説明

音域判定システムおよびプログラム

【課題】従来よりも適切にユーザが発声可能な音域を判定できるようにする。
【解決手段】まず、ユーザの歌唱に伴う時間軸に沿った歌唱音高の推移パターンを、楽曲を適切に歌唱した場合におけるガイド音高の推移パターンと対比することで、これら推移パターンの誤差をそのユーザにおける誤差分布に反映させる。そして、誤差が所定のしきい値未満となっている最高のガイド音高fuから、誤差が所定のしきい値未満となっている最低のガイド音高flまでの音高の範囲を、その誤差分布に対応するユーザの音域と判定する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ユーザの音域を特定するための音域判定システムに関する。
【背景技術】
【0002】
近年、楽曲を歌唱したユーザの音域を特定するための技術が種々提案されている。
例えば、ユーザによる楽曲の歌唱中に、マイクから入力された音声における最高音高(最高音程)および最低音高(最低音程)を検出して、そうして検出された最高音高から最低音高までを、そのユーザの音域と判定する、といった技術がある(特許文献1参照)。
【特許文献1】特開2002−73058号公報
【発明の開示】
【発明が解決しようとする課題】
【0003】
しかし、上述した技術は、単に歌唱に際して検出された最高音高および最低音高の範囲を該当ユーザの音域と判定しているため、その音高が検出されさえすれば、その音高による発声が適切であるか否かに拘わらず音域として判定されてしまう。
【0004】
具体的にいえば、あるユーザにとって発声しにくい音高の区間を有する楽曲が歌唱された場合を想定すると、その区間においてたとえ一時的に適切な音高にまで到達したとしても、その区間における音高の推移パターンは、その区間を適切に歌唱した場合における推移パターンから大きく異なったものになってしまう可能性が高い。
【0005】
このような音高については、そのユーザが無理に発声している音高といえ、歌唱に適した状態で発声できる音高とは言い難いため、この音高をユーザの音域に含めないようにすることが望ましい。
【0006】
本発明は、このような課題を解決するためになされたものであり、その目的は、より適切にユーザが発声可能な音域を判定するための技術を提供することである。
【課題を解決するための手段】
【0007】
上記課題を解決するためには、楽曲を歌唱したユーザの音域を特定するための音域判定システムを、以下に示す第1の構成(請求項1)のようにするとよい。
この構成においては、ユーザによる楽曲の歌唱に伴う時間軸に沿った音高の推移を示す歌唱データを取得する歌唱データ取得手段と、該歌唱データ取得手段により取得される歌唱データにおいて歌唱された楽曲につき、該楽曲を適切に歌唱した場合における時間軸に沿った音高の推移を示すガイドデータを取得するガイドデータ取得手段と、前記歌唱データ取得手段により取得された歌唱データで示される時間軸上の各単位区間(以降「歌唱区間」という)における音高(以降「歌唱音高」という)の推移パターンそれぞれにつき、該推移パターンを、前記ガイドデータ取得手段により取得されたガイドデータで示される時間軸上の各単位区間(以降「ガイド区間」という)のうち、該当歌唱区間に対応するガイド区間における音高(以降「ガイド音高」という)の推移パターンと対比することにより、両推移パターンの誤差を、そのガイド区間において発声すべきガイド音高に対する歌唱音高の誤差としてそれぞれ算出する誤差算出手段と、複数のユーザそれぞれ対して用意され、該ユーザの前記ガイド音高に対する前記歌唱音高の誤差を前記ガイド音高毎に分布させてなる誤差分布のうち、前記誤差算出手段による算出の契機となる歌唱を行ったユーザに対応する誤差分布に、その算出された誤差それぞれを、該算出に際して参照されたガイド区間におけるガイド音高に対する歌唱音高の誤差として追加的に分布させることにより、その誤差分布を更新する分布更新手段と、該分布更新手段により更新された誤差分布において、誤差が所定のしきい値未満となっている最高のガイド音高から、誤差が所定のしきい値未満となっている最低のガイド音高までの音高の範囲を、その誤差分布に対応するユーザの音域と判定する音域判定手段と、を備えている。
【0008】
この構成における音域判定システムでは、まず、ユーザの歌唱に伴う時間軸に沿った音高(歌唱音高)の推移パターンを、楽曲を適切に歌唱した場合における音高(ガイド音高)の推移パターンと対比することで、これら推移パターンの誤差をそのユーザにおける誤差分布に反映させる。そして、誤差が所定のしきい値未満となっている最高のガイド音高から、誤差が所定のしきい値未満となっている最低のガイド音高までの音高の範囲を、その誤差分布に対応するユーザの音域と判定している。
【0009】
この歌唱音高のガイド音高に対する誤差分布は、特定のガイド区間におけるガイド音高に対する歌唱音高の推移パターンとしての誤差をガイド音高毎に分布させたものであるため、その誤差が小さいガイド音高は、該当ユーザが同じような推移パターンで楽に発声できている音高といえるのに対し、その誤差が大きいガイド音高は、該当ユーザが無理に発声している音高といえる。
【0010】
そのため、上記のように、誤差が所定のしきい値未満となっている最高のガイド音高から、誤差が所定のしきい値未満となっている最低のガイド音高までの音高の範囲を、該当ユーザの音域と判定する構成であれば、無理に発声している音高を除いて適切に発声可能な音高の範囲をユーザの音域と判定することができる。
【0011】
この構成において、特定のガイド区間において発声すべきガイド音高に対する歌唱音高の誤差とは、どのような値であってもよく、例えば、歌唱音高の推移パターンとガイド音高の推移パターンとのパターンとしての形状の違いを数値化したものや、歌唱音高の推移パターンおよびガイド音高の推移パターンにおいて最終的に到達した音高それぞれの音高としての違いを数値化したものなどを採用することができる。
【0012】
また、上記構成においてガイドデータを取得するに際しては、あらかじめ用意された複数のガイドデータの中から、ユーザにより歌唱された楽曲に対応するものを取得することとすればよい。ここで「ユーザにより歌唱された楽曲に対応するもの」であることは、歌唱データに、ユーザにより歌唱された楽曲を対応づけておき、その対応関係に基づいて特定することとすればよい。
【0013】
また、上記構成において、該当ユーザに対応する誤差分布を更新するに際しては、歌唱データに、その歌唱をしたユーザを対応づけておき、その対応関係に基づいて特定したユーザの誤差分布を更新することとすればよい。
【0014】
また、上記構成において歌唱データを取得するに際しては、ユーザによる楽曲の歌唱に伴って別途生成したものをシステム外部から取得することとすればよいし、ユーザによる楽曲の歌唱が行われる都度生成してこれを取得することとしてもよい。
【0015】
この後者のように歌唱データを生成するにあたっては、ユーザが楽曲を歌唱してなる音声データに基づいて歌唱データを生成することとすればよく、そのためには、上記構成を以下に示すような第2の構成(請求項2)のようにするとよい。
【0016】
この構成において、前記歌唱データ取得手段は、ユーザが楽曲を歌唱してなる音声データにつき、該音声データにおいて時間軸に沿った位置それぞれの音高を算出し、該音高の時間軸に沿った推移を示すデータを歌唱データとして取得する。
【0017】
この構成であれば、ユーザによる楽曲の歌唱に係る音声データから歌唱データを生成し、これに基づいて音域の判定を行うことができる。
ところで、上述した歌唱データは、その歌唱に伴う時間軸に沿った音高の推移を示すものであるが、歌唱区間それぞれでみると、実際に音高の変化が開始されたタイミングが、その楽曲を適切に歌唱した場合におけるタイミングに対してズレていることが予想される。
【0018】
この場合、上述したように単に推移パターンの対比により誤差を算出すると、そのような タイミングのズレが要因となって誤差が大きくなってしまう。しかし、ユーザの音域を判定するという目的に照らせば、そのようなタイミングよりも、実際に音高が推移する推移パターンそのものが重要といえるため、そのようなタイミングのズレについてあらかじめ補償しておくことが望ましい。
【0019】
そのように、タイミングのズレを補償するためには、上記各構成を以下に示す第3の構成(請求項3)のようにすることが考えられる。
この構成においては、前記歌唱データ取得手段により取得された歌唱データで示される歌唱区間それぞれについて、該歌唱区間における歌唱音高の推移パターンと、前記ガイドデータ取得手段により取得された前記ガイドデータで示される該当ガイド区間におけるガイド音高の推移パターンと、の近似度が最大となるように、その歌唱区間における時間軸上の位置を修正する時間修正手段,を備えている。
【0020】
そして、前記誤差算出手段は、前記時間修正手段により修正された歌唱データで示される各単位区間における歌唱音高の推移パターンそれぞれを、前記ガイドデータ取得手段により取得されたガイドデータで示される各ガイド区間のうち、該当する歌唱区間に対応するガイド区間におけるガイド音高の推移パターンと対比することにより、両推移パターンの誤差を、そのガイド区間において発声すべきガイド音高に対する歌唱音高の誤差としてそれぞれ算出する。
【0021】
この構成であれば、歌唱音高の推移パターンとガイド音高の推移パターンとが最も近似するように、歌唱音高における時間軸上の位置が修正される。このように推移パターンが近似するということは、その音高の変化するタイミングも近似した状態になることを意味するため、こうして、音高の変化が開始されたタイミングのズレを補償することができる。
【0022】
なお、この構成において、推移パターンが近似するように時間軸上の位置を修正するためには、どのような手法を採用してもよいが、例えば、特開2005−107330号公報に記載されているような手法を採用することが考えられる。
【0023】
また、上記各構成においては、誤差分布において誤差が所定のしきい値未満となっている最高のガイド音高から、誤差が所定のしきい値未満となっている最低のガイド音高までの音高の範囲を、該当ユーザの音域と判定することとなるが、この「しきい値」については、例えば、第4の構成(請求項4)のように、「ある歌唱区間における歌唱音高の推移パターンが、それに対応するガイド区間におけるガイド音高より所定量の音高以上ズレた音高まで到達する推移パターンである場合に、これら歌唱区間およびガイド区間それぞれにおける推移パターンを対比した誤差として前記誤差算出手段により算出されうる誤差の値」を採用すればよい。
【0024】
この構成であれば、ある歌唱区間における歌唱音高の推移パターンが、それに対応するガイド区間におけるガイド音高より所定量の音高以上ズレた音高まで到達する推移パターンである場合、このガイド音高が除外された音高の範囲を、該当ユーザの音域と判定することができる。
【0025】
この構成における「所定量の音高以上ズレた音高」としては、例えば、本来到達すべき音高,つまり該当ガイド区間におけるガイド音高を基準として、半音(1/12オクターブ)や1音以上の音に相当する音高だけズレた音高を採用することが考えられる。
【0026】
また、上記各構成において音域を判定する際に参照される「しきい値」としては、誤差分布全体からみて相対的に定めた値を採用することも考えられ、このためには、例えば、上記第1から第3のいずれかの構成を以下に示す第5の構成(請求項5)のようにすることが考えられる。
【0027】
この構成において、前記音域判定手段は、前記分布更新手段により更新された誤差分布における誤差の最大値に対する所定割合を前記しきい値として該当ユーザの音域を判定する。
【0028】
この構成であれば、誤差分布全体からみて相対的に定めた割合を下回っている最高のガイド音高から同最低のガイド音高までの音高の範囲を、該当ユーザの音域と判定することができる。
【0029】
また、上記課題を解決するためには、上記第1〜第5のいずれかの構成における音域判定システムの備える全ての手段としてコンピュータシステムを機能させるためのプログラム(請求項7)としてもよい。
【0030】
このプログラムにより制御されるコンピュータシステムであれば、上記第1〜第5のいずれかの構成における音域判定システムと同様の作用,効果を得ることができる。
なお、上述したプログラムは、コンピュータシステムによる処理に適した命令の順番付けられた列からなるものであって、各種記録媒体や通信回線を介して音域判定システムや、これを利用するユーザに提供されるものである。
【発明を実施するための最良の形態】
【0031】
以下に本発明の実施形態を図面と共に説明する。
(1)ハードウェア構成
音域判定システム1は、周知のコンピュータシステムからなる端末装置やカラオケ装置にプログラムを実装することにより実現されるものである。
【0032】
まず、「端末装置」にプログラムを実装する場合のハードウェア構成は、図1(a)に示すように、システム全体を制御する制御部11,各種情報を記憶する記憶部13,ネットワーク2を介した通信を制御する通信部15,キーボードやディスプレイなどからなるユーザインタフェース(U/I)部17,記録メディアを介して情報を入出力するメディアドライブ19などを備えた構成となる。
【0033】
この構成では、ユーザインタフェース部17または通信部15を介して外部からの所定の指令を受けた際に、制御部11が記憶部13に記憶されたプログラムに従って各種処理を実行することによって、本発明の音域判定システムとしての機能を発揮する。
【0034】
また、「カラオケ装置」にプログラムを実装する場合のハードウェア構成は、図1(b)に示すように、システム全体を制御する制御部11,演奏楽曲の伴奏内容および歌詞を示す楽曲データや映像データなどを記憶する記憶部13,ネットワーク2を介した通信を制御する通信部15,各種映像の表示を行う表示部21,複数のキー・スイッチなどからなる操作部23,マイク25からの音声の入力とスピーカ27からの音声の出力とを制御する音声入出力部29などを備えた構成となる。
【0035】
この構成では、操作部23または通信部15を介して外部からの所定の指令を受けた際に、制御部11が記憶部13に記憶されたプログラムに従って各種処理を実行することによって、本発明の音域判定システムとしての機能を発揮する。
【0036】
なお、本実施形態では、音域判定システム1が単体の装置(端末装置,カラオケ装置)により構成されているが、それぞれ協調して動作する複数の装置により構成できることはいうまでもない。
(2)制御部11による音域判定処理
以下に、制御部11が記憶部13に記憶されたプログラムに従って実行する音域判定処理の処理手順を図2に基づいて説明する。
【0037】
この音域判定処理は、本音域判定システム1が端末装置により実現された構成であれば、ユーザインタフェース部17を介して規定の操作が行われた,または,通信部15を介してネットワーク2からの指令を受けた際に起動される。一方、本音域判定システム1がカラオケ装置により実現された構成であれば、カラオケ装置の動作モードが音域判定モードに切り替えられている状態で、ユーザによる楽曲の歌唱(楽曲データに基づく楽曲の再生)が行われる毎に起動される。
【0038】
この音域判定処理が起動されると、まず、ユーザによる楽曲の歌唱に伴う時間軸に沿った音高の推移を示す歌唱データが取得される(s110)。この歌唱データは、ユーザが楽曲を歌唱した際の音高(以降「歌唱音高」という)の推移を時間軸に沿って示したものであり、具体的には、ユーザの歌唱に係る音声に含まれた基本周波数を時間軸に沿って推移させた推移パターンを示すものである(図3(a)参照)。
【0039】
このs110では、本音域判定システム1が端末装置により実現された構成であれば、ユーザインタフェース部17への操作を介して指定された歌唱データが記憶部13やメディアドライブ19(つまり記録メディア)から取得される、または、通信部15を介して受信された歌唱データが取得される。なお、こうして取得される歌唱データは、その歌唱に係るユーザ,楽曲をそれぞれ識別するためのユーザ識別情報,楽曲識別情報が付加されたものとなっている。
【0040】
また、本音域判定システム1がカラオケ装置により実現された構成であれば、ユーザによる楽曲の歌唱に際して生成された歌唱データが取得される。この場合には、楽曲の歌唱に伴って音声入出力部29から入力されるユーザの音声データ(図4(a)参照)を取得しておき、この音声データにおいて時間軸に沿った位置それぞれの音高を算出し、この音高の時間軸に沿った推移(図4(b)参照)を示すデータが歌唱データとして生成されることとなる。なお、こうして取得される歌唱データは、その歌唱に際してカラオケ装置にログインしているユーザを識別するためのユーザ識別情報と、その歌唱に係る楽曲を識別するためのユーザ識別情報,楽曲識別情報が付加されたものとなっている。
【0041】
次に、上記s110にて取得された歌唱データにおける歌唱に係る楽曲につき、この楽曲を適切に歌唱した場合における時間軸に沿った音高の推移を示すガイドデータが取得される(s120)。このガイドデータとは、楽曲を適切に歌唱した場合における時間軸に沿った音高の推移を示したものであり、具体的には、適切に歌唱した場合の音声に含まれるべき基本周波数を時間軸に沿って推移させた推移パターンを示すものである(図3(a)参照)。
【0042】
本実施形態においては、複数の楽曲それぞれに対し、その楽曲を適切に歌唱した場合における時間軸に沿った音高の推移を示すガイドデータが記憶部13に複数記憶されており、このs120では、それらガイドデータのうち、上記s110にて取得された歌唱データに付加された楽曲識別情報で識別される楽曲に対応するガイドデータが読み出され、これが取得される。なお、このガイドデータは、ネットワーク2を介して接続されたサーバ装置などからの提供を受けて、これを取得することとしてもよい。
【0043】
次に、上記s110にて取得された歌唱データで示される推移パターンにおける時間軸に沿った各単位区間(以降「歌唱区間」という)それぞれの位置が、上記s120にて取得されたガイドデータに基づいて修正される(s130)。
【0044】
ここでは、歌唱データで示される歌唱区間それぞれについて、この歌唱区間における歌唱音高の推移パターンが、ガイドデータで示される時間軸上の各単位区間(以降「ガイド区間」という)のうち、その歌唱区間に対応するガイド区間における音高(以降「ガイド音高」という)の推移パターンと最も近似する(近似度が最大となる)ように、その歌唱区間における時間軸上の位置が修正(時間軸に沿って前後にシフト)される(図3(b)参照)。
【0045】
このように推移パターンが近似するように時間軸上の位置を修正する手法としては、どのような手法を採用してもよいが、例えば、特開2005−107330号公報に記載されているような手法を採用することが考えられる。
【0046】
なお、上述した歌唱区間,ガイド区間それぞれは、楽曲の時間軸に沿った全体を2以上に分割したそれぞれの区間を示すものであるが、楽曲全体を分割することなく全体として1つの歌唱区間,ガイド区間として取り扱うこととしてもよい。
【0047】
次に、上記s130にて時間軸上の位置が修正された歌唱データで示される歌唱音高の推移パターンと、上記s120にて取得されたガイドデータで示されるガイド音高の推移パターンと、の対比により、ガイド音高に対する歌唱音高の誤差が算出される(s140)。
【0048】
ここでは、歌唱データで示される歌唱区間における歌唱音高の推移パターンそれぞれが、ガイドデータで示されるガイド区間のうち、該当歌唱区間に対応するガイド区間における推移パターンと対比され、そのガイド区間において発声すべきガイド音高に対する歌唱音高の誤差それぞれが算出される。
【0049】
ここでいう「誤差」とは、例えば、歌唱音高の推移パターンとガイド音高の推移パターンとのパターンとしての形状の違いを数値化したものや、歌唱音高の推移パターンおよびガイド音高の推移パターンにおいて最終的に到達した音高それぞれの音高としての違い(または歌唱音高がガイド音高と同一の音高となっている期間の違い)を数値化したものなどである。
【0050】
次に、各ユーザのガイド音高に対する歌唱音高の誤差をガイド音高毎に分布させてなる誤差分布を示す複数の誤差分布情報のうち、上記s110にて取得された歌唱データにおける歌唱に係るユーザに対応する誤差分布情報が取得される(s150)。
【0051】
この誤差分布情報で示される「誤差分布」は、図5に示すように、縦軸に誤差の累積値をとり、横軸にガイド音高における基本周波数をとって、上述したガイド音高に対する歌唱音高の誤差を分布させたものである。なお、図5は、基本周波数それぞれの誤差の累積値をつなぐ包絡線により、誤差の分布を示してある。
【0052】
次に、上記s150にて取得された誤算分布情報が、上記s140にて算出された誤差それぞれを、その誤算分布情報で示される誤差分布に追加的に分布させてなる誤差分布を示すものとなるように更新される(s160)。ここでは、上記s140にて算出されたガイド音高毎の誤差それぞれが、上記s150にて取得された誤算分布情報で示される誤差分布のうち、該当ガイド音高の誤差として積算され、こうして積算された誤差分布を示す誤差分布情報に更新される。
【0053】
次に、上記s160にて更新された誤差分布情報に基づいて、この誤差分布情報で示される誤差分布において、誤差が所定のしきい値未満となっている最高のガイド音高から、誤差が所定のしきい値未満となっている最低のガイド音高までの音高の範囲が、その誤差分布に対応するユーザの音域と判定される(s170)。
【0054】
ここでは、「所定のしきい値」としては、「ある歌唱区間における歌唱音高の推移パターンが、それに対応するガイド区間におけるガイド音高より所定量の音高以上ズレた音高まで到達する推移パターンである場合に、これら歌唱区間およびガイド区間それぞれにおける推移パターンを対比した誤差として上記s140で算出されうる誤差の値」が用いられる。この「所定量の音高以上ズレた音高」とは、例えば、本来到達すべき音高,つまり該当ガイド区間におけるガイド音高を基準として、半音(1/12オクターブ)や1音以上の音に相当する音高だけ上下にズレた音高などのことである。
【0055】
この場合、図5(b)に示すように、誤差分布全体からみて絶対的に決まる誤差値を下回っている最高のガイド音高fuから同最低flのガイド音高までの音高の範囲を、該当ユーザの音域と判定することができる。こうして、ある歌唱区間における歌唱音高の推移パターンが、それに対応するガイド区間におけるガイド音高より所定量の音高以上ズレた音高まで到達する推移パターンである場合に、このガイド音高が、該当ユーザの音域から除外される。
【0056】
また、上記「所定のしきい値」としては、「上記s160にて更新された誤差分布情報で示される誤差分布における誤差の最大値Mに対する所定割合A(例えば、20%)」を用いてもよく、この場合、図5(c)に示すように、誤差分布全体からみて相対的に定めた割合Aを下回っている最高のガイド音高fuから同最低flのガイド音高までの音高の範囲を、該当ユーザの音域と判定することができる。
【0057】
そして、こうして判定されたユーザの音域が通知または記憶される(s180)。ここでは、上記s170にて判定されたユーザの音域を通知すべき旨の設定がなされている場合であれば、その音域がユーザインタフェース部17や表示部21に表示される、または、通信部15を介して外部の装置へと送信される。また、ユーザの音域を蓄積しておくべき旨の設定がなされている場合であれば、その音域を示す情報が記憶部13や記録メディアに記憶される。
(3)作用,効果
この構成における音域判定システム1では、まず、ユーザの歌唱に伴う時間軸に沿った音高(歌唱音高)の推移パターンを、楽曲を適切に歌唱した場合における音高(ガイド音高)の推移パターンと対比することで(図2のs140)、これら推移パターンの誤差をそのユーザにおける誤差分布に反映させる(同図s160)。
【0058】
そして、誤差が所定のしきい値未満となっている最高のガイド音高から、誤差が所定のしきい値未満となっている最低のガイド音高までの音高の範囲を、その誤差分布に対応するユーザの音域と判定している(同図s170)。
【0059】
この歌唱音高のガイド音高に対する誤差分布は、図5に示すように、特定のガイド区間におけるガイド音高に対する歌唱音高の推移パターンとしての誤差をガイド音高毎に分布させたものであるため、その誤差が小さいガイド音高は、該当ユーザが同じような推移パターンで楽に発声できている音高といえるのに対し、その誤差が大きいガイド音高は、該当ユーザが無理に発声している音高といえる。
【0060】
そのため、上記のように、誤差が所定のしきい値未満となっている最高のガイド音高から、誤差が所定のしきい値未満となっている最低のガイド音高までの音高の範囲を、該当ユーザの音域と判定する構成であれば、無理に発声している音高を除いて適切に発声可能な音高の範囲をユーザの音域と判定することができる。
【0061】
また、上記実施形態において、音域判定システム1をカラオケ装置により実現した場合には、ユーザによる楽曲の歌唱に係る音声データから歌唱データを都度生成し(図2のs110)、これに基づいて音域の判定を行うことができる。
【0062】
また、上記実施形態においては、歌唱音高の推移パターンとガイド音高の推移パターンとが近似するように、歌唱音高における時間軸上の位置が修正される(図2のs130,図3(b)参照)。このように推移パターンが近似するということは、その音高の変化するタイミングも近似した状態になることを意味するため、こうして、音高の変化が開始されたタイミングのズレを補償したうえで、適切に推移パターンの対比を行うことができる。
【0063】
また、上記実施形態においては、図5(b)に示すように、ある歌唱区間における歌唱音高の推移パターンが、それに対応するガイド区間におけるガイド音高より所定量の音高以上ズレた音高まで到達する推移パターンである場合に、このガイド音高が除外された音高の範囲を、該当ユーザの音域と判定することができる。
【0064】
また、上記実施形態においては、図5(c)に示すように、誤差分布全体からみて相対的に定めた割合Aを下回っている最高のガイド音高fuから同最低のガイド音高flまでの音高の範囲を、該当ユーザの音域と判定することができる。
(4)本発明との対応関係
以上説明した実施形態において、図2のs110が本発明における歌唱データ取得手段であり、同図s120が本発明におけるガイドデータ取得手段であり、同図s140が本発明における誤差算出手段であり、同図s160が本発明における分布更新手段であり、同図s170が本発明における音域判定手段であり、同図s130が本発明における時間修正手段である。
【図面の簡単な説明】
【0065】
【図1】音域判定システムのハードウェア構成を示すブロック図
【図2】音域判定処理を示すフローチャート
【図3】歌唱データおよびガイドデータで示される音高の推移パターンを示す図
【図4】音声データで示される音声波形(a)、および、歌唱データで示される音高の推移パターンを示す図(b)
【図5】誤差分布情報で示される誤差分布を示す図
【符号の説明】
【0066】
1…音域判定システム、2…ネットワーク、11…制御部、13…記憶部、15…通信部、17…ユーザインタフェース部、19…メディアドライブ、21…表示部、23…操作部、25…マイク、27…スピーカ、29…音声入出力部。

【特許請求の範囲】
【請求項1】
ユーザによる楽曲の歌唱に伴う時間軸に沿った音高の推移を示す歌唱データを取得する歌唱データ取得手段と、
該歌唱データ取得手段により取得される歌唱データにおいて歌唱された楽曲につき、該楽曲を適切に歌唱した場合における時間軸に沿った音高の推移を示すガイドデータを取得するガイドデータ取得手段と、
前記歌唱データ取得手段により取得された歌唱データで示される時間軸上の各単位区間(以降「歌唱区間」という)における音高(以降「歌唱音高」という)の推移パターンそれぞれにつき、該推移パターンを、前記ガイドデータ取得手段により取得されたガイドデータで示される時間軸上の各単位区間(以降「ガイド区間」という)のうち、該当歌唱区間に対応するガイド区間における音高(以降「ガイド音高」という)の推移パターンと対比することにより、両推移パターンの誤差を、そのガイド区間において発声すべきガイド音高に対する歌唱音高の誤差としてそれぞれ算出する誤差算出手段と、
複数のユーザそれぞれ対して用意され、該ユーザの前記ガイド音高に対する前記歌唱音高の誤差を前記ガイド音高毎に分布させてなる誤差分布のうち、前記誤差算出手段による算出の契機となる歌唱を行ったユーザに対応する誤差分布に、その算出された誤差それぞれを、該算出に際して参照されたガイド区間におけるガイド音高に対する歌唱音高の誤差として追加的に分布させることにより、その誤差分布を更新する分布更新手段と、
該分布更新手段により更新された誤差分布において、誤差が所定のしきい値未満となっている最高のガイド音高から、誤差が所定のしきい値未満となっている最低のガイド音高までの音高の範囲を、その誤差分布に対応するユーザの音域と判定する音域判定手段と、を備えている
ことを特徴とする音域判定システム。
【請求項2】
前記歌唱データ取得手段は、ユーザが楽曲を歌唱してなる音声データにつき、該音声データにおいて時間軸に沿った位置それぞれの音高を算出し、該音高の時間軸に沿った推移を示すデータを歌唱データとして取得する
ことを特徴とする請求項1に記載の音域判定システム。
【請求項3】
前記歌唱データ取得手段により取得された歌唱データで示される歌唱区間それぞれについて、該歌唱区間における歌唱音高の推移パターンと、前記ガイドデータ取得手段により取得された前記ガイドデータで示される該当ガイド区間におけるガイド音高の推移パターンと、の近似度が最大となるように、その歌唱区間における時間軸上の位置を修正する時間修正手段,を備えており、
前記誤差算出手段は、前記時間修正手段により修正された歌唱データで示される各単位区間における歌唱音高の推移パターンそれぞれを、前記ガイドデータ取得手段により取得されたガイドデータで示される各ガイド区間のうち、該当する歌唱区間に対応するガイド区間におけるガイド音高の推移パターンと対比することにより、両推移パターンの誤差を、そのガイド区間において発声すべきガイド音高に対する歌唱音高の誤差としてそれぞれ算出する
ことを特徴とする請求項1または請求項2に記載の音域判定システム。
【請求項4】
前記音域判定手段は、以下に示す誤差の値を前記しきい値として該当ユーザの音域を判定する
ことを特徴とする請求項1から3のいずれかに記載の音域判定システム。
[誤差の値] ある歌唱区間における歌唱音高の推移パターンが、それに対応するガイド区間におけるガイド音高より所定量の音高以上ズレた音高まで到達する推移パターンである場合に、これら歌唱区間およびガイド区間それぞれにおける推移パターンを対比した誤差として前記誤差算出手段により算出されうる誤差の値。
【請求項5】
前記音域判定手段は、前記分布更新手段により更新された誤差分布における誤差の最大値に対する所定割合を前記しきい値として該当ユーザの音域を判定する
ことを特徴とする請求項1から3のいずれかに記載の音域判定システム。
【請求項6】
請求項1から5のいずれかに記載の全ての手段として機能させるための各種処理手順をコンピュータシステムに実行させるためのプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate


【公開番号】特開2009−244707(P2009−244707A)
【公開日】平成21年10月22日(2009.10.22)
【国際特許分類】
【出願番号】特願2008−92727(P2008−92727)
【出願日】平成20年3月31日(2008.3.31)
【出願人】(000005267)ブラザー工業株式会社 (13,856)
【Fターム(参考)】