説明

選曲歌手分析推薦装置、その方法及びプログラム

【課題】歌唱しているユーザの音声に基づき、そのユーザに類似した歌手を推薦する。
【解決手段】通常の会話に係る音声の発声者を特徴づける第一の音声特徴素を発声者別に格納した音響モデル辞書221と、歌唱時の音声に係る発声者を特徴づける第二の音声特徴素を、発声者別に格納した歌唱モデル辞書222と、デジタル化された音声データを、音響モデル辞書221に格納されている第一の音声特徴素と比較分析し、音声データと類似する第一の音声特徴素の発声者を抽出する音響モデル検索部231と、デジタル化された音声データを、歌唱モデル辞書222に格納されている第二の音声特徴素と比較分析し、音声データと類似する前記第二の音声特徴素の発声者を抽出する歌唱モデル検索部232と、を備え、音響モデル検索部231での抽出結果及び歌唱モデル検索部232での抽出結果から、音声データに類似する音声の発声者をリストアップする。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、歌唱したユーザの音声特徴素を抽出し、この音声特徴素に類似した歌手を推薦する装置、その方法及びプログラムに関する。
【背景技術】
【0002】
従来のカラオケ装置は、歌唱採点機能の付加等を最後にこれといった特徴を持つ装置が見当たらず、カラオケ装置製造各社は製品の差別化が困難であった。
【0003】
そのため、ユーザの音声を分析することで、そのユーザの音声に合致した音声を有する楽曲検索装置がある。
【特許文献1】特開2005−115164号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
しかしながら、特許文献1の楽曲検索装置は、ユーザが携帯電話で通話した音声を基にユーザの音声特徴量を分析しているので、抑揚、音域、発話時間等が通常の会話時とは異なる歌唱時のユーザの音声を把握できず、そのユーザの歌唱時の音声に合致した楽曲を選択することが困難であるという問題があった。
【0005】
又、楽曲を選択するにおいて、楽曲1曲のみでは比較分析を行うためのサンプル数が少なすぎる可能性があり、選択の妥当性に疑念があった。
【0006】
本発明は上記に鑑みてなされたもので、歌唱しているユーザの音声に基づき、そのユーザに類似した歌手の推薦が可能な選曲歌手分析推薦装置、その方法及びプログラムを得ることを目的とする。
【課題を解決するための手段】
【0007】
上述の課題を解決するため、本発明に係る選曲歌手分析推薦装置は、通常の会話に係る音声から抽出可能で、該音声の発声者を特徴づける第一の音声特徴素を、発声者別に格納した第一の辞書と、歌唱時の音声から抽出可能で、該歌唱時の音声に係る発声者を特徴づける第二の音声特徴素を、発声者別に格納した第二の辞書と、デジタル化されたユーザの音声データを、前記第一の辞書に格納されている前記第一の音声特徴素と比較分析し、該音声データと類似する前記第一の音声特徴素の発声者を抽出する第一の検索部と、デジタル化されたユーザの音声データを、前記第二の辞書に格納されている前記第二の音声特徴素と比較分析し、該音声データと類似する前記第二の音声特徴素の発声者を抽出する第二の検索部と、を備え、前記第一の検索部での抽出結果及び前記第二の検索部での抽出結果から、前記音声データに類似する音声の発声者をリストアップすることを特徴とする。
【0008】
上述の課題を解決するため、本発明に係る選曲歌手分析推薦方法は、通常の会話に係る音声から抽出可能で、該音声の発声者を特徴づける第一の音声特徴素を発声者別に格納した第一の辞書を用い、デジタル化されたユーザの音声データを、前記第一の辞書に格納されている前記第一の音声特徴素と比較分析し、該音声データと類似する前記第一の音声特徴素の発声者を抽出する第一の手順と、歌唱時の音声から抽出可能で、該歌唱時の音声に係る発声者を特徴づける第二の音声特徴素を発声者別に格納した第二の辞書を用いて、デジタル化されたユーザの音声データを、前記第二の辞書に格納されている前記第二の音声特徴素と比較分析し、該音声データと類似する前記第二の音声特徴素の発声者を抽出する第二の手順と、前記第一の手順での抽出結果及び前記第二の手順の抽出結果から、前記音声データに類似する音声の発声者をリストアップする手順と、を備えることを特徴とする。
【0009】
上述の課題を解決するため、本発明に係る選曲歌手分析推薦プログラムは、通常の会話に係る音声から抽出可能で、該音声の発声者を特徴づける第一の音声特徴素を発声者別に格納した第一の辞書を用い、デジタル化されたユーザの音声データを、前記第一の辞書に格納されている前記第一の音声特徴素と比較分析し、該音声データと類似する前記第一の音声特徴素の発声者を抽出する第一の処理と、歌唱時の音声から抽出可能で、該歌唱時の音声に係る発声者を特徴づける第二の音声特徴素を発声者別に格納した第二の辞書を用いて、デジタル化されたユーザの音声データを、前記第二の辞書に格納されている前記第二の音声特徴素と比較分析し、該音声データと類似する前記第二の音声特徴素の発声者を抽出する第二の処理と、前記第一の処理での抽出結果及び前記第二の処理の抽出結果から、前記音声データに類似する音声の発声者をリストアップする処理と、をコンピュータに実行させることを特徴とする。
【発明の効果】
【0010】
デジタル化したユーザの音声データと、辞書に記載された歌手の音声データとを、通常の会話に係る音声から抽出可能な第一の音声特徴素で比較分析するのみならず、歌唱時に特有の第二の音声特徴素でも比較分析することにより、歌唱しているユーザの音声に基づき、そのユーザに類似した歌手の推薦が可能な選曲歌手分析推薦装置、その方法及びプログラムを得ることができる。
【発明を実施するための最良の形態】
【0011】
次に、本発明の実施の形態について図面を参照して詳細に説明する。図1は、本発明の実施の形態に係る選曲歌手分析推薦装置が組み込まれたカラオケ装置の構成図である。
【0012】
図1を参照すると、本発明の実施の形態に係る選曲歌手分析推薦装置が組み込まれたカラオケ装置1は、ユーザが選曲に用いるリモコン10と、リモコン10からの選曲に係る選曲信号を受信する信号受信部11と、選曲信号に基づいて楽曲・映像データベース12を検索し、検索によって抽出された楽曲の伴奏、歌詞及び映像のデータを読み出す選曲検索読出し部13と、読み出したデータを再生するまで一時的に保持するスタック部14と、読み出したデータを再生する楽曲再生部15と、マイクロフォン16からのユーザの音声及び楽曲再生部15が再生した伴奏を合成するミキシングアンプ17と、ミキシングアンプ17が合成した伴奏と音声を出力するスピーカ18と、楽曲再生部15が再生した歌詞及び映像と選曲推薦歌手と歌唱力点数とを表示するディスプレイ19と、マイクロフォン16から入力されたアナログ信号の音声を、デジタル信号に変換し、歌唱力得点判定部21と、選曲歌手分析推薦部23とに分配するAD変換分配部20と、デジタル化されたユーザの音声信号と、楽曲再生部15から分配された楽曲のメロディラインとを比較することによってユーザの歌唱力を採点する歌唱力得点判定部21と、デジタル化されたユーザの音声信号と音声特徴辞書22に格納された歌手の音声特徴とを比較分析して、歌唱しているユーザに音声特徴が類似している歌手の名称を選択し、ディスプレイ19に表示する選曲歌手分析推薦部23と、を備える。なお、楽曲・映像のデータをネットワークを介して取得するいわゆる通信カラオケの場合は、楽曲・映像データベース12と選曲検索読出し部13との間にネットワークが介在し、選曲検索読出し部13にはネットワークを介して楽曲・映像データベース12と通信を行う通信手段を別途備えるものとする。
【0013】
上述のカラオケ装置1における選曲歌手分析推薦部23と、音声特徴辞書22とが、本発明の実施の形態に係る選曲歌手分析推薦装置の主要な構成要素であり、その他の部分については、既存の歌唱採点表示カラオケ装置と共通である。
【0014】
図2は、本実施の形態に係る選曲歌手分析推薦装置を実施するための最小の構成を示す図である。この図2において、マイクロフォン16、AD変換分配部20、ディスプレイ19は、図1に示したものと符号も含めて共通するので説明を省略する。
【0015】
図2において、選曲歌手分析推薦部23は、図1に示したものと同じであるが、図2においては、その構成をより詳細に示している。
【0016】
この図2において、音声特徴辞書22は、カラオケの原曲の歌手に係る音量、音声の周波数成分及び発話速度を第一の音声特徴素として記載した音響モデル辞書221と、カラオケの原曲の歌手に係る音声のしゃくり、ビブラート、抑揚、音域及び発話時間を第二の音声特徴素として記載した歌唱モデル辞書222と、を備える。
【0017】
ここで、音響モデル辞書221が格納する第一の音声特徴素であるカラオケの原曲の歌手に係る音量、音声の周波数成分及び発話速度は、歌唱のみならず通常の会話からも抽出可能な要素であるが、歌唱モデル辞書222が格納する第二の音声特徴素であるカラオケの原曲の歌手に係る音声のしゃくり、ビブラート、抑揚、音域及び発話時間は、通常の会話にはない歌唱特有の要素である。
【0018】
この音声特徴辞書22は、本発明の実施の形態に係るカラオケ装置1に備え付けてもよいが、いわゆる通信カラオケとして、ネットワークを経由して本発明の実施の形態に係るカラオケ装置1が辞書のデータを必要に応じて取得するようにしてもよい。
【0019】
図2において、選曲歌手分析推薦部23は、マイクロフォン16から入力されたユーザの音声の音量、その音声の周波数成分及びその音声の発話速度を、音声特徴辞書22に格納されているカラオケの原曲の歌手に係る第一の音声特徴素である音量、音声の周波数成分及び発話速度を記載した音響モデル辞書221と比較分析し、ユーザの音声と音量、周波数成分及び発話速度が類似する歌手のデータを抽出する音響モデル検索部231を備える。
【0020】
さらに選曲歌手分析推薦部23は、マイクロフォン16から入力されたユーザの音声のしゃくり、ビブラート、抑揚、音域及び発話時間を、音声特徴辞書22に格納されているカラオケの原曲の歌手に係る第二の音声特徴素である音声のしゃくり、ビブラート、抑揚、音域及び発話時間を記載した歌唱モデル辞書222と比較分析し、ユーザの音声としゃくり、ビブラート、抑揚、音域、発話時間が類似する歌手のデータを抽出する歌唱モデル検索部232を備える。なお、ここで「しゃくり」とは、設定された音程よりも低い音をまず発声し、そこから本来の音程に近づけてゆくことであり、「ビブラート」とは、歌唱時における揺れの波形モデルのことである。
【0021】
又、歌唱モデル検索部232は、音響モデル検索部231が抽出した結果に基づいて、ユーザの音声と比較分析する歌唱モデル辞書222の範囲を限定するようにしてもよい。
【0022】
例えば、音響モデル検索部222でユーザの音声に類似すると判断されて抽出された歌手に係る音声特徴素に限り、歌唱モデル検索部232でユーザの音声と比較分析してもよく、これによりユーザの音声に類似する歌手をより高精度でリストアップすることが可能になる。
【0023】
選曲歌手分析推薦部23は、音響モデル検索部231での抽出結果と歌唱モデル検索部232での抽出結果を総合的に判断し、ユーザの音声に類似する歌手のデータを類似している順にリストアップし、選曲推薦歌手としてディスプレイ19に出力する。
【0024】
この出力時に、ユーザの音声と類似しているものから(1)、(2)、(3)、のように順位付けを行ってディスプレイ19に該当する歌手の名称などのデータを表示するようにしてもよい。ここで、ユーザの音声に類似する歌手が音声特徴辞書22中に存在しない場合は、そのユーザに類似する歌手が不定である旨の(N)を表示してもよい。
【0025】
ここで図3は、本実施の形態に係る選曲歌手分析推薦装置の動作を示すフローチャートである。
【0026】
まず、マイクロフォン16から入力されたユーザの音声は、AD変換分配部20によってデジタル化される(ステップS301)。
【0027】
次いで、音響モデル検索部231において、デジタル化されたユーザの音声と音量、周波数成分及び発話速度が類似する歌手のデータが音響モデル辞書221から検索によって抽出される(ステップS302)。
【0028】
続いて、歌唱モデル検索部232において、ステップS303での結果に基づいて歌唱モデル辞書222の検索範囲を限定した上で、デジタル化されたユーザの音声としゃくり、ビブラート、抑揚、音域及び発話時間が類似する歌手のデータを歌唱モデル辞書222から抽出し(ステップS303)、この抽出した結果をディスプレイ19に表示して(ステップS304)、本実施の形態に係る選曲歌手分析推薦装置の動作は終了する。
【0029】
ここで、図4は、本実施の形態に係る音響特徴辞書の製作方法を示す図である。
【0030】
この図4で示すように、まず楽曲1曲目が音声解析される。
【0031】
この音声解析では、まず、楽曲(主旋律及び伴奏)を含むデジタル音源から主旋律(歌声)が抽出される。
【0032】
抽出された主旋律は、「音響モデル」と「歌唱モデル」との観点から解析され、その結果から上述の音響モデル辞書221と歌唱モデル辞書222とが作成される。
【0033】
「音響モデル辞書」は、歌唱のみならず通常の会話においても見られる音声の音量、音声の周波数成分及び発話速度からカラオケ原曲の歌手の音声を解析するものである。
【0034】
一方で、「歌唱モデル」は、上述のようにしゃくり、ビブラート、抑揚、音域及び発話時間という、通常の会話にはない歌唱特有の要素に基づいて解析するものである。
【0035】
「音響モデル」及び「歌唱モデル」の音声解析が行われた後、それぞれの解析結果には解析した曲に係る歌手を識別する符号であるINDEXが付与され、音声特徴素として音響モデル辞書221及び歌唱モデル辞書222に登録される。
【0036】
音響モデル辞書221における音声特徴素は、上述のように音声の音量、音声の周波数成分及び発話速度である。
【0037】
又、歌唱モデル辞書222における音声特徴素は、上述のようにしゃくり、ビブラート、抑揚、音域及び発話時間である。
【0038】
楽曲2曲目以降も同様にして「音響モデル」と「歌唱モデル」との観点から音声解析が行われ、その後INDEXについて音響モデル辞書221及び歌唱モデル辞書222が検索される。
【0039】
この検索で、2曲目以降に解析した曲の歌手に係るINDEXが既存の辞書から発見された場合は、2曲目以降の解析結果をそのINDEXに係る音声特徴素に融合(マージ)して、当該歌手に係る音響モデル辞書221及び歌唱モデル辞書222のデータを充実させることができる。
【0040】
それぞれの歌手について音響モデル辞書221及び歌唱モデル辞書222のデータを充実させることにより、本実施の形態において、ユーザの音声に類似した歌手をより精度良く検出できるようになる。
【0041】
以上のように、本実施の形態に係る選曲歌手分析推薦装置によれば、音声の音量、音声の周波数成分及び発話速度の観点から音声を解析する「音響モデル」に加えて、しゃくり、ビブラート、抑揚、音域及び発話時間という、通常の会話にはない歌唱特有の要素に基づいて音声を解析する「歌唱モデル」によってユーザの歌声に基づく音声と、カラオケ原曲の歌手との類似性を比較分析することにより、そのユーザに合致した歌手のデータを高精度で抽出することができる。
【0042】
なお、本発明は、ハードウェア、ソフトウェア又はこれらの組合せにより実現することができる。
【産業上の利用可能性】
【0043】
本発明は、歌唱採点表示カラオケ装置に、ユーザの音声に類似した歌手を選択して表示するという、新たな付加価値を有するカラオケ装置に利用することができる。
【図面の簡単な説明】
【0044】
【図1】本発明の実施の形態に係る選曲歌手分析推薦装置が組み込まれたカラオケ装置の構成図である。
【図2】本実施の形態に係る選曲歌手分析推薦装置を実施するための最小の構成を示す図である。
【図3】本実施の形態に係る選曲歌手分析推薦装置の動作を示すフローチャートである。
【図4】本実施の形態に係る音響特徴辞書の製作方法を示す図である。
【符号の説明】
【0045】
1 カラオケ装置
10 リモコン
11 信号受信部
12 楽曲・映像データベース
13 選曲検索読出し部
14 スタック部
15 楽曲再生部
16 マイクロフォン
17 ミキシングアンプ
18 スピーカ
19 ディスプレイ
20 AD変換分配部
21 歌唱力得点判定部
22 音声特徴辞書
23 選曲歌手分析推薦部
221 音響モデル辞書
222 歌唱モデル辞書
231 音響モデル検索部
232 歌唱モデル検索部

【特許請求の範囲】
【請求項1】
通常の会話に係る音声から抽出可能で、該音声の発声者を特徴づける第一の音声特徴素を、発声者別に格納した第一の辞書と、
歌唱時の音声から抽出可能で、該歌唱時の音声に係る発声者を特徴づける第二の音声特徴素を、発声者別に格納した第二の辞書と、
デジタル化されたユーザの音声データを、前記第一の辞書に格納されている前記第一の音声特徴素と比較分析し、該音声データと類似する前記第一の音声特徴素の発声者を抽出する第一の検索部と、
デジタル化されたユーザの音声データを、前記第二の辞書に格納されている前記第二の音声特徴素と比較分析し、該音声データと類似する前記第二の音声特徴素の発声者を抽出する第二の検索部と、
を備え、
前記第一の検索部での抽出結果及び前記第二の検索部での抽出結果から、前記音声データに類似する音声の発声者をリストアップすることを特徴とする選曲歌手分析推薦装置。
【請求項2】
前記第一の辞書は、前記第一の音声特徴素として、発声者の音声の音量、その音声の周波数成分及びその音声の発話速度を格納し、
前記第二の辞書は、前記第二の音声特徴素として、発声者の音声のしゃくり、ビブラート、抑揚、音域及び発話時間を格納することを特徴とする請求項1に記載の選曲歌手分析推薦装置。
【請求項3】
前記第一の辞書には、楽曲から抽出された歌声について音量、周波数成分及び発話速度を解析した結果が、歌手毎に識別可能な符号が付されて第一の音声特徴素として格納され、
前記第二の辞書には、楽曲から抽出された歌声についてしゃくり、ビブラート、抑揚、音域及び発話時間を解析した結果が、歌手毎に識別可能な符号が付されて第二の音声特徴素として格納されることを特徴とする請求項2に記載の選曲歌手分析推薦装置。
【請求項4】
前記第一の辞書及び前記第二の辞書は、新たな楽曲を解析した結果が格納される際に、該新たな楽曲の歌手の符号が既に存在する場合は、該符号に係る音声特徴素に該新たな楽曲の解析結果が融合されることを特徴とする請求項3に記載の選曲歌手分析推薦装置。
【請求項5】
前記第二の検索部は、前記第一の検索部が抽出した結果に基づいて、比較分析する前記第二の辞書の範囲を限定することを特徴とする請求項1乃至4のいずれか1項に記載の選曲歌手分析推薦装置。
【請求項6】
通常の会話に係る音声から抽出可能で、該音声の発声者を特徴づける第一の音声特徴素を発声者別に格納した第一の辞書を用い、デジタル化されたユーザの音声データを、前記第一の辞書に格納されている前記第一の音声特徴素と比較分析し、該音声データと類似する前記第一の音声特徴素の発声者を抽出する第一の手順と、
歌唱時の音声から抽出可能で、該歌唱時の音声に係る発声者を特徴づける第二の音声特徴素を発声者別に格納した第二の辞書を用いて、デジタル化されたユーザの音声データを、前記第二の辞書に格納されている前記第二の音声特徴素と比較分析し、該音声データと類似する前記第二の音声特徴素の発声者を抽出する第二の手順と、
前記第一の手順での抽出結果及び前記第二の手順の抽出結果から、前記音声データに類似する音声の発声者をリストアップする手順と、
を備えることを特徴とする選曲歌手分析推薦方法。
【請求項7】
前記第一の辞書は、前記第一の音声特徴素として、発声者の音声の音量、その音声の周波数成分及びその音声の発話速度を格納し、
前記第二の辞書は、前記第二の音声特徴素として、発声者の音声のしゃくり、ビブラート、抑揚、音域及び発話時間を格納することを特徴とする請求項6に記載の選曲歌手分析推薦方法。
【請求項8】
前記第一の辞書には、楽曲から抽出された歌声について音量、周波数成分及び発話速度を解析した結果が、歌手毎に識別可能な符号が付されて第一の音声特徴素として格納され、
前記第二の辞書には、楽曲から抽出された歌声についてしゃくり、ビブラート、抑揚、音域及び発話時間を解析した結果が、歌手毎に識別可能な符号が付されて第二の音声特徴素として格納されることを特徴とする請求項7に記載の選曲歌手分析推薦方法。
【請求項9】
前記第一の辞書及び前記第二の辞書は、新たな楽曲を解析した結果が格納される際に、該新たな楽曲の歌手の符号が既に存在する場合は、該符号に係る音声特徴素に該新たな楽曲の解析結果が融合されることを特徴とする請求項8に記載の選曲歌手分析推薦方法。
【請求項10】
前記第二の手順は、前記第一の手順で抽出した結果に基づいて、比較分析する前記第二の辞書の範囲を限定することを特徴とする請求項6乃至9のいずれか1項に記載の選曲歌手分析推薦方法。
【請求項11】
通常の会話に係る音声から抽出可能で、該音声の発声者を特徴づける第一の音声特徴素を発声者別に格納した第一の辞書を用い、デジタル化されたユーザの音声データを、前記第一の辞書に格納されている前記第一の音声特徴素と比較分析し、該音声データと類似する前記第一の音声特徴素の発声者を抽出する第一の処理と、
歌唱時の音声から抽出可能で、該歌唱時の音声に係る発声者を特徴づける第二の音声特徴素を発声者別に格納した第二の辞書を用いて、デジタル化されたユーザの音声データを、前記第二の辞書に格納されている前記第二の音声特徴素と比較分析し、該音声データと類似する前記第二の音声特徴素の発声者を抽出する第二の処理と、
前記第一の処理での抽出結果及び前記第二の処理の抽出結果から、前記音声データに類似する音声の発声者をリストアップする処理と、
をコンピュータに実行させることを特徴とする選曲歌手分析推薦プログラム。
【請求項12】
前記第一の辞書は、前記第一の音声特徴素として、発声者の音声の音量、その音声の周波数成分及びその音声の発話速度を格納し、
前記第二の辞書は、前記第二の音声特徴素として、発声者の音声のしゃくり、ビブラート、抑揚、音域及び発話時間を格納することを特徴とする請求項11に記載の選曲歌手分析推薦プログラム。
【請求項13】
前記第一の辞書には、楽曲から抽出された歌声について音量、周波数成分及び発話速度を解析した結果が、歌手毎に識別可能な符号が付されて第一の音声特徴素として格納され、
前記第二の辞書には、楽曲から抽出された歌声についてしゃくり、ビブラート、抑揚、音域及び発話時間を解析した結果が、歌手毎に識別可能な符号が付されて第二の音声特徴素として格納されることを特徴とする請求項12に記載の選曲歌手分析推薦プログラム。
【請求項14】
前記第一の辞書及び前記第二の辞書は、新たな楽曲を解析した結果が格納される際に、該新たな楽曲の歌手の符号が既に存在する場合は、該符号に係る音声特徴素に該新たな楽曲の解析結果が融合されることを特徴とする請求項13に記載の選曲歌手分析推薦プログラム。
【請求項15】
前記第二の処理は、前記第一の処理で抽出した結果に基づいて、比較分析する前記第二の辞書の範囲を限定することを特徴とする請求項11乃至14のいずれか1項に記載の選曲歌手分析推薦プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate


【公開番号】特開2009−210790(P2009−210790A)
【公開日】平成21年9月17日(2009.9.17)
【国際特許分類】
【出願番号】特願2008−53344(P2008−53344)
【出願日】平成20年3月4日(2008.3.4)
【出願人】(000164449)九州日本電気ソフトウェア株式会社 (67)
【Fターム(参考)】