説明

音声イントネーション較正方法

【課題】使用が簡単で用途が広い、改良された音声イントネーションの較正方法を提供する。
【解決手段】対象者Sが発する音声信号を、リアルタイム処理後に対象者Sの聴覚器官に対して再生する、音声イントネーション較正方法であって、模倣すべき音声信号モデルの収集ステップE10と、音声信号モデルのスペクトル分析ステップE11と、対象者Sが発した模倣音声信号の収集ステップE13と、模倣音声信号のスペクトル分析ステップE15と、音声信号モデルおよび模倣音声信号のスペクトルの比較ステップE16と、模倣音声信号を比較結果に応じて修正するステップE18と、修正された音声信号を対象者Sの聴覚器官に対して再生するステップE22とを含む。特に、語学の発声練習用または歌の歌唱用に用いられる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声イントネーション較正方法に関する。
【0002】
本発明は、また、対象者による学習言語の発声練習方法または歌の歌唱方法に関する。
【0003】
一般に、本発明は、人が話すとき受け取る音響情報を修正することによって、人により発せられる音声信号を修正する方法に関する。
【背景技術】
【0004】
このような方法は、対象者の音声供給、すなわち対象者が発する音が、この同じ対象者に与えられる音響供給に応じて、すなわち対象者が受け取る音響情報に応じて、大幅に変えられるという知られている原理に基づいている。
【0005】
特に言語教育および発声練習といった特定の分野では、対象者が発する音声信号をリアルタイム処理後、対象者の聴覚器官に対して再生する装置の使用が従来技術から知られている。
【0006】
このような方法は、特に、WO92/14229に記載されている。
【0007】
この文献は、学習する外国語の特徴とこの言語の高調波成分とを考慮に入れるために、対象者が発する音声信号を処理して修正する装置を記載している。その後、修正されたこの音声信号は、振動信号、一般には音響信号により、リアルタイムで対象者に供給され、対象者が発する音声信号を修正する。
【0008】
しかしながら、この文献では、対象者が発する音声信号が、学習言語の帯域幅、特に、この帯域幅のエンベロープ曲線に応じて、所定の方法で処理される。
【0009】
実際には、信号の処理回路は、当該外国語、特にこの言語の帯域幅およびこの帯域幅の形状、すなわち帯域幅のエンベロープ曲線に応じて、所定の方法で調整されるマルチ周波数イコライザを含む。実際には、イコライザは、異なる周波数で調整された連続する複数のフィルタから構成される。
【0010】
かくして、このイコライザは、学習言語の特徴により所定の方法で周波数パラメータが設定される。
【0011】
同様に、この文献は、対象者が発する音声信号に適用される第二の処理を記載しており、この第二の処理では、収集された発声の音響振動の高調波成分と、学習言語に依存するパラメータとに応じて、調整パラメータが設定される。
【0012】
この場合、マルチ周波数イコライザのパラメータは、対象者の有効な音声供給による処理された信号と、この言語の所定の特徴との差によって、設定される。
【0013】
かくして、この文献は、対象者の発する音を示す第一の信号から、学習言語の帯域幅に応じて、特にこの言語のエンベロープ曲線に応じて、所定の方法で第一の信号に対して修正される第二の信号と、発声の有効な高調波成分と言語の特徴とに応じた修正により第一の信号から派生する第三の信号とを形成することを記載している。
【0014】
その後、これらの信号は、対象者に対して選択的に再生される。
【0015】
従来技術によるこのようなシステムは、対象者が発する音声信号のタイプを考慮しない所定のパラメータ設定を使用するという不都合がある。
【0016】
【特許文献1】国際公開第92/14229号パンフレット
【特許文献2】欧州特許出願公開第1139318号明細書
【特許文献3】仏国特許出願公開第2764660号明細書
【発明の開示】
【発明が解決しようとする課題】
【0017】
本発明の目的は、既存の音声イントネーション較正方法を改善することにより、その使用を簡略化し、また用途を広げることにある。
【課題を解決するための手段】
【0018】
このため、本発明は、対象者が発する音声信号が、リアルタイム処理後対象者の聴覚器官に対して再生される、音声イントネーション較正方法を提供する。
【0019】
本発明によれば、この方法は、模倣すべき音声信号モデルの収集ステップと、前記音声信号モデルのスペクトル分析ステップと、対象者により発せられた模倣音声信号の収集ステップと、模倣音声信号のスペクトル分析ステップと、音声信号モデルのスペクトルと模倣音声信号のスペクトルとの比較ステップと、模倣音声信号を前記比較結果に応じて修正するステップと、修正された音声信号を対象者の聴覚器官に対して再生するステップとを含むことを特徴とする。
【0020】
本発明は、模倣すべき音声信号および対象者により模倣された音声信号の周波数成分を分析することによって、発声の高調波成分のリアルタイム修正と、周波数分析に基づき修正されたこの信号の再生とにより、人のイントネーションを変えることができる。
【0021】
かくして、この較正方法により、予め記録された音声信号モデルとの比較により、模倣音声信号に含まれる様々な周波数の強度をリアルタイムで増減する。
【0022】
このような較正方法によって、対象者は、模倣すべき音声信号にに基づき、どんなタイプの声でも非常に正確に再生することができる。従って、選択されたネイティブスピーカーが発音する単語群またはフレーズ群を模倣可能な外国語の発声練習だけではなく、歌の歌唱時に歌手のイントネーションを再生可能なカラオケタイプの歌の歌唱にも適用される。
【0023】
本発明の好適な特徴によれば、この音声イントネーション較正方法は、対象者により模倣された音声信号のダイナミックレンジの測定ステップと、修正された音声信号のダイナミックレンジの測定ステップと、模倣音声信号と修正された音声信号のダイナミックレンジの比較ステップと、修正された音声信号を対象者の聴覚器官に対して再生する前に、修正された音声信号のダイナミックレンジを、前記比較の結果に応じて修正するステップとをさらに含む。
【0024】
かくして、修正された信号のエンベロープ全体を、模倣音声信号に応じて修正することにより、対象者で再生される修正信号が、対象者により発せられる音声信号とあまりに異なるダイナミックレンジを持たないようにすることができる。
【0025】
本発明の好適な特徴によれば、この較正方法は、さらに、模倣すべき音声信号モデルのスペクトル分析の記憶ステップを含む。
【0026】
かくして、模倣すべき音声信号を対象者が時間的に遅延して繰り返す場合、音声信号モデルのスペクトル分析を用いることにより、音声イントネーション較正方法を実施できる。
【0027】
特に言語の発声練習時にとりわけ便利なのは、音声イントネーション較正方法が、対象者によって模倣された音声信号の収集ステップの前に、模倣すべき音声信号モデルを対象者の聴覚器官に対して発音するステップを含むことである。
【0028】
模倣すべき信号を模倣する前に対象者が音で聞くことにより、言語の発声練習がさらに容易になり、外国語で単語またはフレーズを発音するときのイントネーションが改善される。
【0029】
こうした音声イントネーション較正方法の第一の実施形態によれば、本発明は、学習言語の発声練習方法に関し、対象者が発する音響信号をリアルタイムで処理後、対象者の聴覚器官に対して再生する。この方法は、本発明による音声イントネーション較正方法を用いる。
【0030】
代わりに、本発明は、また、第二の実施形態において、対象者による歌の歌唱方法に関し、対象者が発する音声信号をリアルタイムで処理後、対象者の聴覚器官に対して再生する。こうした歌の歌唱方法も、同様に、本発明による音声イントネーション較正方法を用いている。
【0031】
さらに、本発明は、また、音声イントネーション較正方法、本発明による学習言語の発声練習方法、または、本発明による歌の歌唱方法のステップを実施するように構成されたソフトウェアコード部分を含む、固定式または着脱式の情報保存手段を提供する。
【0032】
本発明の他の特徴および長所は、以下の説明からいっそう明らかになるであろう。
【0033】
添付図面は、限定的ではなく例として挙げたものである。
【発明を実施するための最良の形態】
【0034】
最初に、図1を参照しながら、本発明の第一の実施形態による音声イントネーションの較正方法について説明する。
【0035】
この例では、音声イントネーション較正方法が、言語の発声練習方法で用いられる。
【0036】
本発明は、各言語が、固有の強度を持つ一つまたは複数のスペクトル帯域を使用することに基づいている。また、全ての対象者は、母国語に固有のスペクトル範囲を認識するのに耳が慣れている。ところで、声は、耳で聞いたものしか再生しないので、学習する新しい言語に固有の範囲を聞くのに耳が慣れていない場合、対象者にとって外国語で正確に単語を発音することは難しい。
【0037】
かくして、本発明による音声イントネーション較正方法は、学習する言語の固有の範囲を発音して聞かせることによって、対象者の耳を再教育することができる。
【0038】
この方法は、まず、模倣すべき音声信号モデルの収集ステップE10を含む。
【0039】
外国語の場合、この音声信号は、学習する言語のネイティブスピーカーが発音する単語または単語の集合とすることができる。
【0040】
こうしたモデル収集は、好適には、様々な音声信号モデルを保存可能なコンピュータファイルによって行われる。
【0041】
これらのサウンドファイルFは、コンピュータのハードディスク、またはCD−ROM、メモリカード等の他のあらゆるデータ媒体に保存可能であるか、あるいは、インターネット等の通信ネットワークを介してダウンロード可能である。
【0042】
模倣すべきこの音声信号は、その後、スペクトル分析ステップE11で分析される。
【0043】
この分析ステップE11では、分析される各周波数帯域に固有の強度が測定される。
【0044】
こうしたスペクトル分析の結果を図2aの例で示した。かくして、この分析ステップE11は、30Hzから10000Hzに及ぶ可聴周波数範囲の一連の周波数帯域で実施される。
【0045】
一連の周波数帯域は、周波数範囲の分割に対応する。
【0046】
実際には、周波数範囲が、音声信号の十分に細かい分析を行えるように、少なくとも50個の周波数帯域、好適には少なくとも160個の周波数帯域に分割される。
【0047】
図2aでは、50Hzから1500Hzの周波数範囲にわたるこのような分割を示した。
【0048】
かくして、各周波数帯域に対して、模倣すべき音声信号に存在するこの周波数帯域の強度をデシベルで測定することができる。
【0049】
この第一の実施形態では、こうしたスペクトル分析の結果、すなわちこの例では図2aに示した分析が、記憶ステップE12でファイルに保存される。
【0050】
音声イントネーション較正方法は、また、対象者Sにより模倣される音声信号の収集ステップE13を含む。この収集ステップE13では、対象者Sから発せられる模倣音声信号が、たとえばマイクロホンを介して集められる。
【0051】
この実施形態では、模倣音声信号のダイナミックレンジが、最初に測定ステップE14で測定される。
【0052】
かくして、測定ステップE14は、模倣音声信号の全体エンベロープを決定する。
【0053】
次に、本発明によれば、スペクトル分析ステップE15が、模倣音声信号に行われる。
【0054】
このスペクトル分析ステップE15は、模倣される音声信号に対して先に記載したステップと同じであり、一連の周波数帯域にわたって、対象者Sに関してこのように収集された音声信号の強度を分析する。
【0055】
かくして、図2bに示したように、30Hzから10000Hzの周波数範囲にわたって、各周波数帯域の信号強度が決定される一定のスペクトル範囲が得られる。
【0056】
図2bでは、周波数範囲50Hzから1500Hzにおけるこのスペクトルの一例を示した。
【0057】
周波数帯域の分割は、模倣すべき音声信号のスペクトル分析ステップE11で用いられているものと同じである。
【0058】
その後、比較ステップE16が行われ、音声信号モデルのスペクトルと、模倣音声信号のスペクトルとを比較する。
【0059】
この比較の結果から、図2cに示したように、計算ステップE17で、模倣音声信号にもたらされるスペクトル修正を計算することができる。
【0060】
図2cに明らかに示されているように、模倣音声信号の各周波数帯域は、帯域ごとに、模倣すべき音声信号の各周波数帯域と比較されて修正されるので、その結果、模倣音声信号の強度値が、模倣すべきモデルの強度値に対応する。
【0061】
実際には、各周波数帯域のレベルで加算または減算すべき修正を、この計算ステップから導く。
【0062】
そのため、この計算ステップは、音声信号モデルに対して加算または減算により、各周波数帯域に適用される修正を画定する。
【0063】
この計算の結果は、模倣音声信号の修正に修正ステップE18で用いられる。実際には、ダイナミックマルチバンドイコライザのパラメータ設定により、模倣音声信号の周波数範囲が、収集された音声信号モデルの周波数範囲に等しくなるようにする。
【0064】
パラメータ設定は、各周波数帯域の利得の自動調整制御により行われる。
【0065】
この好適な実施形態において、次に、修正ステップE18の後で修正された音声信号のダイナミックレンジを測定し、模倣信号のダイナミックレンジと、修正された音声信号のダイナミックレンジとを比較ステップE19で比較する。
【0066】
計算ステップE20は、信号に適用されるダイナミックレンジの修正を画定する。この計算の結果は、修正された音声信号のダイナミックレンジを修正する修正ステップE21で使用される。
【0067】
実際には、計算ステップE20で得られた計算の結果は、信号のダイナミックレンジを調整するように構成された可変利得増幅器のパラメータを設定するために使用される。
【0068】
パラメータの設定は、全体利得の自動調整制御により行われる。
【0069】
次に、この較正方法は、このように修正された音声信号を、対象者Sの聴覚器官に対して再生可能にする発音ステップE22を含む。
【0070】
この発音は、ヘッドホンに出力が接続された増幅器を介して従来の方法で行われる。
【0071】
この増幅器は、前述の処理後の模倣音声信号か、または収集ステップE10で収集された音声信号モデルを、選択的に対象者Sに聞かせることができる。
【0072】
かくして、模倣すべき音声信号モデルを対象者Sの聴覚器官に対して発音するステップは、好適には、対象者Sにより発せられる模倣音声信号の収集ステップE13の前に実施される。
【0073】
好適には、修正ステップE23が、学習言語を表すパラメータに応じて、模倣すべき音声信号モデルを修正するように構成される。
【0074】
実際には、模倣すべき音声信号が、所定のマルチバンドグラフィックイコライザを通る。すなわち、このイコライザは、この言語に固有の周波数帯域を強調するように、選択された言語に応じてパラメータ設定される。
【0075】
このようにして、対象者Sは、通常は耳が比較的感知しない周波数ゾーンをずっとはっきりと認識する。
【0076】
さらに、音声信号がテキストである場合、対象者Sが行う作業、特に対象者Sが模倣すべき音声信号の反復を容易にするために、この方法は、好適には、たとえばコンピュータに結合される画面上へのテキストの表示ステップE24を含む。
【0077】
次に、図3を参照しながら、図1に示したような音声イントネーション較正方法を実施する、学習言語の発声練習方法について説明する。
【0078】
かくして、こうした言語の発声練習方法によって、選択された言語を発声する対象者Sの発音を改善できる。
【0079】
図3に示したような方法は、まず、較正ステップE30を含む。
【0080】
この較正ステップを図4に示した。
【0081】
一般原理において、こうした較正ステップにより、コンピュータの使用前に、対象者Sが発音するフレーズのレベルを予め記録された例と比較することによって、コンピュータのサウンドカードの入力レベルを自動調整することができる。
【0082】
こうした較正により、生徒は、この発声練習方法の適切な動作を妨げうる弱すぎたり強すぎたりするサウンド入力レベルを回避しながら、発声練習方法で自発的に作業することができる。
【0083】
このため、較正ステップはテストステップE41を含み、対象者は、このテストステップ中に、較正を実施するかしないか決定できる。特に、同じ対象者が、コンピュータとその関連するサウンドカードとを使用する場合、較正ステップを省略してもよい。
【0084】
較正を実施する場合、一つの例を生成するステップE42で、基準音声信号を生成できる。
【0085】
表示ステップE43は、生成ステップE42で発生する音声信号に対応するテキストを表示する。
【0086】
次に、対象者は、音声信号例を反復し、その声が記録ステップE44で記録される。
【0087】
音声信号例の全体強度と、対象者から発せられる音声信号の全体強度との比較ステップE45における比較は、計算ステップE46で、2個の音声信号間の強度レベルの差を計算するために使用される。
【0088】
次に、調整ステップE47で、コンピュータのサウンドカードの入力利得が調整される。
【0089】
図3に戻ると、この較正ステップが実施されると、ローディングステップE31が、言語の発声練習方法のコードを含むソフトウェアをローティングすることができる。
【0090】
この実施形態では、同一のソフトウェアを様々な言語に使用できる。
【0091】
もちろん、異なる外国語に対して別々のソフトウェアを使用してもよい。
【0092】
この実施形態では、選択ステップE32で所望の言語を選択することができる。
【0093】
選択ステップE32によって、この言語に関連する全てのパラメータが、コンピュータにローディングされる。
【0094】
特に、これらのパラメータは、学習言語に固有の一つまたは複数の周波数スペクトルを含む。
【0095】
また、第二の選択ステップE33では、特別なレッスンを選択できる。
【0096】
実際、各言語に対して、各レッスンが、予め記録された幾つかの単語またはフレーズを含む複数のレッスンを設けることができる。
【0097】
これらのレッスンは、言語の難易度に応じて、あるいはまた各言語に固有の、学習される様々な音素に応じて、分類可能である。
【0098】
実際には、パラメータおよびレッスンのローディングが、従来通りコンピュータのRAM(Random Acces Memory)で行われる。
【0099】
その後、この方法は、反復すべきフレーズまたは単語の発音ステップE34を含む。
【0100】
1つのフレーズのこうした発音ステップは、図1に示した収集ステップE10とスペクトル修正ステップE23とに対応する。
【0101】
発音ステップE34のとき、増幅器のアクティブ入力は、サウンドファイルFに記録された録音に対応する。
【0102】
かくして、発音ステップE34により、対象者Sは、学習言語のネイティブスピーカーが発音するテキストの単語またはフレーズに対応する、模倣すべき音声信号を聞くことができる。
【0103】
同時に、図1に示したような分析ステップE11およびスペクトル分析の保存ステップE12が実施される。
【0104】
対象者が反復する言葉を容易に記憶するように、図1に示された表示ステップE24に対応する表示ステップE35が、フレーズを発音するステップE34と同時に実施される。
【0105】
その後、この習得方法は、時間遅延ステップE36を含み、図1に示したステップE13からE22の全体を実施する。
【0106】
かくして、この時間遅延中、対象者は、模倣すべき音声信号を反復し、この信号は、前述のように修正されて対象者の耳に対してリアルタイムで再生されるので、対象者は、無意識かつ自発的に自分自身の発音を修正する。
【0107】
時間遅延ステップE36の持続時間は、模倣すべき音声信号の持続時間に数秒を加えた時間にほぼ対応し、対象者が、単語またはフレーズを繰り返すことができるようにする。
【0108】
たとえば、様々な単語またはフレーズを繰り返すように多少とも長い時間を対象者が望む場合、この時間遅延の持続時間を調節することができる。
【0109】
レッスンの進行、すなわち繰り返すべき単語と繰り返した単語との連続は、自動にしてもマニュアルにしてもよい。
【0110】
この実施形態では、テストステップE37により、同じフレーズまたは同じ単語を再び勉強したいかどうか、対象者に尋ねることができる。
【0111】
再び勉強したい場合、発音ステップE34、表示ステップE35、および時間遅延ステップE36が、同じ音声信号で実施される。
【0112】
再び勉強したくない場合、第二のテストステップE38により、次のフレーズまたは単語を勉強したいかどうか対象者に尋ねることができる。
【0113】
次のフレーズまたは単語を勉強したい場合、進行中のレッスンに予め記録された次の単語またはフレーズで、発音ステップE34、表示ステップE35、および時間遅延ステップE36が、同様に実施される。
【0114】
そうでない場合、レッスンが終了される。
【0115】
かくして、フレーズ群または単語群が、ループ状に繰り返され、生徒は、レッスンの幾つかの部分を多少とも勉強することができる。
【0116】
幾つかのレッスンが終わると、対象者の耳は、言語の認識に慣れてきて、耳に与えられる新しい周波数範囲の認識が永続的になる。その場合、対象者の発声も同様に永続的に修正される。
【0117】
次に、図5、6に関して、対象者による歌の歌唱を可能にする同様の方法について説明する。
【0118】
この用途では、音声イントネーション較正方法によって、対象者のイントネーションを修正し、予め記録された歌手の歌い方にできるだけ合わせることができる。
【0119】
かくして、対象者は歌手のように歌うことができ、たとえばカラオケシステムでこれを使用できる。
【0120】
最初に、図5を参照しながら、本発明による音声イントネーション較正方法について説明する。この方法は、図1に示した言語の発声練習方法で用いられる方法と同様の方法である。
【0121】
この用途では、サウンドファイルFが、一つまたは複数の歌を記憶するように構成されている。実際には、各歌に対して3個のサウンドファイルが存在し、1個はアーティストの声だけを含むもの、もう1つは歌に伴奏が入ったもの、そして3番目は歌詞が入ったものである。
【0122】
前述のように、このサウンドファイルは、コンピュータのハードディスクまたは他のあらゆるデータ媒体(CD−ROM、メモリカードなど)に保存可能である。また、インターネット等の通信ネットワークでダウンロードしても得られる。
【0123】
ここでは、図1に示した音声イントネーション較正方法(モデルの収集ステップE10およびこのモデルのスペクトル分析ステップE11と、模倣された音声信号の記録ステップE13およびスペクトル分析ステップE15とが交互に実施されるので、模倣すべき音声信号のスペクトル分析の保存ステップE12を必要とし、それによって後で比較を行う)とは異なり、歌声に対応する模倣すべき音声信号の収集ステップE50が、対象者Sにより発せられた模倣音声信号の記録ステップE53と同時に実施される。
【0124】
前述のように、スペクトル分析ステップE51、E55は、模倣すべき音声信号と、模倣音声信号とにそれぞれ適用され、結果がコンパレータの入力に供給され、スペクトルの比較ステップE56が実施される。
【0125】
比較ステップE56に続く計算ステップE57では、記録されたモデルに応じて、模倣音声信号に実施する修正を計算する。
【0126】
こうした比較ステップおよび計算ステップは、図2a、2b、2cに関して説明したものと同じである。
【0127】
徹底的なスペクトル分析を得るために、好適には少なくとも160個の周波数帯域に周波数範囲を分割する。
【0128】
このように計算された修正は、利得の自動調整制御により各帯域に適用され、修正ステップE58で、模倣音声信号を修正する。
【0129】
前述のように、ダイナミック調整グラフィックイコライザによりこうした修正を実施可能であり、このイコライザは、周波数帯域ごとに、模倣音声信号が収集されたモデルにできるだけ近くなるように調整可能である。
【0130】
対象者で修正信号を再生する前に、前述のようにエンベロープ修正ステップE61が実施される。
【0131】
実際には、記録ステップE53で記録された音声信号のダイナミックレンジの分析ステップE54により、信号の全体強度を知ることができる。比較ステップE59は、記録されたこの音声信号のダイナミックレンジと、修正ステップE58で修正された音声信号のダイナミックレンジとを比較する。
【0132】
計算ステップE60は、修正された音声信号に実施すべき修正を計算する。こうした修正は、全体利得の自動調整制御によって適用され、修正された音声信号を、修正ステップE61で修正する。このエンベロープ修正は、可変利得増幅器によって行われる。
【0133】
このように修正された音声信号は、増幅器を介して発音ステップE62で、対象者に対して再生される。
【0134】
かくして、この音声イントネーション較正方法では、増幅器が、修正された音声信号と、サウンドファイルFから収集ステップE63で収集した伴奏信号とを入力で同時に受信する。
【0135】
かくして、対象者は、伴奏と、前述の処理により修正された自分の声とを同時に聞く。
【0136】
歌の歌唱を容易にするために、表示ステップE64は、歌唱と同時に歌詞を表示できる。
【0137】
実際には、図6に示したように、この音声イントネーション較正方法は、対象者が歌を歌う、もっと複雑なカラオケタイプのシステムで実施可能である。
【0138】
このような歌の歌唱方法において、歌唱の前に較正ステップE61を実施できる。
【0139】
この較正ステップは、図4に関して説明した較正ステップに対応し、コンピュータのサウンドカードの入力利得を調整する。
【0140】
ローディングステップE62は、歌の歌唱方法のコードを含むソフトウェアをローディングするように構成される。
【0141】
実際、選択ステップE63は、サウンドファイルFに記憶された歌のうちの1曲を対象者が選択できるようにする。
【0142】
その後、図5に関して説明したように歌の歌唱ステップE64が実施される。
【0143】
歌唱時、伴奏だけを含むファイルが、増幅器およびヘッドホンを介して対象者Sに発音される。
【0144】
同時に、ステップE64で、コンピュータ画面に歌詞が表示される。声を含むモデルファイルが、伴奏を含むファイルと完全に同期して同時に読み込まれる。対象者は、また、伴奏に従って同時に歌うので、2個の音声信号のスペクトル分析が同時に行われ、模倣音声信号にリアルタイムで適切な修正が行われる。
【0145】
歌の歌唱においてこうした同時性を容易にするために、メトロノーム信号の発音と、場合によっては、歌詞上に示されて歌うべき歌詞部分がどこかを示すカーソルとによって、補助を行うことができる。
【0146】
自分の発声がリアルタイムで修正されて聞こえるので、対象者は、同様にリアルタイムで無意識に自分の発声を認識する。
【0147】
かくして、対象者は、予め録音された歌手の歌い方で歌うように導かれる。
【0148】
歌の歌唱が終了すると、テストステップE65により、対象者は、同じ歌を再び歌うかどうか選択できる。
【0149】
同じ歌を再び歌う場合、歌唱ステップE64を同じサウンドファイルの内容で繰り返す。
【0150】
同じ歌を再び歌わない場合、第二のテストステップE66により、対象者は、別の歌を歌うかどうか選択できる。
【0151】
対象者が別の歌を歌うことを選択した場合、選択ステップE63が繰り返され、サウンドファイルに予め記録された歌の一つを選択する。
【0152】
その場合、この新しい歌で歌唱ステップE64が実施される。
【0153】
テストステップE66の終わりに、別の歌が選択されないとき、歌の歌唱方法が終了する。
【0154】
図7に示したように、歌の歌唱時または学習言語の発声練習時に用いられる音声イントネーション較正方法は、コンピュータ10で実施可能である。
【0155】
この方法で用いられる全ての手段は、マイクロプロセッサ(CPU)11に組み込まれ、ROM(「Read Only Memory」)12が、音声イントネーション較正プログラムならびに、歌の歌唱プログラムまたは言語の発声練習プログラムを記憶するように構成される。
【0156】
RAM13(「Random Acces Memory」)は、これらのプログラムの実行時に修正される値をレジスタに記憶するように構成される。
【0157】
実際には、RAMは、サウンドファイルFならびにスペクトル分析の結果を記憶するように構成されるレジスタを含む。
【0158】
マイクロプロセッサ11は、場合によっては通信インターフェースを介して通信ネットワークに接続可能なコンピュータに内蔵される。
【0159】
コンピュータは、さらに、ハードディスク14等の文書保存手段を含み、あるいは、ディスク(フロッピー(登録商標)ディスク、コンパクトディスク、またはコンピュータカード)ドライブ15により、ディスク5等の着脱式の文書保存手段と協働するように構成される。
【0160】
かくして、固定式または着脱式のこれらの保存手段は、音声イントネーション較正方法のコードと、言語の発声練習方法または歌の歌唱方法のコードとを含むことができる。
【0161】
場合によっては、たとえばコンピュータ10のハードディスクにこれらの方法のコードを記憶可能であり、また、様々なアプリケーションで用いられるサウンドファイルを、ディスク読取装置15と協働するディスク5に別々に記憶できる。
【0162】
変形実施形態では、本発明を実施可能なプログラムをROM12に保存可能である。
【0163】
コンピュータ10は、また、特に反復テキストまたは歌詞を対象者に提示するために、対象者Sとのインターフェースの役割を果たす画面16を備える。
【0164】
サウンドカード17は、また、マイク6およびヘッドホン7と協働することにより、音声信号を発音し、あるいは対象者が発する音声信号を受信可能である。
【0165】
その場合、CPU11は、本発明の実施に関する命令を実行する。電圧印加時、メモリ、たとえばROM12に保存されている本発明に関するプログラムおよび方法は、本発明の実行可能なコードと、本発明の実施に必要な変数とを含むRAM13に転送される。
【0166】
通信バス18は、コンピュータ10の一部である様々なサブシステム間、またはコンピュータに接続された様々なサブシステム間の通信を可能にする。
【0167】
通信バス18の表示は限定的なものではなく、特にマイクロプロセッサ11は、直接、または他のサブシステムを介して、全てのサブシステムに命令を伝達することができる。
【0168】
かくして、本発明により、音声イントネーション較正方法をパソコンで実施可能であり、外部介入の必要なく対象者Sがこれを使用することができる。
【0169】
特に、言語の発声練習の場合、対象者Sは、予め記録された各種のサウンドファイルを用いてイントネーションを勉強することができ、教師の存在は不要である。
【0170】
もちろん、本発明の範囲を逸脱せずに前述の実施形態に多数の修正を行うことができる。
【図面の簡単な説明】
【0171】
【図1】本発明の第一の実施形態による音声イントネーション較正方法を示すアルゴリズムである。
【図2a】図1または5に示された音声イントネーション較正方法の様々なステップを示す図である。
【図2b】図1または5に示された音声イントネーション較正方法の様々なステップを示す図である。
【図2c】図1または5に示された音声イントネーション較正方法の様々なステップを示す図である。
【図3】本発明の実施形態による言語の発声練習方法を示すアルゴリズムである。
【図4】図3、6で用いられる較正ステップを示すアルゴリズムである。
【図5】本発明の第二の実施形態による音声イントネーション較正方法を示すアルゴリズムである。
【図6】本発明の実施形態による歌の歌唱方法を示すアルゴリズムである。
【図7】本発明を実施するように構成されたコンピュータを示すブロック図である。
【符号の説明】
【0172】
6 マイク
7 ヘッドホン
10 コンピュータ
11 CPU
12 ROM
13 RAM
14 ハードディスク
15 ディスクドライブ
16 画面
17 サウンドカード
18 通信バス
S 対象者
F サウンドファイル

【特許請求の範囲】
【請求項1】
対象者(S)が発する音声信号を、リアルタイム処理後に前記対象者(S)の聴覚器官に対して再生する、音声イントネーションの較正方法であって、
模倣すべき音声信号モデルの収集ステップ(E10、E50)と、
前記音声信号モデルのスペクトル分析ステップ(E11、E51)と、
対象者(S)が発した模倣音声信号の収集ステップ(E13、E53)と、
模倣音声信号のスペクトル分析ステップ(E15、E55)と、
音声信号モデルのスペクトルと模倣音声信号のスペクトルとの比較ステップ(E16、E56)と、
模倣音声信号を前記比較結果に応じて修正するステップ(E18、E58)と、
修正された音声信号を対象者(S)の聴覚器官に対して再生するステップ(E22、E62)とを含むことを特徴とする方法。
【請求項2】
対象者(S)により模倣された音声信号のダイナミックレンジの測定ステップ(E14、E24)と、
修正された音声信号のダイナミックレンジの測定ステップ(E18、E28)と、
模倣音声信号と修正された音声信号のダイナミックレンジの比較ステップ(E19、E59)と、
修正された音声信号を対象者(S)の聴覚器官に対して再生する前に、修正された音声信号のダイナミックレンジを、前記比較の結果に応じて修正するステップ(E21、E61)とをさらに含むことを特徴とする、請求項1に記載の音声イントネーション較正方法。
【請求項3】
比較ステップ(E16、E56)および修正ステップ(E18、E58)が、可聴周波数範囲にある一連の周波数帯域で実施されることを特徴とする、請求項1または2に記載の音声イントネーション較正方法。
【請求項4】
一連の周波数帯域が、可聴周波数範囲の分割に対応することを特徴とする、請求項3に記載の音声イントネーション較正方法。
【請求項5】
可聴周波数範囲が、少なくとも50個の周波数帯域に分割されることを特徴とする、請求項3または4に記載の音声イントネーション較正方法。
【請求項6】
模倣すべき音声信号モデルがテキストであり、前記方法が、さらに、前記テキストの表示ステップ(E24、E64)を含むことを特徴とする、請求項1から5のいずれか一項に記載の音声イントネーション較正方法。
【請求項7】
さらに、前記模倣すべき音声信号モデルのスペクトル分析の記憶ステップ(E12)を含むことを特徴とする、請求項1から6のいずれか一項に記載の音声イントネーション較正方法。
【請求項8】
対象者(S)により発せられた模倣音声信号の収集ステップ(E13)の前に、前記模倣すべき音声信号モデルを、対象者(S)の聴覚器官に対して発音するステップ(E22)を含むことを特徴とする、請求項1から7のいずれか一項に記載の音声イントネーション較正方法。
【請求項9】
発音ステップ(E22)の前に、学習する言語を表すパラメータに応じて、模倣すべき音声信号モデルを修正するステップ(E23)をさらに含むことを特徴とする、請求項8に記載の音声イントネーション較正方法。
【請求項10】
模倣すべき音声信号モデルが歌であり、修正された音声信号を対象者(S)の聴覚器官に対して再生するステップ(E62)と同時に、前記歌の伴奏信号を対象者(S)の聴覚器官に対して発音するステップ(E62)をさらに含むことを特徴とする、請求項1から6のいずれか一項に記載の音声イントネーション較正方法。
【請求項11】
対象者(S)が発する音声信号が、リアルタイム処理後に対象者(S)の聴覚器官に対して再生され、請求項1から9のいずれか一項に記載の音声イントネーション較正方法を実施することを特徴とする、学習言語の発声練習方法。
【請求項12】
対象者(S)が発する音声信号が、リアルタイム処理後に対象者の聴覚器官に対して再生され、請求項1から6のいずれか一項または請求項10に記載の音声イントネーション較正方法を実施することを特徴とする、対象者(S)による歌の歌唱方法。
【請求項13】
請求項1から10のいずれか一項に記載の音声イントネーション較正方法のステップを実施するように構成されたソフトウェアコード部分を含むことを特徴とする、固定式または着脱式の情報保存手段。
【請求項14】
請求項11に記載の学習言語の発声練習方法のステップを実施するように構成されたソフトウェアコード部分を含むことを特徴とする、固定式または着脱式の情報保存手段。
【請求項15】
請求項12に記載の歌の歌唱方法のステップを実施するように構成されたソフトウェアコード部分を含むことを特徴とする、固定式または着脱式の情報保存手段。

【図1】
image rotate

【図2a】
image rotate

【図2b】
image rotate

【図2c】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2008−146094(P2008−146094A)
【公開日】平成20年6月26日(2008.6.26)
【国際特許分類】
【外国語出願】
【出願番号】特願2008−9201(P2008−9201)
【出願日】平成20年1月18日(2008.1.18)
【分割の表示】特願2003−284731(P2003−284731)の分割
【原出願日】平成15年8月1日(2003.8.1)
【出願人】(504405419)
【Fターム(参考)】