語学学習装置

【課題】発音の悪い部分あるいは間違った部分を容易に特定できる語学学習システムを提供すること。
【解決手段】本発明は、模範音声を記憶する模範音声記憶手段と、ユーザの音声であるユーザ音声を取得する音声取得手段と、前記模範音声記憶手段に記憶された模範音声と、前記音声取得手段により取得されたユーザ音声を比較する比較手段と、前記比較手段による比較結果に基づいて、前記模範音声と前記ユーザ音声との相違点を抽出する相違点抽出手段と、前記相違点抽出手段により抽出された相違点が存在する部分について強調すべき態様を指示する強調指示データを生成する強調手段と、前記強調手段により生成された強調指示データに基づく態様に合わせて前記模範音声を出力する出力手段と、を有する語学学習装置を提供する。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、語学学習を支援する語学学習システムに関する。
【背景技術】
【０００２】
外国語あるいは母国語の語学学習、特に、発音あるいは発話の独習においては、ＣＤ（Compact Disk）等の記録媒体に記録された模範音声を再生し、その模範音声の真似をして発音あるいは発話するという学習方法が広く用いられている。これは模範音声の真似をすることで正しい発音を身につけることを目的とするものである。ここで、学習をより効果的に進めるためには、模範音声と自分の音声との差を客観的に評価する必要がある。しかし、ＣＤに記録された模範音声を聞いてその真似をするだけでは、自分の発した音声と模範音声との差を具体的に把握することが困難であるという問題があった。
【０００３】
このような問題を解決する技術として、例えば特許文献１に記載の技術がある。特許文献１には、ユーザが発した音声の抑揚と模範音声の抑揚とを比較し、差がある部分について修正指示を行う技術が開示されている。
【特許文献１】特開２００２−２４４５４７号公報
【発明の開示】
【発明が解決しようとする課題】
【０００４】
しかし、特許文献１に記載の技術によれば、ユーザが発した音声の抑揚と模範音声の抑揚との比較はできるものの、ユーザの発音と模範音声の発音が異なっている部分（ユーザの発音の悪い部分あるいは間違った部分）を具体的に特定することは困難であった。
本発明は上述の事情に鑑みてなされたものであり、自分の発音の悪い部分あるいは間違った部分を容易に特定できる語学学習システムを提供することを目的とする。
【課題を解決するための手段】
【０００５】
上記の課題を解決するため、本発明は、模範音声を記憶する模範音声記憶手段と、ユーザの音声であるユーザ音声を取得する音声取得手段と、前記模範音声記憶手段に記憶された模範音声と、前記音声取得手段により取得されたユーザ音声を比較する比較手段と、前記比較手段による比較結果に基づいて、前記模範音声と前記ユーザ音声との相違点を抽出する相違点抽出手段と、前記相違点抽出手段により抽出された相違点が存在する部分について強調すべき態様を指示する強調指示データを生成する強調手段と、前記強調手段により生成された強調指示データに基づく態様に合わせて前記模範音声を出力する出力手段と、を有する語学学習装置を提供する。
この語学学習装置によれば、模範音声とユーザ音声との差異点が抽出され、差異点に相当する部分が強調されて出力される。したがって、ユーザは自分の発音の悪い部分あるいは間違った部分を容易に特定できる。
【０００６】
好ましい態様において、前記模範音声記憶手段が模範音声とその模範音声を特定する文字列とを記憶しており、前記語学学習装置が、前記模範音声記憶手段に記憶された模範音声から、前記ユーザ音声と最も近いものを検索する検索手段と、前記検索手段により検索された模範音声を特定する文字列を表示する表示手段とを有する。
この態様によれば、自分の発音が間違っていた場合に、その間違った発音に対応する文字列が表示されるので、ユーザは自分の間違いがどのようなものであったか認識することができる。
さらに別の好ましい態様において、この語学学習装置は、前記ユーザ音声を記憶するユーザ音声記憶手段と、前記ユーザ音声記憶手段に記憶されたユーザ音声から、前記ユーザの音声パラメータを取得するパラメータ取得手段と、前記パラメータ取得手段により取得された音声パラメータに基づいて声質変換を行う声質変換手段とを有する。
この態様によれば、ユーザ音声と模範音声とで異なる部分があった場合は、差異点が強調された模範音声がユーザ自身の声に近い声で再生されるため、ユーザはその模範音声の真似をしやすくなり、より効果的に学習を行うことができる。
【発明の効果】
【０００７】
この語学学習装置によれば、自分の発音の悪い部分あるいは間違った部分が強調されるので、その部分を容易に特定することができる。また、模範音声のうち間違った部分に対応する箇所が強調されるので、それを真似することにより効果的に学習を行うことができる。
【発明を実施するための最良の形態】
【０００８】
以下、図面を参照して本発明の実施形態について説明する。
＜第１実施形態＞
図１は、本発明の第１実施形態に係る語学学習装置１００のハードウェア構成を示すブロック図である。ＣＰＵ（Central Processing Unit）１０１は、ＲＡＭ（Random Access Memory）１０２を作業エリアとして、ＲＯＭ（Read Only Memory）１０３あるいはＨＤＤ（Hard Disk Drive）１０４に記憶されているプログラムを読み出して実行する。ＨＤＤ１０４は、各種アプリケーションプログラムやデータを記憶する記憶装置である。本実施形態に関して、特に、ＨＤＤ１０４は、語学学習プログラム、この語学学習プログラムで使用する模範音声データを記録した模範音声データベースＤＢ１、およびテキストデータから音声合成を行う際に使用する音節辞書Ｄ１を記憶している（後述）。
【０００９】
ディスプレイ１０５は、ＣＲＴ（Cathode Ray Tube）やＬＣＤ（Liquid Crystal Display）等、ＣＰＵ１０１の制御下で文字や画像を表示する表示装置である。マイク１０６は、ユーザの音声を取得するための集音装置であり、ユーザの発した音声に対応する音声信号を出力する。音声処理部１０７は、マイク１０６により出力されたアナログ音声信号をデジタル音声データに変換する機能や、ＨＤＤ１０４に記憶された音声データを音声信号に変換してスピーカ１０８に出力する機能を有する。また、ユーザはキーボード１０９を操作することにより、語学学習装置１００に対して指示入力を行うことができる。各構成要素は、バス１１０を介して相互に接続されている。
【００１０】
図２は、模範音声データベースＤＢ１の内容を示す図である。模範音声データベースＤＢ１は、語学学習に用いる例文（例えば、英語の学習において「How was your weekend?」等の例文）のテキストデータを記憶した例文テキストデータベースＤＢ２、および音節単位の音声波形をデジタル化した音声波形データと発音記号等その音節を特定する識別子とを記憶した音節データベースＤＢ３から構成される。後述するように、ＣＰＵ１０１は、例文のテキストデータに基づいて、必要な音声波形データを組み合わせることにより例文の音声データを生成する。
【００１１】
さらにＨＤＤ１０４には、本実施形態に係る語学学習プログラムが記憶されている。ＣＰＵ１０１がこの語学学習プログラムを実行することにより、語学学習装置１００は本実施形態に係る語学学習装置としての機能を具備する。
図３は、語学学習装置１００の機能構成を示すブロック図である。模範音声記憶部１１１は、模範音声の音声データを記憶しており、図１に示すハードウェア構成におけるＨＤＤ１０４に相当する。音声比較部１１２は、音声取得部１１５により取得したユーザ音声と模範音声とを比較し、差異点を抽出する。差異点強調部１１３は、音声比較部１１２が抽出した差異点に基づいて、模範音声において差異があった箇所を強調する。出力部１１４は、差異点強調部１１３により強調された差異点を、音声あるいは映像として出力する。ユーザはこの強調された差異点を聴覚的あるいは視覚的に認識することができる。
【００１２】
続いて、語学学習装置１００の動作について説明する。
ユーザがキーボード１０９を操作して語学学習プログラムの実行を指示すると、ＣＰＵ１０１は、ＨＤＤ１０４から語学学習プログラムを読み出して実行する。語学学習プログラムを実行することにより、語学学習装置１００は図３に示す機能を具備する。
【００１３】
図４は、本実施形態に係る語学学習装置１００の動作を示すフローチャートである。
語学学習プログラムを実行すると、ディスプレイ１０５上に、例文の選択を促すメッセージが表示される。ユーザはディスプレイ１０５上に表示されたメッセージに従い、例文を選択する（ステップＳ１０１）。ＣＰＵ１０１は選択された例文に基づいて例文の音声データを生成する（ステップＳ１０２）。具体的には次のとおりである。
ＣＰＵ１０１は、例文テキストデータベースＤＢ２に記録されている例文テキストデータから、選択された例文に対応するものを抽出する。ＣＰＵ１０１は、例文を単語毎に分解し、ＨＤＤ１０４に記憶されている音節辞書Ｄ１を参照して音節データを組み合わせて単語の音声データとする。ここで、音節辞書Ｄ１は、単語と、その単語に対応する発音記号を音節に区分して記録した辞書である。ＣＰＵ１０１は、発音記号に基づいて音節ごとの音声データを抽出する。ＣＰＵ１０１は、こうして生成された単語の音声データをさらに結合し、単語間に適切な間を挿入する等の後処理を行い例文の模範音声データを生成する。音声データを結合する際には補間処理等の必要な処理を行う。ＣＰＵ１０１は、生成した模範音声データを音声処理部１０７に出力する。
【００１４】
音声処理部１０７は受け取った模範音声データをデジタル／アナログ変換して例文の模範音声信号を生成する。音声処理部１０７は、生成した模範音声信号をスピーカ１０８に出力する。こうしてスピーカ１０８から模範音声が出力される（ステップＳ１０３）。なお、このとき音声と同時に例文のテキストデータをディスプレイ１０５に表示してもよい。模範音声を再生した後、ＣＰＵ１０１は、ディスプレイ１０５にユーザに発声を促すメッセージを表示する。
【００１５】
スピーカ１０８から発せられた模範音声を聞いたユーザは、マイク１０６に向かって、模範音声を真似て例文を発声する。マイク１０６は、ユーザの発した音声を電気信号に変換し、ユーザ音声信号として出力する（ステップＳ１０４）。
【００１６】
音声比較部１１２は、マイク１０６から出力されたユーザ音声信号をアナログ／デジタル変換して得られたユーザ音声データと、模範音声データとを比較し、差異点を抽出する（ステップＳ１０５）。この処理は例えば次のように行われる。音声比較部１１２は、模範音声データを音節に分解する。模範音声データは、音節の区切り位置を示す情報を含んでいる。音節の区切り位置を示す情報は、例えば音節ごとの音声データを結合する際に付加される。模範音声データはこの情報に基づいて音節に分解される。音声比較部１１２はさらに、ユーザ音声データを、模範音声データと同じ位置で音節に分解する。音声比較部１１２は、音節に分解された模範音声データが示す波形およびユーザ音声信号が示す波形をフーリエ変換して得られた振幅スペクトルの対数を求め、それをフーリエ逆変換して音節ごとのスペクトル包絡を得る。
【００１７】
図５は、模範音声（上）およびユーザ音声（下）のスペクトル包絡を例示する図である。図５に示されるスペクトル包絡は、音節I、音節II、音節IIIの３つの音節から構成されている。音声比較部１１２は、得られたスペクトル包絡を音節ごとに比較する。音声比較部１１２は、模範音声のスペクトル包絡とユーザ音声のスペクトル包絡との差異が、あらかじめ決められたしきい値を超えた場合は、その音節の発音が悪いものと判断する。模範音声とユーザ音声との差異は、例えば、特徴的なフォルマントの周波数とスペクトル密度とをスペクトル密度−周波数図に表したときの２点間の距離によって求めてもよいし、特定の周波数においてスペクトル密度を比較することによって求めてもよい。図５に示される例では、ＣＰＵ１０１は音節IIについて発音がわるいものと判断する。ＣＰＵ１０１は
、発音が悪い部分があったことを示すフラグを記録したデータＦを生成し、ＲＡＭ１０２に記憶する。発音が悪い部分が無い場合は、ＣＰＵ１０１は、そのことを示すデータＦを生成し、ＲＡＭ１０２に記憶する。さらに、音声比較部１１２は、その音節の発音の良否を示すフラグを記録したデータＤを生成し、ＲＡＭ１０２に記憶する。すなわち、データＤは、音節ごとにユーザの発音の良否を示している。音声比較部１１２はこのようにしてすべての音節について模範音声のスペクトルとユーザ音声のスペクトルを比較する。ＲＡＭ１０２には、発音が悪い（模範音声と異なる）と判断された音節を特定するデータＤが記憶されている。
【００１８】
再び図４を参照して説明する。ＣＰＵ１０１は、データＦに基づいてユーザの発音に悪い部分（模範音声と異なっている部分）が存在するか否か判断する（ステップＳ１０６）。ユーザの発音に悪い部分がある場合、ＣＰＵ１０１は、以下で説明する差異点強調処理を行う（ステップＳ１０７）。これにより、差異点が強調された模範音声が再生される。ユーザの発音に悪い部分が無い場合、ＣＰＵ１０１は「良好です」等のメッセージをディスプレイ１０５に表示する。そして次の例文に移行する等の処理を行う。
【００１９】
ＣＰＵ１０１は、ＲＡＭ１０２に記憶されたデータＤに基づいて差異点強調処理を行う。差異点を強調する態様としては、再生速度を遅くする（ゆっくりと発音する）、音量を増加させる等が考えられるが、ここでは再生速度を遅くする態様について説明する。
ＣＰＵ１０１は、変数ａを設定しＲＡＭ１０２に記憶する。変数ａは、発声速度を遅くする割合を示す変数である。本実施形態においては、変数ａの初期値として「４」が設定される。これは、ユーザの発音が模範音声と異なっていた音節について、再生速度を１／４に低下させることを意味する。
【００２０】
ＣＰＵ１０１は、ＲＡＭ１０２に記憶された変数ａおよびデータＤを参照して模範音声データをに対し差異点強調処理を行う。すなわち、ユーザの発音が模範音声と異なっていたことを示すフラグが立っている音節については、音声波形を時間軸方向にａ倍するようにデータを加工する。本実施形態において、ＣＰＵ１０１は音節IIについて再生速度が１
／４となるようにデータを加工する。ＣＰＵ１０１は、こうして差異点強調処理を施した模範音声データを音声処理部１０７に出力する。音声処理部１０７は、前述の場合と同様に模範音声データをデジタル／アナログ変換して差異点が強調された例文の模範音声信号を生成する。音声処理部１０７は、生成した模範音声信号をスピーカ１０８に出力する。こうしてスピーカ１０８から模範音声が出力される。このとき、ユーザの発音が模範音声と異なっていた部分がゆっくりと再生される。例えば、「How was your weekend?」の「was」の部分の発音が模範音声と異なっていた場合には、他の部分と比較して「was」の部分が強調（デフォルメ）されてゆっくり（１／４のスピードで）と再生される。したがってユーザは、自分の発音が模範音声と異なっていた部分について強調された模範音声を聞くことにより、自分の発音の悪い部分を正確に認識することができる。
【００２１】
なお、上述の説明では１つの例文に対し強調の態様を示す変数ａを１つ設定する場合について説明したが、強調の態様を示す変数を音節ごとに設定する構成としてもよい。その場合、データＤは音節ごとの発音の良否と、発音が悪い場合の強調の態様を示す変数を指定するデータとを含む。
【００２２】
差異点が強調された模範音声を再生した後、ＣＰＵ１０１は、ユーザに模範音声の発声を促すメッセージを表示する。模範音声と自分の発音が異なっていた部分が強調された模範音声を聞いたユーザは、マイク１０６に向かって再度模範音声を真似て例文を発音する。語学学習装置１００は、標準速度で模範音声を再生したとき同様に、ユーザの発音の良否を判定する。ユーザの発音が悪いと判断された場合、ＣＰＵ１０１は、変数ａの値を１増加させる。そして前述の場合と同様に差異点強調処理を行う。このとき変数ａの値は１増加しているので、ユーザの発音が模範音声と異なっていた部分は、さらにゆっくりと（１／５のスピードで）再生される。
逆に、ユーザの発音がよいと判断された場合、ＣＰＵ１０１は、変数ａの値を１減少させる。そして前述の場合と同様に差異点強調処理を行う。このとき変数ａの値は１減少しているので、発音の悪かった部分は１回目のときよりも標準速度に近いスピードで再生される。差異点が強調された模範音声を再生した後、ＣＰＵ１０１は、再度ユーザに模範音声の発声を促すメッセージを表示する。
【００２３】
以上の処理を繰り返し実行することにより、ユーザの発音の悪かった部分は最初ゆっくりと再生されるが、ユーザの発音が改善されるにつれてだんだんと標準速度に近づいていく。逆にユーザの発音が改善されない場合はさらにゆっくりと再生されるようになる。このように、発音が悪かった部分は強調されて再生されるので、ユーザは自身の発音が悪かった部分を正確に認識することができる。また、強調された音声はユーザの発音が改善されるにつれて徐々に標準状態に近づいていくので、ユーザの習熟状況に応じて強調の度合いを変化させることができる。
【００２４】
＜第２実施形態＞
続いて、本発明の第２実施形態について説明する。
図６は、本実施形態に係る語学学習装置２００の機能構成を示すブロック図である。図６において、第１実施形態に係る語学学習装置１００と共通する構成要素には同一の参照番号を付している。語学学習装置１００と共通する構成要素についてはその説明を省略する。また、語学学習装置２００のハードウェア構成は語学学習装置１００と同一であるのでその説明を省略する。
【００２５】
パラメータ記憶部１１７は、ユーザの声の特徴を示すパラメータであるユーザ音声パラメータを記憶している。音質変換部１１６は、パラメータ記憶部１１７に記憶されたユーザ音声パラメータと、模範音声データベースＤＢ１に記録された音声データとに基づいて声質変換を行う。すなわち、本実施形態においては、差異点を強調した模範音声を再生する際に、ユーザ自身の声（によく似た合成音声）で模範音声が再生される。したがってユーザは自分の声を真似すればよいので、発音を真似しやすい。
【００２６】
続いて本実施形態における語学学習装置２００の動作について説明する。
ユーザがキーボード１０９を操作して語学学習プログラムの実行を指示すると、ＣＰＵ１０１は、ＨＤＤ１０４から語学学習プログラムを読み出して実行する。語学学習プログラムを実行することにより、語学学習装置２００は図６に示す機能を具備する。
【００２７】
図７は語学学習装置２００の動作を示すフローチャートである。第１実施形態で説明したように、まずユーザが例文を選択する（ステップＳ２０１）。ＣＰＵ１０１は選択された例文に基づいて例文の音声データを生成する（ステップＳ２０２）。生成された音声データは音声処理部１０７においてデジタル／アナログ変換された後にスピーカ１０８から模範音声として出力される（ステップＳ２０３）。ユーザは模範音声を真似して例文を発声する（ステップＳ２０４）。ユーザの音声はマイク１０６から音声信号として出力される。ＣＰＵ１０１は、模範音声とユーザ音声との差異点を抽出し（ステップＳ２０５）、必要であれば（ステップＳ２０６：ＹＥＳ）第１実施形態と同様に差異点強調処理を行う（ステップＳ２０７）。ここまでの動作は第１実施形態と同一であるので詳細な説明は省略する。
【００２８】
続いてＣＰＵ１０１は、差異点が強調された模範音声データを基にして、声質変換処理を行う（ステップＳ２０８）。声質変換処理は、例えば以下のように行われる。
ＨＤＤ１０４は、ユーザの音声を特徴つけるパラメータであるユーザ音声パラメータを記憶している。本実施形態において、パラメータとしては音声信号のピッチ、および周波数と振幅の組が記憶されている。ユーザ音声パラメータは、あらかじめＨＤＤ１０４に記憶しておいてもよいし、語学学習装置２００における語学学習の開始時にパラメータ採取に必要な基本文をユーザに発生させ、パラメータを採取することとしてもよい。
【００２９】
ＣＰＵ１０１は、差異点が強調された模範音声データを周波数成分と振幅成分に分離する。ＣＰＵ１０１は、得られた周波数成分および振幅成分を正規化する。ＣＰＵ１０１は、正規化された周波数成分に、ユーザ音声パラメータのピッチ情報を混合する。さらに、ＣＰＵ１０１は振幅成分に対してもユーザ音声パラメータの振幅情報を混合する。なお、これらの混合の際に、混合の割合を可変とする構成としてもよい。
ＣＰＵ１０１はこうしてユーザ音声パラメータが反映された周波数成分および振幅成分から、音声波形を生成する。この音声はユーザの声に近いものとなっている。ＣＰＵ１０１は生成した音声データを音声処理部１０７に出力する。音声処理部１０７は、音声データをデジタル／アナログ変換してスピーカ１０８に出力する。スピーカ１０８からは、模範音声との差異点が強調され、かつユーザ自身の声に似せられた音声が出力される。
【００３０】
差異点が強調された模範音声を再生した後、ＣＰＵ１０１は、ユーザに模範音声の発声を促すメッセージを表示する。模範音声と自分の発音が異なっていた部分が強調された模範音声を聞いたユーザは、マイク１０６に向かって再度模範音声を真似て例文を発音する。語学学習装置２００は、標準速度で模範音声を再生したとき同様に、ユーザの発音の良否を判定する。ユーザの発音が悪いと判断された場合、ＣＰＵ１０１は、差異点をさらに強調して再生し、発音が改善したと判断された場合は、ＣＰＵ１０１は、強調された差異点を元の自然な発音に近づける。
【００３１】
以上の処理を繰り返し実行することにより、ユーザの発音の悪かった部分は最初ゆっくりと再生されるが、ユーザの発音が改善されるにつれてだんだんと標準速度に近づいていく。逆にユーザの発音が改善されない場合はさらにゆっくりと再生されるようになる。この際、差異点が強調された音声はユーザ自身の声に似た声で再生されるので、ユーザは自分の声を真似すればよく、正しい発音を理解しやすい。
【００３２】
＜変形例＞
本発明は上述の実施形態に限定されるものではなく、種々の変形実施が可能である。
上述の実施形態においては、ユーザ音声を音節に分解する際に、模範音声の音節と同じ位置で音節に分解する態様について説明したが、本発明はこれに限定されるものではない。例えば、ユーザ音声と模範音声とをそれぞれフーリエ変換したスペクトルを比較してピークの対応付けを行うことにより、音声スペクトルを基に音節に分解する構成としてもよい。
【００３３】
また、ユーザ音声と模範音声に差異点があった場合に、音声データの強調処理に加えて、ディスプレイ１０５に発音が悪い部分を表示する構成としてもよい。ＣＰＵ１０１は、発音が悪い音節を特定するフラグを記録したデータＤに基づいて発音が悪い音節を特定し、その音節に対応する部分をディスプレイ１０５上で明示する。例えば、「How was your weekend?」の「was」の部分の発音が模範音声と異なっていた場合には、ディスプレイ１０５に「How ??? your weekend?」のように表示する。これにより、ユーザは聴覚および視覚の両面から、自分の発音の悪い部分を確認することができる。
【００３４】
さらに、発音の悪い部分があった場合に、音声データの強調処理に加えて、その発音の悪い部分がネイティブスピーカーにはどのように聞こえているかを表示する構成としてもよい。この場合、ＣＰＵ１０１は、ユーザの発音が悪い音節が存在した場合、音節データベースＤＢ３から、波形の似た音声データを検索する。ＣＰＵ１０１は、検索した音声データに対応付けられている発音記号から、これに対応するアルファベットの文字列を抽出する。ＣＰＵ１０１は、この文字列を発音が悪い音節に対応する部分に表示する。例えば、ユーザの「rice」という言葉の発音が悪かった場合、ＣＰＵ１０１は音節データベースＤＢ３を検索し、「lice」という言葉を抽出する。そして例文の「rice」に代えて「lice」という文字列を表示する。この際、大きい文字で表示したり、文字色を変えたりといったように、発音が悪い部分を特定できるように表示する。
【００３５】
また、上述の実施形態においては、模範音声データベースＤＢ１に記憶されている模範音声は音節単位のものであったが、これは単語単位あるいは文単位で区分された音声であったもよい。
【００３６】
また、上述の実施形態においては、ＣＰＵ１０１が語学学習プログラムを実行することにより、各実施形態に係る語学学習装置が図３あるいは図６に示される機能を具備する態様について説明したが、各実施形態に係る語学学習装置が図３あるいは図６に示される各機能構成要素に対応する回路等を有する構成としてもよい。
【図面の簡単な説明】
【００３７】
【図１】本発明の第１実施形態に係る語学学習装置１００のハードウェア構成を示すブロック図である。
【図２】模範音声データベースＤＢ１の内容を示す図である。
【図３】語学学習装置１００の機能構成を示すブロック図である。
【図４】同実施形態に係る語学学習装置１００の動作を示すフローチャートである。
【図５】模範音声（上）およびユーザ音声（下）のスペクトル包絡を例示する図である。
【図６】本発明の第２実施形態に係る語学学習装置２００の機能構成を示すブロック図である。
【図７】同実施形態に係る語学学習装置２００の動作を示すフローチャートである。
【符号の説明】
【００３８】
１００…語学学習装置、１０１…ＣＰＵ、１０２…ＲＡＭ、１０３…ＲＯＭ、１０４…ＨＤＤ、１０５…ディスプレイ、１０６…マイク、１０７…音声処理部、１０８…スピーカ、１０９…キーボード、１１０…バス、１１１…模範音声記憶部、１１２…音声比較部、１１３…差異点強調部、１１４…出力部、１１６…音質変換部、１１７…パラメータ記憶部、２００…語学学習装置

【特許請求の範囲】
【請求項１】
模範音声を記憶する模範音声記憶手段と、
ユーザの音声であるユーザ音声を取得する音声取得手段と、
前記模範音声記憶手段に記憶された模範音声と、前記音声取得手段により取得されたユーザ音声を比較する比較手段と、
前記比較手段による比較結果に基づいて、前記模範音声と前記ユーザ音声との相違点を抽出する相違点抽出手段と、
前記相違点抽出手段により抽出された相違点が存在する部分について強調すべき態様を指示する強調指示データを生成する強調手段と、
前記強調手段により生成された強調指示データに基づく態様に合わせて前記模範音声を出力する出力手段と、
を有する語学学習装置。
【請求項２】
前記模範音声記憶手段が模範音声とその模範音声を特定する文字列とを記憶しており、
前記語学学習装置が、
前記模範音声記憶手段に記憶された模範音声から、前記ユーザ音声と最も近いものを検索する検索手段と、
前記検索手段により検索された模範音声を特定する文字列を表示する表示手段と、
をさらに有する請求項１に記載の語学学習装置。
【請求項３】
前記ユーザ音声を記憶するユーザ音声記憶手段と、
前記ユーザ音声記憶手段に記憶されたユーザ音声から、前記ユーザの音声パラメータを取得するパラメータ取得手段と、
前記パラメータ取得手段により取得された音声パラメータに基づいて声質変換を行う声質変換手段と、
をさらに有する請求項１に記載の語学学習装置。

【図１】