説明

発音学習支援装置及び発音学習支援プログラム

【課題】各地域の発音の学習を可能とする。
【解決手段】 電子辞書1は、英語のテキスト中の各音素に、当該音素の標準英語用のストレスデータを対応付けて前記テキストから音声合成データを生成するCPU6と、地域英語の種類ごとに、標準英語用の前記ストレスデータに対するストレス補正係数を記憶する地域音声パラメータ記憶テーブル87と、音声出力部3とを備える。CPU6は、地域音声パラメータ記憶テーブル87に記憶された何れかの種類の地域英語を学習対象英語として指定するとともに、音声合成データにおける各ストレスデータを、学習対象英語に対応するストレス補正係数で補正する。音声出力部3は、CPU6による補正後の音声合成データに基づいて、前記テキスト中の各音素を学習対象英語のストレスで音声出力する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、発音の学習を支援する発音学習支援装置及び発音学習支援プログラムに関する。
【背景技術】
【0002】
従来、音声出力の可能な電子辞書などの発音学習支援装置では、テキストから合成された音声合成データに基づいて当該テキストを音声出力することにより、多様なテキストについて発音の学習を行えるようになっている。
【0003】
このような発音学習支援装置に関して、近年、日本語テキストから標準的な発音による音声合成データを生成した後、その音声合成データを指定の方言(例えば大阪弁)の発音による音声合成データに変換して音声出力する技術が開発されている(例えば、特許文献1参照)。
【特許文献1】特開2002−304186号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
しかしながら、英語では日本語と異なり、地域(国)によってイントネーション(上がり下がり)やストレス(強弱)等が変化するため、上記特許文献1の技術を単純に適用しても、英語テキストを各地域(国)の発音で音声出力させることはできない。
【0005】
本発明の課題は、各地域の発音を学習することができる発音学習支援装置及び発音学習支援プログラムを提供することである。
【課題を解決するための手段】
【0006】
請求項1記載の発明は、発音学習支援装置において、
英語のテキスト中の各音素に、当該音素の標準英語用のストレスデータを対応付けて前記テキストから音声合成データを生成する標準ストレス音声合成データ生成手段と、
地域英語の種類ごとに、標準英語用の前記ストレスデータに対するストレス補正係数を記憶するストレス補正係数記憶手段と、
前記ストレス補正係数記憶手段に記憶された何れかの種類の地域英語を学習対象英語として指定する学習対象英語指定手段と、
前記音声合成データにおける各ストレスデータを、前記学習対象英語に対応する前記ストレス補正係数で補正するストレスデータ補正手段と、
前記ストレスデータ補正手段による補正後の前記音声合成データに基づいて、前記テキスト中の各音素を前記学習対象英語のストレスで音声出力する音声出力手段と、
を備えることを特徴とする。
【0007】
請求項2記載の発明は、請求項1記載の発音学習支援装置において、
前記ストレス補正係数記憶手段は、
前記ストレス補正係数として、母音の音素の前記ストレスデータに対するストレス母音補正係数と、子音の音素の前記ストレスデータに対するストレス子音補正係数と、を記憶し、
前記ストレスデータ補正手段は、
前記音声合成データにおける各ストレスデータのうち、母音の音素の前記ストレスデータを前記ストレス母音補正係数で補正する母音ストレスデータ補正手段と、
前記音声合成データにおける各ストレスデータのうち、子音の音素の前記ストレスデータを前記ストレス子音補正係数で補正する子音ストレスデータ補正手段と、
を有することを特徴とする。
【0008】
請求項3記載の発明は、請求項1または2記載の発音学習支援装置において、
前記標準ストレス音声合成データ生成手段は、
前記テキスト中の各音素に、当該音素の標準英語用のイントネーションデータを対応付けて前記音声合成データを生成する標準イントネーション音声合成データ生成手段を有し、
前記ストレス補正係数記憶手段は、
地域英語の種類ごとに、標準英語用の前記イントネーションデータに対するイントネーション補正係数を記憶するイントネーション補正係数記憶手段を有し、
前記ストレスデータ補正手段は、
前記音声合成データにおける各イントネーションデータを、前記学習対象英語に対応する前記イントネーション補正係数で補正するイントネーションデータ補正手段を有し、
前記音声出力手段は、
前記イントネーションデータ補正手段による補正後の前記音声合成データに基づいて、前記テキスト中の各音素を前記学習対象英語のイントネーションで音声出力することを特徴とする。
【0009】
請求項4記載の発明は、請求項3記載の発音学習支援装置において、
ユーザ操作に基づいて、前記学習対象英語の訛りレベルを設定する訛りレベル設定手段と、
各地域英語の種類と、当該地域英語の基となった基準地域英語の種類とを対応付けて記憶する基準地域英語記憶手段と、
を備え、
前記ストレスデータ補正手段は、
前記音声合成データにおける各ストレスデータを、下記の式(1)によって算出される前記ストレス補正係数A2で補正する訛りレベル対応ストレスデータ補正手段を有し、
前記イントネーションデータ補正手段は、
前記音声合成データにおける各イントネーションデータを、下記の式(2)によって算出される前記イントネーション補正係数B2で補正する訛りレベル対応イントネーションデータ補正手段を有し、
前記音声出力手段は、
前記訛りレベル対応ストレスデータ補正手段及び前記訛りレベル対応イントネーションデータ補正手段による補正後の前記音声合成データに基づいて、前記テキスト中の各音素を前記訛りレベル設定手段により設定された訛りレベルに対応する前記学習対象英語のストレス及びイントネーションで音声出力することを特徴とする。
2=A1×L/100+A0×(100−L)/100 …(1)
2=B1×L/100+B0×(100−L)/100 …(2)
(但し、式(1)中、「A1」は前記学習対象英語に対応する前記ストレス補正係数、「A0」は前記基準地域英語に対応する前記ストレス補正係数、「L」は前記訛りレベル設定手段により設定された訛りレベル(%)である。また、式(2)中、「B1」は前記学習対象英語に対応する前記イントネーション補正係数、「B0」は前記基準地域英語に対応する前記イントネーション補正係数である。)
【0010】
請求項5記載の発明は、請求項1〜4の何れか一項に記載の発音学習支援装置において、
前記標準ストレス音声合成データ生成手段は、
前記テキスト中の各単語に、当該単語の標準英語用の発音記号を対応付けて前記音声合成データを生成する標準発音記号音声合成データ生成手段を有し、
前記ストレス補正係数記憶手段は、
地域英語の種類ごとに、所定の英単語と、この所定の英単語についての当該地域英語特有の発音の発音記号と、を対応付けて記憶する補正発音記号記憶手段を有し、
前記ストレスデータ補正手段は、
前記音声合成データにおける前記所定の英単語の発音記号を、前記学習対象英語特有の発音の発音記号に補正する発音記号補正手段を有し、
前記音声出力手段は、
前記発音記号補正手段による補正後の前記音声合成データに基づいて、前記テキスト中の前記所定の単語を、前記学習対象英語特有の発音記号による発音で音声出力することを特徴とする。
【0011】
請求項6記載の発明は、請求項1〜5の何れか一項に記載の発音学習支援装置において、
前記学習対象英語指定手段は、
ユーザ操作に基づいて前記学習対象英語を指定することを特徴とする。
【0012】
請求項7記載の発明は、請求項1〜5の何れか一項に記載の発音学習支援装置において、
前記学習対象英語指定手段は、
前記学習対象英語をランダムに指定することを特徴とする。
【0013】
請求項8記載の発明は、請求項1〜7の何れか一項に記載の発音学習支援装置において、
ユーザから文字列の入力操作を受ける文字列入力手段と、
前記音声出力手段により音声出力された前記テキストと、前記文字列入力手段により入力された文字列とを比較することでユーザに対するディクテーションテストの正誤を判定するとともに、当該判定結果をユーザに報知する正誤判定手段と、
を備えることを特徴とする。
【0014】
請求項9記載の発明は、発音学習支援プログラムにおいて、
コンピュータに、
英語のテキスト中の各音素に、当該音素の標準英語用のストレスデータを対応付けて、前記テキストから音声合成データを生成する標準ストレス音声合成データ生成機能と、
地域英語の種類ごとに、標準英語用の前記ストレスデータに対するストレス補正係数を記憶するストレス補正係数記憶機能と、
前記ストレス補正係数記憶機能によって記憶された何れかの種類の地域英語を学習対象英語として指定する学習対象英語指定機能と、
前記音声合成データにおける各ストレスデータを、前記学習対象英語に対応する前記ストレス補正係数で補正するストレスデータ補正機能と、
前記ストレスデータ補正機能による補正後の前記音声合成データに基づいて、前記テキスト中の各音素を前記学習対象英語のストレスで音声出力する音声出力機能と、
を実現させることを特徴とする。
【発明の効果】
【0015】
本発明によれば、英語のテキスト中の各音素に、当該音素の標準英語用のストレスデータが対応付けられて当該テキストから音声合成データが生成され、学習対象英語に対応するストレス補正係数で各ストレスデータが補正された後の音声合成データに基づいて、テキスト中の各音素が学習対象英語のストレスで音声出力されるので、各地域の正確な発音(ストレス)を学習することができる。
【発明を実施するための最良の形態】
【0016】
以下、図面を参照して、本発明に係る発音学習支援装置を適用した電子辞書の実施形態について説明する。
【0017】
[外観構成]
図1(a)は本実施形態における電子辞書1の斜視外観図である。
この図に示すように、電子辞書1は、ディスプレイ10、スピーカ11及びキー群13を備えている。
【0018】
ディスプレイ10は、ユーザによるキー群13の操作に応じた文字や符号等、各種データを表示する部分であり、LCD(Liquid Crystal Display)やELD(Electronic Luminescent Display)等によって構成されている。
【0019】
スピーカ11は、ユーザによるキー群13の操作に応じた語句の音声を出力する部分である。
【0020】
キー群13は、図1(b)に示すように、ユーザが電子辞書1を操作するための各種キーを有している。具体的には、キー群13は、訳/決定キー13bと、文字キー13cと、辞書選択キー13dと、カーソルキー13eと、シフトキー13fと、戻るキー13gと、音声出力キー13hと、発音学習キー13j等とを有している。
【0021】
訳/決定キー13bは、検索の実行や、見出語の決定等に使用されるキーである。文字キー13cは、ユーザによる文字の入力等に使用されるキーであり、本実施の形態においては“A”〜“Z”キーを備えている。辞書選択キー13dは、後述の辞書データベース85a〜85c(図2参照)の選択に使用されるキーである。
【0022】
カーソルキー13eは、ディスプレイ10内で反転表示等により示されるカーソルの移動に使用されるキーである。シフトキー13fは、日本語の語句を検索対象に設定するとき等に使用されるキーである。戻るキー13gは、前回表示した画面に戻るとき等に使用されるキーである。
【0023】
音声出力キー13hは、スピーカ11にテキストを音声出力させるとき等に使用されるキーである。発音学習キー13jは、後述の地域訛り音声学習支援処理(図6参照)を実行させるとき等に使用されるキーである。
【0024】
[内部構成]
図2は、電子辞書1の概略構成を示すブロック図である。
この図に示すように、電子辞書1は、表示部2、音声出力部3、入力部5、CPU6、フラッシュROM8及びRAM7を備えている。
【0025】
表示部2は、上述のディスプレイ10を備えており、CPU6から入力される表示信号に基づいて各種情報をディスプレイ10に表示するようになっている。
【0026】
音声出力部3は、上述のスピーカ11を備えており、CPU6から入力される音声出力信号に基づいてスピーカ11から音声出力するようになっている。
【0027】
入力部5は、上述のキー群13を備えており、押下されたキーに対応する信号をCPU6に出力するようになっている。
【0028】
CPU6は、入力される指示に応じて所定のプログラムに基づいた処理を実行し、各機能部への指示やデータの転送等を行い、電子辞書1を統括的に制御するようになっている。具体的には、CPU6は、入力部5から入力される操作信号等に応じてフラッシュROM8に格納された各種プログラムを読み出し、当該プログラムに従って処理を実行する。そして、CPU6は、処理結果をRAM7に保存するとともに、当該処理結果を表示・音声出力するための信号を表示部2や音声出力部3に適宜出力して、対応した内容を表示・音声出力させる。
【0029】
フラッシュROM8は、電子辞書1の各種機能を実現するためのプログラムやデータを記憶するメモリである。本実施の形態においては、フラッシュROM8は、辞書検索プログラム81と、音声合成プログラム82と、本発明に係る発音学習支援プログラム84と、辞書データベース群85と、地域音声パラメータ記憶テーブル87と、発音記号補正テーブル群86等とを記憶している。
【0030】
辞書検索プログラム81は、従来より公知の辞書検索処理、即ち、ユーザ操作で指定された指定見出語に対応する説明情報を検索して表示する処理をCPU6に実行させるためのプログラムである。
【0031】
音声合成プログラム82は、標準英語(standard English)の発音で音声出力される音声合成データをCPU6に生成させるプログラムであり、本実施の形態においては、図3(a)に示すように、テキスト中の各単語に発音記号及び音素を対応付けるとともに、各音素にイントネーションデータと、母音及び子音のストレスデータとを対応付けて音声合成データを生成させるようになっている。このような音声合成プログラム82としては、従来より公知のプログラムを用いることができる。
【0032】
なお、本実施の形態においては、世界各国で標準的に用いられている英語が標準英語として用いられており、この標準英語はアメリカ英語及びイギリス英語とは異なる英語となっている。また、発音記号として、国際音声記号(IPA(International Phonetic Alphabet))が用いられている。また、音声合成データにおけるイントネーションデータやストレスデータの数値は、大小によってイントネーション(上がり下がり)やストレス(強弱)の程度を示している。更に、図3(a)等の各ストレスデータの後に付記された「(母)」,「(子)」は、母音または子音の音素のストレスデータであることを示している。
【0033】
発音学習支援プログラム84は、後述の地域訛り音声学習支援処理(図7,図8参照)をCPU6に実行させるためのプログラムである。
【0034】
辞書データベース群85は、少なくとも1種類の辞書データベースを有しており、本実施の形態においては、アメリカ英語を学習するための英和辞書「リー○ーズ」,「ジー○アス」の辞書データベース85a,85bや、イギリス英語を学習するための英英辞書「オク○フォード」の辞書データベース85c等を有している。
【0035】
これら辞書データベース85a〜85cには、例えば図4に1例を示すように、複数の見出語と、この見出語の発音記号と、見出語を詳細に説明する説明情報とが対応付けされて格納されている。ここで、アメリカ英語についての辞書データベース85a,85bには、アメリカ英語での模範的な発音の発音記号が格納されており、イギリス英語についての辞書データベース85cには、イギリス英語での模範的な発音の発音記号が格納されている。
【0036】
地域音声パラメータ記憶テーブル87には、図5に示すように、地域(国)特有の英語、つまり地域英語ごとに地域音声パラメータ「P」が記憶されている。
【0037】
ここで、地域音声パラメータ「P」とは、標準英語の発音を基準とした場合の発音傾向を表すパラメータであり、標準英語の発音に対する補正係数となっている。この地域音声パラメータ「P」として、本実施の形態においては、ストレス補正係数「A」及びイントネーション補正係数「B」が用いられており、更にストレス補正係数「A」として、ストレス子音補正係数「X」及びストレス母音補正係数「Y」が用いられている。
【0038】
このうち、ストレス補正係数「A」とは、標準英語の発音のストレスデータ(以下、標準ストレスデータとする)に対する補正係数であり、ストレス子音補正係数「X」,ストレス母音補正係数「Y」とは、標準英語の発音の子音ストレスデータ(以下、標準子音ストレスデータとする),母音ストレスデータ(以下、標準母音ストレスデータとする)に対する補正係数である。また、イントネーション補正係数「B」とは、標準英語の発音のイントネーションデータ(以下、標準イントネーションデータとする)に対する補正係数である。
【0039】
また、本実施の形態においては、地域英語として「イギリス英語」、「オーストラリア英語」、「インド英語」、「アメリカ英語」、「カナダ英語」及び「フィリピン英語」等が用いられており、これらの地域英語は基となった基準英語がイギリス英語であるか、アメリカ英語であるかによってイギリス系またはアメリカ系に分類され、各基準英語に対応付けされた状態となっている。具体的には、「イギリス英語」、「オーストラリア英語」及び「インド英語」はイギリス系に分類されており、標準英語の発音と比較して発音傾向がイギリス英語に近くなっている。また、「アメリカ英語」、「カナダ英語」及び「フィリピン英語」はアメリカ系に分類されており、標準英語の発音と比較して発音傾向がアメリカ英語に近くなっている。なお、これらの地域英語のうち、「オーストラリア英語」、「インド英語」、「カナダ英語」及び「フィリピン英語」については、各単語の発音が体系的に確定していないものの、所定の単語(以下、特有発音単語とする)については、基準英語(イギリス英語またはアメリカ英語)での模範的な発音と比較して規則的に発音記号が変化することが知られている。
【0040】
発音記号補正テーブル群86は、「オーストラリア英語」、「インド英語」、「カナダ英語」及び「フィリピン英語」について発音記号補正テーブル86a〜86dを有している。
【0041】
これら発音記号補正テーブル86a〜86dには、対応する地域英語における前記特有発音単語について、地域英語に対応する基準英語の種類と、当該基準英語での模範的な発音の発音記号と、地域英語に特有の発音の発音記号とが対応付けられて記憶されている。例えば、オーストラリア英語の発音記号補正テーブル86aには、図6に示すように、オーストラリア英語における各特有発音単語について、イギリス英語(基準英語)での模範的な発音の発音記号と、オーストラリア英語に特有の発音の発音記号等とが対応付けられて記憶されている。
【0042】
また、上述の図2に示すように、RAM7は、CPU6が実行する各種プログラムや、これらプログラムの実行に係るデータ等を一時的に保持するメモリであり、本実施の形態においては、学習対象テキスト記憶領域71と、地域・訛りレベル記憶領域72と、地域音声パラメータ展開領域73と、標準英語音声データ記憶領域74と、学習対象英語音声データ記憶領域75とを備えている。
【0043】
学習対象テキスト記憶領域71には、後述の地域訛り音声学習支援処理(図7,図8参照)において学習対象とされるテキスト(以下、学習対象テキストとする)が記憶されるようになっている。
【0044】
地域・訛りレベル記憶領域72には、後述の地域訛り音声学習支援処理(図7,図8参照)において学習対象とされる地域英語(以下、学習対象英語とする)の種類と、当該学習対象英語の訛りレベル(%)とが記憶されるようになっている。
【0045】
地域音声パラメータ展開領域73には、後述の地域訛り音声学習支援処理(図7,図8参照)において学習対象英語の地域音声パラメータ「P」が記憶されるようになっている。
【0046】
標準英語音声データ記憶領域74には、後述の地域訛り音声学習支援処理(図7,図8参照)において学習対象テキストを標準英語の発音で音声出力部3に音声出力させる場合の音声合成データが記憶されるようになっている。
【0047】
学習対象英語音声データ記憶領域75には、後述の地域訛り音声学習支援処理(図7,図8参照)において学習対象テキストを学習対象英語の発音で音声出力部3に音声出力させる場合の音声合成データが記憶されるようになっている。
【0048】
[地域訛り音声学習支援処理]
続いて、電子辞書1の動作について説明する。図7,図8は、CPU6がフラッシュROM8から発音学習支援プログラム84を読み出して実行する地域訛り音声学習支援処理の動作を説明するためのフローチャートである。
【0049】
まず図7に示すように、発音学習キー13jが操作されると、CPU6は、ユーザによって学習対象テキストのランダム指定が選択されるか否かを判定する(ステップS1)。
【0050】
このステップS1においてランダム指定が選択されたと判定した場合(ステップS1;Yes)には、CPU6は、フラッシュROM8内の英語コンテンツ、例えば辞書データベース85の中からランダムに英語のテキストを読み出し、学習対象テキストとして学習対象テキスト記憶領域71に記憶させた後(ステップS2)、後述のステップS4の処理に移行する。
【0051】
また、ステップS1においてランダム指定が選択されないと判定した場合(ステップS1;No)には、CPU6は、ユーザ操作により学習対象テキストとして指定された英語のテキストを学習対象テキスト記憶領域71に記憶させる(ステップS3)。
【0052】
次に、CPU6は、学習対象英語の種類及び訛りレベルがユーザによって指定されたか否かを判定し(ステップS4)、指定されないと判定した場合(ステップS4;No)には、学習対象英語の種類と訛りレベルとをランダムに指定して地域・訛りレベル記憶領域72に記憶させる(ステップS5)。
【0053】
また、ステップS4において学習対象英語の種類及び訛りレベルが指定されたと判定した場合(ステップS4;Yes)には、CPU6は、当該学習対象英語の種類と、訛りレベルとを地域・訛りレベル記憶領域72に記憶させ(ステップS6)、後述のステップS7の処理に移行する。
【0054】
次に、CPU6は、学習対象英語用の音声合成データを生成する地域訛り対応音声合成処理を行う(ステップS7)。
【0055】
より詳細には、図8に示すように、まずCPU6は、音声合成プログラム82によって学習対象テキストから標準英語用の音声合成データ(発音記号、音素、標準ストレスデータ及び標準イントネーションデータ)を生成し、先頭から順に標準英語音声データ記憶領域74及び学習対象英語音声データ記憶領域75に記憶させる(ステップS71)。具体的には、例えば図3(a)に示すように、学習対象テキスト記憶領域71に学習対象テキスト「I can do it today.」が記憶されている場合には、当該学習対象テキストについての音声合成データが標準英語音声データ記憶領域74及び学習対象英語音声データ記憶領域75に記憶される。
【0056】
次に、CPU6は、地域・訛りレベル記憶領域72内の訛りレベルが100%であるか否かを判定し(ステップS72)、100%であると判定した場合(ステップS72;Yes)には、地域音声パラメータ記憶テーブル87から学習対象英語の地域音声パラメータ「P」を読み出し、そのまま地域音声パラメータ展開領域73に記憶させた後(ステップS75)、後述のステップS76の処理に移行する。
【0057】
これにより、例えば学習対象英語が「イギリス英語」、「オーストラリア英語」、「インド英語」、「アメリカ英語」、「カナダ英語」、「フィリピン英語」に、訛りレベルがそれぞれ100%に設定された場合には、図3(b)〜(d)の右側、図9(a)〜(c)の右側に示すように、設定された学習対象英語及び訛りレベルに対応する地域音声パラメータ「P」が地域音声パラメータ展開領域73に記憶されることとなる。
【0058】
また、ステップS72において訛りレベルが100%ではないと判定した場合(ステップS72;No)には、CPU6は、地域音声パラメータ記憶テーブル87内の分類に基づいて学習対象英語の基準英語(イギリス英語またはアメリカ英語)を検出する(ステップS73)。
【0059】
次に、CPU6は、地域音声パラメータ記憶テーブル87から学習対象英語及び基準英語の地域音声パラメータ「P」(後述のP1,P0)を読み出した後、訛りレベルに対応する学習対象英語の地域音声パラメータ「P」(後述のP2)を以下の式(3)に基づいて算出し、地域音声パラメータ展開領域73に記憶させる(ステップS74)。
【0060】
2=P1×L/100+P0×(100−L)/100 …(3)
但し、式(1)中、「P1」,「P2」は補正前後での学習対象英語の地域音声パラメータ、「P0」は基準英語の地域音声パラメータ、「L」は訛りレベル(%)である。また、この式に基づいて地域音声パラメータ「P2」を算出するとは、具体的には、以下の式(1),(2)を計算することによりストレス補正係数「A2」(「X2」,「Y2」)及びイントネーション補正係数「B2」を算出することを意味する。
【0061】
2=A1×L/100+A0×(100−L)/100 …(1)
2=B1×L/100+B0×(100−L)/100 …(2)
【0062】
これにより、例えば学習対象英語が「オーストラリア英語」に、訛りレベルが0%,20%,40%,60%,80%に設定された場合には、図10や、図11(b)〜(c)の右側,図12(a)〜(d)の右側に示すように、設定された学習対象英語及び訛りレベルに対応する地域音声パラメータ「P」が地域音声パラメータ展開領域73に記憶されることとなる。なお、これらの図では、参考として訛りレベルが100%の場合の地域音声パラメータ「P」も図示している。
【0063】
次に、CPU6は、学習対象英語音声データ記憶領域75内で各音素に対応付けられた標準イントネーションデータそれぞれに対して地域音声パラメータ展開領域73内のイントネーション補正係数「A」を乗算した後、つまり、各標準イントネーションデータをイントネーション補正係数「A」で補正した後、各乗算結果に基づいて当該学習対象英語音声データ記憶領域75内の情報を更新する(ステップS76)。
【0064】
これにより、例えば学習対象英語が「イギリス英語」、「オーストラリア英語」、「インド英語」、「アメリカ英語」、「カナダ英語」、「フィリピン英語」に、訛りレベルがそれぞれ100%に設定された場合には、図3(a)のイントネーションデータが、図3(b)〜(d)や図9(a)〜(c)のイントネーションデータに更新されることとなる。また、例えば学習対象英語が「オーストラリア英語」に、訛りレベルが0%,20%,40%,60%,80%,100%に設定された場合には、図11(a)のイントネーションデータが、図11(b)〜(c)や図12(a)〜(d)のイントネーションデータに更新されることとなる。
【0065】
次に、CPU6は、学習対象英語音声データ記憶領域75内で各音素に対応付けられた標準ストレスデータのうち、先頭の標準ストレスデータを読み出した後(ステップS77)、この標準ストレスデータと対応する音素が母音であるか否かを判定する(ステップS78)。
【0066】
このステップS78において音素が母音であると判定した場合(ステップS78;Yes)には、CPU6は、読み出した標準ストレスデータ(標準母音ストレスデータ)に対して地域音声パラメータ展開領域73内のストレス母音補正係数「Y」を乗算した後、つまり、各標準母音ストレスデータをストレス母音補正係数「Y」で補正した後、この乗算結果に基づいて学習対象英語音声データ記憶領域75内の情報を更新し(ステップS79)、後述のステップS81に移行する。
【0067】
一方、ステップS78において音素が母音でない、つまり子音であると判定した場合(ステップS78;No)には、CPU6は、読み出した標準ストレスデータ(標準子音ストレスデータ)に対して地域音声パラメータ展開領域73内のストレス子音補正係数「X」を乗算した後、つまり、各標準子音ストレスデータをストレス子音補正係数「X」で補正した後、この乗算結果に基づいて学習対象英語音声データ記憶領域75内の情報を更新する(ステップS80)。
【0068】
これらステップS79,S80により、例えば学習対象英語が「イギリス英語」、「オーストラリア英語」、「インド英語」、「アメリカ英語」、「カナダ英語」、「フィリピン英語」に、訛りレベルがそれぞれ100%に設定された場合には、図3(a)のストレスデータが、図3(b)〜(d)や図9(a)〜(c)のストレスデータに更新されることとなる。また、例えば学習対象英語が「オーストラリア英語」に、訛りレベルが0%,20%,40%,60%,80%,100%に設定された場合には、図11(a)のストレスデータが、図11(b)〜(c)や図12(a)〜(d)のストレスデータに更新されることとなる。
【0069】
次に、CPU6は、読み出したストレスデータと対応する音素が学習対象テキストの最後の音素であるか否かを判定し(ステップS81)、最後の音素ではないと判定した場合(ステップS81;No)には、学習対象英語音声データ記憶領域75内における標準ストレスデータの格納順序に従って、次の標準ストレスデータを読み出し(ステップS82)、上述のステップS78に移行する。
【0070】
また、ステップS81において最後の音素であると判定した場合(ステップS81;Yes)には、CPU6は、発音記号補正テーブル86a〜86d内の情報に基づいて、学習対象テキストにおける各単語のうち学習対象英語の特有発音単語について、学習対象英語音声データ記憶領域75内の発音記号及び音素を、学習対象単語特有の発音の発音記号に補正し(ステップS83)、地域訛り対応音声合成処理を終了する。
【0071】
これにより、例えば学習対象英語が「イギリス英語」、「オーストラリア英語」、「インド英語」、「アメリカ英語」、「カナダ英語」、「フィリピン英語」に、訛りレベルがそれぞれ100%に設定された場合には、図3(a)の発音記号及び音素が、図3(b)〜(d)や図9(a)〜(c)の発音記号及び音素に更新されることとなる。また、例えば学習対象英語が「オーストラリア英語」に、訛りレベルが0%,20%,40%,60%,80%,100%に設定された場合には、図11(a)の発音記号及び音素が、図11(b)〜(c)や図12(a)〜(d)の発音記号及び音素に更新されることとなる。
【0072】
次に、図7に示すように、CPU6は、ユーザによってディクテーションテストの実行が選択されるか否かを判定し(ステップS9)、選択されないと判定した場合(ステップS9;No)には、学習対象テキストを表示部2に表示させた後(ステップS10)、学習対象英語音声データ記憶領域75内の音声合成データに基づいて学習対象英語の発音(ストレス、イントネーション、音)で学習対象テキストを音声出力部3に音声出力させ(ステップS11)、地域訛り音声学習支援処理を終了する。
【0073】
また、ステップS9においてディクテーションテストの実行が選択されたと判定した場合(ステップS9;Yes)には、CPU6は、学習対象英語音声データ記憶領域75内の音声合成データに基づいて学習対象英語の発音(ストレス、イントネーション、音)で学習対象テキストを音声出力部3に音声出力させた後(ステップS13)、入力部5を介して当該学習対象テキストの内容をユーザに文字入力させる(ステップS14)。
【0074】
そして、CPU6は、ユーザによる入力文字列の内容と学習対象テキストの内容とを比較することによって、ユーザに対するディクテーションテストの正誤を判定し(ステップS15)、正解である(内容が一致する)と判定した場合(ステップS15;Yes)には、正解の旨を示すメッセージを表示部2に表示させ(ステップS16)、地域訛り対応音声合成処理を終了する。また、ステップS15において不正解である(内容が一致しない)と判定した場合(ステップS15;No)には、CPU6は、不正解の旨を示すメッセージと、正解内容、つまり学習対象テキストの内容とを表示部2に表示させ(ステップS17)、地域訛り対応音声合成処理を終了する。
【0075】
以上の電子辞書1によれば、図8のステップS71,S77〜S82や、図3,図9等に示したように、英語のテキスト中の各音素に当該音素の標準ストレスデータが対応付けられて当該テキストから音声合成データが生成された後、学習対象英語に対応するストレス補正係数「A」で音声合成データ中の各標準ストレスデータが補正され、この補正後の音声合成データに基づいてテキスト中の各音素が学習対象英語のストレスで音声出力されるので、各地域の正確な発音(ストレス)を学習することができる。
【0076】
また、図8のステップS78〜S82や、図3,図9等に示したように、学習対象英語に対応するストレス母音補正係数「Y」,ストレス子音補正係数「X」で音声合成データ中の母音の音素,子音の音素の各標準ストレスデータが補正され、この補正後の音声合成データに基づいてテキスト中の各音素が学習対象英語のストレスで音声出力されるので、各地域のより正確な発音(ストレス)を学習することができる。
【0077】
また、図8のステップS71,S76や、図3,図9等に示したように、テキスト中の各音素に当該音素の標準イントネーションデータが対応付けられて音声合成データが生成された後、学習対象英語に対応するイントネーション補正係数「B」で音声合成データ中の各イントネーションデータが補正され、この補正後の音声合成データに基づいてテキスト中の各音素が学習対象英語のイントネーションで音声出力されるので、各地域の正確な発音(イントネーション)を学習することができる。
【0078】
また、図8のステップS73,図10〜図12等に示したように、音声合成データにおける各標準ストレスデータがストレス補正係数A2で、各標準イントネーションデータがイントネーション補正係数B2でそれぞれ補正され、これらの補正後の音声合成データに基づいてテキスト中の各音素が学習対象英語の訛りレベルに対応するストレス及びイントネーションで音声出力されるので、訛りレベルに対応した各地域の正確な発音(ストレス,イントネーション)を学習することができる。
【0079】
また、図8のステップS83や、図3,図9等に示したように、テキスト中の各単語に当該単語の標準英語用の発音記号が対応付けられて音声合成データが生成された後、学習対象英語における特有発音単語の発音記号が学習対象英語特有の発音の発音記号に補正され、この補正後の音声合成データに基づいてテキスト中の特有発音単語が特有の発音で音声出力されるので、各地域のより正確な発音(音)を学習することができる。
【0080】
また、図7のステップS3に示したように、ユーザ操作に基づいて学習対象英語が指定されるので、所望の地域の英語を学習対象英語とすることにより、当該地域の正確な発音を学習することができる。
【0081】
また、図7のステップS2に示したように、学習対象英語がランダムに指定されるので、多様な地域英語について発音の学習効果を高めることができる。
【0082】
また、図7のステップS13〜S17に示したように、ユーザに対するディクテーションテストの正誤が判定され、その判定結果がユーザに表示されるので、発音の学習効果を高めることができる。
【0083】
なお、本発明を適用可能な実施形態は、上述した実施形態に限定されることなく、本発明の趣旨を逸脱しない範囲で適宜変更可能である。
【0084】
例えば、本発明に係る発音学習支援装置を電子辞書1として説明したが、本発明が適用可能なものは、このような製品に限定されず、携帯電話やパソコンなどの電子機器全般に適用可能である。また、本発明に係る発音学習支援プログラムは、これらの電子機器に対して着脱可能なメモリカード、CD等に記憶されることとしてもよい。
【図面の簡単な説明】
【0085】
【図1】本発明に係る発音学習支援装置を適用した電子辞書の概略構成を示す図であり、(a)は概観図であり、(b)は部分平面図である。
【図2】本発明に係る発音学習支援装置を適用した電子辞書の概略構成を示すブロック図である。
【図3】標準英語音声データ記憶領域及び学習対象英語音声データ記憶領域に記憶された音声合成データと、地域音声パラメータ展開領域に記憶された地域音声パラメータとを示す図である。
【図4】辞書データベースのデータ構造を示す図である。
【図5】地域音声パラメータ記憶テーブルのデータ構造を示す図である。
【図6】発音記号補正テーブルのデータ構造を示す図である。
【図7】地域訛り音声学習支援処理を示すフローチャートである。
【図8】地域訛り対応音声合成処理を示すフローチャートである。
【図9】標準英語音声データ記憶領域及び学習対象英語音声データ記憶領域に記憶された音声合成データと、地域音声パラメータ展開領域に記憶された地域音声パラメータとを示す図である。
【図10】訛りレベルの設定値ごとの地域音声パラメータを示す図である。
【図11】標準英語音声データ記憶領域及び学習対象英語音声データ記憶領域に記憶された音声合成データと、地域音声パラメータ展開領域に記憶された地域音声パラメータとを示す図である。
【図12】標準英語音声データ記憶領域及び学習対象英語音声データ記憶領域に記憶された音声合成データと、地域音声パラメータ展開領域に記憶された地域音声パラメータとを示す図である。
【符号の説明】
【0086】
1 電子辞書(発音学習支援装置)
3 音声出力部(音声出力手段)
5 入力部(訛りレベル設定手段、文字列入力手段)
6 CPU(標準ストレス音声合成データ生成手段、学習対象英語指定手段、
ストレスデータ補正手段、母音ストレスデータ補正手段、
子音ストレスデータ補正手段、
標準イントネーション音声合成データ生成手段、
イントネーションデータ補正手段、
訛りレベル対応ストレスデータ補正手段、
訛りレベル対応イントネーションデータ補正手段、
標準発音記号音声合成データ生成手段、発音記号補正手段、
正誤判定手段)
84 発音学習支援プログラム
86a〜86d 発音記号補正テーブル(補正発音記号記憶手段)
87 地域音声パラメータ記憶テーブル(ストレス補正係数記憶手段、
イントネーション補正係数記憶手段、
基準地域英語記憶手段)

【特許請求の範囲】
【請求項1】
英語のテキスト中の各音素に、当該音素の標準英語用のストレスデータを対応付けて前記テキストから音声合成データを生成する標準ストレス音声合成データ生成手段と、
地域英語の種類ごとに、標準英語用の前記ストレスデータに対するストレス補正係数を記憶するストレス補正係数記憶手段と、
前記ストレス補正係数記憶手段に記憶された何れかの種類の地域英語を学習対象英語として指定する学習対象英語指定手段と、
前記音声合成データにおける各ストレスデータを、前記学習対象英語に対応する前記ストレス補正係数で補正するストレスデータ補正手段と、
前記ストレスデータ補正手段による補正後の前記音声合成データに基づいて、前記テキスト中の各音素を前記学習対象英語のストレスで音声出力する音声出力手段と、
を備えることを特徴とする発音学習支援装置。
【請求項2】
請求項1記載の発音学習支援装置において、
前記ストレス補正係数記憶手段は、
前記ストレス補正係数として、母音の音素の前記ストレスデータに対するストレス母音補正係数と、子音の音素の前記ストレスデータに対するストレス子音補正係数と、を記憶し、
前記ストレスデータ補正手段は、
前記音声合成データにおける各ストレスデータのうち、母音の音素の前記ストレスデータを前記ストレス母音補正係数で補正する母音ストレスデータ補正手段と、
前記音声合成データにおける各ストレスデータのうち、子音の音素の前記ストレスデータを前記ストレス子音補正係数で補正する子音ストレスデータ補正手段と、
を有することを特徴とする発音学習支援装置。
【請求項3】
請求項1または2記載の発音学習支援装置において、
前記標準ストレス音声合成データ生成手段は、
前記テキスト中の各音素に、当該音素の標準英語用のイントネーションデータを対応付けて前記音声合成データを生成する標準イントネーション音声合成データ生成手段を有し、
前記ストレス補正係数記憶手段は、
地域英語の種類ごとに、標準英語用の前記イントネーションデータに対するイントネーション補正係数を記憶するイントネーション補正係数記憶手段を有し、
前記ストレスデータ補正手段は、
前記音声合成データにおける各イントネーションデータを、前記学習対象英語に対応する前記イントネーション補正係数で補正するイントネーションデータ補正手段を有し、
前記音声出力手段は、
前記イントネーションデータ補正手段による補正後の前記音声合成データに基づいて、前記テキスト中の各音素を前記学習対象英語のイントネーションで音声出力することを特徴とする発音学習支援装置。
【請求項4】
請求項3記載の発音学習支援装置において、
ユーザ操作に基づいて、前記学習対象英語の訛りレベルを設定する訛りレベル設定手段と、
各地域英語の種類と、当該地域英語の基となった基準地域英語の種類とを対応付けて記憶する基準地域英語記憶手段と、
を備え、
前記ストレスデータ補正手段は、
前記音声合成データにおける各ストレスデータを、下記の式(1)によって算出される前記ストレス補正係数A2で補正する訛りレベル対応ストレスデータ補正手段を有し、
前記イントネーションデータ補正手段は、
前記音声合成データにおける各イントネーションデータを、下記の式(2)によって算出される前記イントネーション補正係数B2で補正する訛りレベル対応イントネーションデータ補正手段を有し、
前記音声出力手段は、
前記訛りレベル対応ストレスデータ補正手段及び前記訛りレベル対応イントネーションデータ補正手段による補正後の前記音声合成データに基づいて、前記テキスト中の各音素を前記訛りレベル設定手段により設定された訛りレベルに対応する前記学習対象英語のストレス及びイントネーションで音声出力することを特徴とする発音学習支援装置。
2=A1×L/100+A0×(100−L)/100 …(1)
2=B1×L/100+B0×(100−L)/100 …(2)
(但し、式(1)中、「A1」は前記学習対象英語に対応する前記ストレス補正係数、「A0」は前記基準地域英語に対応する前記ストレス補正係数、「L」は前記訛りレベル設定手段により設定された訛りレベル(%)である。また、式(2)中、「B1」は前記学習対象英語に対応する前記イントネーション補正係数、「B0」は前記基準地域英語に対応する前記イントネーション補正係数である。)
【請求項5】
請求項1〜4の何れか一項に記載の発音学習支援装置において、
前記標準ストレス音声合成データ生成手段は、
前記テキスト中の各単語に、当該単語の標準英語用の発音記号を対応付けて前記音声合成データを生成する標準発音記号音声合成データ生成手段を有し、
前記ストレス補正係数記憶手段は、
地域英語の種類ごとに、所定の英単語と、この所定の英単語についての当該地域英語特有の発音の発音記号と、を対応付けて記憶する補正発音記号記憶手段を有し、
前記ストレスデータ補正手段は、
前記音声合成データにおける前記所定の英単語の発音記号を、前記学習対象英語特有の発音の発音記号に補正する発音記号補正手段を有し、
前記音声出力手段は、
前記発音記号補正手段による補正後の前記音声合成データに基づいて、前記テキスト中の前記所定の単語を、前記学習対象英語特有の発音記号による発音で音声出力することを特徴とする発音学習支援装置。
【請求項6】
請求項1〜5の何れか一項に記載の発音学習支援装置において、
前記学習対象英語指定手段は、
ユーザ操作に基づいて前記学習対象英語を指定することを特徴とする発音学習支援装置。
【請求項7】
請求項1〜5の何れか一項に記載の発音学習支援装置において、
前記学習対象英語指定手段は、
前記学習対象英語をランダムに指定することを特徴とする発音学習支援装置。
【請求項8】
請求項1〜7の何れか一項に記載の発音学習支援装置において、
ユーザから文字列の入力操作を受ける文字列入力手段と、
前記音声出力手段により音声出力された前記テキストと、前記文字列入力手段により入力された文字列とを比較することでユーザに対するディクテーションテストの正誤を判定するとともに、当該判定結果をユーザに報知する正誤判定手段と、
を備えることを特徴とする発音学習支援装置。
【請求項9】
コンピュータに、
英語のテキスト中の各音素に、当該音素の標準英語用のストレスデータを対応付けて、前記テキストから音声合成データを生成する標準ストレス音声合成データ生成機能と、
地域英語の種類ごとに、標準英語用の前記ストレスデータに対するストレス補正係数を記憶するストレス補正係数記憶機能と、
前記ストレス補正係数記憶機能によって記憶された何れかの種類の地域英語を学習対象英語として指定する学習対象英語指定機能と、
前記音声合成データにおける各ストレスデータを、前記学習対象英語に対応する前記ストレス補正係数で補正するストレスデータ補正機能と、
前記ストレスデータ補正機能による補正後の前記音声合成データに基づいて、前記テキスト中の各音素を前記学習対象英語のストレスで音声出力する音声出力機能と、
を実現させることを特徴とする発音学習支援プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate


【公開番号】特開2008−250090(P2008−250090A)
【公開日】平成20年10月16日(2008.10.16)
【国際特許分類】
【出願番号】特願2007−92797(P2007−92797)
【出願日】平成19年3月30日(2007.3.30)
【出願人】(000001443)カシオ計算機株式会社 (8,748)
【Fターム(参考)】