発音辞書作成装置、発音辞書の生産方法、およびプログラム

【課題】多様な発音変化、特に単語の位置に依存して生起する発音変化に対応できる発音辞書が存在しなかった。
【解決手段】一の言語の単語情報と、当該単語情報の単語情報群内における位置示す分類フラグと、単語の発音情報とを有する１以上の発音エントリを格納し得る発音辞書と、単語情報群と発音情報群との組である情報群を１組以上格納し、１以上の単語情報群を単語に分割し、単語の位置を特定する分類フラグを決定し、単語情報に対応付ける分類部と、単語情報と分類フラグごとに、当該単語情報と当該分類フラグとに対応する各発音情報の頻度を算出し、頻度が予め決められた条件を満たすほど高い発音情報を有する発音エントリを選択して、前記発音辞書に蓄積するエントリ決定部とを具備する発音辞書作成装置により、多様な発音変化、特に単語の位置に依存して生起する発音変化に対応できる発音辞書を作成できる。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、音声認識装置等で利用可能な発音辞書を作成する発音辞書作成装置等に関するものである。
【背景技術】
【０００２】
従来、多言語音声翻訳システムの実用化に向けた研究が盛んにおこなわれている。音声認識技術についても、日本語、英語と並び、韓国語の音声認識システムの研究開発が行われている。
【０００３】
また、従来、移動通信端末装置に内蔵された通訳プログラムを通じてユーザが発した韓国語音声を外国語に通訳してスピーカーを通じて音声として出力し、液晶画面を通じてテキストで出力することができ、外国人とのコミュニケーションのために大きくて重い翻訳機を常時持ち歩く必要がなく、移動通信端末装置を携帯することで何時でも何処でも通訳サービスを受けることができる移動通信端末装置を利用した通訳サービス方法が存在した（特許文献１参照）。
【０００４】
一方、例えば、韓国語では、特に、前後の単語の影響により様々に発音が変化することが知られている。以下は、単語の位置による発音変化の例であり、たとえば、以下の例文１および例文２は、発音変化パターンの一つである「連音」の例である。例文１および例文２において、

は後続する単語によって発音が「/han-gug/」のように変化する。一方、例文３では前後の単語の影響を受けず、発音の変化は生じない。

【０００５】
また、韓国語において、前後の単語の影響によって生じる発音変化に関し、以下の特徴があることが知られている（非特許文献１）。
（１）語節内においては、前後の単語の影響で様々な発音変化が生じる。
（２）話し言葉などで語節間にポーズが生起しない場合に限り語節間の発音変化が生じる。
（３）語節間で生じる発音変化は、先行する単語の影響による重複閉鎖や後続単語によるリエゾンなどの発音変化に限られる。なお、韓国語の閉鎖音には平音・激音・濃音の３項対立があり、平音は無気音、激音は有気音、濃音は喉頭の緊張を伴う無気音である。平音が音節境界で連続した場合、内破＋外破として実現され、破裂の際は喉頭の緊張を伴う濃音として実現される（/VC.C'V/）。これが表記上の重複閉鎖である。また、重複閉鎖の詳細について、論文（http://www.lang.nagoya-u.ac.jp/nichigen/issue/pdf/3/3-14.pdf#search='重複閉鎖'）に説明がある。
【先行技術文献】
【特許文献】
【０００６】
【特許文献１】特表２００９−５２９７０４号公報（第１頁、第１図等）
【非特許文献】
【０００７】
【非特許文献１】K-N.Lee et al. "Modeling Cross-morpheme Pronunciation Variations for Korean Large Vocabulary Continuous Speech Recognition"，Proc.EUROSPEECH 2003.
【発明の概要】
【発明が解決しようとする課題】
【０００８】
しかしながら、特許文献１に記載の韓国語音声認識技術においては、多様な発音変化、特に単語の位置に依存して生起する発音変化に対応できる発音辞書が存在しなかった。そして、単語の位置に依存して生起する発音変化に対応しない発音辞書を用いて、韓国語の音声認識を行っていたため、精度高く、韓国語の音声認識ができなかった。
【０００９】
また、韓国語以外のフランス語やスペイン語等でも、前後の単語の影響により様々に発音が変化するが、かかる言語の音声認識技術においても、多様な発音変化、特に単語の位置に依存して生起する発音変化に対応できる発音辞書が存在せず、精度の高い音声認識ができなかった。
【課題を解決するための手段】
【００１０】
本第一の発明の発音辞書作成装置は、一の言語の単語を示す単語情報、単語情報の単語情報群内における位置を特定する情報である分類フラグ、および単語の発音を示す発音情報を有する１以上の発音エントリを格納し得る発音辞書と、１以上の単語情報を有する単語情報群と、１以上の各単語情報に対応する１以上の発音情報を有する発音情報群との組である情報群を１組以上、格納し得る情報群格納部と、１組以上の情報群が有する１以上の単語情報群を、１以上の単語に分割し、単語の単語情報群内における位置を特定する分類フラグを決定し、分類フラグを単語情報に対応付ける分類部と、単語情報と分類フラグごとに、単語情報と分類フラグとに対応する各発音情報の頻度を算出し、頻度が閾値より高い発音情報を有する発音エントリを選択して、発音辞書に蓄積するエントリ決定部とを具備する発音辞書作成装置である。
【００１１】
かかる構成により、多様な発音変化、特に単語の位置に依存して生起する発音変化に対応できる発音辞書を作成できる。
【００１２】
また、本第二の発明の発音辞書作成装置は、第一の発明に対して、エントリ決定部は、分類フラグごとに、発音エントリを選択する条件である選択条件を格納している選択条件格納手段と、単語情報と分類フラグごとに、単語情報と分類フラグとに対応する各発音情報の頻度を算出する頻度算出手段と、分類フラグに対応する選択条件を選択条件格納手段から取得し、頻度算出手段が算出した頻度が取得した選択条件に合致するか判断する判断手段と、判断手段が選択条件に合致すると判断した発音情報を有する発音エントリを発音辞書に蓄積する発音エントリ蓄積手段とを具備する発音辞書作成装置である。
【００１３】
かかる構成により、多様な発音変化、特に単語の位置に依存して生起する発音変化に精度高く対応できる発音辞書を作成できる。
【００１４】
また、本第三の発明の発音辞書作成装置は、第一または第二の発明に対して、エントリ決定部が選択した１以上の発音エントリに対して、各発音エントリが有する単語情報の情報群格納部における出現頻度を算出し、出現頻度が所定の条件を満たすほど多い発音エントリのみを選択する発音エントリ選択部をさらに具備し、エントリ決定部は、発音エントリ選択部が選択した発音エントリのみを、発音辞書に蓄積する発音辞書作成装置である。
【００１５】
かかる構成により、多様な発音変化、特に単語の位置に依存して生起する発音変化に、さらに精度高く対応できる発音辞書を作成できる。
【００１６】
また、本第四の発明の発音辞書作成装置は、第一から第三いずれかの発明に対して、一の言語は、韓国語であり、単語情報群は、語節である発音辞書作成装置である。
【００１７】
かかる構成により、韓国語の多様な発音変化、特に、語節内における単語の位置に依存して生起する発音変化に対応できる発音辞書を作成できる。
【発明の効果】
【００１８】
本発明による発音辞書作成装置によれば、多様な発音変化、特に単語の位置に依存して生起する発音変化に対応できる発音辞書が作成できる。
【図面の簡単な説明】
【００１９】
【図１】実施の形態１における発音辞書作成装置のブロック図
【図２】同発音辞書作成装置の動作について説明するフローチャート
【図３】同分類処理の動作について説明するフローチャート
【図４】同エントリ決定処理の動作について説明するフローチャート
【図５】同選択条件管理表を示す図
【図６】同音声認識装置のブロック図
【図７】同実験結果を示す図
【図８】同発音辞書作成装置の他のブロック図
【図９】同コンピュータシステムの概観図
【図１０】同コンピュータシステムのブロック図
【発明を実施するための形態】
【００２０】
以下、発音辞書作成装置等の実施形態について図面を参照して説明する。なお、実施の形態において同じ符号を付した構成要素は同様の動作を行うので、再度の説明を省略する場合がある。
（実施の形態１）
【００２１】
本実施の形態において、１以上の単語の集合である単語群（例えば、語節（Eojeol））内の単語の位置によって発音変化の傾向が異なることを利用し、単語群内の位置情報をもとに発音辞書を作成する発音辞書作成装置について説明する。さらに具体的には、本実施の形態において、単語群内の位置によって起こりうる発音変化パターンが異なるという特徴に着目し、単語の単語群の位置情報に応じて異なる発音エントリとして扱い、適切な発音付与が行われた発音辞書を作成する発音辞書作成装置について説明する。
【００２２】
また、発音変化に対応した発音辞書を利用した音声認識装置について説明する。
【００２３】
図１は、本実施の形態における発音辞書作成装置１のブロック図である。
【００２４】
発音辞書作成装置１は、発音辞書１１、情報群格納部１２、分類部１３、エントリ決定部１４、および発音エントリ選択部１５を備える。また、分類部１３は、分割手段１３１、単語位置決定手段１３２、およびフラグ付与手段１３３を備える。また、エントリ決定部１４は、選択条件格納手段１４１、頻度算出手段１４２、判断手段１４３、および発音エントリ蓄積手段１４４を備える。
【００２５】
発音辞書１１は、１以上の発音エントリを格納し得る。発音エントリとは、一の言語の単語を示す単語情報と、当該単語情報の単語情報群内における位置を特定する情報である分類フラグと、当該単語の発音を示す発音情報とを有する。ここで、単語情報とは、単語自体でも良いし、単語の表層など、単語を示す情報であれば何でも良い。また、発音情報とは、アルファベット列でも良いし、音響データ等、発音を示す情報であれば何でも良い。また、一の言語は、例えば、韓国語である。また、一の言語は、フランス語やスペイン語などの、単語群内の単語の位置によって発音変化がある言語であれば何でも良い。発音辞書１１は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。
【００２６】
情報群格納部１２は、１組以上の情報群を格納し得る。情報群とは、単語情報群と、発音情報群との組である。単語情報群とは、１以上の単語情報を有する情報であり、文でも良いし、単語の集合である句、語節などでも良い。なお、語節とは「Eojeol」であり、韓国語における一まとまりの単語の集合である。また、フランス語では、単語情報群はリズムグループという。また、情報群格納部１２において、単語情報と発音情報とは対応付いている、とする。また、発音情報群とは、１以上の各単語情報に対応する１以上の発音情報を有する情報である。なお、例えば、情報群は、多数の文が格納されているコーパス（図示しない）の各文に対して、形態素解析を行って、取得される。
【００２７】
また、情報群格納部１２は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。そして、情報群格納部１２に情報群が記憶される過程は問わない。例えば、記録媒体を介して情報群が情報群格納部１２で記憶されるようになってもよく、通信回線等を介して送信された情報群が情報群格納部１２で記憶されるようになってもよく、あるいは、入力デバイスを介して入力された情報群が情報群格納部１２で記憶されるようになってもよい。
【００２８】
また、類部１３は、１組以上の情報群が有する１以上の単語情報群を、１以上の単語情報に分割し、単語情報の単語情報群内における位置を特定する分類フラグを決定し、当該分類フラグを単語情報に対応付ける。分類フラグは、例えば、単語情報が単語情報群内の先頭に位置することを示すＬ、単語情報が単語情報群内の末尾に位置することを示すＲ、単語情報が単語情報群内の中央部（先頭でも末尾でもない位置）に位置することを示すＣ、単語情報群が一つの単語情報で構成されていることを示すＳである。分類フラグは、その他の分類を示す情報でも良い。
【００２９】
分類部１３を構成する分割手段１３１は、１組以上の情報群が有する１以上の単語情報群を、１以上の単語情報に分割し、１以上の単語情報を取得する。分割手段１３１は、例えば、公知の形態素解析器により実現される。また、分割手段１３１は、例えば、統計的に、単語情報群を１以上の単語情報に分割する処理を行っても良い。なお、分割手段１３１は、公知技術であるので詳細な説明を省略する。また、単語情報群が一つの単語情報のみを有する場合、分割手段１３１は、単語情報群に対する分割の処理を試みた後、当該一つの単語情報を取得する処理を行う。
【００３０】
単語位置決定手段１３２は、分割手段１３１が取得した１以上の各単語情報に対して、単語情報群内における位置を決定する処理を行う。
【００３１】
フラグ付与手段１３３は、単語位置決定手段１３２が決定した位置に対応する分類フラグを、各単語情報に対して付与する。
【００３２】
エントリ決定部１４は、単語情報と分類フラグごとに、単語情報と分類フラグとに対応する各発音情報の頻度を算出し、頻度が予め決められた条件を満たすほど高い発音情報を有する発音エントリを選択して、発音辞書１１に蓄積する。また、エントリ決定部１４は、発音エントリ選択部１５が選択した発音エントリのみを発音辞書１１に蓄積しても良い。
【００３３】
このエントリ決定部１４を構成する選択条件格納手段１４１は、分類フラグごとに、発音エントリを選択する条件である選択条件を格納している。なお、エントリ決定部１４が選択条件格納手段１４１を具備しない場合、エントリ決定部１４は、すべての分類フラグに対して、同一の条件で発音エントリを選択する。また、選択条件格納手段１４１は、すべての分類フラグに共通の一の選択条件を格納していても良い。選択条件格納手段１４１は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。
【００３４】
頻度算出手段１４２は、分類部１３により取得されたすべての発音エントリ（単語情報と分類フラグと発音情報を有する情報）に対して、単語情報と分類フラグごとに、単語情報と分類フラグとに対応する各発音情報の頻度を算出する。
【００３５】
判断手段１４３は、分類フラグに対応する選択条件を選択条件格納手段１４１から取得し、頻度算出手段１４２が算出した頻度が、取得した選択条件に合致するか判断する。なお、選択条件格納手段１４１が存在しない場合、判断手段１４３は、頻度算出手段１４２が算出した頻度が、予め決められた選択条件に合致するか判断する。
【００３６】
発音エントリ蓄積手段１４４は、判断手段１４３が選択条件に合致すると判断した発音情報を有する発音エントリを発音辞書１１に蓄積する。また、発音エントリ蓄積手段１４４は、発音エントリ選択部１５が選択した発音エントリのみを発音辞書１１に蓄積しても良い。
【００３７】
発音エントリ選択部１５は、エントリ決定部１４が選択した１以上の発音エントリに対して、各発音エントリが有する単語情報の情報群格納部１２における出現頻度を算出し、出現頻度が所定の条件を満たすほど多い発音エントリのみを選択する。また、発音エントリ選択部１５は、単語情報の情報群格納部１２における出現頻度を算出し、出現頻度が所定の条件を満たすほど多い単語情報を有する発音エントリのみを、エントリ決定部１４で処理することを、エントリ決定部１４に指示しても良い。
【００３８】
分類部１３、エントリ決定部１４、発音エントリ選択部１５、分割手段１３１、単語位置決定手段１３２、フラグ付与手段１３３、頻度算出手段１４２、判断手段１４３、および発音エントリ蓄積手段１４４は、通常、ＭＰＵやメモリ等から実現され得る。分類部１３等の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはＲＯＭ等の記録媒体に記録されている。但し、ハードウェア（専用回路）で実現しても良い。
【００３９】
次に、発音辞書作成装置１の動作について、図２のフローチャートを用いて説明する。
【００４０】
（ステップＳ２０１）分類部１３は、カウンタｉに１を代入する。
【００４１】
（ステップＳ２０２）分類部１３は、情報群格納部１２に、ｉ番目の情報群が存在するか否かを判断する。ｉ番目の情報群が存在すればステップＳ２０３に行き、存在しなければステップＳ２０５に行く。
【００４２】
（ステップＳ２０３）分類部１３は、ｉ番目の情報群に対して、分類処理を行う。分類処理の詳細について、図３のフローチャートを用いて説明する。
【００４３】
（ステップＳ２０４）分類部１３は、カウンタｉを１、インクリメントし、ステップＳ２０２に戻る。
【００４４】
（ステップＳ２０５）エントリ決定部１４は、エントリ決定処理を行う。エントリ決定処理の詳細について、図４のフローチャートを用いて説明する。
【００４５】
（ステップＳ２０６）発音エントリ選択部１５は、カウンタｉに１を代入する。
【００４６】
（ステップＳ２０７）発音エントリ選択部１５は、ステップＳ２０５で取得された発音エントリの中で、ｉ番目の発音エントリが存在するか否かを判断する。ｉ番目の発音エントリが存在すればステップＳ２０８に行き、存在しなければ処理を終了する。
【００４７】
（ステップＳ２０８）発音エントリ選択部１５は、ｉ番目の発音エントリに含まれる単語情報を取得する。
【００４８】
（ステップＳ２０９）発音エントリ選択部１５は、ステップＳ２０８で取得した単語情報の、情報群格納部１２における出現頻度を取得する。
【００４９】
（ステップＳ２１０）発音エントリ選択部１５は、ステップＳ２０９で取得した出現頻度が、予め決められた条件を満たすか否かを判断する。条件を満たせばステップＳ２１１に行き、条件を満たさなければステップＳ２１２にスキップする。
【００５０】
（ステップＳ２１１）発音エントリ蓄積手段１４４は、ｉ番目の発音エントリを発音辞書１１に蓄積する。
【００５１】
（ステップＳ２１２）発音エントリ選択部１５は、カウンタｉを１、インクリメントし、ステップＳ２０７に戻る。
【００５２】
なお、図２のフローチャートにおいて、発音辞書作成装置１の動作開始のトリガーは、ユーザからの指示、外部装置から送信された指示の受信、予め決められた時刻になった場合の時刻トリガー等、何でも良い。
【００５３】
また、図２のフローチャートのステップＳ２０５において、エントリ決定部１４が取得したすべての発音エントリを発音辞書１１に蓄積しても良い。かかる場合、ステップＳ２０６からステップＳ２１２は不要である。
【００５４】
次に、ステップＳ２０３の分類処理について、図３のフローチャートを用いて説明する。
【００５５】
（ステップＳ３０１）分類部１３を構成する分割手段１３１は、情報群格納部１２から、ｉ番目の情報群を読み出す。
【００５６】
（ステップＳ３０２）分割手段１３１は、ステップＳ３０１で読み出した情報群が有する単語情報群を取得する。
【００５７】
（ステップＳ３０３）分割手段１３１は、ステップＳ３０２で取得した単語情報群を、１以上の単語情報に分割する。
【００５８】
（ステップＳ３０４）単語位置決定手段１３２は、カウンタｊに１を代入する。
【００５９】
（ステップＳ３０５）単語位置決定手段１３２は、ステップＳ３０２で分割され、取得された単語情報の中で、ｊ番目の単語情報が存在するか否かを判断する。ｊ番目の単語情報が存在すればステップＳ３０６に行き、存在しなければ上位処理にリターンする。
【００６０】
（ステップＳ３０６）単語位置決定手段１３２は、ｊ番目の単語情報の、ステップＳ３０２で取得した単語情報群の中における位置を決定する。
【００６１】
（ステップＳ３０７）フラグ付与手段１３３は、ステップＳ３０６で決定された位置に対応する分類フラグを取得し、ｊ番目の単語情報に付与する。
【００６２】
（ステップＳ３０８）分類部１３は、ｊ番目の単語情報に対応する発音情報を、情報群格納部１２から取得する。
【００６３】
（ステップＳ３０９）分類部１３は、ｊ番目の単語情報、分類フラグ、およびステップＳ３０８で取得した発音情報を有する発音エントリを構成する。
【００６４】
（ステップＳ３１０）単語位置決定手段１３２は、カウンタｊを１、インクリメントし、ステップＳ３０５に戻る。
【００６５】
次に、ステップＳ２０５のエントリ決定処理について、図４のフローチャートを用いて説明する。
【００６６】
（ステップＳ４０１）エントリ決定部１４は、ステップＳ２０３の分類処理で取得されたすべての発音エントリを、単語情報および分類フラグをキーとしてソートする。
【００６７】
（ステップＳ４０２）エントリ決定部１４は、カウンタｉに１を代入する。
【００６８】
（ステップＳ４０３）頻度算出手段１４２は、ステップＳ４０１でソートされた発音エントリの中を順に見ていき、ｉ番目の単語情報が存在するか否かを判断する。ｉ番目の単語情報が存在すればステップＳ４０４に行き、存在しなければ上位処理にリターンする。なお、ここでのｉ番目の単語情報は、ｉ番目の種類の単語情報の意味であり、同一の単語情報は、複数でも一つとして数える。
【００６９】
（ステップＳ４０４）頻度算出手段１４２は、ｉ番目の単語情報の各分類フラグに対応する頻度を、分類フラグごとに取得する。
【００７０】
（ステップＳ４０５）頻度算出手段１４２は、カウンタｊに１を代入する。
【００７１】
（ステップＳ４０６）判断手段１４３は、ｉ番目の単語情報に対応するｊ番目の分類フラグが存在するか否かを判断する。ｊ番目の分類フラグが存在すればステップＳ４０７に行き、存在しなければステップＳ４１１に行く。なお、ここでのｊ番目の分類フラグは、ｉ番目の種類の分類フラグの意味であり、同一の分類フラグは、複数でも一つとして数える。
【００７２】
（ステップＳ４０７）判断手段１４３は、ｊ番目の分類フラグに対応する選択条件を、選択条件格納手段１４１から取得する。
【００７３】
（ステップＳ４０８）判断手段１４３は、ｉ番目の単語情報、かつｊ番目の分類フラグの組の頻度が、ステップＳ４０７で取得した選択条件に合致するか否かを判断する。合致すればステップＳ４０９に行き、合致しなければステップＳ４１０にスキップする。
【００７４】
（ステップＳ４０９）発音エントリ蓄積手段１４４は、ｉ番目の単語情報、ｊ番目の分類フラグを含む発音エントリを取得する。なお、ここで取得された発音エントリは、例えば、図示しないバッファに一時蓄積される。
【００７５】
（ステップＳ４１０）エントリ決定部１４は、カウンタｊを１、インクリメントし、ステップＳ４０６に戻る。
【００７６】
（ステップＳ４１１）エントリ決定部１４は、カウンタｉを１、インクリメントし、ステップＳ４０３に戻る。
【００７７】
以下、本実施の形態における発音辞書作成装置１の具体的な動作について説明する。ここで、韓国語とフランス語とを例にして、発音辞書作成装置１の２つの具体的な動作について説明する。
（具体例１）
【００７８】
例えば、韓国語において、単語情報群は語節「Eojeol」である。また、分類フラグは、ここでは、Ｌ「単語が語節頭に生起する時」、Ｒ「単語が語節末に生起する時」、Ｃ「単語が語節内部に生起する時」、Ｓ「１単語が語節を構成している時」の４つである、とする。
【００７９】
そして、現在、多数の韓国語文が格納されているコーパス（図示しない）中の各文に対して、韓国語の形態素解析器を用いて、形態素解析を行い、各文が１以上の語節に分割され、かつ、各語節が１以上の単語に分割された、とする。そして、形態素解析器の結果を基にして、テーブルを用いて、各単語の発音情報も得られた、とする。そして、情報群格納部１２には、１組以上の情報群が格納された、とする。
【００８０】
また、選択条件格納手段１４１は、図５に示す選択条件管理表を保持している、とする。選択条件管理表は、分類フラグと、当該分類フラグに対応する選択条件を有する。選択条件は、ここでは、頻度または頻度割合のいずれかをパラメータとする条件である。ただし、選択条件は、頻度に関する条件であれば良い。なお、「頻度＞＝Ｎ１」は、分類部１３が取得した発音エントリの中で、同一の単語と同一の分類フラグと同一の発音情報の組の出現頻度が「Ｎ１（自然数）」以上であれば、当該発音エントリが選択されることを示す。また、「頻度＞＝３０％」は、分類部１３が取得した発音エントリの中で、「（同一の単語と同一の分類フラグと同一の発音情報の組の出現頻度／同一の単語と同一の分類フラグの出現頻度）×１００」が３０（％）以上であれば、当該発音エントリが選択されることを示す。つまり、頻度とは出現回数であり、頻度割合とは、同一の単語と同一の分類フラグの出現回数の中の、着目する一の発音情報が出現する割合である。
【００８１】
かかる状況において、分類部１３は、情報群格納部１２のすべての単語に対して、単語の単語情報群内における位置を決定し、当該位置に対応する分類フラグを付与する。
【００８２】
例えば、情報群格納部１２内に語節

（以下、当該語節を語節Ａという。）が存在する場合、分類部１３を構成する分割手段１３１は、語節Ａを２つの単語Ａ１と単語Ａ２に分ける。
なお、単語Ａ１は、

単語Ａ２は、

である。
次に、単語位置決定手段１３２は、単語Ａ１に対して、単語情報群内における位置を、「語節頭に生起する」と判断する。次に、フラグ付与手段１３３は、単語Ａ１に対して、分類フラグ「Ｌ」を付与し、「単語Ａ１＿Ｌ」を得る。そして、分類部１３は、語節Ａ中の単語Ａ１に対する発音情報を得て、当該発音情報と「単語Ａ１＿Ｌ」とを有する発音エントリを構成する。
【００８３】
また、単語位置決定手段１３２は、単語Ａ２に対して、単語情報群内における位置を、「語節末に生起する」と判断する。次に、フラグ付与手段１３３は、単語Ａ２に対して、分類フラグ「Ｒ」を付与し、「単語Ａ２＿Ｒ」を得る。そして、分類部１３は、語節Ａの中の単語Ａ２に対する発音情報を得て、当該発音情報と「単語Ａ２＿Ｒ」とを有する発音エントリを構成する。
【００８４】
また、例えば、情報群格納部１２内に語節

（以下、当該語節を語節Ｂという。）が存在する場合、分類部１３を構成する分割手段１３１は、当該語節Ｂは、２以上の単語に分割できない、と判断する。次に、単語位置決定手段１３２は、語節Ｂと一致する単語Ｂ１に対して、単語情報群内における位置を、「１単語で語節を構成している」と判断する。次に、フラグ付与手段１３３は、単語Ｂ１に対して、分類フラグ「Ｓ」を付与し、「単語Ｂ１＿Ｓ」を得る。そして、分類部１３は、語節Ｂの中の単語Ｂ１に対する発音情報を得て、当該発音情報と「単語Ｂ１＿Ｓ」とを有する発音エントリを構成する。
【００８５】
分類部１３は、以上の分類処理を、情報群格納部１２内のすべての語節に対して行い、多数の発音エントリを得る。なお、発音エントリは、分類フラグが付与された単語と、発音情報とを有する。
【００８６】
次に、エントリ決定部１４は、単語情報と分類フラグごとに、単語情報と分類フラグとに対応する各発音情報の頻度を算出し、頻度が予め決められた条件を満たすほど高い発音情報を有する発音エントリを選択する。なお、エントリ決定部１４は、連音を考慮して位置情報に応じて発音エントリを選択しても良い。ここで、以下、連音を考慮する場合について、単語

を例にとり、説明する。
以下の例文１では、語節Ｂは１単語から構成され、単語Ｂ１は後続の単語の影響を受けず、

となる。
（例文１）

一方、以下の例文２では、語節

（語節Ｃという。）
は単語Ｃ１と単語Ｃ２の２単語から構成される。
なお、単語Ｃ１は、

単語Ｃ２は、

である。
そして、語節Ｃにおいて、単語Ｃ１は後続の単語Ｃ２の影響で、「/han-gug/」の発音となる。
（例文２）

また、以下の例文３では、語節

（語節Ｄという。）
は単語Ｄ１と単語Ｄ２と単語Ｄ３の３単語から構成される。
なお、単語Ｄ１は、

単語Ｄ２は、

単語Ｄ３は、

である。
そして、語節Ｄにおいて、単語Ｄ１は後続の単語Ｄ２の影響で、「/han-gug/」の発音となる。
（例文３）

また、以下は単語

（単語Ｅという）（教育）の発音変化例である。つまり、単語Ｅは、前後の単語の影響により「kyo-yug」「gyo-yuk」「kyo-yukh」「kyo-yun」「kkyo-yug」「kkyo-yuk」「gyo-yun」のように発音が変化することがある。

【００８７】
次に、エントリ決定部１４は、上記の分類処理で取得されたすべての発音エントリを、単語情報および分類フラグをキーとしてソートする。
【００８８】
次に、エントリ決定部１４を構成する頻度算出手段１４２は、各単語情報の各分類フラグに対応する頻度を、分類フラグごとに取得する。そして、判断手段１４３は、各分類フラグに対応する選択条件を選択条件管理表（図５）から取得する。次に、判断手段１４３は、単語情報・分類フラグの組「単語Ａ１＿Ｌ」と各発音情報の頻度が選択条件「頻度＞＝Ｎ１」に合致するか否かを判断する。ここで、判断手段１４３は、発音情報「han-guk」「han-gug」が、選択条件「頻度＞＝Ｎ１」に合致すると判断した、とする。また、判断手段１４３は、単語情報・分類フラグの組「単語Ａ１＿Ｒ」と各発音情報の頻度が選択条件「頻度＞＝Ｎ２」に合致するか否かを判断する。ここで、判断手段１４３は、発音情報「han-guk」のみが、選択条件「頻度＞＝Ｎ２」に合致すると判断した、とする。また、判断手段１４３は、単語情報・分類フラグの組「単語Ａ１＿Ｃ」と各発音情報の頻度が選択条件「頻度割合＞＝３０％」に合致するか否かを判断する。ここで、判断手段１４３は、発音情報「han-guk」「han-gug」が、選択条件「頻度割合＞＝３０％」に合致すると判断した、とする。さらに、判断手段１４３は、単語情報・分類フラグの組「単語Ａ１＿Ｓ」と各発音情報の頻度が選択条件「頻度割合＞＝４０％」に合致するか否かを判断する。ここで、判断手段１４３は、発音情報「han-guk」のみが、選択条件「頻度割合＞＝４０％」に合致すると判断した、とする。
【００８９】
そして、エントリ決定部１４は、発音エントリ

（「「単語Ａ１＿Ｌ」，「han-guk」」、「「単語Ａ１＿Ｌ」，「han-gug」」、「「単語Ａ１＿Ｒ」，「han-guk」」、「「単語Ａ１＿Ｃ」，「han-guk」」、「「単語Ａ１＿Ｃ」，「han-gug」」、「「単語Ａ１＿Ｓ」，「han-guk」」、と同意義である）を得る。
【００９０】
次に、発音エントリ蓄積手段１４４は、エントリ決定部１４が得た６つの発音エントリを発音辞書１１に蓄積する。
【００９１】
なお、上記において、発音エントリ選択部１５は、エントリ決定部１４が選択した１以上の発音エントリに対して、各発音エントリが有する単語情報の情報群格納部１２における出現頻度を算出し、出現頻度が所定の条件を満たすほど多い発音エントリのみを選択しても良い。かかる場合、発音エントリ蓄積手段１４４は、発音エントリ選択部１５により選択された発音エントリのみを蓄積する。
（実験）
【００９２】
以下、実験結果について説明する。韓国語旅行会話文発声データ（BTEC、Basic Travel Expression Corpus)を用いて、発音辞書作成装置１の評価実験を実施した。本データは、男女各２０人による読上げ音声である。
【００９３】
本実験において用いる音声認識装置２のブロック図を図６に示す。音声認識装置２は、発音辞書１１、音響モデル６１、言語モデル６２、音声受付部６３、音声認識部６４、および認識結果出力部６５を具備する。
【００９４】
音響モデル６１は、Sitecにて作成された読み上げ音声コーパス（B. Kim et al."Current state and future plants at SiTEC for speech corpora for common use," Malsori, vol. 46,pp. 175-186, 2003.）計７０時間分を用いて学習された。音響モデル６１のサンプリング周波数は１６ｋＨｚ、特徴量は１２次元ＭＦＣＣ、１２次元ΔＭＦＣＣ、Δ対数パワーを用いた。また、音響モデル６１は、より最適なモデル構造が得られるＭＤＬ−ＳＳＳ法（Jitsuhiro et al., IEICE Trans. Inf. & Syst., E87-D8,2121-2129, 2004.）を用いて、自動的に構造決定されたものである。
【００９５】
また、言語モデル６２は旅行会話基本文約１６万文を用いて作成された。単語セグメンテーションは、音声認識実験を行う上で最適な単語単位を自動決定する方法を用いて実施され、各単語単位について、語節内の位置情報を付加した後、言語モデル６２が学習された。
【００９６】
音声受付部６３は、音声を受け付ける。また、音声認識部６４は、発音辞書１１、音響モデル６１、および言語モデル６２を用いて、音声受付部６３が受け付けた音声を認識する。ここで、音声認識のアルゴリズムは既存のアルゴリズムを用いた。既存のアルゴリズムについての説明は省略する。また、認識結果出力部６５は、音声認識部６４が取得した認識結果を出力する。
【００９７】
本実験において、Ｂａｓｅｌｉｎｅでは、発音変形を考慮した発音エントリを追加しない方法である従来法を採った。また、発音辞書作成装置１における選択条件格納手段１４１の選択条件は、すべての分類フラグに対して同一の選択条件であり、発音変形パターンの中で最も高頻度のパターンのみを選択する、という条件とした。なお、かかる発音辞書作成装置１の方法を「Ａｄｄ−１−ｂｅｓｔ」ということとする。
【００９８】
また、図示しない情報群自動生成装置が、非特許文献１で述べられている"Tensification""Liaison""n-insertion"などの変化パターンをルール化し、各単語に対して前後の単語を考慮しつつ、情報群格納部１２における情報群の発音変形パターンを自動生成した。
【００９９】
そして、Ｂａｓｅｌｉｎｅの方法では、発音辞書中の作成された発音エントリ数は５６９４２であった。一方、Ａｄｄ−１−ｂｅｓｔの方法では、発音辞書中の作成された発音エントリ数は６１５８６であった。
【０１００】
また、Ｂａｓｅｌｉｎｅの方法により作成された発音辞書を使用する音声認識装置による音声認識、およびＡｄｄ−１−ｂｅｓｔの方法により作成された発音辞書を使用する音声認識装置２による音声認識を行った。そして、２つの音声認識装置における音声認識の誤り率（文字誤り率）を算出した。かかる実験結果を図７に示す。図７により、学習データ内の頻度を考量して、最も頻度が高い変形候補を追加した場合（Ａｄｄ−１−ｂｅｓｔの方法）については、Ｂａｓｅｌｉｎｅの方法と比較して、１１％の性能改善が確認できた。
【０１０１】
本結果より、発音エントリを決定する上で、語節内の位置情報を用いることの有効性が確認された。本実験では、上記の条件（Ａｄｄ−１−ｂｅｓｔの方法）のみで評価を行ったが、より最適なエントリ追加方法を行うことにより、更なる性能改善が期待できる。
（具体例２）
【０１０２】
発音辞書作成装置１は、韓国語に限らず、フランス語等の他の言語に対しても適用できる。例えば、フランス語において、単語情報群は「リズムグループ」と言われる１以上の単語の集合である。そして、今、図示しないコーパスに、「Je ne suis pas en forme et toi?」や「Je ne sais pas, expliquez-moi s'il vou plait?」などのフランス語の文が多数存在する、とする。次に、フランス語の形態素解析器等の従来技術を用いて、「Je ne suis pas en forme et toi?」が、２つのリズムグループ「Je ne suis pas en forme」「et toi?」に分割され、かつ、各単語の発音情報が取得され、情報群格納部１２に蓄積された、とする。また、フランス語の形態素解析器等を用いて、「Je ne sais pas, expliquez-moi s'il vou plait?」が、２つのリズムグループ「Je ne sais pas,」「expliquez-moi s'il vou plait?」に分割され、かつ、各単語の発音情報が取得され、情報群格納部１２に蓄積された、とする。上記の処理をコーパス内のすべての文に対して実施し、情報群格納部１２に多数の情報群が蓄積された、とする。
【０１０３】
次に、分類部１３は、各リズムグループを単語に分割し、各単語の位置を取得し、分類フラグを付与する。分類部１３は、例えば、リズムグループ「Je ne suis pas en forme」の単語「pas」に対して、分類フラグ「Ｃ」を取得し、「pas＿Ｃ」を得る。また、分類部１３は、「Je ne suis pas en forme」内の単語「pas」の発音情報［pas］を得る。なお、フランス語において、語末の発音されない子音「単語「pas」の「s」」の音は、後続単語が母音（ここでは、単語「en」の「e」）で始まる場合に有音となる。そして、分類部１３は、発音エントリ「「pas＿Ｃ」，［pas］」を取得する。
【０１０４】
また、分類部１３は、例えば、リズムグループ「Je ne sais pas,」の単語「pas」に対して、分類フラグ「Ｒ」を取得し、「pas＿Ｒ」を得る。また、分類部１３は、「Je ne sais pas,」内の単語「pas」の発音情報［pa］を得る。なお、フランス語において、リズムグループを超えて後続の単語の影響は受けない。そして、分類部１３は、発音エントリ「「pas＿Ｒ」，［pa］」を取得する。
なお、同様の現象は英語においても存在し、文節や意味の切れ目で息継ぎをする場合は、その切れ目の前後では、前後の単語による音の変化は生じない。
以下の例文１を「When a family moved in」と「a different family came」の間に息継ぎを入れて発声した場合、「in」は後続の単語の影響を受けず「/in/」と発声する
（例文１）
When a family moved in, a different family came.
一方、以下の例文２において、「it was in a different way.」を、息継ぎをせず発声する場合は、「in」の音は後続の単語「a」の影響を受け「/in n/」のような発音となる。
（例文２）
If you slipped in, it was in a different way.
【０１０５】
分類部１３は、上記の処理を情報群格納部１２のすべてのリズムグループに対して行い、多数の発音エントリを取得する。
【０１０６】
次に、エントリ決定部１４は、具体例１と同様の処理により、単語情報と分類フラグごとに、単語情報と分類フラグとに対応する各発音情報の頻度を算出し、頻度が予め決められた条件を満たすほど高い発音情報を有する発音エントリを選択して、発音辞書１１に蓄積する。
【０１０７】
以上により、フランス語においても、単語の位置を考慮した発音エントリが格納された発音辞書が得られた。
【０１０８】
以上、本実施の形態によれば、多様な発音変化、特に単語の位置に依存して生起する発音変化に対応できる発音辞書を作成できる。そして、かかる発音辞書を用いて、音声認識を行えば、高い精度の音声認識結果が得られる。
【０１０９】
なお、本実施の形態によれば、図８に示すように、発音辞書作成装置１は、発音辞書１１、情報群格納部１２、分類部１３、エントリ決定部１４のみでも良い。
【０１１０】
また、上述したように、発音辞書作成装置１は、韓国語に限らず、フランス語、スペイン語、英語等の他の言語に対しても適用できる。
【０１１１】
また、本実施の形態において作成された発音辞書は、音声認識装置だけではなく、音声合成装置などの他の用途にも利用可能である。また、本実施の形態において作成された発音辞書は、外国語学習者用に電子辞書や教育ソフトにおいて発音情報を提示する際に用いることもできる。
【０１１２】
さらに、本実施の形態における処理は、ソフトウェアで実現しても良い。そして、このソフトウェアをソフトウェアダウンロード等により配布しても良い。また、このソフトウェアをＣＤ−ＲＯＭなどの記録媒体に記録して流布しても良い。なお、このことは、本明細書における他の実施の形態においても該当する。なお、本実施の形態における情報処理装置を実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、記録媒体に、一の言語の単語を示す単語情報、当該単語情報の単語情報群内における位置を特定する情報である分類フラグ、および当該単語の発音を示す発音情報を有する１以上の発音エントリを含む発音辞書と、１以上の単語情報を有する単語情報群と、前記１以上の各単語情報に対応する１以上の発音情報を有する発音情報群との組である情報群を１組以上、格納しており、コンピュータを、前記１組以上の情報群が有する１以上の単語情報群を、１以上の単語に分割し、単語の単語情報群内における位置を特定する分類フラグを決定し、当該分類フラグを前記単語情報に対応付ける分類部と、前記単語情報と前記分類フラグごとに、当該単語情報と当該分類フラグとに対応する各発音情報の頻度を算出し、頻度が予め決められた条件を満たすほど高い発音情報を有する発音エントリを選択して、前記発音辞書に蓄積するエントリ決定部として機能させるためのプログラム、である。
【０１１３】
また、上記プログラムにおいて、前記エントリ決定部は、前記分類フラグごとに、発音エントリを選択する条件である選択条件を格納している選択条件格納手段と、前記単語情報と前記分類フラグごとに、当該単語情報と当該分類フラグとに対応する各発音情報の頻度を算出する頻度算出手段と、前記分類フラグに対応する選択条件を前記選択条件格納手段から取得し、前記頻度算出手段が算出した頻度が前記取得した選択条件に合致するか判断する判断手段と、前記判断手段が選択条件に合致すると判断した発音情報を有する発音エントリを前記発音辞書に蓄積する発音エントリ蓄積手段とを具備するものとして、コンピュータを機能させることは好適である。
【０１１４】
また、上記プログラムにおいて、前記エントリ決定部が選択した１以上の発音エントリに対して、各発音エントリが有する単語情報の前記情報群格納部における出現頻度を算出し、出現頻度が所定の条件を満たすほど多い発音エントリのみを選択する発音エントリ選択部をさらに具備し、前記エントリ決定部は、前記発音エントリ選択部が選択した発音エントリのみを、前記発音辞書に蓄積するものとして、コンピュータを機能させることは好適である。
【０１１５】
また、図９は、本明細書で述べたプログラムを実行して、上述した種々の実施の形態の発音辞書作成装置を実現するコンピュータの外観を示す。上述の実施の形態は、コンピュータハードウェアおよびその上で実行されるコンピュータプログラムで実現され得る。図９は、このコンピュータシステム３００の概観図であり、図１０は、システム３００のブロック図である。
【０１１６】
図９において、コンピュータシステム３００は、ＦＤ（ＦｌｅｘｉｂｌｅＤｉｓｋ）ドライブ、ＣＤ−ＲＯＭ（ＣｏｍｐａｃｔＤｉｓｋＲｅａｄＯｎｌｙＭｅｍｏｒｙ）ドライブを含むコンピュータ３０１と、キーボード３０２と、マウス３０３と、モニタ３０４と、マイク３０５と、スピーカー３０６とを含む。
【０１１７】
図１０において、コンピュータ３０１は、ＦＤドライブ３０１１、ＣＤ−ＲＯＭドライブ３０１２に加えて、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）３０１３と、ＣＰＵ３０１３、ＣＤ−ＲＯＭドライブ３０１２およびＦＤドライブ３０１１に接続されたバス３０１４と、ブートアッププログラム等のプログラムを記憶するためのＲＯＭ（Ｒｅａｄ−ＯｎｌｙＭｅｍｏｒｙ）３０１５と、ＣＰＵ３０１３に接続され、アプリケーションプログラムの命令を一時的に記憶するとともに一時記憶空間を提供するためのＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）３０１６と、アプリケーションプログラム、システムプログラム、およびデータを記憶するためのハードディスク３０１７とを含む。ここでは、図示しないが、コンピュータ３０１は、さらに、ＬＡＮへの接続を提供するネットワークカードを含んでも良い。
【０１１８】
コンピュータシステム３００に、上述した実施の形態の発音辞書作成装置の機能を実行させるプログラムは、ＣＤ−ＲＯＭ３１０１、またはＦＤ３１０２に記憶されて、ＣＤ−ＲＯＭドライブ３０１２またはＦＤドライブ３０１１に挿入され、さらにハードディスク３０１７に転送されても良い。これに代えて、プログラムは、図示しないネットワークを介してコンピュータ３０１に送信され、ハードディスク３０１７に記憶されても良い。プログラムは実行の際にＲＡＭ３０１６にロードされる。プログラムは、ＣＤ−ＲＯＭ３１０１、ＦＤ３１０２またはネットワークから直接、ロードされても良い。
【０１１９】
プログラムは、コンピュータ３０１に、上述した実施の形態の発音辞書作成装置の機能を実行させるオペレーティングシステム（ＯＳ）、またはサードパーティープログラム等は、必ずしも含まなくても良い。プログラムは、制御された態様で適切な機能（モジュール）を呼び出し、所望の結果が得られるようにする命令の部分のみを含んでいれば良い。コンピュータシステム３００がどのように動作するかは周知であり、詳細な説明は省略する。
【０１２０】
また、上記プログラムを実行するコンピュータは、単数であってもよく、複数であってもよい。すなわち、集中処理を行ってもよく、あるいは分散処理を行ってもよい。
【０１２１】
また、上記各実施の形態において、各処理（各機能）は、単一の装置（システム）によって集中処理されることによって実現されてもよく、あるいは、複数の装置によって分散処理されることによって実現されてもよい。
【０１２２】
本発明は、以上の実施の形態に限定されることなく、種々の変更が可能であり、それらも本発明の範囲内に包含されるものであることは言うまでもない。
【産業上の利用可能性】
【０１２３】
以上のように、本発明にかかる発音辞書作成装置は、多様な発音変化、特に単語の位置に依存して生起する発音変化に対応できる発音辞書を作成できる、という効果を有し、発音辞書の生産装置等として有用である。
【符号の説明】
【０１２４】
１発音辞書作成装置
２音声認識装置
１１発音辞書
１２情報群格納部
１３分類部
１４エントリ決定部
１５発音エントリ選択部
６１音響モデル
６２言語モデル
６３音声受付部
６４音声認識部
６５認識結果出力部
１３１分割手段
１３２単語位置決定手段
１３３フラグ付与手段
１４１選択条件格納手段
１４２頻度算出手段
１４３判断手段
１４４発音エントリ蓄積手段

【特許請求の範囲】
【請求項１】
一の言語の単語を示す単語情報、当該単語情報の単語情報群内における位置を特定する情報である分類フラグ、および当該単語の発音を示す発音情報を有する１以上の発音エントリを格納し得る発音辞書と、
１以上の単語情報を有する単語情報群と、前記１以上の各単語情報に対応する１以上の発音情報を有する発音情報群との組である情報群を１組以上、格納し得る情報群格納部と、
前記１組以上の情報群が有する１以上の単語情報群を、１以上の単語に分割し、単語の単語情報群内における位置を特定する分類フラグを決定し、当該分類フラグを前記単語情報に対応付ける分類部と、
前記単語情報と前記分類フラグごとに、当該単語情報と当該分類フラグとに対応する各発音情報の頻度を算出し、頻度が予め決められた条件を満たすほど高い発音情報を有する発音エントリを選択して、前記発音辞書に蓄積するエントリ決定部とを具備する発音辞書作成装置。
【請求項２】
前記エントリ決定部は、
前記分類フラグごとに、発音エントリを選択する条件である選択条件を格納している選択条件格納手段と、
前記単語情報と前記分類フラグごとに、当該単語情報と当該分類フラグとに対応する各発音情報の頻度を算出する頻度算出手段と、
前記分類フラグに対応する選択条件を前記選択条件格納手段から取得し、前記頻度算出手段が算出した頻度が前記取得した選択条件に合致するか判断する判断手段と、
前記判断手段が選択条件に合致すると判断した発音情報を有する発音エントリを前記発音辞書に蓄積する発音エントリ蓄積手段とを具備する請求項１記載の発音辞書作成装置。
【請求項３】
前記エントリ決定部が選択した１以上の発音エントリに対して、各発音エントリが有する単語情報の前記情報群格納部における出現頻度を算出し、出現頻度が所定の条件を満たすほど多い発音エントリのみを選択する発音エントリ選択部をさらに具備し、
前記エントリ決定部は、
前記発音エントリ選択部が選択した発音エントリのみを、前記発音辞書に蓄積する請求項１または請求項２記載の発音辞書作成装置。
【請求項４】
前記一の言語は、韓国語であり、
前記単語情報群は、語節である請求項１から請求項３いずれか記載の発音辞書作成装置。
【請求項５】
記録媒体に、
一の言語の単語を示す単語情報、当該単語情報の単語情報群内における位置を特定する情報である分類フラグ、および当該単語の発音を示す発音情報を有する１以上の発音エントリを含む発音辞書と、
１以上の単語情報を有する単語情報群と、前記１以上の各単語情報に対応する１以上の発音情報を有する発音情報群との組である情報群を１組以上、格納しており、
分類部、およびエントリ決定部により実現される発音辞書の生産方法であって、
前記分類部が、前記１組以上の情報群が有する１以上の単語情報群を、１以上の単語に分割し、単語の単語情報群内における位置を特定する分類フラグを決定し、当該分類フラグを前記単語情報に対応付ける分類ステップと、
前記エントリ決定部が、前記単語情報と前記分類フラグごとに、当該単語情報と当該分類フラグとに対応する各発音情報の頻度を算出し、頻度が予め決められた条件を満たすほど高い発音情報を有する発音エントリを選択して、前記発音辞書に蓄積するエントリ決定ステップとを具備する発音辞書の生産方法。
【請求項６】
記録媒体に、
一の言語の単語を示す単語情報、当該単語情報の単語情報群内における位置を特定する情報である分類フラグ、および当該単語の発音を示す発音情報を有する１以上の発音エントリを含む発音辞書と、
１以上の単語情報を有する単語情報群と、前記１以上の各単語情報に対応する１以上の発音情報を有する発音情報群との組である情報群を１組以上、格納しており、
コンピュータを、
前記１組以上の情報群が有する１以上の単語情報群を、１以上の単語に分割し、単語の単語情報群内における位置を特定する分類フラグを決定し、当該分類フラグを前記単語情報に対応付ける分類部と、
前記単語情報と前記分類フラグごとに、当該単語情報と当該分類フラグとに対応する各発音情報の頻度を算出し、頻度が予め決められた条件を満たすほど高い発音情報を有する発音エントリを選択して、前記発音辞書に蓄積するエントリ決定部として機能させるためのプログラム。

【図１】