説明

文末記号補正装置、音声翻訳システム、文末記号補正方法、制御プログラム、及び該プログラムを記録したコンピュータ読み取り可能な記録媒体

【課題】文末記号の付されていないテキストデータに適切な文末記号を補う。
【解決手段】本発明の文末記号補正装置3は、形態素解析結果バッファ26に格納されている、テキストデータの語句の配列を示す形態素解析結果データと、形態素解析結果データと照合するための判定規則と文末記号とを対応付けた文末記号補正規則データ13とに基づいて上記テキストデータに文末記号を補う文末記号補正部11を備えているので、文末記号の付されていないテキストデータに適切な文末記号を補うことができる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声認識技術を利用した翻訳装置等に用いる文末記号補正装置、音声翻訳システム、文末記号補正方法、制御プログラム、及び該プログラムを記録したコンピュータ読み取り可能な記録媒体に関するものである。
【背景技術】
【0002】
従来から、音声入力された言語を他言語に翻訳する音声翻訳システムが用いられている。一般的な音声翻訳システムは、音声認識装置と翻訳装置とを備えており、音声認識装置が音声データをテキストデータに変換し、翻訳装置がこのテキストデータを解析して翻訳を行っている。
【0003】
音声を入力するだけでその音声が翻訳されるので、上記音声翻訳システムは、異言語間でのコミュニケーションツールとして非常に有用である。
【0004】
なお、本願発明に関連する先行技術文献としては、次の特許文献1、2がある。特許文献1には、音声により入力を行い翻訳結果を得る音声翻訳システムが記載されており、特許文献2には、ネットワークを介して音声翻訳を行う音声翻訳システムが記載されている。
【特許文献1】特開2005−149042号公報(2005年6月9日公開)
【特許文献2】特開2005−202884号公報(2005年7月28日公開)
【発明の開示】
【発明が解決しようとする課題】
【0005】
しかしながら、上記音声翻訳システムの音声認識装置は、入力された音声が平叙文であるか、疑問文であるか、あるいは感嘆文であるのか、等を判断することができないので、上記テキストデータに文末記号を付加することができない。
【0006】
したがって、上記翻訳装置は、文末記号が付加されていないテキストデータの翻訳を行うことになるので、上記従来の音声翻訳システムは、翻訳の精度が低いという問題があった。
【0007】
例えば、入力された音声が平叙文である場合に、文末に終止符が付加されていないテキストデータを翻訳すると、入力された音声の全体を文ではなく名詞句と解釈して翻訳してしまうことがある。
【0008】
また、例えば、『do you have a pen』というテキストデータを、文末に疑問符が付加されていない状態で翻訳する場合、上記音声翻訳装置は、上記テキストデータを疑問文であると認識することができない。従って、例えば、『あなたに役立つ、ペンを持つ』のような正しくない翻訳がなされてしまうことになる。
【0009】
上記特許文献1では、入力された音声をテキスト情報に変換するときに、文の区切り位置に終止符、疑問符、及び感嘆符といった区切り記号(文末記号)を補う技術が開示されている。具体的には、音声の入力時に文章の区切り位置毎にその区切り位置に補うべき区切り記号を音声入力している。
【0010】
しかしながら、文章の区切り位置毎に区切り記号を音声入力することは非常に手間がかかる作業であり、通常の会話の翻訳等に適用することが難しい。
【0011】
また、同特許文献1には、音声をテキストとした情報を解析することにより、区切り記号を補うか否かを自動的に判定することが示唆されているが、具体的にどのような解析を行って区切り記号を補うのかについては何ら言及されていない。
【0012】
上記特許文献2では、テキスト情報における文章の前後関係を解析することによって、文章の区切り位置を判定し、判定した区切り位置に文末記号を補う技術が開示されている。具体的には、「です」や「ます」の後に音声の空白があった場合に「です。」や「ます。」のように句点を補っている。
【0013】
しかしながら、「です」や「ます」のような文末を示す文章表現は、全ての言語にあるわけではない。例えば、英語では特に決まった文末表現は見られないので、特許文献2の技術を適用することは困難である。
【0014】
本発明は、上記の問題点に鑑みてなされたものであり、その目的は、文末記号の付されていないテキストデータに適切な文末記号を補う文末記号補正装置等を提供することにある。
【課題を解決するための手段】
【0015】
本発明に係る文末記号補正装置は、上記課題を解決するために、文末記号が付加されていないテキストデータに文末記号を補う文末記号補正装置であって、上記テキストデータにおける語句の配列と、該配列と照合するための判定規則と文末記号とを対応付けた文末記号補正規則とに基づいて上記テキストデータに文末記号を補う文末記号補正手段を備えていることを特徴としている。
【0016】
また、本発明に係る文末記号補正方法は、上記課題を解決するために、文末記号が付加されていないテキストデータに文末記号を補う文末記号補正装置による文末記号補正方法であって、上記文末記号補正装置の文末記号補正手段が、上記テキストデータにおける語句の配列と、該配列と照合するための判定規則と文末記号とを対応付けた文末記号補正規則とに基づいて上記テキストデータに文末記号を補うステップを含むことを特徴としている。
【0017】
文章が、ある特定の語句の配列を有している場合、その文章の文末記号を推定することができる。例えば、英語において、『What a/an 〔名詞句〕』のような語句の配列を有する文章は感嘆文であると推定することができ、文末記号は『!』であると推定することができる。
【0018】
本発明では、このような特定の語句の配列を判定規則とし、該判定規則とその文末記号とを対応付けて文末記号補正規則としている。
【0019】
したがって、テキストデータにおける語句の配列と上記判定規則とを照合することで、そのテキストデータに補うべき文末記号を決定することができる。すなわち、テキストデータにおける語句の配列と、上記文末記号補正規則とに基づいて上記テキストデータに適切な文末記号を補うことができる。
【0020】
また、本発明に係る文末記号補正装置では、上記文末記号は、感嘆符、疑問符、及び終止符の少なくとも1つであることが好ましい。
【0021】
文末記号には様々なものがあるが、一般的に使用頻度が高い文末記号は感嘆符、疑問符、及び終止符の3種類であるから、テキストデータに補うべき文末記号は感嘆符、疑問符、及び終止符の3種類から選択することができるケースが多い。
【0022】
したがって、文末記号補正手段が補う文末記号を、感嘆符、疑問符、及び終止符の少なくとも1つとしておけば、多くの場合、適切な文末記号を補うことができる。
【0023】
また、本発明に係る文末記号補正装置では、上記文末記号補正手段は、上記テキストデータを発音したときの抑揚を検出した抑揚検出結果に基づいて文末記号を補うことが好ましい。
【0024】
テキストデータを発音したときの抑揚と文末記号とは密接な関係があるので、抑揚検出結果に基づいて文末記号を補うことによって、より正確な文末記号補正が可能となる。特に、会話等においては、平叙文の末尾のイントネーションを上げることで疑問の意思を表現するケースがある。このような場合に、抑揚検出結果に基づいて文末記号を補うことで、話し手の意図を汲み取った適切な文末記号を補うことが可能となる。
【0025】
また、本発明に係る音声翻訳システムは、上記課題を解決するために、第1の言語の音声を第1の言語のテキストデータに変換する音声認識装置と、上記テキストデータに文末記号を補う上記文末記号補正装置と、文末記号補正装置が文末記号を補ったテキストデータを第2の言語に翻訳する翻訳装置とを備えていることを特徴としている。
【0026】
上記の構成によれば、音声認識装置は第1の言語の音声をテキストデータに変換し、文末記号補正装置は、上記テキストデータにおける語句の配列に基づいて上記テキストデータに適切な文末記号を補う。そして、翻訳装置は文末記号が補われた上記テキストデータを翻訳する。
【0027】
翻訳装置は文末記号が補われたテキストデータを翻訳するので、文末記号が補われていないテキストデータを翻訳する場合と比べて、より正確な翻訳を行うことができる。
【0028】
なお、上記文末記号補正装置は、コンピュータによって実現してもよく、この場合にはコンピュータを文末記号補正手段として動作させることにより上記文末記号補正装置をコンピュータにて実現させる制御プログラム、およびそれを記録したコンピュータ読み取り可能な記録媒体も本発明の範疇に入る。
【発明の効果】
【0029】
本発明に係る文末記号補正装置は、以上のように、上記テキストデータにおける語句の配列と、該配列と照合するための判定規則と文末記号とを対応付けた文末記号補正規則とに基づいて上記テキストデータに文末記号を補う文末記号補正手段を備えている。
【0030】
また、本発明に係る文末記号補正方法は、以上のように、文末記号補正装置の文末記号補正手段が、上記テキストデータにおける語句の配列と、該配列と照合するための判定規則と文末記号とを対応付けた文末記号補正規則とに基づいて上記テキストデータに文末記号を補うステップを含む。
【0031】
したがって、文末記号の付されていないテキストデータに適切な文末記号を補うことができるという効果を奏する。
【発明を実施するための最良の形態】
【0032】
〔実施形態1〕
本発明の一実施形態について図1ないし図10に基づいて説明すると以下の通りである。本実施形態の音声翻訳システム1の概要について、図1に基づいて説明する。図1は、音声翻訳システム1の要部構成を示すブロック図である。音声翻訳システム1は、図示のように、音声認識装置2、文末記号補正装置3、翻訳装置4、及び制御装置5を備えている。
【0033】
なお、本実施形態では、音声翻訳システム1が英語の音声の入力を受け付け、入力された英語の音声に対応する日本語訳を出力する例を説明するが、本発明は、その他の言語にも同様に適用できる。
【0034】
本実施形態の音声翻訳システム1では、音声認識装置2は英語の音声をテキストデータに変換し、翻訳装置4は上記テキストデータを解析して該テキストデータにおける語句の配列を得る。そして、文末記号補正装置3は、翻訳装置4が得た語句の配列に基づいて上記テキストデータに適切な文末記号を補う。そして、制御装置5は、音声翻訳システム1を構成する各装置間のデータ送受信の制御、及び結果の出力等を行う構成である。
【0035】
音声翻訳システム1では、翻訳装置4が、文末記号が補われたテキストデータを翻訳するので、入力された音声が正確に翻訳されることになる。以下、音声翻訳システム1を構成する各装置について説明する。
【0036】
音声認識装置2は、図示のように、音声入力部6、音声認識部7、音声認識装置記憶部8、及び音声バッファ10を備えている。また、音声認識装置記憶部8は音声認識規則データ9を格納している。
【0037】
音声入力部6は、入力された音声を音声データに変換し、音声バッファ10に格納する。音声入力部6としては、例えばマイクロフォン等を適用することができる。音声認識部7は、音声認識規則データ9に基づいて音声バッファ10に格納されている音声データを解析し、上記音声データをテキストデータに変換する。
【0038】
テキストデータとは、音声データを文字で表したデータである。また、音声認識規則データ9とは、音声データとテキストデータとの関係を示すパターンデータ等の、音声データをテキストデータに変換するための規則を指す。音声認識部7は、このようにして得られたテキストデータを制御装置5に送出する。
【0039】
翻訳装置4は、図示のように、形態素解析部15、翻訳部16、及び翻訳装置記憶部17を備えており、翻訳装置記憶部17には、形態素解析規則データ18、辞書データ19、及び翻訳規則データ20が格納されている。
【0040】
形態素解析部15は、音声認識部7が生成したテキストデータを解析し、該テキストデータにおける語句の配列を調べる形態素解析を行う。具体的には、形態素解析部15は、形態素解析規則データ18に基づいて上記テキストデータを単語に切り分ける。そして、形態素解析部15は、切り分けた各単語について、辞書データ19を参照して品詞、文法情報、及び意味情報等を対応付けする。なお、辞書データ19には、単語と、その単語の品詞、文法情報、及び意味情報等とが対応付けられている。また、文法情報とは、例えば単語の変化形等に関するデータであり、意味情報とは、単語の持つ意味に関するデータである。
【0041】
このように、テキストデータを単語に切り分け、切り分けた各単語に品詞、文法情報、及び意味情報等を対応付けしたデータが形態素解析結果データである。形態素解析部15は、このようにして得られた形態素解析結果データを制御装置5に送出する。
【0042】
本実施形態の翻訳装置4は、英文を和文に翻訳することを想定しているので、形態素解析部15では各単語を、名詞、代名詞、定冠詞、不定冠詞、限定詞、形容詞、等位接続詞、動詞、助動詞、BE動詞、前置詞の11種類の品詞に分類する。なお、品詞の分類は、この例に限られない。ここで分類した品詞に基づいて後述する文末記号補正処理及び翻訳処理を行うので、これらの処理に合わせて適当な品詞に分類すれば良い。
【0043】
翻訳部16は、文末記号補正装置3が上記形態素解析結果データに文末記号を補ったデータ、すなわち文末記号補正結果データに基づいて翻訳を行い、翻訳結果を示す翻訳結果データを制御装置5に送出する。なお、通常の翻訳装置は、形態素解析結果データをそのまま用いて翻訳を行う。これに対して、本実施形態の翻訳部16は、文末記号補正結果データを用いて翻訳を行うので、翻訳部16は、より正確な翻訳を行うことができる。
【0044】
文末記号補正装置3は、図示のように、文末記号補正部(文末記号補正手段)11及び文末記号補正装置記憶部12を備えており、文末記号補正装置記憶部12には、文末記号補正規則データ(文末記号補正規則)13及び補助規則データ14が格納されている。
【0045】
文末記号補正部11は、上記形態素解析結果データ、文末記号補正規則データ13、及び補助規則データ14に基づいて、上記形態素解析結果データに文末記号を補う文末記号補正処理を行い、文末記号補正結果データを得る。上述のように、形態素解析結果データはテキストデータを単語に切り分け、切り分けた各単語に品詞、文法情報、及び意味情報等を対応付けしたデータであるから、文末記号補正結果データはこのデータにさらに文末記号が補われたデータとなる。
【0046】
そして、文末記号補正部11は、上記文末記号補正結果データを制御装置5に送出する。文末記号補正結果データは、翻訳装置4で翻訳されることになる。なお、文末記号補正装置3の各構成、及び文末記号補正処理の詳細については後述する。
【0047】
本実施形態では、文末記号補正部11が形態素解析結果データに文末記号を補う例を説明するが文末記号を補う対象は形態素解析結果データに限定されない。例えば、文末記号補正結果データを機械翻訳に供する必要がないような場合は、音声認識部7による音声認識結果に文末記号を補うようにしても良い。この場合、文末記号補正結果データは、テキストデータの文末に文末記号が付加されたデータとなる。
【0048】
ただし、本実施形態のように、文末記号補正結果データを機械翻訳するような場合には、翻訳の過程で形態素解析を行う必要が生じる。ここで、形態素解析結果データに文末記号を補う場合、文末記号補正結果データは、すでに形態素解析がなされたデータであるから、このデータをそのまま翻訳装置4で翻訳することができるので、文末記号補正部11は、形態素解析結果データに文末記号を補うことが好ましい。
【0049】
制御装置5は、図示のように、制御部21、制御装置記憶部22、入力部23、及び出力部24を備えている。そして、制御装置記憶部22は、音声認識部7が生成したテキストデータを格納する音声認識結果バッファ25、形態素解析部15が生成した形態素解析結果データを格納する形態素解析結果バッファ26、文末記号補正部11が生成した文末記号補正結果データを格納する文末記号補正結果バッファ27、及び翻訳部16が生成した翻訳結果データを格納する翻訳結果バッファ28を備えている。
【0050】
制御部21は、制御装置5と、音声認識装置2、文末記号補正装置3、及び翻訳装置4との間で行われるデータの送受信を制御する。具体的には、音声認識部7から受け取ったテキストデータを、音声認識結果バッファ25に格納すると共に、形態素解析部15に渡す。また、形態素解析部15から受け取った形態素解析結果データを、形態素解析結果バッファ26に格納すると共に、文末記号補正部11に渡す。そして、文末記号補正部11から受け取った文末記号補正結果データを、文末記号補正結果バッファ27に格納すると共に、翻訳部16に渡す。最後に、翻訳部16から受け取った翻訳結果データを翻訳結果バッファ28に格納する。
【0051】
また、制御部21は出力部24の出力を制御する。具体的には、音声認識結果バッファ25や、文末記号補正結果バッファ27、及び翻訳結果バッファ28に格納されている各種結果を出力部24に送って出力させる。
【0052】
入力部23は、音声翻訳システム1のユーザが操作するための図示しない入力デバイスを備え、該入力デバイスに入力された入力データを制御部21に送出する。入力データとは、制御部21を動作させるためのデータである。すなわち、制御部21における動作は、入力部23からの入力指示によって実行させることもできる。例えば、制御装置記憶部22に格納されている各種結果を編集したり、出力部24に出力させたりすることができる。上記入力デバイスとしては、入力データを入力することができるものであれば良く、例えば、キーボードやタッチパネル、入力キー等で構成することができ、また、ネットワークや記録媒体から入力データを入力するように構成しても良い。
【0053】
出力部24は、制御装置記憶部22に格納されている各種結果を出力する。具体的には、出力部24は図示しない表示部を備え、制御部21の指示に従って制御装置記憶部22から各種結果を読み出し、上記表示部に表示する。表示部としては、液晶表示パネル等を適用することができる。
【0054】
なお、出力部24は、各種結果を音声翻訳システム1のユーザが認識できるような形態で出力するものであれば良く、上述の例に限られない。例えば、出力部24がスピーカ等の音声出力手段、及びデータを音声に変換するモデム等を備え、各種結果を音声にて出力する形態としても良い。
【0055】
以下、本実施形態の音声翻訳システム1における音声翻訳処理について、図2に基づいて説明する。図2は、音声翻訳処理の流れを示すフローチャートである。
【0056】
まず、音声入力部6に音声が入力されると、音声入力部6は、入力された音声を音声データとして音声バッファ10に格納する(S1)。
【0057】
次に、音声認識部7は、音声バッファ10に格納されている音声データの音声認識を行う。具体的には、音声認識部7は、音声認識規則データ9に基づいて音声データを変換し、テキストデータを生成する(S2)。なお、音声認識部7は、入力された音声が疑問文であるか、感嘆文であるか、平叙文であるか、等を判定することができないので、S2で生成されるテキストデータには、感嘆符、疑問符、終止符等の文末記号が付加されていない。
【0058】
そして、音声認識部7は、生成したテキストデータを制御装置5に送出する。制御装置5の制御部21は、上記テキストデータを音声認識結果バッファ25に格納すると共に、出力部24に上記テキストデータを出力させる(S3)。
【0059】
上述のように、出力部24は、上記テキストデータを表示部に表示するので、音声翻訳システム1のユーザは、音声入力部6に入力された音声が正確に音声認識されたか否かを確認することができる。そして、音声翻訳システム1のユーザは、入力部23を介して音声認識結果データ、すなわちテキストデータの編集を行うことができるので、例えば出力部24の表示結果から、音声認識が正確に行われていないことがわかった場合に、音声認識結果データを修正することができる。
【0060】
本実施形態では、音声認識部7から送られるテキストデータを表示部に表示する態様を示しているが、音声が正確に音声認識されたか否かを確認する必要がない場合には、上記テキストデータを表示しない構成としても良い。この場合、S3を省略することができるので、制御部21が行う処理を簡略化することができる。
【0061】
しかしながら、上記テキストデータを表示する場合、音声翻訳システム1のユーザは、入力された音声が正確に音声認識されたか否かを確認することができるので、上記テキストデータを表示することが好ましい。
【0062】
続いて、制御部21は、音声認識結果バッファ25に格納されている上記テキストデータを翻訳装置4の形態素解析部15に送出する。上記テキストデータを受け取った形態素解析部15は、該テキストデータの形態素解析を行う(S4)。そして、形態素解析部15は、形態素解析の結果を制御装置5に送出する。制御装置5の制御部21は、上記形態素解析結果データを形態素解析結果バッファ26に格納する。
【0063】
次に、制御部21は、形態素解析結果バッファ26に格納されている上記形態素解析結果データを文末記号補正装置3の文末記号補正部11に送出する。形態素解析結果データを受け取った文末記号補正部11は、文末記号補正判定を行う(S5)。S5の文末記号補正判定の詳細については後述する。
【0064】
続いて、文末記号補正部11は、S5の文末記号補正判定の結果が、「感嘆符」、「疑問符」、及び「終止符」の何れであるかを確認する(S6)。「疑問符」であった場合、上記形態素解析結果データの文末に疑問符を補い(S7)、「感嘆符」であった場合、形態素解析結果データの文末に感嘆符を補い(S8)、「終止符」であった場合、形態素解析結果データの文末に終止符を補う(S9)。文末記号補正部11は、このようにして文末記号補正結果データを得る。
【0065】
そして、文末記号補正部11は、上記文末記号補正結果データを制御装置5に送出する。制御装置5の制御部21は、上記文末記号補正結果データを文末記号補正結果バッファ27に格納すると共に、出力部24に上記文末記号補正結果データを出力させる(S10)。
【0066】
上述のように、出力部24は、上記文末記号補正結果データを表示部に表示するので、音声翻訳システム1のユーザは、適切な文末記号が補われているか否かを確認することができる。なお、S3と同様にS10を省略してもよい。
【0067】
次に、制御部21は、文末記号補正結果バッファ27に格納されている上記文末記号補正結果データを翻訳装置4の翻訳部16に送出する。上記文末記号補正結果データを受け取った翻訳部16は、該文末記号補正結果データに基づいて翻訳を行う(S11)。
【0068】
続いて、翻訳部16は、S11で得られた翻訳結果データを制御装置5に送出する。制御装置5の制御部21は、上記翻訳結果データを翻訳結果バッファ28に格納すると共に、出力部24に上記翻訳結果データを出力させる(S12)。
【0069】
以上のように、本実施形態の音声翻訳処理では、S1〜S2の音声認識処理によって生成されたテキストデータがS4で形態素解析され、S5〜S9の文末記号補正処理によって上記形態素解析結果データに文末記号が補われる。そして、S11では文末記号が補われた文末記号補正結果データに基づいて翻訳が行われるので、正確な翻訳を行うことができる。
【0070】
次に、S5の文末記号補正判定の詳細について、図3〜図5に基づいて説明する。図3は、文末記号補正規則データの一例を示す図であり、図4は、文末記号補正規則データのための補助規則データの一例を示す図であり、図5は、文末記号補正判定の流れを示すフローチャートである。
【0071】
文末記号補正部11は、図3に示す文末記号補正規則データに基づいて、上記形態素解析結果データの文末に補う文末記号を決定する。文末記号補正規則データでは、図示のように、判定規則番号♯1〜♯8と、各判定規則番号に対応する判定規則と、処理法とが対応付けられている。
【0072】
判定規則番号は、判定規則及び処理法を特定するための番号である。そして、判定規則は語句の配列の類型を示し、処理法はその類型に対応する文末記号を示している。したがって、判定規則欄に示されている語句の配列に、文末記号補正対象となるデータ(この場合、形態素解析結果データ)における語句の配列が当てはまる場合、その判定規則欄に対応する処理法欄の文末記号を補えば良い。
【0073】
文末記号補正部11は、上記形態素解析結果データと、文末記号補正規則データとに基づいて文末記号を決定する。具体的には、文末記号補正部11は、上記形態素解析結果データに、図3に示す判定規則を判定規則番号♯1から順番に当てはめてゆく。そして、文末記号補正部11は、判定規則を満たしたときの判定規則番号に対応する処理法欄を判定結果とする。なお、この判定結果に基づいて、図2のS6以下の処理が行われる。
【0074】
ここで、図3には、例えば、「名詞句」、「形容詞句」等の、形態素解析部15で分類される品詞以外の文法要素が記載されている。このような文法要素、いわゆる非終端要素は、図4に示す補助規則データによって決定することができる。補助規則データでは、図示のように、補助規則番号♯1〜♯3と、要素の名称と、定義とが対応付けられている。
【0075】
補助規則番号は、要素の名称及び定義を特定するための番号である。そして、要素名称は上記非終端要素の名称を示し、定義は該非終端要素の定義を示している。文末記号補正部11は、形態素解析結果データにおける語句の配列と上記定義とを照合し、この定義を満たす場合、上記形態素解析結果データは、該定義に対応する名称の非終端要素を含んでいると判断する。
【0076】
なお、図4の補助規則番号♯1では、非終端要素の『名詞句』の定義欄に、非終端要素『基礎名詞句』を含んでいる。このような場合、文末記号補正部11は、補助規則データの要素名称欄を検索し、『基礎名詞句』の定義を読み出す。そして、文末記号補正部11は、形態素解析結果データにおける語句の配列と『基礎名詞句』の定義とを照合して該形態素解析結果データに基礎名詞句が含まれるか否かを判断する。
【0077】
文末記号補正部11は、形態素解析結果データを上記文末記号補正規則データに当てはめてゆく過程で、文末記号補正規則データ中に非終端要素が出てきた場合に、上記補助規則データを参照して上記形態素解析結果データに含まれる非終端要素の有無を確認する。
【0078】
例えば、判定規則番号♯1の判定規則は、図3に示すように、「What」のあとに「a」または「an」が続き、その後に名詞句が続くという規則である。
【0079】
ここで、文末記号補正部11は、形態素解析結果データにおいて、「What」のあとに「a」または「an」が続いたことを確認すると、補助規則データを参照して、上記形態素解析結果データにおける「What a/an」に続く単語列に名詞句が含まれているか否かを確認する。
【0080】
なお、本実施形態では図4に示す補助規則データを用いて非終端要素を検出する例を示したが、公知の構文解析手段を用いて非終端要素を検出しても良い。
【0081】
続いて、文末記号補正部11による文末記号補正判定の流れを図5のフローチャートに基づいて説明する。まず、文末記号補正部11は、判定規則番号♯iに1を代入する(S20)。
【0082】
次に、文末記号補正部11は、判定規則番号♯iに対応する判定規則と、形態素解析結果データとを照合する(S21)。なお、照合の際に、判定規則に名詞句、形容詞句等の非終端要素があれば、文末記号補正部11は、図4に示す補助規則データを参照して照合を行う。
【0083】
そして、文末記号補正部11は、S21における照合結果が適合しているか否かを確認する(S22)。照合結果が適合していない場合、♯iに1を加えてS21に戻る(S23)。一方、照合結果が適合している場合、適合した判定規則の処理法欄に記載されている文末記号を判定結果とする(S24)。
【0084】
以上説明した文末記号補正判定によって、上記テキストデータに補う文末記号を決定することができる。なお、上述の例では、図3に示した♯1〜♯8の判定規則データを順番に照合し、合致する判定が見つかった段階で照合を打ち切る形態を示したがこの例に限られない。例えば、適合する判定規則が見つかっても更に照合を続け、その結果、適合する判定規則が複数通りになった場合に備え、適用する処理法を1つに絞る方法を予め定めておくようにしても良い。
【0085】
例えば、各判定規則に予め重み付けをしておき、適合した判定規則の重みを処理法ごとに合計して得られるスコアを判定に用いる方法が挙げられる。具体的には、図3において判定規則♯1(処理法:感嘆符を補う)、♯2(処理法:感嘆符を補う)、♯6(処理法:疑問符を補う)の3つの判定規則が適合した場合に、判定規則♯1、♯2、♯6の重みがそれぞれ1、2、4であったとすると、感嘆符を補う処理法のスコアは3となり、疑問符を補う処理法のスコアは4となる。そしてよりスコアの大きい処理法は疑問符を補う処理であるから、これを処理法として決定すれば良い。
【0086】
また、処理法を決定する別の例として、適合した各判定規則の処理法のうち最も多いものを処理法として決定する方法が挙げられる。例えば、図3において判定規則♯1(処理法:感嘆符を補う)、♯2(処理法:感嘆符を補う)、♯6(処理法:疑問符を補う)の3つの判定規則が適合した場合に、最も多い処理法は感嘆符を補う処理であるから、これを処理法として決定すれば良い。
【0087】
以下、本実施形態の音声翻訳システム1の具体的な動作例として、音声入力部6に『Do you have a pen?』との音声が入力された場合について説明する。
【0088】
音声入力部6は入力された音声を音声データに変換し、音声認識部7は該音声データに基づいてテキストデータを生成して制御装置5に送出する。そして、制御装置5の制御部21は、上記テキストデータを形態素解析部15に送ると共に、出力部24に出力させる。
【0089】
図6は、出力部24が表示部に上記テキストデータを表示させた場合の表示例を示す図である。図示のように、入力された『Do you have a pen?』との音声が、文末記号のない『do you have a pen』とのテキストデータに変換されて表示されている。
【0090】
そして、形態素解析部15は、このテキストデータの形態素解析を行う。図7は、形態素解析結果データの例を示す図である。図示のように、『do you have a pen』とのテキストデータが、単語ごとに分割されて、文頭から順に単語番号が付加されると共に、各単語に品詞、文法情報、及び意味情報が付加される。
【0091】
具体的には、形態素解析部15は、形態素解析規則データ18及び辞書データ19を読み出し、これらのデータに基づいて、「do」は助動詞、「you」は代名詞、「have」は動詞の原形、というように各単語の品詞、文法情報、及び意味情報を決定する。
【0092】
続いて、文末記号補正部11は、上記形態素解析結果データと、図3に示した文末記号補正規則データとを照合する。上記テキストデータの文頭、すなわち単語番号♯1が付された単語は「do」であるから、図3に示す文末記号補正規則データの判定規則番号♯1から順に照合してゆくと、判定規則番号♯5が当てはまる。
【0093】
判定規則番号♯5では、「do」の次に「名詞句」が続くので、文末記号補正部11は、図4に示す補助規則データを参照する。補助規則番号♯1では、「名詞句」は〔基礎名詞句〕+(([前置詞または等位接続詞]+[基礎名詞句])の0回以上の繰り返し)と定義されている。また、補助規則番号♯3では、「基礎名詞句」は[0個または1個の定冠詞または不定冠詞または限定詞]+[0個または1個の形容詞]+[1個以上の名詞または代名詞]と定義されている。
【0094】
ここで、上記形態素解析結果データでは、単語番号♯1の「do」に続いて、単語番号♯2は、「you」である。「you」は代名詞であるから、上記「基礎名詞句」の条件を満たし、同時に「名詞句」の条件も満たす。したがって、単語番号♯1から単語番号♯2までが判定規則番号♯5の判定規則に合致することになる。
【0095】
続いて、単語番号♯3の「have」は、動詞の原形であるから、これも判定規則番号♯5の判定規則に合致する。判定規則番号♯5の判定規則では、「動詞の原形」以降は任意の要素が可能であるから、文末記号補正部11は、上記形態素解析結果データには、判定規則番号♯5が適合すると判定する。
【0096】
そして、文末記号補正部11は、図3に示した文末記号補正規則データを参照し、判定規則番号♯5に対応する処理法である、「文末に疑問符を補う」処理を実行する。そして、文末記号補正部11は、上記形態素解析結果データに文末記号「疑問符」を補った文末記号補正結果データを制御装置5に送出する。
【0097】
図8は、文末記号補正結果データの例を示す図である。図示のように、図7に示した形態素解析結果データに加えて、文末に「?」が補われている。
【0098】
また、図9は、出力部24による文末記号補正結果データの表示例を示す図である。図示のように、音声認識部7による認識結果として『do you have a pen』との文が表示されていると共に、文末記号が補われた『do you have a pen?』との文が表示されている。なお、ここでは、図8に示した文末記号補正結果データから、「単語」の項目のみを表示した例を示しているが、「単語」の項目に加えて「単語」以外の項目を表示しても良い。
【0099】
次に、制御装置5の制御部21は、上記文末記号補正結果データを翻訳部16に送り、翻訳部16は、図8に示した文末記号補正結果データを日本語に翻訳した翻訳データを得る。そして、翻訳部16は、上記翻訳結果データを制御装置5に送出し、制御装置5の制御部21は、該翻訳結果データを出力部24に出力させる。
【0100】
図10は、出力部24による翻訳結果データの表示例を示す図である。図示のように、図9に示した認識結果及び補正結果に加えて、翻訳結果として『あなたは、ペンを持っていますか?』との和文が表示されている。翻訳部16は、図8に示したような、文末記号が補われた形態素解析結果データに基づいて翻訳を行うので、より正しい翻訳を行うことができる。
〔実施形態2〕
次に、本発明の他の実施形態について、図11〜図14に基づいて説明する。図11は、本実施形態の音声翻訳システム1の要部構成を示すブロック図である。本実施形態の音声翻訳システム1では、音声認識装置2が補助的音声認識部30を備えている点が図1に示した音声翻訳システム1と相違している。また、文末記号補正部11が、補助的音声認識部30が音声の抑揚を検出した抑揚検出結果に基づいて文末記号を補正する点も音声翻訳システム1と相違している。なお、上記実施形態で説明した構成と同様の機能を有する構成には同一の符号を付して、その説明を省略する。
【0101】
補助的音声認識部30は、音声バッファ10に格納されている音声データの抑揚を認識し、該音声データの末尾におけるイントネーションが上がっているか否か、すなわち末尾上げか否かを判定する抑揚判定を行う。そして、補助的音声認識部30は、抑揚判定の結果である抑揚検出結果を制御装置5に送出する。
【0102】
制御装置5の制御部21は、上記抑揚検出結果を、音声認識部7が生成した音声認識結果データと対応付けて音声認識結果バッファ25に格納する。なお、補助的音声認識部30は、音声データが末尾上げか否かを判定できるものであれば良く、公知の音声認識技術を適用することができる。
【0103】
本実施形態の音声翻訳システム1では、上述のように、抑揚検出結果に基づいて文末記号を補正するので、音声翻訳システム1で取り扱われるデータの形式が実施形態1と異なる点がある。これについて、図12〜図13に基づいて説明する。
【0104】
図12は、本実施形態における音声認識結果データの一例を示す図である。図示のように、本実施形態の音声認識結果データは、音声認識されたテキストデータと末尾上げか否かを示すデータとが対応付けられたデータとなっている。図12の例では「○」「×」で末尾上げか否かを示しており、「末尾上げ」の欄が「○」となっているので、テキストデータ「Do you have a pen」は末尾上げであることがわかる。
【0105】
また、図13は、上記音声認識結果データを形態素解析することによって得られる形態素解析結果データの一例を示す図である。図示のように、本実施形態の形態素解析結果データは、形態素解析の結果と末尾上げか否かを示すデータとが対応付けられたデータとなっている。このデータを用いて文末記号補正処理を行うことにより、末尾上げか否かを考慮した文末記号補正判定を行うことができる。
【0106】
続いて、本実施形態の文末記号補正部11における文末記号補正判定について、図14に基づいて説明する。図14は、本実施形態における文末記号補正判定の流れを示すフローチャートである。
【0107】
S1〜S3にて、入力された音声が音声認識されて音声認識結果データが出力される。音声認識結果データは、音声認識結果バッファ25に格納される。なお、このとき格納される音声認識結果データは、例えば図12に示すようなデータである。ただし、この段階では、「末尾上げ」の欄はブランクになっている。
【0108】
続いて、補助的音声認識部30は、音声バッファ10に格納されている音声データの抑揚、すなわち、上記音声データが末尾上げか否かを判定する(S30)。そして、補助的音声認識部30は、音声データが末尾上げか否かを示す抑揚判定の結果、すなわち抑揚検出結果を制御装置5に送出する。制御装置5の制御部21は、抑揚検出結果をS2の音声認識結果データと対応付けて音声認識結果バッファ25に格納する(S31)。具体的には、制御部21は、図12における「末尾上げ」欄に末尾上げが「○」か「×」か、を書き込む。これにより、音声認識結果データに抑揚検出結果が含まれることになる。そして、制御部21は、抑揚検出結果を含む音声認識結果データを文末記号補正部11に送出する。
【0109】
抑揚検出結果を含む音声認識結果データは、形態素解析部15で形態素解析される(S4)。このときに形態素解析部15から出力されるデータは、抑揚検出結果を含むデータとなり、例えば図13のようなデータ形式となる。このデータは、形態素解析結果バッファ26に格納されると共に、文末記号補正部11に送出されて文末記号補正判定に供される(S5)。
【0110】
文末記号補正部11は、文末記号補正判定を行った後、形態素解析結果データにおける「末尾上げ」欄を参照し、抑揚検出結果が末尾上げか否かを判定する(S32)。末尾上げである場合、S7に進んで文末に疑問符を補う。一方、末尾上げではない場合、S5の文末記号補正判定結果に従って文末記号を補う(S6)。そして、S10で文末記号補正結果データが出力され、S11〜S12で文末記号補正結果データが翻訳処理される。
【0111】
本実施形態の音声翻訳システム1では、以上のように、文末記号補正部11が音声データの抑揚に基づいて文末記号の補正を行うので、より正確な文末記号補正が可能となる。特に、英語での会話時には、平叙文の末尾のイントネーションを上げることで疑問の意思を表現するケースがある。このような場合に、抑揚検出結果に基づいて文末記号を補うことで、話し手の意図を汲み取った適切な文末記号を補うことが可能となる。
【0112】
なお、本実施形態では、S5で文末記号補正判定を行った後、S32で抑揚検出結果の確認を行う態様を示したが、この例に限られない。例えば、S5の文末記号補正判定を行う前にS32の抑揚検出結果の確認を行うようにしても良い。この場合、抑揚検出結果が末尾上げであるときは、S5の文末記号補正判定を省略して文末に疑問符を補うことを決定することができるので、文末記号補正判定を簡略化することができる。
【0113】
本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
【0114】
例えば、音声翻訳システム1内の各装置を一体とすることもできるし、装置の各部をそれぞれ別体に構成することもできる。
【0115】
また、上記実施形態では、翻訳装置4の形態素解析部15が形態素解析を行った形態素解析結果データに基づいて、文末記号補正装置3の文末記号補正部11が文末記号補正処理を行う例を示したが、文末記号補正装置3が形態素解析を行う手段を備える構成や、翻訳装置4及び文末記号補正装置3の両方が形態素解析手段を備える構成とすることもできる。
【0116】
さらに、上記実施形態では、制御装置5が出力部24を備え、音声翻訳システム1を構成する各装置が得た各種結果を出力する構成を示したが、装置ごとに結果を出力しても良い。例えば、音声認識装置2は音声認識結果を出力し、文末記号補正装置3は文末記号補正結果を出力し、翻訳装置4は翻訳結果データを出力するようにしても良い。
【0117】
最後に、文末記号補正装置3の各ブロック、特に文末記号補正部11は、ハードウェアロジックによって構成してもよいし、次のようにCPUを用いてソフトウェアによって実現してもよい。
【0118】
すなわち、文末記号補正装置3は、各機能を実現する制御プログラムの命令を実行するCPU(central processing unit)、上記プログラムを格納したROM(read only memory)、上記プログラムを展開するRAM(random access memory)、上記プログラムおよび各種データを格納するメモリ等の記憶装置(記録媒体)などを備えている。そして、本発明の目的は、上述した機能を実現するソフトウェアである文末記号補正装置3の制御プログラムのプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)をコンピュータで読み取り可能に記録した記録媒体を、上記文末記号補正装置3に供給し、そのコンピュータ(またはCPUやMPU)が記録媒体に記録されているプログラムコードを読み出し実行することによっても、達成可能である。
【0119】
上記記録媒体としては、例えば、磁気テープやカセットテープ等のテープ系、フロッピー(登録商標)ディスク/ハードディスク等の磁気ディスクやCD−ROM/MO/MD/DVD/CD−R等の光ディスクを含むディスク系、ICカード(メモリカードを含む)/光カード等のカード系、あるいはマスクROM/EPROM/EEPROM/フラッシュROM等の半導体メモリ系などを用いることができる。
【0120】
また、文末記号補正装置3を通信ネットワークと接続可能に構成し、上記プログラムコードを通信ネットワークを介して供給してもよい。この通信ネットワークとしては、特に限定されず、例えば、インターネット、イントラネット、エキストラネット、LAN、ISDN、VAN、CATV通信網、仮想専用網(virtual private network)、電話回線網、移動体通信網、衛星通信網等が利用可能である。また、通信ネットワークを構成する伝送媒体としては、特に限定されず、例えば、IEEE1394、USB、電力線搬送、ケーブルTV回線、電話線、ADSL回線等の有線でも、IrDAやリモコンのような赤外線、Bluetooth(登録商標)、802.11無線、HDR、携帯電話網、衛星回線、地上波デジタル網等の無線でも利用可能である。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。
【産業上の利用可能性】
【0121】
本発明の文末記号補正装置は、文末記号の付加されていないテキストデータに文末記号を補うことができるので、音声データをテキストデータに変換する音声認識装置、翻訳専用機器、PDA(Personal Digital Assistance)や携帯電話等に付属する翻訳機器、及び翻訳プログラム等に適用できる。
【図面の簡単な説明】
【0122】
【図1】本発明の一実施形態を示すものであり、音声翻訳システムの要部構成を示すブロック図である。
【図2】上記音声翻訳システムにおける音声翻訳処理の流れを示すフローチャートである。
【図3】本発明の一実施形態を示すものであり、文末記号補正規則データの一例を示す図である。
【図4】本発明の一実施形態を示すものであり、上記文末記号補正規則データのための補助規則データの一例を示す図である。
【図5】本発明の一実施形態を示すものであり、文末記号補正判定の流れを示すフローチャートである。
【図6】音声認識結果の表示例を示す図である。
【図7】形態素解析結果の例を示す図である。
【図8】文末記号補正結果の例を示す図である。
【図9】文末記号補正結果の表示例を示す図である。
【図10】翻訳結果の表示例を示す図である。
【図11】本発明の他の実施形態の音声翻訳システムの要部構成を示すブロック図である。
【図12】本発明の一実施形態を示すものであり、抑揚検出結果を含む音声認識結果データの一例を示す図である。
【図13】本発明の一実施形態を示すものであり、抑揚検出結果を含む形態素解析結果データの一例を示す図である。
【図14】上記音声翻訳システムにおける音声翻訳処理の流れを示すフローチャートである。
【符号の説明】
【0123】
1 音声翻訳システム
2 音声認識装置
3 文末記号補正装置
4 翻訳装置
5 制御装置
6 音声入力部
7 音声認識部
8 音声認識装置記憶部
9 音声認識規則データ
10 音声バッファ
11 文末記号補正部(文末記号補正手段)
12 文末記号補正装置記憶部
13 文末記号補正規則データ(文末記号補正規則)
14 補助規則データ
15 形態素解析部
16 翻訳部
17 翻訳装置記憶部
18 形態素解析規則データ
19 辞書データ
20 翻訳規則データ
21 制御部
22 制御装置記憶部
23 入力部
24 出力部
25 音声認識結果バッファ
26 形態素解析結果バッファ
27 文末記号補正結果バッファ
28 翻訳結果バッファ
30 補助的音声認識部

【特許請求の範囲】
【請求項1】
文末記号が付加されていないテキストデータに文末記号を補う文末記号補正装置であって、
上記テキストデータにおける語句の配列と、該配列と照合するための判定規則と文末記号とを対応付けた文末記号補正規則とに基づいて上記テキストデータに文末記号を補う文末記号補正手段を備えていることを特徴とする文末記号補正装置。
【請求項2】
上記文末記号は、感嘆符、疑問符、及び終止符の少なくとも1つであることを特徴とする請求項1に記載の文末記号補正装置。
【請求項3】
上記文末記号補正手段は、上記テキストデータを発音したときの抑揚を検出した抑揚検出結果に基づいて文末記号を決定することを特徴とする請求項1または2に記載の文末記号補正装置。
【請求項4】
第1の言語の音声を第1の言語のテキストデータに変換する音声認識装置と、
上記テキストデータに文末記号を補う請求項1ないし3の何れか1項に記載の文末記号補正装置と、
上記文末記号補正装置が文末記号を補ったテキストデータを第2の言語に翻訳する翻訳装置とを備えていることを特徴とする音声翻訳システム。
【請求項5】
文末記号が付加されていないテキストデータに文末記号を補う文末記号補正装置による文末記号補正方法であって、
上記文末記号補正装置の文末記号補正手段が、上記テキストデータにおける語句の配列と、該配列と照合するための判定規則と文末記号とを対応付けた文末記号補正規則とに基づいて上記テキストデータに文末記号を補うステップを含むことを特徴とする文末記号補正方法。
【請求項6】
請求項1ないし3の何れか1項に記載の文末記号補正装置の文末記号補正手段としてコンピュータを機能させる文末記号補正装置の制御プログラム。
【請求項7】
請求項6に記載の制御プログラムを記録したコンピュータ読み取り可能な記録媒体。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate