説明

音声翻訳装置および方法

【課題】翻訳したい発話内容に目的言語の固有名詞が含まれる場合であっても、当該発話内容を音声入力する必要のある利用者の負担を軽減させることができる音声翻訳装置おび方法を提供する。
【解決手段】固有名詞抽出部は、文書から目的言語の固有名詞と意味クラスを抽出して検索情報記憶部に記憶させ、入力受付部は、原言語の音声発話の入力を受け付け、認識部は、受け付けられた音声発話を認識して文字列を生成し、一般名詞抽出部は、生成された文字列から一般名詞と意味クラスを抽出し、検索部は、抽出された一般名詞が属する意味クラスに属する固有名詞を検索情報記憶部から検索し、表示制御部は、検索された固有名詞を表示させ、選択受付部は、翻訳に用いる固有名詞の選択を受け付け、翻訳部は、生成された原言語の文字列を、翻訳に用いる固有名詞を用いて目的言語に翻訳し、出力制御部は、翻訳結果を出力させる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声翻訳装置および方法に関する。
【背景技術】
【0002】
近年、文化や経済のグローバル化に伴い、異なる言語を母語とする人同士のコミュニケーションの機会が増加している。このため、自然言語処理技術、音声認識処理技術、機械翻訳技術などを採用し、音声入力された翻訳の元となる原言語(例えば日本語)の入力文を翻訳後の言語である目的言語(例えば中国語)に変換して出力することが可能な音声翻訳装置への期待が高まっている。
【0003】
ところで、このような音声翻訳装置の利用者は、一般的に目的言語を発話することができない。従って、翻訳したい発話内容に地名・人名などの目的言語の固有名詞が含まれる場合、当該固有名詞を音声入力することができず、翻訳することができないという事態が生じ得る。
【0004】
このため、例えば特許文献1に開示された翻訳装置では、原言語の一般名詞に属する固有名詞リストを予め記憶媒体に記憶させておき、利用者に、目的言語の固有名詞に代えて、当該固有名詞が属する原言語の一般名詞が含まれる入力文を入力させている。そして、この翻訳装置では、記憶媒体に記憶されている固有名詞リストの中から、入力された一般名詞に属する目的言語の固有名詞を出力装置に表示させ、表示された固有名詞の中から利用者に選択された固有名詞を用いて、原言語の入力文を目的言語に翻訳して出力している。
【0005】
このような手法により、特許文献1に開示された翻訳装置では、目的言語の固有名詞の入力を行わずに、当該目的言語の固有名詞を用いた翻訳を実現している。
【0006】
【特許文献1】特開平8−314939号公報
【発明の開示】
【発明が解決しようとする課題】
【0007】
しかしながら、特許文献1に開示された翻訳装置では、利用者から入力された一般名詞に属する目的言語の固有名詞の検索に、予め記憶媒体に記憶された固有名詞リスト(例えば、ニューヨークのホテルのリストなど)を用いているため、利用者に関係のない情報が大量に表示されてしまうおそれがある。このため、利用者は大量に表示された固有名詞の中から目的の固有名詞を探さなければならず、翻訳にかかる利用者の負担が大きくなってしまうという問題がある。
【0008】
本発明は、上記事情に鑑みてなされたものであり、翻訳したい発話内容に目的言語の固有名詞が含まれる場合であっても、当該発話内容を音声入力する必要のある利用者の負担を軽減させることができる音声翻訳装置おび方法を提供することを目的とする。
【課題を解決するための手段】
【0009】
上述した課題を解決し、目的を達成するために、本発明の一態様にかかる音声翻訳装置は、原言語による音声発話を目的言語に翻訳する音声翻訳装置であって、文書に対して形態素解析と意味クラス解析とを行って、目的言語の固有名詞と当該固有名詞が属する意味クラスとを抽出する固有名詞抽出部と、前記固有名詞と前記固有名詞が属する意味クラスとを対応付けて記憶する記憶部と、原言語による音声発話の入力を受け付ける入力受付部と、前記音声発話を認識し、文字列を生成する認識部と、前記文字列に対して形態素解析と意味クラス解析とを行って、一般名詞と当該一般名詞が属する意味クラスとを抽出する一般名詞抽出部と、前記一般名詞が属する意味クラスに属する固有名詞を前記記憶部から検索する検索部と、検索された前記固有名詞を表示部に表示させる表示制御部と、表示された前記固有名詞の中から、翻訳に用いる固有名詞の選択を受け付ける選択受付部と、前記一般名詞を含む原言語の前記文字列を、前記翻訳に用いる固有名詞を用いて目的言語に翻訳する翻訳部と、前記翻訳部の翻訳結果を出力部に出力させる出力制御部と、を備えることを特徴とする。
【0010】
また、本発明の別の態様にかかる音声翻訳方法は、原言語による音声発話を目的言語に翻訳する音声翻訳装置で実行される音声翻訳方法であって、固有名詞抽出部が、文書に対して形態素解析と意味クラス解析とを行って、目的言語の固有名詞と当該固有名詞が属する意味クラスとを抽出し、抽出した前記固有名詞と前記固有名詞が属する意味クラスとを対応付けて記憶部に記憶させる固有名詞抽出ステップと、入力受付部が、原言語による音声発話の入力を受け付ける入力受付ステップと、認識部が、前記音声発話を認識し、文字列を生成する認識ステップと、一般名詞抽出部が、前記文字列に対して形態素解析と意味クラス解析とを行って、一般名詞と当該一般名詞が属する意味クラスとを抽出する一般名詞抽出ステップと、検索部が、前記一般名詞が属する意味クラスに属する固有名詞を前記記憶部から検索する検索ステップと、表示制御部が、検索された前記固有名詞を表示部に表示させる表示制御ステップと、選択受付部が、表示された前記固有名詞の中から、翻訳に用いる固有名詞の選択を受け付ける選択受付ステップと、翻訳部が、前記一般名詞を含む原言語の前記文字列を、前記翻訳に用いる固有名詞を用いて目的言語に翻訳する翻訳ステップと、出力制御部が、前記翻訳ステップの翻訳結果を出力部に出力させる出力制御ステップと、を含むことを特徴とする。
【発明の効果】
【0011】
本発明によれば、文書から抽出された固有名詞の中から翻訳候補となる目的言語の固有名詞が検索されるため、例えば利用者が閲覧した電子文書やWeb文書から固有名詞を抽出しておけば、利用者は、自身に関係のある翻訳候補の固有名詞の中から翻訳に用いる固有名詞を選択できる。従って、翻訳したい内容に目的言語の固有名詞が含まれる場合であっても、翻訳にかかる利用者の負担を軽減させることができるという効果を奏する。
【発明を実施するための最良の形態】
【0012】
以下、添付図面を参照しながら、本発明にかかる音声翻訳装置および方法の最良な実施の形態を詳細に説明する。なお、以下の実施の形態では、日本語の音声が入力され、翻訳結果として中国語の文字列等が出力される場合を例にとり説明するが、日本語から中国語への翻訳に限定されるものではなく、あらゆる言語間での翻訳に適用することができる。
【0013】
(第1の実施の形態)
最初に、本実施の形態の音声翻訳装置の概要について説明する。これは本実施の形態の理解を容易にするためであり、音声翻訳装置に制限を加えたり、限定するものではない。
【0014】
例えば、音声翻訳装置の利用者が中国へ旅行する場合、滞在先のホテルまでの所要時間の確認など、中国語の固有名詞が含まれる発話内容を翻訳したい場合がある。しかし、利用者が中国語の固有名詞を発話することができなければ、翻訳したい発話内容を音声入力することができず、翻訳することができない。
【0015】
ところで、利用者は中国旅行に先立ち、滞在先ホテルに関する情報や交通機関の情報、周辺地理の情報など旅行に必要な情報をWeb文書(Webページ)から入手していることが多い。また、ツーリストからメールで送信された行程表などを、PDF文書(Portable Document Format:登録商標)などの電子文書として入手している場合もある。
【0016】
そこで本実施の形態の音声翻訳装置は、利用者が閲覧したWeb文書や電子文書から固有名詞を抽出しておき、利用者が発話できない中国語の固有名詞を含む発話内容に代えて、当該固有名詞に対応する日本語の一般名詞を含む発話内容を音声入力させる。そして、閲覧済みの文書から抽出された固有名詞の中から、音声入力された日本語の一般名詞に対応する中国語の固有名詞を検索し、検索された中国語の固有名詞の中から目的の固有名詞(利用者が発話したかった中国語の固有名詞)を選択させる。そして、音声入力された発話内容に含まれる日本語の一般名詞を、利用者に選択された中国語の固有名詞に置き換えて翻訳し、出力する。
【0017】
これにより本実施の形態の音声翻訳装置は、利用者が発話することのできない中国語の固有名詞を用いた翻訳を実現する。
【0018】
次に、図1〜図7−3を参照しながら、本実施の形態にかかる音声翻訳装置1の機能ブロックについて説明する。
【0019】
図1は、本実施の形態にかかる音声翻訳装置1の構成の一例を示すブロック図である。本実施の形態の音声翻訳装置1は、電子文書およびWeb文書の少なくとも一方の文書を表示可能に構成されており、例えば、Acrobat Reader(登録商標)やWebブラウザなど、電子文書やWeb文書を利用者が閲覧するためのアプリケーションがインストールされている。そして音声翻訳装置1は、音声入力部10と、表示・選択部20と、音声出力部30と、記憶部40と、入力受付部100と、認識部110と、一般名詞抽出部120と、固有名詞抽出部130と、検索部140と、選択受付部150と、翻訳部160と、出力制御部170と、を備える。
【0020】
音声入力部10は、音声翻訳装置1の利用者が発話する翻訳の元となる原言語の音声などを入力するものであり、例えば、マイクなどにより実現できる。
【0021】
表示・選択部20(出力部の一例)は、翻訳のための選択操作を行ったり、翻訳のための翻訳画面を表示したりするものであり、例えば、液晶ディスプレイ上にタッチパネルを重ね合わせた液晶タッチパネルなどにより実現できる。表示・選択部20をタッチパネルで実現する場合、翻訳のための選択操作は、表示・選択部20に表示されているオブジェクトをタッチペンや指などで指し示す(タッチする)ことにより行うことができる。
【0022】
なお、表示・選択部20の表示機能および選択機能を別々に実現するようにしてもよい。例えば、表示機能を液晶ディスプレイにより実現し、選択機能をポインティングデバイスやキースイッチなどにより実現するようにしてもよい。
【0023】
音声出力部30(出力部の一例)は、利用者が音声入力部10に発話した原言語の音声に対する目的言語の音声などを出力するものであり、例えば、スピーカなどにより実現できる。
【0024】
記憶部40は、音声翻訳装置1で行われる各種処理に使用される情報を記憶するものであり、例えば、HDD(Hard Disk Drive)、光ディスク、メモリカード、RAM(Random Access Memory)などの既存の記憶媒体により実現できる。そして記憶部40は、文書記憶部42と、検索情報記憶部44とを含んで構成される。なお、文書記憶部42および検索情報記憶部44の詳細については後述する。
【0025】
入力受付部100は、音声入力部10から原言語による音声発話の入力を受け付ける。具体的には、入力受付部100は、音声入力部10から入力された音声のアナログ信号に対してサンプリングを行い、ステレオのデジタル信号に変換する。なお、デジタル信号への変換には、例えば、A/D変換など既存の技術を用いることができる。
【0026】
認識部110は、入力受付部100により受け付けられた音声発話(デジタル音声信号)を認識し、認識した音声発話の原言語による文字列を生成する音声認識処理を行う。なお、音声認識処理には、例えば、LPC分析、隠れマルコフモデル(HMM:Hidden Markov Model)、ダイナミックプログラミング、ニューラルネットワーク、Nグラム言語モデルなど既存の音声認識方法を用いることができる。
【0027】
一般名詞抽出部120は、認識部110により生成された原言語の文字列に対して形態素解析と意味クラス解析とを行って、一般名詞と当該一般名詞が属する意味クラスとを抽出する。なお、形態素解析に用いる形態素情報、意味クラス解析に用いる意味クラス情報などは、記憶部40に格納(記憶)されている。
【0028】
図2は、一般名詞抽出部120による形態素解析の解析結果の一例を示す図である。図2に示す例では、一般名詞抽出部120は、認識部110により生成された日本語の文字列200に対して形態素解析を行っており、日本語の文字列を構成する各単語および各単語の品詞を抽出している。
【0029】
図3は、一般名詞抽出部120による意味クラス解析の解析結果の一例を示す図である。図3に示す例では、一般名詞抽出部120は、形態素解析により一般名詞として抽出された単語である一般名詞201、202に対して意味クラス解析を行っており、一般名詞201に対しては「交通施設」という意味クラス、一般名詞202に対しては「宿泊施設」という意味クラスを抽出(付与)している。
【0030】
図1に戻り、文書記憶部42には、利用者により閲覧された電子文書やWeb文書が格納(記憶)されている。なお、文書記憶部42は、閲覧済みの文書に、最後に閲覧された日時などを示す最終閲覧日や閲覧された回数を示す閲覧回数などを対応付けて格納されており、最終閲覧日や閲覧回数は、利用者が文書を閲覧する毎に更新される。
【0031】
固有名詞抽出部130は、閲覧済みの電子文書やWeb文書を文書記憶部42から読み出し、読み出した文書に対して形態素解析と意味クラス解析とを行って、固有名詞と当該固有名詞が属する意味クラスとを抽出する。例えば、閲覧済みの文書が日本語の文書である場合には、日本語用の形態素解析と意味クラス解析を行い、閲覧済みの文書が中国語の文書である場合には、中国語用の形態素解析と意味クラス解析を行って、固有名詞と意味クラスとを抽出する。
【0032】
なお、形態素解析および意味クラス解析の切り替えは、後述する選択受付部150により選択を受け付けられた言語に応じて切り替えるようにしてもよいし、閲覧される文書の言語をファイル名やURL(Uniform Resource Locator)などから判別して切り替えるようにしてもよい。また、Web文書にXMLが用いられている場合には、単一の文書内で異なる言語を用いることができるため、用いられる言語毎に形態素解析および意味クラス解析の切り替えを行うようにしてもよい。
【0033】
また固有名詞抽出部130は、文書記憶部42から読み出した文書が、例えばWeb文書のようにHTMLやXMLを用いた構造化文書である場合には、HTMLパーサやXMLパーサなどを用いた文書解析処理を行って抽出の対象となる地の文を取り出してから、形態素解析および意味クラス解析を行うようにしてもよい。
【0034】
なお、形態素解析および意味クラス解析の内容については、一般名詞の抽出が固有名詞の抽出である点を除き、一般名詞抽出部120による形態素解析および意味クラス解析と同様であるため、詳細な説明は省略する。
【0035】
検索情報記憶部44は、固有名詞抽出部130により抽出された固有名詞と意味クラスとを対応付けて格納(記憶)する。
【0036】
図4は、検索情報記憶部44に格納される情報の一例を示す図である。図4に示す例では、検索情報記憶部44は、固有名詞抽出部130により抽出された固有名詞、意味クラスに加え、当該固有名詞が抽出された閲覧済みの文書の識別情報(例えば、ファイル名など)、最終閲覧日、閲覧回数をそれぞれ対応付けて格納している。なお、図4に示す例では、検索情報記憶部44に格納されている固有名詞は、中国語の文書(chn1.xml、chn2.xml)から抽出された中国語の固有名詞となっている。
【0037】
図1に戻り、検索部140は、一般名詞抽出部120により抽出された一般名詞が属する意味クラスに属する固有名詞を検索情報記憶部44から検索する。具体的には、検索部140は、一般名詞抽出部120により抽出された一般名詞であって、後述する選択受付部150により選択が受け付けられた一般名詞が属する意味クラスに属する目的言語の固有名詞を、検索情報記憶部44から検索する。
【0038】
例えば、図3および図4に示す例において、後述する選択受付部150により一般名詞202の選択が受け付けられた場合、検索部140は、一般名詞202の意味クラスである「宿泊施設」に属する固有名詞を検索情報記憶部44から検索する。この場合、図4に示す中国語の固有名詞203、204が「宿泊施設」を含む意味クラスである「企業名・建物名・宿泊施設」に属しているため、検索部140は、検索情報記憶部44から固有名詞203、204を検索する。なお、固有名詞203、204は、ホテル名である。
【0039】
選択受付部150は、表示・選択部20からの選択操作の入力を受け付ける。例えば、選択受付部150は、後述する表示制御部172により表示・選択部20に表示される固有名詞選択画面において、検索部140により検索された固有名詞の中から、翻訳に用いる固有名詞の選択を受け付ける。
【0040】
図5は、表示・選択部20に表示される固有名詞選択画面310の一例を示す図である。図5に示す例では、一般名詞202の置換候補として固有名詞203、204が表示・選択部20に表示されており、選択受付部150は、タッチペン400により指し示された固有名詞(例えば、固有名詞203)を、翻訳に用いる固有名詞の選択として受け付ける。
【0041】
図1に戻り、また例えば選択受付部150は、後述する表示制御部172により表示・選択部20に表示される一般名詞選択画面において、一般名詞抽出部120により抽出された一般名詞の中から、検索部140による検索に用いる一般名詞の選択を受け付ける。
【0042】
図6は、表示・選択部20に表示される一般名詞選択画面320の一例を示す図である。図6に示す例では、認識部110により生成された日本語の文字列200のうち、一般名詞抽出部120により抽出された一般名詞201、202が選択可能な状態で表示されている。そして選択受付部150は、タッチペン400により指し示された一般名詞(例えば、一般名詞202)を、検索に用いる一般名詞の選択として受け付ける。なお、図6に示す例では、選択可能な一般名詞を利用者に判別し易くするため、下線が施されている。
【0043】
図1に戻り、なお、選択受付部150は、固有名詞抽出部130が閲覧済みの文書の形態素解析および意味クラス解析に用いる言語の選択を受け付けるようにしてもよい。
【0044】
翻訳部160は、認識部110により生成された一般名詞を含む原言語の文字列を、選択受付部150により選択を受け付けられた翻訳に用いる固有名詞を用いて目的言語に翻訳する。具体的には、翻訳部160は、認識部110により生成された一般名詞を含む原言語の文字列を目的言語の所定の文字列に翻訳する。そして翻訳した文字列の中から、一般名詞抽出部120により抽出され、選択受付部150により選択が受け付けられた一般名詞に対応する目的言語の単語を、選択受付部150により選択を受け付けられた翻訳に用いる固有名詞に置換する。なお、翻訳処理には、例えば、用例ベース方式、トランスファ方式、統計ベース方式などの既存の翻訳方法を用いることができる。なお、翻訳に用いる辞書情報などは、記憶部40に記憶されている。
【0045】
図7−1〜図7−3は、用例ベース方式を用いた翻訳の一例を説明するための説明図である。まず、認識部110により生成された日本語の文字列200に対して、もっとも類似度が大きい用例が日本語の文字列205であるものとする(図7−1参照)。なお、類似度は、認識部110により生成された文字列と用例との差異部分を検出することで判別できる。
【0046】
この場合、翻訳部160は、日本語の文字列200を、日本語の文字列205の対訳である中国語の文字列206に翻訳する(図7−2参照)。なお、日本語の文字列205と中国語の文字列206との間の各単語の関連付けは、単語対応処理により行われているものとする。
【0047】
そして、翻訳された中国語の文字列206の中から、一般名詞抽出部120により抽出され、選択受付部150により選択が受け付けられた一般名詞202に対応する中国語の一般名詞207を、選択受付部150により選択を受け付けられた固有名詞である固有名詞203に置換する(図7−3参照)。なお、ここでは用例翻訳を用いているため、日本語の一般名詞208の中国語である一般名詞207が一般名詞202に対応する中国語の一般名詞となる。
【0048】
これにより、日本語の文字列200を、利用者が発話することができなかった固有名詞203を用いた中国語の文字列209に翻訳することができる。
【0049】
なお翻訳部160は、認識部110により生成された一般名詞を含む原言語の文字列の中から、一般名詞抽出部120により抽出され、選択受付部150により選択が受け付けられた一般名詞を選択受付部150により選択が受け付けられた固有名詞に置換した後に、置換された文字列を目的言語の文字列に翻訳するようにしてもよい。
【0050】
図1に戻り、出力制御部170は、表示・選択部20や音声出力部30による各種情報の出力を制御するものであり、表示制御部172と、音声制御部174とを含んで構成される。
【0051】
表示制御部172は、表示・選択部20への各種情報の出力を制御する。例えば、表示制御部172は、検索部140により検索された目的言語の固有名詞を表示・選択部20に表示させたり(図5参照)、一般名詞抽出部120により抽出された一般名詞を表示・選択部20に表示させたり(図6参照)、翻訳部160により翻訳された目的言語の文字列を表示・選択部20に表示させる。
【0052】
特に表示制御部172は、検索部140により検索された目的言語の固有名詞を表示・選択部20に表示させる場合、当該固有名詞に対応付けられた閲覧済みの文書の最終閲覧日、閲覧回数などによりソートして表示させる。例えば図5に示す例では、表示制御部172は、固有名詞203、204を最終閲覧日の順にソートして表示・選択部20に表示させている。
【0053】
なお表示制御部172は、固有名詞抽出部130が閲覧済みの文書の形態素解析および意味クラス解析に用いる言語を利用者に選択させるための画面や、利用者が閲覧する電子文書やWeb文書などを表示・選択部20へ表示させる制御なども行う。
【0054】
音声制御部174は、音声出力部30への各種情報の出力を制御する。具体的には、音声制御部174は、検索部140により検索された固有名詞や翻訳部160により翻訳された目的言語の文字列を音声信号に変換する音声合成処理を行い、音声合成処理により生成した音声信号をDA変換して音声出力部30に出力させる。なお、音声合成処理には、例えば、音声素片編集音声合成、フォルマント音声合成、音声コーパスベースの音声合成などの既存の方法を用いることができる。
【0055】
次に、図8〜図11等を参照しながら、本実施の形態にかかる音声翻訳装置1の処理の流れについて説明する。
【0056】
図8は、利用者により閲覧される電子文書やWeb文書から固有名詞等を抽出する手順の一例を示すフローチャートである。
【0057】
まず、固有名詞抽出部130は、閲覧済みの電子文書やWeb文書を文書記憶部42から読み出し、読み出した文書の言語に応じた形態素解析と意味クラス解析とを行って、固有名詞と意味クラスとを抽出する(ステップS12)。
【0058】
次に、固有名詞抽出部130は、図4に示すように、抽出された固有名詞、意味クラスに加え、当該固有名詞が抽出された閲覧済みの文書の識別情報、最終閲覧日、閲覧回数をそれぞれ対応付けて検索情報記憶部44に格納させる(ステップS14)。
【0059】
図9は、本実施の形態の音声翻訳の手順の一例を示すフローチャートである。
【0060】
まず、入力受付部100は、音声入力部10から原言語による音声発話の入力を受け付ける(ステップS20)。ここでは、入力受付部100は、日本語の文字列200の音声発話の入力を受け付けるものとする。
【0061】
次に、認識部110は、入力受付部100により受け付けられた音声発話を認識し、日本語の文字列200を生成する(ステップS22)。
【0062】
次に、一般名詞抽出部120は、認識部110により生成された日本語の文字列に対して形態素解析と意味クラス解析とを行って、一般名詞と意味クラスとを抽出する(ステップS24)。ここでは、一般名詞抽出部120は、図3に示すように、一般名詞201、202を抽出し、一般名詞201に対しては「交通施設」という意味クラス、一般名詞202に対しては「宿泊施設」という意味クラスを抽出するものとする。
【0063】
次に、表示制御部172は、図6に示すように、一般名詞選択画面320を表示・選択部20へ表示させる(ステップS26)。
【0064】
次に、選択受付部150は、置換対象の一般名詞(検索部140による検索に用いる一般名詞)の選択を受け付ける(ステップS28)。ここでは、選択受付部150は、図6に示すように、タッチペン400により指し示された一般名詞202の選択を受け付けるものとする。なお実際には、一般名詞202を指し示した後にOKボタン321を指し示すことにより、一般名詞202の選択が受け付けられる。
【0065】
次に、検索部140は、選択受付部150により選択が受け付けられた一般名詞202が属する意味クラスに属する固有名詞を、検索情報記憶部44から検索する(ステップS30)。ここでは、検索部140は、図4に示すように、一般名詞202が属する意味クラスである「宿泊施設」に属する固有名詞203、204を検索情報記憶部44から検索するものとする。
【0066】
次に、表示制御部172は、図5に示すように、固有名詞選択画面310を表示・選択部20へ表示させる(ステップS32)。ここでは、表示制御部172は、固有名詞203、204を最終閲覧日の遅い順にソートして表示・選択部20に表示させている。
【0067】
次に、選択受付部150は、翻訳に用いる固有名詞の選択を受け付ける(ステップS34)。ここでは、選択受付部150は、図5に示すように、タッチペン400により指し示された固有名詞203の選択を受け付けるものとする。なお実際には、固有名詞203を指し示した後にOKボタン311を指し示すことにより、固有名詞203の選択が受け付けられる。
【0068】
次に、表示制御部172は、固有名詞203の選択が受け付けられると、図10に示すように、日本語の文字列200のうち、一般名詞202を固有名詞203に置き換えた文字列210を表示する置換結果確認画面330を表示・選択部20へ表示させる(ステップS36)。
【0069】
次に、選択受付部150は、図10に示すように、タッチペン400により翻訳ボタン331が指し示されることにより、翻訳の選択を受け付ける(ステップS38)。
【0070】
次に、翻訳部160は、図7−1〜図7−3に示すように、認識部110により生成された日本語の文字列200を、選択受付部150により選択を受け付けられた固有名詞203を用いた中国語の文字列209に翻訳する(ステップS40)。
【0071】
次に、表示制御部172は、図11に示すように、翻訳部160により翻訳された中国語の文字列209を表示する翻訳結果確認画面340を表示・選択部20へ表示させる(ステップS42)。また、固有名詞203の音声出力が可能な場合には、音声制御部174は、翻訳部160により翻訳された中国語の文字列209を音声信号に変換し、音声出力部30に出力させる。
【0072】
このように本実施の形態では、利用者が発話した日本語の一般名詞に対応する中国語の固有名詞が検索され、検索された固有名詞の中から利用者に選択された固有名詞(利用者が発話したかった中国語の固有名詞)を用いて翻訳が行われる。従って、本実施の形態によれば、利用者が発話することのできない中国語の固有名詞を用いた翻訳を実現することができる。
【0073】
例えば、利用者は、固有名詞203を発話できないため、文字列210を音声入力できないが、固有名詞203がホテルであることを知っており、固有名詞203が検索対象の固有名詞に含まれているとする。この場合には、利用者は、文字列210に代えて、日本語の文字列200を音声入力すれば、文字列210の翻訳結果である文字列209を得ることができる。
【0074】
特に本実施の形態では、利用者が閲覧した電子文書やWeb文書から抽出された固有名詞の中から置換候補となる中国語の固有名詞が検索されるため、利用者は、自身に関係のある置換候補の固有名詞の中から翻訳に用いる固有名詞を選択できる。従って本実施の形態によれば、翻訳したい発話内容に目的言語の固有名詞が含まれる場合であっても、当該発話内容を音声入力する必要のある翻訳にかかる利用者の負担を軽減させることができる。
【0075】
例えば、利用者が中国等へ旅行する場合、旅行に先立ち、滞在先ホテルに関する情報や交通機関の情報、周辺地理の情報など旅行に必要な情報をWeb文書やツーリストから入手した電子文書で確認していることが多い。このため、利用者が閲覧した文書から抽出される固有名詞は、利用者に関係のある固有名詞である可能性が高く、同様に、抽出された固有名詞から置換候補として検索される中国語の固有名詞も、利用者に関係のある固有名詞である可能性が高い。従って、利用者は、自身に関係のある置換候補の固有名詞の中から翻訳に用いる固有名詞を選択でき、負担なく翻訳作業を行うことができる。
【0076】
また本実施の形態では、置換候補として検索された中国語の固有名詞を、当該固有名詞が抽出された閲覧済みの文書の最終閲覧日でソートして表示しており、直近に閲覧した文書から抽出された固有名詞から順に表示を行っている(図5参照)。一般に、直近に閲覧した文書から抽出された固有名詞ほど、利用者に関係のある固有名詞と考えられるため、本実施の形態では、置換候補となる中国語の固有名詞が大量に検索された場合であっても、利用者は、自身に関係のある固有名詞を優先的に確認して、翻訳に用いる固有名詞を選択することができる。
【0077】
なお本実施の形態では、置換候補として検索された中国語の固有名詞を最終閲覧日でソートして表示したが、閲覧回数でソートして表示するようにしてもよい。また、置換候補として検索された固有名詞の意味クラスに応じて、最終閲覧日でソートして表示するか、閲覧回数でソートして表示するかを切り替えてもよい。
【0078】
また、置換候補として検索された中国語の固有名詞に加え、当該固有名詞が抽出された文書から、当該固有名詞に関連する画像などを表示するようにしてもよい。このようにすると、利用者が置換候補として検索された中国語の意味が分からない場合であっても、その内容を推察させることができるようになる。
【0079】
また本実施の形態では、中国語の固有名詞に置換する一般名詞を利用者自身に選択させているため、利用者が置換を希望する一般名詞に対してのみ、置換候補の固有名詞を表示させることができる。
【0080】
例えば、利用者が空港で日本語の文字列200の質問をする場合、利用者は空港に居るため、一般名詞201に関しては置換の必要はないが、一般名詞202に関しては目的の中国語のホテル名への置換が必要となる。本実施の形態によれば、このような場合に、一般名詞202に対してのみ中国語の固有名詞に置換することができる。
【0081】
なお本実施の形態の音声翻訳装置1は、CPU(Central Processing Unit)などの制御装置、ROM(Read Only Memory)やRAM(Random Access Memory)などの記憶装置、マイクなどの音声入力装置、タッチパネルなどの表示装置や入力装置、スピーカなどの音声出力装置、ネットワークに接続して通信を行う通信I/F等を備えたハードウェア構成となっている。
【0082】
(第2の実施の形態)
上述した第1の実施の形態では、閲覧済みの文書から抽出された固有名詞の中から目的言語の固有名詞を検索する例について説明したが、第2の実施の形態では、閲覧済みの文書から抽出された固有名詞の中から原言語および目的言語の固有名詞を検索する例について説明する。
【0083】
なお、以下では、第1の実施の形態との相違点の説明を主に行い、第1の実施の形態と同様の機能を有する構成要素については、第1の実施の形態と同様の名称・符号を付し、その説明を省略する。
【0084】
図12は、本実施の形態にかかる音声翻訳装置1001の構成の一例を示すブロック図である。音声翻訳装置1001は、閲覧済みの文書から抽出された固有名詞の中から原言語および目的言語の固有名詞を検索する。従って、記憶部1040に含まれる検索情報記憶部1044が記憶する情報、および翻訳部1160、検索部1140、出力制御部1170に含まれる表示制御部1172の各部が行う処理が、第1の実施の形態にかかる音声翻訳装置1と相違する。
【0085】
翻訳部1160は、固有名詞抽出部130により抽出された原言語の固有名詞を目的言語に翻訳する。
【0086】
検索情報記憶部1044は、固有名詞抽出部130により抽出された固有名詞には、翻訳部1160により翻訳された目的言語の固有名詞である対訳固有名詞を対応付けて格納(記憶)する。
【0087】
図13は、検索情報記憶部1044に格納される情報の一例を示す図である。図13に示す例では、検索情報記憶部1044は、固有名詞抽出部130により抽出された固有名詞、意味クラス、当該固有名詞が抽出された閲覧済みの文書の識別情報、最終閲覧日、閲覧回数をそれぞれ対応付けて格納している。そして、固有名詞抽出部130により抽出された原言語の固有名詞に対しては、対訳固有名詞をさらに対応付けて格納している。
【0088】
なお、図13に示す例では、検索情報記憶部44に格納されている固有名詞は、中国語の文書(chn1.xml)から抽出された中国語の固有名詞、および日本語の文書(jpn1.xml)から抽出された日本語の固有名詞となっている。
【0089】
また、図13に示す例では、日本語の固有名詞1201は、記憶部1040に記憶されている辞書情報に対訳が存在するため、翻訳部1160により固有名詞204に翻訳され、対訳固有名詞として中国語の固有名詞204が対応付けられているものとする。一方、日本語の固有名詞1202は、記憶部1040に記憶されている辞書情報に対訳が存在しないため、翻訳部1160による翻訳が行われず、対訳固有名詞は存在していないものとする。
【0090】
検索部1140は、一般名詞抽出部120により抽出された一般名詞が属する意味クラスに属する翻訳後の固有名詞に加え、原言語の固有名詞を検索情報記憶部1044から検索する。
【0091】
例えば、図3および図13に示す例において、選択受付部150により一般名詞202の選択が受け付けられた場合、検索部1140は、一般名詞202が属する意味クラスである「宿泊施設」に属する固有名詞を検索情報記憶部1044から検索する。この場合、図13に示す固有名詞203、1201の意味クラスである「企業名・建物名・宿泊施設」に、「宿泊施設」が含まれるため、検索部1140は、検索情報記憶部1044から固有名詞203、1201を検索する。
【0092】
表示制御部1172は、検索部1140により検索された目的言語および原言語の固有名詞を表示・選択部20に表示させる。
【0093】
図14は、表示・選択部20に表示される固有名詞選択画面1310の一例を示す図である。図14に示す例では、一般名詞202の置換候補として固有名詞203と、固有名詞1201および固有名詞1201の対訳固有名詞である固有名詞204とが表示・選択部20に表示されている。
【0094】
図15は、利用者により閲覧される電子文書やWeb文書から固有名詞等を抽出する手順の一例を示すフローチャートである。
【0095】
まず、固有名詞等の抽出(ステップS112)は、図8に示すステップS12の処理と同様であるため、説明を省略する。
【0096】
そして、固有名詞抽出部130は、ステップS112で抽出した固有名詞が日本語の固有名詞であるか否かを判定する(ステップS114)。
【0097】
次に、抽出した固有名詞が日本語の固有名詞である場合には(ステップS114でYes)、翻訳部1160は、抽出された日本語の固有名詞を中国語の固有名詞に翻訳する(ステップS116)。
【0098】
一方、固有名詞抽出部130により抽出された固有名詞が日本語の固有名詞でない場合には、翻訳部1160による翻訳は行われない(ステップS114でNo)。
【0099】
次に、固有名詞抽出部130は、図13に示すように、抽出した固有名詞、意味クラス、当該固有名詞が抽出された閲覧済みの文書の識別情報、最終閲覧日、閲覧回数をそれぞれ対応付けて検索情報記憶部1044に格納させる。さらに、翻訳部1160は、固有名詞抽出部130により抽出された日本語の固有名詞に対しては、対訳固有名詞をさらに対応付けて検索情報記憶部1044に格納させる(ステップS118)。
【0100】
このように本実施の形態では、置換候補として検索された日本語の固有名詞については、中国語の対訳固有名詞とともに表示するため、利用者は、中国語の対訳固有名詞の意味が分からなくても同時に表示されている日本語の固有名詞からその意味を理解することができる。
【0101】
なお、音声翻訳の手順については第1の実施の形態と同様であるため、説明を省略する。
【図面の簡単な説明】
【0102】
【図1】第1の実施の形態の音声翻訳装置の構成の一例を示すブロック図である。
【図2】形態素解析の解析結果の一例を示す図である。
【図3】意味クラス解析の解析結果の一例を示す図である。
【図4】検索情報記憶部に格納される情報の一例を示す図である。
【図5】固有名詞選択画面の一例を示す図である。
【図6】一般名詞選択画面の一例を示す図である。
【図7−1】用例ベース方式を用いた翻訳の一例を説明するための説明図である。
【図7−2】用例ベース方式を用いた翻訳の一例を説明するための説明図である。
【図7−3】用例ベース方式を用いた翻訳の一例を説明するための説明図である。
【図8】利用者により閲覧される文書から固有名詞等を抽出する手順の一例を示すフローチャートである。
【図9】第1の実施の音声翻訳の手順の一例を示すフローチャートである。
【図10】置換結果確認画面の一例を示す図である。
【図11】翻訳結果確認画面の一例を示す図である。
【図12】第2の実施の形態の音声翻訳装置の構成の一例を示すブロック図である。
【図13】検索情報記憶部に格納される情報の一例を示す図である。
【図14】固有名詞選択画面の一例を示す図である。
【図15】利用者により閲覧される文書から固有名詞等を抽出する手順の一例を示すフローチャートである。
【符号の説明】
【0103】
1、1001 音声翻訳装置
10 音声入力部
20 表示・選択部
30 音声出力部
40、1040 記憶部
42 文書記憶部
44、1044 検索情報記憶部
100 入力受付部
110 認識部
120 一般名詞抽出部
130 固有名詞抽出部
140、1140 検索部
150 選択受付部
160、1160 翻訳部
170、1170 出力制御部
172、1172 表示制御部
174 音声制御部
200 文字列
201 一般名詞
202 一般名詞
203 固有名詞
204 固有名詞
205 文字列
206 文字列
207 一般名詞
208 一般名詞
209 文字列
210 文字列
310、1310 固有名詞選択画面
311 OKボタン
320 一般名詞選択画面
321 OKボタン
330 置換結果確認画面
331 翻訳ボタン
340 翻訳結果確認画面
400 タッチペン
1201 固有名詞
1202 固有名詞

【特許請求の範囲】
【請求項1】
原言語による音声発話を目的言語に翻訳する音声翻訳装置であって、
文書に対して形態素解析と意味クラス解析とを行って、目的言語の固有名詞と当該固有名詞が属する意味クラスとを抽出する固有名詞抽出部と、
前記固有名詞と前記固有名詞が属する意味クラスとを対応付けて記憶する記憶部と、
原言語による音声発話の入力を受け付ける入力受付部と、
前記音声発話を認識し、文字列を生成する認識部と、
前記文字列に対して形態素解析と意味クラス解析とを行って、一般名詞と当該一般名詞が属する意味クラスとを抽出する一般名詞抽出部と、
前記一般名詞が属する意味クラスに属する固有名詞を前記記憶部から検索する検索部と、
検索された前記固有名詞を表示部に表示させる表示制御部と、
表示された前記固有名詞の中から、翻訳に用いる固有名詞の選択を受け付ける選択受付部と、
前記一般名詞を含む原言語の前記文字列を、前記翻訳に用いる固有名詞を用いて目的言語に翻訳する翻訳部と、
前記翻訳部の翻訳結果を出力部に出力させる出力制御部と、を備えることを特徴とする音声翻訳装置。
【請求項2】
前記記憶部は、前記固有名詞に、当該固有名詞が抽出された前記閲覧済みの文書の閲覧状況を示す閲覧情報を対応付けて更に記憶し、
前記表示制御部は、前記検索部により検索された前記固有名詞を、当該固有名詞に対応付けられた前記閲覧情報によりソートして前記表示部に表示させることを特徴とする請求項1に記載の音声翻訳装置。
【請求項3】
前記閲覧情報は、前記閲覧済みの文書の最終閲覧日および閲覧回数の少なくとも一方であることを特徴とする請求項2に記載の音声翻訳装置。
【請求項4】
前記表示制御部は、前記一般名詞を前記表示部に更に表示させ、
前記選択受付部は、表示された前記一般名詞の中から、前記検索部による検索に用いる一般名詞の選択を更に受け付け、
前記検索部は、選択を受け付けられた前記一般名詞が属する意味クラスに属する固有名詞を前記記憶部から検索することを特徴とする請求項1〜3のいずれか1つに記載の音声翻訳装置。
【請求項5】
前記翻訳部は、前記一般名詞を含む原言語の前記文字列を目的言語の所定の文字列に翻訳し、翻訳した文字列の中から、前記一般名詞に対応する目的言語の単語を、前記翻訳に用いる固有名詞に置換することを特徴とする請求項1〜4のいずれか1つに記載の音声翻訳装置。
【請求項6】
前記選択受付部は、前記閲覧済みの文書の言語の選択を更に受け付け、
前記固有名詞抽出部は、選択を受け付けられた言語に応じた前記形態素解析と前記意味クラス解析とを行うことを特徴とする請求項1〜5のいずれか1つに記載の音声翻訳装置。
【請求項7】
前記固有名詞抽出部は、原言語の固有名詞と当該固有名詞が属する意味クラスとを更に抽出し、
前記翻訳部は、原言語の前記固有名詞を目的言語に翻訳し、
前記記憶部は、原言語の前記固有名詞に、翻訳された目的言語の固有名詞を対応付けて更に記憶し、
前記検索部は、前記一般名詞が属する意味クラスに属する原言語の前記固有名詞を前記記憶部から更に検索し、
前記表示制御部は、検索された原言語の前記固有名詞を、当該固有名詞に対応付けられた目的言語の前記固有名詞とともに前記表示部に更に表示させることを特徴とする請求項1〜6のいずれか1つに記載の音声翻訳装置。
【請求項8】
原言語による音声発話を目的言語に翻訳する音声翻訳装置で実行される音声翻訳方法であって、
固有名詞抽出部が、文書に対して形態素解析と意味クラス解析とを行って、目的言語の固有名詞と当該固有名詞が属する意味クラスとを抽出し、抽出した前記固有名詞と前記固有名詞が属する意味クラスとを対応付けて記憶部に記憶させる固有名詞抽出ステップと、
入力受付部が、原言語による音声発話の入力を受け付ける入力受付ステップと、
認識部が、前記音声発話を認識し、文字列を生成する認識ステップと、
一般名詞抽出部が、前記文字列に対して形態素解析と意味クラス解析とを行って、一般名詞と当該一般名詞が属する意味クラスとを抽出する一般名詞抽出ステップと、
検索部が、前記一般名詞が属する意味クラスに属する固有名詞を前記記憶部から検索する検索ステップと、
表示制御部が、検索された前記固有名詞を表示部に表示させる表示制御ステップと、
選択受付部が、表示された前記固有名詞の中から、翻訳に用いる固有名詞の選択を受け付ける選択受付ステップと、
翻訳部が、前記一般名詞を含む原言語の前記文字列を、前記翻訳に用いる固有名詞を用いて目的言語に翻訳する翻訳ステップと、
出力制御部が、前記翻訳ステップの翻訳結果を出力部に出力させる出力制御ステップと、を含むことを特徴とする音声翻訳方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7−1】
image rotate

【図7−2】
image rotate

【図7−3】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate


【公開番号】特開2010−55506(P2010−55506A)
【公開日】平成22年3月11日(2010.3.11)
【国際特許分類】
【出願番号】特願2008−221804(P2008−221804)
【出願日】平成20年8月29日(2008.8.29)
【出願人】(000003078)株式会社東芝 (54,554)
【Fターム(参考)】