言語処理装置

【課題】
入力言語の設定の手間を省く。
【解決手段】
入力部（１４）は、文字画像を含む映像を認識部（１６）に入力する。認識部（１６）は、入力部（１４９からの映像の文字画像を認識し、この文字画像に対応する文字情報、及びその言語を示す言語情報を出力する。ユーザは、言語選択手段（１２）により出力言語を選択する。言語処理部（１８）は、認識手段（１６）で認識された文字情報を出力言語に機械翻訳する。出力部（２０）は、言語処理部（１８）の翻訳結果を出力する。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、言語を別の言語に変換、即ち翻訳する言語処理装置に関する。
【背景技術】
【０００２】
近年、自然言語処理技術の発展に伴い、様々な言語処理装置が開発されている。図５は、言語を変換する機械翻訳の従来の言語処理装置の概略構成ブロック図を示す。言語処理装置４０は、言語選択部４２と、入力部４４と、言語処理部４６と、翻訳結果出力部４８とを具備する。言語選択部４２は、入力言語と出力言語を選択する選択画面を表示し、ユーザはその画面上で，入力言語又は出力言語を指定する。入力部４４により翻訳対象の言語（の文章）が言語処理部４６に入力される。言語処理部４６は、入力部４４により入力された文章を言語選択部４２で選択された入力言語及び出力言語に従い翻訳する。翻訳結果出力部４８は、言語処理部４６で翻訳された翻訳文を出力する。
【０００３】
図６は、図５に示す言語処理装置の動作フローチャートである。入力部４４が、言語処理を行いたい任意の言語Ｘ_Ｌの文章を取り込み、言語処理部４６に供給する（Ｓ１１）。言語処理部４６は、形態素解析により、入力文の単語を決定する（Ｓ１２）。ステップＳ１２の単語決定処理は、文字列のどこからどこまでが単語で、その品詞は何かを決定する処理である。
【０００４】
言語処理部４６は、構文解析により、ステップＳ２で得られた品詞の係り受けを確定する（Ｓ１３）。例えば、「Ａさんと東京に行く」の「Ａさん」は「行く」に係り、「東京と神奈川に行く」の「東京」は「神奈川」に係るといった内容である。ステップＳ１３により、構文解析の結果を木構造で表した構文木Ｘ_Ｔを得ることが出来る。
【０００５】
言語処理部４６は次に、ステップＳ１３の処理で得られた構文木Ｘ_Ｔに入力言語Ｘ_Ｌと出力言語Ｙ_Ｌとの間で予め定められた規則を適用し、別の言語Ｙ_Ｌの構文木Ｙ_Ｔを得る（Ｓ１４）。言語処理部４６は、ステップＳ１４で得られた構文木Ｙ_Ｔを用いて、言語Ｙ_Ｌの文章を生成する（Ｓ１５）。
【０００６】
言語処理部４６は、このようにして生成された言語Ｙ_Ｌの文章を翻訳結果出力部４８に供給し、翻訳結果出力部４８は、外部に出力する（Ｓ１６）。
【０００７】
以上の処理により、任意の言語Ｘ_Ｌを他の任意の言語Ｙ_Ｌに翻訳できる。一般的に、ステップＳ１２からＳ１５までの処理が、機械翻訳と呼ばれる。
【０００８】
従来の言語処理装置における言語選択方法には、言語処理装置が現在の位置情報を取得し、取得した位置の使用言語を選択するというものがある（特許文献１，２参照。）。
【特許文献１】特開２００３−１１４８８７号公報
【特許文献２】特開２００５−１９０２７８号公報
【発明の開示】
【発明が解決しようとする課題】
【０００９】
従来の言語処理装置では、出力言語を位置情報から決定できる。しかし、入力言語は、ユーザが言語処理装置を使用する際に手動で選択する必要があった。また、仮に現在位置の言語を入力言語とした場合、出力言語を簡易に選択する手段又は方法が望まれる。
【００１０】
本発明は、このような要望を満たす言語処理装置を提示することを目的とする。
【課題を解決するための手段】
【００１１】
本発明に係る言語処理装置は、文字画像を含む映像を入力する入力手段と、前記映像から前記文字画像を認識し、前記文字画像に対応する文字情報、及びその言語を示す言語情報を出力する認識手段と、装置の操作画面表示用言語を選択する言語選択手段と、前記認識手段で認識された前記文字情報を機械翻訳する言語処理手段と、前記言語処理手段の翻訳結果を出力する出力手段とを具備し、前記言語選択手段で選択された言語を入力言語又は出力言語とすることを特徴とする。
【００１２】
本発明に係る言語処理装置は、音声を入力する入力手段と、前記音声を認識し、前記音声に対応する文字情報、及びその言語を示す言語情報を出力する認識手段と、装置の操作画面表示用言語を選択する言語選択手段と、前記認識手段で認識された前記文字情報を機械翻訳する言語処理手段と、前記言語処理手段の翻訳結果を出力する出力手段とを具備し、前記言語選択手段で選択された言語を入力言語又は出力言語とすることを特徴とする。
【発明の効果】
【００１３】
本発明によれば、文字認識又は音声認識により言語も同時に認識するので、入力言語の事前設定が不要になり、ユーザの負担が軽減される。また、複数種類の入力言語に同時対応出来る。
【発明を実施するための最良の形態】
【００１４】
以下、図面を参照して、本発明の実施例を詳細に説明する。
【００１５】
図１は、デジタルビデオカメラに適用された本発明の一実施例の概略構成ブロック図を示す。本実施例は、デジタルビデオで撮影した文字を別言語に翻訳し、翻訳結果を再生映像に重畳表示する機能を提供する。
【００１６】
本実施例の言語処理装置１０は、言語選択部１２と、映像入力部１４と、認識部１６と、言語処理部１８と、翻訳結果出力部２０とを具備する。言語選択部１２は、出力言語を選択する選択画面を表示し、ユーザはその画面上で出力言語を指定する。出力言語は、通常、メニュー表示言語である。
【００１７】
映像入力部１４により被写体の映像（例えば、都市風景等の映像）が言語処理装置１０の認識部１６に入力される。認識部１６は、映像入力部１４により入力された映像から文字部分を抽出し、言語と文字を認識する。認識部１６は、光学文字認識用に、入力言語として指定される可能性のある複数の言語の文字データベースを具備する。認識部１６は、抽出された文字部分を該当する文字データベースとマッチングして個々の文字とその言語を認識し、認識結果の文字情報と、画面上の表示位置と、言語を示す言語情報を言語処理部１８に出力する。
【００１８】
言語処理部１８は、認識部１６からの言語情報で指定される言語を入力言語として、認識部１６からの文字を、言語選択部１２で選択される出力言語に機械翻訳する。機械翻訳結果は、画面上の表示位置の情報とともに、翻訳結果出力部２０に供給される。
【００１９】
翻訳結果出力部２０は、言語処理部１８からの翻訳結果を、言語処理部１８からの表示位置に表示されるように、映像入力部１４の入力対象の映像信号に合成する。合成映像信号は、液晶表示パネル又は電子ビューファインダに表示される。
【００２０】
図２は、本実施例の動作フローチャートを示す。映像入力部１４により、言語処理を行いたい任意の文字（言語Ｘ_Ｌ）を含む映像を取り込み、認識部１６に供給する（Ｓ１）。
【００２１】
認識部１６は、入力画像のパターン認識により、文字画像部分を抽出する（Ｓ２）。認識部１６は更に、抽出した文字画像と内蔵辞書内の言語とのパターンマッチングを行うことで、文字画像から入力言語Ｘ_Ｌを特定し、文字列を取得し（Ｓ３）。認識部１６は、このようにして得られた文字列と入力言語情報（入力言語Ｘ_Ｌを示す情報）を言語処理部１８に供給する。
【００２２】
言語処理部１８は、認識部１６からの入力言語情報に基づく形態素解析により、認識部１６からの文字列を単語に分解し、品詞を決定する（Ｓ４）。言語処理部１８はまた、構文解析により、ステップＳ４で得られた単語の品詞の係り受けを確定し、構文解析の結果を木構造で表した構文木Ｘ_Ｔを生成する（Ｓ５）。言語処理部１８は次に、ステップＳ５の構文解析処理で得られた構文木Ｘ_Ｔに入力言語Ｘ_Ｌと出力言語Ｙ_Ｌとの間で予め定められた規則を適用し、別の言語Ｙ_Ｌの構文木Ｙ_Ｔを得る（Ｓ１４）。なお、ユーザは，言語選択部１２により、出力言語Ｙ_Ｌを予め選択している。出力言語Ｙ_Ｌは、通常、ユーザが日常、使用する言語であり、ビデオカメラに装備される場合には，ビデオカメラのメニューの表示言語でもある。言語処理部１８は、ステップＳ６で得られた構文木Ｙ_Ｔを用いて、言語Ｙ_Ｌの文章（翻訳文）を生成する（Ｓ７）。
【００２３】
言語処理部１８は、このようにして生成された言語Ｙ_Ｌの文章を翻訳結果出力部２０に供給する。翻訳結果出力部２０は、映像信号と混合する混合器（図示せず）に、表示位置のタイミングで言語Ｙ_Ｌの文章の画像データを供給する（Ｓ８）。
【００２４】
以上の処理により、映像に含まれる文字を、その言語Ｘ_Ｌを自動決定した上で、他の任意の言語Ｙ_Ｌに翻訳できる。即ち、ユーザが手動で入力言語を選択する手間を軽減できる。複数の言語の入力に対応するためには、認識部１６でのパターン認識に多大な時間がかかることが予想されるが、言語処理装置１０が現在位置情報を基に、現地の言語を優先的に選択することで、認識時間を短縮できる。
【００２５】
図３は、本実施例のメニュー表示言語を選択する画面の一例を示す。図３（ａ）は、日本語を選択した場合であり、同（ｂ）は、英語を選択した場合をそれぞれ示す。
【００２６】
図４は、実際に韓国で撮影した映像に対する本実施例の表示結果例を示す。撮影映像を再生する際に、本実施例の言語処理装置１０が機能する。メニュー言語が日本語に設定されている場合、モニタ画面には（ａ）に示すように日本語の翻訳文が重畳標示される。他方、メニュー言語が英語に設定されている場合、モニタ画面には（ｂ）に示すように英語の翻訳文が重畳標示される。
【００２７】
図７は、実際に韓国語を入力音声とした本実施例の表示結果例を示す。入力された音声に対する出力を行う際に、本実施例の言語処理装置１０が機能する。メニュー言語が日本語に設定されている場合、モニタ画面には（ａ）に示すように日本語の翻訳文が表示される。他方、メニュー言語が英語に設定されている場合、モニタ画面には（ｂ）に示すように英語の翻訳文が表示される。ここで、出力は音声出力としても良い。また、入力音声がメニュー言語に設定している言語と同様であった場合、従来技術にある位置情報検出の結果から出力言語を決定することが有効であることは言うまでもない。
【図面の簡単な説明】
【００２８】
【図１】本発明の一実施例の概略構成ブロック図である。
【図２】本実施例の動作フローチャートである。
【図３】本実施例を実装したデジタルビデオカメラのメニュー表示言語選択画面例である。
【図４】本実施例を実装したデジタルビデオカメラによる再生画面例である。
【図５】従来の言語処理装置の概略構成ブロック図である。
【図６】従来例の動作フローチャートである。
【図７】本実施例を実装した翻訳機による再生画面例である。
【符号の説明】
【００２９】
１０：言語処理装置
１２：言語選択部
１４：入力部
１６：認識部
１８：言語処理部
２０：翻訳結果出力部
４０：言語処理装置
４２：言語選択部
４４：入力部
４６：言語処理部
４８：翻訳結果出力部

【特許請求の範囲】
【請求項１】
文字画像を含む映像を入力する入力手段と、
前記映像から前記文字画像を認識し、前記文字画像に対応する文字情報、及びその言語を示す言語情報を出力する認識手段と、
装置の操作画面表示用言語を選択する言語選択手段と、
前記認識手段で認識された前記文字情報を機械翻訳する言語処理手段と、
前記言語処理手段の翻訳結果を出力する出力手段
とを具備し、前記言語選択手段で選択された言語を入力言語又は出力言語とすることを特徴とする言語処理装置。
【請求項２】
前記認識手段が、前記文字画像の表示位置を示す情報を出力し、
前記出力手段は、前記映像の前記表示位置に対応する位置に前記文字情報を重畳する手段を含む
ことを特徴とする請求項１に記載の言語処理装置。
【請求項３】
前記言語処理手段は、前記認識手段で認識された前記文字情報を前記言語選択手段で選択された言語に機械翻訳することを特徴とする請求項１又は２に記載の言語処理装置。
【請求項４】
音声を入力する入力手段と、
前記音声を認識し、前記音声に対応する文字情報、及びその言語を示す言語情報を出力する認識手段と、
装置の操作画面表示用言語を選択する言語選択手段と、
前記認識手段で認識された前記文字情報を機械翻訳する言語処理手段と、
前記言語処理手段の翻訳結果を出力する出力手段
とを具備し、前記言語選択手段で選択された言語を入力言語又は出力言語とすることを特徴とする言語処理装置。

【図１】