説明

情報処理装置、情報処理方法および情報処理プログラム

【課題】相手との円滑なコミュニケーションを実現する装置を提供する。
【解決手段】情報処理装置100は、通信部210と、入力部220と、処理部230と、出力部240と、状況設定部250と、状況情報記憶部260とプログラム記憶部270と、データ記憶部275と、外部記憶媒体I/F275とを備える。処理部230は、入力部220への入力や、状況情報記憶部260に格納されている情報に基づいて、相手の状況を判断し、判断結果に基づいて、入力部220に入力された入力文を翻訳し、提示文を生成する。出力部240は、生成された提示文を出力する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、入力された文を、他の言語の文に変換して出力する技術に関する。
【背景技術】
【0002】
現在、ある言語を他の言語に翻訳するための翻訳技術は、様々な局面で利用されている。その1つに、海外旅行などにおいて用いられる通訳機がある。このような通訳機の多くは、旅行会話でよく使われる質問文/依頼文を中心とした文集を内蔵し、入力文に対応する訳文を表示あるいは音声出力するものである。
【0003】
特許文献1には、時間や位置などの状況に応じた処理(画像・文字・音の認識と翻訳)などを行ない、適切な情報(翻訳文、補足説明など)を提供する装置が開示されている。
【特許文献1】特開2005−44075号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
従来の通訳機は、内蔵した文集に基づいて翻訳を行なうものであるため、実際の会話に用いるには使いづらい。実際の会話は、質問したい内容の質問のみで成り立っているわけではなく、例えば、質問の最初や最後に挨拶をしたり、相手の様子から質問の言い方あるいは質問内容を変えることも行なわれている。これに対し、従来の通訳機は、ユーザが文集から選択した文の訳文を出力するものであり、円滑なコミュニケーションを実現できない。
【0005】
つまり、従来の通訳機では、異国間の言語コミュニケーションを行なう場合に、自分や相手の状況に応じた適切な情報交換(翻訳結果出力)ができなかった。例えば、時間や場所、スケジュール、疲労度まで考慮した適切な情報の提示が行なえないため、ユーザが状況に応じて言葉を考える必要があった。
【0006】
また、特許文献1に開示されている装置は、現在いる場所などの情報を利用して、適切な翻訳文を選択する。しかし、この装置は、装置のユーザに関する情報に応じた処理を行なうものであり、この装置を用いた場合、相手の状況に応じたコミュニケーションを図ることには適していない。
【0007】
本発明は、上記のような問題を解決するためになされたものであって、相手との円滑なコミュニケーションを実現する装置を提供することを課題とする。
【課題を解決するための手段】
【0008】
1つの局面に係る本願発明は、相手に提示するための文を作成する情報処理装置であって、入力文を受け付ける第1の入力部と、相手の状況情報を受け付ける第2の入力部と、情報処理装置内部の情報を外部に出力する出力部と、状況情報と相手の状況とを対応付けた判断基準を格納する記憶部と、情報処理装置の動作を制御する制御部とを備え、制御部は、状況情報および判断基準に基づいて、相手の状況を判断する判断部と、判断部の判断結果に基づいて、入力文を翻訳し、提示文を作成する作成部と、出力部による提示文の出力を制御する出力制御部とを含む。
【0009】
好ましくは、記憶部は、状況と挨拶文とを対応付けた挨拶文データをさらに格納し、作成部は、判断結果および挨拶文データに基づいて、状況に応じた挨拶文を含む提示文を作成する。
【0010】
さらに好ましくは、状況情報は、時間情報を含み、挨拶文データは、時間帯と挨拶文とを対応付けたデータを含み、判断部は、時間情報に基づいて、時間帯を判断し、作成部は、判断結果および挨拶文データに基づいて、時間帯に応じた挨拶文を含む提示文を作成する。
【0011】
さらに好ましくは、状況情報は、場所情報を含み、挨拶文データは、地域と挨拶文とを対応付けたデータを含み、判断部は、場所情報に基づいて、地域を判断し、作成部は、判断結果および挨拶文データに基づいて、地域に応じた挨拶文を含む提示文を作成する。
【0012】
さらに好ましくは、状況情報は、環境情報を含み、挨拶文データは、天候と挨拶文とを対応付けたデータを含み、判断部は、環境情報に基づいて、天候を判断し、作成部は、判断結果および挨拶文データに基づいて、天候に応じた挨拶文を含む提示文を作成する。
【0013】
好ましくは、作成部は、出力部が提示文を出力した後に、判断部が、相手に提示文の意味が通じていないと判断した場合に、出力された提示文と入力文の翻訳が異なる提示文を作成する。
【0014】
さらに好ましくは、作成部は、出力部が提示文を出力した後に、判断部が、相手に提示文の意味が通じていないと判断し、かつ、入力文に未知語が含まれている場合、未知語の意味を尋ねる質問文を含む提示文を作成する。
【0015】
さらに好ましくは、第2の入力部は、相手が入力した入力文の履歴を状況情報として受付け、判断部は、履歴を参照して、相手が同じ入力文を所定の回数以上繰り返すときに相手に提示文の意味が通じていないと判断する。
【0016】
さらに好ましくは、第2の入力部は、相手が入力した入力文の履歴を状況情報として受付け、判断部は、履歴を参照して、相手が所定の時間以上発言していないときに提示文の意味が通じていないと判断する。
【0017】
さらに好ましくは、第2の入力部は、相手の顔画像を状況情報として取得するカメラを含み、判断部は、顔画像中の特定の部位についてのパラメータが所定の値にあるときに相手に提示文の意味が通じていないと判断する。
【0018】
好ましくは、作成部は、判断部が、相手が疲れていると判断した場合、入力文を要約モードにて翻訳する。
【0019】
好ましくは、第2の入力部は、場所情報を状況情報として受付け、記憶部は、休憩場所の情報を含む地図情報をさらに格納し、作成部は、判断部が、相手が疲れていると判断した場合、場所情報および地図情報に基づいて、相手を休憩場所に誘導する情報を作成する。
【0020】
好ましくは、出力制御部は、判断部が相手が忙しいと判断した場合に、提示文の出力を中止する。
【0021】
好ましくは、出力部は、情報を音声で出力する音声出力部と、情報を画像で出力する画像出力部とを含み、判断部は、状況情報に基づいて、相手が声が出せるかどうかを判断し、出力制御部は、相手が声を出せない場合、提示文を画像出力部に出力させる。
【0022】
好ましくは、出力部は、情報を音声で出力する音声出力部と、情報を画像で出力する画像出力部とを含み、判断部は、状況情報に基づいて、相手が文字を読めるかどうかを判断し、出力制御部は、相手が文字を読めない場合、提示文を画像出力部に出力させる。
【0023】
他の局面に係る本願発明は、情報処理装置を用いて相手に提示するための文を作成する情報処理方法であって、入力文を受け付けるステップと、相手の状況情報を受け付けるステップと、状況情報と相手の状況とを対応付けた判断基準および状況情報に基づいて、相手の状況を判断するステップと、相手の状況の判断結果に基づいて、入力文を翻訳し、提示文を作成するステップとを備える。
【0024】
さらに他の局面に係る本願発明は、情報処理装置に相手に提示するための文を作成させるための情報処理プログラムであって、情報処理装置は、相手の状況情報と相手の状況とを対応付けた判断基準を格納する記憶部と、情報処理装置の動作を制御する制御部とを含み、入力文を取得するステップと、状況情報を取得するステップと、状況情報および判断基準に基づいて、相手の状況を判断するステップと、相手の状況の判断結果に基づいて、入力文を翻訳し、提示文を作成するステップとを制御部に実行させる。
【発明の効果】
【0025】
本発明によれば、相手の状況情報を取得し、状況情報に基づいて、相手に提示するのに適切な文を生成する。その結果、相手との円滑なコミュニケーションを実現できる。
【発明を実施するための最良の形態】
【0026】
以下、図面を参照しつつ、本発明の実施の形態について説明する。以下の説明では、同一の部分には同一の符号を付してある。それらの名称および機能も同じである。したがってそれらについての詳細な説明は繰り返さない。
【0027】
[第1の実施の形態]
(1.装置構成)
図1は、本実施の形態に係る情報処理装置100の構成をブロック図形式で示す図である。以下、図1を参照して、情報処理装置100の構成について説明する。
【0028】
図1(a)は、情報処理装置100の前面図である。情報処理装置100は、その前面に、LCD(liquid crystal display)110と、キー120と、マイク130とを備える。また、情報処理装置100は、アンテナ140を備える。
【0029】
LCD110は、情報処理装置内部の情報を表示する。なお、LCD110は、表示装置の一例であって、他の種類のディスプレイをLCD110のかわりに用いても構わない。キー120は、ユーザからの指示を受け付ける。キー120は、ユーザからの指示を受け付ける入力装置の一例である。情報処理装置100は、タブレットや、タッチパネルなどをキー120の代わりに備えていてもよい。また、タブレット、タッチパネル、キーなどのうちのいくつかの装置を入力装置として備えていてもよい。タブレットから入力された文字を認識する図示しない手書き文字認識エンジンを備えていてもよい。マイク130は、音を拾って、音声信号に変換する。マイクから入力された声を認識して文字情報に変換する図示しない音声認識エンジンを備えていてもよい。アンテナ140は、別の情報処理装置との通信を行なうためのものであり、例えば電磁波の送受信を行なう。通信方式はアナログ/デジタルいずれであってもよい。通信状況・規模・範囲に応じて、無線LANやWireless USB、Bluetoothや赤外線などを使い分けてもよい。
【0030】
図1(b)は、情報処理装置の背面図である。情報処理装置100は、その背面に、カメラ150と、スピーカ160と、メモリスロット170と、温度センサ180aと、湿度センサ180bと、生体センサ180cとを備える。
【0031】
カメラ150は、画像を撮影する。画像から文字を認識する図示しないOCR(Optical Character Reader)エンジンを備えていてもよい。スピーカ160は、情報処理装置100内部の音声データを基に、音声を出力する。音声の出力には図示しない音声合成エンジンを基にTTS(Text To Speach)による音声合成や予め録音されたデータを再生するようにしてもよい。
【0032】
メモリスロット170には、外部メモリが接続される。メモリスロット170は、外部記憶媒体に格納された情報を読み出すインターフェースの一例である。情報処理装置100は、メモリスロット170のかわりに、CD(compact disc)などから情報を読み出す光ディスクドライブなどを備えていてもよい。また、複数のインターフェースを備えていてもよい。
【0033】
また、温度センサ180a、湿度センサ180bは、それぞれ、温度、湿度を測定する。生体センサ180cは、利用者の生体情報、例えば、心拍数や血圧、あるいは、体温などを測定する。
【0034】
本実施の形態に係る情報処理装置100は、利用者によって携行され、利用者がコミュニケーションを図りたい相手と実際に対面しているときに用いられる。なお、ここで示した情報処理装置100の構成は、一例である。情報処理装置100の構成は、これに限られるわけではない。
【0035】
図2は、第1の実施の形態に係る情報処理装置100の機能的構成を示すブロック図である。以下、図2を参照して、第1の実施の形態に係る情報処理装置100の機能的構成について説明する。
【0036】
情報処理装置100は、通信部210と、入力部220と、制御部230と、出力部240と、状況設定部250と、状況情報記憶部260と、プログラム記憶部270と、データ記憶部275と、外部記憶媒体インターフェース280(以下、外部記憶媒体I/F280とも書く)と、これらを接続する接続部290とを備える。
【0037】
通信部210は、情報処理装置100と外部装置との間の通信を実行する。ここで、外部装置としては、例えば、データサーバベース212や、人工衛星214などが挙げられる。
【0038】
入力部220は、外部から、指示や信号といった情報を受け付ける。入力部220は、キー120と、マイク130と、カメラ150と、センサ180とを含む。センサ180には、温度センサ180a、湿度センサ180b、生体センサ180cが含まれる。
【0039】
制御部230は、情報処理装置100の各部の動作を制御する。制御部230の動作は、本実施の形態では、プログラムを、CPU(central processing unit)などの演算装置で実行することにより実現されるものとする。ただし、制御部230の動作は、ハードウェアで実現されてもよい。制御部230は、状況判断部231と、認識部232と、翻訳部233と、出力制御部235とを含む。
【0040】
状況判断部231は、所定の判断基準に基づいて、入力部220の取得した情報や状況情報記憶部260に格納されている情報などから、情報処理装置100の利用者の状況を判断する。例えば、カメラ150で撮影された顔画像や、マイク130で取得した声の大きさや高さに基づいて、利用者の感情を判断する。特開平2−183371号公報や特開平4−141772号公報にも、顔認識(横ふり、目口の変化)や音声(強弱、速度)による感情を抽出し翻訳結果や音声出力に反映するシステムが開示されている。これらの文献に開示されている技術を用いることができる。
【0041】
これらの顔画像や声の大きさや高さなどの状況の判断に用いられる情報を、状況情報という。状況情報や、状況判断部231による状況判断の具体例については、後述する。
【0042】
認識部232は、入力の音声認識や画像認識を行ない、入力された情報から、言語や状況情報などを認識する。
【0043】
翻訳部233は、入力部220に入力された、あるいは、認識部232で認識された言語を翻訳し、翻訳文を作成する。この翻訳は、一般的な翻訳プログラムによって実現されてもよい。あるいは、ある言語における文例と、他の言語における文例とを対応付けた文例集を参照し、利用者により文例が選択されたことに応じて、他の言語の文例を出力してもよい。言語の種類は日本語⇔英語といった2言語であってもよいし、さらに複数の言語間の翻訳を行なえるように構成されていてもよい。また、同一言語であっても地域による言い回しの違い(方言など)を加味して、切替えられるようになっていてもよい。また、翻訳部233に限らず、通信網などを介し、データベースサーバ212と連携して、翻訳を行なうよう構成してもよい。
【0044】
補足情報処理部234は、状況判断部231の判断結果に基づいて、出力部240に出力させる補足文を作成する。補足情報処理部234は、例えば、会話開始、終了時の挨拶文や、相手の状況を考慮した相手への質問文などを補足文として作成する。なお、補足文を、括弧書きで示したり、補足文の文字色を変更するなどして、補足文であることが分かりやすいようにしてもよい。
【0045】
出力制御部235は、翻訳文あるいは補足文(両者をまとめて、提示文とよぶ)を、出力部240に出力させる。
【0046】
出力部240は、情報処理装置100内部の情報を外部に提示する。なお、ここで、「提示」とは、情報の表示のみならず、情報の音声による出力も含むものとする。出力部240は、スピーカ160と、LCD110とを含む。
【0047】
状況設定部250は、キー120などの入力装置への入力に基づいて、情報処理装置100の利用者の状況情報、例えば、スケジュールを設定し、設定された状況情報を、状況情報記憶部260に格納させる。
【0048】
状況情報記憶部260は、状況情報を格納する。格納される状況情報には、利用者の状況情報と、相手の状況情報との両方が含まれる。ここで、相手の状況情報とは、情報処理装置100の利用者がコミュニケーションを行なおうとしている相手についての状況を判断するために用いることのできる情報である。状況情報記憶部260は、場所情報記憶部261と、時間情報記憶部262と、スケジュール記憶部263と、生体情報記憶部264とを含む。
【0049】
場所情報記憶部261は、情報処理装置100の位置(現在地)や、現在地の周辺情報を格納する。周辺情報は、現在地が含まれる地域名、現在地周辺の施設や交通情報を含む。本実施の形態においては、現在地を、通信部210が通信衛星214から受信したGPS(Global Positioning System;全地球測位システム)信号から得るものとする。ただし、基地局やビーコンからの情報を用いても構わない。周辺情報は、データベースサーバ212に格納された地図データから知ることができる。
【0050】
時間情報記憶部262は、現在時刻や、時差情報を格納する。時差情報とは、現在地と、情報処理装置100の通信先の装置の位置などの他の位置との間の時差を表わす情報である。例えば、「通信先の装置の位置の時刻は、現在地の時刻に比べ3時間進んでいる」といった情報である。あるいは、通信先の装置の位置における時刻そのものを時差情報として用いてもよい。
【0051】
スケジュール記憶部263は、状況設定部250で設定されたスケジュールを格納する。
【0052】
生体情報記憶部264は、利用者あるいは相手の生体情報を格納する。例えば、センサ180で得られる利用者の体温、血圧、マイク130で得られる利用者の声などを格納する。また、マイク130で取得した相手の声や、カメラ150で得た相手の顔画像を格納する。
【0053】
プログラム記憶部270は、情報処理装置100に、各種動作を行なわせるためのプログラムが格納される。
【0054】
データ記憶部275は、通信部210や、外部記憶媒体I/F280が取得したデータを格納する。また、状況の判断基準を格納する。さらに、辞書データベースを格納する。辞書データベースは、ある言語の単語と他の言語の単語とを対応付けたものや、ある言語における文例と、他の言語における文例とを対応付けた文例集を含むものとする。さらに、入力部220に入力された情報の履歴を格納してもよい。
【0055】
外部記憶媒体I/F280は、外部メモリ282やCD(compact disc)284などの外部記憶媒体に格納された情報を読み出す。
【0056】
(2.処理の流れ)
図3は、処理部230が行なう処理を示したフローチャートである。以下、図3を参照して、処理部230が行なう処理について説明する。
【0057】
ステップS301において、処理部230に含まれる認識部232は、入力部220、例えば、キー120やマイク130などに入力された情報を取得する。
【0058】
ステップS303において、認識部232は、ステップS301で入力された情報から、言語を認識する。例えば、マイク130に入力された音声を言語認識する。あるいは、タブレットやタッチパネルにより文字が手書き入力された場合には、手書きされた図形を文字として認識する。なお、キー120により文字が入力された場合、認識部232は、言語認識にあたり特別な処理を行なわなくてもよいが、ここでは、このような場合も、入力の言語認識と呼ぶ。
【0059】
ステップS305において、認識部232は、ステップS301で入力されたマイク130、カメラ150などへの入力から、相手の状況情報を認識する。例えば、マイク130で取得した相手の声の大きさや高さを認識する。また、カメラ150で取得した相手の顔画像から、顔や、顔の各部位の位置を認識する。
【0060】
ステップS307において、処理部230に含まれる状況判断部231は、ステップS305で認識された状況情報、あるいは、状況情報記憶部260に格納されている状況情報に基づいて、相手の、または、自分の状況を判断する。例えば、顔画像中の所定の部位のパラメータと、所定の値との関係により、表情を分類する。このような分類にあたっては、例えば、特開2004−62482号公報に開示されている技術を用いることができる。
【0061】
ステップS309において、処理部230に含まれる翻訳部233は、入力された言語を翻訳し、翻訳文を作成する。例えば、ステップS303において認識された言語、あるいは、キー120などの入力装置により入力された言語を翻訳する。なお、この翻訳にあたっては、ステップS307における状況判断結果が反映されることがある。
【0062】
ステップS311において、処理部230に含まれる補足情報処理部234は、ステップS307の状況判断結果に基づいて、出力部240に出力する補足文を作成する。
【0063】
ステップS313において、処理部230に含まれる出力制御部235は、出力部240に、ステップS309で作成された翻訳文、あるいは、ステップS311で作成された補足文を出力させる。
【0064】
(3.状況に応じた翻訳)
ここで、処理部230による翻訳処理の具体例について、図4を参照して説明する。図4は、処理部230による翻訳処理の一例の流れを示すフローチャートである。この例では、処理部230は、状況判断の結果に応じて、その処理を変える。
【0065】
ステップS401において、処理部230は、入力部220に入力された言語を認識する。処理部230は、入力に対応する認識結果の候補が、複数ある場合は、最も妥当な(例えば、サンプルとの類似度が高い)候補を、認識結果に決定する。
【0066】
ステップS403において、処理部230は、ステップS401において認識された言語の翻訳文を生成する。ここでは、処理部230は、翻訳プログラムに基づき、認識された言語に対応する訳の候補のうち、最も妥当な(例えば、前後関係により定まる出現確率などのスコアが高い)候補を用いて翻訳文を作成するものとする。このような翻訳技術としては、例えば、特開2005−31922号公報に開示されているものを用いることができる。
【0067】
ステップS405において、処理部230は、ステップS403において作成された翻訳文を、出力部240に出力させる。
【0068】
ステップS407において、処理部230は、カメラ150で取得した相手の顔画像に基づき、相手が困った顔をしたか判断する。具体的には、顔画像の特定の部位(目、眉など)の位置などにより定まるパラメータが、所定の範囲内にあるとき、相手が困った顔であると判断する。
【0069】
相手が困った顔をしていない場合(ステップS407においてNo)、処理部230は、ステップS401で認識された言語の翻訳を終了する。相手が困っていないので、翻訳には問題がないと判断できるためである。
【0070】
相手が困った顔をした場合(ステップS407においてNo)、処理部230は、ステップS409において、ステップS401で認識された言語の中に、データ記憶部275の辞書データベースにない未登録語があるかどうか判断する。
【0071】
ステップS401で認識された言語の中に未登録語がない場合(ステップS409においてNo)、処理部230は、ステップS411において、翻訳あるいは認識の曖昧度が高いかどうか判断する。ここで、処理部230は、翻訳の曖昧度を、訳語のスコアに基づいて定めるものとする。なお、処理部230は、訳語自身のスコアに、他の訳候補のスコアを加味して曖昧度を定めてもよい。例えば、訳語のスコアと他の訳候補のスコアとの差が小さい場合には、曖昧度を上げるようにしてもよい。処理部230は、認識の曖昧度についても、サンプルとの類似度を用いて、翻訳の曖昧度と同様に定めるものとする。処理部230は、このように算出された翻訳の曖昧度あるいは認識の曖昧度が、所定の値以上であるときに、翻訳あるいは認識の曖昧度が高いと判断する。
【0072】
翻訳あるいは認識の曖昧度が高くないとき(ステップS411においてNo)、処理部230は、ステップS413において、相手の地位(目上かどうか、外国人かどうかなど)を判断する。そして、ステップS415において、相手の地位に応じて丁寧度を変えた文を生成する。処理部230は、例えば、特開平4−321177号公報、特開平10−149361号公報、特開2006−59017号公報に開示されている技術を用いて、このような文を生成することができる。ステップS409およびステップS411の結果により、出力した翻訳文の意味内容には問題がないが、経緯表現が不適切であり、相手が困惑したと判断できるため、このような処理を行なう。
【0073】
ステップS415の処理後、処理部230は、ステップS415で提示した翻訳文が適切であるか確認するため、ステップS407からの処理を繰り返す。
【0074】
翻訳あるいは認識の曖昧度が高いとき(ステップS411においてYes)、処理部230は、ステップS417において、別候補による翻訳文を作成し、出力部240に出力させる。この際、単に別候補の翻訳を作成して、出力部240に出力させるだけでなく、『違っていますか?』『では、こういうこと(別候補による翻訳文)をおっしゃりたいですか?』などの補足文を作成し、補足文と翻訳文とを組み合わせた提示文を出力部240に出力させてもよい。
【0075】
ステップS417の処理後、処理部230は、ステップS417で提示した翻訳文が適切であるか確認するため、ステップS407からの処理を繰り返す。
【0076】
一方、ステップS401で認識された言語の中に未登録語がある場合(ステップS409においてYes)、処理部230は、ステップS419において、未登録語について相手に問い合わせる。例えば、場所情報を考慮して、『この単語XXは初めて聞くのですが、ここはレストランですので食べ物か飲み物の一種ですか』というような、未知語のジャンルを尋ねる文を出力部240に出力させる。
【0077】
ステップS421において、処理部230は、ステップS319における文の提示後の相手の発言(質問への返答)に応じて翻訳を行なう。例えば、上の文への回答が肯定的なものであった場合、XXを「食べ物」という解釈で翻訳処理を進める。このようにすることで、未知語を、全くの未知であるとして翻訳するよりも、翻訳の精度を向上できる。
【0078】
上述の動作例では、相手が困ったことをきっかけに、相手に提示文の意味が通じたか、つまり、翻訳が適切であるかどうかを判断しているが、他の情報をもとに翻訳が適切か判断し、適切でない場合に、異なる翻訳文の提示等を行なうようにしてもよい。例えば、相手が同じ発言を繰り返すかどうかを、翻訳が適切かどうかの判断に用いてもよい。具体的には、データ記憶部275に格納されている相手の発言の履歴を基に、相手が同じ発言を所定の回数以上行なっている場合に、相手に提示文の意味が通じていないと判断する。あるいは、所定の時間以上、相手からの発言がない場合に、相手が困っていると判断してもよい。
【0079】
また、相手の地位にふさわしい表現をしているかを、翻訳が適切かどうかの判断の前に行なってもよい。なお、ここでは、困った顔であるかを用いているが、怒った顔であるかを用いて、相手の地位にふさわしい表現をしているか判断してもよい。
【0080】
なお、上述の動作例における判断をすべて行なう必要があるわけではない。例えば、相手が困った顔をしたかどうかの判断と、翻訳または認識の曖昧度が高いかどうかの判断のみ行なうなど、用途や必要な翻訳精度などに応じて、判断の組み合わせを適宜変更してもよい。
【0081】
以上説明したように、本情報処理装置100によれば、会話途中に、会話の流れが変わった時やトラブルが発生した時などにも、適切に会話を進めることができる。
【0082】
(4.挨拶文の生成)
実際の人間同士(特に初対面の人との)会話では、いきなり情報を得るための質問をするのではなく、会話のきっかけとして、相手や周囲の状況を見ながらの挨拶を交わしてから始めるのが普通である。例えば、「ちょっとお尋ねしたいのですが」「今よろしいですか」「暑いですね〜」などの挨拶を交わしてから、「このあたりでジュース売り場はありますか?」などの質問をする。
【0083】
ましてや相手が文化も風習も異なる外国人の場合にはこのような本来の質問や依頼とは異なる文を会話の冒頭や合間に挟むことでスムーズな会話を進めることが非常に重要である。にもかかわらず、現在の通訳機では、単刀直入に相手に質問や依頼をすることになるため非常にぎこちない会話になったり、もしくはそういった文まで一々翻訳もしくは選択させる必要があり時間がかかるものになっていた。
【0084】
本実施の形態に係る情報処理装置100は、状況に応じた挨拶文を、会話の開始時あるいは、会話の終了時に生成し、出力することができる。
【0085】
会話の開始時の挨拶文の生成について、図5を参照して説明する。図5は、会話開始時の挨拶文の生成の際の処理の流れを示すフローチャートである。
【0086】
処理部230は、ステップS501において、会話の開始を認識する。処理部230は、例えば、利用者からの入力文を受け付けたとき、情報処理装置100の電源が入れられたとき、あるいは、情報処理装置100が複数のアプリケーションを持つ場合、翻訳のアプリケーションが立ち上げられたときを、会話の開始として認識する。
【0087】
ステップS503において、処理部230は、時間情報記憶部262から、現在時間を読み出す。
【0088】
ステップS505において、処理部230は、温度センサ180a、湿度センサ180bで測定された温度および湿度を取得する。なお、通信部210を介して、外部から天候データを取得する構成であっても構わない。
【0089】
ステップS507において、処理部230は、現在時間、温度、湿度に基づいて、適切な会話開始時の挨拶文を生成する。本実施の形態では、『おはよう』『こんばんは』といった複数種類の挨拶文の各々が、その挨拶が使われる時間帯と対応付けたデータや、天候と『暑いですね』『雨が降っていますね』などの挨拶文とを対応付けたデータを含む開始挨拶文データがデータ記憶部275に格納されており、処理部230は、開始挨拶文データを参照して、現在時間、天候に適した挨拶文を生成するものとする。
【0090】
なお、挨拶文を決定するのに用いる情報は、上に挙げた現在時間、温度、湿度の組み合わせに限られるものではない。
【0091】
例えば、地域によって、適切な挨拶が変わる場合がある。そこで、地域と挨拶文とを関係付けたデータをデータ記憶部275に格納しておけば、補足情報処理部275は、現在地情報を基に、地域にあった挨拶文を出力することができる。通常の利用者は、地域による挨拶文の違いについては知らないので、本情報処理装置100は、より円滑なコミュニケーションの助けとなる。
【0092】
会話の終了時の挨拶文の生成について、図6を参照して説明する。図6は、会話終了時の挨拶文の生成の際の処理の流れを示すフローチャートである。
【0093】
処理部230は、ステップS601において、会話の終了を認識する。処理部230は、例えば、電源オフボタンが押されたときに会話が終了すると認識する。あるいは、スケジュール記憶部263に格納されたスケジュールを参照して、会話を終了すべき時刻(例えば、スケジュールの開始時刻の所定時間前)になったときに、会話が終了するとしてもよい。
【0094】
ステップS603において、処理部230は、会話の終了時の挨拶のテンプレートをデータ記憶部275から取得する。データ記憶部275には、例えば、『今日は○○について教えていただき有難うございました』『今日は○○についてお話しいただき有難うございました』といったテンプレートが格納されているものとする。
【0095】
ステップS605において、処理部230は、データ記憶部275に格納された会話履歴を検索し、テンプレートに代入すべき語句を決定する。処理部230は、代入すべき語句を、会話履歴中の登場頻度や、利用者が最初に行なった質問などに基づいて決定する。
【0096】
なお、テンプレートは、複数種類準備されていてもよい。この場合、処理部230は、会話の履歴から、適切なテンプレートを取得する。例えば、利用者が、『○○について教えて下さい』という質問文を入力している場合、『今日は○○について教えていただき有難うございました』というテンプレートを選択して、挨拶文を生成する。
【0097】
[第2の実施の形態]
第1の実施の形態では、利用者によって携行され、利用者がコミュニケーションを図りたい相手と実際に対面しているときに用いられる情報処理装置100と、その動作態様について説明した。
【0098】
ここからは、第2の実施の形態として、離れた位置にいる複数人が、情報処理装置を利用して、コミュニケーションを図るという使用態様について説明する。
【0099】
(1.装置構成)
第2の実施の形態に係る情報処理装置100としては、第1の実施の形態に示したものとほぼ同様のものを用いることができる。ただし、第2の実施の形態では、情報処理装置100は、相手の表情ではなく、自分の表情を取得する必要があることから、カメラ150は、情報処理装置100の前面に設けられることが好ましい。
【0100】
図7は、第2の実施の形態に係る情報処理装置100の機能的構成を示すブロック図である。情報処理装置100自身の機能的構成は、第1の実施の形態に係るものと、ほぼ同様である。ただし、他の情報処理装置100#と、通信部210を介して通信できるようになっている点が異なる。また、情報処理装置100で生成された提示文は、通信部210を介して情報処理装置100#に送信され、情報処理装置100#の出力部240に出力される。
【0101】
情報処理装置100は、通信部210を介して、情報処理装置100#が取得した情報処理装置100#の使用者の状況情報を取得できる。顔画像を例にとって説明すると、第1の実施の形態では、情報処理装置100の利用者は、対面する相手の顔画像をカメラ150で取得していた。しかし、本実施の形態においては、情報処理装置100は、情報処理装置100#に搭載のカメラで取得された相手の顔画像を通信部210を介して取得することになる。
【0102】
(2.処理の流れ)
第2の実施の形態に係る情報処理装置100が行なう処理の流れの概要は、第1の実施の形態のもの、すなわち、図3を参照して説明したものとほぼ同様である。ただし、ステップS301において取得される情報には、通信部210を介して得られる情報処理装置100#からの情報も含まれる。
【0103】
(3.状況に応じた翻訳)
第1の実施の形態と同様、情報処理装置100は、相手が困った顔をする、同じ質問を繰り返すなどの状況に応じて、翻訳内容を変更したり、会話を補う補足文(『違っていますか?』など)を提示することができる。
【0104】
(4.挨拶文の生成)
第1の実施の形態と同様、情報処理装置100は、状況に応じた挨拶文を、会話の開始時あるいは、会話の終了時に生成し、出力することができる。ただし、本実施の形態においては、利用者と相手とは互いに離れた位置にいることが多い。時には、異なる国にいる場合がある。そのような場合を考慮して、情報処理装置100は、時間情報記憶部262に記憶されている時差情報に基づいて、挨拶文を生成してもよい。この構成によれば、ユーザが相手のいる場所での時間を考慮することなく、相手に適切な挨拶文を提示することができる。
【0105】
(5.モード切替)
第2の実施の形態では、利用者と相手とが互いに離れた位置にいることが多い。したがって、第1の実施の形態以上に、相手の状況に応じて、情報処理装置100の動作を変更することが重要になってくる。
【0106】
例えば、相手が、会議中であったり、電車に乗っているなど、声を出せない状況にいるとき、情報処理装置100が、相手の情報処理装置100#に音声データを送るのは具合が悪い。また、相手が忙しいときに、こちらが一方的に話を続けるのは不都合である。
【0107】
そこで、本実施の形態においては、情報処理装置100は、出力モードの切替をおこなうものとする。図8を参照して、出力モードの切替について説明する。図8は、出力モードの切替にあたり、情報処理装置100が行なう処理の流れの一例を示すフローチャートである。
【0108】
ステップS801において、処理部230は、通信部210を介して相手の場所情報を取得する。
【0109】
ステップS803において、処理部230は、相手の場所情報に基づいて、相手が声を出せる場所にいるか判断する。本実施の形態では、相手の場所情報に、その場所の特性(交通機関、ホール、道、公園など)が含まれており、処理部230は、受信した相手の場所の特性から、判断基準(例えば、交通機関では声をだしてはいけないなど)にしたがって、相手が声を出せる場所にいるか判断するものとする。なお、相手の場所情報は、経度・緯度などの単なる位置情報であって、処理部230は、情報処理装置100自身の場所情報記憶部261に記憶されている地図情報および判断基準から、相手が声を出せる場所にいるか判断してもよい。
【0110】
相手が声を出せない場所にいる場合(ステップS803においてNo)、処理部230は、ステップS811の処理に進む。
【0111】
相手が声を出せる場所にいる場合(ステップS803においてYes)、処理部230は、ステップS805において、通信部210を介して相手の時間情報を取得する。また、ステップS807において、相手のスケジュールを取得する。
【0112】
ステップS809において、処理部230は、相手の時間およびスケジュールから、相手が声を出せるか判断する。スケジュールが入っている時間帯であれば、相手が声を出せないと判断する。
【0113】
相手が声を出せない時間である場合(ステップS809においてNo)、処理部230は、ステップS811の処理に進む。
【0114】
ステップS811において、処理部230は、情報処理装置100が音声出力モードになっている場合は、画像出力モードに切り替える。また、『今の場所では声が出せませんので、文字入力にします』、『そのため、応答時間がかかるかもしれません』などの補足文を、利用者や相手に提示してもよい。
【0115】
相手が声を出せる時間である場合(ステップS809においてYes)、処理部230は、ステップS813において、スケジュールおよび時間に基づいて、相手が忙しいか判断する。例えば、スケジュールの入っている時間およびその前後の所定の時間(例えば、スケジュール開始5分前から)は、相手が忙しいと判断する。
【0116】
相手が忙しくない場合(ステップS813においてNo)、通常に会話できると判断できるため、処理部230は、モード切替処理を終了する。
【0117】
相手が忙しい場合(ステップS813においてYes)、処理部230は、ステップS815において、翻訳の一時停止を伝える旨の文を作成する。例えば、『そちらの時間帯ではお忙しいようですので、○○(後ほど掛け直し)ます』との補足文を提示する。この文は、情報処理装置100の利用者および情報処理装置100#の利用者の双方に提示されるものとする。そのあと、モード切替処理を終了する。あるいは、所定の時間後に再開するメッセージを提示し、所定の時間経過後に、再び、認識および翻訳処理を再開するという構成であってもよい。
【0118】
なお、声が出せるかの判断と、忙しいかどうかの判断は独立に行なってもよい。また、上記の構成を変形して、声が出せるかのかわりに、文字が読めるかどうかを判断し、文字が読めない場合に、翻訳文表示を行なうように切り替える構成であってもよい。
【0119】
さらに、上記の処理を応用して、相手が暗い場所にいる場合は、文字の大きさを大きくする、あるいは、相手が騒音の多い場合には、音声を大きくしたり、速度調整を大きくするといったこともできる。
【0120】
モード切替の他の例を、図9を参照して説明する。図9は、出力モードの切替にあたり、情報処理装置100が行なう処理の流れの他の例を示すフローチャートである。この例は、相手が疲れているかどうかによりモードを切り替えるものである。
【0121】
ステップS901において、処理部230は、マイク130、カメラ150、生体センサ180cから、相手の生体情報を取得する。ここでの生体情報には、相手の表情、相手の声(高さ、大きさ)、体温、血圧が含まれるものとする。
【0122】
ステップS903において、処理部230は、生体情報に基づいて、相手が疲れているかどうか判断する。例えば、体温が所定の範囲内にあり、血圧が所定の変動パターンを示し、かつ、声が所定の大きさ以下のときに疲れていると判断する。ただし、この判断基準は、これに限られるものではない。各情報を適宜組み合わせて、相手が疲れているか判断するようにしてもよい。
【0123】
相手が疲れていると判断した場合(ステップS903においてYes)、ステップS905において、処理部230は、『疲れたので、○○(休みに/手短に/別の場所に移動)しましょう』といった補足文を相手に提示する。いずれか1つの補足文のみを表示できる構成であってもよいし、複数の補足文を利用者に提示し、その中から選ばせる構成であってもよい。
【0124】
処理部230は、ステップS907からステップS911のいずれかで、ステップS905で出力された補足文の処理内容にあった動作を行なう。
【0125】
『疲れたので、休みにしましょう』といった補足文を出力した場合、処理部230は、ステップS907において、翻訳処理を中断する。
【0126】
『疲れたので、手短にしましょう』といった補足文を出力した場合、処理部230は、ステップS909において、要約モードで翻訳を行なう。例えば、数文のうちの1文を出力するなど、既存の要約技術を用いて翻訳する。また、例えば、特開平10−149361号公報に開示されている技術を用いることもできる。
【0127】
『疲れたので、別の場所に移動しましょう』といった補足文を出力した場合、処理部230は、ステップS909において、翻訳処理を一旦停止するとともに、場所情報記憶部261に記憶された地図情報および現在位置を参照して、休憩場所へ案内する情報を提示する。
【0128】
モード切替のさらに他の例を、図10を参照して説明する。図10は、出力モードの切替にあたり、情報処理装置100が行なう処理の流れのさらに他の例を示すフローチャートである。この例は、天候によりモードを切り替えるものである。
【0129】
ステップS1001において、処理部230は、相手側の情報処理装置100#が置かれた場所の温度を取得し、取得した温度が第1の所定温度以上であるかどうか判断する。
【0130】
取得した温度が第1の所定温度以上である場合(ステップS1001においてYes)、処理部230は、ステップS1003において、翻訳を一時中断する。そして、ステップS1005において、場所情報記憶部261に記憶された地図情報および現在位置を参照して、建物の中など涼しい場所へ案内する情報を提示する。以上で、モード切替処理を終了する。
【0131】
取得した温度が第1の所定温度以上でない場合(ステップS1001においてNo)、処理部230は、ステップS1007において、取得した温度が第2の所定温度以下であるかどうか判断する。
【0132】
取得した温度が第2の所定温度以下である場合(ステップS1007においてYes)、処理部230は、ステップS1009において、翻訳を一時中断する。そして、ステップS1011において、場所情報記憶部261に記憶された地図情報および現在位置を参照して、建物の中など暖かい場所へ案内する情報を提示する。以上で、モード切替処理を終了する。
【0133】
取得した温度が第2の所定温度以下でない場合(ステップS1007においてNo)、暑くも寒くもないので、そのまま、翻訳処理を続ける。
【0134】
なお、情報処理装置100は、湿度センサ180bの出力、あるいは、相手の場所情報およびデータベースサーバ212から取得した天候データに基づいて、相手のいる位置で雨が降っているかどうか判断し、雨が降っていると判断した場合に、屋内に案内してもよい。
【0135】
[その他]
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
【図面の簡単な説明】
【0136】
【図1】本実施の形態に係る情報処理装置100の構成をブロック図形式で示す図である。
【図2】第1の実施の形態に係る情報処理装置100の機能的構成を示すブロック図である。
【図3】処理部230が行なう処理を示したフローチャートである。
【図4】処理部230による翻訳処理の一例の流れを示すフローチャートである。
【図5】会話開始時の挨拶文の生成の際の処理の流れを示すフローチャートである。
【図6】会話終了時の挨拶文の生成の際の処理の流れを示すフローチャートである。
【図7】第2の実施の形態に係る情報処理装置100の機能的構成を示すブロック図である。
【図8】出力モードの切替にあたり、情報処理装置100が行なう処理の流れの一例を示すフローチャートである。
【図9】出力モードの切替にあたり、情報処理装置100が行なう処理の流れの他の例を示すフローチャートである。
【図10】出力モードの切替にあたり、情報処理装置100が行なう処理の流れのさらに他の例を示すフローチャートである。
【符号の説明】
【0137】
100 情報処理装置、110 LCD、120 キー、130 マイク、140 アンテナ、150 カメラ、160 スピーカ、170 メモリスロット、180a 温度センサ、180b 湿度センサ、180c 生体センサ。

【特許請求の範囲】
【請求項1】
相手に提示するための文を作成する情報処理装置であって、
入力文を受け付ける第1の入力部と、
前記相手の状況情報を受け付ける第2の入力部と、
前記情報処理装置内部の情報を外部に出力する出力部と、
前記状況情報と前記相手の状況とを対応付けた判断基準を格納する記憶部と、
前記情報処理装置の動作を制御する制御部とを備え、
前記制御部は、
前記状況情報および前記判断基準に基づいて、前記相手の状況を判断する判断部と、
前記判断部の判断結果に基づいて、前記入力文を翻訳し、提示文を作成する作成部と、
前記出力部による前記提示文の出力を制御する出力制御部とを含む、情報処理装置。
【請求項2】
前記記憶部は、前記状況と挨拶文とを対応付けた挨拶文データをさらに格納し、
前記作成部は、前記判断結果および前記挨拶文データに基づいて、前記状況に応じた前記挨拶文を含む提示文を作成する、請求項1に記載の情報処理装置。
【請求項3】
前記状況情報は、時間情報を含み、
前記挨拶文データは、時間帯と挨拶文とを対応付けたデータを含み、
前記判断部は、前記時間情報に基づいて、前記時間帯を判断し、
前記作成部は、前記判断結果および前記挨拶文データに基づいて、前記時間帯に応じた前記挨拶文を含む提示文を作成する、請求項2に記載の情報処理装置。
【請求項4】
前記状況情報は、場所情報を含み、
前記挨拶文データは、地域と挨拶文とを対応付けたデータを含み、
前記判断部は、前記場所情報に基づいて、前記地域を判断し、
前記作成部は、前記判断結果および前記挨拶文データに基づいて、前記地域に応じた前記挨拶文を含む提示文を作成する、請求項2に記載の情報処理装置。
【請求項5】
前記状況情報は、環境情報を含み、
前記挨拶文データは、天候と挨拶文とを対応付けたデータを含み、
前記判断部は、前記環境情報に基づいて、前記天候を判断し、
前記作成部は、前記判断結果および前記挨拶文データに基づいて、前記天候に応じた前記挨拶文を含む提示文を作成する、請求項2に記載の情報処理装置。
【請求項6】
前記作成部は、前記出力部が前記提示文を出力した後に、前記判断部が、前記相手に前記提示文の意味が通じていないと判断した場合に、出力された前記提示文と前記入力文の翻訳が異なる前記提示文を作成する、請求項1に記載の情報処理装置。
【請求項7】
前記作成部は、前記出力部が前記提示文を出力した後に、前記判断部が、前記相手に前記提示文の意味が通じていないと判断し、かつ、前記入力文に未知語が含まれている場合、前記未知語の意味を尋ねる質問文を含む前記提示文を作成する、請求項6に記載の情報処理装置。
【請求項8】
前記第2の入力部は、前記相手が入力した前記入力文の履歴を前記状況情報として受付け、
前記判断部は、前記履歴を参照して、前記相手が同じ前記入力文を所定の回数以上繰り返すときに前記相手に前記提示文の意味が通じていないと判断する、請求項6または7に記載の情報処理装置。
【請求項9】
前記第2の入力部は、前記相手が入力した前記入力文の履歴を前記状況情報として受付け、
前記判断部は、前記履歴を参照して、前記相手が所定の時間以上発言していないときに前記提示文の意味が通じていないと判断する、請求項6または7に記載の情報処理装置。
【請求項10】
前記第2の入力部は、前記相手の顔画像を前記状況情報として取得するカメラを含み、
前記判断部は、前記顔画像中の特定の部位についてのパラメータが所定の値にあるときに前記相手に前記提示文の意味が通じていないと判断する、請求項6または7に記載の情報処理装置。
【請求項11】
前記作成部は、前記判断部が、前記相手が疲れていると判断した場合、前記入力文を要約モードにて翻訳する、請求項1から10のいずれか1項に記載の情報処理装置。
【請求項12】
前記第2の入力部は、場所情報を前記状況情報として受付け、
前記記憶部は、休憩場所の情報を含む地図情報をさらに格納し、
前記作成部は、前記判断部が、前記相手が疲れていると判断した場合、前記場所情報および前記地図情報に基づいて、前記相手を前記休憩場所に誘導する情報を作成する、請求項1から10のいずれか1項に記載の情報処理装置。
【請求項13】
前記出力制御部は、前記判断部が前記相手が忙しいと判断した場合に、前記提示文の出力を中止する、請求項1から12のいずれか1項に記載の情報処理装置。
【請求項14】
前記出力部は、
前記情報を音声で出力する音声出力部と、
前記情報を画像で出力する画像出力部とを含み、
前記判断部は、前記状況情報に基づいて、前記相手が声が出せるかどうかを判断し、
前記出力制御部は、前記相手が声を出せない場合、前記提示文を前記画像出力部に出力させる、請求項1から13のいずれか1項に記載の情報処理装置。
【請求項15】
前記出力部は、
前記情報を音声で出力する音声出力部と、
前記情報を画像で出力する画像出力部とを含み、
前記判断部は、前記状況情報に基づいて、前記相手が文字を読めるかどうかを判断し、
前記出力制御部は、前記相手が文字を読めない場合、前記提示文を前記画像出力部に出力させる、請求項1から13のいずれか1項に記載の情報処理装置。
【請求項16】
情報処理装置を用いて相手に提示するための文を作成する情報処理方法であって、
入力文を受け付けるステップと、
前記相手の状況情報を受け付けるステップと、
前記状況情報と前記相手の状況とを対応付けた判断基準および前記状況情報に基づいて、前記相手の状況を判断するステップと、
前記相手の状況の判断結果に基づいて、前記入力文を翻訳し、提示文を作成するステップとを備える、情報処理方法。
【請求項17】
情報処理装置に相手に提示するための文を作成させるための情報処理プログラムであって、
前記情報処理装置は、前記相手の状況情報と前記相手の状況とを対応付けた判断基準を格納する記憶部と、前記情報処理装置の動作を制御する制御部とを含み、
入力文を取得するステップと、
前記状況情報を取得するステップと、
前記状況情報および前記判断基準に基づいて、前記相手の状況を判断するステップと、
前記相手の状況の判断結果に基づいて、前記入力文を翻訳し、提示文を作成するステップとを前記制御部に実行させる、情報処理プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate


【公開番号】特開2010−44495(P2010−44495A)
【公開日】平成22年2月25日(2010.2.25)
【国際特許分類】
【出願番号】特願2008−206929(P2008−206929)
【出願日】平成20年8月11日(2008.8.11)
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.Bluetooth
【出願人】(000005049)シャープ株式会社 (33,933)
【Fターム(参考)】