説明

情報処理装置、情報処理方法及びソフトウェア

【課題】外国語を翻訳するための翻訳データのデータサイズは小さくし、翻訳の概要と詳細のどちらも表示できる手段を備えた携帯電話を提供すること。
【解決手段】
上記課題を解決するために、例えば、請求項1記載の如く、他の装置と通信する通信部と、画像情報を出力する撮像部と、該撮像部により出力された画像情報に含まれる識別情報を認識する認識部と、該認識部により認識された識別情報に関連した関連情報の取得を指示する関連情報取得指示部と、該関連情報取得指示部により該関連情報の取得が指示された場合に該関連情報を該通信部を介して取得し表示するように制御する制御部とを備えればよい。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、例えば、携帯電話、PHS(Personal Handy-phone System)、PDA(Personal Digital Assistant)やPC(Personal Computer)等の情報処理装置に関するものである。
【背景技術】
【0002】
特開2002−252691号公報には、OCR(Optical Character Recognition)機能により、撮像した画像情報に含まれる文字を文字情報に変換し、印刷物に掲載された住所や名前、電話番号、URL(Uniform Resource Locator)などを入力できる携帯電話が提案されている。また、特開平5−274346号公報には、紙面上に印刷された文字列のイメージを読み取り、OCR機能を利用してそのイメージから文字列を認識して文字情報に変換し、翻訳辞書を参照してその文字列に対応する翻訳を表示部に表示する電子辞書が提案されている。
【0003】
【特許文献1】特開2002−252691号公報
【特許文献2】特開平5−274346号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
しかしながら、上記特許文献1では、印刷物に掲載された住所等の情報を入力できるOCR機能を搭載した携帯電話が開示されているものの、その入力された情報をどのように使うかといった使い勝手の面での検討が不十分であった。また、上記特許文献2では、例えば、OCR機能により入力された単語の翻訳を表示する際、簡単な翻訳しか表示されず、より詳しい翻訳やその単語の使い方などを知りたい場合は、別途英和辞書を引き直さなければならず、使い勝手が悪いといった問題があった。
【0005】
そこで、本発明は、使い勝手の向上した情報処理装置、情報処理方法及びソフトウェアを提供することを目的とする。
【課題を解決するための手段】
【0006】
上記課題を解決するために、例えば、請求項1記載の如く、他の装置と通信する通信部と、画像情報を出力する撮像部と、該撮像部により出力された画像情報に含まれる識別情報を認識する認識部と、該認識部により認識された識別情報に関連した関連情報の取得を指示する関連情報取得指示部と、該関連情報取得指示部により該関連情報の取得が指示された場合に該関連情報を該通信部を介して取得し表示するように制御する制御部とを備えればよい。
【発明の効果】
【0007】
本発明によれば、使い勝手の向上した情報処理装置、情報処理方法及びソフトウェアを提供することができる。
【発明を実施するための最良の形態】
【0008】
以下、本発明の実施の形態を、図面を用いて説明する。なお、以下の図面において、同一の構成部については同符号を用いる。
【0009】
図1は、本実施例(第1の実施例)に係る携帯電話の構成ブロック図である。本実施例においては、携帯電話に搭載された画像認識機能(OCR機能)を利用して、紙面等に掲載された英単語の日本語訳を出力する場合を想定する。
【0010】
携帯電話100は、入力部101、CPU102、撮像部103、記憶部104、画像認識部105、辞書データ106、表示部107、通信部108、検索部109などを含んだものとして構成される。
【0011】
入力部101は、電話番号その他の情報を入力する入力部であり、携帯電話の電源をON/OFFするとき、被写体を撮像するときなど、ユーザが携帯電話に入力を与える際に使用するものである。CPU102は、記憶部104に記憶されたプログラムに基づいて動作し、例えば、入力部101からの入力に応じて各部を制御するものである。
【0012】
撮像部103は、例えば、カメラなどで構成されたものであり、被写体である人の顔や、景色、文字などを撮像し、CPU102で扱える画像情報に変換し、変換された画像情報は必要に応じて表示部107等に出力する。ユーザは、表示部107に出力された画像情報をモニタしながら撮像したい画像を選んでシャッター等により撮像の指示を行う。シャッターが押下されれば、撮像された画像情報は記憶部104に記憶される。また、記憶部104は、携帯電話100で扱うデータやソフトウェアなども記憶する。
【0013】
画像認識部105は、画像情報に含まれる文字や記号等の識別情報を認識する。ここで、識別情報とは、文字、記号等で表された情報であり、例えば、ホームページのアドレス、メールアドレス、住所、電話番号、地図情報あるいは英語の単語等のように文字や記号等で表現されたものであり、事物を識別できる情報であれば上記例以外のものでも構わない。
【0014】
また、ここで、認識とは、撮像部103により撮像された画像情報に含まれる識別情報を抽出し、その識別情報を所定の領域ごとに分割し、分割された領域を所定のパラメータ値に変換し、そのパラメータ値に基づいて分割された領域がどのような情報であるかを決定することをいう。
【0015】
より具体的にいえば、例えば、画像情報内の「abc」という文字を「認識」する場合を考えると、まず、「abc」が画像情報内のどの位置の情報であるかを特定し、次に、「a」「b」「c」に分割し、「a」を所定のパラメータ値(例えば、その文字を縦、横、斜めからの見た線分の構成を、文字の白色部分を「0」、黒色部分を「1」としてパラメータ化された値)に変換する。そして、変換されたパラメータ値に最も類似したパラメータ値と対応付けされた文字を文字パターンデータ表より選び出す。文字パターンデータ表とは、パラメータ値とそのパラメータ値に対応したアルファベット等の文字とが記述されている表であり、予め記憶されているものである。なお、画像認識部105はOCR機能を備えており、OCR機能を実現する具体的な構成は、例えば、特許文献1に記されている。
【0016】
記憶部104に記憶された辞書データ106には、例えば、外国語の単語等といった識別情報、該識別情報の日本語訳及び該識別情報の様々な日本語訳や使い方・用例等について詳しく書かれたホームページのURL等が含まれる。なお、翻訳言語としては、日本語訳に限定されるものではなく、英語やフランス語などでもよい。さらに、識別情報の説明であることがわかれば、絵や音などのデータでもよい。
【0017】
表示部107は、撮像部103により撮像された画像や画像認識部105により認識された識別情報を表示する。その他、表示部107に、例えば、電源状態、電波強度、電池残量、サーバ接続状態、未読メール等の動作状態、入力した電話番号、メール宛先、メール送信文書等や、動画および静止画、着信時の発呼者の電話番号、着信メール文書、接続されたインターネット画面等の受信データの表示、また、携帯電話の機能を利用するために必要な画面を表示する。通信部108は、携帯電話100がインターネットや他の情報処理装置などにアクセスするための通信処理を行う。検索部109は、辞書データ106を参照し、画像認識部105により得られた識別情報と一致する識別情報を検索する。
【0018】
また、CPU102は、モード判定フラグを利用して、撮像モードが通常の静止画又は動画を撮像する通常撮像モードであるか、画像認識部105を利用して識別情報を認識するモードである認識モードであるかを判定する。ここで、モード判定フラグは、例えば、記憶部104に記憶されたソフトウェアのプログラム中に存在する変数で、認識モードの場合と通常撮像モードとでは異なる値になるようにし、CPU102はこの変数に基づいて認識モードと通常撮像モードと、例えば、入力部101による操作により切り換える。以下、実施例では、「認識モード」と「通常撮像モード」との2種類を有する場合を考えるが、これに限定されるものではなく、それ以外にモードがあっても構わない。
【0019】
図2は、辞書データ106の例を示している。列201は、外国語の単語が書かれた列であり、列202は、201の単語に対応した翻訳の概要が書かれた列である。列203は、列201の単語に対応した関連情報、例えば、翻訳の詳細が掲載されているホームページのURLが書かれた列である。なお、ここで、列201の列には例として英単語を記述したが、フランス語やドイツ語などどんな言語でもよいのは言うまでもない。 また、ここでは、列203にはURL全体を記述したが、URLの一部だけを記述してもよい。
【0020】
図3は、URLの一部だけが記述された場合の辞書データ106の例である。図2の場合は、”http://www.○○○.com”が共通であるので、この共通部分はURL共通部分204に記述しておき、”a”や”abacus”などのような固有の部分だけは列206にURL固有部分として記述しておく。また、URL作成方法205には、URL共通部分204とURL固有部分206とを組み合わせて、詳細翻訳が掲載されたホームページのURLを作成する方法を記述しておく。このように、URLの共通部分を辞書データ106内の予め定められた場所に代表して記述し、異なる部分だけを各英単語に対応して記述するようにしておくことで、辞書データ106のデータサイズを減らすことができ、携帯電話で保持すべきデータ量が削減できるというメリットがある。
【0021】
さらに、図3のように、列206に記述される情報と列201の列に記述された単語と同じである場合は、URL固有部分が記述された列206を辞書データ1
06から省略するようにしても構わない。これにより、更に辞書データのデータサイズを減らすことができる。
【0022】
次に、図4のフローチャートを用いて、本実施例における携帯電話の処理手順を説明する。まず、「認識モード」が入力部101を介してユーザにより選択された後、入力部101のうち撮像部103に撮像するように指示を出すスイッチ(以下、これをシャッターボタンと呼ぶ)が押下されれば、CPU102が撮像部103に対して撮像するように指示を出す(ステップS401)。そして、撮像部103により撮像(変換)された被写体である対象物の画像情報はCPU102を介して記憶部104に保存する(ステップS402)。
【0023】
次に、画像認識部105が記憶部104に保存された画像情報を読み取り、該画像情報に含まれる識別情報、例えば、洋書の文中にある単語“recognition”を読み取って、認識結果を記憶部104に保存する(ステップS403)。この結果を、検索部109が読み取り、記憶部104により記憶された辞書データ106の列201にある単語の中から一致するものを検索する(ステップS404)。
【0024】
検索する方法としては、まず識別情報が完全に一致するものを探し出し、完全に一致するものがなかった場合は一文字だけ異なるがその他の文字は一致している単語を探し出すという方法が好ましい。この方法を採用することで、画像認識部105が紙面上の文字を誤って認識した場合でも、その文字列に一番近い単語を探し出すことができ、何度も撮像して文字認識をやり直す手間が省くことができ、使い勝手がよい。
【0025】
また、一文字だけ異なる単語もない場合は、二文字異なる単語、三文字異なる単語、というふうに異なる文字数をだんだん増やして検索してもよく、この場合は認識率が低くても該当する単語を探し出すことができる。
【0026】
ステップS405において、該当する単語が見つかった場合はステップS406に進む。もし該当する単語が見つからなかった場合はステップS410に進み、該当する単語が見つからなかったことをユーザに通知する画面を表示部107に表示して終了する。
【0027】
ステップS406では、ステップS404において検索部109により辞書データから検索され、当該検索された単語に対応する列202(翻訳の概要)をCPU102が読み取り、表示部107に表示する(ステップS406)。
【0028】
この後、CPU102は、入力部101や表示部107を介して、より詳細な翻訳の要求が指示されたか否かを判断し(ステップS407)、要求指示がされた場合はステップS408に進む。
【0029】
ステップS408では、ステップS404において検索部109により検索された単語に対応するURLをCPU102が読み取り、CPU102は、通信部108に対して該URLに接続するように指示信号を出力する。
【0030】
ステップS409で、CPU102が通信部108を介して上記ホームページに記された内容を読み取り、記憶部104に保存する。その後、その内容をCPU102が表示部107に表示する。
【0031】
以上のように、簡単な翻訳だけでなく詳細な翻訳を参照したい場合に、詳細な翻訳が記載されたホームページ等を表示させることができるため、わざわざ英和辞書等を引き直さなくてもその単語の詳細な意味を知ることができ、使い勝手がよい。
【0032】
また、携帯電話などの携帯端末では、大容量のメモリを搭載することができないため、本実施例のように、端末内では必要最低限の情報(簡単な訳や代表的な訳等)を記憶させて置き、詳細な情報が欲しいときはインターネットなどのような別の情報処理装置上に保存された情報を取得して参照できるようにすることは非常に有効である。
【0033】
図5は、本実施例の表示画面例であり、紙面などの上に書かれた文字列が撮像され、その画像を文字認識により文字情報に変換し、辞書データ106の保持する概要翻訳を表示部に表示した後、詳細翻訳の表示を要求する入力があった場合は、辞書データ106の保持するURLに接続し、そのURLに記された内容を表示部107に表示する際の表示画面の例を示している。なお、表示部107の下部に表示された「メニュー」等の機能に対応したボタンは、入力部101のうち、例えば、上部に配置されたボタンなどであり、当該ボタン等がユーザにより押下されると、「メニュー」等の機能に対応した表示画面が表示部107に表示される。同様に、表示画面が遷移される度に、当該ボタン等は各表示画面の下部に表示された機能を実行するためのボタンとして割り当てられる。以下、表示画面の下部に表示された機能を実行するためのボタンは、本明細書において便宜上、当該表示された機能名と対応付けて呼ぶことにする。例えば、「メニュー」機能に対応したボタンを「メニューボタン」、あるいは、「戻る」機能に対応したボタンを「戻るボタン」と呼ぶ。なお、上述した実行ボタンは、右下や左下等の各機能が表示される位置に応じて各ボタンを割り当てるようにしても構わないし、一つのボタンで実現しても構わない。
【0034】
画面501は、撮像モードとして「認識モード」が選択され、例えば、英文中の「Recognition」という単語を特定し、認識することを試みている画面例である。なお、ここで、上記英単語「「Recognition」を特定する手段として、例えば、表示部107の中心に表示された「+」マークを識別情報である「Recognition」の上に持っていけば、「+」マークの位置から近傍のスペース情報からスペース情報までの部分を一区切りの単語として「Recognition」という単語を自動的に特定するようにしてもよいし、ユーザが入力部104を利用して、例えば、上記メールアドレス情報等の認識部分をカーソル等で指定できるようにしても構わない。認識対象を決定する方法が複数ある場合に、選択できるようにしても構わない。また、動画の場合は、動画を静止画でコマ送りできるように設定しておき、そのコマ送り画面で認識対象部を選択できるようにしても構わない。
【0035】
また、ここでは、認識対象である英単語「Recognition」を点線等で囲み明確化したが、画像編集部において認識対象となる「Recognition」を拡大または縮小した画像を作成し、その画像を表示してもよい。拡大するには、例えば、1×1画素で表示していたところを2×2画素で表示する。さらに、画像編集部で認識対象となる文字の画像部分を白黒に変換したものやセピア色に変換したり、または、白黒反転したものを作成しその画像を表示したりしてもよく、画像内でどれが認識対象であるかが明確に分かるように表示すれば、上記例に限定されるものではない。
【0036】
待受状態からこの画面501の状態にするには、例えば、「認識モード」ボタンを押下したり、または待受状態からメニュー画面に進み、そのメニュー画面に沿ってボタン操作を行うことにより画面501に移行してもよい。画面501において、画面下部の「認識」ボタンを押下すると、画面502に遷移する。
【0037】
画面502は、撮像した画像の中でURLなどの認識可能な部分を文字認識部103が検出し、認識処理を行っている最中であることを表す画面である。認識処理が終了すると、画面503に遷移する。
【0038】
画面503は、画像認識部105が認識した結果と、その文字列に対応した概要翻訳202を表示部107に表示した画面である。認識対象となる文字以外の部分の画像は、例えば、認識対象が何であるかを明確化するために、黒色で塗りつぶしたり、撮像した画像やアイコンなどが表示されていない部分の色と同じ色で塗りつぶしたりしている。ユーザが、単語の意味や使い方をもっと詳しく知りたい場合は、画面503の左下部に表示された詳細表示に対応したボタンを押すと、画面504に遷移する。
【0039】
画面504は、通信部108が列203に接続する処理を実行していることを表した画面である。列203に接続できると、画面505に遷移する。
【0040】
画面505は、列203のホームページの内容を表示した画面を表している。
【0041】
以上のような表示画面を利用することで、ユーザは簡単な翻訳を知った後、簡単な操作で、単語の詳細な意味やその使い方・用例を知ることができ、使い勝手がよい。
【0042】
なお、上記実施例では、詳細な単語の意味や使い方を参照するために1種類のホームページのURLを利用することを想定したが、特段これに限定するものではなく、例えば、複数のURL情報を記憶部104に記憶させておき、詳細な訳等を要求する際にその複数のURLの中から好みのURLを選択できるようにしても構わない。これにより、ユーザは、単語に関する詳細な訳等を豊富な情報源から選択することができ、使い勝手がよい。当然、単語に関して詳細な情報を参照するための情報としてURL情報に限定する必要もない。
更にまた、上記例において、英単語の翻訳に関する詳細な情報として、単語の翻訳に関して詳細に記載されたホームページのURLを想定したが、これに限定するものではなく、単語の訳に関して詳細な情報を参照できるものであれば、なんでもよい。
【0043】
また、上記例では詳細な情報を入手するためにホームページを利用したが、携帯電話の記憶部104に訳の詳細な情報を記憶しておくようにすればよい。この場合、単語の簡単な訳と詳細な訳とで区別して記憶するようにし、通常の認識結果は簡単な訳で表示し、更に、ユーザにより詳細な情報の要求指示がなされた場合は、記憶部104に記憶された詳細な情報を表示する。これにより、携帯電話内に訳の詳細な情報が記憶されているためにホームページと接続することなく、速やかに該詳細な情報を表示することができるため、無駄な時間を節約することができ、また、通信圏外においても詳細情報を参照できる。
【0044】
また、詳細な情報が蓄えられたPC(Personal computer)等の装置を利用して詳細な情報を取得できるようにしても構わない。
【0045】
この場合、携帯電話と辞書データ106の列206には、PCに記憶された翻訳等の詳細情報を読み取るために必要な情報を記載しておく。ここで、翻訳の詳細な情報を参照するために必要な情報(以下、参照必要情報)とは、例えば、翻訳の詳細情報を保持するPCを特定するための情報(IPアドレスなどの識別子)、翻訳の詳細が記載されたファイルのパス名及びファイル名、あるいは、PCの記憶部における詳細翻訳が記載された部分を示すアドレスなどである。
【0046】
そして、例えば、「abalone」という単語を認識する場合に、より詳細な翻訳情報が欲しいときは、ユーザは図5(3)のような表示画面例等を利用して詳細情報の要求指示を行い、要求指示信号を受信したCPU102は、記憶部104に記憶された辞書データの「abalone」に対応した参照必要情報を通信部108を介してPCに送信する。PCが参照必要情報を受信すれば、参照必要情報に基づいて外部情報処理装置の記憶部に蓄えられた単語の訳等の詳細な情報を携帯電話に送信する。単語の訳等の詳細な情報を受信した携帯電話のCPU102は、それを表示部107に表示する。なお、携帯電話とPCとを接続する手段としては、有線であっても無線であっても構わない。
【0047】
これによれば、携帯電話内に単語訳等の詳細な情報をPCの記憶部を利用して参照できるため、記憶部104における記憶容量を低減できる。また、通信圏外においても詳細な情報を参照でき、使い勝手がよい。また、同様に、詳細な情報が記憶されている記憶媒体を介して参照できるようにしても構わない。この場合は、携帯電話に記録媒体の情報を読み取るための記録媒体読取部を設けるようにする。処理は前述と同様にすればよい。
【0048】
また、英単語等の詳細な情報自体をユーザ自らが作成や編集ができるようにしても構わない。この場合、詳細な情報をユーザが作成や編集(追加や削除等)するための設定画面などを表示部107に表示させる。そうした設定画面を介して入力された情報は、辞書データの列203に記憶されるようにする。そして、認識した単語の詳細な情報を参照する際には、詳細情報要求指示を受けたCPU102は、記憶部104に記憶された辞書データに基づいて詳細な情報を表示部107に表示する。
【0049】
これにより、自分オリジナルの辞書を作成や編集することができ、さらに、作成されたオリジナル辞書で単語の詳細な情報を参照することができるため、予め設定された詳細な情報には記載されていない情報を追加もしくは削除等することができ、更に使い勝手が向上する。
【0050】
更にまた、上記では、簡易な情報を知りたい場合は携帯電話内に記憶された情報を利用し、詳細な情報を知りたい場合はPCや記憶媒体を利用するようにしたが、簡易な情報を参照する際もPCや記憶媒体に記憶された情報を利用するようにしても構わない。
【0051】
次に、第2の実施例について説明する。上記第1の実施例は、英単語を認識して日本語訳を表示する例であるが、これだと、フランス語やドイツ語などの他言語は翻訳できないといった問題がある。本実施例は、この点に留意してなされた実施例である。
【0052】
第1の実施例と異なる点は、記憶部104に記憶される辞書データに、辞書データaと辞書データbの2つに増えた点と、辞書フラグが含まれる点である。
【0053】
例えば、辞書データaは英和辞書で、辞書データbは独和辞書である。なお、ここでは、辞書データとして2種類の言語(英語とドイツ語)を想定したが、3種類以上の言語を想定してそれぞれに対応した辞書データを記憶するようにしてもよい。
【0054】
辞書フラグは、CPU102がどの辞書データを使用するかを選択するために使うフラグである。辞書フラグは、例えば、記憶部104に記憶されたソフトウェアのプログラム中に存在する変数であり、辞書データに割り当てられた識別番号を代入するようにし、CPU102はこの変数に基づいて使用する辞書データを選択する。辞書フラグの値は、入力部101を介したユーザの操作によって変更が可能となるようにしておくことで、ユーザは多言語の単語に対して翻訳を得ることができ、使い勝手がよい。
【0055】
図6は、ユーザが使用する辞書を選択する際の、携帯電話100の画面表示例を示している。画面601は、携帯電話が撮像部103による撮像を行なえる状態を表した画面である。待ち受け状態からこの状態にするには、例えば携帯電話の側面についているスイッチを押下したり、または待ち受け状態からメニュー画面に進みボタンを数回押下するといった操作を行なう。画面601において、画面右下の「メニュー」に対応したボタンを押下すると、画面602に遷移する。
【0056】
画面602は、撮像および文字認識に関するメニューを選択する画面である。この状態で、「(1)辞書選択」が入力部101を介して選択されると画面603に遷移する。
【0057】
画面603は、使用する辞書を選択する画面である。この状態で、「(3)△△△和英」が入力部101を介して選択されると画面604に遷移する。
【0058】
画面604は、使用する辞書が△△△和英辞書になったことをユーザに知らせる画面である。ここで「確認」に対応したボタンを押下すると画面605に遷移し、再び携帯電話が撮像部103による撮像を行なえる状態になる。
【0059】
このように、辞書データを複数持つことで、多言語に対応した電子辞書機能を有することができ、使い勝手よい。
【0060】
また、使用する辞書データが、例えば、英和辞書に設定されている場合、ドイツ語の単語を認識したときは、該当する単語を見つけることができない。こういった場合に、携帯電話が保持する辞書データ全てを検索させるように構成することで、英和辞書以外に独和辞書を保持していればドイツ語の単語に対しても翻訳を表示することが可能となる。全ての辞書データを検索する方法としては、全ての辞書データの識別番号を入れた配列を用意し、CPU102が辞書フラグに設定された辞書データを検索した後、該配列の第1番目の要素に格納された識別番号に対応する辞書データを検索し、この中でも見つからない場合は、第2番目、第3番目といったように辞書データを変更して検索していく。このようにすることで、ユーザがわざわざ辞書データを選択する手間を省け、使い勝手のよい辞書機能を実現できる。
【0061】
また、上記第2の実施例は、辞書データを複数保持することで多言語の翻訳を出力できるようにした例であるが、これは画像認識部105が認識できる言語に限られてしまう。例えば、英語だけを認識できる画像認識部105では、タイ語やアラビア語は認識できない。よって、タイ語やアラビア語の辞書データを保持しても、認識ができないために翻訳を出力できないという問題がある。
【0062】
こうした問題を解決するために、通信部108を介してインターネットに接続し、多言語の文字パターンデータをダウンロードし、上記文字パターンデータ表に追加するようにすればよい。この場合の処理を以下に説明する。
【0063】
図10のフローチャートを用いて、本実施例に係る携帯電話がインターネットから文字パターンデータをダウンロードする際の処理手順を説明する。
【0064】
まず、文字パターンデータ表のダウンロード指示を受けたCPU102は、通信部108を介してインターネット上に存在する上記文字パターンデータが書かれたサイトに接続する(ステップS1001)。このサイトを表示した状態で、ユーザが文字パターンのダウンロードを指示するために入力部101のボタンを押下する(S1002)。これを受けてCPU102は、通信部108を介して、上記サイトから文字パターンデータをダウンロードし、記憶部104に保存する(ステップS1003)。
【0065】
この後、CPU102は、上記文字パターンデータを文字パターンデータ表に追加する(ステップS1004)。
【0066】
図11は、本実施形態の携帯電話帯が、文字パターンデータをダウンロードできるサイトに接続し、アラビア語の文字パターンデータをダウンロードする画面の例を示している。
【0067】
画面1101は、文字パターンをダウンロードできるインターネット上のサイトを表示した画面である。ここで、「アラビア語」を選択すると、画面1102に遷移する。画面1102は、アラビア語の文字パターンデータをダウンロードするかどうかをユーザに確認する画面である。ここで、「はい」を選択すると、画面1103に遷移する。画面1103は、アラビア語の文字パターンをダウンロードしていることを表す画面である。この状態でしばらく待ち、ダウンロードが終了すると画面1104に遷移する。画面1104は、アラビア語の文字パターンデータをダウンロードしたことを表す画面である。同様にして、各言語の文字パターンに対応した辞書データをダウンロードする。
【0068】
このように、文字パターンデータ及び種々の言語の辞書をダウンロードできるように構成したことにより、多言語に対して文字認識及び翻訳参照を行うことができるため、使い勝手が向上する。
【0069】
なお、予め記憶部104に記憶されていた文字パターンデータ表以外の文字を認識する際に、認識不可能であることをユーザに通知し、その場合に文字パターンデータ表のダウンロードをするように促す画面を表示部107に表示させるようにしてもよい。これにより、たとえ認識対象の文字が認識不可能であったとしても、速やかに認識できるようになり、使い勝手が向上する。
【0070】
更に、例えば、辞書データとして英単語に関するものしかない場合に英単語以外の単語を認識しようとしたときに、翻訳不可能であることをユーザに通知し、その場合に辞書データをダウンロードするように促す画面を表示部107に表示させるようにしてもよい。
【0071】
第1の実施例と異なる点は、記憶部104に記憶される辞書データに、辞書データaと辞書データbの2つに増えた点と、辞書フラグが含まれる点である。
【0072】
例えば、辞書データaは英和辞書で、辞書データbは独和辞書である。なお、ここでは、辞書データとして2種類の言語(英語とドイツ語)を想定したが、3種類以上の言語を想定してそれぞれに対応した辞書データを記憶するようにしてもよい。
【0073】
また、インターネット上には英和辞書などのホームページが複数あり、誰でも閲覧可能なホームページと、登録されたユーザのみが閲覧できるホームページがある。登録されたユーザのみが閲覧できるホームページは、ユーザIDとパスワードをユーザが入力することで閲覧できる。詳細な翻訳の要求が指示された場合に、登録されたユーザのみが閲覧できるサイトを表示してもよい。しかし、この場合は詳細な翻訳を表示するたびにユーザがユーザIDとパスワードを入力しなければならず、使い勝手が悪い。そこで、ユーザIDとパスワードを辞書データの予め定められた部分に記載しておく、という工夫を施す。図12に、複数の辞書データを保持し、その辞書データに含まれる詳細な翻訳のホームページがユーザ認証の必要なものである場合の具体例を示す。携帯端末は、辞書提供者から辞書データを取得することができる。その辞書データには、IDとパスワードが付属している。そのIDとパスワードは、辞書データに記載された詳細な翻訳が書かれたホームページにアクセスする際、ユーザ認証に使用する。
【0074】
図13に、本実施例の辞書データを用いて詳細な翻訳が記載されたホームページを表示する際のフローチャートを示す。
【0075】
ステップS1301で、携帯電話が辞書データを取得する。その方法としては、インターネット上に存在する辞書データファイルを、通信部108を介してダウンロードしてもよいし、記憶媒体に記憶された辞書データを携帯電話に接続させることで取得してもよい。
【0076】
このように辞書データを保持した状態で、文字認識を行ない(ステップS1302)、概要翻訳を表示する(ステップS1303)。
【0077】
詳細翻訳を表示するように要求する信号をCPU102が受信すると(ステップS1304)、CPU102は辞書データからサーバにアクセスするために必要なユーザIDとパスワードを取得する。取得する方法としては、辞書データの中のユーザIDとパスワードが記載されている場所を予め定めておき、CPU102がその場所を読み取るという方法が考えられる。また、ユーザIDとパスワードが記載されている場所を辞書データのヘッダ部分に記載しておき、CPU102がヘッダ部分を読み取ってユーザIDとパスワードの記載された場所を取得し、ユーザIDとパスワードを読み取る、という方法も考えられる
ステップS1306では、CPU102が通信部108を介してサーバにアクセス信号を送信する。この際、ユーザIDとパスワードも一緒に送信する。アクセス信号、ユーザID、パスワードを受信したサーバでは、ユーザ認証を行ない、認証が成功すると詳細翻訳データを端末に送信する。
【0078】
ステップS1307では、CPU102が通信部108を介して詳細翻訳データを取得し、記憶部に記憶する。ステップS1308では、CPU102が記憶部に記憶された詳細翻訳データを読み取り、表示部に表示させる。
【0079】
このように、ユーザIDとパスワードが必要なホームページにアクセスする際にも、ユーザは入力操作をせずにユーザ認証が行われ、使い勝手がよい。
【0080】
次に、第3の実施例について説明する。人間の記憶容量には限界があり、以前調べた英語の単語でも時間が経てばその意味等を忘れてしまうことも多いにあり得る。そうした場合に再度認識し直すのは手間がかかって面倒である。
【0081】
本実施例は、こうした問題に対して検討されたものであり、認識された単語の翻訳等の履歴情報を残す点に特徴がある。以下、このような履歴情報を作成していく処理と、履歴情報を利用する処理に分けて説明する。
【0082】
まず、履歴情報を作成する処理について説明する。図7は、検索された結果が履歴情報として記憶部104に記憶される場合の1例であり、例えば、図7のように、検索部109により検索された単語、検索したときの時刻などの履歴が記されてある。
【0083】
列701は、辞書データの列201のうち文字認識された単語である。列702は、各単語が認識された回数を表している。列703は、今までに認識された時刻のうちで最新の時刻を表している。列704は、履歴情報を利用して英単語等の意味を確認した回数を示すものであり、列705は、最後に確認した時刻を表している。
【0084】
図8は、本発明の第3の実施例に係る携帯電話が、文字認識をした後、例えば、図7のような履歴表を作成する際のフローチャートを表した図である。ステップS406、ステップS407はそれぞれ図4のステップS406、ステップS407を表しており、その間にステップS801〜ステップS804の処理がなされるフローになる。
【0085】
ステップS406は、辞書データ106の概要翻訳、すなわち代表的な訳や簡単な訳を表示した状態である。ここで、検索部109が検索した結果の単語が記憶部104に記憶された履歴情報に存在するかどうかを判定し(ステップS801)、存在した場合はステップS802に進む。ステップS802では、CPU102は、履歴情報の認識回数702を1つ増やす更新処理を行う。ステップS803では、CPU102によりなされる処理がステップS803に到達した時点の時刻を時刻取得部902が取得し、その時刻を履歴情報の最終認識時刻703に記載する。
【0086】
ステップS801で単語が履歴情報に存在しなかった場合は、ステップS804に進み、履歴情報に単語、最終認識時刻を追加記載する。最終認識時刻は、ステップS804に処理が到達した時点の時刻を記憶部104に記載する。以上の処理を経ることにより、履歴表に新たな認識結果の履歴情報を更新していく。なお、この場合、後述するように、履歴を利用して単語の意味等を再度確認するようなことを考えると、記憶部104に記憶された履歴表データと辞書データとを対応付けて記憶するのが望ましい。対応付けて記憶する方法としては、例えば、辞書データ内に履歴情報を追加できるスペースを設けて、そのスペースに履歴情報を次々書き込む方法などが考えられる。
【0087】
次に、作成された履歴情報を利用する場合の処理を説明する。まず、記憶部104により記憶された履歴情報の参照指示がユーザの入力部101による操作を介してなされれば、履歴参照指示信号がCPU102に入力される。履歴参照指示信号が入力されたCPU102は、記憶部104に記憶された履歴表データや辞書データに基づいて英単語の意味を表示部107に表示するように処理する。
【0088】
図9は、本実施形態の携帯電話が、履歴情報を用いて文字認識をせずに単語の翻訳を表示する画面の例を示している。
【0089】
画面901において、画面右下の「メニュー」に対応したボタンを押下すると、画面902に遷移する。画面902は、撮像および文字認識に関するメニューを選択する画面である。この状態で、「(5)履歴表」を選択すると画面903に遷移する。画面903は、履歴情報のうち、単語、その単語に対する認識回数、その単語に対する確認回数などを表示した画面である。この状態で、“recognition”を選択すると画面904に遷移する。
【0090】
画面904は、“recognition”の翻訳を表示した画面である。この状態で、「確認」に対応したボタンを押下すると、画面905に遷移する。
【0091】
画面905は、画面903と同じく、履歴表901のうちの単語、その単語に対する認識回数、その単語に対する確認回数などを表示した画面である。画面903では“recognition”に対する確認回数が0であったのに対し、画面904で“recognition”の訳を確認したため、画面905では“recognition”に対する確認回数が1に増えている。
【0092】
以上により、ユーザは、一度認識した単語の意味等を再度認識する操作を行うことなくいつでも、どこでも、更に何度でも確認できるために使い勝手が向上する。
【0093】
また、図9のような表示画面を表示することにより、認識回数、確認回数をユーザは容易に通知することができる。さらに、ユーザが何度も調べた単語が一目瞭然となるために、この認識回数や確認回数が多い順に上から表示すれば、なかなか覚えられない単語が容易に理解できるため、意識して覚えることができ、更に使い勝手がよい。
【0094】
なお、第1の実施例のように、更なる操作で訳や用例などの詳細な情報(例えば、詳細な情報が記載されたホームページのアドレス等)を参照できるように構成した場合には、簡単な訳と詳細な訳とを区別するように記憶部104に履歴情報として記憶し、ユーザが履歴情報を利用して英単語等の意味を確認する場合に、「簡単な訳」と「詳細な訳」とのいずれかを選択できるようにすれば、使い勝手は更に向上する。また、ここで履歴情報としては、図7に列挙されるような情報に限定されるものではなく、履歴に関する情報であれば何でもよい。
【0095】
更にまた、撮像部103により表示部107に出力された画像情報のうち画像認識部105により識別情報を認識する際に、履歴情報があるか否かをユーザに通知するように構成してもよい。例えば、認識対象を決定するためにひとまず対象を決定する仮決定と仮決定された対象でいい場合に本決定を行うように構成した場合では、仮決定の段階で、記憶部104に記憶された履歴情報の有無を表示部107に表示するようにすれば、わざわざ再度認識することなく、履歴情報を参照して識別情報の意味等を確認することができるため、使い勝手がよい。また、カーソルを認識対象の上に移動させるだけで、例えば、「履歴あり」といった簡易な表示でユーザに通知しても構わない。認識対象の英単語等の識別情報が今までに認識された情報である場合にその履歴の有無を通知する形態としては、文字、アイコンあるいはマークなどを用いた表示だけでなく、音声出力部(図示せず)などを介して音で通知してもよいのは言うまでもない。
【0096】
更にまた、GPSなどの携帯電話に位置情報取得部を備えて、当該位置取得部により取得された位置情報を履歴情報として記憶部104に記憶するように構成してもよい。これによれば、どこで単語を認識したかを容易に確認できる。
【0097】
また、履歴情報として記憶された場所に再度訪れた場合に、その旨及びそのときに認識した単語やその意味をユーザに通知するようにしても構わない。
【0098】
次に、第4の実施例について説明する。図14は、第4の実施例に係る携帯電話の外観を表した図である。本実施例の携帯電話は、図14に示されるように、表示部107を有する筐体200と入力部101を有する筐体300とがヒンジ部1403を介して折畳み可能であり、ヒンジ部に回転可能な撮像部を備えた携帯電話を考える。
【0099】
本実施例の携帯電話は、携帯電話が図14(1)のように開いた状態であるか図14(2)のように閉じた状態であるかを検出する折畳検出部を備えている。折畳検出部は、例えば、筐体200に磁石、筐体300にホール素子を備え、磁石により磁界を加えられたホール素子の電圧値のHiレベル or Lowレベルに基づいて開閉状態の検出を行う。なお、折畳検出部は、開閉状態の検出ができれば、センサー又は凹凸係合等を利用したものであっても構わない。なお、表示部107は、主に開いた状態で利用される表示部(メイン表示部)であるが、本実施例の携帯電話は、メイン表示部以外に携帯電話が折り畳まれた(閉じた)状態においても視認可能なサブ表示部1407を備える。
【0100】
撮像モードの選択を容易にするために、通常撮像ボタン1401と認識撮像ボタン1402とが、例えば、筐体の側面に備えている。
【0101】
通常撮像ボタン1401が押下されると、撮像部104で撮像対象物を撮像し、撮像した画像を記憶部104に保存し、必要に応じて撮像画像を表示する。認識撮像ボタン1402を押下すると、撮像部104で撮像対象物を撮像し、画像認識部105が文字認識を行った後、CPU102は、認識結果を表示部107もしくはサブ表示部1407に表示する処理を行う。
【0102】
以上のように、認識モードと通常撮像モードのそれぞれ専用ボタンを設けることで、ユーザは簡単に各モードを選択でき、使い勝手がよい。また、図14(1)に示すように、筐体300の側面に配置すれば、携帯電話が開いた状態でも折畳まれた状態でも操作が同様なものとなり、わざわざ開閉時で操作を変えることがないため使い勝手が向上する。更に、図14のように、筐体の側面等の携帯電話が閉じた状態で視認できる位置に操作キーを配置すると、閉じた状態においても認識モードを実行可能になるため、わざわざ携帯電話を開くことなく文字認識等を行うことができ、使い勝手はよい。
【0103】
なお、通常撮像ボタン1401と認識撮像ボタン1402とは異なるボタンであることが好ましいが、同一のボタンでもよい。ただし、この場合、同一のボタンである場合は、撮像するためのボタン操作と認識するためのボタン操作を区別させる必要がある。この場合、例えば、ボタンを押下する時間に応じて、あるいは、ボタンを押下する回数に応じて(ダブルクリック等)撮像モードと認識モードとを切り換えたりして区別すればよい。また、このようにボタンを同一にすることで、スペースを取らず、携帯電話を小さくすることができる。通常撮像ボタン1401と認識撮像ボタン1402とは、携帯電話100に付属するセンサのうち、ユーザが取り扱うことのできるものならばどれでもよい。
【0104】
また、上記では、通常撮像ボタン1401と認識撮像ボタン1402とを筐体側面に備える場合について説明したが、これに限定するものではなく、閉じた状態で操作可能な位置に配置されたボタンであれば、例えば、携帯電話の背面に配置されているような構成をとっても構わない。ここで、携帯電話の背面とは、図14(2)の1407に示されているように、携帯電話が折り畳まれた(閉じた)状態で視認可能な表示部107に対向するような面であり、主としてバッテリにより構成される面とは異なる面である。
【0105】
次に、第5の実施例について説明する。本実施例の携帯電話の外観は、第4の実施例と同様に図14のように折畳み可能な携帯電話を考える。以下、認識結果に対する概要翻訳等をメインの表示部107に表示しておき、携帯電話が開かれた場合には、該認識結果に対する詳細翻訳等をサブ表示部1407に表示する例について説明する。
【0106】
図15のフローチャートを用いて、本実施例における携帯電話の処理手順を説明する。
【0107】
まず、ステップS1501は、携帯電話が入力部101からのキー入力を待ち受けている状態である。この状態で、携帯電話のカメラ機能を起動させるための信号をCPU102が検出する(ステップS1502)と、携帯電話が折畳み状態であるかどうかを折畳検出部によって検出する。
【0108】
携帯電話が折畳み状態であった場合には、折畳検出部によって携帯電話が折畳み状態であることを伝える信号がCPU102に入力され(ステップS1503)、これを受けてCPU102は静止画モニタ表示をサブ表示部1407に表示する(ステップS1504)。次に、ユーザなどによってシャッターボタンが押下されると、撮像を指示する信号がCPU102に入力され(ステップS1505)、撮像部103により撮像(変換)された被写体の画像情報がCPU102を介して記憶部104に保存される(ステップS1506)。
【0109】
次に、画像認識部105が記憶部104に保存された画像情報を読み取り、該画像情報に含まれる識別情報、例えば、洋書の文中にある単語“recognition”を読み取って、認識結果を記憶部104に保存する(ステップS1507)。この結果を、検索部109が読み取り、記憶部104に記憶された辞書データ106の列201にある単語の中から一致するものを検索する。再び、携帯電話が折畳み状態であるかどうかを折畳検出部が検出し、CPU102に開閉状態の情報を信号として入力する。該開閉状態情報をCPU102が参照し(ステップS1508)、ステップS1509において、携帯電話が閉じた状態であると判断された場合は、ステップS1510に進む。ステップS1510では当該検索された単語に対応する列202(翻訳の概要)をCPU102が辞書データから読み取り、サブ表示部1407に表示する。
【0110】
また、ステップS1509において、携帯電話が開いた状態であると判断された場合は、当該検索された単語に対応するURLをCPU102が辞書データから読み取り(ステップS1511)、CPU102は通信部108に対して該URLに接続するように指示信号を出す。ステップS1512で、CPU102が通信部108を介して上記URLのホームページに記された内容を読み取り、記憶部104に保存する。その後、その内容をCPU102が表示部107に表示する。
【0111】
図16は、本実施例の表示画面例であり、ユーザによって携帯電話が閉じた状態から開いた状態になった場合に、辞書データ106の保持する詳細な翻訳が記載されたURLのホームページの内容(記載情報)を表示部107に表示する画面の例を示している。なお、画面1601〜1603では、画面左下に表示された「メニュー」などといった表示はボタン1408a、画面右下に表示された「認識」などといった表示はボタン1408bに関連付けされ、ユーザが携帯電話に入力をする際にはそれぞれ関連付けされたボタンを押下することにより、画面が遷移する。これらのボタンを、例えば、画面左下に「メニュー」と表示されていた場合は、ボタン1408aのことを「メニュー」ボタンと呼ぶことにする。
【0112】
画面1601は、携帯電話が折畳まれた状態において、撮像モードとして「認識モード」が選択され、例えば、英文中の「Recognition」という単語を特定し、認識することを試みている場合の、サブ表示部1407に表示された画面例である。この状態で、「認識」ボタンを押下すると、画面1602に遷移する。
【0113】
画面1602は、認識対象として「Recognition」が選択されたことを示している。この画面では、画面中の「Recognition」以外の画像部分が黒く塗りつぶされて表示されており、「Recognition」が強調される。また、文字以外の部分を黒く塗りつぶすことで、盗撮も防止できる。この状態で「決定」ボタンを押下すると、画面1603に遷移する。
【0114】
画面1603は、認識対象となった「Recognition」の概要翻訳がサブ表示部1407に表示されている画面を表している。この状態で携帯電話を開くと、表示部107に画面1604が表示される。
【0115】
画面1604は、携帯電話を開いた状態で表示部107に詳細な翻訳を表示した画面例である。
【0116】
このように、携帯電話を折畳んだ状態でも文字認識ができるため、いちいち携帯電話を開く手間も省け、手軽に文字認識ができる。さらに、ユーザが詳細な翻訳を知りたい場合は、概要翻訳が表示されている状態で携帯電話を開くだけで、詳細な翻訳を表示部107に表示できるため、非常に使い勝手がよい。
【0117】
次に、第6の実施例について説明する。本実施例の携帯電話は、撮像部103が撮像した画像や、該画像に含まれる文字などの識別情報を画像認識部105が認識した結果や、該認識結果に対する概要翻訳等を表示部107に表示した場合、認識結果の各文字を異なる文字に変換する認識結果編集手段を備えたものとする。
図17は、本実施例の携帯電話が、例えば、紙面上に書かれた“Recognition”という文字列を撮像し、画像認識部105が認識した結果が“Reconifiom”であった場合に、該認識結果を編集する画面例を表したものである。
【0118】
画面1701は、撮像部103が被写体である対象物を撮像し、該画像に含まれる文字列“Recognition”を画像認識部105が誤って、例えば“Reconifiom”と認識してしまい、“Reconifiom”に一番近い単語を検索部109が辞書データ106から検索し、検索した結果が“reconfirm”であった場合に、認識結果である“Reconifiom”、検索結果である“reconfirm”と、その概要翻訳“[動詞] 再確認する”を表示部107に表示した画面例である。ここで、「メニュー」ボタンを押下すると、画面1702に遷移する。
【0119】
画面1702は、撮像機能や認識機能に関するメニューを表示した画面である。ここで、「(1)結果編集」を選択して「決定」ボタンを押下すると、認識結果を編集できる画面に遷移する。
【0120】
画面1703は、認識結果を編集できる画面において、“Reconifiom”の“Reco”と“nifiom”の間に“g”を追記した画面を表している。認識結果を編集できる画面では、認識結果の文字が表示される領域1705内に、カーソル1706が表示される。このカーソル1706を使って編集する位置を選択し、入力部101のうち文字を入力に関するボタンを数回押下することで、文字を入力・削除することができる。このようにして編集した認識結果の文字は、CPU102によって記憶部104に記憶される。この状態で、「検索」ボタンを押下すると、入力部101によりCPU102に検索するように指示する入力信号が入力される。これを受けてCPU102は、記憶部104を参照して編集された認識結果文字を読み取り、検索部109に渡す。検索部109はこれを受けて、辞書データ106の中から一致する単語を検索し、検索結果表示領域に表示する。
【0121】
その画面例が画面1704である。画面1704は、認識結果を編集できる画面において、認識結果の文字を“Recognitiom”に編集した後、「検索」ボタンを押下した場合に表示される画面例である。検索結果として“Recognition”が表示されている。
【0122】
このようにして、認識結果が誤認識であり、ユーザが認識させたかった英単語とは異なる文字が検索結果として表示されてしまった場合、もう一度撮像し直して認識させる必要がなく、使い勝手がよい。
【0123】
なお、上記では、「検索」ボタンが押下されたことで、認識結果と一番近い単語を辞書データ106から検索部109が検索するようにしたが、認識結果を編集できる画面において、認識結果の文字を編集したら、認識結果編集手段がCPU102に検索をするように指示する入力信号を入力し、検索部109によって検索をするようにしてもよい。この場合、ユーザは検索結果を表示させたいときにいちいち「検索」ボタンを押さなくて済み、使い勝手がよい。
【0124】
次に、第7の実施例について説明する。本実施例は、携帯電話等に予め備わっているメール機能等を利用して画像認識部105により認識された結果、つまり、簡易情報あるいは詳細情報を送信する場合を想定する。
【0125】
この場合、例えば、入力部101により所定の操作がなされ、その入力信号を受信したCPU102は、認識モードに移行するように処理する。ユーザが認識モードにおいて、認識対象である文字等を認識した後にメール機能を起動するための操作を入力部101を介して行えば(例えば、メール起動キーを押下)、その入力信号を受信したCPU102は、表示部107に記憶部104に予め記憶されているメールソフトを起動し、メール送信できるようにメール作成画面を表示する。その際、CPU102は、認識され、例えば、「abalone」といった英単語の代表的な訳「あわび」を表示する場合、「abalone→あわび」といったようにメール作成の本文欄に自動的に挿入するように処理する。また、第1の実施例のように、簡易な情報のみならず、詳細な情報、例えば、用例や類似後のような詳細な情報が記載されたURL情報などを取得できる場合には、その詳細な情報を自動的に本文欄に挿入するように処理する。
【0126】
また、記憶部104に記憶されたアドレス情報(名前、電話番号あるいはメールアドレスの情報)からユーザが選択して送信相手の宛先欄に挿入できるように構成しても構わない。
【0127】
以上により、画像認識部105による認識結果を簡単な操作で送信したい相手に伝えることができ、使い勝手が向上する。さらに、件名の欄も「OCR結果」等の件名を自動的に挿入記載するようにすれば、更に入力の手間が省け、使い勝手がよい。
【0128】
また、認識結果を利用してメールを作成する際に、メールアドレスを認識した場合は自動的に当該メールアドレスを宛先として宛先欄に設定する方法も考えられる。しかし、この方法では、例えば、メールアドレスを認識してそのメールアドレスをメールの本文欄に記載したい場合においても、メールの宛先として設定されてしまうため、認識結果を利用することはできない。
【0129】
こういった問題を解決するために、例えば、メール作成の場合は、メールの宛先、件名、本文欄等といった項目うち、どの項目に認識結果を挿入するかを選択できるようにする。この機能を、図18を使って説明する。
【0130】
画面(1)は、認識対象である“yamazaki@xxx.jp”を認識した際に、認識画像と認識結果を表示した画面である。この状態で「メニュー」ボタンを押下すると、画面(2)に遷移する。画面(2)は、認識結果である“yamazaki@xxx.jp”を使ってどの機能に利用するかを選択する画面である。メールを作成する場合は、「(2)メール作成」を選択すると、画面(3)に遷移する。画面(3)は、認識結果をメール作成の項目のうちどの項目に挿入するかを選択する画面である。この画面で、「(3)本文」を選択すると、メールの本文に“yamazaki@xxx.jp”が代入されたメールの作成画面へと遷移する(画面(4))。
【0131】
このように、認識結果をメールのどの項目に挿入するかをユーザが選択できるようにすれば、認識結果を表示してから数回の入力操作を行うだけで、メールの本文中に認識結果を挿入したメールの作成画面へと移行することができ、使い勝手が向上する。
【0132】
さらに、画面(2)のメニューを表示する際に、認識結果である文字列の種類によってカーソルの位置を決定することもできる。その方法は、例えば、認識結果に“@”が含まれていればメールアドレス、“http”が含まれていればURLであるとCPU102によって判定させ、メールアドレスであると判定された場合は、画面(2)を表示する際にカーソルの位置を「(2)メール作成」、URLであると判定された場合はカーソルの位置を「(1)インターネット」等に合わせて表示部107に表示させればよい。このようにすれば、画面(2)においてメニューを選択する操作が省けるので、使い勝手がさらに向上する。
【0133】
また、認識結果がメールアドレスであった場合に、当該メールアドレスをアドレス帳に登録したいときは、画面(2)で「(4)アドレス帳登録」を選択すればよい。この場合も同様に、認識結果のメールアドレスをアドレス帳のどの項目に挿入するかを選択できるようにすれば、上述と同じ効果が得られる。
【0134】
なお、上記では、メールソフトの作成画面の欄として、「宛先」「件名」「本文」欄を考えたが、これに限定されるものではない。そのほかに欄を設けたとしても自動的に関係した情報を挿入するようにすれば、入力手間が省け、使い勝手がよい。
【0135】
また、上記では、自動的にメール作成画面欄に認識結果(例:URL情報)が挿入されるような構成をとったが、それだけでなく、ユーザ自らが入力部101を介してコメント等を入力できるようにしても構わない。これにより、OCR機能を行い、その結果を通話相手先に送信する際に、ユーザが単に結果のみを送信するだけでなく、その結果に対するコメント等を添えることができる。なお、その際に、予め記憶部104に記憶された定型文や絵文字等を利用すれば更に使い勝手はよくなる。
【0136】
なお、上記実施例においては、英語等の単語に関して、意味や用例等を詳細に知りたいといった利用シーンを想定したが、これに限定されるものではなく、例えば、スポーツ、映画、歴史、レストラン、科学、恐竜、動植物、芸能人等といった様々なジャンルの単語に関する情報を参照できるようにしても構わない。これにより、参照可能なカテゴリが増えて、ユーザの使い勝手は向上する。このように、参照可能である情報が多いと、例えば、ユーザが雑誌や新聞等の記事を見ているときや、街を何気なく歩いている場合に、興味のある単語が目にとまり、その詳細な情報を参照したいと思った状況などにおいても、速やかにその単語の意味等を参照できるため非常に使い勝手がよい。
【0137】
また、例えば、「ガメラン」といった恐竜の詳細情報を参照したいのに、植物の「ガメラン」の詳細情報を取得したところでユーザの満足度は低い。そこで、詳細情報の要求を行う際に、例えば、表示部107に「どのジャンルの詳細情報が欲しいですか?」などの通知がされ、ユーザが表示画面等を介して種々のジャンルを選択できるようにすれば、更に使い勝手はよい。
【0138】
次に、第8の実施例について説明する。本実施例は、認識した英単語の的確な意味を通知するために、単語の共起関係を利用するものである。共起とは、複数の単語が同一の文書に出現することである。
【0139】
そもそも単語は、同一の単語でも複数の異なる意味を持っている場合が多く、予め用意された辞書の日本語訳をそのまま表示させた場合、認識させた英単語がどの意味で使われているのかを、ユーザが文脈を読み取る等して考えなければならない。その際、もし間違った意味で捉えてしまうと、その英単語を含んだ文章自体も間違った意味で捉えてしまう、という問題がある。本実施例は、この点に留意してなされた実施例である。
【0140】
図19は、本発明の第8の実施例に係る構成例を示す図である。本実施例は、携帯電話100、サーバ1900で構成される。
【0141】
サーバ1900は、SV-CPU1902、共起関係データベース1903、SV記憶部1904、SV画像認識部1905、SV辞書データ1906、SV通信部1908、SV検索部1909、ユーザ登録データベース1910などを含んだものとして構成される。
【0142】
SV通信部1908は、サーバ1900がインターネットや他の情報処理装置などとアクセスするための通信処理を行う。
【0143】
SV-CPU1902は、SV記憶部1904に記憶されたプログラムに基づいて動作し、例えば、SV通信部1908からの信号に応じて各部を制御するものである。
【0144】
共起関係データベースは、共起関係に関するデータであり、例えば、図20に示すように、単語、その単語の訳、共起する単語(以下、共起単語と呼ぶ)及び共起されている単語に対応した訳になる割合等を含んだものとして構成される。なお、図20は、単語が「character」であり、その「character」の訳として「文字」、「登場人物」を想定した例である。
【0145】
共起関係データベース1903は複数の単語に対するデータを保持し、それぞれの単語についてその訳とその訳として使われる確率値などを保持するものとする。
【0146】
認識した単語と当該単語と共起する単語があった場合に、共起関係データベース1903を使って、当該単語に対する値a、値bを比べることで、認識した単語に対する最も適切な訳を得ることができる。例えば、「character」の日本語訳には「文字」や「登場人物」などがあるが、「recognition」という単語が共起した場合、「character」の日本語訳として「文字」が適切である割合が0.95、また、「登場人物」が適切である割合が0.05とする。この場合、「character」の日本語訳としてはその適切な割合を表す値が大きい「文字」を選択すればよい。
【0147】
SV記憶部1904は、通信部から受信するデータなど、サーバ1900で扱うデータを記憶しておく。SV画像認識部1905は、画像情報に含まれる文字や記号等の識別情報を認識する。
【0148】
記憶部104に記憶されたSV辞書データ1906には、例えば、外国語の単語等といった識別情報、当該識別情報の日本語訳及び当該識別情報の様々な日本語訳や使い方・用例等について詳しく書かれたホームページのURL、当該識別情報に関する画像や音声等が含まれる。
【0149】
SV検索部1909は、単語および当該単語と共起する単語を用い、共起関係データベース1903を参照して、単語2001の適切な日本語訳を選択する。
【0150】
ユーザ登録データベース1910は、サーバ1900に接続できるユーザであることを証明するためのユーザIDやパスワードを記録しているデータベースである。
【0151】
次に、図21のフローチャートを用いて、本実施例における携帯電話の処理手順を説明する。
【0152】
図15のステップS1501〜ステップS1507と同様の処理を行うことにより、モニタ表示をしている状態(ステップS2101)から、画像を撮像して文字認識した結果を記憶部104に保存した状態になる(ステップS1502〜ステップS1504)。ステップS2105では、記憶された認識結果から認識位置データ及び認識単語データを抽出する。ここで、認識位置データとは、撮像部103により撮像された画像に含まれる認識対象となる単語の画像上の位置に関するデータのことであり、また、認識単語データとは、ステップS2105において検索部109により検索された結果見つけられた単語のことである。
【0153】
次に、サーバ1900と接続するように指示を出すアクセス信号が入力部101などを介してCPU102に入力されると、CPU102は、通信部108を介して所定のサーバにアクセス信号を送信する(ステップS2107)。
【0154】
次に、アクセス信号を受信したサーバ1900よりユーザID及びユーザIDに対応したパスワードの入力要求信号が送信される。その要求信号を携帯電話100が受信すれば(ステップS2108)、CPU102は、表示部107にユーザID及びパスワードの入力用画面を表示する。入力画面等を介してユーザID及びパスワードが入力されれば、それをサーバ1900に送信する(ステップS2109)。ここで、ユーザID及びパスワードをユーザが入力する認証する形態を考えたが、ユーザの認証が行うことができればこれに限定されるものではない。例えば、声紋、指紋、虹彩などを用いて認証を行ってもよい。
【0155】
CPU102は、サーバから受信した信号が認証成功データか認証失敗データのいずれであるかを判定し(ステップS2110)、当該信号が認証失敗データの場合は、入力用画面を再度表示部107に表示し、当該信号が認証成功データの場合は、撮像部103により撮像された画像、認識位置データ及び認識単語データなどをサーバ1900に送信する(ステップS2111)。
【0156】
その後、サーバ1900から認識単語データに対する訳を示す最適翻訳データを受信すると、CPU102は(ステップS2112)、最適翻訳データを表示部107に表示する(ステップS2113)。
【0157】
次に、図22のフローチャートを用いて、本実施例におけるサーバ1900の処理手順を説明する。
【0158】
サーバ1900が携帯電話100などの端末からのアクセス信号を受信する(ステップS2201)と、続いて携帯電話100にユーザIDとパスワードの入力を要求する(ステップS2201)、携帯電話100からユーザIDとパスワードを受信すると(ステップS2202)、SV-CPU1902がユーザ登録データ1910を参照する。ユーザ登録データ1910に登録されているユーザIDとパスワードに一致するものが見つかれば、SV-CPU1902は、SV通信部1908を介してユーザ認証が確認できたことを携帯電話100に通知し(ステップS2204)、携帯電話100から画像、認識位置データ及び認識単語データを受信する(ステップS2205)。
【0159】
次に、SV画像認識部1905は、受信した画像に含まれる文字を認識する。図23は、受信した画像の例を示している。SV画像認識部1905は認識処理を行う際に、まず、画像に含まれる全部の単語を抽出し、その認識位置データを求める。このうち、抽出領域の一辺が画像の端にかかる単語は認識対象外の単語としてみなされる。
【0160】
図23の画像例では、単語2301のように網掛けの四角で囲んだ単語は認識対象外の単語としてみなされる。それ以外の単語、図23の画像例では、単語2303「The」のように抽出領域が画像の端にかからない単語を認識し、認識結果と一致する、もしくは、一番類似する単語をSV辞書データ1906からSV検索部1909が検索する(ステップS2206)。
【0161】
ここで、ユーザが認識したい単語を「認識対象単語」、実際に携帯電話が認識した対象の単語を「認識単語」と定義する。通常は、認識対象単語と認識単語は一致するが、認識精度が低いなどの理由で両者が異なる場合がある。例えば、「abalone」の翻訳をユーザが欲する場合に「abalone」ではなく誤って認識してしまい、認識対象単語は「abalone」、認識単語は「abalome」となる場合がある。その場合は、誤って認識された「abalome」が辞書データにあるかどうかが検索され、もし無ければ辞書データが有する単語の中で一番類似した単語(例えば、abalone)を認識単語とみなすような処理が行われる。
【0162】
次に、携帯電話から受信した認識位置データおよび認識単語データに基づいて確定される単語(以後、翻訳対象単語)以外の認識対象単語(以後、共起単語)の数nを計測する(ステップS2207)。ステップS2208において、共起単語数nが1つ以上ある場合は、共起関係データベース1903に翻訳対象単語があるかどうかを判定し(ステップS2209)、あった場合は、共起関係データベース1903の列2004に共起単語と一致する単語があるかどうかを判定する(ステップS2210)。
【0163】
共起単語と一致した単語が共起関係データベースにあった場合は、翻訳対象単語の訳のうちで最も適切な訳を決定する(ステップS2211)。
【0164】
決定方法としては、共起関係データベース1903の共起単語に対するそれぞれの訳に基づいて確率を計算する。例えば、翻訳対象単語が「character」、共起単語が「string」と「recognition」であった場合を考える。共起単語に「string」が存在した場合の訳が「文字」となる割合は0.90、また共起単語に「recognition」が存在した場合の訳が「文字」となる割合は0.95、これらの値を足し合わせると1.85となる。また、同様の計算を訳「登場人物」に対して行なうと、合計の値は0.08となる。これらの値が最大となる訳を、最も適切な訳として扱うことができる。なお、上記では、割合値を足し合わせて最適な訳を決定したが、これに限定するものではなく、乗算、割算又は除算等を組合せたりして決定してもよい。最後に、最適翻訳データを端末に送信するステップ(S2212)。
【0165】
また、ステップS2208において共起単語数nが0であった場合、ステップS2213に進み、代表となる訳をSV辞書データ1906から検索する。ステップS2214で、その訳を端末に送信する。
【0166】
また、ステップS2209において共起関係データベース1903に翻訳対象単語がなかった場合と、ステップS2210において共起関係データベース1903に共起単語と一致する単語がなかった場合は、同様にステップS2213に進み、代表訳を端末に送信する。
【0167】
なお、上記フローではステップS2211で最適翻訳データを決定したが、複数の訳の候補を決定してもよい。共起単語に対応した割合の合計値を、大きい順に、例えば、6個求める。このデータを翻訳表示順序データと呼ぶ。図25(1)は、「character」の訳を並び替える前の状態であり、(2)は訳の意味として適切な順に並び替えた後の状態である。
【0168】
この翻訳表示順序データに基づいて訳を端末に送信する。翻訳表示順序データを受信した携帯電話のCPU102は、当該翻訳表示順序データに基いて翻訳を並び替えて表示部107に表示するように制御する。
【0169】
これにより、ユーザは、認識対象単語の意味を知ることができるうえ、その認識対象単語が文脈上どのような意味を持つ可能性が高いかを容易に知ることができ、使い勝手がよい
また、サーバにより選択された最適な訳が間違っている場合も想定されるが、そうした場合でも、図25のように最適な訳だけでなく、その他の訳の候補を並べて列挙することにより、ユーザ自身が文脈上から判断する際の大きな手助けとなり得る。
【0170】
次に、携帯電話とサーバとのやり取りに係る処理例を図24を用いて説明する。ここでは、携帯電話である単語を文字認識してその最適な訳をサーバから受信する場合を想定する。
【0171】
まず、ある単語(以下、認識対象単語)を撮像部103及び画像認識部105により認識すると(ステップS2401)、CPU102は、撮像した画像データ、画像データに含まれる認識対象単語をデータ化した認識単語データ及び当該認識対象単語の位置を示す認識位置データを抽出する(ステップS2402)。次に、ユーザが当該認識対象単語の詳細な訳を参照する指示を入力部101等を介して行うと、CPU102は、サーバと接続するためのアクセス信号を送信する(ステップS2403)。
【0172】
アクセス信号を受信したサーバは、携帯電話にユーザIDとパスワードを要求するためにID・パスワード要求信号を送信し(ステップS2404、ステップS2405)、ID・パスワード要求信号を受信した携帯電話のCPU102は、ユーザによりID及びパスワードを入力画面等を介して入力された後にサーバにID及びパスワードを送信する(ステップS2406)。
【0173】
次に、サーバは受信したユーザID及びパスワードに基づいて正規の登録者か否かの認証を行う。認証を行った結果、正規の登録者と認められた場合(有効)には、サーバ1900は認証成功データを送信し、正規の登録者と認められない場合(無効)には認証失敗データを送信する(ステップS2407〜ステップS2409)。ここでは、認証が有効であった場合を考える。
【0174】
認証成功データを受信した携帯電話は、撮像した画像データ、画像データに含まれる認識対象単語をデータ化した認識単語データ及び当該認識対象単語の位置を示す認識位置データをサーバに送信する(ステップS2410、ステップS2411)。
【0175】
画像データ、認識単語データ及び認識位置データを受信したサーバは、前述したように、認識単語データから画像データ内に含まれる認識対象単語を特定し(ステップS2413)、画像データ内に含まれる認識単語データ以外の単語で、かつ、画像データの上下左右の端などで単語の途中で途切れて画像データの枠からはみ出した単語(共起単語)を抽出し、認識処理を行う(ステップS2412〜ステップS2414)。その後、サーバが所有する共起関係データベースを参照して、認識対象単語の最適な訳を示す最適翻訳データを携帯電話に送信する(ステップS2415、ステップS2416)。
【0176】
最適翻訳データを受信した携帯電話は、最適翻訳データを表示部107に表示する(ステップS2417、ステップS2418)。
【0177】
以上により、ユーザは、ある単語の翻訳をその文脈に沿った最適な訳を参照することができ、使い勝手がよい。また、処理能力及び記憶容量が通常携帯電話より優れているサーバに共起関係データベースの蓄積及び共起データベースから最適な翻訳を決定する処理等を負担させることにより、携帯電話の処理負担及び記憶容量の軽減に貢献するとともに、処理能力や記憶容量の面でバランスのとれたシステムを実現できる。
【0178】
更に、サーバの立場から見ると、上述したような情報処理を行うサーバを利用して、「最適翻訳サービス」等のサービスを想定すれば、例えば、毎月定額の収入を得られて経済的な面でも効果的である。
【0179】
また、ユーザには無料又は低額で提供する代わりに広告会社と契約してその広告会社から広告代としての収入を得るようにしても構わない。この場合、サーバは、その広告に関するデータを最適翻訳データに付加して携帯電話に送信し、その広告データ及び最適翻訳データを受信した携帯電話は、最適翻訳データとともに広告データも表示するようにすればよい。その際に、広告データを最適翻訳データと重ならないように両者を表示するための位置データもサーバが送信し、その位置データを受信した携帯電話がその位置データに基いて表示するようにすれば、ユーザは、最適な翻訳と広告が混在せずに見ることができる。
【0180】
なお、上述してきた種々の機能をソフトウェアで実現してもよく、ユーザは、例えば、記録媒体やサーバから当該ソフトウェアを受信して当該種々の機能を実現できる。これにより、必要な機能だけを搭載したり、また、好みに応じて色々な機能を追加もしくは削除、あるいは更新することが容易となる。
【0181】
なお、携帯電話及びサーバが有する画像認識部および検索部はCPUで構成してもよい。更に、上述してきた実施例を組み合わせて構成することができることは言うまでもない。
【0182】
また、本発明は、上記に示された実施例に限定されるものではなく、ここに開示された原理及び新しい特性は広範囲の技術的範囲を含むものである。
【図面の簡単な説明】
【0183】
【図1】第1の実施例に係る携帯電話の構成ブロック図である。
【図2】辞書データの内容例を示した図である。
【図3】辞書データの内容例を示した図である。
【図4】第1の実施例における処理手順を示すフローチャートである。
【図5】第1の実施例における表示画面例である。
【図6】第2の実施例における表示画面例である。
【図7】第3の実施例に係る履歴表の例である。
【図8】第3の実施例における処理手順を示すフローチャートである。
【図9】第3の実施例における表示画面例である。
【図10】文字パターンデータをダウンロードする実施例の処理フロー図である。
【図11】文字パターンデータをダウンロードする実施例の表画面例である。
【図12】辞書データにID・パスワードが関連付けされている実施例のイメージ図である。
【図13】辞書データにID・パスワードが関連付けされている実施例の処理フロー図である。
【図14】第4又は第5の実施例における携帯電話の概観図である。
【図15】第5の実施例における処理手順を示すフローチャートである。
【図16】第5の実施例における携帯電話の表示画面例である。
【図17】第6の実施例における携帯電話の表示画面例である。
【図18】第7の実施例における携帯電話の表示画面例である。
【図19】第8の実施例における全体システム図である。
【図20】共起関係データベース例である。
【図21】第8の実施例の携帯電話の処理手順を示すフローチャートである。
【図22】第8の実施例のサーバの処理手順を示すフローチャートである。
【図23】第8の実施例において撮像画像、認識対象単語、共起単語との位置関係を説明する図である。
【図24】第8の実施例における携帯電話とサーバの処理シーケンス図である
【図25】第8の実施例における携帯電話の表示画面例である。
【符号の説明】
【0184】
100 携帯電話
101 入力部
102 CPU
103 撮像部
104 記憶部
105 画像認識部
106 辞書データ
107 表示部
108 通信部
109 検索部
110 辞書フラグ
200 メイン表示部を有する筐体
300 入力部を有する筐体
201 外国語
202 概要翻訳
203 詳細翻訳URL
204 URL共通部分
205 URL作成方法
701 単語
702 認識回数
703 最終認識時刻
704 確認回数
705 最終確認時刻
1401 通常撮像ボタン
1402 認識撮像ボタン
1403 ヒンジ部
1407 サブ表示部
1408a 入力部
1408b 入力部
1900 サーバ
1902 SV-CPU
1903 共起関係データベース
1904 SV記憶部
1905 SV画像認識部
1906 SV辞書データ
1908 SV通信部
1909 SV検索部
1910 ユーザ登録データベース
2301 認識対象外の単語
2303 認識対象単語

【特許請求の範囲】
【請求項1】
他の装置と通信する通信部と、
画像情報を出力する撮像部と、
該撮像部により出力された画像情報に含まれる識別情報を認識する認識部と、
該認識部により認識された識別情報に関連した関連情報の取得を指示する関連情報取得指示部と、
該関連情報取得指示部により該関連情報の取得が指示された場合に該関連情報を該通信部を介して取得し表示するように制御する制御部とを備えることを特徴とする情報処理装置。
【請求項2】
請求項1記載の情報処理装置において、
前記関連情報の取得を行うためのID及びパスワードを受信する受信部を備え、
前記制御部は、前記関連情報取得指示部により前記関連情報の取得が指示された場合に該受信部により受信されたID及びパスワードを送信するように制御することを特徴とする情報処理装置。
【請求項3】
請求項2記載の情報処理装置において、
前記関連情報が外国語の翻訳が記載されたホームページアドレスであることを特徴とする情報処理装置。
【請求項4】
請求項1記載の情報処理装置において、
前記識別情報が外国語の単語であり、前記関連情報が該外国語の単語に関する情報であることを特徴とする情報処理装置。
【請求項5】
請求項4記載の情報処理装置において、
前記関連情報が、前記外国語の用例もしくは翻訳を含むことを特徴とする情報処理装置。
【請求項6】
請求項4記載の情報処理装置において、
前記関連情報が、複数の外国語の辞書情報を含み、該辞書情報を選択する辞書選択部を備えることを特徴とする情報処理装置。
【請求項7】
請求項4記載の情報処理装置において、
複数の言語を認識するための文字パターンを受信する受信部と、
該受信部により受信された該文字パターンを記憶する言語パターン記憶部とを備え、
前記認識部は、該言語パターン記憶部により記憶された該文字パターンに基いて前記外国語の単語を認識することを特徴とする情報処理装置。
【請求項8】
画像情報を出力する撮像部と、
該撮像部により出力された該画像情報を表示する表示部と、
単語情報と該単語情報に関する情報とを対応付けて記憶する記憶部と、
該表示部により表示された画像情報に含まれる単語情報を認識する認識部と、
該認識部により認識された単語情報に関する情報の取得を指示する詳細情報取得指示部と、
該詳細情報取得指示部により該単語情報に関する情報の取得が指示された場合に該記憶部により記憶された該単語情報に関する情報を該表示部に表示するように制御する制御部とを備えることを特徴とする情報処理装置。
【請求項9】
請求項8記載の情報処理装置において、
前記記憶部に記憶された前記単語情報に関する情報を作成もしくは編集する編集部とを備えることを特徴とする情報処理装置。
【請求項10】
他の装置と通信を行う通信部と、
画像情報を出力する撮像部と、
該撮像部により出力された画像情報に含まれる単語情報を認識する認識部と、
単語情報に関する詳細な情報が記載されたホームページのアドレスの情報を記憶する記憶部と、
該認識部により認識された該単語情報に関する詳細な情報を表示する指示を行う詳細情報表示指示部と、
該詳細情報表示指示部により該詳細な情報を表示する指示がなされた場合に、
該通信部を介して該記憶部により記憶された該ホームページのアドレスに基づいて該ホームページにアクセスし、該ホームページの内容を表示するように制御する制御部とを備えることを特徴とする情報処理装置。
【請求項11】
請求項10記載の情報処理装置において、
前記記憶部は、前記ホームページのアドレスにおいて共通する部分と前記単語
情報ごとに固有の部分とを区別して記憶することを特徴とする情報処理装置。
【請求項12】
他の装置と通信を行う通信部と、
画像情報を出力する撮像部と、
該撮像部により出力された該画像情報を表示する表示部と、
単語と該単語に関する簡易な情報と該単語に関する詳細な情報が記載されたホームページのアドレスの情報とを対応付けて記憶する記憶部と、
該表示部により表示された画像情報に含まれる単語を認識する認識部と、
該認識部により認識された該単語に関する詳細な情報の表示を指示する詳細情報表示指示部と、
該認識部により該単語の認識を行う場合に該認識された結果と該単語に関する簡易な情報を該表示部に表示し、さらに該詳細情報表示指示部により該詳細な情報の表示の指示がなされた場合に該通信部を介して該記憶部により記憶された該ホームページにアクセスし、該ホームページの内容を該表示部に表示するように制御する制御部とを備えることを特徴とする情報処理装置。
【請求項13】
画像情報を出力する撮像部と、
該撮像部により出力された該画像情報を認識する認識部と、
識別情報と識別情報に関連した関連情報とを対応付けて記憶する記憶部と、
該認識部により認識された識別情報を履歴情報として記憶する履歴記憶部と、
該履歴記憶部により記憶された履歴情報の取得を指示する履歴取得指示部と、
該履歴取得指示部により指示された履歴情報のうち少なくとも1つを選択する履歴選択部と、
該履歴選択部により該履歴情報を選択すると該履歴情報に対応した該関連情報を表示するように制御する制御部とを備えることを特徴とする情報処理装置。
【請求項14】
請求項13記載の情報処理装置において、
前記記憶部により記憶された前記関連情報は、前記識別情報の簡易な情報と前記識別情報の詳細な情報とに区別されて記憶されていることを特徴とする情報処理装置。
【請求項15】
請求項13記載の情報処理装置において、
前記履歴選択部により履歴情報を選択した場合に該履歴情報の簡易な情報あるいは該履歴情報の詳細な情報のいずれを前記表示部に表示するかを選択する関連情報選択部を有することを特徴とする情報処理装置。
【請求項16】
請求項13記載の情報処理装置において、
前記関連情報は、前記識別情報に関して詳細に記載されたホームページのアドレス情報を少なくとも含むことを特徴とする情報処理装置。
【請求項17】
請求項13記載の情報処理装置において、
前記制御部は、前記認識部により認識された前記識別情報が前記記憶部により記憶されていた場合にその旨を通知するように制御することを特徴とする情報処理装置。
【請求項18】
画像情報を出力する撮像部と、
該撮像部により出力された該画像情報を表示する表示部と、
該表示部により表示された画像情報に含まれる単語を認識する認識部と、
該認識部により認識された単語を履歴情報として記憶する履歴記憶部と、
該履歴記憶部により記憶された該単語の表示を指示する履歴表示指示部と、
該履歴表示指示部により表示の指示がされた場合、該単語を選択するための表示画面を該表示部に表示し、選択された該単語の関連情報を該表示部に表示するように制御する制御部とを備えることを特徴とする情報処理装置。
【請求項19】
請求項13又は18記載の情報処理装置において
前記履歴記憶部は、前記認識部により認識された前記識別情報もしくは前記単語の認識回数を記憶することを特徴とする情報処理装置。
【請求項20】
第1の表示部を有する第1の筐体と第1の操作部を有する第2の筐体を有し、ヒンジ部を介して該第1の表示部と該第1の操作部とが対向するように折畳み可能である情報処理装置において、
画像情報を出力する撮像部と、
該情報処理装置が折畳まれた状態で参照可能な位置に配置され、該撮像部により出力された画像情報を表示する第2の表示部と、
該情報処理装置が折畳まれた状態で押下可能な位置に配置された第2の操作部と、
該第2の表示部に表示された画像情報に含まれる識別情報を認識する認識部と、
該第2の操作部を介して該第2の表示部に表示された該識別情報の認識を行う指示をした場合に、該第2の表示部に表示された該識別情報を該認識部により認識するように制御する制御部とを備えることを特徴とする情報処理装置。
【請求項21】
請求項20記載の情報処理装置において、
前記情報処理装置が折畳まれた状態であるか否かを検出する折畳検出部と、
前記識別情報に関連する関連情報を記憶する記憶部とを備え、
前記制御部は、前記該第2の操作部を介して前記第2の表示部に表示された前記識別情報を認識した後に、該折畳検出部により開いた状態であると検出された場合に該関連情報を前記第1の表示部に表示するように制御することを特徴とする情報処理装置。
【請求項22】
請求項21記載の情報処理装置において、
他の装置と通信する通信部とを備え、
前記関連情報が前記識別情報の詳細な情報が記載されたホームページアドレスを含み、
前記制御部は、前記折畳検出部により開いた状態であると検出された場合に該通信部を介して該ホームページにアクセスして該ホームページの内容を前記メイン表示部に表示するように制御することを特徴とする情報処理装置。
【請求項23】
メイン表示部を有する第1の筐体とメイン操作部を有する第2の筐体を有し、ヒンジ部を介して該メイン表示部と該メイン操作部とが対向するように折畳み可能であり、画像情報を出力する撮像部が該ヒンジ部に備わって回転可能である情報処理装置において、
該情報処理装置が折畳まれた状態で参照可能な位置に配置され、該撮像部により出力された画像情報を表示するサブ表示部と、
該情報処理装置が折畳まれた状態で押下可能な位置に配置されたサブ操作部と、
該サブ表示部に表示された画像情報に含まれる単語を認識する認識部と、
該サブ操作部を介して該第2の表示部に表示された該単語の認識を行う指示をした場合に、該サブ表示部に表示された該単語を該認識部により認識するように制御する制御部とを備えることを特徴とする情報処理装置。
【請求項24】
他の装置と通信する通信部と、
該通信部を介してメールの送受信を行うためのソフトウェアを記憶するメールソフトウェア記憶部と、
画像情報を出力する撮像部と、
該撮像部により出力された該画像情報を表示する表示部と、
該表示部により表示された画像情報に含まれる識別情報を認識する認識部と、
該認識部により認識された識別情報に関連した関連情報の取得を指示する関連情報取得指示部と、
該関連情報取得指示部により該関連情報の取得が指示され該関連情報を該表示部に表示した後に該メールソフトウェア記憶部により記憶された該ソフトウェアを起動するか否かを選択するソフトウェア起動選択部と、
該認識部により該識別情報を認識した後に該メールソフトウェア起動選択部により該ソフトウェアの起動が選択されるとメール作成用の表示画面を少なくとも送信相手先を入力するための宛先欄及び送信したい文字を入力するための本文欄とから構成されるメール作成画面を該表示部に表示するとともに、該本文欄には該認識部により認識された該識別情報と該関連情報のうち少なくともいずれか一方を挿入するように制御する制御部とを備えることを特徴とする情報処理装置。
【請求項25】
他の装置と通信する通信部と、
画像情報を出力する撮像部と、
該撮像部により出力された該画像情報を表示する表示部と、
該表示部により表示された画像情報に含まれる単語情報を認識する認識部と、
該認識部により認識された単語情報がメールアドレスか否かを判定するメールアドレス判定部と、
該通信部を介してメールの送受信を行うためのソフトウェアを記憶するメールソフトウェア記憶部と、
該メールソフトウェア記憶部により記憶された該ソフトウェアを起動するか否かを選択するメールソフトウェア起動選択部と、
該認識部により該単語情報を認識した後に該メールソフトウェア起動選択部により該ソフトウェアの起動が選択されると少なくとも送信相手の相手先を入力するための宛先欄及び送信したい文字を入力するための本文欄とから構成されるメール作成画面を該表示部に表示するとともに、該認識部により認識された単語情報が該メールアドレス判定部によりメールアドレスであると判定された場合は該宛先欄に該単語情報を挿入し、一方、該認識部により認識された単語情報が該メールアドレス判定部によりメールアドレスでないと判定された場合は該宛先欄以外の欄に該単語情報を挿入するように制御する制御部とを備えることを特徴とする情報処理装置。
【請求項26】
他の装置と通信する通信部と、
画像情報を出力する撮像部と、
該撮像部により出力された該画像情報を表示する表示部と、
該表示部により表示された画像情報に含まれる単語情報を認識する認識部と、
該通信部を介してメールの送受信を行うためのソフトウェアを記憶するメールソフトウェア記憶部と、
該メールソフトウェア記憶部により記憶された該ソフトウェアを起動するか否かを選択するメールソフトウェア起動選択部と、
該認識部により該単語情報を認識した後に該メールソフトウェア起動選択部により該ソフトウェアの起動が選択されると少なくとも送信相手の相手先を入力するための宛先欄及び送信したい文字を入力するための本文欄とから構成されるメール作成画面を該表示部に表示するとともに、該認識部により認識された単語情報が該メールアドレスである場合は該宛先欄に該単語情報を挿入し、該認識部により認識された単語情報がメールアドレスでない場合は該宛先欄以外の欄に該単語情報を挿入するように制御する制御部とを備えることを特徴とする情報処理装置。
【請求項27】
他の装置と通信する通信部と、
画像情報を出力する撮像部と、
該撮像部により出力された該画像情報を表示する表示部と、
該表示部により表示された画像情報に含まれる識別情報を認識する認識部と、
該通信部を介してメールの送受信を行うためのソフトウェアを少なくとも記憶するソフトウェア記憶部と、
該ソフト記憶部により記憶された該ソフトウェアを起動するか否かを選択するメールソフトウェア起動選択部と、
該認識部により該識別情報を認識した後で該メールソフトウェア起動選択部により該ソフトウェアの起動が選択されると少なくとも送信相手の相手先を入力するための宛先欄び送信したい文字を入力するための本文欄とから構成されるメール作成画面のうちどの欄に該認識部により認識された該識別情報を挿入するかを選択できる表示画面を該表示部に表示するように制御する制御部とを備えることを特徴とする情報処理装置。
【請求項28】
画像情報を出力する撮像部と、
該撮像部により出力された画像情報に含まれる識別情報を認識する認識部と、
該認識部により認識された該識別情報の位置情報を抽出する認識位置抽出部と、
該認識位置抽出部により抽出された位置情報、該認識部により認識された識別情報、該撮像部により出力された画像情報を送信する送信部とを備えることを特徴とする情報処理装置。
【請求項29】
請求項28記載の情報処理装置において
前記送信部により前記位置情報、前記識別情報及び前記画像情報を送信した後に前記識別情報に関連する関連情報を受信する受信部とを備えることを特徴とする情報処理装置。
【請求項30】
請求項29記載の情報処理装置において
前記識別情報が外国語の単語であり、前記関連情報が該外国語の翻訳であることを特徴とする情報処理装置。
【請求項31】
少なくとも1つ以上の単語を含む画像情報と該画像情報に含まれる所定の単語を特定するための単語特定情報とを受信し、
該画像情報及び該単語特定情報に基づいて該受信した画像情報に含まれる該所定の単語を特定し、
該画像情報に含まれる単語のうちで該特定された単語以外の単語を抽出し、
予め記憶された第1の単語と第2の単語との組み合わせに応じて該第1の単語の関連情報を決定するためのデータベースを参照して該特定された単語の関連情報を決定し、該決定された関連情報を送信することを特徴とする情報処理方法。
【請求項32】
請求項31記載の情報処理方法において、
前記単語特定情報が、前記所定の単語の位置情報を含むことを特徴とする情報処理方法。
【請求項33】
請求項31又は32記載の情報処理方法において、
前記単語が外国語の単語であり、前記関連情報が該外国語の単語の翻訳であることを特徴とする情報処理方法。
【請求項34】
請求項31記載の情報処理方法において、
前記画像情報に含まれる単語のうちで前記特定された単語以外の単語を抽出する際に、
前記画像情報に含まれる単語のうちで前記特定された単語以外の単語の領域を指定し、
該指定された領域と前記画像情報の端とが重ならない場合にその単語を前記画像情報に含まれる単語として抽出することを特徴とする情報処理方法。
【請求項35】
英単語の翻訳を要求する翻訳要求データを受信し、
該受信した翻訳要求データに含まれる翻訳対象となる単語及び翻訳対象以外の単語とから当該単語情報の意味を、予め記憶された、第1の単語と第2の単語との組み合わせに応じて該第1の単語の意味を決定するための統計データが含まれるデータベースから抽出し、
該抽出した意味を該データベースに基づいて並び替え、該並び替えられた意味を表示するための翻訳表示順序データを送信することを特徴とする情報処理方法。
【請求項36】
他の装置と通信する通信部と、画像情報を出力する撮像部と、該撮像部により出力された画像情報に含まれる識別情報を認識する認識部とを有した情報処理装置を実行させるソフトウェアにおいて、
該認識部により認識された識別情報に関連した関連情報の取得が指示された場合に該関連情報を該通信部を介して取得し表示するように該情報処理装置を実行させることを特徴とするソフトウェア。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22】
image rotate

【図23】
image rotate

【図24】
image rotate

【図25】
image rotate


【公開番号】特開2008−160852(P2008−160852A)
【公開日】平成20年7月10日(2008.7.10)
【国際特許分類】
【出願番号】特願2007−335602(P2007−335602)
【出願日】平成19年12月27日(2007.12.27)
【分割の表示】特願2003−194007(P2003−194007)の分割
【原出願日】平成15年7月9日(2003.7.9)
【出願人】(000005108)株式会社日立製作所 (27,607)
【Fターム(参考)】