説明

携帯情報端末

カメラ付携帯電話機(1)では、カメラ部(3)で撮影された画像データに対して、文字認識処理が実行される。具体的には、カメラ部(3)で撮影された画像データが、作業用メモリ(4)に保存され、そこで、制御部(2)によって、文字認識処理を実行される。文字認識処理の結果である文字情報は、文字の種類と関連付けられて、作業用メモリ(4)に一時的に保存される。作業用メモリ(4)には、文字の種類と関連付けられた複数の文字情報が保存可能であり、さらに、カメラ付携帯電話機(1)では、当該複数の文字情報は、一括して、一人分の電話帳への登録されることが可能である。

【発明の詳細な説明】
【技術分野】
本発明は、携帯情報端末に関するものである。特に、文字認識機能を有する携帯情報端末に関するものである。
【背景技術】
従来から、画像を処理することにより画像の中に含まれる文字を文字情報として認識する、いわゆる文字認識という技術があった。具体的には、たとえば、パーソナルコンピュータ等の装置において、当該装置で処理の可能な画像に対して文字認識が行なわれていた。そして、当該文字認識の結果として得られた文字情報が、当該パーソナルコンピュータにおける文字入力に用いられてきた。このような文字認識については、より具体的には、たとえば種々の文献において技術が開示されてきている。
たとえば、特開平2−82379号公報では、文字認識を行なった後、認識結果の文字列を画面に表示し、さらに、カーソルに近接する位置に、当該近接する位置にある認識結果についての複数の候補文字を別途表示させる技術が開示されている。
また、特開平2−257358号公報では、認識結果を表示させ、さらに、当該認識結果の表示とは独立したウィンドウに、認識結果が表示されている中でのカーソルの位置する行のイメージを当該カーソルとともに表示させ、両方の表示におけるカーソルの表示を連動させる技術が開示されている。
また、特開平4−17085号公報には、文字認識の修正が行なわれる際、カーソルの位置付く文字位置にその先頭文字が位置する候補単語のみが表示され選択される技術が開示されている。
このように、従来から、文字認識に関する技術として、その表示態様に工夫を加えることにより、容易な操作によって認識結果を利用するための技術が種々開示されてきた。そして、近年、携帯情報端末においても、画像の表示等、画像データを扱う機能が備えられるようになった。このため、当該携帯情報端末に対しても、このような文字認識の技術の適用が考えられてきた。
なお、携帯情報端末では、機器が携帯性を備えているため、上記したパーソナルコンピュータ等の装置と比較して装置が小型化されており、このことから、ユーザが操作を行なう部分も比較的小型化されている。
このため、携帯情報端末では、より一層、容易な操作によって、認識結果を有効利用できることが望まれる。
【発明の開示】
本発明の目的は、容易な操作で認識結果を有効利用できる携帯情報端末を提供することにある。
本発明に従った携帯情報端末は、画像データを記憶する画像データ記憶部と、画像データ記憶部に記憶された画像データに対して文字認識処理を実行し、文字認識処理の結果として文字情報を出力する文字認識部と、文字認識処理の結果として出力される文字情報の種類を指定する種類指定部と、文字情報を記憶する文字情報記憶部と、文字認識部に第1の画像データに対して文字認識処理を実行させ、さらに、第1の画像データに対する文字認識処理の結果である第1の文字情報を、第1の文字情報について種類指定部に対して指定された種類に対応させて文字情報記憶部に記憶させる制御部と、第1の画像データに対する文字認識処理の後に、文字認識部に、第1の文字情報に関連付けるべき文字情報を得るための文字認識処理であって、第2の画像データについての文字認識処理を実行させるために操作される、連続認識指示部とを備え、制御部は、第2の画像データに対する文字認識処理の結果である第2の文字情報を、第2の文字情報について種類指定部に対して指定された種類に対応させ、かつ、第1の文字情報と関連付けて、文字情報記憶部に記憶させることを特徴とする。
また、本発明に従った携帯情報端末では、文字認識部は、文字認識処理の結果に対して、種類指定部に対して指定された種類に応じて補正を行なった後、文字情報を出力することが好ましい。
また、本発明に従った携帯情報端末では、連続認識指示部は、第1の画像データに対する文字認識処理の後に、連続して、文字認識部に、第1の文字情報に関連付けるべき文字情報を得るための第2の画像データの文字認識処理を実行させるために操作されることが好ましい。
また、本発明に従った携帯情報端末は、文字情報記憶部への文字情報の記憶を指示するために操作される文字情報記憶指示部をさらに備え、制御部は、文字情報記憶指示部が操作されることにより、第1の文字情報と第2の文字情報を一括して文字情報記憶部に記憶させることが好ましい。
また、本発明に従った携帯情報端末では、文字情報記憶部は、電話帳データを記憶可能であり、第1の文字情報および第2の文字情報は、電話帳データを構成する情報であることが好ましい。
また、本発明に従った携帯情報端末では、文字情報記憶部は、住所録データを記憶可能であり、第1の文字情報および第2の文字情報は、住所録データを構成する情報であることが好ましい。
また、本発明に従った携帯情報端末では、第1および第2の文字情報は、文字情報について種類指定部に対して指定される文字情報の種類が同じであることが好ましい。
また、本発明に従った携帯情報端末では、第1および第2の文字情報は、文字情報について種類指定部に対して指定される文字情報の種類が異なることが好ましい。
また、本発明に従った携帯情報端末では、文字認識部は、第1および第2の画像データに対応する文字認識の後に連続認識指示部が操作されることにより、第1および第2の文字情報に関連付けるべき第3の文字情報を得るための文字認識処理であって、第3の画像データについての文字認識を実行し、第1〜第3の文字情報の中の少なくとも2つは、文字情報について種類指定部に対して指定される文字情報の種類が同じであることが好ましい。
また、本発明に従った携帯情報端末では、文字認識部は、第1および第2の画像データに対応する文字認識の後に連続認識指示部が操作されることにより、第1および第2の文字情報に関連付けるべき第3の文字情報を得るための文字認識処理であって、第3の画像データについての文字認識を実行し、第1〜第3の文字情報の中の少なくとも2つは、文字情報について種類指定部に対して指定される文字情報の種類が異なることが好ましい。
また、本発明に従った携帯情報端末は、携帯電話機であることが好ましい。
本発明に従った携帯情報端末の制御方法は、第1の画像データに対する、文字認識処理の結果として出力される文字情報の種類の指定を受付けるステップと、第1の画像データについての文字認識処理を実行するステップと、第1の画像データについての文字認識処理の結果である第1の文字情報を、第1の文字情報に対して指定された種類に対応させて記憶させるステップと、第1の画像データに対する文字認識処理の後に、第2の画像データについての文字認識処理を実行するステップと、第2の画像データに対する文字認識処理の結果である第2の文字情報を、第2の文字情報に対して指定された種類に対応させ、かつ、第1の文字情報と関連付けて、記憶させるステップとを備えることを特徴とする。
本発明によると、連続認識指示部が操作されること等によって、連続的に実行された文字認識処理の結果である複数の文字情報が、互いに関連付けられて、文字情報記憶部等の記憶部に適宜記憶される。これにより、携帯情報端末は、複数の文字認識処理の結果として得られる文字情報を、互いに関連付けて記憶させることができる。したがって、容易な操作で、携帯情報端末において、文字認識の結果が有効利用されるようになる。
また、本発明によると、携帯情報端末において、文字認識の結果として得られた文字情報が、ユーザによって種類指定部に対して指定された種類に応じて補正されて、出力される。これにより、ユーザは、文字認識の結果として、自らが指定した種類に応じて補正された文字情報を得ることができる。したがって、携帯情報端末において、認識結果に対してユーザが行なうことを必要とされる修正等のための操作が削減できる。
また、本発明によると、携帯情報端末において、連続認識指示部が操作されることにより、連続して、異なる画像データに対する文字認識処理が実行されることが可能となる。これにより、ユーザは、その文字認識処理の結果である文字情報を互いに関連付けたい複数の画像データについて、連続して、文字認識処理の結果を得ることができる。したがって、当該携帯情報端末の利便性を向上させることができる。
また、本発明によると、携帯情報端末において、文字情報記憶指示部が操作されることにより、複数の文字情報を、一括して、文字情報記憶部に記憶させることができる。これにより、複数の文字情報を電話帳データとして個人情報に関連付けて記憶させるためには、文字情報ごとに複数回の登録作業が必要とされていた従来の携帯情報端末と比較して、携帯情報端末が、容易な操作で文字認識処理の結果を有効利用できる、利便性の高いものとなる。
また、本発明によると、携帯情報端末において、電話帳データとして、画像データに対する文字認識処理の結果得られた文字情報を利用することができる。したがって、携帯情報端末において、文字認識の結果がさらに有効に利用されるようになる。
また、本発明によると、携帯情報端末において、住所録データとして、画像データに対する文字認識処理の結果得られた文字情報を利用することができる。したがって、携帯情報端末において、文字認識の結果がさらに有効に利用されるようになる。
また、本発明によると、携帯情報端末において、同じ種類を指定された、または、異なる種類を指定された、複数の文字情報が、文字認識の結果として得られることが可能となり、かつ、互いに関連付けて記憶されることが可能となる。このため、ユーザに対して、ユーザが扱う対象となる文字情報の種類についての制約を、できるだけ少なくすることができるため、携帯情報端末の利便性が向上されることになる。
【図面の簡単な説明】
図1は、本発明の一実施の形態であるカメラ付携帯電話機のブロック構成図である。
図2および図3は、図1のカメラ付携帯電話機の外観図である。
図4は、図1のカメラ付携帯電話機の制御部が実行するメインルーチンのフローチャートである。
図5〜図7は、図4に示されたカメラモードのサブルーチンのフローチャートである。
図8〜図24は、図1のカメラ付携帯電話機の表示部における表示態様の一例を示す図である。
【発明を実施するための最良の形態】
以下、図面を参照しつつ、本発明の一実施の形態であるカメラ付携帯電話機(以下、携帯電話と略す)について説明する。なお、以下の説明では、同一の部品には、特記された場合を除き、同一の符号が付され、それらの名称および機能も同じである。したがって、それらについての詳細な説明は繰り返さない場合がある。
まず、図1〜図3を参照して、携帯電話1の概略構成について説明する。なお、図2は、携帯電話1の、表示部10やシャッタボタン12等が備えられた面を示し、図3は、携帯電話1の、図2に示された面の裏面を示している。
携帯電話1は、被写体を撮影して画像データを出力するカメラ部3、液晶表示装置などからなる表示部10、カメラ部3を起動させるために操作されるカメラキー11、カメラ部3によるシャッタ動作のためおよび撮影して得られた画像データを保存するために操作されるシャッタボタン12、通信のためのアンテナ15、表示部10に表示された内容に対して指示を入力するマルチキー30、カメラ部3で接写するために操作される接写キー35、電話番号や文字(数字を含む)を入力するために操作される複数のボタンからなるダイヤルボタン40、および、モードボタン19を備える。マルチキー30は、表示部10に表示されたカーソルを上下左右にそれぞれ移動させるための上キー31、下キー33、左キー32、および、右キー34が一体的に構成されたものである。なお、各種操作のためのボタンやキーの種類および配置はこれに限定されない。例えば、表示部10に表示される操作メニューの中から操作すべき項目を選択するようにしてもよい。
携帯電話1は、各部を制御するためにCPU(Central Processing Unit)などのマイクロプロセッサを含む制御部2、CCD(Charge Coupled Device)16を含むカメラ部3、RAM(Random Access Memory)からなる作業用メモリ4、圧縮処理部20を有し画像データを圧縮処理部20でエンコード(圧縮)して保存処理するための保存処理部5、フラッシュメモリからなる保存用メモリ7、RAMからなる表示用メモリ8、表示ドライバ部9、表示部10、カメラキー11、シャッタボタン12およびモードボタン19、アンテナ15を介した通信のための通信制御部13、ならびに、無線部14を備える。
制御部2は、携帯電話1の制御に用いるための各種プログラムデータ等を記録するためのメモリ21を備えている。
接写キー35は、カメラ部3のレンズ36の外周に設置されたレバーとして備えられている。
携帯電話1は、周知の携帯電話機と同様に、通話機能、メール機能、Web接続機能(コンピュータ等のネットワークへの接続機能)、および、電話帳機能を有している。電話帳機能では、たとえば、人物等の名前、電話番号、メールアドレス、URL(Uniform Resource Locator)、画像を含む種々のデータを、それぞれの人物等について互いに関連付けて、保存用メモリ7に記憶させることができる。また、携帯電話1は、カメラ部3において撮影された画像データを保存するカメラ機能を有している。
カメラ部3において撮影された画像データは、作業用メモリ4に一旦保存され、そして、圧縮処理部20でエンコードされて保存用メモリ7に保存される。
さらに、携帯電話1は、カメラ部3で撮影された画像データや、他の装置から入力され保存用メモリ7に保存された画像データに対して、文字認識処理を実行する、文字認識機能を備えている。具体的には、カメラ部3で撮影された画像データは、作業用メモリ4に保存され、そこで、制御部2により、文字認識処理を実行される。文字認識処理の結果である文字情報は、作業用メモリ4に一時的に保存される。なお、保存用メモリ7に保存されている画像データは、作業用メモリ4に移された後、文字認識処理を実行される。
また、携帯電話1は、上記のような文字認識処理で得た文字情報を、文字認識処理の直後に、そのまま、通話機能における電話番号として、メール機能におけるメールアドレスとして、Web接続機能における接続先(URL)として、または、電話帳機能において登録する各種のデータとして、というように、他の機能で活用することができる。以下に、制御部2の実行する処理を、このような文字認識処理で得た文字情報を活用する点を中心に、図4を参照して説明する。
制御部2は、ステップS1(以下、「ステップ」を省略する)で、ユーザから通話機能を使用する旨の操作がなされたか否か判断し、そのような操作があったと判断するとS2で、発呼を行なったりする通話モードの処理を実行した後、S1に処理を戻す。一方、そのような操作がなかったと判断すると、S3に処理を進める。
制御部2は、S3で、ユーザからメール機能を使用する旨の操作がなされたか否か判断し、そのような操作があったと判断すると、S4で、メール作成や送信等のメールモードの処理を実行し、S1に処理を戻す。一方、そのような操作がなかったと判断すると、S5に処理を進める。
制御部2は、S5で、ユーザからWeb接続機能を使用する旨の操作がなされたか否か判断し、そのような操作があったと判断すると、S6で、インターネット等のネットワークに接続する等のWeb接続モードの処理を実行し、S1に処理を戻す。一方、そのような操作がなかったと判断すると、S7に処理を進める。
制御部2は、S7で、電話帳機能を使用する旨の操作がなされたか否か判断し、そのような操作があったと判断すると、S8で、保存用メモリ7に保存された電話帳データの編集等を行なう電話帳モードの処理を実行し、S1に処理を戻す。一方、そのような操作がなかったと判断すると、S9に処理を進める。
制御部2は、S9で、カメラ機能を使用する旨の操作がなされたか否か判断し、そのような操作があったと判断すると、S10で、カメラ部3により撮影される画像を作業用メモリ4に保存する等のカメラモードの処理を実行し、S1に処理を戻す。一方、そのような操作がなかったと判断すると、S11で、ユーザにより操作された内容に従った処理を実行した後、S1に処理を戻す。
以下に、図5〜図7および図8〜図23を参照して、S10におけるカメラモードの処理について説明する。
カメラモードの処理では、制御部2は、S101で、カメラ部3による撮影のモードとして文字読取モードが選択されているか否かを判断する。文字読取モードとは、文字認識処理のために画像を撮影するモードである。そして、文字読取モードが選択されていると判断するとS103以降に処理を進める。一方、それ以外のモードが選択されていると判断すると、S102で、選択されたモードに従った撮影処理を実行した後、処理をリターンさせる。
携帯電話1では、カメラモードに入ったとき、静止画撮影モードで起動される。このモードでは、表示部10には、図8に示すように、表示枠81が表示され、表示枠81内には選択できる複数のメニューが番号と関連付けられて表示される。ユーザは、ダイヤルボタン40の中の、選択したいメニューに対応するボタンを操作するか、上キー31または下キー33を操作することによりカーソル82を選択したいメニューに合わせた後にシャッタボタン12を操作することにより、適宜、メニューを選択できる。
なお、図8では、表示部10の下端中央に、「決定」という文字が欄83として表示されている。これは、欄83に対応する位置に設置されているシャッタボタン12に、操作することにより表示枠81内の内容を決定するという機能がアサインされていることを意味している。
そして、図8に示されている状態から、「カメラモード切替」というメニューが選択されると、表示部10には、図9に示す画面が表示される。図9では、表示部10の表示枠91内には、選択可能な撮影のモードが複数表示されており、その中の1つの上に、カーソル93が位置し、選択可能な状態とされている。そして、ユーザが、ダイヤルボタン40の中の、選択したいモードに対応するボタンを操作するか、上キー31または下キー33を操作することによりカーソル93を選択したいメニューに合わせた後シャッタボタン12を操作することにより、文字読取(図9には「文字読み取り」と表示)メニューを選択できる。なお、図9に示した状態では、現在の文字読取モードでは選択できない「静止画」のメニューにカーソル93が合わされているため、表示部10には、図8の欄83のような「決定」という文字の欄が表示されていない。そして、カーソル93が、図9内の「▲3▼文字読り取り」というメニューに合わされてシャッタボタン12が操作されると、上記した文字読取モードが選択されたことになる。
一方、制御部2は、S103で、ユーザから、文字読取モードにおいて実行される文字認識処理において、どのような種類の文字を読取らせるのかについての入力があったか否かを判断する。そして、入力があったと判断すると、S104で、当該種類を保存用メモリ7に保存し、S105に処理を進める。
なお、携帯電話1では、読取らせる文字の種類として、図10の表示部10の表示枠101内に示すように、「URL」「メールアドレス」「電話番号」「英語名」が準備され、各種類が表示枠101内で、番号に関連付けられて表示されている。
そして、ユーザが、ダイヤルボタン40の中の、選択したいモードに対応するボタンを操作するか、上キー31または下キー33を操作することによりカーソル102を選択したいメニューに合わせてシャッタボタン12を操作することにより、文字の種類が選択される。
なお、図10を参照すると、表示部10の下端中央に「決定」という文字が欄103として表示されている。これは、図8における欄83が表示されているのと同様の意味を有する。
S105で、制御部2は、表示部10に、文字認識処理に用いる画像データを生成する準備をするための画面(文字読取画面)を表示させ、S106に処理を進める。そのような画面の一例を、図11に示す。
携帯電話1において読取らせる文字の種類が選択されると、表示部10には、図11に示された画面が表示される。図11を参照すると、表示枠111には、1番目に、接写モードに設定し、2番目に、表示枠111内にあるモニタ欄112の左右に表示されているガイド113,114内にこれから撮影しようとする文字が入るようカメラ部3の位置を調整し、そして、3番目に、モニタ欄112の下方のバーが所定の状態になったとき(最も青くなったとき)にシャッタボタン12を操作して撮影するように、というメッセージが表示されている。
携帯電話1は、接写キー35を操作されることにより、接写モードとなる。また、モニタ欄112内には、カメラ部3で撮影されている映像が表示される。また、表示部10内にはカメラの絵を含むアイコン115が表示されている。
図11では、携帯電話1が接写モードとされている状態での表示部10を示しているので、アイコン115内には、カメラの絵とともにチューリップの絵が表示されている。なお、携帯電話1が接写モードとされていない場合には、このようなアイコン115内には、チューリップの絵は表示されず、カメラの絵のみが表示される。
S106で、制御部2は、シャッタボタン12が操作されたか否かを判断し、操作されたと判断すると、S107に処理を進める。
S107で、制御部2は、表示部10に、図12に示すように、シャッタボタン12が操作された時点でカメラ部3が撮影していた画像データを表示させた後、S108で、ユーザからの文字認識処理の開始を指示する操作を待つ。なお、このとき、制御部2は、当該画像データを、作業用メモリ4に保存している。
図12では、表示部10内には、現在実行しているモード(文字読取モード)と読取らせる文字の種類(S104で保存した種類、図12ではその一例として「URL」)とを示す欄121が表示されている。また、表示部10内の表示欄122内に、作業用メモリ4に保存された画像データが表示されている。
表示欄122内には、文字認識処理の対象となる画像の領域を指定するための枠123が表示されている。表示欄122における枠123の位置は、上キー31または下キー33が操作されることにより、移動される。
制御部2は、ユーザが、表示欄122に表示されている画像の中で、文字認識処理の対象としたい部分に枠123を移動させた後、シャッタボタン12を操作することにより、文字認識処理を開始するための指示がなされたと判断する。
なお、図12では、表示部10の下端中央に、「読取」という文字が、欄124として表示されている。これは、シャッタボタン12に、操作されることにより文字認識処理の開始を指示するという機能がアサインされていることを意味している。
S109で、制御部2は、作業用メモリ4に保存されている画像データの中で、枠123内に位置する部分に対して、文字認識処理を実行し、文字認識処理が完了すると、S110に処理を進める。なお、文字認識処理を実行している間は、表示部10には、図13に示した画面が表示される。図13に示す画面では、表示部10内の欄131に、文字認識処理を実行している最中である旨を示すメッセージ(「読取中」)が表示されている。
S109における文字認識処理では、当該認識結果に、S104において保存した、読取らせる文字の種類に応じた補正が行なわれる。読取らせる文字の種類と補正パターンとの関係は、たとえば、表1に示すようなテーブルであり、メモリ21に記憶されている。

表1を参照すると、たとえば、読取らせる文字として「URL」が入力されている場合には、認識結果としては、「A」〜「z」という英文字、「0」〜「9」の数字、および、「.」「−」「_」「:」「/」「」という記号文字が、出力文字の候補とされる。また、URLの表示に一般的に添付される「URL:」というキーワード(文字列)は、認識されたとしても、認識結果としては出力しないという補正がなされる。また、認識結果の先頭に、URLには通常存在する「http//:」という文字列が存在しない場合や不完全な状態では、当該文字列を完全な形で出力されるよう補完する補正がなされる。
また、読取らせる文字として「メールアドレス」が入力されている場合には、認識結果としては、「A」〜「z」という英文字、「0」〜「9」の数字、および、「.」「@」「−」「_」「:」という記号文字が、出力文字の候補とされる。また、メールアドレスの表示に一般的に添付される「E−Mail:」というキーワード(文字列)は、認識されたとしても、認識結果としては出力しないという補正がなされる。
また、読取らせる文字として「電話番号」が入力されている場合には、認識結果としては、「0」〜「9」の数字、および、「−」「+」「P」「#」「*」という記号文字が、出力文字の候補とされる。文字認識の結果が、数字またはハイフンのみとなるように補正される。また、電話番号の表示に一般的に添付される「TEL:」というキーワード(文字列)は、認識されたとしても、認識結果としては出力しないという補正がなされる。また、「)」という文字は、認識結果として出力する際には、「−」という文字に置き換えるという補正がなされる。
また、読取らせる文字として「」が入力されている場合には、認識結果としては、「0」〜「9」の数字、および、「−」「+」「P」「#」「*」という記号文字が、出力文字の候補とされる。文字認識の結果が、数字またはハイフンのみとなるように補正される。また、電話番号の表示に一般的に添付される「TEL:」というキーワード(文字列)は、認識されたとしても、認識結果としては出力しないという補正がなされる。また、「)」という文字は、認識結果として出力する際には、「−」という文字に置き換えるという補正がなされる。
S110で、制御部2は、表示部10に、図14に示すように、上記したような表1に従った補正を加えた後の認識結果を表示させ、S111に処理を進める。
図14では、表示部10内の表示欄141に、文字認識処理の結果である文字列が表示されている。文字列の中の1つには、カーソル142が重ねて表示されている。修正候補欄143には、カーソル142が重ねて表示されている文字に対する単数または複数の修正候補が、番号に関連付けられて、表示されている。なお、この修正候補欄143に表示される修正候補の中には、最初に文字認識処理の結果として表示された文字も含まれている。ユーザは、左キー32,右キー34を適宜操作することにより、表示欄141内の文字列の中の修正の対象となる文字を変更することができる。また、ユーザが、ダイヤルボタン40の中の、修正候補欄143内に表示されている希望する修正候補に対応するボタンを操作するか、上キー31または下キー33を操作することによりカーソル144を希望する修正候補に合わせることにより、カーソル142に重ねられた文字が修正される。
また、表示部10に図14に示された画面が表示されているときに、シャッタボタン12が操作されることにより、制御部2は、表示欄141内のすべての文字について修正内容を決定する旨の操作がなされたと判断する。これは、表示部10の下端中央に「決定」という文字が欄145として表示されており、これが、シャッタボタン12に、操作することにより表示欄141内の表示されている文字列を、以降の処理で利用する文字列に決定するという機能がアサインされていることに対応しているからである。
S111では、制御部2は、表示部10に図14に示された画面が表示されているときに、何らかの操作がなされたか否かを判断する。
そして、S111で、制御部2は、上記したような、文字を修正するための操作がなされたと判断すれば、S112で、操作に応じて認識結果を修正した後、S113で、修正後の認識結果を表示部10の表示欄141に表示させて、S111に処理を戻す。
また、S111で、制御部2は、上記したような、すべての文字についての修正内容を決定する旨の操作(シャッタボタン12に対する操作)がなされたと判断すれば、S115に処理を進める。
また、S111で、制御部2は、モードボタン19が操作されたと判断すると、S114で、現在作業用メモリ4に保存されている文字認識処理用の画像データを消去した後、再度作業用メモリ4に画像データを保存するため、S105に処理を戻す。モードボタン19が操作されることによりこのような処理が実行されるのは、モードボタン19に、操作することにより再度画像の読取りを開始するという機能がアサインされているからである。なお、モードボタン19にこのような機能がアサインされていることは、「再読取」という文字が表示されている欄146に対応する位置にモードボタン19が設置されていることに対応している。
S115で、制御部2は、表示部10に、図15に示すように、これ以降の処理に利用するものとして確定された文字列を表示させ、S116に処理を進める。図15では、表示部10内の表示欄151に、確定された文字列が表示されている。なお、表示欄151の横には、表示欄152として、当該文字列の種類(S104で保存した種類、図15ではその一例として「URL」)が表示されている。
ここで、制御部2は、S115で表示される画面の種類をS104に保存されている文字列の種類に応じたものにするように制御している。具体的には、S104に保存されている文字列の種類(読取らせる文字の種類)を参照し、表2に示すものに制御している。

つまり、表2から理解されるように、文字列の種類(読取種類)がURLであれば、S115で表示される画面は、Web接続のURL入力画面とされる。文読取種類がメールアドレスであれば、S115で表示される画面は、メール送信時のメール入力画面とされる。文読取種類が電話番号であれば、S115で表示される画面は、電話発呼前の電話番号入力画面とされる。そして、文読取種類が英語名であれば、S115で表示される画面は、電話帳において名前欄を入力するための画面とされる。図15では、一例として、読取種類がURLである場合の、Web接続のURL入力画面が示されている。
また、S115では、制御部2は、当該確定された文字列を、S104で保存した種類と関連付けて、作業用メモリ4に保存する。ここで、今回保存する文字列が、S120として後述する、確定文字列を続き登録用に保存される処理が実行された後に実行された文字認識処理による文字列であれば、つまり、前回の文字認識処理による文字列の続きとして得られた文字列であれば、前回の文字認識処理による文字列と連結させて、保存される。
S116で、制御部2は、ユーザが行なった操作の内容を判断し、操作の内容に応じて処理を進める。
具体的には、S116で、制御部2は、モードボタン19が操作されたと判断するとS114に処理を進める。これは、モードボタン19が、図15の表示部10内の「再読取」と表示された欄155に対応する位置に設置され、再度画像データを読取ることを指示する機能をアサインされていることに基づいている。
また、S116で、制御部2は、カメラキー11が操作されたと判断すると、予め用意されたサブメニューからユーザの選択するメニューを判断するS117に処理を進める。これは、カメラキー11が、図15の表示部10内の「サブメニュー」と表示された欄154に対応する位置に設置され、ユーザに、さらにサブメニューを選択させることを指示する機能をアサインされていることに基づいている。
S117では、制御部2は、サブメニューの画面を表示させ、S118で、ユーザからの入力を待つ。S118で、制御部2は、S115で表示された「確定された文字列」を電話帳に登録するメニューが選択されたと判断すると、S125に処理を進める。
また、S118で、追加読取りをするメニューが選択されたと判断すると、制御部2は、S119で、S115で表示された「確定された文字列」を作業用メモリ4に追加登録用に保存した後、S103に処理を戻す。追加読取りとは、現在の「確定された文字列」と、続いて文字認識処理を行なった結果として得られる別の文字列とを、電話帳の同じ人の欄に、つまり、互いに関連付けて、保存用メモリ7に保存するためのメニューである。また、「追加登録用に保存する」こととは、現在の「確定された文字列」を、現在S104に保存されている文字の種類と関連付け、かつ、後に保存される別の文字列とともに追加登録が可能なように、保存することである。このため、追加登録では、続いて行なわれる文字認識処理において新たに文字の種類を指定する必要がある。したがって、S119の処理の後、S103に処理が戻される。
また、S118で、続き読取りをするメニューが選択されたと判断すると、制御部2は、S120で、S115で表示された「確定された文字列」を作業用メモリ4に続き登録用に保存した後、S105に処理を戻す。続き読取りとは、現在の「確定された文字列」と、続いて文字認識処理を行なった結果として得られる別の文字列とを、連続した一つの文字列として連結させて、保存用メモリ7に保存するためのメニューである。また、「続き登録用に保存する」こととは、現在の「確定された文字列」を、現在S104の処理によって保存用メモリ7に保存されている文字の種類と関連付け、かつ、後に保存される別の文字列とともに続き登録が可能なように、保存することである。このため、続き登録では、続いて行なわれる文字認識処理において文字の種類を指定する必要がない。したがって、S120の処理の後、S105に処理が戻される。
一方、S116で、制御部2は、シャッタボタン12が操作されたと判断すると、S121に処理を進める。S121では、制御部2は、表示部10に、S104に保存した種類に応じたアプリケーションを起動するための確認画面を表示させる。S121でこのような処理が実行されるのは、シャッタボタン12が、S104に保存した文字の種類に応じたアプリケーションを起動するための処理を実行を決定する機能をアサインされていることに基づいている。シャッタボタン12にこのような機能がアサインされていることは、図15の表示部10内の欄153内に「決定」と表示され、そして、シャッタボタン12が、当該欄153に対応する位置に設置されていることに基づいている。
また、S121で表示される画面の一例を図16に示す。図16を参照して、表示部10内の表示枠161には、ユーザに対し、アプリケーションの起動について確認するメッセージが表示されている。図16では、一例として、文字の種類がURLの場合に表示される画面が示されている。
そして、S121で確認画面を表示させた後、制御部2は、S122で、ユーザが行なった操作の内容を判断し、操作の内容に応じて処理を進める。
具体的には、「はい」というメニューに対応するメニュー欄164上にカーソルを位置させてシャッタボタン12が操作されたと判断すると、S123に処理を進める。制御部2が、S121で確認画面を表示させた後、メニュー欄164上にカーソルを位置させてシャッタボタン12が操作されることを条件としてS123に処理を進めるのは、図16の表示部10の下端中央に「決定」という文字が欄162として表示されていることが、欄162に対応する位置に設置されているシャッタボタン12に対して、操作されることにより確認画面の内容を確認し、かつ、アプリケーションの起動を決定するという機能がアサインされていることを意味している。
一方、「いいえ」というメニューに対応するメニュー欄165上にカーソルを位置させてシャッタボタン12が操作されたと判断すると、制御部2は、S116に処理を戻す。
なお、上記したようなS119の処理が行なわれることによって、複数の文字列が作業用メモリ4に保存されている場合には、S115の処理によって、表示部10に、当該複数の文字列のそれぞれが、図15の表示欄151,152のような欄に表示される。そして、このような場合には、当該複数の文字列のいずれか1つの上にカーソルが表示される。ユーザは、当該カーソルを、上キー31または下キー33を適宜操作することにより適宜移動させて、当該複数の文字列の中のいずれか1つを選択し、シャッタボタン12を操作すると、S121以降の処理は、選択された文字列(の種類)に対応した処理がなされる。
そして、制御部2は、S123で、アプリケーションを起動させた後、S124で、当該アプリケーションに基づいた処理を実行して、リターンする。なお、S123の処理によると、表示部10には、図17に示すように、アプリケーションの起動を報知するメッセージを含む表示枠171が、表示される。
一方、制御部2は、S125で、今回の登録が、電話帳において、新規の個人についての登録であるか否かを判断する。そして、制御部2は、新規の個人の登録であると判断するとS127に、すでにある個人データへの追加の登録であると判断するとS126に、それぞれ処理を進める。
S126では、制御部2は、ユーザから、データを追加する対象となる個人データを特定するデータの入力を受付け、電話調データの中の当該個人データを選択し、処理をS127に進める。
S127では、制御部2は、電話帳編集ソフトウェアを起動し、S128に処理を進める。
S128では、制御部2は、当該電話帳編集ソフトウェアに従って、作業用メモリ4に保存された個人のデータを入力(保存)する処理を行なう。そして、S129で、制御部2は、当該入力(保存)する処理が完了したと判断すると、処理をリターンさせる。
以上説明したカメラモードの処理では、制御部2は、S121で確認画面を表示させる際、当該確認画面が対応するアプリケーションを、S104に保存した文字の種類を参照し、さらに、表3のような、アプリケーションと文字の種類とが関連付けられたテーブルを参照することによって、決定する。

表3から理解されるように、文字列の種類(読取種類)がURLであれば、S121ではWeb接続についての確認画面が表示される。文読取種類がメールアドレスであれば、S121では電子メールソフトウェアの起動についての確認画面が表示される。文読取種類が電話番号であれば、S121では通話ソフトウェアの起動(または、通話発呼)についての確認画面が表示される。そして、文読取種類が英語名であれば、S115で表示される画面は、電話帳編集ソフトウェアの起動についての確認画面が表示される。
ここで、図18〜図23に、上記したS115の処理によって表示される、確定された文字列を表示する画面、および、S121において表示される確認画面について、図15と図16に示した例とは別の文字の種類が指定された場合についての画面を示す。
図18,図20,図22には、それぞれ、文字の種類が、メールアドレス,電話番号,英語名とされた場合についての、確定された文字列を表示する画面が示されている。
図18,図20,図22の各画面には、図15に示された表示欄151に対応するように、確定された文字列を表示するための表示欄181,201,221が含まれている。また、これらの各画面には、図15に示された表示欄152に対応するように、文字列の種類を表示するための表示欄182,202,222が表示されている。また、これらのの各画面には、図15に示された欄153〜155と同じ機能を有する、欄183〜185,203〜205,223〜225が表示されている。
また、図19,図21,図23には、それぞれ、文字の種類が、メールアドレス,電話番号,英語名とされた場合の、確認画面が示されている。
図19,図21,図23の各画面には、図16に示された表示枠161に対応するように、電子メールソフトウェアの起動について確認するメッセージを含む表示枠191、通話発呼について確認するメッセージを含む表示枠211、電話帳編集ソフトウェアの起動について確認するメッセージを含む表示枠231が表示されている。また、これらの各画面には、図16の欄162と同じ機能を有する、欄192,212,232が表示されている。また、図19,図21,図23の各画面には、図16に示されたメニュー欄164,165と同様に、「はい」「いいえ」に対応するメニュー欄194,195,214,215,234,235が表示されている。
以上説明した本実施の形態では、携帯電話1は、文字の種類と関連付けられた複数(たとえば、3件まで)の文字列を作業用メモリ4に保存可能であり(S119の処理参照)、そして、S125以降の処理によって、当該複数の文字列を、一括して、一人分の電話帳に登録することができる。
なお、携帯電話1における電話帳では、一人分のデータとして、表4に示されるように、「電話帳内区分」として示される9つの情報が登録可能とされる。

つまり、携帯電話1では、電話帳として、名前と、当該名前の読み(フリガナ)と、3つの電話番号(電話番号1〜電話番号3)と、3つのメールアドレス(メールアドレス1〜メールアドレス3)と、パーソナルデータとが、互いに関連付けられて、保存用メモリ7に保存される。
なお、S125〜S129の処理で一度に保存される文字列の上限は、たとえば3件とされるが、これらの3件ともが、メールアドレス等、同じ種類を指定された文字列であっても良いし、1件の電話番号と1件のメールアドレスと1件のURLというように、すべて異なる種類を指定された文字列であっても良い。また、3件の文字列は、2件が電話番号であり1件がメールアドレスであるというように、一部が同じ種類の文字列であり、さらに、異なる種類の文字列を含むようなものであっても良い。
また、S125〜S129の処理が実行される際、作業用メモリ4には、たとえば、表5に示すように、複数の(単数の場合もある)確定された文字列がそれぞれ読取種類と関連付けられて、保存されている。

つまり、作業用メモリ4には、たとえば表5に示すように、読取種別がURLとされた1つの文字列と、読取種別がメールアドレスとされた2つの文字列と、読取種別が電話番号とされた1つの文字列とが、保存されている。そして、S118の処理では、これらが、一括して、一人分の電話帳のデータとして、登録される。なお、どの読取種別の文字列がどの電話帳区分のデータとして保存されるかは、表6に示された関係に基づいて決定される。

つまり、読取種別をURLとされて確定された文字列は、電話帳のパーソナルデータとして保存される。また、読取種別をメールアドレスとされて確定された文字列は、電話帳のメールアドレス1〜メールアドレス3のいずれかとして保存される。また、読取種別を電話番号として確定された文字列は、電話帳の電話番号1〜電話番号3のいずれかとして保存される。また、読取種別を英語名とされて確定された文字列は、電話帳の「読み」として保存される。
図24に、作業用メモリ4に表5に示した文字列が保存されている場合に、S125〜S129が実行された結果として表示部10で表示される、電話帳として登録されたデータを表示する画面を示す。図24では、表示部10内の、欄241は名前を、欄242は当該名前の読みを、欄243〜245は電話番号を、欄246〜248はメールアドレスを、欄249はパーソナルデータを、表示する欄である。そして、図24では、欄243,246,247,249に、それぞれ、表5に示したデータが表示されている。
なお、表4から理解されるように、電話帳の一人分のデータには、名前、読み、および、パーソナルデータは1つずつしか登録できず、また、電話番号およびメールアドレスは3つまでしか登録ができない。したがって、S119において追加登録用の保存がなされる場合、ユーザが、各電話帳区分に対応する読取種類についてこの数を越えて保存させようとした場合には、制御部2は、当該保存が不可能である旨を表示等によって報知する制御を実行することが好ましい。
以上説明した実施の形態では、携帯情報端末の具体例として携帯電話機を挙げたが、本発明はこれに限定されない。また、本実施の形態において電話帳にメールアドレス等を登録する技術は、必ずしも携帯情報端末のみに適用されるものではなく、通信機能を持たない携帯情報端末に対しても、適用することができる。
また、以上説明した本実施の形態では、電話帳に、メールアドレス等を登録する技術について説明したが、本発明はこれに限定されず、個人別に管理するデータベースであれば、住所録等に、メールアドレス等の種々の情報を登録する技術についても、本発明を適用することができる。
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなく特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
【図1】

【図2】

【図3】

【図4】

【図5】

【図6】

【図7】

【図8】

【図9】

【図10】

【図11】

【図12】

【図13】

【図14】

【図15】

【図16】

【図17】

【図18】

【図19】

【図20】

【図21】

【図22】

【図23】

【図24】


【特許請求の範囲】
【請求項1】
画像データを記憶する画像データ記憶部(4)と、
前記画像データ記憶部に記憶された画像データに対して文字認識処理を実行し、前記文字認識処理の結果として文字情報を出力する文字認識部(2)と、
前記文字認識処理の結果として出力される文字情報の種類を指定する種類指定部(40,31,32,102,12)と、
文字情報を記憶する文字情報記憶部(4)と、
前記文字認識部に第1の画像データに対して文字認識処理を実行させ、さらに、前記第1の画像データに対する文字認識処理の結果である第1の文字情報を、前記第1の文字情報について前記種類指定部に対して指定された種類に対応させて前記文字情報記憶部に記憶させる制御部(2)と、
前記第1の画像データに対する文字認識処理の後に、前記文字認識部に、前記第1の文字情報に関連付けるべき文字情報を得るための文字認識処理であって、第2の画像データについての文字認識処理を実行させるために操作される、連続認識指示部(19)とを備え、
前記制御部は、前記第2の画像データに対する文字認識処理の結果である第2の文字情報を、前記第2の文字情報について前記種類指定部に対して指定された種類に対応させ、かつ、前記第1の文字情報と関連付けて、前記文字情報記憶部に記憶させる、携帯情報端末。
【請求項2】
前記文字認識部は、文字認識処理の結果に対して、前記種類指定部に対して指定された種類に応じて補正を行なった後、前記文字情報を出力する、請求項1に記載の携帯情報端末。
【請求項3】
前記連続認識指示部は、前記第1の画像データに対する文字認識処理の後に、連続して、前記文字認識部に、前記第1の文字情報に関連付けるべき文字情報を得るための前記第2の画像データの文字認識処理を実行させるために操作される、請求項1または請求項2に記載の携帯情報端末。
【請求項4】
前記文字情報記憶部への文字情報の記憶を指示するために操作される文字情報記憶指示部(12)をさらに備え、
前記制御部は、前記文字情報記憶指示部が操作されることにより、前記第1の文字情報と前記第2の文字情報を一括して前記文字情報記憶部に記憶させる、請求項1または請求項2に記載の携帯情報端末。
【請求項5】
前記文字情報記憶部は、電話帳データを記憶可能であり、
前記第1の文字情報および前記第2の文字情報は、前記電話帳データを構成する情報である、請求項1または請求項2に記載の携帯情報端末。
【請求項6】
前記文字情報記憶部は、住所録データを記憶可能であり、
前記第1の文字情報および前記第2の文字情報は、前記住所録データを構成する情報である、請求項1または請求項2に記載の携帯情報端末。
【請求項7】
前記第1および第2の文字情報は、前記文字情報について前記種類指定部に対して指定される文字情報の種類が同じである、請求項1または請求項2に記載の携帯情報端末。
【請求項8】
前記第1および第2の文字情報は、前記文字情報について前記種類指定部に対して指定される文字情報の種類が異なる、請求項1または請求項2に記載の携帯情報端末。
【請求項9】
前記文字認識部は、前記第1および第2の画像データに対応する文字認識の後に前記連続認識指示部が操作されることにより、前記第1および第2の文字情報に関連付けるべき第3の文字情報を得るための文字認識処理であって、第3の画像データについての文字認識を実行し、
前記第1〜第3の文字情報の中の少なくとも2つは、前記文字情報について前記種類指定部に対して指定される文字情報の種類が同じである、請求項1または請求項2に記載の携帯情報端末。
【請求項10】
前記文字認識部は、前記第1および第2の画像データに対応する文字認識の後に前記連続認識指示部が操作されることにより、前記第1および第2の文字情報に関連付けるべき第3の文字情報を得るための文字認識処理であって、第3の画像データについての文字認識を実行し、
前記第1〜第3の文字情報の中の少なくとも2つは、前記文字情報について前記種類指定部に対して指定される文字情報の種類が異なる、請求項1または請求項2に記載の携帯情報端末。
【請求項11】
前記携帯情報端末は、携帯電話機である、請求項1または請求項2に記載の携帯情報端末。
【請求項12】
第1の画像データに対する、文字認識処理の結果として出力される文字情報の種類の指定を受付けるステップと、
前記第1の画像データについての文字認識処理を実行するステップと、
前記第1の画像データについての文字認識処理の結果である第1の文字情報を、前記第1の文字情報に対して指定された種類に対応させて記憶させるステップと、
前記第1の画像データに対する文字認識処理の後に、第2の画像データについての文字認識処理を実行するステップと、
前記第2の画像データに対する文字認識処理の結果である第2の文字情報を、前記第2の文字情報に対して指定された種類に対応させ、かつ、前記第1の文字情報と関連付けて、記憶させるステップとを備える、携帯情報端末の制御方法。

【国際公開番号】WO2004/109587
【国際公開日】平成16年12月16日(2004.12.16)
【発行日】平成18年7月20日(2006.7.20)
【国際特許分類】
【出願番号】特願2005−506733(P2005−506733)
【国際出願番号】PCT/JP2004/006106
【国際出願日】平成16年4月27日(2004.4.27)
【出願人】(000005049)シャープ株式会社 (33,933)
【Fターム(参考)】