説明

情報入力装置、及びプログラム

【課題】 様々な様式で情報が表示された画像表示媒体から、特定の情報を読み取ることができる情報入力装置を提供する。
【解決手段】 情報入力装置2は、背景色と情報の種類とが互いに対応付けられた種類テーブルを予め有し、画像表示媒体から読み取られた画像に対して、文字認識処理を行い、画像中で特定された文字列について、上記種類テーブルを用いて、文字列で示される情報の種類を判定し、判定結果に応じて、特定された文字列を分類整理する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報入力装置に関する。
【背景技術】
【0002】
例えば、特許文献1には、原稿上の太線又はマ−カペンにより指定された枠を検知することで文字認識対象領域を設定する複写装置が開示されている。
また、特許文献2には、多数枚の伝票を読み取って累積演算する光学式文字認識装置において、読み取られた帳票が白紙の場合には累積演算結果をホスト・コンピュータに転送する光学式文字読取装置が開示されている。
また、特許文献3には、端末側の読み取り手段から任意のフォーマットの帳票を読み取り、表示手段に表示された帳票の画像情報を参照して、このフォーマットをデータ化し、データ化されたフォーマットを本体側に登録する帳票用文字認識装置が開示されている。
【特許文献1】特開平7−273928号公報
【特許文献2】特開平5−342401号公報
【特許文献3】特開平10−97587号公報
【発明の開示】
【発明が解決しようとする課題】
【0003】
本発明は、上述した背景からなされたものであり、様々な様式で情報が表示された画像表示媒体から、特定の情報を読み取ることができる情報入力装置を提供することを目的とする。
【課題を解決するための手段】
【0004】
[情報入力装置]
上記目的を達成するために、本発明にかかる情報入力装置は、画像を読み取る読取手段と、前記読取手段により読み取られた画像の中から、既定の描画特性を有する画像領域を特定する領域特定手段と、前記領域特定手段により特定された画像領域に表示された情報の種類を、この画像領域の描画特性に基づいて判定する種類判定手段とを有する。
【0005】
好適には、前記描画特性は、色又は模様であり、前記領域特定手段は、既定の色又は模様が背景となっている画像領域を特定し、前記種類判定手段は、特定された画像領域における背景の色又は模様に基づいて、情報の種類を判定する。
【0006】
好適には、前記領域特定手段により特定された画像領域に対して、文字認識処理を行う文字認識手段をさらに有し、前記種類判定手段は、前記文字認識手段により認識された文字列が示す情報の種類を判定する。
【0007】
好適には、情報の種類と描画特性とが互いに対応付けられた種類テーブルを登録するテーブル登録手段と、前記種類判定手段は、前記テーブル登録手段により登録された種類テーブルを参照して、画像領域に表示された情報の種類を判定する。
【0008】
[プログラム]
また、本発明にかかるプログラムは、画像表示媒体から読み取られた画像の中から、既定の描画特性を有する画像領域を特定するステップと、特定された画像領域に表示された情報の種類を、この画像領域の描画特性に基づいて判定するステップとをコンピュータに実行させる。
【発明の効果】
【0009】
請求項1にかかる発明は、様々な様式の画像表示媒体に表示された情報の種類を特定することができる。
請求項2にかかる発明は、ユーザにとって特定の情報を記載すべき領域を判別しやすくなり、また、特定の情報が記載される領域の範囲を判別しやすくなる。
請求項3にかかる発明は、画像表示媒体から読み取られた画像から、特定の種類の情報を取り出すことができる。
請求項4にかかる発明は、ユーザが任意に特定の情報を記載すべき領域の描画特性を決定することができる。
請求項5にかかる発明は、様々な様式の画像表示媒体に表示された情報の種類を特定することができる。
【発明を実施するための最良の形態】
【0010】
[ハードウェア構成]
まず、情報入力装置2のハードウェア構成を説明する。
図1は、情報入力装置2のハードウェア構成を、制御装置20を中心に例示する図である。
図1に例示するように、情報入力装置2は、CPU202及びメモリ204などを含む制御装置20、通信装置22、スキャナ装置23、HDD・CD装置などの記録装置24、並びに、LCD表示装置あるいはCRT表示装置およびキーボード・タッチパネルなどを含むユーザインターフェース装置(UI装置)26から構成される。
情報入力装置2は、例えば、スキャナ装置23により光学的に読み取られた画像データから、特定の情報を抽出し、抽出された情報を仕分けしてサーバ(不図示)に送信する。
なお、情報入力装置2は、スキャナ装置23に加えて、印刷機能及びファクシミリ送受信機能を実現する装置を有してもよい。
【0011】
[情報入力プログラム]
図2は、制御装置20(図1)により実行される情報入力プログラム5の機能構成を例示する図である。
図2に例示するように、情報入力プログラム5は、画像読取部500、文字認識部510、背景判定部520、テーブル登録部530、種類判定部540、及び情報送信部550を有する。
情報入力プログラム5は、例えば、記録媒体240に記録されており、この記録媒体240を介して制御装置20にインストールされる。
【0012】
情報入力プログラム5において、画像読取部500は、スキャナ装置23(図1)を制御して、画像表示媒体(例えば、伝票)から画像を読み取り、読み取られた画像のデータを文字認識部510及び背景判定部520に出力する。
【0013】
文字認識部510は、画像読取部500により読み取られた画像データに対して、文字認識処理を行い、画像に含まれる文字を特定し、特定された文字を種類判定部540に出力する。
例えば、文字認識部510は、パターンマッチングなどにより、画像に含まれる文字列(数字、かな、漢字、アルファベット、記号等)を特定し、特定された文字列の文字コードを種類判定部540に出力する。
【0014】
背景判定部520は、画像読取部500により読み取られた画像データの中から、特定の描画特性を有する画像領域を特定し、特定された画像領域の範囲及びその描画特性を種類判定部540に通知する。ここで、「描画特性」とは、例えば、色、又は、模様などである。そして、この場合の「色」には、人間の目に見える色の他、人間の目に見えない波長領域の反射光(紫外光、赤外光など)も含まれうる。
本例の背景判定部520は、画像読取部500により読み取られた画像データの中から、テーブル登録部530に登録された色が背景となっている画像領域を特定する。
【0015】
テーブル登録部530は、UI装置26(図1)又は通信装置22(図1)を介して、描画特性(例えば、背景の色又は模様)と、情報の種類(例えば、商品名、単価、数量、合計額など)とを互いに対応付ける種類テーブルの登録を受け付ける。
例えば、ユーザが、ネットワークに接続されたコンピュータ端末、又は、UI装置26などを操作して、情報の種類に対応する描画特性を指定すると、テーブル登録部530は、ユーザの指定に応じて、描画特性と情報の種類とが互いに対応付けられた種類テーブルを生成し、生成された種類テーブルを登録する。
【0016】
種類判定部540は、文字認識部510により特定された文字又は文字列が示す情報の種類を判定する。
本例の種類判定部540は、文字認識部510により特定された文字列が、背景判定部520により特定された画像領域のいずれに存在するかを判断し、この文字が存在する画像領域の描画特性に対応する情報の種類を、テーブル登録部530に登録されている種類テーブルから読み出し、読み出された種類とその文字のコードとを情報送信部550に出力する。なお、同一の画像領域に複数の文字列が存在する場合に、種類判定部540は、それぞれの文字列について、情報の種類を判定し、それぞれの文字列のコードに対して、情報の種類を対応付けて情報送信部550に出力する。
【0017】
情報送信部550は、種類判定部540により判定された情報の種類に基づいて、文字認識部510により特定された文字(又は文字列)を分類する。
本例の情報送信部550は、種類判定部540から入力された情報の種類に基づいて、種類判定部540から入力された文字コードを分類して、表計算ソフトウェアのデータフォーマットに変換し、この文字コードが含まれたデータファイルを外部に送信する。
【0018】
図3は、テーブル登録部530(図2)により登録される種類テーブル532を例示する図である。
図3に例示するように、本例のテーブル登録部530は、ユーザの操作に応じて、背景の色と情報の種類及び属性とが互いに対応付けられた種類テーブル532を作成し、作成された種類テーブル532を登録する。情報の属性とは、情報が有する性質であり、例えば、かな、漢字、数字又はアルファベットなどの文字種や、文字数又は数字の桁数などの文字列の長さなどである。情報の属性は、例えば、文字認識処理の精度向上を図るため、又は、同一の画像領域に記載された複数の文字列を分離するためなどに利用される。
なお、本図では、「黄色」、「グレー」、「青色」等と記載されているが、実際には、各色に相当する各色成分の範囲(例えば、R成分、G成分及びB成分の範囲)が、種類テーブル532に登録される。
【0019】
図4は、スキャナ装置23(図1)で読み取られる画像表示媒体(伝票700)を例示する図である。
図4に例示するように、伝票700には、複数の記載欄710が設けられている。各記載欄710は、単一の色で塗り潰されている。各記載欄710の色は、記載されるべき情報の種類に応じて決定された色であり、種類テーブル532に登録される色である。したがって、記載されるべき情報の種類が異なると、記載欄710の背景色も異なる。
ユーザは、この伝票700に、手書きで「商品名」、「単価」、「数量」等を記載して、この伝票700の記載面を情報入力装置2のスキャナ装置23で読み取らせる。
【0020】
図5は、第2の伝票702を例示する図である。
図5に例示された伝票702は、図4の伝票700のレイアウトを変更したものである。このように、伝票のレイアウトを変更しても、各記載欄710の色が一致していれば、情報入力装置2により文字列の抽出及び分類が可能である。
【0021】
[全体動作]
次に、情報入力装置2の動作を説明する。
図6は、情報入力プログラム5の動作(S10)を示すフローチャートである。
図6に示すように、ステップ100(S100)において、ユーザは、図4又は図5に例示した伝票700(702)の記載欄710に手書きで情報を記載し、情報入力装置2のスキャナ装置23(図1)にセットし、情報読取りを指示する。
情報入力プログラム5の画像読取部500(図2)は、ユーザの指示に応じて、スキャナ装置23を制御して、伝票700(702)から画像を読み取らせ、読み取られた画像データを文字認識部510及び背景判定部520に出力する。
【0022】
ステップ110(S110)において、文字認識部510は、画像読取部500から入力された画像データに対して、文字認識処理を行い、画像に含まれる文字を特定し、特定された文字のコードを種類判定部540に出力し、文字が特定された位置を背景判定部520に出力する。
【0023】
ステップ120(S120)において、背景判定部520は、文字認識部510から入力された位置(文字が特定された位置)の背景色(下地色)を判定し、判定された色を種類判定部540に出力する。背景色は、例えば、既定の誤差範囲内の画素値(RGB値)が既定サイズ以上連続するか否かにより判定される。
【0024】
ステップ130(S130)において、種類判定部540は、文字認識部510から入力された文字コードについて、背景判定部520により判定された背景色に基づいて、情報の種類を判定し、文字コードとその判定結果とを情報送信部550に出力する。情報の種類の判定は、背景判定部520により判定された背景色に対応する情報の種類を種類テーブル532(図3)から読み出すことにより実現される。
【0025】
ステップ140(S140)において、情報送信部550は、種類判定部540から入力された判定結果(情報の種類)に応じて、種類判定部540から入力された文字コードを分類し、表計算ソフトウェアのデータフォーマットで整理する。
【0026】
ステップ150(S150)において、情報送信部550は、表計算ソフトウェアのデータフォーマットで整理された文字コードを外部(例えば、情報の集計を行う本部サーバなど)に送信する。
【0027】
以上説明したように、本実施形態における情報入力装置2は、記載欄の背景色又は背景模様に基づいて、記載欄に記載された情報の種類を判別し、情報の種類に応じて、記載されていた情報を整理する。
【0028】
[変形例]
上記実施形態では、まず文字認識処理を行い、文字が特定された領域の背景色を判定しているが、これに限定されるものではない。
そこで、本変形例の情報入力装置2は、特定の色(又は模様)が背景となっている画像領域を特定し、特定された画像領域についてのみ、文字認識処理を行う。
【0029】
図7は、変形例における情報入力プログラム5の動作(S20)を示すフローチャートである。
図7に示すように、ステップ200(S200)において、ユーザは、伝票700(図4)の記載欄710に手書きで情報を記載し、情報入力装置2のスキャナ装置23(図1)にセットし、情報読取りを指示する。
情報入力プログラム5の画像読取部500(図2)は、ユーザの指示に応じて、スキャナ装置23を制御して、伝票700(702)から画像を読み取らせ、読み取られた画像データを文字認識部510及び背景判定部520に出力する。
【0030】
ステップ210(S210)において、背景判定部520は、テーブル登録部530の種類テーブル532(図3)に登録された色が背景色として用いられている画像領域を特定し、特定された画像領域の範囲を文字認識部510に通知し、特定された画像領域の背景色を種類判定部540に通知する。
【0031】
ステップ220(S220)において、情報入力プログラム5は、背景判定部520により特定された画像領域の中から、順に注目領域を設定する。
【0032】
ステップ230(S230)において、種類判定部540は、背景判定部520により判定された注目領域の背景色に基づいて、情報の種類及び属性を判定し、判定された属性を文字認識部510に出力する。
【0033】
ステップ240(S240)において、文字認識部510は、画像読取部500から入力された画像データのうち、背景判定部520から通知された注目領域(画像領域)の範囲に対して文字認識処理を行う。この場合の文字認識処理は、種類判定部540から通知された属性(例えば、文字の種類など)に応じた処理である。
文字認識部510は、注目領域で特定された文字列の文字コードを種類判定部540に出力し、種類判定部540は、文字認識部510から入力された文字コードに対して、この注目領域で判定された情報の種類を対応付けて情報送信部550に出力する。
【0034】
ステップ250(S250)において、情報送信部550は、種類判定部540から入力された情報の種類に応じて、種類判定部540から入力された文字コードを分類し、表計算ソフトウェアのデータフォーマットで整理する。
【0035】
ステップ260(S260)において、情報入力プログラム5は、全画像領域について処理が終了したか否かを判断し、未処理の画像領域が存在する場合には、S220の処理に戻り、全画像領域について処理が終了した場合には、S270の処理に移行する。
【0036】
ステップ270(S270)において、情報送信部550は、表計算ソフトウェアのデータフォーマットで整理された文字コードを外部(例えば、情報の集計を行う本部サーバなど)に送信する。
【図面の簡単な説明】
【0037】
【図1】情報入力装置2のハードウェア構成を、制御装置20を中心に例示する図である。
【図2】制御装置20(図1)により実行される情報入力プログラム5の機能構成を例示する図である。
【図3】テーブル登録部530(図2)により登録される種類テーブル532を例示する図である。
【図4】スキャナ装置23(図1)で読み取られる画像表示媒体(伝票700)を例示する図である。
【図5】第2の伝票702を例示する図である。
【図6】情報入力プログラム5の動作(S10)を示すフローチャートである。
【図7】変形例における情報入力プログラム5の動作(S20)を示すフローチャートである。
【符号の説明】
【0038】
2・・・情報入力装置
5・・・情報入力プログラム
500・・・画像読取部
510・・・文字認識部
520・・・背景判定部
530・・・テーブル登録部
540・・・種類判定部
550・・・情報送信部

【特許請求の範囲】
【請求項1】
画像を読み取る読取手段と、
前記読取手段により読み取られた画像の中から、既定の描画特性を有する画像領域を特定する領域特定手段と、
前記領域特定手段により特定された画像領域に表示された情報の種類を、この画像領域の描画特性に基づいて判定する種類判定手段と
を有する情報入力装置。
【請求項2】
前記描画特性は、色又は模様であり、
前記領域特定手段は、既定の色又は模様が背景となっている画像領域を特定し、
前記種類判定手段は、特定された画像領域における背景の色又は模様に基づいて、情報の種類を判定する
請求項1に記載の情報入力装置。
【請求項3】
前記領域特定手段により特定された画像領域に対して、文字認識処理を行う文字認識手段
をさらに有し、
前記種類判定手段は、前記文字認識手段により認識された文字列が示す情報の種類を判定する
請求項1に記載の情報入力装置。
【請求項4】
情報の種類と描画特性とが互いに対応付けられた種類テーブルを登録するテーブル登録手段と、
前記種類判定手段は、前記テーブル登録手段により登録された種類テーブルを参照して、画像領域に表示された情報の種類を判定する
請求項1に記載の情報入力装置。
【請求項5】
画像表示媒体から読み取られた画像の中から、既定の描画特性を有する画像領域を特定するステップと、
特定された画像領域に表示された情報の種類を、この画像領域の描画特性に基づいて判定するステップと
をコンピュータに実行させるプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2008−59255(P2008−59255A)
【公開日】平成20年3月13日(2008.3.13)
【国際特許分類】
【出願番号】特願2006−235108(P2006−235108)
【出願日】平成18年8月31日(2006.8.31)
【出願人】(000005496)富士ゼロックス株式会社 (21,908)
【Fターム(参考)】