説明

情報処理装置、情報処理方法、プログラム及び記録媒体。

【課題】関連する複数の帳票画像を読み込んで文字認識処理を行い、文字認識結果に対する修正時を行う際に、優先度の高い帳票画像の文字認識結果を利用して、ユーザの修正作業の効率化を図る。
【解決手段】読み取られた複数の帳票画像に対して、帳票画像毎の領域に対して文字認識処理をすることで得られる文字認識結果をそれぞれ取得して、取得した複数の帳票画像の文字認識結果を管理し、ユーザから第一の帳票画像に対する修正画面を表示する要求を受け付けて、管理している第一の帳票画像の文字認識結果と、当該文字認識結果に対応する当該第一の帳票画像に関連する第二の帳票画像の文字認識結果とが一致するかを判定して、一致しないと判定した場合、第一の帳票画像と第二の帳票画像のうち優先度の高い帳票画像の文字認識結果を、前記修正画面に表示する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、文字認識した結果の誤認識文字の修正を容易とする技術に関する。
【背景技術】
【0002】
従来から、紙の帳票を読み取って文字認識処理(OCR処理)を行う技術が知られている。これらの文字認識に共通して言えることは、認識率は除々に向上してきているものの、「100%の自動認識」、即ち誤りのない認識が不可能なことである。
【0003】
したがって、どのシステムにおいても認識処理の途中でのオペレータの介入、あるいは認識結果に対する後修正が、多かれ少なかれ必要であり、認識処理の過程において、オペレータが認識結果を容易に確認・修正できるような環境を提供することにより、全体としての文書入力の効率を向上する必要がある。
【0004】
特に手書きの文字は、誤認識する可能性が高いので、オペレータの修正作業の負担を軽減する技術が開示されている(例えば、特許文献1)。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開平11−306279号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、特許文献1に記載の技術は、誤認識しやすい文字の修正を容易とする技術であるが、実際には、誤認識しやすい文字でない文字であっても誤認識は有りえるため、そのような場合に対応できない。
【0007】
ところで、読み取った帳票に対して文字認識を行うユースケースとして、重複する項目を有する複数の帳票に対して文字認識処理を行うことがある。例えば、住所、氏名を手書きで記載する「申し込み用紙」と、申込者の住所・氏名を証明するための「証明書」に対して文字認識処理を行うような場合である。
【0008】
このような場合、手書きの「申し込み用紙」の文字認識は、上手く書いていないと誤認識となる可能性があるが、市役所などから発行される「証明書」(例えば住民票)は、印字された文字であるため正しく認識される可能性が高い。
【0009】
そのため、このようなケースでは、手書きの「申し込み用紙」の認識結果を修正する場合に、印字された「証明書」の認識結果を、優先的に表示させることで、誤認識文字の修正作業を容易にできる可能性がある。
【0010】
本発明は、上記課題を解決するものであり、関連する複数の帳票画像を読み込んで文字認識処理を行い、文字認識結果に対する修正時を行う際に、優先度の高い帳票画像の文字認識結果を利用して、ユーザの修正作業の効率化を図ることを可能とする。
【課題を解決するための手段】
【0011】
本発明は、文字認識結果を修正する情報処理装置であって、読み取る帳票画像の文字認識処理を行う領域を示す情報を帳票画像毎に登録する登録手段と、読み取られた複数の帳票画像に対して、前記登録手段により登録された帳票画像毎の領域に対して文字認識処理をすることで得られる文字認識結果をそれぞれ取得する文字認識結果取得手段と、前記文字認識結果取得手段により取得された複数の帳票画像の文字認識結果を管理する管理手段と、ユーザから第一の帳票画像に対する修正画面を表示する要求を受け付ける受付手段と、前記受付手段により受け付けた要求に応じて、前記管理手段により管理される前記第一の帳票画像の文字認識結果と、当該文字認識結果に対応する当該第一の帳票画像に関連する第二の帳票画像の文字認識結果とが一致するかを判定する判定手段と、前記判定手段による判定の結果、一致しないと判定された場合、前記第一の帳票画像と第二の帳票画像のうち優先度の高い帳票画像の文字認識結果を、前記修正画面に表示する制御を行う表示制御手段とを有することを特徴とする。
【発明の効果】
【0012】
本発明によれば、関連する複数の帳票画像を読み込んで文字認識処理を行い、文字認識結果に対する修正時を行う際に、優先度の高い帳票画像の文字認識結果を利用して、ユーザの修正作業の効率化を図ることが可能となる。
【図面の簡単な説明】
【0013】
【図1】本実施形態において採用可能なコンピュータシステムの構成例を示す図である。
【図2】本発明の一実施形態を実現する情報処理装置の概略構成を示すブロック図である。
【図3】本実施形態における画像処理の概要手順を説明するフローチャートである。
【図4】スキャン画像の代表的なサンプルを示す図である。
【図5】図4のスキャン画像から抽出された帳票画像の例を示す図である。
【図6】本実施形態における帳票データベース作成処理を説明するフローチャートである。
【図7】登録帳票選択画面の例を示す図である。
【図8】テンプレート作成画面の例を示す図である。
【図9】帳票データベース内に登録される情報の例を示す表である。
【図10】文字認識結果の例を示す表である。
【図11】本実施形態における文字認識結果の確認・修正処理を説明するフローチャート(1)である。
【図12】文字認識結果修正画面の例を示す図である。
【図13】関連付けテーブルの一例を示す図である。
【図14】本実施形態における文字認識結果の確認・修正処理を説明するフローチャート(2)である。
【発明を実施するための形態】
【0014】
以下、図面を参照して、本発明の実施形態を詳細に説明する。
【0015】
図1は、本実施形態において採用可能なコンピュータシステムの構成例を示す図である。
【0016】
情報処理装置11、スキャナ装置12により構成されている。
【0017】
情報処理装置11は、所定の画像処理(文字認識処理)を実行し、ユーザがキーボード及びマウスを操作して処理結果を確認・修正する装置である。
【0018】
スキャナ装置12は、原稿を光学的に読み取り電子化し、画像データを情報処理装置11に送る装置である。
【0019】
なお、本実施形態では、スキャナ装置12を用いて帳票を読み込んでいるが、デジタルカメラ等を用いて帳票を電子化して画像データを得てもよい。
【0020】
図2は、本発明の一実施形態を実現する情報処理装置の概略構成を示すブロック図である。
【0021】
101は、CPUであり、ROM102に格納されている制御プログラムに従って本装置全体の制御を行う。
【0022】
102は、ROMであり、CPU101が実行する後述するフローチャートに示す処理等の制御プログラムを含む各種プログラムや各種パラメータデータを格納する。
【0023】
103はRAMであり、画像や各種データを記憶する。また、RAM103は、データの作業領域や一時待避領域として機能する。
【0024】
104は、外部記憶装置であり、画像を管理するデータベースを含む各種データを記憶する。また、外部記憶装置104は、例えば、ハードディスクやCD−ROM等で構成される。105はディスプレイであり、例えば、LCDやCRTで構成される。
【0025】
106は、入力装置である。例えば、マウスやペンタブレット等で構成される。
【0026】
107は、カラー画像の入力が可能なスキャンであり、画像(例えば、文書)を光学的に読み取り、その画像データを取得する。
【0027】
108は、プリンタであり、所定の画像処理を行った画像データ等の印刷を行う。
【0028】
尚、本発明は、汎用的なコンピュータでも実施可能であり、その場合、記憶媒体に記憶される制御プログラムを外部記憶装置104に記憶し、オペレータの指示等によりCPU101で実行するように構成されてもよい。
【0029】
109は、ネットワークインターフェース(I/F)であり、ネットワーク上に接続されている外部装置(例えば、サーバ、外部記憶装置等)と通信し、プログラムやデータを読み込んだり、書き込んだりする。
【0030】
尚、ネットワークは、典型的にはインターネットやLANやWANや電話回線、専用デジタル回線、ATMやフレームリレー回線、通信衛星回線、ケーブルテレビ回線、データ放送用無線回線等のいずれか、またはこれらの組み合わせにより実現されるいわゆる通信ネットワークであり、データの送受信が可能であれば良い。
【0031】
また、複合機107やディスプレイ105は、ネットワークインターフェース109を介して接続されて構成されていても良い。
【0032】
以上の構成を備えた本実施形態の画像処理装置の動作について、以下、説明する。
【0033】
図3は、本実施形態における画像処理の概要手順を説明するフローチャートである。
【0034】
まず、ステップS301において、スキャナが紙文書を読み込む。スキャナにより読み込まれたスキャン画像(画像データ)は、その後、情報処理装置へ送られる。
【0035】
ステップS302において、情報処理装置は、スキャン画像を取得する。ここで、取得するスキャン画像の一例を図4に示す。
【0036】
この例では、一枚のスキャン画像に、帳票A「証明書」と帳票B「申し込み用紙」とが読み込まれている。
【0037】
帳票A「証明書」の氏名欄401には、「山田 太郎」と、住所欄402には、「千葉県 市川市」と印字されている。また、帳票B「申し込み用紙」の氏名欄403には、「山田 太郎」と、住所欄404には、「千葉県 市川市」と手書きで記載されている。
【0038】
なお、スキャン画像は、スキャナから直接取得する場合に限らず、予め別の記憶装置に記憶されていたものから取得してもよい。
【0039】
ステップS303において、情報処理装置は、スキャン画像全体より帳票の画像データを抽出する。この抽出方法については、例えば、特開2008−167009号公報に記載されている技術を用いることで実現可能となる。
【0040】
図4のスキャン画像から取り出した画像データの例を図5に示す。
【0041】
図5に示す通り、帳票A「証明書」と、帳票B「申し込み用紙」とが、それぞれ別の帳票画像(画像データ)として抽出される。
【0042】
図3の処理の説明に戻り、次に、ステップS304において、情報処理装置は、帳票画像に対してブロックセレクション処理を行い、帳票画像内から表、文字、絵や図、枠、線等の特徴量を抽出する。この特徴量の算出方法は、公知技術であるため詳細な説明は省略する。
【0043】
ステップS305において、情報処理装置は、ステップS304で抽出した特徴量を元に予め用意している帳票データベース内から該当する帳票(登録帳票)がないかを検索する。
【0044】
各種帳票画像は、予め管理者によって帳票データベースへ登録が行われているものとする。
【0045】
ステップS306において、情報処理装置は、ステップS305の検索の結果、該当帳票があるか否かを判定する。Yesの場合、ステップS307へ進み、Noの場合、ステップS309へ進む。
【0046】
ステップS307において、情報処理装置は、帳票データベース内の登録帳票に関連付けて格納されている帳票画像内の文字認識を実施する座標等の情報(テンプレート情報)を取得する。
【0047】
テンプレート情報は、各種帳票画像を登録する際に管理者によってなされている。管理者の登録方法と、テンプレート情報の詳細について、図6〜9を用いて説明する。
【0048】
図6は帳票データベースを作成する手順を示すフローチャートである。
【0049】
まず、ステップS601において、管理者端末は、紙文書をスキャナで読み込み、ステップS602において、スキャン画像を取得する。
【0050】
ステップS603において、管理者端末は、スキャン画像全体より一または複数の帳票の画像を抽出する。複数の帳票画像を取得する方法は、上述した通りである。
【0051】
ステップS604において、管理者端末は、抽出した帳票画像を図7に示す画面に表示する。
【0052】
図7は、登録帳票選択画面の例を示す図である。
【0053】
登録を行う管理者は、管理者端末を用いて、登録帳票選択画面701を読み出す。
【0054】
ステップS605において、管理者端末は、表示した帳票画像が帳票データベース内に登録するか否かの選択命令を受ける。
【0055】
オペレータは帳票画像を確認後、帳票データベースへ登録を行なう場合は「登録名称702」エディットボックスに登録名称を入力後、「登録実行704」ボタンを押下し、登録を行なわない場合は「登録未実施705」ボタンを押下して選択命令を出す。
【0056】
ステップS606において、管理者端末は、登録対象であるかを判定する。Yesの場合、ステップS607へ進み、Noの場合、ステップS611へ進む。具体的には、「登録実行704」ボタンが押下された場合は、ステップS607へ進み、「登録未実施705」ボタンが押下された場合は、ステップS611へ進む。
【0057】
ステップS607において、管理者端末は、帳票画像に対してブロックセレクション処理を行い帳票画像内から表、文字、絵や図、枠、線等の特徴量を抽出する。
【0058】
ステップS608において、テンプレート情報を図8に示す画面を表示する。
【0059】
図8は、テンプレート作成画面の例を示す図である。
【0060】
ステップS609において、テンプレート情報の作成命令を受け付ける。
【0061】
管理者は、テンプレート作成画面801に表示されている登録帳票上の所定の領域を選択する。ここで選択した領域は、OCR処理を行う領域となる。この例では、矩形802と、矩形803が選択されている。
【0062】
矩形を選択すると、選択した矩形の順番に、テンプレート情報の座標情報欄804に座標情報が表示される。矩形は、802、803の順番に選択されたため、802の座標は、(100、40、110、160)で、803の座標は、(120、40、130、160)となっている。
【0063】
また、管理者は、それぞれの領域の属性を属性欄805に入力する。図8の例では、矩形802には「氏名」という属性を、矩形803には「住所」という属性を入力している。この属性は、良く使われる属性が予め登録されていて、プルダウンから選択することができる。また、他の例では、管理者が任意の文字列を入力できるようにしてもよい。
【0064】
最後に、管理者は、登録ボタン806を押すことで一つの帳票についてのテンプレート登録操作を終了する。
【0065】
ステップS610において、管理者端末は、ステップS607において抽出した帳票画像の特徴量とS609において作成命令を受けたテンプレート情報を関連付けて帳票データベースへ登録する。
【0066】
図9は、帳票データベース内に登録される情報の例を示す表である。
【0067】
登録帳票901とテンプレート情報902とが登録される。テンプレート情報には、認識領域NO903と、座標情報904と、属性905が含まれる。
【0068】
ステップS611において、スキャン画像内にある全ての帳票画像を抽出したかを判定する。Yesの場合、処理を終了し、Noの場合、ステップS603へ戻る。スキャン画像内にある全ての帳票画像に対してステップS603からステップS609の処理を実施して終了することで、図9の例に示すような情報が帳票データベースに登録される。
【0069】
図9の例では、「証明書」と「申込書」が登録されている。また、それぞれのテンプレート情報には、認識領域が二つあり、それぞれの認識領域に属性「氏名」「住所」が登録されている。なお、抽出された帳票画像には、抽出画像1001に入力される名称で記憶領域に記憶される。したがって、この名称で紐づけられることとなる。
【0070】
以上、管理者の登録方法と、テンプレート情報の詳細について説明した。
【0071】
図3の処理の説明に戻り、次に、ステップS308において、情報処理装置は、テンプレート情報を元に帳票画像内の文字認識を実施する箇所全てに対して文字認識を実施する。また、文字認識の際、文字コードと共に文字の確からしさ(評価値)をそれぞれ算出する。確からしさの算出方法は、公知技術であるため詳細な説明は省略する。また、評価結果の精度を示す情報であれば、どのようなものであってもよい。
【0072】
ステップS309において、情報処理装置は、対象となっているスキャン画像内にある全ての帳票画像を抽出したかを判定する。Yesの場合、ステップS310へ進み、Noの場合、ステップS303へ戻る。
【0073】
全ての帳票画像に対してステップS304からステップS309の処理を実施することで、図10に示すような文字認識結果(文字認識結果テーブル)を取得することができる。
【0074】
なお、本実施の形態では、同時にスキャンした複数の帳票からそれぞれの帳票を抽出して図10に示すような文字認識結果を得る例を示したが、別々にスキャンした帳票画像の文字認識結果を後からまとめて図10に示すような文字認識結果として作成してもよい。
【0075】
図10に示す例では、抽出画像1001として、2つの画像を抽出したことを示している。該当帳票1002は、帳票データベースでマッチした登録帳票名が入力される。認識領域NO1003は、登録帳票のテンプレートに設定されていた認識領域の番号が入力される。文字認識結果1004は、認識領域に対して実際に文字認識処理を行うことで得られた認識結果が入力される。属性1005は、認識文字の属性が入力される。確からしさ1006は、文字認識処理の結果得られた認識結果がどの程度確からしいかを示す数値が入力される。数値の値が大きいほど認識結果が正しい可能性が高いことを示す。
【0076】
本実施の形態では、図5に示す2つの帳票を読み込んだ結果、図10に示す文字認識結果を取得することとなる。帳票A「証明書」は、印刷文字であるため文字認識結果も正しく得ることができたが、帳票B「申し込み用紙」は、手書きの文字であるため一部誤認識されている。1007で、本来「市」と認識すべき文字を「布」と認識している。
【0077】
図3の処理の説明に戻り、次に、ステップS310において、情報処理装置は、取得した全帳票画像の文字認識結果をオペレータの指示に従って確認・修正する。
【0078】
この確認・修正処理は、図11〜12を用いて説明する。
【0079】
図11は、文字認識結果を修正する手順を示すフローチャートである。
【0080】
まず、ステップS1101において、情報処理装置は、図10示す文字認識結果を用いて修正画面を表示する処理を開始する。文字認識結果修正画面の例を図12に示す。
【0081】
ステップS1102において、情報処理装置は、帳票画面を表示する。図12に示す例では、図11の文字認識結果のうち帳票画像Bを表示している。1202、1203ボタンを押すことにより、他の帳票画像を表示することができる。
【0082】
なお、本実施の形態においては、帳票画像Aと帳票画像Bとを同時にスキャンして修正する例としているが、これに限られず、帳票画像Aと帳票画像Bとを別々にスキャンしてもよい。
【0083】
その場合、帳票画像Aと帳票画像Bとが関連する帳票画像であることを予め関連付けに登録しておくことで実現可能となる。関連付けテーブルの例を図13に示す。
【0084】
図13は、関連付けテーブルの一例を示す図である。この例では、1301には、関連付けが、1302には、優先度が設定される。
【0085】
具体的には、帳票画像Aと帳票画像Bとが関連付けられ、帳票画像Aの優先度が「1」で高く、帳票画像Bの優先度が「2」で低いことを示している。また、帳票画像Cと帳票画像Dと帳票画像Eとが関連付けられ、帳票画像Cの優先度が「3」で、帳票画像Dの優先度が「1」で、帳票画像Eの優先度が「2」であることを示している。優先度は、帳票画像の種類によって設定されるものである。
【0086】
従って、1202、1203ボタンを押すことにより、上記関連付けテーブルで関連付けられている他の帳票画像を表示することができる。
【0087】
ステップS1103において、情報処理装置は、同属性の読取領域で認識結果が異なるか判定する。Yesの場合、ステップS1104へ進み、Noの場合、ステップS1107へ進む。図10を用いて、具体例を説明する。図12では、図10に示す帳票画像Bが表示されていることより、まず、当該レコードの属性1005を参照する。この場合、属性1005には、「氏名」、「住所」が存在する。そこで、最初に他のレコードに「氏名」が存在するかをチェックする。もし同じ属性が存在した場合、両者の文字認識結果1004を比較することでこの判定を行う。帳票画像Bの「氏名」の文字認識結果1004が「山田太郎」に対し、帳票画像Aの「氏名」の文字認識結果1004は「山田太郎」なので、この場合、文字認識結果が同じになるためステップS1107へ進むことになる。
【0088】
ステップS1107において、情報処理装置は、文字認識結果1004を表示する。このように、複数の帳票で文字認識結果が一致した場合、正しく文字認識された可能性が高いため、そのまま文字認識結果を表示する。もし誤認識の場合、ユーザは、帳票画像を参照し、直接「氏名」1204へ正しい文字列を入力する。
【0089】
一方、帳票画像Bの「住所」の文字認識結果1004が「千葉県布川市」に対し、帳票画像Aの「住所」の文字認識結果1004は「千葉県市川市」なので、この場合、文字認識結果が異なるためS1104へ進むことになる。
【0090】
ステップS1104において、情報処理装置は、確からしさが等しいかを判定する。Yesの場合、ステップS1105へ進み、Noの場合、ステップS1106へ進む。図10の例の場合、帳票画像Bの「住所」の確からしさ1006が「7800」なのに対し、帳票画像Aの「住所」の確からしさ1006が「9980」なので、確からしさは等しくないためステップS1106へ進むこととなる。
【0091】
ステップS1106において、情報処理装置は、確からしさが高い順に文字認識結果をドロップダウンリストに追加する。図10に示す例の場合、ドロップダウンリストには、「千葉県市川市」、「千葉県布川市」の順で追加される。表示例を図12の住所1205へ示す。このように現在表示している帳票画像の文字認識結果ではなく、確からしさの高い順に他の帳票画像の文字認識結果をドロップダウンリストに表示するのは、少なくともいずれかの文字認識結果が間違っている可能性があることから、その誤認識の修正を容易にするためである。即ち、同じ属性の他の帳票画像で確からしさの高い文字認識結果を、そのまま使うことができる可能性が高いためである。これにより、ドロップダウンリストから選択することができるため手動で入力する手間がかからないという効果が得られる。また、誤入力を防ぐこともできる。もしドロップダウンリストに正しい文字認識結果がない場合、ユーザは、帳票画像を参照し、直接「住所」1205へ正しい文字列を入力する。コンボボックスとしてリスト表示することで直接入力も可能となる。
【0092】
次に、ステップS1105において、情報処理装置は、比較対象となる帳票画像を抽出した順にドロップダウンリストに追加する。確からしさが等しいため優劣をつけることができないためである。このような場合でもドロップダウンリストへ追加するのは、どれかに正しい文字認識結果が含まれている可能性があるため、手作業による修正作業をなくすことができるからである。もしドロップダウンリストに正しい文字認識結果がない場合、ユーザは、直接正しい文字列を入力する。
【0093】
ステップS1108において、情報処理装置は、全ての読取領域を表示したかを判定する。Yesの場合、ステップS1109へ進み、Noの場合、ステップS1103へ戻る。ここでは、図10に示す認識領域NO1003全てに対して処理を行ったかを判定している。
【0094】
ステップS1109において、情報処理装置は、文字認識結果修正命令受付を受け付ける。具体的には、図12に示す登録ボタン1206が押下されることにより受付を行う。
【0095】
ステップS1110において、情報処理装置は、修正があったか否かを判定する。Yesの場合、ステップS1111へ進み、Noの場合、ステップS1113へ進む。修正の有無は、入力された文字列が、図10に示す文字認識結果1004と一致するかにより判定する。
【0096】
ステップS1111において、情報処理装置は、文字認識結果を修正する。また、ステップS1112において、情報処理装置は、帳票画像を更新する。これにより帳票画像の属性情報もしくは帳票画像と紐付くデータベースが修正後の文字列に書き変わる。
【0097】
ステップS1113において、情報処理装置は、修正終了かを判定する。Yesの場合、ステップS1114へ進み、Noの場合、ステップS1109へ戻る。終了か否かは、図12に示す登録ボタン1206が押下されたかにより判定することができる。
【0098】
ステップS1114において、情報処理装置は、全帳票画像の修正が終了したかを判定する。Yesの場合、終了し、Noの場合、ステップS1102へ戻る。例えば、図10に示す文字認識結果に、修正確認有無のフラグを準備しておき、未修正の帳票画像がある場合、順番に表示するようにしてもよい。
【0099】
ここで、図11の本実施形態における文字認識結果の確認・修正処理を説明するフローチャートの変形例を、図14を用いて説明する。なお、図11と同じ処理については同じステップ番号を付与しており処理も同じであるため説明を省略する。
【0100】
図11と図14の処理で異なるのはステップS1401である。
【0101】
ステップS1401において、情報処理装置は、優先度の高い帳票画像の認識結果の順にドロップダウンリストへ追加する。ここでは、図13に示す関連付けテーブルに設定される優先度を用いる。
【0102】
帳票画像毎の優先度を用いるのは、印字された帳票画像「帳票画像A」と、手書きの帳票画像「帳票画像B」とが存在する場合、印字された帳票画像Aの文字認識処理の結果の方が、正しい認識文字を得られている可能性が高いためである。
【0103】
最後に、図3の処理の説明に戻り、最後に、ステップS311において、情報処理装置は、修正後の認識結果をプリンタ等に出力したり、他の文書管理処理システムに渡したり、通信により他の文書管理システムに渡すようにしてもよい。また、記憶装置に記憶してもよい。
【0104】
以上説明した通り、本発明によれば、関連する複数の帳票画像を読み込んで文字認識処理を行い、文字認識結果に対する修正時を行う際に、優先度の高い帳票画像の文字認識結果を利用して、ユーザの修正作業の効率化を図ることが可能となる。
【0105】
本発明は、例えば、システム、装置、方法、プログラム若しくは記憶媒体等としての実施形態も可能であり、具体的には、複数の機器から構成されるシステムに適用してもよいし、また、1つの機器からなる装置に適用してもよい。
【0106】
なお、本発明は、前述した実施形態の機能を実現するソフトウェアのプログラムを、システム或いは装置に直接、或いは遠隔から供給するものを含む。そして、そのシステム或いは装置のコンピュータが前記供給されたプログラムコードを読み出して実行することによっても達成される場合も本発明に含まれる。
【0107】
したがって、本発明の機能処理をコンピュータで実現するために、前記コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明は、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。
【0108】
その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等の形態であってもよい。
【0109】
プログラムを供給するための記録媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、MO、CD−ROM、CD−R、CD−RWなどがある。また、磁気テープ、不揮発性のメモリカード、ROM、DVD(DVD−ROM,DVD−R)などもある。
【0110】
その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページに接続する。そして、前記ホームページから本発明のコンピュータプログラムそのもの、若しくは圧縮され自動インストール機能を含むファイルをハードディスク等の記録媒体にダウンロードすることによっても供給できる。
【0111】
また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバも、本発明に含まれるものである。
【0112】
また、本発明のプログラムを暗号化してCD−ROM等の記憶媒体に格納してユーザに配布し、所定の条件をクリアしたユーザに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせる。そして、ダウンロードした鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。
【0113】
また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される。その他、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部又は全部を行い、その処理によっても前述した実施形態の機能が実現され得る。
【0114】
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれる。その後、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部又は全部を行い、その処理によっても前述した実施形態の機能が実現される。
【0115】
なお、前述した実施形態は、本発明を実施するにあたっての具体化の例を示したものに過ぎず、これらによって本発明の技術的範囲が限定的に解釈されてはならないものである。即ち、本発明はその技術思想、又はその主要な特徴から逸脱することなく、様々な形で実施することができる。
【符号の説明】
【0116】
11 情報処理装置
12 スキャナ装置
101 CPU
102 ROM
103 RAM
104 外部記憶装置
105 ディスプレイ
106 入力装置
107 スキャナ
108 プリンタ
109 ネットワークインターフェース

【特許請求の範囲】
【請求項1】
文字認識結果を修正する情報処理装置であって、
読み取る帳票画像の文字認識処理を行う領域を示す情報を帳票画像毎に登録する登録手段と、
読み取られた複数の帳票画像に対して、前記登録手段により登録された帳票画像毎の領域に対して文字認識処理をすることで得られる文字認識結果をそれぞれ取得する文字認識結果取得手段と、
前記文字認識結果取得手段により取得された複数の帳票画像の文字認識結果を管理する管理手段と、
ユーザから第一の帳票画像に対する修正画面を表示する要求を受け付ける受付手段と、
前記受付手段により受け付けた要求に応じて、前記管理手段により管理される前記第一の帳票画像の文字認識結果と、当該文字認識結果に対応する当該第一の帳票画像に関連する第二の帳票画像の文字認識結果とが一致するかを判定する判定手段と、
前記判定手段による判定の結果、一致しないと判定された場合、前記第一の帳票画像と第二の帳票画像のうち優先度の高い帳票画像の文字認識結果を、前記修正画面に表示する制御を行う表示制御手段と
を有することを特徴とする情報処理装置。
【請求項2】
前記表示制御手段は、優先度の高さに応じて、前記文字認識結果をドロップダウンリストへ優先度の順に表示することを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記第一の帳票画像と第二の帳票画像との優先度は、帳票画像の種類に応じて予め設定されていることを特徴とする請求項1または2に記載の情報処理装置。
【請求項4】
前記第一の帳票画像と第二の帳票画像との優先度は、当該第一の帳票画像の文字認識結果に対する評価値と当該第二の帳票画像の文字認識結果に対する評価値との比較により定まることを特徴とする請求項1または2に記載の情報処理装置。
【請求項5】
前記表示制御手段は、前記判定手段による判定の結果、一致すると判定された場合、前記修正画面に、前記管理手段により管理される前記第一の帳票画像の文字認識結果を表示することを特徴とする請求項1乃至4のいずれか1項に記載の情報処理装置。
【請求項6】
前記管理手段は、前記文字認識結果と共に、当該文字認識結果を得た帳票画像の領域に対して設定される属性情報を更に管理し、
前記判定手段は、前記属性情報を用いて、前記管理手段により管理される前記第一の帳票画像の文字認識結果に対応する当該第一の帳票画像に関連する第二の帳票画像の文字認識結果を特定することを特徴とする請求項1乃至5のいずれか1項に記載の情報処理装置。
【請求項7】
前記表示制御手段により表示された修正画面を介して入力された修正指示を受け付ける修正指示手段を更に有することを特徴とする請求項1乃至6のいずれか1項に記載の情報処理装置。
【請求項8】
文字認識結果を修正する情報処理装置における情報処理方法であって、
読み取る帳票画像の文字認識処理を行う領域を示す情報を帳票画像毎に登録する登録ステップと、
読み取られた複数の帳票画像に対して、前記登録ステップにより登録された帳票画像毎の領域に対して文字認識処理をすることで得られる文字認識結果をそれぞれ取得する文字認識結果取得ステップと、
前記文字認識結果取得ステップにより取得された複数の帳票画像の文字認識結果を管理する管理ステップと、
ユーザから第一の帳票画像に対する修正画面を表示する要求を受け付ける受付ステップと、
前記受付ステップにより受け付けた要求に応じて、前記管理ステップにより管理される前記第一の帳票画像の文字認識結果と、当該文字認識結果に対応する当該第一の帳票画像に関連する第二の帳票画像の文字認識結果とが一致するかを判定する判定ステップと、
前記判定ステップによる判定の結果、一致しないと判定された場合、前記第一の帳票画像と第二の帳票画像のうち優先度の高い帳票画像の文字認識結果を、前記修正画面に表示する制御を行う表示制御ステップと
を有することを特徴とする情報処理方法。
【請求項9】
文字認識結果を修正する情報処理装置において実行可能なプログラムであって、
読み取る帳票画像の文字認識処理を行う領域を示す情報を帳票画像毎に登録する登録手段、
読み取られた複数の帳票画像に対して、前記登録手段により登録された帳票画像毎の領域に対して文字認識処理をすることで得られる文字認識結果をそれぞれ取得する文字認識結果取得手段、
前記文字認識結果取得手段により取得された複数の帳票画像の文字認識結果を管理する管理手段、
ユーザから第一の帳票画像に対する修正画面を表示する要求を受け付ける受付手段、
前記受付手段により受け付けた要求に応じて、前記管理手段により管理される前記第一の帳票画像の文字認識結果と、当該文字認識結果に対応する当該第一の帳票画像に関連する第二の帳票画像の文字認識結果とが一致するかを判定する判定手段、
前記判定手段による判定の結果、一致しないと判定された場合、前記第一の帳票画像と第二の帳票画像のうち優先度の高い帳票画像の文字認識結果を、前記修正画面に表示する制御を行う表示制御手段
として前記情報処理装置を機能させることを特徴とするプログラム。
【請求項10】
請求項9に記載のプログラムをコンピュータ読み取り可能に記憶した記録媒体。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate


【公開番号】特開2012−64195(P2012−64195A)
【公開日】平成24年3月29日(2012.3.29)
【国際特許分類】
【出願番号】特願2011−81143(P2011−81143)
【出願日】平成23年3月31日(2011.3.31)
【出願人】(301015956)キヤノンソフトウェア株式会社 (364)
【Fターム(参考)】