説明

情報処理装置、情報処理システム、制御方法、およびそのプログラム。

【課題】極端な癖のある文字をOCR認識する場合に、高い認識率でかつ効率的なOCR認識を実現することが可能な仕組みを提供する。
【解決手段】読取装置から送信される画像データに含まれる文字情報の読取を実行する情報処理装置であって、前記読取装置により読み取られた文書の特定矩形領域から得られた情報を取得する画像データ取得手段と、前記画像データ取得手段で取得した前記画像データに含まれる文字情報の読取を実行する読取手段と、前記読取手段で前記画像データより読み取った読取情報を用いることにより、前記文書に書かれている文字情報を認識するためのプロファイルを特定する特定手段と、前記特定手段で特定した前記プロファイルを用いることにより前記文書に書かれている文字情報の認識を実行する文字情報認識手段と、前記文字情報認識手段で文字認識を実行した結果得られるエラー回数に応じて、適用する認識結果を決定する決定手段と、前記決定手段で決定した前記認識結果を登録する登録手段とを備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は文書読取装置のOCR技術に関するものである。
【背景技術】
【0002】
従来から、手書きによるマークの塗りつぶしや、文字の記述などを行う試験の採点を行う際に、OCR技術を用いた文字認識が用いられて解答用紙の採点が行われている。
【0003】
手書きによる解答用紙をOCRで認識する場合、文字の個人差(癖)や解答用紙のよごれ等によって正しく文字認識できないことは一般的に知られている。特に、文字の個人差に関して言えば、文字を覚えたての小学生などの解答用紙を読み取る場合に、字が汚くエラーとなる可能性は高くなる。
【0004】
OCRの認識率を向上させるために、記入された癖のある文字を記憶する学習機能が一般的に用意されている。しかしこの学習機能は複数人の癖を同じ学習ファイル内に記憶するため、各個人差が大きい場合、あまり有効ではない。特に小学生のように個人差が大きいことが予想される回答に対する学習ファイルとしては極端な癖文字を1つのファイルに集約されることは有効ではない。
【0005】
認識結果確認の正確性を向上させるとともに、何段階もの確認、検証処理を効率化させるために、補正の省力化を行うことができるOCR認識結果の補正方法が開示されている(例えば、特許文献1)。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2000−298700号
【発明の概要】
【発明が解決しようとする課題】
【0007】
OCRの認識率を向上させるために、記入された癖のある文字を記憶する学習機能が一般的に用意されている。しかしこの学習機能は複数人の癖を同じ学習ファイル内に記憶するため、各個人差が大きい場合、あまり有効ではない。特に小学生のように個人差が大きいことが予想される回答に対する学習ファイルとしては極端な癖文字を1つのファイルに集約されることは有効ではない。
【0008】
補正の省力化という観点で、特許文献1に開示された技術は効果を発揮するが、文字認識率を向上させることに関しては課題が残っている。
【0009】
そこで本発明は、極端な癖のある文字をOCR認識する場合に、高い認識率でかつ効率的なOCR認識を実現することが可能な仕組みを提供することを目的としている。
【課題を解決するための手段】
【0010】
即ち、本発明は、読取装置から送信される画像データに含まれる文字情報の読取を実行する情報処理装置であって、前記読取装置により読み取られた文書の特定矩形領域から得られた情報を取得する画像データ取得手段と、前記画像データ取得手段で取得した前記画像データに含まれる文字情報の読取を実行する読取手段と、前記読取手段で前記画像データより読み取った読取情報を用いることにより、前記文書に書かれている文字情報を認識するためのプロファイルを特定する特定手段と、前記特定手段で特定した前記プロファイルを用いることにより前記文書に書かれている文字情報の認識を実行する文字情報認識手段と、前記文字情報認識手段で文字認識を実行した結果得られるエラー回数に応じて、適用する認識結果を決定する決定手段と、前記決定手段で決定した前記認識結果を登録する登録手段とを備えることを特徴とする。
【発明の効果】
【0011】
本発明によれば、極端な癖のある文字をOCR認識する場合に、高い認識率でかつ効率的なOCR認識を実現することが可能な仕組みを提供することが可能になる。
【図面の簡単な説明】
【0012】
【図1】本発明の情報処理システムの構成の一例を示すシステム構成図である。
【図2】図1に示したクライアント端末101、サーバ103に適用可能な情報処理装置のハードウェア構成を示すブロック図である。
【図3】図1に示したスキャナ102のハードウェア構成の一例を示すブロック図である。
【図4】本発明における文書読取システムにおける文字認識処理の一例を示すフローチャートである。
【図5】図1に示したサーバ103に保持される計数テーブルである。
【図6】図5に示した計数テーブルに登録する意図を示したイメージ図である。
【図7】図5に示した計数テーブルに登録する意図を示したイメージ図である。
【図8】本発明の実施形態においてスキャナ102で読取を行う文書のサンプル図である。
【発明を実施するための形態】
【0013】
以下、図面を参照して、本発明の実施形態を詳細に説明する。図1は、本発明の文書読取システムの構成の一例を示すシステム構成図である。
【0014】
図1は、1又は複数のクライアント端末101、1又は複数のスキャナ102、および1又は複数のサーバ103がローカルエリアネットワーク(LAN)104を介して接続される構成となっている。
【0015】
クライアント端末101は、スキャナ102で読取られた文書の認識結果を表示ディスプレイに表示し、サーバ103に記憶されている学習ファイルの取得によってOCR認識結果の確認を行う。スキャナ102は、図7の文書などの紙媒体のスキャンおよびOCR認識を実行する。
【0016】
サーバ103は、学習ファイル判断用計数テーブル(後述する図5に示す)を記憶し、スキャナ102から受信した画像データに対するOCR処理時に適用する学習ファイル情報を取得するために用いられる。
【0017】
次に図2を用いて、図1に示したクライアント端末101、サーバ103に適用可能な情報処理装置のハードウェア構成について説明する。図2は、図1に示したクライアント端末101、サーバ103に適用可能な情報処理装置のハードウェア構成を示すブロック図である。
【0018】
図2において、201はCPUで、システムバス204に接続される各デバイスやコントローラを統括的に制御する。また、ROM202あるいは外部メモリ211には、CPU201の制御プログラムであるBIOS(Basic Input / Output System)やオペレーティングシステムプログラム(以下、OS)や、各サーバ或いは各PCの実行する機能を実現するために必要な後述する各種プログラム等が記憶されている。
【0019】
203はRAMで、CPU201の主メモリ、ワークエリア等として機能する。CPU201は、処理の実行に際して必要なプログラム等をROM202あるいは外部メモリ211からRAM203にロードして、該ロードしたプログラムを実行することで各種動作を実現するものである。
【0020】
また、205は入力コントローラで、キーボード(KB)209や不図示のマウス等のポインティングデバイス等からの入力を制御する。206はビデオコントローラで、CRTディスプレイ(CRT)210等の表示器への表示を制御する。なお、図2では、CRT210と記載しているが、表示器はCRTだけでなく、液晶ディスプレイ等の他の表示器であってもよい。これらは必要に応じて管理者が使用するものである。
【0021】
207はメモリコントローラで、ブートプログラム、各種のアプリケーション、フォントデータ、ユーザファイル、編集ファイル、各種データ等を記憶する外部記憶装置(ハードディスク(HD))や、フレキシブルディスク(FD)、或いはPCMCIAカードスロットにアダプタを介して接続されるコンパクトフラッシュ(登録商標)メモリ等の外部メモリ211へのアクセスを制御する。
【0022】
208は通信I/Fコントローラで、ネットワーク(例えば、図1に示したLAN400)を介して外部機器と接続・通信するものであり、ネットワークでの通信制御処理を実行する。例えば、TCP/IPを用いた通信等が可能である。
【0023】
なお、CPU201は、例えばRAM203内の表示情報用領域へアウトラインフォントの展開(ラスタライズ)処理を実行することにより、CRT210上での表示を可能としている。また、CPU201は、CRT210上の不図示のマウスカーソル等でのユーザ指示を可能とする。
【0024】
本発明を実現するための後述する各種プログラムは、外部メモリ211に記録されており、必要に応じてRAM203にロードされることによりCPU201によって実行されるものである。さらに、上記プログラムの実行時に用いられる定義ファイル及び各種情報テーブル等も、外部メモリ211に格納されており、これらについての詳細な説明も後述する。
【0025】
次に、図3を用いて、本発明の情報処理装置としてのスキャナ102を制御するコントローラユニットのハードウェア構成について説明する。
【0026】
図3は、図1に示したスキャナ102のハードウェア構成の一例を示すブロック図である。実施例として、一般的なスキャナ部を備える複合機をベースに説明をするが、読取部のみで独立した筐体のスキャナ102であっても何ら問題はない。
【0027】
図3において、316はコントローラユニットで、画像入力デバイスとして機能するスキャナ314や、画像出力デバイスとして機能するプリンタ部312と接続する一方、LAN(例えば、図1に示したLAN600)や公衆回線(WAN)(例えば、PSTNまたはISDN等)と接続することで、画像データやデバイス情報の入出力を行う。
【0028】
コントローラユニット316において、301はCPUで、システム全体を制御するプロセッサである。302はRAMで、CPU301が動作するためのシステムワークメモリであり、プログラムを記録するためのプログラムメモリや、画像データを一時記録するための画像メモリでもある。
【0029】
303はROMで、システムのブートプログラムや各種制御プログラムが格納されている。304はハードディスクドライブ(HDD)で、システムを制御するための各種プログラム,画像データ等を格納する。
【0030】
307は操作部インターフェイス(操作部I/F)で、操作部(キーボード)308とのインターフェイス部である。また、操作部I/F307は、操作部308から入力したキー情報(例えば、スタートボタンの押下)をCPU301に伝える役割をする。
【0031】
305はネットワークインターフェイス(NetworkI/F)で、ネットワーク(LAN)600に接続し、データの入出力を行う。306はモデム(MODEM)で、公衆回線に接続し、FAXの送受信等のデータの入出力を行う。
【0032】
318は外部インターフェイス(外部I/F)で、USB、IEEE1394,プリンタポート,RS−232C等の外部入力を受け付けるI/F部であり、本実施形態においては認証で必要となる携帯端末のICカード(記録媒体)の読み取り用のカードリーダ319が外部I/F部318に接続されている。そして、CPU301は、この外部I/F318を介してカードリーダ319による携帯端末のICカードからの情報読み取りを制御し、該携帯端末のICカードから読み取られた情報を取得可能である。以上のデバイスがシステムバス309上に配置される。
【0033】
320はイメージバスインターフェイス(IMAGEBUS I/F)であり、システムバス309と画像データを高速で転送する画像バス315とを接続し、データ構造を変換するバスブリッジである。画像バス315は、PCIバスまたはIEEE1394で構成される。画像バス315上には以下のデバイスが配置される。
【0034】
310はラスタイメージプロセッサ(RIP)で、例えば、PDLコード等のベクトルデータをビットマップイメージに展開する。311はプリンタインターフェイス(プリンタI/F)で、プリンタ部312とコントローラユニット316を接続し、画像データの同期系/非同期系の変換を行う。また、313はスキャナインターフェイス(スキャナI/F)で、スキャナ314とコントローラユニット316を接続し、画像データの同期系/非同期系の変換を行う。
【0035】
317は画像処理部で、入力画像データに対し補正、加工、編集を行ったり、プリント出力画像データに対して、プリンタの補正、解像度変換等を行う。また、これに加えて、画像処理部317は、画像データの回転や、多値画像データに対してはJPEG、2値画像データはJBIG、MMR、MH等の圧縮伸張処理を行う。そして、この画像処理部317は、スキャナ部314を駆動して画像読み取りされた画像データを画像処理して、ファイル出力可能な形式(例えば、PDF形式ファイル)に変換し、CPU301と連携して、ネットワークI/F305を介して、外部装置に画像データのファイルを送信することができる。
【0036】
スキャナ部314は、原稿となる紙上の画像を照明し、CCDラインセンサで走査することで、ラスタイメージデータとして電気信号に変換する。原稿用紙は原稿フィーダのトレイにセットし、装置使用者が操作部308から読み取り起動指示することにより、CPU301がスキャナ314に指示を与え、フィーダは原稿用紙を1枚ずつフィードし原稿画像の読み取り動作を行う。
【0037】
プリンタ部312は、ラスタイメージデータを用紙上の画像に変換する部分であり、その方式は感光体ドラムや感光体ベルトを用いた電子写真方式、微少ノズルアレイからインクを吐出して用紙上に直接画像を印字するインクジェット方式等があるが、どの方式でも構わない。プリント動作の起動は、CPU301からの指示によって開始する。なお、プリンタ部312には、異なる用紙サイズまたは異なる用紙向きを選択できるように複数の給紙段を持ち、それに対応した用紙カセットがある。
【0038】
操作部308は、LCD表示部を有し、LCD上にタッチパネルシートが貼られており、システムの操作画面を表示するとともに、表示してあるキーが押されるとその位置情報を操作部I/F307を介してCPU301に伝える。また、操作部308は、各種操作キーとして、例えば、スタートキー、ストップキー、IDキー、リセットキー等を備える。
【0039】
尚、表示部はプリンタによって表示性能が異なり、タッチパネルを介して操作をできるプリンタ、単に液晶画面を備え文字列を表示(印刷状態や印刷している文書名の表示)させるだけのプリンタによって本発明は構成されている。
【0040】
ここで、操作部308のスタートキーは、原稿画像の読み取り動作を開始する時などに用いる。スタートキーの中央部には、緑と赤の2色LEDがあり、その色によってスタートキーが使える状態にあるかどうかを示す。また、操作部308のストップキーは、稼働中の動作を止める働きをする。また、操作部308のIDキーは、使用者のユーザIDを入力する時に用いる。リセットキーは、操作部からの設定を初期化する時に用いる。
【0041】
カードリーダ319は、CPU301からの制御により、携帯端末内に備えられたICカードに記憶されている情報を読み取り、該読み取った情報を外部I/F318を介してCPU301へ通知する。
【0042】
以上のような構成によって、プリンタ300は、スキャナ314から読み込んだ画像データをLAN600上に送信したり、LAN600から受信した印刷データをプリンタ部312により印刷出力することができる。
【0043】
また、スキャナ314から読み込んだ画像データをモデム306により、公衆回線上にFAX送信したり、公衆回線からFAX受信した画像データをプリンタ部312により出力することできる。
【0044】
次に、本実施形態における文書読取システムの全体の処理について図4から図7を用いて説明する。
図4は、クライアント端末101、スキャナ102、サーバ103を用いて処理される文書読取システムのシーケンスチャートである。
【0045】
スキャナ102は、ユーザによるスキャン指示(例えば、スキャンボタンの押下)を受け付けることにより、試験回答用紙等の紙媒体をスキャンした画像データを取得する。スキャナ102は、画像データをサーバ103に送信する。
【0046】
サーバ103は、スキャナ102より画像データを受信すると、画像データのヘッダー部をOCR処理し、学年と性別情報を認識する。
【0047】
サーバ103は、ヘッダー部OCR処理により取得した学年と性別情報を用いて、該当する学年と性別の学習ファイルと計数を計数テーブル(図5)から取得する。すなわち、ヘッダ部をOCR処理して例えば、「小学3年生」で「女」という学年と性別情報を得ているとしたら、サーバ103の記憶部より「小学3年生の女」という学習ファイルを記憶部より取得する。
【0048】
次に、サーバ103は上述の画像データのメイン部に対し、OCR処理を実行する。このとき1回につき1つの学習ファイルを適用し、取得した1又は複数の学習ファイルの数だけOCR処理を繰り返し実行する。
【0049】
次に、サーバ103は、1又は複数回実行された画像データへのOCR結果のリジェクトエラー数に対し、前述の計数による計算を行う。計算値が最小となる結果を採用し、OCR結果テーブルに認識結果を登録する。
【0050】
次に、クライアント端末101は、サーバ103にて登録されたOCR結果テーブルを参照し、前述の画像データとOCR処理された結果を閲覧する。誤認識がある場合は、結果を訂正し、OCR結果テーブルに更新処理行う。また、誤認識した文字を正しい文字に修正し、学習ファイルを更新する。
【0051】
以下、図4を参照して、本実施形態の文書読取システムにおけるOCR認識処理について説明する。
図4ではOCR認識処理について説明する。本処理はスキャナ102とサーバ103にて実施され、スキャナ102に備えられる「スキャン開始」ボタン(不図示)を押下すると、処理が開始される。
【0052】
ステップS101では、スキャナ102にあらかじめ準備された用紙をスキャンし、スキャンした文書から画像データを取得する。
【0053】
本発明の実施の形態で用いられるスキャン文書は、例えば図9で示すデータ構成をしている。図8は、ヘッダー部801と、メイン部(1)802、メイン部(3)803の構造を備えている。ここでメイン部(1)(2)は、それぞれ別のものとしての扱いをしているが、実際にはメイン(1)に表記される設問などからの続きの内容である。
【0054】
ヘッダー部801は、例えば受験する教科の「教科ID」、学校の「学校ID」、年、組、人数、性別、出席番号の項目を含んでいる。
【0055】
次に、メイン部(1)および(2)は数値のマークを塗りつぶすマーク回答、文字のマークを塗りつぶす文字回答、記号による解答欄を含んでいる。
【0056】
引き続き図4に戻り、ステップS102では、スキャナ102のCPU201は、ステップS101で取得した画像データをサーバ103へ送信する。この情報をサーバ103はステップS103で受信する。
【0057】
ステップS104で、サーバ103のCPU201は、ステップS103で受信した画像データのヘッダー部801に対し、OCR処理を行う。このときにヘッダー部801に記述されている学校ID、学年、出席番号を取得する。尚、取得した学校ID、学年、出席番号はRAM302に記憶させておき、後述のS106、S107、S108の処理で利用される。
【0058】
ステップS105で、サーバ103のCPU201は、ステップS104で取得した学年とシステム月から、計数テーブル(図5)を検索し、該当する1又は複数の学習ファイルと計数を取得する。尚、取得した学習ファイルと計数はRAM302に記憶させておき、後述のS106、S107、S108の処理で用いる。学習ファイルと計数が取得出来ない場合は、無条件に標準設定された値を用いてもよい。
【0059】
ステップS106で、サーバ103のCPU201は、ステップS105で取得された学習ファイルのうち1つを適用し、前述の画像データのメイン部に対するOCR処理を行う。適用した学習ファイルはRAM302から削除する。尚、OCR結果はRAM302に記憶させておき、後述のS108の処理で利用される。
【0060】
ステップS107で、サーバ103のCPU201は、ステップS105で取得された学習ファイルの残数を確認し、1つ以上の学習ファイルが残っている場合はステップS106へ戻る。学習ファイルが残っていない(全ての学習ファイルを用いての適用が終了した)場合は、ステップS108へ進む。
【0061】
ステップS108で、サーバ103のCPU201は、ステップS106で記憶した1又は複数のOCR結果からリジェクトエラー数を取得する。其々のリジェクトエラー数に対し、ステップS105で記憶されている其々の計数から、
式「リジェクトエラー数×(1+(1−計数))」
の計算を行う。尚、リジェクトエラー数とは、OCR認識をした時に認識が不可能な文字や認識結果が不明瞭なエラーである。
【0062】
ステップS109で、サーバ103のCPU201は、ステップ108で計算された値の内、最小となる値を判断する。最小と判断されたOCR認識結果は、最も精度が高く認識された結果と判断する。すなわちリジェクトエラー数の一番少なかった学習ファイルである。
【0063】
ステップS110で、サーバ103のCPU201は、ステップ109で判断されたOCR結果をOCR結果テーブルへ登録する。
【0064】
ステップS111で、クライアント端末101のCPU201は、ステップS110で登録された結果をOCR結果テーブルから参照し、画面表示(不図示)する。OCR結果の画面表示は一般的に知られているOCRソフトウェア等で表示されるものとし、ここでは説明を割愛する。
【0065】
ステップS112で、クライアント端末101のCPU201は、ステップS111で表示されたOCR結果に誤認識がある場合は、ユーザ操作から得られた正しい結果に修正し、OCR結果テーブルに更新する。
【0066】
図5に示すように、計数テーブルは、学年、月、学習ファイル、計数の情報から構成される。計数情報は1学年の同一月に対して複数登録可能となっている。図7に示すように、例として、学年2の4月に実施されたOCR処理に対して、複数の学習ファイルを適用させて認識結果を得たい場合、複数のレコードを登録する。学年2の4月には基本的に学習ファイル2を適用するが、学年2にあがったばかりの4月の場合、学年1を想定して作成された学習ファイル1の結果も有効であると考えられるからである。
【0067】
図7に示すように、OCR結果テーブルは、学校ID、学年、出席番号、学習ファイル、リジェクトエラー数、回答1認識結果、回答1リジェクトエラー〜回答50認識結果、回答50リジェクトエラーで構成される。ここでは回答数を50としているが回答数は実施する試験等の問題数によって変わるものとする。リジェクトエラー数は回答1リジェクトエラー〜回答50リジェクトエラーの内「有」の個数が設定されるものとする。
【0068】
以上の本発明によれば、極端な癖のある文字をOCR認識する場合に、高い認識率でかつ効率的なOCR認識を実現することが可能な仕組みを提供することが可能になる。
【0069】
即ち、本発明は、読取装置から送信される画像データに含まれる文字情報の読取を実行する情報処理装置であって、前記読取装置により読み取られた文書の特定矩形領域から得られた情報を取得する画像データ取得手段と、前記画像データ取得手段で取得した前記画像データに含まれる文字情報の読取を実行する読取手段と、前記読取手段で前記画像データより読み取った読取情報を用いることにより、前記文書に書かれている文字情報を認識するためのプロファイルを特定する特定手段と、前記特定手段で特定した前記プロファイルを用いることにより前記文書に書かれている文字情報の認識を実行する文字情報認識手段と、前記文字情報認識手段で文字認識を実行した結果得られるエラー回数に応じて、適用する認識結果を決定する決定手段と、前記決定手段で決定した前記認識結果を登録する登録手段とを備えることを特徴とする。
【0070】
以上、実施形態、具体例を主に詳述したが、本発明は、例えば、システム、装置、方法、プログラムもしくは記憶媒体等としての実施態様をとることが可能であり、具体的には、複数の機器から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。
【0071】
本発明におけるプログラムは、図4に示すフローチャートの処理に従って情報処理装置100としてのコンピュータが実行可能なプログラムであり、本発明の記憶媒体は図4〜図7の処理方法を実行可能なプログラムを記憶されている。なお、本発明におけるプログラムは各装置の処理方法ごと、別の独立したプログラムであってもよい。
【0072】
以上のように、前述した実施形態の機能を実現するプログラムを記録した記録媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記録媒体に格納されたプログラムを読出し実行することによっても、本発明の目的が達成されることは言うまでもない。
【0073】
この場合、記録媒体から読み出されたプログラム自体が本発明の新規な機能を実現することになり、そのプログラムを記憶した記録媒体は本発明を構成することになる。
【0074】
プログラムを供給するための記録媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、DVD−ROM、磁気テープ、不揮発性のメモリカード、ROM、EEPROM、シリコンディスク等を用いることができる。
【0075】
また、情報処理装置100が読み出したプログラムを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0076】
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPU等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0077】
また、本発明は、複数の機器から構成されるシステムに適用しても、1つの機器からなる装置に適用してもよい。また、本発明は、システムあるいは装置にプログラムを供給することによって達成される場合にも適応できることは言うまでもない。この場合、本発明を達成するためのプログラムを格納した記録媒体を該システムあるいは装置に読み出すことによって、そのシステムあるいは装置が、本発明の効果を享受することが可能となる。
【0078】
さらに、本発明を達成するためのプログラムをネットワーク上のサーバ、データベース等から通信プログラムによりダウンロードして読み出すことによって、そのシステムあるいは装置が、本発明の効果を享受することが可能となる。なお、上述した各実施形態およびその変形例を組み合わせた構成も全て本発明に含まれるものである。
【0079】
また上記のソフトウェアで実現する各処理を、ファームウェアやハードウェア構成にして、各処理を各手段として実現することも可能であり、本発明の技術的範囲はこのようなファームウェアやハードウェア構成による実現も含むものである。

【特許請求の範囲】
【請求項1】
読取装置から送信される画像データに含まれる文字情報の読取を実行する情報処理装置であって、
前記読取装置により読み取られた文書の特定矩形領域から得られた情報を取得する画像データ取得手段と、
前記画像データ取得手段で取得した前記画像データに含まれる文字情報の読取を実行する読取手段と、
前記読取手段で前記画像データより読み取った読取情報を用いることにより、前記文書に書かれている文字情報を認識するためのプロファイルを特定する特定手段と、
前記特定手段で特定した前記プロファイルを用いることにより前記文書に書かれている文字情報の認識を実行する文字情報認識手段と、
前記文字情報認識手段で文字認識を実行した結果得られるエラー回数に応じて、適用する認識結果を決定する決定手段と、
前記決定手段で決定した前記認識結果を登録する登録手段と
を備えることを特徴とする情報処理装置。
【請求項2】
前記決定手段は前記文字情報認識手段で文字認識を実行した結果得られるエラー回数が最も少ない認識結果を、前記登録手段で登録する認識結果として決定することを特徴とする請求項1に記載の情報処理装置。
【請求項3】
読取装置から送信される画像データに含まれる文字情報の読取を実行する情報処理装置とクライアント端末を含む情報処理システムであって、
前記情報処理装置において、
前記読取装置により読み取られた文書の特定矩形領域から得られた情報を取得する画像データ取得手段と、
前記画像データ取得手段で取得した前記画像データに含まれる文字情報の読取を実行する読取手段と、
前記読取手段で前記画像データより読み取った読取情報を用いることにより、前記文書に書かれている文字情報を認識するためのプロファイルを特定する特定手段と、
前記特定手段で特定した前記プロファイルを用いることにより前記文書に書かれている文字情報の認識を実行する文字情報認識手段と、
前記文字情報認識手段で文字認識を実行した結果得られるエラー回数に応じて、適用する認識結果を決定する決定手段と、
前記決定手段で決定した前記認識結果を登録する登録手段と、
前記登録手段で登録をした前記認識結果を前記クライアント端末で表示すべく送信する送信手段とを備え、
前記クライアント端末において、
前記送信手段で前記情報処理装置より送信される前記認識結果を表示部に表示する表示手段と
を備えることを特徴とする情報処理システム。
【請求項4】
前記決定手段は前記文字情報認識手段で文字認識を実行した結果得られるエラー回数が最も少ない認識結果を、前記登録手段で登録する認識結果として決定することを特徴とする請求項3に記載の情報処理システム。
【請求項5】
読取装置から送信される画像データに含まれる文字情報の読取を実行する情報処理装置の制御方法であって、
前記情報処理装置において、
前記情報処理装置の画像データ取得手段が、前記読取装置により読み取られた文書の特定矩形領域から得られた情報を取得する画像データ取得ステップと、
前記情報処理装置の読取手段が、前記画像データ取得ステップで取得した前記画像データに含まれる文字情報の読取を実行する読取ステップと、
前記情報処理装置の特定手段が、前記読取ステップで前記画像データより読み取った読取情報を用いることにより、前記文書に書かれている文字情報を認識するためのプロファイルを特定する特定ステップと、
前記情報処理装置の文字情報認識手段が、前記特定ステップで特定した前記プロファイルを用いることにより前記文書に書かれている文字情報の認識を実行する文字情報認識ステップと、
前記情報処理装置の決定手段が、前記文字情報認識ステップで文字認識を実行した結果得られるエラー回数に応じて、適用する認識結果を決定する決定ステップと、
前記情報処理装置の登録手段が、前記決定ステップで決定した前記認識結果を登録する登録ステップ
とを含むことを特徴とする情報処理装置の制御方法。
【請求項6】
読取装置から送信される画像データに含まれる文字情報の読取を実行する情報処理装置を制御するプログラムであって、
前記情報処理装置を、
前記読取装置により読み取られた文書の特定矩形領域から得られた情報を取得する画像データ取得手段と、
前記画像データ取得手段で取得した前記画像データに含まれる文字情報の読取を実行する読取手段と、
前記読取手段で前記画像データより読み取った読取情報を用いることにより、前記文書に書かれている文字情報を認識するためのプロファイルを特定する特定手段と、
前記特定手段で特定した前記プロファイルを用いることにより前記文書に書かれている文字情報の認識を実行する文字情報認識手段と、
前記文字情報認識手段で文字認識を実行した結果得られるエラー回数に応じて、適用する認識結果を決定する決定手段と、
前記決定手段で決定した前記認識結果を登録する登録手段
として機能させることを特徴とするコンピュータで読取実行可能なプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate


【公開番号】特開2013−105331(P2013−105331A)
【公開日】平成25年5月30日(2013.5.30)
【国際特許分類】
【出願番号】特願2011−248906(P2011−248906)
【出願日】平成23年11月14日(2011.11.14)
【出願人】(390002761)キヤノンマーケティングジャパン株式会社 (656)
【出願人】(312000206)キヤノンMJアイティグループホールディングス株式会社 (259)
【出願人】(592135203)キヤノンITソリューションズ株式会社 (528)
【Fターム(参考)】