画像処理装置とその制御方法及び画像処理システム

【課題】ある文字列を文字認識できる画像処理装置がネットワークに存在しても、たまたまＯＣＲ処理を実行した画像処理装置の文字認識能力で、そのＯＣＲ処理の結果の精度が決まってしまう。
【解決手段】ＭＦＰにおいて、画像の文字領域に含まれる画像データに基づいて文字認識処理を実行し、その文字認識処理の処理結果に誤認識が含まれている可能性が高いと判定された場合、処理結果に誤認識が含まれている可能性が高いことを示す第１の情報とともに、その処理結果を他のＭＦＰに出力する。より高度の文字認識機能を有する他のＭＦＰは、その処理結果を取得し、第１の情報を含む場合に、その文字領域に含まれる画像データに対して文字認識処理を実行する。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、画像に対して文字認識処理を実行する画像処理装置とその装置の制御方法及び画像処理システムに関するものである。
【背景技術】
【０００２】
ネットワークを介して多数の画像処理装置（プリンタ、スキャナ、デジタル複写機、ＦＡＸ装置等）を接続し、これら画像処理装置を連携して動作させることにより、より高度な機能を実現することが望まれている。そのために画像処理装置間で送受信する画像データを、解像度に依存しない画像データ形式（解像度非依存データ：ベクタデータ）に変換する（ベクタライズ）ことが提案されている。このベクタデータを受信した各画像処理装置は、それをビットマップ画像に変換（ラスタライズ）するため、解像度変換による画像劣化も発生しない。そのため各々の画像処理装置に適したビットマップイメージを生成して高品位な画像を得ることが可能となり、特に能力が異なる各種画像処理装置を相互に連携させる技術として重要である。
【０００３】
また、ベクタライズされた画像データの付加情報として、印刷対象外の情報（メタデータ）を管理することも提案されている。このメタデータには、画像データに関連する情報が含まれており、画像処理のヒントにしたり、メタデータの情報をキーワードとして画像検索を行ったりすることが考えられている。
【０００４】
更に、スキャナ装置で読み取った原稿のビットマップ画像に対してＯＣＲ処理（文字認識処理）を行い、そのＯＣＲ処理結果として得られた文字コードをメタデータとして画像データに付加することで、その画像の検索用情報とすることも提案されている。
【０００５】
また、入力した画像データを画像処理装置内の二次記憶装置にファイルとして保存しておけば、ユーザが好きな時に取り出して繰り返し出力することができる。このように画像データの再利用を目的として、画像処理装置の二次記憶装置に画像データをファイル形式で保存する機能をボックス機能と呼び、ファイルシステムをボックスと呼ぶ。このボックス機能を用いると、格納された画像データを再度印刷したり、能力の異なる他の画像処理装置に配信したりする等、一度生成した画像データを繰り返し再利用することも可能である。このようにボックスに保存された大量の画像データが、ネットワークを介して接続された多数の画像処理装置に分散して蓄積されている場合、画像データの検索ができれば便利である。その検索方法の一つとして、前述のＯＣＲ処理結果をメタデータとして画像データに付加しておき、そのメタデータを検索することで、高速かつ簡単に目的の画像データを探すことが考えられる。しかしながら、ＯＣＲ処理による文字認識は、画像処理装置が備えるＯＣＲ機能がサポートしている言語や、画像処理装置のＯＣＲ処理能力等によって、文字の誤認識率が高くなる場合がある。そのため、ＯＣＲ処理における誤認識の可能性がある場合、ＯＣＲ処理を実行せず、その領域を入力されたビットマップ画像のまま保存する技術が提案されている（特許文献１）。
【特許文献１】特開２０００−３３９４０２号公報
【発明の開示】
【発明が解決しようとする課題】
【０００６】
しかしながら上述の従来技術において、文字を正確に認識できずビットマップ画像のままとしている領域は、ＯＣＲ処理能力の異なる別の画像処理装置では正しく文字認識ができる可能性がある。例えば、複写機やプリンタ装置は同一機種がさまざまな言語地域に出荷されるため、そのＯＣＲ機能も各言語に対応して一様ではない。よって、英語向けの画像処理装置で日本語の文字を含む画像をＯＣＲ処理した場合には文字認識ができない可能性がある。この場合、日本語のＯＣＲ処理が可能な画像処理装置があれば、その画像処理装置に画像を転送することで正しいＯＣＲ処理結果が得られる可能性が高い。また原稿の文字サイズが極端に小さかったり、文字のかすれがあったりする場合には、文字認識の能力がより高いのＯＣＲ機能を備えた装置のほうが適切に文字を認識できる可能性が高い。
【０００７】
このように従来の技術では、ある文字列を文字認識できる画像処理装置がネットワークに存在しても、たまたまＯＣＲ処理を実行した画像処理装置の文字認識能力で、そのＯＣＲ処理の処理結果が決まってしまっていた。このため、たとえ他の画像処理装置がより能力が高いＯＣＲ機能を備えていたとしても、その能力を充分に活用できないという問題があった。
【０００８】
本発明の目的は、上記従来技術の問題点を解決することにある。
【０００９】
また本発明の特徴は、ある画像処理装置において実行された文字認識処理の結果に誤認識が含まれている可能性が高い場合に、より高い文字認識能力を有する他の画像処理装置において文字認識処理を実行できるようにすることである。を提供することにある。
【課題を解決するための手段】
【００１０】
上記目的を達成するために本発明の一態様に係る画像処理装置は以下のような構成を備える。即ち、
画像に含まれる文字領域を識別する識別手段と、
前記識別手段により識別された文字領域に含まれる画像データに基づいて、文字認識処理を実行する文字認識手段と、
前記文字認識処理の処理結果を出力する第１の出力手段と、
前記文字認識処理の処理結果に誤認識が含まれている可能性が高いか否かを判定する判定手段と、
前記判定手段により、前記文字認識処理の処理結果に誤認識が含まれている可能性が高いと判定された場合に、前記文字認識処理の処理結果に誤認識が含まれている可能性が高いことを示す第１の情報とともに、前記文字認識処理の処理結果を出力するよう制御する制御手段とを有することを特徴とする。
【００１１】
上記目的を達成するために本発明の一態様に係る画像処理システムは以下のような構成を備える。即ち、
ネットワークを介して接続された少なくとも第１と第２の画像処理装置を含む画像処理システムであって、
前記第１の画像処理装置は、
画像に含まれる文字領域を識別する識別手段と、
前記識別手段により識別された文字領域に含まれる画像データに基づいて、第１の文字認識処理を実行する第１の文字認識手段と、
前記第１の文字認識処理の処理結果を出力する出力手段と、
前記第１の文字認識処理の処理結果に誤認識が含まれている可能性が高いか否かを判定する判定手段と、
前記判定手段により、前記第１の文字認識処理の処理結果に誤認識が含まれている可能性が高いと判定された場合に、前記第１の文字認識処理の処理結果に誤認識が含まれている可能性が高いことを示す第１の情報とともに、前記第１の文字認識処理の処理結果を出力するよう制御する制御手段とを備え、
前記第２の画像処理装置は、
前記第１の画像処理装置から出力された前記第１の文字認識処理の処理結果を取得する取得手段と、
前記第１の文字認識手段よりも文字認識能力が高い文字認識手段であって、第２の文字認識処理を実行する第２の文字認識手段とを備え、
前記第２の文字認識手段は、前記取得手段で取得した前記第１の文字認識処理の処理結果に前記第１の情報が含まれている場合に、前記第１の文字認識処理を実行した画像データに対して前記第２の文字認識処理を実行することを特徴とする画像処理システム。
【００１２】
上記目的を達成するために本発明の一態様に係る画像処理装置の制御方法は以下のような工程を備える。即ち、
画像に含まれる文字領域を識別する識別工程と、
前記識別工程で識別された文字領域に含まれる画像データに基づいて、文字認識処理を実行する文字認識工程と、
前記文字認識処理の処理結果を出力する第１の出力工程と、
前記文字認識処理の処理結果に誤認識が含まれている可能性が高いか否かを判定する判定工程と、
前記判定工程において、前記文字認識処理の処理結果に誤認識が含まれている可能性が高いと判定された場合に、前記文字認識処理の処理結果に誤認識が含まれている可能性が高いことを示す第１の情報とともに、前記文字認識処理の処理結果を出力するよう制御する制御工程とを有することを特徴とする。
【発明の効果】
【００１３】
本発明によれば、ある画像処理装置において実行された文字認識処理の結果に誤認識が含まれている可能性が高い場合に、より高い文字認識能力を有する他の画像処理装置において文字認識処理を実行することができる。
【発明を実施するための最良の形態】
【００１４】
以下、添付図面を参照して本発明の好適な実施の形態を詳しく説明する。尚、以下の実施の形態は特許請求の範囲に係る本発明を限定するものでなく、また本実施の形態で説明されている特徴の組み合わせの全てが本発明の解決手段に必須のものとは限らない。
【００１５】
＜画像処理装置の構成＞
本実施の形態を適用するに好適な１ＤカラーＭＦＰ（Multi Function Peripheral：多機能装置）の構成について、図１を用いて説明する。
【００１６】
図１は、本実施の形態に係る画像処理装置（複合機）の構成を示す図である。
【００１７】
この画像処理装置は、スキャナ部１０１、レーザ露光部１０２、感光ドラム１０３を有する作像部１０４、定着部１０５、給紙／搬送部１０６及び、これらを制御するプリンタ制御部（不図示）を有している。
【００１８】
スキャナ部１０１は、原稿台に置かれた原稿に対して、光源からの光を照射し原稿上の画像を光学的に読み取り、その像を電気信号に変換して画像データを作成する。レーザ露光部１０２は、その画像データに応じて変調されたレーザ光等の光線を等角速度で回転する回転多面鏡（ポリゴンミラー）に入射し、その反射光を走査光として感光ドラム１０３に照射する。作像部１０４は、感光ドラム１０３を回転駆動し、帯電器によって帯電させ、レーザ露光部１０２によって感光ドラム１０３上に形成された潜像をトナーによって現像化し、そのトナー像をシートに転写する。その際に転写されずに感光ドラム１０３に残った微小トナーを回収するといった一連の電子写真プロセスを実行して作像する。その際、シートが転写ドラム１０７の所定位置に巻付く。そして４回転する間に、マゼンタ（Ｍ）、シアン（Ｃ）、イエロー（Ｙ）、ブラック（Ｋ）のトナーを持つそれぞれの現像ユニット（現像ステーション）が入れ替わりで順次前述の電子写真プロセスを繰り返し実行する。４回転の後、４色のフルカラートナー像が転写されたシートは転写ドラム１０７を離れて定着部１０５へ搬送される。
【００１９】
定着部１０５は、ローラやベルトの組み合わせによって構成され、ハロゲンヒータ等の熱源を内蔵し、作像部１０４でトナー像が転写されたシート上のトナーを、熱と圧力によって溶解、定着させる。
【００２０】
給紙／搬送部１０６は、シートカセットやペーパーデッキに代表されるシート収納庫を一つ以上持っており、プリンタ制御部の指示に応じてシート収納庫に収納された複数のシートの中から一枚分離し、作像部１０４、定着部１０５へ搬送する。シートは作像部１０４の転写ドラム１０７に巻きつけられ、４回転した後に定着部１０５へ搬送される。４回転する間に前述のＹＭＣＫ各色のトナー像がシートに転写される。また、シートの両面に画像形成する場合は、定着部１０５を通過したシートを再度作像部１０４へ搬送する搬送経路を通るように制御する。
【００２１】
プリンタ制御部は、この画像処理装置全体を制御する制御部と通信して、その指示に応じて制御を実行すると共に、前述のスキャナ、レーザ露光、作像、定着、給紙／搬送の各部の状態を管理しながら、全体が調和を保って円滑に動作できるよう指示する。
【００２２】
＜システム構成＞
図２は、本実施の形態に係る画像処理システムの全体構成を示すブロック図である。
【００２３】
図において、この画像処理システムは、互いにＬＡＮ（Local Area Network）１０等を介して接続されたＭＦＰ１，ＭＦＰ２，ＭＦＰ３を有している。これらＭＦＰ１，ＭＦＰ２，ＭＦＰ３は、ネットワークプロトコルを使用して互いに通信することができる。尚、ＬＡＮ１０に接続されるこれらのＭＦＰは、上記のような物理的な配置に限定されなくても良い。また、ＬＡＮ１０にはＭＦＰ以外の機器（例えばＰＣ、各種サーバ、プリンタ等）が接続されていても良い。各ＭＦＰはそれぞれＨＤＤ（ハードディスク：二次記憶装置）Ｈ１，Ｈ２，Ｈ３を具備している。
【００２４】
ここで各ＭＦＰは、それぞれの個々の装置の基本設定として、言語及び仕向け設定を持つ。ここでＭＦＰ１は、言語が英語（ＥＮ）で北米（ＵＳ）向け仕様の装置である。ＭＦＰ２は、言語が日本語（ＪＡ）で北米（ＵＳ）向け仕様の装置であり、ＭＦＰ３は、言語が日本語（ＪＡ）で日本（ＪＰ）向け仕様の装置である。更に、各装置が具備するＯＣＲソフトウェアの文字認識能力も異なっている。ＭＦＰ１とＭＦＰ２は同等のＯＣＲ処理能力（Level 1）であるが、ＭＦＰ３は、それよりも優れた（Level 3）ＯＣＲ処理能力を備えている。このように、様々な仕様、言語、能力をもった画像処理装置がネットワーク１０を介して接続されており、ドキュメントを相互に送信し、プリンタで印刷したり、ボックスに保存したりすることが可能に構成されている。
【００２５】
＜制御部の説明＞
図３は、本実施の形態に係る画像処理装置（複合機）の制御部（コントローラ）の構成例を示すブロック図である。
【００２６】
図において、制御部２００は、画像入力デバイスであるスキャナ部１０１や画像出力デバイスであるプリンタエンジン２０２と接続し、画像データの読み取りやプリント出力のための制御を行う。また制御部２００は、ＬＡＮ１０や公衆回線２０４と接続することで、画像情報やデバイス情報をＬＡＮ１０経由で入出力するための制御を行う。
【００２７】
ＣＰＵ２０５は、このＭＦＰ全体を制御するための中央処理装置である。ＲＡＭ２０６にはＣＰＵ２０５が実行するプログラムがロードされ、またＣＰＵ２０５が動作するためのワークメモリを提供している。更に、このＲＡＭ２０６は、入力された画像データを一時記憶するための画像メモリも提供している。ＲＯＭ２０７はブートＲＯＭであり、システムのブートプログラムを格納している。ＨＤＤ２０８はハードディスクドライブで、各種処理のためのシステムソフトウェア及び入力された画像データ等を格納する。操作部Ｉ／Ｆ２０９は、画像データ等を表示可能な表示画面を有する操作部２１０に対するインタフェース部であり、操作部２１０に対して表示データを出力する。また操作部Ｉ／Ｆ２０９は、操作部２１０から操作者が入力した情報をＣＰＵ２０５に伝える役割をする、各種指示をユーザが入力可能なユーザインタフェース手段を提供する。ネットワークインタフェース２１１は、例えばＬＡＮカード等で実現され、ＬＡＮ１０に接続して外部装置との間で各種情報の入出力を制御する。また、モデム２１２は公衆回線２０４に接続し、外部装置との間で情報の入出力を制御する。以上のユニットがシステムバス２１３上に配置されている。
【００２８】
イメージバスＩ／Ｆ２１４は、画像データを高速で転送する画像バス２１５とシステムバス２１３とを接続するためのインタフェースであり、データ構造を変換するバスブリッジである。画像バス２１５には、ラスタイメージプロセッサ（ＲＩＰ）２１６、デバイスＩ／Ｆ２１７、スキャナ画像処理部２１８、プリンタ画像処理部２１９、編集用画像処理部２２０、カラーマネージメントモジュール（ＣＭＭ）２３０が接続される。ラスタイメージプロセッサ（ＲＩＰ）２１６は、ページ記述言語（ＰＤＬ）コードや後述するベクトルデータをイメージデータに展開する。デバイスＩ／Ｆ部２１７は、スキャナ部１０１やプリンタエンジン２０２と制御部２００とを接続し、画像データの同期系／非同期系の変換を行う。
【００２９】
またスキャナ画像処理部２１８は、スキャナ部１０１から入力した画像データに対して、補正、加工、編集等の各種処理を行う。プリンタ画像処理部２１９は、印刷用の画像データに対して、プリンタエンジン２０２に応じた補正、解像度変換等の処理を行う。編集用画像処理部２２０は、画像データの回転や、画像データの圧縮伸長処理等の各種画像処理を行う。ＣＭＭ２３０は、画像データに対して、プロファイルやキャリブレーションデータに基づいた、色変換処理（色空間変換処理ともいう）を施す専用ハードウェアモジュールである。プロファイルとは、機器に依存した色空間で表現したカラー画像データを機器に依存しない色空間（例えばＬａｂ等）に変換するための関数のような情報である。キャリブレーションデータとは、複合機におけるスキャナ部１０１やプリンタエンジン２０２の色再現特性を修正するためのデータである。
【００３０】
＜ソフトウェア構成＞
図４は、本実施の形態に係る画像処理装置の動作を制御するソフトウェアの構成を示すブロック図である。
【００３１】
プリンタインターフェイス１２００は、ネットワーク１０との入出力を制御するインタフェースである。プロトコル制御部１１０１は、ネットワークプロトコルを解析・送信することによって外部との通信を制御する。ベクタデータ生成部１１０２は、ビットマップイメージから解像度に依存しない描画記述であるベクタデータを生成（ベクタライズ）する。メタデータ生成部１１０３は、ベクタデータ生成部１１０２におけるベクタライズの過程で得られる副次情報をメタデータとして生成する。このメタデータは、描画処理には使用されない付加情報であって、検索などに使用されるデータである。このベクタデータのレンダリングに要する処理量の指数も、メタデータとして生成される。ＰＤＬ解析部１１０４は、ＰＤＬデータを解析し、より処理しやすい形式の中間コード（DisplayList）に変換する。このＰＤＬ解析部１１０４で生成された中間コードは、データ描画部１１０５に渡されて処理される。データ描画部１１０５は、その中間コードをビットマップデータに展開する。こうして展開されたビットマップデータはページメモリ１１０６に逐次描画される。ページメモリ１１０６は、データ描画部１１０５が展開するビットマップデータを一次的に保持する揮発性のメモリである。
【００３２】
パネル入出力制御部１０２０は、操作部２１０との間でデータの入出力を制御する。ドキュメント記憶部１０３０は、入力文書の一塊（ジョブ）単位にベクタデータ、ディスプレイリスト、メタデータを包含するデータファイルを記憶するもので、ハードディスク等の二次記憶装置によって実現される。尚、このデータファイルを本実施の形態では「ドキュメント」と呼ぶ。スキャン制御部１５００は、スキャナ部１０１から入力した画像データに対して、補正、加工、編集等の各種処理を実行する。印刷制御部１３００は、ページメモリ１１０６の内容をビデオ信号に変換処理してプリンタエンジン２０２へ転送する。プリンタエンジン２０２は、その受け取ったビデオ信号を記録紙（シート）に可視画像を形成するための印刷機構部である。システム制御部１０１０は、上記の各種ソフト制御部を統合し、システムとして、この画像処理装置全体の制御管理を行う。更に、システム制御部１０１０は、プリント動作、スキャン動作等の一単位の動作をジョブとして制御し、パネル入出力制御部１０２０を制御して操作部２１０にジョブの処理状況やステータスを表示する。
【００３３】
＜制御部２００によるデータ処理＞
次に、ドキュメントを構成するベクタデータ、ディスプレイリストＤＬ、メタデータがどのように生成されるのかを説明する。
【００３４】
図５及び図６は、本実施の形態における制御部２００によるデータの流れを示す図である。
【００３５】
図５は、スキャナ部１０１が原稿を走査して読み取ったデータに基づいてドキュメントを生成し、コピー動作やボックス保存を行う場合のデータの流れを示す図である。
【００３６】
原稿露光部にセットされた原稿の画像は、スキャン処理ｄ１によってビットマップデータ５０１に変換される。次にベクタライズ処理ｄ２とメタデータ生成処理ｄ４によって、ビットマップデータ５０１からそれぞれ解像度に依存しないベクタデータ５０２と、それに付随するメタデータ（付加情報）５０３とが生成される。これらベクタデータ５０２、メタデータ５０３の具体な生成方法については後述する。
【００３７】
次にドキュメント生成処理ｄ３によって、ベクタデータ５０２とメタデータ５０３とが関連付けられたドキュメント５０４が生成される。次にＤＬ生成処理ｄ５により、ドキュメント５０４のベクタデータからＤＬ５０５が生成される。こうして生成されたＤＬ５０５は、ドキュメントの中に格納されて（ｄ６）、ドキュメント５０８となる。このドキュメント５０８は、更にレンダリング処理ｄ７に送られてビットマップデータ５０６に変換される。このビットマップデータ５０６は、印刷処理ｄ８によってシートに印刷されて印刷物５０７となる。尚、印刷された印刷物５０７をまた原稿露光部にセットすればスキャン処理ｄ１からの処理を行うことができる。
【００３８】
図６は、図５のメタデータ生成処理ｄ４の具体的な処理の流れを示す図である。
【００３９】
まず領域分割処理６０１で、ビットマップデータ５０１の領域分割を行う。この領域分割は、入力されたビットマップ画像データを解析して、画像に含まれるオブジェクトの塊毎に領域に分割し、各領域の属性を識別して分類する処理である。ここで属性としては、文字（TEXT）、画像(PHOTO)、線(LINE)、図形(PICTURE)、表(TABLE)等がある。
【００４０】
図７は、入力画像の領域分割を行った場合の一例を示す図である。
【００４１】
入力画像７０１に対して領域分割を行った結果を７０２で示す。７０２において、点線で囲った部分が画像を解析した結果のオブジェクトの１単位を表し、各オブジェクトに対して付されている属性の種類が領域分割の判定結果である。
【００４２】
再び図６において、属性毎に分類された領域の内、文字属性の領域（文字領域）６０２として識別された画像データは、ＯＣＲ処理６０３により文字認識処理されて文字列６０４に変換される。つまり、この文字列６０４は紙面に印刷されている文字列である。
【００４３】
一方、属性毎に分類された領域の内、画像属性の領域（画像領域）６０５は、画像情報抽出処理６０６を通して画像情報６０７に変換される。この画像情報６０７は、画像の特徴を現す文字列であり、例えば「花」や「顔」といった文字列である。この画像情報の抽出には、画像特徴量（画像を構成するピクセルの周波数や濃度等）の検出や顔認識等の一般的な画像処理技術を用いることができる。こうして生成された文字列６０４と画像情報６０７、及びそれぞれの処理量指数は、フォーマット変換処理６０８によって後述するデータフォーマットに整えられてメタデータ５０３が生成される。
【００４４】
＜ドキュメントデータの構造＞
次に、ドキュメントの構造を説明する。
【００４５】
図８〜図１０は、本実施の形態の画像処理システムで処理されるドキュメントの構造の一例を示す図である。
【００４６】
図８は、ドキュメントのデータ構造を説明する図である。
【００４７】
ドキュメントは、複数ページからなるデータであり、大きく分けるとベクタデータ８０１、メタデータ８０２、ディスプレイリスト（ＤＬ）８０３で構成されており、ドキュメントヘッダ８０４を先頭とする階層構造である。ベクタデータ８０１は更に、各ページのページヘッダ８０５、サマリ情報８０６、オブジェクト８１１で構成されている。メタデータ８０２は更に、ページ情報８０７と詳細情報８０８で構成されている。ＤＬ８０３は更に、ページヘッダ８０９と、描画展開用のインストラクション８１０から構成されている。ドキュメントヘッダ８０４には、ベクタデータ８０１の格納場所と、ＤＬ８０３の格納場所が記述されているため、ベクタデータ８０１とＤＬ８０３とはドキュメントヘッダ８０４によって関連付けられている。
【００４８】
ベクタデータ８０１は、解像度非依存な描画データであるので、ページヘッダ８０５にはページの大きさや向き等のレイアウト情報が記述される。オブジェクト８１１には、ライン、多角形、ベジェ曲線等の描画データが一つずつリンクされており、複数のオブジェクトがまとめてサマリ情報８０６に関連付けられている。サマリ情報８０６は、複数のオブジェクトの特徴をまとめて表現するものであり、ここには各分割領域の属性情報等が記述される。
【００４９】
メタデータ８０２は、描画処理には直接的に関係しない付加情報であり、処理量指数、ページ数等の、そのドキュメントの処理時間の予測に必要な情報や、検索用情報等が含まれる。ページ情報８０７には、そのページに含まれる描画データのレンダリング処理に必要な処理量指数が格納される。また詳細情報８０８には、ＯＣＲ処理結果や画像情報として生成された文字列（文字コード列）が記述される。
【００５０】
更にメタデータ８０２には、トータル情報８１２が、ドキュメントヘッダ８０４から直接参照可能に含まれている。同様に、ページ単位でも素早く、そのページの付加情報を参照可能なように、各ページヘッダ８０５からページ情報８０７が関連付けがされている。またベクタデータ８０１のサマリ情報８０６からメタデータ８０２が参照されており、サマリ情報８０６から詳細情報８０８を見つけることができる。
【００５１】
ＤＬ８０３は、レンダラがビットマップ展開するための中間コードである。ページヘッダ８０９には、各ページ内の描画情報（インストラクション）の管理テーブル等が記述され、インストラクション８１０は、解像度依存な描画情報（ビットマップイメージ）で構成されている。
【００５２】
図９（Ａ）（Ｂ）は、図８で説明したデータ構造がメモリやファイルにどう配置されるのかを示す図である。
【００５３】
図９（Ａ）において、ドキュメント９０１は、ベクタデータ領域９０２、メタデータ領域９０３、ＤＬ領域９０４がメモリ上の任意のアドレスに配置される。従って、ヘッダはアドレス「0xf0000000」から読み出される。またベクタデータはアドレス「0xf000aabb」から読み出される。またベクタデータに対応するメタデータは、ポインタ（*ptr）により関連付けられている。
【００５４】
図９（Ｂ）では、ドキュメントは、ベクタデータ領域、メタデータ領域、ＤＬ領域が一つのファイルにシリアライズされる。従って、ベクタデータ、メタデータ、ディスプレイリストはそれぞれ、先頭アドレスに対するオフセット値に従ってアクセスされる。
【００５５】
図１０は、本実施の形態で処理される、例えば１００ページからなるドキュメントデータの具体例を示す図である。
【００５６】
画像処理装置がドキュメントを受信して処理しようとする場合、画像データの内容を解析することなくドキュメントヘッダから直接メタデータの全体情報を参照可能である。
【００５７】
１ページ目を例に、各ページの詳細な構成を説明する。１ページ目のサマリ情報には「TEXT」と「IMAGE」が含まれる。「TEXT」のサマリ情報１００１には、H,e,l,l,o（オブジェクト１００２）とW,o,r,l,d（オブジェクト１００３）の文字輪郭がベクタデータとしてリンクされている。更に、このサマリ情報から「Hello」「World」という文字コード列（メタデータ１００４）が参照されている。
【００５８】
また「IMAGE」のサマリ情報１００５には、蝶の写真画像(JPEG)１００７がリンクされている。更に、このサマリ情報１００５から、「butterfly」という画像情報（メタデータ１００６）が参照されている。従って、例えばキーワード「World」で、ページ中のテキストを検索する場合は、以下の手順で検出すればよい。まずドキュメントヘッダ１０１００から各ページのページデータ１０１１を順次取得する。そしてページヘッダにリンクされているサマリ情報１００１，１００５から文字領域「TEXT」にリンクされているメタデータを検索する。そして、そのメタデータにキーワード「World」が含まれているページを取り出す。尚、Ｍ１，Ｍ２，...，Ｍ１００のそれぞれは、各ページのページヘッダを示す。
【００５９】
＜スキャン及び転送に伴うＯＣＲ処理＞
スキャナ部１０１で原稿を読み取り、ＯＣＲ処理を実行してドキュメントを生成する処理、及びそのドキュメントが更に別の装置に転送されて、ＯＣＲ処理結果の精度を高めていく処理の流れについて説明する。
【００６０】
図１１は、本実施の形態に係る画像処理装置（ＭＦＰ）間でドキュメントを転送する場合のシステム構成図である。
【００６１】
図において、第１の画像処理装置として機能するＭＦＰ１で原稿１３０１をスキャンし（１１０１０）、ＯＣＲ処理とドキュメント生成を実行する。このＭＦＰ１は、言語が英語（ＥＮ）で北米（ＵＳ）向け仕様の装置で、ＯＣＲレベルはレベル１（level 1）である。その後、ＭＦＰ１からＭＦＰ２へ、そのＯＣＲ処理結果であるドキュメントデータが送信（又は転送）され（１１０２）る。ＭＦＰ２は、言語が日本語（ＪＡ）で北米（ＵＳ）向け仕様の装置で、このＭＦＰ２で、再度ＯＣＲ処理が実行される。このＭＦＰ２は、ＭＦＰ１と同等のＯＣＲ能力（Level 1）を有している。また第２の画像処理装置として機能するＭＦＰ３は、言語が日本語（ＪＡ）で日本（ＪＰ）向け仕様の装置で、ＭＦＰ３は、他のＭＦＰよりも優れた（Level 3）ＯＣＲ能力を備えている。更にその後、ＭＦＰ２からＭＦＰ３へドキュメントが送信（又は転送）されて（１１０３）、更にＯＣＲ処理が実行される場合を示している。
【００６２】
まず、ＭＦＰ１での原稿のスキャンとドキュメント生成処理１１０１０について、図１２乃至図１４を参照して説明する。
【００６３】
図１３は、スキャンする原稿１３０１の一例を示す図である。
【００６４】
この原稿１３０１は、英語の文字領域１３０２と、日本語の文字領域１３０３とを含んでいる。
【００６５】
続いて、図１２のフローチャートを参照して、ＯＣＲ処理及びドキュメント生成処理について説明する。
【００６６】
図１２は、本実施の形態に係る画像処理装置において原稿を読み取ってＯＣＲ処理を実行してドキュメントを生成する処理を説明するフローチャートである。尚、この処理を実行するプログラムは、実行時にはＨＤＤ２０８からＲＡＭ２０６にロードされ、ＣＰＵ２０５の制御の下に実行される。
【００６７】
先ずステップＳ１にて、ユーザがＭＦＰ１のスキャナ部１０１に原稿をセットし、操作部２１０からスキャン開始を指示することで原稿が読み取られる。ステップＳ２では、スキャナ部１０１でスキャンしたビットマップ画像を解析し、図６の６０１で示した領域分割処理を実行する。図１３の原稿１３０１は、文字領域１３０２，１３０３を含み、ステップＳ３ではこれらの領域が文字領域（ＴＥＸＴ）として識別される。次にステップＳ４に進み、第１の文字認識手段として機能するＣＰＵ２０５は、まず文字領域１３０２に対してＯＣＲ処理（第１の文字認識処理）を実行する。
【００６８】
上述したようにＭＦＰ１の言語、仕向け設定は英語、北米仕向けであるので、英語である文字領域１３０２内に含まれる文字を正確に認識することができる。次にステップＳ５に進み、誤認識の可能性は高くないと判断してステップＳ６に進む。ステップＳ６では、元画像の文字を再現するためのベクタデータ（フォント情報等）を生成するとともに、ステップＳ４のＯＣＲ処理の処理結果として得られた文字列を、その領域メタデータとして付加する。そして第１の出力手段として機能するＣＰＵ２０５は、この文字認識処理の処理結果を出力する。
【００６９】
図１４は、本実施の形態に係る画像処理装置の一例であるＭＦＰ１でのスキャンで得られるドキュメントデータを説明する図である。
【００７０】
原稿１３０１の文字領域１３０２から得られるベクタデータが１４０１，１４０２で示されている。また１４０３は、メタデータを示している。
【００７１】
次にステップＳ７に進み、そのページ内の全ての画像領域の処理が終了したかをチェックし、未処理の領域があればステップＳ３に戻って、前述の処理を実行する。
【００７２】
図１３の原稿の例では、文字領域１３０３が未処理であるためステップＳ３に戻る。
【００７３】
この文字領域１３０３は、ステップＳ３で文字（ＴＥＸＴ）領域として識別される。次にステップＳ４で、その文字領域１３０３に対してＯＣＲ処理が実行される。ここで、文字領域１３０３は、日本語文字で構成されている。この場合、ＭＦＰ１は、日本語を認識する能力がないため、正確に文字を認識することができない。そのため続くステップＳ５では「誤認識の可能性が高い」と判定してステップＳ１０へ進む。ステップＳ１０では、誤認識の可能性が高くてもＯＣＲ処理を実行するか、或いはＯＣＲ処理の処理結果に代えて、その領域をビットマップ画像のままとするかを判断する。ここで、いずれの処理を行うかは、ＭＦＰ１に予め設定された設定値を用いてもよいし、操作部２１０を使用してユーザに指示させてもよい。
【００７４】
ここではステップＳ１０で操作部２１０からユーザが「ＯＣＲ処理を実行しない」を選択するように指示したものとする。この場合はステップＳ１０からステップＳ１１に進み、その文字領域１３０３をスキャンしたビットマップ画像のままとする。ビットマップ画像のメタデータ１４０４は、ビットマップ（Image）画像であるが、ここでは文字を含む可能性があることを示す情報（Text(Maybe)）（第２の情報）を付加する。これはドキュメントが他のＭＦＰにおいて再度処理される場合において、この文字領域に対してＯＣＲ処理を実行すれば文字認識ができる可能性を示すヒント情報として利用される。そして、第２の出力手段として機能するＣＰＵ２０５は、文字認識処理の処理結果に代えて、文字認識処理を実行した画像データを出力する。
【００７５】
一方ステップＳ１０で、ＯＣＲ処理を実行すると設定されているか、或はＯＣＲ処理を実行する旨の指示が入力された場合はステップＳ１２に進み、ＯＣＲ処理を実行してステップＳ６と同様のベクタデータ生成とメタデータ生成を行う。次にステップＳ１３に進み、そのメタデータに「誤認識が含まれている可能性がある」ことを示す情報（第１の情報）を付加して出力する。そしてステップＳ１４に進み、更に文字領域１３０３のビットマップ画像もヒント情報として付加する。ここでビットマップ画像も同時に付加するのは、そのドキュメントが別の装置に転送された場合に、再度ＯＣＲ処理を可能にするためである。
【００７６】
こうしてステップＳ１１，Ｓ１４を実行するとステップＳ７に進み、１ページの処理が終了したと判断するとステップＳ８に進み、その処理済みのページが最終ページかどうかを判断する。最終ページでなければステップＳ１に戻って、次のページの原稿を読み取る。こうしてステップＳ８で、最終ページであると判断するとステップＳ９に進み、図１３に示すドキュメントデータの生成を完了し、それをハードディスク２０８（図３）に保存して処理を終了する。
【００７７】
次に図１１において、ＭＦＰ１でのスキャンして生成された図１３に示すドキュメントデータをＭＦＰ２に送信（又は転送）し、ＭＦＰ２で再度ＯＣＲ処理を実行する場合（図１１の転送（１１０２））を説明する。
【００７８】
図１５は、ＭＦＰ２が、ＭＦＰ１からドキュメントデータを取得し、それを再度ＯＣＲ処理することにより生成してＭＦＰ２に保存するドキュメントデータの一例を示す図である。尚、図１５において、図１４と共通する部分は同じ記号で示している。
【００７９】
ここで、日本語の文字領域に対してＯＣＲ処理を実行した結果、認識された結果のベクタデータ１５０１及び１５０２で示している。尚、ここでは、１５０２に含まれている文字中の１５０３で示す部分は誤認識した例を示している。従って、ここでは、その文字領域の元のビットマップ画像１５０４もヒント情報として付加されている。１５０５はメタデータで、認識した文字のベクタデータや、ヒント情報としての画像であることを示す情報等が付加されている。
【００８０】
図１７は、本実施の形態に係る画像処理装置において、他の画像処理装置から転送されたドキュメントデータに対してＯＣＲ処理を実行する処理を説明するフローチャートである。尚、この処理を実行するプログラムは、実行時にはＨＤＤ２０８からＲＡＭ２０６にロードされ、ＣＰＵ２０５の制御の下に実行される。
【００８１】
この処理は、ＭＦＰ１から送信されたドキュメントデータを、ＭＦＰ２がネットワーク１０経由で受信することにより開始される。このドキュメントデータの受信はＭＦＰ１からの送信（Ｐｕｓｈ型）でも、ＭＦＰ２からＭＦＰ１への送信要求に基づく転送（Ｐｕｌｌ型）のいずれでもよい。またネットワーク１０に接続された、他の装置（不図示のパーソナルコンピュータ等）からＭＦＰ１又はＭＦＰ２への動作指示によって開始されてもよい。
【００８２】
こうしてドキュメントデータを受信するとステップＳ２１で、そのドキュメントデータのメタデータ１４０３，１５０５を検索し、そのドキュメントデータにＯＣＲ対象となる画像が含まれているか否かをチェックする。ステップＳ２２，Ｓ２３では、それぞれＯＣＲ処理されていないビットマップ画像、或は誤認識が含まれている可能性があるＯＣＲ処理結果が存在しているか否かを判定する。ステップＳ２２或はＳ２３で、該当するデータがあると検出した場合はステップＳ２４に進み、第２の文字認識手段として機能するＣＰＵ２０５が、そのドキュメントデータに含まれるビットマップ画像に対してＯＣＲ処理（第２の文字認識処理）を実行する。そしてステップＳ２５で、文字認識に成功したかを判定し、成功したと判定するとステップＳ２６に進み、ベクタデータ生成と、ＯＣＲ処理結果のメタデータ化を行う。続いてステップＳ２７に進み、取得したメタデータに含まれているＯＣＲ未処理、又は誤認識の可能性有り等のメタデータを消去する。尚、ステップＳ２２，Ｓ２３で、ＯＣＲ処理されていないビットマップ画像、或は誤認識が含まれている可能性があるＯＣＲ処理結果が存在していないと判断するとステップＳ２８に進む。
【００８３】
本実施の形態では、ＭＦＰ２が認識可能な言語は日本語であるが、ＯＣＲの認識レベルが高くない（レベル１）ため、そのドキュメントデータに含まれる日本語の文字領域１３０３を認識できないものとする。この場合はステップＳ２５で、誤認識の可能性ありと判断してステップＳ３０に進む。ステップＳ３０では、ＯＣＲ処理を実行するかどうかの判断する。ここで、図１７のＰ１７０１で示す一連の処理は、図１２で示したスキャン時の処理フローにおけるＰ１２０１の処理と同一である。従って、ステップＳ３０におけるＯＣＲ処理を実行するかどうかの指示方法は、図１２のステップＳ１０と同様に、予めＭＦＰ２に設定された設定値によるか、或は操作部２１０（ユーザインタフェース）からユーザが選択指示によるかの、いずれであってもよい。
【００８４】
ここでは、ＭＦＰ２においてユーザから「ＯＣＲ処理を実行する」の選択指示がされたものとし、その場合はステップＳ３２に進む。ステップＳ３２，Ｓ３３ではＯＣＲ処理を実行し、その結果と、誤認識の可能性の有無の情報を、図１５の１５０５で示すメタデータとして生成する。更にステップＳ３４に進み、元のビットマップ画像１５０４もヒント情報として、そのメタデータに付加する。こうしてメタデータ１５０５には、ヒント情報としての画像であることを示す情報が付加される。
【００８５】
こうしてステップＳ２７，Ｓ３１，Ｓ３４のいずれかを実行するとステップＳ２８に進み、１ページの処理が終了したかどうかを判断する。１ページの処理が終了したと判断するとステップＳ２９に進み、その処理済みのページが最終ページかどうかを判断する。最終ページでなければステップＳ２１に戻って、次のメタデータを走査する。こうしてステップＳ２９で、最終ページであると判断すると、図１５に示すドキュメントデータをハードディスク２０８（Ｈ２）に保存して、この処理を終了する。
【００８６】
図１５は、こうしてＯＣＲの結果認識された結果のベクタデータ１５０１，１５０２、及びメタデータ１５０５を示している。
【００８７】
ＭＦＰ２のようにＯＣＲ処理能力が比較的低く、ＯＣＲ処理結果に誤認識が含まれている可能性があるＭＦＰで作成されたメタデータは、逆に誤った検索結果をもたらすおそれがある。このため、本実施の形態で想定するメタデータを用いたドキュメント検索では、このＭＦＰで作成されたメタデータは検索対象外としている。つまりＭＦＰ２が生成した、図１５に示すドキュメントに対して、元の原稿の文字領域１３０３に含まれる文字列で検索することが出来ない。
【００８８】
そこで図１５に示すドキュメントが、より能力が高いＯＣＲ機能を有するＭＦＰ３に転送され、正しくＯＣＲ処理される場合について説明する。
【００８９】
前述したＭＦＰ１からＭＦＰ２へのドキュメントデータの転送時の処理と同様に、ＭＦＰ２からＭＦＰ３に転送されたドキュメントデータに対してＭＦＰ３による処理が行われる。その場合の処理の流れは、前述の図１７のフローチャートと同一である。
【００９０】
こうしてＭＦＰ３は、図１５に示すような、ＭＦＰ２が処理したドキュメントデータを受信して処理を実行する。ここでＭＦＰ３は、前述したように、言語、仕向けとも日本語、日本向けの設定であり、更にＯＣＲ能力がＭＦＰ１、ＭＦＰ２よりも優れているもの（Level 3）である。そのため、ＭＦＰ２が正確に文字認識できなかった原稿１３０１の文字領域１３０３内の文字を正しく認識することができる。そのため図１７のステップＳ２５では、領域内の文字を正しく認識でき、ＯＣＲ処理結果に誤認識が含まれている可能性が高くないと判断してステップＳ２６に進む。ステップＳ２６では、ステップＳ２４のＯＣＲ結果を用いて文字のベクタライズとメタデータを生成する。更にステップＳ２７に進み、その文字領域１３０３のメタデータに付加された「誤認識の可能性あり」及び「ヒントとしてビットマップ画像付き」のメタデータを消去するとともに、ヒントのビットマップ画像本体も削除する。
【００９１】
図１６は、こうして最終的にＭＦＰ３が作成したドキュメントデータの一例を示す図である。尚、図１６において、前述の図１４，図１５と共通する部分は同じ記号で示している。
【００９２】
図１６では、図１４，図１５に示すＭＦＰ１及びＭＦＰ２が正確に文字認識できなかった原稿１３０１の文字領域１３０３の文字が正確に文字認識され、ベクタデータ１６０１，１６０２、及びメタデータ１６０３が正しく生成されている。これによって、ＭＦＰ１、ＭＦＰ２で処理したドキュメントデータの文字領域１３０３の検索も、このドキュメントのメタデータを用いて正確に行うことができることがわかる。
【００９３】
以上説明したように本実施の形態によれば、あるＭＦＰでは適切なＯＣＲ処理結果が得られない場合でも、そのドキュメントデータをより能力が高いＯＣＲ機能を有するＭＦＰ３に送信して処理することにより、より適切なＯＣＲ処理結果を得ることができる。
【００９４】
なお、本発明は、前述した実施形態の機能を実現するソフトウェアのプログラムを、システム或いは装置に直接或いは遠隔から供給し、そのシステム或いは装置のコンピュータが該供給されたプログラムを読み出して実行することによっても達成され得る。その場合、プログラムの機能を有していれば、形態は、プログラムである必要はない。
【００９５】
従って、本発明の機能処理をコンピュータで実現するために、該コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明のクレームでは、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、ＯＳに供給するスクリプトデータ等、プログラムの形態を問わない。
【００９６】
プログラムを供給するための記録媒体としては、様々なものが使用できる。例えば、フロッピー（登録商標）ディスク、ハードディスク、光ディスク、光磁気ディスク、ＭＯ、ＣＤ−ＲＯＭ、ＣＤ−Ｒ、ＣＤ−ＲＷ、磁気テープ、不揮発性のメモリカード、ＲＯＭ、ＤＶＤ（ＤＶＤ−ＲＯＭ，ＤＶＤ−Ｒ）などである。
【００９７】
その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページに接続し、該ホームページからハードディスク等の記録媒体にダウンロードすることによっても供給できる。その場合、ダウンロードされるのは、本発明のコンピュータプログラムそのもの、もしくは圧縮され自動インストール機能を含むファイルであってもよい。また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。
【００９８】
また、本発明のプログラムを暗号化してＣＤ−ＲＯＭ等の記憶媒体に格納してユーザに配布する形態としても良い。その場合、所定の条件をクリアしたユーザに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせ、その鍵情報を使用することにより暗号化されたプログラムが実行可能な形式でコンピュータにインストールされるようにする。
【００９９】
また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される形態以外の形態でも実現可能である。例えば、そのプログラムの指示に基づき、コンピュータ上で稼動しているＯＳなどが、実際の処理の一部又は全部を行い、その処理によっても前述した実施形態の機能が実現され得る。
【０１００】
更に、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれるようにしてもよい。この場合、その後で、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるＣＰＵなどが実際の処理の一部又は全部を行い、その処理によって前述した実施形態の機能が実現される。
【図面の簡単な説明】
【０１０１】
【図１】本実施の形態に係る画像処理装置（複合機）の構成を示す図である。
【図２】本実施の形態に係る画像処理システムの全体的な構成を示すブロック図である。
【図３】本実施の形態に係る画像処理装置（複合機）の制御部の構成例を示すブロック図である。
【図４】本実施の形態に係る画像処理装置の動作を制御するソフトウェアの構成を示すブロック図である。
【図５】スキャナ部が原稿を走査して読み取ったデータに基づいてドキュメントを生成し、コピー動作やボックス保存を行う場合のデータの流れを示す図である。
【図６】図５のメタデータ生成処理ｄ４の具体的な処理の流れを示す図である。
【図７】入力画像の領域分割を行った場合の一例を示す図である。
【図８】ドキュメントのデータ構造を説明する図である。
【図９】図８で説明したデータ構造がメモリやファイルにどう配置されるのかを示す図である。
【図１０】本実施の形態で処理される、例えば１００ページからなるドキュメントデータの具体例を示す図である。
【図１１】本実施の形態に係る画像処理装置（ＭＦＰ）間でドキュメントを転送する場合のシステム構成図である。
【図１２】本実施の形態に係る画像処理装置において原稿を読み取ってＯＣＲ処理を実行してドキュメントを生成する処理を説明するフローチャートである。
【図１３】スキャンする原稿１３０１の一例を示す図である。
【図１４】本実施の形態に係る画像処理装置の一例であるＭＦＰ１でのスキャンで得られるドキュメントデータを説明する図である。
【図１５】実施の形態に係るＭＦＰ２のＯＣＲ処理の結果認識されたベクタデータ及びメタデータの一例を示す図である。
【図１６】実施の形態に係るＭＦＰ２が作成したドキュメントデータの一例を示す図である。
【図１７】本実施の形態に係る画像処理装置が、他の画像処理装置から転送されたドキュメントデータにＯＣＲ処理を実行する処理を説明するフローチャートである。

【特許請求の範囲】
【請求項１】
画像に含まれる文字領域を識別する識別手段と、
前記識別手段により識別された文字領域に含まれる画像データに基づいて、文字認識処理を実行する文字認識手段と、
前記文字認識処理の処理結果を出力する第１の出力手段と、
前記文字認識処理の処理結果に誤認識が含まれている可能性が高いか否かを判定する判定手段と、
前記判定手段により、前記文字認識処理の処理結果に誤認識が含まれている可能性が高いと判定された場合に、前記文字認識処理の処理結果に誤認識が含まれている可能性が高いことを示す第１の情報とともに、前記文字認識処理の処理結果を出力するよう制御する制御手段と、
を有することを特徴とする画像処理装置。
【請求項２】
前記画像の少なくとも一部の領域を解像度に依存しない解像度非依存データに変換する変換処理を実行する変換手段を更に備え、
前記第１の出力手段は、前記文字認識処理の処理結果を、前記変換処理により得られた解像度非依存データの付加情報として、当該解像度非依存データに付加して出力することを特徴とする請求項１に記載の画像処理装置。
【請求項３】
前記判定手段は、前記文字認識手段の文字認識能力に基づいて、前記判定を行うことを特徴とする請求項１又は２に記載の画像処理装置。
【請求項４】
前記判定手段は、前記文字認識手段が認識可能な言語に基づいて、前記判定を行うことを特徴とする請求項１又は２に記載の画像処理装置。
【請求項５】
前記文字認識処理の処理結果に代えて、当該文字認識処理を実行した画像データに、当該画像データが文字を含むことを示す第２の情報を付加して出力する第２の出力手段を更に備えることを特徴とする請求項１乃至４のいずれか１項に記載の画像処理装置。
【請求項６】
前記第１の出力手段に前記文字認識処理の処理結果を出力させるか、又は前記第２の出力手段に前記画像データを出力させるかを選択するための指示を入力可能なインタフェース手段を更に有することを特徴とする請求項５に記載の画像処理装置。
【請求項７】
ネットワークを介して接続された少なくとも第１と第２の画像処理装置を含む画像処理システムであって、
前記第１の画像処理装置は、
画像に含まれる文字領域を識別する識別手段と、
前記識別手段により識別された文字領域に含まれる画像データに基づいて、第１の文字認識処理を実行する第１の文字認識手段と、
前記第１の文字認識処理の処理結果を出力する出力手段と、
前記第１の文字認識処理の処理結果に誤認識が含まれている可能性が高いか否かを判定する判定手段と、
前記判定手段により、前記第１の文字認識処理の結果に誤認識が含まれている可能性が高いと判定された場合に、前記第１の文字認識処理の処理結果に誤認識が含まれている可能性が高いことを示す第１の情報とともに、前記第１の文字認識処理の処理結果を出力するよう制御する制御手段とを備え、
前記第２の画像処理装置は、
前記第１の画像処理装置から出力された前記第１の文字認識処理の処理結果を取得する取得手段と、
前記第１の文字認識手段よりも文字認識能力が高い文字認識手段であって、第２の文字認識処理を実行する第２の文字認識手段とを備え、
前記第２の文字認識手段は、前記取得手段で取得した前記第１の文字認識処理の処理結果に前記第１の情報が含まれている場合に、前記第１の文字認識処理を実行した画像データに対して前記第２の文字認識処理を実行することを特徴とする画像処理システム。
【請求項８】
画像に含まれる文字領域を識別する識別工程と、
前記識別工程で識別された文字領域に含まれる画像データに基づいて、文字認識処理を実行する文字認識工程と、
前記文字認識処理の処理結果を出力する第１の出力工程と、
前記文字認識処理の処理結果に誤認識が含まれている可能性が高いか否かを判定する判定工程と、
前記判定工程において、前記文字認識処理の処理結果に誤認識が含まれている可能性が高いと判定された場合に、前記文字認識処理の処理結果に誤認識が含まれている可能性が高いことを示す第１の情報とともに、前記文字認識処理の処理結果を出力するよう制御する制御工程と、
を有することを特徴とする画像処理装置における画像処理装置の制御方法。
【請求項９】
前記画像の少なくとも一部の領域を解像度に依存しない解像度非依存データに変換する変換処理を実行する変換工程を更に備え、
前記第１の出力工程では、前記文字認識処理の処理結果を、前記変換処理により得られた解像度非依存データの付加情報として、当該解像度非依存データに付加して出力することを特徴とする請求項８に記載の画像処理装置の制御方法。
【請求項１０】
前記文字認識処理の処理結果に代えて、当該文字認識処理を実行した画像データに、当該画像データが文字を含むことを示す第２の情報を付加して出力する第２の出力工程を更に備えることを特徴とする請求項８又は９に記載の画像処理装置の制御方法。
【請求項１１】
前記第１の出力工程で前記文字認識処理により得られた結果を出力させるか、又は前記第２の出力工程で前記画像データを出力させるかを選択する選択工程を更に有することを特徴とする請求項１０に記載の画像処理装置の制御方法。

【図１】