説明

画像処理装置及びプログラム

【課題】文字が混在している構成要素を含む文書を画像として読み取ることで得られた画像データから、文書データとして、文字やその周辺の見栄えが維持され文字コードデータの利用性も確保されたデータを生成する。
【解決手段】文書を画像として読み取り、文書を構成する個々のオブジェクト(写真や文字、CG等)をオブジェクト種に応じた形式のデータで文書ファイルを生成するにあたり、文字が混在しているオブジェクトに対し、当該文字混在オブジェクトと混在している文字を表示する文字ボックスの何れを前面に配置するかを、文字混在オブジェクトに混在している文字に対する文字認識の確度(98,100)、文字のサイズ(102〜106)、文字混在オブジェクト内の文字数及び行数(108〜112)、文字の明度(114,116)、文字背景色の明度及び明度の分散(118〜122)の各々を対応する判定閾値(th1〜th8の何れか)と比較することで判定する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は画像処理装置及び画像処理プログラムに関する。
【背景技術】
【0002】
特許文献1には、文書処理において、文字を含む入力多値画像データから2値画像データを作成し、作成した2値画像データから文字コードと文字位置を認識し、認識した文字の位置データを用いて多値画像から文字を除去し、文字を除去した画像データとコード化された文字データとを重ねて配置した合成画像を出力する技術が開示されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2001−358925号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
本発明は、文字が混在している構成要素を含む文書を画像として読み取ることで得られた画像データから、前記文書を表す文書データとして、文字やその周辺の見栄えが維持され文字コードデータの利用性も確保されたデータを生成できる画像処理装置及び画像処理プログラムを得ることが目的である。
【課題を解決するための手段】
【0005】
上記目的を達成するために請求項1記載の発明に係る画像処理装置は、文字が混在している構成要素を含む文書を画像として読み取ることで得られた画像データに基づき、前記構成要素に混在している前記文字に対して文字認識を行う文字認識手段と、前記文書を表し、前記文字が混在している状態の前記構成要素を表す第1データと、前記文字認識手段によって認識された文字の文字コードデータを含み、当該文字コードデータが表す前記文字を表示する文字ブロックを表す第2データと、を含んだ文書データの生成にあたり、当該文書データが表す文書が表示される際に、前記第2データが表す文字ブロックを前記第1データが表す前記構成要素の背面に隠蔽させるか、前記第2データが表す文字ブロックを前記第1データが表す前記構成要素の前面に表示させるかを、前記構成要素のうち前記文字の周囲の背景領域の明度又は明度の分散、前記構成要素中の前記文字の文字数又は行数、前記構成要素のうち前記文字の領域の明度、前記文字認識手段による前記文字認識の確度、前記構成要素中の前記文字の大きさ、及び、前記構成要素の種別の少なくとも1つに基づいて判定する判定手段と、前記判定手段による判定結果に従って、前記文書が表示される際の前記文字ブロックと前記構成要素との表示の前後関係を設定した前記文書データを生成する生成手段と、を含んで構成されている。
【0006】
請求項2記載の発明は、請求項1記載の発明において、前記判定手段は、前記構成要素のうち前記文字の周囲の背景領域の明度が第1閾値未満、又は、前記文字の周囲の背景領域の明度の分散が第2閾値以上の場合に、前記文字ブロックを前記構成要素の背面に隠蔽させると判定する。
【0007】
請求項3記載の発明は、請求項1又は請求項2記載の発明において、前記判定手段は、前記構成要素中の前記文字の文字数が第3閾値以上、又は、前記構成要素中の前記文字の行数が第4閾値以上の場合に、前記文字ブロックを前記構成要素の背面に隠蔽させると判定する。
【0008】
請求項4記載の発明は、請求項1〜請求項3の何れかに記載の発明において、前記判定手段は、前記構成要素のうち前記文字の領域の明度が第5閾値以上の場合に、前記文字ブロックを前記構成要素の前面に表示させると判定する。
【0009】
請求項5記載の発明は、請求項1〜請求項4の何れかに記載の発明において、前記判定手段は、前記文字認識手段による前記文字認識の確度が第6閾値未満の場合に、前記文字ブロックを前記構成要素の背面に隠蔽させると判定する。
【0010】
請求項6記載の発明は、請求項1〜請求項5の何れかに記載の発明において、前記判定手段は、前記構成要素中の前記文字の大きさが第7閾値以上の場合に、前記文字ブロックを前記構成要素の背面に隠蔽させると判定する。
【0011】
請求項7記載の発明は、請求項1〜請求項6の何れかに記載の発明において、前記判定手段は、前記構成要素の種別が、前記文字ブロックを隠蔽させる種別として設定された種別である場合に、前記文字ブロックを前記構成要素の背面に隠蔽させると判定する。
【0012】
請求項8記載の発明は、請求項1〜請求項6の何れかに記載の発明において、前記判定手段は、前記構成要素中の前記文字の周囲の背景領域の明度又は明度の分散、前記構成要素中の前記文字の文字数又は行数、前記構成要素中の前記文字の領域の明度、前記文字認識手段による前記文字認識の確度、及び、前記構成要素中の前記文字の大きさの少なくとも1つを閾値と比較した結果に基づいて、前記文字ブロックを前記構成要素の背面に隠蔽させるか、前記文字ブロックを前記構成要素の前面に表示させるかを判定すると共に、前記構成要素の種別が前記文字ブロックを隠蔽させる種別として設定された種別である場合に、前記構成要素の種別が前記文字ブロックを隠蔽させる種別として設定された種別でない場合よりも、前記文字ブロックを前記構成要素の背面に隠蔽させると判定する確率が高くなるように前記閾値を予め変更する。
【0013】
請求項9記載の発明は、請求項1〜請求項8の何れかに記載の発明において、前記判定手段は、前記構成要素中の前記文字の周囲の背景領域の明度又は明度の分散、前記構成要素中の前記文字の文字数又は行数、前記構成要素中の前記文字の領域の明度、前記文字認識手段による前記文字認識の確度、前記構成要素中の前記文字の大きさ、及び、前記構成要素の種別の少なくとも1つを、記憶手段に記憶された閾値又は設定情報と比較し、比較結果に基づいて、前記文字ブロックを前記構成要素の背面に隠蔽させるか、前記文字ブロックを前記構成要素の前面に表示させるかを判定し、利用者から指示手段を介して前記閾値又は前記設定情報の変更が指示された場合に、利用者からの指示に応じて、記憶手段に記憶された前記閾値又は前記設定情報を変更する第1変更手段を更に備えている。
【0014】
請求項10記載の発明は、請求項1〜請求項9の何れかに記載の発明において、前記生成手段は、前記判定手段により前記文字ブロックを前記構成要素の背面に隠蔽させると判定された場合には、前記第2データとして、前記文字コードデータが表す前記文字及び前記文字の周囲の背景領域を予め指定された文字色、背景色で各々表示する文字ブロックを表すデータを生成し、前記判定手段により前記文字ブロックを前記構成要素の前面に表示させると判定された場合には、前記第2データとして、前記文字コードデータが表す前記文字及び前記文字の周囲の背景領域を、前記構成要素に混在している状態での前記文字の文字色又は前記背景領域の背景色と同一又は類似の色で各々表示する文字ブロックを表すデータを生成する。
【0015】
請求項11記載の発明は、請求項10記載の発明において、前記判定手段により前記文字ブロックを前記構成要素の背面に隠蔽させると判定された場合の前記文字ブロックの前記文字色及び前記背景色を指定する色指定情報が記憶手段に予め記憶されており、前記判定手段により前記文字ブロックを前記構成要素の背面に隠蔽させると判定された場合の前記文字ブロックの前記文字色及び前記背景色の少なくとも一方の変更が指示手段を介して利用者から指示された場合に、利用者からの指示に応じて前記色指定情報を変更する第2変更手段を更に備えている。
【0016】
請求項12記載の発明は、請求項1〜請求項11の何れかに記載の発明において、利用者からの、前記判定手段による判定結果が特定の判定結果のときに、前記文書データからの前記第2データの除去を指示する除去指示情報の入力を受け付ける入力受付手段を更に備え、前記生成手段は、前記入力受付手段によって前記除去指示情報の入力が受け付けされ、かつ前記判定手段による判定結果が前記除去指示情報に規定された特定の判定結果に合致した場合には、前記文書データとして前記第2データを除去したデータを生成する。
【0017】
請求項13記載の発明は、請求項12記載の発明において、前記生成手段は、前記文書データとして前記第2データを除去したデータを生成する場合、前記構成要素に混在している状態での前記文字を画像として表す文字画像データを生成し、前記文書データとして、生成した前記文字画像データを含み、前記文書が表示される際に前記文字画像データが表す文字画像が前記構成要素の前面に表示されるように、前記文書が表示される際の前記文字画像と前記構成要素との表示の前後関係を設定したデータを生成する。
【0018】
請求項14記載の発明は、請求項1〜請求項13の何れかに記載の発明において、少なくとも前記第1データは、任意の情報を前記構成要素の属性情報として設定可能なフォーマットであり、前記文字認識手段によって認識された文字の文字コードデータを前記構成要素の属性情報として前記第1データに設定する属性設定手段を更に備えている。
【0019】
請求項15記載の発明に係る画像処理プログラムは、コンピュータを、文字が混在している構成要素を含む文書を画像として読み取ることで得られた画像データに基づき、前記構成要素に混在している前記文字に対して文字認識を行う文字認識手段、前記文書を表し、前記文字が混在している状態の前記構成要素を表す第1データと、前記文字認識手段による文字認識で認識された文字の文字コードデータを含み当該文字コードデータが表す前記文字を表示する文字ブロックを表す第2データと、を含んだ文書データの生成にあたり、当該文書データが表す文書が表示される際に、前記第2データが表す文字ブロックを前記第1データが表す前記構成要素の背面に隠蔽させるか、前記第2データが表す文字ブロックを前記第1データが表す前記構成要素の前面に表示させるかを、前記構成要素のうち前記文字の周囲の背景領域の明度又は明度の分散、前記構成要素中の前記文字の文字数又は行数、前記構成要素のうち前記文字の領域の明度、前記文字認識手段による前記文字認識の確度、前記構成要素中の前記文字の大きさ、及び、前記構成要素の種別の少なくとも1つに基づいて判定する判定手段、及び、前記判定手段による判定結果に従って前記文書が表示される際の前記文字ブロックと前記構成要素との表示の前後関係を設定した前記文書データを生成する生成手段として機能させる。
【発明の効果】
【0020】
請求項1,15記載の発明は、文字が混在している構成要素を含む文書を画像として読み取ることで得られた画像データから、前記文書を表す文書データとして、文字やその周辺の見栄えが維持され文字コードデータの利用性も確保されたデータを生成できる、という効果を有する。
【0021】
請求項2〜7記載の発明は、本構成を有していない場合と比較して、文書データが表す文書が表示される際の、文字ブロックと文字が混在している状態の構成要素との表示の前後関係を、簡単な判定により適正に決定できる、という効果を有する。
【0022】
請求項8記載の発明は、文書データが表す文書が表示される際の、文字ブロックと文字が混在している状態の構成要素との表示の前後関係の判定に、構成要素の種別とそれ以外のパラメータを併用する場合に、簡易な処理により、構成要素の種別に基づく前後関係の判断を、それ以外のパラメータに基づく前後関係の判断に反映させることができる、という効果を有する。
【0023】
請求項9記載の発明は、文書データが表す文書が表示される際の、文字ブロックと文字が混在している状態の構成要素との表示の前後関係の判定の基準を、利用者の好みに応じて変更調整することが可能になる、という効果を有する。
【0024】
請求項10記載の発明は、文書データが表す文書が表示される際に、文字ブロックが構成要素の背面に隠蔽される場合及び文字ブロックが構成要素の前面に表示される場合の各々について、文字ブロックの文字色及び背景色を最適化できる、という効果を有する。
【0025】
請求項11記載の発明は、文書データが表す文書が表示される際に、文字ブロックが構成要素の背面に隠蔽される場合の文字ブロックの文字色及び背景色を、利用者の好みに応じて変更することが可能になる、という効果を有する。
【0026】
請求項12記載の発明は、文書データが表す文書が表示される際の、文字ブロックと文字が混在している状態の構成要素との表示の前後関係が特定の関係のときに、文字ブロックを表す第2データを含まない文書データを生成させることを、利用者が指示することが可能となる、という効果を有する。
【0027】
請求項13記載の発明は、利用者の指示により、文字ブロックを表す第2データを含まない文書データを生成する場合に、文字コードデータに代えて利用者による文字画像データの利用が可能になる、という効果を有する。
【0028】
請求項14記載の発明は、第1データが任意の情報を構成要素の属性情報として設定可能なフォーマットである場合に、第2データに含まれる文字コードデータに代えて、構成要素の属性情報として第1データに設定された文字コードデータを利用することが可能になる、という効果を有する。
【図面の簡単な説明】
【0029】
【図1】実施形態に係るコンピュータ・システムの概略構成を示すブロック図である。
【図2】読取・ファイル化処理の内容を示すフローチャートである。
【図3】前後判定処理の内容を示すフローチャートである。
【図4】文書ファイル生成処理の内容を示すフローチャートである。
【図5】設定変更処理の内容を示すフローチャートである。
【図6】文字認識処理における文字色及び背景色の判別を説明するためのイメージ図である。
【図7】文字混在オブジェクトのオブジェクト種に基づく文字ボックスの前面/背面判定(閾値変更)を説明するための概念図である。
【図8】文字認識の確度に基づく文字ボックスの前面/背面判定を説明するための概念図である。
【図9】文字のフォントサイズに基づく文字ボックスの前面/背面判定を説明するための概念図である。
【図10】文字の文字数・行数に基づく文字ボックスの前面/背面判定を説明するための概念図である。
【図11】文字の明度に基づく文字ボックスの前面/背面判定を説明するための概念図である。
【図12】文字の背景色の明度及び背景明度の分散に基づく文字ボックスの前面/背面判定を説明するための概念図である。
【発明を実施するための形態】
【0030】
以下、図面を参照して本発明の実施形態の一例を詳細に説明する。図1には、本実施形態に係るコンピュータ・システム10の概略構成が示されている。コンピュータ・システム10は、LAN等から成るネットワーク12に、画像読取印刷装置14と、PC(Personal Computer:パーソナル・コンピュータ)等から成る複数台の端末装置24と、が各々接続されて構成されている。
【0031】
画像読取印刷装置14は、複写機としての機能や、プリンタとしての機能、スキャナとしての機能を兼ね備えた装置で構成することができ、マイクロコンピュータ等から成りCPU16A、メモリ16B、HDD(Hard Disk Drive)やフラッシュメモリ等から成る不揮発性の記憶部16C及びネットワークI/F(インタフェース)部16Dを内蔵した本体制御部16を備えている。また本体制御部16には、セットされた読取対象の文書(紙原稿)を光学的に読み取って読取画像データを出力する画像読取部18、入力された印刷画像データが表す画像を記録用紙に印刷する画像印刷部20、及び、LCD等から成る表示部22A及びテンキーやタッチパネル等から成る操作部22Bが設けられた操作パネル22が各々接続されている。
【0032】
本体制御部16のネットワークI/F部16Dはネットワーク12に接続され、端末装置24とのネットワーク12経由での通信を司る。また本体制御部16の記憶部16Cには、CPU16Aによって実行されるプログラムとして、画像読取印刷装置14の各部の動作を制御して利用者(ユーザ)に各種のサービス(例えば文書の複写、プリント(端末装置24から受信した文書データが表す文書の印刷)、を提供するための本体制御プログラムと、CPU16Aによって後述する読取・ファイル化処理を行うための読取・ファイル化プログラムが各々インストールされている。
【0033】
なお、上記の読取・ファイル化プログラムは本発明に係る画像処理プログラムの一例であり、本実施形態では、画像読取印刷装置14の本体制御部16のCPU16Aによって上記の読取・ファイル化プログラムが実行されることで、画像読取印刷装置14が本発明に係る画像処理装置として機能する。
【0034】
また、個々の端末装置24はCPU24A、メモリ24B、HDDやフラッシュメモリ等から成る不揮発性の記憶部24C、ネットワークI/F部24Dを備えており、ネットワークI/F部24Dを介してネットワーク12に接続されている。また、端末装置24には、ディスプレイ26、キーボード28及びマウス30が各々接続されている。
【0035】
次に本実施形態の作用として、画像読取印刷装置14の本体制御部16のCPU16Aによって読取・ファイル化プログラムが実行されることで実現される読取・ファイル化処理について、図2を参照して説明する。なお、この読取・ファイル化処理は、画像読取部18に読取対象の原稿(文書)がセットされた状態で、操作パネル22の操作部22Bを介し、原稿(文書)の読み取り、及び、読取結果に基づく原稿(文書)の文書ファイルの生成・出力(「スキャンtoファイル」サービスの実行)が利用者から指示されると実行される。
【0036】
読取・ファイル出力処理では、まずステップ40において、画像読取部18にセットされた原稿(文書)が画像読取部18により画像として読み取られ、当該読み取りによって得られた文書の読取結果を表す画像データ(例えばビットマップ形式の画像データ)が記憶部16Cに記憶される。次のステップ42では、記憶部16Cに記憶された画像データに基づき、読取文書の画像を、文字や写真、イラスト(CG)、表、線画等の各種オブジェクト(構成要素)に分離・抽出するオブジェクト分離処理を行う。
【0037】
このオブジェクト分離処理は、例えば特開2006−203582号公報や特開2006−203583号公報等に開示されているように、画像を複数個のブロックに分割し、各ブロック毎に作成したL*a*b*色空間でのL*,a*,b*のヒストグラムの形状、或いは、各ブロック毎のL*,a*,b*の分散値や平均値等に基づいて、各ブロックを複数のカテゴリ(例えば「カラー絵柄ブロック」「カラー文字及び周辺の下地ブロック」「モノクロ絵柄ブロック」「モノクロ文字及び周辺の下地ブロック」「モノクロ下地ブロック」及び「属性不明ブロック」等)の何れかに分類し、同一のカテゴリに分類した隣り合うブロックを単一の領域に統合する技術を適用することで、読取文書の画像を互いにカテゴリの異なる複数の領域(構成要素)に分離することで実現することができる。
【0038】
ステップ44では、ステップ42のオブジェクト分離処理によって読取文書の画像から個々のオブジェクトを対象として、オブジェクト中に存在している文字を探索し、当該探索で抽出された文字に対してパターンマッチングを行う等により、抽出された文字の文字コードデータやフォント種、フォントサイズ、位置等を判別する文字認識処理を行う。これにより、オブジェクト種が「文字」のオブジェクト(文字のみから成るオブジェクト)のオブジェクト種が「文字」中に存在している文字のみならず、「写真」や「CG」「表」等のように「文字」以外のオブジェクト種のオブジェクトの中に混在している文字に対しても文字認識が行われ、文字コードデータやフォント種、フォントサイズ等が判別されることになる。また、例として図6に示すように、上記の文字認識処理では、文字の色及び背景領域の色(個々の文字を囲む矩形領域内のうち文字以外の領域の色)も個々の文字毎に判別される。
【0039】
ステップ46では、ステップ44における文字認識処理の結果に基づき、読取文書の画像の中に、オブジェクト種が「文字」以外でかつ文字が混在しているオブジェクト(文字認識処理で文字が抽出されたオブジェクト)が存在していたか否か判定する。この判定が否定された場合はステップ50へ移行するが、また、ステップ46の判定が肯定された場合はステップ48へ移行し、文書ファイルが表す文書が表示されたときに、文字が混在しているオブジェクトと、文字認識処理で認識された文字を表示する文字ボックス(本発明に係る文字ブロックの一例)の何れを前面に配置するかを判定する前後判定処理を行った後にステップ50へ移行する。なお、上記の前後判定処理については後述する。またステップ50では、読取文書を表す文書ファイルを生成する文書ファイル生成処理を行うが、この文書ファイル生成処理についても後述する。そしてステップ52では、文書ファイル生成処理で生成された文書ファイルを利用者から予め指定された転送先(例えば利用者が操作する端末装置24)へ転送したり、電子メールに添付して送信する等によって出力し、読取・ファイル出力処理を終了する。
【0040】
ところで、特許文献1に記載の技術では、画像中に混在している文字に対して文字認識を行うと共に前記文字を画像から除去し、文字を除去した画像の前面に、文字認識で認識された文字コードが表す文字を配置した合成画像を出力している。しかし、この技術では、文字を除去した部分の画像(文字混在オブジェクト)が写真画像であった場合、文字を除去した部分の色や濃度を、写真画像に不自然さが生じないように設定することは困難であるので、文字混在オブジェクト(写真画像)の利用性が低下する。また、画像(文字混在オブジェクト)中に混在している文字のサイズや文字数、行数、或いは前記文字に対する文字認識の確度等によっては、文字混在オブジェクト(写真画像)の前面に配置する文字と、文字混在オブジェクト(写真画像)の文字を除去した部分とに位置ずれが生ずる。
【0041】
本実施形態に係る前後判定処理は、文書ファイルが表す文書が表示されたときに、文字混在オブジェクトと文字ボックスの何れを前面に配置するかを、上記を考慮して判定するものであり、以下、図3を参照して本実施形態に係る前後判定処理を説明すると、まずステップ90では、読取・ファイル化処理(図2)のステップ42のオブジェクト分離処理で読取文書から分離抽出されたオブジェクトの中から、文字混在オブジェクト(ファイル化処理(図2)のステップ44の文字認識処理で文字が抽出されたオブジェクト)であり、かつ次のステップ90以降の処理が未処理の単一のオブジェクトを、処理対象の文字混在オブジェクトとして選択する。
【0042】
次のステップ92では、処理対象の文字混在オブジェクトが、文字ボックス隠蔽対象のオブジェクト種か否か判定する。本実施形態では、前後判定処理における前後判定(文字混在オブジェクトと文字ボックスの何れを前面に配置するかの判定)で用いる判定基準を表す判定基準情報が記憶部16Cに記憶されているが、この判定基準情報の中には、文字ボックスの配置位置が文字混在オブジェクトの背面と前面の何れが望ましいかを個々のオブジェクト種毎に規定する配置規定情報が含まれている。ステップ92の判定は、処理対象の文字混在オブジェクトのオブジェクト種を配置規定情報と照合し、処理対象の文字混在オブジェクトのオブジェクト種に対する文字ボックスの望ましい配置位置が「背面」か否かを判断することで実現される。
【0043】
なお、例として図7に示すように、オブジェクト種が「CG」の文字混在オブジェクトは文字の背景色が単一の色であることが多く、この種の文字混在オブジェクトの前面に文字ブロック(例えば図7に示すように「2008/08/12」なる文字列を表示する文字ブロックや、「Today's Topic」なる文字列を表示する文字ブロック)を配置しても見栄えが悪化することはなく、文字ブロックを前面に配置することで文字ブロックに表示されている文字列の文字コードデータの再利用性が向上する。一方、同じく図7に示すように、オブジェクト種が「写真」の文字混在オブジェクトは文字の背景色が様々な色・明度(濃度)から成り、この種の文字混在オブジェクトの前面に文字ブロック(例えば図7に示すように「8月11日 庭で撮影」なる文字列を表示する文字ブロック)を配置すると、見栄えが悪化することになる。
【0044】
このため、配置規定情報は、例えばオブジェクト種が「CG」の文字混在オブジェクトに対しては、文字ボックスの望ましい配置位置が「前面」となり、オブジェクト種が「写真」の文字混在オブジェクトに対しては、文字ボックスの望ましい配置位置が「背面」となるように初期値(デフォルト)が設定されている。なお、本実施形態では配置規定情報の内容を利用者が変更可能とされている(詳細は後述)。
【0045】
前述の判定基準情報には8種類の判定閾値th1〜th8が含まれており、ステップ92の判定が否定された場合はステップ94へ移行し、記憶部16Cから判定閾値th1〜th8を読み出してメモリ16Bに記憶させ、ステップ98へ移行する。一方、ステップ92の判定が肯定された場合はステップ96へ移行し、記憶部16Cから判定閾値th1〜th8を読み出してメモリ16Bに記憶させた後に、判定閾値th1〜th8のうち、或るパラメータの値が判定閾値以上の場合に「背面」と判定される判定閾値については値を減少させる一方、或るパラメータの値が判定閾値未満の場合に「背面」と判定される判定閾値については値を増加させ、ステップ98へ移行する。これにより、ステップ92の判定が否定された場合よりも、文字ボックスが処理対象の文字混在オブジェクトの背面に隠蔽される確率が高くなるように判定閾値th1〜th8の値が変更される。
【0046】
なお、上記のステップ92〜ステップ96は請求項8に記載の判定手段による処理の一例である。また、上記のステップ94,96の処理に代えて、配置規定情報に規定されている文字ボックスの望ましい配置位置が「背面」の場合は記憶部16Cに記憶されている判定閾値th1〜th8をそのまま用い、配置規定情報に規定されている文字ボックスの望ましい配置位置が「前面」の場合は、記憶部16Cに記憶されている判定閾値th1〜th8の値を、文字ボックスが処理対象の文字混在オブジェクトの前面に配置される確率が高くなるように変更してもよいし、配置規定情報に規定されている文字ボックスの望ましい配置位置が「背面」の場合及び「前面」の場合に、記憶部16Cに記憶されている判定閾値th1〜th8の値を各々変更する(逆方向へ変更する)ようにしてもよい。
【0047】
ステップ98では、処理対象の文字混在オブジェクトに混在している文字に対する文字認識処理(図2のステップ44)で算出された文字認識の確度を取得する。なお、文字認識の確度は個々の文字毎に算出されるので、ステップ98では、処理対象の文字混在オブジェクトに混在している全ての文字について文字認識の確度を各々取得し、処理対象の文字混在オブジェクトに対する文字認識の確度として、取得した確度の平均値を演算するか、又は、取得した確度の最小値を演算する。次のステップ100では、ステップ98で取得した処理対象の文字混在オブジェクトに対する文字認識の確度が、メモリ16Bに記憶されている8種類の判定閾値th1〜th8のうちの文字認識の確度に関する判定閾値th6未満か否か判定する。なお、本実施形態では判定閾値th6についても利用者が任意に変更可能とされている(詳細は後述)。
【0048】
文字ブロックには文字認識処理で認識された文字コードデータが表す文字(列)が表示されるが、ステップ100の判定が否定された場合、例として図8(B)に示すように、文字ブロックに表示されている文字(列)が処理対象の文字混在オブジェクトに混在している文字(列)と相違している可能性がある(例えば図8(B)に示す例では、処理対象の文字混在オブジェクトに文字列「あいうえお」が混在しているのに対し、文字ブロックには文字列「ありうえあ」が表示されており、両者は相違している)。このため、ステップ100の判定が肯定された場合はステップ124へ移行し、文字ボックスの配置位置を処理対象の文字混在オブジェクトの「背面」と判定し、ステップ128へ移行する。
【0049】
一方、ステップ100の判定が肯定された場合は、例として図8(A)に示すように、文字ブロックに表示されている文字(列)が処理対象の文字混在オブジェクトに混在している文字(列)と一致している可能性が高いので、文字ボックスの配置位置を処理対象の文字混在オブジェクトの「背面」と判定することなくステップ124へ移行する。なお、上記のステップ98,100は請求項5に記載の判定手段による処理の一例である。
【0050】
ステップ102では、処理対象の文字混在オブジェクトに混在している文字に対する文字認識処理(図2のステップ44)で認識された文字のサイズを取得する。なお、文字のサイズについても個々の文字毎に算出されるので、ステップ102では、処理対象の文字混在オブジェクトに混在している全ての文字について文字のサイズを各々取得し、処理対象の文字混在オブジェクトに混在している文字のサイズとして、取得したサイズの最大値を演算する。次のステップ104では、ステップ102で取得した処理対象の文字混在オブジェクトに混在している文字のサイズが、メモリ16Bに記憶されている8種類の判定閾値th1〜th8のうち文字のサイズに関する判定閾値(大サイズ側の判定閾値)th7以上か否か判定する。
【0051】
例として図9にも示すように、処理対象の文字混在オブジェクトに混在している文字のサイズが大きい場合(一例として18pt以上の場合)、文字認識処理における認識結果の若干のずれやフォント種の違いにより、処理対象の文字混在オブジェクトに混在している文字(列)に対して文字ブロックに表示されている文字(列)のずれが生じ易い。このため、ステップ104の判定が肯定された場合はステップ124へ移行し、文字ボックスの配置位置を処理対象の文字混在オブジェクトの「背面」と判定し、ステップ128へ移行する。なお、ステップ104は請求項6に記載の判定手段による処理の一例である。
【0052】
また、ステップ104の判定が否定された場合はステップ106へ移行し、ステップ102で取得した処理対象の文字混在オブジェクトに混在している文字のサイズが、メモリ16Bに記憶されている8種類の判定閾値th1〜th8のうち文字のサイズに関する判定閾値(小サイズ側の判定閾値)th8未満か否か判定する。例として図9にも示すように、処理対象の文字混在オブジェクトに混在している文字のサイズが何れも小さい場合(一例として6pt以下の場合)、処理対象の文字混在オブジェクトに混在している文字(列)に対して文字ブロックに表示されている文字(列)のずれは生じ難いので、ステップ106の判定が肯定された場合はステップ126へ移行し、文字ボックスの配置位置を処理対象の文字混在オブジェクトの「前面」と判定し、ステップ128へ移行する。
【0053】
また、ステップ104,106の判定が何れも否定された場合はステップ108へ移行する。なお、本実施形態では上記の判定閾値th7,th8についても利用者が変更可能とされている(詳細は後述)。また、上記のステップ102〜106は請求項6に記載の判定手段による処理の一例である。
【0054】
ステップ108では、文字認識処理(図2のステップ44)で認識された、処理対象の文字混在オブジェクトに混在している文字の文字数及び行数を取得する。次のステップ110では、ステップ108で取得した処理対象の文字混在オブジェクトに混在している文字の文字数が、メモリ16Bに記憶されている8種類の判定閾値th1〜th8のうち文字数に関する判定閾値th3以上か否か判定する。また、ステップ110の判定が否定された場合はステップ112へ移行し、ステップ108で取得した処理対象の文字混在オブジェクトに混在している文字の行数が、メモリ16Bに記憶されている8種類の判定閾値th1〜th8のうち行数に関する判定閾値th4以上か否か判定する。
【0055】
例として図10(A)にも示すように、処理対象の文字混在オブジェクトに混在している文字の文字数や行数が多い場合(例えば文字数が50文字以上や行数が5行以上の場合)、フォントサイズや行間、フォント種の僅かな相違の影響で、処理対象の文字混在オブジェクトに混在している文字列に対して文字ブロックに表示されている文字列の行幅や文字幅がずれ易く、このずれにより、文字ブロックが処理対象の文字混在オブジェクトの範囲から逸脱して他のオブジェクトと一部重なる等の見栄えの悪化が生ずる。このため、ステップ110,112の何れかの判定が肯定された場合はステップ124へ移行し、文字ボックスの配置位置を処理対象の文字混在オブジェクトの「背面」と判定し(図10(B)も参照)、ステップ128へ移行する。
【0056】
なお、ステップ110,112の判定が何れも否定された場合はステップ114へ移行する。本実施形態では上記の判定閾値th3,th4についても利用者が変更可能とされている(詳細は後述)。また、上記のステップ108〜112は請求項3に記載の判定手段による処理の一例である。
【0057】
ステップ114では、処理対象の文字混在オブジェクトに混在している文字に対する文字認識処理(図2のステップ44)で判別された文字色を取得し、取得した文字色に基づいて、処理対象の文字混在オブジェクトに混在している文字色の明度を演算する。なお、文字色の明度は個々の文字毎に相違している可能性があるので、ステップ114では、処理対象の文字混在オブジェクトに混在している全ての文字について文字色の明度を各々演算し、処理対象の文字混在オブジェクトに混在している文字色の明度として、各文字毎に演算した明度の平均値を演算する。次のステップ116では、ステップ114で演算した処理対象の文字混在オブジェクトに混在している文字色の明度が、メモリ16Bに記憶されている8種類の判定閾値th1〜th8のうち文字の明度に関する判定閾値th5以上か否か判定する。
【0058】
オブジェクト種がCGのオブジェクトに混在している文字のベクトル化において、文字が背景よりも明度が高い場合には、例として図11に示すように、文字のエッジがギザギザになっている等のように、文字のエッジの再現性が損なわれて見栄えが悪化していることが多い。文字認識で明度の高い文字が認識されるのは、当該文字の背景色が単色の場合、すなわち文字混在オブジェクトのオブジェクト種が「CG」の場合であり、ステップ116の判定が肯定された場合は文字混在オブジェクトに混在している文字のエッジの再現性が損なわれている可能性が高いと判断できる。このため、ステップ116の判定が肯定された場合はステップ126へ移行し、文字ボックスの配置位置を処理対象の文字混在オブジェクトの「前面」と判定し、ステップ128へ移行する。
【0059】
なお、ステップ116の判定が否定された場合はステップ118へ移行する。本実施形態では判定閾値th5についても利用者が任意に変更可能とされている(詳細は後述)。また、上記のステップ114,116は請求項4に記載の判定手段による処理の一例である。
【0060】
ステップ118では、処理対象の文字混在オブジェクトに混在している文字に対する文字認識処理(図2のステップ44)で判別された背景色を取得し、取得した背景色に基づいて、処理対象の文字混在オブジェクトに混在している文字の背景色の明度及びその分散を各々演算する。なお、背景色の明度についても個々の文字毎に相違している可能性があるので、ステップ118では、処理対象の文字混在オブジェクトに混在している全ての文字について背景色の明度を各々演算し、処理対象の文字混在オブジェクトに混在している文字の背景色の明度として、各文字毎に演算した背景色の明度の中央値(各文字毎の背景色の明度を昇順又は降順に並べ替えたときに、順位が中央の明度値)を求める。なお、上記の中央値に代えて平均値を用いてもよい。また、背景色の明度の分散は、例えば次の(1)式を用いて算出することができる。
【0061】
【数1】

【0062】
但し、nは処理対象の文字混在オブジェクトに混在している文字の総数、Biはi番目の文字の背景色の明度、B0は処理対象の文字混在オブジェクトに混在している文字の背景色の明度の平均値である。
【0063】
次のステップ120では、ステッップ118で演算した処理対象の文字混在オブジェクトに混在している文字の背景色の明度が、メモリ16Bに記憶されている8種類の判定閾値th1〜th8のうち背景色の明度に関する判定閾値th1未満か否か判定する。また、ステップ120の判定が否定された場合はステップ122へ移行し、ステップ118で演算した処理対象の文字混在オブジェクトに混在している文字の背景色の明度の分散が、メモリ16Bに記憶されている8種類の判定閾値th1〜th8のうち背景色の明度の分散に関する判定閾値th2以上か否か判定する。
【0064】
処理対象の文字混在オブジェクトに混在している文字の背景色の明度が低い場合や、背景色の明度の分散が大きい場合は、例として図12(A)にも示すように、処理対象の文字混在オブジェクトは「写真」やそれに近いオブジェクトと判断できるが、この種のオブジェクトの前面に、背景色として或る色を設定した文字ブロックを配置したとすると、例として図12(B)に示すように、文字ブロックの背景色と文字混在オブジェクトの色が相違していることで見栄えが悪化する。また、「写真」やそれに近いオブジェクトの前面に背景を透明に設定した文字ブロックを配置した場合にも、例として図12(C)に示すように、フォント種やフォントサイズの相違により、処理対象の文字混在オブジェクトに混在している文字(列)に対して文字ブロックに表示されている文字(列)にずれが生じ、見栄えの悪化が生ずる。
【0065】
このため、ステップ120,122の何れかの判定が肯定された場合はステップ124へ移行し、文字ボックスの配置位置を処理対象の文字混在オブジェクトの「背面」と判定し(図12(D)も参照)、ステップ128へ移行する。また、ステップ120,122の判定が何れも否定された場合はステップ126へ移行し、文字ボックスの配置位置を処理対象の文字混在オブジェクトの「前面」と判定し、ステップ128へ移行する。なお、ステップ118〜ステップ122は請求項2に記載の判定手段による処理の一例である。
【0066】
ステップ128では、読取文書から分離抽出された全ての文字混在オブジェクトに対してステップ90以降の処理を行ったか否か判定する。判定が否定された場合はステップ90に戻り、ステップ128の判定が肯定される迄ステップ90〜ステップ128を繰り返す。これにより、読取文書から分離抽出された全ての文字混在オブジェクトに対して上記の前後判定が各々行われる。そして、読取文書から分離抽出された全ての文字混在オブジェクトに対して上記の前後判定を行うと、ステップ128の判定が肯定されて前後判定処理を終了する。
【0067】
次に、文書ファイル生成処理について図4を参照して説明する。文書ファイル生成処理では、まずステップ140において、読取・ファイル化処理(図2)のステップ42のオブジェクト分離処理で読取文書から分離抽出されたオブジェクトの中から、処理対象のオブジェクトとして単一のオブジェクトのデータを取り出す。ステップ142では、ステップ140でデータを取り出した処理対象のオブジェクトのデータに基づき、処理対象のオブジェクトを表し、処理対象のオブジェクトのオブジェクト種に応じたフォーマットのオブジェクトデータ(例えばオブジェクト種が「文字」であれば文字コードデータを含み文書処理ソフトで取扱可能な形式の文書データ、オブジェクト種が「写真」や「イラスト(CG)」であれば画像編集ソフトで取扱可能な形式の画像データ、オブジェクト種が「表」であれば表計算ソフト等で取扱可能な形式の表データ、オブジェクト種が「線画」であれば図形描画ソフト等で取扱可能な形式のベクトルデータ)を生成する。
【0068】
次のステップ144では、処理対象のオブジェクトが文字混在オブジェクトか否か判定する。判定が否定された場合はステップ166へ移行するが、判定が肯定された場合はステップ146へ移行し、処理対象の文字混在オブジェクトに混在している文字に対する文字認識処理(図2のステップ44)の処理結果を取得する。またステップ148では、処理対象の文字混在オブジェクトに混在している文字に対して行われた前後判定処理(図3)による判定結果(処理対象の文字混在オブジェクトと文字ボックスの何れを前面に配置するかを判定した結果:前後関係の判定結果)を取得する。
【0069】
次のステップ150では、記憶部16Cに記憶されている設定情報を参照し、参照した設定情報に文字ボックスの削除条件が設定されているか否か判定する。本実施形態では、文字混在オブジェクトに対し、或る削除条件(「文字ボックスを文字混在オブジェクトの前面に配置」「文字ボックスを文字混在オブジェクトの背面に隠蔽」「文字ボックスを文字混在オブジェクトの前面又は背面に配置」の何れか)を満たしたときに対応する文字ボックスを削除することを、利用者が事前に指示することが可能とされており、利用者によって前記指示が入力された場合は、利用者の指示が削除条件情報として設定情報に設定される。ステップ150の判定は、設定情報に削除条件情報が設定されているか否かを判断することによって成される。ステップ150の判定が否定された場合はステップ154へ移行するが、ステップ150の判定が肯定された場合はステップ152へ移行し、前後判定処理(図3)における処理対象の文字混在オブジェクトと文字ボックスの前後関係の判定結果が、削除条件情報に規定されている削除条件に合致しているか否か判定する。
【0070】
ステップ152の判定が否定された場合はステップ154へ移行し、文字ブロックの文字色・背景色の情報として、前後判定処理(図3)における前後関係の判定結果に応じた文字色・背景色の情報を取得する。すなわち、本実施形態では、記憶部16Cに記憶されている設定情報の中に、前後関係の判定結果が「背面(文字ボックスを文字混在オブジェクトの背面に隠蔽)」の場合の文字色・背景色を規定する文字色・背景色情報が含まれており(当該文字色・背景色情報は、初期値(デフォルト)として、文字色が黒、背景色が透明に設定されている)、前後判定処理(図3)における前後関係の判定結果が「背面」の場合、ステップ154では記憶部16Cに記憶されている設定情報の中から上記の文字色・背景色情報を抽出する。なお、この文字色・背景色情報は請求項11に記載の色指定情報の一例である。また、前後判定処理(図3)における前後関係の判定結果が「前面(文字ボックスを文字混在オブジェクトの前面に配置)」の場合、ステップ154では、処理対象の文字混在オブジェクトに混在している文字に対する文字認識処理(図2のステップ44)で判別された文字色・背景色を取得する。上記のように、前後判定処理(図3)における前後関係の判定結果に応じて文字ボックスの文字色・背景色を切り替えることは、請求項10に記載の生成手段による処理の一例である。
【0071】
次のステップ156では、処理対象の文字混在オブジェクトに混在している文字に対する文字認識処理(図2のステップ44)で判別された文字コードデータやフォント種、フォントサイズ、位置等の情報を取得し、取得した文字コードデータが表す文字(列)を、取得したフォント種・サイズ、ステップ154で取得した文字色で表示すると共に、背景領域をステップ154で取得した背景領域で着色した文字ボックスのデータを生成する。この文字ボックスのデータには、文字認識処理で判別された文字コードデータも含まれており、当該文字ボックスを含む文書がディスプレイ等に表示されている状態で、文字ボックスを選択する操作が行われた場合に、文字ボックスに表示されている文字(列)の文字コードデータを複写(コピー)することが可能になる(更にコピーした文字コードデータを貼り付ける(ペースト)も可能になる)と共に、文字(列)を検索する操作が行われた場合、文字ボックスに表示されている文字(列)も検索の対象となる。
【0072】
ステップ158では、ステップ156で取得した処理対象の文字混在オブジェクト内の文字の位置を表す情報に基づき、ステップ156でデータを生成した文字ボックスの文書上での配置位置として、文字ボックスに表示される文字が処理対象のオブジェクトに混在している文字と重なる位置を設定する。またステップ160では、処理対象の文字混在オブジェクトとステップ156でデータを生成した文字ボックスとの前後関係を規定する情報を、前後判定処理(図3)における前後関係の判定結果に従って設定し、ステップ166へ移行する。
【0073】
一方、先のステップ150,152の判定が各々肯定された場合(文字ボックスの削除条件が設定されており、かつ前後判定処理(図3)における前後関係の判定結果が削除条件に合致した場合)には、ステップ152からステップ162へ移行する。この場合、文字ボックス(のデータ)の生成は行われず、前述の文字ボックスを利用した文字コードデータのコピー/ペーストや文字の検索が不可となる。
【0074】
このため、ステップ162では、処理対象の文字混在オブジェクトに混在している文字に対する文字認識処理(図2のステップ44)で判別された文字コードデータを取得し、取得した文字コードデータを処理対象の文字混在オブジェクトのオブジェクトデータに属性情報として設定する。これにより、処理対象の文字混在オブジェクトを含む文書がディスプレイ等に表示されている状態で、文字混在オブジェクトの属性情報を表示させる操作が行われた場合、表示された属性情報を利用して、文字コードデータのコピー/ペーストを行うことが可能となる。なお、上記のステップ162は請求項14に記載の属性設定手段による処理の一例である。
【0075】
次のステップ164では、処理対象の文字混在オブジェクトのビットマップデータ等に基づいて、処理対象の文字混在オブジェクトに混在している状態での文字の領域を画像として表す文字画像データ(例えばpng等の形式の画像データ)を生成し、生成した文字画像データと処理対象の文字混在オブジェクトとの前後関係を、文字画像データが処理対象の文字混在オブジェクトの前面に表示されるように設定し、ステップ166へ以降する。この場合、処理対象の文字混在オブジェクトを含む文書がディスプレイ等に表示されている状態で、文字コードデータに代えて文字画像データを利用する(コピー/ペースト等)ことが可能となる。なお、png等の形式の文字画像データに代えて、文字をベクトル形式で表すベクトルデータを用いるようにしてもよい。
【0076】
なお、上記のステップ164は請求項13に記載の生成手段による処理の一例である。また、ステップ152の判定が肯定された場合にステップ162,164のみ行う(文字ボックスのデータの生成を行わない)ことは、請求項12に記載の生成手段による処理の一例である。
【0077】
ステップ166では、オブジェクト分離処理(図2のステップ42)で読取文書から分離抽出された全てのオブジェクトに対して上記処理を行ったか否か判定する。判定が否定された場合はステップ166へ戻り、ステップ166の判定が肯定される迄ステップ140〜ステップ166を繰り返す。これにより、読取文書から分離抽出された全てのオブジェクトに対して少なくともオブジェクトデータの生成(ステップ142)が各々行われ、文字混在オブジェクトに対しては、更にステップ146以降の処理も各々行われる。ステップ166の判定が肯定されるとステップ168へ移行し、上記処理で生成した全データ(各オブジェクトのオブジェクトデータやステップ156で生成した文字ボックスのデータ、ステップ164で生成した文字画像データ)を含む文書ファイルを生成し、文書ファイル生成処理を終了する。
【0078】
続いて、操作パネル22の操作部22Bを介し、前後判定処理で参照される判定基準情報や、文書ファイル生成処理で参照される設定情報の変更が利用者から指示された場合に実行される設定変更処理について、図5を参照して説明する。
【0079】
この設定変更処理では、まずステップ60において、利用者によって指定された変更対象が前後判定処理で参照される判定基準情報か否か判定する。この判定が肯定された場合はステップ62へ移行し、判定基準情報に含まれる配置規定情報や判定閾値th1〜th8の変更を指示可能な判定基準変更画面を操作パネル22の表示部22Aに表示させる。次のステップ64では利用者による入力が完了したか否か判定し、判定が肯定される迄ステップ64を繰り返す。利用者による入力が完了すると、ステップ64の判定が肯定されてステップ66へ移行し、判定基準情報を構成する各情報のうち、操作パネル22の表示部22Aに表示させた判定基準変更画面を介して利用者から変更が指示された情報を、判定基準変更画面を介して利用者から指示された値(内容)へ変更し、設定変更処理を終了する。なお、上記のステップ62〜ステップ66は、請求項9に記載の第1変更手段による処理の一例である。
【0080】
また、ステップ60の判定が否定された場合はステップ68へ移行し、利用者によって指定された変更対象が、文書ファイル生成処理で参照される設定情報に含まれる文字色・背景色情報か否か判定する。判定が肯定された場合はステップ70へ移行し、文字色・背景色情報の変更を指示可能な文字色・背景色変更画面を操作パネル22の表示部22Aに表示させる。次のステップ72では利用者による入力が完了したか否か判定し、判定が肯定される迄ステップ72を繰り返す。利用者による入力が完了すると、ステップ72の判定が肯定されてステップ74へ移行し、設定情報に含まれる文字色・背景色情報を、操作パネル22の表示部22Aに表示させた文字色・背景色変更画面を介して利用者から指示された値(内容)へ変更し、設定変更処理を終了する。なお、上記のステップ70〜ステップ74は、請求項11に記載の第2変更手段による処理の一例である。
【0081】
また、ステップ68の判定が否定された場合、利用者が文字ブロックに対する削除条件の設定を所望していると判断し、ステップ76へ移行して、文字ブロックに対する削除条件の設定を指示可能な削除条件設定画面を操作パネル22の表示部22Aに表示させる。次のステップ78では利用者による削除条件の設定入力が完了したか否か判定し、判定が肯定される迄ステップ78を繰り返す。利用者による設定入力が完了すると、ステップ78の判定が肯定されてステップ80へ移行し、設定情報に含まれる削除条件情報を、操作パネル22の表示部22Aに表示させた削除条件設定画面を介して利用者から指示された内容へ変更し、設定変更処理を終了する。
【0082】
また、上記では判定閾値th1〜th8を全て用いると共に、文字混在オブジェクトのオブジェクト種も用いて前後判定を行う態様を説明したが、本発明はこれに限定されるものではなく、判定閾値th1〜th8と文字混在オブジェクトのオブジェクト種の一部(少なくとも1つ)を用いて前後判定を行う態様も本発明の権利範囲に含まれることは言うまでもない。
【0083】
また、上記では文字混在オブジェクトのオブジェクト種が文字ボックス隠蔽対象か否かに基づいて、判定閾値th1〜th8の値を切り替える態様を説明したが、本発明はこれに限定されるものではなく、上記でも述べたように、文字混在オブジェクトのオブジェクト種を単独で用い、文字混在オブジェクトと文字ボックスの何れを前面に配置するかを、文字混在オブジェクトのオブジェクト種に基づいて判定するようにしてもよい。この態様は請求項7記載の発明に対応している。
【0084】
また、上記では本発明に係る文字ブロックとして矩形状の文字ボックスを例示したが、本発明はこれに限定されるものではなく、本発明に係る文字ブロックは矩形状以外の外形形状であってもよいことは言うまでもない。
【0085】
また、上記では本発明に係る画像処理プログラムとしての読取・ファイル化プログラムが画像読取印刷装置14の本体制御部16の記憶部16Cに予め記憶(インストール)されている態様を説明したが、本発明に係る画像処理プログラムは、CD−ROMやDVD−ROM等の記録媒体に記録されている形態で提供することも可能である。また、上記では画像処理プログラムとしての読取・ファイル化プログラムが画像読取印刷装置14の本体制御部16の記憶部16Cで実行される態様を説明したが、これに限定されるものではなく、端末装置24等の他の電子機器で実行されるように構成してもよい。
【符号の説明】
【0086】
10 コンピュータ・システム
14 画像読取印刷装置
16 本体制御部
18 画像読取部
22 操作パネル
24 端末装置

【特許請求の範囲】
【請求項1】
文字が混在している構成要素を含む文書を画像として読み取ることで得られた画像データに基づき、前記構成要素に混在している前記文字に対して文字認識を行う文字認識手段と、
前記文書を表し、前記文字が混在している状態の前記構成要素を表す第1データと、前記文字認識手段によって認識された文字の文字コードデータを含み、当該文字コードデータが表す前記文字を表示する文字ブロックを表す第2データと、を含んだ文書データの生成にあたり、当該文書データが表す文書が表示される際に、前記第2データが表す文字ブロックを前記第1データが表す前記構成要素の背面に隠蔽させるか、前記第2データが表す文字ブロックを前記第1データが表す前記構成要素の前面に表示させるかを、前記構成要素のうち前記文字の周囲の背景領域の明度又は明度の分散、前記構成要素中の前記文字の文字数又は行数、前記構成要素のうち前記文字の領域の明度、前記文字認識手段による前記文字認識の確度、前記構成要素中の前記文字の大きさ、及び、前記構成要素の種別の少なくとも1つに基づいて判定する判定手段と、
前記判定手段による判定結果に従って、前記文書が表示される際の前記文字ブロックと前記構成要素との表示の前後関係を設定した前記文書データを生成する生成手段と、
を含む画像処理装置。
【請求項2】
前記判定手段は、前記構成要素のうち前記文字の周囲の背景領域の明度が第1閾値未満、又は、前記文字の周囲の背景領域の明度の分散が第2閾値以上の場合に、前記文字ブロックを前記構成要素の背面に隠蔽させると判定する請求項1記載の画像処理装置。
【請求項3】
前記判定手段は、前記構成要素中の前記文字の文字数が第3閾値以上、又は、前記構成要素中の前記文字の行数が第4閾値以上の場合に、前記文字ブロックを前記構成要素の背面に隠蔽させると判定する請求項1又は請求項2記載の画像処理装置。
【請求項4】
前記判定手段は、前記構成要素のうち前記文字の領域の明度が第5閾値以上の場合に、前記文字ブロックを前記構成要素の前面に表示させると判定する請求項1〜請求項3の何れか1項記載の画像処理装置。
【請求項5】
前記判定手段は、前記文字認識手段による前記文字認識の確度が第6閾値未満の場合に、前記文字ブロックを前記構成要素の背面に隠蔽させると判定する請求項1〜請求項4の何れか1項記載の画像処理装置。
【請求項6】
前記判定手段は、前記構成要素中の前記文字の大きさが第7閾値以上の場合に、前記文字ブロックを前記構成要素の背面に隠蔽させると判定する請求項1〜請求項5の何れか1項記載の画像処理装置。
【請求項7】
前記判定手段は、前記構成要素の種別が、前記文字ブロックを隠蔽させる種別として設定された種別である場合に、前記文字ブロックを前記構成要素の背面に隠蔽させると判定する請求項1〜請求項6の何れか1項記載の画像処理装置。
【請求項8】
前記判定手段は、前記構成要素中の前記文字の周囲の背景領域の明度又は明度の分散、前記構成要素中の前記文字の文字数又は行数、前記構成要素中の前記文字の領域の明度、前記文字認識手段による前記文字認識の確度、及び、前記構成要素中の前記文字の大きさの少なくとも1つを閾値と比較した結果に基づいて、前記文字ブロックを前記構成要素の背面に隠蔽させるか、前記文字ブロックを前記構成要素の前面に表示させるかを判定すると共に、前記構成要素の種別が前記文字ブロックを隠蔽させる種別として設定された種別である場合に、前記構成要素の種別が前記文字ブロックを隠蔽させる種別として設定された種別でない場合よりも、前記文字ブロックを前記構成要素の背面に隠蔽させると判定する確率が高くなるように前記閾値を予め変更する請求項1〜請求項6の何れか1項記載の画像処理装置。
【請求項9】
前記判定手段は、前記構成要素中の前記文字の周囲の背景領域の明度又は明度の分散、前記構成要素中の前記文字の文字数又は行数、前記構成要素中の前記文字の領域の明度、前記文字認識手段による前記文字認識の確度、前記構成要素中の前記文字の大きさ、及び、前記構成要素の種別の少なくとも1つを、記憶手段に記憶された閾値又は設定情報と比較し、比較結果に基づいて、前記文字ブロックを前記構成要素の背面に隠蔽させるか、前記文字ブロックを前記構成要素の前面に表示させるかを判定し、
利用者から指示手段を介して前記閾値又は前記設定情報の変更が指示された場合に、利用者からの指示に応じて、記憶手段に記憶された前記閾値又は前記設定情報を変更する第1変更手段を更に備えた請求項1〜請求項8の何れか1項記載の画像処理装置。
【請求項10】
前記生成手段は、前記判定手段により前記文字ブロックを前記構成要素の背面に隠蔽させると判定された場合には、前記第2データとして、前記文字コードデータが表す前記文字及び前記文字の周囲の背景領域を予め指定された文字色、背景色で各々表示する文字ブロックを表すデータを生成し、前記判定手段により前記文字ブロックを前記構成要素の前面に表示させると判定された場合には、前記第2データとして、前記文字コードデータが表す前記文字及び前記文字の周囲の背景領域を、前記構成要素に混在している状態での前記文字の文字色又は前記背景領域の背景色と同一又は類似の色で各々表示する文字ブロックを表すデータを生成する請求項1〜請求項9の何れか1項記載の画像処理装置。
【請求項11】
前記判定手段により前記文字ブロックを前記構成要素の背面に隠蔽させると判定された場合の前記文字ブロックの前記文字色及び前記背景色を指定する色指定情報が記憶手段に予め記憶されており、
前記判定手段により前記文字ブロックを前記構成要素の背面に隠蔽させると判定された場合の前記文字ブロックの前記文字色及び前記背景色の少なくとも一方の変更が指示手段を介して利用者から指示された場合に、利用者からの指示に応じて前記色指定情報を変更する第2変更手段を更に備えた請求項10記載の画像処理装置。
【請求項12】
利用者からの、前記判定手段による判定結果が特定の判定結果のときに、前記文書データからの前記第2データの除去を指示する除去指示情報の入力を受け付ける入力受付手段を更に備え、
前記生成手段は、前記入力受付手段によって前記除去指示情報の入力が受け付けされ、かつ前記判定手段による判定結果が前記除去指示情報に規定された特定の判定結果に合致した場合には、前記文書データとして前記第2データを除去したデータを生成する請求項1〜請求項11の何れか1項記載の画像処理装置。
【請求項13】
前記生成手段は、前記文書データとして前記第2データを除去したデータを生成する場合、前記構成要素に混在している状態での前記文字を画像として表す文字画像データを生成し、前記文書データとして、生成した前記文字画像データを含み、前記文書が表示される際に前記文字画像データが表す文字画像が前記構成要素の前面に表示されるように、前記文書が表示される際の前記文字画像と前記構成要素との表示の前後関係を設定したデータを生成する請求項12記載の画像処理装置。
【請求項14】
少なくとも前記第1データは、任意の情報を前記構成要素の属性情報として設定可能なフォーマットであり、
前記文字認識手段によって認識された文字の文字コードデータを前記構成要素の属性情報として前記第1データに設定する属性設定手段を更に備えた請求項1〜請求項13の何れか1項記載の画像処理装置。
【請求項15】
コンピュータを、
文字が混在している構成要素を含む文書を画像として読み取ることで得られた画像データに基づき、前記構成要素に混在している前記文字に対して文字認識を行う文字認識手段、
前記文書を表し、前記文字が混在している状態の前記構成要素を表す第1データと、前記文字認識手段による文字認識で認識された文字の文字コードデータを含み当該文字コードデータが表す前記文字を表示する文字ブロックを表す第2データと、を含んだ文書データの生成にあたり、当該文書データが表す文書が表示される際に、前記第2データが表す文字ブロックを前記第1データが表す前記構成要素の背面に隠蔽させるか、前記第2データが表す文字ブロックを前記第1データが表す前記構成要素の前面に表示させるかを、前記構成要素のうち前記文字の周囲の背景領域の明度又は明度の分散、前記構成要素中の前記文字の文字数又は行数、前記構成要素のうち前記文字の領域の明度、前記文字認識手段による前記文字認識の確度、前記構成要素中の前記文字の大きさ、及び、前記構成要素の種別の少なくとも1つに基づいて判定する判定手段、
及び、前記判定手段による判定結果に従って前記文書が表示される際の前記文字ブロックと前記構成要素との表示の前後関係を設定した前記文書データを生成する生成手段
として機能させるための画像処理プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図7】
image rotate

【図12】
image rotate

【図6】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate


【公開番号】特開2012−44257(P2012−44257A)
【公開日】平成24年3月1日(2012.3.1)
【国際特許分類】
【出願番号】特願2010−180984(P2010−180984)
【出願日】平成22年8月12日(2010.8.12)
【出願人】(000005496)富士ゼロックス株式会社 (21,908)
【Fターム(参考)】