説明

画像データ処理装置

【課題】 複数ページからなる入力画像データに対して、各ページの画像データに共通の画像と非共通の画像とを識別して、非共通画像は勿論のこと共通画像は共通画像として処理することにより、データ量を大幅に削減することが可能な画像データ処理装置を提供することを課題とする。
【解決手段】 入力された複数ページからなる画像データに対して所定の処理を施す画像データ処理装置において、前記入力された複数ページからなる画像データに基づいて、各ページに共通する共通画像と各ページ毎に異なる非共通画像を識別する画像識別手段と、前記画像識別手段によって識別された各ページに共通する共通画像と各ページ毎の非共通画像を別にファイル化するファイル生成手段とを備えるように構成して課題を解決した。

【発明の詳細な説明】
【技術分野】
【0001】
この発明は、スキャナー等の画像読取装置により読み取られるなどにして入力された原稿の画像データを処理する画像データ処理装置に関し、特に、同一のフォームを持った複数ページからなる原稿などの入力画像データに対して、共通画像と非共通画像を分離する画像処理を施す画像データ処理装置に関するものである。
【背景技術】
【0002】
【特許文献1】特開2002−27228号公報
【特許文献2】特開平9−106450号公報
【0003】
近年、企業のオフィスや役所、あるいは学校や予備校・学習塾等で取り扱われる多くの文書は、用紙にプリントやコピーされた文書以外に、パーソナルコンピュータ等で作成され保存された文書データや、原稿の画像をスキャナー等で読み取った文書データなど、電子化された画像データとしてやり取りされるようになってきている。
【0004】
例えば、数十ページに及ぶ紙の資料をスキャナーによって読み取ることにより、画像データに変換して保存したり転送するなどというケースも多く発生しているが、この場合には、画像データのファイルサイズが過大となって記憶装置としてのハードディスクの容量を多く消費することになる。
【0005】
また、このような数十ページに及ぶ画像データをプリントアウトする場合や、画像データのファイルを転送する場合などには、画像データのデータ量が過大となって、当該画像データをプリントする際の読出や転送に長時間を要したり、ネットワークを混雑させる原因になるという問題点を有していた。
【0006】
そこで、かかる問題点を解決し得る技術としては、例えば、特開2002−27228号公報や特開平9−106450号公報等に開示されたものが既に提案されている。
【0007】
上記特開2002−27228号公報に開示された技術は、プリントアウトする際に共通部分を除去して出力するように構成したものである。
【0008】
更に説明すると、この特開2002−27228号公報に係る画像処理装置は、複数ページからなる画像が入力された場合に、各ページにおける共通の画像を認識する共通画像認識手段と、前記複数ページからなる画像から共通の画像を除去する共通画像除去手段と、共通画像除去手段により共通画像が除去された複数ページからなる画像を出力する画像出力手段とを有するように構成されている。
【0009】
また、上記特開平9−106450号公報に開示された技術は、ページ間で画像データ中の下地色が共通の濃度を有するものであれば、共通の下地データとなるように構成したものである。
【0010】
更に説明すると、この特開平9−106450号公報に係る画像データ処理方法は、描画順序が規定されている複数の画像部品を表わす部品データを含む画像データの処理方法であって、(a)前記描画順序において連続する少なくとも2つの画像部品について、濃度値の差分が所定の閾値よりもそれぞれ小さく、かつ、それぞれの位置が隣接している場合に、前記少なくとも2つの画像部品の全体を1つの統合画像部品として認識する工程と、(b)前記統合画像部品を対象として画像処理を実行する工程と、を備えるように構成したものである。
【発明の開示】
【発明が解決しようとする課題】
【0011】
しかしながら、上記従来技術の場合には、次のような問題点を有している。すなわち、上記特開2002−27228号公報に係る画像処理装置の場合には、複数ページからなる画像が入力された場合に、各ページにおける共通の画像を認識する共通画像認識手段と、前記複数ページからなる画像から共通の画像を除去する共通画像除去手段と、共通画像除去手段により共通画像が除去された複数ページからなる画像を出力する画像出力手段とを有するように構成したものであるが、複数ページからなる画像から共通の画像を共通画像除去手段によって除去するため、複数ページからなる画像の共通部分は、保存されず、別に容易するなどの作業が必要となるという問題点を有していた。
【0012】
また、上記特開平9−106450号公報に係る画像データ処理方法の場合には、描画順序において連続する少なくとも2つの画像部品について、濃度値の差分が所定の閾値よりもそれぞれ小さく、かつ、それぞれの位置が隣接している場合に、少なくとも2つの画像部品の全体を1つの統合画像部品として認識するように構成したものであるが、共通の絵柄や文字を複数のページ間にわたって共通部として認識し管理することはできないという問題点を有していた。
【0013】
そこで、この発明は、上記従来技術の問題点を解決するためになされたものであり、その目的とするところは、複数ページからなる入力画像データに対して、各ページの画像データに共通の画像と非共通の画像とを識別して、非共通画像は勿論のこと共通画像は共通画像として処理することにより、データ量を大幅に削減することが可能な画像データ処理装置を提供することにある。
【課題を解決するための手段】
【0014】
上記目的を達成するため、請求項1に記載された発明は、入力された複数ページからなる画像データに対して所定の処理を施す画像データ処理装置において、
前記入力された複数ページからなる画像データに基づいて、各ページに共通する共通画像と各ページ毎に異なる非共通画像を識別する画像識別手段と、
前記画像識別手段によって識別された各ページに共通する共通画像と各ページ毎の非共通画像を別にファイル化するファイル生成手段とを備えたことを特徴とする画像データ処理装置である。
【0015】
また、請求項2に記載された発明は、前記画像識別手段が、前記入力された複数ページからなる画像データに基づいて、各ページに共通する共通画像を認識する共通画像認識手段と、
前記入力された各ページの画像データから前記共通画像認識手段によって認識された共通画像を抽出する共通画像抽出手段と、
前記入力された各ページの画像データから前記共通画像抽出手段によって抽出された共通画像を除去して、各ページ毎に異なる非共通画像を得る共通画像除去手段とを備えていることを特徴とする請求項1に記載の画像データ処理装置である。
【0016】
さらに、請求項3に記載された発明は、前記共通画像認識手段は、前記入力された各ページの画像データに付加された位置合わせ用の認識マーカを検出し、当該認識マーカの検出結果に基づいて、前記入力された各ページの画像データの位置を調整することを特徴とする請求項2に記載の画像データ処理装置である。
【0017】
又、請求項4に記載された発明は、前記共通画像認識手段は、前記入力された各ページの画像データにビット膨張処理を施して共通画像を認識することを特徴とする請求項2又は3に記載の画像データ処理装置である。
【0018】
更に、請求項5に記載された発明は、前記共通画像認識手段は、前記入力された各ページの画像データのうち、nページ目とn+1ページ目の画像データの共通画像を認識し、当該認識結果とn+2ページ目の画像データの共通画像を認識し、以降同様に前ページまでの認識結果と現ページの画像データの共通画像を認識することを特徴とする請求項2乃至4のいずれかに記載の画像データ処理装置である。
【0019】
また、請求項6に記載された発明は、前記画像識別手段によって識別された共通画像と非共通画像を、テキスト部とイメージ部に分離する分離手段と、前記分離手段によって分離されたテキスト部は、少なくとも1つ以上の矩形部分に切り出す切り出し手段とを備え、当該切り出し部によって切り出された矩形部分を、ページ数と認識マーカからの位置情報と当該矩形部分を示すx,y方向の長さ情報で管理することを特徴とする請求項1に記載の画像データ処理装置である。
【0020】
さらに、請求項7に記載された発明は、前記切り出し手段によって切り出された矩形部分のテキスト画像を、文字認識ソフトを用いて文字認識を行い、当該認識された文字画像データを文字コード化することを特徴とする請求項6に記載の画像データ処理装置である。
【0021】
又、請求項8に記載された発明は、前記切り出し手段によって切り出された矩形部分の画像を、ビットマップデータとして生成するか文字コードとして生成するかを選択する選択手段を備えたことを特徴とする請求項7に記載の画像データ処理装置である。
【発明の効果】
【0022】
この発明によれば、複数ページからなる入力画像データに対して、各ページの画像データに共通の画像と非共通の画像とを識別して、非共通画像は勿論のこと共通画像は共通画像として処理することにより、データ量を大幅に削減することが可能な画像データ処理装置を提供することができる。
【発明を実施するための最良の形態】
【0023】
以下に、この発明の実施の形態について図面を参照して説明する。
【0024】
実施の形態1
図2はこの発明の実施の形態1に係る画像データ処理装置を適用した画像処理システムを示すものである。
【0025】
この画像処理システム1は、図2に示すように、例えば、単独で設置された画像読取装置としてのスキャナー2と、画像出力装置としてのカラー複合機3と、データベースとしてのサーバー4と、画像作成装置としてのパーソナルコンピュータ5と、これらスキャナー2やカラー複合機3、サーバー4、パーソナルコンピュータ5等を互いに通信可能に接続するLANや電話回線等からなるネットワーク6とを備えるように構成されている。なお、図中、7はスキャナー2とネットワーク6を通信可能に接続する通信モデムを示すものである。
【0026】
上記スキャナー2は、複数のページからなる文書8等の画像を電子化する際に、当該複数のページからなる文書8の画像を順次読み取り、文書8の画像情報を電子化した画像データを出力するものである。このスキャナー2によって読み取られた文書8の画像データは、例えば、ネットワーク6を介して、カラー複合機3に送られ、当該カラー複合機3の内部に設けられた画像処理装置によって、所定の画像処理が施された後にプリントアウトされたり、当該画像処理装置に付設された画像データ処理装置によって所望の加工が施されるようになっている。なお、上記画像データ処理装置は、カラー複合機3に内蔵される以外に、パーソナルコンピュータ5に画像データ処理用のソフトウエアとしてインストールされ、当該パーソナルコンピュータ5自身が画像データ処理装置として機能するように構成されていても勿論良い。
【0027】
また、上記カラー複合機3は、それ自身で画像読取装置としてのスキャナー9を備えており、当該スキャナー9で読み取った文書の画像を複写したり、パーソナルコンピュータ5から送られてきたり、サーバー4から読み出された画像データに基づいてプリントしたり、電話回線を介して画像データを送受信するファックスとして機能するものである。
【0028】
さらに、上記サーバー4は、電子化された文書8の画像データなどをそのまま記憶したり、スキャナー2、9によって読み取られ、画像データ処理装置によって所定の画像処理が施され、ファイル化されたデータなどを記憶保持するものである。
【0029】
図3はこの発明の実施の形態1に係る画像データ処理装置を適用した画像出力装置としてのカラー複合機を示すものである。
【0030】
図3において、10はカラー複合機の本体を示すものであり、このカラー複合機の上部には、文書8を一枚ずつ分離した状態で自動的に搬送する自動原稿搬送装置(ADF)11と、当該自動原稿搬送装置11によって搬送される文書8の画像を読み取る画像入力装置(IIT)12を備えた画像読取装置としてのスキャナー9が配設されている。なお、スキャナー2も、当該スキャナー9と同様に構成されている。上記画像入力装置12は、プラテンガラス15上に載置された文書8を光源16によって照明し、文書8からの反射光像を、フルレートミラー17及びハーフレートミラー18、19及び結像レンズ20からなる縮小光学系を介してCCD等からなる画像読取素子21上に走査露光して、この画像読取素子21によって文書8の色材反射光像を所定のドット密度(例えば、16ドット/mm)で読み取るようになっている。
【0031】
上記画像入力装置12によって読み取られた文書8の反射光像は、例えば、赤(R)、緑(G)、青(B)(各8bit)の3色の反射率データとして画像処理装置13(IPS)に送られ、この画像処理装置13では、文書8の画像データに対して、必要に応じて、シェーデイング補正、位置ズレ補正、明度/色空間変換、ガンマ補正、枠消し、色/移動編集等の処理を含め、後述するように所定の画像処理が施される。また、この画像処理装置13は、パーソナルコンピュータ5等から送られてくる画像データに対しても、所定の画像処理を行なうようになっている。上記画像処理装置13には、本実施の形態に係る画像データ処理装置が組み込まれている。
【0032】
そして、上記画像処理装置13で所定の画像処理が施された画像データは、同じく画像処理装置13によって、イエロー(Y)、マジェンタ(M)、シアン(C)、ブラック (K)(各8ビット)の4色の階調データに変換され、次に述べるように、イエロー(Y)、マジェンタ(M)、シアン(C)、ブラック(K)の各色の画像形成ユニット23Y、23M、23C、23Kに共通するROS(RaserOutputScanner)24に送られ、この画像露光装置としてのROS24では、所定の色の階調データに応じてレーザ光LBによる画像露光が行われる。なお、カラー画像に限らず、白黒の画像のみを形成しても勿論良い。
【0033】
ところで、上記カラー複合機3の内部には、図3に示すように、画像形成手段Aが配設されており、この画像形成手段Aには、イエロー(Y)、マジェンタ(M)、シアン(C)、ブラック(K)の4つの画像形成ユニット23Y、23M、23C、23Kが、水平方向に一定の間隔をおいて並列的に配置されている。
【0034】
これらの4つの画像形成ユニット23Y、23M、23C、23Kは、すべて同様に構成されており、大別して、所定の速度で回転駆動される像担持体としての感光体ドラム25と、この感光体ドラム25の表面を一様に帯電する一次帯電用の帯電ロール26と、当該感光体ドラム25の表面に所定の色に対応した画像を露光して静電潜像を形成する画像露光装置としてのROS24と、感光体ドラム25上に形成された静電潜像を所定の色のトナーで現像する現像器27と、感光体ドラム25の表面を清掃するクリーニング装置28とから構成されている。これらの感光体ドラム25と周辺に配置される画像形成部材は、一体的にユニット化されており、プリンター及び複写機本体10から個別に交換可能に構成されている。
【0035】
上記ROS24は、図3に示すように、4つの画像形成ユニット23Y、23M、23C、23Kに共通に構成されており、図示しない4つの半導体レーザを各色の階調データに応じて変調して、これらの半導体レーザからレーザ光LB−Y、LB−M、LB−C、LB−Kを階調データに応じて出射するように構成されている。なお、上記ROS24は、複数の画像形成ユニット毎に個別に構成しても勿論よい。上記半導体レーザから出射されたレーザ光LB−Y、LB−M、LB−C、LB−Kは、図示しないf−θレンズを介してポリゴンミラー29に照射され、このポリゴンミラー29によって偏向走査される。上記ポリゴンミラー29によって偏向走査されたレーザ光LB−Y、LB−M、LB−C、LB−Kは、図示しない結像レンズ及び複数枚のミラーを介して、感光体ドラム25上の露光ポイントに、斜め下方から走査露光される。
【0036】
上記ROS24は、図3に示すように、下方から感光体ドラム25上に画像を走査露光するものであるため、このROS24には、上方に位置する4つの画像形成ユニット23Y、23M、23C、23Kの現像器27などからトナー等が落下して、汚損される虞れを有している。そのため、ROS24は、その周囲が直方体状のフレーム30によって密閉されているとともに、当該フレーム30の上部には、4本のレーザ光LB−Y、LB−M、LB−C、LB−Kを、各画像形成ユニット23Y、23M、23C、23Kの感光体ドラム25上に露光するため、シールド部材としての透明なガラス製のウインドウ31Y、31M、31C、31Kが設けられている。
【0037】
上記画像データ処理装置13からは、イエロー(Y)、マジェンタ(M)、シアン(C)、ブラック(K)の各色の画像形成ユニット23Y、23M、23C、23Kに共通して設けられたROS24に、各色の画像データが順次出力され、このROS24から画像データに応じて出射されたレーザ光LB−Y、LB−M、LB−C、LB−Kは、対応する感光体ドラム25の表面に走査露光され、静電潜像が形成される。上記感光体ドラム25上に形成された静電潜像は、現像器27Y、27M、27C、27Kによって、それぞれイエロー(Y)、マジェンタ(M)、シアン(C)、ブラック(K)の各色のトナー像として現像される。
【0038】
上記各画像形成ユニット23Y、23M、23C、23Kの感光体ドラム25上に、順次形成されたイエロー(Y)、マジェンタ(M)、シアン(C)、ブラック(K)の各色のトナー像は、各画像形成ユニット23Y、23M、23C、23Kの上方にわたって配置された転写ユニット32の中間転写ベルト35上に、4つの一次転写ロール36Y、36M、36C、36Kによって多重に転写される。これらの一次転写ロール36Y、36M、36C、36Kは、各画像形成ユニット23Y、23M、23C、23Kの感光体ドラム25に対応した中間転写ベルト35の裏面側に配設されている。この実施の形態における一次転写ロール36Y、36M、36C、36Kの体積抵抗値は、105 〜108 Ωcmに抵抗調整されたものを使用している。そして、一次転写ロール36Y、36M、36C、36Kには、転写バイアス電源(図示しない)が接続されており、所定のトナー極性とは逆極性(本実施の形態では正極性)の転写バイアスが所定のタイミングで印加されるようになっている。
【0039】
また、上記中間転写ベルト35は、図3に示すように、ドライブロール37と、テンションロール34と、バックアップロール38との間に一定のテンションで掛け回されており、図示しない定速性に優れた専用の駆動モーターによって回転駆動されるドライブロール37により、矢印方向に所定の速度で循環駆動されるようになっている。上記中間転写ベルト35は、例えば、チャージアップを起こさないべルト素材(ゴムまたは樹脂)にて構成されている。
【0040】
上記中間転写ベルト35上に多重に転写されたイエロー(Y)、マジェンタ(M)、シアン(C)、ブラック(K)の各色のトナー像は、図3に示すように、バックアップロール38に圧接する二次転写ロール39によって、シート材としての用紙40上に二次転写され、これらの各色のトナー像が転写された用紙40は、上方に位置する定着器41へと搬送される。上記二次転写ロール39は、バックアップロール38の側方に圧接しており、下方から上方に搬送される用紙40上に、各色のトナー像を二次転写するようになっている。
【0041】
上記用紙40は、カラー複写機本体10内の下部に複数段配設された給紙トレイ41、42、43、44のいずれかから所定サイズのものが、フィードロール45及びロタードロール46等によって一枚ずつ分離された状態で、搬送ロール47を備えた用紙搬送路48を介して給紙される。そして、上記給紙トレイ41、42、43、44のいずれかから給紙された用紙40は、レジストロール49で一旦停止され、中間転写ベルト35上の画像と同期して、当該レジストロール49によって中間転写ベルト35の二次転写位置へと給紙される。
【0042】
そして、上記各色のトナー像が転写された用紙40は、図3に示すように、定着器50によって熱及び圧力で定着処理を受けた後、搬送ロール51によって、画像形成面を下にして第1の排出トレイとしてのフェイスダウントレイ52に排出するための第1の用紙搬送路53を介して、当該第1の用紙搬送路53の出口に設けられた排出ロール54によって、装置本体10の上部に設けられたフェイスダウントレイ52上に排出される。
【0043】
また、上記の如く画像が形成された用紙40を、画像形成面を上にして排出する場合には、図3に示すように、画像形成面を上にして第2の排出トレイとしてのフェイスアップトレイ55に排出するための第2の用紙搬送路56を介して、当該第2の用紙搬送路56の出口に設けられた排出ロール57によって、装置本体1の側部に設けられるフェイスアップトレイ55上に排出されるようになっている。
【0044】
なお、上記カラー複合機3において、フルカラー等の両面コピーをとる場合には、図3に示すように、片面に画像が定着された記録用紙40を、排出ロール54によってフェイスダウントレイ52上にそのまま排出せずに、図示しない切替ゲートによって搬送方向を切り替えるとともに、排出ロール54を一旦停止させた後に逆転して、当該排出ロール54によって両面用の用紙搬送路58へと搬送する。そして、この両面用の用紙搬送路58には、当該搬送路58に沿って設けられた搬送ローラ59により、記録用紙40の表裏が反転された状態で、再度レジストロール49へと搬送され、今度は、当該記録用紙40の裏面に画像が転写・定着された後、第1の用紙搬送路53又は第2の用紙搬送路56を介して、フェイスダウントレイ52又はフェイスアップトレイ55のいずれかに排出される。
【0045】
図3中、60Y、60M、60C、60Kは、イエロー(Y)、マジェンタ(M)、シアン(C)、ブラック(K)の各色の現像器27に、所定の色のトナーを供給するトナーカートリッジをそれぞれ示している。
【0046】
図4は上記カラー複合機3の各画像形成ユニットを示すものである。
【0047】
上記イエロー色、マジェンタ色、シアン色及びブラック色の4つの画像形成ユニット23Y、23M、23C、23Kは、図4に示すように、すべて同様に構成されており、これらの4つの画像形成ユニット23Y、23M、23C、23Kでは、上述したように、それぞれイエロー色、マジェンタ色、シアン色及びブラック色のトナー像が所定のタイミングで順次形成されるように構成されている。上記各色の画像形成ユニット23Y、23M、23C、23Kは、上述したように、感光体ドラム25を備えており、これらの感光体ドラム25の表面は、一次帯電用の帯電ロール26によって一様に帯電される。その後、上記感光体ドラム25の表面は、ROS24から画像データに応じて出射される画像形成用のレーザ光LBが走査露光されて、各色に対応した静電潜像が形成される。上記感光体ドラム25上に走査露光されるレーザ光LBは、当該感光体ドラム25の直下よりやや右側寄りの斜め下方から露光されるように設定されている。上記感光体ドラム25上に形成された静電潜像は、各画像形成ユニット23Y、23M、23C、23Kの現像器27の現像ロール27aによってそれぞれイエロー色、マジェンタ色、シアン色、ブラック色の各色のトナーにより現像されて可視トナー像となり、これらの可視トナー像は、一次転写ロール36の帯電によって中間転写ベルト25上に順次多重に転写される。
【0048】
なお、トナー像の転写工程が終了した後の感光体ドラム25の表面は、クリーニング装置28によって残留トナーや紙粉等が除去されて、次の画像形成プロセスに備える。上記クリーニング装置28は、クリーニングブレード28aを備えており、このクリーニングブレード28aによって、感光体ドラム25上の残留トナーや紙粉等を除去するようになっている。また、トナー像の転写工程が終了した後の中間転写ベルト35の表面は、図3に示すように、クリーニング装置61によって残留トナーや紙粉等が除去されて、次の画像形成プロセスに備える。上記クリーニング装置61は、クリーニングブラシ62及びクリーニングブレード63を備えており、これらのクリーニングブラシ62及びブレード63によって、中間転写ベルト35上の残留トナーや紙粉等を除去するようになっている。
【0049】
図5は、単独で配置された画像読取装置としてのスキャナー2を示すものである。
【0050】
このスキャナー2は、上述したカラー複合機3のスキャナー9と同様に構成されているが、当該スキャナー2には、画像処理装置13が内蔵されている。
【0051】
ところで、この実施の形態1に係る画像データ処理装置は、入力された複数ページからなる画像データに対して所定の処理を施す画像データ処理装置において、前記入力された複数ページからなる画像データに基づいて、各ページに共通する共通画像と各ページ毎に異なる非共通画像を識別する画像識別手段と、前記画像識別手段によって識別された各ページに共通する共通画像と各ページ毎の非共通画像を別にファイル化するファイル生成手段とを備えるように構成されている。
【0052】
また、この実施の形態では、前記画像識別手段が、前記入力された複数ページからなる画像データに基づいて、各ページに共通する共通画像を認識する共通画像認識手段と、前記入力された各ページの画像データから前記共通画像認識手段によって認識された共通画像を抽出する共通画像抽出手段と、前記入力された各ページの画像データから前記共通画像抽出手段によって抽出された共通画像を除去して、各ページ毎に異なる非共通画像を得る共通画像除去手段とを備えるように構成されている。
【0053】
さらに、この実施の形態では、前記共通画像認識手段は、前記入力された各ページの画像データに付加された位置合わせ用の認識マーカを検出し、当該認識マーカの検出結果に基づいて、前記入力された各ページの画像データの位置を調整するように構成されている。
【0054】
又、この実施の形態では、前記共通画像認識手段は、前記入力された各ページの画像データにビット膨張処理を施して共通画像を認識するように構成されている。
【0055】
更に、この実施の形態では、前記共通画像認識手段は、前記入力された各ページの画像データのうち、nページ目とn+1ページ目の画像データの共通画像を認識し、当該認識結果とn+2ページ目の画像データの共通画像を認識し、以降同様に前ページまでの認識結果と現ページの画像データの共通画像を認識するように構成されている。
【0056】
また、この実施の形態では、前記画像識別手段によって識別された共通画像と非共通画像を、テキスト部とイメージ部に分離する分離手段と、前記分離手段によって分離されたテキスト部は、少なくとも1つ以上の矩形部分に切り出す切り出し手段とを備え、当該切り出し部によって切り出された矩形部分を、ページ数と認識マーカからの位置情報と当該矩形部分を示すx,y方向の長さ情報で管理するように構成されている。
【0057】
さらに、この実施の形態では、前記切り出し手段によって切り出された矩形部分のテキスト画像を、文字認識ソフトを用いて文字認識を行い、当該認識された文字画像データを文字コード化するように構成されている。
【0058】
又、この実施の形態では、前記切り出し手段によって切り出された矩形部分の画像を、ビットマップデータとして生成するか文字コードとして生成するかを選択する選択手段を備えるように構成されている。
【0059】
すなわち、この実施の形態に係る画像データ処理装置100は、例えば、図3に示すように、画像出力装置としてのカラー複合機3の内部に、画像処理装置13の一部として組み込まれた状態で装着されている。また、この画像データ処理装置100は、パーソナルコンピュータ5等に画像データ処理用のソフトウエアをインストールすることによって構成される。さらに、上記画像データ処理装置100は、図5に示すように、画像読取装置としてのスキャナー2の内部に、画像処理装置13の一部として組み込まれた状態で装着されるように構成しても良い。
【0060】
この画像データ処理装置100は、図1に示すように、大別して、画像読取装置としてのスキャナー2、9から画像データが入力され、当該入力された画像データに対して所定の画像処理を施す画像処理手段としての画像処理部110と、入力された画像データや画像処理部110によって所定の画像処理が施された画像データ等を記憶するメモリ部120とから構成されている。また、上記画像処理部110は、共通画像認識部111と、共通画像抽出部112と、共通画像除去部113と、T/I分離部114と、矩形切り出し部115と、OCR部116と、ファイル生成部117とを備えている。さらに、上記メモリ部120は、第1のメモリ121と、第2のメモリ122と、第3のメモリ123とを備えている。なお、上記共通画像認識部111と共通画像抽出部112と共通画像除去部113とで、画像識別手段を構成している。また、上記実施の形態では、ファイル生成部117というように、何々部と記載しているが、当該何々部は、何々手段と同義である。
【0061】
上記画像読取装置2、9から入力された複数ページの画像データは、共通画像認識部111を介して、第1のメモリ121の入力画像記憶部124に一時記憶される。上記共通画像認識部111は、画像読取装置2、9から入力され、第1のメモリ121の入力画像記憶部124に一時記憶された複数ページの画像データに基づいて、各ページに共通する共通画像を認識するためのものである。この共通画像認識部111は、1ページ目の画像データと2ページ目の画像データというように、各ページの画像データを互いに比較して、各ページに共通する共通画像を認識するように構成されている。
【0062】
上記画像読取装置2、9によって読み取られる複数ページにわたる文書8としては、特に限定されるものではないが、例えば、図6に示すように、学校や学習塾等で用いられるテスト用紙や、企業のオフィスや役所等で使用される定型の文書などが挙げられる。ただし、文書としては、これらに限定されるものではなく、他の種類の文書等であっても良いことは勿論である。このテスト用紙からなる文書8には、図6に示すように、テスト用紙を作成した会社等を表示したマーク等の図形801や、学期末テストや科目等の文書のタイトルを示す文字画像802、「氏名」を書く欄に記載された「氏名」の文字803、 「問1」、「問2」・・・等の問題番号を示す文字を含む問題文804、805、「氏名」の欄や問題文の欄を囲む矩形状の枠を表示する直線状の枠画像806などが、印刷やプリント等によって予め記載されている。また、上記テスト用紙の文書8には、テストを受けた者が、「氏名」807や解答としての数字808、あるいは解答としての文章809や棒グラフ等の図形810が手書きによって記載されている。
【0063】
また、上記テスト用紙の文書8には、図6に示すように、左上の隅等の所定位置に、矩形状や十字状等の所定の形状に形成された位置合わせ用の認識マーカ811が印刷やプリント等によって予め記載されている。
【0064】
そして、上記共通画像認識手段111は、入力された各ページの画像データに付加された位置合わせ用の認識マーカ811を検出し、当該認識マーカ811の検出結果に基づいて、入力された各ページの画像データの位置を調整するように構成されている。そのため、各ページの文書8に印刷等された図形801や文字画像802等に、用紙8の端部からのずれがページ毎に存在する場合であっても、認識マーカ811の位置を基準として、入力された各ページの画像データの位置を調整することにより、各ページに共通する画像を誤差なく認識することが可能となる。
【0065】
更に説明すると、上記共通画像認識手段111は、図7に示すように、各ページの画像を読み取った画像データに用紙8の端部からの全体的な位置ずれがある場合であっても、例えば、認識マーカ811から文字画像803等までのx方向及びy方向の距離Dx,Dyを基準にして、文字画像803に外接する矩形のx方向の幅W及びy方向の高さHが求められ、各ページの画像データの位置を調整するように構成されている。そして、この共通画像認識部111は、図8に示すように、入力された各ページの画像データのうち、1ページ目と2ページ目の画像データの共通画像を認識し、当該認識結果と3ページ目の画像データの共通画像を認識し、以降同様に前ページまでの認識結果と現ページの画像データの共通画像を認識するように構成されている。
【0066】
その際、上記共通画像認識手段111では、入力された各ページの画像データにビット膨張処理を施して共通画像を認識するように構成されている。つまり、上記各ページの画像が図6に示すように枠体状の画像806である場合には、1ページ目の画像データと2ページ目の画像データとが1ビット程度でもずれると、枠体状の画像806を共通画像として認識できない虞れがある。
【0067】
そこで、この実施の形態では、特に、図9に示すように、枠体状の画像806のようにビット数が少ない画像の場合に、枠体状の画像806を縦方向及び横方向にビット数を1ビットから数ビットだけ増加させるビット膨張処理を施した上で、共通画像を認識するように構成されている。
【0068】
また、上記共通画像抽出部112は、入力された各ページの画像データから、前記共通画像認識手段111によって認識された各ページに共通する共通画像を抽出するように構成されている。そして、この共通画像抽出部112によって抽出された共通画像は、第1のメモリ121の共通画像記憶部125に記憶される。
【0069】
さらに、上記共通画像除去部113では、入力された各ページの画像データから、前記共通画像抽出部112によって抽出された共通画像を除去する処理が行なわれ、各ページの画像データ毎に異なる非共通画像が求められる。この共通画像除去部113によって求められた非共通画像は、第2のメモリ122の非共通画像記憶部126に記憶される。
【0070】
又、上記T/I分離部114は、入力された各ページの画像データを、文字画像等からなるテキスト(Text)部と、図形等の画像からなるイメージ(Image)部とに分離するためのものである。T/I分離部114は、公知のテキスト/イメージ分離手段によって構成されている。このT/I分離部114によって分離された各ページの画像データのテキスト部とイメージ部の情報は、個別にT/I分離結果127として第3のメモリ123に適宜読み出し可能に記憶されるようになっている。
【0071】
また、上記矩形切り出し部115は、各ページの共通画像と非共通画像から、前記T/I分離部114によって分離されたテキスト部の画像とイメージ部の画像を、少なくとも1つ以上の矩形部分に切り出すように構成されている。この矩形切り出し部115による矩形状の画像の切り出しは、図8に示すように、入力画像データの共通画像及び非共通画像の中から、イメージ画像やテキスト画像を、例えば、カラー複合機のユーザーインターフェースに設けられたタッチパネルやマウス等によって対角線状に左上の角841と右下の角842とを指定することによって行われる。また、上記矩形切り出し部115による矩形状の画像の切り出しは、図10に示すように、「氏名」の文字803などのテキスト画像やイメージ画像に外接する矩形状部分843から、所定ビット数だけ外側の矩形状の領域844を、自動的に切出すことによって行なうように構成しても良い。なお、隣接する「氏名」等の文字であっても、両者の間隔が所定のビット数よりも小さければ、同じ矩形状の領域844として切出されるようになっている。
【0072】
上記OCR部116では、前記切り出し部115によって矩形状に切り出された画像のうち、T/I分離部114によってテキスト部として分離された画像データが、文字認識されて文字コードに変換される。
【0073】
さらに、上記ファイル生成部117では、入力画像データのうち、共通画像と非共通画像の画像データに基づいて、これら共通画像と非共通画像の画像データを別々に電子化して、PDFファイルやポストスクリプト等のファイルデータを生成するようになっている。
【0074】
以上の構成において、この実施の形態に係る画像データ処理装置では、次のようにして、複数ページからなる入力画像データに対して、各ページの画像データに共通の画像と非共通の画像とを識別して、非共通画像は勿論のこと共通画像は共通画像として処理することにより、データ量を大幅に削減することが可能となっている。
【0075】
すなわち、この実施の形態に係る画像データ処理装置100が適用された画像処理システム1では、図2に示すように、複数ページにわたる文書8等の画像が画像読取装置としてのスキャナー2又はスキャナー9によって読み取られ、当該スキャナー2、9によって読み取られた複数ページにわたる文書8等の画像データは、図1に示すように、画像データ処理装置100が装着された画像出力装置としてのカラー複合機3に入力される。なお、上記スキャナー2、9によって読み取られた複数ページにわたる文書8としては、例えば、図6に示すように、学校や学習塾等で用いられるテスト用紙や、企業のオフィスや役所等で使用される定型の文書などが挙げられる。
【0076】
上記画像データ処理装置100には、図1に示すように、画像読取装置としてのスキャナー2、9によって読み取られた複数ページにわたる文書8の画像データが入力され、当該入力された画像データは、共通画像認識部111によって、当該入力された複数ページからなる画像データに基づいて、各ページに共通する共通画像が認識される。上記共通画像認識部111によって認識される文書8の画像データとしては、例えば、2値化された画像データが用いられるが、多値のままの画像データを用いるように構成しても良い。また、カラー画像の場合には、色を問わず画像データのある部分は、画像とみなすようになっている。
【0077】
例えば、図8に示すように、学期末テストの氏名や解答が書き込まれたテスト用紙8の複数ページからなる画像データ800が入力されると、共通画像認識部111では、図11に示すように、1ページ目の画像データと、2ページ目の画像データというように、各ページの画像データ800がビット単位で比較され、図12に示すように、共通画像821、822などが認識される。この共通画像認識部111によって認識された共通画像は、第1メモリ121の共通画像記憶部125に一時記憶される。次に、共通画像記憶部125に記憶された1ページ目の画像データと2ページ目の画像データとの共通画像は、共通画像認識部111によって、3ページ目の画像データと比較され、共通画像が認識されて、第1メモリ121の共通画像記憶部125に一時記憶される。
【0078】
このように、上記共通画像認識部111では、入力された各ページの画像データのうち、1ページ目と2ページ目の画像データの共通画像を認識し、図8に示すように、1ページ目と2ページ目の画像データの共通画像が識別される。次に、上記記共通画像認識部111では、1ページ目と2ページ目の画像データの共通画像として識別された結果と、3ページ目の画像データの共通画像を認識するというように、入力された各ページの画像データのうち、nページ目とn+1ページ目の画像データの共通画像を識別し、当該識別結果とn+2ページ目の画像データの共通画像を識別し、以降同様に前ページまでの識別結果と現ページの画像データの共通画像を識別するようになっている。この場合には、共通画像の識別が逐次行われるので、共通画像認識部111の構成が簡単で済む利点を有している。その結果、上記共通画像認識部111では、各ページの画像に共通する共通画像が識別され、この共通画像は、第1のメモリ121の共通画像記憶部125に記憶される。なお、上記共通画像認識部111では、すべてのページの画像データを同時に比較し、共通画像を識別するように構成しても良い。
【0079】
次に、上記共通画像抽出部112では、共通画像認識部111による各ページの画像データを比較した結果である共通画像の認識結果に基づいて、図8に示すように、共通画像831が抽出される。この共通画像抽出部112によって抽出された共通画像831は、第1のメモリ121の共通画像記憶部125に記憶される。
【0080】
次に、共通画像除去部113では、図8に示すように、第1のメモリ121の入力画像記憶部124に記憶された各ページの画像データから、共通画像抽出部112で抽出されて共通画像記憶部125に記憶された共通画像831が除去され、各ページで異なる非共通画像832が求められる。これらの非共通画像832は、第2のメモリ122の非共通画像記憶部126に記憶される。
【0081】
その後、上記第1のメモリ121の共通画像記憶部125に記憶された共通画像831と、第2のメモリ122の非共通画像記憶部126に記憶された非共通画像832は、図1に示すように、T/I分離部114によって、テキスト部とイメージ部とが分離される。上記共通画像では、図8に示すように、学期末テスト等の文書のタイトルを示す文字画像802、「氏名」を書く欄に記載された「氏名」の文字803、「問1」、「問2」・・・等の問題番号を示す文字を含む問題文804、805からなるテキスト部と、テスト用紙を作成した会社や科目等を表示したマーク等の図形801や、「氏名」の欄や問題文の欄を囲む矩形状の枠を表示する直線状の枠画像806からなるイメージ部とが分離され、これらのテキスト部とイメージ部の分離結果は、第3のメモリ123にT/I分離結果として記憶される。
【0082】
また、上記非共通画像832では、図8に示すように、テストを受けた者の「氏名」807や、解答としての数字808、あるいは解答としての文章809からなるテキスト部と、棒グラフ等の図形810からなるイメージ部とが分離され、これらのテキスト部とイメージ部の分離結果は、第3のメモリ123にT/I分離結果として記憶される。
【0083】
次に、上記T/I分離部114によってテキスト部とイメージ部とに分離された共通画像831と非共通画像832は、矩形切り出し部115によって矩形状の切り出し枠851、852・・・で、図8、図13及び図14に示すように、テキスト部とイメージ部の各画像データ毎に切り出される。
【0084】
上記画像データ処理装置100の処理操作を指示するカラー複合機3等のユーザーインタフェース(選択手段)118(図1参照)では、矩形状に切り出された画像を、ビットマップで生成するかOCR部116によって文字コードを生成するかを選択することができるようになっている。
【0085】
そして、上記矩形切り出し部115によって矩形状に切り出されたテキスト部の各画像データは、例えば、OCR部116によって文字認識され、文字コードに変換される。
【0086】
最後に、入力された画像データは、テキスト画像の認識された文字コードや文字の大きさ、文字の位置等のデータ、及びイメージ画像のイメージの内容及び位置等のデータが、ファイル生成部117によってファイル化されて、図15に示すように、共通部分の1番目のヘッダと当該1番目の共通部分であるイメージ1のデータ、次に、共通部分の2番目のヘッダと当該2番目の共通部分であるテキスト1のデータ・・・、1 ページ目の非共通部分の1番目のヘッダと当該1番目の非共通部分であるデータ、次に、非共通部分の2番目のヘッダと当該2番目の非共通部分であるデータ・・・、2ページ目の非共通部分の1番目のヘッダと当該1番目の非共通部分であるデータ、次に、非共通部分の2番目のヘッダと当該2番目の非共通部分であるデータ・・・というように、ファイルが生成される。このファイルの種類としては、PDFファイルやポストスクリプトファイルなど、任意の種類のものであっても良いことは勿論である。
【0087】
したがって、数十ページに及ぶ文書等であっても、共通画像は1つの画像データのみで良いため、数十ページに及ぶ文書等の画像データを記憶したり、プリントあるいは転送したりする場合であっても、少ないデータ量で短時間に行うことができる。
【0088】
このように、上記実施の形態に係る画像データ処理装置100では、複数ページからなる入力画像データに対して、各ページの画像データに共通の画像831と非共通の画像832とを判別して、個別に処理することにより、共通画像831は、1つで済み、各ページ毎に共通画像をデータとして備える必要はないため、データ量を大幅に削減することが可能となっている。
【図面の簡単な説明】
【0089】
【図1】図1はこの発明の実施の形態1に係る画像データ処理装置を示すブロック図である。
【図2】図2はこの発明の実施の形態1に係る画像データ処理装置を適用した画像処理システムを示す構成図である。
【図3】図3はこの発明の実施の形態1に係る画像データ処理装置を適用した画像出力装置としてのカラー複合機を示す構成図である。
【図4】図4はこの発明の実施の形態1に係る画像データ処理装置を適用した画像出力装置としてのカラー複合機の画像形成部を示す構成図である。
【図5】図5はこの発明の実施の形態1に係る画像データ処理装置を適用し得る画像読取装置を示す構成図である。
【図6】図6はこの発明の実施の形態1に係る画像データ処理装置によって画像が処理される文書を示す説明図である。
【図7】図7はこの発明の実施の形態1に係る画像データ処理装置による画像処理の動作を示す説明図である。
【図8】図8はこの発明の実施の形態1に係る画像データ処理装置による画像処理の動作を示す説明図である。
【図9】図9はこの発明の実施の形態1に係る画像データ処理装置による画像処理の動作を示す説明図である。
【図10】図10はこの発明の実施の形態1に係る画像データ処理装置による画像処理の動作を示す説明図である。
【図11】図11はこの発明の実施の形態1に係る画像データ処理装置による画像処理の動作を示す説明図である。
【図12】図12はこの発明の実施の形態1に係る画像データ処理装置による画像処理の動作を示す説明図である。
【図13】図13はこの発明の実施の形態1に係る画像データ処理装置による画像処理の動作を示す説明図である。
【図14】図14はこの発明の実施の形態1に係る画像データ処理装置による画像処理の動作を示す説明図である。
【図15】図15はこの発明の実施の形態1に係る画像データ処理装置によって作成されるファイルを示す図表である。
【符号の説明】
【0090】
100:画像データ処理装置、101:共通画像認識部、112:共通画像抽出部、113:共通画像除去部、114:T/I分離部、115:矩形切り出し部、116:OCR部、117:ファイル生成部。

【特許請求の範囲】
【請求項1】
入力された複数ページからなる画像データに対して所定の処理を施す画像データ処理装置において、
前記入力された複数ページからなる画像データに基づいて、各ページに共通する共通画像と各ページ毎に異なる非共通画像を識別する画像識別手段と、
前記画像識別手段によって識別された各ページに共通する共通画像と各ページ毎の非共通画像を別にファイル化するファイル生成手段とを備えたことを特徴とする画像データ処理装置。
【請求項2】
前記画像識別手段が、前記入力された複数ページからなる画像データに基づいて、各ページに共通する共通画像を認識する共通画像認識手段と、
前記入力された各ページの画像データから前記共通画像認識手段によって認識された共通画像を抽出する共通画像抽出手段と、
前記入力された各ページの画像データから前記共通画像抽出手段によって抽出された共通画像を除去して、各ページ毎に異なる非共通画像を得る共通画像除去手段とを備えていることを特徴とする請求項1に記載の画像データ処理装置。
【請求項3】
前記共通画像認識手段は、前記入力された各ページの画像データに付加された位置合わせ用の認識マーカを検出し、当該認識マーカの検出結果に基づいて、前記入力された各ページの画像データの位置を調整することを特徴とする請求項2に記載の画像データ処理装置。
【請求項4】
前記共通画像認識手段は、前記入力された各ページの画像データにビット膨張処理を施して共通画像を認識することを特徴とする請求項2又は3に記載の画像データ処理装置。
【請求項5】
前記共通画像認識手段は、前記入力された各ページの画像データのうち、nページ目とn+1ページ目の画像データの共通画像を認識し、当該認識結果とn+2ページ目の画像データの共通画像を認識し、以降同様に前ページまでの認識結果と現ページの画像データの共通画像を認識することを特徴とする請求項2乃至4のいずれかに記載の画像データ処理装置。
【請求項6】
前記画像識別手段によって識別された共通画像と非共通画像を、テキスト部とイメージ部に分離する分離手段と、前記分離手段によって分離されたテキスト部は、少なくとも1つ以上の矩形部分に切り出す切り出し手段とを備え、当該切り出し部によって切り出された矩形部分を、ページ数と認識マーカからの位置情報と当該矩形部分を示すx,y方向の長さ情報で管理することを特徴とする請求項1に記載の画像データ処理装置。
【請求項7】
前記切り出し手段によって切り出された矩形部分のテキスト画像を、文字認識ソフトを用いて文字認識を行い、当該認識された文字画像データを文字コード化することを特徴とする請求項6に記載の画像データ処理装置。
【請求項8】
前記切り出し手段によって切り出された矩形部分の画像を、ビットマップデータとして生成するか文字コードとして生成するかを選択する選択手段を備えたことを特徴とする請求項7に記載の画像データ処理装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate


【公開番号】特開2006−201935(P2006−201935A)
【公開日】平成18年8月3日(2006.8.3)
【国際特許分類】
【出願番号】特願2005−11540(P2005−11540)
【出願日】平成17年1月19日(2005.1.19)
【出願人】(000005496)富士ゼロックス株式会社 (21,908)
【Fターム(参考)】