説明

画像処理システム及び画像処理方法

【課題】 イメージ情報をベクトルデータに変換したときの変換結果情報をユーザが容易に確認することができる画像処理システム及び画像処理方法を提供する。
【解決手段】 入力装置113から入力されたイメージ情報は、データ処理装置115によってベクトル化され、さらにベクトル化に成功したベクトルデータが画像データに変換される。そして、入力されたイメージ情報と変換された画像データとが合成されて合成画像データが生成されて出力される。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、入力されたイメージ情報を汎用の文書作成アプリケーションソフトウェア等で再利用可能なベクトルデータに変換する画像処理システム及び画像処理方法に関する。
【背景技術】
【0002】
近年、環境問題に対する関心が高まっている中、オフィス等でのペーパーレス化が急速に進んでいる。これに伴って、従来からバインダー等で蓄積されていた紙文書をスキャナで読み取ってポータブルドキュメントフォーマット(以下、「PDF」と記す。)に変換して、画像記憶装置にデータベースとして蓄積するようにした文書管理システムが知られている。
【0003】
さらに、紙文書をスキャナで読み取って、原稿に記載されている文字、図或いは表等をOCR(Optical Character Recognition)技術やエッジ抽出等の画像処理を施すことにより、文字、図或いは表をベクトルデータとして生成することができる画像処理システムも知られている(例えば、特許文献1)。
【特許文献1】特開平5−342408号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
しかしながら、上述したベクトルデータを生成する従来の画像処理システムでは、ベクトル化された画像中のオブジェクトをユーザが確認するためには、表示装置を用いて、ユーザが目視によって、どの部分がベクトル化されたかを確認する必要があった。
【0005】
一方、高価な表示装置を搭載することが難しい廉価な画像処理システム(例えば、複合機能を有する複写機やファクシミリ装置等のデジタル複合機(MFP))では、イメージ情報から変換されたベクトルデータを一旦当該画像処理システムに接続するパーソナルコンピュータ(PC)等に転送し、PC上でベクトルデータを表示又はプリンタで印刷出力することになるが、単にPC上でベクトルデータを表示したりプリンタで印刷出力しただけでは、元の画像に近い画像が表示、印刷されるだけであり、どの部分がベクトルデータに変換されたのかが判別できないものであった。
また、ベクトル化処理を行った場合、どのような処理をそれぐらいの量行ったかなどの情報を得ることのできないものであった。
【0006】
本発明は、このような事情を考慮してなされたものであり、イメージ情報をベクトルデータに変換したときの変換結果情報をユーザが容易に確認することができる画像処理システム及び画像処理方法を提供することを目的とする。
【課題を解決するための手段】
【0007】
上記課題を解決するために、本発明に係る画像処理システムは、
イメージ情報を入力する入力手段と、
前記イメージ情報をベクトル化するベクトル化手段と、
前記イメージ情報がベクトル化されたことを識別可能に前記イメージ情報を印刷装置に出力する出力手段と
を備えることを特徴とする。
【0008】
また、上記課題を解決するために、本発明に係る画像処理方法は、
イメージ情報を画像処理装置に入力する入力工程と、
前記イメージ情報をベクトル化するベクトル化工程と、
前記イメージ情報がベクトル化されたことを識別可能に前記イメージ情報を印刷装置に出力する出力工程と
を有することを特徴とする。
【0009】
さらに、上記課題を解決するために、本発明に係る画像処理システムは、
イメージ情報を入力する入力手段と、
前記入力手段で入力された前記イメージ情報をベクトル化するベクトル化手段と、
前記ベクトル化手段によるベクトル化処理結果を示す結果レポートを出力する出力手段と
を備えることを特徴とする。
【0010】
さらにまた、上記課題を解決するために、本発明に係る画像処理方法は、
イメージ情報を画像処理装置に入力する入力工程と、
前記入力工程で入力されたイメージ情報をベクトル化するベクトル化工程と、
前記ベクトル化工程によるベクトル化処理結果を示す結果レポートを出力する出力工程と
を有することを特徴とする。
【発明の効果】
【0011】
本発明によれば、イメージ情報をベクトルデータに変換したときの変換結果情報をユーザが容易に確認することができる。
【発明を実施するための最良の形態】
【0012】
以下、図面を参照して、本発明の好適な実施形態に係る画像処理システム及び画像処理方法について説明する。
【0013】
図1は、本発明の一実施形態に係る画像処理システムの構成を示すブロック図である。図1に示す画像処理システムは、一例として、オフィス10とオフィス20とをインターネット等のネットワーク104で接続された環境で実現される。
【0014】
オフィス10内に構築されたLAN107には、MFP100と、MFP100を制御するマネージメントPC101と、クライアントPC102と、文書管理サーバ106aと、そのデータベース105a及びプロキシサーバ103aが接続されている。また、オフィス20内に構築されたLAN108には、文書管理サーバ106bと、そのデータベース105b及びプロキシサーバ103bが接続されている。尚、クライアントPC102は、外部記憶部、検索イメージ入力部及び検索結果出力部を備えている。また、LAN107及びオフィス20内のLAN108は、プロキシサーバ103a、103bを介してインターネット等のネットワーク104に接続されている。
【0015】
MFP100は、本実施形態において紙文書を光学的に読み取って画像信号に変換する画像読み取り処理と、読み取った画像信号に対する画像処理の一部を担当し、画像信号はLAN109を用いてマネージメントPC101に入力する。尚、マネージメントPC101は、通常のPCでも実現可能であり、内部に画像記憶部、画像処理部、表示部及び入力部を備える。尚、マネージメントPC101は、その一部又は全部の機能をMFP100に組み込んで一体化して構成してもよい。
【0016】
さらに、マネージメントPC101には、RAM(Random Access Memory)やハードディスク記憶装置等の各種記憶手段が内臓可能であって、入力された画像データ、画像データから生成されたベクトルデータ、或いはベクトル処理を行った結果に関する情報を保持することができる。
【0017】
図2は、本発明の一実施形態に係るMFP100の構成を示すブロック図である。尚、MFP100に対する操作者の指示は、MFP100に装備されているキー等の入力装置113、或いはマネージメントPC101のキーボードやマウス等からなる入力装置から行われ、これら一連の動作はデータ処理装置115内の制御部で制御される。
【0018】
図2において、オートドキュメントフィーダ(以下、「ADF」と略す。)を含む画像読み取り部110は、束状或いは1枚の原稿画像を内部に備える光源で照射し、原稿反射像をレンズで固体撮像素子上に結像し、固体撮像素子からラスタ状の画像読み取り信号を例えば600dpiの密度のイメージ情報(例えば、ビットマップ画像)として得る。そして、通常の複写機能を用いる場合は、この画像信号をデータ処理部115で記録信号へ画像処理し、複数毎複写の場合は記憶装置111に一旦1ページ分の記録データを保持した後、印刷装置112に順次出力して紙上に画像を形成する。
【0019】
一方、クライアントPC102から出力されるプリントデータは、LAN107からMFP100に入力され、ネットワークIF114を経てデータ処理装置115で記録可能なラスタデータに変換された後、印刷装置112に出力して紙上に記録画像として形成される。
【0020】
一方、操作入力の状態表示及び処理中の画像データの表示は、MFP100の表示装置116又は、マネージメントPC101、クライアントPC102のモニタ等で行われる。尚、記憶装置111は、画像読み取り部110で読み取られ、データ処理装置115でデータ処理が施された画像データを格納する。尚、データ処理装置115は、CPU、ROM、RAM等を具備しており、本実施形態に係る制御プログラム及び各種データを保持する。また、記憶装置111は、マネージメントPC101からも制御可能であり、MFP100とマネージメントPC101とのデータの授受及び制御は、ネットワークIF117及び直結したLAN109を用いて行われる。
【0021】
[画像処理の概要]
次に、本発明の一実施形態に係る画像処理システムによる画像処理全体の概要について説明する。図3は、本発明の一実施形態に係る画像処理システムによる画像処理の手順について説明するためのフローチャートである。ここでは、図3のフローチャートを用いて紙原稿を読み取ってイメージ情報を取得し、当該イメージ情報をベクトル化して、その変換処理結果に関する情報を出力する処理について説明する。
【0022】
まず、MFP100における画像読み取り部110を動作させて1枚の原稿をラスタ走査し、例えば、600dpi、8ビットの画像信号を得る(原稿スキャン処理:ステップS301)。尚、当該画像信号は、データ処理装置115で前処理を施して記憶装置111に1ページ分の画像データ(例えば、ビットマップ画像)として保存する。
【0023】
次に、データ処理装置115内のCPU、或いはマネージメントPC101のCPUにより、記憶装置111に格納された画像信号から、まず文字/線画部分とハーフトーンの画像部分とに領域を分離する。そして、文字部分はさらに段落で塊として纏まっているブロック毎に、或いは、線で構成された表、図形に分離し各々セグメント化する。一方、ハーフトーンで表現される画像部分は、矩形に分離されたブロックの画像部分、背景部等のいわゆるブロック毎に独立したオブジェクトに分割する(BS処理:ステップS302)。尚、ステップS302のBS処理は、上述した処理内容に限定されることはなく、属性ごとの領域(ブロック)に分割する処理をその他の手順で行うようにしてもよい。
【0024】
次に、OCR/OMR処理を行うことにより、文字ブロックに対して、文字のサイズ、スタイル、字体等の文字認識を行い、原稿画像中に含まれる文字に対して、文字コード、文字種、文字オブジェクトの存在位置情報等が生成され、記憶装置111に保存される(ステップS303)。
【0025】
次いで、ベクトル化処理及び図形認識処理が行われる(ステップS304)。まず、ベクトル化処理では、矩形(ブロック)ごと、色ごと、或いはオブジェクトごとのベクトル化が実施される。すなわち、ベクトル化処理とは、画像データ(ビットマップ画像)からベクトルデータへの変換処理であって、オリジナルの電子ファイルに近い電子ファイルに変換される。
【0026】
本実施形態では、まず、ステップS303でOCR/OCM処理された文字ブロックに対して、さらに文字のサイズ、スタイル、字体を認識し、アウトラインフォントを用いることによって、原稿を走査して読み取られた文字に可視的に忠実なフォントデータに変換することでベクトルデータを生成する。一方、線で構成される表、図形ブロック等に対しては、エッジを抽出してアウトライン化することでベクトルデータを生成する。また、写真等の画像ブロックに対しては、イメージ情報として個別のJPEGファイルとして処理する。尚、これらのベクトル化処理は各オブジェクト毎に行い、さらに各オブジェクトのレイアウト情報を電子ファイルとして記憶装置111に保存しておく。
【0027】
次に、置換色が指示されているか否かを判定する(ステップS305)。その結果、置換色が指示されている場合(Yes)、ベクトルデータ色置換処理を行う(ステップS306)。一方、置換色が指示されていない場合(No)は、ステップS307に移行する。
【0028】
ステップS306のベクトルデータ色置換処理では、既に生成されたベクトルデータの色を変換するための処理が実施される。本実施形態では、例えば、ベクトルデータの全てを赤色に変換するようにする。図4は、ベクトル変換後のデータであるSVGベクトルデータの一例を示す図である。また、図20は、図4に示されるSVGベクトルデータで描画された図形の一例を示す図である。図4に示されるSVGベクトルデータ(円のベクトルデータ)がベクトル変換後のデータとする場合、円を示すXMLタグ”<circle”の色属性”stroke=blue”が、赤である”stroke=red”に書き換えられる。そして、色置換処理が終了した後、ステップS307に進む。
【0029】
尚、ベクトルデータの色を変える方法は上記色置換処理に限定されることはない。例えば、ステップS304のベクトル化処理時に、図4に示すようなベクトルデータを生成する際に、予め色属性を赤”stroke=red”とすればよい。
【0030】
ステップS307では、画像データの合成を行うか否かの指示があるか否かを判定する。その結果、画像合成指示があると判定された場合(Yes)は、画像データの合成処理を実行し(ステップS308)、ステップS309に移行する。一方、ステップS307で画像合成指示がないと判定された場合(No)は、ステップ309へ移行する。
【0031】
ステップS308の画像データ合成処理では、ステップS304で生成されたベクトルデータを一旦ビットマップのラスタ画像データに変換し、ベクトル変換前の原画像データと合成する。図5及び図6は、それぞれ本実施形態に係る画像データ合成処理によって合成された合成画像データの一例を示す図である。尚、画像データの合成処理の詳細については後述する。
【0032】
そして、ステップS309では、各種出力処理(加工、蓄積、伝送、記録等)が実行される。すなわち、入力されるカラー又はグレースケールのビットマップ画像データ、ベクトルデータ或いはベクトル変換の処理結果(例えば、変換されたオブジェクト数、表や図形等のオブジェクト種別等)に対する処理が行われる。
【0033】
このように本実施形態に係る画像処理システムでは、ユーザがベクトル変換前の画像オブジェクトとベクトル変換後の画像オブジェクトとを瞬時に比較して、適切にベクトル化が行われているかを一目で識別することができるように、画像データとベクトルデータ、及びベクトル変換処理の結果を出力先の形式にあわせて変換するようにする。例えば、プリント用のビットマップ画像やPDL(Page Description Language)、電子メール用のデータ形式やリモートPCのWebブラウザで参照できる形式であるHTML(Hyper Text Markup Language)に変換する。尚、それらの処理の詳細は後述する。
【0034】
そして、次のステップとして、ベクトルデータに変換されたデータをそれぞれ、図2に示す印刷装置112、マネージメントPC101の電子メール送信機能やWebサーバ機能によりネットワークを介して電子メールクライアントやWebブラウザを搭載したPCクライアント102に対して(電子メールサーバ経由で)送信する。尚、電子メール送信機能やWebサーバ機能の詳細は公知であるので、ここではその説明を省略する。このように、ベクトル処理の結果を紙にプリントする以外にも、ネットワーク等に接続されたPC上のWebクライアントや電子メールクライアントを用いることで、ビットマップ画像をベクトルデータに変換する画像処理システムの利便性を大幅に向上させることが可能となり、さらに大幅なコストダウンも可能となる。
【0035】
さて、これらの処理を行うことにより、ビットマップ画像を用いる場合に比べて情報量が削減できる。その結果、蓄積効率の向上や伝送時間の短縮が実現でき、さらに記録表示する際には高品位なデータとして再生することができるので、非常に優位となる。尚、記録処理を行うに当たっては、ベクトルデータからラスタ画像データに変換する必要があるが、詳細は後述する。また、本実施形態で上述した処理は、マネージメントPC101及びその表示装置・周辺装置において実現することとするが、これに限定されることはなく、MFP100のデータ処理装置115と表示装置116、入力装置113等により実現しても良い。以下、各処理の詳細について説明する。
【0036】
[ブロックセレクション処理]
図7は、ブロックセレクション処理によって読み取った1枚のイメージデータを属性を判定し複数のブロックに分割する様子を示す図である。すなわち、ブロックセレクション処理とは、符号71に示すステップS301で読み取った一頁のイメージデータを、符号72に示すようにオブジェクト毎の塊として認識し、それぞれのブロックを文字(TEXT)、写真(PHOTO)、線(LINE)、表(TABLE)等の属性に判定し、異なる属性を持つ領域(ブロック)に分割する処理である。
【0037】
ブロックセレクション処理の一実施形態を以下に説明する。
【0038】
まず、入力画像を白黒に2値化して、輪郭線追跡を行って黒画素輪郭で囲まれる画素の塊を抽出する。そして、面積の大きい黒画素の塊については、内部にある白画素に対して同様に輪郭線追跡を行って白画素の塊を抽出する。さらに、一定面積以上の白画素の塊の内部からも再帰的に黒画素の塊を抽出する。尚、上記処理は、白地に黒字等で記載されている原稿の場合の処理であって、それ以外の場合は背景に相当する色を「白」、オブジェクトに相当する色を「黒」とすることにより同様に処理することができる。
【0039】
このようにして得られた黒画素の塊を、大きさ及び形状等で分類し、異なる属性を持つ領域へ分類する。例えば、縦横比が1に近く、大きさが一定の範囲のものを文字相当の画素塊とし、さらに近接する文字が整列良くグループ化可能な部分を文字領域とする。また、扁平な画素塊を線領域、一定の大きさ以上でかつ四角系の白画素塊を整列よく内包する黒画素塊の占める範囲を表領域、不定形の画素塊が散在している領域を写真領域、それ以外の任意形状の画素塊を図画領域等とする。これにより、1枚の原稿を読み取って作成した電子データの再利用に対してより高度な制限等を設けることができる。
【0040】
図8は、ブロックセレクション処理で得られた各ブロックに対するブロック情報の一例について示す図である。図8に示されるブロック毎の情報は、後述するベクトル化或いは検索のための情報として用いられる。
【0041】
[ベクトル化処理]
次に、図3のステップS304で示されるベクトル化処理について説明する。まず、文字ブロックに対しては各文字に対して文字認識処理を行う。
【0042】
《文字認識処理》
文字認識処理のため、本実施形態では文字単位で切り出された画像に対し、パターンマッチングの一手法を用いて認識を行い、対応する文字コードを得る。この認識処理は、文字画像から得られる特徴を数十次元の数値列に変換した観測特徴ベクトルと、あらかじめ字種毎に求められている辞書特徴ベクトルと比較し、最も距離の近い字種を認識結果とする処理である。尚、特徴ベクトルの抽出には種々の公知手法があり、例えば、文字をメッシュ状に分割し、各メッシュ内の文字線を方向別に線素としてカウントしたメッシュ数次元ベクトルを特徴とする方法を用いることができる。
【0043】
ブロックセレクション処理(ステップS302)で抽出された文字領域に対して文字認識を行う場合、まず該当領域に対して横書き、縦書きの判定を行い、各々対応する方向に行を切り出し、その後文字を切り出して文字画像を得る。横書き、縦書きの判定は、該当領域内で画素値に対する水平/垂直の射影を取り、水平射影の分散が大きい場合は横書き領域、垂直射影の分散が大きい場合は縦書き領域と判断すればよい。
【0044】
また、文字列及び文字への分解は、横書きの場合は水平方向の射影を利用して行を切り出し、さらに切り出された行に対する垂直方向の射影から、文字を切り出す。一方、縦書きの文字領域に対しては、水平と垂直を逆にすればよい。尚、文字のサイズは切り出した大きさに基づいて検出することができる。
【0045】
《フォント認識処理》
文字認識の際に用いられる字種数分の辞書特徴ベクトルを、文字形状種、すなわちフォント種に対して複数用意し、マッチングの際に文字コードとともにフォント種を出力することで、文字のフォントを認識することができる。
【0046】
《文字のベクトル化処理》
本実施形態では、文字のベクトル化に際して、前述した文字認識及びフォント認識よって得られた文字コード及びフォント情報を用いて、各々あらかじめ用意されたアウトラインデータを用いて、文字部分の情報をベクトルデータに変換する。尚、元の原稿がカラー原稿の場合は、カラー画像から各文字の色を抽出してベクトルデータとともに記録する。
【0047】
以上の処理により、文字ブロックに属するイメージ情報を形状、大きさ、色ともにほぼ忠実なベクトルデータに変換することができる。これにより、高品位な文字データを取り扱うことが可能になる。
【0048】
《文字以外の部分のベクトル化処理》
ステップS302のブロックセレクション処理で、図画或いは線、表領域とされた領域を対象として、それぞれ抽出された画素塊の輪郭をベクトルデータに変換する。具体的には、輪郭を成す画素の点列を角とみなされる点で区切って、各区間を部分的な直線或いは曲線で近似する。ここで、「角」とは、曲率が極大となる点である。
【0049】
図9は、曲率が極大となる点を説明するための図である。図9に示すように、任意点Piに対して左右k個の離れた点Pi-k〜Pi+kの間に弦を引いたとき、この弦とPiの距離が極大となる点として求められる。さらに、Pi-k〜Pi+k間の弦の長さ/弧の長さをRとし、Rの値が閾値以下である点を角とみなすことができる。角によって分割された後の各区間は、直線は点列に対する最小二乗法等を用いて、曲線は3次スプライン関数等を用いてベクトル化することができる。
【0050】
また、対象が内輪郭を持つ場合、ブロックセレクション処理で抽出した白画素輪郭の点列を用いて、同様に部分的直線或いは曲線で近似する。
【0051】
以上のように、輪郭の区分線近似を用いることによって、任意形状の図形のアウトラインをベクトル化することができる。尚、入力される原稿がカラーの場合は、カラー画像から図形の色を抽出してベクトルデータとともに記録する。
【0052】
図10は、外輪郭が内輪郭又は別の外輪郭と近接している場合に太さを持った線として表現する例について説明するための図である。図10に示すように、ある区間で外輪郭が、内輪郭又は別の外輪郭が近接している場合、2つの輪郭線を一まとめにし、太さを持った線として表現することができる。具体的には、ある輪郭の各点Piから別輪郭上で最短距離となる点Qiまで線を引き、各距離PQiが平均的に一定長以下の場合、注目区間はPQi中点を点列として直線又は曲線で近似し、その太さはPQiの平均値とする。線や線の集合体である表罫線は、前記したような太さを持つ線の集合として、効率よくベクトル表現することができる。
【0053】
尚、文字ブロックに対する文字認識処理を用いたベクトル化については前述したように、当該文字認識処理の結果、辞書からの距離が最も近い文字を認識結果として用いる。ここで、この距離が所定値以上の場合は、必ずしも本来の文字に一致するとは限らず、形状が類似する文字に誤認識するような場合が多い。従って、本実施形態では、このような文字に対しては上述したように、一般的な線画と同様に扱って当該文字をアウトライン化する。すなわち、従来は文字認識処理で誤認識を起こしていたような文字でも、誤った文字にベクトル化されることなく、可視的にイメージデータ(ビットマップ画像)に忠実なアウトライン化によるベクトル化を行うことができる。また、写真と判定されたブロックに対しては、本実施形態ではベクトル化せずに、イメージデータ(ビットマップ画像)のままとする。
【0054】
尚、一頁分のビットマップ画像をブロックセレクション処理(ステップS302)し、ベクトル化処理(ステップS304)した結果は、図12に示す様な中間データ形式のファイルとして変換されている。本実施形態では、このようなデータ形式をドキュメント・アナリシス・アウトプット・フォーマット(DAOF)と呼ぶこととする。
【0055】
図11は、一頁分のイメージデータをブロックセレクション処理(ステップS302)及びベクトル化処理(ステップS304)によって変換された結果として得られる中間データ形式のファイルのデータ構造を示す図である。図11に示すようなデータ形式は、ドキュメント・アナリシス・アウトプット・フォーマット(DAOF)と呼ばれる。すなわち、図11は、DAOFのデータ構造を示す図である。
【0056】
図11において、1101はHeader(ヘッダ)であり、処理対象の文書画像データに関する情報が保持される。1102はレイアウト記述データ部であり、文書画像データ中のTEXT(文字)、TITLE(タイトル)、CAPTION(キャプション)、LINEART(線画)、PICTURE(自然画)、FRAME(枠)、TABLE(表)等の属性毎に認識された各ブロックの属性情報とその矩形アドレス情報を保持する。文字認識記述データ部1103では、TEXT、TITLE、CAPTION等のTEXTブロックを文字認識して得られる文字認識結果を保持する。表記述データ部1104では、TABLEブロックの構造の詳細を格納する。画像記述データ部1105は、PICTUREやLINEART等のブロックのビットマップ画像を切り出して保持する。
【0057】
[図形認識処理]
ここでは、上述したように任意形状の図形のアウトラインをベクトル化した後、これらのベクトル化された区分線を図形オブジェクト毎にグループ化する処理について説明する。
【0058】
図12は、ベクトルデータを図形オブジェクト毎にグループ化するまでの処理手順を説明するためのフローチャートである。まず、各ベクトルデータの始点、終点を算出する(ステップS1201)。次に、各ベクトルの始点、終点情報を用いて、図形要素を検出する(ステップS1202)。ここで、図形要素の検出とは、区分線が構成している閉図形を検出することである。検出に際しては、閉形状を構成する各ベクトルはその両端にそれぞれ連結するベクトルを有しているという原理を応用して検出を行う。
【0059】
次に、図形要素内に存在する他の図形要素又は区分線をグループ化し、一つの図形オブジェクトとする(ステップS1203)。尚、図形要素内に他の図形要素又は区分線が存在しない場合は、図形要素を図形オブジェクトとする。
【0060】
図13は、図形要素を検出する処理手順(ステップS1202)の詳細を説明するためのフローチャートである。まず、ベクトルデータから両端に連結していない不要なベクトルを除去し、閉図形構成ベクトルを抽出する(ステップS1301)。次に、閉図形構成ベクトルの中から当該ベクトルの始点を開始点とし、時計回りに順にベクトルを追っていく。そして、開始点に戻るまで追跡を行い、通過したベクトルを全て一つの図形要素を構成する閉図形としてグループ化する(ステップS1302)。尚、この際に、閉図形内部にある閉図形構成ベクトルも全てグループ化する。さらに、まだグループ化されていないベクトルの始点を開始点とし、同様の処理を繰り返す。最後に、ステップS1301で除去された不要ベクトルのうち、ステップS1302で閉図形としてグループ化されたベクトルに接合しているものを検出し、一つの図形要素としてグループ化する(ステップS1303)。
【0061】
以上の処理によって、図形ブロックを個別に再利用可能な個別の図形オブジェクトとして扱うことが可能になる。
【0062】
[画像データの合成処理]
画像データの合成処理では、ステップS304で生成されたベクトルデータを一旦ビットマップのラスタ画像データに変換し、ベクトル変換前の原画像データと合成する。画像データの合成処理について図5と図6を用いて説明する。
【0063】
図5の合成画像501は前記原画像データとベクトルデータとを重ね合わせる処理をせずに、並べて合成した例である。図5において、502は、原画像のビットマップ画像データ部分である。一方、503がベクトルデータから変換されたラスタ画像データである。本実施形態では、部分画像503と部分画像504とがベクトル化に失敗したとして仮定する。尚、原画像502の下側に原画像である旨を示すために文字列「変換前画像」509がビットマップ上に展開されている。
【0064】
一方、図5において、画像505はステップS304で生成されたベクトルデータを一旦ビットマップのラスタ画像データに変換したものである。尚、図5では、ベクトル化への変換が成功した部分画像506、507、508のみで構成されている。また、図5では、説明を簡略化するために、ブロック(矩形)内の画像のベクトル変換が全て成功した場合に画像505の領域に変換後の画像を載せている。実際は、部分画像503内の「木」の画像オブジェクトのベクトル変換が成功した場合は、右の変換後の画像505内に「木」の画像オブジェクトが埋め込まれることとなる。
【0065】
一方、図6の画像601は前記原画像とベクトルデータとを重ね合わせて合成した例である。ここで、図6に示すような出力形態において、白黒画像で表現した場合に、変換が成功した画像部分とそうでない部分とを単純にOR条件で重ね合わせると、それぞれの違いを人間が目で見て区別することができない。そこで、図6に示すように本実施形態ではそれを一目で判別できるように工夫がされている。
【0066】
例えば、ベクトル変換が失敗して原画像の部分画像を表示している場合は、その部分画像の領域602、603にはハッチングパターン等を重畳して表示する。これにより、ベクトル化できなかった部位をユーザが一目で容易に判別することができる。具体的な画像作成手順としては、原画像においてベクトル変換が成功した原画像の画素を白等で埋める。次に、その画素の領域をハッチングパターンで重畳する。そして、ベクトル変換されたベクトルデータをラスタ画像データに変換して、原画像データに重畳する。尚、ここでの処理はハッチング以外、グレーデータに変換して、ベクトル化されなかったことが容易に判別できるように加工するなどしてもよい。
【0067】
尚、上述した実施形態については画像を出力する印刷装置が白黒画像を出力する場合であることを前提として説明した。ここで、画像出力手段である印刷装置がカラー画像を扱う能力がある前提で説明する。このような場合は、例えば、図5に示す例では、原画像とベクトル変換された画像を区別するためにそれぞれの出力色を別々にしたり、ベクトル化に成功したオブジェクトと失敗したオブジェクトで異なる色属性値を与えるようにする。或いは、原画像の輝度成分のみを抽出してグレースケール画像に変換する等の処理を行う。次に、ベクトル変換されたベクトルデータをもと色のまま色の変化をさせずに原画像に上書きする。或いは、ベクトルデータ色変換処理として特定の色に変換するようにしてもよい。すなわち、ベクトル化されたオブジェクトの色属性値を当該オブジェクトが有していた色属性と異なる色属性値に変換するようにしてもよい。
【0068】
[各種出力処理]
次に、図3のステップS309の加工、蓄積、伝送、記録等の各種出力処理の詳細について説明する。
【0069】
≪ベクトルデータのラスタ画像データ変換処理≫
図4のSVGベクトルデータと図20のSVG描画例を用いて、ベクトルデータをラスタ画像データに変換する処理について説明する。
【0070】
図4は、インターネット標準を標準化するW3C標準化委員会で標準化されたSVG(Scalable Vector Graphics)の記述フォーマットで記載したSVGベクトルデータである。図1のマネージメントPC101又は図2のMFP100のデータ処理装置115に登載されたデータ処理部は、SVGベクトルデータを解析するパーサ処理を含む。そして、当該パーサは、ベクトルデータで記載されたオブジェクト(例えば、<svg>と</svg>とで囲まれたデータ)を解釈し、描画処理を実行し、記憶装置111にラスタ画像データとして格納する。
【0071】
例えば、図4に示すオブジェクトデータは、円の描画で幅12cm、高さ14cmの矩形領域に左上隅から水平方向に6cm、垂直方向に7cmの位置を円の中心とし、半径4cmの円を塗りつぶしなしに、青線で描画したオブジェクトであることを示している。尚、ベクトルデータのラスタ画像データ変換処理は、上記パーサの結果を元にして対応する描画関数(例えば、円描画関数)が搭載されている。例えば、前述のSVGオブジェクトデータに円描画関数を実行すると、図7に示すような画像が、データ処理装置115内やマネージメントPCのRAMや記憶装置111に格納される。
【0072】
≪ベクトルデータの記録(プリント)処理≫
ベクトルデータがプリントされるまでの処理の流れについて説明する。例えば、図4に示すベクトルデータは、前述したベクトルデータのラスタ画像データ変換処理によってラスタ画像データに変換された後、記憶装置111に格納される。その後、図20に示すようなラスタ画像データが、印刷装置112により記録用紙上にプリントされる。
【0073】
≪プリント対象≫
次に、原画像データ、ベクトル変換されたベクトルデータ、及びベクトル変換結果情報がどのようにプリントされるかについて、いくつかの具体的なプリントパターンを例に挙げて説明する。ここで、図14は、原画像データの一例を示す図である。また、図15は、図14に示す原画像をベクトル化したベクトルデータを画像化した図である。さらに、図16は、ベクトル変換した結果をレポート化した変換結果情報を示す図である。
【0074】
<パターン1>
(1)原画像として、例えば図14に示す画像をプリントする。
(2)次に、ベクトルデータとして、例えば図15に示す画像をプリントする。
【0075】
<パターン2>
(1)原画像として、例えば図14に示す画像をプリントする。
(2)次に、ベクトルデータとして、例えば図15に示す画像をプリントする。
(3)次に、変換結果情報として、例えば図16に示すレポートをプリントする。
【0076】
次に、画像合成が指示されて図3に示すフローチャートの画像データ合成処理(ステップS308)で生成した画像データをプリントするパターンについて説明する。
【0077】
<パターン3>
(1)例えば、図5に示す合成画像をプリントする。
【0078】
<パターン4>
(1)例えば、図5に示す合成画像をプリントする。
(2)次に、変換結果情報として、例えば図16に示すレポートをプリントする。
【0079】
<パターン5>
(1)例えば、図6に示す合成画像をプリントする。
【0080】
<パターン6>
(1)例えば、図6に示す合成画像をプリントする。
(2)次に、変換結果情報として、例えば図16に示すレポートをプリントする。
【0081】
尚、上述したプリントパターンにおいては、いずれの記録レイアウト(例えば、両面プリントや同じ記録面に複数の画像をプリントする等)、いずれの印刷順序であっても良い。また、どのようなベクトル化処理(線画、表など)が行われたのかを注釈として付加するなどしてもよいし、さらにベクトル化処理が行われなかったオブジェクト(イメージなど)の処理種別を注釈として付加してもよい。
【0082】
≪変換結果情報≫
原画像データをベクトルデータに変換する際に抽出される情報は、例えば図16に示すようなベクトルデータ変換結果レポートで出力(プリント、電子メール送信、HTMLデータ送信等のインターネットプロトコルによる送信)される。そして、その表示内容には、変換オブジェクト総数(文字数除く)、文字列を含む領域の数、文字オブジェクト数、表オブジェクト数、図形オブジェクト数、ラスタ画像等の画像オブジェクト数等が含まれる。尚、以上の処理は、図3に示すフローチャートのBS(ブロックセレクション)処理(ステップS302)で認識したブロック(矩形)単位で行われる。もちろん、このほか、オブジェクトの大きさなど上記以外の情報が付加されてもいいし、上記のうちのいずれかであってもよい。
【0083】
≪電子メールデータ変換≫
次に、原画像データ、ベクトル変換されたベクトルデータとベクトル変換結果情報がどのよう電子メールデータに変換されるか図17を用いて説明する。図17は、電子メールデータの一例を示す図である。電子メールデータは全て文字コードで記述されたてテキストデータであり、”---Boundary---”という区切り文字列で分割されている。
【0084】
図17において、1個めの区切り文字列171よりも上は、電子メールヘッダが記述されている。また、2個目の区切り文字列172の上の領域は、メールの内容、ジョブ番号、画像処理装置の名称、処理日時、処理時間、添付ファイルの内容、及び図3のフローチャートにおけるベクトル化と図形認識(ステップS304)の変換処理結果を表したベクトルデータ変換結果レポート情報が記述される。
【0085】
さらに、次の3個目の区切り文字列173の上の領域は図14に示すような原画像のTIFF(Tagged image file format)のデータファイルをBASE64変換でバイナリデータを文字列に変換したデータである。尚、これはJPEG画像であってもかまわない。
【0086】
次の4個目の区切り文字列174の下の領域は、図15に示すようなベクトルデータであるSVG(Scalable Vector Graphic)データをBASE64変換でバイナリデータを文字列に変換したデータである。尚、これは、ベクトルデータをラスタデータに変換したTIFFやJPEG画像であってもかまわない。
【0087】
一方、図18は、画像合成データを電子メールデータに変換した例を示す図である。図18において、2つめの区切り文字列182の上までは、図17と同様である。図18において、3つめの区切り文字列183の上の領域は、図14や図15に示すような原画像とベクトルデータを合成した画像のJPEGデータファイルをBASE64変換でバイナリデータを文字列に変換したデータである。
【0088】
≪HTMLデータ変換≫
Webサーバを介してリモートのPC上のWebクライアントに原画像データ、ベクトル変換されたベクトルデータ、ベクトル変換結果情報、或いは画像合成データ等を送信するためには、一旦HTMLデータに変換する必要がある。そこで、当該変換処理について図19を用いて簡単に説明する。
【0089】
図19は、HTMLデータの一例を示す図である。図19において、11行目までは前述した電子メールデータと同様に、メールの内容、ジョブ番号、画像処理装置の名称、処理日時、処理時間、添付ファイルの内容である。そして、13行目の<P><IMG src=”images/iRC3200_9999.tif”></P>が、図17に示す電子メールデータと同様に原画像データのTIFFファイルである。また、15行目の<P><IMG src=”images/iRC3200_9999.svg”></P>がベクトルデータであるSVGファイルである。さらに、次の16行目からは電子メールデータと同様にベクトルデータ変換結果レポートが記載されている。
【0090】
以上説明したように、本実施形態によれば、ビットマップ画像をベクトルデータに変換する画像処理システムにおいて、画像処理システム自身に必ずしも高価な表示装置を備える必要がなく、その分のコストを低減するともに当該画像処理システムの利便性を向上させることが可能となる。例えば、複合機能を有する複写機やファクシミリ装置等のMFPに対して、ビットマップ画像をベクトルデータに変換する機能を搭載させても、ベクトルデータの変換結果を確認する際には上記方法を使用することで、価格の高騰を抑えることができる。
【0091】
以上、実施形態例を詳述したが、本発明は、例えば、システム、装置、方法、プログラム若しくは記憶媒体等としての実施態様をとることが可能であり、具体的には、複数の機器から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。
【0092】
尚、本発明は、前述した実施形態の機能を実現するソフトウェアのプログラム(実施形態では図に示すフローチャートに対応したプログラム)を、システムあるいは装置に直接あるいは遠隔から供給し、そのシステムあるいは装置のコンピュータが該供給されたプログラムコードを読み出して実行することによっても達成される場合を含む。
【0093】
従って、本発明の機能処理をコンピュータで実現するために、該コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明は、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。
【0094】
その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等の形態であっても良い。
【0095】
プログラムを供給するための記録媒体としては、例えば、フロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、MO、CD−ROM、CD−R、CD−RW、磁気テープ、不揮発性のメモリカード、ROM、DVD(DVD−ROM,DVD−R)などがある。
【0096】
その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページに接続し、該ホームページから本発明のコンピュータプログラムそのもの、もしくは圧縮され自動インストール機能を含むファイルをハードディスク等の記録媒体にダウンロードすることによっても供給できる。また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバも、本発明に含まれるものである。
【0097】
また、本発明のプログラムを暗号化してCD−ROM等の記憶媒体に格納してユーザに配布し、所定の条件をクリアしたユーザに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせ、その鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。
【0098】
また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される他、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部または全部を行い、その処理によっても前述した実施形態の機能が実現され得る。
【0099】
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によっても前述した実施形態の機能が実現される。
【図面の簡単な説明】
【0100】
【図1】本発明の一実施形態に係る画像処理システムの構成を示すブロック図である。
【図2】本発明の一実施形態に係るMFP100の構成を示すブロック図である。
【図3】本発明の一実施形態に係る画像処理システムによる画像処理の手順について説明するためのフローチャートである。
【図4】ベクトル変換後のデータであるSVGベクトルデータの一例を示す図である。
【図5】本実施形態に係る画像データ合成処理によって合成された合成画像データの一例を示す図である。
【図6】本実施形態に係る画像データ合成処理によって合成された合成画像データの一例を示す図である。
【図7】ブロックセレクション処理によって読み取った1枚のイメージデータを属性を判定し複数のブロックに分割する様子を示す図である。
【図8】ブロックセレクション処理で得られた各ブロックに対するブロック情報の一例について示す図である。
【図9】曲率が極大となる点を説明するための図である。
【図10】外輪郭が内輪郭又は別の外輪郭と近接している場合に太さを持った線として表現する例について説明するための図である。
【図11】DAOFのデータ構造を示す図である。
【図12】ベクトルデータを図形オブジェクト毎にグループ化するまでの処理手順を説明するためのフローチャートである。
【図13】図形要素を検出する処理手順(ステップS1202)の詳細を説明するためのフローチャートである。
【図14】原画像データの一例を示す図である。
【図15】図14に示す原画像をベクトル化したベクトルデータを画像化した図である。
【図16】ベクトル変換した結果をレポート化した変換結果情報を示す図である。
【図17】電子メールデータの一例を示す図である。
【図18】画像合成データを電子メールデータに変換した例を示す図である。
【図19】HTMLデータの一例を示す図である。
【図20】図4に示されるSVGベクトルデータで描画された図形の一例を示す図である。
【符号の説明】
【0101】
100 デジタル複合機(MFP)
101 マネージメントPC
102 クライアントPC
103a、103b プロキシサーバ
104 ネットワーク
105a、105b データベース
106a、106b 文書管理サーバ
107、108、109 LAN
110 画像読み取り部
111 記憶装置
112 印刷装置
113 入力装置
114、117 ネットワークI/F
115 データ処理装置
116 表示装置

【特許請求の範囲】
【請求項1】
イメージ情報を入力する入力手段と、
前記イメージ情報をベクトル化するベクトル化手段と、
前記イメージ情報がベクトル化されたことを識別可能に前記イメージ情報を印刷装置に出力する出力手段と
を備えることを特徴とする画像処理システム。
【請求項2】
前記イメージ情報からベクトル化に成功したベクトルデータを画像データに変換する変換手段と、
前記ベクトル化手段によるベクトル化が実行されていないイメージ情報と前記変換手段で変換された前記画像データとを合成して合成画像データを生成する合成手段とをさらに備え、
前記出力手段が、前記合成画像データを含む変換結果情報を出力する
ことを特徴とする請求項1に記載の画像処理システム。
【請求項3】
前記合成手段が、前記ベクトル化手段によるベクトル化が実行されていない前記イメージ情報と前記変換手段で変換された前記画像データとを並べた合成画像データを生成することを特徴とする請求項2に記載の画像処理システム。
【請求項4】
前記合成手段が、前記ベクトル化手段によってベクトル化された部分とベクトル化されなかった部分とを区別して前記合成画像データを生成することを特徴とする請求項2に記載の画像処理システム。
【請求項5】
前記イメージ情報を複数のオブジェクトに分割する分割手段をさらに備え、
前記ベクトル化手段が、前記分割手段によって分割されたそれぞれのオブジェクトを独立にベクトル化する
ことを特徴とする請求項2に記載の画像処理システム。
【請求項6】
前記出力手段が、前記複数のオブジェクトのうち、前記ベクトル化手段によってベクトル化されたオブジェクトのオブジェクト数又は該オブジェクトの種類の内訳を含む前記変換結果情報を出力することを特徴とする請求項5に記載の画像処理システム。
【請求項7】
前記変換結果情報を電子メールデータに変換するデータ変換手段と、
前記電子メールデータを電子メールを用いて指定されたアドレス宛てに送信する送信手段と
をさらに備えることを特徴とする請求項2から6までのいずれか1項に記載の画像処理システム。
【請求項8】
前記データ変換手段が、前記変換結果情報を電子メールの添付ファイルとした電子メールデータに変換することを特徴とする請求項7に記載の画像処理システム。
【請求項9】
前記変換結果情報を所定の格納先に格納する格納手段をさらに備え、
前記出力手段が、前記格納手段に格納された前記変換結果情報の格納先に関する情報を出力する
ことを特徴とする請求項2から8までのいずれか1項に記載の画像処理システム。
【請求項10】
前記入力手段が、紙原稿を光学的に読み取って得られた前記イメージ情報を入力することを特徴とする請求項1から9までのいずれか1項に記載の画像処理システム。
【請求項11】
前記変換結果情報をHTMLデータに変換するデータ変換手段と、
前記HTMLデータをWebサーバを介して接続されているWebクライアントに転送する転送手段とさらに備え、
前記送信手段が、前記転送手段により転送された前記HTMLデータが格納されている格納先に関する情報を送信する
ことを特徴とする請求項7又は8に記載の画像処理システム。
【請求項12】
前記ベクトル化手段が、ベクトル化に成功したオブジェクトと失敗したオブジェクトで異なる色属性値を与えることを特徴とする請求項5に記載の画像処理システム。
【請求項13】
前記ベクトル化手段によってベクトル化されたオブジェクトの色属性値を該オブジェクトが有していた色属性と異なる色属性値に変換する色置換手段をさらに備えることを特徴とする請求項12に記載の画像処理システム。
【請求項14】
イメージ情報を画像処理装置に入力する入力工程と、
前記イメージ情報をベクトル化するベクトル化工程と、
前記イメージ情報がベクトル化されたことを識別可能に前記イメージ情報を印刷装置に出力する出力工程と
を有することを特徴とする画像処理方法。
【請求項15】
イメージ情報が入力されたコンピュータに、
前記イメージ情報をベクトル化するベクトル化手順と、
前記イメージ情報がベクトル化されたことを識別可能に前記イメージ情報を印刷装置に出力する出力手順と
を実行させるためのプログラム。
【請求項16】
イメージ情報を入力する入力手段と、
前記入力手段で入力された前記イメージ情報をベクトル化するベクトル化手段と、
前記ベクトル化手段によるベクトル化処理結果を示す結果レポートを出力する出力手段と
を備えることを特徴とする画像処理システム。
【請求項17】
前記入力手段で入力された前記イメージ情報を複数のオブジェクトに分割する分割手段をさらに備え、
前記ベクトル化手段が、前記分割手段によって分割されたそれぞれのオブジェクトを独立にベクトル化する
ことを特徴とする請求項16に記載の画像処理システム。
【請求項18】
前記出力手段が、前記複数のオブジェクトのうち、前記ベクトル化手段によってベクトル化されたオブジェクトのオブジェクト数又は該オブジェクトの種類の内訳を含む前記結果レポートを出力することを特徴とする請求項17に記載の画像処理システム。
【請求項19】
前記出力手段が、前記結果レポートを記録媒体上に形成して印刷出力することを特徴とする請求項16から18までのいずれか1項に記載の画像処理システム。
【請求項20】
前記結果レポートを電子メールデータに変換するデータ変換手段をさらに備え、
前記出力手段が、前記電子メールデータを電子メール送信時に指定されたアドレス宛てに送信することを特徴とする請求項16から19までのいずれか1項に記載の画像処理システム。
【請求項21】
前記結果レポートをHTMLデータに変換するデータ変換手段と、
前記HTMLデータをWebサーバを介して接続されているWebクライアントに転送する転送手段とさらに備え、
前記出力手段は、前記転送手段により転送された前記HTMLデータが格納されている格納先に関する情報を出力する
ことを特徴とする請求項16から20までのいずれか1項に記載の画像処理システム。
【請求項22】
イメージ情報を画像処理装置に入力する入力工程と、
前記入力工程で入力されたイメージ情報をベクトル化するベクトル化工程と、
前記ベクトル化工程によるベクトル化処理結果を示す結果レポートを出力する出力工程と
を有することを特徴とする画像処理方法。
【請求項23】
イメージ情報が入力されたコンピュータに、
前記イメージ情報をベクトル化するベクトル化手順と、
前記ベクトル化手順によるベクトル処理結果を示す結果レポートを出力する出力手順と
を実行させるためのプログラム。
【請求項24】
請求項15又は23に記載のプログラムを格納したことを特徴とするコンピュータ読み取り可能な記録媒体。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate