説明

画像処理装置、画像処理方法、プログラム、及び記憶媒体

【課題】スキャンしたイラストの境界部に滲みが出る問題において、滲みに対応するラベル領域を同定し、隣接する他の領域に統合処理することにより、色領域を正確に分離しベクトル化する手法を可能にする。
【解決手段】画像入力手段と、入力した画像を色領域に分ける色領域分割手段と、個別のラベルを色領域に付与するラベリング手段と、ラベルが付与された色領域であるラベル領域の形状特徴を表わす情報を含むラベル形状情報を求めるラベル形状解析手段と、ラベル形状情報に基づいて、ラベルを付与されたラベル領域が微小領域かどうか判定する微小領域判定手段と、微小領域と判定された領域を隣接する領域に統合する微小領域統合手段を有し、入力の滲みに対応するラベル領域をラベル形状から判断し、隣接する領域に統合する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像処理技術に関するものである。より詳細には、本発明はスキャンした画像のイラストの境界部における滲みを解消させるための画像処理装置、画像処理方法、プログラム、および記憶媒体に関する。
【背景技術】
【0002】
近年、情報の電子化が進み、紙文書をそのまま保存するのではなく、スキャナ等により電子化して保存したり、その電子データを他装置に送信したりするシステムが普及してきている。送信コストを削減するため、電子化された文書に対して高い圧縮性が要求されている。一方、電子データの圧縮においては、電子化データを部分的に編集出来る再利用性と、拡大や縮小を行っても画質が落ちない高画質性とが要求されている。
【0003】
ところが、文書データに文字領域や写真領域が混在する場合、文字領域に適した圧縮を行うと画質は良いが圧縮率が低くなり、写真領域に適した圧縮を行うと圧縮率は高いが文字が劣化してしまう問題がある。そこで、次のような手法が提案されている。まず、電子化された文書データ(文書画像)を文字領域や写真領域に分離し、再利用性と高画質性が重視される文字領域をベクトルデータに変換する。そして、それ以外の簡易にベクトル化できない写真領域等をJPEGで圧縮し、各領域の圧縮結果を合成して出力することにより、文書画像の高圧縮性、再利用性、高画質性を実現する手法が提案されている(特許文献1を参照)。
【0004】
また文字領域だけでなく、数色の均等色で構成され、輪郭がはっきりしている特徴を持つ図形領域(イラストやクリップアート、線画と一般的に呼ばれる)をベクトル処理の対象とする手法も提案されている(特許文献2を参照)。ここで提案されている方式は、入力画像に対して色の類似度を使って入力画像の色数を減色し、次に各色領域の輪郭線を抽出した後に関数近似を行って色情報を加えてベクトルデータを出力するものである。
【0005】
スキャン画像のベクトル化を行うには入力画像に含まれるスキャンノイズを低減し、原画像の輪郭を抽出する必要があるが、その前処理として減色処理が必要となる。クラスタリングを用いる場合、最初にクラスタリングで色数をある程度絞った後、後処理で類似色のクラスタ同士を統合することでより正確な色分離を行う手法が取られてきた。例えば特許文献3ではクラスタリングを行った結果に対し、所定の閾値よりも小さい画素数をもつクラスタを削除する手法が提示されている。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2004−265384号公報
【特許文献2】特開2006−344069号公報
【特許文献3】特開2006−344069号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
イラストには細い線画領域や強いエッジ成分を含むものもあるが、こういった画像を処理すると該領域の周辺に滲みが発生し、滲みによって発生した色が入力画像と異なる色になるため、以降の画像処理においても悪影響を与えてしまう。また、滲みが発生した領域に対して本来不要であったベクトルデータが生成されてしまうため、結果としてベクトルデータのサイズは大きくなり、データの再利用性も悪くなるという課題がある。
【0008】
また、ベクトルフォーマットでは対応しているレンダラの性能限界により、レンダリング可能な線幅に下限があるものがある。細い線形状のノイズを含んだ画像をベクトル化し、レンダリング可能な線幅に下限があるベクトルフォーマットで出力すると、図4に示すように線形状のノイズが実際よりも太く表示され、線が滲んで見えるようになり、画質が劣化して見える問題もある。例えば、元の原稿画像では1本の線画像であった部分が、色の誤差により2本の平行な線状領域にクラスタリングされ、各線状領域をベクトル化すると2つの隣接する細い線を表すベクトルデータが生成されることになる。このベクトルデータの線幅がレンダリング可能な下限よりも細い場合、レンダリングしたときに太く再現されてしまうので、2本の線が存在する部分が滲んだように太く見えてしまう。例えば、図4の左側のように100%で表示した時、ベクトルデータの線幅がレンダリング可能な線幅より細いため、線が滲んだように再現される。なお、その滲んだように見えている部分を400%に拡大して見ると、図4の右側のように、ベクトルデータの線幅に基づいて正確に拡大再生されるので、2本のベクトルデータが元の1本の線のように見えることもある。
【課題を解決するための手段】
【0009】
上記課題を解決するために、本発明に係る画像処理装置は読み取った画像を入力する画像入力手段と、前記入力した画像を色領域に分ける色領域分割手段と、個別のラベルを前記各色領域に付与するラベリング手段と、前記ラベルが付与された色領域であるラベル領域の形状特徴を表わす情報を含むラベル形状情報を求めるラベル形状解析手段と、前記ラベル形状解析手段で求めたラベル形状情報に基づいて、前記ラベルを付与されたラベル領域が微小領域かどうか判定する微小領域判定手段と、前記微小領域と判定された領域を隣接するラベルに統合する微小領域統合手段とを備えることを特徴とする。
【0010】
また、本発明に係る画像処理方法は、読み取った画像を入力する画像入力工程と、前記入力した画像を色領域に分ける色領域分割工程と、個別のラベルを前記各色領域に付与するラベリング工程と、前記ラベルが付与された色領域であるラベル領域の形状特徴を表す情報を含むラベル形状情報を求めるラベル形状解析工程と、前記ラベル形状解析工程で求めたラベル形状情報に基づいて、前記ラベルを付与されたラベル領域が微小領域かどうか判定する微小領域判定工程と、前記微小領域と判定された領域を隣接するラベルに統合する微小領域統合工程とを備えることを特徴とする。
【発明の効果】
【0011】
本発明は、色領域を分割してラベルを付与したラベル領域の形状特徴を表わすラベル形状情報に基づいて微小領域を判定する。そして、判定した微小領域を他の領域と統合するので、細い線画領域や強いエッジ成分近辺に色が滲み出る問題を解決し、精度が高い色成分の分離が出来る。このため、イラストをベクトル化した際のデータ量が削減でき、かつ部品としての再利用性を向上させることが可能になる。
【図面の簡単な説明】
【0012】
【図1】本発明の実施形態1に係る画像処理装置の機能構成を示すブロック図である。
【図2】図1に示す画像処理装置を実現したディジタル複合機(MFP)の主要部構成を例示するブロック図である。
【図3】実施形態1におけるイラスト領域のベクトル化処理の概略を説明するためのフローチャートである。
【図4】レンダリング可能な線幅に上限があるベクトルフォーマットで細い線状のノイズ領域を残したままベクトル化した表示結果を示す図である。
【図5】実施形態1の画像処理において圧縮、スキャン等による線画領域に発生する色の滲み出る一例を示す図である。
【図6】イラスト領域分割処理を説明するためのフローチャートである。
【図7】微小領域の再処理を説明するフローチャートである。
【図8】線形状判定を行う対象のラベルと抽出情報例である。
【図9】実施形態1の画像処理において微小領域の統合処理を実行した例である。
【図10】1画素ずつ統合処理を行う例を示した図である。
【発明を実施するための形態】
【0013】
<実施形態1>
以下、図面を参照して本発明に係る画像処理装置を用いたイラスト画像の色分離処理について詳細に説明する。ただし、この実施の形態に記載されている構成要素はあくまで例示であり、本発明の技術的範囲は特許請求の範囲によって確定されるのであって以下の個別の実施形態によって限定されるものではない。
【0014】
図1は、本発明の実施形態に係る画像処理装置の構成を示すブロック図である。画像処理装置は、イラストのベクトル化処理における色分離処理を行う機能を有する。
【0015】
図1において、画像入力部10は、例えば、スキャナ等の画像読取手段を介して紙情報から入力されたモノクロまたはカラー画像データの入力を受け付ける。グラフィックス領域抽出部11は入力画像から属性が文字でもない写真でもないグラフィックス領域を抽出する。属性が文字の場合には、ベクトル化の対象となり、属性が写真の場合には、ベクトル化の対象とはならず、例えばJPEG等での圧縮処理が行なわれる。本実施形態では、属性が文字および写真を除いたグラフィックス領域を抽出し、このグラフィックス領域からベクトル変換の対象となるイラスト領域を抽出する。色領域分離部12はイラスト領域を色成分に分ける。この色領域分離部12を用いて本実施形態の特徴的な処理が行なわれることになる。詳細については後述する。イラスト領域ベクトル変換部13はイラスト領域の色分離結果をベクトルデータに変換する。ベクトル出力部14は、イラスト領域ベクトル変換部13の処理結果得られるベクトルデータを出力する。
【0016】
図2は、図1に示す画像処理装置を実現した一実施形態であるディジタル複合機(MFP:Multifunction Peripheral)の主要部構成を示すブロック図である。尚、本実施形態では、画像処理装置として、スキャナ機能やプリンタ機能を有するディジタル複合機(MFP)を用いているが、汎用のスキャナとパーソナルコンピュータとを接続したシステムを当該画像処理装置として用いてもよい。
【0017】
図2に示すように、MFPは、画像処理装置の制御手段として機能するコントローラユニット2000を備えている。コントローラユニット2000は、画像入力デバイスであるスキャナ2070や画像出力デバイスであるプリンタ2095と、デバイスインタフェース(I/F)2020を介して接続する。そして、コントローラユニット2000は、スキャナ2070で原稿画像から読み取られた画像データをプリンタ2095によって印刷出力するコピー機能を実現するための制御を行うことが可能である。また、コントローラユニット2000は、LAN1006や公衆回線(WAN)1008を介して他装置との間でパターン画像やデバイス情報等の入出力を行うための制御を行うことが可能である。
【0018】
コントローラユニット2000は、図2に示すように、CPU2001を有している。CPU2001は、ROM2003に格納されているブートプログラムによりオペレーションシステム(OS)を立ち上げる。そして、このOS上でHDD(ハードディスクドライブ)2004に格納されているアプリケーションプログラムを実行することによって各種処理を実行する。CPU2001の作業領域として、RAM2002が用いられる。RAM2002はまた、CPU2001の作業領域だけでなく、画像データを一時記憶するための画像メモリ領域をも提供する。HDD2004は、上記アプリケーションプログラムとともに、画像データを格納する。
【0019】
CPU2001には、システムバス2007を介して、ROM2003やRAM2002が接続している。CPU2001には、操作部I/F(インタフェース)2006、ネットワークI/F(インタフェース)2010、モデム2050及びイメージバスI/F(インタフェース)2005が接続されている。
【0020】
操作部I/F2006は、タッチパネルを有する操作部2012とのインタフェースであり、操作部2012に表示する画像データを操作部2012に対して出力する。また、操作部I/F2006は、操作部2012においてユーザにより入力された情報をCPU2001に送出する。
【0021】
また、ネットワークI/F2010は、LAN1006に接続され、LAN1006を介してLAN1006に接続された各装置との間で情報の入出力を行う。モデム2050は、公衆回線1008に接続し、公衆回線1008を介して他装置との間で情報の入出力を行う。
【0022】
イメージバスI/F2005は、システムバス2007と画像データを高速で転送する画像バス2008を接続し、データ構造を変換するためのバスブリッジである。画像バス2008は、PCIバス又はIEEE1394から構成される。画像バス2008上には、ラスタイメージプロセッサ(RIP)2060、デバイスI/F2020、スキャナ画像処理部2080、プリンタ画像処理部2090、画像回転部2030、及び画像圧縮部2040が設けられている。
【0023】
RIP2060は、PDL(page description language)コードをビットマップイメージに展開するプロセッサである。デバイスI/F2020には、スキャナ2070及びプリンタ2095が接続され、画像データの同期系/非同期系の変換を行う。スキャナ画像処理部2080は、入力画像データに対して補正、加工、編集処理を行う。プリンタ画像処理部2090は、プリント出力画像データに対してプリンタの補正、解像度変換等を行う。画像回転部2030は、画像データの回転を行う。画像圧縮部2040は、多値画像データをJPEGデータに、ニ値画像データをJBIG、MMR、MH等のデータに圧縮するとともに、その伸長処理も行う。
【0024】
図3は、実施形態1におけるイラストベクトル化処理の概略を説明するためのフローチャートである。
【0025】
まず、画像入力部10において、スキャナより画像情報を入力し、カラー文書画像データを得る(ステップS310)。次に、グラフィックス領域抽出部11において、入力されたカラー文書画像を二値データに変換し、この二値画像データを文字、写真、表等の複数種類の領域に抽出して分離する。この領域分離処理を実現する一例として、米国特許第5680478号公報に記載の領域分離技術を用いることが出来る。尚、当該公報には、「Method and Apparatus for character recognition (Shin-Ywan Wang et al./Canon K.K.)」が記載されている。領域の属性が文字・写真・表のいずれでもないものを選択することでグラフィックス領域を抽出することができる(ステップS311)。この抽出されたグラフィックス領域に含まれる線画領域(図形領域)のことを本明細書ではイラスト領域と称する。
【0026】
次にイラスト領域の色領域分離部12において、各画素の色特徴及び各領域の連結等の情報に基づき各色領域に分ける(ステップS312)。このイラスト領域の色領域分割処理(色分離処理)の詳細については後述する。
【0027】
次にイラスト領域ベクトル変換部13において、分離された各色領域をベクトルデータに変換する(ステップS313)。このベクトル処理を実現する一例としては、例えば、特許第2885999号公報に記載の、二値画像の輪郭線の追跡を行い、その座標ベクトルを選択することによりベクトル化するものが挙げられる。
【0028】
最後に、ベクトルデータ出力部18(ステップS314)において、ベクトル化の結果を出力する。
【0029】
イラスト領域色分離処理(ステップS312)の詳細を、図5を用いて説明する。まず、ステップS701では、処理対象となるイラスト画像を入力する。このイラスト画像は、先に説明したように、領域の属性が文字・写真・表のいずれでもない領域の画像のことである。そして、ステップ702では、入力したイラスト画像の各画素の色特徴量に基づいてクラスタリング処理を行う。この処理では画像の左上に位置する画素を用いて最初のクラスタを生成する。そして、ラスタスキャン順に画素を見ていき、以降の全画素に対して、全てのクラスタ間との色特徴量の類似度を求める。類似度が高いほど、着目画素とクラスタとの特徴が近いと考えられる。ここでは、類似度の計算にRGB値を用いるが、他のカラー空間の情報、或いは、カラー以外の情報を特徴量として用いてもよい。そして、一番高い類似度と、この類似度に対応したクラスタ番号とを一時記録し、この類似度を事前に設定された閾値(第7の閾値)と比較する。類似度が閾値より高ければ、着目画素を、当該最も類似度が高かったクラスタに属させる。類似度が閾値より低ければ、着目画素を基に新たなクラスタを生成する。この処理は全ての画素を処理し終えるまで繰り返し実行する。
【0030】
次に、ステップS703では、先のステップS702のクラスタリング処理結果に基づき、クラスタ統合処理を行う。この処理では、画素数が小さいクラスタから順に取り出し、もっとも特徴情報が類似したクラスタを探索する。類似度の計算にRGB値を考えた場合、類似度は2つのクラスタ間の色距離を求めることで用いることができる。両クラスタが類似していると考えられる場合は両クラスタを統合し、すべてのクラスタに対してこの処理を行う。こうすることで所定の類似度内のクラスタを1つにまとめることが可能となる。
【0031】
図6は、実施形態1の画像処理においてクラスタ統合処理後に見られる圧縮、スキャン等によるイラスト中の細線・エッジ近辺に発生する色の滲みを示す図である。原画は図6(a)に示すように緑線、赤線、青線からなる画像であるとする。この画像をスキャナで読み取り、クラスタリングを用いて減色処理を行うと、主要な色線として、図6(b)に示すように緑線401、赤線402、青線403が得られる。一方で、図6(c)に示すように主要な色線付近に断片的な短い滲み線として、緑線401の付近にうすい緑線401’、赤線402の付近に黄色線402’、青線403の付近にうすい青線403’が生じることがある。すなわち、スキャンしたときに、主要な線分の一部が線分401〜403と別の色と判定され、別の線分401’〜403’として分離されてしまう場合がある。これらの別の線分は、結果としてベクトルデータのサイズを大きくし、レンダリング時の滲みの原因となり、またデータの再利用性も低減させてしまう。そこで以降の処理でこの領域を主要な色線に統合し、精度のよい色別画像の生成を行う必要がある。
【0032】
ステップS704では、先のステップS703のクラスタ統合処理の結果に基づき、ラベリング処理を行う。ラベリング処理とは、画素の集合に番号を付与することで画素を分類する処理のことである。このラベリング処理では、各クラスタ内に含まれるラベル領域の数を示す連結情報(ラベル数)、各ラベル領域の幅、及び各ラベル領域の外接矩形といった形状情報を含むラベル形状情報を求める。なお、ラベル領域の外接矩形とは、図8の点線に示すように、ラベル領域が外接する矩形のことであり、その内部にラベル領域を内包する矩形のことを示す。各ラベル領域は、それぞれ対応する外接矩形を有することになる。また、ラベル形状情報には、ラベルの画素数が含まれてもよい。
【0033】
そして、ステップS705では、上記のラベリング処理により求められた各ラベルの連結情報、及び各ラベル領域の形状特徴を含むラベル形状情報に基づき、再処理の必要があるラベル領域を微小領域として処理する(ラベル形状解析処理)。この微小領域の判定処理と統合処理については後で詳細に説明する。ステップS706で各色領域の2値画像を出力し、処理は終了となる。なお、出力された2値画像は、上述したようにベクトル変換されて出力されることになる。
【0034】
次に、S705に示した微小領域の判定処理および統合処理(再処理)について説明する。微小領域判定処理では、まず初めにラベルの形状を解析する。これは各ラベルの画素数やラベルの形状が線形状かどうかといった特徴を判断する処理である(線状微小領域判定処理)。これはベクトル化に不向きな領域を検出するために行う。画素数が非常に小さなラベルや線形状のラベルがこれに該当し、これらはデータ量の増加や、滲みの原因、編集性の低下などの問題を引き起こす。画素数が非常に小さなラベルや線形状のラベルはどちらもスキャンノイズが主に影響してクラスタリング結果に生じる。そのためこれらの領域はクラスタリング処理の結果として異なる色領域と判定されても、他のラベル領域と統合可能か判断し、ベクトル化処理に適した処理単位にする必要がある。
【0035】
なお、ラベルの画素数は、ラベル番号と、番号に対応するラベルの画素数との集計表を用意しておくことで、画像全体に対する1回のラスタ走査で得ることができる。ラスタスキャン後に各ラベルの画素数を第5の閾値と比較することで着目するラベルが微小領域かどうかを判断することができる。第5の閾値はいくつに設定してもよいが、入力スキャン画像が300dpiとすると、5画素未満のラベルは目視で確認することが困難であり、他の領域に統合されても視覚的な劣化を生じることが少ない。そこで本実施形態では第5の閾値を5とし、5画素未満の画素数のラベルを微小サイズと判断する。この第5の閾値は入力解像度や入力画像サイズに応じて異なる値を用いてもよい。例えば入力解像度や入力画像サイズが大きい場合、視覚的な劣化が検知できない画素数の上限値はもっと大きくなるため、大きい値を用いたほうが良い。
【0036】
またラベルが線形状の微小領域かどうか判定するための判定方式として、ここでは以下のような方式があると考えられる。図8に示したラベルを例として考える。このラベルの外接矩形の横幅が100ピクセル、縦幅が15ピクセル、ラベルの画素数が150ピクセルで、黒のラベルと白のラベルの境界に位置する画素数(境界線の長さ)が200ピクセルであるとする。
【0037】
例えば、第1の判定方式では、一方向の辺の長さに対するもう一方向の辺の長さの比(例えば外接矩形の長いほうと短いほうの長さの比)を求め、第1の閾値よりも大きい値であれば外接矩形が長細い形状をしているとしてラベルが線形状であると判断する。第1の閾値を例えば5とすると、この場合、
外接矩形の長手方向の長さ ÷もう一方の外接矩形長 = 6.67
となり、閾値の5よりも大きな値となるためラベルを線形状と判定することができる。
【0038】
第二の判定方式では外接矩形の面積とラベルの画素数との比を用いる。これは外接矩形の面積と実際のラベルの画素数の比を求め、第2の閾値以下であれば、外接矩形に占めるラベルの画素数が少ないと判断し、線形状のラベルと判断する。第2の閾値を例えば7とすると
外接矩形の面積 ÷ ラベルの画素数 = 10
となり、閾値の7よりも大きな値となるため、ラベルを線形状として判定することができる。
【0039】
第三の判定方式ではラベル同士の境界に位置する画素数(境界線の長さ)とラベルの画素数の比を用いる。これは他のラベルに接している境界線の長さ(周囲長)とラベルの画素数の比を求める。比の大きさが第3の閾値以上であれば、着目したラベルが線形状であると判断する。第3の閾値を例えば1.0とすると
他のラベルとの境界線の数 ÷ ラベルの画素数 = 1.33
となり、閾値の1.0よりも大きな値となるため、ラベルを線形状として判定することができる。
【0040】
以上のように微小領域を判定したのちに、微小領域の統合処理を行う。微小領域統合処理の流れを図7に示す。微小領域の統合手段では隣接した2つのラベル領域を統合するべきかどうか、先に判定した微小領域を表わす情報と両ラベルの類似度を用いて判断する。本実施例では類似度の指標としてRGB色空間での色距離とHSV色空間での色相を用いる。まずステップS4601で一方のラベルの画素数が第5の閾値以下の微小領域かどうかを判定する。微小サイズのラベルが一方に含まれると判定した場合、ステップS4606へ進み、当該2つの領域の色距離に関する閾値(第8の閾値)を設定する。このような微小なサイズとして残っているラベルはスキャンノイズが原因で発生した周囲を背景クラスタに囲まれた孤立点であると考えられる。よって第8の閾値を緩めに設定することでスキャンノイズをなくすことができる。すなわち、ステップS4601で一方のラベルの画素数が第5の閾値以下だった場合、色相の差を見ることなく、ステップS4607で2つのラベル間の色距離を第8の閾値と比較して、統合するかどうか判断する。
【0041】
ステップS4601で両方のラベルの面積が第5の閾値よりも大きいと判断した場合、ステップS4602で少なくとも一方のラベルが線形状であるかどうかを確認する。一方のラベルが線形状の場合、ステップS4604に処理を移す。両方のラベルが線形状でなかった場合、ステップS4603に処理を移す。
【0042】
ステップS4603では、少なくとも一方のラベルが第9の閾値以下かどうかを見る。これは画素数が大きいラベルが統合されるのを防ぐためである。2つのラベルの画素数がともに第9の閾値よりも大きい場合、ラベルの統合処理は行わないため判断処理を終了する。一方の画素数が第9の閾値以下の場合はステップS4605に処理を移す。
【0043】
ステップS4604では、当該線形状と判断されたラベルの幅が出力フォーマットにより定まる第4の閾値以下かどうかを判断する。第4の閾値はレンダリング可能な線幅の下限値(最小値)に基づいて決定される。線幅がレンダリング可能な線幅の下限値より小さいラベルをベクトル化し、当該ベクトル化後のデータをレンダラで表示した場合、着目しているラベルが正確な線幅で表示されず、画質が劣化する要因になってしまう。そこで線形状のラベルの線幅が第4の閾値以下である場合は色相の差を確認するステップS4605を省略し、ステップS4606においてラベル同士を統合するための色距離の閾値(第8の閾値)として緩めの値を設定する。こうすることで着目している線形状のラベルが統合されやすくする。
【0044】
なお、線幅が1または2のラベルの場合、当該ラベルが付与された領域の境界線(輪郭線)の長さ(1画素分の長さを1とする)が、ラベルの画素数以上になる。したがって、第4の閾値が2の場合は次のようにして判定すれば高速に判定できる。すなわち、ラベルの境界線長さとラベルの画素数との比(ラベルの境界線長さ/ラベルの画素数)が1より大きければ、当該ラベルの線幅は2以下であると判定する。また、第4の閾値が3以上の場合は、当該ラベルを構成する領域の輪郭の距離を求めることで各ラベルの線幅を求め、ステップS4604での判断に用いることができる。このように、出力ベクトルフォーマットに応じて第4の閾値を設定し、それ以下の幅を持つラベル領域をノイズ成分として他の領域に統合しやすくすることでベクトルデータをレンダリングした際の画質を向上することができる。
【0045】
ステップS4605では着目した2つのラベルの色相の差を見る。色相は着目画素のラベルの色空間をHSVに変換し、Hの値を参照すれば差を求めることができる。この差が第10の閾値以下のときは、ステップS4606に進む。このときHの値を参照し、両ラベルが黒に近い色をしている場合、この後の色距離の判断で用いる第8の閾値をステップS4606において緩く設定することができる。これは黒い画像は色距離が遠く出る傾向にあり、他の色と同じように統合するには閾値を緩くとる必要があるためである。両ラベルが黒に近いかどうかは両方のラベルのHの値が第9の閾値以下かどうかを見ることで判断することができる。なお、ステップS4605で色相の差が第10の閾値よりも大きいと判断した場合は、ラベルの統合処理は行わず判断処理を終了する。
【0046】
ステップS4607では着目した2つのラベルの色距離を見る。色距離はRGBのマンハッタン距離(シティブロック距離)やユークリッド距離を用いることができる。この色距離が第8の閾値以下の時はステップS4608で両ラベルを統合する。統合処理は画素数が大きいラベル番号で、画素数が小さいほうのラベル番号を書き換え、ラベルに関する形状情報を更新することで行なわれる。
【0047】
図9は、実施形態1の画像処理において微小領域の統合処理を行った結果である。線状微小領域はそれぞれ位置的に近い赤線領域に入れられ、画像は緑線、青線、赤線と三つのまとまった色領域に分離できるようになった。
【0048】
以上説明したように本実施形態によれば、圧縮、スキャン等による発生する滲みは綺麗にまとまった色領域に分離することが可能になる。それにより、ベクトル化結果が改善され、文書画像の圧縮性や再利用性を向上させることが可能になる。
【0049】
<実施形態2>
上記の実施形態1では、ラベルの統合先を選択する場合、統合条件を満たすラベルが最初に見つかった時に統合する例を挙げたが、本発明でカバーされる範囲はこれに限らない。例えば隣接するラベル同士を統合できるか全ての組み合わせに対して確認し、最も色距離が近いラベル同士を優先して統合してもよい。この場合、実施形態1で述べたやり方と比較して長い処理時間を要するが、より正確な色別画像を生成することができる。
【0050】
また着目しているラベルが線形状の場合、端点箇所に接続先としてふさわしいラベルが接していることも多い。そこで着目ラベルの端点箇所に接続しているラベルの中で、最も色距離が近いラベル同士を統合してもよい。
【0051】
<実施形態3>
上記の実施形態1または2では条件を満たす隣接するラベル領域に統合した。実施形態3では統合を判定する条件として、統合先のラベル領域が主要色を構成するラベル領域(主要色領域)かどうかを考慮して決定する。ラベルが主要色を構成するかどうかは、図7のステップS4608において、統合先ラベル領域の画素数が第6の閾値よりも大きいかどうかを見ればよい。この条件を満たす場合、統合先ラベル領域を主要色と判断し、2つのラベルの統合処理を行う。
【0052】
<実施形態4>
上記の実施形態1から3では線状微小領域の再処理は、各線状微小領域、即ち、ラベル単位で、隣接クラスタに統合するものとした。本実施形態では、線状微小領域の再処理は、その線状微小領域にある各画素を画素単位で主要色クラスタに再統合するものとする。画素単位で統合処理を行うことで入力画像の原画に近い形状を保ったまま色分離処理を行うことができる。
【0053】
図10では白のラベルとグレーのラベルと、第5の閾値未満の画素数の薄いグレーのラベルの3つがある。1画素ずつ統合処理を行う例では図の黒丸で示した箇所を順次着目し、周囲のラベルの状況を見て、もっとも割合が多いラベルに画素単位で統合する。Aが処理前の状態とすると、A〜Cでは黒丸で示した画素に隣接する領域を参照すると白いラベルの割合が最も多い。よって順次黒丸で示した画素を白いラベルで置き換えていく。Dではグレーのラベルの割合が多くなるため、白ではなくグレーのラベルで置き換える。こういった処理を行うことで最終的にEで示す画像を得ることが出来る。
【0054】
<他の実施形態>
なお、本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録したコンピュータ可読の記憶媒体を、システムあるいは装置に供給することによっても、達成されることは言うまでもない。また、システムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読出し実行することによっても、達成されることは言うまでもない。この場合、記憶媒体から読出されたコンピュータ装置が実行可能なプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶したコンピュータ読み取り可能な記憶媒体は本発明を構成することになる。
【0055】
プログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、不揮発性のメモリカード、ROMなどを用いることが出来る。
【0056】
また、コンピュータが読出したプログラムコードを実行することにより、前述した実施形態の機能が実現される。また、プログラムコードの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態が実現される場合も含まれることは言うまでもない。

【特許請求の範囲】
【請求項1】
読み取った画像を入力する画像入力手段と、
前記入力した画像を色領域に分ける色領域分割手段と、
個別のラベルを前記各色領域に付与するラベリング手段と、
前記ラベルが付与された色領域であるラベル領域の形状特徴を表わす情報を含むラベル形状情報を求めるラベル形状解析手段と、
前記ラベル形状解析手段で求めたラベル形状情報に基づいて、前記ラベルを付与されたラベル領域が微小領域かどうか判定する微小領域判定手段と、
前記微小領域と判定された領域を隣接するラベルに統合する微小領域統合手段と
を備えることを特徴とする画像処理装置。
【請求項2】
前記微小領域判定手段は、
前記ラベル形状解析手段で求めたラベル形状情報を用いて、前記ラベル領域の中の着目ラベルの領域が線状微小領域かどうかを判定する線状微小領域判定手段であることを特徴とする請求項1に記載の画像処理装置。
【請求項3】
前記線状微小領域判定手段は、
前記着目ラベルの領域に対応する外接矩形において、一方向の辺の長さに対するもう一方向の辺の長さの比が第1の閾値より大きいラベル領域を前記線状微小領域と判定することを特徴とする請求項2に記載の画像処理装置。
【請求項4】
前記線状微小領域判定手段は、
前記着目ラベルの領域の画素数と前記着目ラベルの領域に対応する外接矩形の面積との比が第2の閾値より大きいラベル領域を前記線状微小領域と判定することを特徴とする請求項2に記載の画像処理装置。
【請求項5】
前記線状微小領域判定手段は、
着目ラベルの領域の画素数と前記着目ラベルの周囲長との比が第3の閾値より大きいラベル領域を前記線状微小領域と判定することを特徴とする請求項2に記載の画像処理装置。
【請求項6】
前記線状微小領域判定手段は、
出力フォーマットの種類、入力画像のサイズ、または入力画像の解像度の少なくとも1つの情報に応じて決定される最小のラベルの幅を第4の閾値として設定し、
前記第4の閾値以下の幅のラベル領域を前記線状微小領域と判定することを特徴とする請求項2に記載の画像処理装置。
【請求項7】
前記ラベル形状解析手段は、ラベルの画素数を含むラベル形状情報を求め、
前記微小領域判定手段は、
前記ラベル形状解析手段で求めたラベルの画素数が予め定められた第5の閾値より少ない領域を微小領域と判定することを特徴とする請求項1に記載の画像処理装置。
【請求項8】
前記画像入力手段は、
前記入力した画像からグラフィックス領域を抽出する領域抽出手段をさらに備え、
前記色領域分割手段は、前記グラフィックス領域を前記色領域に分けることを特徴とする請求項1に記載の画像処理装置。
【請求項9】
前記色領域分割手段は、
あるラベル領域の画素数が予め定められた第6の閾値より多い領域を主要色領域とし、
前記微小領域統合手段は、
統合先のラベル領域を前記主要色領域から選択することを特徴とする請求項1に記載の画像処理装置。
【請求項10】
前記微小領域統合手段の結果得られる画像データをベクトル化するベクトル化手段をさらに備えることを特徴とする請求項1に記載の画像処理装置。
【請求項11】
前記微小領域統合手段は、
統合条件を満たす最初に見つかった領域に前記微小領域を統合することを特徴とする請求項1に記載の画像処理装置。
【請求項12】
前記微小領域統合手段は、
統合条件を満たす領域の中で最も色距離が近い領域に前記微小領域を統合することを特徴とする請求項1に記載の画像処理装置。
【請求項13】
前記微小領域統合手段は、
線状微小領域を処理する場合、統合条件を満たす領域の中で前記線状微小領域の端点に接続している領域を優先して統合することを特徴とする請求項1に記載の画像処理装置。
【請求項14】
前記微小領域統合手段は、
画素ごとに統合先のラベル領域を切り替えることを特徴とする請求項1に記載の画像処理装置。
【請求項15】
前記ラベル形状解析手段は、
画素数、幅、または外接矩形の情報のうち少なくとも1つの情報を求めることを特徴とする請求項1に記載の画像処理装置。
【請求項16】
読み取った画像を入力する画像入力工程と、
前記入力した画像を色領域に分ける色領域分割工程と、
個別のラベルを前記各色領域に付与するラベリング工程と、
前記ラベルが付与された色領域であるラベル領域の形状特徴を表す情報を含むラベル形状情報を求めるラベル形状解析工程と、
前記ラベル形状解析工程で求めたラベル形状情報に基づいて、前記ラベルを付与されたラベル領域が微小領域かどうか判定する微小領域判定工程と、
前記微小領域と判定された領域を隣接するラベルに統合する微小領域統合工程と
を備えることを特徴とする画像処理方法。
【請求項17】
前記微小領域判定工程は、
前記ラベル形状解析工程で求めたラベル形状情報を用いて、前記ラベル領域の中の着目ラベルの領域が線状微小領域かどうかを判定する線状微小領域判定工程であることを特徴とする請求項16に記載の画像処理方法。
【請求項18】
前記線状微小領域判定工程は、
前記着目ラベルの領域に対応する外接矩形において、一方向の辺の長さに対するもう一方向の辺の長さの比が第1の閾値より大きいラベル領域を前記線状微小領域と判定することを特徴とする請求項17に記載の画像処理方法。
【請求項19】
前記線状微小領域判定工程は、
前記着目ラベルの領域の画素数と前記着目ラベルの領域に対応する外接矩形の面積との比が第2の閾値より大きいラベル領域を前記線状微小領域と判定することを特徴とする請求項17に記載の画像処理方法。
【請求項20】
前記線状微小領域判定工程は、
着目ラベルの領域の画素数と前記着目ラベルの周囲長との比が第3の閾値より大きいラベル領域を前記線状微小領域と判定することを特徴とする請求項17に記載の画像処理方法。
【請求項21】
前記ラベル形状解析工程は、ラベルの画素数を含むラベル形状情報を求め、
前記線状微小領域判定工程は、
出力フォーマットの種類、入力画像のサイズ、または入力画像の解像度の少なくとも1つの情報に応じて決定される最小のラベルの幅を第4の閾値として設定し、
前記第4の閾値以下の幅のラベル領域を前記線状微小領域と判定することを特徴とする請求項17に記載の画像処理方法。
【請求項22】
前記微小領域判定工程は、
前記ラベル形状解析工程で求めたラベルの画素数が予め定められた第5の閾値より少ない領域を微小領域と判定することを特徴とする請求項16に記載の画像処理方法。
【請求項23】
前記画像入力工程は、
前記入力した画像からグラフィックス領域を抽出する領域抽出工程をさらに備え、
前記色領域分割工程は、前記グラフィックス領域を前記色領域に分けることを特徴とする請求項16に記載の画像処理方法。
【請求項24】
前記色領域分割工程は、
あるラベル領域の画素数が予め定められた第6の閾値より多い領域を主要色領域とし、
前記微小領域統合工程は、
統合先のラベル領域を前記主要色領域から選択することを特徴とする請求項16に記載の画像処理方法。
【請求項25】
前記微小領域統合工程の結果得られる画像データをベクトル化するベクトル化工程をさらに備えることを特徴とする請求項16に記載の画像処理方法。
【請求項26】
前記微小領域統合工程は、
統合条件を満たす最初に見つかった領域に前記微小領域を統合することを特徴とする請求項16に記載の画像処理方法。
【請求項27】
前記微小領域統合工程は、
統合条件を満たす領域の中で最も色距離が近い領域に前記微小領域を統合することを特徴とする請求項16に記載の画像処理方法。
【請求項28】
前記微小領域統合工程は、
線状微小領域を処理する場合、統合条件を満たす領域の中で前記線状微小領域の端点に接続している領域を優先して統合することを特徴とする請求項16に記載の画像処理方法。
【請求項29】
前記微小領域統合工程は、
画素ごとに統合先のラベル領域を切り替えることを特徴とする請求項16に記載の画像処理方法。
【請求項30】
前記ラベル形状解析工程は、
画素数、幅、または外接矩形の情報のうち少なくとも1つの情報を求めることを特徴とする請求項16に記載の画像処理方法。
【請求項31】
コンピュータ装置が実行可能なプログラムであって、前記プログラムを実行するコンピュータ装置に、前記請求項16〜30に記載の画像処理方法を実行させるためのプログラム。
【請求項32】
前記請求項31に記載のプログラムを記憶したコンピュータ読み取り可能な記憶媒体。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate


【公開番号】特開2011−13900(P2011−13900A)
【公開日】平成23年1月20日(2011.1.20)
【国際特許分類】
【出願番号】特願2009−156974(P2009−156974)
【出願日】平成21年7月1日(2009.7.1)
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】