説明

文字色判別装置、文字色判別方法、およびコンピュータプログラム

【課題】スキャナなどで入力した文字画像の表わす文字の色を正確に判別する。
【解決手段】画像形成装置1に、スキャンした入力画像に表れる文字の線図形の中央線およびその付近の領域である中央領域を、その入力画像の細線化画像を生成することによって検出する細線化画像生成部302と、その中央領域を複数の文字色候補領域RCに分割する文字画像分割部303と、小領域ごとに、その小領域に属する画素の中から所定の条件に合う画素を近似色画素として検出する近似色画素選出部304と、入力画像に表れる文字の色を各小領域の条件合致画素の色情報に基づいて判別する文字色決定部306と、を設ける。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、スキャナなどの画像入力装置で入力した画像に含まれる文字の色を判別する装置および方法などに関する。
【背景技術】
【0002】
用紙に描かれている画像をスキャナでスキャンし電子データとして保存する技術が普及している。通常、高品質な画像の電子データを得るために、スキャンした画像に対してその特性に応じた画像処理を施すことが多い。例えば、文字を表わす文字画像が含まれる領域に対しては、文字の識別性を高くするための画像処理を施す。つまり、その文字画像が何の文字を表わしているのかが明確に分かるようにするための画像処理を施す。
【0003】
スキャンした文字領域に対する画像処理の方法として、特許文献1に記載されるような方法が提案されている。この方法によると、カラー画像より文字領域の二値画像を生成し、前記文字領域の二値画像に対し文字矩形を作成し、前記文字矩形の単色判定を行い、非単色の文字矩形が複数種の単色文字集合であることを判定し、上記判定矩形内を文字切りする。これにより、文字色および文字領域の情報を抽出することができる。
【0004】
また、特許文献2に記載される方法によると、文書画像をカラーデジタル画像として入力し、該文書画像の背景色を特定し、該背景色を用いて該文書画像から背景領域以外の画素を抽出し、該画素を統合して連結成分を生成し、該連結成分を形状特徴と色特徴から文字/罫線/図/写真などの領域に分類し、識別する。識別された領域である文字領域として文字矩形データを取得し、該文字矩形内の背景色に相当する画素を除去して残った画素の画素値に基づいて代表色を算出し、該代表色をその文字矩形の文字色とする。
【0005】
そのほか、特許文献3には、入力した画像の中から写真の領域、色文字の領域、および黒文字の領域を判定する方法が開示されている。入力された画像の色信号から、色判定部で各画素が色画素か否かを判定する。色判定補正部で、色判定部で色画素と判定された領域に対し、第1の膨張処理部での膨張処理で色文字の切れをつなぎ、収縮処理部での収縮処理で黒文字部の色画素を除去し、第2の膨張処理部で色文字の部分を包含するように色画素の領域を膨張処理する。これにより、黒文字部の色画素判定が除去され、色文字部の色画素でないと判定された部分も色画素となる。一方、構造抽出部で写真構造、文字構造が抽出され、写真・文字判定部で、色判定補正部で補正された色判定結果とともに論理演算により写真、色文字、黒文字の各領域を判定する。
【特許文献1】特開2004−242075号公報
【特許文献2】特開2002−236921号公報
【特許文献3】特開平11−4344号公報
【発明の開示】
【発明が解決しようとする課題】
【0006】
ところで、通常、スキャンした文字画像のエッジの部分つまり文字の背景の画像(背景画像)との境界付近の画素は、背景画像の色と混じり合い、文字画像の色が滲んでしまうことがよくある。背景画像から離れている画素は、滲みが少なく、文字の本来の色が明確に表れている。
【0007】
文字画像の表わす文字の線が太い場合は、背景画像から離れている画素を多く選出することができるので、上に述べたような従来の方法を用いても文字の色をある程度正確に判別することができる。
【0008】
しかし、文字画像の表わす文字の線が細い場合は、文字画像の多くの画素は、背景画像との境界付近に位置するので、その色が滲んでしまっている。つまり、文字の線が太い文字画像と比較して、本来の色が明確に表れている画素が少ない。したがって、従来の方法では、判別した色の正確性が乏しい。
【0009】
本発明は、このような問題点に鑑み、スキャナなどで入力した文字画像の表わす文字の色を従来よりも正確に判別することを目的とする。
【課題を解決するための手段】
【0010】
本発明に係る文字色判別装置は、画像入力装置によって入力された入力画像に表れる文字の線図形の中央線またはその付近の領域である中央領域を検出する中央領域検出手段と、複数の画素からなる複数の小領域を前記中央領域から抽出する小領域抽出手段と、前記小領域ごとに、当該小領域に属する画素の中から所定の条件に合う画素を条件合致画素として検出する条件合致画素検出手段と、前記入力画像に表れる文字の色を前記各小領域の前記条件合致画素の色情報に基づいて判別する色判別手段と、を有することを特徴とする。
【0011】
好ましくは、前記中央領域検出手段は、前記入力画像に対して細線化処理を施すことによって検出した細線またはその付近の領域を、前記中央領域として検出し、前記所定の条件とは、明度が最も低いことであり、前記色判別手段は、原色ごとに、前記条件合致画素の当該原色の階調のピークを算出し、当該各原色の当該ピークによって表わされる色を、前記入力画像に表れる文字の色であると判別する。
【0012】
なお、本発明では、「文字」には、漢字、平仮名、片仮名、およびアルファベットなどのほか、「0」〜「9」の数字および演算子などの符号も含まれるものとする。
【発明の効果】
【0013】
本発明によると、スキャナなどで入力した文字画像の表わす文字の色を従来よりも正確に判別することができる。
【発明を実施するための最良の形態】
【0014】
図1は本発明に係る画像形成装置1を有するシステム構成の例を示す図、図2は画像形成装置1のハードウェア構成の例を示す図、図3は画像形成装置1の機能的構成の例を示す図である。
【0015】
図1に示す画像形成装置1は、コピー、スキャナ、ファックス、ネットワークプリンティング、ドキュメントサーバ、およびファイル転送などの様々な機能を集約した画像処理装置である。複合機またはMFP(Multi Function Peripherals)などと呼ばれることもある。
【0016】
この画像形成装置1は、役所または企業などのオフィス、学校または図書館などの公共施設、コンビニエンスストアなどの店舗、その他種々の場所に設置され、複数のユーザによって共用することができる。また、パーソナルコンピュータまたはワークステーションなどの端末装置2と通信回線3を介して接続可能である。通信回線3として、インターネット、LAN、公衆回線、または専用線などが用いられる。
【0017】
画像形成装置1は、図2に示すように、CPU10a、RAM10b、ROM10c、ハードディスク10d、制御用回路10e、操作パネル10f、スキャナユニット10g、印刷ユニット10h、モデム10j、およびネットワークインタフェース10kなどによって構成される。
【0018】
スキャナユニット10gは、原稿の用紙(以下、単に「原稿」と記載する。)に描かれている写真、文字、絵、図表などの画像を光学的に読み取って電子データ化する装置である。読み取られた画像のデータはRAM10bに記憶され、後に説明するように、様々な処理が施されてファイル化される。本実施形態では、カラースキャナが用いられる。
【0019】
印刷ユニット10hは、スキャナユニット10gで読み取られた画像または端末装置2などから送信されてきた画像を、イエロー、マゼンタ、シアン、およびブラックの4色のトナーを使用して用紙に印刷する装置である。
【0020】
操作パネル10fは、操作部および表示部によって構成される。操作部としてテンキーなどが用いられ、表示部として液晶ディスプレイなどが用いられる。ユーザは、操作部を操作することによって、画像形成装置1に対して、処理の実行開始または中断などの指令を与え、データの宛先、スキャン条件、または画像ファイルフォーマットなどの処理条件を指定し、その他種々の事項を指定することができる。表示部には、ユーザに対してメッセージまたは指示を与えるための画面、ユーザが所望する処理の種類および処理条件を入力するための画面、および画像形成装置1で実行された処理の結果を示す画面などが表示される。操作パネル10fとしてタッチパネルを用いた場合は、タッチパネルが操作部および表示部の両方を兼ねる。このように、操作パネル10fは、画像形成装置1を操作するユーザのためのユーザインタフェースの役割を果たしている。なお、端末装置2には、画像形成装置1に対して指令を与えるためのアプリケーションプログラムおよびドライバがインストールされている。したがって、ユーザは、端末装置2によって画像形成装置1を遠隔的に操作することができる。
【0021】
モデム10jは、NCU(Network Control Unit)が内蔵されており、アナログの公衆回線を介して他のファックス端末と接続し、ファクシミリプロトコルに基づくデータ制御およびファックスデータの変復調などを行う。ネットワークインタフェース10kは、NIC(Network Interface Card)であって、LANまたはインターネットなどを介して端末装置2などへの接続を行い、ファイルの送受信などを行う。
【0022】
制御用回路10eは、ハードディスク10d、操作パネル10f、スキャナユニット10g、印刷ユニット10h、モデム10j、およびネットワークインタフェース10kなどの装置を制御するための回路である。
【0023】
ハードディスク10dには、図3に示すような前処理部101、非文字領域処理部102、文字領域処理部103、およびPDFファイル生成部104などの機能を実現するためのプログラムおよびデータなどが格納されている。これらのプログラムは必要に応じてRAM10bに読み出され、CPU10aによってプログラムが実行される。これらのプログラムまたはデータの一部または全部を、ROM10cに記憶させておいてもよい。または、図3の機能の一部または全部を、制御用回路10eによって実現するようにしてもよい。
【0024】
図4は原稿画像GA0、GA0’の例を示す図、図5は非文字領域処理部102の構成の例を示す図である。
【0025】
次に、図3に示す画像形成装置1の各部の機能および処理内容などについて説明する。
【0026】
前処理部101は、スキャナユニット10gによって入力された原稿の画像(以下、「原稿画像GA0」と記載する。)に対して、非文字領域処理部102以降の処理に対応した解像度に変換する処理(解像度変換処理)を施し、さらに、原稿画像GA0の下地部分の色などを除去する処理(下地除去処理)を施す。「原稿画像GA0の下地部分」とは、コンテンツ(オブジェクト)が何もない領域のことを意味する。例えば、図4に示すような原稿画像GA0である場合は、「新・デジタルMFP 255255」という文字列の画像のある矩形領域、「デジタル機の価格差は…期待できます。」という文字列の画像のある矩形領域、およびMFPの写真が中央に配置された矩形領域の合計3つの矩形領域以外の部分が、原稿画像GA0の下地部分である。
【0027】
原稿画像GA0には、文字の画像、写真の画像、または背景の画像など、様々な種類のオブジェクトの画像が含まれている。以下、文字画像が含まれる領域を「文字領域RM」と記載し、文字画像以外のオブジェクトの画像しか含まれない領域を「非文字領域RH」と記載する。例えば、図4の原稿画像GA0は、2つの文字領域RMおよび1つの非文字領域RHを有している。また、解像度変換処理および下地除去処理が施された原稿画像GA0を「原稿画像GA0’」と記載する。
【0028】
文字領域RMには、文字を表わす線の画像およびその線の背景の画像が含まれている。以下、前者を「文字画像」と記載し、後者を「文字背景画像」と記載する。例えば、白色の用紙に赤色の文字が書かれている原稿をスキャンした場合は、文字領域RMのうち、赤色の画素群が文字画像となり、白色の画素群が文字背景画像となる。ただし、文字の線と背景との境界付近は、色滲みのために色の区別が付かないことがある。この問題については、後に順次説明する処理によって対処する。
【0029】
非文字領域処理部102は、図5に示すように、明度算出部121、写真背景等抽出部122、階調等補正部123、および非文字再現用データ生成部124などによって構成され、原稿画像GA0’のうちの非文字領域RHつまり写真および背景などの領域に対する画像処理などを行う。
【0030】
明度算出部121は、前処理された原稿画像GA0つまり原稿画像GA0’の各画素の明度を算出することによって、明度画像GA1を生成する。例えば、フルカラー(つまり、24ビット)の原稿画像GA0が入力された場合は、次のような方法で明度を算出する。
【0031】
前処理によって得られた原稿画像GA0’のR(赤)、G(緑)、およびB(青)の各原色の階調の値を8ビットの階調に落とす。そして、これらの値を次の(1)式のような公知の計算式に代入する。
Y=0.3×R+0.6×G+0.1×B …… (1)
ただし、Yは明度、RはR成分の階調の値、GはG成分の階調の値、BはB成分の階調の値である。
【0032】
なお、必要に応じて、スムージング処理を施し、明度画像GA1のノイズの除去および輪郭の補正などを行ってもよい。
【0033】
写真背景等抽出部122は、明度画像GA1に対してラベリング処理を施すことによって、原稿画像GA0’に含まれる写真または背景などの画像つまり文字以外の画像の領域(非文字領域RH)の位置を判別し、非文字領域RHを抽出する。一般に、写真などの画像に対してラベリング処理を施すと白または黒の大きな塊が出現し、文字画像に対してラベリング処理を施すと不規則な細い線が多く出現しする。このような特徴に基づいて、非文字領域RHの位置を判別する。そして、その判別結果を示す非文字領域位置データ81を生成する。図4の場合は、非文字領域RHaの位置を示す非文字領域位置データ81を生成する。
【0034】
階調等補正部123は、必要に応じて、写真背景等抽出部122によって抽出された非文字領域RHの中の画像の階調などの補正を、公知の方法を用いて行う。
【0035】
非文字再現用データ生成部124は、各非文字領域RHの、階調等補正部123によって補正された画像(以下、「非文字画像GC」と記載する。)の画像データおよび非文字領域位置データ81を統合することによって非文字領域画像再現用データ71を生成する。
【0036】
以上のような非文字領域処理部102を構成する各部の処理によって、原稿画像GA0’に含まれる各非文字領域RHの位置に関する情報および好適な画像データ(イメージデータ)が得られる。以下、非文字領域処理部102による画像処理の結果得られた、非文字領域RHの画像データを、「非文字領域画像再現用データ71」と記載する。
【0037】
図6は文字領域処理部103の構成の例を示す図、図7は複数のブロックBRに分割した文字領域RMの例を示す図、図8は原稿文字色判別部135の構成の例を示す図、図9は細線化画像GSの生成方法の例を説明するための図、図10は文字の線図形の中央線の位置の例を示す図、図11は文字の線図形の中央線およびその付近の領域を複数の文字色候補領域RCに分割する方法の例を説明するための図、図12は近似色画素選出処理の流れの例を説明するためのフローチャート、図13は各原色の階調の分布の例を示す図である。
【0038】
図3に戻って、文字領域処理部103は、図6に示すように、明度算出部131、文字領域抽出部132、文字領域分割部133、二値化処理部134、原稿文字色判別部135、文字背景処理部136、および文字再現用データ生成部137などによって構成され、文字画像を含む領域つまり文字領域RMに対する画像処理などを行う。
【0039】
明度算出部131は、図5の明度算出部121と同様に、原稿画像GA0’の各画素の明度を算出することによって、明度画像GA1を生成する。
【0040】
文字領域抽出部132は、明度画像GA1に対してラベリング処理を施し、その処理結果の特徴に基づいて原稿画像GA0’に含まれる文字領域RMの位置を判別し、文字領域RMを抽出する。そして、その判別結果を示す文字領域位置データ80を生成する。図4の場合は、2つの文字領域RMa、RMbそれぞれについて、各位置を示す文字領域位置データ80が生成される。
【0041】
なお、明度算出部131と明度算出部121とを共通化し、文字領域抽出部132と写真背景等抽出部122とを共通化してもよい。つまり、1つの明度算出部によって得られた明度画像を、以降の処理において各部が共通に使用するようにしてもよい。また、文字領域抽出部132および写真背景等抽出部122を1つの領域抽出部として共通化し、1回のラベリング処理の結果に基づいて原稿画像GA0’の中から文字領域RMおよび非文字領域RHの両方を抽出し、それぞれの位置を示す文字領域位置データ80および非文字領域位置データ81を生成するようにしてもよい。
【0042】
文字領域分割部133は、文字領域画像GMに多数の文字が表れている場合に、左右方向または上下方向に並ぶ複数個の文字をグループ化する。例えば、1〜10個程度の文字をグループ化する。英文などの場合は、単語ごと(つまり、スペースとスペースとの間にある文字群ごと)にグループ化してもよい。横書きの場合は左右方向に並ぶ文字をグループ化し、縦書きの場合は上下方向に並ぶ文字をグループ化する。横書きであるか縦書きであるかは、文字画像の並び方の特徴に基づいて判別することができる。そして、グループ化した各文字の文字画像を含む部分を、文字領域RMからブロックBRとして抽出する。これにより、文字領域RMは複数のブロックBRに分割される。例えば、文字領域RMb(図4参照)を、図7に示すように複数のブロックBR(BR1、BR2、…)に分割する。また、各ブロックBRについて、文字領域RMにおけるその位置を示すブロック位置データ82を生成しておく。
【0043】
二値化処理部134は、文字領域分割部133によって得られた文字領域RMの各ブロックBRの二値画像GNを生成する。本実施形態では、ブロックBRの二値画像GNを次のように生成する。ブロックBRの画像の各画素の濃度を算出する。本実施形態では、濃度は8ビットで表されるものとする。算出した濃度が、濃度閾値β以上であればその画素の値を「1」とし、濃度閾値β未満であればその画素の値を「0」とする。このように各画素の値を「0」または「1」のいずれかに変換することによって、二値画像GNが生成される。
【0044】
生成した二値画像によると、原稿画像GA0’および明度画像GA1などにそれぞれ含まれる文字領域RMの文字画像の部分と文字背景画像の部分とを区別することができる。つまり、「1」である画素が文字画像の部分を示し、「0」である画素が文字背景画像の部分を示しているものとする。
【0045】
原稿文字色判別部135は、図8に示すように、低解像度画像生成部301、細線化画像生成部302、文字画像分割部303、近似色画素選出部304、文字色成分取得部305、および文字色決定部306などによって構成され、原稿に描かれていた文字の色(以下、「原稿文字色」と記載する。)を判別する。本実施形態では、ブロックBRごとに、原稿文字色を判別する。ここで、原稿文字色を判別する処理の内容について、図9に示すような「255255」という文字群を表す文字画像を含むブロックBRxが処理対象である場合を例に説明する。
【0046】
図9(a)は、元の原稿画像GA0’のうちのブロックBRxに対応する部分(以下、「ブロック原稿画像GA0x」と記載する。)を示している。図9(b)は、原稿画像GA0’の明度画像GA1のうちのブロックBRxに対応する部分(以下、「ブロック明度画像GA1x」と記載する。)を示している。図9(c)は、ブロックBRxの二値画像GNである。
【0047】
図8の低解像度画像生成部301は、ブロックBRxの二値画像GNの解像度を落とすことによって図9(d)に示すような低解像度画像GTを生成する。本実施形態では、原稿画像GA0、GA0’、ブロック原稿画像GA0x、および二値画像GNの解像度が300dpiであるものとし、低解像度画像生成部301は75dpiの低解像度画像GTを生成するものとする。
【0048】
細線化画像生成部302は、低解像度画像GTに対して公知の細線化処理を施すことによって、図9(e)のような細線化画像GSを生成する。すなわち、低解像度画像GTに表れている太さ1ピクセル(画素)以上の線図形から中心線を検出することによって低解像度画像GTを生成する。例えば「2」という文字の線図形からは、図10に示すような中央線が検出される。本実施形態では、太さ1ピクセル(画素)の細線を表わす細線化画像GSを生成する。なお、細線化画像GSの解像度は、低解像度画像GTの解像度と同じであり、75dpiである。細線化画像生成部302の処理によって、文字の線図形の中央線およびその付近に位置する画素群(領域)を見つけることができる。
【0049】
文字画像分割部303は、細線化画像GSに基づいて、ブロック原稿画像GA0xに含まれる文字画像が表わす文字の線図形の中央線およびその付近を複数の文字色候補領域RCに分割する。文字色候補領域RCに分割する処理は、例えば次のような方法で行う。
【0050】
細線化画像GSの細線上の1つの画素は、ブロック原稿画像GA0xの中の文字画像のうちの複数個の画素に相当する。つまり、例えば図11(a)において円形の点線枠で示す細線化画像GSの中の細線上の1つの画素PXは、図11(b)において矩形の点線枠で示す元のブロック原稿画像GA0xの文字の線上の複数個の画素に相当する。文字画像分割部303は、これらの画素の塊を文字色候補領域RCとして抽出する。本実施形態では、細線化画像GSおよびブロック原稿画像GA0xのそれぞれの解像度の関係から、図11(c)に示すように、4×4画素の文字色候補領域RCが抽出される。同様に、細線上の他の画素に対応する画素の塊を抽出することによって、ブロック原稿画像GA0xの文字画像が表わす文字の線図形の中央線およびその付近を複数の文字色候補領域RCに分割することができる。文字画像分割部303の処理によって複数の文字色候補領域RCが抽出される。
【0051】
近似色画素選出部304は、文字画像分割部303によって得られた各文字色候補領域RCの中から、原稿文字色に最も近い色を表わしていると考えられる画素(以下、「近似色画素PK」と記載する。)を、図12に示すような手順で選出する。
【0052】
1つの文字色候補領域RCに注目し、その文字色候補領域RCを構成する4×4個の画素のうち上下左右の端に位置する画素(例えば、図11(c)において太線枠の外側に位置する12個の画素)を候補から除外する(図12の#402)。これらの画素は、太線枠の内側に位置する画素よりも文字背景画像に近いので、色滲みが発生している可能性が高く信頼性が低いからである。
【0053】
除外されずに残った画素つまり図11(c)において太線枠の内側に位置する2×2個の画素のそれぞれの明度を算出する。そして、明度が最も低い画素(つまり、濃度が最も高い画素)を、原稿文字色に最も近い色を表わしている画素つまり近似色画素PKとして選出する(#403)。明度は、図6の明度算出部131によって生成した明度画像GA1を参照しても構わない。
【0054】
他の文字色候補領域RCについても同様にステップ#402、#403の処理を実行し、近似色画素PKを選出する。
【0055】
以上の処理によって、1つのブロックBRについて多数の近似色画素PKが選出される。具体的には、そのブロックBRの細線化画像GS(図9(e)参照)の細線を構成する画素の個数分の近似色画素PKが選出される。
【0056】
図8の文字色成分取得部305は、近似色画素選出部304によって選出された各近似色画素PKについて、ブロックBRの文字画像の中のその近似色画素PKの、RGBの各原色の階調の値を取得する。係る画素値は、元の原稿画像GA0’のうちのブロックBRに対応する部分を検索し、そのブロックBRの中のその近似色画素PKの位置の画素値を参照することによって取得することができる。取得した各原色の階調の値は、例えば、図13に示すヒストグラムのような分布になる。
【0057】
文字色決定部306は、文字色成分取得部305によって取得された各原色の階調の値の分布に基づいて、ブロックBRの文字画像が表わす文字の色を、例えば次のような方法で決定する。
【0058】
文字色成分取得部305によって取得された各原色の階調の値の分布のそれぞれについて、ピークの値を求める。これは、公知の方法によって求められる。例えば、最も個数の多い画素値をピークの値として選出してもよいし、公知の演算方法によって求めてもよい。このようにして求められたR、G、Bそれぞれのピークの値によって再現される色を、ブロックBRの文字画像が表わす文字の色に決定する。そして、これを、ブロックBRの文字画像が表わす文字の色であると判別する。
【0059】
以上のような原稿文字色判別部135を構成する各部の処理によって、ブロックBRそれぞれの文字画像が表わす文字の色が決定する。そして、決定した色を、ブロックBRにおける原稿文字色であると判別する。また、原稿文字色判別部135は、ブロックBRごとに、判別した原稿文字色を示す文字色データ83を生成する。
【0060】
図6に戻って、文字背景処理部136は、原稿画像GA0’の中の各文字領域RMの各ブロックBRの画像から文字画像を削除することによって、文字の背景部分だけの画像つまり文字背景画像の画像データを生成する。以下、文字背景処理部136によって得られた文字背景画像を「文字背景画像GH」と記載する。文字背景画像GHの削除された画素の部分は、白抜けの状態になる。なお、文字画像の位置は、二値画像GNを参照すればよい。つまり、二値画像GNの中の画素値が「1」である画素の位置に対応する部分をブロックBRの画像から削除することによって、文字背景画像GHを生成することができる。
【0061】
文字再現用データ生成部137は、各文字領域RMの画像を再現するための文字領域再現用データ70を生成する。この文字領域再現用データ70は、各文字領域RMの各ブロックBRのブロック位置データ82、二値画像GNすなわち文字画像の線図形の画像データ(イメージデータ)、文字色データ83、および文字背景画像GHの画像データ(イメージデータ)と、各文字領域RMの文字領域位置データ80とを統合することによって生成される。
【0062】
以上のような文字領域処理部103を構成する各部の処理によって、文字領域RMに対する画像処理がなされ、文字領域再現用データ70が生成される。
【0063】
図14は原稿再現用ファイルFLの構造の例を示す図である。図3に戻って、PDFファイル生成部104は、非文字領域処理部102によって生成された非文字領域位置データ81および文字領域処理部103によって生成された文字領域位置データ80などを用いて、スキャナユニット10gによって入力された原稿の画像を再現するための原稿再現用ファイルFLを、例えば次のような手順で生成する。
【0064】
文字領域再現用データ70に含まれる二値画像GN(文字画像の線図形)の画像データおよび文字背景画像GHの画像データを圧縮する。前者は二値データなので、G4圧縮方式(MMR圧縮方式)で圧縮するのが望ましい。後者は、色または模様の画像データなので、GIFまたはJPEGなどの圧縮方式で圧縮するのが望ましい。
【0065】
二値画像GNおよび文字背景画像GHの圧縮処理と並行してまたは前後して、非文字領域画像再現用データ71に含まれる非文字画像GCの画像データを圧縮する。非文字領域RHには写真などの大きなサイズの画像が配置されているので、JPEGのような、非可逆の圧縮方式によってサイズが小さくなるように圧縮する。または、非文字画像GCごとに画像のタイプを判別し、JPEGまたはGIFなどの圧縮方式を使い分けるようにしてもよい。
【0066】
さらに、生成する原稿再現用ファイルFLの属性(ファイル名、サイズ、作成者など)を示すファイル属性データ72を生成する。属性の一部(例えばファイル名など)は、ユーザに指定させるようにしてもよい。
【0067】
そして、圧縮処理を施した各文字領域RMの文字領域再現用データ70および各非文字領域RHの非文字領域画像再現用データ71と生成したファイル属性データ72とを統合しファイル化する。このようにして、原稿再現用ファイルFLが生成される。例えば、図4のような原稿画像GA0がスキャナユニット10gによって入力され、その原稿画像GA0に対して図3の各部が処理を実行すると、図14に示すようなデータ構造の原稿再現用ファイルFLが生成される。
【0068】
なお、同じ種類のオブジェクトの領域が複数個ある場合は、これらの領域を1つに統合し、全体のオブジェクト数を減らす処理を行ってもよい。
【0069】
生成された原稿再現用ファイルFLは、ハードディスク10dに保存される。または、電子メールまたはFTPなどによって通信回線3を介して端末装置2などに転送される。原稿再現用ファイルFLを、アクロバット社のPDFなどの既存のフォーマットに従って生成してもよい。PDFに関しては、例えば、次の公知技術文献1に記載されている。
【0070】
〔公知技術文献1〕”Adobe PDFってなに?−PDF初級編”、アドビシステムズ社、平成17年5月14日検索、インターネット<URL:http://www.adobe.co.jp/products/acrobat/adobepdf13.html>
生成された原稿再現用ファイルFLを使用することによって、原稿の画像を再現することができる。ここで、原稿の画像の再現の手順について説明する。
【0071】
画像形成装置1または端末装置2は、原稿再現用ファイルFLに対応したアプリケーションソフト(例えば、原稿再現用ファイルFLがPDFファイルである場合はアドビシステムズ社のアクロバットリーダなど)を起動し、原稿再現用ファイルFLをRAMにロードする。圧縮されているデータは、適宜解凍する。
【0072】
文字領域RMの画像を、その文字領域RMに係る文字領域再現用データ70に基づいて次のような手順で再現する。文字領域RMを構成する各ブロックBRについて、文字背景画像GHを再現するとともに、文字画像の線図形を再現する。その文字画像の線図形には、そのブロックBRに係る文字色データ83に示される原稿文字色を着色する。着色した文字画像の線図形を文字背景画像GHに嵌め込んでブロックBR全体の画像を再現し、これをブロック位置データ82に示される位置に配置することによって、文字領域RM全体の画像を再現する。文字領域RMが複数存在する場合つまり原稿再現用ファイルFLの中に複数の文字領域再現用データ70が含まれている場合は、文字領域RMごとに本処理を実行する。
【0073】
文字領域RM全体の画像を再現する処理と前後してまたは並行して、非文字領域RH全体の画像つまり非文字画像GCを、その非文字領域RHに係る非文字領域画像再現用データ71に基づいて再現する。非文字領域RHが複数存在する場合つまり原稿再現用ファイルFLの中に複数の非文字領域画像再現用データ71が含まれている場合は、非文字領域RHごとに本処理を実行する。
【0074】
そして、再現された文字領域RM全体の画像を、それに対応する文字領域位置データ80に示される位置に配置する。また、再現された非文字領域RH全体の画像を、それに対応する非文字領域位置データ81に示される位置に配置する。これにより、原稿再現用ファイルFLに係る画像が再現される。
【0075】
再現された画像は、用紙に印刷しまたはディスプレイに表示することによって、ユーザに対して出力することができる。
【0076】
図15は画像形成装置1の全体的な処理の流れの例を説明するためのフローチャート、図16は非文字領域処理の流れの例を説明するためのフローチャート、図17は文字領域処理の流れの例を説明するためのフローチャートである。
【0077】
次に、原稿の画像をスキャンし原稿再現用ファイルFLを生成する一連の処理の流れを、フローチャートを参照して説明する。
【0078】
図15において、画像形成装置1は、ファイル化の対象である原稿の画像をスキャンし(#1)、得られた画像に対して解像度変換処理および下地除去処理などの前処理を施す(#2)。
【0079】
原稿の画像の中の、文字以外のオブジェクト(写真など)が描かれている領域つまり非文字領域RHに対して図16に示すような処理を行うことによって、非文字領域RHの非文字領域画像再現用データ71を生成する(#3)。
【0080】
すなわち、原稿の画像の各画素の明度を算出し(図16の#11)、ラベリング処理を実行することによって非文字領域RHを抽出する(#12)。その際に、各非文字領域RHの位置情報(非文字領域位置データ81)も取得しておく。
【0081】
そして、非文字領域RHの画像の階調などの補正処理を必要に応じて行い(#13)、その画像のデータおよび非文字領域位置データ81などに基づいて非文字領域画像再現用データ71を生成する(#14)。
【0082】
図15に戻って、ステップ#3の処理と前後してまたは並行して、原稿の画像の中の、文字が描かれている領域つまり文字領域RMに対して図17に示すような処理を施すことによって、文字領域RMの文字領域再現用データ70を生成する。
【0083】
すなわち、原稿の画像の各画素の明度を算出し(図17の#21)、ラベリング処理を実行することによって文字領域RMを抽出する(#22)。その際に、各文字領域RMの位置情報(文字領域位置データ80)も抽出しておく。なお、明度の算出の処理およびラベリングの処理は、図16のステップ#11、#12の処理と共通に行ってもよい。
【0084】
文字領域RMに多くの文字が示されている場合は、これを複数のブロックBRに分割し(#23)、ブロックBRごとに二値画像GNを生成する(#24)。この二値画像GNによってブロックBRの中の文字画像と文字背景画像とを分けることができる。
【0085】
各ブロックBRの文字画像が表わす文字の色を判別する処理を行う。すなわち、原稿に書かれている文字の本来の色に近い画素(近似色画素PK)を選び出し(#25)、それらの画素値に基づいて原稿文字色を判別する(#26)。なお、近似色画素PKの選出方法は、前に図12で説明した通りである。ステップ#25の処理と前後してまたは並行して、文字背景画像GHのデータを生成する(#27)。
【0086】
そして、各ブロックBRの二値画像GNのデータ、文字色データ83、文字背景画像GHのデータ、およびブロック位置データ82と文字領域RMの文字領域位置データ80とに基づいて文字領域再現用データ70を生成する(#28)。
【0087】
図15に戻って、原稿再現用ファイルFLに関する属性を示すファイル属性データ72を生成する(#5)。そして、ステップ#3、#4の処理によって得られた原稿の画像中の各非文字領域RHの非文字領域画像再現用データ71および各文字領域RMの文字領域再現用データ70を圧縮し(#6)、圧縮したデータとファイル属性データ72とを統合することによって原稿再現用ファイルFLを生成する(#7)。
【0088】
本実施形態によると、文字の線図形の中央線にできるだけ近い画素を参照することによって原稿文字色を判別する。よって、色滲みの影響を低減し、従来よりも正確に原稿文字色を判別することができる。
【0089】
また、本実施形態によると、解像度を落とした二値画像GNおよび細線化画像GSを用いて原稿文字色の判別のための処理を行うので、処理に要する時間を短縮することができる。
【0090】
図18は近似色画素選出処理の流れの変形例を説明するためのフローチャート、図19はテンプレートTMPおよび参照画素位置フレームSGPの例を示す図である。
【0091】
本実施形態では、文字画像が表わす色を判別する処理(図17のステップ#25)を、図11および図12などで説明した方法で行った。つまり、図11(a)のような細線化画像GSの細線上の各画素に対応する文字色候補領域RCを原稿画像GA0’の中から抽出し、抽出したそれぞれの文字色候補領域RCから近似色画素PKを1つずつ選出し、そして、それらの近似色画素PKのRGBの各原色の階調の値に基づいて原稿文字色を判別した。しかし、文字色候補領域RC以外から近似色画素PKを選出してもよい。例えば、図18に示すような方法で、近似色画素PKを選出してもよい。
【0092】
図19(a)〜(d)に示すようなテンプレートTMP(TMP1〜TMP4)を予め用意しておく。これらのテンプレートTMPには、それぞれ、図中の右側に示すような、参照画素の位置を求めるための参照画素位置フレームSGP(SGP1〜SGP4)を対応付けておく。なお、テンプレートTMP1〜TMP4の1つのセルは、細線化画像GSの解像度(75dpi)における1画素に対応する。一方、参照画素位置フレームSGP1〜SGP4の1つのセルは、原稿画像GA0’の解像度(300dpi)における1画素に対応する。
【0093】
まず、細線化画像GSの細線上の各画素に対応する文字色候補領域RCから1つずつ近似色画素PKを選出する(図18の#501〜#503)。この処理の内容は、前に図12で説明した処理の内容と同様である。つまり、文字色候補領域RCの端を除いた中央部分から明度の最も低い画素を近似色画素PKとして選出する。
【0094】
テンプレートTMP1〜TMP4を次のように使用して、さらに近似色画素PKを選出する。細線化画像GSの中の、細線に隣接する画素に注目し、その注目した画素(以下、「注目画素」と記載する。)にテンプレートTMP1の中心つまり図19(a)の太線枠で示すセルを合わせるようにして、テンプレートTMP1を重ねる(#506)。
【0095】
このとき、テンプレートTMPの灰色で示す所定のセルのいずれかに細線化画像GSの細線が重なったら(#507でYes)、テンプレートTMP1に対応する参照画素位置フレームSGP1を用いて、近似色画素PKの候補として参照すべき画素を、次のように決定する(#508)。すなわち、原稿画像GA0’の中の、その注目画素に対応する4×4個の画素に、その参照画素位置フレームSGP1を重ねる。参照画素位置フレームSGP1の中の太線枠のセルと重なった画素を、参照すべき画素に決定する。
【0096】
そして、これらの参照すべき画素の中から明度の最も低いものを、近似色画素PKとして選出する(#509)。
【0097】
ステップ#506〜#509の処理を、細線化画像GSの細線に隣接する他の画素についても実行する。さらに、テンプレートTMP2〜TMP4を使用して同様の処理を実行する。以上のようにして、近似色画素PKが追加される。
【0098】
近似色画素PKを選出した後に実行する処理は、本実施形態で説明した通りである。つまり、選出した近似色画素PKのRGB成分ごとのヒストグラムを求め(図13参照)、ピークの値を求ることによって、原稿文字色を決定する。
【0099】
本実施形態では、文字色候補領域RC(図11(c)参照)の中央の4つの画素の中から1つだけ近似色画素PKを選出したが、複数選出してもよい。例えば、中央の4つの画素すべてを選出してもよい。同様に、図18で説明した選出方法においても、参照画素位置フレームSGP(図19参照)の太線枠のセルに重なった3つの画素の中から1つだけを近似色画素PKとして選出するのではなく、2つまたは3つを選出するようにしてもよい。
【0100】
本実施形態では、原稿の画像を読み取る機能、画像を補正する機能、および画像データのファイル化を行う機能などがすべて画像形成装置1に備わっている場合を例に説明したが、これらの機能を複数の装置に分散して実現することも可能である。例えば、原稿の画像を読み取る機能をパーソナルコンピュータ用のスキャナで実現し、それ以外の機能をパーソナルコンピュータによって実現するようにしてもよい。この場合は、パーソナルコンピュータには、図3の各部の機能を実現するためのプログラムなどをインストールしておく。または、画像形成装置1で読み取った原稿画像GA0の画像データを端末装置2に転送し、端末装置2が図3の各部の処理を実行するようにしてもよい。
【0101】
本実施形態では、スキャナで読み取った原稿の画像をファイル化する場合を例に説明したが、本発明は、それ以外の種類の画像読取装置で取得した画像をファイル化する場合にも適用可能である。例えば、デジタルカメラで撮影した原稿の画像をファイル化するためにも適用することができる。
【0102】
文字領域RMを再現するためのデータとしてリッチテキストフォーマットのデータを生成してもよい。
【0103】
文字領域RMの文字画像よりも文字背景画像の色のほうが濃い場合、つまり、いわゆる白抜き文字が描かれている場合は、画像形成装置1の各部は、次のように処理内容を変更する。図6の二値化処理部134は、ブロックBRの各画素の濃度を算出し、算出した濃度が濃度閾値β未満であればその画素の値を「1」とし、濃度閾値β以上であればその画素の値を「0」とする。つまり、濃度が低いほうの画素を、文字画像を構成する画素であるものとする。図8の近似色画素選出部304は、文字色候補領域RC(図11(c)参照)の中央の4つの画素の中から明度が最も高い画素つまり濃度が最も低い画素を近似色画素PKとして選出する。
【0104】
本実施形態では、ブロックBRの画像よりも低解像度の細線化画像GSを生成することによって文字の線図形の中央線およびその付近の領域を抽出したが、解像度を落とさずに細線化画像を生成し、これに基づいて抽出してもよい。この場合は、この細線化画像とブロックBRの画像とを重ね合わせることによって、中央線およびその付近の領域を知ることができる。そして、その領域から図11(c)に示すような4×4の画素の領域を複数個選び出し、それ以降の処理を行うようにすればよい。
【0105】
その他、画像形成装置1の全体または各部の構成、処理内容、処理順序、テーブルの内容などは、本発明の趣旨に沿って適宜変更することができる。
【図面の簡単な説明】
【0106】
【図1】本発明に係る画像形成装置を有するシステム構成の例を示す図である。
【図2】画像形成装置のハードウェア構成の例を示す図である。
【図3】画像形成装置の機能的構成の例を示す図である。
【図4】原稿画像の例を示す図である。
【図5】非文字領域処理部の構成の例を示す図である。
【図6】文字領域処理部の構成の例を示す図である。
【図7】複数のブロックに分割した文字領域RMの例を示す図である。
【図8】文字色判別部の構成の例を示す図である。
【図9】細線化画像の生成方法の例を説明するための図である。
【図10】文字の線図形の中央線の位置の例を示す図である。
【図11】文字の線図形の中央線およびその付近の領域を複数の文字色候補領域に分割する方法の例を説明するための図である。
【図12】近似色画素選出処理の流れの例を説明するためのフローチャートである。
【図13】各原色の階調の分布の例を示す図である。
【図14】原稿再現用ファイルの構造の例を示す図である。
【図15】画像形成装置の全体的な処理の流れの例を説明するためのフローチャートである。
【図16】非文字領域処理の流れの例を説明するためのフローチャートである。
【図17】文字領域処理の流れの例を説明するためのフローチャートである。
【図18】近似色画素選出処理の流れの変形例を説明するためのフローチャートである。
【図19】テンプレートおよび参照画素位置フレームの例を示す図である。
【符号の説明】
【0107】
1 画像形成装置(文字色判別装置)
302 細線化画像生成部(中央領域検出手段)
303 文字画像分割部(小領域抽出手段)
304 近似色画素選出部(条件合致画素検出手段)
306 文字色決定部(色判別手段)
RC 文字色候補領域(小領域)
PK 近似色画素(条件合致画素)


【特許請求の範囲】
【請求項1】
画像入力装置によって入力された入力画像に表れる文字の線図形の中央線またはその付近の領域である中央領域を検出する中央領域検出手段と、
複数の画素からなる複数の小領域を前記中央領域から抽出する小領域抽出手段と、
前記小領域ごとに、当該小領域に属する画素の中から所定の条件に合う画素を条件合致画素として検出する条件合致画素検出手段と、
前記入力画像に表れる文字の色を前記各小領域の前記条件合致画素の色情報に基づいて判別する色判別手段と、
を有することを特徴とする文字色判別装置。
【請求項2】
前記中央領域検出手段は、前記入力画像に対して細線化処理を施すことによって検出した細線またはその付近の領域を、前記中央領域として検出し、
前記所定の条件とは、明度が最も低いことであり、
前記色判別手段は、原色ごとに、前記条件合致画素の当該原色の階調のピークを算出し、当該各原色の当該ピークによって表わされる色を、前記入力画像に表れる文字の色であると判別する、
請求項1記載の文字色判別装置。
【請求項3】
前記小領域抽出手段は、前記小領域を、前記中央線が当該小領域の中央を通るように抽出する、
請求項1または請求項2記載の文字色判別装置。
【請求項4】
前記条件合致画素検出手段は、前記中央線が通らない前記小領域については、当該小領域に属する、前記中央線に近い側の所定の位置の画素の中から、前記条件合致画素を検出する、
請求項1または請求項2記載の文字色判別装置。
【請求項5】
画像入力装置によって入力された入力画像に表れる文字の線図形の中央線またはその付近の領域である中央領域を検出し、
複数の画素からなる複数の小領域を前記中央領域から抽出し、
前記小領域ごとに、当該小領域に属する画素の中から所定の条件に合う画素を条件合致画素として検出し、
前記入力画像に表れる文字の色を前記各小領域の前記条件合致画素の色情報に基づいて判別する、
ことを特徴とする文字色判別方法。
【請求項6】
画像入力装置によって入力された入力画像を取り扱うコンピュータに用いられるコンピュータプログラムであって、
前記入力画像に表れる文字の線図形の中央線またはその付近の領域である中央領域を検出する処理と、
複数の画素からなる複数の小領域を前記中央領域から抽出する処理と、
前記小領域ごとに、当該小領域に属する画素の中から所定の条件に合う画素を条件合致画素として検出する処理と、
前記入力画像に表れる文字の色を前記各小領域の前記条件合致画素の色情報に基づいて判別する処理と、
をコンピュータに実行させるためのコンピュータプログラム。


【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate


【公開番号】特開2007−249774(P2007−249774A)
【公開日】平成19年9月27日(2007.9.27)
【国際特許分類】
【出願番号】特願2006−74507(P2006−74507)
【出願日】平成18年3月17日(2006.3.17)
【出願人】(303000372)コニカミノルタビジネステクノロジーズ株式会社 (12,802)
【Fターム(参考)】