説明

文字検出装置、文字検出方法、およびコンピュータプログラム

【課題】透過画像が重ねられた領域から字を従来よりも精度よく検出する。
【解決手段】画像形成装置1に、次の手段を設ける。文字を表わす第一の画像に半透明のオブジェクトを表わす第二の画像が重なっている領域である重畳領域を検出する透過画像重畳領域抽出部101と、重畳領域を複数に分割したブロックごとに、色相および明度の階級ごとの画素の出現の度数を算出するヒストグラム算出部103と、各ブロックの階級ごとの度数に基づいて、重畳領域から文字を検出する文字画素判別部104と、を設ける。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、透過画像を含む画像に対して画像処理を行う装置および方法などに関する。
【背景技術】
【0002】
近年、コピー、PCプリント、スキャン、ファックス、およびファイルサーバなどの様々な機能を備えた画像形成装置が普及している。このような画像形成装置は、「複合機」または「MFP(Multi Function Peripherals)」などと呼ばれる。
【0003】
PCプリントは、パーソナルコンピュータから画像データを受信し画像を用紙に印刷する機能である。
【0004】
また、近年、パーソナルコンピュータで描画を行うためのアプリケーションが流通している。このようなアプリケーションは、「描画ソフト」と呼ばれている。描画ソフトの中には、透過画像をディスプレイに表示する機能が備わっているものがある。
【0005】
「透過画像」は、後ろに他のオブジェクトの画像があっても当該他のオブジェクトの画像が透けて表れる性質を有する。
【0006】
つまり、例えば、図4(A)に示すように、背後画像40bの左半分の上に透過画像40aを重ねる。すると、図4(B)に示すように、背後画像40bの、透過画像40aと重なる部分は、透けて見える。しかし、背後画像40bの右半分の上に透過画像でない非透過画像40cを重ねても、透けて見えない。透過画像の透過率が高いほど、それが重ねられた背後の画像は、よく透けて見える。
【0007】
画像形成装置は、パーソナルコンピュータに表示されている透過画像を用紙に印刷することができる。印刷されるまでに透過画像は、透過率の高さに応じて、図5(B)および図5(C)に示すように、画素の間引きの処理が施される。そして、間引かれた画素の位置に、透過画像の背後の画像が印刷される。これにより、背後の画像が透けて表れているように見える。
【0008】
また、画像の中の文字または数字などの字を検出する技術が、実用化されている。さらに、字を精度よく検出する方法が提案されている。例えば、次のような方法が提案されている。
【0009】
デジタル画像を複数のブロックに分割し、ブロックに含まれる複数の画素の画素値に関するコントラスト量を求め、ブロックに含まれる複数の画素の画素値のヒストグラムに関する画素値二峰性評価値を求め、複数の上記コントラスト量に基づくコントラスト閾値を求め、複数の上記画素値二峰性評価値に基づく二峰性閾値を求め、上記ブロックをテキストブロックまたは非テキストブロックとして分類する。上記分類においては、上記コントラスト量および上記画素値二峰性評価値が、上記コントラスト閾値および上記二峰性閾値に基づいた第1基準を満たしている上記ブロックを、テキストブロックとして分類し、上記第1基準を満たしていない上記ブロックを、非テキストブロックとして分類する(特許文献1)。
【先行技術文献】
【特許文献】
【0010】
【特許文献1】特開2010−81604号公報
【発明の概要】
【発明が解決しようとする課題】
【0011】
しかし、特許文献1に記載されるような従来の方法では、透過画像が重ねられた字を上手く検出することは、できない。透過画像を重ねられた部分の全面がテキストの領域であると、判定されるからである。
【0012】
本発明は、このような問題点に鑑み、透過画像が重ねられた字を従来よりも精度よく検出することを、目的とする。
【課題を解決するための手段】
【0013】
本発明の一形態に係る文字検出装置は、文字を表わす第一の画像と半透明のオブジェクトを表わす第二の画像と含む画像から前記文字を検出する文字検出装置であって、前記第一の画像に前記第二の画像が重なっている領域である重畳領域を複数に分割したブロックごとに、色相および明度の階級ごとの画素の出現の度数を算出する、色相分布算出手段と、前記各ブロックの前記階級ごとの前記度数に基づいて、前記重畳領域から前記文字を検出する、文字検出手段と、を有する。
【0014】
好ましくは、前記複数のブロックそれぞれについて、前記度数として一定以上の値が表れる1つのまたは連続する複数の前記階級からなる階級グループを検出する、階級グループ検出手段と、検出された前記階級グループのうちの色相が同一でありかつ明度の幅が同一である階級グループにおける、当該複数のブロックのうちの一方のブロックの前記度数の合計と他方のブロックの前記度数の合計との差を算出する、差算出手段と、前記重畳領域の中の、検出された前記階級グループのうちの前記差が所定の値以上でありかつ所定の範囲未満の色相および明度に係る階級グループの色相および明度の画素を膨張させ収縮させることによって、クロージング画像を生成するクロージング画像生成手段と、を有し、前記文字検出手段は、生成された前記クロージング画像に基づいて前記文字を検出する。
【0015】
または、前記複数のブロックそれぞれについて、前記度数として一定以上の値が表れる1つのまたは連続する複数の前記階級からなる階級グループを検出する、階級グループ検出手段と、検出された前記階級グループのうちの色相が同一でありかつ明度の幅が同一である階級グループにおける、当該複数のブロックのうちの一方のブロックの前記度数の合計と他方のブロックの前記度数の合計との差を算出する、差算出手段と、検出された前記階級グループのうちの前記差が所定の値以上である階級グループごとに、前記重畳領域の中の、当該階級グループの色相および明度の画素を膨張させ収縮させることによって、クロージング画像を生成する、クロージング画像生成手段と、を有し、前記文字検出手段は、生成された前記各クロージング画像に基づいて前記文字を検出する。
【発明の効果】
【0016】
本発明によると、透過画像が重ねられた領域から字を従来よりも精度よく検出することができる。
【図面の簡単な説明】
【0017】
【図1】画像形成装置を含むネットワークシステムの例を示す図である。
【図2】画像形成装置のハードウェア構成の例を示す図である。
【図3】画像処理回路の構成の例を示す図である。
【図4】背後画像への透過画像および非透過画像の重ね合わせの例を説明するための図である。
【図5】透過画像の特性の例を説明するための図である。
【図6】背後画像への透過画像の重ね合わせの例を説明するための図である。
【図7】オリジナル画像、透過画像、および背後画像などの位置関係の例を示す図である。
【図8】透過画像重畳領域およびブロックの例を示す図である。
【図9】色相および明度ごとのヒストグラムの例を示す図である。
【図10】文字画素判別部の構成の例を示す図である。
【図11】変化画素選出部およびクロージング処理部の処理を説明するための図である。
【図12】オリジナル画像、透過画像、および背後画像などの位置関係の例を示す図である。
【図13】画像処理回路の変形例を示す図である。
【図14】文字画素判別部の構成の例を示す図である。
【図15】透過画像重畳領域およびブロックの例を示す図である。
【図16】色相および明度ごとのヒストグラムの例を示す図である。
【図17】第一の画素置換部、第一のクロージング処理部、および第一の文字画素判別部の処理を説明するための図である。
【図18】第二の画素置換部、第二のクロージング処理部、および第二の文字画素判別部の処理を説明するための図である。
【図19】論理和演算部の処理を説明するための図である。
【発明を実施するための形態】
【0018】
〔第一の実施形態〕
図1は、画像形成装置1を含むネットワークシステムの例を示す図である。図2は、画像形成装置1のハードウェア構成の例を示す図である。
【0019】
図1に示す画像形成装置1は、一般に複合機またはMFP(Multi Function Peripherals)などと呼ばれる装置であって、コピー、ネットワークプリンティング(PCプリント)、ファックス、およびスキャナなどの機能を集約した装置である。
【0020】
画像形成装置1は、LAN(Local Area Network)、公衆回線、またはインターネットなどの通信回線4Tを介してパーソナルコンピュータ4Aなどの装置と画像データのやり取りを行うことができる。
【0021】
画像形成装置1は、図2に示すように、CPU(Central Processing Unit)10a、RAM(Random Access Memory)10b、ROM(Read Only Memory)10c、大容量記憶装置10d、スキャナ10e、印刷装置10f、ネットワークインタフェース10g、タッチパネルディスプレイ10h、モデム10i、および画像処理回路10jなどによって構成される。
【0022】
スキャナ10eは、原稿の用紙に記されている写真、文字、絵、図表などの画像を読み取って画像データを生成する装置である。
【0023】
タッチパネルディスプレイ10hは、ユーザに対してメッセージまたは指示を与えるための画面、ユーザが処理の指令および条件を入力するための画面、およびCPU10aの処理の結果を示す画面などを表示する。また、ユーザが指で触れた位置を検知し、検知結果を示す信号をCPU10aに送信する。
【0024】
ネットワークインタフェース10gは、通信回線4Tを介してパーソナルコンピュータ4Aなどの他の装置と通信を行うためのNIC(Network Interface Card)である。
【0025】
モデム10iは、固定電話網を介して他のファックス端末との間でG3などのプロトコルで画像データをやり取りするための装置である。
【0026】
画像処理回路10jは、パーソナルコンピュータ4Aから送信されてきた画像データに基づいて、印刷の対象の画像に対して画像処理を施す。画像処理回路10jの各部は、ASIC(Application Specific Integrated Circuit)またはFPGA(Field Programmable Gate Array)などの回路によって実現される。画像処理回路10jの各部の処理については、後述する。
【0027】
印刷装置10fは、スキャナ10eによって読み取られた画像または画像処理回路10jによって画像処理が施された画像などを用紙に印刷する。
【0028】
ROM10cおよび大容量記憶装置10dには、OS(Operating System)のほかファームウェアおよびアプリケーションなどのプログラムが記憶されている。これらのプログラムは、必要に応じてRAM10bにロードされ、CPU10aによって実行される。大容量記憶装置10dとして、ハードディスクまたはフラッシュメモリなどが用いられる。
【0029】
次に、画像処理回路10jの構成および画像処理回路10jによる画像処理について、説明する。
【0030】
図3は、画像処理回路10jの構成の例を示す図である。図4は、背後画像40bへの透過画像40aおよび非透過画像40cの重ね合わせの例を説明するための図である。図5は、透過画像の特性の例を説明するための図である。図6は、背後画像41bへの透過画像41aの重ね合わせの例を説明するための図である。図7は、オリジナル画像50、透過画像50a、および背後画像50bなどの位置関係の例を示す図である。図8は、透過画像重畳領域50Kおよびブロック61の例を示す図である。図9は、色相および明度ごとのヒストグラムの例を示す図である。図10は、文字画素判別部104の構成の例を示す図である。図11は、変化画素選出部231およびクロージング処理部232の処理を説明するための図である。
【0031】
画像処理回路10jは、図3に示すように、透過画像重畳領域抽出部101、ブロック分割部102、ヒストグラム算出部103、文字画素判別部104、および透過画像重畳領域補正部105などによって構成される。画像処理回路10jは、印刷の対象の画像に対して画像処理を施す。画像処理は、具体的には、印刷の対象の画像を表す画像データ70を編集する情報処理である。
【0032】
本実施形態では、画像データ70として、透過画像が他の画像に重なった様子を表す画像データが用いられる。
【0033】
一般に、「透過画像」は、後ろに他のオブジェクトの画像があっても当該他のオブジェクトの画像が透けて表れる性質を有する画像である。つまり、透過画像はガラスおよびセロハンなどのような半透明のオブジェクトを表わしていると、言える。
【0034】
例えば、図4(A)に示すように、背後画像40bの左半分の上に透過画像40aを重ね、背後画像40bの右半分の上に非透過画像40cを重ねる。すると、図4(B)に示すように、背後画像40bの、透過画像40aと重なる部分は、透けて見える。しかし、背後画像40bの、非透過画像40cと重なる部分は、全く表れない。
【0035】
透過画像の透過率が高いほど、その透過画像が上に重ねられた他の画像(つまり、背後画像)は、よく透けて見える。
【0036】
また、一般に、透過画像は、パーソナルコンピュータ4Aなどで表示されるときには図5(A)に示すようにすべての画素が一定の値以上の濃度を有していても、印刷時には、図5(B)または図5(C)に示すように、その濃度を有する画素と有しない画素とによって構成されるように、変換される。
【0037】
なお、図5(B)および図5(C)において、ハッチングした画素が、その濃度を有する画素である。一方、ハッチングしていない画素が、その濃度を有しない画素である。図15においても、同様である。以下、この濃度を有する画素を「濃度有画素」と記載し、この濃度を有しない画素を「濃度無画素」と記載する。また、「濃度」は、透過画像がカラー画像である場合は各色(例えば、Red、Green、Blueそれぞれ)の階調であり、透過画像がモノクロ画像である場合はグレースケールである。
【0038】
濃度有画素は、決められた濃度で印刷される。一方、濃度無画素は、後ろに他の画像がなければ印刷されないが、他の画像があれば、当該他の画像の中の、この濃度無画素と同じ位置にある画素が印刷される。
【0039】
よって、例えば図6に示すように透過画像41aの一部分が背後画像41bの一部分の上に重なっている場合は、透過画像41aの濃度無画素の位置に背後画像41bの対応する画素を配置して印刷することによって、背後画像41bが透過画像41aに透けているかのように、両画像が印刷される。
【0040】
また、透過画像の透過率が高いほど、濃度有画素が出現する頻度が低い。したがって、図5(B)に示す透過画像のほうが図5(C)に示す透過画像よりも透過率が高い。
【0041】
図5(B)に示す濃度有画素の上下左右には、濃度無画素が存在する。一方、図5(C)に示す濃度無画素の上下左右には、濃度有画素が存在する。
【0042】
以下、他方のタイプの画素が上下左右に存在する画素を「孤立点」と記載する。したがって、図5(B)においては、濃度有画素が孤立点画素であり、図5(C)においては、濃度無画素が孤立点画素である。
【0043】
本実施形態では、画像データ70として、オリジナル画像50を表す画像データを取り扱う場合を例に、画像処理回路10jによる画像処理を説明する。
【0044】
オリジナル画像50は、図7(A)に示すように、背後画像50bの上に透過画像50aを重ねたものである。
【0045】
透過画像50aは、背後画像50bよりも小さい。よって、オリジナル画像50には、図7(B)に示すように、背後画像50bと透過画像50aとが重なっている領域と背後画像50bのみの領域とがある。以下、前者を「透過画像重畳領域50K」と記載し、後者を「透過画像非重畳領域50L」と記載する。
【0046】
背後画像50bの、透過画像50aが重なった部分には、「A」という文字が記されている。この文字の色は、特定の1つの色(例えば、青色)である。また、この文字の背景の色は、別の特定の1つの色(例えば、緑色)であるが、左から右へ行くに連れて徐々に濃度が変化する。つまり、グラデーションによって表現されている。透過画像50aの色は、文字の色とも文字の背景の色とも異なる。例えば、オレンジ色である。
【0047】
ユーザは、オリジナル画像50を、パーソナルコンピュータ4Aにインストールされている描画ソフトなどのアプリケーションを用いて作成する。これにより、オリジナル画像50を再現するためのデータが画像データ70として生成される。
【0048】
パーソナルコンピュータ4Aは、印刷の指令とともに画像データ70を画像形成装置1へ送信する。
【0049】
画像形成装置1において、印刷の指令および画像データ70が受信されると、図3に示す画像処理回路10jの各部は、次のような処理を実行する。
【0050】
透過画像重畳領域抽出部101は、オリジナル画像50の中から透過画像重畳領域50Kを判別し、抽出する。
【0051】
具体的には、透過画像重畳領域抽出部101は、透過画像の上述の特性に基づいて、透過画像重畳領域50Kを、例えば次のように判別し検出する。
【0052】
透過画像重畳領域抽出部101は、オリジナル画像50の中から孤立点を次のように検出する。ある1つの画素に注目する。以下、この画素を「注目画素」と記載する。注目画素の濃度(階調)と、注目画素の上下左右に隣接する他の画素(以下、「隣接画素」と記載する。)それぞれの濃度とを比較する。
【0053】
注目画素の濃度と当該他の画素それぞれの濃度との差がすべて所定の値β1以上であるという要件を満たす場合は、透過画像重畳領域抽出部101は、注目画素を孤立点として検出する。
【0054】
なお、オリジナル画像50がカラー画像である場合は、透過画像重畳領域抽出部101は、この比較を各色それぞれについて独立して行う。そして、いずれか1つでも要件を満たす場合は、注目画素を孤立点として検出する。以下、オリジナル画像50がカラー画像である場合における要件の具備の判断において、同様である。
【0055】
図5(B)および図5(C)に示したように、透過画像の孤立点の出現には、一定の周期性(規則性)がある。そこで、透過画像重畳領域抽出部101は、検出した孤立点のうちの、出現の仕方に周期性がある複数の孤立点を抽出する。
【0056】
そして、透過画像重畳領域抽出部101は、抽出した複数の孤立点の分布を表す画像(以下、「分布画像」と記載する。)に対してクロージングの処理を行う。つまり、各孤立点の位置にあるドットを拡張(膨張)させ縮小(収縮)させる処理を行う。クロージングの処理がなされた分布画像の位置および形状が、透過画像重畳領域50Kの位置および形状にほぼ対応する。
【0057】
透過画像重畳領域抽出部101は、このようにして透過画像重畳領域50Kの位置および形状を特定し、オリジナル画像50から透過画像重畳領域50Kを抽出する。
【0058】
なお、透過画像の透過率が50%前後である場合は、濃度有画素が孤立点として検出されるとともに、濃度無画素の位置に表れている背後画像の画素も孤立点として検出される。つまり、領域の中のほとんどの画素が孤立点として検出される。各濃度有画素の濃度は一定であるが、各濃度無画素の位置に表れている背後画像の画素は、一定でない。そこで、領域の中のほとんどの画素が孤立点として検出された場合は、透過画像重畳領域抽出部101は、一定の濃度を有する孤立点だけを選出し、選出した孤立点の分布を表す画像を分布画像としてクロージングを行えばよい。
【0059】
ブロック分割部102は、透過画像重畳領域抽出部101によって抽出された透過画像重畳領域50Kを所定の個数のブロック61に分割する。本実施形態では、図8(A)に示す透過画像重畳領域50Kを、図8(B)に示すように、4×4個のブロック61A〜61Pに分割する。ブロック61A〜61Pのサイズはすべて等しいものとする。
【0060】
ヒストグラム算出部103は、ブロック61A〜61Pにおける、各色相および各明度の画素の個数を度数を算出する。算出された各度数の分布(度数分布)は、図9(A)〜(C)のように、色相、明度、および度数(画素数)をそれぞれX軸、Y軸、およびZ軸とする3次元空間において、3次元のヒストグラムとして表すことができる。図9(A)、(B)、および(C)は、それぞれ、ブロック61B、61C、および61Fにおけるヒストグラムである。以下、ヒストグラムの6面のうちの原点Oを通るX−Y平面に接する面を、底面として取り扱う。
【0061】
文字画素判別部104、図10に示すように、比較演算部201〜224、変化画素選出部231、クロージング処理部232、および文字画素特定部233などによって構成される。このような構成により、文字画素判別部104は、ヒストグラム算出部103によって算出された各ブロック61のヒストグラムに基づいて、透過画像重畳領域50Kの中から文字の画素を次のように判別する。
【0062】
透過画像重畳領域50Kには、上下または前後に隣り合う2つのブロック61の組合せが、24通りある。文字画素判別部104には、これらの組合せごとに、比較演算部が1つずつ設けられている。
【0063】
そして、比較演算部201〜224は、ヒストグラム算出部103によって算出された、ブロック61それぞれのヒストグラムの表れ方を比較する。例えば、比較演算部202は、ブロック61Bのヒストグラムの表れ方とブロック61Cのヒストグラムの表れ方とを比較する。比較演算部214は、ブロック61Bのヒストグラムの表れ方とブロック61Fのヒストグラムの表れ方とを比較する。
【0064】
比較演算部201〜224は、2つのブロック61のヒストグラムの表れ方を次のように比較する。
【0065】
図9(A)〜(C)には、1本の独立したヒストグラムも表れていれば、隣り合う複数のヒストグラムも表れている。つまり、図9(A)〜(C)のそれぞれには、1本または複数本のヒストグラムの塊が表れている。以下、ヒストグラムの塊を「ヒストグラム群」と記載する。
【0066】
比較演算部201〜224は、ヒストグラム算出部103による処理の結果、2つのブロック61のそれぞれから、2つまたは3つのヒストグラム群を検出する。そして、一方のブロック61のヒストグラム群の底面と他方のブロック61の底面とを比較する。すると、底面の位置が同じであるヒストグラム群が、一方のブロック61の結果および他方のブロック61の結果から複数組、見つかる。
【0067】
比較演算部201〜224は、底面の位置が同じである2つのヒストグラム群それぞれの体積を算出し、さらに、両体積の差を算出する。
【0068】
そして、比較演算部201〜224は、差が所定の値β2(例えば、2つ分の画素に相当する値)以下である組のヒストグラム群の底面が表す色相の範囲および明度の範囲を変化画素選出部231へ通知する。
【0069】
例えば、比較演算部202がブロック61Bのヒストグラム群(図9(A)参照)およびブロック61Bのヒストグラム群(図9(B)参照)について上述の処理を行うと、底面Saの色相の範囲および明度の範囲が変化画素選出部231へ通知される。
【0070】
変化画素選出部231は、24個の比較演算部(比較演算部201〜224)のそれぞれから、色相の範囲および明度の範囲の組が通知される。通知された内容に基づいて、次のように透過画像重畳領域50Kから変化画素を選出する。
【0071】
変化画素選出部231は、所定の個数α1(例えば、18個)以上の比較演算部から通知された、色相の範囲および明度の範囲の組を選出する。選出した組のうち、色相の範囲の幅が所定の幅γ1以下でありかつ明度の範囲の幅が所定の幅γ2以下である組に絞る。そして、透過画像重畳領域50Kの中から、絞った組の色相の範囲および明度の範囲の画素を、変化画素として選出する。これにより、図8(A)および図11(A)において黒色で塗り潰した画素が変化画素として選出される。
【0072】
クロージング処理部232は、図11(B)に示す、選出された変化画素からなる二値画像51に対して、クロージングの処理を行う。つまり、図11(B)において黒色で示す画素を膨張させ収縮させる。これにより、図11(C)に示すような結果が得られる。以下、クロージング処理部232によってクロージングの処理がなされた二値画像51を「クロージング処理画像52」と記載する。
【0073】
そして、文字画素特定部233は、透過画像重畳領域50Kの中の、クロージング処理画像52において黒色で示される画素と同じ位置にある画素を、文字の画素として特定する。
【0074】
以上のようにして、文字画素判別部104の各部による処理によって、透過画像重畳領域50Kの中の文字の画素が判別される。
【0075】
図3に戻って、透過画像重畳領域補正部105は、文字画素判別部104による判別結果(クロージング処理画像52)などに基づいて、オリジナル画像50の中の透過画像重畳領域50Kの補正を行う。例えば、文字の画素であると判別された画素群に対して、エッジ強調処理を行い、残りの部分に対して、ぼかしの処理を行う。以下、文字画素判別部104によって処理がなされたオリジナル画像50を「補正画像53」と記載する。
【0076】
その後、印刷装置10fは、補正画像53を用紙に印刷する。または、ネットワークインタフェース10gは、補正画像53の画像データをパーソナルコンピュータ4Aなどに送信する。
【0077】
第一の実施形態によると、透過画像が重ねられたグラデーションの領域から文字を従来よりも精度よく検出することができる。
【0078】
〔第二の実施形態〕
図12は、オリジナル画像55、透過画像55a、および背後画像55bなどの位置関係の例を示す図である。図13は、画像処理回路10jの変形例を示す図である。図14は、文字画素判別部124の構成の例を示す図である。図15は、透過画像重畳領域55Kおよびブロック62の例を示す図である。図16は、色相および明度ごとのヒストグラムの例を示す図である。図17は、第一の画素置換部332、第一のクロージング処理部333、および第一の文字画素判別部334の処理を説明するための図である。図18は、第二の画素置換部335、第二のクロージング処理部336、および第二の文字画素判別部337の処理を説明するための図である。図19は、論理和演算部338の処理を説明するための図である。
【0079】
第一の実施形態では、背後画像50bにはグラデーションの効果が適用され、透過画像50aにはグラデーションの効果が適用されていなかった(図7参照)。第二の実施形態では、透過画像にはグラデーションの効果が適用されているが背後画像にはグラデーションの効果が適用されていないオリジナル画像を処理対象とする。以下、図12(A)のように背後画像55bの上に透過画像55aを重ねたオリジナル画像55を処理対象とする場合を例に説明する。ただし、第一の実施形態と重複する点については、説明を省略する。
【0080】
透過画像55aは、背後画像55bよりも小さい。よって、オリジナル画像55には、図12(B)に示すように、背後画像55bと透過画像55aとが重なっている領域と背後画像55bのみの領域とがある。以下、前者を「透過画像重畳領域55K」と記載し、後者を「透過画像非重畳領域55L」と記載する。
【0081】
背後画像55bの、透過画像55aが重なった部分には、「A」という文字が記されている。この文字の色は、特定の1つの色(例えば、青色)である。また、この文字の背景の色は、別の特定の1つの色(例えば、緑色)である。透過画像55aの色は、文字の色とも文字の背景の色とも異なる。例えば、オレンジ色である。さらに、透過画像55aは、左から右へ行くに連れて徐々に濃度が変化する。つまり、グラデーションによって表現されている。
【0082】
画像形成装置1のハードウェア構成は、第一の実施形態の場合と基本的に同じであり、図3に示した通りである。ただし、第二の実施形態では、画像形成装置1の画像処理回路10jには、文字画素判別部104の代わりに、図13に示すように文字画素判別部124が備わっている。
【0083】
文字画素判別部124は、図14に示すように、比較演算部301〜324、画素タイプ判別部331、第一の画素置換部332、第一のクロージング処理部333、第一の文字画素判別部334、第二の画素置換部335、第二のクロージング処理部336、第二の文字画素判別部337、および論理和演算部338などによって構成される。
【0084】
ユーザは、オリジナル画像55を再現するための画像データ71を用意する。パーソナルコンピュータ4Aは、印刷の指令とともに画像データ71を画像形成装置1へ送信する。
【0085】
画像形成装置1において、印刷の指令および画像データ71が受信されると、画像処理回路10jの各部は、次のような処理を実行する。
【0086】
透過画像重畳領域抽出部101は、第一の実施形態における透過画像重畳領域50Kを抽出する方法と同様の方法で、オリジナル画像55の中から透過画像重畳領域55Kを判別し、抽出する。
【0087】
ブロック分割部102は、第一の実施形態における透過画像重畳領域50Kの分割と同様に、図15(A)に示す透過画像重畳領域55Kを、図15(B)に示すように、4×4個のブロック62A〜62Pに分割する。ブロック62A〜62Pのサイズはすべて等しいものとする。
【0088】
なお、図15において、ハッチングした画素は濃度有画素であるが、見やすさのため、グラデーションの表現を省略している。また、黒色で塗りつぶした画素は文字の画層であり、黒点で示す画素は文字の背景の画素である。
【0089】
ヒストグラム算出部103は、ブロック62A〜62Pにおける、各色相および各明度の画素の個数を度数を算出する。ブロック62B、62C、および62Fそれぞれの算出の結果として、図16(A)、(B)、および(C)に示すヒストグラムが得られる。
【0090】
文字画素判別部124は、ヒストグラム算出部103によって算出された各ブロック62のヒストグラムに基づいて、透過画像重畳領域55Kの中から文字の画素を次のように判別する。
【0091】
比較演算部301〜324は、ヒストグラム算出部103によって算出された、ブロック62それぞれのヒストグラムの表れ方を比較する。例えば、比較演算部302は、ブロック62Bのヒストグラムの表れ方とブロック62Cのヒストグラムの表れ方とを比較する。比較演算部314は、ブロック62Bのヒストグラムの表れ方とブロック62Fのヒストグラムの表れ方とを比較する。
【0092】
比較演算部301〜324は、2つのブロック62のヒストグラムの表れ方を次のように比較する。
【0093】
比較演算部301〜324は、ヒストグラム算出部103による処理の結果、2つのブロック62のそれぞれから、2つまたは3つのヒストグラム群を検出する。そして、一方のブロック61のヒストグラム群の底面と他方のブロック61の底面とを比較する。
【0094】
すると、底面の位置が同じであるヒストグラム群が、一方のブロック62の結果および他方のブロック62の結果から複数組、見つかる。さらに、底面のY軸方向の位置は相違するがX軸方向の位置が同じでありかつ所定の個数α2(例えば、5本)以上のヒストグラムからなるヒストグラム群の組が見つかる場合が、ある。
【0095】
比較演算部301〜324は、見つかった組の2つのヒストグラム群それぞれの体積を算出し、両体積の差を算出する。そして、2つのヒストグラム群それぞれの体積および底面の面積のほか、両体積の差および底面が表す色相の範囲および明度の範囲を、画素タイプ判別部331へ通知する。
【0096】
画素タイプ判別部331は、比較演算部から通知された内容に基づいて、各組のヒストグラム群を次の(1)〜(3)のいずれかに分類する。
(1) 底面の面積が所定の値β3以下であり、かつ、体積が所定の値β4未満である第一のヒストグラム群。
(2) 体積が所定の値β4以上であり、かつ、ペア同士の体積の差が所定の値β5以上である第二のヒストグラム群。
(3) 体積が所定の値β4以上であり、かつ、ペア同士の体積の差が所定の値β5未満である第三のヒストグラム群。
【0097】
画素タイプ判別部331は、この分類の処理を、比較演算部301〜324それぞれから通知された内容ごとに、実行する。そして、所定の回数α3(例えば、18回)以上、上記の(1)に分類されたヒストグラム群を、第一のヒストグラム群であると判別する。同様に、所定の回数α3以上、上記の(2)に分類されたヒストグラム群を、第二のヒストグラム群であると判別し、所定の回数α3以上、上記の(3)に分類されたヒストグラム群を、第三のヒストグラム群であると判別する。
【0098】
画素タイプ判別部331の処理によると、図16(A)〜(C)に示す底面Seのヒストグラム群は、第一のヒストグラム群であると判別され、底面Sfのヒストグラム群は、第二のヒストグラム群であると判別され、底面SgまたはShのヒストグラム群は、第三のヒストグラム群であると判別される。
【0099】
以下、第一のヒストグラム群の底面が表す色相の範囲および明度の範囲の画素を「第一の画素」と記載する。同様に、第二のヒストグラム群の底面が表す色相の範囲および明度の範囲の画素を「第二の画素」と記載し、第三のヒストグラム群の任意の底面が表す色相の範囲および明度の範囲の画素を「第三の画素」と記載する。
【0100】
第一の画素置換部332、第一のクロージング処理部333、および第一の文字画素判別部334は、画像データ71および画素タイプ判別部331から通知された内容に基づいて処理を行う。ここで、この処理の手順を、図17を参照しながら説明する。
【0101】
第一の画素置換部332は、透過画像重畳領域55Kの中から第三の画素を検索する。これにより、図15(A)および図17(A)においてハッチングした画素が見つかる。そして、第一の画素置換部332は、見つかった第三の画素を、図17(B)に示すように、第二の画素(黒丸の画素)に置換する。以下、第一の画素置換部332によって置換の処理がなされた透過画像重畳領域55Kの画像を「置換処理画像56A」と記載する。
【0102】
第一のクロージング処理部333は、第一の画素を膨張させ収縮させることによって、置換処理画像56Aに対してクロージングの処理を行う。これにより、図17(C)に示すような結果が得られる。以下、第一のクロージング処理部333によってクロージングの処理がなされた置換処理画像56Aを「クロージング処理画像56B」と記載する。
【0103】
第一の文字画素判別部334は、クロージング処理画像56Bの画素のうちの、第一の画素および第二の画素のうちの個数が多い方を画素を、文字の画素であると、判別する。そして、文字の画素が「1」になり、それ以外の画素が「0」になるように、クロージング処理画像56Bを二値化する。これにより、図17(D)に示すような結果が得られる。なお、図17(D)において、白丸を付した画素の値が「1」であり、付していない画素の値が「0」である。後に示す図18(D)および図19においても、同様である。以下、第一の文字画素判別部334によって二値化されたクロージング処理画像56Bを「第一の二値画像56C」と記載する。
【0104】
第二の画素置換部335、第二のクロージング処理部336、および第二の文字画素判別部337も、第一の画素置換部332、第一のクロージング処理部333、および第一の文字画素判別部334と同様に、画像データ71および画素タイプ判別部331から通知された内容に基づいて処理を行う。ただし、画素の置換の仕方などが、異なる。
【0105】
以下、第二の画素置換部335、第二のクロージング処理部336、および第二の文字画素判別部337の処理を、図18を参照しながら説明する。
【0106】
第二の画素置換部335は、透過画像重畳領域55Kの中から第三の画素を検索し、見つかった第三の画素を、図18(B)に示すように、第一の画素(黒色で塗り潰した画素)に置換する。以下、第二の画素置換部335によって置換の処理がなされた透過画像重畳領域55Kの画像を「置換処理画像57A」と記載する。
【0107】
第二のクロージング処理部336は、第二の画素を膨張させ収縮させることによって、置換処理画像57Aに対してクロージングの処理を行う。これにより、図18(C)に示すような結果が得られる。以下、第二のクロージング処理部336によってクロージングの処理がなされた置換処理画像57Aを「クロージング処理画像57B」と記載する。
【0108】
第二の文字画素判別部337は、クロージング処理画像57Bの画素のうちの、第一の画素および第二の画素のうちの個数が多い方を画素を、文字の画素であると、判別する。そして、文字の画素が「1」になり、それ以外の画素が「0」になるように、クロージング処理画像57Bを二値化する。これにより、図18(D)に示すような結果が得られる。以下、第二の文字画素判別部337によって二値化されたクロージング処理画像57Bを「第二の二値画像57C」と記載する。
【0109】
論理和演算部338は、図19に示すように、同じ位置にある、第一の二値画像56Cの画素の値および第二の二値画像57Cの画素の値同士の論理和を算出する。二値画像58は、各位置の論理和を表している。
【0110】
二値画像58の中の値が「1」である画素が、透過画像重畳領域55Kの中の文字の画素に対応する。
【0111】
以上のようにして、文字画素判別部124の各部による処理によって、透過画像重畳領域55Kの中の文字の画素が判別される。
【0112】
図13に戻って、透過画像重畳領域補正部105は、文字画素判別部124による判別結果(二値画像58)などに基づいて、オリジナル画像55の中の透過画像重畳領域55Kの補正を行う。
【0113】
第二の実施形態によると、グラデーションの透過画像が重ねられた領域から文字を従来よりも精度よく検出することができる。
【0114】
第一の実施形態では、透過画像重畳領域50Kを、濃度有画素である孤立点の位置の規則性に基づいて検出したが、画像データ70に透過画像50aの位置を示すデータが予め含まれている場合は、このデータに基づいて検出すればよい。第二の実施形態の透過画像重畳領域55Kも同様に、画像データ71に透過画像55aの位置を示すデータが予め含まれている場合は、このデータに基づいて検出すればよい。
【0115】
第一の実施形態および第二の実施形態では、透過画像重畳領域50K、55Kを16個のブロックに分割したが、もっと少ない個数のブロックに分割してもよいし、多い個数のブロックに分割してもよい。
【0116】
第一の実施形態および第二の実施形態では、上下左右に隣り合うブロックのヒストグラム群同士を比較したが、他の組合せであってもよい。例えば、さらに、斜めの方向に並ぶブロックのヒストグラム群同士を比較してもよい。または、上下に隣り合うブロックのヒストグラム群同士のみを比較してもよいし、左右に隣り合うブロックのヒストグラム群同士のみを比較してもよい。
【0117】
第一の実施形態および第二の実施形態では、透過画像重畳領域50K、55Kを複数のブロックに等分したが、サイズの異なる複数のブロックに分割してもよい。ただし、その場合は、画素の度数として、個数の代わりに、ブロック全体に対する割合を算出するのが、望ましい。
【0118】
第一の実施形態および第二の実施形態では、透過画像重畳領域50K、55Kからの文字の検出を主に画像処理回路10jによって行ったが、コンピュータプログラムをCPU10aに実行させることによって行うこともできる。この場合は、図3に示す透過画像重畳領域抽出部101ないし透過画像重畳領域補正部105の処理の手順をメインルーチンとするプログラムモジュールと図10に示す文字画素判別部104の各部または図14に示す文字画素判別部124の各部の処理の手順をサブルーチンとするプログラムモジュールとを有するコンピュータプログラムを、用意すればよい。そして、このコンピュータプログラムをROM10cまたは大容量記憶装置10dに記憶させておき、CPU10aに実行させればよい。
【0119】
文字画素判別部104および文字画素判別部124の両方を1つの画像処理回路10jに設け、ヒストグラム算出部103による処理の結果に応じて、いずれか一方を次のように使い分けるようにしてもよい。
【0120】
すなわち、各ブロック61または62のそれぞれから見つかった、所定の個数α2以上のヒストグラムからなるヒストグラム群同士の体積の差の大多数(例えば、18個以上)が、所定の値β4以上であれば、文字画素判別部104を使用する。一方、所定の値β4未満であれば、文字画素判別部124を使用する。
【0121】
その他、画像形成装置1全体または各部の構成、処理内容、処理順序、データの構成などは、本発明の趣旨に沿って適宜変更することができる。
【符号の説明】
【0122】
1 画像形成装置(文字検出装置)
103 ヒストグラム算出部(度数算出手段)
201〜224 比較演算部(階級グループ検出手段、差算出手段)
232 クロージング処理部(クロージング画像生成手段)
233 文字画素特定部(文字検出手段)
301〜324 比較演算部(階級グループ検出手段、差算出手段)
333 第一のクロージング処理部(クロージング画像生成手段)
336 第二のクロージング処理部(クロージング画像生成手段)
50K、55K 透過画像重畳領域(重畳領域)
52 クロージング処理画像(クロージング画像)
56B クロージング処理画像(クロージング画像)
57B クロージング処理画像(クロージング画像)


【特許請求の範囲】
【請求項1】
文字を表わす第一の画像と半透明のオブジェクトを表わす第二の画像と含む画像から前記文字を検出する文字検出装置であって、
前記第一の画像に前記第二の画像が重なっている領域である重畳領域を複数に分割したブロックごとに、色相および明度の階級ごとの画素の出現の度数を算出する、度数算出手段と、
前記各ブロックの前記階級ごとの前記度数に基づいて、前記重畳領域から前記文字を検出する、文字検出手段と、
を有することを特徴とする文字検出装置。
【請求項2】
前記複数のブロックそれぞれについて、前記度数として一定以上の値が表れる1つのまたは連続する複数の前記階級からなる階級グループを検出する、階級グループ検出手段と、
検出された前記階級グループのうちの色相が同一でありかつ明度の幅が同一である階級グループにおける、当該複数のブロックのうちの一方のブロックの前記度数の合計と他方のブロックの前記度数の合計との差を算出する、差算出手段と、
前記重畳領域の中の、検出された前記階級グループのうちの前記差が所定の値以上でありかつ所定の範囲未満の色相および明度に係る階級グループの色相および明度の画素を膨張させ収縮させることによって、クロージング画像を生成するクロージング画像生成手段と、を有し、
前記文字検出手段は、生成された前記クロージング画像に基づいて前記文字を検出する、
請求項1に記載の文字検出装置。
【請求項3】
前記複数のブロックそれぞれについて、前記度数として一定以上の値が表れる1つのまたは連続する複数の前記階級からなる階級グループを検出する、階級グループ検出手段と、
検出された前記階級グループのうちの色相が同一でありかつ明度の幅が同一である階級グループにおける、当該複数のブロックのうちの一方のブロックの前記度数の合計と他方のブロックの前記度数の合計との差を算出する、差算出手段と、
検出された前記階級グループのうちの前記差が所定の値以上である階級グループごとに、前記重畳領域の中の、当該階級グループの色相および明度の画素を膨張させ収縮させることによって、クロージング画像を生成する、クロージング画像生成手段と、を有し、
前記文字検出手段は、生成された前記各クロージング画像に基づいて前記文字を検出する、
請求項1に記載の文字検出装置。
【請求項4】
文字を表わす第一の画像と半透明のオブジェクトを表わす第二の画像と含む画像から前記文字を検出する文字検出方法であって、
前記第一の画像に前記第二の画像が重なっている領域である重畳領域を複数に分割したブロックごとに、色相および明度の階級ごとの画素の出現の度数を算出し、
前記各ブロックの前記階級ごとの前記度数に基づいて、前記重畳領域から前記文字を検出する、
ことを特徴とする文字検出方法。
【請求項5】
文字を表わす第一の画像と半透明のオブジェクトを表わす第二の画像と含む画像から前記文字を検出するコンピュータに用いられるコンピュータプログラムであって、
前記コンピュータに、
前記第一の画像に前記第二の画像が重なっている領域である重畳領域を複数に分割したブロックごとに、色相および明度の階級ごとの画素の出現の度数を算出する処理と、
前記各ブロックの前記階級ごとの前記度数に基づいて、前記重畳領域から前記文字を検出する処理と、
を実行させることを特徴とするコンピュータプログラム。


【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate


【公開番号】特開2012−145978(P2012−145978A)
【公開日】平成24年8月2日(2012.8.2)
【国際特許分類】
【出願番号】特願2011−1432(P2011−1432)
【出願日】平成23年1月6日(2011.1.6)
【出願人】(303000372)コニカミノルタビジネステクノロジーズ株式会社 (12,802)
【Fターム(参考)】