説明

文字検出装置、文字検出方法、およびコンピュータプログラム

【課題】透過画像が重ねられた字を従来よりも精度よく検出できるようにする。
【解決手段】文字を表わす第一の画像と半透明のオブジェクトを表わす第二の画像と含む画像から文字を検出する画像処理回路10jは、次の処理を行う。第一の画像に第二の画像が重なっている領域である重畳領域を複数に分割したブロックごとに、色相ごとの画素の出現の度数を算出する。そして、各ブロックの各色相の度数に基づいて、重畳領域から文字を検出する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、透過画像を含む画像に対して画像処理を行う装置および方法などに関する。
【背景技術】
【0002】
近年、コピー、PCプリント、スキャン、ファックス、およびファイルサーバなどの様々な機能を備えた画像形成装置が普及している。このような画像形成装置は、「複合機」または「MFP(Multi Function Peripherals)」などと呼ばれる。
【0003】
PCプリントは、パーソナルコンピュータから画像データを受信し画像を用紙に印刷する機能である。
【0004】
また、近年、パーソナルコンピュータで描画を行うためのアプリケーションが流通している。このようなアプリケーションは、「描画ソフト」と呼ばれている。描画ソフトの中には、透過画像をディスプレイに表示する機能が備わっているものがある。
【0005】
「透過画像」は、後ろに他のオブジェクトの画像があっても当該他のオブジェクトの画像が透けて表れる性質を有する。
【0006】
つまり、例えば、図4(A)に示すように、背後画像40bの左半分の上に透過画像40aを重ねる。すると、図4(B)に示すように、背後画像40bの、透過画像40aと重なる部分は、透けて見える。しかし、背後画像40bの右半分の上に透過画像でない非透過画像40cを重ねても、透けて見えない。透過画像の透過率が高いほど、それが重ねられた背後の画像は、よく透けて見える。
【0007】
画像形成装置は、パーソナルコンピュータに表示されている透過画像を用紙に印刷することができる。印刷されるまでに透過画像は、透過率の高さに応じて、図5(B)および図5(C)に示すように、画素の間引きの処理が施される。そして、間引かれた画素の位置に、透過画像の背後の画像が印刷される。これにより、背後の画像が透けて表れているように見える。
【0008】
また、画像の中の文字または数字などの字を検出する技術が、実用化されている。さらに、字を精度よく検出する方法が提案されている。例えば、次のような方法が提案されている。
【0009】
デジタル画像を複数のブロックに分割し、ブロックに含まれる複数の画素の画素値に関するコントラスト量を求め、ブロックに含まれる複数の画素の画素値のヒストグラムに関する画素値二峰性評価値を求め、複数の上記コントラスト量に基づくコントラスト閾値を求め、複数の上記画素値二峰性評価値に基づく二峰性閾値を求め、上記ブロックをテキストブロックまたは非テキストブロックとして分類する。上記分類においては、上記コントラスト量および上記画素値二峰性評価値が、上記コントラスト閾値および上記二峰性閾値に基づいた第1基準を満たしている上記ブロックを、テキストブロックとして分類し、上記第1基準を満たしていない上記ブロックを、非テキストブロックとして分類する(特許文献1)。
【先行技術文献】
【特許文献】
【0010】
【特許文献1】特開2010−81604号公報
【発明の概要】
【発明が解決しようとする課題】
【0011】
しかし、特許文献1に記載されるような従来の方法では、透過画像が重ねられた字を上手く検出することは、できない。透過画像を重ねられた部分の全面がテキストの領域であると、判定されるからである。
【0012】
本発明は、このような問題点に鑑み、透過画像が重ねられた字を従来よりも精度よく検出することを、目的とする。
【課題を解決するための手段】
【0013】
本発明の一形態に係ることを文字検出装置は、文字を表わす第一の画像と半透明のオブジェクトを表わす第二の画像と含む画像から前記文字を検出する文字検出装置であって、前記第一の画像に前記第二の画像が重なっている領域である重畳領域を複数に分割したブロックごとに、色相ごとの画素の出現の度数を算出する、色相分布算出手段と、前記各ブロックの前記各色相の前記度数に基づいて、前記重畳領域から前記文字を検出する、文字検出手段と、を有する。
【0014】
好ましくは、前記重畳領域の、濃度ごとの画素の出現の度数である濃度度数を算出する濃度分布算出手段と、鋭さが一定以上である第一の濃度度数および第二の濃度度数が前記濃度度数として算出された場合に、前記重畳領域の中の前記第一の濃度度数の濃度でも前記第二の濃度度数の濃度でもない画素を第一の色相の画素に置換する、置換処理手段と、前記度数のうちの、前記第一の色相における度数である第一の度数、第二の色相における度数である第二の度数、および第三の色相における度数である第三の度数がピークであり、かつ、前記各ブロックにおける前記第三の度数同士の差が、前記各ブロックにおける前記第一の度数同士の差および前記各ブロックにおける前記第二の度数同士の差よりも小さい場合に、置換後の前記重畳領域の画素のうちの前記第三の色相の画素を前記第一の色相の画素に変更することによって第一の置換画像を生成し、置換後の前記重畳領域の画素のうちの前記第三の色相の画素を前記第二の色相の画素に変更することによって第二の置換画像を生成する、置換画像生成手段と、前記第一の置換画像の前記第一の色相の画素をクロージングする第一のクロージング処理手段と、前記第二の置換画像の前記第二の色相の画素をクロージングする第二のクロージング処理手段と、を有し、前記文字検出手段は、前記重畳領域の画素のうちの、クロージング後の前記第一の置換画像の前記第一の色相の画素と同じ位置またはクロージング後の前記第二の置換画像の前記第二の色相の画素と同じ位置にある画素の集合を、前記文字として検出する。
【0015】
または、第一の色相における度数である第一の度数および第二の色相における度数である第二の度数がピークである場合に、前記重畳領域の画素のうちの前記第二の色相の画素を前記第一の色相の画素に変更することによって第一の置換画像を生成し、前記重畳領域の画素のうちの前記第一の色相の画素を前記第二の色相の画素に変更することによって第二の置換画像を生成する、置換画像生成手段と、前記第一の置換画像の前記第一の色相の画素をクロージングする第一のクロージング処理手段と、前記第二の置換画像の前記第二の色相の画素をクロージングする第二のクロージング処理手段と、を有し、前記文字検出手段は、前記重畳領域の画素のうちの、クロージング後の前記第一の置換画像の前記第一の色相の画素と同じ位置またはクロージング後の前記第二の置換画像の前記第二の色相の画素と同じ位置にある画素の集合を、前記文字として検出する。
【発明の効果】
【0016】
本発明によると、透過画像が重ねられた領域から字を従来よりも精度よく検出することができる。
【図面の簡単な説明】
【0017】
【図1】画像形成装置を含むネットワークシステムの例を示す図である。
【図2】画像形成装置のハードウェア構成の例を示す図である。
【図3】画像処理回路の構成の例を示す図である。
【図4】背後画像への透過画像および非透過画像の重ね合わせの例を説明するための図である。
【図5】透過画像の特性の例を説明するための図である。
【図6】背後画像への透過画像の重ね合わせの例を説明するための図である。
【図7】オリジナル画像、透過画像、および背後画像などの位置関係の例を示す図である。
【図8】透過画像重畳領域およびブロックの例を示す図である。
【図9】各色相の画素の個数の分布の例を示すヒストグラムである。
【図10】置換画像の例を示す図である。
【図11】ブロックの例を示す図である。
【図12】各色相の画素の個数の分布の例を示すヒストグラムである。
【図13】非使用画素置換部の構成の例を示す図である。
【図14】第一の画素置換部、第一のクロージング処理部、および第一の文字画素判別部の処理の例を説明するための図である。
【図15】第二の画素置換部、第二のクロージング処理部、および第二の文字画素判別部の処理の例を説明するための図である。
【図16】論理和演算部の処理を説明するための図である。
【図17】画像処理回路の構成の例を示す図である。
【図18】オリジナル画像、透過画像、および背後画像などの位置関係の例を示す図である。
【図19】透過画像重畳領域の例を示す図である。
【図20】各色相の画素の個数の分布の例を示すヒストグラムである。
【図21】文字画素存在推定部の構成の例を示す図である。
【図22】ブロックの例を示す図である。
【図23】各色相の画素の個数の分布の例を示すヒストグラムである。
【図24】二値画像の例を示す図である。
【図25】第一のクロージング処理部および第一の文字画素判別部の処理の例を説明するための図である。
【図26】第二のクロージング処理部および第二の文字画素判別部の処理の例を説明するための図である。
【図27】論理和演算部の処理の例を説明するための図である。
【発明を実施するための形態】
【0018】
〔第一の実施形態〕
図1は、画像形成装置1を含むネットワークシステムの例を示す図である。図2は、画像形成装置1のハードウェア構成の例を示す図である。
【0019】
図1に示す画像形成装置1は、一般に複合機またはMFP(Multi Function Peripherals)などと呼ばれる装置であって、コピー、ネットワークプリンティング(PCプリント)、ファックス、およびスキャナなどの機能を集約した装置である。
【0020】
画像形成装置1は、LAN(Local Area Network)、公衆回線、またはインターネットなどの通信回線4Tを介してパーソナルコンピュータ4Aなどの装置と画像データのやり取りを行うこととができる。
【0021】
画像形成装置1は、図2に示すように、CPU(Central Processing Unit)10a、RAM(Random Access Memory)10b、ROM(Read Only Memory)10c、大容量記憶装置10d、スキャナ10e、印刷装置10f、ネットワークインタフェース10g、タッチパネルディスプレイ10h、モデム10i、および画像処理回路10jなどによって構成される。
【0022】
スキャナ10eは、原稿の用紙に記されている写真、文字、絵、図表などの画像を読み取って画像データを生成する装置である。
【0023】
タッチパネルディスプレイ10hは、ユーザに対してメッセージまたは指示を与えるための画面、ユーザが処理の指令および条件を入力するための画面、およびCPU10aの処理の結果を示す画面などを表示する。また、ユーザが指で触れた位置を検知し、検知結果を示す信号をCPU10aに送信する。
【0024】
ネットワークインタフェース10gは、通信回線4Tを介してパーソナルコンピュータ4Aなどの他の装置と通信を行うためのNIC(Network Interface Card)である。
【0025】
モデム10iは、固定電話網を介して他のファックス端末との間でG3などのプロトコルで画像データをやり取りするための装置である。
【0026】
画像処理回路10jは、パーソナルコンピュータ4Aから送信されてきた画像データに基づいて、印刷の対象の画像に対して画像処理を施す。画像処理回路10jの各部は、ASIC(Application Specific Integrated Circuit)またはFPGA(Field Programmable Gate Array)などの回路によって実現される。画像処理回路10jの各部の処理については、後述する。
【0027】
印刷装置10fは、スキャナ10eによって読み取られた画像または画像処理回路10jによって画像処理が施された画像などを用紙に印刷する。
【0028】
ROM10cおよび大容量記憶装置10dには、OS(Operating System)のほかファームウェアおよびアプリケーションなどのプログラムが記憶されている。これらのプログラムは、必要に応じてRAM10bにロードされ、CPU10aによって実行される。大容量記憶装置10dとして、ハードディスクまたはフラッシュメモリなどが用いられる。
【0029】
次に、画像処理回路10jの構成および画像処理回路10jによる画像処理について、説明する。
【0030】
図3は、画像処理回路10jの構成の例を示す図である。図4は、背後画像40bへの透過画像40aおよび非透過画像40cの重ね合わせの例を説明するための図である。図5は、透過画像の特性の例を説明するための図である。図6は、背後画像41bへの透過画像41aの重ね合わせの例を説明するための図である。図7は、オリジナル画像50、透過画像50a、および背後画像50bなどの位置関係の例を示す図である。図8は、透過画像重畳領域50Kおよびブロック59の例を示す図である。図9は、各色相の画素の個数の分布の例を示すヒストグラムである。図10は、置換画像60の例を示す図である。図11は、ブロック61の例を示す図である。図12は、各色相の画素の個数の分布の例を示すヒストグラムである。図13は、文字画素判別部107の構成の例を示す図である。図14は、第一の画素置換部303、第一のクロージング処理部304、および第一の文字画素判別部305の処理の例を説明するための図である。図15は、第二の画素置換部306、第二のクロージング処理部307、および第二の文字画素判別部308の処理の例を説明するための図である。図16は、論理和演算部309の処理を説明するための図である。
【0031】
画像処理回路10jは、図3に示すように、透過画像重畳領域抽出部101、第一のブロック分割部102、第一のヒストグラム算出部103、非ピーク画素置換部104、第二のブロック分割部105、第二のヒストグラム算出部106、文字画素判別部107、および透過画像重畳領域補正部108などによって構成される。画像処理回路10jは、印刷の対象の画像に対して画像処理を施す。画像処理は、具体的には、印刷の対象の画像を表す画像データ70を編集する情報処理である。
【0032】
本実施形態では、画像データ70として、透過画像が他の画像に重なった様子を表す画像データが用いられる。
【0033】
一般に、「透過画像」は、後ろに他のオブジェクトの画像があっても当該他のオブジェクトの画像が透けて表れる性質を有する画像である。つまり、透過画像はガラスおよびセロハンなどのような半透明のオブジェクトを表わしていると、言える。
【0034】
例えば、図4(A)に示すように、背後画像40bの左半分の上に透過画像40aを重ね、背後画像40bの右半分の上に非透過画像40cを重ねる。すると、図4(B)に示すように、背後画像40bの、透過画像40aと重なる部分は、透けて見える。しかし、背後画像40bの、非透過画像40cと重なる部分は、全く表れない。
【0035】
透過画像の透過率が高いほど、その透過画像が上に重ねられた他の画像(つまり、背後画像)は、よく透けて見える。
【0036】
また、一般に、透過画像は、パーソナルコンピュータ4Aなどで表示されるときには図5(A)に示すようにすべての画素が一定の濃度を有していても、印刷時には、図5(B)または図5(C)に示すように一定の濃度を有する画素と有しない画素とによって構成されるように変換される。
【0037】
なお、図5(B)および図5(C)において、ハッチングした画素が、一定の濃度を有する画素である。一方、ハッチングしていない画素が、一定の濃度を有しない画素である。図6、図10、図11、図14、および図15においても、同様である。以下、一定の濃度を有する画素を「濃度有画素」と記載し、一定の濃度を有しない画素を「濃度無画素」と記載する。また、「濃度」は、透過画像がカラー画像である場合は各色(例えば、Red、Green、Blueそれぞれ)の階調であり、透過画像がモノクロ画像である場合はグレースケールである。
【0038】
濃度有画素は、決められた濃度で印刷される。一方、濃度無画素は、後ろに他の画像がなければ印刷されないが、他の画像があれば、当該他の画像の中の、この濃度無画素と同じ位置にある画素が印刷される。
【0039】
よって、例えば図6に示すように透過画像41aの一部分が背後画像41bの一部分の上に重なっている場合は、透過画像41aの濃度無画素の位置に背後画像41bの対応する画素を配置して印刷することによって、背後画像41bが透過画像41aに透けているかのように、両画像が印刷される。
【0040】
また、透過画像の透過率が高いほど、濃度有画素が出現する頻度が低い。したがって、図5(B)に示す透過画像のほうが図5(C)に示す透過画像よりも透過率が高い。
【0041】
図5(B)に示す濃度有画素の上下左右には、濃度無画素が存在する。一方、図5(C)に示す濃度無画素の上下左右には、濃度有画素が存在する。
【0042】
以下、他方のタイプの画素が上下左右に存在する画素を「孤立点」と記載する。したがって、図5(B)においては、濃度有画素が孤立点画素であり、図5(C)においては、濃度無画素が孤立点画素である。
【0043】
本実施形態では、画像データ70として、オリジナル画像50を表す画像データを取り扱う場合を例に、画像処理回路10jによる画像処理を説明する。
【0044】
オリジナル画像50は、図7(A)に示すように、背後画像50bの上に透過画像50aを重ねたものである。
【0045】
透過画像50aは、背後画像50bよりも小さい。よって、オリジナル画像50には、図7(B)に示すように、背後画像50bと透過画像50aとが重なっている領域と背後画像50bのみの領域とがある。以下、前者を「透過画像重畳領域50K」と記載し、後者を「透過画像非重畳領域50L」と記載する。
【0046】
背後画像50bの、透過画像50aが重なった部分には、「A」という文字が記されている。この文字の色は、特定の1つの色(例えば、青色)である。また、この文字の背景の色は、別の特定の1つの色(例えば、緑色)であるが、左から右へ行くに連れて徐々に薄くなっている。つまり、グラデーションによって表現されている。
【0047】
ユーザは、オリジナル画像50を、パーソナルコンピュータ4Aにインストールされている描画ソフトなどのアプリケーションを用いて作成する。これにより、オリジナル画像50を再現するためのデータが画像データ70として生成される。
【0048】
パーソナルコンピュータ4Aは、印刷の指令とともに画像データ70を画像形成装置1へ送信する。
【0049】
画像形成装置1において、印刷の指令および画像データ70が受信されると、画像処理回路10jの各部は、次のような処理を実行する。
【0050】
透過画像重畳領域抽出部101は、オリジナル画像50の中から透過画像重畳領域50Kを判別し、抽出する。
【0051】
具体的には、透過画像重畳領域抽出部101は、透過画像の上述の特性に基づいて、透過画像重畳領域50Kを、例えば次のように判別し検出する。
【0052】
透過画像重畳領域抽出部101は、オリジナル画像50の中から孤立点を次のように検出する。ある1つの画素に注目する。以下、この画素を「注目画素」と記載する。注目画素の濃度(階調)と、注目画素の上下左右に隣接する他の画素(以下、「隣接画素」と記載する。)それぞれの濃度とを比較する。
【0053】
注目画素の濃度と当該他の画素それぞれの濃度との差がすべて所定の値β以上であるという要件を満たす場合は、透過画像重畳領域抽出部101は、注目画素を孤立点として検出する。
【0054】
なお、オリジナル画像50がカラー画像である場合は、透過画像重畳領域抽出部101は、この比較を各色それぞれについて独立して行う。そして、いずれか1つでも要件を満たす場合は、注目画素を孤立点として検出する。以下、オリジナル画像50がカラー画像である場合における要件の具備の判断において、同様である。
【0055】
図5(B)および図5(C)に示したように、透過画像の孤立点の出現には、一定の周期性(規則性)がある。そこで、透過画像重畳領域抽出部101は、検出した孤立点のうちの、出現の仕方に周期性がある複数の孤立点を抽出する。
【0056】
そして、透過画像重畳領域抽出部101は、抽出した複数の孤立点の分布を表す画像(以下、「分布画像」と記載する。)に対してクロージングの処理を行う。つまり、各孤立点の位置にあるドットを拡張(膨張)させ縮小(収縮)させる処理を行う。クロージングの処理がなされた分布画像の位置および形状が、透過画像重畳領域50Kの位置および形状にほぼ対応する。
【0057】
透過画像重畳領域抽出部101は、このようにして透過画像重畳領域50Kの位置および形状を特定し、オリジナル画像50から透過画像重畳領域50Kを抽出する。
【0058】
なお、透過画像の透過率が50%前後である場合は、濃度有画素が孤立点として検出されるとともに、濃度無画素の位置に表れている背後画像の画素も孤立点として検出される。つまり、領域の中のほとんどの画素が孤立点として検出される。各濃度有画素の濃度は一定であるが、各濃度無画素の位置に表れている背後画像の画素は、一定でない。そこで、領域の中のほとんどの画素が孤立点として検出された場合は、透過画像重畳領域抽出部101は、一定の濃度を有する孤立点だけを選出し、選出した孤立点の分布を表す画像を分布画像としてクロージングを行えばよい。
【0059】
第一のブロック分割部102は、透過画像重畳領域抽出部101によって抽出された透過画像重畳領域50Kを所定の個数のブロック59に分割する。本実施形態では、図8(A)に示す透過画像重畳領域50Kを、図8(B)に示すように、2×2個のブロック59A〜59Dに分割する。ブロック59A〜59Dのサイズはすべて等しいものとする。
【0060】
なお、図8(A)および図8(B)において、ハッチングした画素は、透過画像50aの濃度有画素である。黒色の画素およびグレー色の画素は、ともに、透過画像50aの濃度無画素の位置に表れた、背後画像50bの画素であるが、黒色の画素は「A」の文字の画素であり、グレー色の画素は文字の背景の画素である。
【0061】
第一のヒストグラム算出部103は、ブロック59A〜59Dそれぞれの、各濃度の画素の個数を度数とする度数分布を算出する。算出された各度数分布は、図9に示すようなヒストグラムとして表すことができる。
【0062】
各ブロック59のヒストグラムには、度数が一定以上でありかつ鋭さが一定以上である2つのピークが表れている。1つのピークは、透過画像50aの濃度有画素と濃度が同じである画素の個数の分布に対応している。もう1つのピークは、背後画像50bの文字と濃度が同じである画素の個数の分布に対応している。
【0063】
非ピーク画素置換部104は、ブロック59Aの画素のうち、濃度がブロック59Aのヒストグラムの上述の2つのピークの濃度のどちらでもない画素を、白色の画素に置換する。さらに、非ピーク画素置換部104は、ブロック59B〜59Dについても同様に、2つのピークの濃度のどちらでもない画素を、白色の画素に置換する。なお、透過画像重畳領域50Kに用いられていない色であれば、白色以外の色の画素に置換してもよい。
【0064】
非ピーク画素置換部104による処理によって、透過画像重畳領域50Kから図10に示すような置換画像60が得られる。
【0065】
第二のブロック分割部105は、非ピーク画素置換部104によって得られた置換画像60を所定の個数のブロック61に分割する。本実施形態では、図10に示す置換画像60を、図11に示すように、4×4個のブロック61A〜61Pに分割する。ブロック61A〜61Pのサイズはすべて等しいものとする。
【0066】
第二のヒストグラム算出部106は、ブロック61A〜61Pそれぞれの、各色相の画素の個数を度数とする度数分布を算出する。算出された各度数分布は、図12に示すように、ヒストグラムとして表すことができる。
【0067】
図12(A)、図12(B)、および図12(C)に示すヒストグラムは、それぞれ、ブロック61A、ブロック61B、およびブロック61Cの度数分布を表すヒストグラムである。
【0068】
これらのヒストグラムには、2つまたは3つのピークが表れている。各ピークは、透過画像50aの濃度有画素と色相が同じである画素の個数の分布、背後画像50bの文字と色相が同じである画素の個数の分布、および非ピーク画素置換部104によって置換が行われた画素(本実施形態では、白色の画素)の個数の分布のうちのいずれか1つに対応している。
【0069】
文字画素判別部107は、図13に示すように、24個の比較演算部、画素種別色相判別部302、第一の画素置換部303、第一のクロージング処理部304、第一の文字画素判別部305、第二の画素置換部306、第二のクロージング処理部307、第二の文字画素判別部308、および論理和演算部309などによって構成される。このような構成により、文字画素判別部107は、第二のヒストグラム算出部106によって算出された各ブロック61の度数分布に基づいて、透過画像重畳領域50Kの中から文字の画素を次のように判別する。以下、24個の比較演算部の1つ1つを「第一の比較演算部201」、「第二の比較演算部202」、…、「第二十四の比較演算部224」と区別して記載することがある。
【0070】
置換画像60には、上下または前後に隣り合う2つのブロック61の組合せが、24通りある。文字画素判別部107には、これらの組合せごとに、比較演算部が設けられている。そして、比較演算部は、第二のヒストグラム算出部106によって算出された、ブロック61それぞれの度数分布を比較する。
【0071】
例えば、第一の比較演算部201は、ブロック61Aの度数分布とブロック61Bの度数分布とを比較する。第二の比較演算部202は、ブロック61Bの度数分布とブロック61Cの度数分布とを比較する。第三の比較演算部203は、ブロック61Cの度数分布とブロック61Dの度数分布とを比較する。
【0072】
比較演算部は、ブロック61それぞれの度数分布を次のように比較する。図12で説明した通り、ブロック61の度数分布には、2つまたは3つのピークがある。比較演算部は、2つのブロック61の、色相が同じであるピーク同士を比較する。
【0073】
例えば、第一の比較演算部201は、ブロック61Aの第一の色相Hu1の度数とブロック61Bの第一の色相Hu1の度数とを比較する。ブロック61Aの第二の色相Hu2の度数とブロック61Bの第二の色相Hu2の度数とを比較する。さらに、ブロック61Aの第三の色相Hu3の度数とブロック61Bの第三の色相Hu3の度数とを比較する。
【0074】
同様に、第二の比較演算部202は、ブロック61Bの第一の色相Hu1の度数とブロック61Cの第一の色相Hu1の度数とを比較する。ブロック61Bの第二の色相Hu2の度数とブロック61Cの第二の色相Hu2の度数とを比較する。さらに、ブロック61Bの第三の色相Hu3の度数とブロック61Cの第三の色相Hu3の度数とを比較する。
【0075】
そして、比較演算部は、画素種別色相判別部302へ、2つの度数の差が所定の値α未満である色相を一定色相として通知するとともに、2つの度数の差が所定の値α以上である色相を不定色相として通知する。
【0076】
例えば、ブロック61Aの度数分布は、図12(A)のヒストグラムの通りであり、ブロック61Bの度数分布は、図12(B)のヒストグラムの通りである。両者を比較すると、両ブロック61の色相Hu3の画素の度数は等しいが、色相Hu1の画素の度数は相違し、色相Hu2の画素の度数も相違する。
【0077】
よって、第一の比較演算部201は、色相Hu3を一定色相として画素種別色相判別部302へ通知する。さらに、色相Hu1および色相Hu2を、所定の値αに応じて、一定色相または不定色相として画素種別色相判別部302へ通知する。例えば、所定の値αが「1」であれば、2つの度数が少しでも違えば差が「1」以上になるので、不定色相に決まる。したがって、色相Hu1および色相Hu2を不定色相として通知する。
【0078】
画素種別色相判別部302には、24個の比較演算部から、合計、約24個の一定色相と約48個の不定色相とが通知される。
【0079】
画素種別色相判別部302は、通知された約24個の一定色相を、値ごとに分類する。本例では、第一の色相Hu1、第二の色相Hu2、および第三の色相Hu3のいずれかに分類することができる。そして、最も多く分類された一定色相を、透過画像50aの濃度有画素の色相であると、判別する。その結果、本例では、第三の色相Hu3に分類される一定色相が最も多く、第三の色相Hu3が透過画像50aの濃度有画素の色相であると判別されるはずである。透過画像50aの濃度有画素の色相の分布は、すべてのブロック61において、ほぼ一定だからである。以下、透過画像50aの濃度有画素の色相であると判別された色相(一定色相)を「濃度有画素色相Hn」と記載する。
【0080】
さらに、画素種別色相判別部302は、通知された約48個の不定色相も同様に、値ごとに分類する。本例では、第一の色相Hu1、第二の色相Hu2、および第三の色相Hu3のいずれかに分類されるはずである。そして、分類された不定色相のうちの、透過画像50aの濃度有画素の色相でないものを、背後画像50bの文字の画素の色相または非ピーク画素置換部104によって置換が行われた画素の色相であると、判別する。本例では、先に第三の色相Hu3を透過画像50aの濃度有画素の色相であると判別しているので、第一の色相Hu1および第二の色相Hu2がこららの色相のうちのどちらかであると、判別する。以下、判別された2つの色相(不定色相)をそれぞれ「第一の背後画像色相Hg1」、「第二の背後画像色相Hg2」と記載する。また、以下、第一の色相Hu1が第一の背後画像色相Hg1であり、第二の色相Hu2が第二の背後画像色相Hg2である場合を例に、説明する。
【0081】
そして、画素種別色相判別部302は、第一の画素置換部303および第二の画素置換部306へ、濃度有画素色相Hn、第一の背後画像色相Hg1、および第二の背後画像色相Hg2を通知する。
【0082】
第一の画素置換部303、第一のクロージング処理部304、および第一の文字画素判別部305は、画像データ70、濃度有画素色相Hn、第一の背後画像色相Hg1、および第二の背後画像色相Hg2に基づいて処理を行う。ここで、この処理の手順を、図14を参照しながら説明する。
【0083】
第一の画素置換部303は、置換画像60の中から色相が濃度有画素色相Hnである画素を検索する。これにより、図14(A)においてハッチングで示す画素が見つかる。そして、第一の画素置換部303は、濃度有画素色相Hnである画素を、図14(B)に示すように、色相が第一の背後画像色相Hg1である画素(白色で示す画素)に置換する。以下、第一の画素置換部303によって置換の処理がなされた置換画像60の画像を「置換処理画像62A」と記載する。
【0084】
第一のクロージング処理部304は、第二の背後画像色相Hg2の画素(黒色で示す画素)を膨張させ収縮させることによって、置換処理画像62Aに対してクロージングの処理を行う。これにより、図14(C)に示すような結果が得られる。以下、第一のクロージング処理部304によってクロージングの処理がなされた置換処理画像62Aを「クロージング処理画像62B」と記載する。
【0085】
クロージング処理画像62Bを構成する画素の色相は、第一の背後画像色相Hg1および第二の背後画像色相Hg2のうちのいずれかである。
【0086】
第一の文字画素判別部305は、第一の背後画像色相Hg1の画素および第二の背後画像色相Hg2の画素のうちの個数が多い方を画素を、文字の画素であると、判別する。そして、それらの画素が「1」になり、それ以外の画素が「0」になるように、クロージング処理画像62Bを二値化する。これにより、図14(D)に示すような結果が得られる。なお、図14(D)において、黒点を付した画素の値が「1」であり、付していない画素の値が「0」である。後に示す図15(D)および図16においても、同様である。以下、第一の文字画素判別部305によって二値化されたクロージング処理画像62Bを「第一の二値画像62C」と記載する。
【0087】
第二の画素置換部306、第二のクロージング処理部307、および第二の文字画素判別部308も、第一の画素置換部303、第一のクロージング処理部304、および第一の文字画素判別部305と同様に、画像データ70、濃度有画素色相Hn、第一の背後画像色相Hg1、および第二の背後画像色相Hg2に基づいて処理を行う。ただし、第一の背後画像色相Hg1および第二の背後画像色相Hg2の使い方が、異なる。
【0088】
以下、第二の画素置換部306、第二のクロージング処理部307、および第二の文字画素判別部308の処理を、図15を参照しながら説明する。
【0089】
第二の画素置換部306は、置換画像60の中から色相が濃度有画素色相Hnである画素を検索し、図15(B)に示すように、それらの画素を、色相が第二の背後画像色相Hg2である画素(黒色で示す画素)に置換する。以下、第二の画素置換部306によって置換の処理がなされた置換画像60を「置換処理画像63A」と記載する。
【0090】
第二のクロージング処理部307は、第一の背後画像色相Hg1の画素(白色で示す画素)を膨張させ収縮させることによって、置換処理画像63Aに対してクロージングの処理を行う。これにより、図15(C)に示すような結果が得られる。以下、第二のクロージング処理部307によってクロージングの処理がなされた置換処理画像63Aを「クロージング処理画像63B」と記載する。
【0091】
クロージング処理画像63Bを構成する画素の色相も、クロージング処理画像62Bを構成する画素の色相と同様に、第一の背後画像色相Hg1および第二の背後画像色相Hg2のうちのいずれかである。
【0092】
第二の文字画素判別部308は、第一の背後画像色相Hg1の画素および第二の背後画像色相Hg2の画素のうちの個数が多い方を画素を、文字の画素であると、判別する。そして、それらの画素が「1」になり、それ以外の画素が「0」になるように、クロージング処理画像63Bを二値化する。これにより、図15(D)に示すような結果が得られる。以下、第二の文字画素判別部308によって二値化されたクロージング処理画像63Bを「第二の二値画像63C」と記載する。
【0093】
論理和演算部309は、図16に示すように、同じ位置にある、第一の二値画像62Cの画素の値および第二の二値画像63Cの画素の値同士の論理和を算出する。二値画像64は、各位置の論理和を表している。
【0094】
二値画像64の中の値が「1」である画素が、透過画像重畳領域50Kの中の文字の画素に対応する。
【0095】
以上のようにして、文字画素判別部107の各部による処理によって、透過画像重畳領域50Kの中の文字の画素が判別される。
【0096】
図3に戻って、透過画像重畳領域補正部108は、文字画素判別部107による判別結果などに基づいて、オリジナル画像50の中の透過画像重畳領域50Kの補正を行う。例えば、文字の画素であると判別された画素群に対して、エッジ強調処理を行い、残りの部分に対して、ぼかしの処理を行う。以下、透過画像重畳領域補正部108によって処理がなされたオリジナル画像50を「補正画像55」と記載する。
【0097】
その後、印刷装置10fは、補正画像55を用紙に印刷する。または、ネットワークインタフェース10gは、補正画像55の画像データをパーソナルコンピュータ4Aなどに送信する。
【0098】
第一の実施形態によると、透過画像が重ねられたグラデーションの領域から文字を従来よりも精度よく検出することができる。
【0099】
〔第二の実施形態〕
図17は、画像処理回路10kの構成の例を示す図である。図18は、オリジナル画像52、透過画像52a、および背後画像52bなどの位置関係の例を示す図である。図19は、透過画像重畳領域52Kの例を示す図である。図20は、各色相の画素の個数の分布の例を示すヒストグラムである。図21は、文字画素存在推定部122の構成の例を示す図である。図22は、ブロック65の例を示す図である。図23は、各色相の画素の個数の分布の例を示すヒストグラムである。図24は、二値画像66の例を示す図である。図25は、第一のクロージング処理部124および第一の文字画素判別部125の処理の例を説明するための図である。図26は、第二のクロージング処理部126および第二の文字画素判別部127の処理の例を説明するための図である。図27は、論理和演算部128の処理の例を説明するための図である。
【0100】
第一の実施形態では、図7などに示した透過画像50aの濃度有画素の色相と背後画像50bの文字の色相とが相違していた。
【0101】
第二の実施形態では、画像形成装置1は、透過画像50aの濃度有画素の色相と背後画像50bの文字の色相とが同一である場合であっても文字を検出できるように処理を行う。
【0102】
画像形成装置1のハードウェア構成は、第一の実施形態の場合と基本的に同じであり、図3に示した通りである。ただし、第二の実施形態では、画像形成装置1には、画像処理回路10jの代わりに画像処理回路10kが備わっている。
【0103】
画像処理回路10kは、図17に示すように、透過画像重畳領域抽出部120、全体ヒストグラム算出部121、文字画素存在推定部122、二値画像生成部123、第一のクロージング処理部124、第一の文字画素判別部125、第二のクロージング処理部126、第二の文字画素判別部127、論理和演算部128、および透過画像重畳領域補正部129などによって構成される。
【0104】
以下、図18および図19に示すように透過画像52aが背後画像52bの「A」の文字に重なったオリジナル画像52を処理する場合を例に、全体ヒストグラム算出部121ないし透過画像重畳領域補正部129の処理内容を、順次説明する。なお、第一の実施形態と共通する処理については、説明を省略する。また、背後画像52bと透過画像52aとが重なっている領域を「透過画像重畳領域52K」と記載し、背後画像52bのみの領域を「透過画像非重畳領域52L」と記載する。
【0105】
図19において、ハッチングしている画素は、透過画像52aの濃度有画素である。背後画像52bの、透過画像52aが重なった部分には、「A」という文字が記されている。黒色の画素が、文字を構成する画素である。三角のマークを付している画素は、背後画像52bの文字の背景の画素である。
【0106】
この文字の色は、特定の1つの色(例えば、緑色)である。この文字の背景の色は、別の特定の1つの色(例えば、赤色)である。なお、第一の実施形態では、背後画像50bの背景はグラデーションによって表現されていたが、第二の実施形態では、背後画像52bの背景の濃淡は一定である。
【0107】
透過画像52aの濃度有画素は、左から右へ行くに連れて徐々に色が薄くなっている。つまり、第二の実施形態では、透過画像52aはグラデーションによって表現されており、濃度有画素は色相が一定であり、濃度が一定の範囲である。また、透過画像52aの色相と背後画像52bの文字の色相とは、同一である。なお、図19および図22においては、見やすさのためにグラデーションを省略している。
【0108】
透過画像重畳領域抽出部120は、オリジナル画像52を再現するための画像データ72が受信されると、第一の実施形態の透過画像重畳領域抽出部101(図3参照)と同様に、オリジナル画像52の中から透過画像重畳領域52Kを判別し、抽出する。
【0109】
全体ヒストグラム算出部121は、透過画像重畳領域52K全体の各色相の度数分布を算出する。その結果、図20に示すような、ピークが2つのヒストグラムが得られる。
【0110】
ピークが3つのヒストグラムが得られた場合は、文字画像検出部130は、第一の実施形態で説明した通りの処理、特に第一のブロック分割部102ないし透過画像重畳領域補正部108(図3参照)と同様の処理を行うことによって、透過画像重畳領域52Kから文字を検出する。
【0111】
一方、ピークが2つのヒストグラムが得られた場合は、文字画素存在推定部122ないし透過画像重畳領域補正部129によって次のような処理が行われる。
【0112】
文字画素存在推定部122は、図21に示すように、ブロック分割部131、ブロックヒストグラム算出部132、度数変化比較部133、および文字画素有無判別部134などによって構成される。文字画素存在推定部122の各部によって、透過画像重畳領域52Kに文字の画素が存在するか否かが推定される。
【0113】
ブロック分割部131は、透過画像重畳領域抽出部120によって抽出された透過画像重畳領域52Kを所定の個数のブロック65に分割する。本実施形態では、図22に示すように、4×4個のブロック65A〜65Pに分割する。ブロック65A〜65Pのサイズはすべて等しいものとする。
【0114】
ブロックヒストグラム算出部132は、ブロック65A〜65Pそれぞれの、各色相の画素の個数を度数とする度数分布を算出する。算出された各度数分布は、図23に示すように、ヒストグラムとして表すことができる。図23(A)はブロック65Aのヒストグラムの例であり、図23(B)はブロック65Bのヒストグラムの例である。
【0115】
これらのヒストグラムには、2つのピークが現れている。一方のピークが、透過画像52aの濃度有画素および背後画像52bの文字と色相が同じである画素の個数の分布のピークである。もう一方のピークが、背後画像52bの背景の画素の個数の分布のピークである。以下、一方のピークの色相を「第一の色相He1」と記載し、もう一方のピークの色相を「第二の色相He2」と記載する。
【0116】
ところで、第一の実施形態の置換画像60と同様、透過画像重畳領域52Kには、上下または前後に隣り合う2つのブロック65の組合せが、24通りある。
【0117】
度数変化比較部133には、これらの組合せごとに、比較演算部が設けられている。そして、比較演算部は、ブロックヒストグラム算出部132によって算出された、ブロック65それぞれの度数分布同士を比較する。以下、24個の比較演算部の1つ1つを「第一の比較演算部401」、「第二の比較演算部402」、…、「第二十四の比較演算部424」と区別して記載することがある。
【0118】
例えば、第一の比較演算部401は、ブロック65Aの度数分布とブロック65Bの度数分布とを比較する。第二の比較演算部402は、ブロック65Bの度数分布とブロック65Cの度数分布とを比較する。第三の比較演算部403は、ブロック65Cの度数分布とブロック65Dの度数分布とを比較する。
【0119】
各比較演算部は、それぞれの組合せに係る2つのブロック65の、色相が同じであるピークの度数同士を比較し、その差を算出する。これにより、隣り合う2つのブロック65の第一の色相He1同士の差が24個算出され、同様に、第二の色相He2同士の差が24個算出される。
【0120】
なお、左右に隣り合う2つのブロック65の度数の差は、左のブロックの度数から右のブロックの度数を減算することによって算出するものとする。また、上下に隣り合う2つのブロック65の度数の差は、上のブロックの度数から下のブロックの度数を減算することによって算出するものとする。したがって、差は、プラスになることもあれば、マイナスになることもある。ゼロになることも、ある。
【0121】
以下、第一の比較演算部401、第二の比較演算部402、…、第二十四の比較演算部424それぞれが算出した第一の色相He1同士の差を「第一の度数差Da1」、「第二の度数差Da2」、…、「第二十四の度数差Da24」と記載する。同様に、それぞれが算出した第二の色相He2同士の差を「第一の度数差Db1」、「第二の度数差Db2」、…、「第二十四の度数差Db24」と記載する。
【0122】
文字画素有無判別部134は、24個の比較演算部それぞれによって算出された度数差に基づいて、透過画像重畳領域52Kの各ブロック65に文字の画素が存在するか否かを次のように判別する。
【0123】
文字画素有無判別部134は、24組の第一の度数差Daiおよび第二の度数差Dbiが次の(1)〜(3)式を満たすか否かを判別する。
Dai=−Dbi …… (1)
Dai>0 …… (2)
Dbi>0 …… (3)
ただし、i=1,2,…,24、である。
【0124】
そして、文字画素有無判別部134は、(1)〜(3)式をすべて満たす組に係る2つのブロック65には文字の画素が存在すると、判別する。
【0125】
例えば、Da1=−Db1、である場合は、文字画素有無判別部134は、2つのブロック65A、65Bには文字の画素が存在すると、判別する。
【0126】
文字画素有無判別部134による処理によると、図22に示すブロック65は、すべて、文字の画素が存在すると判別される。
【0127】
図17に戻って、二値画像生成部123は、透過画像重畳領域52Kのうちの文字の画素が存在すると文字画素存在推定部122によって判別されたブロック65を、第一の色相He1の画素と第二の色相He2の画素とが区別される二値画像66に変換する。上述の通り、図22の透過画像重畳領域52Kのブロック65はすべて、文字の画素が存在すると判別される。したがって、透過画像重畳領域52Kを処理する場合は、二値画像生成部123は、透過画像重畳領域52Kの全体に対して、例えば、第一の色相He1の画素を白色の画素に置換し第二の色相He2の画素を黒色の画素に置換する処理を行うことによって、図24に示すような二値画像66に変換する。
【0128】
第一のクロージング処理部124は、黒色で示す画素(透過画像重畳領域52Kの中の第二の色相He2の画素に対応する画素)を膨張させ収縮させることによって、二値画像66(図25(A)参照)に対してクロージングの処理を行う。これにより、図25(B)に示すような結果が得られる。以下、第一のクロージング処理部124によってクロージングの処理がなされた二値画像66を「クロージング処理画像67A」と記載する。
【0129】
第一の文字画素判別部125は、白色の画素および黒色の画素のうちの個数が少ない方を画素を、文字の画素であると、判別する。そして、それらの画素が「1」になり、それ以外の画素が「0」になるように、クロージング処理画像67Aを書き換える。これにより、図25(C)に示すような結果が得られる。
【0130】
なお、図25(C)において、黒点を付した画素の値が「1」であり、付していない画素の値が「0」である。後に示す図26(C)および図27においても、同様である。以下、第一の文字画素判別部125によって得られた画像を「第一の文字領域画像67B」と記載する。
【0131】
第二のクロージング処理部126および第二の文字画素判別部127も、第一のクロージング処理部124および第一の文字画素判別部125と同様の処理を行う。ただし、第一の色相He1および第二の色相He2の使い方が、異なる。
【0132】
第二のクロージング処理部126は、白色で示す画素(透過画像重畳領域52Kの中の第一の色相He1の画素に対応する画素)を膨張させ収縮させることによって、二値画像66(図26(A)参照)に対してクロージングの処理を行う。これにより、図26(B)に示すようなクロージング処理画像68Aが得られる。
【0133】
第二の文字画素判別部127は、第一の文字画素判別部125と同様、白色の画素および黒色の画素のうちの個数が少ない方を画素を、文字の画素であると、判別する。そして、それらの画素が「1」になり、それ以外の画素が「0」になるように、クロージング処理画像68Aを書き換える。これにより、図26(C)に示すような第二の文字領域画像68Bが得られる。
【0134】
論理和演算部128は、図27に示すように、同じ位置にある、第一の文字領域画像67Bの画素の値および第二の文字領域画像68Bの画素の値同士の論理和を算出する。二値画像69は、各位置の論理和を表している。
【0135】
二値画像69の中の値が「1」である画素が、透過画像重畳領域50Kの中の文字の画素に対応する。
【0136】
以上の処理によって、透過画像重畳領域52Kの中の文字の画素を判別することができる。
【0137】
透過画像重畳領域補正部129は、オリジナル画像52の中の透過画像重畳領域52Kの補正を行う。例えば、文字の画素であると判別された画素群に対して、エッジ強調処理を行い、残りの部分に対して、ぼかしの処理を行う。以下、透過画像重畳領域補正部129によって処理がなされたオリジナル画像52を「補正画像57」と記載する。
【0138】
その後、印刷装置10fは、補正画像57を用紙に印刷する。または、ネットワークインタフェース10gは、補正画像57の画像データをパーソナルコンピュータ4Aなどに送信する。
【0139】
第二の実施形態によると、グラデーションの透過画像が重ねられた領域から文字を従来よりも精度よく検出することができる。
【0140】
第一の実施形態では、透過画像重畳領域50Kを、濃度有画素である孤立点の位置の規則性に基づいて検出したが、画像データ70に透過画像50aの位置を示すデータが予め含まれている場合は、このデータに基づいて検出すればよい。第二の実施形態の透過画像重畳領域52Kも同様に、画像データ72に透過画像52aの位置を示すデータが予め含まれている場合は、このデータに基づいて検出すればよい。
【0141】
第一の実施形態および第二の実施形態では、各領域を4つまたは16個のブロックに分割したが、もっと少ない個数のブロックに分割してもよいし、多い個数のブロックに分割してもよい。
【0142】
第一の実施形態および第二の実施形態では、上下左右に隣り合うブロックの度数分布同士を比較したが、他の組合せであってもよい。例えば、さらに、斜めの方向に並ぶブロックの度数分布同士を比較してもよい。または、上下に隣り合うブロックの度数分布同士のみを比較してもよいし、左右に隣り合うブロックの度数分布同士のみを比較してもよい。
【0143】
第一の実施形態および第二の実施形態では、各領域を複数のブロックに等分したが、サイズの異なる複数のブロックに分割してもよい。ただし、その場合は、各色相の画素の度数として、個数の代わりに、ブロック全体に対してその色相の画素の占める割合を算出するのが、望ましい。
【0144】
第一の実施形態では、透過画像重畳領域50Kからの文字の検出を主に画像処理回路10jによって行ったが、コンピュータプログラムをCPU10aに実行させることによって行うこともできる。この場合は、図3に示す透過画像重畳領域抽出部101ないし透過画像重畳領域補正部108の処理の手順をメインルーチンとするプログラムモジュールと図13に示す文字画素判別部107の各部の処理の手順をサブルーチンとするプログラムモジュールとを有するコンピュータプログラムを、用意すればよい。そして、このコンピュータプログラムをROM10cまたは大容量記憶装置10dに記憶させておき、CPU10aに実行させればよい。
【0145】
同様に、第二の実施形態では、透過画像重畳領域52Kからの文字の検出を主に画像処理回路10kによって行ったが、コンピュータプログラムをCPU10aに実行させることによって行うこともできる。つまり、図17に示した全体ヒストグラム算出部121ないし透過画像重畳領域補正部129の処理の手順をメインルーチンとするプログラムモジュールと図21に示す文字画素存在推定部122の各部の処理の手順をサブルーチンとするプログラムモジュールとを有するコンピュータプログラムを用意し、CPU10aに実行させればよい。
【0146】
その他、画像形成装置1全体または各部の構成、処理内容、処理順序、データの構成などは、本発明の趣旨に沿って適宜変更することができる。
【符号の説明】
【0147】
1 画像形成装置
10j 画像処理回路
10k 画像処理回路
103 第一のヒストグラム算出部(濃度分布算出手段)
104 非ピーク画素置換部(置換処理手段)
106 第二のヒストグラム算出部(色相分布算出手段)
107 文字画素判別部(文字検出手段)
123 二値画像生成部(置換画像生成手段)
124 第一のクロージング処理部(第一のクロージング処理手段)
126 第二のクロージング処理部(第二のクロージング処理手段)
303 第一の画素置換部(置換画像生成手段)
304 第一のクロージング処理部(第一のクロージング処理手段)
306 第二の画素置換部(置換画像生成手段)
307 第二のクロージング処理部(第二のクロージング処理手段)
50a 透過画像(第二の画像)
50b 背後画像(第一の画像)
50K 透過画像重畳領域(重畳領域)
52a 透過画像(第二の画像)
52b 背後画像(第一の画像)
52K 透過画像重畳領域(重畳領域)
61 ブロック

【特許請求の範囲】
【請求項1】
文字を表わす第一の画像と半透明のオブジェクトを表わす第二の画像と含む画像から前記文字を検出する文字検出装置であって、
前記第一の画像に前記第二の画像が重なっている領域である重畳領域を複数に分割したブロックごとに、色相ごとの画素の出現の度数を算出する、色相分布算出手段と、
前記各ブロックの前記各色相の前記度数に基づいて、前記重畳領域から前記文字を検出する、文字検出手段と、
を有することを特徴とする文字検出装置。
【請求項2】
前記重畳領域の、濃度ごとの画素の出現の度数である濃度度数を算出する濃度分布算出手段と、
鋭さが一定以上である第一の濃度度数および第二の濃度度数が前記濃度度数として算出された場合に、前記重畳領域の中の前記第一の濃度度数の濃度でも前記第二の濃度度数の濃度でもない画素を第一の色相の画素に置換する、置換処理手段と、
前記度数のうちの、前記第一の色相における度数である第一の度数、第二の色相における度数である第二の度数、および第三の色相における度数である第三の度数がピークであり、かつ、前記各ブロックにおける前記第三の度数同士の差が、前記各ブロックにおける前記第一の度数同士の差および前記各ブロックにおける前記第二の度数同士の差よりも小さい場合に、置換後の前記重畳領域の画素のうちの前記第三の色相の画素を前記第一の色相の画素に変更することによって第一の置換画像を生成し、置換後の前記重畳領域の画素のうちの前記第三の色相の画素を前記第二の色相の画素に変更することによって第二の置換画像を生成する、置換画像生成手段と、
前記第一の置換画像の前記第一の色相の画素をクロージングする第一のクロージング処理手段と、
前記第二の置換画像の前記第二の色相の画素をクロージングする第二のクロージング処理手段と、を有し、
前記文字検出手段は、前記重畳領域の画素のうちの、クロージング後の前記第一の置換画像の前記第一の色相の画素と同じ位置またはクロージング後の前記第二の置換画像の前記第二の色相の画素と同じ位置にある画素の集合を、前記文字として検出する、
請求項1記載の文字検出装置。
【請求項3】
第一の色相における度数である第一の度数および第二の色相における度数である第二の度数がピークである場合に、前記重畳領域の画素のうちの前記第二の色相の画素を前記第一の色相の画素に変更することによって第一の置換画像を生成し、前記重畳領域の画素のうちの前記第一の色相の画素を前記第二の色相の画素に変更することによって第二の置換画像を生成する、置換画像生成手段と、
前記第一の置換画像の前記第一の色相の画素をクロージングする第一のクロージング処理手段と、
前記第二の置換画像の前記第二の色相の画素をクロージングする第二のクロージング処理手段と、を有し、
前記文字検出手段は、前記重畳領域の画素のうちの、クロージング後の前記第一の置換画像の前記第一の色相の画素と同じ位置またはクロージング後の前記第二の置換画像の前記第二の色相の画素と同じ位置にある画素の集合を、前記文字として検出する、
請求項1記載の文字検出装置。
【請求項4】
文字を表わす第一の画像と半透明のオブジェクトを表わす第二の画像と含む画像から前記文字を検出する文字検出方法であって、
前記第一の画像に前記第二の画像が重なっている領域である重畳領域を複数に分割したブロックごとに、色相ごとの画素の出現の度数を算出する第一のステップと、
前記各ブロックの前記各色相の前記度数に基づいて、前記重畳領域から前記文字を検出する第二のステップと、
を有することを特徴とする文字検出方法。
【請求項5】
前記重畳領域の、濃度ごとの画素の出現の度数である濃度度数を算出する、第三のステップと、
鋭さが一定以上である第一の濃度度数および第二の濃度度数が前記濃度度数として算出された場合に、前記重畳領域の中の前記第一の濃度度数の濃度でも前記第二の濃度度数の濃度でもない画素を第一の色相の画素に置換する、第四のステップと、
前記度数のうちの、前記第一の色相における度数である第一の度数、第二の色相における度数である第二の度数、および第三の色相における度数である第三の度数がピークであり、かつ、前記各ブロックにおける前記第三の度数同士の差が、前記各ブロックにおける前記第一の度数同士の差および前記各ブロックにおける前記第二の度数同士の差よりも小さい場合に、置換後の前記重畳領域の画素のうちの前記第三の色相の画素を前記第一の色相の画素に変更することによって第一の置換画像を生成し、置換後の前記重畳領域の画素のうちの前記第三の色相の画素を前記第二の色相の画素に変更することによって第二の置換画像を生成する、第五のステップと、
前記第一の置換画像の前記第一の色相の画素をクロージングする第六のステップと、
前記第二の置換画像の前記第二の色相の画素をクロージングする第七のステップと、を有し、
前記第二のステップにおいては、前記重畳領域の画素のうちの、クロージング後の前記第一の置換画像の前記第一の色相の画素と同じ位置またはクロージング後の前記第二の置換画像の前記第二の色相の画素と同じ位置にある画素の集合を、前記文字として検出する、
請求項4記載の文字検出方法。
【請求項6】
第一の色相における度数である第一の度数および第二の色相における度数である第二の度数がピークである場合に、前記重畳領域の画素のうちの前記第二の色相の画素を前記第一の色相の画素に変更することによって第一の置換画像を生成し、前記重畳領域の画素のうちの前記第一の色相の画素を前記第二の色相の画素に変更することによって第二の置換画像を生成する、第三のステップと、
前記第一の置換画像の前記第一の色相の画素をクロージングする第四のステップと、
前記第二の置換画像の前記第二の色相の画素をクロージングする第五のステップと、を有し、
前記第二のステップにおいては、前記重畳領域の画素のうちの、クロージング後の前記第一の置換画像の前記第一の色相の画素と同じ位置またはクロージング後の前記第二の置換画像の前記第二の色相の画素と同じ位置にある画素の集合を、前記文字として検出する、
請求項4記載の文字検出方法。
【請求項7】
文字を表わす第一の画像と半透明のオブジェクトを表わす第二の画像と含む画像から前記文字を検出するコンピュータに用いられるコンピュータプログラムであって、
前記コンピュータに、
前記第一の画像に前記第二の画像が重なっている領域である重畳領域を複数に分割したブロックごとに、色相ごとの画素の出現の度数を算出する第一の処理と、
前記各ブロックの前記各色相の前記度数に基づいて、前記重畳領域から前記文字を検出する第二の処理と、
を実行させることを特徴とするコンピュータプログラム。
【請求項8】
前記重畳領域の、濃度ごとの画素の出現の度数である濃度度数を算出する、第三の処理を、前記コンピュータに実行させ、
鋭さが一定以上である第一の濃度度数および第二の濃度度数が前記濃度度数として算出された場合に、前記重畳領域の中の前記第一の濃度度数の濃度でも前記第二の濃度度数の濃度でもない画素を第一の色相の画素に置換する、第四の処理を、前記コンピュータに実行させ、
前記度数のうちの、前記第一の色相における度数である第一の度数、第二の色相における度数である第二の度数、および第三の色相における度数である第三の度数がピークであり、かつ、前記各ブロックにおける前記第三の度数同士の差が、前記各ブロックにおける前記第一の度数同士の差および前記各ブロックにおける前記第二の度数同士の差よりも小さい場合に、置換後の前記重畳領域の画素のうちの前記第三の色相の画素を前記第一の色相の画素に変更することによって第一の置換画像を生成し、置換後の前記重畳領域の画素のうちの前記第三の色相の画素を前記第二の色相の画素に変更することによって第二の置換画像を生成する、第五の処理を、前記コンピュータに実行させ、
前記第一の置換画像の前記第一の色相の画素をクロージングする第六の処理を、前記コンピュータに実行させ、
前記第二の置換画像の前記第二の色相の画素をクロージングする第七の処理を、前記コンピュータに実行させ、
前記第二の処理として、前記重畳領域の画素のうちの、クロージング後の前記第一の置換画像の前記第一の色相の画素と同じ位置またはクロージング後の前記第二の置換画像の前記第二の色相の画素と同じ位置にある画素の集合を、前記文字として検出する処理を、前記コンピュータに実行させる、
請求項7記載のコンピュータプログラム。
【請求項9】
第一の色相における度数である第一の度数および第二の色相における度数である第二の度数がピークである場合に、前記重畳領域の画素のうちの前記第二の色相の画素を前記第一の色相の画素に変更することによって第一の置換画像を生成し、前記重畳領域の画素のうちの前記第一の色相の画素を前記第二の色相の画素に変更することによって第二の置換画像を生成する、第三の処理を、前記コンピュータに実行させ、
前記第一の置換画像の前記第一の色相の画素をクロージングする第四の処理を、前記コンピュータに実行させ、
前記第二の置換画像の前記第二の色相の画素をクロージングする第五の処理を、前記コンピュータに実行させ、
前記第二の処理として、前記重畳領域の画素のうちの、クロージング後の前記第一の置換画像の前記第一の色相の画素と同じ位置またはクロージング後の前記第二の置換画像の前記第二の色相の画素と同じ位置にある画素の集合を、前記文字として検出する処理を、前記コンピュータに実行させる、
請求項7記載のコンピュータプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22】
image rotate

【図23】
image rotate

【図24】
image rotate

【図25】
image rotate

【図26】
image rotate

【図27】
image rotate


【公開番号】特開2012−141824(P2012−141824A)
【公開日】平成24年7月26日(2012.7.26)
【国際特許分類】
【出願番号】特願2010−294503(P2010−294503)
【出願日】平成22年12月29日(2010.12.29)
【出願人】(303000372)コニカミノルタビジネステクノロジーズ株式会社 (12,802)
【Fターム(参考)】