説明

画像2値化方法および画像2値化装置

【課題】2値化対象画像の背景に絵柄が含まれ、背景の絵柄が認識対象の文字に重なっている場合に、画像2値化装置が、より適切な2値化画像を生成し得るようにする。
【解決手段】画像2値化装置1が、2値化対象画像から局所領域を切り出す局所領域画像切出部124と、切り出された局所領域の画素値に基づいて2値化処理の閾値を設定する局所領域閾値設定部125と、設定された閾値に基づいて2値化処理を行う局所2値化処理部126とを具備する。これにより、文字領域と絵柄領域とが連結している場合に、文字領域と絵柄領域との輝度差に基づいて、文字領域と絵柄領域とが連結しない2値化画像を生成し得る。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像2値化方法、および、当該画像2値化方法を用いて画像を2値化する画像2値化装置に関する。
【背景技術】
【0002】
文字認識等の画像認識の前処理の1つに画像の2値化処理がある。例えば、特許文献1に記載の文字列2値化装置は、2値化対象画像から文字幅相当の高周波成分を有する領域を抽出し、当該抽出によって得られた画像に対して2値化処理を行う。この文字列2値化装置によれば、例えば文字列の下に引かれた下線を消去して、より適切に2値化処理を行うことができる。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特許第3462727号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、特許文献1に開示される技術などの従来技術では、2値化対象画像の背景に絵柄が含まれ、背景の絵柄が認識対象の文字に重なっている場合に、適切な2値化を行えないおそれがある。例えば、特許文献1に記載の文字列2値化装置における2値化方法など、全体の輝度値に基づいて2値化の閾値を決定する方法では、絵柄の輝度値と、認識対象の文字の輝度値の差が小さい場合に、当該絵柄を認識対象の文字から分離できないおそれがある。
【0005】
本発明は、このような事情を考慮してなされたものであり、その目的は、2値化対象画像の背景に絵柄が含まれ、背景の絵柄が認識対象の文字に重なっている場合に、より適切な2値化画像を生成し得る画像2値化方法および画像2値化装置を提供することにある。
【課題を解決するための手段】
【0006】
この発明は上述した課題を解決するためになされたもので、本発明の一態様による画像2値化方法は、画像を2値化する画像2値化装置が行う画像2値化方法であって、2値化対象画像に対して2値化処理を行って第1の2値化画像を生成する第1の2値化画像生成ステップと、前記第1の2値化画像から文字領域の候補を抽出する文字領域候補取得ステップと、前記文字領域の候補に含まれる文字線の太さに基づいて単位領域の大きさを設定する単位領域サイズ設定ステップと、前記2値化対象画像のうち前記単位領域分の部分画像の画素値に基づいて2値化の閾値を設定する2値化閾値設定ステップと、前記2値化の閾値に基づいて2値化処理を行って局所2値化データを生成する局所2値化処理ステップと、前記局所2値化データを複数の前記部分画像について合成して第2の2値化画像を生成する第2の2値化画像生成ステップと、を備えることを特徴とする。
【0007】
また、本発明の一態様による画像2値化方法は、上述の画像2値化方法であって、前記2値化対象画像に対して2値化処理を行って第3の2値化画像を生成する第3の2値化画像生成ステップと、前記第2の2値化画像と前記第3の2値化画像との画素値の論理和を演算して第4の2値化画像を生成する第4の2値化画像生成ステップと、を備えることを特徴とする。
【0008】
また、本発明の一態様による画像2値化方法は、上述の画像2値化方法であって、前記第1の2値化画像生成ステップは、前記第3の2値化画像生成ステップを兼ね、前記第3の2値化画像として前記第1の2値化画像を使用する、ことを特徴とする。
【0009】
また、本発明の一態様による画像2値化方法は、上述の画像2値化方法であって、前記2値化対象画像のうち前記局所2値化処理ステップで2値化処理を行う領域である局所2値化対象領域を、予め設定される文字領域の大きさの最小値基づいて決定する局所2値化対象領域決定ステップを備え、前記局所2値化処理ステップにて、前記局所2値化対象領域に含まれない領域の前記局所2値化データを所定の背景画素値とする、ことを特徴とする。
【0010】
また、本発明の一態様による画像2値化方法は、上述の画像2値化方法であって、前記単位領域サイズ設定ステップにて大きさを設定された前記単位領域分の前記部分画像毎に、該部分画像内の各画素の画素値のばらつき度を示すばらつき度指標を算出するばらつき度指標値算出ステップと、前記局所2値化処理ステップにて、前記ばらつき度指標値が所定以下のばらつき度を示す前記部分画像に対して前記局所2値化データを所定の背景画素値とする、ことを特徴とする。
【0011】
また、本発明の一態様による画像2値化方法は、上述の画像2値化方法であって、前記2値化対象画像の色情報に基づいて、当該2値化対象画像を文字領域と文字以外領域とに区分する色情報評価ステップを備え、前記局所2値化処理ステップにて、前記文字以外領域の前記局所2値化データを所定の背景画素値とする、ことを特徴とする。
【0012】
また、本発明の一態様による画像2値化装置は、2値化対象画像に対して2値化処理を行って第1の2値化画像を生成する第1の2値化画像生成部と、前記第1の2値化画像から文字領域の候補を抽出する文字領域候補取得部と、前記文字領域の候補に含まれる文字線の太さに基づいて単位領域の大きさを設定する単位領域サイズ設定部と、前記2値化対象画像のうち前記単位領域分の部分画像の画素値に基づいて2値化の閾値を設定する2値化閾値設定部と、前記2値化の閾値に基づいて2値化処理を行って局所2値化データを生成する局所2値化処理部と、前記局所2値化データを複数の前記部分画像について合成して第2の2値化画像を生成する第2の2値化画像生成部と、を備えることを特徴とする。
【発明の効果】
【0013】
本発明によれば、2値化対象画像の背景に絵柄が含まれ、背景の絵柄が認識対象の文字に重なっている場合に、より適切な2値化画像を生成し得る。
【図面の簡単な説明】
【0014】
【図1】本発明の第1に実施形態における画像2値化装置1の概略構成を示す構成図である。
【図2】同実施形態において、プレート画像取得部11が取得する2値化対象画像の例を示す図である。
【図3】同実施形態において、仮2値化処理部121が、2値化対象画像から文字幅相当の高周波成分を有する領域を抽出する際に設定するフィルタサイズの例を示す図である。
【図4】同実施形態において、仮2値化処理部121が生成する最大値フィルタ画像の例を示す図である。
【図5】同実施形態において、仮2値化処理部121が生成する最小値フィルタ画像の例を示す図である。
【図6】同実施形態における、最小値フィルタ画像から2値化対象画像を減算した画像の例を示す図である。
【図7】同実施形態において、仮2値化処理部121が2値化処理を行った画像の例を示す図である。
【図8】同実施形態において、仮2値化処理部121が生成する反転画像の例を示す図である。
【図9】同実施形態において、局所領域サイズ設定部123が測定する線の太さの例を示す図である。
【図10】同実施形態において、局所領域サイズ設定部123が設定する局所領域の大きさの例を示す図である。
【図11】同実施形態において、局所領域画像切出部124が切り出す部分画像の例を示す図である。
【図12】同実施形態において、局所領域画像切出部124が局所領域を設定する順序の例を示す図である。
【図13】同実施形態において、局所領域閾値設定部125が閾値を設定する際に画素値を参照する画素の例を示す図である。
【図14】同実施形態の局所2値化画像生成部127が生成する局所2値化画像において、文字領域と背景領域とが連結しない例を示す図である。
【図15】同実施形態において、論理和算出部128が出力する2値化画像の例を示す図である。
【図16】同実施形態において、2値化処理部12が2値化画像を生成する処理手順を示すフローチャートである。
【図17】本発明の第2に実施形態における画像2値化装置2の概略構成を示す構成図である。
【図18】同実施形態において、2値化処理部22が2値化画像を生成する処理手順を示すフローチャートである。
【図19】本発明の第3に実施形態における画像2値化装置3の概略構成を示す構成図である。
【図20】同実施形態において、2値化処理部32が2値化画像を生成する処理手順を示すフローチャートである。
【図21】本発明の第4に実施形態における画像2値化装置4の概略構成を示す構成図である。
【図22】同実施形態において、色情報評価部433が出力する画像の例を示す図である。
【図23】同実施形態において、2値化処理部42が2値化画像を生成する処理手順を示すフローチャートである。
【発明を実施するための形態】
【0015】
<第1の実施形態>
以下、図面を参照して、本発明の実施の形態について説明する。
図1は、本発明の第1に実施形態における画像2値化装置1の概略構成を示す構成図である。同図において、画像2値化装置1は、プレート画像取得部11と、2値化処理部12と、2値化画像出力部14とを備える。2値化処理部12は、仮2値化処理部(第1の2値化画像生成部)121と、文字領域候補取得部122と、局所領域サイズ設定部(単位領域サイズ設定部)123と、局所領域画像切出部124と、局所領域閾値設定部(2値化閾値設定部)125と、局所2値化処理部126と、局所2値化画像生成部(第2の2値化画像生成部)127と、論理和算出部128とを備える。
【0016】
画像2値化装置1は、2値化対象画像(2値化処理を行う対象となる画像)を取得して2値化処理を行い、2値化画像(2値化された画像)を出力する。本実施形態では、画像2値化装置1は、ナンバープレート認識装置の前処理としての2値化処理を行う装置であり、背景に絵柄の描かれているナンバープレートの画像を取得して2値化処理を行う。
【0017】
プレート画像取得部11は、2値化対象画像を取得して、仮2値化処理部121と局所領域画像切出部124とに出力する。
プレート画像取得部11は、例えば道路に設置された撮像装置と通信を行い、当該撮像装置が撮像する、ナンバープレートの撮像画像を受信する。そして、プレート画像取得部11は、受信した撮像画像に対してノイズ除去処理を行って2値化対象画像を生成する。プレート画像取得部11は、生成した2値化対象画像を、仮2値化処理部121と局所領域画像切出部124とに出力する。
【0018】
図2は、プレート画像取得部11が取得する2値化対象画像の例を示す図である。同図に示す2値化対象画像は、文字C11〜C16と、下線L11と、絵柄D11〜D13と、背景B11とを含む。文字C11は、認識対象の文字列(車両番号)を構成する。また、絵柄D11〜D13は、背景B11に描かれた絵柄である。このうち、絵柄D13は、文字C14〜C16および絵柄D12に接して描かれている。
なお、ここでいう、文字と絵柄とが「接する」とは、文字の領域と絵柄の領域とが、画素単位で上下または左右に隣接する(連結している)箇所を有することである。
【0019】
本実施形態において、プレート画像取得部11が取得する2値化対象画像は、ビットマップ形式など、画素値によって各画素の輝度値(明度)をグレースケールで示すデータ形式で表現されており、画素値が大きいほど明るい(薄い、白っぽい)ことを示す。
また、認識対象の文字は、背景よりも暗い(濃い、黒っぽい)領域となっている。また、絵柄は、文字と背景との中間の輝度値の領域となっている。図2の例では、文字C11〜C16および下線L11の輝度値は、絵柄D11〜D13の輝度値よりも小さく(暗く)、絵柄D11〜D13の輝度値は、背景B11の輝度値よりも小さくなっている。
【0020】
ただし、本発明を適用可能な画像のデータ形式は、上記のものに限らない。本発明は、様々なデータ形式で表現された画像に適用可能である。例えば、プレート画像取得部11が、圧縮符号などビットマップ以外のデータ形式にて2値化対象画像を取得して、画素毎の輝度値を示すデータ形式に変換するようにしてもよい。また、プレート画像取得部11が、画素毎にRGB(赤、緑、青)それぞれの輝度値を取得し、これらの輝度値を足し合わせて画素の輝度値を算出するようにしてもよい。また、文字が背景よりも明るく、絵柄が文字と背景との中間の輝度値であってもよい。
【0021】
2値化処理部12は、プレート画像取得部11から出力される2値化対象画像に対して2値化処理を行い、2値化画像を2値化画像出力部14に出力する。
仮2値化処理部121は、プレート画像取得部11から出力される2値化対象画像に対して2値化処理を行って2値化画像(第1の2値化画像。以下、「仮2値化画像」と称する)を生成し、文字領域候補取得部122に出力する。なお、本実施形態では、仮2値化処理部121は、特許第3462727号に示される処理のように、2値化対象画像から文字幅相当の高周波成分を有する領域を抽出し、当該抽出によって得られた画像に対して2値化処理を行う。ただし、仮2値化処理部121が行う2値化処理は、この高周波成分を有する領域の抽出を含む2値化処理に限らない。仮2値化処理部121が行う2値化処理として、文字の太さを取得可能な様々な2値化処理を用いることができる。
【0022】
図3は、仮2値化処理部121が、2値化対象画像から文字幅相当の高周波成分を有する領域を抽出する際に設定するフィルタサイズの例を示す図である。同図において、領域A21および領域A22は、2値化対象画像中の、最大値フィルタを適用された領域の例を示す。
文字の輝度値が背景の輝度値よりも小さい本実施形態においては、仮2値化処理部121は、2値化対象画像に対して最大値フィルタを適用し、最大値フィルタにより得られる画像に最小値フィルタを適用する。
【0023】
仮2値化処理部121は、予め、最大値フィルタを、幅Wfltかつ高さHfltの矩形領域のフィルタに設定している。ここで、仮2値化処理部121は、2値化対象画像に含まれる文字の大きさ(高さおよび幅)および文字線の太さについての参照値(代表値)を予め記憶している。そして、仮2値化処理部121は、最大値フィルタの幅Wfltを、文字幅の参照値Wrefよりやや大きい幅に設定し、最大値フィルタの高さHfltを、文字線の太さの参照値Tref程度の高さに設定している。
【0024】
そして、仮2値化処理部121は、2値化対象画像中の、幅Wfltかつ高さHfltを有する矩形領域の各々について、最大値フィルタを適用する。この最大値フィルタは、適用された領域内における画素値の最大値(最も明るい画素値)を、当該最大値フィルタを適用された領域の中央の画素の値として出力する。
例えば、領域A21は、比較的画素値の大きい背景領域B11を含む。したがって、領域A21の中央の画素の画素値は、背景の画素値となる。一方、領域A22は、背景領域よりも画素値の小さい下線の領域のみを含む。従って、領域A21の中央の画素の画素値は、背景よりも画素値の小さい下線の画素値となる。
【0025】
仮2値化処理部121は、最大値フィルタの出力する画素値を合成して画像を生成する。以下では、この最大値フィルタの出力から合成される画像を「最大値フィルタ画像」と称する。
図4は、仮2値化処理部121が生成する最大値フィルタ画像の例を示す図である。
例えば、仮2値化処理部121は、図3の2値化対象画像に対して、図4の最大値フィルタ画像を生成する。ここで、図3の2値化対象画像において、下線L11以外の領域は、最大値フィルタを適用した際に背景部分を含む。これにより、図4の最大値フィルタ画像の画素値は、下線L11以外の領域においては背景の画素値となっている。一方、領域A22のように、下線L11には、最大値フィルタ全体が含まれ得る。これにより、図4の最大値フィルタ画像の画素値は、下線L11の中心寄りの部分(図4の線L12)においては下線の画素値となっている。
【0026】
また、仮2値化処理部121は、予め、最小値フィルタを、最大値フィルタと同一の矩形領域のフィルタに設定している。そして、仮2値化処理部121は、最大値フィルタ画像中の、幅Wfltかつ高さHfltを有する矩形領域の各々について、最小値フィルタを適用する。この最小値フィルタは、適用された領域内における画素値の最小値(最も暗い画素値)を、当該最小値フィルタを適用された領域の中央の画素の値として出力する。そして、仮2値化処理部121は、最小値フィルタの出力する画素値を合成して画像を生成する。以下では、この最小値フィルタの出力から合成される画像を「最小値フィルタ画像」と称する。
【0027】
図5は、仮2値化処理部121が生成する最小値フィルタ画像の例を示す図である。
例えば、仮2値化処理部121は、図4の最大値フィルタ画像に対して、図5の最小値フィルタ画像を生成する。ここで、図4の最大値フィルタ画像において、線L12の近傍以外の領域は、最小フィルタを適用した際に背景部分のみを含む。これにより、図5の最大値フィルタ画像の画素値は、下線L12の近傍以外の領域においては背景の画素値となっている。一方、線L12の近傍では、最小フィルタを適用した際に線L12を含み得る。これにより、図5の最小値フィルタ画像は、下線L12の近傍(図5の下線L13)においては、下線の画素値となっている。
【0028】
次に、仮2値化処理部121は、最小値フィルタ画像から2値化対象画像を減算する(対応する画素毎に画素値を減算する)ことにより、2値化対象画像から文字幅相当の高周波成分を有する領域を抽出する。
図6は、最小値フィルタ画像から2値化対象画像を減算した画像の例を示す図である。
例えば、仮2値化処理部121は、図5の最小値フィルタ画像から、図3の2値化対象画像を減算して、図6の画像を取得する。同図では、画像の減算によって、図3の場合と画素値の大きさの順番が逆になっており、文字C11〜C16および下線L11の輝度値が、絵柄D11〜D13の輝度値よりも大きく(明るく)、絵柄D11〜D13の輝度値が、背景B11の輝度値よりも大きくなっている。
また、図6では、下線L11が無くなり、背景の一部となっている。
【0029】
次に、仮2値化処理部121は、最小値フィルタ画像から2値化対象画像を減算した画像に対して2値化処理を行う。
図7は、仮2値化処理部121が2値化処理を行った画像の例を示す図である。
例えば、仮2値化処理部121は、図6の画像に対して2値化処理を行うことによって図7の画像を取得する。図7の画像は、例えば、背景領域は「0」、文字領域や絵柄領域は「1」など2値化されており、特に絵柄領域の値と文字領域の値とが等しくなっている。
仮2値化処理部121は、2値化処理によって得られた仮2値化画像を文字領域候補取得部122に出力する。
【0030】
なお、ここでいう「文字領域」は、文字認識の対象となるシンボルを示す領域である。ここで、文字認識の対象となるシンボルの種類は予め定められており、以下の説明では、数字とアルファベットとが、文字認識の対象となるシンボルの種類に含まれているものとする。また、「絵柄領域」は、文字認識の対象以外のシンボルまたは模様を示す領域である。また、「背景領域」は、背景領域は、文字領域および絵柄領域以外の領域である。
【0031】
また、仮2値化処理部121は、仮2値化画像の各画素値(例えば「1」と「0」)を反転させた反転画像(第3の2値化画像)を生成し、論理和算出部128に出力する。
図8は、仮2値化処理部121が生成する反転画像の例を示す図である。
例えば、仮2値化処理部121は、図7の仮2値化画像の各画素値を反転させて図8の反転画像を生成する。この反転画像は、論理和算出部128が、後述する画像の論理和を算出する処理を行う際に使用する。
【0032】
文字領域候補取得部122は、仮2値化処理部121から出力される仮2値化画像に対してラベリング処理を行い、ラベルを付加された各領域の中から、文字領域の候補である文字領域候補を選択することにより、仮2値化画像から文字領域の候補を抽出する。
まず、文字領域候補取得部122は、仮2値化画像に対してラベリング処理を行う。ここでいう「ラベリング処理」は、連結している画素に同じラベルを付加することにより、仮2値化画像から連結する画素の領域を抽出する処理である。
例えば、図7の仮2値化画像において、文字領域候補取得部122は、文字C11の各画素にラベル「1」を付加し、文字C112の各画素にラベル「2」を付加するなど、連結している画素毎にラベルを付加する。ここで、文字C14〜C16と、背景D12およびD13とは連結している。従って、文字領域候補取得部122は、これらの画素に同一のラベルを付加する。
【0033】
次に、文字領域候補取得部122は、ラベリング処理にて付加したラベル毎の領域から、文字領域候補を選択する。
例えば、文字領域候補取得部122は、文字領域の特徴量を予め記憶しておき、当該特徴量と、各ラベル領域の特徴量とを比較して文字領域の候補としてのラベル領域の絞込みを行う。そして、文字領域候補取得部122は、絞込みによって得られた各ラベル領域に対してパターンマッチングを行い、文字領域を抽出する。
【0034】
具体的には、文字領域候補取得部122は、まず、ラベリング処理にて得られたラベル領域のうち、大きさ(x軸方向の長さ(すなわち幅)およびy軸方向の長さ(すなわち高さ))が、予め記憶する文字領域の大きさの最大値(横方向の最大値として予め定められた閾値、および、縦方向の最大値として予め定められた閾値)以下、かつ、予め記憶する文字領域の大きさの最小値(横方向の最小値として予め定められた閾値、および、縦方向の最小値として予め定められた閾値)以上の領域を、文字領域の第一段階候補として選択する。
【0035】
また、文字領域候補取得部122は、各文字のパターン画像を予め記憶しており、文字領域の第一段階候補として選択した各ラベル領域と、パターン画像の各々とのパターンマッチングを行って類似度を算出する。そして、文字領域候補取得部122は、算出した類似度が所定の閾値以上の領域を文字領域と判定し、当該領域を文字領域候補として局所領域サイズ設定部123に出力する。具体的には、例えば文字領域候補取得部122は、文字領域候補に付加されているラベルを示す情報を局所領域サイズ設定部123に出力する。
【0036】
図7の例では、文字領域候補取得部122は、ラベル領域C11〜C13を文字領域候補として選択する。一方、絵柄D11の各ラベル領域(絵柄D11の中心の円と周囲の各三角とは連結しておらず、それぞれ異なるラベルが付加される)は、類似する文字パターンが存在せず、文字領域候補とはならない。また、文字C14〜C16と絵柄D12およびD13が連結したラベル領域も、当該領域全体に対しては類似する文字パターンが存在せず、文字領域候補とはならない。
【0037】
なお、文字領域候補取得部122が文字領域候補を選択する方法は、上述した領域の大きさに基づく判定およびパターンマッチングによる方法に限らず、文字らしい領域を選択可能な様々な方法を用いることができる。例えば、文字領域候補取得部122が、文字領域の特徴量として、領域の大きさに加えて領域の充填率を用いるようにしてもよい。ここで、「充填率」とは、ラベル領域に外接する矩形においてラベル領域が占める面積の割合をいう。
【0038】
あるいは、文字領域候補取得部122が、領域の特徴量(例えば大きさ)のみに基づいて文字領域候補を選択するようにしてもよいし、パターンマッチングのみに基づいて文字領域候補を選択するようにしてもよい。このように単一の方法を用いることにより、文字領域候補取得部122の行う処理をより単純化できるので、文字領域候補取得部122をより容易に構築できるようになる。
一方、上述したように領域の特徴量に基づいて候補を選択する方法と、パターンマッチングに基づいて候補を選択する方法とを併用することにより、絞り込まれた候補に対してパターンマッチングを行うようにできるので、文字領域候補取得部122が、より速く、かつ、より正確に、文字領域を選択できるようになる。
【0039】
局所領域サイズ設定部123は、文字領域候補に含まれる文字線の太さに基づいて局所領域(単位領域)の大きさを設定する。後述するように、この局所領域は、局所領域閾値設定部125が2値化処理の閾値を決定する際の単位領域となる。
まず、局所領域サイズ設定部123は、文字領域候補取得部122が選択した文字領域候補から文字線の太さを取得する。
例えば、局所領域サイズ設定部123は、文字領域候補の各々について、所定の部分を通る線(文字線)を検出し、検出した全ての線の傾きを求めて当該線の太さを測定する。そして、局所領域サイズ設定部123は、算出した全ての線の太さの平均を測定して文字線の太さとする。
【0040】
図9は、局所領域サイズ設定部123が測定する線の太さの例を示す図である。
例えば、局所領域サイズ設定部123は、所定の部分としてラベル領域C12の縦の中心線LCを求め、この中心線LCに沿ってラベル領域C12をスキャンして線L31〜L33を検出する。そして、局所領域サイズ設定部123は、線L31〜L33の各々についてエッジを検出して線の傾きを算出し、算出した傾きに対する垂直方向を、文字線の太さの測定方向とする。ここでは、線L31〜L33の傾きは0(図の横方向に平行)であり、局所領域サイズ設定部123は、図の縦方向を、文字線の太さの測定方向とする。
そして、局所領域サイズ設定部123は、線L31〜L33の各々について図の縦方向に文字線の太さを測定して、太さT31〜T33を取得する。
局所領域サイズ設定部123は、他の文字領域候補である文字C11およびC13(図7)に対しても同様の処理を行って太さを取得する。そして、局所領域サイズ設定部123は、取得した全ての太さの平均を算出して文字線の太さとする。
【0041】
次に、局所領域サイズ設定部123は、算出した文字線の太さに基づいて局所領域の大きさを設定する。具体的には、例えば局所領域の形は正方形に予め決定されており、局所領域サイズ設定部123はこの正方形の1辺の長さ(すなわち、幅および高さ)を設定する。
図10は、局所領域サイズ設定部123が設定する局所領域の大きさの例を示す図である。局所領域サイズ設定部123は、文字線の太さW41に所定の幅W42を加えて局所領域の幅および高さW43とする。これによって、局所領域が、幅W43かつ高さW43の正方形の領域A41に設定される。
ここで、幅W42は、例えば1画素分の幅など微小な幅である。従って、局所領域の幅及び高さW43は、例えば、文字線の太さW41に2画素分の幅を加えた長さなど、文字線の太さよりもやや長い長さに設定される。
局所領域サイズ設定部123は、設定した局所領域の大きさを、局所領域画像切出部124に出力する。
【0042】
局所領域画像切出部124は、プレート画像取得部11から出力される2値化対象画像において、局所領域の部分画像を切り出す。
図11は、局所領域画像切出部124が切り出す部分画像の例を示す図である。同図に示すように、局所領域画像切出部124は、2値化対象画像の様々な部分に、局所領域サイズ設定部123によって設定された大きさの局所領域A41を設定し、当該局所領域A41に含まれる部分画像を切り出す。具体的には、局所領域画像切出部124は、局所領域A41に含まれる各画素の画素値を読み出す。
局所領域画像切出部124は、局所領域を設定して部分画像を切り出す毎に、切り出した部分画像(すなわち、読み出した画素値)と、設定した局所領域の位置情報とを、局所領域閾値設定部125に出力する。
【0043】
なお、本実施形態においては、画像2値化装置1は、2値化対象画像の左上端を原点とし、右方向にx軸、下方向にy軸を取り、画素幅を長さの単位とした座標系を用いて2値化対象画像における位置を特定する。例えば、2値化対象画像の左上端の座標は(0,0)となる。また、2値化対象画像の左上端から右に1画素分ずれた位置の座標は(1,0)となる。また、2値化対象画像の左上端から下に1画素分ずれた位置の座標は(0,1)となる。
但し、画像2値化装置1による2値化対象画像における位置の特定方法は、当該座標系を用いるものに限らない、例えば、画素毎に予め識別番号が付されており、画像2値化装置1は当該識別番号を用いて2値化対象画像における位置を特定するなど、他の方法を用いるようにしてもよい。
【0044】
図12は、局所領域画像切出部124が局所領域を設定する順序の例を示す図である。同図の領域A51〜A55は、いずれも局所領域A41を示す。また、幅WPは1画素分の幅を示す。
まず、同図(a)に示すように、局所領域画像切出部124は、2値化対象画像の左上に局所領域A51を設定し、この局所領域A51に含まれる各画素の画素値を読み出して局所領域閾値設定部125に出力する。また、局所領域画像切出部124は、局所領域A51の位置情報として、例えば、この局所領域A51の中心の画素P51の座標(x,y)を局所領域閾値設定部125に出力する。
【0045】
次に、同図(b)に示すように、局所領域画像切出部124は、局所領域A51から1画素分(幅WP)右にずらした位置に局所領域A52を設定し、この局所領域A52に含まれる各画素の画素値を読み出して局所領域閾値設定部125に出力する。また、局所領域画像切出部124は、局所領域A52の位置情報として、この局所領域A52の中心の画素P52の座標(x+1,y)を局所領域閾値設定部125に出力する。
【0046】
局所領域画像切出部124は、局所領域を右に1画素ずつずらして同様の処理を繰り返す。そして、同図(c)に示すように2値化対象画像の右端まで処理をし終えると、局所領域画像切出部124は、同図(d)に示すように、2値化対象画像の左上から1画素分(幅WP)下にずらした位置に局所領域A54を設定し、この局所領域A54に含まれる各画素の画素値を読み出して局所領域閾値設定部125に出力する。また、局所領域画像切出部124は、局所領域A54の位置情報として、この局所領域A54の中心の画素P54の座標(x,y+1)を局所領域閾値設定部125に出力する。
局所領域画像切出部124は、局所領域を右に1画素ずつずらし、また、右端まで処理を終えると下に1画素ずつずらしで同様の処理を繰り返す。そして、同図(e)に示すように2値化対象画像の右下端まで処理をし終えると(、すなわち、全ての切り出し処理を完了すると、)局所領域画像切出部124は、切り出し処理を終了したことを示す情報を、局所領域閾値設定部125および局所2値化処理部126を介して局所2値化画像生成部127に出力する。
【0047】
局所領域閾値設定部125は、局所領域画像切出部124が2値化対象画像から切り出す局所領域分の部分画像の画素値に基づいて2値化の閾値を設定する。
図13は、局所領域閾値設定部125が閾値を設定する際に画素値を参照する画素の例を示す図である。同図において、局所領域A41の各マス目が画素を示す。また、画素P61は局所領域A41の中央の画素である。局所領域閾値設定部125は、この中央の画素P61の2値化処理の閾値を決定する。
例えば、局所領域閾値設定部125は、局所領域A41に含まれる各画素の画素値の平均(すなわち平均輝度)μと標準偏差σとを算出し、式(1)を用いて閾値θを算出する。
【0048】
【数1】

【0049】
ここで、係数kは、予め定められた負の定数(k<0)である。kの値は、例えば幾つかのサンプル画像について、様々なkの値で2値化処理を行ってみて、最も良好な結果を得られる値に設定する。
なお、2値化対象画像の文字領域の画素値が、背景領域の画素値よりも大きい場合(例えば、黒の背景に白文字でナンバーが記載されている場合)は、局所領域閾値設定部125は、係数kとして正の定数(k>0)を用いる。
【0050】
局所領域閾値設定部125は、設定した閾値θと、局所領域画像切出部124から出力される局所領域の位置情報と、局所領域の中央の画素(例えば、図13の画素P61)の画素値とを、局所2値化処理部126に出力する。
なお、標準偏差σは、本発明におけるばらつき度指標の一例である。すなわち、局所領域に含まれる部分画像の各画素の画素値のばらつき度が大きいほど、標準偏差σは大きい値を取る。
【0051】
局所2値化処理部126は、局所領域閾値設定部125が設定した閾値に基づいて、2値化処理(第2の2値化処理。以下では「局所2値化処理」と称する。)を行って局所2値化データを生成する。ここでいう「局所2値化データ」は、局所領域の中央の画素に対する2値化処理の結果得られる、2値化された画素値である。局所2値化処理部126は、局所領域閾値設定部125から出力される閾値と局所領域の中央の画素の画素値をと比較して、画素値が閾値以上であると判定したときは局所2値化データの値を「1」とし、画素値が閾値未満であると判定したときは局所2値化データの値を「0」とする。
局所2値化処理部126は、生成した局所2値化データと、局所領域閾値設定部125から出力される局所領域の位置情報とを、局所2値化画像生成部127に出力する。
【0052】
局所2値化画像生成部127は、局所2値化処理部126から出力される局所2値化データを、局所領域画像切出部124が2値化対象画像に設定する各局所領域について合成して、2値化画像(第2の2値化画像。以下では「局所2値化画像」と称する)を生成する。具体的には、局所2値化画像生成部127は、出力用画像のフォームを予め用意しておき、局所2値化処理部126から局所2値化データと座標(局所領域の中央の画素の座標)とが出力される毎に、出力用画像のフォームにおいて、局所2値化処理部126から出力される座標の画素の画素値を、局所2値化処理部126から出力される局所2値化データの値とする処理を繰り返す。これにより、局所2値化画像生成部127は、(周辺の一部を除いて)局所2値化処理の結果を画素とする出力用画像(局所2値化画像)を生成する。
【0053】
図14は、局所2値化画像生成部127が生成する局所2値化画像において、文字領域と背景領域とが連結しない例を示す図である。
上述したように、局所領域閾値設定部125は、各画素の画素値の平均μに加えて、標準偏差σを用いて閾値θを算出するので、文字領域と背景領域と絵柄領域との輝度差に応じて適切な閾値を得ることができる。これにより、文字領域と、絵柄領域とが結合しなくなることを期待できる。すなわち、図14の領域A71のように、文字領域と絵柄領域との間に局所2値化データ値「0」の領域が生成されることを期待できる。
【0054】
論理和算出部128は、仮2値化処理部121から出力される反転画像と、局所2値化画像生成部127から出力される局所2値化画像との画素値の論理和を演算して、2値化処理部12の2値化処理結果としての2値化画像(第4の2値化画像)を生成する。
ここで、局所領域に、ほぼ均一な輝度値の背景領域のみが含まれる場合、標準偏差σの値が小さくなり、局所領域に含まれる背景画像の画素の平均輝度に近い値の閾値が設定される。このため、ノイズ等によって局所領域の中央の画素の画素値が小さくなると、局所2値化データの値が「0」(文字領域を示すデータ)となり得る。これにより、局所2値化画像は、背景にノイズを含み易い画像となる。
そこで、論理和算出部128は、仮2値化処理部121から出力される反転画像と、局所2値化画像との、対応する画素毎の画素値の論理和を演算することにより、局所2値化画像の背景部分に含まれるノイズを除去する。
なお、2値化画像の背景領域の値が「0」に設定され、文字領域の値が「1」に設定されている場合は、論理和算出部128は、論理和に換えて論理積を演算する。
【0055】
なお、論理和算出部128が局所2値化画像との論理和を行う画像は、仮2値化処理部121から出力される反転画像に限らない。論理和算出部128は、局所2値化画像との論理和を行う画像として、画像全体に共通する閾値で2値化された様々な画像(局所2値化画像との比較において、背景部分にノイズが含まれにくい様々な画像)を用いることができる。
【0056】
図15は、論理和算出部128が出力する2値化画像の例を示す図である。同図(a)は、論理和算出部128が出力する2値化画像の例を示し、同図(b)は、この2値化画像の一部を拡大した例を示す。
図14で説明したように、局所2値化画像において、文字領域と絵柄領域とが連結しないことを期待し得る。これにより、論理和算出部128が出力する2値化画像も、文字領域C14〜C16と背景領域D13とが連結しない画像となることを期待し得る。
【0057】
2値化画像出力部14は、2値化処理部12から出力される2値化画像を2値化処理部12の外部に出力する。例えば、2値化画像出力部14は、文字認識装置との間における通信機能を有し、2値化処理部12から出力される2値化画像を文字認識装置に送信する。
【0058】
次に、画像2値化装置1の動作について説明する。
図16は、2値化処理部12が2値化画像を生成する処理手順を示すフローチャートである。2値化処理部12は、プレート画像取得部11から2値化対象画像が出力されると同図の処理を開始する。
まず、仮2値化処理部121が、プレート画像取得部11から出力される2値化対象画像を取得して仮2値化処理を行う(ステップS101)。この仮2値化処理は、2値化対象画像に含まれる文字線の太さを取得する前処理としての2値化処理である。
仮2値化処理部121は、この仮2値化処理によって得られた仮2値化画像を、文字領域候補取得部122に出力する。また、仮2値化処理部121は、仮2値化画像の各画素値を反転させた反転画像を生成し、論理和算出部128に出力する。
【0059】
次に、文字領域候補取得部122は、仮2値化処理部121から出力される仮2値化画像に対してラベリング処理を行う(ステップS102)。そして、文字領域候補取得部122は、ラベリング処理によって得られたラベル領域に対して、予め記憶する文字領域の特徴量に基づいて、文字領域の候補としてのラベル領域の絞込みを行う。さらに、文字領域候補取得部122は、絞込みの結果得られたラベル領域の各々に対して、予め記憶する文字パターンとのパターンマッチングを行い、これらラベル領域の中から文字領域候補を選択する(ステップS103)。
そして、文字領域候補取得部122は、選択した文字領域候補を示す情報を局所領域サイズ設定部123に出力する。
【0060】
次に、局所領域サイズ設定部123は、文字領域候補取得部122が選択した文字領域候補から文字線の太さを取得する(ステップS104)。そして、局所領域サイズ設定部123は、文字領域候補に含まれる文字線の太さに基づいて、局所領域閾値設定部125が2地価処理の閾値を決定する際の単位となる局所領域の大きさを設定する(ステップS105)。局所領域サイズ設定部123は、設定した局所領域の大きさを、局所領域画像切出部124に出力する。
【0061】
次に、局所領域画像切出部124は、プレート画像取得部11から出力される2値化対象画像に対して、図12で説明した様々な局所領域を設定するループを開始する(ステップS111)。そして、局所領域画像切出部124は、設定した局所領域に含まれる部分画像を切り出し、切り出した部分画像と、設定した局所領域の位置情報とを、局所領域閾値設定部125に出力する(ステップS112)。
ここで、局所領域画像切出部124が取得する2値化対象画像は、ステップS101で仮2値化処理部121が取得する2値化対象画像と同一である。
【0062】
次に、局所領域閾値設定部125は、局所領域画像切出部124から出力される部分画像の、平均輝度値μおよび標準偏差σを算出し(ステップS113)、算出した平均輝度値μおよび標準偏差σに基づいて2値化の閾値を設定する(ステップS114)。そして、局所領域閾値設定部125は、設定した閾値と、部分画像と共に局所領域閾値設定部125から取得した局所領域の位置情報とを、局所2値化処理部126に出力する。
【0063】
次に、局所2値化処理部126は、局所領域の中央の画素の画素値と局所領域閾値設定部125が設定した閾値とを比較することによって当該中央の画素に対する2値化処理を行い(ステップS115)、2値化処理結果である局所2値化データを、局所領域閾値設定部125から出力される局所領域の位置情報と共に、局所2値化画像生成部127に出力する。
【0064】
次に、局所2値化画像生成部127は、局所2値化処理部126から出力される局所2値化データ2を合成する(ステップS116)。この局所2値化データの合成処理は、局所2値化画像を生成する処理である。
その後、局所領域画像切出部124は、全ての局所領域を切り出す処理を完了したか否かを判定する(ステップS117)。完了していないと判定した場合は、ステップS111に戻って、引き続き残りの局所領域に対する処理を行う。一方、全ての局所領域を切り出す処理を完了したと判定し場合は、局所領域画像切出部124は、処理を終了したことを示す情報を、局所領域閾値設定部125と局所2値化処理部126とを介して局所2値化画像生成部127に出力する。そして、局所2値化画像生成部127は、局所領域画像切出部124から出力される当該情報を取得すると、合成した2値化画像を、局所2値化画像として論理和算出部128に出力する。
論理和算出部128は、仮2値化処理部121から出力される反転画像と、局所2値化画像生成部127から出力される局所2値化画像との画素値の論理和を演算して、2値化処理部12の2値化処理結果としての2値化画像を生成する(ステップS121)。
その後、論理和算出部128は、生成した2値化画像を2値化画像出力部14に出力する。そして、2値化画像出力部14は、2値化処理部12から出力される2値化画像を2値化処理部12の外部に出力する。
【0065】
以上のように、局所領域画像切出部124が、2値化対象画像から局所領域(部分画像)を切り出し、局所領域閾値設定部125が、部分画像の画素値に基づいて局所2値化処理用の閾値を設定し、局所2値化処理部126が、局所領域閾値設定部125の設定した閾値を用いて局所2値化処理を行う。
これにより、画像2値化装置1は、2値化対象画像の背景に絵柄が含まれ、背景の絵柄が認識対象の文字に重なっている場合に、より適切な2値化画像(具体的には、文字領域と絵柄領域とが連結しない画像)を生成し得る。
【0066】
また、論理和算出部128が、仮2値化処理部121から出力される反転画像と、局所2値化画像生成部127から出力される局所2値化画像との論理和を演算して2値化画像を生成する。これにより、局所2値化画像の背景領域に含まれるノイズを除去できる。
【0067】
また、論理和算出部128は、局所2値化画像との論理和を演算する2値化画像として、仮2値化処理部121から出力される反転画像を用いる。これにより、局所領域サイズを決定するための2値化処理と、局所2値化画像との論理和を演算する2値化画像を生成するための2値化処理とを同一の処理とすることができ、2値化処理部12の処理負荷を抑えることができる。
【0068】
<第2の実施形態>
図17は、本発明の第2に実施形態における画像2値化装置2の概略構成を示す構成図である。同図において、画像2値化装置2は、プレート画像取得部11と、2値化処理部22と、2値化画像出力部14とを備える。2値化処理部22は、仮2値化処理部121と、文字領域候補取得部222と、局所領域サイズ設定部123と、局所2値化対象領域決定部231と、局所領域画像切出部224と、局所領域閾値設定部(2値化閾値設定部)225と、局所2値化処理部226と、局所2値化画像生成部127と、論理和算出部128とを備える。
同図において、図1の各部に対応して同様の機能を有する部分には同一の符号(11、121、123、127、128、14)を付して説明を省略する。
【0069】
文字領域候補取得部222は、文字領域候補取得部122(図1)と同様の処理を行う。加えて、文字領域候補取得部222は、仮2値化画像に対してラベリング処理を行って得られるラベル領域の各々について、ラベル領域の大きさ(高さおよび幅)と、当該ラベル領域の位置情報とが対応付けられたラベル領域情報を、局所2値化対象領域決定部231に出力する。ラベル領域の位置情報として、例えば文字領域候補取得部222は、ラベル領域に外接する矩形の左上の頂点の座標をラベル領域情報に含めて、局所2値化対象領域決定部231に出力する。
【0070】
局所2値化対象領域決定部231は、2値化対象画像に含まれる文字の大きさ(高さおよび幅)および文字線の太さについての参照値(代表値)に基づいて予め決定された、文字領域の大きさ(高さおよび幅)の最小値を予め記憶している。
そして、局所2値化対象領域決定部231は、文字領域候補取得部222から出力されるラベル領域情報に基づいて、文字領域の大きさの最小値以上の大きさを有するラベル領域を全て選択し、選択した各領域の大きさおよび位置の情報を局所領域画像切出部224に出力する。
【0071】
具体的には、局所2値化対象領域決定部231は、文字領域候補取得部222から出力されるラベル領域情報に基づいて、各ラベル領域の高さおよび幅と、文字領域の高さおよび幅の最小値とを比較する。そして、局所2値化対象領域決定部231は、高さ、幅共に文字領域の最小値以上の全てのラベル領域を、局所2値化対象領域として選択し、選択した各領域の大きさ(高さおよび幅)と、文字領域候補取得部222から出力される位置の情報とを局所領域画像切出部224に出力する。これにより、局所2値化対象領域決定部231は、文字領域の高さおよび幅の最小値以上の高さおよび幅を有するラベル領域に外接する矩形領域(矩形内部を含む)を局所2値化対象領域として指定し、局所領域画像切出部224に通知する。
【0072】
例えば、図7の仮2値化画像の場合、ラベル領域C11〜C13と、領域C14〜C16とD12とD13とが連結しているラベル領域とは、文字領域の大きさの最小値以上の大きさを有しており、局所2値化対象領域決定部231は、これらのラベル領域を局所2値化対象領域として選択する。一方、絵柄D11の各ラベル領域は、文字領域の大きさの最小値未満の大きさを有しており、局所2値化対象領域決定部231は、これらのラベル領域については局所2値化対象領域として選択しない。
【0073】
局所領域画像切出部224は、局所領域画像切出部124(図1)と同様に、プレート画像取得部11から出力される2値化対象画像において、図12で説明したように局所領域を順次設定する。
そして、局所領域画像切出部224は、設定した局所領域の中央の画素が、局所2値化対象領域決定部231が選択した局所2値化対象領域に含まれるか否かを判定する。具体的には、局所領域画像切出部224は、設定した局所領域の中央の画素の座標を算出する。そして、算出した座標が、局所2値化対象領域決定部231から出力される上述の矩形領域に含まれるか否かを判定する。
【0074】
設定した局所領域が局所2値化対象領域に含まれると判定した場合、局所領域画像切出部224は、局所領域画像切出部124と同様に、局所領域の部分画像を切り出し、切り出した部分画像と、設定した局所領域の位置情報とを、局所領域閾値設定部125に出力する。
一方、設定した局所領域が局所2値化対象領域に含まれないと判定した場合、局所領域画像切出部224は、局所2値化対象領域外であることを示す情報に、局所領域の位置情報を含めて、局所領域閾値設定部125に出力する。
また、局所領域画像切出部224は、局所領域画像切出部124と同様に、全ての切り出し処理を完了すると、切り出し処理を終了したことを示す情報を、局所領域閾値設定部225および局所2値化処理部226を介して局所2値化画像生成部127に出力する。
【0075】
局所領域閾値設定部225は、局所領域画像切出部224から、部分画像と、局所領域の位置情報とが出力されたときは、局所領域閾値設定部125(図1)と同様の処理を行う。
一方、局所領域画像切出部224から、局所2値化対象領域外であることを示す情報が出力されたときは、局所領域閾値設定部225は、当該情報を、そのまま局所2値化処理部226に出力し、閾値の設定処理は行わない。
【0076】
局所2値化処理部226は、局所領域閾値設定部225から、閾値θと局所領域の位置情報と局所領域の中央の画素の画素値とが出力されたときは、局所2値化処理部126(図1)と同様の処理を行う。
一方、局所領域閾値設定部225から、局所2値化対象領域外であることを示す情報が出力されたときは、局所2値化処理部226は、局所2値化対象領域外であることを示す情報から局所領域の位置情報を読み出し、背景を示す局所2値化データ「1」と、局所領域の位置情報とを、局所2値化画像生成部127に出力する。
【0077】
次に、画像2値化装置2の動作について説明する。
図18は、2値化処理部22が2値化画像を生成する処理手順を示すフローチャートである。2値化処理部22は、プレート画像取得部11から2値化対象画像が出力されると同図の処理を開始する。
ステップS201〜S205は、図16のステップS101〜S105と同様である。ただし、ステップS203において、文字領域候補取得部122は、選択した文字領域候補を示す情報を、局所領域サイズ設定部123に加えて局所2値化対象領域決定部231にも出力する。
ステップS206において、局所2値化対象領域決定部231は、予め記憶する文字領域の大きさの最小値の情報と、文字領域候補取得部222から出力されるラベル領域情報とに基づいて、局所2値化対象領域を設定し、設定した局所2値化対象領域の情報を局所領域画像切出部224に出力する。
【0078】
ステップS211は、図16のステップS111と同様である。
ステップS212において、局所領域画像切出部224は、処理対象の局所領域の中央の画素が局所2値化対象領域に含まれるか否かを判定することにより、処理対象の局所領域が局所2値化の対象か否かを判定する。局所2値化の対象であると判定した場合(ステップS212:YES)、ステップS221に進む。ステップS221〜S224は、図16のステップS112〜S115と同様である。
【0079】
一方、ステップS212において、局所2値化の対象であると判定した場合(ステップS212:NO)、局所領域画像切出部224は、局所2値化対象領域外であることを示す情報に、局所領域の位置情報を含めて、局所領域閾値設定部225を介して局所2値化処理部226に出力する。そして、局所2値化処理部226は、背景を示す局所2値化データ「1」と、局所領域の位置情報とを、局所2値化画像生成部127に出力する(ステップS231)。その後、ステップS241に進む。
ステップS241〜S251は、図16のステップS116〜S121と同様である。
【0080】
以上のように、局所領域画像切出部224が、局所2値化対象領域外であると判定した局所領域に対しては、局所領域画像切出部224は部分画像の切り出しを行わず、局所領域閾値設定部225は閾値の設定を行わず、局所2値化処理部226は局所領域の中央の画素が閾値以上か否かの判定を行わない。このように、局所2値化対象領域決定部231が、2値化処理を行う対象領域を選択(限定)することにより、局所領域画像切出部224と、局所領域閾値設定部225と、局所2値化処理部226との処理負荷を軽減できる。特に、局所領域閾値設定部225は、局所領域の画素値の標準偏差や分散を算出する回数を減らすことができ、処理速度の向上を図ることができる。また、局所領域画像切出部224が、局所2値化対象領域外であると判定した局所領域に対しては、局所領域画像切出部224が局所領域内の各画素値を出力する必要が無く、局所領域画像切出部224が局所領域閾値設定部225に出力するデータ量を抑えることが出来る。これにより、データ入出力の処理時間を削減でき、この点でも処理速度の向上を図ることができる。
【0081】
<第3の実施形態>
図19は、本発明の第3に実施形態における画像2値化装置3の概略構成を示す構成図である。同図において、画像2値化装置3は、プレート画像取得部11と、2値化処理部32と、2値化画像出力部14とを備える。2値化処理部32は、仮2値化処理部121と、文字領域候補取得部122と、局所領域サイズ設定部123と、局所領域画像切出部124と、標準偏差評価部332と、局所領域閾値設定部(2値化閾値設定部)325と、局所2値化処理部326と、局所2値化画像生成部127と、論理和算出部128とを備える。
同図において、図1の各部に対応して同様の機能を有する部分には同一の符号(11、121〜124、127、128、14)を付して説明を省略する。
【0082】
標準偏差評価部332は、局所領域画像切出部124が切り出す部分画像を取得し、当該部分画像に含まれる画素の標準偏差σを算出する。そして、標準偏差評価部332は、算出した標準偏差と、予め記憶する閾値βとを比較する。
標準偏差σが閾値β以上であると判定した場合、標準偏差評価部332は、閾値以上を示す情報を、局所領域閾値設定部325に出力する。なお、標準偏差評価部332が、閾値以上を示す情報に加えて、算出した標準偏差σを局所領域閾値設定部325に出力するようにしてもよい。これにより、局所領域閾値設定部325は改めて標準偏差σを算出する必要が無くなり、2値化処理部32の負荷の増大を抑制できる。
一方、標準偏差σが閾値β未満であると判定した場合、標準偏差評価部332は、閾値未満を示す情報を局所領域閾値設定部325に出力する。
【0083】
ここで、局所領域画像切出部124が切り出す部分画像に、文字領域と背景領域との境界など、領域の境界が含まれる場合は、背景のみの場合よりも標準偏差が大きくなる。一方、部分画像に背景領域のみが含まれる場合など、領域の境界が含まれない場合は、標準偏差が小さくなる。
そして、局所領域の大きさは文字線の太さよりも大きく設定されているので、部分画像に文字領域が含まれる場合は、文字領域と背景領域あるいは絵柄領域との境界が含まれて、背景のみの場合よりも標準偏差が大きくなる。
従って、標準偏差が小さい場合、背景領域のみ又はほぼ同じ輝度値からなる絵柄領域のみが部分画像に含まれる、すなわち文字領域が部分画像に含まれないことを期待できる。
そこで、本実施形態では、標準偏差評価部332が標準偏差の大きさを評価し、所定の閾値β以下であるときに背景領域であるとして以下に説明する処理を行う。
【0084】
局所領域閾値設定部325は、閾値以上を示す情報が標準偏差評価部332から出力された場合は、局所領域閾値設定部125(図1)と同様の処理を行う。
一方、局所領域閾値設定部325は、閾値未満を示す情報が標準偏差評価部332から出力された場合は、閾値の設定処理は行わず、当該閾値未満を示す情報と、局所領域画像切出部124から出力される局所領域の位置情報とを、局所2値化処理部326に出力する。
【0085】
局所2値化処理部326は、局所領域閾値設定部325から、閾値θと局所領域の位置情報と局所領域の中央の画素の画素値とが出力されたときは、局所2値化処理部126(図1)と同様の処理を行う。
一方、局所領域閾値設定部325から、閾値未満を示す情報と局所領域の位置情報とが出力されたときは、局所2値化処理部326は、背景を示す局所2値化データ「1」と、局所領域の位置情報とを、局所2値化画像生成部127に出力する。
【0086】
次に、画像2値化装置3の動作について説明する。
図20は、2値化処理部32が2値化画像を生成する処理手順を示すフローチャートである。
ステップS301〜S312は、図16のステップS101〜S112と同様である。
その後、標準偏差評価部332は、局所領域画像切出部124が切り出した部分画像に含まれる画素値の標準偏差σを算出する(ステップS313)。そして、標準偏差評価部332は、算出した標準偏差σが予め記憶する閾値β以上か否かを判定する(ステップS314)。標準偏差σが閾値β以上であると判定した場合(ステップS314:YES)、標準偏差評価部332が閾値以上を示す情報を局所領域閾値設定部325に出力することにより、ステップS321に進む。ステップS321〜S323は、図16のステップS113〜S115と同様である。
【0087】
一方、ステップS314において、標準偏差σが閾値β未満であると判定した場合(ステップS314:NO)、標準偏差評価部332は、閾値未満を示す情報を、局所領域閾値設定部325に出力する。そして、局所領域閾値設定部325は、当該閾値未満を示す情報と、局所領域画像切出部124から出力される局所領域の位置情報とを、局所2値化処理部326に出力する。そして、局所2値化処理部326は、背景を示す局所2値化データ「1」と、局所領域の位置情報とを、局所2値化画像生成部127に出力する(ステップS331)。その後、ステップS341に進む。
ステップS341〜S351は、図16のステップS116〜S121と同様である。
【0088】
以上のように、標準偏差評価部332が部分画像の画素値の標準偏差σと予め記憶する閾値βとを比較し、標準偏差σが閾値β未満であると判定すると、局所2値化処理部326は、当該部分画像(局所領域)の中央の画素を背景領域として局所2値化データを生成し出力する。
ここで、標準偏差σの値が小さい場合、局所領域閾値設定部325は、局所2値化処理の閾値θを、部分画像の画素値の平均に近い値に設定する。そのため、局所領域が背景のみを含む場合に、局所領域の中央の画素の画素値がノイズ等によって実際よりもわずかに大きい値になっただけで、文字領域として2値化されてしまうおそれがある。
そこで、標準偏差σが小さいときに、局所2値化処理部326が背景領域として局所2値化処理することにより、ノイズ混入等によって背景領域を文字領域として誤処理することを防止し、より適切に局所2値化処理を行うことができる。
【0089】
なお、本実施形態では、画像2値化装置1(図1)に標準偏差評価部332を加え、上述の処理を行う場合の例について説明したが、上述の処理を行う画像2値化装置はこれに限らない。例えば、画像2値化装置2(図17)が標準偏差評価部332を具備して上述の処理を行うようにしてもよい。
【0090】
<第4の実施形態>
図21は、本発明の第4に実施形態における画像2値化装置4の概略構成を示す構成図である。同図において、画像2値化装置4は、プレート画像取得部41と、2値化処理部42と、2値化画像出力部14とを備える。2値化処理部42は、色情報評価部433と、仮2値化処理部121と、文字領域候補取得部122と、局所領域サイズ設定部123と、局所領域画像切出部124と、局所領域閾値設定部125と、局所2値化処理部126と、局所2値化画像生成部127と、論理和算出部128とを備える。
同図において、図1の各部に対応して同様の機能を有する部分には同一の符号(121〜128、14)を付して説明を省略する。
【0091】
プレート画像取得部41は、カラーの画像データを取得して色情報評価部433に出力する点で、プレート画像取得部11(図1)と異なる。プレート画像取得部41は、例えば、画像データとして画素毎にRGB(赤、緑、青)それぞれの輝度値を取得し、当該画像データに対してノイズ除去処理を行って色情報評価部433に出力する。
【0092】
色情報評価部433は、文字色を予め記憶しておき、2値化対象画像の各領域を、文字領域と文字以外の領域とに区別する。そして、色情報評価部433は、文字色以外の色の領域の画素値を、予め記憶する背景の画素値(例えば輝度値「赤:255、緑:255、青:255」)に置き換える。以下では、この置き換え処理を「背景化処理」と称する。
例えば、文字色が緑の場合、プレート画像取得部41から出力される画像データの各画素について、緑の輝度値と赤の輝度値と、および、緑の輝度値と青の輝度値とを比較し、赤の輝度値、青の輝度値のいずれかが、緑の輝度値に対して所定の割合(例えば5割)以上である画素の画素値を、文字以外の領域として、背景を示す画素値に置き換える。
そして色情報評価部433は、画素値の置き換え処理の完了した画像をモノクロ画像に変換し、2値化対象画像として仮2値化処理部121に出力する。色情報評価部433は、例えば、画素毎に、赤の輝度値rと、緑の輝度値gと、青の輝度値bとを、式(2)に代入してモノクロ画像における輝度値uを算出することにより、モノクロ画像への変換を行う。
【0093】
【数2】

【0094】
図22は、色情報評価部433が出力する画像の例を示す図である。例えば、プレート画像取得部41から図2の画像がカラー画像で出力され、絵柄D11が赤であり、文字C11〜C16と絵柄D12と絵柄D13とが緑であり、背景B11が白である場合に、色情報評価部433は、予め記憶する文字色に基づいて、文字色と異なる絵柄D11の各画素を背景の画素値とし、さらにモノクロ画像に変換することにより、絵柄D11を含まない、図22のモノクロ画像を生成して仮2値化処理部121に出力する。
【0095】
次に、画像2値化装置4の動作について説明する。
図23は、2値化処理部42が2値化画像を生成する処理手順を示すフローチャートである。
ステップS401において、色情報評価部433は、プレート画像取得部41から出力されるカラー画像において、予め記憶する文字色と異なる色の領域を背景化する処理を行う(ステップS401)。そして、色情報評価部433は、背景化処理の完了した画像をモノクロ画像に変換して仮2値化処理部121に出力する。
ステップS402〜S421は、図16のステップS101〜S121と同様である。
【0096】
以上のように、色情報評価部433が、色情報を用いて、文字色と異なる色の絵柄を除去するので、画像2値化装置4は、より適切な2値化画像を生成し得る。具体的には、文字領域をより抽出し易い2値化画像を生成し得る。
【0097】
なお、本実施形態では、画像2値化装置1(図1)に色情報評価部433を加え、上述の処理を行う場合の例について説明したが、上述の処理を行う画像2値化装置はこれに限らない。例えば、画像2値化装置2(図17)が色情報評価部433を具備して上述の処理を行うようにしてもよい。あるいは、画像2値化装置3(図19)が色情報評価部433を具備して上述の処理を行うようにしてもよい。
【0098】
なお、画像2値化装置1、2、3、または4の全部または一部の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより各部の処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。
また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含むものとする。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよい。
【0099】
以上、本発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計変更等も含まれる。
【符号の説明】
【0100】
1、2、3、4 画像2値化装置
11、41 プレート画像取得部
12、22、32、42 2値化処理部
121 仮2値化処理部
122、222 文字領域候補取得部
123 局所領域サイズ設定部
124、224 局所領域画像切出部
125、225、325 局所領域閾値設定部
126、226、326 局所2値化処理部
127 局所2値化画像生成部
128 論理和算出部
231 局所2値化対象領域決定部
332 標準偏差評価部
433 色情報評価部
14 2値化画像出力部


【特許請求の範囲】
【請求項1】
画像を2値化する画像2値化装置が行う画像2値化方法であって、
2値化対象画像に対して2値化処理を行って第1の2値化画像を生成する第1の2値化画像生成ステップと、
前記第1の2値化画像から文字領域の候補を抽出する文字領域候補取得ステップと、
前記文字領域の候補に含まれる文字線の太さに基づいて単位領域の大きさを設定する単位領域サイズ設定ステップと、
前記2値化対象画像のうち前記単位領域分の部分画像の画素値に基づいて2値化の閾値を設定する2値化閾値設定ステップと、
前記2値化の閾値に基づいて2値化処理を行って局所2値化データを生成する局所2値化処理ステップと、
前記局所2値化データを複数の前記部分画像について合成して第2の2値化画像を生成する第2の2値化画像生成ステップと、
を備えることを特徴とする画像2値化方法。
【請求項2】
前記2値化対象画像に対して2値化処理を行って第3の2値化画像を生成する第3の2値化画像生成ステップと、
前記第2の2値化画像と前記第3の2値化画像との画素値の論理和または論理積を演算して第4の2値化画像を生成する第4の2値化画像生成ステップと、
を備えることを特徴とする請求項1に記載の画像2値化方法。
【請求項3】
前記第1の2値化画像生成ステップは、前記第3の2値化画像生成ステップを兼ね、前記第3の2値化画像として前記第1の2値化画像を使用する、ことを特徴とする請求項2に記載の画像2値化方法。
【請求項4】
前記2値化対象画像のうち前記局所2値化処理ステップで2値化処理を行う領域である局所2値化対象領域を、予め設定される文字領域の大きさの最小値に基づいて決定する局所2値化対象領域決定ステップを備え、
前記局所2値化処理ステップにて、前記局所2値化対象領域に含まれない領域の前記局所2値化データを所定の背景画素値とする、ことを特徴とする請求項1から3のいずれか一項に記載の画像2値化方法。
【請求項5】
前記単位領域サイズ設定ステップにて大きさを設定された前記単位領域分の前記部分画像毎に、該部分画像内の各画素の画素値のばらつき度を示すばらつき度指標を算出するばらつき度指標値算出ステップと、
前記局所2値化処理ステップにて、前記ばらつき度指標値が所定以下のばらつき度を示す前記部分画像に対して前記局所2値化データを所定の背景画素値とする、ことを特徴とする請求項1から4のいずれか一項に記載の画像2値化方法。
【請求項6】
前記2値化対象画像の色情報に基づいて、当該2値化対象画像を文字領域と文字以外領域とに区分する色情報評価ステップを備え、
前記局所2値化処理ステップにて、前記文字以外領域の前記局所2値化データを所定の背景画素値とする、ことを特徴とする請求項1から5のいずれか一項に記載の画像2値化方法。
【請求項7】
2値化対象画像に対して2値化処理を行って第1の2値化画像を生成する第1の2値化画像生成部と、
前記第1の2値化画像から文字領域の候補を抽出する文字領域候補取得部と、
前記文字領域の候補に含まれる文字線の太さに基づいて単位領域の大きさを設定する単位領域サイズ設定部と、
前記2値化対象画像のうち前記単位領域分の部分画像の画素値に基づいて2値化の閾値を設定する2値化閾値設定部と、
前記2値化の閾値に基づいて2値化処理を行って局所2値化データを生成する局所2値化処理部と、
前記局所2値化データを複数の前記部分画像について合成して第2の2値化画像を生成する第2の2値化画像生成部と、
を備えることを特徴とする画像2値化装置。





【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22】
image rotate

【図23】
image rotate


【公開番号】特開2012−155586(P2012−155586A)
【公開日】平成24年8月16日(2012.8.16)
【国際特許分類】
【出願番号】特願2011−15093(P2011−15093)
【出願日】平成23年1月27日(2011.1.27)
【出願人】(000006208)三菱重工業株式会社 (10,378)
【Fターム(参考)】