説明

画像処理装置および画像処理装置の制御方法

【課題】 画像処理装置で読み取った1つの原稿画像から複数のラベル付けされた黒画素の塊が抽出された場合でも、1つの原稿として抽出することができる画像処理装置を提供する。

【解決手段】 読取データを2値化した読取データの黒画素であって、連続している黒画素毎に固有のラベル番号を付与するラベリング手段と、ラベル番号が付与されている黒画素について、そのラベル番号毎の画素数が規定値以下である画素を、ノイズであると判断し、処理対象から除外するノイズ除去手段と、ノイズ除去手段がノイズ除去した後に残っている黒画素のラベル番号の全てを、互いに同一のラベル番号に置換するラベル番号置換手段と、ラベル付けされている黒画素の座標を取得する座標取得手段と、座標取得手段が取得した座標情報に基づいて、原稿領域を抽出する抽出手段とを有する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は画像処理装置およびその制御方法に係り、特に原稿領域を抽出して読み取り、その読み取った画像を保存、または、印刷する画像処理装置に関する。
【背景技術】
【0002】
従来の画像処理装置において、原画像から矩形領域を検出し、切り出すためのアルゴリズムが多く提案されている(たとえば、特許文献1、特許文献2参照)。また、2値化処理とラベリング処理とを実行する画像処理装置が知られている(たとえば、特許文献3参照)。
【特許文献1】特開平8−237537号公報(第15頁、図10)
【特許文献2】特開2004−30430号公報(第17頁、図9)
【特許文献3】特開平3−188587号公報(第5頁、図1および第6頁、図2)
【発明の開示】
【発明が解決しようとする課題】
【0003】
上記特許文献1に記載されている画像処理装置では、輪郭抽出を行い、輪郭が直線を成す部分を探すことによって、矩形領域を探索する。しかし、ノイズの多い環境下では、矩形輪郭の直線部分を検出することが困難であり、4つの直線を関連付けて1個の矩形を検出することが困難であるという問題がある。
【0004】
上記特許文献2に記載されている画像処理装置では、ノイズの多い環境下でも検出精度を向上させるために、2値化した原画像データから、水平方向と垂直方向との黒画素数のヒストグラムを作成し、それを台形近似する。これによって、矩形の存在と傾き方向とを検出する。しかし、原稿領域と背景との境界があいまいである場合(読取装置において、原稿と原稿台の圧板との色差がわずかである場合)には、原稿領域を検出することが困難であるという問題がある。
【0005】
上記特許文献3に記載されている従来技術では、2値化した画像データに対してヒストグラムを生成し、ある規定値以上の大きさの黒画素のみを残す。しかし、1枚の原稿に対して複数のラベル番号の付与されている画素の塊が存在し、ラベル番号毎に原稿領域を切り出す処理である場合、切り出される原稿数が複数になるという問題がある。
【0006】
本発明は、画像処理装置で読み取った1つの原稿画像から複数のラベル付けされた黒画素の塊が抽出されたとしても、1つの原稿として抽出することができる画像処理装置および画像処理装置の制御方法を提供することを目的とするものである。
【課題を解決するための手段】
【0007】
本発明は、原稿領域を抽出する画像処理装置において、原稿を読み取る読取手段と、上記読取手段が取得した読取データを2値化する2値化手段と、上記2値化手段が2値化した読取データの黒画素であって、連続している黒画素毎に固有のラベル番号を付与するラベリング手段と、上記ラベル番号が付与されている黒画素について、そのラベル番号毎の画素数が規定値以下である画素を、ノイズであると判断し、処理対象から除外するノイズ除去手段と、上記ノイズ除去手段がノイズ除去した後に残っている黒画素のラベル番号の全てを、互いに同一のラベル番号に置換するラベル番号置換手段と、ラベル付けされている黒画素の座標を取得する座標取得手段と、上記座標取得手段が取得した座標情報に基づいて、原稿領域を抽出する抽出手段とを有する画像処理装置である。
【発明の効果】
【0008】
本発明によれば、画像処理装置で読み取った1つの原稿画像から複数のラベル付けされた黒画素の塊が抽出されたとしても、1つの原稿として抽出することができるという効果を奏する。
【発明を実施するための最良の形態】
【0009】
発明を実施するための最良の形態は、次の実施例である。
【実施例1】
【0010】
図1は、本発明の実施例1である原画像データ中の原稿領域を検出する画像処理装置10を示すブロック図である。
【0011】
画像処理装置10は、外部インタフェース部1と、入力操作部2と、印刷部3と、読取部4と、表示部5と、制御部6と、汎用記憶部7とを有する。
【0012】
外部インタフェース部1は、ディジタルカメラで撮影した画像データ等を、画像処理装置10に入力するためのインタフェースである。通常、各種メモリカードのスロットや、ディジタルカメラやPCと接続するためのUSBコネクタ等を備えている。ここでは、メモリカード用の物理的な受け口として、PCMCIAスロットを始め、各種メモリカードへの対応も物理的に接続可能な専用スロットを設けている。また、非接触のインタフェースとして、IrDA(赤外線通信)ポート等によるデータ伝送も考えられる。
【0013】
入力操作部2は、ユーザが画像処理装置10の操作を行う部分である。
【0014】
印刷部3は、インクジェット方式のプリンタであり、外部I/F1に接続されているPCやメモリカード等からのデータや読取部4で読み取った画像データを印刷するものである。もちろん、印刷方式等に制限はない。
【0015】
読取部4は、銀塩写真や雑誌等を画像データ(ディジタルデータ)として読み取るためのCCD方式、または、CIS方式のカラースキャナである。
【0016】
表示部5は、読み込んだ画像データや、装置の状態情報や入力操作部2からのユーザによる入力情報等を表示する。
【0017】
制御部6は、画像処理装置10における各制御手順を実行し、各種センサによって画像処理装置10の状態を取得するためのものである。図2に示すような各種制御手順を実行する。
【0018】
汎用記憶部7は、画像処理装置10における各種制御手段を実現するためのプログラム、データ等を納め、制御実行のために必要に応じて作業領域としても使用する。
【0019】
次に、実施例1において、原稿領域を検出する動作について説明する。
【0020】
図2は、実施例1において、原稿領域を検出する動作を示すフローチャートである。
【0021】
S1で、開始し、ユーザからの操作を待ち受けるスタンバイ状態になる。
【0022】
次に、ユーザの操作によって、原稿領域検出が必要である場合、S2へ進み、本来の読取としてユーザが指定している色、解像度ではなく、RGBカラー、75dpiで前読み取りを行う。ここで、解像度を75dpiとしたが、画像処理装置10に使用される読取センサの仕様によって、他の解像度で読み取るようにしてもよい。しかし、原稿領域検出の解析処理の高速化を図るため、本読み取り時の解像度よりも低い解像度で読み取ることが望ましい。
【0023】
図3は、A4サイズの原稿台全面に対して名刺が1枚置かれたものをRGBカラー、75dpiで読み取った画像データを示す図である。
【0024】
次に、S2の前読み取りにおいて、RGBカラー、75dpiで読み取ったデータ(図3)を、S3では、彩度(S)、明度(V)情報を含む色空間であるHSV色空間データへ変換する。ここで、彩度(S)、明度(V)情報を含む色空間として、HSV色空間を示したが、HSV色空間にこだわる必要はなく、彩度(S)、明度(V)情報を含む色空間であれば、いずれの色空間に変換するようにしてもよい。
【0025】
RGB色空間からHSV色空間への変換方式は多様であるが、画像処理装置10においては、色差(H)、彩度(S)および明度(V)への色空間の変換式として、それぞれ下記の式を用いる。
【0026】
【数1】

【0027】
【数2】

V=max(R,G,B)
ただし、上式中のmax(R,G,B)は、各要素値の中の最大値であり、min(R,G,B)は、各要素値の中の最小値である。また、各データ値の値は、0〜255の範囲(整数値)になるように、スケール変換を行う。
【0028】
次に、S4〜S6の処理を並行に実行する。
【0029】
S4では、S3で取得したHSV色空間データの明度成分(V)データを、閾値τによって2値化し、2値データBinary1を得る。明度(V)データが、閾値τよりも小さければ、黒(以下の式で、黒を1と表す)とし、それ以外の場合は、白(以下の式で、白を0と表す)とする。
【0030】
【数3】

S5では、S3で取得したHSV色空間データの明度成分(V)データを、3×3ウィンドウ毎に分割する。
【0031】
図4は、実施例1で使用するフィルタの例を示す図である。
【0032】
そして、図4に示すように、8つのKirschエッジ検出フィルタ301〜308を、それぞれ掛け合わせた値Binary2(ただし、i=1〜8)について、S4と同様に、閾値τによる2値化処理を行う。
【0033】
ちなみに、図4に示すフィルタ301〜308は、それぞれ上、左斜め上、左、左斜め下、下、右斜め下、右、右斜め上方向から、エッジを検出するフィルタ(3×3行列)である。また、各フィルタを掛けて閾値処理を行うことによって得た2値データBinary2(ただし、i=1〜8)を、論理和演算し、重ね合わせることによって、8方向の全てのエッジ情報を含む2値データBinary2を得る。
【0034】
【数4】

ここで、エッジ検出フィルタとして、Kirschフィルタを用いているが、他の代表的なエッジ検出フィルタや、それらを改良したフィルタを用いるようにしてもよい。また、分割ウィンドウサイズを、3×3に限らず、3×3以外のサイズを使用するようにしてもよい。
【0035】
S6では、S3で取得したHSV色空間データの彩度成分(S)データについて、閾値κによって2値化し、2値データBinary3を得る。彩度(S)データが、閾値κよりも小さければ、黒(1)とし、それ以外の場合は、白(0)とする。
【0036】
【数5】

図5は、S7の演算結果である2値化された画像データを示す図である。
【0037】
次に、S7では、S4〜S6で取得した各2値化データBinary1〜Binary3を、論理和演算で重ね合わせることによって、最終的な2値データBinaryとする(図5)。
【0038】
Binary=Binary1∪Binary2∪Binary3
次に、S8では、S7で得た2値データBinaryに対し、黒画素データの膨張処理、収縮処理を連続的に複数回実行することによって、点線として途切れた原稿の端部を修復し、原稿領域を正確に検出できるようにする。ちなみに、S8で行う膨張収縮処理は、膨張処理と収縮処理とを、連続的に複数回実行する処理である。上記「膨張処理」は、2値データBinaryを3×3ウィンドウ毎に分割し、そのウィンドウ内に1つでも黒画素(1)が存在すれば、そのウィンドウの中心画素を黒画素(1)とする膨張処理である。上記「収縮処理」は、2値データBinaryを3×3ウィンドウ毎に分割し、ウィンドウ内に1つでも白画素(0)が存在したら、そのウィンドウの中心画素を白画素(0)とする収縮処理である。
【0039】
ここでは、ウィンドウサイズとして、3×3のサイズを使用したが、他のサイズを使用するようにしてもよい。
【0040】
次に、S9では、最終的に得た2値データについて、その黒画素毎に、ラベル番号を付与する。ラベル番号を付与する際に、近接する黒画素に対しては、同一のラベル番号を付与する。つまり、連続する黒画素(黒画素の塊)毎に、ラベル番号を付与する。
【0041】
次に、S10では、S9で付与されたラベル番号毎に、画素数のヒストグラムを生成し、規定画素数以下のラベル番号の画素グループは、ノイズであると判断し、処理対象から除外する(S11)。
【0042】
図6は、実施例1において、ノイズが除去されたラベル番号ごとのラベル画像を示す図である。図6の丸付き数字はラベル番号の例であるが、ラベル番号1〜11のうち、ノイズとして除去されたラベル画像があるので、図6のラベル番号は途中の番号6と8とが抜けていることを示している。
【0043】
なお、上記「ラベル画像」は、同一のラベル番号が付与されている画素の塊である。
【0044】
次に、ラベル番号とラベル画像とについて説明する。
【0045】
図8は、2値画像データのラベル番号テーブルを説明するための2値画像データの各画素を表示した図である。図8において小さな四角形が1画素を示す。
【0046】
図8には、ABという文字が書かれている。
【0047】
図9は、ラベル番号を管理するラベル管理テーブルを示す図である。
【0048】
「ラベル番号管理テーブル」は、画像データの1画素ごとに、1つの番号記入欄を持ち、各画素の位置と同一位置に対応付けて番号記入欄が設けられている。図9は、文字「A」の部分の2値画像データに、ラベル番号1を付与し、文字「B」の部分の2値画像データに、ラベル番号2を付与していることを示す図である。
【0049】
なお、図9では、番号記入欄の位置が、画素位置と同一位置であることを分かりやすくするために、文字「A」と「B」との画素位置に対応する番号記入欄を、グレーで着色してある(網点表示してある)。図9に示すラベル番号管理テーブルは、汎用記憶部7に記憶され、制御部6によって書き替えられる。
【0050】
S12では、S11のノイズ除去によってノイズが取り除かれた2値データに対し、残ったラベル番号が付与されている黒画素の全てに、同一のラベル番号を付与しなおす。すなわち、S11までの処理が終ったときに残っているラベル番号が付与されている黒画素の塊は、ノイズではなく、原稿の画像の各部分であると推定される部分であるので、これらを1つの原稿として統合する。
【0051】
図10は、結合後のラベル画像の様子を示す図である。
【0052】
図10に示す例では、図9に示すラベル番号2がラベル番号1に書き替えられている。
【0053】
S12で1つの黒画素の塊として認識されている2値データについて、原点から最も近い黒画素であって、ラベル付けされている黒画素の座標と、最も遠い黒画素であって、ラベル付けされている黒画素の座標とをS13で取得する。なお、上記「原点」は、図6上に示す原稿台上の読み取り領域の角に位置する1点である。
【0054】
また、図6における点Aは、原点から最も近い黒画素であって、ラベル付けされている黒画素位置を示す。図6における点Bは、原点から最も遠い黒画素であって、ラベル付けされている黒画素位置を示す。そして、上記取得された2点A、Bを含む矩形領域を、原稿領域であると認識する。
【0055】
なお、上記点A、Bを設定すると、点AとBとを頂点とする矩形の原稿領域の外側に、ラベル付けされた画素がある可能性がある。そこで、ラベル付けされた全ての画素の座標から、横軸方向(図6のX軸方向)の最小値と、縦軸方向(図6のY軸方向)の最小値とを抽出し、それらを持つ座標をA点とするようにしてもよい。これと同様に、横軸方向の最大値と、縦軸方向の最大値とを抽出し、それらを持つ座標をB点とするようにしてもよい。このように、点AとBとを設定し、これら点AとBとを頂点とする領域を、原稿領域であると認識すれば、ラベル付けされた全ての画素が原稿領域に含まれる。
【0056】
ここでは、上記取得した2点は、原点から最も近いラベル付けされた黒画素の座標と最も遠い座標とであると考えている。そして、通常原点の位置に合わせて原稿を置くように指定してあるので、この場合、原稿領域が、原点と、原点から最も遠いラベル付けされている黒画素の座標との2点で求められる領域であると考えてもよい。また、原点の位置が、原稿台上の他の座標であると考えてもよい。
【0057】
S14では、S13で確定された原稿のサイズをチェックし、規定値以下の原稿サイズであれば、ノイズであると判断し、S16で、オペレータへ警告し、処理を中断する。
【0058】
規定値以上の原稿サイズであれば、原稿であると判断し、S15で、確定した領域を原稿として抽出する。
【0059】
図7は、実施例1において、抽出された結果の例を示す図である。
【0060】
上記処理によって、画像処理装置10が読み取った1つの原稿画像から、ラベル付けされた黒画素の塊が、複数抽出されたとしても、1つの原稿として抽出することができる。また、白い原稿のように、原稿の端部が認識しにくい原稿であっても、抽出された黒画素の塊を統合するので、抽出率を向上させることができる。また、最終的に確定した原稿領域サイズを確認するので、ノイズを原稿として誤検出することを防止することができる。
【0061】
上記実施例によれば、画像処理装置10が読み取った1つの原稿画像から、ラベル付けされた黒画素の塊が複数抽出されたとしても、1つの原稿として抽出することができる。
【0062】
また、上記実施例によれば、白い原稿のように、原稿の端部が認識しにくい原稿であっても、抽出された黒画素の塊を統合するので、抽出率を向上させることができる。
【図面の簡単な説明】
【0063】
【図1】本発明の実施例1である原画像データ中の原稿領域を検出する画像処理装置10を示すブロック図である。
【図2】実施例1において、原稿領域を検出する動作を示すフローチャートである。
【図3】A4サイズの原稿台全面に対して名刺が1枚置かれたものをRGBカラー、75dpiで読み取った画像データを示す図である。
【図4】実施例1で使用するフィルタの例を示す図である。
【図5】S7の演算結果である2値化された画像データを示す図である。
【図6】実施例1において、ノイズが除去されたラベル番号ごとのラベル画像を示す。
【図7】実施例1において、抽出された結果の例を示す図である。
【図8】2値画像データを説明する図である。
【図9】ラベル番号管理テーブルを説明する図である。
【図10】結合後のラベル画像の様子を示す図である。
【符号の説明】
【0064】
10…画像処理装置、
1…外部I/F、
2…入力操作部、
3…印刷部、
4…読取部、
5…表示部、
6…制御部、
7…汎用記憶部。

【特許請求の範囲】
【請求項1】
原稿領域を抽出する画像処理装置において、
原稿を読み取る読取手段と;
上記読取手段が取得した読取データを2値化する2値化手段と;
上記2値化手段が2値化した読取データの黒画素であって、連続している黒画素毎に固有のラベル番号を付与するラベリング手段と;
上記ラベル番号が付与されている黒画素について、そのラベル番号毎の画素数が規定値以下である画素を、ノイズであると判断し、処理対象から除外するノイズ除去手段と;
上記ノイズ除去手段がノイズ除去した後に残っている黒画素のラベル番号の全てを、互いに同一のラベル番号に置換するラベル番号置換手段と;
ラベル付けされている黒画素の座標を取得する座標取得手段と;
上記座標取得手段が取得した座標情報に基づいて、原稿領域を抽出する抽出手段と;
を有することを特徴とする画像処理装置。
【請求項2】
請求項1において、
上記座標取得手段が取得した座標情報は、原点から最も近い位置にあるラベル付けされている黒画素と、原点から最も遠い位置にあるラベル付けされている黒画素との2点の座標情報であり、
上記抽出手段は、上記座標取得手段が取得した上記2点の座標を含む矩形領域が、原稿領域であるとして抽出する手段であることを特徴とする画像処理装置。
【請求項3】
請求項1において、
上記座標取得手段が取得した座標情報は、原点の座標情報と、原点から最も遠い位置にあるラベル付けされている黒画素の座標情報とであり、
上記抽出手段は、上記座標取得手段が取得した1点の座標と原点とを含む矩形領域を、原稿領域として抽出する手段であることを特徴とする画像処理装置。
【請求項4】
請求項1において、
上記座標取得手段が取得した座標情報は、ラベル付けされている全ての黒画素の座標情報から、縦軸方向および縦軸方向の最小値を抽出した値を持つ点と、縦軸方向および縦軸方向の最大値を抽出した値を持つ点との2点の座標情報であり、
上記抽出手段は、上記座標取得手段が取得した2点の座標を含む矩形領域を、原稿領域として抽出する手段であることを特徴とする画像処理装置。
【請求項5】
請求項1〜請求項4のいずれか1項において、
抽出された原稿領域サイズが、規定値以下であれば、原稿なしであると判断する原稿判定手段を有することを特徴とする画像処理装置。
【請求項6】
請求項1〜請求項5のいずれか1項において、
上記原稿判定手段が原稿なしと判断した場合、処理を中断し、その旨をオペレータに通知する通知手段を有することを特徴とする画像処理装置。
【請求項7】
原稿領域を抽出する画像処理装置の制御方法において、
原稿を読み取る読取工程と;
上記読取工程で取得した読取データを2値化する2値化工程と;
上記2値化工程で2値化した読取データの黒画素であって、連続している黒画素毎に固有のラベル番号を付与するラベリング工程と;
上記ラベル番号が付与されている黒画素について、そのラベル番号毎の画素数が規定値以下である画素を、ノイズであると判断し、処理対象から除外するノイズ除去工程と;
上記ノイズ除去工程でノイズ除去した後に残っている黒画素のラベル番号の全てを、互いに同一のラベル番号に置換するラベル番号置換工程と;
ラベル付けされている黒画素の座標を取得する座標取得工程と;
上記座標取得工程で取された座標情報に基づいて、原稿領域を抽出する抽出工程と;
を有することを特徴とする画像処理装置の制御方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate


【公開番号】特開2007−72642(P2007−72642A)
【公開日】平成19年3月22日(2007.3.22)
【国際特許分類】
【出願番号】特願2005−257360(P2005−257360)
【出願日】平成17年9月6日(2005.9.6)
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】