画像処理装置および画像処理装置の制御方法

【課題】画像処理装置で読み取った１つの原稿画像から複数のラベル付けされた黒画素の塊が抽出された場合でも、１つの原稿として抽出することができる画像処理装置を提供する。

【解決手段】読取データを２値化した読取データの黒画素であって、連続している黒画素毎に固有のラベル番号を付与するラベリング手段と、ラベル番号が付与されている黒画素について、そのラベル番号毎の画素数が規定値以下である画素を、ノイズであると判断し、処理対象から除外するノイズ除去手段と、ノイズ除去手段がノイズ除去した後に残っている黒画素のラベル番号の全てを、互いに同一のラベル番号に置換するラベル番号置換手段と、ラベル付けされている黒画素の座標を取得する座標取得手段と、座標取得手段が取得した座標情報に基づいて、原稿領域を抽出する抽出手段とを有する。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は画像処理装置およびその制御方法に係り、特に原稿領域を抽出して読み取り、その読み取った画像を保存、または、印刷する画像処理装置に関する。
【背景技術】
【０００２】
従来の画像処理装置において、原画像から矩形領域を検出し、切り出すためのアルゴリズムが多く提案されている（たとえば、特許文献１、特許文献２参照）。また、２値化処理とラベリング処理とを実行する画像処理装置が知られている（たとえば、特許文献３参照）。
【特許文献１】特開平８−２３７５３７号公報（第１５頁、図１０）
【特許文献２】特開２００４−３０４３０号公報（第１７頁、図９）
【特許文献３】特開平３−１８８５８７号公報（第５頁、図１および第６頁、図２）
【発明の開示】
【発明が解決しようとする課題】
【０００３】
上記特許文献１に記載されている画像処理装置では、輪郭抽出を行い、輪郭が直線を成す部分を探すことによって、矩形領域を探索する。しかし、ノイズの多い環境下では、矩形輪郭の直線部分を検出することが困難であり、４つの直線を関連付けて１個の矩形を検出することが困難であるという問題がある。
【０００４】
上記特許文献２に記載されている画像処理装置では、ノイズの多い環境下でも検出精度を向上させるために、２値化した原画像データから、水平方向と垂直方向との黒画素数のヒストグラムを作成し、それを台形近似する。これによって、矩形の存在と傾き方向とを検出する。しかし、原稿領域と背景との境界があいまいである場合（読取装置において、原稿と原稿台の圧板との色差がわずかである場合）には、原稿領域を検出することが困難であるという問題がある。
【０００５】
上記特許文献３に記載されている従来技術では、２値化した画像データに対してヒストグラムを生成し、ある規定値以上の大きさの黒画素のみを残す。しかし、１枚の原稿に対して複数のラベル番号の付与されている画素の塊が存在し、ラベル番号毎に原稿領域を切り出す処理である場合、切り出される原稿数が複数になるという問題がある。
【０００６】
本発明は、画像処理装置で読み取った１つの原稿画像から複数のラベル付けされた黒画素の塊が抽出されたとしても、１つの原稿として抽出することができる画像処理装置および画像処理装置の制御方法を提供することを目的とするものである。
【課題を解決するための手段】
【０００７】
本発明は、原稿領域を抽出する画像処理装置において、原稿を読み取る読取手段と、上記読取手段が取得した読取データを２値化する２値化手段と、上記２値化手段が２値化した読取データの黒画素であって、連続している黒画素毎に固有のラベル番号を付与するラベリング手段と、上記ラベル番号が付与されている黒画素について、そのラベル番号毎の画素数が規定値以下である画素を、ノイズであると判断し、処理対象から除外するノイズ除去手段と、上記ノイズ除去手段がノイズ除去した後に残っている黒画素のラベル番号の全てを、互いに同一のラベル番号に置換するラベル番号置換手段と、ラベル付けされている黒画素の座標を取得する座標取得手段と、上記座標取得手段が取得した座標情報に基づいて、原稿領域を抽出する抽出手段とを有する画像処理装置である。
【発明の効果】
【０００８】
本発明によれば、画像処理装置で読み取った１つの原稿画像から複数のラベル付けされた黒画素の塊が抽出されたとしても、１つの原稿として抽出することができるという効果を奏する。
【発明を実施するための最良の形態】
【０００９】
発明を実施するための最良の形態は、次の実施例である。
【実施例１】
【００１０】
図１は、本発明の実施例１である原画像データ中の原稿領域を検出する画像処理装置１０を示すブロック図である。
【００１１】
画像処理装置１０は、外部インタフェース部１と、入力操作部２と、印刷部３と、読取部４と、表示部５と、制御部６と、汎用記憶部７とを有する。
【００１２】
外部インタフェース部１は、ディジタルカメラで撮影した画像データ等を、画像処理装置１０に入力するためのインタフェースである。通常、各種メモリカードのスロットや、ディジタルカメラやＰＣと接続するためのＵＳＢコネクタ等を備えている。ここでは、メモリカード用の物理的な受け口として、ＰＣＭＣＩＡスロットを始め、各種メモリカードへの対応も物理的に接続可能な専用スロットを設けている。また、非接触のインタフェースとして、ＩｒＤＡ（赤外線通信）ポート等によるデータ伝送も考えられる。
【００１３】
入力操作部２は、ユーザが画像処理装置１０の操作を行う部分である。
【００１４】
印刷部３は、インクジェット方式のプリンタであり、外部Ｉ／Ｆ１に接続されているＰＣやメモリカード等からのデータや読取部４で読み取った画像データを印刷するものである。もちろん、印刷方式等に制限はない。
【００１５】
読取部４は、銀塩写真や雑誌等を画像データ（ディジタルデータ）として読み取るためのＣＣＤ方式、または、ＣＩＳ方式のカラースキャナである。
【００１６】
表示部５は、読み込んだ画像データや、装置の状態情報や入力操作部２からのユーザによる入力情報等を表示する。
【００１７】
制御部６は、画像処理装置１０における各制御手順を実行し、各種センサによって画像処理装置１０の状態を取得するためのものである。図２に示すような各種制御手順を実行する。
【００１８】
汎用記憶部７は、画像処理装置１０における各種制御手段を実現するためのプログラム、データ等を納め、制御実行のために必要に応じて作業領域としても使用する。
【００１９】
次に、実施例１において、原稿領域を検出する動作について説明する。
【００２０】
図２は、実施例１において、原稿領域を検出する動作を示すフローチャートである。
【００２１】
Ｓ１で、開始し、ユーザからの操作を待ち受けるスタンバイ状態になる。
【００２２】
次に、ユーザの操作によって、原稿領域検出が必要である場合、Ｓ２へ進み、本来の読取としてユーザが指定している色、解像度ではなく、ＲＧＢカラー、７５ｄｐｉで前読み取りを行う。ここで、解像度を７５ｄｐｉとしたが、画像処理装置１０に使用される読取センサの仕様によって、他の解像度で読み取るようにしてもよい。しかし、原稿領域検出の解析処理の高速化を図るため、本読み取り時の解像度よりも低い解像度で読み取ることが望ましい。
【００２３】
図３は、Ａ４サイズの原稿台全面に対して名刺が１枚置かれたものをＲＧＢカラー、７５ｄｐｉで読み取った画像データを示す図である。
【００２４】
次に、Ｓ２の前読み取りにおいて、ＲＧＢカラー、７５ｄｐｉで読み取ったデータ（図３）を、Ｓ３では、彩度（Ｓ）、明度（Ｖ）情報を含む色空間であるＨＳＶ色空間データへ変換する。ここで、彩度（Ｓ）、明度（Ｖ）情報を含む色空間として、ＨＳＶ色空間を示したが、ＨＳＶ色空間にこだわる必要はなく、彩度（Ｓ）、明度（Ｖ）情報を含む色空間であれば、いずれの色空間に変換するようにしてもよい。
【００２５】
ＲＧＢ色空間からＨＳＶ色空間への変換方式は多様であるが、画像処理装置１０においては、色差（Ｈ）、彩度（Ｓ）および明度（Ｖ）への色空間の変換式として、それぞれ下記の式を用いる。
【００２６】
【数１】

【００２７】
【数２】

Ｖ＝ｍａｘ（Ｒ，Ｇ，Ｂ）
ただし、上式中のｍａｘ（Ｒ，Ｇ，Ｂ）は、各要素値の中の最大値であり、ｍｉｎ（Ｒ，Ｇ，Ｂ）は、各要素値の中の最小値である。また、各データ値の値は、０〜２５５の範囲（整数値）になるように、スケール変換を行う。
【００２８】
次に、Ｓ４〜Ｓ６の処理を並行に実行する。
【００２９】
Ｓ４では、Ｓ３で取得したＨＳＶ色空間データの明度成分（Ｖ）データを、閾値τによって２値化し、２値データＢｉｎａｒｙ１を得る。明度（Ｖ）データが、閾値τよりも小さければ、黒（以下の式で、黒を１と表す）とし、それ以外の場合は、白（以下の式で、白を０と表す）とする。
【００３０】
【数３】

Ｓ５では、Ｓ３で取得したＨＳＶ色空間データの明度成分（Ｖ）データを、３×３ウィンドウ毎に分割する。
【００３１】
図４は、実施例１で使用するフィルタの例を示す図である。
【００３２】
そして、図４に示すように、８つのＫｉｒｓｃｈエッジ検出フィルタ３０１〜３０８を、それぞれ掛け合わせた値Ｂｉｎａｒｙ２_ｉ（ただし、ｉ＝１〜８）について、Ｓ４と同様に、閾値τによる２値化処理を行う。
【００３３】
ちなみに、図４に示すフィルタ３０１〜３０８は、それぞれ上、左斜め上、左、左斜め下、下、右斜め下、右、右斜め上方向から、エッジを検出するフィルタ（３×３行列）である。また、各フィルタを掛けて閾値処理を行うことによって得た２値データＢｉｎａｒｙ２_ｉ（ただし、ｉ＝１〜８）を、論理和演算し、重ね合わせることによって、８方向の全てのエッジ情報を含む２値データＢｉｎａｒｙ２を得る。
【００３４】
【数４】

ここで、エッジ検出フィルタとして、Ｋｉｒｓｃｈフィルタを用いているが、他の代表的なエッジ検出フィルタや、それらを改良したフィルタを用いるようにしてもよい。また、分割ウィンドウサイズを、３×３に限らず、３×３以外のサイズを使用するようにしてもよい。
【００３５】
Ｓ６では、Ｓ３で取得したＨＳＶ色空間データの彩度成分（Ｓ）データについて、閾値κによって２値化し、２値データＢｉｎａｒｙ３を得る。彩度（Ｓ）データが、閾値κよりも小さければ、黒（１）とし、それ以外の場合は、白（０）とする。
【００３６】
【数５】

図５は、Ｓ７の演算結果である２値化された画像データを示す図である。
【００３７】
次に、Ｓ７では、Ｓ４〜Ｓ６で取得した各２値化データＢｉｎａｒｙ１〜Ｂｉｎａｒｙ３を、論理和演算で重ね合わせることによって、最終的な２値データＢｉｎａｒｙとする（図５）。
【００３８】
Ｂｉｎａｒｙ＝Ｂｉｎａｒｙ１∪Ｂｉｎａｒｙ２∪Ｂｉｎａｒｙ３
次に、Ｓ８では、Ｓ７で得た２値データＢｉｎａｒｙに対し、黒画素データの膨張処理、収縮処理を連続的に複数回実行することによって、点線として途切れた原稿の端部を修復し、原稿領域を正確に検出できるようにする。ちなみに、Ｓ８で行う膨張収縮処理は、膨張処理と収縮処理とを、連続的に複数回実行する処理である。上記「膨張処理」は、２値データＢｉｎａｒｙを３×３ウィンドウ毎に分割し、そのウィンドウ内に１つでも黒画素（１）が存在すれば、そのウィンドウの中心画素を黒画素（１）とする膨張処理である。上記「収縮処理」は、２値データＢｉｎａｒｙを３×３ウィンドウ毎に分割し、ウィンドウ内に１つでも白画素（０）が存在したら、そのウィンドウの中心画素を白画素（０）とする収縮処理である。
【００３９】
ここでは、ウィンドウサイズとして、３×３のサイズを使用したが、他のサイズを使用するようにしてもよい。
【００４０】
次に、Ｓ９では、最終的に得た２値データについて、その黒画素毎に、ラベル番号を付与する。ラベル番号を付与する際に、近接する黒画素に対しては、同一のラベル番号を付与する。つまり、連続する黒画素（黒画素の塊）毎に、ラベル番号を付与する。
【００４１】
次に、Ｓ１０では、Ｓ９で付与されたラベル番号毎に、画素数のヒストグラムを生成し、規定画素数以下のラベル番号の画素グループは、ノイズであると判断し、処理対象から除外する（Ｓ１１）。
【００４２】
図６は、実施例１において、ノイズが除去されたラベル番号ごとのラベル画像を示す図である。図６の丸付き数字はラベル番号の例であるが、ラベル番号１〜１１のうち、ノイズとして除去されたラベル画像があるので、図６のラベル番号は途中の番号６と８とが抜けていることを示している。
【００４３】
なお、上記「ラベル画像」は、同一のラベル番号が付与されている画素の塊である。
【００４４】
次に、ラベル番号とラベル画像とについて説明する。
【００４５】
図８は、２値画像データのラベル番号テーブルを説明するための２値画像データの各画素を表示した図である。図８において小さな四角形が１画素を示す。
【００４６】
図８には、ＡＢという文字が書かれている。
【００４７】
図９は、ラベル番号を管理するラベル管理テーブルを示す図である。
【００４８】
「ラベル番号管理テーブル」は、画像データの１画素ごとに、１つの番号記入欄を持ち、各画素の位置と同一位置に対応付けて番号記入欄が設けられている。図９は、文字「Ａ」の部分の２値画像データに、ラベル番号１を付与し、文字「Ｂ」の部分の２値画像データに、ラベル番号２を付与していることを示す図である。
【００４９】
なお、図９では、番号記入欄の位置が、画素位置と同一位置であることを分かりやすくするために、文字「Ａ」と「Ｂ」との画素位置に対応する番号記入欄を、グレーで着色してある（網点表示してある）。図９に示すラベル番号管理テーブルは、汎用記憶部７に記憶され、制御部６によって書き替えられる。
【００５０】
Ｓ１２では、Ｓ１１のノイズ除去によってノイズが取り除かれた２値データに対し、残ったラベル番号が付与されている黒画素の全てに、同一のラベル番号を付与しなおす。すなわち、Ｓ１１までの処理が終ったときに残っているラベル番号が付与されている黒画素の塊は、ノイズではなく、原稿の画像の各部分であると推定される部分であるので、これらを１つの原稿として統合する。
【００５１】
図１０は、結合後のラベル画像の様子を示す図である。
【００５２】
図１０に示す例では、図９に示すラベル番号２がラベル番号１に書き替えられている。
【００５３】
Ｓ１２で１つの黒画素の塊として認識されている２値データについて、原点から最も近い黒画素であって、ラベル付けされている黒画素の座標と、最も遠い黒画素であって、ラベル付けされている黒画素の座標とをＳ１３で取得する。なお、上記「原点」は、図６上に示す原稿台上の読み取り領域の角に位置する１点である。
【００５４】
また、図６における点Ａは、原点から最も近い黒画素であって、ラベル付けされている黒画素位置を示す。図６における点Ｂは、原点から最も遠い黒画素であって、ラベル付けされている黒画素位置を示す。そして、上記取得された２点Ａ、Ｂを含む矩形領域を、原稿領域であると認識する。
【００５５】
なお、上記点Ａ、Ｂを設定すると、点ＡとＢとを頂点とする矩形の原稿領域の外側に、ラベル付けされた画素がある可能性がある。そこで、ラベル付けされた全ての画素の座標から、横軸方向（図６のＸ軸方向）の最小値と、縦軸方向（図６のＹ軸方向）の最小値とを抽出し、それらを持つ座標をＡ点とするようにしてもよい。これと同様に、横軸方向の最大値と、縦軸方向の最大値とを抽出し、それらを持つ座標をＢ点とするようにしてもよい。このように、点ＡとＢとを設定し、これら点ＡとＢとを頂点とする領域を、原稿領域であると認識すれば、ラベル付けされた全ての画素が原稿領域に含まれる。
【００５６】
ここでは、上記取得した２点は、原点から最も近いラベル付けされた黒画素の座標と最も遠い座標とであると考えている。そして、通常原点の位置に合わせて原稿を置くように指定してあるので、この場合、原稿領域が、原点と、原点から最も遠いラベル付けされている黒画素の座標との２点で求められる領域であると考えてもよい。また、原点の位置が、原稿台上の他の座標であると考えてもよい。
【００５７】
Ｓ１４では、Ｓ１３で確定された原稿のサイズをチェックし、規定値以下の原稿サイズであれば、ノイズであると判断し、Ｓ１６で、オペレータへ警告し、処理を中断する。
【００５８】
規定値以上の原稿サイズであれば、原稿であると判断し、Ｓ１５で、確定した領域を原稿として抽出する。
【００５９】
図７は、実施例１において、抽出された結果の例を示す図である。
【００６０】
上記処理によって、画像処理装置１０が読み取った１つの原稿画像から、ラベル付けされた黒画素の塊が、複数抽出されたとしても、１つの原稿として抽出することができる。また、白い原稿のように、原稿の端部が認識しにくい原稿であっても、抽出された黒画素の塊を統合するので、抽出率を向上させることができる。また、最終的に確定した原稿領域サイズを確認するので、ノイズを原稿として誤検出することを防止することができる。
【００６１】
上記実施例によれば、画像処理装置１０が読み取った１つの原稿画像から、ラベル付けされた黒画素の塊が複数抽出されたとしても、１つの原稿として抽出することができる。
【００６２】
また、上記実施例によれば、白い原稿のように、原稿の端部が認識しにくい原稿であっても、抽出された黒画素の塊を統合するので、抽出率を向上させることができる。
【図面の簡単な説明】
【００６３】
【図１】本発明の実施例１である原画像データ中の原稿領域を検出する画像処理装置１０を示すブロック図である。
【図２】実施例１において、原稿領域を検出する動作を示すフローチャートである。
【図３】Ａ４サイズの原稿台全面に対して名刺が１枚置かれたものをＲＧＢカラー、７５ｄｐｉで読み取った画像データを示す図である。
【図４】実施例１で使用するフィルタの例を示す図である。
【図５】Ｓ７の演算結果である２値化された画像データを示す図である。
【図６】実施例１において、ノイズが除去されたラベル番号ごとのラベル画像を示す。
【図７】実施例１において、抽出された結果の例を示す図である。
【図８】２値画像データを説明する図である。
【図９】ラベル番号管理テーブルを説明する図である。
【図１０】結合後のラベル画像の様子を示す図である。
【符号の説明】
【００６４】
１０…画像処理装置、
１…外部Ｉ／Ｆ、
２…入力操作部、
３…印刷部、
４…読取部、
５…表示部、
６…制御部、
７…汎用記憶部。

【特許請求の範囲】
【請求項１】
原稿領域を抽出する画像処理装置において、
原稿を読み取る読取手段と；
上記読取手段が取得した読取データを２値化する２値化手段と；
上記２値化手段が２値化した読取データの黒画素であって、連続している黒画素毎に固有のラベル番号を付与するラベリング手段と；
上記ラベル番号が付与されている黒画素について、そのラベル番号毎の画素数が規定値以下である画素を、ノイズであると判断し、処理対象から除外するノイズ除去手段と；
上記ノイズ除去手段がノイズ除去した後に残っている黒画素のラベル番号の全てを、互いに同一のラベル番号に置換するラベル番号置換手段と；
ラベル付けされている黒画素の座標を取得する座標取得手段と；
上記座標取得手段が取得した座標情報に基づいて、原稿領域を抽出する抽出手段と；
を有することを特徴とする画像処理装置。
【請求項２】
請求項１において、
上記座標取得手段が取得した座標情報は、原点から最も近い位置にあるラベル付けされている黒画素と、原点から最も遠い位置にあるラベル付けされている黒画素との２点の座標情報であり、
上記抽出手段は、上記座標取得手段が取得した上記２点の座標を含む矩形領域が、原稿領域であるとして抽出する手段であることを特徴とする画像処理装置。
【請求項３】
請求項１において、
上記座標取得手段が取得した座標情報は、原点の座標情報と、原点から最も遠い位置にあるラベル付けされている黒画素の座標情報とであり、
上記抽出手段は、上記座標取得手段が取得した１点の座標と原点とを含む矩形領域を、原稿領域として抽出する手段であることを特徴とする画像処理装置。
【請求項４】
請求項１において、
上記座標取得手段が取得した座標情報は、ラベル付けされている全ての黒画素の座標情報から、縦軸方向および縦軸方向の最小値を抽出した値を持つ点と、縦軸方向および縦軸方向の最大値を抽出した値を持つ点との２点の座標情報であり、
上記抽出手段は、上記座標取得手段が取得した２点の座標を含む矩形領域を、原稿領域として抽出する手段であることを特徴とする画像処理装置。
【請求項５】
請求項１〜請求項４のいずれか１項において、
抽出された原稿領域サイズが、規定値以下であれば、原稿なしであると判断する原稿判定手段を有することを特徴とする画像処理装置。
【請求項６】
請求項１〜請求項５のいずれか１項において、
上記原稿判定手段が原稿なしと判断した場合、処理を中断し、その旨をオペレータに通知する通知手段を有することを特徴とする画像処理装置。
【請求項７】
原稿領域を抽出する画像処理装置の制御方法において、
原稿を読み取る読取工程と；
上記読取工程で取得した読取データを２値化する２値化工程と；
上記２値化工程で２値化した読取データの黒画素であって、連続している黒画素毎に固有のラベル番号を付与するラベリング工程と；
上記ラベル番号が付与されている黒画素について、そのラベル番号毎の画素数が規定値以下である画素を、ノイズであると判断し、処理対象から除外するノイズ除去工程と；
上記ノイズ除去工程でノイズ除去した後に残っている黒画素のラベル番号の全てを、互いに同一のラベル番号に置換するラベル番号置換工程と；
ラベル付けされている黒画素の座標を取得する座標取得工程と；
上記座標取得工程で取された座標情報に基づいて、原稿領域を抽出する抽出工程と；
を有することを特徴とする画像処理装置の制御方法。

【図１】