画像形成装置及び画像処理方法

【課題】入力文書画像に依存する像域識別処理時間の増加を低減し、出力画像の画質劣化の危険性を軽減することのできる画像形成装置を提供する。
【解決手段】原稿から画像情報を取得して入力画像を生成する画像入力手段１０１と、入力画像に第１の像域識別処理を行って画像の属性を示す第１の識別信号を出力する第１の識別手段１０２と、第１の識別信号を入力し、第１の像域識別処理に続く第２の像域識別処理を行って第２の識別信号を出力する第２の識別手段１０４と、第１の識別信号を入力し、第２の識別手段を実行すべきか否かを示す判断信号を出力する判断手段１０３と、判断信号が実行すべきではないと示している場合には第２の像域識別処理を行わずに第１の識別信号を第３の識別信号として選択し、判断信号が実行すべきと示す場合には、第２の識別信号を第３の識別信号として選択する選択手段と、入力画像と第３の識別信号とを入力して前記第２の像域識別処理を行わずに画像処理を実行する画像処理手段１０５とを備える画像形成装置である。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、画像形成装置及び画像処理方法に関し、特に、文書画像に像域識別処理を施して画像形成するための技術に関する。
【背景技術】
【０００２】
文書画像に像域識別処理を行い、その識別結果に基づいて適用する画像処理を切り替えて画像形成する技術が知られている。特に最近では画質を保ったままデータ量を削減することを目的に、文字と写真とを分離し、文字は解像性を重視し、写真は階調性を重視してそれぞれに適した画像処理・圧縮処理を施して電子ファイル化する技術がある。
【０００３】
例えば、特許文献１に記載の技術では、処理対象となった画像データにレイアウト解析処理を適用し、その結果に基づいて文字部分の画像要素を特定し、文字部分として特定された画像要素と、それ以外の部分とについて、互いに異なる圧縮方法で圧縮処理を行うことで文字の可読性を保ったまま高圧縮な画像ファイル（高圧縮ＰＤＦ）を得ている。
【０００４】
また、前述した像域識別処理については特許文献２及び特許文献３に開示された技術が知られている。
特許文献２に記載の技術では、処理対象を２値化した後、その黒画素群の連結成分の外接矩形のサイズのみに基づいて黒画素が文字か否かを判断する。
特許文献３に記載の技術では、ある特定画素群の外接矩形の集合のサイズや並び方に基づいて文字列、文字列領域を抽出する。
【発明の概要】
【発明が解決しようとする課題】
【０００５】
特許文献２に記載の技術では、誤識別が起こりにくく、また、高速に処理することができるが、写真中の文字が抽出できないなど適用できる対象が狭い。そのため、この識別結果を利用して前述の高圧縮な画像ファイルを形成した場合、黒文字以外の文字では文字がぼやけて可読性が悪化し、また、高い圧縮効果を得ることが難しいという問題点がある。
【０００６】
一方、特許文献３に記載の技術では、前者と比較して多様な文字を抽出することが可能である。しかし、網点下地を多く含んでいる文書画像、あるいは、複雑な構成である文書画像が入力された場合、その外接矩形の数が膨大となりレイアウト解析処理に非常に大きな時間を要することがある。また、レイアウト解析処理で誤識別を起こす危険性も高くなる。大きな処理時間を要する点に関しては、所定の処理時間内でのみ識別処理を実施し、処理時間を超過した場合は識別処理を実施しないという退避方法も考えられるが、結果としてユーザが望む画像を形成することができない。
【０００７】
本発明は斯かる事情に鑑みてなされたものであって、入力文書画像に依存する像域識別処理時間の増加を低減するとともに、出力画像の画質劣化の危険性を軽減して、ユーザの期待に近い出力画像を得ることのできる画像形成装置及び画像処理方法を提供することを目的とする。
【課題を解決するための手段】
【０００８】
上記課題を解決するための本発明は、紙原稿を含む原稿から画像情報を取得して入力画像を生成する画像入力手段と、入力画像に対して第１の像域識別処理を行って画像の属性を示す第１の識別信号を出力する第１の識別手段と、前記第１の識別信号を入力し、前記第１の像域識別処理に続く第２の像域識別処理を行って画像の属性を示す第２の識別信号を出力する第２の識別手段と、前記第１の識別信号を入力し、前記第２の識別手段を実行すべきか否かを示す判断信号を出力する判断手段と、前記判断信号が実行すべきではないと示している場合には前記第１の識別信号を第３の識別信号として選択し、前記判断信号が実行すべきと示す場合には、前記第２の識別信号を前記第３の識別信号として選択する選択手段と、前記入力画像と前記第３の識別信号とを入力して画像処理を実行する画像処理手段とを備える画像形成装置である。
【０００９】
また本発明は、紙原稿を含む原稿から画像情報を取得して入力画像を生成する画像入力手段と、入力画像に対して第１の像域識別処理を行って画像の属性を示す第１の識別信号を出力する第１の識別手段と、前記第１の識別信号を入力し、前記第１の像域識別処理に続く第２の像域識別処理の前処理を行って前処理信号を出力する前処理手段と、前処理信号を入力し、前記第２の像域識別処理を行って画像の属性を示す第２の識別信号を出力する第２の識別手段と、前処理信号を入力し、前記第２の識別手段を実行すべきか否かを示す判断信号を出力する判断手段と、前記判断信号が実行すべきではないと示している場合には前記第１の識別信号を第３の識別信号として選択し、前記判断信号が実行すべきと示す場合には、前記第２の識別信号を前記第３の識別信号として選択する選択手段と、前記入力画像と前記第３の識別信号とを入力して画像処理を実行する画像処理手段とを備える画像形成装置である。
【００１０】
また本発明は、紙原稿を含む原稿から画像情報を取得して入力画像を生成する画像入力手段と、入力画像に対して第１の像域識別処理を行って画像の属性を示す第１の識別信号を出力する第１の識別手段と、前記第１の識別信号を入力し、前記第１の像域識別処理に続く第２の像域識別処理を行って画像の属性を示す第２の識別信号を出力する第２の識別手段と、前記第１の識別信号を入力し、前記第２の識別手段を実行すべきか否かを示す判断信号を出力する判断手段と、前記判断信号が実行すべきではないと示している場合は、前記入力画像と前記第１の識別信号とを入力して画像処理を実行する第１の画像処理手段と、前記判断信号が実行すべきと示している場合は、前記入力画像と前記第２の識別信号とを入力して画像処理を実行する第２の画像処理手段とを備える画像形成装置である。
【００１１】
また本発明は、紙原稿を含む原稿から画像情報を取得して入力画像を生成し、前記入力画像に対して第１の像域識別処理を行って画像の属性を示す第１の識別信号を生成し、前記第１の識別信号に、前記第１の像域識別処理に続く第２の像域識別処理を行って画像の属性を示す第２の識別信号を生成し、前記第１の識別信号から前記第２の識別手段を実行すべきか否かを示す判断信号を生成し、前記判断信号が実行すべきではないと示している場合には前記第２の像域識別処理を行わずに前記第１の識別信号を第３の識別信号として選択し、前記判断信号が実行すべきと示す場合には、前記第２の識別信号を前記第３の識別信号として選択し、前記入力画像と前記第３の識別信号とに前記第２の像域識別処理を行わずに画像処理を実行する画像処理方法である。
【発明の効果】
【００１２】
本発明の画像形成装置及び画像処理方法によれば、入力文書画像に依存する像域識別処理時間の増加を低減するとともに、出力画像の画質劣化の危険性を軽減して、ユーザの期待に近い出力画像を得ることができる。
【図面の簡単な説明】
【００１３】
【図１】第１の実施の形態の画像形成装置の構成を示す図。
【図２】第１の実施の形態の画像形成装置の概略の処理手順を示すフローチャート。
【図３】第１の実施の形態の出力ファイルのデータ形式を示す図。
【図４】従来の画像形成装置を示す図。
【図５】ラベリング処理を説明する図。
【図６】エッジ画像の連結成分の外接矩形と文字成分を例示する図。
【図７】画像処理手段の一構成例を示すブロック図。
【図８】第２の実施の形態の画像形成装置の構成を示す図。
【図９】第２の実施の形態の画像形成装置の概略の処理手順を示すフローチャート。
【図１０】第３の実施の形態の画像形成装置の構成を示す図。
【図１１】第３の実施の形態の画像形成装置の概略の処理手順を示すフローチャート。
【図１２】第３の実施の形態の第１の画像処理手段で生成されるＰＤＦファイルのデータ形式を説明する図。
【図１３】第１の画像処理手段の一構成例を示すブロック図。
【図１４】ＭＲＣ形式と他の形式との画像のデータサイズを比較して示す図。
【図１５】文字色検出手段の動作例を示す図。
【図１６】射影像の計算方法を説明する図。
【図１７】第１及び第２の識別手段の機能を分類して示す図。
【発明を実施するための形態】
【００１４】
[第１の実施の形態]
図１は、第１の実施の形態の画像形成装置の構成を示す図であり、図２は、第１の実施の形態の画像形成装置の概略の処理手順を示すフローチャートである。図１及び図２を参照しつつ画像形成装置の構成と動作について説明する。
【００１５】
画像入力手段１０１は、入力された紙原稿を画像信号に変換する、例えば、ＭＦＰのスキャナである。アクト２０１において、画像入力手段１０１は、変換した入力画像信号１１１を出力する。アクト２０２において、第１の識別手段１０２は、入力画像信号１１１を入力してエッジ抽出・黒画素抽出などにより入力画像の比較的狭い範囲の画素を参照して第１の識別処理を実行し、画素属性を示す第１の識別信号１１２を出力する。アクト２０３において、判断手段１０３は、第１の識別信号１１２を入力して入力文書画像の複雑さを判断し、入力文書画像が複雑であるか否かを示す判断信号１１３を出力する。
【００１６】
アクト２０４において、第２の識別手段１０４は、第１の識別信号１１２を入力して第２の識別処理を実行して文字列・文字領域を抽出し、第２の識別信号１１４を出力する。但し、判断信号１１３が“入力文書が複雑である”ことを示している場合には、第２の識別手段は処理を実施せず、“入力文書が複雑ではない（標準的である）”ことを示している場合に、第２の識別手段は処理を実施する。
【００１７】
アクト２０５において、画像処理手段１０５は、入力画像信号１１１と第１の識別信号１１２あるいは第２の識別信号１１４とを入力して画像処理を実施する。ここで、判断信号１１３が“入力文書が複雑である”ことを示している場合には、第１の識別信号１１２が識別信号として入力される。判断信号１１３が、“入力文書が複雑ではない（標準的である）”ことを示している場合には第２の識別信号１１４が識別信号として入力される。
【００１８】
なお、第１の実施の形態における第１の識別手段１０２ならび、第２の識別手段１０４は公知の技術を使用することができる。例えば、特開２０００−２０７２６号公報に記載の文字領域抽出部と同様の処理を使用することができる。
【００１９】
続いて、第１の実施の形態を具体的に説明する。
第１の実施の形態では画像形成装置としてＭＦＰ（多機能複合機）を例として、当該ＭＦＰのスキャン機能として標準的に搭載されている高圧縮ＰＤＦ生成を説明する。
【００２０】
図３は、第１の実施の形態の出力ファイルのデータ形式を示す図である。
一般に高圧縮ＰＤＦと呼ばれる電子ファイルであっても、ファイル内のデータフォーマットは様々である。第１の実施の形態の高圧縮ＰＤＦにおいては、図３に示す入力画像３０１から文字・自然画などのオブジェクトを切り出し、その属性に適した方式で圧縮し結合することで高圧縮を実現する。
【００２１】
即ち、このデータ形式では、１５０ｄｐｉの背景画像３０２の上に、（図では表現できていないが）色毎に分割された３００ｄｐｉの２値の文字画像３０３を重ねて表現する。ここで、文字画像３０３は“０”“１”の２値を有している。文字画像３０３では白画素に当る“０”値の画素は、重ね合わせの下の層にある背景画像３０２を透過して描画し、黒画素に当る“１”値の画素は、別に指定されている色で描画する。文字画像は３００ｄｐｉで表現するためはっきりと表わされ、文字以外の部分は解像度を１５０ｄｐｉに落としているため、ファイルサイズを削減できる。
【００２２】
ここで、比較のために従来の画像形成装置の構成と動作について説明する。図４は、従来の画像形成装置を示す図である。
【００２３】
画像入力手段４０１は、入力画像信号４１１を出力する。識別手段４０２は、入力画像信号４１１に基づいて識別信号４１２を出力する。画像処理手段４０６は、入力画像信号４１１と識別信号４１２とを入力して高圧縮ＰＤＦファイルを生成して出力する。
【００２４】
ここで、識別手段４０２は、エッジ抽出手段４０３、外矩生成手段（ラベリング手段）４０４及び文字列・文字領域抽出処理手段４０５を備えている。
【００２５】
エッジ抽出手段４０３は、入力画像信号４１１を入力して、入力画像中のエッジ画素を抽出したエッジ画像を出力する。エッジ抽出手段としては様々な手法が提案されているが、例えば式（１）に示す変換式で輝度値Ｙを求めた後に、下の行列に示す単純なＳｏｂｅｌフィルタを使用して抽出する。
【００２６】
Ｙ＝０．２５７Ｒ＋０．５０４Ｇ＋０．０９８Ｂ＋１６・・・式（１）
（ここで、Ｒ，Ｇ，Ｂは各画素の信号値）
【数１】

【００２７】
外矩生成手段（ラベリング）４０４は、エッジ抽出手段４０３より出力されたエッジ画像を入力して、エッジ画素の連結成分の外接矩形を生成した外矩画像を出力する。外接矩形を生成するために、外矩生成手段（ラベリング）４０４は、ラベリング処理を実行する。
【００２８】
図５は、ラベリング処理の一例を説明する図である。なお、ラベリングの手法は様々なものが提案されており、いずれを選択してもよいことはいうまでもない。
入力画像５０１は、“０” “１”の２値画像である。入力画像５０１に対して左上の画素を始点とし、左→右、上→下の順で全画素を走査してラベルを付ける。いま、走査する画素を注目画素とすると、対応する参照画素の状況に応じて注目画素に付けるラベル（数字）を決定する。注目画素と参照画素とを示す例５０２で規定する処理方法では、注目画素（○）が黒画素であった場合、注目画素の左、左上、上、右上の位置にある参照画素（＊）の値に応じて注目画素のラベルが定められる。
【００２９】
例えば、次のようなルールでラベルを付ける。
＊参照画素に黒画素が一つもなかった場合、０から始めて昇順に数値を付番する。
＊参照画素に１種類のラベルがあった場合、参照画素にあるのと同じラベルを付ける。
＊参照画素に２種類以上のラベルがあった場合、参照画素にある中で一番若い番号のラベルを付ける。更に、その異なる番号のラベルが同一ラベルであることを記録しておく。
【００３０】
左上（１行×１列）の画素を注目画素とすると、参照画素は領域外となり黒画素は存在しない。従って、新しいラベル“０”を付ける。次に右側（１行×２列）の画素を注目画素とすると、１行×１列の参照画素が黒画素である。従って、参照画素（１行×１列）にあるのと同じラベル“０”を付ける。
【００３１】
更に右側に進んだ、（１行×３列）の画素と（１行×４列）の画素は白画素である。従って、この注目画素についてはブランクとしてラベルを付与しない。右上（１行×５列）の画素を注目画素とすると、参照画素には黒画素は存在しない。従って、昇順の新しいラベル“１”を付ける。
【００３２】
（４行×４列）の画素を注目画素とすると、注目画素の左側の参照画素は既に“０”のラベルが付いているのに対し、上側の参照画素は“１”のラベルが付いている。従って、注目画素に対しては“０”と“１”のうち若い番号である“０”のラベルを付ける。更に、“０”と“１”が同じラベルであることを記録しておく。
【００３３】
左下（５行×１列）の画素を注目画素とすると、参照画素には黒画素は存在しない。従って、新しいラベルを付ける。この時、ラベル“０”と“１”は既に使用されているので新しいラベル“２”を付ける。
【００３４】
このようにして、１回目の走査が終了した後のラベルの状態をラベリング結果５０３に示す。このラベリング結果５０３をみると、本来同じラベルを持つべき連結成分が“０”というラベルを持った画素と“１”というラベルを持った画素の２つのグループに分けられていることがわかる。
【００３５】
次にラベルの統一処理を実施する。上述のように、左から４番目・上から４番目の画素を注目画素とした時に、“０”と“１”が同一ラベルであることは別に記録されている。このような場合には若い数字にラベルを統一する。すなわちラベリング結果５０３において“１”というラベルが付いた画素は“０”とラベルをつけ直す。この処理結果をラベリング結果５０４に示している。ラベリング結果５０４に示すように、本来一つの連結成分となるべきグループの画素全てが同じラベルになる。
【００３６】
最後に空きラベルの修正処理を実行する。統一処理を行った結果として空きラベルが発生した場合は、ラベルの番号を詰め直す。ラベリング結果５０４の例ではラベル“１”が空き番号になるので“２”以降のラベルの番号を詰める。ラベリング結果５０５は、このようにして最終的に得られるラベリング結果を示している。
【００３７】
同じラベルが付与された画素の（ｘ座標，ｙ座標）の最小値の組、最大値の組がそれぞれ連結成分の外接矩形の左上頂点、右下頂点の（ｘ座標，ｙ座標）となるので、ラベリング処理の結果からエッジ画素の連結成分の外接矩形を生成することができる。
【００３８】
文字列・文字領域抽出処理手段４０５は、外矩生成手段４０４から出力された外矩画像を入力とし、識別信号４１２を出力する。図６は、エッジ画像の連結成分の外接矩形と文字成分を例示する図である。
【００３９】
具体的には、文字列・文字領域抽出処理手段４０５は、エッジ画像の連結成分の外接矩形画像６０１を入力した場合（図中の一点鎖線が外接矩形）、接触・交差・内包している矩形同士を結合し文字成分６０２を生成する。そして、文字列・文字領域抽出処理手段４０５は、このようにして生成された文字成分について
・自身のサイズが極端に大きかったり小さかったりしないか？
・矩形の縦横比は１に近いか（矩形の形状は正方形に近いか）？
・水平方向の近傍の文字成分とサイズが揃っているか？ｙ座標が揃っているか？
・垂直方向の近傍の文字成分とのサイズが揃っているか？ｘ座標が揃っているか？
など文字列らしい特性を持っているかという基準から文字列生成を行うと共に、更に文字列らしさ、文字列の並び方から文字領域であるか否かを判定する。
【００４０】
ここで、文字列・文字領域抽出の過程では、矩形の削除および矩形同士の結合が繰り返して実行される。そのため、処理対象となる文字成分が多い場合には、処理時間が膨大になってしまう。また、文字成分が多いということは、文字と誤識別しやすい網点やノイズも多いため識別精度が悪い可能性が高いことも示している。
【００４１】
画像処理手段４０６について説明する。図７は、画像処理手段の一構成例を示すブロック図である。この画像処理手段４０６は、図３に示したデータ形式の画像ファイルを得るための構成である。
【００４２】
文字画素検出手段７０１は、入力画像信号に基づいて像域識別処理を実行し、識別信号を出力する。即ち、文字画素検出手段７０１は、図４の識別手段４０２に該当するため、その詳細の説明は省略する。
【００４３】
まず背景用の多値画像３０２の作成処理を説明する。文字周囲色検出手段７０２は、文字周囲の色を検出する。検出する方法としては、例えば文字との距離が３画素以内の画素を抽出し、その画素値の平均値を求めて文字周囲色とする。次に文字塗りつぶし手段７０３は、文字画素を検出した文字周囲色に置き換える。これによって文字が周囲の背景色によって塗りつぶされる。最後に画像縮小手段７０４が縮小処理を実行し、その後多値画像圧縮手段７０５がＪＰＥＧなどの多値画像圧縮を実行して背景用画像を作成する。
【００４４】
なお、文字塗りつぶし手段７０３が文字を塗りつぶすのは、ＪＰＥＧに代表される多値画像圧縮は一般に空間周波数の高周波成分が多い画像の圧縮は苦手な傾向があるため、高周波成分を含む文字を消すことによって圧縮率を高めるためである。
【００４５】
次に文字用画像３０３の作成処理を説明する。まず文字色検出手段７０６が各文字画素の文字色を検出する。具体的には、例えば、類似する色の文字画素をグルーピングし、そのグループの文字画素のＲＧＢ平均値を文字色とする。一方、この処理と並行して２値化手段７０７は、文字画素が“１”、非文字画素が“０”となるように２値画像を生成する。
【００４６】
文字色による２値画像分割手段７０８が、生成した２値画像を文字色検出手段７０６がグルーピングした色毎の２値画像に分割する。そして、２値画像圧縮手段７０９が、分割後の２値画像に対してＭＭＲなどの２値画像圧縮を施して文字用画像を作成する。
なお、色毎に文字画素をグルーピングし２値画像を分割する理由は、２値画像であるため、一つの画像では背景と前景（文字）の２色しか表現できないためである。
【００４７】
以上、従来の画像形成装置の構成と動作について説明した。上述のように、従来の画像形成装置では入力文書画像が複雑であった場合、像域識別手段における処理時間が膨大となったり、あるいは、識別精度が不十分なため画質不具合が生じる危険性が高い。
【００４８】
図１に示す第１の実施の形態の画像形成装置は、このような問題点の発生を防止する。第１の実施の形態の画像形成装置の構成と動作を従来の画像形成装置と比較させて、図１と図４とを参照しつつ説明する。
【００４９】
第１の実施の形態の画像形成装置では、従来の画像形成装置の識別手段４０２（図４）を、第１の識別手段１０２（図１）と第２の識別手段１０４（図１）とに分割する。ここで、第１の識別手段１０２（図１）は、従来の画像形成装置のエッジ抽出手段４０３（図４）に相当し、第２の識別手段１０４は、従来の画像形成装置の外矩生成手段４０４（図４）および文字列・文字領域抽出処理手段４０５（図４）に相当する。
【００５０】
第１の実施の形態の画像形成装置では、判断手段１０３（図１）が文書複雑さを判断する。即ち、判断手段１０３（図１）は第１の識別信号１１２（図１）を入力し、文書が複雑であるか否かの判断信号１１３（図１）を出力する。
【００５１】
ここで、文書画像複雑さの判断手段１０３（図１）について説明する。上述のように、第２の識別手段１０４、即ち、従来の画像形成装置の外矩生成手段４０４（図４）および文字列・文字領域抽出処理手段４０５（図４）はエッジ画像の外接矩形数に依存して処理時間が膨大になりあるいは識別精度が悪化する恐れが高くなる。ここで、エッジ画素の外接矩形の数はエッジ画素数にある程度依存すると考えられる。
【００５２】
そこで、判断手段１０３（図１）は、第１の識別手段１０２即ち、従来の画像形成装置のエッジ抽出手段４０３（図４）から出力されるエッジ画像信号を第１の識別信号１１２（図１）として入力とし、そのエッジ画像を走査してエッジ画素数Ｎｅをカウントする。そして、Ｎｅ＞Ｔｈ１であれば入力文書が複雑であることを示す判断信号１１３を出力する。反対にＮｅ＜＝Ｔｈ１であれば、入力文書が複雑ではない（標準的である）ことを示す判断信号１１３を出力する。ここでＴｈ１は予め決めておいた閾値である。
【００５３】
判断信号１１３（図１）が“文書が複雑であること”を示している場合には、第２の識別手段１０４、即ち、従来の画像形成装置の外矩生成手段４０４（図４）および文字列・文字領域抽出処理手段４０５（図４）は動作しない。従って、画像処理手段１０５（図１）は、入力画像信号１１１（図１）と第１の識別信号１１２を入力として高圧縮ＰＤＦを出力する。
【００５４】
反対に判断信号１１３（図１）が“文書が複雑ではない（標準的である）こと”を示している場合には、更に第２の識別手段１０４、即ち、従来の画像形成装置の外矩生成手段４０４（図４）および文字列・文字領域抽出処理手段４０５（図４）が動作する。従って、画像処理手段１０５（図１）は、入力画像信号１１１（図１）と第２の識別信号１１４を入力として高圧縮ＰＤＦを出力する。
【００５５】
以上説明したとおり、第１の実施の形態では、入力文書画像が複雑な場合においても画質不具合や処理時間が膨大となる危険性が少ない高圧縮ＰＤＦファイルを作成することが可能である。
また、第１の実施の形態の文書画像複雑さ判断手段１０３は、第２の識別手段１０４に必要なデータのみを使用しており、新たなデータ入力を必要としていない。従って、処理時間に大きな影響を及ぼさずに判断することができる。更に、入力された文書画像が複雑であった場合には、従来の方式と比較して不必要な信号を生成することなく高圧縮ＰＤＦを作成することが可能である。
【００５６】
[第２の実施の形態]
図８は、第２の実施の形態の画像形成装置の構成を示す図であり、図９は、第２の実施の形態の画像形成装置の概略の処理手順を示すフローチャートである。図８及び図９を参照しつつ画像形成装置の構成と動作について説明する。
なお、第２の実施の形態の画像形成装置は、第２識別の前処理手段８０３を備えている点で第１の実施の形態の画像形成装置と異なっている。
【００５７】
画像入力手段８０１は、入力された紙原稿を画像信号に変換するＭＦＰのスキャナなどである。アクト９０１において、画像入力手段８０１は、変換した入力画像信号８１１を出力する。アクト９０２において、第１の識別手段８０２は、入力画像信号８１１を入力してエッジ抽出・黒画素抽出などにより入力画像の比較的狭い範囲の画素を参照して第１の識別処理を実行し、画素属性を示す第１の識別信号８１２を出力する。アクト９０３において、第２識別の前処理手段８０３は、第１の識別信号８１２を入力して、第２の識別手段の前処理を行い、前処理信号８１３を出力する。
【００５８】
アクト９０４において、判断手段８０４は、前処理信号８１３を入力して入力文書画像の複雑さを判断し、入力文書画像が複雑であるか否かを示す判断信号８１４を出力する。アクト９０５において、第２の識別手段８０５は、前処理信号８１３を入力して文字列・文字領域を抽出し、第２の識別信号８１５を出力する。但し、判断信号８１４が“入力文書が複雑である”ことを示している場合には第２の識別手段８０５は処理を実施せず、“入力文書が複雑ではない（標準的である）”ことを示している場合には第２の識別手段８０５は処理を実施する。
【００５９】
アクト９０６において、画像処理手段８０６は、入力画像信号８１１と第１の識別信号８１２あるいは第２の識別信号８１５とを入力として画像処理を行う。ここで、判断信号８１４が“入力文書が複雑である”ことを示している場合には、第１の識別信号８１２が識別信号として入力される。判断信号８１４が“入力文書が複雑ではない（標準的である）”ことを示している場合には、第２の識別信号８１５が識別信号として入力される。
【００６０】
第２の実施の形態と第１の実施の形態との大きな違いは、第１の実施の形態では、従来の画像形成装置の識別手段４０２（図４）を第１の識別手段１０２（図１）と第２の識別手段１０４（図１）の２つに分割していたのに対し、第２の実施の形態においては第１の識別手段８０２（図８）と第２識別の前処理手段８０３（図８）と第２の識別手段８０５（図８）の３つに分割している点である。
【００６１】
第２の実施の形態の各手段と従来の画像形成装置の処理ブロックとの具体的な対応は以下の通りである。
第２の実施の形態の第１の識別手段８０２は、従来技術のエッジ抽出手段４０３（図４）に対応する。第２の実施の形態の第２識別の前処理手段８０３は、従来技術の外矩生成手段４０４（図４）に対応する。第２の実施の形態の第２の識別手段８０５は、従来技術の文字列・文字領域抽出処理手段４０５（図４）に対応する。
【００６２】
ここで、文書画像複雑さの判断手段８０４（図８）について説明する。上述したように、第２の識別手段８０５に対応する従来技術の文字列・文字領域抽出処理手段４０５（図４）は、エッジ画像の外接矩形数に依存して処理時間が膨大になったり識別精度が悪くなったりする。第１の実施の形態においては、エッジ画素数Ｎｅをカウントし、Ｎｅ＞Ｔｈであるか否かを入力文書が複雑であるか否かの判断基準とした。
【００６３】
第２の実施の形態においては、第２識別の前処理手段８０３は前処理信号８１３として外矩画像を出力するため、判断手段８０４は、文書の複雑さをより表している外矩数ＮｒをカウントしＮｒ＞Ｔｈ２であれば入力文書が複雑であると判断し、入力文書が複雑であることを示す判断信号８１４を出力する。反対にＮｒ＜＝Ｔｈ２であれば、入力文書が複雑ではない（標準的である）ことを示す判断信号８１４を出力する。ここでＴｈ２は予め決めておいた閾値である。
これにより、第１の実施の形態よりさらに正確に文書の複雑さを判断することが可能となる。
【００６４】
以上説明したとおり、第２の実施の形態では、第１の実施の形態よりも正確に入力文書画像の複雑さを判断することが可能であり、入力文書画像が複雑な場合においても画質不具合や処理時間が膨大となる危険性が少ない高圧縮ＰＤＦファイルを作成することが可能である。
【００６５】
また、第２の実施の形態の文書画像複雑さ判断手段８０４は、第２の識別手段８０５に必要なデータのみを使用しており、新たなデータ入力を必要としていない。従って、処理時間に大きな影響を及ぼさずに判断することができる。
【００６６】
[第３の実施の形態]
図１０は、第３の実施の形態の画像形成装置の構成を示す図であり、図１１は、第３の実施の形態の画像形成装置の概略の処理手順を示すフローチャートである。図１０及び図１１を参照しつつ画像形成装置の構成と動作について説明する。
なお、第３の実施の形態と第１の実施の形態との違いは入力文書画像の複雑さにより画像処理手段まで切り替える点であり、第３の実施の形態では、第１の画像処理手段１００５と第２の画像処理手段１００６とを有している。
【００６７】
第３の実施の形態では、アクト１１０３において、複雑さ判断手段１００３により入力画像が複雑であると判断された場合には、アクト１１０６において、第１の識別信号１０１２に基づき第１の画像処理手段１００５によって第１の画像処理が施される。一方、入力画像が複雑ではない（標準的）と判断された場合には、アクト１１０４において、第２の識別手段１００４が、第１の識別信号１０１２に基づき第２の識別信号１０１３を出力する。アクト１１０５において、第２の識別信号１０１３に基づき第２の画像処理手段１００６によって第２の画像処理が施される。
【００６８】
図１２は、第３の実施の形態の第１の画像処理手段１００５で生成されるＰＤＦファイルのデータ形式を説明する図である。
【００６９】
図１２に示すデータ形式（ＭＲＣ）は、マスク画像１２０２、背景用画像１２０３及び文字色用画像１２０４を備えている。マスク画像１２０２は、“０”“１”の２値を持った３００ｄｐｉの画像である。背景用画像１２０３は、入力画像から文字を消去した１５０ｄｐｉの画像である。文字色用画像１２０４は、文字色を特定するための７５ｄｐｉの画像である。
【００７０】
第３の実施の形態ではマスク画像１２０２が黒画素の位置には文字色用画像１２０４を選択し、白画素の位置には背景用画像１２０３を選択して表示する。それにより、文字の形状は３００ｄｐｉのマスク画像に依存するため、文字ははっきりさせたまま文字以外の解像度を落とすことでファイルサイズの削減を実現している。
なお、第３の実施の形態の第２の画像処理手段１００６で作成されるＰＤＦファイルのデータ形式は、第１の実施の形態の画像処理手段１０５（図１）で生成される図３に示すＰＤＦファイルと同じデータ形式とする。
【００７１】
図１３は、第１の画像処理手段１００５の一構成例を示すブロック図である。
【００７２】
文字画素検出手段１３０１は、入力画像信号に基づいて像域識別処理を実行し、識別信号を出力する。即ち、文字画素検出手段１３０１は、図１０の第１の識別手段１００２に該当するため、その詳細の説明は省略する。
【００７３】
まずマスク画像１２０２の作成動作を説明する。２値化手段１３０２は、例えば文字画素を“１”，文字以外の画素を“０”とする２値画像を生成する。２値画像圧縮手段１３０３は、生成した２値画像に対しＭＭＲなどの２値圧縮を施してマスク画像１２０２を作成する。
【００７４】
次に、背景用画像１２０３の作成動作を説明する。文字周囲色検出手段１３０４は、文字周囲の色を検出する。検出する方法としては、例えば文字との距離が３画素以内の画素を抽出し、その画素値の平均値を求めて文字周囲色とする。次に文字塗りつぶし手段１３０５は、文字画素を検出した文字周囲色に置き換える。これによって文字が周囲の背景色によって塗りつぶされる。最後に第１の画像縮小手段１３０６が縮小処理を実行し、その後第１の多値画像圧縮手段７０５がＪＰＥＧなどの多値画像圧縮を実行して背景用画像を作成する。
【００７５】
なお、文字塗りつぶし手段１３０５が文字を塗りつぶすのは、ＪＰＥＧに代表される多値画像圧縮は一般に空間周波数の高周波成分が多い画像の圧縮は苦手な傾向があるためであり、高周波成分を含む文字を消すことによって圧縮率を高めるためである。
【００７６】
次に、文字色用画像１２０４の作成動作を説明する。まず、非文字消去手段１３０８が入力画像から文字以外を消去する。具体的には文字検出手段１３０１で文字として検出されなかった画素を白画素で置き換える。次に文字画素膨張手段１３０９が文字画素を膨張させる。具体的には、色画素の８近傍にある白画素をその色で置き換える処理を、全ての色画素に対して繰り返す。なお、この文字画素膨張処理も背景用画像１２０３と同様に高周波成分をなくすために文字形状を残さないための処理である。そのため、繰り返し回数を大きくすれば処理時間が大きくなるものの圧縮ファイルサイズを小さくできる。
【００７７】
なお、膨張処理をある回数繰り返すとファイルサイズは減少しなくなるが、その回数は入力解像度に依存する。例えば、解像度が低いほど少ない繰り返し回数でファイルサイズの減少は限界となる。文字画素膨張後の画像に対して第２の画像縮小手段１３１０が縮小処理を実行し、その後第２の多値画像圧縮手段１３１１が、多値画像圧縮を実行して文字色用画像１２０４を作成する。
【００７８】
次に、データ形式をＭＲＣ形式にした理由を説明する。
図１２に示すように、第１の画像処理手段１００５により出力されるＭＲＣ形式では背景用の１５０ｄｐｉの多値画像と文字形状用のマスク画像３００ｄｐｉの２値画像および文字色用の７５ｄｐｉの多値画像により構成されている。それに対し、図３に示すように、第２の画像処理手段１００６により出力される形式では背景用の１５０ｄｐｉの多値画像と文字用の３００ｄｐｉの２値画像により構成される。
【００７９】
それぞれを構成する各画像のデータサイズを比較すると、図１４に示す通り、前者（ＭＲＣ形式）と後者の背景用画像は、ほぼ同じデータサイズである。また、前者（ＭＲＣ形式）のマスク画像と後者の文字用画像も、ほぼ同じデータサイズである。そのため、文字色用画像のデータサイズ分、前者（ＭＲＣ形式）の方がファイルサイズが大きくなりやすい。しかし、後者の形式では、ＭＲＣ形式より高精度な処理が要求される。具体的には、後者の形式でのみ必要な文字色検出手段７０６（図７）は高い精度が要求される。
【００８０】
図１５は、文字色検出手段の動作例を示す図である。
図１５の文字画像１５０１は、文字色検出手段７０６に入力される画像の例である。この文字画像１５０１の１行目（アルファベット）、２行目（数字）、３行目（平仮名）は、全て異なる文字色である。
【００８１】
文字色ごとにグルーピングする際に文字画像１５０２に示すように文字色とグループが１対１対応し、かつ、そのグループの色を正しく抽出できれば、文字画像１５０３に示すように、出力電子画像ファイル中の文字画像を入力画像とほぼ同様に表現できる。しかし、例えば文字画像１５０４に示すように第１行目〜第３行目の複数色の文字を誤って一つの文字色グループとしてしまった場合、文字画像１５０５に示すように出力電子画像ファイル中の文字画像はただ１色（本例では３行の平均色のただ１色）で表現されてしまう。
【００８２】
また、文字画像１５０６に示すように一文字一文字でグルーピングしてしまった場合、あるいは文字画像１５０７に示すように文字列中で一文字だけ抽出文字色を間違えてしまった場合には、同一色の文字列の中で異なる色の文字が発生してしまい非常に違和感のある画像を出力する危険性もある。
また、画像データサイズ自体は文字画像１５０３、１５０５、１５０７ともほぼ同じだが、文字画像１５０６のように細かく分割しすぎると、出力の電子画像ファイルを構成するためのオーバーヘッドが大きくなり、この結果ファイルサイズが大きくなることもありうる。
【００８３】
すなわち、入力画像が複雑な場合に第２の画像処理手段１００６を実行すると文字色を間違える危険性が高いため、第３の実施の形態においては第１の画像処理手段１００５にてＭＲＣ形式のＰＤＦファイルを作成するようにしている。
【００８４】
以上で説明したとおり、第３の実施の形態では、入力文書画像が複雑であった場合であっても画質不具合や処理時間が膨大となる危険性が少ない高圧縮ＰＤＦファイルを作成することが可能である。さらに、本第３の実施の形態における文書画像複雑さ判断処理は、像域識別処理に必要なデータのみを使用しており、新たなデータ入力を必要としていない。従って、標準的な画像が入力された場合の処理時間に悪影響を及ぼさずに判断が可能である。
【００８５】
第１〜第３の実施の形態においては、高圧縮ＰＤＦを具体例にして、文書が複雑なために処理時間が膨大となりあるいは画質不良が生じるなどの不具合を防止することのできる画像処理技術について説明した。以下の形態では、高圧縮ＰＤＦ以外への本画像処理技術の適用の例を挙げる
[第４の実施の形態]
第４の実施の形態の画像形成装置は図１に示す画像形成装置と同じ構成をとる。従って、第１の実施の形態の画像形成装置と同じ参照符号を用いて、その構成についての詳細説明は割愛する。なお、本実施形態における画像形成装置は原稿の入力傾きを検知・補正する装置とする。
【００８６】
文書画像には文字が多く含まれるため、画像を決められた角度ステップで回転しながら文字画素をｘ軸へ射影するとその先鋭度から傾き角度を検知することができる。しかし、回転する角度を細かいステップで処理すると、画像を回転する処理は多くの時間を要するため、処理時間が大きくなり、回転する角度を粗いステップで処理すると精度が低下するとのトレードオフが生じる。
一方、表などの線分を多く含む文書画像であれば、その線分を抽出できれば線分の傾き角度を求めるだけで比較的高速に傾き角を検知することが可能である。
【００８７】
次に、図１を参照しつつ画像処理装置の動作を説明する。第１の識別手段１０２は、文字・線分画素の抽出とラベリングを実施する。具体的には第１実施例と同じ手法でエッジ抽出とそのエッジ画素のラベリングを実施する。更に、同一ラベルの画素のｘ座標ｙ座標の最大最小値から連結成分の外接矩形を生成する。更にその外接矩形が下の条件を満たせば、外接矩形の対角線を線分と見なす。
【００８８】
条件１：縦横比がある閾値以上（例えば１００以上）である。
条件２：（Ａ）矩形の右上・左下頂点が黒画素で、かつ、左上・右下頂点が白画素である。または、（Ｂ）左上・右下頂点が黒画素で、かつ、右上・左下頂点が白画素である。
【００８９】
次に判断手段１０３は、線分情報を用いてスキュー（傾き）検知できるか否かを判断する。ここで、文書に使用される線分は水平または垂直であると仮定している。
判断手段１０３は、第１の識別手段において識別された線分の傾き角の平均と分散を求める。それぞれの線分の角度は単純にθ＝ｔａｎ^−１（ｗ／ｈ）として求める。ただし、上記（Ｂ）のパターンの場合は符号を逆転させてθ＝−ｔａｎ^−１（ｗ／ｈ）とする。ここでｗ，ｈはそれぞれ矩形の幅、高さである。このようにして判断手段１０３は、各線分の傾き角度を算出する。そして、その傾き角度の分散値がある閾値未満であれば、線分の傾き角の平均値θを文書全体のスキュー角度として使用できると判断する。
【００９０】
一方、判断手段１０３が、線分の傾き角を使用できないと判断した場合には、第２の識別手段１０４は、文字と見なされる外接矩形を予め決めていた角度ステップで回転させながらｘ軸へ射影し、そのヒストグラム形状から傾き角を検知する。
ここで、文字は正方形に近い形状であることから外接矩形の縦横比がある閾値（例えば２）未満のものを文字と見なす。また、実画像を回転させながらｘ軸への射影を求めると処理時間が膨大になってしまうため、実際は計算により射影を求める。
【００９１】
図１６は、射影像の計算方法を説明する図である。図１６（１）が傾きの無い状態での外接矩形の座標を表している。その左上座標は（ｘ０，ｙ０）、幅・高さは（ｓｘ，ｓｙ）である。図１６（２）は、座標軸を角度θ回転させた状態を表している。その外接矩形のｘ軸への射影は下記式（２）、式（３）で表されるα〜βの範囲となる。
α ＝ｘ０ｃｏｓθ − ｙ０ｓｉｎθ ・・・式（２）
β ＝（ｘ０＋ｓｘ）ｃｏｓθ − （ｙ０＋ｓｙ）ｓｉｎθ ・・・式（３）
この射影を文字と見なされる全ての外接矩形について行い、その射影の長さのヒストグラム形状が最も尖鋭である角度θを文書のスキュー角度と検知する。
【００９２】
続いて、画像処理手段１０５における傾き補正方法について説明する。第１の識別手段または第２の識別手段により求められた原稿傾き角度をθとすると、傾きを補正するためには、原稿を角度θ回転させればよいので、補正後の画素（ｘ’，ｙ’）の画素値は下の式を満たす画素（ｘ，ｙ）の画素値となる。
【数２】

【００９３】
従って、補正後の画素位置（ｘ’，ｙ’）の画素値を得るために参照すべき入力画像の画素位置（ｘ，ｙ）は、上式（４）の両辺に左側から回転行列の逆行列をかけることで下の式（５）で求められる。
【００９４】
ｘ＝ｘ’ｃｏｓθ ＋ｙ’ｓｉｎθ
ｙ＝ −ｘ’ｓｉｎθ ＋ｙ’ｃｏｓθ ・・・式（５）
式（５）で求められた入力画像の座標位置(x, y)は回転角θが９０°の倍数以外のときは整数とならないことが多い。即ち、ピクセル単位の値にならないことが多い。そこで、座標位置(x, y)の周囲のピクセル単位（格子点）の座標位置とその画素値を用いて、例えば式（６）のように入力画像の画素を補間（バイリニア法）しながら回転処理する。これによってジャギーの発生を防ぐ。
【数３】

【００９５】
なお（ｘ_０、ｙ_０）、（ｘ_１、ｙ_１）は座標位置（ｘ，ｙ）の最近傍の左上の格子点と右下の格子点であり、左上を原点としている。
【００９６】
以上説明したように、本実施形態においては、文書中に信頼できる線分がある場合は線分情報を用いてスキュー角度を検知し、信頼できる線分がないと判断した場合にのみ第２の識別手段によってスキュー角を検知する。これにより、処理時間を浪費することなくスキュー補正することが可能となる。
【００９７】
[第５の実施の形態]
第５の実施の形態の画像形成装置は図１０に示す第３の実施の形態の画像形成装置と同じ構成をとる。従って、第３の実施の形態の画像形成装置と同じ参照符号を用いて、その構成についての詳細説明は割愛する。
第５の実施の形態における画像形成装置は図３で説明した高圧縮ＰＤＦファイルを生成するとともに、原稿の向きおよび入力傾きを検知・補正する。なお、本実施形態においてスキュー検知は線分を用いずに文字画素のみを用いる。
【００９８】
現在よく使用されるスキュー検知および文書向き検知は入力文書画像に文字が多数含まれていることを前提とした処理になっている。しかし、文字数が少ない場合にはその検知精度が低くなってしまう。
【００９９】
そこで、第５の実施の形態においては、第３の実施の形態と同様に第１の識別手段１００２（図１０）がエッジ抽出を行い、判断手段１００３がラベリング処理を実行して外接矩形数を計数する。ここで外接矩形数があらかじめ決めておいた閾値（例えば１００）未満の場合、十分なスキュー・文書向きの検知精度が得られないと判断し、第２の識別手段１００４を実行しない。スキュー・文書向き検知を行わないと判断した場合、第１の画像処理手段１００５はスキュー・文書向き補正は行わず、第１の実施の形態で説明した方法により高圧縮ＰＤＦを生成する。
【０１００】
判断手段１００３がスキュー・文書向き検知を行うべきと判断した場合、第２の識別手段１００４がスキュー・文書向きの検知処理を行う。スキュー検知については第４の実施形態と同様の処理を行えばよいので説明は割愛する。文書向き検知はＯＣＲを使用して行う。まず任意の文字列を抽出しその文字列画像に対し０°、９０°、１８０°、２７０°の４方向に画像回転しＯＣＲの類似度を算出する。その類似度が最も高い角度を正しい文書向きと検知する。このように第２の識別手段にて原稿傾きと文書向きを検知した場合、第２の画像処理手段１００６が原稿傾きと文書向きを補正し、高圧縮ＰＤＦ作成を実行する。
【０１０１】
以上説明した各実施の形態の画像形成装置では、像域識別処理を前半の第１の識別処理と後半の第２の識別処理に分割し、入力文書画像に応じて第２の識別手段を実施するか否かを判断する。ここで第１の識別処理は入力文書画像に精度・速度が依存しない処理である。また、第２の識別手段を実施するか否かを判断する判断手段においては第２の識別手段にて使用する信号を入力、あるいは生成しその信号を基に判断する。
【０１０２】
文書の複雑さを判断した結果、簡素な文書である場合には第１の識別手段より出力された第１の識別信号と判断手段より出力された判断信号を基に第２の識別処理を実施し、第２の識別信号を基に画像処理を行う。一方で、文書が複雑であると判断した場合には第２の識別処理は行わず第１の識別信号を用いて画像処理を行う。
【０１０３】
なお、第１の識別手段と第２の識別手段が備える機能は上述の入力文書画像に精度・速度が依存するかどうかのみによって分類されるものではない。図１７は、第１及び第２の識別手段の機能を分類して示す図である。本願発明の第１の識別手段と第２の識別手段は、この図１７に示す機能によって分類することができ、逆にこの機能によって分類される第１の識別手段と第２の識別手段とは本願発明の技術的範囲に含まれる。
【０１０４】
これらの形態の画像形成装置によれば、複雑な画像が入力された場合には、処理時間が膨大になったり画質不具合が起こったりする危険性を軽減してユーザの希望に近い画像を形成することが可能となる。また、複雑ではない（標準的な）画像が入力された場合には、第１の識別手段・判定手段・第２の識別手段いずれも本来必要な処理のみで構成されていることから、処理時間、識別精度に影響を与えることなくユーザが期待する出力画像を得られる。
【０１０５】
尚、本発明は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。
また、上記実施形態に開示されている複数の構成要素の適宜な組み合せにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。更に、異なる実施形態に亘る構成要素を適宜組み合せてもよい。
【産業上の利用可能性】
【０１０６】
本発明は、入力文書画像に依存する像域識別処理時間の増加を低減するとともに、出力画像の画質劣化の危険性を軽減して、ユーザの期待に近い出力画像を得ることができる画像形成装置を製造する産業で利用することができる。
【符号の説明】
【０１０７】
１０１…画像入力手段、１０２…第１の識別手段、１０３…判断手段、１０４…第２の識別手段、１０５…画像処理手段、３０１…入力画像、３０２…背景画像、３０２…多値画像、３０３…文字画像、３０３…文字用画像、４０１…画像入力手段、４０２…識別手段、４０３…エッジ抽出手段、４０４…外矩生成手段、４０５…文字列・文字領域抽出処理手段、４０６…画像処理手段、８０１…画像入力手段、８０２…第１の識別手段、８０３…前処理手段、８０４…判断手段、８０５…第２の識別手段、８０６…画像処理手段、１００２…第１の識別手段、１００３…判断手段、１００４…第２の識別手段、１００５…第１の画像処理手段、１００６…第２の画像処理手段。
【先行技術文献】
【特許文献】
【０１０８】
【特許文献１】特開２００５−１７５６４１号公報
【特許文献２】特開２００３−００８９０９号公報
【特許文献３】特開２０００−０２０７２６号公報

【特許請求の範囲】
【請求項１】
紙原稿を含む原稿から画像情報を取得して入力画像を生成する画像入力手段と、
入力画像に対して第１の像域識別処理を行って画像の属性を示す第１の識別信号を出力する第１の識別手段と、
前記第１の識別信号を入力し、前記第１の像域識別処理に続く第２の像域識別処理を行って画像の属性を示す第２の識別信号を出力する第２の識別手段と、
前記第１の識別信号を入力し、前記第２の識別手段を実行すべきか否かを示す判断信号を出力する判断手段と、
前記判断信号が実行すべきではないと示している場合には前記第２の像域識別処理を行わずに前記第１の識別信号を第３の識別信号として選択し、前記判断信号が実行すべきと示す場合には、前記第２の識別信号を前記第３の識別信号として選択する選択手段と、
前記入力画像と前記第３の識別信号とを入力して前記第２の像域識別処理を行わずに画像処理を実行する画像処理手段と
を備えることを特徴とする画像形成装置。
【請求項２】
紙原稿を含む原稿から画像情報を取得して入力画像を生成する画像入力手段と、
入力画像に対して第１の像域識別処理を行って画像の属性を示す第１の識別信号を出力する第１の識別手段と、
前記第１の識別信号を入力し、前記第１の像域識別処理に続く第２の像域識別処理の前処理を行って前処理信号を出力する前処理手段と、
前処理信号を入力し、前記第２の像域識別処理を行って画像の属性を示す第２の識別信号を出力する第２の識別手段と、
前処理信号を入力し、前記第２の識別手段を実行すべきか否かを示す判断信号を出力する判断手段と、
前記判断信号が実行すべきではないと示している場合には前記第２の像域識別処理を行わずに前記第１の識別信号を第３の識別信号として選択し、前記判断信号が実行すべきと示す場合には、前記第２の識別信号を前記第３の識別信号として選択する選択手段と、
前記入力画像と前記第３の識別信号とを入力して前記第２の像域識別処理を行わずに画像処理を実行する画像処理手段と
を備えることを特徴とする画像形成装置。
【請求項３】
紙原稿を含む原稿から画像情報を取得して入力画像を生成する画像入力手段と、
入力画像に対して第１の像域識別処理を行って画像の属性を示す第１の識別信号を出力する第１の識別手段と、
前記第１の識別信号を入力し、前記第１の像域識別処理に続く第２の像域識別処理を行って画像の属性を示す第２の識別信号を出力する第２の識別手段と、
前記第１の識別信号を入力し、前記第２の識別手段を実行すべきか否かを示す判断信号を出力する判断手段と、
前記判断信号が実行すべきではないと示している場合は前記第２の像域識別処理を行わず、前記入力画像と前記第１の識別信号とを入力して画像処理を実行する第１の画像処理手段と
前記判断信号が実行すべきと示している場合は、前記入力画像と前記第２の識別信号とを入力して画像処理を実行する第２の画像処理手段と
を備えることを特徴とする画像形成装置。
【請求項４】
前記第１の識別手段は当該画素とその近傍のみを参照することで画素の属性を識別し、前記第２の識別手段は更に広い領域あるいは文書全体を参照することで属性を識別することを特徴とする請求項１または請求項２に記載の画像形成装置
【請求項５】
前記第１の識別手段は入力画像の画素値の分布に処理時間が依存しない識別手段であり、前記第２の識別手段は入力画像の画素値の分布に処理時間が依存する識別手段であることを特徴とする請求項１または請求項２に記載の画像形成装置。
【請求項６】
前記第１の識別手段は入力画像の画素値の分布に処理精度が依存しない識別手段であり、前記第２の識別手段は入力画像の画素値の分布に処理精度が依存する識別手段であることを特徴とする請求項１に記載の画像形成装置。
【請求項７】
前記第１の識別手段は当該画素自身の閾値処理と固定サイズのフィルタ処理からなる入力画像の画素値の分布に処理時間および精度が依存しない識別手段であることを特徴とする請求項３または請求項４に記載の画像形成装置。
【請求項８】
前記第２の識別手段は前記第１の識別手段にて分類された画素の連結成分同士のサイズ、位置の相互関係を解析する入力画像の画素値の分布に処理時間および精度が依存する識別手段であることを特徴とする請求項３または請求項４に記載の画像形成装置。
【請求項９】
前記第１の識別手段は入力画像の画素ごとの属性を識別する手段であり、前記第２の識別手段は入力画像中の矩形で表現される領域ごとの属性を識別する手段であることを特徴とする請求項１に記載の画像形成装置
【請求項１０】
紙原稿を含む原稿から画像情報を取得して入力画像を生成し、
前記入力画像に対して第１の像域識別処理を行って画像の属性を示す第１の識別信号を生成し、
前記第１の識別信号に、前記第１の像域識別処理に続く第２の像域識別処理を行って画像の属性を示す第２の識別信号を生成し、
前記第１の識別信号から前記第２の識別手段を実行すべきか否かを示す判断信号を生成し、
前記判断信号が実行すべきではないと示している場合には前記第２の像域識別処理を行わずに前記第１の識別信号を第３の識別信号として選択し、前記判断信号が実行すべきと示す場合には、前記第２の識別信号を前記第３の識別信号として選択し、
前記入力画像と前記第３の識別信号とに前記第２の像域識別処理を行わずに画像処理を実行することを特徴とする画像処理方法。

【図１】