画像形成装置及び画像処理方法
【課題】入力文書画像に依存する像域識別処理時間の増加を低減し、出力画像の画質劣化の危険性を軽減することのできる画像形成装置を提供する。
【解決手段】原稿から画像情報を取得して入力画像を生成する画像入力手段101と、入力画像に第1の像域識別処理を行って画像の属性を示す第1の識別信号を出力する第1の識別手段102と、第1の識別信号を入力し、第1の像域識別処理に続く第2の像域識別処理を行って第2の識別信号を出力する第2の識別手段104と、第1の識別信号を入力し、第2の識別手段を実行すべきか否かを示す判断信号を出力する判断手段103と、判断信号が実行すべきではないと示している場合には第2の像域識別処理を行わずに第1の識別信号を第3の識別信号として選択し、判断信号が実行すべきと示す場合には、第2の識別信号を第3の識別信号として選択する選択手段と、入力画像と第3の識別信号とを入力して前記第2の像域識別処理を行わずに画像処理を実行する画像処理手段105とを備える画像形成装置である。
【解決手段】原稿から画像情報を取得して入力画像を生成する画像入力手段101と、入力画像に第1の像域識別処理を行って画像の属性を示す第1の識別信号を出力する第1の識別手段102と、第1の識別信号を入力し、第1の像域識別処理に続く第2の像域識別処理を行って第2の識別信号を出力する第2の識別手段104と、第1の識別信号を入力し、第2の識別手段を実行すべきか否かを示す判断信号を出力する判断手段103と、判断信号が実行すべきではないと示している場合には第2の像域識別処理を行わずに第1の識別信号を第3の識別信号として選択し、判断信号が実行すべきと示す場合には、第2の識別信号を第3の識別信号として選択する選択手段と、入力画像と第3の識別信号とを入力して前記第2の像域識別処理を行わずに画像処理を実行する画像処理手段105とを備える画像形成装置である。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像形成装置及び画像処理方法に関し、特に、文書画像に像域識別処理を施して画像形成するための技術に関する。
【背景技術】
【0002】
文書画像に像域識別処理を行い、その識別結果に基づいて適用する画像処理を切り替えて画像形成する技術が知られている。特に最近では画質を保ったままデータ量を削減することを目的に、文字と写真とを分離し、文字は解像性を重視し、写真は階調性を重視してそれぞれに適した画像処理・圧縮処理を施して電子ファイル化する技術がある。
【0003】
例えば、特許文献1に記載の技術では、処理対象となった画像データにレイアウト解析処理を適用し、その結果に基づいて文字部分の画像要素を特定し、文字部分として特定された画像要素と、それ以外の部分とについて、互いに異なる圧縮方法で圧縮処理を行うことで文字の可読性を保ったまま高圧縮な画像ファイル(高圧縮PDF)を得ている。
【0004】
また、前述した像域識別処理については特許文献2及び特許文献3に開示された技術が知られている。
特許文献2に記載の技術では、処理対象を2値化した後、その黒画素群の連結成分の外接矩形のサイズのみに基づいて黒画素が文字か否かを判断する。
特許文献3に記載の技術では、ある特定画素群の外接矩形の集合のサイズや並び方に基づいて文字列、文字列領域を抽出する。
【発明の概要】
【発明が解決しようとする課題】
【0005】
特許文献2に記載の技術では、誤識別が起こりにくく、また、高速に処理することができるが、写真中の文字が抽出できないなど適用できる対象が狭い。そのため、この識別結果を利用して前述の高圧縮な画像ファイルを形成した場合、黒文字以外の文字では文字がぼやけて可読性が悪化し、また、高い圧縮効果を得ることが難しいという問題点がある。
【0006】
一方、特許文献3に記載の技術では、前者と比較して多様な文字を抽出することが可能である。しかし、網点下地を多く含んでいる文書画像、あるいは、複雑な構成である文書画像が入力された場合、その外接矩形の数が膨大となりレイアウト解析処理に非常に大きな時間を要することがある。また、レイアウト解析処理で誤識別を起こす危険性も高くなる。大きな処理時間を要する点に関しては、所定の処理時間内でのみ識別処理を実施し、処理時間を超過した場合は識別処理を実施しないという退避方法も考えられるが、結果としてユーザが望む画像を形成することができない。
【0007】
本発明は斯かる事情に鑑みてなされたものであって、入力文書画像に依存する像域識別処理時間の増加を低減するとともに、出力画像の画質劣化の危険性を軽減して、ユーザの期待に近い出力画像を得ることのできる画像形成装置及び画像処理方法を提供することを目的とする。
【課題を解決するための手段】
【0008】
上記課題を解決するための本発明は、紙原稿を含む原稿から画像情報を取得して入力画像を生成する画像入力手段と、入力画像に対して第1の像域識別処理を行って画像の属性を示す第1の識別信号を出力する第1の識別手段と、前記第1の識別信号を入力し、前記第1の像域識別処理に続く第2の像域識別処理を行って画像の属性を示す第2の識別信号を出力する第2の識別手段と、前記第1の識別信号を入力し、前記第2の識別手段を実行すべきか否かを示す判断信号を出力する判断手段と、前記判断信号が実行すべきではないと示している場合には前記第1の識別信号を第3の識別信号として選択し、前記判断信号が実行すべきと示す場合には、前記第2の識別信号を前記第3の識別信号として選択する選択手段と、前記入力画像と前記第3の識別信号とを入力して画像処理を実行する画像処理手段とを備える画像形成装置である。
【0009】
また本発明は、紙原稿を含む原稿から画像情報を取得して入力画像を生成する画像入力手段と、入力画像に対して第1の像域識別処理を行って画像の属性を示す第1の識別信号を出力する第1の識別手段と、前記第1の識別信号を入力し、前記第1の像域識別処理に続く第2の像域識別処理の前処理を行って前処理信号を出力する前処理手段と、前処理信号を入力し、前記第2の像域識別処理を行って画像の属性を示す第2の識別信号を出力する第2の識別手段と、前処理信号を入力し、前記第2の識別手段を実行すべきか否かを示す判断信号を出力する判断手段と、前記判断信号が実行すべきではないと示している場合には前記第1の識別信号を第3の識別信号として選択し、前記判断信号が実行すべきと示す場合には、前記第2の識別信号を前記第3の識別信号として選択する選択手段と、前記入力画像と前記第3の識別信号とを入力して画像処理を実行する画像処理手段とを備える画像形成装置である。
【0010】
また本発明は、紙原稿を含む原稿から画像情報を取得して入力画像を生成する画像入力手段と、入力画像に対して第1の像域識別処理を行って画像の属性を示す第1の識別信号を出力する第1の識別手段と、前記第1の識別信号を入力し、前記第1の像域識別処理に続く第2の像域識別処理を行って画像の属性を示す第2の識別信号を出力する第2の識別手段と、前記第1の識別信号を入力し、前記第2の識別手段を実行すべきか否かを示す判断信号を出力する判断手段と、前記判断信号が実行すべきではないと示している場合は、前記入力画像と前記第1の識別信号とを入力して画像処理を実行する第1の画像処理手段と、前記判断信号が実行すべきと示している場合は、前記入力画像と前記第2の識別信号とを入力して画像処理を実行する第2の画像処理手段とを備える画像形成装置である。
【0011】
また本発明は、紙原稿を含む原稿から画像情報を取得して入力画像を生成し、前記入力画像に対して第1の像域識別処理を行って画像の属性を示す第1の識別信号を生成し、前記第1の識別信号に、前記第1の像域識別処理に続く第2の像域識別処理を行って画像の属性を示す第2の識別信号を生成し、前記第1の識別信号から前記第2の識別手段を実行すべきか否かを示す判断信号を生成し、前記判断信号が実行すべきではないと示している場合には前記第2の像域識別処理を行わずに前記第1の識別信号を第3の識別信号として選択し、前記判断信号が実行すべきと示す場合には、前記第2の識別信号を前記第3の識別信号として選択し、前記入力画像と前記第3の識別信号とに前記第2の像域識別処理を行わずに画像処理を実行する画像処理方法である。
【発明の効果】
【0012】
本発明の画像形成装置及び画像処理方法によれば、入力文書画像に依存する像域識別処理時間の増加を低減するとともに、出力画像の画質劣化の危険性を軽減して、ユーザの期待に近い出力画像を得ることができる。
【図面の簡単な説明】
【0013】
【図1】第1の実施の形態の画像形成装置の構成を示す図。
【図2】第1の実施の形態の画像形成装置の概略の処理手順を示すフローチャート。
【図3】第1の実施の形態の出力ファイルのデータ形式を示す図。
【図4】従来の画像形成装置を示す図。
【図5】ラベリング処理を説明する図。
【図6】エッジ画像の連結成分の外接矩形と文字成分を例示する図。
【図7】画像処理手段の一構成例を示すブロック図。
【図8】第2の実施の形態の画像形成装置の構成を示す図。
【図9】第2の実施の形態の画像形成装置の概略の処理手順を示すフローチャート。
【図10】第3の実施の形態の画像形成装置の構成を示す図。
【図11】第3の実施の形態の画像形成装置の概略の処理手順を示すフローチャート。
【図12】第3の実施の形態の第1の画像処理手段で生成されるPDFファイルのデータ形式を説明する図。
【図13】第1の画像処理手段の一構成例を示すブロック図。
【図14】MRC形式と他の形式との画像のデータサイズを比較して示す図。
【図15】文字色検出手段の動作例を示す図。
【図16】射影像の計算方法を説明する図。
【図17】第1及び第2の識別手段の機能を分類して示す図。
【発明を実施するための形態】
【0014】
[第1の実施の形態]
図1は、第1の実施の形態の画像形成装置の構成を示す図であり、図2は、第1の実施の形態の画像形成装置の概略の処理手順を示すフローチャートである。図1及び図2を参照しつつ画像形成装置の構成と動作について説明する。
【0015】
画像入力手段101は、入力された紙原稿を画像信号に変換する、例えば、MFPのスキャナである。アクト201において、画像入力手段101は、変換した入力画像信号111を出力する。アクト202において、第1の識別手段102は、入力画像信号111を入力してエッジ抽出・黒画素抽出などにより入力画像の比較的狭い範囲の画素を参照して第1の識別処理を実行し、画素属性を示す第1の識別信号112を出力する。アクト203において、判断手段103は、第1の識別信号112を入力して入力文書画像の複雑さを判断し、入力文書画像が複雑であるか否かを示す判断信号113を出力する。
【0016】
アクト204において、第2の識別手段104は、第1の識別信号112を入力して第2の識別処理を実行して文字列・文字領域を抽出し、第2の識別信号114を出力する。但し、判断信号113が“入力文書が複雑である”ことを示している場合には、第2の識別手段は処理を実施せず、“入力文書が複雑ではない(標準的である)”ことを示している場合に、第2の識別手段は処理を実施する。
【0017】
アクト205において、画像処理手段105は、入力画像信号111と第1の識別信号112あるいは第2の識別信号114とを入力して画像処理を実施する。ここで、判断信号113が“入力文書が複雑である”ことを示している場合には、第1の識別信号112が識別信号として入力される。判断信号113が、“入力文書が複雑ではない(標準的である)”ことを示している場合には第2の識別信号114が識別信号として入力される。
【0018】
なお、第1の実施の形態における第1の識別手段102ならび、第2の識別手段104は公知の技術を使用することができる。例えば、特開2000−20726号公報に記載の文字領域抽出部と同様の処理を使用することができる。
【0019】
続いて、第1の実施の形態を具体的に説明する。
第1の実施の形態では画像形成装置としてMFP(多機能複合機)を例として、当該MFPのスキャン機能として標準的に搭載されている高圧縮PDF生成を説明する。
【0020】
図3は、第1の実施の形態の出力ファイルのデータ形式を示す図である。
一般に高圧縮PDFと呼ばれる電子ファイルであっても、ファイル内のデータフォーマットは様々である。第1の実施の形態の高圧縮PDFにおいては、図3に示す入力画像301から文字・自然画などのオブジェクトを切り出し、その属性に適した方式で圧縮し結合することで高圧縮を実現する。
【0021】
即ち、このデータ形式では、150dpiの背景画像302の上に、(図では表現できていないが)色毎に分割された300dpiの2値の文字画像303を重ねて表現する。ここで、文字画像303は“0”“1”の2値を有している。文字画像303では白画素に当る“0”値の画素は、重ね合わせの下の層にある背景画像302を透過して描画し、黒画素に当る“1”値の画素は、別に指定されている色で描画する。文字画像は300dpiで表現するためはっきりと表わされ、文字以外の部分は解像度を150dpiに落としているため、ファイルサイズを削減できる。
【0022】
ここで、比較のために従来の画像形成装置の構成と動作について説明する。図4は、従来の画像形成装置を示す図である。
【0023】
画像入力手段401は、入力画像信号411を出力する。識別手段402は、入力画像信号411に基づいて識別信号412を出力する。画像処理手段406は、入力画像信号411と識別信号412とを入力して高圧縮PDFファイルを生成して出力する。
【0024】
ここで、識別手段402は、エッジ抽出手段403、外矩生成手段(ラベリング手段)404及び文字列・文字領域抽出処理手段405を備えている。
【0025】
エッジ抽出手段403は、入力画像信号411を入力して、入力画像中のエッジ画素を抽出したエッジ画像を出力する。エッジ抽出手段としては様々な手法が提案されているが、例えば式(1)に示す変換式で輝度値Yを求めた後に、下の行列に示す単純なSobelフィルタを使用して抽出する。
【0026】
Y = 0.257R+0.504G+0.098B+16 ・・・式(1)
(ここで、R,G,Bは各画素の信号値)
【数1】
【0027】
外矩生成手段(ラベリング)404は、エッジ抽出手段403より出力されたエッジ画像を入力して、エッジ画素の連結成分の外接矩形を生成した外矩画像を出力する。外接矩形を生成するために、外矩生成手段(ラベリング)404は、ラベリング処理を実行する。
【0028】
図5は、ラベリング処理の一例を説明する図である。なお、ラベリングの手法は様々なものが提案されており、いずれを選択してもよいことはいうまでもない。
入力画像501は、“0” “1”の2値画像である。入力画像501に対して左上の画素を始点とし、左→右、上→下の順で全画素を走査してラベルを付ける。いま、走査する画素を注目画素とすると、対応する参照画素の状況に応じて注目画素に付けるラベル(数字)を決定する。注目画素と参照画素とを示す例502で規定する処理方法では、注目画素(○)が黒画素であった場合、注目画素の左、左上、上、右上の位置にある参照画素(*)の値に応じて注目画素のラベルが定められる。
【0029】
例えば、次のようなルールでラベルを付ける。
*参照画素に黒画素が一つもなかった場合、0から始めて昇順に数値を付番する。
*参照画素に1種類のラベルがあった場合、参照画素にあるのと同じラベルを付ける。
*参照画素に2種類以上のラベルがあった場合、参照画素にある中で一番若い番号のラベルを付ける。更に、その異なる番号のラベルが同一ラベルであることを記録しておく。
【0030】
左上(1行×1列)の画素を注目画素とすると、参照画素は領域外となり黒画素は存在しない。従って、新しいラベル“0”を付ける。次に右側(1行×2列)の画素を注目画素とすると、1行×1列の参照画素が黒画素である。従って、参照画素(1行×1列)にあるのと同じラベル“0”を付ける。
【0031】
更に右側に進んだ、(1行×3列)の画素と(1行×4列)の画素は白画素である。従って、この注目画素についてはブランクとしてラベルを付与しない。右上(1行×5列)の画素を注目画素とすると、参照画素には黒画素は存在しない。従って、昇順の新しいラベル“1”を付ける。
【0032】
(4行×4列)の画素を注目画素とすると、注目画素の左側の参照画素は既に“0”のラベルが付いているのに対し、上側の参照画素は“1”のラベルが付いている。従って、注目画素に対しては“0”と“1”のうち若い番号である“0”のラベルを付ける。更に、“0”と“1”が同じラベルであることを記録しておく。
【0033】
左下(5行×1列)の画素を注目画素とすると、参照画素には黒画素は存在しない。従って、新しいラベルを付ける。この時、ラベル“0”と“1”は既に使用されているので新しいラベル“2”を付ける。
【0034】
このようにして、1回目の走査が終了した後のラベルの状態をラベリング結果503に示す。このラベリング結果503をみると、本来同じラベルを持つべき連結成分が“0”というラベルを持った画素と“1”というラベルを持った画素の2つのグループに分けられていることがわかる。
【0035】
次にラベルの統一処理を実施する。上述のように、左から4番目・上から4番目の画素を注目画素とした時に、“0”と“1”が同一ラベルであることは別に記録されている。このような場合には若い数字にラベルを統一する。すなわちラベリング結果503において“1”というラベルが付いた画素は“0”とラベルをつけ直す。この処理結果をラベリング結果504に示している。ラベリング結果504に示すように、本来一つの連結成分となるべきグループの画素全てが同じラベルになる。
【0036】
最後に空きラベルの修正処理を実行する。統一処理を行った結果として空きラベルが発生した場合は、ラベルの番号を詰め直す。ラベリング結果504の例ではラベル“1”が空き番号になるので“2”以降のラベルの番号を詰める。ラベリング結果505は、このようにして最終的に得られるラベリング結果を示している。
【0037】
同じラベルが付与された画素の(x座標,y座標)の最小値の組、最大値の組がそれぞれ連結成分の外接矩形の左上頂点、右下頂点の(x座標,y座標)となるので、ラベリング処理の結果からエッジ画素の連結成分の外接矩形を生成することができる。
【0038】
文字列・文字領域抽出処理手段405は、外矩生成手段404から出力された外矩画像を入力とし、識別信号412を出力する。図6は、エッジ画像の連結成分の外接矩形と文字成分を例示する図である。
【0039】
具体的には、文字列・文字領域抽出処理手段405は、エッジ画像の連結成分の外接矩形画像601を入力した場合(図中の一点鎖線が外接矩形)、接触・交差・内包している矩形同士を結合し文字成分602を生成する。そして、文字列・文字領域抽出処理手段405は、このようにして生成された文字成分について
・自身のサイズが極端に大きかったり小さかったりしないか?
・矩形の縦横比は1に近いか(矩形の形状は正方形に近いか)?
・水平方向の近傍の文字成分とサイズが揃っているか?y座標が揃っているか?
・垂直方向の近傍の文字成分とのサイズが揃っているか?x座標が揃っているか?
など文字列らしい特性を持っているかという基準から文字列生成を行うと共に、更に文字列らしさ、文字列の並び方から文字領域であるか否かを判定する。
【0040】
ここで、文字列・文字領域抽出の過程では、矩形の削除および矩形同士の結合が繰り返して実行される。そのため、処理対象となる文字成分が多い場合には、処理時間が膨大になってしまう。また、文字成分が多いということは、文字と誤識別しやすい網点やノイズも多いため識別精度が悪い可能性が高いことも示している。
【0041】
画像処理手段406について説明する。図7は、画像処理手段の一構成例を示すブロック図である。この画像処理手段406は、図3に示したデータ形式の画像ファイルを得るための構成である。
【0042】
文字画素検出手段701は、入力画像信号に基づいて像域識別処理を実行し、識別信号を出力する。即ち、文字画素検出手段701は、図4の識別手段402に該当するため、その詳細の説明は省略する。
【0043】
まず背景用の多値画像302の作成処理を説明する。文字周囲色検出手段702は、文字周囲の色を検出する。検出する方法としては、例えば文字との距離が3画素以内の画素を抽出し、その画素値の平均値を求めて文字周囲色とする。次に文字塗りつぶし手段703は、文字画素を検出した文字周囲色に置き換える。これによって文字が周囲の背景色によって塗りつぶされる。最後に画像縮小手段704が縮小処理を実行し、その後多値画像圧縮手段705がJPEGなどの多値画像圧縮を実行して背景用画像を作成する。
【0044】
なお、文字塗りつぶし手段703が文字を塗りつぶすのは、JPEGに代表される多値画像圧縮は一般に空間周波数の高周波成分が多い画像の圧縮は苦手な傾向があるため、高周波成分を含む文字を消すことによって圧縮率を高めるためである。
【0045】
次に文字用画像303の作成処理を説明する。まず文字色検出手段706が各文字画素の文字色を検出する。具体的には、例えば、類似する色の文字画素をグルーピングし、そのグループの文字画素のRGB平均値を文字色とする。一方、この処理と並行して2値化手段707は、文字画素が“1”、非文字画素が“0”となるように2値画像を生成する。
【0046】
文字色による2値画像分割手段708が、生成した2値画像を文字色検出手段706がグルーピングした色毎の2値画像に分割する。そして、2値画像圧縮手段709が、分割後の2値画像に対してMMRなどの2値画像圧縮を施して文字用画像を作成する。
なお、色毎に文字画素をグルーピングし2値画像を分割する理由は、2値画像であるため、一つの画像では背景と前景(文字)の2色しか表現できないためである。
【0047】
以上、従来の画像形成装置の構成と動作について説明した。上述のように、従来の画像形成装置では入力文書画像が複雑であった場合、像域識別手段における処理時間が膨大となったり、あるいは、識別精度が不十分なため画質不具合が生じる危険性が高い。
【0048】
図1に示す第1の実施の形態の画像形成装置は、このような問題点の発生を防止する。第1の実施の形態の画像形成装置の構成と動作を従来の画像形成装置と比較させて、図1と図4とを参照しつつ説明する。
【0049】
第1の実施の形態の画像形成装置では、従来の画像形成装置の識別手段402(図4)を、第1の識別手段102(図1)と第2の識別手段104(図1)とに分割する。ここで、第1の識別手段102(図1)は、従来の画像形成装置のエッジ抽出手段403(図4)に相当し、第2の識別手段104は、従来の画像形成装置の外矩生成手段404(図4)および文字列・文字領域抽出処理手段405(図4)に相当する。
【0050】
第1の実施の形態の画像形成装置では、判断手段103(図1)が文書複雑さを判断する。即ち、判断手段103(図1)は第1の識別信号112(図1)を入力し、文書が複雑であるか否かの判断信号113(図1)を出力する。
【0051】
ここで、文書画像複雑さの判断手段103(図1)について説明する。上述のように、第2の識別手段104、即ち、従来の画像形成装置の外矩生成手段404(図4)および文字列・文字領域抽出処理手段405(図4)はエッジ画像の外接矩形数に依存して処理時間が膨大になりあるいは識別精度が悪化する恐れが高くなる。ここで、エッジ画素の外接矩形の数はエッジ画素数にある程度依存すると考えられる。
【0052】
そこで、判断手段103(図1)は、第1の識別手段102即ち、従来の画像形成装置のエッジ抽出手段403(図4)から出力されるエッジ画像信号を第1の識別信号112(図1)として入力とし、そのエッジ画像を走査してエッジ画素数Neをカウントする。そして、Ne>Th1であれば入力文書が複雑であることを示す判断信号113を出力する。反対にNe<=Th1であれば、入力文書が複雑ではない(標準的である)ことを示す判断信号113を出力する。ここでTh1は予め決めておいた閾値である。
【0053】
判断信号113(図1)が“文書が複雑であること”を示している場合には、第2の識別手段104、即ち、従来の画像形成装置の外矩生成手段404(図4)および文字列・文字領域抽出処理手段405(図4)は動作しない。従って、画像処理手段105(図1)は、入力画像信号111(図1)と第1の識別信号112を入力として高圧縮PDFを出力する。
【0054】
反対に判断信号113(図1)が“文書が複雑ではない(標準的である)こと”を示している場合には、更に第2の識別手段104、即ち、従来の画像形成装置の外矩生成手段404(図4)および文字列・文字領域抽出処理手段405(図4)が動作する。従って、画像処理手段105(図1)は、入力画像信号111(図1)と第2の識別信号114を入力として高圧縮PDFを出力する。
【0055】
以上説明したとおり、第1の実施の形態では、入力文書画像が複雑な場合においても画質不具合や処理時間が膨大となる危険性が少ない高圧縮PDFファイルを作成することが可能である。
また、第1の実施の形態の文書画像複雑さ判断手段103は、第2の識別手段104に必要なデータのみを使用しており、新たなデータ入力を必要としていない。従って、処理時間に大きな影響を及ぼさずに判断することができる。更に、入力された文書画像が複雑であった場合には、従来の方式と比較して不必要な信号を生成することなく高圧縮PDFを作成することが可能である。
【0056】
[第2の実施の形態]
図8は、第2の実施の形態の画像形成装置の構成を示す図であり、図9は、第2の実施の形態の画像形成装置の概略の処理手順を示すフローチャートである。図8及び図9を参照しつつ画像形成装置の構成と動作について説明する。
なお、第2の実施の形態の画像形成装置は、第2識別の前処理手段803を備えている点で第1の実施の形態の画像形成装置と異なっている。
【0057】
画像入力手段801は、入力された紙原稿を画像信号に変換するMFPのスキャナなどである。アクト901において、画像入力手段801は、変換した入力画像信号811を出力する。アクト902において、第1の識別手段802は、入力画像信号811を入力してエッジ抽出・黒画素抽出などにより入力画像の比較的狭い範囲の画素を参照して第1の識別処理を実行し、画素属性を示す第1の識別信号812を出力する。アクト903において、第2識別の前処理手段803は、第1の識別信号812を入力して、第2の識別手段の前処理を行い、前処理信号813を出力する。
【0058】
アクト904において、判断手段804は、前処理信号813を入力して入力文書画像の複雑さを判断し、入力文書画像が複雑であるか否かを示す判断信号814を出力する。アクト905において、第2の識別手段805は、前処理信号813を入力して文字列・文字領域を抽出し、第2の識別信号815を出力する。但し、判断信号814が“入力文書が複雑である”ことを示している場合には第2の識別手段805は処理を実施せず、“入力文書が複雑ではない(標準的である)”ことを示している場合には第2の識別手段805は処理を実施する。
【0059】
アクト906において、画像処理手段806は、入力画像信号811と第1の識別信号812あるいは第2の識別信号815とを入力として画像処理を行う。ここで、判断信号814が“入力文書が複雑である”ことを示している場合には、第1の識別信号812が識別信号として入力される。判断信号814が“入力文書が複雑ではない(標準的である)”ことを示している場合には、第2の識別信号815が識別信号として入力される。
【0060】
第2の実施の形態と第1の実施の形態との大きな違いは、第1の実施の形態では、従来の画像形成装置の識別手段402(図4)を第1の識別手段102(図1)と第2の識別手段104(図1)の2つに分割していたのに対し、第2の実施の形態においては第1の識別手段802(図8)と第2識別の前処理手段803(図8)と第2の識別手段805(図8)の3つに分割している点である。
【0061】
第2の実施の形態の各手段と従来の画像形成装置の処理ブロックとの具体的な対応は以下の通りである。
第2の実施の形態の第1の識別手段802は、従来技術のエッジ抽出手段403(図4)に対応する。第2の実施の形態の第2識別の前処理手段803は、従来技術の外矩生成手段404(図4)に対応する。第2の実施の形態の第2の識別手段805は、従来技術の文字列・文字領域抽出処理手段405(図4)に対応する。
【0062】
ここで、文書画像複雑さの判断手段804(図8)について説明する。上述したように、第2の識別手段805に対応する従来技術の文字列・文字領域抽出処理手段405(図4)は、エッジ画像の外接矩形数に依存して処理時間が膨大になったり識別精度が悪くなったりする。第1の実施の形態においては、エッジ画素数Neをカウントし、Ne > Thであるか否かを入力文書が複雑であるか否かの判断基準とした。
【0063】
第2の実施の形態においては、第2識別の前処理手段803は前処理信号813として外矩画像を出力するため、判断手段804は、文書の複雑さをより表している外矩数NrをカウントしNr>Th2であれば入力文書が複雑であると判断し、入力文書が複雑であることを示す判断信号814を出力する。反対にNr<=Th2であれば、入力文書が複雑ではない(標準的である)ことを示す判断信号814を出力する。ここでTh2は予め決めておいた閾値である。
これにより、第1の実施の形態よりさらに正確に文書の複雑さを判断することが可能となる。
【0064】
以上説明したとおり、第2の実施の形態では、第1の実施の形態よりも正確に入力文書画像の複雑さを判断することが可能であり、入力文書画像が複雑な場合においても画質不具合や処理時間が膨大となる危険性が少ない高圧縮PDFファイルを作成することが可能である。
【0065】
また、第2の実施の形態の文書画像複雑さ判断手段804は、第2の識別手段805に必要なデータのみを使用しており、新たなデータ入力を必要としていない。従って、処理時間に大きな影響を及ぼさずに判断することができる。
【0066】
[第3の実施の形態]
図10は、第3の実施の形態の画像形成装置の構成を示す図であり、図11は、第3の実施の形態の画像形成装置の概略の処理手順を示すフローチャートである。図10及び図11を参照しつつ画像形成装置の構成と動作について説明する。
なお、第3の実施の形態と第1の実施の形態との違いは入力文書画像の複雑さにより画像処理手段まで切り替える点であり、第3の実施の形態では、第1の画像処理手段1005と第2の画像処理手段1006とを有している。
【0067】
第3の実施の形態では、アクト1103において、複雑さ判断手段1003により入力画像が複雑であると判断された場合には、アクト1106において、第1の識別信号1012に基づき第1の画像処理手段1005によって第1の画像処理が施される。一方、入力画像が複雑ではない(標準的)と判断された場合には、アクト1104において、第2の識別手段1004が、第1の識別信号1012に基づき第2の識別信号1013を出力する。アクト1105において、第2の識別信号1013に基づき第2の画像処理手段1006によって第2の画像処理が施される。
【0068】
図12は、第3の実施の形態の第1の画像処理手段1005で生成されるPDFファイルのデータ形式を説明する図である。
【0069】
図12に示すデータ形式(MRC)は、マスク画像1202、背景用画像1203及び文字色用画像1204を備えている。マスク画像1202は、“0”“1”の2値を持った300dpiの画像である。背景用画像1203は、入力画像から文字を消去した150dpiの画像である。文字色用画像1204は、文字色を特定するための75dpiの画像である。
【0070】
第3の実施の形態ではマスク画像1202が黒画素の位置には文字色用画像1204を選択し、白画素の位置には背景用画像1203を選択して表示する。それにより、文字の形状は300dpiのマスク画像に依存するため、文字ははっきりさせたまま文字以外の解像度を落とすことでファイルサイズの削減を実現している。
なお、第3の実施の形態の第2の画像処理手段1006で作成されるPDFファイルのデータ形式は、第1の実施の形態の画像処理手段105(図1)で生成される図3に示すPDFファイルと同じデータ形式とする。
【0071】
図13は、第1の画像処理手段1005の一構成例を示すブロック図である。
【0072】
文字画素検出手段1301は、入力画像信号に基づいて像域識別処理を実行し、識別信号を出力する。即ち、文字画素検出手段1301は、図10の第1の識別手段1002に該当するため、その詳細の説明は省略する。
【0073】
まずマスク画像1202の作成動作を説明する。2値化手段1302は、例えば文字画素を“1”,文字以外の画素を“0”とする2値画像を生成する。2値画像圧縮手段1303は、生成した2値画像に対しMMRなどの2値圧縮を施してマスク画像1202を作成する。
【0074】
次に、背景用画像1203の作成動作を説明する。文字周囲色検出手段1304は、文字周囲の色を検出する。検出する方法としては、例えば文字との距離が3画素以内の画素を抽出し、その画素値の平均値を求めて文字周囲色とする。次に文字塗りつぶし手段1305は、文字画素を検出した文字周囲色に置き換える。これによって文字が周囲の背景色によって塗りつぶされる。最後に第1の画像縮小手段1306が縮小処理を実行し、その後第1の多値画像圧縮手段705がJPEGなどの多値画像圧縮を実行して背景用画像を作成する。
【0075】
なお、文字塗りつぶし手段1305が文字を塗りつぶすのは、JPEGに代表される多値画像圧縮は一般に空間周波数の高周波成分が多い画像の圧縮は苦手な傾向があるためであり、高周波成分を含む文字を消すことによって圧縮率を高めるためである。
【0076】
次に、文字色用画像1204の作成動作を説明する。まず、非文字消去手段1308が入力画像から文字以外を消去する。具体的には文字検出手段1301で文字として検出されなかった画素を白画素で置き換える。次に文字画素膨張手段1309が文字画素を膨張させる。具体的には、色画素の8近傍にある白画素をその色で置き換える処理を、全ての色画素に対して繰り返す。なお、この文字画素膨張処理も背景用画像1203と同様に高周波成分をなくすために文字形状を残さないための処理である。そのため、繰り返し回数を大きくすれば処理時間が大きくなるものの圧縮ファイルサイズを小さくできる。
【0077】
なお、膨張処理をある回数繰り返すとファイルサイズは減少しなくなるが、その回数は入力解像度に依存する。例えば、解像度が低いほど少ない繰り返し回数でファイルサイズの減少は限界となる。文字画素膨張後の画像に対して第2の画像縮小手段1310が縮小処理を実行し、その後第2の多値画像圧縮手段1311が、多値画像圧縮を実行して文字色用画像1204を作成する。
【0078】
次に、データ形式をMRC形式にした理由を説明する。
図12に示すように、第1の画像処理手段1005により出力されるMRC形式では背景用の150dpiの多値画像と文字形状用のマスク画像300dpiの2値画像および文字色用の75dpiの多値画像により構成されている。それに対し、図3に示すように、第2の画像処理手段1006により出力される形式では背景用の150dpiの多値画像と文字用の300dpiの2値画像により構成される。
【0079】
それぞれを構成する各画像のデータサイズを比較すると、図14に示す通り、前者(MRC形式)と後者の背景用画像は、ほぼ同じデータサイズである。また、前者(MRC形式)のマスク画像と後者の文字用画像も、ほぼ同じデータサイズである。そのため、文字色用画像のデータサイズ分、前者(MRC形式)の方がファイルサイズが大きくなりやすい。しかし、後者の形式では、MRC形式より高精度な処理が要求される。具体的には、後者の形式でのみ必要な文字色検出手段706(図7)は高い精度が要求される。
【0080】
図15は、文字色検出手段の動作例を示す図である。
図15の文字画像1501は、文字色検出手段706に入力される画像の例である。この文字画像1501の1行目(アルファベット)、2行目(数字)、3行目(平仮名)は、全て異なる文字色である。
【0081】
文字色ごとにグルーピングする際に文字画像1502に示すように文字色とグループが1対1対応し、かつ、そのグループの色を正しく抽出できれば、文字画像1503に示すように、出力電子画像ファイル中の文字画像を入力画像とほぼ同様に表現できる。しかし、例えば文字画像1504に示すように第1行目〜第3行目の複数色の文字を誤って一つの文字色グループとしてしまった場合、文字画像1505に示すように出力電子画像ファイル中の文字画像はただ1色(本例では3行の平均色のただ1色)で表現されてしまう。
【0082】
また、文字画像1506に示すように一文字一文字でグルーピングしてしまった場合、あるいは文字画像1507に示すように文字列中で一文字だけ抽出文字色を間違えてしまった場合には、同一色の文字列の中で異なる色の文字が発生してしまい非常に違和感のある画像を出力する危険性もある。
また、画像データサイズ自体は文字画像1503、1505、1507ともほぼ同じだが、文字画像1506のように細かく分割しすぎると、出力の電子画像ファイルを構成するためのオーバーヘッドが大きくなり、この結果ファイルサイズが大きくなることもありうる。
【0083】
すなわち、入力画像が複雑な場合に第2の画像処理手段1006を実行すると文字色を間違える危険性が高いため、第3の実施の形態においては第1の画像処理手段1005にてMRC形式のPDFファイルを作成するようにしている。
【0084】
以上で説明したとおり、第3の実施の形態では、入力文書画像が複雑であった場合であっても画質不具合や処理時間が膨大となる危険性が少ない高圧縮PDFファイルを作成することが可能である。さらに、本第3の実施の形態における文書画像複雑さ判断処理は、像域識別処理に必要なデータのみを使用しており、新たなデータ入力を必要としていない。従って、標準的な画像が入力された場合の処理時間に悪影響を及ぼさずに判断が可能である。
【0085】
第1〜第3の実施の形態においては、高圧縮PDFを具体例にして、文書が複雑なために処理時間が膨大となりあるいは画質不良が生じるなどの不具合を防止することのできる画像処理技術について説明した。以下の形態では、高圧縮PDF以外への本画像処理技術の適用の例を挙げる
[第4の実施の形態]
第4の実施の形態の画像形成装置は図1に示す画像形成装置と同じ構成をとる。従って、第1の実施の形態の画像形成装置と同じ参照符号を用いて、その構成についての詳細説明は割愛する。なお、本実施形態における画像形成装置は原稿の入力傾きを検知・補正する装置とする。
【0086】
文書画像には文字が多く含まれるため、画像を決められた角度ステップで回転しながら文字画素をx軸へ射影するとその先鋭度から傾き角度を検知することができる。しかし、回転する角度を細かいステップで処理すると、画像を回転する処理は多くの時間を要するため、処理時間が大きくなり、回転する角度を粗いステップで処理すると精度が低下するとのトレードオフが生じる。
一方、表などの線分を多く含む文書画像であれば、その線分を抽出できれば線分の傾き角度を求めるだけで比較的高速に傾き角を検知することが可能である。
【0087】
次に、図1を参照しつつ画像処理装置の動作を説明する。第1の識別手段102は、文字・線分画素の抽出とラベリングを実施する。具体的には第1実施例と同じ手法でエッジ抽出とそのエッジ画素のラベリングを実施する。更に、同一ラベルの画素のx座標y座標の最大最小値から連結成分の外接矩形を生成する。更にその外接矩形が下の条件を満たせば、外接矩形の対角線を線分と見なす。
【0088】
条件1:縦横比がある閾値以上(例えば100以上)である。
条件2:(A)矩形の右上・左下頂点が黒画素で、かつ、左上・右下頂点が白画素である。または、(B)左上・右下頂点が黒画素で、かつ、右上・左下頂点が白画素である。
【0089】
次に判断手段103は、線分情報を用いてスキュー(傾き)検知できるか否かを判断する。ここで、文書に使用される線分は水平または垂直であると仮定している。
判断手段103は、第1の識別手段において識別された線分の傾き角の平均と分散を求める。それぞれの線分の角度は単純にθ=tan−1(w/h)として求める。ただし、上記(B)のパターンの場合は符号を逆転させてθ=−tan−1(w/h)とする。ここでw,hはそれぞれ矩形の幅、高さである。このようにして判断手段103は、各線分の傾き角度を算出する。そして、その傾き角度の分散値がある閾値未満であれば、線分の傾き角の平均値θを文書全体のスキュー角度として使用できると判断する。
【0090】
一方、判断手段103が、線分の傾き角を使用できないと判断した場合には、第2の識別手段104は、文字と見なされる外接矩形を予め決めていた角度ステップで回転させながらx軸へ射影し、そのヒストグラム形状から傾き角を検知する。
ここで、文字は正方形に近い形状であることから外接矩形の縦横比がある閾値(例えば2)未満のものを文字と見なす。また、実画像を回転させながらx軸への射影を求めると処理時間が膨大になってしまうため、実際は計算により射影を求める。
【0091】
図16は、射影像の計算方法を説明する図である。図16(1)が傾きの無い状態での外接矩形の座標を表している。その左上座標は(x0,y0)、幅・高さは(sx,sy)である。図16(2)は、座標軸を角度θ回転させた状態を表している。その外接矩形のx軸への射影は下記式(2)、式(3)で表されるα〜βの範囲となる。
α = x0cosθ − y0sinθ ・・・式(2)
β = (x0+sx)cosθ − (y0+sy)sinθ ・・・式(3)
この射影を文字と見なされる全ての外接矩形について行い、その射影の長さのヒストグラム形状が最も尖鋭である角度θを文書のスキュー角度と検知する。
【0092】
続いて、画像処理手段105における傾き補正方法について説明する。第1の識別手段または第2の識別手段により求められた原稿傾き角度をθとすると、傾きを補正するためには、原稿を角度θ回転させればよいので、補正後の画素(x’,y’)の画素値は下の式を満たす画素(x,y)の画素値となる。
【数2】
【0093】
従って、補正後の画素位置(x’,y’)の画素値を得るために参照すべき入力画像の画素位置(x,y)は、上式(4)の両辺に左側から回転行列の逆行列をかけることで下の式(5)で求められる。
【0094】
x = x’cosθ + y’sinθ
y = −x’sinθ + y’cosθ ・・・式(5)
式(5)で求められた入力画像の座標位置(x, y)は回転角θが90°の倍数以外のときは整数とならないことが多い。即ち、ピクセル単位の値にならないことが多い。そこで、座標位置(x, y)の周囲のピクセル単位(格子点)の座標位置とその画素値を用いて、例えば式(6)のように入力画像の画素を補間(バイリニア法)しながら回転処理する。これによってジャギーの発生を防ぐ。
【数3】
【0095】
なお(x0、y0)、(x1、y1)は 座標位置(x,y)の最近傍の左上の格子点と右下の格子点であり、左上を原点としている。
【0096】
以上説明したように、本実施形態においては、文書中に信頼できる線分がある場合は線分情報を用いてスキュー角度を検知し、信頼できる線分がないと判断した場合にのみ第2の識別手段によってスキュー角を検知する。これにより、処理時間を浪費することなくスキュー補正することが可能となる。
【0097】
[第5の実施の形態]
第5の実施の形態の画像形成装置は図10に示す第3の実施の形態の画像形成装置と同じ構成をとる。従って、第3の実施の形態の画像形成装置と同じ参照符号を用いて、その構成についての詳細説明は割愛する。
第5の実施の形態における画像形成装置は図3で説明した高圧縮PDFファイルを生成するとともに、原稿の向きおよび入力傾きを検知・補正する。なお、本実施形態においてスキュー検知は線分を用いずに文字画素のみを用いる。
【0098】
現在よく使用されるスキュー検知および文書向き検知は入力文書画像に文字が多数含まれていることを前提とした処理になっている。しかし、文字数が少ない場合にはその検知精度が低くなってしまう。
【0099】
そこで、第5の実施の形態においては、第3の実施の形態と同様に第1の識別手段1002(図10)がエッジ抽出を行い、判断手段1003がラベリング処理を実行して外接矩形数を計数する。ここで外接矩形数があらかじめ決めておいた閾値(例えば100)未満の場合、十分なスキュー・文書向きの検知精度が得られないと判断し、第2の識別手段1004を実行しない。スキュー・文書向き検知を行わないと判断した場合、第1の画像処理手段1005はスキュー・文書向き補正は行わず、第1の実施の形態で説明した方法により高圧縮PDFを生成する。
【0100】
判断手段1003がスキュー・文書向き検知を行うべきと判断した場合、第2の識別手段1004がスキュー・文書向きの検知処理を行う。スキュー検知については第4の実施形態と同様の処理を行えばよいので説明は割愛する。文書向き検知はOCRを使用して行う。まず任意の文字列を抽出しその文字列画像に対し0°、90°、180°、270°の4方向に画像回転しOCRの類似度を算出する。その類似度が最も高い角度を正しい文書向きと検知する。このように第2の識別手段にて原稿傾きと文書向きを検知した場合、第2の画像処理手段1006が原稿傾きと文書向きを補正し、高圧縮PDF作成を実行する。
【0101】
以上説明した各実施の形態の画像形成装置では、像域識別処理を前半の第1の識別処理と後半の第2の識別処理に分割し、入力文書画像に応じて第2の識別手段を実施するか否かを判断する。ここで第1の識別処理は入力文書画像に精度・速度が依存しない処理である。また、第2の識別手段を実施するか否かを判断する判断手段においては第2の識別手段にて使用する信号を入力、あるいは生成しその信号を基に判断する。
【0102】
文書の複雑さを判断した結果、簡素な文書である場合には第1の識別手段より出力された第1の識別信号と判断手段より出力された判断信号を基に第2の識別処理を実施し、第2の識別信号を基に画像処理を行う。一方で、文書が複雑であると判断した場合には第2の識別処理は行わず第1の識別信号を用いて画像処理を行う。
【0103】
なお、第1の識別手段と第2の識別手段が備える機能は上述の入力文書画像に精度・速度が依存するかどうかのみによって分類されるものではない。図17は、第1及び第2の識別手段の機能を分類して示す図である。本願発明の第1の識別手段と第2の識別手段は、この図17に示す機能によって分類することができ、逆にこの機能によって分類される第1の識別手段と第2の識別手段とは本願発明の技術的範囲に含まれる。
【0104】
これらの形態の画像形成装置によれば、複雑な画像が入力された場合には、処理時間が膨大になったり画質不具合が起こったりする危険性を軽減してユーザの希望に近い画像を形成することが可能となる。また、複雑ではない(標準的な)画像が入力された場合には、第1の識別手段・判定手段・第2の識別手段いずれも本来必要な処理のみで構成されていることから、処理時間、識別精度に影響を与えることなくユーザが期待する出力画像を得られる。
【0105】
尚、本発明は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。
また、上記実施形態に開示されている複数の構成要素の適宜な組み合せにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。更に、異なる実施形態に亘る構成要素を適宜組み合せてもよい。
【産業上の利用可能性】
【0106】
本発明は、入力文書画像に依存する像域識別処理時間の増加を低減するとともに、出力画像の画質劣化の危険性を軽減して、ユーザの期待に近い出力画像を得ることができる画像形成装置を製造する産業で利用することができる。
【符号の説明】
【0107】
101…画像入力手段、102…第1の識別手段、103…判断手段、104…第2の識別手段、105…画像処理手段、301…入力画像、302…背景画像、302…多値画像、303…文字画像、303…文字用画像、401…画像入力手段、402…識別手段、403…エッジ抽出手段、404…外矩生成手段、405…文字列・文字領域抽出処理手段、406…画像処理手段、801…画像入力手段、802…第1の識別手段、803…前処理手段、804…判断手段、805…第2の識別手段、806…画像処理手段、1002…第1の識別手段、1003…判断手段、1004…第2の識別手段、1005…第1の画像処理手段、1006…第2の画像処理手段。
【先行技術文献】
【特許文献】
【0108】
【特許文献1】特開2005−175641号公報
【特許文献2】特開2003−008909号公報
【特許文献3】特開2000−020726号公報
【技術分野】
【0001】
本発明は、画像形成装置及び画像処理方法に関し、特に、文書画像に像域識別処理を施して画像形成するための技術に関する。
【背景技術】
【0002】
文書画像に像域識別処理を行い、その識別結果に基づいて適用する画像処理を切り替えて画像形成する技術が知られている。特に最近では画質を保ったままデータ量を削減することを目的に、文字と写真とを分離し、文字は解像性を重視し、写真は階調性を重視してそれぞれに適した画像処理・圧縮処理を施して電子ファイル化する技術がある。
【0003】
例えば、特許文献1に記載の技術では、処理対象となった画像データにレイアウト解析処理を適用し、その結果に基づいて文字部分の画像要素を特定し、文字部分として特定された画像要素と、それ以外の部分とについて、互いに異なる圧縮方法で圧縮処理を行うことで文字の可読性を保ったまま高圧縮な画像ファイル(高圧縮PDF)を得ている。
【0004】
また、前述した像域識別処理については特許文献2及び特許文献3に開示された技術が知られている。
特許文献2に記載の技術では、処理対象を2値化した後、その黒画素群の連結成分の外接矩形のサイズのみに基づいて黒画素が文字か否かを判断する。
特許文献3に記載の技術では、ある特定画素群の外接矩形の集合のサイズや並び方に基づいて文字列、文字列領域を抽出する。
【発明の概要】
【発明が解決しようとする課題】
【0005】
特許文献2に記載の技術では、誤識別が起こりにくく、また、高速に処理することができるが、写真中の文字が抽出できないなど適用できる対象が狭い。そのため、この識別結果を利用して前述の高圧縮な画像ファイルを形成した場合、黒文字以外の文字では文字がぼやけて可読性が悪化し、また、高い圧縮効果を得ることが難しいという問題点がある。
【0006】
一方、特許文献3に記載の技術では、前者と比較して多様な文字を抽出することが可能である。しかし、網点下地を多く含んでいる文書画像、あるいは、複雑な構成である文書画像が入力された場合、その外接矩形の数が膨大となりレイアウト解析処理に非常に大きな時間を要することがある。また、レイアウト解析処理で誤識別を起こす危険性も高くなる。大きな処理時間を要する点に関しては、所定の処理時間内でのみ識別処理を実施し、処理時間を超過した場合は識別処理を実施しないという退避方法も考えられるが、結果としてユーザが望む画像を形成することができない。
【0007】
本発明は斯かる事情に鑑みてなされたものであって、入力文書画像に依存する像域識別処理時間の増加を低減するとともに、出力画像の画質劣化の危険性を軽減して、ユーザの期待に近い出力画像を得ることのできる画像形成装置及び画像処理方法を提供することを目的とする。
【課題を解決するための手段】
【0008】
上記課題を解決するための本発明は、紙原稿を含む原稿から画像情報を取得して入力画像を生成する画像入力手段と、入力画像に対して第1の像域識別処理を行って画像の属性を示す第1の識別信号を出力する第1の識別手段と、前記第1の識別信号を入力し、前記第1の像域識別処理に続く第2の像域識別処理を行って画像の属性を示す第2の識別信号を出力する第2の識別手段と、前記第1の識別信号を入力し、前記第2の識別手段を実行すべきか否かを示す判断信号を出力する判断手段と、前記判断信号が実行すべきではないと示している場合には前記第1の識別信号を第3の識別信号として選択し、前記判断信号が実行すべきと示す場合には、前記第2の識別信号を前記第3の識別信号として選択する選択手段と、前記入力画像と前記第3の識別信号とを入力して画像処理を実行する画像処理手段とを備える画像形成装置である。
【0009】
また本発明は、紙原稿を含む原稿から画像情報を取得して入力画像を生成する画像入力手段と、入力画像に対して第1の像域識別処理を行って画像の属性を示す第1の識別信号を出力する第1の識別手段と、前記第1の識別信号を入力し、前記第1の像域識別処理に続く第2の像域識別処理の前処理を行って前処理信号を出力する前処理手段と、前処理信号を入力し、前記第2の像域識別処理を行って画像の属性を示す第2の識別信号を出力する第2の識別手段と、前処理信号を入力し、前記第2の識別手段を実行すべきか否かを示す判断信号を出力する判断手段と、前記判断信号が実行すべきではないと示している場合には前記第1の識別信号を第3の識別信号として選択し、前記判断信号が実行すべきと示す場合には、前記第2の識別信号を前記第3の識別信号として選択する選択手段と、前記入力画像と前記第3の識別信号とを入力して画像処理を実行する画像処理手段とを備える画像形成装置である。
【0010】
また本発明は、紙原稿を含む原稿から画像情報を取得して入力画像を生成する画像入力手段と、入力画像に対して第1の像域識別処理を行って画像の属性を示す第1の識別信号を出力する第1の識別手段と、前記第1の識別信号を入力し、前記第1の像域識別処理に続く第2の像域識別処理を行って画像の属性を示す第2の識別信号を出力する第2の識別手段と、前記第1の識別信号を入力し、前記第2の識別手段を実行すべきか否かを示す判断信号を出力する判断手段と、前記判断信号が実行すべきではないと示している場合は、前記入力画像と前記第1の識別信号とを入力して画像処理を実行する第1の画像処理手段と、前記判断信号が実行すべきと示している場合は、前記入力画像と前記第2の識別信号とを入力して画像処理を実行する第2の画像処理手段とを備える画像形成装置である。
【0011】
また本発明は、紙原稿を含む原稿から画像情報を取得して入力画像を生成し、前記入力画像に対して第1の像域識別処理を行って画像の属性を示す第1の識別信号を生成し、前記第1の識別信号に、前記第1の像域識別処理に続く第2の像域識別処理を行って画像の属性を示す第2の識別信号を生成し、前記第1の識別信号から前記第2の識別手段を実行すべきか否かを示す判断信号を生成し、前記判断信号が実行すべきではないと示している場合には前記第2の像域識別処理を行わずに前記第1の識別信号を第3の識別信号として選択し、前記判断信号が実行すべきと示す場合には、前記第2の識別信号を前記第3の識別信号として選択し、前記入力画像と前記第3の識別信号とに前記第2の像域識別処理を行わずに画像処理を実行する画像処理方法である。
【発明の効果】
【0012】
本発明の画像形成装置及び画像処理方法によれば、入力文書画像に依存する像域識別処理時間の増加を低減するとともに、出力画像の画質劣化の危険性を軽減して、ユーザの期待に近い出力画像を得ることができる。
【図面の簡単な説明】
【0013】
【図1】第1の実施の形態の画像形成装置の構成を示す図。
【図2】第1の実施の形態の画像形成装置の概略の処理手順を示すフローチャート。
【図3】第1の実施の形態の出力ファイルのデータ形式を示す図。
【図4】従来の画像形成装置を示す図。
【図5】ラベリング処理を説明する図。
【図6】エッジ画像の連結成分の外接矩形と文字成分を例示する図。
【図7】画像処理手段の一構成例を示すブロック図。
【図8】第2の実施の形態の画像形成装置の構成を示す図。
【図9】第2の実施の形態の画像形成装置の概略の処理手順を示すフローチャート。
【図10】第3の実施の形態の画像形成装置の構成を示す図。
【図11】第3の実施の形態の画像形成装置の概略の処理手順を示すフローチャート。
【図12】第3の実施の形態の第1の画像処理手段で生成されるPDFファイルのデータ形式を説明する図。
【図13】第1の画像処理手段の一構成例を示すブロック図。
【図14】MRC形式と他の形式との画像のデータサイズを比較して示す図。
【図15】文字色検出手段の動作例を示す図。
【図16】射影像の計算方法を説明する図。
【図17】第1及び第2の識別手段の機能を分類して示す図。
【発明を実施するための形態】
【0014】
[第1の実施の形態]
図1は、第1の実施の形態の画像形成装置の構成を示す図であり、図2は、第1の実施の形態の画像形成装置の概略の処理手順を示すフローチャートである。図1及び図2を参照しつつ画像形成装置の構成と動作について説明する。
【0015】
画像入力手段101は、入力された紙原稿を画像信号に変換する、例えば、MFPのスキャナである。アクト201において、画像入力手段101は、変換した入力画像信号111を出力する。アクト202において、第1の識別手段102は、入力画像信号111を入力してエッジ抽出・黒画素抽出などにより入力画像の比較的狭い範囲の画素を参照して第1の識別処理を実行し、画素属性を示す第1の識別信号112を出力する。アクト203において、判断手段103は、第1の識別信号112を入力して入力文書画像の複雑さを判断し、入力文書画像が複雑であるか否かを示す判断信号113を出力する。
【0016】
アクト204において、第2の識別手段104は、第1の識別信号112を入力して第2の識別処理を実行して文字列・文字領域を抽出し、第2の識別信号114を出力する。但し、判断信号113が“入力文書が複雑である”ことを示している場合には、第2の識別手段は処理を実施せず、“入力文書が複雑ではない(標準的である)”ことを示している場合に、第2の識別手段は処理を実施する。
【0017】
アクト205において、画像処理手段105は、入力画像信号111と第1の識別信号112あるいは第2の識別信号114とを入力して画像処理を実施する。ここで、判断信号113が“入力文書が複雑である”ことを示している場合には、第1の識別信号112が識別信号として入力される。判断信号113が、“入力文書が複雑ではない(標準的である)”ことを示している場合には第2の識別信号114が識別信号として入力される。
【0018】
なお、第1の実施の形態における第1の識別手段102ならび、第2の識別手段104は公知の技術を使用することができる。例えば、特開2000−20726号公報に記載の文字領域抽出部と同様の処理を使用することができる。
【0019】
続いて、第1の実施の形態を具体的に説明する。
第1の実施の形態では画像形成装置としてMFP(多機能複合機)を例として、当該MFPのスキャン機能として標準的に搭載されている高圧縮PDF生成を説明する。
【0020】
図3は、第1の実施の形態の出力ファイルのデータ形式を示す図である。
一般に高圧縮PDFと呼ばれる電子ファイルであっても、ファイル内のデータフォーマットは様々である。第1の実施の形態の高圧縮PDFにおいては、図3に示す入力画像301から文字・自然画などのオブジェクトを切り出し、その属性に適した方式で圧縮し結合することで高圧縮を実現する。
【0021】
即ち、このデータ形式では、150dpiの背景画像302の上に、(図では表現できていないが)色毎に分割された300dpiの2値の文字画像303を重ねて表現する。ここで、文字画像303は“0”“1”の2値を有している。文字画像303では白画素に当る“0”値の画素は、重ね合わせの下の層にある背景画像302を透過して描画し、黒画素に当る“1”値の画素は、別に指定されている色で描画する。文字画像は300dpiで表現するためはっきりと表わされ、文字以外の部分は解像度を150dpiに落としているため、ファイルサイズを削減できる。
【0022】
ここで、比較のために従来の画像形成装置の構成と動作について説明する。図4は、従来の画像形成装置を示す図である。
【0023】
画像入力手段401は、入力画像信号411を出力する。識別手段402は、入力画像信号411に基づいて識別信号412を出力する。画像処理手段406は、入力画像信号411と識別信号412とを入力して高圧縮PDFファイルを生成して出力する。
【0024】
ここで、識別手段402は、エッジ抽出手段403、外矩生成手段(ラベリング手段)404及び文字列・文字領域抽出処理手段405を備えている。
【0025】
エッジ抽出手段403は、入力画像信号411を入力して、入力画像中のエッジ画素を抽出したエッジ画像を出力する。エッジ抽出手段としては様々な手法が提案されているが、例えば式(1)に示す変換式で輝度値Yを求めた後に、下の行列に示す単純なSobelフィルタを使用して抽出する。
【0026】
Y = 0.257R+0.504G+0.098B+16 ・・・式(1)
(ここで、R,G,Bは各画素の信号値)
【数1】
【0027】
外矩生成手段(ラベリング)404は、エッジ抽出手段403より出力されたエッジ画像を入力して、エッジ画素の連結成分の外接矩形を生成した外矩画像を出力する。外接矩形を生成するために、外矩生成手段(ラベリング)404は、ラベリング処理を実行する。
【0028】
図5は、ラベリング処理の一例を説明する図である。なお、ラベリングの手法は様々なものが提案されており、いずれを選択してもよいことはいうまでもない。
入力画像501は、“0” “1”の2値画像である。入力画像501に対して左上の画素を始点とし、左→右、上→下の順で全画素を走査してラベルを付ける。いま、走査する画素を注目画素とすると、対応する参照画素の状況に応じて注目画素に付けるラベル(数字)を決定する。注目画素と参照画素とを示す例502で規定する処理方法では、注目画素(○)が黒画素であった場合、注目画素の左、左上、上、右上の位置にある参照画素(*)の値に応じて注目画素のラベルが定められる。
【0029】
例えば、次のようなルールでラベルを付ける。
*参照画素に黒画素が一つもなかった場合、0から始めて昇順に数値を付番する。
*参照画素に1種類のラベルがあった場合、参照画素にあるのと同じラベルを付ける。
*参照画素に2種類以上のラベルがあった場合、参照画素にある中で一番若い番号のラベルを付ける。更に、その異なる番号のラベルが同一ラベルであることを記録しておく。
【0030】
左上(1行×1列)の画素を注目画素とすると、参照画素は領域外となり黒画素は存在しない。従って、新しいラベル“0”を付ける。次に右側(1行×2列)の画素を注目画素とすると、1行×1列の参照画素が黒画素である。従って、参照画素(1行×1列)にあるのと同じラベル“0”を付ける。
【0031】
更に右側に進んだ、(1行×3列)の画素と(1行×4列)の画素は白画素である。従って、この注目画素についてはブランクとしてラベルを付与しない。右上(1行×5列)の画素を注目画素とすると、参照画素には黒画素は存在しない。従って、昇順の新しいラベル“1”を付ける。
【0032】
(4行×4列)の画素を注目画素とすると、注目画素の左側の参照画素は既に“0”のラベルが付いているのに対し、上側の参照画素は“1”のラベルが付いている。従って、注目画素に対しては“0”と“1”のうち若い番号である“0”のラベルを付ける。更に、“0”と“1”が同じラベルであることを記録しておく。
【0033】
左下(5行×1列)の画素を注目画素とすると、参照画素には黒画素は存在しない。従って、新しいラベルを付ける。この時、ラベル“0”と“1”は既に使用されているので新しいラベル“2”を付ける。
【0034】
このようにして、1回目の走査が終了した後のラベルの状態をラベリング結果503に示す。このラベリング結果503をみると、本来同じラベルを持つべき連結成分が“0”というラベルを持った画素と“1”というラベルを持った画素の2つのグループに分けられていることがわかる。
【0035】
次にラベルの統一処理を実施する。上述のように、左から4番目・上から4番目の画素を注目画素とした時に、“0”と“1”が同一ラベルであることは別に記録されている。このような場合には若い数字にラベルを統一する。すなわちラベリング結果503において“1”というラベルが付いた画素は“0”とラベルをつけ直す。この処理結果をラベリング結果504に示している。ラベリング結果504に示すように、本来一つの連結成分となるべきグループの画素全てが同じラベルになる。
【0036】
最後に空きラベルの修正処理を実行する。統一処理を行った結果として空きラベルが発生した場合は、ラベルの番号を詰め直す。ラベリング結果504の例ではラベル“1”が空き番号になるので“2”以降のラベルの番号を詰める。ラベリング結果505は、このようにして最終的に得られるラベリング結果を示している。
【0037】
同じラベルが付与された画素の(x座標,y座標)の最小値の組、最大値の組がそれぞれ連結成分の外接矩形の左上頂点、右下頂点の(x座標,y座標)となるので、ラベリング処理の結果からエッジ画素の連結成分の外接矩形を生成することができる。
【0038】
文字列・文字領域抽出処理手段405は、外矩生成手段404から出力された外矩画像を入力とし、識別信号412を出力する。図6は、エッジ画像の連結成分の外接矩形と文字成分を例示する図である。
【0039】
具体的には、文字列・文字領域抽出処理手段405は、エッジ画像の連結成分の外接矩形画像601を入力した場合(図中の一点鎖線が外接矩形)、接触・交差・内包している矩形同士を結合し文字成分602を生成する。そして、文字列・文字領域抽出処理手段405は、このようにして生成された文字成分について
・自身のサイズが極端に大きかったり小さかったりしないか?
・矩形の縦横比は1に近いか(矩形の形状は正方形に近いか)?
・水平方向の近傍の文字成分とサイズが揃っているか?y座標が揃っているか?
・垂直方向の近傍の文字成分とのサイズが揃っているか?x座標が揃っているか?
など文字列らしい特性を持っているかという基準から文字列生成を行うと共に、更に文字列らしさ、文字列の並び方から文字領域であるか否かを判定する。
【0040】
ここで、文字列・文字領域抽出の過程では、矩形の削除および矩形同士の結合が繰り返して実行される。そのため、処理対象となる文字成分が多い場合には、処理時間が膨大になってしまう。また、文字成分が多いということは、文字と誤識別しやすい網点やノイズも多いため識別精度が悪い可能性が高いことも示している。
【0041】
画像処理手段406について説明する。図7は、画像処理手段の一構成例を示すブロック図である。この画像処理手段406は、図3に示したデータ形式の画像ファイルを得るための構成である。
【0042】
文字画素検出手段701は、入力画像信号に基づいて像域識別処理を実行し、識別信号を出力する。即ち、文字画素検出手段701は、図4の識別手段402に該当するため、その詳細の説明は省略する。
【0043】
まず背景用の多値画像302の作成処理を説明する。文字周囲色検出手段702は、文字周囲の色を検出する。検出する方法としては、例えば文字との距離が3画素以内の画素を抽出し、その画素値の平均値を求めて文字周囲色とする。次に文字塗りつぶし手段703は、文字画素を検出した文字周囲色に置き換える。これによって文字が周囲の背景色によって塗りつぶされる。最後に画像縮小手段704が縮小処理を実行し、その後多値画像圧縮手段705がJPEGなどの多値画像圧縮を実行して背景用画像を作成する。
【0044】
なお、文字塗りつぶし手段703が文字を塗りつぶすのは、JPEGに代表される多値画像圧縮は一般に空間周波数の高周波成分が多い画像の圧縮は苦手な傾向があるため、高周波成分を含む文字を消すことによって圧縮率を高めるためである。
【0045】
次に文字用画像303の作成処理を説明する。まず文字色検出手段706が各文字画素の文字色を検出する。具体的には、例えば、類似する色の文字画素をグルーピングし、そのグループの文字画素のRGB平均値を文字色とする。一方、この処理と並行して2値化手段707は、文字画素が“1”、非文字画素が“0”となるように2値画像を生成する。
【0046】
文字色による2値画像分割手段708が、生成した2値画像を文字色検出手段706がグルーピングした色毎の2値画像に分割する。そして、2値画像圧縮手段709が、分割後の2値画像に対してMMRなどの2値画像圧縮を施して文字用画像を作成する。
なお、色毎に文字画素をグルーピングし2値画像を分割する理由は、2値画像であるため、一つの画像では背景と前景(文字)の2色しか表現できないためである。
【0047】
以上、従来の画像形成装置の構成と動作について説明した。上述のように、従来の画像形成装置では入力文書画像が複雑であった場合、像域識別手段における処理時間が膨大となったり、あるいは、識別精度が不十分なため画質不具合が生じる危険性が高い。
【0048】
図1に示す第1の実施の形態の画像形成装置は、このような問題点の発生を防止する。第1の実施の形態の画像形成装置の構成と動作を従来の画像形成装置と比較させて、図1と図4とを参照しつつ説明する。
【0049】
第1の実施の形態の画像形成装置では、従来の画像形成装置の識別手段402(図4)を、第1の識別手段102(図1)と第2の識別手段104(図1)とに分割する。ここで、第1の識別手段102(図1)は、従来の画像形成装置のエッジ抽出手段403(図4)に相当し、第2の識別手段104は、従来の画像形成装置の外矩生成手段404(図4)および文字列・文字領域抽出処理手段405(図4)に相当する。
【0050】
第1の実施の形態の画像形成装置では、判断手段103(図1)が文書複雑さを判断する。即ち、判断手段103(図1)は第1の識別信号112(図1)を入力し、文書が複雑であるか否かの判断信号113(図1)を出力する。
【0051】
ここで、文書画像複雑さの判断手段103(図1)について説明する。上述のように、第2の識別手段104、即ち、従来の画像形成装置の外矩生成手段404(図4)および文字列・文字領域抽出処理手段405(図4)はエッジ画像の外接矩形数に依存して処理時間が膨大になりあるいは識別精度が悪化する恐れが高くなる。ここで、エッジ画素の外接矩形の数はエッジ画素数にある程度依存すると考えられる。
【0052】
そこで、判断手段103(図1)は、第1の識別手段102即ち、従来の画像形成装置のエッジ抽出手段403(図4)から出力されるエッジ画像信号を第1の識別信号112(図1)として入力とし、そのエッジ画像を走査してエッジ画素数Neをカウントする。そして、Ne>Th1であれば入力文書が複雑であることを示す判断信号113を出力する。反対にNe<=Th1であれば、入力文書が複雑ではない(標準的である)ことを示す判断信号113を出力する。ここでTh1は予め決めておいた閾値である。
【0053】
判断信号113(図1)が“文書が複雑であること”を示している場合には、第2の識別手段104、即ち、従来の画像形成装置の外矩生成手段404(図4)および文字列・文字領域抽出処理手段405(図4)は動作しない。従って、画像処理手段105(図1)は、入力画像信号111(図1)と第1の識別信号112を入力として高圧縮PDFを出力する。
【0054】
反対に判断信号113(図1)が“文書が複雑ではない(標準的である)こと”を示している場合には、更に第2の識別手段104、即ち、従来の画像形成装置の外矩生成手段404(図4)および文字列・文字領域抽出処理手段405(図4)が動作する。従って、画像処理手段105(図1)は、入力画像信号111(図1)と第2の識別信号114を入力として高圧縮PDFを出力する。
【0055】
以上説明したとおり、第1の実施の形態では、入力文書画像が複雑な場合においても画質不具合や処理時間が膨大となる危険性が少ない高圧縮PDFファイルを作成することが可能である。
また、第1の実施の形態の文書画像複雑さ判断手段103は、第2の識別手段104に必要なデータのみを使用しており、新たなデータ入力を必要としていない。従って、処理時間に大きな影響を及ぼさずに判断することができる。更に、入力された文書画像が複雑であった場合には、従来の方式と比較して不必要な信号を生成することなく高圧縮PDFを作成することが可能である。
【0056】
[第2の実施の形態]
図8は、第2の実施の形態の画像形成装置の構成を示す図であり、図9は、第2の実施の形態の画像形成装置の概略の処理手順を示すフローチャートである。図8及び図9を参照しつつ画像形成装置の構成と動作について説明する。
なお、第2の実施の形態の画像形成装置は、第2識別の前処理手段803を備えている点で第1の実施の形態の画像形成装置と異なっている。
【0057】
画像入力手段801は、入力された紙原稿を画像信号に変換するMFPのスキャナなどである。アクト901において、画像入力手段801は、変換した入力画像信号811を出力する。アクト902において、第1の識別手段802は、入力画像信号811を入力してエッジ抽出・黒画素抽出などにより入力画像の比較的狭い範囲の画素を参照して第1の識別処理を実行し、画素属性を示す第1の識別信号812を出力する。アクト903において、第2識別の前処理手段803は、第1の識別信号812を入力して、第2の識別手段の前処理を行い、前処理信号813を出力する。
【0058】
アクト904において、判断手段804は、前処理信号813を入力して入力文書画像の複雑さを判断し、入力文書画像が複雑であるか否かを示す判断信号814を出力する。アクト905において、第2の識別手段805は、前処理信号813を入力して文字列・文字領域を抽出し、第2の識別信号815を出力する。但し、判断信号814が“入力文書が複雑である”ことを示している場合には第2の識別手段805は処理を実施せず、“入力文書が複雑ではない(標準的である)”ことを示している場合には第2の識別手段805は処理を実施する。
【0059】
アクト906において、画像処理手段806は、入力画像信号811と第1の識別信号812あるいは第2の識別信号815とを入力として画像処理を行う。ここで、判断信号814が“入力文書が複雑である”ことを示している場合には、第1の識別信号812が識別信号として入力される。判断信号814が“入力文書が複雑ではない(標準的である)”ことを示している場合には、第2の識別信号815が識別信号として入力される。
【0060】
第2の実施の形態と第1の実施の形態との大きな違いは、第1の実施の形態では、従来の画像形成装置の識別手段402(図4)を第1の識別手段102(図1)と第2の識別手段104(図1)の2つに分割していたのに対し、第2の実施の形態においては第1の識別手段802(図8)と第2識別の前処理手段803(図8)と第2の識別手段805(図8)の3つに分割している点である。
【0061】
第2の実施の形態の各手段と従来の画像形成装置の処理ブロックとの具体的な対応は以下の通りである。
第2の実施の形態の第1の識別手段802は、従来技術のエッジ抽出手段403(図4)に対応する。第2の実施の形態の第2識別の前処理手段803は、従来技術の外矩生成手段404(図4)に対応する。第2の実施の形態の第2の識別手段805は、従来技術の文字列・文字領域抽出処理手段405(図4)に対応する。
【0062】
ここで、文書画像複雑さの判断手段804(図8)について説明する。上述したように、第2の識別手段805に対応する従来技術の文字列・文字領域抽出処理手段405(図4)は、エッジ画像の外接矩形数に依存して処理時間が膨大になったり識別精度が悪くなったりする。第1の実施の形態においては、エッジ画素数Neをカウントし、Ne > Thであるか否かを入力文書が複雑であるか否かの判断基準とした。
【0063】
第2の実施の形態においては、第2識別の前処理手段803は前処理信号813として外矩画像を出力するため、判断手段804は、文書の複雑さをより表している外矩数NrをカウントしNr>Th2であれば入力文書が複雑であると判断し、入力文書が複雑であることを示す判断信号814を出力する。反対にNr<=Th2であれば、入力文書が複雑ではない(標準的である)ことを示す判断信号814を出力する。ここでTh2は予め決めておいた閾値である。
これにより、第1の実施の形態よりさらに正確に文書の複雑さを判断することが可能となる。
【0064】
以上説明したとおり、第2の実施の形態では、第1の実施の形態よりも正確に入力文書画像の複雑さを判断することが可能であり、入力文書画像が複雑な場合においても画質不具合や処理時間が膨大となる危険性が少ない高圧縮PDFファイルを作成することが可能である。
【0065】
また、第2の実施の形態の文書画像複雑さ判断手段804は、第2の識別手段805に必要なデータのみを使用しており、新たなデータ入力を必要としていない。従って、処理時間に大きな影響を及ぼさずに判断することができる。
【0066】
[第3の実施の形態]
図10は、第3の実施の形態の画像形成装置の構成を示す図であり、図11は、第3の実施の形態の画像形成装置の概略の処理手順を示すフローチャートである。図10及び図11を参照しつつ画像形成装置の構成と動作について説明する。
なお、第3の実施の形態と第1の実施の形態との違いは入力文書画像の複雑さにより画像処理手段まで切り替える点であり、第3の実施の形態では、第1の画像処理手段1005と第2の画像処理手段1006とを有している。
【0067】
第3の実施の形態では、アクト1103において、複雑さ判断手段1003により入力画像が複雑であると判断された場合には、アクト1106において、第1の識別信号1012に基づき第1の画像処理手段1005によって第1の画像処理が施される。一方、入力画像が複雑ではない(標準的)と判断された場合には、アクト1104において、第2の識別手段1004が、第1の識別信号1012に基づき第2の識別信号1013を出力する。アクト1105において、第2の識別信号1013に基づき第2の画像処理手段1006によって第2の画像処理が施される。
【0068】
図12は、第3の実施の形態の第1の画像処理手段1005で生成されるPDFファイルのデータ形式を説明する図である。
【0069】
図12に示すデータ形式(MRC)は、マスク画像1202、背景用画像1203及び文字色用画像1204を備えている。マスク画像1202は、“0”“1”の2値を持った300dpiの画像である。背景用画像1203は、入力画像から文字を消去した150dpiの画像である。文字色用画像1204は、文字色を特定するための75dpiの画像である。
【0070】
第3の実施の形態ではマスク画像1202が黒画素の位置には文字色用画像1204を選択し、白画素の位置には背景用画像1203を選択して表示する。それにより、文字の形状は300dpiのマスク画像に依存するため、文字ははっきりさせたまま文字以外の解像度を落とすことでファイルサイズの削減を実現している。
なお、第3の実施の形態の第2の画像処理手段1006で作成されるPDFファイルのデータ形式は、第1の実施の形態の画像処理手段105(図1)で生成される図3に示すPDFファイルと同じデータ形式とする。
【0071】
図13は、第1の画像処理手段1005の一構成例を示すブロック図である。
【0072】
文字画素検出手段1301は、入力画像信号に基づいて像域識別処理を実行し、識別信号を出力する。即ち、文字画素検出手段1301は、図10の第1の識別手段1002に該当するため、その詳細の説明は省略する。
【0073】
まずマスク画像1202の作成動作を説明する。2値化手段1302は、例えば文字画素を“1”,文字以外の画素を“0”とする2値画像を生成する。2値画像圧縮手段1303は、生成した2値画像に対しMMRなどの2値圧縮を施してマスク画像1202を作成する。
【0074】
次に、背景用画像1203の作成動作を説明する。文字周囲色検出手段1304は、文字周囲の色を検出する。検出する方法としては、例えば文字との距離が3画素以内の画素を抽出し、その画素値の平均値を求めて文字周囲色とする。次に文字塗りつぶし手段1305は、文字画素を検出した文字周囲色に置き換える。これによって文字が周囲の背景色によって塗りつぶされる。最後に第1の画像縮小手段1306が縮小処理を実行し、その後第1の多値画像圧縮手段705がJPEGなどの多値画像圧縮を実行して背景用画像を作成する。
【0075】
なお、文字塗りつぶし手段1305が文字を塗りつぶすのは、JPEGに代表される多値画像圧縮は一般に空間周波数の高周波成分が多い画像の圧縮は苦手な傾向があるためであり、高周波成分を含む文字を消すことによって圧縮率を高めるためである。
【0076】
次に、文字色用画像1204の作成動作を説明する。まず、非文字消去手段1308が入力画像から文字以外を消去する。具体的には文字検出手段1301で文字として検出されなかった画素を白画素で置き換える。次に文字画素膨張手段1309が文字画素を膨張させる。具体的には、色画素の8近傍にある白画素をその色で置き換える処理を、全ての色画素に対して繰り返す。なお、この文字画素膨張処理も背景用画像1203と同様に高周波成分をなくすために文字形状を残さないための処理である。そのため、繰り返し回数を大きくすれば処理時間が大きくなるものの圧縮ファイルサイズを小さくできる。
【0077】
なお、膨張処理をある回数繰り返すとファイルサイズは減少しなくなるが、その回数は入力解像度に依存する。例えば、解像度が低いほど少ない繰り返し回数でファイルサイズの減少は限界となる。文字画素膨張後の画像に対して第2の画像縮小手段1310が縮小処理を実行し、その後第2の多値画像圧縮手段1311が、多値画像圧縮を実行して文字色用画像1204を作成する。
【0078】
次に、データ形式をMRC形式にした理由を説明する。
図12に示すように、第1の画像処理手段1005により出力されるMRC形式では背景用の150dpiの多値画像と文字形状用のマスク画像300dpiの2値画像および文字色用の75dpiの多値画像により構成されている。それに対し、図3に示すように、第2の画像処理手段1006により出力される形式では背景用の150dpiの多値画像と文字用の300dpiの2値画像により構成される。
【0079】
それぞれを構成する各画像のデータサイズを比較すると、図14に示す通り、前者(MRC形式)と後者の背景用画像は、ほぼ同じデータサイズである。また、前者(MRC形式)のマスク画像と後者の文字用画像も、ほぼ同じデータサイズである。そのため、文字色用画像のデータサイズ分、前者(MRC形式)の方がファイルサイズが大きくなりやすい。しかし、後者の形式では、MRC形式より高精度な処理が要求される。具体的には、後者の形式でのみ必要な文字色検出手段706(図7)は高い精度が要求される。
【0080】
図15は、文字色検出手段の動作例を示す図である。
図15の文字画像1501は、文字色検出手段706に入力される画像の例である。この文字画像1501の1行目(アルファベット)、2行目(数字)、3行目(平仮名)は、全て異なる文字色である。
【0081】
文字色ごとにグルーピングする際に文字画像1502に示すように文字色とグループが1対1対応し、かつ、そのグループの色を正しく抽出できれば、文字画像1503に示すように、出力電子画像ファイル中の文字画像を入力画像とほぼ同様に表現できる。しかし、例えば文字画像1504に示すように第1行目〜第3行目の複数色の文字を誤って一つの文字色グループとしてしまった場合、文字画像1505に示すように出力電子画像ファイル中の文字画像はただ1色(本例では3行の平均色のただ1色)で表現されてしまう。
【0082】
また、文字画像1506に示すように一文字一文字でグルーピングしてしまった場合、あるいは文字画像1507に示すように文字列中で一文字だけ抽出文字色を間違えてしまった場合には、同一色の文字列の中で異なる色の文字が発生してしまい非常に違和感のある画像を出力する危険性もある。
また、画像データサイズ自体は文字画像1503、1505、1507ともほぼ同じだが、文字画像1506のように細かく分割しすぎると、出力の電子画像ファイルを構成するためのオーバーヘッドが大きくなり、この結果ファイルサイズが大きくなることもありうる。
【0083】
すなわち、入力画像が複雑な場合に第2の画像処理手段1006を実行すると文字色を間違える危険性が高いため、第3の実施の形態においては第1の画像処理手段1005にてMRC形式のPDFファイルを作成するようにしている。
【0084】
以上で説明したとおり、第3の実施の形態では、入力文書画像が複雑であった場合であっても画質不具合や処理時間が膨大となる危険性が少ない高圧縮PDFファイルを作成することが可能である。さらに、本第3の実施の形態における文書画像複雑さ判断処理は、像域識別処理に必要なデータのみを使用しており、新たなデータ入力を必要としていない。従って、標準的な画像が入力された場合の処理時間に悪影響を及ぼさずに判断が可能である。
【0085】
第1〜第3の実施の形態においては、高圧縮PDFを具体例にして、文書が複雑なために処理時間が膨大となりあるいは画質不良が生じるなどの不具合を防止することのできる画像処理技術について説明した。以下の形態では、高圧縮PDF以外への本画像処理技術の適用の例を挙げる
[第4の実施の形態]
第4の実施の形態の画像形成装置は図1に示す画像形成装置と同じ構成をとる。従って、第1の実施の形態の画像形成装置と同じ参照符号を用いて、その構成についての詳細説明は割愛する。なお、本実施形態における画像形成装置は原稿の入力傾きを検知・補正する装置とする。
【0086】
文書画像には文字が多く含まれるため、画像を決められた角度ステップで回転しながら文字画素をx軸へ射影するとその先鋭度から傾き角度を検知することができる。しかし、回転する角度を細かいステップで処理すると、画像を回転する処理は多くの時間を要するため、処理時間が大きくなり、回転する角度を粗いステップで処理すると精度が低下するとのトレードオフが生じる。
一方、表などの線分を多く含む文書画像であれば、その線分を抽出できれば線分の傾き角度を求めるだけで比較的高速に傾き角を検知することが可能である。
【0087】
次に、図1を参照しつつ画像処理装置の動作を説明する。第1の識別手段102は、文字・線分画素の抽出とラベリングを実施する。具体的には第1実施例と同じ手法でエッジ抽出とそのエッジ画素のラベリングを実施する。更に、同一ラベルの画素のx座標y座標の最大最小値から連結成分の外接矩形を生成する。更にその外接矩形が下の条件を満たせば、外接矩形の対角線を線分と見なす。
【0088】
条件1:縦横比がある閾値以上(例えば100以上)である。
条件2:(A)矩形の右上・左下頂点が黒画素で、かつ、左上・右下頂点が白画素である。または、(B)左上・右下頂点が黒画素で、かつ、右上・左下頂点が白画素である。
【0089】
次に判断手段103は、線分情報を用いてスキュー(傾き)検知できるか否かを判断する。ここで、文書に使用される線分は水平または垂直であると仮定している。
判断手段103は、第1の識別手段において識別された線分の傾き角の平均と分散を求める。それぞれの線分の角度は単純にθ=tan−1(w/h)として求める。ただし、上記(B)のパターンの場合は符号を逆転させてθ=−tan−1(w/h)とする。ここでw,hはそれぞれ矩形の幅、高さである。このようにして判断手段103は、各線分の傾き角度を算出する。そして、その傾き角度の分散値がある閾値未満であれば、線分の傾き角の平均値θを文書全体のスキュー角度として使用できると判断する。
【0090】
一方、判断手段103が、線分の傾き角を使用できないと判断した場合には、第2の識別手段104は、文字と見なされる外接矩形を予め決めていた角度ステップで回転させながらx軸へ射影し、そのヒストグラム形状から傾き角を検知する。
ここで、文字は正方形に近い形状であることから外接矩形の縦横比がある閾値(例えば2)未満のものを文字と見なす。また、実画像を回転させながらx軸への射影を求めると処理時間が膨大になってしまうため、実際は計算により射影を求める。
【0091】
図16は、射影像の計算方法を説明する図である。図16(1)が傾きの無い状態での外接矩形の座標を表している。その左上座標は(x0,y0)、幅・高さは(sx,sy)である。図16(2)は、座標軸を角度θ回転させた状態を表している。その外接矩形のx軸への射影は下記式(2)、式(3)で表されるα〜βの範囲となる。
α = x0cosθ − y0sinθ ・・・式(2)
β = (x0+sx)cosθ − (y0+sy)sinθ ・・・式(3)
この射影を文字と見なされる全ての外接矩形について行い、その射影の長さのヒストグラム形状が最も尖鋭である角度θを文書のスキュー角度と検知する。
【0092】
続いて、画像処理手段105における傾き補正方法について説明する。第1の識別手段または第2の識別手段により求められた原稿傾き角度をθとすると、傾きを補正するためには、原稿を角度θ回転させればよいので、補正後の画素(x’,y’)の画素値は下の式を満たす画素(x,y)の画素値となる。
【数2】
【0093】
従って、補正後の画素位置(x’,y’)の画素値を得るために参照すべき入力画像の画素位置(x,y)は、上式(4)の両辺に左側から回転行列の逆行列をかけることで下の式(5)で求められる。
【0094】
x = x’cosθ + y’sinθ
y = −x’sinθ + y’cosθ ・・・式(5)
式(5)で求められた入力画像の座標位置(x, y)は回転角θが90°の倍数以外のときは整数とならないことが多い。即ち、ピクセル単位の値にならないことが多い。そこで、座標位置(x, y)の周囲のピクセル単位(格子点)の座標位置とその画素値を用いて、例えば式(6)のように入力画像の画素を補間(バイリニア法)しながら回転処理する。これによってジャギーの発生を防ぐ。
【数3】
【0095】
なお(x0、y0)、(x1、y1)は 座標位置(x,y)の最近傍の左上の格子点と右下の格子点であり、左上を原点としている。
【0096】
以上説明したように、本実施形態においては、文書中に信頼できる線分がある場合は線分情報を用いてスキュー角度を検知し、信頼できる線分がないと判断した場合にのみ第2の識別手段によってスキュー角を検知する。これにより、処理時間を浪費することなくスキュー補正することが可能となる。
【0097】
[第5の実施の形態]
第5の実施の形態の画像形成装置は図10に示す第3の実施の形態の画像形成装置と同じ構成をとる。従って、第3の実施の形態の画像形成装置と同じ参照符号を用いて、その構成についての詳細説明は割愛する。
第5の実施の形態における画像形成装置は図3で説明した高圧縮PDFファイルを生成するとともに、原稿の向きおよび入力傾きを検知・補正する。なお、本実施形態においてスキュー検知は線分を用いずに文字画素のみを用いる。
【0098】
現在よく使用されるスキュー検知および文書向き検知は入力文書画像に文字が多数含まれていることを前提とした処理になっている。しかし、文字数が少ない場合にはその検知精度が低くなってしまう。
【0099】
そこで、第5の実施の形態においては、第3の実施の形態と同様に第1の識別手段1002(図10)がエッジ抽出を行い、判断手段1003がラベリング処理を実行して外接矩形数を計数する。ここで外接矩形数があらかじめ決めておいた閾値(例えば100)未満の場合、十分なスキュー・文書向きの検知精度が得られないと判断し、第2の識別手段1004を実行しない。スキュー・文書向き検知を行わないと判断した場合、第1の画像処理手段1005はスキュー・文書向き補正は行わず、第1の実施の形態で説明した方法により高圧縮PDFを生成する。
【0100】
判断手段1003がスキュー・文書向き検知を行うべきと判断した場合、第2の識別手段1004がスキュー・文書向きの検知処理を行う。スキュー検知については第4の実施形態と同様の処理を行えばよいので説明は割愛する。文書向き検知はOCRを使用して行う。まず任意の文字列を抽出しその文字列画像に対し0°、90°、180°、270°の4方向に画像回転しOCRの類似度を算出する。その類似度が最も高い角度を正しい文書向きと検知する。このように第2の識別手段にて原稿傾きと文書向きを検知した場合、第2の画像処理手段1006が原稿傾きと文書向きを補正し、高圧縮PDF作成を実行する。
【0101】
以上説明した各実施の形態の画像形成装置では、像域識別処理を前半の第1の識別処理と後半の第2の識別処理に分割し、入力文書画像に応じて第2の識別手段を実施するか否かを判断する。ここで第1の識別処理は入力文書画像に精度・速度が依存しない処理である。また、第2の識別手段を実施するか否かを判断する判断手段においては第2の識別手段にて使用する信号を入力、あるいは生成しその信号を基に判断する。
【0102】
文書の複雑さを判断した結果、簡素な文書である場合には第1の識別手段より出力された第1の識別信号と判断手段より出力された判断信号を基に第2の識別処理を実施し、第2の識別信号を基に画像処理を行う。一方で、文書が複雑であると判断した場合には第2の識別処理は行わず第1の識別信号を用いて画像処理を行う。
【0103】
なお、第1の識別手段と第2の識別手段が備える機能は上述の入力文書画像に精度・速度が依存するかどうかのみによって分類されるものではない。図17は、第1及び第2の識別手段の機能を分類して示す図である。本願発明の第1の識別手段と第2の識別手段は、この図17に示す機能によって分類することができ、逆にこの機能によって分類される第1の識別手段と第2の識別手段とは本願発明の技術的範囲に含まれる。
【0104】
これらの形態の画像形成装置によれば、複雑な画像が入力された場合には、処理時間が膨大になったり画質不具合が起こったりする危険性を軽減してユーザの希望に近い画像を形成することが可能となる。また、複雑ではない(標準的な)画像が入力された場合には、第1の識別手段・判定手段・第2の識別手段いずれも本来必要な処理のみで構成されていることから、処理時間、識別精度に影響を与えることなくユーザが期待する出力画像を得られる。
【0105】
尚、本発明は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。
また、上記実施形態に開示されている複数の構成要素の適宜な組み合せにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。更に、異なる実施形態に亘る構成要素を適宜組み合せてもよい。
【産業上の利用可能性】
【0106】
本発明は、入力文書画像に依存する像域識別処理時間の増加を低減するとともに、出力画像の画質劣化の危険性を軽減して、ユーザの期待に近い出力画像を得ることができる画像形成装置を製造する産業で利用することができる。
【符号の説明】
【0107】
101…画像入力手段、102…第1の識別手段、103…判断手段、104…第2の識別手段、105…画像処理手段、301…入力画像、302…背景画像、302…多値画像、303…文字画像、303…文字用画像、401…画像入力手段、402…識別手段、403…エッジ抽出手段、404…外矩生成手段、405…文字列・文字領域抽出処理手段、406…画像処理手段、801…画像入力手段、802…第1の識別手段、803…前処理手段、804…判断手段、805…第2の識別手段、806…画像処理手段、1002…第1の識別手段、1003…判断手段、1004…第2の識別手段、1005…第1の画像処理手段、1006…第2の画像処理手段。
【先行技術文献】
【特許文献】
【0108】
【特許文献1】特開2005−175641号公報
【特許文献2】特開2003−008909号公報
【特許文献3】特開2000−020726号公報
【特許請求の範囲】
【請求項1】
紙原稿を含む原稿から画像情報を取得して入力画像を生成する画像入力手段と、
入力画像に対して第1の像域識別処理を行って画像の属性を示す第1の識別信号を出力する第1の識別手段と、
前記第1の識別信号を入力し、前記第1の像域識別処理に続く第2の像域識別処理を行って画像の属性を示す第2の識別信号を出力する第2の識別手段と、
前記第1の識別信号を入力し、前記第2の識別手段を実行すべきか否かを示す判断信号を出力する判断手段と、
前記判断信号が実行すべきではないと示している場合には前記第2の像域識別処理を行わずに前記第1の識別信号を第3の識別信号として選択し、前記判断信号が実行すべきと示す場合には、前記第2の識別信号を前記第3の識別信号として選択する選択手段と、
前記入力画像と前記第3の識別信号とを入力して前記第2の像域識別処理を行わずに画像処理を実行する画像処理手段と
を備えることを特徴とする画像形成装置。
【請求項2】
紙原稿を含む原稿から画像情報を取得して入力画像を生成する画像入力手段と、
入力画像に対して第1の像域識別処理を行って画像の属性を示す第1の識別信号を出力する第1の識別手段と、
前記第1の識別信号を入力し、前記第1の像域識別処理に続く第2の像域識別処理の前処理を行って前処理信号を出力する前処理手段と、
前処理信号を入力し、前記第2の像域識別処理を行って画像の属性を示す第2の識別信号を出力する第2の識別手段と、
前処理信号を入力し、前記第2の識別手段を実行すべきか否かを示す判断信号を出力する判断手段と、
前記判断信号が実行すべきではないと示している場合には前記第2の像域識別処理を行わずに前記第1の識別信号を第3の識別信号として選択し、前記判断信号が実行すべきと示す場合には、前記第2の識別信号を前記第3の識別信号として選択する選択手段と、
前記入力画像と前記第3の識別信号とを入力して前記第2の像域識別処理を行わずに画像処理を実行する画像処理手段と
を備えることを特徴とする画像形成装置。
【請求項3】
紙原稿を含む原稿から画像情報を取得して入力画像を生成する画像入力手段と、
入力画像に対して第1の像域識別処理を行って画像の属性を示す第1の識別信号を出力する第1の識別手段と、
前記第1の識別信号を入力し、前記第1の像域識別処理に続く第2の像域識別処理を行って画像の属性を示す第2の識別信号を出力する第2の識別手段と、
前記第1の識別信号を入力し、前記第2の識別手段を実行すべきか否かを示す判断信号を出力する判断手段と、
前記判断信号が実行すべきではないと示している場合は前記第2の像域識別処理を行わず、前記入力画像と前記第1の識別信号とを入力して画像処理を実行する第1の画像処理手段と
前記判断信号が実行すべきと示している場合は、前記入力画像と前記第2の識別信号とを入力して画像処理を実行する第2の画像処理手段と
を備えることを特徴とする画像形成装置。
【請求項4】
前記第1の識別手段は当該画素とその近傍のみを参照することで画素の属性を識別し、前記第2の識別手段は更に広い領域あるいは文書全体を参照することで属性を識別することを特徴とする請求項1または請求項2に記載の画像形成装置
【請求項5】
前記第1の識別手段は入力画像の画素値の分布に処理時間が依存しない識別手段であり、前記第2の識別手段は入力画像の画素値の分布に処理時間が依存する識別手段であることを特徴とする請求項1または請求項2に記載の画像形成装置。
【請求項6】
前記第1の識別手段は入力画像の画素値の分布に処理精度が依存しない識別手段であり、前記第2の識別手段は入力画像の画素値の分布に処理精度が依存する識別手段であることを特徴とする請求項1に記載の画像形成装置。
【請求項7】
前記第1の識別手段は当該画素自身の閾値処理と固定サイズのフィルタ処理からなる入力画像の画素値の分布に処理時間および精度が依存しない識別手段であることを特徴とする請求項3または請求項4に記載の画像形成装置。
【請求項8】
前記第2の識別手段は前記第1の識別手段にて分類された画素の連結成分同士のサイズ、位置の相互関係を解析する入力画像の画素値の分布に処理時間および精度が依存する識別手段であることを特徴とする請求項3または請求項4に記載の画像形成装置。
【請求項9】
前記第1の識別手段は入力画像の画素ごとの属性を識別する手段であり、前記第2の識別手段は入力画像中の矩形で表現される領域ごとの属性を識別する手段であることを特徴とする請求項1に記載の画像形成装置
【請求項10】
紙原稿を含む原稿から画像情報を取得して入力画像を生成し、
前記入力画像に対して第1の像域識別処理を行って画像の属性を示す第1の識別信号を生成し、
前記第1の識別信号に、前記第1の像域識別処理に続く第2の像域識別処理を行って画像の属性を示す第2の識別信号を生成し、
前記第1の識別信号から前記第2の識別手段を実行すべきか否かを示す判断信号を生成し、
前記判断信号が実行すべきではないと示している場合には前記第2の像域識別処理を行わずに前記第1の識別信号を第3の識別信号として選択し、前記判断信号が実行すべきと示す場合には、前記第2の識別信号を前記第3の識別信号として選択し、
前記入力画像と前記第3の識別信号とに前記第2の像域識別処理を行わずに画像処理を実行することを特徴とする画像処理方法。
【請求項1】
紙原稿を含む原稿から画像情報を取得して入力画像を生成する画像入力手段と、
入力画像に対して第1の像域識別処理を行って画像の属性を示す第1の識別信号を出力する第1の識別手段と、
前記第1の識別信号を入力し、前記第1の像域識別処理に続く第2の像域識別処理を行って画像の属性を示す第2の識別信号を出力する第2の識別手段と、
前記第1の識別信号を入力し、前記第2の識別手段を実行すべきか否かを示す判断信号を出力する判断手段と、
前記判断信号が実行すべきではないと示している場合には前記第2の像域識別処理を行わずに前記第1の識別信号を第3の識別信号として選択し、前記判断信号が実行すべきと示す場合には、前記第2の識別信号を前記第3の識別信号として選択する選択手段と、
前記入力画像と前記第3の識別信号とを入力して前記第2の像域識別処理を行わずに画像処理を実行する画像処理手段と
を備えることを特徴とする画像形成装置。
【請求項2】
紙原稿を含む原稿から画像情報を取得して入力画像を生成する画像入力手段と、
入力画像に対して第1の像域識別処理を行って画像の属性を示す第1の識別信号を出力する第1の識別手段と、
前記第1の識別信号を入力し、前記第1の像域識別処理に続く第2の像域識別処理の前処理を行って前処理信号を出力する前処理手段と、
前処理信号を入力し、前記第2の像域識別処理を行って画像の属性を示す第2の識別信号を出力する第2の識別手段と、
前処理信号を入力し、前記第2の識別手段を実行すべきか否かを示す判断信号を出力する判断手段と、
前記判断信号が実行すべきではないと示している場合には前記第2の像域識別処理を行わずに前記第1の識別信号を第3の識別信号として選択し、前記判断信号が実行すべきと示す場合には、前記第2の識別信号を前記第3の識別信号として選択する選択手段と、
前記入力画像と前記第3の識別信号とを入力して前記第2の像域識別処理を行わずに画像処理を実行する画像処理手段と
を備えることを特徴とする画像形成装置。
【請求項3】
紙原稿を含む原稿から画像情報を取得して入力画像を生成する画像入力手段と、
入力画像に対して第1の像域識別処理を行って画像の属性を示す第1の識別信号を出力する第1の識別手段と、
前記第1の識別信号を入力し、前記第1の像域識別処理に続く第2の像域識別処理を行って画像の属性を示す第2の識別信号を出力する第2の識別手段と、
前記第1の識別信号を入力し、前記第2の識別手段を実行すべきか否かを示す判断信号を出力する判断手段と、
前記判断信号が実行すべきではないと示している場合は前記第2の像域識別処理を行わず、前記入力画像と前記第1の識別信号とを入力して画像処理を実行する第1の画像処理手段と
前記判断信号が実行すべきと示している場合は、前記入力画像と前記第2の識別信号とを入力して画像処理を実行する第2の画像処理手段と
を備えることを特徴とする画像形成装置。
【請求項4】
前記第1の識別手段は当該画素とその近傍のみを参照することで画素の属性を識別し、前記第2の識別手段は更に広い領域あるいは文書全体を参照することで属性を識別することを特徴とする請求項1または請求項2に記載の画像形成装置
【請求項5】
前記第1の識別手段は入力画像の画素値の分布に処理時間が依存しない識別手段であり、前記第2の識別手段は入力画像の画素値の分布に処理時間が依存する識別手段であることを特徴とする請求項1または請求項2に記載の画像形成装置。
【請求項6】
前記第1の識別手段は入力画像の画素値の分布に処理精度が依存しない識別手段であり、前記第2の識別手段は入力画像の画素値の分布に処理精度が依存する識別手段であることを特徴とする請求項1に記載の画像形成装置。
【請求項7】
前記第1の識別手段は当該画素自身の閾値処理と固定サイズのフィルタ処理からなる入力画像の画素値の分布に処理時間および精度が依存しない識別手段であることを特徴とする請求項3または請求項4に記載の画像形成装置。
【請求項8】
前記第2の識別手段は前記第1の識別手段にて分類された画素の連結成分同士のサイズ、位置の相互関係を解析する入力画像の画素値の分布に処理時間および精度が依存する識別手段であることを特徴とする請求項3または請求項4に記載の画像形成装置。
【請求項9】
前記第1の識別手段は入力画像の画素ごとの属性を識別する手段であり、前記第2の識別手段は入力画像中の矩形で表現される領域ごとの属性を識別する手段であることを特徴とする請求項1に記載の画像形成装置
【請求項10】
紙原稿を含む原稿から画像情報を取得して入力画像を生成し、
前記入力画像に対して第1の像域識別処理を行って画像の属性を示す第1の識別信号を生成し、
前記第1の識別信号に、前記第1の像域識別処理に続く第2の像域識別処理を行って画像の属性を示す第2の識別信号を生成し、
前記第1の識別信号から前記第2の識別手段を実行すべきか否かを示す判断信号を生成し、
前記判断信号が実行すべきではないと示している場合には前記第2の像域識別処理を行わずに前記第1の識別信号を第3の識別信号として選択し、前記判断信号が実行すべきと示す場合には、前記第2の識別信号を前記第3の識別信号として選択し、
前記入力画像と前記第3の識別信号とに前記第2の像域識別処理を行わずに画像処理を実行することを特徴とする画像処理方法。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【公開番号】特開2010−11450(P2010−11450A)
【公開日】平成22年1月14日(2010.1.14)
【国際特許分類】
【出願番号】特願2009−126614(P2009−126614)
【出願日】平成21年5月26日(2009.5.26)
【出願人】(000003078)株式会社東芝 (54,554)
【出願人】(000003562)東芝テック株式会社 (5,631)
【Fターム(参考)】
【公開日】平成22年1月14日(2010.1.14)
【国際特許分類】
【出願日】平成21年5月26日(2009.5.26)
【出願人】(000003078)株式会社東芝 (54,554)
【出願人】(000003562)東芝テック株式会社 (5,631)
【Fターム(参考)】
[ Back to top ]