説明

画像処理装置、画像形成装置、画像読取装置、画像処理方法、画像処理プログラムおよび記録媒体

【課題】原稿を読み取って得られた画像データを出力や保存に適した画像ファイルに変更するにあたり、レイアウト解析と文字認識処理とを利用して、原稿における文字の量に関する状況を検出し、該状況に応じたファイル形式を自動的選択することのできる画像処理装置を提供する。
【解決手段】原稿判定部113は、文字認識部111およびレイアウト解析部112の各結果より、入力画像データが示す原稿画像が文字を多く含んでいる文字中心画像であるか否かを判定する。ファイル形式決定部114は、原稿判定部113の判定結果に基づいて、文字中心画像である場合は文書画像に適したファイル形式を選択し、文字中心画像ではない場合は写真画像に適したファイル形式を選択し、フォーマット化処理部110に対し、指定信号を出力してファイル形式を指定する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、スキャナ等で読み取った画像データを出力や保存に適したファイル形式に変換する画像処理装置、画像処理方法、およびこれを利用した、画像形成装置、画像読取装置に関する。
【背景技術】
【0002】
書類等の紙媒体に記録されている画像をスキャナ等の画像入力装置で読み取って画像データを作成し、PDF形式やTIFF形式等の出力や保存に適したファイル形式に変換して、所定フォルダに保存したり、ネットワークを用いて送信したりすることが行われている。
【0003】
また、画像入力装置で読み取った画像データを、複数のバンド(領域)に分けてバンド毎にPDFファイル化することも行われている。例えば、特許文献1には、画像データを複数のバンド(領域)に分けてバンド毎にPDFファイル化するにあたり、メモリの空き容量に応じて、バンド毎に適用する画像圧縮形式を自動に切り換える技術が開示されている。
【0004】
具体的には、領域(文字、背景等)の判別を行う場合に用いるメモリの空き容量が規定値以上か否かを判断し、メモリの空き容量が規定値以上の場合、バンドについてその文字領域をMMR圧縮し、その背景領域をJPEG圧縮とする。また、メモリの空き容量が規定値より少ない場合は、バンドにおける全領域をJPEG圧縮する。また、1ページ内の文字数が極端に多い原稿など、蓄積処理の途中でメモリの空き容量が規定値よりも少なくなる蓋然性が高いと考えられる原稿(特殊原稿)の場合は、全バンドについてJPEG圧縮を施す。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2007−6411号公報(平成19年1月11日公開)
【特許文献2】特開平7−192086号公報(平成7年7月28日公開)
【特許文献3】特開平6−189083号公報(平成6年7月8日公開)
【特許文献4】特開2002−94805号公報(平成14年3月29日公開)
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、特許文献1のように、メモリの空き容量に応じて適応する画像圧縮形式を切り換えた場合、原稿の種類(入力画像の状況)に適さない画像圧縮形式にて画像が圧縮されてしまうことがあり、保存した画像データを後々有効に利用できないといった問題がある。
【0007】
具体的に言うと、その最たる例が、上記した文字数が極端に多い原稿に対する処理である。文字数が極端に多い原稿の画像の処理としては本来、文字領域をMMR圧縮、背景領域をJPEG圧縮する方式の方が望ましい。しかしながら、上述したように、引用文献1では、このような原稿は、全バンドがJPEG圧縮されるといった、望ましくない処理が行われる。このような場合、最悪の場合、記憶装置から読み出して再現した画像からは文字の判別が困難になるといったことが起こる。
【0008】
本発明は、上記の問題点に鑑みてなされたものであり、その目的は、原稿を読み取って得られた画像データを出力や保存に適した形式の画像ファイルに変更するにあたり、レイアウト解析と文字認識処理とを利用して原稿における文字の量に関する状況を検出して該状況に応じたファイル形式を自動的に選択して変換することのできる画像処理装置、画像処理方法を提供することにある。
【課題を解決するための手段】
【0009】
本発明の画像処理装置は、上記の課題を解決するために、原稿画像を画像入力装置にて読み取ることで得られた入力画像データを指定されたファイル形式に変更するフォーマット化処理手段を備えた画像処理装置であって、上記入力画像データに対して文字認識処理を行う文字認識手段と、上記入力画像データに対して、ページ毎の画像のレイアウトを解析するレイアウト解析手段と、上記レイアウト解析手段の解析結果および上記文字認識手段の認識結果より、上記入力画像データが示す原稿画像が文字を多く含んでいる文字中心画像であるか否かを判定する原稿判定手段と、上記原稿判定手段の判定結果に基づいてファイル形式を決定し、上記フォーマット化処理手段に対して決定したファイル形式を指定するファイル形式決定手段とを有し、上記ファイル形式決定手段は、文字中心画像であると判定された場合に、文書画像に適したファイル形式を選択し、文字中心画像ではないと判定された場合に、写真画像に適したファイル形式を選択することを特徴としている。
【0010】
また、本発明の画像処理方法は、上記課題を解決するために、原稿画像を画像入力装置にて読み取ることで得られた入力画像データを指定されたファイル形式に変更するフォーマット化処理工程を含む画像処理方法であって、上記入力画像データに対して文字認識処理を行う文字認識工程と、上記入力画像データに対して、ページ毎の画像のレイアウトを解析するレイアウト解析工程と、上記レイアウト解析工程の解析結果および上記文字認識工程の認識結果より、上記入力画像データが示す原稿画像が文字を多く含んでいる文字中心画像であるか否かを判定する原稿判定工程と、上記原稿判定工程の判定結果に基づいてファイル形式を決定し、上記フォーマット化処理工程に対して決定したファイル形式を指定するファイル形式決定工程とを有し、上記ファイル形式決定工程においては、上記原稿判定工程にて文字中心画像であると判定された場合に、文書画像に適したファイル形式を選択し、上記原稿判定工程にて文字中心画像ではないと判定された場合に、写真画像に適したファイル形式を選択することを特徴としている。
【0011】
上記画像処理装置および画像処理方法によれば、文字認識手段による文字認識結果とレイアウト解析手段によるレイアウト解析結果を基に、原稿画像が文字を多く含んでいる文字中心画像かどうかを判断し、文字中心画像である場合とない場合とで、変更するファイル形式を切り換え、それぞれに応じたファイル形式を自動選択する。
【0012】
つまり、入力された原稿画像の文字の量に関する状況に応じて、ファイル形式が自動的に原稿画像に適したものへと切り換えられる。
【0013】
したがって、利用者は、自身で原稿画像の文字の量に関する状況を確認し、手動にて状況に適したファイル形式へと切り換える作業を伴うことなく、適切なファイル形式に変更させることが可能となる。
【0014】
上記文書画像に適したファイル形式としては、例えば、原稿画像における文字部分を2値画像として格納し、原稿画像におけるその他の部分を多階調画像として格納する高圧縮PDF形式とすることができる。また、上記写真画像に適した出力ファイル形式としては、原稿画像全体を多階調画像として格納する通常PDF形式とすることができる。
【0015】
本発明の画像処理装置は、さらに、上記原稿判定手段は、上記レイアウト解析手段および上記文字認識手段の各結果より原稿画像における文字領域の占める割合を算出する文字領域割合算出手段と、上記文字認識手段において認識された文字のページ毎の総数を数える文字計数手段と、上記文字計数手段にて計数された文字数および上記文字領域割合算出手段にて算出された文字領域の割合に基づいて、少なくとも文字数が多いあるいは文字領域の割合が高い場合に文字中心画像と判定し、文字数が少なくかつ文字領域の割合も低い場合に文字中心画像ではないと判定する第1判定処理手段とを含む構成とすることもできる。なお、上記文字領域とは、文字の外接矩形のことである。
【0016】
上記構成によれば、少なくとも文字数が多いあるいは文字領域の割合が高い場合に文字中心画像と判定され、文字数が少なくかつ文字領域の割合も低い場合に文字中心画像ではないと判定される。
【0017】
つまり、原稿画像の文字の量に関する状況を、文字数あるいは文字領域の割合より検出する。文字数や文字領域の割合からは、高い精度で原稿画像における文字の量を検出可能である。したがって、これにより、入力された原稿画像の文字の量に関する状況に応じたファイル形式の自動切り換えをより高精度に実現できる。
【0018】
本発明の画像処理装置は、さらに、上記原稿判定手段は、上記レイアウト解析手段の解析結果および上記文字認識手段の認識結果よりタイトル領域の有無を判定するタイトル領域判定手段と、タイトル領域が有る場合に文字中心画像と判定し、タイトル領域が無い場合に文字中心画像ではないと判定する第2判定処理手段とを含む構成とすることもできる。
【0019】
上記構成によれば、タイトル領域が有る場合に文字中心画像と判定され、タイトル領域が無い場合には文字中心画像ではないと判定される。
【0020】
つまり、原稿画像の文字の量に関する状況を、タイトル領域があるかどうかで検出する。タイトル領域を有するということは、原稿画像は、文字を多く含む文書よりなる原稿である蓋然性が高い。そのため、タイトル領域の有無の情報より、高い精度で原稿画像における文字の量を検出可能である。したがって、これによっても、入力された原稿画像の文字の量に関する状況に応じたファイル形式の自動切り換えをより高精度に実現できる。
【0021】
この場合、上記タイトル領域判定手段は、上記レイアウト解析手段の解析結果より、一般的にタイトルが位置すると予想される位置に、原稿画像の他の領域よりも文字の外接矩形のサイズが大きく、かつ該外接矩形が連続してなる帯状ブロックが規定以上の長さを有する場合に、タイトル領域と仮判定する仮判定手段と、上記仮判定手段にてタイトル領域と仮判定された部分に対する文字認識結果が規定以上の認識率である場合に、タイトル領域と本判定する本判定手段とを含む構成とすることもできる。
【0022】
文書原稿におけるタイトルの位置は、原稿上部や原稿右端等、決まった位置に付されることが多い。また、文字サイズが、他の部分の文字サイズよりも大きいといった特徴もある。
【0023】
上記構成によれば、これらの特徴を利用して、まずはレイアウト的にタイトル領域の有無を判定し、レイアウト的にタイトル領域であると判定(仮判定)できるものがあれば、その部分が文字より構成されているかどうかを判断し、文字で構成されている場合は、タイトル領域であると判定(本判定)する。これにより、精度よく、タイトル領域の有無を判断することができる。
【0024】
本発明の画像処理装置においては、さらに、上記ファイル形式決定手段には、上記入力画像データの利用用途を示す選択信号が入力されるようになっており、上記ファイル形式決定手段は、上記選択信号より利用用途が画像ファイリングであることを判別すると、上記フォーマット化処理手段に対してデフォルト設定されているファイル形式に変更するよう指定する構成とすることが好ましい。
【0025】
文書画像向きの出力ファイル形式は、文字部分が優先され、文字以外の部分の詳細情報が残りにくい形式であるため、ファイリング用途の一部である帳簿書類等の電子化には不向きである。
【0026】
そこで、利用用途を示す選択信号をファイル形式決定手段に入力させる構成とし、電子ファイリング用途の場合に出力ファイル形式の自動切り替えを自動で行わない構成とすることで、帳簿書類等を間違って文書画像向きの出力ファイル形式で保存することを防止できる。
【0027】
本発明は、上記した本発明の画像処理装置を搭載した画像形成装置及び画像読取装置も発明の範疇としている。
【0028】
なお、上記画像処理装置は、コンピュータによって実現してもよく、この場合には、コンピュータを上記各部として動作させることにより、上記画像処理装置をコンピュータにて実現させる画像処理プログラム、およびそれを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に含まれる。
【発明の効果】
【0029】
以上のように、本発明の画像処理装置は、原稿画像を画像入力装置にて読み取ることで得られた入力画像データを指定されたファイル形式に変更するフォーマット化処理手段を備えた画像処理装置であって、上記入力画像データに対して文字認識処理を行う文字認識手段と、上記入力画像データに対して、ページ毎の画像のレイアウトを解析するレイアウト解析手段と、上記レイアウト解析手段の解析結果および上記文字認識手段の認識結果より、上記入力画像データが示す原稿画像が文字を多く含んでいる文字中心画像であるか否かを判定する原稿判定手段と、上記原稿判定手段の判定結果に基づいてファイル形式を決定し、上記フォーマット化処理手段に対して決定したファイル形式を指定するファイル形式決定手段とを有し、上記ファイル形式決定手段は、文字中心画像であると判定された場合に、文書画像に適したファイル形式を選択し、文字中心画像ではないと判定された場合に、写真画像に適したファイル形式を選択する構成である。
【0030】
また、本発明の画像処理方法は、原稿画像を画像入力装置にて読み取ることで得られた入力画像データを指定されたファイル形式に変更するフォーマット化処理工程を含む画像処理方法であって、上記入力画像データに対して文字認識処理を行う文字認識工程と、上記入力画像データに対して、ページ毎の画像のレイアウトを解析するレイアウト解析工程と、上記レイアウト解析工程の解析結果および上記文字認識工程の認識結果より、上記入力画像データが示す原稿画像が文字を多く含んでいる文字中心画像であるか否かを判定する原稿判定工程と、上記原稿判定工程の判定結果に基づいてファイル形式を決定し、上記フォーマット化処理工程に対して決定したファイル形式を指定するファイル形式決定工程とを有し、上記ファイル形式決定工程においては、上記原稿判定工程にて文字中心画像であると判定された場合に、文書画像に適したファイル形式を選択し、上記原稿判定工程にて文字中心画像ではないと判定された場合に、写真画像に適したファイル形式を選択するものである。
【0031】
これによれば、入力された原稿画像の文字の量に関する状況に応じて、ファイル形式が自動的に適したものへと切り換えられる。したがって、利用者は、自身で原稿画像の文字の量に関する状況を確認し、手動にて状況に適したファイル形式へと切り換える作業を伴うことなく、適切なファイル形式に変更させることが可能となる。
【図面の簡単な説明】
【0032】
【図1】本発明の一実施形態にかかる画像処理装置の要部の構成を示すブロック図である。
【図2】上記画像処理装置における信号前処理部の構成を示すブロックである。
【図3】上記画像処理装置におけるレイアウト解析部のレイアウト解析処理を示す説明図である。
【図4】上記画像処理装置におけるレイアウト解析部のレイアウト解析結果の一例を示す説明図である。
【図5】上記画像処理装置における原稿判定部の第1の具体例であるの第1原稿判定部の構成を示すブロック図である。
【図6】上記画像処理装置における、信号前処理部、文字認識部、レイアウト解析部、および第1原稿判定部で実施される、入力画像データより文字中心原稿であるか否かを判定するまでの大まかな処理の流れを示すフローチャートである。
【図7】上記画像処理装置における原稿判定部の第2の具体例であるの第2原稿判定部の構成を示すブロック図である。
【図8】(a)〜(d)共に、上記第2原稿判定部が、レイアウト解析結果よりタイトル領域があると仮判定する処理を示す説明図である。
【図9】上記画像処理装置における、信号前処理部、文字認識部、レイアウト解析部、および第2原稿判定部で実施される、入力画像データより文字中心原稿であるか否かを判定するまでの大まかな処理の流れを示すフローチャートである。
【図10】上記画像処理装置におけるファイル形式決定部の、ファイル形式を決定して指定信号を出力する処理の手順を示すフローチャートである。
【図11】上記画像処理装置におけるフォーマット化処理部の構成を示すブロック図である。
【図12】上記画像処理装置を搭載したデジタルカラー複合機のブロック図を示すもので、画像入力装置より原稿画像を読み取って画像データを生成し、該画像データに基づく画像を画像出力装置にて生成して出力する、いわゆるコピーモードにおけるデータの流れを示している。
【図13】上記画像処理装置を搭載したデジタルカラー複合機のブロック図を示すもので、画像入力装置より原稿画像を読み取って画像データを生成し、該画像データのファイル形式を変更して送受信装置より出力する、送信モードにおけるデータの流れを示している。
【図14】(a)(b)共に、上記画像処理装置において中間調補正処理に用いるガンマ曲線の一例を示すグラフである。
【図15】上記画像処理装置を搭載したデジタルカラー複合機の変形例を示すブロック図である。
【図16】上記画像処理装置を搭載したデジタルカラー複合機の変形例を示すブロック図である。
【図17】上記画像処理装置を搭載したデジタルカラースキャナのブロック図を示すものである。
【発明を実施するための形態】
【0033】
以下、本発明の実施の一形態について、図1〜図17を用いて説明する。
【0034】
まずは、図1を用いて、本実施形態の画像処理装置100の要部について説明する。図1は、本画像処理装置100の要部構成を示すブロック図である。
【0035】
図1に示すように、本画像処理装置100は、フォーマット化処理部(フォーマット化処理手段)110、信号前処理部115、文字認識部(文字認識手段)111、レイアウト解析部(レイアウト解析手段)112、原稿判定部(原稿判定手段)113、およびファイル形式決定部(ファイル形式決定手段)114を備えている。
【0036】
フォーマット化処理部110は、原稿画像をスキャナ等の画像読取装置にて読み取ることで得られた入力画像データを、指定されたファイル形式に変更するものである。変更された画像データは、出力画像データとして、図示しない送受信装置を介してネットワーク送信されたり、画像処理装置外部の記憶装置の所定アドレスに保存されたりする。
【0037】
上記入力画像データは、モノクロ対応の画像読取装置にて読み取られた場合は2値の画像データであり、カラー対応の画像読取装置にて読み取られた場合は、RGB信号のカラー画像データである。本実施形態では、入力画像データが、RGB信号のカラー画像データである場合を例示する。
【0038】
フォーマット化処理部110におけるファイル形式の指定は、後述するファイル形式決定部114からの指定信号に行われる。フォーマット化処理部110は、入力画像データを、ファイル形式決定部114より入力される指定信号が示すファイル形式へと変更する。フォーマット化処理部110の詳細については、図11を用いて後述する。
【0039】
信号前処理部115は、フォーマット化処理部110に入力されるRGB信号の入力画像データを、後段の文字認識部111およびレイアウト解析部112に適した状態になるように、信号変換処理や、2値化処理、解像度変換処理、原稿の傾き補正処理等を行うものである。信号前処理部115の出力は、文字認識部111とレイアウト解析部112とに出力される。信号前処理部115の詳細については、図2を用いて後述する。
【0040】
文字認識部111は、OCR技術を用いて入力画像データに対して文字認識処理を行うものである。文字認識処理の方法は特に限定されるものではなく、従来から公知の種々の方法を用いることができる。文字認識結果は、原稿判定部113と、フォーマット化処理部110へと出力される。また、本実施形態では、文字認識部111は、原稿画像の天地を判定する原稿天地判定にも利用されるようになっている。文字認識部111の詳細についても後述する。
【0041】
レイアウト解析部112は、入力画像データに対して、ページ毎の画像のレイアウトを解析するものである。レイアウト解析結果は、原稿判定部113および文字認識部111へと出力される。レイアウト解析方法については、図3、図4を用いて後述する。
【0042】
原稿判定部113は、レイアウト解析部112の解析結果および文字認識部111の認識結果より、入力画像データが示す原稿画像が文字画像を多く含んでいる文字中心画像であるか否かを判定するものである。判定結果は、ファイル形式決定部114へと出力される。文字中心画像であるかどうかの判定手法としては、例えば後記する2つの手法がある。原稿判定部113の詳細については、図5〜図9を用いて後述する。
【0043】
ファイル形式決定部114は、原稿判定部113の判定結果に基づいてファイル形式を決定するものである。ファイル形式決定部114は、決定したファイル形式を示す指定信号をフォーマット化処理部110に対して出力する。ファイル形式決定部114は、文字中心画像であると判定された場合は、文書画像に適したファイル形式を選択し、文字中心画像ではないと判定された場合には、写真画像に適したファイル形式を選択する。また、本実施形態においては、ファイル形式決定部114に、入力画像データの用途を示す選択信号が入力されるようになっており、該選択信号の示す用途によっては、フォーマット化処理部110に対して、デフォルトのファイル形式を選択するよう指定する。ファイル形式決定部114の詳細については、図10を用いて後述する。
【0044】
また、図1に示す、文字認識部111、レイアウト解析部112、原稿判定部113、およびファイル形式決定部114にて、後述する図12、図13、図15〜図17に示す認識処理部109が構成されている。
【0045】
以下、画像処理装置100の各部について、詳細に説明する。まずは、図2を用いて、信号前処理部115の構成を説明する。図2は、信号前処理部115の構成を示すブロックである。
【0046】
図2に示すように、信号前処理部115は、信号変換部121、2値化処理部122、解像度変換部123、原稿傾き検知部124、傾き補正部125を備えている。入力画像データは、信号変換部121に入力される。
【0047】
信号変換部121は、RGB信号の入力画像データを無彩化して輝度信号に変換するものである。例えば、信号変換部121は、Yi=0.30Ri+0.59Gi+0.11Biを演算することによりRGB信号を輝度信号Yに変換する。ここで、Yは各画素の輝度信号であり、R,G,Bは各画素のRGB信号における各色成分である。添え字のiは画素毎に付与された値(iは1以上の整数)である。
【0048】
また、信号変換部121は、RGB信号の入力画像データを無彩化してCIE1976L*a*b*信号(CIE:Commission International de l'Eclairage、L*:明度、a*,b*:色度)に変換する構成としてもよい。
【0049】
2値化処理部122は、信号変換部121より入力された無彩化された画像データ(本実施例では輝度信号であるので輝度値)と、予め設定された閾値とを比較することにより画像データを2値化するものである。例えば、画像データが8ビットである場合、上記閾値を128とする。あるいは、複数の画素(例えば5画素×5画素)からなるブロックにおける濃度(画素値)の平均値を閾値としてもよい。
【0050】
解像度変換部123は、2値化処理部122にて2値化された画像データの解像度を低解像度に変換するものである。例えば、1200dpiや600dpiで読み込まれた画像データを300dpiに変換する。解像度変換の方法は特に限定されるものではなく、例えば、公知のニアレストネイバー法、バイリニア法、バイキュービック法などを用いることができる。
【0051】
本実施形態では、解像度変換部123は、画像データを300dpiと75dpiとに低解像度化する。そして、原稿傾き検知部124には、300dpiの画像データを出力し、レイアウト解析部には、75dpi(凡そのレイアウトが分かる程度の解像度)の画像データを出力する。
【0052】
原稿傾き検知部124は、解像度変換部123によって低解像度に変換された画像データ(300dpi)に基づいて、画像読取時のスキャン範囲(正規の原稿位置)に対する原稿の傾き角度を検知するものである。画像読取装置におけるスキャン範囲(正規の原稿位置)に対して、読み取られる原稿の載置位置が傾いていた場合に、この傾き角度が検知される。傾き角度の検知方法は特に限定されるものではなく、従来から公知の種々の方法を用いることができる。検知した傾き角度の情報は、後段の傾き補正部125へと出力される。
【0053】
ここでは、特許文献2に記載されている方法を用いた場合を説明する。この方法では、2値化された画像データからを黒画素と白画素との境界点(例えば各文字の上端における白/黒の境界点の座標)を複数個抽出し、各境界点の点列の座標データを求める。そして、この点列の座標データに基づいて回帰直線を求め、その回帰係数bを下記式(1)に基づいて算出する。
【0054】
b=Sxy/Sx ・・・(1)
なお、Sx,Syはそれぞれ変量x,yの残差平方和であり、Sxyはxの残差とyの残差の積の和である。すなわち、Sx,Sy,Sxyは下記式(2)〜(4)で表わされる。
【0055】
【数1】

【0056】
そして、上記のように算出した回帰係数bより、下記式(5)に基づいて傾き角度θを算出する。
【0057】
tanθ=b ・・・(5)
傾き補正部125は、原稿傾き検知部124で検知された傾き角度θに基づいて、原稿の座標を補正して、原稿の傾きを補正するものである。
【0058】
原点を中心に、反時計まわりに角度θだけ、傾き補正した場合の補正前後の座標の関係は、補正前座標(X,Y)、補正後座標(X’,Y’)とすると、以下の式で表される。下記式を用いて原稿の傾き補正を行う。
【0059】
【数2】

【0060】
また、原点を中心に、反時計まわりに角度90°、180°、270°回転する場合の回転前後の座標の関係は、回転前座標(X,Y)、回転後座標(X’,Y’)とすると、以下の式で表される。下記式を用いて原稿の傾き補正を行う。
【0061】
(90°回転時)
X’= オリジナル画像Y方向サイズ − 1 − Y
Y’= X
(180°回転時)
X’= オリジナル画像X方向サイズ − 1 − X
Y’= オリジナル画像Y方向サイズ − 1 − Y
(270°回転時)
X’= Y
Y’= オリジナル画像X方向サイズ − 1 − X 補正前座標(X,Y)。
【0062】
傾き補正部125による座標の補正にて、文字認識部111に入力される画像データ(300dpi)もレイアウト解析部112に入力される画像データ(75dpi)も原稿の傾きを含まないものとなる。
【0063】
傾き補正部125にて傾きが補正された300dpiの画像データは文字認識部111へと出力され、傾きが補正された75dpiの画像データはレイアウト解析部112へと出力される。
【0064】
なお、図1では記載していないが、原稿傾き検知部124、傾き補正部125の機能を用いて、フォーマット化処理部110の前段に設けられた原稿補正部にて、フォーマット化処理部110へと入力される画像データ(RGB信号のカラー画像データ)に対しても、原稿の傾きが補正される。後述する図12、図13、図15〜図17に示す原稿補正部15がこれに相当する。
【0065】
次に、図3、図4を用いて、レイアウト解析部112におけるレイアウト解析の手順(一例)について説明する。
(1)まず、原稿の傾きが補正された画像データ(75dpi)に対し、最初のラインを注目ラインとし、黒画素にラベリングを行う。
(2)次に、注目ラインを一つ下のラインにずらし、黒画素について上記ラインとは異なるラベルをセットする。
(3)注目ラインと一つ上のラインの黒画素の連結状態を判定し、連結して入る場合は、画素が繋がっていると判断し、同じラベル(上のラインのラベル)に置き換える。
(4)上記処理を繰り返して文字を抽出する。抽出された文字より、図3に示すように、上端、下端、左端および右端の画素位置を基に外接矩形(1文字の文字領域に相当)を抽出する。このとき、画素の座標は、入力画像データの左端の位置を原点として求める。
(5)抽出された外接矩形のうち、垂直方向の長さのうち小さいものを除いて平均値を求める。この処理を行単位(外接矩形が求められる単位毎)に行う。また、外接矩形の下側の座標の平均値を算出する。
(6)外接矩形の下側の座標の平均値から、上記垂直方向の長さの平均値を基準とした所定範囲内に新たな黒画素が存在するか否か判定する。ここで、黒画素が存在する場合は、次の行の外接矩形を求め、上記(5)と同様にして矩形の垂直方向の長さの平均値を求める。上記垂直方向の長さの平均値を基準とした所定範囲としては、例えば、垂直方向の長さの平均値の1.5倍の範囲とする。そして、所定範囲内であれば、同じブロックであると判定する。一方、所定範囲外である場合は、別のブロックであると判定する。
【0066】
図4に、学術論文の原稿(1ページ目)をレイアウト解析した結果を示す。5つのブロックA〜Eが抽出されている。
【0067】
このうち、ブロックAがタイトルの部分である。通常、タイトルは、原稿の上部あるいは右端に存在する。また、タイトルの特徴として、文字サイズが、本文を構成する部分に比べて大きい。つまり、外接矩形のサイズが、本文とみなされる領域の外接矩形よりも大きく、例えば、本文と見なされる領域の外接矩形の1.5倍以上ある。
【0068】
また、ブロックBが著者名が記載され部分であり、ブロックCがアブストラクトの記載部分、ブロックD、Eが本文の記載部分である。なお、アブストラクトを本文と区別する必要はない。また、表やグラフを抽出することも可能である。
【0069】
文字認識部111は、原稿の傾きが補正された画像データ(300pi)を用いて、画像データの特徴量を抽出し、辞書データと比較して文字認識を行う。
【0070】
本実施形態では、上述したように、文字認識部111は、原稿画像の天地を判定する原稿天地判定にも利用されるようになっている。原稿天地判定の場合は、一部のサンプリングされた文字に対して文字認識を行い、文字の向きを検出して原稿の天地を判定する。そして、画像データに含まれる全ての文字の文字認識については、原稿の天地が判定された状態で行う。
【0071】
ここで、原稿天地判定について説明する。本実施形態の画像処理装置100では、レイアウト解析部112を備えており、レイアウト解析により、原稿画像は、図4に示すような複数のブロックに分割される。そこで、画像処理装置100は、まずはブロック毎の天地判定を行い、各ブロックの天地の判定結果を用いて最終的に原稿の天地を判定するようになっている。
【0072】
原稿の天地判定には、例えば特許文献3の記載された方法を用いることができ、手順について説明する。
(A)OCR技術を用い文字認識を行い、原稿内の一文字、一文字を切り出し、その文字をパターン化する。なお、ここでは、あくまで原稿の天地が判定できればいいので、全ての文字に対して行うのではなく、サンプリングした一部の文字についてのみパターン化する。
(B)文字パターンの特徴とデータベース化された文字パターン情報を比較する。マッチングの方法としては、データベース化された文字パターンに切り出された文字パターンを重ね合わせ、画素ごとの白黒を比較し、全てが合致したときのデータベース化された文字パターンを入力パターンの文字であると判別する。全てが合致する文字パターンがない場合、マッチングする画素が最も多い文字パターンの文字であると判別する。なお、所定のマッチング割合に達しなければ判別不能と判断する。
(C)切り出された文字パターンを90°、180°、270°回転させ、上記2)の処理を繰りかえす。
(D)上記(B)(D)で得られた文字パターンの回転角毎の判別可能な文字数の比較を行い、判別可能な文字数が最も多い回転角を文字の方向を、当該ブロックの天地方向とする。
(E)各ブロックの天地判定に基づいて、最も多くのブロックが天地方向とした方向を、原稿の天地方向と判定する。なお、全てのブロックの天地方向が揃わなかった場合に、表示部に画像表示を行い、ユーザに天地の確認を促すように構成してもよい。
(F)天地判定の結果は、文字認識部111にフィードバックされる。これにより、文字認識部111は、画像データに含まれる全ての文字の認識については、原稿の天地を判別した状態で行うことができる。
【0073】
また、文字認識部111は、この画像データに含まれる全ての文字の認識を行う場合にも、レイアウト解析部112のレイアウト解析結果を用いて、抽出されたブロック毎に文字認識を行う。
【0074】
なお、図1では記載していないが、傾き補正と同様に、この天地判定の結果を用いて、フォーマット化処理部110の前段に設けられた原稿補正部により、フォーマット化処理部110へと入力される画像データ(RGB信号のカラー画像データ)に対しても原稿の天地が補正される。
【0075】
次に、図5〜図9を用いて、原稿判定部113について説明する。上述したように、文字中心画像であるかどうかの判定手法として、ここでは2つの手法について説明する。図5が、第1原稿判定部113Aの構成を示すブロック図であり、図7が第2原稿判定部113Bの構成を示すブロック図である。
【0076】
まず、図5、図6を用いて、第1原稿判定部113Aより説明する。第1原稿判定部113Aは、原稿画像の文字の量に関する状況を、文字数あるいは文字領域の割合より検出するものである。文字数や文字領域の割合からは、高い精度で原稿画像における文字の量を検出可能である。
【0077】
図5に示すように、第1原稿判定部113Aは、文字計数部(文字計数手段)130、文字領域割合算出部(文字領域割合算出手段)131、および第1判定処理部(第1判定処理手段)132を備えている。
【0078】
文字計数部130には、文字認識部111より文字認識結果が入力される。文字計数部130は、文字認識部111において認識された文字のページ毎の総数を数えるものであり、ページ毎に文字数の合計を求める。
【0079】
文字領域割合算出部131には、レイアウト解析部112よりレイアウト解析結果が入力されると共に、文字認識部111より文字認識結果が入力される。文字領域割合算出部131は、レイアウト解析部112の解析結果および文字認識部111の認識結果より、原稿画像における文字領域の占める割合を算出する。具体的には、文字領域割合算出部131は、文字認識部111にて文字認識された各文字について、レイアウト解析部112が求めた外接矩形の面積を合計し、原稿画像(1ページ分の画像全体)の全面積に対する認識された全文字の外接矩形の総面積の割合を算出する。
【0080】
上述したように、本画像処理装置100においては、文字認識部111は、レイアウト解析部112のレイアウト解析結果に基づき、抽出されたブロック単位で文字認識を行うので、文字計数部130の認識文字の計数、および文字領域割合算出部131における外接矩形の面積加算の処理も、ブロック毎に実施される。
【0081】
第1判定処理部132は、文字計数部130にて計数された1ページ中に含まれる文字の総数、および文字領域割合算出部131にて算出された文字領域の割合に基づいて、文字中心画像であるか否かを判定するものであり、判定結果は、ファイル形式決定部114へと送られる。
【0082】
第1判定処理部132には、文字計数部130より、原稿画像(ページ単位)における文字認識された文字の総数を示す計数結果が入力されると共に、文字領域割合算出部131より、原稿画像(ページ単位)における文字認識された各文字の外接矩形の総面積が原稿画像の総面積に対して占める割合(以下、文字領域割合)の算出結果が入力される。
【0083】
第1判定処理部132は、文字数および文字領域割合の比較基準として予め定められている規定値と比較し、少なくとも文字数が多いあるいは文字領域割合が高い場合に、文字中心画像と判定し、文字数が少なくかつ文字領域割合も低い場合に、文字中心画像ではないと判定する。
【0084】
換言すると、第1判定処理部132は、文字数が規定値以上の場合は、たとえ文字領域割合が規定値未満でも、文字中心画像と判定する。同様に、文字領域割合が規定値以上の場合は、たとえ文字数が規定値未満であっても文字中心画像と判定する。そして、文字数が規定値未満であり、かつ、文字領域割合も規定値未満である場合に、文字中心画像ではないと判定する。
【0085】
ここで、規定値の例としては、例えば文字数150文字以上、文字領域割合20%以上などが考えられる。規定値については、ユーザが任意設定できるように構成したり、予め用意された複数セットの中から、ユーザが自由に選択設定できる構成としたりしてもよい。
【0086】
図6のフローチャートに、信号前処理部115、文字認識部111、レイアウト解析部112、および第1原稿判定部113Aで実施される、入力画像データより文字中心原稿であるか否かを判定するまでの大まかな処理の流れを示す。
【0087】
信号前処理部115にて、原稿傾きが検知され(S1)、傾きが補正される(S2)。傾きが補正された画像データを用いて、レイアウト解析部112がレイアウト解析を行う(S3)。レイアウト解析の結果を基に、文字認識部111による文字認識を利用して、抽出された最も多くのブロックが示す方向を、原稿の天地方向とする(S4)。
【0088】
原稿の天地が判定されると、文字認識部111は、画像全体の文字認識を開始する。ここで、文字認識は、レイアウト解析の結果を用いてブロック単位で実施する。文字認識部111が最初のブロックの文字認識を実施すると(S5)、その結果を用いて、第1原稿判定部113Aが、認識された文字数を計測し(S6)、認識された文字の文字領域の面積を求める(S7)。
【0089】
そして、S8において、当該ページの原稿画像に含まれる全てのブロックの処理が完了したかどうかを判断し、ブロックが残っている場合は、S5に戻り、次のブロックについて、S5〜S7を行って、認識された文字数の計測・加算、認識された文字の文字領域面積の算出・加算を行う。この処理を、S8において、全てのブロックの処理が完了したと判断するまで繰り返す。
【0090】
S8において、全てのブロックについて処理が完了していると判断すると、S9に移行し、第1原稿判定部113Aが、加算された文字領域面積より文字領域の割合を求め、求めた文字領域割合と文字数の総数に基づいて、文字中心画像であるか否かを判定する。判定結果は、ファイル形式決定部114へと送られる。
【0091】
その後、ファイル形式決定部114が、判定結果を用いて、ファイル形式を決定する(S10)。なお、S10の処理の詳細については、図10のフローチャートを用いて後述する。
【0092】
続いて、図7〜図9を用いて、第2原稿判定部113Bについて説明する。第2原稿判定部113Bは、原稿画像の文字の量に関する状況を、タイトル領域があるかどうかで検出するものである。タイトル領域を有するということは、原稿画像は、文字を多く含む文書よりなる原稿である蓋然性が高い。そのため、タイトル領域の有無の情報より、高い精度で原稿画像における文字の量を検出可能である。
【0093】
図7に示すように、第2原稿判定部113Bは、タイトル領域判定部(タイトル領域判定手段)140、および第2判定処理部(第2判定処理手段)141を備えている。
【0094】
タイトル領域判定部140は、レイアウト解析部112の解析結果および文字認識部111の認識結果より、原稿画像にタイトル領域が有るかどうかを判定するものである。タイトル領域判定部140は、仮判定部(仮判定手段)142と、本判定部(本判定手段)143とを備えている。
【0095】
仮判定部142は、レイアウト解析部112の解析結果より、一般的にタイトルが位置すると予想される位置に、原稿画像の他の領域よりも文字の外接矩形のサイズが大きく(文字サイズが大きく)、かつ該外接矩形が連続してなる帯状ブロックが規定以上の長さを有する場合に、これをタイトル領域と仮判定するものである。
【0096】
ここで、図8(a)〜図8(d)を用いて、仮判定部142が、レイアウト解析結果よりタイトル領域を仮判定する手順について説明する。仮判定部142は、レイアウト解析部112の解析結果を基に、抽出されたブロックの条件が以下のような条件である場合に、そのブロックはタイトル領域であると判定(仮判定)する。
【0097】
図8(a)〜図8(d)は、前述した図4のレイアウト解析結果を有する原稿を、4方向に回転した状態で入力された場合に取得される画像データのレイアウト解析結果を表している。4方向の内、図8(a)が上向き、図8(b)が右向き、図8(c)が下向き、図8(d)が左向きの場合を表す。
【0098】
画像データの方向が上向き・右向き・下向き・左向きと想定した場合のそれぞれに対する方向の上側(図8(a)〜図8(d)のブロックAの位置)または右側に、規定値以上の外接矩形サイズで、規定値以上の長さを有するブロックがある場合に、タイトル領域であると判定する。
【0099】
規定値の例としては、例えば外接矩形サイズが18ポイント以上や本文領域の外接矩形サイズの1.5倍以上、画像データの幅または高さの40%以上の長さなどが考えられる。ここで、画像データの幅または高さとは、図8(a)の参照符号L1、L2の寸法である。このような規定値の場合、図8(a)〜図8(d)では、ブロックAがタイトル領域として判定される。規定値は、ユーザが任意設定できるようにしたり、あるいは複数セット用意しておき、ユーザにより選択可能な構成にしたりしてもよい。
【0100】
本判定部143は、仮判定部142にてタイトル領域と判定(仮判定)された部分に対する文字認識結果が規定以上の認識率である場合に、タイトル領域であると本判定するものである。本判定部143には、仮判定部142より、タイトル領域であると仮判定したブロックの情報と、文字認識部111より文字認識結果が入力される。
【0101】
例えば、本判定部143は、仮判定部142にてタイトル領域であると判定されたブロックに対し、規定値以上の文字認識率である場合に、最終的にタイトル領域であると本判定する。
【0102】
文字認識率の規定値の例としては、例えばブロックに含まれる外接矩形の50%以上が文字認識されている場合などが考えられる。これにおいても、規定値については、ユーザが任意設定できるように構成したり、予め用意された複数セットの中から、ユーザが自由に選択設定できる構成としたりしてもよい。
【0103】
第2判定処理部141は、タイトル領域判定部140の判定結果に基づき、タイトル領域が有る場合は文字中心画像と判定し、タイトル領域が無い場合は文字中心画像ではないと判定するものであり、判定結果は、ファイル形式決定部114へと送られる。
【0104】
図9のフローチャートに、信号前処理部115、文字認識部111、レイアウト解析部112、および第2原稿判定部113Bで実施される、入力画像データより文字中心原稿であるか否かを判定するまでの大まかな処理の流れを示す。
【0105】
信号前処理部115にて、原稿傾きが検知され(S21)、傾きが補正される(S22)。傾きが補正された画像データを用いて、レイアウト解析部112がレイアウト解析を行う(S23)。レイアウト解析の結果を基に、第2原稿判定部113Bが、タイトル領域であるブロックが存在するかどうかを仮判定する(S24)。
【0106】
次に、文字認識部111による文字認識を利用して、抽出された最も多くのブロックが示す方向を、原稿の天地方向とする(S25)。
【0107】
原稿の天地が判定されると、文字認識部111は、画像全体の文字認識を開始する。ここで、文字認識は、レイアウト解析の結果を用いてブロック単位で実施する(S26)。
【0108】
文字認識が完了すると、S27に進んでS24の仮判定でタイトル領域であると仮判定されたブロックがあるかどうかを判断し、ある場合はS28に進んで、文字認識結果を用いて、タイトル領域の本判定を行う。なお、無い場合は、S28をスキップする。
【0109】
続くS29では、タイトル領域の有無に基づいて、文字中心画像であるか否かを判定する。判定結果は、ファイル形式決定部114へと送られる。
【0110】
その後、ファイル形式決定部114が、判定結果を用いて、ファイル形式を決定する(S30)。なお、S30の処理は、図6のフローチャートのS10の処理と同じであり、詳細については、図10のフローチャートを用いて後述する。
【0111】
次に、図10を用いて、ファイル形式決定部114による処理について説明する。図10は、ファイル形式決定部114による、ファイル形式を決定して指定信号を出力する処理の手順を示すフローチャートである。
【0112】
上述したようにファイル形式決定部114は、原稿判定部113(第1原稿判定部113A,第2原稿判定部113B)の判定結果に基づいてファイル形式を決定するものである。決定したファイル形式は、フォーマット化処理部110に対して指定信号として出力される。
【0113】
ファイル形式決定部114は、文字中心画像であると判定された場合は、文書画像に適したファイル形式を選択し、文字中心画像ではないと判定された場合には、写真画像に適したファイル形式を選択する。
【0114】
より具体的には、本実施形態においては、ファイル形式決定部114は、文書画像に適したファイル形式として、原稿画像における文字部分を2値画像として格納し、原稿画像におけるその他の部分を多階調画像として格納する高圧縮PDF形式を選択する。また、写真画像に適した出力ファイル形式としては、原稿画像全体を多階調画像として格納する通常PDF形式を選択する。
【0115】
また、本実施形態においては、ファイル形式決定部114には、入力画像データの用途を示す選択信号が入力される。ファイル形式決定部114は、選択信号より用途が、画像ファイリングであることを判別すると、フォーマット化処理部110に対してデフォルト設定されているファイル形式に変更するよう指定するようになっている。
【0116】
文書画像向きの出力ファイル形式は、文字部分が優先され文字以外の部分の詳細情報が残りにくい形式であるため、ファイリング用途の一部である帳簿書類等の電子化には不向きである。
【0117】
そこで、利用用途を示す選択信号をファイル形式決定部114に入力させる構成とし、電子ファイリング用途の場合に出力ファイル形式の自動切り替えを自動で行わない構成とすることで、帳簿書類等を間違って文書画像向きの出力ファイル形式で保存することを防止できる。
【0118】
本画像処理装置100が、例えば画像ファイリング機能を有する画像形成装置(例えば、MFP)に搭載された場合は、ユーザが操作パネル等を用いて選択した処理モード(scan to e-mailモード、scan to FTPモード、scan to 共有フォルダモード、scan to Desktopモード等)を示す選択信号がファイル形式決定部114に入力される。ファイル形式決定部114は、選択信号より、選択された処理モードが予め設定された画像ファイリングに係る処理モード(例えば、scan to 共有フォルダモード)である場合に、用途が画像ファイリングであることを判別する。scan to e-mailモード、scan to FTPモード、scan to 共有フォルダモード、scan to Desktopモード等のうち、scan to FTPモードとscan to 共有フォルダモードが画像ファイリングに関わるモードとなり得る。装置の仕様により、その両方、あるいは、何れか一方が、画像ファイリングに関わるモードとして事前に設定されている。
【0119】
図10のフローチャートに、ファイル形式決定部114の処理手順を示す。ファイル形式決定部114は、まず、選択信号がOKかどうか、つまり画像ファイリングの用途であるかどうかを判断する(S31)。ここで、選択信号が、用途として画像ファイリングを示す場合は、選択信号OKではないと判断してS35に進み、デフォルト形式を選択する。
【0120】
一方、選択信号が、用途として画像ファイリングを示すものではない場合は、選択信号OKと判断してS32に進み、原稿判定部113の判別結果が、文字中心原稿であるか否かを判断する。
【0121】
ここで、文字中心原稿である場合は、S33に進み高圧縮PDF形式を選択する。一方、文字中心原稿ではない場合は、S34に進み通常のPDF形式を選択する。
【0122】
S33、S34、S35において、ファイル形式の選択が完了すると、S36に進み、それぞれ選択したファイル形式を指定する指定信号をフォーマット化処理部110へと送信する。
【0123】
次に、図11を用いて、フォーマット化処理部110について説明する。図11は、フォーマット化処理部110の構成を示すブロック図である。フォーマット化処理部110は、透明テキスト作成部150と、画像ファイル生成部151とを備えている。
【0124】
透明テキスト作成部150には、文字認識部111より文字認識結果が入力される。透明テキスト作成部150は、文字認識結果に基づいて透明テキストを生成し、画像ファイル生成部151に出力する。透明テキストとは、認識された文字をテキスト情報として、見掛け上は見えない形で画像データに重ね合わせる(あるいは埋め込む)ためのデータである。例えば、PDFファイルでは、画像データに透明テキストを付加した画像ファイルが一般に使用されている。
【0125】
画像ファイル生成部151は、入力画像データを、指定信号にて指定されたファイル形式に変更するものである。指定されたファイル形式に応じ、入力画像データを所定の形式で圧縮処理し、この圧縮処理した画像データと、透明テキストとに基づいて所定のフォーマットの画像ファイルを生成するものである。
【0126】
本実施形態では、RGB信号の入力画像データを、ファイル形式決定部114の指定に従って、通常のPDF形式あるいは高圧縮PDF形式に変更するとともに、文字認識結果に基づいて生成された透明テキストを各画像ファイルに埋め込む。
【0127】
画像ファイル生成部151は、高圧縮PDF形式が指定されると、入力画像データにおける原稿画像の文字部分の画像は文字が判読しやすい解像度(たとえば300dpi)のMMR(Modified Modified Read)圧縮画像とし、原稿画像のその他の部分は、解像度がたとえば150dpiのJPEG(Joint Photographic Experts Group)画像に圧縮する。また、通常PDF形式が指定されると、原稿画像全体をたとえば150dpiのJPEG画像に圧縮する。
【0128】
ここで、高圧縮PDF生成処理の手順について説明する。
(I)前景マスク生成処理
入力画像から文字画素を表す前景マスクを抽出する。この処理としては、領域分離処理において、文字領域であると判定された画素を2値化し文字画素を抽出する。
(II)前景色インデックス化処理
前景画素色をインデックス化し、インデックス画像を表す前景レイヤーと、前景レイヤーの各文字色、および各文字色領域の最大・最小座標、各インデックスに属する画素数を格納した前景インデックスカラーテーブルを生成する。この処理としては、特許文献4に記載されている方法を用いることができる。これは、前景色のインデックス化処理に関する方法であり、前景レイヤー生成時に全ての前景画素を限られた色数で表す方法である。詳細には、前景画素について、前景インデックスカラーテーブルを更新していくことで、最終的に前景画像のインデックス化を行う。各前景画素について、前景画素色が既に前景インデックスカラーテーブルに登録されていると判断された場合、前景インデックスカラーテーブル内で、最も近い色を有するインデックス値を割り当てる。前景画素色が前景インデックスカラーテーブルに登録されていないと判断された場合は、新規インデックス値を割り当て、前景インデックスカラーテーブルに登録する。上記処理を繰り返すことにより、前景画像をインデックス化する。
(III)背景レイヤー生成処理
入力画像から前景画素を取り除いて、背景レイヤーを生成する処理であり、背景レイヤーの圧縮率を向上するために、前景画素周辺の前景画素でない周辺背景レイヤー画素を用いて穴埋め処理を行う。前景画素周辺の前景画素でない背景画素を参照し、その背景画素の平均値を用いて、背景レイヤー前景画素部を穴埋めする。また、近傍に前景画素でない背景画素が存在しない場合、近傍穴埋め処理結果を用いる。
(IV)2値画像生成処理
入力される前景レイヤーと、前景色インデックス化処理にて生成された座標情報を用いて、各インデックスの2値化画像を出力する。
(V)圧縮処理
各レイヤーに適切な圧縮処理を適用する。前述の通り、前景レイヤーは、MMR:可逆圧縮技術を用いて圧縮する。一方、背景レイヤーはJPEG:非可逆圧縮技術を用いて圧縮する。
【0129】
上記処理は、本画像処理装置100が複合機に搭載される場合は、後述する図12、図13に示す中間調生成部の後段に圧縮処理部を設け、高圧縮PDFを生成する際、圧縮処理部からのデータを用いるようにしても良い。
【0130】
また、ここではPDF形式を例示しているが、高解像度の2値画像と低解像度の背景画像とを重ねて配置することができるレイヤー構成が可能なファイルフォーマットであればどのような形式でもよい。例えば、マイクロソフト(商標)のパワーポイント(商標)など画像を重ねて配置できるようなアプリケーションは多数あり、複数の画像を重ねて配置できるようなアプリケーションの専用ファイルフォーマットで保存するという方法も考えられる。
【0131】
以上のように、本画像処理装置100では、原稿を読み取って得られた画像データをフォーマット化処理部110にてそのファイル形式を変更するにあたり、レイアウト解析と文字認識処理とを利用して原稿画像の文字の量に関する状況を検出し、この状況に応じたファイル形式を自動的に選択して変更することができる。
【0132】
これにより、利用者は、自身で原稿画像の文字の量に関する状況を確認し、手動にて状況に適したファイル形式へと切り換える作業を伴うことなく、適切なファイル形式に変更させることが可能となり、装置の利便性を向上することができる。
【0133】
そして、本画像処理装置100は、複写機、複合機、画像読取装置等に搭載させることができる。
【0134】
図12、図13に、本画像処理装置100を搭載したデジタルカラー複合機1のブロック図を示す。このうち、図12は、スキャナ等の画像入力装置2より原稿画像を読み取って画像データを生成し、該画像データに基づく画像を画像出力装置4にて生成して出力する、いわゆるコピーモードにおけるデータの流れを示している。
【0135】
一方、図13は、スキャナ等の画像入力装置2より原稿画像を読み取って画像データを生成し、該画像データのファイル形式を変更して送受信装置5より出力する、送信モードにおけるデータの流れを示している。
【0136】
図12、図13に示すように、デジタルカラー複合機1は、画像入力装置2、画像処理装置3、画像出力装置4、送受信装置5、および操作パネル6を備えている。なお、本画像処理装置100は、画像処理装置3に搭載されている。
【0137】
画像入力装置2は、原稿の画像を読み取って画像データを生成するものであり、例えばCCD(Charge Coupled Device )などの光学情報を電気信号に変換するデバイスを備えたスキャナ部(図示せず)より構成されている。本実施形態では、画像入力装置2は、原稿からの反射光像を、RGB(R:赤・G:緑・B:青)のアナログ信号として画像処理装置3に出力する。
【0138】
画像処理装置3は、図12、図13に示すように、A/D変換部11、シェーディング補正部12、入力処理部13、信号前処理部115、原稿補正部15、色補正部(色変換部)16、黒生成/下色除去部17、空間フィルタ部18、出力階調補正部19、中間調生成部(中間調生成部)20、領域分離部21、認識処理部109、フォーマット化処理部110、記憶部23、および制御部(CPU)24を備えている。
【0139】
記憶部23は画像処理装置3で扱われる各種データ(画像データ等)を記憶する記憶手段である。記憶部23の構成は特に限定されるものではないが、例えばハードディスクなどを用いることができる。また、制御部24は、画像処理装置3に備えられる各部の動作を制御する制御手段である。この制御部24は、デジタルカラー複合機1の主制御部(図示せず)に備えられるものであってもよく、主制御部とは別に備えられ、主制御部と協働して処理を行うものであってもよい。
【0140】
画像処理装置3は、コピーモードでは、画像入力装置2から入力された画像データに種々の画像処理を施して得られるCMYKの画像データを画像出力装置4に出力する。
【0141】
また、画像処理装置3は、送信モードでは、画像入力装置2から入力された画像データに傾き補正処理、原稿画像領域抽出処理、変倍処理、回転処理等の画像処理を施すと共に、画像処理後の画像データに基づいて一般に普及している表示装置の表示特性に適合したR’G’B’の画像データ(例えば、sRGBデータ)を生成し、生成したR’G’B’の画像データを、フォーマット化処理部110にて、原稿の状況に応じたファイル形式に変更して送受信装置5に出力する。
【0142】
画像出力装置4は、画像処理装置3から入力された画像データを記録材(例えば紙等)上に出力するものである。画像出力装置4の構成は特に限定されるものではなく、例えば、電子写真方式やインクジェット方式を用いた画像出力装置を用いることができる。
【0143】
送受信装置5は、例えばモデムやネットワークカードより構成される。送受信装置5は、ネットワークカード、LANケーブル等を介して、ネットワークに接続された他の装置(例えば、パーソナルコンピュータ、サーバ装置、表示装置、他のデジタル複合機、ファクシミリ装置等)とデータ通信を行う。送受信装置5は、画像データを送信する場合、相手先との送信手続きを行って送信可能な状態が確保されると、所定の形式で圧縮された画像データをメモリから読み出し、圧縮形式の変更など必要な処理を施して、通信回線を介して相手先に順次送信する。また、送受信装置5は、画像データを受信する場合、通信手続きを行うとともに、相手先から送信されてくる画像データを受信して画像処理装置3に入力する。受信した画像データは、画像処理装置3で伸張処理、回転処理、解像度変換処理、出力階調補正、階調再現処理などの所定の処理が施され、画像出力装置4によって出力される。なお、受信した画像データを記憶装置(図示せず)に保存し、画像処理装置3が必要に応じて読み出して上記所定の処理を施すようにしてもよい。
【0144】
操作パネル6は、例えば、液晶ディスプレイなどの表示部と設定ボタンなどより構成され(いずれも図示せず)、デジタルカラー複合機1の主制御部(図示せず)の指示に応じた情報を上記表示部に表示するとともに、上記設定ボタンを介してユーザから入力される情報を上記主制御部に伝達する。ユーザは、操作パネル6を介して入力画像データに対する処理モード、印刷枚数、用紙サイズ、送信先アドレスなどの各種情報を入力することができる。
【0145】
上記主制御部は、例えばCPU(Central Processing Unit)等からなり、図示しないROM等に格納されたプログラムや各種データ、操作パネル6から入力される情報等に基づいて、デジタルカラー複合機1の各部の動作を制御する。
【0146】
次に、コピーモードにおける画像処理装置3の動作についてより詳細に説明する。コピーモードの場合、図12に示すように、まず、A/D変換部11が、画像入力装置2から入力されたRGBのアナログ信号をデジタル信号に変換してシェーディング補正部12に出力する。
【0147】
シェーディング補正部12は、A/D変換部11から送られてきたデジタルのRGB信号に対して、画像入力装置2の照明系、結像系、撮像系で生じる各種の歪みを取り除く処理を施し、入力処理部13に出力する。
【0148】
入力処理部(入力階調補正部)13は、シェーディング補正部12にて各種の歪みが取り除かれたRGB信号に対して、カラーバランスを整えると同時に、濃度信号など画像処理装置3に採用されている画像処理システムの扱い易い信号に変換する処理を施すものである。また、下地濃度の除去やコントラストなどの画質調整処理を行う。また、入力処理部13は、上記の各処理を施した画像データを記憶部23に記憶させる。
【0149】
信号前処理部115は、上述したように、画像データを、後段の認識処理部109に適した信号となるように処理するものである。但し、コピーモードでは、認識処理部109よりフォーマット化処理部110へと指定信号が出力されたり、文字認識結果が出力されることはない。コピーモードの場合、信号前処理部115は、原稿傾き検知部124で検知された傾き角度の情報、あるいは傾き補正部125で補正した座標情報を、原稿補正部15へと出力する。また、認識処理部109は、原稿の天地判定結果を原稿補正部15へと出力する。
【0150】
原稿補正部15は、信号前処理部115、認識処理部109から出力される、原稿傾きの情報や原稿の天地の情報に従って、入力処理部13から入力される画像データ、あるいは記憶部23に保存されている画像データに対して、傾き補正処理、天地補正処理などを行う。
【0151】
また、原稿補正部15によって上記の各処理がなされた画像データを、記憶部23においてファイリングデータとして管理するようにしてもよい。
【0152】
画像データが、ファイリングデータとして管理される場合、上記画像データは、例えば、JPEG圧縮アルゴリズムに基づいてJPEGコードに圧縮されて記憶部23に格納される。そして、この画像データに対するコピー出力動作やプリント出力動作が指示された場合には、記憶部23からJPEGコードが引き出されて不図示のJPEG伸張部に引き渡され、復号化処理が施されてRGBデータに変換される。また、上記の画像データに対して送信動作が指示された場合には、記憶部23からJPEGコードが引き出され、ネットワーク網や通信回線を介して送受信装置5から外部装置へ送信される。
【0153】
色補正部16は、色再現の忠実化実現のために、不要吸収成分を含むCMY(C:シアン・M:マゼンタ・Y:イエロー)色材の分光特性に基づいた色濁りを取り除く処理を行うものである。
【0154】
黒生成/下色除去部17は、色補正後のCMYの3色信号から黒(K)信号を生成する黒生成、元のCMY信号から黒生成で得たK信号を差し引いて新たなCMY信号を生成する処理を行うものである。これにより、CMYの3色信号はCMYKの4色信号に変換される。
【0155】
空間フィルタ部18は、黒生成/下色除去部17より入力されるCMYK信号の画像データに対して、領域識別信号を基にデジタルフィルタによる空間フィルタ処理(強調処理および/または平滑化処理)を行い、空間周波数特性を補正する。これにより、出力画像のぼやけや粒状性劣化を軽減することができる。
【0156】
中間調生成部20は、空間フィルタ部18と同様、CMYK信号の画像データに対して領域識別信号を基に所定の処理を施すものである。
【0157】
例えば、領域分離部21にて文字に分離された領域は、特に黒文字あるいは色文字の再現性を高めるために、空間フィルタ部18による空間フィルタ処理における鮮鋭強調処理で高周波数の強調量が大きくされる。同時に、中間調生成部20においては、高域周波数の再現に適した高解像度のスクリーンでの二値化または多値化処理が選択される。また、領域分離部21にて網点領域に分離された領域に関しては、空間フィルタ部18において、入力網点成分を除去するためのローパス・フィルタ処理が施される。そして、出力階調補正部19では、濃度信号などの信号を画像出力装置4の特性値である網点面積率に変換する出力階調補正処理を行った後、中間調生成部20で、最終的に画像を画素に分離してそれぞれの階調を再現できるように処理する階調再現処理(中間調生成)が施される。領域分離部21にて写真に分離された領域に関しては、階調再現性を重視したスクリーンでの二値化または多値化処理が行われる。
【0158】
領域分離部21は、RGB信号より、入力画像中の各画素を黒文字領域、色文字領域、網点領域、印画紙写真(連続階調領域)領域の何れかに分離するものである。領域分離部21は、分離結果に基づき、画素がどの領域に属しているかを示す領域分離信号を、黒生成/下色除去部17、空間フィルタ部18、および中間調生成部20へと出力する。
【0159】
なお、認識処理部109における原稿判定部113およびファイル形式決定部114、フォーマット化処理部110は、コピーモードでは動作を行わない。
【0160】
上述した各処理が施された画像データは、一旦、図示しないメモリに記憶されたのち、所定のタイミングで読み出されて画像出力装置4に入力される。
【0161】
次に、送信モードにおける画像処理装置3の動作について、図13を参照しながら説明する。なお、送信モードにおけるA/D変換部11、シェーディング補正部12、入力処理部13、原稿補正部15、および領域分離部21の処理は、コピーモード時と同様である。なお、領域分離部21は領域分離信号を空間フィルタ部18および中間調生成部20に対して出力する。
【0162】
信号前処理部115は、画像形成モード時と同様の動作を行うとともに、2値化、低解像度化、傾き補正を行った画像データを認識処理部109に出力する。
【0163】
認識処理部109は、信号前処理部115より入力された画像データに基づいて、文字認識を行う。また、文字中心原稿であるかどうか、および処理モードがscan to e-mailモード、ファイリング等の処理ではないかどうかを判断して、ファイル形式を指定する指定信号を出力する。文字認識結果は、フォーマット化処理部110の透明テキスト作成部150に入力され、指定信号は画像ファイル生成部151に入力される。
【0164】
一方、色補正部16は、原稿補正部15から入力されたRGBの画像データを、一般に普及している表示装置の表示特性に適合したR’G’B’の画像データ(例えば、sRGBデータ)に変換し、黒生成/下色除去部17に出力する。黒生成/下色除去部17は、色補正部16から入力された画像データをそのまま空間フィルタ部18に出力(スルー)する。
【0165】
空間フィルタ部18は、黒生成/下色除去部17より入力されるR’G’B’の画像データに対して、領域識別信号を基にデジタルフィルタによる空間フィルタ処理(強調処理および/または平滑化処理)を行って、出力階調補正部19に出力する。出力階調補正部19は、空間フィルタ部18から入力されたR’G’B’の画像データに対して領域識別信号を基に所定の処理を施し、フォーマット化処理部110における画像ファイル生成部151に出力する。
【0166】
例えば、出力階調補正部19は、文字領域に対しては図14(b)に実線で示したガンマ曲線を用いた補正を行い、文字領域以外の領域に対しては図14(a)に示したガンマ曲線を用いた補正を行う。図14(b)の破線で示したガンマ曲線は、図14(a)に示したガンマ曲線である。図14(a)に示したガンマ曲線としては、例えば送信先の外部装置に備えられる表示装置の表示特性に応じた曲線を設定しておき、文字領域のガンマ曲線は文字をくっきり表示できるように設定しておくことが好ましい。
【0167】
出力階調補正部19から出力されたR’G’B’の画像データは、中間調生成部20に出力する。中間調生成部20は、出力階調補正部19から入力されたR’G’B’の画像データをそのまま後段のフォーマット化処理部110における画像ファイル生成部151に出力(スルー)する。
【0168】
フォーマット化処理部110の透明テキスト作成部150は、文字認識結果より透明テキストを作成し、画像ファイル生成部151へと出力する。画像ファイル生成部151は、中間調生成部20からスルーされてきたR’G’B’の画像データを、指定信号に従って、通常のPDF形式あるいは高圧縮PDF形式、あるいはデフォルト設定されているファイル形式に変更するとともに、作成された透明テキストを各画像ファイルに埋め込む。
【0169】
なお、本実施形態では、画像データに透明テキストを付加して送信するものとしているが、これに限るものではなく、ファイル形式のみ変更して、透明テキストを付加せずに送信するようにしてもよい。なお、透明テキストを付加しない場合には、認識処理部109からフォーマット化処理部110へのデータ出力を行わないようにしてもよい。
【0170】
送受信装置5は、フォーマット化処理部110から入力された画像ファイルを、ネットワークを介して通信可能に接続された外部装置に送信する。例えば、送受信装置5は、上記の画像ファイルを図示しないメール処理部(ジョブ装置)によって電子メールに添付して送信する。また、scan to e-mailモードが選択された場合は、指定されたメールアドレスへ、上記画像ファイルを電子メールに添付して送信する。また、scan to FTPモード、scan to 共有フォルダモードが選択された場合は、デジタルカラー複合機1外部のファイルサーバ内の指定のアドレス(例えば、IPアドレス)へ、上記画像ファイルを送信する。なお、デジタルカラー複合機1内部に設けた図示しないハードディスクを、ファイルサーバの代わりに使用することもできる。
【0171】
なお、図12、図13のデジタルカラー複合機1では、認識処理部109を領域分離部の前段に設けている。しかしながら、図15に示すように、認識処理部109を領域分離部21の後段に設けて、領域分離信号より作成されたテキストマップ(文字エッジと判定された画素よりなる画像領域)を参照して、レイアウト解析、文字領域に対する文字認識を行うようにしても良い。
【0172】
あるいは、図16に示すように、認識処理部109の前段に、原稿種別自動判別30を設け、原稿種別信号を認識処理部109の文字認識部111に入力させ、文字認識部111は、天地方向が判定された原稿画像全体に対して文字認識を行う場合、原稿種別信号に基づいて、文字原稿、文字印刷写真原稿、文字印画紙写真原稿と判別されたときに、文字認識を行うようにしても良い。
【0173】
なお、本実施形態では、本画像処理装置100をカラー画像データに対応した構成とし、デジタルカラー複合機1に適用する場合について説明したが、これに限らず、モノクロの複合機に適用してもよい。
【0174】
また、本画像処理装置100を、例えば単体の画像読取装置に適用してもよい。図17に、本画像処理装置100を搭載したデジタルカラースキャナ300の構成を示す。
【0175】
図17に示すように、デジタルカラースキャナ300は、画像入力装置2、画像処理装置3’、送信装置5’、および操作パネル6を備えている。画像入力装置2、および操作パネル6の構成および機能は上述したデジタルカラー複合機1の場合と略同様なので、ここではその説明を省略する。送信装置5’は、前記した送受信装置5の送信機能のみを備えた構成である。本画像処理装置100は画像処理装置3’に搭載されている。
【0176】
画像処理装置3’は、A/D変換部11、シェーディング補正部12、入力処理部13、信号前処理部115、原稿補正部15、色補正部16、認識処理部109、フォーマット化処理部110、記憶部23、および制御部24を備えている。
【0177】
なお、コピーモードを備えていない点、および、色補正部16が色補正処理後の画像データを、フォーマット化処理部110の画像ファイル生成部151に出力し、画像ファイル生成部151が色補正部16から入力された画像データに基づいて外部装置に送信する画像ファイルを生成する点以外の画像処理装置3’の機能は、上述したデジタルカラー複合機1の画像処理装置3の場合と略同様である。
【0178】
画像処理装置3’において上述した各処理が施されて生成された画像ファイルは、送信装置5’により、ネットワークを介して通信可能に接続されたコンピュータやサーバなどに送信される。
【0179】
また、上記実施形態において、画像処理装置100、デジタルカラー複合機1、デジタルカラースキャナ300に備えられる各部(各ブロック)を、CPU等のプロセッサを用いてソフトウェアによって実現してもよい。この場合、画像処理装置100、デジタルカラー複合機1、デジタルカラースキャナ300は、各機能を実現する制御プログラムの命令を実行するCPU(central processing unit)、上記プログラムを格納したROM(read only memory)、上記プログラムを展開するRAM(random access memory)、上記プログラムおよび各種データを格納するメモリ等の記憶装置(記録媒体)などを備えている。
【0180】
そして、本発明の目的は、上述した機能を実現するソフトウェアである画像処理装置100、デジタルカラー複合機1、デジタルカラースキャナ300の制御プログラムのプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)をコンピュータで読み取り可能に記録した記録媒体を、画像処理装置100、デジタルカラー複合機1、デジタルカラースキャナ300に供給し、そのコンピュータ(またはCPUやMPU)が記録媒体に記録されているプログラムコードを読み出し実行することによって達成される。
【0181】
上記記録媒体としては、例えば、磁気テープやカセットテープ等のテープ系、フロッピー(登録商標)ディスク/ハードディスク等の磁気ディスクやCD−ROM/MO/MD/DVD/CD−R等の光ディスクを含むディスク系、ICカード(メモリカードを含む)/光カード等のカード系、あるいはマスクROM/EPROM/EEPROM/フラッシュROM等の半導体メモリ系などを用いることができる。
【0182】
また、画像処理装置100、デジタルカラー複合機1、デジタルカラースキャナ300を通信ネットワークと接続可能に構成し、通信ネットワークを介して上記プログラムコードを供給してもよい。この通信ネットワークとしては、特に限定されず、例えば、インターネット、イントラネット、エキストラネット、LAN、ISDN、VAN、CATV通信網、仮想専用網(virtual private network)、電話回線網、移動体通信網、衛星通信網等が利用可能である。また、通信ネットワークを構成する伝送媒体としては、特に限定されず、例えば、IEEE1394、USB、電力線搬送、ケーブルTV回線、電話線、ADSL回線等の有線でも、IrDAやリモコンのような赤外線、Bluetooth(登録商標)、802.11無線、HDR、携帯電話網、衛星回線、地上波デジタル網等の無線でも利用可能である。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。
【0183】
また、画像処理装置100、デジタルカラー複合機1、デジタルカラースキャナ300の各ブロックは、ソフトウェアを用いて実現されるものに限らず、ハードウェアロジックによって構成されるものであってもよく、処理の一部を行うハードウェアと当該ハードウェアの制御や残余の処理を行うソフトウェアを実行する演算手段とを組み合わせたものであってもよい。
【0184】
本発明は上述した実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能である。すなわち、請求項に示した範囲で適宜変更した技術的手段を組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
【産業上の利用可能性】
【0185】
本発明は、原稿から読み取った画像データのファイル形式を変更して他の装置に送信する画像処理装置、画像読取装置、および画像形成装置に適用できる。
【符号の説明】
【0186】
1 デジタルカラー複合機(画像処理装置、画像形成装置)
2 画像入力装置
3 画像処理装置
3’ 画像処理装置
4 画像出力装置
5 送受信装置
5’ 送信装置
6 操作パネル
15 原稿補正部
16 色補正部
21 領域分離部
23 記憶部
24 制御部
100 画像処理装置
110 フォーマット化処理部(フォーマット化処理手段)
111 文字認識部(文字認識手段)
112 レイアウト解析部(レイアウト解析手段)
113 原稿判定部(原稿判定手段)
113A 原稿判定部(原稿判定手段)
113B 原稿判定部(原稿判定手段)
114 ファイル形式決定部(ファイル形式決定手段)
115 信号前処理部
130 文字計数部(文字計数手段)
131 文字領域割合算出部(文字領域割合算出手段)
132 第1判定処理部(第1判定処理手段)
140 タイトル領域判定部(タイトル領域判定手段)
141 第2判定処理部(第2判定処理手段)
300 デジタルカラースキャナ(画像読取装置)

【特許請求の範囲】
【請求項1】
原稿画像を画像入力装置にて読み取ることで得られた入力画像データを指定されたファイル形式に変更するフォーマット化処理手段を備えた画像処理装置であって、
上記入力画像データに対して文字認識処理を行う文字認識手段と、
上記入力画像データに対して、ページ毎の画像のレイアウトを解析するレイアウト解析手段と、
上記レイアウト解析手段の解析結果および上記文字認識手段の認識結果より、上記入力画像データが示す原稿画像が文字を多く含んでいる文字中心画像であるか否かを判定する原稿判定手段と、
上記原稿判定手段の判定結果に基づいてファイル形式を決定し、上記フォーマット化処理手段に対して決定したファイル形式を指定するファイル形式決定手段とを有し、
上記ファイル形式決定手段は、文字中心画像であると判定された場合に、文書画像に適したファイル形式を選択し、文字中心画像ではないと判定された場合に、写真画像に適したファイル形式を選択することを特徴とする画像処理装置。
【請求項2】
上記原稿判定手段は、
上記レイアウト解析手段の解析結果および上記文字認識手段の認識結果より原稿画像における文字領域の占める割合を算出する文字領域割合算出手段と、
上記文字認識手段において認識された文字のページ毎の総数を数える文字計数手段と、
上記文字計数手段にて計数された文字数および上記文字領域割合算出手段にて算出された文字領域の割合に基づいて、少なくとも文字数が多いあるいは文字領域の割合が高い場合に文字中心画像と判定し、文字数が少なくかつ文字領域の割合も低い場合に文字中心画像ではないと判定する第1判定処理手段とを含むことを特徴とする請求項1に記載の画像処理装置。
【請求項3】
上記原稿判定手段は、
上記レイアウト解析手段の解析結果および上記文字認識手段の認識結果よりタイトル領域の有無を判定するタイトル領域判定手段と、
タイトル領域が有る場合に文字中心画像と判定し、タイトル領域が無い場合に文字中心画像ではないと判定する第2判定処理手段とを含むことを特徴とする請求項1に記載の画像処理装置。
【請求項4】
上記タイトル領域判定手段は、
上記レイアウト解析手段の解析結果より、一般的にタイトルが位置すると予想される位置に、原稿画像の他の領域よりも文字の外接矩形のサイズが大きく、かつ該外接矩形が連続してなる帯状ブロックが規定以上の長さを有する場合に、タイトル領域と仮判定する仮判定手段と、
上記仮判定手段にてタイトル領域と仮判定された部分に対する文字認識結果が規定以上の認識率である場合に、タイトル領域と本判定する本判定手段とを含むことを特徴とする請求項3に記載の画像処理装置。
【請求項5】
上記文書画像に適したファイル形式が、原稿画像における文字部分を2値画像として格納し、原稿画像におけるその他の部分を多階調画像として格納する高圧縮PDF形式であり、
上記写真画像に適した出力ファイル形式が、原稿画像全体を多階調画像として格納する通常PDF形式であることを特徴とする請求項1〜4の何れか1項に記載の画像処理装置。
【請求項6】
上記ファイル形式決定手段には、上記入力画像データの利用用途を示す選択信号が入力されるようになっており、
上記ファイル形式決定手段は、上記選択信号より利用用途が画像ファイリングであることを判別すると、上記フォーマット化処理手段に対してデフォルト設定されているファイル形式に変更するよう指定することを特徴とする請求項1〜5の何れか1項に記載の画像処理装置。
【請求項7】
請求項1〜6の何れか1項に記載の画像処理装置を備えることを特徴とする画像形成装置。
【請求項8】
請求項1〜6の何れか1項に記載の画像処理装置を備えることを特徴とする画像読取装置。
【請求項9】
原稿画像を画像入力装置にて読み取ることで得られた入力画像データを指定されたファイル形式に変更するフォーマット化処理工程を含む画像処理方法であって、
上記入力画像データに対して文字認識処理を行う文字認識工程と、
上記入力画像データに対して、ページ毎の画像のレイアウトを解析するレイアウト解析工程と、
上記レイアウト解析工程の解析結果および上記文字認識工程の認識結果より、上記入力画像データが示す原稿画像が文字画像を多く含んでいる文字中心画像であるか否かを判定する原稿判定工程と、
上記原稿判定工程の判定結果に基づいてファイル形式を決定し、上記フォーマット化処理工程に対して決定したファイル形式を指定するファイル形式決定工程とを有し、
上記ファイル形式決定工程においては、上記原稿判定工程にて文字中心画像であると判定された場合に、文書画像に適したファイル形式を選択し、上記原稿判定工程にて文字中心画像ではないと判定された場合に、写真画像に適したファイル形式を選択することを特徴とする画像処理方法。
【請求項10】
請求項1〜6の何れか1項に記載の画像処理装置を動作させるための画像処理プログラムであって、コンピュータを上記の各手段として機能させるための画像処理プログラム。
【請求項11】
請求項10に記載された画像処理プログラムを記憶したことを特徴とした記録媒体。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate


【公開番号】特開2012−74852(P2012−74852A)
【公開日】平成24年4月12日(2012.4.12)
【国際特許分類】
【出願番号】特願2010−217342(P2010−217342)
【出願日】平成22年9月28日(2010.9.28)
【出願人】(000005049)シャープ株式会社 (33,933)
【Fターム(参考)】