画像処理装置、画像処理方法および画像処理プログラム

【課題】文字の色を容易かつ高精度に検出する。
【解決手段】ＭＦＰは、カラー画像から文字が表された文字属性の文字領域を抽出する文字領域抽出部３１０と、文字領域に含まれる文字を細線化する細線化部３３１と、細線化された文字を構成する複数の文字中心画素に対応するカラー画像の画素の色に基づいて、文字色を決定する文字色決定部３３０と、カラー画像を２値化することによって、２値画像に変換するノイズ除去部３２０と、２値画像の文字領域を符号化し、符号データを生成する文字領域符号化部３４０と、生成された符号データと、決定された文字色と、文字領域のカラー画像中の位置とを関連付ける統合部３７０と、を備える。

【発明の詳細な説明】
【技術分野】
【０００１】
この発明は、画像処理装置、画像処理方法および画像処理プログラムに関し、特にカラー画像を効率的に圧縮する画像処理装置、画像処理方法および画像処理プログラムに関する。
【背景技術】
【０００２】
近年、情報の電子化が進み、文書を紙でなく電子データとして保存あるいは送信する需要が高まっている。さらに、文書がカラーで表されることが多く、電子データもカラー画像であることが望まれる。一方で、カラー画像は、モノクロ画像に比較してデータ量が多くなるため、カラー画像の電子データを圧縮し、圧縮後のデータを保存あるいは送信することがなされている。
【０００３】
しかしながら、カラー画像に文字が表されている場合、写真等の圧縮に適した非可逆方式で圧縮すると、伸張後のカラー画像中で文字が読めなくなってしまうといった問題がある。この問題に対応するために、カラー画像を、文字が表された文字領域と、文字領域以外の領域とに分離し、カラー画像の文字領域を可逆圧縮方式で圧縮し、文字領域以外の領域を非可逆圧縮方式で圧縮する技術が、特開２０００−３５００４０（特許文献１）または特開平５−１３０４２６号公報（特許文献２）に記載されている。さらに、カラー画像に複数の色で文字が表されている場合、複数の色別に文字領域を２値化した画像を可逆圧縮すると、カラー画像を効率的に圧縮することができる。
【０００４】
しかしながら、原稿を読み取るスキャナの特性上、スキャナが出力するカラー画像データで、文字の中心部分の画素と文字の輪郭部分の画素とで色が異なるため、文字を構成する画素の値から文字の色を高精度に検出するためには、複雑な処理を行わなければならず、処理に時間がかかるといった問題があった。
【特許文献１】特開２００１−３１２７２５号公報
【特許文献２】特開２００１−３１２７２６号公報
【発明の開示】
【発明が解決しようとする課題】
【０００５】
この発明は上述した問題点を解決するためになされたもので、この発明の目的の一つは、文字の色を容易かつ高精度に検出することが可能な画像処理装置、画像圧縮方法および画像圧縮プログラムを提供することである。
【０００６】
この発明の他の目的は、画像から文字が表された領域を抽出する精度を高めた画像処理装置を提供することである。
【課題を解決するための手段】
【０００７】
上述した目的を達成するためにこの発明のある局面によれば、画像処理装置は、カラー画像から文字が表された文字属性の文字領域を抽出する文字領域抽出手段と、文字領域に含まれる文字を細線化する細線化手段と、細線化された文字を構成する複数の文字中心画素に対応するカラー画像の画素の色に基づいて、文字色を決定する文字色決定手段と、カラー画像を２値化することによって、２値画像に変換する２値化手段と、２値画像の文字領域を符号化し、符号データを生成する文字領域符号化手段と、生成された符号データと、決定された文字色と、文字領域のカラー画像中の位置とを関連付ける関連付手段と、を備える。
【０００８】
この局面に従えば、カラー画像から抽出された文字領域に含まれる文字が細線化され、細線化された文字を構成する複数の文字中心画素に対応するカラー画像の画素の色に基づいて、文字色が決定される。そして、カラー画像を２値化した２値画像の文字領域が符号化され、符号データと、決定された文字色と、文字領域のカラー画像中の位置とが関連付けられる。カラー画像を２値化した２値画像の文字領域が符号化されるので、文字全体を同じ色の文字として２値化することができる。また、細線化後の文字を構成する複数の文字中心画素に対応する画像データの画素の色に基づいて文字色が決定されるので、文字の色を正確に検出することができる。その結果、画像中の文字の色を容易かつ高精度に検出することが可能な画像処理装置を提供することができる。
【０００９】
好ましくは、細線化手段は、２値画像において主走査方向に連続して配置された黒画素のうちから中心の画素を抽出する主走査方向検出手段と、主走査方向と交わる副走査方向に連続して配置された黒画素のうちから中心の画素を抽出する副走査方向検出手段と、主走査方向検出手段で抽出された中心画素と、副走査方向検出手段で抽出された中心画素とを文字中心画素に決定する決定手段と、を含む。
【００１０】
この局面に従えば、主走査方向と副走査方向それぞれで、連続して配置された黒画素のうちから中心の画素を文字中心画素として抽出するので、文字中心画素を容易に抽出することができ、処理速度を速くすることができる。
【００１１】
好ましくは、細線化手段は、主走査方向に連続して配置された複数の黒画素の両端から所定数の画素を除いた少なくとも１つの画素を第１候補画素として抽出する主走査方向検出手段と、主走査方向と交わる副走査方向に連続して配置された複数の黒画素の両端から所定数の画素を除いた少なくとも１つの画素を第２候補画素として抽出する副走査方向検出手段と、第１候補画素および第２候補画素のいずれでもある画素を文字中心画素に決定する決定手段と、を含む。
【００１２】
この局面に従えば、主走査方向に連続して配置された複数の黒画素の両端から所定数の画素を除いた少なくとも１つの画素であって、副走査方向に連続して配置された複数の黒画素の両端から所定数の画素を除いた少なくとも１つの画素を文字中心画素とするので、文字中心画素を容易に抽出することができ、処理速度を早くすることができる。
【００１３】
好ましくは、文字色決定手段は、複数の文字中心画素それぞれの細線化する前の色に基づき、複数の文字中心画素それぞれを複数の色相階級のいずれかに分類する分類手段と、度数が第１のしきい値以下の色相階級に分類された画素をノイズとして除去するノイズ除去手段を含む。
【００１４】
好ましくは、文字色決定手段は、複数の文字中心画素それぞれの細線化する前の色に基づき、複数の文字中心画素それぞれを複数の色相階級のいずれかに分類する分類手段と、複数の色相階級のうちから度数が第１のしきい値を超える色相階級を代表色相として選択する選択手段と、を含み、複数の文字中心画素のうち選択された代表色相の色相階級に分類された文字中心画素の細線化する前の色に基づき文字色を決定する。
【００１５】
好ましくは、選択手段は、度数が第１しきい値を超える色相階級が２以上連続する場合、連続する色相階級のうち度数が最大の色相階級を代表色相として選択する色相統合手段を含む。
【００１６】
好ましくは、文字色決定手段は、選択手段により複数の代表色相が選択された場合、複数の代表色相にそれぞれ対応する複数の文字色を決定し、文字領域符号化手段は、複数の代表色相それぞれにおいて、２値画像の文字領域に含まれる黒画素のうちから該黒画素に対応するカラー画像の画素の色が該代表色相に対応する文字色と近似する画素を抽出することにより、該代表色相に対応する文字色別２値画像を生成する文字色別２値化データ生成手段と、決定された複数の文字色にそれぞれ対応する複数の文字色別２値化データを符号化し、文字色別符号データを生成する文字色別符号化手段と、を含み、関連付手段は、決定された複数の文字色ごとに、該文字色と、該文字色に対応する文字色別符号データと、文字領域の画像データ中の位置とを関連付ける文字色別関連付手段を含む。
【００１７】
好ましくは、文字色決定手段は、複数の文字中心画素それぞれの細線化する前の色に基づき、複数の文字中心画素それぞれを複数の色相階級のいずれかに分類する分類手段と、複数の色相階級の度数分布に基づいて、文字領域の属性を文字属性以外の属性に変更する属性変更手段と、を含む。
【００１８】
この発明の他の局面によれば、画像処理装置は、カラー画像から文字が表された文字属性の文字領域を抽出する文字領域抽出手段と、カラー画像から写真または図形が表された写真／図属性の写真／図領域を抽出する写真／図領域抽出手段と、文字領域に含まれる文字を細線化する細線化手段と、細線化された文字を構成する複数の文字中心画素それぞれの細線化する前の色に基づき、複数の文字中心画素それぞれを複数の色相階級のいずれかに分類する分類手段と、複数の色相階級の度数分布に基づいて、文字領域の属性を文字属性以外の属性に変更する属性変更手段と、を備える。
【００１９】
この局面に従えば、文字中心画素それぞれの細線化する前の色の複数の色相階級における度数分布に基づいて、文字領域の属性が文字属性以外の属性に変更される。このため、写真または図が表されている領域が誤って文字領域に判別された場合であっても、適切に領域の属性を判別することができる。その結果、画像から文字が表された領域を抽出する精度を高めた画像処理装置を提供することができる。
【００２０】
この発明のさらに他の局面によれば、画像処理方法は、カラー画像から文字が表された文字属性の文字領域を抽出するステップと、文字領域に含まれる文字を細線化するステップと、細線化された文字を構成する複数の文字中心画素に対応するカラー画像の画素の色に基づいて、文字色を決定するステップと、カラー画像を２値化することによって、カラー画像を２値画像に変換するステップと、２値画像の文字領域を符号化し、符号データを生成するステップと、生成された符号データと、決定された文字色と、文字領域のカラー画像中の位置とを関連付けるステップと、を含む。
【００２１】
この局面に従えば、画像中の文字の色を容易かつ高精度に検出することが可能な画像処理方法を提供することができる。
【００２２】
この発明のさらに他の局面によれば、画像処理方法は、カラー画像から文字が表された文字属性の文字領域を抽出するステップと、カラー画像から写真または図形が表された写真／図属性の写真／図領域を抽出するステップと、文字領域に含まれる文字を細線化するステップと、細線化された文字を構成する複数の文字中心画素それぞれの細線化する前の色に基づき、複数の文字中心画素それぞれを複数の色相階級のいずれかに分類するステップと、
複数の色相階級の度数分布に基づいて、文字領域の属性を文字属性以外の属性に変更するステップと、を含む。
【００２３】
この局面に従えば、画像から文字が表された領域を抽出する精度を高めた画像処理方法を提供することができる。
【００２４】
この発明のさらに他の局面によれば、画像処理プログラムは、カラー画像から文字が表された文字属性の文字領域を抽出するステップと、文字領域に含まれる文字を細線化するステップと、細線化された文字を構成する複数の文字中心画素に対応するカラー画像の画素の色に基づいて、文字色を決定するステップと、カラー画像を２値化することによって、カラー画像を２値画像に変換するステップと、２値画像の文字領域を符号化し、符号データを生成するステップと、生成された符号データと、決定された文字色と、文字領域のカラー画像中の位置とを関連付けるステップと、をコンピュータに実行させる。
【００２５】
この局面に従えば、画像中の文字の色を容易かつ高精度に検出することが可能な画像処理プログラムを提供することができる。
【００２６】
この発明のさらに他の局面によれば、画像処理プログラムは、カラー画像から文字が表された文字属性の文字領域を抽出するステップと、カラー画像から写真または図形が表された写真／図属性の写真／図領域を抽出するステップと、文字領域に含まれる文字を細線化するステップと、細線化された文字を構成する複数の文字中心画素それぞれの細線化する前の色に基づき、複数の文字中心画素それぞれを複数の色相階級のいずれかに分類するステップと、
複数の色相階級の度数分布に基づいて、文字領域の属性を文字属性以外の属性に変更するステップと、をコンピュータに実行させる。
【００２７】
この局面に従えば、画像から文字が表された領域を抽出する精度を高めた画像処理プログラムを提供することができる。
【発明を実施するための最良の形態】
【００２８】
以下、本発明の実施の形態について図面を参照して説明する。以下の説明では同一の部品には同一の符号を付してある。それらの名称および機能も同じである。したがってそれらについての詳細な説明は繰返さない。
【００２９】
図１は、本発明の実施の形態の一つにおける画像形成システムの全体概要を示す図である。図１を参照して、画像形成システム１は、ネットワーク２にそれぞれ接続された画像処理装置としてのＭＦＰ（ＭｕｌｔｉＦｕｎｃｔｉｏｎＰｅｒｉｐｈｅｒａｌ）１００と、コンピュータ３，３Ａ，３Ｂ，３Ｃと、それぞれがＭＦＰ１００に接続されるデジタルカメラ４と、デジタルビデオカメラ５と、携帯情報端末６とを含む。
【００３０】
ＭＦＰ１００は、原稿を読取るためのスキャナ、画像データに基づいて紙などの記録媒体に画像を形成するための画像形成部、ファクシミリを含み、画像読取機能、複写機能、ファクシミリ送受信機能を備えている。
【００３１】
コンピュータ３，３Ａ，３Ｂ，３Ｃは、一般的なパーソナルコンピュータであり、ＭＦＰ１００を制御するためのプリンタドライバプログラムがインストールされている。コンピュータ３，３Ａ，３Ｂ，３Ｃは、それらがアプリケーションプログラムを実行することにより、生成されるプリントデータまたは画像データを、ＭＦＰ１００に出力する。ＭＦＰ１００は、携帯情報端末６から入力されるプリントデータまたは画像データを画像処理する、または、そのプリントデータまたは画像データに基づいて、記録媒体に画像を形成する。さらに、コンピュータ３，３Ａ，３Ｂ，３Ｃは、画像処理装置としても機能する。
【００３２】
デジタルカメラ４およびデジタルビデオカメラ５は、撮像した静止画像または動画像を記憶し、それらが接続されたＭＦＰ１００に静止画像または動画像の画像データを出力する。ＭＦＰ１００は、入力される静止画像の画像データを画像処理する、また、静止画像の画像データに基づき用紙等の記録媒体に静止画像を形成する。また、動画像の画像データが入力される場合、１フレームの画像の画像データを画像処理する、また、１フレームの画像の画像データに基づき記録媒体に画像を形成する。携帯情報端末６は、コンピュータ３，３Ａ，３Ｂ，３Ｃと同様に、それがアプリケーションプログラムを実行することにより生成されるデータまたは画像データを、ＭＦＰ１００に出力する。ＭＦＰ１００は、携帯情報端末６から入力されるデータまたは画像データを画像処理する、また、その画像データに基づいて、記録媒体に画像を形成する。
【００３３】
ネットワーク２は、ローカルエリアネットワーク（ＬＡＮ）であり、接続形態は有線または無線を問わない。またネットワーク２は、ＬＡＮに限らず、ワイドエリアネットワーク（ＷＡＮ）、インターネット等であってもよい。
【００３４】
図２は、ＭＦＰの外観を示す斜視図である。図２を参照して、ＭＦＰ１００は、自動原稿搬送装置（ＡＤＦ）１０と、画像読取部２０と、画像形成部４０と、給紙部５０と、を含む。ＡＤＦ１０は、原稿台に搭載された複数枚の原稿をさばいて１枚ずつ順に、画像読取部２０に搬送する。画像読取部２０は、写真、文字、絵等の画像情報を原稿から光学的に読み取って画像データを取得する。画像形成部４０は、画像データが入力されると、画像データに基づいて用紙上に画像を形成する。画像形成部４０は、シアン、マゼンタ、イエロー、ブラックの４色のトナーを用いて画像を形成する。給紙部５０は、用紙を格納しており、格納した用紙を１枚ずつ画像形成部４０に供給する。ＭＦＰ１００は、その上面に操作パネル９を備える。
【００３５】
図３は、ＭＦＰのハード構成の一例を示すブロック図である。図３を参照して、ＭＦＰ１００は、メイン回路１０１と、ファクシミリ部６０と、通信制御部６１と、ＡＤＦ１０と、画像読取部２０と、画像処理部３０と、画像形成部４０と、給紙部５０とを含む。メイン回路１０１は、中央演算装置（ＣＰＵ）１１１と、ＣＰＵ１１１の作業領域として使用されるＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）１１２と、ＣＰＵ１１１が実行するプログラム等を記憶するためのＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）１１３と、表示部１１４と、操作部１１５と、大容量記憶装置としてのハードディスクドライブ（ＨＤＤ）１１６と、データ通信制御部１１７と、を含む。ＣＰＵ１１１は、表示部１１４、操作部１１５、ＨＤＤ１１６およびデータ通信制御部１１７とそれぞれ接続され、メイン回路１０１の全体を制御する。また、ＣＰＵ１１１は、ファクシミリ部６０、通信制御部６１、ＡＤＦ１０、画像読取部２０、画像処理部３０、画像形成部４０、給紙部５０、と接続され、ＭＦＰ１００の全体を制御する。
【００３６】
表示部１１４は、液晶表示装置（ＬＣＤ）、有機ＥＬＤ（ＥｌｅｃｔｒｏＬｕｍｉｎｅｓｃｅｎｃｅＤｉｓｐｌａｙ）等の表示装置であり、ユーザに対する指示メニューや取得した画像データに関する情報等を表示する。操作部１１５は、複数のキーを備え、キーに対応するユーザの操作による各種の指示、文字、数字などのデータの入力を受付ける。操作部１１５は、表示部１１４上に設けられたタッチパネルを含む。表示部１１４と操作部１１５とで、操作パネル９が構成される。
【００３７】
データ通信制御部１１７は、ＴＣＰ（ＴｒａｎｓｍｉｓｓｉｏｎＣｏｎｔｒｏｌＰｒｏｔｏｃｏｌ）またはＦＴＰ（ＦｉｌｅＴｒａｎｓｆｅｒＰｒｏｔｏｃｏｌ）等の通信プロトコルで通信するためのインターフェースであるＬＡＮ端子１１８と、シリアル通信インターフェース端子１１９とを有する。データ通信制御部１１７は、ＣＰＵ１１１からの指示に従って、ＬＡＮ端子１１８またはシリアル通信インターフェース端子１１９に接続された外部の機器との間でデータを送受信する。
【００３８】
ＬＡＮ端子１１８に、ネットワーク２に接続するためのＬＡＮケーブルが接続される場合、データ通信制御部１１７は、ＬＡＮ端子１１８を介して接続された他のＭＦＰ、スキャナ、プリンタ、またはコンピュータ３，３Ａ，３Ｂ，３Ｃと通信する。シリアル通信インターフェース端子１１９に機器が接続された場合、データ通信制御部１１７は、シリアル通信インターフェース端子１１９に接続された機器、例えば、デジタルカメラ４、デジタルビデオカメラ５または携帯情報端末６との間で通信して画像データを入出力する。また、シリアル通信インターフェース端子１１９には、フラッシュメモリを内蔵したメモリカード１１９Ａが接続可能である。ＣＰＵ１１１は、データ通信制御部１１７を制御して、メモリカード１１９ＡからＣＰＵ１１１または画像処理部３０が実行するためのプログラムを読出し、読み出したプログラムをＲＡＭ１１２に記憶し、実行する。
【００３９】
なお、ＣＰＵ１１１または画像処理部３０が実行するためのプログラムを記憶する記録媒体としては、メモリカード１１９Ａに限られず、フレキシブルディスク、カセットテープ、光ディスク（ＣＤ−ＲＯＭ（ＣｏｍｐａｃｔＤｉｓｃ−ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）／ＭＯ（ＭａｇｎｅｔｉｃＯｐｔｉｃａｌＤｉｓｃ／ＭＤ（ＭｉｎｉＤｉｓｃ）／ＤＶＤ（ＤｉｇｉｔａｌＶｅｒｓａｔｉｌｅＤｉｓｃ））、ＩＣカード（メモリカードを含む）、光カード、マスクＲＯＭ、ＥＰＲＯＭ（ＥｒａｓａｂｌｅＰｒｏｇｒａｍｍａｂｌｅＲＯＭ）、ＥＥＰＲＯＭ（ＥｌｅｃｔｒｏｎｉｃａｌｌｙＥＰＲＯＭ）などの半導体メモリ等の媒体でもよい。さらに、ＣＰＵ１１１がインターネットに接続されたコンピュータからプログラムをダウンロードしてＨＤＤ１１６に記憶する、または、インターネットに接続されたコンピュータがプログラムをＨＤＤ１１６に書込みするようにして、ＨＤＤ１１６に記憶されたプログラムをＲＡＭ１１２にロードしてＣＰＵ１１１または画像処理部３０で実行するようにしてもよい。ここでいうプログラムは、ＣＰＵ１１１または画像処理部３０により直接実行可能なプログラムだけでなく、ソースプログラム、圧縮処理されたプログラム、暗号化されたプログラム等を含む。
【００４０】
通信制御部６１は、ＣＰＵ１１１をＰＳＴＮ（ＰｕｂｌｉｃＳｗｉｔｃｈｅｄＴｅｌｅｐｈｏｎｅＮｅｔｗｏｒｋｓ）７に接続するためのモデムである。ＭＦＰ１００には、ＰＳＴＮ７における電話番号が予め割り当てられており、ＰＳＴＮ７に接続されたファクシミリ装置からＭＦＰ１００に割り当てられた電話番号に発呼があると、通信制御部６１がその発呼を検出する。通信制御部６１は、発呼を検出すると通話を確立し、ファクシミリ部６０に通信させる。
【００４１】
ファクシミリ部６０は、ＰＳＴＮ７に接続され、ＰＳＴＮ７にファクシミリデータを送信する、またはＰＳＴＮ７からファクシミリデータを受信する。ファクシミリ部６０は、受信したファクシミリデータを、ＣＰＵ１１１に出力する。また、ファクシミリ部６０は、受信したファクシミリデータを画像形成部４０でプリント可能なプリントデータに変換して、画像形成部４０に出力する。これにより、画像形成部４０は、ファクシミリ部６０により受信されたファクシミリデータを記録シートにプリントする。また、ファクシミリ部６０は、ＨＤＤ１１６に記憶された画像データをファクシミリデータに変換して、ＰＳＴＮ７に接続されたファクシミリ装置または他のＭＦＰに出力する。これにより、ＨＤＤ１１６に記憶されたデータをファクシミリ装置または他のＭＦＰに出力することができる。なお、ファクシミリデータは画像データに含まれる。このように、ＭＦＰ１００は、ファクシミリ送受信機能を有する。
【００４２】
ＭＦＰ１００は、スキャナ機能を有し、画像読取部２０が原稿を読み取って出力する画像データが、ＲＡＭ１１２に一時的に記憶される。また、画像形成部４０は、画像読取部２０が原稿を読み取って出力する画像データに基づいて、用紙等の記録シート上に画像を形成する。このため、ＭＦＰ１００は、コピー機能を有する。さらに、データ通信制御部１１７は、ネットワーク２に接続された他のＰＣ３、３Ａ，３Ｂ，３Ｃのいずれかから受信した画像データ、または、シリアル通信インターフェース端子１１９に接続されたデジタルカメラ４、デジタルビデオカメラ５および携帯情報端末６のいずれかから受信された画像データをＲＡＭ１１２に一時的に記憶する。そして、ＲＡＭ１１２に一時的に記憶された画像データに基づいて、用紙等の記録シート上に画像を形成する。このため、ＭＦＰ１００は、プリント機能を有する。
【００４３】
画像処理部３０は、ＲＡＭ１１２に記憶された画像データを画像処理する。画像処理部３０は、ＭＦＰ１００がスキャナ機能またはコピー機能を能動化する場合には、画像読取部２０が原稿を読み取って出力する画像データを画像処理する。また、画像処理部３０は、ＭＦＰ１００がファクシミリ機能を能動化する場合には、ファクシミリ部６０が受信するファクシミリデータ（画像データ）を画像処理する。さらに、画像処理部３０は、データ通信制御部１１７が、ネットワーク２に接続された他のＰＣ３、３Ａ，３Ｂ，３Ｃ、スキャナ、ＭＦＰのいずれかから受信した画像データ、またはシリアル通信インターフェース端子１１９に接続されたデジタルカメラ４、デジタルビデオカメラ５および携帯情報端末６のいずれかから受信された画像データを画像処理する。
【００４４】
図４は、画像処理部の機能の一例を示す機能ブロック図である。図４を参照して、画像処理部３０は、画像データに前処理を実行し明度画像を出力する前処理部３０１と、明度画像から文字の表された文字領域を抽出する文字領域抽出部３１０と、文字領域の画像からノイズを除去するノイズ除去部３２０と、文字領域に含まれる文字の色を決定する文字色決定部３３０と、文字領域の画像を符号化する文字領域符号化部３４０と、明度画像から写真属性および図属性の領域をそれぞれ抽出する写真／図領域抽出部３５０と、写真属性および図属性の領域の画像を符号化する写真／図領域符号化部３６０と、符号データを統合する統合部３７０と、を含む。
【００４５】
本実施の形態においては、画像処理部３０に入力される画像データは、１画素が赤（Ｒ）、緑（Ｇ）および青（Ｂ）の３つの値（８ビット）を含む２４ビットの値を有するカラー画像である。
【００４６】
前処理部３０１は、カラー画像の下地部分を除去する下地除去処理と、下地の除去されたカラー画像を明度画像に変換する明度変換処理と、明度画像をスムージングするスムージング処理とを実行し、スムージング処理した明度画像を文字領域抽出部３１０および写真／図領域抽出部３５０に出力する。下地除去処理は、カラー画像の濃度の薄い下地色を除去し、コントラストを伸張する。これにより、カラー画像の傾向を整えることができる。明度変換処理は、カラー画像の各画素値（２４ビット）に基づいて明度（８ビット）を算出し、明度画像を生成する。明度画像は、１画素が８ビットの値を有するグレースケールの画像である。明度画像を生成するのは、写真／図領域抽出部３５０および文字領域抽出部３１０で、明度画像を処理の対象としているからである。スムージング処理は、明度画像をスムージングする。スムージングすることにより、ノイズが除去されるので、写真／図領域抽出部３５０および文字領域抽出部３１０において領域を抽出する精度を向上させることができる。
【００４７】
写真／図領域抽出部３５０の主目的は、文字、図、写真および表の表された領域を含んだカラー画像から図が表された領域および写真が表された領域を抽出することである。図が表された領域および写真が表された領域を抽出するのは、それらの領域は文字が含まれることが少ないからである。文字が含まれることが少ない図および写真の表された領域に対して文字抽出処理を行うと、図および写真の表された領域の一部を誤って文字と判定してしまうため、そのような誤判定を回避するためである。このため、本実施の形態においては、写真／図領域抽出部３５０において、図属性または写真属性と判定された領域の明度データを、文字領域抽出部３１０に入力しないようにしている。表の罫線については文字領域抽出部３１０において罫線除去を行い、罫線の位置情報を写真／図領域符号化部３６０に伝え、罫線を写真／図領域符号化部３６０で符号化する。
【００４８】
写真／図領域抽出部３５０は、明度画像を２値化し、２値画像を生成する。そして、生成した２値画像をラベリングする。ラベリングは、２値画像で値が「１」の黒画素のうちで隣接する複数の画素の集合に外接する矩形をブロックとして抽出する処理である。ブロックを矩形とするのは、一般的に、写真、図形などは矩形の画像として原稿に表されることが多いからである。ラベリングにより抽出されたブロックは、それの画像データ中における位置を示す位置情報と関連付けられる。
【００４９】
さらに、写真／図領域抽出部３５０は、抽出されたブロックの大きさやそれぞれの明度画像の特徴量を算出し、ブロックの属性を判別する。複数のブロックが抽出された場合は、複数のブロックそれぞれの属性を判別する。属性は、明度画像のブロックに表されている対象を特定し、文字の表された文字属性と、図形の表された図属性と、写真の表された写真属性と、表属性とを含む。そして、写真／図領域抽出部３５０は、写真属性または図属性のブロックの位置情報を写真画像符号化部３６０と文字領域抽出部３１０に出力する。位置情報は、例えば、画像データにおけるブロックの対角の画素の座標である。
【００５０】
図５は、文字領域抽出部の詳細な機能を示す機能ブロック図である。図５を参照して、文字領域抽出部３１０は、明度画像からエッジを抽出し、エッジ画像を生成するエッジ画像生成部３１１と、抽出されたエッジで構成される線からエッジ画像の傾きを補正する傾き補正部３１２と、傾きが補正されたエッジ画像から罫線を除去する罫線除去部３１３と、エッジ画像から文字領域の候補となるブロックを抽出する候補ブロック抽出部３１４と、ブロックのエッジ画像が文字属性か否かを判定する判定部３１５と、文字属性とされたブロックを文字領域に決定する文字領域決定部３１６と、文字属性でないと判定されたブロックを写真属性の領域に変更する第１属性変更部３１７と、を含む。
【００５１】
エッジ画像生成部３１１は、前処理部３０１が出力する明度画像が入力され、明度画像を、例えば微分フィルタを用いてフィルタ処理することにより、エッジ画像を生成する。エッジ画像は、明度画像において、画素の値が、周辺の画素の値と所定の差のある画素をエッジ画素（値が「１」）として含む。傾き補正部３１２は、抽出されたエッジ画素で構成される線が、水平または垂直となるように、エッジ画像を回転させる。これにより、次の罫線除去部３１３による罫線の検出精度が向上する。罫線除去部３１３は、エッジ画像から罫線を検出し、その罫線をエッジ画像から除去する。判定部３１５における文字判定の精度を向上させるためである。また、エッジ画像の罫線に対応する部分の周辺の明度データを調べ、罫線領域を決定し、罫線の位置情報を写真／図領域符号化部３６０に出力する。
【００５２】
候補ブロック抽出部３１４は、エッジ画像中から文字領域の候補となる候補ブロックを抽出する。具体的には、まず行間を処理対象から除外する。行間は、エッジ画像の主走査方向（Ｘ軸方向）の画素値がすべて「０」のラインである。エッジ画像の行間以外の画素で、近傍のエッジ画素（値が「１」の画素）を連結することにより、連結されたエッジ画素の集合に外接する矩形を候補ブロックとして抽出する。候補ブロックは、画像中で、１行の文字列の外接矩形に相当する。
【００５３】
判定部３１５は、抽出された候補ブロックが、文字属性か否かを判定する。判定方法は、例えば、候補ブロックの縦横比、横方向の長さ、縦方向の長さ、候補ブロックのエッジ画像におけるエッジ画素の占める割合等を基に判定するようにすればよい。判定部３１５は、候補ブロック抽出部３１４により複数の候補ブロックが抽出された場合には、複数の候補ブロックそれぞれを判定する。
【００５４】
文字領域決定部３１６は、判定部３１５により文字属性と判定された候補ブロックを文字領域に決定し、文字領域の画像データ中の位置を示す位置情報をノイズ除去部３２０に出力する。第１属性変更部３１７は、判定部３１５により文字属性と判定されなかった候補ブロックを写真領域に変更し、候補ブロックの画像データ中の位置を示す位置情報を写真／図領域符号化部３６０に出力する。
【００５５】
図６は、ノイズ除去部３２０の詳細な機能を示す機能ブロック図である。図６を参照して、ノイズ除去部３２０は、文字領域抽出部３１０から文字領域の位置情報が入力され、前処理部３０１から明度画像が入力される。ノイズ除去部３２０は、明度画像の文字領域に含まれる複数の画素の画素値に基づいて明度ヒストグラムを生成するための明度ヒストグラム生成部３２１と、ノイズおよび背景を除去するための網点・背景除去部３２３と、文字領域の属性を写真属性に変更する第２属性変更部３２５とを含む。
【００５６】
網点のノイズは、明度が低い。このため、網点・背景除去部３２３は、明度画像の文字領域に含まれる複数の画素のうちで所定のしきい値より明度の低い画素を、網点のノイズとして除去する。具体的には、しきい値より明度の低い画素の画素値を「０」にする。さらに、明度画像の文字領域に文字が表されている場合、文字領域に含まれる画素は、文字を構成する画素または背景を構成する画素のいずれかである。文字と背景とでは明度が異なる。このため、明度ヒストグラムは、文字の明度で度数が高くなり、背景の明度で度数が高くなる。複数色の文字を含む場合、複数色それぞれの文字を構成する画素の明度で度数が高くなる。また、背景は、明度が高く、文字は明度が低い。したがって、ノイズ除去部３２０は、ヒストグラムの度数から文字の明度と背景の明度との間に背景除去のためのしきい値を設定し、明度画像を２値化し、２値画像を生成する。具体的には、明度画像の文字領域に含まれる複数の画素のうちで背景除去のためのしきい値よりも明度の高い画素の画素値を「０」にし、他の画像の値を「１」にする。網点・背景除去部３２３は、文字領域の位置情報と２値画像とを、文字色決定部３３０および文字領域符号化部３４０に出力する。
【００５７】
網点・背景除去部３２３は、背景除去のためのしきい値を設定することができない場合がある。明度画像の文字領域に写真または図が表されている場合である。したがって、網点・背景除去部３２３は、背景除去のためのしきい値を設定することができない場合、第２属性変更部にエラー信号を出力する。第２属性変更部３２５は、網点・背景除去部３２３からエラー信号が入力されると、文字領域の属性を写真領域に変更し、文字領域の画像データ中の位置を示す位置情報を写真／図領域符号化部３６０に出力する。
【００５８】
図７は、文字色決定部の詳細な機能を示す機能ブロック図である。図７を参照して、文字色決定部３３０は、ノイズ除去部３２０から２値画像と位置情報とが入力され、カラー画像が入力される。文字色決定部３３０は、２値画像に含まれる文字の線幅を細くする細線化部３３１と、カラー画像中における細線の画素値から色相ヒストグラムを生成する色相ヒストグラム生成部３３２と、ノイズ色相除去部３３３と、隣接色相統合部３３４と、第３属性変更部３３５と、代表色相選択部３３６と、第４属性変更部３３７と、文字色算出部３３８とを含む。
【００５９】
細線化部３３１は、２値画像において主走査方向に連続して配置された黒画素のうちから中心の画素を主走査方向中心画素として抽出し、主走査方向と交わる副走査方向に連続して配置された黒画素のうちから中心の画素を副走査方向中心画素として抽出する。そして、抽出した主走査方向中心画素と、副走査方向中心画素とを文字を構成する文字中心画素に決定する。図８は、文字「Ａ」を含む２値画像の一例を示す図である。文字を構成する画素をハッチングで示している。図９（Ａ）は、主走査方向中心画素の一例を示す図である。図８に示した２値画像から抽出された主走査方向中心画素を、ハッチングで示している。図９（Ｂ）は、副主走査方向中心画素の一例を示す図である。図８に示した２値画像から抽出された副走査方向中心画素をハッチングで示している。図９（Ｃ）は、文字中心画素の一例を示す図である。文字中心画素は、図９（Ａ）に示した主走査方向中心画素と、図９（Ｂ）に示した副走査方向中心画素とを含み、それをハッチングして示している。
【００６０】
図７に戻って、細線化部３３１は、文字中心画素の値を「１」とし、他の画素の値を「０」にした２値画像を色相ヒストグラム生成部３３２に出力する。上述したように、スキャナの特性からそれが出力する画像中の黒以外の色の文字の輪郭の色が、文字の中心の色と異なるため、文字の色を文字の中心を構成する色から判定するためである。文字の主走査方向の中心の画素と、副走査方法の中心の画素とを抽出する簡単な処理で文字中心画素を抽出することができるので、処理速度が向上する。さらに、処理対象とする画素の数が少なくなるので、後の処理の速度を早くすることができる。
【００６１】
また、中心画素を文字の輪郭部分を除いた画素とするようにしてもよい。この場合、細線化部３３１は、２値画像において主走査方向に連続して配置された複数の黒画素の両端から所定数の画素を除いた少なくとも１つの画素を第１候補画素として抽出し、副走査方向に連続して配置された複数の黒画素の両端から所定数の画素を除いた少なくとも１つの画素を第２候補画素として抽出する。そして、第１候補画素および第２候補画素のいずれでもある画素を文字中心画素に決定する。所定数は、文字の太さ、スキャナの読取解像度により定めるようにすればよい。この場合においても、文字の輪郭部分の画素を除去する簡単な処理で文字中心画素を抽出することができるので、処理速度が向上する。さらに、処理対象とする画素の数が少なくなるので、後の処理の速度を早くすることができる。
【００６２】
色相ヒストグラム生成部３３２は、細線化部３３１から入力される２値画像で値が「１」の画素のカラー画像の画素値に基づいて、色相ヒストグラムを生成する。換言すれば、細線化された文字（文字中心画素）の細線化する前の色に基づき、細線化された文字（文字中心画素）を複数の色相階級のいずれかに分類する。具体的には、２値画像中の処理対象とする画素の位置と、２値化画像の位置情報とから処理対象とする画素に対応するカラー画像中の画素の画素値を取得する。カラー画像中の画素の画素値は、ＲＧＢ値を有するため、このＲＧＢ値をＨＳＬ表色系に変換する。そして、色相（Ｈ）に基づいて、色相ヒストグラムを生成する。ただし、彩度（Ｓ）が所定の値よりも低い場合、明度（Ｌ）をしきい値と比較し、白または黒のいずれかの階級に分類する。ここでは、色相ヒストグラムは、色相を３２等分した３２区間の階級と、白の階級と、黒の階級とを含む。図１０に、色相ヒストグラムの階級の一例を示す。
【００６３】
ノイズ色相除去部３３３は、色相ヒストグラム生成部３３２により生成された色相ヒストグラムにおいて、最大度数を基準に第１しきい値を設定し、第１しきい値以下の度数の階級に振り分けられた画素をノイズとみなし、その画素を処理対象から除外する。ノイズを除去することにより、文字の色の検出精度を向上させることができる。図１１は、色相ヒストグラムの一例を示す第１の図である。図１１を参照して、度数が１以上の１２の階級が存在する。色相の階級「１０」で度数が最大の「２５００」である。図１２は、色相ヒストグラムの一例を示す第２の図である。第１しきい値を、最大度数の３０％の「７５０」としている。図１３は、色相ヒストグラムの一例を示す第３の図である。図１３は、ノイズ色相を除去した後の色相ヒストグラムを示す。ノイズ色相を除去することにより、４階級の色相に限定される。
【００６４】
隣接色相統合部３３４は、第１のしきい値を超える度数の階級を、代表色相選択部３３６に出力する。また、第１しきい値を超える度数の階級が連続する場合、連続する階級を統合した１つの階級を、代表色相選択部３３６に出力する。具体的には、連続する階級のうち度数が最大の階級に統合する。図１４は、色相ヒストグラムの一例を示す第４の図である。図１４は、階級「２９」と階級「３０」とを階級「３０」に統合した後の色相ヒストグラムを示す。これにより、色相の統合により３階級の色相に限定される。
【００６５】
ただし、隣接色相統合部３３４は、第１しきい値を超える度数の階級が第２のしきい値以上連続する場合、位置情報で特定される文字領域が、文字以外のもの（写真、図形、罫線など）が表わされた領域と判断し、第３属性変更部３３５にエラー信号を出力する。第２のしきい値は、色相ヒストグラムの階級数により定まり、色相を３２等分して３２階級とする場合には、４階級とすれば、良好な結果が得られる。
【００６６】
第３属性変更部３３５は、隣接色相統合部３３４からエラー信号が入力されると、文字領域の属性を写真領域に変更し、文字領域の画像データ中の位置を示す位置情報を写真／図領域符号化部３６０に出力する。
【００６７】
代表色相選択部３３６は、隣接色相統合部３３４から入力される階級の色相を、文字領域に含まれる文字の色相に決定し、入力された階級を文字色算出部３３８に出力する。隣接色相統合部３３４から複数の階級が入力される場合、複数の階級それぞれの色相を代表色相として決定する。ただし、代表色相選択部３３６は、隣接色相統合部３３４から第３のしきい値以上の階級が入力される場合、位置情報で特定される文字領域が、文字でなく写真または図形が表された領域と判断し、第４属性変更部３３７にエラー信号を出力する。第３のしきい値は、文字領域に含まれる文字の色数の上限であり、第３のしきい値を４とすれば良好な結果が得られる。
【００６８】
第４属性変更部３３７は、代表色相選択部３３６からエラー信号が入力されると、文字領域の属性を写真領域に変更し、文字領域の画像データ中の位置を示す位置情報を写真／図領域符号化部３６０に出力する。
【００６９】
文字色算出部３３８は、代表色相選択部３３６から入力された階級に振り分けられた複数の画素のカラー画像の画素値から文字色を算出し、算出した文字色を文字領域符号化部３４０に出力する。具体的には、複数の画素のＲＧＢ値の平均を算出し、文字色とする。代表色相選択部３３６から複数の階級が入力される場合、複数の階級毎に文字色を算出する。
【００７０】
図１５は、文字領域符号化部の詳細な機能を示す機能ブロック図である。図１５を参照して、文字領域符号化部３４０は、ノイズ除去部３２０から２値画像と位置情報とが入力され、文字色決定部３３０から文字色が入力され、カラー画像が入力される。文字領域符号化部３４０は、文字色別の２値画像を生成する文字色別２値画像生成部３４１と、文字色別の２値画像を圧縮符号化する文字色別符号化部３４３とを含む。文字色別２値画像生成部３４１は、２値画像のうち画素値が「１」の画素のうちからカラー画像の画素値が文字色に近い画素を抽出することにより、その文字色に対応する文字色別２値画像を生成する。カラー画像の画素値が文字色と近いか否かは、カラー画像の画素値と文字色との間のＲＧＢ色空間における距離が所定の範囲にあるか否かにより判断すればよい。
【００７１】
例えば、文字領域に「文字色別に圧縮」の７文字が含まれており、カラー画像において７文字のうち「文字色別」の４文字が赤色、「に」の１文字が黒色、および「圧縮」の２文字が青色の場合、文字領域符号化部３４０には、赤、黒および青の３つの文字色が入力される。文字色別２値画像生成部３４１は、赤色の文字色に対応する２値画像として、「文字色別」の４文字を含む文字色別２値化画像を生成し、黒色の文字色に対応する２値画像として、「に」の１文字を含む文字色別２値化画像を生成し、青色の文字色に対応する２値画像として、「圧縮」の２文字を含む文字色別２値化画像を生成する。文字色別２値画像生成部３４１は、文字色と、その文字色に対応する文字色別２値画像とを文字色別符号化部３４３に出力する。
【００７２】
文字色別符号化部３４３は、文字色別２値画像を可逆圧縮方式で符号化し、符号データを生成する。そして、符号データと、文字色と、文字領域の位置情報とを統合部３７０に出力する。可逆圧縮方式は、いずれの方式を用いてもよいが、ここでは、ＭＭＲ（ＭｏｄｉｆｉｅｄＭｏｄｉｆｉｅｄＲｅａｄ）圧縮方式を用いる。
【００７３】
図４に戻って、写真／図領域符号化部３６０は、文字以外（写真、図、罫線）のカラー画像を、非可逆圧縮方式で符号化し、符号データを生成する。圧縮方式は、非可逆圧縮方式であればよく、ここではＪＰＥＧ（ＪｏｉｎｔＰｈｏｔｏｇｒａｐｈｉｃＥｘｐｅｒｔｓＧｒｏｕｐ）方式を用いている。そして、符号データを統合部３７０に出力する。統合部３７０は、文字領域符号化部３４０から入力される符号データ、文字色および文字領域の位置情報と、写真／図領域符号化部３６０から入力される符号データとを併せて１つのファイルとして出力する。符号データは、それぞれ別々の符号データとして出力する。
【００７４】
図１６は、圧縮処理の流れの一例を示すフローチャートである。圧縮処理は、圧縮プログラムを実行する画像処理部３０により実行される処理である。図１６を参照して、画像処理部３０は、画像データを受け付けたか否かを判断する（ステップＳ０１）。画像データを受け付けるまで待機状態となり（ステップＳ０１でＮＯ）、画像データを受け付けたならば処理をステップＳ０２に進める。すなわち、画像処理は、画像データを受け付けることにより実行される処理である。画像データは、ＣＰＵ１１１からの指示により、画像処理部３０が、ＲＡＭ１１２から画像データを読み出すことにより受け付ける。画像データは、１画素がＲＧＢの３つの値（８ビット）を含むカラー画像である。
【００７５】
次に、カラー画像に前処理を実行することにより明度画像を生成し（ステップＳ０２）、写真領域および図領域を抽出する写真／図領域抽出処理を実行し（ステップＳ０３）、文字領域を抽出する文字領域抽出処理を実行する（ステップＳ０４）。文字領域抽出処理については後述するが、ステップＳ０２において抽出された明度画像から文字領域を抽出する。文字領域は、カラー画像中の位置を示す位置情報で特定される。文字領域抽出処理は、複数の文字領域が抽出される場合がある。
【００７６】
ステップＳ０５〜ステップＳ０８の処理は、１つの文字領域に対して実行される処理である。このため、複数の文字領域が抽出された場合は、それらのうち１つを処理対象に設定し、ステップＳ０５以降の処理が実行される。ステップＳ０５においては、ステップＳ０２で生成された明度画像の文字領域からノイズを除去することにより明度画像の文字領域を２値画像に変換する。ノイズを除去できたか否かにより明度画像の文字領域が文字属性か否かを判断する（ステップＳ０６）。文字属性ならば処理をステップＳ０７に進め、文字属性でなければ処理をステップＳ１０に進める。
【００７７】
ステップＳ０７においては、カラー画像の文字領域に含まれる文字の色を決定するための文字色決定処理を実行する。そして、カラー画像の文字領域に含まれる文字の色相の状態により、文字領域が文字属性か否かを判断する（ステップＳ０８）。文字属性ならば処理をステップＳ０９に進め、文字属性でなければ処理をステップＳ１０に進める。
【００７８】
ステップＳ０９においては、２値画像の文字領域を符号化するための文字領域符号化処理を実行し、処理をステップＳ１０に進める。この段階で、２値画像の文字領域が圧縮符号化される。ステップＳ１０においては、次に処理対象とするべき未処理の文字領域が存在するか否かを判断する。そのような文字領域が存在すればその文字領域を処理対象に設定し、処理をステップＳ０５に戻すが、存在しなければ処理をステップＳ１１に進める。
【００７９】
ステップＳ１１においては、ステップＳ０３で抽出された写真／図領域と、ステップＳ０４、ステップＳ０５およびステップＳ０７において文字ではないと判定された領域を圧縮符号化するための写真／図領域符号化処理を実行する。複数の写真／図領域が抽出された場合には、複数の写真／図領域毎に圧縮符号化する。このため、複数の写真／図領域のうち１つを処理対処に設定し、ステップＳ１１を実行する。そして、次に処理対象とするべき未処理の写真／図領域が存在するか否かを判断する（ステップＳ１２）。そのような写真／文字領域が存在すればその写真／文字領域を処理対象に設定し、処理をステップＳ１１に戻すが、存在しなければ処理をステップＳ１３に進める。
【００８０】
ステップＳ１３においては、ステップＳ０９において２値画像の文字領域を符号化した符号データと、その文字領域の文字色と、その文字領域の位置情報と、ステップＳ１１においてカラー画像の写真／文字領域を符号化した符号データとを統合し、１つの圧縮データを生成する。
【００８１】
図１７は、前処理の流れの一例を示すフローチャートである。前処理は、図１６のステップＳ０２で実行される処理である。図１７を参照して、カラー画像の下地部分を除去する（ステップＳ２１）。カラー画像の濃度の薄い下地色を除去し、コントラストを伸張する。これにより、カラー画像の傾向を整えることができる。そして、下地の除去されたカラー画像を明度画像に変換する（ステップＳ２２）。カラー画像の各画素値（２４ビット）の値を明度（８ビット）に変換することにより、カラー画像を明度画像に変換する。次に、明度画像をスムージングする（ステップＳ２３）。明度画像をスムージングすることにより、ノイズが除去されるので、後の処理の精度を向上させることができる。
【００８２】
図１８は、写真／図領域抽出処理の流れの一例を示すフローチャートである。図１８を参照して、図１６のステップＳ０２において生成した明度画像を２値化し、２値画像を生成する（ステップＳ３１）。そして、生成した２値画像をラベリングする（ステップＳ３２）。ラベリングにより、２値画像で値が「１」の複数の画素の集合に外接する矩形がブロックとして抽出される。２値画像から複数のブロックが抽出される場合がある。
【００８３】
ステップＳ３３〜ステップＳ３５の処理は、１つのブロックに対して実行される処理である。このため、複数のブロックが抽出された場合は、それらのうち１つを処理対象に設定し、ステップＳ３３以降の処理を実行する。ステップＳ３３においては、ステップＳ３１で生成された２値画像の処理対象ブロックの特徴量を算出する。そして、算出した特徴量から処理対象ブロックの属性を判別する。属性は、文字属性と、図属性と、写真属性と、下地属性とを含む。そして、ステップＳ３４においては、処理対象ブロックの属性が、写属性または図属性であれば処理をステップＳ３５に進め、そうでなければステップＳ３５をスキップして処理をステップＳ３６に進める。ステップＳ３５においては、処理対象ブロックを、写真／文字領域と判断し、その処理対象ブロックの２値画像中の位置を示す位置情報を写真／文字領域の位置情報として記憶する。例えば、処理対象ブロックの対抗する２つの頂点の２値画像中の座標をＲＡＭ１１２の写真／文字領域の位置情報を格納する領域に記憶する。
【００８４】
ステップＳ３６においては、次に処理対象とするべき未処理のブロックが存在するか否かを判断する。そのようなブロックが存在すればそのブロックを処理対象に設定し、処理をステップＳ３３に戻すが、存在しなければ処理を圧縮処理に戻す。
【００８５】
図１９は、文字領域抽出処理の流れの一例を示すフローチャートである。文字領域抽出処理は、図１６のステップＳ０４において実行される処理である。画像処理部３０は、図１６のステップＳ０２において生成された明度画像を、例えば微分フィルタを用いてフィルタ処理することにより、エッジ画像を生成する（ステップＳ４１）。そして、エッジ画像の傾きを補正する（ステップＳ４２）。抽出されたエッジ画素で構成される線が、水平または垂直となるように、エッジ画像を回転させる。画像データが、画像読取部２０から入力される場合があり、原稿が傾いて読み取られる場合があるからである。そして、エッジ画像から罫線を検出し、その罫線をエッジ画像から除去する（ステップＳ４３）。次のステップＳ４５における文字判定の精度を向上させるためである。
【００８６】
次のステップＳ４４においては、エッジ画像中から文字領域の候補となる候補ブロックを抽出する。具体的には、まず行間を処理対象から除外し、エッジ画像のエッジ画素を近傍のエッジ画素と連結することにより、連結された複数のエッジ画素の集合に外接する矩形を候補ブロックとして抽出する。候補ブロックは、画像中で、１行の文字列の外接矩形に相当する。複数の候補ブロックが抽出される場合がある。
【００８７】
ステップＳ４５〜ステップＳ４８の処理は、１つの候補ブロックに対して実行される処理である。このため、複数の候補ブロックが抽出された場合は、それらのうち１つを処理対象に設定し、ステップＳ４５以降の処理が実行される。ステップＳ４５においては、処理対象の候補ブロックが、文字属性か否かを判定する。判定方法は、例えば、候補ブロックの縦横比、横方方向の長さ、縦方向の長さ、候補ブロックのエッジ画像におけるエッジ画素の占める割合等を基に判定する。処理対象の候補ブロックが文字属性ならば処理をステップＳ４６に進めるが、そうでなければ処理をステップＳ４７に進める。
【００８８】
ステップＳ４６においては、文字属性と判定された候補ブロックを、文字領域と判断し、その候補ブロックのエッジ画像中の位置を示す位置情報を文字領域の位置情報として記憶する。例えば、候補ブロックの対抗する２つの頂点のエッジ画像中の座標をＲＡＭ１１２の文字領域の位置情報を格納する領域に記憶する。
【００８９】
一方、ステップＳ４７においては、文字属性と判定されなかった候補ブロックの属性を写真属性に変更し、処理をステップＳ４８に進める。具体的には、その候補ブロックのエッジ画像中の位置を示す位置情報を写真領域の位置情報として記憶するため、候補ブロックの位置情報をＲＡＭ１１２の写真領域の位置情報を格納する領域に記憶する。
【００９０】
ステップＳ４８においては、次に処理対象とするべき未処理の候補ブロックが存在するか否かを判断する。そのような候補ブロックが存在すればその候補ブロックを処理対象に設定し、処理をステップＳ４５に戻すが、存在しなければ処理を圧縮処理に戻す。
【００９１】
図２０は、ノイズ除去処理の流れの一例を示すフローチャートである。ノイズ除去処理は、図１６のステップＳ０５において実行される処理である。図２０を参照して、画像処理部３０は、文字領域の位置情報をＲＡＭ１１２から読み出す（ステップＳ５１）。そして、図１６のステップＳ０２で生成された明度画像の文字領域に含まれる複数の画素の画素値に基づいて明度ヒストグラムを生成する（ステップＳ５２）。明度画像の文字領域に含まれる複数の画素のうちで所定のしきい値より明度の低い画素を、網点のノイズとして除去する（ステップＳ５３）。具体的には、しきい値より明度の低い画素の画素値を「０」にする。さらに、ヒストグラムの度数から文字の明度と背景の明度との間に背景除去のためのしきい値を設定する（ステップＳ５４）。しきい値を設定できたならば処理をステップＳ５５に進めるが、しきい値を設定できない場合は処理をステップＳ５７に進める。背景除去のためのしきい値を設定できない場合には、文字領域に文字でなく写真または図が表されている可能性が高いからである。
【００９２】
ステップＳ５５においては、背景除去のためのしきい値を用いて、明度画像の文字領域を２値化し、２値画像を生成する。次のステップＳ５６においては、生成した２値画像と位置情報とを関連付け、処理を圧縮処理に戻す。具体的には、その２値画像と位置情報との組をＲＡＭ１１２の所定の領域に記憶する。
【００９３】
一方、ステップＳ５７においては、しきい値を設定できなかった文字領域の属性を写真属性に変更し、処理を圧縮処理に戻す。具体的には、その文字領域の位置情報をＲＡＭ１１２の写真領域の位置情報を格納する領域に記憶する。
【００９４】
図２１は、文字色決定処理の流れの一例を示すフローチャートである。文字色決定処理は、図１６のステップＳ０７において実行される処理である。図２１を参照して、画像処理部３０は、２値画像と位置情報との組をＲＡＭ１１２から読み出す（ステップＳ６１）。読み出した２値画像中の文字の線幅を細くするために細線化処理を実行する（ステップＳ６２）。細線化処理が実行されることにより文字中心画素の値を「１」とし、他の画素の値を「０」にした２値画像が生成される。
【００９５】
ステップＳ６３においては、文字領域の色相ヒストグラムを生成する。ステップＳ６１で読み出した位置情報は、カラー画像における文字領域の位置を示す。この位置情報からステップＳ６２で生成された２値画像が含む各画素に対応するカラー画像中の画素を特定することができる。このため、ステップＳ６２で生成され２値画像で値が「１」の画素に対応するカラー画像の画素の画素値に基づいて、色相ヒストグラムを生成する。ここでは、色相ヒストグラムは、色相を３２等分した３２区間の階級と、白の階級と、黒の階級とを含む。
【００９６】
そして、ノイズとなる色相の画素を処理対象から除去する（ステップＳ６４）。具体的には、色相ヒストグラムにおいて、最大度数を基準に第１しきい値を設定し、第１しきい値以下の度数の階級に振り分けられた画素をノイズとみなし、その画素を処理対象から除外する。ノイズを除去することにより、文字の色の検出精度を向上させることができる。第１しきい値は、最大度数の３０％とするのが好ましい。
【００９７】
次に、色相ヒストグラムにおいて第１のしきい値を超える度数の階級が３つ以上連続するか否かを判断する（ステップＳ６５）。第１しきい値を超える度数の階級が３つ以上連続する場合、処理をステップＳ７１に進めるが、そうでなければ処理をステップＳ６６に進める。第１しきい値を超える度数の階級が３つ以上連続する場合、位置情報で特定される文字領域が、文字でなく写真または図形が表わされている可能性が高いからである。なお、第１しきい値を超える度数の階級が連続する最大のしきい値を２としたが、このしきい値は、これに限定されることなく、色相ヒストグラムの階級に応じて定めることができる。
【００９８】
ステップＳ６６においては、第１しきい値を超える度数の階級が連続する場合、連続する階級を度数が最大の代表色相の階級に統合する。これにより、文字色の近い画素を１つの代表色相の階級にすることで、文字色の数を少なくし、圧縮率を向上することができる。また、文字の輪郭部分と中央部分との色を同じ色とすることができ、文字の見栄えをよくすることができる。
【００９９】
次のステップＳ６７においては、代表色相の階級数が４以上か否かを判断する。代表色相の階級数が４以上であれば処理をステップＳ７１に進め、そうでなければ処理をステップＳ６８に進める。代表色相の階級数が４以上の場合、カラー画像が文字領域において４色以上を含むことになり、文字でなく写真または図形が表わされている可能性が高いからである。なお、代表色相の階級数が４以上の場合に文字領域を写真属性に変更するようにしたが、このしきい値「４」は、これに限定されることなく、色相ヒストグラムの階級に応じて定めることができる。
【０１００】
ステップＳ６８においては、文字色を算出する。文字色は、代表色相の階級に基づいて算出する。代表色相の階級が複数の場合、複数の代表色相の階級毎に文字色を算出するため、複数の代表色相の階級の１つを処理対象に設定する。そして、色相ヒストグラムにおいて、処理対象の代表色相の階級に振り分けられた複数の画素のカラー画像における画素値から文字色を算出する。文字色は、複数の画素のＲＧＢ値それぞれを平均したＲＧＢ値である。
【０１０１】
次のステップＳ６９においては、文字色と２値画像と位置情報とを関連付け、処理をステップＳ７０に進める。具体的には、ステップＳ６８で算出された文字色と、ステップＳ６４でノイズが除去された２値画像と、位置情報との組をＲＡＭ１１２の所定の領域に記憶する。
【０１０２】
次のステップＳ７０においては、次に処理対象とするべき未処理の代表色相の階級が存在するか否かを判断する。未処理の代表色相の階級が存在すれば処理をステップＳ０８に戻し、存在しなければ処理を圧縮処理に戻す。
【０１０３】
一方、処理をステップＳ７１に進める場合は、ステップＳ６５において第１しきい値を超える度数の階級が３つ以上連続すると判断された場合、または、ステップＳ６７において代表色相の階級数が４以上存在すると判断された場合である。この場合、文字領域には文字でなく写真または図形が表されている可能性が高いので、ステップＳ７１においては、文字領域の属性を写真属性に変更し、処理を圧縮処理に戻す。具体的には、文字領域の位置情報をＲＡＭ１１２の写真領域の位置情報を格納する領域に記憶する。
【０１０４】
図２２は、文字領域符号化処理の流れの一例を示すフローチャートである。文字領域符号化処理は、図１６のステップＳ０９において実行される処理である。図２２を参照して、画像処理部３０は、文字色と、２値画像と、位置情報との組をＲＡＭ１１２から読み出す（ステップＳ８１）。文字色と２値画像と位置情報との組で同じ位置情報の組が複数記憶されている場合には、それらの組のうちから１つを読み出す。そして、文字色別２値画像を生成する（ステップＳ８２）。文字色別２値画像は、カラー画像で文字色に近い色の画素の画素値を「１」とし、他の画素の画素値を「０」とした画像である。具体的には、画像処理部３０は、２値画像のうち画素値が「１」の画素のうちからカラー画像の画素値が文字色に近い画素を抽出することにより、その文字色に対応する文字色別２値画像を生成する。カラー画像の画素値が文字色と近いか否かは、カラー画像の画素値と文字色との間のＲＧＢ色空間における距離が所定の範囲にあることを条件とする。
【０１０５】
次のステップＳ８３においては、文字色別２値画像を圧縮符号化し、符号データを生成する。ここでの圧縮符号化は、可逆圧縮方式であり、例えばＭＭＲ圧縮方式である。次のステップＳ８４においては、文字色と符号データと位置情報とを関連付け、処理をステップＳ８５に進める。具体的には、ステップＳ８１で読み出した文字色および位置情報と、ステップＳ８４で生成した符号データの組をＲＡＭ１１２の所定の領域に記憶する。
【０１０６】
次のステップＳ８５においては、次に処理対象とするべき文字色と２値画像と位置情報との組が存在するか否かを判断する。そのような組が存在するならば、処理をステップＳ８１に戻し、存在しなければ処理を圧縮処理に戻す。
【０１０７】
以上説明したように、本実施の形態におけるＭＦＰ１００は、カラー画像から抽出された文字領域に含まれる文字を細線化し、細線化された文字を構成する複数の文字中心画素に対応するカラー画像の画素の色に基づいて、文字色を決定する。そして、カラー画像を２値化した２値画像の文字領域を符号化し、符号データと、決定された文字色と、文字領域のカラー画像中の位置とを関連付ける。カラー画像を２値化した２値画像の文字領域を符号化するので、文字全体を同じ色の文字として２値化することができる。また、細線化後の文字を構成する複数の文字中心画素に対応する画像データの画素の色に基づいて文字色を決定するので、文字の色を正確に検出することができる。その結果、画像中の文字の色を容易かつ高精度に検出することができる。
【０１０８】
また、主走査方向と副走査方向それぞれで、連続して配置された黒画素のうちから中心の画素を文字中心画素として抽出するので、文字中心画素を容易に抽出することができ、処理速度を速くすることができる。
【０１０９】
さらに、主走査方向に連続して配置された複数の黒画素の両端から所定数の画素を除いた少なくとも１つの画素であって、副走査方向に連続して配置された複数の黒画素の両端から所定数の画素を除いた少なくとも１つの画素を文字中心画素とするので、文字中心画素を容易に抽出することができ、処理速度を早くすることができる。
【０１１０】
なお、上述した実施の形態においては画像処理装置の一例としてＭＦＰ１００について説明したが、図１６〜図２１に示した圧縮処理をＭＦＰ１００に実行させるための画像圧縮方法、または図１６〜図２１に示した圧縮処理をＭＦＰ１００またはＰＣ３，３Ａ，３Ｂ、３Ｃに実行させるための画像圧縮プログラムとして発明を捉えることができるのは言うまでもない。
【０１１１】
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
【０１１２】
＜付記＞
（１）前記第１のしきい値は、度数の最大値に基づき定められる、請求項４に記載の画像処理装置。
（２）前記属性変更手段は、度数が第１しきい値を超える色相階級が第２のしきい値を超えて連続する場合、前記文字領域の属性を文字属性以外の属性に変更する、請求項８または９に記載の画像処理装置。
（３）前記文字色決定手段は、前記複数の色相階級のうちから度数が第１のしきい値を超える色相階級を代表色相として選択する選択手段をさらに含み、
前記属性変更手段は、度数が第１しきい値を超える代表色相が第３のしきい値を越えて存在する場合、前記文字領域の属性を文字属性以外の属性に変更する、請求項８または９に記載の画像処理装置。
（４）前記文字領域符号化手段は、前記２値化データを可逆圧縮する可逆圧縮手段を含む、請求項１に記載の画像処理装置。
（５）カラー画像から写真または図形が表された写真／図属性の写真／図領域を抽出する写真／図領域抽出手段と、
前記写真／図領域のカラー画像を符号化する写真／図形領域符号化手段と、をさらに備えた請求項１に記載の画像処理装置。
（６）前記文字領域符号化手段は、前記２値画像の前記文字領域を可逆圧縮する可逆圧縮手段を含み、
前記写真／図形領域符号化手段は、前記カラー画像の前記写真／図領域を非可逆圧縮する非可逆圧縮手段を含む、（５）に記載の画像処理装置。
【図面の簡単な説明】
【０１１３】
【図１】本発明の実施の形態の一つにおける画像形成システムの全体概要を示す図である。
【図２】ＭＦＰの外観を示す斜視図である。
【図３】ＭＦＰのハード構成の一例を示すブロック図である。
【図４】画像処理部の機能の一例を示す機能ブロック図である。
【図５】文字領域抽出部の詳細な機能を示す機能ブロック図である。
【図６】ノイズ除去部３２０の詳細な機能を示す機能ブロック図である。
【図７】文字色決定部の詳細な機能を示す機能ブロック図である。
【図８】文字「Ａ」を含む２値画像の一例を示す図である。
【図９】（Ａ）は主走査方向中心画素の一例を示す図であり、（Ｂ）は副走査方向中心画素の一例を示す図であり、（Ｃ）は文字中心画素の一例を示す図である。
【図１０】色相ヒストグラムの階級の一例を示す図である。
【図１１】色相ヒストグラムの一例を示す第１の図である。
【図１２】色相ヒストグラムの一例を示す第２の図である。
【図１３】色相ヒストグラムの一例を示す第３の図である。
【図１４】色相ヒストグラムの一例を示す第４の図である。
【図１５】文字領域符号化部の詳細な機能を示す機能ブロック図である。
【図１６】圧縮処理の流れの一例を示すフローチャートである。
【図１７】前処理の流れの一例を示すフローチャートである。
【図１８】写真／図領域抽出処理の流れの一例を示すフローチャートである。
【図１９】文字領域抽出処理の流れの一例を示すフローチャートである。
【図２０】ノイズ除去処理の流れの一例を示すフローチャートである。
【図２１】文字色決定処理の流れの一例を示すフローチャートである。
【図２２】文字領域符号化処理の流れの一例を示すフローチャートである。
【符号の説明】
【０１１４】
１画像形成システム、２ネットワーク、３，３Ａ，３Ｂ，３Ｃコンピュータ、４デジタルカメラ、５デジタルビデオカメラ、６携帯情報端末、９操作パネル、２０画像読取部、２０画像読取部、３０画像処理部、４０画像形成部、５０給紙部、６０ファクシミリ部、６１通信制御部、１００ＭＦＰ、１０１メイン回路、１１１ＣＰＵ、１１２ＲＡＭ、１１３ＲＯＭ、１１４表示部、１１５操作部、１１６ＨＤＤ、１１７データ通信制御部、１１８ＬＡＮ端子、１１９シリアル通信インターフェース端子、１１９Ａメモリカード、３０１前処理部、３１０文字領域抽出部、３１１エッジ画像生成部、３１２傾き補正部、３１３罫線除去部、３１４候補ブロック抽出部、３１５判定部、３１６文字領域決定部、３１７第１属性変更部、３２０ノイズ除去部、３２１明度ヒストグラム生成部、３２３網点・背景除去部、３２５第２属性変更部、３３０文字色決定部、３３１細線化部、３３２色相ヒストグラム生成部、３３３ノイズ色相除去部、３３４隣接色相統合部、３３５第３属性変更部、３３６代表色相選択部、３３７第４属性変更部、３３８文字色算出部、３４０文字領域符号化部、３４１値画像生成部、３４３文字色別符号化部、３５０写真／図領域抽出部、３６０写真画像符号化部、３７０統合部。

【特許請求の範囲】
【請求項１】
カラー画像から文字が表された文字属性の文字領域を抽出する文字領域抽出手段と、
前記文字領域に含まれる文字を細線化する細線化手段と、
前記細線化された文字を構成する複数の文字中心画素に対応する前記カラー画像の画素の色に基づいて、文字色を決定する文字色決定手段と、
前記カラー画像を２値化することによって、２値画像に変換する２値化手段と、
前記２値画像の前記文字領域を符号化し、符号データを生成する文字領域符号化手段と、
前記生成された符号データと、前記決定された文字色と、前記文字領域の前記カラー画像中の位置とを関連付ける関連付手段と、を備えた画像処理装置。
【請求項２】
前記細線化手段は、前記２値画像において主走査方向に連続して配置された黒画素のうちから中心の画素を抽出する主走査方向検出手段と、
前記主走査方向と交わる副走査方向に連続して配置された黒画素のうちから中心の画素を抽出する副走査方向検出手段と、
前記主走査方向検出手段で抽出された中心画素と、前記副走査方向検出手段で抽出された中心画素とを前記文字中心画素に決定する決定手段と、を含む請求項１に記載の画像処理装置。
【請求項３】
前記細線化手段は、主走査方向に連続して配置された複数の黒画素の両端から所定数の画素を除いた少なくとも１つの画素を第１候補画素として抽出する主走査方向検出手段と、
前記主走査方向と交わる副走査方向に連続して配置された複数の黒画素の両端から所定数の画素を除いた少なくとも１つの画素を第２候補画素として抽出する副走査方向検出手段と、
前記第１候補画素および前記第２候補画素のいずれでもある画素を前記文字中心画素に決定する決定手段と、を含む請求項１に記載の画像処理装置。
【請求項４】
前記文字色決定手段は、前記複数の文字中心画素それぞれの細線化する前の色に基づき、前記複数の文字中心画素それぞれを複数の色相階級のいずれかに分類する分類手段と、
度数が第１のしきい値以下の色相階級に分類された画素をノイズとして除去するノイズ除去手段を含む、請求項１に記載の画像処理装置。
【請求項５】
前記文字色決定手段は、前記複数の文字中心画素それぞれの細線化する前の色に基づき、前記複数の文字中心画素それぞれを複数の色相階級のいずれかに分類する分類手段と、前記複数の色相階級のうちから度数が第１のしきい値を超える色相階級を代表色相として選択する選択手段と、を含み、
前記複数の文字中心画素のうち前記選択された代表色相の色相階級に分類された前記文字中心画素の細線化する前の色に基づき前記文字色を決定する、請求項１に記載の画像処理装置。
【請求項６】
前記選択手段は、度数が前記第１しきい値を超える色相階級が２以上連続する場合、連続する色相階級のうち度数が最大の色相階級を代表色相として選択する色相統合手段を含む、請求項５に記載の画像処理装置。
【請求項７】
前記文字色決定手段は、前記選択手段により複数の前記代表色相が選択された場合、前記複数の代表色相にそれぞれ対応する複数の前記文字色を決定し、
前記文字領域符号化手段は、前記複数の代表色相それぞれにおいて、前記２値画像の前記文字領域に含まれる黒画素のうちから該黒画素に対応する前記カラー画像の画素の色が該代表色相に対応する前記文字色と近似する画素を抽出することにより、該代表色相に対応する文字色別２値画像を生成する文字色別２値化データ生成手段と、
前記決定された複数の文字色にそれぞれ対応する複数の文字色別２値化データを符号化し、文字色別符号データを生成する文字色別符号化手段と、を含み、
前記関連付手段は、前記決定された複数の文字色ごとに、該文字色と、該文字色に対応する前記文字色別符号データと、前記文字領域の前記画像データ中の位置とを関連付ける文字色別関連付手段を含む、請求項５に記載の画像処理装置。
【請求項８】
前記文字色決定手段は、前記複数の文字中心画素それぞれの細線化する前の色に基づき、前記複数の文字中心画素それぞれを複数の色相階級のいずれかに分類する分類手段と、前記複数の色相階級の度数分布に基づいて、前記文字領域の属性を文字属性以外の属性に変更する属性変更手段と、を含む請求項１に記載の画像処理装置。
【請求項９】
カラー画像から文字が表された文字属性の文字領域を抽出する文字領域抽出手段と、
カラー画像から写真または図形が表された写真／図属性の写真／図領域を抽出する写真／図領域抽出手段と、
前記文字領域に含まれる文字を細線化する細線化手段と、
前記細線化された文字を構成する複数の文字中心画素それぞれの細線化する前の色に基づき、前記複数の文字中心画素それぞれを複数の色相階級のいずれかに分類する分類手段と、
前記複数の色相階級の度数分布に基づいて、前記文字領域の属性を文字属性以外の属性に変更する属性変更手段と、を備えた画像処理装置。
【請求項１０】
カラー画像から文字が表された文字属性の文字領域を抽出するステップと、
前記文字領域に含まれる文字を細線化するステップと、
前記細線化された文字を構成する複数の文字中心画素に対応する前記カラー画像の画素の色に基づいて、文字色を決定するステップと、
前記カラー画像を２値化することによって、前記カラー画像を２値画像に変換するステップと、
前記２値画像の前記文字領域を符号化し、符号データを生成するステップと、
前記生成された符号データと、前記決定された文字色と、前記文字領域の前記カラー画像中の位置とを関連付けるステップと、を含む画像処理方法。
【請求項１１】
カラー画像から文字が表された文字属性の文字領域を抽出するステップと、
カラー画像から写真または図形が表された写真／図属性の写真／図領域を抽出するステップと、
前記文字領域に含まれる文字を細線化するステップと、
前記細線化された文字を構成する複数の文字中心画素それぞれの細線化する前の色に基づき、前記複数の文字中心画素それぞれを複数の色相階級のいずれかに分類するステップと、
前記複数の色相階級の度数分布に基づいて、前記文字領域の属性を文字属性以外の属性に変更するステップと、を含む画像処理方法。
【請求項１２】
カラー画像から文字が表された文字属性の文字領域を抽出するステップと、
前記文字領域に含まれる文字を細線化するステップと、
前記細線化された文字を構成する複数の文字中心画素に対応する前記カラー画像の画素の色に基づいて、文字色を決定するステップと、
前記カラー画像を２値化することによって、前記カラー画像を２値画像に変換するステップと、
前記２値画像の前記文字領域を符号化し、符号データを生成するステップと、
前記生成された符号データと、前記決定された文字色と、前記文字領域の前記カラー画像中の位置とを関連付けるステップと、をコンピュータに実行させる画像処理プログラム。
【請求項１３】
カラー画像から文字が表された文字属性の文字領域を抽出するステップと、
カラー画像から写真または図形が表された写真／図属性の写真／図領域を抽出するステップと、
前記文字領域に含まれる文字を細線化するステップと、
前記細線化された文字を構成する複数の文字中心画素それぞれの細線化する前の色に基づき、前記複数の文字中心画素それぞれを複数の色相階級のいずれかに分類するステップと、
前記複数の色相階級の度数分布に基づいて、前記文字領域の属性を文字属性以外の属性に変更するステップと、をコンピュータに実行させる画像処理プログラム。

【図１】