説明

画像処理装置およびプログラム

【課題】使用者が設定することなしに、原稿の種類に応じて適切な圧縮形式を設定可能な画像処理装置を提供する。
【解決手段】原稿種類判定部32は、原稿読取装置27によって得られた原稿読取情報に基づいて原稿の種類を判定する。圧縮形式設定部34は、原稿種類判定部32で判定された原稿の種類に基づいて、原稿読取情報から画像データを生成する際の圧縮形式を設定する。画像データ生成部374は、圧縮形式設定部34で設定された圧縮形式で原稿読取情報を圧縮し、原稿に対応する画像データを生成する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像処理装置およびプログラムに関する。
【背景技術】
【0002】
特許文献1は、重要単語辞書に記憶した単語の出現頻度を文字認識装置で測定して文書種類を推定する文書分類システムを開示する。
特許文献2は、原稿が地図であるか否かを判定し判定結果に基づいて処理を切り替える地図原稿種判定付画像処理装置を開示する。
特許文献3は、原稿の種別を判別し、原稿全体に想到する全入力画像データの特徴量を求めることにより原稿の種別を判別する画像処理装置を開示する。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2003−317034号公報
【特許文献2】特開平9−65143号公報
【特許文献3】特開2004−297212号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
本発明の目的は、使用者が設定することなしに、原稿の種類に応じて適切な圧縮形式を設定可能な画像処理装置を提供することである。
【課題を解決するための手段】
【0005】
請求項1にかかる本発明は、原稿を読み取る読み取り手段によって得られた読み取り情報に基づいて原稿の種類を判定する種類判定手段と、前記種類判定手段によって判定された原稿の種類に基づいて、読み取り情報から画像データを生成する際の圧縮形式を設定する圧縮形式設定手段と、前記圧縮形式設定手段によって設定された圧縮形式で前記読み取り情報を圧縮し、前記原稿に対応する画像データを生成する生成手段とを有する画像処理装置である。
【0006】
請求項2にかかる本発明は、前記読み取り情報から色情報を抽出する色情報抽出手段
をさらに有し、前記圧縮形式設定手段は、前記色情報抽出手段によって抽出された色情報に基づいて、読み取り情報から画像データを生成する際の圧縮形式を設定する請求項1に記載の画像処理装置である。
【0007】
請求項3にかかる本発明は、前記圧縮形式設定手段は、前記種類判定手段による原稿の判定ができなかった場合に、前記色情報抽出手段によって抽出された色情報に基づいて圧縮形式を設定する請求項2に記載の画像処理装置である。
【0008】
請求項4にかかる本発明は、前記圧縮形式設定手段は、前記色情報に基づいて、前記読み取り情報において出現頻度の最も高い色値の出現頻度とその色値と所定範囲内にある色値の出現頻度との合計が閾値を超える場合に、圧縮後の色数を所定数に減ずる第1の圧縮形式を設定する請求項2に記載の画像処理装置である。
【0009】
請求項5にかかる本発明は、前記圧縮形式設定手段は、前記色情報に基づいて、出現頻度の最も高い色値およびその色値と所定範囲内にある色値の出現頻度が閾値以下である場合に、前記第1の圧縮形式よりも圧縮後の色数が多い第2の圧縮形式を設定する請求項4に記載の画像処理装置である。
【0010】
請求項6にかかる本発明は、前記原稿が複数の頁からなる場合に、頁毎に圧縮形式を設定するか否かを設定する複数頁設定手段をさらに有し、前記複数頁設定手段が頁毎に圧縮形式を設定しないと設定している場合、前記生成手段は、最初の頁について設定された圧縮形式で全ての頁に対応する画像データを生成する請求項1〜5のいずれかに記載の画像処理装置である。
【0011】
請求項7にかかる本発明は、前記複数頁設定手段が頁毎に圧縮形式を設定すると設定している場合に、前記種類判定手段は、頁毎に原稿の種類を判定し、前記圧縮形式設定手段は、頁毎に圧縮形式を設定し、前記生成手段は、頁毎に設定された圧縮形式で画像データを生成する請求項6に記載の画像処理装置である。
【0012】
請求項8にかかる本発明は、原稿を読み取る読み取り手段によって得られた読み取り情報に基づいて原稿の種類を判定する種類判定ステップと、前記種類判定ステップで判定された原稿の種類に基づいて、読み取り情報から画像データを生成する際の圧縮形式を設定する圧縮形式設定ステップと、前記圧縮形式設定ステップで設定された圧縮形式で前記読み取り情報を圧縮し、前記原稿に対応する画像データを生成する生成ステップとをコンピュータに実行させる画像処理プログラムである。
【発明の効果】
【0013】
請求項1に係る本発明によれば、使用者が設定することなしに、原稿の種類に応じて適切な圧縮形式を設定可能な画像処理装置を提供することができる。
【0014】
請求項2に係る本発明によれば、請求項1に係る本発明により得られる効果に加えて、原稿の種類の判定ができない場合であっても、使用者が設定することなしに、圧縮形式を設定できる。
【0015】
請求項3に係る本発明によれば、請求項2に係る本発明により得られる効果に加えて、原稿の種類の判定の可否に応じて、本構成を有していない場合と比較して効率的に圧縮形式を設定できる。
【0016】
請求項4に係る本発明によれば、請求項2に係る本発明により得られる効果に加えて、本構成を有していない場合と比較して、効率的に圧縮形式を設定できる。
【0017】
請求項5に係る本発明によれば、請求項4に係る本発明により得られる効果に加えて、本構成を有していない場合と比較して、効率的に圧縮形式を設定できる。
【0018】
請求項6に係る本発明によれば、請求項1〜5のいずれかに係る本発明により得られる効果に加えて、原稿が複数ページで構成されている場合に、本構成を有していない場合と比較して、効率的に全ページの圧縮形式を設定できる。
【0019】
請求項7に係る本発明によれば、請求項6に係る本発明により得られる効果に加えて、使用者がページ毎に圧縮形式を設定する必要がなく、全ページの圧縮形式を設定できる。
【0020】
請求項8に係る本発明によれば、使用者が設定することなしに、原稿の種類に応じて適切な圧縮形式を設定可能な画像処理プログラムを提供することができる。
【図面の簡単な説明】
【0021】
【図1】本実施形態にかかる画像処理装置のハードウェア構成を例示する図である。
【図2】図1に示した画像処理装置において動作する処理プログラムである。
【図3】図2に示した原稿種類判定部の構成を示す図である。
【図4】図2に示した圧縮形式設定部の構成を示す図である。
【図5】原稿判定情報および原稿種類/圧縮形式対応情報を例示する図である。
【図6】図4に示す最大頻度色判定部の処理を説明するための図である。
【図7A】処理プログラムの処理を示すフローチャートである。
【図7B】処理プログラムの処理を示すフローチャートである。
【図7C】処理プログラムの処理を示すフローチャートである。
【図8】本実施形態に係る処理プログラムの処理対象である第1の原稿の例を示す図である。
【図9】本実施形態に係る処理プログラムの処理対象である第2の原稿の例を示す図である。
【図10】本実施形態に係る処理プログラムの処理対象である第3の原稿の例を示す図である。
【図11】本実施形態に係る処理プログラムの処理対象である第4の原稿の例を示す図である。
【図12】本実施形態に係る処理プログラムの処理対象である第5の原稿の例を示す図である。
【発明を実施するための形態】
【0022】
図1は、本実施形態にかかる画像処理装置2のハードウェア構成を例示する図である。
図1に例示するように、画像処理装置2は、CPU等の演算部212及びメモリ等の記憶部214などを含む制御装置21と、通信装置22と、記録装置24と、ユーザインターフェース装置(UI装置)25と、画像読取装置27とから構成される。
【0023】
UI装置25は、LCD(Liquid Crystal Display)表示装置あるいはCRT(Cathode Ray Tube)表示装置等の表示装置およびキーボード・タッチパネルなどを含む。
画像読取装置27は、例えばスキャナ等であって、原稿等の記録媒体から画像等を読み取って、例えばビットマップ形式等の読取情報に変換する。
つまり、画像処理装置2は、情報処理および他の画像処理装置又は端末との通信が可能なコンピュータとしてのハードウェア構成部分を有している。
なお、以下の各図において、実質的に同じ構成部分および処理には同じ番号が付される。
また、本実施形態において、画像処理装置2は印刷装置26および画像読取装置27を有するとしたが、画像処理装置は、例えば、印刷装置および画像読取装置を有さないPCであってもよく、この場合、画像処理装置は、画像読取装置とLAN(Local Area Network)等を介して接続されていてもよい。
【0024】
図2は、図1に示した画像処理装置2において動作する処理プログラム3の構成を示す図である。
図2に示すように、処理プログラム3は、原稿読取情報受付部302、原稿読取情報格納部304、圧縮形式手動指定部306、原稿判定情報格納部308、原稿種類/圧縮形式格納部310、色情報抽出部314、色分布算出部316、原稿種類判定部32、圧縮形式設定部34、圧縮処理部372、画像データ生成部374、複数頁設定部376、画像データ出力部378および異常通知部380から構成される。
処理プログラム3は、たとえば、記憶媒体240(図1)を介して画像処理装置2に供給され、記憶部214にロードされ、画像処理装置2にインストールされたOS(図示せず)上で、画像処理装置2のハードウェア資源を具体的に利用して実行される。
なお、本実施形態においては、処理プログラム3は、ソフトウェアで実現されるとしているが、処理プログラム3の機能の全部又は一部は、FPGA(Field Programmable Gate Array)などのハードウェアで実現されてもよい。
【0025】
図3は、図2に示した原稿種類判定部32の構成を示す図である。
図3に示すように、原稿種類判定部32は、配置解析部322、文字認識部324、特定文字列判断部326、特定文字列位置判定部330、特定文字列寸法判定部332および原稿判定部338から構成される。
図4は、図2に示した圧縮形式設定部34の構成を示す図である。
図4に示すように、圧縮形式設定部34は、原稿種類情報受付部342、原稿種類/圧縮形式受付部344、原稿種類判断部348、圧縮形式判定部350、白黒形式設定部362、限定色形式設定部364および高画質形式設定部366から構成される。
【0026】
処理プログラム3において、原稿読取情報受付部302は、画像読取装置27から得られた読取情報(原稿読取情報)を受け付け、原稿読取情報格納部304に対して出力する。
原稿読取情報格納部304は、原稿読取情報受付部302からの原稿読取情報を格納する。
圧縮形式手動指定部306は、使用者がUI装置25を操作することによって得られた圧縮形式手動指定情報を受け付けて圧縮形式設定部34に対して出力する。ここで、圧縮形式手動指定情報とは、原稿読取情報を所定の圧縮形式で圧縮して画像データを生成させるか否かを示す情報である。
この圧縮形式手動指定情報は、圧縮せずに画像データを生成させる旨の指示、後述する所定の圧縮形式で圧縮して画像データを生成させる旨の指示、および任意の圧縮形式で圧縮して画像データを生成させる旨の指示を含む。
【0027】
原稿判定情報格納部308は、図5を用いて後述する原稿判定情報を格納する。
この原稿判定情報は、読み取られた原稿の種類を判別するための情報であって、例えば、使用者がUI装置25を操作することによって得られる情報である。
原稿種類/圧縮形式格納部310は、図5を用いて後述する原稿種類/圧縮形式対応情報を格納する。
この原稿種類/圧縮形式対応情報は、原稿の種類に応じて圧縮形式を設定するための情報であって、例えば、使用者がUI装置25を操作することによって得られる情報である。
図5は、原稿判定情報および原稿種類/圧縮形式対応情報を例示する図であって、(A)は原稿判定情報を例示し、(B)は原稿種類/圧縮形式対応情報を例示する。
図5(A)に例示するように、原稿判定情報は、原稿の種類を示す原稿種類と、その原稿の種類を特徴付ける文字列である特定文字列と、特定文字列が位置する範囲を示す位置情報と、特定文字列の寸法の範囲を示す寸法情報とを含む。
図5(B)に例示するように、原稿種類/圧縮形式対応情報は、原稿種類と、原稿の種類に応じて設定すべき圧縮形式(圧縮形式設定)とを含む。
【0028】
色情報抽出部314(図2)は、原稿読取情報格納部304に格納された原稿読取情報から、読み取られた原稿に含まれる色に対応する色情報を抽出する。
色分布算出部316は、抽出された色情報に基づいて、色分布を算出する。
例えば、色情報がRGB三次元色空間で表現されている場合、色情報抽出部314は、原稿読取情報から、各画素におけるR(赤)G(緑)B(青)それぞれの輝度等の色値を抽出する。
この場合、色分布算出部316は、各画素における各色値の出現頻度を算出し、各色値とその色値の出現頻度との関係を示すヒストグラムを作成する。
なお、以下、色情報がRGB三次元色空間で表現されている場合を例として説明するが、色情報は、例えばLab色空間等で表現されていてもよい。
【0029】
原稿種類判定部32において、配置解析部322(図3)は、原稿読取情報を解析して、原稿に含まれる文字、表、写真等の自然画、CG(Computer Graphics)又は絵画等を分類(オブジェクト分類)し、それぞれについて位置情報を対応付ける。
この分類は、例えば、原稿に含まれる各種の線、枠線、罫線又は色情報の検出と、エッジ検出と、パターンマッチングとによって行われるが、これらの手法に限られない。
文字認識部324は、例えばOCR(Optical Character Recognition:光学文字認識)機能を使用することによって原稿読取情報を解析し、原稿に含まれる文字列を、例えば形態素解析によってその文字列単独で所定の語義を有する形式で検出する。
ここで、文字認識とは、読み取って得られた文字の画像データを前もって記憶されたパターンと照合することによって、その文字を特定して、文字データ(文字列)を生成することをいう。
また、形態素解析とは、例えば、予め記憶されている文法の規則に関する情報と単語が登録された辞書とに基づいて、1つの文章を形態素(意味を持つ最小の言語単位)に分類し、分類された形態素の品詞を判別する処理をいう。
さらに、文字認識部322は、検出した文字列の位置を算出して、その文字列と位置とを対応付けた位置情報を生成する。
【0030】
特定文字列判断部326は、原稿判定情報格納部308からの原稿判定情報に含まれる特定文字列が、文字認識部322によって検出された文字列に含まれるか否かを判断する。
特定文字列が含まれる場合、特定文字列判断部326は、特定文字列位置判定部330および特定文字列寸法判定部332対して、検出された特定文字列に関する情報を出力する。
一方、特定文字列が含まれない場合、特定文字列判断部326は、その旨を示す情報(特定文字列無情報)を原稿判定部338に対して出力する。
【0031】
特定文字列位置判定部330は、特定文字列の位置が、原稿判定情報に含まれる対応する特定文字列に関連する位置情報によって示される位置の範囲内にある場合に、特定文字列の位置が一致した旨の情報(位置一致情報)を生成して、原稿判定部338に対して出力する。
特定文字列寸法判定部332は、特定文字列の寸法が、原稿判定情報に含まれる対応する特定文字列に関連する寸法情報によって示される寸法の範囲内にある場合に、特定文字列の寸法が一致した旨の情報(寸法一致情報)を生成して、原稿判定部338に対して出力する。
原稿判定部338は、ある特定文字列について位置一致情報および寸法一致情報が生成された場合に、原稿読取情報に対応する原稿が、その特定文字列に関する原稿であると判定し、判定した原稿の種類を示す原稿種類情報を生成する。
さらに、原稿判定部338は、原稿種類情報を、圧縮形式設定部34に対して出力する。
一方、少なくとも位置一致情報又は寸法一致情報のどちらかが生成されなかった場合、または、特定文字列無情報が生成された場合、原稿判定部338は、原稿読取情報に対応する原稿の種類を判定することができなかったことを示す原稿種類情報を生成する。
【0032】
上述した処理について、図5(A)に示した例を用いて具体的に説明する。
例えば、特定文字列判断部326によって原稿読取情報から特定文字列「AAA」が検出された場合について説明する。
この場合、特定文字列位置判定部330によって特定文字列「AAA」の位置が位置情報#1の示す位置範囲内であると判定され、特定文字列寸法判定部332によって特定文字列「AAA」の寸法が寸法情報#1の示す寸法範囲内であると判定されたときに、特定文字列「AAA」について位置一致情報および寸法一致情報が生成される。
よって、原稿判定部338は、原稿読取情報に対応する原稿の種類を「原稿A」であると判定する。
【0033】
なお、上述した実施形態においては、原稿判定部338は、位置一致情報および寸法一致情報の両方が生成された場合に、特定の原稿の種類を判定するとしたが、位置一致情報または寸法一致情報の少なくともいずれか一方が生成された場合に特定の原稿の種類を判定するとしてもよい。
また、上述した実施形態においては、位置情報および寸法情報がある一定の範囲を有し、特定文字列の位置および寸法がそれぞれそれらの範囲内にあるか否かが判定されるとしたが、位置情報および寸法情報がある特定の値を示し、位置及び寸法それぞれについて、これらのある特定の値に近ければ近い程高い点数を付け、位置及び寸法についてこれらの点数の合計が閾値を越えた場合に、原稿の種類が判定されるようにしてもよい。
さらに、上述した実施形態においては、特定文字列の位置および寸法に基づいて原稿の種類が判定されるとしたが、例えば原稿の種類が設計図か否かを判定する場合に、特定の位置(例えば右下又は左上等)に所定数の縦横の罫線が存在するときに原稿の種類が設計図であると判定されるようにしてもよい。
【0034】
圧縮形式設定部34において、原稿種類情報受付部342(図4)は、原稿種類判定部32から原稿種類情報を受け付け、原稿種類判断部348に対して出力する。
原稿種類/圧縮形式受付部344は、原稿種類/圧縮形式格納部310から、原稿種類/圧縮形式対応情報を受け付け、原稿種類判断部348に対して出力する。
原稿種類判断部348は、原稿種類/圧縮形式対応情報に基づいて、原稿種類情報が示す原稿の種類に対応した圧縮形式を判断する。
さらに、原稿種類判断部348は、白黒形式設定であると判断した場合には、白黒形式設定部362に対して圧縮形式を設定すべき旨の命令を出力し、限定色形式設定であると判断した場合には、限定色形式設定部364に対して圧縮形式を設定すべき旨の命令を出力し、高画質形式設定であると判断した場合には、高画質形式設定部366に対して圧縮形式を設定すべき旨の命令を出力する。
【0035】
ここで、「白黒設定」とは、画像データを生成する際に、表現される色を白及び黒のみにすることによってデータ量を圧縮する設定である。
また、「限定色設定」とは、画像データを生成する際に、表現される色の数を所定の色数に限定することによってデータ量を圧縮する設定であり、各色に対応するレイヤを二値データとして作成/圧縮することによって、マルチレイヤ構造をサポートするファイル形式(例えばPDF形式)の画像データを作成することにより、データ量を圧縮する設定を含む。
また、「高画質設定」とは、画像データを生成する際に、元画像から文字、写真、CG等をオブジェクトとして抽出し、抽出された各オブジェクトに適した方式により圧縮したレイヤを作成/統合し、マルチレイヤ構造をサポートするファイル形式(例えばPDF)の画像データを作成することにより、データ量を圧縮する設定を含む。
【0036】
つまり、「白黒設定」、「限定色設定」、「高画質設定」は、原稿読取情報のデータ量を圧縮して画像データを生成する際に、再現色の数が異なる圧縮形式であり、「白黒設定」、「限定色設定」、「高画質設定」の順に再現色の数が増加し、「高画質設定」の場合に最も再現色が多い。
ここで、「限定色」とは、ヒストグラムを元にして、計算により抽出された単数または複数の代表色であり、「限定色設定」の場合、所定の限定色以外の色の画素については、RGB色空間において距離が近い(色値の差が小さい)限定色に色が変換される。このように、色数を限定色の色数に削減することにより、「高画質設定」よりもデータ量が圧縮される。
【0037】
また、原稿種類情報に原稿の種類が示されていない場合(つまり、原稿の種類の判定ができなかった場合)、原稿種類判断部348は、その旨を示す情報(種類未特定情報)を、圧縮形式判定部350に対して出力する。
また、原稿種類情報に原稿の種類が示されているが、対応する圧縮形式が「カラー設定」となっている場合、「限定色設定」又は「高画質設定」のいずれでもよいことを示す。
したがって、原稿種類判断部348は、その旨を示す情報(カラー設定情報)を、圧縮形式判定部350に対して出力する。
【0038】
上述した処理について、図5(B)に示した例を用いて具体的に説明する。
例えば、原稿の種類が「原稿A」であると判断された場合、原稿種類判断部348は、「限定色設定」で圧縮処理がなされるように、限定色形式設定部364に対して圧縮形式を設定すべき旨の命令を出力する。
また、原稿の種類が「原稿D」であると判断された場合、原稿種類判断部348は、種類未特定情報を、圧縮形式判定部350に対して出力する。
また、原稿の種類が「原稿B」であると判断された場合、原稿種類判断部348は、カラー設定情報を、圧縮形式判定部350に対して出力する。
【0039】
圧縮形式判定部350(図4)は、原稿種類判断部348によって圧縮形式が1つに判断されなかった場合に、設定すべき圧縮形式を判定する。
圧縮形式判定部350は、最大頻度色判定部354および含有色判定部356から構成される。
また、図6は、図4に示す最大頻度色判定部354の処理を説明するための図(ヒストグラム)である。
図6において、横軸はRGBそれぞれの色値(輝度値等)であり、縦軸はその色値の画素の出現頻度(画素数)である。
【0040】
また、本実施形態においては、色分布を示す図として二次元ヒストグラムを例示したが、この場合、R、G、Bそれぞれについて、ヒストグラムが生成されるようにしてもよい。
なお、本実施形態においては、理解を容易にするため、色分布を示す図として二次元ヒストグラムを例示したが、三次元ヒストグラムが算出されるようにしてもよく、その三次元ヒストグラムが解析されるように構成してもよい。
この場合、三次元ヒストグラムは、RGB三次元空間の3方向について例えば256個に区切られて形成された256個の立方体それぞれについて、その各立方体に対応する色の画素の数が対応付けられている。
【0041】
最大頻度色判定部354は、出現頻度が最大の点の色値およびその最大の点から所定の色値幅以内の色値を最大頻度色とする。
具体的には、図6の例において、出現頻度が最大の点Bを特定し、さらに、B点から所定距離W2の色値を最大頻度色とする。
次に、最大頻度色判定部354は、原稿全体に占める最大頻度色の割合が閾値(例えば80%)以下であるか否かを判断する。
そして、最大頻度色判定部354は、最大頻度色の割合が閾値以下である場合には、高画質形式設定部366に対し、圧縮形式の設定をする旨の命令を出力する。
一方、最大頻度色判定部354が、最大頻度色の割合が閾値を超えると判断した場合は、含有色判定部356が、以下に説明する処理を行う。
【0042】
含有色判定部356は、ヒストグラムに対して標本化および量子化を実行し、標本化および量子化された後、出現頻度が閾値以上の色値およびその色値から所定範囲以内の色値を、原稿に含まれる色(含有色)であると特定する。
さらに、含有色判定部356は、その含有色の数を算出し、含有色数が閾値以上であるか否かを判断する。
そして、含有色判定部356は、含有色数が閾値以上である場合には、高画質形式設定部366に対し、圧縮形式の設定をする旨の命令を出力する。
【0043】
また、含有色判定部356は、含有色数が閾値以上でないと判断した場合であって、原稿種類判断部348によってカラー設定情報が出力されている場合には、限定色形式設定部364に対し、圧縮形式の設定をする旨の命令を出力する。
一方、含有色判定部356は、含有色数が閾値以上でないと判断した場合であって、原稿種類判断部348によってカラー設定情報が出力されていない場合には、含有色が、白、黒およびこれらと所定範囲以内の色値の色のみであるか否かを判断する。
そして、含有色判定部356は、含有色が、白、黒およびこれらと所定範囲以内の色値の色のみであると判断した場合には、白黒形式設定部362に対し、圧縮形式の設定をする旨の命令を出力し、そうでないと判断した場合には、限定色形式設定部364に対し、圧縮形式の設定をする旨の命令を出力する。
【0044】
白黒形式設定部362は、圧縮形式を白黒形式に設定して、設定された圧縮形式を示す情報を圧縮処理部372に対して出力する。
限定色形式設定部364は、圧縮形式を限定色形式に設定して、設定された圧縮形式を示す情報を圧縮処理部372に対して出力する。
高画質形式設定部366は、圧縮形式を高画質形式に設定して、設定された圧縮形式を示す情報を圧縮処理部372に対して出力する。
なお、本実施形態において、圧縮形式の具体例を、白黒形式設定、限定色形式、高画質形式としたが、これらに限定されるわけではない。
【0045】
圧縮処理部372(図2)は、白黒形式設定部362、限定色形式設定部364、又は高画質形式設定部366で設定された圧縮形式で、原稿読取情報に対して圧縮処理を実行する。
複数頁設定部376は、原稿が複数ページから構成されている場合に、1ページ目の圧縮形式を踏襲するか、又は、ページごとに圧縮形式を設定するかを設定する。
この設定は、例えば、使用者がUI装置25を操作することによって得られる。
原稿が複数ページから構成されている場合であって、1ページ目の圧縮形式を踏襲する旨の設定がされている場合、圧縮処理部372は、以降のページについて、1ページ目の圧縮形式で圧縮処理をする。
一方、原稿が複数ページから構成されている場合であって、ページごとに圧縮形式を設定する旨の設定がされている場合、圧縮処理部372は、画像データ生成部374は、以降のページについて、原稿種類判定部32および圧縮形式設定部34に対して上述した処理を行うように制御する。
【0046】
画像データ生成部374は、圧縮処理がなされた情報について、例えばPDF(Portable Document Format)形式の画像データを生成する。原稿が複数ページからなる場合は、圧縮処理がされた複数ページを合わせて画像データが生成される。
画像データ出力部378は、生成された画像データを表示装置等のUI装置25に表示する。
異常通知部380は、圧縮形式判定部350によって圧縮形式が判定されなかった場合に、表示装置等のUI装置25に警告等を表示し、又は、スピーカ等のUI装置25に警報を発令させる。
【0047】
図7A〜図7Cは、処理プログラム3の処理を示すフローチャートである。
ステップ102(S102)において、原稿読取情報受付部302は、原稿を読み取って得られた原稿読取情報を受け付ける。
ステップ104(S104)において、圧縮形式手動指定部306は、画像データの生成の際に圧縮して画像データを生成する旨の指示があったか否かを判断し、圧縮して画像データを生成する旨の指示がなかった場合は、処理はS106に進み、圧縮して画像データを生成する旨の指示があった場合は、処理はS108に進む。
ステップ106(S106)において、画像データ生成部374は、圧縮処理を施すことなく画像データを生成し、処理を終了する。
【0048】
ステップ108(S108)において、圧縮形式手動指定部306は、圧縮形式の指定があるか否かを判断し、圧縮形式の指定がある場合は、処理はS110に進み、圧縮形式の指定がない場合(自動で設定する場合)は、処理はS112に進む。
ステップ110(S110)において、圧縮処理部372は、指定された圧縮形式で圧縮処理を行う。
ステップ112(S112)において、原稿種類判定部は、原稿が特定の種類であるか否かを判断し、特定の種類である場合は、処理はS114に進み、特定の種類でない場合(特定の種類と判定できなかった場合)は、処理はS162に進む。
【0049】
ステップ114(S114)において、圧縮形式設定部34の原稿種類判断部348は、原稿の種類に対応した圧縮形式が指定されているか否か判断し、指定されている場合は、処理はS116に進み、指定されていない場合は、処理はS162に進む。
ステップ116(S116)において、原稿種類判断部348は、指定されている圧縮形式が白黒形式設定であるか否か判断し、白黒形式と指定されている場合は、処理はS118に進み、そうでない場合は、処理はS120に進む。
ステップ118(S118)において、白黒形式設定部362は、圧縮形式を白黒形式に設定し、圧縮処理部372は、白黒形式で圧縮処理を行う。
【0050】
ステップ120(S120)において、原稿種類判断部348は、限定色設定又は高画質設定のいずれかの指定がされているか、あるいは、カラー設定のみの指定がなされているかを判断し、限定色設定又は高画質設定のいずれかの指定がされている場合は、処理はS122に進み、カラー設定のみの指定がなされている場合は、処理はS172に進む。
ステップ122(S122)において、限定色形式設定部364又は高画質形式設定部366は、それぞれの圧縮形式を設定し、圧縮処理部372は、限定色設定又は高画質設定のいずれかで圧縮処理を行う。
【0051】
ステップ142(S142)において、複数頁設定部376は、原稿が複数ページからなるか否か判断し、複数ページからなる場合は、処理はS144に進み、1ページのみからなる場合は、処理はS150に進む。
ステップ144(S144)において、1ページ目の圧縮形式を踏襲する旨の設定がされているか否か判断し、その旨の設定がされている場合は、処理はS146に進み、そうでない場合は、処理はS148に進む。
【0052】
ステップ146(S146)において、圧縮処理部372は、以降のページについて、1ページ目の圧縮形式で圧縮処理をする。
ステップ148(S148)において、圧縮処理部372は、すべてのページについて圧縮処理が完了したか否かを判断し、そうである場合は、処理はS150に進み、そうでない場合は、処理はS112に戻る。
ステップ150(S150)において、画像データ生成部374は、圧縮処理がされた画像データを生成し、処理を終了する。
【0053】
ステップ162(S162)において、圧縮形式設定部34の最大頻度判定部354は、最大頻度色の割合が閾値以上であるか否かを判断し、そうである場合は、処理はS184に進み、そうでない場合は、処理はS164に進む。
【0054】
ステップ164(S164)において、圧縮形式設定部34の含有色判定部356は、含有色数が閾値以上であるか否かを判断し、そうである場合は、処理はS184に進み、そうでない場合は、処理はS166に進む。
ステップ166(S166)において、圧縮形式設定部34の含有色判定部356は、含有色が、白、黒およびこれらと所定範囲以内の色値の色のみであるか否かを判断し、そうである場合は、処理はS180に進み、そうでない場合は、処理はS182に進む。
【0055】
ステップ172(S172)において、圧縮形式設定部34の最大頻度判定部354は、最大頻度色の割合が閾値以上であるか否かを判断し、そうである場合は、処理はS184に進み、そうでない場合は、処理はS174に進む。
ステップ174(S174)において、圧縮形式設定部34の含有色判定部356は、含有色数が閾値以上であるか否かを判断し、そうである場合は、処理はS184に進み、そうでない場合は、処理はS182に進む。
【0056】
ステップ180(S180)において、圧縮形式設定部34の白黒形式設定部362は、圧縮形式を白黒形式に設定する。
ステップ182(S182)において、圧縮形式設定部34の限定色形式設定部364は、圧縮形式を限定色形式に設定する。
ステップ184(S184)において、圧縮形式設定部34の高画質形式設定部366は、圧縮形式を高画質形式に設定する。
【0057】
以下、本実施形態に係る処理プログラム3の処理について、具体的に例を挙げて説明する。
図8は、本実施形態に係る処理プログラム3の処理対象である第1の原稿の例を示す図である。
図8は見積書を例示したものであり、背景は白色であり、E部は赤色であり、その他の文字および線は黒色である。
例えば、図5(A)の原稿判定情報の原稿Aが「見積書」であり、対応する特定文字列「AAA」が「見積書」であり、対応する位置情報#1が「原稿の上方の中央部」に相当する位置情報であり、対応する寸法情報#1が「相対的に大きい寸法(フォント)」に相当する寸法情報であるとする。
ここで、図8に示す原稿の上方中央部に文字列「見積書」があり、この文字列の寸法は他の文字列よりも大きい。
したがって、原稿種類判定部32(図2)は、図5(A)に基づいて、図8に示した原稿を「見積書」と判定する。
【0058】
次に、圧縮形式設定部34の原稿種類判断部348(図4)は、原稿種類/圧縮形式対応情報に基づいて、原稿種類「見積書」がどの圧縮形式で圧縮すべきか判断する。
例えば、図5(B)の「原稿A」が「見積書」である場合、原稿種類判断部348は、限定色形式に設定し、「原稿C」が「見積書」である場合、原稿種類判断部348は、白黒形式に設定する。
ここで、図5(B)の「原稿B」が「見積書」である場合、圧縮形式は「カラー設定」であり、「限定色設定」または「高画質設定」のどちらかを特定できないので、圧縮形式判定部350によって、圧縮形式の判定がなされる。
【0059】
また、図8に示した原稿において、9割以上が白色なので、最大頻度判定部354は、ヒストグラムを解析し、最大頻度色を白色と判定し、その原稿に占める白色の割合が閾値(例えば50%)を超えると判断する。
さらに、図8に示した原稿において、含有色は白色、黒色および赤色(E部)のみなので、含有色判定部356は、含有色数は閾値以下であると判定する。
したがって、限定色形式設定部364によって、圧縮形式が限定色形式に設定される。
【0060】
図9は、本実施形態に係る処理プログラム3の処理対象である第2の原稿の例を示す図である。
図9は、地下鉄路線図を例示したものであり、背景は白色であり、赤色、青色、黄色および緑色の線と黒色の文字とからなる。
図9に示す原稿に対応する種類が図5(A)の原稿判定情報にない場合、原稿種類判定部32は、種類未特定情報を圧縮形式判定部350に対して出力し、圧縮形式判定部350が圧縮形式を判定する。
図9に示した原稿において、5割以上が白色なので、最大頻度判定部354は、ヒストグラムを解析し、最大頻度色を白色と判定し、その原稿に占める白色の割合が閾値(例えば50%)を超えると判断する。
さらに、図9に示した原稿において、含有色は白色、黒色、赤色、青色、黄色および緑色であり、閾値が5色である場合、含有色判定部356は、含有色数は閾値以上であると判定する。
したがって、高画質形式設定部366によって、圧縮形式が高画質形式に設定される。
【0061】
図10は、本実施形態に係る処理プログラム3の処理対象である第3の原稿の例を示す図である。
図10は設計図を例示したものであり、背景は白色であり、F部(寸法の修正箇所)は赤色であり、その他の文字および線は黒色である。
例えば、図5(A)の原稿判定情報の原稿Dが「設計図」であり、対応する特定文字列「DDD」が「図番」であり、対応する位置情報#4が「原稿の右下の枠内」に相当する位置情報であり、対応する寸法情報#4が「枠内に収まる寸法」に相当する寸法情報であるとする。
この場合、図10に示す原稿の右下部の枠内に文字列「図番」があるので、原稿種類判定部32(図2)は、図5(A)に基づいて、図10に示した原稿を「設計図」と判定する。
【0062】
次に、圧縮形式設定部34の原稿種類判断部348(図4)は、原稿種類/圧縮形式対応情報に基づいて、原稿種類「見積書」がどの圧縮形式で圧縮すべきか判断する。
ここで、図5(B)の「原稿D」が「設計図」である場合、原稿種類判断部348は、圧縮設定を特定できないので、圧縮形式判定部350によって、圧縮形式の判定がなされる。
図10に示した原稿において、9割以上が白色なので、最大頻度判定部354は、ヒストグラムを解析し、最大頻度色を白色と判定し、その原稿に占める白色の割合が閾値(例えば50%)を超えると判断する。
さらに、図10に示した原稿において、含有色は白色、黒色および赤色(F部)のみなので、含有色判定部356は、含有色数は閾値以下であると判定する。
したがって、限定色形式設定部364によって、圧縮形式が限定色形式に設定される。
【0063】
図11は、本実施形態に係る処理プログラム3の処理対象である第4の原稿の例を示す図である。
図11は、修理報告書を例示したものであり、背景は白色であり、G部(印字された箇所)は青色、H部は赤色であり、それ以外の文字および線は黒色である。
図11に示す原稿に対応する種類が図5(A)の原稿判定情報にない場合、原稿種類判定部32は、種類未特定情報を圧縮形式判定部350に対して出力し、圧縮形式判定部350が圧縮形式を判定する。
図11に示した原稿において、5割以上が白色なので、最大頻度判定部354は、ヒストグラムを解析し、最大頻度色を白色と判定し、その原稿に占める白色の割合が閾値(例えば50%)を超えると判断する。
さらに、図11に示した原稿において、含有色は白色、黒色、青色および赤色のみなので、含有色判定部356は、含有色数は閾値(5色)以下であると判定する。
したがって、限定色形式設定部364によって、圧縮形式が限定色形式に設定される。
【0064】
図12は、本実施形態に係る処理プログラム3の処理対象である第5の原稿の例を示す図である。
図12に例示する原稿は、「見積書」、「設計図」および「修理報告書」からなる複数の原稿である。
この場合、複数頁設定部376によって1ページ目の圧縮形式を踏襲する旨の設定がされている場合は、「見積書」についての圧縮形式で、2ページ以降も圧縮処理がなされる。
一方、ページごとに圧縮形式を設定する旨の設定がされている場合は、「見積書」、「設計図」および「修理報告書」それぞれについての圧縮形式で、各ページに対して圧縮処理がなされる。
【0065】
なお、色情報抽出部314および色分布算出部316は、圧縮種類判断部348によって1つの圧縮形式に特定できなかった場合のみに処理を行うようにしてもよい。
【符号の説明】
【0066】
2・・・画像処理装置,
3・・・処理プログラム,
302・・・原稿読取情報受付部,
304・・・原稿読取情報格納部,
306・・・圧縮形式手動指定部,
308・・・原稿判定情報格納部,
310・・・原稿種類/圧縮形式格納部,
314・・・色情報抽出部,
316・・・色分布算出部,
32・・・原稿種類判定部,
322・・・配置解析部,
324・・・文字認識部,
326・・・特定文字列判断部,
330・・・特定文字列位置判定部,
332・・・特定文字列寸法判定部,
338・・・原稿判定部,
34・・・圧縮形式設定部,
342・・・原稿種類情報受付部,
344・・・原稿種類/圧縮形式受付部,
348・・・原稿種類判断部,
350・・・圧縮形式判定部,
362・・・白黒形式設定部,
364・・・限定色形式設定部,
366・・・高画質形式設定部,
372・・・圧縮処理部,
374・・・画像データ生成部,
376・・・複数頁設定部,
378・・・画像データ出力部,
380・・・異常通知部,

【特許請求の範囲】
【請求項1】
原稿を読み取る読み取り手段によって得られた読み取り情報に基づいて原稿の種類を判定する種類判定手段と、
前記種類判定手段によって判定された原稿の種類に基づいて、読み取り情報から画像データを生成する際の圧縮形式を設定する圧縮形式設定手段と、
前記圧縮形式設定手段によって設定された圧縮形式で前記読み取り情報を圧縮し、前記原稿に対応する画像データを生成する生成手段と
を有する画像処理装置。
【請求項2】
前記読み取り情報から色情報を抽出する色情報抽出手段
をさらに有し、
前記圧縮形式設定手段は、前記色情報抽出手段によって抽出された色情報に基づいて、読み取り情報から画像データを生成する際の圧縮形式を設定する
請求項1に記載の画像処理装置。
【請求項3】
前記圧縮形式設定手段は、前記種類判定手段による原稿の判定ができなかった場合に、前記色情報抽出手段によって抽出された色情報に基づいて圧縮形式を設定する
請求項2に記載の画像処理装置。
【請求項4】
前記圧縮形式設定手段は、前記色情報に基づいて、前記読み取り情報において出現頻度の最も高い色値の出現頻度とその色値と所定範囲内にある色値の出現頻度との合計が閾値を超える場合に、圧縮後の色数を所定数に減ずる第1の圧縮形式を設定する
請求項2に記載の画像処理装置。
【請求項5】
前記圧縮形式設定手段は、前記色情報に基づいて、出現頻度の最も高い色値およびその色値と所定範囲内にある色値の出現頻度が閾値以下である場合に、前記第1の圧縮形式よりも圧縮後の色数が多い第2の圧縮形式を設定する
請求項4に記載の画像処理装置。
【請求項6】
前記原稿が複数の頁からなる場合に、頁毎に圧縮形式を設定するか否かを設定する複数頁設定手段
をさらに有し、
前記複数頁設定手段が頁毎に圧縮形式を設定しないと設定している場合、前記生成手段は、最初の頁について設定された圧縮形式で全ての頁に対応する画像データを生成する
請求項1〜5のいずれかに記載の画像処理装置。
【請求項7】
前記複数頁設定手段が頁毎に圧縮形式を設定すると設定している場合に、
前記種類判定手段は、頁毎に原稿の種類を判定し、
前記圧縮形式設定手段は、頁毎に圧縮形式を設定し、
前記生成手段は、頁毎に設定された圧縮形式で画像データを生成する
請求項6に記載の画像処理装置。
【請求項8】
原稿を読み取る読み取り手段によって得られた読み取り情報に基づいて原稿の種類を判定する種類判定ステップと、
前記種類判定ステップで判定された原稿の種類に基づいて、読み取り情報から画像データを生成する際の圧縮形式を設定する圧縮形式設定ステップと、
前記圧縮形式設定ステップで設定された圧縮形式で前記読み取り情報を圧縮し、前記原稿に対応する画像データを生成する生成ステップと
をコンピュータに実行させる画像処理プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7A】
image rotate

【図7B】
image rotate

【図7C】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate