説明

画像蓄積処理装置及び画像蓄積処理方法

【解決課題】 画質の低下を抑え、かつ、高効率に画像データを圧縮して蓄積することができるようにする。
【解決手段】 画像データがクライアントPCから入力されると(100)、画像データから文字線分を抽出する文字線分抽出処理を行い(102)、画像データからイメージを抽出するイメージ抽出処理を行い(104)、抽出された文字線分のデータ、抽出されたイメージのデータ、及び文字線分のデータとイメージのデータとを画像データから除いた背景を表すデータを圧縮してHDDに蓄積する圧縮蓄積処理を行う(106)。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像蓄積処理装置及び画像蓄積処理方法に係り、特に、入力された画像データを圧縮して蓄積する画像蓄積処理装置及び画像蓄積処理方法に関する。
【背景技術】
【0002】
従来、画像蓄積処理装置では、入力された画像データを蓄積する際に、データ容量を縮小するために、画像圧縮方式により圧縮した画像データを蓄積している。
【0003】
入力された画像データを画像圧縮する画像処理装置として、分割した領域毎に文字部、線部、ハーフトーン図形部などの属性に分類し、その属性毎に画像圧縮方式を選択し、実行する画像処理装置が知られている(特許文献1)。
【特許文献1】特開平7―220091
【発明の開示】
【発明が解決しようとする課題】
【0004】
しかしながら、特許文献1に記載の画像処理装置では、分割した領域が文字部、線部、ハーフトーン図形部などの複数の属性を有することがあり、文字部や線部の形状の鮮鋭さを劣化させない画像圧縮方式では、ハーフトーン図形部である領域を高効率に圧縮することができないため、画質の低下を抑え、かつ、高効率に圧縮可能な画像圧縮方式を選択することができない、という問題がある。
【0005】
本発明は、上記の問題点を解決するためになされたもので、画質の低下を抑え、かつ、高効率に画像データを圧縮して蓄積することができる画像蓄積処理装置及び画像蓄積処理方法を提供することを目的とする
【課題を解決するための手段】
【0006】
上記の目的を達成するために第1の発明の画像蓄積処理装置は、画像データから文字及び線分を表示する部分を抽出し、文字及び線分のみを表示する文字線分表示画像データを生成する文字線分抽出生成手段と、前記画像データから前記文字及び線分を表示する部分を除いた背景表示画像データを生成する文字線分除去生成手段と、前記文字線分表示画像データに対応した第1の画像圧縮方式により、前記文字線分表示画像データを圧縮し、前記背景表示画像データに対応した第2の画像圧縮方式により、前記背景表示画像データを圧縮する圧縮手段と、前記圧縮された文字線分表示画像データ及び背景表示画像データを蓄積する蓄積手段と、を含んで構成されている。
【0007】
また、第2の発明の画像蓄積処理方法は、画像データから文字及び線分を表示する部分を抽出し、文字及び線分のみを表示する文字線分表示画像データを生成し、前記画像データから前記文字及び線分を表示する部分を除いた背景表示画像データを生成し、前記文字線分表示画像データに対応した第1の画像圧縮方式により、前記文字線分表示画像データを圧縮し、前記背景表示画像データに対応した第2の画像圧縮方式により、前記背景表示画像データを圧縮し、前記圧縮された文字線分表示画像データ及び背景表示画像データを蓄積することを特徴とすることを特徴としている。
【0008】
第1の発明及び第2の発明によれば、画像データから文字及び線分を表示する部分を抽出し、文字及び線分のみを表示する文字線分表示画像データを生成し、画像データから文字及び線分を表示する部分を除いて背景表示画像データを生成する。そして、文字線分表示画像データに対応した第1の画像圧縮方式により、文字線分表示画像データを圧縮して蓄積し、背景表示画像データに対応した第2の画像圧縮方式により、背景表示画像データを圧縮し蓄積する。
【0009】
第1の発明及び第2の発明では、文字及び線分のみを表示する文字線分表示画像データと文字及び線分を表示する部分を除いた背景表示画像データとを生成し、各々のデータに合った画像圧縮方式で圧縮することにより、画質の低下を抑え、かつ、高効率に画像データを圧縮して蓄積することができる。
【0010】
第3の発明の画像蓄積処理装置は、画像データから文字を表示する部分を抽出し、文字のみを表示する文字表示画像データを生成し、前記画像データから線分を表示する部分を抽出し、線分のみを表示する線分表示画像データを生成する文字線分抽出生成手段と、前記画像データから前記文字及び線分を表示する部分を除いた背景表示画像データを生成する文字線分除去生成手段と、前記背景表示画像データからイメージを表示する部分を抽出し、イメージのみを表示するイメージ表示画像データを生成するイメージ抽出生成手段と、前記背景表示画像データから前記イメージを表示する部分を除いた残余背景表示画像データを生成するイメージ除去生成手段と、前記文字表示画像データに対応した第1の画像圧縮方式により、前記文字表示画像データを圧縮し、前記線分表示画像データに対応した第2の画像圧縮方式により、前記線分表示画像データを圧縮し、前記イメージ表示画像データに対応した第3の画像圧縮方式により、前記イメージ表示画像データを圧縮し、前記残余背景表示画像データに対応した第4の画像圧縮方式により、前記残余背景表示画像データを圧縮する圧縮手段と、前記圧縮された文字表示画像データ、線分表示画像データ、イメージ表示画像データ及び残余背景表示画像データを蓄積する蓄積手段と、を含んで構成されている。
【0011】
第3の発明によれば、文字線分抽出手段によって、画像データから文字を表示する部分を抽出し、文字のみを表示する文字表示画像データを生成し、画像データから線分を表示する部分を抽出し、線分のみを表示する線分表示画像データを生成し、文字線分除去生成手段によって、画像データから文字及び線分を表示する部分を除いた背景表示画像データを生成する。そして、イメージ抽出生成手段によって、背景表示画像データからイメージを表示する部分を抽出し、イメージのみを表示するイメージ表示画像データを生成し、イメージ除去生成手段によって、背景表示画像データからイメージを表示する部分を除いた残余背景表示画像データを生成する。
【0012】
そして、圧縮手段によって、文字表示画像データに対応した第1の画像圧縮方式により、文字表示画像データを圧縮し、線分表示画像データに対応した第2の画像圧縮方式により、線分表示画像データを圧縮し、イメージ表示画像データに対応した第3の画像圧縮方式により、イメージ表示画像データを圧縮し、残余背景表示画像データに対応した第4の画像圧縮方式により、残余背景表示画像データを圧縮し、蓄積手段によって、圧縮された文字表示画像データ、線分表示画像データ、イメージ表示画像データ、及び残余背景表示画像データを蓄積する。
【0013】
第3の発明では、画像データから文字表示画像データ、線分表示画像データ、イメージ表示画像データ、及び残余背景表示画像データを生成し、各々のデータに合った画像圧縮方式で圧縮することにより、画質の低下を抑え、かつ、高効率に画像データを圧縮して蓄積することができる。また、画像データを文字表示画像データ、線分表示画像データ、イメージ表示画像データ、及び残余背景表示画像データに分離することにより、他の画像データを生成するときに再利用できるデータの組み合わせの自由度が向上するため、蓄積されたデータの再利用性を向上させることができる。
【0014】
また、第1の発明及び第3の発明に係る除去生成手段は、画像データの文字及び線分を表示する部分の画素値を、文字及び線分を表示する部分の周辺画素に基づく画素値に変更することにより、背景表示画像データを生成することができる。
【発明の効果】
【0015】
以上説明したように、本発明の画像蓄積処理装置及び画像蓄積処理方法によれば、文字及び線分のみを表示する文字線分表示画像データと文字及び線分を表示する部分を除いた背景表示画像データとを生成し、各々のデータに合った画像圧縮方式で圧縮することにより、画質の低下を抑え、かつ、高効率に画像データを圧縮して蓄積することができる、という効果が得られる。
【発明を実施するための最良の形態】
【0016】
以下、本発明の実施の形態について図面を参照して説明する。
【0017】
図1に示すように、画像蓄積処理システム10は、画像データを蓄積する本発明の実施の形態に係る画像蓄積処理装置12と、画像データを作成するクライアントPC14とから構成されており、画像蓄積処理装置12とクライアントPC14とは、LANなどのネットワーク30を介して接続されている。画像蓄積処理装置12には、後述する画像蓄積処理ルーチンのプログラムを含む各種プログラムやパラメータ等が記憶されたROM16、各種プログラムを実行するCPU18、CPU18による各種プログラムの実行時におけるワークエリア等として用いられるRAM20、画像データを格納するためのHDD22、ネットワークインタフェース24、及びこれらを相互に接続するためのバス26が設けられている。
【0018】
なお、クライアントPC14は、従来公知のパーソナルコンピュータの一般的構成を備えたものであればよく、本実施の形態では、クライアントPC14の一般的処理の説明を省略する。
【0019】
次に、本発明の実施の形態の作用を説明する。
【0020】
まず、クライアントPC14で、画像データ、例えば図2に示すような文字と線分と多色画像であるイメージとを含む画像データ(例えば、ビットマップデータ)が生成され、画像蓄積処理装置12に画像データが出力される。
【0021】
そして、画像蓄積処理装置12において、図3に示す画像蓄積処理ルーチンが実行される。まず、ステップ100において、画像データがクライアントPC14から入力されたか否かを判定し、画像データが入力されたと判定されると、ステップ102において、画像データから文字線分を抽出する文字線分抽出処理を行う。そして、ステップ104において、画像データからイメージを抽出するイメージ抽出処理を行い、ステップ106で、ステップ102において抽出された文字線分のデータ、ステップ106において抽出されたイメージのデータ、及び文字線分のデータとイメージのデータとを画像データから除いた背景を表すデータを圧縮してHDD22に蓄積する圧縮蓄積処理を行い、画像蓄積処理ルーチンを終了する。
【0022】
次に、上記のステップ102の文字線分抽出処理を実現する文字線分抽出処理ルーチンについて図4を用いて説明する。まず、ステップ110において、クライアントPC14から入力された画像データを濃度に応じてニ値化処理し、ニ値画像データを生成する。なお、ニ値化処理の際に用いる閾値は、予め文字線分のみを抽出できる値を統計的に求めて、その値を閾値として設定しておく。また、画像データのイメージ部分において、絵柄を抽出しないように局所的に閾値を変更してもよい。
【0023】
次のステップ112では、ニ値画像データに基づいてレイアウト解析を行い、オン画素を囲む外接矩形を算出し、さらに隣接する外接矩形については統合する。このとき、外接矩形の高さを1とした際の横の比率を縦横比として計算し、縦横比が文字の大きさを表す所定範囲内である外接矩形同士を統合し、縦横比が文字の大きさを表す所定範囲外である外接矩形同士を統合する。また、外接矩形の統合が終了したときに、小さな外接矩形が残っている場合には、文字や線分のノイズとしてその外接矩形を除去する。なお、外接矩形を算出する処理は従来既知の技術を用いればよく、詳細な説明は省略する。
【0024】
そして、ステップ114で、外接矩形を識別する番号であるnを初期値とし、ステップ116で、n番目の外接矩形が文字を表すものであるか否かを判定する。ステップ112で縦横比が文字の大きさを表す所定範囲内である外接矩形が統合されて生成された外接矩形であると判定されると、ステップ118において、文字の形状を表すニ値画像データである文字マスク画像データにおいて、n番目の外接矩形内のオン画素に対応する位置の画素をオン画素とし、ステップ120において、入力された画像データと外接矩形内のオン画素の位置とに基づいて、文字部分の色を表す文字色画像データにおいて、外接矩形内のオン画素に対応する位置に文字の色情報を記録する。なお、文字色画像データの色情報を、外接矩形内のオン画素に対応する位置ごとに記憶するのではなく、外接矩形内の全てのオン画素の色情報に基づいて代表色を決定し、その代表色を表す色情報を外接矩形内に記録することにより、色情報を平滑化する。
【0025】
一方、n番目の外接矩形が、ステップ112で縦横比が文字の大きさを表す所定範囲外である外接矩形が統合されて生成された外接矩形であると判定されると、ステップ122において、線分の形状を表すニ値画像データである線分マスク画像データにおいて、n番目の外接矩形内のオン画素に対応する位置をオン画素とし、ステップ124において、入力された画像データと外接矩形内のオン画素の位置とに基づいて、線分の色を表す線分色画像データにおいて、外接矩形内のオン画素に対応する位置に線分の色情報を記憶する。なお、線分色画像データについても、文字色画像データと同様に色情報を平滑化する。
【0026】
次のステップ126では、n+1番目の外接矩形があるか否かを判定し、判定が肯定されると、ステップ128で、nをインクリメントし、ステップ116へ戻り、繰り返しステップ116〜126の処理を行う。全ての外接矩形について上記の処理を行うと、ステップ126の判定が否定され、文字線分抽出処理ルーチンを終了する。この文字線分抽出処理ルーチンにより、図2(b)に示すような文字マスタ画像データ、図2(c)に示すような線分マスタ画像データ、文字色画像データ、及び線分色画像データが生成される。
【0027】
次に、ステップ104のイメージ抽出処理を実現するイメージ抽出処理ルーチンについて図5を用いて説明する。まず、ステップ140で、入力された画像データにおいて、文字マスク画像データのオン画素に対応する位置と線分マスク画像データのオン画素に対応する位置とから文字線分を表す画素を除去し、ステップ142では、ステップ140で除去された画素の穴埋め処理を行って背景画像データを生成する。例えば、除去された画素の周辺画素、例えば図6に示すような文字マスク画像データのオン画素と線分マスク画像データのオン画素とに対応する位置以外の周辺画素の画素値の平均値を以下の式により算出し、除去された画素の画素値をその平均画素値に変更することにより、穴埋め処理を行う。
【0028】
平均画素値=周辺画素の画素値の合計/周辺画素の画素数
ステップ140で除去された全ての画素について穴埋め処理を行うと、ステップ143において、背景画像データのレイアウト解析を行い、レイアウト領域を算出する。例えば、背景画像データを二値化処理し、オン画素となっている領域を算出することにより、レイアウト領域を算出する。そして、ステップ144において、レイアウト領域毎に画素値の分散値sを以下の式により算出する。
【0029】
【数1】

【0030】
ただし、nは対象となっているレイアウト領域の画素数、xは対象となっている画素の画素値である。
【0031】
そして、ステップ146において、ステップ144で算出された分散値に基づいて、背景画像データからイメージ部分を抽出する。レイアウト領域の分散値が閾値以上であるとイメージ部分であると推測できるため、分散値が閾値以上であるレイアウト領域をイメージ部分として抽出し、イメージのみからなる画像データであるイメージ画像データに抽出したイメージ部分を記録し、ステップ148において、背景画像データからイメージ部分に対応する領域からイメージを表す画素を除去して、残余背景画像データを生成し、イメージ抽出処理ルーチンを終了する。
【0032】
次に、ステップ106の圧縮蓄積処理を実現する圧縮蓄積処理ルーチンについて図7を用いて説明する。まず、ステップ160において、文字マスク画像データ及び線分マスク画像データの各々に対しMMR(Modified Modified READ)圧縮処理を行い、圧縮データをHDD22に蓄積し、ステップ162において、文字色画像データ及び線分色画像データの各々に対しJPEG(Joint Photographic Experts Group)圧縮処理を行い、圧縮データをHDD22に蓄積する。そして、ステップ164において、イメージ画像データに対しJPEG圧縮処理を行い、圧縮データをHDD22に蓄積し、ステップ166において、残余背景画像データに対しGIF(Graphics Interchange Format)圧縮処理を行い、圧縮データをHDD22に蓄積し、圧縮蓄積処理ルーチンを終了する。
【0033】
HDD22に蓄積された圧縮データをクライアントPC14へ出力する場合には、圧縮データに対して伸張処理を行うことにより、入力された画像データ(例えば、ビットマップデータ)に復元して出力する。また、各画像圧縮方式で圧縮された圧縮データをそのまま出力することもでき、さらに、文字マスク画像データに対して文字認識処理を行い、テキストデータとして出力することもできる。
【0034】
以上説明したように、本発明の実施の形態に係る画像蓄積処理装置によれば、画像データから、文字のみを抽出した文字マスク画像データ、線分のみを抽出した線分マスク画像データ、イメージのみを抽出したイメージ画像データ、文字、線分、及びイメージを表示する部分を除いた残余背景画像データとを生成し、各々のデータに適した画像圧縮方式により各データを圧縮することにより、高効率に画像データを圧縮して蓄積することができ、また、背景やイメージの上にある文字や線分を抽出して文字や線分に適した画像圧縮方式により圧縮しているため、画像圧縮による文字や線分の形状の鮮鋭さの劣化を防止し、画質の低下を抑えることができる。
【0035】
また、画像データを文字マスク画像データ、線分マスク画像データ、イメージ画像データ及び残余背景画像データに分離して部品化することにより、他の画像データを生成するときに、各データ毎に再利用できるため、蓄積されたデータの再利用性を向上させることができる。
【0036】
なお、本発明の実施の形態では、文字について文字マスク画像データ及び文字色画像データを生成し、線分について線分マスク画像データ及び線分色画像データを生成する場合を例に説明したが、文字と線分とを分けずに、文字線分に対して文字線分マスク画像データ及び文字線分色画像データを生成するようにしてもよい。
【0037】
また、イメージ抽出処理ルーチンでは、レイアウト領域毎の分散値を算出し、イメージ部分を抽出する場合を例に紹介したが、文字線分抽出処理ルーチンで特定した外接矩形毎に分散値を計算し、外接矩形の領域がイメージ部分であるか否かを判定し、イメージ部分を抽出してもよい。
【0038】
また、圧縮蓄積処理ルーチンでは、画像圧縮方式としてMMR、JPEG、GIFを用いる場合を例に説明したが、これに限定されるものではなく、文字マスク画像データ及び線分マスク画像データはJBIG(Joint Bi−level Image Coding Experts Group)圧縮してもよく、残余背景画像データに対してはLZW(Lempel−Ziv−Weich)圧縮又はユニバーサル符号化によって圧縮してもよい。また、イメージ画像データに対してはJPEG2000によって圧縮してもよい。
【図面の簡単な説明】
【0039】
【図1】本発明の実施の形態に係る画像蓄積処理システムの構成を示す概略図である。
【図2】本発明の実施の形態に係る画像データ、文字マスタ画像データ、線分マスタ画像データ、残余背景画像データ及びイメージ画像データのイメージ図である。
【図3】本発明の実施の形態に係る画像蓄積処理装置の画像蓄積処理ルーチンの内容を示すフローチャートである。
【図4】本発明の実施の形態に係る画像蓄積処理装置の文字線分抽出処理ルーチンの内容を示すフローチャートである。
【図5】本発明の実施の形態に係る画像蓄積処理装置のイメージ抽出処理ルーチンの内容を示すフローチャートである。
【図6】イメージ抽出処理ルーチンの穴埋め処理における周辺画素のイメージ図である。
【図7】本発明の実施の形態に係る画像蓄積処理装置の圧縮蓄積処理ルーチンの内容を示すフローチャートである。
【符号の説明】
【0040】
10 画像蓄積処理システム
12 画像蓄積処理装置
14 クライアントPC
16 ROM
18 CPU
20 RAM
22 HDD
24 ネットワークインタフェース
30 ネットワーク

【特許請求の範囲】
【請求項1】
画像データから文字及び線分を表示する部分を抽出し、文字及び線分のみを表示する文字線分表示画像データを生成する文字線分抽出生成手段と、
前記画像データから前記文字及び線分を表示する部分を除いた背景表示画像データを生成する文字線分除去生成手段と、
前記文字線分表示画像データに対応した第1の画像圧縮方式により、前記文字線分表示画像データを圧縮し、前記背景表示画像データに対応した第2の画像圧縮方式により、前記背景表示画像データを圧縮する圧縮手段と、
前記圧縮された文字線分表示画像データ及び背景表示画像データを蓄積する蓄積手段と、
を含む画像蓄積処理装置。
【請求項2】
画像データから文字を表示する部分を抽出し、文字のみを表示する文字表示画像データを生成し、前記画像データから線分を表示する部分を抽出し、線分のみを表示する線分表示画像データを生成する文字線分抽出生成手段と、
前記画像データから文字及び線分を表示する部分を除いた背景表示画像データを生成する文字線分除去生成手段と、
前記背景表示画像データからイメージを表示する部分を抽出し、イメージのみを表示するイメージ表示画像データを生成するイメージ抽出生成手段と、
前記背景表示画像データから前記イメージを表示する部分を除いた残余背景表示画像データを生成するイメージ除去生成手段と、
前記文字表示画像データに対応した第1の画像圧縮方式により、前記文字表示画像データを圧縮し、前記線分表示画像データに対応した第2の画像圧縮方式により、前記線分表示画像データを圧縮し、前記イメージ表示画像データに対応した第3の画像圧縮方式により、前記イメージ表示画像データを圧縮し、前記残余背景表示画像データに対応した第4の画像圧縮方式により、前記残余背景表示画像データを圧縮する圧縮手段と、
前記圧縮された文字表示画像データ、線分表示画像データ、イメージ表示画像データ、及び残余背景表示画像データを蓄積する蓄積手段と、
を含む画像蓄積処理装置。
【請求項3】
前記文字線分除去生成手段は、前記画像データの前記文字及び線分を表示する部分の画素値を、前記文字及び線分を表示する部分の周辺画素に基づく画素値に変更することにより、前記背景表示画像データを生成する請求項1又は2に記載の画像蓄積処理装置。
【請求項4】
画像データから文字及び線分を表示する部分を抽出し、文字及び線分のみを表示する文字線分表示画像データを生成し、
前記画像データから前記文字及び線分を表示する部分を除いた背景表示画像データを生成し、
前記文字線分表示画像データに対応した第1の画像圧縮方式により、前記文字線分表示画像データを圧縮し、前記背景表示画像データに対応した第2の画像圧縮方式により、前記背景表示画像データを圧縮し、
前記圧縮された文字線分表示画像データ及び背景表示画像データを蓄積することを特徴とする画像蓄積処理方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2006−270439(P2006−270439A)
【公開日】平成18年10月5日(2006.10.5)
【国際特許分類】
【出願番号】特願2005−84818(P2005−84818)
【出願日】平成17年3月23日(2005.3.23)
【出願人】(000005496)富士ゼロックス株式会社 (21,908)
【Fターム(参考)】