文字画像圧縮装置及び文字画像復元装置、文字画像圧縮方法及び文字画像復元方法、並びに文字画像圧縮プログラム及び文字画像復元プログラム
【課題】、高品質で、低容量に文字画像を圧縮する
【解決手段】文字画像取得部50が取得した文字画像の文字認識を文字認識部51が行い、線形和画像生成部53が、認識された文字に対応する複数のサンプル画像を辞書DB58から取得するとともに、当該複数のサンプル画像を用いた線形和画像を生成する。また、差分画像生成部55が、文字画像取得部50が取得した文字画像と線形和画像との差分画像を生成し、格納部56が、線形和画像と差分画像とを関連付けて、格納手段30に格納する。
【解決手段】文字画像取得部50が取得した文字画像の文字認識を文字認識部51が行い、線形和画像生成部53が、認識された文字に対応する複数のサンプル画像を辞書DB58から取得するとともに、当該複数のサンプル画像を用いた線形和画像を生成する。また、差分画像生成部55が、文字画像取得部50が取得した文字画像と線形和画像との差分画像を生成し、格納部56が、線形和画像と差分画像とを関連付けて、格納手段30に格納する。
【発明の詳細な説明】
【技術分野】
【0001】
本件は、文字画像圧縮装置及び文字画像復元装置、文字画像圧縮方法及び文字画像復元方法、並びに文字画像圧縮プログラム及び文字画像復元プログラムに関する。
【背景技術】
【0002】
文書画像を大量保存する場合や、例えば銀行業務のように窓口で取得した帳票画像を業務センター等へ大量送信する場合等においては、文書画像を高品質かつ低容量に圧縮できることが好ましい。
【0003】
一般に画像を圧縮する方式としてJPEG(Joint Photographic Experts Group)圧縮がある。しかし、文書画像に対してJPEG圧縮を行うと、文字パターンの周辺にブロックノイズが発生して視認性が大きく低下することがある。特に、元の文書画像の画質が劣悪な場合や文字が小さい場合などにおいて、JPEG圧縮を行うと文字が非常に見づらくなる。
【0004】
これに対し、最近では、例えば特許文献1のような技術を用いた圧縮方法が提案されている。特許文献1に記載の技術は、文書画像を文字画像と背景画像に分離して、それぞれに適した圧縮を行うというものである。具体的には、背景画像にはJPEG圧縮を施し、その一方で、文字画像に対しては、文字の色を減らし複数枚の2値画像に変換しそれらに対して可逆圧縮を施すというものである。
【0005】
更に、特許文献2のような、文字認識結果を用いた圧縮方法も提案されている。この技術では、文字認識結果の信頼性が高い文字を文字コードに置き換えて保存するというものである。また、特許文献3には、文字認識結果の文字コードに対して、文字画像と最も近い文字フォントを探索して近似画像とし、それを入力画像に対する予測画像とし、予測誤差を求めて符号化する技術が開示されている。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2005−159663号公報
【特許文献2】特開平8−295934号公報
【特許文献3】特開平10−178638号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、上記特許文献1の技術では、文字の色を減らすことで文字パターンの一部が消失するなどして、必ずしも視認性を改善できるとは限らない。また、特許文献2の技術のように文字認識を用いても、文字認識結果自体が100%信頼できるものではないため、誤った画像が復元される可能性がある。また、特許文献3の技術を用いても、取得する文書画像は大抵の場合劣化しているため、最も近いフォントの文字画像でも実際の画像との差分が大きくなってしまい、文字画像の高精度(高品質)な圧縮を実現できないおそれがある。
【0008】
そこで本件は上記の課題に鑑みてなされたものであり、高品質で、低容量に文字画像を圧縮することが可能な文字画像圧縮装置、文字画像圧縮方法及び文字画像圧縮プログラムを提供することを目的とする。また、本件は、高品質で、低容量に圧縮された文字画像を復元することが可能な文字画像復元装置、文字画像復元方法及び文字画像復元プログラムを提供することを目的とする。
【課題を解決するための手段】
【0009】
本明細書に記載の文字画像圧縮装置は、文字画像を取得する文字画像取得部と、前記文字画像取得部で取得された前記文字画像の文字認識を行う文字認識部と、前記文字認識部にて認識された文字に対応する複数のサンプル画像を取得し、前記複数のサンプル画像を用いた線形和画像を生成する線形和画像生成部と、前記文字画像取得部が取得した前記文字画像と、前記線形和画像との差分画像を生成する差分画像生成部と、前記線形和画像の情報と、前記差分画像の情報とを関連付けて、格納手段に格納する格納部と、を備える。
【0010】
本明細書に記載の文字画像復元装置は、本明細書に記載の文字画像圧縮装置の前記格納部が前記格納手段に格納した、前記線形和画像の情報と、前記差分画像の情報とを取得する取得部と、前記取得部が取得した情報から前記文字画像を復元する復元部と、を備える。
【0011】
本明細書に記載の文字画像圧縮方法は、コンピュータが、文字画像を取得する文字画像取得工程と、前記文字画像取得工程で取得された前記文字画像の文字認識を行う文字認識工程と、前記文字認識工程で認識された文字に対応する複数のサンプル画像を取得し、前記複数のサンプル画像を用いた線形和画像を生成する線形和画像生成工程と、前記文字画像取得工程で取得した前記文字画像と、前記線形和画像との差分画像を生成する差分画像生成工程と、前記線形和画像の情報と、前記差分画像の情報とを関連付けて、格納手段に格納する格納工程と、を実行する文字画像圧縮方法である。
【0012】
本明細書に記載の文字画像復元方法は、コンピュータが、本明細書に記載の文字画像圧縮方法を用いて、前記格納手段に格納された、前記線形和画像の情報と、前記差分画像の情報とを取得する取得工程と、前記取得工程において取得された情報から前記文字画像を復元する復元工程と、を実行する文字画像復元方法である。
【0013】
本明細書に記載の文字画像圧縮プログラムは、コンピュータに、文字画像を取得する文字画像取得工程と、前記文字画像取得工程で取得された前記文字画像の文字認識を行う文字認識工程と、前記文字認識工程で認識された文字に対応する複数のサンプル画像を取得し、前記複数のサンプル画像を用いた線形和画像を生成する線形和画像生成工程と、前記文字画像取得工程で取得した前記文字画像と、前記線形和画像との差分画像を生成する差分画像生成工程と、前記線形和画像の情報と、前記差分画像の情報とを関連付けて、格納手段に格納する格納工程と、を実行させる文字画像圧縮プログラムである。
【0014】
本明細書に記載の文字画像復元プログラムは、コンピュータに、本明細書に記載の文字画像圧縮プログラムを用いて、前記格納手段に格納された、前記線形和画像の情報と、前記差分画像の情報とを取得する取得工程と、前記取得工程において取得された情報から前記文字画像を復元する復元工程と、を実行させる文字画像復元プログラムである。
【発明の効果】
【0015】
本明細書に記載の文字画像圧縮装置、文字画像圧縮方法及び文字画像圧縮プログラムは、高品質で、低容量に文字画像を圧縮することができるという効果を奏する。また、本明細書に記載の文字画像復元装置、文字画像復元方法及び文字画像復元プログラムは、高品質で、低容量に圧縮された文字画像を復元することができるという効果を奏する。
【図面の簡単な説明】
【0016】
【図1】一実施形態に係る情報処理装置の構成を概略的に示す図である。
【図2】図1のPCのハードウェア構成を示す図である。
【図3】図1のPCの機能ブロック図が示されている。
【図4】文字画像圧縮部と、文字画像復元部の詳細な機能ブロック図である。
【図5】辞書DBのデータ構造を示す図である。
【図6】一実施形態の情報処理装置における文書画像圧縮処理の具体的な処理内容を示すフローチャートである。
【図7】図6のステップS16(文字画像圧縮のサブルーチン)における具体的処理を示すフローチャートである。
【図8】図8(a)〜図8(d)は、線形和画像の生成方法を説明するための図である。
【図9】図7のステップS28の具体的処理を示すフローチャートである。
【図10】図10(a)、図10(b)は、差分画像の生成方法を説明するための図である。
【図11】図11(a)は、圧縮文字データのデータ構造を模式的に示す図であり、図11(b)は、文字画像データのデータ構造を示す図である
【図12】差分画像データのデータ構造を示す図である。
【図13】文書画像の復元処理を示すフローチャートである。
【図14】図13のステップS94の具体的処理内容を示すフローチャートである。
【図15】図15(a)〜図15(c)は、比較例1を説明するための図である。
【図16】図16(a)〜図16(c)は、比較例2を説明するための図である。
【図17】変形例に係るPCの機能ブロック図である。
【図18】図18(a)は、変形例に係る表示例を示す図であり、図18(b)は、図18(a)の画像を鮮明にした状態を示す図である。
【図19】図19(a)〜図19(c)は、変形例における重み係数の計算手順を示す図である。
【発明を実施するための形態】
【0017】
以下、文字画像圧縮装置及び文字画像復元装置の一実施形態について詳細に説明する。図1には、一実施形態に係る情報処理装置100の構成が概略的に示されている。この図1に示すように、情報処理装置100は、PC10と、ディスプレイ12と、キーボード14と、マウス16と、スキャナ18とを備える。
【0018】
PC10は、外部から入力される文書画像を圧縮して保持するとともに、ユーザの指示に応じて、保存している文書画像を復元して、ディスプレイ12に表示する機能を有している。
【0019】
図2には、PC10のハードウェア構成が示されている。この図2に示すように、PC10は、CPU90、ROM91、RAM92、記憶部(ここではHDD(Hard Disk Drive))93、入出力部94等を備えており、これら構成各部は、バス95に接続されている。PC10では、ROM91あるいはHDD93に格納されている各種プログラム(文字画像圧縮プログラム及び文字画像復元プログラムを含む)をCPU90が実行することにより、図3の各部の機能が実現される。また、入出力部94には、図1のディスプレイ12、キーボード14、マウス16、スキャナ18等が接続されている。
【0020】
図1に戻り、ディスプレイ12は、液晶ディスプレイ等の表示装置であり、PC10から入力される画像を表示する。キーボード14及びマウス16は、ユーザがPC10への指示を入力する際に用いられるユーザインタフェースである。スキャナ18は、文字や図形等が記載された紙文書の画像(文書画像と呼ぶ)を読み取り、PC10に入力する装置である。
【0021】
図3には、PC10の機能ブロック図が示されている。この図3に示すように、PC10は、文書画像分離部20と、背景画像圧縮部22と、文字画像圧縮装置としての文字画像圧縮部24と、格納手段30と、背景画像復元部40と、文字画像復元装置としての文字画像復元部42と、文書画像生成部44と、表示制御部46と、を有する。
【0022】
文書画像分離部20は、スキャナ18にて読み込まれた文書画像を、背景画像と文字画像とに分離する。ここで、文字画像とは、文書画像に含まれる文字を1文字ずつ取り出した画像である。また、背景画像は、文字画像以外の部分の画像である。
【0023】
背景画像圧縮部22は、文書画像分離部20で分離された背景画像をJPEG形式などにより圧縮して、当該圧縮により生成された圧縮背景データを格納手段30に格納する。文字画像圧縮部24は、辞書DB58に格納されているデータを用いて、文書画像分離部20で分離された文字画像を後述する方法で圧縮する。また、文字画像圧縮部24は、圧縮により生成された圧縮文字データを、格納手段30に格納する。なお、文字画像圧縮部24の詳細については、後述する。
【0024】
ここで、格納手段30及び辞書DB58は、図2のHDD93により実現されている。辞書DB58には、複数の文字に対して、複数のフォント、複数の劣化度の画像(サンプル画像(図8(b)参照)と呼ぶ)が格納されている。
【0025】
背景画像復元部40は、格納手段30に格納されている圧縮背景データを読み出し、当該圧縮背景データから、背景画像を復元する。文字画像復元部42は、格納手段30に格納されている圧縮文字データを読み出し、当該圧縮文字データと、辞書DB58に格納されているデータとに基づいて、文字画像を復元する。なお、文字画像復元部42の詳細については、後述する。
【0026】
文書画像生成部44は、背景画像復元部40で復元された背景画像と、文字画像復元部42で復元された文字画像とを用いて、文書画像を生成(復元)する。表示制御部46は、文書画像生成部44で生成された文書画像を、ディスプレイ12に表示する。
【0027】
図4には、文字画像圧縮部24及び文字画像復元部42の詳細な機能ブロック図が示されている。図4に示すように、文字画像圧縮部24は、文字画像取得部50と、文字認識部51と、色情報取得部52と、線形和画像生成部53と、差分画像生成部55と、格納部56と、を備える。
【0028】
文字画像取得部50は、図3の文書画像分離部20において文書画像から分離された文字画像を取得する。文字認識部51は、文字画像取得部50で取得された文字画像の文字認識を行う。色情報取得部52は、文字画像から色情報(ここでは、色相と彩度)を取得する。
【0029】
線形和画像生成部53は、複数のサンプル画像の各々に重み付けを行い、サンプル画像の画素値と各サンプル画像の重み係数とを積算した値の和から線形和画像を生成する。より具体的には、サンプル画像取得部54aと、重み係数決定部54bと、画像生成部54cと、を有している。サンプル画像取得部54aは、文字認識部51にて認識された文字に対応する複数のサンプル画像を辞書DB58から取得する。また、重み係数決定部54bは、複数のサンプル画像を用いた線形和による生成画像が、文字画像に類似するように、各サンプル画像の重み係数を決定する。画像生成部54cは、複数のサンプル画像と各サンプル画像の重み係数とを積算した値の和から、線形和画像を生成する。
【0030】
差分画像生成部55は、文字画像取得部50が取得した文字画像と、線形和画像生成部53で生成された線形和画像との差分画像を生成するとともに、差分画像を可逆圧縮して差分画像データを生成する。
【0031】
格納部56は、線形和画像の情報(線形和画像生成に用いたサンプル画像の情報及び重み係数を含む文字画像データ)と、差分画像の情報(差分画像データ)とを関連付けて、格納手段30に格納する。
【0032】
図3の文字画像復元部42は、図4に示すように、取得部60と、復元部62と、出力部64と、を備えている。
【0033】
取得部60は、格納手段30に格納されている情報のうち、線形和画像の情報と、差分画像の情報とを取得する。復元部62は、取得部60が取得した線形和画像の情報と辞書DB58のサンプル画像とから生成される線形和画像と、差分画像の情報から生成される差分画像とから文字画像を復元する。出力部64は、復元部62において復元された文字画像を図3の文書画像生成部44に対して出力する。
【0034】
次に、辞書DB58のデータ構造について、図5に基づいて説明する。図5に示すように、辞書DB58には、「文字種類数」の項目と、「文字種類1」〜「文字種類p」の項目が設けられている。なお、図5では、「文字種類数」の項目には、pが入力されることになる。ここで、文字種類とは、文字そのもの(例えば、「あ」、「い」…など)を意味し、フォントや画像の劣化度が異なっているものも含めて、1つの文字種類となる。文字種類は、一般に、文字カテゴリとも呼ばれ、文字種類数は、通常、日本語であれば約4000程度となる。
【0035】
また、辞書DB58には、図5に示すように、文字種類ごとに、「文字コード」の項目、「文字画像数」の項目が設けられている。また、複数の文字画像に対応して、「ID」の項目、「文字画像(データ)」の項目、「文字特徴(ベクトル)」の項目が、設けられている。「文字画像」の項目には、例えば、図8(b)に示すような、フォントや画像の劣化度が異なる画像(「サンプル画像」とも呼ぶ)が登録され、「ID」の項目には、図8(b)に示すA1〜D3などのIDが登録される。
【0036】
なお、文字画像としては正規化された画像、例えばグレー画像が登録される。また、文字特徴ベクトルの次元数も文字画像によらず一定である。したがって、文字画像毎の情報は固定の大きさの領域となる。なお、文字特徴ベクトルは、グレー画像ではなく、2値画像から得られるものでもよい。また、画像の劣化度は、例えば、文字画像に対してガウシアンフィルタの分散を多段階に変更しつつ作用させることにより得ることができる。
【0037】
次に、本実施形態の情報処理装置100における文書画像圧縮処理と文書画像復元処理の詳細について、図6〜図14に基づいて説明する。
【0038】
図6には、本実施形態の情報処理装置100における文書画像圧縮処理の具体的な処理内容が、フローチャートにて示されている。図6の処理では、まず、ステップS10において、文書画像分離部20が、スキャナ18にて読み込まれた文書画像を取得する。次いで、ステップS12では、文書画像分離部20が、文字画像と背景画像とを分離する。この分離方法としては、例えば、特開2005−159663号公報に記載されているような方法を採用することができる。
【0039】
次いで、ステップS14では、背景画像圧縮部22が、背景画像を圧縮する処理を実行する。この場合、背景画像圧縮部22は、例えばJPEG形式により背景画像を圧縮し、圧縮背景データを生成するものとする。
【0040】
次いで、ステップS16では、文字画像圧縮部24が、文字画像圧縮のサブルーチンを実行する。この文字画像圧縮のサブルーチンでは、図7の処理が実行される。
【0041】
図7には、ステップS16(文字画像圧縮のサブルーチン)における具体的処理がフローチャートにて示されている。この図7の処理では、まず、ステップS20において、文字画像圧縮部24の文字画像取得部50が、文書画像分離部20にて文書画像から分離された全ての文字画像を取得する。ここで取得される文字画像は、カラーの文字画像であるものとする。
【0042】
次いで、ステップS22では、文字認識部51が、ステップS20において取得された文字画像(カラーの文字画像)を用いて文字認識処理を行う。その結果得られる文字認識結果は、認識結果文字数と各認識結果の文字情報である。認識結果の文字情報は、文字コードと、文字座標とを含む。
【0043】
次いで、ステップS23では、色情報取得部52が、未処理の文字画像を取得する。次いで、ステップS24では、色情報取得部52が、取得した文字画像の色情報を取得する。ここで、文字画像の色情報は、色相と彩度の値である。この場合、まず、色情報取得部52は、カラーの元画像(Iとする)から明度画像(Fとする)を生成する。そして、色情報取得部52は、文字画像の画素のうち、明度値が所定の閾値よりも大きい画素、すなわち、文字画像をグレー画像としたときに所定以上黒く表示される画素に関して、色相と彩度の値を計算してサンプリングする。また、色情報取得部52は、当該サンプリングの結果、最も出現頻度の大きい色相と彩度の値を求め、これを、文字画像の色情報とする。なお、色彩と彩度の取得方法は、上記方法に限らず、色情報取得部52は、文字画像の画素の色彩と彩度の平均値を求め、これを文字画像の色情報として取得することとしても良い。
【0044】
次いで、ステップS26では、線形和画像生成部53が、線形和画像を生成する。以下、線形和画像の生成方法について、図8(a)〜図8(d)に基づいて、詳細に説明する。
【0045】
図8(a)には、1文字分の文字画像(明度画像)Fの一例として、「証」の文字の文字画像が示されている。この文字画像Fの文字認識(ステップS22)の結果、正しく「証」と認識された場合には、サンプル画像取得部54aは、辞書DB58から「証」の文字に対応する複数のサンプル画像を、図8(b)のように取得する。次いで、重み係数決定部54bは、文字画像Fに関し、サンプル画像との距離を算出し、距離の近い上位N個のサンプル画像f1、f2、…、fNを決定する。ここで、文字画像Fとサンプル画像との距離は、サンプル画像の文字特徴ベクトルを用いた識別関数値を利用して、算出することができる。なお、図8(c)では、N=3の例が示されている。
【0046】
次いで、重み係数決定部54bは、文字画像Fに対して、線形和画像の最適類似画像を求める。具体的には、上位N個のサンプル画像f1、f2、…、fNに対する重み係数α1、α2、…、αNを、次式(1)から求める。
【0047】
【数1】
【0048】
ここで、上式(1)の問題を、制約付き最小自乗問題と捉えれば、その解として重み係数α1、α2、…、αNを計算することができる。具体的には、重み係数決定部54bは、次式(2)に基づいて、α1、α2、…、αNを計算する。
【0049】
【数2】
なお、上式(2)では、C={(F−fk)・(F−fl)}であるものとする。
【0050】
以上のようにして、重み係数α1、α2、…、αNを決定すると、画像生成部54cは、線形和画像を生成することができる。一例として、図8(c)に示すように、サンプル画像のIDがA3の重み係数が0.60、A2の重み係数が0.31、C3の重み係数が0.09であったとするならば、画像生成部54cは、各サンプル画像の画素値と各サンプル画像の重み係数とを積算した値の和から、図8(d)のような線形和画像を生成することができる。このように線形和画像が生成された後は、図7のステップS28に移行する。
【0051】
図7のステップS28では、差分画像生成部55が、差分画像を生成するサブルーチンを実行する。このサブルーチンでは、差分画像生成部55は、図9のような処理を実行する。なお、ステップS28の処理は、簡単に言えば、図10(a)のように文字画像FからステップS26で生成された線形和画像を差し引いて、図10(b)のような差分画像を生成する処理である。
【0052】
図9の処理では、まずステップS40において、差分画像生成部55が、正の差分画像及び負の差分画像を生成する。なお、正の差分画像とは、線形和画像を元の文字画像に近づけるために、より黒くする必要のある画素を示す画像であり、負の差分画像とは、線形和画像を元の文字画像に近づけるために、より白くする必要のある画素を示す画像である。
【0053】
具体的には、差分画像生成部55は、次式(3)から差分画像Dを求める。
【0054】
【数3】
【0055】
次いで、差分画像生成部55は、Dを正の差分画像D+と負の差分画像D-に分解する。具体的には、差分画像生成部55は、次式(4)、(5)から、D+とD-を求める。なお、mは、行方向の画素番号を示し、nは列方向の画素番号を示す。
【0056】
【数4】
【0057】
【数5】
【0058】
次いで、ステップS42では、正の差分画像全体の画素値(画素値の総和)が、所定の閾値thα以下であるか否かを判断する。ここで、閾値thαとしては、例えば、線形和画像が正しく生成されているときにとりうる差分画像の画素値の範囲(事前の実験やシミュレーションにより求められる)のうちの最大値を採用することとする。ここでの判断が否定された場合、すなわち、正の差分画像が大きすぎて、ステップS26において適切な線形和画像が生成されていない可能性が高いと判断される場合には、ステップS78に移行する。ステップS78では、正の差分画像を文字画像Fに設定するとともに、負の差分画像を0(Null)に設定し、かつ重み係数をクリアする。このようにステップS78を経た場合には、前述したステップS26において生成された線形和画像を用いた画像圧縮を行うことなく、文字画像そのものを正の差分画像として扱うことになる。このステップS78が行われた後は、図9の全処理を終了して、図7のステップS30に移行する。
【0059】
一方、ステップS42の判断が肯定された場合には、ステップS44に移行する。ステップS44では、差分画像生成部55が、差分画像の画素の行番号m(0≦m≦ymax)を0に設定する(m=0)。次いで、ステップS46では、差分画像生成部55が、行番号mが行番号の最大値ymax以下か否かを判断する。ここでの判断が肯定された場合には、ステップS48に移行するが、否定された場合には、ステップS60に移行する。ステップS48に移行した場合、差分画像生成部55は、差分画像の画素の列番号n(0≦n≦xmax)を0に設定する(n=0)。次いで、ステップS50では、差分画像生成部55が、列番号nが列番号の最大値xmax以下か否かを判断する。ここでの判断が肯定された場合には、ステップS52に移行するが、否定された場合には、ステップS58においてmを1インクリメント(m←m+1)した後、ステップS46に戻る。
【0060】
ステップS52に移行した場合、差分画像生成部55は、m行n列の画素値が所定の閾値thβ以上か否かを判断する。ここで、閾値thβとしては、画素の値を0に近似しても復元した画像と圧縮前の画像との間に見た目上ほとんど差異が生じない程度の画素の値を採用することができる。ここでの判断が否定された場合、すなわち、m行n列の画素値が閾値thβよりも小さく、ほぼ0と看做せる場合には、ステップS54において、差分画像生成部55が、m行n列の画素値を0に設定して、ステップS56に移行する。このように、m行n列の画素値がほぼ0と看做せるときに画素値を0とすることで、差分画像のデータ量を小さくすることができる。
【0061】
一方、ステップS52の判断が肯定された場合には、差分画像生成部55は、ステップS54を経ずに、すなわち、m行n列の画素値を維持したまま、ステップS56に移行する。
【0062】
ステップS56では、差分画像生成部55は、列番号nを1インクリメントした後に、ステップS50に戻る。その後は、差分画像生成部55が、ステップS46〜S56を繰り返すことで、0行0列の画素からymax行xmax列の画素までの処理を実行し、ステップS46の判断が否定された段階で、ステップS60に移行する。
【0063】
なお、これ以降のステップS60〜ステップS76の処理は、負の差分画像に対する処理であるが、前述した、ステップS42〜ステップS58までの正の差分画像に対する処理と同様に行われる。なお、ステップS60では、負の差分画像全体の画素値(画素値の総和)の絶対値と閾値thαとを比較し、ステップS70では、m行n列の画素値の絶対値と閾値thβとを比較している点が、前述した正の差分画像に対する処理と異なっている。ステップS60の判断が否定された場合には、ステップS78の処理を経て、図9の全処理を終了し、ステップS64の判断が否定された場合には、ステップS78を経ずに、図9の全処理を終了する。
【0064】
図9の全処理が終了すると、図7のステップS29に移行する。ステップS29では、差分画像生成部55が、ステップS28で生成された差分画像を可逆圧縮して、差分画像の情報(差分画像データ)を生成する。次いで、ステップS30では、色情報取得部52が、未処理の全文字の取得が終了したか否かを判断する。ここでの判断が否定された場合には、ステップS23に戻り、ステップS30の判断が肯定されるまで、ステップS23〜S30の処理・判断を繰り返す。一方、ステップS30の判断が肯定された場合には、図7の全処理を終了し、図6のステップS18に移行する。なお、図7の処理を終了した段階で生成された各データを、「圧縮文字データ」と呼ぶものとする。すなわち、図11(a)に模式的に示すように、圧縮文字データは、線形和画像生成に用いられるサンプル画像の情報や重み係数、色情報などを含む文字画像データと、差分画像データとを含んでいる。
【0065】
ここで、図11(a)に示す文字画像データと、差分画像データについて説明する。
【0066】
文字画像データは、図11(b)に示すように、先頭に「文字数」の項目があり、その後に「1文字分のコード情報」の項目が文字数分だけ配列される。「1文字分のコード情報」の項目には、「文字の座標」(例えば、文字の左上の点の座標と右下の点の座標)、「文字の色情報」、「文字コード」が記述される。また、線形和画像を生成するのに用いた重み係数の個数が記述されるとともに、重み係数に対応するサンプル画像のIDとその重み係数が記述される。なお、文字の色情報は、色相と彩度の2つの数値からなる。
【0067】
一方、差分画像データは、図12に示すように、先頭に「文字数」の項目があり、その後に「1文字分の差分画像」の情報が文字数分だけ配列される。「1文字分の差分画像」は、データサイズ、文字の座標(例えば、文字の左上の点の座標と右下の点の座標)が記述される。そして、正の差分画像データのサイズが記され、その後に正の差分画像データが配置される。さらに、負の差分画像データのサイズが記され、その後に負の差分画像データが配置される。なお、差分画像データは、可逆圧縮によって圧縮されたデータである。
【0068】
なお、図11、図12から分かるように、図11の「1文字分のコード情報」と、図12の「1文字分の差分画像」には、それぞれ座標が記述されているので、各文字のコード情報と差分画像とが関連付けられていることになる。
【0069】
図6に戻り、ステップS18では、背景画像圧縮部22が、ステップS14で生成された圧縮背景データを格納手段30に格納するとともに、文字画像圧縮部24の格納部56(図4参照)が、圧縮文字データを格納手段30に格納する。
【0070】
次に、上記のようにして格納手段30に格納された圧縮背景データと圧縮文字データとを用いた文書画像の復元処理について、図13のフローチャートに沿って説明する。
【0071】
図13の処理では、まず、ステップS90において、取得部60が、ユーザからの文書画像の復元指示があったか否かを判断する。ここでの判断が否定されている間は、ステップS90が繰り返され、ステップS90の判断が肯定された段階で、ステップS91に移行する。
【0072】
ステップS91では、取得部60が、ユーザによる復元指示において指定された文書画像に対応する圧縮背景データを、格納手段30から取得する。次いで、ステップS92では、取得部60が、ユーザによる復元指示において指定された文書画像に対応する圧縮文字データを、格納手段30から取得する。
【0073】
次いで、ステップS93では、復元部62が、圧縮背景データを用いて、背景画像を復元、すなわち、メモリ(ここでは、便宜上メモリAとする)上に展開する。次いで、ステップS94では、復元部62が、文字画像を復元するサブルーチンを実行する。
【0074】
具体的には、復元部62は、図14のフローチャートに沿った処理を実行する。図14では、まず、ステップS102において、復元部62が、図11の圧縮文字データを取得する。
【0075】
次いで、ステップS104では、復元部62が、線形和画像をメモリAと異なるメモリB上に展開し、図11の圧縮文字データに記されている座標情報に従って、メモリAに上書きする。より具体的には、ステップS104では、復元部62は、まず、線形和画像をメモリBに展開し、圧縮文字データに記されている文字数分だけ線形和画像を作成する。このとき、復元部62は、圧縮文字データに記されているIDに基づいて、辞書DB58を探索して対応するサンプル画像を取得し、当該サンプル画像に重み係数を積算して順次足し合わせて線形和画像を作成する。
【0076】
次いで、ステップS106では、復元部62は、メモリB上に差分画像を展開する。ここで、差分画像データは可逆圧縮されているので、復元部62は、復号化して展開する。この場合、復元部62は、復号化された差分画像情報を用いて、メモリB上に差分画像の画素値を付加する作業を行う。なお、正の差分画像は足し合わせ、負の差分画像は差し引くこととする。なお、線形和画像の値が所定の閾値よりも小さいところは透明にする。
【0077】
次いで、ステップS108では、復元部62が、ステップS108において生成された文字画像を、カラー化する。このカラー化においては、復元部62は、文字画像データのうちの、色情報から得られる色相と彩度の値をそのまま用いて、文字画像をカラー化する。
【0078】
以上のようにして、ステップS102において取得された圧縮文字データから文字画像が復元されると、図14の全処理を終了し、図13のステップS96に移行する。なお、この段階においては、背景画像と文字画像とが合成された文書画像が復元されていることになる。
【0079】
ステップS96では、出力部64が復元された文書画像を図3の表示制御部46に対して出力する。以上のようにして、図13の処理が終了すると、表示制御部46が、ディスプレイ12上に文書画像を表示するので、ユーザは、文書画像を閲覧・利用等することが可能となる。
【0080】
以上、詳細に説明したように、本実施形態によると、文字画像取得部50が取得した文字画像の文字認識を文字認識部51が行い、線形和画像生成部53が、認識された文字に対応する複数のサンプル画像を辞書DB58から取得するとともに、当該複数のサンプル画像を用いた線形和画像を生成する。また、差分画像生成部55が、文字画像取得部50が取得した文字画像と線形和画像との差分画像を生成し、格納部56が、線形和画像と差分画像とを関連付けて、格納手段30に格納する。このように、本実施形態では、複数のサンプル画像を用いて、線形和画像を生成するので、文字画像が多様に変化していても、当該文字画像に近似した線形和画像を生成することができる。これにより、高精度(高品質)に文字画像を圧縮することができる。また、本実施形態では、文字画像に近似した線形和画像を生成することができることから、差分画像の容量を小さくすることができる。これにより、文字画像を低容量に圧縮することができるようになる。更に、たとえ文字認識精度が100%でなくても、本実施形態のように差分画像を用いることで、文字認識の誤りを補完することが可能であり、この点からも、高精度(高品質)な文字画像の圧縮が可能となる。
【0081】
ここで、比較例について説明する。図15(a)〜図15(c)には、文字画像をJPEG圧縮した場合の例(比較例1)が示されている。このうち、図15(a)の左図に示すように、JPEG圧縮を行った画像では、図15(a)の右図(拡大図)に示すように、文字パターンの周辺にブロックノイズが発生して視認性が著しく低下することがある。この場合、図15(b)に示すようにブロックノイズが発生することで、図15(c)に示す元画像と比較して、ずれが生じることになる。
【0082】
また、図16(a)〜図16(c)には、文字画像の文字の色を減らし複数枚の2値画像に可逆圧縮を施す例(比較例2)が示されている。このうち、図16(a)の左図に示すように、色を減らす処理を行った画像では、図16(a)の右図(拡大図)に示すように、文字パターンの一部が消失して視認性が著しく低下することがある。この場合、図16(b)に示すように、文字の一部が消失することで、図16(c)に示す元画像に対するずれが生じることになる。
【0083】
これに対し、本実施形態では、元画像を圧縮してもほぼ同一の画像を復元することができるので、文字の視認性を元画像と同等に維持することができるようになる。
【0084】
また、本実施形態では、線形和画像生成部53が、文字認識部51にて認識された文字に対応する複数のサンプル画像の各々に重み付けを行い、各サンプル画像の画素値と各サンプル画像の重み係数とを積算した値の和から線形和画像を生成する。このように、本実施形態では、重み係数を各サンプル画像ごとに決定することで、文字画像に高精度に類似(近似)する線形和画像を生成することができるようになる。
【0085】
また、本実施形態では、重み係数決定部54bは、文字画像の特徴ベクトルと、線形和による生成画像の特徴ベクトルとの距離が最小距離となるように、制約付き最小自乗問題の解として、各サンプル画像の重み係数を決定するので、適切な演算を行うことで、文字画像に高精度に類似(近似)する線形和画像を生成することができる。
【0086】
また、本実施形態では、同一の文字に対して、フォントの種類及び劣化度の少なくとも一方が異なる複数のサンプル画像が用意されているので、圧縮対象の文字画像が様々なフォントであったり、文字画像の劣化度が種々異なっていたりしていても、圧縮対象の文字画像に類似(近似)する線形和画像を生成することができる。
【0087】
また、本実施形態では、文字画像復元部42の取得部60が、格納手段70に格納されている線形和画像の情報(文字画像データ)と、差分画像の情報(差分画像データ)とを取得し、それらの情報から、復元部62が、文字画像を復元する。このように文字画像に高精度に類似する線形和画像と、差分画像を用いた復元を行うことで、元の文字画像を高精度に復元することが可能となる。
【0088】
なお、上記実施形態では、文書画像を圧縮した後、これを復元する際に、元の文書画像により近づけるように復元する場合について説明したが、これに限られるものではない。文書画像のうち、文字画像の部分が不鮮明な場合には、ユーザからの指示に応じて(又は自動で)、文字画像部分を鮮明に表示するようにしても良い。このような方法の具体例(変形例)について、以下説明する。
【0089】
図17には、変形例に係るPC10の機能ブロック図が示されている。この図17と図3とを比較すると分かるように、図17では、受付部としての鮮明度入力受付部96が設けられている点が、上記実施形態と異なっている。鮮明度入力受付部96は、ユーザがマウス16やキーボード14を介して、鮮明度の入力をした場合に、その入力を受け付けて、文字画像復元部42に対して出力する機能を有する。
【0090】
図18(a)には、本変形例におけるディスプレイ12の画面表示例が示されている。この図18(a)に示すように、本変形例では、画面下側に鮮明度コントロール用のスライダコントロール98が表示されている。ユーザは、このスライダコントロール98において、マウス16等を用いてツマミ99を左右方向にスライド操作することで、鮮明度の入力を行う。
【0091】
なお、本変形例の前提として、辞書DB58に登録されるサンプル画像のIDには、劣化度の情報が含まれているものとする。具体的には、IDを32ビットで表すものとすると、最初の4ビット(値は0から15までをとる)を劣化度に割り当てることとする。劣化度は、0を「劣化なし」とし、番号が大きくなるほど劣化するというように定義するものとする。また、IDの次の16ビットには文字コードを割り当て、残りの12ビットに、同じ文字コードに対する通し番号を割り当てる。例えば、「御」(文字コード:0x8CE4)という文字で、劣化度が1、通し番号が7であるならば、IDは、16進表示で「18CE4007」と表されることになる。なお、劣化度は、上記実施形態と同様、文字画像に対して作用させるガウシアンフィルタの分散に基づく値である。
【0092】
上記前提の下、文字画像復元部42は、鮮明度(鮮明度は0(低い)〜1(高い)の値をとるものとする)の入力を受け付けると、線形和画像の復元を開始する。ここでは、線形和画像の復元に用いるサンプル画像(重み係数)が4つあり、それらのIDに対し、図19(a)に示すような重み係数が設定されているものとする。
【0093】
文字画像復元部42は、線形和画像の復元に際し、劣化度が0でない画像の重み係数に、(1−鮮明度)を積算する。図19(b)には、鮮明度を0.8とした場合の計算結果が示されている。
【0094】
次いで、文字画像復元部42は、4つの重み係数の和が1になるように、各重み係数を正規化する。この正規化後の重み係数が、図19(c)に示されている。そして、文字画像復元部42は、図19(c)に示す正規化後の重み係数を用いて、線形和画像を生成する。これ以外の処理は、上記実施形態と同様となっている。
【0095】
このような鮮明度を考慮した処理を行うことで、劣化度が0の画像を優先して線形和画像を生成することができるので、図18(a)のような不鮮明な画像を、図18(b)に示すように鮮明にすることができる。これにより、元画像よりも鮮明な画像をディスプレイ12上に表示することが可能となる。
【0096】
なお、上記変形例では、劣化度が0でない画像の重み係数に対して、一律に(1−鮮明度)を積算する場合について説明したが、これに限られるものではない。例えば、劣化度(1〜15)を考慮して、劣化度が大きいほど重み係数が小さくなるような演算を、重み係数に対して施しても良い。
【0097】
なお、上記実施形態では、差分画像を生成する際に、ステップS42、S60において差分画像の画素値の総和の絶対値が所定の閾値thαよりも大きい場合に、サンプル画像を用いた圧縮を行わないこととする場合について説明した。しかしながら、これに限らず、差分画像の画素値の総和の大小にかかわらず、サンプル画像を用いた圧縮を常に行うこととしても良い。
【0098】
また、上記実施形態では、ステップS52、S70において、m行n列の画素値の絶対値が所定の閾値thβよりも小さい場合に、画素値を0にすることで、差分画像のデータ量を小さくすることとした。しかしながら、これに限られるものではなく、各画素の画素値が0に近いか否かにかかわらず、実際の画素値を維持することとしても良い。
【0099】
なお、上記実施形態では、文字画像がカラーである場合について説明したが、これに限らず、スキャナ18が読み取る文書画像はモノクロ画像であっても良い。文書画像が常にモノクロ画像である場合には、図4の色情報取得部52を省略するとともに、色情報取得部52の処理を省略しても良い。
【0100】
なお、上記実施形態では、スキャナ18を用いて文書画像を取得する場合について説明したが、これに限られるものではなく、文書画像は、インターネットなどのネットワークを介して取得しても良い。また、スキャナに代えて、デジタルカメラやスキャナ機能を有する複合機などから文書画像を取得しても良い。
【0101】
なお、上記実施形態では、1台のPCで、文書画像の圧縮と復元を行う場合について説明したが、これに限らず、一のPCで文書画像の圧縮を行い、他のPCで文書画像の復元を行うこととしても良い。この場合、一のPCと他のPCをインターネットやLAN(local area network)などのネットワークを介して接続しておき、当該ネットワークを介して圧縮背景データや圧縮文字データのやり取りを行うこととしても良い。あるいは、一のPCと他のPCとの間でのデータのやり取りに、USBメモリ等の可搬型記憶媒体を用いることとしても良い。この場合、一のPCと他のPCはネットワークを介して接続されていても良いし、接続されていなくても良い。
【0102】
なお、上記実施形態では、本件の文字画像圧縮プログラム及び文字画像復元プログラムが、PC10内に組み込まれ、図3の各部の各機能を実現する。しかしながら、これに限らず、例えば、インターネット等の通信網に接続されたサーバコンピュータを本件の文字画像圧縮装置及び文字画像復元装置とし、これに接続されたパーソナルコンピュータ等が有する格納手段に、圧縮文字データを格納するサービスをサーバコンピュータから提供するようにしても良い(ASP(Application Service Provider))。
【0103】
なお、上記の処理機能は、コンピュータによって実現することができる。その場合、処理装置が有すべき機能の処理内容を記述したプログラムが提供される。そのプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。
【0104】
プログラムを流通させる場合には、例えば、そのプログラムが記録されたDVD(Digital Versatile Disc)、CD−ROM(Compact Disc Read Only Memory)などの可搬型記録媒体の形態で販売される。また、プログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することもできる。
【0105】
プログラムを実行するコンピュータは、例えば、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、自己の記憶装置に格納する。そして、コンピュータは、自己の記憶装置からプログラムを読み取り、プログラムに従った処理を実行する。なお、コンピュータは、可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することもできる。また、コンピュータは、サーバコンピュータからプログラムが転送されるごとに、逐次、受け取ったプログラムに従った処理を実行することもできる。
【0106】
上述した実施形態は本発明の好適な実施の例である。但し、これに限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々変形実施可能である。
【0107】
なお、以上の説明に関して更に以下の付記を開示する。
(付記1) 文字画像を取得する文字画像取得部と、前記文字画像取得部で取得された前記文字画像の文字認識を行う文字認識部と、前記文字認識部にて認識された文字に対応する複数のサンプル画像を取得し、前記複数のサンプル画像を用いた線形和画像を生成する線形和画像生成部と、前記文字画像取得部が取得した前記文字画像と、前記線形和画像との差分画像を生成する差分画像生成部と、前記線形和画像の情報と、前記差分画像の情報とを関連付けて、格納手段に格納する格納部と、を備える文字画像圧縮装置。
(付記2) 前記線形和画像生成部は、前記複数のサンプル画像の各々に重み付けを行い、サンプル画像の画素値と各サンプル画像の重み係数とを積算した値の和から線形和画像を生成することを特徴とする付記1に記載の文字画像圧縮装置。
(付記3) 前記複数のサンプル画像は、同一の文字に関し、フォントの種類及び劣化度の少なくとも一方を異ならせた画像であることを特徴とする付記1又は2に記載の文字画像圧縮装置。
(付記4) 付記1〜3のいずれかに記載の文字画像圧縮装置の前記格納部が前記格納手段に格納した、前記線形和画像の情報と、前記差分画像の情報とを取得する取得部と、前記取得部が取得した情報から前記文字画像を復元する復元部と、を備える文字画像復元装置。
(付記5) 前記復元部が復元する前記文字画像の鮮明度の入力を受け付ける受付部を更に備え、前記復元部は、前記線形和画像の情報に含まれるサンプル画像の重み係数を、前記受付部が受け付けた前記鮮明度に基づいて変更することを特徴とする付記4に記載の文字画像復元装置。
(付記6) 前記復元部は、前記重み係数を変更する際に、前記サンプル画像の劣化度を考慮することを特徴とする付記5に記載の文字画像復元装置。
(付記7) コンピュータが、文字画像を取得する文字画像取得工程と、前記文字画像取得工程で取得された前記文字画像の文字認識を行う文字認識工程と、前記文字認識工程で認識された文字に対応する複数のサンプル画像を取得し、前記複数のサンプル画像を用いた線形和画像を生成する線形和画像生成工程と、前記文字画像取得工程で取得した前記文字画像と、前記線形和画像との差分画像を生成する差分画像生成工程と、前記線形和画像の情報と、前記差分画像の情報とを関連付けて、格納手段に格納する格納工程と、を実行する文字画像圧縮方法。
(付記8) 前記線形和画像生成工程では、前記複数のサンプル画像の各々に重み付けを行い、サンプル画像の画素値と各サンプル画像の重み係数とを積算した値の和から線形和画像を生成することを特徴とする付記7に記載の文字画像圧縮方法。
(付記9) 前記複数のサンプル画像は、同一の文字に関し、フォントの種類及び劣化度の少なくとも一方を異ならせた画像であることを特徴とする付記7又は8のいずれかに記載の文字画像圧縮方法。
(付記10) コンピュータが、付記7〜9のいずれかに記載の文字画像圧縮方法を用いて、前記格納手段に格納された、前記線形和画像の情報と、前記差分画像の情報とを取得する取得工程と、前記取得工程において取得された情報から前記文字画像を復元する復元工程と、を実行する文字画像復元方法。
(付記11) 前記復元工程で復元された前記文字画像の鮮明度の入力を受け付ける受付工程を更に含み、前記復元工程では、前記線形和画像の情報に含まれるサンプル画像の重み係数を、前記受付工程で受け付けた前記鮮明度に基づいて変更することを特徴とする付記10に記載の文字画像復元方法。
(付記12) 前記復元工程では、前記重み係数を変更する際に、前記サンプル画像の劣化度を考慮することを特徴とする付記11に記載の文字画像復元方法。
(付記13) コンピュータに、文字画像を取得する文字画像取得工程と、前記文字画像取得工程で取得された前記文字画像の文字認識を行う文字認識工程と、前記文字認識工程で認識された文字に対応する複数のサンプル画像を取得し、前記複数のサンプル画像を用いた線形和画像を生成する線形和画像生成工程と、前記文字画像取得工程で取得した前記文字画像と、前記線形和画像との差分画像を生成する差分画像生成工程と、前記線形和画像の情報と、前記差分画像の情報とを関連付けて、格納手段に格納する格納工程と、を実行させる文字画像圧縮プログラム。
(付記14) 前記線形和画像生成工程では、前記複数のサンプル画像の各々に重み付けを行い、サンプル画像の画素値と各サンプル画像の重み係数とを積算した値の和から線形和画像を生成することを特徴とする付記13に記載の文字画像圧縮プログラム。
(付記15) 前記複数のサンプル画像は、同一の文字に関し、フォントの種類及び劣化度の少なくとも一方を異ならせた画像であることを特徴とする付記13又は14に記載の文字画像圧縮プログラム。
(付記16) コンピュータに、付記13〜15のいずれかに記載の文字画像圧縮プログラムを用いて、前記格納手段に格納された、前記線形和画像の情報と、前記差分画像の情報とを取得する取得工程と、前記取得工程において取得された情報から前記文字画像を復元する復元工程と、を実行させる文字画像復元プログラム。
(付記17) 前記復元工程で復元される前記文字画像の鮮明度の入力を受け付ける受付工程を更に含み、前記復元工程では、前記線形和画像の情報に含まれるサンプル画像の重み係数を、前記受付工程で受け付けた前記鮮明度に基づいて変更することを特徴とする付記16に記載の文字画像復元プログラム。
(付記18) 前記復元工程では、前記重み係数を変更する際に、前記サンプル画像の劣化度を考慮することを特徴とする付記17に記載の文字画像復元プログラム。
【符号の説明】
【0108】
24 文字画像圧縮部(文字画像圧縮装置)
30 格納手段
42 文字画像復元部(文字画像復元装置)
50 文字画像取得部
51 文字認識部
53 線形和画像生成部
54c 画像生成部
55 差分画像生成部
56 格納部
60 取得部
62 復元部
【技術分野】
【0001】
本件は、文字画像圧縮装置及び文字画像復元装置、文字画像圧縮方法及び文字画像復元方法、並びに文字画像圧縮プログラム及び文字画像復元プログラムに関する。
【背景技術】
【0002】
文書画像を大量保存する場合や、例えば銀行業務のように窓口で取得した帳票画像を業務センター等へ大量送信する場合等においては、文書画像を高品質かつ低容量に圧縮できることが好ましい。
【0003】
一般に画像を圧縮する方式としてJPEG(Joint Photographic Experts Group)圧縮がある。しかし、文書画像に対してJPEG圧縮を行うと、文字パターンの周辺にブロックノイズが発生して視認性が大きく低下することがある。特に、元の文書画像の画質が劣悪な場合や文字が小さい場合などにおいて、JPEG圧縮を行うと文字が非常に見づらくなる。
【0004】
これに対し、最近では、例えば特許文献1のような技術を用いた圧縮方法が提案されている。特許文献1に記載の技術は、文書画像を文字画像と背景画像に分離して、それぞれに適した圧縮を行うというものである。具体的には、背景画像にはJPEG圧縮を施し、その一方で、文字画像に対しては、文字の色を減らし複数枚の2値画像に変換しそれらに対して可逆圧縮を施すというものである。
【0005】
更に、特許文献2のような、文字認識結果を用いた圧縮方法も提案されている。この技術では、文字認識結果の信頼性が高い文字を文字コードに置き換えて保存するというものである。また、特許文献3には、文字認識結果の文字コードに対して、文字画像と最も近い文字フォントを探索して近似画像とし、それを入力画像に対する予測画像とし、予測誤差を求めて符号化する技術が開示されている。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2005−159663号公報
【特許文献2】特開平8−295934号公報
【特許文献3】特開平10−178638号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、上記特許文献1の技術では、文字の色を減らすことで文字パターンの一部が消失するなどして、必ずしも視認性を改善できるとは限らない。また、特許文献2の技術のように文字認識を用いても、文字認識結果自体が100%信頼できるものではないため、誤った画像が復元される可能性がある。また、特許文献3の技術を用いても、取得する文書画像は大抵の場合劣化しているため、最も近いフォントの文字画像でも実際の画像との差分が大きくなってしまい、文字画像の高精度(高品質)な圧縮を実現できないおそれがある。
【0008】
そこで本件は上記の課題に鑑みてなされたものであり、高品質で、低容量に文字画像を圧縮することが可能な文字画像圧縮装置、文字画像圧縮方法及び文字画像圧縮プログラムを提供することを目的とする。また、本件は、高品質で、低容量に圧縮された文字画像を復元することが可能な文字画像復元装置、文字画像復元方法及び文字画像復元プログラムを提供することを目的とする。
【課題を解決するための手段】
【0009】
本明細書に記載の文字画像圧縮装置は、文字画像を取得する文字画像取得部と、前記文字画像取得部で取得された前記文字画像の文字認識を行う文字認識部と、前記文字認識部にて認識された文字に対応する複数のサンプル画像を取得し、前記複数のサンプル画像を用いた線形和画像を生成する線形和画像生成部と、前記文字画像取得部が取得した前記文字画像と、前記線形和画像との差分画像を生成する差分画像生成部と、前記線形和画像の情報と、前記差分画像の情報とを関連付けて、格納手段に格納する格納部と、を備える。
【0010】
本明細書に記載の文字画像復元装置は、本明細書に記載の文字画像圧縮装置の前記格納部が前記格納手段に格納した、前記線形和画像の情報と、前記差分画像の情報とを取得する取得部と、前記取得部が取得した情報から前記文字画像を復元する復元部と、を備える。
【0011】
本明細書に記載の文字画像圧縮方法は、コンピュータが、文字画像を取得する文字画像取得工程と、前記文字画像取得工程で取得された前記文字画像の文字認識を行う文字認識工程と、前記文字認識工程で認識された文字に対応する複数のサンプル画像を取得し、前記複数のサンプル画像を用いた線形和画像を生成する線形和画像生成工程と、前記文字画像取得工程で取得した前記文字画像と、前記線形和画像との差分画像を生成する差分画像生成工程と、前記線形和画像の情報と、前記差分画像の情報とを関連付けて、格納手段に格納する格納工程と、を実行する文字画像圧縮方法である。
【0012】
本明細書に記載の文字画像復元方法は、コンピュータが、本明細書に記載の文字画像圧縮方法を用いて、前記格納手段に格納された、前記線形和画像の情報と、前記差分画像の情報とを取得する取得工程と、前記取得工程において取得された情報から前記文字画像を復元する復元工程と、を実行する文字画像復元方法である。
【0013】
本明細書に記載の文字画像圧縮プログラムは、コンピュータに、文字画像を取得する文字画像取得工程と、前記文字画像取得工程で取得された前記文字画像の文字認識を行う文字認識工程と、前記文字認識工程で認識された文字に対応する複数のサンプル画像を取得し、前記複数のサンプル画像を用いた線形和画像を生成する線形和画像生成工程と、前記文字画像取得工程で取得した前記文字画像と、前記線形和画像との差分画像を生成する差分画像生成工程と、前記線形和画像の情報と、前記差分画像の情報とを関連付けて、格納手段に格納する格納工程と、を実行させる文字画像圧縮プログラムである。
【0014】
本明細書に記載の文字画像復元プログラムは、コンピュータに、本明細書に記載の文字画像圧縮プログラムを用いて、前記格納手段に格納された、前記線形和画像の情報と、前記差分画像の情報とを取得する取得工程と、前記取得工程において取得された情報から前記文字画像を復元する復元工程と、を実行させる文字画像復元プログラムである。
【発明の効果】
【0015】
本明細書に記載の文字画像圧縮装置、文字画像圧縮方法及び文字画像圧縮プログラムは、高品質で、低容量に文字画像を圧縮することができるという効果を奏する。また、本明細書に記載の文字画像復元装置、文字画像復元方法及び文字画像復元プログラムは、高品質で、低容量に圧縮された文字画像を復元することができるという効果を奏する。
【図面の簡単な説明】
【0016】
【図1】一実施形態に係る情報処理装置の構成を概略的に示す図である。
【図2】図1のPCのハードウェア構成を示す図である。
【図3】図1のPCの機能ブロック図が示されている。
【図4】文字画像圧縮部と、文字画像復元部の詳細な機能ブロック図である。
【図5】辞書DBのデータ構造を示す図である。
【図6】一実施形態の情報処理装置における文書画像圧縮処理の具体的な処理内容を示すフローチャートである。
【図7】図6のステップS16(文字画像圧縮のサブルーチン)における具体的処理を示すフローチャートである。
【図8】図8(a)〜図8(d)は、線形和画像の生成方法を説明するための図である。
【図9】図7のステップS28の具体的処理を示すフローチャートである。
【図10】図10(a)、図10(b)は、差分画像の生成方法を説明するための図である。
【図11】図11(a)は、圧縮文字データのデータ構造を模式的に示す図であり、図11(b)は、文字画像データのデータ構造を示す図である
【図12】差分画像データのデータ構造を示す図である。
【図13】文書画像の復元処理を示すフローチャートである。
【図14】図13のステップS94の具体的処理内容を示すフローチャートである。
【図15】図15(a)〜図15(c)は、比較例1を説明するための図である。
【図16】図16(a)〜図16(c)は、比較例2を説明するための図である。
【図17】変形例に係るPCの機能ブロック図である。
【図18】図18(a)は、変形例に係る表示例を示す図であり、図18(b)は、図18(a)の画像を鮮明にした状態を示す図である。
【図19】図19(a)〜図19(c)は、変形例における重み係数の計算手順を示す図である。
【発明を実施するための形態】
【0017】
以下、文字画像圧縮装置及び文字画像復元装置の一実施形態について詳細に説明する。図1には、一実施形態に係る情報処理装置100の構成が概略的に示されている。この図1に示すように、情報処理装置100は、PC10と、ディスプレイ12と、キーボード14と、マウス16と、スキャナ18とを備える。
【0018】
PC10は、外部から入力される文書画像を圧縮して保持するとともに、ユーザの指示に応じて、保存している文書画像を復元して、ディスプレイ12に表示する機能を有している。
【0019】
図2には、PC10のハードウェア構成が示されている。この図2に示すように、PC10は、CPU90、ROM91、RAM92、記憶部(ここではHDD(Hard Disk Drive))93、入出力部94等を備えており、これら構成各部は、バス95に接続されている。PC10では、ROM91あるいはHDD93に格納されている各種プログラム(文字画像圧縮プログラム及び文字画像復元プログラムを含む)をCPU90が実行することにより、図3の各部の機能が実現される。また、入出力部94には、図1のディスプレイ12、キーボード14、マウス16、スキャナ18等が接続されている。
【0020】
図1に戻り、ディスプレイ12は、液晶ディスプレイ等の表示装置であり、PC10から入力される画像を表示する。キーボード14及びマウス16は、ユーザがPC10への指示を入力する際に用いられるユーザインタフェースである。スキャナ18は、文字や図形等が記載された紙文書の画像(文書画像と呼ぶ)を読み取り、PC10に入力する装置である。
【0021】
図3には、PC10の機能ブロック図が示されている。この図3に示すように、PC10は、文書画像分離部20と、背景画像圧縮部22と、文字画像圧縮装置としての文字画像圧縮部24と、格納手段30と、背景画像復元部40と、文字画像復元装置としての文字画像復元部42と、文書画像生成部44と、表示制御部46と、を有する。
【0022】
文書画像分離部20は、スキャナ18にて読み込まれた文書画像を、背景画像と文字画像とに分離する。ここで、文字画像とは、文書画像に含まれる文字を1文字ずつ取り出した画像である。また、背景画像は、文字画像以外の部分の画像である。
【0023】
背景画像圧縮部22は、文書画像分離部20で分離された背景画像をJPEG形式などにより圧縮して、当該圧縮により生成された圧縮背景データを格納手段30に格納する。文字画像圧縮部24は、辞書DB58に格納されているデータを用いて、文書画像分離部20で分離された文字画像を後述する方法で圧縮する。また、文字画像圧縮部24は、圧縮により生成された圧縮文字データを、格納手段30に格納する。なお、文字画像圧縮部24の詳細については、後述する。
【0024】
ここで、格納手段30及び辞書DB58は、図2のHDD93により実現されている。辞書DB58には、複数の文字に対して、複数のフォント、複数の劣化度の画像(サンプル画像(図8(b)参照)と呼ぶ)が格納されている。
【0025】
背景画像復元部40は、格納手段30に格納されている圧縮背景データを読み出し、当該圧縮背景データから、背景画像を復元する。文字画像復元部42は、格納手段30に格納されている圧縮文字データを読み出し、当該圧縮文字データと、辞書DB58に格納されているデータとに基づいて、文字画像を復元する。なお、文字画像復元部42の詳細については、後述する。
【0026】
文書画像生成部44は、背景画像復元部40で復元された背景画像と、文字画像復元部42で復元された文字画像とを用いて、文書画像を生成(復元)する。表示制御部46は、文書画像生成部44で生成された文書画像を、ディスプレイ12に表示する。
【0027】
図4には、文字画像圧縮部24及び文字画像復元部42の詳細な機能ブロック図が示されている。図4に示すように、文字画像圧縮部24は、文字画像取得部50と、文字認識部51と、色情報取得部52と、線形和画像生成部53と、差分画像生成部55と、格納部56と、を備える。
【0028】
文字画像取得部50は、図3の文書画像分離部20において文書画像から分離された文字画像を取得する。文字認識部51は、文字画像取得部50で取得された文字画像の文字認識を行う。色情報取得部52は、文字画像から色情報(ここでは、色相と彩度)を取得する。
【0029】
線形和画像生成部53は、複数のサンプル画像の各々に重み付けを行い、サンプル画像の画素値と各サンプル画像の重み係数とを積算した値の和から線形和画像を生成する。より具体的には、サンプル画像取得部54aと、重み係数決定部54bと、画像生成部54cと、を有している。サンプル画像取得部54aは、文字認識部51にて認識された文字に対応する複数のサンプル画像を辞書DB58から取得する。また、重み係数決定部54bは、複数のサンプル画像を用いた線形和による生成画像が、文字画像に類似するように、各サンプル画像の重み係数を決定する。画像生成部54cは、複数のサンプル画像と各サンプル画像の重み係数とを積算した値の和から、線形和画像を生成する。
【0030】
差分画像生成部55は、文字画像取得部50が取得した文字画像と、線形和画像生成部53で生成された線形和画像との差分画像を生成するとともに、差分画像を可逆圧縮して差分画像データを生成する。
【0031】
格納部56は、線形和画像の情報(線形和画像生成に用いたサンプル画像の情報及び重み係数を含む文字画像データ)と、差分画像の情報(差分画像データ)とを関連付けて、格納手段30に格納する。
【0032】
図3の文字画像復元部42は、図4に示すように、取得部60と、復元部62と、出力部64と、を備えている。
【0033】
取得部60は、格納手段30に格納されている情報のうち、線形和画像の情報と、差分画像の情報とを取得する。復元部62は、取得部60が取得した線形和画像の情報と辞書DB58のサンプル画像とから生成される線形和画像と、差分画像の情報から生成される差分画像とから文字画像を復元する。出力部64は、復元部62において復元された文字画像を図3の文書画像生成部44に対して出力する。
【0034】
次に、辞書DB58のデータ構造について、図5に基づいて説明する。図5に示すように、辞書DB58には、「文字種類数」の項目と、「文字種類1」〜「文字種類p」の項目が設けられている。なお、図5では、「文字種類数」の項目には、pが入力されることになる。ここで、文字種類とは、文字そのもの(例えば、「あ」、「い」…など)を意味し、フォントや画像の劣化度が異なっているものも含めて、1つの文字種類となる。文字種類は、一般に、文字カテゴリとも呼ばれ、文字種類数は、通常、日本語であれば約4000程度となる。
【0035】
また、辞書DB58には、図5に示すように、文字種類ごとに、「文字コード」の項目、「文字画像数」の項目が設けられている。また、複数の文字画像に対応して、「ID」の項目、「文字画像(データ)」の項目、「文字特徴(ベクトル)」の項目が、設けられている。「文字画像」の項目には、例えば、図8(b)に示すような、フォントや画像の劣化度が異なる画像(「サンプル画像」とも呼ぶ)が登録され、「ID」の項目には、図8(b)に示すA1〜D3などのIDが登録される。
【0036】
なお、文字画像としては正規化された画像、例えばグレー画像が登録される。また、文字特徴ベクトルの次元数も文字画像によらず一定である。したがって、文字画像毎の情報は固定の大きさの領域となる。なお、文字特徴ベクトルは、グレー画像ではなく、2値画像から得られるものでもよい。また、画像の劣化度は、例えば、文字画像に対してガウシアンフィルタの分散を多段階に変更しつつ作用させることにより得ることができる。
【0037】
次に、本実施形態の情報処理装置100における文書画像圧縮処理と文書画像復元処理の詳細について、図6〜図14に基づいて説明する。
【0038】
図6には、本実施形態の情報処理装置100における文書画像圧縮処理の具体的な処理内容が、フローチャートにて示されている。図6の処理では、まず、ステップS10において、文書画像分離部20が、スキャナ18にて読み込まれた文書画像を取得する。次いで、ステップS12では、文書画像分離部20が、文字画像と背景画像とを分離する。この分離方法としては、例えば、特開2005−159663号公報に記載されているような方法を採用することができる。
【0039】
次いで、ステップS14では、背景画像圧縮部22が、背景画像を圧縮する処理を実行する。この場合、背景画像圧縮部22は、例えばJPEG形式により背景画像を圧縮し、圧縮背景データを生成するものとする。
【0040】
次いで、ステップS16では、文字画像圧縮部24が、文字画像圧縮のサブルーチンを実行する。この文字画像圧縮のサブルーチンでは、図7の処理が実行される。
【0041】
図7には、ステップS16(文字画像圧縮のサブルーチン)における具体的処理がフローチャートにて示されている。この図7の処理では、まず、ステップS20において、文字画像圧縮部24の文字画像取得部50が、文書画像分離部20にて文書画像から分離された全ての文字画像を取得する。ここで取得される文字画像は、カラーの文字画像であるものとする。
【0042】
次いで、ステップS22では、文字認識部51が、ステップS20において取得された文字画像(カラーの文字画像)を用いて文字認識処理を行う。その結果得られる文字認識結果は、認識結果文字数と各認識結果の文字情報である。認識結果の文字情報は、文字コードと、文字座標とを含む。
【0043】
次いで、ステップS23では、色情報取得部52が、未処理の文字画像を取得する。次いで、ステップS24では、色情報取得部52が、取得した文字画像の色情報を取得する。ここで、文字画像の色情報は、色相と彩度の値である。この場合、まず、色情報取得部52は、カラーの元画像(Iとする)から明度画像(Fとする)を生成する。そして、色情報取得部52は、文字画像の画素のうち、明度値が所定の閾値よりも大きい画素、すなわち、文字画像をグレー画像としたときに所定以上黒く表示される画素に関して、色相と彩度の値を計算してサンプリングする。また、色情報取得部52は、当該サンプリングの結果、最も出現頻度の大きい色相と彩度の値を求め、これを、文字画像の色情報とする。なお、色彩と彩度の取得方法は、上記方法に限らず、色情報取得部52は、文字画像の画素の色彩と彩度の平均値を求め、これを文字画像の色情報として取得することとしても良い。
【0044】
次いで、ステップS26では、線形和画像生成部53が、線形和画像を生成する。以下、線形和画像の生成方法について、図8(a)〜図8(d)に基づいて、詳細に説明する。
【0045】
図8(a)には、1文字分の文字画像(明度画像)Fの一例として、「証」の文字の文字画像が示されている。この文字画像Fの文字認識(ステップS22)の結果、正しく「証」と認識された場合には、サンプル画像取得部54aは、辞書DB58から「証」の文字に対応する複数のサンプル画像を、図8(b)のように取得する。次いで、重み係数決定部54bは、文字画像Fに関し、サンプル画像との距離を算出し、距離の近い上位N個のサンプル画像f1、f2、…、fNを決定する。ここで、文字画像Fとサンプル画像との距離は、サンプル画像の文字特徴ベクトルを用いた識別関数値を利用して、算出することができる。なお、図8(c)では、N=3の例が示されている。
【0046】
次いで、重み係数決定部54bは、文字画像Fに対して、線形和画像の最適類似画像を求める。具体的には、上位N個のサンプル画像f1、f2、…、fNに対する重み係数α1、α2、…、αNを、次式(1)から求める。
【0047】
【数1】
【0048】
ここで、上式(1)の問題を、制約付き最小自乗問題と捉えれば、その解として重み係数α1、α2、…、αNを計算することができる。具体的には、重み係数決定部54bは、次式(2)に基づいて、α1、α2、…、αNを計算する。
【0049】
【数2】
なお、上式(2)では、C={(F−fk)・(F−fl)}であるものとする。
【0050】
以上のようにして、重み係数α1、α2、…、αNを決定すると、画像生成部54cは、線形和画像を生成することができる。一例として、図8(c)に示すように、サンプル画像のIDがA3の重み係数が0.60、A2の重み係数が0.31、C3の重み係数が0.09であったとするならば、画像生成部54cは、各サンプル画像の画素値と各サンプル画像の重み係数とを積算した値の和から、図8(d)のような線形和画像を生成することができる。このように線形和画像が生成された後は、図7のステップS28に移行する。
【0051】
図7のステップS28では、差分画像生成部55が、差分画像を生成するサブルーチンを実行する。このサブルーチンでは、差分画像生成部55は、図9のような処理を実行する。なお、ステップS28の処理は、簡単に言えば、図10(a)のように文字画像FからステップS26で生成された線形和画像を差し引いて、図10(b)のような差分画像を生成する処理である。
【0052】
図9の処理では、まずステップS40において、差分画像生成部55が、正の差分画像及び負の差分画像を生成する。なお、正の差分画像とは、線形和画像を元の文字画像に近づけるために、より黒くする必要のある画素を示す画像であり、負の差分画像とは、線形和画像を元の文字画像に近づけるために、より白くする必要のある画素を示す画像である。
【0053】
具体的には、差分画像生成部55は、次式(3)から差分画像Dを求める。
【0054】
【数3】
【0055】
次いで、差分画像生成部55は、Dを正の差分画像D+と負の差分画像D-に分解する。具体的には、差分画像生成部55は、次式(4)、(5)から、D+とD-を求める。なお、mは、行方向の画素番号を示し、nは列方向の画素番号を示す。
【0056】
【数4】
【0057】
【数5】
【0058】
次いで、ステップS42では、正の差分画像全体の画素値(画素値の総和)が、所定の閾値thα以下であるか否かを判断する。ここで、閾値thαとしては、例えば、線形和画像が正しく生成されているときにとりうる差分画像の画素値の範囲(事前の実験やシミュレーションにより求められる)のうちの最大値を採用することとする。ここでの判断が否定された場合、すなわち、正の差分画像が大きすぎて、ステップS26において適切な線形和画像が生成されていない可能性が高いと判断される場合には、ステップS78に移行する。ステップS78では、正の差分画像を文字画像Fに設定するとともに、負の差分画像を0(Null)に設定し、かつ重み係数をクリアする。このようにステップS78を経た場合には、前述したステップS26において生成された線形和画像を用いた画像圧縮を行うことなく、文字画像そのものを正の差分画像として扱うことになる。このステップS78が行われた後は、図9の全処理を終了して、図7のステップS30に移行する。
【0059】
一方、ステップS42の判断が肯定された場合には、ステップS44に移行する。ステップS44では、差分画像生成部55が、差分画像の画素の行番号m(0≦m≦ymax)を0に設定する(m=0)。次いで、ステップS46では、差分画像生成部55が、行番号mが行番号の最大値ymax以下か否かを判断する。ここでの判断が肯定された場合には、ステップS48に移行するが、否定された場合には、ステップS60に移行する。ステップS48に移行した場合、差分画像生成部55は、差分画像の画素の列番号n(0≦n≦xmax)を0に設定する(n=0)。次いで、ステップS50では、差分画像生成部55が、列番号nが列番号の最大値xmax以下か否かを判断する。ここでの判断が肯定された場合には、ステップS52に移行するが、否定された場合には、ステップS58においてmを1インクリメント(m←m+1)した後、ステップS46に戻る。
【0060】
ステップS52に移行した場合、差分画像生成部55は、m行n列の画素値が所定の閾値thβ以上か否かを判断する。ここで、閾値thβとしては、画素の値を0に近似しても復元した画像と圧縮前の画像との間に見た目上ほとんど差異が生じない程度の画素の値を採用することができる。ここでの判断が否定された場合、すなわち、m行n列の画素値が閾値thβよりも小さく、ほぼ0と看做せる場合には、ステップS54において、差分画像生成部55が、m行n列の画素値を0に設定して、ステップS56に移行する。このように、m行n列の画素値がほぼ0と看做せるときに画素値を0とすることで、差分画像のデータ量を小さくすることができる。
【0061】
一方、ステップS52の判断が肯定された場合には、差分画像生成部55は、ステップS54を経ずに、すなわち、m行n列の画素値を維持したまま、ステップS56に移行する。
【0062】
ステップS56では、差分画像生成部55は、列番号nを1インクリメントした後に、ステップS50に戻る。その後は、差分画像生成部55が、ステップS46〜S56を繰り返すことで、0行0列の画素からymax行xmax列の画素までの処理を実行し、ステップS46の判断が否定された段階で、ステップS60に移行する。
【0063】
なお、これ以降のステップS60〜ステップS76の処理は、負の差分画像に対する処理であるが、前述した、ステップS42〜ステップS58までの正の差分画像に対する処理と同様に行われる。なお、ステップS60では、負の差分画像全体の画素値(画素値の総和)の絶対値と閾値thαとを比較し、ステップS70では、m行n列の画素値の絶対値と閾値thβとを比較している点が、前述した正の差分画像に対する処理と異なっている。ステップS60の判断が否定された場合には、ステップS78の処理を経て、図9の全処理を終了し、ステップS64の判断が否定された場合には、ステップS78を経ずに、図9の全処理を終了する。
【0064】
図9の全処理が終了すると、図7のステップS29に移行する。ステップS29では、差分画像生成部55が、ステップS28で生成された差分画像を可逆圧縮して、差分画像の情報(差分画像データ)を生成する。次いで、ステップS30では、色情報取得部52が、未処理の全文字の取得が終了したか否かを判断する。ここでの判断が否定された場合には、ステップS23に戻り、ステップS30の判断が肯定されるまで、ステップS23〜S30の処理・判断を繰り返す。一方、ステップS30の判断が肯定された場合には、図7の全処理を終了し、図6のステップS18に移行する。なお、図7の処理を終了した段階で生成された各データを、「圧縮文字データ」と呼ぶものとする。すなわち、図11(a)に模式的に示すように、圧縮文字データは、線形和画像生成に用いられるサンプル画像の情報や重み係数、色情報などを含む文字画像データと、差分画像データとを含んでいる。
【0065】
ここで、図11(a)に示す文字画像データと、差分画像データについて説明する。
【0066】
文字画像データは、図11(b)に示すように、先頭に「文字数」の項目があり、その後に「1文字分のコード情報」の項目が文字数分だけ配列される。「1文字分のコード情報」の項目には、「文字の座標」(例えば、文字の左上の点の座標と右下の点の座標)、「文字の色情報」、「文字コード」が記述される。また、線形和画像を生成するのに用いた重み係数の個数が記述されるとともに、重み係数に対応するサンプル画像のIDとその重み係数が記述される。なお、文字の色情報は、色相と彩度の2つの数値からなる。
【0067】
一方、差分画像データは、図12に示すように、先頭に「文字数」の項目があり、その後に「1文字分の差分画像」の情報が文字数分だけ配列される。「1文字分の差分画像」は、データサイズ、文字の座標(例えば、文字の左上の点の座標と右下の点の座標)が記述される。そして、正の差分画像データのサイズが記され、その後に正の差分画像データが配置される。さらに、負の差分画像データのサイズが記され、その後に負の差分画像データが配置される。なお、差分画像データは、可逆圧縮によって圧縮されたデータである。
【0068】
なお、図11、図12から分かるように、図11の「1文字分のコード情報」と、図12の「1文字分の差分画像」には、それぞれ座標が記述されているので、各文字のコード情報と差分画像とが関連付けられていることになる。
【0069】
図6に戻り、ステップS18では、背景画像圧縮部22が、ステップS14で生成された圧縮背景データを格納手段30に格納するとともに、文字画像圧縮部24の格納部56(図4参照)が、圧縮文字データを格納手段30に格納する。
【0070】
次に、上記のようにして格納手段30に格納された圧縮背景データと圧縮文字データとを用いた文書画像の復元処理について、図13のフローチャートに沿って説明する。
【0071】
図13の処理では、まず、ステップS90において、取得部60が、ユーザからの文書画像の復元指示があったか否かを判断する。ここでの判断が否定されている間は、ステップS90が繰り返され、ステップS90の判断が肯定された段階で、ステップS91に移行する。
【0072】
ステップS91では、取得部60が、ユーザによる復元指示において指定された文書画像に対応する圧縮背景データを、格納手段30から取得する。次いで、ステップS92では、取得部60が、ユーザによる復元指示において指定された文書画像に対応する圧縮文字データを、格納手段30から取得する。
【0073】
次いで、ステップS93では、復元部62が、圧縮背景データを用いて、背景画像を復元、すなわち、メモリ(ここでは、便宜上メモリAとする)上に展開する。次いで、ステップS94では、復元部62が、文字画像を復元するサブルーチンを実行する。
【0074】
具体的には、復元部62は、図14のフローチャートに沿った処理を実行する。図14では、まず、ステップS102において、復元部62が、図11の圧縮文字データを取得する。
【0075】
次いで、ステップS104では、復元部62が、線形和画像をメモリAと異なるメモリB上に展開し、図11の圧縮文字データに記されている座標情報に従って、メモリAに上書きする。より具体的には、ステップS104では、復元部62は、まず、線形和画像をメモリBに展開し、圧縮文字データに記されている文字数分だけ線形和画像を作成する。このとき、復元部62は、圧縮文字データに記されているIDに基づいて、辞書DB58を探索して対応するサンプル画像を取得し、当該サンプル画像に重み係数を積算して順次足し合わせて線形和画像を作成する。
【0076】
次いで、ステップS106では、復元部62は、メモリB上に差分画像を展開する。ここで、差分画像データは可逆圧縮されているので、復元部62は、復号化して展開する。この場合、復元部62は、復号化された差分画像情報を用いて、メモリB上に差分画像の画素値を付加する作業を行う。なお、正の差分画像は足し合わせ、負の差分画像は差し引くこととする。なお、線形和画像の値が所定の閾値よりも小さいところは透明にする。
【0077】
次いで、ステップS108では、復元部62が、ステップS108において生成された文字画像を、カラー化する。このカラー化においては、復元部62は、文字画像データのうちの、色情報から得られる色相と彩度の値をそのまま用いて、文字画像をカラー化する。
【0078】
以上のようにして、ステップS102において取得された圧縮文字データから文字画像が復元されると、図14の全処理を終了し、図13のステップS96に移行する。なお、この段階においては、背景画像と文字画像とが合成された文書画像が復元されていることになる。
【0079】
ステップS96では、出力部64が復元された文書画像を図3の表示制御部46に対して出力する。以上のようにして、図13の処理が終了すると、表示制御部46が、ディスプレイ12上に文書画像を表示するので、ユーザは、文書画像を閲覧・利用等することが可能となる。
【0080】
以上、詳細に説明したように、本実施形態によると、文字画像取得部50が取得した文字画像の文字認識を文字認識部51が行い、線形和画像生成部53が、認識された文字に対応する複数のサンプル画像を辞書DB58から取得するとともに、当該複数のサンプル画像を用いた線形和画像を生成する。また、差分画像生成部55が、文字画像取得部50が取得した文字画像と線形和画像との差分画像を生成し、格納部56が、線形和画像と差分画像とを関連付けて、格納手段30に格納する。このように、本実施形態では、複数のサンプル画像を用いて、線形和画像を生成するので、文字画像が多様に変化していても、当該文字画像に近似した線形和画像を生成することができる。これにより、高精度(高品質)に文字画像を圧縮することができる。また、本実施形態では、文字画像に近似した線形和画像を生成することができることから、差分画像の容量を小さくすることができる。これにより、文字画像を低容量に圧縮することができるようになる。更に、たとえ文字認識精度が100%でなくても、本実施形態のように差分画像を用いることで、文字認識の誤りを補完することが可能であり、この点からも、高精度(高品質)な文字画像の圧縮が可能となる。
【0081】
ここで、比較例について説明する。図15(a)〜図15(c)には、文字画像をJPEG圧縮した場合の例(比較例1)が示されている。このうち、図15(a)の左図に示すように、JPEG圧縮を行った画像では、図15(a)の右図(拡大図)に示すように、文字パターンの周辺にブロックノイズが発生して視認性が著しく低下することがある。この場合、図15(b)に示すようにブロックノイズが発生することで、図15(c)に示す元画像と比較して、ずれが生じることになる。
【0082】
また、図16(a)〜図16(c)には、文字画像の文字の色を減らし複数枚の2値画像に可逆圧縮を施す例(比較例2)が示されている。このうち、図16(a)の左図に示すように、色を減らす処理を行った画像では、図16(a)の右図(拡大図)に示すように、文字パターンの一部が消失して視認性が著しく低下することがある。この場合、図16(b)に示すように、文字の一部が消失することで、図16(c)に示す元画像に対するずれが生じることになる。
【0083】
これに対し、本実施形態では、元画像を圧縮してもほぼ同一の画像を復元することができるので、文字の視認性を元画像と同等に維持することができるようになる。
【0084】
また、本実施形態では、線形和画像生成部53が、文字認識部51にて認識された文字に対応する複数のサンプル画像の各々に重み付けを行い、各サンプル画像の画素値と各サンプル画像の重み係数とを積算した値の和から線形和画像を生成する。このように、本実施形態では、重み係数を各サンプル画像ごとに決定することで、文字画像に高精度に類似(近似)する線形和画像を生成することができるようになる。
【0085】
また、本実施形態では、重み係数決定部54bは、文字画像の特徴ベクトルと、線形和による生成画像の特徴ベクトルとの距離が最小距離となるように、制約付き最小自乗問題の解として、各サンプル画像の重み係数を決定するので、適切な演算を行うことで、文字画像に高精度に類似(近似)する線形和画像を生成することができる。
【0086】
また、本実施形態では、同一の文字に対して、フォントの種類及び劣化度の少なくとも一方が異なる複数のサンプル画像が用意されているので、圧縮対象の文字画像が様々なフォントであったり、文字画像の劣化度が種々異なっていたりしていても、圧縮対象の文字画像に類似(近似)する線形和画像を生成することができる。
【0087】
また、本実施形態では、文字画像復元部42の取得部60が、格納手段70に格納されている線形和画像の情報(文字画像データ)と、差分画像の情報(差分画像データ)とを取得し、それらの情報から、復元部62が、文字画像を復元する。このように文字画像に高精度に類似する線形和画像と、差分画像を用いた復元を行うことで、元の文字画像を高精度に復元することが可能となる。
【0088】
なお、上記実施形態では、文書画像を圧縮した後、これを復元する際に、元の文書画像により近づけるように復元する場合について説明したが、これに限られるものではない。文書画像のうち、文字画像の部分が不鮮明な場合には、ユーザからの指示に応じて(又は自動で)、文字画像部分を鮮明に表示するようにしても良い。このような方法の具体例(変形例)について、以下説明する。
【0089】
図17には、変形例に係るPC10の機能ブロック図が示されている。この図17と図3とを比較すると分かるように、図17では、受付部としての鮮明度入力受付部96が設けられている点が、上記実施形態と異なっている。鮮明度入力受付部96は、ユーザがマウス16やキーボード14を介して、鮮明度の入力をした場合に、その入力を受け付けて、文字画像復元部42に対して出力する機能を有する。
【0090】
図18(a)には、本変形例におけるディスプレイ12の画面表示例が示されている。この図18(a)に示すように、本変形例では、画面下側に鮮明度コントロール用のスライダコントロール98が表示されている。ユーザは、このスライダコントロール98において、マウス16等を用いてツマミ99を左右方向にスライド操作することで、鮮明度の入力を行う。
【0091】
なお、本変形例の前提として、辞書DB58に登録されるサンプル画像のIDには、劣化度の情報が含まれているものとする。具体的には、IDを32ビットで表すものとすると、最初の4ビット(値は0から15までをとる)を劣化度に割り当てることとする。劣化度は、0を「劣化なし」とし、番号が大きくなるほど劣化するというように定義するものとする。また、IDの次の16ビットには文字コードを割り当て、残りの12ビットに、同じ文字コードに対する通し番号を割り当てる。例えば、「御」(文字コード:0x8CE4)という文字で、劣化度が1、通し番号が7であるならば、IDは、16進表示で「18CE4007」と表されることになる。なお、劣化度は、上記実施形態と同様、文字画像に対して作用させるガウシアンフィルタの分散に基づく値である。
【0092】
上記前提の下、文字画像復元部42は、鮮明度(鮮明度は0(低い)〜1(高い)の値をとるものとする)の入力を受け付けると、線形和画像の復元を開始する。ここでは、線形和画像の復元に用いるサンプル画像(重み係数)が4つあり、それらのIDに対し、図19(a)に示すような重み係数が設定されているものとする。
【0093】
文字画像復元部42は、線形和画像の復元に際し、劣化度が0でない画像の重み係数に、(1−鮮明度)を積算する。図19(b)には、鮮明度を0.8とした場合の計算結果が示されている。
【0094】
次いで、文字画像復元部42は、4つの重み係数の和が1になるように、各重み係数を正規化する。この正規化後の重み係数が、図19(c)に示されている。そして、文字画像復元部42は、図19(c)に示す正規化後の重み係数を用いて、線形和画像を生成する。これ以外の処理は、上記実施形態と同様となっている。
【0095】
このような鮮明度を考慮した処理を行うことで、劣化度が0の画像を優先して線形和画像を生成することができるので、図18(a)のような不鮮明な画像を、図18(b)に示すように鮮明にすることができる。これにより、元画像よりも鮮明な画像をディスプレイ12上に表示することが可能となる。
【0096】
なお、上記変形例では、劣化度が0でない画像の重み係数に対して、一律に(1−鮮明度)を積算する場合について説明したが、これに限られるものではない。例えば、劣化度(1〜15)を考慮して、劣化度が大きいほど重み係数が小さくなるような演算を、重み係数に対して施しても良い。
【0097】
なお、上記実施形態では、差分画像を生成する際に、ステップS42、S60において差分画像の画素値の総和の絶対値が所定の閾値thαよりも大きい場合に、サンプル画像を用いた圧縮を行わないこととする場合について説明した。しかしながら、これに限らず、差分画像の画素値の総和の大小にかかわらず、サンプル画像を用いた圧縮を常に行うこととしても良い。
【0098】
また、上記実施形態では、ステップS52、S70において、m行n列の画素値の絶対値が所定の閾値thβよりも小さい場合に、画素値を0にすることで、差分画像のデータ量を小さくすることとした。しかしながら、これに限られるものではなく、各画素の画素値が0に近いか否かにかかわらず、実際の画素値を維持することとしても良い。
【0099】
なお、上記実施形態では、文字画像がカラーである場合について説明したが、これに限らず、スキャナ18が読み取る文書画像はモノクロ画像であっても良い。文書画像が常にモノクロ画像である場合には、図4の色情報取得部52を省略するとともに、色情報取得部52の処理を省略しても良い。
【0100】
なお、上記実施形態では、スキャナ18を用いて文書画像を取得する場合について説明したが、これに限られるものではなく、文書画像は、インターネットなどのネットワークを介して取得しても良い。また、スキャナに代えて、デジタルカメラやスキャナ機能を有する複合機などから文書画像を取得しても良い。
【0101】
なお、上記実施形態では、1台のPCで、文書画像の圧縮と復元を行う場合について説明したが、これに限らず、一のPCで文書画像の圧縮を行い、他のPCで文書画像の復元を行うこととしても良い。この場合、一のPCと他のPCをインターネットやLAN(local area network)などのネットワークを介して接続しておき、当該ネットワークを介して圧縮背景データや圧縮文字データのやり取りを行うこととしても良い。あるいは、一のPCと他のPCとの間でのデータのやり取りに、USBメモリ等の可搬型記憶媒体を用いることとしても良い。この場合、一のPCと他のPCはネットワークを介して接続されていても良いし、接続されていなくても良い。
【0102】
なお、上記実施形態では、本件の文字画像圧縮プログラム及び文字画像復元プログラムが、PC10内に組み込まれ、図3の各部の各機能を実現する。しかしながら、これに限らず、例えば、インターネット等の通信網に接続されたサーバコンピュータを本件の文字画像圧縮装置及び文字画像復元装置とし、これに接続されたパーソナルコンピュータ等が有する格納手段に、圧縮文字データを格納するサービスをサーバコンピュータから提供するようにしても良い(ASP(Application Service Provider))。
【0103】
なお、上記の処理機能は、コンピュータによって実現することができる。その場合、処理装置が有すべき機能の処理内容を記述したプログラムが提供される。そのプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。
【0104】
プログラムを流通させる場合には、例えば、そのプログラムが記録されたDVD(Digital Versatile Disc)、CD−ROM(Compact Disc Read Only Memory)などの可搬型記録媒体の形態で販売される。また、プログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することもできる。
【0105】
プログラムを実行するコンピュータは、例えば、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、自己の記憶装置に格納する。そして、コンピュータは、自己の記憶装置からプログラムを読み取り、プログラムに従った処理を実行する。なお、コンピュータは、可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することもできる。また、コンピュータは、サーバコンピュータからプログラムが転送されるごとに、逐次、受け取ったプログラムに従った処理を実行することもできる。
【0106】
上述した実施形態は本発明の好適な実施の例である。但し、これに限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々変形実施可能である。
【0107】
なお、以上の説明に関して更に以下の付記を開示する。
(付記1) 文字画像を取得する文字画像取得部と、前記文字画像取得部で取得された前記文字画像の文字認識を行う文字認識部と、前記文字認識部にて認識された文字に対応する複数のサンプル画像を取得し、前記複数のサンプル画像を用いた線形和画像を生成する線形和画像生成部と、前記文字画像取得部が取得した前記文字画像と、前記線形和画像との差分画像を生成する差分画像生成部と、前記線形和画像の情報と、前記差分画像の情報とを関連付けて、格納手段に格納する格納部と、を備える文字画像圧縮装置。
(付記2) 前記線形和画像生成部は、前記複数のサンプル画像の各々に重み付けを行い、サンプル画像の画素値と各サンプル画像の重み係数とを積算した値の和から線形和画像を生成することを特徴とする付記1に記載の文字画像圧縮装置。
(付記3) 前記複数のサンプル画像は、同一の文字に関し、フォントの種類及び劣化度の少なくとも一方を異ならせた画像であることを特徴とする付記1又は2に記載の文字画像圧縮装置。
(付記4) 付記1〜3のいずれかに記載の文字画像圧縮装置の前記格納部が前記格納手段に格納した、前記線形和画像の情報と、前記差分画像の情報とを取得する取得部と、前記取得部が取得した情報から前記文字画像を復元する復元部と、を備える文字画像復元装置。
(付記5) 前記復元部が復元する前記文字画像の鮮明度の入力を受け付ける受付部を更に備え、前記復元部は、前記線形和画像の情報に含まれるサンプル画像の重み係数を、前記受付部が受け付けた前記鮮明度に基づいて変更することを特徴とする付記4に記載の文字画像復元装置。
(付記6) 前記復元部は、前記重み係数を変更する際に、前記サンプル画像の劣化度を考慮することを特徴とする付記5に記載の文字画像復元装置。
(付記7) コンピュータが、文字画像を取得する文字画像取得工程と、前記文字画像取得工程で取得された前記文字画像の文字認識を行う文字認識工程と、前記文字認識工程で認識された文字に対応する複数のサンプル画像を取得し、前記複数のサンプル画像を用いた線形和画像を生成する線形和画像生成工程と、前記文字画像取得工程で取得した前記文字画像と、前記線形和画像との差分画像を生成する差分画像生成工程と、前記線形和画像の情報と、前記差分画像の情報とを関連付けて、格納手段に格納する格納工程と、を実行する文字画像圧縮方法。
(付記8) 前記線形和画像生成工程では、前記複数のサンプル画像の各々に重み付けを行い、サンプル画像の画素値と各サンプル画像の重み係数とを積算した値の和から線形和画像を生成することを特徴とする付記7に記載の文字画像圧縮方法。
(付記9) 前記複数のサンプル画像は、同一の文字に関し、フォントの種類及び劣化度の少なくとも一方を異ならせた画像であることを特徴とする付記7又は8のいずれかに記載の文字画像圧縮方法。
(付記10) コンピュータが、付記7〜9のいずれかに記載の文字画像圧縮方法を用いて、前記格納手段に格納された、前記線形和画像の情報と、前記差分画像の情報とを取得する取得工程と、前記取得工程において取得された情報から前記文字画像を復元する復元工程と、を実行する文字画像復元方法。
(付記11) 前記復元工程で復元された前記文字画像の鮮明度の入力を受け付ける受付工程を更に含み、前記復元工程では、前記線形和画像の情報に含まれるサンプル画像の重み係数を、前記受付工程で受け付けた前記鮮明度に基づいて変更することを特徴とする付記10に記載の文字画像復元方法。
(付記12) 前記復元工程では、前記重み係数を変更する際に、前記サンプル画像の劣化度を考慮することを特徴とする付記11に記載の文字画像復元方法。
(付記13) コンピュータに、文字画像を取得する文字画像取得工程と、前記文字画像取得工程で取得された前記文字画像の文字認識を行う文字認識工程と、前記文字認識工程で認識された文字に対応する複数のサンプル画像を取得し、前記複数のサンプル画像を用いた線形和画像を生成する線形和画像生成工程と、前記文字画像取得工程で取得した前記文字画像と、前記線形和画像との差分画像を生成する差分画像生成工程と、前記線形和画像の情報と、前記差分画像の情報とを関連付けて、格納手段に格納する格納工程と、を実行させる文字画像圧縮プログラム。
(付記14) 前記線形和画像生成工程では、前記複数のサンプル画像の各々に重み付けを行い、サンプル画像の画素値と各サンプル画像の重み係数とを積算した値の和から線形和画像を生成することを特徴とする付記13に記載の文字画像圧縮プログラム。
(付記15) 前記複数のサンプル画像は、同一の文字に関し、フォントの種類及び劣化度の少なくとも一方を異ならせた画像であることを特徴とする付記13又は14に記載の文字画像圧縮プログラム。
(付記16) コンピュータに、付記13〜15のいずれかに記載の文字画像圧縮プログラムを用いて、前記格納手段に格納された、前記線形和画像の情報と、前記差分画像の情報とを取得する取得工程と、前記取得工程において取得された情報から前記文字画像を復元する復元工程と、を実行させる文字画像復元プログラム。
(付記17) 前記復元工程で復元される前記文字画像の鮮明度の入力を受け付ける受付工程を更に含み、前記復元工程では、前記線形和画像の情報に含まれるサンプル画像の重み係数を、前記受付工程で受け付けた前記鮮明度に基づいて変更することを特徴とする付記16に記載の文字画像復元プログラム。
(付記18) 前記復元工程では、前記重み係数を変更する際に、前記サンプル画像の劣化度を考慮することを特徴とする付記17に記載の文字画像復元プログラム。
【符号の説明】
【0108】
24 文字画像圧縮部(文字画像圧縮装置)
30 格納手段
42 文字画像復元部(文字画像復元装置)
50 文字画像取得部
51 文字認識部
53 線形和画像生成部
54c 画像生成部
55 差分画像生成部
56 格納部
60 取得部
62 復元部
【特許請求の範囲】
【請求項1】
文字画像を取得する文字画像取得部と、
前記文字画像取得部で取得された前記文字画像の文字認識を行う文字認識部と、
前記文字認識部にて認識された文字に対応する複数のサンプル画像を取得し、前記複数のサンプル画像を用いた線形和画像を生成する線形和画像生成部と、
前記文字画像取得部が取得した前記文字画像と、前記線形和画像との差分画像を生成する差分画像生成部と、
前記線形和画像の情報と、前記差分画像の情報とを関連付けて、格納手段に格納する格納部と、を備える文字画像圧縮装置。
【請求項2】
前記線形和画像生成部は、
前記複数のサンプル画像の各々に重み付けを行い、サンプル画像の画素値と各サンプル画像の重み係数とを積算した値の和から線形和画像を生成することを特徴とする請求項1に記載の文字画像圧縮装置。
【請求項3】
前記複数のサンプル画像は、同一の文字に関し、フォントの種類及び劣化度の少なくとも一方を異ならせた画像であることを特徴とする請求項1又は2に記載の文字画像圧縮装置。
【請求項4】
請求項1〜3のいずれか一項に記載の文字画像圧縮装置の前記格納部が前記格納手段に格納した、前記線形和画像の情報と、前記差分画像の情報とを取得する取得部と、
前記取得部が取得した情報から前記文字画像を復元する復元部と、を備える文字画像復元装置。
【請求項5】
前記復元部が復元する前記文字画像の鮮明度の入力を受け付ける受付部を更に備え、
前記復元部は、前記線形和画像の情報に含まれるサンプル画像の重み係数を、前記受付部が受け付けた前記鮮明度に基づいて変更することを特徴とする請求項4に記載の文字画像復元装置。
【請求項6】
前記復元部は、前記重み係数を変更する際に、前記サンプル画像の劣化度を考慮することを特徴とする請求項5に記載の文字画像復元装置。
【請求項7】
コンピュータが、
文字画像を取得する文字画像取得工程と、
前記文字画像取得工程で取得された前記文字画像の文字認識を行う文字認識工程と、
前記文字認識工程で認識された文字に対応する複数のサンプル画像を取得し、前記複数のサンプル画像を用いた線形和画像を生成する線形和画像生成工程と、
前記文字画像取得工程で取得した前記文字画像と、前記線形和画像との差分画像を生成する差分画像生成工程と、
前記線形和画像の情報と、前記差分画像の情報とを関連付けて、格納手段に格納する格納工程と、を実行する文字画像圧縮方法。
【請求項8】
コンピュータが、
請求項7に記載の文字画像圧縮方法を用いて、前記格納手段に格納された、前記線形和画像の情報と、前記差分画像の情報とを取得する取得工程と、
前記取得工程において取得された情報から前記文字画像を復元する復元工程と、を実行する文字画像復元方法。
【請求項9】
コンピュータに、
文字画像を取得する文字画像取得工程と、
前記文字画像取得工程で取得された前記文字画像の文字認識を行う文字認識工程と、
前記文字認識工程で認識された文字に対応する複数のサンプル画像を取得し、前記複数のサンプル画像を用いた線形和画像を生成する線形和画像生成工程と、
前記文字画像取得工程で取得した前記文字画像と、前記線形和画像との差分画像を生成する差分画像生成工程と、
前記線形和画像の情報と、前記差分画像の情報とを関連付けて、格納手段に格納する格納工程と、を実行させる文字画像圧縮プログラム。
【請求項10】
コンピュータに、
請求項9に記載の文字画像圧縮プログラムを用いて、前記格納手段に格納された、前記線形和画像の情報と、前記差分画像の情報とを取得する取得工程と、
前記取得工程において取得された情報から前記文字画像を復元する復元工程と、を実行させる文字画像復元プログラム。
【請求項1】
文字画像を取得する文字画像取得部と、
前記文字画像取得部で取得された前記文字画像の文字認識を行う文字認識部と、
前記文字認識部にて認識された文字に対応する複数のサンプル画像を取得し、前記複数のサンプル画像を用いた線形和画像を生成する線形和画像生成部と、
前記文字画像取得部が取得した前記文字画像と、前記線形和画像との差分画像を生成する差分画像生成部と、
前記線形和画像の情報と、前記差分画像の情報とを関連付けて、格納手段に格納する格納部と、を備える文字画像圧縮装置。
【請求項2】
前記線形和画像生成部は、
前記複数のサンプル画像の各々に重み付けを行い、サンプル画像の画素値と各サンプル画像の重み係数とを積算した値の和から線形和画像を生成することを特徴とする請求項1に記載の文字画像圧縮装置。
【請求項3】
前記複数のサンプル画像は、同一の文字に関し、フォントの種類及び劣化度の少なくとも一方を異ならせた画像であることを特徴とする請求項1又は2に記載の文字画像圧縮装置。
【請求項4】
請求項1〜3のいずれか一項に記載の文字画像圧縮装置の前記格納部が前記格納手段に格納した、前記線形和画像の情報と、前記差分画像の情報とを取得する取得部と、
前記取得部が取得した情報から前記文字画像を復元する復元部と、を備える文字画像復元装置。
【請求項5】
前記復元部が復元する前記文字画像の鮮明度の入力を受け付ける受付部を更に備え、
前記復元部は、前記線形和画像の情報に含まれるサンプル画像の重み係数を、前記受付部が受け付けた前記鮮明度に基づいて変更することを特徴とする請求項4に記載の文字画像復元装置。
【請求項6】
前記復元部は、前記重み係数を変更する際に、前記サンプル画像の劣化度を考慮することを特徴とする請求項5に記載の文字画像復元装置。
【請求項7】
コンピュータが、
文字画像を取得する文字画像取得工程と、
前記文字画像取得工程で取得された前記文字画像の文字認識を行う文字認識工程と、
前記文字認識工程で認識された文字に対応する複数のサンプル画像を取得し、前記複数のサンプル画像を用いた線形和画像を生成する線形和画像生成工程と、
前記文字画像取得工程で取得した前記文字画像と、前記線形和画像との差分画像を生成する差分画像生成工程と、
前記線形和画像の情報と、前記差分画像の情報とを関連付けて、格納手段に格納する格納工程と、を実行する文字画像圧縮方法。
【請求項8】
コンピュータが、
請求項7に記載の文字画像圧縮方法を用いて、前記格納手段に格納された、前記線形和画像の情報と、前記差分画像の情報とを取得する取得工程と、
前記取得工程において取得された情報から前記文字画像を復元する復元工程と、を実行する文字画像復元方法。
【請求項9】
コンピュータに、
文字画像を取得する文字画像取得工程と、
前記文字画像取得工程で取得された前記文字画像の文字認識を行う文字認識工程と、
前記文字認識工程で認識された文字に対応する複数のサンプル画像を取得し、前記複数のサンプル画像を用いた線形和画像を生成する線形和画像生成工程と、
前記文字画像取得工程で取得した前記文字画像と、前記線形和画像との差分画像を生成する差分画像生成工程と、
前記線形和画像の情報と、前記差分画像の情報とを関連付けて、格納手段に格納する格納工程と、を実行させる文字画像圧縮プログラム。
【請求項10】
コンピュータに、
請求項9に記載の文字画像圧縮プログラムを用いて、前記格納手段に格納された、前記線形和画像の情報と、前記差分画像の情報とを取得する取得工程と、
前記取得工程において取得された情報から前記文字画像を復元する復元工程と、を実行させる文字画像復元プログラム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【公開番号】特開2012−5076(P2012−5076A)
【公開日】平成24年1月5日(2012.1.5)
【国際特許分類】
【出願番号】特願2010−141043(P2010−141043)
【出願日】平成22年6月21日(2010.6.21)
【出願人】(000005223)富士通株式会社 (25,993)
【Fターム(参考)】
【公開日】平成24年1月5日(2012.1.5)
【国際特許分類】
【出願日】平成22年6月21日(2010.6.21)
【出願人】(000005223)富士通株式会社 (25,993)
【Fターム(参考)】
[ Back to top ]