文字画像圧縮装置及び文字画像復元装置、文字画像圧縮方法及び文字画像復元方法、並びに文字画像圧縮プログラム及び文字画像復元プログラム

【課題】、高品質で、低容量に文字画像を圧縮する
【解決手段】文字画像取得部５０が取得した文字画像の文字認識を文字認識部５１が行い、線形和画像生成部５３が、認識された文字に対応する複数のサンプル画像を辞書ＤＢ５８から取得するとともに、当該複数のサンプル画像を用いた線形和画像を生成する。また、差分画像生成部５５が、文字画像取得部５０が取得した文字画像と線形和画像との差分画像を生成し、格納部５６が、線形和画像と差分画像とを関連付けて、格納手段３０に格納する。

【発明の詳細な説明】
【技術分野】
【０００１】
本件は、文字画像圧縮装置及び文字画像復元装置、文字画像圧縮方法及び文字画像復元方法、並びに文字画像圧縮プログラム及び文字画像復元プログラムに関する。
【背景技術】
【０００２】
文書画像を大量保存する場合や、例えば銀行業務のように窓口で取得した帳票画像を業務センター等へ大量送信する場合等においては、文書画像を高品質かつ低容量に圧縮できることが好ましい。
【０００３】
一般に画像を圧縮する方式としてＪＰＥＧ（Joint Photographic Experts Group）圧縮がある。しかし、文書画像に対してＪＰＥＧ圧縮を行うと、文字パターンの周辺にブロックノイズが発生して視認性が大きく低下することがある。特に、元の文書画像の画質が劣悪な場合や文字が小さい場合などにおいて、ＪＰＥＧ圧縮を行うと文字が非常に見づらくなる。
【０００４】
これに対し、最近では、例えば特許文献１のような技術を用いた圧縮方法が提案されている。特許文献１に記載の技術は、文書画像を文字画像と背景画像に分離して、それぞれに適した圧縮を行うというものである。具体的には、背景画像にはＪＰＥＧ圧縮を施し、その一方で、文字画像に対しては、文字の色を減らし複数枚の２値画像に変換しそれらに対して可逆圧縮を施すというものである。
【０００５】
更に、特許文献２のような、文字認識結果を用いた圧縮方法も提案されている。この技術では、文字認識結果の信頼性が高い文字を文字コードに置き換えて保存するというものである。また、特許文献３には、文字認識結果の文字コードに対して、文字画像と最も近い文字フォントを探索して近似画像とし、それを入力画像に対する予測画像とし、予測誤差を求めて符号化する技術が開示されている。
【先行技術文献】
【特許文献】
【０００６】
【特許文献１】特開２００５−１５９６６３号公報
【特許文献２】特開平８−２９５９３４号公報
【特許文献３】特開平１０−１７８６３８号公報
【発明の概要】
【発明が解決しようとする課題】
【０００７】
しかしながら、上記特許文献１の技術では、文字の色を減らすことで文字パターンの一部が消失するなどして、必ずしも視認性を改善できるとは限らない。また、特許文献２の技術のように文字認識を用いても、文字認識結果自体が１００％信頼できるものではないため、誤った画像が復元される可能性がある。また、特許文献３の技術を用いても、取得する文書画像は大抵の場合劣化しているため、最も近いフォントの文字画像でも実際の画像との差分が大きくなってしまい、文字画像の高精度（高品質）な圧縮を実現できないおそれがある。
【０００８】
そこで本件は上記の課題に鑑みてなされたものであり、高品質で、低容量に文字画像を圧縮することが可能な文字画像圧縮装置、文字画像圧縮方法及び文字画像圧縮プログラムを提供することを目的とする。また、本件は、高品質で、低容量に圧縮された文字画像を復元することが可能な文字画像復元装置、文字画像復元方法及び文字画像復元プログラムを提供することを目的とする。
【課題を解決するための手段】
【０００９】
本明細書に記載の文字画像圧縮装置は、文字画像を取得する文字画像取得部と、前記文字画像取得部で取得された前記文字画像の文字認識を行う文字認識部と、前記文字認識部にて認識された文字に対応する複数のサンプル画像を取得し、前記複数のサンプル画像を用いた線形和画像を生成する線形和画像生成部と、前記文字画像取得部が取得した前記文字画像と、前記線形和画像との差分画像を生成する差分画像生成部と、前記線形和画像の情報と、前記差分画像の情報とを関連付けて、格納手段に格納する格納部と、を備える。
【００１０】
本明細書に記載の文字画像復元装置は、本明細書に記載の文字画像圧縮装置の前記格納部が前記格納手段に格納した、前記線形和画像の情報と、前記差分画像の情報とを取得する取得部と、前記取得部が取得した情報から前記文字画像を復元する復元部と、を備える。
【００１１】
本明細書に記載の文字画像圧縮方法は、コンピュータが、文字画像を取得する文字画像取得工程と、前記文字画像取得工程で取得された前記文字画像の文字認識を行う文字認識工程と、前記文字認識工程で認識された文字に対応する複数のサンプル画像を取得し、前記複数のサンプル画像を用いた線形和画像を生成する線形和画像生成工程と、前記文字画像取得工程で取得した前記文字画像と、前記線形和画像との差分画像を生成する差分画像生成工程と、前記線形和画像の情報と、前記差分画像の情報とを関連付けて、格納手段に格納する格納工程と、を実行する文字画像圧縮方法である。
【００１２】
本明細書に記載の文字画像復元方法は、コンピュータが、本明細書に記載の文字画像圧縮方法を用いて、前記格納手段に格納された、前記線形和画像の情報と、前記差分画像の情報とを取得する取得工程と、前記取得工程において取得された情報から前記文字画像を復元する復元工程と、を実行する文字画像復元方法である。
【００１３】
本明細書に記載の文字画像圧縮プログラムは、コンピュータに、文字画像を取得する文字画像取得工程と、前記文字画像取得工程で取得された前記文字画像の文字認識を行う文字認識工程と、前記文字認識工程で認識された文字に対応する複数のサンプル画像を取得し、前記複数のサンプル画像を用いた線形和画像を生成する線形和画像生成工程と、前記文字画像取得工程で取得した前記文字画像と、前記線形和画像との差分画像を生成する差分画像生成工程と、前記線形和画像の情報と、前記差分画像の情報とを関連付けて、格納手段に格納する格納工程と、を実行させる文字画像圧縮プログラムである。
【００１４】
本明細書に記載の文字画像復元プログラムは、コンピュータに、本明細書に記載の文字画像圧縮プログラムを用いて、前記格納手段に格納された、前記線形和画像の情報と、前記差分画像の情報とを取得する取得工程と、前記取得工程において取得された情報から前記文字画像を復元する復元工程と、を実行させる文字画像復元プログラムである。
【発明の効果】
【００１５】
本明細書に記載の文字画像圧縮装置、文字画像圧縮方法及び文字画像圧縮プログラムは、高品質で、低容量に文字画像を圧縮することができるという効果を奏する。また、本明細書に記載の文字画像復元装置、文字画像復元方法及び文字画像復元プログラムは、高品質で、低容量に圧縮された文字画像を復元することができるという効果を奏する。
【図面の簡単な説明】
【００１６】
【図１】一実施形態に係る情報処理装置の構成を概略的に示す図である。
【図２】図１のＰＣのハードウェア構成を示す図である。
【図３】図１のＰＣの機能ブロック図が示されている。
【図４】文字画像圧縮部と、文字画像復元部の詳細な機能ブロック図である。
【図５】辞書ＤＢのデータ構造を示す図である。
【図６】一実施形態の情報処理装置における文書画像圧縮処理の具体的な処理内容を示すフローチャートである。
【図７】図６のステップＳ１６（文字画像圧縮のサブルーチン）における具体的処理を示すフローチャートである。
【図８】図８（ａ）〜図８（ｄ）は、線形和画像の生成方法を説明するための図である。
【図９】図７のステップＳ２８の具体的処理を示すフローチャートである。
【図１０】図１０（ａ）、図１０（ｂ）は、差分画像の生成方法を説明するための図である。
【図１１】図１１（ａ）は、圧縮文字データのデータ構造を模式的に示す図であり、図１１（ｂ）は、文字画像データのデータ構造を示す図である
【図１２】差分画像データのデータ構造を示す図である。
【図１３】文書画像の復元処理を示すフローチャートである。
【図１４】図１３のステップＳ９４の具体的処理内容を示すフローチャートである。
【図１５】図１５（ａ）〜図１５（ｃ）は、比較例１を説明するための図である。
【図１６】図１６（ａ）〜図１６（ｃ）は、比較例２を説明するための図である。
【図１７】変形例に係るＰＣの機能ブロック図である。
【図１８】図１８（ａ）は、変形例に係る表示例を示す図であり、図１８（ｂ）は、図１８（ａ）の画像を鮮明にした状態を示す図である。
【図１９】図１９（ａ）〜図１９（ｃ）は、変形例における重み係数の計算手順を示す図である。
【発明を実施するための形態】
【００１７】
以下、文字画像圧縮装置及び文字画像復元装置の一実施形態について詳細に説明する。図１には、一実施形態に係る情報処理装置１００の構成が概略的に示されている。この図１に示すように、情報処理装置１００は、ＰＣ１０と、ディスプレイ１２と、キーボード１４と、マウス１６と、スキャナ１８とを備える。
【００１８】
ＰＣ１０は、外部から入力される文書画像を圧縮して保持するとともに、ユーザの指示に応じて、保存している文書画像を復元して、ディスプレイ１２に表示する機能を有している。
【００１９】
図２には、ＰＣ１０のハードウェア構成が示されている。この図２に示すように、ＰＣ１０は、ＣＰＵ９０、ＲＯＭ９１、ＲＡＭ９２、記憶部（ここではＨＤＤ（Hard Disk Drive））９３、入出力部９４等を備えており、これら構成各部は、バス９５に接続されている。ＰＣ１０では、ＲＯＭ９１あるいはＨＤＤ９３に格納されている各種プログラム（文字画像圧縮プログラム及び文字画像復元プログラムを含む）をＣＰＵ９０が実行することにより、図３の各部の機能が実現される。また、入出力部９４には、図１のディスプレイ１２、キーボード１４、マウス１６、スキャナ１８等が接続されている。
【００２０】
図１に戻り、ディスプレイ１２は、液晶ディスプレイ等の表示装置であり、ＰＣ１０から入力される画像を表示する。キーボード１４及びマウス１６は、ユーザがＰＣ１０への指示を入力する際に用いられるユーザインタフェースである。スキャナ１８は、文字や図形等が記載された紙文書の画像（文書画像と呼ぶ）を読み取り、ＰＣ１０に入力する装置である。
【００２１】
図３には、ＰＣ１０の機能ブロック図が示されている。この図３に示すように、ＰＣ１０は、文書画像分離部２０と、背景画像圧縮部２２と、文字画像圧縮装置としての文字画像圧縮部２４と、格納手段３０と、背景画像復元部４０と、文字画像復元装置としての文字画像復元部４２と、文書画像生成部４４と、表示制御部４６と、を有する。
【００２２】
文書画像分離部２０は、スキャナ１８にて読み込まれた文書画像を、背景画像と文字画像とに分離する。ここで、文字画像とは、文書画像に含まれる文字を１文字ずつ取り出した画像である。また、背景画像は、文字画像以外の部分の画像である。
【００２３】
背景画像圧縮部２２は、文書画像分離部２０で分離された背景画像をＪＰＥＧ形式などにより圧縮して、当該圧縮により生成された圧縮背景データを格納手段３０に格納する。文字画像圧縮部２４は、辞書ＤＢ５８に格納されているデータを用いて、文書画像分離部２０で分離された文字画像を後述する方法で圧縮する。また、文字画像圧縮部２４は、圧縮により生成された圧縮文字データを、格納手段３０に格納する。なお、文字画像圧縮部２４の詳細については、後述する。
【００２４】
ここで、格納手段３０及び辞書ＤＢ５８は、図２のＨＤＤ９３により実現されている。辞書ＤＢ５８には、複数の文字に対して、複数のフォント、複数の劣化度の画像（サンプル画像（図８（ｂ）参照）と呼ぶ）が格納されている。
【００２５】
背景画像復元部４０は、格納手段３０に格納されている圧縮背景データを読み出し、当該圧縮背景データから、背景画像を復元する。文字画像復元部４２は、格納手段３０に格納されている圧縮文字データを読み出し、当該圧縮文字データと、辞書ＤＢ５８に格納されているデータとに基づいて、文字画像を復元する。なお、文字画像復元部４２の詳細については、後述する。
【００２６】
文書画像生成部４４は、背景画像復元部４０で復元された背景画像と、文字画像復元部４２で復元された文字画像とを用いて、文書画像を生成（復元）する。表示制御部４６は、文書画像生成部４４で生成された文書画像を、ディスプレイ１２に表示する。
【００２７】
図４には、文字画像圧縮部２４及び文字画像復元部４２の詳細な機能ブロック図が示されている。図４に示すように、文字画像圧縮部２４は、文字画像取得部５０と、文字認識部５１と、色情報取得部５２と、線形和画像生成部５３と、差分画像生成部５５と、格納部５６と、を備える。
【００２８】
文字画像取得部５０は、図３の文書画像分離部２０において文書画像から分離された文字画像を取得する。文字認識部５１は、文字画像取得部５０で取得された文字画像の文字認識を行う。色情報取得部５２は、文字画像から色情報（ここでは、色相と彩度）を取得する。
【００２９】
線形和画像生成部５３は、複数のサンプル画像の各々に重み付けを行い、サンプル画像の画素値と各サンプル画像の重み係数とを積算した値の和から線形和画像を生成する。より具体的には、サンプル画像取得部５４ａと、重み係数決定部５４ｂと、画像生成部５４ｃと、を有している。サンプル画像取得部５４ａは、文字認識部５１にて認識された文字に対応する複数のサンプル画像を辞書ＤＢ５８から取得する。また、重み係数決定部５４ｂは、複数のサンプル画像を用いた線形和による生成画像が、文字画像に類似するように、各サンプル画像の重み係数を決定する。画像生成部５４ｃは、複数のサンプル画像と各サンプル画像の重み係数とを積算した値の和から、線形和画像を生成する。
【００３０】
差分画像生成部５５は、文字画像取得部５０が取得した文字画像と、線形和画像生成部５３で生成された線形和画像との差分画像を生成するとともに、差分画像を可逆圧縮して差分画像データを生成する。
【００３１】
格納部５６は、線形和画像の情報（線形和画像生成に用いたサンプル画像の情報及び重み係数を含む文字画像データ）と、差分画像の情報（差分画像データ）とを関連付けて、格納手段３０に格納する。
【００３２】
図３の文字画像復元部４２は、図４に示すように、取得部６０と、復元部６２と、出力部６４と、を備えている。
【００３３】
取得部６０は、格納手段３０に格納されている情報のうち、線形和画像の情報と、差分画像の情報とを取得する。復元部６２は、取得部６０が取得した線形和画像の情報と辞書ＤＢ５８のサンプル画像とから生成される線形和画像と、差分画像の情報から生成される差分画像とから文字画像を復元する。出力部６４は、復元部６２において復元された文字画像を図３の文書画像生成部４４に対して出力する。
【００３４】
次に、辞書ＤＢ５８のデータ構造について、図５に基づいて説明する。図５に示すように、辞書ＤＢ５８には、「文字種類数」の項目と、「文字種類１」〜「文字種類ｐ」の項目が設けられている。なお、図５では、「文字種類数」の項目には、ｐが入力されることになる。ここで、文字種類とは、文字そのもの（例えば、「あ」、「い」…など）を意味し、フォントや画像の劣化度が異なっているものも含めて、１つの文字種類となる。文字種類は、一般に、文字カテゴリとも呼ばれ、文字種類数は、通常、日本語であれば約４０００程度となる。
【００３５】
また、辞書ＤＢ５８には、図５に示すように、文字種類ごとに、「文字コード」の項目、「文字画像数」の項目が設けられている。また、複数の文字画像に対応して、「ＩＤ」の項目、「文字画像（データ）」の項目、「文字特徴（ベクトル）」の項目が、設けられている。「文字画像」の項目には、例えば、図８（ｂ）に示すような、フォントや画像の劣化度が異なる画像（「サンプル画像」とも呼ぶ）が登録され、「ＩＤ」の項目には、図８（ｂ）に示すＡ１〜Ｄ３などのＩＤが登録される。
【００３６】
なお、文字画像としては正規化された画像、例えばグレー画像が登録される。また、文字特徴ベクトルの次元数も文字画像によらず一定である。したがって、文字画像毎の情報は固定の大きさの領域となる。なお、文字特徴ベクトルは、グレー画像ではなく、２値画像から得られるものでもよい。また、画像の劣化度は、例えば、文字画像に対してガウシアンフィルタの分散を多段階に変更しつつ作用させることにより得ることができる。
【００３７】
次に、本実施形態の情報処理装置１００における文書画像圧縮処理と文書画像復元処理の詳細について、図６〜図１４に基づいて説明する。
【００３８】
図６には、本実施形態の情報処理装置１００における文書画像圧縮処理の具体的な処理内容が、フローチャートにて示されている。図６の処理では、まず、ステップＳ１０において、文書画像分離部２０が、スキャナ１８にて読み込まれた文書画像を取得する。次いで、ステップＳ１２では、文書画像分離部２０が、文字画像と背景画像とを分離する。この分離方法としては、例えば、特開２００５−１５９６６３号公報に記載されているような方法を採用することができる。
【００３９】
次いで、ステップＳ１４では、背景画像圧縮部２２が、背景画像を圧縮する処理を実行する。この場合、背景画像圧縮部２２は、例えばＪＰＥＧ形式により背景画像を圧縮し、圧縮背景データを生成するものとする。
【００４０】
次いで、ステップＳ１６では、文字画像圧縮部２４が、文字画像圧縮のサブルーチンを実行する。この文字画像圧縮のサブルーチンでは、図７の処理が実行される。
【００４１】
図７には、ステップＳ１６（文字画像圧縮のサブルーチン）における具体的処理がフローチャートにて示されている。この図７の処理では、まず、ステップＳ２０において、文字画像圧縮部２４の文字画像取得部５０が、文書画像分離部２０にて文書画像から分離された全ての文字画像を取得する。ここで取得される文字画像は、カラーの文字画像であるものとする。
【００４２】
次いで、ステップＳ２２では、文字認識部５１が、ステップＳ２０において取得された文字画像（カラーの文字画像）を用いて文字認識処理を行う。その結果得られる文字認識結果は、認識結果文字数と各認識結果の文字情報である。認識結果の文字情報は、文字コードと、文字座標とを含む。
【００４３】
次いで、ステップＳ２３では、色情報取得部５２が、未処理の文字画像を取得する。次いで、ステップＳ２４では、色情報取得部５２が、取得した文字画像の色情報を取得する。ここで、文字画像の色情報は、色相と彩度の値である。この場合、まず、色情報取得部５２は、カラーの元画像（Ｉとする）から明度画像（Ｆとする）を生成する。そして、色情報取得部５２は、文字画像の画素のうち、明度値が所定の閾値よりも大きい画素、すなわち、文字画像をグレー画像としたときに所定以上黒く表示される画素に関して、色相と彩度の値を計算してサンプリングする。また、色情報取得部５２は、当該サンプリングの結果、最も出現頻度の大きい色相と彩度の値を求め、これを、文字画像の色情報とする。なお、色彩と彩度の取得方法は、上記方法に限らず、色情報取得部５２は、文字画像の画素の色彩と彩度の平均値を求め、これを文字画像の色情報として取得することとしても良い。
【００４４】
次いで、ステップＳ２６では、線形和画像生成部５３が、線形和画像を生成する。以下、線形和画像の生成方法について、図８（ａ）〜図８（ｄ）に基づいて、詳細に説明する。
【００４５】
図８（ａ）には、１文字分の文字画像（明度画像）Ｆの一例として、「証」の文字の文字画像が示されている。この文字画像Ｆの文字認識（ステップＳ２２）の結果、正しく「証」と認識された場合には、サンプル画像取得部５４ａは、辞書ＤＢ５８から「証」の文字に対応する複数のサンプル画像を、図８（ｂ）のように取得する。次いで、重み係数決定部５４ｂは、文字画像Ｆに関し、サンプル画像との距離を算出し、距離の近い上位Ｎ個のサンプル画像ｆ₁、ｆ₂、…、ｆ_Nを決定する。ここで、文字画像Ｆとサンプル画像との距離は、サンプル画像の文字特徴ベクトルを用いた識別関数値を利用して、算出することができる。なお、図８（ｃ）では、Ｎ＝３の例が示されている。
【００４６】
次いで、重み係数決定部５４ｂは、文字画像Ｆに対して、線形和画像の最適類似画像を求める。具体的には、上位Ｎ個のサンプル画像ｆ₁、ｆ₂、…、ｆ_Nに対する重み係数α₁、α₂、…、α_Nを、次式（１）から求める。
【００４７】
【数１】

【００４８】
ここで、上式（１）の問題を、制約付き最小自乗問題と捉えれば、その解として重み係数α₁、α₂、…、α_Nを計算することができる。具体的には、重み係数決定部５４ｂは、次式（２）に基づいて、α₁、α₂、…、α_Nを計算する。
【００４９】
【数２】

なお、上式（２）では、Ｃ＝｛（Ｆ−ｆ_k）・（Ｆ−ｆ_ｌ）｝であるものとする。
【００５０】
以上のようにして、重み係数α₁、α₂、…、α_Nを決定すると、画像生成部５４ｃは、線形和画像を生成することができる。一例として、図８（ｃ）に示すように、サンプル画像のＩＤがＡ３の重み係数が０．６０、Ａ２の重み係数が０．３１、Ｃ３の重み係数が０．０９であったとするならば、画像生成部５４ｃは、各サンプル画像の画素値と各サンプル画像の重み係数とを積算した値の和から、図８（ｄ）のような線形和画像を生成することができる。このように線形和画像が生成された後は、図７のステップＳ２８に移行する。
【００５１】
図７のステップＳ２８では、差分画像生成部５５が、差分画像を生成するサブルーチンを実行する。このサブルーチンでは、差分画像生成部５５は、図９のような処理を実行する。なお、ステップＳ２８の処理は、簡単に言えば、図１０（ａ）のように文字画像ＦからステップＳ２６で生成された線形和画像を差し引いて、図１０（ｂ）のような差分画像を生成する処理である。
【００５２】
図９の処理では、まずステップＳ４０において、差分画像生成部５５が、正の差分画像及び負の差分画像を生成する。なお、正の差分画像とは、線形和画像を元の文字画像に近づけるために、より黒くする必要のある画素を示す画像であり、負の差分画像とは、線形和画像を元の文字画像に近づけるために、より白くする必要のある画素を示す画像である。
【００５３】
具体的には、差分画像生成部５５は、次式（３）から差分画像Ｄを求める。
【００５４】
【数３】

【００５５】
次いで、差分画像生成部５５は、Ｄを正の差分画像Ｄ₊と負の差分画像Ｄ_-に分解する。具体的には、差分画像生成部５５は、次式（４）、（５）から、Ｄ₊とＤ_-を求める。なお、ｍは、行方向の画素番号を示し、ｎは列方向の画素番号を示す。
【００５６】
【数４】

【００５７】
【数５】

【００５８】
次いで、ステップＳ４２では、正の差分画像全体の画素値（画素値の総和）が、所定の閾値ｔｈ_α以下であるか否かを判断する。ここで、閾値ｔｈ_αとしては、例えば、線形和画像が正しく生成されているときにとりうる差分画像の画素値の範囲（事前の実験やシミュレーションにより求められる）のうちの最大値を採用することとする。ここでの判断が否定された場合、すなわち、正の差分画像が大きすぎて、ステップＳ２６において適切な線形和画像が生成されていない可能性が高いと判断される場合には、ステップＳ７８に移行する。ステップＳ７８では、正の差分画像を文字画像Ｆに設定するとともに、負の差分画像を０（Ｎｕｌｌ）に設定し、かつ重み係数をクリアする。このようにステップＳ７８を経た場合には、前述したステップＳ２６において生成された線形和画像を用いた画像圧縮を行うことなく、文字画像そのものを正の差分画像として扱うことになる。このステップＳ７８が行われた後は、図９の全処理を終了して、図７のステップＳ３０に移行する。
【００５９】
一方、ステップＳ４２の判断が肯定された場合には、ステップＳ４４に移行する。ステップＳ４４では、差分画像生成部５５が、差分画像の画素の行番号ｍ（０≦ｍ≦ｙ_max）を０に設定する（ｍ＝０）。次いで、ステップＳ４６では、差分画像生成部５５が、行番号ｍが行番号の最大値ｙ_max以下か否かを判断する。ここでの判断が肯定された場合には、ステップＳ４８に移行するが、否定された場合には、ステップＳ６０に移行する。ステップＳ４８に移行した場合、差分画像生成部５５は、差分画像の画素の列番号ｎ（０≦ｎ≦ｘ_max）を０に設定する（ｎ＝０）。次いで、ステップＳ５０では、差分画像生成部５５が、列番号ｎが列番号の最大値ｘ_max以下か否かを判断する。ここでの判断が肯定された場合には、ステップＳ５２に移行するが、否定された場合には、ステップＳ５８においてｍを１インクリメント（ｍ←ｍ＋１）した後、ステップＳ４６に戻る。
【００６０】
ステップＳ５２に移行した場合、差分画像生成部５５は、ｍ行ｎ列の画素値が所定の閾値ｔｈ_β以上か否かを判断する。ここで、閾値ｔｈ_βとしては、画素の値を０に近似しても復元した画像と圧縮前の画像との間に見た目上ほとんど差異が生じない程度の画素の値を採用することができる。ここでの判断が否定された場合、すなわち、ｍ行ｎ列の画素値が閾値ｔｈ_βよりも小さく、ほぼ０と看做せる場合には、ステップＳ５４において、差分画像生成部５５が、ｍ行ｎ列の画素値を０に設定して、ステップＳ５６に移行する。このように、ｍ行ｎ列の画素値がほぼ０と看做せるときに画素値を０とすることで、差分画像のデータ量を小さくすることができる。
【００６１】
一方、ステップＳ５２の判断が肯定された場合には、差分画像生成部５５は、ステップＳ５４を経ずに、すなわち、ｍ行ｎ列の画素値を維持したまま、ステップＳ５６に移行する。
【００６２】
ステップＳ５６では、差分画像生成部５５は、列番号ｎを１インクリメントした後に、ステップＳ５０に戻る。その後は、差分画像生成部５５が、ステップＳ４６〜Ｓ５６を繰り返すことで、０行０列の画素からｙ_max行ｘ_max列の画素までの処理を実行し、ステップＳ４６の判断が否定された段階で、ステップＳ６０に移行する。
【００６３】
なお、これ以降のステップＳ６０〜ステップＳ７６の処理は、負の差分画像に対する処理であるが、前述した、ステップＳ４２〜ステップＳ５８までの正の差分画像に対する処理と同様に行われる。なお、ステップＳ６０では、負の差分画像全体の画素値（画素値の総和）の絶対値と閾値ｔｈ_αとを比較し、ステップＳ７０では、ｍ行ｎ列の画素値の絶対値と閾値ｔｈ_βとを比較している点が、前述した正の差分画像に対する処理と異なっている。ステップＳ６０の判断が否定された場合には、ステップＳ７８の処理を経て、図９の全処理を終了し、ステップＳ６４の判断が否定された場合には、ステップＳ７８を経ずに、図９の全処理を終了する。
【００６４】
図９の全処理が終了すると、図７のステップＳ２９に移行する。ステップＳ２９では、差分画像生成部５５が、ステップＳ２８で生成された差分画像を可逆圧縮して、差分画像の情報（差分画像データ）を生成する。次いで、ステップＳ３０では、色情報取得部５２が、未処理の全文字の取得が終了したか否かを判断する。ここでの判断が否定された場合には、ステップＳ２３に戻り、ステップＳ３０の判断が肯定されるまで、ステップＳ２３〜Ｓ３０の処理・判断を繰り返す。一方、ステップＳ３０の判断が肯定された場合には、図７の全処理を終了し、図６のステップＳ１８に移行する。なお、図７の処理を終了した段階で生成された各データを、「圧縮文字データ」と呼ぶものとする。すなわち、図１１（ａ）に模式的に示すように、圧縮文字データは、線形和画像生成に用いられるサンプル画像の情報や重み係数、色情報などを含む文字画像データと、差分画像データとを含んでいる。
【００６５】
ここで、図１１（ａ）に示す文字画像データと、差分画像データについて説明する。
【００６６】
文字画像データは、図１１（ｂ）に示すように、先頭に「文字数」の項目があり、その後に「１文字分のコード情報」の項目が文字数分だけ配列される。「１文字分のコード情報」の項目には、「文字の座標」（例えば、文字の左上の点の座標と右下の点の座標）、「文字の色情報」、「文字コード」が記述される。また、線形和画像を生成するのに用いた重み係数の個数が記述されるとともに、重み係数に対応するサンプル画像のＩＤとその重み係数が記述される。なお、文字の色情報は、色相と彩度の２つの数値からなる。
【００６７】
一方、差分画像データは、図１２に示すように、先頭に「文字数」の項目があり、その後に「１文字分の差分画像」の情報が文字数分だけ配列される。「１文字分の差分画像」は、データサイズ、文字の座標（例えば、文字の左上の点の座標と右下の点の座標）が記述される。そして、正の差分画像データのサイズが記され、その後に正の差分画像データが配置される。さらに、負の差分画像データのサイズが記され、その後に負の差分画像データが配置される。なお、差分画像データは、可逆圧縮によって圧縮されたデータである。
【００６８】
なお、図１１、図１２から分かるように、図１１の「１文字分のコード情報」と、図１２の「１文字分の差分画像」には、それぞれ座標が記述されているので、各文字のコード情報と差分画像とが関連付けられていることになる。
【００６９】
図６に戻り、ステップＳ１８では、背景画像圧縮部２２が、ステップＳ１４で生成された圧縮背景データを格納手段３０に格納するとともに、文字画像圧縮部２４の格納部５６（図４参照）が、圧縮文字データを格納手段３０に格納する。
【００７０】
次に、上記のようにして格納手段３０に格納された圧縮背景データと圧縮文字データとを用いた文書画像の復元処理について、図１３のフローチャートに沿って説明する。
【００７１】
図１３の処理では、まず、ステップＳ９０において、取得部６０が、ユーザからの文書画像の復元指示があったか否かを判断する。ここでの判断が否定されている間は、ステップＳ９０が繰り返され、ステップＳ９０の判断が肯定された段階で、ステップＳ９１に移行する。
【００７２】
ステップＳ９１では、取得部６０が、ユーザによる復元指示において指定された文書画像に対応する圧縮背景データを、格納手段３０から取得する。次いで、ステップＳ９２では、取得部６０が、ユーザによる復元指示において指定された文書画像に対応する圧縮文字データを、格納手段３０から取得する。
【００７３】
次いで、ステップＳ９３では、復元部６２が、圧縮背景データを用いて、背景画像を復元、すなわち、メモリ（ここでは、便宜上メモリＡとする）上に展開する。次いで、ステップＳ９４では、復元部６２が、文字画像を復元するサブルーチンを実行する。
【００７４】
具体的には、復元部６２は、図１４のフローチャートに沿った処理を実行する。図１４では、まず、ステップＳ１０２において、復元部６２が、図１１の圧縮文字データを取得する。
【００７５】
次いで、ステップＳ１０４では、復元部６２が、線形和画像をメモリＡと異なるメモリＢ上に展開し、図１１の圧縮文字データに記されている座標情報に従って、メモリＡに上書きする。より具体的には、ステップＳ１０４では、復元部６２は、まず、線形和画像をメモリＢに展開し、圧縮文字データに記されている文字数分だけ線形和画像を作成する。このとき、復元部６２は、圧縮文字データに記されているＩＤに基づいて、辞書ＤＢ５８を探索して対応するサンプル画像を取得し、当該サンプル画像に重み係数を積算して順次足し合わせて線形和画像を作成する。
【００７６】
次いで、ステップＳ１０６では、復元部６２は、メモリＢ上に差分画像を展開する。ここで、差分画像データは可逆圧縮されているので、復元部６２は、復号化して展開する。この場合、復元部６２は、復号化された差分画像情報を用いて、メモリＢ上に差分画像の画素値を付加する作業を行う。なお、正の差分画像は足し合わせ、負の差分画像は差し引くこととする。なお、線形和画像の値が所定の閾値よりも小さいところは透明にする。
【００７７】
次いで、ステップＳ１０８では、復元部６２が、ステップＳ１０８において生成された文字画像を、カラー化する。このカラー化においては、復元部６２は、文字画像データのうちの、色情報から得られる色相と彩度の値をそのまま用いて、文字画像をカラー化する。
【００７８】
以上のようにして、ステップＳ１０２において取得された圧縮文字データから文字画像が復元されると、図１４の全処理を終了し、図１３のステップＳ９６に移行する。なお、この段階においては、背景画像と文字画像とが合成された文書画像が復元されていることになる。
【００７９】
ステップＳ９６では、出力部６４が復元された文書画像を図３の表示制御部４６に対して出力する。以上のようにして、図１３の処理が終了すると、表示制御部４６が、ディスプレイ１２上に文書画像を表示するので、ユーザは、文書画像を閲覧・利用等することが可能となる。
【００８０】
以上、詳細に説明したように、本実施形態によると、文字画像取得部５０が取得した文字画像の文字認識を文字認識部５１が行い、線形和画像生成部５３が、認識された文字に対応する複数のサンプル画像を辞書ＤＢ５８から取得するとともに、当該複数のサンプル画像を用いた線形和画像を生成する。また、差分画像生成部５５が、文字画像取得部５０が取得した文字画像と線形和画像との差分画像を生成し、格納部５６が、線形和画像と差分画像とを関連付けて、格納手段３０に格納する。このように、本実施形態では、複数のサンプル画像を用いて、線形和画像を生成するので、文字画像が多様に変化していても、当該文字画像に近似した線形和画像を生成することができる。これにより、高精度（高品質）に文字画像を圧縮することができる。また、本実施形態では、文字画像に近似した線形和画像を生成することができることから、差分画像の容量を小さくすることができる。これにより、文字画像を低容量に圧縮することができるようになる。更に、たとえ文字認識精度が１００％でなくても、本実施形態のように差分画像を用いることで、文字認識の誤りを補完することが可能であり、この点からも、高精度（高品質）な文字画像の圧縮が可能となる。
【００８１】
ここで、比較例について説明する。図１５（ａ）〜図１５（ｃ）には、文字画像をＪＰＥＧ圧縮した場合の例（比較例１）が示されている。このうち、図１５（ａ）の左図に示すように、ＪＰＥＧ圧縮を行った画像では、図１５（ａ）の右図（拡大図）に示すように、文字パターンの周辺にブロックノイズが発生して視認性が著しく低下することがある。この場合、図１５（ｂ）に示すようにブロックノイズが発生することで、図１５（ｃ）に示す元画像と比較して、ずれが生じることになる。
【００８２】
また、図１６（ａ）〜図１６（ｃ）には、文字画像の文字の色を減らし複数枚の２値画像に可逆圧縮を施す例（比較例２）が示されている。このうち、図１６（ａ）の左図に示すように、色を減らす処理を行った画像では、図１６（ａ）の右図（拡大図）に示すように、文字パターンの一部が消失して視認性が著しく低下することがある。この場合、図１６（ｂ）に示すように、文字の一部が消失することで、図１６（ｃ）に示す元画像に対するずれが生じることになる。
【００８３】
これに対し、本実施形態では、元画像を圧縮してもほぼ同一の画像を復元することができるので、文字の視認性を元画像と同等に維持することができるようになる。
【００８４】
また、本実施形態では、線形和画像生成部５３が、文字認識部５１にて認識された文字に対応する複数のサンプル画像の各々に重み付けを行い、各サンプル画像の画素値と各サンプル画像の重み係数とを積算した値の和から線形和画像を生成する。このように、本実施形態では、重み係数を各サンプル画像ごとに決定することで、文字画像に高精度に類似（近似）する線形和画像を生成することができるようになる。
【００８５】
また、本実施形態では、重み係数決定部５４ｂは、文字画像の特徴ベクトルと、線形和による生成画像の特徴ベクトルとの距離が最小距離となるように、制約付き最小自乗問題の解として、各サンプル画像の重み係数を決定するので、適切な演算を行うことで、文字画像に高精度に類似（近似）する線形和画像を生成することができる。
【００８６】
また、本実施形態では、同一の文字に対して、フォントの種類及び劣化度の少なくとも一方が異なる複数のサンプル画像が用意されているので、圧縮対象の文字画像が様々なフォントであったり、文字画像の劣化度が種々異なっていたりしていても、圧縮対象の文字画像に類似（近似）する線形和画像を生成することができる。
【００８７】
また、本実施形態では、文字画像復元部４２の取得部６０が、格納手段７０に格納されている線形和画像の情報（文字画像データ）と、差分画像の情報（差分画像データ）とを取得し、それらの情報から、復元部６２が、文字画像を復元する。このように文字画像に高精度に類似する線形和画像と、差分画像を用いた復元を行うことで、元の文字画像を高精度に復元することが可能となる。
【００８８】
なお、上記実施形態では、文書画像を圧縮した後、これを復元する際に、元の文書画像により近づけるように復元する場合について説明したが、これに限られるものではない。文書画像のうち、文字画像の部分が不鮮明な場合には、ユーザからの指示に応じて（又は自動で）、文字画像部分を鮮明に表示するようにしても良い。このような方法の具体例（変形例）について、以下説明する。
【００８９】
図１７には、変形例に係るＰＣ１０の機能ブロック図が示されている。この図１７と図３とを比較すると分かるように、図１７では、受付部としての鮮明度入力受付部９６が設けられている点が、上記実施形態と異なっている。鮮明度入力受付部９６は、ユーザがマウス１６やキーボード１４を介して、鮮明度の入力をした場合に、その入力を受け付けて、文字画像復元部４２に対して出力する機能を有する。
【００９０】
図１８（ａ）には、本変形例におけるディスプレイ１２の画面表示例が示されている。この図１８（ａ）に示すように、本変形例では、画面下側に鮮明度コントロール用のスライダコントロール９８が表示されている。ユーザは、このスライダコントロール９８において、マウス１６等を用いてツマミ９９を左右方向にスライド操作することで、鮮明度の入力を行う。
【００９１】
なお、本変形例の前提として、辞書ＤＢ５８に登録されるサンプル画像のＩＤには、劣化度の情報が含まれているものとする。具体的には、ＩＤを３２ビットで表すものとすると、最初の４ビット（値は０から１５までをとる）を劣化度に割り当てることとする。劣化度は、０を「劣化なし」とし、番号が大きくなるほど劣化するというように定義するものとする。また、ＩＤの次の１６ビットには文字コードを割り当て、残りの１２ビットに、同じ文字コードに対する通し番号を割り当てる。例えば、「御」（文字コード：０ｘ８ＣＥ４）という文字で、劣化度が１、通し番号が７であるならば、ＩＤは、１６進表示で「１８ＣＥ４００７」と表されることになる。なお、劣化度は、上記実施形態と同様、文字画像に対して作用させるガウシアンフィルタの分散に基づく値である。
【００９２】
上記前提の下、文字画像復元部４２は、鮮明度（鮮明度は０（低い）〜１（高い）の値をとるものとする）の入力を受け付けると、線形和画像の復元を開始する。ここでは、線形和画像の復元に用いるサンプル画像（重み係数）が４つあり、それらのＩＤに対し、図１９（ａ）に示すような重み係数が設定されているものとする。
【００９３】
文字画像復元部４２は、線形和画像の復元に際し、劣化度が０でない画像の重み係数に、（１−鮮明度）を積算する。図１９（ｂ）には、鮮明度を０．８とした場合の計算結果が示されている。
【００９４】
次いで、文字画像復元部４２は、４つの重み係数の和が１になるように、各重み係数を正規化する。この正規化後の重み係数が、図１９（ｃ）に示されている。そして、文字画像復元部４２は、図１９（ｃ）に示す正規化後の重み係数を用いて、線形和画像を生成する。これ以外の処理は、上記実施形態と同様となっている。
【００９５】
このような鮮明度を考慮した処理を行うことで、劣化度が０の画像を優先して線形和画像を生成することができるので、図１８（ａ）のような不鮮明な画像を、図１８（ｂ）に示すように鮮明にすることができる。これにより、元画像よりも鮮明な画像をディスプレイ１２上に表示することが可能となる。
【００９６】
なお、上記変形例では、劣化度が０でない画像の重み係数に対して、一律に（１−鮮明度）を積算する場合について説明したが、これに限られるものではない。例えば、劣化度（１〜１５）を考慮して、劣化度が大きいほど重み係数が小さくなるような演算を、重み係数に対して施しても良い。
【００９７】
なお、上記実施形態では、差分画像を生成する際に、ステップＳ４２、Ｓ６０において差分画像の画素値の総和の絶対値が所定の閾値ｔｈ_αよりも大きい場合に、サンプル画像を用いた圧縮を行わないこととする場合について説明した。しかしながら、これに限らず、差分画像の画素値の総和の大小にかかわらず、サンプル画像を用いた圧縮を常に行うこととしても良い。
【００９８】
また、上記実施形態では、ステップＳ５２、Ｓ７０において、ｍ行ｎ列の画素値の絶対値が所定の閾値ｔｈ_βよりも小さい場合に、画素値を０にすることで、差分画像のデータ量を小さくすることとした。しかしながら、これに限られるものではなく、各画素の画素値が０に近いか否かにかかわらず、実際の画素値を維持することとしても良い。
【００９９】
なお、上記実施形態では、文字画像がカラーである場合について説明したが、これに限らず、スキャナ１８が読み取る文書画像はモノクロ画像であっても良い。文書画像が常にモノクロ画像である場合には、図４の色情報取得部５２を省略するとともに、色情報取得部５２の処理を省略しても良い。
【０１００】
なお、上記実施形態では、スキャナ１８を用いて文書画像を取得する場合について説明したが、これに限られるものではなく、文書画像は、インターネットなどのネットワークを介して取得しても良い。また、スキャナに代えて、デジタルカメラやスキャナ機能を有する複合機などから文書画像を取得しても良い。
【０１０１】
なお、上記実施形態では、１台のＰＣで、文書画像の圧縮と復元を行う場合について説明したが、これに限らず、一のＰＣで文書画像の圧縮を行い、他のＰＣで文書画像の復元を行うこととしても良い。この場合、一のＰＣと他のＰＣをインターネットやＬＡＮ（local area network）などのネットワークを介して接続しておき、当該ネットワークを介して圧縮背景データや圧縮文字データのやり取りを行うこととしても良い。あるいは、一のＰＣと他のＰＣとの間でのデータのやり取りに、ＵＳＢメモリ等の可搬型記憶媒体を用いることとしても良い。この場合、一のＰＣと他のＰＣはネットワークを介して接続されていても良いし、接続されていなくても良い。
【０１０２】
なお、上記実施形態では、本件の文字画像圧縮プログラム及び文字画像復元プログラムが、ＰＣ１０内に組み込まれ、図３の各部の各機能を実現する。しかしながら、これに限らず、例えば、インターネット等の通信網に接続されたサーバコンピュータを本件の文字画像圧縮装置及び文字画像復元装置とし、これに接続されたパーソナルコンピュータ等が有する格納手段に、圧縮文字データを格納するサービスをサーバコンピュータから提供するようにしても良い（ＡＳＰ(Application Service Provider)）。
【０１０３】
なお、上記の処理機能は、コンピュータによって実現することができる。その場合、処理装置が有すべき機能の処理内容を記述したプログラムが提供される。そのプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。
【０１０４】
プログラムを流通させる場合には、例えば、そのプログラムが記録されたＤＶＤ（Digital Versatile Disc）、ＣＤ−ＲＯＭ（Compact Disc Read Only Memory）などの可搬型記録媒体の形態で販売される。また、プログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することもできる。
【０１０５】
プログラムを実行するコンピュータは、例えば、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、自己の記憶装置に格納する。そして、コンピュータは、自己の記憶装置からプログラムを読み取り、プログラムに従った処理を実行する。なお、コンピュータは、可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することもできる。また、コンピュータは、サーバコンピュータからプログラムが転送されるごとに、逐次、受け取ったプログラムに従った処理を実行することもできる。
【０１０６】
上述した実施形態は本発明の好適な実施の例である。但し、これに限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々変形実施可能である。
【０１０７】
なお、以上の説明に関して更に以下の付記を開示する。
（付記１）文字画像を取得する文字画像取得部と、前記文字画像取得部で取得された前記文字画像の文字認識を行う文字認識部と、前記文字認識部にて認識された文字に対応する複数のサンプル画像を取得し、前記複数のサンプル画像を用いた線形和画像を生成する線形和画像生成部と、前記文字画像取得部が取得した前記文字画像と、前記線形和画像との差分画像を生成する差分画像生成部と、前記線形和画像の情報と、前記差分画像の情報とを関連付けて、格納手段に格納する格納部と、を備える文字画像圧縮装置。
（付記２）前記線形和画像生成部は、前記複数のサンプル画像の各々に重み付けを行い、サンプル画像の画素値と各サンプル画像の重み係数とを積算した値の和から線形和画像を生成することを特徴とする付記１に記載の文字画像圧縮装置。
（付記３）前記複数のサンプル画像は、同一の文字に関し、フォントの種類及び劣化度の少なくとも一方を異ならせた画像であることを特徴とする付記１又は２に記載の文字画像圧縮装置。
（付記４）付記１〜３のいずれかに記載の文字画像圧縮装置の前記格納部が前記格納手段に格納した、前記線形和画像の情報と、前記差分画像の情報とを取得する取得部と、前記取得部が取得した情報から前記文字画像を復元する復元部と、を備える文字画像復元装置。
（付記５）前記復元部が復元する前記文字画像の鮮明度の入力を受け付ける受付部を更に備え、前記復元部は、前記線形和画像の情報に含まれるサンプル画像の重み係数を、前記受付部が受け付けた前記鮮明度に基づいて変更することを特徴とする付記４に記載の文字画像復元装置。
（付記６）前記復元部は、前記重み係数を変更する際に、前記サンプル画像の劣化度を考慮することを特徴とする付記５に記載の文字画像復元装置。
（付記７）コンピュータが、文字画像を取得する文字画像取得工程と、前記文字画像取得工程で取得された前記文字画像の文字認識を行う文字認識工程と、前記文字認識工程で認識された文字に対応する複数のサンプル画像を取得し、前記複数のサンプル画像を用いた線形和画像を生成する線形和画像生成工程と、前記文字画像取得工程で取得した前記文字画像と、前記線形和画像との差分画像を生成する差分画像生成工程と、前記線形和画像の情報と、前記差分画像の情報とを関連付けて、格納手段に格納する格納工程と、を実行する文字画像圧縮方法。
（付記８）前記線形和画像生成工程では、前記複数のサンプル画像の各々に重み付けを行い、サンプル画像の画素値と各サンプル画像の重み係数とを積算した値の和から線形和画像を生成することを特徴とする付記７に記載の文字画像圧縮方法。
（付記９）前記複数のサンプル画像は、同一の文字に関し、フォントの種類及び劣化度の少なくとも一方を異ならせた画像であることを特徴とする付記７又は８のいずれかに記載の文字画像圧縮方法。
（付記１０）コンピュータが、付記７〜９のいずれかに記載の文字画像圧縮方法を用いて、前記格納手段に格納された、前記線形和画像の情報と、前記差分画像の情報とを取得する取得工程と、前記取得工程において取得された情報から前記文字画像を復元する復元工程と、を実行する文字画像復元方法。
（付記１１）前記復元工程で復元された前記文字画像の鮮明度の入力を受け付ける受付工程を更に含み、前記復元工程では、前記線形和画像の情報に含まれるサンプル画像の重み係数を、前記受付工程で受け付けた前記鮮明度に基づいて変更することを特徴とする付記１０に記載の文字画像復元方法。
（付記１２）前記復元工程では、前記重み係数を変更する際に、前記サンプル画像の劣化度を考慮することを特徴とする付記１１に記載の文字画像復元方法。
（付記１３）コンピュータに、文字画像を取得する文字画像取得工程と、前記文字画像取得工程で取得された前記文字画像の文字認識を行う文字認識工程と、前記文字認識工程で認識された文字に対応する複数のサンプル画像を取得し、前記複数のサンプル画像を用いた線形和画像を生成する線形和画像生成工程と、前記文字画像取得工程で取得した前記文字画像と、前記線形和画像との差分画像を生成する差分画像生成工程と、前記線形和画像の情報と、前記差分画像の情報とを関連付けて、格納手段に格納する格納工程と、を実行させる文字画像圧縮プログラム。
（付記１４）前記線形和画像生成工程では、前記複数のサンプル画像の各々に重み付けを行い、サンプル画像の画素値と各サンプル画像の重み係数とを積算した値の和から線形和画像を生成することを特徴とする付記１３に記載の文字画像圧縮プログラム。
（付記１５）前記複数のサンプル画像は、同一の文字に関し、フォントの種類及び劣化度の少なくとも一方を異ならせた画像であることを特徴とする付記１３又は１４に記載の文字画像圧縮プログラム。
（付記１６）コンピュータに、付記１３〜１５のいずれかに記載の文字画像圧縮プログラムを用いて、前記格納手段に格納された、前記線形和画像の情報と、前記差分画像の情報とを取得する取得工程と、前記取得工程において取得された情報から前記文字画像を復元する復元工程と、を実行させる文字画像復元プログラム。
（付記１７）前記復元工程で復元される前記文字画像の鮮明度の入力を受け付ける受付工程を更に含み、前記復元工程では、前記線形和画像の情報に含まれるサンプル画像の重み係数を、前記受付工程で受け付けた前記鮮明度に基づいて変更することを特徴とする付記１６に記載の文字画像復元プログラム。
（付記１８）前記復元工程では、前記重み係数を変更する際に、前記サンプル画像の劣化度を考慮することを特徴とする付記１７に記載の文字画像復元プログラム。
【符号の説明】
【０１０８】
２４文字画像圧縮部（文字画像圧縮装置）
３０格納手段
４２文字画像復元部（文字画像復元装置）
５０文字画像取得部
５１文字認識部
５３線形和画像生成部
５４ｃ画像生成部
５５差分画像生成部
５６格納部
６０取得部
６２復元部

【特許請求の範囲】
【請求項１】
文字画像を取得する文字画像取得部と、
前記文字画像取得部で取得された前記文字画像の文字認識を行う文字認識部と、
前記文字認識部にて認識された文字に対応する複数のサンプル画像を取得し、前記複数のサンプル画像を用いた線形和画像を生成する線形和画像生成部と、
前記文字画像取得部が取得した前記文字画像と、前記線形和画像との差分画像を生成する差分画像生成部と、
前記線形和画像の情報と、前記差分画像の情報とを関連付けて、格納手段に格納する格納部と、を備える文字画像圧縮装置。
【請求項２】
前記線形和画像生成部は、
前記複数のサンプル画像の各々に重み付けを行い、サンプル画像の画素値と各サンプル画像の重み係数とを積算した値の和から線形和画像を生成することを特徴とする請求項１に記載の文字画像圧縮装置。
【請求項３】
前記複数のサンプル画像は、同一の文字に関し、フォントの種類及び劣化度の少なくとも一方を異ならせた画像であることを特徴とする請求項１又は２に記載の文字画像圧縮装置。
【請求項４】
請求項１〜３のいずれか一項に記載の文字画像圧縮装置の前記格納部が前記格納手段に格納した、前記線形和画像の情報と、前記差分画像の情報とを取得する取得部と、
前記取得部が取得した情報から前記文字画像を復元する復元部と、を備える文字画像復元装置。
【請求項５】
前記復元部が復元する前記文字画像の鮮明度の入力を受け付ける受付部を更に備え、
前記復元部は、前記線形和画像の情報に含まれるサンプル画像の重み係数を、前記受付部が受け付けた前記鮮明度に基づいて変更することを特徴とする請求項４に記載の文字画像復元装置。
【請求項６】
前記復元部は、前記重み係数を変更する際に、前記サンプル画像の劣化度を考慮することを特徴とする請求項５に記載の文字画像復元装置。
【請求項７】
コンピュータが、
文字画像を取得する文字画像取得工程と、
前記文字画像取得工程で取得された前記文字画像の文字認識を行う文字認識工程と、
前記文字認識工程で認識された文字に対応する複数のサンプル画像を取得し、前記複数のサンプル画像を用いた線形和画像を生成する線形和画像生成工程と、
前記文字画像取得工程で取得した前記文字画像と、前記線形和画像との差分画像を生成する差分画像生成工程と、
前記線形和画像の情報と、前記差分画像の情報とを関連付けて、格納手段に格納する格納工程と、を実行する文字画像圧縮方法。
【請求項８】
コンピュータが、
請求項７に記載の文字画像圧縮方法を用いて、前記格納手段に格納された、前記線形和画像の情報と、前記差分画像の情報とを取得する取得工程と、
前記取得工程において取得された情報から前記文字画像を復元する復元工程と、を実行する文字画像復元方法。
【請求項９】
コンピュータに、
文字画像を取得する文字画像取得工程と、
前記文字画像取得工程で取得された前記文字画像の文字認識を行う文字認識工程と、
前記文字認識工程で認識された文字に対応する複数のサンプル画像を取得し、前記複数のサンプル画像を用いた線形和画像を生成する線形和画像生成工程と、
前記文字画像取得工程で取得した前記文字画像と、前記線形和画像との差分画像を生成する差分画像生成工程と、
前記線形和画像の情報と、前記差分画像の情報とを関連付けて、格納手段に格納する格納工程と、を実行させる文字画像圧縮プログラム。
【請求項１０】
コンピュータに、
請求項９に記載の文字画像圧縮プログラムを用いて、前記格納手段に格納された、前記線形和画像の情報と、前記差分画像の情報とを取得する取得工程と、
前記取得工程において取得された情報から前記文字画像を復元する復元工程と、を実行させる文字画像復元プログラム。

【図１】