スキャンされたドキュメントを含むデジタル画像の圧縮
第1の態様は、スキャンされたドキュメントを含む入力デジタル画像から2値マスク画像を作成する方法に関し、入力デジタル画像を2値化することによって2値化画像を作成するステップと、暗い背景に重ねて明るいテキストを表す第1テキスト領域を検出するステップと、第1テキスト領域を反転させることにより、明るい背景に重ねて示された暗いテキストと同様に反転した第1テキスト領域が判別可能となるようにするステップとを有する。第2の態様は、2値画像において第1画素ブロブを第2画素ブロブと比較しこれらが一致シンボルを表すかどうかを決定する方法に関し、一方のブロブに存在する線であって他方には存在しない線を検出するステップ、および/またはブロブのうちの一方がイタリック体のシンボルを表し他方が表さないかどうかを決定するステップを有する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、スキャンされたドキュメントを含む入力デジタル画像を圧縮する、方法、アルゴリズム、およびコンピュータで読み取り可能なプログラム製品に関する。
【背景技術】
【0002】
ITU−T(国際通信連合の電気通信標準化部門)は、勧告T.44において、ミクストラスターコンテント(Mixed Raster Content:MRC)モデルを規定した。このモデルを用いることによって、カラーおよびグレースケールドキュメント画像を、高圧縮レートで、テキストが視認性よく、写真が良好な描写で、圧縮することが可能となる。MRCモデルは、ドキュメント画像を、2値マスク層、前景層、および背景層の3層に分割する。マスク層は2値画像であり、背景および前景層はカラー(またはグレースケール)画像である。2値マスク層内にあるオン画素は、伸張時にカラー(またはグレースケール)が前景層から取り除かれなければならないことを示す。2値マスク層内にあるオフ画素は、伸張時にカラー(またはグレースケール)が背景層から取り除かれなければならないことを示す。しかしながら、ITU−T T.44は、層への分割方法を特定してはいない。
【0003】
米国特許第5,778,092号明細書によると、MRCモデルに対応して、ドキュメントを表すカラーまたはグレースケール画素マップを圧縮する最初の技術が開示されている。画素マップは、低減された解像度の前景プレーン、低減された解像度の背景プレーン、および高解像度の2値プレーンセレクタを有する3枚のプレーン表現に分解される。前景プレーンは、テキストおよびグラフィック要素などの、前景品目のカラーまたはグレースケール情報を含む。背景プレーンは、そのページおよびそのページに含まれる連続階調写真の「背景」のカラーまたはグレースケール情報を含む。プレーンセレクタは、伸張の間に、前景プレーンまたは背景プレーンのうちのいずれか一方から選択する情報を記憶する。各プレーンは、対応するデータタイプに対する適切な圧縮技術を用いて圧縮される。
【0004】
米国特許第6,731,800号明細書によると、スキャンされたカラーおよびグレースケールドキュメントを圧縮する別の技術が開示されており、スキャンされたドキュメントのデジタル画像は、3枚の画像プレーン、すなわち前景画像、背景画像、および2値マスク画像に分割される。マスク画像は、ドキュメントの領域が前景に属すること、および背景に属することを記述する。マスク画像を生成するために、適応的しきい値方法により規定されたやり方で低減された元ドキュメントから、局所的に変化可能なしきい値画像が生成され、元ドキュメントのサイズにもう一度戻る。この技術により、さらに反転テキスト(暗い背景上の明るいテキスト)が検出されることが可能となる。反転テキストは、「穴」の概念によって検出される。「穴」は、前景領域、またはすでに入力された別の前景領域に接するブロブである。この方法は、すべてのブロブが追跡されなければならないので、大量のメモリを必要とし、ブロブが互いに接する場合に検査されなければならないので、多大な時間を必要とする。加えて、「黒色」ブロブおよび「白色」ブロブの両方が記録されなければならない。
【0005】
米国特許第6,748,115号明細書によると、グレーレベルデジタル画像入力を、弱い接続性を最小化する2レベル入力へ変換するグレーレベルしきい値を選択するために用いる画像圧縮技術が開示されており、弱い接続性は、2×2の配列または複数画素の近傍に含まれている市松模様を有している。変換用のしきい値は、単一のパスにおいてドキュメントを有する複数画素の配列を横切り、連続する2×2近傍を分析し、最初に市松模様が現れるグレーレベル値に対してプラスレジスタを増分し、市松模様がもはや存在しないグレーレベル値に対してマイナスレジスタを増分することによって決定される。
【0006】
しかしながら、これらの画像圧縮技術の不利な点は、達成される圧縮レートが不十分なことである。さらにしばしば、再構成された画像品質、たとえばテキストの視認性または写真の描写が、圧縮技術によって影響される。
【0007】
米国特許第5,835,638号明細書によると、同値類へ分類するテキストの2値画像から抽出されたシンボルを比較する方法および装置が開示されている。ハウスドルフ(Hausdorff)類似の方法が、類似のシンボルを比較するために使用される。ビットマップAに含まれるシンボルが、ビットマップBに含まれるシンボルと比較される場合、ビットマップBのシンボルが、過度の誤差密度にならずに、ビットマップAのシンボルの拡張表現へと、許容範囲内に適合するかどうか、およびビットマップAのシンボルが、過度の誤差密度にならずに、ビットマップBのシンボルの拡張表現へと、許容範囲内に適合するかどうかが決定される。両方のテストに通った場合、誤差密度検査が実行され、一致を決定する。
【0008】
この公知のシンボル比較方法の不利な点は、多くの場合、実際に不一致が発生する場所に、一致が返されてもよいことである。
【先行技術文献】
【特許文献】
【0009】
【特許文献1】米国特許第5,778,092号明細書
【特許文献2】米国特許第6,731,800号明細書
【特許文献3】米国特許第6,748,115号明細書
【特許文献4】米国特許第5,835,638号明細書
【非特許文献】
【0010】
【非特許文献1】J.キャニー「エッジ検出に対するコンピュータによるアプローチ」米国電気電子学会、パターン解析および人工知能に関する会報(J.Canny、「A Computational Approach to Edge Detection」、IEEE Transactions on Pattern Analysis and Machine Intelligence)、第8巻、6号、11月、1986年
【発明の概要】
【発明が解決しようとする課題】
【0011】
本発明の第1の目的は、必要とする時間を少なくし、メモリをさらに効率的に使用する画像2値化技術を与えることである。
【0012】
この第1の目的は、第1の独立請求項の画像2値化技術により達成される。
【0013】
本発明の第2の目的は、実質的に置き換えの誤差なしに、最小数のモデルクラスを生成するシンボル比較技術を与えることである。
【0014】
この第2の目的は、第2の独立請求項のシンボル比較技術により達成される。
【0015】
本発明のさらなる目的は、上述した第1および/または第2態様が適用される画像圧縮技術を与えることである。
【課題を解決するための手段】
【0016】
本発明の第1の態様において、スキャンされたドキュメントを含む入力デジタル画像から、2値マスク画像を作成する方法が提案される。方法は、(a)前記入力デジタル画像を2値化することによって、2値化画像を作成するステップと、(b)前記入力デジタル画像内にある暗い背景に重ねて明るいテキストを表す第1テキスト領域を、前記2値化画像において検出するステップと、(c)前記2値化画像において前記第1テキスト領域を反転させることにより、明るい背景に重ねて示された暗いテキストと同様に、反転した第1テキスト領域が判別可能となるようにするステップと、を有する。これらのステップによって、反転したテキスト(暗い背景に重ねて示された明るいテキスト)が、従来例に対してさらに効率的なやり方で、特により速いスピードで、およびより少ない所要メモリ量で、検出することが可能となる。反転によって、正常テキスト(明るい背景に重ねて示された暗いテキスト)と同様に、反転テキストが判別可能となり、反転テキストを検出し、それを2値マスク内に配置するために、いかなる専用のステップおよびアルゴリズムも必要とはならない。
【0017】
本発明の第1の態様における方法は、たとえばMRCモデルを用いる画像圧縮技術において適用されることが可能である。このような技術において、正常テキストと同様に反転テキストを記録する有利な点は、反転テキストが背景ではなく前景内に置くことが可能となることである。結果として、反転テキストは、より高い圧縮レートをもたらすことが可能なシンボルに基づく圧縮技術によって圧縮されることが可能である。さらにその上、通常、低解像度を有し低い品質で圧縮される背景画像だけではなく、前景および背景画像に基づいて画像が再構成されるので、再構成された画像内にある反転テキストの視認性を高めることが可能となる。
【0018】
本発明の第1の態様における方法は、たとえばテキスト認識技術において適用されることが可能である。このような技術において、正常テキストと同様に反転テキストを記録する有利な点は、反転テキストが、正常テキストに加えて認識可能となり、その後テキスト検索が可能となることである。
【0019】
好ましい実施の形態において、本発明の第1の態様における方法は、さらに、(d)前記入力デジタル画像内にある明るい背景に重ねて暗いテキストを表す第2テキスト領域を、前記2値化画像において検出するステップと、(e)たとえば入力画像内にある写真部分からもたらされる写真要素以外には、テキストが実在しないテキスト領域を、2値化画像から取り除くステップと、を有する。
【0020】
入力デジタル画像を2値化することによる、2値化画像の作成は、好ましくは、(a1)前記入力デジタル画像からグレースケール画像を構築するステップと、(a2)前記グレースケール画像内にあるエッジを検出し、エッジ画素および非エッジ画素を含むエッジ2値画像を構築するステップと、(a3)周囲の画素に基づいて、前記エッジ画素のそれぞれに対するしきい値を決定するとともに、前記非エッジ画素にゼロのしきい値を与え、しきい値グレースケール画像を構築するステップと、(a4)周囲のしきい値に基づいて、エッジ画素に接する前記非エッジ画素のそれぞれに対するしきい値を決定するステップと、(a5)最高のしきい値を保つことによって前記しきい値グレースケール画像をスケーリングするステップと、(a6)正の値を有する画素からゼロの値を有する画素へ、しきい値を伝搬させるステップと、(a7)前記グレースケール画像および前記スケーリングされたしきい値グレースケール画像に基づいて、第1の2値画像を構築するステップと、を含む。これらのステップの有利な点は、入力デジタル画像において種々の輝度およびコントラストを有するさらなる要素を検出するために、第1の2値画像を構築するために使用されるしきい値が変化することである。これにより、MRCモデル圧縮技術においては、伸張後の再構成された画像の品質を高めることが可能となる。
【0021】
前記画像内にあるテキストシンボルのエッジを検出するステップ(a2)は、好ましくは、テキストシンボルの前記エッジ検出用にキャニーエッジアルゴリズムの使用を含む。キャニーエッジアルゴリズムは、多数のステージアルゴリズムを使用し、広い範囲のエッジを検出する。キャニーエッジアルゴリズムは、たとえば、J.キャニー「エッジ検出に対するコンピュータによるアプローチ」米国電気電子学会、パターン解析および人工知能に関する会報、第8巻、6号、11月、1986年により開示されており、全体として参照することにより本明細書に援用される。このアルゴリズムの使用により、1つの画像内にあるテキストシンボルの検出および/または認識において、相当な改善をもたらすことが可能となる。
【0022】
さらに好ましくは、2値画像の作成は、(a8)前記グレースケール画像および前記しきい値グレースケール画像に基づいて、第2の2値画像を構築するステップと、(a9)前記第1および第2の2値画像を組み合わせることによって、前記2値化画像を構築するステップと、を含む。これらのステップの有利な点は、入力デジタル画像において種々の輝度およびコントラストを有するさらなる要素を検出するために、第2の2値画像を構築するために使用されるしきい値がさらに変化することである。これにより、MRCモデル圧縮技術においては、伸張後の再構成された画像の品質を高めることが可能となる。
【0023】
1つの実施の形態において、2値マスク画像の作成は、2値マスク解像度低減係数により入力デジタル画像の解像度を低減するステップを含む。このように、2値マスク解像度は、たとえば、再構成された画像における所望の品質に依存して、MRCモデル圧縮技術においてユーザ−側で調整可能となる。
【0024】
本発明の第2の態様は、本発明におけるその他の態様と組み合わせてもよく、組み合わせなくてもよい。この第2の態様では、2値画像において、第1画素ブロブを第2画素ブロブと比較し、該第1および第2画素ブロブが一致シンボルを表すかどうかを決定する方法が提案される。方法は、(f)第1ブロブを拡張し、第2ブロブが前記拡張された第1ブロブの内部に適合するかどうかを検査するステップと、(g)第2ブロブを拡張し、第1ブロブが前記拡張された第2ブロブの内部に適合するかどうかを検査するステップと、を有する。比較方法は、さらに、(h)第1および第2ブロブのうちの一方に存在する線であって、他方には存在しない線を検出するステップと、(i)第1および第2ブロブのうちの一方がイタリック体のシンボルを表し、他方がイタリック体のシンボルを表さないかどうかを決定するステップと、のうち、少なくとも1つのステップを有する。ステップ(h)および(i)は、誤ったシンボル一致の数を効果的に低減する、言い換えれば、不一致シンボルが一致シンボルとして検出されるリスクを効果的に低減することが可能である。
【0025】
本発明の第2の態様に記載の方法において、好ましくは、ステップ(h)は、Nが相当数のビット数、好ましくは3の場合、N×Nのクロスにおいて、前記ブロブのうちの一方内にある1つの線が、他方のブロブ内にある1つの線とは異なるカラーを有するかどうかを検査するステップを含む。
【0026】
本発明の第2の態様に記載の方法において、好ましくは、ステップ(i)は、第1および第2ブロブが共有する黒色画素の数が、所定のしきい値より高いかどうかを検査するステップを含む。この所定のしきい値は、好ましくは1つのブロブ内にある画素の全量の80〜90%に等しく、さらに好ましくは大略85%に等しい。しかしながら、当業者によって適切と判断されるなら、さらに別のしきい値が使用されてもよい。
【0027】
本発明におけるすべての上述した態様は、本発明のさらなる態様の部分であってもよく、すなわち、前記スキャンされたドキュメントを含む前記入力デジタル画像を圧縮する圧縮方法であって、(j)前記ドキュメントの前景要素のカラー情報を含む前景画像と、前記ドキュメントの背景要素のカラー情報を含む背景画像と、前記圧縮されたデジタル画像を伸張するときに前記前景画像および前記背景画像内にある画素から選択する前記2値マスク画像と、を有する多数の画像層へと、前記入力デジタル画像を分割するステップと、(k)適切な圧縮技術によって画像層のそれぞれを圧縮し、圧縮されたデジタル画像を得るステップと、を有する。
【0028】
このさらなる態様において、好ましくは前記2値マスク画像の作成は、2値マスク解像度低減係数により前記入力デジタル画像の解像度を低減するステップを含む。2値マスク解像度は、たとえば、再構成された画像における所望の品質に依存して、ユーザ−側で調整可能である。
【0029】
このさらなる態様において、好ましくは前記前景および背景画像は、それぞれ前景解像度低減係数および背景解像度低減係数により前記解像度を低減することによって構築される。前景および背景解像度は、たとえば、再構成された画像における所望の品質に依存して、ユーザ−側で調整可能である。
【0030】
このさらなる態様において、好ましくは、圧縮は、たとえばJPEG2000または当業者には知られているいずれか別の圧縮技術などの、(k1)画像圧縮技術によって前記前景および背景画像を圧縮するステップと、(k2)シンボルに基づく圧縮技術によって前記2値マスク画像を圧縮するステップと、を含む。
【0031】
本発明による実施の形態の有利な点は、スキャンされたドキュメント用に、再構成された画像の品質に影響せずにより高い圧縮レートが達成されることが可能な画像圧縮技術が与えられることである。
【0032】
本発明による実施の形態の別の有利な点は、テキストの視認性または写真の描写について実質的に妥協しない画像圧縮技術が、与えられることである。
【0033】
本発明による実施の形態の別の有利な点は、小型と品質との間のトレードオフを調整するのに、非常に柔軟性のある画像圧縮技術が与えられることである。
【0034】
本発明による実施の形態の別の有利な点は、たとえば異なるカラーおよび明度のテキスト要素を含んでもよいドキュメント、ならびに/または異なるカラーおよび明度の背景、もしくはたとえば透かしもしくは写真などの一様でない背景上に配置されるテキスト要素を含むドキュメント、などのいずれかのタイプのドキュメントに対して、適切な画像圧縮技術が与えられることである。
【0035】
本発明による実施の形態の別の有利な点は、暗い背景に重ねて示された明るいテキストを含むドキュメントに対して、適切な画像圧縮技術が与えられることである。
【0036】
本発明による実施の形態の別の有利な点は、水平および垂直のグラフィック線が高い品質で伸張されることが可能な画像圧縮技術が与えられることである。
【0037】
本発明による実施の形態の別の有利な点は、特定のタイプのドキュメントに対して設定される必要がある、ドキュメント特定のパラメータが少しも無い画像圧縮技術が与えられることである。
【図面の簡単な説明】
【0038】
【図1】本発明に従うMRCモデル圧縮アルゴリズムの全体のフローチャートを示す。
【図2】図1のフローチャートにおける分割ステップの詳細なフローチャートを示す。
【図3】図2のフローチャートにおける2値化ステップの詳細なフローチャートを示す。
【図4】図2のフローチャートにおける前景要素の選択ステップの詳細なフローチャートを示す。
【図5】図4のフローチャートにおける大きいブロブ除去ステップおよび白色ブロブ反転ステップの詳細なフローチャートを示す。
【図6】図5のフローチャートにおいてさらに水平および垂直のグラフィック要素が保たれる場合の変形を示す。
【図7】図2のフローチャートにおける背景画像構築ステップの詳細なフローチャートを示す。
【図8】図2のフローチャートにおける前景画像構築ステップの詳細なフローチャートを示す。
【図9】本発明に従うシンボル比較アルゴリズムのフローチャートを示す。
【図10】図9のシンボル比較アルゴリズムにおけるステップの可視化を示す。
【図11】図1〜8の方法によって圧縮可能な入力カラー画像の一例を示す。
【図12】2値化ステップ後における図11の画像を示す。
【図13】図11の画像から構築された2値マスク画像を示す。
【図14】図11の画像から構築された背景画像を示す。
【図15】図11の画像から構築された前景画像を示す。
【図16】図13〜15の画像によって構築された、再構成された画像を示す。
【図17】図13の2値マスク画像が図12の2値化された画像からいかに構築されるかをステップ的に示す。
【図18】図13の2値マスク画像が図12の2値化された画像からいかに構築されるかをステップ的に示す。
【図19】図13の2値マスク画像が図12の2値化された画像からいかに構築されるかをステップ的に示す。
【図20】図13の2値マスク画像が図12の2値化された画像からいかに構築されるかをステップ的に示す。
【図21】図13の2値マスク画像が図12の2値化された画像からいかに構築されるかをステップ的に示す。
【発明を実施するための形態】
【0039】
本発明は、次の説明および添付の図面によって、さらに明らかにされる。
【0040】
本発明は、特定の実施の形態について、およびいくらかの図面を参照して説明される。しかしながら本発明は、これらの実施の形態および図面に限定されず、請求項によってだけ限定される。説明される図面は、図式的なものにすぎず、非限定的である。図面において、要素のいくつかのサイズは、誇張されてもよく、例示的な目的のために、定規に合わせて描かれなくてもよい。寸法および相対的寸法は、本発明の実際の具体化物に必ずしも一致しない。
【0041】
さらにその上、明細書および請求項における、第1、第2、第3、および類似の用語は、類似の要素間の区別用に使用され、必ずしも順次的または時系列的順番を説明するものではない。用語は、適切な状況の下で交換可能であり、本発明の実施の形態は、本明細書において説明されまたは図示される以外の別の一連の処理において動作することが可能である。
【0042】
さらにその上、明細書および請求項における、一番上の、一番下の、上方の、下方のおよび類似の用語は、便宜的に使用されており、必ずしも相対的場所を説明するものではない。使用されている用語は、適切な状況の下で交換可能であり、本明細書において説明される本発明の実施の形態は、本明細書において説明されまたは図示される以外の別の方向性において動作することが可能である。
【0043】
請求項において使用される「有する(含む)」の用語は、閉鎖的限定列挙の意味に解釈されるべきではなく、別の要素またはステップを除外してはいない。この用語は、参照されるような、定められた特徴、統合部分、ステップ、または構成要素の存在を特定するとして解釈される必要があるが、しかし1つ以上の別の特徴、統合部分、ステップもしくは構成要素、またはこれらの組み合わせの存在もしくは追加を除外しない。それゆえに、表現「手段AおよびBを有する(含む)装置」は、構成要素AおよびBに閉鎖的限定解釈されるべきではない。本発明に関して、装置のうち必須の構成要素がAおよびBであるということを意味する。
【0044】
本実施の形態では、「カラー画像」は、カラーラスター画像、すなわちカラー値を表す各画素を有する画素マップを意味すると意図される。
【0045】
本実施の形態では、「グレースケール画像」は、明度値を表す各画素を有する画素マップを意味すると意図される。
【0046】
本実施の形態では、「2値画像」または「2値化された画像」は、2値性画像、たとえば黒色&白色画像、すなわち2値(オンまたはオフ、1または0、黒色または白色)を表す各画素を有する画素マップを意味すると意図される。
【0047】
本実施の形態では、「2値化」は、カラーまたはグレースケール画像を2値画像に変換する動作を参照すると意図される。
【0048】
本実施の形態では、2つの2値画像の「AND」動作は、2つの元の画像において対応する画素の論理積を作成し、結果を目標画像内に入れる動作を参照すると意図される。
【0049】
本実施の形態では、2つの2値画像の「OR」動作は、2つの元の画像において対応する画素の論理和を作成し、結果を目標画像内に入れる動作を参照すると意図される。
【0050】
本実施の形態では、2つの2値画像の「XOR」動作は、2つの元の画像において対応する画素の排他的論理和を作成し、結果を目標画像内に入れる動作を参照すると意図される。
【0051】
本実施の形態では、2値画像の「反転」は、元の画像における各画素を反転させ、結果を目標画像内に入れる動作を参照すると意図される。
【0052】
本実施の形態では、2値画像の「拡張」は、各黒色画素に対して、N×Nの黒色模様を、目標画像内の対応する黒色画素位置を中心とするように、目標画像に加える動作を参照すると意図される。たとえば、3×3黒色模様による拡張は、各黒色画素に対して、3×3黒色模様を目標画像に加える動作を意味する。
【0053】
本実施の形態では、グレースケール画像の「拡張」は、各画素に対して、この画素を中心とするN×N(たとえば、3×3)の4角形内でもっとも暗い画素の値を検索し、目標画像の対応する画素をこの値にする動作を参照すると意図される。
【0054】
本実施の形態では、2つの2値画像における「ブロブ(blob:塊)」は、接続された黒色または白色画素のグループを参照すると意図される。
【0055】
次に、画像圧縮方法の例を用いて、本発明の態様が説明される。ここで留意すべきは、説明されるアルゴリズムの多くは、さらに別の方法で与えられてもよく、たとえばテキスト認識などのアルゴリズムであってもよい。さらにその上、本発明の範囲から逸脱せずに、多くの修正が、説明されるステップおよびアルゴリズムになされてもよい。
【0056】
図1に示される圧縮方法は、MRCモデルに基づいており、入力されたカラーまたはグレースケール画像は、3つの層に分割され、その後、各層は、適切な圧縮技術によって別々に圧縮される。特に、入力されたカラー画像1は、背景解像度低減係数2、前景解像度低減係数3、および2値マスク解像度低減係数4をパラメータとする分割アルゴリズム100によって、背景画像5、2値マスク画像6、および前景画像7へと分割される。マスク画像6は2値画像であり、背景および前景画像5、7は、(入力された画像1がカラーまたはグレースケールかどうかに依存して)カラーまたはグレースケール画像である。2値マスク画像6内にあるオン画素は、伸張する場合に、カラー(またはグレースケール)が前景画像7から取り除かれなければならないことを示す。2値マスク画像6内にあるオフ画素は、伸張する場合に、カラー(またはグレースケール)が背景画像5から取り除かれなければならないことを示す。引き続いて、背景画像5は、背景品質8をパラメータとする(たとえば、JPEG2000などの)画像圧縮技術300によって圧縮され、2値マスク画像6は、マスク品質9をパラメータとする(たとえば、JBIG2などの)シンボルに基づく圧縮技術によって圧縮され、前景画像7は、前景品質10を入力とする(たとえばJPEG2000などの)画像圧縮技術500によって圧縮される。最後に、圧縮された画像は、たとえばPDFなどの、ドキュメント読み取り可能フォーマット内にカプセル化され、圧縮された画像11を生成する。
【0057】
分割アルゴリズム100は、図2〜8によって詳述され、ステップおよびサブアルゴリズムが示される。一般に、図2に示されるように、分割は次のステップを有する。入力された画像1は、適応局所アルゴリズム110により2値化され、2値化された画像123をもたらす。ステップ125において、2値化された画像123から前景要素が選択され、2値マスク画像6を構築する。この2値マスク画像6は、入力された画像1に基づいて、ステップ170において背景画像5を構築し、ステップ180において前景画像7を構築するために使用される。ステップ170および180は、それぞれ背景解像度低減係数2および前景解像度低減係数3を考慮に入れる。ステップ126は、任意選択のステップであり、2値マスク解像度低減係数4に基づいて2値マスク画像6の解像度を低減する。
【0058】
図3に示されるように、入力された画像1の2値化は、次のステップによる適応局所アルゴリズム110を有する。ステップ111において、入力された画像1(カラーの場合)は、画素明度を計算することによって、グレースケール画像へと変換される。このグレースケール画像は、ノイズを低減するために(たとえばガウシアンフィルタによって)平滑化されてもよい。
【0059】
次にステップ112では、グレースケール画像においてキャニーエッジ検出アルゴリズムによってエッジが検出される。キャニーエッジ検出アルゴリズムは、1986年に、ジョン.エフ.キャニー(John F.Canny)によって開発された。キャニーエッジ検出アルゴリズムは、多数のステージアルゴリズムを使用し、広い範囲のエッジを検出する。キャニーエッジ検出アルゴリズムは、たとえば、J.キャニー「エッジ検出に対するコンピュータによるアプローチ」米国電気電子学会、パターン解析および人工知能に関する会報、第8巻、6号、11月、1986年において説明されており、全体として参照することにより本明細書に援用される。アルゴリズムは、エッジ輪郭を破壊することを回避するために、2つのしきい値、「Thigh」および「Tlow」を使用する。エッジ輪郭は、Thighよりも大きい勾配の画素で始まり、Thighよりも低くTlowよりも大きな勾配の画素に対してさえも続くことが可能である。本発明によれば、TlowおよびThighの典型的な値は、1バイトのグレースケール画像に対してそれぞれ32および40である。キャニーエッジ検出アルゴリズムは、グレースケール画像内にあるテキストおよびグラフィック要素のエッジを検出するために、使用される。このようにすることにより、写真のエッジもまた検出されるが、写真要素は、あとで(後述のステップ160を参照)フィルタが掛けられるので問題とはならない。キャニーエッジ検出器は2値画像を生成し、この2値画像においてエッジ画素だけが1に設定される。
【0060】
別のエッジ検出アルゴリズムに対して、キャニーエッジ検出アルゴリズムは、次の有利な点を提供する。
− 良好な検出:このアルゴリズムは、画像内にある実在のエッジをできるかぎり多くマークする。
− 良好な位置決め:マークされたエッジは、実在の画像内にあるエッジにできるだけ近い。
− 最小限の応答:画像内にある所定のエッジはいったんマークされるだけであり、可能であれば、画像ノイズは偽のエッジを作成しない。
【0061】
次にステップ113において、エッジ2値画像出力の各エッジ画素に対して、キャニーエッジアルゴリズム112によってしきい値が計算される。しきい値は、最低値と最高値との和の半分となる。最低値は、分析される画素を中心とする3×3の4角形における最低値である。最高値は、分析される画素を中心とする3×3の4角形における最高値である。非エッジ画素は0のしきい値を受ける。
【0062】
次にステップ114において、エッジ画素に接する非エッジ画素に、しきい値が割り当てられる。しきい値は、入力から出力へとコピーされる。非エッジ画素(値=0)にとっては、3×3の4角形は各画素を中心とする。この4角形内にある画素のしきい値の合計が計算され、エッジ画素があればエッジ画素の数によって分割される。この値は、出力画像上にコピーされる。ステップ114の出力はしきい値グレースケール画像である。
【0063】
次にステップ115において、このしきい値グレースケール画像は、ある整数の係数分だけ、好ましくは4だけスケーリングされる。出力画像は0で初期化される。各出力画素に対して、対応する入力画素の値は加算され、非ゼロ値があれば非ゼロ値の数によって分割される。
【0064】
次にステップ116において、しきい値は近隣における値で平均化される。3×3の4角形は、0とは異なる値の各画素を中心とする。この4角形内にある画素のしきい値の合計が計算され、非ゼロ値があれば非ゼロ値の数によって分割される。この値は、出力画像上にコピーされる。
【0065】
次にステップ117において、しきい値は、しきい値を有しない画素へと伝搬する。第1に、しきい値は、ステップ114と大略同様に、ゼロ値画素に接する非ゼロ値画素に割り当てられる。第2に、2パス伝搬アルゴリズムが使用される。1番目のパスにおいて、画像は左から右へ、および上から下へスキャンされる。ゼロ値画素の値は、最小の非ゼロ値を有する隣接画素の値にされる。2番目のパスにおいて、画像は右から左へ、および下から上へスキャンされる。再び、ゼロ値画素の値は、最小の非ゼロ値を有する隣接画素の値にされる。このように、すべての画素がしきい値を受ける。
【0066】
次にステップ118において、ステップ111からのグレースケール画像出力と、ステップ117からのしきい値がスケーリングされたグレースケール画像出力との組み合わせによって、第1の2値画像119が構築される。グレースケール画像内にある各画素の値は、スケーリングされたしきい値画像内にある対応する画素のしきい値と比較される。第1の2値画像119において、画素値がしきい値を下回るか上回るかに依存して、1または0の値が設定される。
【0067】
ステップ120において、ステップ111からのグレースケール画像出力と、ステップ114からのしきい値グレースケール画像出力との組み合わせによって、第2の2値画像121が構築される。グレースケール画像内にある各画素の値は、しきい値画像内にある対応する画素のしきい値と比較される。第2の2値画像121において、画素値がしきい値を下回るか上回るかに依存して、1または0の値が設定される。
【0068】
最後に2値化アルゴリズム110のステップ122において、第1の2値画像119と第2の2値画像121との論理和(OR)がなされ、2値化された画像123を生成する。
【0069】
2値化された画像123は、テキストおよびグラフィック要素に加えて、入力された画像1内にある写真部分からの要素を含む。これらの要素は取り除かれ、2値マスク画像6内には発生しないことが望ましい。さらにその上、黒色のテキスト要素に重ねて示された白色のテキスト要素が反転することにより、白色テキストに重ねて示された黒色テキストと同様に判別可能となる。これは、2値マスク画像6におけるさらなる処理において、非常に有利な点となる。これらのステップは、図4に示される選択アルゴリズム125によって実行される。
【0070】
サブアルゴリズム130または140によって、2値化された画像123から大きいブロブが取り除かれ、白色ブロブが反転する。2つの間の差は、サブアルゴリズム140では、水平および垂直のグラフィック要素を保つためのステップが加えられることである。
【0071】
図5に示されるサブアルゴリズム130は、次のステップを有する。ステップ131において、大きい黒色ブロブ、すなわち所定の最低値を上回る相当数の画素を有するブロブ、だけが保たれる。次にステップ132において、保たれたブロブを含む画像が反転する(INVERT)。ステップ133において、この反転した画像と2値化された画像との論理積(AND)がなされる。これらのステップは、ステップ132の画像出力に対して繰り返される。すなわちステップ134において、再び大きい黒色ブロブだけが保たれ、ステップ135において、保たれたブロブを含む画像が反転し、ステップ136において、ステップ132の画像出力との論理積がなされる。最後に、ステップ137において、ステップ133の画像出力とステップ136の画像出力との排他的論理和(XOR)がなされ、変換された2値画像138となる。
【0072】
図6に示されるサブアルゴリズム140は、次のステップを有する。除去ステップ141および排他的論理和ステップ142によって、2値化された画像123から水平および垂直のグラフィック要素が分離される。ステップ143〜145は、サブアルゴリズム130のステップ131〜133に一致する。さらに、除去ステップ146および排他的論理和ステップ147によって、ステップ144の画像出力から水平および垂直のグラフィック要素が分離される。これらの分離されたグラフィック要素は、ステップ148において、排他的論理和ステップ142の出力と排他的論理和ステップ147の出力との論理和を作成するとによって組み合わせられる。ステップ149〜151は、サブアルゴリズム130のステップ134〜136に一致する。再びステップ152において、論理積ステップ145の画像出力と論理積ステップ151の画像出力との排他的論理和がなされる。最後にステップ156において、排他的論理和ステップ152の出力と論理和ステップ148の出力との論理和を作成することによって、変換された2値画像157が生成され、水平および垂直のグラフィック要素を画像へ戻す。
【0073】
黒色テキスト要素に重ねて示された白色テキスト要素を反転させる上述したステップの有利な点は、ドキュメントにおけるすべてのブロブの記述(ビットマップまたは実行リスト)を記憶する必要がないことである。従来例の方法では、特に、穴(別のブロブに囲まれたブロブ)を探し出すことによって、黒色ブロブに重ねて示された白色ブロブを反転させるために、これが必要となる。アルゴリズム130および140において、ブロブは見つけられるやいなや処理され、ブロブが処理された後、その記述は取り除かれる。
【0074】
図4に戻ると、写真ブロブを取り除くこと(すなわちテキスト要素が存在しないブロブ)によって、変換された2値画像138/157から2値マスク画像6が生成される。これは、当技術分野で周知の最小記述長原理を使用する、フィルタを掛けるステップ160によって達成される。各ブロブに対して、前景要素または背景要素のうちのいずれであるかが決定される。最小記述長原理を適用する場合に、ストラテジーは、ブロブが前景であるとして圧縮される場合と、背景の一部分であるとして圧縮される場合とにおいて、いずれの場合がより良好に圧縮されるかを知ることにある。ブロブは、背景内にある場合、背景画像において圧縮される。ブロブは、前景内にある場合、2値マスク画像および前景画像において圧縮される。それで、異なる圧縮のコストを見積もる必要がある。見積もりは、単純なモデルを用いてなされる。背景モデルは、カラーが滑らかに変化すると仮定する。画素のカラーは、その近隣の画素と大きくは異ならない。画素カラーと局所的平均のカラーとの間の誤差の合計がコストとなる。前景モデルは、ブロブにおけるすべての画素が同じカラーを有していると仮定する。これは、通常は、テキスト要素の場合である。画素カラーと平均のカラーとの間の誤差の合計がコストとなる。2値マスクモデルは、圧縮コストがブロブの周囲に依存すると仮定する。そうすると、
背景コスト < 前景コスト + 周囲*係数
の場合、ブロブは背景の一部分となり、(フィルタが掛けられる)。
【0075】
係数はパラメータだけであり、大量のページをテストすることによって調整される。ここで再び、ブロブは、見つけられるやいなや処理される。ブロブが処理された後、記述は取り除かれる。
【0076】
図7に示されるように、背景画像5は、入力された画像1と、2値マスク画像6と、ユーザ−規定可能なパラメータであってもよい背景解像度低減係数2とを入力とするアルゴリズム170によって生成される。ステップ171において、2値マスク画像は拡張される。ステップ172において、解像度は背景解像度低減係数2によって低減される。同様にステップ173において、入力された画像1の解像度は、背景解像度低減係数2によって低減される。その結果、画像は、ステップ174において組み合わせられ、「空き」画素を満たす。低減された2値マスク画像においてオンとなる、低減された入力画像における画素のカラーは、2つのステップの順次的なアルゴリズムを用いることによって、変更される。1番目のパスにおいて、2つの画像が左から右へ、および上から下へスキャンされる。「空き」画素に出会った場合(低減された2値マスク内のオフ値)、3×3の4角形は、低減された入力画像内のこの「空き」画素を中心とし、この4角形内にある画素のカラー値の合計が計算され、非空き画素があれば非空き画素の数によって分割される。このカラー値は、低減された入力画像内の画素に割り当てられる。2番目のパスにおいて、2つの画像が右から左へ、および下から上へスキャンされる。再び、「空き」画素に出会った場合、1番目のパスと同様にカラー値がこの「空き」画素に割り当てられる。
【0077】
図8に示されるように、前景画像7は、入力された画像1と、2値マスク画像6と、ユーザ−規定可能なパラメータであってもよい前景解像度低減係数3とを入力とするアルゴリズム180によって生成される。ステップ181および182において、2値マスク画像は引き続いて反転し、拡張される。ステップ183において、解像度は前景解像度低減係数2によって低減される。同様にステップ185において、入力された画像1の解像度は、前景解像度低減係数2によって低減される。その結果、画像は、ステップ186において組み合わせられ、「空き」画素を満たす。低減された2値マスク画像においてオンとなる、低減された入力画像における画素のカラーは、ステップ174に類似の、2つのステップの順次的なアルゴリズムを用いることによって、変更される。
【0078】
図1〜8の方法によって圧縮された画像の一例が、図11〜16に示される。図11は、300dpiでスキャンされたドキュメントである、入力されたカラー画像1を示す。図12は、2値化110後の2値化された画像123を示し、図13は、前景要素125の選択後の2値マスク画像6を示す。2値マスク画像もまた300dpiの解像度であり、この場合は2値マスク解像度低減係数が1に設定されている(低減なし)ことを意味する。図14は背景画像5を示し、背景画像5は100dpiの解像度であり、背景解像度低減係数が3に設定されていることを意味する。図15は前景画像7を示し、前景画像7は50dpiの解像度であり、前景解像度低減係数が6に設定されていることを意味する。図16は、圧縮された画像11の伸張後に達成される、再構成された画像12を示す。2値マスク画像は300dpiの解像度であるので、再構成された画像もまた300dpiの解像度であり、すなわち入力された画像1と同じ解像度となる。図11および16の比較から、再構成された画像の高い品質が、図1〜8の圧縮方法によって達成可能であることが明らかである。
【0079】
図17〜21は、前景要素選択処理125によって、2値化された画像123から2値マスク画像6がいかに構築されるかを示す(図4〜6を参照)。図17は、画像の中央にある垂直の黒色線の分離後、すなわちステップ141の後の、2値化された画像123を示す。図18は、大きい黒色ブロブだけが保たれ、反転した後、すなわちステップ143および144の後の、2値化された画像123を示す。図19は、大きい黒色ブロブを有しない、2値化された画像123を示す。これは、ステップ145において図17および18の画像の論理積を行うことによって達成される。図20は、ステップ146〜151の後の結果、すなわち大きい黒色ブロブを有しない、反転した画像を示す。ステップ152において、図19および20におけるこれら2つの画像の排他的論理和を行うことによって、変換された2値画像138/157が達成される。変換された2値画像138/157は、2値化された画像123において、大きい黒色ブロブが取り除かれ、白色ブロブが反転した画像となっている。この変換された画像は、図21に示される。元の画像1内にある暗い背景または「反転したテキスト」に重ねて明るいテキストを表すテキスト領域は、元の画像1内にある明るい背景または「正常テキスト」に重ねて示された暗いテキストと同様に、白色に重ねて示された黒色として表されると理解することが可能である。図13の2値マスク画像6は、ステップ160において、写真ブロブに対してフィルタを掛けることによって、図21の変換された画像から構築される。
【0080】
図9は、本発明の第2の態様に従うシンボル分類アルゴリズムを示す。このシンボル分類アルゴリズムは、2値マスク画像6を圧縮するために使用される、シンボルに基づく圧縮アルゴリズム400の一部分であってもよい。シンボル分類アルゴリズムは、たとえば2値マスク画像6などの2値画像を入力とし、シンボルのリストおよびシンボル発生のリストを出力する。シンボルのリスト内にある品目は、シンボルIDおよびシンボルビットマップを含む。発生のリスト内にある品目は、一致シンボルIDおよびページ内の発生場所を含む。
【0081】
シンボル分類アルゴリズムは、次のステップを有する。ステップ403および404において、第1画素ブロブ401が第2画素ブロブ402の拡張内に適合するかどうかが決定される。適合しない場合、「不一致」が戻される。適合する場合、ステップ405および406において、第2画素ブロブ402が第1画素ブロブ401の拡張内に適合するかどうかが決定される。適合しない場合、「不一致」が戻される。適合する場合、「一致」のように見えるが、しかし誤差を回避するためにさらに2つの検査がなされる。ステップ407および408において、ブロブ401、402のうちの一方が、他方において存在しない線を有するかどうかが決定される。さらに詳しくは、これは、ブロブのうちの一方内にある1つの線が、他方のブロブ内にある別の線とは異なるカラーを有する、3×3のクロスを検査するステップを含む。ステップ409および411において、ブロブ401、402のうちの一方がイタリック体のシンボルを表し、他方が表さないかどうかが決定される。さらに詳しくは、これは、第1および第2ブロブ401、402が共有する黒色画素の数が、所定のしきい値410を越えるかどうかを検査するステップを含む。この所定のしきい値は、好ましくは1つのブロブ内にある画素の全量の80〜90%に等しく、さらに好ましくは大略85%に等しい。
【0082】
これらのステップは、図10において視覚化されている。上の行は、互いの拡張(ステップ403〜406)へと適合し、結果423が一致となる、2つの画素ブロブ421および422を表す。中央の行は、さらに互いの拡張(ステップ403〜406)へと適合し、しかし明らかに一致とはならない、2つの画素ブロブ431および432を表す。この種の誤差は、ブロブのうちの一方内にある1つの線が、他方のブロブ内にある他方の線とは異なるカラーを有する、3×3のクロス433、434を検査することによって取り除かれる(ステップ407〜408)。第1ブロブ431に重ねて示されたクロス433において垂直線435は黒色であり、一方、第2ブロブ432に重ねて示された対応するクロス434内にある水平線436は白色であり、結果437は不一致となる。下の行は、互いの拡張へとさらに適合し(ステップ403〜406)、しかし、ブロブ442がイタリック体のシンボルであり、ブロブ441がイタリック体のシンボルではないので、明らかに一致ではない、2つの画素ブロブ441および442を表す。この種の誤差は、ブロブ441とブロブ442との論理積を行い、その結果が443に示されるようになる(共通の黒色画素が結果443において黒色となる)ステップ、および共通の画素の数がしきい値410を越えるかどうかを検査するステップによって取り除かれる(ステップ409〜411)。この例では、443内にある画素の数はしきい値410を下回り、それゆえ不一致が検出される。
【技術分野】
【0001】
本発明は、スキャンされたドキュメントを含む入力デジタル画像を圧縮する、方法、アルゴリズム、およびコンピュータで読み取り可能なプログラム製品に関する。
【背景技術】
【0002】
ITU−T(国際通信連合の電気通信標準化部門)は、勧告T.44において、ミクストラスターコンテント(Mixed Raster Content:MRC)モデルを規定した。このモデルを用いることによって、カラーおよびグレースケールドキュメント画像を、高圧縮レートで、テキストが視認性よく、写真が良好な描写で、圧縮することが可能となる。MRCモデルは、ドキュメント画像を、2値マスク層、前景層、および背景層の3層に分割する。マスク層は2値画像であり、背景および前景層はカラー(またはグレースケール)画像である。2値マスク層内にあるオン画素は、伸張時にカラー(またはグレースケール)が前景層から取り除かれなければならないことを示す。2値マスク層内にあるオフ画素は、伸張時にカラー(またはグレースケール)が背景層から取り除かれなければならないことを示す。しかしながら、ITU−T T.44は、層への分割方法を特定してはいない。
【0003】
米国特許第5,778,092号明細書によると、MRCモデルに対応して、ドキュメントを表すカラーまたはグレースケール画素マップを圧縮する最初の技術が開示されている。画素マップは、低減された解像度の前景プレーン、低減された解像度の背景プレーン、および高解像度の2値プレーンセレクタを有する3枚のプレーン表現に分解される。前景プレーンは、テキストおよびグラフィック要素などの、前景品目のカラーまたはグレースケール情報を含む。背景プレーンは、そのページおよびそのページに含まれる連続階調写真の「背景」のカラーまたはグレースケール情報を含む。プレーンセレクタは、伸張の間に、前景プレーンまたは背景プレーンのうちのいずれか一方から選択する情報を記憶する。各プレーンは、対応するデータタイプに対する適切な圧縮技術を用いて圧縮される。
【0004】
米国特許第6,731,800号明細書によると、スキャンされたカラーおよびグレースケールドキュメントを圧縮する別の技術が開示されており、スキャンされたドキュメントのデジタル画像は、3枚の画像プレーン、すなわち前景画像、背景画像、および2値マスク画像に分割される。マスク画像は、ドキュメントの領域が前景に属すること、および背景に属することを記述する。マスク画像を生成するために、適応的しきい値方法により規定されたやり方で低減された元ドキュメントから、局所的に変化可能なしきい値画像が生成され、元ドキュメントのサイズにもう一度戻る。この技術により、さらに反転テキスト(暗い背景上の明るいテキスト)が検出されることが可能となる。反転テキストは、「穴」の概念によって検出される。「穴」は、前景領域、またはすでに入力された別の前景領域に接するブロブである。この方法は、すべてのブロブが追跡されなければならないので、大量のメモリを必要とし、ブロブが互いに接する場合に検査されなければならないので、多大な時間を必要とする。加えて、「黒色」ブロブおよび「白色」ブロブの両方が記録されなければならない。
【0005】
米国特許第6,748,115号明細書によると、グレーレベルデジタル画像入力を、弱い接続性を最小化する2レベル入力へ変換するグレーレベルしきい値を選択するために用いる画像圧縮技術が開示されており、弱い接続性は、2×2の配列または複数画素の近傍に含まれている市松模様を有している。変換用のしきい値は、単一のパスにおいてドキュメントを有する複数画素の配列を横切り、連続する2×2近傍を分析し、最初に市松模様が現れるグレーレベル値に対してプラスレジスタを増分し、市松模様がもはや存在しないグレーレベル値に対してマイナスレジスタを増分することによって決定される。
【0006】
しかしながら、これらの画像圧縮技術の不利な点は、達成される圧縮レートが不十分なことである。さらにしばしば、再構成された画像品質、たとえばテキストの視認性または写真の描写が、圧縮技術によって影響される。
【0007】
米国特許第5,835,638号明細書によると、同値類へ分類するテキストの2値画像から抽出されたシンボルを比較する方法および装置が開示されている。ハウスドルフ(Hausdorff)類似の方法が、類似のシンボルを比較するために使用される。ビットマップAに含まれるシンボルが、ビットマップBに含まれるシンボルと比較される場合、ビットマップBのシンボルが、過度の誤差密度にならずに、ビットマップAのシンボルの拡張表現へと、許容範囲内に適合するかどうか、およびビットマップAのシンボルが、過度の誤差密度にならずに、ビットマップBのシンボルの拡張表現へと、許容範囲内に適合するかどうかが決定される。両方のテストに通った場合、誤差密度検査が実行され、一致を決定する。
【0008】
この公知のシンボル比較方法の不利な点は、多くの場合、実際に不一致が発生する場所に、一致が返されてもよいことである。
【先行技術文献】
【特許文献】
【0009】
【特許文献1】米国特許第5,778,092号明細書
【特許文献2】米国特許第6,731,800号明細書
【特許文献3】米国特許第6,748,115号明細書
【特許文献4】米国特許第5,835,638号明細書
【非特許文献】
【0010】
【非特許文献1】J.キャニー「エッジ検出に対するコンピュータによるアプローチ」米国電気電子学会、パターン解析および人工知能に関する会報(J.Canny、「A Computational Approach to Edge Detection」、IEEE Transactions on Pattern Analysis and Machine Intelligence)、第8巻、6号、11月、1986年
【発明の概要】
【発明が解決しようとする課題】
【0011】
本発明の第1の目的は、必要とする時間を少なくし、メモリをさらに効率的に使用する画像2値化技術を与えることである。
【0012】
この第1の目的は、第1の独立請求項の画像2値化技術により達成される。
【0013】
本発明の第2の目的は、実質的に置き換えの誤差なしに、最小数のモデルクラスを生成するシンボル比較技術を与えることである。
【0014】
この第2の目的は、第2の独立請求項のシンボル比較技術により達成される。
【0015】
本発明のさらなる目的は、上述した第1および/または第2態様が適用される画像圧縮技術を与えることである。
【課題を解決するための手段】
【0016】
本発明の第1の態様において、スキャンされたドキュメントを含む入力デジタル画像から、2値マスク画像を作成する方法が提案される。方法は、(a)前記入力デジタル画像を2値化することによって、2値化画像を作成するステップと、(b)前記入力デジタル画像内にある暗い背景に重ねて明るいテキストを表す第1テキスト領域を、前記2値化画像において検出するステップと、(c)前記2値化画像において前記第1テキスト領域を反転させることにより、明るい背景に重ねて示された暗いテキストと同様に、反転した第1テキスト領域が判別可能となるようにするステップと、を有する。これらのステップによって、反転したテキスト(暗い背景に重ねて示された明るいテキスト)が、従来例に対してさらに効率的なやり方で、特により速いスピードで、およびより少ない所要メモリ量で、検出することが可能となる。反転によって、正常テキスト(明るい背景に重ねて示された暗いテキスト)と同様に、反転テキストが判別可能となり、反転テキストを検出し、それを2値マスク内に配置するために、いかなる専用のステップおよびアルゴリズムも必要とはならない。
【0017】
本発明の第1の態様における方法は、たとえばMRCモデルを用いる画像圧縮技術において適用されることが可能である。このような技術において、正常テキストと同様に反転テキストを記録する有利な点は、反転テキストが背景ではなく前景内に置くことが可能となることである。結果として、反転テキストは、より高い圧縮レートをもたらすことが可能なシンボルに基づく圧縮技術によって圧縮されることが可能である。さらにその上、通常、低解像度を有し低い品質で圧縮される背景画像だけではなく、前景および背景画像に基づいて画像が再構成されるので、再構成された画像内にある反転テキストの視認性を高めることが可能となる。
【0018】
本発明の第1の態様における方法は、たとえばテキスト認識技術において適用されることが可能である。このような技術において、正常テキストと同様に反転テキストを記録する有利な点は、反転テキストが、正常テキストに加えて認識可能となり、その後テキスト検索が可能となることである。
【0019】
好ましい実施の形態において、本発明の第1の態様における方法は、さらに、(d)前記入力デジタル画像内にある明るい背景に重ねて暗いテキストを表す第2テキスト領域を、前記2値化画像において検出するステップと、(e)たとえば入力画像内にある写真部分からもたらされる写真要素以外には、テキストが実在しないテキスト領域を、2値化画像から取り除くステップと、を有する。
【0020】
入力デジタル画像を2値化することによる、2値化画像の作成は、好ましくは、(a1)前記入力デジタル画像からグレースケール画像を構築するステップと、(a2)前記グレースケール画像内にあるエッジを検出し、エッジ画素および非エッジ画素を含むエッジ2値画像を構築するステップと、(a3)周囲の画素に基づいて、前記エッジ画素のそれぞれに対するしきい値を決定するとともに、前記非エッジ画素にゼロのしきい値を与え、しきい値グレースケール画像を構築するステップと、(a4)周囲のしきい値に基づいて、エッジ画素に接する前記非エッジ画素のそれぞれに対するしきい値を決定するステップと、(a5)最高のしきい値を保つことによって前記しきい値グレースケール画像をスケーリングするステップと、(a6)正の値を有する画素からゼロの値を有する画素へ、しきい値を伝搬させるステップと、(a7)前記グレースケール画像および前記スケーリングされたしきい値グレースケール画像に基づいて、第1の2値画像を構築するステップと、を含む。これらのステップの有利な点は、入力デジタル画像において種々の輝度およびコントラストを有するさらなる要素を検出するために、第1の2値画像を構築するために使用されるしきい値が変化することである。これにより、MRCモデル圧縮技術においては、伸張後の再構成された画像の品質を高めることが可能となる。
【0021】
前記画像内にあるテキストシンボルのエッジを検出するステップ(a2)は、好ましくは、テキストシンボルの前記エッジ検出用にキャニーエッジアルゴリズムの使用を含む。キャニーエッジアルゴリズムは、多数のステージアルゴリズムを使用し、広い範囲のエッジを検出する。キャニーエッジアルゴリズムは、たとえば、J.キャニー「エッジ検出に対するコンピュータによるアプローチ」米国電気電子学会、パターン解析および人工知能に関する会報、第8巻、6号、11月、1986年により開示されており、全体として参照することにより本明細書に援用される。このアルゴリズムの使用により、1つの画像内にあるテキストシンボルの検出および/または認識において、相当な改善をもたらすことが可能となる。
【0022】
さらに好ましくは、2値画像の作成は、(a8)前記グレースケール画像および前記しきい値グレースケール画像に基づいて、第2の2値画像を構築するステップと、(a9)前記第1および第2の2値画像を組み合わせることによって、前記2値化画像を構築するステップと、を含む。これらのステップの有利な点は、入力デジタル画像において種々の輝度およびコントラストを有するさらなる要素を検出するために、第2の2値画像を構築するために使用されるしきい値がさらに変化することである。これにより、MRCモデル圧縮技術においては、伸張後の再構成された画像の品質を高めることが可能となる。
【0023】
1つの実施の形態において、2値マスク画像の作成は、2値マスク解像度低減係数により入力デジタル画像の解像度を低減するステップを含む。このように、2値マスク解像度は、たとえば、再構成された画像における所望の品質に依存して、MRCモデル圧縮技術においてユーザ−側で調整可能となる。
【0024】
本発明の第2の態様は、本発明におけるその他の態様と組み合わせてもよく、組み合わせなくてもよい。この第2の態様では、2値画像において、第1画素ブロブを第2画素ブロブと比較し、該第1および第2画素ブロブが一致シンボルを表すかどうかを決定する方法が提案される。方法は、(f)第1ブロブを拡張し、第2ブロブが前記拡張された第1ブロブの内部に適合するかどうかを検査するステップと、(g)第2ブロブを拡張し、第1ブロブが前記拡張された第2ブロブの内部に適合するかどうかを検査するステップと、を有する。比較方法は、さらに、(h)第1および第2ブロブのうちの一方に存在する線であって、他方には存在しない線を検出するステップと、(i)第1および第2ブロブのうちの一方がイタリック体のシンボルを表し、他方がイタリック体のシンボルを表さないかどうかを決定するステップと、のうち、少なくとも1つのステップを有する。ステップ(h)および(i)は、誤ったシンボル一致の数を効果的に低減する、言い換えれば、不一致シンボルが一致シンボルとして検出されるリスクを効果的に低減することが可能である。
【0025】
本発明の第2の態様に記載の方法において、好ましくは、ステップ(h)は、Nが相当数のビット数、好ましくは3の場合、N×Nのクロスにおいて、前記ブロブのうちの一方内にある1つの線が、他方のブロブ内にある1つの線とは異なるカラーを有するかどうかを検査するステップを含む。
【0026】
本発明の第2の態様に記載の方法において、好ましくは、ステップ(i)は、第1および第2ブロブが共有する黒色画素の数が、所定のしきい値より高いかどうかを検査するステップを含む。この所定のしきい値は、好ましくは1つのブロブ内にある画素の全量の80〜90%に等しく、さらに好ましくは大略85%に等しい。しかしながら、当業者によって適切と判断されるなら、さらに別のしきい値が使用されてもよい。
【0027】
本発明におけるすべての上述した態様は、本発明のさらなる態様の部分であってもよく、すなわち、前記スキャンされたドキュメントを含む前記入力デジタル画像を圧縮する圧縮方法であって、(j)前記ドキュメントの前景要素のカラー情報を含む前景画像と、前記ドキュメントの背景要素のカラー情報を含む背景画像と、前記圧縮されたデジタル画像を伸張するときに前記前景画像および前記背景画像内にある画素から選択する前記2値マスク画像と、を有する多数の画像層へと、前記入力デジタル画像を分割するステップと、(k)適切な圧縮技術によって画像層のそれぞれを圧縮し、圧縮されたデジタル画像を得るステップと、を有する。
【0028】
このさらなる態様において、好ましくは前記2値マスク画像の作成は、2値マスク解像度低減係数により前記入力デジタル画像の解像度を低減するステップを含む。2値マスク解像度は、たとえば、再構成された画像における所望の品質に依存して、ユーザ−側で調整可能である。
【0029】
このさらなる態様において、好ましくは前記前景および背景画像は、それぞれ前景解像度低減係数および背景解像度低減係数により前記解像度を低減することによって構築される。前景および背景解像度は、たとえば、再構成された画像における所望の品質に依存して、ユーザ−側で調整可能である。
【0030】
このさらなる態様において、好ましくは、圧縮は、たとえばJPEG2000または当業者には知られているいずれか別の圧縮技術などの、(k1)画像圧縮技術によって前記前景および背景画像を圧縮するステップと、(k2)シンボルに基づく圧縮技術によって前記2値マスク画像を圧縮するステップと、を含む。
【0031】
本発明による実施の形態の有利な点は、スキャンされたドキュメント用に、再構成された画像の品質に影響せずにより高い圧縮レートが達成されることが可能な画像圧縮技術が与えられることである。
【0032】
本発明による実施の形態の別の有利な点は、テキストの視認性または写真の描写について実質的に妥協しない画像圧縮技術が、与えられることである。
【0033】
本発明による実施の形態の別の有利な点は、小型と品質との間のトレードオフを調整するのに、非常に柔軟性のある画像圧縮技術が与えられることである。
【0034】
本発明による実施の形態の別の有利な点は、たとえば異なるカラーおよび明度のテキスト要素を含んでもよいドキュメント、ならびに/または異なるカラーおよび明度の背景、もしくはたとえば透かしもしくは写真などの一様でない背景上に配置されるテキスト要素を含むドキュメント、などのいずれかのタイプのドキュメントに対して、適切な画像圧縮技術が与えられることである。
【0035】
本発明による実施の形態の別の有利な点は、暗い背景に重ねて示された明るいテキストを含むドキュメントに対して、適切な画像圧縮技術が与えられることである。
【0036】
本発明による実施の形態の別の有利な点は、水平および垂直のグラフィック線が高い品質で伸張されることが可能な画像圧縮技術が与えられることである。
【0037】
本発明による実施の形態の別の有利な点は、特定のタイプのドキュメントに対して設定される必要がある、ドキュメント特定のパラメータが少しも無い画像圧縮技術が与えられることである。
【図面の簡単な説明】
【0038】
【図1】本発明に従うMRCモデル圧縮アルゴリズムの全体のフローチャートを示す。
【図2】図1のフローチャートにおける分割ステップの詳細なフローチャートを示す。
【図3】図2のフローチャートにおける2値化ステップの詳細なフローチャートを示す。
【図4】図2のフローチャートにおける前景要素の選択ステップの詳細なフローチャートを示す。
【図5】図4のフローチャートにおける大きいブロブ除去ステップおよび白色ブロブ反転ステップの詳細なフローチャートを示す。
【図6】図5のフローチャートにおいてさらに水平および垂直のグラフィック要素が保たれる場合の変形を示す。
【図7】図2のフローチャートにおける背景画像構築ステップの詳細なフローチャートを示す。
【図8】図2のフローチャートにおける前景画像構築ステップの詳細なフローチャートを示す。
【図9】本発明に従うシンボル比較アルゴリズムのフローチャートを示す。
【図10】図9のシンボル比較アルゴリズムにおけるステップの可視化を示す。
【図11】図1〜8の方法によって圧縮可能な入力カラー画像の一例を示す。
【図12】2値化ステップ後における図11の画像を示す。
【図13】図11の画像から構築された2値マスク画像を示す。
【図14】図11の画像から構築された背景画像を示す。
【図15】図11の画像から構築された前景画像を示す。
【図16】図13〜15の画像によって構築された、再構成された画像を示す。
【図17】図13の2値マスク画像が図12の2値化された画像からいかに構築されるかをステップ的に示す。
【図18】図13の2値マスク画像が図12の2値化された画像からいかに構築されるかをステップ的に示す。
【図19】図13の2値マスク画像が図12の2値化された画像からいかに構築されるかをステップ的に示す。
【図20】図13の2値マスク画像が図12の2値化された画像からいかに構築されるかをステップ的に示す。
【図21】図13の2値マスク画像が図12の2値化された画像からいかに構築されるかをステップ的に示す。
【発明を実施するための形態】
【0039】
本発明は、次の説明および添付の図面によって、さらに明らかにされる。
【0040】
本発明は、特定の実施の形態について、およびいくらかの図面を参照して説明される。しかしながら本発明は、これらの実施の形態および図面に限定されず、請求項によってだけ限定される。説明される図面は、図式的なものにすぎず、非限定的である。図面において、要素のいくつかのサイズは、誇張されてもよく、例示的な目的のために、定規に合わせて描かれなくてもよい。寸法および相対的寸法は、本発明の実際の具体化物に必ずしも一致しない。
【0041】
さらにその上、明細書および請求項における、第1、第2、第3、および類似の用語は、類似の要素間の区別用に使用され、必ずしも順次的または時系列的順番を説明するものではない。用語は、適切な状況の下で交換可能であり、本発明の実施の形態は、本明細書において説明されまたは図示される以外の別の一連の処理において動作することが可能である。
【0042】
さらにその上、明細書および請求項における、一番上の、一番下の、上方の、下方のおよび類似の用語は、便宜的に使用されており、必ずしも相対的場所を説明するものではない。使用されている用語は、適切な状況の下で交換可能であり、本明細書において説明される本発明の実施の形態は、本明細書において説明されまたは図示される以外の別の方向性において動作することが可能である。
【0043】
請求項において使用される「有する(含む)」の用語は、閉鎖的限定列挙の意味に解釈されるべきではなく、別の要素またはステップを除外してはいない。この用語は、参照されるような、定められた特徴、統合部分、ステップ、または構成要素の存在を特定するとして解釈される必要があるが、しかし1つ以上の別の特徴、統合部分、ステップもしくは構成要素、またはこれらの組み合わせの存在もしくは追加を除外しない。それゆえに、表現「手段AおよびBを有する(含む)装置」は、構成要素AおよびBに閉鎖的限定解釈されるべきではない。本発明に関して、装置のうち必須の構成要素がAおよびBであるということを意味する。
【0044】
本実施の形態では、「カラー画像」は、カラーラスター画像、すなわちカラー値を表す各画素を有する画素マップを意味すると意図される。
【0045】
本実施の形態では、「グレースケール画像」は、明度値を表す各画素を有する画素マップを意味すると意図される。
【0046】
本実施の形態では、「2値画像」または「2値化された画像」は、2値性画像、たとえば黒色&白色画像、すなわち2値(オンまたはオフ、1または0、黒色または白色)を表す各画素を有する画素マップを意味すると意図される。
【0047】
本実施の形態では、「2値化」は、カラーまたはグレースケール画像を2値画像に変換する動作を参照すると意図される。
【0048】
本実施の形態では、2つの2値画像の「AND」動作は、2つの元の画像において対応する画素の論理積を作成し、結果を目標画像内に入れる動作を参照すると意図される。
【0049】
本実施の形態では、2つの2値画像の「OR」動作は、2つの元の画像において対応する画素の論理和を作成し、結果を目標画像内に入れる動作を参照すると意図される。
【0050】
本実施の形態では、2つの2値画像の「XOR」動作は、2つの元の画像において対応する画素の排他的論理和を作成し、結果を目標画像内に入れる動作を参照すると意図される。
【0051】
本実施の形態では、2値画像の「反転」は、元の画像における各画素を反転させ、結果を目標画像内に入れる動作を参照すると意図される。
【0052】
本実施の形態では、2値画像の「拡張」は、各黒色画素に対して、N×Nの黒色模様を、目標画像内の対応する黒色画素位置を中心とするように、目標画像に加える動作を参照すると意図される。たとえば、3×3黒色模様による拡張は、各黒色画素に対して、3×3黒色模様を目標画像に加える動作を意味する。
【0053】
本実施の形態では、グレースケール画像の「拡張」は、各画素に対して、この画素を中心とするN×N(たとえば、3×3)の4角形内でもっとも暗い画素の値を検索し、目標画像の対応する画素をこの値にする動作を参照すると意図される。
【0054】
本実施の形態では、2つの2値画像における「ブロブ(blob:塊)」は、接続された黒色または白色画素のグループを参照すると意図される。
【0055】
次に、画像圧縮方法の例を用いて、本発明の態様が説明される。ここで留意すべきは、説明されるアルゴリズムの多くは、さらに別の方法で与えられてもよく、たとえばテキスト認識などのアルゴリズムであってもよい。さらにその上、本発明の範囲から逸脱せずに、多くの修正が、説明されるステップおよびアルゴリズムになされてもよい。
【0056】
図1に示される圧縮方法は、MRCモデルに基づいており、入力されたカラーまたはグレースケール画像は、3つの層に分割され、その後、各層は、適切な圧縮技術によって別々に圧縮される。特に、入力されたカラー画像1は、背景解像度低減係数2、前景解像度低減係数3、および2値マスク解像度低減係数4をパラメータとする分割アルゴリズム100によって、背景画像5、2値マスク画像6、および前景画像7へと分割される。マスク画像6は2値画像であり、背景および前景画像5、7は、(入力された画像1がカラーまたはグレースケールかどうかに依存して)カラーまたはグレースケール画像である。2値マスク画像6内にあるオン画素は、伸張する場合に、カラー(またはグレースケール)が前景画像7から取り除かれなければならないことを示す。2値マスク画像6内にあるオフ画素は、伸張する場合に、カラー(またはグレースケール)が背景画像5から取り除かれなければならないことを示す。引き続いて、背景画像5は、背景品質8をパラメータとする(たとえば、JPEG2000などの)画像圧縮技術300によって圧縮され、2値マスク画像6は、マスク品質9をパラメータとする(たとえば、JBIG2などの)シンボルに基づく圧縮技術によって圧縮され、前景画像7は、前景品質10を入力とする(たとえばJPEG2000などの)画像圧縮技術500によって圧縮される。最後に、圧縮された画像は、たとえばPDFなどの、ドキュメント読み取り可能フォーマット内にカプセル化され、圧縮された画像11を生成する。
【0057】
分割アルゴリズム100は、図2〜8によって詳述され、ステップおよびサブアルゴリズムが示される。一般に、図2に示されるように、分割は次のステップを有する。入力された画像1は、適応局所アルゴリズム110により2値化され、2値化された画像123をもたらす。ステップ125において、2値化された画像123から前景要素が選択され、2値マスク画像6を構築する。この2値マスク画像6は、入力された画像1に基づいて、ステップ170において背景画像5を構築し、ステップ180において前景画像7を構築するために使用される。ステップ170および180は、それぞれ背景解像度低減係数2および前景解像度低減係数3を考慮に入れる。ステップ126は、任意選択のステップであり、2値マスク解像度低減係数4に基づいて2値マスク画像6の解像度を低減する。
【0058】
図3に示されるように、入力された画像1の2値化は、次のステップによる適応局所アルゴリズム110を有する。ステップ111において、入力された画像1(カラーの場合)は、画素明度を計算することによって、グレースケール画像へと変換される。このグレースケール画像は、ノイズを低減するために(たとえばガウシアンフィルタによって)平滑化されてもよい。
【0059】
次にステップ112では、グレースケール画像においてキャニーエッジ検出アルゴリズムによってエッジが検出される。キャニーエッジ検出アルゴリズムは、1986年に、ジョン.エフ.キャニー(John F.Canny)によって開発された。キャニーエッジ検出アルゴリズムは、多数のステージアルゴリズムを使用し、広い範囲のエッジを検出する。キャニーエッジ検出アルゴリズムは、たとえば、J.キャニー「エッジ検出に対するコンピュータによるアプローチ」米国電気電子学会、パターン解析および人工知能に関する会報、第8巻、6号、11月、1986年において説明されており、全体として参照することにより本明細書に援用される。アルゴリズムは、エッジ輪郭を破壊することを回避するために、2つのしきい値、「Thigh」および「Tlow」を使用する。エッジ輪郭は、Thighよりも大きい勾配の画素で始まり、Thighよりも低くTlowよりも大きな勾配の画素に対してさえも続くことが可能である。本発明によれば、TlowおよびThighの典型的な値は、1バイトのグレースケール画像に対してそれぞれ32および40である。キャニーエッジ検出アルゴリズムは、グレースケール画像内にあるテキストおよびグラフィック要素のエッジを検出するために、使用される。このようにすることにより、写真のエッジもまた検出されるが、写真要素は、あとで(後述のステップ160を参照)フィルタが掛けられるので問題とはならない。キャニーエッジ検出器は2値画像を生成し、この2値画像においてエッジ画素だけが1に設定される。
【0060】
別のエッジ検出アルゴリズムに対して、キャニーエッジ検出アルゴリズムは、次の有利な点を提供する。
− 良好な検出:このアルゴリズムは、画像内にある実在のエッジをできるかぎり多くマークする。
− 良好な位置決め:マークされたエッジは、実在の画像内にあるエッジにできるだけ近い。
− 最小限の応答:画像内にある所定のエッジはいったんマークされるだけであり、可能であれば、画像ノイズは偽のエッジを作成しない。
【0061】
次にステップ113において、エッジ2値画像出力の各エッジ画素に対して、キャニーエッジアルゴリズム112によってしきい値が計算される。しきい値は、最低値と最高値との和の半分となる。最低値は、分析される画素を中心とする3×3の4角形における最低値である。最高値は、分析される画素を中心とする3×3の4角形における最高値である。非エッジ画素は0のしきい値を受ける。
【0062】
次にステップ114において、エッジ画素に接する非エッジ画素に、しきい値が割り当てられる。しきい値は、入力から出力へとコピーされる。非エッジ画素(値=0)にとっては、3×3の4角形は各画素を中心とする。この4角形内にある画素のしきい値の合計が計算され、エッジ画素があればエッジ画素の数によって分割される。この値は、出力画像上にコピーされる。ステップ114の出力はしきい値グレースケール画像である。
【0063】
次にステップ115において、このしきい値グレースケール画像は、ある整数の係数分だけ、好ましくは4だけスケーリングされる。出力画像は0で初期化される。各出力画素に対して、対応する入力画素の値は加算され、非ゼロ値があれば非ゼロ値の数によって分割される。
【0064】
次にステップ116において、しきい値は近隣における値で平均化される。3×3の4角形は、0とは異なる値の各画素を中心とする。この4角形内にある画素のしきい値の合計が計算され、非ゼロ値があれば非ゼロ値の数によって分割される。この値は、出力画像上にコピーされる。
【0065】
次にステップ117において、しきい値は、しきい値を有しない画素へと伝搬する。第1に、しきい値は、ステップ114と大略同様に、ゼロ値画素に接する非ゼロ値画素に割り当てられる。第2に、2パス伝搬アルゴリズムが使用される。1番目のパスにおいて、画像は左から右へ、および上から下へスキャンされる。ゼロ値画素の値は、最小の非ゼロ値を有する隣接画素の値にされる。2番目のパスにおいて、画像は右から左へ、および下から上へスキャンされる。再び、ゼロ値画素の値は、最小の非ゼロ値を有する隣接画素の値にされる。このように、すべての画素がしきい値を受ける。
【0066】
次にステップ118において、ステップ111からのグレースケール画像出力と、ステップ117からのしきい値がスケーリングされたグレースケール画像出力との組み合わせによって、第1の2値画像119が構築される。グレースケール画像内にある各画素の値は、スケーリングされたしきい値画像内にある対応する画素のしきい値と比較される。第1の2値画像119において、画素値がしきい値を下回るか上回るかに依存して、1または0の値が設定される。
【0067】
ステップ120において、ステップ111からのグレースケール画像出力と、ステップ114からのしきい値グレースケール画像出力との組み合わせによって、第2の2値画像121が構築される。グレースケール画像内にある各画素の値は、しきい値画像内にある対応する画素のしきい値と比較される。第2の2値画像121において、画素値がしきい値を下回るか上回るかに依存して、1または0の値が設定される。
【0068】
最後に2値化アルゴリズム110のステップ122において、第1の2値画像119と第2の2値画像121との論理和(OR)がなされ、2値化された画像123を生成する。
【0069】
2値化された画像123は、テキストおよびグラフィック要素に加えて、入力された画像1内にある写真部分からの要素を含む。これらの要素は取り除かれ、2値マスク画像6内には発生しないことが望ましい。さらにその上、黒色のテキスト要素に重ねて示された白色のテキスト要素が反転することにより、白色テキストに重ねて示された黒色テキストと同様に判別可能となる。これは、2値マスク画像6におけるさらなる処理において、非常に有利な点となる。これらのステップは、図4に示される選択アルゴリズム125によって実行される。
【0070】
サブアルゴリズム130または140によって、2値化された画像123から大きいブロブが取り除かれ、白色ブロブが反転する。2つの間の差は、サブアルゴリズム140では、水平および垂直のグラフィック要素を保つためのステップが加えられることである。
【0071】
図5に示されるサブアルゴリズム130は、次のステップを有する。ステップ131において、大きい黒色ブロブ、すなわち所定の最低値を上回る相当数の画素を有するブロブ、だけが保たれる。次にステップ132において、保たれたブロブを含む画像が反転する(INVERT)。ステップ133において、この反転した画像と2値化された画像との論理積(AND)がなされる。これらのステップは、ステップ132の画像出力に対して繰り返される。すなわちステップ134において、再び大きい黒色ブロブだけが保たれ、ステップ135において、保たれたブロブを含む画像が反転し、ステップ136において、ステップ132の画像出力との論理積がなされる。最後に、ステップ137において、ステップ133の画像出力とステップ136の画像出力との排他的論理和(XOR)がなされ、変換された2値画像138となる。
【0072】
図6に示されるサブアルゴリズム140は、次のステップを有する。除去ステップ141および排他的論理和ステップ142によって、2値化された画像123から水平および垂直のグラフィック要素が分離される。ステップ143〜145は、サブアルゴリズム130のステップ131〜133に一致する。さらに、除去ステップ146および排他的論理和ステップ147によって、ステップ144の画像出力から水平および垂直のグラフィック要素が分離される。これらの分離されたグラフィック要素は、ステップ148において、排他的論理和ステップ142の出力と排他的論理和ステップ147の出力との論理和を作成するとによって組み合わせられる。ステップ149〜151は、サブアルゴリズム130のステップ134〜136に一致する。再びステップ152において、論理積ステップ145の画像出力と論理積ステップ151の画像出力との排他的論理和がなされる。最後にステップ156において、排他的論理和ステップ152の出力と論理和ステップ148の出力との論理和を作成することによって、変換された2値画像157が生成され、水平および垂直のグラフィック要素を画像へ戻す。
【0073】
黒色テキスト要素に重ねて示された白色テキスト要素を反転させる上述したステップの有利な点は、ドキュメントにおけるすべてのブロブの記述(ビットマップまたは実行リスト)を記憶する必要がないことである。従来例の方法では、特に、穴(別のブロブに囲まれたブロブ)を探し出すことによって、黒色ブロブに重ねて示された白色ブロブを反転させるために、これが必要となる。アルゴリズム130および140において、ブロブは見つけられるやいなや処理され、ブロブが処理された後、その記述は取り除かれる。
【0074】
図4に戻ると、写真ブロブを取り除くこと(すなわちテキスト要素が存在しないブロブ)によって、変換された2値画像138/157から2値マスク画像6が生成される。これは、当技術分野で周知の最小記述長原理を使用する、フィルタを掛けるステップ160によって達成される。各ブロブに対して、前景要素または背景要素のうちのいずれであるかが決定される。最小記述長原理を適用する場合に、ストラテジーは、ブロブが前景であるとして圧縮される場合と、背景の一部分であるとして圧縮される場合とにおいて、いずれの場合がより良好に圧縮されるかを知ることにある。ブロブは、背景内にある場合、背景画像において圧縮される。ブロブは、前景内にある場合、2値マスク画像および前景画像において圧縮される。それで、異なる圧縮のコストを見積もる必要がある。見積もりは、単純なモデルを用いてなされる。背景モデルは、カラーが滑らかに変化すると仮定する。画素のカラーは、その近隣の画素と大きくは異ならない。画素カラーと局所的平均のカラーとの間の誤差の合計がコストとなる。前景モデルは、ブロブにおけるすべての画素が同じカラーを有していると仮定する。これは、通常は、テキスト要素の場合である。画素カラーと平均のカラーとの間の誤差の合計がコストとなる。2値マスクモデルは、圧縮コストがブロブの周囲に依存すると仮定する。そうすると、
背景コスト < 前景コスト + 周囲*係数
の場合、ブロブは背景の一部分となり、(フィルタが掛けられる)。
【0075】
係数はパラメータだけであり、大量のページをテストすることによって調整される。ここで再び、ブロブは、見つけられるやいなや処理される。ブロブが処理された後、記述は取り除かれる。
【0076】
図7に示されるように、背景画像5は、入力された画像1と、2値マスク画像6と、ユーザ−規定可能なパラメータであってもよい背景解像度低減係数2とを入力とするアルゴリズム170によって生成される。ステップ171において、2値マスク画像は拡張される。ステップ172において、解像度は背景解像度低減係数2によって低減される。同様にステップ173において、入力された画像1の解像度は、背景解像度低減係数2によって低減される。その結果、画像は、ステップ174において組み合わせられ、「空き」画素を満たす。低減された2値マスク画像においてオンとなる、低減された入力画像における画素のカラーは、2つのステップの順次的なアルゴリズムを用いることによって、変更される。1番目のパスにおいて、2つの画像が左から右へ、および上から下へスキャンされる。「空き」画素に出会った場合(低減された2値マスク内のオフ値)、3×3の4角形は、低減された入力画像内のこの「空き」画素を中心とし、この4角形内にある画素のカラー値の合計が計算され、非空き画素があれば非空き画素の数によって分割される。このカラー値は、低減された入力画像内の画素に割り当てられる。2番目のパスにおいて、2つの画像が右から左へ、および下から上へスキャンされる。再び、「空き」画素に出会った場合、1番目のパスと同様にカラー値がこの「空き」画素に割り当てられる。
【0077】
図8に示されるように、前景画像7は、入力された画像1と、2値マスク画像6と、ユーザ−規定可能なパラメータであってもよい前景解像度低減係数3とを入力とするアルゴリズム180によって生成される。ステップ181および182において、2値マスク画像は引き続いて反転し、拡張される。ステップ183において、解像度は前景解像度低減係数2によって低減される。同様にステップ185において、入力された画像1の解像度は、前景解像度低減係数2によって低減される。その結果、画像は、ステップ186において組み合わせられ、「空き」画素を満たす。低減された2値マスク画像においてオンとなる、低減された入力画像における画素のカラーは、ステップ174に類似の、2つのステップの順次的なアルゴリズムを用いることによって、変更される。
【0078】
図1〜8の方法によって圧縮された画像の一例が、図11〜16に示される。図11は、300dpiでスキャンされたドキュメントである、入力されたカラー画像1を示す。図12は、2値化110後の2値化された画像123を示し、図13は、前景要素125の選択後の2値マスク画像6を示す。2値マスク画像もまた300dpiの解像度であり、この場合は2値マスク解像度低減係数が1に設定されている(低減なし)ことを意味する。図14は背景画像5を示し、背景画像5は100dpiの解像度であり、背景解像度低減係数が3に設定されていることを意味する。図15は前景画像7を示し、前景画像7は50dpiの解像度であり、前景解像度低減係数が6に設定されていることを意味する。図16は、圧縮された画像11の伸張後に達成される、再構成された画像12を示す。2値マスク画像は300dpiの解像度であるので、再構成された画像もまた300dpiの解像度であり、すなわち入力された画像1と同じ解像度となる。図11および16の比較から、再構成された画像の高い品質が、図1〜8の圧縮方法によって達成可能であることが明らかである。
【0079】
図17〜21は、前景要素選択処理125によって、2値化された画像123から2値マスク画像6がいかに構築されるかを示す(図4〜6を参照)。図17は、画像の中央にある垂直の黒色線の分離後、すなわちステップ141の後の、2値化された画像123を示す。図18は、大きい黒色ブロブだけが保たれ、反転した後、すなわちステップ143および144の後の、2値化された画像123を示す。図19は、大きい黒色ブロブを有しない、2値化された画像123を示す。これは、ステップ145において図17および18の画像の論理積を行うことによって達成される。図20は、ステップ146〜151の後の結果、すなわち大きい黒色ブロブを有しない、反転した画像を示す。ステップ152において、図19および20におけるこれら2つの画像の排他的論理和を行うことによって、変換された2値画像138/157が達成される。変換された2値画像138/157は、2値化された画像123において、大きい黒色ブロブが取り除かれ、白色ブロブが反転した画像となっている。この変換された画像は、図21に示される。元の画像1内にある暗い背景または「反転したテキスト」に重ねて明るいテキストを表すテキスト領域は、元の画像1内にある明るい背景または「正常テキスト」に重ねて示された暗いテキストと同様に、白色に重ねて示された黒色として表されると理解することが可能である。図13の2値マスク画像6は、ステップ160において、写真ブロブに対してフィルタを掛けることによって、図21の変換された画像から構築される。
【0080】
図9は、本発明の第2の態様に従うシンボル分類アルゴリズムを示す。このシンボル分類アルゴリズムは、2値マスク画像6を圧縮するために使用される、シンボルに基づく圧縮アルゴリズム400の一部分であってもよい。シンボル分類アルゴリズムは、たとえば2値マスク画像6などの2値画像を入力とし、シンボルのリストおよびシンボル発生のリストを出力する。シンボルのリスト内にある品目は、シンボルIDおよびシンボルビットマップを含む。発生のリスト内にある品目は、一致シンボルIDおよびページ内の発生場所を含む。
【0081】
シンボル分類アルゴリズムは、次のステップを有する。ステップ403および404において、第1画素ブロブ401が第2画素ブロブ402の拡張内に適合するかどうかが決定される。適合しない場合、「不一致」が戻される。適合する場合、ステップ405および406において、第2画素ブロブ402が第1画素ブロブ401の拡張内に適合するかどうかが決定される。適合しない場合、「不一致」が戻される。適合する場合、「一致」のように見えるが、しかし誤差を回避するためにさらに2つの検査がなされる。ステップ407および408において、ブロブ401、402のうちの一方が、他方において存在しない線を有するかどうかが決定される。さらに詳しくは、これは、ブロブのうちの一方内にある1つの線が、他方のブロブ内にある別の線とは異なるカラーを有する、3×3のクロスを検査するステップを含む。ステップ409および411において、ブロブ401、402のうちの一方がイタリック体のシンボルを表し、他方が表さないかどうかが決定される。さらに詳しくは、これは、第1および第2ブロブ401、402が共有する黒色画素の数が、所定のしきい値410を越えるかどうかを検査するステップを含む。この所定のしきい値は、好ましくは1つのブロブ内にある画素の全量の80〜90%に等しく、さらに好ましくは大略85%に等しい。
【0082】
これらのステップは、図10において視覚化されている。上の行は、互いの拡張(ステップ403〜406)へと適合し、結果423が一致となる、2つの画素ブロブ421および422を表す。中央の行は、さらに互いの拡張(ステップ403〜406)へと適合し、しかし明らかに一致とはならない、2つの画素ブロブ431および432を表す。この種の誤差は、ブロブのうちの一方内にある1つの線が、他方のブロブ内にある他方の線とは異なるカラーを有する、3×3のクロス433、434を検査することによって取り除かれる(ステップ407〜408)。第1ブロブ431に重ねて示されたクロス433において垂直線435は黒色であり、一方、第2ブロブ432に重ねて示された対応するクロス434内にある水平線436は白色であり、結果437は不一致となる。下の行は、互いの拡張へとさらに適合し(ステップ403〜406)、しかし、ブロブ442がイタリック体のシンボルであり、ブロブ441がイタリック体のシンボルではないので、明らかに一致ではない、2つの画素ブロブ441および442を表す。この種の誤差は、ブロブ441とブロブ442との論理積を行い、その結果が443に示されるようになる(共通の黒色画素が結果443において黒色となる)ステップ、および共通の画素の数がしきい値410を越えるかどうかを検査するステップによって取り除かれる(ステップ409〜411)。この例では、443内にある画素の数はしきい値410を下回り、それゆえ不一致が検出される。
【特許請求の範囲】
【請求項1】
スキャンされたドキュメントを含む入力デジタル画像から、2値マスク画像を作成する方法であって、
a)前記入力デジタル画像を2値化することによって、2値化画像を作成するステップと、
b)前記入力デジタル画像内にある暗い背景に重ねて明るいテキストを表す第1テキスト領域を、前記2値化画像において検出するステップと、
c)前記2値化画像において前記第1テキスト領域を反転させることにより、明るい背景に重ねて示された暗いテキストと同様に、反転した第1テキスト領域が判別可能となるようにするステップと、を有する方法。
【請求項2】
さらに、
d)前記入力デジタル画像内にある明るい背景に重ねて暗いテキストを表す第2テキスト領域を、前記2値化画像において検出するステップと、
e)テキストが実在しないテキスト領域を、2値化画像から取り除くステップと、を有する、請求項1に記載の方法。
【請求項3】
さらに、
前記第1および第2テキスト領域を検出するステップの前に、水平および垂直のグラフィック要素を分離するステップと、
前記検出ステップの後に、前記水平および垂直のグラフィック要素を2値化画像へと再導入するステップと、有する、請求項2に記載の方法。
【請求項4】
ステップa)は、
a1)前記入力デジタル画像からグレースケール画像を構築するステップと、
a2)前記グレースケール画像内にあるエッジを検出し、エッジ画素および非エッジ画素を含むエッジ2値画像を構築するステップと、
a3)周囲の画素に基づいて、前記エッジ画素のそれぞれに対するしきい値を決定するとともに、前記非エッジ画素にゼロのしきい値を与え、しきい値グレースケール画像を構築するステップと、
a4)周囲のしきい値に基づいて、エッジ画素に接する前記非エッジ画素のそれぞれに対するしきい値を決定するステップと、
a5)最高のしきい値を保つことによって前記しきい値グレースケール画像をスケーリングするステップと、
a6)正の値を有する画素からゼロの値を有する画素へ、しきい値を伝搬させるステップと、
a7)前記グレースケール画像および前記スケーリングされたしきい値グレースケール画像に基づいて、第1の2値画像を構築するステップと、を含む、請求項1から3のうちのいずれか1つに記載の方法。
【請求項5】
ステップa2)は、前記エッジ検出用にキャニーエッジアルゴリズムの使用を含む、請求項4に記載の方法。
【請求項6】
ステップa)は、
a8)前記グレースケール画像および前記しきい値グレースケール画像に基づいて、第2の2値画像を構築するステップと、
a9)前記第1および第2の2値画像を組み合わせることによって、前記2値化画像を構築するステップと、を含む、請求項4に記載の方法。
【請求項7】
前記入力デジタル画像は所定の解像度を有し、
前記2値マスク画像の作成は、2値マスク解像度低減係数により前記解像度を低減するステップを含む、請求項1から6のうちのいずれか1つに記載の方法。
【請求項8】
2値画像において、第1画素ブロブを第2画素ブロブと比較し、該第1および第2画素ブロブが一致シンボルを表すかどうかを決定する方法であって、
f)第1ブロブを拡張し、第2ブロブが前記拡張された第1ブロブの内部に適合するかどうかを検査するステップと、
g)第2ブロブを拡張し、第1ブロブが前記拡張された第2ブロブの内部に適合するかどうかを検査するステップと、を有し、さらに、
h)第1および第2ブロブのうちの一方に存在する線であって、他方には存在しない線を検出するステップと、
i)第1および第2ブロブのうちの一方がイタリック体のシンボルを表し、他方がイタリック体のシンボルを表さないかどうかを決定するステップと、のうち、少なくとも1つのステップを有する、方法。
【請求項9】
ステップh)は、Nが相当数のビット数の場合、N×Nのクロスにおいて、前記ブロブのうちの一方内にある1つの線が、他方のブロブ内にある1つの線とは異なるカラーを有するかどうかを検査するステップを含む、請求項8に記載の方法。
【請求項10】
Nが3である、請求項9に記載の方法。
【請求項11】
ステップi)は、第1および第2ブロブが共有する黒色画素の数が、所定のしきい値より高いかどうかを検査するステップを含む、請求項8から10のうちのいずれか1つに記載の方法。
【請求項12】
前記所定のしきい値は、1つのブロブ内にある画素の全量の80から90%に等しい、請求項11に記載の方法。
【請求項13】
前記スキャンされたドキュメントを含む前記入力デジタル画像を圧縮する圧縮方法であって、
j)前記ドキュメントの前景要素のカラー情報を含む前景画像と、前記ドキュメントの背景要素のカラー情報を含む背景画像と、前記圧縮されたデジタル画像を伸張するときに前記前景画像および前記背景画像内にある画素から選択する前記2値マスク画像と、を有する多数の画像層へと、前記入力デジタル画像を分割するステップと、
k)適切な圧縮技術によって画像層のそれぞれを圧縮し、圧縮されたデジタル画像を得るステップと、を有し、
前記2値マスク画像は、請求項1から7のうちのいずれか1つに記載の方法による、方法。
【請求項14】
前記入力デジタル画像は所定の解像度を有し、
前記前景および背景画像は、それぞれ前景解像度低減係数および背景解像度低減係数により前記解像度を低減することによって構築される、請求項13に記載の方法。
【請求項15】
ステップk)は、
k1)画像圧縮技術によって前記前景および背景画像を圧縮するステップと、
k2)シンボルに基づく圧縮技術によって前記2値マスク画像を圧縮するステップと、を含む、請求項13または14に記載の方法。
【請求項16】
スキャンされたドキュメントを含む入力デジタル画像を圧縮する圧縮方法であって、
l)前記ドキュメントの前景要素のカラー情報を含む前景画像と、前記ドキュメントの背景要素のカラー情報を含む背景画像と、前記圧縮されたデジタル画像を伸張するときに前記前景画像および前記背景画像内にある画素から選択する2値マスク画像と、を有する多数の画像層へと、前記入力デジタル画像を分割するステップと、
m)画像圧縮技術によって前記前景および背景画像を圧縮するステップと、
n)シンボルに基づく圧縮技術によって前記2値マスク画像を圧縮するステップと、を有し、
前記シンボルに基づく圧縮技術は、請求項8から12のうちのいずれか1つに記載の方法の使用を含む、方法。
【請求項17】
前記入力デジタル画像は所定の解像度を有し、
前記2値マスク画像の作成は、2値マスク解像度低減係数により前記解像度を低減するステップを含む、請求項16に記載の方法。
【請求項18】
前記入力デジタル画像は所定の解像度を有し、
前記前景および背景画像は、それぞれ前景解像度低減係数および背景解像度低減係数により前記解像度を低減することによって構築される、請求項16または17に記載の方法。
【請求項19】
コンピュータのメモリへと、直接にロード可能なコンピュータプログラム製品であって、
前記製品がコンピュータ上で実行される場合に、請求項1から7または13から15のうちのいずれか1つに記載のステップを実行する、ソフトウェアコード部分を有する、コンピュータプログラム製品。
【請求項20】
コンピュータで利用可能な媒体上に記憶される、請求項19に記載のコンピュータプログラム製品。
【請求項21】
コンピュータのメモリへと、直接にロード可能なコンピュータプログラム製品であって、
前記製品がコンピュータ上で実行される場合に、請求項8から12または16から18のうちのいずれか1つに記載のステップを実行する、ソフトウェアコード部分を有する、コンピュータプログラム製品。
【請求項22】
コンピュータで利用可能な媒体上に記憶される、請求項21に記載のコンピュータプログラム製品。
【請求項1】
スキャンされたドキュメントを含む入力デジタル画像から、2値マスク画像を作成する方法であって、
a)前記入力デジタル画像を2値化することによって、2値化画像を作成するステップと、
b)前記入力デジタル画像内にある暗い背景に重ねて明るいテキストを表す第1テキスト領域を、前記2値化画像において検出するステップと、
c)前記2値化画像において前記第1テキスト領域を反転させることにより、明るい背景に重ねて示された暗いテキストと同様に、反転した第1テキスト領域が判別可能となるようにするステップと、を有する方法。
【請求項2】
さらに、
d)前記入力デジタル画像内にある明るい背景に重ねて暗いテキストを表す第2テキスト領域を、前記2値化画像において検出するステップと、
e)テキストが実在しないテキスト領域を、2値化画像から取り除くステップと、を有する、請求項1に記載の方法。
【請求項3】
さらに、
前記第1および第2テキスト領域を検出するステップの前に、水平および垂直のグラフィック要素を分離するステップと、
前記検出ステップの後に、前記水平および垂直のグラフィック要素を2値化画像へと再導入するステップと、有する、請求項2に記載の方法。
【請求項4】
ステップa)は、
a1)前記入力デジタル画像からグレースケール画像を構築するステップと、
a2)前記グレースケール画像内にあるエッジを検出し、エッジ画素および非エッジ画素を含むエッジ2値画像を構築するステップと、
a3)周囲の画素に基づいて、前記エッジ画素のそれぞれに対するしきい値を決定するとともに、前記非エッジ画素にゼロのしきい値を与え、しきい値グレースケール画像を構築するステップと、
a4)周囲のしきい値に基づいて、エッジ画素に接する前記非エッジ画素のそれぞれに対するしきい値を決定するステップと、
a5)最高のしきい値を保つことによって前記しきい値グレースケール画像をスケーリングするステップと、
a6)正の値を有する画素からゼロの値を有する画素へ、しきい値を伝搬させるステップと、
a7)前記グレースケール画像および前記スケーリングされたしきい値グレースケール画像に基づいて、第1の2値画像を構築するステップと、を含む、請求項1から3のうちのいずれか1つに記載の方法。
【請求項5】
ステップa2)は、前記エッジ検出用にキャニーエッジアルゴリズムの使用を含む、請求項4に記載の方法。
【請求項6】
ステップa)は、
a8)前記グレースケール画像および前記しきい値グレースケール画像に基づいて、第2の2値画像を構築するステップと、
a9)前記第1および第2の2値画像を組み合わせることによって、前記2値化画像を構築するステップと、を含む、請求項4に記載の方法。
【請求項7】
前記入力デジタル画像は所定の解像度を有し、
前記2値マスク画像の作成は、2値マスク解像度低減係数により前記解像度を低減するステップを含む、請求項1から6のうちのいずれか1つに記載の方法。
【請求項8】
2値画像において、第1画素ブロブを第2画素ブロブと比較し、該第1および第2画素ブロブが一致シンボルを表すかどうかを決定する方法であって、
f)第1ブロブを拡張し、第2ブロブが前記拡張された第1ブロブの内部に適合するかどうかを検査するステップと、
g)第2ブロブを拡張し、第1ブロブが前記拡張された第2ブロブの内部に適合するかどうかを検査するステップと、を有し、さらに、
h)第1および第2ブロブのうちの一方に存在する線であって、他方には存在しない線を検出するステップと、
i)第1および第2ブロブのうちの一方がイタリック体のシンボルを表し、他方がイタリック体のシンボルを表さないかどうかを決定するステップと、のうち、少なくとも1つのステップを有する、方法。
【請求項9】
ステップh)は、Nが相当数のビット数の場合、N×Nのクロスにおいて、前記ブロブのうちの一方内にある1つの線が、他方のブロブ内にある1つの線とは異なるカラーを有するかどうかを検査するステップを含む、請求項8に記載の方法。
【請求項10】
Nが3である、請求項9に記載の方法。
【請求項11】
ステップi)は、第1および第2ブロブが共有する黒色画素の数が、所定のしきい値より高いかどうかを検査するステップを含む、請求項8から10のうちのいずれか1つに記載の方法。
【請求項12】
前記所定のしきい値は、1つのブロブ内にある画素の全量の80から90%に等しい、請求項11に記載の方法。
【請求項13】
前記スキャンされたドキュメントを含む前記入力デジタル画像を圧縮する圧縮方法であって、
j)前記ドキュメントの前景要素のカラー情報を含む前景画像と、前記ドキュメントの背景要素のカラー情報を含む背景画像と、前記圧縮されたデジタル画像を伸張するときに前記前景画像および前記背景画像内にある画素から選択する前記2値マスク画像と、を有する多数の画像層へと、前記入力デジタル画像を分割するステップと、
k)適切な圧縮技術によって画像層のそれぞれを圧縮し、圧縮されたデジタル画像を得るステップと、を有し、
前記2値マスク画像は、請求項1から7のうちのいずれか1つに記載の方法による、方法。
【請求項14】
前記入力デジタル画像は所定の解像度を有し、
前記前景および背景画像は、それぞれ前景解像度低減係数および背景解像度低減係数により前記解像度を低減することによって構築される、請求項13に記載の方法。
【請求項15】
ステップk)は、
k1)画像圧縮技術によって前記前景および背景画像を圧縮するステップと、
k2)シンボルに基づく圧縮技術によって前記2値マスク画像を圧縮するステップと、を含む、請求項13または14に記載の方法。
【請求項16】
スキャンされたドキュメントを含む入力デジタル画像を圧縮する圧縮方法であって、
l)前記ドキュメントの前景要素のカラー情報を含む前景画像と、前記ドキュメントの背景要素のカラー情報を含む背景画像と、前記圧縮されたデジタル画像を伸張するときに前記前景画像および前記背景画像内にある画素から選択する2値マスク画像と、を有する多数の画像層へと、前記入力デジタル画像を分割するステップと、
m)画像圧縮技術によって前記前景および背景画像を圧縮するステップと、
n)シンボルに基づく圧縮技術によって前記2値マスク画像を圧縮するステップと、を有し、
前記シンボルに基づく圧縮技術は、請求項8から12のうちのいずれか1つに記載の方法の使用を含む、方法。
【請求項17】
前記入力デジタル画像は所定の解像度を有し、
前記2値マスク画像の作成は、2値マスク解像度低減係数により前記解像度を低減するステップを含む、請求項16に記載の方法。
【請求項18】
前記入力デジタル画像は所定の解像度を有し、
前記前景および背景画像は、それぞれ前景解像度低減係数および背景解像度低減係数により前記解像度を低減することによって構築される、請求項16または17に記載の方法。
【請求項19】
コンピュータのメモリへと、直接にロード可能なコンピュータプログラム製品であって、
前記製品がコンピュータ上で実行される場合に、請求項1から7または13から15のうちのいずれか1つに記載のステップを実行する、ソフトウェアコード部分を有する、コンピュータプログラム製品。
【請求項20】
コンピュータで利用可能な媒体上に記憶される、請求項19に記載のコンピュータプログラム製品。
【請求項21】
コンピュータのメモリへと、直接にロード可能なコンピュータプログラム製品であって、
前記製品がコンピュータ上で実行される場合に、請求項8から12または16から18のうちのいずれか1つに記載のステップを実行する、ソフトウェアコード部分を有する、コンピュータプログラム製品。
【請求項22】
コンピュータで利用可能な媒体上に記憶される、請求項21に記載のコンピュータプログラム製品。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図12】
【図13】
【図17】
【図18】
【図19】
【図20】
【図21】
【図11】
【図14】
【図15】
【図16】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図12】
【図13】
【図17】
【図18】
【図19】
【図20】
【図21】
【図11】
【図14】
【図15】
【図16】
【公表番号】特表2010−527190(P2010−527190A)
【公表日】平成22年8月5日(2010.8.5)
【国際特許分類】
【出願番号】特願2010−506892(P2010−506892)
【出願日】平成20年4月28日(2008.4.28)
【国際出願番号】PCT/EP2008/055198
【国際公開番号】WO2008/135440
【国際公開日】平成20年11月13日(2008.11.13)
【出願人】(509305365)イー・エル・イー・エス・ソシエテ・アノニム (1)
【氏名又は名称原語表記】I.R.I.S. S.A.
【Fターム(参考)】
【公表日】平成22年8月5日(2010.8.5)
【国際特許分類】
【出願日】平成20年4月28日(2008.4.28)
【国際出願番号】PCT/EP2008/055198
【国際公開番号】WO2008/135440
【国際公開日】平成20年11月13日(2008.11.13)
【出願人】(509305365)イー・エル・イー・エス・ソシエテ・アノニム (1)
【氏名又は名称原語表記】I.R.I.S. S.A.
【Fターム(参考)】
[ Back to top ]