説明

符号化装置及び符号化方法

【課題】高画質な構造化文書の生成に掛かる処理時間を低減可能な符号化技術を提供する。
【解決手段】入力ファイルパーサ手段11は、絵柄混在文書を外部記憶装置から読み出してこれをページ毎に分割して符号化手段12に引き渡す。符号化手段12は、入力ファイルパーサ手段11から引き渡された絵柄混在文書についてページ毎に、前景、背景及びマスクに対して各々画像を割り当て、各画像を所定の符号化方式により各々符号化する。組立手段13は、符号化手段12が符号化した前景、背景及びマスクを所定のデータフォーマットに従って組み立てて、構造化文書を生成する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像を符号化して構造化文書を生成する符号化装置及び符号化方法に関する。
【背景技術】
【0002】
従来より、文字や絵柄が混在する文書(絵柄混在文書)などの画像を符号化する技術がある。このような絵柄混在文書を高圧縮率で符号化するために、符号化した画像を構造化文書として形成する技術がある(例えば、特許文献1〜2参照)。構造化文書とは、絵柄混在文書を画像成分分析して絵柄部分とエッジ部分とに分離し、例えば、絵柄部分を表す画像を背景とし、エッジ部分を表す画像をマスクとし、エッジの色を表す画像を前景とし、これらを各々独立して符号化して符号データを作成した後、これらの各符号データを1つのファイルフォーマットに組み立てたものである。このような符号化方式によって絵柄混在文書を符号化して構造化文書を生成すれば、高圧縮率で符号化したときに、絵柄混在文書を1つの多値画像として符号化する符号化方式に比べてより高画質を提供できる。
【0003】
【特許文献1】特許第3275807号
【特許文献2】USP Re35,657,USP5,778,092 “Method and apparatus for compressing color orgray scale documents“,Xerox Corporation
【発明の開示】
【発明が解決しようとする課題】
【0004】
しかしながら、特許文献1に示されるような従来の技術においては、エッジ部分と絵柄部分とを分離するためにかなりの処理時間が掛かっていた。
【0005】
本発明は、上記に鑑みてなされたものであって、高画質な構造化文書の生成に掛かる処理時間を低減可能な符号化装置及び符号化方法を提供することを目的とする。
【課題を解決するための手段】
【0006】
上述した課題を解決し、目的を達成するために、請求項1にかかる発明は、入力画像を符号化して、前景、背景及びマスクから構成される構造化文書を生成する符号化装置であって、前記前景として第1多値画像を割り当て、前記背景として第2多値画像を割り当て、前記マスクとして2値画像を割り当て、前記前景、前記背景及び前記マスクを各々符号化する符号化手段と、前記符号化手段が符号化した前記前景、前記背景及び前記マスクを所定のファイルフォーマットに従って組み立てて構造化文書を生成する組立手段とを備え、前記符号化手段は、前記第1多値画像として任意の画像を多値符号化方式により符号化する第1符号化手段と、前記第2多値画像として前記入力画像を多値符号化方式により符号化する第2符号化手段と、前記2値画像として白色を表す画像を2値画像符号化方式により符号化する第3符号化手段とを有することを特徴とする。
【0007】
請求項2にかかる発明は、請求項1にかかる発明において、前記第1符号化手段は、前記第1多値画像として白色を表す画像を多値符号化方式により符号化することを特徴とする。
【0008】
請求項3にかかる発明は、入力画像を符号化して、前景、背景及びマスクから構成される構造化文書を生成する符号化装置であって、前記前景として第1多値画像を割り当て、前記背景として第2多値画像を割り当て、前記マスクとして2値画像を割り当て、前記前景、前記背景及び前記マスクを各々符号化する符号化手段と、前記符号化手段が符号化した前記前景、前記背景及び前記マスクを所定のファイルフォーマットにより組み立てて構造化文書を生成する組立手段とを備え、前記符号化手段は、前記第1多値画像として前記入力画像を多値符号化方式により符号化する第1符号化手段と、前記第2多値画像として任意の画像を多値符号化方式により符号化する第2符号化手段と、前記2値画像として黒色を表す画像を2値画像符号化方式により符号化する第3符号化手段とを有することを特徴とする。
【0009】
請求項4にかかる発明は、入力画像を符号化して、前景、背景及びマスクから構成される構造化文書を生成する符号化装置であって、前記背景として前記入力画像を多値画像符号化方式により符号化する符号化手段と、前記符号化手段が符号化した前記背景と、任意の画像が多値符号化方式により予め符号化されて第1記憶手段に記憶された符号化済前景と、白色を表す画像が2値符号化方式により予め符号化されて第2記憶手段に記憶された符号化済マスクとを所定のファイルフォーマットにより組み立てて構造化文書を生成する組立手段とを備えることを特徴とする。
【0010】
請求項5にかかる発明は、請求項2又は請求項3にかかる発明において、前記第1符号化手段は、前記第1多値画像を構成する画素の値が全て0となるよう、又は当該第1多値画像を伸張したときの伸張画像を構成する画素の値が全て0となるよう、当該第1多値画像を多値符号化方式により符号化することを特徴とする。
【0011】
請求項6にかかる発明は、請求項1にかかる発明において、前記第3符号化手段は、前記2値画像を構成する画素の値が全て0となるよう、又は当該2値画像を伸張したときの伸張画像を構成する画素の値が全て0となるよう、当該2値画像を2値符号化方式により符号化することを特徴とする。
【0012】
請求項7にかかる発明は、請求項3にかかる発明において、前記第3符号化手段は、前記2値画像を構成する画素の値が全て1となるよう、又は当該2値画像を伸張したときの伸張画像を構成する画素の値が全て1となるよう、当該2値画像を2値符号化方式により符号化することを特徴とする。
【0013】
請求項8にかかる発明は、請求項1乃至請求項7のいずれか一項にかかる発明において、前記画像は、IS15444シリーズで規定されるJPEG2000ファミリーファイル、国際標準IS15444−1 JPEG2000 IMAGE CODING SYSTEM:Core Coding Systemで示すJPEG2000コードストリーム、国際標準IS15444−1 JPEG2000 IMAGE CODING SYSTEM:Core Coding Systemで示すJPEG2000ファイル、国際標準IS15444−2 JPEG2000 IMAGE CODING SYSTEM:EXTENTIONSで示すJPEG2000ファイル、国際標準IS15444−3 MOTION JPEG2000で示すJPEG2000パート3ファイルで示すモーションJPEG2000ファイル及び国際標準IS15444−6 INFORMATIONTECHNOLOGY−JPEG2000 IMAGE Coding System:Part6:Compound Image Fileで示すJPMファイルのうち少なくとも1つのファイル形式で表される画像であることを特徴とする。
【0014】
請求項9にかかる発明は、請求項1乃至請求項8のいずれか一項にかかる発明において、前記構造化文書は、国際標準IS15444−6 INFORMATIONTECHNOLOGY−JPEG2000 IMAGE Coding System:Part6:Compound Image File Formatで示すJPEG2000パート6ファイル、PDF:Portable Document Formatで示すPDFファイル、PostScriptファイル及びDjvuファイルのうち少なくとも1つのファイル形式により表される画像であることを特徴とする。
【0015】
請求項10にかかる発明は、入力画像を符号化して、前景、背景及びマスクから構成される構造化文書を生成する符号化方法であって、前記前景として第1多値画像を割り当て、前記背景として第2多値画像を割り当て、前記マスクとして2値画像を割り当て、前記前景、前記背景及び前記マスクを各々符号化する符号化ステップと、前記符号化手段が符号化した前記前景、前記背景及び前記マスクを所定のファイルフォーマットに従って組み立てて構造化文書を生成する組立ステップとを含み、前記符号化ステップは、前記第1多値画像として任意の画像を多値符号化方式により符号化する第1符号化ステップと、前記第2多値画像として前記入力画像を多値符号化方式により符号化する第2符号化ステップと、前記2値画像として白色を表す画像を2値画像符号化方式により符号化する第3符号化ステップとを含むことを特徴とする。
【発明の効果】
【0016】
本発明によれば、高画質な構造化文書の生成に掛かる処理時間を低減することができる。
【発明を実施するための最良の形態】
【0017】
以下に添付図面を参照して、この発明にかかる符号化装置及び符号化方法の最良な実施の形態を詳細に説明する。
【0018】
(1)構成
本実施の形態にかかる符号化装置1の構成について説明する。符号化装置1は、CPU(Central Processing Unit)と、ROM(Read Only Memory)と、RAM(Random Access Memory)と、HDD(Hard Disk Drive)やCD(Compact Disk)ドライブ装置等の外部記憶装置と、通信I/Fと、ユーザからの操作が入力される操作装置と、情報を表示する表示装置と、これらを接続するバスを備えており(いずれも図示せず)、通常のコンピュータを利用したハードウェア構成となっている。外部記憶装置には、各種プログラムや各種データが記憶される。また、外部記憶装置には、例えば、スキャナにより読み取られた文書の画像を構造化文書のファイルフォーマット(例えば、JPMとする)で符号化した符号データ(JPMファイル)が記憶される。構造化文書とは、文字からなる文字部分や絵柄からなる絵柄部分などの構成要素が混在する一般的なオフィス文書(絵柄混在文書という)において、これらの構成要素をオブジェクトとして捉え、前景、背景及び前景と背景とを切り替えるためのマスクを有する複数のレイアウトオブジェクトから構成されるものである。ここで、前景と背景とは高精細カラー画像となるため、タイル分割またはプレシンクト分割を行うようにJPEG2000符号化方式により符号化されており、それぞれ4分割されている。一方、マスクは、MH/MR/MMRのような分割構造を持たない2値画像符号化方式により符号化されている。以降、このようなマスクを2値マスクという。ROMには、各種プログラムや各種データが記憶される。CPUは、ROMや外部記憶装置に記憶されている各種プログラムをRAMにロードしてこれを実行することにより、装置全体を制御し、各種機能を実現させる。特に、本実施の形態においては、CPUは、絵柄混在文書を符号化して構造化文書を生成する機能を実現させる。
【0019】
ここで、符号化装置1が絵柄混在文書を符号化して構造化文書を生成する機能について簡単に説明する。図1は、符号化装置1が絵柄混在文書を符号化して構造化文書を生成する機能を概念的に示した図である。符号化装置1は、絵柄混在文書G1を用いて、構造化文書の各オブジェクトである前景G2、背景G3及びマスクG4に対して各々画像を割り当てる。背景及び前景は、2値画像又は多値画像であり、マスクは2値画像である。そして、符号化装置1は、前景G2に割り当てた画像を多値符号化方式により符号化し、背景G3に割り当てた画像を多値符号化方式により符号化し、マスクG4に割り当てた画像を2値画像符号化方式により符号化する。そして、符号化装置1は、各々符号化した画像を組み立てることにより、構造化文書G5を生成する。ここで、本実施の形態において特徴的なことは、前景G2、背景G3及びマスクG4を、絵柄混在文書からの分離により得るのではなく、画像の割り当てにより得る。どのように画像を割り当てるかについては後述の動作欄で説明する。
【0020】
次に、符号化装置1のCPUが各種プログラムを実行することにより符号化装置1において実現される機能について説明する。図2は、符号化装置1の機能的構成を示すブロック図である。符号化装置1の機能的構成は、入力ファイルパーサ手段11と、符号化手段12と、組立手段13とからなる。
【0021】
入力ファイルパーサ手段11は、処理対象として入力された絵柄混在文書(入力ファイル10)を外部記憶装置から読み出し、当該絵柄混在文書に書き込まれた情報を読み取ることにより絵柄混在文書の状態を解釈する。このような情報は、例えば、絵柄混在文書のヘッダに書き込まれている。具体的には、入力ファイルパーサ手段11は、絵柄混在文書の状態として、既に圧縮されているのか又は非圧縮なのかを解釈したり、絵柄混在文書が複数のページからなるか否かを解釈したりする。入力された絵柄混在文書が非圧縮であり且つ複数ページからなる場合、入力ファイルパーサ手段11は、当該絵柄混在文書をページ毎に分割して、これらを符号化手段12に引き渡す。
【0022】
符号化手段12は、入力ファイルパーサ手段11から引き渡された絵柄混在文書についてページ毎に、構造化文書の各オブジェクト(前景、背景及びマスク)に対して各々画像を割り当て、各オブジェクトを所定の符号化方式により各々符号化する。符号化手段12の具体的な動作については後述の動作欄で詳述する。
【0023】
組立手段13は、符号化手段12が各々符号化した各符号データ(コードストリーム)を所定のデータフォーマットに従って組み立てる。概略的には、組立手段13は、上述した符号データのうち、背景、マスクの順に画像を重ね合わせ、マスクにおいて黒を表す画素については、前景の対応する画素に置き換える。組立手段13は、このようにして組み立てた構造化文書を出力ファイル14として外部記憶装置に出力する。
【0024】
(2)動作
次に、符号化装置1の動作について説明する。図3は、符号化装置1が絵柄混在文書を符号化して構造化文書を生成する処理の手順を示すフローチャートである。ユーザが操作装置を介して処理対象の絵柄混在文書の符号化要求を入力すると、符号化装置1は、当該符号化要求の入力を受け付ける(ステップS1)。尚、ここで入力される符号化要求には、例えば、処理対象の絵柄混在文書のファイル名(入力ファイル名)と、処理後の構造化文書のファイル名(出力ファイル名)と、圧縮率(例えば、1/500)とが含まれる。そして、符号化装置1の入力ファイルパーサ手段11は、符号化要求に含まれる入力ファイル名を有する絵柄混在文書を外部記憶装置から読み出す(ステップS2)。入力ファイルパーサ手段11は、読み出した絵柄混在文書が非圧縮か否かを判別し(ステップS3)、当該判別結果が肯定的である場合、入力ファイルパーサ手段11は、読み出した絵柄混在文書をページ毎に分解して、符号化手段12に引き渡す。
【0025】
符号化手段12は、入力ファイルパーサ手段11が引き渡された絵柄混在文書について、ページ毎に以下の処理を行う。符号化手段12は、構造化文書の各オブジェクト(背景、前景、マスク)に対して画像を各々割り当てる(ステップS4)。具体的には、符号化手段12は、背景として1ページの画像全体を割り当て、マスクとして全面白色の画像を割り当て、前景として全面白色の画像を割り当てる。即ち、ここでは、符号化装置1は、絵柄混在文書を画像成分分析して絵柄部分とエッジ部分とに分離することはせず、絵柄混在文書の画像を背景に割り当てる。そして、符号化装置1は、従来であれば、例えば、エッジ部分の画像を表すマスクに対してダミーの画像として、全面白色の画像を割り当てる。即ち、マスクに対して、エッジ部分が全くない状態を表す画像を符号化装置1は割り当てる。そして、エッジ部分の色を表す画像が割り当てられる前景については、マスクにエッジ部分が全くない状態であるから、表すべき色がない状態となる。このため、前景に割り当てる画像はどのような画像であっても良いが、ここでは便宜的に全面白色の画像を符号化装置1は割り当てる。また、発色は白色以外の他の色であっても良いし、発色のパターンは全面でなくても良く他のパターンであっても良い。一般的には圧縮率が高くなるようにすべて同じ値のパターンとすることが好ましい。
【0026】
そして、符号化手段12は、以上のように画像を割り当てた前景を多値画像符号化方式により符号化し(ステップS5)、背景を多値画像符号化方式により符号化し(ステップS6)、マスクを2値画像符号化方式により符号化する(ステップS7)。尚、符号化手段12は、マスクを2値画像符号化方式により符号化する際に所定の閾値で量子化する処理も適宜行う。
【0027】
組立手段13は、符号化手段12が各オブジェクトを各々符号化した符号データを所定のファイルフォーマットに従って組み立て、コードストリームを組み立てるという一連の動作をページ毎に繰り返し、構造化文書を生成する(ステップS8)。組立手段13が、背景、前景及びマスクを所定のファイルフォーマットに従って組み立てて構造化文書を生成する処理の手順は、周知技術のMRC(Mixed Raster Content)符号化方式によるものと同様であるため、ここではその説明を省略する。そして、組立手段13は、生成した構造化文書を、ステップS1で入力を受け付けた符号化要求に含まれる出力ファイル名で外部記憶装置に出力する一方、処理結果を表示装置に出力する(ステップS9)。
【0028】
以上のようにして、絵柄混在文書を高い圧縮率で符号化して構造化文書を生成する場合、背景、前景及びマスクに対して画像を割り当てる。このため、絵柄混在文書に対して画像成分分析を行って背景、前景及びマスクに分離する必要がない。従って、多くの処理時間を掛けずに高品質な画像を提供することができる。
【0029】
[変形例]
また、上述した各実施の形態に限定されるものではなく、以下に例示するような種々の変形が可能である。
【0030】
<変形例1>
上述の実施の形態の符号化装置1で実行される各種プログラムは、インストール可能な形式又は実行可能な形式のファイルでCD−ROM、フレキシブルディスク(FD)、CD−R、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録して提供するように構成してもよい。また、当該プログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由で符号化装置1にダウンロードさせることにより提供するように構成しても良い。
【0031】
<変形例2>
上述の実施の形態においては、符号化手段12は、マスクとして全面白色の画像を割り当て、前景として全面白色の画像を割り当てたが、当該画像を符号化した符号化画像を構成する画素の値又は当該符号化画像を伸張したときの伸張画像を構成する画素の値が、全て「0」となるように、符号化すれば良い。
【0032】
<変形例3>
上述した実施の形態においては、符号化手段12は、絵柄混在文書について、1ページの画像全体を構造化文書の背景に割り当てるように構成したが、これを前景に割り当てるようにしても良い。図4は、本変形例にかかる符号化装置1が絵柄混在文書を符号化して構造化文書を生成する機能を概念的に示した図である。この場合、マスクG4には、全面黒色の画像を割り当てる。背景G3には、任意の画像を割り当て可能であるが、ここでは、一例として、全面白色の画像を割り当てる。このような構成によれば、図3のステップS5で組立手段13が背景の画像にマスクの画像を重ね合わせたとき、マスクの全画素を前景の対応する画素に置き換えることになる。この結果、表れる画像は、前景の画像となり、絵柄混在文書の1ページの画像全体と同じとなる。従って、以上のような構成によっても、絵柄混在文書から構造化文書を生成する場合に、絵柄混在文書を画像成分分析して背景、前景及びマスクに分離する必要がなく、多くの処理時間を掛けずに高品質な画像を提供することができる。
【0033】
尚、マスクとして全面黒色の画像を割り当てたが、符号化手段12は、当該画像を符号化した符号化画像を構成する画素の値又は当該符号化画像を伸張したときの伸張画像を構成する画素の値が、全て「1」となるように、符号化すれば良い。
【0034】
<変形例4>
上述の実施形態において、符号化手段12が構造化文書の各オブジェクト(前景、背景、マスク)を符号化するタイミングは、これらを組み立てる時であっても良いし、これらを組み立てる前であっても良い。これらを組み立てる前に符号化する場合とは、例えば、画像を予め符号化した符号データ(コードストリーム)を予め用意しておく場合である。図5は、符号化装置1が、絵柄混在文書の符号化の際に、前景の画像及びマスクの画像が予め符号化されたコードストリームを用いて構造化文書を生成する機能を概念的に示した図である。同図に示される符号化済前景コードストリームM1は、前景を多値符号化方式により予め符号化したコードストリームであり、例えば外部記憶装置に記憶される。尚、符号化前の前景の画像は、上述の実施の形態と同様に、一例として全面白色の画像又は任意の画像である。また、符号化済マスクコードストリームM2は、マスクを2値画像符号化方式により予め符号化したコードストリームであり、例えば外部記憶装置に記憶される。尚、符号化前のマスクは上述の実施の形態と同様に、全面白色の画像である。組立手段13は、符号化手段12が符号化した背景のコードストリームと、外部記憶装置に予め記憶された符号化済前景コードストリーム及び符号化済マスクコードストリームを用いて組立を行い構造化文書を生成する。
【0035】
このような構成によっても、多くの処理時間を掛けずに高品質な画像を提供することができる。
【0036】
また、上述の変形例3においても同様に、マスク及び背景を各々符号化したコードストリームを外部記憶装置などに予め記憶させておき、組立手段13は、これらと上述した前景とを組み立てるようにしても良い。
【0037】
<変形例5>
上述の実施の形態においては、符号化装置1が符号化する対象の画像として絵柄混在文書を取り扱ったが、これに限らず、絵柄や写真のみの多値画像や文字のみの2値画像を符号化の対象としても良い。
【0038】
また、符号化装置1が符号化する対象の画像は、IS15444シリーズで規定されるJPEG2000ファミリーファイル、国際標準IS15444−1 JPEG2000 IMAGE CODING SYSTEM:Core Coding Systemで示すJPEG2000コードストリーム、国際標準IS15444−1 JPEG2000 IMAGE CODING SYSTEM:Core Coding Systemで示すJPEG2000ファイル、国際標準IS15444−2 JPEG2000 IMAGE CODING SYSTEM:EXTENTIONSで示すJPEG2000ファイル、国際標準IS15444−3 MOTION JPEG2000で示すJPEG2000パート3ファイルで示すモーションJPEG2000ファイル及び国際標準IS15444−6 INFORMATIONTECHNOLOGY−JPEG2000 IMAGE Coding System:Part6:Compound Image Fileで示すJPMファイルのうち少なくとも1つのファイル形式で表される画像であっても良い。
【0039】
また、符号化装置が生成する構造化文書は、国際標準IS15444−6 INFORMATIONTECHNOLOGY−JPEG2000 IMAGE Coding System:Part6:Compound Image File Formatで示すJPEG2000パート6ファイル、PDF:Portable Document Formatで示すPDFファイル、PostScriptファイル及びDjvuファイルのうち少なくとも1つのファイル形式で表される画像であっても良い。
【産業上の利用可能性】
【0040】
本発明は、画像を符号化して構造化文書を生成する符号化技術に用いて好適である。
【図面の簡単な説明】
【0041】
【図1】本発明の一実施の形態にかかる符号化装置1が絵柄混在文書を符号化して構造化文書を生成する機能を概念的に示した図である。
【図2】同実施の形態にかかる符号化装置1の機能的構成を示すブロック図である。
【図3】同実施の形態にかかる符号化装置1が絵柄混在文書を符号化して構造化文書を生成する処理の手順を示すフローチャートである。
【図4】同実施の形態の一変形例にかかる符号化装置1が絵柄混在文書を符号化して構造化文書を生成する機能を概念的に示した図である。
【図5】同実施の形態の一変形例にかかる符号化装置1が、絵柄混在文書の符号化の際に、前景の画像及びマスクの画像が予め符号化されたコードストリームを用いて構造化文書を生成する機能を概念的に示した図である。
【符号の説明】
【0042】
1 符号化装置
11 入力ファイルパーサ手段
12 符号化手段
13 組立手段

【特許請求の範囲】
【請求項1】
入力画像を符号化して、前景、背景及びマスクから構成される構造化文書を生成する符号化装置であって、
前記前景として第1多値画像を割り当て、前記背景として第2多値画像を割り当て、前記マスクとして2値画像を割り当て、前記前景、前記背景及び前記マスクを各々符号化する符号化手段と、
前記符号化手段が符号化した前記前景、前記背景及び前記マスクを所定のファイルフォーマットに従って組み立てて構造化文書を生成する組立手段とを備え、
前記符号化手段は、
前記第1多値画像として任意の画像を多値符号化方式により符号化する第1符号化手段と、
前記第2多値画像として前記入力画像を多値符号化方式により符号化する第2符号化手段と、
前記2値画像として白色を表す画像を2値画像符号化方式により符号化する第3符号化手段とを有する
ことを特徴とする符号化装置。
【請求項2】
前記第1符号化手段は、前記第1多値画像として白色を表す画像を多値符号化方式により符号化する
ことを特徴とする請求項1に記載の符号化装置。
【請求項3】
入力画像を符号化して、前景、背景及びマスクから構成される構造化文書を生成する符号化装置であって、
前記前景として第1多値画像を割り当て、前記背景として第2多値画像を割り当て、前記マスクとして2値画像を割り当て、前記前景、前記背景及び前記マスクを各々符号化する符号化手段と、
前記符号化手段が符号化した前記前景、前記背景及び前記マスクを所定のファイルフォーマットにより組み立てて構造化文書を生成する組立手段とを備え、
前記符号化手段は、
前記第1多値画像として前記入力画像を多値符号化方式により符号化する第1符号化手段と、
前記第2多値画像として任意の画像を多値符号化方式により符号化する第2符号化手段と、
前記2値画像として黒色を表す画像を2値画像符号化方式により符号化する第3符号化手段とを有する
ことを特徴とする符号化装置。
【請求項4】
入力画像を符号化して、前景、背景及びマスクから構成される構造化文書を生成する符号化装置であって、
前記背景として前記入力画像を多値画像符号化方式により符号化する符号化手段と、
前記符号化手段が符号化した前記背景と、任意の画像が多値符号化方式により予め符号化されて第1記憶手段に記憶された符号化済前景と、白色を表す画像が2値符号化方式により予め符号化されて第2記憶手段に記憶された符号化済マスクとを所定のファイルフォーマットにより組み立てて構造化文書を生成する組立手段とを備える
ことを特徴とする符号化装置。
【請求項5】
前記第1符号化手段は、前記第1多値画像を構成する画素の値が全て0となるよう、又は当該第1多値画像を伸張したときの伸張画像を構成する画素の値が全て0となるよう、当該第1多値画像を多値符号化方式により符号化する
ことを特徴とする請求項2又は請求項3に記載の符号化装置。
【請求項6】
前記第3符号化手段は、前記2値画像を構成する画素の値が全て0となるよう、又は当該2値画像を伸張したときの伸張画像を構成する画素の値が全て0となるよう、当該2値画像を2値符号化方式により符号化する
ことを特徴とする請求項1に記載の符号化装置。
【請求項7】
前記第3符号化手段は、前記2値画像を構成する画素の値が全て1となるよう、又は当該2値画像を伸張したときの伸張画像を構成する画素の値が全て1となるよう、当該2値画像を2値符号化方式により符号化する
ことを特徴とする請求項3に記載の符号化装置。
【請求項8】
前記画像は、IS15444シリーズで規定されるJPEG2000ファミリーファイル、国際標準IS15444−1 JPEG2000 IMAGE CODING SYSTEM:Core Coding Systemで示すJPEG2000コードストリーム、国際標準IS15444−1 JPEG2000 IMAGE CODING SYSTEM:Core Coding Systemで示すJPEG2000ファイル、国際標準IS15444−2 JPEG2000 IMAGE CODING SYSTEM:EXTENTIONSで示すJPEG2000ファイル、国際標準IS15444−3 MOTION JPEG2000で示すJPEG2000パート3ファイルで示すモーションJPEG2000ファイル及び国際標準IS15444−6 INFORMATIONTECHNOLOGY−JPEG2000 IMAGE Coding System:Part6:Compound Image Fileで示すJPMファイルのうち少なくとも1つのファイル形式で表される画像である
ことを特徴とする請求項1乃至請求項7のいずれか一項に記載の符号化装置。
【請求項9】
前記構造化文書は、国際標準IS15444−6 INFORMATIONTECHNOLOGY−JPEG2000 IMAGE Coding System:Part6:Compound Image File Formatで示すJPEG2000パート6ファイル、PDF:Portable Document Formatで示すPDFファイル、PostScriptファイル及びDjvuファイルのうち少なくとも1つのファイル形式により表される画像である
ことを特徴とする請求項1乃至請求項8のいずれか一項に記載の符号化装置。
【請求項10】
入力画像を符号化して、前景、背景及びマスクから構成される構造化文書を生成する符号化方法であって、
前記前景として第1多値画像を割り当て、前記背景として第2多値画像を割り当て、前記マスクとして2値画像を割り当て、前記前景、前記背景及び前記マスクを各々符号化する符号化ステップと、
前記符号化手段が符号化した前記前景、前記背景及び前記マスクを所定のファイルフォーマットに従って組み立てて構造化文書を生成する組立ステップとを含み、
前記符号化ステップは、
前記第1多値画像として任意の画像を多値符号化方式により符号化する第1符号化ステップと、
前記第2多値画像として前記入力画像を多値符号化方式により符号化する第2符号化ステップと、
前記2値画像として白色を表す画像を2値画像符号化方式により符号化する第3符号化ステップとを含む
ことを特徴とする符号化方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate


【公開番号】特開2009−5247(P2009−5247A)
【公開日】平成21年1月8日(2009.1.8)
【国際特許分類】
【出願番号】特願2007−166300(P2007−166300)
【出願日】平成19年6月25日(2007.6.25)
【出願人】(000006747)株式会社リコー (37,907)
【Fターム(参考)】