説明

画像データ作成方法、画像データ作成装置、及びプログラム

【課題】特別なソフトを用意することなく、文字や画像が混在した文書を閲覧することができる画像データ作成方法を提供する。
【解決手段】元の文書からJPEGフォーマットで規定された文書画像データ100を作成する。文書画像データ100は、元の文書の全領域の画像170aに対応する主画像データ170と、JPEGヘッダ120とを含む。また、JPEGヘッダ120には、元の文書の文字列(11月11日 佳能山)を構成する文字であって文字装飾が施されていない標準文字が文書情報130として格納される。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像データ作成方法、画像データ作成装置、及びプログラムに関し、特に、文字を含む文書の画像から所定フォーマットの画像データを作成する画像データ作成方法、画像データ作成装置、及びプログラムに関する。
【背景技術】
【0002】
パーソナルコンピュータ(以下、「PC」という)では、ワープロソフトなどを用いることにより、標準文字に文字装飾を施した装飾文字を含む文書だけでなく、挿絵や図を含む文書を作成することができる。また、作成した文書は、この文書を作成したワープロソフトに固有のフォーマットで電子データ(ファイル)として保存することができる。
【0003】
ここで、標準文字のみの文書は、ワープロソフトに固有のフォーマットに限られることはなく、他のPCでも読み取り可能なテキストデータとして保存することもできる。一方、装飾文字、挿絵、及び図などを含む文書は、フォーマットが異なるためテキストデータとして保存することができない。このため、装飾文字、挿絵、及び図などを含む文書は、テキストデータよりも解像度が高く即ちデータサイズが大きい画像データとして保存されることがある。
【0004】
そこで、データサイズが大きいままのオリジナル画像と、当該オリジナル画像のデータサイズを縮小したサムネイル画像との双方を管理する技術が提案されている(例えば、特許文献1参照。)。この技術では、オリジナル画像はネットワーク上に格納されており、サムネイル画像を含むデータからオリジナル画像を参照することができる。
【特許文献1】特許第3021023号公報
【発明の開示】
【発明が解決しようとする課題】
【0005】
しかしながら、ワープロソフトに固有のフォーマットで保存されたデータは、そのワープロソフト又はそれと互換性のあるワープロソフトでしか取り扱うことができない。このため、他のPCがこのようなデータを受信・読み書き・編集・閲覧・印刷などの処理を実行するためには、このようなデータを取り扱い可能なワープロソフトを用意する必要がある。ワープロソフトが用意できない場合であっても、このようなデータを少なくとも閲覧可能なビューアソフトを用意する必要がある。
【0006】
また、文書を画像データとして保存すると、画像データからテキストデータを抽出することが困難となる。
【0007】
本発明の目的は、特別なソフトを用意することなく、文字や画像が混在した文書を閲覧することができる画像データ作成方法、画像データ作成装置、及びプログラムを提供することにある。
【課題を解決するための手段】
【0008】
上記目的を達成するために、本発明の画像データ作成方法は、少なくとも1つの文字が配置された文書の画像から所定のフォーマットの画像データを作成する画像データ作成方法において、前記文書の全領域の画像に対応する主画像データを作成する主画像データ作成ステップと、前記文書に関する文書情報を抽出する文書情報抽出ステップと、前記主画像データ及び前記文書情報を含むフォーマットの文書画像データを作成するフォーマットステップとを有することを特徴とする。
【0009】
上記目的を達成するために、本発明の画像データ作成装置は、少なくとも1つの文字が配置された文書の画像から所定のフォーマットの画像データを作成する画像データ作成装置において、前記文書の全領域の画像に対応する主画像データを作成する主画像データ作成手段と、前記文書に関する文書情報を抽出する文書情報抽出手段と、前記主画像データ及び前記文書情報を含むフォーマットの文書画像データを作成するフォーマット手段とを備えたことを特徴とする。
【0010】
上記目的を達成するために、本発明のプログラムは、少なくとも1つの文字が配置された文書の画像から所定のフォーマットの画像データを作成する画像データ作成方法をコンピュータに実行させるプログラムであって、前記文書の全領域の画像に対応する主画像データを作成する主画像データ作成モジュールと、前記文書に関する文書情報を抽出する文書情報抽出モジュールと、前記主画像データ及び前記文書情報を含むフォーマットの文書画像データを作成するフォーマットモジュールとを備えたことを特徴とする。
【発明の効果】
【0011】
本発明によれば、特別なソフトを用意することなく、文字や画像が混在した文書を閲覧することができる。
【発明を実施するための最良の形態】
【0012】
以下、本発明の実施の形態について図面を参照しながら詳細に説明する。
【0013】
図1は、本発明の実施の形態に係る画像データ作成方法にしたがって作成された文書画像データのフォーマットを示す模式図である。
【0014】
本実施の形態に係る画像データ作成方法を実行する画像データ作成装置はコンピュータによって実現される。また、このコンピュータは、ネットワークを介して、多数の画像データを格納可能なサーバ(不図示)に接続されている。
【0015】
図1に示す文書画像データ100は、上記コンピュータにより、図2に示すような文書200から作成された画像データ(以下、このようなデータを「文書画像データ」という)である。図2に示すように、文書200には、複数の文字からなる文字列240と、写真画像250とが配置されている。
【0016】
図1において、文書画像データ100は、JPEGフォーマットで規定されており、SOI(Start of image)110と、JPEGヘッダ120と、主画像データ170と、EOI(End of image)180とから構成されている。
【0017】
主画像データ170としては、文書200の全領域の画像をJPEGフォーマットの文書画像データとして保存したビットマップ画像に対応する画像データが格納される。このビットマップ画像は、DCT変換、量子化、及びエントロピ符号化などの公知のJPEGフォーマットに従って圧縮されている。したがって、図1に示す主画像データ170に対応する主画像170aは、図2の文書200又は写真画像250に比べて、解像度が低く、データサイズが小さい。
【0018】
JPEGヘッダ120には、後述する文書情報130が格納されている。文書情報130を格納するためには、アプリケーションセグメントであるAPPnマーカやCOM(comment)マーカが用いられる。これにより、この文書情報130をコンピュータで読み取り可能にすることができる。
【0019】
文書情報130は、図1に示すように、テキスト情報140と、オリジナル画像情報150とから構成されている。テキスト情報140及びオリジナル画像情報150は、コンピュータが文書画像データ100を生成する際に、文書200から文字列240に関する情報及び写真画像250に関する情報をそれぞれ抽出したものである。
【0020】
図1に示すように、テキスト情報140としては、文字列240を構成する標準文字と、当該標準文字に施されている文字装飾に関する文字装飾情報と、文字列240の文書200上の配置及びサイズを示すレイアウト情報とが格納される。なお、このレイアウト情報は、文字列240のサイズに関する情報を含まなくてもよい。
【0021】
さらに、テキスト情報140としては、後述するフォントデータの格納場所を示すフォントアドレスも格納される。
【0022】
このフォントデータは、文字列240に対応するベクタ画像データであって、コンピュータがテキスト情報140を抽出した際にサーバの所定領域に画像ファイルとして格納したものである。したがって、フォントアドレスは、サーバ内の画像ファイルの格納位置を特定するアドレス又はパスを示している。すなわち、ユーザは、コンピュータを用いてこのフォントアドレスを参照することにより、サーバにアクセスして、フォントデータに対応するフォント画像340(図3(b))を閲覧することができる。なお、フォントデータ340は、ベクタ画像に限られることはなく、ビットマップ画像であってもよい。
【0023】
また、オリジナル画像情報150としては、写真画像250の文書200上の配置及びサイズを示すレイアウト情報が格納される。さらに、オリジナル画像情報150としては、後述するオリジナル画像データの格納場所を示す画像アドレスも格納される。
【0024】
このオリジナル画像データは、写真画像250に対応するベクタ画像データであって、コンピュータがオリジナル画像情報150を抽出した際にサーバの所定領域に画像ファイルとして格納したものである。なお、この画像ファイルは、上記フォントデータを格納した画像ファイルと同一であることが好ましい。
【0025】
したがって、画像アドレスは、サーバ内の画像ファイルの格納位置を特定するアドレス又はパスを示している。すなわち、ユーザは、コンピュータを用いてこの画像アドレスを参照することにより、サーバにアクセスして、オリジナル画像データに対応するオリジナル画像350(図3(a))を閲覧することができる。
【0026】
このオリジナル画像350の解像度は、写真画像250の解像度と同一である。これにより、ユーザは、画質の劣化のない画像を閲覧することができる。なお、オリジナル画像350の解像度を写真画像250の解像度よりも低く、且つ主画像170aの解像度よりも高くしてもよい。
【0027】
また、ユーザは、コンピュータを用いて、上記フォントアドレス及び画像アドレスの双方を参照することにより、オリジナル画像350とフォント画像340の双方を閲覧することもできる。このとき、テキスト情報140及びオリジナル画像情報150として格納されているレイアウト情報に基づいて、オリジナル画像350とフォント画像340の双方の配置及びサイズを文書200と同様にすることが好ましいが、サイズを変更してもよい。
【0028】
以上詳細に説明したように、本実施の形態によれば、文書200がその主画像データ170と文書情報130との集合体として表現される。
【0029】
なお、上記実施の形態において、テキスト情報140として、フォントアドレスを格納したが、これに代えて、フォントデータ340そのものを格納してもよい。同様に、オリジナル画像データ150として、画像アドレスを格納したが、これに代えて、オリジナル画像データ350そのものを格納してもよい。
【0030】
次に、本発明の実施の形態の変形例について説明する。本変形例では、文書200が複数ページから成る場合に、各ページの文書に対しても文書画像データが作成される。
【0031】
図4は、本変形例において作成された文書画像データのフォーマットを示す模式図である。
【0032】
図4に示すように、本変形例によって作成される文書画像データ100’のフォーマットは、基本的には、図1に示した文書画像データ100のフォーマットと同一であるので、異なる部分のみ説明する。
【0033】
本変形例では、文書画像データ100’の文書情報130’に、文書200を構成する各ページに関するページ情報160が格納される。このページ情報160としては、各ページの文書に対応する文書画像データにアクセスするためのページアドレスが1ページ目アドレス、2ページ目アドレスというように図4に示すように格納される。
【0034】
また、文書画像データ100’の主画像データ170に対応する主画像は、文書200の全ページに対応する画像であってもよいし、第1ページ目の画像であってもよいし、文書200を構成する複数のページのうちユーザが指定した代表ページの画像であってもよい。
【0035】
図5は、図4の文書画像データ100’に関連した複数のデータを格納するサーバの格納領域を示す模式図である。
【0036】
図5に示すように、サーバの格納領域300には、文書画像データ100’に関連して、文書200のページ数に対応する数の文書画像データ100a,100b,…、フォントデータ540、及びオリジナル画像データ550が格納されている。なお、フォントデータ540及びオリジナル画像データ550は、それぞれ、文書画像データ100’の主画像データ170に対応するフォントデータ及びオリジナル画像データも含む。
【0037】
図5において、例えば、文書画像データ100aは、文書200の第1ページ目に該当し、図1の文書画像データ100と同様に作成されたものである。文書画像データ100aのテキスト情報140内のフォントアドレスを参照すると、サーバの格納領域300内のフォントデータ540が参照される。また、文書画像データ100aのオリジナル画像情報150内の画像アドレスを参照すると、サーバの格納領域300内のオリジナル画像データ550が参照される。文書画像データ100aと同様に、文書200の他のページについても同様に文書画像データが作成され、サーバの格納領域300に格納される。
【0038】
本変形例によれば、文書画像データ100’にページ情報160を格納するだけで、文書200を構成する各ページを閲覧することができる。換言すれば、文書画像データ100’のデータサイズをほとんど変えることなく、文書画像データ100’から多くの情報を参照することができる。
【0039】
以上説明したように、本実施の形態及びその変形例によれば、文書画像データがJPEGフォーマットで規定されているため、どのようなOSを搭載したコンピュータであっても、少なくとも主画像170aを閲覧することができる。また、文書画像データには、テキスト情報140として標準文字が格納されているので、文字装飾が施されている文字列であっても、少なくとも文字装飾が施されていない標準文字を閲覧することができる。これらの結果、文字や画像が混在した文書を閲覧する際に、ワープロソフトやビューアソフトなどの特別なソフトを用意する必要をなくすことができる。また、本実施の形態及びその変形例では、文字を含むデータの利便性を従来よりも向上させることができる。
【0040】
また、サーバにオリジナル画像データが格納されているので、文書画像データのデータサイズを非常に小さく、即ち文書画像データをコンパクトにすることができる。
【0041】
また、サーバにアクセス可能なコンピュータであれば、フォントアドレス及び画像アドレスに基づいて、文字装飾が施された文字や解像度の高いオリジナル画像を閲覧することができるので、文字を含むデータの利便性を損なうことをなくすことができる。
【0042】
なお、上記実施の形態及びその変形例では、文書画像データは、JPEGフォーマットで規定したが、JEPGフォーマットに限られることはなく、画像データを規定可能なフォーマットであればいかなるフォーマットであってもよい。
【0043】
また、文書200が写真画像250を含まない、即ち文書200が文字列210のみで構成されている場合には、オリジナル画像情報150やオリジナル画像350などが生成されることはない。また、文書200が写真画像や、図、挿絵、複数の文字列を含む場合には、それらの数に応じたテキスト情報140及びオリジナル画像情報150が生成される。
【0044】
上記実施の形態及びその変形例では、オリジナル画像情報150として、文書200上の写真画像250に関する情報を抽出したが、文書200上の文字列240以外の領域に対応する部分画像、即ち余白部分を含む画像に関する情報を抽出してもよい。
【0045】
テキスト情報140及びオリジナル画像情報150として格納されるレイアウト情報は、文書200上の配置及びサイズだけでなく、サーバにアクセスしたときに表示される表示サイズやその配置(表示位置)に関する情報も含まれる。
【0046】
サーバは、文書画像データを取り扱うコンピュータからアクセス可能に構成されていれば、どのような構成であってもよいし、どのようなOSを搭載するものであってもよい。
【0047】
また、文書画像データは、携帯情報端末、携帯電話、デジタルカメラなどの携帯機器が取り扱ってもよい。携帯機器であっても、文書画像データのフォーマットがJPEGフォーマットであるのでファームウェアの修正が不要である。これらの携帯機器では、少なくとも主画像170aが閲覧可能であり、サーバにアクセス可能に構成されていればオリジナル画像350及びフォント画像340が閲覧可能である。
【0048】
また、本発明の目的は、以下の処理を実行することによって達成される。即ち、上述した実施の形態及びその変形例の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システム或いは装置に供給し、そのシステム或いは装置のコンピュータ(又はCPUやMPUなど)が記憶媒体に格納されたプログラムコードを読み出す処理である。
【0049】
この場合、記憶媒体から読み出されたプログラムコード自体が上記実施の形態及びその変形例の機能を実現することになり、そのプログラムコード及び該プログラムコードを記憶した記憶媒体は本発明を構成することになる。
【0050】
また、プログラムコードを供給するための記憶媒体としては、次のものを用いることができる。例えば、フロッピー(登録商標)ディスク、ハードディスク、光磁気ディスク、CD−R、CD−RW、DVD−ROM、DVD−RAM、DVD−RW、DVD+RW等の光ディスク、磁気テープ、不揮発性のメモリカード、ROMなどである。または、プログラムコードをネットワークを介してダウンロードしてもよい。
【0051】
また、コンピュータが読み出したプログラムコードを実行することにより、上記実施の形態及びその変形例の機能が実現される場合も本発明に含まれる。加えて、そのプログラムコードの指示に基づき、コンピュータ上で稼動しているOS(オペレーティングシステム)などが実際の処理の一部又は全部を行い、その処理によって前述した実施の形態及びその変形例の機能が実現される場合も含まれる。
【0052】
さらに、前述した実施の形態及びその変形例の機能が以下の処理によって実現される場合も本発明に含まれる。即ち、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれる。その後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部又は全部を行う場合である。
【図面の簡単な説明】
【0053】
【図1】本発明の実施の形態に係る画像データ作成方法にしたがって作成された文書画像データのフォーマットを示す模式図である。
【図2】図1の文書画像データを作成するために使用した文書の一例を示す図である。
【図3】(a)は、図2における写真画像に対応してサーバに格納されたオリジナル画像を示す図であり、(b)は、図2における文字列に対応してサーバに格納されたフォント画像を示す図である。
【図4】本発明の実施の形態の変形例において作成された文書画像データのフォーマットを示す模式図である。
【図5】図4の文書画像データに関連した複数のデータを格納するサーバの格納領域を示す模式図である。
【符号の説明】
【0054】
100,100’ 文書画像データ
130 文書情報
140 テキスト情報
150 オリジナル画像情報
170 主画像データ
170a 主画像
200 文書
240 文字列
250 写真画像
340 フォント画像
350 オリジナル画像

【特許請求の範囲】
【請求項1】
少なくとも1つの文字が配置された文書の画像から所定のフォーマットの画像データを作成する画像データ作成方法において、
前記文書の全領域の画像に対応する主画像データを作成する主画像データ作成ステップと、
前記文書に関する文書情報を抽出する文書情報抽出ステップと、
前記主画像データ及び前記文書情報を含むフォーマットの文書画像データを作成するフォーマットステップとを有することを特徴とする画像データ作成方法。
【請求項2】
前記文書情報は、前記文字、前記文字の前記文書上の配置及びサイズを示すレイアウト情報、前記文字のフォントデータの格納場所を示すフォントアドレス、並びに前記文字に施されている装飾に関する文字装飾情報から成る群から選択された少なくとも1つの文字情報を含むことを特徴とする請求項1記載の画像データ作成方法。
【請求項3】
前記文書情報抽出ステップは、前記文書上の前記文字列以外の領域に対応する部分画像に関する情報をオリジナル画像情報として抽出するオリジナル画像抽出ステップを含むことを特徴とする請求項1又は2記載の画像データ作成方法。
【請求項4】
前記文書情報は、前記部分画像、前記部分画像の前記文書上の配置及びサイズを示すレイアウト情報、並びに前記部分画像に対応する画像データの格納場所を示す画像アドレスから成る群から選択された少なくとも1つの部分画像情報を含むことを特徴とする請求項3記載の画像データ作成方法。
【請求項5】
前記主画像データのデータサイズは、前記部分画像に対応する画像データのデータサイズよりも小さいことを特徴とする請求項3又は4記載の画像データ作成方法。
【請求項6】
前記フォーマットはJPEGフォーマットから成り、前記フォーマットステップでは、前記JPEGフォーマットで規定されたヘッダ部分にマーカを用いて前記文書情報を格納することを特徴とする請求項1乃至5のいずれか1項に記載の画像データ作成方法。
【請求項7】
前記文書が複数のページから構成されている場合には、前記フォーマットステップでは、前記文書を構成する各ページの文書画像データを作成すると共に、当該作成した各文書画像データに関するページ情報を前記文書情報として含む文書画像データを作成することを特徴とする請求項1乃至6のいずれか1項に記載の画像データ作成方法。
【請求項8】
少なくとも1つの文字が配置された文書の画像から所定のフォーマットの画像データを作成する画像データ作成装置において、
前記文書の全領域の画像に対応する主画像データを作成する主画像データ作成手段と、
前記文書に関する文書情報を抽出する文書情報抽出手段と、
前記主画像データ及び前記文書情報を含むフォーマットの文書画像データを作成するフォーマット手段とを備えたことを特徴とする画像データ作成装置。
【請求項9】
前記文書情報は、前記文字、前記文字の前記文書上の配置及びサイズを示すレイアウト情報、前記文字のフォントデータの格納場所を示すフォントアドレス、並びに前記文字に施されている装飾に関する文字装飾情報から成る群から選択された少なくとも1つの文字情報を含むことを特徴とする請求項8記載の画像データ作成装置。
【請求項10】
前記文書情報抽出手段は、前記文書上の前記文字列以外の領域に対応する部分画像に関する情報をオリジナル画像情報として抽出するオリジナル画像抽出手段を含むことを特徴とする請求項8又は9記載の画像データ作成装置。
【請求項11】
前記文書情報は、前記部分画像、前記部分画像の前記文書上の配置及びサイズを示すレイアウト情報、並びに前記部分画像に対応する画像データの格納場所を示す画像アドレスから成る群から選択された少なくとも1つの部分画像情報を含むことを特徴とする請求項10記載の画像データ作成装置。
【請求項12】
前記主画像データのデータサイズは、前記部分画像に対応する画像データのデータサイズよりも小さいことを特徴とする請求項10又は11記載の画像データ作成装置。
【請求項13】
前記フォーマットはJPEGフォーマットから成り、前記フォーマット手段は、前記JPEGフォーマットで規定されたヘッダ部分にマーカを用いて前記文書情報を格納することを特徴とする請求項8乃至12のいずれか1項に記載の画像データ作成装置。
【請求項14】
前記文書が複数のページから構成されている場合には、前記フォーマット手段は、前記文書を構成する各ページの文書画像データを作成すると共に、当該作成した各文書画像データに関するページ情報を前記文書情報として含む文書画像データを作成することを特徴とする請求項8乃至13のいずれか1項に記載の画像データ作成装置。
【請求項15】
少なくとも1つの文字が配置された文書の画像から所定のフォーマットの画像データを作成する画像データ作成方法をコンピュータに実行させるプログラムであって、
前記文書の全領域の画像に対応する主画像データを作成する主画像データ作成モジュールと、
前記文書に関する文書情報を抽出する文書情報抽出モジュールと、
前記主画像データ及び前記文書情報を含むフォーマットの文書画像データを作成するフォーマットモジュールとを備えたことを特徴とするプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate