画像処理装置、画像処理方法、プログラム、および記憶媒体

【課題】本発明の課題は、印刷データを検索可能なようにして保存する機能を有する画像処理装置を提供することである。
【解決手段】上記課題を解決するために、本発明では、ビットマップ画像と前記ビットマップ画像の各ピクセルの属性データとを含む印刷データを受信すると、前記属性データの中の文字属性を有するピクセルに基づいて文字認識処理を実行し、当該文字認識結果の文字コードをメタデータとして生成する。更に、前記属性データの中の文字属性を有するピクセルに基づいて、文字輪郭を示すベクタデータを生成する。そして、前記生成したメタデータとベクタデータとを含むドキュメントを生成する。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、ネットワークに接続され、印刷データを送受信する機能を有する画像処理装置、画像処理方法、プログラム、および記憶媒体に関する。
【背景技術】
【０００２】
画像入力機器から入力した画像データを、画像出力機器内の二次記憶装置にファイルとして保存しておけば、ユーザが好きな時間に取り出して繰り返し出力することができる。このように再利用を目的として画像出力装置の二次記憶装置に入力データをファイル形式で保存する機能をボックス機能と呼ぶ。また、再利用を目的として画像出力装置の二次記憶装置に入力データをファイル形式で保存するファイルシステムをボックスと呼ぶ。
【０００３】
ボックス内のファイルは、ドキュメントスキャナで読み取られたビットマップデータや、ネットワークを介して接続されたホストコンピュータから受信したＰＤＬデータである。ボックス内に保存されているファイルが増えるとファイル名やサムネイルなどの一覧情報から目的のファイルを探し出すことが難しくなってくる。
【０００４】
そこで、ユーザが目的のファイルに含まれるキーワードをＵＩ（ユーザインタフェース）から入力し、検索を使ってキーワードにマッチするファイルだけを一覧表示すればユーザの利便性が格段に向上する。
【０００５】
検索対象ファイルがＰＤＬ（ページ記述言語）データの場合、文字として印刷される描画オブジェクトは、通常、文字コードを伴ったフォント情報としてＰＤＬデータ内に記述されている。そのため、ＰＤＬデータ内を直接文字列検索することが可能である。また、ボックス内に保存される際にデータ形式が変換されて文字コード情報を失う場合でも、ボックス保存時に文字コード情報のみを別途保存してメタデータとして添付保存しておくことで、ボックス内に保存されているデータの検索が可能となる。
【発明の開示】
【発明が解決しようとする課題】
【０００６】
一方、ＰＤＬ印刷に用いるデータであっても、文字として印刷される描画オブジェクトデータが文字コード情報を伴っていない場合がある。
【０００７】
ひとつは、ホストコンピュータ上で印刷データをビットマップ展開する場合である。通常のＰＤＬデータを用いて出力を行うと、画像出力機器固有の描画パラメータを用いて画像展開を行う。そのため、予期せぬ画像不良が生じる場合がある。たとえば元画像のドットパターン描画と、画像出力機器固有のハーフトーンとの干渉が発生してしまうケースが挙げられる。また、ＰＤＬデータの内容によっては、ホストコンピュータ上でＰＤＬデータを展開したほうが、処理が高速な場合もある。そのような場面で、ユーザは、ホストコンピュータ上で画像展開するモードを選択できる。
【０００８】
また、画像出力機器として、画像展開を行う装置(ラスタイメージプロセッサ、以下、ＲＩＰと言う。) と、展開された画像を用いて出力を行う機器とが、別の装置になっている場合がある。しかし、このような場合でも、ボックス機能が画像出力装置側に装備されている場合には、ボックス内のデータに文字コード情報を付加することができない。
【０００９】
このような状況においては、画像出力機器が受信するデータ内に検索に用いるための文字コード情報が残っていないため、受信した文字コードを用いて検索用のメタデータを付加することが不可能である。
【課題を解決するための手段】
【００１０】
上記課題を解決するために、本発明に係る画像処理装置は、ビットマップ画像と前記ビットマップ画像の各ピクセルの属性データとを含む印刷データを受信する受信手段と、前記属性データの中の文字属性を有するピクセルに基づいて文字認識処理を実行し、当該文字認識結果の文字コードをメタデータとして生成するメタデータ生成手段と、前記属性データの中の文字属性を有するピクセルに基づいて、文字輪郭を示すベクタデータを生成するベクタデータの生成手段と、前記メタデータ生成手段で生成したメタデータと、前記ベクタデータの生成手段で生成したベクタデータとを含むドキュメントを生成するドキュメント生成手段と、を備えることを特徴とする。
【発明の効果】
【００１１】
本発明によれば、画像出力装置が受信したデータ中に文字コード情報が含まれていない場合でも、ボックス保存データに対して検索用メタデータを付加することが可能となる。
【００１２】
また、本発明によれば、印刷データがホストコンピュータ上でビットマップ展開される場合や外部ＲＩＰ装置によって画像展開される場合でも、受信した文字コード情報を含まない印刷データに対して、検索用メタデータを付加しつつボックス保存できる。
【発明を実施するための最良の形態】
【００１３】
（実施形態１）
以下、本発明を実施するための最良の形態について、図面を参照して説明する。
【００１４】
本発明を実施するに好適な画像処理装置を、図１を参照しながら説明する。図１には、画像処理装置１０００の概要が示されている。
【００１５】
図１において、リーダー装置(リーダー部（スキャナ）)２００は、原稿画像を光学的に読み取り、画像データに変換する。リーダー装置２００は、原稿を読取るための機能を持つスキャナユニット２１０と、原稿用紙を搬送するための機能を持つ原稿給紙ユニット２５０とを有する。
【００１６】
プリンタ装置(プリンタ部)３００は、記録紙を搬送し、その上に画像データを可視画像として印字して装置外に排紙する。
【００１７】
プリンタ装置３００は、給紙ユニット３１０、マーキングユニット３２０、排紙ユニット３３０、及びフィニッシャユニット５００を有する。
【００１８】
ここで、給紙ユニット３１０は、複数種類の記録紙カセットを持つ。また、マーキングユニット３２０は、画像データを記録紙に転写、定着させる機能を持つ。また、排紙ユニット３３０は、印字された記録紙を機外へ出力する機能を持つ。また、フィニッシャユニット５００は、ステイプル処理、ソート処理を行う。
【００１９】
制御装置（コントローラ部）１００は、リーダー装置２００、プリンタ装置３００と電気的に接続され、さらに、ＬＡＮ（ローカルエリアネットワーク）４００を介して、ＰＣ（ホストコンピュータ）４０１、４０２や、インターネット上の各種サーバと接続される。
【００２０】
制御装置１００は、リーダー装置２００を制御して、原稿の画像データを読込み、プリンタ装置３００を制御して画像データを記録用紙に出力してコピー機能を提供する。
【００２１】
また、制御装置１００は、スキャナ機能、プリンタ機能、およびボックス機能も提供する。
【００２２】
ここで、スキャナ機能は、リーダー装置２００から読取った画像データを、コードデータに変換し、ＬＡＮ４００を介してホストコンピュータへ送信する機能である。また、プリンタ機能は、ホストコンピュータからＬＡＮ４００を介して受信したコードデータを画像データに変換し、プリンタ装置３００に出力する機能である。また、ボックス機能、リーダー装置２００から読み取った画像データおよびホストコンピュータから受信したコードデータを変換した画像データを、制御装置１００内の２次記憶装置に保存する機能である。
【００２３】
操作部１５０は、制御装置１００に接続され、液晶タッチパネルを有し、画像入出力システムを操作するためのユーザＩ／Ｆ（インタフェース）を提供する。
【００２４】
図２は、リーダー装置２００及びプリンタ装置３００を含むＭＦＰ（ＭｕｌｔｉｆｕｎｃｔｉｏｎＰｅｒｉｐｈｅｒａｌ（複合機））の断面図である。リーダー部の原稿給紙ユニット２５０は、原稿を先頭順に１枚ずつプラテンガラス２１１上へ給送し、原稿の読み取り動作終了後、プラテンガラス２１１上の原稿を排出トレイ２１９に排出するものである。原稿がプラテンガラス２１１上に搬送されると、ランプ２１２が点灯する。そして、光学ユニット２１３の移動が開始し、原稿が露光走査される。このときの原稿からの反射光は、ミラー２１４、２１５、２１６、及びレンズ２１７によってＣＣＤイメージセンサ(以下ＣＣＤという)２１８へ導かれる。このように、走査された原稿の画像はＣＣＤ２１８によって読み取られる。ＣＣＤ２１８から出力される画像データは、所定の処理が施された後、制御装置１００へ転送される。
【００２５】
プリンタ装置３００のレーザドライバ３２１は、レーザ発光部３２２を駆動するものであり、制御装置１００から出力された画像データに応じたレーザ光をレーザ発光部３２２に発光させる。このレーザ光は感光ドラム３２３に照射され、感光ドラム３２３にはレーザ光に応じた潜像が形成される。この感光ドラム３２３の潜像の部分には現像器３２４によって現像剤が付着される。
【００２６】
そして、レーザ光の照射開始と同期したタイミングで、カセット３１１、カセット３１２、カセット３１３、カセット３１４、手差し給紙段３１５のいずれかから記録紙を給紙する。そして、転写部３２５へ搬送路３３１によって、感光ドラム３２３に付着された現像剤を記録紙に転写する。
【００２７】
現像剤の乗った記録紙は搬送ベルト３２６によって、定着部３２７に搬送され、定着部３２７の熱と圧力により、現像剤は、記像紙に定着される。その後、定着部３２７を通過した記録紙は搬送路３３５、搬送路３３４を通り、排出される。あるいは、印字面を反転して排出する場合には、搬送路３３６、搬送路３３８まで導かれ、そこから記録紙を逆方向に搬送し、搬送路３３７、搬送路３３４を通る。
【００２８】
また、両面記録が設定されている場合は、定着部３２７を通過したあと、搬送路３３６からフラッパ３２９によって、搬送路３３３に記録紙は導かれる。その後、記録紙は、逆方向に搬送され、フラッパ３２９によって、搬送路３３８、再給紙搬送路３３２へ導かれる。再給紙搬送路３３２へ導かれた記録紙は上述したタイミングで搬送路３３１を通り、転写部３２５へ給紙される。
【００２９】
搬送路３３４より排出された記録紙は、フィニッシャユニット５００へ搬送される。
【００３０】
搬送された記録紙はまずバッファユニット５０１へ送られる。ここでは場合に応じて搬送されてきた記録紙をバッファローラに巻きつけてバッファリングする。例えばこの下流で行われるステイプル等処理に時間がかかる場合は、このバッファユニットを利用することによって本体から搬送されてくる記録紙の搬送速度を一定に保つことができ、スループットの向上に役立たせることが可能である。
【００３１】
記録紙は、この後、上流排出ローラ対５０２、下流排出ローラ対５０３でスタックトレイ５０７ａに排出される。
【００３２】
＜コントローラユニット＞
図３は、本実施形態におけるＭＦＰのコントロールユニット（コントローラ部（制御装置））の一例を示すブロック図である。図２において、制御装置１００は、画像入力デバイスであるリーダー装置２００や画像出力デバイスであるプリンタ装置３００と接続し、画像データの読み取りやプリント出力のための制御を行う。また、制御装置１００は、ＬＡＮ４００と接続することで、画像情報やデバイス情報をＬＡＮ４００経由で入出力するための制御を行う。
【００３３】
図３において、ＣＰＵ１０１は、ＭＦＰ全体を制御するための中央処理装置である。ＲＡＭ１０２は、ＣＰＵ１０１が動作するためのシステムワークメモリであり、入力された画像データを一時記憶するための画像メモリでもある。さらに、ＲＯＭ１０３はブートＲＯＭであり、システムのブートプログラムが格納されている。ＨＤＤ１０４は、ハードディスクドライブであり、各種処理のためのシステムソフトウェア及び入力された画像データを等格納する。操作部Ｉ／Ｆ（インタフェース）１０５は、画像データ等を表示可能な表示画面を有する操作部１５０に対するインタフェース部であり、操作部１５０に対して操作画面データを出力する。また、操作部Ｉ／Ｆ（インタフェース）１０５は、操作部１５０から操作者が入力した情報をＣＰＵ１０１に伝える役割をする。ネットワークＩ／Ｆ（インタフェース）１０７は、例えばＬＡＮカード等で実現され、ＬＡＮ４００に接続して外部装置との間で情報の入出力を行う。以上のユニットがシステムバス１０６上に配置されている。
【００３４】
イメージバスＩ／Ｆ（インタフェース）１０９は、システムバス１０６と画像データを高速で転送する画像バス１１０とを接続するためのインタフェースであり、データ構造を変換するバスブリッジである。画像バス１１０には、ＲＩＰ（ラスタイメージプロセッサ）１１１、デバイスＩ／Ｆ（インタフェース）１１２、スキャナ画像処理部１１３、プリンタ画像処理部１１４、画像編集用画像処理部１１５が接続される。また、画像バス１１０には、ＣＭＭ（カラーマネージメントモジュール）１１６も接続される。
【００３５】
ＲＩＰ（ラスタイメージプロセッサ）１１１は、ＰＤＬ（ページ記述言語）コードや後述するベクトルデータをイメージに展開する。デバイスＩ／Ｆ（インタフェース）１１２は、リーダー装置２００やプリンタ装置３００と制御装置１００とを接続し、画像データの同期系／非同期系の変換を行う。
【００３６】
また、スキャナ画像処理部１１３は、リーダー装置２００から入力された画像データに対して、補正、加工、編集等の各種処理を行う。プリンタ画像処理部１１４は、プリント出力する画像データに対して、プリンタエンジンに応じた補正、解像度変換等の処理を行う。画像編集用画像処理部１１５は、画像データの回転や、画像データの圧縮伸長処理等の各種画像処理を行う。ＣＭＭ１１６は、画像データに対して、プロファイルやキャリブレーションデータに基づいた、色変換処理（色空間変換処理ともいう）を施す専用ハードウェアモジュールである。プロファイルとは、機器に依存した色空間で表現したカラー画像データを機器に依存しない色空間（例えばＬａｂなど）に変換するための関数のような情報である。キャリブレーションデータとは、複合機におけるリーダー装置２００やプリンタ装置３００の色再現特性を修正するためのデータである。
【００３７】
＜コントローラソフトウェア＞
図４は、ＭＦＰの動作を制御するコントローラソフトウェアを示すブロック図である。
【００３８】
プリンタＩ／Ｆ（インタフェ−ス）１２００は、外部との入出力のための手段である。プロトコル制御部１１０１は、ネットワークプロトコルを解析および送信することによって外部との通信を行う手段である。
【００３９】
デジタル文字認識部１１０２は、ビットマップイメージからデジタル文字認識（ＯＣＲ）を用いて、認識結果として文字コードを生成する。また、デジタル文字認識の過程で抽出される文字輪郭から、ベクタデータを生成（ベクタライズ）する。
【００４０】
メタデータ生成部１１０３では、デジタル文字認識部１１０２にて、デジタル文字認識の結果として得られる文字コードと、デジタル文字認識の過程で生成されたベクタデータと結びつけて、メタデータが生成される。メタデータとは描画処理には必要のない検索用の付加的なデータである。
【００４１】
ＰＤＬ解析部１１０４は、ＰＤＬデータを解析し、より処理しやすい形式の中間コードであるＤＬ（ＤｉｓｐｌａｙＬｉｓｔ）に変換する手段である。ＰＤＬ解析部１１０４において生成された中間コードはデータ描画部１１０５に渡されて処理される。データ描画部１１０５は上記中間コードをビットマップデータに展開するものであり、展開されたビットマップデータはページメモリ１１０６に逐次描画されて行く。
【００４２】
ページメモリ１１０６はデータ描画部１１０５が展開するビットマップデータを一次的に保持する揮発性のメモリである。
【００４３】
パネル入出力制御部１０２０は、操作部１５０からの入出力を制御するものである。
【００４４】
Ｄｏｃｕｍｅｎｔ（ドキュメント）記憶部１０３０は、入力文書の一塊（ジョブ）単位にベクタデータ、ＤｉｓｐｌａｙＬｉｓｔ（ディスプレイリスト）、メタデータを包含するデータファイルを記憶する手段である。Ｄｏｃｕｍｅｎｔ記憶部１０３０は、ハードディスク等の二次記憶装置によって実現される。なお、このデータファイルを本実施形態では「ドキュメント（またはＤｏｃｕｍｅｎｔ）」と呼ぶ。
【００４５】
スキャン制御部１５００は、リーダー装置２００から入力した画像データに対して、補正、加工、編集などの各種処理を行う。
【００４６】
印刷制御部１３００は、ページメモリ１１０６の内容をビデオ信号に変換処理し、プリンタ装置３００へ画像転送を行なう。プリンタ装置３００は受け取ったビデオ信号を記録紙に可視画像形成するための印刷機構部である。
【００４７】
＜コントローラユニットのデータ処理＞
次に、ドキュメントのベクタデータ、ＤＬ（ＤｉｓｐｌａｙＬｉｓｔ（ディスプレイリスト））、メタデータがどのように生成されるのかを説明する。
【００４８】
図７、図８、図９は、本実施形態におけるコントロールユニットのデータフローの一例を示している。
【００４９】
図７は、ＰＤＬ（ＰａｇｅＤｅｓｃｒｉｐｔｉｏｎＬａｎｇｕａｇｅ（ページ記述言語））プリント時のデータフローの一例を示している。ＰＤＬプリントとはＰＣ（ＰｅｒｓｏｎａｌＣｏｍｐｕｔｅｒ）上のアプリケーションソフトから印刷を指示した場合にＰＣ上のプリンタドライバによって生成されたＰＤＬ（ページ記述言語）を受け取って出力する、プリンタ動作のことである。
【００５０】
まず、ＰＣ４０１では、ワードプロセッサや表計算ソフトやＷｅｂブラウザなどのアプリケーションソフトが動作している。このアプリケーションソフトが扱うデータをアプリケーションデータと呼ぶ。図７に示されているように、ホストＰＣ上で動作するプリンタドライバは、アプリケーションデータをＰＤＬデータに変換する処理ｄ１を行い、ＰＤＬデータを生成する。ここで生成されるＰＤＬデータは、文字コードとフォントデータによって定義される文字オブジェクトデータ、線画や領域の塗りを定義するグラフィクスオブジェクトデータ、ビットマップを有するイメージオブジェクトデータを含む。さらに、ＰＤＬデータは、上記のオブジェクトデータ以外にも、プログラミング言語としての変数や手続き、デジタル複合機の動作を指示する機器制御コマンドを含むこともある。生成されたＰＤＬデータは、ネットワークを通じて制御装置１００に送信される。
【００５１】
図７に示されているように、制御装置１００にて受信されたＰＤＬデータはＰＤＬデータ解析処理ｄ２によって解析され、後述のＤＬ生成に適したベクタデータが生成される。
【００５２】
図７に示されているように、次に、ＤＬ生成処理ｄ３によりベクタデータからＤＬが生成され、生成されたＤＬはドキュメントの中に格納されると共にレンダリング処理ｄ４に送られてビットマップに展開される。そして、展開されたビットマップは印刷処理ｄ５によって紙媒体に記録されて印刷物となる。
【００５３】
この過程で生成されるベクタデータ、ＤＬは、図７に示されているように、ドキュメント生成処理ｄ６によってドキュメントに格納される。このようにして生成されたドキュメントは、ＢＯＸ等の記憶装置に記憶され、再利用（再印刷など）する際に使用される。
【００５４】
また、ＰＤＬにはＬＩＰＳ（ＬＢＰＩｍａｇｅＰｒｏｃｅｓｓｉｎｇＳｙｓｔｅｍ）（登録商標）やＰＳ（ポストスクリプト（登録商標））など様々な種類が存在するが、ＰＤＬによっては文字列情報（文字コード）を持っているものもある。この場合はＰＤＬ解析時に文字列（文字コード）からメタデータ（検索キーワードなど）が生成され、ドキュメントに格納される。
【００５５】
図８は、ＰＤＬプリントにおけるイメージモードの処理形態でのデータフローの一例を示す例である。ここでは、アプリケーションデータからビットマップイメージ（ビットマップ画像）に変換され、そのイメージデータから作成されたＰＤＬを処理対象にする場合について説明する。
【００５６】
まず、図８に示されているように、ＰＣ４０１上で動作するプリンタドライバは、アプリケーションデータをＰＤＬデータに変換する処理ｄ１を行う。このとき、ＰＤＬデータは、出力されるページ全面のビットマップイメージデータを含む。このＰＤＬは詳細には、ＲＧＢやＣＭＹＫなど人間が視覚的に認知可能な表色系で表現される色値を持つ画素（ピクセル）を有する画像プレーンと、テキスト、グラフィクス、イメージのいずれかの属性をもつ画素を有する像域属性プレーンを含む。すなわち、ビットマップ化されたイメージデータと、そのイメージの各画素の属性（テキスト・グラフィクス・イメージ）を示すビットマップ状の属性データとを含むＰＤＬが生成される。なお、各画素の属性は、アプリケーションデータからビットマップイメージを作成する際に決定することができる。例えば、アプリケーションデータ中の文字描画命令によって生成された画素値が描画された領域か、アプリケーションデータ中のイメージデータ描画命令によって生成された画素が描画された領域か、などに基づいて決定することが可能である。
【００５７】
上記の画像プレーンは、１ページ分もしくは複数ページ分のビットマップ化された画像を含んでいても良い。
【００５８】
また、本発明において、プレーンは複数ある場合がある。プレーンが複数ある場合には、複数のプレーンを第１のプレーン、第２のプレーンと呼んでも良い。
【００５９】
さらに、ＰＤＬデータは上記のオブジェクトデータ以外にも、プログラミング言語としての変数や手続き、デジタル複合機の動作を指示する機器制御コマンドを含むこともある。生成されたＰＤＬデータはネットワークを通じて制御装置１００に送信される。
【００６０】
図８に示されているように、制御装置１００にて受信されたＰＤＬデータは、ＰＤＬデータ解析処理ｄ２によって解析され、ベクタデータが生成されると同時に、像域属性プレーンデータのコピーが生成される。ただし、本例で生成されるベクタデータとは、全面イメージを描画するために必要なビットマップデータと座標変換情報を有する。
【００６１】
次に、図８に示されているように、ＤＬ生成処理ｄ３によりベクタデータからＤＬが生成される。生成されたＤＬは、ドキュメントの中に格納されると共にレンダリング処理ｄ４に送られてビットマップに展開される。展開されたビットマップは、印刷処理ｄ５によって紙媒体に記録されて印刷物となる。
【００６２】
この過程で生成されるベクタデータ、ＤＬは、図８に示されているように、ドキュメント生成処理ｄ７によってドキュメントに格納される。
【００６３】
また、図８の処理ｄ２で生成された像域属性プレーンデータのコピーからは、メタデータ生成処理ｄ６によってメタデータと文字輪郭ベクタデータが生成され、これもドキュメント生成処理ｄ７によってドキュメントに格納される。処理ｄ６については、図９を用いて後述する。
【００６４】
図９は、図８で示したメタデータ生成処理ｄ６の具体的なデータフローの一例を示している。
【００６５】
まず、図９に示されているように、像域属性分離処理ｄ１にて、文字属性領域が分離される。すなわち、像域属性プレーン（属性を示すビットマップ）からテキスト属性を有する画素で構成される文字属性領域が抽出される。そして、図９に示されているように、抽出されたテキスト画素を有する文字属性領域の画像は、文字認識(ＯＣＲ)処理ｄ２により文字認識処理とベクトル化処理とが実行され、文字輪郭ベクタデータと文字コードデータに変換される。
【００６６】
また、図９に示されているように、文字認識処理により生成された文字コードデータを有する文字列は、フォーマット変換処理ｄ４によって後述するデータフォーマットに整えられてメタデータが生成される。
【００６７】
また、処理ｄ１では、文字属性以外の属性の領域とＰＤＬに含まれているビットマップイメージに基づいて、イメージ領域などのビットマップが得られる。この得られたビットマップと、前述したベクトル化処理により生成された文字輪郭ベクタデータとを、処理ｄ３において、Ｄｏｃｕｍｅｎｔに格納すべきベクタデータとして生成する。
【００６８】
図１５は、ＰＤＬからのＤｏｃｕｍｅｎｔ（ドキュメント）の生成および印刷の処理の一例を示している。この処理はイメージモードではない通常のＰＤＬデータを受けてドキュメントを生成、印刷出力する処理である。すなわち、イメージモードのＰＤＬを扱わない画像処理装置においては図１５のような処理を行えばよい。イメージモードのＰＤＬを扱う画像処理装置については図１６を用いて後述する。図１５に示されているフローチャートの処理は、ＣＰＵ１０１により実行される。
【００６９】
まず、ステップＳ１５０１で、ＰＤＬデータが解析される。次に、ステップＳ１５０２で、ＰＤＬデータ中に文字オブジェクトが含まれているか否かが判断される。ステップＳ１５０２で、ＰＤＬデータ中に文字オブジェクトが含まれていると判断された場合は、ステップＳ１５０９に進んで文字オブジェクト中の文字コードをもとに、メタデータ生成が行われる。その後、ステップＳ１５０３に処理が進む。
【００７０】
ステップＳ１５０２で、ＰＤＬデータ中に文字オブジェクトが含まれていないと判断された場合には、ステップＳ１５０３に進む。ステップＳ１５０３では、ＰＤＬデータのオブジェクト（文字オブジェクトや線画などの図形オブジェクト等）が、ベクタデータに変換された後、ステップＳ１５０４に進んでドキュメントが生成される。ステップＳ１５０４で生成されるドキュメントには、ステップＳ１５０３で生成されたベクタデータと、ステップＳ１５０９にて生成されたメタデータとが格納され、そのドキュメントはＢＯＸ等の記憶媒体に記憶される。
【００７１】
次に、ステップＳ１５０５においてＤＬ（ＤｉｓｐｌａｙＬｉｓｔ（ディスプレイリスト））が生成される。ここで生成されるＤＬは、この画像処理装置の機種でレンダリング処理するのに適した中間コードである。ステップＳ１５０６では、当該生成されたＤＬがＤｏｃｕｍｅｎｔ（ドキュメント）に追加される。
【００７２】
ここまでのフローでドキュメントが生成される。さらに、ステップＳ１５０５で生成されたＤＬは、ステップＳ１５０７のレンダリング処理でレンダリングされ、ステップＳ１５０８の紙媒体への印刷処理で印刷が実行される。
【００７３】
図１６は、イメージモードで生成されたＰＤＬデータを処理可能な画像処理装置において実行される、ドキュメントの生成および印刷の処理の一例を示している。この処理は通常のＰＤＬデータおよびイメージモードのＰＤＬデータのいずれかを受けてドキュメントを生成、印刷出力する処理である。図１６に示されているフローチャートの処理は、ＣＰＵ１０１により実行される。
【００７４】
まず、ステップＳ１６０１で、ＰＤＬデータの解析が行われ、ＰＤＬデータに含まれるデータの種類が判別される。次に、ステップＳ１６０２において、ＰＤＬデータがイメージモードであるか否かが判断される。
【００７５】
ステップＳ１６０２において、ＰＤＬデータがイメージモードであると判断された場合には、ステップＳ１６１１に進む。ステップＳ１６１１では、ＰＤＬデータに含まれている像域属性データ（各画素の属性（文字属性領域など）を示すビットマップデータ）のコピーが生成される。更に、このビットマップの像域属性データから、文字像域属性画像（文字属性を有する領域のデータ）を抽出する。ステップＳ１６１１で生成された文字像域属性画像は、ステップＳ１６１２にてデジタル的に文字認識処理とベクトル化処理がなされ、文字コード情報を含むメタデータと文字輪郭ベクタデータが生成される。なお、ステップＳ１６１２で、ＰＤＬ内のイメージから線画などの図形領域を検出できた場合、当該線画部分についてもベクタデータを生成するようにしてもよい。
【００７６】
ステップＳ１６１２で生成された文字輪郭ベクタデータは、その総数がステップＳ１６１３にてチェックされる。描画される文字が複雑な漢字であったり文字数が多かったりする場合には、後述するドキュメントのデータサイズが膨大になってしまうことが懸念される。そこで、ステップＳ１６１３で、文字輪郭ベクタデータの要素数が所定の数より多いと判断された場合には、ステップＳ１６１４にて、文字輪郭ベクタデータが単純な矩形ベクタデータに変換される。ステップＳ１６１４で変換された矩形ベクタデータは、変換される前の１文字分の文字輪郭ベクタデータから、描画位置座標と、文字の大きさに対応する描画範囲の幅と高さの情報を引き継ぐ。これは、ＢＯＸに格納されたＤｏｃｕｍｅｎｔをメタデータに格納されている文字列を用いて検索する際に、検索結果に該当する文字画像の部分を識別するためには、矩形ベクタでも可能であるからである。なお、デバイスなどに予め格納されている外部フォントを参照し、前記文字認識結果の文字コードを用いて、該矩形ベクタのサイズに合うように文字を描画する命令（ベクタデータ記述）にしておいてもよい。
【００７７】
また、このように構成する理由としては、元のイメージの画質や文字の複雑さ、文字数の多さなどに応じて、文字輪郭を構成するベクタの総数が増加しすぎてしまうことがあるからである。したがってデータ量が多くなりすぎる場合、元画像の文字の輪郭を正確にトレースする文字ベクタデータを記録するのではなく、文字を含む領域に該当する矩形ベクタを替わりに用いることで、大幅にベクタデータ量を削減できるようになる。ステップＳ１６１４の処理が終わった後、もしくはステップＳ１６１３でＮｏの場合、ステップＳ１６０６へ進む。
【００７８】
一方、ステップＳ１６０２で、イメージモードでない通常のＰＤＬデータであると判断された場合、ステップＳ１６０３へ進む。ステップＳ１６０３〜１６０５では、図１５のＳ１５０２、Ｓ１５０３、Ｓ１５０９で説明した処理と同様の処理が実行され、ベクタデータが生成される。
【００７９】
ステップＳ１６０６では、ベクタデータを含むＤｏｃｕｍｅｎｔ（ドキュメント）フォーマットに変換されて、ＤｏｃｕｍｅｎｔがＢＯＸ等の記憶媒体に保管される。このとき、ステップＳ１６１２にて生成されたメタデータと文字輪郭ベクタデータおよびステップＳ１６１４にて生成された矩形ベクタデータや、ステップＳ１６０５で生成されたベクタデータが、ドキュメントに追加される。
【００８０】
次に、ステップＳ１６０７においてＤＬ（ＤｉｓｐｌａｙＬｉｓｔ（ディスプレイリスト））が生成される。そして、ステップＳ１６０８に進んで生成したＤＬがＤｏｃｕｍｅｎｔ（ドキュメント）に追加される。
【００８１】
ここまでのフローでドキュメントが生成される。さらに、ステップＳ１６０７で生成されたＤＬは、ステップＳ１６０９のレンダリング処理でレンダリングされ、ステップＳ１６１０の印刷処理で記録媒体への印刷が実行される。
【００８２】
図１４は、ＢＯＸ等に保存されているＤｏｃｕｍｅｎｔ（ドキュメント）を再印刷する場合の処理の一例を示している。この処理は生成・保存されたドキュメントを再印刷出力する処理である。図１４に示されているフローチャートの処理は、ＣＰＵ１０１により実行される。
【００８３】
まず、ステップＳ１４０１で、印刷対象のＤｏｃｕｍｅｎｔ（ドキュメント）データを取得する。ステップＳ１４０２において、ドキュメント中に含まれているＤＬ（ＤｉｓｐｌａｙＬｉｓｔ（ディスプレイリスト））を抽出する。ステップＳ１４０３では、ステップＳ１４０２で抽出したＤＬをビットマップにレンダリングする。最後に、ステップＳ１４０４において、紙媒体への印刷処理を実行する。
【００８４】
このように、同じデバイスにおいて、再度印刷を行う際は、ドキュメントに格納されているＤＬデータを用いて印刷処理を実行するので、高速に印刷することができる。
【００８５】
なお、Ｄｏｃｕｍｅｎｔに含まれているＤＬデータは、そのＤｏｃｕｍｅｎｔを生成したデバイスの種類に適したデータである。したがって、Ｄｏｃｕｍｅｎｔを他のデバイスで印刷する場合は、その他のデバイスに適したＤＬデータを作り直す方がよい。すなわち、Ｄｏｃｕｍｅｎｔに含まれているベクタデータを用いて、他のデバイスに適したＤＬデータを生成しなおして、レンダリング・印刷処理を行うものとする。
【００８６】
＜ドキュメントデータ構造＞
次に、ドキュメントの構造を説明する。
【００８７】
図１１、図１２、図１３は、ドキュメントの構造の一例を示している。
【００８８】
図１１は、ドキュメントのデータ構造の一例を示している。
【００８９】
ドキュメントは、複数ページを有するデータであり、大きく分けるとベクタデータ（ａ）、メタデータ（ｂ）、ＤＬ（ｃ）、を含み、ドキュメントヘッダ（ｘ１）を先頭とする階層構造である。ベクタデータ（ａ）は、さらに、ページヘッダ（ｘ２）、サマリ情報（ｘ３）、オブジェクト（ｘ４）を含み、メタデータ（ｂ）は、さらに、ページ情報（ｘ５）と詳細情報（ｘ６）を含む。ＤＬ（ｃ）は、さらに、ページヘッダ（ｘ７）と描画展開用のインストラクション（ｘ８）を含む。
【００９０】
ドキュメントヘッダ（ｘ１）にはベクタデータの格納場所とＤＬの格納場所が記述されているためベクタデータとＤＬはドキュメントヘッダ（ｘ１）によって関連付けられている。
【００９１】
ページヘッダ（ｘ２）はページの大きさや向きなどのレイアウト情報が記述される。オブジェクト（ｘ４）にはライン、多角形、ベジェ曲線、などの描画データが一つずつリンクされており、関連する複数のオブジェクトのグループ単位でサマリ情報（ｘ３）に関連付けられている。また、描画オブジェクト（ｘ４）としてイメージオブジェクトがリンクされる場合もある。サマリ情報（ｘ３）は複数のオブジェクトの特徴をまとめて表現するものであり、像域属性に関連する情報などが記述される。
【００９２】
メタデータ（ｂ）は描画処理には関係しない検索用の付加情報である。
【００９３】
ページ情報（ｘ５）領域には、例えばメタデータがイメージモードデータから生成されたものなのか、文字オブジェクトを含むＰＤＬデータから生成されたものなのか、などのページ情報が記述される。詳細情報（ｘ６）にはＯＣＲ情報や画像情報として生成された文字列（文字コード列）が記述される。
【００９４】
また、ベクタデータ（ａ）の各サマリ情報（ｘ３）からはメタデータが参照されており、サマリ情報（ｘ３）から、メタデータの各サマリに関する詳細情報（ｘ６）を見つけることができる。
【００９５】
ＤＬ（ｃ）はレンダラがビットマップ展開するための中間コードである。ページヘッダ（ｘ７）にはページ内の描画情報（インストラクション）の管理テーブルなどが記述され、インストラクション（ｘ８）は、解像度依存な描画情報を含む。
【００９６】
図１７は、イメージモードで生成されたＰＤＬデータを処理する場合のドキュメント構造の一例を示している。
【００９７】
ホストコンピュータのイメージモードで生成されたＰＤＬデータを処理すると、まず、１ページ中にひとつのサマリ情報（ｙ３）に関連付けられたひとつのイメージオブジェクト（ｙ４）を含むドキュメントが生成される。このイメージオブジェクト（ｙ４）は、色値を持つ画像プレーンと像域属性値をもつ像域属性プレーンを含むことがサマリ情報（ｙ３）に記載される。その後、文字認識処理およびベクトル化処理で生成された文字輪郭ベクタデータのサマリ情報（ｙ５）が新たに追加され、それに関連付けられて複数の文字輪郭ベクタデータが、色値をもたない描画オブジェクト（ｙ６、ｙ７）として追加される。さらに、文字輪郭ベクタデータのサマリ情報（ｙ５）から参照可能なように、メタデータの詳細情報（ｙ９）として文字認識結果の文字列が記載される。
【００９８】
図１３は、ドキュメントデータの一例を示している。
【００９９】
１ページ目のサマリ情報に「ＴＥＸＴ」と「ＩＭＡＧＥ」を持っている。「ＴＥＸＴ」のサマリ情報にはＨ，ｅ，ｌ，ｌ，ｏ（オブジェクトｔ１）とＷ，ｏ，ｒ，ｌ，ｄ（オブジェクトｔ２）の文字輪郭がベクタデータとしてリンクされている。
【０１００】
さらに、サマリ情報からは「Ｈｅｌｌｏ」「Ｗｏｒｌｄ」という文字コード列（メタデータｍｔ）が参照されている。
【０１０１】
また、「ＩＭＡＧＥ」のサマリ情報には蝶の写真画像（ＪＰＥＧ）がリンクされている。
【０１０２】
さらに、サマリ情報からは「ｂｕｔｔｅｒｆｌｙ」という画像情報（メタデータｍｉ）が参照されている。
【０１０３】
したがって、例えば「Ｗｏｒｌｄ」というキーワードでページ中のテキストを検索する場合は以下の手順で検出すればよい。まずドキュメントヘッダからベクタページデータを順次取得し、ページヘッダにリンクされているサマリ情報から「ＴＥＸＴ」にリンクされているメタデータを検索する。
【０１０４】
イメージモードで生成されたＰＤＬデータでは、ドキュメントとして最初に記述されるのは「ＩＭＡＧＥ」のサマリである。このＩＭＡＧＥは、ページ全面のビットマップがリンクされている。Ｓ１６１１の処理において文字像域属性画像からデジタル文字認識を経て生成されるメタデータは、「ＴＥＸＴ」サマリ情報として付加される。このサマリ情報からは、デジタル文字認識で生成された文字コード列が参照される。
【０１０５】
図１２は，図１１で説明したデータ構造がメモリ上、ファイル上にどう配置されるのかを示している。
【０１０６】
図１２の１２−１で示されているように、本実施形態において、ドキュメントは、ベクタデータ領域、メタデータ領域、ＤＬ領域がメモリ上の任意のアドレスに配置されている。
【０１０７】
図１２の１２−２で示されているように、本実施形態において、ドキュメントは、ベクタデータ領域、メタデータ領域、ＤＬ領域が、一つのファイルにシリアライズされている。
【０１０８】
（実施形態２）
実施形態１では、ホストコンピュータでイメージモードのＰＤＬデータが生成される場合について説明したが、実施形態２では、画像出力機器とは別の画像展開装置からイメージデータを受信する場合について説明する。
【０１０９】
図５は、実施形態２の全体概要を示している。画像展開を行う装置として、外部ＲＩＰ６００が追加されている点が実施形態１と異なる。
【０１１０】
外部ＲＩＰ６００は、ＬＡＮ４００に対してネットワークデータの送受信を行い、制御装置１００に対してネットワークデータの送受信、および画像データの送信を行う。
【０１１１】
図６は、実施形態２のブロック図を示している。外部ＲＩＰ６００は、制御装置内のネットワークＩ／Ｆ（インタフェース）１０７およびビデオＩ／Ｆ（インタフェース）１１７と接続される。ビデオＩ／Ｆ（インタフェース）１１７は、画像バス１１０に接続されており、画像データを画像処理部やデバイスＩ／Ｆ（インタフェース）に送信する。
【０１１２】
図１０は、実施形態２における外部ＲＩＰ接続の処理形態でのデータフローの例を示している。
【０１１３】
図１０に示されているように、まず、ＰＣ４０１上で動作するプリンタドライバは、アプリケーションデータをＰＤＬデータに変換する処理ｄ１を行う。ＰＤＬデータの内部データ形式は、外部ＲＩＰ６００にて画像展開処理可能な形式であればよく、ここでは規定はしない。さらに、ＰＤＬデータは上記のオブジェクトデータ以外にも、プログラミング言語としての変数や手続き、デジタル複合機の動作を指示する機器制御コマンドを含むこともある。生成されたＰＤＬデータはネットワークを通じて外部ＲＩＰ６００に送信される。
【０１１４】
外部ＲＩＰ６００にて受信されたＰＤＬデータはＰＤＬデータ解析処理およびレンダリング処理ｄ２によってビットマップに展開され制御装置１００に送信される。このビットマップは、画像プレーンデータと像域属性プレーンデータを含む。
【０１１５】
図１０に示されている処理ｄ３では、外部ＲＩＰ６００から受信したビットマップデータをもとに、像域属性プレーンデータのテキスト属性部のコピーが生成される。その後、ビットマップは印刷処理ｄ４によって紙媒体に記録されて印刷物となる。
【０１１６】
また、図１０に示されている処理ｄ３で生成された像域属性プレーンデータのコピーからは、メタデータ生成処理ｄ５によってデジタル的に文字認識され、メタデータと文字輪郭ベクタデータが生成される。これも、図１０に示されているＤｏｃｕｍｅｎｔ生成処理ｄ６によってドキュメントに格納される。図１０に示されている処理ｄ５は、前述の実施形態１における図８に示されている処理ｄ６と同様の処理である。
【０１１７】
また、図１０に示されている処理で用いられているドキュメントの構造は、前述の実施形態１の説明で用いた図１７に示されているドキュメントの構造と同様である。
【０１１８】
（他の実施形態）
以上、様々な実施形態を詳述したが、本発明は、複数の機器を含むシステムに適用してもよいし、また、１つの機器を有する装置に適用してもよい。例えば、スキャナ、プリンタ、ＰＣ、複写機、複合機及びファクシミリ装置の如くである。
【０１１９】
本発明は、前述した実施形態の各機能を実現するソフトウェアプログラムを、システム若しくは装置に対して直接または遠隔から供給し、そのシステム等に含まれるコンピュータが該供給されたプログラムコードを読み出して実行することによっても達成される。
【０１２０】
従って、本発明の機能および処理をコンピュータで実現するために、該コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、上記機能および処理を実現するためのコンピュータプログラム自体も本発明の一つである。
【０１２１】
その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、ＯＳに供給するスクリプトデータ等、プログラムの形態を問わない。
【０１２２】
プログラムを供給するためのコンピュータ読み取り可能な記憶媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、ＭＯ、ＣＤ−ＲＯＭ、ＣＤ−Ｒ、ＣＤ−ＲＷなどがある。また、記憶媒体としては、磁気テープ、不揮発性のメモリカード、ＲＯＭ、ＤＶＤ（ＤＶＤ−ＲＯＭ、ＤＶＤ−Ｒ）などもある。
【０１２３】
また、プログラムは、クライアントコンピュータのブラウザを用いてインターネット／イントラネットのウェブサイトからダウンロードしてもよい。すなわち、該ウェブサイトから本発明のコンピュータプログラムそのもの、もしくは圧縮され自動インストール機能を含むファイルをハードディスク等の記憶媒体にダウンロードしてもよいのである。また、本発明のプログラムを含むプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるウェブサイトからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるＷＷＷサーバも、本発明に含まれる場合がある。
【０１２４】
また、本発明のプログラムを暗号化してＣＤ−ＲＯＭ等の記憶媒体に格納してユーザに配布してもよい。この場合、所定条件をクリアしたユーザにのみ、インターネット／イントラネットを介してウェブサイトから暗号化を解く鍵情報をダウンロードさせ、その鍵情報で暗号化されたプログラムを復号して実行し、プログラムをコンピュータにインストールしてもよい。
【０１２５】
また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現されてもよい。なお、そのプログラムの指示に基づき、コンピュータ上で稼動しているＯＳなどが、実際の処理の一部または全部を行ってもよい。もちろん、この場合も、前述した実施形態の機能が実現され得る。
【０１２６】
さらに、記憶媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれてもよい。そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるＣＰＵなどが実際の処理の一部または全部を行ってもよい。このようにして、前述した実施形態の機能が実現されることもある。
【図面の簡単な説明】
【０１２７】
【図１】実施形態におけるシステムの一例を示す図である。
【図２】本発明の一実施形態のＭＦＰの構造の一例を示す側断面図である。
【図３】実施形態における各機器のコントロールユニットの一例を示すブロック図である。
【図４】実施形態におけるコントローラソフトウェアの一例を示すブロック図である。
【図５】実施形態に係るシステムの一例を示す図である。
【図６】実施形態における、各機器のコントロールユニットの一例を示すブロック図である。
【図７】一般的なＰＤＬプリントにおけるデータフローの一例を示す図である。
【図８】実施形１におけるデータフローの一例を示す図である。
【図９】実施形態におけるメタデータ生成のデータフローの一例を示す図である。
【図１０】実施形２におけるデータフローの一例を示す図である。
【図１１】実施形態におけるドキュメントのデータ構造の一例を示す図である。
【図１２】実施形態におけるドキュメントの格納構造の一例を示す図である。
【図１３】実施形態におけるドキュメントデータの一例を示す図である。
【図１４】実施形態におけるドキュメント印刷のデータフローの一例を示す図である。
【図１５】実施形態におけるＰＤＬからのドキュメントの生成および印刷のデータフローの一例を示す図である。
【図１６】実施形態におけるＰＤＬイメージモードからのドキュメントの生成および印刷のデータフローの一例を示す図である。
【図１７】実施形態におけるＰＤＬイメージモード処理時のドキュメントのデータ構造の一例を示す図である。
【符号の説明】
【０１２８】
１００制御装置
１５０操作部
２００リーダー装置
３００プリンタ装置
５００フィニッシャユニット
６００外部ＲＩＰ
１０００画像処理装置
１１０１プロトコル制御部
１１０２デジタル文字認識部
１１０３メタデータ生成部
１１０４ＰＤＬ解析部
１１０５データ描画部
１１０６ページメモリ
１０２０パネル入出力制御部
１０３０Ｄｏｃｕｍｅｎｔ記憶部
１３００印刷制御部
１５００スキャン制御部

【特許請求の範囲】
【請求項１】
ビットマップ画像と前記ビットマップ画像の各ピクセルの属性データとを含む印刷データを受信する受信手段と、
前記属性データの中の文字属性を有するピクセルに基づいて文字認識処理を実行し、当該文字認識処理の結果の文字コードをメタデータとして生成するメタデータ生成手段と、
前記属性データの中の文字属性を有するピクセルに基づいて、文字輪郭を示すベクタデータを生成するベクタデータの生成手段と、
前記メタデータ生成手段で生成したメタデータと、前記ベクタデータの生成手段で生成したベクタデータとを含むドキュメントを生成するドキュメント生成手段と、
を備えることを特徴とする画像処理装置。
【請求項２】
前記印刷データが、前記ビットマップ画像と前記ビットマップ画像の各ピクセルの属性データとを含む印刷データであるか、オブジェクトで記述されている印刷データであるかを判別する判別手段を、更に備え、
前記判別手段で前記オブジェクトで記述されている印刷データであると判別した場合、前記メタデータ生成手段は、当該印刷データに含まれている文字オブジェクトから文字コードを抽出して、当該抽出した文字コードを前記メタデータとして生成し、一方、前記ベクタデータの生成手段は、当該印刷データを解析してベクタデータを生成することを特徴とする請求項１に記載の画像処理装置。
【請求項３】
前記ビットマップ画像の各ピクセルの属性データは、ビットマップ状の属性データであることを特徴とする請求項１に記載の画像処理装置。
【請求項４】
前記画像処理装置で印刷処理するのに適したディスプレイリストを生成するディスプレイリストの生成手段を、更に備え、
前記ドキュメント生成手段は、前記メタデータ生成手段で生成したメタデータと、前記ベクタデータの生成手段で生成したベクタデータと、前記ディスプレイリストの生成手段で生成したディスプレイリストとを含むドキュメントを生成することを特徴とする請求項１に記載の画像処理装置。
【請求項５】
前記画像処理装置において再印刷を行う場合、前記ドキュメントに含まれるディスプレイリストを用いて再印刷を行うことを特徴とする請求項４に記載の画像処理装置。
【請求項６】
他の画像処理装置において再印刷を行う場合、前記ドキュメントに含まれるベクタデータを用いて再印刷を行うことを特徴とする請求項４に記載の画像処理装置。
【請求項７】
前記メタデータを用いて、前記ドキュメントの検索を行う検索手段を、更に備えることを特徴とする請求項１に記載の画像処理装置。
【請求項８】
受信手段が、ビットマップ画像と前記ビットマップ画像の各ピクセルの属性データとを含む印刷データを受信する受信ステップと、
メタデータ生成手段が、前記属性データの中の文字属性を有するピクセルに基づいて文字認識処理を実行し、当該文字認識処理の結果の文字コードをメタデータとして生成するメタデータ生成ステップと、
ベクタデータの生成手段が、前記属性データの中の文字属性を有するピクセルに基づいて、文字輪郭を示すベクタデータを生成するベクタデータの生成ステップと、
ドキュメント生成手段が、前記メタデータ生成ステップで生成したメタデータと、前記ベクタデータの生成ステップで生成したベクタデータとを含むドキュメントを生成するドキュメント生成ステップと、
を備えることを特徴とする画像処理方法。
【請求項９】
コンピュータを、
ビットマップ画像と前記ビットマップ画像の各ピクセルの属性データとを含む印刷データに対して、前記属性データの中の文字属性を有するピクセルに基づいて文字認識処理を実行し、当該文字認識処理の結果の文字コードをメタデータとして生成するメタデータ生成手段、
前記属性データの中の文字属性を有するピクセルに基づいて、文字輪郭を示すベクタデータを生成するベクタデータの生成手段、
前記メタデータ生成手段で生成したメタデータと、前記ベクタデータの生成手段で生成したベクタデータとを含むドキュメントを生成するドキュメント生成手段、
として機能させるためのプログラム。
【請求項１０】
請求項９に記載のプログラムを記憶した、コンピュータ読み取り可能な記憶媒体。

【図１】