画像処理装置、画像処理方法、及びプログラム
【課題】本発明によれば、電子文書データ内のオブジェクトが有する形状やデータ状態を維持しつつ、検索により検出されたオブジェクトをユーザが認識しやすいように強調表示可能な電子文書データを生成すること。
【解決手段】画像処理装置は、入力された画像からオブジェクトを抽出し、当該オブジェクトに関するメタデータを抽出する。そして、枠のベクトルパス記述をオブジェクトの形状に応じた形状で記述するか、既定形状に応じた形状で枠のベクトルパス記述を記述するかを判定する。オブジェクトの形状に応じた形状で記述すると判定した場合は、オブジェクトの形状に応じた形状で記述された枠のベクトルパス記述を生成する。そして、前記入力された画像のデータと、前記メタデータが関連付けられた前記枠のベクトルパス記述とを含む電子文書を生成する。生成された電子文書のキーワード検索が行われた場合、当該キーワードに一致するメタデータが関連付けられている前記枠のベクトルパス記述にしたがって強調表示される。
【解決手段】画像処理装置は、入力された画像からオブジェクトを抽出し、当該オブジェクトに関するメタデータを抽出する。そして、枠のベクトルパス記述をオブジェクトの形状に応じた形状で記述するか、既定形状に応じた形状で枠のベクトルパス記述を記述するかを判定する。オブジェクトの形状に応じた形状で記述すると判定した場合は、オブジェクトの形状に応じた形状で記述された枠のベクトルパス記述を生成する。そして、前記入力された画像のデータと、前記メタデータが関連付けられた前記枠のベクトルパス記述とを含む電子文書を生成する。生成された電子文書のキーワード検索が行われた場合、当該キーワードに一致するメタデータが関連付けられている前記枠のベクトルパス記述にしたがって強調表示される。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、文書画像からオブジェクト検索可能な電子文書データを生成するための画像処理装置、画像処理方法、及びプログラムに関する。
【背景技術】
【0002】
従来、文書画像中の文字以外のオブジェクト(例えば、写真、図面、線画、表等)を利用しやすくするために、当該オブジェクトを検索できるようにする技術が知られている。以下の説明において、特に記載がない限り、オブジェクトは、文字を除くオブジェクトのことを示すものとする。
【0003】
特許文献1では、文書画像から図やグラフなどのオブジェクトを抽出し、当該オブジェクトの近傍にキャプション文字列(オブジェクトを説明する文字列)があるかどうか判断する。キャプション文字列がある場合、該オブジェクトに当該キャプション文字列を関連付けて、オブジェクトを検索できるようにしている。
【0004】
また、オブジェクトに隣接するキャプションが図番(例えば、「図1」や「第1図」等)である場合、一般的な文書画像では、オブジェクトの説明のために同じ図番の文字列が本文にも記載されている。すなわち、キャプションに記載されている図番と同一表現が本文内にも記述されている。特許文献2には、キャプション中の図番と本文中の図番との間にリンクを自動的に生成し、ハイパーテキスト化する技術が開示されている。この技術において、例えば、オブジェクトに隣接するキャプションに図番「図1」が含まれ、本文中に「図1は、AAAである」という記載がある場合、キャプション「図1」と本文中の「図1」との間に、ハイパーリンクが生成される。また、特許文献2には、オブジェクトとそれに関連する本文との間にリンクを自動的に生成し、ハイパーテキスト化された文書を生成することも記載されている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開平11−306197号公報
【特許文献2】特開平10−228473号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
なお、メタデータが関連付けられた各オブジェクトをJPEG圧縮等して、1つの電子文書に格納しておけば、データ量の少ない1つの電子文書として生成できる。このような電子文書をアプリケーション側で利用する場合、キャプション文字列を検索キーワードとして、該メタデータからオブジェクトを検索することが可能となる。
【0007】
一方、キャプション文字列をメタデータとしてオブジェクトに付与し、文字以外のオブジェクトを検索できるようにした電子文書において、キーワード検索をおこなった際に、検索結果のオブジェクトが強調表示されるようにすることが望まれている。
【0008】
しかしながら、検索対象となるオブジェクトは写真、図、表等であり、色・形状ともに多種多様である。従って、オブジェクトが元々有する色・形状のために、強調表示が目立たず、ユーザが検索でヒットしたオブジェクトを特定するのが困難な場合がある。例えば、検索されたオブジェクトの輪郭を赤色の外接矩形で着色するような強調方式であるときに、赤色を多く含む矩形の写真のオブジェクトが検索されると、検索結果の強調表示が写真と同様の色で写真領域に接触しているので目立たなくなってしまう。すなわち、ユーザにとっては、検索でヒットしたオブジェクトを特定することが非常に困難になってしまう。また、オブジェクトのサイズが小さかったり、複数のオブジェクトが隣接して存在したりしている場合等には、検索でヒットしたオブジェクトの識別が直観的にできなくなってしまうため、検索効率の向上が見込めないという課題もある(図17(a)、(c)参照)。
【0009】
そこで、文字以外のオブジェクトをキーワード検索可能な電子文書データの作成処理において、検索時に検索対象オブジェクトが有する形状やデータ状態を維持しつつ、ユーザが認識しやすい強調表示を行う電子文書データ作成方法が必要となっていた。
【課題を解決するための手段】
【0010】
本発明に係る画像処理装置は、入力された画像からオブジェクトを抽出するオブジェクト抽出手段と、前記オブジェクトに関するメタデータを抽出するメタデータ抽出手段と、前記オブジェクトの形状に応じた形状で枠のベクトルパス記述を記述するか、既定形状に応じた形状で枠のベクトルパス記述を記述するかを判定する判定手段と、前記判定手段で前記オブジェクトの形状に応じた形状で記述すると判定した場合は、前記オブジェクトの形状に応じた形状で記述された枠のベクトルパス記述を生成し、前記判定手段で前記既定形状に応じた形状で記述すると判定した場合は、前記既定形状に応じた形状で記述された枠のベクトルパス記述を生成する枠生成手段と、前記入力された画像のデータと、前記メタデータが関連付けられた前記枠のベクトルパス記述とを含む電子文書を生成する文書生成手段と、を備え、前記電子文書のキーワード検索が行われた場合、当該キーワードに一致するメタデータが関連付けられている前記枠のベクトルパス記述にしたがって強調表示されることを特徴とする。
【0011】
本発明に係る画像処理装置は、入力された画像からオブジェクトを抽出するオブジェクト抽出手段と、前記オブジェクトに関するメタデータを抽出するメタデータ抽出手段と、前記オブジェクトの形状の外輪郭に相似する形状で記述された枠のベクトルパス記述を生成する枠生成手段と、前記入力された画像のデータと、前記メタデータが関連付けられた前記枠のベクトルパス記述とを含む電子文書を生成する文書生成手段と、を備え、前記電子文書のキーワード検索が行われた場合、当該キーワードに一致するメタデータが関連付けられている前記枠のベクトルパス記述にしたがって強調表示されることを特徴とする。
【0012】
本発明に係る画像処理装置は、入力された画像からオブジェクトを抽出し、当該オブジェクトについての情報である領域情報を取得する手段と、前記抽出されたオブジェクトを前記取得された領域情報に応じた形状で囲む透明枠のベクトルパス記述を生成する手段と、前記入力された画像から、前記生成された透明枠のベクトルパス記述を含む電子文書データを生成する手段とを備え、前記生成された透明枠のベクトルパス記述は、前記生成された電子文書データからオブジェクトが検索され検索結果として検出されたときに、当該枠を強調表示するための強調色のパラメータ記述を含むことを特徴とする。
【発明の効果】
【0013】
本発明によれば、検索により検出されたオブジェクトをユーザが認識しやすいように強調表示可能な電子文書データを生成するための画像処理装置、画像処理方法、及びプログラムを提供することができる。
【図面の簡単な説明】
【0014】
【図1】画像処理システムの構成例を示すブロック図である。
【図2】MFPの構成例を示すブロック図である。
【図3】データ処理部の構成例を示すブロック図である。
【図4】フォーマット変換部の構成例を示すブロック図である。
【図5】入力イメージデータに対して領域分割を行った結果の例を示す図である。
【図6】入力イメージデータに対して出力される電子文書データの例を示す図である。
【図7】フォーマット変換部の制御情報である対応テーブルの例を示す図である。
【図8】画像処理システムで実行される処理全体の概要を示すフローチャートである。
【図9】4ページからなる入力イメージデータに対して領域分割を行った結果の例を示す図である。
【図10】メタデータ処理部の処理を説明するフローチャートである。
【図11】フォーマット変換部の処理を説明するフローチャートである。
【図12】電子文書記述生成部の処理を説明するフローチャートである。
【図13】グラフィックスデータの例を示す図である。
【図14】入力イメージデータに対して出力される電子文書データの例を示す図である。
【図15】入力イメージデータに対して出力される電子文書データの例を示す図である。
【図16】電子文書データを閲覧・検索するアプリケーションの画面表示例である。
【図17】電子文書データを閲覧・検索するアプリケーションの画面表示例である。
【図18】本発明の実施例3におけるパラメータ記述生成処理を説明するフローチャートである。
【図19】本発明の実施例3における処理結果例を示す図である。
【図20】本発明の実施例4におけるパラメータ記述生成処理を説明するフローチャートである。
【図21】本発明の実施例4における処理結果例を示す図である。
【図22】本発明の実施例5における図4のベクトル変換処理部402の処理を説明するフローチャートである。
【図23】本発明の実施例5における処理結果例を示す図である。
【図24】本発明の実施例6におけるベクトル変換処理部の処理を説明するフローチャートである。
【図25】本発明の実施例6におけるベクトル変換処理部の処理を説明するフローチャートである。
【図26】本発明の実施例6における処理結果例を示す図である。
【図27】本発明の実施例7におけるユーザインタフェース(UI)画面の一例を示す図である。
【発明を実施するための形態】
【0015】
(実施例1)
以下、本発明を実施するための最良の形態について図面を用いて説明する。
【0016】
[画像処理システムの構成]
図1は本実施例の画像処理システムの構成を示すブロック図である。
【0017】
図1において、オフィスA内に構築されたLAN102には、複数種類の機能(複写機能、印刷機能、送信機能等)を実現する複合機であるMFP(Multi Function Peripheral)100が接続されている。LAN102は、プロキシサーバ103を介して外部ネットワーク104にも接続されている。クライアントPC101はLAN102を介してMFP100からの送信データを受信したり、MFP100が有する機能を利用したりする。例えば、クライアントPC101は、印刷データをMFP100へ送信することで、その印刷データに基づく印刷物をMFP100で印刷することもできる。尚、図1の構成は一例であり、オフィスAと同様の構成要素を有する、複数のオフィスがネットワーク104上に接続されていても良い。また、ネットワーク104は、典型的にはインターネットやLANやWANや電話回線、専用デジタル回線、ATMやフレームリレー回線、通信衛星回線、ケーブルテレビ回線、データ放送用無線回線等で実現される通信ネットワークである。これは、データの送受信が可能なものであれば、何でも良い。また、クライアントPC101、プロキシサーバ103の各種端末はそれぞれ、汎用コンピュータに搭載される標準的な構成要素を有している。例えば、CPU、RAM、ROM、ハードディスク、外部記憶装置、ネットワークインタフェース、ディスプレイ、キーボード、マウス等である。
【0018】
図2は本実施例の画像処理装置であるMFP100の詳細構成を示す図である。
MFP100は、画像入力デバイスであるスキャナ部201と、画像出力デバイスであるプリンタ部202と、CPU205等で構成される制御ユニット204と、ユーザインタフェースである操作部203等を有する。制御ユニット204は、スキャナ部201、プリンタ部202、操作部203と接続し、一方では、LAN219や一般の電話回線網である公衆回線(WAN)220と接続することで、画像情報やデバイス情報の入出力を行うコントローラである。CPU205は、制御ユニット204に含まれる各ユニットを制御する。RAM206はCPU205が動作するためのシステムワークメモリであり、画像データを一時記憶するための画像メモリでもある。ROM210はブートROMであり、システムのブートプログラム等のプログラムが格納されている。記憶部211はハードディスクドライブで、システム制御ソフトウェア、画像データを格納する。操作部I/F207は操作部(UI)203とのインターフェース部で、操作部203に表示するための画像データを操作部203に対して出力する。また、操作部I/F207は操作部203から本画像処理装置の使用者が入力した情報を、CPU205に伝える役割をする。ネットワークI/F208は本画像処理装置をLAN219に接続し、パケット形式の情報の入出力を行う。モデム209は本画像処理装置をWAN220に接続し、データの復調・変調を行うことにより情報の入出力を行う。以上のデバイスがシステムバス221上に配置される。
【0019】
イメージバスI/F212はシステムバス221と画像データを高速で転送する画像バス222とを接続し、データ構造を変換するバスブリッジである。画像バス222は、例えば、PCIバスやIEEE1394で構成される。画像バス222上には以下のデバイスが配置される。ラスターイメージプロセッサ(RIP)213はPDL(ページ記述言語)コードを解析し、指定された解像度のビットマップイメージに展開する、いわゆるレンダリング処理を実現する。この展開をする際には、各画素単位あるいは又は各領域単位に属性情報が付加されることになる。これを像域判定処理と呼ぶ。像域判定処理により、画素毎にあるいは領域毎に、文字(テキスト)、線(ライン)、グラフィクス、イメージ等といったオブジェクトの種類を示す属性情報が付加される。例えば、PDLコード内のPDL記述のオブジェクトの種類に応じて、RIP213から像域信号が出力され、その信号値で示される属性に応じた属性情報が、オブジェクトに対応する画素や領域に関連づけて保存される。したがって画像データには、関連づけられた属性情報が付属している。デバイスI/F214は、信号線223を介して画像入力デバイスであるスキャナ部201を、信号線224を介して画像出力デバイスであるプリンタ部202を、それぞれ制御ユニット204に接続する。デバイスI/F214は、画像データの同期系/非同期系の変換を行う。スキャナ画像処理部215は、入力画像データに対し補正、加工、編集を行う。プリンタ画像処理部216は、プリンタ部202に出力すべきプリント出力画像データに対して、プリンタ部202に応じた補正、解像度変換等を行う。画像回転部217は入力された画像データが正立するように回転を行い出力する。データ処理部218については後述する。
【0020】
[処理部の構成]
次に、図3を用いて、図2のデータ処理部218の詳細説明を行う。データ処理部218は、領域分割部(領域抽出部)301、属性情報付加部302、文字認識部303、メタデータ処理部304、及びフォーマット変換部305を備えて構成される。データ処理部218は、スキャナ部201でスキャンしたイメージデータ300を入力し、各処理部301〜305で処理を行うことにより、電子文書データ310を生成して出力する。すなわち、データ処理部218は、文書生成を行う。
【0021】
領域分割部301には、図2のスキャナ部201でスキャンされたイメージデータ、あるいは記憶部211に保存されているイメージデータ(文書画像)が入力される。そして、領域分割部301は、入力されたイメージデータから文字、写真、図、表等ページ内に配置されたオブジェクトの領域(オブジェクト領域)を抽出するために、データ中の画素の抽出・グループ化等の処理を行う。さらに領域分割部301は、オブジェクト領域の属性情報及びサイズ、並びにオブジェクト領域の近傍に他のオブジェクトが存在するか否かなどの情報を抽出し、当該情報を領域情報として記憶部211に保存する。
【0022】
この際の領域抽出方法(オブジェクト抽出方法、領域分割方法)としては公知の方法を用いればよい。一例を説明すると、まず、入力画像を2値化して2値画像を生成し、2値画像を低解像度化して間引き画像(縮小画像)を作成する。例えば、1/(M×N)の間引き画像を作成する際には、2値画像をM×N画素毎に分割し、M×N画素内に黒画素が存在すれば縮小後の対応する画素を黒画素とし、存在しなければ白画素とすることにより、間引き画像を作成する。次に、間引き画像において黒画素が連結する部分(連結黒画素)を抽出して当該連結黒画素に外接する矩形を作成していく。文字画像サイズに近い矩形(1文字の矩形)が並んでいる場合や、縦横のどちらかが文字画像サイズに近い矩形(数文字が繋がった連結黒画素の矩形)で短辺の近くに同様の矩形が並んでいる場合は、1つの文字行を構成している文字画像である可能性が高い。この場合は矩形同士を結合して、1つの文字行を表す矩形を得る。そして、1つの文字行を表す矩形の短辺の長さがほぼ同じで、列方向にほぼ等間隔に並んでいる矩形の集合は、本文部である可能性が高いので結合して本文領域を抽出する。また、写真領域や図領域や表領域は、文字画像よりも大きいサイズの連結黒画素により抽出される。その結果、例えば、図5(a)の501から505に示す領域が抽出されることとなる。なお、各領域の属性は、後述するように、そのサイズや縦横比や黒画素密度や、連結黒画素内部に含まれる白画素の輪郭追跡結果等に基づいて判断される。
【0023】
属性情報付加部302は、領域分割部301で分割された領域毎に属性を付加する。図5(a)に示されたイメージを入力イメージデータの例として処理動作を説明する。領域505は、その領域内の文字列が所定の量の文字数や行数を有し、文字列が段落の形態を有するなど、総合的な点から本文であると判定され、『本文』の属性が付加される。残りの領域については、まず、属性情報付加部302は、文字画像サイズに近い矩形が含まれている領域か否かを判断する。特に、文字画像が含まれている領域は、領域内で文字画像の矩形が周期的に現れる。そのため、矩形が現れる周期性の有無により領域内に文字が含まれている領域であるか否かを判断することができる。その結果、領域501及び領域504は文字が含まれる領域としてこれらの領域のメタデータに『文字領域』の属性を付加する。ただし、これらの領域は、所定の量の文字数及び行数を有さず、文字列が段落の形態を持たないなどの点から、『本文』の属性は付加されないことになる。
【0024】
一方、それ以外の領域については、領域の大きさが非常に小さければ『ノイズ』と判定する。また、画素密度が小さい連結黒画素について、その内部の白画素輪郭追跡を行ったときに、その白画素輪郭の外接矩形が整然と並んでいる場合は当該領域を『表』と判断し、整然と並んでいない場合は『線画』と判断する。それ以外の画素密度の高いものは絵や写真であるとして『写真』の属性を付加する。
【0025】
更に、本文でないと判断された文字領域が、『表』、『線画』又は『写真』の近傍(領域の上または下)に存在する場合、当該文字領域は、当該『表』、『線画』又は『写真』の領域を説明する文字領域であると判断され、『キャプション』の属性が付加される。尚、『キャプション』の属性が付加された領域は、そのキャプションにより説明されている『表』、『線画』又は『写真』の領域を特定できるように、当該説明されている領域と関連付けて記憶部211などの記憶手段に保存される。
【0026】
また、本文でないと判断された文字領域が、本文部の文字画像より大きく、本文部の段組とは異なる位置にあれば、当該文字領域に『見出し』の属性を付加する。また、当該文字領域が、本文部の文字画像より大きく、本文部の段組の上部に存在すれば、属性を『小見出し』とする。更に、当該文字領域が、本文部の文字画像のサイズ以下の文字画像であり、原稿の下端部や上端部に存在すれば『ページ』(又は、「ページヘッダ」若しくは「ページフッタ」)の属性が付加される。また、文字領域として判断されたが、『本文』、『見出し』、『小見出し』、『キャプション』、又は『ページ』のどれにも当てはまらなかった場合、『文字』の属性が付加される。
【0027】
以上のような属性情報付加処理を行うと、図5(a)の例では、領域501には『見出し』、領域502には『表』、領域503には『写真』、領域504には領域503に付随する『キャプション』、領域505には『本文』の属性が付加されることとなる。
【0028】
文字認識部303は、文字画像を含む領域(『文字』、『本文』、『見出し』、『小見出し』、又は『キャプション』領域)について、公知の文字認識処理を実行する。文字認識部303は、文字認識処理によって得られた文字コード列を文字情報として対象領域と関連付けて記憶部211に保存する。
【0029】
領域分割部301、属性情報付加部302、及び文字認識部303における処理により抽出された、領域の位置や大きさや領域属性の情報、ページの情報、及び文字認識結果の文字情報(文字コード情報)等は、記憶部211に保存される。図5(b)は、図5(a)の入力イメージデータに対して処理を行った場合に記憶部211に保存される情報の例を示す。なお、図5(a)の説明および図5(b)に示された例では省略されているが、表内の文字画像の領域に関しては、『表内文字』の属性を付加して文字認識処理を行って、図5(b)のように情報を保存しておくのが望ましい。
【0030】
メタデータ処理部304は、属性情報付加部302で検出されたキャプションが付随するオブジェクト(『写真』、『線画』、『表』等のオブジェクト)に対し、当該オブジェクトを検索するための情報としてメタデータを関連づけて記憶部211に保存する。
【0031】
本実施例では、当該オブジェクトのキャプションに記載されている文字列と、当該キャプションに含まれる文字(単語)と同じ文字(単語)が記載されている本文中の文章とが、オブジェクト検索用のメタデータの中で関連付けられる。
【0032】
また、本実施例では、オブジェクト検索用のメタデータとして使用する文字列を決定するために、キャプション用識別子を用いるものとする。当該識別子は、キャプションが付随するオブジェクトと、キャプションおよび本文の文字情報とを対応づけるためのものである。キャプション用識別子として、オブジェクトを識別するためのID(識別情報)、キャプションや本文の文字情報の格納位置を指定する位置情報(記録位置を示すアドレスやポインタ)、参照情報(例えばXMLPathやURL)等を用いることが可能である。本実施例では、1ページまたは複数ページを入力とする一連の処理において、キャプション付きのオブジェクトを一意に識別するためのIDを用いるものとし、例えば、通し番号のようなものを使用することとする。
【0033】
そこで、まず、メタデータ処理部304では、属性情報付加部302で検出されたキャプションが付随するオブジェクトに対して、それらを一意に特定する為のキャプション識別子を作成し、この識別子を当該オブジェクトに付与する処理を行う。
【0034】
次に、文字認識部303が出力したキャプションおよび本文の文字情報から、オブジェクトに対する説明文、キーワード等に相当するメタデータ文字列を抽出して、これに対して、対応するキャプション識別子を関連付けて記憶部211に保管する処理を行う。この際に、キャプションが付随するオブジェクトとメタデータ文字列の組み合わせに対して、その対応がわかるようにユニークなIDを付加することで、その対応を表現する。
【0035】
これにより、メタデータ処理部304は、属性情報付加部302で検出されたキャプションが付随するオブジェクトに対し、そのメタデータを関係づけて、当該関係づけた情報を記憶部211に保管する。
【0036】
フォーマット変換部305は、領域分割部301、属性情報付加部302、文字認識部303、及びメタデータ処理部304から得られた情報を用いて、入力されたイメージデータ300を所定の電子文書フォーマットへ変換する。当該電子文書フォーマットとして、例えば、PDF、SVG,XPS、OfficeOpenXML等が考えられる。フォーマット変換で生成される電子文書は、グラフィックス等によるページ表示情報(表示用画像等)と、文字等の意味記述による内容情報(メタデータ等)を含む。
【0037】
図4はフォーマット変換部305の構成例を示すブロック図である。画像フィルタ処理部401は入力された画像データに対して、平坦化やスムージング、エッジ強調、色量子化、2値化等のフィルタ処理を施す。ベクトル変換処理部402は、画像データ(例えば、『線画』属性が付与された領域に対応する部分の画像)をベクトルパス記述のグラフィックスデータ(ベクトルデータ)へと変換する。ベクトルデータへ変換する技術は公知のベクトル化技術を用いることが可能である。画像切り出し処理部403は、画像データ(例えば、『写真』属性が付与された領域に対応する部分の画像)を、画像パーツのグラフィックスデータ(例えばJPEGデータ)として切り出す。電子文書記述生成部404は、オブジェクト検索時に、検索結果を特定・強調する際に表示される枠などのグラフィックス記述(ベクトルパス記述)を生成する。電子文書記述出力部405は、グラフィックスデータ、意味記述、及び枠のベクトルパス記述を所定フォーマット形式で記述し、電子文書を生成する。ここで、グラフィックスデータは、ベクトル変換処理部402および画像切り出し処理部403から出力されるデータである。意味記述は、文字認識部303やメタデータ処理部304で得た文字情報やメタデータ等である。枠のベクトルパス記述は、電子文書記述生成部404で生成される記述である。フォーマット変換制御部406は、図2の記憶部211に保管されている領域情報(位置、大きさ、属性)411、領域内の文字情報412、及びメタデータ413に基づいて、イメージデータ300中の各領域を適切な処理部401〜405へと配分する。そして、フォーマット変換制御部406は、各処理部401〜404から出力されたデータが電子文書記述出力部405で統合されるように、フォーマット変換部305全体の制御を行う。
【0038】
以下に401〜405の各処理部の処理内容例について説明する。
画像フィルタ処理部401は、画像に対して、平坦化、スムージング、エッジ強調、色量子化、2値化等の公知の画像フィルタ処理を施す処理部であり、ベクトル変換処理部402や画像切り出し処理部403で処理を行う際に、必要に応じて画像処理を行う。具体的な説明は省略するが、ベクトル変換処理を行う際に適した画像処理や、画像切り出し処理を行う際に適した画像処理が行われるものとする。
【0039】
ベクトル変換処理部402は、線画や表罫線等の画像領域の対象画素集合を、ベクトルパス描画関数によるグラフィックス描画表現、すなわちベクトルパス記述データへと変換する。
【0040】
ベクトル変換処理の一例を説明する。まず変換対象の画像を2値画像データに変換する。例えば、変換対象の画像がグレースケール画像の場合は、画像フィルタ処理部401を用いて各画素の輝度を所定しきい値と比較して2値化することによって2値画像データを得る処理を行う。なお、変換対象の画像が複数色を含む場合は、色成分毎に分解して色毎の2値画像データを生成するようにしてもよい。次に2値画像データ内で連結する黒画素集合に対して輪郭追跡を行って、集合毎に輪郭の座標点列を取得する。続いて輪郭の座標点列を複数の区間に適応的に分割し、各々の区間を直線関数や曲線関数で近似する。曲線関数の例としてはスプライン曲線、ベジェ曲線等がある。最終的に、始点、直線および曲線、終端の1組からなるベクトルパス記述へと変換する。
【0041】
なお、ベクトル化手法は上記手法に限るものではなく、他の公知のベクトル化手法を用いてもよい。例えば、輪郭を関数近似する代わりに、線図形の芯線を関数近似するベクトル化手法も良く知られている。
【0042】
画像切り出し処理部403は、入力画像中の対象領域に対し、領域内の画素データのみを用いた個別の画像パーツデータを生成する。本処理の際に、領域の特性にあわせて画素データ種別や圧縮方法を変更してもよい。例えば『線画』や『文字』属性の領域に対しては、画像フィルタ処理部401を用いて色毎に2値画像(1枚または複数枚の2値画像)へ変換した後に、MMR等公知の2値圧縮方式でデータ化するともに、各2値画像に対応する色情報を付加したデータを生成する。一方、『写真』属性の領域に対しては、自然画の圧縮に適したJPEGやJPEG2000方式を用いて圧縮する。
【0043】
なお、ベクトル変換処理部402によるベクトル変換と、画像切り出し処理部403による画像圧縮は、領域の属性に応じて、どちらか一方を行うように設定してもよいし、両方を行うように設定してもよい。また、本文や見だしやキャプション等の文字領域に関しては、文字認識結果の類似度が高ければ、当該文字認識結果の文字コード、文字のサイズ情報、及び文字の位置情報等を記述し、当該文字領域部分のグラフィックスを再現するようにしてもよい。
【0044】
電子文書記述生成部404では、電子文書の閲覧時には表示されないが、オブジェクト検索時に、検索結果を特定・強調する際に表示される枠などのグラフィックス記述(ベクトルパス記述)を生成する。その際、該オブジェクトの属性やサイズ、他オブジェクトとの関係性などを解析し、当該オブジェクトに最適な強調表示用の枠を生成する方法を決定する。枠の生成方法としては、当該オブジェクトのベクトルパス記述を参照する方法と、予め定義された既定形状(例えば、矩形や円形等)のベクトルパス記述を参照する方法がある。また、透明枠に対し、オブジェクトの検索結果の認識・識別効率を高めるための補足形状のベクトルパス記述を電子文書に追加することも可能である。当該補足形状の例は、透明枠の位置を指し示す矢印表記や、メタデータ文字列などである。
【0045】
電子文書記述出力部405は、グラフィックスデータ、意味記述、及び透明枠のベクトルパス記述を所定フォーマット形式で記述し、電子文書を生成する。ここで、グラフィックスデータは、ベクトル変換処理部402及び画像切り出し処理部403から出力されたデータである。意味記述は、文字認識部303やメタデータ処理部304で得た文字情報やメタデータ等である。透明枠のベクトルパス記述は、電子文書記述生成部404で生成された記述である。
【0046】
生成される電子文書データ310の例を図6に示す。図6の例は、図5(a)のイメージデータ500の例を処理した場合に、記憶部211に保存された図5(b)のようなデータに基づいて、SVG(Scalable Vector Graphics)フォーマットで記述を行った場合の例を示す。図6の記述601〜605は、それぞれ図5(a)の領域501〜505に対するグラフィックス記述である。ここで、記述601、604および605は文字コードによる文字描画記述の例である。記述602はベクトル変換された表の枠のベクトルパス記述である。記述603は切り出し処理された写真画像を貼り付ける記述の例である。また、記述606は写真オブジェクト503に対する強調表示用の透明枠(詳細は後述する)のベクトルパス記述である。キャプションが付随する透明枠オブジェクト606には、キャプション識別子(caption_id)608として‘‘1’’が付与されている。なお、図5(b)と図6の例で、座標値X1、Y1等記号で記述されている部分は実際には数値である。また、記述607はメタデータの記述例である。メタデータの記述607には、キャプション604の文字列と本文の文字列とに基づいて抽出した文字列610として「AAA」が記述され、キャプション識別子608と同じ識別子609が関連づけられている。なお、図6の例では、単語「図1」を含む本文の個所「・・・図1は、AAAである。・・・」という文章から、単語「AAA」を抽出してメタデータ610としたが、単語に限るものではなく、文章(例えば「図1」を含む1文)をそのままメタデータとして付与してもよい。また、図6の例では、本文から抽出した文字列をメタデータとしているが、これに限るものではなく、キャプションの文字列から抽出した単語をメタデータとして更に追加するように構成してもよい。
【0047】
なお、ここではSVGを例として説明したが、出力フォーマットはSVGに限定されるものではなく、PDF、XPS、Office Open XML、その他のPDL系のデータ形式等に変換してもよい。
【0048】
フォーマット変換制御部406における変換処理制御の例について以下に説明する。
【0049】
フォーマット変換部305において、各領域に施すべき変換処理内容は、領域の属性によって異なる。例えば、ベクトル変換処理は文字や線画のように白黒あるいは数色で構成された図形に対しては好適であるが、写真のように階調性のある画像領域には不適である。このように、各領域の属性に従った適切な変換を行うためには、図7のような対応テーブルをあらかじめ設定しておけばよい。
【0050】
例えば、図7(a)の設定に従えば、『文字』、『線画』および『表』属性の領域に対してはベクトル変換処理が、『写真』属性の領域に対しては画像切り出し処理が行われる。
【0051】
さらに、図7の対応テーブルには、該当領域の画素情報をイメージデータ300から消去する処理の有無が記載されている。例えば、図7(a)の設定に従って『文字』属性の領域をベクトルパス記述データに変換する場合を説明する。『文字』属性は、消去処理「あり」と指示されているので、イメージデータ300上において、当該変換されたベクトルパスに覆われる部分に対応する画素をその周辺色で塗りつぶす処理を行う。同様に、『写真』属性の領域を矩形の画像パーツとして切り出す際には、イメージデータ300上において、当該切り出された領域に対応する領域範囲内を、その周辺色等で塗りつぶす処理を行う。
【0052】
このような消去処理を行う目的としては、各領域に対する処理が終了した後(塗りつぶし処理終了後)のイメージデータ300を『背景』の画像パーツデータとして利用できることである。この背景用の画像データ(背景画像)には、領域分割処理で抽出された領域以外の部分(例えばイメージデータ300中の下地にあたるような画素)が残っている。電子文書データ記述の際には、ベクトル変換処理部402や画像切り出し処理部403で得られたグラフィックスデータ(前景画像)を背景画像パーツデータ(背景画像)の上に重畳して表示するような記述を行う。これにより、背景画素(下地の色)の情報欠落がなくなり、かつ冗長性のないグラフィックスデータを構成することが可能となる。
【0053】
図7(b)は対応テーブルの別の例である。図7(b)に従えば、『文字』領域部分に対しては、2値による画像切り出し処理と、イメージデータ300からの画素消去処理が行われるが、それ以外の属性の領域に対しては、ベクトル化処理や画像切り出し処理は行われない。すなわち、処理対象外の画素(『写真』や『線画』や『表』属性の領域内の画素情報)は、背景画像パーツデータ内に残っており、この背景画像上に『文字』の画像パーツを重畳するように記述される。
【0054】
また、図7(c)、図7(d)は別の対応テーブルの例であるが、これらの詳細な説明は後述する。
【0055】
なお、図7(a)〜(d)のような対応テーブルを予め複数用意しておき、出力電子文書データの用途(使用目的)や文書の内容に応じて選択するようにしても良い。例えば、図7(a)の対応テーブルに基づいた出力は、オブジェクトの大半がベクトルパス記述へと変換されているため、拡大縮小時の画質に優れているので、グラフィックエディタ等の再利用用途に好適である。また、図7(b)の対応テーブルは、文字画像を文字色ごとに個別の2値画像を生成して可逆圧縮することで、文字画像部分は高品位に再生することができ、かつ、それ以外を背景画像としてJPEG圧縮することでデータサイズの圧縮率を高くすることができる。したがって、図7(b)の場合は、圧縮率を高くしつつ文字画像が読みやすいデータを作成したい場合に適している。
【0056】
[処理のフロー]
次に、本実施例の画像処理システムで実行する処理全体の概要を、図8のフローチャートを用いて説明する。図8に示すフローチャートは、図2のデータ処理部218(図3の各処理部301〜305)によって実行されるものとする。なお、本実施形態では、CPU205が記憶部211に格納されたコンピュータプログラムを読み取り実行することによって、データ処理部218(図3の各処理部301〜305)として機能するものとするが、これに限るものではない。例えば、データ処理部218(図3の各処理部301〜305)を、電子回路等のハードウェアで実現するように構成してもよい。
【0057】
図8は、図1のMFP100で入力された複数ページのイメージデータを、複数ページからなる電子文書データに変換する処理のフローチャートである。尚、複数ページのイメージデータとしては、例えば、図9(a)のページ画像901〜904が入力されるものとする。図9(a)は、4ページで構成される文書画像の一例であり、画像901〜904は順に1〜4ページとする。以下、図8のフローチャートの各説明を行う。
【0058】
ステップS801において、領域分割部301は、入力された1ページ分のイメージデータから領域(オブジェクト)を分割(抽出)する。例えば、図9(a)のイメージデータ901(1ページ目)に対しては領域905及び906を抽出する。
【0059】
ステップS802において、属性情報付加部302は、ステップS801で抽出された各領域に属性を付加する。図9(a)の1ページ目の例では、領域905には『写真』、領域906は『キャプション』の属性を付加する。尚、このキャプションの領域906には、付随する領域が領域905であるという情報も付加する。また、2ページ目の例では、領域907、908、及び911には『線画』の属性が、領域909、910、及び912には『キャプション』の属性が付加される。また、これらのキャプション909、910、及び912には、付随する領域がそれぞれ907、908、及び911であるという情報も関連付けて記憶部211に保存されている。
【0060】
ステップS803において、文字認識部303は、ステップS802で文字(本文、キャプション、見出し、小見出し等)の属性を付加した領域に対して文字認識処理を実行し、その結果を文字情報として対象領域に関連付けて保持する。1ページ目の例では、文字である『キャプション』属性が付加された領域906に対して文字認識処理を行って、文字情報『図1』が得られ、領域906に関連付けを行う。
【0061】
ステップS804において、データ処理部218は、ステップS801〜S803の情報抽出処理を全てのページに対して行った否かを判断する。全てのページを処理していればステップS805へ進む。未処理のページがあればステップS801から繰り返す。
【0062】
図9(a)の画像901〜904に対して、ステップS801〜S804の処理を行った結果として、抽出される領域の位置や大きさ等の情報、ページの情報、領域の属性、及び領域の文字情報の例を図9(b)に示す。また、領域913〜915はそれぞれ2〜4ページ目から抽出された『本文』属性の領域である。これらの情報は記憶部211に保存されている。
【0063】
ステップS805において、メタデータ処理部304は、メタデータ抽出処理およびメタデータ付与処理を行う。ステップS805でメタデータ処理部304が実行する処理の詳細については、図10のフローチャートを用いて説明する。
【0064】
図10のステップS1001において、メタデータ処理部304は、記憶部211に保存された領域情報において、『キャプション』属性が付与された領域のうち、本メタデータ処理が行われていないものを一つ選出する。すなわち、未処理のキャプション領域があれば、当該未処理キャプション領域を処理対象として選択してステップS1002に進む。キャプション領域が存在しないか、すべて処理済みであった場合にはメタデータ処理を終了する。図9(a)の画像901〜904を入力とした場合、キャプション領域906が最初に選出され、909,910,912と続いて選択される。
【0065】
ステップS1002において、メタデータ処理部304は、当該処理対象のキャプションが付随するオブジェクトに対してキャプション識別子を付与し、さらに記憶部211に当該付与したキャプション識別子用のメタデータ記憶領域を確保する。ここではキャプション906が付随する写真オブジェクト905に対し、キャプション識別子「1」が付与され、記憶部211に当該キャプション識別子「1」用のメタデータ記憶領域が確保されるものとする。
【0066】
ステップS1003において、メタデータ処理部304は、キャプション領域内の文字認識情報から、アンカー文字列およびメタデータ文字列を抽出する。アンカー文字列とは、元の文書中でこのキャプションが付随するオブジェクトを識別するための文字情報である。メタデータ文字列とは、オブジェクトを説明するための文字情報である。オブジェクトに付随するキャプションには、アンカー文字列のみが記載される場合、メタデータ文字列のみが記載される場合、さらに両方が記載される場合がある。例えば、アンカー文字列は「図」や「Fig」等、特定の文字列と、番号や記号との組み合わせ表現された図番号である場合が多い。そこで、それら特定の文字列を登録したアンカー文字列用辞書を予め用意しておき、キャプション文字列を該辞書と比較してアンカー部分(アンカー文字列+数記号)を特定すればよい。そして、キャプション領域の文字列のうち、アンカー部分以外の文字列をメタデータ文字列として判断すればよい。例えば、「図1カメラ」というキャプションの場合には、「図1」がアンカー文字列にあたり、「カメラ」がメタデータ文字列に当たる。
【0067】
ステップS1004において、メタデータ処理部304は、ステップS1003でキャプション領域からメタデータ文字列が抽出されたか否かを判断する。メタデータ文字列が抽出された場合はステップS1005に進み、メタデータ文字列が抽出されなかった場合はステップS1006に進む。
【0068】
ステップS1005において、メタデータ処理部304は、キャプション領域から抽出されたメタデータ文字列を、ステップS1002で付与されたキャプション識別子用の記憶領域に保存し、ステップS1006に進む。すなわち、キャプション領域から抽出されたメタデータ文字列を当該キャプション識別子と関連付ける。
【0069】
ステップS1006において、メタデータ処理部304は、ステップS1003でキャプション領域からアンカー文字列が抽出されたか否かを判断し、アンカー文字列が抽出された場合はステップS1007に進む。一方、アンカー文字列が抽出されなかった場合はステップS1001に戻って、未処理のキャプション領域があるかどうか判断する。
【0070】
図9(a)の入力例の1ページ目901では、キャプション領域906からはアンカー文字列として「図1」が抽出されるがメタデータ文字列は抽出されないのでステップS1004からS1006、S1007へと進む。
【0071】
ステップS1007において、メタデータ処理部304は、当該抽出されたアンカー文字列と同等の文字列表現を、記憶部211に格納された『本文』領域の文字情報から検出する。同等の文字列表現を検出した場合は、ステップS1008に進む。検出されなかった場合はステップS1001に戻って未処理のキャプション領域があるかどうか判断する。
【0072】
ステップS1008において、メタデータ処理部304は、ステップS1007で本文から検出された文字列表現の周辺から、オブジェクトのメタデータに相当する文字列を抽出する。図9(a)の入力例では、本文領域915から、アンカー文字列「図1」906と同じ文字列916が検出されるので、その周辺の文字列「図1のカメラで撮影した。」に形態素解析等を行い、単語「カメラ」がメタデータ文字列として抽出される。このメタデータ文字列の判断には自然言語処理の形態素解析等で単語切り機能を用いればよい。なお、本実施形態では単語を抽出してメタデータ文字列とする例を示したが、これに限るものではなく、例えば、アンカー文字列を含む1文をそのままメタデータ文字列として用いるようにしても構わない。
【0073】
ステップS1009では、メタデータ処理部304は、ステップS1008で抽出したメタデータ文字列を、前記キャプション識別子用の記憶領域に追加保存する。すなわち、本文から抽出されたメタデータ文字列をキャプション識別子と関連付ける。そしてS1007に戻って、本文の別の部分に同様のアンカー文字列の記述があるかどうか繰り返し、あれば順次追加保存していく。したがって、1つのキャプション識別子に対して、複数のメタデータ文字列が関連づけられる場合もある。
【0074】
図8に戻って、ステップS806において、フォーマット変換部305は、イメージデータ300および、記憶部211に保存された図9(b)に示すような情報に基づいて、電子文書データ310への変換を行う。なお、図4で説明したように、フォーマット変換部305は、フォーマット変換制御部406の制御により、各領域に施すべき変換処理方法を記した対応テーブルに従って、図8のイメージデータ300内の領域に対してフォーマット変換処理を実行する。ここでは、図7(c)の対応テーブルを用いて変換を制御する際のフォーマット変換処理のフローを、図11のフローチャートを用いて説明する。
【0075】
図11のステップS1101において、フォーマット変換制御部406は、処理ページ番号のカウンタnを1で初期化する。
【0076】
ステップS1102において、フォーマット変換制御部406は、図4の領域情報411中のnページ目のデータの中から、未処理の領域のうちの一つを処理対象領域として選出する。
【0077】
ステップS1103において、フォーマット変換制御部406は、当該処理対象領域の属性と対応テーブルと照らし合わせて属性毎に処理を分岐する。本例では、図7(c)の対応テーブルを用いて判断するので、文字か否かの判断が行われる。すなわち、属性が文字(『本文』、『キャプション』、『ページ』、又は『見出し』)の場合はステップS1104に進み、属性が『写真』、『線画』、又は『表』の場合はステップS1106に進む。
【0078】
ステップS1104において、図7(c)の対応テーブルの設定に従って、画像切り出し処理部403が、イメージデータ300中の当該処理対象の『文字』属性領域に対応する部分の2値画像(2値画像パーツ)を作成する。作成された2値画像パーツは、例えばPNGフォーマット等で圧縮されて図2の記憶部211に保存される。なお、この2値画像パーツ中の文字線に相当する画素には、別途イメージデータ300中の該当文字画素の色より取得された文字色情報が付与され、それ以外の画素には透明色が付与される。
【0079】
ステップS1105において、図7(c)には文字領域の消去処理指示が設定されているため、フォーマット変換制御部406は、図4のイメージデータ300中の文字部分に対応する画素を周囲の画素色で塗りつぶす消去処理を行う。
【0080】
一方、ステップS1103で、『写真』、『線画』、又は『表』と判定された領域に対し、ステップS1106では、フォーマット変換制御部406が、当該処理対象領域にキャプション識別子が付与されているか否かを調べる。付与されていればステップS1107へ進み、付与されていなければステップS1110に進む。
【0081】
ステップS1107において、図4の画像切り出し処理部403とベクトル変換処理部402が、図7(c)の対応テーブルの設定に従って、グラフィックス記述生成を行う。すなわち、『写真』属性が付与された領域に対しては、画像切り出しによる画像パーツ記述が生成され、『線画』又は『表』属性が付与された領域に対しては、ベクトル変換によるベクトルパス記述が生成される。
【0082】
ステップS1108において、図7(c)の対応テーブルの設定に従って、フォーマット変換制御部406が、図4のイメージデータ300中の『写真』、『線画』、又は『表』に対応する画素情報を、周囲の画素色で塗りつぶす消去処理を行う。
【0083】
ステップS1109において、フォーマット変換制御部406は、図7(c)の対応テーブルの設定に従って、電子文書記述生成部404に、当該処理対象領域を囲む枠に相当するベクトルパス記述データを生成させる。更に、ステップS1109では、当該生成した枠のベクトルパス記述データに対して、当該処理対象領域のキャプション識別子を付与し、その枠のベクトルパス記述データの描画色として透明色を割りあてるものとする。このようにして生成されたベクトルパス記述データは、図2の記憶部211に保存される。ステップS1109で電子文書記述生成部404が実行する透明枠のベクトルパス記述データ生成処理の詳細については、図12のフローチャートを用いて説明する。
【0084】
図12のステップS1201において、電子文書記述生成部404は、当該処理対象のキャプションが付随するオブジェクトについての情報である領域情報を取得する。領域情報としては、例えば、領域の位置や大きさ、領域の属性、隣接オブジェクト情報等である。これらの情報は記憶部211に保存されている。
【0085】
ステップS1202において、電子文書記述生成部404は、当該処理対象領域がベクトルパス記述で表現されているかどうかを判定する。ベクトルパス記述で表現されている場合(例えば、『線画』又は『表』属性が付与された領域の場合)、ステップS1203へ進み、ベクトルパス記述以外の場合(例えば、『写真』属性が付与された領域の場合)、ステップS1206へ進む。例えば、図9(a)のページ画像901〜904を入力文書とした場合を説明する。『線画』属性が付与されているオブジェクト907,908,及び911に対する処理のときはステップS1203へ進み、『写真』属性が付与されたオブジェクト905に対する処理のときはステップS1206へ進む。
【0086】
ステップS1203において、電子文書記述生成部404は、当該処理対象領域のサイズを所定の閾値と比較する。処理対象領域のサイズが所定の閾値より小さい場合(例えば、図9(a)の911の場合)はステップS1205に進み、所定サイズ以上のサイズの場合(例えば、図9(a)の907又は908の場合)はステップS1204へ進む。すなわち、処理対象領域のサイズに応じて、処理が分岐する。
【0087】
ステップS1204において、電子文書記述生成部404は、処理対象領域の近傍に他のオブジェクトが存在しているかどうかを判定する。他のオブジェクトが存在している場合(例えば、図9(a)のオブジェクト907、908)はステップS1205に進み、存在しない場合はステップS1206に進む。すなわち、処理対象領域の近傍に他のオブジェクトが存在しているか否かに応じて処理が分岐する。
【0088】
このように、S1202、S1203及びS1204の処理によれば、領域情報(処理対象領域の属性情報及びサイズ、及び処理対象領域の近傍に他のオブジェクトが存在するか否か)に応じて以降の処理が分岐する。当該分岐の結果、後述する透明枠のベクトルパス記述の記述方法が変更される。透明枠とは、オブジェクトを囲む透明色の枠である。
【0089】
ステップS1205において、電子文書記述生成部404は、図11のステップS1107で生成された、当該処理対象のオブジェクトのベクトルパス記述データを参照(再利用)することによって、透明枠のベクトルパス記述を生成する。透明枠のベクトルパス記述データは、オブジェクトのベクトルパス記述データへの参照命令、枠の拡大、枠の位置の移動、枠の太さ、枠の強調色等のパラメータ記述を含むデータである。このとき、枠のサイズが、当該オブジェクトのベクトルパス記述よりも数ピクセル分大きくなるように、拡大のパラメータを設定する。なお、オブジェクトのベクトルパス記述を参照する際、オブジェクトの外輪郭を表す部分のベクトルパス記述を参照するように設定するのが望ましい。すなわち、枠のベクトルパス記述データは、オブジェクトの形状に相似する形状を有し、且つ、オブジェクトのサイズよりも数ピクセル分大きいサイズで記述されることになる。透明枠のベクトルパス記述データは、当該枠を強調表示する際に点滅表示させるためのパラメータを含んでも良い。また、枠のベクトルパス記述データから枠を通常描画するときの色として、透明色を割りあてる。透明色であるため、当該枠のベクトルパス記述の描画結果は、通常の表示を行う際は、描画されたページの視認性に影響を与えない。なお、あるオブジェクトが検索結果として検出された際に、当該オブジェクトを囲む透明枠に強調色を付する、又は当該枠を太くする若しくは点滅表示等することによって、当該枠を前述のパラメータ記述に応じて強調表示することができる。当該強調表示の結果、検索により検出されたオブジェクトを検索結果として認識することができる。
【0090】
ここで電子文書データの記述例を示す図15を参照して、図9のオブジェクト907に対して生成された透明枠のベクトルパス記述の例を説明する。オブジェクト907のベクトルパス記述である記述1512には、当該記述を参照するためのID(vec_img1)が付与されて記述されている。透明枠のベクトルパス記述である記述1515は、この参照用IDを参照する記述(useコマンド)とパラメータ記述を用いて記述されている。すなわち、透明枠のベクトルパス記述は、オブジェクトのベクトルパス記述データを参照(利用)することによって生成される。透明枠のベクトルパス記述の詳細は後述する。
【0091】
一方、ステップS1206において、電子文書記述生成部404は、予め定義されている既定形状(例えば、矩形や円形、六角形等)のベクトルパス記述データを参照(利用)することによって、透明枠のベクトルパス記述データを生成する。すなわち、透明枠のベクトルパス記述データは、既定形状のベクトルパス記述データへの参照命令のパラメータ記述を含む。透明枠のベクトルパス記述は、当該処理対象のオブジェクトの外接図形よりも少し大きめ(例えば、オブジェクトの外接図形周囲に5pix分のスペースを空ける等)となるように記述する。枠のベクトルパス記述データの描画色として透明色を割りあてる。このように透明枠のベクトルパス記述がオブジェクトの外接図形よりも少し大きめに記述されることによって、当該枠のベクトルパス記述の描画結果を強調表示した際に、当該枠に囲まれたオブジェクトを視認しやすくなる。
【0092】
例えば図9のオブジェクト905に対する透明枠のベクトルパス記述を生成する場合は、図15の1505で既定形状として定義されている矩形のベクトルパス記述(参照用ID:frame_square)を利用する。そして、この参照用IDを参照する記述(useコマンド)とパラメータ記述を用いて、透明枠のベクトルパス記述1511を生成する。透明枠のベクトルパス記述の詳細は後述する。
【0093】
以上の処理によれば、処理対象領域の属性情報及び領域情報に応じて、透明枠のベクトルパス記述の記述方法(S1205又はS1206)が選択される。すなわち、領域情報等に応じた形状で透明枠のベクトルパス記述を生成する。その結果、検索の結果検出されたオブジェクトを囲む枠を強調表示した場合に、当該オブジェクトを視認しやすくすることができる。
【0094】
なお、領域のサイズに応じて透明枠のベクトルパス記述の記述方法を変更することによって、当該領域(オブジェクト)が小さい場合であっても、どのオブジェクトが検索により検出されたしたのかを認識しやすいように枠を強調表示することができる。
【0095】
また、領域の近傍に他のオブジェクトが存在しているか否かに応じて透明枠のベクトルパス記述の記述方法を変更するため、近傍に他のオブジェクトが存在している場合であっても、検索により検出されたオブジェクトを他のオブジェクトと誤認しにくくなる。
【0096】
ステップS1207において、電子文書記述生成部404は、ステップS1205及びS1206で生成された枠(又はオブジェクト)をさらに補足的に強調させる(指し示す)ための追加の透明形状のベクトルパス記述を生成する。当該透明形状の例としては、オブジェクト位置を分かりやすく指し示すための矢印等の記述が考えられる。このとき、追加記述で必要となる矢印等の形状のベクトルパス記述を予め既定形状の一つとして記述し、透明枠のベクトルパス記述に当該ベクトルパス記述の参照を含めることができる。そして、当該枠を強調表示する際に、当該矢印等の透明形状も同様に強調表示する。透明形状を強調表示するための強調色を指定するパラメータについての記述が、当該透明形状のベクトルパス記述に含まれているのが望ましい。また、補足的強調表示を行うために、透明枠のベクトルパス記述から当該オブジェクトに付与されたメタデータ(文字コード)を参照し、当該オブジェクトを説明するための文字列を強調色で描画してもよい。
【0097】
ステップS1208において、電子文書記述生成部404は、当該生成した枠のベクトルパス記述データに対して、当該処理対象領域のキャプション識別子を付与する。生成された枠のベクトルパス記述データは図2の記憶部211に保存される。
【0098】
図11に戻って、ステップS1110において、フォーマット変換制御部406は、nページ目において未処理の領域があるかを判断する。未処理領域が残っている場合は、ステップS1102に戻ってステップS1102〜S1109の処理を繰り返す。nページ目の全領域が処理済であればステップS1111に進む。
【0099】
ステップS1111において、フォーマット変換制御部406は、図4のイメージデータ300に対して、画像切り出し処理部403で切り出した領域の部分をその周辺色で塗りつぶす処理を行い、背景画像パーツを生成する。すなわち、ステップS1105でイメージデータ300から画像パーツとして切り出された『文字』領域の画素(文字線に相当する画素)が、その周囲の色で塗りつぶされて消去される。S1108でイメージデータ300から画像パーツとして切り出されたベクトルパス記述データとして切り出された『写真』、『線画』及び『表』領域の画素が、その周囲の色で塗りつぶされて消去される。また、それ以外の領域(例えば、下地部分等)は未処理のまま残されている。本例ではこの背景画像パーツを、更に1/2の解像度に低解像度化してからJPEG圧縮を施した画像データに変換し、図2の記憶部211に保存するものとするが、スムージング等他の画像処理を施して別形式による圧縮をおこなってもよい。
【0100】
図13(a)及び(b)は、図9(a)のイメージデータに対してステップS1101〜S1111の処理を行った場合に生成される画像パーツおよびベクトルパス記述データの例である。図13(a)は1ページ目のイメージデータ901を、図13(b)は2ページ目のイメージデータ902を処理した結果である。符号1301,1304はステップS1111で生成される背景画像パーツの例である。背景画像パーツ1301,1304は、文字画像の部分と切り出されたオブジェクト部分が周辺色で塗りつぶされて消去されているので、それ以外のすべてを含む1枚の画像で構成されている。符号1302,1305はステップS1104で生成される文字部分の2値画像パーツ、および、ステップS1107で生成されるグラフィックス記述データの例である。文字部分の2値画像パーツに関しては、文字色の情報も別途保存しているので、文字線の部分は文字色の画素、それ以外の白い部分は透明色の画素で構成されることになる。なお、本図の画像パーツ1302及びグラフィックス記述1305の外枠にあたる破線は図示の為の便宜的なものであって、実際の画像パーツは文字部やグラフィックス記述データの部分を囲む最小の矩形範囲で構成されていてもよい。符号1303,1306は、ステップS1109(図12の各処理)で生成される枠のベクトルパス記述データの例である。本図では枠のベクトルパス記述は便宜上黒の太線で書かれているが、実際には透明色によるベクトルパス記述であるので不可視である。また、ベクトルパス記述1303,1306の外枠にあたる破線は図示の為の便宜的なものであり実際にデータとしては存在しない。
【0101】
ステップS1112において、フォーマット変換制御部406は、電子文書記述出力部405に、現在処理中のページを所定のフォーマットで電子文書ページ310として記述する処理を行わせる。図9(a)の1ページ目の画像901に対して記述される電子文書ページの例を図14に示す。図14の1400は電子文書ページをSVG(Scalable Vector Graphics)フォーマットで記述した例である。電子文書ページ1400は、背景画像データ記述1401、文字部分の2値画像パーツ記述1402、透明枠のベクトルパス記述1403、及びベクトルパス記述1404で構成される。背景画像データ記述1401は、図11のステップS1111で生成された記述である。文字部分の2値画像パーツ記述1402は、ステップS1104で生成された記述である。透明枠のベクトルパス記述1403は、ステップS1109で生成された記述である。ベクトルパス記述1404は、図12のステップS1206の処理の際に参照される既定形状を定義した記述である。
【0102】
ベクトルパス記述1403では、<use xlink:href=“frame_square”>と記述することで、後述するベクトルパス記述1404で定義された既定形状を参照(再利用)する。そして<transform=“translate(100,100)scale(2)”>という記述により、描画位置とサイズを指定することで、透明色で描画される枠を生成している。また、ベクトルパス記述1404中の、<id=“frame_square”>は、既定形状として定義されるテンプレートのIDを参照するための記述であり、<stroke=“transparent”>は、枠を透明色で描画させるための記述である。即ち、<d=”M440,608 L2040,608 L2040,1880 L440,1880 L440,608 s”>でベクトルパス記述された形状の図形を透明色で描画することを意味している。規定形状のベクトルパス記述は、矩形に限るものではなく、円形、六角形等自由に定義することが可能であり、複数用意しておいて使い分けてもよい。記述1401〜1403はそれぞれ図13(a)の符号1301〜1303に相当するグラフィックス描画記述であり、それらが記述1401から順番に重畳描画されるようなグラフィックスデータとして構築されている。すなわち、背景画像が一番下に描画され、その上に文字画像が描画され、更にその上に透明枠が描画されることになる。また、透明枠のベクトルパス記述(グラフィックス記述)1403にはキャプション識別子1405が付与されている。
【0103】
ステップS1113において、フォーマット変換制御部406は、処理中のページ番号nが最後のページ番号である全ページ数に等しいかどうか判定する。等しい場合は全ページの変換処理が終了したと判断してステップS1115へ進む。nの方が全ページ数より小さい場合はステップS1114に進み、nに1を加算し、ステップS1102に戻り次ページに対する処理を繰り返す。
【0104】
最後に、ステップS1115において、電子文書記述出力部405は、ステップS1112で記述された各ページの電子文書ページをまとめて一つにするとともに、メタデータの記述を付与して出力電子文書データ310を作成する。すなわち、電子文書記述出力部405は、先に説明した透明枠のベクトルパス記述等を含む電子文書データを生成する。
【0105】
図15は出力電子文書データの記述例である。出力電子文書データ1500において、記述1501〜1504はそれぞれ1〜4ページ目の電子文書ページ記述である。記述1505は透明枠用の矩形のベクトルパス記述であり、<id=‘‘frame_square’’>の記述により参照用IDが割り当てられている。また、記述1506は追加記述用に定義された矢印のベクトルパス記述であり、<id=‘‘frame_arrow’’>の記述により参照用IDが割り当てられている。記述1507はメタデータの記述例であり、キャプション識別子とメタデータ文字列が対応付けられて記述されている。記述1512〜1514は図11のステップS1107で生成されたオブジェクトのベクトルパス記述である。これらのオブジェクトのベクトルパス記述には、透明枠のベクトルパス記述から参照されるIDが自動的に割り当てられる。例えば、オブジェクト907のベクトルパス記述1515には、<id=‘‘vec_img1’’>の記述により参照用IDが割り当てられている。記述1511および記述1515〜1517は透明枠のベクトルパス記述であり、キャプション用識別子‘‘caption_id’’により一意に識別される。そして、それぞれの透明枠は、<use xlink:href=‘‘参照用ID’’>という記述により、既定形状のベクトルパス記述や、オブジェクトのベクトルパス記述を参照している。また、描画位置とサイズを指定するパラメータ記述も併記される。メタデータ記述1507中のメタデータ文字列「カメラ」1508はキャプション識別子1509と関連付けて記述されており、このキャプション識別子は1ページ目の透明枠のベクトルパス記述1511に付与されたキャプション識別子1510と同じものである。このようにキャプション識別子1509と1510を介して、メタデータ1508と透明枠のベクトルパス記述1511とが関連付けられているので、後述するように、キーワード「カメラ」で検索を行った場合、透明ベクトルパス記述1511を検索できる。
【0106】
以上が、本発明の実施例1における電子文書データ作成処理に関する説明である。
【0107】
[オブジェクトの検索]
次に、本実施例で作成された電子文書データ310に対し、前述したメタデータをキーワードとしてオブジェクトを検索する例について図16を用いて説明する。
【0108】
図16(a)〜(d)は、オブジェクトを検索するためのアプリケーション(以下、オブジェクト検索アプリケーション)として、図1のクライアントPC101や、その他のクライアントPC等で実行されるソフトウェアの表示画面(GUI)の一例である。このようなソフトウェアとしては、例えば、生成する文書のフォーマットがPDFである場合は、Adobe Reader(商標)等を用いることができる。
【0109】
オブジェクト検索アプリケーションは、入力フィールド1601に検索語句として入力された文字列が、電子文書データに付与されたメタデータと一致する場合、該メタデータに関連づけられたキャプション識別子を有するベクトルパス記述を強調表示する。
【0110】
図16(a)は、図5(a)の文書をアプリケーションで表示させたときに表示画面の例である。符号1601は、検索する語句を入力(指定)するための入力フィールドである。符号1602は、検索する語句を入力した後に検索を実行するための検索実行ボタンである。符号1603は、図6の電子文書データ600の描画結果を表示した領域である。その表示内容はグラフィックス記述601〜605の描画結果である。
【0111】
図16(b)は、検索を実行させた結果を示している。符号1604は、検索する語句として「AAA」を指定した状態を示している。図6の電子文書データ600ではメタデータ記述607中の文字列「AAA」(610)、および文字描画記述605中の文字列「AAA」が、検索語句と一致するので、アプリケーションは検索ヒット時の動作を行う。ここでは、メタデータ記述607中の文字列610がヒットした場合の動作例について説明する。
【0112】
オブジェクト検索アプリケーションは電子文書600内から、検索語句と一致するメタデータのキャプション識別子609を検出し、さらに、これと同一の識別子608が付与されたグラフィックス記述606を検出する。そして、ページ表示の際、該当部分が強調されるように対象グラフィックス記述を描画する。本例では、グラフィックス記述が画像の貼りつけであるため、当該画像オブジェクトの回りに強調色、例えば赤色で枠を加えて表示を行うものとする。図16(b)中の符号1605は、検索を実行した結果としてヒットしたオブジェクトの部分が、赤色の枠により強調されている状態を示している。
【0113】
図16(c)は、図9(a)の4ページからなるイメージデータ901〜904に対して、図7(c)の対応テーブルに基づいて図11のフローチャートの処理を行うことで生成された図15の電子文書データ1500の1ページ目を表示した様子を示している。その表示内容は1ページ目のグラフィックス記述1501の描画結果であり、図13の背景画像1301の上に文字の画像(前景画像)1302を重畳表示したものに等しい。なお、枠のベクトルパス記述である1303は透明色が指定されているため、通常状態では不可視である。
【0114】
図16(d)は、図16(c)で表示されている電子文書データ1500に対して検索を実行させた結果を示している。入力フィールド1614には、検索する語句として「カメラ」が入力されている。電子文書データ1500ではメタデータ記述1507中の文字列「カメラ」1508と検索語句が一致するので、アプリケーションは検索ヒット時の動作を行う。具体的には、先の説明と同様に、一致したメタデータ1508のキャプション識別子1509と同一の値が付与されたグラフィックス記述を検出し、ページ表示の際に該当部分に強調表示を行う。この場合、キャプション識別子1510が付与された透明枠のベクトルパス記述1511が強調表示の対象となるので、当該ベクトルパス記述1511の枠は、元々指定されていた透明色ではなく、強調色(例えば赤色)で描画される。したがって1615のように、検索でヒットしたメタデータに対応するグラフィックス記述が、赤色等の可視状態で強調表示された枠として文書画像上に重ねて表示されることになる。ユーザにとっては、背景画像内の写真部分が検索でヒットしたかのように見えることになる。なお、強調表示の方法はこの限りでなく、別の枠色や、既定形状と定義してある別の枠形状を用いてもよい。枠を点滅表示させてもよい。また、ヒットしたオブジェクトの記述が画像貼り付けではなく、ベクトルパス記述で表現されている場合は、当該ベクトルパス記述を再利用した枠形状を用いることもできる。
【0115】
本手法によって検索結果の視認性(ヒットしたオブジェクトの認識と、何のオブジェクトであるかの識別(特定))が向上した例を、図17を用いて説明する。図15の電子文書1500に対して、視認性を考慮していない場合(図17(a)および(c))と、視認性を考慮して透明枠の制御を行った場合(本手法、図17(b)および(d))に対して、検索を実行した結果について示している。
【0116】
図17(a)および(b)の入力ウインドウ1701は検索する語句として「B星」を指定した状態を示している。検索の流れは前述と同じであるため、説明を省略する。検索時の視認性を考慮せずに作成された電子文書の場合は、図17(a)に示すように、符号1702のような強調表示がなされる。しかし、ヒットしたオブジェクトがとても小さく、電子文書中のどこにオブジェクトが存在するのか認識しにくい。また、ヒットしたオブジェクトの位置が分かったとしても、それがどんなオブジェクトなのか瞬時に識別することが困難である。一方、本手法によって作成された電子文書の場合は、図17(b)に示すように、オブジェクトの形状を基にして、オブジェクトよりも少し大きめ(例えばオブジェクトより5pix分大きく等)になるように記述された透明枠1703が強調表示される。それに加え、オブジェクトの位置を分かりやすくするように補足情報として記述された矢印による透明枠1704も同時に検出結果として強調表示される。補足情報である矢印の枠1704により、ヒットしたオブジェクトの位置が一目で分かるようになり、かつ、透明な枠1703によって、何の画像がヒットしているのかという情報まで一目で認識することができる。また、検索アプリケーションによっては、検索時に表示する強調色が予め決められた1色(例えば赤色)である場合もあるが、上述したように、少し大きめに表示されたり、矢印などの補足情報が表示されたりするようにしているので、ユーザは認識しやすい。また、検索時に表示すべき強調色が電子文書で指定されている場合、オブジェクト検索アプリケーションがその記述を解釈して強調色を変更する機能を有するならば、ユーザは更に認識しやすくなる。
【0117】
図17(c)および(d)は、別の語句による検索結果として、入力フィールド1705に「月」が指定された状態を示している。視認性を考慮せずに作成された電子文書の場合(すなわち、検索されたオブジェクトを矩形で強調表示するようにした電子文書の場合)、強調表示した矩形内に別のオブジェクトが含まれてしまう場合がある。すなわち、図17(c)に示すように、「月」のオブジェクトに基づいて強調表示された領域内1706に別のオブジェクト(「A星」のオブジェクト)が存在しているため、ヒットしたオブジェクトを一意に特定するのが困難となる場合がある。それに対し、本発明の手法を用いて強調表示された枠の形状1707は、当該「月」のオブジェクトの外輪郭の形状を基に生成されているため、検索でヒットしたオブジェクトの識別が容易になる。また、このとき、枠1707は、オブジェクトの形状に基づいて、オブジェクトと同様の形状で且つオブジェクトよりも少し大きめ(例えばオブジェクトより3pix分大きくする)になるように記述することにより、より識別しやすくする。
【0118】
以上説明したように、図7の設定に基づき文書画像を電子文書データに変換する場合、ステップS801〜S805の処理により、文書画像から抽出したキャプション付きのオブジェクトと、検索に使用するメタデータを関連付けて抽出する。図7(c)の対応テーブルによれば、図11のステップS1107において、『写真』のオブジェクトに対しては画像切り出しによる画像パーツ記述を生成する。『線画』、『表』のオブジェクトのうち、キャプション識別子が付与されたオブジェクトの場合には、ステップS1107において、ベクトル変換によるベクトルパス記述を生成する。そしてステップS1109(図12)において、各オブジェクトの属性に依存した透明枠のベクトルパス記述を作成し、キャプション識別子と関連付けて保存する。このように変換された電子文書データをアプリケーションで閲覧・検索する場合、閲覧時には前記透明色によるベクトルパス記述は不可視である。そのため、当該ベクトルパス記述は描画される画像の視認性に影響を与えずに、ページ表示が行われる。一方、検索時にメタデータがヒットした際には、アプリケーションによって前記透明色のベクトルパス記述が強調色で表示される。このベクトルパス記述は対象オブジェクトの属性や形状、他オブジェクトとの位置関係等に応じて制御することができるため、電子文書データ作成側の意図に従った任意形状の強調表示を行わせることが可能である。例えば、対象オブジェクトの外接矩形よりも大き目の矩形の枠を記述することにより、検索時には、対象オブジェクトに相当する個所を一回り大きな枠で囲むことができるので、ユーザにとっては識別しやすくなる。さらに、対象オブジェクトがベクトルパス記述で記述されていた場合には、当該オブジェクトの形状に倣って強調表示がなされるため、ユーザにとって対象オブジェクトの識別が容易になる。
【0119】
すなわち、本実施例によれば、文字以外のオブジェクトをキーワード検索可能な電子文書データの作成処理において、検索対象オブジェクトの形状や状態を判断し、強調表示用の枠の形状を制御している。これにより、ユーザがヒットしたオブジェクトの認識・識別が容易な強調表現が可能となる電子文書データを作成することができる。
【0120】
また、枠のベクトルパス記述を生成する際に、当該オブジェクトのベクトルパス記述および、予め定義された既定形状のベクトルパス記述を参照(再利用)することにより、全ての枠を個別に記述した場合に比べて、データ量を減らすことも可能である。例えば、矩形による枠を生成する際、形状情報(矩形描画コマンド、描画位置・描画サイズ)や枠の透明描画設定、強調表示時の枠の太さや強調色等500byte以上のベクトルパス記述が必要となる。枠形状を複雑に設定すればするほど当然記述量も増加する。例えば、枠の形状を星型に設定すると1Kbyte以上記述する必要がある。一方、既定形状の参照による枠生成を行う場合には、既定形状の定義に同サイズの記述が必要になるが、参照による枠のベクトルパス記述自体は、枠のパラメータ記述のみとなるため、枠の形状に係わらず200〜300byte程度の記述量に抑えられる。枠のパラメータ記述は、例えば、描画位置(絶対位置もしくは参照オブジェクトに対する相対位置)、描画サイズ(拡大率・拡大量)、強調色設定等である。もし1ページに写真が100個含まれる画像に対して、矩形による枠を生成する場合、参照によって枠のベクトルパス記述を生成することで、個別に記述する場合に比べ、1ページ当たり30Kbyte以上のサイズ削減が可能である。
【0121】
以上のように本実施例によれば、電子文書データ内のオブジェクトが有する形状やデータ状態を維持しつつ、検索により検出されたオブジェクトをユーザが認識しやすいように強調表示可能な電子文書データを生成することができる。
【0122】
(実施例2)
実施例1の動作説明では、図7(c)の対応テーブルを用いることで『写真』、『線画』、『表』に対して、個々のオブジェクトのグラフィックス記述を画像パーツとして生成して前景画像に含め、強調表示用の透明ベクトルパス記述をそれぞれ生成していた。本実施例では、『文字』以外のオブジェクト(『写真』、『線画』、『表』)全てを背景画像に含め、キャプション識別子の付与されたオブジェクトに対してのみ透明のベクトルパス記述を生成する例を示す。
【0123】
本実施例では、図3のフォーマット変換部305が図7(d)の対応テーブルに基づいて制御する場合の処理例を示す。処理フローは実施例1(図11)と同様であるため、同じ動作をする処理ステップの説明は省略する。
【0124】
図7(d)の対応テーブルによれば、『写真』オブジェクトは背景画像に含める設定になっている。そのため、図11のステップS1107、S1108において、図4の画像切り出し処理部403は、画像パーツの生成と背景画像からの消去処理を行なわず、ステップS1109へ進む。また、図7(d)の対応テーブルによると、『線画』、『表』オブジェクトの場合は、ベクトル変換は行うが、背景画像からの消去画像は行わない設定になっている。すわなち、ステップS1107において、ベクトル変換処理部402は、オブジェクトのベクトルパス記述を生成し、記憶部211に一時的に記憶する。続くステップS1108では消去処理を行わず、ステップS1109へ進む。
【0125】
ステップS1109(すなわち、図12)において、電子文書記述生成部404は、透明枠のベクトルパス記述を生成する。図12のステップS1202〜ステップS1204において、透明枠の生成方法(ステップS1205またはS1206)を決定する。
【0126】
実施例1では、ステップS1205において、電子文書記述生成部404は、オブジェクトのベクトルパスの参照命令の記述とパラメータ記述(拡大、移動、強調色設定等)を含む透明枠を生成していた。これは、オブジェクトのベクトルパス記述が前景画像中に記述されているため、参照(再利用)が可能であるからである。それに対し、本実施例では、オブジェクトは背景画像に埋め込まれているため、実施例1のようにオブジェクトのベクトルパス記述を参照(再利用)することができない。そこで、参照命令ではなく、ステップS1107で生成したオブジェクトのベクトルパス記述を透明枠のベクトルパス記述に流用し、それにパラメータ記述を追記することで、フォーマット変換制御部406は透明枠の生成を行う。
【0127】
ステップS1206において、電子文書記述生成部404は、実施例1と同様に、既定形状のベクトルパス記述を参照(再利用)して、透明枠のベクトルパス記述を生成する。このとき、当該オブジェクトが『線画』、『表』オブジェクトである場合、ステップS1107で生成されたベクトルパス記述は透明枠生成には不要であるため、記憶部211から削除することが可能である。
【0128】
このように変換された電子文書データに対して検索を行うと、通常時には背景画像と前景画像(文字部)のページが表示される。一方、検索時にメタデータがヒットした際には、透明色のベクトルパス記述がアプリケーションによって強調色で表示され、ユーザにはオブジェクト自体が検索でヒットしたかのように見える。
【0129】
これにより、実施例1と同様に各オブジェクトの属性等に応じて制御された透明枠の強調表示によって、検索結果がユーザに分かりやすい電子文書を作成することができる。さらに、『文字』以外の全てのオブジェクトを背景画像に含めることによって、抽出した写真オブジェクトと背景とをそれぞれ別の圧縮画像データとして保持するよりもファイルサイズの削減をすることができる。なぜなら、そのようなデータは画像情報と圧縮のためのヘッダ情報から構成されており、オブジェクトのデータ数が多くなるとデータ個数分のヘッダ情報が重複して保持されることになるからである。特に、高度な画像圧縮方式ほど、圧縮のためのヘッダ情報が大きくなる傾向がある。したがって、写真等のオブジェクトを多数含む文書画像から電子文書ファイルを生成する場合には、各オブジェクトを別々に圧縮するよりも1枚の画像として圧縮する方が、総データサイズ削減のためには適している。例えば、画像データをJPEG圧縮したストリームとして保持する場合、各ストリームはヘッダ情報として、展開のための量子化テーブル、ハフマンコード等を含む700byte以上のサイズのデータを必ず伴う。もし1ページに写真が100個含まれる画像の場合、写真と背景の両方を1枚の画像データとして圧縮すれば、背景と写真で計101個の画像データを個別に圧縮するよりも、1ページあたり70Kbyte以上のサイズ削減が可能である。
【0130】
また、電子文書データに対して、または、その検索対象である個々の『写真』、『線画』、若しくは『表』の画像切り出しによる画像パーツに対して、その記述方式、及びそれに対するキャプション識別子の付与方式を、ユーザに適時選択させるようにしてもよい。例えば、『写真』、『線画』等のオブジェクトを別の文書等で再利用する可能性が高い場合には、図7(c)のように、『写真』を画像パーツとして切り出して画像解像度を上げ、『線画』のベクトル変換によるベクトルパス記述を行う。そして、各オブジェクトに対し、キャプション識別子を付与した透明枠を生成する。このように、画像パーツとして再利用する可能性のあるオブジェクトに関しては、ベクトルパス記述や高解像度のオブジェクト画像として電子文書に保存する。こうすることで、それらのオブジェクトを他の文書にコピーしたときも、その画像情報をなるべく損なうことなく、利用できるようになる。また、作成する電子文書データのデータサイズが重要視され且つオブジェクト検索できるようにしたい場合には、図7(d)のように、『写真』等のオブジェクトを『背景』に含め、透明枠の記述を生成してキャプション識別子を付加する。こうすることで、画像内のオブジェクトが検索されたかのような表示をすることができ、且つ、画像データの圧縮率向上が図りやすくなるため、データサイズを小さくすることが可能となる。また、オブジェクトの種別に応じて、より詳細に運用することも可能である。
【0131】
なお、このような使い分けをユーザに選択させるのではなく、文書やページ内の『写真』等の数や、各オブジェクトの大きさや特性に応じて、画像切り出しによる画像パーツ記述方式と、キャプション識別子の付与方式を自動的に選択するようにしてもよい。また、その際、文書やページ単位に自動的に切り替えて使用するように構成してもよい。
【0132】
このように、画像切り出しによる画像パーツ記述方式を適切に選択すると同時に、キャプション識別子の付与方式を適宜選択することで、利用目的に応じた電子文書データの作成が可能となる。これにより、ユーザの使いやすい電子文書データが提供されるという効果がある。
【0133】
(実施例3)
実施例3では、キャプション識別子が付与されたオブジェクトに対して透明枠のベクトルパス記述を作成する際に必要となる枠のパラメータ(絶対位置もしくは参照オブジェクトに対する相対位置、サイズもしくは拡大率等)を自動的に算出する方法の例を示す。
【0134】
枠のパラメータを算出する方法について、図18の処理フローを用いて説明する。
ステップS1801において、電子文書記述生成部404は、処理対象のキャプションが付随するオブジェクトの領域サイズを取得する。この情報は記憶部211に保存されている。
【0135】
ステップS1802およびステップS1803において、電子文書記述生成部404は、予め設定されている上限値および下限値とステップS1801で取得したサイズを比較する。オブジェクトのサイズが下限値以上、上限値以下(下限値≦オブジェクトサイズ<上限値)であれば、ステップS1804へ進む。上限値以上もしくは下限値以下である場合にはステップS1805へ進む。
【0136】
ステップS1804において、電子文書記述生成部404は、オブジェクトのサイズに応じた拡大率(例えば、オブジェクトに対して120%拡大等)を算出する。オブジェクトが小さい場合には拡大率を大きく、オブジェクトが大きい場合には拡大率が小さくなるように設定する。これにより、オブジェクトサイズに応じて枠の大きさを可変にできるため、検索の結果を視認しやすい画像を作成することができる。
【0137】
一方、ステップS1805において、電子文書記述生成部404は、透明枠をオブジェクトより一定サイズ大きくなるように拡大量を算出する。オブジェクトサイズが上限値以上の場合と下限値以下の場合で、拡大量を変更することも可能である。例えば、オブジェクトの外接図形より常に10pix分大きくするという設定でも、上限値以上のオブジェクトには5pix分大きく透明枠を生成し、下限値以下の場合には10pix分大きく透明枠を生成するという設定でも構わない。
【0138】
ステップS1806において、電子文書記述生成部404は、ステップS1804やステップS1805で算出した拡大率・拡大量に応じて、透明枠の移動量を算出する。これは、透明枠がオブジェクトの中心から拡大されず、例えばオブジェクトの左上を基準に拡大される場合等に、透明枠の中心にオブジェクトが位置するように透明枠を移動させる必要があるためである。
【0139】
ステップS1807では、電子文書記述生成部404は、算出された拡大率・拡大量、移動量より、枠のパラメータ記述を生成し、図12の処理フローに従って透明枠のベクトルパス記述を作成する。なお、この枠のパラメータ記述は図12のステップS1205やステップS1206で透明枠のベクトルパス記述を生成するときに使用するパラメータ記述である。
【0140】
以上の手順により、オブジェクトサイズに応じて透明枠のサイズ(拡大率・拡大量)を自動で制御することで、図19に示すように、オブジェクトのサイズに応じたサイズの透明枠が生成できる。これにより、オブジェクトサイズに合わせた、分かりやすい強調表示を行える透明枠を生成することが可能となる。
【0141】
(実施例4)
実施例3では、オブジェクトサイズに応じてパラメータ記述(拡大率・拡大量、移動量等)を生成する方法について述べた。実施例4では、生成されたパラメータ記述が画像外にはみ出してしまう場合の制御方法について述べる。図20、図21を用いて本実施例の動作フローを説明する。
【0142】
ステップS2001において、電子文書記述生成部404は、オブジェクトに応じたパラメータ記述(拡大率・拡大量、移動量等)を生成する。本処理は、実施例3に記載の方法(図18)を用いる。図21(a)は、ステップS2001によって得られたパラメータ記述2102を基にして、透明枠2101を描画した例である。パラメータ記述2102中において、‘‘transform=scale(1.5,1.5) translate(−100、−100)’’と拡大率と移動量が設定されている。
【0143】
ステップS2002において、電子文書記述生成部404は、生成されたパラメータ2102で枠を描画した際に、文書内に枠が収まるかどうかをチェックする。文書内に収まる場合は、ステップS2006へ進み、パラメータ記述として生成する。一方、文書外にはみ出してしまう場合にはステップS2003へ進む。図21(a)では、文書左側と下側において透明枠が文書外に描画されることになるため、ステップS2003以降の処理を行う。
【0144】
ステップS2003において、電子文書記述生成部404は、枠の縦横比を保存したまま文書内に枠が収まるように拡大率・拡大量を下げる。この時、予め設定している拡大率・拡大量の下限値(実施例2で利用した下限値でも構わない)を下回らない程度に調整する。例えば、図21(b)のように‘‘transform=scale(1.2,1.2) translate(−40、−40)’’と拡大率・移動量を変更してパラメータ記述2104を生成し、透明枠2103を描画する。
【0145】
ステップS2003で所望のパラメータ記述を得られなかった場合、ステップS2004において、電子文書記述生成部404は、枠の縦横比を保持せずに拡大率・拡大量の変更を行う。本処理でもステップS2003と同様に、下限値を下回らない程度の補正を加える。生成されるパラメータ記述としては、例えば、‘‘transform=scale(1.2,1.4) translate(−40、−80)’’である。この記述は、縦横比を保存せず拡大率・移動量を変更させたパラメータ記述2106であり、これを用いて透明枠2105を描画させる。
【0146】
ステップS2004で所望のパラメータ記述を得られなかった場合、ステップS2005において、電子文書記述生成部404は、透明枠をオブジェクトに外接する図形(例えば矩形等)に強制的に変更し、枠の補足説明用の描画記述を追加する設定に変更する。例えば、図21(d)に示すように、透明枠2107を、オブジェクトの外接矩形もしくはそれよりも少し大きめな矩形として生成する。さらに、透明枠を強調するような追加記述2108,2109を記述するパラメータ記述2110を生成する。
【0147】
ステップS2006において、電子文書記述生成部404は、ステップS2001〜S2005によって修正されたパラメータを、文書内に収まる透明枠を記述するためのパラメータ記述として更新する。
【0148】
以上の処理により、透明枠が文書外にはみ出すことなく、ユーザに分かりやすい強調表示を自動で行うことが可能となる。
【0149】
(実施例5)
実施例1では、ベクトルパス記述で描画されるオブジェクトのうち、オブジェクトサイズが小さいもの、あるいは隣接オブジェクトが存在しているものに対しては、オブジェクトのベクトルパス記述を再利用して透明枠を生成していた。本実施例では、さらに、オブジェクトのベクトルパス記述が透明枠に利用できるかどうかを判定して、透明枠の生成方法を制御する。
【0150】
図22を用いて本実施例の動作フローを説明する。なお、実施例1の図12と同じステップに関しては同じステップ番号を与えている。また、図23(a)の電子文書2300を入力例として説明を行う。電子文書2300にはキャプションが付与されたオブジェクト2301、2302、2303が含まれている。これらのオブジェクトはどれもベクトルパス記述によって生成されているものとする。
【0151】
図22のステップS1201〜ステップS1204において、電子文書記述生成部404は、オブジェクトのベクトルパス記述を再利用して透明枠を生成するのか、既定形状のベクトルパス記述を再利用して生成するのかを判定する。処理の詳細については、実施例1の図12と同じであるため省略する。
【0152】
ステップS2201において、電子文書記述生成部404は、オブジェクトのベクトルパス記述から輪郭部(外輪郭)のベクトルパス記述が抽出可能かを判定する。輪郭部の抽出が可能な場合はステップS2202へ進み、抽出ができない場合はステップS1206へ進む。これは、オブジェクトが複雑な形状であった場合、オブジェクト内部の描画まで再現してしまうと、検索時に強調された枠がヒットしたオブジェクト上に重畳表示されてしまい、ヒットしたオブジェクトが何であるかが分からなくなってしまうことが考えられる。そこで、オブジェクトの一部である輪郭部のみを透明枠生成に利用することで、視認性を向上させる。
【0153】
ステップS2202において、電子文書記述生成部404は、オブジェクトのベクトルパス記述の一部である輪郭部の記述のみを参照(再利用)して透明枠のベクトルパス記述を生成する。図23のオブジェクト2302は輪郭抽出が容易なオブジェクトであるため、オブジェクト2302の輪郭部のベクトルパス記述を参照(再利用)し、図23(b)の透明枠2304を生成する。
【0154】
一方、ステップS2201で、当該オブジェクトの輪郭部の抽出が困難であると判定された場合は、ステップS1206において、電子文書記述生成部404は、予め定義されている既定形状のベクトルパス記述を参照(再利用)して透明枠を生成する。図23(a)のオブジェクト2303は輪郭抽出が困難であると判断されたため、既定形状である矩形のベクトルパス記述を参照(再利用)して、図23(c)の透明枠2305が生成される。
【0155】
ステップS1207において、電子文書記述生成部404は、ステップS2202およびステップS1206で生成された透明枠に補足の情報を付与するためのベクトルパス記述を行う。特に、ステップS2201において、当該オブジェクトの輪郭部の抽出が困難と判断された場合には、ここで、追加情報が記述される。これは、強調表示のための透明枠を既定形状によって作成したため、オブジェクトが小さい場合や、近傍に他のオブジェクトが存在している場合等、検索でヒットしたオブジェクトが何(どちら)であるかが識別できなくなってしまう。そこで、矢印等の追加記述であったり、オブジェクトのベクトルパス記述をそのまま再利用して、ヒットしたオブジェクト自体に重ならない位置に透明枠を生成したりすることで、分かりやすい表示が必要になる。図23(c)のオブジェクト2303の透明枠2305の補足説明用として、矢印2306やオブジェクト自体の拡大図(2307)が記述される。
【0156】
ステップS1208では、キャプション識別子と生成された透明枠の関連付け処理が行われる。
【0157】
以上の処理で生成された電子文書2300に対して、「望遠レンズ」というキーワードで検索を行った結果について簡単に説明する。オブジェクト2303にはアンカー文字列「図3」が関連付けされる。このアンカー文字列は、本文中に書かれた文字列「図3」と一致しているため、オブジェクト2303に対するキャプション文字列として「望遠レンズ」が抽出される。そしてキャプション文字列「望遠レンズ」に対するキャプション識別子と同一のキャプション識別子が付与された透明枠2305〜2307が検索結果としてヒットし、強調表示される。このように、オブジェクトのベクトルパス記述を透明枠として再利用可能かどうか調べ、有効であればオブジェクトのベクトルパス記述の一部(輪郭部)を再利用して透明枠を生成する。無効であれば、既定形状によるベクトルパス記述に加え、補足情報として矢印やオブジェクトの拡大図等を当該オブジェクトの近傍に配置することで、検索時に検索結果の認識・識別が容易な電子文書を作成することができる。
【0158】
(実施例6)
実施例1〜5では、オブジェクト形状に依存しない、既定形状のベクトルパス記述を再利用した透明枠を生成していた。本実施例では、オブジェクトの形状を解析して透明枠の形状を制御することによって、よりオブジェクトの形状に合った透明枠を生成する手法について説明する。
【0159】
図24を用いて、本実施例の処理の流れを説明する。なお、実施例1の図12および、実施例5の図22と同じ処理に関しては同じステップ番号を与え、処理の説明は省略する。
【0160】
ステップS2401において、電子文書記述生成部404は、オブジェクトの解析処理を行う。オブジェクトの解析処理には、オブジェクトの矩形度や円形度の解析、傾斜度の算出、又はオブジェクトの色彩情報の解析等が含まれる。
【0161】
ステップS2402において、電子文書記述生成部404は、オブジェクト形状に合った透明枠のベクトルパス記述を生成する。この処理の一例を図25に示す。なお、本実施例の説明では、予め定義されている既定形状は「矩形」「円形」「六角形」の3種類であるとして説明を行う。
【0162】
図25のステップS2501において、電子文書記述生成部404は、オブジェクトの矩形度の判定処理を行う。所定のしきい値以上(例えば矩形度80%以上等)であれば、既定形状として「矩形」データ2510が選択され、しきい値未満であればステップS2502へ進む。
【0163】
ステップS2502において、電子文書記述生成部404は、オブジェクトの円形度の判定処理を行う。所定のしきい値以上(例えば円形度70%以上等)であれば、既定形状として「円形」データ2511が選択される。しきい値未満の場合は、既定形状として「六角形」データ2512が選択される。
【0164】
ステップS2503において、電子文書記述生成部404は、前記ステップで選択された既定形状データを再利用して透明枠のベクトルパス記述を生成する。図26に結果の一例を示す。入力電子文書2600には『写真』属性の付与されたオブジェクト2601〜2603が含まれている。オブジェクト2601は矩形度が高いため、ステップS2501において、「矩形」データが選択され、「矩形」のベクトルパス記述を参照した透明枠のベクトルパス記述2604が生成される。オブジェクト2602は楕円形に近い形状をしているため「円形」データが、オブジェクト2603は「六角形」データが選択され、透明枠のベクトルパス記述2605,2606がそれぞれ生成される。
【0165】
ステップS2504において、電子文書記述生成部404は、図24のステップS2401で算出されたオブジェクトの傾斜度を用いて、オブジェクトによりフィットした透明枠を生成するための回転パラメータを生成する。図26のオブジェクト2603は傾きのあるオブジェクトとして認識されるため、透明枠もオブジェクトと同様に傾きを加えることにより、透明枠2606が生成される。
【0166】
ステップS2505において、電子文書記述生成部404は、図24のステップS2401で得られたオブジェクトの色彩情報を基に、強調表示されたときにできるだけ見やすくなるように配色を決定し、強調色を設定する。すなわち、オブジェクトの色彩とは異系色の色を強調色として設定する。これにより、オブジェクトと透明枠の強調色が同系色にまとまってしまって、結果が分かりにくくなることを防ぐことができる。図26の入力例2600では、オブジェクトは黒色であるため、透明枠の強調色は例えば赤色と設定すればよい。
【0167】
本実施例では、既定形状を「矩形」「円形」「六角形」と限定して説明を行ったが、既定形状はこれに限ったものではなく、星形や雲形等でも構わない。また、解析項目や、既定形状の選択の方法もこの限りではない。
【0168】
以上の処理によって、生成時のファイルサイズを抑えつつ、検索時に強調表示される枠が、より対象オブジェクトの形状にフィットしたものとなるため、ユーザに分かりやすい強調表現を行うことができる。
【0169】
(実施例7)
実施例1〜6では、オブジェクト領域の位置・大きさや、オブジェクトを画像処理して得られる情報等を基にしてオブジェクト領域に記述する最適な透明枠を自動で生成していた。本発明の実施例7では、ユーザが、記述される透明枠の形状や線幅等を自由に設定することができる仕組みを提供する。
【0170】
図27(a)は、図1のMFP100に装備された図2の操作部203に表示される電子文書データの目的をユーザに選択させるためのユーザインタフェース(UI)画面の一例である。UI画面2701上には、強調表示用の透明枠の生成方法を自動で決定するように設定するためのボタン2702と、ユーザが設定するためのボタン2703がある。また、選択内容をキャンセルするためのCancelボタン2704、確定するためのOKボタン2705も配置されている。「自動」ボタン2702が選択された場合は実施例1〜6の手順に従い、オブジェクト毎に最適な形状をした透明枠を生成する。一方、「ユーザ設定」ボタン2703が押下された場合は、全てのオブジェクトに対し、ユーザが設定した形状により透明枠を生成する。
【0171】
図27(b)は、強調表示用の全オブジェクトに共通する透明枠形状をユーザが設定するためのUI画面の一例である。UI画面2706には透明枠の基本形状を選択するためのボタン2707と、線幅を選択するためのボタン2708、強調色を選択するためのボタン2709がある。ユーザはUI画面2706上の選択ボタン2707〜2709を操作して透明枠の記述の仕方を選択し、OKボタン2711を押す。これにより、データ処理部218内の制御部(不図示)が、当該UIを介してユーザが指定した透明枠の記述に関する情報をフォーマット変換部305へ伝達する。Cancelボタン2710が押されてユーザ設定が為されなかった場合は、デフォルトの設定情報が制御部によってフォーマット変換部305へ送信される。フォーマット変換部305は、受信した情報を基に、ステップS1109(S1206)において透明枠のベクトル記述を行う。このとき、オブジェクトを特定できるようにするために、図18の処理手順で、オブジェクトのサイズに応じて、当該選択された基本形状のサイズを変更して透明枠のベクトルパス記述を生成するのが望ましい。
【0172】
以上により、「自動」動作時には、ユーザにとって、検索時にヒットしたオブジェクトの認識および識別が容易な電子文書が作成される。一方「ユーザ設定」動作時には、既定形状として1つのベクトルパス記述が定義され、全ての枠生成時に参照するため、ファイルサイズが小さくなる。また、オブジェクト毎に枠の生成の仕方や枠形状の判定処理を行わないため、出力電子文書作成時の処理パフォーマンスの向上も見込める。
【0173】
(その他の実施形態)
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
【技術分野】
【0001】
本発明は、文書画像からオブジェクト検索可能な電子文書データを生成するための画像処理装置、画像処理方法、及びプログラムに関する。
【背景技術】
【0002】
従来、文書画像中の文字以外のオブジェクト(例えば、写真、図面、線画、表等)を利用しやすくするために、当該オブジェクトを検索できるようにする技術が知られている。以下の説明において、特に記載がない限り、オブジェクトは、文字を除くオブジェクトのことを示すものとする。
【0003】
特許文献1では、文書画像から図やグラフなどのオブジェクトを抽出し、当該オブジェクトの近傍にキャプション文字列(オブジェクトを説明する文字列)があるかどうか判断する。キャプション文字列がある場合、該オブジェクトに当該キャプション文字列を関連付けて、オブジェクトを検索できるようにしている。
【0004】
また、オブジェクトに隣接するキャプションが図番(例えば、「図1」や「第1図」等)である場合、一般的な文書画像では、オブジェクトの説明のために同じ図番の文字列が本文にも記載されている。すなわち、キャプションに記載されている図番と同一表現が本文内にも記述されている。特許文献2には、キャプション中の図番と本文中の図番との間にリンクを自動的に生成し、ハイパーテキスト化する技術が開示されている。この技術において、例えば、オブジェクトに隣接するキャプションに図番「図1」が含まれ、本文中に「図1は、AAAである」という記載がある場合、キャプション「図1」と本文中の「図1」との間に、ハイパーリンクが生成される。また、特許文献2には、オブジェクトとそれに関連する本文との間にリンクを自動的に生成し、ハイパーテキスト化された文書を生成することも記載されている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開平11−306197号公報
【特許文献2】特開平10−228473号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
なお、メタデータが関連付けられた各オブジェクトをJPEG圧縮等して、1つの電子文書に格納しておけば、データ量の少ない1つの電子文書として生成できる。このような電子文書をアプリケーション側で利用する場合、キャプション文字列を検索キーワードとして、該メタデータからオブジェクトを検索することが可能となる。
【0007】
一方、キャプション文字列をメタデータとしてオブジェクトに付与し、文字以外のオブジェクトを検索できるようにした電子文書において、キーワード検索をおこなった際に、検索結果のオブジェクトが強調表示されるようにすることが望まれている。
【0008】
しかしながら、検索対象となるオブジェクトは写真、図、表等であり、色・形状ともに多種多様である。従って、オブジェクトが元々有する色・形状のために、強調表示が目立たず、ユーザが検索でヒットしたオブジェクトを特定するのが困難な場合がある。例えば、検索されたオブジェクトの輪郭を赤色の外接矩形で着色するような強調方式であるときに、赤色を多く含む矩形の写真のオブジェクトが検索されると、検索結果の強調表示が写真と同様の色で写真領域に接触しているので目立たなくなってしまう。すなわち、ユーザにとっては、検索でヒットしたオブジェクトを特定することが非常に困難になってしまう。また、オブジェクトのサイズが小さかったり、複数のオブジェクトが隣接して存在したりしている場合等には、検索でヒットしたオブジェクトの識別が直観的にできなくなってしまうため、検索効率の向上が見込めないという課題もある(図17(a)、(c)参照)。
【0009】
そこで、文字以外のオブジェクトをキーワード検索可能な電子文書データの作成処理において、検索時に検索対象オブジェクトが有する形状やデータ状態を維持しつつ、ユーザが認識しやすい強調表示を行う電子文書データ作成方法が必要となっていた。
【課題を解決するための手段】
【0010】
本発明に係る画像処理装置は、入力された画像からオブジェクトを抽出するオブジェクト抽出手段と、前記オブジェクトに関するメタデータを抽出するメタデータ抽出手段と、前記オブジェクトの形状に応じた形状で枠のベクトルパス記述を記述するか、既定形状に応じた形状で枠のベクトルパス記述を記述するかを判定する判定手段と、前記判定手段で前記オブジェクトの形状に応じた形状で記述すると判定した場合は、前記オブジェクトの形状に応じた形状で記述された枠のベクトルパス記述を生成し、前記判定手段で前記既定形状に応じた形状で記述すると判定した場合は、前記既定形状に応じた形状で記述された枠のベクトルパス記述を生成する枠生成手段と、前記入力された画像のデータと、前記メタデータが関連付けられた前記枠のベクトルパス記述とを含む電子文書を生成する文書生成手段と、を備え、前記電子文書のキーワード検索が行われた場合、当該キーワードに一致するメタデータが関連付けられている前記枠のベクトルパス記述にしたがって強調表示されることを特徴とする。
【0011】
本発明に係る画像処理装置は、入力された画像からオブジェクトを抽出するオブジェクト抽出手段と、前記オブジェクトに関するメタデータを抽出するメタデータ抽出手段と、前記オブジェクトの形状の外輪郭に相似する形状で記述された枠のベクトルパス記述を生成する枠生成手段と、前記入力された画像のデータと、前記メタデータが関連付けられた前記枠のベクトルパス記述とを含む電子文書を生成する文書生成手段と、を備え、前記電子文書のキーワード検索が行われた場合、当該キーワードに一致するメタデータが関連付けられている前記枠のベクトルパス記述にしたがって強調表示されることを特徴とする。
【0012】
本発明に係る画像処理装置は、入力された画像からオブジェクトを抽出し、当該オブジェクトについての情報である領域情報を取得する手段と、前記抽出されたオブジェクトを前記取得された領域情報に応じた形状で囲む透明枠のベクトルパス記述を生成する手段と、前記入力された画像から、前記生成された透明枠のベクトルパス記述を含む電子文書データを生成する手段とを備え、前記生成された透明枠のベクトルパス記述は、前記生成された電子文書データからオブジェクトが検索され検索結果として検出されたときに、当該枠を強調表示するための強調色のパラメータ記述を含むことを特徴とする。
【発明の効果】
【0013】
本発明によれば、検索により検出されたオブジェクトをユーザが認識しやすいように強調表示可能な電子文書データを生成するための画像処理装置、画像処理方法、及びプログラムを提供することができる。
【図面の簡単な説明】
【0014】
【図1】画像処理システムの構成例を示すブロック図である。
【図2】MFPの構成例を示すブロック図である。
【図3】データ処理部の構成例を示すブロック図である。
【図4】フォーマット変換部の構成例を示すブロック図である。
【図5】入力イメージデータに対して領域分割を行った結果の例を示す図である。
【図6】入力イメージデータに対して出力される電子文書データの例を示す図である。
【図7】フォーマット変換部の制御情報である対応テーブルの例を示す図である。
【図8】画像処理システムで実行される処理全体の概要を示すフローチャートである。
【図9】4ページからなる入力イメージデータに対して領域分割を行った結果の例を示す図である。
【図10】メタデータ処理部の処理を説明するフローチャートである。
【図11】フォーマット変換部の処理を説明するフローチャートである。
【図12】電子文書記述生成部の処理を説明するフローチャートである。
【図13】グラフィックスデータの例を示す図である。
【図14】入力イメージデータに対して出力される電子文書データの例を示す図である。
【図15】入力イメージデータに対して出力される電子文書データの例を示す図である。
【図16】電子文書データを閲覧・検索するアプリケーションの画面表示例である。
【図17】電子文書データを閲覧・検索するアプリケーションの画面表示例である。
【図18】本発明の実施例3におけるパラメータ記述生成処理を説明するフローチャートである。
【図19】本発明の実施例3における処理結果例を示す図である。
【図20】本発明の実施例4におけるパラメータ記述生成処理を説明するフローチャートである。
【図21】本発明の実施例4における処理結果例を示す図である。
【図22】本発明の実施例5における図4のベクトル変換処理部402の処理を説明するフローチャートである。
【図23】本発明の実施例5における処理結果例を示す図である。
【図24】本発明の実施例6におけるベクトル変換処理部の処理を説明するフローチャートである。
【図25】本発明の実施例6におけるベクトル変換処理部の処理を説明するフローチャートである。
【図26】本発明の実施例6における処理結果例を示す図である。
【図27】本発明の実施例7におけるユーザインタフェース(UI)画面の一例を示す図である。
【発明を実施するための形態】
【0015】
(実施例1)
以下、本発明を実施するための最良の形態について図面を用いて説明する。
【0016】
[画像処理システムの構成]
図1は本実施例の画像処理システムの構成を示すブロック図である。
【0017】
図1において、オフィスA内に構築されたLAN102には、複数種類の機能(複写機能、印刷機能、送信機能等)を実現する複合機であるMFP(Multi Function Peripheral)100が接続されている。LAN102は、プロキシサーバ103を介して外部ネットワーク104にも接続されている。クライアントPC101はLAN102を介してMFP100からの送信データを受信したり、MFP100が有する機能を利用したりする。例えば、クライアントPC101は、印刷データをMFP100へ送信することで、その印刷データに基づく印刷物をMFP100で印刷することもできる。尚、図1の構成は一例であり、オフィスAと同様の構成要素を有する、複数のオフィスがネットワーク104上に接続されていても良い。また、ネットワーク104は、典型的にはインターネットやLANやWANや電話回線、専用デジタル回線、ATMやフレームリレー回線、通信衛星回線、ケーブルテレビ回線、データ放送用無線回線等で実現される通信ネットワークである。これは、データの送受信が可能なものであれば、何でも良い。また、クライアントPC101、プロキシサーバ103の各種端末はそれぞれ、汎用コンピュータに搭載される標準的な構成要素を有している。例えば、CPU、RAM、ROM、ハードディスク、外部記憶装置、ネットワークインタフェース、ディスプレイ、キーボード、マウス等である。
【0018】
図2は本実施例の画像処理装置であるMFP100の詳細構成を示す図である。
MFP100は、画像入力デバイスであるスキャナ部201と、画像出力デバイスであるプリンタ部202と、CPU205等で構成される制御ユニット204と、ユーザインタフェースである操作部203等を有する。制御ユニット204は、スキャナ部201、プリンタ部202、操作部203と接続し、一方では、LAN219や一般の電話回線網である公衆回線(WAN)220と接続することで、画像情報やデバイス情報の入出力を行うコントローラである。CPU205は、制御ユニット204に含まれる各ユニットを制御する。RAM206はCPU205が動作するためのシステムワークメモリであり、画像データを一時記憶するための画像メモリでもある。ROM210はブートROMであり、システムのブートプログラム等のプログラムが格納されている。記憶部211はハードディスクドライブで、システム制御ソフトウェア、画像データを格納する。操作部I/F207は操作部(UI)203とのインターフェース部で、操作部203に表示するための画像データを操作部203に対して出力する。また、操作部I/F207は操作部203から本画像処理装置の使用者が入力した情報を、CPU205に伝える役割をする。ネットワークI/F208は本画像処理装置をLAN219に接続し、パケット形式の情報の入出力を行う。モデム209は本画像処理装置をWAN220に接続し、データの復調・変調を行うことにより情報の入出力を行う。以上のデバイスがシステムバス221上に配置される。
【0019】
イメージバスI/F212はシステムバス221と画像データを高速で転送する画像バス222とを接続し、データ構造を変換するバスブリッジである。画像バス222は、例えば、PCIバスやIEEE1394で構成される。画像バス222上には以下のデバイスが配置される。ラスターイメージプロセッサ(RIP)213はPDL(ページ記述言語)コードを解析し、指定された解像度のビットマップイメージに展開する、いわゆるレンダリング処理を実現する。この展開をする際には、各画素単位あるいは又は各領域単位に属性情報が付加されることになる。これを像域判定処理と呼ぶ。像域判定処理により、画素毎にあるいは領域毎に、文字(テキスト)、線(ライン)、グラフィクス、イメージ等といったオブジェクトの種類を示す属性情報が付加される。例えば、PDLコード内のPDL記述のオブジェクトの種類に応じて、RIP213から像域信号が出力され、その信号値で示される属性に応じた属性情報が、オブジェクトに対応する画素や領域に関連づけて保存される。したがって画像データには、関連づけられた属性情報が付属している。デバイスI/F214は、信号線223を介して画像入力デバイスであるスキャナ部201を、信号線224を介して画像出力デバイスであるプリンタ部202を、それぞれ制御ユニット204に接続する。デバイスI/F214は、画像データの同期系/非同期系の変換を行う。スキャナ画像処理部215は、入力画像データに対し補正、加工、編集を行う。プリンタ画像処理部216は、プリンタ部202に出力すべきプリント出力画像データに対して、プリンタ部202に応じた補正、解像度変換等を行う。画像回転部217は入力された画像データが正立するように回転を行い出力する。データ処理部218については後述する。
【0020】
[処理部の構成]
次に、図3を用いて、図2のデータ処理部218の詳細説明を行う。データ処理部218は、領域分割部(領域抽出部)301、属性情報付加部302、文字認識部303、メタデータ処理部304、及びフォーマット変換部305を備えて構成される。データ処理部218は、スキャナ部201でスキャンしたイメージデータ300を入力し、各処理部301〜305で処理を行うことにより、電子文書データ310を生成して出力する。すなわち、データ処理部218は、文書生成を行う。
【0021】
領域分割部301には、図2のスキャナ部201でスキャンされたイメージデータ、あるいは記憶部211に保存されているイメージデータ(文書画像)が入力される。そして、領域分割部301は、入力されたイメージデータから文字、写真、図、表等ページ内に配置されたオブジェクトの領域(オブジェクト領域)を抽出するために、データ中の画素の抽出・グループ化等の処理を行う。さらに領域分割部301は、オブジェクト領域の属性情報及びサイズ、並びにオブジェクト領域の近傍に他のオブジェクトが存在するか否かなどの情報を抽出し、当該情報を領域情報として記憶部211に保存する。
【0022】
この際の領域抽出方法(オブジェクト抽出方法、領域分割方法)としては公知の方法を用いればよい。一例を説明すると、まず、入力画像を2値化して2値画像を生成し、2値画像を低解像度化して間引き画像(縮小画像)を作成する。例えば、1/(M×N)の間引き画像を作成する際には、2値画像をM×N画素毎に分割し、M×N画素内に黒画素が存在すれば縮小後の対応する画素を黒画素とし、存在しなければ白画素とすることにより、間引き画像を作成する。次に、間引き画像において黒画素が連結する部分(連結黒画素)を抽出して当該連結黒画素に外接する矩形を作成していく。文字画像サイズに近い矩形(1文字の矩形)が並んでいる場合や、縦横のどちらかが文字画像サイズに近い矩形(数文字が繋がった連結黒画素の矩形)で短辺の近くに同様の矩形が並んでいる場合は、1つの文字行を構成している文字画像である可能性が高い。この場合は矩形同士を結合して、1つの文字行を表す矩形を得る。そして、1つの文字行を表す矩形の短辺の長さがほぼ同じで、列方向にほぼ等間隔に並んでいる矩形の集合は、本文部である可能性が高いので結合して本文領域を抽出する。また、写真領域や図領域や表領域は、文字画像よりも大きいサイズの連結黒画素により抽出される。その結果、例えば、図5(a)の501から505に示す領域が抽出されることとなる。なお、各領域の属性は、後述するように、そのサイズや縦横比や黒画素密度や、連結黒画素内部に含まれる白画素の輪郭追跡結果等に基づいて判断される。
【0023】
属性情報付加部302は、領域分割部301で分割された領域毎に属性を付加する。図5(a)に示されたイメージを入力イメージデータの例として処理動作を説明する。領域505は、その領域内の文字列が所定の量の文字数や行数を有し、文字列が段落の形態を有するなど、総合的な点から本文であると判定され、『本文』の属性が付加される。残りの領域については、まず、属性情報付加部302は、文字画像サイズに近い矩形が含まれている領域か否かを判断する。特に、文字画像が含まれている領域は、領域内で文字画像の矩形が周期的に現れる。そのため、矩形が現れる周期性の有無により領域内に文字が含まれている領域であるか否かを判断することができる。その結果、領域501及び領域504は文字が含まれる領域としてこれらの領域のメタデータに『文字領域』の属性を付加する。ただし、これらの領域は、所定の量の文字数及び行数を有さず、文字列が段落の形態を持たないなどの点から、『本文』の属性は付加されないことになる。
【0024】
一方、それ以外の領域については、領域の大きさが非常に小さければ『ノイズ』と判定する。また、画素密度が小さい連結黒画素について、その内部の白画素輪郭追跡を行ったときに、その白画素輪郭の外接矩形が整然と並んでいる場合は当該領域を『表』と判断し、整然と並んでいない場合は『線画』と判断する。それ以外の画素密度の高いものは絵や写真であるとして『写真』の属性を付加する。
【0025】
更に、本文でないと判断された文字領域が、『表』、『線画』又は『写真』の近傍(領域の上または下)に存在する場合、当該文字領域は、当該『表』、『線画』又は『写真』の領域を説明する文字領域であると判断され、『キャプション』の属性が付加される。尚、『キャプション』の属性が付加された領域は、そのキャプションにより説明されている『表』、『線画』又は『写真』の領域を特定できるように、当該説明されている領域と関連付けて記憶部211などの記憶手段に保存される。
【0026】
また、本文でないと判断された文字領域が、本文部の文字画像より大きく、本文部の段組とは異なる位置にあれば、当該文字領域に『見出し』の属性を付加する。また、当該文字領域が、本文部の文字画像より大きく、本文部の段組の上部に存在すれば、属性を『小見出し』とする。更に、当該文字領域が、本文部の文字画像のサイズ以下の文字画像であり、原稿の下端部や上端部に存在すれば『ページ』(又は、「ページヘッダ」若しくは「ページフッタ」)の属性が付加される。また、文字領域として判断されたが、『本文』、『見出し』、『小見出し』、『キャプション』、又は『ページ』のどれにも当てはまらなかった場合、『文字』の属性が付加される。
【0027】
以上のような属性情報付加処理を行うと、図5(a)の例では、領域501には『見出し』、領域502には『表』、領域503には『写真』、領域504には領域503に付随する『キャプション』、領域505には『本文』の属性が付加されることとなる。
【0028】
文字認識部303は、文字画像を含む領域(『文字』、『本文』、『見出し』、『小見出し』、又は『キャプション』領域)について、公知の文字認識処理を実行する。文字認識部303は、文字認識処理によって得られた文字コード列を文字情報として対象領域と関連付けて記憶部211に保存する。
【0029】
領域分割部301、属性情報付加部302、及び文字認識部303における処理により抽出された、領域の位置や大きさや領域属性の情報、ページの情報、及び文字認識結果の文字情報(文字コード情報)等は、記憶部211に保存される。図5(b)は、図5(a)の入力イメージデータに対して処理を行った場合に記憶部211に保存される情報の例を示す。なお、図5(a)の説明および図5(b)に示された例では省略されているが、表内の文字画像の領域に関しては、『表内文字』の属性を付加して文字認識処理を行って、図5(b)のように情報を保存しておくのが望ましい。
【0030】
メタデータ処理部304は、属性情報付加部302で検出されたキャプションが付随するオブジェクト(『写真』、『線画』、『表』等のオブジェクト)に対し、当該オブジェクトを検索するための情報としてメタデータを関連づけて記憶部211に保存する。
【0031】
本実施例では、当該オブジェクトのキャプションに記載されている文字列と、当該キャプションに含まれる文字(単語)と同じ文字(単語)が記載されている本文中の文章とが、オブジェクト検索用のメタデータの中で関連付けられる。
【0032】
また、本実施例では、オブジェクト検索用のメタデータとして使用する文字列を決定するために、キャプション用識別子を用いるものとする。当該識別子は、キャプションが付随するオブジェクトと、キャプションおよび本文の文字情報とを対応づけるためのものである。キャプション用識別子として、オブジェクトを識別するためのID(識別情報)、キャプションや本文の文字情報の格納位置を指定する位置情報(記録位置を示すアドレスやポインタ)、参照情報(例えばXMLPathやURL)等を用いることが可能である。本実施例では、1ページまたは複数ページを入力とする一連の処理において、キャプション付きのオブジェクトを一意に識別するためのIDを用いるものとし、例えば、通し番号のようなものを使用することとする。
【0033】
そこで、まず、メタデータ処理部304では、属性情報付加部302で検出されたキャプションが付随するオブジェクトに対して、それらを一意に特定する為のキャプション識別子を作成し、この識別子を当該オブジェクトに付与する処理を行う。
【0034】
次に、文字認識部303が出力したキャプションおよび本文の文字情報から、オブジェクトに対する説明文、キーワード等に相当するメタデータ文字列を抽出して、これに対して、対応するキャプション識別子を関連付けて記憶部211に保管する処理を行う。この際に、キャプションが付随するオブジェクトとメタデータ文字列の組み合わせに対して、その対応がわかるようにユニークなIDを付加することで、その対応を表現する。
【0035】
これにより、メタデータ処理部304は、属性情報付加部302で検出されたキャプションが付随するオブジェクトに対し、そのメタデータを関係づけて、当該関係づけた情報を記憶部211に保管する。
【0036】
フォーマット変換部305は、領域分割部301、属性情報付加部302、文字認識部303、及びメタデータ処理部304から得られた情報を用いて、入力されたイメージデータ300を所定の電子文書フォーマットへ変換する。当該電子文書フォーマットとして、例えば、PDF、SVG,XPS、OfficeOpenXML等が考えられる。フォーマット変換で生成される電子文書は、グラフィックス等によるページ表示情報(表示用画像等)と、文字等の意味記述による内容情報(メタデータ等)を含む。
【0037】
図4はフォーマット変換部305の構成例を示すブロック図である。画像フィルタ処理部401は入力された画像データに対して、平坦化やスムージング、エッジ強調、色量子化、2値化等のフィルタ処理を施す。ベクトル変換処理部402は、画像データ(例えば、『線画』属性が付与された領域に対応する部分の画像)をベクトルパス記述のグラフィックスデータ(ベクトルデータ)へと変換する。ベクトルデータへ変換する技術は公知のベクトル化技術を用いることが可能である。画像切り出し処理部403は、画像データ(例えば、『写真』属性が付与された領域に対応する部分の画像)を、画像パーツのグラフィックスデータ(例えばJPEGデータ)として切り出す。電子文書記述生成部404は、オブジェクト検索時に、検索結果を特定・強調する際に表示される枠などのグラフィックス記述(ベクトルパス記述)を生成する。電子文書記述出力部405は、グラフィックスデータ、意味記述、及び枠のベクトルパス記述を所定フォーマット形式で記述し、電子文書を生成する。ここで、グラフィックスデータは、ベクトル変換処理部402および画像切り出し処理部403から出力されるデータである。意味記述は、文字認識部303やメタデータ処理部304で得た文字情報やメタデータ等である。枠のベクトルパス記述は、電子文書記述生成部404で生成される記述である。フォーマット変換制御部406は、図2の記憶部211に保管されている領域情報(位置、大きさ、属性)411、領域内の文字情報412、及びメタデータ413に基づいて、イメージデータ300中の各領域を適切な処理部401〜405へと配分する。そして、フォーマット変換制御部406は、各処理部401〜404から出力されたデータが電子文書記述出力部405で統合されるように、フォーマット変換部305全体の制御を行う。
【0038】
以下に401〜405の各処理部の処理内容例について説明する。
画像フィルタ処理部401は、画像に対して、平坦化、スムージング、エッジ強調、色量子化、2値化等の公知の画像フィルタ処理を施す処理部であり、ベクトル変換処理部402や画像切り出し処理部403で処理を行う際に、必要に応じて画像処理を行う。具体的な説明は省略するが、ベクトル変換処理を行う際に適した画像処理や、画像切り出し処理を行う際に適した画像処理が行われるものとする。
【0039】
ベクトル変換処理部402は、線画や表罫線等の画像領域の対象画素集合を、ベクトルパス描画関数によるグラフィックス描画表現、すなわちベクトルパス記述データへと変換する。
【0040】
ベクトル変換処理の一例を説明する。まず変換対象の画像を2値画像データに変換する。例えば、変換対象の画像がグレースケール画像の場合は、画像フィルタ処理部401を用いて各画素の輝度を所定しきい値と比較して2値化することによって2値画像データを得る処理を行う。なお、変換対象の画像が複数色を含む場合は、色成分毎に分解して色毎の2値画像データを生成するようにしてもよい。次に2値画像データ内で連結する黒画素集合に対して輪郭追跡を行って、集合毎に輪郭の座標点列を取得する。続いて輪郭の座標点列を複数の区間に適応的に分割し、各々の区間を直線関数や曲線関数で近似する。曲線関数の例としてはスプライン曲線、ベジェ曲線等がある。最終的に、始点、直線および曲線、終端の1組からなるベクトルパス記述へと変換する。
【0041】
なお、ベクトル化手法は上記手法に限るものではなく、他の公知のベクトル化手法を用いてもよい。例えば、輪郭を関数近似する代わりに、線図形の芯線を関数近似するベクトル化手法も良く知られている。
【0042】
画像切り出し処理部403は、入力画像中の対象領域に対し、領域内の画素データのみを用いた個別の画像パーツデータを生成する。本処理の際に、領域の特性にあわせて画素データ種別や圧縮方法を変更してもよい。例えば『線画』や『文字』属性の領域に対しては、画像フィルタ処理部401を用いて色毎に2値画像(1枚または複数枚の2値画像)へ変換した後に、MMR等公知の2値圧縮方式でデータ化するともに、各2値画像に対応する色情報を付加したデータを生成する。一方、『写真』属性の領域に対しては、自然画の圧縮に適したJPEGやJPEG2000方式を用いて圧縮する。
【0043】
なお、ベクトル変換処理部402によるベクトル変換と、画像切り出し処理部403による画像圧縮は、領域の属性に応じて、どちらか一方を行うように設定してもよいし、両方を行うように設定してもよい。また、本文や見だしやキャプション等の文字領域に関しては、文字認識結果の類似度が高ければ、当該文字認識結果の文字コード、文字のサイズ情報、及び文字の位置情報等を記述し、当該文字領域部分のグラフィックスを再現するようにしてもよい。
【0044】
電子文書記述生成部404では、電子文書の閲覧時には表示されないが、オブジェクト検索時に、検索結果を特定・強調する際に表示される枠などのグラフィックス記述(ベクトルパス記述)を生成する。その際、該オブジェクトの属性やサイズ、他オブジェクトとの関係性などを解析し、当該オブジェクトに最適な強調表示用の枠を生成する方法を決定する。枠の生成方法としては、当該オブジェクトのベクトルパス記述を参照する方法と、予め定義された既定形状(例えば、矩形や円形等)のベクトルパス記述を参照する方法がある。また、透明枠に対し、オブジェクトの検索結果の認識・識別効率を高めるための補足形状のベクトルパス記述を電子文書に追加することも可能である。当該補足形状の例は、透明枠の位置を指し示す矢印表記や、メタデータ文字列などである。
【0045】
電子文書記述出力部405は、グラフィックスデータ、意味記述、及び透明枠のベクトルパス記述を所定フォーマット形式で記述し、電子文書を生成する。ここで、グラフィックスデータは、ベクトル変換処理部402及び画像切り出し処理部403から出力されたデータである。意味記述は、文字認識部303やメタデータ処理部304で得た文字情報やメタデータ等である。透明枠のベクトルパス記述は、電子文書記述生成部404で生成された記述である。
【0046】
生成される電子文書データ310の例を図6に示す。図6の例は、図5(a)のイメージデータ500の例を処理した場合に、記憶部211に保存された図5(b)のようなデータに基づいて、SVG(Scalable Vector Graphics)フォーマットで記述を行った場合の例を示す。図6の記述601〜605は、それぞれ図5(a)の領域501〜505に対するグラフィックス記述である。ここで、記述601、604および605は文字コードによる文字描画記述の例である。記述602はベクトル変換された表の枠のベクトルパス記述である。記述603は切り出し処理された写真画像を貼り付ける記述の例である。また、記述606は写真オブジェクト503に対する強調表示用の透明枠(詳細は後述する)のベクトルパス記述である。キャプションが付随する透明枠オブジェクト606には、キャプション識別子(caption_id)608として‘‘1’’が付与されている。なお、図5(b)と図6の例で、座標値X1、Y1等記号で記述されている部分は実際には数値である。また、記述607はメタデータの記述例である。メタデータの記述607には、キャプション604の文字列と本文の文字列とに基づいて抽出した文字列610として「AAA」が記述され、キャプション識別子608と同じ識別子609が関連づけられている。なお、図6の例では、単語「図1」を含む本文の個所「・・・図1は、AAAである。・・・」という文章から、単語「AAA」を抽出してメタデータ610としたが、単語に限るものではなく、文章(例えば「図1」を含む1文)をそのままメタデータとして付与してもよい。また、図6の例では、本文から抽出した文字列をメタデータとしているが、これに限るものではなく、キャプションの文字列から抽出した単語をメタデータとして更に追加するように構成してもよい。
【0047】
なお、ここではSVGを例として説明したが、出力フォーマットはSVGに限定されるものではなく、PDF、XPS、Office Open XML、その他のPDL系のデータ形式等に変換してもよい。
【0048】
フォーマット変換制御部406における変換処理制御の例について以下に説明する。
【0049】
フォーマット変換部305において、各領域に施すべき変換処理内容は、領域の属性によって異なる。例えば、ベクトル変換処理は文字や線画のように白黒あるいは数色で構成された図形に対しては好適であるが、写真のように階調性のある画像領域には不適である。このように、各領域の属性に従った適切な変換を行うためには、図7のような対応テーブルをあらかじめ設定しておけばよい。
【0050】
例えば、図7(a)の設定に従えば、『文字』、『線画』および『表』属性の領域に対してはベクトル変換処理が、『写真』属性の領域に対しては画像切り出し処理が行われる。
【0051】
さらに、図7の対応テーブルには、該当領域の画素情報をイメージデータ300から消去する処理の有無が記載されている。例えば、図7(a)の設定に従って『文字』属性の領域をベクトルパス記述データに変換する場合を説明する。『文字』属性は、消去処理「あり」と指示されているので、イメージデータ300上において、当該変換されたベクトルパスに覆われる部分に対応する画素をその周辺色で塗りつぶす処理を行う。同様に、『写真』属性の領域を矩形の画像パーツとして切り出す際には、イメージデータ300上において、当該切り出された領域に対応する領域範囲内を、その周辺色等で塗りつぶす処理を行う。
【0052】
このような消去処理を行う目的としては、各領域に対する処理が終了した後(塗りつぶし処理終了後)のイメージデータ300を『背景』の画像パーツデータとして利用できることである。この背景用の画像データ(背景画像)には、領域分割処理で抽出された領域以外の部分(例えばイメージデータ300中の下地にあたるような画素)が残っている。電子文書データ記述の際には、ベクトル変換処理部402や画像切り出し処理部403で得られたグラフィックスデータ(前景画像)を背景画像パーツデータ(背景画像)の上に重畳して表示するような記述を行う。これにより、背景画素(下地の色)の情報欠落がなくなり、かつ冗長性のないグラフィックスデータを構成することが可能となる。
【0053】
図7(b)は対応テーブルの別の例である。図7(b)に従えば、『文字』領域部分に対しては、2値による画像切り出し処理と、イメージデータ300からの画素消去処理が行われるが、それ以外の属性の領域に対しては、ベクトル化処理や画像切り出し処理は行われない。すなわち、処理対象外の画素(『写真』や『線画』や『表』属性の領域内の画素情報)は、背景画像パーツデータ内に残っており、この背景画像上に『文字』の画像パーツを重畳するように記述される。
【0054】
また、図7(c)、図7(d)は別の対応テーブルの例であるが、これらの詳細な説明は後述する。
【0055】
なお、図7(a)〜(d)のような対応テーブルを予め複数用意しておき、出力電子文書データの用途(使用目的)や文書の内容に応じて選択するようにしても良い。例えば、図7(a)の対応テーブルに基づいた出力は、オブジェクトの大半がベクトルパス記述へと変換されているため、拡大縮小時の画質に優れているので、グラフィックエディタ等の再利用用途に好適である。また、図7(b)の対応テーブルは、文字画像を文字色ごとに個別の2値画像を生成して可逆圧縮することで、文字画像部分は高品位に再生することができ、かつ、それ以外を背景画像としてJPEG圧縮することでデータサイズの圧縮率を高くすることができる。したがって、図7(b)の場合は、圧縮率を高くしつつ文字画像が読みやすいデータを作成したい場合に適している。
【0056】
[処理のフロー]
次に、本実施例の画像処理システムで実行する処理全体の概要を、図8のフローチャートを用いて説明する。図8に示すフローチャートは、図2のデータ処理部218(図3の各処理部301〜305)によって実行されるものとする。なお、本実施形態では、CPU205が記憶部211に格納されたコンピュータプログラムを読み取り実行することによって、データ処理部218(図3の各処理部301〜305)として機能するものとするが、これに限るものではない。例えば、データ処理部218(図3の各処理部301〜305)を、電子回路等のハードウェアで実現するように構成してもよい。
【0057】
図8は、図1のMFP100で入力された複数ページのイメージデータを、複数ページからなる電子文書データに変換する処理のフローチャートである。尚、複数ページのイメージデータとしては、例えば、図9(a)のページ画像901〜904が入力されるものとする。図9(a)は、4ページで構成される文書画像の一例であり、画像901〜904は順に1〜4ページとする。以下、図8のフローチャートの各説明を行う。
【0058】
ステップS801において、領域分割部301は、入力された1ページ分のイメージデータから領域(オブジェクト)を分割(抽出)する。例えば、図9(a)のイメージデータ901(1ページ目)に対しては領域905及び906を抽出する。
【0059】
ステップS802において、属性情報付加部302は、ステップS801で抽出された各領域に属性を付加する。図9(a)の1ページ目の例では、領域905には『写真』、領域906は『キャプション』の属性を付加する。尚、このキャプションの領域906には、付随する領域が領域905であるという情報も付加する。また、2ページ目の例では、領域907、908、及び911には『線画』の属性が、領域909、910、及び912には『キャプション』の属性が付加される。また、これらのキャプション909、910、及び912には、付随する領域がそれぞれ907、908、及び911であるという情報も関連付けて記憶部211に保存されている。
【0060】
ステップS803において、文字認識部303は、ステップS802で文字(本文、キャプション、見出し、小見出し等)の属性を付加した領域に対して文字認識処理を実行し、その結果を文字情報として対象領域に関連付けて保持する。1ページ目の例では、文字である『キャプション』属性が付加された領域906に対して文字認識処理を行って、文字情報『図1』が得られ、領域906に関連付けを行う。
【0061】
ステップS804において、データ処理部218は、ステップS801〜S803の情報抽出処理を全てのページに対して行った否かを判断する。全てのページを処理していればステップS805へ進む。未処理のページがあればステップS801から繰り返す。
【0062】
図9(a)の画像901〜904に対して、ステップS801〜S804の処理を行った結果として、抽出される領域の位置や大きさ等の情報、ページの情報、領域の属性、及び領域の文字情報の例を図9(b)に示す。また、領域913〜915はそれぞれ2〜4ページ目から抽出された『本文』属性の領域である。これらの情報は記憶部211に保存されている。
【0063】
ステップS805において、メタデータ処理部304は、メタデータ抽出処理およびメタデータ付与処理を行う。ステップS805でメタデータ処理部304が実行する処理の詳細については、図10のフローチャートを用いて説明する。
【0064】
図10のステップS1001において、メタデータ処理部304は、記憶部211に保存された領域情報において、『キャプション』属性が付与された領域のうち、本メタデータ処理が行われていないものを一つ選出する。すなわち、未処理のキャプション領域があれば、当該未処理キャプション領域を処理対象として選択してステップS1002に進む。キャプション領域が存在しないか、すべて処理済みであった場合にはメタデータ処理を終了する。図9(a)の画像901〜904を入力とした場合、キャプション領域906が最初に選出され、909,910,912と続いて選択される。
【0065】
ステップS1002において、メタデータ処理部304は、当該処理対象のキャプションが付随するオブジェクトに対してキャプション識別子を付与し、さらに記憶部211に当該付与したキャプション識別子用のメタデータ記憶領域を確保する。ここではキャプション906が付随する写真オブジェクト905に対し、キャプション識別子「1」が付与され、記憶部211に当該キャプション識別子「1」用のメタデータ記憶領域が確保されるものとする。
【0066】
ステップS1003において、メタデータ処理部304は、キャプション領域内の文字認識情報から、アンカー文字列およびメタデータ文字列を抽出する。アンカー文字列とは、元の文書中でこのキャプションが付随するオブジェクトを識別するための文字情報である。メタデータ文字列とは、オブジェクトを説明するための文字情報である。オブジェクトに付随するキャプションには、アンカー文字列のみが記載される場合、メタデータ文字列のみが記載される場合、さらに両方が記載される場合がある。例えば、アンカー文字列は「図」や「Fig」等、特定の文字列と、番号や記号との組み合わせ表現された図番号である場合が多い。そこで、それら特定の文字列を登録したアンカー文字列用辞書を予め用意しておき、キャプション文字列を該辞書と比較してアンカー部分(アンカー文字列+数記号)を特定すればよい。そして、キャプション領域の文字列のうち、アンカー部分以外の文字列をメタデータ文字列として判断すればよい。例えば、「図1カメラ」というキャプションの場合には、「図1」がアンカー文字列にあたり、「カメラ」がメタデータ文字列に当たる。
【0067】
ステップS1004において、メタデータ処理部304は、ステップS1003でキャプション領域からメタデータ文字列が抽出されたか否かを判断する。メタデータ文字列が抽出された場合はステップS1005に進み、メタデータ文字列が抽出されなかった場合はステップS1006に進む。
【0068】
ステップS1005において、メタデータ処理部304は、キャプション領域から抽出されたメタデータ文字列を、ステップS1002で付与されたキャプション識別子用の記憶領域に保存し、ステップS1006に進む。すなわち、キャプション領域から抽出されたメタデータ文字列を当該キャプション識別子と関連付ける。
【0069】
ステップS1006において、メタデータ処理部304は、ステップS1003でキャプション領域からアンカー文字列が抽出されたか否かを判断し、アンカー文字列が抽出された場合はステップS1007に進む。一方、アンカー文字列が抽出されなかった場合はステップS1001に戻って、未処理のキャプション領域があるかどうか判断する。
【0070】
図9(a)の入力例の1ページ目901では、キャプション領域906からはアンカー文字列として「図1」が抽出されるがメタデータ文字列は抽出されないのでステップS1004からS1006、S1007へと進む。
【0071】
ステップS1007において、メタデータ処理部304は、当該抽出されたアンカー文字列と同等の文字列表現を、記憶部211に格納された『本文』領域の文字情報から検出する。同等の文字列表現を検出した場合は、ステップS1008に進む。検出されなかった場合はステップS1001に戻って未処理のキャプション領域があるかどうか判断する。
【0072】
ステップS1008において、メタデータ処理部304は、ステップS1007で本文から検出された文字列表現の周辺から、オブジェクトのメタデータに相当する文字列を抽出する。図9(a)の入力例では、本文領域915から、アンカー文字列「図1」906と同じ文字列916が検出されるので、その周辺の文字列「図1のカメラで撮影した。」に形態素解析等を行い、単語「カメラ」がメタデータ文字列として抽出される。このメタデータ文字列の判断には自然言語処理の形態素解析等で単語切り機能を用いればよい。なお、本実施形態では単語を抽出してメタデータ文字列とする例を示したが、これに限るものではなく、例えば、アンカー文字列を含む1文をそのままメタデータ文字列として用いるようにしても構わない。
【0073】
ステップS1009では、メタデータ処理部304は、ステップS1008で抽出したメタデータ文字列を、前記キャプション識別子用の記憶領域に追加保存する。すなわち、本文から抽出されたメタデータ文字列をキャプション識別子と関連付ける。そしてS1007に戻って、本文の別の部分に同様のアンカー文字列の記述があるかどうか繰り返し、あれば順次追加保存していく。したがって、1つのキャプション識別子に対して、複数のメタデータ文字列が関連づけられる場合もある。
【0074】
図8に戻って、ステップS806において、フォーマット変換部305は、イメージデータ300および、記憶部211に保存された図9(b)に示すような情報に基づいて、電子文書データ310への変換を行う。なお、図4で説明したように、フォーマット変換部305は、フォーマット変換制御部406の制御により、各領域に施すべき変換処理方法を記した対応テーブルに従って、図8のイメージデータ300内の領域に対してフォーマット変換処理を実行する。ここでは、図7(c)の対応テーブルを用いて変換を制御する際のフォーマット変換処理のフローを、図11のフローチャートを用いて説明する。
【0075】
図11のステップS1101において、フォーマット変換制御部406は、処理ページ番号のカウンタnを1で初期化する。
【0076】
ステップS1102において、フォーマット変換制御部406は、図4の領域情報411中のnページ目のデータの中から、未処理の領域のうちの一つを処理対象領域として選出する。
【0077】
ステップS1103において、フォーマット変換制御部406は、当該処理対象領域の属性と対応テーブルと照らし合わせて属性毎に処理を分岐する。本例では、図7(c)の対応テーブルを用いて判断するので、文字か否かの判断が行われる。すなわち、属性が文字(『本文』、『キャプション』、『ページ』、又は『見出し』)の場合はステップS1104に進み、属性が『写真』、『線画』、又は『表』の場合はステップS1106に進む。
【0078】
ステップS1104において、図7(c)の対応テーブルの設定に従って、画像切り出し処理部403が、イメージデータ300中の当該処理対象の『文字』属性領域に対応する部分の2値画像(2値画像パーツ)を作成する。作成された2値画像パーツは、例えばPNGフォーマット等で圧縮されて図2の記憶部211に保存される。なお、この2値画像パーツ中の文字線に相当する画素には、別途イメージデータ300中の該当文字画素の色より取得された文字色情報が付与され、それ以外の画素には透明色が付与される。
【0079】
ステップS1105において、図7(c)には文字領域の消去処理指示が設定されているため、フォーマット変換制御部406は、図4のイメージデータ300中の文字部分に対応する画素を周囲の画素色で塗りつぶす消去処理を行う。
【0080】
一方、ステップS1103で、『写真』、『線画』、又は『表』と判定された領域に対し、ステップS1106では、フォーマット変換制御部406が、当該処理対象領域にキャプション識別子が付与されているか否かを調べる。付与されていればステップS1107へ進み、付与されていなければステップS1110に進む。
【0081】
ステップS1107において、図4の画像切り出し処理部403とベクトル変換処理部402が、図7(c)の対応テーブルの設定に従って、グラフィックス記述生成を行う。すなわち、『写真』属性が付与された領域に対しては、画像切り出しによる画像パーツ記述が生成され、『線画』又は『表』属性が付与された領域に対しては、ベクトル変換によるベクトルパス記述が生成される。
【0082】
ステップS1108において、図7(c)の対応テーブルの設定に従って、フォーマット変換制御部406が、図4のイメージデータ300中の『写真』、『線画』、又は『表』に対応する画素情報を、周囲の画素色で塗りつぶす消去処理を行う。
【0083】
ステップS1109において、フォーマット変換制御部406は、図7(c)の対応テーブルの設定に従って、電子文書記述生成部404に、当該処理対象領域を囲む枠に相当するベクトルパス記述データを生成させる。更に、ステップS1109では、当該生成した枠のベクトルパス記述データに対して、当該処理対象領域のキャプション識別子を付与し、その枠のベクトルパス記述データの描画色として透明色を割りあてるものとする。このようにして生成されたベクトルパス記述データは、図2の記憶部211に保存される。ステップS1109で電子文書記述生成部404が実行する透明枠のベクトルパス記述データ生成処理の詳細については、図12のフローチャートを用いて説明する。
【0084】
図12のステップS1201において、電子文書記述生成部404は、当該処理対象のキャプションが付随するオブジェクトについての情報である領域情報を取得する。領域情報としては、例えば、領域の位置や大きさ、領域の属性、隣接オブジェクト情報等である。これらの情報は記憶部211に保存されている。
【0085】
ステップS1202において、電子文書記述生成部404は、当該処理対象領域がベクトルパス記述で表現されているかどうかを判定する。ベクトルパス記述で表現されている場合(例えば、『線画』又は『表』属性が付与された領域の場合)、ステップS1203へ進み、ベクトルパス記述以外の場合(例えば、『写真』属性が付与された領域の場合)、ステップS1206へ進む。例えば、図9(a)のページ画像901〜904を入力文書とした場合を説明する。『線画』属性が付与されているオブジェクト907,908,及び911に対する処理のときはステップS1203へ進み、『写真』属性が付与されたオブジェクト905に対する処理のときはステップS1206へ進む。
【0086】
ステップS1203において、電子文書記述生成部404は、当該処理対象領域のサイズを所定の閾値と比較する。処理対象領域のサイズが所定の閾値より小さい場合(例えば、図9(a)の911の場合)はステップS1205に進み、所定サイズ以上のサイズの場合(例えば、図9(a)の907又は908の場合)はステップS1204へ進む。すなわち、処理対象領域のサイズに応じて、処理が分岐する。
【0087】
ステップS1204において、電子文書記述生成部404は、処理対象領域の近傍に他のオブジェクトが存在しているかどうかを判定する。他のオブジェクトが存在している場合(例えば、図9(a)のオブジェクト907、908)はステップS1205に進み、存在しない場合はステップS1206に進む。すなわち、処理対象領域の近傍に他のオブジェクトが存在しているか否かに応じて処理が分岐する。
【0088】
このように、S1202、S1203及びS1204の処理によれば、領域情報(処理対象領域の属性情報及びサイズ、及び処理対象領域の近傍に他のオブジェクトが存在するか否か)に応じて以降の処理が分岐する。当該分岐の結果、後述する透明枠のベクトルパス記述の記述方法が変更される。透明枠とは、オブジェクトを囲む透明色の枠である。
【0089】
ステップS1205において、電子文書記述生成部404は、図11のステップS1107で生成された、当該処理対象のオブジェクトのベクトルパス記述データを参照(再利用)することによって、透明枠のベクトルパス記述を生成する。透明枠のベクトルパス記述データは、オブジェクトのベクトルパス記述データへの参照命令、枠の拡大、枠の位置の移動、枠の太さ、枠の強調色等のパラメータ記述を含むデータである。このとき、枠のサイズが、当該オブジェクトのベクトルパス記述よりも数ピクセル分大きくなるように、拡大のパラメータを設定する。なお、オブジェクトのベクトルパス記述を参照する際、オブジェクトの外輪郭を表す部分のベクトルパス記述を参照するように設定するのが望ましい。すなわち、枠のベクトルパス記述データは、オブジェクトの形状に相似する形状を有し、且つ、オブジェクトのサイズよりも数ピクセル分大きいサイズで記述されることになる。透明枠のベクトルパス記述データは、当該枠を強調表示する際に点滅表示させるためのパラメータを含んでも良い。また、枠のベクトルパス記述データから枠を通常描画するときの色として、透明色を割りあてる。透明色であるため、当該枠のベクトルパス記述の描画結果は、通常の表示を行う際は、描画されたページの視認性に影響を与えない。なお、あるオブジェクトが検索結果として検出された際に、当該オブジェクトを囲む透明枠に強調色を付する、又は当該枠を太くする若しくは点滅表示等することによって、当該枠を前述のパラメータ記述に応じて強調表示することができる。当該強調表示の結果、検索により検出されたオブジェクトを検索結果として認識することができる。
【0090】
ここで電子文書データの記述例を示す図15を参照して、図9のオブジェクト907に対して生成された透明枠のベクトルパス記述の例を説明する。オブジェクト907のベクトルパス記述である記述1512には、当該記述を参照するためのID(vec_img1)が付与されて記述されている。透明枠のベクトルパス記述である記述1515は、この参照用IDを参照する記述(useコマンド)とパラメータ記述を用いて記述されている。すなわち、透明枠のベクトルパス記述は、オブジェクトのベクトルパス記述データを参照(利用)することによって生成される。透明枠のベクトルパス記述の詳細は後述する。
【0091】
一方、ステップS1206において、電子文書記述生成部404は、予め定義されている既定形状(例えば、矩形や円形、六角形等)のベクトルパス記述データを参照(利用)することによって、透明枠のベクトルパス記述データを生成する。すなわち、透明枠のベクトルパス記述データは、既定形状のベクトルパス記述データへの参照命令のパラメータ記述を含む。透明枠のベクトルパス記述は、当該処理対象のオブジェクトの外接図形よりも少し大きめ(例えば、オブジェクトの外接図形周囲に5pix分のスペースを空ける等)となるように記述する。枠のベクトルパス記述データの描画色として透明色を割りあてる。このように透明枠のベクトルパス記述がオブジェクトの外接図形よりも少し大きめに記述されることによって、当該枠のベクトルパス記述の描画結果を強調表示した際に、当該枠に囲まれたオブジェクトを視認しやすくなる。
【0092】
例えば図9のオブジェクト905に対する透明枠のベクトルパス記述を生成する場合は、図15の1505で既定形状として定義されている矩形のベクトルパス記述(参照用ID:frame_square)を利用する。そして、この参照用IDを参照する記述(useコマンド)とパラメータ記述を用いて、透明枠のベクトルパス記述1511を生成する。透明枠のベクトルパス記述の詳細は後述する。
【0093】
以上の処理によれば、処理対象領域の属性情報及び領域情報に応じて、透明枠のベクトルパス記述の記述方法(S1205又はS1206)が選択される。すなわち、領域情報等に応じた形状で透明枠のベクトルパス記述を生成する。その結果、検索の結果検出されたオブジェクトを囲む枠を強調表示した場合に、当該オブジェクトを視認しやすくすることができる。
【0094】
なお、領域のサイズに応じて透明枠のベクトルパス記述の記述方法を変更することによって、当該領域(オブジェクト)が小さい場合であっても、どのオブジェクトが検索により検出されたしたのかを認識しやすいように枠を強調表示することができる。
【0095】
また、領域の近傍に他のオブジェクトが存在しているか否かに応じて透明枠のベクトルパス記述の記述方法を変更するため、近傍に他のオブジェクトが存在している場合であっても、検索により検出されたオブジェクトを他のオブジェクトと誤認しにくくなる。
【0096】
ステップS1207において、電子文書記述生成部404は、ステップS1205及びS1206で生成された枠(又はオブジェクト)をさらに補足的に強調させる(指し示す)ための追加の透明形状のベクトルパス記述を生成する。当該透明形状の例としては、オブジェクト位置を分かりやすく指し示すための矢印等の記述が考えられる。このとき、追加記述で必要となる矢印等の形状のベクトルパス記述を予め既定形状の一つとして記述し、透明枠のベクトルパス記述に当該ベクトルパス記述の参照を含めることができる。そして、当該枠を強調表示する際に、当該矢印等の透明形状も同様に強調表示する。透明形状を強調表示するための強調色を指定するパラメータについての記述が、当該透明形状のベクトルパス記述に含まれているのが望ましい。また、補足的強調表示を行うために、透明枠のベクトルパス記述から当該オブジェクトに付与されたメタデータ(文字コード)を参照し、当該オブジェクトを説明するための文字列を強調色で描画してもよい。
【0097】
ステップS1208において、電子文書記述生成部404は、当該生成した枠のベクトルパス記述データに対して、当該処理対象領域のキャプション識別子を付与する。生成された枠のベクトルパス記述データは図2の記憶部211に保存される。
【0098】
図11に戻って、ステップS1110において、フォーマット変換制御部406は、nページ目において未処理の領域があるかを判断する。未処理領域が残っている場合は、ステップS1102に戻ってステップS1102〜S1109の処理を繰り返す。nページ目の全領域が処理済であればステップS1111に進む。
【0099】
ステップS1111において、フォーマット変換制御部406は、図4のイメージデータ300に対して、画像切り出し処理部403で切り出した領域の部分をその周辺色で塗りつぶす処理を行い、背景画像パーツを生成する。すなわち、ステップS1105でイメージデータ300から画像パーツとして切り出された『文字』領域の画素(文字線に相当する画素)が、その周囲の色で塗りつぶされて消去される。S1108でイメージデータ300から画像パーツとして切り出されたベクトルパス記述データとして切り出された『写真』、『線画』及び『表』領域の画素が、その周囲の色で塗りつぶされて消去される。また、それ以外の領域(例えば、下地部分等)は未処理のまま残されている。本例ではこの背景画像パーツを、更に1/2の解像度に低解像度化してからJPEG圧縮を施した画像データに変換し、図2の記憶部211に保存するものとするが、スムージング等他の画像処理を施して別形式による圧縮をおこなってもよい。
【0100】
図13(a)及び(b)は、図9(a)のイメージデータに対してステップS1101〜S1111の処理を行った場合に生成される画像パーツおよびベクトルパス記述データの例である。図13(a)は1ページ目のイメージデータ901を、図13(b)は2ページ目のイメージデータ902を処理した結果である。符号1301,1304はステップS1111で生成される背景画像パーツの例である。背景画像パーツ1301,1304は、文字画像の部分と切り出されたオブジェクト部分が周辺色で塗りつぶされて消去されているので、それ以外のすべてを含む1枚の画像で構成されている。符号1302,1305はステップS1104で生成される文字部分の2値画像パーツ、および、ステップS1107で生成されるグラフィックス記述データの例である。文字部分の2値画像パーツに関しては、文字色の情報も別途保存しているので、文字線の部分は文字色の画素、それ以外の白い部分は透明色の画素で構成されることになる。なお、本図の画像パーツ1302及びグラフィックス記述1305の外枠にあたる破線は図示の為の便宜的なものであって、実際の画像パーツは文字部やグラフィックス記述データの部分を囲む最小の矩形範囲で構成されていてもよい。符号1303,1306は、ステップS1109(図12の各処理)で生成される枠のベクトルパス記述データの例である。本図では枠のベクトルパス記述は便宜上黒の太線で書かれているが、実際には透明色によるベクトルパス記述であるので不可視である。また、ベクトルパス記述1303,1306の外枠にあたる破線は図示の為の便宜的なものであり実際にデータとしては存在しない。
【0101】
ステップS1112において、フォーマット変換制御部406は、電子文書記述出力部405に、現在処理中のページを所定のフォーマットで電子文書ページ310として記述する処理を行わせる。図9(a)の1ページ目の画像901に対して記述される電子文書ページの例を図14に示す。図14の1400は電子文書ページをSVG(Scalable Vector Graphics)フォーマットで記述した例である。電子文書ページ1400は、背景画像データ記述1401、文字部分の2値画像パーツ記述1402、透明枠のベクトルパス記述1403、及びベクトルパス記述1404で構成される。背景画像データ記述1401は、図11のステップS1111で生成された記述である。文字部分の2値画像パーツ記述1402は、ステップS1104で生成された記述である。透明枠のベクトルパス記述1403は、ステップS1109で生成された記述である。ベクトルパス記述1404は、図12のステップS1206の処理の際に参照される既定形状を定義した記述である。
【0102】
ベクトルパス記述1403では、<use xlink:href=“frame_square”>と記述することで、後述するベクトルパス記述1404で定義された既定形状を参照(再利用)する。そして<transform=“translate(100,100)scale(2)”>という記述により、描画位置とサイズを指定することで、透明色で描画される枠を生成している。また、ベクトルパス記述1404中の、<id=“frame_square”>は、既定形状として定義されるテンプレートのIDを参照するための記述であり、<stroke=“transparent”>は、枠を透明色で描画させるための記述である。即ち、<d=”M440,608 L2040,608 L2040,1880 L440,1880 L440,608 s”>でベクトルパス記述された形状の図形を透明色で描画することを意味している。規定形状のベクトルパス記述は、矩形に限るものではなく、円形、六角形等自由に定義することが可能であり、複数用意しておいて使い分けてもよい。記述1401〜1403はそれぞれ図13(a)の符号1301〜1303に相当するグラフィックス描画記述であり、それらが記述1401から順番に重畳描画されるようなグラフィックスデータとして構築されている。すなわち、背景画像が一番下に描画され、その上に文字画像が描画され、更にその上に透明枠が描画されることになる。また、透明枠のベクトルパス記述(グラフィックス記述)1403にはキャプション識別子1405が付与されている。
【0103】
ステップS1113において、フォーマット変換制御部406は、処理中のページ番号nが最後のページ番号である全ページ数に等しいかどうか判定する。等しい場合は全ページの変換処理が終了したと判断してステップS1115へ進む。nの方が全ページ数より小さい場合はステップS1114に進み、nに1を加算し、ステップS1102に戻り次ページに対する処理を繰り返す。
【0104】
最後に、ステップS1115において、電子文書記述出力部405は、ステップS1112で記述された各ページの電子文書ページをまとめて一つにするとともに、メタデータの記述を付与して出力電子文書データ310を作成する。すなわち、電子文書記述出力部405は、先に説明した透明枠のベクトルパス記述等を含む電子文書データを生成する。
【0105】
図15は出力電子文書データの記述例である。出力電子文書データ1500において、記述1501〜1504はそれぞれ1〜4ページ目の電子文書ページ記述である。記述1505は透明枠用の矩形のベクトルパス記述であり、<id=‘‘frame_square’’>の記述により参照用IDが割り当てられている。また、記述1506は追加記述用に定義された矢印のベクトルパス記述であり、<id=‘‘frame_arrow’’>の記述により参照用IDが割り当てられている。記述1507はメタデータの記述例であり、キャプション識別子とメタデータ文字列が対応付けられて記述されている。記述1512〜1514は図11のステップS1107で生成されたオブジェクトのベクトルパス記述である。これらのオブジェクトのベクトルパス記述には、透明枠のベクトルパス記述から参照されるIDが自動的に割り当てられる。例えば、オブジェクト907のベクトルパス記述1515には、<id=‘‘vec_img1’’>の記述により参照用IDが割り当てられている。記述1511および記述1515〜1517は透明枠のベクトルパス記述であり、キャプション用識別子‘‘caption_id’’により一意に識別される。そして、それぞれの透明枠は、<use xlink:href=‘‘参照用ID’’>という記述により、既定形状のベクトルパス記述や、オブジェクトのベクトルパス記述を参照している。また、描画位置とサイズを指定するパラメータ記述も併記される。メタデータ記述1507中のメタデータ文字列「カメラ」1508はキャプション識別子1509と関連付けて記述されており、このキャプション識別子は1ページ目の透明枠のベクトルパス記述1511に付与されたキャプション識別子1510と同じものである。このようにキャプション識別子1509と1510を介して、メタデータ1508と透明枠のベクトルパス記述1511とが関連付けられているので、後述するように、キーワード「カメラ」で検索を行った場合、透明ベクトルパス記述1511を検索できる。
【0106】
以上が、本発明の実施例1における電子文書データ作成処理に関する説明である。
【0107】
[オブジェクトの検索]
次に、本実施例で作成された電子文書データ310に対し、前述したメタデータをキーワードとしてオブジェクトを検索する例について図16を用いて説明する。
【0108】
図16(a)〜(d)は、オブジェクトを検索するためのアプリケーション(以下、オブジェクト検索アプリケーション)として、図1のクライアントPC101や、その他のクライアントPC等で実行されるソフトウェアの表示画面(GUI)の一例である。このようなソフトウェアとしては、例えば、生成する文書のフォーマットがPDFである場合は、Adobe Reader(商標)等を用いることができる。
【0109】
オブジェクト検索アプリケーションは、入力フィールド1601に検索語句として入力された文字列が、電子文書データに付与されたメタデータと一致する場合、該メタデータに関連づけられたキャプション識別子を有するベクトルパス記述を強調表示する。
【0110】
図16(a)は、図5(a)の文書をアプリケーションで表示させたときに表示画面の例である。符号1601は、検索する語句を入力(指定)するための入力フィールドである。符号1602は、検索する語句を入力した後に検索を実行するための検索実行ボタンである。符号1603は、図6の電子文書データ600の描画結果を表示した領域である。その表示内容はグラフィックス記述601〜605の描画結果である。
【0111】
図16(b)は、検索を実行させた結果を示している。符号1604は、検索する語句として「AAA」を指定した状態を示している。図6の電子文書データ600ではメタデータ記述607中の文字列「AAA」(610)、および文字描画記述605中の文字列「AAA」が、検索語句と一致するので、アプリケーションは検索ヒット時の動作を行う。ここでは、メタデータ記述607中の文字列610がヒットした場合の動作例について説明する。
【0112】
オブジェクト検索アプリケーションは電子文書600内から、検索語句と一致するメタデータのキャプション識別子609を検出し、さらに、これと同一の識別子608が付与されたグラフィックス記述606を検出する。そして、ページ表示の際、該当部分が強調されるように対象グラフィックス記述を描画する。本例では、グラフィックス記述が画像の貼りつけであるため、当該画像オブジェクトの回りに強調色、例えば赤色で枠を加えて表示を行うものとする。図16(b)中の符号1605は、検索を実行した結果としてヒットしたオブジェクトの部分が、赤色の枠により強調されている状態を示している。
【0113】
図16(c)は、図9(a)の4ページからなるイメージデータ901〜904に対して、図7(c)の対応テーブルに基づいて図11のフローチャートの処理を行うことで生成された図15の電子文書データ1500の1ページ目を表示した様子を示している。その表示内容は1ページ目のグラフィックス記述1501の描画結果であり、図13の背景画像1301の上に文字の画像(前景画像)1302を重畳表示したものに等しい。なお、枠のベクトルパス記述である1303は透明色が指定されているため、通常状態では不可視である。
【0114】
図16(d)は、図16(c)で表示されている電子文書データ1500に対して検索を実行させた結果を示している。入力フィールド1614には、検索する語句として「カメラ」が入力されている。電子文書データ1500ではメタデータ記述1507中の文字列「カメラ」1508と検索語句が一致するので、アプリケーションは検索ヒット時の動作を行う。具体的には、先の説明と同様に、一致したメタデータ1508のキャプション識別子1509と同一の値が付与されたグラフィックス記述を検出し、ページ表示の際に該当部分に強調表示を行う。この場合、キャプション識別子1510が付与された透明枠のベクトルパス記述1511が強調表示の対象となるので、当該ベクトルパス記述1511の枠は、元々指定されていた透明色ではなく、強調色(例えば赤色)で描画される。したがって1615のように、検索でヒットしたメタデータに対応するグラフィックス記述が、赤色等の可視状態で強調表示された枠として文書画像上に重ねて表示されることになる。ユーザにとっては、背景画像内の写真部分が検索でヒットしたかのように見えることになる。なお、強調表示の方法はこの限りでなく、別の枠色や、既定形状と定義してある別の枠形状を用いてもよい。枠を点滅表示させてもよい。また、ヒットしたオブジェクトの記述が画像貼り付けではなく、ベクトルパス記述で表現されている場合は、当該ベクトルパス記述を再利用した枠形状を用いることもできる。
【0115】
本手法によって検索結果の視認性(ヒットしたオブジェクトの認識と、何のオブジェクトであるかの識別(特定))が向上した例を、図17を用いて説明する。図15の電子文書1500に対して、視認性を考慮していない場合(図17(a)および(c))と、視認性を考慮して透明枠の制御を行った場合(本手法、図17(b)および(d))に対して、検索を実行した結果について示している。
【0116】
図17(a)および(b)の入力ウインドウ1701は検索する語句として「B星」を指定した状態を示している。検索の流れは前述と同じであるため、説明を省略する。検索時の視認性を考慮せずに作成された電子文書の場合は、図17(a)に示すように、符号1702のような強調表示がなされる。しかし、ヒットしたオブジェクトがとても小さく、電子文書中のどこにオブジェクトが存在するのか認識しにくい。また、ヒットしたオブジェクトの位置が分かったとしても、それがどんなオブジェクトなのか瞬時に識別することが困難である。一方、本手法によって作成された電子文書の場合は、図17(b)に示すように、オブジェクトの形状を基にして、オブジェクトよりも少し大きめ(例えばオブジェクトより5pix分大きく等)になるように記述された透明枠1703が強調表示される。それに加え、オブジェクトの位置を分かりやすくするように補足情報として記述された矢印による透明枠1704も同時に検出結果として強調表示される。補足情報である矢印の枠1704により、ヒットしたオブジェクトの位置が一目で分かるようになり、かつ、透明な枠1703によって、何の画像がヒットしているのかという情報まで一目で認識することができる。また、検索アプリケーションによっては、検索時に表示する強調色が予め決められた1色(例えば赤色)である場合もあるが、上述したように、少し大きめに表示されたり、矢印などの補足情報が表示されたりするようにしているので、ユーザは認識しやすい。また、検索時に表示すべき強調色が電子文書で指定されている場合、オブジェクト検索アプリケーションがその記述を解釈して強調色を変更する機能を有するならば、ユーザは更に認識しやすくなる。
【0117】
図17(c)および(d)は、別の語句による検索結果として、入力フィールド1705に「月」が指定された状態を示している。視認性を考慮せずに作成された電子文書の場合(すなわち、検索されたオブジェクトを矩形で強調表示するようにした電子文書の場合)、強調表示した矩形内に別のオブジェクトが含まれてしまう場合がある。すなわち、図17(c)に示すように、「月」のオブジェクトに基づいて強調表示された領域内1706に別のオブジェクト(「A星」のオブジェクト)が存在しているため、ヒットしたオブジェクトを一意に特定するのが困難となる場合がある。それに対し、本発明の手法を用いて強調表示された枠の形状1707は、当該「月」のオブジェクトの外輪郭の形状を基に生成されているため、検索でヒットしたオブジェクトの識別が容易になる。また、このとき、枠1707は、オブジェクトの形状に基づいて、オブジェクトと同様の形状で且つオブジェクトよりも少し大きめ(例えばオブジェクトより3pix分大きくする)になるように記述することにより、より識別しやすくする。
【0118】
以上説明したように、図7の設定に基づき文書画像を電子文書データに変換する場合、ステップS801〜S805の処理により、文書画像から抽出したキャプション付きのオブジェクトと、検索に使用するメタデータを関連付けて抽出する。図7(c)の対応テーブルによれば、図11のステップS1107において、『写真』のオブジェクトに対しては画像切り出しによる画像パーツ記述を生成する。『線画』、『表』のオブジェクトのうち、キャプション識別子が付与されたオブジェクトの場合には、ステップS1107において、ベクトル変換によるベクトルパス記述を生成する。そしてステップS1109(図12)において、各オブジェクトの属性に依存した透明枠のベクトルパス記述を作成し、キャプション識別子と関連付けて保存する。このように変換された電子文書データをアプリケーションで閲覧・検索する場合、閲覧時には前記透明色によるベクトルパス記述は不可視である。そのため、当該ベクトルパス記述は描画される画像の視認性に影響を与えずに、ページ表示が行われる。一方、検索時にメタデータがヒットした際には、アプリケーションによって前記透明色のベクトルパス記述が強調色で表示される。このベクトルパス記述は対象オブジェクトの属性や形状、他オブジェクトとの位置関係等に応じて制御することができるため、電子文書データ作成側の意図に従った任意形状の強調表示を行わせることが可能である。例えば、対象オブジェクトの外接矩形よりも大き目の矩形の枠を記述することにより、検索時には、対象オブジェクトに相当する個所を一回り大きな枠で囲むことができるので、ユーザにとっては識別しやすくなる。さらに、対象オブジェクトがベクトルパス記述で記述されていた場合には、当該オブジェクトの形状に倣って強調表示がなされるため、ユーザにとって対象オブジェクトの識別が容易になる。
【0119】
すなわち、本実施例によれば、文字以外のオブジェクトをキーワード検索可能な電子文書データの作成処理において、検索対象オブジェクトの形状や状態を判断し、強調表示用の枠の形状を制御している。これにより、ユーザがヒットしたオブジェクトの認識・識別が容易な強調表現が可能となる電子文書データを作成することができる。
【0120】
また、枠のベクトルパス記述を生成する際に、当該オブジェクトのベクトルパス記述および、予め定義された既定形状のベクトルパス記述を参照(再利用)することにより、全ての枠を個別に記述した場合に比べて、データ量を減らすことも可能である。例えば、矩形による枠を生成する際、形状情報(矩形描画コマンド、描画位置・描画サイズ)や枠の透明描画設定、強調表示時の枠の太さや強調色等500byte以上のベクトルパス記述が必要となる。枠形状を複雑に設定すればするほど当然記述量も増加する。例えば、枠の形状を星型に設定すると1Kbyte以上記述する必要がある。一方、既定形状の参照による枠生成を行う場合には、既定形状の定義に同サイズの記述が必要になるが、参照による枠のベクトルパス記述自体は、枠のパラメータ記述のみとなるため、枠の形状に係わらず200〜300byte程度の記述量に抑えられる。枠のパラメータ記述は、例えば、描画位置(絶対位置もしくは参照オブジェクトに対する相対位置)、描画サイズ(拡大率・拡大量)、強調色設定等である。もし1ページに写真が100個含まれる画像に対して、矩形による枠を生成する場合、参照によって枠のベクトルパス記述を生成することで、個別に記述する場合に比べ、1ページ当たり30Kbyte以上のサイズ削減が可能である。
【0121】
以上のように本実施例によれば、電子文書データ内のオブジェクトが有する形状やデータ状態を維持しつつ、検索により検出されたオブジェクトをユーザが認識しやすいように強調表示可能な電子文書データを生成することができる。
【0122】
(実施例2)
実施例1の動作説明では、図7(c)の対応テーブルを用いることで『写真』、『線画』、『表』に対して、個々のオブジェクトのグラフィックス記述を画像パーツとして生成して前景画像に含め、強調表示用の透明ベクトルパス記述をそれぞれ生成していた。本実施例では、『文字』以外のオブジェクト(『写真』、『線画』、『表』)全てを背景画像に含め、キャプション識別子の付与されたオブジェクトに対してのみ透明のベクトルパス記述を生成する例を示す。
【0123】
本実施例では、図3のフォーマット変換部305が図7(d)の対応テーブルに基づいて制御する場合の処理例を示す。処理フローは実施例1(図11)と同様であるため、同じ動作をする処理ステップの説明は省略する。
【0124】
図7(d)の対応テーブルによれば、『写真』オブジェクトは背景画像に含める設定になっている。そのため、図11のステップS1107、S1108において、図4の画像切り出し処理部403は、画像パーツの生成と背景画像からの消去処理を行なわず、ステップS1109へ進む。また、図7(d)の対応テーブルによると、『線画』、『表』オブジェクトの場合は、ベクトル変換は行うが、背景画像からの消去画像は行わない設定になっている。すわなち、ステップS1107において、ベクトル変換処理部402は、オブジェクトのベクトルパス記述を生成し、記憶部211に一時的に記憶する。続くステップS1108では消去処理を行わず、ステップS1109へ進む。
【0125】
ステップS1109(すなわち、図12)において、電子文書記述生成部404は、透明枠のベクトルパス記述を生成する。図12のステップS1202〜ステップS1204において、透明枠の生成方法(ステップS1205またはS1206)を決定する。
【0126】
実施例1では、ステップS1205において、電子文書記述生成部404は、オブジェクトのベクトルパスの参照命令の記述とパラメータ記述(拡大、移動、強調色設定等)を含む透明枠を生成していた。これは、オブジェクトのベクトルパス記述が前景画像中に記述されているため、参照(再利用)が可能であるからである。それに対し、本実施例では、オブジェクトは背景画像に埋め込まれているため、実施例1のようにオブジェクトのベクトルパス記述を参照(再利用)することができない。そこで、参照命令ではなく、ステップS1107で生成したオブジェクトのベクトルパス記述を透明枠のベクトルパス記述に流用し、それにパラメータ記述を追記することで、フォーマット変換制御部406は透明枠の生成を行う。
【0127】
ステップS1206において、電子文書記述生成部404は、実施例1と同様に、既定形状のベクトルパス記述を参照(再利用)して、透明枠のベクトルパス記述を生成する。このとき、当該オブジェクトが『線画』、『表』オブジェクトである場合、ステップS1107で生成されたベクトルパス記述は透明枠生成には不要であるため、記憶部211から削除することが可能である。
【0128】
このように変換された電子文書データに対して検索を行うと、通常時には背景画像と前景画像(文字部)のページが表示される。一方、検索時にメタデータがヒットした際には、透明色のベクトルパス記述がアプリケーションによって強調色で表示され、ユーザにはオブジェクト自体が検索でヒットしたかのように見える。
【0129】
これにより、実施例1と同様に各オブジェクトの属性等に応じて制御された透明枠の強調表示によって、検索結果がユーザに分かりやすい電子文書を作成することができる。さらに、『文字』以外の全てのオブジェクトを背景画像に含めることによって、抽出した写真オブジェクトと背景とをそれぞれ別の圧縮画像データとして保持するよりもファイルサイズの削減をすることができる。なぜなら、そのようなデータは画像情報と圧縮のためのヘッダ情報から構成されており、オブジェクトのデータ数が多くなるとデータ個数分のヘッダ情報が重複して保持されることになるからである。特に、高度な画像圧縮方式ほど、圧縮のためのヘッダ情報が大きくなる傾向がある。したがって、写真等のオブジェクトを多数含む文書画像から電子文書ファイルを生成する場合には、各オブジェクトを別々に圧縮するよりも1枚の画像として圧縮する方が、総データサイズ削減のためには適している。例えば、画像データをJPEG圧縮したストリームとして保持する場合、各ストリームはヘッダ情報として、展開のための量子化テーブル、ハフマンコード等を含む700byte以上のサイズのデータを必ず伴う。もし1ページに写真が100個含まれる画像の場合、写真と背景の両方を1枚の画像データとして圧縮すれば、背景と写真で計101個の画像データを個別に圧縮するよりも、1ページあたり70Kbyte以上のサイズ削減が可能である。
【0130】
また、電子文書データに対して、または、その検索対象である個々の『写真』、『線画』、若しくは『表』の画像切り出しによる画像パーツに対して、その記述方式、及びそれに対するキャプション識別子の付与方式を、ユーザに適時選択させるようにしてもよい。例えば、『写真』、『線画』等のオブジェクトを別の文書等で再利用する可能性が高い場合には、図7(c)のように、『写真』を画像パーツとして切り出して画像解像度を上げ、『線画』のベクトル変換によるベクトルパス記述を行う。そして、各オブジェクトに対し、キャプション識別子を付与した透明枠を生成する。このように、画像パーツとして再利用する可能性のあるオブジェクトに関しては、ベクトルパス記述や高解像度のオブジェクト画像として電子文書に保存する。こうすることで、それらのオブジェクトを他の文書にコピーしたときも、その画像情報をなるべく損なうことなく、利用できるようになる。また、作成する電子文書データのデータサイズが重要視され且つオブジェクト検索できるようにしたい場合には、図7(d)のように、『写真』等のオブジェクトを『背景』に含め、透明枠の記述を生成してキャプション識別子を付加する。こうすることで、画像内のオブジェクトが検索されたかのような表示をすることができ、且つ、画像データの圧縮率向上が図りやすくなるため、データサイズを小さくすることが可能となる。また、オブジェクトの種別に応じて、より詳細に運用することも可能である。
【0131】
なお、このような使い分けをユーザに選択させるのではなく、文書やページ内の『写真』等の数や、各オブジェクトの大きさや特性に応じて、画像切り出しによる画像パーツ記述方式と、キャプション識別子の付与方式を自動的に選択するようにしてもよい。また、その際、文書やページ単位に自動的に切り替えて使用するように構成してもよい。
【0132】
このように、画像切り出しによる画像パーツ記述方式を適切に選択すると同時に、キャプション識別子の付与方式を適宜選択することで、利用目的に応じた電子文書データの作成が可能となる。これにより、ユーザの使いやすい電子文書データが提供されるという効果がある。
【0133】
(実施例3)
実施例3では、キャプション識別子が付与されたオブジェクトに対して透明枠のベクトルパス記述を作成する際に必要となる枠のパラメータ(絶対位置もしくは参照オブジェクトに対する相対位置、サイズもしくは拡大率等)を自動的に算出する方法の例を示す。
【0134】
枠のパラメータを算出する方法について、図18の処理フローを用いて説明する。
ステップS1801において、電子文書記述生成部404は、処理対象のキャプションが付随するオブジェクトの領域サイズを取得する。この情報は記憶部211に保存されている。
【0135】
ステップS1802およびステップS1803において、電子文書記述生成部404は、予め設定されている上限値および下限値とステップS1801で取得したサイズを比較する。オブジェクトのサイズが下限値以上、上限値以下(下限値≦オブジェクトサイズ<上限値)であれば、ステップS1804へ進む。上限値以上もしくは下限値以下である場合にはステップS1805へ進む。
【0136】
ステップS1804において、電子文書記述生成部404は、オブジェクトのサイズに応じた拡大率(例えば、オブジェクトに対して120%拡大等)を算出する。オブジェクトが小さい場合には拡大率を大きく、オブジェクトが大きい場合には拡大率が小さくなるように設定する。これにより、オブジェクトサイズに応じて枠の大きさを可変にできるため、検索の結果を視認しやすい画像を作成することができる。
【0137】
一方、ステップS1805において、電子文書記述生成部404は、透明枠をオブジェクトより一定サイズ大きくなるように拡大量を算出する。オブジェクトサイズが上限値以上の場合と下限値以下の場合で、拡大量を変更することも可能である。例えば、オブジェクトの外接図形より常に10pix分大きくするという設定でも、上限値以上のオブジェクトには5pix分大きく透明枠を生成し、下限値以下の場合には10pix分大きく透明枠を生成するという設定でも構わない。
【0138】
ステップS1806において、電子文書記述生成部404は、ステップS1804やステップS1805で算出した拡大率・拡大量に応じて、透明枠の移動量を算出する。これは、透明枠がオブジェクトの中心から拡大されず、例えばオブジェクトの左上を基準に拡大される場合等に、透明枠の中心にオブジェクトが位置するように透明枠を移動させる必要があるためである。
【0139】
ステップS1807では、電子文書記述生成部404は、算出された拡大率・拡大量、移動量より、枠のパラメータ記述を生成し、図12の処理フローに従って透明枠のベクトルパス記述を作成する。なお、この枠のパラメータ記述は図12のステップS1205やステップS1206で透明枠のベクトルパス記述を生成するときに使用するパラメータ記述である。
【0140】
以上の手順により、オブジェクトサイズに応じて透明枠のサイズ(拡大率・拡大量)を自動で制御することで、図19に示すように、オブジェクトのサイズに応じたサイズの透明枠が生成できる。これにより、オブジェクトサイズに合わせた、分かりやすい強調表示を行える透明枠を生成することが可能となる。
【0141】
(実施例4)
実施例3では、オブジェクトサイズに応じてパラメータ記述(拡大率・拡大量、移動量等)を生成する方法について述べた。実施例4では、生成されたパラメータ記述が画像外にはみ出してしまう場合の制御方法について述べる。図20、図21を用いて本実施例の動作フローを説明する。
【0142】
ステップS2001において、電子文書記述生成部404は、オブジェクトに応じたパラメータ記述(拡大率・拡大量、移動量等)を生成する。本処理は、実施例3に記載の方法(図18)を用いる。図21(a)は、ステップS2001によって得られたパラメータ記述2102を基にして、透明枠2101を描画した例である。パラメータ記述2102中において、‘‘transform=scale(1.5,1.5) translate(−100、−100)’’と拡大率と移動量が設定されている。
【0143】
ステップS2002において、電子文書記述生成部404は、生成されたパラメータ2102で枠を描画した際に、文書内に枠が収まるかどうかをチェックする。文書内に収まる場合は、ステップS2006へ進み、パラメータ記述として生成する。一方、文書外にはみ出してしまう場合にはステップS2003へ進む。図21(a)では、文書左側と下側において透明枠が文書外に描画されることになるため、ステップS2003以降の処理を行う。
【0144】
ステップS2003において、電子文書記述生成部404は、枠の縦横比を保存したまま文書内に枠が収まるように拡大率・拡大量を下げる。この時、予め設定している拡大率・拡大量の下限値(実施例2で利用した下限値でも構わない)を下回らない程度に調整する。例えば、図21(b)のように‘‘transform=scale(1.2,1.2) translate(−40、−40)’’と拡大率・移動量を変更してパラメータ記述2104を生成し、透明枠2103を描画する。
【0145】
ステップS2003で所望のパラメータ記述を得られなかった場合、ステップS2004において、電子文書記述生成部404は、枠の縦横比を保持せずに拡大率・拡大量の変更を行う。本処理でもステップS2003と同様に、下限値を下回らない程度の補正を加える。生成されるパラメータ記述としては、例えば、‘‘transform=scale(1.2,1.4) translate(−40、−80)’’である。この記述は、縦横比を保存せず拡大率・移動量を変更させたパラメータ記述2106であり、これを用いて透明枠2105を描画させる。
【0146】
ステップS2004で所望のパラメータ記述を得られなかった場合、ステップS2005において、電子文書記述生成部404は、透明枠をオブジェクトに外接する図形(例えば矩形等)に強制的に変更し、枠の補足説明用の描画記述を追加する設定に変更する。例えば、図21(d)に示すように、透明枠2107を、オブジェクトの外接矩形もしくはそれよりも少し大きめな矩形として生成する。さらに、透明枠を強調するような追加記述2108,2109を記述するパラメータ記述2110を生成する。
【0147】
ステップS2006において、電子文書記述生成部404は、ステップS2001〜S2005によって修正されたパラメータを、文書内に収まる透明枠を記述するためのパラメータ記述として更新する。
【0148】
以上の処理により、透明枠が文書外にはみ出すことなく、ユーザに分かりやすい強調表示を自動で行うことが可能となる。
【0149】
(実施例5)
実施例1では、ベクトルパス記述で描画されるオブジェクトのうち、オブジェクトサイズが小さいもの、あるいは隣接オブジェクトが存在しているものに対しては、オブジェクトのベクトルパス記述を再利用して透明枠を生成していた。本実施例では、さらに、オブジェクトのベクトルパス記述が透明枠に利用できるかどうかを判定して、透明枠の生成方法を制御する。
【0150】
図22を用いて本実施例の動作フローを説明する。なお、実施例1の図12と同じステップに関しては同じステップ番号を与えている。また、図23(a)の電子文書2300を入力例として説明を行う。電子文書2300にはキャプションが付与されたオブジェクト2301、2302、2303が含まれている。これらのオブジェクトはどれもベクトルパス記述によって生成されているものとする。
【0151】
図22のステップS1201〜ステップS1204において、電子文書記述生成部404は、オブジェクトのベクトルパス記述を再利用して透明枠を生成するのか、既定形状のベクトルパス記述を再利用して生成するのかを判定する。処理の詳細については、実施例1の図12と同じであるため省略する。
【0152】
ステップS2201において、電子文書記述生成部404は、オブジェクトのベクトルパス記述から輪郭部(外輪郭)のベクトルパス記述が抽出可能かを判定する。輪郭部の抽出が可能な場合はステップS2202へ進み、抽出ができない場合はステップS1206へ進む。これは、オブジェクトが複雑な形状であった場合、オブジェクト内部の描画まで再現してしまうと、検索時に強調された枠がヒットしたオブジェクト上に重畳表示されてしまい、ヒットしたオブジェクトが何であるかが分からなくなってしまうことが考えられる。そこで、オブジェクトの一部である輪郭部のみを透明枠生成に利用することで、視認性を向上させる。
【0153】
ステップS2202において、電子文書記述生成部404は、オブジェクトのベクトルパス記述の一部である輪郭部の記述のみを参照(再利用)して透明枠のベクトルパス記述を生成する。図23のオブジェクト2302は輪郭抽出が容易なオブジェクトであるため、オブジェクト2302の輪郭部のベクトルパス記述を参照(再利用)し、図23(b)の透明枠2304を生成する。
【0154】
一方、ステップS2201で、当該オブジェクトの輪郭部の抽出が困難であると判定された場合は、ステップS1206において、電子文書記述生成部404は、予め定義されている既定形状のベクトルパス記述を参照(再利用)して透明枠を生成する。図23(a)のオブジェクト2303は輪郭抽出が困難であると判断されたため、既定形状である矩形のベクトルパス記述を参照(再利用)して、図23(c)の透明枠2305が生成される。
【0155】
ステップS1207において、電子文書記述生成部404は、ステップS2202およびステップS1206で生成された透明枠に補足の情報を付与するためのベクトルパス記述を行う。特に、ステップS2201において、当該オブジェクトの輪郭部の抽出が困難と判断された場合には、ここで、追加情報が記述される。これは、強調表示のための透明枠を既定形状によって作成したため、オブジェクトが小さい場合や、近傍に他のオブジェクトが存在している場合等、検索でヒットしたオブジェクトが何(どちら)であるかが識別できなくなってしまう。そこで、矢印等の追加記述であったり、オブジェクトのベクトルパス記述をそのまま再利用して、ヒットしたオブジェクト自体に重ならない位置に透明枠を生成したりすることで、分かりやすい表示が必要になる。図23(c)のオブジェクト2303の透明枠2305の補足説明用として、矢印2306やオブジェクト自体の拡大図(2307)が記述される。
【0156】
ステップS1208では、キャプション識別子と生成された透明枠の関連付け処理が行われる。
【0157】
以上の処理で生成された電子文書2300に対して、「望遠レンズ」というキーワードで検索を行った結果について簡単に説明する。オブジェクト2303にはアンカー文字列「図3」が関連付けされる。このアンカー文字列は、本文中に書かれた文字列「図3」と一致しているため、オブジェクト2303に対するキャプション文字列として「望遠レンズ」が抽出される。そしてキャプション文字列「望遠レンズ」に対するキャプション識別子と同一のキャプション識別子が付与された透明枠2305〜2307が検索結果としてヒットし、強調表示される。このように、オブジェクトのベクトルパス記述を透明枠として再利用可能かどうか調べ、有効であればオブジェクトのベクトルパス記述の一部(輪郭部)を再利用して透明枠を生成する。無効であれば、既定形状によるベクトルパス記述に加え、補足情報として矢印やオブジェクトの拡大図等を当該オブジェクトの近傍に配置することで、検索時に検索結果の認識・識別が容易な電子文書を作成することができる。
【0158】
(実施例6)
実施例1〜5では、オブジェクト形状に依存しない、既定形状のベクトルパス記述を再利用した透明枠を生成していた。本実施例では、オブジェクトの形状を解析して透明枠の形状を制御することによって、よりオブジェクトの形状に合った透明枠を生成する手法について説明する。
【0159】
図24を用いて、本実施例の処理の流れを説明する。なお、実施例1の図12および、実施例5の図22と同じ処理に関しては同じステップ番号を与え、処理の説明は省略する。
【0160】
ステップS2401において、電子文書記述生成部404は、オブジェクトの解析処理を行う。オブジェクトの解析処理には、オブジェクトの矩形度や円形度の解析、傾斜度の算出、又はオブジェクトの色彩情報の解析等が含まれる。
【0161】
ステップS2402において、電子文書記述生成部404は、オブジェクト形状に合った透明枠のベクトルパス記述を生成する。この処理の一例を図25に示す。なお、本実施例の説明では、予め定義されている既定形状は「矩形」「円形」「六角形」の3種類であるとして説明を行う。
【0162】
図25のステップS2501において、電子文書記述生成部404は、オブジェクトの矩形度の判定処理を行う。所定のしきい値以上(例えば矩形度80%以上等)であれば、既定形状として「矩形」データ2510が選択され、しきい値未満であればステップS2502へ進む。
【0163】
ステップS2502において、電子文書記述生成部404は、オブジェクトの円形度の判定処理を行う。所定のしきい値以上(例えば円形度70%以上等)であれば、既定形状として「円形」データ2511が選択される。しきい値未満の場合は、既定形状として「六角形」データ2512が選択される。
【0164】
ステップS2503において、電子文書記述生成部404は、前記ステップで選択された既定形状データを再利用して透明枠のベクトルパス記述を生成する。図26に結果の一例を示す。入力電子文書2600には『写真』属性の付与されたオブジェクト2601〜2603が含まれている。オブジェクト2601は矩形度が高いため、ステップS2501において、「矩形」データが選択され、「矩形」のベクトルパス記述を参照した透明枠のベクトルパス記述2604が生成される。オブジェクト2602は楕円形に近い形状をしているため「円形」データが、オブジェクト2603は「六角形」データが選択され、透明枠のベクトルパス記述2605,2606がそれぞれ生成される。
【0165】
ステップS2504において、電子文書記述生成部404は、図24のステップS2401で算出されたオブジェクトの傾斜度を用いて、オブジェクトによりフィットした透明枠を生成するための回転パラメータを生成する。図26のオブジェクト2603は傾きのあるオブジェクトとして認識されるため、透明枠もオブジェクトと同様に傾きを加えることにより、透明枠2606が生成される。
【0166】
ステップS2505において、電子文書記述生成部404は、図24のステップS2401で得られたオブジェクトの色彩情報を基に、強調表示されたときにできるだけ見やすくなるように配色を決定し、強調色を設定する。すなわち、オブジェクトの色彩とは異系色の色を強調色として設定する。これにより、オブジェクトと透明枠の強調色が同系色にまとまってしまって、結果が分かりにくくなることを防ぐことができる。図26の入力例2600では、オブジェクトは黒色であるため、透明枠の強調色は例えば赤色と設定すればよい。
【0167】
本実施例では、既定形状を「矩形」「円形」「六角形」と限定して説明を行ったが、既定形状はこれに限ったものではなく、星形や雲形等でも構わない。また、解析項目や、既定形状の選択の方法もこの限りではない。
【0168】
以上の処理によって、生成時のファイルサイズを抑えつつ、検索時に強調表示される枠が、より対象オブジェクトの形状にフィットしたものとなるため、ユーザに分かりやすい強調表現を行うことができる。
【0169】
(実施例7)
実施例1〜6では、オブジェクト領域の位置・大きさや、オブジェクトを画像処理して得られる情報等を基にしてオブジェクト領域に記述する最適な透明枠を自動で生成していた。本発明の実施例7では、ユーザが、記述される透明枠の形状や線幅等を自由に設定することができる仕組みを提供する。
【0170】
図27(a)は、図1のMFP100に装備された図2の操作部203に表示される電子文書データの目的をユーザに選択させるためのユーザインタフェース(UI)画面の一例である。UI画面2701上には、強調表示用の透明枠の生成方法を自動で決定するように設定するためのボタン2702と、ユーザが設定するためのボタン2703がある。また、選択内容をキャンセルするためのCancelボタン2704、確定するためのOKボタン2705も配置されている。「自動」ボタン2702が選択された場合は実施例1〜6の手順に従い、オブジェクト毎に最適な形状をした透明枠を生成する。一方、「ユーザ設定」ボタン2703が押下された場合は、全てのオブジェクトに対し、ユーザが設定した形状により透明枠を生成する。
【0171】
図27(b)は、強調表示用の全オブジェクトに共通する透明枠形状をユーザが設定するためのUI画面の一例である。UI画面2706には透明枠の基本形状を選択するためのボタン2707と、線幅を選択するためのボタン2708、強調色を選択するためのボタン2709がある。ユーザはUI画面2706上の選択ボタン2707〜2709を操作して透明枠の記述の仕方を選択し、OKボタン2711を押す。これにより、データ処理部218内の制御部(不図示)が、当該UIを介してユーザが指定した透明枠の記述に関する情報をフォーマット変換部305へ伝達する。Cancelボタン2710が押されてユーザ設定が為されなかった場合は、デフォルトの設定情報が制御部によってフォーマット変換部305へ送信される。フォーマット変換部305は、受信した情報を基に、ステップS1109(S1206)において透明枠のベクトル記述を行う。このとき、オブジェクトを特定できるようにするために、図18の処理手順で、オブジェクトのサイズに応じて、当該選択された基本形状のサイズを変更して透明枠のベクトルパス記述を生成するのが望ましい。
【0172】
以上により、「自動」動作時には、ユーザにとって、検索時にヒットしたオブジェクトの認識および識別が容易な電子文書が作成される。一方「ユーザ設定」動作時には、既定形状として1つのベクトルパス記述が定義され、全ての枠生成時に参照するため、ファイルサイズが小さくなる。また、オブジェクト毎に枠の生成の仕方や枠形状の判定処理を行わないため、出力電子文書作成時の処理パフォーマンスの向上も見込める。
【0173】
(その他の実施形態)
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
【特許請求の範囲】
【請求項1】
入力された画像からオブジェクトを抽出するオブジェクト抽出手段と、
前記オブジェクトに関するメタデータを抽出するメタデータ抽出手段と、
前記オブジェクトの形状に応じた形状で枠のベクトルパス記述を記述するか、既定形状に応じた形状で枠のベクトルパス記述を記述するかを判定する判定手段と、
前記判定手段で前記オブジェクトの形状に応じた形状で記述すると判定した場合は、前記オブジェクトの形状に応じた形状で記述された枠のベクトルパス記述を生成し、前記判定手段で前記既定形状に応じた形状で記述すると判定した場合は、前記既定形状に応じた形状で記述された枠のベクトルパス記述を生成する枠生成手段と、
前記入力された画像のデータと、前記メタデータが関連付けられた前記枠のベクトルパス記述とを含む電子文書を生成する文書生成手段と、
を備え、
前記電子文書のキーワード検索が行われた場合、当該キーワードに一致するメタデータが関連付けられている前記枠のベクトルパス記述にしたがって強調表示されることを特徴とする画像処理装置。
【請求項2】
前記判定手段は、少なくとも前記オブジェクトがベクトルパス記述されるか否かに基づいて、前記枠のベクトルパス記述を、前記オブジェクトのベクトルパス記述に基づく形状で記述するか、前記既定形状に応じた形状で記述するかを判定することを特徴とする請求項1に記載の画像処理装置。
【請求項3】
前記判定手段は、前記オブジェクトがベクトルパス記述されるか否かと、当該オブジェクトのサイズと、当該オブジェクトの近傍に他のオブジェクトが存在するか否かとに基づいて、前記枠のベクトルパス記述を、前記オブジェクトのベクトルパス記述に基づく形状で記述するか、前記既定形状に応じた形状で記述するかを判定することを特徴とする請求項1に記載の画像処理装置。
【請求項4】
前記判定手段は、前記オブジェクトがベクトルパス記述され、且つ、当該オブジェクトのサイズが小さいか近傍に他のオブジェクトが存在する場合、前記枠のベクトルパス記述を、当該オブジェクトのベクトルパス記述に基づく形状で記述すると判定することを特徴とする請求項3に記載の画像処理装置。
【請求項5】
前記判定手段は、前記オブジェクトがベクトルパス記述されない場合、或いは、前記オブジェクトがベクトルパス記述され且つ当該オブジェクトのサイズが大きく且つ隣接オブジェクトがない場合に、前記枠のベクトルパス記述を前記既定形状に応じた形状で記述すると判定することを特徴とする請求項3または4に記載の画像処理装置。
【請求項6】
前記オブジェクトの形状に応じた形状で記述された枠のベクトルパス記述は、当該オブジェクトの外輪郭の形状に相似する形状であることを特徴とする請求項1乃至5のいずれか1項に記載の画像処理装置。
【請求項7】
前記枠のベクトルパス記述は、前記枠を前記オブジェクトより大きくするための拡大のパラメータ記述を含むことを特徴とする請求項1乃至6のいずれか1項に記載の画像処理装置。
【請求項8】
前記枠のベクトルパス記述の描画色は透明色であることを特徴とする請求項1乃至7のいずれか1項に記載の画像処理装置。
【請求項9】
前記枠のベクトルパス記述は、前記キーワード検索が行われたときの強調表示に用いられる強調色のパラメータ記述を含むことを特徴とする請求項1乃至8のいずれか1項に記載の画像処理装置。
【請求項10】
前記強調表示するための強調色は、前記オブジェクトの色とは異系色であることを特徴とする請求項9に記載の画像処理装置。
【請求項11】
前記枠生成手段は、更に、前記オブジェクトを補足的に指し示す補足情報のベクトルパス記述を生成し、
前記文書生成手段は、前記入力された画像のデータと、前記メタデータが関連付けられた前記枠のベクトルパス記述及び前記補足情報のベクトルパス記述とを含む電子文書を生成し、
前記電子文書のキーワード検索が行われた場合、当該キーワードに一致するメタデータが関連付けられている前記枠のベクトルパス記述と前記補足情報のベクトルパス記述とにしたがって強調表示されることを特徴とする請求項1乃至10のいずれか1項に記載の画像処理装置。
【請求項12】
入力された画像からオブジェクトを抽出するオブジェクト抽出手段と、
前記オブジェクトに関するメタデータを抽出するメタデータ抽出手段と、
前記オブジェクトの形状の外輪郭に相似する形状で記述された枠のベクトルパス記述を生成する枠生成手段と、
前記入力された画像のデータと、前記メタデータが関連付けられた前記枠のベクトルパス記述とを含む電子文書を生成する文書生成手段と、
を備え、
前記電子文書のキーワード検索が行われた場合、当該キーワードに一致するメタデータが関連付けられている前記枠のベクトルパス記述にしたがって強調表示されることを特徴とする画像処理装置。
【請求項13】
入力された画像からオブジェクトを抽出し、当該オブジェクトについての情報である領域情報を取得する手段と、
前記抽出されたオブジェクトを前記取得された領域情報に応じた形状で囲む透明枠のベクトルパス記述を生成する手段と、
前記入力された画像から、前記生成された透明枠のベクトルパス記述を含む電子文書データを生成する手段と
を備え、
前記生成された透明枠のベクトルパス記述は、前記生成された電子文書データからオブジェクトが検索され検索結果として検出されたときに、当該枠を強調表示するための強調色のパラメータ記述を含むこと
を特徴とする画像処理装置。
【請求項14】
オブジェクト抽出手段が、入力された画像からオブジェクトを抽出するオブジェクト抽出ステップと、
メタデータ抽出手段が、前記オブジェクトに関するメタデータを抽出するメタデータ抽出ステップと、
判定手段が、前記オブジェクトの形状に応じた形状で枠のベクトルパス記述を記述するか、既定形状に応じた形状で枠のベクトルパス記述を記述するかを判定する判定ステップと、
前記判定ステップで前記オブジェクトの形状に応じた形状で記述すると判定した場合は、枠生成手段が、前記オブジェクトの形状に応じた形状で記述された枠のベクトルパス記述を生成し、前記判定ステップで前記既定形状に応じた形状で記述すると判定した場合は、前記枠生成手段が、前記既定形状に応じた形状で記述された枠のベクトルパス記述を生成する枠生成ステップと、
文書生成手段が、前記入力された画像のデータと、前記メタデータが関連付けられた前記枠のベクトルパス記述とを含む電子文書を生成する文書生成ステップと、
を備える、画像処理装置の画像処理方法であって、
前記電子文書のキーワード検索が行われた場合、当該キーワードに一致するメタデータが関連付けられている前記枠のベクトルパス記述にしたがって強調表示されることを特徴とする画像処理方法。
【請求項15】
コンピュータを、請求項1乃至13のいずれか1項に記載の画像処理装置として機能させるためのプログラム。
【請求項1】
入力された画像からオブジェクトを抽出するオブジェクト抽出手段と、
前記オブジェクトに関するメタデータを抽出するメタデータ抽出手段と、
前記オブジェクトの形状に応じた形状で枠のベクトルパス記述を記述するか、既定形状に応じた形状で枠のベクトルパス記述を記述するかを判定する判定手段と、
前記判定手段で前記オブジェクトの形状に応じた形状で記述すると判定した場合は、前記オブジェクトの形状に応じた形状で記述された枠のベクトルパス記述を生成し、前記判定手段で前記既定形状に応じた形状で記述すると判定した場合は、前記既定形状に応じた形状で記述された枠のベクトルパス記述を生成する枠生成手段と、
前記入力された画像のデータと、前記メタデータが関連付けられた前記枠のベクトルパス記述とを含む電子文書を生成する文書生成手段と、
を備え、
前記電子文書のキーワード検索が行われた場合、当該キーワードに一致するメタデータが関連付けられている前記枠のベクトルパス記述にしたがって強調表示されることを特徴とする画像処理装置。
【請求項2】
前記判定手段は、少なくとも前記オブジェクトがベクトルパス記述されるか否かに基づいて、前記枠のベクトルパス記述を、前記オブジェクトのベクトルパス記述に基づく形状で記述するか、前記既定形状に応じた形状で記述するかを判定することを特徴とする請求項1に記載の画像処理装置。
【請求項3】
前記判定手段は、前記オブジェクトがベクトルパス記述されるか否かと、当該オブジェクトのサイズと、当該オブジェクトの近傍に他のオブジェクトが存在するか否かとに基づいて、前記枠のベクトルパス記述を、前記オブジェクトのベクトルパス記述に基づく形状で記述するか、前記既定形状に応じた形状で記述するかを判定することを特徴とする請求項1に記載の画像処理装置。
【請求項4】
前記判定手段は、前記オブジェクトがベクトルパス記述され、且つ、当該オブジェクトのサイズが小さいか近傍に他のオブジェクトが存在する場合、前記枠のベクトルパス記述を、当該オブジェクトのベクトルパス記述に基づく形状で記述すると判定することを特徴とする請求項3に記載の画像処理装置。
【請求項5】
前記判定手段は、前記オブジェクトがベクトルパス記述されない場合、或いは、前記オブジェクトがベクトルパス記述され且つ当該オブジェクトのサイズが大きく且つ隣接オブジェクトがない場合に、前記枠のベクトルパス記述を前記既定形状に応じた形状で記述すると判定することを特徴とする請求項3または4に記載の画像処理装置。
【請求項6】
前記オブジェクトの形状に応じた形状で記述された枠のベクトルパス記述は、当該オブジェクトの外輪郭の形状に相似する形状であることを特徴とする請求項1乃至5のいずれか1項に記載の画像処理装置。
【請求項7】
前記枠のベクトルパス記述は、前記枠を前記オブジェクトより大きくするための拡大のパラメータ記述を含むことを特徴とする請求項1乃至6のいずれか1項に記載の画像処理装置。
【請求項8】
前記枠のベクトルパス記述の描画色は透明色であることを特徴とする請求項1乃至7のいずれか1項に記載の画像処理装置。
【請求項9】
前記枠のベクトルパス記述は、前記キーワード検索が行われたときの強調表示に用いられる強調色のパラメータ記述を含むことを特徴とする請求項1乃至8のいずれか1項に記載の画像処理装置。
【請求項10】
前記強調表示するための強調色は、前記オブジェクトの色とは異系色であることを特徴とする請求項9に記載の画像処理装置。
【請求項11】
前記枠生成手段は、更に、前記オブジェクトを補足的に指し示す補足情報のベクトルパス記述を生成し、
前記文書生成手段は、前記入力された画像のデータと、前記メタデータが関連付けられた前記枠のベクトルパス記述及び前記補足情報のベクトルパス記述とを含む電子文書を生成し、
前記電子文書のキーワード検索が行われた場合、当該キーワードに一致するメタデータが関連付けられている前記枠のベクトルパス記述と前記補足情報のベクトルパス記述とにしたがって強調表示されることを特徴とする請求項1乃至10のいずれか1項に記載の画像処理装置。
【請求項12】
入力された画像からオブジェクトを抽出するオブジェクト抽出手段と、
前記オブジェクトに関するメタデータを抽出するメタデータ抽出手段と、
前記オブジェクトの形状の外輪郭に相似する形状で記述された枠のベクトルパス記述を生成する枠生成手段と、
前記入力された画像のデータと、前記メタデータが関連付けられた前記枠のベクトルパス記述とを含む電子文書を生成する文書生成手段と、
を備え、
前記電子文書のキーワード検索が行われた場合、当該キーワードに一致するメタデータが関連付けられている前記枠のベクトルパス記述にしたがって強調表示されることを特徴とする画像処理装置。
【請求項13】
入力された画像からオブジェクトを抽出し、当該オブジェクトについての情報である領域情報を取得する手段と、
前記抽出されたオブジェクトを前記取得された領域情報に応じた形状で囲む透明枠のベクトルパス記述を生成する手段と、
前記入力された画像から、前記生成された透明枠のベクトルパス記述を含む電子文書データを生成する手段と
を備え、
前記生成された透明枠のベクトルパス記述は、前記生成された電子文書データからオブジェクトが検索され検索結果として検出されたときに、当該枠を強調表示するための強調色のパラメータ記述を含むこと
を特徴とする画像処理装置。
【請求項14】
オブジェクト抽出手段が、入力された画像からオブジェクトを抽出するオブジェクト抽出ステップと、
メタデータ抽出手段が、前記オブジェクトに関するメタデータを抽出するメタデータ抽出ステップと、
判定手段が、前記オブジェクトの形状に応じた形状で枠のベクトルパス記述を記述するか、既定形状に応じた形状で枠のベクトルパス記述を記述するかを判定する判定ステップと、
前記判定ステップで前記オブジェクトの形状に応じた形状で記述すると判定した場合は、枠生成手段が、前記オブジェクトの形状に応じた形状で記述された枠のベクトルパス記述を生成し、前記判定ステップで前記既定形状に応じた形状で記述すると判定した場合は、前記枠生成手段が、前記既定形状に応じた形状で記述された枠のベクトルパス記述を生成する枠生成ステップと、
文書生成手段が、前記入力された画像のデータと、前記メタデータが関連付けられた前記枠のベクトルパス記述とを含む電子文書を生成する文書生成ステップと、
を備える、画像処理装置の画像処理方法であって、
前記電子文書のキーワード検索が行われた場合、当該キーワードに一致するメタデータが関連付けられている前記枠のベクトルパス記述にしたがって強調表示されることを特徴とする画像処理方法。
【請求項15】
コンピュータを、請求項1乃至13のいずれか1項に記載の画像処理装置として機能させるためのプログラム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【図22】
【図23】
【図24】
【図25】
【図26】
【図27】
【図21】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【図22】
【図23】
【図24】
【図25】
【図26】
【図27】
【図21】
【公開番号】特開2011−141598(P2011−141598A)
【公開日】平成23年7月21日(2011.7.21)
【国際特許分類】
【出願番号】特願2010−489(P2010−489)
【出願日】平成22年1月5日(2010.1.5)
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】
【公開日】平成23年7月21日(2011.7.21)
【国際特許分類】
【出願日】平成22年1月5日(2010.1.5)
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】
[ Back to top ]