説明

画像検索システム、画像検索方法、画像登録システム、及び画像登録方法

【課題】画像の種類によって検索のための適切な特徴量が異なっても、検索元画像と検索先画像の種類とその組み合わせに応じて、検索のための適切な特徴量と辞書データとが選定され、精度が高く、かつ効率的な検索を行うことができる画像検索システム、画像検索方法、及びその辞書データに登録する画像登録システム、画像登録方法を提供する。
【解決手段】画像の種類によって検索のための適切な特徴量が異なっても、それらのうち1つの特徴量に対して1種類の画像を登録した辞書データと、他の特徴量に対してすべての種類の画像を登録した辞書データとを用意し、検索元画像の種類に応じて、検索する特徴量とそれに対応する辞書データを切り換えることで、精度が高く、かつ効率的な検索を行うことができる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、入力画像の特徴量に基づいて辞書データを検索し、記憶された画像データの中から類似の特徴量を有する画像を抽出する画像検索システム、画像検索方法、及び検索される画像を辞書データに登録する画像登録システム、画像登録方法に関する。
【背景技術】
【0002】
近年は、デジタル化、ネットワーク化の進展により、様々な情報が電子的に扱われるようになってきた。オフィスなどでも文書の電子化が進み、大量の文書がデジタルの電子ファイルとして管理されている。電子的に文書を取り扱うことにより、紙文書では考えられなかった大量のデータの迅速な処理、作成、表示印刷、移動や検索などが可能となっている。
【0003】
しかしながら、紙文書に代表されるアナログの媒体も捨てがたいものがあり、会議などの資料としてその手軽さ、見やすさからプリントアウトされた紙文書が配られたりするのは今もよくあることである。
【0004】
こういった事情から、デジタルの電子データと紙文書などのアナログデータとを両立させ、互いに連繋しながらシームレスに活用できることが望まれている。
【0005】
現状では両者の変換法として、電子データを紙媒体にプリントアウトする、あるいは紙文書をスキャンして電子的に画像データ化する、などが行われている。しかしここで、一旦アナログデータにすると、デジタルデータとは異なり、変化するという特性があることに注目しなければならない。例えば、コピーして作成した文書は元の文書から変化しているし、それをコピーすればまた変化する。スキャンして再度デジタル化しても元の電子データとは異なっている。
【0006】
こういった状況に対して、アナログの紙文書から、それに対応するデジタルの電子データを、管理された大量の電子データの中から電子的に検索できるような技術が求められてきた。そうすれば、常に一貫したデジタルデータを元にして各種処理を行うことが可能になる。
【0007】
検索の手段としては、識別コードやメタデータを付与して、それをキーに検索する方法なども開発されたが、紙文書の場合その印刷内容の中にコードなどを埋め込まねばならないという制約がある。文書中のテキストなどのキーワードで検索する方法もあるが、テキストだけでは不十分であり、図主体の文書などでは不適当である。
【0008】
よく用いられるのは、文書を画像として比較して、その類似度により検索するという手法である。文書の画像データから画像としての特徴量を求め、その特徴量を検索のキーとして検索する。つまり、検索元の画像の特徴量と検索先の各画像の特徴量を比較して類似度合いを算出し、類似度合いの大きい画像を抽出してくるのである。
【0009】
こういった検索の具体的な用途として考えられる例としては、オフィスでの事務書類の作成、管理、編集、コピー、配信、記録、といった電子データと紙媒体と両方を用いるようなケースである。例えば、配布された紙の文書を再プリントしたい、そのとき通常なら、MFPに持っていき複写すればよい、しかし様々な理由からそのまま複写しにくい場合もある。例えば、元々はカラー文書であったものをモノクロでプリントしていた、しかし、今度は元のカラー文書が必要だといったケースも想定される。こういった場合、MFPに持っていき、複写する代わりに検索複写を選択すれば、自動的に管理された登録文書の中から元のカラー文書のデジタルデータを検索し、プリントアウトする、といった形態が考えられる。
【0010】
しかしながら、上記のモノクロのアナログ画像からカラーのデジタル画像を検索する場合のように、画像データとしての特徴量を用いて、類似画像(アナログなので少し変化している)としての元の画像を検索するに当たって、画像の種類が異なってきているような場合も想定しなければならない。
【0011】
検索にカラーの特徴量を用いれば、モノクロの特徴量より情報量が多く、検索精度が向上するだろうが、モノクロ画像に対しては、有効でない余計な情報を用いていることになり、非効率である。モノクロ特徴量を用いれば、効率的に検索できるが、カラー画像に対しては、色情報を使用していないので検索の精度を落とすことになる。
【0012】
カラー画像とモノクロ画像の例を挙げたが、要は画像の性質、種類により、適切な検索法は異なってくるということである。しかしながら、画像の種類を予め限定できず、複数の種類が混在している場合がむしろ一般的であることから、複数の検索法を使い分けるような技術も提案されてきている(例えば、特許文献1、2、及び3参照)。
【0013】
特許文献1では、カラー画像とモノクロ画像に対して、検索元の画像の種類を検知して、カラー画像であればカラー特徴量を検索に用い、モノクロ画像であればモノクロ特徴量を検索に用いるように、切り換えて処理する技術が提示されている。
【0014】
特許文献2では、検索元の画像によりカラー特徴量とモノクロ特徴量のどちらを重視するかの重み付けを決定して、常に重み付きで両方を検索に用いる技術を提示している。
【0015】
特許文献3では、カラーとモノクロではなく、検索元の文書に適用できるマクロ機能を検索するために、例えば用途別、言語別など複数の分類木を用意し、どの分類木を辿っても該当するマクロ機能へ辿れるような技術が提示されている。つまり複数の検索法からユーザが任意に選べるようになっている。
【0016】
画像の種類を第1種の画像、第2種の画像と称し、それぞれに適した検索のための特徴量を第1の特徴量、第2の特徴量として、上記技術を当てはめてみると、以下のように総括できる。
【0017】
特許文献1の技術は、検索元の画像が第1種の画像であれば、第1の特徴量を用いて検索し、検索元の画像が第2種の画像であれば、第2の特徴量を用いて検索するタイプ。
【0018】
特許文献2の技術は、第1の特徴量、第2の特徴量両方を検索に用いるが、検索元の画像に応じてその重み付けを換えるタイプ。
【0019】
特許文献3の技術は、検索元の画像にかかわらず、第1の特徴量、第2の特徴量を任意に選んで検索することができるタイプ。
【特許文献1】特開2004−334336号公報
【特許文献2】特開2001−143080号公報
【特許文献3】特開平9−223134号公報
【発明の開示】
【発明が解決しようとする課題】
【0020】
上記特許文献1に示された技術によれば、第1種の画像に対しても第2種の画像に対しても、それぞれ適切な検索が可能であるが、検索先の画像の種類が検索元の画像の種類と同じであるとは限らない。従って、場合によっては非効率になったり、検索精度がよくなかったりする。また第1の特徴量と第2の特徴量と、両方を予め求めておくか、そのつどどちらかを算出するといった手間が必要である。
【0021】
特許文献2に示された技術によれば、検索元の画像に応じて重み付けすることで検索の精度がよくなる。しかしながら、検索元の画像に対して、常に第1の特徴量と第2の特徴量と両方の特徴量を算出しなければならない。また検索先の各画像に対しても、両方を予め求めておくなどの対処が必要である。重み付きながら常に両方を用いるので効率が悪い。
【0022】
特許文献3に示された技術によれば、ユーザが任意に検索方法を選ぶことができ、どちらを選択しても基本的には同じ検索が可能という長所がある。しかしながら、これは複数の検索方法の設定によっては、検索精度や効率が著しくアンバランスになる場合もある。例えばカラーとモノクロの場合のように、第1の特徴量と第2の特徴量の情報量が著しく異なり、一方に他方が包含されるようなケースで適用するのは、現実的ではない。
【0023】
本発明の目的は、上記のような課題を解決し、入力画像の特徴量に基づいて辞書データを検索し、記憶された画像データの中から類似の特徴量を有する画像を抽出するに当たって、画像の種類によって検索のための適切な特徴量が異なっても、検索元の入力画像と検索先の記憶された画像の種類とその組み合わせに応じて、検索のための適切な特徴量と辞書データとが選定され、精度が高く、かつ効率的な検索を行うことができる画像検索システム、画像検索方法、及びその適切な辞書データが形成されるよう、検索先の画像を適切な特徴量と関連づけて登録する画像登録システム、画像登録方法を提供することである。
【課題を解決するための手段】
【0024】
本発明は上記課題を解決するため、以下のような特徴を有するものである。
【0025】
1. 取得した入力画像に対して画像の特徴量を算出し、前記特徴量に基づいて所定の辞書データを検索し、前記入力画像と前記特徴量が対応する出力画像を抽出する画像検索システムであって、前記入力画像から第1の特徴量を抽出する第1の特徴量抽出手段と、前記入力画像から第2の特徴量を抽出する第2の特徴量抽出手段と、前記入力画像が第1種の画像であるか第2種の画像であるかを検知する画像検知手段と、前記第1の特徴量を検索キーとして、前記第1種の画像が登録された第1種の画像用辞書データと、前記第2の特徴量を検索キーとして、前記第1種の画像と前記第2種の画像とが登録された第2種の画像用辞書データと、前記画像検知手段による前記入力画像の検知結果が前記第1種の画像である場合に、前記入力画像の前記第1の特徴量に基づいて、前記第1種の画像用辞書データを検索し、対応する出力画像候補を抽出する第1種の画像検索手段と、前記画像検知手段による前記入力画像の検知結果が前記第2種の画像である場合に、前記入力画像の前記第2の特徴量に基づいて、前記第2種の画像用辞書データを検索し、対応する出力画像候補を抽出する第2種の画像検索手段と、を有する、ことを特徴とする画像検索システム。
【0026】
2. 前記第2の特徴量抽出手段が抽出する前記第2の特徴量の次元数は、前記第1の特徴量抽出手段が抽出する前記第1の特徴量の次元数よりも小さい、ことを特徴とする1に記載の画像検索システム。
【0027】
3. 前記画像検知手段は、前記第1の特徴量に基づき、前記入力画像が前記第1種の画像であるか前記第2種の画像であるかを判別する画像判別手段を有する、ことを特徴とする1または2に記載の画像検索システム。
【0028】
4. 前記入力画像が、その画像中に第1種の画像領域と第2種の画像領域を有する場合、前記画像判別手段は、前記入力画像において前記第1種の画像領域が画像全領域に対して占める割合に応じて、前記入力画像が前記第1種の画像であるか前記第2種の画像であるかを判別し、前記第2種の画像検索手段は、前記画像判別手段が前記入力画像を前記第2種の画像であると判別した場合、前記入力画像の前記第2の特徴量のうち、その画像中の前記第1種の画像領域を除いた部分に対応する前記第2の特徴量に基づいて、前記第2種の画像用辞書データを検索し、対応する出力画像候補を抽出する、ことを特徴とする3に記載の画像検索システム。
【0029】
5. 前記第1種の画像用辞書データまたは前記第2種の画像用辞書データに登録されている画像の画像データは、ネットワークで接続された機器に分散されて格納されている、ことを特徴とする1乃至4の何れか1項に記載の画像検索システム。
【0030】
6. 前記第1種の画像検索手段は、前記入力画像の前記第1の特徴量に基づき、第1種の画像検索用インデックスを用いて、前記第1種の画像用辞書データを検索し、対応する出力画像候補を抽出し、前記第2種の画像検索手段は、前記入力画像の前記第2の特徴量に基づき、第2種の画像検索用インデックスを用いて、前記第2種の画像用辞書データを検索し、対応する出力画像候補を抽出する、ことを特徴とする1乃至5の何れか1項に記載の画像検索システム。
【0031】
7. 前記第1種の画像はカラー画像であり、前記第1の特徴量は、カラー特徴量であり、前記第2種の画像はモノクロ画像であり、前記第2の特徴量は、モノクロ特徴量である、ことを特徴とする1乃至6の何れか1項に記載の画像検索システム。
【0032】
8 1乃至5の何れか1項に記載の画像検索システムで用いられる辞書データへの画像登録システムであって、前記第1の特徴量抽出手段と、前記第2の特徴量抽出手段と、前記画像検知手段と、前記第1種の画像用辞書データと、前記第2種の画像用辞書データと、前記画像検知手段による前記入力画像の検知結果が前記第1種の画像である場合に、前記第1種の画像用辞書データに、前記第1の特徴量と関連づけて前記入力画像を登録する第1種の画像登録手段と、前記画像検知手段による前記入力画像の検知結果に関わらず、前記第2種の画像用辞書データに、前記第2の特徴量と関連づけて前記入力画像を登録する第2種の画像登録手段と、を有する、ことを特徴とする画像登録システム。
【0033】
9. 前記第1種の画像登録手段は、前記第1種の画像用辞書データに、前記入力画像を登録するとともに、前記入力画像の前記第1の特徴量に基づき第1種の画像検索用インデックスを更新し、前記第2種の画像登録手段は、前記第2種の画像用辞書データに、前記入力画像を登録するとともに、前記入力画像の前記第2の特徴量に基づき第2種の画像検索用インデックスを更新する、ことを特徴とする8に記載の画像登録システム。
【0034】
10. 前記第1種の画像はカラー画像であり、前記第1の特徴量は、カラー特徴量であり、前記第2種の画像はモノクロ画像であり、前記第2の特徴量は、モノクロ特徴量である、ことを特徴とする8または9に記載の画像登録システム。
【0035】
11. 取得した入力画像に対して画像の特徴量を算出し、前記特徴量に基づいて所定の辞書データを検索し、前記入力画像と前記特徴量が対応する出力画像を抽出する画像検索方法であって、前記入力画像から第1の特徴量を抽出する第1の特徴量抽出工程と、前記入力画像から第2の特徴量を抽出する第2の特徴量抽出工程と、前記入力画像が第1種の画像であるか第2種の画像であるかを検知する画像検知工程と、前記画像検知工程における前記入力画像の検知結果が前記第1種の画像である場合に、前記入力画像の前記第1の特徴量に基づいて、前記第1種の画像が登録された第1種の画像用辞書データを検索し、対応する出力画像候補を抽出する第1種の画像検索工程と、前記画像検知工程における前記入力画像の検知結果が前記第2種の画像である場合に、前記入力画像の前記第2の特徴量に基づいて、前記第1種の画像と前記第2種の画像とが登録された第2種の画像用辞書データを検索し、対応する出力画像候補を抽出する第2種の画像検索工程と、を備える、ことを特徴とする画像検索方法。
【0036】
12. 前記第2の特徴量抽出工程において抽出される前記第2の特徴量の次元数は、前記第1の特徴量抽出工程において抽出される前記第1の特徴量の次元数よりも小さい、ことを特徴とする11に記載の画像検索方法。
【0037】
13. 前記画像検知工程は、前記第1の特徴量に基づき、前記入力画像が前記第1種の画像であるか前記第2種の画像であるかを判別する画像判別工程を有する、ことを特徴とする11または12に記載の画像検索方法。
【0038】
14. 前記入力画像が、その画像中に第1種の画像領域と第2種の画像領域を有する場合、前記画像判別工程では、前記入力画像において前記第1種の画像領域が画像全領域に対して占める割合に応じて、前記入力画像が前記第1種の画像であるか前記第2種の画像であるかを判別し、前記第2種の画像検索工程では、前記画像判別工程において前記入力画像が前記第2種の画像であると判別された場合、前記入力画像の前記第2の特徴量のうち、その画像中の前記第1種の画像領域を除いた部分に対応する前記第2の特徴量に基づいて、前記第2種の画像用辞書データを検索し、対応する出力画像候補を抽出する、ことを特徴とする13に記載の画像検索方法。
【0039】
15. 前記第1種の画像用辞書データまたは前記第2種の画像用辞書データに登録されている画像の画像データは、ネットワークで接続された機器に分散されて格納されている、ことを特徴とする11乃至14の何れか1項に記載の画像検索方法。
【0040】
16. 前記第1種の画像検索工程では、前記入力画像の前記第1の特徴量に基づき、第1種の画像検索用インデックスを用いて、前記第1種の画像用辞書データを検索し、対応する出力画像候補を抽出し、前記第2種の画像検索工程では、前記入力画像の前記第2の特徴量に基づき、第2種の画像検索用インデックスを用いて、前記第2種の画像用辞書データを検索し、対応する出力画像候補を抽出する、ことを特徴とする11乃至15の何れか1項に記載の画像検索方法。
【0041】
17. 前記第1種の画像はカラー画像であり、前記第1の特徴量は、カラー特徴量であり、前記第2種の画像はモノクロ画像であり、前記第2の特徴量は、モノクロ特徴量である、ことを特徴とする11乃至16の何れか1項に記載の画像検索方法。
【0042】
18. 11乃至15の何れか1項に記載の画像検索方法において用いられる辞書データへの画像登録方法であって、前記第1の特徴量抽出工程と、前記第2の特徴量抽出工程と、前記画像検知工程と、前記画像検知工程における前記入力画像の検知結果が前記第1種の画像である場合に、前記第1種の画像用辞書データに、前記第1の特徴量と関連づけて前記入力画像を登録する第1種の画像登録工程と、前記画像検知工程における前記入力画像の検知結果に関わらず、前記第2種の画像用辞書データに、前記第2の特徴量と関連づけて前記入力画像を登録する第2種の画像登録工程と、を備える、ことを特徴とする画像登録方法。
【0043】
19. 前記第1種の画像登録工程では、前記第1種の画像用辞書データに、前記入力画像を登録するとともに、前記入力画像の前記第1の特徴量に基づき第1種の画像検索用インデックスを更新し、前記第2種の画像登録工程では、前記第2種の画像用辞書データに、前記入力画像を登録するとともに、前記入力画像の前記第2の特徴量に基づき第2種の画像検索用インデックスを更新する、ことを特徴とする18に記載の画像登録方法。
【0044】
20. 前記第1種の画像はカラー画像であり、前記第1の特徴量は、カラー特徴量であり、前記第2種の画像はモノクロ画像であり、前記第2の特徴量は、モノクロ特徴量である、ことを特徴とする18または19に記載の画像登録方法。
【発明の効果】
【0045】
本発明によれば、入力画像の特徴量に基づいて辞書データを検索し、記憶された画像データの中から類似の特徴量を有する画像を抽出するに当たって、画像の種類によって検索のための適切な特徴量が異なっても、それらのうち1つの特徴量に対して1種類の画像を登録した辞書データと、他の特徴量に対してすべての種類の画像を登録した辞書データとを用意し、検索元の入力画像の種類に応じて、検索する特徴量とそれに対応する辞書データを切り換えることで、精度が高く、かつ効率的な検索を行うことができる。
【発明を実施するための最良の形態】
【0046】
以下、図面を参照して本発明の実施形態を説明する。
【0047】
(システムの全体構成及び動作)
図1は本実施形態に係る画像検索システム及び画像登録システムの構成例を示すブロック図である。図1を用いて、本実施形態に係る画像検索システム及び画像登録システムの概略構成を説明する。
【0048】
図1において、1は本実施形態に係る画像検索システム及び画像登録システムである。1は画像検索システム及び画像登録システムの両者を包含しており、以後、本実施形態の説明において画像検索システム1と呼称する場合は、画像登録システムも含むものとする。もちろん画像検索システムと画像登録システムとは、別の構成を有する別個のシステムであってもかまわない。
【0049】
画像検索システム1は、画像に対する検索や登録処理を行う単独のシステムであってもよいし、複写機やファックス、MFP(多機能型プリンタ)などの画像形成装置、あるいは他の画像処理装置などに接続、あるいは内蔵されたものであってもよい。その場合は画像入出力に関わる機能部分などで、システムの構成要素が画像形成装置などの構成要素と兼用されたものであってもよい。以後、本実施形態の説明においては、MFPに本画像検索システム1が内蔵されている例を想定して説明する。
【0050】
画像検索システム1は、以下の10から17の符号を付した構成要素を有する。
【0051】
10はデータ処理部であり、画像検索と画像登録の処理を行う。データ処理部10の内部構成については後述する。
【0052】
11は操作部であり、画像検索と画像登録の処理時にユーザの操作入力を受け付ける。例えば操作部11は、検索処理の指示、画像の種類の指定、出力候補画像からの出力画像選択などの操作を受け付ける。
【0053】
12は表示部であり、画像検索と画像登録の処理時にユーザに提示すべき情報を表示する。例えば表示部12は、検索の処理内容に関する情報、検索結果の情報(出力候補画像)などの表示を行う。
【0054】
13は画像読み取り部であり、スキャナ機能などを利用して検索や登録の対象である画像の入力を行う。例えば画像読み取り部13は、文書画像などを複写する際に読み取った文書画像を、登録処理のために複写とは別にデータ処理部10へ送り込む。
【0055】
14はプリント部であり、登録処理した画像、あるいは検索された出力画像などのプリント出力を行う。例えばプリント部14は、複写の入力画像に対応してデータ処理部10から検索された出力画像を受け取り、複写の出力としてプリントアウトする。
【0056】
17は記憶部であり、登録処理した画像データを記憶する、またその画像データ検索のための辞書データを記憶する。例えば、記憶部17は、複写に際して画像データと辞書データを逐一記憶する。あるいは複写に際して記憶部17から辞書データにより画像データを検索する。
【0057】
15は画像入力に関わる通信部であり、16は画像出力に関わる通信部である。通信部15及び16は、いずれもネットワーク2などを経由して、外部から画像を受信する、あるいは送信するなどの形態で、データ処理部10での検索や登録処理の対象となる画像データを入力あるいは出力する。
【0058】
3、4、5は、いずれもネットワーク2を経由して画像検索システム1と接続された外部の装置あるいはシステムであり、例えば、管理用のサーバや外部記憶装置が想定される。しかしながら、それらが画像検索システム1の登録画像データの記憶や、登録検索の情報(辞書データ)の記憶や管理を行っている場合には、画像検索システム1に包含されるシステムの構成要素と見なすのが適当である。
【0059】
図2を参照して、MFPに内蔵されるシステムとして、画像検索システムの動作を説明する。図2(a)はMFPによる文書画像の複写時に画像登録する場合の、図2(b)はMFPによる文書画像の複写時に画像検索する場合の、それぞれ動作を示す図である。
【0060】
MFPによる文書画像の複写時に画像登録する図2(a)の場合には、画像読み取り部13で入力された原文書画像A41は、通常の処理として複写処理されるが、それとは別にデータ処理部10へ送られ、画像データ(原文書画像A)として登録処理が行われる。データ処理部10での登録処理の詳細は後述する。原文書画像Aの画像データは記憶部17に記憶され、合わせて記憶部17の辞書データに登録される。登録済みの原文書画像A41は通常の複写処理により、複写された文書(複写文書画像A’42)としてプリント部14でプリントアウトされる。
【0061】
また、MFPによる文書画像の複写時に画像検索する図2(b)の場合には、画像読み取り部13で入力された画像(複写文書画像A”43)はデータ処理部10へ送られ、その画像データ(複写文書画像A”)に基づき、出力すべき画像の検索処理が行われる。データ処理部10での検索処理の詳細は後述する。記憶部17の辞書データが参照され、記憶部17に記憶された画像データから複写文書画像A”に対応する出力画像候補が抽出され、表示部12に表示される。ユーザが出力画像候補から出力画像を選択すると、選択された画像(原文書画像A44)が複写の出力としてプリント部14からプリントアウトされる。
【0062】
上記のような登録及び検索の動作によって、例えば、原稿となる文書の複写時に登録を行っておくことにより、次回その複写文書またはその再複写文書あるいは修正文書などを用いて再複写処理を行おうとする際に、検索処理により元の画像データを参照して、元画像データによる文書複写をすることが可能になる。
【0063】
(データ処理部10の内部構成)
図3は、図1におけるデータ処理部10の内部構成例を示すブロック図である。図3を用いて、画像検索システム1におけるデータ処理部10内部の概略構成を説明する。
【0064】
図3において、10はデータ処理部であり、17は記憶部である。データ処理部10は21乃至27の符号を付した構成要素を有する。
【0065】
21は前処理部であり、入力画像に対して幾何学的な補正処理、シェーディング処理など、一般的な入力画像の補正処理を行う。
【0066】
22は画像検知部であり、画像検知手段として機能する。画像検知部22は、後で述べる画像の特徴量抽出やそれに基づく検索、登録に必要な画像の種類の分類を行う。分類される画像の種類は、後述する第1種の画像と第2種の画像である。
【0067】
この画像の種類の分類については、画像の種類の情報自体を検知する場合(例えば、ユーザが指定する、MFP本体から検知結果を受け取るなど)と、入力画像自体から判別する場合とがある。後者の場合、画像判別部23がその判別処理を行う。画像判別部23は、例えば後で述べる第1の特徴量を用いて入力画像の種類を判別する、すなわち画像判別手段として機能する。
【0068】
24aは第1の特徴量抽出部であり、第1の特徴量抽出手段として機能する。第1の特徴量抽出部24aは、入力画像から第1の特徴量を抽出する。第1の特徴量は画像検知部22で分類された第1種の画像に対して画像の類似度を算出するのに適した画像の特徴量である。
【0069】
また24bは第2の特徴量抽出部であり、第2の特徴量抽出手段として機能する。第2の特徴量抽出部24bは、入力画像から第2の特徴量を抽出する。第2の特徴量は画像検知部22で分類された第2種の画像に対して画像の類似度を算出するのに適した画像の特徴量である。
【0070】
また逆にこれらの特徴量から画像の種類を判別することもできる。例えば、前述の画像判別部23は、この第1の特徴量を用いて入力画像の種類を第1種であると見なすべきかどうかを判別する。
【0071】
25aは第1種の画像登録部であり、第1種の画像登録手段として機能する。第1種の画像登録部25aは、画像検知部22で第1種の画像と分類された入力画像を第1の特徴量抽出部24aで抽出された第1の特徴量と関連づけて、後述の第1種の画像用辞書データ31a(記憶部17に保存されている)に登録する。
【0072】
また25bは第2種の画像登録部であり、第2種の画像登録手段として機能する。第2種の画像登録部25bは、画像検知部22での分類結果に関わらず、入力画像を第2の特徴量抽出部24bで抽出された第2の特徴量と関連づけて、後述の第2種の画像用辞書データ31b(記憶部17に保存されている)に登録する。
【0073】
26aは第1種の画像検索部であり、第1種の画像検索手段として機能する。第1種の画像検索部25aは、画像検知部22で第1種の画像と分類された入力画像に対して、第1の特徴量抽出部24aで抽出された第1の特徴量に基づき、後述の第1種の画像用辞書データ(記憶部17に保存されている)を検索し、出力画像候補を抽出する。
【0074】
また26bは第2種の画像検索部であり、第2種の画像検索手段として機能する。第2種の画像検索部25bは、画像検知部22で第2種の画像と分類された入力画像に対して、第2の特徴量抽出部24bで抽出された第2の特徴量に基づき、後述の第2種の画像用辞書データ(記憶部17に保存されている)を検索し、出力画像候補を抽出する。
【0075】
27は出力画像作成部であり、上記出力画像候補から出力画像が選択されると記憶部17の蓄積画像データ32を参照して引き出される画像データを受け取り、データ処理部10より出力するために出力画像を作成する。
【0076】
以上がデータ処理部10の構成要素である。画像の登録処理及び検索処理の詳細については、後で図5及び図6を用いてそのフローを説明する。
【0077】
記憶部17は、画像の登録と検索に関わる記憶データとして、31a、31bの辞書データ、32の蓄積画像データを有している。
【0078】
31aは第1種の画像用辞書データであり、画像検知部22で第1種の画像と分類された入力画像が、第1の特徴量抽出部24aで抽出された第1の特徴量と関連づけて登録されており、画像検知部22で第1種の画像と分類された入力画像に対して、第1の特徴量抽出部24aで抽出された第1の特徴量に基づき、検索がかかる。
【0079】
また31bは第2種の画像用辞書データであり、画像検知部22での分類結果に関わらず、入力画像が第2の特徴量抽出部24bで抽出された第2の特徴量と関連づけて登録されており、画像検知部22で第2種の画像と分類された入力画像に対して、第2の特徴量抽出部24bで抽出された第2の特徴量に基づき、検索がかかる。
【0080】
32は蓄積画像データであり、入力画像の辞書データ31aまたは31bへの登録に合わせて、入力画像の画像データが保存される。また入力画像に対する検索時には、検索された辞書データ登録情報に基づき、蓄積画像データ32から該当する画像データが出力画像候補として抽出される。
【0081】
(データ処理部10の動作)
上記したデータ処理部10の各部の機能において特徴的な部分は、画像検知部22での第1種または第2種の画像への分類結果に対して、後の画像登録の動作と、従って辞書データの登録内容が、第1種と第2種の画像に関して対称的でないことである。
【0082】
実際に、入力画像が第1種の画像の場合と第2種の画像の場合とで、画像登録時または画像検索時の処理がどう異なるかを表1に示した。
【0083】
【表1】

【0084】
表1に示すように、入力画像が第1種の画像の場合、第1の特徴量と関連づけて第1種の画像用辞書データに登録するとともに、第2の特徴量と関連づけて第2種の画像用辞書データにも登録している。すなわち第1種の画像である入力画像に対しては、両方の辞書データに登録される。
【0085】
入力画像が第2種の画像の場合は、第2の特徴量と関連づけて第2種の画像用辞書データにだけ登録している。
【0086】
検索時には、第1種の入力画像に対しては、第1の特徴量に基づき、第1種の画像用辞書データのみを検索する。もちろん、第2の特徴量に基づき、第2種の画像用辞書データをも検索することが可能であるが、両方に同じ画像が登録されており、同じ第1種の出力画像が抽出されるのみであり、その必要性がない。
【0087】
第2種の入力画像に対しては、その第2の特徴量に基づき、第2種の画像用辞書データのみを検索する。これは第1種の画像用辞書データの方には登録されていないからである。しかし、第2種の画像用辞書データから抽出される出力画像は、第2種の画像とは限らず、第1種の画像の場合もある。これは第2種の画像用辞書データには第1種の画像も第2の特徴量と関連づけて登録されているからであり、第2種の入力画像に対して、その第2の特徴量に基づいて第1種の出力画像が抽出されることがある。
【0088】
データ処理部10における、こういったデータ処理の特徴がどのような効果に関連しているかを図4を用いて説明する。
【0089】
図4は、画像の種類がカラー画像とモノクロ画像の場合を想定しており、図4(a)はMFPによるカラー画像のモノクロでのプリント時に画像登録する場合の動作を示し、図4(b)はMFPによるモノクロ画像の入力に対して元のカラー画像を検索し、カラープリントする場合の動作を示す。
【0090】
すなわち、図4においては、第1種の画像はカラー画像であり、第1の特徴量はカラー特徴量であり、さらに第2種の画像はモノクロ画像であり、第2の特徴量はモノクロ特徴量である場合を想定している。
【0091】
図4(a)においてカラー画像Aが、例えば通信部15などからプリント用の画像データとして入力される。これは一方でモノクロ画像A’としてモノクロでプリントアウトされる。しかしもう一方では、カラー画像Aとして記憶部17の蓄積画像データ54に追加記憶されるとともに、辞書データ53a及び53bに登録される。
【0092】
登録の手順として、まず画像検知部51でカラー画像であることが検知される。カラー画像はカラー用辞書データ53aとモノクロ用辞書データ53bの両方に登録される。従って、カラー特徴量抽出52aとモノクロ特徴量抽出52bと両方が行われ、それぞれの特徴量を関連づけて、カラー画像Aはカラー用辞書データ53aとモノクロ用辞書データ53bのそれぞれに登録される。すなわちモノクロ用辞書データ53bにもモノクロ特徴量と関連づけたカラー画像Aが登録されている。
図4(b)においてはモノクロ画像A’が、例えば画像読み取り部13などにより画像入力される。これに対して出力すべき画像としてオリジナルの画像の存在が検索される。すなわち、モノクロ画像A’のオリジナルがカラーであればそのカラー画像を出力するという処理動作である。
【0093】
検索の手順としては、まず画像検知部51でモノクロ画像であることが検知される。従って、モノクロ画像A’に対してモノクロ特徴量抽出52bのみが行われ、そのモノクロ特徴量に基づいてモノクロ用辞書データ53bが検索される。しかしモノクロ用辞書データ53bには、オリジナルがモノクロ画像であってもカラー画像であっても登録されているはずである。従ってこの場合、オリジナルのカラー画像Aが抽出され、記憶部17の蓄積画像データ54からカラー画像Aの画像データが引き出され、カラー画像Aとしてカラーでプリントアウトされる。
【0094】
データ処理部10でこのような処理を行うことにより、カラーの原文書をモノクロでプリントした紙文書から、元のカラー文書データを検索し、利用することができる。
【0095】
一方ではモノクロ画像に対して検索をかける必要があるものの、単純にモノクロ特徴量のみを利用して検索するのでは、一方でカラー画像の有する強力な検索特徴、つまりカラー情報を利用できない。モノクロ画像とカラー画像に対して、検索のキーとしてのモノクロ特徴量とカラー特徴量を使い分けることが検索処理を効率的にするが、場合によっては、上記のようにモノクロ特徴量でカラー画像を検索するといった処理を組み込むことが検索の自由度と価値を上げることがある。本実施形態はそういう場合にも適切な動作を行い、検索効果を上げることができる。
【0096】
すなわち、カラー画像とモノクロ画像の場合でいうなら、カラーの特徴量をキーとするカラー用の辞書データにはカラーの原文書のみを登録し、モノクロの特徴量をキーとするモノクロ用辞書データにはすべての原文書を登録しておき、所定の検索処理をかけると、モノクロ文書に対しては、原文書がカラーであっても自動的にモノクロ用辞書データからカラーの原文書を検索することができ、一方カラー文書に対しては、カラー文書のみ検索し、不必要なモノクロ文書の検索を行うこともなく、高精度で、且つ高速な検索を行うことができる。
【0097】
第1種の画像、第2種の画像は、このようにカラー画像、モノクロ画像に限定されるものではない。本発明の実施形態にふさわしいのは、第1種の画像に対して適切な特徴量である第1の特徴量が、第2種の画像に対して適切な特徴量である第2の特徴量を包含するような場合である。このような場合、第1の特徴量の次元数は、第2の特徴量の次元数よりも大きくなる。
【0098】
例えば、カラー特徴量の情報量はモノクロ特徴量の情報を含んでいるが、その逆は言えない。カラー画像をモノクロ画像に変換することは通常容易に行われるが、その逆は原則的にない。このような場合、カラー画像をモノクロ画像から検索することに意味があり、その逆は通常ない。つまり、非対称な関係である。
【0099】
例えば、第1種の画像が複数ページからなる画像、第2種の画像がその中の単独ページからなる画像としてもよい。このような場合第1の特徴量は、情報量として第2の特徴量を包含することになるだろう。単独のページからそれを含む複数のページを検索することはあっても、その逆は意味がない。
【0100】
このような場合、第2種の画像に対しては、原画像が第1種の画像であっても自動的に第2種の画像用辞書データから第1種の画像である原画像を検索することができ、一方、第1種の画像に対しては、第1種の画像のみ検索し、不必要な第2種の画像の検索を行うこともなく、高精度で、且つ高速な検索を行うことができる。
【0101】
(画像登録処理のフロー)
図5を用いてデータ処理部10における画像登録の処理の流れを説明する。また適時図3も参照する。図5は本実施形態に係る画像登録方法のフローチャートである。
【0102】
図5のステップS11では、まず登録するための入力画像が取得される。これは図1における画像読み取り部13あるいは通信部(画像入力部)15などにより取得される。
【0103】
取得された入力画像はデータ処理部10に送られ、ステップS12で前処理が施される。前処理は、図3の前処理部21で行われ、入力画像の幾何学的な位置、方向、大きさなどの補正であったり、読み取りにより発生する色、輝度ムラなどを補正するシェーディング補正であったりする。
【0104】
次いでステップS13では、前処理された入力画像が、入力日時その他のメタデータとともに所定のフォーマットで記憶部17の蓄積画像データ32に保存される。また画像の参照用として、入力画像には画像ID番号が付される。画像ID番号によって辞書データの登録内容(特徴量など)と蓄積画像データ32の画像データとは連結している。
【0105】
ステップS14は第1の特徴量抽出工程であり、入力画像に対する第1の特徴量が第1の特徴量抽出部24aで抽出される。次のステップで入力画像が第1種の画像かどうかを第1の特徴量を用いて判別するためにこういう手順としている。操作部11からのユーザの指定により、あるいは本システムが内蔵されている画像形成装置(MFP)などからの情報により、画像の種類を検知する場合は、その検知後に必要に応じて特徴量を抽出してもよい。
【0106】
ここで第1の特徴量はカラー特徴量であるとして、その具体例を説明する。
【0107】
カラー画像は二次元に配列する画素の集合から構成され、各画素はそれぞれ複数の色成分値を有する。各色成分値は、通常三次元の色空間で規定される。一般に使用される色空間は各種あるが、ここではLab色空間におけるヒストグラムを用いた特徴量、すなわちブロックLabヒストグラムについて述べる。
【0108】
L、a、bの三つの色成分で表されるLab空間を任意のK個のビンに区分する。各画素はその色成分により何れかのビンに該当する。一方でカラー画像全体をI×Jの矩形ブロックに区分けする。その各矩形ブロックごとに、そのブロックを構成する各画素の色成分の該当するビンを求め、K個のビンに対する該当画素の個数、すなわち頻度を求め、各ブロックごとにヒストグラムを作成する。つまり、各ブロックごとに横軸がK個のビン、縦軸が頻度(画素数)のヒストグラムができる。このヒストグラムは独立したK個の値で表され、K次元の空間内の点として記述できる。このヒストグラムをそのブロックの特徴量とすると次元数Kの特徴量となる。
【0109】
入力画像に対しては、ヒストグラムの総数が矩形ブロックの数、すなわちI×J個であるので、I×J個のヒストグラムをこの入力画像のカラー特徴量とすると、次元数はC=I×J×Kとなる。
【0110】
後のステップで抽出する第2の特徴量についても、モノクロ特徴量であるとして、同様の具体例、すなわちブロック輝度ヒストグラムを説明する。
【0111】
モノクロ画像はカラー画像と同様に二次元に配列する画素の集合から構成されるが、各画素はそれぞれ複数の色成分値ではなく単独の輝度値を有する。各画素の輝度値は、1次元の値であり、モノクロ画像に対して先のLab色空間を適用してもL成分値のみの実質1次元の値となる。一方カラー画像に対しては、その3次元の色成分値から1次元の輝度値を算出することができる。つまりカラー画像をモノクロ画像に変換する処理を色成分から輝度値への変換という形で数値的に表現できるのである。例えば紙文書などでは、カラー文書画像からモノクロ文書画像への変換がかなりの頻度で行われることを考えると、前述のようにカラー画像をモノクロ特徴量と関連づけておくことが有効であることが多い。
【0112】
輝度値で表される1次元のスケールを任意のL個のビンに区分する。各画素はその輝度値により何れかのビンに該当する。一方でカラー特徴量の場合と同様、全体をI×Jの矩形ブロックに区分けする。その各矩形ブロックごとに、やはりカラー特徴量と同様に、そのブロックを構成する各画素の輝度値の該当するビンを求め、L個のビンに対する該当画素の頻度(個数)から、各ブロックごとに横軸がL個のビン、縦軸が頻度(画素数)のヒストグラムを作成する。このヒストグラムは次元数Lの特徴量であり、入力画像に対しては、ヒストグラムの総数が矩形ブロックの数(I×J個)であるので、それをこの入力画像のモノクロ特徴量とすると、その次元数はM=I×J×Lとなる。
【0113】
通常L≪Kのため、モノクロ特徴量の次元数M=I×J×Lは、カラー特徴量の次元数C=I×J×Kよりもずっと低い次元数となる。しかしながらMでさえも、一般には非常に高い次元となる。
【0114】
図5に戻り、画像登録処理の説明を続ける。
【0115】
ステップS14で入力画像に対して第1の特徴量を抽出すると、次のステップS15ではその第1の特徴量に基づいて入力画像が第1種の画像であるか第2種の画像であるかの判別を行う。ステップS15は画像検知工程である。
【0116】
判別処理は画像検知部22で行われる。但し、画像の種類に関する情報が、操作部11によるユーザの指定から、あるいは本システムが内蔵された画像形成装置本体から、得られるのではなく、入力画像自体から判別する場合には、画像検知部22内の画像判別部23で判別処理が行われる。従ってステップS15の画像検知工程には画像判別工程も含まれる。
【0117】
例えば、カラー画像(第1種の画像とする)とモノクロ画像(第2種の画像とする)の例で判別処理を説明すると、前述のようにカラー画像のカラー特徴量は3次元の色空間に基づいた特徴量となるが、モノクロ画像のカラー特徴量は実質1次元のL成分のみに基づいた特徴量となる。これにより特徴量に生じてくる差異を利用してカラー画像とモノクロ画像の判別ができる。例えば、カラー特徴量であるブロックLabヒストグラムの、ab成分に該当するビンの値が0であればモノクロ画像、そうでなければカラー画像と判別できる。
【0118】
ステップS15で、入力画像が第1種の画像であると判別された場合(ステップS15:YES)は、次のステップS16を実行する。入力画像が第2種の画像であると判別された場合(ステップS15:NO)は、次のステップS16を省略し、ステップS17を実行する。
【0119】
ステップS16は第1種の画像登録工程である。入力画像が第1種の画像であるので、入力画像を保存した画像ID番号と第1の特徴量とを関連づけて、記憶部17の第1種の画像用辞書データ31aに登録する。登録処理は第1種の画像登録部25aで行われる。
【0120】
ステップS17は第2の特徴量抽出工程であり、入力画像が第1種の画像であるか第2種の画像であるかに関わらず、入力画像に対する第2の特徴量が第2の特徴量抽出部24bで抽出される。第2の特徴量がモノクロ特徴量である場合の特徴量の具体例については既に説明した。
【0121】
ステップS18は第2種の画像登録工程である。入力画像が第1種の画像であるか第2種の画像であるかに関わらず、入力画像を保存した画像ID番号と第2の特徴量とを関連づけて、記憶部17の第2種の画像用辞書データ31bに登録する。登録処理は第2種の画像登録部25bで行われる。
【0122】
例えば、カラー画像(第1種の画像)とモノクロ画像(第2種の画像)の例でステップS16とステップS18の画像登録処理を説明する。
【0123】
前述のように入力画像がカラー画像の場合、C(=I×J×K)次元のカラー特徴量が抽出され、入力画像に付与された画像ID番号と関連づけてカラー画像用辞書データに登録される。また入力画像がカラー画像であってもモノクロ画像であっても、M(=I×J×L)次元のモノクロ特徴量が抽出され、入力画像に付与された画像ID番号と関連づけてモノクロ画像用辞書データに登録される。
【0124】
表2にカラー画像用辞書データ及びモノクロ画像用辞書データのデータ構造例を示す。
【0125】
【表2】

【0126】
カラー画像用辞書にはカラー画像のみが登録され、各画像のID番号(表では1からN)に対して、C次元のカラー特徴量(表では1からC)が連繋して記憶される。モノクロ画像用辞書にはカラー画像及びモノクロ画像が登録され、各画像のID番号(表では1からN)に対して、M次元のカラー特徴量(表では1からM)が連繋して記憶される。
【0127】
画像ID番号については、特徴量に基づき検索した画像(のID番号)から画像データを参照するためのものであり、画像データを参照可能であれば、表2とは異なる任意のID番号付与方法が可能である。また、特徴量はそれを元に画像検索するためのものであり、検索の目的に応じて記憶する特徴量の構成を変えてもよい。
【0128】
また上記以外に、検索に役立てるためあるいはそれ以外の目的で、各画像に付随する任意のメタデータを合わせて記憶させていてもよい。また、後述するように検索をより効率化するために、検索用のインデックスを付与し、記憶させていてもよい。
【0129】
上記辞書データを用いた検索処理の具体例については後述する。
【0130】
以上データ処理部10における画像登録方法の説明を終える。
【0131】
(画像検索処理のフロー)
図6を用いてデータ処理部10における画像検索の処理の流れを説明する。また適時図3も参照する。図6は本実施形態に係る画像検索方法のフローチャートである。
【0132】
図6のステップS21では、まず操作部11からのユーザの指示などで検索が開始されると、検索の基準となる入力画像が取得される。これは図1における画像読み取り部13あるいは通信部(画像入力部)15などにより取得される。
【0133】
取得された入力画像はデータ処理部10に送られ、ステップS22で前処理が施される。前処理は、図3の前処理部21で行われ、入力画像の幾何学的な位置、方向、大きさなどの補正であったり、読み取りにより発生する色、輝度ムラなどを補正するシェーディング補正であったりする。
【0134】
ステップS23は第1の特徴量抽出工程であり、入力画像に対する第1の特徴量が第1の特徴量抽出部24aで抽出される。次のステップで入力画像が第1種の画像かどうかを第1の特徴量を用いて判別するためにこういう手順としている。操作部11からのユーザの指定により、あるいは本システムが内蔵されている画像形成装置(MFP)などからの情報により、画像の種類を検知する場合は、その検知後に必要に応じて特徴量を抽出してもよい。
【0135】
第1の特徴量がカラー特徴量であるとしたときの、特徴量の具体例は画像登録処理のフローで既に述べたとおりである。
【0136】
入力画像に対する第1の特徴量が抽出されると、次のステップS24ではその第1の特徴量に基づいて入力画像が第1種の画像であるか第2種の画像であるかの判別を行う。ステップS24は画像検知工程である。
【0137】
判別処理は画像検知部22で行われる。但し、画像の種類に関する情報が、操作部11によるユーザの指定から、あるいは本システムが内蔵された画像形成装置本体から、得られるのではなく、入力画像自体から判別する場合には、画像検知部22内の画像判別部23で判別処理が行われる。従ってステップS24の画像検知工程には画像判別工程も含まれる。
【0138】
判別処理については、画像登録処理の場合と同様である。
【0139】
以上の各ステップについては、画像登録処理の場合と同様であるが、次のステップからは各工程の内容が異なってくる。
【0140】
ステップS24で、入力画像が第1種の画像であると判別された場合(ステップS24:YES)は、次のステップS25を実行する。入力画像が第2種の画像であると判別された場合(ステップS24:NO)は、ステップS26を実行する。
【0141】
ステップS25は第1種の画像検索工程である。入力画像が第1種の画像であるので、抽出された第1の特徴量に基づいて記憶部17の第1種の画像用辞書データ31aを検索する。第1の特徴量に基づく類似度の高い出力画像候補を抽出し、その画像ID番号をもとに同じく記憶部17の蓄積画像データ32から該当する画像データを参照してくる。従って出力画像候補は第1種の画像である。検索処理は第1種の画像検索部25aで行われる。ステップS25で出力画像候補が抽出されるとステップS28に進む。
【0142】
一方、入力画像が第2種の画像の場合に実行されるステップS26は、第2の特徴量抽出工程であり、第2種の画像である入力画像に対する第2の特徴量が第2の特徴量抽出部24bで抽出される。第2の特徴量がモノクロ特徴量である場合の特徴量の具体例についても既に説明した。
【0143】
次のステップS27は第2種の画像検索工程である。入力画像が第2種の画像であるので、抽出された第2の特徴量に基づいて記憶部17の第2種の画像用辞書データ31bを検索する。第2の特徴量に基づく類似度の高い出力画像候補を抽出し、その画像ID番号をもとに同じく記憶部17の蓄積画像データ32から該当する画像データを参照してくる。従って出力画像候補は第1種の画像または第2種の画像の何れかである。検索処理は第2種の画像検索部25aで行われる。
【0144】
例えば、カラー画像(第1種の画像)とモノクロ画像(第2種の画像)の例でステップS25とステップS27の画像検索処理を説明する。
【0145】
前述の表2のように、カラー画像用辞書データにはカラー画像のみが登録され、カラー画像の画像ID番号と関連づけてC(=I×J×K)次元のカラー特徴量が登録されている。またモノクロ画像用辞書データにはカラー画像及びモノクロ画像が登録され、カラー画像及びモノクロ画像の画像ID番号と関連づけてM(=I×J×L)次元のモノクロ特徴量が登録されている。
【0146】
検索の基準となる入力画像がカラー画像であった場合、カラー特徴量に基づいてカラー画像用辞書データを検索する。入力画像のカラー特徴量と、カラー画像用辞書データに登録されているそれぞれの画像のカラー特徴量とを、カラー特徴量のC次元空間で比較し、C次元空間内で定義された距離を算出する。その距離を類似度(ゼロに近いほど類似している)とし、カラー画像用辞書データに登録されている画像について逐次その距離を求め、類似度の高い(距離の小さい)カラー特徴量に該当する画像ID番号を出力画像候補として抽出する。
【0147】
また検索の基準となる入力画像がモノクロ画像であった場合も同様に、モノクロ特徴量に基づいてモノクロ画像用辞書データを検索する。入力画像のモノクロ特徴量と、モノクロ画像用辞書データに登録されているそれぞれの画像のモノクロ特徴量とを、モノクロ特徴量のM次元空間で比較し、M次元空間内で定義された距離を算出する。その距離を類似度(ゼロに近いほど類似している)とし、モノクロ画像用辞書データに登録されている画像について逐次その距離を求め、類似度の高い(距離の小さい)モノクロ特徴量に該当する画像ID番号を出力画像候補として抽出する。
【0148】
ここで、入力画像がカラー画像であった場合、カラー特徴量に基づいて、カラー画像だけが登録されているカラー画像用辞書データを検索するので、出力画像候補はすべてカラー画像である。一方、入力画像がモノクロ画像であった場合、モノクロ特徴量に基づいて、カラー画像及びモノクロ画像の両方が登録されたモノクロ画像用辞書データを検索するので、出力画像候補はカラー画像またはモノクロ画像の何れかとなる。
【0149】
検索処理は一般に、上記のCやMで記した高次元の特徴量に対して、上記のような類似度合いを算出していかねばならないので、精度を落とさず効率をいかに上げるかが重要である。本システムのような画像検索方法によれば、モノクロ文書に対しては、原文書がカラーであっても自動的にモノクロ用辞書データからカラーの原文書を検索することができ、一方カラー文書に対しては、カラー文書のみ検索し、不必要なモノクロ文書の検索を行うこともなく、高精度で、且つ高速な検索を行うことができる。
【0150】
また本システムにおいて、さらに検索効率を上げるためには、各辞書データに検索用のインデックスを付与することが望ましい。これについては後述する。
【0151】
ところで、上記のような本システムでのカラー文書画像(第1種の画像とする)とモノクロ文書画像(第2種の画像とする)の扱いが検索に不都合を生ずる場合もある。
【0152】
例えば、カラー特徴量を用いたカラー画像とモノクロ画像の判別処理について、カラー特徴量は3次元の色空間に基づいた特徴量となるが、モノクロ画像のカラー特徴量は実質1次元のL成分のみに基づいた特徴量となり、これにより特徴量に生じてくる差異を利用してカラー画像とモノクロ画像の判別ができると述べた。
【0153】
しかし、モノクロ画像であっても一部分がカラー画像になっているという場合もある。例えば、モノクロの文書画像の一部に赤ペンでの追記があるといった場合であるが、このような場合は、その文書画像が本来モノクロであることを考慮すれば、モノクロ画像としてモノクロ特徴量を検索に用いた方がより適切な検索が可能になる。
【0154】
本システムでの画像登録時には、登録する入力画像がカラー画像と判別されると、カラー特徴量とモノクロ特徴量を両方抽出し、カラー画像用の辞書データとモノクロ画像用の辞書データと両方に登録される。つまり、それが検索対象のオリジナルであり、カラー画像からもモノクロ画像からも検索可能となっている。
【0155】
しかし、本システムでの画像検索時には、検索の基準となる入力画像がカラー画像と判別されると、カラー特徴量だけを抽出し、カラー画像用の辞書データだけを検索することになり、従って原画像がモノクロ画像であった場合には、その原画像はカラー画像用の辞書データには登録されていないため、検索されなくなってしまう。
【0156】
このような不都合を防ぐために、例えば以下のような対処を行った方がよい。
【0157】
画像判別部23における入力画像の判別処理時に、画像の区分けされた領域ごとに判別を行い、第1種の画像と判別される領域と第2種の画像と判別される領域と、両方が入力画像に含まれる場合は、入力画像の全体領域に対する第1種の画像と判別される領域の占める割合を算出し、その割合が所定のしきい値以上の場合に入力画像を第1種の画像と判別し、そうでない場合には第2種の画像と判別する。
【0158】
上記に従えば、入力画像が第2種の画像と判別されても、第1種の画像に相当する領域を有する場合があることになる。第2種の画像検索部26bにおける検索処理時には、この画像から抽出した第2の特徴量を用いて第2種の画像用辞書データを検索することになるが、その際、検索の精度を上げるため、第1種の画像に相当する領域の特徴量は検索に使用しない。すなわち、その画像中の第1種の画像領域を除いた部分に対応する第2の特徴量に基づいて、第2種の画像用辞書データを検索し、対応する出力画像候補を抽出する。
【0159】
このような対処により、モノクロの原文書に対して、カラーの付加した文書からも適切に検索をかけて、出力画像としてモノクロの原文書を抽出することが可能となる。
【0160】
図6に戻り、次のステップS28では、抽出された出力画像候補について表示部12に表示するためデータ処理部10より出力する。表示部12に表示されるのは一般にサムネイルと称される縮小された簡略化画像である。
【0161】
図7に表示部12に表示される状態の例を示す。図7では、左の61に検索の基準となる入力画像のサムネイルが表示され、右側に検索して抽出された六つの出力画像候補のサムネイルが類似度合いの順に表示されている。例えば、62が最も類似した出力画像候補であり、63が六つのうちで最も類似していない出力画像候補である。
【0162】
ユーザはこの表示に基づき、最適な出力画像を選択し、操作部11を通じてデータ処理部10に指定入力する。データ処理部10は出力画像の指定を受け、該当するID番号の画像データを記憶部17の蓄積画像データ32を参照して引き出し、出力画像作成部27に渡す。
【0163】
次のステップS29では、出力画像作成部27は、蓄積画像データ32からの画像データを受け取り、データ処理部10より出力するために出力画像を作成する。
【0164】
以上で、データ処理部10における画像検索方法の説明を終える。
【0165】
(検索用インデックスを用いた検索処理)
本実施形態によれば、第1種の画像と第2種の画像とで辞書データを切り分けて検索し、且つその登録内容を工夫することにより、精度よく且つ効率よく検索できるようにしている。しかし、さらなる効率化のため、あるいは他の目的であっても様々な変更が可能である。
【0166】
例えば、検索用のインデックスを用いることでさらに検索を効率化することができる。検索用のインデックスの付け方は、様々な公知の方法を適用することが可能であるが、ここではk−D木を使用した検索用インデックスを説明する。
【0167】
いわゆる木構造を形成するように分類しておき、検索時には木の幹から枝分かれしながら辿っていくことで最小の手数で枝先端まで達するという考え方に基づいている。
【0168】
分類木の構成方法を以下に手順で示すと、
(1−1)サンプルとしてN個の画像があればN個の特徴量があり、N個の特徴量は高次元の特徴量空間中にサンプル点として分布している。この特徴量空間中に任意の特徴軸を選択し、その軸に垂直な超平面を考える。特徴量空間内でN個の特徴量のサンプル点がその超平面で等分されるよう超平面の位置を決めて、特徴量空間を2分割する。
(1−2)2分された特徴量空間のそれぞれについて、また別の特徴軸を用いて、1と同様にして空間をさらに2分割する。
(1−3)以下、分割された各特徴量空間ごとに、特徴軸を変更しながら分割を続け、最終的に分割された各特徴量空間に特徴量のサンプル点が1つだけになるまで特徴量空間を分割する。
【0169】
図8には、2次元の特徴量空間の場合に、空間60が分割されている状態を例示した。全体の領域が上下に2分割され、さらに各々の領域が左右に2分割され、また上下に2分割され、2分割を3回続けることで8個の特徴量のサンプル点66が8個の分割された領域67に各一つずつ入るように分割されている。このそれぞれの分割空間(すなわち各サンプル点)への到達経路を示すよう検索用インデックスを付与する。
【0170】
新しく特徴量のサンプル点が追加登録されるときは、枝の先端部で木構造を修正することになる。それに従って該当する部分の検索用インデックスも更新処理を行う。
【0171】
上記分類木による検索方法を以下に手順で示すと、
(2−1)検索のキーとなる特徴量が与えられると、その特徴量もこの分割された特徴量空間の何れかに特徴点(質問点と呼ぶ)として位置することになる。上記の分割は2分木となっているので、2分木を辿ってこの特徴点の属する分割空間を特定していく動作は、すなわちこの特徴点の属する分割空間の検索用インデックスを求める動作である。求めたインデックスに従いその分割空間に属するサンプル点を検出する。
(2−2)質問点を中心とし、検出されたサンプル点を表面に含む超球を考え、超球と交わる分割空間を求める。
(2−3)1で検出されたサンプル点、及び2で検出された分割空間中のサンプル点の中で最も質問点までの距離が近いものを、それぞれ距離計算を行って比較することにより求める。
【0172】
上記のように、予め木構造の検索用インデックスを付与しておけば、特徴量空間での距離計算は近傍のサンプル点だけでよく、後はキーとなる特徴量の点、つまり質問点がどの分割空間に属するかを木構造を辿って特定する動作だけである。
【0173】
本実施形態の検索システムにおいては、第1種の画像用辞書データと第2種の画像用辞書データとが切り分けて用意されているので、検索用インデックスもそれに対応して、第1種の画像検索用インデックスと第2種の画像検索用インデックスとを切り分けて用意することになる。
【0174】
なお、検索用インデックスを切り分けることにより、辞書データについても、第1種の画像用と第2種の画像用を別々の記憶データとするのではなく、一つの記憶データの中に両者を含めておくことが可能である。記憶されている個々の画像データの登録内容が、第1種の画像用辞書データに該当するのか第2種の画像用辞書データに該当するのか、その切り分けは、検索時に検索用インデックスを切り換えることで行うことにすれば、同一の記憶データの中から両者を切り分けて検索することも可能である。
【0175】
以上のように、本実施形態によれば、入力画像の特徴量に基づいて辞書データを検索し、記憶された画像データの中から類似の特徴量を有する画像を抽出するに当たって、画像の種類によって検索のための適切な特徴量が異なっても、それらのうち1つの特徴量に対して1種類の画像を登録した辞書データと、他の特徴量に対してすべての種類の画像を登録した辞書データとを用意し、検索元の入力画像の種類に応じて、検索する特徴量とそれに対応する辞書データを切り換えることで、精度が高く、かつ効率的な検索を行うことができる。
【0176】
なお本発明の実施形態は、上記の実施形態に限定されるものではなく、本発明の趣旨に則る限り、様々な変更された形態もその範囲に含まれるものである。
【図面の簡単な説明】
【0177】
【図1】本実施形態に係る画像検索システム及び画像登録システムの構成例を示すブロック図である。
【図2】MFPに内蔵されるシステムとして、(a)はMFPによる文書画像の複写時に画像登録する場合の、(b)はMFPによる文書画像の複写時に画像検索する場合の、それぞれ画像検索システム1の動作を説明する図である。
【図3】図1におけるデータ処理部10の内部構成例を示すブロック図である。
【図4】(a)はMFPによるカラー画像のモノクロでのプリント時に画像登録する場合の、(b)はMFPによるモノクロ画像の入力に対して元のカラー画像を検索し、カラープリントする場合の、それぞれ動作を示す図である。
【図5】本実施形態に係る画像登録方法の処理の流れを示すフローチャートである。
【図6】本実施形態に係る画像検索方法の処理の流れを示すフローチャートである。
【図7】表示部12に出力画像候補が表示される状態の例を示す図である。
【図8】検索のため2分木を構成し、2次元の特徴量空間が分割されている状態を例示した図である。
【符号の説明】
【0178】
1 画像検索システム(及び画像登録システム)
2 ネットワーク
3、4、5 外部装置
10 データ処理部
11 操作部
12 表示部
13 画像読み取り部
14 プリント部
15 通信部(画像入力部)
16 通信部(画像出力部)
17 記憶部
21 前処理部
22 画像検知部
23 画像判別部
24a 第1の特徴量抽出部
24b 第2の特徴量抽出部
25a 第1種の画像登録部
25b 第2種の画像登録部
26a 第1種の画像検索部
26b 第2種の画像検索部
27 出力画像作成部
31a 第1種の画像用辞書データ
31b 第2種の画像用辞書データ
32 蓄積画像データ
41 原文書画像A
42 複写文書画像A’
43 複写文書画像A”
44 複写文書画像A’
45 カラー画像A
46 モノクロ画像A’
47 モノクロ画像A’
48 カラー画像A

【特許請求の範囲】
【請求項1】
取得した入力画像に対して画像の特徴量を算出し、前記特徴量に基づいて所定の辞書データを検索し、前記入力画像と前記特徴量が対応する出力画像を抽出する画像検索システムであって、
前記入力画像から第1の特徴量を抽出する第1の特徴量抽出手段と、
前記入力画像から第2の特徴量を抽出する第2の特徴量抽出手段と、
前記入力画像が第1種の画像であるか第2種の画像であるかを検知する画像検知手段と、
前記第1の特徴量を検索キーとして、前記第1種の画像が登録された第1種の画像用辞書データと、
前記第2の特徴量を検索キーとして、前記第1種の画像と前記第2種の画像とが登録された第2種の画像用辞書データと、
前記画像検知手段による前記入力画像の検知結果が前記第1種の画像である場合に、前記入力画像の前記第1の特徴量に基づいて、前記第1種の画像用辞書データを検索し、対応する出力画像候補を抽出する第1種の画像検索手段と、
前記画像検知手段による前記入力画像の検知結果が前記第2種の画像である場合に、前記入力画像の前記第2の特徴量に基づいて、前記第2種の画像用辞書データを検索し、対応する出力画像候補を抽出する第2種の画像検索手段と、を有する、
ことを特徴とする画像検索システム。
【請求項2】
前記第2の特徴量抽出手段が抽出する前記第2の特徴量の次元数は、
前記第1の特徴量抽出手段が抽出する前記第1の特徴量の次元数よりも小さい、
ことを特徴とする請求項1に記載の画像検索システム。
【請求項3】
前記画像検知手段は、
前記第1の特徴量に基づき、前記入力画像が前記第1種の画像であるか前記第2種の画像であるかを判別する画像判別手段を有する、
ことを特徴とする請求項1または2に記載の画像検索システム。
【請求項4】
前記入力画像が、その画像中に第1種の画像領域と第2種の画像領域を有する場合、
前記画像判別手段は、
前記入力画像において前記第1種の画像領域が画像全領域に対して占める割合に応じて、前記入力画像が前記第1種の画像であるか前記第2種の画像であるかを判別し、
前記第2種の画像検索手段は、
前記画像判別手段が前記入力画像を前記第2種の画像であると判別した場合、前記入力画像の前記第2の特徴量のうち、その画像中の前記第1種の画像領域を除いた部分に対応する前記第2の特徴量に基づいて、前記第2種の画像用辞書データを検索し、対応する出力画像候補を抽出する、
ことを特徴とする請求項3に記載の画像検索システム。
【請求項5】
前記第1種の画像用辞書データまたは前記第2種の画像用辞書データに登録されている画像の画像データは、ネットワークで接続された機器に分散されて格納されている、
ことを特徴とする請求項1乃至4の何れか1項に記載の画像検索システム。
【請求項6】
前記第1種の画像検索手段は、
前記入力画像の前記第1の特徴量に基づき、第1種の画像検索用インデックスを用いて、前記第1種の画像用辞書データを検索し、対応する出力画像候補を抽出し、
前記第2種の画像検索手段は、
前記入力画像の前記第2の特徴量に基づき、第2種の画像検索用インデックスを用いて、前記第2種の画像用辞書データを検索し、対応する出力画像候補を抽出する、
ことを特徴とする請求項1乃至5の何れか1項に記載の画像検索システム。
【請求項7】
前記第1種の画像はカラー画像であり、
前記第1の特徴量は、カラー特徴量であり、
前記第2種の画像はモノクロ画像であり、
前記第2の特徴量は、モノクロ特徴量である、
ことを特徴とする請求項1乃至6の何れか1項に記載の画像検索システム。
【請求項8】
請求項1乃至5の何れか1項に記載の画像検索システムで用いられる辞書データへの画像登録システムであって、
前記第1の特徴量抽出手段と、
前記第2の特徴量抽出手段と、
前記画像検知手段と、
前記第1種の画像用辞書データと、
前記第2種の画像用辞書データと、
前記画像検知手段による前記入力画像の検知結果が前記第1種の画像である場合に、前記第1種の画像用辞書データに、前記第1の特徴量と関連づけて前記入力画像を登録する第1種の画像登録手段と、
前記画像検知手段による前記入力画像の検知結果に関わらず、前記第2種の画像用辞書データに、前記第2の特徴量と関連づけて前記入力画像を登録する第2種の画像登録手段と、を有する、
ことを特徴とする画像登録システム。
【請求項9】
前記第1種の画像登録手段は、
前記第1種の画像用辞書データに、前記入力画像を登録するとともに、前記入力画像の前記第1の特徴量に基づき第1種の画像検索用インデックスを更新し、
前記第2種の画像登録手段は、
前記第2種の画像用辞書データに、前記入力画像を登録するとともに、前記入力画像の前記第2の特徴量に基づき第2種の画像検索用インデックスを更新する、
ことを特徴とする請求項8に記載の画像登録システム。
【請求項10】
前記第1種の画像はカラー画像であり、
前記第1の特徴量は、カラー特徴量であり、
前記第2種の画像はモノクロ画像であり、
前記第2の特徴量は、モノクロ特徴量である、
ことを特徴とする請求項8または9に記載の画像登録システム。
【請求項11】
取得した入力画像に対して画像の特徴量を算出し、前記特徴量に基づいて所定の辞書データを検索し、前記入力画像と前記特徴量が対応する出力画像を抽出する画像検索方法であって、
前記入力画像から第1の特徴量を抽出する第1の特徴量抽出工程と、
前記入力画像から第2の特徴量を抽出する第2の特徴量抽出工程と、
前記入力画像が第1種の画像であるか第2種の画像であるかを検知する画像検知工程と、
前記画像検知工程における前記入力画像の検知結果が前記第1種の画像である場合に、前記入力画像の前記第1の特徴量に基づいて、前記第1種の画像が登録された第1種の画像用辞書データを検索し、対応する出力画像候補を抽出する第1種の画像検索工程と、
前記画像検知工程における前記入力画像の検知結果が前記第2種の画像である場合に、前記入力画像の前記第2の特徴量に基づいて、前記第1種の画像と前記第2種の画像とが登録された第2種の画像用辞書データを検索し、対応する出力画像候補を抽出する第2種の画像検索工程と、を備える、
ことを特徴とする画像検索方法。
【請求項12】
前記第2の特徴量抽出工程において抽出される前記第2の特徴量の次元数は、
前記第1の特徴量抽出工程において抽出される前記第1の特徴量の次元数よりも小さい、
ことを特徴とする請求項11に記載の画像検索方法。
【請求項13】
前記画像検知工程は、
前記第1の特徴量に基づき、前記入力画像が前記第1種の画像であるか前記第2種の画像であるかを判別する画像判別工程を有する、
ことを特徴とする請求項11または12に記載の画像検索方法。
【請求項14】
前記入力画像が、その画像中に第1種の画像領域と第2種の画像領域を有する場合、
前記画像判別工程では、
前記入力画像において前記第1種の画像領域が画像全領域に対して占める割合に応じて、前記入力画像が前記第1種の画像であるか前記第2種の画像であるかを判別し、
前記第2種の画像検索工程では、
前記画像判別工程において前記入力画像が前記第2種の画像であると判別された場合、前記入力画像の前記第2の特徴量のうち、その画像中の前記第1種の画像領域を除いた部分に対応する前記第2の特徴量に基づいて、前記第2種の画像用辞書データを検索し、対応する出力画像候補を抽出する、
ことを特徴とする請求項13に記載の画像検索方法。
【請求項15】
前記第1種の画像用辞書データまたは前記第2種の画像用辞書データに登録されている画像の画像データは、ネットワークで接続された機器に分散されて格納されている、
ことを特徴とする請求項11乃至14の何れか1項に記載の画像検索方法。
【請求項16】
前記第1種の画像検索工程では、
前記入力画像の前記第1の特徴量に基づき、第1種の画像検索用インデックスを用いて、前記第1種の画像用辞書データを検索し、対応する出力画像候補を抽出し、
前記第2種の画像検索工程では、
前記入力画像の前記第2の特徴量に基づき、第2種の画像検索用インデックスを用いて、前記第2種の画像用辞書データを検索し、対応する出力画像候補を抽出する、
ことを特徴とする請求項11乃至15の何れか1項に記載の画像検索方法。
【請求項17】
前記第1種の画像はカラー画像であり、
前記第1の特徴量は、カラー特徴量であり、
前記第2種の画像はモノクロ画像であり、
前記第2の特徴量は、モノクロ特徴量である、
ことを特徴とする請求項11乃至16の何れか1項に記載の画像検索方法。
【請求項18】
請求項11乃至15の何れか1項に記載の画像検索方法において用いられる辞書データへの画像登録方法であって、
前記第1の特徴量抽出工程と、
前記第2の特徴量抽出工程と、
前記画像検知工程と、
前記画像検知工程における前記入力画像の検知結果が前記第1種の画像である場合に、前記第1種の画像用辞書データに、前記第1の特徴量と関連づけて前記入力画像を登録する第1種の画像登録工程と、
前記画像検知工程における前記入力画像の検知結果に関わらず、前記第2種の画像用辞書データに、前記第2の特徴量と関連づけて前記入力画像を登録する第2種の画像登録工程と、を備える、
ことを特徴とする画像登録方法。
【請求項19】
前記第1種の画像登録工程では、
前記第1種の画像用辞書データに、前記入力画像を登録するとともに、前記入力画像の前記第1の特徴量に基づき第1種の画像検索用インデックスを更新し、
前記第2種の画像登録工程では、
前記第2種の画像用辞書データに、前記入力画像を登録するとともに、前記入力画像の前記第2の特徴量に基づき第2種の画像検索用インデックスを更新する、
ことを特徴とする請求項18に記載の画像登録方法。
【請求項20】
前記第1種の画像はカラー画像であり、
前記第1の特徴量は、カラー特徴量であり、
前記第2種の画像はモノクロ画像であり、
前記第2の特徴量は、モノクロ特徴量である、
ことを特徴とする請求項18または19に記載の画像登録方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate