説明

画像処理装置

【課題】集合画像を使用するマップ探索型の画像閲覧方法を実現する画像処理装置において、複数種類の集合画像を用意せずにマップの表示形態の種類を増やすことができる画像処理装置を提供すること。
【解決手段】複数のサムネイル124を表示するための表示画面119を生成する表示画面生成部118を備え、表示画面生成部118は、サムネイル124がカテゴリ毎に集められ、サムネイル124が配置されていない領域が透明化された集合画像121を互いに異なる領域に配置した表示画面119を生成する第1モードと、集合画像121を重ねて配置した表示画面119を生成する第2モードとのなかでクライアント装置100によって選択されたモードをとる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像処理装置に関し、特に、画像データベースに蓄積された画像データのサムネイルの一覧等のような、複数の画像の一覧を表示画面に表示する画像処理装置に関する。
【背景技術】
【0002】
従来、紙文書をスキャナ等の入力デバイスを使用して電子化する電子ファイリングを行う装置は存在していたが、大量に紙文書を扱う業務用途にとどまっていた。
【0003】
近年、スキャナの低価格化、スキャン機能を搭載したMFP(Multi Function Printer)の普及、および、e−文書法等の法制化により、一般的なオフィスにおいてもハンドリングの良さや利便性が認知され、紙文書をスキャンして電子化する機会が増えてきている。
【0004】
また、電子化された文書画像データ、写真画像データおよびPC(Personal Computer)等のアプリケーションによって作成された文書データ等をデータベース(以下、「DB」という。)化して一元管理する画像DBの用途も併せて増えてきている。例えば、紙文書の原本を保存しておく必要があっても、管理のしやすさ、検索のしやすさという点で画像DBを構築するようになってきている。
【0005】
このような画像DBは、サーバ装置を設置してインターネットやLANを介して多数の人がアクセスする大規模なものから、個人のPC内にDBを構築するパーソナル用途のものまで様々である。また、近年のMFPは、文書を蓄積するHDDを備えており、MFPをベースとした画像DBを構築する例もある。
【0006】
このような画像DB内の画像を閲覧するときに、DB内に複数の画像が蓄積されている場合には、ユーザが目的とする画像を検索する必要がある。画像を検索する場合に、検索対象の画像の画像名(ファイル名)が既知であれば、画像名の一覧から検索することもできるが、多くの場合には、サムネイル一覧表示が使用される。
【0007】
例えば、ユーザに文書画像を検索させる場合には、キーワード検索で検出された候補画像を対象としたサムネイル一覧表示を行い、検索対象画像を選択させたり、最初からサムネイル一覧表示を行って検索対象画像を探し出させたりする方法がとられている。
【0008】
サムネイル一覧表示は、複数の縮小画像を画面上に並べて表示することで、簡易に画像の内容を把握させることを目的としている。一般的に、サムネイル一覧表示は、限られた画面上に複数の画像を一度に表示するため、個々のサムネイルの解像度を大きく低下させる。
【0009】
このようなサムネイル一覧表示では、写真画像が対象の場合には、解像度を低下させた縮小画像であっても、その内容をユーザに比較的容易に把握させることができるが、文字中心の文書画像が対象の場合には、ユーザが縮小画像で文字を判読することが困難であるため、文書画像の内容をユーザに把握させることが難しい。
【0010】
このような文書画像を検索させる場合には、ビューア等を使ってユーザに個々の文書画像を拡大表示させて確認させる必要があり、検索時の操作性が非常に悪いという問題がある。
【0011】
また、特にネットワークを介したサーバ・クライアントシステムにおいては、ビューアで画像を表示するときに新たに解像度の高い画像データをサーバからクライアント側に転送する必要があるため、数多く画像を確認させるためには多くの処理時間が必要となり、生産性が低下するという問題がある。
【0012】
また、前述したような画像DBにおいては、蓄積画像数が増えると、そのDBに蓄積されている画像の全容を把握するのが難しいという問題がある。通常のサムネイル一覧表示において、蓄積画像数が数千画像程度になると、それら全てをチェックすることは、ユーザにとって非常に厳しい(つらい)作業になるため、特定の画像が絶対に必要な場合以外には、そのような行為が行われることは通常はなく、また行われたとしても、ランダムに並んだサムネイル一覧からDBの全容を推測することは非常に困難である。
【0013】
これは画像DBのブラックボックス化を示していると考えられ、例えば、WWW(World Wide Web)等のように世界中の莫大な情報を対象とする画像DBにおいては、ユーザが必要とする情報がほぼ確実に存在し得るため、ユーザは安心して検索等を行うが、通常のローカルな画像DBにおいては、「どのような情報がどれだけ蓄積されているか?」という情報は、ユーザの記憶にのみ依存し、その記憶を頼りにユーザがキーワードや日付等により蓄積画像を検索し、所望の情報を得るしかなく、ユーザに忘れられた情報は活用される機会を失うこととなり、画像DBの活用効率を落とす要因になる。
【0014】
上述したような問題に対して、画像を2次元または3次元のマップ上に配置して閲覧利用者が全体俯瞰、ズームおよびスクロール等の機能を使用して地図上を散策するようなイメージで情報空間を散策するマップ探索型の画像閲覧方法が提案されている(例えば、特許文献1参照)。
【0015】
しかし、マップ探索型の画像閲覧方法において、画像DBの全容を把握するためには、DB内に蓄積された画像を一覧させるために一度に多量の表示画像を表示する必要がある。
【0016】
これに対し、一覧表示画面の表示倍率が小さく、表示画面内に表示する画像数が多い場合には、高速に表示が可能な集合画像を表示することにより実際に表示する画像を少なくし、表示倍率が大きく画面内に表示する画像数が少ない場合には、個々のサムネイルを表示することによって、軽快な多量の画像表示と、個々の精細な画像表示との切り替えをシームレスに実現できるマップ探索型の画像閲覧方法が提案されている(例えば、特許文献2参照)。
【0017】
また、マップ探索型の画像閲覧方法において、画像をカテゴリ毎に分類し、分類したカテゴリ毎の画像のサムネイルをまとめて配置する文書分類方法も提案されている(例えば、特許文献3参照)。
【0018】
この文書分類方法は、大分類として文書タイプで分類を行い、中、小分類として色や形状、レイアウト等で分類を行い、階層的に画像が分類された画像マップから画像を検索させる。ここで、この文書分類方法による分類は、階層的になされているが、大分類による検索キー(以下、「分類キー」という。)、すなわち、初期分類キーは、固定されていることになる。
【0019】
このように分類された画像マップからユーザに画像を検索させる場合には、検索に使用する初期分類キーは、いくつかの選択肢があった方がよい。例えば、検索対象の画像の記憶により初期の絞り込みを文書タイプで探したい場合もあれば、色情報で探したい場合も考えられる。
【0020】
しかし、上述した文書分類方法では、階層的にいくつかの分類キーによって分類されているが、最初にユーザがカテゴリを選択するのは文書タイプで固定されているため、このような要求には答えられない。
【特許文献1】特開2003−76718号公報
【特許文献2】特願2008−022603号
【特許文献3】特願2007−116070号
【発明の開示】
【発明が解決しようとする課題】
【0021】
このように複数の分類キーに対応するには、複数の画像配置(換言すれば、大分類カテゴリ毎に異なる複数のマップ)を用意しておけばよいが、特許文献2に開示された高速に大量の画像を表示する目的によって集合画像を使用する画像閲覧方法の場合には、処理コストの大きな複数種類の集合画像を用意する必要が生じるために問題が生じる。
【0022】
すなわち、集合画像は、個別画像と比較してサイズの大きな画像となるため、複数種類の集合画像を用意することは、サーバのディスク容量を圧迫する。また、画像を新たに登録する場合やマップ上の画像の位置を変更するときには、集合画像を変更する必要が生じるため、集合画像の種類分の処理時間が必要となり、サーバ側の負荷が大きくなってしまう。
【0023】
サーバ側のディスク容量や負荷の増大は、一台のサーバあたりで対応可能なユーザ数が減ってしまうことになり、多くのユーザを備えたシステムではサーバ台数が多くなり、結果としてコストが大きくなることになる。
【0024】
本発明は、従来の課題を解決するためになされたもので、集合画像を使用するマップ探索型の画像閲覧方法を実現する画像処理装置において、複数種類の集合画像を用意せずにマップの初期分類キー、換言すればマップの表示形態の種類を増やすことができる画像処理装置を提供することを目的とする。
【課題を解決するための手段】
【0025】
本発明の画像処理装置は、複数の表示用画像を表示するために表示倍率に応じた一覧表示画面を生成する表示画面生成部を備えた画像処理装置であって、前記表示画面生成部は、前記表示用画像がカテゴリ毎に集められ、前記表示用画像が配置されていない領域が透明化された集合画像を互いに異なる領域に配置した一覧表示画面を生成する第1モードと、前記集合画像を重ねて配置した一覧表示画面を生成する第2モードと、のなかで選択されたモードをとる構成を有している。
【0026】
この構成により、本発明の画像処理装置は、カテゴリ毎に集合画像を生成し、これらを組み合わせることによって一覧表示画面を生成するため、複数種類の集合画像を用意せずにマップの表示形態の種類を増やすことができる。
【0027】
なお、本発明の画像処理装置は、オリジナル画像をサイズ変更したサムネイルを前記表示用画像として生成するサムネイル生成部と、前記サムネイルを前記カテゴリで分類するカテゴリ分類部と、前記集合画像に前記サムネイルを配置する画像配置部と、前記画像配置部による配置にしたがって前記サムネイルを集めることにより前記カテゴリ毎の集合画像を生成する集合画像生成部と、を備え、前記集合画像生成部は、前記集合画像のなかで前記サムネイルが配置されていない領域を透明化するようにしてもよい。
【0028】
この構成により、本発明の画像処理装置は、カテゴリ毎に集合画像を生成し、これらを組み合わせることによって一覧表示画面を生成することができる。
【0029】
また、前記集合画像生成部は、前記カテゴリ毎に略同一のサイズの集合画像を生成するようにしてもよい。
【0030】
この構成により、本発明の画像処理装置は、カテゴリ毎に略同一のサイズの集合画像を生成するため、各カテゴリの集合画像に対して何ら処理を加えずに集合画像を重ねることによりオリジナル画像の特徴によって分類された一覧表示画面を生成することができ、一覧表示画面を表示する際の処理量を削減することができる。
【0031】
また、前記画像配置部は、全てのカテゴリにおいて、前記オリジナル画像の特徴量と前記サムネイルの位置とを関連付けた同一の数式に基づいて前記サムネイルの位置を決定するようにしてもよい。
【0032】
この構成により、本発明の画像処理装置は、全てのカテゴリにおいて、同一の数式に基づいてサムネイルの位置を決定するため、集合画像を重ねた場合であっても、精度の良い画像マップを作成することができる。
【0033】
また、前記画像配置部は、全てのカテゴリにおいて、前記オリジナル画像の特徴量と前記サムネイルの位置とを関連付けた同一のモデルデータに基づいて前記サムネイルの位置を決定するようにしてもよい。
【0034】
この構成により、本発明の画像処理装置は、全てのカテゴリにおいて、同一のモデルデータに基づいてサムネイルの位置を決定するため、複数の色味を持つ画像や形状に特徴のある画像など多次元の画像特徴量を必要とする画像マップを作成する場合に、精度の良い画像マップを作成することができ、マップ全体の座標値に対してモデルデータを作成する必要がなくモデルデータの容量を削減することができる。
【0035】
前記表示画面生成部は、表示用画像が分類されていないカテゴリに対応する集合画像の生成を省くようにしてもよい。
【0036】
この構成により、本発明の画像処理装置は、あるカテゴリに対して新規にオリジナル画像が登録されたときに、カテゴリの座標データを設定することによって表示用画像が分類されていないカテゴリの集合画像をマップ上に表示させないため、一覧表示画面上で不要な空白を生じさせず、ユーザの操作性を向上させることができる。また、本発明の画像処理装置は、表示用画像が分類されていないカテゴリの集合画像を表示対象としないため、通信や表示等の不要な処理を省略することができ、全体的な処理の効率を向上させることができる。
【0037】
また、前記集合画像は、透明レイヤを保持することが可能な符号フォーマットで符号化されていてもよい。
【0038】
この構成により、本発明の画像処理装置は、集合画像のなかで表示用画像が配置されていない領域を透明化することができる。
【0039】
また、本発明の画像処理方法は、画像処理装置を用いて、複数の表示用画像を表示するために表示倍率に応じた一覧表示画面を生成する画像処理方法であって、前記表示用画像がカテゴリ毎に集められ、前記表示用画像が配置されていない領域が透明化された集合画像を互いに異なる領域に配置した一覧表示画面を生成する第1ステップと、前記集合画像を重ねて配置した一覧表示画面を生成する第2ステップと、のなかで選択されたステップを実行する。
【0040】
したがって、本発明の画像処理方法は、カテゴリ毎に集合画像を生成し、これらを組み合わせることによって一覧表示画面を生成するため、複数種類の集合画像を用意せずにマップの表示形態の種類を増やすことができる。
【0041】
また、本発明の画像処理方法は、前記画像処理装置を用いて、オリジナル画像をサイズ変更したサムネイルを前記表示用画像として生成するサムネイル生成ステップと、前記サムネイルを前記カテゴリで分類するカテゴリ分類ステップと、前記集合画像に前記サムネイルを配置する画像配置ステップと、前記画像配置ステップにおける配置にしたがって前記サムネイルを集めることにより前記カテゴリ毎の集合画像を生成する集合画像生成ステップと、をさらに実行するようにしてもよい。
【0042】
したがって、本発明の画像処理方法は、カテゴリ毎に集合画像を生成し、これらを組み合わせることによって一覧表示画面を生成することができる。
【0043】
また、本発明の画像処理プログラムは、複数の表示用画像を表示するために表示倍率に応じた一覧表示画面をコンピュータに生成させるための画像処理プログラムであって、前記表示用画像がカテゴリ毎に集められ、前記表示用画像が配置されていない領域が透明化された集合画像を互いに異なる領域に配置した一覧表示画面を生成する第1ステップと、前記集合画像を重ねて配置した一覧表示画面を生成する第2ステップと、のなかで選択されたステップを前記コンピュータに実行させる。
【0044】
したがって、本発明の画像処理プログラムは、カテゴリ毎に集合画像を生成させ、これらを組み合わせることによって一覧表示画面を生成させるため、複数種類の集合画像を用意せずにマップの表示形態の種類を増やすことができる。
【発明の効果】
【0045】
本発明は、集合画像を使用するマップ探索型の画像閲覧方法を実現する画像処理装置において、複数種類の集合画像を用意せずにマップの表示形態の種類を増やすことができる画像処理装置を提供することができる。
【発明を実施するための最良の形態】
【0046】
以下、本発明の実施の形態について、図面を参照して説明する。なお、本実施の形態においては、本発明に係る画像処理装置をサーバ装置とクライアント装置とによって構成した例について説明する。
【0047】
(第1の実施の形態)
図1に示すように、本実施の形態における画像表示システム1は、パーソナルコンピュータ(以下、「PC」という。)等によって構成されたクライアント装置100と、クライアント装置100から通信路105を介して送信されたコマンドに応じて画像分類を行い、分類結果をクライアント装置100に通信路105を介して送信するサーバ装置110とを備えている。
【0048】
なお、クライアント装置100は、PCの他に、PDA(Personal Digital Assistant)や携帯電話等のモバイル端末によって構成してもよい。また、通信路105は、LAN(Local Area Network)、インターネット網および無線通信網等よりなる。
【0049】
クライアント装置100は、モニタ等よりなる表示デバイス101と、ユーザ指示の解釈、サーバ装置110との通信、および、表示デバイス101の制御を行うアプリケーション102と、ユーザから指示が入力されるキーボードやポインティングデバイス等よりなる入力デバイス103と、アプリケーション102がサーバ装置110から受信した画像を一時的に蓄積する画像キャッシュ104とを備えている。
【0050】
サーバ装置110は、通信路105に対して設けられた外部インターフェース(以下、「I/F」という。)111と、クライアント装置100から登録が要求された登録画像112(本発明における「オリジナル画像」にあたる。)を所定サイズ以下に変倍した表示用のサムネイル124を生成するサムネイル生成部113と、登録画像112およびサムネイル124のデータを蓄積する画像DB114と、画像をカテゴリ(以下、「分類カテゴリ」という。)で分類するカテゴリ分類部115と、複数のサムネイル124を貼り付けた集合画像121を生成するとともに、ユーザ操作に応じて集合画像121の変更を行う集合画像生成部116と、サムネイル124をマップ上に配置する画像配置部117と、クライアント装置100から送信された画面制御データ120の内容に応じて表示画面119のデータを生成する表示画面生成部118とを備えている。
【0051】
ここで、表示画面119のデータは、クライアント装置100の表示デバイス101上にマップを表示させるための情報を表している。
【0052】
画像DB114には、サムネイル生成部113によって生成されたサムネイル124のデータと、サムネイル124を合成して集約した集合画像121のデータと、画像配置データ122とが格納される。
【0053】
画像配置データ122は、画像DB114に登録された各登録画像112のサムネイル124が分類された分類カテゴリを表す分類カテゴリデータと、各分類カテゴリにおけるサムネイル124の座標(以下、「サムネイル座標」という。)を表すサムネイル座標データと、各分類カテゴリのマップ上の座標(以下、「カテゴリ座標」という。)を表すカテゴリ座標データと、必要に応じて分類カテゴリ単位に用意された各集合画像121のマップ上の座標(以下、「集合画像座標」という。)を表す集合画像座標データとを含んでいる。
【0054】
図2は、サーバ装置110のハードウェア構成を示すブロック図である。サーバ装置110は、プログラムを実行することによって演算や処理を行うCPU(Central Processing Unit)201と、プログラムのコードや画像の符号データ等を一時的に記憶する揮発性のメモリ202と、画像データやプログラム等を保存するためのハードディスク装置(以下、「HDD」という。)203と、モニタ205に表示させるためにデータをバッファリングするビデオメモリ204と、キーボードやポインティングデバイス等よりなる入力デバイス206と、通信路105に対して設けられた外部I/F207と、これら各構成要素を接続するバス208とを備えている。
【0055】
HDD203には、画像DB114が格納される。また、ビデオメモリ204に書き込まれた画像データが表す画像は、定期的にモニタ205に表示される。
【0056】
本実施の形態において、サーバ装置110は、サーバコンピュータによって構成され、画像DB114に登録画像112を登録する画像登録動作等の後述する各動作は、HDD203等に格納されたアプリケーションを実行するCPU201によって実行される。
【0057】
ただし、本発明においては、この例に限定されず、MFP等の装置内に設けられたハードウェアによってサーバ装置110を構成してもよい。また、本発明の画像処理装置をサーバ装置とクライアント装置とによって構成せずに、例えば、図1に示す画像表示システム1と同等に機能する1つのPCまたはMFP等によって構成してもよい。
【0058】
なお、クライアント装置100のハードウェア構成は、図2に示したサーバ装置110のハードウェア構成と同様であるため、図示を省略する。
【0059】
以上のように構成された画像表示システム1の動作について説明する。画像表示システム1は、主に、画像登録動作と画像検索動作との2つの動作を実行する。ここで、画像検索動作は、クライアント装置100のユーザが所望する画像の検索、探索、閲覧および取得(サーバ装置110からのダウンロード)を実行するために画像DB114に登録された画像を利用する動作である。
【0060】
画像検索動作は、ユーザが所望する画像の検索や探索を行い、その後、クライアント装置100のHDD等に格納されたアプリケーション102の1つであるビューアを介して、画像を閲覧させたりクライアント装置100のHDDに蓄積したりする。
【0061】
図3は、画像表示システム1の画像登録動作を示すシーケンス図である。
【0062】
まず、クライアント装置100のユーザによって入力デバイス103を介して、画像データの登録と、登録する登録画像112を表すデータとがアプリケーション102に指示されると(ステップS1)、画像データの登録の指示と、指示された登録画像112を表すデータとが、アプリケーション102によってサーバ装置110に通信路105を介して送信される(ステップS2)。
【0063】
サーバ装置110の外部I/F111に受信された登録画像112を表すデータは、サムネイル生成部113によって縮小処理や画像フォーマットの変換等が施され、表示用のサムネイル124が生成される(ステップS3)。ここで、登録画像112が、複数のページからなる場合には、ページ毎のサムネイル124がサムネイル生成部113によって生成される。
【0064】
登録画像112を表すデータは、サムネイル生成部113によって生成されたサムネイル124を表すデータと、ファイル名等の登録画像112に付随するメタ情報と共に、IDが付されて画像DB114に登録される(ステップS4)。
【0065】
ここで、サムネイル124を所定の分類カテゴリに分類する分類処理がカテゴリ分類部115によって実行される(ステップS5)。なお、分類処理は、上述したステップS3、S4と並行するように実行してもよい。また、分類処理は、該当する登録画像112のメタ情報等に基づいて分類を行ってもよいし、登録画像112の特徴量を算出して、算出した特徴量に応じた分類を行ってもよい。
【0066】
画像に対するクラスタリングや分類処理については、数々の従来技術が存在し、本発明においては、いかなる分類処理も適用することができるため、分類処理についての詳細な説明は省略する。
【0067】
分類処理の好適な一例としては、登録文書画像を8×8の局所ブロック毎に離散コサイン変換(Discrete Cosine Transform。以下、「DCT」という。)を施し、DCT係数の分布に応じて局所領域を線画、文字および写真等に識別した後、識別した結果毎に25次元の高次局所自己相関特徴量を算出し、それらの特徴量を閾値処理またはサポート・ベクタ・マシン(以下、「SVM」という。)等の機械学習を利用して「図面」、「帳票」、「書籍」および「その他」等のカテゴリに分類するものがある(例えば、特願2007−039787号参照)。
【0068】
また、登録文書画像から色、形状およびレイアウト等の複数の特徴量を算出し、複数の分類処理を行うものもある(例えば、特開2007−286864号公報参照)。ここで、分類処理によって識別される分類の種類としては、色分類、形状分類、レイアウト分類および文書タイプ分類がある。この分類処理を、本実施の形態に適用する場合は、1つの分類処理を実行すればよく、例えば、文書タイプ分類のみを識別すればよい。
【0069】
また、別の分類処理として、画像から得られる色、エッジおよびテクスチャ等の量や画像上での分布等を画像特徴量として入力し、予め教師データを用いて学習させたSVM等の機械学習のモデル等を用いて画像の種類を識別し分類する処理もある。
【0070】
一方、画像のメタ情報を使用する分類処理として、予め画像に付与された書誌的情報、画像の作成日、および、DBの登録日等の情報に基づいて、複数のカテゴリに画像を分類するものについても数多くの文献に開示されている。
【0071】
本発明における分類処理は、上述したいずれのものを用いてもよい。本実施の形態においては、特願2007−039787号に開示されているように、画像の文書タイプを分類の対象として識別し、予め定められた所定のカテゴリへ分類する分類処理を用いるものとする。
【0072】
また、本実施の形態においては、登録画像112を文書画像とし、分類処理における分類カテゴリを「論文」、「図面」、「帳票」および「スライド」の4つのカテゴリとして、以下説明する。
【0073】
図3において、カテゴリ分類部115によって登録画像112のサムネイル124が分類されると、当該サムネイル124のサムネイル座標が画像配置部117によって決定される(ステップS6)。
【0074】
図4(a)は、各分類カテゴリに含まれる画像の表示領域(以下、「カテゴリ領域」という。)が割り当てられたマップを示す概念図である。図4(a)において、分類カテゴリのカテゴリ領域は、4つの楕円で示されている。
【0075】
本実施の形態における集合画像121は、集合画像生成部116によって分類カテゴリ毎に生成される。なお、図4(a)には、1つの画像で集合画像121を構成する例を示しているが、集合画像121を分割した部分集合画像で集合画像121を構成してもよい。例えば、各分類カテゴリの集合画像121を4つの部分集合画像で構成してもよい。
【0076】
図4(b)に示すように、各分類カテゴリに分類されたサムネイル124は、各カテゴリ領域内に含まれるようにマップ上に配置される。
【0077】
各カテゴリ領域内における画像配置の決定方法は、前述したように画像の特徴を使用する方法や文書の形態素解析等を用いて文書の内容の類似度に基づいて配置する方法等、種々の方法がある。
【0078】
本実施の形態においては、登録画像112の見た目により配置を定めることによって登録画像112のサムネイル124をマップ上から検索しやすくするため、画像配置部117は、登録画像112の特徴、特に、画像の特徴のなかで最も人間の感覚に近い色特徴に基づいてサムネイル座標を決定するものとする。
【0079】
色特徴を抽出する方法としては、画像の平均色や代表色を画像の色特徴として算出する方法、色のヒストグラム等を画像の色特徴として算出する方法(例えば、特開2000−187731号公報参照)、および、色分布を画像の色特徴として算出する方法(例えば、特開2002−133412号公報参照)等、種々の方法がある。
【0080】
画像の平均色を画像の色特徴として算出する場合には、全画素の色の平均値を求めればよく、画像の代表色を画像の色特徴として算出する場合には、例えば、色のヒストグラムを算出した後、最も出現頻度の高い色を代表色として選択すればよい。
【0081】
平均色や代表色は、3次元ベクトルで表される単一色として得られ、ヒストグラムや色分布からは、多次元の特徴量が得られるため、サムネイル座標の算出方法は両者で異なる。このため、ヒストグラムや色分布を画像の色特徴として算出する場合には、多次元ベクトルを2次元座標へ変換する必要がある。この変換方法については、後述する本発明の第2の実施の形態で説明する。
【0082】
平均色や代表色等の単一色の値(以下、「単色値」という。)を画像の色特徴として算出する場合には、算出された単色値の3属性(例えば、RGB値やYCrCb(輝度/色差)値等)を計算によって2次元座標に変換すればよい。本実施の形態においては、このように単色値を画像の特徴量とする例について説明する。
【0083】
単色値を画像の特徴量とする場合には、HSVの表色系を使用して色相Hと彩度Sとを単色値から算出し、算出した色相Hと彩度Sとに応じた2次元の座標を求めればよい。例えば、RGBからHSVの変換は、RGB値の最大値をmaxとし、最小値をminとして、以下の式を用いて行うことができる。
【0084】
if max=R H[度]=60×(G−B)/(max−min)
if max=G H[度]=60×(B−R)/(max−min)+120
if max=B H[度]=60×(R−G)/(max−min)+240
S=(max−min)/max
【0085】
なお、上述したように、HSVの表色系を使用する他に、YCrCb等のような輝度/色差表色系の色差成分のみを使用したり、CIELAB表色系の色度のみを使用したりしてもよい。
【0086】
図4(c)は、原点をカテゴリ領域の中心としたときのサムネイル座標と色との関係を示す概念図であり、0度は、原点から水平方向右側へ伸びる線上として半時計周りに+の角度としている。
【0087】
なお、HSVの表色系を使用した場合には、通常、カテゴリ領域は真円になるが、これを作為的に変形させてもよく、図4(c)においては、カテゴリ領域を楕円に変形させている。また、図4(d)は、CIELAB表色系のa*を水平軸、b*を垂直軸に取ったときのサムネイル座標と色との関係を示す概念図である。
【0088】
このように、本発明においては、各カテゴリ領域内における画像配置を様々な方法で決定することができるが、画像配置部117は、全ての分類カテゴリにおいて同一の方法で各サムネイル124のサムネイル座標を決定する。
【0089】
このように決定された各サムネイル124のサムネイル座標を表すサムネイル座標データと、分類カテゴリデータとは、画像配置部117によって、画像配置データ122に含められ、登録画像112とIDでリンクされて画像DB114に登録される。なお、サムネイル座標データは、上述したようにHSVの表色系で算出された値のように極座標で表してもよいし、2次元(x,y)座標として表してもよい。
【0090】
図4(b)に示すようなマップ上における各サムネイル124の座標は、画像配置データ122に予め登録されている各分類カテゴリのカテゴリ座標データを使用することにより求めることができる。カテゴリ座標データは、各カテゴリ領域の中心位置または集合画像121のいずれかの頂点の位置をカテゴリ領域の原点としたマップ上の座標を表している。
【0091】
このため、集合画像121における座標と、カテゴリ領域における座標とを同一に扱うことができる。以下の説明において、集合画像121における座標と、カテゴリ領域における座標とは、一致するものとする。なお、カテゴリ領域の中心位置をカテゴリ領域の原点とした場合には、カテゴリ領域の中心位置と集合画像の中心位置とを同一にする必要がある。
【0092】
ここで、各分類カテゴリの集合画像を複数の部分集合画像に分割して保持する場合には、部分集合画像の原点の座標を表すデータを集合画像座標データと共に画像配置データ122に含めるようにすればよい。
【0093】
図3において、集合画像生成部116では、サムネイル124を表すデータと、カテゴリ分類部115による分類結果を表す分類カテゴリデータと、画像配置部117によって決定されたサムネイル124のサムネイル座標と、分類カテゴリデータに対応した更新前の集合画像121(以下、「集合画像A」という)とに基づいて、更新後の集合画像121(以下、「集合画像B」という)が生成され、集合画像Aに代えて集合画像Bが画像DB114に登録されると共に、画像配置データ122が更新される集合画像更新処理が実行される(ステップS7)。
【0094】
なお、画像DB114において、IDやファイル名等の付随するメタ情報を一般的なRDB(リレーショナルデータベース)で管理することにより、このような情報の登録、管理および検索等の処理を容易に実現することができる。
【0095】
また、集合画像121およびサムネイル124等を表す画像データについては、必要に応じて圧縮符号化等の処理を施してHDD203に蓄積しておき、メタ情報に含まれるリンクによって特定して読み込むことができるようにしておけばよい。
【0096】
また画像DB114は、上述した機能を満たすものであれば、例えば、XML(eXtensible Markup Language)等の言語を使用し、階層的なデータ構造を構築して各データを蓄積してもよい。また、画像DB114は、複数のデータベースサーバに分散して格納されていてもよい。
【0097】
なお、画像登録動作において、スキャナやデジタルカメラ等の画像入力装置から画像データを直接にサーバ装置110に登録できるようにしてもよい。また、サーバ装置110にレンダリング機能を設けて電子データを入力できるようにしてもよい。
【0098】
図5は、サーバ装置110の集合画像更新処理(ステップS7、図3)を詳細に示すフローチャートである。なお、ここでは、画像DB114に複数の画像が既に登録されているものとする。
【0099】
まず、集合画像生成部116によって、分類カテゴリデータに対応した集合画像Aが画像DB114から選択される(ステップS10)。例えば、分類カテゴリデータが「スライド」を表す場合には(図4(a)参照)、「スライド」に対応する集合画像が選択される。
【0100】
次に、画像DB114に登録されている既存の集合画像Aが集合画像生成部116によって取得され、集合画像Aのコピー画像が生成される(ステップS11)。
【0101】
また、登録画像112が所定サイズ以下に変倍されたサムネイル124がサムネイル生成部113によって生成される(ステップS12)。ここで、「所定サイズ」とは、登録画像112と、画像配置部117によって決定されたマップとの相対値によって定められる。
【0102】
次に、サムネイル生成部113によって生成されたサムネイル124が、集合画像Aのコピー画像に合成される合成処理が実行され、集合画像Bが生成される(ステップS13)。
【0103】
合成処理は、画像配置部117によって決定された集合画像121の領域にサムネイル124を貼り付けるように上書きする。また、合成処理と共に、集合画像B上でサムネイル124の存在しない部分を透明化する透明化処理が集合画像生成部116によって実行される(ステップS14)。
【0104】
ここで、透明化処理は、集合画像Bに対して、サムネイル124を配置した領域に対応する画素の透明度を0%とし、サムネイル124を配置していない領域に対応する画素の透明度を100%とする処理である。
【0105】
このように集合画像Bに透明化処理を施すことによって、集合画像Bと、他の集合画像121とを表示画面上で重ねた場合に、サムネイル124が配置されていない領域については、下に重なった集合画像121のサムネイル124が表示されることになる。
【0106】
図4(e)は、図4(a)、(b)に示した「スライド」の分類カテゴリ用の集合画像Bに対して、透明部分を斜線で示した概念図である。
【0107】
なお、集合画像121の透明化処理においては、一般的にαチャネルと呼ばれる透明レイヤを有することができる画像フォーマットの画像データで集合画像121を管理するのが最も簡単な実現方法である。
【0108】
αチャネルを有することができる代表的な画像フォーマットとしては、JPEG(Joint Photographic Experts Group)2000、JPEG−XR(eXtended Range)、PNG(Portable Network Graphics)フォーマット等がある。
【0109】
また、画像の透明化処理を実現する別な方法としては、透明、不透明を集合画像121の画素単位で判定するための情報を別途用意して、クライアント装置100のアプリケーション102にてマスク処理を行うことによって実現することもできるが、前者の方法の方が汎用性が高く、より好適であるため、本実施の形態においては、前者の方法で画像の透明化処理を実現するものとする。
【0110】
集合画像Bのαチャネルは、サムネイル124が全く登録されていない初期状態には、全ての画素が透明度100%のαチャネルを有している。そして、集合画像生成部116は、集合画像121にサムネイル124を合成する度に、サムネイル124を合成した領域の透明度を0%に変更していく。換言すれば、集合画像生成部116は、αチャネルのレイヤに透明度が0%の意味を有する画像を貼り付けるように上書き処理することによって、集合画像Bの透明化処理を実現する。
【0111】
このように、集合画像Bが生成されると、集合画像Bは、集合画像生成部116によって画像DB114に新規に登録され、新規の画像ID(例えば、URL(Uniform Resource Locator))が付与される(ステップS15)。
【0112】
次に、画像配置データ122に含まれる集合画像のリンク先が、集合画像生成部116によって、集合画像Aの画像IDから集合画像Bの画像IDに変更される(ステップS16)。そして、集合画像Aが、集合画像生成部116によって画像DB114から削除される(ステップS17)。
【0113】
ここで、本実施の形態におけるサムネイル124と集合画像121との関係について説明する。前述したように、本実施の形態においては、サーバ装置110は、登録画像112毎にクライアント装置100に表示させるサムネイル124と、集合画像121とを生成する。
【0114】
本実施の形態におけるマップ探索型の画像表示システム1においては、クライアント装置100の表示画面の表示サイズに応じた画像サイズのサムネイル124を生成する必要がある。
【0115】
サムネイルを生成する方法は、JPEG2000等に代表される階層符号化方式を用いて必要な画像サイズ分の画像データ(符号コード)を用いて実現してもよく(例えば、特願2006−304012号参照)、サイズの異なるサムネイルを複数用意して表示サイズに対応するサムネイルを選択することにより実現してもよい。
【0116】
サムネイルを集約した集合画像121においても、個々の登録画像112の縮小画像であるサムネイル124と同様に、階層符号化方式で実現してもよく、サイズの異なる複数の画像で実現してもよい。ただし、前述したように、集合画像121は、画像の透明化処理を施すために、αチャネルを有することが必要となる。
【0117】
なお、集合画像121は、一般的に見れば巨大な画像データとなるので、JPEG2000やJPEG−XR等の階層符号化方式で構成した方が、全体的な蓄積容量が節約できるため好適である。
【0118】
また、前述したように、集合画像121は、各分類カテゴリに対して1つの画像で構成してもよく、各分類カテゴリの集合画像121の全体を分割した複数の部分集合画像で構成してもよい。
【0119】
本実施の形態においては、本発明を理解しやすくするために、各分類カテゴリに対して1つの画像で集合画像121を構成する場合について説明しているが、複数の部分集合画像で集合画像121を構成する場合には、集合画像生成部116は、集合画像121の更新や表示に先立って対象の部分集合画像を画像配置データ122に基づいて選択すればよい。
【0120】
図6は、画像表示システム1の画像検索動作を示すシーケンス図である。なお、画像検索動作は、クライアント装置100のユーザが目的の登録画像112を画像DB114から検索するときや、画像DB114に登録された登録画像112を探索するときに実行される。
【0121】
なお、本実施の形態において、サムネイル124の表示モードとして、図7(a)に示すように、登録画像112のサムネイル124をカテゴリ領域毎に配置した「分類表示モード」と、図7(c)に示すように、登録画像112の色味(図4(c)参照)毎にサムネイル124を配置した「カラーマップ表示モード」との2つのモードがある。
【0122】
「分類表示モード」と「カラーマップ表示モード」との切り替えは、クライアント装置100の入力デバイス103による一覧表示画面上の表示切替ボタン308(図7(a))の押下(クリック)により行われる。
【0123】
なお、本発明を理解しやすくするために、表示モードは、画像検索動作が実行される前に、予め選択されているものとし、図6に示す画像検索動作においては、表示モードの切り替えがあったときのステップについての説明を割愛している。
【0124】
図6において、まず、ユーザによって入力デバイス103を介して、サムネイルの一覧表示がアプリケーション102に指示されると(ステップS20)、図7(a)に示すようなサムネイルの一覧表示画面の初期画面がサーバ装置110の表示画面生成部118によって生成される(ステップS21)。
【0125】
ここで、図7(a)において、初期画面上には、サムネイルを一覧表示する領域であるサムネイル一覧ビュー302の表示領域を規定するウィンドウ301と、各矩形によって図示されているサムネイル303と、サムネイル一覧ビュー302の表示倍率を設定するスライダ304と、サムネイル一覧ビュー302を水平方向へスクロールさせるためのスライダ305と、サムネイル一覧ビュー302を垂直方向へスクロールさせるためのスライダ306と、「分類表示モード」と「カラーマップ表示モード」とを切り替えるための表示切替ボタン308とが表示される。
【0126】
ここで、集合画像121を表示する場合には、サムネイル一覧ビュー302上に集合画像121を配置することになり、個々のサムネイル303を表示する場合には、表示されるサムネイル303をサムネイル一覧ビュー302上に個々に配置することとなる。
【0127】
なお、図7(a)乃至(c)において、マップ上のサムネイル303の配置がランダムに配置されており、表示画面生成部118は、マップ上のサムネイル303の重なりを許容しているが、サムネイル303の配置を整列するようにしてもよい。
【0128】
本実施の形態におけるサムネイルの一覧表示画面は、サムネイル一覧ビュー302と、サムネイル一覧ビュー302以外のユーザインターフェースの部分およびデザイン的な意味合いの外枠のフレーム部分とからなる。クライアント装置100のアプリケーション102は、これらを合成して表示デバイス101用の表示画面を生成し、最終的に図7(a)に示すような表示画面を生成する。
【0129】
図7(b)は、サムネイル一覧ビュー302の例を示す概念図である。サムネイル一覧ビュー302は、ウィンドウ301の境界によって規定された表示領域307を有している。表示画面生成部118は、表示画面119を表すデータを生成する場合には、前述の通り2種類の表示モードに対応する表示画面を生成するが、外枠のフレーム部分については、サムネイル一覧ビュー302の表示倍率や表示領域を変更するスライダ304乃至306の表示を更新する程度なので、説明を省略し、サムネイル一覧ビュー302の画面情報を生成することについて説明する。
【0130】
なお、図7(b)に示すサムネイル一覧ビュー302については、余白部分が存在するが、実装を容易にするために設けられたものであり、本発明には特に関係しない。また、図7(a)に示すように、本実施の形態においては、表示倍率や表示領域を変更するためのスライダを一覧表示画面内に設けているが、例えば、クライアント装置100に設けられたマウス等の入力デバイス103にそれらの機能を設けるようにしてもよい。
【0131】
表示画面生成部118は、初期画面を生成する場合には、サムネイル一覧ビュー302の表示倍率(図7(a)乃至(c)では最低倍率)と表示領域307とを予め定められた初期値に設定して、サムネイル一覧ビュー302を生成し、外枠のフレーム部分と共に表示画面119のデータとして外部I/F111より通信路105を介してクライアント装置100に送信する。
【0132】
このような表示画面の作成方法やサーバ・クライアント間の通信方法には種々の方法があるが、一般的によく使用される好適なものとして、サーバ装置110をWebサーバとしてWorldWideWebベースの技術を使用することによって実現することができる。
【0133】
この場合には、表示画面119のデータは、HTML(Hyper Text Markup Language)によって記述され、アプリケーション102として、一般的なWebブラウザを適用すればよい。
【0134】
このような方法によれば、サーバ装置110は、まず、画像の配置や画像のリンク先(Web上のURL)が記述されたHTMLファイルをクライアント装置100に送信し、クライアント装置100は、受信したHTMLファイルのリンク先から画像を取得する。このような方法は、換言すれば表示画面の構造的情報と画像データとを分離して送付する方法と言える。
【0135】
それ以外の方法としては、サーバ装置110がクライアント装置100の表示画面のビットマップデータそのものを生成して、生成したビットマップデータをクライアント装置100に送信する方法もある。以下、本実施の形態においては、前者の方法を用いた例で説明を行う。
【0136】
表示画面生成部118は、集合画像121を表示画面に表示させる場合には、各集合画像121の画像ID(WWW技術においては、画像のURLということになる)と、集合画像座標データとが必要であり、個々のサムネイル124を表示画面に表示させる場合には、個々のサムネイル124の画像IDとサムネイル座標データとが必要となる。
【0137】
前述の通り、本実施の形態においては「分類表示モード」と「カラーマップ表示モード」との2つの表示モードがある。表示モードは、クライアント装置100から指示され、画面制御データ120としてサーバ装置110に通知される。表示画面生成部118は、表示モードに応じて処理を切り替える。
【0138】
図8は、サーバ装置110の表示画面生成動作を示すフローチャートである。
【0139】
まず、クライアント装置100から送信された画面制御データ120の内容に基づいて、表示モードが「分類表示モード」か「カラーマップ表示モード」かが表示画面生成部118によって判断される(ステップS31)。
【0140】
ここで、表示モードが「分類表示モード」と判断された場合には、分類カテゴリのカテゴリ座標データが表示画面生成部118によって画像DB114から取得される(ステップS32)。
【0141】
ここで、表示画面生成部118は、例えば、表示画面119の表示領域307(図7(b)参照)に該当するマップの領域に基づいて、表示画面119に表示させる分類カテゴリを選択し、選択した分類カテゴリのカテゴリ座標データを取得する。このような方法は、画像DB114をRDBによって構成すれば容易に実現できるため、詳細な説明は省略する。
【0142】
次に、表示画面119に表示させる画像が個別画像(本実施の形態においては、サムネイル)であるか集合画像であるかが表示画面生成部118によって判断される(ステップS33)。この判断は、例えば、表示画像数や表示倍率で切り替えたり、表示用の複数のモードを備えていてモードによって切り替えたりしてシステムの動作仕様として決めればよく、本発明とは直接に関連しない部分であるため説明は省略する。
【0143】
ここで、表示画面119に表示させる画像が個別画像であると判断された場合には、表示対象のサムネイル124のサムネイル座標データと画像IDとが表示画面生成部118によって画像DB114から取得される(ステップS34)。
【0144】
次いで、ステップS31において、表示モードが「分類表示モード」であると判断された場合には(ステップS35:YES)、表示対象の登録画像112のマップ上の座標が表示画面生成部118によって算出される(ステップS36)。
【0145】
ここで、個々のサムネイル124を表示画面119に表示させる場合には、各サムネイル124のマップ上の座標は、当該サムネイル124が分類された分類カテゴリのカテゴリ座標データと、当該サムネイル124のサムネイル座標データから算出することができる。
【0146】
例えば、あるサムネイル124が分類された分類カテゴリのカテゴリ座標を(X,Y)として、当該サムネイル124のサムネイル座標を(x,y)とすると、当該サムネイル124のマップ上の座標(mx,my)は、以下の式により求めることができる。
【0147】
mx=X+x
my=Y+y
【0148】
一方、ステップS31において、表示モードが「カラーマップ表示モード」であると判断された場合には(ステップS35:NO)、各登録画像112のマップ上の座標は、当該登録画像112のサムネイル座標データが表すサムネイル座標のみから得られる。
【0149】
この場合には、各分類カテゴリの集合画像121を重ねる順番によって、表示画面119に表示される内容が変化するため、サーバ装置110は、例えば、各分類カテゴリの集合画像121を重ねる順番を予め設定しておくか、ユーザの好みに応じて変更しておく。また、表示画面生成部118は、各登録画像112のサムネイル124を表示する場合にも、集合画像121に設定された順番にしたがって表示画面119上に配置する。
【0150】
例えば、「論文」の分類カテゴリに分類された集合画像121に次いで、「図面」の分類カテゴリに分類された集合画像121が表示される場合には、「論文」の分類カテゴリに分類された登録画像112が、「図面」の分類カテゴリに分類された登録画像112の背面に位置するため、「論文」の分類カテゴリに分類された集合画像121のサムネイル124を最初にクライアント装置100に表示させ、次に、「図面」の分類カテゴリに分類された集合画像121のサムネイル124を表示させる必要がある。
【0151】
このような表示順序の制御は、サーバ装置110から出力される表示画面119のデータを用いて表示順序を指示して、クライアント装置100のアプリケーション102が指示通りに表示を行うことによって実現できる。
【0152】
ステップS33において、表示画面119に表示させる画像が集合画像であると判断された場合には、集合画像121の画像IDが表示画面生成部118によって画像DB114から取得される(ステップS37)。
【0153】
集合画像121のマップ上の座標については、「分類表示モード」の場合には、各サムネイル座標データを各集合画像121のマップ上の座標データとして扱う。それによって、各分類カテゴリの集合画像121は、マップ上の異なる位置に配置され図7(a)のような表示画面119を生成することができる。
【0154】
なお、「カラーマップ表示モード」の場合には、分類カテゴリによらずに各集合画像121のマップ上の座標データを同一として扱うため、「カラーマップ表示モード」の場合には、ステップS32を実行する必要がない。
【0155】
例えば、マップ上の原点を集合画像121の原点として扱うことによって、各分類カテゴリの集合画像121は、マップ上の同一の位置に重なって配置されることになり図7(c)に示すような表示画面119が生成されることになる。
【0156】
このように得られた表示画面119を表すデータが表示画面生成部118によって生成され(ステップS38)、クライアント装置100に送信される。
【0157】
図6において、クライアント装置100では、表示画面119を表すデータの情報に基づいて表示画面119がアプリケーション102によって展開(レンダリング)され、表示デバイス101上に表示される(ステップS22)。
【0158】
ここで、クライアント装置100を使用しているユーザによって、表示領域を変更するためのスライダ305、306、または、表示倍率を変更するためのスライダ304が操作され、画面スクロールや表示倍率変更の指示が入力されると(ステップS23)、画面スクロールや表示倍率変更の指示は、表示倍率と表示領域とを表す画面制御データ120に変換され、クライアント装置100からサーバ装置110に送信される(ステップS24)。なお、各スライダ等の操作は、マウス等の入力デバイス103により行われる。
【0159】
画面制御データ120を受信したサーバ装置110では、表示画面119が変更され(ステップS25)、変更された表示画面119を表すデータがクライアント装置100に送信される。
【0160】
次に、クライアント装置100では、変更後の表示画面119を表すデータに基づいて、表示画面119がアプリケーション102によって展開され、表示デバイス101上に表示される(ステップS26)。
【0161】
ここで、クライアント装置100のユーザが検索対象の登録画像112のサムネイル124を見つける等して、画像検索動作の終了がアプリケーション102に指示されている場合には(ステップS27:YES)、画像検索動作は、終了する。一方、画像検索動作の終了がアプリケーション102に指示されていない場合には(ステップS27:NO)、画像検索動作は、ステップS23に戻る。
【0162】
図9は、本実施の形態におけるクライアント装置100による拡大表示動作を説明するための概念図である。
【0163】
図9(a)において、ユーザは、スライダ305、306を使用して、多くのサムネイル124から検索対象の登録画像112のサムネイル124の候補を画面中央へ表示させ、図9(b)、(c)に示すように、徐々に拡大率を上げていく仮定で、周囲の登録画像112との比較や画像内容の確認を行いながら表示画面内に検索対象の登録画像112が存在するかどうかを確認する。
【0164】
ここで、表示画面内に検索対象の登録画像112のサムネイル124が存在しないことが確認できた場合には、ユーザは、表示倍率を縮小して他の候補から検索対象の登録画像112のサムネイル124を探していく。
【0165】
一方、表示画面内に検索対象の登録画像112のサムネイル124が存在することが確認できた場合には、図9(d)に示すように、表示倍率を拡大することによって、ユーザは、サムネイル一覧ビュー302上で登録画像112の内容を詳細に確認することができる。
【0166】
以上説明したように、本発明の第1の実施の形態としての画像表示システム1は、集合画像121を使用するマップ探索型の画像表示システムにおいて、分類カテゴリ毎に集合画像121を生成し、各分類カテゴリ内で登録画像112のサムネイル124の座標を同一な規則で算出すると共に、集合画像121においてサムネイル124が配置されない領域に対して透明化処理を行っているため、単一種類の集合画像121によって、異なる分類カテゴリ(初期分類キー)を有するマップを表示することができる。
【0167】
したがって、画像表示システム1は、ユーザの操作性向上のために分類カテゴリが異なるマップを表示するために、マップ毎の集合画像121を生成する必要がなくなり、集合画像121の更新に対する処理速度を向上し、集合画像121の保持容量を低減することができる。
【0168】
すなわち、画像表示システム1は、複数種類の集合画像121を用意せずにマップの表示形態の種類を増やすことができる。
【0169】
(第2の実施の形態)
本発明の第1の実施の形態においては、分類カテゴリ内における登録画像112のサムネイル124の座標を算出するときに、画像特徴量に対して単色の色特徴という特徴次元数の少ないものを使用して2次元のマップ座標へ変換する例を示した。
【0170】
しかし、自然画像等への適用を考えると自然画は複数の色味を含む場合が多く、単一色では精度が落ちる場合が考えられる。また、白黒の図面等のように形状により特徴のある画像を主として扱う場合には適用できない等の課題がある。
【0171】
このような場合においては、前述したような色ヒストグラムやテクスチャやエッジ等の画像形状の特徴量を使用することが考えられるが、画像特徴量が多次元におよぶケースがほとんどになる。本実施の形態においては、画像形状の特徴量を使用する場合の例について説明する。なお、各分類カテゴリ内の画像配置以外に関する構成や動作については、本発明の第1の実施の形態と同様とする。
【0172】
多次元の特徴量を使用して2次元の座標へ変換する好適な方法の一例として、SOM(自己組織化マップ)がある。SOMは入力された特徴量ベクトルと、各座標に割り当てられた重みベクトルとの距離を所定の測度(例えばユークリッド測度)で演算し、この距離が最小となる座標点(以下、「最整合ノード」という。)を検出する。そして、この最整合ノード近傍の複数の座標について、入力された特徴量ベクトルを用いて重みベクトルを更新する。
【0173】
この処理の繰り返しにより、互いに類似する特徴量ベクトルに対する最整合ノードが連続的な領域を形成するようになる。つまり、この座標空間には、多次元の入力信号である特徴量ベクトルから2次元のマップへの非線形射影が位相を保持したまま形成され、重みの更新により、データの特徴部分が組織化され、その学習成果として類似のデータに反応する格子が近接するようになる。
【0174】
このようなSOMの性質を利用すれば、多次元特徴量から特徴が似通った画像を近傍に配置した2次元画像マップを作成することができる。しかし、通常SOMは、画像が入力されるたびに、その画像配置を変化させることになるため、登録画像112が登録される度に使用する場合には、各分類カテゴリで全く異なる位置に配置されることになり、各分類カテゴリの集合画像121を重ねたときに、画像特徴によるマップではなくなってしまうことになる。
【0175】
例えば、本発明の第1の実施の形態で用いた例では、分類カテゴリ毎に色味の分布が変わってしまい、それらを重ねた場合には、ところどころで様々な色味の登録画像112のサムネイル124が混ざり合うマップとなってしまう。
【0176】
上記の課題に対する解決策として、本実施の形態においては、SOMと学習データ用の画像データを用いて学習によりマップモデルを予め作成し、登録画像112のサムネイル124の配置を決定するときに、予め作成された分類カテゴリによらない単一のモデルを用いてサムネイル124の配置を決定する。
【0177】
マップモデルは、特徴量と座標との関連が表されていればよい。例えば、学習によって各座標にマップされた画像の特徴量をその座標の特徴量とすればよい。そして入力された登録画像112の特徴量を算出した後、全ての座標のなかから最も特徴量が近い(例えば、ユークリッド距離が近い)座標をサムネイル座標とすればよい。
【0178】
図10は、マップモデルを表すモデルデータを作成するモデルデータ作成動作を示すフローチャートである。なお、モデルデータ作成動作を本実施の形態としての画像表示システムに実行させる代わりに、モデルデータ作成動作を他の計算機によって予め実行させ、作成されたマップモデルをサーバ装置110に登録するようにしてもよい。
【0179】
なお、モデルデータ作成に先立ち、SOMの座標を定め、全座標点について適当な初期値を与え、必要数の学習用画像データを用意する必要がある。ここで、必要数とは、実際に登録される登録画像112の種類をほぼ補う数が必要であり、例えば、本発明の第1の実施の形態のように色味で分布するマップを作成する場合、全ての色味に対応する画像種の学習用画像データが必要となる。このような画像データは、人工的に作成してもよい。
【0180】
まず、学習画像の特徴量が算出される(ステップS40)。ここで、特徴量は、登録画像112の画像配置を決定する場合に算出する特徴量と同じものを使用する。なお、特徴量の種類については特に限定されず、前述した色ヒストグラムやテクスチャ等でもよく、これらを組み合わせたものでもよい。
【0181】
次に、新規に入力された学習画像の特徴量データがSOMに追加される(ステップS41)。前述したように、SOMの手法の通り、既存のSOMの最も近い座標点に特徴量データをマッピングし、その近傍の座標データの特徴量データを変更する。
【0182】
ここで、全ての学習画像に対してステップS40、S41を実行したか否かが判断され(ステップS42)、全ての学習画像に対してステップS40、S41を実行していないと判断された場合には、モデルデータ作成動作は、ステップS40に戻る。
【0183】
一方、全ての学習画像に対してステップS40、S41を実行したと判断された場合には、学習画像全てにおけるSOMが完成した後に、SOMからモデルデータが作成される(ステップS43)。ここでのモデルデータとは、特徴量データと座標点とがリンクされたものであり、学習が完成したSOMそのものでもよい。
【0184】
図11は、本実施の形態において、登録画像112のサムネイル124のサムネイル座標を決定するサーバ装置110の動作(ステップS6、図3)を詳細に示すフローチャートである。
【0185】
まず、画像配置部117によって登録画像112から画像特徴量が算出される(ステップS50)。次に、算出された画像特徴量とモデルデータとが画像配置部117によって比較され、登録画像112の画像特徴量に最も近い(類似性の高い)座標が抽出される(ステップS51)。
【0186】
ここでの登録画像112とモデルとの特徴量の比較は、種々の方法があるが、例えば多次元特徴量間のユークリッド距離が最も近いものを選択すればよい。他に、多次元特徴量の種類に応じて重みを使用してもよい。
【0187】
以上説明したように、本発明の第2の実施の形態としての画像表示システムは、登録画像112から多次元特徴量を抽出して分類カテゴリ内でサムネイル124の配置を決定する場合において、各分類カテゴリの集合画像121を重ねたときに、画像特徴によるマップを維持することができる。
【0188】
また、本発明の第2の実施の形態としての画像表示システムは、分類カテゴリによらず単一のモデルデータによって全ての分類カテゴリ内の画像配置を抽出するため、分類カテゴリ毎にモデルデータを作成する必要がなく、モデルデータの容量を削減することができる。
【0189】
(第3の実施の形態)
システム側で分類カテゴリが予め定められているマップ探索型の画像一覧表示においては、ユーザが登録する登録画像112によっては、サムネイル124が全く分類されない分類カテゴリが存在することがある。このような分類カテゴリは、表示画面上に不要な空白を描画させるだけでなく、必要のない集合画像121の送受信や表示処理を実行させることとなる。
【0190】
本実施の形態においては、このような課題に対応し、登録画像112のサムネイル124が分類されていない分類カテゴリに対する処理を追加したものについて説明する。なお、本実施の形態における構成や基本的な動作などは、本発明の第1の実施の形態および第2の実施の形態と同様である。
【0191】
図12は、分類表示モードにおいて、登録画像112のサムネイル124が分類されていない分類カテゴリを表示した例である。このように、登録画像112のサムネイル124が分類されていない分類カテゴリが図中左下に表示されることになり、表示上の効率が低下するばかりでなく、相対的に表示画像のサイズが小さくなる可能性が高いため、ユーザの操作性も低下することになる。
【0192】
図13は、本実施の形態における画像登録動作を示すシーケンス図である。なお、本発明の第1の実施の形態の画像表示システム1の画像登録動作を説明するために参照した図3に示すシーケンス図に対して、図13は、ステップS60、S61が追加されている。このため、ステップS60、S61以外についての説明は省略する。
【0193】
登録画像112のサムネイル124に対する分類処理が実行されると(ステップS5)、当該サムネイル124が当該分類カテゴリに最初に分類されたものであるか否か、すなわち、当該分類カテゴリに既に分類されたサムネイル124が存在しないか否かがカテゴリ分類部115によって判断される(ステップS60)。
【0194】
ここで、当該登録画像112のサムネイル124が当該分類カテゴリに最初に分類されたものであると判断された場合には、画像配置部117によってカテゴリ座標データが画像DB114に登録される(ステップS61)。
【0195】
一方、当該登録画像112のサムネイル124が当該分類カテゴリに最初に分類されたものでないと判断された場合には、画像登録動作は、ステップS6を実行する。
【0196】
すなわち、本実施の形態においては、登録画像112のサムネイル124が分類されていない分類カテゴリに対しては、カテゴリ座標が設定されないこととなる。また、画像配置部117によるカテゴリ座標の設定は、最初に登録画像112のサムネイル124が分類された分類カテゴリ(最初に出現した分類カテゴリ)の座標を図4(a)における「論文」の分類カテゴリの座標に設定し、次に登録画像112のサムネイル124が分類された分類カテゴリ(次に出現した分類カテゴリ)の座標を図4(a)における「図面」の分類カテゴリの座標に設定するなど、予め定めた順序で設定するようにしてもよい。
【0197】
図14は、本実施の形態におけるサーバ装置110の表示画面生成動作を示すフローチャートである。なお、図8に示した本発明の第1の実施の形態におけるサーバ装置110の表示画面生成動作では、ステップS31乃至S37の各ステップを分類カテゴリによらずに各ステップ内で全ての表示領域の画像について処理をしていたが、本実施の形態における表示画面生成動作は、分類カテゴリ単位毎に処理を行っていく。
【0198】
また、本発明の第1の実施の形態におけるサーバ装置110の表示画面生成動作を説明するために参照した図8に示すフローチャートに対して、図14は、ステップS70、S71が追加されている。このため、ステップS70、S71以外についての説明は省略する。
【0199】
まず、対象の分類カテゴリが表示画面生成部118によって選択され、対象の分類カテゴリに登録画像112のサムネイル124が分類されているか否かが判断される(ステップS70)。ここで、対象の分類カテゴリに登録画像112のサムネイル124が分類されていないと判断された場合には、表示画面生成動作は、ステップS71に進む。
【0200】
一方、対象の分類カテゴリに登録画像112のサムネイル124が分類されていると判断された場合には、表示画面生成動作は、ステップS31に進み、対象の分類カテゴリに対してステップS31乃至S37が処理される。
【0201】
ステップS71においては、表示対象の全ての分類カテゴリに対する処理が終了したか否かが表示画面生成部118によって判断される。ここで、表示対象の全ての分類カテゴリに対する処理が終了したと判断された場合には、表示画面生成動作は、ステップS38に進む。
【0202】
一方、表示対象の全ての分類カテゴリに対する処理が終了していないと判断された場合には、表示画面生成動作は、ステップS70に戻り、次の分類カテゴリが表示画面生成部118によって選択される。
【0203】
すなわち、本実施の形態においては、登録画像112のサムネイル124が分類されていない分類カテゴリに対する表示画面生成動作をスキップする。
【0204】
以上説明したように、本発明の第3の実施の形態としての画像表示システムは、分類カテゴリに対して新規に画像が分類されたときに分類カテゴリの座標データを新規に設定することにより、登録画像112のサムネイル124が分類されていない分類カテゴリをマップ上に表示させない。
【0205】
このため、本発明の第3の実施の形態としての画像表示システムは、クライアント装置100において、登録画像112のサムネイル124が分類されていない分類カテゴリを表示対象としないため、通信や表示等の不要な処理を省略しシステム全体の効率を向上させることができる。
【図面の簡単な説明】
【0206】
【図1】本発明の第1の実施の形態としての画像表示システムのブロック図である。
【図2】本発明の第1の実施の形態としての画像表示システムを構成するサーバ装置のハードウェア構成図である。
【図3】本発明の第1の実施の形態としての画像表示システムの画像登録動作を示すシーケンス図である。
【図4】(a)は、本発明の第1の実施の形態としての画像表示システムを構成するサーバ装置において、各カテゴリ領域が配置されたマップを示す概念図であり、(b)は、本発明の第1の実施の形態としての画像表示システムを構成するサーバ装置において、各カテゴリ領域内に登録画像のサムネイルが配置されたマップを示す概念図であり、(c)は、本発明の第1の実施の形態としての画像表示システムを構成するサーバ装置において、原点をカテゴリ領域の中心としたときのサムネイル座標と色との関係を示す概念図であり、(d)は、本発明の第1の実施の形態としての画像表示システムを構成するサーバ装置において、CIELAB表色系のa*を水平軸、b*を垂直軸に取ったときのサムネイル座標と色との関係を示す概念図であり、(e)は、本発明の第1の実施の形態としての画像表示システムを構成するサーバ装置において、集合画像の透明部分を斜線で示した概念図である。
【図5】本発明の第1の実施の形態としての画像表示システムを構成するサーバ装置の集合画像更新処理を詳細に示すフローチャートである。
【図6】本発明の第1の実施の形態としての画像表示システムの画像検索動作を示すシーケンス図である。
【図7】(a)は、本発明の第1の実施の形態としての画像表示システムの分類表示モードにおける表示画面の例を示す概念図であり、(b)は、本発明の第1の実施の形態としての画像表示システムにおけるサムネイル一覧ビューの例を示す概念図であり、(c)は、本発明の第1の実施の形態としての画像表示システムのカラーマップ表示モードにおける表示画面の例を示す概念図である。
【図8】本発明の第1の実施の形態としての画像表示システムを構成するサーバ装置の表示画面生成動作を示すフローチャートである。
【図9】本発明の第1の実施の形態としての画像表示システムを構成するクライアント装置による拡大表示動作を説明するための概念図である。
【図10】本発明の第2の実施の形態としての画像表示システムにおけるモデルデータ作成動作を示すフローチャートである。
【図11】本発明の第2の実施の形態としての画像表示システムの画像登録動作を示すシーケンス図である。
【図12】分類表示の際に登録画像のサムネイルが分類されていない分類カテゴリの表示例である。
【図13】本発明の第3の実施の形態としての画像表示システムの画像登録動作を示すシーケンス図である。
【図14】本発明の第3の実施の形態としての画像表示システムを構成するサーバ装置の表示画面生成動作を示すフローチャートである。
【符号の説明】
【0207】
1 画像表示システム
100 クライアント装置
101 表示デバイス
102 アプリケーション
103 入力デバイス
104 画像キャッシュ
105 通信路
110 サーバ装置
111 外部I/F
112 登録画像
113 サムネイル生成部
114 画像DB
115 カテゴリ分類部
116 集合画像生成部
117 画像配置部
118 表示画面生成部
119 表示画面
120 画面制御データ
121 集合画像
122 画像配置データ
124、303 サムネイル
201 CPU
202 メモリ
203 HDD
204 ビデオメモリ
205 モニタ
206 入力デバイス
207 外部I/F
208 バス
301 ウィンドウ
302 サムネイル一覧ビュー
304、305、306 スライダ
307 表示領域
308 表示切替ボタン

【特許請求の範囲】
【請求項1】
複数の表示用画像を表示するために表示倍率に応じた一覧表示画面を生成する表示画面生成部を備えた画像処理装置であって、
前記表示画面生成部は、前記表示用画像がカテゴリ毎に集められ、前記表示用画像が配置されていない領域が透明化された集合画像を互いに異なる領域に配置した一覧表示画面を生成する第1モードと、
前記集合画像を重ねて配置した一覧表示画面を生成する第2モードと、のなかで選択されたモードをとることを特徴とする画像処理装置。
【請求項2】
オリジナル画像をサイズ変更したサムネイルを前記表示用画像として生成するサムネイル生成部と、
前記サムネイルを前記カテゴリで分類するカテゴリ分類部と、
前記集合画像に前記サムネイルを配置する画像配置部と、
前記画像配置部による配置にしたがって前記サムネイルを集めることにより前記カテゴリ毎の集合画像を生成する集合画像生成部と、を備え、
前記集合画像生成部は、前記集合画像のなかで前記サムネイルが配置されていない領域を透明化することを特徴とする請求項1に記載の画像処理装置。
【請求項3】
前記集合画像生成部は、前記カテゴリ毎に略同一のサイズの集合画像を生成することを特徴とする請求項1または請求項2に記載の画像処理装置。
【請求項4】
前記画像配置部は、全てのカテゴリにおいて、前記オリジナル画像の特徴量と前記サムネイルの位置とを関連付けた同一の数式に基づいて前記サムネイルの位置を決定することを特徴とする請求項2または請求項3に記載の画像処理装置。
【請求項5】
前記画像配置部は、全てのカテゴリにおいて、前記オリジナル画像の特徴量と前記サムネイルの位置とを関連付けた同一のモデルデータに基づいて前記サムネイルの位置を決定することを特徴とする請求項2または請求項3に記載の画像処理装置。
【請求項6】
前記表示画面生成部は、前記表示用画像が分類されていないカテゴリに対応する集合画像の生成を省くことを特徴とする請求項1乃至請求項5のいずれかに記載の画像処理装置。
【請求項7】
前記集合画像は、透明レイヤを保持することが可能な符号フォーマットで符号化されていることを特徴とする請求項1乃至請求項6のいずれかに記載の画像処理装置。
【請求項8】
画像処理装置を用いて、複数の表示用画像を表示するために表示倍率に応じた一覧表示画面を生成する画像処理方法であって、
前記表示用画像がカテゴリ毎に集められ、前記表示用画像が配置されていない領域が透明化された集合画像を互いに異なる領域に配置した一覧表示画面を生成する第1ステップと、
前記集合画像を重ねて配置した一覧表示画面を生成する第2ステップと、のなかで選択されたステップを実行することを特徴とする画像処理方法。
【請求項9】
前記画像処理装置を用いて、
オリジナル画像をサイズ変更したサムネイルを前記表示用画像として生成するサムネイル生成ステップと、
前記サムネイルを前記カテゴリで分類するカテゴリ分類ステップと、
前記集合画像に前記サムネイルを配置する画像配置ステップと、
前記画像配置ステップにおける配置にしたがって前記サムネイルを集めることにより前記カテゴリ毎の集合画像を生成する集合画像生成ステップと、をさらに実行することを特徴とする請求項8に記載の画像処理方法。
【請求項10】
複数の表示用画像を表示するために表示倍率に応じた一覧表示画面をコンピュータに生成させるための画像処理プログラムであって、
前記表示用画像がカテゴリ毎に集められ、前記表示用画像が配置されていない領域が透明化された集合画像を互いに異なる領域に配置した一覧表示画面を生成する第1ステップと、
前記集合画像を重ねて配置した一覧表示画面を生成する第2ステップと、のなかで選択されたステップを前記コンピュータに実行させる画像処理プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate


【公開番号】特開2010−49158(P2010−49158A)
【公開日】平成22年3月4日(2010.3.4)
【国際特許分類】
【出願番号】特願2008−215172(P2008−215172)
【出願日】平成20年8月25日(2008.8.25)
【出願人】(000006747)株式会社リコー (37,907)
【Fターム(参考)】