画像イメージを検索するタグデータの生成方法
【課題】画像イメージの検索を効果的に行うことができる画像タグデータを生成する。
【解決手段】デスクトップ画面150には複数の文字155を含むデスクトップ空間画像が表示される。デスクトップ画面にはさらにユーザによりアノテーション157が書き込まれる。複数の文字のそれぞれの位置とアノテーションの位置から計算したアノテーションと各文字との距離に基づいて各文字に対する強調データを生成する。文字と強調データとで構成される画像タグデータを生成し、画像タグデータと画像タグデータに関連付けられたデスクトップ空間画像とを保存する。画像タグデータを対象にした検索を行い、デスクトップ空間画像と文字の組を表示するときに、文字を強調データで強調表示する。
【解決手段】デスクトップ画面150には複数の文字155を含むデスクトップ空間画像が表示される。デスクトップ画面にはさらにユーザによりアノテーション157が書き込まれる。複数の文字のそれぞれの位置とアノテーションの位置から計算したアノテーションと各文字との距離に基づいて各文字に対する強調データを生成する。文字と強調データとで構成される画像タグデータを生成し、画像タグデータと画像タグデータに関連付けられたデスクトップ空間画像とを保存する。画像タグデータを対象にした検索を行い、デスクトップ空間画像と文字の組を表示するときに、文字を強調データで強調表示する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、コンピュータに格納された曖昧な情報を画像イメージに対するユーザの既視感を通じて検索する技術に関し、さらに詳細には画像イメージを効果的に検索するためのタグデータを生成する技術に関する。
【背景技術】
【0002】
今日コンピュータは文書の作成、プレゼンテーション、Webサイトへのアクセス、または、画像や音声の再生などのような多様な目的に利用される。近年、ハードディスク・ドライブ(HDD)の容量が飛躍的に増大して、コンピュータに格納されるデータの容量も増大の一途をたどっている。ユーザは過去にアクセスしたファイルに再度アクセスする場合に、ファイル名やファイルの作成日時などの形式的な情報を覚えていればその検索は容易である。しかし、形式的な情報を思い出せない場合は膨大な情報の中から目的とするファイル(以下、ターゲット・ファイルという。)を手探りで探していくことになる。これまで、検索対象を絞り込むために、カレンダーを利用する方法があった。この方法ではカレンダーの各日付に登録された情報は、登録した日付を覚えていれば探し出すことができる。
【0003】
特許文献1は、一度みたインターネット上のサイトを再度検索する場合の時間を短縮する技術を開示する。同文献には、インターネット上にて検索及び閲覧済みのサイトおよび情報を、サムネイル(画像の縮小見本)として一括蓄積し、再度過去検索サイトおよび情報を閲覧可能とし、情報収集の対象となる情報どうしの比較検討作業を簡略化ならしめることが記載されている。特許文献2は、媒体ファイルを高速でブラウジングする技術を開示する。同文献には、時間周期に対し、特定形式の媒体ファイル、アノテーションまたはブックマーク処理された媒体ファイル、または他のユーザ指定のブラウズ可能パラメータをブラウジングするよう構成し、ブラウジングまたはスクローリングファンクションのスピードをユーザの希望に基づき変更できるようにすることが記載されている。
【0004】
特許文献3は、手書きによるアノテーションが付加された文書の管理を支援する文書管理支援装置を開示する。同文献には、活字文字と手書文字とが混在する文書を表す画像データを受け取ると、受け取った画像データから文書画像データを生成し、文書画像データにおいて、活字文字が記されている活字領域の画像データと、手書文字が記されている手書領域の画像データとを分離することが記載されている。同文献にはさらに、注目領域を特定し、注目領域内において隣り合う2つの文字の間の距離を当該2つの文字列の組毎に求め、求めた各距離のばらつきの程度が所定の範囲を超えないときは注目領域が活字領域であると判断する一方で、当該ばらつきの程度が所定の範囲を超えるときは前記注目領域が手書き領域であることを判断することが記載されている。
【0005】
特許文献4は、文書に対して手書きで追記された追記マークに基づいて、互いに関連性を有すると推測される領域の記載内容を集めてユーザに提示する文書処理装置を開示する。同文献には、紙文書を電子化して得られる文書画像データを解析し、その文書画像データの表す文書の原本に対して手書きで追記された追記マークを抽出し、抽出された追記マークの各々について、その追記マークが対応付けられている画像領域を特定することが記載されている。そして、複数の追記マークが抽出された場合に、各追記マークの形状を解析して、同一又は類似する形状を有する追記マーク毎に分類し、同一又は類似する形状を有すると分類された追記マークの各々について、その追記マークに対応付けられていると特定された画像領域に配置されている画像を所定のレイアウトにしたがって出力することが記載されている。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2002−73684号公報
【特許文献2】特開2005−216285号公報
【特許文献3】特開2007−11683号公報
【特許文献4】特開2006−301695号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
カレンダーの日付を基準にして検索対象を絞り込む方法は、カレンダーに登録されたデータに関しては有効であるが、ターゲット・ファイルがつねにカレンダーに登録されているとは限らない。また、日付を覚えていない場合は、ターゲット・ファイルを探すのが困難になる。
【0008】
人間には、ファイルの名称や作成日時などのような形式的な情報よりもそれに関連するイメージの方が記憶に残しやすいという特質がある。したがって、イメージを通じて特定のファイルを探し出すしくみがあれば、コンピュータの利便性を一層高めることができる。ここで、コンピュータのデスクトップ画面は、その時点でユーザが行っていた作業に対する画像イメージを提供することができる。また、プレゼンテーションを行うための資料の各ページもその場で参加者が発言していた内容を記録した音声ファイルを思い出す手がかりとなる画像イメージを提供することができる。ユーザがターゲット・ファイルに感じる既視感をこのような画像イメージとして再現できれば、形式的な情報を覚えていなくても画像イメージを通じてターゲット・ファイルを連想することで検索を容易に行うことができる。
【0009】
画像イメージに対する既視感を利用する検索システムでは、ターゲット・ファイルが関連付けられた画像イメージが、所定のトリガ・イベントごとにキャプチャされて保管されていくことになる。画像イメージの検索は、検索キーワードに基づいて画像イメージ自体を分析して行う方法もあるが精度が低く、また、デスクトップ空間画像のように似通った画像を検索する手法としては採用しがたい。したがって、画像イメージの数が多い場合は一次検索をキーワードで行い、ユーザは一次検索により抽出した画像イメージを実際にみて、ターゲット・ファイルに対する既視感を抱かせるような画像イメージを最終的に特定する必要がある。一次検索により、ターゲット・ファイルを含むと判断できる画像イメージを短時間で探せる付加的な情報を画像イメージと同時に提供できればユーザにとって都合がよい。
【0010】
また、画像イメージの一次検索に利用するタグデータとしては、一般にユーザが作成したファイル名または付加的情報やタイムスタンプが利用される。しかし、ユーザが画像イメージをキャプチャするトリガ・イベントのタイミングでその画像イメージに対する適切なタグデータを作成しようとしても定型的な言葉になりがちであったり、誤った言葉を付加してしまったり、あるいは検索に適さない言葉を選択してしまったりして検索には必ずしも有効に機能しない場合がある。また、タイムスタンプは、ターゲット・ファイルに対する関連度合いを表しているとは限らないので、一次検索において効果的に利用できない場合がある。
【0011】
そこで本発明の目的は、画像イメージの検索を効果的に行うことができる画像タグデータの生成方法を提供することにある。さらに本発明の目的は、ターゲット・ファイルが関連付けられた画像イメージを既視感に基づいて有効に検索する情報を提供できる画像タグデータを生成する方法を提供することにある。さらに本発明の目的は、入力ミスのない画像タグデータを生成する方法を提供することにある。さらに本発明の目的は、そのような画像タグデータを利用して画像イメージを検索する方法を提供することにある。さらに本発明の目的は、そのような画像タグデータの生成が可能な情報処理装置および当該情報処理装置に実装するコンピュータ・プログラムを提供することにある。
【課題を解決するための手段】
【0012】
ターゲット・ファイルのアイコンやウインドウを含むデスクトップ空間画像はターゲット・ファイルを検索する際の既視感をデスクトップ画面に形成することができる。ターゲット・ファイルを検索するためには、最初にデスクトップ空間画像を検索する必要がある。本発明においては、デスクトップ空間画像の検索を容易に行うことができる画像タグデータを生成する方法を提供する。デスクトップ画面には、ユーザが作業をしている間に、複数の文字を含むデスクトップ空間画像が表示される。デスクトップ空間画像の数が多い場合は最初にキーワードを入力して候補となるデスクトップ空間画像を抽出し、さらに抽出したデスクトップ空間画像をユーザが実際にみて確認する二次検索により目的とする画像を決定することになるが、本発明にかかる画像タグデータは、一次検索および二次検索に有効に利用することができる。
【0013】
ユーザが、デスクトップ画面の注目した位置にマークとしての第1のアノテーションを書き込むと、情報処理装置が第1のアノテーションの位置と各文字の位置とに基づいて各文字を重み付けするための強調データを各文字についてする。そして、情報処理装置が文字と文字に対応する強調データとを含む画像タグデータを生成し、画像タグデータとデスクトップ空間画像とを関連付けて情報処理装置に保存する。画像タグデータは、通常は重み付けされた複数の文字を含むことになる。
【0014】
ユーザは、保存された画像タグデータをキーワードで検索することで、画像タグデータに関連付けられたデスクトップ空間画像を抽出することができる。その際、デスクトップ空間画像と画像タグデータを組にして表示し、かつ、画像タグデータの文字を強調データで強調表示させることができる。アノテーションの座標から近い画像タグデータの文字ほど強調の度合いを強めることで、ユーザはデスクトップ空間画像と関連して表示された文字からターゲット・ファイルに関連すると記憶しているデスクトップ空間画像を見つけ出し易くなる。画像タグデータは、アノテーションに基づいてデスクトップ空間画像に含まれる文字の中から選択されるため、ユーザが入力するタグデータのように誤った情報であったり、似通った情報になったりすることがない。
【0015】
強調データは、中心の要素に最大の数値を設定し外側に配列された要素に順番に小さな数値を設定したランキング・マトリクスを使用することで容易に生成することができる。ランキング・マトリクスの中心の要素には、アノテーションの座標が設定され、各文字の位置が重なるランキング・マトリクスの要素に設定された数値が、各文字の重みを示す強調データとなる。画像タグデータは、所定値以上の重みを有する文字だけを選択することで、より目的とするデスクトップ空間画像が見つけやすくなる。ユーザはデスクトップ画面に第2のアノテーションを書き込むことができる。アノテーションが複数書き込まれている場合は、第1のアノテーションの座標を中心とするランキング・マトリクスと第2のアノテーションの座標を中心とする前記ランキング・マトリクスが重なる場合がある。重なった領域ではランキング・マトリクスの要素の数値を各ランキング・マトリクスの平均値または各ランキング・マトリクスの高い方の数値とすることができる。
【0016】
第1のアノテーションの座標を中心とするランキング・マトリクスと第2のアノテーションの座標を中心とするランキング・マトリクスが重ならない場合は、対象となる文字に近い位置に中心座標があるランキング・マトリクスを使用することができる。第1のアノテーションの近傍に存在する文字のフォント・サイズで各文字までの距離を正規化することで、異なるフォント・サイズの文字が表示されているデスクトップ空間画像間でも有効に重み付けを利用することができる。正規化は、ランキング・マトリクスの平面的なサイズに対して行ってもよい。
【0017】
デスクトップ空間画像に含まれる複数の文字の中には、画像タグデータとして利用する価値が低い単語を含む場合がある。その場合は、検索のキーワードに利用される可能性の高い文字だけを画像タグデータの候補として特定された文字である候補文字として選択し、候補文字についてだけ強調データを生成するようにしてもよい。さらに情報処理装置はアノテーションが書き込まれているか否かを判断し、アノテーションが書き込まれていないと判断したときに、デスクトップ画面に表示されているいずれかの候補文字を画像タグデータとして選択することができる。
【0018】
したがって、アノテーションが書き込まれないデスクトップ空間画像に対しても、画像タグデータは作成されることになる。選択する画像タグデータは、デスクトップ画面に対するユーザの視点の座標に最も近い候補文字としたり、デスクトップ画面が一定時間以上変化しないときにデスクトップ画面の中心座標に最も近い候補文字としたりすることができる。また選択する画像タグデータは、デスクトップ画面に複数のフレームで構成されたウインドウが表示されているときに最大フレームの中心座標に最も近い候補文字としたり、デスクトップ画面に表示された複数の文字の中で最大のフォント・サイズの候補文字としたりすることができる。さらにまた選択する画像タグデータは、マウス・カーソルの座標に最も近い候補文字としたり、デスクトップ画面に表示された複数の文字の中で所定数以上の候補文字と色が異なる候補文字としたりすることができる。
【0019】
また、前回保存された画像タグデータを今回保存するデスクトップ空間画像に関する画像タグデータとして選択することができる。強調表示は、強調データで文字のフォント・サイズを変更したり、文字の色を変更したり、文字の装飾を変更したりすることができる。デスクトップ空間画像と文字の組を複数抽出したときに、強調データの大きさに基づいた順番に従って各組を表示することができる。
【発明の効果】
【0020】
本発明により、画像イメージの検索を効果的に行うことができる画像タグデータの生成方法を提供することができた。さらに本発明により、ターゲット・ファイルが関連付けられた画像イメージを既視感に基づいて有効に検索する情報を提供できる画像タグデータを生成する方法を提供することができた。さらに本発明により、入力ミスのない画像タグデータを生成する方法を提供することができた。さらに本発明により、そのような画像タグデータを利用して画像イメージを検索する方法を提供することができた。さらに本発明により、そのような画像タグデータの生成が可能な情報処理装置および当該情報処理装置に実装するコンピュータ・プログラムを提供することができた。
【図面の簡単な説明】
【0021】
【図1】本実施の形態にかかるコンピュータのハードウエアの概略の構成を示す機能ブロック図である。
【図2】コンピュータの動作状態の一例を示す図である。
【図3】本実施の形態にかかる検索システムのソフトウエアの構成を示す機能ブロック図である。
【図4】画像タグデータを生成する手順を示すフローチャートである。
【図5】デスクトップ画面に候補文字とマークが表示されている様子を示す図である。
【図6】候補文字の重みを計算するためのランキング・マトリクスのデータ構造の一例を示す図である。
【図7】図2の時刻t1で連想データ作成部が作成したメタデータのデータ構造の一例を示す図である。
【図8】連想データを蓄積する手順を示すフローチャートである。
【図9】連想データを利用してターゲット・ファイルを検索する手順を示すフローチャートである。
【図10】検索されたデスクトップ空間画像の一例を示す図である
【図11】ファイル選択画面の一例を示す図である。
【図12】マークが書き込まれない場合に画像タグデータを作成する手順を示すフローチャートである。
【発明を実施するための形態】
【0022】
[コンピュータのハードウエア構成]
図1は、本実施の形態にかかるコンピュータ10のハードウエアの概略の構成を示す機能ブロック図である。コンピュータ10は、ノートブック型パーソナル・コンピュータであってもデスクトップ型パーソナル・コンピュータであってもよく特に限定しない。コンピュータ10は、CPU11、メイン・メモリ13、HDD15、液晶ディスプレイ(LCD)17、内蔵カメラ19、内蔵マイクロフォン21、無線モジュール23、USBポート25、内蔵スピーカ27、およびキーボードやマウスなどの入力デバイス29がバス31に接続されている。バス31は、ノース・ブリッジやサウス・ブリッジなどの複数のチップ・セットを含む。USBポート25には、外付けのLCD、プロジェクタ、外付けマイクロフォン、外付けカメラ、外付けHDD、ブルートゥース(Bluetooth:登録商標)・マウス、光学ディスク・ドライブ(ODD)、血圧計、歩数計、デジタイザまたはオシロスコープなどの外部デバイスを接続することができる。コンピュータ10のハードウエアの構成は周知であるため、個々のデバイスの説明は省略する。
【0023】
[コンピュータの作業状態]
図2は、コンピュータ10の動作状態の一例を示す図である。コンピュータ10では、ユーザの認識のもとで、あるいはユーザが認識していないところでさまざまなプログラムが実行され実行状態を示す情報の一部はLCD17に表示される。ここにプログラムの実行状態を示す情報はコンピュータ10のその時点での動作環境を構成し、CPU11で実行されているプログラムの種類と表示されるアプリケーション・ウインドウの表示内容、USBポート25に接続された外部デバイスの種類と動作状況、およびスピーカ27の音量やLCD17の輝度設定のようなハードウエアの設定状態などを含む。
【0024】
図2には、コンピュータ10の動作環境の一例として、時刻t0から時刻t4までの間にコンピュータ10で処理されている内部使用データと外部入力データの時系列的な状態を示している。図2には、内部使用データを処理するアプリケーション・ソフトウエアの一例として、主に文書を作成する文書作成支援ソフトウエア、主にプレゼンテーションに利用するプレゼンテーション支援ソフトウエア、Webサーバにアクセスして文書あるいは画像を閲覧するためのWebブラウザ、および動画を再生するための動画再生ソフトウエアを示している。この他に内部使用データを処理するアプリケーション・ソフトウエアには、電子メールの送信および受信を行うメーリング・ソフトウエアや表計算を行う表計算ソフトウエアなども含まれる。
【0025】
また図2には、外部入力データを処理するソフトウエアの一例として、内蔵カメラ19またはUSBポート25に接続された外付けカメラからの映像を記録および再生するカメラ処理ソフトウエア、内蔵マイクロフォン21またはUSBポート25に接続された外付けマイクロフォンの音声を録音および再生するマイクロフォン処理ソフトウエア、無線モジュール23が接続するアクセス・ポイントのIPアドレスを取得するIPアドレス取得ソフトウエア、およびUSBポート25に接続された血圧計の測定結果を処理する心拍数計測ソフトウエアを示している。この他に外部入力データを処理するソフトウエアとして、USBポート25に接続されるマウスやODDなどの外付けデバイスを制御するデバイス・ドライバなども含むことができる。
【0026】
図2には、各ソフトウエアの時刻t0から時刻t4までの実行状態を示している。文書作成支援ソフトウエアは、時刻t1と時刻t3の間にファイル名がaaa.xy1のファイルを作成または更新している。プレゼンテーション支援ソフトウエアは、時刻t0と時刻t4の間にファイル名がbbb.xy2のファイルをLCD17またはUSBポート25に接続されたプロジェクタに表示している。Webブラウザは、時刻t0から時刻t4までの間に、ファイル名がa.html〜f.htmlのファイルをLCD17表示している。動画再生ソフトウエアは、時刻t0と時刻t1の間にファイル名がccc.xy3のファイルをLCD17と内蔵スピーカ27で再生している。
【0027】
カメラ処理ソフトウエアは、時刻t1と時刻t4の間に映像を撮影し、ファイル名がddd.xy4のファイルとしてHDD15に記録している。マイクロフォン処理ソフトウエアは、時刻t0と時刻t3の間に音声を録音し、ファイル名がeee.xy5のファイルとしてHDD15に記録している。IPアドレス取得ソフトウエアは、無線モジュール23が時刻t0と時刻t1の間に接続したアクセス・ポイントのIPアドレスとしてa.b.c.dを取得し、時刻t1と時刻t4の間に接続したIPアドレスとしてe.f.g.hを取得している。心拍数計測ソフトウエアは、時刻t0と時刻t1の間に血圧計が測定した心拍数をnnnとして取得している。時刻t0、t1、t2、t3、t4は、あらかじめ定義されたイベントに基づいて確定され、それぞれのタイミングで画像イメージが生成されるが、これについては後に説明する。
【0028】
[検索システムの構成]
図3は、本実施の形態にかかる検索システム100のソフトウエアの構成を示す機能ブロック図である。図3は、HDD15およびLCD17以外はすべてソフトウエアの機能ブロックを示している。図3に示すソフトウエアの機能ブロックはHDD15に格納されたプログラムが、メイン・メモリ13にロードされてCPU11で実行されることで形成される。各機能ブロックのソフトウエアは、周知のオペレーティング・システム(OS)および周知のデバイス・ドライバなどと協働して所定の機能を実現する。各機能ブロックは単体のプログラム・モジュールで構成してもよいし、複数の機能ブロックをまとめたプログラム・モジュールで構成してもよい。
【0029】
アノテーション作成部101は、ユーザがLCD17に表示されたデスクトップ画面に対して入力デバイス29またはUSBポート25に接続されたデジタイザによりアノテーションを書き込むための処理をする周知のソフトウエアである。本実施の形態におけるアノテーションは、ユーザがデスクトップ画面に書き込んだマークをいう。マークは、ユーザがデスクトップ画面に表示された文字に対する自らまたは第3者の注意を喚起するために書き込まれる。マークの座標は後に説明するデスクトップ空間画像を検索するためのタグデータの生成に利用される。デスクトップ空間画像を検索するためのタグデータは画像タグ生成部104により生成されるが、このタグデータを内部使用データ処理部105または外部入力データ処理部109が扱うタグデータと区別するために、以後、画像タグデータということにする。
【0030】
本明細書においてはデスクトップ画面とは、画像を表示したり入力デバイス29からフォント文字または手書きのラインを書き込んだりすることができるLCD17の表示領域を意味するものとする。デスクトップ画面には、アプリケーションが実行されていないときに壁紙、所定のアイコン、およびOSのバーなどの定型的なデスクトップ画像が表示される。デスクトップ画面にはデスクトップ空間画像またはデスクトップ画像が表示される。デスクトップ空間画像は、デスクトップ画面の上にアプリケーション・ウインドウが表示されているときには、アプリケーション・ウインドウが表示されたLCD17の画像全体をいい、アプリケーション・ウインドウが表示されていないときは、デスクトップ画像をいう。また、アノテーション作成部101を通じてデスクトップ画面にマークが書き込まれている場合は、デスクトップ空間画像はマークも含む。したがってデスクトップ空間画像はデスクトップ画像、アプリケーション・ウインドウおよびマークで構成される場合がある。アプリケーション・ウインドウは、画像タグデータを構成する複数の文字を含む。
【0031】
空間画像取得部102は、イベントが発生したタイミングでLCD17のデスクトップ画面に表示されたデスクトップ空間画像をキャプチャする。デスクトップ空間画像は、LCD17に表示するための画像イメージを一時的に記憶するVRAMが保有している。空間画像取得部102は、たとえば入力デバイス29のPrintScreenキーの押下、マウスのクリック、またはジェスチャー動作でデスクトップ空間画像をキャプチャする周知のプログラムを利用して構成することができる。空間画像取得部102は、デスクトップ画面に表示されている複数の文字の中で、名詞、形容詞、および数詞などのデスクトップ空間画像を検索するためのキーワードとして有効な品詞の文字だけを画像タグデータの候補として選定する。以後、画像タグデータの候補となる文字を候補文字ということにする。
【0032】
空間画像取得部102は、連想データ作成部115からの指示でデスクトップ空間画像をキャプチャしてBMP、JPEG、またはTIFなどの画像イメージのデータ形式で空間画像記録部103に記録する。空間画像取得部102はデスクトップ空間画像をキャプチャする際に、すべての候補文字の座標を計算して候補文字とその座標を空間画像記録部102に記録する。候補文字の座標は、候補文字全体を矩形で囲ったときの矩形の中心座標として周知の方法で計算することができる。空間画像取得部102はデスクトップ空間画像をキャプチャする際に、マークをベクター形式で空間画像記録部103に記録する。空間画像取得部102は、キャプチャしたデスクトップ空間画像の空間画像記録部103におけるファイル名とデータ・パスを画像タグ生成部104と連想データ作成部115に送る。
【0033】
空間画像記録部103、内部使用データ記録部107、外部入力データ記録部111、および連想データ記録部117は、HDD15の記憶領域の一部である。画像タグ生成部104は、空間画像記録部103に記録されたマークの座標を計算する。マークは座標が特定でき、かつ、ユーザが誤って記入した点のようなノイズと区別できる点、線、または面とすることができる。マークは、ユーザが記入した文字、●印、レ印、×印、□印などでもよく、また候補文字を囲う閉曲線でもよい。
【0034】
画像タグ生成部104は、閉曲線として描かれたベクター形式のマークをラスター形式のイメージに展開してマークを形成する軌跡の座標を計算し、軌跡の座標から幾何学的な重心を計算してマークの座標とする。閉曲線の幾何学的な重心の計算は、周知のプログラムで行うことができる。マークが閉曲線でない場合は、画像タグ生成部104は、マークのパターン認識をして座標を計算することができる。たとえばマークが、レ点の場合は角部分を座標としたり、×印の場合は交差部分を座標としたり、塗りつぶしの面の場合は形状を閉曲線にみたてたときの幾何学的重心を座標としたりすることができる。
【0035】
画像タグ生成部104は、空間画像記録部103から取得した各候補文字の座標とマークの座標の距離に基づいて、各候補文字についてその重みを示す強調データを生成する。強調データは、画像タグデータでデスクトップ空間画像を検索したときに、ターゲット・ファイルに対する既視感を反映できるように、重みに基づいて画像タグデータを強調表示するための情報である。強調データは、候補文字の大きさに関する情報、色に関する情報、および装飾に関する情報のいずれかまたは任意の2以上の要素の組み合わせとすることができる。
【0036】
画像タグ生成部104は、ランキング・マトリクス171を利用して候補文字の重みを示す強調データを計算する。ランキング・マトリクス171のデータ構造は図6を参照して後に説明する。画像タグ生成部104は、所定値以上の重みを有する候補文字を画像タグデータとして選択する。よって画像タグデータは、所定値以上の重みを有する候補文字とそれに対応する強調データで構成される。画像タグ生成部104は空間画像記録部103からキャプチャされたデスクトップ空間画像のファイル名とHDD15におけるデータ・パスを取得して画像タグデータとともにそれらを連想データ作成部115に送る。画像タグデータの生成方法は、図4を参照して後に説明する。
【0037】
内部使用データ処理部105は、図2に示した内部使用データに関する周知の複数のソフトウエアを利用して構成されている。内部使用データ処理部105は、内部使用データ記録部107に記憶された所定のファイルをメイン・メモリ13に読み出して編集、表示、または再生の処理を行う。内部使用データ処理部105は、ユーザが新たにファイルを作成したり編集したりしたときに内部使用データ記録部107にそのファイルを記録する。内部使用データ処理部105の各ソフトウエアは、メイン・メモリ13上にロードされてファイルを処理しているときに、処理に関連するタグデータが更新されるたびに連想データ作成部115に送る。
【0038】
たとえば、文書作成支援ソフトウエアが処理するファイルのページが図7で説明するタグデータ項目に選定されているときは、内部使用データ処理部105は、ページが変更されるたびにそのページ情報を連想データ作成部115に送る。内部使用データ処理部105の各ソフトウエアは内部使用データ記録部107に記録するファイルのファイル名称とデータ・パスを連想データ作成部115に送る。
【0039】
内部使用データに関するタグデータは、文書作成支援ソフトウエアや文書閲覧ソフトウエアの名称、処理しているファイルの名称、および処理しているページとすることができる。内部使用データに関するタグデータはまた、メーリング・ソフトウエアが処理した電子メールのサブジェクト名、送信または受信時刻、送信者名、または宛先名とすることができる。あるいは内部使用データに関するタグデータは、Webブラウザが閲覧したファイルのURLや動画再生ソフトウエアの名称、処理しているファイルの名称、開始時刻、および終了時刻とすることができる。
【0040】
外部入力データ処理部109は、図2に示した外部入力データに関する周知のソフトウエアを利用して構成されている。外部入力データ処理部109は、外部からコンピュータ10に入力された画像、音声、IPアドレス、または、外付けデバイスの識別子などに関連する外部入力データを外部入力データ記録部111に記録する。外部入力データ処理部109は、外部から外部入力データを収集したり、または外部入力データ記録部111に記録された外部入力データをLCD17に表示したり内蔵スピーカ27で再生したりする。
【0041】
外部入力データ処理部109の各ソフトウエアは、メイン・メモリ13上にロードされてファイルを処理しているときに、処理に関連するタグデータが更新されるたびに連想データ作成部115に送る。たとえば、IPアドレス取得ソフトウエアが取得するIPアドレスが図4で説明するタグデータ項目に選定されているときは、外部入力データ処理部109は、IPアドレスが変更されるたびにそのIPアドレスを連想データ作成部115に送る。外部入力データ処理部109の各ソフトウエアは外部入力データ記録部111に記録するファイルのファイル名称とデータ・パスを連想データ作成部115に送る。
【0042】
外部使用データに関するタグデータは、カメラ処理ソフトウエアやマイクロフォン処理ソフトウエアの名称、処理しているファイルの名称、開始時刻および終了時刻とすることができる。外部使用データに関するタグデータはまた、マイクロフォンが収集した音声の大きさ、音源の方向とすることもできる。外部使用データに関するタグデータはまた、接続されたネットワークのIPアドレス、開始時刻、および終了時刻としたり、USBポート25に接続されたデバイスの名称、開始時刻および終了時刻としたりすることもできる。
【0043】
イベント生成部113は、図2の時刻t0、t1、t2、t3、t4を確定するためのイベントを生成して連想データ作成部115に送る。イベントは後にユーザがターゲット・ファイルに関して抱いている既視感を再現するためのデスクトップ空間画像をキャプチャするタイミングを与える。イベントは、デスクトップ空間画像がユーザにターゲット・ファイルに対して最も既視感を与えることができる状態のときに生成することが望ましい。そのようなイベントの一例としては、プレゼンテーション支援ソフトウエアを使ってユーザがプレゼンテーションをしている間にページ操作が行われて新しいページに移行したとき、内部使用データを処理するソフトウエアの中であらかじめ定義した特徴的なアプリケーション・ウインドウがアクティブになったときを挙げることができる。
【0044】
さらにイベントは、内蔵マイクロフォン21が録音を開始または終了したとき、内蔵カメラ19が撮影を開始または終了したとき、または無線モジュール23が接続するアクセス・ポイントのIPアドレスが変更されたときに生成することができる。さらにイベントは、コンピュータ10を使用している間にユーザがアノテーション作成部101の機能を有効にしてマークの書き込みを可能な状態にしたり、それを無効な状態にしたり、あるいは特別に割り当てられたキーを押下したりしたときに生成することができる。
【0045】
連想データ作成部115は、イベント生成部113から受け取ったイベントに応じて、その時点でデスクトップ画面に表示されているデスクトップ空間画像をキャプチャして空間画像記録部103に記録するように、空間画像取得部102に指示する。連想データ作成部115はイベント生成部113から受け取ったイベントに応じて、内部使用データ処理部105および外部入力データ処理部109にファイル名、データ・パスおよびタグデータを送るように指示する。連想データ作成部115はイベント生成部113から受け取ったイベントに応じて、画像タグ生成部104にデスクトップ空間画像のファイル名およびデータ・パスならびに当該デスクトップ空間画像に対応する画像タグデータを送るように指示する。
【0046】
連想データ作成部115は内部使用データ処理部105および外部入力データ処理部109から同一のタグデータ項目に対して新しいタグデータが送られてきたときにはそれまで受けっていたタグデータを更新する。たとえば、図2に示したWebブラウザが閲覧していたファイルの名称に関するタグデータは、時刻t0から時刻t1までの間に連想データ作成部115によりa.html、b.html、c.htmlと更新される。連想データ作成部115は、たとえば時刻t1でイベント生成部113から受け取ったイベントに応じて、キャプチャされたデスクトップ空間画像に対するタグデータおよび画像タグデータを確定し、XML(Extensible Markup Language)でそれらを関連付けて当該デスクトップ空間画像のメタデータを作成する。連想データ作成部115は作成したメタデータを連想データ記録部117に記録する。
【0047】
検索画面処理部119は、ターゲット・ファイルが含まれているデスクトップ空間画像を一次検索するために、ユーザがキーワードを入力する検索画面をLCD17に表示する。検索画面処理部119は、ターゲット・ファイルが含まれているデスクトップ空間画像をユーザが実際に確認して探すためのイメージ検索画像をLCD17に表示する。イメージ検索画像はターゲット・ファイルを取得するためのファイル選択画像を含む。ファイル選択画像は、デスクトップ空間画像とそれに関連するメタデータで構成する。検索画面処理部119は、空間画像記録部103に記録された複数のデスクトップ空間画像と画像タグデータを組にして、各組を縮小したサムネイル形式で表示したり、スクロール形式で表示したり、あるいは画面送り形式で表示したりすることができる。検索実行部121は、検索画面処理部119から受け取った検索のキーワードに合致するメタデータを連想データ記録部117から取得して検索画面処理部119に戻す。連想データ記録部117は、XMLで作成したメタデータを保存する。
【0048】
[画像タグデータの生成手順]
図4は、画像タグ生成部104が画像タグデータを生成する手順を示すフローチャートである。図5は、デスクトップ画面に候補文字とマークが表示されている様子を示す図である。ブロック201では、USBポート25にプロジェクタを接続してユーザがプレゼンテーションをしているものとする。コンピュータ10のLCD17には、図5に示すデスクトップ画面150にアプリケーション・ウインドウ151、153が表示されている。アプリケーション・ウインドウ151は、プレゼンテーション支援ソフトウエアにより作成されたものとする。アプリケーション・ウインドウ151、153には、文章が表示されている。
【0049】
図5(A)には、アプリケーション・ウインドウ151が含む文章の中から抽出された複数の候補文字155が矩形で示されている。また、候補文字の位置は、アプリケーション・ウインドウ151において表示されていた位置を示している。ブロック203では、ユーザがプレゼンテーションの進行に伴って強調して説明したいデスクトップ画面150上の場所、または参加者から受けた質問に対する回答に関連する場所などにアノテーション作成部101を通じてマーク157を書き込む。マーク157は、通常は特定の文字の上に書き込まれるがこれに限定されるものではなく、文字とは重ならない場所に書き込まれたものでもよい。
【0050】
ブロック205では、連想データ作成部115からの指示に基づいて空間画像取得部102が、現在デスクトップ画面150に表示されているすべての情報であるデスクトップ空間画像をキャプチャしてイメージ・データとして空間画像記録部115に記録し、デスクトップ空間画像のファイル名およびデータ・パスを連想データ作成部115と画像タグ生成部104に送る。空間画像取得部102は、キャプチャするときにデスクトップ画面に表示されているすべての文字の中から候補文字を選択しその座標を計算する。空間画像取得部102は、ベクター形式のデータで構成されたマーク157の情報と、複数の候補文字155と各候補文字155の座標を空間画像記録部115に記録する。空間画像取得部102は、デスクトップ空間画像、マーク157の情報、複数の候補文字155およびその座標を空間画像記録部103に記録するとその旨を画像タグ生成部104に通知する。
【0051】
通知を受け取った画像タグ生成部104は、ブロック207でベクター形式のマーク157をラスター形式のイメージに展開してマーク157の座標を計算する。マーク157が複数ある場合は、それぞれについて座標を計算する。ここで、ユーザの意図しない小さな模様がデスクトップ画面150に書き込まれたような場合は、画像タグ生成部104はそれを孤立点として処理しマークとしての処理対象から除外する。ブロック209では画像タグ生成部104が、マーク157の座標と各候補文字の座標から両者の距離をそれぞれの候補文字について計算し各候補文字に対する強調データの計算を開始する。
【0052】
各候補文字の重みは、マーク157の座標を中心とし半径が等間隔で異なる複数の同心円を設定し、各同心円上に同じ重みを示す数値を割り当て、かつ外側に向かうに従って同心円に割り当てた数値が小さくなるようにして候補文字の座標に一致したまたは近い同心円の数値を当該候補文字の重みとして計算することができる。本実施の形態では、重みの計算を簡単に行うために、画像タグ生成部104はランキング・マトリクスを使用して重みを示す強調データを計算する。
【0053】
図6は、候補文字の重みを計算するためのランキング・マトリクスのデータ構造を説明する図である。ランキング・マトリクスでは、複数の正方形の要素がマトリクス状に配列され、各要素には中心の要素からの距離に応じた重みを示す数値が設定される。ランキング・マトリクスにはある特定の1つの要素を中心要素として設定したときに、中心要素を取り囲む第一番目の外側要素の集合、第一番目の外側要素の集合を取り囲む第二番目の外側要素の集合、第二番目の外側要素の集合を取り囲む第三番目の外側要素の集合を定義することができる。そして、中心要素に最も高い数値を設定し、第一番目、第二番目、第三番目と配列された外側要素の集合に順番に小さな数値を設定する。
【0054】
図6には、一例として中心要素に9を設定し、順次外側要素の集合に6、3、1と設定した7×7のランキング・マトリクス171を示している。ランキング・マトリクス171は、平面的なサイズも所定の値に決められている。画像タグ生成部104は、ランキング・マトリクス171の中心要素をマーク157の座標に設定して、各候補文字の座標と重なった要素に設定された数値を当該候補文字の強調データとして計算する。ランキング・マトリクス171の平面的なサイズは対象とする候補文字のフォント・サイズに基づいて決定し、要素の数および数値は適宜設定することができる。
【0055】
画像タグ生成部104は、ランキング・マトリクス171の平面的なサイズの中に入った候補文字には9、6、3、1のいずれかの数値を付与することで強調データを計算する。なお、ランキング・マトリクス171の平面的なサイズから外れて外側に表示されていた候補文字の強調データはゼロになる。また、アプリケーション・ウインドウ151に書き込まれたマーク157に基づいて、アプリケーション・ウインドウ153に表示された候補文字の重みも計算することができる。
【0056】
ここで、ランキング・マトリクス171の平面的なサイズを一定にしておき、異なるフォント・サイズの候補文字に同一サイズのランキング・マトリクス171を適用すると、マーク157の表示位置から候補文字の表示位置までの距離とその重要さの関係が対応しなくなる。たとえば、図5(A)のアプリケーション・ウインドウ151と図5(B)のアプリケーション・ウインドウ151aは同じ情報を表示しかつマーク157、157aは同じ候補文字の上に書き込まれているが、アプリケーション・ウインドウ151aに表示されている文字のフォント・サイズはアプリケーション・ウインドウ151に表示されている文字のフォント・サイズよりも小さい。
【0057】
アプリケーション・ウインドウ151を含むデスクトップ空間画像とアプリケーション・ウインドウ151aを含むデスクトップ空間画像に対して、それぞれ同一サイズのランキング・マトリクス171を適用すると、アプリケーション・ウインドウ157aに小さなフォント・サイズで表示された各候補文字にはアプリケーション・ウインドウ157に大きなフォント・サイズで表示された各候補文字よりも大きな重みが与えられることになり、フォント・サイズの異なる候補文字を含むデスクトップ空間画像の間では重みが候補文字の重要度を反映しない情報になってしまう。
【0058】
この問題を解消するために、ブロック211で画像タグ生成部104は、ランキング・マトリクス171に対して候補文字の座標を適用する際に、マーク157の近辺に表示されている候補文字のフォント・サイズでマーク157から各候補文字までの距離を正規化する。具体的には最初に、基準となるフォント・サイズの候補文字とそれに適用する所定の平面的なサイズを備えるランキング・マトリクスを設定する。そしてマーク157の近辺に存在する候補文字のフォント・サイズが基準となる候補文字のフォント・サイズと異なる場合は両者の比を計算し、マーク157から候補文字までのデスクトップ画面上の距離をその比で修正する。この場合、マーク157の近辺にある文字のフォント・サイズが基準となる候補文字のフォント・サイズよりも小さい場合は、ランキング・マトリクスを適用する各候補文字までの距離はデスクトップ画面上の座標から計算した距離よりも短くなる。
【0059】
あるいは、画像タグ生成部104は、マーク157の近辺にある候補文字のフォント・サイズでランキング・マトリクス171の平面的なサイズを正規化してもよい。具体的には、前述のように計算した候補文字の比でランキング・マトリクス171の平面的なサイズを修正する。この場合、マーク157の近辺にある文字のフォント・サイズが基準となる候補文字のフォント・サイズよりも小さい場合は、基準となるフォント・サイズの候補文字に適用するランキング・マトリクスよりも平面的なサイズが小さいラインキング・マトリクスを適用することになる。いずれかの方法で重みを正規化することで、異なるフォント・サイズの候補文字の間でも各候補文字の重みを相対的に比較することができるようになる。なお、マーク157の近辺にある候補文字に代えて、マーク157の近辺に表示されている候補文字を含んだ複数の文字のフォント・サイズの平均値を利用して正規化してもよい。そのような平均値は、画像タグ生成部104が空間画像取得部102から取得できるように空間画像取得部102を構成することができる。
【0060】
同一のデスクトップ空間画像を表示するデスクトップ画面に、複数のマーク157が書き込まれることがある。そしてマーク間の間隔が短い場合は、ランキング・マトリクス171が重なる場合もある。2つ以上のランキング・マトリクスが重なった場合は、重なった部分の要素の数値を平均した値をまたは重なった部分の要素の大きい方の数値をその要素の強調データとする。図6では、ランキング・マトリクス173と175が一部で重なっており、重なった部分の要素にはそれぞれのランキング・マトリクスの数値を平均した数値が強調データとして設定されている様子が示されている。また、ランキング・マトリクス177と179が一部で重なっており、重なった部分の要素にはそれぞれのラインキング・マトリクスのうち大きな方の数値が強調データとして設定されている様子が示されている。画像タグ生成部104は、同一のデスクトップ空間画像に、ランキング・マトリクス171が重ならない複数のマークが書き込まれている場合は、各候補文字についてそれぞれのマークに設定したランキング・マトリクスによる強調データを計算し最大の数値を選択する。
【0061】
ブロック211で各候補文字に対する強調データの計算が終了すると、画像タグ生成部104はブロック213で画像タグデータを生成する。画像タグデータは、1以上の重みが与えられた候補文字と強調データで構成される。画像タグ生成部104は、空間画像取得部102が取得した複数の候補文字のなかで、強調データがゼロの候補文字を画像データから排除する。画像タグデータは通常は複数の候補文字を含むが、単一の候補文字で構成される場合もある。画像タグデータを生成した画像タグ生成部104は、関連するデスクトップ空間画像のファイル名とデータ・パスとともに画像タグデータを連想データ作成部115に送る。
【0062】
[メタデータのデータ構造]
コンピュータ10が図2に示したように動作しているときに連想データ作成部115が作成したメタデータを説明する。時刻t1、t2、t3、t4でそれぞれキャプチャされたファイル名がイメージ#001、イメージ#002、イメージ#003、イメージ#004のデスクトップ空間画像の実データまたはボディ部分が空間画像記録部103に記録され、そのファイル名とHDD15内での記録場所に対するデータ・パスがメタデータの一部として連想データ記録部117に記録される。また、画像タグデータ生成部104により生成されたそれぞれのデスクトップ空間画像に関連する画像タグデータがメタデータの一部として連想データ記録部117に記録される。
【0063】
さらにまた、イメージ#001、イメージ#002、イメージ#003、イメージ#004に対して時刻t0〜t1、時刻t1〜時刻t2、時刻t2〜時刻t3、時刻t3〜時刻t4の間にコンピュータ10の動作環境として存在していたタグデータがそれぞれのデスクトップ空間画像に関連するメタデータとして連想データ記録部117に記録される。各タグデータで示された実データは内部使用データ記録部107または外部入力データ記録部111に記録される。
【0064】
図7は、図2の時刻t1で連想データ作成部115が作成したメタデータのデータ構造の一例を示す図である。メタデータ180は、時刻t1で発生したイベントに基づいて作成された複数のタグデータおよび複数の画像タグデータが、ファイル名がイメージ#001のデスクトップ空間画像に関連付けられている。メタデータ180は画像タグ生成部104、内部使用データ処理部105および外部入力データ処理部109からあらかじめ受け取るように定めておいたタグデータ項目に基づいて形式が作成されている。タグデータ項目には、アノテーション、ソフトウエア名、ファイル名、ページ、URL、開始・終了時刻などが含まれる。メタデータ180は各タグデータをツリー状に関連付けて構成することができる。たとえば、プレゼンテーション支援ソフトウエアが複数のファイルを処理したときに、ページはそれぞれのファイルの下層に位置するタグデータとして構成することができる。
【0065】
アノテーションには、画像タグ生成部104が生成した6個の文字を含む画像タグデータが含まれている。ここでは、「タブレット」、「解像度」、「無線LAN」、「アプリケーション」、「価格」、「販売日」という文字と[a(×)b(×)c(×)]の形式で作成された強調データでそれぞれ構成された画像タグデータがメタデータ180の一部を構成している。強調データ[a(×)]、「b(×)」、[c(×)]は、それぞれ当該文字のフォント・サイズ、色、および装飾方法に対応している。たとえば、強調データ[a(1)]は、当該文字を最も大きなフォント・サイズで表示することを示し、[a(4)]は当該文字を最も小さなフォント・サイズで表示することを示している。
【0066】
文書作成支援ソフトウエアは時刻t0と時刻t1の間で作成、編集または表示がされていないのでタグデータは記録されていない。プレゼンテーション支援ソフトウエアに関するタグデータは時刻t1で表示されていたbbb.xy2のファイル名とその時刻に表示されていた10ページのページ数が記録されている。Webブラウザに関するタグデータは、時刻t0と時刻t1との間で閲覧が更新されたa.html、b.html、c.htmlのファイルの中で、時刻t1で閲覧されていたc.htmlのファイル名が記録されている。
【0067】
動画再生ソフトウエアに関するタグデータとしては、時刻t0と時刻t1の間で再生されていたccc.xy3のファイル名、開始時刻00:bb:ccおよび終了時刻00:dd:eeが記録されている。カメラ処理ソフトウエアは、時刻t0と時刻t1の間で撮影および再生をしていないのでタグデータは記録されていない。マイクロフォン処理プログラムに関するタグデータとしては、時刻t0と時刻t1の間で録音されたeee.xy5のファイル名、録音開始時刻aa:bb:ccおよび時刻t2と時刻t3との間の録音終了時刻cc:dd:eeが記録されている。
【0068】
録音終了時刻は時刻t1の時点では確定しないので、連想データ作成部115は、時刻t3の時点でメタデータを作成する際に、外部入力データ処理部109または外部入力データ記録部111から録音終了時刻を取得してメタデータ150に記録する。IPアドレス取得ソフトウエアに関するタグデータとしては、時刻t0と時刻t1の間で無線モジュール23が接続されていたアクセス・ポイントのa.b.c.dというIPアドレスとその開始時刻00:aa:ccおよび終了時刻00:ee:ffが記録されている。内部使用データ記録部107および外部入力データ記録部111には、タグデータにリンクした実データが記録されており、LCD17に表示されたタグデータを入力デバイス29で選択すると実データをメイン・メモリ13にロードすることができる。
【0069】
[連想データの蓄積手順]
つぎにユーザが過去に処理したことがあるとかすかに記憶しているターゲット・ファイルを、デスクトップ空間画像およびメタデータで再現することにより検索を行う手順を説明する。図8は、連想データを蓄積する手順を示すフローチャートで、図9は連想データを利用してターゲット・ファイルを検索する手順を示すフローチャートである。ここに連想データは、イベントごとに作成されたデスクトップ空間画像とそれに関連するメタデータとで構成される。ブロック301でコンピュータ10が動作を開始すると、ユーザは図3に示した検索システム100を実行する。
【0070】
ブロック303でユーザは検索画面処理部119がLCD17に表示する検索画面を通じて、図7で説明したソフトウエア名、ファイル名、ページ、URL、時刻情報、およびIPアドレスのようなタグデータ項目を決定して空間画像取得部102および連想データ作成部115に設定する。なお、一旦登録したタグデータ項目は、次回の起動のときは自動的に同じ内容で設定するようにしてもよい。
【0071】
ブロック305では、ユーザはさらにデスクトップ空間画像をキャプチャしてメタデータとしてのタグデータおよび画像タグデータを作成するタイミングを取得するためのイベント項目を検索画面を通じて選定し、イベント生成部113に設定する。ここでは、プレゼンテーション支援ソフトウエアを利用しているユーザが、資料のページを操作するときのタイミングをイベント項目として設定するものとする。イベント項目は1つまたは複数選択することができる。その後ユーザは連想データの収集作業を意識することなく通常通りコンピュータ10を使用する。
【0072】
ブロック307では、コンピュータ10は図7の検索システム100に対して連想データ収集作業を開始する指示が行われるまで待機する。連想データ収集作業は、ユーザがキーボード29の特定のキーを押下したり、特定のプログラムが動作を開始したり、あるいは、コンピュータ10が特定の外部デバイスの装着を認識したときに開始することができる。ここでは、プレゼンテーション支援ソフトウエアが起動したときに連想データの収集作業を開始するものとする。このようにして図2の時刻t0では、連想データ収集作業が開始される。ユーザは、プレゼンテーションの間、アノテーション作成部101を通じてデスクトップ画面にマーク157を書き込む。
【0073】
ブロック309では、連想データ収集作業が開始されたことに基づいて連想データ作成部115はイン・メモリ13上にXMLのデータ形式で図7に示した構造のメタデータのフォーマットを作成する。そして、ブロック303で設定されたタグデータ項目について、内部使用データ処理部105から内部使用データに関するタグデータを取得し、外部入力データ処理部109から外部入力データに関するタグデータを取得してメイン・メモリ13に記憶する。連想データ作成部115は、同一のタグデータ項目に対して新しいタグデータを受け取ったときはタグデータを更新し、その処理を時刻t0から時刻t1まで継続する。文書作成支援ソフトウエアおよびカメラ処理ソフトウエアは時刻t1までの間は実行されないので、それらに関するタグデータ項目は空のままである。連想データ作成部115は、プレゼンテーション支援ソフトウエアのページが操作されるたびに操作された後のページを対応するタグデータ項目に記録する。新たなページが操作されたときには、古いページを上書きして更新する。
【0074】
連想データ作成部115は、Webブラウザが閲覧するURLが変更されるたびに、そのファイル名を更新しながら対応するタグデータ項目に記憶する。連想データ作成部115は、動画再生ソフトウエアが実行したccc.xy3のファイル名、開始時刻および終了時刻を対応するタグデータ項目に記憶する。連想データ作成部115は、マイクロフォン処理ソフトウエアのソフトウエア名(eee.xy5)と録音開始時刻を記憶する。なお、マイクロフォン処理ソフトウエアは、イベントが発生するたびにeee.xy5のファイルに時間タグを付加して、後に検索して実行されるときにイベントが発生する時刻を再生開始時刻または再生終了時刻に設定できるようにする。連想データ作成部115は、IPアドレス取得ソフトウエアが取得したIPアドレスと接続開始時刻および接続終了時刻を記憶する。
【0075】
ブロック311では、プレゼンテーション支援ソフトウエアのページが操作されたことにより時刻t1でイベント生成部113がイベントを生成する。ブロック313では、連想データ作成部115はイベントの生成に応じて空間画像取得部102に、その時点でLCD17に表示されているデスクトップ空間画像をキャプチャして空間画像記録部103に記録するように指示する。連想データ作成部115は同時に空間画像取得部102からキャプチャされたデスクトップ空間画像のファイル名(イメージ#001)とそのデータ・パスを取得し、メタデータの一部として連想データ記録部117に記録する。
【0076】
また、空間画像取得部102は、キャプチャされるデスクトップ空間画像に表示されるすべての文字の中から候補文字を選択し、その座標とともに空間画像記録部103に記録する。さらに空間画像取得部102は、キャプチャされるデスクトップ空間画像に書き込まれたマーク157をベクター形式のデータとしてアノテーション作成部101から取得して空間画像記録部103に記録する。ブロック315では画像タグデータ生成部104が空間画像記録部103に記録された候補文字の座標およびマーク157の座標に基づいてランキング・マトリクス171、173、175を利用して画像タグデータを生成し、連想データ作成部115に送る。
【0077】
連想データ作成部115は、受け取った画像タグデータをイメージ#001のデスクトップ空間画像に関連するメタデータの一部として連想データ記録部117に記録する。ブロック317では連想データ作成部115が、内部使用データ処理部105および外部入力データ処理部109から受け取ったタグデータをイメージ#001のデスクトップ空間画像に関連するメタデータの一部として連想データ記録部117に記録する。その結果、イメージ#001のデスクトップ空間画像に関連するメタデータが確定する。
【0078】
ブロック319では連想データ作成部115が連想データ収集作業を終了したか否かを検索画面処理部119が判断する。連想データ収集作業の終了の判断は、ブロック307の開始の判断に対応させて同一のソフトウエアの状態の変化により行うことができる。時刻t4まではブロック319からブロック309に戻って同様の手順でメタデータが連想データ記録部117に記録される。ブロック319で時刻t4に到達したときにプレゼンテーション支援ソフトウエアが終了するとブロック321で連想データ収集作業終了が終了する。ブロック303とブロック305でタグデータ項目とイベント項目を初期設定しておけば、以後ユーザは何ら意識しないでもブロック307からブロック321までの手順が自動的に実行され、ユーザが通常の作業を行っている間にイベントの生成のタイミングで連想データが連想データ記録部117に蓄積されていく。
【0079】
[ターゲット・ファイルの検索手順]
つぎに、蓄積された連想データを利用して曖昧に記憶しているターゲット・ファイルを検索する手順を、図9を参照して説明する。ユーザは過去にターゲット・ファイルを作成したり、利用したりしたことを漠然と覚えているが、それをHDD15から検索するために必要なファイル名または利用の日時を思い出せない場合がある。たとえば、ユーザはある話し手が過去に話していた特定の内容を録音したことだけをかすかに記憶しており、それをターゲット・ファイルとして検索したいとする。ユーザは録音したときのデスクトップ空間画像は記憶している可能性が高いので、本実施の形態ではターゲット・ファイルに対する既視感を、デスクトップ空間画像とメタデータからなる視覚を通じて認識できる連想データを通じて具現化しターゲット・ファイルの検索範囲を絞り込んでいく。
【0080】
ブロック401でコンピュータ10が動作を開始したとき、連想データ記録部117には、図7に示したようなメタデータが複数記録されているものとする。ユーザはブロック403で、検索画面処理部119がLCD17に提供する検索画面を通じて空間画像記録部103に記録されたデスクトップ空間画像を検索する。ユーザは、ターゲット・ファイルに関連するデスクトップ空間画像を検索するために、検索画面にターゲット・ファイルが作成されたときに表示されていたと思われるデスクトップ空間画像を検索するためのキーワードを入力する。ここでは、「解像度」、「無線LAN」、「タブレット」、および「価格」の4つのキーワードをOR条件で入力するものとする。検索画面処理部119は入力されたキーワードと論理式からなる検索条件を検索実行部121に指示する。
【0081】
検索実行部121は検索条件に該当する画像タグデータとその画像タグデータを含むデスクトップ空間画像のファイル名を連想データ記録部117から検索して検索画面処理部119に送る。ブロック405で検索画面処理部119は、受け取ったファイル名に対応するデスクトップ空間画像を空間画像記録部103から取得し、検索実行部117を通じて画像タグデータを連想データ記録部117から取得してLCD17に表示する。図10は、検索されたデスクトップ空間画像と画像タグデータの組(以下、イメージ検索画像という。)500の一例を示す。イメージ検索画像500は、検索条件に合致した5つの要素画像501a〜501eで構成されている。各要素画像501a〜501eは、それぞれデスクトップ空間画像503a〜503eとタグクラウド505a〜505eで構成されている。タグクラウドは、各要素画像501a〜501eにおいて検索のキーワードに合致した画像タグデータで構成される。
【0082】
検索画面処理部119は、検索条件に合致した文字を強調データで強調表示してタグクラウド505a〜505eを表示する。タグクラウドは、強調データに基づいて強調表示された複数の候補文字の集合である。ここで、要素画像501aは、時刻t1で作成されたファイル名がイメージ#001のデスクトップ空間画像のメタデータ180(図7参照)を含むものとする。メタデータ180は、検索条件に合致する4つのキーワードに該当する画像タグデータの候補文字を含んでおり、タグクラウド505aとして表示されている。ここでは、強調データとしてフォント・サイズだけを適用している。メタデータ180では、フォント・サイズに関する強調データが「解像度」、「無線LAN」、「タブレット」、および「価格」に対して、それぞれ1、2、4、4になっており、タグクラウド505aは強調データに応じた大きさで表示される。
【0083】
他の要素画像では、各候補文字に対応する強調データに応じてタグクラウドが表示される。また、検索画面処理部119は、最初に入力したキーワードに対応する画像タグデータの文字の強調データの大きさの順番に従って、要素画像501a〜501eの表示の順番を決定する。表示の順番は、サムネイル表示形式の場合は配列の順番としたり、スクロール表示形式の場合は上位から下位に向かう順番としたり、画面送り表示の場合は表示の順番としたりすることができる。要素画像の表示の順番は、検索された候補文字の強調データの合計で決定してもよい。コンピュータ10をプレゼンテーションに使用するような場合は、デスクトップ空間画像の広い面積に文字が表示されて相互に似通ってしまうことが多いので、候補文字がタグクラウドとして表示されていない場合は、ユーザは要素画像501a〜501eを同じ重要度でみていくことになり、音声ファイルに関連するデスクトップ空間画像を思い出すのが困難な場合がある。
【0084】
しかし、イメージ検索画像500は、複数の要素画像をターゲット・ファイルに関連の強い順番で配置しており、さらにタグクラウドを参照することで、ユーザは似通った複数のデスクトップ空間画像の中から、ターゲット・ファイルが関連付けられたデスクトップ空間画像を思い出し易くなる。また、タグクラウドの候補文字は、ユーザが入力したものではなく、デスクトップ空間画像に表示されていたものを抽出しているので、誤って入力されたタグデータの文字でデスクトップ空間画像が表示されるようなこともなくなる。さらに、強調表示された候補文字は、ユーザがそのプレゼンテーションにおいて最も印象に残る文字である可能性が高く、ユーザはターゲット・ファイルが関連付けられたデスクトップ空間画像を一層思い出しやすくなる。
【0085】
ブロック407では、イメージ検索画像500をみたユーザが要素画像501aを選択するものとする。ただし、イメージ検索画像500の先頭に表示された要素画像501aがターゲット・ファイルに関連するということが常に保証されているものではなく、最終的にはユーザがタグクラウドおよびデスクトップ空間画像に対して抱く既視感に基づいて要素画像を選択する。検索システム100は、ユーザのターゲット・ファイルに対するなんとなく録音の記憶があるという既視感を、現実に録音したときに表示されていたデスクトップ空間画像を通じて鮮明にして、ターゲット・ファイルの検索を支援することができる。ユーザが要素画像501aを選択すると、検索画面処理部119は連想データ記録部117から対応するメタデータを取得してLCD17にファイル選択画像を表示する。
【0086】
ブロック409では選択された特定のデスクトップ空間画像とそれに対応するメタデータからなる連想データが、検索画面処理部119によりファイル選択画像としてLCD17に表示される。図11にファイル選択画像の一例を示す。検索画面処理部119によりLCD17に表示されたファイル選択画像600の中には、イメージ#001のデスクトップ空間画像601と動画再生ソフトウエアとファイル名ccc.xy3のファイルを明示するアイコン603、IPアドレス取得ソフトウエアとIPアドレスa.b.c.dを明示するアイコン605、および心拍数計測ソフトウエアと心拍数nnnを明示するアイコン607が表示されている。アイコン603、605、607は、イメージ#001のデスクトップ空間画像が生成された時刻t1の瞬間にはLCD17の画面に存在しないタグデータを表示するために作成されたものである。
【0087】
その他のタグデータは時刻t1において、プレゼンテーション支援ソフトウエアが作成したアプリケーション・ウインドウ609、Webブラウザが作成したアプリケーション・ウインドウ611、およびマイクロフォン処理ソフトウエアが作成したアプリケーション・ウインドウ613がLCD17に表示される。アプリケーション・ウインドウ609には、メタデータ180に含まれる画像タグデータの文字と、マーク615も表示されている。ブロック411でユーザはファイル選択画像600に含まれたアプリケーション・ウインドウやアイコンからターゲット・ファイルと想定したアプリケーション・ウインドウ613を選択する。ターゲット・ファイルは、メタデータに関連するアイコンまたはアプリケーション・ウインドウの中から選択することになる。
【0088】
アプリケーション・ウインドウ613はHDD15の外部入力データ処理部111に保存された開始時刻aa:bb:ccから終了時刻cc:dd:eeまでの音声ファイルeee.xy5にリンクしており、入力デバイス29で選択するとブロック413で時刻aa:bb:ccから時刻t0まで録音された音声が再生される。もし時刻t2のデスクトップ空間画像(イメージ#002)とアプリケーション・ウインドウ613が選択されたときは時刻t1から時刻t2まで録音された音声が再生され、時刻t3のデスクトップ空間画像(イメージ#003)とアプリケーション・ウインドウ613が選択されたときは、時刻t2から時刻cc:dd:eeまで録音された音声が再生される。本実施の形態における検索は、ユーザがターゲット・ファイルの名称や作成日時を記憶していない場合に行われるため、ターゲット・ファイルを認識するためにはユーザは実際に当該ファイルを実行して内容を確認する必要がある。
【0089】
ブロック415でユーザは、その音声を聞いてファイル名がeee.xy5のファイルがターゲット・ファイルであるか否かを判断し、ターゲット・ファイルであると判断した場合はブロック413で検索を終了する。ターゲット・ファイルでないと判断した検索条件を変更する必要がある場合は、ブロック403に移行してユーザは他のキーワードを入力する。検索条件を変更する必要がないと判断したときは、ブロック407に移行して、ユーザは他の要素画像をみて選択し同様の手順を繰り返す。
【0090】
[マークが書き込まれない場合の画像タグデータの生成方法]
図4では、デスクトップ画面に書き込まれたマーク157に基づいて画像タグデータを生成した。しかし、空間画像記録部103にはマークを含まないデスクトップ空間画像が記録される場合もある。マークを含まないデスクトップ空間画像にも、ターゲット・ファイルは存在するので、そのようなデスクトップ空間画像に対しても画像タグデータを生成して要素画像が検索結果から脱落しないようにする必要がある。しかも、この場合の画像タグデータもユーザの既視感を再現できるデスクトップ空間画像が検索できるように生成する必要がある。図12は、デスクトップ画面にマークが書き込まれない場合に画像タグデータを作成する手順を示すフローチャートである。
【0091】
ブロック701では、空間画像記録部103にデスクトップ空間画像と候補文字およびその座標が記録されている。ブロック703では、ブロック701で空間画像記録部103にもしマークの情報も一緒に記録されている場合は、画像タグ生成部104はブロック705において図4の手順に基づいて画像タグデータを生成する。ここで、LCD17の上部には内蔵カメラ19が装着されており、コンピュータ10はユーザの顔を撮影できるものとする。そして、内蔵カメラ19はユーザを撮影している間に、周知のプログラムで画面に対するユーザの視点の座標を計算することができ、イベントが発生してデスクトップ空間画像をキャプチャするときには空間画像取得部102はその座標を空間画像記録部103に記録できるものとする。
【0092】
画像タグ生成部104がブロック703でマークの情報は記録されていないと判断した場合は、ブロック707でユーザのデスクトップ画面に対する視点の座標が空間画像記録部103に記録されているかどうかを判断する。視点の座標が記録されている場合は、ブロック709でその視点に最も近い候補文字を画像タグデータとして選択する。ここではユーザがデスクトップ画面をみて作業しているときはその視点にある文字を注視しているため、視点にある文字とデスクトップ空間画像を関連付けて記憶している可能性が高いと想定している。
【0093】
ここで、空間画像取得部102は、現在のデスクトップ画面が変化しない時間である静止時間を計測して、デスクトップ空間画像をキャプチャするときに空間画像記録部103に記録できるものとする。ブロック707で視点の座標が記録されていないと判断したときは、画像タグ生成部104はブロック711で空間画像記録部103に記録された静止時間が一定値以上であるかどうかを判断する。静止時間が一定値以上であると判断したときは、ブロック713で画像タグ生成部104は、デスクトップ画面の中心座標に最も近い候補文字を画像タグデータとして選択する。ここでは、特定のデスクトップ空間画像が長い時間表示されているときは、ユーザはデスクトップ画面の中心に最も重要な情報を表示する傾向があることを想定している。
【0094】
ここで、空間画像取得部102は、デスクトップ空間画像がWebブラウザのように複数のフレームで分割されたアプリケーション・ウインドウを含む場合に、各フレームの面積を計算して最も大きなフレームの中心座標を計算し、デスクトップ空間画像をキャプチャするときに空間画像記録部103に記録できるものとする。ブロック711で一定時間以上静止していないと判断したときは、画像タグ生成部104はブロック715でWebブラウザのアプリケーション・ウインドウが複数のフレームを含み、面積が最大のフレームの中心座標が空間画像記録部103に記録されているかどうかを判断する。最大フレームの中心座標が記録されている場合は、ブロック717で画像タグ生成部104は、最大フレームの中心座標に最も近い候補文字を画像タグデータとして選択する。ここでは、最も面積の大きなフレームに重要な情報が表示されている可能性が高いと想定している。
【0095】
ここで、空間画像取得部102は、デスクトップ空間画像に表示された文字のフォント・サイズを計算し、最もフォント・サイズの大きな候補文字を指定して、デスクトップ空間画像をキャプチャするときに空間画像記録部103に記録できるものとする。ブロック715で最大フレームの中心座標が記録されていないと判断したときは、画像タグ生成部104はブロック719で最大フォント・サイズの文字が空間画像記録部103に記録されているか否かを判断する。最大フォント・サイズの文字が記録されている場合は、ブロック721で画像タグ生成部104は最大フォント・サイズの候補文字を画像タグデータとして選択する。大多数の文字のフォント・サイズよりも大きくてかつ同一のフォント・サイズの文字が複数ある場合は、最大フォント・サイズの文字としてそれらの複数の文字を選択することができる。ここでは、デスクトップ空間画像に表示されている文字の中で、最大のフォント・サイズの文字は当該デスクトップ空間画像に対する既視感に重要な役割を果たす可能性が高いと想定している。
【0096】
ここで、空間画像取得部102は、デスクトップ空間画像の上を移動するマウス・カーソルの特定の軌跡の座標を計算して、その中心座標をデスクトップ空間画像をキャプチャするときに空間画像記録部103に記録できるものとする。マウス・カーソルの特定の軌跡とは、幾何学的重心を座標として計算できる閉曲線を描く軌跡をいう。ブロック719で最大フォント・サイズの文字が記録されていないと判断したときは、画像タグ生成部104はブロック723でマウス・カーソルの座標が空間画像記録部103に記録されているか否かを判断する。マウス・カーソルの座標が記録されている場合は、ブロック725で画像タグ生成部104はマウス・カーソルの座標に最も近い候補文字を画像タグデータとして選択する。ここでは、ユーザは画面上でマウス・カーソルを、閉曲線を描くように移動させて、会議の参加者の注目を特定の文字に向けることがあることを想定している。
【0097】
ここで、空間画像取得部102は、デスクトップ画面に表示されている文字の色を識別して、他の所定数以上の文字と色が異なる候補文字を指定し、デスクトップ空間画像をキャプチャするときに空間画像記録部103に記録できるものとする。ブロック723でマウス・カーソルの座標が記録されていないと判断したときは、画像タグ生成部104はブロック729で異なる色の候補文字が空間画像記録部103に記録されているか否かを判断する。所定数以上の文字の色と異なる色の候補文字が記録されている場合は、画像タグ生成部104はブロック729で異なる色の候補文字を画像タグデータとして選択する。異なる色の候補文字が複数ある場合はそれらの複数の候補文字を選択する。ここでは文章の中で他の文字と異なる色で着色された文字は重要な意味を有していると想定している。
【0098】
ブロック727で異なる色の候補文字が記録されていないと判断したときは、画像タグ生成部104はブロック731で、今回キャプチャしたデスクトップ空間画像の1つ前にキャプチャしたデスクトップ空間画像について生成した画像タグデータを当該デスクトップ空間画像にも適用する。ここでは同一のファイルを使ってプレゼンテーションをするような場合は、一定の時間帯では重要なテーマが変化しないため、前回の画像タグデータが有効な場合があることを想定している。ブロック703からブロック731までの手順により、すべてのデスクトップ空間画像に対して画像タグデータを生成することができる。なお、ブロック709、713、717、721、725、729で生成した画像タグデータの強調データは、ランキング・マトリクス171の最も小さい数値、またはその他の数値としてあらかじめ定めておくものとする。また、ブロック707、711、715、719、723、727の順番は、図12に示した順番に限定する必要はなく他の順番で判断することもできる。
【0099】
これまで本発明について図面に示した特定の実施の形態をもって説明してきたが、本発明は図面に示した実施の形態に限定されるものではなく、本発明の効果を奏する限り、これまで知られたいかなる構成であっても採用することができることはいうまでもないことである。
【符号の説明】
【0100】
10…コンピュータ
100…検索システム
150…デスクトップ画面
151、153…アプリケーション・ウインドウ
157、157a、615…マーク
155、155a…候補文字
171、173、175…ランキング・マトリクス
180…メタデータ
500…イメージ検索画像
501a、501b、501c、501d、501e…要素画像
503a、503b、503c、503d、503e、601…デスクトップ空間画像
505a、505b、505c、505d、505e…タグクラウド
600…ファイル選択画像
603…動画再生ソフトウエアのアイコン
605…IPアドレス取得ソフトウエアのアイコン
607…心拍数を明示するアイコン
609…プレゼンテーション支援ソフトウエアが作成したアプリケーション・ウインドウ
611…Webブラウザが作成したアプリケーション・ウインドウ
613…マイクロフォン処理ソフトウエアが作成したアプリケーション・ウインドウ
【技術分野】
【0001】
本発明は、コンピュータに格納された曖昧な情報を画像イメージに対するユーザの既視感を通じて検索する技術に関し、さらに詳細には画像イメージを効果的に検索するためのタグデータを生成する技術に関する。
【背景技術】
【0002】
今日コンピュータは文書の作成、プレゼンテーション、Webサイトへのアクセス、または、画像や音声の再生などのような多様な目的に利用される。近年、ハードディスク・ドライブ(HDD)の容量が飛躍的に増大して、コンピュータに格納されるデータの容量も増大の一途をたどっている。ユーザは過去にアクセスしたファイルに再度アクセスする場合に、ファイル名やファイルの作成日時などの形式的な情報を覚えていればその検索は容易である。しかし、形式的な情報を思い出せない場合は膨大な情報の中から目的とするファイル(以下、ターゲット・ファイルという。)を手探りで探していくことになる。これまで、検索対象を絞り込むために、カレンダーを利用する方法があった。この方法ではカレンダーの各日付に登録された情報は、登録した日付を覚えていれば探し出すことができる。
【0003】
特許文献1は、一度みたインターネット上のサイトを再度検索する場合の時間を短縮する技術を開示する。同文献には、インターネット上にて検索及び閲覧済みのサイトおよび情報を、サムネイル(画像の縮小見本)として一括蓄積し、再度過去検索サイトおよび情報を閲覧可能とし、情報収集の対象となる情報どうしの比較検討作業を簡略化ならしめることが記載されている。特許文献2は、媒体ファイルを高速でブラウジングする技術を開示する。同文献には、時間周期に対し、特定形式の媒体ファイル、アノテーションまたはブックマーク処理された媒体ファイル、または他のユーザ指定のブラウズ可能パラメータをブラウジングするよう構成し、ブラウジングまたはスクローリングファンクションのスピードをユーザの希望に基づき変更できるようにすることが記載されている。
【0004】
特許文献3は、手書きによるアノテーションが付加された文書の管理を支援する文書管理支援装置を開示する。同文献には、活字文字と手書文字とが混在する文書を表す画像データを受け取ると、受け取った画像データから文書画像データを生成し、文書画像データにおいて、活字文字が記されている活字領域の画像データと、手書文字が記されている手書領域の画像データとを分離することが記載されている。同文献にはさらに、注目領域を特定し、注目領域内において隣り合う2つの文字の間の距離を当該2つの文字列の組毎に求め、求めた各距離のばらつきの程度が所定の範囲を超えないときは注目領域が活字領域であると判断する一方で、当該ばらつきの程度が所定の範囲を超えるときは前記注目領域が手書き領域であることを判断することが記載されている。
【0005】
特許文献4は、文書に対して手書きで追記された追記マークに基づいて、互いに関連性を有すると推測される領域の記載内容を集めてユーザに提示する文書処理装置を開示する。同文献には、紙文書を電子化して得られる文書画像データを解析し、その文書画像データの表す文書の原本に対して手書きで追記された追記マークを抽出し、抽出された追記マークの各々について、その追記マークが対応付けられている画像領域を特定することが記載されている。そして、複数の追記マークが抽出された場合に、各追記マークの形状を解析して、同一又は類似する形状を有する追記マーク毎に分類し、同一又は類似する形状を有すると分類された追記マークの各々について、その追記マークに対応付けられていると特定された画像領域に配置されている画像を所定のレイアウトにしたがって出力することが記載されている。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2002−73684号公報
【特許文献2】特開2005−216285号公報
【特許文献3】特開2007−11683号公報
【特許文献4】特開2006−301695号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
カレンダーの日付を基準にして検索対象を絞り込む方法は、カレンダーに登録されたデータに関しては有効であるが、ターゲット・ファイルがつねにカレンダーに登録されているとは限らない。また、日付を覚えていない場合は、ターゲット・ファイルを探すのが困難になる。
【0008】
人間には、ファイルの名称や作成日時などのような形式的な情報よりもそれに関連するイメージの方が記憶に残しやすいという特質がある。したがって、イメージを通じて特定のファイルを探し出すしくみがあれば、コンピュータの利便性を一層高めることができる。ここで、コンピュータのデスクトップ画面は、その時点でユーザが行っていた作業に対する画像イメージを提供することができる。また、プレゼンテーションを行うための資料の各ページもその場で参加者が発言していた内容を記録した音声ファイルを思い出す手がかりとなる画像イメージを提供することができる。ユーザがターゲット・ファイルに感じる既視感をこのような画像イメージとして再現できれば、形式的な情報を覚えていなくても画像イメージを通じてターゲット・ファイルを連想することで検索を容易に行うことができる。
【0009】
画像イメージに対する既視感を利用する検索システムでは、ターゲット・ファイルが関連付けられた画像イメージが、所定のトリガ・イベントごとにキャプチャされて保管されていくことになる。画像イメージの検索は、検索キーワードに基づいて画像イメージ自体を分析して行う方法もあるが精度が低く、また、デスクトップ空間画像のように似通った画像を検索する手法としては採用しがたい。したがって、画像イメージの数が多い場合は一次検索をキーワードで行い、ユーザは一次検索により抽出した画像イメージを実際にみて、ターゲット・ファイルに対する既視感を抱かせるような画像イメージを最終的に特定する必要がある。一次検索により、ターゲット・ファイルを含むと判断できる画像イメージを短時間で探せる付加的な情報を画像イメージと同時に提供できればユーザにとって都合がよい。
【0010】
また、画像イメージの一次検索に利用するタグデータとしては、一般にユーザが作成したファイル名または付加的情報やタイムスタンプが利用される。しかし、ユーザが画像イメージをキャプチャするトリガ・イベントのタイミングでその画像イメージに対する適切なタグデータを作成しようとしても定型的な言葉になりがちであったり、誤った言葉を付加してしまったり、あるいは検索に適さない言葉を選択してしまったりして検索には必ずしも有効に機能しない場合がある。また、タイムスタンプは、ターゲット・ファイルに対する関連度合いを表しているとは限らないので、一次検索において効果的に利用できない場合がある。
【0011】
そこで本発明の目的は、画像イメージの検索を効果的に行うことができる画像タグデータの生成方法を提供することにある。さらに本発明の目的は、ターゲット・ファイルが関連付けられた画像イメージを既視感に基づいて有効に検索する情報を提供できる画像タグデータを生成する方法を提供することにある。さらに本発明の目的は、入力ミスのない画像タグデータを生成する方法を提供することにある。さらに本発明の目的は、そのような画像タグデータを利用して画像イメージを検索する方法を提供することにある。さらに本発明の目的は、そのような画像タグデータの生成が可能な情報処理装置および当該情報処理装置に実装するコンピュータ・プログラムを提供することにある。
【課題を解決するための手段】
【0012】
ターゲット・ファイルのアイコンやウインドウを含むデスクトップ空間画像はターゲット・ファイルを検索する際の既視感をデスクトップ画面に形成することができる。ターゲット・ファイルを検索するためには、最初にデスクトップ空間画像を検索する必要がある。本発明においては、デスクトップ空間画像の検索を容易に行うことができる画像タグデータを生成する方法を提供する。デスクトップ画面には、ユーザが作業をしている間に、複数の文字を含むデスクトップ空間画像が表示される。デスクトップ空間画像の数が多い場合は最初にキーワードを入力して候補となるデスクトップ空間画像を抽出し、さらに抽出したデスクトップ空間画像をユーザが実際にみて確認する二次検索により目的とする画像を決定することになるが、本発明にかかる画像タグデータは、一次検索および二次検索に有効に利用することができる。
【0013】
ユーザが、デスクトップ画面の注目した位置にマークとしての第1のアノテーションを書き込むと、情報処理装置が第1のアノテーションの位置と各文字の位置とに基づいて各文字を重み付けするための強調データを各文字についてする。そして、情報処理装置が文字と文字に対応する強調データとを含む画像タグデータを生成し、画像タグデータとデスクトップ空間画像とを関連付けて情報処理装置に保存する。画像タグデータは、通常は重み付けされた複数の文字を含むことになる。
【0014】
ユーザは、保存された画像タグデータをキーワードで検索することで、画像タグデータに関連付けられたデスクトップ空間画像を抽出することができる。その際、デスクトップ空間画像と画像タグデータを組にして表示し、かつ、画像タグデータの文字を強調データで強調表示させることができる。アノテーションの座標から近い画像タグデータの文字ほど強調の度合いを強めることで、ユーザはデスクトップ空間画像と関連して表示された文字からターゲット・ファイルに関連すると記憶しているデスクトップ空間画像を見つけ出し易くなる。画像タグデータは、アノテーションに基づいてデスクトップ空間画像に含まれる文字の中から選択されるため、ユーザが入力するタグデータのように誤った情報であったり、似通った情報になったりすることがない。
【0015】
強調データは、中心の要素に最大の数値を設定し外側に配列された要素に順番に小さな数値を設定したランキング・マトリクスを使用することで容易に生成することができる。ランキング・マトリクスの中心の要素には、アノテーションの座標が設定され、各文字の位置が重なるランキング・マトリクスの要素に設定された数値が、各文字の重みを示す強調データとなる。画像タグデータは、所定値以上の重みを有する文字だけを選択することで、より目的とするデスクトップ空間画像が見つけやすくなる。ユーザはデスクトップ画面に第2のアノテーションを書き込むことができる。アノテーションが複数書き込まれている場合は、第1のアノテーションの座標を中心とするランキング・マトリクスと第2のアノテーションの座標を中心とする前記ランキング・マトリクスが重なる場合がある。重なった領域ではランキング・マトリクスの要素の数値を各ランキング・マトリクスの平均値または各ランキング・マトリクスの高い方の数値とすることができる。
【0016】
第1のアノテーションの座標を中心とするランキング・マトリクスと第2のアノテーションの座標を中心とするランキング・マトリクスが重ならない場合は、対象となる文字に近い位置に中心座標があるランキング・マトリクスを使用することができる。第1のアノテーションの近傍に存在する文字のフォント・サイズで各文字までの距離を正規化することで、異なるフォント・サイズの文字が表示されているデスクトップ空間画像間でも有効に重み付けを利用することができる。正規化は、ランキング・マトリクスの平面的なサイズに対して行ってもよい。
【0017】
デスクトップ空間画像に含まれる複数の文字の中には、画像タグデータとして利用する価値が低い単語を含む場合がある。その場合は、検索のキーワードに利用される可能性の高い文字だけを画像タグデータの候補として特定された文字である候補文字として選択し、候補文字についてだけ強調データを生成するようにしてもよい。さらに情報処理装置はアノテーションが書き込まれているか否かを判断し、アノテーションが書き込まれていないと判断したときに、デスクトップ画面に表示されているいずれかの候補文字を画像タグデータとして選択することができる。
【0018】
したがって、アノテーションが書き込まれないデスクトップ空間画像に対しても、画像タグデータは作成されることになる。選択する画像タグデータは、デスクトップ画面に対するユーザの視点の座標に最も近い候補文字としたり、デスクトップ画面が一定時間以上変化しないときにデスクトップ画面の中心座標に最も近い候補文字としたりすることができる。また選択する画像タグデータは、デスクトップ画面に複数のフレームで構成されたウインドウが表示されているときに最大フレームの中心座標に最も近い候補文字としたり、デスクトップ画面に表示された複数の文字の中で最大のフォント・サイズの候補文字としたりすることができる。さらにまた選択する画像タグデータは、マウス・カーソルの座標に最も近い候補文字としたり、デスクトップ画面に表示された複数の文字の中で所定数以上の候補文字と色が異なる候補文字としたりすることができる。
【0019】
また、前回保存された画像タグデータを今回保存するデスクトップ空間画像に関する画像タグデータとして選択することができる。強調表示は、強調データで文字のフォント・サイズを変更したり、文字の色を変更したり、文字の装飾を変更したりすることができる。デスクトップ空間画像と文字の組を複数抽出したときに、強調データの大きさに基づいた順番に従って各組を表示することができる。
【発明の効果】
【0020】
本発明により、画像イメージの検索を効果的に行うことができる画像タグデータの生成方法を提供することができた。さらに本発明により、ターゲット・ファイルが関連付けられた画像イメージを既視感に基づいて有効に検索する情報を提供できる画像タグデータを生成する方法を提供することができた。さらに本発明により、入力ミスのない画像タグデータを生成する方法を提供することができた。さらに本発明により、そのような画像タグデータを利用して画像イメージを検索する方法を提供することができた。さらに本発明により、そのような画像タグデータの生成が可能な情報処理装置および当該情報処理装置に実装するコンピュータ・プログラムを提供することができた。
【図面の簡単な説明】
【0021】
【図1】本実施の形態にかかるコンピュータのハードウエアの概略の構成を示す機能ブロック図である。
【図2】コンピュータの動作状態の一例を示す図である。
【図3】本実施の形態にかかる検索システムのソフトウエアの構成を示す機能ブロック図である。
【図4】画像タグデータを生成する手順を示すフローチャートである。
【図5】デスクトップ画面に候補文字とマークが表示されている様子を示す図である。
【図6】候補文字の重みを計算するためのランキング・マトリクスのデータ構造の一例を示す図である。
【図7】図2の時刻t1で連想データ作成部が作成したメタデータのデータ構造の一例を示す図である。
【図8】連想データを蓄積する手順を示すフローチャートである。
【図9】連想データを利用してターゲット・ファイルを検索する手順を示すフローチャートである。
【図10】検索されたデスクトップ空間画像の一例を示す図である
【図11】ファイル選択画面の一例を示す図である。
【図12】マークが書き込まれない場合に画像タグデータを作成する手順を示すフローチャートである。
【発明を実施するための形態】
【0022】
[コンピュータのハードウエア構成]
図1は、本実施の形態にかかるコンピュータ10のハードウエアの概略の構成を示す機能ブロック図である。コンピュータ10は、ノートブック型パーソナル・コンピュータであってもデスクトップ型パーソナル・コンピュータであってもよく特に限定しない。コンピュータ10は、CPU11、メイン・メモリ13、HDD15、液晶ディスプレイ(LCD)17、内蔵カメラ19、内蔵マイクロフォン21、無線モジュール23、USBポート25、内蔵スピーカ27、およびキーボードやマウスなどの入力デバイス29がバス31に接続されている。バス31は、ノース・ブリッジやサウス・ブリッジなどの複数のチップ・セットを含む。USBポート25には、外付けのLCD、プロジェクタ、外付けマイクロフォン、外付けカメラ、外付けHDD、ブルートゥース(Bluetooth:登録商標)・マウス、光学ディスク・ドライブ(ODD)、血圧計、歩数計、デジタイザまたはオシロスコープなどの外部デバイスを接続することができる。コンピュータ10のハードウエアの構成は周知であるため、個々のデバイスの説明は省略する。
【0023】
[コンピュータの作業状態]
図2は、コンピュータ10の動作状態の一例を示す図である。コンピュータ10では、ユーザの認識のもとで、あるいはユーザが認識していないところでさまざまなプログラムが実行され実行状態を示す情報の一部はLCD17に表示される。ここにプログラムの実行状態を示す情報はコンピュータ10のその時点での動作環境を構成し、CPU11で実行されているプログラムの種類と表示されるアプリケーション・ウインドウの表示内容、USBポート25に接続された外部デバイスの種類と動作状況、およびスピーカ27の音量やLCD17の輝度設定のようなハードウエアの設定状態などを含む。
【0024】
図2には、コンピュータ10の動作環境の一例として、時刻t0から時刻t4までの間にコンピュータ10で処理されている内部使用データと外部入力データの時系列的な状態を示している。図2には、内部使用データを処理するアプリケーション・ソフトウエアの一例として、主に文書を作成する文書作成支援ソフトウエア、主にプレゼンテーションに利用するプレゼンテーション支援ソフトウエア、Webサーバにアクセスして文書あるいは画像を閲覧するためのWebブラウザ、および動画を再生するための動画再生ソフトウエアを示している。この他に内部使用データを処理するアプリケーション・ソフトウエアには、電子メールの送信および受信を行うメーリング・ソフトウエアや表計算を行う表計算ソフトウエアなども含まれる。
【0025】
また図2には、外部入力データを処理するソフトウエアの一例として、内蔵カメラ19またはUSBポート25に接続された外付けカメラからの映像を記録および再生するカメラ処理ソフトウエア、内蔵マイクロフォン21またはUSBポート25に接続された外付けマイクロフォンの音声を録音および再生するマイクロフォン処理ソフトウエア、無線モジュール23が接続するアクセス・ポイントのIPアドレスを取得するIPアドレス取得ソフトウエア、およびUSBポート25に接続された血圧計の測定結果を処理する心拍数計測ソフトウエアを示している。この他に外部入力データを処理するソフトウエアとして、USBポート25に接続されるマウスやODDなどの外付けデバイスを制御するデバイス・ドライバなども含むことができる。
【0026】
図2には、各ソフトウエアの時刻t0から時刻t4までの実行状態を示している。文書作成支援ソフトウエアは、時刻t1と時刻t3の間にファイル名がaaa.xy1のファイルを作成または更新している。プレゼンテーション支援ソフトウエアは、時刻t0と時刻t4の間にファイル名がbbb.xy2のファイルをLCD17またはUSBポート25に接続されたプロジェクタに表示している。Webブラウザは、時刻t0から時刻t4までの間に、ファイル名がa.html〜f.htmlのファイルをLCD17表示している。動画再生ソフトウエアは、時刻t0と時刻t1の間にファイル名がccc.xy3のファイルをLCD17と内蔵スピーカ27で再生している。
【0027】
カメラ処理ソフトウエアは、時刻t1と時刻t4の間に映像を撮影し、ファイル名がddd.xy4のファイルとしてHDD15に記録している。マイクロフォン処理ソフトウエアは、時刻t0と時刻t3の間に音声を録音し、ファイル名がeee.xy5のファイルとしてHDD15に記録している。IPアドレス取得ソフトウエアは、無線モジュール23が時刻t0と時刻t1の間に接続したアクセス・ポイントのIPアドレスとしてa.b.c.dを取得し、時刻t1と時刻t4の間に接続したIPアドレスとしてe.f.g.hを取得している。心拍数計測ソフトウエアは、時刻t0と時刻t1の間に血圧計が測定した心拍数をnnnとして取得している。時刻t0、t1、t2、t3、t4は、あらかじめ定義されたイベントに基づいて確定され、それぞれのタイミングで画像イメージが生成されるが、これについては後に説明する。
【0028】
[検索システムの構成]
図3は、本実施の形態にかかる検索システム100のソフトウエアの構成を示す機能ブロック図である。図3は、HDD15およびLCD17以外はすべてソフトウエアの機能ブロックを示している。図3に示すソフトウエアの機能ブロックはHDD15に格納されたプログラムが、メイン・メモリ13にロードされてCPU11で実行されることで形成される。各機能ブロックのソフトウエアは、周知のオペレーティング・システム(OS)および周知のデバイス・ドライバなどと協働して所定の機能を実現する。各機能ブロックは単体のプログラム・モジュールで構成してもよいし、複数の機能ブロックをまとめたプログラム・モジュールで構成してもよい。
【0029】
アノテーション作成部101は、ユーザがLCD17に表示されたデスクトップ画面に対して入力デバイス29またはUSBポート25に接続されたデジタイザによりアノテーションを書き込むための処理をする周知のソフトウエアである。本実施の形態におけるアノテーションは、ユーザがデスクトップ画面に書き込んだマークをいう。マークは、ユーザがデスクトップ画面に表示された文字に対する自らまたは第3者の注意を喚起するために書き込まれる。マークの座標は後に説明するデスクトップ空間画像を検索するためのタグデータの生成に利用される。デスクトップ空間画像を検索するためのタグデータは画像タグ生成部104により生成されるが、このタグデータを内部使用データ処理部105または外部入力データ処理部109が扱うタグデータと区別するために、以後、画像タグデータということにする。
【0030】
本明細書においてはデスクトップ画面とは、画像を表示したり入力デバイス29からフォント文字または手書きのラインを書き込んだりすることができるLCD17の表示領域を意味するものとする。デスクトップ画面には、アプリケーションが実行されていないときに壁紙、所定のアイコン、およびOSのバーなどの定型的なデスクトップ画像が表示される。デスクトップ画面にはデスクトップ空間画像またはデスクトップ画像が表示される。デスクトップ空間画像は、デスクトップ画面の上にアプリケーション・ウインドウが表示されているときには、アプリケーション・ウインドウが表示されたLCD17の画像全体をいい、アプリケーション・ウインドウが表示されていないときは、デスクトップ画像をいう。また、アノテーション作成部101を通じてデスクトップ画面にマークが書き込まれている場合は、デスクトップ空間画像はマークも含む。したがってデスクトップ空間画像はデスクトップ画像、アプリケーション・ウインドウおよびマークで構成される場合がある。アプリケーション・ウインドウは、画像タグデータを構成する複数の文字を含む。
【0031】
空間画像取得部102は、イベントが発生したタイミングでLCD17のデスクトップ画面に表示されたデスクトップ空間画像をキャプチャする。デスクトップ空間画像は、LCD17に表示するための画像イメージを一時的に記憶するVRAMが保有している。空間画像取得部102は、たとえば入力デバイス29のPrintScreenキーの押下、マウスのクリック、またはジェスチャー動作でデスクトップ空間画像をキャプチャする周知のプログラムを利用して構成することができる。空間画像取得部102は、デスクトップ画面に表示されている複数の文字の中で、名詞、形容詞、および数詞などのデスクトップ空間画像を検索するためのキーワードとして有効な品詞の文字だけを画像タグデータの候補として選定する。以後、画像タグデータの候補となる文字を候補文字ということにする。
【0032】
空間画像取得部102は、連想データ作成部115からの指示でデスクトップ空間画像をキャプチャしてBMP、JPEG、またはTIFなどの画像イメージのデータ形式で空間画像記録部103に記録する。空間画像取得部102はデスクトップ空間画像をキャプチャする際に、すべての候補文字の座標を計算して候補文字とその座標を空間画像記録部102に記録する。候補文字の座標は、候補文字全体を矩形で囲ったときの矩形の中心座標として周知の方法で計算することができる。空間画像取得部102はデスクトップ空間画像をキャプチャする際に、マークをベクター形式で空間画像記録部103に記録する。空間画像取得部102は、キャプチャしたデスクトップ空間画像の空間画像記録部103におけるファイル名とデータ・パスを画像タグ生成部104と連想データ作成部115に送る。
【0033】
空間画像記録部103、内部使用データ記録部107、外部入力データ記録部111、および連想データ記録部117は、HDD15の記憶領域の一部である。画像タグ生成部104は、空間画像記録部103に記録されたマークの座標を計算する。マークは座標が特定でき、かつ、ユーザが誤って記入した点のようなノイズと区別できる点、線、または面とすることができる。マークは、ユーザが記入した文字、●印、レ印、×印、□印などでもよく、また候補文字を囲う閉曲線でもよい。
【0034】
画像タグ生成部104は、閉曲線として描かれたベクター形式のマークをラスター形式のイメージに展開してマークを形成する軌跡の座標を計算し、軌跡の座標から幾何学的な重心を計算してマークの座標とする。閉曲線の幾何学的な重心の計算は、周知のプログラムで行うことができる。マークが閉曲線でない場合は、画像タグ生成部104は、マークのパターン認識をして座標を計算することができる。たとえばマークが、レ点の場合は角部分を座標としたり、×印の場合は交差部分を座標としたり、塗りつぶしの面の場合は形状を閉曲線にみたてたときの幾何学的重心を座標としたりすることができる。
【0035】
画像タグ生成部104は、空間画像記録部103から取得した各候補文字の座標とマークの座標の距離に基づいて、各候補文字についてその重みを示す強調データを生成する。強調データは、画像タグデータでデスクトップ空間画像を検索したときに、ターゲット・ファイルに対する既視感を反映できるように、重みに基づいて画像タグデータを強調表示するための情報である。強調データは、候補文字の大きさに関する情報、色に関する情報、および装飾に関する情報のいずれかまたは任意の2以上の要素の組み合わせとすることができる。
【0036】
画像タグ生成部104は、ランキング・マトリクス171を利用して候補文字の重みを示す強調データを計算する。ランキング・マトリクス171のデータ構造は図6を参照して後に説明する。画像タグ生成部104は、所定値以上の重みを有する候補文字を画像タグデータとして選択する。よって画像タグデータは、所定値以上の重みを有する候補文字とそれに対応する強調データで構成される。画像タグ生成部104は空間画像記録部103からキャプチャされたデスクトップ空間画像のファイル名とHDD15におけるデータ・パスを取得して画像タグデータとともにそれらを連想データ作成部115に送る。画像タグデータの生成方法は、図4を参照して後に説明する。
【0037】
内部使用データ処理部105は、図2に示した内部使用データに関する周知の複数のソフトウエアを利用して構成されている。内部使用データ処理部105は、内部使用データ記録部107に記憶された所定のファイルをメイン・メモリ13に読み出して編集、表示、または再生の処理を行う。内部使用データ処理部105は、ユーザが新たにファイルを作成したり編集したりしたときに内部使用データ記録部107にそのファイルを記録する。内部使用データ処理部105の各ソフトウエアは、メイン・メモリ13上にロードされてファイルを処理しているときに、処理に関連するタグデータが更新されるたびに連想データ作成部115に送る。
【0038】
たとえば、文書作成支援ソフトウエアが処理するファイルのページが図7で説明するタグデータ項目に選定されているときは、内部使用データ処理部105は、ページが変更されるたびにそのページ情報を連想データ作成部115に送る。内部使用データ処理部105の各ソフトウエアは内部使用データ記録部107に記録するファイルのファイル名称とデータ・パスを連想データ作成部115に送る。
【0039】
内部使用データに関するタグデータは、文書作成支援ソフトウエアや文書閲覧ソフトウエアの名称、処理しているファイルの名称、および処理しているページとすることができる。内部使用データに関するタグデータはまた、メーリング・ソフトウエアが処理した電子メールのサブジェクト名、送信または受信時刻、送信者名、または宛先名とすることができる。あるいは内部使用データに関するタグデータは、Webブラウザが閲覧したファイルのURLや動画再生ソフトウエアの名称、処理しているファイルの名称、開始時刻、および終了時刻とすることができる。
【0040】
外部入力データ処理部109は、図2に示した外部入力データに関する周知のソフトウエアを利用して構成されている。外部入力データ処理部109は、外部からコンピュータ10に入力された画像、音声、IPアドレス、または、外付けデバイスの識別子などに関連する外部入力データを外部入力データ記録部111に記録する。外部入力データ処理部109は、外部から外部入力データを収集したり、または外部入力データ記録部111に記録された外部入力データをLCD17に表示したり内蔵スピーカ27で再生したりする。
【0041】
外部入力データ処理部109の各ソフトウエアは、メイン・メモリ13上にロードされてファイルを処理しているときに、処理に関連するタグデータが更新されるたびに連想データ作成部115に送る。たとえば、IPアドレス取得ソフトウエアが取得するIPアドレスが図4で説明するタグデータ項目に選定されているときは、外部入力データ処理部109は、IPアドレスが変更されるたびにそのIPアドレスを連想データ作成部115に送る。外部入力データ処理部109の各ソフトウエアは外部入力データ記録部111に記録するファイルのファイル名称とデータ・パスを連想データ作成部115に送る。
【0042】
外部使用データに関するタグデータは、カメラ処理ソフトウエアやマイクロフォン処理ソフトウエアの名称、処理しているファイルの名称、開始時刻および終了時刻とすることができる。外部使用データに関するタグデータはまた、マイクロフォンが収集した音声の大きさ、音源の方向とすることもできる。外部使用データに関するタグデータはまた、接続されたネットワークのIPアドレス、開始時刻、および終了時刻としたり、USBポート25に接続されたデバイスの名称、開始時刻および終了時刻としたりすることもできる。
【0043】
イベント生成部113は、図2の時刻t0、t1、t2、t3、t4を確定するためのイベントを生成して連想データ作成部115に送る。イベントは後にユーザがターゲット・ファイルに関して抱いている既視感を再現するためのデスクトップ空間画像をキャプチャするタイミングを与える。イベントは、デスクトップ空間画像がユーザにターゲット・ファイルに対して最も既視感を与えることができる状態のときに生成することが望ましい。そのようなイベントの一例としては、プレゼンテーション支援ソフトウエアを使ってユーザがプレゼンテーションをしている間にページ操作が行われて新しいページに移行したとき、内部使用データを処理するソフトウエアの中であらかじめ定義した特徴的なアプリケーション・ウインドウがアクティブになったときを挙げることができる。
【0044】
さらにイベントは、内蔵マイクロフォン21が録音を開始または終了したとき、内蔵カメラ19が撮影を開始または終了したとき、または無線モジュール23が接続するアクセス・ポイントのIPアドレスが変更されたときに生成することができる。さらにイベントは、コンピュータ10を使用している間にユーザがアノテーション作成部101の機能を有効にしてマークの書き込みを可能な状態にしたり、それを無効な状態にしたり、あるいは特別に割り当てられたキーを押下したりしたときに生成することができる。
【0045】
連想データ作成部115は、イベント生成部113から受け取ったイベントに応じて、その時点でデスクトップ画面に表示されているデスクトップ空間画像をキャプチャして空間画像記録部103に記録するように、空間画像取得部102に指示する。連想データ作成部115はイベント生成部113から受け取ったイベントに応じて、内部使用データ処理部105および外部入力データ処理部109にファイル名、データ・パスおよびタグデータを送るように指示する。連想データ作成部115はイベント生成部113から受け取ったイベントに応じて、画像タグ生成部104にデスクトップ空間画像のファイル名およびデータ・パスならびに当該デスクトップ空間画像に対応する画像タグデータを送るように指示する。
【0046】
連想データ作成部115は内部使用データ処理部105および外部入力データ処理部109から同一のタグデータ項目に対して新しいタグデータが送られてきたときにはそれまで受けっていたタグデータを更新する。たとえば、図2に示したWebブラウザが閲覧していたファイルの名称に関するタグデータは、時刻t0から時刻t1までの間に連想データ作成部115によりa.html、b.html、c.htmlと更新される。連想データ作成部115は、たとえば時刻t1でイベント生成部113から受け取ったイベントに応じて、キャプチャされたデスクトップ空間画像に対するタグデータおよび画像タグデータを確定し、XML(Extensible Markup Language)でそれらを関連付けて当該デスクトップ空間画像のメタデータを作成する。連想データ作成部115は作成したメタデータを連想データ記録部117に記録する。
【0047】
検索画面処理部119は、ターゲット・ファイルが含まれているデスクトップ空間画像を一次検索するために、ユーザがキーワードを入力する検索画面をLCD17に表示する。検索画面処理部119は、ターゲット・ファイルが含まれているデスクトップ空間画像をユーザが実際に確認して探すためのイメージ検索画像をLCD17に表示する。イメージ検索画像はターゲット・ファイルを取得するためのファイル選択画像を含む。ファイル選択画像は、デスクトップ空間画像とそれに関連するメタデータで構成する。検索画面処理部119は、空間画像記録部103に記録された複数のデスクトップ空間画像と画像タグデータを組にして、各組を縮小したサムネイル形式で表示したり、スクロール形式で表示したり、あるいは画面送り形式で表示したりすることができる。検索実行部121は、検索画面処理部119から受け取った検索のキーワードに合致するメタデータを連想データ記録部117から取得して検索画面処理部119に戻す。連想データ記録部117は、XMLで作成したメタデータを保存する。
【0048】
[画像タグデータの生成手順]
図4は、画像タグ生成部104が画像タグデータを生成する手順を示すフローチャートである。図5は、デスクトップ画面に候補文字とマークが表示されている様子を示す図である。ブロック201では、USBポート25にプロジェクタを接続してユーザがプレゼンテーションをしているものとする。コンピュータ10のLCD17には、図5に示すデスクトップ画面150にアプリケーション・ウインドウ151、153が表示されている。アプリケーション・ウインドウ151は、プレゼンテーション支援ソフトウエアにより作成されたものとする。アプリケーション・ウインドウ151、153には、文章が表示されている。
【0049】
図5(A)には、アプリケーション・ウインドウ151が含む文章の中から抽出された複数の候補文字155が矩形で示されている。また、候補文字の位置は、アプリケーション・ウインドウ151において表示されていた位置を示している。ブロック203では、ユーザがプレゼンテーションの進行に伴って強調して説明したいデスクトップ画面150上の場所、または参加者から受けた質問に対する回答に関連する場所などにアノテーション作成部101を通じてマーク157を書き込む。マーク157は、通常は特定の文字の上に書き込まれるがこれに限定されるものではなく、文字とは重ならない場所に書き込まれたものでもよい。
【0050】
ブロック205では、連想データ作成部115からの指示に基づいて空間画像取得部102が、現在デスクトップ画面150に表示されているすべての情報であるデスクトップ空間画像をキャプチャしてイメージ・データとして空間画像記録部115に記録し、デスクトップ空間画像のファイル名およびデータ・パスを連想データ作成部115と画像タグ生成部104に送る。空間画像取得部102は、キャプチャするときにデスクトップ画面に表示されているすべての文字の中から候補文字を選択しその座標を計算する。空間画像取得部102は、ベクター形式のデータで構成されたマーク157の情報と、複数の候補文字155と各候補文字155の座標を空間画像記録部115に記録する。空間画像取得部102は、デスクトップ空間画像、マーク157の情報、複数の候補文字155およびその座標を空間画像記録部103に記録するとその旨を画像タグ生成部104に通知する。
【0051】
通知を受け取った画像タグ生成部104は、ブロック207でベクター形式のマーク157をラスター形式のイメージに展開してマーク157の座標を計算する。マーク157が複数ある場合は、それぞれについて座標を計算する。ここで、ユーザの意図しない小さな模様がデスクトップ画面150に書き込まれたような場合は、画像タグ生成部104はそれを孤立点として処理しマークとしての処理対象から除外する。ブロック209では画像タグ生成部104が、マーク157の座標と各候補文字の座標から両者の距離をそれぞれの候補文字について計算し各候補文字に対する強調データの計算を開始する。
【0052】
各候補文字の重みは、マーク157の座標を中心とし半径が等間隔で異なる複数の同心円を設定し、各同心円上に同じ重みを示す数値を割り当て、かつ外側に向かうに従って同心円に割り当てた数値が小さくなるようにして候補文字の座標に一致したまたは近い同心円の数値を当該候補文字の重みとして計算することができる。本実施の形態では、重みの計算を簡単に行うために、画像タグ生成部104はランキング・マトリクスを使用して重みを示す強調データを計算する。
【0053】
図6は、候補文字の重みを計算するためのランキング・マトリクスのデータ構造を説明する図である。ランキング・マトリクスでは、複数の正方形の要素がマトリクス状に配列され、各要素には中心の要素からの距離に応じた重みを示す数値が設定される。ランキング・マトリクスにはある特定の1つの要素を中心要素として設定したときに、中心要素を取り囲む第一番目の外側要素の集合、第一番目の外側要素の集合を取り囲む第二番目の外側要素の集合、第二番目の外側要素の集合を取り囲む第三番目の外側要素の集合を定義することができる。そして、中心要素に最も高い数値を設定し、第一番目、第二番目、第三番目と配列された外側要素の集合に順番に小さな数値を設定する。
【0054】
図6には、一例として中心要素に9を設定し、順次外側要素の集合に6、3、1と設定した7×7のランキング・マトリクス171を示している。ランキング・マトリクス171は、平面的なサイズも所定の値に決められている。画像タグ生成部104は、ランキング・マトリクス171の中心要素をマーク157の座標に設定して、各候補文字の座標と重なった要素に設定された数値を当該候補文字の強調データとして計算する。ランキング・マトリクス171の平面的なサイズは対象とする候補文字のフォント・サイズに基づいて決定し、要素の数および数値は適宜設定することができる。
【0055】
画像タグ生成部104は、ランキング・マトリクス171の平面的なサイズの中に入った候補文字には9、6、3、1のいずれかの数値を付与することで強調データを計算する。なお、ランキング・マトリクス171の平面的なサイズから外れて外側に表示されていた候補文字の強調データはゼロになる。また、アプリケーション・ウインドウ151に書き込まれたマーク157に基づいて、アプリケーション・ウインドウ153に表示された候補文字の重みも計算することができる。
【0056】
ここで、ランキング・マトリクス171の平面的なサイズを一定にしておき、異なるフォント・サイズの候補文字に同一サイズのランキング・マトリクス171を適用すると、マーク157の表示位置から候補文字の表示位置までの距離とその重要さの関係が対応しなくなる。たとえば、図5(A)のアプリケーション・ウインドウ151と図5(B)のアプリケーション・ウインドウ151aは同じ情報を表示しかつマーク157、157aは同じ候補文字の上に書き込まれているが、アプリケーション・ウインドウ151aに表示されている文字のフォント・サイズはアプリケーション・ウインドウ151に表示されている文字のフォント・サイズよりも小さい。
【0057】
アプリケーション・ウインドウ151を含むデスクトップ空間画像とアプリケーション・ウインドウ151aを含むデスクトップ空間画像に対して、それぞれ同一サイズのランキング・マトリクス171を適用すると、アプリケーション・ウインドウ157aに小さなフォント・サイズで表示された各候補文字にはアプリケーション・ウインドウ157に大きなフォント・サイズで表示された各候補文字よりも大きな重みが与えられることになり、フォント・サイズの異なる候補文字を含むデスクトップ空間画像の間では重みが候補文字の重要度を反映しない情報になってしまう。
【0058】
この問題を解消するために、ブロック211で画像タグ生成部104は、ランキング・マトリクス171に対して候補文字の座標を適用する際に、マーク157の近辺に表示されている候補文字のフォント・サイズでマーク157から各候補文字までの距離を正規化する。具体的には最初に、基準となるフォント・サイズの候補文字とそれに適用する所定の平面的なサイズを備えるランキング・マトリクスを設定する。そしてマーク157の近辺に存在する候補文字のフォント・サイズが基準となる候補文字のフォント・サイズと異なる場合は両者の比を計算し、マーク157から候補文字までのデスクトップ画面上の距離をその比で修正する。この場合、マーク157の近辺にある文字のフォント・サイズが基準となる候補文字のフォント・サイズよりも小さい場合は、ランキング・マトリクスを適用する各候補文字までの距離はデスクトップ画面上の座標から計算した距離よりも短くなる。
【0059】
あるいは、画像タグ生成部104は、マーク157の近辺にある候補文字のフォント・サイズでランキング・マトリクス171の平面的なサイズを正規化してもよい。具体的には、前述のように計算した候補文字の比でランキング・マトリクス171の平面的なサイズを修正する。この場合、マーク157の近辺にある文字のフォント・サイズが基準となる候補文字のフォント・サイズよりも小さい場合は、基準となるフォント・サイズの候補文字に適用するランキング・マトリクスよりも平面的なサイズが小さいラインキング・マトリクスを適用することになる。いずれかの方法で重みを正規化することで、異なるフォント・サイズの候補文字の間でも各候補文字の重みを相対的に比較することができるようになる。なお、マーク157の近辺にある候補文字に代えて、マーク157の近辺に表示されている候補文字を含んだ複数の文字のフォント・サイズの平均値を利用して正規化してもよい。そのような平均値は、画像タグ生成部104が空間画像取得部102から取得できるように空間画像取得部102を構成することができる。
【0060】
同一のデスクトップ空間画像を表示するデスクトップ画面に、複数のマーク157が書き込まれることがある。そしてマーク間の間隔が短い場合は、ランキング・マトリクス171が重なる場合もある。2つ以上のランキング・マトリクスが重なった場合は、重なった部分の要素の数値を平均した値をまたは重なった部分の要素の大きい方の数値をその要素の強調データとする。図6では、ランキング・マトリクス173と175が一部で重なっており、重なった部分の要素にはそれぞれのランキング・マトリクスの数値を平均した数値が強調データとして設定されている様子が示されている。また、ランキング・マトリクス177と179が一部で重なっており、重なった部分の要素にはそれぞれのラインキング・マトリクスのうち大きな方の数値が強調データとして設定されている様子が示されている。画像タグ生成部104は、同一のデスクトップ空間画像に、ランキング・マトリクス171が重ならない複数のマークが書き込まれている場合は、各候補文字についてそれぞれのマークに設定したランキング・マトリクスによる強調データを計算し最大の数値を選択する。
【0061】
ブロック211で各候補文字に対する強調データの計算が終了すると、画像タグ生成部104はブロック213で画像タグデータを生成する。画像タグデータは、1以上の重みが与えられた候補文字と強調データで構成される。画像タグ生成部104は、空間画像取得部102が取得した複数の候補文字のなかで、強調データがゼロの候補文字を画像データから排除する。画像タグデータは通常は複数の候補文字を含むが、単一の候補文字で構成される場合もある。画像タグデータを生成した画像タグ生成部104は、関連するデスクトップ空間画像のファイル名とデータ・パスとともに画像タグデータを連想データ作成部115に送る。
【0062】
[メタデータのデータ構造]
コンピュータ10が図2に示したように動作しているときに連想データ作成部115が作成したメタデータを説明する。時刻t1、t2、t3、t4でそれぞれキャプチャされたファイル名がイメージ#001、イメージ#002、イメージ#003、イメージ#004のデスクトップ空間画像の実データまたはボディ部分が空間画像記録部103に記録され、そのファイル名とHDD15内での記録場所に対するデータ・パスがメタデータの一部として連想データ記録部117に記録される。また、画像タグデータ生成部104により生成されたそれぞれのデスクトップ空間画像に関連する画像タグデータがメタデータの一部として連想データ記録部117に記録される。
【0063】
さらにまた、イメージ#001、イメージ#002、イメージ#003、イメージ#004に対して時刻t0〜t1、時刻t1〜時刻t2、時刻t2〜時刻t3、時刻t3〜時刻t4の間にコンピュータ10の動作環境として存在していたタグデータがそれぞれのデスクトップ空間画像に関連するメタデータとして連想データ記録部117に記録される。各タグデータで示された実データは内部使用データ記録部107または外部入力データ記録部111に記録される。
【0064】
図7は、図2の時刻t1で連想データ作成部115が作成したメタデータのデータ構造の一例を示す図である。メタデータ180は、時刻t1で発生したイベントに基づいて作成された複数のタグデータおよび複数の画像タグデータが、ファイル名がイメージ#001のデスクトップ空間画像に関連付けられている。メタデータ180は画像タグ生成部104、内部使用データ処理部105および外部入力データ処理部109からあらかじめ受け取るように定めておいたタグデータ項目に基づいて形式が作成されている。タグデータ項目には、アノテーション、ソフトウエア名、ファイル名、ページ、URL、開始・終了時刻などが含まれる。メタデータ180は各タグデータをツリー状に関連付けて構成することができる。たとえば、プレゼンテーション支援ソフトウエアが複数のファイルを処理したときに、ページはそれぞれのファイルの下層に位置するタグデータとして構成することができる。
【0065】
アノテーションには、画像タグ生成部104が生成した6個の文字を含む画像タグデータが含まれている。ここでは、「タブレット」、「解像度」、「無線LAN」、「アプリケーション」、「価格」、「販売日」という文字と[a(×)b(×)c(×)]の形式で作成された強調データでそれぞれ構成された画像タグデータがメタデータ180の一部を構成している。強調データ[a(×)]、「b(×)」、[c(×)]は、それぞれ当該文字のフォント・サイズ、色、および装飾方法に対応している。たとえば、強調データ[a(1)]は、当該文字を最も大きなフォント・サイズで表示することを示し、[a(4)]は当該文字を最も小さなフォント・サイズで表示することを示している。
【0066】
文書作成支援ソフトウエアは時刻t0と時刻t1の間で作成、編集または表示がされていないのでタグデータは記録されていない。プレゼンテーション支援ソフトウエアに関するタグデータは時刻t1で表示されていたbbb.xy2のファイル名とその時刻に表示されていた10ページのページ数が記録されている。Webブラウザに関するタグデータは、時刻t0と時刻t1との間で閲覧が更新されたa.html、b.html、c.htmlのファイルの中で、時刻t1で閲覧されていたc.htmlのファイル名が記録されている。
【0067】
動画再生ソフトウエアに関するタグデータとしては、時刻t0と時刻t1の間で再生されていたccc.xy3のファイル名、開始時刻00:bb:ccおよび終了時刻00:dd:eeが記録されている。カメラ処理ソフトウエアは、時刻t0と時刻t1の間で撮影および再生をしていないのでタグデータは記録されていない。マイクロフォン処理プログラムに関するタグデータとしては、時刻t0と時刻t1の間で録音されたeee.xy5のファイル名、録音開始時刻aa:bb:ccおよび時刻t2と時刻t3との間の録音終了時刻cc:dd:eeが記録されている。
【0068】
録音終了時刻は時刻t1の時点では確定しないので、連想データ作成部115は、時刻t3の時点でメタデータを作成する際に、外部入力データ処理部109または外部入力データ記録部111から録音終了時刻を取得してメタデータ150に記録する。IPアドレス取得ソフトウエアに関するタグデータとしては、時刻t0と時刻t1の間で無線モジュール23が接続されていたアクセス・ポイントのa.b.c.dというIPアドレスとその開始時刻00:aa:ccおよび終了時刻00:ee:ffが記録されている。内部使用データ記録部107および外部入力データ記録部111には、タグデータにリンクした実データが記録されており、LCD17に表示されたタグデータを入力デバイス29で選択すると実データをメイン・メモリ13にロードすることができる。
【0069】
[連想データの蓄積手順]
つぎにユーザが過去に処理したことがあるとかすかに記憶しているターゲット・ファイルを、デスクトップ空間画像およびメタデータで再現することにより検索を行う手順を説明する。図8は、連想データを蓄積する手順を示すフローチャートで、図9は連想データを利用してターゲット・ファイルを検索する手順を示すフローチャートである。ここに連想データは、イベントごとに作成されたデスクトップ空間画像とそれに関連するメタデータとで構成される。ブロック301でコンピュータ10が動作を開始すると、ユーザは図3に示した検索システム100を実行する。
【0070】
ブロック303でユーザは検索画面処理部119がLCD17に表示する検索画面を通じて、図7で説明したソフトウエア名、ファイル名、ページ、URL、時刻情報、およびIPアドレスのようなタグデータ項目を決定して空間画像取得部102および連想データ作成部115に設定する。なお、一旦登録したタグデータ項目は、次回の起動のときは自動的に同じ内容で設定するようにしてもよい。
【0071】
ブロック305では、ユーザはさらにデスクトップ空間画像をキャプチャしてメタデータとしてのタグデータおよび画像タグデータを作成するタイミングを取得するためのイベント項目を検索画面を通じて選定し、イベント生成部113に設定する。ここでは、プレゼンテーション支援ソフトウエアを利用しているユーザが、資料のページを操作するときのタイミングをイベント項目として設定するものとする。イベント項目は1つまたは複数選択することができる。その後ユーザは連想データの収集作業を意識することなく通常通りコンピュータ10を使用する。
【0072】
ブロック307では、コンピュータ10は図7の検索システム100に対して連想データ収集作業を開始する指示が行われるまで待機する。連想データ収集作業は、ユーザがキーボード29の特定のキーを押下したり、特定のプログラムが動作を開始したり、あるいは、コンピュータ10が特定の外部デバイスの装着を認識したときに開始することができる。ここでは、プレゼンテーション支援ソフトウエアが起動したときに連想データの収集作業を開始するものとする。このようにして図2の時刻t0では、連想データ収集作業が開始される。ユーザは、プレゼンテーションの間、アノテーション作成部101を通じてデスクトップ画面にマーク157を書き込む。
【0073】
ブロック309では、連想データ収集作業が開始されたことに基づいて連想データ作成部115はイン・メモリ13上にXMLのデータ形式で図7に示した構造のメタデータのフォーマットを作成する。そして、ブロック303で設定されたタグデータ項目について、内部使用データ処理部105から内部使用データに関するタグデータを取得し、外部入力データ処理部109から外部入力データに関するタグデータを取得してメイン・メモリ13に記憶する。連想データ作成部115は、同一のタグデータ項目に対して新しいタグデータを受け取ったときはタグデータを更新し、その処理を時刻t0から時刻t1まで継続する。文書作成支援ソフトウエアおよびカメラ処理ソフトウエアは時刻t1までの間は実行されないので、それらに関するタグデータ項目は空のままである。連想データ作成部115は、プレゼンテーション支援ソフトウエアのページが操作されるたびに操作された後のページを対応するタグデータ項目に記録する。新たなページが操作されたときには、古いページを上書きして更新する。
【0074】
連想データ作成部115は、Webブラウザが閲覧するURLが変更されるたびに、そのファイル名を更新しながら対応するタグデータ項目に記憶する。連想データ作成部115は、動画再生ソフトウエアが実行したccc.xy3のファイル名、開始時刻および終了時刻を対応するタグデータ項目に記憶する。連想データ作成部115は、マイクロフォン処理ソフトウエアのソフトウエア名(eee.xy5)と録音開始時刻を記憶する。なお、マイクロフォン処理ソフトウエアは、イベントが発生するたびにeee.xy5のファイルに時間タグを付加して、後に検索して実行されるときにイベントが発生する時刻を再生開始時刻または再生終了時刻に設定できるようにする。連想データ作成部115は、IPアドレス取得ソフトウエアが取得したIPアドレスと接続開始時刻および接続終了時刻を記憶する。
【0075】
ブロック311では、プレゼンテーション支援ソフトウエアのページが操作されたことにより時刻t1でイベント生成部113がイベントを生成する。ブロック313では、連想データ作成部115はイベントの生成に応じて空間画像取得部102に、その時点でLCD17に表示されているデスクトップ空間画像をキャプチャして空間画像記録部103に記録するように指示する。連想データ作成部115は同時に空間画像取得部102からキャプチャされたデスクトップ空間画像のファイル名(イメージ#001)とそのデータ・パスを取得し、メタデータの一部として連想データ記録部117に記録する。
【0076】
また、空間画像取得部102は、キャプチャされるデスクトップ空間画像に表示されるすべての文字の中から候補文字を選択し、その座標とともに空間画像記録部103に記録する。さらに空間画像取得部102は、キャプチャされるデスクトップ空間画像に書き込まれたマーク157をベクター形式のデータとしてアノテーション作成部101から取得して空間画像記録部103に記録する。ブロック315では画像タグデータ生成部104が空間画像記録部103に記録された候補文字の座標およびマーク157の座標に基づいてランキング・マトリクス171、173、175を利用して画像タグデータを生成し、連想データ作成部115に送る。
【0077】
連想データ作成部115は、受け取った画像タグデータをイメージ#001のデスクトップ空間画像に関連するメタデータの一部として連想データ記録部117に記録する。ブロック317では連想データ作成部115が、内部使用データ処理部105および外部入力データ処理部109から受け取ったタグデータをイメージ#001のデスクトップ空間画像に関連するメタデータの一部として連想データ記録部117に記録する。その結果、イメージ#001のデスクトップ空間画像に関連するメタデータが確定する。
【0078】
ブロック319では連想データ作成部115が連想データ収集作業を終了したか否かを検索画面処理部119が判断する。連想データ収集作業の終了の判断は、ブロック307の開始の判断に対応させて同一のソフトウエアの状態の変化により行うことができる。時刻t4まではブロック319からブロック309に戻って同様の手順でメタデータが連想データ記録部117に記録される。ブロック319で時刻t4に到達したときにプレゼンテーション支援ソフトウエアが終了するとブロック321で連想データ収集作業終了が終了する。ブロック303とブロック305でタグデータ項目とイベント項目を初期設定しておけば、以後ユーザは何ら意識しないでもブロック307からブロック321までの手順が自動的に実行され、ユーザが通常の作業を行っている間にイベントの生成のタイミングで連想データが連想データ記録部117に蓄積されていく。
【0079】
[ターゲット・ファイルの検索手順]
つぎに、蓄積された連想データを利用して曖昧に記憶しているターゲット・ファイルを検索する手順を、図9を参照して説明する。ユーザは過去にターゲット・ファイルを作成したり、利用したりしたことを漠然と覚えているが、それをHDD15から検索するために必要なファイル名または利用の日時を思い出せない場合がある。たとえば、ユーザはある話し手が過去に話していた特定の内容を録音したことだけをかすかに記憶しており、それをターゲット・ファイルとして検索したいとする。ユーザは録音したときのデスクトップ空間画像は記憶している可能性が高いので、本実施の形態ではターゲット・ファイルに対する既視感を、デスクトップ空間画像とメタデータからなる視覚を通じて認識できる連想データを通じて具現化しターゲット・ファイルの検索範囲を絞り込んでいく。
【0080】
ブロック401でコンピュータ10が動作を開始したとき、連想データ記録部117には、図7に示したようなメタデータが複数記録されているものとする。ユーザはブロック403で、検索画面処理部119がLCD17に提供する検索画面を通じて空間画像記録部103に記録されたデスクトップ空間画像を検索する。ユーザは、ターゲット・ファイルに関連するデスクトップ空間画像を検索するために、検索画面にターゲット・ファイルが作成されたときに表示されていたと思われるデスクトップ空間画像を検索するためのキーワードを入力する。ここでは、「解像度」、「無線LAN」、「タブレット」、および「価格」の4つのキーワードをOR条件で入力するものとする。検索画面処理部119は入力されたキーワードと論理式からなる検索条件を検索実行部121に指示する。
【0081】
検索実行部121は検索条件に該当する画像タグデータとその画像タグデータを含むデスクトップ空間画像のファイル名を連想データ記録部117から検索して検索画面処理部119に送る。ブロック405で検索画面処理部119は、受け取ったファイル名に対応するデスクトップ空間画像を空間画像記録部103から取得し、検索実行部117を通じて画像タグデータを連想データ記録部117から取得してLCD17に表示する。図10は、検索されたデスクトップ空間画像と画像タグデータの組(以下、イメージ検索画像という。)500の一例を示す。イメージ検索画像500は、検索条件に合致した5つの要素画像501a〜501eで構成されている。各要素画像501a〜501eは、それぞれデスクトップ空間画像503a〜503eとタグクラウド505a〜505eで構成されている。タグクラウドは、各要素画像501a〜501eにおいて検索のキーワードに合致した画像タグデータで構成される。
【0082】
検索画面処理部119は、検索条件に合致した文字を強調データで強調表示してタグクラウド505a〜505eを表示する。タグクラウドは、強調データに基づいて強調表示された複数の候補文字の集合である。ここで、要素画像501aは、時刻t1で作成されたファイル名がイメージ#001のデスクトップ空間画像のメタデータ180(図7参照)を含むものとする。メタデータ180は、検索条件に合致する4つのキーワードに該当する画像タグデータの候補文字を含んでおり、タグクラウド505aとして表示されている。ここでは、強調データとしてフォント・サイズだけを適用している。メタデータ180では、フォント・サイズに関する強調データが「解像度」、「無線LAN」、「タブレット」、および「価格」に対して、それぞれ1、2、4、4になっており、タグクラウド505aは強調データに応じた大きさで表示される。
【0083】
他の要素画像では、各候補文字に対応する強調データに応じてタグクラウドが表示される。また、検索画面処理部119は、最初に入力したキーワードに対応する画像タグデータの文字の強調データの大きさの順番に従って、要素画像501a〜501eの表示の順番を決定する。表示の順番は、サムネイル表示形式の場合は配列の順番としたり、スクロール表示形式の場合は上位から下位に向かう順番としたり、画面送り表示の場合は表示の順番としたりすることができる。要素画像の表示の順番は、検索された候補文字の強調データの合計で決定してもよい。コンピュータ10をプレゼンテーションに使用するような場合は、デスクトップ空間画像の広い面積に文字が表示されて相互に似通ってしまうことが多いので、候補文字がタグクラウドとして表示されていない場合は、ユーザは要素画像501a〜501eを同じ重要度でみていくことになり、音声ファイルに関連するデスクトップ空間画像を思い出すのが困難な場合がある。
【0084】
しかし、イメージ検索画像500は、複数の要素画像をターゲット・ファイルに関連の強い順番で配置しており、さらにタグクラウドを参照することで、ユーザは似通った複数のデスクトップ空間画像の中から、ターゲット・ファイルが関連付けられたデスクトップ空間画像を思い出し易くなる。また、タグクラウドの候補文字は、ユーザが入力したものではなく、デスクトップ空間画像に表示されていたものを抽出しているので、誤って入力されたタグデータの文字でデスクトップ空間画像が表示されるようなこともなくなる。さらに、強調表示された候補文字は、ユーザがそのプレゼンテーションにおいて最も印象に残る文字である可能性が高く、ユーザはターゲット・ファイルが関連付けられたデスクトップ空間画像を一層思い出しやすくなる。
【0085】
ブロック407では、イメージ検索画像500をみたユーザが要素画像501aを選択するものとする。ただし、イメージ検索画像500の先頭に表示された要素画像501aがターゲット・ファイルに関連するということが常に保証されているものではなく、最終的にはユーザがタグクラウドおよびデスクトップ空間画像に対して抱く既視感に基づいて要素画像を選択する。検索システム100は、ユーザのターゲット・ファイルに対するなんとなく録音の記憶があるという既視感を、現実に録音したときに表示されていたデスクトップ空間画像を通じて鮮明にして、ターゲット・ファイルの検索を支援することができる。ユーザが要素画像501aを選択すると、検索画面処理部119は連想データ記録部117から対応するメタデータを取得してLCD17にファイル選択画像を表示する。
【0086】
ブロック409では選択された特定のデスクトップ空間画像とそれに対応するメタデータからなる連想データが、検索画面処理部119によりファイル選択画像としてLCD17に表示される。図11にファイル選択画像の一例を示す。検索画面処理部119によりLCD17に表示されたファイル選択画像600の中には、イメージ#001のデスクトップ空間画像601と動画再生ソフトウエアとファイル名ccc.xy3のファイルを明示するアイコン603、IPアドレス取得ソフトウエアとIPアドレスa.b.c.dを明示するアイコン605、および心拍数計測ソフトウエアと心拍数nnnを明示するアイコン607が表示されている。アイコン603、605、607は、イメージ#001のデスクトップ空間画像が生成された時刻t1の瞬間にはLCD17の画面に存在しないタグデータを表示するために作成されたものである。
【0087】
その他のタグデータは時刻t1において、プレゼンテーション支援ソフトウエアが作成したアプリケーション・ウインドウ609、Webブラウザが作成したアプリケーション・ウインドウ611、およびマイクロフォン処理ソフトウエアが作成したアプリケーション・ウインドウ613がLCD17に表示される。アプリケーション・ウインドウ609には、メタデータ180に含まれる画像タグデータの文字と、マーク615も表示されている。ブロック411でユーザはファイル選択画像600に含まれたアプリケーション・ウインドウやアイコンからターゲット・ファイルと想定したアプリケーション・ウインドウ613を選択する。ターゲット・ファイルは、メタデータに関連するアイコンまたはアプリケーション・ウインドウの中から選択することになる。
【0088】
アプリケーション・ウインドウ613はHDD15の外部入力データ処理部111に保存された開始時刻aa:bb:ccから終了時刻cc:dd:eeまでの音声ファイルeee.xy5にリンクしており、入力デバイス29で選択するとブロック413で時刻aa:bb:ccから時刻t0まで録音された音声が再生される。もし時刻t2のデスクトップ空間画像(イメージ#002)とアプリケーション・ウインドウ613が選択されたときは時刻t1から時刻t2まで録音された音声が再生され、時刻t3のデスクトップ空間画像(イメージ#003)とアプリケーション・ウインドウ613が選択されたときは、時刻t2から時刻cc:dd:eeまで録音された音声が再生される。本実施の形態における検索は、ユーザがターゲット・ファイルの名称や作成日時を記憶していない場合に行われるため、ターゲット・ファイルを認識するためにはユーザは実際に当該ファイルを実行して内容を確認する必要がある。
【0089】
ブロック415でユーザは、その音声を聞いてファイル名がeee.xy5のファイルがターゲット・ファイルであるか否かを判断し、ターゲット・ファイルであると判断した場合はブロック413で検索を終了する。ターゲット・ファイルでないと判断した検索条件を変更する必要がある場合は、ブロック403に移行してユーザは他のキーワードを入力する。検索条件を変更する必要がないと判断したときは、ブロック407に移行して、ユーザは他の要素画像をみて選択し同様の手順を繰り返す。
【0090】
[マークが書き込まれない場合の画像タグデータの生成方法]
図4では、デスクトップ画面に書き込まれたマーク157に基づいて画像タグデータを生成した。しかし、空間画像記録部103にはマークを含まないデスクトップ空間画像が記録される場合もある。マークを含まないデスクトップ空間画像にも、ターゲット・ファイルは存在するので、そのようなデスクトップ空間画像に対しても画像タグデータを生成して要素画像が検索結果から脱落しないようにする必要がある。しかも、この場合の画像タグデータもユーザの既視感を再現できるデスクトップ空間画像が検索できるように生成する必要がある。図12は、デスクトップ画面にマークが書き込まれない場合に画像タグデータを作成する手順を示すフローチャートである。
【0091】
ブロック701では、空間画像記録部103にデスクトップ空間画像と候補文字およびその座標が記録されている。ブロック703では、ブロック701で空間画像記録部103にもしマークの情報も一緒に記録されている場合は、画像タグ生成部104はブロック705において図4の手順に基づいて画像タグデータを生成する。ここで、LCD17の上部には内蔵カメラ19が装着されており、コンピュータ10はユーザの顔を撮影できるものとする。そして、内蔵カメラ19はユーザを撮影している間に、周知のプログラムで画面に対するユーザの視点の座標を計算することができ、イベントが発生してデスクトップ空間画像をキャプチャするときには空間画像取得部102はその座標を空間画像記録部103に記録できるものとする。
【0092】
画像タグ生成部104がブロック703でマークの情報は記録されていないと判断した場合は、ブロック707でユーザのデスクトップ画面に対する視点の座標が空間画像記録部103に記録されているかどうかを判断する。視点の座標が記録されている場合は、ブロック709でその視点に最も近い候補文字を画像タグデータとして選択する。ここではユーザがデスクトップ画面をみて作業しているときはその視点にある文字を注視しているため、視点にある文字とデスクトップ空間画像を関連付けて記憶している可能性が高いと想定している。
【0093】
ここで、空間画像取得部102は、現在のデスクトップ画面が変化しない時間である静止時間を計測して、デスクトップ空間画像をキャプチャするときに空間画像記録部103に記録できるものとする。ブロック707で視点の座標が記録されていないと判断したときは、画像タグ生成部104はブロック711で空間画像記録部103に記録された静止時間が一定値以上であるかどうかを判断する。静止時間が一定値以上であると判断したときは、ブロック713で画像タグ生成部104は、デスクトップ画面の中心座標に最も近い候補文字を画像タグデータとして選択する。ここでは、特定のデスクトップ空間画像が長い時間表示されているときは、ユーザはデスクトップ画面の中心に最も重要な情報を表示する傾向があることを想定している。
【0094】
ここで、空間画像取得部102は、デスクトップ空間画像がWebブラウザのように複数のフレームで分割されたアプリケーション・ウインドウを含む場合に、各フレームの面積を計算して最も大きなフレームの中心座標を計算し、デスクトップ空間画像をキャプチャするときに空間画像記録部103に記録できるものとする。ブロック711で一定時間以上静止していないと判断したときは、画像タグ生成部104はブロック715でWebブラウザのアプリケーション・ウインドウが複数のフレームを含み、面積が最大のフレームの中心座標が空間画像記録部103に記録されているかどうかを判断する。最大フレームの中心座標が記録されている場合は、ブロック717で画像タグ生成部104は、最大フレームの中心座標に最も近い候補文字を画像タグデータとして選択する。ここでは、最も面積の大きなフレームに重要な情報が表示されている可能性が高いと想定している。
【0095】
ここで、空間画像取得部102は、デスクトップ空間画像に表示された文字のフォント・サイズを計算し、最もフォント・サイズの大きな候補文字を指定して、デスクトップ空間画像をキャプチャするときに空間画像記録部103に記録できるものとする。ブロック715で最大フレームの中心座標が記録されていないと判断したときは、画像タグ生成部104はブロック719で最大フォント・サイズの文字が空間画像記録部103に記録されているか否かを判断する。最大フォント・サイズの文字が記録されている場合は、ブロック721で画像タグ生成部104は最大フォント・サイズの候補文字を画像タグデータとして選択する。大多数の文字のフォント・サイズよりも大きくてかつ同一のフォント・サイズの文字が複数ある場合は、最大フォント・サイズの文字としてそれらの複数の文字を選択することができる。ここでは、デスクトップ空間画像に表示されている文字の中で、最大のフォント・サイズの文字は当該デスクトップ空間画像に対する既視感に重要な役割を果たす可能性が高いと想定している。
【0096】
ここで、空間画像取得部102は、デスクトップ空間画像の上を移動するマウス・カーソルの特定の軌跡の座標を計算して、その中心座標をデスクトップ空間画像をキャプチャするときに空間画像記録部103に記録できるものとする。マウス・カーソルの特定の軌跡とは、幾何学的重心を座標として計算できる閉曲線を描く軌跡をいう。ブロック719で最大フォント・サイズの文字が記録されていないと判断したときは、画像タグ生成部104はブロック723でマウス・カーソルの座標が空間画像記録部103に記録されているか否かを判断する。マウス・カーソルの座標が記録されている場合は、ブロック725で画像タグ生成部104はマウス・カーソルの座標に最も近い候補文字を画像タグデータとして選択する。ここでは、ユーザは画面上でマウス・カーソルを、閉曲線を描くように移動させて、会議の参加者の注目を特定の文字に向けることがあることを想定している。
【0097】
ここで、空間画像取得部102は、デスクトップ画面に表示されている文字の色を識別して、他の所定数以上の文字と色が異なる候補文字を指定し、デスクトップ空間画像をキャプチャするときに空間画像記録部103に記録できるものとする。ブロック723でマウス・カーソルの座標が記録されていないと判断したときは、画像タグ生成部104はブロック729で異なる色の候補文字が空間画像記録部103に記録されているか否かを判断する。所定数以上の文字の色と異なる色の候補文字が記録されている場合は、画像タグ生成部104はブロック729で異なる色の候補文字を画像タグデータとして選択する。異なる色の候補文字が複数ある場合はそれらの複数の候補文字を選択する。ここでは文章の中で他の文字と異なる色で着色された文字は重要な意味を有していると想定している。
【0098】
ブロック727で異なる色の候補文字が記録されていないと判断したときは、画像タグ生成部104はブロック731で、今回キャプチャしたデスクトップ空間画像の1つ前にキャプチャしたデスクトップ空間画像について生成した画像タグデータを当該デスクトップ空間画像にも適用する。ここでは同一のファイルを使ってプレゼンテーションをするような場合は、一定の時間帯では重要なテーマが変化しないため、前回の画像タグデータが有効な場合があることを想定している。ブロック703からブロック731までの手順により、すべてのデスクトップ空間画像に対して画像タグデータを生成することができる。なお、ブロック709、713、717、721、725、729で生成した画像タグデータの強調データは、ランキング・マトリクス171の最も小さい数値、またはその他の数値としてあらかじめ定めておくものとする。また、ブロック707、711、715、719、723、727の順番は、図12に示した順番に限定する必要はなく他の順番で判断することもできる。
【0099】
これまで本発明について図面に示した特定の実施の形態をもって説明してきたが、本発明は図面に示した実施の形態に限定されるものではなく、本発明の効果を奏する限り、これまで知られたいかなる構成であっても採用することができることはいうまでもないことである。
【符号の説明】
【0100】
10…コンピュータ
100…検索システム
150…デスクトップ画面
151、153…アプリケーション・ウインドウ
157、157a、615…マーク
155、155a…候補文字
171、173、175…ランキング・マトリクス
180…メタデータ
500…イメージ検索画像
501a、501b、501c、501d、501e…要素画像
503a、503b、503c、503d、503e、601…デスクトップ空間画像
505a、505b、505c、505d、505e…タグクラウド
600…ファイル選択画像
603…動画再生ソフトウエアのアイコン
605…IPアドレス取得ソフトウエアのアイコン
607…心拍数を明示するアイコン
609…プレゼンテーション支援ソフトウエアが作成したアプリケーション・ウインドウ
611…Webブラウザが作成したアプリケーション・ウインドウ
613…マイクロフォン処理ソフトウエアが作成したアプリケーション・ウインドウ
【特許請求の範囲】
【請求項1】
デスクトップ画面に複数の文字を含むデスクトップ空間画像を表示するディスプレイと、
前記デスクトップ画面に第1のアノテーションを書き込む入力部と、
前記第1のアノテーションの位置と前記デスクトップ空間画像に含まれる各文字の位置とに基づいて文字を重み付けするための強調データを各文字について生成する強調データ生成部と、
前記強調データが生成された複数の文字を含む画像タグデータを生成するタグ生成部と、
前記デスクトップ空間画像に関連付けられた前記画像タグデータを保存するデータ保存部と
を有する情報処理装置。
【請求項2】
前記デスクトップ空間画像に含まれる各文字の座標と前記第1のアノテーションの座標を計算する座標計算部と、
中心の要素に最大の数値を設定し外側に配列された要素に順番に小さな数値を設定したランキング・マトリクスとを有し、
前記強調データ生成部が、前記第1のアノテーションの座標に前記ランキング・マトリクスの前記中心の要素を設定して前記強調データを生成する請求項1に記載の情報処理装置。
【請求項3】
前記タグ生成部が、所定値以上の重みを有する文字だけを前記画像タグデータとして選択する請求項1または請求項2に記載の情報処理装置。
【請求項4】
前記デスクトップ画面に前記入力部を通じて第2のアノテーションが書き込まれ、
前記座標計算部が前記第2のアノテーションの座標を計算し、
前記強調データ生成部が、前記第1のアノテーションの座標に設定した前記ランキング・マトリクスと前記第2のアノテーションの座標に設定した前記ランキング・マトリクスが重なる領域では前記ランキング・マトリクスの要素の数値を各ランキング・マトリクスの要素に設定された数値の平均値に設定して前記強調データを生成する請求項2または請求項3に記載の情報処理装置。
【請求項5】
前記強調データ生成部が、前記第1のアノテーションの座標に設定した前記ランキング・マトリクスと前記第2のアノテーションの座標に設定した前記ランキング・マトリクスが重ならない領域に存在する文字に対しては、近い位置に座標が存在するアノテーションに設定された前記ランキング・マトリクスで前記強調データを生成する請求項4に記載の情報処理装置。
【請求項6】
前記強調データ生成部が、前記第1のアノテーションの近傍に存在する文字のフォント・サイズで各文字までの距離または前記ランキング・マトリクスの平面的なサイズを正規化する請求項2から請求項5のいずれかに記載の情報処理装置。
【請求項7】
前記強調データ生成部は、前記デスクトップ空間画像に含まれる複数の文字の中から、前記画像タグデータの候補として特定された文字である候補文字についてだけ前記強調データを生成する請求項1から請求項6のいずれかに記載の情報処理装置。
【請求項8】
前記タグ生成部は、前記デスクトップ画面にアノテーションが書き込まれているか否かを判断し、いずれのアノテーションも書き込まれていないと判断したときに前記デスクトップ画面に表示されているいずれかの候補文字を前記画像タグデータとして選択する請求項7に記載の情報処理装置。
【請求項9】
前記タグ生成部は、前記デスクトップ画面に対するユーザの視点の座標に最も近い候補文字を前記画像タグデータとして選択する請求項8に記載の情報処理装置。
【請求項10】
前記タグ生成部は、前記デスクトップ画面が一定時間以上変化しないときに前記デスクトップ画面の中心座標に最も近い候補文字を前記画像タグデータとして選択する請求項8または請求項9に記載の情報処理装置。
【請求項11】
前記タグ生成部は、前記デスクトップ画面に表示されたウインドウが複数のフレームで構成されているときに最大フレームの中心座標に最も近い候補文字を前記画像タグデータとして選択する請求項8から請求項10のいずれかに記載の情報処理装置。
【請求項12】
前記タグ生成部は、前記デスクトップ画面に表示された複数の文字の中で最もフォント・サイズの大きな候補文字を前記画像タグデータとして選択する請求項8から請求項11のいずれかに記載の情報処理装置。
【請求項13】
前記タグ生成部は、マウス・カーソルの座標に最も近い候補文字を前記画像タグデータとして選択する請求項8から請求項12のいずれかに記載の情報処理装置。
【請求項14】
前記タグ生成部は、前記デスクトップ画面に表示された複数の文字の中で所定数以上の文字と色が異なる候補文字を前記画像タグデータとして選択する請求項8から請求項13のいずれかに記載の情報処理装置。
【請求項15】
前記タグ生成部は、前記データ保存部に前回保存された画像タグデータを今回関連付けて保存するデスクトップ空間画像に対する画像タグデータとして選択する請求項8から請求項14のいずれかに記載の情報処理装置。
【請求項16】
検索文字を受け取って前記データ保存部に保存された前記画像タグデータを検索する検索部と、
探索した画像タグデータと該画像タグデータに関連付けられたデスクトップ空間画像の組を抽出し、各組について前記デスクトップ空間画像と前記強調データに基づいて強調表示された文字を表示する表示処理部と
を有する請求項1から請求項15のいずれかに記載の情報処理装置。
【請求項17】
前記デスクトップ空間画像と前記文字の組を複数抽出したときに、前記強調データの大きさに基づく順番に従って各組を表示する請求項16に記載の情報処理装置。
【請求項18】
ディスプレイを備えるコンピュータに保存されたデスクトップ空間画像を検索するための画像タグデータを前記コンピュータが生成する方法であって、
前記ディスプレイのデスクトップ画面に複数の文字を含むデスクトップ空間画像を表示するステップと、
前記デスクトップ画面に書き込まれたアノテーションの座標と、前記デスクトップ空間画像に含まれる各文字の座標とを前記コンピュータが計算するステップと、
前記アノテーションの座標と前記デスクトップ空間画像に含まれる各文字の座標との距離に基づいて文字を重み付けするための強調データを各文字について前記コンピュータが生成するステップと、
前記文字と前記強調データを含む画像タグデータを前記コンピュータが生成するステップと
を有する方法。
【請求項19】
ディスプレイを備えるコンピュータに保存されたデスクトップ空間画像を検索する方法であって、
前記ディスプレイに複数の文字を含むデスクトップ空間画像を表示するステップと、
前記ディスプレイに書き込まれたアノテーションの位置と前記デスクトップ空間画像に含まれる各文字の位置とに基づいて各文字を前記コンピュータが重み付けするステップと、
重み付けされた複数の文字を含む画像タグデータを前記コンピュータが生成するステップと、
前記デスクトップ空間画像と前記画像タグデータをそれぞれ関連付けて保存するステップと、
前記保存された画像タグデータを検索するステップと、
前記重み付けに基づいて強調表示された前記複数の文字と前記画像タグデータに関連付けられたデスクトップ空間画像の組を前記ディスプレイに表示するステップと
を有する方法。
【請求項20】
コンピュータに保存されたデスクトップ空間画像を検索するために、前記コンピュータに、
複数の文字を含むデスクトップ空間画像を表示するステップと、
前記デスクトップ空間画像に書き込まれた第1のアノテーションを受け取るステップと、
前記第1のアノテーションの位置と前記デスクトップ空間画像に含まれる各文字の位置に基づいて各文字を重み付けするステップと、
前記重み付けされた複数の文字を含む画像タグデータを生成するステップと
を有する処理を実行させるコンピュータ・プログラム。
【請求項1】
デスクトップ画面に複数の文字を含むデスクトップ空間画像を表示するディスプレイと、
前記デスクトップ画面に第1のアノテーションを書き込む入力部と、
前記第1のアノテーションの位置と前記デスクトップ空間画像に含まれる各文字の位置とに基づいて文字を重み付けするための強調データを各文字について生成する強調データ生成部と、
前記強調データが生成された複数の文字を含む画像タグデータを生成するタグ生成部と、
前記デスクトップ空間画像に関連付けられた前記画像タグデータを保存するデータ保存部と
を有する情報処理装置。
【請求項2】
前記デスクトップ空間画像に含まれる各文字の座標と前記第1のアノテーションの座標を計算する座標計算部と、
中心の要素に最大の数値を設定し外側に配列された要素に順番に小さな数値を設定したランキング・マトリクスとを有し、
前記強調データ生成部が、前記第1のアノテーションの座標に前記ランキング・マトリクスの前記中心の要素を設定して前記強調データを生成する請求項1に記載の情報処理装置。
【請求項3】
前記タグ生成部が、所定値以上の重みを有する文字だけを前記画像タグデータとして選択する請求項1または請求項2に記載の情報処理装置。
【請求項4】
前記デスクトップ画面に前記入力部を通じて第2のアノテーションが書き込まれ、
前記座標計算部が前記第2のアノテーションの座標を計算し、
前記強調データ生成部が、前記第1のアノテーションの座標に設定した前記ランキング・マトリクスと前記第2のアノテーションの座標に設定した前記ランキング・マトリクスが重なる領域では前記ランキング・マトリクスの要素の数値を各ランキング・マトリクスの要素に設定された数値の平均値に設定して前記強調データを生成する請求項2または請求項3に記載の情報処理装置。
【請求項5】
前記強調データ生成部が、前記第1のアノテーションの座標に設定した前記ランキング・マトリクスと前記第2のアノテーションの座標に設定した前記ランキング・マトリクスが重ならない領域に存在する文字に対しては、近い位置に座標が存在するアノテーションに設定された前記ランキング・マトリクスで前記強調データを生成する請求項4に記載の情報処理装置。
【請求項6】
前記強調データ生成部が、前記第1のアノテーションの近傍に存在する文字のフォント・サイズで各文字までの距離または前記ランキング・マトリクスの平面的なサイズを正規化する請求項2から請求項5のいずれかに記載の情報処理装置。
【請求項7】
前記強調データ生成部は、前記デスクトップ空間画像に含まれる複数の文字の中から、前記画像タグデータの候補として特定された文字である候補文字についてだけ前記強調データを生成する請求項1から請求項6のいずれかに記載の情報処理装置。
【請求項8】
前記タグ生成部は、前記デスクトップ画面にアノテーションが書き込まれているか否かを判断し、いずれのアノテーションも書き込まれていないと判断したときに前記デスクトップ画面に表示されているいずれかの候補文字を前記画像タグデータとして選択する請求項7に記載の情報処理装置。
【請求項9】
前記タグ生成部は、前記デスクトップ画面に対するユーザの視点の座標に最も近い候補文字を前記画像タグデータとして選択する請求項8に記載の情報処理装置。
【請求項10】
前記タグ生成部は、前記デスクトップ画面が一定時間以上変化しないときに前記デスクトップ画面の中心座標に最も近い候補文字を前記画像タグデータとして選択する請求項8または請求項9に記載の情報処理装置。
【請求項11】
前記タグ生成部は、前記デスクトップ画面に表示されたウインドウが複数のフレームで構成されているときに最大フレームの中心座標に最も近い候補文字を前記画像タグデータとして選択する請求項8から請求項10のいずれかに記載の情報処理装置。
【請求項12】
前記タグ生成部は、前記デスクトップ画面に表示された複数の文字の中で最もフォント・サイズの大きな候補文字を前記画像タグデータとして選択する請求項8から請求項11のいずれかに記載の情報処理装置。
【請求項13】
前記タグ生成部は、マウス・カーソルの座標に最も近い候補文字を前記画像タグデータとして選択する請求項8から請求項12のいずれかに記載の情報処理装置。
【請求項14】
前記タグ生成部は、前記デスクトップ画面に表示された複数の文字の中で所定数以上の文字と色が異なる候補文字を前記画像タグデータとして選択する請求項8から請求項13のいずれかに記載の情報処理装置。
【請求項15】
前記タグ生成部は、前記データ保存部に前回保存された画像タグデータを今回関連付けて保存するデスクトップ空間画像に対する画像タグデータとして選択する請求項8から請求項14のいずれかに記載の情報処理装置。
【請求項16】
検索文字を受け取って前記データ保存部に保存された前記画像タグデータを検索する検索部と、
探索した画像タグデータと該画像タグデータに関連付けられたデスクトップ空間画像の組を抽出し、各組について前記デスクトップ空間画像と前記強調データに基づいて強調表示された文字を表示する表示処理部と
を有する請求項1から請求項15のいずれかに記載の情報処理装置。
【請求項17】
前記デスクトップ空間画像と前記文字の組を複数抽出したときに、前記強調データの大きさに基づく順番に従って各組を表示する請求項16に記載の情報処理装置。
【請求項18】
ディスプレイを備えるコンピュータに保存されたデスクトップ空間画像を検索するための画像タグデータを前記コンピュータが生成する方法であって、
前記ディスプレイのデスクトップ画面に複数の文字を含むデスクトップ空間画像を表示するステップと、
前記デスクトップ画面に書き込まれたアノテーションの座標と、前記デスクトップ空間画像に含まれる各文字の座標とを前記コンピュータが計算するステップと、
前記アノテーションの座標と前記デスクトップ空間画像に含まれる各文字の座標との距離に基づいて文字を重み付けするための強調データを各文字について前記コンピュータが生成するステップと、
前記文字と前記強調データを含む画像タグデータを前記コンピュータが生成するステップと
を有する方法。
【請求項19】
ディスプレイを備えるコンピュータに保存されたデスクトップ空間画像を検索する方法であって、
前記ディスプレイに複数の文字を含むデスクトップ空間画像を表示するステップと、
前記ディスプレイに書き込まれたアノテーションの位置と前記デスクトップ空間画像に含まれる各文字の位置とに基づいて各文字を前記コンピュータが重み付けするステップと、
重み付けされた複数の文字を含む画像タグデータを前記コンピュータが生成するステップと、
前記デスクトップ空間画像と前記画像タグデータをそれぞれ関連付けて保存するステップと、
前記保存された画像タグデータを検索するステップと、
前記重み付けに基づいて強調表示された前記複数の文字と前記画像タグデータに関連付けられたデスクトップ空間画像の組を前記ディスプレイに表示するステップと
を有する方法。
【請求項20】
コンピュータに保存されたデスクトップ空間画像を検索するために、前記コンピュータに、
複数の文字を含むデスクトップ空間画像を表示するステップと、
前記デスクトップ空間画像に書き込まれた第1のアノテーションを受け取るステップと、
前記第1のアノテーションの位置と前記デスクトップ空間画像に含まれる各文字の位置に基づいて各文字を重み付けするステップと、
前記重み付けされた複数の文字を含む画像タグデータを生成するステップと
を有する処理を実行させるコンピュータ・プログラム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【公開番号】特開2011−170418(P2011−170418A)
【公開日】平成23年9月1日(2011.9.1)
【国際特許分類】
【出願番号】特願2010−31149(P2010−31149)
【出願日】平成22年2月16日(2010.2.16)
【出願人】(505205731)レノボ・シンガポール・プライベート・リミテッド (292)
【復代理人】
【識別番号】100106699
【弁理士】
【氏名又は名称】渡部 弘道
【復代理人】
【識別番号】100077584
【弁理士】
【氏名又は名称】守谷 一雄
【Fターム(参考)】
【公開日】平成23年9月1日(2011.9.1)
【国際特許分類】
【出願日】平成22年2月16日(2010.2.16)
【出願人】(505205731)レノボ・シンガポール・プライベート・リミテッド (292)
【復代理人】
【識別番号】100106699
【弁理士】
【氏名又は名称】渡部 弘道
【復代理人】
【識別番号】100077584
【弁理士】
【氏名又は名称】守谷 一雄
【Fターム(参考)】
[ Back to top ]