メタデータ生成装置
【課題】 個人コンテンツに対して適合度が高く、検索を容易に行うことができるメタデータを容易に生成する。
【解決手段】 個人のコンテンツ情報を作成する個人コンテンツ情報作成手段13と、検索用メタデータの作成対象となるパブリックコンテンツ情報を収集するパブリックコンテンツ情報収集手段22と、該パブリックコンテンツ情報収集手段で収集したパブリックコンテンツ情報から前記検索用メタデータの基礎となるキーワードを抽出するキーワード抽出手段24と、該キーワード抽出手段で抽出したキーワードに基づいて前記個人コンテンツ情報作成手段で作成した個人コンテンツに対する検索用メタデータを生成するメタデータ生成手段26とを備えている。
【解決手段】 個人のコンテンツ情報を作成する個人コンテンツ情報作成手段13と、検索用メタデータの作成対象となるパブリックコンテンツ情報を収集するパブリックコンテンツ情報収集手段22と、該パブリックコンテンツ情報収集手段で収集したパブリックコンテンツ情報から前記検索用メタデータの基礎となるキーワードを抽出するキーワード抽出手段24と、該キーワード抽出手段で抽出したキーワードに基づいて前記個人コンテンツ情報作成手段で作成した個人コンテンツに対する検索用メタデータを生成するメタデータ生成手段26とを備えている。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、個人が製作した静止画像データや動画像データ等で構成される個人コンテンツのメタデータを容易に生成することができるメタデータ生成装置に関する。
【背景技術】
【0002】
放送されるTV番組やホームページなどで公開されるパブリックコンテンツに加えて、近年のデジタルカメラやカメラ付携帯電話機の普及により、大量の映像や画像を撮影し、撮影した画像データを個人コンテンツとしてパーソナルコンピュータ等の記憶装置やコンパクトデスク、デジタルビデオデスク等の記憶媒体に格納することが極めて容易になってきている。このように、大量の画像・映像データを含む個人コンテンツを効率的に検索するためにメタデータを付加することは必要不可欠である。
【0003】
デジタルカメラやデジタルビデオの画像・映像には、撮影日時がメタデータとして自動的に記憶されるが、効率的な検索という意味では不十分である。さらに、ダブリンコアやMPEG−7などのメタデータを作成する体系も整備されているが、これらの体系に基づいてメタデータを作成、入力する作業に熟練を要し、専門家ではない一般のユーザーではメタデータの作成作業が困難である。
【0004】
そこで、従来、少なくとも時間に関する情報を含む複数のイベント情報を記憶可能なイベント記憶部と、少なくとも時間に関する情報を含む付属情報を有する対象データを記憶可能な情報記憶部とを有すると共に、イベント情報関連判定部はイベント情報と付属情報とに基づいてイベントと対象データとの関連の有無を判定し、その判定結果をイベント表示部に認識可能に対象データを表す情報を表示するようにした情報処理方法が提案されている(例えば、特許文献1参照)。
【特許文献1】特開2003−303210号公報(第1頁、図1,図13)
【発明の開示】
【発明が解決しようとする課題】
【0005】
しかしながら、上記特許文献1に記載された従来例にあっては、スケジュールデータ等のイベント情報を用意する必要があり、このイベント情報の日時を信頼性高く保守しなければならず、これが面倒であるという未解決の課題を有すると共に、イベント情報が用意されていないときには検索することができないという未解決の課題もある。
そこで、本発明は、上記従来例の未解決の課題に着目してなされたものであり、個人コンテンツに対して適合度が高く、検索を容易に行うことができるメタデータを容易に生成することができるメタデータ生成装置を提供することを目的としている。
【課題を解決するための手段】
【0006】
第1の発明に係るメタデータ生成装置は、個人のコンテンツ情報を作成する個人コンテンツ情報作成手段と、検索用メタデータの作成対象となるパブリックコンテンツ情報を収集するパブリックコンテンツ情報収集手段と、該パブリックコンテンツ情報収集手段で収集したパブリックコンテンツ情報から前記検索用メタデータの基礎となるキーワードを抽出するキーワード抽出手段と、該キーワード抽出手段で抽出したキーワードに基づいて前記個人コンテンツ情報作成手段で作成した個人コンテンツに対する検索用メタデータを生成するメタデータ生成手段とを備えたことを特徴としている。
【0007】
この第1の発明では、個人コンテンツ情報作成手段でデジタルカメラやデジタルビデオ等の静止画像データや動画動データで構成される個人コンテンツ情報を作成する一方、パブリックコンテンツ情報収集手段で、放送電波、CATV、インターネット等を通じて放送されるテレビ番組やラジオ、ビデオオンデマンドで提供されるビデオ等の任意のイベント情報を含むパブリックコンテンツ情報を収集し、収集したパブリックコンテンツ情報からキーワードを抽出し、抽出したキーワードに基づいて検索用メタデータをメタデータ生成手段で生成することにより、個人コンテンツ情報に対して検索が容易となる検索用メタデータを容易に自動生成することができる。
【0008】
また、第2の発明に係るメタデータ生成装置は、第1の発明において、前記パブリックコンテンツ情報収集手段は、メタデータを含むパブリックコンテンツ情報を収集するように構成され、前記キーワード抽出手段は、前記パブリックコンテンツ情報収集手段で収集したパブリックコンテンツ情報に含まれるメタデータを解析するメタデータ解析手段と、該メタデータ解析手段の解析結果に基づいて形態素解析してキーワードを抽出する形態素解析手段とを備えたことを特徴としている。
【0009】
この第2の発明では、メタデータ解析手段で収集したパブリックコンテンツ情報に含まれるメタデータを解析し、その解析結果に基づいて形態素解析手段で形態素解析を行ってキーワードを抽出するので、個人コンテンツ情報にキーワードを抽出することが可能となる。
さらに、第3の発明に係るメタデータ生成装置は、第1の発明において、前記パブリックコンテンツ情報収集手段は、音声情報を含むパブリックコンテンツ情報を収集し、前記キーワード抽出手段は、前記音声情報を音声認識してテキストデータを形成する音声認識手段と、該音声認識手段で形成されたテキストデータを形態素解析してキーワードを抽出する形態素解析手段とを有することを特徴としている。
【0010】
この第3の発明では、音声情報を含むパブリックコンテンツ情報を収集し、この音声情報を音声認識手段で音声認識してテキストデータを形成し、このテキストデータから形態素解析してキーワードを抽出するので、音声情報からキーワードを正確に抽出することが可能となる。
さらにまた、第4の発明に係るメタデータ生成装置は、第1乃至第3の発明において、前記キーワード抽出手段は、検索用メタデータの生成対象とするキーワードを記憶するキーワード記憶手段を有し、前記パブリックコンテンツ情報から抽出したキーワードのうち前記キーワード記憶手段に記憶されているキーワードと一致するキーワードを対象キーワードとして選択するように構成されていることを特徴としている。
【0011】
この第4の発明では、パブリックコンテンツ情報から抽出したキーワードのうちキーワード記憶手段に記憶されているキーワードと一致するキーワードを対象キーワードとして選択するので、キーワード記憶手段にユーザーの思考に応じたキーワードを記憶させておくことにより、ユーザーの思考に最適なキーワードを抽出することができる。
なおさらに、第5の発明に係るメタデータ生成装置は、第4の発明において、前記キーワード記憶手段は、パブリックコンテンツ情報から抽出したキーワードを記憶するように構成されていることを特徴としている。
【0012】
この第5の発明では、キーワード記憶手段にパブリックコンテンツ情報から抽出したキーワードをユーザーの好みに応じて記憶させることができ、ユーザーの思考に最適なキーワードを記憶させることができる。
また、第6の発明に係るメタデータ生成装置は、第1乃至第5の何れか1つの発明において、前記メタデータ生成手段は、前記キーワード抽出手段で抽出したキーワードから所定適合度に基づいて検索用キーワードを選択し、選択した検索用キーワードに基づいて検索用メタデータを生成するように構成されていることを特徴としている。
【0013】
この第6の発明では、キーワード抽出したキーワードから所定適合度に基づいて検索用キーワードを選択し、選択した検索用キーワードに基づいて検索用メタデータを生成するので、不要なキーワードに基づいて検索用メタデータが生成されることを防止して、検索精度の高いキーワードのみで検索用メタデータを生成することができる。
さらに、第7の発明に係るメタデータ生成装置は、第1乃至第5の何れか1つの発明において、前記メタデータ生成手段は、所定適合度として高出現頻度を設定し、出現頻度の高いキーワードを検索用キーワードとして選択するように構成されていることを特徴としている。
【0014】
この第7の発明では、メタデータ生成手段で出現頻度の高いキーワードを検索用キーワードとして選択することにより、このキーワードから個人コンテンツ情報に対するより検索効率の高い検索用メタデータを生成することができる。
さらにまた、第8の発明に係るメタデータ生成装置は、個人のコンテンツ情報を作成する個人コンテンツ情報作成手段と、検索用メタデータの作成対象となるメタデータを含むパブリックコンテンツ情報を収集するパブリックコンテンツ情報収集手段と、キーワードを入力するキーワード入力手段と、該キーワード入力手段で入力したキーワードと一致するキーワードを記述したメタデータを含むパブリックコンテンツ情報を抽出するパブリックコンテンツ情報抽出手段と、該パブリックコンテンツ情報収集手段で抽出したパブリックコンテンツ情報に含まれるメタデータを個人コンテンツ情報の検索用メタデータとして生成するメタデータ生成手段とを備えたことを特徴としている。
【0015】
この第8の発明では、キーワード入力手段でユーザーが個人コンテンツ情報に最適なキーワードを入力することにより、入力されたキーワードを記述するメタデータを含むパブリックコンテンツ情報を抽出し、抽出したパブリックコンテンツ情報に含まれるメタデータを個人コンテンツ情報の検索用メタデータとして生成するので、ユーザーの設定したキーワードに対応する検索用メタデータを確実に生成することができる。
【0016】
なおさらに、第9の発明に係るメタデータ生成装置は、第1乃至第8の何れか1つの発明において、前記コンテンツ情報収集手段は、放送電波、ネットワーク、記憶媒体の少なくとも1つに含まれるコンテンツ情報を収集するように構成されていることを特徴としている。
この第9の発明では、コンテンツ情報収集手段で、放送電波、ネットワーク、記憶媒体の少なくとも1つに含まれるコンテンツ情報を収集することにより、個人コンテンツ情報に最適なメタデータを広範囲に収集して、最適なメタデータを生成することができる。
【発明を実施するための最良の形態】
【0017】
以下、本発明の実施の形態を図面に基づいて説明する。
図1は、本発明の第1の実施形態を示すブロック図であって、図中、PCはパーソナルコンピュータ、サーバー等で構成される情報処理装置であって、この情報処理装置PCは、中央演算処理装置(CPU)1を有し、この中央演算処理装置1にシステムバス2を介して中央演算処理装置1が実行するプログラムを記憶したROM3、中央処理装置1で実行する演算処理に必要なデータ等を記憶するRAM4、アプリケーションプログラムや後述する個人及びパブリックコンテンツ情報等を記憶するハードディスク装置(HDD)5、デジタル多用途ディスク(DVD)に対する書込及び読出しを行うDVDドライブ装置(DVDD)6、データを表示するディスプレイ7、データを入力するためのキーボード8及びマウス9等が接続されている。
【0018】
また、システムバス2には、インターネット等のネットワークに接続するネットワーク接続部10、デジタル放送電波を受信するデジタル放送受信部11を接続するデジタル放送受信部接続インタフェース12、個人コンテンツ情報作成手段としてのデジタルカメラ13を接続するデジタルカメラ接続インタフェース14及び各種メモリカードを装着するメモリカードリーダー15を接続するメモリカードインタフェース16が接続されている。
【0019】
中央演算処理装置1は、機能ブロック図で表すと、図2に示すように、デジタルカメラ13から後述するように画像データ及び撮影メタデータで構成される個人コンテンツ情報を読込む個人コンテンツ情報読込部20と、この個人コンテンツ情報読込部20で読込んだ個人コンテンツ情報を記憶する個人コンテンツ情報記憶部21と、個人コンテンツ情報を検索する場合にその検索を容易にする検索用メタデータを生成する元になるパブリックコンテンツ情報としてのメタデータを含むパブリックコンテンツ情報を収集するパブリックコンテンツ情報収集部22と、このパブリックコンテンツ情報収集部22で収集したパブリックコンテンツ情報を記憶するパブリックコンテンツ情報記憶部23と、個人コンテンツ情報記憶部21に記憶された個人コンテンツ情報から検索用メタデータを付加する個人コンテンツ情報を選択し、その撮影日時に対応するパブリックコンテンツ情報のメタデータからキーワードを抽出するキーワード抽出部24と、このキーワード抽出部で抽出したキーワードのうちキーワード記憶部25に予め記憶されているユーザーの意向に従ったキーワードと一致するキーワードを選択し、選択したキーワードの出現頻度の高いキーワードを検索用キーワードとしてこれを検索用メタデータに変換し、個人コンテンツ情報に関連付けて記憶するメタデータ生成部26とを有する。
【0020】
そして、中央演算処理装置1では、図3に示す個人コンテンツ情報を検索する場合にその検索を容易にするメタデータを生成する元になるパブリックコンテンツ情報を収集するコンテンツ情報収集処理、図5に示すデジタルカメラ13からの静止画像データを読込む個人コンテンツ情報読込処理、図7に示すパブリックコンテンツ情報からメタデータを生成するメタデータ生成処理を実行する。
【0021】
コンテンツ情報収集処理は、図3に示すように、先ず、ステップS0で、収集するパブリックコンテンツ情報を設定する情報収集設定画面を表示する。この情報収集設定画面は、図4に示すように、放送チャンネルを設定する放送チャンネル設定部27と、ニュース番組、歌謡番組、ドラマ等のパブリックコンテンツ情報の種別を選択する種別選択部28と、収集期間を設定する収集期間設定部29とを備えている。
【0022】
この情報収集設定画面で各設定部27〜29を設定すると、ステップS1に移行し、設定されたデジタル放送チャンネルの番組情報を取得し、次いでステップS2に移行して、取得した番組情報から設定された番組が放送される時間帯を抽出してからステップS3に移行する。
このステップS3では、抽出された設定番組の放送開始時間となったか否かを判定し、設定番組の放送開始時間となっていないときには、放送開始時間となるまで待機し、放送開始時間となったときにはステップS4に移行して、設定番組に付随するメタデータを例えばハードディスク装置5に形成したパブリックコンテンツ情報記憶領域に、記録日時と共に記憶してからステップS5に移行する。
【0023】
このステップS5では、設定番組の放送時間が終了したか否かを判定し、放送時間が終了していないときには前記ステップS4に戻り、放送時間が終了したときにはステップS6に移行して、前記ステップS2で抽出した全ての設定番組におけるメタデータの収集が完了したか否かを判定し、収集していない設定番組が存在する場合にはステップS7に移行して、次の設定番組を指定してから前記ステップS3に戻り、全ての設定番組におけるメタデータの収集が終了したときにはステップS8に移行して、情報収集を継続するか否かを例えば収集期間設定部29で設定した収集期間内であるか否かで判定し、収集期間内であるときには情報収集を継続するものと判断して前記ステップS1に戻り、収集期間を終了したときには情報収集処理を終了する。
【0024】
また、個人コンテンツ情報読込処理は、デジタルカメラ接続インタフェース14にデジタルカメラ13が接続されたときに実行され、図5に示すように、先ず、ステップS11で、デジタルカメラ13に内蔵された撮影した画像データ及びそのメタデータを関連付けして記憶するメモリカードにアクセスして、これに記憶されている画像データ及びメタデータを順次読込む。
【0025】
ここで、カードメモリに記憶されている画像データは、図6に示すように、デジタルカメラ13で撮影したバイナリデータの画像データを圧縮した例えばJPEG圧縮形式のデータのデータ記録領域RDと、このデータ記録領域RDに続くXML(Extensible Markup Language)データで記述されるメタデータを記録する撮影メタデータ記憶領域RMとが連結された形式で記憶されている。撮影メタデータ記憶領域RMに記録されたメタデータは、メタデータ領域ヘッダーRM1、メタデータボディRM2及びメタデータ領域フッターRM3とで構成されている。メタデータ領域ヘッダーRM1及びメタデータ領域フッターRM3は、画像データにメタデータが連結されているか否かを正しく認識するために、撮影メタデータ記憶領域RMの識別情報、サイズ情報が記録され、メタデータボディRM2には、撮影した画像情報の日時情報、シャッター速度、絞り等の撮影情報等がXMLファイル形式で記録されている。
【0026】
このように、画像データ記憶領域RDの次にメタデータ記録領域RMを形成することにより、他のアプリケーションには影響を与えずに、メタデータを登録することができる。すなわち、画像データのヘッダー部分の情報はメタデータの接続前から変化しないので、画像データを一般的なブラウザによって画像再生が行えることになる。
次いで、ステップS12に移行して、読込んだ画像データをディスプレイ7に表示して、読込みたい画像データを選択する選択処理を行い、次いでステップS13に移行して、選択処理で選択された画像データが存在するか否かを判定し、選択された画像データが存在しない場合には読込処理を終了し、選択された画像データが存在する場合には、ステップS14に移行して、選択された画像データ及びこれに付属するメタデータとをハードディスク装置5の指定された個人コンテンツ情報記憶領域としての画像データ記憶領域に記憶してから画像データ読込処理を終了する。
【0027】
さらに、メタデータ生成処理は、所定のメニュー画面で、メタデータ生成処理が選択されたときに実行開始され、図7に示すように、先ず、ステップS21で、ハードディスク装置5の画像データ記憶領域から画像データの検索を容易にする検索用メタデータを付加する対象となる画像データを読込んでディスプレイ7に表示する画像データ選択処理を行い、次いでステップS22に移行して、画像データ選択処理で、検索用メタデータを付加する対象となる画像データが選択されたか否かを判定し、画像データが選択されていないときにはステップS23に移行して、メタデータ生成処理を終了する処理終了ボタンの選択等による処理終了指示があったか否かを判定し、処理終了指示があったときにはそのままメタデータ生成処理を終了し、処理終了指示がないときには前記ステップS21に戻る。
【0028】
一方、ステップS22の判定結果が、選択された画像データが存在するものであるときには、ステップS24に移行して、選択された画像データに付加された撮影メタデータを読込み、次いでステップS25に移行して、ハードディスク装置5のパブリックコンテンツ情報記憶領域に記憶されているパブリックコンテンツ情報から上記ステップS24で読込んだメタデータに記述された撮影日時に近い日時のパブリックコンテンツ情報を抽出し、次いでステップS26に移行して、抽出されたパブリックコンテンツ情報が存在するか否かを判定し、抽出されたパブリックコンテンツ情報が存在しない場合にはステップS27に移行して、該当するパブリックコンテンツ情報が存在しない旨のガイダンス情報をディスプレイ7に表示してから後述するステップS47に移行し、抽出されたパブリックコンテンツ情報が存在する場合にはステップS28に移行する。
【0029】
このステップS28では、抽出されたパブリックコンテンツ情報の最初の1つについてメタデータを読込み、次いでステップS29に移行して、メタデータを解析してメタデータとして記述されているテキストデータを抽出し、次いでステップS30に移行して、抽出したテキストデータが単一の単語で構成されているか否かを判定し、単一の単語で構成されている場合にはステップS31に移行して、単一の単語をキーワードとして設定してからステップS34にジャンプする。
【0030】
また、前記ステップS30の判定結果が、テキストデータが単一の単語で構成されていないときにはステップS32に移行して、テキストデータを形態素解析して固有名詞の単語を抽出し、次いでステップS33に移行して抽出した単語をキーワードとして設定してからステップS34に移行する。
ステップS34では、ハードディスク装置5に予め設定されたキーワード記憶部に記憶されたキーワードと一致するキーワードを抽出し、次いでステップS35に移行して、一致するキーワードが抽出されたか否かを判定し、一致するキーワードが抽出されたときには後述するステップS39にジャップし、一致するキーワードが抽出されなかったときには、ステップS36に移行して、テキストデータから抽出したキーワードを採用するか否かを選択する選択画面をディスプレイ7に表示し、次いでステップS37に移行して、キーワードの採用が設定されたか否かを判定し、キーワードの採用が選択されないときには後述するステップS40にジャンプし、キーワードの採用が選択されたときにはステップS38に移行して、採用されたキーワードをキーワード記憶部に追加してからステップS39に移行する。
【0031】
ステップS39では、抽出されたキーワードを検索キーワードとしてRAM4に一時記憶し、次いでステップS40に移行し、上述したキーワード抽出処理をしていないパブリックコンテンツ情報が存在するか否かを判定し、キーワード抽出処理を終了していないパブリックコンテンツ情報が存在する場合にはステップS41に移行して、次のパブリックコンテンツ情報のメタデータを読込んでから前記ステップS29に戻り、抽出した全てのパブリックコンテンツ情報に対してキーワード抽出処理が終了したときにはステップS42に移行する。
【0032】
このステップS42では、RAM4に記憶されたキーワードから出現頻度の高いキーワードを選択し、次いでステップS43に移行して、選択したキーワードを検索用キーワードとして採用するか否かを選択する選択画面をディスプレイ7に表示し、次いでステップS44に移行して検索用キーワードとして選択されているか否かを判定し、検索用キーワードとして選択されていないときには後述するステップS47にジャンプし、検索用キーワードとして選択されているときにはステップS45に移行して、検索用キーワードを検索用メタデータに変換し、次いでステップS46に移行して、変換した検索用メタデータを該当する画像データの撮影メタデータ記憶領域RMに付加すると共に、メタデータ領域ヘッダーRM1及びメタデータ領域フッターRM3ヘッダーを変更してからステップS47に移行する。
【0033】
ステップS47では、他の個人コンテンツ情報を選択するか否かを判定し、他の個人コンテンツ情報を選択する場合には前記ステップS21に戻り、他の個人コンテンツ情報を選択しない場合にはメタデータ生成処理を終了する。
なお、図3の処理がパブリックコンテンツ情報収集手段に対応し、図7の処理において、ステップS21〜S41の処理がキーワード抽出手段に対応し、ステップS28及びS29の処理がメタデータ解析手段に対応し、ステップS32の処理が形態素解析手段に対応し、ステップS35〜S38の処理がキーワード記憶手段に対応し、ステップS42〜ステップS46の処理がメタデータ生成手段に対応している。
【0034】
次に、上記第1の実施形態の動作を説明する。
先ず、ユーザーは情報処理装置PCを起動して、ユーザーがデジタルカメラ13を操作して撮影した画像データ及びメタデータで構成される個人コンテンツ情報を多数纏めてアルバム形式等の任意の形式でハードディスク装置5に格納する場合に、撮影データの検索を容易にする検索用メタデータを生成するためのパブリックコンテンツ情報を収集するコンテンツ情報収集処理を実行する。
【0035】
このコンテンツ情報収集処理では、前述したように、個人コンテンツ情報の検索を容易にするためのキーワードを収集するためのものであり、例えばコンテンツ情報収集処理を実行開始するアイコンをマウスで指定してクリックすることにより、図3の情報収集処理が開始される。この情報収集処理では、先ず、図4に示す情報収集設定画面が表示され(ステップS0)、この情報収集設定画面で収集するパブリックコンテンツ情報の放送チャンネル設定部27でデジタル放送の放送チャンネルを設定すると共に、パブリックコンテンツ情報種別設定部28でパブリックコンテンツ情報の種別例えばニュース番組を設定し、さらに収集期間設定部29でパブリックコンテンツ情報を収集する期間を設定し、その後に図示しない実行ボタンをマウス9でクリックすることにより、ステップS1に移行する。
【0036】
このステップS1では、指定されたデジタル放送チャンネルの番組情報を取得し、取得した番組情報からニュース番組の時間帯を抽出する(ステップS2)。
そして、最初のニュース番組の開始時刻となるまでは待機し、該当ニュース番組の開始時刻となると(ステップS3)、ニュース番組に付随する各種メタデータのうち例えばニュース内容を記述するコンテンツ記述メタデータ、コンテンツの特定のインスタンスを記述するインスタンス記述メタデータ等のニュース内容を記述するメタデータをハードディスク装置5に形成したパブリックコンテンツ情報記憶領域に記憶する(ステップS4)。
【0037】
そして、ニュース番組が終了すると、設定した全てのニュース番組からのメタデータの収集が完了したか否かを判定し(ステップS5)、残りのニュース番組が存在する場合には、残りのニュース番組の内一番近い時間帯の次のニュース番組を指定し(ステップS7)、次いで前記ステップS3に戻る。
そして、上記情報収集処理を取得した番組情報に記載された全てのニュース番組のメタデータ収集を完了すると(ステップS6)、指定した期間内の情報収集が終了したか否かを判定し、設定期間が満了しておらず情報収集を継続する場合には前記ステップS1に戻り、設定期間が満了すると情報収集処理を終了する。
【0038】
このように情報収集処理を設定期間の間繰り返すことにより、ニュース番組で取り上げられた重大ニュースやスキー、花見、花火大会、海水浴などの季節に合わせたイベントを記述する種々のメタデータをその日時に対応させて順次収集することができ、これらがハードディスク装置5のパブリックコンテンツ情報記憶領域に記憶される。
このようにして、ハードディスク装置5のパブリックコンテンツ情報記憶領域に順次ニュース番組のメタデータがその日時と共に記憶されている状態で、ユーザーがデジタルカメラ13で例えば花火大会の風景や人物の写真を撮影し、そのビットマップ画像データと撮影日時、撮影データ等の撮影メタデータとで構成される個人コンテンツ情報をデジタルカメラ13のメモリカードに格納する。
【0039】
その後、デジタルカメラ13を自宅に持ち帰って、デジタルカメラ13を直接デジタルカメラ接続インタフェース14に接続するか又はデジタルカメラ13からメモリカードを抜き出し、これをメモリカードインタフェース16に接続されたメモリカードリーダー15に装着した状態で、図5に示す個人コンテンツ情報読込処理を実行する。
これにより、メモリカードアクセスして、これに格納された各個人コンテンツ情報を読込み(ステップS11)、読込んだ各個人コンテンツ情報をディスプレイ7に表示して、必要な個人コンテンツ情報を選択する画像データ選択処理を行い(ステップS12)、この画像データ選択処理で選択された画像データと撮影メタデータとで構成される個人コンテンツ情報がハードディスク装置5の指定した個人コンテンツ情報記憶領域としての画像データ記憶領域に記憶される(ステップS14)。
【0040】
この個人コンテンツ情報のハードディスク装置5への記憶が完了した時点で又はその後に、記憶した個人コンテンツ情報に対して検索を容易にするための検索用メタデータを付加するには、例えばディスプレイ7に表示されているアイコンをクリックして図7に示すメタデータ生成処理を実行させる。
このメタデータ生成処理では、先ず、検索用メタデータを付加する個人コンテンツ情報を選択する選択処理を実行する。この選択処理では、ハードディスク装置5の個人コンテンツ情報記憶領域に記憶されている個人コンテンツ情報をディスプレイ7に表示し、表示された個人コンテンツ情報から所望の個人コンテンツ情報を選択する。この場合、個人コンテンツ情報は1つの画像データを選択してもよく、複数の画像データをグループに纏めてグループ単位で選択するようにしてもよい。
【0041】
そして、個人コンテンツ情報の選択が行われない場合には処理終了ボタンをマウスでクリックする等の処理終了指示が入力されたか否かを判定し、処理終了指示が入力されたときには、そのままメタデータ生成処理を終了するが、処理終了指示が入力されていないときにはステップS21に戻って個人コンテンツ情報選択処理を継続する。
この個人コンテンツ情報選択処理で、任意の個人コンテンツ情報が1つ又はグループ単位で選択されると、ステップS22からステップS24に移行して、対象となる個人コンテンツ情報に付加されている撮影メタデータを読込み、ハードディスク装置5に形成されたパブリックコンテンツ情報記憶領域をアクセスして、撮影メタデータに記述された撮影日時に近い日時のパブリックコンテンツ情報を抽出する(ステップS25)。
【0042】
そして、該当するパブリックコンテンツ情報が抽出されたか否かを判定し、該当するパブリックコンテンツ情報が抽出されないときには、該当パブリックコンテンツ情報が存在しない旨のガイダンス情報をディスプレイ7に表示してからステップS47に移行して、他の個人コンテンツ情報を選択するか否かを判定し、他の個人コンテンツ情報を選択する場合にはステップS21に戻り、他の個人コンテンツ情報を選択しない場合にはメタデータ生成処理を終了する。
【0043】
一方、ステップS26の判定結果が、該当するパブリックコンテンツ情報が存在する場合にはその最初のパブリックコンテンツ情報のメタデータを読込む(ステップS28)。
このとき、パブリックコンテンツ情報のメタデータが、図8に示すように、ニュース番組のメタデータであって、「Title」として「2004年夏花火大会」が設定され、「Synopsis(概要)」として「花火大会が隅田川に大きな花火が上がった。観衆から歓声があがる。」と記述されていたものとし、一方、ハードディスク装置5のキーワード記憶部に図9に示すようにキーワードとして「花火大会、運動会、発表会、コンサート、……利根川、隅田川、木曽川……」等が記憶されているものとする。
【0044】
この状態でメタデータを解析してテキストデータを抽出すると、「花火大会が隅田川に大きな花火が上がった。観衆から歓声があがる。」が抽出され、これが単一単語ではないので、ステップS30からステップS32に移行して、形態素解析して固有名詞の単語「花火大会」「隅田川」「花火」「観衆」及び「歓声」がキーワードとして抽出される。
そして、抽出された各単語のうちキーワード記憶領域に記憶されているキーワードと一致するキーワードを抽出すると、「花火大会」「隅田川」が一致することになり、これらが検索用キーワードとしてRAM4の所定記憶領域に一時記憶される。
【0045】
次いで、キーワード抽出処理していないパブリックコンテンツ情報即ち他のニュース番組が存在する場合には、このニュース番組についてステップS29〜S39の解析処理が行われ、ここでは打ち上げ場所の異なる「花火大会」のニュースが取り上げられているものとすると、「花火大会」の出現頻度が高くなり、この「花火大会」がキーワードとして選択される(ステップS42)。
【0046】
そして、選択されたキーワード「花火大会」を検索用キーワードとして採用するか否かの選択画面がディスプレイ7に表示され(ステップS43)、これを検索用キーワードとして選択したときには、「花火大会」をメタデータに変換し(ステップS45)、このメタデータを該当する個人コンテンツ情報の撮影メタデータ記憶領域RMに付加すると共に、メタデータ領域ヘッダー及びメタデータ領域フッターを変更し(ステップS46)。次いで、ステップS47に移行する。このときの検索用メタデータは、図10に示すように、例えば「DrivedKeyword」として「花火大会」が記憶される。
【0047】
このステップS47で他の個人コンテンツ情報を選択するか否かを判定し、他の個人コンテンツ情報を選択する場合には前記ステップS21に戻り、他の個人コンテンツ情報を選択しない場合にはメタデータ生成処理を終了する。
ところで、前述したステップS34でテキストデータから抽出したキーワードがキーワード記憶部に記憶されているキーワードと一致しない場合には、ステップS35からステップS36に移行して、テキストデータから抽出したキーワードを採用するか否かの選択画面をディスプレイ7に表示し、テキストデータから抽出したキーワードを採用する場合には、ステップS37からステップS38に移行して、採用したキーワードを新たなキーワードとしてキーワード記憶部に追加してからステップS39に移行して検索用キーワードとしてRAM4に一時記憶する。
【0048】
このため、他のニュース番組でも新たなキーワードが抽出され、その出現頻度が高い場合には、新たなキーワードが検索用キーワードとして採用され、これを選択することにより、メタデータに変換されて該当する個人コンテンツ情報の撮影メタデータ記憶領域RMに付加される。
このようにして、ハードディスク装置5に記憶された個人コンテンツ情報に検索用メタデータが自動的に付加されることにより、後日個人コンテンツ情報を検索する際、個人コンテンツ情報の日時が正確に思い出せない場合に、検索用キーワード例えば上記の場合「花火大会」を入力して検索することにより、該当する個人コンテンツ情報を正確に検索することができる。この場合、個人コンテンツ情報の内容と検索用メタデータで記述されたキーワードの内容とが一致する必要はなく、花火大会の頃に撮影した個人コンテンツ情報を検索したい場合に花火大会の前後の個人コンテンツ情報に「花火大会」を記述する検索用メタデータが付加されることになるため、「花火大会」をキーワードとして時期的に関連する個人コンテンツ情報を正確に検索することができる。
【0049】
このように、上記第1の実施形態によれば、所望の収集期間でパブリックコンテンツ情報を収集して、このパブリックコンテンツ情報に含まれるメタデータから検索用メタデータを生成するようにしたので、ユーザーが検索用メタデータを直接入力することなく、検索用メタデータを生成することができ、検索用メタデータを煩わしい操作を伴うことなく容易に生成することができ、操作に不慣れなユーザーであっても個人コンテンツ情報に検索用メタデータを容易に付加することができる。
【0050】
しかも、検索用メタデータを作成する対象となるパブリックコンテンツ情報を限定することができるので、ユーザー個人に最適なキーワードを抽出することができ、後の個人コンテンツ情報を検索する際のキーワードとして最適なキーワード設定することができる。
しかも、パブリックコンテンツ情報から抽出したキーワードをキーワード記憶部に記憶されているキーワードと比較して一致するキーワードを検索用キーワードとして設定するので、不用意に多数のキーワードが検索用キーワードとして設定されることがなく、ユーザーが必要とするキーワードのみが検索用メタデータとして設定され、全体の検索用メタデータ数を制限することができる。
【0051】
なお、上記第1の実施形態においては、パブリックコンテンツ情報としてデジタル放送のニュース番組を選択する場合について説明したが、これに限定されるものではなく、例えば図11に示すように、デジタル放送やアナログ放送の視聴率データにアクセスできる場合には、視聴率の高い番組で且つ連続しているドラマ等の特定の可能な番組を抽出し、抽出した番組の番組名を検索用メタデータとして生成するようにしてもよい。この場合には、視聴率の高い番組は、番組自体が社会的に話題になっていることが多く、視聴者の記憶に残っている場合が多い。したがって、番組名などを検索用メタデータとすることにより、最適なキーワードを設定することができる。同様に、ドラマのように連続するものではないが、一つのチャンネルではなく、複数のチャンネルの報道番組、ワイドショー等で取り上げられている全国的な話題や世界的な話題を検索用メタデータとして採用するようにしてもよい。
【0052】
また、上記第1の実施形態においては、キーワードの出現頻度に基づいて検索用キーワードとして設定する場合について説明したが、これに限定されるもではなく、抽出されたキーワードをディスプレイに表示して、ユーザーがキーボード8、マウス9等で選択することにより、採用する検索用キーワードを設定するようにしてもよい。
さらに、上記第1の実施形態においては、パブリックコンテンツ情報、個人コンテンツ情報、検索用メタデータをハードディスク装置5に記憶した場合について説明したが、これに限定されるものではなく、検索用メタデータを付加した個人コンテンツ情報をDVDドライブ装置6でDVDに格納するようにしてもよく、他の任意の記憶装置を適用するようにしてもよい。
【0053】
次に、本発明の第2の実施形態を図12及び図13について説明する。
この第2の実施形態では、デジタル放送の番組情報に付随するメタデータを利用して個人コンテンツ情報のメタデータを自動生成する場合に代えて、デジタル放送やアナログ放送、さらにはラジオ放送の音声情報に基づいてメタデータを自動生成するようにしたものである。
【0054】
すなわち、第2の実施形態では、中央演算処理装置1で図12に示すコンテンツ情報収集処理を実行する。このコンテンツ情報収集処理は、前述した第1の実施形態における図3のコンテンツ情報収集処理において、ステップS4及びS5の処理が省略され、これらに代えて、ステップS3で抽出したニュース番組の放送開始時間と判定されたときに、ニュース番組の音声情報を音声認識してテキストデータを作成する音声認識処理を実行するステップS51に移行し、次いで、ニュース番組を開始してから重要なニュースの概要を紹介する所定時間(例えば3分程度、コマーシャルが入る場合には実際のニュースが提供されてから3分程度)が経過したか否かを判定し、所定時間が経過していないときには全ステップS51に戻り、所定時間が経過したときにはステップS53に移行して、作成したテキストデータをコンテンツ情報記憶部に記憶してから前記ステップS6に移行することを除いては同様の処理を行い、図3の処理と対応する処理には同一ステップ番号を付し、その詳細説明はこれを省略する。ここで、音声認識処理としては、周波数分析、音素の認識、単語認識、文章認識のステップで行われる。
【0055】
また、中央演算処理装置1で実行するメタデータ生成処理が、図13に示すように、第1の実施形態における図7のメタデータ生成処理において、ステップS28の処理が最初のメタデータを読込む処理から最初のテキストデータを読込む処理に変更され、メタデータを解析してテキストを抽出するステップS29、テキストが単一単語で構成されているか否かを判定するステップS30及び単語をキーワードに設定するステップS31の処理が省略され、さらにステップS41の処理が次のコンテンツ情報のメタデータを読込む処理から次のコンテンツ情報のテキストデータを読込む処理に変更されていることを除いては図7のメタデータ生成処理と同様の処理を行い、図7との対応部分には同一ステップ番号を付し、その詳細説明はこれを省略する。
【0056】
なお、図12の処理がパブリックコンテンツ情報収集手段に対応し、このうちステップS51の処理が音声認識手段に対応し、図13の処理におけるステップS21〜S29、S32〜S41の処理がキーワード抽出手段に対応し、このうちステップS32の処理が形態素解析手段に対応し、図13の処理におけるステップS42〜S46の処理がメタデータ生成手段に対応している。
【0057】
この第2の実施形態によると、第1の実施形態におけるニュース番組に付随するメタデータを収集する場合に代えて、ニュース番組冒頭の重要なニュースの概要を音声認識処理してテキストデータを作成し(ステップS51)、作成したテストデータをコンテンツ情報記憶部に記憶するようにしているので、コンテンツ情報記憶部に記憶する情報量としては多くなるが、重要なニュースを抽出することができる。
【0058】
そして、コンテンツ情報記憶部に記憶されたテキストデータに基づいて図13のメタデータ生成処理で、形態素解析を行って固有名詞でなる複数のキーワードを抽出し、抽出した複数のキーワードをキーワード記憶部に記憶されているキーワードと比較して一致するキーワードを選択してRAM4に一時記憶し、個人コンテンツ情報の撮影日時近傍の各ニュース番組から選択したキーワードのうち出現頻度の高いキーワードを検索用キーワードとして設定し、これをディスプレイ7に表示してユーザーが確認したときに検索用メタデータに変換し、この検索用メタデータを個人コンテンツ情報の画像データ記憶領域RDに続く撮影メタデータ記憶領域RMに付加すると共に、メタデータ領域ヘッダー及びメタデータ領域フッターを変更する。
【0059】
このため、前述した第1の実施形態と同様に、ニュース番組の音声信号から個人コンテンツ情報の検索用メタデータを自動生成することができ、ユーザーの煩わしい操作を防止して、負担を大幅に軽減することができ、操作に不慣れなユーザーであっても個人コンテンツ情報に容易に検索用メタデータを付加することができる。
なお、上記第2の実施形態においては、図12に示すパブリックコンテンツ情報の収集処理の中で音声認識処理によるテキストデータの作成を行う場合について説明したが、これに限定されるものではなく、図13に示すメタデータ生成処理において、ステップS28で音声情報を読込み、次いでステップS32に移行して音声認識処理を行って単語を抽出するようにしてもよい。この場合の音声認識処理としては、上述したように周波数分析、音素の認識、単語認識、文章認識を行ってテキストデータを形成するようにしてもよいが、周波数分析、音素の認識を行った後に単語HMM(Hidden Markov Model)を行って直接単語を抽出するようにすることが好ましい。
【0060】
また、上記第2の実施形態においては、デジタル放送電波を受信したときの音声信号に基づいて検索用メタデータを生成する場合について説明したが、これに限定されるものではなく、アナログ放送電波を受信して、そのニュース番組の音声信号から検索用メタデータを生成したり、ラジオ放送のニュース番組の音声信号から検索用メタデータを形成したりすることができる。
【0061】
さらに、上記第1及び第2の実施形態においては、検索用キーワードが選択されたときに、この検索用キーワードをディスプレイ7に表示してユーザーが採用するか否かを選択するようにした場合について説明したが、これに限定されるものではなく、検索用キーワードが選択されたときに、ユーザーの判断を行うことなく、検索用キーワードを検索用メタデータに変換して個人コンテンツ情報の撮影メタデータに付加するようにしてもよい。
【0062】
さらにまた、上記第1及び第2の実施形態においては、検索用キーワードとしての適合度として高出現頻度を設定した場合について説明したが、これに限定されるものではなく、キーワードに優先度を付け、優先度が高いキーワードを検索用キーワードとして選択するようにしてもよい。
なおさらに、上記第1及び第2の実施形態においては、生成した検索用メタデータを個人コンテンツ情報の撮影メタデータに付加する場合について説明したが、これに限定されるものではなく、生成した検索用メタデータをハードディスク装置5に形成した検索用メタデータ記憶領域に個人コンテンツ情報と関連付けして記憶するようにしてもよい。
【0063】
また、上記第1及び第2の実施形態においては、パブリックコンテンツ情報を収集して、このパブリックコンテンツ情報から個人コンテンツ情報の日時に該当するパブリックコンテンツ情報のメタデータを抽出するようにした場合について説明したが、これに限定されるものではなく、図14で機能ブロック図として示すように、前述した図3に示す情報処理収集処理を実行するパブリックコンテンツ収集部31と、このパブリックコンテンツ収集部31で収集したパブリックコンテンツ情報を記憶するパブリックコンテンツ記憶部32と、検索用のキーワードを入力するキーボード8等のキーワード入力手段としてのキーワード入力部33と、このキーワード入力部33で入力したキーワードと同一のキーワードを記述したメタデータを含むパブリックコンテンツ情報をパブリックコンテンツ記憶部32に記憶されているパブリックコンテンツ情報から抽出するパブリックコンテンツ情報抽出手段としてのパブリックコンテンツ抽出部34と、このパブリックコンテンツ抽出部34で抽出したパブリックコンテンツ情報のメタデータを検索用メタデータとして個人コンテンツ情報記憶部35にが記憶された個人コンテンツ情報と関連付けしてハードディスク装置等に記憶するメタデータ生成手段としてのメタデータ生成部36とを設けるようにしてもよい。
【0064】
さらに、上記第1及び第2の実施形態においては、デジタル又はアナログ放送電波を受信部11で受信する場合について説明したが、これに限定されるものではなく、光ファイバー等を利用したCATV等で配信される放送情報や、インターネット等のネットワークを介して配信される放送情報や、ビデオオンデマンドで提供されるビデオ等を収集するようにしてもよく、さらには、インターネット等のネットワークを介して配信される新聞データや、DVD、CD等の記憶媒体に記憶された年間の新聞情報、雑誌情報等をパブリックコンテンツ情報として収集するようにしてもよい。
【0065】
さらにまた、上記第1及び第2の実施形態においては、個人コンテンツ情報作成手段としてデジタルカメラ13を適用した場合について説明したが、これに限定されるものではなく、動画データを撮影するデジタルビデオカメラを適用することもでき、任意の個人コンテンツ情報作成手段を適用することができる。
なおさらに、上記第1及び第2の実施形態においては、1つ情報処理装置PCでパブリックコンテンツ情報収集処理と、メタデータ生成処理とを行う場合について説明したが、これに限定されるものではなく、パブリックコンテンツ情報収集処理と個人コンテンツ情報読込処理及びメタデータ生成処理とを個別の情報処理装置で行い、両者をネットワークで接続して連携させるようにしてもよく、さらにはデジタル放送受信装置でパブリックコンテンツ情報収集処理、個人コンテンツ情報読込処理及びメタデータ生成処理を行うようにしてもよい。
【図面の簡単な説明】
【0066】
【図1】本発明の一実施形態を示すブロック図である。
【図2】中央演算処理装置の機能ブロック図である。
【図3】中央演算処理装置で実行するパブリックコンテンツ情報収集処理手順の一例を示すフローチャートである。
【図4】パブリックコンテンツ情報収集処理でディスプレイに表示する情報収集設定画面を示す説明図である。
【図5】中央演算処理装置で実行する個人コンテンツ情報読込処理手順の一例を示すフローチャートである。
【図6】デジタルカメラのメモリカードの記憶領域を示す説明図である。
【図7】中央演算処理装置で実行するメタデータ生成処理手順の一例を示すフローチャートである。
【図8】パブリックコンテンツ情報に付加されたメタデータを示す説明図である。
【図9】キーワード記憶部に記憶されたキーワード記憶内容を示す説明図である。
【図10】個人コンテンツ情報に付加する検索用メタデータの一例を示す説明図である。
【図11】番組視聴率データを示す説明図である。
【図12】本発明の第2の実施形態におけるパブリックコンテンツ情報収集処理手順の一例を示すフローチャートである。
【図13】本発明の第2の実施形態におけるメタデータ生成処理手順の一例を示すフローチャートである。
【図14】中央演算処理装置の他の機能ブロック図である。
【符号の説明】
【0067】
PC…情報処理装置、1…中央演算処理装置、2…システムバス、3…ROM、4…RAM、5…ハードディスク装置、6…DVDドライブ装置、7…ディスプレイ、8…キーボード、9…マウス、10…ネットワーク接続部、11…デジタル放送受信部、13…デジタルカメラ、15…メモリカードリーダー、20…個人コンテンツ情報読込部、21…個人コンテンツ情報記憶部、22…パブリックコンテンツ収集部、23…パブリックコンテンツ記憶部、24…キーワード抽出部、25…キーワード記憶部、26…メタデータ生成部、27…放送チャンネル設定部、28…パブリックコンテンツ情報種別設定部、29…収集期間設定部、31…パブリックコンテンツ収集部、32…パブリックコンテンツ記憶部、33…キーワード入力部、34…パブリックコンテンツ抽出部、35…個人コンテンツ記憶部、36…メタデータ生成部
【技術分野】
【0001】
本発明は、個人が製作した静止画像データや動画像データ等で構成される個人コンテンツのメタデータを容易に生成することができるメタデータ生成装置に関する。
【背景技術】
【0002】
放送されるTV番組やホームページなどで公開されるパブリックコンテンツに加えて、近年のデジタルカメラやカメラ付携帯電話機の普及により、大量の映像や画像を撮影し、撮影した画像データを個人コンテンツとしてパーソナルコンピュータ等の記憶装置やコンパクトデスク、デジタルビデオデスク等の記憶媒体に格納することが極めて容易になってきている。このように、大量の画像・映像データを含む個人コンテンツを効率的に検索するためにメタデータを付加することは必要不可欠である。
【0003】
デジタルカメラやデジタルビデオの画像・映像には、撮影日時がメタデータとして自動的に記憶されるが、効率的な検索という意味では不十分である。さらに、ダブリンコアやMPEG−7などのメタデータを作成する体系も整備されているが、これらの体系に基づいてメタデータを作成、入力する作業に熟練を要し、専門家ではない一般のユーザーではメタデータの作成作業が困難である。
【0004】
そこで、従来、少なくとも時間に関する情報を含む複数のイベント情報を記憶可能なイベント記憶部と、少なくとも時間に関する情報を含む付属情報を有する対象データを記憶可能な情報記憶部とを有すると共に、イベント情報関連判定部はイベント情報と付属情報とに基づいてイベントと対象データとの関連の有無を判定し、その判定結果をイベント表示部に認識可能に対象データを表す情報を表示するようにした情報処理方法が提案されている(例えば、特許文献1参照)。
【特許文献1】特開2003−303210号公報(第1頁、図1,図13)
【発明の開示】
【発明が解決しようとする課題】
【0005】
しかしながら、上記特許文献1に記載された従来例にあっては、スケジュールデータ等のイベント情報を用意する必要があり、このイベント情報の日時を信頼性高く保守しなければならず、これが面倒であるという未解決の課題を有すると共に、イベント情報が用意されていないときには検索することができないという未解決の課題もある。
そこで、本発明は、上記従来例の未解決の課題に着目してなされたものであり、個人コンテンツに対して適合度が高く、検索を容易に行うことができるメタデータを容易に生成することができるメタデータ生成装置を提供することを目的としている。
【課題を解決するための手段】
【0006】
第1の発明に係るメタデータ生成装置は、個人のコンテンツ情報を作成する個人コンテンツ情報作成手段と、検索用メタデータの作成対象となるパブリックコンテンツ情報を収集するパブリックコンテンツ情報収集手段と、該パブリックコンテンツ情報収集手段で収集したパブリックコンテンツ情報から前記検索用メタデータの基礎となるキーワードを抽出するキーワード抽出手段と、該キーワード抽出手段で抽出したキーワードに基づいて前記個人コンテンツ情報作成手段で作成した個人コンテンツに対する検索用メタデータを生成するメタデータ生成手段とを備えたことを特徴としている。
【0007】
この第1の発明では、個人コンテンツ情報作成手段でデジタルカメラやデジタルビデオ等の静止画像データや動画動データで構成される個人コンテンツ情報を作成する一方、パブリックコンテンツ情報収集手段で、放送電波、CATV、インターネット等を通じて放送されるテレビ番組やラジオ、ビデオオンデマンドで提供されるビデオ等の任意のイベント情報を含むパブリックコンテンツ情報を収集し、収集したパブリックコンテンツ情報からキーワードを抽出し、抽出したキーワードに基づいて検索用メタデータをメタデータ生成手段で生成することにより、個人コンテンツ情報に対して検索が容易となる検索用メタデータを容易に自動生成することができる。
【0008】
また、第2の発明に係るメタデータ生成装置は、第1の発明において、前記パブリックコンテンツ情報収集手段は、メタデータを含むパブリックコンテンツ情報を収集するように構成され、前記キーワード抽出手段は、前記パブリックコンテンツ情報収集手段で収集したパブリックコンテンツ情報に含まれるメタデータを解析するメタデータ解析手段と、該メタデータ解析手段の解析結果に基づいて形態素解析してキーワードを抽出する形態素解析手段とを備えたことを特徴としている。
【0009】
この第2の発明では、メタデータ解析手段で収集したパブリックコンテンツ情報に含まれるメタデータを解析し、その解析結果に基づいて形態素解析手段で形態素解析を行ってキーワードを抽出するので、個人コンテンツ情報にキーワードを抽出することが可能となる。
さらに、第3の発明に係るメタデータ生成装置は、第1の発明において、前記パブリックコンテンツ情報収集手段は、音声情報を含むパブリックコンテンツ情報を収集し、前記キーワード抽出手段は、前記音声情報を音声認識してテキストデータを形成する音声認識手段と、該音声認識手段で形成されたテキストデータを形態素解析してキーワードを抽出する形態素解析手段とを有することを特徴としている。
【0010】
この第3の発明では、音声情報を含むパブリックコンテンツ情報を収集し、この音声情報を音声認識手段で音声認識してテキストデータを形成し、このテキストデータから形態素解析してキーワードを抽出するので、音声情報からキーワードを正確に抽出することが可能となる。
さらにまた、第4の発明に係るメタデータ生成装置は、第1乃至第3の発明において、前記キーワード抽出手段は、検索用メタデータの生成対象とするキーワードを記憶するキーワード記憶手段を有し、前記パブリックコンテンツ情報から抽出したキーワードのうち前記キーワード記憶手段に記憶されているキーワードと一致するキーワードを対象キーワードとして選択するように構成されていることを特徴としている。
【0011】
この第4の発明では、パブリックコンテンツ情報から抽出したキーワードのうちキーワード記憶手段に記憶されているキーワードと一致するキーワードを対象キーワードとして選択するので、キーワード記憶手段にユーザーの思考に応じたキーワードを記憶させておくことにより、ユーザーの思考に最適なキーワードを抽出することができる。
なおさらに、第5の発明に係るメタデータ生成装置は、第4の発明において、前記キーワード記憶手段は、パブリックコンテンツ情報から抽出したキーワードを記憶するように構成されていることを特徴としている。
【0012】
この第5の発明では、キーワード記憶手段にパブリックコンテンツ情報から抽出したキーワードをユーザーの好みに応じて記憶させることができ、ユーザーの思考に最適なキーワードを記憶させることができる。
また、第6の発明に係るメタデータ生成装置は、第1乃至第5の何れか1つの発明において、前記メタデータ生成手段は、前記キーワード抽出手段で抽出したキーワードから所定適合度に基づいて検索用キーワードを選択し、選択した検索用キーワードに基づいて検索用メタデータを生成するように構成されていることを特徴としている。
【0013】
この第6の発明では、キーワード抽出したキーワードから所定適合度に基づいて検索用キーワードを選択し、選択した検索用キーワードに基づいて検索用メタデータを生成するので、不要なキーワードに基づいて検索用メタデータが生成されることを防止して、検索精度の高いキーワードのみで検索用メタデータを生成することができる。
さらに、第7の発明に係るメタデータ生成装置は、第1乃至第5の何れか1つの発明において、前記メタデータ生成手段は、所定適合度として高出現頻度を設定し、出現頻度の高いキーワードを検索用キーワードとして選択するように構成されていることを特徴としている。
【0014】
この第7の発明では、メタデータ生成手段で出現頻度の高いキーワードを検索用キーワードとして選択することにより、このキーワードから個人コンテンツ情報に対するより検索効率の高い検索用メタデータを生成することができる。
さらにまた、第8の発明に係るメタデータ生成装置は、個人のコンテンツ情報を作成する個人コンテンツ情報作成手段と、検索用メタデータの作成対象となるメタデータを含むパブリックコンテンツ情報を収集するパブリックコンテンツ情報収集手段と、キーワードを入力するキーワード入力手段と、該キーワード入力手段で入力したキーワードと一致するキーワードを記述したメタデータを含むパブリックコンテンツ情報を抽出するパブリックコンテンツ情報抽出手段と、該パブリックコンテンツ情報収集手段で抽出したパブリックコンテンツ情報に含まれるメタデータを個人コンテンツ情報の検索用メタデータとして生成するメタデータ生成手段とを備えたことを特徴としている。
【0015】
この第8の発明では、キーワード入力手段でユーザーが個人コンテンツ情報に最適なキーワードを入力することにより、入力されたキーワードを記述するメタデータを含むパブリックコンテンツ情報を抽出し、抽出したパブリックコンテンツ情報に含まれるメタデータを個人コンテンツ情報の検索用メタデータとして生成するので、ユーザーの設定したキーワードに対応する検索用メタデータを確実に生成することができる。
【0016】
なおさらに、第9の発明に係るメタデータ生成装置は、第1乃至第8の何れか1つの発明において、前記コンテンツ情報収集手段は、放送電波、ネットワーク、記憶媒体の少なくとも1つに含まれるコンテンツ情報を収集するように構成されていることを特徴としている。
この第9の発明では、コンテンツ情報収集手段で、放送電波、ネットワーク、記憶媒体の少なくとも1つに含まれるコンテンツ情報を収集することにより、個人コンテンツ情報に最適なメタデータを広範囲に収集して、最適なメタデータを生成することができる。
【発明を実施するための最良の形態】
【0017】
以下、本発明の実施の形態を図面に基づいて説明する。
図1は、本発明の第1の実施形態を示すブロック図であって、図中、PCはパーソナルコンピュータ、サーバー等で構成される情報処理装置であって、この情報処理装置PCは、中央演算処理装置(CPU)1を有し、この中央演算処理装置1にシステムバス2を介して中央演算処理装置1が実行するプログラムを記憶したROM3、中央処理装置1で実行する演算処理に必要なデータ等を記憶するRAM4、アプリケーションプログラムや後述する個人及びパブリックコンテンツ情報等を記憶するハードディスク装置(HDD)5、デジタル多用途ディスク(DVD)に対する書込及び読出しを行うDVDドライブ装置(DVDD)6、データを表示するディスプレイ7、データを入力するためのキーボード8及びマウス9等が接続されている。
【0018】
また、システムバス2には、インターネット等のネットワークに接続するネットワーク接続部10、デジタル放送電波を受信するデジタル放送受信部11を接続するデジタル放送受信部接続インタフェース12、個人コンテンツ情報作成手段としてのデジタルカメラ13を接続するデジタルカメラ接続インタフェース14及び各種メモリカードを装着するメモリカードリーダー15を接続するメモリカードインタフェース16が接続されている。
【0019】
中央演算処理装置1は、機能ブロック図で表すと、図2に示すように、デジタルカメラ13から後述するように画像データ及び撮影メタデータで構成される個人コンテンツ情報を読込む個人コンテンツ情報読込部20と、この個人コンテンツ情報読込部20で読込んだ個人コンテンツ情報を記憶する個人コンテンツ情報記憶部21と、個人コンテンツ情報を検索する場合にその検索を容易にする検索用メタデータを生成する元になるパブリックコンテンツ情報としてのメタデータを含むパブリックコンテンツ情報を収集するパブリックコンテンツ情報収集部22と、このパブリックコンテンツ情報収集部22で収集したパブリックコンテンツ情報を記憶するパブリックコンテンツ情報記憶部23と、個人コンテンツ情報記憶部21に記憶された個人コンテンツ情報から検索用メタデータを付加する個人コンテンツ情報を選択し、その撮影日時に対応するパブリックコンテンツ情報のメタデータからキーワードを抽出するキーワード抽出部24と、このキーワード抽出部で抽出したキーワードのうちキーワード記憶部25に予め記憶されているユーザーの意向に従ったキーワードと一致するキーワードを選択し、選択したキーワードの出現頻度の高いキーワードを検索用キーワードとしてこれを検索用メタデータに変換し、個人コンテンツ情報に関連付けて記憶するメタデータ生成部26とを有する。
【0020】
そして、中央演算処理装置1では、図3に示す個人コンテンツ情報を検索する場合にその検索を容易にするメタデータを生成する元になるパブリックコンテンツ情報を収集するコンテンツ情報収集処理、図5に示すデジタルカメラ13からの静止画像データを読込む個人コンテンツ情報読込処理、図7に示すパブリックコンテンツ情報からメタデータを生成するメタデータ生成処理を実行する。
【0021】
コンテンツ情報収集処理は、図3に示すように、先ず、ステップS0で、収集するパブリックコンテンツ情報を設定する情報収集設定画面を表示する。この情報収集設定画面は、図4に示すように、放送チャンネルを設定する放送チャンネル設定部27と、ニュース番組、歌謡番組、ドラマ等のパブリックコンテンツ情報の種別を選択する種別選択部28と、収集期間を設定する収集期間設定部29とを備えている。
【0022】
この情報収集設定画面で各設定部27〜29を設定すると、ステップS1に移行し、設定されたデジタル放送チャンネルの番組情報を取得し、次いでステップS2に移行して、取得した番組情報から設定された番組が放送される時間帯を抽出してからステップS3に移行する。
このステップS3では、抽出された設定番組の放送開始時間となったか否かを判定し、設定番組の放送開始時間となっていないときには、放送開始時間となるまで待機し、放送開始時間となったときにはステップS4に移行して、設定番組に付随するメタデータを例えばハードディスク装置5に形成したパブリックコンテンツ情報記憶領域に、記録日時と共に記憶してからステップS5に移行する。
【0023】
このステップS5では、設定番組の放送時間が終了したか否かを判定し、放送時間が終了していないときには前記ステップS4に戻り、放送時間が終了したときにはステップS6に移行して、前記ステップS2で抽出した全ての設定番組におけるメタデータの収集が完了したか否かを判定し、収集していない設定番組が存在する場合にはステップS7に移行して、次の設定番組を指定してから前記ステップS3に戻り、全ての設定番組におけるメタデータの収集が終了したときにはステップS8に移行して、情報収集を継続するか否かを例えば収集期間設定部29で設定した収集期間内であるか否かで判定し、収集期間内であるときには情報収集を継続するものと判断して前記ステップS1に戻り、収集期間を終了したときには情報収集処理を終了する。
【0024】
また、個人コンテンツ情報読込処理は、デジタルカメラ接続インタフェース14にデジタルカメラ13が接続されたときに実行され、図5に示すように、先ず、ステップS11で、デジタルカメラ13に内蔵された撮影した画像データ及びそのメタデータを関連付けして記憶するメモリカードにアクセスして、これに記憶されている画像データ及びメタデータを順次読込む。
【0025】
ここで、カードメモリに記憶されている画像データは、図6に示すように、デジタルカメラ13で撮影したバイナリデータの画像データを圧縮した例えばJPEG圧縮形式のデータのデータ記録領域RDと、このデータ記録領域RDに続くXML(Extensible Markup Language)データで記述されるメタデータを記録する撮影メタデータ記憶領域RMとが連結された形式で記憶されている。撮影メタデータ記憶領域RMに記録されたメタデータは、メタデータ領域ヘッダーRM1、メタデータボディRM2及びメタデータ領域フッターRM3とで構成されている。メタデータ領域ヘッダーRM1及びメタデータ領域フッターRM3は、画像データにメタデータが連結されているか否かを正しく認識するために、撮影メタデータ記憶領域RMの識別情報、サイズ情報が記録され、メタデータボディRM2には、撮影した画像情報の日時情報、シャッター速度、絞り等の撮影情報等がXMLファイル形式で記録されている。
【0026】
このように、画像データ記憶領域RDの次にメタデータ記録領域RMを形成することにより、他のアプリケーションには影響を与えずに、メタデータを登録することができる。すなわち、画像データのヘッダー部分の情報はメタデータの接続前から変化しないので、画像データを一般的なブラウザによって画像再生が行えることになる。
次いで、ステップS12に移行して、読込んだ画像データをディスプレイ7に表示して、読込みたい画像データを選択する選択処理を行い、次いでステップS13に移行して、選択処理で選択された画像データが存在するか否かを判定し、選択された画像データが存在しない場合には読込処理を終了し、選択された画像データが存在する場合には、ステップS14に移行して、選択された画像データ及びこれに付属するメタデータとをハードディスク装置5の指定された個人コンテンツ情報記憶領域としての画像データ記憶領域に記憶してから画像データ読込処理を終了する。
【0027】
さらに、メタデータ生成処理は、所定のメニュー画面で、メタデータ生成処理が選択されたときに実行開始され、図7に示すように、先ず、ステップS21で、ハードディスク装置5の画像データ記憶領域から画像データの検索を容易にする検索用メタデータを付加する対象となる画像データを読込んでディスプレイ7に表示する画像データ選択処理を行い、次いでステップS22に移行して、画像データ選択処理で、検索用メタデータを付加する対象となる画像データが選択されたか否かを判定し、画像データが選択されていないときにはステップS23に移行して、メタデータ生成処理を終了する処理終了ボタンの選択等による処理終了指示があったか否かを判定し、処理終了指示があったときにはそのままメタデータ生成処理を終了し、処理終了指示がないときには前記ステップS21に戻る。
【0028】
一方、ステップS22の判定結果が、選択された画像データが存在するものであるときには、ステップS24に移行して、選択された画像データに付加された撮影メタデータを読込み、次いでステップS25に移行して、ハードディスク装置5のパブリックコンテンツ情報記憶領域に記憶されているパブリックコンテンツ情報から上記ステップS24で読込んだメタデータに記述された撮影日時に近い日時のパブリックコンテンツ情報を抽出し、次いでステップS26に移行して、抽出されたパブリックコンテンツ情報が存在するか否かを判定し、抽出されたパブリックコンテンツ情報が存在しない場合にはステップS27に移行して、該当するパブリックコンテンツ情報が存在しない旨のガイダンス情報をディスプレイ7に表示してから後述するステップS47に移行し、抽出されたパブリックコンテンツ情報が存在する場合にはステップS28に移行する。
【0029】
このステップS28では、抽出されたパブリックコンテンツ情報の最初の1つについてメタデータを読込み、次いでステップS29に移行して、メタデータを解析してメタデータとして記述されているテキストデータを抽出し、次いでステップS30に移行して、抽出したテキストデータが単一の単語で構成されているか否かを判定し、単一の単語で構成されている場合にはステップS31に移行して、単一の単語をキーワードとして設定してからステップS34にジャンプする。
【0030】
また、前記ステップS30の判定結果が、テキストデータが単一の単語で構成されていないときにはステップS32に移行して、テキストデータを形態素解析して固有名詞の単語を抽出し、次いでステップS33に移行して抽出した単語をキーワードとして設定してからステップS34に移行する。
ステップS34では、ハードディスク装置5に予め設定されたキーワード記憶部に記憶されたキーワードと一致するキーワードを抽出し、次いでステップS35に移行して、一致するキーワードが抽出されたか否かを判定し、一致するキーワードが抽出されたときには後述するステップS39にジャップし、一致するキーワードが抽出されなかったときには、ステップS36に移行して、テキストデータから抽出したキーワードを採用するか否かを選択する選択画面をディスプレイ7に表示し、次いでステップS37に移行して、キーワードの採用が設定されたか否かを判定し、キーワードの採用が選択されないときには後述するステップS40にジャンプし、キーワードの採用が選択されたときにはステップS38に移行して、採用されたキーワードをキーワード記憶部に追加してからステップS39に移行する。
【0031】
ステップS39では、抽出されたキーワードを検索キーワードとしてRAM4に一時記憶し、次いでステップS40に移行し、上述したキーワード抽出処理をしていないパブリックコンテンツ情報が存在するか否かを判定し、キーワード抽出処理を終了していないパブリックコンテンツ情報が存在する場合にはステップS41に移行して、次のパブリックコンテンツ情報のメタデータを読込んでから前記ステップS29に戻り、抽出した全てのパブリックコンテンツ情報に対してキーワード抽出処理が終了したときにはステップS42に移行する。
【0032】
このステップS42では、RAM4に記憶されたキーワードから出現頻度の高いキーワードを選択し、次いでステップS43に移行して、選択したキーワードを検索用キーワードとして採用するか否かを選択する選択画面をディスプレイ7に表示し、次いでステップS44に移行して検索用キーワードとして選択されているか否かを判定し、検索用キーワードとして選択されていないときには後述するステップS47にジャンプし、検索用キーワードとして選択されているときにはステップS45に移行して、検索用キーワードを検索用メタデータに変換し、次いでステップS46に移行して、変換した検索用メタデータを該当する画像データの撮影メタデータ記憶領域RMに付加すると共に、メタデータ領域ヘッダーRM1及びメタデータ領域フッターRM3ヘッダーを変更してからステップS47に移行する。
【0033】
ステップS47では、他の個人コンテンツ情報を選択するか否かを判定し、他の個人コンテンツ情報を選択する場合には前記ステップS21に戻り、他の個人コンテンツ情報を選択しない場合にはメタデータ生成処理を終了する。
なお、図3の処理がパブリックコンテンツ情報収集手段に対応し、図7の処理において、ステップS21〜S41の処理がキーワード抽出手段に対応し、ステップS28及びS29の処理がメタデータ解析手段に対応し、ステップS32の処理が形態素解析手段に対応し、ステップS35〜S38の処理がキーワード記憶手段に対応し、ステップS42〜ステップS46の処理がメタデータ生成手段に対応している。
【0034】
次に、上記第1の実施形態の動作を説明する。
先ず、ユーザーは情報処理装置PCを起動して、ユーザーがデジタルカメラ13を操作して撮影した画像データ及びメタデータで構成される個人コンテンツ情報を多数纏めてアルバム形式等の任意の形式でハードディスク装置5に格納する場合に、撮影データの検索を容易にする検索用メタデータを生成するためのパブリックコンテンツ情報を収集するコンテンツ情報収集処理を実行する。
【0035】
このコンテンツ情報収集処理では、前述したように、個人コンテンツ情報の検索を容易にするためのキーワードを収集するためのものであり、例えばコンテンツ情報収集処理を実行開始するアイコンをマウスで指定してクリックすることにより、図3の情報収集処理が開始される。この情報収集処理では、先ず、図4に示す情報収集設定画面が表示され(ステップS0)、この情報収集設定画面で収集するパブリックコンテンツ情報の放送チャンネル設定部27でデジタル放送の放送チャンネルを設定すると共に、パブリックコンテンツ情報種別設定部28でパブリックコンテンツ情報の種別例えばニュース番組を設定し、さらに収集期間設定部29でパブリックコンテンツ情報を収集する期間を設定し、その後に図示しない実行ボタンをマウス9でクリックすることにより、ステップS1に移行する。
【0036】
このステップS1では、指定されたデジタル放送チャンネルの番組情報を取得し、取得した番組情報からニュース番組の時間帯を抽出する(ステップS2)。
そして、最初のニュース番組の開始時刻となるまでは待機し、該当ニュース番組の開始時刻となると(ステップS3)、ニュース番組に付随する各種メタデータのうち例えばニュース内容を記述するコンテンツ記述メタデータ、コンテンツの特定のインスタンスを記述するインスタンス記述メタデータ等のニュース内容を記述するメタデータをハードディスク装置5に形成したパブリックコンテンツ情報記憶領域に記憶する(ステップS4)。
【0037】
そして、ニュース番組が終了すると、設定した全てのニュース番組からのメタデータの収集が完了したか否かを判定し(ステップS5)、残りのニュース番組が存在する場合には、残りのニュース番組の内一番近い時間帯の次のニュース番組を指定し(ステップS7)、次いで前記ステップS3に戻る。
そして、上記情報収集処理を取得した番組情報に記載された全てのニュース番組のメタデータ収集を完了すると(ステップS6)、指定した期間内の情報収集が終了したか否かを判定し、設定期間が満了しておらず情報収集を継続する場合には前記ステップS1に戻り、設定期間が満了すると情報収集処理を終了する。
【0038】
このように情報収集処理を設定期間の間繰り返すことにより、ニュース番組で取り上げられた重大ニュースやスキー、花見、花火大会、海水浴などの季節に合わせたイベントを記述する種々のメタデータをその日時に対応させて順次収集することができ、これらがハードディスク装置5のパブリックコンテンツ情報記憶領域に記憶される。
このようにして、ハードディスク装置5のパブリックコンテンツ情報記憶領域に順次ニュース番組のメタデータがその日時と共に記憶されている状態で、ユーザーがデジタルカメラ13で例えば花火大会の風景や人物の写真を撮影し、そのビットマップ画像データと撮影日時、撮影データ等の撮影メタデータとで構成される個人コンテンツ情報をデジタルカメラ13のメモリカードに格納する。
【0039】
その後、デジタルカメラ13を自宅に持ち帰って、デジタルカメラ13を直接デジタルカメラ接続インタフェース14に接続するか又はデジタルカメラ13からメモリカードを抜き出し、これをメモリカードインタフェース16に接続されたメモリカードリーダー15に装着した状態で、図5に示す個人コンテンツ情報読込処理を実行する。
これにより、メモリカードアクセスして、これに格納された各個人コンテンツ情報を読込み(ステップS11)、読込んだ各個人コンテンツ情報をディスプレイ7に表示して、必要な個人コンテンツ情報を選択する画像データ選択処理を行い(ステップS12)、この画像データ選択処理で選択された画像データと撮影メタデータとで構成される個人コンテンツ情報がハードディスク装置5の指定した個人コンテンツ情報記憶領域としての画像データ記憶領域に記憶される(ステップS14)。
【0040】
この個人コンテンツ情報のハードディスク装置5への記憶が完了した時点で又はその後に、記憶した個人コンテンツ情報に対して検索を容易にするための検索用メタデータを付加するには、例えばディスプレイ7に表示されているアイコンをクリックして図7に示すメタデータ生成処理を実行させる。
このメタデータ生成処理では、先ず、検索用メタデータを付加する個人コンテンツ情報を選択する選択処理を実行する。この選択処理では、ハードディスク装置5の個人コンテンツ情報記憶領域に記憶されている個人コンテンツ情報をディスプレイ7に表示し、表示された個人コンテンツ情報から所望の個人コンテンツ情報を選択する。この場合、個人コンテンツ情報は1つの画像データを選択してもよく、複数の画像データをグループに纏めてグループ単位で選択するようにしてもよい。
【0041】
そして、個人コンテンツ情報の選択が行われない場合には処理終了ボタンをマウスでクリックする等の処理終了指示が入力されたか否かを判定し、処理終了指示が入力されたときには、そのままメタデータ生成処理を終了するが、処理終了指示が入力されていないときにはステップS21に戻って個人コンテンツ情報選択処理を継続する。
この個人コンテンツ情報選択処理で、任意の個人コンテンツ情報が1つ又はグループ単位で選択されると、ステップS22からステップS24に移行して、対象となる個人コンテンツ情報に付加されている撮影メタデータを読込み、ハードディスク装置5に形成されたパブリックコンテンツ情報記憶領域をアクセスして、撮影メタデータに記述された撮影日時に近い日時のパブリックコンテンツ情報を抽出する(ステップS25)。
【0042】
そして、該当するパブリックコンテンツ情報が抽出されたか否かを判定し、該当するパブリックコンテンツ情報が抽出されないときには、該当パブリックコンテンツ情報が存在しない旨のガイダンス情報をディスプレイ7に表示してからステップS47に移行して、他の個人コンテンツ情報を選択するか否かを判定し、他の個人コンテンツ情報を選択する場合にはステップS21に戻り、他の個人コンテンツ情報を選択しない場合にはメタデータ生成処理を終了する。
【0043】
一方、ステップS26の判定結果が、該当するパブリックコンテンツ情報が存在する場合にはその最初のパブリックコンテンツ情報のメタデータを読込む(ステップS28)。
このとき、パブリックコンテンツ情報のメタデータが、図8に示すように、ニュース番組のメタデータであって、「Title」として「2004年夏花火大会」が設定され、「Synopsis(概要)」として「花火大会が隅田川に大きな花火が上がった。観衆から歓声があがる。」と記述されていたものとし、一方、ハードディスク装置5のキーワード記憶部に図9に示すようにキーワードとして「花火大会、運動会、発表会、コンサート、……利根川、隅田川、木曽川……」等が記憶されているものとする。
【0044】
この状態でメタデータを解析してテキストデータを抽出すると、「花火大会が隅田川に大きな花火が上がった。観衆から歓声があがる。」が抽出され、これが単一単語ではないので、ステップS30からステップS32に移行して、形態素解析して固有名詞の単語「花火大会」「隅田川」「花火」「観衆」及び「歓声」がキーワードとして抽出される。
そして、抽出された各単語のうちキーワード記憶領域に記憶されているキーワードと一致するキーワードを抽出すると、「花火大会」「隅田川」が一致することになり、これらが検索用キーワードとしてRAM4の所定記憶領域に一時記憶される。
【0045】
次いで、キーワード抽出処理していないパブリックコンテンツ情報即ち他のニュース番組が存在する場合には、このニュース番組についてステップS29〜S39の解析処理が行われ、ここでは打ち上げ場所の異なる「花火大会」のニュースが取り上げられているものとすると、「花火大会」の出現頻度が高くなり、この「花火大会」がキーワードとして選択される(ステップS42)。
【0046】
そして、選択されたキーワード「花火大会」を検索用キーワードとして採用するか否かの選択画面がディスプレイ7に表示され(ステップS43)、これを検索用キーワードとして選択したときには、「花火大会」をメタデータに変換し(ステップS45)、このメタデータを該当する個人コンテンツ情報の撮影メタデータ記憶領域RMに付加すると共に、メタデータ領域ヘッダー及びメタデータ領域フッターを変更し(ステップS46)。次いで、ステップS47に移行する。このときの検索用メタデータは、図10に示すように、例えば「DrivedKeyword」として「花火大会」が記憶される。
【0047】
このステップS47で他の個人コンテンツ情報を選択するか否かを判定し、他の個人コンテンツ情報を選択する場合には前記ステップS21に戻り、他の個人コンテンツ情報を選択しない場合にはメタデータ生成処理を終了する。
ところで、前述したステップS34でテキストデータから抽出したキーワードがキーワード記憶部に記憶されているキーワードと一致しない場合には、ステップS35からステップS36に移行して、テキストデータから抽出したキーワードを採用するか否かの選択画面をディスプレイ7に表示し、テキストデータから抽出したキーワードを採用する場合には、ステップS37からステップS38に移行して、採用したキーワードを新たなキーワードとしてキーワード記憶部に追加してからステップS39に移行して検索用キーワードとしてRAM4に一時記憶する。
【0048】
このため、他のニュース番組でも新たなキーワードが抽出され、その出現頻度が高い場合には、新たなキーワードが検索用キーワードとして採用され、これを選択することにより、メタデータに変換されて該当する個人コンテンツ情報の撮影メタデータ記憶領域RMに付加される。
このようにして、ハードディスク装置5に記憶された個人コンテンツ情報に検索用メタデータが自動的に付加されることにより、後日個人コンテンツ情報を検索する際、個人コンテンツ情報の日時が正確に思い出せない場合に、検索用キーワード例えば上記の場合「花火大会」を入力して検索することにより、該当する個人コンテンツ情報を正確に検索することができる。この場合、個人コンテンツ情報の内容と検索用メタデータで記述されたキーワードの内容とが一致する必要はなく、花火大会の頃に撮影した個人コンテンツ情報を検索したい場合に花火大会の前後の個人コンテンツ情報に「花火大会」を記述する検索用メタデータが付加されることになるため、「花火大会」をキーワードとして時期的に関連する個人コンテンツ情報を正確に検索することができる。
【0049】
このように、上記第1の実施形態によれば、所望の収集期間でパブリックコンテンツ情報を収集して、このパブリックコンテンツ情報に含まれるメタデータから検索用メタデータを生成するようにしたので、ユーザーが検索用メタデータを直接入力することなく、検索用メタデータを生成することができ、検索用メタデータを煩わしい操作を伴うことなく容易に生成することができ、操作に不慣れなユーザーであっても個人コンテンツ情報に検索用メタデータを容易に付加することができる。
【0050】
しかも、検索用メタデータを作成する対象となるパブリックコンテンツ情報を限定することができるので、ユーザー個人に最適なキーワードを抽出することができ、後の個人コンテンツ情報を検索する際のキーワードとして最適なキーワード設定することができる。
しかも、パブリックコンテンツ情報から抽出したキーワードをキーワード記憶部に記憶されているキーワードと比較して一致するキーワードを検索用キーワードとして設定するので、不用意に多数のキーワードが検索用キーワードとして設定されることがなく、ユーザーが必要とするキーワードのみが検索用メタデータとして設定され、全体の検索用メタデータ数を制限することができる。
【0051】
なお、上記第1の実施形態においては、パブリックコンテンツ情報としてデジタル放送のニュース番組を選択する場合について説明したが、これに限定されるものではなく、例えば図11に示すように、デジタル放送やアナログ放送の視聴率データにアクセスできる場合には、視聴率の高い番組で且つ連続しているドラマ等の特定の可能な番組を抽出し、抽出した番組の番組名を検索用メタデータとして生成するようにしてもよい。この場合には、視聴率の高い番組は、番組自体が社会的に話題になっていることが多く、視聴者の記憶に残っている場合が多い。したがって、番組名などを検索用メタデータとすることにより、最適なキーワードを設定することができる。同様に、ドラマのように連続するものではないが、一つのチャンネルではなく、複数のチャンネルの報道番組、ワイドショー等で取り上げられている全国的な話題や世界的な話題を検索用メタデータとして採用するようにしてもよい。
【0052】
また、上記第1の実施形態においては、キーワードの出現頻度に基づいて検索用キーワードとして設定する場合について説明したが、これに限定されるもではなく、抽出されたキーワードをディスプレイに表示して、ユーザーがキーボード8、マウス9等で選択することにより、採用する検索用キーワードを設定するようにしてもよい。
さらに、上記第1の実施形態においては、パブリックコンテンツ情報、個人コンテンツ情報、検索用メタデータをハードディスク装置5に記憶した場合について説明したが、これに限定されるものではなく、検索用メタデータを付加した個人コンテンツ情報をDVDドライブ装置6でDVDに格納するようにしてもよく、他の任意の記憶装置を適用するようにしてもよい。
【0053】
次に、本発明の第2の実施形態を図12及び図13について説明する。
この第2の実施形態では、デジタル放送の番組情報に付随するメタデータを利用して個人コンテンツ情報のメタデータを自動生成する場合に代えて、デジタル放送やアナログ放送、さらにはラジオ放送の音声情報に基づいてメタデータを自動生成するようにしたものである。
【0054】
すなわち、第2の実施形態では、中央演算処理装置1で図12に示すコンテンツ情報収集処理を実行する。このコンテンツ情報収集処理は、前述した第1の実施形態における図3のコンテンツ情報収集処理において、ステップS4及びS5の処理が省略され、これらに代えて、ステップS3で抽出したニュース番組の放送開始時間と判定されたときに、ニュース番組の音声情報を音声認識してテキストデータを作成する音声認識処理を実行するステップS51に移行し、次いで、ニュース番組を開始してから重要なニュースの概要を紹介する所定時間(例えば3分程度、コマーシャルが入る場合には実際のニュースが提供されてから3分程度)が経過したか否かを判定し、所定時間が経過していないときには全ステップS51に戻り、所定時間が経過したときにはステップS53に移行して、作成したテキストデータをコンテンツ情報記憶部に記憶してから前記ステップS6に移行することを除いては同様の処理を行い、図3の処理と対応する処理には同一ステップ番号を付し、その詳細説明はこれを省略する。ここで、音声認識処理としては、周波数分析、音素の認識、単語認識、文章認識のステップで行われる。
【0055】
また、中央演算処理装置1で実行するメタデータ生成処理が、図13に示すように、第1の実施形態における図7のメタデータ生成処理において、ステップS28の処理が最初のメタデータを読込む処理から最初のテキストデータを読込む処理に変更され、メタデータを解析してテキストを抽出するステップS29、テキストが単一単語で構成されているか否かを判定するステップS30及び単語をキーワードに設定するステップS31の処理が省略され、さらにステップS41の処理が次のコンテンツ情報のメタデータを読込む処理から次のコンテンツ情報のテキストデータを読込む処理に変更されていることを除いては図7のメタデータ生成処理と同様の処理を行い、図7との対応部分には同一ステップ番号を付し、その詳細説明はこれを省略する。
【0056】
なお、図12の処理がパブリックコンテンツ情報収集手段に対応し、このうちステップS51の処理が音声認識手段に対応し、図13の処理におけるステップS21〜S29、S32〜S41の処理がキーワード抽出手段に対応し、このうちステップS32の処理が形態素解析手段に対応し、図13の処理におけるステップS42〜S46の処理がメタデータ生成手段に対応している。
【0057】
この第2の実施形態によると、第1の実施形態におけるニュース番組に付随するメタデータを収集する場合に代えて、ニュース番組冒頭の重要なニュースの概要を音声認識処理してテキストデータを作成し(ステップS51)、作成したテストデータをコンテンツ情報記憶部に記憶するようにしているので、コンテンツ情報記憶部に記憶する情報量としては多くなるが、重要なニュースを抽出することができる。
【0058】
そして、コンテンツ情報記憶部に記憶されたテキストデータに基づいて図13のメタデータ生成処理で、形態素解析を行って固有名詞でなる複数のキーワードを抽出し、抽出した複数のキーワードをキーワード記憶部に記憶されているキーワードと比較して一致するキーワードを選択してRAM4に一時記憶し、個人コンテンツ情報の撮影日時近傍の各ニュース番組から選択したキーワードのうち出現頻度の高いキーワードを検索用キーワードとして設定し、これをディスプレイ7に表示してユーザーが確認したときに検索用メタデータに変換し、この検索用メタデータを個人コンテンツ情報の画像データ記憶領域RDに続く撮影メタデータ記憶領域RMに付加すると共に、メタデータ領域ヘッダー及びメタデータ領域フッターを変更する。
【0059】
このため、前述した第1の実施形態と同様に、ニュース番組の音声信号から個人コンテンツ情報の検索用メタデータを自動生成することができ、ユーザーの煩わしい操作を防止して、負担を大幅に軽減することができ、操作に不慣れなユーザーであっても個人コンテンツ情報に容易に検索用メタデータを付加することができる。
なお、上記第2の実施形態においては、図12に示すパブリックコンテンツ情報の収集処理の中で音声認識処理によるテキストデータの作成を行う場合について説明したが、これに限定されるものではなく、図13に示すメタデータ生成処理において、ステップS28で音声情報を読込み、次いでステップS32に移行して音声認識処理を行って単語を抽出するようにしてもよい。この場合の音声認識処理としては、上述したように周波数分析、音素の認識、単語認識、文章認識を行ってテキストデータを形成するようにしてもよいが、周波数分析、音素の認識を行った後に単語HMM(Hidden Markov Model)を行って直接単語を抽出するようにすることが好ましい。
【0060】
また、上記第2の実施形態においては、デジタル放送電波を受信したときの音声信号に基づいて検索用メタデータを生成する場合について説明したが、これに限定されるものではなく、アナログ放送電波を受信して、そのニュース番組の音声信号から検索用メタデータを生成したり、ラジオ放送のニュース番組の音声信号から検索用メタデータを形成したりすることができる。
【0061】
さらに、上記第1及び第2の実施形態においては、検索用キーワードが選択されたときに、この検索用キーワードをディスプレイ7に表示してユーザーが採用するか否かを選択するようにした場合について説明したが、これに限定されるものではなく、検索用キーワードが選択されたときに、ユーザーの判断を行うことなく、検索用キーワードを検索用メタデータに変換して個人コンテンツ情報の撮影メタデータに付加するようにしてもよい。
【0062】
さらにまた、上記第1及び第2の実施形態においては、検索用キーワードとしての適合度として高出現頻度を設定した場合について説明したが、これに限定されるものではなく、キーワードに優先度を付け、優先度が高いキーワードを検索用キーワードとして選択するようにしてもよい。
なおさらに、上記第1及び第2の実施形態においては、生成した検索用メタデータを個人コンテンツ情報の撮影メタデータに付加する場合について説明したが、これに限定されるものではなく、生成した検索用メタデータをハードディスク装置5に形成した検索用メタデータ記憶領域に個人コンテンツ情報と関連付けして記憶するようにしてもよい。
【0063】
また、上記第1及び第2の実施形態においては、パブリックコンテンツ情報を収集して、このパブリックコンテンツ情報から個人コンテンツ情報の日時に該当するパブリックコンテンツ情報のメタデータを抽出するようにした場合について説明したが、これに限定されるものではなく、図14で機能ブロック図として示すように、前述した図3に示す情報処理収集処理を実行するパブリックコンテンツ収集部31と、このパブリックコンテンツ収集部31で収集したパブリックコンテンツ情報を記憶するパブリックコンテンツ記憶部32と、検索用のキーワードを入力するキーボード8等のキーワード入力手段としてのキーワード入力部33と、このキーワード入力部33で入力したキーワードと同一のキーワードを記述したメタデータを含むパブリックコンテンツ情報をパブリックコンテンツ記憶部32に記憶されているパブリックコンテンツ情報から抽出するパブリックコンテンツ情報抽出手段としてのパブリックコンテンツ抽出部34と、このパブリックコンテンツ抽出部34で抽出したパブリックコンテンツ情報のメタデータを検索用メタデータとして個人コンテンツ情報記憶部35にが記憶された個人コンテンツ情報と関連付けしてハードディスク装置等に記憶するメタデータ生成手段としてのメタデータ生成部36とを設けるようにしてもよい。
【0064】
さらに、上記第1及び第2の実施形態においては、デジタル又はアナログ放送電波を受信部11で受信する場合について説明したが、これに限定されるものではなく、光ファイバー等を利用したCATV等で配信される放送情報や、インターネット等のネットワークを介して配信される放送情報や、ビデオオンデマンドで提供されるビデオ等を収集するようにしてもよく、さらには、インターネット等のネットワークを介して配信される新聞データや、DVD、CD等の記憶媒体に記憶された年間の新聞情報、雑誌情報等をパブリックコンテンツ情報として収集するようにしてもよい。
【0065】
さらにまた、上記第1及び第2の実施形態においては、個人コンテンツ情報作成手段としてデジタルカメラ13を適用した場合について説明したが、これに限定されるものではなく、動画データを撮影するデジタルビデオカメラを適用することもでき、任意の個人コンテンツ情報作成手段を適用することができる。
なおさらに、上記第1及び第2の実施形態においては、1つ情報処理装置PCでパブリックコンテンツ情報収集処理と、メタデータ生成処理とを行う場合について説明したが、これに限定されるものではなく、パブリックコンテンツ情報収集処理と個人コンテンツ情報読込処理及びメタデータ生成処理とを個別の情報処理装置で行い、両者をネットワークで接続して連携させるようにしてもよく、さらにはデジタル放送受信装置でパブリックコンテンツ情報収集処理、個人コンテンツ情報読込処理及びメタデータ生成処理を行うようにしてもよい。
【図面の簡単な説明】
【0066】
【図1】本発明の一実施形態を示すブロック図である。
【図2】中央演算処理装置の機能ブロック図である。
【図3】中央演算処理装置で実行するパブリックコンテンツ情報収集処理手順の一例を示すフローチャートである。
【図4】パブリックコンテンツ情報収集処理でディスプレイに表示する情報収集設定画面を示す説明図である。
【図5】中央演算処理装置で実行する個人コンテンツ情報読込処理手順の一例を示すフローチャートである。
【図6】デジタルカメラのメモリカードの記憶領域を示す説明図である。
【図7】中央演算処理装置で実行するメタデータ生成処理手順の一例を示すフローチャートである。
【図8】パブリックコンテンツ情報に付加されたメタデータを示す説明図である。
【図9】キーワード記憶部に記憶されたキーワード記憶内容を示す説明図である。
【図10】個人コンテンツ情報に付加する検索用メタデータの一例を示す説明図である。
【図11】番組視聴率データを示す説明図である。
【図12】本発明の第2の実施形態におけるパブリックコンテンツ情報収集処理手順の一例を示すフローチャートである。
【図13】本発明の第2の実施形態におけるメタデータ生成処理手順の一例を示すフローチャートである。
【図14】中央演算処理装置の他の機能ブロック図である。
【符号の説明】
【0067】
PC…情報処理装置、1…中央演算処理装置、2…システムバス、3…ROM、4…RAM、5…ハードディスク装置、6…DVDドライブ装置、7…ディスプレイ、8…キーボード、9…マウス、10…ネットワーク接続部、11…デジタル放送受信部、13…デジタルカメラ、15…メモリカードリーダー、20…個人コンテンツ情報読込部、21…個人コンテンツ情報記憶部、22…パブリックコンテンツ収集部、23…パブリックコンテンツ記憶部、24…キーワード抽出部、25…キーワード記憶部、26…メタデータ生成部、27…放送チャンネル設定部、28…パブリックコンテンツ情報種別設定部、29…収集期間設定部、31…パブリックコンテンツ収集部、32…パブリックコンテンツ記憶部、33…キーワード入力部、34…パブリックコンテンツ抽出部、35…個人コンテンツ記憶部、36…メタデータ生成部
【特許請求の範囲】
【請求項1】
個人のコンテンツ情報を作成する個人コンテンツ情報作成手段と、検索用メタデータの作成対象となるパブリックコンテンツ情報を収集するパブリックコンテンツ情報収集手段と、該パブリックコンテンツ情報収集手段で収集したパブリックコンテンツ情報から前記検索用メタデータの基礎となるキーワードを抽出するキーワード抽出手段と、該キーワード抽出手段で抽出したキーワードに基づいて前記個人コンテンツ情報作成手段で作成した個人コンテンツに対する検索用メタデータを生成するメタデータ生成手段とを備えたことを特徴とするメタデータ生成装置。
【請求項2】
前記パブリックコンテンツ情報収集手段は、メタデータを含むパブリックコンテンツ情報を収集するように構成され、前記キーワード抽出手段は、前記パブリックコンテンツ情報収集手段で収集したパブリックコンテンツ情報に含まれるメタデータを解析するメタデータ解析手段と、該メタデータ解析手段の解析結果に基づいて形態素解析してキーワードを抽出する形態素解析手段とを備えたことを特徴とする請求項1に記載のメタデータ生成装置。
【請求項3】
前記パブリックコンテンツ情報収集手段は、音声情報を含むパブリックコンテンツ情報を収集し、前記キーワード抽出手段は、前記音声情報を音声認識してテキストデータを形成する音声認識手段と、該音声認識手段で形成されたテキストデータを形態素解析してキーワードを抽出する形態素解析手段とを有することを特徴とする請求項1に記載のメタデータ生成装置。
【請求項4】
前記キーワード抽出手段は、検索用メタデータの生成対象とするキーワードを記憶するキーワード記憶手段を有し、前記パブリックコンテンツ情報から抽出したキーワードのうち前記キーワード記憶手段に記憶されているキーワードと一致するキーワードを対象キーワードとして選択するように構成されていることを特徴とする請求項1乃至3の何れか1項に記載のメタデータ生成装置。
【請求項5】
前記キーワード記憶手段は、パブリックコンテンツ情報から抽出したキーワードを記憶するように構成されていることを特徴とする請求項4に記載のメタデータ生成装置。
【請求項6】
前記メタデータ生成手段は、前記キーワード抽出手段で抽出したキーワードから所定適合度に基づいて検索用キーワードを選択し、選択した検索用キーワードに基づいて検索用メタデータを生成するように構成されていることを特徴とする請求項1乃至5の何れか1項に記載のメタデータ生成装置。
【請求項7】
前記メタデータ生成手段は、所定適合度として高出現頻度を設定し、出現頻度の高いキーワードを検索用キーワードとして選択するように構成されていることを特徴とする請求項1乃至5の何れか1項に記載のメタデータ生成装置。
【請求項8】
個人のコンテンツ情報を作成する個人コンテンツ情報作成手段と、検索用メタデータの作成対象となるメタデータを含むパブリックコンテンツ情報を収集するパブリックコンテンツ情報収集手段と、キーワードを入力するキーワード入力手段と、該キーワード入力手段で入力したキーワードと一致するキーワードを記述したメタデータを含むパブリックコンテンツ情報を抽出するパブリックコンテンツ情報抽出手段と、該パブリックコンテンツ情報収集手段で抽出したパブリックコンテンツ情報に含まれるメタデータを個人コンテンツ情報の検索用メタデータとして生成するメタデータ生成手段とを備えたことを特徴とするメタデータ生成装置。
【請求項9】
前記コンテンツ情報収集手段は、放送電波、ネットワーク、記憶媒体の少なくとも1つに含まれるコンテンツ情報を収集するように構成されていることを特徴とする請求項1乃至8の何れか1項に記載のメタデータ生成装置。
【請求項1】
個人のコンテンツ情報を作成する個人コンテンツ情報作成手段と、検索用メタデータの作成対象となるパブリックコンテンツ情報を収集するパブリックコンテンツ情報収集手段と、該パブリックコンテンツ情報収集手段で収集したパブリックコンテンツ情報から前記検索用メタデータの基礎となるキーワードを抽出するキーワード抽出手段と、該キーワード抽出手段で抽出したキーワードに基づいて前記個人コンテンツ情報作成手段で作成した個人コンテンツに対する検索用メタデータを生成するメタデータ生成手段とを備えたことを特徴とするメタデータ生成装置。
【請求項2】
前記パブリックコンテンツ情報収集手段は、メタデータを含むパブリックコンテンツ情報を収集するように構成され、前記キーワード抽出手段は、前記パブリックコンテンツ情報収集手段で収集したパブリックコンテンツ情報に含まれるメタデータを解析するメタデータ解析手段と、該メタデータ解析手段の解析結果に基づいて形態素解析してキーワードを抽出する形態素解析手段とを備えたことを特徴とする請求項1に記載のメタデータ生成装置。
【請求項3】
前記パブリックコンテンツ情報収集手段は、音声情報を含むパブリックコンテンツ情報を収集し、前記キーワード抽出手段は、前記音声情報を音声認識してテキストデータを形成する音声認識手段と、該音声認識手段で形成されたテキストデータを形態素解析してキーワードを抽出する形態素解析手段とを有することを特徴とする請求項1に記載のメタデータ生成装置。
【請求項4】
前記キーワード抽出手段は、検索用メタデータの生成対象とするキーワードを記憶するキーワード記憶手段を有し、前記パブリックコンテンツ情報から抽出したキーワードのうち前記キーワード記憶手段に記憶されているキーワードと一致するキーワードを対象キーワードとして選択するように構成されていることを特徴とする請求項1乃至3の何れか1項に記載のメタデータ生成装置。
【請求項5】
前記キーワード記憶手段は、パブリックコンテンツ情報から抽出したキーワードを記憶するように構成されていることを特徴とする請求項4に記載のメタデータ生成装置。
【請求項6】
前記メタデータ生成手段は、前記キーワード抽出手段で抽出したキーワードから所定適合度に基づいて検索用キーワードを選択し、選択した検索用キーワードに基づいて検索用メタデータを生成するように構成されていることを特徴とする請求項1乃至5の何れか1項に記載のメタデータ生成装置。
【請求項7】
前記メタデータ生成手段は、所定適合度として高出現頻度を設定し、出現頻度の高いキーワードを検索用キーワードとして選択するように構成されていることを特徴とする請求項1乃至5の何れか1項に記載のメタデータ生成装置。
【請求項8】
個人のコンテンツ情報を作成する個人コンテンツ情報作成手段と、検索用メタデータの作成対象となるメタデータを含むパブリックコンテンツ情報を収集するパブリックコンテンツ情報収集手段と、キーワードを入力するキーワード入力手段と、該キーワード入力手段で入力したキーワードと一致するキーワードを記述したメタデータを含むパブリックコンテンツ情報を抽出するパブリックコンテンツ情報抽出手段と、該パブリックコンテンツ情報収集手段で抽出したパブリックコンテンツ情報に含まれるメタデータを個人コンテンツ情報の検索用メタデータとして生成するメタデータ生成手段とを備えたことを特徴とするメタデータ生成装置。
【請求項9】
前記コンテンツ情報収集手段は、放送電波、ネットワーク、記憶媒体の少なくとも1つに含まれるコンテンツ情報を収集するように構成されていることを特徴とする請求項1乃至8の何れか1項に記載のメタデータ生成装置。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【公開番号】特開2006−163877(P2006−163877A)
【公開日】平成18年6月22日(2006.6.22)
【国際特許分類】
【出願番号】特願2004−354991(P2004−354991)
【出願日】平成16年12月8日(2004.12.8)
【出願人】(000002369)セイコーエプソン株式会社 (51,324)
【Fターム(参考)】
【公開日】平成18年6月22日(2006.6.22)
【国際特許分類】
【出願日】平成16年12月8日(2004.12.8)
【出願人】(000002369)セイコーエプソン株式会社 (51,324)
【Fターム(参考)】
[ Back to top ]