メタデータ取得・管理方法及び装置及びプログラム
【課題】 ダウンロード時またはダウンロード完了時に内容検索を考慮してファイル名やプロパティ名を自動的に付与する。
【解決手段】 本発明は、Webページに含まれるリンクが示す、ダウンロード可能な取得対象の映像データをユーザに指定させ、取得対象データのファイルを含む、予め該取得対象データと関連付けられた初期メタデータを任意の方法により取得し、取得対象データへのリンクを含むWebページ内の文字列から、該リンクを示す取得対象データに関連する関連文字列を取得し、初期メタデータ及び関連文字列とに基づく情報を追加メタデータとしてメタデータDBに格納する。
【解決手段】 本発明は、Webページに含まれるリンクが示す、ダウンロード可能な取得対象の映像データをユーザに指定させ、取得対象データのファイルを含む、予め該取得対象データと関連付けられた初期メタデータを任意の方法により取得し、取得対象データへのリンクを含むWebページ内の文字列から、該リンクを示す取得対象データに関連する関連文字列を取得し、初期メタデータ及び関連文字列とに基づく情報を追加メタデータとしてメタデータDBに格納する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、メタデータ取得・管理方法及び装置及びプログラムに係り、特に、ネットワーク上のWeb情報中のリンクから、画像データ、映像データ等の各種データをダウンロードする機器及びシステム(例えば、パーソナルコンピュータ)において、メタデータと呼ばれる関連情報をファイルに付与するためのメタデータ取得・管理方法及び装置及びプログラムに関する。
【背景技術】
【0002】
個人が所有するデータの中から、所望のデータを短時間に探したいという要求がある。例えば、録画、コピー、またはダウンロードの手段によって多くの映像データがディスクに保存されている状態において、映像を順次再生して内容を確認し、探す方法ではなく、文字列を入力とした映像データの検索を行い、すばやく所望の映像データに到達したという要求である。
【0003】
この要求に対し、従来技術により以下の検索機能が提供されている。
【0004】
・ファイル名を対象とした検索;
・ファイル取得日時を対象とした検索;
・ファイルのフォーマット(拡張子など)を指定することにより検索;
・ファイルの内部に記述されたプロパティ情報(作成日時、タイトル名、概要等)からの検索;
上記は全て既存のファイル管理アプリケーションの機能によって実現されている。
【0005】
しかしながら、ネットワーク上から取得した映像データについては、一般に以下のような問題がある。
【0006】
・プロパティが記載されていない場合がある;
・ファイル名が数値の羅列や略称となっており、映像の内容を的確に表せない記述となっている場合がある;
・そもそもファイル名に記述できる文字列に文字数等の制限がある;
このため、従来技術が提供する手段を用いて、文字列によって効果的に検索を行うためには、
・映像データを記憶媒体に取得した後、プロパティエディタなどを用いて関連情報を手作業で入力する作業;
・ダウンロード時に、映像データのファイル名を内容に関連するものに書き換える作業;
が必要である。即ち、映像データにかぎらず、予めそのデータに対する内容検索を行うことを考慮してデータのファイル名やプロパティを適切に記述する作業が必要である(例えば、非特許文献1参照)。
【非特許文献1】J. Ryu, Y. Sohn, and M. Kim, “MPEG-7 Metadata. Authoring Tool”, Proc. 10th ACM Int’l Conf. Multimedia, ACM Press, 2002, pp.267-270
【発明の開示】
【発明が解決しようとする課題】
【0007】
本発明は、従来課題となっていたダウンロード時もしくは、ダウンロード完了時に内容検索を考慮してファイル名やプロパティを記述する作業を不要とする、メタデータ取得・管理方法及び装置及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0008】
図1は、本発明の原理を説明するための図である。
【0009】
本発明(請求項1)は、閲覧中のWebページ中のリンクからダウンロードした画像データ、映像データを含む各種データにメタデータと呼ばれる関連情報を付与するメタデータの取得・管理方法であって、
Webページに含まれるリンクが示す、ダウンロード可能な取得対象の映像データをユーザに指定させる取得対象データ指定ステップ(ステップ1)と、
取得対象データのファイルを含む、予め該取得対象データと関連付けられた初期メタデータを任意の方法により取得する初期メタデータ取得ステップ(ステップ2)と、
取得対象データへのリンクを含むWebページ内の文字列から、該リンクを示す取得対象データに関連する関連文字列を取得する関連文字列抽出ステップ(ステップ3)と、
初期メタデータ取得ステップ(ステップ2)により取得した初期メタデータ及び関連文字列抽出ステップ(ステップ3)により取得した関連文字列とに基づく情報を追加メタデータとしてメタデータDBに格納するメタデータDB生成ステップ(ステップ4)と、を行う。
【0010】
また、本発明(請求項2)は、請求項1の関連文字列抽出ステップ(ステップ3)において、
Webページにおける、取得対象データのリンク文字列の位置を基準として、該Webページ内の句読点で区切られた全てのセンテンスに対し、基準位置からの距離に基づくスコアを付与し、
それぞれのセンテンス内に含まれる単語に対して、該単語が含まれていたセンテンスのスコア及び該取得対象データのリンク文字列との比較結果に基づく重み係数を用いてスコアを付与し、該単語に付与されたスコアに基づいて取得する関連語を抽出する。
【0011】
また、本発明(請求項3)は、請求項1のメタデータDB生成ステップにおける、メタデータDBが、ダウンロードされた取得対象データのファイルのファイルパス、ファイル名、初期メタデータ、及び追加メタデータが関連付けられた管理テーブルを有する。
【0012】
本発明(請求項4)は、閲覧中のWebページ中のリンクからダウンロードした画像データ、映像データを含む各種データにメタデータと呼ばれる関連情報を付与するメタデータの取得・管理方法であって、
Webページに含まれるリンクが示す、ダウンロード可能な取得対象の映像データをユーザに指定させる取得対象データ指定ステップと、
取得対象データのファイル名を含む、予め該取得対象データと関連付けられた初期メタデータを任意の方法により取得する初期メタデータ取得ステップと、
取得対象データへのリンクを含むWebページ内文字列から、リンクの示す取得対象データに関する関連文字列を取得する関連文字列抽出ステップと、
初期メタデータ取得ステップにより取得された初期メタデータ及び、関連文字列抽出ステップにより取得された関連文字列とに基づく情報を追加メタデータとしてメタデータDBに格納する追加メタデータ取得ステップと、
初期メタデータ及び追加メタデータに基づき、取得対象データがメタデータDBにダウンロードされた後に検索可能なデータベースを構築するメタデータDB生成ステップと、
追加メタデータ取得ステップにより取得した追加メタデータをメタデータDBに追加し、該メタデータDBを更新するメタデータDB更新ステップと、
ユーザから入力された検索キーに基づいて、メタデータDBを検索する検索ステップと、
ユーザから任意に入力された編集指示に基づいて、メタデータDBを編集するメタデータDB編集ステップと、を行う。
【0013】
図2は、本発明の原理構成図である。
【0014】
本発明(請項5)は、閲覧中のWebページ中のリンクからダウンロードした画像データ、映像データを含む各種データにメタデータと呼ばれる関連情報を付与するメタデータの取得・管理装置であって、
Webページに含まれるリンクが示す、ダウンロード可能な取得対象映像データがユーザによって指定されると、該取得対象データのファイルを含む、予め該取得対象データと関連付けられた初期メタデータを任意の方法により取得する初期メタデータ取得手段と、
取得対象データへのリンクを含むWebページ内の文字列から、該リンクを示す取得対象データに関連する関連文字列を取得する関連文字列抽出手段と、
初期メタデータ取得ステップにより取得した初期メタデータ及び関連文字列抽出ステップにより取得した関連文字列とに基づく情報を追加メタデータとしてメタデータDBに格納するメタデータDB生成手段と、を有する。
【0015】
本発明(請求項6)は、閲覧中のWebページ中のリンクからダウンロードした画像データ、映像データを含む各種データにメタデータと呼ばれる関連情報を付与するメタデータの取得・管理プログラムであって、
Webページに含まれるリンクが示す、ダウンロード可能な映像ファイルを含むデータをユーザに指定させる取得対象データ指定ステップと、
取得対象データのファイルを含む、予め該取得対象データと関連付けられた初期メタデータを任意の方法により取得する初期メタデータ取得ステップと、
取得対象データへのリンクを含むWebページ内の文字列から、該リンクを示す取得対象データに関連する関連文字列を取得する関連文字列抽出ステップと、
初期メタデータ取得ステップにより取得した初期メタデータ及び関連文字列抽出ステップにより取得した関連文字列とに基づく情報を追加メタデータとしてメタデータDBに格納するメタデータDB生成ステップとをコンピュータに実行させるプログラムである。
【発明の効果】
【0016】
本発明では、映像データ等のダウンロード時に自動的に関連情報を取得し、また、映像データ等のファイル名を自動的に変換することで、映像データをネットワーク上から取得する際に、関連情報を周囲のテキストから自動的に取得し、また、ファイル名も自動的に変換される、あるいは、付与すべき関連情報が選択可能な状態で提示される。従って、本発明によって、映像データの内容に関連する文字列を容易にファイルに付与することが可能となる。結果として、映像データの内容に関連するキーワードを入力して映像データを探すことができるようになり、従来より所望の映像データに到達することが容易となる。
【発明を実施するための最良の形態】
【0017】
以下、図面と共に本発明の実施の形態を説明する。
【0018】
最初に以下の説明に用いる用語について説明する。
【0019】
ネットワーク:インターネット、社内ネットワーク等の、物理的なネットワークケーブルもしくは、ワイヤレス通信によって情報環境が接続され、相互に情報伝送が可能となっている環境。
【0020】
映像データ:放送受信装置または、ネットワークを介して記憶媒体へと格納されたテレビ番組等の動画像を含む情報。
【0021】
記憶媒体:映像データを記憶することが可能なあらゆる装置(コンピュータのディスクやメモリ等、あるいは、ハードディスクレコーダ、セットトップボックス等)。
【0022】
ダウンロード:ネットワーク上の記憶媒体から情報を移動または複製する処理。
【0023】
初期メタデータ:ネットワーク上の映像データをユーザが取得しようとする時点で、ネットワーク上においてネットワーク上の映像データと共に存在し、関連付けられている情報(例えば、ファイル名、プロパティ)か、または映像データと共には存在しないが、関連付けすべき映像データを明確に指定する情報(例えば、電子番組表)。
【0024】
ここで、初期メタデータの例を挙げる。
【0025】
・映像データがどこかのHP(ホームページ)に貼り付けられており、ユーザがダウンロードする対象物を指定する際に画面上に表示されているアイコンが表す実体のファイル名;
・映像データのダウンロード時に“名前を付けて保存”のダイアログが立ち上がったときにデフォルトで付けられているファイル名・プロパティ;
・HP上に張り付いている映像データをユーザが右クリックし、“プロパティ”のダイアログボックスが立ち上がったときに表示される映像データの名前、製作者、フォーマット情報、概要等;
・HP上に電子番組表のリンクが貼り付けられているときに、リンクをクリックすることにより電子番組表がコンピュータ上に保存されると同時に、録画用プログラムが起動し、録画予約日時が自動的にセットされ、その後、予約録画された映像ファイルがダウンロードされた電子番組表と関連付けられる仕組みとなっている場合の当該電子番組表;
・特にユーザが意識して関連情報を追記することがない状態で、映像に関連して付与されている情報;
追加メタデータ:本発明で述べる手法を用いて映像データに付与する関連情報。
【0026】
メタデータ:初期メタデータと追加メタデータの総称。
【0027】
ブラウザ:HP等に代表されるネットワーク上の情報をユーザが閲覧する手段を提供するプログラム。
【0028】
Web情報:HTML等の言語で記述され、ブラウザで閲覧可能なネットワーク上の情報。
【0029】
Webページ:Web情報の全部または一部であって、ブラウザの画面上に表示されたもの。
【0030】
リンク:Webページ内のオブジェクト(テキスト、画像等)が、特定のWeb情報(例えば、Webページ内のテキストまたはオブジェクト、動画像、静止画像、別のWebページ内のオブジェクト等)に関連付けられているもの。
以下の説明では、Webページ上のリンクから映像ファイルをパーソナルコンピュータ上にダウンロードする場合の例を説明する。
【0031】
[第1の実施の形態]
本実施の形態では、請求項文中における「取扱映像データ」に相当するものを「映像データ」と記載する。
【0032】
図3は、本発明の第1の実施の形態における装置構成を示す。
【0033】
同図に示すメタデータ取得装置は、映像データ入出力部20、記憶部30、入出力部40、処理部100から構成される。
【0034】
映像データ入出力部20は、ネットワークに接続されている。
【0035】
記憶部30は、パーソナルコンピュータ(PC)内にあるディスクやメモリ等の記憶媒体であり、映像データ記憶部31、関連情報記憶部32、メタデータDB33を有する。
【0036】
入出力部40は、PC等のオペレータが利用するキーボードやマウス等の入力機能と、ディスプレイ等の出力機能を有する。
【0037】
処理部100は、情報取得部110、初期メタデータ取得部120、関連文字列抽出部130、取得情報提示部140、メタデータDB生成部150、検索部160から構成される。
【0038】
上記の構成における動作を以下に説明する。
【0039】
図4は、本発明の第1の実施の形態における動作の概要を示すフローチャートである。
【0040】
ステップ11) 映像指定ステップ:
オペレータが入出力部40からブラウザ等で閲覧している情報の中から、ダウンロードの対象となる映像データを指定する。具体的には、マウスカーソルで指示し、クリックすることにより、文字列及びリンク内に含まれる情報を取得する。取得された情報(映像ファイル名)は、メモリ(図示せず)に格納される。
【0041】
ステップ12) 初期メタデータ取得ステップ:
初期メタデータ取得部120において、ステップ11で指定された映像データファイルの初期メタデータを取得し、メモリ(図示せず)に格納する。初期メタデータとしては、リンクのアドレス、タイトル、作成者、作成日時、ファイルサイズ、概要等がある。なお、初期メタデータの取得方法については特に限定しない。
【0042】
ステップ13) 関連文字列抽出ステップ:
次に、関連文字列抽出部130において、以下の処理を行う。
【0043】
図5は、本発明の第1の実施の形態における関連文字列抽出ステップのフローチャートである。
【0044】
ステップ131) 関連文字列抽出部130は、ステップ11で指定された映像データのリンク文字列が含まれるWebページを読み込み、BODYの文字列及びリンク文字列中のAlt属性タグに指定された文字列を抽出する。
【0045】
ステップ132) 関連文字列抽出部130は、ステップ131で抽出された文字列を句読点で先頭から順に複数の文字列に分割する。ここで、句読点が1つ以上あれば、この時点で複数の文字列が抽出されたことになる。また、文字列のうちの少なくとも1つは、リンク文字列を等しいか、または、リンク文字列を含んでいることになる。分割されたそれぞれの文字列に対し、ページの先頭からリンク文字列を含む文字列Xに至るまでの距離(文字数)に応じた数(m)を付与し、文字列Xとmからなる一組の形式として出力する。
【0046】
ステップ133) 関連文字列抽出部130は、ステップ131で得られる文字列及びステップ132で得られる位置情報に基づいて、リンク先のファイルの関連語を取得し、メモリ(図示せず)に格納する。
【0047】
ステップ14) 取得情報提示ステップ:
取得情報提示部140において、以下の処理を行う。
【0048】
図5は、本発明の第1の実施の形態における取得情報提示ステップのフローチャートである。
【0049】
ステップ141) 取得情報提示部140は、ステップ12で取得し、初期メタデータ取得部120のメモリ(図示せず)から初期メタデータを読み出して、入出力部40のディスプレイに表示する。
【0050】
ステップ142) 取得情報提示部140は、ステップ13で取得し、関連文字列抽出部130のメモリ(図示せず)から文字列を読み出して入出力部40のディスプレイに表示する。
【0051】
ステップ143) 取得情報提示部140は、ステップ142でディスプレイに表示した複数の文字列(初期メタデータ)からユーザにファイル名を選択させ、取得する。
【0052】
ステップ144) 取得情報提示部140は、ステップ142でディスプレイに表示された複数の文字列(関連情報)からユーザに関連情報を選択させ、取得する。
【0053】
上記のようにして提示された画面例を図7に示す。
【0054】
ステップ15) 情報取得ステップ:
情報取得部110は、以下の処理を行う。
【0055】
図8は、本発明の第1の実施の形態における情報取得ステップのフローチャートである。
【0056】
ステップ151) ステップ11で指定され、メモリ(図示せず)に格納されている映像ファイル名に基づいて、映像データファイルをダウンロードし、記憶部30の映像データ記憶部31に保存する。
【0057】
ステップ152) ステップ143及びステップ144でそれぞれ指定されたファイル名及び関連情報を関連情報記憶部32に保存する。
【0058】
ステップ16) メタデータDB生成ステップ:
メタデータDB生成部150は、以下の処理を行う。
【0059】
図9は、本発明の第1の実施の形態におけるメタデータ生成ステップのフローチャートである。
【0060】
ステップ161) メタデータDB生成部150は、メタデータDBを記憶部30上に作成する。メタデータDB33のカラムは、ファイル名、ファイルパス、初期メタデータ、関連情報からなる。ファイル名、関連情報については、関連情報記憶部32から読み出して設定する。初期メタデータは、ステップ12で取得され、初期メタデータ取得部120のメモリ(図示せず)に格納されているものを読み出して設定する。
【0061】
ステップ162) ステップ161で作成されたメタデータDB33に、ステップ151で映像データ記憶部31に保存した映像データのファイルパス、及びステップ152で関連情報記憶部32に保存した情報をメタデータDB33に追加する。
【0062】
ステップ17) 検索ステップ:
検索部160は、以下の処理を行う。
【0063】
図10は、本発明の第1の実施の形態における検索ステップのフローチャートである。
【0064】
ステップ171) 検索部160は、入出力部40からユーザにより指定された検索キーを取得する。
【0065】
ステップ172) ステップ171で得られた検索キーを用いて、ステップ16で生成されたメタデータDB33を検索する。検索結果は、
a)初期メタデータに合致するものがある。
【0066】
b)初期メタデータに合致するものがなく、関連情報にのみ合致するものである。
の2種類に分けて出力する。
【0067】
ステップ173) ステップ172で出力された検索結果を1つの画面に集約して、入出力部40のディスプレイに表示する。
【0068】
次に、上記のステップ133の関連語取得ステップの処理について詳細に説明する。
【0069】
図11は、本発明の第1の実施の形態における関連語取得ステップの詳細なフローチャートである。
【0070】
ステップ1331) 関連語情報抽出部130は、ステップ12で取得した初期メタデータをメモリ(図示せず)から読み込む。
【0071】
ステップ1332) 関連語情報抽出部130は、ステップ132で出力された[文字列X、m]の複数の組を読み込み、それぞれの文字列に対する位置スコアを計算する。文字列X=nの文字列の有する位置スコアSs(n)は、下記の式で与えられる。
【0072】
Ss(n)=│m−n│+1 (但し、n=1,2,…,N)
上記のスコアは、文字列Xと近い位置に存在する文字列(N個のいずれか)ほど、評価値スコアSs(n)が小さくなり、1に近づく。
【0073】
ステップ1333) 関連語情報抽出部130は、ステップ1332で分割された文字列をそれぞれ品詞分解し、名詞及び未知語を抽出する。
【0074】
ステップ1334) 関連語情報抽出部130は、ステップ1333で抽出された名詞に対し、重要度を計算する。なお、重要度の計算方法については、図12において詳述する。
【0075】
ステップ1335) 関連語情報抽出部130は、ステップ1334で計算された重要度に基づいてステップ1332で抽出された文字列をソートしてメモリ(図示せず)に格納する。
【0076】
次に、上記のステップ1334の重要度の計算について詳細に説明する。
【0077】
図12は、本発明の第1の実施の形態における重要度計算のフローチャートである。
【0078】
ステップ13341) ステップ1333で抽出された単語を入力する。
【0079】
ステップ13342) ステップ13341で入力された単語に対し、その単語の含まれていた文字列の位置スコアをステップ1332の結果より入力する。
【0080】
ステップ13343) 下記の式に基づいて、単語wのスコアS(w)を評価する。単語スコアは、その単語を含む文字列の位置スコアを分母として、重みdをかけたものであり、重みdは、例えば、その単語がリンク文字列中の単語に含まれていればd=10とし、そうでない場合はd=1とする(重みdは可変である)。
【0081】
【数1】
但し、S(w)は単語wに与えられるスコア、dは1以上の重み係数、Ss(n)は単語wが含まれていた文字列X=nの位置スコア、Wはステップ132で取得したAlt属性タグに指定された文字列を表す。初期値としてd=10とする。なお、重み係数dは変更可能な数値である。
【0082】
ステップ13344) ステップ13343で得られたスコアを出力する。
【0083】
[第2の実施の形態]
図13は、本発明の第2の実施の形態における装置構成を示す。
【0084】
同図に示す構成は、図3の取得情報提示部140を含まない構成であり、その他の構成は図3と同様である。
【0085】
図14は、本発明の第2の実施の形態における動作の概要を示すフローチャートである。同図に示す動作は、図4に示すフローチャートのステップ14の処理がなく、ステップ15の処理のみが異なる。
【0086】
当該ステップ15は、映像データファイル保存ステップ(ステップ151)と、関連情報保存ステップ(152)からなる。
【0087】
ステップ151において、情報取得部10は、ステップ11で、ユーザによって入出力部40から指定され、メモリ(図示せず)に格納されている映像ファイル名に基づいて、映像データファイルをダウンロードし、映像データ記憶部31に格納する。
【0088】
ステップ152では、情報取得部10は、ステップ12で得られ、初期メタデータ取得部120のメモリ(図示せず)に保存されている初期メタデータを入力し、初期メタデータのうちタイトルを示すタグに情報があれば、ファイル名をタイトルを示すタグ内の情報に変更する。また、ステップ1335において、関連文字列抽出部130において、スコアが最大となる文字列を関連情報として、関連情報記憶部32に保存する。
【0089】
[第3の実施の形態]
図15は、本発明の第3の実施の形態における装置構成を示す。
【0090】
同図に示す構成は、第1の実施の形態における図3の構成にメタデータDB編集部170が追加された構成である。
【0091】
動作においても以下の動作以外は第1の実施の形態と同様である。
【0092】
図16は、本発明の第3の実施の形態におけるメタデータDB編集ステップのフローチャートである。
【0093】
当該メタデータDB編集ステップ(ステップ18)は、メタデータDB編集部170において、ステップ16で生成されたメタデータDB32の内容を、入出力部40からユーザから入力された変更指示に基づいてエディタ等を介して、変更する。
【0094】
なお、本発明は、上記に示した装置以外の機器(例えば、ハードディスクレコーダ)で実施することもできる。
【0095】
また、本発明では、メタデータを取得する対象として、Web情報中の映像データを主たる対象とした実施の形態を記載しているが、メタデータを自動的に取得し、管理するという方法において、対象は映像データに限定されることなく、画像や音声であってもよい。
【0096】
また、上記の実施の形態では、Webページ上のリンクから映像データをパーソナルコンピュータ上にダウンロードする形態について記載したが、装置は個人端末に限定されない。例えば、映像配信用の大規模サーバ上で行うことも可能である。
【0097】
なお、上記の装置の動作をプログラムとして構築し、メタデータ取得・管理装置として利用されるコンピュータに実行させる、または、ネットワークを介して流通させることが可能である。
【0098】
なお、本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において種々変更・応用が可能である。
【産業上の利用可能性】
【0099】
本発明は、Webページ上のリンクから映像データをパーソナルコンピュータ上にダウンロードする、または、映像配信用の大規模サーバから映像データをダウンロードする技術に適用可能である。また、ダウンロードする機器として、パーソナルコンピュータ以外の例えば、ハードディスクレコーダ等に適用することができる。
【図面の簡単な説明】
【0100】
【図1】本発明の原理を説明するための図である。
【図2】本発明の原理構成図である。
【図3】本発明の第1の実施の形態における装置構成図である。
【図4】本発明の第1の実施の形態における動作の概要を示すフローチャートである。
【図5】本発明の第1の実施の形態における関連文字列抽出ステップのフローチャートである。
【図6】本発明の第1の実施の形態における取得情報提示ステップのフローチャートである。
【図7】本発明の第1の実施の形態における取得情報提示ステップの処理により表示された画面例である。
【図8】本発明の第1の実施の形態における情報取得ステップのフローチャートである。
【図9】本発明の第1の実施の形態におけるメタデータDB生成ステップのフローチャートである。
【図10】本発明の第1の実施の形態における検索ステップのフローチャートである。
【図11】本発明の第1の実施の形態における関連語取得ステップの詳細なフローチャートである。
【図12】本発明の第1の実施の形態における重要度計算のフローチャートである。
【図13】本発明の第2の実施の形態における装置構成図である。
【図14】本発明の第2の実施の形態における動作の概要のフローチャートである。
【図15】本発明の第3の実施の形態における装置構成図である。
【図16】本発明の第3の実施の形態における動作の概要のフローチャートである。
【符号の説明】
【0101】
20 映像データ入出力部
30 記憶部
31 映像データ記憶部
33 関連情報記憶部
33 メタデータDB
40 入出力部
100 処理部
110 情報取得部
120 初期メタデータ取得手段
130 関連文字列抽出手段、関連文字列抽出部
140 取得情報提示部
150 メタデータDB生成手段、メタデータDB製絵師部
160 検索部
170 メタデータDB編集部
【技術分野】
【0001】
本発明は、メタデータ取得・管理方法及び装置及びプログラムに係り、特に、ネットワーク上のWeb情報中のリンクから、画像データ、映像データ等の各種データをダウンロードする機器及びシステム(例えば、パーソナルコンピュータ)において、メタデータと呼ばれる関連情報をファイルに付与するためのメタデータ取得・管理方法及び装置及びプログラムに関する。
【背景技術】
【0002】
個人が所有するデータの中から、所望のデータを短時間に探したいという要求がある。例えば、録画、コピー、またはダウンロードの手段によって多くの映像データがディスクに保存されている状態において、映像を順次再生して内容を確認し、探す方法ではなく、文字列を入力とした映像データの検索を行い、すばやく所望の映像データに到達したという要求である。
【0003】
この要求に対し、従来技術により以下の検索機能が提供されている。
【0004】
・ファイル名を対象とした検索;
・ファイル取得日時を対象とした検索;
・ファイルのフォーマット(拡張子など)を指定することにより検索;
・ファイルの内部に記述されたプロパティ情報(作成日時、タイトル名、概要等)からの検索;
上記は全て既存のファイル管理アプリケーションの機能によって実現されている。
【0005】
しかしながら、ネットワーク上から取得した映像データについては、一般に以下のような問題がある。
【0006】
・プロパティが記載されていない場合がある;
・ファイル名が数値の羅列や略称となっており、映像の内容を的確に表せない記述となっている場合がある;
・そもそもファイル名に記述できる文字列に文字数等の制限がある;
このため、従来技術が提供する手段を用いて、文字列によって効果的に検索を行うためには、
・映像データを記憶媒体に取得した後、プロパティエディタなどを用いて関連情報を手作業で入力する作業;
・ダウンロード時に、映像データのファイル名を内容に関連するものに書き換える作業;
が必要である。即ち、映像データにかぎらず、予めそのデータに対する内容検索を行うことを考慮してデータのファイル名やプロパティを適切に記述する作業が必要である(例えば、非特許文献1参照)。
【非特許文献1】J. Ryu, Y. Sohn, and M. Kim, “MPEG-7 Metadata. Authoring Tool”, Proc. 10th ACM Int’l Conf. Multimedia, ACM Press, 2002, pp.267-270
【発明の開示】
【発明が解決しようとする課題】
【0007】
本発明は、従来課題となっていたダウンロード時もしくは、ダウンロード完了時に内容検索を考慮してファイル名やプロパティを記述する作業を不要とする、メタデータ取得・管理方法及び装置及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0008】
図1は、本発明の原理を説明するための図である。
【0009】
本発明(請求項1)は、閲覧中のWebページ中のリンクからダウンロードした画像データ、映像データを含む各種データにメタデータと呼ばれる関連情報を付与するメタデータの取得・管理方法であって、
Webページに含まれるリンクが示す、ダウンロード可能な取得対象の映像データをユーザに指定させる取得対象データ指定ステップ(ステップ1)と、
取得対象データのファイルを含む、予め該取得対象データと関連付けられた初期メタデータを任意の方法により取得する初期メタデータ取得ステップ(ステップ2)と、
取得対象データへのリンクを含むWebページ内の文字列から、該リンクを示す取得対象データに関連する関連文字列を取得する関連文字列抽出ステップ(ステップ3)と、
初期メタデータ取得ステップ(ステップ2)により取得した初期メタデータ及び関連文字列抽出ステップ(ステップ3)により取得した関連文字列とに基づく情報を追加メタデータとしてメタデータDBに格納するメタデータDB生成ステップ(ステップ4)と、を行う。
【0010】
また、本発明(請求項2)は、請求項1の関連文字列抽出ステップ(ステップ3)において、
Webページにおける、取得対象データのリンク文字列の位置を基準として、該Webページ内の句読点で区切られた全てのセンテンスに対し、基準位置からの距離に基づくスコアを付与し、
それぞれのセンテンス内に含まれる単語に対して、該単語が含まれていたセンテンスのスコア及び該取得対象データのリンク文字列との比較結果に基づく重み係数を用いてスコアを付与し、該単語に付与されたスコアに基づいて取得する関連語を抽出する。
【0011】
また、本発明(請求項3)は、請求項1のメタデータDB生成ステップにおける、メタデータDBが、ダウンロードされた取得対象データのファイルのファイルパス、ファイル名、初期メタデータ、及び追加メタデータが関連付けられた管理テーブルを有する。
【0012】
本発明(請求項4)は、閲覧中のWebページ中のリンクからダウンロードした画像データ、映像データを含む各種データにメタデータと呼ばれる関連情報を付与するメタデータの取得・管理方法であって、
Webページに含まれるリンクが示す、ダウンロード可能な取得対象の映像データをユーザに指定させる取得対象データ指定ステップと、
取得対象データのファイル名を含む、予め該取得対象データと関連付けられた初期メタデータを任意の方法により取得する初期メタデータ取得ステップと、
取得対象データへのリンクを含むWebページ内文字列から、リンクの示す取得対象データに関する関連文字列を取得する関連文字列抽出ステップと、
初期メタデータ取得ステップにより取得された初期メタデータ及び、関連文字列抽出ステップにより取得された関連文字列とに基づく情報を追加メタデータとしてメタデータDBに格納する追加メタデータ取得ステップと、
初期メタデータ及び追加メタデータに基づき、取得対象データがメタデータDBにダウンロードされた後に検索可能なデータベースを構築するメタデータDB生成ステップと、
追加メタデータ取得ステップにより取得した追加メタデータをメタデータDBに追加し、該メタデータDBを更新するメタデータDB更新ステップと、
ユーザから入力された検索キーに基づいて、メタデータDBを検索する検索ステップと、
ユーザから任意に入力された編集指示に基づいて、メタデータDBを編集するメタデータDB編集ステップと、を行う。
【0013】
図2は、本発明の原理構成図である。
【0014】
本発明(請項5)は、閲覧中のWebページ中のリンクからダウンロードした画像データ、映像データを含む各種データにメタデータと呼ばれる関連情報を付与するメタデータの取得・管理装置であって、
Webページに含まれるリンクが示す、ダウンロード可能な取得対象映像データがユーザによって指定されると、該取得対象データのファイルを含む、予め該取得対象データと関連付けられた初期メタデータを任意の方法により取得する初期メタデータ取得手段と、
取得対象データへのリンクを含むWebページ内の文字列から、該リンクを示す取得対象データに関連する関連文字列を取得する関連文字列抽出手段と、
初期メタデータ取得ステップにより取得した初期メタデータ及び関連文字列抽出ステップにより取得した関連文字列とに基づく情報を追加メタデータとしてメタデータDBに格納するメタデータDB生成手段と、を有する。
【0015】
本発明(請求項6)は、閲覧中のWebページ中のリンクからダウンロードした画像データ、映像データを含む各種データにメタデータと呼ばれる関連情報を付与するメタデータの取得・管理プログラムであって、
Webページに含まれるリンクが示す、ダウンロード可能な映像ファイルを含むデータをユーザに指定させる取得対象データ指定ステップと、
取得対象データのファイルを含む、予め該取得対象データと関連付けられた初期メタデータを任意の方法により取得する初期メタデータ取得ステップと、
取得対象データへのリンクを含むWebページ内の文字列から、該リンクを示す取得対象データに関連する関連文字列を取得する関連文字列抽出ステップと、
初期メタデータ取得ステップにより取得した初期メタデータ及び関連文字列抽出ステップにより取得した関連文字列とに基づく情報を追加メタデータとしてメタデータDBに格納するメタデータDB生成ステップとをコンピュータに実行させるプログラムである。
【発明の効果】
【0016】
本発明では、映像データ等のダウンロード時に自動的に関連情報を取得し、また、映像データ等のファイル名を自動的に変換することで、映像データをネットワーク上から取得する際に、関連情報を周囲のテキストから自動的に取得し、また、ファイル名も自動的に変換される、あるいは、付与すべき関連情報が選択可能な状態で提示される。従って、本発明によって、映像データの内容に関連する文字列を容易にファイルに付与することが可能となる。結果として、映像データの内容に関連するキーワードを入力して映像データを探すことができるようになり、従来より所望の映像データに到達することが容易となる。
【発明を実施するための最良の形態】
【0017】
以下、図面と共に本発明の実施の形態を説明する。
【0018】
最初に以下の説明に用いる用語について説明する。
【0019】
ネットワーク:インターネット、社内ネットワーク等の、物理的なネットワークケーブルもしくは、ワイヤレス通信によって情報環境が接続され、相互に情報伝送が可能となっている環境。
【0020】
映像データ:放送受信装置または、ネットワークを介して記憶媒体へと格納されたテレビ番組等の動画像を含む情報。
【0021】
記憶媒体:映像データを記憶することが可能なあらゆる装置(コンピュータのディスクやメモリ等、あるいは、ハードディスクレコーダ、セットトップボックス等)。
【0022】
ダウンロード:ネットワーク上の記憶媒体から情報を移動または複製する処理。
【0023】
初期メタデータ:ネットワーク上の映像データをユーザが取得しようとする時点で、ネットワーク上においてネットワーク上の映像データと共に存在し、関連付けられている情報(例えば、ファイル名、プロパティ)か、または映像データと共には存在しないが、関連付けすべき映像データを明確に指定する情報(例えば、電子番組表)。
【0024】
ここで、初期メタデータの例を挙げる。
【0025】
・映像データがどこかのHP(ホームページ)に貼り付けられており、ユーザがダウンロードする対象物を指定する際に画面上に表示されているアイコンが表す実体のファイル名;
・映像データのダウンロード時に“名前を付けて保存”のダイアログが立ち上がったときにデフォルトで付けられているファイル名・プロパティ;
・HP上に張り付いている映像データをユーザが右クリックし、“プロパティ”のダイアログボックスが立ち上がったときに表示される映像データの名前、製作者、フォーマット情報、概要等;
・HP上に電子番組表のリンクが貼り付けられているときに、リンクをクリックすることにより電子番組表がコンピュータ上に保存されると同時に、録画用プログラムが起動し、録画予約日時が自動的にセットされ、その後、予約録画された映像ファイルがダウンロードされた電子番組表と関連付けられる仕組みとなっている場合の当該電子番組表;
・特にユーザが意識して関連情報を追記することがない状態で、映像に関連して付与されている情報;
追加メタデータ:本発明で述べる手法を用いて映像データに付与する関連情報。
【0026】
メタデータ:初期メタデータと追加メタデータの総称。
【0027】
ブラウザ:HP等に代表されるネットワーク上の情報をユーザが閲覧する手段を提供するプログラム。
【0028】
Web情報:HTML等の言語で記述され、ブラウザで閲覧可能なネットワーク上の情報。
【0029】
Webページ:Web情報の全部または一部であって、ブラウザの画面上に表示されたもの。
【0030】
リンク:Webページ内のオブジェクト(テキスト、画像等)が、特定のWeb情報(例えば、Webページ内のテキストまたはオブジェクト、動画像、静止画像、別のWebページ内のオブジェクト等)に関連付けられているもの。
以下の説明では、Webページ上のリンクから映像ファイルをパーソナルコンピュータ上にダウンロードする場合の例を説明する。
【0031】
[第1の実施の形態]
本実施の形態では、請求項文中における「取扱映像データ」に相当するものを「映像データ」と記載する。
【0032】
図3は、本発明の第1の実施の形態における装置構成を示す。
【0033】
同図に示すメタデータ取得装置は、映像データ入出力部20、記憶部30、入出力部40、処理部100から構成される。
【0034】
映像データ入出力部20は、ネットワークに接続されている。
【0035】
記憶部30は、パーソナルコンピュータ(PC)内にあるディスクやメモリ等の記憶媒体であり、映像データ記憶部31、関連情報記憶部32、メタデータDB33を有する。
【0036】
入出力部40は、PC等のオペレータが利用するキーボードやマウス等の入力機能と、ディスプレイ等の出力機能を有する。
【0037】
処理部100は、情報取得部110、初期メタデータ取得部120、関連文字列抽出部130、取得情報提示部140、メタデータDB生成部150、検索部160から構成される。
【0038】
上記の構成における動作を以下に説明する。
【0039】
図4は、本発明の第1の実施の形態における動作の概要を示すフローチャートである。
【0040】
ステップ11) 映像指定ステップ:
オペレータが入出力部40からブラウザ等で閲覧している情報の中から、ダウンロードの対象となる映像データを指定する。具体的には、マウスカーソルで指示し、クリックすることにより、文字列及びリンク内に含まれる情報を取得する。取得された情報(映像ファイル名)は、メモリ(図示せず)に格納される。
【0041】
ステップ12) 初期メタデータ取得ステップ:
初期メタデータ取得部120において、ステップ11で指定された映像データファイルの初期メタデータを取得し、メモリ(図示せず)に格納する。初期メタデータとしては、リンクのアドレス、タイトル、作成者、作成日時、ファイルサイズ、概要等がある。なお、初期メタデータの取得方法については特に限定しない。
【0042】
ステップ13) 関連文字列抽出ステップ:
次に、関連文字列抽出部130において、以下の処理を行う。
【0043】
図5は、本発明の第1の実施の形態における関連文字列抽出ステップのフローチャートである。
【0044】
ステップ131) 関連文字列抽出部130は、ステップ11で指定された映像データのリンク文字列が含まれるWebページを読み込み、BODYの文字列及びリンク文字列中のAlt属性タグに指定された文字列を抽出する。
【0045】
ステップ132) 関連文字列抽出部130は、ステップ131で抽出された文字列を句読点で先頭から順に複数の文字列に分割する。ここで、句読点が1つ以上あれば、この時点で複数の文字列が抽出されたことになる。また、文字列のうちの少なくとも1つは、リンク文字列を等しいか、または、リンク文字列を含んでいることになる。分割されたそれぞれの文字列に対し、ページの先頭からリンク文字列を含む文字列Xに至るまでの距離(文字数)に応じた数(m)を付与し、文字列Xとmからなる一組の形式として出力する。
【0046】
ステップ133) 関連文字列抽出部130は、ステップ131で得られる文字列及びステップ132で得られる位置情報に基づいて、リンク先のファイルの関連語を取得し、メモリ(図示せず)に格納する。
【0047】
ステップ14) 取得情報提示ステップ:
取得情報提示部140において、以下の処理を行う。
【0048】
図5は、本発明の第1の実施の形態における取得情報提示ステップのフローチャートである。
【0049】
ステップ141) 取得情報提示部140は、ステップ12で取得し、初期メタデータ取得部120のメモリ(図示せず)から初期メタデータを読み出して、入出力部40のディスプレイに表示する。
【0050】
ステップ142) 取得情報提示部140は、ステップ13で取得し、関連文字列抽出部130のメモリ(図示せず)から文字列を読み出して入出力部40のディスプレイに表示する。
【0051】
ステップ143) 取得情報提示部140は、ステップ142でディスプレイに表示した複数の文字列(初期メタデータ)からユーザにファイル名を選択させ、取得する。
【0052】
ステップ144) 取得情報提示部140は、ステップ142でディスプレイに表示された複数の文字列(関連情報)からユーザに関連情報を選択させ、取得する。
【0053】
上記のようにして提示された画面例を図7に示す。
【0054】
ステップ15) 情報取得ステップ:
情報取得部110は、以下の処理を行う。
【0055】
図8は、本発明の第1の実施の形態における情報取得ステップのフローチャートである。
【0056】
ステップ151) ステップ11で指定され、メモリ(図示せず)に格納されている映像ファイル名に基づいて、映像データファイルをダウンロードし、記憶部30の映像データ記憶部31に保存する。
【0057】
ステップ152) ステップ143及びステップ144でそれぞれ指定されたファイル名及び関連情報を関連情報記憶部32に保存する。
【0058】
ステップ16) メタデータDB生成ステップ:
メタデータDB生成部150は、以下の処理を行う。
【0059】
図9は、本発明の第1の実施の形態におけるメタデータ生成ステップのフローチャートである。
【0060】
ステップ161) メタデータDB生成部150は、メタデータDBを記憶部30上に作成する。メタデータDB33のカラムは、ファイル名、ファイルパス、初期メタデータ、関連情報からなる。ファイル名、関連情報については、関連情報記憶部32から読み出して設定する。初期メタデータは、ステップ12で取得され、初期メタデータ取得部120のメモリ(図示せず)に格納されているものを読み出して設定する。
【0061】
ステップ162) ステップ161で作成されたメタデータDB33に、ステップ151で映像データ記憶部31に保存した映像データのファイルパス、及びステップ152で関連情報記憶部32に保存した情報をメタデータDB33に追加する。
【0062】
ステップ17) 検索ステップ:
検索部160は、以下の処理を行う。
【0063】
図10は、本発明の第1の実施の形態における検索ステップのフローチャートである。
【0064】
ステップ171) 検索部160は、入出力部40からユーザにより指定された検索キーを取得する。
【0065】
ステップ172) ステップ171で得られた検索キーを用いて、ステップ16で生成されたメタデータDB33を検索する。検索結果は、
a)初期メタデータに合致するものがある。
【0066】
b)初期メタデータに合致するものがなく、関連情報にのみ合致するものである。
の2種類に分けて出力する。
【0067】
ステップ173) ステップ172で出力された検索結果を1つの画面に集約して、入出力部40のディスプレイに表示する。
【0068】
次に、上記のステップ133の関連語取得ステップの処理について詳細に説明する。
【0069】
図11は、本発明の第1の実施の形態における関連語取得ステップの詳細なフローチャートである。
【0070】
ステップ1331) 関連語情報抽出部130は、ステップ12で取得した初期メタデータをメモリ(図示せず)から読み込む。
【0071】
ステップ1332) 関連語情報抽出部130は、ステップ132で出力された[文字列X、m]の複数の組を読み込み、それぞれの文字列に対する位置スコアを計算する。文字列X=nの文字列の有する位置スコアSs(n)は、下記の式で与えられる。
【0072】
Ss(n)=│m−n│+1 (但し、n=1,2,…,N)
上記のスコアは、文字列Xと近い位置に存在する文字列(N個のいずれか)ほど、評価値スコアSs(n)が小さくなり、1に近づく。
【0073】
ステップ1333) 関連語情報抽出部130は、ステップ1332で分割された文字列をそれぞれ品詞分解し、名詞及び未知語を抽出する。
【0074】
ステップ1334) 関連語情報抽出部130は、ステップ1333で抽出された名詞に対し、重要度を計算する。なお、重要度の計算方法については、図12において詳述する。
【0075】
ステップ1335) 関連語情報抽出部130は、ステップ1334で計算された重要度に基づいてステップ1332で抽出された文字列をソートしてメモリ(図示せず)に格納する。
【0076】
次に、上記のステップ1334の重要度の計算について詳細に説明する。
【0077】
図12は、本発明の第1の実施の形態における重要度計算のフローチャートである。
【0078】
ステップ13341) ステップ1333で抽出された単語を入力する。
【0079】
ステップ13342) ステップ13341で入力された単語に対し、その単語の含まれていた文字列の位置スコアをステップ1332の結果より入力する。
【0080】
ステップ13343) 下記の式に基づいて、単語wのスコアS(w)を評価する。単語スコアは、その単語を含む文字列の位置スコアを分母として、重みdをかけたものであり、重みdは、例えば、その単語がリンク文字列中の単語に含まれていればd=10とし、そうでない場合はd=1とする(重みdは可変である)。
【0081】
【数1】
但し、S(w)は単語wに与えられるスコア、dは1以上の重み係数、Ss(n)は単語wが含まれていた文字列X=nの位置スコア、Wはステップ132で取得したAlt属性タグに指定された文字列を表す。初期値としてd=10とする。なお、重み係数dは変更可能な数値である。
【0082】
ステップ13344) ステップ13343で得られたスコアを出力する。
【0083】
[第2の実施の形態]
図13は、本発明の第2の実施の形態における装置構成を示す。
【0084】
同図に示す構成は、図3の取得情報提示部140を含まない構成であり、その他の構成は図3と同様である。
【0085】
図14は、本発明の第2の実施の形態における動作の概要を示すフローチャートである。同図に示す動作は、図4に示すフローチャートのステップ14の処理がなく、ステップ15の処理のみが異なる。
【0086】
当該ステップ15は、映像データファイル保存ステップ(ステップ151)と、関連情報保存ステップ(152)からなる。
【0087】
ステップ151において、情報取得部10は、ステップ11で、ユーザによって入出力部40から指定され、メモリ(図示せず)に格納されている映像ファイル名に基づいて、映像データファイルをダウンロードし、映像データ記憶部31に格納する。
【0088】
ステップ152では、情報取得部10は、ステップ12で得られ、初期メタデータ取得部120のメモリ(図示せず)に保存されている初期メタデータを入力し、初期メタデータのうちタイトルを示すタグに情報があれば、ファイル名をタイトルを示すタグ内の情報に変更する。また、ステップ1335において、関連文字列抽出部130において、スコアが最大となる文字列を関連情報として、関連情報記憶部32に保存する。
【0089】
[第3の実施の形態]
図15は、本発明の第3の実施の形態における装置構成を示す。
【0090】
同図に示す構成は、第1の実施の形態における図3の構成にメタデータDB編集部170が追加された構成である。
【0091】
動作においても以下の動作以外は第1の実施の形態と同様である。
【0092】
図16は、本発明の第3の実施の形態におけるメタデータDB編集ステップのフローチャートである。
【0093】
当該メタデータDB編集ステップ(ステップ18)は、メタデータDB編集部170において、ステップ16で生成されたメタデータDB32の内容を、入出力部40からユーザから入力された変更指示に基づいてエディタ等を介して、変更する。
【0094】
なお、本発明は、上記に示した装置以外の機器(例えば、ハードディスクレコーダ)で実施することもできる。
【0095】
また、本発明では、メタデータを取得する対象として、Web情報中の映像データを主たる対象とした実施の形態を記載しているが、メタデータを自動的に取得し、管理するという方法において、対象は映像データに限定されることなく、画像や音声であってもよい。
【0096】
また、上記の実施の形態では、Webページ上のリンクから映像データをパーソナルコンピュータ上にダウンロードする形態について記載したが、装置は個人端末に限定されない。例えば、映像配信用の大規模サーバ上で行うことも可能である。
【0097】
なお、上記の装置の動作をプログラムとして構築し、メタデータ取得・管理装置として利用されるコンピュータに実行させる、または、ネットワークを介して流通させることが可能である。
【0098】
なお、本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において種々変更・応用が可能である。
【産業上の利用可能性】
【0099】
本発明は、Webページ上のリンクから映像データをパーソナルコンピュータ上にダウンロードする、または、映像配信用の大規模サーバから映像データをダウンロードする技術に適用可能である。また、ダウンロードする機器として、パーソナルコンピュータ以外の例えば、ハードディスクレコーダ等に適用することができる。
【図面の簡単な説明】
【0100】
【図1】本発明の原理を説明するための図である。
【図2】本発明の原理構成図である。
【図3】本発明の第1の実施の形態における装置構成図である。
【図4】本発明の第1の実施の形態における動作の概要を示すフローチャートである。
【図5】本発明の第1の実施の形態における関連文字列抽出ステップのフローチャートである。
【図6】本発明の第1の実施の形態における取得情報提示ステップのフローチャートである。
【図7】本発明の第1の実施の形態における取得情報提示ステップの処理により表示された画面例である。
【図8】本発明の第1の実施の形態における情報取得ステップのフローチャートである。
【図9】本発明の第1の実施の形態におけるメタデータDB生成ステップのフローチャートである。
【図10】本発明の第1の実施の形態における検索ステップのフローチャートである。
【図11】本発明の第1の実施の形態における関連語取得ステップの詳細なフローチャートである。
【図12】本発明の第1の実施の形態における重要度計算のフローチャートである。
【図13】本発明の第2の実施の形態における装置構成図である。
【図14】本発明の第2の実施の形態における動作の概要のフローチャートである。
【図15】本発明の第3の実施の形態における装置構成図である。
【図16】本発明の第3の実施の形態における動作の概要のフローチャートである。
【符号の説明】
【0101】
20 映像データ入出力部
30 記憶部
31 映像データ記憶部
33 関連情報記憶部
33 メタデータDB
40 入出力部
100 処理部
110 情報取得部
120 初期メタデータ取得手段
130 関連文字列抽出手段、関連文字列抽出部
140 取得情報提示部
150 メタデータDB生成手段、メタデータDB製絵師部
160 検索部
170 メタデータDB編集部
【特許請求の範囲】
【請求項1】
閲覧中のWebページ中のリンクからダウンロードした画像データ、映像データを含む各種データにメタデータと呼ばれる関連情報を付与するメタデータの取得・管理方法であって、
前記Webページに含まれるリンクが示す、ダウンロード可能な取得対象の映像データをユーザに指定させる取得対象データ指定ステップと、
前記取得対象データのファイルを含む、予め該取得対象データと関連付けられた初期メタデータを任意の方法により取得する初期メタデータ取得ステップと、
前記取得対象データへのリンクを含むWebページ内の文字列から、該リンクを示す取得対象データに関連する関連文字列を取得する関連文字列抽出ステップと、
前記初期メタデータ取得ステップにより取得した前記初期メタデータ及び前記関連文字列抽出ステップにより取得した前記関連文字列とに基づく情報を追加メタデータとしてメタデータDBに格納するメタデータDB生成ステップと、
を行うことを特徴とするメタデータの取得・管理方法。
【請求項2】
前記関連文字列抽出ステップにおいて、
前記Webページにおける、前記取得対象データのリンク文字列の位置を基準として、該Webページ内の句読点で区切られた全てのセンテンスに対し、基準位置からの距離に基づくスコアを付与し、
それぞれのセンテンス内に含まれる単語に対して、該単語が含まれていたセンテンスのスコア及び該取得対象データのリンク文字列との比較結果に基づく重み係数を用いてスコアを付与し、該単語に付与されたスコアに基づいて取得する関連語を抽出する、
請求項1記載のメタデータの取得・管理方法。
【請求項3】
前記メタデータDB生成ステップにおける、前記メタデータDBは、ダウンロードされた取得対象データのファイルのファイルパス、ファイル名、初期メタデータ、及び追加メタデータが関連付けられた管理テーブルを有する、
請求項1記載のメタデータの取得・管理方法。
【請求項4】
閲覧中のWebページ中のリンクからダウンロードした画像データ、映像データを含む各種データにメタデータと呼ばれる関連情報を付与するメタデータの取得・管理方法であって、
前記Webページに含まれるリンクが示す、ダウンロード可能な取得対象の映像データをユーザに指定させる取得対象データ指定ステップと、
前記取得対象データのファイル名を含む、予め該取得対象データと関連付けられた初期メタデータを任意の方法により取得する初期メタデータ取得ステップと、
前記取得対象データへのリンクを含むWebページ内文字列から、リンクの示す取得対象データに関する関連文字列を取得する関連文字列抽出ステップと、
前記初期メタデータ取得ステップにより取得された前記初期メタデータ及び、前記関連文字列抽出ステップにより取得された前記関連文字列とに基づく情報を追加メタデータとしてメタデータDBに格納する追加メタデータ取得ステップと、
前記初期メタデータ及び前記追加メタデータに基づき、前記取得対象データが前記メタデータDBにダウンロードされた後に検索可能なデータベースを構築するメタデータDB生成ステップと、
前記追加メタデータ取得ステップにより取得した前記追加メタデータを前記メタデータDBに追加し、該メタデータDBを更新するメタデータDB更新ステップと、
ユーザから入力された検索キーに基づいて、前記メタデータDBを検索する検索ステップと、
前記ユーザから任意に入力された編集指示に基づいて、前記メタデータDBを編集するメタデータDB編集ステップと、
を行うことを特徴とするメタデータの取得・管理方法。
【請求項5】
閲覧中のWebページ中のリンクからダウンロードした画像データ、映像データを含む各種データにメタデータと呼ばれる関連情報を付与するメタデータの取得・管理装置であって、
前記Webページに含まれるリンクが示す、ダウンロード可能な取得対象映像データがユーザによって指定されると、該取得対象データのファイルを含む、予め該取得対象データと関連付けられた初期メタデータを任意の方法により取得する初期メタデータ取得手段と、
前記取得対象データへのリンクを含むWebページ内の文字列から、該リンクを示す取得対象データに関連する関連文字列を取得する関連文字列抽出手段と、
前記初期メタデータ取得ステップにより取得した前記初期メタデータ及び前記関連文字列抽出ステップにより取得した前記関連文字列とに基づく情報を追加メタデータとしてメタデータDBに格納するメタデータDB生成手段と、
を有することを特徴とするメタデータの取得・管理装置。
【請求項6】
閲覧中のWebページ中のリンクからダウンロードした画像データ、映像データを含む各種データにメタデータと呼ばれる関連情報を付与するメタデータの取得・管理プログラムであって、
前記Webページに含まれるリンクが示す、ダウンロード可能な映像ファイルを含むデータをユーザに指定させる取得対象データ指定ステップと、
前記取得対象データのファイルを含む、予め該取得対象データと関連付けられた初期メタデータを任意の方法により取得する初期メタデータ取得ステップと、
前記取得対象データへのリンクを含むWebページ内の文字列から、該リンクを示す取得対象データに関連する関連文字列を取得する関連文字列抽出ステップと、
前記初期メタデータ取得ステップにより取得した前記初期メタデータ及び前記関連文字列抽出ステップにより取得した前記関連文字列とに基づく情報を追加メタデータとしてメタデータDBに格納するメタデータDB生成ステップと、
を、コンピュータに実行させることを特徴とするメタデータの取得・管理プログラム。
【請求項1】
閲覧中のWebページ中のリンクからダウンロードした画像データ、映像データを含む各種データにメタデータと呼ばれる関連情報を付与するメタデータの取得・管理方法であって、
前記Webページに含まれるリンクが示す、ダウンロード可能な取得対象の映像データをユーザに指定させる取得対象データ指定ステップと、
前記取得対象データのファイルを含む、予め該取得対象データと関連付けられた初期メタデータを任意の方法により取得する初期メタデータ取得ステップと、
前記取得対象データへのリンクを含むWebページ内の文字列から、該リンクを示す取得対象データに関連する関連文字列を取得する関連文字列抽出ステップと、
前記初期メタデータ取得ステップにより取得した前記初期メタデータ及び前記関連文字列抽出ステップにより取得した前記関連文字列とに基づく情報を追加メタデータとしてメタデータDBに格納するメタデータDB生成ステップと、
を行うことを特徴とするメタデータの取得・管理方法。
【請求項2】
前記関連文字列抽出ステップにおいて、
前記Webページにおける、前記取得対象データのリンク文字列の位置を基準として、該Webページ内の句読点で区切られた全てのセンテンスに対し、基準位置からの距離に基づくスコアを付与し、
それぞれのセンテンス内に含まれる単語に対して、該単語が含まれていたセンテンスのスコア及び該取得対象データのリンク文字列との比較結果に基づく重み係数を用いてスコアを付与し、該単語に付与されたスコアに基づいて取得する関連語を抽出する、
請求項1記載のメタデータの取得・管理方法。
【請求項3】
前記メタデータDB生成ステップにおける、前記メタデータDBは、ダウンロードされた取得対象データのファイルのファイルパス、ファイル名、初期メタデータ、及び追加メタデータが関連付けられた管理テーブルを有する、
請求項1記載のメタデータの取得・管理方法。
【請求項4】
閲覧中のWebページ中のリンクからダウンロードした画像データ、映像データを含む各種データにメタデータと呼ばれる関連情報を付与するメタデータの取得・管理方法であって、
前記Webページに含まれるリンクが示す、ダウンロード可能な取得対象の映像データをユーザに指定させる取得対象データ指定ステップと、
前記取得対象データのファイル名を含む、予め該取得対象データと関連付けられた初期メタデータを任意の方法により取得する初期メタデータ取得ステップと、
前記取得対象データへのリンクを含むWebページ内文字列から、リンクの示す取得対象データに関する関連文字列を取得する関連文字列抽出ステップと、
前記初期メタデータ取得ステップにより取得された前記初期メタデータ及び、前記関連文字列抽出ステップにより取得された前記関連文字列とに基づく情報を追加メタデータとしてメタデータDBに格納する追加メタデータ取得ステップと、
前記初期メタデータ及び前記追加メタデータに基づき、前記取得対象データが前記メタデータDBにダウンロードされた後に検索可能なデータベースを構築するメタデータDB生成ステップと、
前記追加メタデータ取得ステップにより取得した前記追加メタデータを前記メタデータDBに追加し、該メタデータDBを更新するメタデータDB更新ステップと、
ユーザから入力された検索キーに基づいて、前記メタデータDBを検索する検索ステップと、
前記ユーザから任意に入力された編集指示に基づいて、前記メタデータDBを編集するメタデータDB編集ステップと、
を行うことを特徴とするメタデータの取得・管理方法。
【請求項5】
閲覧中のWebページ中のリンクからダウンロードした画像データ、映像データを含む各種データにメタデータと呼ばれる関連情報を付与するメタデータの取得・管理装置であって、
前記Webページに含まれるリンクが示す、ダウンロード可能な取得対象映像データがユーザによって指定されると、該取得対象データのファイルを含む、予め該取得対象データと関連付けられた初期メタデータを任意の方法により取得する初期メタデータ取得手段と、
前記取得対象データへのリンクを含むWebページ内の文字列から、該リンクを示す取得対象データに関連する関連文字列を取得する関連文字列抽出手段と、
前記初期メタデータ取得ステップにより取得した前記初期メタデータ及び前記関連文字列抽出ステップにより取得した前記関連文字列とに基づく情報を追加メタデータとしてメタデータDBに格納するメタデータDB生成手段と、
を有することを特徴とするメタデータの取得・管理装置。
【請求項6】
閲覧中のWebページ中のリンクからダウンロードした画像データ、映像データを含む各種データにメタデータと呼ばれる関連情報を付与するメタデータの取得・管理プログラムであって、
前記Webページに含まれるリンクが示す、ダウンロード可能な映像ファイルを含むデータをユーザに指定させる取得対象データ指定ステップと、
前記取得対象データのファイルを含む、予め該取得対象データと関連付けられた初期メタデータを任意の方法により取得する初期メタデータ取得ステップと、
前記取得対象データへのリンクを含むWebページ内の文字列から、該リンクを示す取得対象データに関連する関連文字列を取得する関連文字列抽出ステップと、
前記初期メタデータ取得ステップにより取得した前記初期メタデータ及び前記関連文字列抽出ステップにより取得した前記関連文字列とに基づく情報を追加メタデータとしてメタデータDBに格納するメタデータDB生成ステップと、
を、コンピュータに実行させることを特徴とするメタデータの取得・管理プログラム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【公開番号】特開2007−41864(P2007−41864A)
【公開日】平成19年2月15日(2007.2.15)
【国際特許分類】
【出願番号】特願2005−225534(P2005−225534)
【出願日】平成17年8月3日(2005.8.3)
【出願人】(000004226)日本電信電話株式会社 (13,992)
【Fターム(参考)】
【公開日】平成19年2月15日(2007.2.15)
【国際特許分類】
【出願日】平成17年8月3日(2005.8.3)
【出願人】(000004226)日本電信電話株式会社 (13,992)
【Fターム(参考)】
[ Back to top ]