説明

検索支援装置及び検索支援方法

【課題】検索語が含まれるコンテンツの属性によって適した検索対象が異なる場合であっても、適切な検索結果を得ること。
【解決手段】検索支援装置10は、情報伝達媒体を介してコンテンツを取得するコンテンツ獲得部11と、取得したコンテンツからキーワードを抽出して検索語を生成する検索語生成部12と、検索語生成部12が生成した検索語の抽出元のコンテンツの属性を示すコンテンツ属性に基づいて検索エンジンを選定する検索エンジン選定部13と、検索エンジン選定部13が選定した検索エンジンに対して、検索語生成部12で生成した検索語を指定して検索要求する検索クエリー送信部14と、検索要求した検索エンジンからの検索結果を受信する検索結果受信部15と、コンテンツ獲得部11が取得したコンテンツと検索結果受信部15が受信した検索結果とに基づいてコンテンツに関連する関連コンテンツを生成する関連コンテンツ生成部16と、を備えた。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、コンテンツから生成した検索語の検索クエリーを検索エンジンに送信して関連情報を検索する検索支援装置及び検索支援方法に関する。
【背景技術】
【0002】
従来、インターネット上の複数の検索エンジンに対して、検索エンジンの選択と同時にカテゴリの選択も設定可能な検索システムが知られている(特許文献1参照)。この検索システムでは、検索条件(検索語)に対する適切なカテゴリをユーザが選択することで、検索対象のカテゴリを指定しない場合に比べて、検索対象をカテゴリ内に絞って検索することを可能にしている。
【0003】
また、特定分野に特化した情報を効率的に得るために、検索入力文(検索語)に応じて専用検索エンジンを自動的に選択し、選択した検索エンジンで検索を行う検索支援装置が知られている(特許文献2参照)。この検索支援装置では、Webサイトの検索支援事例文と特定の分野に特化した検索エンジンとを関連付けておき、クライアント端末装置から取得した検索入力文を構文解析し予め登録してある事例文とマッチングし、類似度の高い事例文と関連付けられた検索エンジンを選択する。これにより、検索入力文と特定の分野に特化した検索エンジンで検索を行うことができる。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2003−157283号公報
【特許文献2】特開2003−132060号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、上記従来の検索支援装置では、検索語のみを基準に検索エンジンを選択するため、例えば、検索語が含まれていたコンテンツの種類や属性によって適した検索対象が異なる場合には、全ての検索対象から検索結果を得ることとなり、適切な検索結果を得ることができない問題があった。
【0006】
本発明は、かかる点に鑑みてなされたものであり、検索語が含まれるコンテンツの属性によって適した検索対象が異なる場合であっても、適切な検索結果を得ることができる検索支援装置及び検索支援方法を提供することを目的とする。
【課題を解決するための手段】
【0007】
本発明の検索支援装置は、情報伝達媒体を介してコンテンツを取得するコンテンツ獲得手段と、取得したコンテンツからキーワードを抽出して検索語を生成する検索語生成手段と、前記検索語生成手段が生成した検索語の抽出元のコンテンツの属性を示すコンテンツ属性に基づいて検索エンジンを選定する検索エンジン選定手段と、前記検索エンジン選定手段が選定した検索エンジンに対して、前記検索語生成手段で生成した検索語を指定して検索要求する検索要求手段と、前記検索要求した検索エンジンからの検索結果を受信する検索結果受信手段と、前記コンテンツ獲得手段が取得したコンテンツと前記検索結果受信手段が受信した検索結果とに基づいて前記コンテンツに関連する関連コンテンツを生成する関連コンテンツ生成手段と、を備えたことを特徴とする。
【0008】
この構成によれば、検索語の抽出元のコンテンツ属性に基づいて検索エンジンを選定し、当該コンテンツ属性に応じて選定された検索エンジンで検索するので、検索語が含まれるコンテンツの属性によって適した検索対象が異なる場合でも、適切な検索結果を得ることができる。
【0009】
上記検索支援装置において、前記コンテンツは放送コンテンツであり、前記関連コンテンツは、前記放送コンテンツ及び前記検索結果からなる放送関連コンテンツである構成が可能である。
【0010】
上記検索支援装置において、前記検索エンジン選定手段は、前記コンテンツ属性が放送コンテンツの放送番組のジャンルである場合、当該放送番組のジャンルと同一又は関連する特性を持つ検索エンジンを選定することを特徴とする。
【0011】
この構成によれば、放送番組のジャンル毎に検索エンジンを選定するので、同一の検索語が異なるジャンルの放送コンテンツに含まれる場合であっても、ジャンル毎に検索結果を得ることができる。
【0012】
上記検索支援装置において、前記放送コンテンツの放送番組の放送時間中に前記検索語生成手段が前記検索語の生成をした場合には、前記コンテンツ属性を放送時間中とし、前記検索エンジン選定手段は、前記放送時間中に関連する特性を持つ検索エンジンを選定することを特徴とする。
【0013】
この構成によれば、放送時間中に関連する特性を持つ検索エンジンを選定するので、放送時間中に関連性の高い検索結果を得ることができる。
【0014】
上記検索支援装置において、前記放送コンテンツの放送番組の放送時間終了後に当該放送コンテンツに関連する関連コンテンツに対して情報更新要求を受けて前記検索語生成手段が検索語を生成した場合には前記コンテンツ属性を放送時間終了後とし、前記検索エンジン選定手段は、前記放送時間終了後に関連する特性を持つ検索エンジンを選定することを特徴とする。
【0015】
この構成によれば、放送時間終了後に関連する特性を持つ検索エンジンを選定するので、放送時間終了後に関連性の高い検索結果を得ることができる。
【0016】
本発明の検索支援方法は、情報伝達媒体を介してコンテンツを取得するステップと、取得したコンテンツからキーワードを抽出して検索語を生成するステップと、生成した検索語の抽出元のコンテンツの属性を示すコンテンツ属性に基づいて検索エンジンを選定するステップと、選定した前記検索エンジンに対して、生成した前記検索語を指定して検索要求するステップと、検索要求した前記検索エンジンからの検索結果を受信するステップと、取得した前記コンテンツと受信した前記検索結果とに基づいて前記コンテンツに関連する関連コンテンツを作成するステップと、を備えたことを特徴とする。
【発明の効果】
【0017】
本発明によれば、検索語が含まれるコンテンツの属性によって適した検索対象が異なる場合であっても、適切な検索結果を得ることができる。
【図面の簡単な説明】
【0018】
【図1】本発明の実施の形態に係る検索支援システムの概要を示すシステム構成図である。
【図2】本実施の形態に係る検索支援装置の機能ブロック図である。
【図3】コンテンツ獲得部の取得するコンテンツの一例を示す図である。
【図4】検索語生成部が抽出したコンテンツの属性を示す概念図である。
【図5】検索語分類部が分類した検索語の属性を示す概念図である。
【図6】検索エンジン特性保持部が保持する検索エンジンの特性情報を説明するための図である。
【図7】本実施の形態に係る検索支援装置の検索支援動作を示すフロー図である。
【図8】変形例に係る検索支援装置の検索支援動作を示すフロー図である。
【発明を実施するための形態】
【0019】
以下、本発明の実施の形態について添付図面を参照して詳細に説明する。本発明の実施の形態に係る検索支援装置は、情報伝達媒体を介して取得したコンテンツに含まれるキーワードから検索語を生成し、当該検索語の抽出元となるコンテンツの属性を特性に持つ検索エンジンを選定し、選定した検索エンジンで検索を行うものである。
【0020】
まず、検索支援装置の詳細な説明の前に、検索支援装置が属する検索支援システムの概要の一例について説明する。図1は、本発明の実施の形態に係る検索支援装置が属する検索支援システムの概要を示すシステム構成図である。図1に示す検索支援システムは、検索支援装置10と、コンテンツ提供サーバ20と、複数の検索エンジン30(30a,30b,30c)とを備えている。検索支援装置10、コンテンツ提供サーバ20及び複数の検索エンジン30は、ネットワーク50を介してデータ送受信を行うための通信インタフェースを備えている。なお、図1では、説明を簡単にするために3つの検索エンジン30a,30b,30cを示しているが、検索エンジン30の数はこれに限定されるものではない。
【0021】
検索支援装置10は、コンテンツ提供サーバ20又はクライアント端末(図示省略)から放送内容に対して作成されたコンテンツのメタデータを獲得する機能、コンテンツのメタデータを利用して検索語を生成する機能、検索エンジン30の検索特性を示す特性情報を保持する機能、検索語の抽出元のコンテンツに基づいて検索エンジン30を選定する機能、選定した検索エンジン30に検索要求をする機能、獲得したメタデータ及び検索エンジン30からの検索結果からユーザに提供する提供用コンテンツを作成する機能、提供用コンテンツをクライアント端末等に配信する機能を主に備える。本実施の形態では、検索支援装置10は、CPU、メモリ、通信デバイス、その他のデバイスを含んだコンピュータシステムで構成されており、ハードウエア資源とソフトウエア資源とが協働して動作することにより構築される情報処理組織によって上記各種機能が実現される。すなわち、コンピュータに上記各機能を実現させるためのプログラムを備える。
【0022】
ここで、放送とは、テレビジョン放送、ラジオ放送、インターネット上の動画配信、インターネット上のポッドキャスト等を含む概念である。コンテンツとは、クライアント端末上で視聴できる動画像、静止画像、音声又はテキスト等、さらにはこれらの組み合わせからなるデータである。また、メタデータは、放送内容に対して作成されるものであり、少なくとも放送内容(コンテンツ)を示す属性情報を含むものである。また、メタデータは、放送内容に関連する種々の付加情報を含み得るものである。以下では、放送コンテンツとして、テレビジョン放送コンテンツを例に説明する。
【0023】
コンテンツ提供サーバ20は、放送番組毎に放送内容(放送コンテンツ)に対して作成されたメタデータを提供する機能を備えている。放送内容に対するメタデータは、時系列的に順次作成されても良い。コンテンツ提供サーバ20は、検索支援装置10からの要求に応じて該当するメタデータを配信する。なお、検索支援装置10からの要求をトリガとせずに、コンテンツ提供サーバ20は、検索支援装置10に対してメタデータを配信(プッシュ型配信)しても良い。メタデータは、検索支援装置10によって解釈可能な形式で記述される。メタデータの記述形式は、例えば、XML(Extensible Markup Language)であってもよいが、XMLに限定されない。異なる放送番組のメタデータは、同一形式で記述されたものであってもよく、それぞれ異なる形式により記述されたものであってもよい。
【0024】
検索エンジン30は、ネットワーク上のWEBページ、画像ファイル、テキストファイル等の各種情報を検索する機能を備えている。各検索エンジン30は、それぞれ特定のコンテンツの属性に対する特性を備えている。ここで、コンテンツの属性に対する特性とは、当該属性に関して検索能力が高い特徴を持つこという。従って、例えば、コンテンツの属性「ニュース」に特性を持つ検索エンジン30は、他の検索エンジン30に比較して「ニュース」分野(ジャンル)に係る検索に適していることを意味する。この特定のコンテンツの属性に対する特性を示す情報は、後述する検索エンジン特性保持部133で保持される検索エンジン特性情報を構成する。検索エンジン30は、検索支援装置10から検索語の検索クエリーを検索要求として受信し、インターネット、イントラネット、ローカルエリアネットワーク等に接続されているWEBサーバから検索クエリーに関連する関連情報を獲得し、検索結果として検索支援装置10へ送信する。なお、関連情報の検索対象は、インターネット経由で接続されるWEBサーバだけでなく、直接接続されているデータベースであっても良い。
【0025】
ネットワーク50は、固定有線ネットワーク、移動無線ネットワーク、近距離無線ネットワーク、あるいはその他の通信回路であっても良い。本実施の形態では、ネットワークを利用する例で説明しているが、一部にDVD(Digital Versatile Disc)やCD−ROM(Compact Disc−Read Only Memory)等の記録媒体を介して情報を交換する手段を含んでもよい。
【0026】
次に、図2を用いて、検索支援装置10の構成について詳しく説明する。図2は、検索支援装置10の機能ブロック図である。検索支援装置10は、コンテンツ獲得部11、検索語生成部12、検索エンジン選定部13、検索クエリー送信部14、検索結果受信部15、関連コンテンツ生成部16、関連コンテンツ配信部17、ユーザコマンド処理部18を備えている。
【0027】
コンテンツ獲得部11は、コンテンツ提供サーバ20に対して放送コンテンツのメタデータを要求し、コンテンツ提供サーバ20から放送コンテンツのメタデータを獲得する。ここで、コンテンツ獲得部11は、放送番組チャネル及び放送時間帯(開始時刻と終了時刻)を指定して該当するメタデータを要求することができる。または、コンテンツ獲得部11は、番組チャネルを指定して、前回アクセスしたときから更新されたメタデータを要求してもよいし、番組チャネルとして放送されている全番組チャネルを指定することを含め、複数の番組チャネルを指定してもよい。なお、コンテンツ提供サーバ20からメタデータを配信(プッシュ型配信)する場合、コンテンツ獲得部11からのメタデータの要求は不要である。
【0028】
図3は、コンテンツ獲得部11が獲得した放送コンテンツのメタデータを説明するための図である。図3(a)は、ニュース番組の放送コンテンツのメタデータを示し、同図(b)は、バラエティ番組の放送コンテンツのメタデータを示している。コンテンツ獲得部11は、獲得したメタデータを記述形式に従って解釈し、内部処理用のフォーマット(内部フォーマット)に変換して記録する。内部フォーマットに変換する際に、メタデータ中の文章に対して、形態素解析処理を施し、キーワードとなる名詞を抽出しておいても良い。また、フォーマット変換したメタデータは検索語生成部12及びコンテンツ生成部16へ入力される。
【0029】
検索語生成部12は、コンテンツ獲得部11から入力されたメタデータから検索語として使用するキーワードを抽出すると共に、当該検索語の抽出元となるコンテンツの属性(コンテンツ属性)を抽出する。キーワード(検索語)は、放送コンテンツの構成単位毎に抽出(生成)される。ここで、キーワードとは、メタデータに含まれた単語又は文章等の、検索語として利用可能な意味のある文字列、記号、数字及びこれらのまとまりをいう。また、コンテンツの属性とは、コンテンツ特有の特徴・性質を表すものであり、例えば、ジャンル(ニュース、エンターテイメント、スポーツ、教養等)、放送時間中、放送時間終了後等が挙げられる。図4は、検索語生成部12が抽出したコンテンツの属性を示す概念図である。ここでは、図3(a)に示す放送コンテンツAのメタデータが入力された際に、抽出したコンテンツの属性が示されている。検索語生成部12は、放送コンテンツAのメタデータの最初から順番に解釈し、番組名である「ニュース1030」、番組開始時刻である「10時30分00秒」、番組終了時刻である「10時55分00秒」、出演者名である「田中一郎」「山田太郎」、番組内容を表した表題である「総選挙」といったキーワード(検索語)を抽出し、これら検索語の抽出元となるコンテンツの属性「ニュース」を抽出する。なお、抽出するコンテンツ属性の数は、1つに限定されるものではなく、複数のコンテンツ属性(例えば、「ニュース」「放送時間中」)を抽出してもよい。そして、検索語生成部12は、コンテンツの属性を検索エンジン選定部13の検索エンジン判定部132に送ると共に、検索語を検索語分類部131に送る。また、検索語生成部12は、抽出したキーワードを検索語に用いて検索クエリーを生成し、生成した検索クエリーを検索要求として検索クエリー送信部14に送る(検索要求手段)。
【0030】
検索エンジン選定部13は、検索語生成部12で生成された検索語の抽出元となる放送コンテンツの属性に基づいて検索エンジン30を選定するものであり、検索語分類部131、検索エンジン判定部132、検索エンジン特性保持部133を有している。
【0031】
検索語分類部131は、検索語生成部12から送られた検索語の属性を分類する。ここで、検索語の属性は、放送コンテンツに含まれる検索語の特徴又は性質を表すものである。検索語の属性の分類には、言語処理等で利用される公知の属性自動推定技術を用いることが可能である。この属性自動推定技術とは、検索語を検索して得られた検索結果の中から特定のキーワードを分析するものであり、当該検索語の属性を自動的に推定する技術である。なお、検索語分類部131は、検索語の検索クエリーを各検索エンジン30に送信し、各検索エンジン30から受けた検索語についての検索結果に基づいて検索語の属性を推定してもよい。取得した検索語の属性を示す検索語属性情報は、検索語分類部131内に蓄積され、以降の検索語の属性の分類に供される。検索語分類部131は、上記方法で分類した検索語の属性を、検索エンジン判定部132に送る。
【0032】
図5は、検索語分類部131が分類した検索語の属性を示した概念図である。ここでは、図3(a)に示す放送コンテンツAから生成された検索語を分類した属性が示されている。図5では、例えば、放送コンテンツ内の番組名を示す検索語「ニュース1030」は属性「ニュース」に、番組開始時刻及び番組終了時刻を示す検索語「10時30分00秒」「10時55分00秒」は属性「放送時間中」に分類されている。また、出演者を示す検索語「田中一郎」は属性「アナウンサー」に、検索語「山田太郎」は属性「大学教授」に、番組内容を示す検索語「総選挙」は属性「ニュース」に分類されている。この検索語の属性は、後述する二次的な検索エンジンの選定(二次検索)に利用することが可能である。
【0033】
検索エンジン特性保持部133は、検索エンジン30を選定するために用いられる検索エンジン特性情報を保持している。図6は、検索エンジン特性保持部133が保持する検索エンジン特性情報の一例を示す図である。検索エンジン特性情報は、コンテンツ属性に対する特性と、この特性を持つ検索エンジン及びリンク先情報(URL等)とが紐づけられて構成されている。例えば、図6に示す検索エンジン特性情報において、コンテンツの属性「ニュース」の検索に特性を持つ検索エンジンとして、検索エンジンA(ULR1)が挙げられ、コンテンツの属性「職業」の検索に特性を持つ検索エンジンとして、検索エンジンB(URL2)が挙げられる。なお、図6に示す検索エンジン特性情報では、説明を簡単にするために、コンテンツの属性に対する特性と検索エンジンとが一対一で紐づけられているが、1つの特性に対して複数の検索エンジンが紐づけられてもよい。
【0034】
検索エンジン判定部132は、検索エンジン特性保持部133に保持された検索エンジン特性情報の中から、検索語生成部12から受けたコンテンツの属性と同一又は関連する特性を持つ検索エンジン30を判定する。例えば、検索語生成部12から図4に示すコンテンツの属性「ニュース」を受けた場合、検索エンジン判定部132は、図6に示す検索エンジン特性情報の中から、コンテンツ属性「ニュース」を特性に持つ検索エンジンAを選定し、選定結果として検索エンジンAのURL等を検索クエリー送信部14に送る。なお、選定される検索エンジンは1つに限定されるものではなく、コンテンツ属性と同一の特性又は関連する特性を持つものであれば複数の検索エンジンを選定してもよい。また、検索エンジン判定部132は、検索結果を絞り込むためのコンテンツ属性に基づく一次的な検索エンジンの選定(一次検索)の後に、検索語分類部131から受けた検索語の属性に基づいて二次的な検索エンジンを選定(二次検索)してもよい。これにより、一次検索としてコンテンツに関連する絞り込み検索を行い、二次検索として各検索語に関連する広範検索を行うことができる。
【0035】
検索クエリー送信部14は、検索エンジン判定部132からの選定結果に基づき、選定された検索エンジン30に対して、検索語生成部12から入力された検索語の検索クエリーを検索要求として送信する(検索要求手段)。
【0036】
検索結果受信部15は、検索エンジン30から検索結果を受信し、受信した検索結果を関連コンテンツ生成部16へ送る。ここで、検索エンジン30から提供される検索結果は、例えば、サイトへアクセスするためのリンク情報(例えば、URL)等である。
【0037】
関連コンテンツ生成部16は、検索語生成部12から入力されるメタデータと、検索結果受信部15から入力される検索結果とを用いて、ユーザへ提供するための関連コンテンツを生成して蓄積する。ここで、蓄積される関連コンテンツは、放送コンテンツのメタデータに、検索結果として受けた関連情報(例えば、リンク先のURL)が付加された放送関連コンテンツである。コンテンツ形式は、HTMLのファイルでもいいし、Flashのファイルでもいいし、アプリケーションに読み込まれるデータの形式でもよく、クライアント端末でのコンテンツ提示手段と整合性のある形式で作成されればよい。
【0038】
関連コンテンツ配信部17は、関連コンテンツ生成部16で作成された関連コンテンツの中から、ユーザコマンド処理部18を通して受信するユーザの操作に応じて選択された部分を、クライアント端末へ配信する。
【0039】
ユーザコマンド処理部18は、クライアント端末に対するユーザ操作によってクライアント端末から送信されるユーザコマンドを受信する。受信したユーザコマンドは内容に応じて該当する処理部(関連コンテンツ生成部16及び関連コンテンツ配信部17)へ通知される。
【0040】
次に、図7を参照して、検索支援装置10の検索支援動作について説明する。図7は、検索支援装置10が放送コンテンツを獲得してから放送関連コンテンツを生成するまでの処理を示すフロー図である。ここでは、図3(a)に示す放送コンテンツAの検索語「山田太郎」を検索要求するものとし、コンテンツ属性「ニュース」に検索エンジンを選定した場合と、コンテンツ属性「放送時間中」に基づいて検索エンジンを選定した場合とをそれぞれ説明する。先ず、コンテンツ属性「ニュース」に基づいて検索エンジンを選定した場合について説明する。
【0041】
コンテンツ獲得部11が、コンテンツ提供サーバ20に対して放送番組の放送コンテンツAのメタデータを要求し、コンテンツ提供サーバ20から放送コンテンツAのメタデータを獲得する(ステップS71)。獲得した放送コンテンツAのメタデータは、記述形式に従って解釈され、内部フォーマットに変換されて、検索語生成部12及びコンテンツ生成部16に送られる。
【0042】
検索語生成部12は、コンテンツ獲得部11から入力されたメタデータから検索語を抽出し、検索語の抽出元となるコンテンツ属性を抽出する(ステップS72)。ここでは、図3(a)に示す放送コンテンツAのメタデータから、番組名「ニュース1030」、番組開始時刻「10時30分00秒」、番組終了時刻「10時55分00秒」、出演者名「田中一郎」「山田太郎」、番組内容「総選挙」をキーワード(検索語)として抽出し、これら検索語の抽出元となるコンテンツの属性「ニュース」を抽出する。コンテンツ属性は検索エンジン判定部132に送られ、検索語は検索語分類部131及び検索クエリー送信部14に送られる。
【0043】
検索語分類部131は、公知の属性自動推定技術等を利用して検索語生成部12から送られた各検索語の属性を分類する(ステップS73)。ここでは、放送コンテンツAに含まれる検索語について、図5に示す検索語の属性に分類する。分類した検索語の属性情報は、検索エンジン判定部132に送られる。
【0044】
検索エンジン判定部132は、検索語生成部12からコンテンツ属性を受けると、検索エンジン特性保持部133に保持された検索エンジン特性情報の中から、コンテンツ属性と同一又は関連する特性を持つ検索エンジン30を選び出す(ステップS74)。ここでは、検索エンジン判定部132は、図6に示す検索エンジン特性情報の中から、放送コンテンツAに係る放送番組のジャンルを示すコンテンツ属性「ニュース」と同一又は関連する検索特性を持つ検索エンジンAを選定する。選定結果として検索エンジンAのURL等が、検索クエリー送信部14に送られる。これにより、コンテンツ属性「ニュース」に特性を持たない検索エンジン(検索エンジンA以外の検索エンジン)30は除外され、コンテンツ属性「ニュース」に特性を持つ検索エンジン(検索エンジンA)30のみが選定される。
【0045】
従来の検索支援装置では、図3(a)及び(b)に示す放送コンテンツA,Bに同一の検索語「山田太郎」がそれぞれ含まれるような場合には、検索語「山田太郎」のみを基準に検索エンジンを選定するため、放送コンテンツの属性が異なる場合であっても放送コンテンツA,B区別することなく同一の検索エンジンを選定することになる。従って、各放送コンテンツA,Bの各属性によって適した検索対象(検索範囲)が異なる場合でも、検索範囲を区別することなく、同一の検索エンジンの検索範囲内でのみ検索結果を得ることになる。一方、本実施の形態では、同一の検索語「山田太郎」であっても、各検索語「山田太郎」はそれぞれ抽出元となる放送コンテンツA,Bの構成単位毎にそれぞれコンテンツ属性が抽出され、各放送コンテンツA,Bの構成単位毎に抽出されるコンテンツ属性と、同一又は関連する検索特性を持つ検索エンジンがそれぞれ選定される。すなわち、各放送コンテンツA,Bの各属性によって適した検索対象(検索範囲)が異なる場合には、コンテンツ属性のジャンルにより検索範囲が区別され、選定された検索エンジンの検索範囲で最適な検索結果を得ることができる。従って、同一の検索語「山田太郎」であっても、例えば、放送コンテンツAについては、コンテンツ属性「ニュース」と同一又は関連する検索特性を持つ検索エンジンが、放送コンテンツBについては、コンテンツ属性「バラエティ」と同一又は関連する検索特性を持つ検索エンジンが選定されることになる。すなわち、放送番組のジャンル毎に検索エンジンを選定するので、同一の検索語が異なるジャンルの放送コンテンツに含まれる場合であっても、ジャンル毎に検索結果を得ることができる。
【0046】
検索クエリー送信部14は、検索エンジン判定部132からの選定結果に基づき、選定された検索エンジン30(検索エンジンA)に対して、検索語生成部12から入力された検索語「山田太郎」の検索クエリーを検索要求として送信する(ステップS75)。
【0047】
検索結果受信部15は、検索エンジン30(検索エンジンA)から検索結果を受信し、受信した検索結果を関連コンテンツ生成部16へ送る(ステップS76)。ここで、検索エンジンAから受信する検索結果は、コンテンツ属性「ニュース」に関連した「山田太郎」についての検索結果である。関連コンテンツ生成部16は、検索語生成部12から入力される放送コンテンツAのメタデータに、検索結果受信部15から入力される検索結果(リンク先のURL等)を付加し、放送関連コンテンツを生成して蓄積する(ステップS77)。
【0048】
なお、上述したコンテンツ属性に基づく検索エンジンの選定後、ステップS73で分類した検索語の属性情報に基づいて検索エンジン30を選定してもよい。本例では、検索語「山田太郎」について検索要求しているので、検索エンジン判定部132は、検索語分類部131から受けた検索語「山田太郎」の属性「大学教授」を受けると、検索エンジン特性保持部133に保持された検索エンジン特性情報の中から、検索語属性「大学教授」と同一又は関連する特性を持つ検索エンジン(検索エンジンB)30を選び出す。これにより、コンテンツ属性に基づく検索エンジンの一次選定でコンテンツに関連性の高い検索精度を向上させ、検索語属性に基づく検索エンジンの二次選定で各検索語に関連性の高い広範な検索を行うことができる。
【0049】
次に、放送コンテンツAのコンテンツ属性「放送時間中」に基づいて検索エンジンを選定した場合について説明する。なお、上述の説明と異なるステップS74及びS75について中心に説明し、その他のステップについての詳細な説明は省略する。
【0050】
コンテンツ獲得部11が、コンテンツ提供サーバ20から放送コンテンツAのメタデータを獲得し(ステップS71)。検索語生成部12は、コンテンツ獲得部11から入力されたメタデータから検索語を抽出し、検索語の抽出元となるコンテンツ属性を抽出する(ステップS72)。検索語分類部131は、公知の属性自動推定技術等を利用して検索語生成部12から送られた各検索語の属性を分類する(ステップS73)。
【0051】
ここで、放送コンテンツから抽出された検索語を用いて情報検索する場合、同じ検索語であっても検索時間によって最適な検索エンジンが異なる傾向が存在する。例えば、放送コンテンツAの出演者「山田太郎」が放送コンテンツAの放送時間中に検索語として用いられた場合は、検索実施者は、出演者「山田太郎」自身に関する情報の取得を希望している傾向が強く、また、放送コンテンツAに出演中の「山田太郎」が放送コンテンツAの放送時間終了直後に検索語として用いられた場合は、出演者「山田太郎」自身に関する情報よりも、放送コンテンツAに関する情報を希望している傾向が強い。
【0052】
本実施の形態では、上記のような放送コンテンツの放送時間と検索時間との時間間隔に基づいて最適な検索エンジンを選定するようにしている。
検索エンジン判定部132は、検索語生成部12からコンテンツ属性「放送時間中」を受けると、当該コンテンツ属性「放送時間中」に基づいて検索エンジン30を選定する(ステップS74)。具体的には、放送番組の放送時間中の場合、当該放送番組の出演者自身に関する情報を求める傾向が高いことから、検索エンジン判定部132は、例えば、出演者の職業やプロフィール等の直接的に人物に関わる事項に対して同一又は関連する検索特性を持つ検索エンジン30を選定する。ここでは、例えば、職業の検索に特性を持つ検索エンジンB、公式HP・ブログの検索に特性を持つ検索エンジンDを選定し、選定結果として検索エンジンB及びDのURL等が、検索クエリー送信部14に送られる。これにより、コンテンツ属性「放送時間中」に関連する特性を持つ検索エンジンを選定するので、放送時間中に関連性の高い検索結果のみを得ることができる。
【0053】
検索結果受信部15は、検索エンジン30(検索エンジンB,D)から検索結果を受信し、受信した検索結果を関連コンテンツ生成部16へ送る(ステップS76)。ここで、検索エンジンBから受信する検索結果は、「職業」に関連した「山田太郎」についての検索結果であり、検索エンジンDから受信する検索結果は、「公式HP・ブログ」に関連する「山田太郎」についての検索結果である。関連コンテンツ生成部16は、検索語生成部12から入力される放送コンテンツAのメタデータに、検索結果受信部15から入力される2つの検索結果(リンク先のURL等)を付加し、放送関連コンテンツを生成して蓄積する(ステップS77)。
【0054】
次に、図8を用いて、変形例に係る検索支援装置10について説明する。図8は、検索支援装置10が放送番組終了後に検索エンジンを選定する場合の検索支援動作を示すフロー図である。ここでは、関連コンテンツ配信部17から受信した放送コンテンツAに関連する放送関連コンテンツ(以下、放送関連コンテンツAとする)を、ユーザのユーザ端末(図示省略)で閲覧しているものとし、放送コンテンツAに係る放送番組に出演する「山田太郎」を検索語として検索要求するものとして説明する。
【0055】
関連コンテンツ配信部17は、ユーザのユーザ端末に対して放送関連コンテンツを配信し、ユーザは、受信した放送関連コンテンツAを閲覧している(ステップS81)。そして、ユーザは、放送コンテンツAに係る放送番組の放送終了後も引き続き放送関連コンテンツAを閲覧するために、ユーザ端末を介して検索支援装置10に対して情報更新要求を行う。
【0056】
ユーザ端末からの情報更新要求を受けたユーザコマンド処理部18は、情報更新要求のコマンドを処理し、情報更新要求対象の放送関連コンテンツ(放送関連コンテンツA)及び情報更新要求のあった更新要求時刻を含む更新要求情報を検索語生成部12に送る(ステップS82)。
【0057】
検索語生成部12は、ユーザコマンド処理部18から更新要求情報を受けると、関連コンテンツ生成部16に蓄積される更新要求対象の放送関連コンテンツAのメタデータから検索語「山田太郎」等を抽出し、検索語の抽出元となるコンテンツ属性を抽出する(ステップS83)。ここでは、情報更新要求時刻が放送コンテンツAに係る放送番組の放送番組終了後であるため、コンテンツ属性「放送時間終了後」が付与される。コンテンツ属性「放送時間終了後」は検索エンジン判定部132に送られ、検索語は検索語分類部131及び検索クエリー送信部14に送られる。
【0058】
検索エンジン判定部132は、検索語生成部12からコンテンツ属性「放送時間終了後」を受けると、検索エンジン特性保持部133に保持された検索エンジン特性情報の中から、コンテンツ属性と同一又は関連する特性を持つ検索エンジン30を選び出す(ステップS84)。放送番組の放送時間終了後の場合、当該放送番組における最新のプレゼント応募規定や番組関連イベント情報を求める傾向が高いことから、検索エンジン判定部132は、図6に示す検索エンジン特性情報の中から、例えば、人名からの出演番組・映画の検索に特性を持つ検索エンジン(検索エンジンC)30を選定する。検索クエリー送信部14は、検索エンジン判定部132からの選定結果に基づき、選定された検索エンジン30(検索エンジンC)に対して、検索語生成部12から入力された検索語「山田太郎」の検索クエリーを検索要求として送信する(ステップS85)。これにより、コンテンツ属性「放送時間終了後」に関連する特性を持つ検索エンジンを選定するので、放送時間終了後に関連性の高い検索結果のみを得ることができる。
【0059】
検索結果受信部15は、検索エンジン30(検索エンジンC)から検索結果を受信し、受信した検索結果を関連コンテンツ生成部16へ送る(ステップS86)。ここで、検索エンジンCから受信する検索結果は、コンテンツ属性「放送時間終了後」に関連した「山田太郎」についての検索結果であり、例えば、放送番組で行っている視聴者プレゼント等の情報である。関連コンテンツ生成部16は、放送関連コンテンツAのメタデータに、検索結果受信部15から入力される検索結果(情報更新された放送番組のHP等のリンク先のURL等)を付加し、放送関連コンテンツAを生成して蓄積する(ステップS87)。そして、関連コンテンツ配信部17は、関連コンテンツ生成部16で生成した放送関連コンテンツAを、情報更新要求元であるユーザ端末に配信する(ステップS88)。
【0060】
このように、本実施の形態によれば、抽出したコンテンツ属性と同一又は関連する特性を持つ検索エンジン30を選定するので、コンテンツ属性30に対して特性を持たない検索エンジン30は除外され、コンテンツ属性を特性に持つ検索エンジン30のみが選ばれる。従って、検索語が含まれるコンテンツの属性によって適した検索対象が異なる場合でも、選定された検索エンジン30のカバーする適切な検索範囲で検索が行われることにより、検索が絞り込まれ、特定のコンテンツの属性に関連性の高い適切な検索結果を得ることができる。
【0061】
上記実施の形態では、1つのコンテンツ属性に基づいて検索エンジンを選定する場合を例に説明したが、この構成に限定されるものではなく、複数のコンテンツ属性に基づいて、これらコンテンツ属性と同一又は関連する1つ又は複数の検索エンジンを選定してもよい。
【0062】
また、上記実施の形態では、コンテンツ提供サーバ20からコンテンツが提供される場合を例に説明したが、この構成に限定されるものではなく、USB(Universal Serial Bus)メモリ等の情報記憶媒体からユーザコマンド処理部18を介して放送コンテンツが提供されてもよい。
【0063】
本発明は上述した実施例に限定されるものではなく、本発明の要旨を逸脱しない範囲で種々変形実施可能である。
【産業上の利用可能性】
【0064】
本発明は、コンテンツから生成した検索語の検索クエリーを検索エンジンに送信して関連情報を検索する検索支援装置に適用可能である。
【符号の説明】
【0065】
10 検索支援装置
20 コンテンツ提供サーバ
30 検索エンジン
50 ネットワーク
11 コンテンツ獲得部
12 検索語生成部
13 検索エンジン選定部
14 検索クエリー送信部(検索要求手段)
15 検索結果受信部
16 関連コンテンツ生成部
17 関連コンテンツ配信部
18 ユーザコマンド処理部
131 検索語分類部
132 検索エンジン判定部
133 検索エンジン特性保持部


【特許請求の範囲】
【請求項1】
情報伝達媒体を介してコンテンツを取得するコンテンツ獲得手段と、
取得したコンテンツからキーワードを抽出して検索語を生成する検索語生成手段と、
前記検索語生成手段が生成した検索語の抽出元のコンテンツの属性を示すコンテンツ属性に基づいて検索エンジンを選定する検索エンジン選定手段と、
前記検索エンジン選定手段が選定した検索エンジンに対して、前記検索語生成手段で生成した検索語を指定して検索要求する検索要求手段と、
前記検索要求した検索エンジンからの検索結果を受信する検索結果受信手段と、
前記コンテンツ獲得手段が取得したコンテンツと前記検索結果受信手段が受信した検索結果とに基づいて前記コンテンツに関連する関連コンテンツを生成する関連コンテンツ生成手段と、を備えたことを特徴とする検索支援装置。
【請求項2】
前記コンテンツは、放送コンテンツであり、前記関連コンテンツは、前記放送コンテンツ及び前記検索結果からなる放送関連コンテンツであることを特徴とする請求項1に記載の検索支援装置。
【請求項3】
前記検索エンジン選定手段は、前記コンテンツ属性が放送コンテンツの放送番組のジャンルである場合、当該放送番組のジャンルと同一又は関連する特性を持つ検索エンジンを選定することを特徴とする請求項1又は請求項2に記載の検索支援装置。
【請求項4】
前記放送コンテンツの放送番組の放送時間中に前記検索語生成手段が前記検索語の生成をした場合には、前記コンテンツ属性を放送時間中とし、前記検索エンジン選定手段は、前記放送時間中に関連する特性を持つ検索エンジンを選定することを特徴とする請求項1又は請求項2に記載の検索支援装置。
【請求項5】
前記放送コンテンツの放送番組の放送時間終了後に当該放送コンテンツに関連する関連コンテンツに対して情報更新要求を受けて前記検索語生成手段が検索語を生成した場合には前記コンテンツ属性を放送時間終了後とし、前記検索エンジン選定手段は、前記放送時間終了後に関連する特性を持つ検索エンジンを選定することを特徴とする請求項1又は請求項2に記載の検索支援装置。
【請求項6】
情報伝達媒体を介してコンテンツを取得するステップと、
取得したコンテンツからキーワードを抽出して検索語を生成するステップと、
生成した検索語の抽出元のコンテンツの属性を示すコンテンツ属性に基づいて検索エンジンを選定するステップと、
選定した前記検索エンジンに対して、生成した前記検索語を指定して検索要求するステップと、
検索要求した前記検索エンジンからの検索結果を受信するステップと、
取得した前記コンテンツと受信した前記検索結果とに基づいて前記コンテンツに関連する関連コンテンツを作成するステップと、を備えたことを特徴とする検索支援方法。



【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate


【公開番号】特開2011−145813(P2011−145813A)
【公開日】平成23年7月28日(2011.7.28)
【国際特許分類】
【出願番号】特願2010−4876(P2010−4876)
【出願日】平成22年1月13日(2010.1.13)
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.FLASH
【出願人】(392026693)株式会社エヌ・ティ・ティ・ドコモ (5,876)
【Fターム(参考)】