説明

候補提示装置、方法及びプログラム

【課題】従来よりも適切に候補を提示することにより、映像等のコンテンツの検索を容易にする技術を提供する。
【解決手段】メタデータ記憶部1には、コンテンツについての情報をメタデータとして、各コンテンツのメタデータが記憶されている。言語処理部2が、メタデータを構成する文字列を予測変換候補語として抽出する。抽出された予測変換候補語は予測変換候補語記憶部3に記憶される。露出度計算部5が、予測変換候補語がコンテンツに関連する所定のデータに現れる頻度についての情報をその予測変換候補語のその所定のデータについての露出度として、各予測変換候補語の露出度を計算する。予測変換候補語抽出部7が、ユーザによって入力された文字列を含む予測変換候補語を予測変換候補語記憶部から抽出する。候補語ソート部8が、抽出された予測変換候補語を露出度が高い順に出力する。

【発明の詳細な説明】
【技術分野】
【0001】
この発明は、ユーザによるコンテンツの検索を補助する技術に関する。
【背景技術】
【0002】
ユーザが検索窓にキーワードの入力を始めると、他のユーザの検索内容に基づいて検索の対象となるキーワードの候補を予測し、表示する技術が非特許文献1に記載されている。
【先行技術文献】
【非特許文献】
【0003】
【非特許文献1】[online]、[平成23年2月22日検索]、インターネット<URL=”http://www.google.com/support/websearch/bin/answer.py?hl=jp&answer=106230”>
【発明の概要】
【発明が解決しようとする課題】
【0004】
非特許文献1に記載された技術は、映像、音楽等のコンテンツの検索には特化されていない。このため、適切ではない候補が提示されることがある。
【0005】
この発明の課題は、映像、音楽等のコンテンツの検索において、従来よりも適切に候補を提示する候補提示装置、方法及びプログラムを提供することである。
【課題を解決するための手段】
【0006】
この発明の一態様による候補提示装置は、コンテンツについての情報をメタデータとして、各コンテンツのメタデータが記憶されているメタデータ記憶部と、メタデータを構成する文字列を予測変換候補語として抽出する言語処理部と、予測変換候補語が記憶される予測変換候補語記憶部と、予測変換候補語がコンテンツに関連する所定のデータに現れる頻度についての情報をその予測変換候補語のその所定のデータについての露出度として、各予測変換候補語の露出度を計算する露出度計算部と、ユーザによって入力された文字列を含む予測変換候補語を予測変換候補語記憶部から抽出する予測変換候補語抽出部と、抽出された予測変換候補語を露出度が高い順に出力する候補語ソート部と、を含む。
【発明の効果】
【0007】
コンテンツについての情報であるメタデータに基づいて予測変換候補語及びこれらを提示する順序を決定するため、従来よりも適切に候補を提示することができる。
【図面の簡単な説明】
【0008】
【図1】実施形態の候補提示装置の構成を説明するためのブロック図。
【図2】実施形態の候補提示方法の処理を説明するためのフローチャート。
【図3】実施形態の候補提示方法の処理を説明するためのフローチャート。
【図4】メタデータの例を示す図。
【図5】拡張されたメタデータの例を示す図。
【図6】露出度の例を示す図。
【図7】ユーザに提示される画面の例を示す図。
【発明を実施するための形態】
【0009】
以下、図面を参照してこの発明の一実施形態を説明する。
【0010】
図1に例示するように、候補提示装置0は、メタデータ記憶部1、言語処理部2、予測変換候補語記憶部3、露出度計算部5、露出度記憶部6、変換サーバ9、メタデータ提供部12、クロールサーバ13、クロールデータ記憶部14、メタデータ拡張部15、検索ログ収集部16を備える。変換サーバ9は、予測変換候補語抽出部7、候補語ソート部8、タイトル抽出部10、タイトルソート部11を備える。
【0011】
メタデータ記憶部1には、各コンテンツのメタデータが記憶されている。コンテンツは、例えば映画、TV番組等の映像や音楽である。メタデータとは、コンテンツについての情報である。
【0012】
放送型のサービスでは、放送時間、放送チャンネルの一覧、各番組のタイトル、概要、出演者等のコンテンツについての情報がEPG(Electric Program Guide)に記載されている。また、VOD(Video On Demand)等のオンデマンド型のサービスでは、タイトル、出演者名、内容に加えて映像の属するジャンル、キーワード、配信可能期間等のコンテンツについての情報がコンテンツに付与されている。これらのコンテンツについての情報が、メタデータの例である。メタデータの例を、図4に示す。
【0013】
言語処理部2は、メタデータ記憶部1からメタデータを読み込み、メタデータを構成する文字列を予測変換候補語として抽出する(ステップS1)。抽出された予測変換候補語は、予測変換候補語記憶部3に記憶される。
【0014】
そのために、まず、言語処理部2の形態素解析部21は、メタデータ記憶部1から読み込んだ各メタデータを形態素解析して、形態素に分割する。言語処理部2のデータ処理部22は、所定のルールに基づいて、形態素を選択、削除、結合等することにより文字列を生成する。この文字列が予測変換候補語として出力され、予測変換候補語記憶部3に記憶される。所定のルールは、例えば名詞の形態素又は固有名詞の形態素のみを出力するというルールである。また、所定のルールは、コンテンツの「タイトル」についてはそのまま出力するというルールであってもよい。
【0015】
露出度計算部5は、予測変換候補語がコンテンツに関連する所定のデータに現れる頻度についての情報をその予測変換候補語のその所定のデータについての露出度として、予測変換候補語記憶部3から読み込んだ各予測変換候補語の露出度を計算する(ステップS2)。計算された露出度は、露出度記憶部6に記憶される。
【0016】
コンテンツに関連する所定のデータとは、例えばメタデータ記憶部1に記憶されたメタデータである。この場合には、露出度計算部5は、予測変換候補語がメタデータ記憶部1に記憶されたメタデータに現れる回数をカウントして、その回数をその予測変換候補語の
メタデータ記憶部1に記憶されたメタデータについての露出度とする。
【0017】
後述するように、同一の予測変換候補語について複数の露出度が計算される場合がある。この場合の露出度記憶部6に記憶された複数の露出度の例を図6に示す。
【0018】
予測変換候補語抽出部7は、ユーザによって入力された文字列を含む予測変換候補語を予測変換候補語記憶部3から抽出する(ステップS3)。抽出された予測変換候補語は、候補語ソート部8に送信される。
【0019】
ユーザは例えば、TV等の映像視聴端末であるクライアント装置4に対して赤外線のリモコン装置で、視聴したいコンテンツを検索するための文字列を入力する。クライアント装置4は、入力された文字列を予測変換候補語抽出部7に送信する。ひらがなから漢字への変換前の未確定の文字列が送信されてもよいし、変換後の確定された文字列が送信されてもよい。TV等の映像視聴端末において、例えば図7の一番左の表示がされる。
【0020】
候補語ソート部8は、露出度記憶部6を参照して、抽出された予測変換候補語を露出度が高い順に出力する(ステップS4)。出力された予測変換候補語は、クライアント装置4に送信され、露出度が高い順にユーザに提示される。例えば、図7の左から2番目の表示がされる。この際、クライアント装置4の表示スペースに限りがある等の場合には、露出度が高い順に所定の数の予測変換候補語をユーザに提示してもよい。 予測変換候補語抽出部7において抽出された予測変換候補語が1つである場合には、候補語ソート部8の処理は行われずに、その1つの予測変換候補語がクライアント装置4に送信されユーザに提示される。
【0021】
ユーザは、提示された予測変換候補語の中から1つの予測変換候補語を選択する。クライアント装置4は、選択された予測変換候補語をタイトル抽出部10に送信する。
【0022】
タイトル抽出部10は、メタデータ記憶部1を参照して、ユーザによって選択された予測変換候補語をメタデータとして含むコンテンツのタイトルを抽出する(ステップS5)。抽出されたタイトルは、タイトルソート部11に送信される。
【0023】
例えば、図4の例において、出演者であるAの名前がユーザにより予測変換候補語として選択された場合には、Aをメタデータとして含むコンテンツのコンテンツIDは11111111Aとなる。このため、コンテンツIDが11111111Aであるコンテンツの「タイトル1」が、抽出される。
【0024】
タイトルソート部11は、露出度記憶部6を参照して、抽出されたタイトルを露出度が高い順に出力する(ステップS6)。出力されたタイトルは、クライアント装置4に送信され、露出度が高い順にユーザに提示される。例えば、図7の左から3番目の表示がされる。
【0025】
ユーザは、提示されたタイトルの中から1つのタイトルを選択する。クライアント装置4は、選択されたタイトルをメタデータ提供部12に送信する。
【0026】
メタデータ提供部12は、選択されたタイトルに対応するメタデータをメタデータ記憶部1から読み込み、クライアント装置4に送信する。クライアント装置4は、選択されたタイトルに対応するメタデータをユーザに提示する。例えば、図7の一番右の表示がされる。
【0027】
ユーザはそのメタデータを見て、そのコンテンツを視聴するか否かを決定する。
【0028】
なお、ユーザにタイトルを提示するときに、そのタイトルに対応するメタデータも一緒にユーザに提示してもよい。
【0029】
このように、コンテンツについての情報であるメタデータに基づいて予測変換候補語及びこれらを提示する順序を決定するため、従来よりも適切に候補を提示することができる。
【0030】
また、予測候補文字列をメタデータから生成し選択された予測候補文字列を含むタイトルをユーザに提示することにより、ユーザは必ずコンテンツのタイトルに到達することができるという有利な効果がある。
【0031】
[変形例等]
露出度計算部5は、予測変換候補語のメタデータについての露出度に代えて、各予測変換候補語のクロールデータについての露出度を計算して、その各予測変換候補語の露出度としてもよい。ここで、クロールデータとは、コンテンツについての他の情報であり、クロールサーバ13により生成され、クロールデータ記憶部14に記憶されている。
【0032】
クロールサーバ13は、外部サーバから、コンテンツに関連する公開された所定のデータをダウンロードして、クロールデータとしてクロールデータ記憶部14に記憶する。コンテンツに関連する公開された所定のデータとは、例えば、DVDを販売するWebサイト、VODサービスを提供しているWebサイト、WIKIPEDIA(登録商標)等のオンライン百科事典・辞書、ブログ、インターネットのポータルサイトに掲載されているニュース、よく検索される検索キーワードの一覧であるいわゆるホットキーワードである。コンテンツに関連する公開された所定のデータは、これらのデータのいくつかを合わせたデータであってもよい。例えば、同じジャンルの2以上のクロールデータを組み合わせることにより、ひとつのクロールデータが構成されていてもよい。
【0033】
露出度計算部5は、予測変換候補語のメタデータについての露出度と、予測変換候補語のクロールデータとの両方を考慮して、その予測変換候補語の露出度を決定してもよい。また、クロールデータが複数ある場合には、露出度計算部5は、クロールデータごとに各予測変換候補語の露出度を計算し、これらの計算された複数の露出度を考慮してその各予測変換候補語の露出度を決定してもよい。
【0034】
例えば、予測変換候補語のメタデータについての露出度をXとし、n=1,…,N−1として、予測変換候補語の第nのクロールデータについての露出度をXとする。また、αをユーザが設定可能な重み付き係数、βを他のユーザが設定したαの平均値、γをサービス提供者等の第三者が設定する重み付き係数、0≦p,q,r≦1をp+q+r=1の関係を満たす実数とする。このとき、露出度計算部5は、N個の露出度は次式に基づいて統合して、予測変換候補語の露出度として露出度記憶部6に記憶させる。
露出度=Σn=0(pα+qβ+rγ)X
【0035】
このようにして、露出度計算部5は、各予測変換候補語のメタデータ記憶部1に記憶されているメタデータについての露出度と、各予測変換候補語のクロールデータ記憶部14に記憶されているクロールデータについての露出度とを重み付き加算して、各予測変換候補語の露出度としてもよい。
【0036】
露出度計算部5は、時間帯、ユーザの視聴履歴、行動履歴、ユーザ属性等に基づいて、p,q,rを動的に変化させてもよい。
【0037】
また、検索ログ収集部16が、ユーザによって選択された予測変換候補語及びタイトルをカウントして、その予測変換候補語及びタイトルの露出度としてもよい。この露出度は、メタデータについての露出度、クロールデータについての露出度と同様に露出度記憶部6に記憶され重み付き加算される。
【0038】
候補提示装置0は、メタデータ記憶部1に記憶されたメタデータを補充するメタデータ拡張部15を備えていてもよい。メタデータ拡張部15は、例えばクロールデータ記憶部14に記憶されたクロールデータに基づいて、既存のメタデータを補充する。すなわち、クロールデータに存在するが、既存のメタデータに存在しないデータ(例えば、タイトルの読み仮名等)を補充して新たなメタデータとする。この拡張されたメタデータに基づいて上記の実施形態と同様の処理が行われる。図4のメタデータを拡張したメタデータの例を図5に示す。この図5の例では、タイトルの略称と、別の概要と、コンテンツIDが11125135Cのコンテンツの出演者についての情報が補充されている。
【0039】
候補提示装置0の各部間のデータのやり取りは直接行われてもよいし、図示していない記憶部を介して行われてもよい。
【0040】
その他、この発明は上述の実施形態に限定されるものではない。例えば、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。
【0041】
また、上述の構成をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。
【0042】
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。
【0043】
その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。
【符号の説明】
【0044】
0 候補提示装置
1 メタデータ記憶部
2 言語処理部
3 予測変換候補語記憶部
4 クライアント装置
5 露出度計算部
6 露出度記憶部
7 予測変換候補語抽出部
8 候補語ソート部
9 変換サーバ
10 タイトル抽出部
11 タイトルソート部
12 メタデータ提供部
13 クロールサーバ
14 クロールデータ記憶部
15 メタデータ拡張部
16 検索ログ収集部
21 形態素解析部
22 データ処理部

【特許請求の範囲】
【請求項1】
コンテンツについての情報をメタデータとして、各コンテンツのメタデータが記憶されているメタデータ記憶部と、
上記メタデータを構成する文字列を予測変換候補語として抽出する言語処理部と、
上記予測変換候補語が記憶される予測変換候補語記憶部と、
予測変換候補語がコンテンツに関連する所定のデータに現れる頻度についての情報をその予測変換候補語のその所定のデータについての露出度として、各上記予測変換候補語の露出度を計算する露出度計算部と、
ユーザによって入力された文字列を含む予測変換候補語を上記予測変換候補語記憶部から抽出する予測変換候補語抽出部と、
上記抽出された予測変換候補語を露出度が高い順に出力する候補語ソート部と、
を含む候補提示装置。
【請求項2】
請求項1の候補提示装置において、
ユーザによって選択された予測変換候補語をメタデータとして含むコンテンツのタイトルを抽出するタイトル抽出部と、
上記抽出されたタイトルを露出度が高い順に出力するタイトルソート部と、
を更に含む候補提示装置。
【請求項3】
請求項1又は2の候補提示装置において、
コンテンツに関連する他の情報であるクロールデータが記憶されているクロールデータ記憶部を更に含み、
上記露出度計算部は、上記各予測変換候補語の上記メタデータ記憶部に記憶されているメタデータについての露出度と、上記各予測変換候補語の上記クロールデータ記憶部に記憶されているクロールデータについての露出度とを重み付き加算して、上記各予測変換候補語の露出度とすることを特徴とする、
候補提示装置。
【請求項4】
メタデータ記憶部には、コンテンツについての情報をメタデータとして、各コンテンツのメタデータが記憶されているとし、
予測変換候補語記憶部には、予測変換候補語が記憶されるとし、
言語処理部が、上記メタデータを構成する文字列を予測変換候補語として抽出する言語処理ステップと、
露出度計算部が、予測変換候補語がコンテンツに関連する所定のデータに現れる頻度についての情報をその予測変換候補語のその所定のデータについての露出度として、各上記予測変換候補語の露出度を計算する露出度計算ステップと、
予測変換候補語抽出部が、ユーザによって入力された文字列を含む予測変換候補語を上記予測変換候補語記憶部から抽出する予測変換候補語抽出ステップと、
候補語ソート部が、上記抽出された予測変換候補語を露出度が高い順に出力する候補語ソートステップと、
を含む候補提示方法。
【請求項5】
請求項1から3の候補提示装置の各部としてコンピュータを機能させるためのプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate