説明

コンテンツ分類装置、コンテンツ分類方法、コンテンツ分類プログラムおよび記録媒体

【課題】 ユーザにコンテンツを分類する手間を与えることなく、コンテンツをグループに分類する。
【解決手段】
コンテンツ関連性判定部12は、コンテンツの内容を表すメタ情報と、このコンテンツと異なる他のコンテンツの内容を表す他のメタ情報とが少なくとも部分的に一致するとき、上記コンテンツと上記他のコンテンツとが互いに関連していると判定する。コンテンツ分類部13は、コンテンツ関連性判定手段によって互いに関連していると判定される上記コンテンツおよび上記他のコンテンツを、同一のグループに分類する。したがってコンテンツ分類装置は、ユーザにコンテンツを分類する手間を与えることなく、コンテンツをグループに分類できる

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、コンテンツを分類する手間をユーザに与えることなく、コンテンツをグループに自動的に分類できるコンテンツ分類装置、コンテンツ分類方法、コンテンツ分類プログラムおよび記録媒体に関する。
【背景技術】
【0002】
放送されている番組を受信できる装置として、テレビ、ハードディスクレコーダ、およびパーソナルコンピュータが知られている。これらの装置は、受信した番組を、ハードディスクなどの所定の記録媒体に保存することによって、番組を録画する。以前の装置は、番組を録画する場合に、各番組のコンテンツを、それぞれ所定のファイルとして、ルートディレクトリに順次配列するだけであった。そのため、ユーザは、多くのコンテンツの中から所望のコンテンツを迅速に検索することができなかった。
【0003】
この課題を解決する技術を開示する文献として、特許文献1がある。この文献には、提供される情報を取得する取得手段と、前記取得手段により取得された情報の中から、記録する情報を選択する選択手段と、前記選択手段により選択された情報を記録する第1の記録手段と、前記選択手段により選択された情報の分類を決定する決定手段と、前記決定手段により決定された分類を記録する第2の記録手段とを含むことを特徴とする情報処理装置が開示されている。
【0004】
特許文献1の装置では、録画予約時に、放送番組とともに番組情報を取得する。取得した番組情報から番組属性を抽出し、この番組属性の中から所定の文字列をユーザに選択させる。選択された文字列をディレクトリ名としてディレクトリを作成し、番組をディレクトリ下に記録する。これにより、番組を分類する。さらに、選択された文字列のディレクトリが既に存在する場合は、既存のディレクトリの下に番組を記録する。
【0005】
類似する技術は、特許文献2にも開示されている。
【特許文献1】特開2000−285638号公報(2000年10月13日公開)
【特許文献2】特開2000−285647号公報(2000年10月13日公開)
【発明の開示】
【発明が解決しようとする課題】
【0006】
しかし、特許文献1および2に開示されている技術では、番組ごとに、ユーザにディレクトリ名とする文字列を選択させる手間がかかる。ディレクトリ名になり得る文字列として、番組属性の中に、ジャンル、曜日、タイトル、出演者、およびキーワードなど多くの選択肢がある。そのため、ユーザは、番組を予約するたびに、その中から選択しなければならない。
【0007】
また、ユーザは、適当な分類状況になるように、予約の段階でディレクトリ構成を考えておかなければならない。適当な分類状況とは、コンテンツが適度に分散している状況をいう。すなわち、ある一つのディレクトリにコンテンツが偏ったり、もしくはディレクトリの数がコンテンツの数に近くなりディレクトリの意味をなさなかったりすることがない状況である。また、番組を検索する際に、ディレクトリの中身が容易に推測できるようなディレクトリ名にしておかなければならない。コンテンツが少ないうちには適当であるディレクトリ構成も、コンテンツが増減するにしたがって、不適当になりうる。1つのディレクトリに、コンテンツが偏る可能性があるからである。したがって、ユーザは、番組を検索しやすくするために、大きな負担を要して分類構成を最適化する必要が生ずる。
【0008】
さらに、ある特定のコンテンツは、ルートディレクトリに格納しておいた方が検索しやすい。たとえば、すぐに消去する予定のコンテンツや、録画したばかりで日付の新しいコンテンツや、ディレクトリを生成しても同じディレクトリ内のコンテンツ数が少ないコンテンツなどがそうである。したがって、全てのコンテンツを同じディレクトリに分類してしまうと、ユーザは検索時に必ず一度ディレクトリを選択しなければならず、使い勝手がよくない。
【0009】
タイトルなどの番組情報に基づいた場合、コンテンツを正しく分類できないこともある。これは、タイトルが省略されていたり、放送回数の表記やサブタイトルの表記に揺らぎが生ずる可能性があるからである。選択された文字列が、既存のディレクトリの中に存在すれば、新たにディレクトリは作成せず既存のディレクトリの下に記録する。しかし、逆に、存在しなければ、新たに選択された文字列のディレクトリを作成する。
【0010】
たとえば、番組属性の中でタイトルが選択され、ディレクトリ名がタイトルであるディレクトリが作成されたとする。ここでユーザは、同じ番組を同じディレクトリに記録したいとする。次に、別の日に同じ番組を予約する際に、ユーザは、予約時に同じように番組属性の中からタイトルを選択する。このとき、前回予約したときと、今回予約したときのタイトルが同表記であればよい。しかし、番組情報のデータには表記のゆらぎがある場合がある。そのため、この場合は、既存のディレクトリとの対応がとれず、新たに別のディレクトリが作成されてしまう。したがって、番組が、ユーザの思惑通りに分類されない可能性がある。
【0011】
本発明は上記の課題を解決するためになされたものであり、その目的は、コンテンツを分類する手間をユーザに与えることなく、コンテンツをグループに自動的に分類できるコンテンツ分類装置、コンテンツ分類方法、コンテンツ分類プログラムおよび記録媒体を提供することにある。
【課題を解決するための手段】
【0012】
本発明に係るコンテンツ分類装置は、上記の課題を解決するために、
コンテンツの内容を表す付加情報と、このコンテンツと異なる他のコンテンツの内容を表す他の付加情報とが少なくとも部分的に一致するとき、上記コンテンツと上記他のコンテンツとが互いに関連していると判定するコンテンツ関連性判定手段と、
上記コンテンツ関連性判定手段によって互いに関連していると判定される上記コンテンツおよび上記他のコンテンツを、同一のグループに分類するコンテンツ分類手段とを備えていることを特徴としている。
【0013】
上記の構成によれば、コンテンツ分類装置では、コンテンツ関連性判定手段が、コンテンツの内容を表す付加情報と、他のコンテンツの内容を表す他の付加情報とを比較する。ここでいう「コンテンツ」とは、たとえば、放送されている所定の番組である。また、「付加情報」とは、番組の内容を表す、たとえば電子番組表である。
【0014】
コンテンツ分類装置は、付加情報を内部に含んでいるコンテンツを取得することもできるし、コンテンツに付加されている付加情報を取得することもできるし、コンテンツと付加情報とを別々に取得することもできる。いずれにせよ、コンテンツ分類装置は、何らかの手段によって取得した付加情報と、他の付加情報とを比較する。このとき、付加情報および他の付加情報とが、少なくとも部分的に一致するなら、コンテンツ関連性判定手段は、コンテンツと他のコンテンツとを、互いに関連していると判定する。
【0015】
コンテンツ分類装置では、さらに、コンテンツ関連性判定手段によって互いに関連していると判定されたコンテンツおよび他のコンテンツを、コンテンツ分類手段が、同一のグループに分類する。たとえば、それぞれの電子番組表に、同じ出演者に関する情報が含まれていると判定されるとき、コンテンツ分類手段は、2つの番組を、その出演者に関するグループに分類する。
【0016】
このように、コンテンツ分類装置は、互いに関連していると判定する複数のコンテンツを、共通するグループに自動的に分類する。したがって、コンテンツ分類装置は、コンテンツをユーザに分類する手間を与えることなく、コンテンツをグループに自動的に分類できる効果を奏する。
【0017】
本発明に係るコンテンツ分類方法は、上記の課題を解決するために、
コンテンツの内容を表す付加情報と、このコンテンツと異なる他のコンテンツの内容を表す他の付加情報とが少なくとも部分的に一致するとき、上記コンテンツと上記他のコンテンツとが互いに関連していると判定するコンテンツ関連性判定ステップと、
上記コンテンツと上記他のコンテンツとが互いに関連していると判定されると、上記コンテンツと上記他のコンテンツとを同一のグループに分類するコンテンツ分類ステップとを含んでいることを特徴としている。
【0018】
上記の構成によれば、本発明に係るコンテンツ分類装置と同様の効果を奏する。
【0019】
また、本発明に係るコンテンツ分類装置では、さらに、
上記付加情報は、上記コンテンツの内容を表すキーワードを含んでおり、
上記他の付加情報は、上記他のコンテンツの内容を表す他のキーワードを含んでおり、
上記コンテンツ関連性判定手段は、
上記キーワードと上記他のキーワードとが少なくとも部分的に一致すると判定するとき、上記コンテンツと上記他のコンテンツとが互いに関連していると判定することが好ましい。
【0020】
上記の構成によれば、コンテンツの内容を表す付加情報は、所定のキーワードを含んでいる。このキーワードは、コンテンツの内容を表している。付加情報は、たとえばキーワードとして、コンテンツのタイトルを表すテキストを含んでいる。さらに、他のコンテンツの内容を表す他の付加情報も、所定の他のキーワードを含んでいる。この他のキーワードは、他のコンテンツの内容を表している。他の付加情報は、たとえば他のキーワードとして、他のコンテンツのジャンルを表すテキストを含んでいる。
【0021】
ここで、コンテンツ関連性判定手段は、キーワードと他のキーワードとが、少なくとも部分的に一致するとき、コンテンツおよび他のコンテンツが、互いに関連していると判定する。これにより、コンテンツ分類手段は、キーワード同士が互いにマッチングしているコンテンツおよび他のコンテンツを、共通するグループに分類する。
【0022】
したがって、付加情報全体を判定しなくても、キーワードのみを判定することによって、コンテンツと他のコンテンツとが関連するか否かを判定できる。このように、コンテンツ分類装置は、コンテンツをグループに分類するときの処理速度を、より速めることができる効果を奏する。
【0023】
また、本発明に係るコンテンツ分類装置では、さらに、
上記コンテンツ関連性判定手段は、
上記キーワードと上記他のキーワードとの距離が、あらかじめ定められた閾値より小さいとき、上記コンテンツと上記他のコンテンツとが互いに関連していると判定することが好ましい。
【0024】
上記の構成によれば、コンテンツ関連性判定手段は、2つのキーワードの間の距離を算出する。このとき、たとえば、DPマッチングによって、この距離を算出する。コンテンツ関連性判定手段は、算出した距離が、あらかじめ定められた閾値よりも小さいとき、コンテンツと他のコンテンツとが互いに関連していると判定する。これにより、コンテンツ分類手段は、キーワード間の距離が閾値よりも小さい複数のコンテンツを、共通するグループに分類する。したがって、コンテンツ分類装置は、より客観性の高い指標に基づき、コンテンツをグループに分類できる効果を奏する。
【0025】
また、本発明に係るコンテンツ分類装置では、さらに、
上記同一のグループの名前は、上記キーワードおよび上記他のキーワードに共通している文字列であることが好ましい。
【0026】
上記の構成によれば、コンテンツ分類手段は、キーワードおよび他のキーワードに共通している文字列が名前に設定されているグループに、コンテンツおよび他のコンテンツを分類する。これにより、コンテンツとの関連が深いグループに、コンテンツを分類できる効果を奏する。
【0027】
また、本発明に係るコンテンツ分類装置では、さらに、
上記キーワードが属するカテゴリは、上記他のキーワードが属するカテゴリと同一であることが好ましい。
【0028】
上記の構成によれば、コンテンツ関連性判定手段は、同一のカテゴリに属するキーワードおよび他のキーワードとが、少なくとも部分的に互いに一致するとき、コンテンツおよび他のコンテンツが互いに関連していると判定する。これにより、コンテンツ分類手段は、同一のカテゴリに属するキーワードがマッチングするコンテンツを、共通するグループに分類できる。したがって、コンテンツ分類装置は、コンテンツをグループに分類するときの精度を、より高くできる効果を奏する。
【0029】
また、本発明に係るコンテンツ分類装置では、さらに、
上記コンテンツ関連性判定手段は、さらに、上記付加情報に含まれる、上記カテゴリと異なる他のカテゴリに属するキーワードと、上記他の付加情報に含まれる、上記他のカテゴリに属する他のキーワードとが、少なくとも部分的に一致するとき、上記コンテンツと上記他のコンテンツとが互いに関連していると判定することが好ましい。
【0030】
上記の構成によれば、あるカテゴリに属するキーワードによってマッチングする2つのコンテンツに関して、さらに、このカテゴリと異なる他のカテゴリに属するキーワードによって、再びマッチングするか否かを判定する。すなわち、異なるカテゴリに属する2種類のキーワードが互いにマッチングしているとき、コンテンツ関連性判定手段は、2つのコンテンツを互いに関連していると判定する。これによりコンテンツ分類手段は、これら2つのコンテンツを、共通するグループに分類する。すなわち、分類するコンテンツを絞りこむ。
【0031】
このように、コンテンツ分類装置は、特定のグループに過剰なコンテンツが分類されることを防止できる効果を奏する。
【0032】
また、本発明に係るコンテンツ分類装置では、さらに、
上記キーワードは、より高い優先度が設定されているキーワードであることが好ましい。
【0033】
上記の構成によれば、コンテンツ関連性判定手段は、より高い優先度が設定されているキーワードを、コンテンツのマッチングに使用する。優先度が高いということは、他のキーワードよりも優先して、コンテンツのマッチングに使用されることが好ましいことを意味する。これにより、コンテンツ分類装置は、コンテンツを、コンテンツが分類されるべきより適切なグループに分類できる効果を奏する。
【0034】
また、本発明に係るコンテンツ分類装置では、さらに、
ユーザによる上記キーワードの選択を受け付るキーワード選択手段と、
ユーザによって選択された上記キーワードに、より高い優先度を設定する優先度設定手段とをさらに備えていることが好ましい。
【0035】
上記の構成によれば、優先度設定手段は、ユーザが選択したキーワードに、ユーザが選択しなかったキーワードより高い優先度を設定する。ここで、ユーザが選択するキーワードは、ユーザが嗜好している可能性が高いキーワードである。これにより、コンテンツ関連性判定手段は、ユーザが嗜好している可能性が高いキーワードがマッチングする2つのコンテンツを、互いに関連していると判定する。したがって、コンテンツ分類装置は、コンテンツをグループに分類する分類構成を、ユーザが求めるものにより近づけることができる効果を奏する。
【0036】
また、本発明に係るコンテンツ分類装置では、さらに、
ユーザの選択した上記グループの名前を受け付るグループ名選択手段と、
上記グループ名選択手段が受け付た上記グループの名前を含んでいる上記キーワードに、より高い優先度を設定する優先度設定手段さらに備えていることが好ましい。
【0037】
上記の構成によれば、優先度設定手段は、ユーザが選択したグループの名前を含んでいるキーワードに、より高い優先度を設定する。ここで、ユーザが選択する、グループの名前は、ユーザが嗜好している可能性が高い。これにより、コンテンツ関連性判定手段は、ユーザが嗜好している可能性が高い文字列を含んでいるキーワードによってマッチングされる2つのコンテンツを、同一のグループに分類する。したがって、コンテンツ分類装置は、コンテンツをグループに分類する分類構成を、ユーザが求めるものにより近づけることができる効果を奏する。
【0038】
また、本発明に係るコンテンツ分類装置では、さらに、
ユーザに関する情報の入力を受け付るユーザ情報入力手段と、
上記ユーザ情報入力手段によって受け付けられた上記ユーザに関する情報に含まれている文字列を含んでいるキーワードに、より高い優先度を設定する優先度設定手段とをさらに備えていることが好ましい。
【0039】
上記の構成によれば、優先度設定手段は、ユーザに関する情報に含まれている文字列を含んでいるキーワードに、より高い優先度を設定する。したがって、コンテンツ分類手段、ユーザに関する情報に関連が深いキーワードによってマッチングする2つのコンテンツを、同一のグループに分類する。
【0040】
したがって、コンテンツ分類装置は、コンテンツをグループに分類する分類構成を、ユーザが求めるものにより近づけることができる。さらに、このような処理を、ユーザが嗜好しているキーワードまたはグループの名前を入力することなく、実現できる。
【0041】
また、本発明に係るコンテンツ分類装置では、さらに、
上記コンテンツ分類手段は、
より高い優先度が設定されているキーワードおよび他のキーワードに共通する文字列を、より上位の階層に位置する上記グループの名前に設定することが好ましい。
【0042】
上記の構成によれば、より高い優先度が設定されているキーワードおよび他のキーワードに共通する文字列を、コンテンツおよび他のコンテンツを分類するグループの名前に設定する。さらに、このグループを、より上位の階層に位置させる。したがって、ユーザにより関連が深いグループを、より上位に位置させるため、ユーザがコンテンツを検索しやすいグループ構成にすることができる効果を奏する。
【0043】
また、本発明に係るコンテンツ分類装置では、さらに、
階層構造のグループがあらかじめ存在するとき、
より上位の階層に位置するグループの名前を含んでいるキーワードが属するカテゴリと同一のカテゴリに属するキーワードに、より上位の優先度を設定する優先度設定手段をさらに備えていることが好ましい。
【0044】
上記の構成によれば、優先度設定手段は、既存のグループの階層構造に基づき、この階層においてより上位に位置するグループの名前を含んでいるキーワードが属するカテゴリと同一のカテゴリに属するキーワードに、より高い優先度を設定する。したがって、コンテンツ分類装置は、コンテンツおよび他のコンテンツを分類するグループの階層構造を、既存のグループの階層構造に類似させることができる。これにより、グループの階層構造に統一感が生じるため、グループに分類されているコンテンツを検索しやすいグループ構成とすることができる効果を奏する。
【0045】
また、本発明に係るコンテンツ分類装置では、さらに、
ユーザによって指示された上記グループを削除するグループ削除手段をさらに備えていることが好ましい。
【0046】
上記の構成によれば、コンテンツ分類装置は、ユーザが不要と感じるグループを削除できる。これにより、管理しているグループの構成を最適化できる効果を奏する。
【0047】
また、本発明に係るコンテンツ分類装置では、さらに、
ユーザによって指示された上記グループを削除するグループ削除手段をさらに備え、
上記グループ削除手段によって削除されたグループの名前を含んでいるキーワードの優先度を、より下位に設定する優先度設定手段とを備えていることが好ましい。
【0048】
上記の構成によれば、コンテンツ分類装置は、ユーザが不要と感じるグループを削除できる。したがって、まず、管理しているグループの構成を最適化できる。コンテンツ分類装置では、さらに、優先度設定手段が、削除されたグループの名前を含んでいるキーワードの優先度を、より下位に設定する。
【0049】
ここで、ユーザが削除を要求するグループは、ユーザが不要と感じるグループである。すなわち、このグループの名前は、ユーザにとって、特に重要ではない可能性が高い。このとき、コンテンツ分類装置は、ユーザが特に重要と感じないキーワードの優先度を、より低く設定する。したがって、コンテンツ分類手段は、コンテンツおよび他のコンテンツが互いに関連しているかを判定するとき、このキーワードを使用しにくくなる。
【0050】
これにより、コンテンツ分類装置は、コンテンツをグループに分類するときの構成が、ユーザが望まないものになることを防止できる効果を奏する。
【0051】
また、本発明に係るコンテンツ分類装置では、さらに、
上記コンテンツ分類手段による分類結果を所定のディスプレイに表示する表示手段をさらに備えていることが好ましい。
【0052】
上記の構成によれば、表示手段は、コンテンツ分類手段がコンテンツをグループに分類した結果を、所定のディスプレイに表示する。たとえばコンテンツの新たな分類構成を、ディスプレイに表示する。これにより、ユーザは、コンテンツ分類装置が管理しているコンテンツの分類状況を、容易に把握できる効果を奏する。
【0053】
ユーザが選択した上記キーワードを学習する嗜好学習部と、
上記嗜好学習部が学習した上記キーワードに基づき、ユーザにコンテンツを推薦するコンテンツ推薦手段とをさらに備えていることが好ましい。
【0054】
上記の構成によれば、嗜好学習部は、ユーザが選択したキーワードを、たとえば、ユーザが嗜好しているキーワードとして学習する。このとき、学習したキーワードを、たとえば、所定の嗜好情報データベースに記憶する。これにより、コンテンツ推薦手段は、嗜好学習部が学習したキーワードに基づき、このキーワードによる表されるコンテンツを、ユーザに推薦する。たとえば、所定のディスプレイに、このコンテンツに関する情報を表示することによって、コンテンツをユーザに推薦する。
【0055】
このように、コンテンツ分類装置は、コンテンツのマッチングに使用するキーワードをユーザが選択するだけで、ユーザが嗜好している可能性が高いコンテンツをユーザに推薦できる効果を奏する。
【0056】
また、本発明に係るコンテンツ分類装置では、さらに、
ユーザの指示に基づき、上記グループに新たなコンテンツを追加するコンテンツ追加手段と、
上記コンテンツ追加手段によって上記新たなコンテンツが上記グループに追加されたとき、上記新たなコンテンツの内容を表すキーワードと、上記グループにあらかじめ含まれているコンテンツの内容を表すキーワードとの距離のうち、最大の距離を算出するキーワード距離測定手段と、
上記最大の距離があらかじめ定められた閾値よりも大きいとき、この最大の距離を新たな閾値に設定する閾値設定手段とをさらに備えていることが好ましい。
【0057】
上記の構成によれば、コンテンツ分類装置では、ユーザが指示したコンテンツを、コンテンツ追加手段がグループに追加する。さらに、キーワード距離測定手段は、新たなコンテンツの内容を表すキーワードと、このコンテンツが分類されるグループにあらかじめ含まれているコンテンツの内容を表すキーワードとの距離のうち、最大の距離を算出する。つぎに、キーワード距離測定手段が算出する最大の距離が、グループにあらかじめ定められた閾値よりも大きいとき、この最大の距離を、グループの新たな閾値に設定する。
【0058】
ユーザが、あるコンテンツをグループに追加することをコンテンツ分類装置に指示するのは、グループに分類されるコンテンツの範囲を、より広くして欲しいからである可能性が高い。そこで、閾値設定手段は、あらかじめ定められた閾値を、より大きい値に変更することによって、より多くのコンテンツをこのグループに分類できるようにする。このように、コンテンツ分類装置は、ユーザが要求したコンテンツをグループに追加だけで、このグループに新たに追加されるコンテンツの範囲を自動的に広げることができる効果を奏する。
【0059】
また、本発明に係るコンテンツ分類装置では、さらに、
ユーザによって指示された上記コンテンツを、上記グループから取り除くコンテンツ削除手段と、
上記コンテンツ削除手段によって上記グループから上記コンテンツが取り除かれたとき、上記グループから任意に選択される第1コンテンツの内容を表すキーワードと、上記グループから任意に選択される、上記第1コンテンツと異なる第2コンテンツの内容を表す他のキーワードとの距離のうち、最大の距離を算出するキーワード距離測定手段と、
上記最大の距離が上記あらかじめ定められた閾値よりも小さいとき、この最大の距離を新たな閾値に設定する閾値設定手段とをさらに備えていることが好ましい。
【0060】
上記の構成によれば、コンテンツ分類装置では、コンテンツ削除手段が、ユーザが指示したコンテンツを、コンテンツ追加手段がグループから取り除く。さらに、キーワード距離測定手段は、コンテンツが取り除かれた後のグループから任意に選択される第1コンテンツの内容を表すキーワードと、同じく任意に選択される第2コンテンツの内容を表す他のキーワードとの距離のうち、最大の距離を算出する。つぎに、閾値設定手段が、算出された最大の距離が、あらかじめ定められた閾値よりも小さいとき、この最大の距離を、新たな閾値に設定する。
【0061】
ユーザが、あるコンテンツをグループから取り除くことをコンテンツ分類装置に指示するのは、グループに分類するコンテンツの範囲を、より狭くして欲しいからである可能性が高い。そこで、閾値設定手段は、あらかじめ定められた閾値を、より小さい値に変更することによって、このグループに次に分類されるコンテンツの数がより少なくなるように、調整する。このように、コンテンツ分類装置は、ユーザが要求したコンテンツをグループから取り除くだけで、このグループに新たに追加されるコンテンツの範囲を自動的に狭めることができる効果を奏する。
【0062】
また、本発明に係るコンテンツ分類装置では、さらに、
ユーザが指示した新たなコンテンツを上記グループに追加するコンテンツ追加手段をさらに備え、
上記コンテンツ分類手段は、
上記コンテンツ追加手段によって上記グループに上記新たなコンテンツが追加されたとき、上記グループに含まれる各コンテンツの内容を表している上記キーワードに共通する文字列を、上記グループの新たな名前に設定することが好ましい。
【0063】
上記の構成によれば、コンテンツ追加手段は、ユーザが指示したコンテンツを、グループに追加する。これにより、コンテンツ分類手段は、新たなコンテンツが追加されるグループの名前を変更する。具体的には、コンテンツ分類手段は、グループに分類されている各コンテンツの内容を表す各キーワードに共通する文字列を、抽出し、この文字列を、グループの名前に設定する。これにより、グループに設定される名前は、グループに追加された新たなコンテンツのキーワードを反映したものとなる。
【0064】
このように、コンテンツ分類装置は、グループに新たに追加されたコンテンツを反映した、より適切な名前をグループに設定できる効果を奏する。
【0065】
また、本発明に係るコンテンツ分類装置では、さらに、
ユーザによって指示された上記コンテンツを上記グループから取り除くコンテンツ削除手段をさらに備え、
上記コンテンツ分類手段は、
上記コンテンツ削除手段によって上記コンテンツが上記グループから取り除かれたとき、上記グループに新たに含まれる各コンテンツの内容を表す上記キーワードに共通する文字列を、上記グループの名前に新たに設定することが好ましい。
【0066】
上記の構成によれば、コンテンツ削除手段は、ユーザが指示したコンテンツを、グループから取り除く。これにより、コンテンツ分類手段は、グループの名前を変更する。具体的には、コンテンツ分類手段は、グループに残されている各コンテンツの内容を表す各キーワードに共通する文字列を抽出し、この文字列を、グループの名前に設定する。したがって、グループに設定される名前は、グループに残されているコンテンツを反映した、すなわちグループに取り除かれたコンテンツを反映しないものとなる。
【0067】
このように、コンテンツ分類装置は、あるコンテンツが取り除かれた後にグループに残されているコンテンツを反映した、より適切な名前をグループに新たに設定できる効果を奏する。
【0068】
また、本発明に係るコンテンツ分類装置では、さらに、
所定の番組を上記コンテンツとして受信する番組受信手段と、
上記番組の内容を表す番組情報を上記付加情報として取得する番組情報取得手段とをさらに備えていることが好ましい。
【0069】
上記の構成によれば、コンテンツ分類装置は、番組をグループに分類する手間をユーザに与えることなく、受信した番組をグループに自動的に分類できる効果を奏する。
【0070】
また、本発明に係るコンテンツ分類装置では、さらに、
上記付加情報は、上記番組の内容を表す所定のキーワードを含んでおり、
上記他の付加情報は、上記他の番組の内容を表す所定の他のキーワードを含んでおり、
上記コンテンツ関連性判定手段は、
上記キーワードと上記他のキーワードとが少なくとも部分的に一致すると判定するとき、上記番組と上記他の番組とが互いに関連していると判定することが好ましい
上記の構成によれば、コンテンツ分類装置は、番組をより適切なグループに分類できる効果を奏する。
【0071】
また、本発明に係るコンテンツ分類装置では、さらに、
ユーザが録画および視聴の少なくともいずれかを要求した上記番組を表す上記番組情報を所定の記録媒体に保存する番組情報保存手段と、
上記記録媒体に記憶されている上記番組情報に含まれている文字列を含んでいる上記キーワードに、より高い優先度を設定する優先度設定手段とをさらに備えていることが好ましい。
【0072】
上記の構成によれば、番組情報保存手段は、ユーザが録画および視聴の少なくともいずれかを要求した番組の表す番組情報を、所定の記録媒体に記憶する。すなわち番組情報保存手段は、ユーザが指定した番組の履歴を記録媒体に蓄積する。これにより優先度設定手段は、記録媒体に記憶されている番組情報に含まれている文字列を含んでいるキーワードに、より高い優先度を設定する。すなわち、優先度設定手段は、ユーザが録画する番組より、視聴する番組を表すキーワードに、より高い優先度を設定する。したがって、コンテンツ分類手段は、ユーザが普段親しんでいる番組を表すキーワードのマッチング結果に基づき、番組をグループに分類する。
【0073】
これにより、コンテンツ分類装置では、ユーザが番組の嗜好に関する情報を入力しなくても、番組をユーザの嗜好にあわせてグループに自動的に分類できる効果を奏する
上記記録媒体に記憶されている上記番組情報に含まれている文字列を含んでいる上記キーワードを学習する嗜好学習部と、
上記嗜好学習部が学習した上記キーワードに基づき、ユーザに番組を推薦する番組推薦手段とをさらに備えていることが好ましい。
【0074】
上記の構成によれば、嗜好学習部は、ユーザが指定した番組の履歴に基づき、キーワードを学習する。このとき、学習したキーワードを、たとえば、所定の嗜好情報データベースに記憶する。これにより、番組推薦手段は、嗜好学習部が学習したキーワードに基づき、このキーワードによる表される番組を、ユーザに推薦する。たとえば、所定のディスプレイに、この番組について情報を表示することによって、番組をユーザに推薦する。
【0075】
このように、コンテンツ分類装置は、ユーザが番組を視聴したり録画したりするだけで、ユーザが嗜好している可能性が高い番組をユーザに自動的に推薦できる効果を奏する。
【0076】
ユーザによる上記キーワードの選択を受け付るキーワード選択手段と、
ユーザが選択した上記キーワードを学習する嗜好学習部と、
上記嗜好学習部が学習した上記キーワードに基づき、ユーザに番組を推薦する番組推薦手段とをさらに備えていることが好ましい。
x 上記の構成によれば、嗜好学習部は、ユーザが選択したキーワードを、たとえば、ユーザが嗜好しているキーワードとして学習する。このとき、学習したキーワードを、たとえば、所定の嗜好情報データベースに記憶する。これにより、番組推薦手段は、嗜好学習部が学習したキーワードに基づき、このキーワードによって表される番組を、ユーザに推薦する。たとえば、所定のディスプレイに、この番組に関する情報を表示することによって、番組をユーザに推薦する。
【0077】
このように、コンテンツ分類装置は、番組のマッチングに使用するキーワードをユーザが選択するだけで、ユーザが嗜好している可能性が高い番組をユーザに自動的に推薦できる効果を奏する。
【0078】
なお、上記コンテンツ分類装置は、コンピュータによって実現してもよい。この場合、コンピュータを上記各手段として動作させることにより上記コンテンツ分類装置をコンピュータにおいて実現するコンテンツ分類プログラム、およびそのコンテンツ分類プログラムを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に入る。
【発明の効果】
【0079】
以上のように、本発明に係るコンテンツ分類装置は、互いに関連していると判定されたコンテンツおよび他のコンテンツとを、同一のグループに分類するコンテンツ分類手段を備えているため、コンテンツを分類する手間をユーザに与えることなく、コンテンツをグループに自動的に分類できる効果を奏する。
【発明を実施するための最良の形態】
【0080】
本発明の一実施形態について、図1から図21を参照して以下に説明する。
(コンテンツ分類装置1)
まず、本実施形態に係るコンテンツ分類装置1の構成について、図1を参照して以下に説明する。図1は、本発明の一実施形態に係るコンテンツ分類装置1の詳細を表すブロック図である。この図によれば、コンテンツ分類装置1は、入力部2、ディスプレイ4、コンテンツデータベース5、分類データベース6、およびコンテンツ管理部10を備えている。
(入力部2)
入力部2は、所定のコンテンツの入力を受け付る。このコンテンツは、たとえば、ウェブページまたは電子書籍などである。入力部2は、さらに、このコンテンツの内容を表すメタ情報(付加情報)の入力を受け付る。入力部2は、入力されるコンテンツおよびメタ情報を、コンテンツ管理部10に出力する。
(表示部3およびディスプレイ4)
表示部3は、コンテンツの分類に関する所定の情報をディスプレイ4に表示する。たとえば、現在のコンテンツの分類構成をディスプレイ4に表示する。また、コンテンツをグループに分類するときにユーザに選択させるキーワードの一覧を表示する。
(コンテンツデータベース5)
コンテンツデータベース5は、コンテンツ分類装置1に入力されるコンテンツを格納しているデータベースである。このデータベースは、さらに、コンテンツの内容を表すメタ情報も格納している。コンテンツデータベース5は、コンテンツ分類装置1において、所定の図示しないメモリに形成されている。
(分類データベース6)
分類データベース6は、コンテンツがどのグループに分類されているかを定義している表示用データを格納しているデータベースである。この分類データの詳細は、後述する。分類データベース6は、コンテンツ分類装置1において、所定の図示しないメモリに形成されている。
(コンテンツ管理部10)
コンテンツ管理部10は、入力部2を通じて入力されるコンテンツを、コンテンツデータベース5および分類データベース6において管理する。コンテンツ管理部10は、その内部にサブモジュールとして、キーワード抽出部11、コンテンツ関連性判定部12(コンテンツ関連性判定手段)、コンテンツ分類部13(コンテンツ分類手段)、優先度設定部14(優先度設定手段)、グループ作成部15、グループ削除部16(グループ削除手段)、および嗜好学習部17(嗜好学習手段)を備えている。
【0081】
次に、これらの各部材について説明する。
(キーワード抽出部11)
キーワード抽出部11は、コンテンツの内容を表すメタ情報から、所定のキーワードを抽出する。キーワード抽出部11は、新たに入力されるコンテンツを表すメタ情報から、たとえば所定のテキストデータによって表されるキーワードを抽出できる。さらに、既存のグループに分類されているコンテンツを表すメタ情報からも、コンテンツの内容を表すキーワードを抽出する。このときキーワード抽出部11は、コンテンツデータベース5に格納されているメタ情報から、キーワードを抽出する。
【0082】
キーワード抽出部11は、抽出したキーワードを、コンテンツ関連性判定部12に出力する。
(コンテンツ関連性判定部12)
コンテンツ関連性判定部12は、コンテンツと、このコンテンツと異なる他のコンテンツとが、互いに関連しているかを判定する。具体的には、コンテンツ関連性判定部12は、コンテンツの内容を表すメタ情報と、このコンテンツとは異なる他のコンテンツを表す他のメタ情報とが、少なくとも部分的に一致するか否かを判定する。一致すると判定するとき、コンテンツ関連性判定部12は、コンテンツおよび他のコンテンツを互いに関連していると判定する。
【0083】
コンテンツ関連性判定部12は、さらに、メタ情報から抽出したキーワードと、他のメタ情報から抽出した他のキーワードとが、少なくとも部分的に一致するときも、コンテンツと他のコンテンツとを、互いに関連していると判定する。すなわち、コンテンツ関連性判定部12は、コンテンツの内容を表すキーワードのマッチングによって、2つのコンテンツが関連しているかを判定する。
【0084】
なお、コンテンツ関連性判定部12は、判定の結果を、コンテンツ分類部13に分類する。
(コンテンツ分類部13)
コンテンツ分類部13は、コンテンツ関連性判定部12による判定結果に基づき、コンテンツをグループに分類する。たとえば、コンテンツ分類装置1に新たに入力されるコンテンツを、作成済みのグループに分類する。また、新たに入力された複数のコンテンツを、新たに作成されるグループに分類することもできる。
(優先度設定部14)
優先度設定部14は、キーワードに優先度を設定する。この詳細は、後述する。
(グループ作成部15)
グループ作成部15は、コンテンツを分類するためのグループを作成する。グループ作成部15は、2つのコンテンツのキーワードに共通する文字列を、グループの名前に設定することができる。この詳細は、後述する。
(グループ削除部16)
グループ削除部16は、ユーザが指定した既存のグループを削除する。すなわち、分類データベース6に記憶されている分類データから、ユーザが指定したグループに関する情報を削除する。
(嗜好学習部17)
嗜好学習部17は、ユーザが選択したキーワードを学習する。このとき、嗜好学習部17は、学習したキーワードに関する情報を、図示しない嗜好情報データベースに記憶している。詳細は後述する。
【0085】
なお、コンテンツ分類装置1において、キーワード抽出部11、コンテンツ関連性判定部12、コンテンツ分類部13、グループ作成部15、およびグループ削除部16は、それぞれの機能を併せて持った、一つの部材として実装されていてもよい。その意味では、たとえば、コンテンツ分類部13がグループ作成部15としての機能を有していてもよい。
(コンピュータシステム構成)
本実施の形態に係るコンテンツ分類装置1は、実質的には、コンピュータハードウェアと、そのコンピュータハードウェアにより実行されるプログラムと、コンピュータハードウェアに格納されるデータとにより実現される。
【0086】
そこで、コンテンツ分類装置1を実現するコンピュータシステム200について、図2を参照して以下に説明する。図2は、コンテンツ分類装置1を実現するコンピュータシステム200を示す図である。
【0087】
この図によれば、コンピュータシステム200は、光ディスクドライブ201および磁気ディスクドライブ202を有するコンピュータ220と、モニタ203と、リモコン204とを備えている。
【0088】
コンピュータ220は、光ディスクドライブ201および磁気ディスクドライブ202に加えて、リモコン204からの信号を受信するリモコンインタフェース(I/F)205を備えている。さらに、CPU(中央処理装置)206を備えている。さらに、リモコンインタフェース205、CPU206、光ディスクドライブ201および磁気ディスクドライブ202に接続されたバス207を備えている。さらに、バス207に接続され、ブートアッププログラム等を記憶する読出専用メモリ(ROM)208を備えている。さらに、同じくバス207に接続され、プログラム命令、システムプログラム、および作業データ等を記憶するランダムアクセスメモリ(RAM)209を備えている。
【0089】
図2には示さないが、コンピュータ220は、さらに、ローカルエリアネットワーク(LAN)への接続を提供するネットワークアダプタボードを備えてもよい。
【0090】
コンピュータシステム200に情報処理装置の機能を実現させるためのプログラム、入力情報はいずれも、光ディスクドライブ201に挿入される光ディスク210に記憶されている。または、磁気ディスクドライブ202に挿入される磁気ディスク211に記憶されている。この記録媒体に記憶されているコンテンツ分類プログラムは、ハードディスク212に転送される。または、コンテンツ分類プログラムは、図示しないネットワークを通じてコンピュータ220に送信され、ハードディスク212に記憶されてもよい。コンテンツ分類プログラムは、RAM209にロードされることによって、実行される。なお、光ディスク210から、磁気ディスク211から、またはネットワークを介して、直接にRAM209にプログラムをロードしてもよい。
【0091】
このコンテンツ分類プログラムは、コンピュータ220に、本実施の形態に係るコンテンツ分類装置1の機能を実現させる複数の命令を含んでいる。これら機能を実現させるのに必要な基本的機能のいくつかは、コンピュータ220上で動作するオペレーティングシステム(OS)またはサードパーティのプログラム、若しくはコンピュータ220にインストールされる各種ツールキットのモジュールにより提供される。したがって、このコンテンツ分類プログラムは、本実施形態に係るコンテンツ分類装置1の機能を実現するのに必要な機能の全てを必ずしも含まなくてよい。すなわちコンテンツ分類プログラムは、命令のうち、所望の結果が得られるように制御されたやり方で適切な機能または「ツール」を呼出すことにより、上記した情報処理装置の制御を実行する命令のみを含んでいればよい。コンピュータシステム200の動作は周知であるので、ここでは繰り返さない。
【0092】
なお、情報処理装置の機能を実現するためのプログラムが記憶されている記録媒体は、CD−ROM(コンパクトディスク読取専用メモリ)、MO(Magneto−Optical disc)、MD(Mini Disc)、およびDVD(Digital Versatile Disc)等の光ディスク210、FD(フレキシブルディスク)およびハードディスク等の磁気ディスク211に限らない。磁気テープおよびカセットテープ等のテープ、IC(Integrated Circuit)カードおよび光カード等のカード型記録媒体、並びにマスクROM、EPROM(Erasable Programable ROM)、EEPROM(Electrically Erasable Programable ROM)、およびフラッシュROM等の半導体メモリのいずれかでもよい。ただし、コンピュータシステム200は、これら記録媒体からの読出を行なうための読出装置を実装する必要がある。
(コンテンツおよびメタ情報のデータ構造)
コンテンツ分類装置1が処理するコンテンツ、およびこのコンテンツの内容を表すメタ情報のデータ構造について、図3を参照して以下に説明する。図3は、コンテンツおよびメタ情報を表すコンテンツデータを説明する図である。この図によれば、コンテンツ分類装置1が処理するコンテンツデータは、コンテンツを表すコンテンツ領域と、メタ情報を表すメタ情報領域とが一体化された構造である。
【0093】
コンテンツデータは、文字通り、コンテンツを構成するデータである。メタ情報は、このコンテンツの内容を表す、所定の情報である。図3に示すように、メタ情報は、所定のキーワードを含んでいる。各キーワードは、コンテンツの内容を表している。また、これらのキーワードは、それぞれ、所定のカテゴリに属している。たとえば、キーワード「コンテンツABCパート4」は、カテゴリ「タイトル」に属している。さらに、キーワード「田中一朗」は、カテゴリ「作成者」に属している。
【0094】
キーワードが属するカテゴリの例として、たとえば、作成者、作成日、コンテンツサイズ、および内容説明がある。これらのカテゴリは、いずれも、コンテンツに関する特定の特徴を端的に表した所定の属性である。
(分類データベース6の詳細)
上述したように、コンテンツ分類装置1は、コンテンツのどのグループに分類するか否かを、分類データベース6を使用して管理している。そこで、この分類データベース6の詳細について、図4を参照して以下に説明する。図4は、分類データベース6の詳細を表す図である。
【0095】
この図によれば、分類データベース6は、コンテンツと、コンテンツが分類されているグループとの対応関係を表すデータベースである。すなわち、分類データベース6は、コンテンツのタイトルと、グループの名前とを互いに関連付け、格納している。さらに、グループごとに、グループの名前と、この名前が属するカテゴリとを関連付け、格納している。ここでいう、グループの名前が属する「カテゴリ」は、グループ作成部15がグループの名前を決定するときに使用した、コンテンツの内容を表すキーワードが属するカテゴリと、同一である。
(グループ分類フラグ)
分類データベース6は、さらに、所定のグループ分類フラグを格納している。このグループ分類フラグは、あるコンテンツがあるグループに分類されているか否かを表している。グループ分類フラグは、分類データベース6において、コンテンツのタイトルと、このコンテンツが分類されているグループの名前とに関連付られている。
【0096】
グループ分類フラグが「1」のとき、コンテンツはグループに分類されている。たとえば、コンテンツのタイトルである「コンテンツABC」と、グループの名前である「コンテンツABC」とに関連付られているグループ分類フラグは、「1」である。すなわちコンテンツ「コンテンツABC」は、グループ「コンテンツABC」に分類されている。なお、グループ分類フラグが「0」のとき、コンテンツはグループに分類されていない。
(キーワードの格納)
分類データベース6は、さらに、あるコンテンツをあるグループに分類することを決定したときに使用されたキーワードを格納している。このキーワードは、分類データベース6において、コンテンツのタイトルと、このコンテンツが分類されているグループの名前とに関連付られている。分類データベース6に格納されているキーワードが属するカテゴリは、このキーワードが関連付られているグループの名前が属するカテゴリと同一である。すなわち、キーワードは、カテゴリが同一のグループに関連付られて格納されている。
【0097】
図4に示す例では、タイトルがコンテンツABC、コンテンツABCパート2、およびコンテンツABCパート3である3つのコンテンツが、いずれも、名前がコンテンツABCである1つのグループに分類されている。グループ「コンテンツABC」の名前は、図4に示すように、カテゴリ「タイトル」に属している。そこで、コンテンツ分類装置1は、新たに入力されるコンテンツをこのグループに分類するか否かを、このコンテンツの内容を表すメタ情報に含まれているキーワードのうち、カテゴリ「タイトル」に属するキーワードをマッチングに使用することによって、決定する。すなわち、コンテンツ関連性判定部12は、同一のカテゴリに属するキーワードを使用することによって、キーワードのマッチングを実行する。
【0098】
図4に示すように、各コンテンツ「データ1」、「データ2」、「情報1」、および「情報2」は、いずれも、グループ「山田」に分類されている。このグループの名前「山田」は、カテゴリ「作成者」に属している。そこでコンテンツ分類装置1は、新たに入力されるコンテンツをこのグループに分類するか否かを、このコンテンツの内容を表すメタ情報に含まれているキーワードのうち、カテゴリ「作成者」に属するキーワードをマッチングに使用することによって、決定する。
(キーワードの抽出)
コンテンツ分類装置1では、キーワード抽出部11が、メタ情報から所定のキーワードを抽出する。さらに、他のメタ情報から所定の他のキーワードを抽出する。以下では、説明の便宜のため、キーワードという表現は、他のキーワードである意味も含むものとする。この点は、コンテンツ、メタ情報、番組についても同様である。
【0099】
キーワード抽出部11は、1つのメタ情報から、各カテゴリに属する全てのキーワードを抽出する。たとえば、図3に示すメタ情報から、キーワードを抽出するとき、キーワード抽出部11は、タイトル、作成者、作成日、コンテンツサイズ、ジャンル、および内容説明のカテゴリに属するキーワードを、それぞれ、抽出する。
【0100】
キーワード抽出部11は、あるカテゴリに属するキーワードとして抽出した文字列から、さらに、単語などの、より短い部分文字列を抽出してもよい。たとえば、コンテンツの作成者は、1人だけではなく、複数人であることもある。複数の作成者によって作成されるコンテンツでは、その内容を表すメタ情報には、カテゴリ「作成者」に属するキーワードとして、「山田太郎、山田一朗」のように、各作成者をそれぞれ表す複数の文字列を含んでいる。すなわち、1つのカテゴリに、複数の情報が含まれる。このようなとき、キーワード抽出部11は、1つのカテゴリに属する複数の情報を、それぞれ、1つのキーワードとして抽出すればよい。
【0101】
キーワード抽出部11は、さらに、各カテゴリに属する文字列、たとえば、カテゴリ「タイトル」に属する文字列、または、カテゴリ「内容説明」に属する文字列を、それぞれ、形態素解析によって、名詞のみや動詞のみなど、より短い部分文字列として抽出してもよい。
【0102】
このときコンテンツ関連性判定部12は、抽出した各部分文字列を、それぞれ、1つのキーワードとして使用してもよい。なお、以下では、メタ情報から抽出する、各カテゴリに属する文字列を、そのまま、キーワードとして使用する例を説明する。
(コンテンツ関連性の判定)
コンテンツ分類装置1では、コンテンツ関連性判定部12が、コンテンツ分類装置1に新たに入力されたコンテンツを、作成済みのグループに分類するか否かを判定する。このとき、コンテンツ関連性判定部12は、入力されたコンテンツのメタ情報から抽出したキーワードと、既存のグループに含まれている各コンテンツのメタ情報から抽出したキーワードとを比較する。これにより、入力されたコンテンツと、グループに既存のコンテンツ(他のコンテンツ)とが、互いに関連するか否かを判定する。
【0103】
このときコンテンツ関連性判定部12は、既存のグループの名前が属するカテゴリと同一のカテゴリに属するキーワードを使用する。たとえば、グループの名前がカテゴリ「タイトル」に属するとき、入力されたコンテンツのメタ情報から抽出される、カテゴリ「タイトル」に属するキーワード(たとえば、コンテンツABCパート4)と、既存のグループに分類されている他のコンテンツのメタ情報から抽出される、カテゴリ「タイトル」に属するキーワード(たとえば、コンテンツABCパート2)とを比較する。コンテンツ関連性判定部12は、これらのキーワードが互いにマッチングするとき、追加コンテンツを上記グループに分類することを決定する。
【0104】
この決定に基づき、コンテンツ分類部13は、コンテンツをグループに分類する。すなわち、追加するコンテンツのメタ情報から抽出される、グループのタイトルと、マッチングに使用したキーワードとを、分類データベース6に保存する。さらに、分類する先のグループの名前に、グループ分類フラグを立てる。
(距離の算出)
上述したように、コンテンツ関連性判定部12は、新たに入力されたコンテンツの内容をキーワードと、既存のグループに分類されているコンテンツの内容を表すキーワードとが、少なくとも部分的に一致するとき、このコンテンツと他のコンテンツとを、互いに関連していると判定する。ここで、コンテンツ関連性判定部12は、2つのキーワード間の距離が、あらかじめ定められた閾値よりも小さいとき、2つのコンテンツが互いに関連していると判定してもよい。
【0105】
このとき、コンテンツ関連性判定部12は、キーワードと、他のキーワードとの距離を算出する。さらに、この距離を、あらかじめ定められた閾値と比較する。この閾値は、コンテンツ分類装置1において、図示しないメモリにあらかじめ格納されている。コンテンツ関連性判定部12は、算出した距離が、あらかじめ定められた閾値より小さいとき、比較した2つのキーワードを互いにマッチングすると判定する。2つのキーワードがマッチングしていると判定するとき、コンテンツ関連性判定部12は、コンテンツと他のコンテンツとを、互いに関連していると判定する。
(DPマッチング)
コンテンツ関連性判定部12は、キーワードと、他のキーワードとの距離を、たとえば、DPマッチングによって算出する。すなわち、このDPマッチングに基づき、キーワードと他のキーワードとがマッチングするか否かを判定する。このときコンテンツ関連性判定部12は、キーワードを構成する文字の数を、文字数N1として算出する。さらに、他のキーワードを構成する文字の数を、文字数N2として算出する。
【0106】
コンテンツ関連性判定部12は、DPマッチングを使用するとき、キーワードと他のキーワードとの距離を、以下の式によって算出する。
【0107】
【数1】

【0108】
(詳細例)
コンテンツ分類部13が、コンテンツABCパート4をグループ「コンテンツABC」に分類する例について、以下に説明する。
【0109】
まず、コンテンツ関連性判定部12は、コンテンツABCパート4を、グループ「コンテンツABC」に分類するか否かを決定するとき、このグループの名前の属するカテゴリをチェックする。グループ「コンテンツABC」の名前は、カテゴリ「タイトル」に属している。したがって、コンテンツ関連性判定部12は、追加のコンテンツABCパート4の内容を表すメタ情報から、カテゴリ「タイトル」に属するキーワードを抽出する。コンテンツABCパート4のメタ情報では、カテゴリ「タイトル」に属するキーワードは、「コンテンツABCパート4」である。すなわち、キーワード抽出部11は、キーワードとして、文字列「コンテンツABCパート4」を抽出する。
【0110】
コンテンツ分類装置1において既存のグループ「コンテンツABC」には、コンテンツABC、コンテンツABCパート2、およびコンテンツABCパート3が分類されている。そこでキーワード抽出部11は、コンテンツABCのメタ情報から、タイトルのキーワードとして、文字列「コンテンツABC」を抽出する。さらに、コンテンツABCパート2のメタ情報から、タイトルのキーワードとして、文字列「コンテンツABCパート2」を抽出する。さらに、コンテンツABCパート3のメタ情報から、タイトルのキーワードとして、文字列「コンテンツABCパート3」を抽出する。
(算出距離の例)
コンテンツ関連性判定部12は、キーワード「コンテンツABCパート4」と、グループ「コンテンツABC」に含まれている各コンテンツのメタ情報から抽出される、タイトルのキーワードとの距離を、それぞれ、数式(1)に示すDPマッチングによって算出する。具体的には、キーワード「コンテンツABCパート4」とキーワード「コンテンツABC」との距離を算出する。さらに、キーワード「コンテンツABCパート4」とキーワード「コンテンツABCパート2」との距離を算出する。さらに、キーワード「コンテンツABCパート4」とキーワード「コンテンツABCパート3」との距離を算出する。さらに、キーワード「コンテンツABCパート4」とグループの名前である文字列「コンテンツABC」との距離を算出する。
【0111】
コンテンツ関連性判定部12が算出する距離の例について、図5を参照して以下に説明する。図5は、コンテンツ関連性判定部12が算出するキーワード間の距離の例を示す図である
この図によれば、コンテンツ関連性判定部12は、キーワード「コンテンツABCパート4」と名前「コンテンツABC」との距離を、0.345であると算出する。一方、キーワード「コンテンツABCパート4」と名前「コンテンツABC」との距離を、0.345であると算出する。さらに、キーワード「コンテンツABCパート4」とキーワード「コンテンツABCパート2」との距離を、0.15であると算出する。さらに、キーワード「コンテンツABCパート4」とキーワード「コンテンツABCパート3」との距離を、0.15であると算出する。

(判定距離と基準最大距離との比較)
このように、コンテンツ関連性判定部12は、入力されたコンテンツのメタ情報から抽出されるキーワードと、既存のグループの名前との距離を、0.345であると算出する。コンテンツ関連性判定部12は、この距離を「判定距離」として算出する。一方、コンテンツ関連性判定部12は、追加されるコンテンツのメタ情報から抽出されるキーワードと、既存のグループに含まれているコンテンツのメタ情報から抽出するキーワードとの距離のうち、もっとも大きい距離を、0.345であると算出する。コンテンツ関連性判定部12は、この距離を「基準最大距離」として算出する。
【0112】
上述したように、「判定距離」は、「基準最大距離」と同一である。すなわち、コンテンツ関連性判定部12は、判定距離を基準最大距離以内であると算出する。これによりコンテンツ関連性判定部12は、コンテンツABCパート4を、グループ「コンテンツABC」に分類することを決定する。したがってコンテンツ分類部13は、コンテンツABCパート4を、グループ「コンテンツABC」に分類する。
【0113】
このように、判定距離が基準最大距離以内であると判定されるとき、コンテンツ分類部13は、コンテンツをグループに追加する。すなわち、コンテンツ関連性判定部12は、算出した距離があらかじめ定められた所定の閾値より小さいとき、キーワードと他のキーワードとをマッチングしていると判定している。
(分類データベース6の更新)
コンテンツ分類部13は、グループに追加するコンテンツABCパート4のタイトルを、分類データベース6に追加する。すなわち、コンテンツABCパート4のメタ情報から抽出され、コンテンツのマッチングに使用された文字列「コンテンツABCパート4」を、グループ「コンテンツABC」に関連付けて記憶する。さらに、グループ「コンテンツABC」の欄に、コンテンツABCパート4がグループ「コンテンツABC」に分類されていることを示すグループ分類フラグを立てる。すなわちこのグループ分類フラグを「1」に設定する。
(部分文字列の使用)
上述したように、コンテンツ分類装置1は、入力されたコンテンツのメタ情報から、カテゴリ「タイトル」に属するキーワード「コンテンツABCパート4」を抽出し、キーワードのマッチングに使用する。ここでコンテンツ関連性判定部12は、文字列「コンテンツABCパート4」から、その部分文字列を抽出し、マッチングに使用してもよい。たとえば、コンテンツABCパート4から、部分文字列「コンテンツ」、または部分文字列「ABC4」を抽出し、マッチングに使用してもよい。
(新たなグループの作成)
以上のように、コンテンツ分類装置1は、入力されるコンテンツを、既存のグループに分類することができる。これに加えて、コンテンツ分類装置1は、新たなグループを作成し、このグループにコンテンツを分類することもできる。このときコンテンツ分類装置1は、複数のコンテンツから、1つのコンテンツを抽出し、抽出したコンテンツと、他のコンテンツとが互いに関連するか否かを判定する。これにより、互いに関連するコンテンツを複数のコンテンツを抽出し、それらを、新たに作成する1つのグループに分類する。この処理の具体例について、以下に説明する。
【0114】
図6は、コンテンツ分類装置1が管理しているグループ、および各グループに分類されているコンテンツの例を表す図であり、(a)はグループの例を表す図であり、(b)はコンテンツの例を表す図であり、(c)はコンテンツをさらに詳細に説明する例を表す図である
図6(a)に示す例では、コンテンツ分類装置1は、2つのグループを作成している。すなわちグループ「コンテンツABC」とグループ「山田」とである。グループ「コンテンツABC」の作成日は、2005年1月21日である。グループ「コンテンツABC」の名前は、カテゴリ「タイトル」に属している。すなわち、コンテンツ分類装置1は、カテゴリ「タイトル」に属するキーワードをマッチングに使用することによって、このグループを作成している。
【0115】
図6に示すように、グループ「山田」の作成日は、2005年2月28日である。また、グループ「山田」の名前は、カテゴリ「作成者」に属している。すなわち、コンテンツ分類装置1は、カテゴリ「作成者」に属するキーワードをマッチングに使用することによって、グループ「山田」をを作成している。
(コンテンツおよびグループの例)
図6(b)に示すように、コンテンツ分類装置1は、コンテンツデータベース5に、6つのコンテンツを格納している。すなわち、3つのコンテンツ「ミュージックα」と、1つのコンテンツ「衝撃映像スクープ」と、1つのコンテンツ「歌謡リクエスト」と、1つコンテンツ「ミュージックB」とを格納している。
【0116】
コンテンツ分類装置1が3つコンテンツ「ミュージックα」をコンテンツデータベース5に追加した日付は、それぞれ、2005年2月14日、2005年2月21日、および2005年2月28日である。また、コンテンツ「衝撃映像スクープ」をコンテンツデータベース5に追加した日付は、2005年2月23日である。さらに、コンテンツ「歌謡リクエスト」をコンテンツデータベース5に追加した日付は、2005年2月25日である。さらに、コンテンツ「歌謡リクエスト」をコンテンツデータベース5に追加した日付は、2005年3月31日である。
【0117】
コンテンツ分類装置1は、コンテンツの内容を表すメタ情報も、各コンテンツと共に、それぞれ、コンテンツデータベース5に格納している。
【0118】
図6(c)に示す例では、ユーザは、作成日が2005年2月14日であるコンテンツ「ミュージックα」を選択する。ユーザが選択したコンテンツの情報は、入力部2が受け付け、コンテンツ管理部10に出力する。これにより、キーワード抽出部11は、コンテンツ「ミュージックα」のメタ情報から、キーワードを抽出する。すなわち、カテゴリ「タイトル」に属するキーワードとして、文字列「ミュージックα」を抽出する。さらに、カテゴリ「ジャンル」に属するキーワードとして、文字列「ミュージック」を抽出する。さらに、カテゴリ「作成者」に属するキーワードとして、文字列「田中一朗」を抽出する。
【0119】
キーワード抽出部11は、他の5つのコンテンツのメタ情報からも、それぞれ、キーワードを抽出する。
(グループ「ミュージックα」の作成)
コンテンツ関連性判定部12は、同一のカテゴリに属するキーワードを使用することによって、DPマッチングを実行する。図6(c)に示すように、カテゴリ「タイトル」に属するキーワード「ミュージックα」に、完全にマッチングするキーワード、すなわちキーワード「ミュージックα」が、3つある。すなわち、タイトルがミュージックαであるコンテンツが、3つある。したがって、コンテンツ関連性判定部12は、これら3つのコンテンツを、互いに関連していると判定する。
【0120】
グループ作成部15は、マッチングするキーワード、すなわち文字列「ミュージックα」を、作成するグループの名前に設定する。すなわち、グループ作成部15は、名前がミュージックαであるグループを作成する。これにより、コンテンツ分類部13は、3つのコンテンツ「ミュージックα」を、グループ作成部15が作成したグループ「ミュージックα」に分類する。
(グループ「音楽」の作成)
図6(c)に示す例では、さらに、カテゴリ「ジャンル」に属するキーワード「音楽」に完全にマッチングするキーワードが、5つある。すなわち、ジャンルが音楽であるコンテンツが、5つある。したがってコンテンツ関連性判定部12は、これら5つのコンテンツを、互いに関連していると判定する。
【0121】
グループ作成部15は、マッチングするキーワード、すなわち文字列「音楽」を、作成するグループの名前に設定する。すなわち、名前が音楽であるグループを作成する。コンテンツ分類部13は、5つのコンテンツを、グループ作成部15が作成したグループ「ミュージックα」に分類する。
(グループ「田中一朗」の作成)
図6(c)に示す例では、さらに、カテゴリ「作成者」に属するキーワード「田中一朗」に完全にマッチングするキーワードが、2つある。すなわち、作成者が田中一朗であるコンテンツが、2つある。これにより、コンテンツ関連性判定部12は、これら2つのコンテンツを、互いに関連していると判定する。
【0122】
グループ作成部15は、マッチングするキーワード、すなわち文字列「田中一朗」を、作成するグループの名前に設定する。すなわち、名前が田中一朗であるグループを作成する。コンテンツ分類部13は、2つのコンテンツを、グループ作成部15が作成したグループ「ミュージックα」に分類する。
【0123】
このように、コンテンツ分類部13は、キーワードおよび他のキーワードに共通している文字列が名前に設定されているグループに、コンテンツおよび他のコンテンツを分類する。これにより、コンテンツとの関連が深いグループに、コンテンツを分類できる。
(閾値と比較することによって判定)
コンテンツ関連性判定部12は、比較するキーワードと、他のキーワードとの距離が、あらかじめ定められた閾値よりも小さいとき、2つのコンテンツを互いに関連していると判定してもよい。たとえば、コンテンツ関連性判定部12は、キーワード「ミュージックα」と、キーワード「ミュージックB」との距離を、DPマッチングによって、0.28であると算出する。このとき、あらかじめ定められた閾値を0.35であるとする。この閾値は、図示しないメモリにあらかじめ記憶されている。
【0124】
コンテンツ関連性判定部12は、算出した距離(0.28)と、図示しないメモリにあらかじめ記憶されている閾値(0.35)とを比較することによって、キーワード「ミュージックα」とキーワード「ミュージックB」との距離が、あらかじめ定められた閾値よりも小さいことを判定する。これによりコンテンツ関連性判定部12は、キーワード「ミュージックα」とキーワード「ミュージックB」とを、完全ではないが、互いにマッチングしていると判定する。したがって、タイトルがミュージックαであるコンテンツと、タイトルがミュージックBであるコンテンツとを、互いに関連していると判定する。
【0125】
これにより、コンテンツ分類部13は、コンテンツ「ミュージックB」を、グループ「ミュージックα」に分類することができる。すなわち、キーワードが完全にマッチングする場合よりも、より多いコンテンツをグループに分類できる。
(部分文字列の利用)
上述したように、コンテンツ関連性判定部12は、キーワード抽出部11が抽出したキーワードを、そのまま使用できる。しかし、このとき、次のような問題が生ずる可能性がある。たとえば、キーワード抽出部11がキーワードを抽出し、コンテンツ関連性判定部12がマッチングするコンテンツを検索したとき、マッチングするコンテンツが、所定の数よりも少なくなる可能性がある。さらに、キーワード抽出部11が抽出したキーワードが、必要以上に長く、マッチングに適さない場合もある。
【0126】
これらの問題を回避するため、キーワード抽出部11は、抽出されたキーワードの少なくとも一部を、部分文字列としてさらに抽出してもよい。このときコンテンツ関連性判定部12は、キーワード抽出部11が抽出した部分文字列を、マッチングに使用すればよい。このとき、コンテンツ関連性判定部12は、より短いキーワードを、コンテンツのマッチングに使用することになる。
【0127】
キーワード抽出部11は、文字列「ミュージックα」から、文字列「ミュージック」および文字列「α」を、それぞれ部分文字列として抽出すればよい。さらに、コンテンツ関連性判定部12は、これらの部分文字列を、それぞれマッチングに使用してもよい。
【0128】
コンテンツ関連性判定部12は、たとえば、テキスト「ミュージックα」およびテキスト「ミュージックB」を、互いに完全にマッチングしないと判定する。
このとき、キーワード抽出部11は、「ミュージックα」から、部分文字列として、「ミュージック」および「α」を抽出する。さらに、「ミュージックB」から、部分文字列として、「ミュージック」および「β」を抽出する。コンテンツ関連性判定部12は、キーワード抽出部11が抽出したこれらの部分文字列を、キーワードとしてマッチングに使用する。このとき、コンテンツ関連性判定部12は、「ミュージックα」から抽出される「ミュージック」と、「ミュージックB」から抽出される「ミュージック」とを、互いに完全にマッチングしていると判定する。
(部分文字列をグループの名前に設定する)
グループ作成部15は、互いに完全にマッチングする部分文字列を、グループの名前に設定してもよい。すなわち、完全にマッチングする部分文字列を名前として有するグループを作成してもよい。たとえば、「ミュージックα」から抽出される「ミュージック」と、「ミュージックB」から抽出される「ミュージック」とは、完全にマッチングする。そこでグループ作成部15は、文字列「ミュージック」を、作成するグループの名前に設定してもよい。
(部分文字列の抽出法)
キーワード抽出部11は、所定のアルゴリズムに基づき、キーワードから部分文字列を抽出すればよい。たとえば、キーワードに含まれているひらがな、かたかな、漢字、記号など、異なる文字によって区切られる所定長の文字列を、部分文字列として抽出すればよい。または、キーワードとして使用する部分文字列をあらかじめ格納しているキーワード辞書を参照することによって、この辞書に含まれている部分文字列をキーワードから抽出してもよい。さらに、キーワード抽出部11は、キーワードを形態素解析して、たとえば名詞のみを部分文字列として抽出してもよい。
(コンテンツをグループに分類しない場合)
コンテンツ分類部13は、場合によっては、コンテンツデータベース5に記憶されているコンテンツのほとんど全てを、1つのグループに分類することもある。これでは、コンテンツをグループに分類する意味がない。そこでコンテンツ分類部13は、コンテンツのキーワードがグループの名前にマッチングしている場合であっても、コンテンツをグループに分類しなくてもよい。すなわち、コンテンツが互いに関連していると判定されている場合であっても、グループ作成部15は、これらのコンテンツを分類するためグループを、作成しなくてもよい。なお、グループ作成部15は、コンテンツデータベース5に記憶されている全てのコンテンツのうち、新たに作成するグループに含むコンテンツが、どのくらいの割合を占めるかに応じて、そのグループを作成するか否かを決定してもよい。
(コンテンツを複数のグループへ分類)
コンテンツ関連性判定部12は、入力されるコンテンツと、既存のグループにすでに分類されているコンテンツが、互いに関連しているかを判定してもよい。これにより、コンテンツ分類部13は、1つのコンテンツを、異なる複数のグループに分類できる。
(キーワードの優先度)
上述したように、コンテンツ関連性判定部12は、メタ情報に含まれているキーワードが互いにマッチングするとき、2つのコンテンツを互いに作成していると判定する。キーワードが互いにマッチングするとき、コンテンツ分類部13は、これら2つのコンテンツを、共通するグループに分類する。ここでコンテンツ関連性判定部12は、マッチングに使用するキーワードを、キーワードに設定されている優先度に基づき決定してもよい。
【0129】
まず、作成されるグループの名前に設定できるキーワードとして、タイトルカテゴリに属するテキスト「ミュージック」と、作成者カテゴリに属するテキスト「田中」と、ジャンルカテゴリに属するテキスト「音楽」とがあるとする。このとき優先度設定部14は、キーワード候補に設定する優先度を決定する。この優先度は、複数のキーワード候補のうち、どのキーワード候補をキーワードとして使用するかの指標となる値である。優先度設定部14は、決定する優先度に関する情報を、コンテンツ関連性判定部12に出力する。
【0130】
図6(b)に示す例では、グループ作成部15は、キーワード「ミュージック」が名前に設定されているグループを作成している。コンテンツ分類部13は、このグループに、タイトルがミュージックαである3つのコンテンツと、タイトルがミュージックBである1つのコンテンツとを、分類している。すなわち、グループ作成部15は、ミュージックαおよびミュージックBに完全にマッチングするテキスト「ミュージック」を抽出し、このテキストをグループの名前に設定している。
【0131】
さらに、グループ作成部15は、キーワード「田中」が名前に設定されているグループを作成している。コンテンツ分類部13は、このグループに、作成者が田中一朗である1つのコンテンツと、作成者が田中四朗である2つのコンテンツと、作成者が田中五朗である1つのコンテンツとを、それぞれ分類している。すなわちキーワード抽出部11は、田中一朗、田中四朗、および田中五朗に完全にマッチングするテキスト「田中」を抽出している。なお、この例では、田中一朗、田中四朗、および田中五朗から任意に選択される2つのキーワードの距離は、いずれも、あらかじめ定められた閾値よりも小さいとする。
【0132】
優先度設定部14は、ユーザが選択したキーワードに、より高い優先度を設定すればよい。または、コンテンツ分類装置1がキーワード候補から任意に選択したキーワード候補に、より高い優先度を設定してもよい。
【0133】
コンテンツ分類装置1がユーザにキーワード候補を提供し、ユーザが選択したキーワード候補に、より高い優先度を設定する例について、図8を参照して以下に説明する。図8は、ユーザにキーワードを選択させるための表示画面を表す図である。
(ユーザがキーワードを選択する例)
この図によれば、表示部3は、キーワード候補として、ミュージック、田中、および音楽をディスプレイ4に表示している。さらに、各グループに現在分類されているコンテンツのタイトルを、同時に表示している。これにより表示部3は、各グループに分類されているコンテンツの名前を、ユーザに通知している。
【0134】
このとき表示部3は、キーワード候補のテキストと共に、このテキストが属するカテゴリをディスプレイ4に表示してもよい。ユーザは、ディスプレイ4に表示されているキーワード候補から、作成したいグループの名前として、任意のキーワード候補を選択する。すなわちユーザは、1つのキーワード候補を選択する。または、複数のキーワード候補を選択してもよい。この例では、1つのキーワード候補として、ユーザは、ミュージックを選択している。すなわち表示部3は、ユーザが選択している「選択」ボタンを反転してディスプレイ4に表示している。
(優先度設定のルール)
上述したようにコンテンツ分類装置1は、あらかじめ定められたルールに基づき、キーワードの優先度を決定してもよい。このルールは、コンテンツ分類装置1において、図示しないメモリにあらかじめ記憶されている。このルールとして、たとえば、タイトルカテゴリに属するキーワードに、より高い優先度を設定し、ジャンルカテゴリに属するキーワードに、より低い優先度を設定する、というものがある。
【0135】
優先度設定部14は、キーワード候補の長さに基づき、設定する優先度を決定してもよい。このとき、より長いキーワード候補、すなわち、文字数がより多いキーワード候補に、より高い優先度を設定すればよい。または、優先度設定部14は、キーワード候補が、あるグループの名前に設定されているとき、このグループに分類されているコンテンツを表すキーワードに設定されている優先度と、同一の優先度を、このキーワード候補に設定してもよい。このとき、より多くのコンテンツが分類されているグループの名前と同一であるキーワードに、より高い優先度を設定してもよい。
【0136】
優先度設定部14は、ユーザによってキーワード候補の選択、またはコンテンツ分類装置1によってキーワード候補の選択に基づき、各キーワード候補に優先度を設定する優先度を決定する。たとえば、ユーザがキーワード候補を複数選択したとき、これら複数のキーワード候補に同一の優先度を設定すれば。
(キーワード学習に基づき優先度を設定する)
優先度設定部14は、キーワードを選択するとき、嗜好学習部17が学習したキーワードの情報を使用してもよい。上述したように、嗜好学習部17aは、ユーザが選択したキーワード候補およびグループ、さらに、ユーザが削除したグループを学習している。これにより優先度設定部14は、ユーザが嗜好しているキーワードを、優先度をより高く設定するキーワードとして選択してもよい。または、優先度設定部14は、ユーザが嗜好しないキーワード以外のキーワードを、優先度をより高く設定するキーワードとして選択してもよい。
【0137】
ユーザは、入力部2を通じて、ユーザに関する情報を入力する。この情報として、ユーザは、たとえば、ユーザの名前、ユーザの所属などのプロファイル情報、ユーザの好みを表す情報を入力する。たとえば、ユーザは、音楽を嗜好していることを表す情報を、入力する。これにより、コンテンツ分類装置1は、この情報を、図示しないメモリに記憶し、管理している。
【0138】
優先度設定部14は、コンテンツ分類装置1に記憶されているユーザ情報に基づき、たとえば、キーワード「ミュージック」の優先度を、他のキーワードの優先度よりもより高くする。すなわち、ユーザが嗜好しているキーワードにマッチングしているキーワードの優先度を、他のキーワードの優先度よりもより高くする。
(分類構成に基づき優先度を設定する例)
優先度設定部14は、既存のグループの分類構成に基づき、キーワードの優先度を決定してもよい。これにより、グループ作成部15は、作成するグループの分類構成を、すでに作成されている他のグループの分類構成に類似させることができる。この例について、図12を参照して以下に説明する。図12は、グループの階層構造を表す図である。
【0139】
この図によれば、グループ作成部15は、分類データベース6において、グループ「山田」を作成している。このグループの名前は、作成者カテゴリに属している。さらに、グループ作成部15は、このグループの下に、グループ「情報」を作成している。このグループの名前は、タイトルカテゴリに属している。すなわちグループ作成部15は、これら2つのグループを作成したとき、まず、コンテンツを、作成者のキーワードによってマッチングするコンテンツを分類するためグループを作成し、さらに、このグループに分類されるコンテンツのうち、タイトルのキーワードによってマッチングするコンテンツを分類するためグループを作成している。
【0140】
グループ作成部15は、この分類構成に基づき、新たなコンテンツを分類するためグループを作成する。コンテンツ分類部13は、グループ作成部15が作成した分類構成のグループに、コンテンツを分類する。すなわち、グループ作成部15は、まず、作成者のキーワードによってマッチングするコンテンツを分類するためグループを作成する。これにより、コンテンツ分類部13は、作成者のキーワードによってマッチングするコンテンツを、このグループに分類する。つぎに、グループ作成部15は、このグループに分類されるコンテンツのうち、タイトルのキーワードによってマッチングするコンテンツを分類するためグループを作成する。これにより、コンテンツ分類部13は、タイトルのキーワードによってマッチングするコンテンツを、このグループに分類する。
【0141】
分類構成が類似するグループとは、グループの名前が属するカテゴリが、より上位のグループ同士で一致し、さらに、どのグループ同士で一致することを意味する。
(優先度の設定)
たとえば、優先度設定部14は、キーワード候補として、作成者カテゴリに属する田中と、タイトルカテゴリに属するミュージックと、ジャンルカテゴリに属する音楽とを処理するとする。上述したように、すでに作成されているグループの分類構成では、作成者カテゴリに属する「山田」が名前に設定されているグループが、他のグループより上位に存在している。このとき優先度設定部14は、キーワード候補「田中」に設定する優先度を、キーワード候補「ミュージックα」および「音楽」に設定する優先度よりもより高くする。
【0142】
優先度設定部14は、すでに作成されているグループの分類構成に基づき、キーワードの優先度を決定したとき、表示部3は、より高い優先度が設定されているキーワードを、表示画面における一番上に表示すればよい。
(まとめ)
このようにコンテンツ管理部10は、グループの分類構成を統一する。これにより、ユーザは、コンテンツを検索するとき、グループの分類構成を把握しやすい。したがって、コンテンツを検索しやすい。このように、優先度設定部14は、既存のグループの分類構成に基づき、キーワード候補に設定する優先度を決定することは、ユーザにとって非常に有意義である。
【0143】
以下ではタイトルカテゴリに属するキーワード「ミュージック」を、ユーザが選択する例を説明する。ユーザが「ミュージック」を選択することによって、優先度設定部14は、「ミュージック」の優先度を、他のキーワードよりもより高くする。優先度設定部14は、キーワードに設定する優先度の情報を、分類データベース6において更新する。
【0144】
グループ作成部15は、より高い優先度のキーワードが名前に設定されているグループを、優先して作成する。このときグループ作成部15は、図4に示す、分類データベース6に格納されている分類データを更新する。たとえば、タイトルカテゴリに属するミュージックを名前に設定したグループを作成する。さらに、このグループに属するコンテンツに、フラグを特定する。更新したあとの分類データを、図7に示す。図7は、分類データベースの詳細を表す図である。
【0145】
表示部3は、分類データベース6に格納されている分類データに基づき、ディスプレイ4に表示する情報を表す表示用データを作成する。表示部3は、作成した表示用データに基づき、ディスプレイ4に所定の情報を表示する。表示部3がディスプレイ4に表示する情報の例について、図10を参照して以下に説明する。図10は、グループおよびコンテンツを表示している表示画面の例を表す図である。
【0146】
この図によれば、表示部3は、3つのグループを表示している。すなわち、グループ「コンテンツABC」と、グループ「山田」と、グループ「ミュージック」とを表示している。さらに、これら3つのグループに分類されていないコンテンツを、2つ表示している。すなわち、コンテンツ「衝撃映像スクープ」と、コンテンツ「歌謡リクエスト」とを表示している。ユーザは、これら2つのコンテンツを、表示されているコンテンツから直接に選択できる。
(キーワードの学習)
ユーザが選択したキーワードは、ユーザの嗜好を表している可能性がある。そこで嗜好学習部17は、ユーザが選択したキーワードを学習する。この例について、説明する。
【0147】
たとえば、ユーザは、タイトルカテゴリに属するミュージックと、作成者カテゴリに属する田中と、ジャンルカテゴリに属する音楽とを選択できるとする。ユーザは、これらのキーワードのうち、「音楽」を選択する。これにより嗜好学習部17は、ユーザが選択したキーワード「音楽」を、ユーザが嗜好しているキーワードとして、図示しないメモリに記憶する。すなわち嗜好学習部17は、キーワード「音楽」を学習する。これにより、コンテンツ分類装置1は、コンテンツデータベース5に確認されているコンテンツをグループに分類するとき、このキーワードを他のキーワードよりも優先して使用する。
【0148】
ユーザが「ミュージック」を選択したとき、優先度設定部14は、音楽のジャンルのうち、タイトルがミュージックであるコンテンツをユーザが嗜好していると判断する。これにより、優先度設定部14は、キーワード「ミュージックα」を図示しないメモリに格納する。
(優先度管理データベース)
キーワードに設定される優先度を管理するため優先度管理データベースの例について、図9を参照して以下に説明する。図9は、各キーワードに設定されている優先度の例を表す図である。ユーザがミュージックを選択したとき、優先度設定部14は、キーワードが音楽であり、カテゴリがジャンルであるキーワードを追加する。さらに、このキーワードのポイントを、1とする。このポイントは、キーワードの優先度を表す。
【0149】
ユーザが、音楽のジャンルのうち、タイトル「ミュージック」を選択したとき、優先度設定部14は、ジャンルが音楽であり、キーワードがミュージックであり、カテゴリがタイトルであるキーワードを、追加する。さらに、このキーワードのポイントを、プラス1とする。また、図9に示す例では、ジャンルがミュージックであり、キーワードが田中であり、図示している作成者のキーワードも追加している。さらに、このキーワードのポイントを、マイナス1に設定している。
【0150】
優先度設定部14は、ユーザが選択したキーワードの情報を、優先度管理データベースに格納する。さらに、ユーザが入力した情報に、ユーザの嗜好に関する情報が含まれているとき、この情報も優先度管理データベースに格納してもよい。
(グループを削除する例)
コンテンツ分類装置1は、ユーザが指定したグループを、分類データベース6から削除できる。そこで、ユーザが指定したグループを、コンテンツ分類装置1が削除する例について、以下に説明する。
【0151】
ユーザは、ディスプレイ4に表示されている分類構成を見て、不要と感じるグループを削除することをコンテンツ分類装置1に指示する。グループ削除部16は、ユーザが指示したグループを削除する。
【0152】
ここで、ユーザが選択したキーワードにより高い優先度を設定されているとき、ユーザは、作成されるグループに特に不満を感じることはないだろう。しかし、グループ作成部15は、キーワードの優先度を自動的に設定しているとき、ユーザにとって不要なキーワードを名前に設定したグループを作成している可能性がある。または、分類されているコンテンツをユーザが想像しにくいグループを作成している可能性もある。
【0153】
たとえば、作成できるグループのキーワードとして、カテゴリ「タイトル」に属するキーワード「ミュージック」と、カテゴリ「作成者」に属するキーワード「田中」があるとする。これにより、グループ作成部15が、グループ「ミュージック」およびグループ「田中」を作成したとする。ここで、ユーザは、グループ「田中」を不要であると判断する。たとえば、図10に示す表示画面において、削除するグループとしてグループ「田中」を選択し、さらに、削除ボタンを押下する。
【0154】
コンテンツ分類装置1では、ユーザが指定した、削除するグループに関する情報を、入力部2が受け付け、コンテンツ管理部10に出力する。コンテンツ管理部10では、グループ削除部16が、ユーザが指定したグループを、分類データベース6から削除する。また、嗜好学習部17が、ユーザが指定したグループの名前を、ユーザが好まない文字列として、学習する。
【0155】
図9に示す例に基づき説明すると、ユーザがグループ「田中」を削除することを選択したとき、嗜好学習部17は、ジャンルが音楽であり、キーワードが田中であり、カテゴリが作成者であるキーワードのポイントを、マイナス1として、優先度管理データベースに記憶する。なお、優先度管理データベースは、ポイントがマイナスであるキーワードを、ユーザが好まないキーワードとして格納している。
(グループを再編成する例)
さらに、コンテンツ分類装置1は、ユーザが指定したコンテンツを、既存のグループから取り除くことができる。また、ユーザが指定したコンテンツを、既存のグループに追加できる。これらの例について、次に説明する。
【0156】
コンテンツ分類部13がグループに分類した複数のコンテンツの分類構成を、ユーザは、自分が意図した分類構成でないと感じることがある。このとき、ユーザは、グループに分類されている、不要なコンテンツを、グループから削除したいと考える。さらに、グループに分類されていないコンテンツを、このグループに分類したいと考えることもある。コンテンツ分類装置1は、ユーザによるこれらの要求を、次に示す方法によって実現する。
【0157】
コンテンツ分類装置1では、表示部3が、現在の分類構成をディスプレイ4に表示する。この表示をみたユーザは、ディスプレイ4に表示されているコンテンツの中から、グループから取り除きたいコンテンツを入力部2を通じて選択する。入力部2は、ユーザが選択したコンテンツ「情報」を受け付け、受け付けたコンテンツに関する情報をコンテンツ管理部10に出力する。コンテンツ分類部13が、ユーザが選択したコンテンツを、そのコンテンツが分類されているグループから取り除く。
【0158】
あるグループから取り除いたコンテンツが、そのグループとは異なる他のどのグループにも分類されていないとき、コンテンツ分類部13は、このコンテンツをルートディレクトリに格納する。表示部3は、表示画面において、このコンテンツがルートディレクトリに格納されていることを表示する。また、コンテンツ分類部13は、グループから削除するコンテンツの情報を、分類データベース6から削除する。
(コンテンツをグループに追加する)
ユーザは、あるコンテンツをグループに追加したいとき、ディスプレイ4に表示されている表示画面において、追加したいコンテンツを選択し、グループ追加メニューを押下する。これにより、表示部3は、ディスプレイ4に、ユーザが選択したコンテンツを分類できるグループの一覧を表示する。ユーザは、表示されている一覧の中から、コンテンツを分類したいグループを選択する。
【0159】
コンテンツ分類部13は、ユーザが選択したグループに、ユーザが選択したコンテンツを追加する。このとき分類データベース6において、追加するコンテンツの情報を追加する。具体的には、追加するグループにグループ分類フラグを立てる。さらに、追加するグループの名前が属するカテゴリをチェックし、追加するカテゴリのメタ情報から、このカテゴリに属するキーワードを抽出する。また、メタ情報から抽出されたキーワードを、分類データベース6に追加する。
【0160】
このように、コンテンツ分類装置1は、ユーザの指定に基づき、グループに分類されているコンテンツの構成を変更する。このときコンテンツ分類装置1は、グループにあらかじめ定められている、キーワードのマッチング閾値を、新たなグループの分類構成を反映する新たな値に変更してもよい。または、あるグループに新たに分類されるコンテンツ同士によって、キーワードのマッチングを新たに実行し、グループの名前を、新たなコンテンツを反映する名前に変更してもよい。
(閾値を変更する例)
まず、コンテンツ分類装置1が、キーワードの閾値を変更する例について説明する。コンテンツ分類装置1は、距離に関する閾値を、グループごとに、分類データベース6に格納している。すなわち分類データベース6は、図4に示すように、グループの名前、グループ分類フラグ、マッチングするキーワードに加えて、グループにあらかじめ設定されている閾値を格納している。
【0161】
上述したように、グループ削除部16は、ユーザが指定したコンテンツを、このコンテンツが分類されているグループから取り除く。これにより、コンテンツ分類部13は、取り除かれたコンテンツのキーワードと、グループに残されているコンテンツのキーワードとの最小の距離であるL1を算出する。さらに、このグループに残されているコンテンツのキーワード同士の距離のうち、最大の距離であるL2を算出する。
【0162】
ここで、コンテンツ分類部13は、算出したL1がL2よりも大きいとき、このグループに設定されている閾値を、L2に変更する。なお、コンテンツ関連性判定部12は、キーワードのマッチングを実行するとき、グループを作成したとき、または、グループにコンテンツを追加したときにおいて、キーワードのマッチングに使用したカテゴリと同一のカテゴリに属するキーワードを使用する。
【0163】
グループに不要なコンテンツが分類されていると判断したため、ユーザは、この不要なコンテンツを、グループから取り除くように、コンテンツ分類装置1に要求する。さらに、L1がL2よりも大きいことは、キーワードのマッチングに使用した閾値が大きすぎて、本来は分類されるべきではない余計なコンテンツが、グループに分類されたことを意味する。そこで優先度設定部14が、グループの閾値をより適切な値に変更する。これにより、コンテンツ分類部13は、つぎにコンテンツをグループに次に分類するとき、余計なコンテンツをグループに分類しないようにする。
【0164】
上述したように、グループ作成部15は、グループ「ミュージック」を作成している。グループ「ミュージック」には、タイトルが「ミュージックα」である3つのコンテンツと、タイトルがミュージックBである1つのコンテンツとが、分類されている。図11に、これらのコンテンツのキーワード同士の距離を表す。図11は、コンテンツを取り除く前および後において、グループに分類できるコンテンツの範囲を表す図である。
【0165】
ここで、ユーザが、コンテンツ「ミュージックB」をグループ「ミュージック」から取り除くことを、コンテンツ分類装置1に指示したとする。これにより、グループ削除部16は、コンテンツ「ミュージックB」をグループ「ミュージック」から取り除く。このとき、コンテンツ「ミュージックB」が取り除かれているグループ「ミュージック」には、コンテンツ「ミュージックα」が3つ、残されている。これらの残されている3つのコンテンツでは、キーワード間の距離は、いずれも「0」と算出され、L1よりも小さい。このときコンテンツ分類部13は、L2を「0」と算出する。L1がL2と同一であるため、コンテンツ関連性判定部12は、このグループの閾値を、「0」に変更する。
【0166】
図11には、コンテンツ「ミュージックB」がグループから取り除かれる前における、グループに分類されるコンテンツの範囲と、コンテンツが取り除かれる後における、グループに分類されるコンテンツの範囲とを表している。仮にコンテンツ「ミュージックB」がコンテンツ分類装置1に新たに入力されたとしても、コンテンツ分類部13は、このコンテンツをグループ「ミュージックα」には分類しない。グループの閾値が「0」であるため、コンテンツ分類装置1は、グループ「ミュージックα」には、キーワードが完全にマッチングするコンテンツ、すなわちコンテンツ「ミュージックα」のみを分類する。
【0167】
キーワード「ミュージックγ」と、キーワード「ミュージックα」との距離が、仮にL1だとすれば、コンテンツ分類装置1は、ミュージックBが取り除かれている前のグループ「ミュージック」は、コンテンツ「ミュージックγ」を分類できる。しかし、コンテンツ「ミュージックγ」が取り除かれた後のグループ「ミュージックα」には、コンテンツ「ミュージックγ」を分類できない。
【0168】
L1とL2とが同一であるとき、コンテンツ関連性判定部12は、閾値を変更せず、そのままの値としておいてもよい。しかし、コンテンツ分類部13は、1つのグループから、複数のコンテンツを、一度に取り除くこともありえる。このとき、コンテンツ関連性判定部12は、グループに残されているコンテンツのキーワード同士の距離のうち、L2の次に大きいL2’を算出する。このとき、算出したL2’を、グループの新たな閾値に設定してもよい。さらに、コンテンツ分類部13は、グループに残されているコンテンツのうち、他のコンテンツとの距離が全てL2(L1)であるキーワードに関連するコンテンツが存在するとき、このコンテンツをグループから取り除いていてもよい。
【0169】
上述したように、グループ作成部15は、名前が「ミュージック」であるグループを作成した。グループ「ミュージック」には、コンテンツ「ミュージックα」と、コンテンツ「ミュージックB」とが分類されている。コンテンツ分類部13は、ユーザの指定に基づき、コンテンツ「ミュージックB」をグループ「ミュージック」から取り除く。このとき、グループに残されているコンテンツに、コンテンツ「ミュージックB」が存在するなら、L1とL2とが同一になる。すなわち、キーワード「ミュージックB」と、キーワード「ミュージックα」との距離は、L2である。このL2は、L1と同一である。
【0170】
これにより、コンテンツ分類部13は、コンテンツ「ミュージックB」を、グループ「ミュージック」から取り除く。さらに、コンテンツ関連性判定部12は、このグループの閾値を、L2よりも小さい「0」に変更する。このようにして、コンテンツ分類装置1は、ユーザが指定したコンテンツに基づき、このコンテンツと異なる他のコンテンツをも、グループから自動的に取り除くことができる。
(コンテンツをグループに追加する例)
つぎに、ユーザが指定したコンテンツを、コンテンツ分類部13が所定のグループに追加する例について、以下に説明する。
【0171】
ユーザが指定した、既存のグループに分類されていないコンテンツを、コンテンツ分類部13がグループから取り除いたとき、コンテンツ関連性判定部12は、グループに追加されたコンテンツのキーワードと、グループにあらかじめ分類されているコンテンツのキーワードとの距離のうち、最大の距離であるL3を算出する。さらに、算出したL3と、このグループにあらかじめ設定されている閾値Mとを比較する。L3が閾値Mよりも大きいとき、コンテンツ関連性判定部12は、このグループの閾値を算出したL3に変更する。このときコンテンツ関連性判定部12は、グループの名前が属するカテゴリと同一のカテゴリに属するキーワードを、マッチングに使用する。
【0172】
ユーザが、あるコンテンツをグループに追加することをコンテンツ分類装置1に指示するのは、グループに分類するコンテンツの範囲を、より広くして欲しいからである可能性が高い。そこで、コンテンツ関連性判定部12は、算出したL3が、あらかじめ定められた閾値Mよりも大きいとき、グループに設定する閾値をより大きくする。これにより、グループの名前にマッチングするコンテンツのキーワードの範囲を、より広くする。したがって、コンテンツ分類装置1に新たなコンテンツが追加されたとき、グループに分類されているコンテンツのキーワードと、追加されたコンテンツのキーワードとの距離が、L3よりも以下であれば、コンテンツ分類部13は、このコンテンツを、グループに追加できる。
(分類構成の変更)
コンテンツ関連性判定部12は、あらかじめ定められた閾値を新たな値に変更したとき、このグループに分類できるコンテンツを、コンテンツデータベース5から検索してもよい。このときコンテンツ分類部13は、検索したコンテンツのキーワードと、グループに分類されているコンテンツのキーワードとの距離を算出する。このとき算出される距離が、グループに新たに設定された閾値よりも小さいとき、コンテンツ分類部13は、コンテンツデータベース5から検索したコンテンツを、グループに追加する。
【0173】
このように、コンテンツ分類装置1は、グループから1つのコンテンツを取り除くか、またはグループに1つのコンテンツを追加することの少なくともいずれかを実行することによって、このグループに分類されていない他のコンテンツの分類構成も、適宜、変更できる。
【0174】
グループにコンテンツを追加するとき、コンテンツ分類部13は、分類データベース6を更新する。すなわち、まず、分類データベース6において、追加するコンテンツをこのグループに関連付る。さらに、追加したコンテンツに、このグループに分類されていることを表すグループ分類フラグを立てる。さらに、追加したコンテンツのキーワードのうち、グループの名前が属するカテゴリと同一のカテゴリに属するキーワードを抽出し、分類データベース6に追加する。
(グループ名の変更)
コンテンツ分類装置1は、グループに分類するコンテンツの数を変更するとき、このグループに現在分類されているコンテンツのキーワード同士のマッチングを実行することによって、より適切なキーワードを抽出し、このグループの名前に設定できる。この例について、以下に説明する。
【0175】
以下では、コンテンツ分類装置1が、ユーザの指定したコンテンツをグループから取り除いたあとに、グループの名前を変更する例について説明する。コンテンツ分類部13は、グループは残されているコンテンツに関するキーワード同士によりマッチングする文字列が存在するか否かを判定する。マッチングする文字列が存在すると判定するとき、グループ作成部15は、この文字列を抽出し、現在のグループの名前に追加する。このとき、グループ作成部15は、完全にマッチングするときに、マッチングした文字列を、グループの名前に追加する。したがって、グループ作成部15は、グループに、より長い名前を設定する。
【0176】
コンテンツ分類装置1は、グループの名前が属するカテゴリと同一のカテゴリに属するキーワードを、マッチングに使用する。1つのコンテンツをグループから取り除くことによって、グループに残されているコンテンツのキーワードをマッチングしたとき、より長い文字列がマッチングすることがある。このときコンテンツ分類装置1は、グループの名前を、マッチングした文字列に変更すればよい。
【0177】
たとえば、グループ作成部15は、名前が「ミュージック」であるグループを作成している。グループ「ミュージック」には、コンテンツ「ミュージックα」およびコンテンツ「ミュージックB」が分類されている。ここで、コンテンツ分類部13は、ユーザが指定したミュージックBを、グループ「ミュージック」から取り除く。このとき、コンテンツ関連性判定部12は、グループに残されているコンテンツ「ミュージックα」のキーワードである「ミュージックα」を、マッチングに使用する。
【0178】
これによりキーワード抽出部11は、現在のグループの名前である「ミュージック」よりも長い文字列である「ミュージックα」を、キーワードから抽出する。したがってコンテンツ分類部13は、グループの名前を、「ミュージック」から、「ミュージックα」に変更する。
【0179】
なお、グループ作成部15は、既存のグループの名前に、新たに抽出された文字列を、所定の記号を介して連結させてもよい。具体的には、「ミュージック」に、「α」を、「−」を介して接続し、グループの名前を、「ミュージック−α」に設定すればよい。これにより、元のグループの名前と、新たに抽出した文字とのつながりが不自然な場合であっても、より自然な名前をグループに設定できる。さらに、ユーザは、このようなグループの名前を見ることによって、グループの名前が決定されたときに、複数のキーワードが使用されたことを知ることができる。具体的には、このグループに、キーワードとして、「ミュージック」および「α」が関連づけられていることを知る。
【0180】
グループからコンテンツを取り除く前と、後とにおいて、コンテンツ関連性判定部12は、グループに分類されているコンテンツのキーワード同士の距離の平均値を算出してもよい。このとき、コンテンツをグループから取り除いた後において算出した平均値が、取り除く前において算出した平均値よりも大きいとき、グループに残されているコンテンツのキーワード同士を、コンテンツを取り除く前のグループに分類されているコンテンツのキーワード同士よりも、長い文字がマッチングしている可能性が高いと判定する。そこで、このとき、コンテンツ関連性判定部12は、コンテンツのキーワードに、新たにマッチングする文字が存在するか否かを判定してもよい。
【0181】
コンテンツ関連性判定部12は、ユーザが指定した、グループに現在分類されていないコンテンツを、グループに追加したとき、追加したコンテンツのキーワードの部分文字列が、グループの名前にマッチングするか否かを判定してもよい。マッチングすると判定するなら、グループ作成部15は、グループの名前を変更せず、そのままにすればよい。このときコンテンツ関連性判定部12は、グループの名前が属するカテゴリと同一のカテゴリに属するキーワードを、マッチングに使用すればよい。ここでいうマッチングとは、あらかじめマッチングすることを意味する。
【0182】
コンテンツのキーワードの部分文字列と、グループの名前とがマッチングしないとき、コンテンツ関連性判定部12は、グループに新たに分類されたコンテンツのキーワードが、共通して、コンテンツを追加する前におけるグループの名前の部分文字列とマッチングするか否かを判定してもよい。マッチングすると判定するとき、グループ作成部15は、グループの名前を、グループの名前にマッチングする部分文字列に変更すればよい。
【0183】
コンテンツ関連性判定部12は、互いにマッチングするキーワードが存在しないことを判定するとき、コンテンツのキーワードのうち、他のカテゴリに属するキーワード同士を比較することによって、マッチングするキーワードが他に存在するか否かを判定してもよい。存在すると判定するとき、グループ作成部15は、新たにマッチングした文字列を、グループの名前に設定してもよい。
【0184】
上述したように、コンテンツ分類装置1は、グループの名前を変更するとき、さらに、分類データベース6において管理しているグループの名前も、変更する。
(番組分類装置1a)
以上に、図1に示すコンテンツ分類装置1の詳細を説明した。つぎに、コンテンツとして番組を、さらに、メタ情報として番組情報を取得し、取得した番組情報に基づき、受信した番組を自動的にグループに分類する番組分類装置1aについて、説明する。この番組分類装置1aは、たとえばハードディスクレコーダのような、番組情報を取得する機能、および番組を録画する機能を有している。さらに、ユーザに適すると判定した番組を、ユーザに推薦する機能も有している。
【0185】
まず番組分類装置1aの詳細について、図13を参照して以下に説明する。図13は、本発明の一実施形態に係る番組分類装置1aの詳細を表すブロック図である。
【0186】
この図によれば、番組分類装置1aは、入力部2a、ディスプレイ4a、番組データベース5a、分類データベース6a、通信アンテナ7a、番組管理部10aを備えている。
【0187】
さらに、番組管理部10aは、キーワード抽出部11a(キーワード抽出手段)、番組関連性判定部12a、番組分類部13a(番組分類手段)、優先度設定部14a(優先度設定手段)、グループ作成部15a、グループ削除部16a(グループ削除手段)、および嗜好学習部17a(嗜好学習手段)、および番組推薦部18a(番組推薦手段)を備えている。
【0188】
これら部材のうち、図1に示すコンテンツ分類装置1に備えている部材と同様の機能を有するものについては、その説明を省略する。番組分類装置1aは、コンテンツとして番組を処理する。さらに、メタ情報として、番組情報を処理する。
(番組受信部8a)
番組受信部8aは、放送されている番組を受信し、番組データベース5aに格納する。この番組を表す番組情報について、図14を参照して以下に説明する。図14は、番組情報の一例を表す図である。この図にしめすように、番組情報は、番組ごとに、あるカテゴリに属するキーワードを、テキスト情報として格納している。たとえば、カテゴリとして、ジャンル、タイトル、放送局名、出演者、および内容説明がある。
【0189】
番組受信部8aは、任意の日数の番組の番組情報を、特定の時間帯において、放送局から受信し、番組データベース5aに格納する。番組受信部8aは、デジタル衛星放送などの放送システムにしたがって放送される番組を受信するとき、この番組に付加されている番組情報を同時に受信できる。なお、番組受信部8aは、インターネットなどを通じて、番組とは別に、番組情報を受信してもよい。
【0190】
ユーザは、入力部2aを通じて、番組の録画に関する情報を入力する。表示部3aは、ディスプレイ4aに、録画した番組をグループに分類して表示する。番組分類部13aは、ユーザが指定した番組を、既存のグループに分類する。このとき、番組の内容を表す番組情報を使用する。
【0191】
番組管理部10aは、番組をグループに分類するとき、分類データベース6aに格納されている番組情報を使用してもよい。このとき、ユーザは、番組を特定する番組ID(番組識別情報)を入力する。番組管理部10aは、入力される番組IDに基づき、番組データベース5aにおいてユーザが指定した番組を特定する。番組管理部10aは、特定した番組の番組情報に基づき、番組をグループに分類する。
【0192】
なお、番組分類装置1aが番組をグループに分類するときの処理は、番組分類装置1aがコンテンツをグループに分類するときの処理と、実質的に同一であるため、詳細な説明を省略する。
(番組推薦部18a)
番組推薦部18aは、ユーザに番組を推薦する。このとき、ユーザは、入力部2aを通じて、番組の推薦要求を入力する。番組推薦部18aは、図示しない嗜好情報データベースに格納されている、ユーザの嗜好に関する情報に基づき、ユーザに推薦する番組を、番組データベース5aから特定する。
【0193】
表示部3aは、ディスプレイ4aに、番組推薦部18aが特定した、ユーザに推薦する番組に関する情報を表示する。
【0194】
ユーザは、キーワードの優先度を決定するとき、ディスプレイ4aに表示されている、複数のキーワードの中から、1つのキーワードを選択する。たとえば各キーワード「女優A」、「俳優B」、および「女優C」のうち、「俳優B」を選択する。これによりグループ作成部15aは、名前が俳優Bであるグループを作成する。番組分類部13aは、番組をこのグループに分類する。
【0195】
このとき嗜好学習部17aは、キーワード「女優B」を、ユーザが嗜好しているキーワードとして、嗜好情報データベースに格納する。番組推薦部18aは、嗜好情報データベースに格納されているキーワード「俳優B」を抽出し、この文字列をキーワードとして含んでいる番組情報によって表される番組を、ユーザに推薦する。
(推薦する番組の表示)
表示部3aは、番組推薦部18aが抽出した番組を表示するため分類データを作成し、作成した分類データに基づき、ユーザに推薦する番組に関する情報をディスプレイ4aに表示する。たとえば、図15に示す表示画面を、ディスプレイ4aに表示する。
【0196】
このように、嗜好学習部17aは、番組をグループに分類するときにユーザが選択した情報を学習している。番組推薦部18aは嗜好学習部17a学習した情報に基づき、ユーザが嗜好する番組を推測し、ユーザに推薦する。これにより、番組分類装置1aは、ユーザの嗜好をユーザがあらかじめ入力しなくても、ユーザに関連の深い番組を推薦できる。
(録画または視聴に基づく学習)
嗜好学習部17aは、ユーザが録画する番組を、ユーザが嗜好している番組であるとして学習してもよい。このとき、嗜好学習部17aは、ユーザが録画するように指定した番組の番組情報から、キーワードを抽出し、抽出したキーワードを、好みのキーワードとして嗜好情報データベースに格納すればよい。
【0197】
嗜好学習部17aは、ユーザが視聴する番組を、ユーザが嗜好している番組であるとして学習してもよい。このとき嗜好学習部17aは、ユーザが視聴している番組すなわち視聴番組の番組情報からキーワードを抽出し、抽出したキーワードを、好みのキーワードとして嗜好情報データベースに格納してもよい。
【0198】
視聴番組または録画番組に基づき、ユーザの嗜好を学習するとき、嗜好学習部17aは、ユーザが視聴する番組の番組情報、または録画する番組の番組情報に非常に高い割合で含まれているキーワードを、好みのキーワードとして学習してもよい。
【0199】
優先度設定部14aは、図9に示すように、キーワードに優先度を設定してもよい。すなわち、ユーザが番組を視聴または録画するごとに、この番組の番組情報に含まれているキーワードのポイントを増やす。このとき、番組推薦部18aは、ポイントがより高い番組を、ユーザがより好んでいる番組であると判定する。
【0200】
ユーザが視聴するごとに、キーワードのポイントを増加するとき、視聴する回数がより多い番組のキーワードに、より高い優先度が設定され、有利になる。すなわち番組推薦部18aは、ポイントがより高いキーワードを抽出し、この抽出したキーワードを含んでいる番組をユーザに推薦する。
【0201】
このように嗜好学習部17aは、ユーザが視聴した番組の履歴、または録画した番組の履歴に基づき、ユーザの嗜好を学習する。このとき嗜好学習部17aは、さらに、番組をグループに選択するときに、ユーザが選択したキーワードを、ユーザの嗜好する情報として使用することによって、ユーザが嗜好する情報を、より精度よく学習できる。
【0202】
たとえば、ユーザが、出演者カテゴリに属するキーワード「俳優A」および「俳優B」を含んでいる番組情報が表す番組を、複数回、録画したとする。この番組Aのタイトルは「番組A」であり、ジャンルはドラマである。嗜好学習部17aは、ユーザがこの番組Aの録画を指示するごとに、タイトルの番組Aと、ジャンルのドラマと、出演者の俳優Aおよび俳優Bとに、それぞれ、ポイントを加算する。
【0203】
嗜好学習部17aは、番組および番組のキーワードに設定されている優先度を、どちらも同じようにより高くする。これにより、番組推薦部18aは、俳優Aをキーワードとして含んでいる番組、および俳優Bをキーワードとして含んでいる番組とを、どちらもユーザに推薦する。
【0204】
ここで、ユーザが、俳優Aを好んでいるが、俳優Bを好んでいないとする。このとき、俳優Aが出演する番組は、ユーザが好んでいない番組である可能性が高い。しかし、ユーザが録画した番組の履歴、および視聴した番組の履歴に基づくなら、番組情報が複数のキーワードを含んでいるとき、ユーザがどのキーワードを好んでいるのかを嗜好学習部17aが学習ことは、困難である。
(キーワードの優先度と番組の推薦)
「番組A」をキーワードとして含む複数の番組が、コンテンツデータベース5に格納されているとき、これらの番組のうち、番組Aをユーザが選択し、グループに分類するように番組分類装置1aに指示したとする。このとき、ユーザが選択できるキーワード候補には、「俳優A」と、「俳優B」と、番組Aのタイトルと、番組Aのジャンル(ドラマ)とがある。このとき、ユーザは、たとえば、キーワード候補として、俳優Bを選択する。これにより、優先度設定部14aは、「俳優B」のポイントを、「俳優A」のポイントよりもより高くする。番組分類装置1aでは、ユーザが俳優Bを選択したときに、ポイントに加算される値が、あらかじめ決定されている。
【0205】
ユーザがキーワード候補として「俳優B」を選択することによって、嗜好学習部17aは、俳優Bのポイントを、俳優Aのポイントよりもより高くできる。このとき、番組分類装置1aは、ポイントがより高い番組を、ユーザに推薦するとする。このとき、番組推薦部18aは、俳優Bをキーワードとして含んでいる番組情報が表す番組を、俳優Aをキーワードとして含んでいる番組情報が表す番組よりも、ユーザに優先的に推薦する。これにより、俳優Aが出演する番組をユーザに推薦することを、抑えることができる。
【0206】
このように、嗜好学習部17aは、ユーザが録画した番組の履歴、およびユーザが視聴した番組の履歴に加え、番組分類装置1aが番組を分類するときにユーザが指定したキーワードを学習する。したがって、番組推薦部18aは、学習した情報に基づき番組を推薦することによって、番組をユーザにより精度よく推薦できる。
(表示画面の例)
コンテンツ分類装置1が番組をグループに分類するときにディスプレイ4aに表示する表示画面の例について、図16を参照して以下に説明する。図16は、グループに分類する番組をユーザが選択するときに、ディスプレイ4aに表示する表示画面の例を表す図であり、(a)は、録画した番組の一覧を表示している表示画面であり、(b)はユーザが番組Aを選択している表示画面を表す図であり、(c)は作成するグループをユーザに選択させるための表示画面を表す図であり、(d)はユーザが選択した番組をユーザが選択したグループに分類したことを表示する表示画面を表す図である。
【0207】
この図によれば、まず、表示部3aは、ディスプレイ4aに、録画した番組の一覧を表示する。このとき、各番組の番組情報から、番組のキーワードを抽出し、同時に表示している。たとえば、番組のタイトル、録画日時、ジャンル、出演者、内容説明を、表示している。
【0208】
このとき、ユーザが分類メニューを選択することによって、表示部3aは、図16(b)に示す表示画面をディスプレイ4aに表示する。ユーザは、この表示画面に表示されている番組から、グループに分類したい番組を選択する。図16(b)の例では、ユーザは「番組A」を選択している。
【0209】
キーワード抽出部11aは、ユーザが選択した番組Aの番組情報から、グループの名前に設定できるキーワードを複数抽出する。これにより、表示部3aは、図16(c)に示す表示画面をディスプレイ4aに表示する。ユーザは、この表示画面に選択されているキーワードの中から、グループの名前に設定したいキーワードを選択する。図16(c)の例では、ユーザは、キーワード「俳優B」を選択している。
【0210】
ユーザがキーワードを選択することによって、表示部3aは、図16(d)に示す表示画面を、ディスプレイ4aに表示する。すなわち、表示部3aは、番組Aをグループ「俳優B」に分類したことを示す表示画面を表示する。
(カテゴリが異なる2つのキーワードを使用する)
以下では、1つの番組の番組情報が、キーワードとして、番組のタイトル、番組のおよび番組の内容説明を含んでいる例について、説明する。番組分類装置1aは、複数の番組を処理する。これら複数の番組をそれぞれ表す複数の番組情報は、それぞれ、キーワードとしてプロ野球のチームを示す「チームAlを含んでいる。これにより、番組関連性判定部12aは、チームAをキーワードとしてマッチングを判定することによって、このキーワードを含んでいる番組情報が表す番組が、複数マッチングすることを判定する。
【0211】
番組関連性判定部12aは、さらに、キーワード「チームA」によってマッチングする複数の番組の中から、別のキーワードによってマッチングするコンテンツを絞り込む。このとき、これらの番組を表す複数の番組情報から、他のカテゴリ、たとえば番組のジャンルに属するキーワードを、それぞれ抽出する。グループ作成部15aは、ジャンルから抽出したキーワードに共通する文字列が名前に設定されるグループを作成する。
【0212】
このように番組関連性判定部12aは、キーワード「チームA」がマッチングし、さらに、キーワード「野球」がマッチングする番組を、互いに関連していると判定する。
【0213】
これによりグループ作成部15aは、番組のジャンルが「野球」であり、かつ番組の内容説明が「チームA」であるグループを作成する。このときグループ作成部15aは、名前が「チームA」であるグループを作成すればよい。または、グループ作成部15aは、名前が「野球−チームA」であるグループを作成してもよい。すなわち、グループ作成部15aは、マッチングに使用したキーワードのいずれか1つを名前に設定したグループを作成すればよい。または、マッチングに使用した各キーワードを、ハイフンなどの所定の記号によって連結したテキストを名前に設定したグループを作成してもよい。
【0214】
コンテンツ分類部13は、作成されたグループに、キーワード「チームA」およびキーワード「野球」の両方によってマッチングする番組のみを分類する。したがって、チームAのみによってマッチングする番組、および野球のみによってマッチングする番組を、いずれも、このグループには分類しない。さらに、グループ作成部15aは、複数の番組が、チームAのみによってマッチングするときには、チームAが名前に設定されるグループを作成しない。
(グループを作成しない例)
番組分類装置1aを使用するユーザは、番組を予約するとき、予約する番組を分類するグループを指定しなくてもよい。一方、従来技術の装置では、ユーザは、番組を予約するごとに、どのグループに分類するか否かを指定する必要がある。すなわち、番組分類装置1aは、ユーザにグループを指定させることなく、番組をグループに自動的に分類できる。
【0215】
さらに、番組分類装置1aは、番組を表す番組情報に含まれている、番組の内容を表すキーワードに基づき、番組を既存のグループに分類する。または、新たなグループを作成し、作成したグループに番組を分類する。すなわち、グループ作成部15aは、番組を分類するため必要なグループのみを作成する。したがって、作成したグループに分類されていない番組を、ルートディレクトリに配置する。これにより、ユーザは、グループに分類されている番組を、グループを介することなく直接に検索できる。
【0216】
全ての番組をグループに分類するなら、ユーザは、番組を選択するとき、この番組が分類されているグループを、必ず一度は指定する必要がある。コンテンツ分類装置1では、ユーザは、その手順を省くことができ、番組を直接に選択できる。たとえば、ユーザが録画したあとすぐに削除する番組は、グループに分類する必要がない。そこで、コンテンツ分類装置1は、このような番組をグループに分類しない。
(複数のグループに番組を分類する例)
番組分類装置1aは、1つの番組を、異なる複数のグループに分類できる。このとき、番組分類装置1aは、番組を表す複数のキーワードをマッチングに使用することによって、あるキーワードによってマッチングする場合、このキーワードが名前に設定されるグループに、この番組を分類し、他のキーワードによってマッチングする場合、このキーワードが名前に設定されている他のグループに、この番組を分類する。このときユーザは、複数のグループから、1つの番組を検索できる。したがって、1つの番組が1つのグループに分類されている場合に比べ、番組を検索しやすい。
【0217】
コンテンツ分類装置1は、コンテンツデータベース5に現在格納している複数の番組から、それぞれキーワードを抽出し、これらのキーワードに比較する文字が名前に設定されるグループを作成する。これにより、番組分類装置1aはコンテンツデータベース5に現在格納している番組を分類するために最適なグループを作成できる。
(従来例の問題)
一方、従来例で、ユーザが、映画番組を予約するとき、ジャンルの項目で「映画」というグループに、番組を格納することを指定したとする。その後、映画番組を複数予約し、同じように「映画」というグループに格納していくと、「映画」のグループの中に番組がたくさん格納されることになる。従来例では、ユーザが、曜日などの項目も予約時に選択しておけば、装置は、「映画」のグループの中でさらに「曜日」についての小グループを作成する。しかし、そうでない場合は、装置は、「映画」グループの中にたくさん番組を格納する。したがって、ユーザは番組を検索しにくい。
【0218】
逆に、ユーザが、全部の項目(タイトル、曜日、時間など)を選んでしまうと、装置は、「映画」のグループの中の番組が少ないうちも「映画」から「曜日」というように、まずグループを選択しなければならない。そのため、検索の手続きが増える。このように、ユーザが予約時に項目を選択する方法では、予約時には「映画」のグループに入る番組がどれだけ増えるかがわからない。したがって、ユーザが、予約時に的確に項目を選択するのは困難である。
(本願装置の有利な点)
番組分類装置1aは、「映画」のグループの中の番組が増えて、ユーザが「映画」の中で小グループを作りたいときにも、対応できる。「映画」の中のある番組をユーザが選択すると、番組分類装置1aは、「映画」の中で選択された番組と番組データで共通するキーワードをもつ番組を抽出し、グループを作成する。番組データには出演者、映画監督などの情報がある。そこで、たとえばユーザが同じ監督の映画をよく録画していれば、番組分類装置1aは、その監督の映画のグループを作成することができる。したがって、番組分類装置1aは、分類データベース6に格納している番組にあわせて、グループを作成することができる。
【0219】
番組分類装置1aは、キーワードをマッチングするとき、キーワード間で文字が一致する部分を抽出することによって、キーワード同士の距離を算出する。算出した距離が、閾値より近いかどうかによってマッチングするかどうかを決める。このようにすることによって、キーワード間の表記のゆらぎに対応できる。
【0220】
たとえば、シリーズ番組などの番組タイトルには、「刑事サスペンスドラマ1」、「刑事サスペンスドラマ2」のようにシリーズ番号が付与されることがある。このような場合でも、番組分類装置1aは、これらのグループのタイトルを、同タイトルとみなすことによって、比較するタイトルでグループを作成することができる。さらに、番組情報に含まれている番組タイトルには、省略された表記や、表記のゆらぎがあるが、番組分類装置1aは、このような場合にも対応できる。
【0221】
キーワードが互いにマッチングするかどうかは、キーワード間の距離の閾値に応じて決まる。閾値を小さくするほど、共通する文字がより多いキーワードがマッチングする。番組分類装置1aは、作成したグループに対して、ユーザが実行する修正に応じて、閾値を自動的に変更する。たとえば、タイトルが「刑事サスペンスドラマ」として互いに一致する番組を分類しているグループの例を説明する。このグループに、「サスペンス劇場」というタイトルの番組が、キーワード間の距離が閾値内だったために分類されるとする。
【0222】
この場合、そのグループから、ユーザの指定した、「サスペンス劇場」というタイトルの番組を取り除いたとき、番組分類装置1aは、そのグループの閾値を、この番組が残される前において閾値よりも、小さくする。これにより、番組分類装置1aは、「サスペンス劇場」というタイトルの番組が、そのグループに再び分類されることを防止できる。
【0223】
番組を分類するとき、作成できるグループが複数あるなら、番組分類装置1aは、ユーザの指定したグループを作成できる。番組分類装置1aは、ユーザが選択したグループのキーワードを、ユーザが好んでいるキーワードとして学習する。これにより、番組分類装置1aは、学習したキーワードに基づき、ユーザに番組を推薦できる。
【0224】
一方、ユーザの嗜好に関する情報をあらかじめ記憶するなら、作成可能なグループからユーザが1つのグループを選択したとき、番組分類装置1aはこの情報を使用する。これにより、コンテンツ分類装置1は、ユーザが嗜好しているキーワードを名前として有するグループを作成できる。
(コンテンツ分類装置1が実行する各処理の流れ)
以上に、コンテンツ分類装置1および番組分類装置1aの詳細について説明した。つぎに、コンテンツ分類装置1が実行する処理の流れについて、図17から図21に示す各フローチャートを参照して以下に説明する。
【0225】
まず、コンテンツ分類装置1が、入力されるコンテンツを既存のグループに追加する例について、図17を参照して以下に説明する。図17は、入力されたコンテンツをコンテンツ分類装置1がグループに分類するときの処理の流れを表すフローチャートである。
【0226】
ユーザは、コンテンツ分類装置1にコンテンツを入力する(ステップS11)。キーワード抽出部11は、入力されるコンテンツの内容を表すメタ情報から、所定のキーワードを抽出する(ステップS12)。コンテンツ関連性判定部12は、キーワード抽出部11が抽出したキーワード同士がマッチングするか否かを判定する(ステップS13)。キーワードがマッチングするとき、グループ作成部15は、コンテンツをグループに分類する(ステップS14)。グループ作成部15は、さらに、分類データベース6において、分類データを更新する。すなわち、追加したコンテンツに関する情報を、分類データベース6に格納する。さらに、コンテンツを分類したグループに、グループ分類フラグを立てる。
【0227】
コンテンツ分類装置1が、ユーザの指定したグループを、コンテンツ分類装置1が削除するときの処理の流れについて、図18を参照して以下に説明する。図18は、ユーザが指示したグループをコンテンツ分類装置1が削除し、さらに、グループの名前を変更するときの処理の流れを表すフローチャートである。この図によれば、ユーザは、グループを削除することを要求する指示を、コンテンツ分類装置1に入力する(ステップS21)。グループ削除部16は、ユーザが指示したグループを削除する(ステップS22)。嗜好学習部17は、グループ削除部16が削除したグループの名前を学習する(ステップS24)。さらに、コンテンツ管理部10は、分類データベース6において、分類データを更新する。
【0228】
コンテンツ分類装置1が、キーワードを学習するときの処理の流れについて、図19を参照して以下に説明する。図19は、ユーザまたはコンテンツ分類装置1が選択したキーワードにコンテンツ分類装置1がより高い優先度を設定し、さらに、ユーザが選択したキーワードをコンテンツ分類装置1が学習するときの処理の流れを表す図である。
【0229】
この図によれば、ユーザまたはコンテンツ分類装置1が、グループに分類するコンテンツを選択する(ステップS31)。キーワード抽出部11は、選択されたコンテンツの内容を表すメタ情報から、所定のキーワードを抽出する(ステップS32)コンテンツ関連性判定部12は、抽出されたキーワードに設定されている優先度に基づき、マッチングに使用するキーワードを決定する(ステップS33)。コンテンツ関連性判定部12は、複数のキーワードがマッチングするか否かを判定する(ステップS34)。嗜好学習部17は、ユーザがキーワードを選択したのか否かを判定する()。ステップS35において判定結果が「真」であるとき(Yes)、嗜好学習部17は、ユーザが選択したキーワードを学習する(ステップS36)。さらに、コンテンツ管理部10は、分類データベース6において、分類データを更新する。
【0230】
コンテンツ分類装置1が、グループにあらかじめ定められた閾値を、より適切な値に変更するときの処理の流れについて、図20を参照して以下に説明する。図20は、グループにあらかじめ定められた閾値をコンテンツ分類装置1が変更するときの処理の流れを表すフローチャートである。
【0231】
この図によれば、ユーザは、グループの閾値を変更する要求をコンテンツ分類装置1に指示する()。コンテンツ関連性判定部12は、グループに分類されているコンテンツのキーワードをマッチングに使用することによって、キーワード間の距離を算出し、グループの閾値を変更する。さらに、必要があれば、グループ作成部15は、グループの名前を変更する(ステップS43)。さらに、コンテンツ管理部10は、分類データベース6において、分類データを更新する。
コンテンツ分類装置1が、コンテンツの現在の分類構成をディスプレイ4に表示するときの処理の流れについて、図21を参照して以下に説明する。図21は、ユーザの指示に応じてコンテンツ分類装置1がディスプレイ4にコンテンツの分類状況を表示するときの処理の流れを表すフローチャートである。
【0232】
この図によれば、ユーザは、コンテンツおよびグループをディスプレイ4に表示することを、コンテンツ分類装置1に要求する(ステップS51)。これにより、表示部3は、分類データベース6にアクセスすることによって、グループの現在の分類構成を取得し、ディスプレイ4に表示する(ステップS52)。
【0233】
また、本発明は、以下に示す構成のものとしても実現できる。
(第1の構成)
複数のコンテンツとコンテンツメタ情報を記憶する記憶手段を有し、記憶手段に記憶されたコンテンツを選択する選択手段と、選択されたコンテンツのコンテンツメタ情報と共通するコンテンツメタ情報をもつコンテンツを探索する手段と、前記共通するコンテンツメタ情報をもつコンテンツによって複数のコンテンツを分類することを特徴とする情報処理装置。
(第2の構成)
第1の構成において、コンテンツメタ情報からキーワードを抽出するキーワード抽出手段をもち、キーワードのマッチングが可能かどうかによって、コンテンツメタ情報が共通するかどうかを判断することを特徴とする情報処理装置。
(第3の構成)
第2の構成において、 マッチング可能かどうかは、キーワード間で文字が一致する部分を抽出し、キーワード間の距離を算出し、ある任意の閾値より近い距離にあるキーワード同士はマッチすると判断することを特徴とする情報処理装置。
(第4の構成)
第3の構成において、一旦マッチング可能としてコンテンツを分類したのち、ユーザによって分類の修正が行われた場合、閾値の修正を行うことを特徴とする情報処理装置。
(第5の構成)
第2の構成において、複数のコンテンツメタ情報に共通に含まれるキーワードのうち、優先度の高いキーワードによって分類することを特徴とする情報処理装置。
(第6の構成)
第5の構成において、ユーザがキーワードを選択する手段をもち、キーワードの優先度をユーザの選択結果によって決定することを特徴とする情報処理装置。
(第7の構成)
第5の構成において、ユーザ情報記憶手段をもち、キーワードの優先度をユーザ情報によって決定することを特徴とする情報処理装置。
(第8の構成)
第5の構成において、キーワードの優先度を他のコンテンツの分類構成によって決定することを特徴とする情報処理装置。
(第9の構成)
第2の構成において、あるキーワード1が複数のコンテンツのコンテンツメタ情報でマッチングされる場合、同時に別のキーワード2でもマッチング可能なときのみ、キーワード1を分類に利用できるといった、キーワードに条件を付けることを特徴とする情報処理装置。
(第10の構成)
第2の構成において、表示手段をもつ情報処理装置。
(第11の構成)
第2の構成において、嗜好学習手段をもち、分類に利用されたキーワードを嗜好キーワードとして学習することを特徴とする情報処理装置。
(第12の構成)
第2の構成において、生成された分類を取消できることを特徴とする情報処理装置。
(第13の構成)
第12の構成において、取り消された分類を生成したキーワードを非嗜好キーワードとして学習することを特徴とする情報処理装置。
(第14の構成)
第2の構成において、コンテンツを分類したのち、ユーザによって分類の修正が行われた場合、分類の名称を変更することを特徴とする情報処理装置。
(第15の構成)
第1の構成において、番組取得手段と、番組情報取得手段と、番組を分類する手段をもち、分類状況を表示する表示手段をもつことを特徴とする情報処理装置。
(第16の構成)
第15の構成において、履歴格納手段をもち、履歴から嗜好を学習する嗜好学習手段をもち、学習した嗜好によって、番組情報に共通に含まれるキーワードの優先度を決定することを特徴とする情報処理装置。
(第17の構成)
第16の構成において、学習した嗜好情報でもって番組推薦することを特徴とする情報処理装置。
(第18の構成)
複数のコンテンツとコンテンツメタ情報を記憶するステップを有し、記憶手段に記憶されたコンテンツを選択するステップと、選択されたコンテンツのコンテンツメタ情報と共通するコンテンツメタ情報をもつコンテンツを探索するステップと、前記共通するコンテンツメタ情報によって複数のコンテンツを分類することを特徴とする情報処理方法。
(第19の構成)
第18の構成を実現するプログラム。
(第20の構成)
第18の構成のプログラムを格納した記録媒体。
【0234】
本発明は、テレビ、ハードディスクレコーダ、パーソナルコンピュータなど、番組を受信し、受信した番組を所定のグループに自動的に分類する装置として利用できるる。
【図面の簡単な説明】
【0235】
【図1】本発明の一実施形態に係るコンテンツ分類装置の詳細を表すブロック図である。
【図2】コンテンツ分類装置を実現するコンピュータシステムを示す図である。
【図3】コンテンツおよびメタ情報を表すコンテンツデータを説明する図である。
【図4】分類データベースの詳細を表す図である。
【図5】コンテンツ関連性判定部が算出するキーワード間の距離の例を示す図である。
【図6】コンテンツ分類装置が管理しているグループ、および各グループに分類されているコンテンツの例を表す図である。
【図7】分類データベースの詳細を表す図である。
【図8】ユーザにキーワードを選択させるための表示画面を表す図である。
【図9】各キーワードに設定されている優先度の例を表す図である。
【図10】グループおよびコンテンツを表示している表示画面の例を表す図である。
【図11】コンテンツを取り除く前および後において、グループに分類できるコンテンツの範囲を表す図である。
【図12】グループの階層構造を表す図である。
【図13】本発明の一実施形態に係る番組分類装置の詳細を表すブロック図である。
【図14】番組情報の一例を表す図である。
【図15】ディスプレイに表示されている、ユーザに推薦する番組の一覧を表す図である。
【図16】グループに分類する番組をユーザが選択するときに、ディスプレイに表示する表示画面の例を表す図であり、(a)は、録画した番組の一覧を表示している表示画面である、(b)はユーザが番組Aを選択している表示画面を表す図であり、(c)は作成するグループをユーザに選択させるための表示画面を表す図であり、(d)はユーザが選択した番組をユーザが選択したグループに分類したことを表示する表示画面を表す図である。
【図17】入力されたコンテンツをコンテンツ分類装置がグループに分類するときの処理の流れを表すフローチャートである。
【図18】ユーザが指示したグループをコンテンツ分類装置が削除し、さらに、グループの名前を変更するときの処理の流れを表すフローチャートである。
【図19】ユーザまたはコンテンツ分類装置が選択したキーワードにコンテンツ分類装置がより高い優先度を設定し、さらに、ユーザが選択したキーワードをコンテンツ分類装置が学習するときの処理の流れを表す図である。
【図20】グループにあらかじめ定められた閾値をコンテンツ分類装置が変更するときの処理の流れを表すフローチャートである。
【図21】ユーザの指示に応じてコンテンツ分類装置がディスプレイにコンテンツの分類状況を表示するときの処理の流れを表すフローチャートである。
【符号の説明】
【0236】
1 コンテンツ分類装置
2 入力部(キーワード選択手段、ユーザ情報入力手段、グループ名選択手段)
3 表示部
4 ディスプレイ
5 コンテンツデータベース
6 分類データベース
10 コンテンツ管理部
11 キーワード抽出部(キーワード抽出手段)
12 コンテンツ関連性判定部(コンテンツ関連性判定手段、キーワード距離測定手段)
13 コンテンツ分類部(コンテンツ分類手段)
14 優先度設定部(優先度設定手段)
15 グループ作成部
16 グループ削除部(コンテンツ削除手段)
17 嗜好学習部(嗜好学習手段)
1a 番組分類装置
2a 入力部(キーワード選択手段、ユーザ情報入力手段、グループ名選択手段)
3a 表示部
4a ディスプレイ
5a 番組データベース
6a 分類データベース
7a 通信アンテナ
8a 番組受信部(番組受信手段)
10a 番組管理部
11a キーワード抽出部(キーワード抽出手段)
12a 番組関連性判定部(コンテンツ関連性判定手段)
13a 番組分類部(コンテンツ分類手段)
14a 優先度設定部(優先度設定手段)
15a グループ作成部
16a グループ削除部(グループ削除手段)
17a 嗜好学習部(嗜好学習手段)
18a 番組推薦部(嗜好学習手段)

【特許請求の範囲】
【請求項1】
コンテンツの内容を表す付加情報と、このコンテンツと異なる他のコンテンツの内容を表す他の付加情報とが少なくとも部分的に一致するとき、上記コンテンツと上記他のコンテンツとが互いに関連していると判定するコンテンツ関連性判定手段と、
上記コンテンツ関連性判定手段によって互いに関連していると判定される上記コンテンツおよび上記他のコンテンツを、同一のグループに分類するコンテンツ分類手段とを備えていることを特徴とするコンテンツ分類装置。
【請求項2】
上記付加情報は、上記コンテンツの内容を表すキーワードを含んでおり、
上記他の付加情報は、上記他のコンテンツの内容を表す他のキーワードを含んでおり、
上記コンテンツ関連性判定手段は、
上記キーワードと上記他のキーワードとが少なくとも部分的に一致すると判定するとき、上記コンテンツと上記他のコンテンツとが互いに関連していると判定することを特徴とする請求項1に記載のコンテンツ分類装置。
【請求項3】
上記コンテンツ関連性判定手段は、
上記キーワードと上記他のキーワードとの距離が、あらかじめ定められた閾値より小さいとき、上記コンテンツと上記他のコンテンツとが互いに関連していると判定することを特徴とする請求項2に記載のコンテンツ分類装置。
【請求項4】
上記同一のグループの名前は、上記キーワードおよび上記他のキーワードに共通している文字列であることを特徴とする請求項2に記載のコンテンツ分類装置。
【請求項5】
上記キーワードが属するカテゴリは、上記他のキーワードが属するカテゴリと同一であることを特徴とする請求項2に記載のコンテンツ分類装置。
【請求項6】
上記コンテンツ関連性判定手段は、さらに、上記付加情報に含まれる、上記カテゴリと異なる他のカテゴリに属するキーワードと、上記他の付加情報に含まれる、上記他のカテゴリに属する他のキーワードとが、少なくとも部分的に一致するとき、上記コンテンツと上記他のコンテンツとが互いに関連していると判定する請求項5に記載のコンテンツ分類装置。
【請求項7】
上記キーワードは、より高い優先度が設定されているキーワードであることを特徴とする請求項2に記載のコンテンツ分類装置。
【請求項8】
ユーザによる上記キーワードの選択を受け付るキーワード選択手段と、
ユーザによって選択された上記キーワードに、より高い優先度を設定する優先度設定手段とをさらに備えていることを特徴とする請求項2に記載のコンテンツ分類装置。
【請求項9】
ユーザの選択した上記グループの名前を受け付るグループ名選択手段と、
上記グループ名選択手段が受け付た上記グループの名前を含んでいる上記キーワードに、より高い優先度を設定する優先度設定手段さらに備えていることを特徴とする請求項2に記載のコンテンツ分類装置。
【請求項10】
ユーザに関する情報の入力を受け付るユーザ情報入力手段と、
上記ユーザ情報入力手段によって受け付けられた上記ユーザに関する情報に含まれている文字列を含んでいるキーワードに、より高い優先度を設定する優先度設定手段とをさらに備えていることを特徴とする請求項2に記載のコンテンツ分類装置。
【請求項11】
上記コンテンツ分類手段は、
より高い優先度が設定されているキーワードおよび他のキーワードに共通する文字列を、より上位の階層に位置する上記グループの名前に設定することを特徴とする請求項7に記載のコンテンツ分類装置。
【請求項12】
階層構造のグループがあらかじめ存在するとき、
より上位の階層に位置するグループの名前を含んでいるキーワードが属するカテゴリと同一のカテゴリに属するキーワードに、より上位の優先度を設定する優先度設定手段をさらに備えていることを特徴とする請求項7に記載のコンテンツ分類装置。
【請求項13】
ユーザによって指示された上記グループを削除するグループ削除手段をさらに備えていることを特徴とする請求項1に記載のコンテンツ分類装置。
【請求項14】
ユーザによって指示された上記グループを削除するグループ削除手段をさらに備え、
上記グループ削除手段によって削除されたグループの名前を含んでいるキーワードの優先度を、より下位に設定する優先度設定手段を備えていることを特徴とする請求項7に記載のコンテンツ分類装置。
【請求項15】
上記コンテンツ分類手段による分類結果を所定のディスプレイに表示する表示手段をさらに備えていることを特徴とする請求項1に記載のコンテンツ分類装置。
【請求項16】
ユーザが選択した上記キーワードを学習する嗜好学習部と、
上記嗜好学習部が学習した上記キーワードに基づき、ユーザにコンテンツを推薦するコンテンツ推薦手段とをさらに備えていることを特徴とする請求項2に記載のコンテンツ分類装置。
【請求項17】
ユーザの指示に基づき、上記グループに新たなコンテンツを追加するコンテンツ追加手段と、
上記コンテンツ追加手段によって上記新たなコンテンツが上記グループに追加されたとき、上記新たなコンテンツの内容を表すキーワードと、上記グループにあらかじめ含まれているコンテンツの内容を表すキーワードとの距離のうち、最大の距離を算出するキーワード距離測定手段と、
上記最大の距離があらかじめ定められた閾値よりも大きいとき、この最大の距離を新たな閾値に設定する閾値設定手段とをさらに備えていることを特徴とする請求項3に記載のコンテンツ分類装置。
【請求項18】
ユーザによって指示された上記コンテンツを、上記グループから取り除くコンテンツ削除手段と、
上記コンテンツ削除手段によって上記グループから上記コンテンツが取り除かれたとき、上記グループから任意に選択される第1コンテンツの内容を表すキーワードと、上記グループから任意に選択される、上記第1コンテンツと異なる第2コンテンツの内容を表す他のキーワードとの距離のうち、最大の距離を算出するキーワード距離測定手段と、
上記最大の距離が上記あらかじめ定められた閾値よりも小さいとき、この最大の距離を新たな閾値に設定する閾値設定手段とをさらに備えていることを特徴とする請求項3に記載のコンテンツ分類装置。
【請求項19】
ユーザが指示した新たなコンテンツを上記グループに追加するコンテンツ追加手段をさらに備え、
上記コンテンツ分類手段は、
上記コンテンツ追加手段によって上記グループに上記新たなコンテンツが追加されたとき、上記グループに含まれる各コンテンツの内容を表している上記キーワードに共通する文字列を、上記グループの新たな名前に設定することを特徴とする請求項3に記載のコンテンツ分類装置。
【請求項20】
ユーザによって指示された上記コンテンツを上記グループから取り除くコンテンツ削除手段をさらに備え、
上記コンテンツ分類手段は、
上記コンテンツ削除手段によって上記コンテンツが上記グループから取り除かれたとき、上記グループに新たに含まれる各コンテンツの内容を表す上記キーワードに共通する文字列を、上記グループの名前に新たに設定することを特徴とする請求項2に記載のコンテンツ分類装置。
【請求項21】
所定の番組を上記コンテンツとして受信する番組受信手段と、
上記番組の内容を表す番組情報を上記付加情報として取得する番組情報取得手段とをさらに備えている請求項tコンテンツ分類装置。
【請求項22】
上記付加情報は、上記番組の内容を表す所定のキーワードを含んでおり、
上記他の付加情報は、上記他の番組の内容を表す所定の他のキーワードを含んでおり、
上記コンテンツ関連性判定手段は、
上記キーワードと上記他のキーワードとが少なくとも部分的に一致すると判定するとき、上記番組と上記他の番組とが互いに関連していると判定することを特徴とする請求項21に記載のコンテンツ分類装置。
【請求項23】
ユーザが録画および視聴の少なくともいずれかを要求した上記番組を表す上記番組情報を所定の記録媒体に保存する番組情報保存手段と、
上記記録媒体に記憶されている上記番組情報に含まれている文字列を含んでいる上記キーワードに、より高い優先度を設定する優先度設定手段とをさらに備えていることを特徴とする請求項22に記載のコンテンツ分類装置。
【請求項24】
上記記録媒体に記憶されている上記番組情報に含まれている文字列を含んでいる上記キーワードを学習する嗜好学習部と、
上記嗜好学習部が学習した上記キーワードに基づき、ユーザに番組を推薦する番組推薦手段とをさらに備えていることを特徴とする請求項23に記載のコンテンツ分類装置。
【請求項25】
ユーザによる上記キーワードの選択を受け付るキーワード選択手段と、
ユーザが選択した上記キーワードを学習する嗜好学習部と、
上記嗜好学習部が学習した上記キーワードに基づき、ユーザに番組を推薦する番組推薦手段とをさらに備えていることを特徴とする請求項22に記載のコンテンツ分類装置。
【請求項26】
コンテンツの内容を表す付加情報と、このコンテンツと異なる他のコンテンツの内容を表す他の付加情報とが少なくとも部分的に一致するとき、上記コンテンツと上記他のコンテンツとが互いに関連していると判定するコンテンツ関連性判定ステップと、
上記コンテンツと上記他のコンテンツとが互いに関連していると判定されると、上記コンテンツと上記他のコンテンツとを同一のグループに分類するコンテンツ分類ステップとを含んでいることを特徴とするコンテンツ分類方法。
【請求項27】
請求項1〜25のいずれか1項に記載のコンテンツ分類装置を動作させるコンテンツ分類プログラムであって、コンピュータを上記の各手段として機能させるためのコンテンツ分類プログラム。
【請求項28】
請求項27に記載のコンテンツ分類プログラムを記録しているコンピュータ読み取り可能な記録媒体。


【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate


【公開番号】特開2007−58562(P2007−58562A)
【公開日】平成19年3月8日(2007.3.8)
【国際特許分類】
【出願番号】特願2005−242965(P2005−242965)
【出願日】平成17年8月24日(2005.8.24)
【出願人】(000005049)シャープ株式会社 (33,933)
【Fターム(参考)】