説明

ノイズ除去条件決定装置、ノイズ除去条件決定方法、及びプログラム

【課題】行動ログからノイズを除去した適切なログを抽出するために使用するノイズ除去条件を自動的に決定する。
【解決手段】ノイズ除去条件決定装置において、収集された行動ログから、ノイズ除去条件候補を用いてノイズを除去し、ノイズ除去済ログを抽出する手段と、前記ノイズ除去済ログから、ある基準点より前の行動ログからなる学習用ログと、ノイズ除去条件決定対象ユーザの前記基準点以降の行動ログからなる正解ログとを抽出する手段と、前記学習用ログを用いて、前記対象ユーザの行動予測を行う手段と、行動予測結果と、前記正解ログとを比較し、所定の基準で行動予測結果の評価を行う手段と、ノイズ除去条件候補を変更しながら、前記各手段による処理を繰り返す制御を行い、繰り返しの結果得られる複数の評価結果のうち最も良い評価結果に対応するノイズ除去条件候補を、前記対象ユーザのノイズ除去条件として決定する手段とを備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、セットトップボックス(STB)から収集される視聴ログ等の行動ログからノイズを除去するための技術に関するものである。
【背景技術】
【0002】
現在、個人の行動ログが様々な場面で取得されている。行動ログとしては、TVやVODの視聴ログ、実店舗での購買履歴ログ、オンラインショッピングでの購買履歴ログ、携帯電話やPCでのWebの閲覧・検索履歴ログ、オフィス・交通機関での入退室・乗降車ログなどがある。このような行動ログは、種々のサービスやマーケティングに活用されている。例えば、行動ログ(購買履歴ログ)を利用したサービスとして、ECサイトで本を購入するときなどに、「あなたにおすすめの本」や、「この本を買った人にはこれがおすすめ」のようなレコメンドを表示するサービスがある。また、マーケティングに関しては、行動ログからマーケティング用データ(売り上げ、視聴率、マーケティングセグメント毎の行動特性など)を抽出し、当該データをサービス・商品の提供側に対して提供するマーケティングシステムがある。
【0003】
行動ログを収集する仕組みはログの種類により異なるが、例えば、IPTVやCATVにおいては、STBに対する操作情報等を視聴ログとしてネットワーク上のログ収集格納装置に送信し、ログ収集格納装置が視聴ログを収集する仕組みがある。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2009−118189号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
レコメンドシステムやマーケティングシステムなどの行動ログを利用するシステムにおいては、入力する行動ログにノイズが含まれる場合には、ユーザの嗜好を正しく反映した適切なレコメンドやマーケティングデータの出力を行うことができないという問題がある。この問題をSTBからの視聴ログ収集を例に挙げて説明する。
【0006】
STBとテレビ受像機とからなる映像受信装置において、視聴者は、STBを操作するとともに、テレビ受像機そのものを操作する場合がある。例えば、就寝のためにテレビの視聴を終了するときに、STBの電源をOFFにするのでなく、テレビ受像機の電源をOFFにする場合がある。この場合、テレビ放送の受信機能を有するSTBは、番組を受信し続けることになり、この時点でSTBにより生成される視聴ログは、番組を受信し続けていることを示す視聴ログとなる。
【0007】
そのため、上記のようなSTBから得られたログから視聴者の行動を分析しようとした際に、STBから得られた視聴ログをそのまま利用してしまうと、実際には視聴していない番組が好きなことになってしまうなど、精度の高い分析をすることができない。
【0008】
そこで、STBのログから複数の指標を用いてノイズを除き、視聴者の嗜好を表すであろうログを抜き出す必要がある。例えば、継続視聴時間がある閾値以上であるログを、「つけっぱなし」のログとして除外する。また、例えば、視聴割合(ある番組放送時間に対する視聴時間の割合)の閾値により、「興味を持って見た」と推定できるログと、そうでないと推定できるログとに分別することができる。
【0009】
上記のようなノイズ除去に用いるパラメータの閾値は、一般に、視聴者にアンケートをとってその結果を分析して決めたり、あるいは、システム運営者側で感覚的に決めたりする。
【0010】
しかし、それでは、新たなノイズ除去用のパラメータ(継続未視聴時間等)を加える際に、閾値の決定に時間がかかることや(例えば、アンケート収集の稼動がかかる)、閾値を決定する人に依存して値にバラツキが出ることが問題となる。
【0011】
ノイズ除去に用いるパラメータとしては、上記に挙げた視聴割合等以外に、番組が有料であったかどうか、ニッチなジャンルであったかどうか、予約して見たかどうか、予約番組直後の放送であったかどうか、そのチャンネルに固定する直前のザッピング度合い(どれだけチャンネルを遷移した後に決めたか)等ログから算出できる値で、様々なパラメータが考えられる。
【0012】
また、TVで途中まで見た番組を携帯で持ち出して見るようなことになれば、どの端末で見たかも分割の重要なパラメータとなり、取得可能なログの種類が増えることによって嗜好を表すログとそうでないログを分割するためのパラメータは増え続けることになり。その度に閾値を決定する必要が出てくる。
【0013】
また、閾値は、ユーザの属性によっても変化する。例えば、子供と大人では平均的に興味を持って番組を視聴する時間が異なったり、映画好きの人とドキュメンタリー好きでは平均的な視聴割合が異なる可能性がある。更に、季節や曜日による変化や、時代とともにライフスタイルが変化することにより、同じ個人でも適正な閾値に変化が生じてくることもある。
【0014】
上記のように、適正に個々人の嗜好を反映するようにノイズを除去したログを抽出するためには、多くのパラメータの中から利用できそうなものを適切に選択し、最適閾値を検証することを何度も繰り返し実施しなければならない。しかしながら、現在は、個人の経験、アンケート等での閾値決定を必要とするため、時間が足りず、一律の閾値をずっと利用し続けることになってしまう。それでは、ログを入力して視聴者に番組をおすすめするレコメンドシステムでは個々人へのきめ細かいレコメンドを実施できず、視聴率や視聴者行動特性を算出するマーケティングデータシステムも正しく視聴者行動を捉えられなくなる。
【0015】
本発明は、上記の点に鑑みてなされたものであり、収集された行動ログから、個々人の嗜好を反映するようにノイズを除去した適切なログを抽出するために使用するノイズ除去条件を自動的に決定する技術を提供することを目的とする。
【課題を解決するための手段】
【0016】
上記の課題を解決するために、本発明は、ユーザの行動ログからノイズを除去するために用いるノイズ除去条件を決定するノイズ除去条件決定装置であって、ログ格納手段に格納された行動ログから、ノイズ除去条件候補を用いてノイズを除去し、ノイズ除去済ログを抽出するノイズ除去済ログ抽出手段と、前記ノイズ除去済ログ抽出手段により抽出された前記ノイズ除去済ログから、ある基準点より前の行動ログからなる学習用ログと、ノイズ除去条件を決定する対象となる対象ユーザの前記基準点以降の行動ログからなる正解ログとを抽出する評価用ログ抽出手段と、前記評価用ログ抽出手段により抽出された前記学習用ログを用いて、前記対象ユーザの行動予測を行い、行動予測結果を行動予測結果格納手段に格納する行動予測手段と、前記行動予測手段により得られた行動予測結果と、前記正解ログとを比較し、両者の一致度合いに基づいて、所定の基準で行動予測結果の評価を行う比較評価手段と、ノイズ除去条件候補を変更しながら、前記ノイズ除去済ログ抽出手段、前記評価用ログ抽出手段、及び前記比較評価手段による処理を繰り返す制御を行い、繰り返しの結果得られる複数の評価結果のうち最も良い評価結果に対応するノイズ除去条件候補を、前記対象ユーザのノイズ除去条件として決定する最適ノイズ除去条件決定手段とを備えたことを特徴とするノイズ除去条件決定装置として構成される。
【0017】
また、本発明は、ノイズ除去条件決定装置が実行する処理に対応するノイズ除去条件決定方法として構成してもよい。また、本発明は、コンピュータを、ノイズ除去条件決定装置の各手段として機能させるためのプログラムとして構成することもできる。
【発明の効果】
【0018】
本発明によれば、行動ログからノイズを除去した適切なログを抽出するために使用するノイズ除去条件を自動的に決定することが可能となる。
【図面の簡単な説明】
【0019】
【図1】本発明の実施の形態に係るシステムの全体構成図である。
【図2】ノイズ除去条件決定装置10の機能構成図である。
【図3】ノイズ除去条件決定装置10の動作を説明するためのフローチャートである。
【図4】ノイズ除去済ログ抽出を説明するための図である。
【図5】行動予測結果の評価を説明するための例を示す図である。
【図6】合致した番組集合と、正解ログの番組集合と、行動予測結果の番組集合との関係を示す図である。
【図7】ノイズ除去済ログ抽出装置200の機能構成を示す図である。
【発明を実施するための形態】
【0020】
以下、図面を参照して本発明の実施の形態を説明する。
【0021】
(システム構成)
図1に本発明の実施の形態に係るシステムの全体構成図を示す。図1に示すように、本実施の形態に係るシステムは、本発明に係るノイズ除去条件決定装置10、ログ収集格納装置20、及び映像受信装置30が、通信ネットワーク40を介して接続されて構成されている。
【0022】
本実施の形態に係る映像受信装置30は、放送される番組を受信して表示するとともに、視聴ログを通信ネットワーク40を介してログ収集格納装置20に送信する機能を備えた装置である。本実施の形態では、映像受信装置30として、STBとTV受像機とからなる装置を想定しているが、映像受信装置30は、これに限られるものではなく、例えば、インターネット経由で放送される番組を受信可能なPCでもよい。なお、図1には、映像受信装置30が1つだけ示されているが、実際には多数の映像受信装置が通信ネットワーク40に接続されている。
【0023】
通信ネットワーク40は、視聴ログを伝送するネットワークである。この通信ネットワーク40は、放送される番組自体も伝送するネットワークであってもよいし、放送される番組以外のデータ通信を行うためのネットワークであってもよい。前者は、IPTVやCATV等の場合に相当し、後者は、番組を電波で受信し、視聴ログを通信ネットワーク40(インターネット等)を介して送信する場合等に相当する。
【0024】
ログ収集格納装置20は、映像受信装置30から、視聴ログを受信し、記憶手段に格納する装置である。ノイズ除去条件決定装置10は、ログ収集格納装置20により収集された視聴ログを用いて、ユーザ毎に最適なノイズ除去条件を決定する装置である。
【0025】
図2に、ノイズ除去条件決定装置10の機能構成図を示す。図2に示すように、ノイズ除去条件決定装置10は、ログ取得部101、ログ格納部102、ノイズ除去条件候補提供部103、ノイズ除去済ログ抽出部104、ノイズ除去済ログ格納部105、評価用ログ抽出部106、正解ログ格納部107、学習用ログ格納部108、履歴ログ格納部109、行動予測部110、行動予測結果格納部111、比較評価部112、評価結果格納部113、最適ノイズ除去条件決定部114、ノイズ除去条件格納部115を備える。また、行動予測部110は、協調フィルタ生成部121、協調フィルタ格納部122、予測行動抽出部123を備える。なお、協調フィルタとは、協調フィルタリングによって生成されたフィルタのことである。
【0026】
上記各機能部の処理内容については、後述するノイズ除去条件決定装置10の動作説明の中で順次説明される。
【0027】
なお、本実施の形態では、行動予測部110として、レコメンドサービスで使用されるレコメンドエンジンを用い、レコメンド手法として協調フィルタリングを使用するため、行動予測部110は、協調フィルタ生成部121、及び協調フィルタ格納部122を備えるが、行動予測部110を実現するために採用する手法はこれに限られず、他の手法を用いてもよい。
【0028】
また、本実施の形態では、ノイズ除去条件決定装置10とは別にログ収集格納装置20を備え、ノイズ除去条件決定装置10はログ収集格納装置20からログを取得することとしているが、ノイズ除去条件決定装置10自体がログ収集格納機能を備えてもよい。
【0029】
ノイズ除去条件決定装置10は、CPU、メモリ、ハードディスク、通信インターフェース等を備えた一般的なコンピュータに、各機能部の処理を記述したプログラムを実行させることにより実現可能である。当該プログラムは、可搬メモリ等の記録媒体に記録して配布することが可能である。また、当該プログラムをネットワーク上のサーバからダウンロードしてインストールすることも可能である。
【0030】
また、ノイズ除去条件決定装置10は、1つのコンピュータで実現してもよいし、複数のコンピュータをネットワークを介して接続することにより実現してもよい。
【0031】
(ノイズ除去条件決定装置10の動作)
次に、図3に示すフローチャートに示す手順に沿って、ノイズ除去条件決定装置10の動作を説明する。説明において、図4〜図6を適宜参照する。
【0032】
<ステップ1:ログ取得処理>
ログ取得部101が、ログ収集格納装置20から視聴ログを取得し、ログ格納部102に格納する。ログ格納部102に格納される視聴ログ(=ログ収集格納装置20において格納される視聴ログ)は、例えば、(ログ取得時刻、ユーザID、視聴チャンネル、番組ID、視聴開始時刻、視聴終了時刻、番組開始時刻、番組終了時刻、視聴割合、継続視聴時間)からなる情報である。
【0033】
これらの情報は、映像受信装置30が生成し、定期的、もしくは所定の契機(視聴終了時等)にて映像受信装置30からログ収集格納装置20に送信される。もしくは、映像受信装置20は、ユーザ操作に基づき直接に取得できる情報(ユーザID、視聴チャンネル、チャンネルを合わせた時刻、他のチャンネルに変更した時刻等)のみをログ収集格納装置20に送信し、ログ収集格納装置20において、番組提供事業者が提供する番組表等を参照して、映像受信装置30から受信したログに対して解釈・計算を行って、上記の形式のログを格納することとしてもよい。
【0034】
上記のログにおいて、ユーザIDは、映像受信装置30に予め割り当てられたIDもしくは予め入力されたIDである。また、視聴者がIDを入力してから視聴を行うサービス等においては、ユーザIDを、当該映像受信装置30で視聴を行う視聴者が、視聴時に入力するIDとしてもよい。以下、"ユーザ"は、ユーザIDで一意に識別される主体を意味する。
【0035】
視聴開始時刻、及び視聴終了時刻は、映像受信装置30においてユーザがチャンネルを番組に合わせたり変更したりする操作に対応する情報である。番組開始時刻、及び番組終了時刻は、番組表から得られる情報である。視聴割合は、該当の番組の放送時間に含まれる視聴時間の割合である。継続視聴時間は、ユーザ操作がないまま継続して視聴された時間(あるコンテンツ(番組、CM、番組中のコーナー等)を視聴開始した時刻−それ以前に最後に操作を行った時刻)である。
【0036】
以降の処理は、ユーザ毎に行われ、各ユーザに関して最適なノイズ除去条件が決定されるが、以下の説明においては、1のユーザに関する処理について説明する。
【0037】
<ステップ2:ノイズ除去済ログ抽出処理>
ノイズ除去条件候補提供部103は、最適ノイズ除去条件を決定する対象となるユーザを除く各ユーザの最適ノイズ除去条件をノイズ除去条件格納部115から取得し、それらをノイズ除去済ログ抽出部104に与える。なお、ノイズ除去条件格納部115は、ユーザ毎にノイズ除去条件を格納しており、既に最適ノイズ除去条件として決定しているノイズ除去条件に関しては、最適であることを示すフラグが立てられている。フラグが立てられていないノイズ除去条件は、ノイズ除去条件候補であり、最適ノイズ除去条件を決定するための候補として用いられる。また、最適ノイズ除去条件が決定していないユーザに関して、複数種類のノイズ除去条件候補が格納されている。
【0038】
ノイズ除去条件候補提供部103は、最適ノイズ除去条件を決定する対象となるユーザに関しては、ノイズ除去条件格納部115から1つのノイズ除去条件候補を取得して、ノイズ除去済ログ抽出部104に与える。なお、最適ノイズ除去条件を決定する対象となるユーザを除くユーザの中で、最適ノイズ除去条件が未定のユーザがある場合、当該ユーザに関しては、予め定めた1つのノイズ除去条件候補をノイズ除去済ログ抽出部104に与える。最適ノイズ除去条件を決定する対象のユーザに関して、ノイズ除去条件候補は、ステップ2からの処理を繰り返す度に変更されるが、その他のユーザのノイズ除去条件は固定である。
【0039】
続いて、ノイズ除去済ログ抽出部104が、ノイズ除去条件候補提供部103から与えられたユーザ毎のノイズ除去条件(ノイズ除去条件候補含む)をユーザ毎のフィルタリングの条件として用いて、ログ格納部102から各ユーザのノイズ除去済ログを抽出し、抽出したノイズ除去済ログをノイズ除去済ログ格納部105に格納する。
【0040】
例えば、ユーザAに着目し、元のログが図4(a)に示すものであるとする。ここで、ユーザAに対するノイズ除去条件(又はノイズ除去条件候補)として、視聴割合が70%以上であるという条件を用いた場合、ノイズ除去済ログは図4(b)に示すとおりのログになる。
【0041】
なお、ステップ2におけるログ抽出処理では、上記ノイズ除去条件を用いたノイズ除去と合わせて、一定時間内にある回数以上チャンネルが変更されているログをザッピングデータとみなして削除する処理を行ってもよい。
【0042】
<ステップ3:評価用ログ抽出処理>
次に、評価用ログ抽出部106が、評価のために使用するログとして、ノイズ除去済ログ格納部105から学習用ログ、正解ログ、履歴ログを取得し、それぞれ学習用ログ格納部108、正解ログ格納部107、履歴ログ格納部109に格納する。
【0043】
学習用ログは、ノイズ除去済ログ格納部105に格納されたノイズ除去済ログのうち、予め定めた基準点(基準時刻)よりも前のログである。履歴ログは、ノイズ除去済ログのうち、最適ノイズ除去条件を決定する対象となるユーザに関しての上記基準点よりも前のログである。正解ログは、ノイズ除去済ログのうち、最適ノイズ除去条件を決定する対象となるユーザに関しての上記基準点以降のログである。なお、学習用ログには、履歴ログが含まれているので、ここで履歴ログを抽出することは必ずしも必要でなく、評価において必要に応じて学習用ログから履歴ログに相当するログを抽出して使用してもよい。
【0044】
例えば、ノイズ除去済ログに、1月1日から3月31日までのログが含まれる場合において、基準点を3月1日とすると、学習用ログとして、ノイズ除去済ログから、1月1日から2月末日までのログを抽出し、履歴ログとして、対象ユーザに関する1月1日から2月末日までのログを抽出し、正解ログとして、対象ユーザに関する3月1日から3月31日までのログを抽出する。
【0045】
<ステップ4:行動予測処理>
次に、行動予測部110が、基準点より前のデータである学習用ログ及び履歴ログを用いて、行動予測を行う。本実施の形態では、ログを用いたレコメンド手法としてよく用いられている協調フィルタリングによる行動予測を行う。
【0046】
ここではまず、協調フィルタ生成部121が、学習用ログ格納部108に格納されている学習用ログに基づき、協調フィルタリングによって協調フィルタを生成し、協調フィルタ格納部122に格納する。
【0047】
そして、予測行動抽出部123が、履歴ログ格納部109に格納されている履歴ログを協調フィルタに適用することにより、予測された行動内容を抽出し、それを行動予測結果格納部111に格納する。ここでは、予測された行動内容としての番組IDと、ユーザID(最適ノイズ除去条件決定対象のユーザのユーザID)とを含む情報が行動予測結果格納部111に格納される。
【0048】
<ステップ5:比較評価処理>
続いて、比較評価部112が、行動予測結果と、正解ログ格納部107に格納されている正解ログとを比較し、合致するアイテム(本実施形態では、番組(つまり、番組ID)である)の個数を算出する。
【0049】
そして、比較評価部112は、合致した番組数と行動予測結果の番組数との比を適合率として算出し、合致した番組数と正解ログに含まれる番組数との比を再現率として算出する。
【0050】
例えば、正解ログにおける番組と、行動予測結果における番組が図5に示すとおりであったとする。この場合、合致した番組数が4であり、行動予測結果の番組数が6であるから、適合率は4/6≒66.6%である。また、正解ログの番組数が8であるから、再現率は4/8=50%である。なお、再現率は網羅性を表す指標であり、この値が高い場合は、視聴者が視聴したいものを網羅的にレコメンドしていることになる。また、適合率は正確性を表す指標であり、この値が高い場合、レコメンド結果(行動予測結果)に外れが少ないことを示す。図6に、合致した番組集合と、正解ログの番組集合と、行動予測結果の番組集合との関係を示す。
【0051】
更に比較評価部112は、下記の式により再現率と適合率の調和平均であるF値を求め、それを、ユーザIDとともに評価結果格納部113に格納する。また、評価結果格納部113には、最適ノイズ除去条件決定部114等により、上記F値に対応するノイズ除去条件が格納される。
【0052】
F値=2/(1/再現率+1/適合率)
図5に示す例では、F値=2/(8/4+6/4)=2/3.5≒57.1%となる。この値が高い場合、行動予測(レコメンド)が総合的に高精度(網羅的で外れが少ない)であることを示す。すなわち、本実施の形態では、最も良い評価結果は、最も高いF値に相当する。通常、再現率と適合率は、一方が高くなると他方が低くなる傾向がある。
【0053】
なお、上記の評価方法は一例に過ぎない。行動予測の正確さを計測できる評価方法であれば、上記の方法以外の方法を用いてもよい。
【0054】
<ステップ6、ステップ7、ステップ8:終了判定処理、継続処理、最適ノイズ除去条件決定処理>
続いて、最適ノイズ除去条件決定部114が、現在の対象ユーザに関する最適ノイズ条件決定のための繰り返し処理を終了するか否かを判定する(ステップ6)。この判定においては、例えば、異なるノイズ除去条件候補に基づくF値が予め定めた数だけ得られたこと(すなわち、繰り返し処理が予め定めた回数に達したこと)を終了条件することができる。また、予め定めたF値以上のF値が得られたことを終了条件としてもよい。また、ノイズ除去条件候補が、少しずつ値をずらすことができるもの("視聴割合がX%以上"等)である場合、その値を例えば1%ずつ増加又は減少させながらF値を求める処理を繰り返す中で、最大のF値が得られたと判定することを終了条件としてもよい。更に、所定回数が終了した時点で、最大のF値に対応するノイズ除去条件を中心にして、上記のように少しずつ値をずらしながら処理を繰り返し、更に大きなF値が得られるノイズ除去条件を決定してもよい。
【0055】
ステップ6で終了でないと判定した場合にステップ7に進み、最適ノイズ除去条件決定部114は、異なるノイズ除去条件候補を用いてステップ2からの処理を行うよう各機能部に対する制御を行う。この場合、異なるノイズ除去条件候補を用いてステップ2からの処理が行われる。
ステップ6で終了であると判定した場合にはステップ8に進む。ステップ8において、最適ノイズ除去条件決定部114は、評価結果格納部113に格納された複数のF値のうちの最大のF値を求めるために使用したノイズ除去条件候補を、最適ノイズ除去条件として、該当のユーザIDとともにノイズ除去条件格納部115に格納する。すなわち、当該ユーザに関してノイズ除去条件格納部115に格納されたノイズ除去条件候補のうち、最適であると決定されたノイズ除去条件候補に対して最適ノイズ除去条件であることを示すフラグが立てられる。最適ノイズ除去条件を決定した後、当該ユーザについての最適ノイズ除去条件以外のノイズ除去条件候補をノイズ除去条件格納部115から削除することとしてもよい。
【0056】
なお、ノイズ除去条件は、視聴割合等の単独のパラメータに関する条件に限らず、視聴割合と継続視聴時間などの複数のパラメータを組み合わせた条件であってもよい。その場合、多次元的にノイズ除去条件を決定するために、サポートベクターマシン等を利用してもよい。
【0057】
また、ノイズ除去条件は、上記に挙げた例に限られず、例えば、番組が有料かどうか、ニッチ名のジャンルであったかどうか、視聴予約をして視聴したものかどうか等をノイズ除去条件とすることもできる。
【0058】
(適用例)
上記のようにして得られた各ユーザの最適ノイズ除去条件は、例えば、ログを用いてレコメンドを行うレコメンド装置に提供され、当該レコメンド装置において、ログからユーザ毎のノイズ除去を行うことにより、ユーザ毎に適切にノイズが除去されたノイズ除去済ログを取得することができ、当該ノイズ除去済ログを用いることにより、精度の高いレコメンドを行うことができる。また、上記のようにして得られた各ユーザの最適ノイズ除去条件を、ログを用いてマーケティングデータを算出するマーケティングデータ算出装置に提供してもよく、これにより、マーケティングデータ算出装置は精度の高いマーケティングデータを得ることができる。
【0059】
また、図7に示すように、ノイズ除去条件決定装置10と同じ機能を有するノイズ除去条件決定部201と、ノイズ除去条件決定部201において決定した各ユーザの最適ノイズ除去条件を用いてノイズ除去済ログを抽出するノイズ除去済ログ抽出部202と、ノイズ除去済ログ格納部203とを備えることによりノイズ除去済ログ抽出装置200を実現することもできる。なお、ノイズ除去済ログ抽出装置200は、本実施の形態に係るノイズ除去条件決定機能を有するので、これをノイズ除去条件決定装置と称してもよい。
【0060】
図7に示す例では、ノイズ除去済ログ抽出装置200から、ノイズ除去済ログが、マーケティングデータ算出装置300、及びレコメンド装置400に提供される。もちろん、ノイズ除去済ログを、その他の装置に提供してもよい。
【0061】
(実施の形態の効果)
本実施の形態で説明した技術により、ノイズ除去条件を、アンケート調査等の手間をかけることなく自動的に決定することが可能となるので、ノイズ除去条件決定の時間を短縮できる。そのため、よりきめ細かいノイズ除去条件を求めることが可能となる。更に、本実施の形態の技術によれば、個人の感覚やアンケート調査等の主観評価によらず、客観的な評価を用いてノイズ除去条件を決定するので、個人の嗜好を的確に反映した精度の高いノイズ除去条件を決定することが可能となる。
【0062】
また、ログの中に、つけっぱなしのログや、余り興味を持って見なかったログ等が含まれている場合でも、本実施の形態の技術で決定したノイズ除去条件により、これらのログをノイズとして適切に除去することができる。例えばレコメンドシステムにおいて、このようにノイズが除去されたログを用いることにより、個々の視聴者にとって本当に見たい番組、もしくは有益である番組をレコメンドすることができる。
【0063】
また、マーケティングデータシステムにおいて、上記のようにノイズが除去されたログを使用することにより、精度よく時間・番組・チャンネル別視聴率を算出したり、行動特性による特定の視聴者セグメントを抽出したりすることができる。マーケティングデータをもとにIPTV・CATVを提供する企業やコンテンツプロバイダがどのようなコンテンツを配信・調達するかというコンテンツ配信戦略を練ったり、特定のユーザセグメントにダイレクトマーケティングを行うことができるようになる。
【0064】
本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において、種々変更・応用が可能である。例えば、上記の実施の形態では、行動ログとして視聴ログを例に挙げて説明したが、本発明は、視聴ログに限らず、行動ログからノイズを除去するためのノイズ除去条件決定に適用できる。
【符号の説明】
【0065】
10 ノイズ除去条件決定装置
20 ログ収集格納装置
30 映像受信装置
40 通信ネットワーク
101 ログ取得部
102 ログ格納部
103 ノイズ除去条件候補提供部
104 ノイズ除去済ログ抽出部
105 ノイズ除去済ログ格納部
106 評価用ログ抽出部
107 正解ログ格納部
108 学習用ログ格納部
109 履歴ログ格納部
110 行動予測部
111 行動予測結果格納部
112 比較評価部
113 評価結果格納部
114 最適ノイズ除去条件決定部
115 ノイズ除去条件格納部
121 協調フィルタ生成部
122 協調フィルタ格納部
123 予測行動抽出部
200 ノイズ除去済ログ抽出装置
201 ノイズ除去条件決定部
202 ノイズ除去済ログ抽出部
203 ノイズ除去済ログ格納部
300 マーケティングデータ算出装置
400 レコメンド装置

【特許請求の範囲】
【請求項1】
ユーザの行動ログからノイズを除去するために用いるノイズ除去条件を決定するノイズ除去条件決定装置であって、
ログ格納手段に格納された行動ログから、ノイズ除去条件候補を用いてノイズを除去し、ノイズ除去済ログを抽出するノイズ除去済ログ抽出手段と、
前記ノイズ除去済ログ抽出手段により抽出された前記ノイズ除去済ログから、ある基準点より前の行動ログからなる学習用ログと、ノイズ除去条件を決定する対象となる対象ユーザの前記基準点以降の行動ログからなる正解ログとを抽出する評価用ログ抽出手段と、
前記評価用ログ抽出手段により抽出された前記学習用ログを用いて、前記対象ユーザの行動予測を行い、行動予測結果を行動予測結果格納手段に格納する行動予測手段と、
前記行動予測手段により得られた行動予測結果と、前記正解ログとを比較し、両者の一致度合いに基づいて、所定の基準で行動予測結果の評価を行う比較評価手段と、
ノイズ除去条件候補を変更しながら、前記ノイズ除去済ログ抽出手段、前記評価用ログ抽出手段、及び前記比較評価手段による処理を繰り返す制御を行い、繰り返しの結果得られる複数の評価結果のうち最も良い評価結果に対応するノイズ除去条件候補を、前記対象ユーザのノイズ除去条件として決定する最適ノイズ除去条件決定手段と
を備えたことを特徴とするノイズ除去条件決定装置。
【請求項2】
前記行動予測手段は、前記学習用ログから協調フィルタリングによってフィルタを生成し、当該フィルタを用いて前記対象ユーザの行動予測を行うことを特徴とする請求項1に記載のノイズ除去条件決定装置。
【請求項3】
前記比較評価手段は、前記行動予測結果と前記正解ログとの間で一致した一致アイテム数と、前記行動予測結果のアイテム数との比である適合率を算出し、前記一致アイテム数と前記正解ログのアイテム数との比である再現率を算出し、算出した適合率と再現率とを用いて評価結果を算出することを特徴とする請求項1又は2に記載のノイズ除去条件決定装置。
【請求項4】
前記行動ログは、放送番組を受信する映像受信装置から送信され、通信ネットワークを介して収集された視聴ログであることを特徴とする請求項1ないし3のうちいずれか1項に記載のノイズ除去条件決定装置。
【請求項5】
ユーザの行動ログからノイズを除去するために用いるノイズ除去条件を決定するノイズ除去条件決定装置が実行するノイズ除去条件決定方法であって、
ログ格納手段に格納された行動ログから、ノイズ除去条件候補を用いてノイズを除去し、ノイズ除去済ログを抽出するノイズ除去済ログ抽出ステップと、
前記ノイズ除去済ログ抽出ステップにより抽出された前記ノイズ除去済ログから、ある基準点より前の行動ログからなる学習用ログと、ノイズ除去条件を決定する対象となる対象ユーザの前記基準点以降の行動ログからなる正解ログとを抽出する評価用ログ抽出ステップと、
前記評価用ログ抽出ステップにより抽出された前記学習用ログを用いて、前記対象ユーザの行動予測を行い、行動予測結果を行動予測結果格納手段に格納する行動予測ステップと、
前記行動予測ステップにより得られた行動予測結果と、前記正解ログとを比較し、両者の一致度合いに基づいて、所定の基準で行動予測結果の評価を行う比較評価ステップと、
ノイズ除去条件候補を変更しながら、前記ノイズ除去済ログ抽出ステップ、前記評価用ログ抽出ステップ、及び前記比較評価ステップによる処理を繰り返す制御を行い、繰り返しの結果得られる複数の評価結果のうち最も良い評価結果に対応するノイズ除去条件候補を、前記対象ユーザのノイズ除去条件として決定する最適ノイズ除去条件決定ステップと
を備えたことを特徴とするノイズ除去条件決定方法。
【請求項6】
コンピュータを、請求項1ないし4のうちいずれか1項に記載のノイズ除去条件決定装置における各手段として機能させるためのプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2012−14660(P2012−14660A)
【公開日】平成24年1月19日(2012.1.19)
【国際特許分類】
【出願番号】特願2010−153500(P2010−153500)
【出願日】平成22年7月5日(2010.7.5)
【出願人】(399035766)エヌ・ティ・ティ・コミュニケーションズ株式会社 (321)
【Fターム(参考)】