説明

学習装置、学習方法、及び学習プログラム

【課題】 条件付確率表を観測に基づく学習によって更新するベイジアンネットワークにおいて、学習感度の過度の増加又は過度の低下を抑えることができる学習装置を提供する。
【解決手段】 推論装置100の学習部10は、親ノードの観測値及び子ノードの観測値を含む観測データに基づいて、条件付観測回数表23における観測データに該当するセルの観測回数に観測回数加算値を加算する観測回数増減管理部111と、条件付観測回数表23における観測回数の総和を計算する観測回数総和計算部112と、観測回数の総和が所定の上限値を超えたときに、観測回数の総和が上限値より低い所定の基準値となるように、条件付観測回数表23を正規化する観測回数表正規化部113と、条件付観測回数表23に基づいて、当該条件付観測回数表23に対応する条件付確率表22を更新する条件付確率表更新部12とを備えている。
を備えている。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ベイジアンネットワークの条件付確率表を観測に基づく学習によって更新する学習装置、学習方法、及び学習プログラムに関するものである。
【背景技術】
【0002】
従来、複数の要因の依存関係に基づいて確率計算を行う情報処理モデルとしてベイジアンネットワークが知られている。ベイジアンネットワークとは、確率変数、確率変数間の条件付依存関係、及びその条件付確率の3つによって定義されるネットワーク状の確率モデルである。
【0003】
確率変数はノード、確率変数間の条件付依存関係はノード間に張った有向リンクで表され、リンクの先に来るノードを子ノード、リンクの元にあるノードを親ノードと呼ぶ。条件付確率は、親ノードがある値をとった時に、子ノードがある値をとる確率であり、離散変数の場合にはP(子ノード=y|親ノード=x1,x2,...)=pのような、子ノードと親ノードがとるすべての状態のそれぞれにおける確率値を列挙した表(条件付確率表)の形で表現される(非特許文献1)。
【0004】
図3は、親ノードである「シーン」及び「番組総時間」からそれぞれ子ノードである「ジャンル」に有向リンクが張られたベイジアンネットワークのグラフ構造を示す図であり、図4は、このベイジアンネットワークの条件付確率表を示す図である。図4に示すように、条件付確率表では、各「シーン」及び「番組総時間」について、「ジャンル」の確率値が列挙されている。
【0005】
図4に示す条件付確率表は、図5に示すような条件付観測回数表に基づいて作成される。即ち、条件付確率は、ある親ノードのステート(図3の例では「シーン」及び「番組総時間」であり、図4の列に相当する)における、子ノードの各ステート(図3の例では「ジャンル」であり、図4の行に相当する)の確率であるので、各確率は、親ノードと子ノードの観測値が得られた場合には、条件付観測回数表における該当するセルの観測回数を増加させるとともに、親ノードの当該ステートにおける子ノードの各ステートの観測回数を、それぞれ当該親ノードのステートにおける合計観測回数で割ることで、当該親ノードのステートにおける子ノードの各ステートの条件付確率を求めることができる。
【0006】
具体的には、図5に示すように、例えば、「シーン」=「レジャー」かつ「番組総時間」=「2〜2.5時間」という親ノードのステートにおいて、子ノードの「ジャンル」の観測回数は、「J−POP」が5回、「ロック」が3回、「ジャズ」が11回、「クラシック」が1回、「フォーク」が3回、「ダンス」が1回であり、合計観測回数は24回である。
【0007】
したがって、図4の条件付確率表において、「シーン」=「レジャー」かつ「番組総時間」=「2〜2.5時間」という親ノードのステートについては、子ノードの「ジャンル」の条件付確率は、「J−POP」が5回/24回=20.8%、「ロック」が3回/24回=12.5%、「ジャズ」が11回/24回=45.8%、「クラシック」が1回/24回=4.2%、「フォーク」が3回/24回=12.5%、「ダンス」が1回/24回=4.2%となる。
【0008】
観測に基づく学習により条件付確率表を更新する場合には、まず、図5に示す条件付観測回数表において、該当するセルの観測回数を増加させることで、条件付観測回数表を更新する。そして、その更新された条件付観測回数表に基づいて、条件付確率表を作成しなおすことで条件付き確率表を更新する。
【0009】
例えば、「シーン」=「レジャー」かつ「番組総時間」=「2〜2.5時間」であって、「ジャンル」が「ロック」であるという観測データを得た場合には、条件付観測回数表において、「シーン」=「レジャー」かつ「番組総時間」=「2〜2.5時間」であって、「ジャンル」=「ロック」であるセルの観測回数に観測回数加算値が加算され、この観測回数加算値が加算された後の条件付観測回数表に基づいて、条件付確率表を計算しなおすことで、条件付確率表が更新される。
【0010】
このように、観測に基づく学習により条件付確率表を更新することで、条件付確率表の信頼度が向上し、この条件付確率表を使った推論の精度を向上させることができる。
【先行技術文献】
【非特許文献】
【0011】
【非特許文献1】本村陽一「ベイジアンネットソフトウェア」、人工知能学会論文誌、第17巻 5号a(2002年)
【発明の概要】
【発明が解決しようとする課題】
【0012】
しかしながら、観測に基づく学習を繰り返していくと、条件付観測回数表における観測回数の総数が大きくなっていく。観測回数の総数があまりに大きくなると、1回の観測による学習の効果(学習感度)が小さくなりすぎて、1回の観測による学習によっては条件付確率表がほとんど更新されなくなってしまう。
【0013】
また、観測に基づいて、条件付観測回数表の観測回数を増加又は減少させるという学習を行う場合がある。このような学習方法においては、観測に基づく学習を繰り返すことで、条件付観測回数表における観測回数が減少していき、観測回数の総数が小さくなっていくことがある。観測回数の総数があまりに小さくなると、1回の観測による学習の効果(学習感度)が高くなりすぎて、1回の観測による学習によって条件付確率表が大きく変動してしまう。
【0014】
また、観測回数表の観測回数が減少していって、すべての観測回数が0になってしまうと、条件付確率が計算できず、ベイジアンネットワークの計算自体が不可能になる。
【0015】
本発明は、上記の問題に鑑みてなされたものであり、条件付確率表を観測に基づく学習によって更新するベイジアンネットワークにおいて、学習感度の過度の増加又は過度の低下を抑えることができる学習装置を提供することを目的とする。
【課題を解決するための手段】
【0016】
本発明の学習装置は、ベイジアンネットワークの条件付確率表を観測に基づく学習によって更新する学習装置であって、親ノードの観測値及び子ノードの観測値を含む観測データに基づいて、前記親ノードの各ステート及び前記子ノードの各ステートの組合せごとに観測回数を規定した条件付観測回数表における該当する前記組合せの観測回数に観測回数加算値を加算する観測回数増減管理部と、前記条件付観測回数表における観測回数の総和を計算する観測回数総和計算部と、前記観測回数の総和が所定の上限値を超えたときに、前記観測回数の総和が前記上限値より低い所定の基準値となるように、前記条件付観測回数表を正規化する観測回数表正規化部と、前記条件付観測回数表に基づいて、当該条件付観測回数表に対応する条件付確率表を更新する条件付確率表更新部とを備えた構成を有している。
【0017】
この構成によれば、観測回数の総和が所定の上限値を超えたときに、観測回数の総和が基準値となるように、条件付観測回数表を正規化するので、学習感度の過度の低下を抑えることができる。
【0018】
本発明の学習装置において、前記観測回数増減管理部は、前記観測データに基づいて、前記観測回数加算値を増減させてよい。
【0019】
この構成によれば、観測回数の増加が観測データに基づいて加速される場合にも、学習感度の過度の低下を抑えることができる。
【0020】
本発明の別の態様の学習装置は、ベイジアンネットワークの条件付確率表を観測に基づく学習によって更新する学習装置であって、親ノードの観測値及び子ノードの観測値を含む観測データに基づいて、前記親ノードの各ステート及び前記子ノードの各ステートの組合せごとに観測回数を規定した条件付観測回数表における該当する組合せの観測回数に対して、観測回数加算値を加算し、又は観測回数減算値を減算する観測回数増減管理部と、前記条件付観測回数表における観測回数の総和を計算する観測回数総和計算部と、前記観測回数の総和が所定の上限値を超えたとき、又は前記観測回数の総和が所定の下限値を下回ったときに、前記観測回数の総和が前記上限値より小さく前記下限値より大きい所定の基準値となるように、前記条件付観測回数表を正規化する観測回数表正規化部と、前記条件付観測回数表に基づいて、当該条件付観測回数表に対応する条件付確率表を更新する条件付確率表更新部とを備えた構成を有している。
【0021】
この構成によれば、観測回数の総和が所定の上限値を超えたとき、又は観測回数の総和が所定の下限値を下回ったときに、観測回数の総和が基準値となるように、観測回数表を正規化するので、学習感度の過度の増加及び過度の低下を抑えることができる。
【0022】
本発明の学習装置において、前記観測回数増減管理部は、前記観測データに基づいて、前記観測回数加算値又は前記観測回数減算値を増減させてよい。
【0023】
この構成によれば、観測回数の増加及び減少が観測データに基づいて加速される場合にも、学習感度の過度の増加及び過度の低下を抑えることができる。
【0024】
上記の学習装置において、前記ベイジアンネットワークは、情報コンテンツの再生に係る確率モデルであってよく、前記情報コンテンツの属性に関するノードと、前記再生の属性に関するノードとを含み、前記情報コンテンツの属性に関するノードは、前記観測データに基づいて、観測回数が増加または減少してよい。
【0025】
この構成によれば、情報コンテンツの属性に関するノードが、前記観測データに基づいて、観測回数が増加または減少するので、この情報コンテンツの属性に関するノードの過度の増加及び過度の減少による学習感度の過度の増加及び過度の低下を抑えることができる。なお、情報コンテンツは例えば楽曲コンテンツであってよく、情報コンテンツの属性に関するノードには、楽曲のジャンル、年代、アーティスト、各情報コンテンツの有無が含まれてよい。また、情報コンテンツの再生に関するノードには、再生の曜日、時間、シーン、番組総時間が含まれてよい。
【0026】
また、本発明の学習装置において、前記情報コンテンツは、所定の順序に従って自動的に再生可能であるとともに、直接再生することも可能であってよく、前記観測回数増減管理部は、情報コンテンツが再生されたときに、前記情報コンテンツの属性に関するノードの該当するステートの観測回数に前記観測回数加算値を加算するとともに、情報コンテンツが直接再生されたときに、前記情報コンテンツの属性に関するノードの該当するステートの観測回数加算値を、自動的に再生されたときの前記情報コンテンツの属性に関するノードの該当するステートの観測回数加算値より大きくしてよい。
【0027】
この構成によれば、情報コンテンツが直接再生された場合に、観測回数の増加を加速させることができる。
【0028】
本発明の学習装置において、前記情報コンテンツは、所定の順序に従って自動的に再生可能であるとともに、リピート再生をすることも可能であってよく、前記観測回数増減管理部は、情報コンテンツが再生されたときに、前記情報コンテンツの属性に関するノードの該当するステートの観測回数に前記観測回数加算値を加算するとともに、情報コンテンツがリピート再生されたときに、前記情報コンテンツの属性に関するノードの該当するステートの観測回数加算値を、自動的に再生されたときの前記情報コンテンツの属性に関するノードの該当するステートの観測回数加算値より大きくしてよい。
【0029】
この構成によれば、情報コンテンツがリピート再生された場合に、観測回数の増加を加速させることができる。
【0030】
前記情報コンテンツは、所定の順序に従って自動的に再生可能であるとともに、順序に従った自動的な再生の際に再生をスキップすることも可能であってよく、前記観測回数増減管理部は、情報コンテンツの再生がスキップされたときに、前記情報コンテンツの属性に関するノードの該当するステートの観測回数から前記観測回数減算値を減算してよい。
【0031】
この構成によれば、情報コンテンツの再生がスキップされた場合に、観測回数を減少させることができる。
【0032】
本発明のさらに別の態様は、ベイジアンネットワークの条件付確率表を観測に基づく学習によって更新する学習方法であって、この方法は、親ノードの観測値及び子ノードの観測値を含む観測データに基づいて、前記親ノードの各ステート及び前記子ノードの各ステートの組合せごとに観測回数を規定した条件付観測回数表における該当する前記組合せの観測回数に観測回数加算値を加算する観測回数増減管理ステップと、前記条件付観測回数表における観測回数の総和を計算する観測回数総和計算ステップと、前記観測回数の総和が所定の上限値を超えたときに、前記観測回数の総和が前記上限値より低い所定の基準値となるように、前記条件付観測回数表を正規化する観測回数表正規化ステップと、前記条件付観測回数表に基づいて、当該条件付観測回数表に対応する条件付確率表を更新する条件付確率表更新ステップとを含んでいる。
【0033】
この構成によっても、観測回数の総和が所定の上限値を超えたときに、観測回数の総和が基準値となるように、条件付観測回数表を正規化するので、学習感度の過度の低下を抑えることができる。
【0034】
本発明のさらに別の態様は、ベイジアンネットワークの条件付確率表を観測に基づく学習によって更新する学習方法であって、親ノードの観測値及び子ノードの観測値を含む観測データに基づいて、前記親ノードの各ステート及び前記子ノードの各ステートの組合せごとに観測回数を規定した条件付観測回数表における該当する組合せの観測回数に対して、観測回数加算値を加算し、又は観測回数減算値を減算する観測回数増減管理ステップと、前記条件付観測回数表における観測回数の総和を計算する観測回数総和計ステップ部と、前記観測回数の総和が所定の上限値を超えたとき、又は前記観測回数の総和が所定の下限値を下回ったときに、前記観測回数の総和が前記上限値より小さく前記下限値より大きい所定の基準値となるように、前記条件付観測回数表を正規化する観測回数表正規化ステップと、前記条件付観測回数表に基づいて、当該条件付観測回数表に対応する条件付確率表を更新する条件付確率表更新ステップとを含んでいる。
【0035】
この構成によっても、観測回数の総和が所定の上限値を超えたとき、又は観測回数の総和が所定の下限値を下回ったときに、観測回数の総和が基準値となるように、観測回数表を正規化するので、学習感度の過度の増加及び過度の低下を抑えることができる。
【0036】
本発明のさらに別の態様は、上記の学習方法をコンピュータに実行させるためのコンピュータプログラムである。
【発明の効果】
【0037】
本発明によれば、条件付確率表を観測に基づく学習によって更新するベイジアンネットワークにおいて、学習感度の過度の増加又は過度の低下を抑えることができる。
【図面の簡単な説明】
【0038】
【図1】本発明の実施の形態における学習装置の構成を示すブロック図
【図2】本発明の実施の形態における条件付依存関係のグラフ構造を示す図
【図3】本発明の実施の形態における条件付依存関係の一部のグラフ構造を示す図
【図4】本発明の実施の形態における条件付確率表の例を示す図
【図5】本発明の実施の形態における条件付観測回数表の例を示す図
【図6】本発明の実施の形態の条件付確率更新処理のフロー図
【発明を実施するための形態】
【0039】
以下、本発明の実施の形態の学習装置について、図面を参照しながら説明する。図1は、本発明の実施の形態の学習装置を含む推論装置の構成を示す図である。推論装置100は、情報コンテンツである楽曲コンテンツの再生に係る確率モデルを用いて、推論を行なう装置である。
【0040】
この推論装置100には、図示しない情報コンテンツ再生装置(楽曲コンテンツ再生装置)が接続され、情報コンテンツ再生装置から、条件付確率表を学習するための観測データを入力する。また、推論装置100は、推論を行なう際に、情報コンテンツ再生装置から観測値が得られたノード(以下、「観測ノード」という。)の観測値を入力するとともに、推論すべきノード(以下、「推論ノード」という。)の推論結果を情報コンテンツ再生装置に出力する。
【0041】
図1に示すように、本実施の形態の推論装置100は、学習部10と、モデル記憶部20と、推論部30と、入力部40と、出力部50とを備えている。学習部10は、本発明の学習装置に相当する。なお、学習部10は、コンピュータが学習プログラムを実行することによって実現されてよい。
【0042】
モデル記憶部20は、ベイジアンネットワークの確率モデルを記憶している。学習部10は、学習によってモデル記憶部20に記憶された確率モデルを更新する。推論部30は、観測ノードの観測値に基づいて、推論ノードの事後確率表を作成する。推論部30は、事後確率表を推論結果として出力してもよいし、事後確率表における最大事後確率のステートを推論結果として出力してもよい。入力部40は、学習の際には親ノードとその子ノードの観測値を情報コンテンツ再生装置から入力し、推論の際には観測ノードの観測値を情報コンテンツ再生装置から入力する。出力部50は、推論部30で得られた推論結果を出力する。
【0043】
モデル記憶部20は、具体的には、確率変数間の条件付依存関係21(即ち、ベイジアンネットワークのグラフ構造)と、条件付確率表22と、条件付確率表22を作成するための条件付観測回数表23を記憶している。
【0044】
図2は、条件付依存関係21のグラフ構造を示す図である。上述のように、この確率モデルは、情報コンテンツとしての楽曲コンテンツの再生に係る確率モデルである。図2に示すように、この確率モデルには、楽曲コンテンツの属性に関するノードとして、楽曲の「ジャンル」、「年代」、「アーティスト」、「各情報コンテンツの有無」のノードが含まれており、楽曲コンテンツの再生に関するノードとして、再生の「曜日」、「時間」、「シーン」、「番組総時間」のノードが含まれている。
【0045】
入力部40は、ある事象が観測された場合に、条件付観測回数表23を更新するために、その事象の観測データとして、確率変数の値を入力する。入力部40は、観測データを情報コンテンツ再生装置から入力する。この情報コンテンツ再生装置は、車両に搭載されている。
【0046】
情報コンテンツ再生装置は、楽曲コンテンツが再生されると、その楽曲コンテンツの属性に関する観測値として、「ジャンル」、「年代」、「アーティスト」、「各情報コンテンツの有無」の値を出力し、再生に関する観測値として、再生の「曜日」、「時間」、「シーン」、「番組総時間」の値を出力する。入力部40は、これらの値を観測データとして入力する。
【0047】
情報コンテンツ再生装置は、複数の楽曲コンテンツを所定の再生順序に従って自動的に再生可能である。また、情報コンテンツ再生装置は、ユーザの操作に従って、再生する楽曲コンテンツを直接指定して再生するダイレクト再生も可能である。さらに、情報コンテンツ再生装置は、ユーザの操作に従って、複数の楽曲コンテンツを再生順序に従って順に再生するのではなく、一の楽曲コンテンツを繰り返し再生するリピート再生も可能である。
【0048】
また、情報コンテンツ再生装置は、ユーザの操作に従って、複数の楽曲コンテンツを再生順序に従って順に再生しているときに、一の楽曲コンテンツをスキップして、次の楽曲コンテンツを再生することもできる。情報コンテンツ再生装置は、再生されたときの上述の観測データのほかに、ダイレクト再生の情報、リピート再生の情報、再生スキップの情報も観測データとして出力し、入力部40はこれらの観測データを入力する。
【0049】
以下、条件付確率表の学習について説明するが、以下の説明では、図2に示す条件付依存関係21のグラフ構造のうち、「シーン」、「番組総時間」、及び「ジャンル」に係るグラフ構造部分を例に説明する。図3は、このグラフ構造部分に係る条件付依存関係を示す図である。このグラフ構造部分では、「シーン」及び「番組総時間」が親ノードとなり、「ジャンル」が子ノードとなる。
【0050】
図4は、このグラフ構造部分の条件付確率表22の例を示す図である。この条件付確率表において、各列は、親ノードである「シーン」及び「番組総時間」の各ステートを表し、各行は、子ノードである「ジャンル」の各ステートを表す。図5は、条件付観測回数表23の例を示す図である。図5の条件付観測回数表は、図4の条件付確率表に対応している。
【0051】
学習部10は、条件付観測回数更新部11と、観測回数総和計算部112と、観測回数表正規化部113とを備えた条件付観測回数標高深部11と、条件付確率更新部12とを備えている。
【0052】
観測回数増減管理部111は、親ノードである「シーン」及び「番組総時間」のそれぞれの観測値、及び子ノードである「ジャンル」の観測値を含む観測データを入力部40から取得する。観測回数増減管理部11は、観測ノードに基づいて、親ノードである「シーン」の各ステート(レジャー、通勤、買い物等)及び親ノードである「番組総時間」の各ステート(0.5〜1時間、1〜1.5時間、1.5〜2時間、・・・)と子ノードである「ジャンル」の各ステート(J−POP、ロック、ジャズ、クラシック、フォーク、ダンス)の組合せごとに観測回数を規定した条件付観測回数表において、取得した観測ノードに該当するセルの観測回数に観測回数加算値を加算する。
【0053】
観測回数増減管理部111は、再生順序に従って自動的に再生された楽曲コンテンツにいては、基準の観測回数加算値を加算する。基準の観測回数加算値は、例えば1である。観測回数増減管理部111は、再生順序に従って自動的に再生されたのではなく、ユーザの操作によって直接指定されて再生された楽曲コンテンツについては、割り増しの観測回数加算値を加算するポジティブ学習を行なう。また、観測回数増減管理部111は、ユーザの操作によってリピート再生された楽曲コンテンツについても、同様に割り増しの観測回数加算値を加算するポジティブ学習を行なう。割り増しの観測回数加算値は、例えば2である。
【0054】
観測回数増減管理部111は、さらに、観測データに基づいて観測回数を増加させるだけでなく、次の場合には観測回数を減少させるネガティブ学習を行なう。即ち、情報コンテンツ再生装置において、楽曲コンテンツがスキップされた場合には、観測回数増減管理部111は、その情報を観測データとして取得して、当該スキップされた楽曲コンテンツについて、該当するセルの観測回数から観測回数減算値を減算する。観測回数減算値は、例えば1である。
【0055】
観測回数総和計算部112は、条件付観測回数表23における観測回数の総和を計算する。観測回数表正規化部113は、観測回数総和計算部112にて算出された観測回数の総和が所定の上限値(例えば1200)を超えたか否かを判断する。
【0056】
観測回数の総和が上限値を超えている場合には、観測回数表正規化部113は、観測回数の総和が上限値より低い所定の基準値(例えば1000)となるように、条件付観測回数表を正規化する。具体的には、すべてのセルの観測回数に(基準値/上限値)(上記の例では、1000/1200=5/6)を掛けて、観測回数の総和が基準値程度になるようにする。即ち、観測回数総和計算部112は、観測回数の総和が基準値を所定の割合(上記の例では、20%)以上上回った場合に、観測回数の総和を基準値に戻すように、すべてのセルの観測回数に(基準値/上限値)=(1/(1+所定の割合))を掛けて、条件付観測回数表全体を正規化する。
【0057】
また、観測回数表正規化部113は、観測回数総和計算部112にて算出された観測回数の総和が所定の下限値(例えば800)を下回ったか否かを判断する。観測回数の総和が下限値を下回った場合には、観測回数表正規化部113は、観測回数の総和が下限値より高い基準値(例えば1000)となるように、条件付観測回数表を正規化する。
【0058】
具体的には、すべてのセルの観測回数に(基準値/下限値)(上記の例では、10000/800=5/4)を掛けて、観測回数の総和が基準値程度になるようにする。即ち、観測回数総和計算部112は、観測回数の総和が基準値を所定の割合(上記の例では、20%)以上下回った場合に、観測回数の総和を基準値に戻すように、すべてのセルの観測回数に(基準値/下限値)=(1/(1−所定の割合))を掛けて、条件付観測回数表全体を正規化する。
【0059】
以上のようにして、条件付観測回数表更新部11は、条件付観測回数表23を更新し、必要に応じて観測回数の総和が基準値になるように条件付観測回数表23を正規化する。条件付確率表更新部12は、このようにして得られた条件付観測回数表に基づいて条件付確率表を作成しなおす。
【0060】
上記では、学習部10において、観測に基づく学習を行なう際に入力部40が入力する観測データについて説明したが、入力部40はさらに、推論部30が観測ノードの値に基づいて、推論ノードの推論を行なうために、観測ノードの観測値を入力する。
【0061】
推論部30は、入力部40に入力された観測ノードの値に基づいて、モデル記憶部20に記憶されたベイジアンネットワークの確率モデルを用いて推論を行なう。図2において枠で囲った部分について、推論部30は、「シーン」及び「番組総時間」のノードを観測ノードとし、かつ、「ジャンル」、「年代」、「アーティスト」、「各情報コンテンツの有無」をそれぞれ推論ノードとして、推論を行なう。
【0062】
推論部30は、観測ノードの観測値に基づいて観測ノードの事後確率表を生成し、この観測ノードの事後確率表に基づいて、推定ノードの事後確率表を求める。推論部30は、この推論ノードの事後確率表を、出力部50を介して情報コンテンツ再生装置に出力する。情報コンテンツ再生装置では、この推論ノードの事後確率表に基づいて、ユーザの傾向や嗜好を考慮したお薦めの楽曲コンテンツを提示する。推論部30は、推論ノードの事後確率表における最大事後確率の楽曲コンテンツを、出力部50を介して情報コンテンツ再生装置に出力してもよい。
【0063】
図6は、学習部10による条件付確率更新処理のフロー図である。学習部10は、まず入力部40より、観測データを取得する(ステップS61)。条件付観測回数表更新部11の観測回数増減管理部111は、観測データに基づいて、条件付観測回数表23中の観測回数を更新するセルを選択し、当該セルの観測回数を増加させるか減少させるかを判断し、増加させる場合には、基準の観測回数加算値を加算するか、割り増しの観測回数加算値を加算するかを判断し、選択したセルの観測回数に対して、観測回数加算値を加算し、又は観測回数減算値を減算する(ステップS62)。
【0064】
次に、観測回数総和計算部112は、条件付観測回数表23について、観測回数の総和を計算する(ステップS63)。そして、観測回数表正規化部113は、観測回数総和計算部112にて算出された観測回数の総和が、所定の上限値(基準値の20%増)を超えており、又は所定の下限値(基準値の20%減)を下回っているかを判断する(ステップS64)。
【0065】
観測回数の総和が所定の上限値を超えており、又は所定の下限値を下回っている場合には(ステップS64にてYES)、観測回数表正規化部113は、条件付観測回数表23を正規化する(ステップS65)。観測回数の総和が上限値以下であって下限値以上である場合(ステップS64にてNO)、及び観測回数表正規化部113にて条件付観測回数表23を正規化した後には、条件付確率表更新部12が、その条件付観測回数表23に基づいて条件付確率表を更新する(ステップS66)。
【0066】
なお、条件付確率表の更新は、ステップS62にて、観測回数表の観測回数が増減された後であれば、いつ実施されてもよい。これは、条件付観測回数表23の正規化は、上述のように、全体に一定の係数を掛けることで行なわれるので、条件付観測回数表23に基づいて計算される条件付確率表22は、条件付観測回数表23が正規化される前後で変わらないからである。
【0067】
なお、上記の実施の形態では、上限値を基準値の20%増とし、下限値を基準値の20%減としたが、上限値及び下限値がこれらに限られないことはいうまでもない。また、上記の実施の形態では、基準値を1000としたが、これに限られない。基準値は、セルの個数及び観測回数加算値及び観測回数減算値の大きさに基づいて設定される。好ましくは、1回の観測回数加算値の加算によって、条件付確率表の条件付き確率が0.1〜10%程度変動するように、基準値を定める。
【0068】
また、上記の実施の形態では、条件付観測回数表23における観測回数の総和が上限値を超えた場合に、条件付観測回数表23のすべての観測回数に(基準値/上限値)を掛け、又は下限値を下回った場合に、条件付観測回数表23のすべての観測回数に(基準値/下限値)を掛けることで、条件付観測回数表23を正規化したが、条件付観測回数表23における観測回数の総和が上限値を超えた場合に、条件付観測回数表23のすべての観測回数に(基準値/観測回数の総和)を掛け、又は下限値を下回った場合に、条件付観測回数表23のすべての観測回数に(基準値/観測回数の総和)を掛けることで、条件付観測回数表23を正規化してもよい。
【0069】
上記の後者の方法によれば、正規化によって観測回数の総和がちょうど基準値になる。しかし、正規化の際に観測回数の総和を正確に基準値に戻す必要はないので、前者の方法であっても本発明の効果には実質的に影響しない。
【0070】
また、上記の実施の形態では、観測回数増減管理部111が、観測データに基づいて、観測回数を増加又は減少させたが、観測データを得た場合に条件付観測回数表23の該当するセルに観測回数加算値を加算するだけであってもよい。また、観測回数増減管理部111は、直接再生やリピート再生がされた場合には、観測回数の加算を加速すべく条件付観測回数表23の該当するセルに割り増しの観測回数加算値を加算したが、このような観測回数の加算を行わなくてもよい。一方、観測回数増減管理部111は、観測回数の減算についても、よりネガティブな事象を観測した場合には、割り増しの観測回数減算値を減算して、観測回数の減算を加速するようにしてもよい。
【産業上の利用可能性】
【0071】
本発明は、条件付確率表を観測に基づく学習によって更新するベイジアンネットワークにおいて、学習感度の過度の増加又は過度の低下を抑えることができるという効果を有し、ベイジアンネットワークの条件付確率表を観測に基づく学習によって更新する学習装置等として有用である。
【符号の説明】
【0072】
10 学習部
11 条件付観測回数表更新部
111 観測回数増減管理部
112 観測回数総和計算部
113 観測回数表正規化部
12 条件付確率更新部
20 モデル記憶部
21 条件付依存関係
22 条件付確率表
23 条件付観測回数表
30 推論部
40 入力部
50 出力部
100 推論装置

【特許請求の範囲】
【請求項1】
ベイジアンネットワークの条件付確率表を観測に基づく学習によって更新する学習装置であって、
親ノードの観測値及び子ノードの観測値を含む観測データに基づいて、前記親ノードの各ステート及び前記子ノードの各ステートの組合せごとに観測回数を規定した条件付観測回数表における該当する前記組合せの観測回数に観測回数加算値を加算する観測回数増減管理部と、
前記条件付観測回数表における観測回数の総和を計算する観測回数総和計算部と、
前記観測回数の総和が所定の上限値を超えたときに、前記観測回数の総和が前記上限値より低い所定の基準値となるように、前記条件付観測回数表を正規化する観測回数表正規化部と、
前記条件付観測回数表に基づいて、当該条件付観測回数表に対応する条件付確率表を更新する条件付確率表更新部と、
を備えたことを特徴とする学習装置。
【請求項2】
前記観測回数増減管理部は、前記観測データに基づいて、前記観測回数加算値を増減させることを特徴とする請求項1に記載の学習装置。
【請求項3】
ベイジアンネットワークの条件付確率表を観測に基づく学習によって更新する学習装置であって、
親ノードの観測値及び子ノードの観測値を含む観測データに基づいて、前記親ノードの各ステート及び前記子ノードの各ステートの組合せごとに観測回数を規定した条件付観測回数表における該当する組合せの観測回数に対して、観測回数加算値を加算し、又は観測回数減算値を減算する観測回数増減管理部と、
前記条件付観測回数表における観測回数の総和を計算する観測回数総和計算部と、
前記観測回数の総和が所定の上限値を超えたとき、又は前記観測回数の総和が所定の下限値を下回ったときに、前記観測回数の総和が前記上限値より小さく前記下限値より大きい所定の基準値となるように、前記条件付観測回数表を正規化する観測回数表正規化部と、
前記条件付観測回数表に基づいて、当該条件付観測回数表に対応する条件付確率表を更新する条件付確率表更新部と、
を備えたことを特徴とする学習装置。
【請求項4】
前記観測回数増減管理部は、前記観測データに基づいて、前記観測回数加算値又は前記観測回数減算値を増減させることを特徴とする請求項3に記載の学習装置。
【請求項5】
前記ベイジアンネットワークは、情報コンテンツの再生に係る確率モデルであり、前記情報コンテンツの属性に関するノードと、前記再生の属性に関するノードとを含み、前記情報コンテンツの属性に関するノードは、前記観測データに基づいて、観測回数が増加または減少することを特徴とする請求項1ないし4のいずれか一項に記載の学習装置。
【請求項6】
前記情報コンテンツは、所定の順序に従って自動的に再生可能であるとともに、直接再生することも可能であり、
前記観測回数増減管理部は、情報コンテンツが再生されたときに、前記情報コンテンツの属性に関するノードの該当するステートの観測回数に前記観測回数加算値を加算するとともに、情報コンテンツが直接再生されたときに、前記情報コンテンツの属性に関するノードの該当するステートの観測回数加算値を、自動的に再生されたときの前記情報コンテンツの属性に関するノードの該当するステートの観測回数加算値より大きくする
ことを特徴とする請求項5に記載の学習装置。
【請求項7】
前記情報コンテンツは、所定の順序に従って自動的に再生可能であるとともに、リピート再生をすることも可能であり、
前記観測回数増減管理部は、情報コンテンツが再生されたときに、前記情報コンテンツの属性に関するノードの該当するステートの観測回数に前記観測回数加算値を加算するとともに、情報コンテンツがリピート再生されたときに、前記情報コンテンツの属性に関するノードの該当するステートの観測回数加算値を、自動的に再生されたときの前記情報コンテンツの属性に関するノードの該当するステートの観測回数加算値より大きくする
ことを特徴とする請求項5又は6に記載の学習装置。
【請求項8】
前記情報コンテンツは、所定の順序に従って自動的に再生可能であるとともに、順序に従った自動的な再生の際に再生をスキップすることも可能であり、
前記観測回数増減管理部は、情報コンテンツの再生がスキップされたときに、前記情報コンテンツの属性に関するノードの該当するステートの観測回数から前記観測回数減算値を減算する
ことを特徴とする請求項5ないし7のいずれか一項に記載の学習装置。
【請求項9】
ベイジアンネットワークの条件付確率表を観測に基づく学習によって更新する学習方法であって、
親ノードの観測値及び子ノードの観測値を含む観測データに基づいて、前記親ノードの各ステート及び前記子ノードの各ステートの組合せごとに観測回数を規定した条件付観測回数表における該当する前記組合せの観測回数に観測回数加算値を加算する観測回数増減管理ステップと、
前記条件付観測回数表における観測回数の総和を計算する観測回数総和計算ステップと、
前記観測回数の総和が所定の上限値を超えたときに、前記観測回数の総和が前記上限値より低い所定の基準値となるように、前記条件付観測回数表を正規化する観測回数表正規化ステップと、
前記条件付観測回数表に基づいて、当該条件付観測回数表に対応する条件付確率表を更新する条件付確率表更新ステップと、
を含むことを特徴とする学習方法。
【請求項10】
ベイジアンネットワークの条件付確率表を観測に基づく学習によって更新する学習方法であって、
親ノードの観測値及び子ノードの観測値を含む観測データに基づいて、前記親ノードの各ステート及び前記子ノードの各ステートの組合せごとに観測回数を規定した条件付観測回数表における該当する組合せの観測回数に対して、観測回数加算値を加算し、又は観測回数減算値を減算する観測回数増減管理ステップと、
前記条件付観測回数表における観測回数の総和を計算する観測回数総和計算ステップと、
前記観測回数の総和が所定の上限値を超えたとき、又は前記観測回数の総和が所定の下限値を下回ったときに、前記観測回数の総和が前記上限値より小さく前記下限値より大きい所定の基準値となるように、前記条件付観測回数表を正規化する観測回数表正規化ステップと、
前記条件付観測回数表に基づいて、当該条件付観測回数表に対応する条件付確率表を更新する条件付確率表更新ステップと、
を含むことを特徴とする学習方法。
【請求項11】
コンピュータに請求項9又は10に記載の学習方法を実行させるための学習プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2012−212276(P2012−212276A)
【公開日】平成24年11月1日(2012.11.1)
【国際特許分類】
【出願番号】特願2011−76960(P2011−76960)
【出願日】平成23年3月31日(2011.3.31)
【出願人】(502324066)株式会社デンソーアイティーラボラトリ (332)