説明

情報学習方法、プログラム及び記録媒体

【課題】 情報学習方法が、複数ユーザに対して自律的に情報を収集し、各ユーザとのインタラクションから効率的に複数ユーザの対応を学習することができる。
【解決手段】 情報学習方法は、対応するユーザを特定するユーザ特定部2と、類似度を正確に算出するためのフィルタリング部40とユーザの類似度を算出する類似度計算部50を持つ類似計算部3と、ユーザごとに対応を記憶させ、類似度に応じて個別情報を更新する個別情報記憶部70とそれに基づいて行動の表出を制御する行動表出制御部60を持つ行動管理部4と、行動管理部4に報酬情報を出力するセンサ入力部5とを備え、複数ユーザに対して自律的に情報を収集し、各ユーザとのインタラクションから効率的に複数ユーザの対応を学習する

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報学習方法に関し、詳しくは、複数ユーザに効率的に対応するロボット装置及び人工エージェントにより行う情報学習方法に関する。
【背景技術】
【0002】
近年、自律的に行動するロボット装置や人工エージェントが提案されている。これらの装置としては、動物などの生命体を模擬する装置が提案されている。このようなロボット装置等は、例えば、使用者(ユーザ)からの命令等による外部環境や、ロボット装置等の内部状態に応じて自律的に行動し、行動して得た情報からその対応を使用者に対して学習するように構成されている。
【0003】
従来、個人の好みや操作等を学習して個人に適応したシステムはあるが、複数のユーザに対して、個別に学習せずに効率的に学習することができない問題を有していた。
【0004】
ここで、従来の情報学習方法には、複数ユーザを認証し対応する機能を施したものがある(例えば、特許文献1参照)。しかし、これは、複数ユーザに対してあらかじめ用意された個別に対応する制御内容に従って、制御を行う個人適応制御装置となっており、個々のユーザの嗜好や行為に応じて対応を学習するものではない。
【特許文献1】特開2004−30133
【発明が解決しようとする課題】
【0005】
上述したような従来のロボット装置等における情報学習方法は、例えば、実環境下において自ら収集した情報を記憶し、記憶した情報からその対応を学習するような構成とされているが、その学習はユーザを一人に限定したものであった。このような情報学習方法においては、例えば、複数のユーザに対しては全体を一人のユーザとして対応するか、またはそれぞれ個別に収集した情報を記憶して学習を行うといった対応が行われてきた。
【0006】
例えば、娯楽用の情報学習方法がユーザを特定できず、複数ユーザを一人のユーザとして対応する場合、複数のユーザに対して同じ行動をとることになり、娯楽性の点では、知的に感じない、面白味に欠ける、飽きる等の問題となる。このような情報学習方法においては、例えば、複数ユーザに適切に対応可能な情報学習方法が望ましいとされる。
【0007】
また、個別に学習する場合は、各ユーザに対して学習を行うことが必要になり、メモリの確保や学習時間の増大の問題となるため現実的には不可能となる。
【0008】
そこで、本発明は、上述の実情に鑑みてなされたものであり、複数ユーザに対して自律的に情報を収集し、各ユーザとのインタラクションから効率的に複数ユーザの対応を学習することができる情報学習方法を提供することを目的としている。
【課題を解決するための手段】
【0009】
本発明に係る情報学習方法は、複数ユーザとのインタラクションから学習をする情報学習方法である。この情報学習方法は、上述のような実情に鑑み、対応するユーザを特定するユーザ特定手段と、ユーザの類似性を算出する類似性計算手段と、類似度を正確に算出するためのフィルタリング手段と、ユーザごとに対応を記憶させる個別情報記録手段と、類似度応じて個別情報を更新する行動管理手段とを備える。
【0010】
このような構成を備える情報学習方法は、ユーザ特定手段によりユーザを特定し、ユーザとのインタラクションによる結果を個別情報記録手段に記憶させ、記憶手段に記憶させた個別情報を入力として、ユーザの類似性を類似性計算手段とフィルタリング手段により計算し、算出された類似度の結果に応じて行動管理手段により、個別情報を更新し個別情報に基づき行為を出力する。これにより情報学習方法は、複数のユーザに効率よく学習し対応する。
【0011】
また、本発明に係るプログラムは、上述のような実情に鑑み、情報学習方法がユーザ特定工程によりユーザを特定し、ユーザとのインタラクションによる結果を個別情報記録工程により記憶させ、記憶させた個別情報を入力として、ユーザの類似性を類似性計算工程とフィルタリング工程により計算し、算出された類似度の結果に応じて行動管理工程により、個別情報を更新し個別情報に基づき行為を出力する。このプログラムの実行により、情報学習方法は、複数のユーザに効率よく学習し対応する。
【0012】
また、本発明に係る記録媒体は、上述のような実情に鑑み、情報学習方法がユーザ特定工程によりユーザを特定し、ユーザとのインタラクションによる結果を個別情報記録工程により記憶させ、記憶させた個別情報を入力として、ユーザの類似性を類似性計算工程とフィルタリング工程により計算し、算出された類似度の結果に応じて行動管理工程により、個別情報を更新し個別情報に基づき行為を出力する。この記録媒体に記録されているプログラムの実行により、情報学習方法は、複数のユーザに効率よく学習し対応する。
【発明の効果】
【0013】
本発明に係る情報学習方法は、情報学習方法が対応するユーザを特定するユーザ特定工程と、ユーザの類似性を算出する類似性計算工程と、類似度を正確に算出するためのフィルタリング工程と、ユーザごとに対応を記憶させる個別情報記録工程と、類似度に応じて個別情報を更新する行動管理工程とを有しており、この情報学習方法により、情報学習方法は、実環境下で複数ユーザに対して自律的に情報を収集し、各ユーザとのインタラクションから効率的に複数ユーザの対応を学習することができる。
【0014】
また、本発明に係るプログラムは、情報学習方法が対応するユーザを特定するユーザ特定工程と、ユーザの類似性を算出する類似性計算工程と、類似度を正確に算出するためのフィルタリング工程と、ユーザごとに対応を記憶させる個別情報記録工程と、類似度に応じて個別情報を更新する行動管理工程とを情報学習方法に実行させるものであって、このようなプログラムの実行により、情報学習方法は、実環境下で複数ユーザに対して自律的に情報を収集し、各ユーザとのインタラクションから効率的に複数ユーザの対応を学習することができる。
【0015】
また、本発明に係る記録媒体は、情報学習方法が対応するユーザを特定するユーザ特定工程と、ユーザの類似性を算出する類似性計算工程と、類似度を正確に算出するためのフィルタリング工程と、ユーザごとに対応を記憶させる個別情報記録工程と、類似度に応じて個別情報を更新する行動管理工程とを情報学習方法に実行させるためのプログラムが記録されており、この記録媒体に記録されているプログラムの実行により、情報学習方法は、実環境下で複数ユーザに対して自律的に情報を収集し、各ユーザとのインタラクションから効率的に複数ユーザの対応を学習することができる。
【発明を実施するための最良の形態】
【0016】
以下、本発明の実施の形態について図面を用いて詳細に説明する。この実施の形態は、本発明を、複数の使用者から評価等の外部環境によって行動学習する情報学習方法に適用したものである。
【0017】
図1に示すように、情報学習方法1は、ユーザ特定部2と、類似計算部3と、行動管理部4とを備えている。
【0018】
このような構成において、ユーザ特定部2は、対応するユーザを特定するものとして機能し、音声入力部10、画像入力部20及びユーザ特定入力部30等からなる。類似計算部3は、類似度計算部40及びフィルタリング部50からなり、ユーザ特定部2が検出したユーザ情報により各ユーザ間の類似度が計算される計算手段として機能する。行動管理部4は行動表出制御部60及び個別情報記憶部70からなり、外部情報とユーザ情報及び類似計算部3が検出した類似度情報に応じて情報学習方法の行動を制御するものとして構成されている。
【0019】
情報学習方法はこのような構成により、自律的な行動をして得た外部情報に対して、ユーザとのインタラクションを持ちながら、集団に対して効率的なインタラクションを学習する。以下、情報学習方法を構成する上述の各構成部の詳細について説明する。
【0020】
ユーザ特定部2は、情報学習方法がユーザの情報を収集する部分として構成されている。ユーザ特定部2は、音声入力部10、画像入力部20及びユーザ特定入力部30等によりユーザの情報をユーザ情報として検出するよう構成されている。得られたユーザ情報を類似計算部3に出力する。例えば、ユーザ情報はユーザの名称などとし、他のユーザと区別できるものとする。ユーザ情報は、これに限られるものではなく、ユーザを特定できる情報であれば、全てユーザ情報として含まれるものとする。他にもシステム側で作成した呼称や、ユーザの画像情報などが考えられる。
【0021】
音声入力部10は、情報学習方法が外部の音声情報を検出して認識する部分として構成されている。例えば、情報入力機器としては、マイク等を用いた認識技術がある。
【0022】
画像入力部20は、情報学習方法が外部の画像情報を検出して認識する部分として構成されている。例えば、情報入力機器としては、カメラ等を用いた認識技術がある。
【0023】
ユーザ特定入力部30は、情報学習方法が音声情報と画像情報以外のユーザの特定が可能な情報を収集する部分として構成されている。例えば、情報入力機器としては、温度センサ、味センサ、臭いセンサ等がある。
【0024】
類似計算部3は、ユーザ特定部2が特定したユーザ情報と個別情報記憶部70が記憶している個別情報に基づき、各ユーザ間の類似度を計算するよう構成されている。類似計算部3は、フィルタリング部40、類似度計算部50等により構成され、ユーザ特定部2から得られたユーザ情報と行動管理部4の個別情報記憶部70から得られた個別情報から各ユーザ間の類似度を計算し出力するよう構成されている。
【0025】
フィルタリング部40は、情報学習方法がユーザ情報と個別情報から類似度計算部50が正確な類似度を計算するために、あらかじめ情報にフィルタリングをかけておくよう構成されている。フィルタリング方法としては、例えば、全てのルール集合をIとすると状態xに対応するルールセットがIx、行為aを出力するルール集合をIaとすると、状態xに関連したルール集合Ixから、もしくは、出力が行為aに関するルール集合Iaから各ユーザ間の類似性を計算することで、それぞれ状況に応じた正確な類似性を計算することが可能である。これは、相関係数によるフィルタリングの一つであるといえる。フィルタリング方法は、これに限られるものではなく、類似度を正確に算出するためのフィルタリング方法であれば、全てフィルタリング方法として含まれるものとする。他にもフィルタリングの手法としては、アイテムの相関を用いる情報フィルタリング手法や、モデルベースのフィルタリング手法(ベイジアンネットワーク、クラスタリング等)等がある。
【0026】
類似度計算部50は、フィルタリング部40のフィルタリングされた個別情報により各ユーザ間の類似度を計算するよう構成されている。例えば、ベクトル空間法を用いて、ユーザAとユーザBの個別情報をそれぞれベクトルf、gとすると、この手続きは、以下のように示される。

なお、上記においては、類似度を求める手法としてベクトル空間法を用いたが、これに限られるものではなく、ユーザ間の類似度を算出できる情報であれば、全て類似度計算手法として含まれるものとする。これにより得られた類似度を行動管理部4の個別情報記憶部70へ出力する。
【0027】
行動管理部4は、ユーザ特定部2が出力するユーザ情報、類似計算部3が出力した類似度情報、センサ入力部5により得られる報酬情報により適切な行動を出力する部分として構成されている。行動管理部4は、行動表出制御部60、個別情報記憶部70等により構成されている。
【0028】
行動表出制御部60は、ユーザ特定部2が出力するユーザ情報、センサ入力部5により得られる報酬情報により、個別情報記憶部70の個別情報に応じて適切な行動を出力するように構成されている。
【0029】
個別情報記憶部70は、センサ入力部5により得られる報酬情報、類似計算部3が出力した類似度情報に基づき個別情報を更新するように更新されている。個別情報記憶部70に記憶される個別情報のフォーマットとしては、例えば、IF THENなどのルールとそれに付随するパラメータ等により構成される。図3に個別情報記憶部70に記憶される個別情報のフォーマット例を示す。パラメータ更新の方法は、例えば、下記のようなWidrow−Hoff delta ruleにより計算することが可能である。
←p+β(P−p

新方法は、これに限られるものではなく、ユーザを特定できる情報であれば、全てユーザ情報として含まれるものとする。他にも、強化学習やLearning Classifier System等の学習方法があげられる。
【0030】
ユーザ群6は、このシステムと対応するユーザ群を示している。各ユーザは行動管理部4から出力された行為aに対して評価、行為等のインタラクションを行う。そのインタラクションの内容は、音声情報、画像情報、その他センサ情報として音声入力部10、画像入力部20、ユーザ特定入力部30、センサ入力部5に入力情報として入力される。ユーザ群6は人間だけでなく、人工エージェント、ロボット等も含まれる。
【0031】
以上のように、情報学習方法1は、ユーザ特定部2と、類似計算部3と、行動管理部4より構成されている。
【0032】
次に本発明に係る情報学習方法1の動作について、図2を用いて詳しく説明する。情報学習方法1は、自律的な行動をして情報を収集する際に、外部情報として、ステップST1でユーザ特定入力部30によりユーザ特定情報を、ステップST2で音声入力部10により音声情報を、ステップST3で画像入力部20により画像情報を、ステップST4でセンサ入力部5によりその他のセンサ情報をそれぞれ得る。ステップST5では、ユーザ特定部2においてステップST1、ステップST2及びステップST3にて得られたユーザ特定情報、音声情報、画像情報によりユーザが特定される。ステップST6では、ユーザが特定されたかどうかを判断し、特定できているならばステップST7に進み、特定できていないならばステップST1、ステップST2及びステップST3へ戻る。ステップST7では、行動管理部4の個別情報記憶部70において、ステップST6で特定されたユーザ情報を記録する。ステップST8では、類似計算部3のフィルタリング部50において、正確な類似度を計算するためにフィルタリングを行う。フィルタリングの手法としては情報フィルタリングの手法等を用いることができる。得られたフィルタリング結果を類似度計算部50に出力する。ステップST9では、類似計算部3の類似度計算部50において、ステップST8で得られたフィルタリング結果により対応する全ての各ユーザ間の類似度を計算する。類似度計算の手法としては、ベクトル空間法等を用いることができる。ステップST10で全ての各ユーザ間の類似度を計算できたかどうかを判定し、計算できているならばステップST11へその結果を出力し、計算できていないならばST7へ戻る。ステップST11では、行動管理部4の個別情報記憶部70において、ステップST9の結果とST4により得られる外部情報に応じて個別情報を更新する。ステップST12では、行動管理部4の行動表出制御部60において、センサ入力部5において得られた外部情報と個別情報記憶部70における個別情報に基づいて適切な行為を出力する。
【0033】
これにより、情報学習方法1は複数ユーザに対して自律的に情報を収集し、各ユーザとのインタラクションから効率的に複数ユーザの対応を学習することができるようになる。
【0034】
なお、上記においては、ユーザを特定できる外部情報として音声情報と、画像情報、その他ユーザを特定できるユーザ特定情報としたが、これらに限られるものではなく、他の情報を検出して、ユーザの特定に使用できる情報であれば、全てユーザ特定情報に含まれるものとする。例えば、他の情報としては、温度センサによる温度情報、味センサによる味覚情報、臭いセンサによる臭い情報等の外部情報が考えられ、それらを検出してユーザの特定情報としても良い。
【図面の簡単な説明】
【0035】
【図1】本発明の実施の形態の情報学習方法の要部を示したブロック図である。
【図2】本発明の実施の形態の情報学習方法の要部の動作を示すフローチャートである。
【図3】行動管理部の個別情報記憶部と行動表出制御部における個別情報のフォーマットを示す図である。
【符号の説明】
【0036】
1 情報学習方法、
2 ユーザ特定部
3 類似計算部
4 行動管理部
5 センサ入力部
6 ユーザ群
10 音声入力部
20 画像入力部
30 ユーザ特定入力部
40 類似度計算部
50 フィルタリング部
60 行動表出制御部
70 個別情報記憶部

【特許請求の範囲】
【請求項1】
複数ユーザとのインタラクション(interaction:相互作用)から学習をする情報学習方法であって、対応するユーザを特定するユーザ特定手段と、ユーザごとに対応を記憶させる個別情報記録手段と、ユーザの類似性を算出する類似性計算手段と、類似度を正確に算出するためのフィルタリング手段と、類似度に応じて個別情報を更新する行動管理手段とを備えることを特徴とする情報学習方法。
【請求項2】
上記個別情報記録手段は、上記ユーザ特定手段の結果に応じて対応するユーザ毎にインタラクションの結果を個別情報として記録することを特徴とする請求項1記載の情報学習方法。
【請求項3】
上記類似性計算手段が算出する類似度は、上記ユーザ特定手段の結果に応じてユーザ毎の個別情報の類似度を各組合せについて計算し出力する類似度であることを特徴とする請求項1記載の情報学習方法。
【請求項4】
上記フィルタリング手段は、上記類似度計算手段に対して正確な類似度を計算させることを特徴とする請求項1記載の情報学習方法。
【請求項5】
上記行動管理手段は、上記フィルタリング手段によって個別情報を更新しその値に応じてユーザ毎に行為の出力を行うことを特徴とする請求項1記載の情報学習方法。
【請求項6】
複数ユーザとのインタラクションから、対応するユーザを特定するユーザ特定工程と、ユーザごとに対応を記憶させる個別情報記録工程と、ユーザの類似性を算出する類似性計算工程と、類似度を正確に算出するためのフィルタリング工程と、類似度に応じて個別情報を更新する行動管理工程とを有することを特徴とするプログラム。
【請求項7】
複数ユーザとのインタラクションから、対応するユーザを特定するユーザ特定工程と、ユーザごとに対応を記憶させる個別情報記録工程と、ユーザの類似性を算出する類似性計算工程と、類似度を正確に算出するためのフィルタリング工程と、類似度に応じて個別情報を更新する行動管理工程とを有することを特徴とするプログラムが記録される記録媒体。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate


【公開番号】特開2006−53880(P2006−53880A)
【公開日】平成18年2月23日(2006.2.23)
【国際特許分類】
【出願番号】特願2004−263039(P2004−263039)
【出願日】平成16年8月16日(2004.8.16)
【新規性喪失の例外の表示】特許法第30条第1項適用申請有り 2004年5月31日から6月4日 社団法人人工知能学会主催の「2004年度 人工知能学会全国大会(第18回)」において文書をもって発表
【出願人】(304021417)国立大学法人東京工業大学 (1,821)