説明

対話システム評価方法

【課題】対話システムの種類に依存しない、客観的かつ定量的な対話システム評価方法を提供する。
【解決手段】評価の基準となる対話と評価の対象となる対話に特徴を付与するための特徴付与部、基準対話の特徴と、被評価対話の特徴間の類似度を計算する類似度計算部、前記類似度から前記被評価対話を評価する対話評価部から構成される。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、少なくとも一つの対話からなる基準対話と、被評価対話とに特徴を付与し、それらの特徴間の類似度を前記被評価対話の評価基準とする対話評価方法に関するものである。
【背景技術】
【0002】
従来、コンピュータの自動応答による対話型のシステム(以後対話システムと呼ぶ)が切符の予約、口座の残高確認等で利用されている。このような技術開発のためには、対話システムの性能評価が必須であり、その評価方法として、特定のタスクの達成を目指したタスク指向型対話を対象とする評価方法が知られている(例えば特許文献1参照)。
【特許文献1】 特開2004−272740号公報
【発明の開示】
【発明が解決しようとする課題】
【0003】
しかし、特許文献1の装置では、以下に示すような問題があった。
▲1▼対話の評価が人間の主観に基づくため、客観性に欠ける。
▲2▼明確な目的や目標を持たない非タスク指向型対話の場合、対話の評価に、目的の達成率、目的の達成時間という評価基準を用いることができない。
本発明は、上述した課題を解決するためになされたものであり、
対話の評価に人間の主観を必要とせず、明確な目的や目標を持たない対話にも適用でき、少なくとも1つの基準となる対話を与えることで、被評価対話を評価する方法を提供することを目的とする。
【課題を解決するための手段】
【0004】
請求項1の発明は、以下の通りである。第1図は本発明方法の原理を示すフローチャートである。本発明においては、(i)評価の基準となる対話(以後基準対話と呼ぶ)と評価の対象となる対話(以後被評価対話と呼ぶ)に特徴を付与するための特徴付与部(110)、(ii)基準対話の特徴と、被評価対話の特徴間の類似度を計算する類似度計算部(111)、(iii)前記類似度から前記被評価対話を評価する対話評価部(112)を持つ。
【0005】
特徴付与部は、基準対話(104)と被評価対話(102)に含まれる各発話に対して、少なくとも1つの特徴を人手で付与した対話(103、以後標準データ呼ぶ)と、前記発話と全ての特徴の組の中で、前記標準データから計算される尤度が最大となる特徴を付与する。
【0006】
類似度計算部は、被評価対話に付与された特徴(107)と、基準対話に付与された特徴(108)から、107と108の類似度を計算する。
【0007】
対話評価部は、類似度計算部で計算した類似度を基に、対話の評価を行う。具体的には、人間同士の対話を自然な対話であると仮定し、基準対話を人間同士の対話とした場合、被評価対話と基準対話の類似度の大小によって被評価対話の自然さを評価する。
【発明の効果】
【0008】
以上説明したように、本発明によれば、以下の効果が得られる。
(1) 対話に対して、自動的に特徴を付与することができるため、従来のように人手による特徴付与の過程が不要となり、人手と時間を大幅に節減できる。
(2) 基準対話と被評価対話の類似度を求めることができる。その類似度により被評価対話を評価するため、客観的な評価が可能となる。
(3) 対話システムの客観的・定量的な評価が可能となり、癒し系ロボットをはじめとする各種対話システムの設計または改良に資することができる。
【発明を実施するための最良の形態】
【0009】
以下、本発明の最良の実施形態を添付した第1図から第5図に基づいて説明する。
【0010】
第2図は本例の構成を示す図であり、人間同士の対話を基準対話、人間と対話システムの対話を被評価対話として第1図に示す本発明を適用したもので、特徴付与部は、発話の意味を表す発話タグを付与する。類似度計算部は、基準対話と被評価対話の類似度を隠れマルコフモデルによって計算する。対話評価部は、前記類似度の大小により、対話の自然さを評価する。
【0011】
特徴付与部では、発話の意味を表す発話タグを特徴とし、あらかじめ人手で発話タグを付与された複数の対話から成る標準データから、基準対話または被評価対話の各発話に対して発話タグ毎に尤度を計算し、尤度が最大となる発話タグを前記発話に付与する。
【0012】
第3図は、対話と発話タグの関係を説明するための図である。発話タグは以下に示す14種類である。
(1)Uninterpretable,(2)Self−talk,(3)3rd−party−talk,(4)Statement,(5)Question,(6)Directive,(7)Influencing−addressee−fut−actn,(8)Committing−speaker−future−action,(9)Other−forward−function,(10)Thanking,(11)Apology,(12)Agreement,(13)Understanding,(14)Other
【0013】
標準データを構成するにあたり、標準データに含まれる対話中の各発話に対して、少なくとも1つの発話タグを人手で付与する。
【0014】
標準データを構成する対話に含まれる単語νの出現確率P(ν)、前記対話に含まれる単語νと単語νの2語が連続して現れる確率P(νν)、前記対話に含まれる発話タグcの出現確率P(c)、発話タグcが現れたときに前記対話に含まれる単語νが現れる条件付き確率P(ν|c)、発話タグcが現れたときに前記対話に含まれる単語νと単語νの2語が連続して現れる条件付き確率P(νν|c)から、発話毎に発話タグcの尤度aを計算する。尤度aの求め方は次式による。

上式において、
=logP(c
mk=I(ν,c
mnk=I(νν,c)−I(ν,c)−I(ν,c

:単語νが発話に含まれるとき1,それ以外0
mn:単語列ννが発話に含まれるとき1,それ以外0
M:単語の総数
である。基準対話または被評価対話の各発話に対して、尤度aが最大となる発話タグcを付与する。
【0015】
第4図は、発話として「それで良い」を例にとって前記処理を説明するための図である。第4図において、401、402、403は「それで良い」に含まれる単語、404、405は「それで良い」に含まれる2語連続で現れた単語である。標準データを構成する対話と、401、402、403、404、405から式(1)のw、wmk、wmnkを計算し、「それで良い」に対する、発話タグcの尤度aを求める。第4図において、尤度aが0.3で最大のため、「それで良い」にはタグcを付与する。
【0016】
類似度計算部は、基準対話に付与された発話タグの系列を隠れマルコフモデルによってモデル化し、前記モデルに対して、被評価対話に付与された発話タグの系列を入力することによって、前記基準対話と前記被評価対話の出力確率を計算し、その出力確率を類似度とする。
【0017】
人間同士の対話は自然で理想的であるという前提に立ち、人間同士の対話を基準対話とする。前記基準対話を隠れマルコフモデルでモデル化し、被評価対話に付与された発話タグの系列を前記モデルに入力することで、前記被評価対話が人間同士の対話にどの程度類似しているかを出力確率として計測する。
【0018】
第5図は、人間同士の対話と、人間と対話システムの対話をそれぞれ被評価対話とした場合を例にとって本発明による処理結果を説明するための図である。図では、横軸を出力確率、縦軸を相対頻度としている。第5図から明らかなように、人間同士の対話は、人間と対話システムの対話と比べて、大きい出力確率となり、基準対話との類似度を計算できることがわかる。
【0019】
対話評価部は、類似度計算部で求めた類似度の大小により、人間同士の対話と、人間と対話システムの対話を評価する。基準対話は自然で理想的な対話であるため、基準対話と類似度が大きい被評価対話ほど自然な対話であると評価する。第5図では、人間と対話システムの対話は、人間同士の対話と比べて、不自然な対話と評価される。
【産業上の利用性】
【0020】
本発明は、癒し系ロボットをはじめとする各種対話システムの設計、改良に関する。
【図面の簡単な説明】
【0021】
【図1】 本発明方法の原理を表す構成図である。
【図2】 本発明の一実施形態例を表す構成図である。
【図3】 対話と発話とタグの関係を表す説明図である。
【図4】 本発明の一実施形態例における、タグ付与手法を表す説明図である。
【図5】 本発明の一実施形態例における、対話の評価例を示す図である。
【符号の説明】
【0022】
101 人手による特徴付与
102 評価の対象となる対話
103 標準データ
104 評価の基準となる対話
105 評価の対象となる対話の自動特徴付与
106 評価の基準となる対話の自動特徴付与
107 被評価対話の特徴
108 基準対話の特徴
109 類似度計算
110 特徴付与部
111 類似度計算部
112 対話評価部
401 単語「それ」
402 単語「で」
403 単語「良い」
404 2単語の並び「それで」
405 2単語の並び「で良い」

【特許請求の範囲】
【請求項1】
被評価対話に対し、
少なくとも一つの対話からなる基準対話と、前記被評価対話に、指定された複数の特徴を付与する第1の過程と、
前記基準対話の特徴と、前記被評価対話の特徴の類似度を計算し、前記被評価対話を評価する第2の過程と、
を有することを特徴とする対話評価方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate


【公開番号】特開2008−262523(P2008−262523A)
【公開日】平成20年10月30日(2008.10.30)
【国際特許分類】
【出願番号】特願2007−127380(P2007−127380)
【出願日】平成19年4月11日(2007.4.11)
【新規性喪失の例外の表示】特許法第30条第1項適用申請有り 電子情報通信学会報告 ISSN 0913−5865 信学技報 Vol.106 No.300 発行日 2006年10月12日
【出願人】(504139662)国立大学法人名古屋大学 (996)
【出願人】(000004226)日本電信電話株式会社 (13,992)
【Fターム(参考)】