説明

対話装置

【課題】音声認識の認識結果を早期確定して逐次認識結果を出力することができるとともに、早期確定するフレームの間隔を短くした場合であっても、認識率の低下を抑制することができる対話装置を提供する。
【解決手段】対話装置1は、音声認識の認識区間を設定する認識区間設定手段20と、音声認識を行う音声認識手段30と、音声認識の認識結果の中に所定のキーフレーズが含まれる場合、これに対応した応答行動を決定する応答行動決定手段40と、決定された応答行動を実行する応答行動実行手段50と、を備え、認識区間設定手段20が、既に設定された認識区間の認識終了位置を、当該認識終了位置から所定の時間長だけ進んだ位置のフレームに繰り返し更新することで複数の認識区間を設定し、音声認識手段30が、認識終了位置の異なる複数の認識区間のそれぞれについて音声認識を行う。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ユーザの発話内容に対応した応答行動を行う対話装置に関するものである。
【背景技術】
【0002】
従来、ユーザとコミュニケーションをとることが可能なコミュニケーションロボット等に利用される対話装置では、文単位、あるいは複数の文が区切りなく発話されたユーザの音声を認識することが必要となるため、統計的音声認識手法を利用した連続音声認識が適用されている。このような統計的音声認識手法の探索アルゴリズムとしては、1パス探索とマルチパス探索が知られている。
【0003】
1パス探索は、図16(a)に示すように、入力された音声における単語候補の探索を一度だけ行う手法である。1パス探索は、ユーザの発話区間を始端から終端まで連続して探索するため、認識精度が比較的高いという利点がある。しかし、1パス探索は、大語彙になるほど処理量が多くなるため、複雑なモデル(音響モデルおよび言語モデル)の導入が困難であるという問題があった。
【0004】
そこで、現在は、図16(b)に示すように、ユーザの発話内容の探索を複数回行うマルチパス探索が広く利用されている。マルチパス探索では、図16(b)に示すように、まず発話区間の始端から終端に向かって簡易な(精度の荒い)モデルを用いた第1パス探索を行った後、発話区間の終端から始端に向かって複雑な(精度の高い)モデルを用いた第2パス探索を行う。マルチパス探索は、各パスにおいて簡易なモデルから詳細なモデルに切り替えることで全体の計算量を抑えることをできるため、実装がしやすいという利点がある。
【0005】
その一方で、図16(b)に示すようなマルチパス探索では、発話区間全体についての第2パス探索が終わらなければ音声認識の認識結果を出力することができないという問題があった。すなわち、図16(b)に示すマルチパス探索では、発話の途中で応答行動を決定するためのキーフレーズが出てきても、逐次認識結果を出力することができず、発話区間の終端まで探索を行わなければ認識結果を出力することができなかった。このように、ユーザの発話音声を聞きながら逐次認識結果を出力するには、音声認識の結果を何らかの基準に従って認識途中で早期に確定する必要がある。
【0006】
そこで、現在では、図16(c)に示すように、発話区間を所定長さの区間に分割し、当該分割した区間ごとに認識結果を早期確定して逐次出力する逐次認識技術が提案されている(例えば特許文献1、非特許文献1,2参照)。このような逐次認識技術は、例えば、発話の書き起こしや字幕作成を音声認識で自動化する分野で主に利用されている。
【0007】
特許文献1では、発話区間の音声を認識して意味表現を取り出し、その意味表現の列を意味的なまとまりごとに分割した上で、分割したそれぞれの意味表現に対する処理を行う音声対話システムが提案されている。また、非特許文献1では、早期確定を行うフレームの間隔(発話区間を区切る間隔)を1.5〜3秒に設定し、その周辺で1パス目の終端単語を探索することにより、発話区間が短いことで懸念される認識率の低下を回避する技術が提案されている。そして、非特許文献2では、300msecごとに1パス探索における最尤単語列の比較を行うことで、早期確定を行うことができる終端単語を探索することで、単語確定平均遅れ時間を512msecに抑えた逐次音声認識の技術が提案されている。
【先行技術文献】
【特許文献】
【0008】
【特許文献1】特開平6−259090号公報(図1参照)
【非特許文献】
【0009】
【非特許文献1】瀬川修、他2名「端点検出を行わない連続音声認識手法」、音声言語情報処理 34−18 pp.101−106、2000年12月
【非特許文献2】今井亨、他3名「最ゆう単語列逐次比較による音声認識結果の早期確定」、電子情報通信学会論文誌 D−II Vol.J84−D−II No.9 pp.1942−1949、2001年9月
【発明の概要】
【発明が解決しようとする課題】
【0010】
しかしながら、特許文献1および非特許文献1,2で提案された技術は、いずれも簡易なモデルを用いた第1パス探索(以下、適宜1パス目という)の結果から早期確定するフレームの間隔を特定しているため、1パス目における探索結果が誤っている場合、間違えた単語の区切りが第2パス探索(以下、適宜2パス目という)の探索結果に影響し、認識率が低下してしまうという問題があった。
【0011】
また、音声対話による逐次認識では、発話の書き起こしや字幕作成の場合よりも速いレスポンスが求められるため、早期確定を行う間隔をより短くする必要がある。しかし、特許文献1および非特許文献1,2で提案された技術は、認識結果のレスポンスを上げるために早期確定するフレームの間隔を短くすると、音声認識を行う区間が短くなって単語同士の境界の探索が不安定となり、認識率が低下してしまうという問題があった。
【0012】
本発明は、前記した問題点に鑑み創案されたものであり、音声認識の認識結果を早期確定して逐次認識結果を出力することができるとともに、早期確定するフレームの間隔を短くした場合であっても、認識率の低下を抑制することができる対話装置を提供することを課題とする。
【課題を解決するための手段】
【0013】
前記課題を解決するために本発明に係る対話装置は、入力された音声を音声認識することでユーザの発話内容を認識し、当該発話内容に対応した所定の応答行動を行う対話装置であって、前記音声中における前記ユーザの発話の始端となる発話始端フレームを認識開始位置に設定するとともに、当該認識開始位置から予め定められた時間長だけ進んだ位置のフレームを認識終了位置に設定することで、音声認識を実施する認識区間を設定する認識区間設定手段と、前記認識区間において音声認識を行う音声認識手段と、前記音声認識手段による認識結果の中に所定のキーフレーズが含まれる場合、当該キーフレーズに対応した所定の応答行動を決定する応答行動決定手段と、前記応答行動決定手段によって決定された応答行動を逐次実行する応答行動実行手段と、を備え、前記認識区間設定手段が、既に設定された前記認識終了位置を、当該認識終了位置から前記所定の時間長だけ進んだ位置のフレームに繰り返し更新することで、前記認識終了位置の異なる複数の認識区間を設定し、前記音声認識手段が、前記認識終了位置の異なる複数の認識区間のそれぞれについて音声認識を行う構成とした。
【0014】
このような構成を備える対話装置は、認識区間設定手段によって、ユーザの発話区間を所定の時間長ごとに区切るとともに、当該区切りの位置を認識終了位置とする複数の長さの認識区間を設定し、音声認識手段によって、当該複数の認識区間のそれぞれについて音声認識を行うことで、前記した区切りの位置で音声認識の認識結果を早期確定することができ、複数の認識区間ごとの認識結果(部分認識結果)を出力することができる。
【0015】
また、本発明に係る対話装置は、前記認識区間設定手段は、前記発話始端フレームを検出し、当該発話始端フレームを前記認識開始位置に設定する認識開始位置設定部と、前記認識開始位置設定部によって設定された前記認識開始位置から前記所定の時間長だけ進んだ位置のフレームを前記認識終了位置に設定する認識終了位置設定部と、前記認識終了位置設定部によって既に設定された前記認識終了位置を、当該認識終了位置から前記所定の時間長だけ進んだ位置のフレームに繰り返し更新する認識終了位置更新部と、を備え、前記認識終了位置更新部が、前記音声中における前記ユーザの発話の終端となる発話終端フレームを検出し、前記認識終了位置設定部によって既に設定または自己が既に更新した前記認識終了位置を、当該発話終端フレームに更新し、前記音声認識手段が、前記ユーザの発話区間において、前記発話始端フレームから前記発話終端フレームに向かって前記単語候補の探索を行う第1パス探索部と、前記第1パス探索部による探索結果に従って、前記認識終了位置の異なる複数の認識区間のそれぞれについて、前記認識終了位置から前記認識開始位置に向かって前記単語候補の探索を行う第2パス探索部と、を備え、前記応答行動決定手段が、前記第2パス探索部による探索結果の中に前記所定のキーフレーズが含まれる場合、当該キーフレーズに対応して予め定められた前記所定の応答行動を決定することが好ましい。
【0016】
このような構成を備える対話装置は、認識終了位置更新部によって、予め設定された認識終了位置を所定の時間長だけ進んだ位置のフレームに繰り返し更新することで、複数の長さの認識区間を設定し、第1パス探索部によって、ユーザの発話区間全体の探索を行い、第2パス探索部によって、当該複数の認識区間のそれぞれについて探索を行うことで、速度と精度を両立させながら音声認識を行うことができる。
【0017】
また、本発明に係る対話装置は、前記認識区間設定手段が、前記第2パス探索部による探索結果の中に前記ユーザの発話の区切りが含まれる場合、前記認識開始位置設定部によって既に設定された前記認識開始位置を、当該発話の区切りの先頭の位置のフレームに更新する認識開始位置更新部を備え、前記第2パス探索部が、前記認識開始位置と前記認識終了位置とが異なる複数の認識区間のそれぞれについて前記単語候補の探索を行うことが好ましい。
【0018】
このような構成を備える対話装置は、第2パス探索部によってショートポーズやフィラー等のユーザの発話の区切りが検出された場合、認識開始位置更新部によって、予め設定された認識開始位置を当該発話の区切りの位置の先頭のフレームに更新する。従って、対話装置は、認識終了位置更新部によって認識終了位置が繰り返し更新されることで認識区間が繰り返し延長される場合であっても、認識開始位置更新部によって当該認識区間を短縮させることができる。そのため、対話装置は、長い発話に対して第2パス探索による逆向き探索区間の増加を抑えて探索にかかる処理時間を削減することができるとともに、応答速度を維持することができる。
【0019】
また、本発明に係る対話装置は、前記応答行動決定手段が、前記第2パス探索部による探索結果の中に複数の単語からなる所定のキーフレーズが含まれる場合、当該キーフレーズに対応した所定の応答行動を決定することが好ましい。
【0020】
このような構成を備える対話装置は、応答行動決定手段によって、第2パス探索部による探索結果の中に複数の単語からなるキーフレーズが含まれるか否かによって応答行動を決定する。従って、対話装置は、認識区間を短い時間(例えば200msec)で区切って連続音声認識を行った場合において、第2パス探索部の探索結果の中に誤った単語候補が含まれる場合であっても、一つの単語候補のみで応答行動を決定しないため、応答行動の決定をより精度よく厳密に行うことができる。
【0021】
また、本発明に係る対話装置は、前記第2パス探索部が、探索を行った前記単語候補ごとに、当該単語候補の確からしさを示す単語信頼度を算出し、前記応答行動決定手段が、前記第2パス探索部による探索結果の中に前記所定のキーフレーズが含まれるとともに、当該キーフレーズと一致する単語候補の前記単語信頼度が予め定められた所定値よりも高い場合、前記キーフレーズに対応した前記所定の応答行動を決定することが好ましい。
【0022】
このような構成を備える対話装置は、応答行動決定手段によって、第2パス探索部による探索結果の中にキーフレーズが含まれるとともに、当該キーフレーズと一致する単語候補の単語信頼度が所定以上である場合のみ応答行動を決定するため、応答行動の決定をより精度よく厳密に行うことができる。
【0023】
また、本発明に係る対話装置は、前記キーフレーズと、当該キーフレーズに対応した前記所定の応答行動と、当該所定の応答行動のカテゴリを示す応答行動カテゴリと、をそれぞれ関連付けて記憶する応答行動記憶手段と、前記応答行動決定手段によって既に決定された応答行動の履歴を記憶する応答行動履歴記憶手段と、を備え、前記応答行動決定手段が、前記第2パス探索部による探索結果の中に前記所定のキーフレーズが含まれる場合、前記応答行動記憶手段および前記応答行動履歴記憶手段を参照することで、今回決定しようとする応答行動の前記応答行動カテゴリと、前回決定された応答行動の前記応答行動カテゴリと、が一致するか否かを判定し、両者が一致する場合、前記キーフレーズに対応した前記所定の応答行動を決定することが好ましい。
【0024】
このような構成を備える対話装置は、応答行動決定手段によって、今回決定しようとする応答行動が前回決定した応答行動と同じカテゴリに属する場合のみ、今回の応答行動を決定するため、第2パス探索部による誤探索の結果、前回決定された応答行動と全く関連しない、誤った探索結果に基づいた応答行動が決定されることを防止することができる。
【0025】
また、本発明に係る対話装置は、前記応答行動実行手段が、前記第2パス探索部による最後の探索結果に従って決定された応答行動と、前記第2パス探索部による最後よりも前の探索結果に従って決定された応答行動と、が異なる場合、最後の探索結果に従って決定された応答行動を実行することが好ましい。
【0026】
このような構成を備える対話装置は、応答行動実行手段によって、第2パス探索部による最終的な探索結果に従って決定された応答行動を実行するため、第2パス探索部による途中の探索結果が誤っていた場合であっても、誤った応答行動が実行されることを防止することができる。
【0027】
また、本発明に係る対話装置は、前記応答行動実行手段が、前記応答行動決定手段によって決定された応答行動の実行を開始した後に、前記第2パス探索部による最後の探索が行われた場合において、現在実行中の応答行動に対応した前記第2パス探索部による探索結果の認識結果と、前記第2パス探索部による最後の探索結果と、が異なる場合、現在実行中の応答行動を中止して当該応答行動を訂正するための所定の応答行動を実行した後、前記第2パス探索部による最後の探索結果に従って、前記応答行動決定手段によって決定された応答行動を実行することが好ましい。
【0028】
このような構成を備える対話装置は、第2パス探索部による途中の探索結果(発話区間途中の探索結果)が誤っていた場合において、当該誤った探索結果に従って既に応答行動が決定および実行されてしまった場合であっても、当該誤った応答行動を訂正した上で、第2パス探索部による最終的な探索結果(発話区間終端の探索結果)に従って応答行動を実行することができる。
【発明の効果】
【0029】
本発明に係る対話装置によれば、ユーザの発話区間を所定の時間長ごとに区切った認識区間について連続音声認識を行うことで、逐次認識のレスポンスを確保しながら、認識区間の長さを確保して認識率の低下を抑制することができる。
【図面の簡単な説明】
【0030】
【図1】本発明の第1実施形態に係る対話装置の構成を示すブロック図である。
【図2】本発明の第1実施形態に係る対話装置の詳細な構成を示すブロック図である。
【図3】本発明の第1実施形態に係る対話装置の音声認識手段による探索処理の概要を示す概略図である。
【図4】本発明の第1実施形態に係る対話装置の音声認識手段による一連の処理を示す概略図であって、(a)は、ユーザの発話例を示す図、(b)は、認識区間の設定例を示す図、(c)は、ユーザの発話例に対する認識結果の例を示す図、である。
【図5】本発明の第1実施形態に係る対話装置の応答行動決定手段が予め保持するテーブルを示す概略図である。
【図6】本発明の第1実施形態に係る対話装置の動作を示すフローチャートである。
【図7】本発明の第1実施形態に係る対話装置の動作における認識区間の設定処理を示すフローチャートである。
【図8】本発明の第1実施形態に係る対話装置の動作における認識開始位置の更新処理を示すフローチャートである。
【図9】本発明の第1実施形態に係る対話装置の動作における応答行動の決定処理の一例を説明するための図であって、(a)は、応答行動の決定処理を示すフローチャート、(b)は、応答行動の決定処理の具体例を示す図、である。
【図10】本発明の第1実施形態に係る対話装置の動作における応答行動の決定処理のその他の例を説明するための図であって、(a)は、応答行動の決定処理を示すフローチャート、(b)は、応答行動の決定処理の具体例を示す図、である。
【図11】本発明の第1実施形態に係る対話装置の動作における応答行動の実行処理の一例を示すフローチャートである。
【図12】本発明の第1実施形態に係る対話装置の動作における応答行動の実行処理のその他の例を示すフローチャートである。
【図13】本発明の第2実施形態に係る対話装置の詳細な構成を示すブロック図である。
【図14】本発明の第2実施形態に係る対話装置の応答行動記憶手段が予め保持するテーブルを示す概略図である。
【図15】本発明の第2実施形態に係る対話装置の動作における応答行動の決定処理の一例を説明するための図であって、(a)は、応答行動の決定処理の詳細を示すフローチャート、(b)は、応答行動の決定処理の具体例を示す図、である。
【図16】従来の探索処理の概要を示す概略図であって、(a)は、1パス探索を示す概略図、(b)、(c)は、それぞれマルチパス探索を示す概略図、である。
【発明を実施するための形態】
【0031】
本発明に係る対話装置について、図面を参照しながら説明する。なお、以下の説明では、各実施形態について、同一の構成については同一の名称及び符号を付し、詳細説明を適宜省略する。
【0032】
[第1実施形態]
以下、本発明の第1実施形態に係る対話装置1について、図1〜図5を参照しながら詳細に説明する。対話装置1は、入力されたユーザの音声(以下、適宜入力音声という)から当該ユーザの発話内容を認識し、この発話内容に対応した応答行動を行うものである。対話装置1は、例えば前記したコミュニケーションロボットや、音声を用いて航空券やチケット等の購入を行うシステム等に利用される。
【0033】
対話装置1は、ここでは図1に示すように、音声入力手段10と、認識区間設定手段20と、音声認識手段30と、応答行動決定手段40と、応答行動実行手段50と、を備えている。以下、対話装置1の各要素について、詳細に説明する。
【0034】
音声入力手段10は、図2に示すように、外部からユーザの音声が入力されるものである。音声入力手段10は、例えばオーディオインターフェイスであり、図示しない外部マイク等を介して入力された音声を、図1に示すように、音声時系列データとして認識区間設定手段20に出力する。
【0035】
認識区間設定手段20は、図2に示すように、音声認識を行う区間を示す認識区間を設定するものである。認識区間設定手段20は、具体的には、音声認識の認識区間の始端となる認識開始位置と、音声認識の認識区間の終端となる認識終了位置と、を設定することで、所定長さ(所定フレーム間隔)の認識区間を設定する。認識区間設定手段20は、図2に示すように、音声分析部21と、認識開始位置設定部22と、認識終了位置設定部23と、認識終了位置更新部24と、認識開始位置更新部25と、を備えることが好ましい。
【0036】
音声分析部21は、図2に示すように、音声時系列データを音声特徴ベクトルの時系列に変換するものである。音声分析部21は、ユーザの音声を含む音声時系列データを所定時間長、例えば10msec程度の時間間隔でフレームに分断し、ケプストラム分析によってそれぞれのフレームごとに特徴量を分析することで、音声時系列データに対応した音声特徴ベクトルの時系列を生成する。なお、音声特徴ベクトルの具体例としては、例えばMFCC(Mel Frequency Cepstral Coefficient)、ΔMFCC、ΔΔMFCC、Δ対数パワー等が挙げられる。
【0037】
音声分析部21には、図2に示すように、音声入力手段10からユーザの音声を含む音声時系列データが入力される。そして、音声分析部21は、前記した手法によって音声時系列データを音声特徴ベクトルの時系列に変換し、図2に示すように、当該音声特徴ベクトルの時系列を認識開始位置設定部22と、認識終了位置更新部24と、第1パス探索部31と、にそれぞれ出力する。
【0038】
認識開始位置設定部22は、図2に示すように、音声認識の認識区間における認識開始位置を設定するものである。認識開始位置設定部22は、例えば音声特徴ベクトルの時系列のパワー情報を用いて、音声特徴ベクトルのパワーが予め定めた所定の閾値を超えるフレームを入力音声におけるユーザの発話の始端となる発話始端フレームとして検出する。そして、認識開始位置設定部22は、当該発話始端フレームを認識開始位置に設定する。
【0039】
認識開始位置設定部22には、図2に示すように、音声分析部21から音声特徴ベクトルの時系列が入力される。そして、認識開始位置設定部22は、前記した手法によって入力音声の認識開始位置を設定し、図2に示すように、当該認識開始位置を認識終了位置設定部23と、認識開始位置更新部25と、第1パス探索部31と、第2パス探索部32と、にそれぞれ出力する。
【0040】
認識終了位置設定部23は、図2に示すように、音声認識の認識区間における認識終了位置を設定するものである。認識終了位置設定部23は、具体的には、認識開始位置設定部22によって設定された認識開始位置から予め定められた時間長だけ進んだ位置のフレームを認識終了位置に設定する。ここで、予め定められた時間長としては、例えば形態素解析における一つの形態素に相当する時間長とすることが好ましく、具体的には200msecとすることがより好ましい。
【0041】
認識終了位置設定部23には、図2に示すように、認識開始位置設定部22から認識開始位置が入力される。そして、認識終了位置設定部23は、前記した手法によって入力音声の認識終了位置を設定し、図2に示すように、当該認識終了位置を認識終了位置更新部24と、第2パス探索部32と、にそれぞれ出力する。
【0042】
認識終了位置更新部24は、図2に示すように、音声認識の認識区間における認識終了位置を更新するものである。認識終了位置更新部24は、具体的には認識終了位置設定部23によって既に設定された認識終了位置を、予め定められた時間長だけ進んだ位置のフレームに繰り返し更新する。すなわち、認識終了位置更新部24は、既に設定された認識終了位置を所定の時間長分だけずらすことで、認識区間を当該所定の時間長だけ延長する。なお、予め定められた時間長としては、前記したように、例えば形態素解析における一つの形態素に相当する時間長とすることが好ましく、具体的には200msecとすることがより好ましい。
【0043】
このように、認識終了位置更新部24によって、認識終了位置を繰り返し更新することで、ユーザの発話区間を所定の時間長ごとに区切ることができ、当該区切りの位置で音声認識の認識結果を早期確定することができる。また、所定の時間長を例えば200msecに設定することで、早期確定を行うフレームの間隔を従来よりも短くすることができるため、当該区切りの位置でその都度部分認識結果を出力することができ、対話装置1のレスポンスを向上させることができる。
【0044】
ここで、図3に示すように、ユーザの発話区間の始端のフレームに認識開始位置s1が設定され、当該認識開始位置s1から例えば200msec進んだ位置のフレームに認識終了位置e1が設定されているとする。この場合、認識終了位置更新部24は、認識終了位置e1を、当該認識終了位置e1から200msec進んだ位置のフレームに更新して認識終了位置e2とする。また、認識終了位置更新部24は、同じように、認識終了位置e2を認識終了位置e3に更新する。これにより、認識区間設定手段20は、長さの異なる複数の認識区間(s1〜e1の区間:200msec、s1〜e2の区間:400msec、s1〜e3の区間:600msec)を設定することができる。
【0045】
なお、認識終了位置更新部24は、例えば音声特徴ベクトルの時系列のパワー情報を用いて、音声特徴ベクトルのパワーが予め定めた所定の閾値未満となるフレームを、入力音声におけるユーザの発話の終端となる発話終端フレームとして検出している。そして、認識開始位置設定部22によって設定された認識開始位置から予め定められた時間長(例えば200msec)だけ進んだ位置までの間に、前記した発話終端フレームが存在する場合、当該発話終端フレームを認識終了位置に設定する。
【0046】
認識終了位置更新部24には、図2に示すように、音声分析部21から音声特長ベクトルの時系列が、認識終了位置設定部23から認識終了位置が入力される。そして、認識終了位置更新部24は、前記した手法によって認識終了位置を更新し、図2に示すように、当該更新後の認識終了位置を第1パス探索部31と、第2パス探索部32と、にそれぞれ出力する。
【0047】
認識開始位置更新部25は、図2に示すように、音声認識の認識区間における認識開始位置を更新するものである。認識開始位置更新部25は、具体的には図3に示すように、後記する第2パス探索部32による探索結果の中にユーザの発話の区切りが含まれる場合、認識開始位置設定部22によって既に設定された認識開始位置を、当該発話の区切りの位置の先頭のフレームに更新する。
【0048】
ここで、前記したユーザの発話の区切りとは、例えば発話中におけるショート・ポーズ(息継ぎ)、フィラー(「えー」等の音声)等のことを示しており、ショート・ポーズの場合は、入力音声中における例えば200msec未満の無音区間のことを意味している。なお、第2パス探索部32は、後記するように、精度の高いモデルを用いて最終的な単語候補を探索しているため、その探索結果に含まれるユーザの発話の区切りも精度の高いものとなる。従って、認識開始位置更新部25は、入力音声をユーザの発話の区切りの位置で適切に区切ることができる。
【0049】
前記したように、認識開始位置更新部25によって認識開始位置が更新された場合、前記した認識終了位置更新部24は、当該更新された認識開始位置から、予め定められた時間長だけ進んだ位置(例えば200msec)のフレームに認識終了位置を更新する。すなわち、図3に示すように、第2パス探索部32による3回目の探索結果(s1〜e3の区間における探索結果)の中に、ユーザの発話の区切りが含まれる場合、認識開始位置更新部25は、当該発話の区切りの先頭のフレームを新しい認識開始位置s2に設定する。そして、認識終了位置更新部24は、認識終了位置e3を、認識開始位置s2から200msec進んだ位置のフレームに更新して認識終了位置e4とする。このように、認識開始位置更新部25によって認識開始位置が更新された場合、これに対応して、認識終了位置更新部24も前記更新後の認識開始位置を基準として認識終了位置を再度更新する。
【0050】
このような認識開始位置更新部25を備える対話装置1は、第2パス探索部32によってショートポーズやフィラー等のユーザの発話の区切りが検出された場合、当該認識開始位置更新部25によって、予め設定された認識開始位置を当該発話の区切りの位置の先頭のフレームに更新する。従って、対話装置1は、認識終了位置更新部24によって認識終了位置が繰り返し更新されることで認識区間が繰り返し延長される場合であっても、認識開始位置更新部25によって当該認識区間を短縮させることができる。そのため、対話装置1は、長い発話に対して第2パス探索による逆向き探索区間の増加を抑えて探索にかかる処理時間を削減することができるとともに、応答速度を維持することができる。
【0051】
認識開始位置更新部25には、図2に示すように、認識開始位置設定部22から認識開始位置が、第2パス探索部32から第2パス探索結果が入力される。そして、認識開始位置更新部25は、前記した手法によって認識開始位置を更新し、図2に示すように、当該更新後の認識開始位置を第2パス探索部32に出力する。以下、対話装置1の残りの構成について説明を続ける。
【0052】
音声認識手段30は、図2に示すように、認識区間において音声認識を行うものである。音声認識手段30は、具体的には音声分析部21によって生成された音声特徴ベクトルの時系列を入力として、言語モデル(Language Model)、音響モデル(Acoustic Model)、単語辞書(Word Dictionary)を用いた尤度計算によって入力音声のテキスト化を行なう。
【0053】
ここで、言語モデルは、単語間の接続関係を規定するものであり、予め膨大なテキストデータを形態素解析することで作成される。言語モデルは、例えば単語N−gramモデルを用いることができる。また、音響モデルは、音素(ローマ字1文字にほぼ相当)や音節(かな1文字に相当)の周波数パターンを保持するものであり、予め膨大な音声データを収集して作成される。音響モデルは、例えば隠れマルコフモデル(HMM:Hidden Markov Model)を用いることができる。そして、単語辞書は、認識対象の語彙(=単語の集合)とその発音を規定するものである。なお、言語モデル、音響モデルおよび単語辞書は、図示しない記憶手段に記憶されており、音声認識手段30に入出力可能に構成されている。音声認識手段30は、図2に示すように、第1パス探索部31と、第2パス探索部32と、を備えることが好ましい。
【0054】
第1パス探索部31は、図3に示すように、ユーザの発話区間において、発話始端フレームから発話終端フレームに向かって単語候補の探索を行うものである。ここで、発話始端フレームとは、具体的には前記した認識開始位置設定部22によって最初に設定された認識開始位置(認識開始位置更新部25によって更新されていない認識開始位置、例えば図3におけるs1)のことを意味している。また、発話終端フレームとは、具体的には前記した認識終了位置更新部24によってユーザの発話の終端のフレームに設定された認識終了位置(例えば図3におけるe7)のことを意味している。すなわち、第1パス探索部31は、入力音声中におけるユーザの発話区間全体(始端から終端まで)に対して音声認識を行う。
【0055】
第1パス探索部31は、前記した言語モデル、音響モデルおよび単語辞書を用いて、音声特徴ベクトルの時系列の入力と並行して、left−to−rightにフレーム同期ビーム探索を行う。第1パス探索部31によって行われる第1パス探索は、後記する第2パス探索の前段処理であり、入力音声に対する単語の絞り込みを目的としている。従って、第1パス探索部31は、精度よりも高速性を重視したヒューリスティックな探索を行う。
【0056】
第1パス探索部31は、具体的には精度の荒い言語モデルである単語2−gram(bigram)モデルや、精度の荒い音響モデルを用いて入力音声に対応した音声特徴ベクトルの時系列に対してリアルタイムに第1パス探索を行い、第1パス探索結果として、単語トレリス(単語候補集合)を出力する。この単語トレリスは、第1パス探索中の各フレームにおける単語候補をインデックス化したものであり、音声認識のいわば中間結果に相当するものである。また、この単語トレリスには、単語候補ごとの尤度も含まれている。
【0057】
第1パス探索部31には、図2に示すように、音声分析部21から音声特徴ベクトルの時系列が、認識開始位置設定部22から認識開始位置(発話区間の始端)が、認識終了位置更新部24から更新された認識終了位置(発話区間の終端)が入力される。そして、第1パス探索部31は、前記した手法によって第1パス探索を行い、当該第1パス探索結果(単語トレリス)を第2パス探索部32に出力する。
【0058】
第2パス探索部32は、図3に示すように、認識区間において、認識終了位置から認識開始位置に向かって単語候補の探索を行うものである。第2パス探索部32は、前記した言語モデル、音響モデルおよび単語辞書を用いて、第1パス探索部31による第1パス探索が終了した後に、right−to−leftにスタックデコーディングサーチを行う。第2パス探索部32によって行う第2パス探索は、前記した第1パス探索の後段処理であり、第1パス探索によって得られた中間結果に対して再探索を行い、最終的な単語候補(仮説)を決定することを目的としている。従って、第2パス探索部32は、高速性よりも精度を重視した探索を行う。
【0059】
第2パス探索部32は、具体的には精度の高い言語モデルである単語3−gram(trigram)モデルや、精度の高い音響モデルを用いて単語トレリスに対して逆向きに第2パス探索を行い、第2パス探索結果として、最終的な単語候補を出力する。このように、第2パス探索部32は、第1パス探索部31によって絞り込まれた結果(単語トレリス)に対して逆向きに探索を行うため、第1パス探索で算出された単語候補の尤度を未探索部分の先読みとして反映させることができ、仮説(単語候補)の入力全体に対する評価を得ながら探索を進めることができる。
【0060】
第2パス探索部32は、第1パス探索部31とは異なり、例えば図3に示すように、長さの異なる複数の認識区間のそれぞれに対して単語候補の探索を行う。第2パス探索部32は、例えば第1パス探索部31によって単語トレリスが生成されると、当該単語トレリス上において、認識終了位置設定部23によって設定された認識終了位置e1から、認識開始位置設定部22によって設定された認識開始位置s1まで、逆向きに探索を行う。また、第2パス探索部32は、認識終了位置更新部24によって認識終了位置がe1からe2に更新されると、当該単語トレリス上において、認識終了位置更新部24によって更新された認識終了位置e2から、認識開始位置設定部22によって設定された認識開始位置s1まで、逆向きに探索を行う。
【0061】
また、第2パス探索部32は、認識開始位置更新部25によって認識開始位置s1がs2に更新されると、当該単語トレリス上において、認識終了位置更新部24によって更新された認識終了位置e4から、認識開始位置更新部25によって更新された認識開始位置s2まで、逆向きに探索を行う。また、第2パス探索部32は、認識終了位置更新部24によって認識終了位置e4がe5に更新されると、当該単語トレリス上において、認識終了位置更新部24によって更新された認識終了位置e5から、認識開始位置更新部25によって更新された認識開始位置s2まで、逆向きに探索を行う。また、第2パス探索部32は、認識終了位置更新部24によって認識終了位置e5がe6に更新されると、当該単語トレリス上において、認識終了位置更新部24によって更新された認識終了位置e6から、認識開始位置更新部25によって更新された認識開始位置s2まで、逆向きに探索を行う。そして、第2パス探索部32は、認識終了位置更新部24によって認識終了位置e6がe7に更新されると、当該単語トレリス上において、認識終了位置更新部24によって更新された認識終了位置e7(発話の終端)から、認識開始位置更新部25によって更新された認識開始位置s2まで、逆向きに探索を行う。
【0062】
このように、第2パス探索部32は、認識区間設定手段20によって設定された複数の長さの認識区間のそれぞれについて第2パス探索を行い、設定された認識区間の数に応じた第2パス探索結果を生成する。なお、第2パス探索部32は、探索を行った単語候補ごとに、当該単語候補の確からしさを示す単語信頼度を算出することが好ましい。単語信頼度とは、より具体的には単語候補と音声との音響的な近さを示す音響スコアや、単語間の接続確率を示す言語スコアが挙げられる。これにより、後記するように、応答行動決定手段40によって、第2パス探索部32による探索結果の中にキーフレーズが含まれるとともに、当該キーフレーズに該当する単語候補の単語信頼度が所定以上である場合のみ、対応した応答行動を決定するように構成することができる。
【0063】
第2パス探索部32には、図2に示すように、第1パス探索部31から第1パス探索結果が、認識開始位置設定部22から認識開始位置が、認識終了位置設定部23から認識終了位置が、認識終了位置更新部24から更新後の認識終了位置が、認識開始位置更新部25から更新後の認識開始位置が入力される。そして、第2パス探索部32は、前記した手法によって第2パス探索を行い、当該第2パス探索結果を認識開始位置更新部25と、応答行動決定手段40と、に出力する。以下、対話装置1の残りの構成について説明を続ける。
【0064】
応答行動決定手段40は、図2に示すように、音声認識手段30の認識結果に従って、応答行動を決定するものである。応答行動決定手段40は、予め定めた所定のキーフレーズと、このキーフレーズに対応した応答行動と、の関係を例えばテーブル形式等によって予め保持している。そして、応答行動決定手段40は、音声認識手段30による認識結果、より詳しくは第2パス探索部32による第2パス探索結果に含まれる単語候補の終端単語がキーフレーズと一致するか否かを前記したテーブルを参照して判定し、一致する場合は当該キーフレーズに対応した応答行動を決定する。
【0065】
前記したキーフレーズとは、具体的には第2パス探索部32による第2パス探索結果に含まれることが想定される単語のことを意味している。また、終端単語とは、第2パス探索部32による第2パス探索結果に含まれる単語候補(単語列)のうち、終端に位置する単語のことを意味している。例えば、「海岸にはどんなごみがあるの。」という音声を対話装置1に入力した場合において、第2パス探索部32による第2探索結果に「海岸」、「には」、「どんな」、「ごみ」という4つの単語候補が含まれる場合、終端単語は「ごみ」となる。
【0066】
応答行動決定手段40には、音声認識手段30から複数の認識区間に対応した複数の音声認識の結果が入力される。例えば、図4(a)に示すように、音声入力手段10に対して、ユーザから「海岸にはどんなごみがあるの。」という音声が入力された場合、図4(b)に示すように、認識区間設定手段20によって、発話区間内における長さの異なる複数の認識区間が設定され、図4(c)に示すように、音声認識手段30によって、複数の認識区間のそれぞれについて音声認識が行われ、その認識結果が応答行動決定手段40に逐次入力される。そして、応答行動決定手段40は、図4(c)における「認識区間のフレーム数:100」の認識結果に含まれる終端単語がキーフレーズに一致するため、当該「認識区間のフレーム数:100」の認識結果が入力された時点で、当該認識結果に従って応答行動を決定する。
【0067】
なお、図4(c)における「認識区間のフレーム数」とは、認識区間の長さをフレーム数で示したものであり、「フレーム」とは、前記したように、ユーザの音声における10msec程度の区間のことを意味している。従って、1フレームを10msecとすると、図4(c)における2行目(フレーム数:20)の認識区間の長さは200msec、3行目(フレーム数:40)の認識区間の長さは400msec、4行目(フレーム数:60)の認識区間の長さは600msec、となり、認識区間が200msecずつ増加していることになる。
【0068】
ここで、前記した応答行動決定手段40は、第2パス探索部32による第2探索結果に含まれる1つの終端単語と、予め定められた1つのキーフレーズと、が一致するか否かを判定しているが、終端単語を含む複数単語からなる終端単語群と、予め定められた複数の単語からなるキーフレーズと、が一致するか否かを判定することが好ましい。
【0069】
この場合、応答行動決定手段40は、例えば図5に示すように、複数の単語からなるキーフレーズと、当該キーフレーズに対応した応答行動と、の関係を例えばテーブル形式等によって予め保持している。そして、応答行動決定手段40は、第2パス探索部32による第2パス探索結果に含まれる終端単語と、当該終端単語の一つ前に位置する単語と、からなる終端単語群がキーフレーズと一致するか否かを前記したテーブルを参照して判定し、一致する場合は当該キーフレーズに対応した応答行動を決定する。
【0070】
なお、図5における応答行動の欄の「TYPE」、「AMOUNT」、「PARTICIPATE」、「SCHEDULE」は、それぞれ応答行動の種類を示しており、例えば応答行動決定手段40によって、応答行動「TYPE」が決定された場合は、後記する応答行動実行手段50によって、ごみの種類を返答するような応答行動が実行されることになる。また、例えば応答行動決定手段40によって、応答行動「AMOUNT」が決定された場合は、後記する応答行動実行手段50によって、ごみの量を返答するような応答行動が実行されることになる。
【0071】
応答行動決定手段40には、音声認識手段30から複数の認識区間に対応した複数の音声認識の結果が入力される。例えば、図4(a)に示すように、音声入力手段10に対して、ユーザから「海岸にはどんなごみがあるの。」という音声が入力された場合、図4(b)に示すように、認識区間設定手段20によって、発話区間内における長さの異なる複数の認識区間が設定され、図4(c)に示すように、音声認識手段30によって、複数の認識区間のそれぞれについて音声認識が行われ、その認識結果が応答行動決定手段40に逐次入力される。そして、応答行動決定手段40は、図4(c)における「認識区間のフレーム数:120」の認識結果に含まれる終端単語群がキーフレーズに一致するため、当該「認識区間のフレーム数:120」の認識結果が入力された時点で、当該認識結果に従って応答行動を決定する。
【0072】
このような応答行動決定手段40を備える対話装置1は、当該応答行動決定手段40によって、第2パス探索部32による探索結果の中に複数の単語からなるキーフレーズが含まれるか否かによって応答行動を決定する。従って、対話装置1は、認識区間を短い時間(例えば200msec)で区切って連続音声認識を行った場合において、第2パス探索部32の探索結果の中に誤った単語候補が含まれる場合であっても、一つの単語候補のみで応答行動を決定しないため、応答行動の決定をより精度よく厳密に行うことができる。
【0073】
また、前記した応答行動決定手段40は、前記したように第2パス探索部32が探索を行った単語候補ごとの単語信頼度を算出した場合、当該単語信頼度を閾値処理することで応答行動を決定することが好ましい。
【0074】
この場合、応答行動決定手段40は、第2パス探索部32による第2パス探索結果に含まれる終端単語が、予め定められたキーフレーズと一致するか否かを判定すると同時に、終端単語の単語信頼度が、予め定められた所定値よりも高いか否かを判定する閾値処理を行う。そして、応答行動決定手段40は、終端単語がキーフレーズと一致し、単語信頼度が所定値よりも高い場合のみ、キーフレーズに対応した応答行動を決定する。
【0075】
応答行動決定手段40には、音声認識手段30から複数の認識区間に対応した複数の音声認識の結果が入力される。例えば、図4(a)に示すように、音声入力手段10に対して、ユーザから「海岸にはどんなごみがあるの。」という音声が入力された場合、図4(b)に示すように、認識区間設定手段20によって、発話区間内における長さの異なる複数の認識区間が設定され、図4(c)に示すように、音声認識手段30によって、複数の認識区間について順番に音声認識が行われ、その認識結果が応答行動決定手段40に入力される。
【0076】
そして、応答行動決定手段40は、図4(c)における「認識区間のフレーム数:120」の認識結果に含まれる終端単語(群)がキーフレーズと一致する場合において、終端単語の単語信頼度が所定値よりも高い場合、当該「認識区間のフレーム数:120」の認識結果が入力された時点で、当該認識結果に従って応答行動を決定する。一方、応答行動決定手段40は、図4(c)における「認識区間のフレーム数:120」の認識結果に含まれる終端単語の単語信頼度が所定値未満である場合、当該「認識区間のフレーム数:120」の認識結果を採用せずに、次の「認識区間のフレーム数:140」の認識結果を参照する。そして、応答行動決定手段40は、図4(c)における「認識区間のフレーム数:140」の認識結果に含まれる終端単語がキーフレーズと一致する場合において、終端単語の単語信頼度が所定値よりも高い場合、当該「認識区間のフレーム数:140」の認識結果が入力された時点で、当該認識結果に従って応答行動を決定する。
【0077】
このような応答行動決定手段40を備える対話装置1は、当該応答行動決定手段40によって、第2パス探索部32による探索結果の中にキーフレーズが含まれるとともに、当該キーフレーズと一致する単語候補の単語信頼度が所定以上である場合のみ応答行動を決定するため、応答行動の決定をより精度よく厳密に行うことができる。
【0078】
応答行動決定手段40には、図2に示すように、第2パス探索部32から第2パス探索結果が入力される。そして、応答行動決定手段40は、前記した手法によって応答行動を決定し、当該決定された応答行動を応答行動実行手段50に出力する。
【0079】
応答行動実行手段50は、図2に示すように、応答行動決定手段40によって決定された応答行動を実行するものである。ここで、応答行動実行手段50は、ユーザの発話区間途中の第2パス探索結果により決定された応答行動よりも、ユーザの発話区間終端の第2パス探索結果により決定された応答行動を優先して実行することが好ましい。
【0080】
この場合、応答行動実行手段50は、応答行動決定手段40から発話区間途中の第2パス探索結果により決定された応答行動が入力されると、発話区間終端の第2パス探索結果により決定された応答行動が入力されるまで、発話区間途中の第2パス探索結果により決定された応答行動の実行を行わずに予約する。なお、発話区間途中の第2パス探索結果とは、例えば図3におけるe1〜e6(発話区間の途中)に認識終了位置が設定された認識区間における音声認識結果のことを意味しており、発話区間終端の第2パス探索結果とは、例えば図3におけるe7(発話区間の終端)に認識終了位置が設定された認識区間における音声認識結果のことを意味している。
【0081】
応答行動実行手段50は、応答行動決定手段40から発話区間終端の第2パス探索結果により決定された応答行動が入力されると、発話区間途中の第2パス探索結果により決定された応答行動と、発話区間終端の第2パス探索結果により決定された応答行動と、が一致するか否かを判定する。そして、応答行動実行手段50は、両者が相違する場合は、発話区間途中の第2パス探索結果により決定された応答行動を破棄し、発話区間終端の第2パス探索結果により決定された応答行動を実行する。一方、応答行動実行手段50は、両者が一致する場合は、発話区間終端の第2パス探索結果により決定された応答行動を破棄し、発話区間途中の第2パス探索結果により決定された応答行動を実行する。
【0082】
このような応答行動実行手段50を備える対話装置1は、当該応答行動実行手段50によって、第2パス探索部32による最終的な探索結果に従って決定された応答行動を実行するため、第2パス探索部32による途中の探索結果が誤っていた場合であっても、誤った応答行動が実行されることを防止することができる。
【0083】
また、応答行動決定手段40は、ユーザの発話区間途中の第2パス探索結果により決定された応答行動と、ユーザの発話区間終端の第2パス探索結果により決定された応答行動と、が異なる場合において、ユーザの発話区間途中の第2パス探索結果により決定された応答行動を既に実行している場合は、これを訂正するための応答行動を実行することが好ましい。
【0084】
この場合、応答行動実行手段50は、応答行動決定手段40から発話区間途中の第2パス探索結果により決定された応答行動が入力されると、これを実行する。そして、応答行動実行手段50は、応答行動決定手段40から発話区間終端の第2パス探索結果により決定された応答行動が入力されると、発話区間途中の第2パス探索結果により決定された応答行動と、発話区間終端の第2パス探索結果により決定された応答行動と、が一致するか否かを判定する。そして、応答行動実行手段50は、両者が相違する場合は、既に実行している発話区間途中の第2パス探索結果により決定された応答行動を中止し、かつ、これを訂正するための応答行動を実行する。一方、応答行動実行手段50は、両者が一致する場合は、発話区間終端の第2パス探索結果により決定された応答行動を破棄し、発話区間途中の第2パス探索結果により決定された応答行動の実行を継続する。
【0085】
例えば、「海岸にはどんなごみがあるの。」という音声を対話装置1に入力した場合において、第2パス探索部32による発話区間途中の第2探索結果が誤っている場合(例えば、「海岸」、「には」、「どんな」、「ごむ」と認識した場合)、応答行動実行手段50は、当該第2探索結果により決定された応答行動の実行を開始する。しかし、当該応答行動の実行中に、第2パス探索部32による発話区間終端の正しい第2探索結果(例えば、「海岸」、「には」、「どんな」、「ごみ」、「が」、「ある」、「の」と認識)により決定された応答行動が応答行動決定手段40から入力された場合、応答行動実行手段50は、実行中の応答行動を中止し、かつ、これを訂正するための応答行動(例えば「間違えました」という音声出力)を実行する。そして、応答行動実行手段50は、発話区間終端の第2探索結果により決定された応答行動の実行を開始する。
【0086】
このような応答行動実行手段50を備える対話装置1は、第2パス探索部32による途中の探索結果(発話区間途中の探索結果)が誤っていた場合において、当該誤った探索結果に従って既に応答行動が決定および実行されてしまった場合であっても、当該誤った応答行動を訂正した上で、第2パス探索部32による最終的な探索結果(発話区間終端の探索結果)に従って応答行動を実行することができる。
【0087】
応答行動実行手段50には、図2に示すように、応答行動決定手段40から決定された応答行動が入力される。そして、応答行動実行手段50は、前記したように当該応答行動を実行する。
【0088】
以上のような構成を備える対話装置1は、認識区間設定手段20によって、ユーザの発話区間を所定の時間長ごとに区切るとともに、当該区切りの位置を認識終了位置とする複数の長さの認識区間を設定し、音声認識手段30によって、当該複数の認識区間のそれぞれについて音声認識を行うことで、前記した区切りの位置で音声認識の認識結果を早期確定することができ、複数の認識区間ごとの認識結果(部分認識結果)を出力することができる。
【0089】
また、対話装置1は、認識区間設定手段20および音声認識手段30が図2に示すような構成を備える場合、認識終了位置更新部24によって、予め設定された認識終了位置を所定の時間長だけ進んだ位置のフレームに繰り返し更新することで、複数の長さの認識区間を設定し、第1パス探索部31によって、ユーザの発話区間全体の探索を行い、第2パス探索部32によって、当該複数の認識区間のそれぞれについて探索を行うことで、速度と精度を両立させながら音声認識を行うことができる。
【0090】
従って、対話装置1によれば、ユーザの発話区間を所定の時間長ごとに区切った認識区間について連続音声認識を行うことで、逐次認識のレスポンスを確保しながら、認識区間の長さを確保して認識率の低下を抑制することができる。
【0091】
[対話装置1の動作]
以下、第1実施形態に係る対話装置1の動作について、図6を参照しながら簡単に説明する。
【0092】
まず、対話装置1は、音声入力手段10に音声が入力されると(ステップS1)、認識区間設定手段20によって、音声認識を行う認識区間を設定する(ステップS2)。次に、対話装置1は、音声認識手段30によって、設定された認識区間における音声認識を行う(ステップS3)。次に、対話装置1は、応答行動決定手段40によって、音声認識手段30による認識結果の中に予め定められたキーフレーズがあるか否かを判定する(ステップS4)。
【0093】
そして、対話装置1は、音声認識手段30による認識結果の中にキーフレーズがある場合(ステップS4においてYes)、応答行動決定手段40によって、キーフレーズに対応した応答行動を決定する(ステップS5)。一方、対話装置1は、音声認識手段30による認識結果の中にキーフレーズがない場合(ステップS4においてNo)、ステップS3に戻る。次に、対話装置1は、応答行動実行手段50によって、応答行動決定手段40によって決定された応答行動を実行し(ステップS6)、処理を終了する。なお、対話装置1は、音声認識手段30による認識結果の中にキーフレーズがない場合(ステップS4においてNo)、ステップS3に戻る前に認識開始位置を更新することもできる(ステップS7)。
【0094】
(認識区間の設定処理(ステップS2)の詳細)
以下、図6における認識区間の設定処理(ステップS2)の詳細について、図7を参照しながら簡単に説明する。
【0095】
まず、対話装置1は、音声分析部21によって、入力された音声の1フレーム分を分析し、音声特徴ベクトルに変換する(ステップS21)。次に、対話装置1は、認識開始位置設定部22によって、例えば音声特徴ベクトルのパワー情報を用いて、当該1フレームがユーザの発話区間の中か否かを判定する(ステップS22)。そして、対話装置1は、当該1フレームがユーザの発話区間の中である場合(ステップS22においてYes)、ステップS23に進む。一方、対話装置1は、当該1フレームがユーザの発話区間の中ではない場合(ステップS22においてNo)、ステップS21に戻る。
【0096】
次に、対話装置1は、認識開始位置設定部22によって、例えば音声特徴ベクトルのパワー情報を用いて、当該1フレームがユーザの発話区間の始端であるか否かを判定する(ステップS23)。そして、対話装置1は、当該1フレームがユーザの発話区間の始端である場合(ステップS23においてYes)、認識開始位置設定部22によって、分析中のフレームを認識開始位置に設定し(ステップS24)、f=0とした後(ステップS25)、ステップS29に進む。なお、ステップS25におけるfは、認識区間における認識開始位置から分析中のフレームまでのフレーム数のことを意味している。
【0097】
一方、対話装置1は、当該1フレームがユーザの発話区間の始端ではない場合(ステップS23においてNo)、認識終了位置更新部24によって、当該1フレームがユーザの発話区間の終端であるか否かを判定する(ステップS26)。そして、対話装置1は、当該1フレームがユーザの発話区間の終端である場合(ステップS26においてYes)、認識終了位置更新部24によって、分析中のフレームを認識終了位置に設定し(ステップS27)、認識区間の設定処理を終了する。
【0098】
一方、対話装置1は、当該1フレームがユーザの発話区間の終端ではない場合(ステップS26においてNo)、f=f+1とした後(ステップS28)、f<Nであるか否を判定する(ステップS29)。なお、ステップS29におけるNは、認識終了位置設定部23によって認識終了位置を設定する際の間隔(または認識終了位置更新部24によって認識終了位置を更新する際の間隔)に相当するフレーム数であり、前記認識終了位置設定部23が認識終了位置を設定(前記した認識終了位置更新部24が認識終了位置を更新)する場合に用いる「予め定められた時間長」に相当するものである。
【0099】
例えば、前記したように、入力音声の1フレームの長さを10msecとし、認識終了位置設定部23によって認識終了位置を設定(認識終了位置更新部24によって認識終了位置を更新)する際の間隔を200msecとした場合、ステップS29におけるNは20(=200/10)となる。このように、ステップS29の処理では、認識終了位置設定部23が認識終了位置を設定(認識終了位置更新部24による認識終了位置の更新)する際のフレーム数をカウントしている。
【0100】
そして、対話装置1は、f<Nである場合(ステップS29においてYes)、ステップS21に戻る。一方、対話装置1は、f<Nではない場合(ステップS29においてNo)、認識終了位置設定部23(認識終了位置更新部24)によって、分析中のフレームを認識終了位置に設定し(ステップS30)、f=0とし(ステップS31)、認識区間の設定処理を終了する。
【0101】
(認識開始位置の更新処理(ステップS7)の詳細)
以下、図6における認識開始位置の更新処理(ステップS7)の詳細について、図8を参照しながら簡単に説明する。
【0102】
まず、対話装置1は、認識開始位置更新部25によって、第2パス探索部32による探索結果の中に発話の区切りがあるか否かを判定する(ステップS71)。そして、対話装置1は、第2パス探索部32による探索結果の中に発話の区切りがある場合(ステップS71においてYes)、認識開始位置更新部25によって、発話の区切りの先頭のフレームを認識開始位置に設定し(ステップS72)、f=0とし(ステップS73)、認識開始位置の更新処理を終了する。一方、対話装置1は、第2パス探索部32による探索結果の中に発話の区切りがない場合(ステップS71においてNo)、認識開始位置の更新処理を終了する。
【0103】
(応答行動の決定処理(ステップS5)の一例の詳細)
以下、図6における応答行動の決定処理(ステップS5)の一例の詳細について、図9を参照(適宜図4(c)および図5参照)しながら簡単に説明する。なお、以下の説明では、まず図9(a)を参照しながらフローチャートによって一連の処理の流れを説明するとともに、図9(b)を参照しながら一連の処理の具体例についても説明する。
【0104】
まず、対話装置1は、図9(a)に示すように、応答行動決定手段40によって、第2パス探索部32による探索結果(認識結果)を取得する(ステップS511)。この処理によって、対話装置1は、例えば図9(b)における「認識区間120フレームの時の認識結果例(図4(c)参照)」に示すような結果を得る。
【0105】
次に、対話装置1は、図9(a)に示すように、応答行動決定手段40によって、第2パス探索結果の中からキーフレーズを検出する(ステップS512)。この処理によって対話装置1は、例えば図9(b)における「キーフレーズの検出結果」に示すような結果を得る。
【0106】
次に、対話装置1は、図9(a)に示すように、応答行動決定手段40によって、検出したキーフレーズに対応した応答行動を決定し(ステップS513)、応答行動の決定処理を終了する。この処理によって対話装置1は、例えば図9(b)における「決定した応答行動」に示すような結果を得る。なお、図9(b)における「決定した応答行動」は、応答行動決定手段40が前記した図5のテーブルを用いて決定したものである。
【0107】
(応答行動の決定処理(ステップS5)のその他の例の詳細)
以下、図6における応答行動の決定処理(ステップS5)のその他の例の詳細について、図10を参照(適宜図4(c)および図5参照)しながら簡単に説明する。なお、以下の説明では、まず図10(a)を参照しながらフローチャートによって一連の処理の流れを説明するとともに、図10(b)を参照しながら一連の処理の具体例についても説明する。
【0108】
まず、対話装置1は、図10(a)に示すように、応答行動決定手段40によって、第2パス探索部32による探索結果(認識結果)を取得する(ステップS521)。この処理によって、対話装置1は、例えば図10(b)における「認識区間120フレームの時の認識結果例(図4(c)参照)」に示すような結果を得る。
【0109】
次に、対話装置1は、図10(a)に示すように、応答行動決定手段40によって、第2パス探索結果の中からキーフレーズを検出する(ステップS522)。また、対話装置1は、図10(a)に示すように、応答行動決定手段40によって、検出したキーフレーズの中に終端単語Weがあるかを判定する(ステップS523)。そして、対話装置1は、検出したキーフレーズの中に終端単語Weがある場合(ステップS523においてYes)、ステップS524に進む。これらの処理によって対話装置1は、例えば図10(b)における「キーフレーズの検出結果」に示すような結果を得る。
【0110】
次に、対話装置1は、図10(a)に示すように、応答行動決定手段40によって、終端単語Weの単語信頼度Seが所定の値αを超えるか否かを判定する(ステップS524)。そして、対話装置1は、図10(a)、(b)に示すように、終端単語Weの単語信頼度Seが所定の値αを超える場合(ステップS524においてYes)、対応した応答行動を決定して応答行動の決定処理を終了する(ステップS525)。一方、対話装置1は、図10(a)、(b)に示すように、終端単語Weの単語信頼度Seが所定の値α未満である場合(ステップS524においてNo)、終端単語Weをキーフレーズとしてみなさずに破棄し、応答行動の決定処理を終了する(ステップS526)。
【0111】
(応答行動の実行処理(ステップS6)の一例の詳細)
以下、図6における応答行動の実行処理(ステップS6)の一例の詳細について、図11を参照しながら簡単に説明する。
【0112】
まず、対話装置1は、応答行動決定手段40から応答行動が入力されると(ステップS611)、応答行動実行手段50によって、発話区間途中の探索結果により既に決定された応答行動があるか否かを判定する(ステップS612)。そして、対話装置1は、発話区間途中の探索結果により既に決定された応答行動がある場合(ステップS612においてYes)、ステップS613に進む。一方、対話装置1は、発話区間途中の探索結果により既に決定された応答行動がない場合(ステップS612においてNo)、ステップS614に進み、応答行動実行手段50によって、入力された応答行動の実行を予約し(ステップS614)、応答行動の実行処理を終了する。
【0113】
次に、対話装置1は、応答行動実行手段50によって、応答行動決定手段40から入力された応答行動が発話区間終端の認識結果により決定された応答行動であるか否かを判定する(ステップS613)。そして、対話装置1は、応答行動決定手段40から入力された応答行動が発話区間終端の認識結果により決定された応答行動である場合(ステップS613においてYes)、ステップS615に進む。一方、対話装置1は、応答行動決定手段40から入力された応答行動が発話区間終端の認識結果により決定された応答行動ではない場合(ステップS613においてNo)、応答行動の実行処理を終了する。
【0114】
次に、対話装置1は、応答行動実行手段50によって、応答行動決定手段40から入力された応答行動が、発話区間終端の認識結果により決定された応答行動と、相違するか否かを判定する(ステップS615)。そして、対話装置1は、応答行動決定手段40から入力された応答行動が、発話区間終端の認識結果により決定された応答行動と、相違する場合(ステップS615でYes)、発話区間終端の認識結果により決定された応答行動を優先的に実行し(ステップS616)、応答行動の実行処理を終了する。一方、対話装置1は、応答行動決定手段40から入力された応答行動が、発話区間終端の認識結果により決定された応答行動と、相違しない場合(ステップS615でNo)、発話区間途中の探索結果により決定された応答行動を実行し(ステップS617)、応答行動の実行処理を終了する。
【0115】
(応答行動の実行処理(ステップS6)のその他の例の詳細)
以下、図6における応答行動の実行処理(ステップS6)のその他の例の詳細について、図12を参照しながら簡単に説明する。
【0116】
まず、対話装置1は、応答行動決定手段40から応答行動が入力されると(ステップS621)、応答行動実行手段50によって、発話区間途中の探索結果により既に決定された応答行動があるか否かを判定する(ステップS622)。そして、対話装置1は、発話区間途中の探索結果により既に決定された応答行動がある場合(ステップS622においてYes)、ステップS623に進む。一方、対話装置1は、発話区間途中の探索結果により既に決定された応答行動がない場合(ステップS622においてNo)、ステップS624に進み、応答行動実行手段50によって、入力された応答行動の実行を継続し(ステップS624)、応答行動の実行処理を終了する。
【0117】
次に、対話装置1は、応答行動実行手段50によって、応答行動決定手段40から入力された応答行動が発話区間終端の認識結果により決定された応答行動であるか否かを判定する(ステップS623)。そして、対話装置1は、応答行動決定手段40から入力された応答行動が発話区間終端の認識結果により決定された応答行動である場合(ステップS623においてYes)、ステップS625に進む。一方、対話装置1は、応答行動決定手段40から入力された応答行動が発話区間終端の認識結果により決定された応答行動ではない場合(ステップS623においてNo)、応答行動の実行処理を終了する。
【0118】
次に、対話装置1は、応答行動実行手段50によって、応答行動決定手段40から入力された応答行動が、発話区間終端の認識結果により決定された応答行動と、相違するか否かを判定する(ステップS625)。そして、対話装置1は、応答行動決定手段40から入力された応答行動が、発話区間終端の認識結果により決定された応答行動と、相違する場合(ステップS625でYes)、訂正のための応答行動を実行し(ステップS626)、発話区間終端の認識結果により決定された応答行動を優先的に実行し(ステップS627)、応答行動の実行処理を終了する。一方、対話装置1は、応答行動決定手段40から入力された応答行動が、発話区間終端の認識結果により決定された応答行動と、相違しない場合(ステップS625でNo)、応答行動の実行処理を終了する。
【0119】
[第2実施形態]
以下、第2実施形態に係る対話装置1Aについて、図13および図14を参照しながら簡単に説明する。対話装置1Aは、図13に示すように、応答行動記憶手段60と、応答行動履歴記憶手段70と、を更に備える以外は、第1実施形態に係る対話装置1と同様の構成を備えている。従って、以下の説明では、対話装置1との相違点を中心に説明を行い、当該対話装置1と重複する構成については詳細説明を省略する。
【0120】
応答行動記憶手段60は、応答行動決定手段40が決定する応答行動に関する情報を記憶するものである。応答行動記憶手段60は、ここでは図14に示すように、キーフレーズと、これに対応した応答行動と、当該応答行動のカテゴリを示す応答行動カテゴリと、をそれぞれ関連付けたテーブルを記憶しており、図13に示すように、必要に応じて応答行動決定手段40に出力可能に構成されている。応答行動記憶手段60は、具体的には、データを記憶することができるメモリ、ハードディスク等で具現される。
【0121】
応答行動履歴記憶手段70は、応答行動決定手段40によって既に決定された応答行動の履歴を記憶するものである。応答行動履歴記憶手段70は、具体的には応答行動決定手段40によって決定された応答行動を、例えば表形式で記憶しており、図13に示すように、必要に応じて応答行動決定手段40に出力可能に構成されている。また、応答行動履歴記憶手段70には、図13に示すように、応答行動決定手段40によって決定された応答行動が逐次入力される。応答行動履歴記憶手段70は、具体的には、データを記憶することができるメモリ、ハードディスク等で具現される。
【0122】
このような応答行動記憶手段60および応答行動履歴記憶手段70を備える対話装置1Aは、応答行動決定手段40による応答行動の決定処理を2段階に分けて行う。すなわち、応答行動決定手段40は、第2パス探索部32による第2パス探索結果に含まれる終端単語(群)が、予め定められたキーフレーズと一致するか否かを判定すると同時に、応答行動決定手段40によって今回決定された応答行動の応答行動カテゴリと、応答行動決定手段40によって前回決定された応答行動の応答行動カテゴリと、が一致するか否かを判定する。そして、応答行動決定手段40は、終端単語(群)がキーフレーズと一致し、両者のカテゴリが一致する場合のみ、キーフレーズに対応した応答行動を決定する。
【0123】
応答行動決定手段40によって今回決定された応答行動の応答行動カテゴリと、応答行動決定手段40によって前回決定された応答行動の応答行動カテゴリと、が一致するか否かを判定は、応答行動履歴記憶手段70に記憶された前回の応答行動履歴を、応答行動記憶手段60に記憶されたテーブルに照らし合わせることで行う。
【0124】
このような構成を備える対話装置1Aは、応答行動決定手段40によって、今回決定しようとする応答行動が前回決定した応答行動と同じカテゴリに属する場合のみ、今回の応答行動を決定するため、第2パス探索部32による誤探索の結果、前回決定された応答行動と全く関連しない、誤った探索結果に基づいた応答行動が決定されることを防止することができる。
[対話装置1Aの動作]
以下、第2実施形態に係る対話装置1Aの動作について、図15を参照しながら簡単に説明する。なお、対話装置1Aは、応答行動の決定処理(図6のステップS5)以外の処理は、対話装置1と同様であるため、以下の説明では、対話装置1Aにおける応答行動の実行処理についてのみ説明する。また、以下の説明では、まず図15(a)を参照しながらフローチャートによって一連の処理の流れを説明するとともに、図15(b)を参照しながら一連の処理の具体例についても説明する。
【0125】
まず、対話装置1Aは、図15(a)に示すように、応答行動決定手段40によって、第2パス探索部32による認識結果を取得する(ステップS531)。この処理によって、対話装置1Aは、例えば図15(b)における「認識区間120フレームの時の認識結果例(図4(c)参照)」に示すような結果を得る。
【0126】
次に、対話装置1Aは、図15(a)に示すように、応答行動決定手段40によって、第2パス探索結果の中からキーフレーズを検出する(ステップS532)。また、対話装置1Aは、図15(a)に示すように、応答行動決定手段40によって、検出したキーフレーズの中に終端単語Weがあるかを判定する(ステップS533)。そして、対話装置1Aは、検出したキーフレーズの中に終端単語Weがある場合(ステップS533においてYes)、ステップS534に進む。これらの処理によって対話装置1Aは、例えば図15(b)における「キーフレーズの検出結果」に示すような結果を得る。なお、対話装置1Aは、検出したキーフレーズの中に終端単語Weがない場合(ステップS533においてNo)、ステップS536に進む。
【0127】
次に、対話装置1Aは、図15(a)に示すように、応答行動決定手段40によって、終端単語Weに対応した応答行動を仮決定する(ステップS534)。この処理によって対話装置1Aは、例えば図15(b)における「仮決定した応答行動と該当する応答行動カテゴリ」に示すような結果を得る。次に、対話装置1Aは、図15(a)に示すように、応答行動決定手段40によって、仮決定した応答行動が前回決定した応答行動カテゴリに該当するか否かを判定する(ステップS535)。
【0128】
そして、対話装置1Aは、図15(a)に示すように、仮決定した応答行動が前回決定した応答行動カテゴリに該当する場合(ステップS535においてYes)、応答行動決定手段40によって、仮決定した応答行動を決定する(ステップS536)。この処理によって対話装置1Aは、例えば図15(b)における「前回決定した応答行動カテゴリがREFUSEの場合」に示すような結果を得る。一方、対話装置1Aは、図15(a)に示すように、仮決定した応答行動が前回決定した応答行動カテゴリに該当しない場合(ステップS535においてNo)、応答行動決定手段40によって、前記した終端単語Weをキーフレーズとしてみなさず、仮決定した応答行動を破棄し(ステップS537)、応答行動の決定処理を終了する。この処理によって対話装置1Aは、例えば図15(b)における「前回決定した応答行動カテゴリがBEACHCLEANの場合」に示すような結果を得る。次に、対話装置1Aは、図15(a)に示すように、応答行動決定手段40によって決定された応答行動を応答行動履歴記憶手段70に記憶させ(ステップS538)、応答行動の決定処理を終了する。
【0129】
[対話プログラム]
ここで、前記した対話装置1,1Aは、一般的なコンピュータを、前記した各手段および各部として機能させるプログラムにより動作させることで実現することができる。このプログラムは、通信回線を介して配布することも可能であるし、CD−ROM等の記録媒体に書き込んで配布することも可能である。
【0130】
以上、本発明に係る対話装置1,1Aについて、発明を実施するための形態により具体的に説明したが、本発明の趣旨はこれらの記載に限定されるものではなく、特許請求の範囲の記載に基づいて広く解釈されなければならない。また、これらの記載に基づいて種々変更、改変等したものも本発明の趣旨に含まれることはいうまでもない。
【0131】
例えば、対話装置1,1Aは、前記したように、外部から音声入力手段10に対して音声が入力され、音声分析部21によって当該音声(音声時系列データ)を音声特徴ベクトルに変換する構成としたが、音声分析部21の構成を省略し、音声入力手段10において、入力音声を音声特徴ベクトルに変換する構成としても構わない。
【0132】
また、対話装置1,1Aの応答行動決定手段40は、前記したように、音声認識手段30の第2パス探索部32による認識結果に含まれることが想定される単語を示すキーフレーズと、このキーフレーズに対応して行う応答行動と、の関係を例えばテーブル形式等によって予め保持している構成としたが(図5参照)、これらを外部の図示しない記憶手段に予め記憶させ、応答行動決定手段40が適宜読み出す構成としても構わない。
【符号の説明】
【0133】
1,1A 対話装置
10 音声入力手段
20 認識区間設定手段
21 音声分析部
22 認識開始位置設定部
23 認識終了位置設定部
24 認識終了位置更新部
25 認識開始位置更新部
30 音声認識手段
31 第1パス探索部
32 第2パス探索部
40 応答行動決定手段
50 応答行動実行手段
60 応答行動記憶手段
70 応答行動履歴記憶手段

【特許請求の範囲】
【請求項1】
入力された音声を音声認識することでユーザの発話内容を認識し、当該発話内容に対応した所定の応答行動を行う対話装置であって、
前記音声中における前記ユーザの発話の始端となる発話始端フレームを認識開始位置に設定するとともに、当該認識開始位置から予め定められた時間長だけ進んだ位置のフレームを認識終了位置に設定することで、音声認識を実施する認識区間を設定する認識区間設定手段と、
前記認識区間において音声認識を行う音声認識手段と、
前記音声認識手段による認識結果の中に所定のキーフレーズが含まれる場合、当該キーフレーズに対応した所定の応答行動を決定する応答行動決定手段と、
前記応答行動決定手段によって決定された応答行動を逐次実行する応答行動実行手段と、を備え、
前記認識区間設定手段は、既に設定された前記認識終了位置を、当該認識終了位置から前記所定の時間長だけ進んだ位置のフレームに繰り返し更新することで、前記認識終了位置の異なる複数の認識区間を設定し、
前記音声認識手段は、前記認識終了位置の異なる複数の認識区間のそれぞれについて音声認識を行うことを特徴とする対話装置。
【請求項2】
前記認識区間設定手段は、
前記発話始端フレームを検出し、当該発話始端フレームを前記認識開始位置に設定する認識開始位置設定部と、
前記認識開始位置設定部によって設定された前記認識開始位置から前記所定の時間長だけ進んだ位置のフレームを前記認識終了位置に設定する認識終了位置設定部と、
前記認識終了位置設定部によって既に設定された前記認識終了位置を、当該認識終了位置から前記所定の時間長だけ進んだ位置のフレームに繰り返し更新する認識終了位置更新部と、を備え、
前記認識終了位置更新部は、前記音声中における前記ユーザの発話の終端となる発話終端フレームを検出し、前記認識終了位置設定部によって既に設定または自己が既に更新した前記認識終了位置を、当該発話終端フレームに更新し、
前記音声認識手段は、
前記ユーザの発話区間において、前記発話始端フレームから前記発話終端フレームに向かって単語候補の探索を行う第1パス探索部と、
前記第1パス探索部による探索結果に従って、前記認識終了位置の異なる複数の認識区間のそれぞれについて、前記認識終了位置から前記認識開始位置に向かって前記単語候補の探索を行う第2パス探索部と、を備え、
前記応答行動決定手段は、前記第2パス探索部による探索結果の中に前記所定のキーフレーズが含まれる場合、当該キーフレーズに対応して予め定められた前記所定の応答行動を決定することを特徴とする請求項1に記載の対話装置。
【請求項3】
前記認識区間設定手段は、前記第2パス探索部による探索結果の中に前記ユーザの発話の区切りが含まれる場合、前記認識開始位置設定部によって既に設定された前記認識開始位置を、当該発話の区切りの先頭の位置のフレームに更新する認識開始位置更新部を備え、
前記第2パス探索部は、前記認識開始位置と前記認識終了位置とが異なる複数の認識区間のそれぞれについて前記単語候補の探索を行うことを特徴とする請求項2に記載の対話装置。
【請求項4】
前記応答行動決定手段は、前記第2パス探索部による探索結果の中に複数の単語からなる所定のキーフレーズが含まれる場合、当該キーフレーズに対応した所定の応答行動を決定することを特徴とする請求項2または請求項3に記載の対話装置。
【請求項5】
前記第2パス探索部は、探索を行った前記単語候補ごとに、当該単語候補の確からしさを示す単語信頼度を算出し、
前記応答行動決定手段は、前記第2パス探索部による探索結果の中に前記所定のキーフレーズが含まれるとともに、当該キーフレーズと一致する単語候補の前記単語信頼度が予め定められた所定値よりも高い場合、前記キーフレーズに対応した前記所定の応答行動を決定することを特徴とする請求項2から請求項4のいずれか一項に記載の対話装置。
【請求項6】
前記キーフレーズと、当該キーフレーズに対応した前記所定の応答行動と、当該所定の応答行動のカテゴリを示す応答行動カテゴリと、をそれぞれ関連付けて記憶する応答行動記憶手段と、
前記応答行動決定手段によって既に決定された応答行動の履歴を記憶する応答行動履歴記憶手段と、を備え、
前記応答行動決定手段は、前記第2パス探索部による探索結果の中に前記所定のキーフレーズが含まれる場合、前記応答行動記憶手段および前記応答行動履歴記憶手段を参照することで、今回決定しようとする応答行動の前記応答行動カテゴリと、前回決定された応答行動の前記応答行動カテゴリと、が一致するか否かを判定し、両者が一致する場合、前記キーフレーズに対応した前記所定の応答行動を決定することを特徴とする請求項2から請求項4のいずれか一項に記載の対話装置。
【請求項7】
前記応答行動実行手段は、前記第2パス探索部による最後の探索結果に従って決定された応答行動と、前記第2パス探索部による最後よりも前の探索結果に従って決定された応答行動と、が異なる場合、最後の探索結果に従って決定された応答行動を実行することを特徴とする請求項2から請求項6のいずれか一項に記載の対話装置。
【請求項8】
前記応答行動実行手段は、前記応答行動決定手段によって決定された応答行動の実行を開始した後に、前記第2パス探索部による最後の探索が行われた場合において、現在実行中の応答行動に対応した前記第2パス探索部による探索結果の認識結果と、前記第2パス探索部による最後の探索結果と、が異なる場合、現在実行中の応答行動を中止して当該応答行動を訂正するための所定の応答行動を実行した後、前記第2パス探索部による最後の探索結果に従って、前記応答行動決定手段によって決定された応答行動を実行することを特徴とする請求項2から請求項7のいずれか一項に記載の対話装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate


【公開番号】特開2012−226068(P2012−226068A)
【公開日】平成24年11月15日(2012.11.15)
【国際特許分類】
【出願番号】特願2011−92683(P2011−92683)
【出願日】平成23年4月19日(2011.4.19)
【出願人】(000005326)本田技研工業株式会社 (23,863)
【Fターム(参考)】