説明

音声信号処理装置

【課題】用件に対する話者間の対話時の音声信号から用件に係る必要情報を精度よく抽出することができる技術を提供する。
【解決手段】音声認識手段13は、話者間の対話時の音声信号を音声認識情報に変換する。会話単位分割手段14は、音声認識情報を会話単位に分割する。必要情報手掛かり情報付与手段16は、会話単位に含まれている必要情報手掛かり情報を会話単位に付与する。用件判別手段15は、音声認識情報に基づいて話者間の対話の用件を判別する。対話状態遷移判別手段17は、用件に対応する必要情報を抽出するための手掛かりとなる必要情報手掛かり情報が含まれている会話単位を選択する。そして、選択した会話単位と、用件に対応して対話状態判別情報データベース25に記憶されている対話状態判別情報に基づいて、対話状態が、情報要求対話状態、要求受理対話状態、情報開示対話状態、情報受理対話状態の順に遷移したことを判別することにより必要情報を抽出する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、用件に対する話者間の対話時の音声信号から、用件に係る必要情報を抽出する技術に関する。
【背景技術】
【0002】
顧客が企業に用件(サービス)を依頼する場合(例えば、顧客が電力会社に[電気の使用開始]、[電気の使用停止]、[電気の契約容量の変更]を依頼する場合)等には、顧客は、企業のサービスセンターに電話する。この時、サービスセンターの受付者(オペレータ)は、顧客が依頼する用件の内容、当該依頼された用件の遂行に必要な必要情報を顧客から聞き取り、聞き取った用件の内容および必要情報をコンピュータや記録用紙に記録する。この場合、受付者は、用件の内容や必要情報を顧客から聞き取って記録する作業が必要となり、受付者の負担が大きい。
そこで、受付者の負担を軽減するために、話者間の対話時の音声信号から必要情報を抽出する音声信号処理装置の開発が要望されている。
これまで、音声から必要情報を抽出(要約)する技術が提案されている。例えば、特許文献1には、音響分析による特徴パターン(無音継続時間、音声の高低、話者間の音声波形の類似度等)を手掛かりとして、対話中の重要な情報(語句)を判別し、音声要約を行う方法が開示されている。また、特許文献2には、音声認識結果であるテキスト情報に対して、形態素解析や構文解析および意味解析を行い、これらの結果に基づき重要箇所の判別を行う方法が開示されている。
しかしながら、このような従来の音声要約技術では、用件が明確な目的指向の対話から、用件に係る必要情報を精度よく抽出することができない。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2006−58567号公報
【特許文献2】特開平8−212228号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
本願発明は、このような点に鑑みて創案されたものであり、用件に対する話者間の対話時の音声信号から、用件に係る必要情報を精度よく抽出することができる技術を提供することを目的とする。
【課題を解決するための手段】
【0005】
本願の音声信号処理装置は、予め定められている用件に対する話者間の対話時の音声信号から、当該用件に係る必要情報を抽出する。「用件」としては、典型的には、顧客が企業に依頼するサービス(例えば、顧客が電力会社に依頼する[電気の使用開始]、[電気の使用停止]、[電気の契約容量の変更])が対応する。「音声信号」としては、典型的には、音声を電気信号に変換するマイクロフォン等から出力される信号が対応する。なお、処理手段における信号処理はデジタルで行われるため、マイクロフォン等から出力されるアナログの信号をデジタル化した信号を「音声信号」として用いることもできる。
【0006】
一つの発明は、記憶手段と、処理手段と、入力手段と、出力手段を備えている。
記憶手段は、必要情報データベースと、対話状態判別情報データベースを有している。
必要情報データベースには、用件に係る必要情報を示す必要情報リストが記憶されている。「必要情報」は、依頼された用件(例えば、顧客から企業に依頼するサービス)を遂行するのに必要な情報であり、用件毎に定められる。
対話状態判別情報データベースには、話者間の対話状態を判別するための対話状態判別情報が記憶されている。本発明では、話者間の対話状態が、必要情報を要求した情報要求対話状態、必要情報を開示した情報開示対話状態、必要情報を受理した情報受理対話状態の順に遷移したことを判別することにより、必要情報を判別する。このため、対話状態判別情報として、必要情報を要求した対話状態であることを判別するための情報要求手掛かり情報、必要情報を開示した対話状態であることを判別するための情報開示手掛かり情報、必要情報を受理した対話状態であることを判別するための情報受理手掛かり情報が記憶されている。
処理手段は、音声認識手段と、用件判別手段と、対話状態遷移判別手段と、管理手段を有している。
音声認識手段は、入力手段から入力された話者間の対話時の音声信号を、テキスト情報を含む音声認識情報に変換する。音声信号を音声認識情報に変換する方法としては、公知の種々の音声認識方法を用いることができる。例えば、HMM(隠れマルコフモデル)とNグラム(確率的言語モデル)を用いた大語彙連続音声認識方法が用いられる。入力手段としては、例えば、音声を電気信号に変換するマイクロフォン、アナログ信号をデジタル信号に変換するA/D変換処理を行うA/D変換器等が用いられる。なお、A/D変換処理は、音声認識手段で行うこともできる。また、入力手段としては、記憶媒体に記憶されている音声信号等を読み取る読取手段を用いることもできる。また、本願発明の「音声認識手段は、入力手段から入力された話者間の対話時の音声信号を音声認識情報に変換する」構成には、「処理手段と離れて設けられている音声認識手段によって音声信号を音声認識情報に変換し、音声認識情報を入力手段から入力する」構成も含まれる。
用件判別手段は、音声認識情報に基づいて、話者間の対話の用件を判別する。「音声認識情報に基づいて用件を判別する」方法としては、典型的には、音声認識情報に含まれている文字列から用件を判別する方法が用いられる。本明細書では、文字、数字や記号等を用いて表現されたものを「文字列」という。
対話状態遷移判別手段は、音声認識情報に基づいて、話者間の対話状態が、情報要求対話状態、情報開示対話状態、情報受理対話状態の順に遷移したことを判別することによって、用件判別手段で判別した用件に対応する必要情報リストで示されている各必要情報を抽出する。例えば、必要情報が[契約者名]である場合には、契約者の名前を示す人名を抽出し、必要情報が[契約者住所]である場合には、契約者の住所を示す地名を抽出し、必要情報が[契約者電話番号]である場合には、契約者の電話番号を示す数詞を抽出する。話者間の対話状態が、情報要求対話状態、情報開示対話状態、情報受理対話状態の順に遷移したことは、例えば、音声認識情報に、対話状態判別情報データベースに記憶されている情報要求手掛かり情報、情報開示手掛かり情報、情報受理手掛かり情報が順に含まれていることによって判別する。
管理手段は、対話状態遷移判別手段によって抽出された必要情報を出力手段から出力する。出力手段としては、例えば、表示手段、印刷手段等が用いられる。対話状態遷移判別手段によって抽出された必要情報を出力手段から出力する態様としては、種々の出力態様を用いることができる。
本発明では、対話状態が、情報要求対話状態、情報開示対話状態、情報受理対話状態の順に遷移したことを判別することによって必要情報を抽出しているため、必要情報を精度よく抽出することができる。
【0007】
他の発明は、記憶手段と、処理手段と、入力手段と、出力手段を備えている。
記憶手段は、必要情報データベースと、対話状態判別情報データベースを有している。必要情報データベース、対話状態判別情報データベースとしては、前述した一つの発明と同様のものを用いることができる。
処理手段は、音声認識手段と、用件判別手段と、対話状態遷移判別手段と、管理手段を有している。音声認識手段、対話状態遷移判別手段、管理手段としては、前述した一つの発明と同様の音声認識手段、対話状態遷移判別手段、管理手段を用いることができる。本発明では、用件判別手段は、入力手段から入力された用件識別情報に基づいて、話者間の対話の用件を判別する。用件識別情報を入力する方法としては、例えば、入力手段に設けられている入力キーを操作する方法や入力手段に設けられている入力画面に表示されている入力部を選択する方法を用いることができる。用件識別情報は、音声信号とともに入力するのが好ましいが、音声信号と異なるタイミングで入力してもよい。
本発明では、対話状態が、情報要求対話状態、情報開示対話状態、情報受理対話状態の順に遷移したことを判別することによって必要情報を抽出しているため、必要情報を精度よく抽出することができる。また、本発明では、入力手段から入力される用件識別情報に基づいて用件を判別するため、話者間の対話の用件を容易に判別することができる。
【0008】
一つの発明あるいは他の発明の異なる形態では、対話状態判別情報データベースには、さらに、必要情報の要求を受理した要求受理対話状態であることを判別するための要求受理手掛かり情報が記憶されている。そして、対話状態遷移判別手段は、音声認識情報に基づいて、話者間の対話状態が、情報要求対話状態、要求受理対話状態、情報開示対話状態、情報受理対話状態の順に遷移したことを判別することによって、用件判別手段で判別した用件に対応する必要情報リストで示されている各必要情報を抽出する。話者間の対話状態が、情報要求対話状態、要求受理対話状態、情報開示対話状態、情報受理対話状態の順に遷移したことは、音声認識情報に、対話状態判別情報データベースに記憶されている情報要求手掛かり情報、要求受理手掛かり情報、情報開示手掛かり情報、情報受理手掛かり情報が順に含まれていることによって判別する。
本形態では、対話状態が、情報要求対話状態、要求受理対話状態、情報開示対話状態、情報受理対話状態の順に遷移したことを判別することによって必要情報を抽出しているため、必要情報を精度よく抽出することができる。
【0009】
一つの発明あるいは他の発明の他の異なる形態では、記憶手段は、さらに、会話単位判別情報データベースと必要情報手掛かり情報データベースを有し、処理手段は、さらに、会話単位分割手段と必要情報手掛かり情報付与手段を有している。
会話単位判別情報データベースには、音声認識情報を会話単位に分割するための会話単位判別情報が記憶されている。「会話単位」は、一つの話題に関する範囲を意味する。会話単位判別情報データベースには、典型的には、会話単位の始点を判別するための会話単位始点判別情報と、会話単位の終点を判別するための会話単位終点判別情報を含む会話単位判別情報が記憶される。必要情報手掛かり情報データベースには、必要情報を抽出するための手掛かりとなる必要情報手掛かり情報を示す必要情報手掛かり情報リストが、用件に対応して記憶されている。必要情報手掛かり情報は、必要情報に対応して適宜設定することができるが、少なくとも、必要情報として抽出される文字列に対応する必要情報手掛かり情報(典型的には、必要情報として抽出される文字列と同じ品詞を有する必要情報手掛かり情報)が設定される。例えば、必要情報が[契約者名]である場合には、少なくとも、人名を示す文字列に対応する必要情報手掛かり情報(品詞[人名]を有する必要情報手掛かり情報)を設定する。また、必要情報が[契約者住所]である場合には、少なくとも、住所を示す文字列に対する必要情報手掛かり情報(品詞[地名]を有する必要情報手掛かり情報)を設定する。また、必要情報が[契約者電話番号]である場合には、少なくとも、数字を組み合わせた文字列に対する必要情報手掛かり情報(品詞[数詞]を有する必要情報手掛かり情報)を設定する。なお、必要情報手掛かり情報データベースと必要情報データベースを一つのデータベースとして構成することもできる。例えば、用件に対応させて必要情報を記憶させるとともに、各必要情報に対応させて必要情報手掛かり情報を記憶させる。
会話単位分割手段は、会話単位判別情報データベースに記憶されている会話単位判別情報に基づいて、音声認識情報を会話単位に分割する。会話単位分割手段は、典型的には、音声認識情報と会話単位判別情報データベースに記憶されている会話単位始点判別情報および会話単位終点判別情報に基づいて会話単位の始点および終点を判別し、会話単位の始点と、会話単位の始点に後続する会話単位の終点の間を会話単位とする。例えば、会話単位始点判別情報が存在する箇所を会話単位の始点とし、会話単位終点判別情報が存在する箇所を会話単位の終点とする。なお、2つの会話単位始点判別情報の間に会話単位終点判別情報が存在しない場合には、後続する会話単位始点判別情報が存在する箇所の直前の箇所を、先行する会話単位の終点とし、後続する会話単位始点判別情報が存在する箇所を、後続する会話単位の始点とする。また、2つの会話単位終点判別情報の間に会話単位始点判別情報が存在しない場合には、先行する会話単位終点判別情報が存在する箇所を、先行する会話単位の終点とし、先行する会話単位終点判別情報が存在する箇所の直後の箇所を、後続する会話単位の始点とする。
必要情報手掛かり情報付与手段は、会話単位分割手段により分割された会話単位に必要情報手掛かり情報を付与する。具体的には、会話単位に、必要情報を抽出する手掛かりとなる必要情報手掛かり情報が含まれていれば、当該必要情報手掛かり情報を当該会話単位に付与する。
対話状態遷移判別手段は、用件に対応する必要情報を抽出する手掛かりとなる必要情報手掛かり情報を含んでいる会話単位を選択する。必要情報を抽出する手掛かりとなる必要情報手掛かり情報を含む会話単位を選択する方法としては、必要情報に対応する必要情報手掛かり情報を一つ含む会話単位を選択する方法や、適宜選択した複数の必要情報手掛かり情報を含む会話単位を選択する方法を用いることができる。また、会話単位に含まれる必要情報手掛かり情報を適宜変更しながら会話単位を選択する方法を用いることもできる。なお、会話単位を選択する際には、少なくとも、必要情報として抽出される文字列に対応する必要情報手掛かり情報(典型的には、必要情報として抽出される文字列と同じ品詞を有する必要情報手掛かり情報)を含む会話単位を選択する。例えば、必要情報が[契約者名]である場合には、人名を示す文字列(品詞[人名]を有する文字列)を含んでいる会話単位を選択し、必要情報が[契約者住所]である場合には、住所を示す文字列(品詞[地名]を有する文字列)を含んでいる会話単位を選択し、必要情報が[契約者電話番号]である場合には、数字を組み合わせた文字列(品詞[数詞]を有する文字列)を含んでいる会話単位を選択する。そして、選択した会話単位に含まれている音声認識情報に基づいて対話状態の遷移を判別することによって、必要情報を抽出する。
本形態では、音声認識情報を会話単位に分割することにより、必要情報をより精度よく抽出することができる。また、必要情報手掛かり情報を会話単位に付与することにより、必要情報を効率よく抽出することができる。
【0010】
さらに他の発明は、コンピュータに、前記した処理手段の処理を実行させるためのプログラムあるいはプログラムが記憶された記憶媒体である。
本発明のプログラムあるいは記憶媒体を用いることにより、前述した効果を得ることができる。
【発明の効果】
【0011】
本発明の音声信号処理装置では、対話状態の遷移を判別することで、用件に関する話者間の対話時の音声信号から用件に係る必要情報を抽出しているため、用件に係る必要情報を精度よく抽出することができる。
本発明では、
【図面の簡単な説明】
【0012】
【図1】本発明の実施の形態の概略構成図である。
【図2】会話単位判別情報データベースの一例を示す図である。
【図3】必要情報リストの一例を示す図である。
【図4】必要情報リストの他の例を示す図である。
【図5】必要情報リストのさらに他の例を示す図である。
【図6】必要情報手掛かり情報リストの一例を示す図である。
【図7】対話状態判別情報データベースの一例を示す図である。
【図8】本発明の実施の形態の動作を説明するフローチャートである。
【図9】話者間の対話時の音声信号を音声認識した音声認識情報の一例を示す図である。
【図10】話者間の対話時の音声信号を音声認識した音声認識情報の一例を示す図である。
【図11】話者間の対話状態の遷移を判別することにより必要情報を抽出する方法の概要を示す図である。
【図12】話者間の対話状態の遷移を判別することにより必要情報を抽出する方法の一例を示すである。
【図13】話者間の対話状態の遷移を判別することにより必要情報を抽出する他の例を示すである。
【図14】話者間の対話状態の遷移を判別することにより必要情報を抽出するさらに他の例を示すである。
【発明を実施するための形態】
【0013】
以下に、本願発明の音声信号処理装置の実施の形態を、図面を参照して説明する。
図1に、本発明の音声信号処理装置の第1の実施の形態の概略構成図が示されている。第1の実施の形態の音声信号処理装置は、一方の話者から他方の話者に、予め定められている用件を依頼する際における話者間の対話時の音声信号から、依頼された用件を遂行するために必要な必要情報を抽出する音声信号処理装置として好適に用いることができる。本明細書において、「用件」は、一方の話者から他方の話者に依頼する内容(例えば、サービスの内容)を意味する。
本実施の形態の音声信号処理装置は、処理手段10、記憶手段20、入力手段30、出力手段40を備えている。
入力手段30としては、音声を電気信号である音声信号に変換するマイクロフォン、記憶媒体に記憶されている音声信号を読み取る読取手段、入力キー、入力画面等の種々の公知の入力手段を用いることができる。「音声信号」は、音声を電気信号に変換するマイクロフォン等から出力される信号を意味する。なお、「音声信号」には、マイクロフォン等から出力された信号をデジタル化した信号も含まれる。
出力手段40としては、表示手段や印刷手段等の公知の種々の出力手段を用いることができる。
【0014】
記憶手段20は、音声信号データベース21、会話単位判別情報データベース22、必要情報データベース23、必要情報手掛かり情報データベース24、対話状態判別情報データベース25を有している。
【0015】
音声信号データベース21には、入力手段30を介して入力された、用件に対する話者間の対話時の音声信号が記憶される。なお、本実施の形態では、後述するように、音声信号から作成された、テキスト情報を含む音声認識情報に基づいて必要情報を抽出する。このため、音声信号を記憶する音声信号データベース21に代えて、音声認識情報データベース26を用いることもできる。この場合、入力手段30を介して入力された音声信号は音声認識手段12により音声認識情報に変換され、変換された音声認識情報が音声認識情報データベース26に記憶される。あるいは、入力手段30を介して入力された音声信号を音声信号データベース21に記憶し、音声信号データベース21に記憶されている音声信号から作成された音声認識情報を音声認識情報データベース26に記憶させてもよい。あるいは、入力手段30を介して入力された音声認識情報を音声認識情報データベース26に記憶させてもよい。すなわち、音声信号から作成された音声認識情報を利用可能であればよい。
【0016】
会話単位判別情報データベース22には、音声認識情報を会話単位に分割するための会話単位判別情報が記憶されている。「会話単位]は、一つの話題に関する範囲を意味する。
図2に、会話単位判別情報データベース22の一例が示されている。図2に示されている会話単位判別情報データベース22では、会話単位判別情報として、会話単位の始点を示す会話単位始点判別情報と、会話単位の終点を示す会話単位終点判別情報が記憶されている。会話単位始点判別情報としては、会話単位の初めに用いられることが多い表現が用いられる。例えば、呼び掛ける時の表現「もしもし」、始めの挨拶の表現「おはようございます」、話題を変更する時の表現「では」、「それでは」および「次に」等が用いられる。会話単位終点判別情報としては、会話単位の終わりに用いられることが多い表現が用いられる。例えば、お礼の表現「ありがとうございました」、確認の表現「かしこまりました」および「承りました」、終わりの挨拶の表現「失礼いたします」等が用いられる。
【0017】
必要情報データベース23には、話者間の対話時の音声信号(音声認識情報)から抽出する必要情報が記憶されている。話者間の対話時の音声信号から抽出する必要情報は、一方の話者から他方の話者に依頼する用件に応じて異なることが多い。このため、必要情報データベース23には、話者間の対話時の音声信号から抽出する必要情報を示している必要情報リストが用件に対応して記憶されている。勿論、複数の用件に対して共通の必要情報を抽出する場合には、共通の必要情報リストを、複数の用件に対応させて記憶させてもよい。
図3〜図5に、顧客から電力会社に用件(サービス)を依頼する際における顧客と電力会社の受付者(オペレータ)との間の対話時の音声信号から抽出する必要情報を示している必要情報リストの一例が示されている。図3〜図5には、スロット番号と、スロット番号に対応する必要情報(スロット番号のスロットに挿入される必要情報)が示されている。図3に示されている必要情報リストは、顧客から電力会社に[電気の使用]を依頼する(用件:[電気の使用開始])際に、音声信号から抽出する必要情報を示している。図4に示されている必要情報リストは、顧客から電力会社に[電気の停止]を依頼する(用件:[電気の使用停止])際に、音声信号から抽出する必要情報を示している。図5に示されている必要情報リストは、顧客から電力会社に[電気の契約容量の変更]を依頼する(用件:[電気の契約容量の変更])際に、音声信号から抽出する必要情報を示している。
【0018】
必要情報手掛かり情報データベース24には、話者間の対話時の音声信号(音声認識情報)から必要情報を抽出する際の手掛かりとなる必要情報手掛かり情報が記憶されている。本実施の形態では、必要情報手掛かり情報データベース24には、必要情報に対応する必要情報手掛かり情報を示す必要情報手掛かり情報リストが用件に対応して記憶されている。必要情報手掛かり情報は、必要情報に対応して(用件に対応する必要情報に対応して)適宜設定することができるが、少なくとも、必要情報として抽出される文字列に対応する必要情報手掛かり情報(典型的には、必要情報として抽出される文字列と同じ品詞を有する必要情報手掛かり情報)を設定する。例えば、必要情報が[契約者名]である場合には、少なくとも、人名を示す文字列に対応する必要情報手掛かり情報(品詞[人名]を有する必要情報手掛かり情報)を設定する。また、必要情報が[契約者住所]である場合には、少なくとも、住所を示す文字列に対する必要情報手掛かり情報(品詞[地名]を有する必要情報手掛かり情報)を設定する。また、必要情報が[契約者電話番号]である場合には、少なくとも、数字を組み合わせた文字列に対する必要情報手掛かり情報(品詞[数詞]を有する必要情報手掛かり情報)を設定する。
図6に、顧客から[電気の停止]を依頼する(用件:[電気の使用停止])際に、音声信号から必要情報を抽出する手掛かりとなる必要情報手掛かり情報を示す必要情報手掛かり情報リストの一例が示されている。なお、図6において、必要情報手掛かり情報[品詞:○○]は、文字列の品詞種別(品種情報)が○○である(例えば、人の名前を表す[人名]、住所を表す[地名]、数字の組み合わせを表す[数詞])ことを表し、それ以外の必要情報手掛かり情報は、文字列を表している。
図6に示されている必要情報手掛かり情報リストには、例えば、必要情報[契約者名]に対応して、必要情報[契約者名]を抽出する手掛かりとなる必要情報手掛かり情報[契約者]、[お客様]、[名前]、[品詞:人名]が記憶されている。また、必要情報[契約者住所]に対応させて、必要情報[契約者住所]を抽出する手掛かりとなる必要情報手掛かり情報[契約者]、[お客様]、[住所]、[品詞:地名]が記憶されている。また、必要情報[契約者電話番号]に対応させて、必要情報[契約者電話番号]を抽出する手掛かりとなる必要情報手掛かり情報[契約者]、[お客様]、[電話]、[携帯]、[番号]、[品詞:数詞]が記憶されている。
必要情報手掛かり情報は、音声信号(音声認識情報)から必要情報を抽出する際に、会話単位を選択する処理で用いられる(詳しくは後述する)。
【0019】
対話状態判別情報データベース25には、話者間の対話状態を判別するための対話状態判別情報が記憶されている。本実施の形態では、対話状態判別情報として、必要情報を要求した対話状態(「情報要求対話状態」という)であることを判別するための情報要求手掛かり情報25a、必要情報の要求を受理した対話状態(「要求受理対話状態」という)であることを判別するための要求受理手掛かり情報25b、必要情報を開示した対話状態(「情報開示対話状態」という)であることを判別するための情報開示手掛かり情報25c、必要情報を受理した対話状態(「情報受理対話状態」という)であることを判別するための情報受理手掛かり情報25dが記憶されている。
図7に、対話状態判別情報データベース25の一例が示されている。図7に示されている対話状態判別情報データベース25には、情報要求手掛かり情報として、必要情報の開示を要求する表現「[(必要情報)]をお願いします」等が記憶され、要求受理手掛かり情報として、必要情報の要求を受理したことを表す表現「わかりました」等が記憶され、情報開示手掛かり情報として、必要情報を表す表現「人名」、「地名」や「数詞」等が記憶され、情報受理手掛かり情報として、開示された必要情報を受理したことを表す表現「ありがとうございます」や「[(必要情報)]ですね」等が記憶されている。
なお、図7に記載されている[(必要情報)]は、必要情報を抽出する手掛かりとなる必要情報抽出情報(図6参照)のいずれか一つを含む文字列あるいは必要情報そのものを表す。例えば、必要情報を要求する対話([情報要求対話状態])では、「お客様番号」、「お引越し先のご住所」等の文字列が用いられ、必要情報を開示する対話([情報開示対話状態])では、お客様番号そのもの、引越し先の住所そのもの等が用いられる。
【0020】
処理手段10は、管理手段11と必要情報抽出手段12を有している。
管理手段11は、音声信号処理装置の全体の処理を管理する。例えば、入力手段30を介して音声信号を入力する処理、入力された音声信号を音声信号データベース21に記憶させる処理、音声信号から必要情報を抽出するために必要情報抽出手段12を作動させる処理、抽出した必要情報を出力手段40から出力する処理等を実行する。なお、管理手段11の処理を必要情報抽出手段12で実行させることもできる。この場合には、管理手段11を省略することができる。
【0021】
必要情報抽出手段12は、音声認識手段13、会話単位分割手段14、用件判別手段15、必要情報手掛かり情報付与手段16、対話状態遷移判別手段17により構成されている。本実施の形態では、各手段の処理を共通の処理装置によって実行するように構成しているが、各手段の処理を別々の処理装置で実行するように構成することもできる。また、各手段は、LAN、電話回線、インターネット回線等の通信回線を介して接続するように構成されていてもよい。
【0022】
音声認識手段13は、入力手段30を介して入力された、話者間の対話時の音声信号を、テキスト情報を含む音声認識情報に変換する。音声信号を音声認識情報に変換する方法としては、公知の種々の音声認識方法を用いることができる。例えば、HMM(隠れマルコフモデル)とNグラム(確率的言語モデル)を用いた大語彙連続音声認識方法を用いることができる。
なお、「入力手段30を介して入力された音声信号」には、入力手段30を介して入力された音声信号そのものだけでなく、入力手段30を介して入力された後音声信号データベース21に記憶されている音声信号も含まれる。
本実施の形態では、音声認識手段13は、品詞情報が付与されている音声認識情報を出力する。例えば、音声認識結果(音声認識情報)に、品詞情報を有する文字列が含まれている場合(音声認識手段13で用いる認識語彙辞書に品詞情報が含まれている場合)には、当該品詞情報を当該文字列に対して付与する。音声認識結果(音声認識情報)に、品詞情報を有していない文字列が含まれている場合には、音声認識結果に含まれているテキスト情報に対して形態素解析を行うことによって当該文字列に品詞情報を付与する。音声認識情報に付与された品詞情報は、後述する必要情報手掛かり情報付与手段16が会話単位に必要情報手掛かり情報を付与する際に用いられる。
また、音声信号を音声認識情報に変換する音声認識手段13は、処理手段10内に設けられていなくてもよい。例えば、処理手段10が設けられているコンピュータとは別のコンピュータに設けられている音声認識手段によって音声信号を音声認識情報に変換してもよい。この場合には、別のコンピュータに設けられている音声認識手段から出力される音声認識情報が入力手段30を介して入力され、音声認識情報データベース26に記憶される。本願発明の「音声認識手段は、入力手段から入力された話者間の対話時の音声信号を音声認識して音声認識情報を出力する」構成には、処理手段10が設けられているコンピュータとは別のコンピュータに設けられている音声認識手段を用いて音声信号を音声認識情報に変換し、変換した音声認識情報を入力手段30から入力する」構成も含まれる。
【0023】
会話単位分割手段14は、会話単位判別情報データベース22に記憶されている会話単位判別情報に基づいて、音声認識情報を会話単位に分割する。本実施の形態では、会話単位判別情報データベース22には、会話単位始点判別情報と会話単位終点判別情報を含む会話単位判別情報が記憶されている。そして、会話単位分割手段14は、会話単位判別情報データベースに記憶されている会話単位始点情報と会話単位終点情報に基づいて会話単位の始点と終点を判別することによって、音声認識情報を会話単位に分割している。例えば、会話単位始点判別情報が存在する箇所を会話単位の始点とし、会話単位終点判別情報が存在する箇所を会話単位の終点とする。なお、通常の会話においては、会話単位終点判別情報を発することなく会話単位始点判別情報を発し、あるいは、会話単位終点情報を発した後、会話単位始点判別情報を発することなく会話単位始点情報を発することがある。このため、2つの会話単位始点判別情報の間に会話単位終点判別情報が存在しない場合には、後続する会話単位始点判別情報が存在する箇所の直前の箇所を、先行する会話単位の終点とし、後続する会話単位始点判別情報が存在する箇所を、後続する会話単位の始点とする。また、2つの会話単位終点判別情報の間に会話単位始点判別情報が存在しない場合には、先行する会話単位終点判別情報が存在する箇所を、先行する会話単位の終点とし、先行する会話単位終点判別情報が存在する箇所の直後の箇所を、後続する会話単位の始点とする。なお、会話単位の始点や終点を判別する際には、会話単位判別情報そのものだけでなく、会話単位判別情報の変化態様も考慮する。
【0024】
用件判別手段15は、話者間の対話の用件を判別する。本実施の形態では、用件判別手段15は、音声認識情報に基づいて、話者間の対話の用件を判別している。音声認識情報に基づいて用件を判別する方法としては、用件認識情報にいずれの用件に対応する表現が含まれているかを判別する方法が用いられる。
【0025】
必要情報手掛かり情報付与手段16は、会話単位分割手段14によって分割された会話単位に必要情報手掛かり情報を付与する。すなわち、会話単位に必要情報手掛かり情報が含まれている場合には、当該必要情報手掛かり情報を当該会話単位に付与する。必要情報手掛かり情報としては、用件に対応して必要情報手掛かり情報データベース24に記憶されている必要情報手掛かり情報リストで示される必要情報手掛かり情報が用いられる。
【0026】
対話状態遷移判別手段17は、音声認識情報に基づいて対話状態の遷移を判別することによって、必要情報を抽出する。本実施の形態では、対話状態遷移判別手段17は、情報要求対話状態判別手段17a、要求受理対話状態判別手段17b、情報開示対話状態判別手段17c、情報受理対話状態判別手段17dを有している。情報要求対話状態判別手段17aは、音声認識情報と、対話状態判別情報データベース25に記憶されている情報要求手掛かり情報25aに基づいて、対話状態が情報要求対話状態であることを判別する。要求受理対話状態判別手段17bは、音声認識情報と、対話状態判別情報データベース25に記憶されている要求受理手掛かり情報25bに基づいて、対話状態が要求受理対話状態であることを判別する。情報開示対話状態判別手段17cは、音声認識情報と、対話状態判別情報データベース25に記憶されている情報開示手掛かり情報25cに基づいて、対話状態が情報開示対話状態であることを判別する。情報受理対話状態判別手段17dは、音声認識情報と、対話状態判別情報データベース25に記憶されている情報受理手掛かり情報25dに基づいて、対話状態が情報受理対話状態であることを判別する。そして、対話状態遷移判別手段17は、対話状態が、情報要求対話状態、要求受理対話状態、情報開示対話状態、情報受理対話状態の順に遷移したことを判別することによって、必要情報を抽出する。
【0027】
顧客と企業のサービスセンターの受付者(オペレータ)との間の対話時の音声信号(音声信号に対応する音声認識情報)から、本実施の形態の対話状態遷移判別手段17によって対話状態の遷移を判別する方法の概要が図11に示されている。なお、本実施の形態では、実線矢印で示されている順に対話状態が遷移したことを判別する。
先ず、受付者は、情報要求手掛かり情報を顧客に発する。例えば、情報要求手掛かり情報「[(必要情報)]をお願いします。」を発する。
顧客は、受付者から発せられた情報要求手掛かり情報を確認すると、要求受理手掛かり情報を受付者に発する。例えば、要求受理手掛かり情報「わかりました。」を発する。
次いで、顧客は、情報開示手掛かり情報を受付者に発する。例えば、「[(必要情報)]です。」を発する。
受付者は、顧客から発せられた情報開示手掛かり情報を確認すると、情報受理手掛かり情報を顧客に発する。例えば、「ありがとうございます。」を発する。
これにより、[(必要情報)]に対して、対話状態が、情報要求対話状態、要求受理対話状態、情報開示対話状態、情報受理対話状態の順に遷移したことを判別し、[(必要情報)]を抽出する。
【0028】
ここで、本実施の形態では、必要情報の抽出精度を高め、また、処理負担を軽減するために、会話単位分割手段14および必要情報手掛かり情報付与手段16が設けられている。
すなわち、会話単位分割手段14によって、音声認識情報を会話単位に分割する。また、必要情報手掛かり情報付与手段16によって、必要情報手掛かり情報が会話単位に含まれている場合には、当該必要情報手掛かり情報を当該会話単位に付与する。
対話状態遷移判別手段17は、用件判別手段15によって判別された用件に対応する必要情報リストで示されている必要情報を抽出する際には、必要情報を抽出する手掛かりとなる必要情報手掛かり情報を含む会話単位を選択する。必要情報を抽出する手掛かりとなる必要情報手掛かり情報を含む会話単位を選択する方法としては、必要情報に対応する必要情報手掛かり情報を一つ含む会話単位を選択する方法や、適宜選択した複数の必要情報手掛かり情報を含む会話単位を選択する方法を用いることができる。また、会話単位に含まれる必要情報手掛かり情報を適宜変更しながら会話単位を選択する方法を用いることもできる。なお、会話単位を選択する際には、少なくとも、必要情報として抽出される文字列に対応する必要情報手掛かり情報(典型的には、必要情報として抽出される文字列と同じ品詞を有する必要情報手掛かり情報)を含む会話単位を選択する。例えば、必要情報が[契約者名]である場合には、少なくとも、人名を示す文字列(品詞[人名]を有する文字列)を含んでいる会話単位を選択し、必要情報が[契約者住所]である場合には、少なくとも、住所を示す文字列(品詞[地名]を有する文字列)を含んでいる会話単位を選択し、必要情報が[契約者電話番号]である場合には、少なくとも、数字を組み合わせた文字列(品詞[数詞]を有する文字列)を含んでいる会話単位を選択する。そして、選択した会話単位(あるいは、選択した会話単位を含む、選択した会話単位に隣接する複数の会話単位)に対して対話状態の遷移を判別することによって、必要情報を抽出する。
例えば、必要情報手掛かり情報付与手段16は、用件に対応する必要情報リストによって必要情報[契約者名]が示されている場合、会話単位に、「契約者」、「お客様」、[名前]という文字列や、[品詞:人名]が含まれていれば、必要情報[契約者名]を抽出する際の手掛かりとなる必要情報手掛かり情報[契約者]、[お客様]、[名前]、[品詞:人名]を当該会話単位に付与する。対話状態遷移判別手段17は、必要情報[契約者名]を抽出する際には、必要情報手掛かり情報[契約者]、[お客様]、[名前]、[品詞:人名]が付与されている(必要情報手掛かり情報「契約者」、「お客様」、「名前」、[品詞:人名]が含まれている)会話単位を選択する。そして、選択した会話単位に含まれている音声認識情報に基づいて、対話状態の遷移を判別することにより、必要情報[契約者名]を抽出する。この場合、[品詞:人名]を抽出する。これにより、必要情報を精度よく、また、効率よく抽出することができる。なお、必要情報手掛かり情報付与手段16は、品詞情報に基づいて会話単位に必要情報手掛かり情報を付与する際には、音声認識手段13によって、音声認識情報に付与された品詞情報と、必要情報データベース23に記憶されている必要情報手掛かり情報リストで示されている必要情報手掛かり情報の品詞情報を比較して必要情報手掛かり情報を付与する。
【0029】
次に、本実施の形態の音声信号処理装置の動作を、図8に示されているフローチャートを参照して説明する。
ステップA1では、入力手段30を介して、話者間の対話時の音声信号を入力する。ステップA1の処理は、管理手段11によって実行される。
ステップA2では、ステップA1で入力された音声信号を、テキスト情報を含む音声認識情報に変換する。なお、入力手段30を介して入力された音声信号には、入力手段30を介して入力された後、音声信号データベース21に記憶されている音声信号も含まれる。ステップA2の処理は、音声認識手段13によって実行される。
ステップA3では、ステップA2で作成された音声認識情報を会話単位に分割する。なお、音声認識情報には、音声信号から変換された後、音声認識情報データベース26に記憶されている音声認識情報も含まれる。ステップA3の処理は、会話単位分割手段14によって実行される。
ステップA4では、話者間の対話の用件を判別する。本実施の形態では、ステップA2で作成された音声認識情報に基づいて、話者間の対話の用件を判別している。ステップA4の処理は、用件判別手段15によって実行される。
ステップA5では、ステップA3で分割された会話単位に必要情報手掛かり情報を付与する。本実施の形態では、会話単位に、必要情報を抽出する手掛かりとなる必要情報手掛かり情報が含まれているか否かを判別し、必要情報手掛かり情報が含まれていれば、当該必要情報手掛かり情報を当該会話単位に付与する。必要情報は、必要情報データベース24に、ステップA4で判別された用件に対応して記憶されている必要情報リストで示されている。また、必要情報手掛かり情報は、必要情報手掛かり情報データベース24に、ステップA4で判別された用件に対応して記憶されている必要情報手掛かり情報リストで、必要情報に対応して示されている。ステップA5の処理は、必要情報手掛かり情報付与手段16によって実行される。
【0030】
ステップA6では、必要情報データベース23に記憶されている、ステップA4で判別された用件に対応する必要情報リストを選択する。
ステップA7では、スロット番号Nを「1」に設定する。
ステップA8では、スロット番号Nのスロットに挿入される必要情報を抽出する手掛かりとなる必要情報手掛かり情報を含む会話単位の一つを選択する。ステップA8では、少なくとも、必要情報として抽出される文字列に対応する必要情報手掛かり情報を含む会話単位を選択する。例えば、必要情報が、顧客の名前である[契約者名]の場合には、少なくとも、人の名前を示す必要情報手掛かり情報[品詞:人名]を含む会話単位を選択する。好ましくは、必要情報手掛かり情報[品詞:人名]、[契約者](あるいは、[お客様])、[名前]を含む会話単位を選択する。また、必要情報が、顧客の住所である[契約者住所]の場合には、少なくとも、住所を示す必要情報手掛かり情報[品詞:地名]を含む会話単位を選択する。好ましくは、必要情報手掛かり情報[品詞:地名]、[契約者](あるいは、[お客様])、[住所]を含む会話単位を選択する。また、必要情報が、顧客の電話番号である[契約者電話番号]の場合には、少なくとも、数字の組み合わせを示す必要情報手掛かり情報[品詞:数詞]を含む会話単位を選択する。好ましくは、必要情報手掛かり情報[品詞:数詞]、[契約者](あるいは、[お客様])、[電話](あるいは、[携帯])、[番号]を含む会話単位を選択する。
ステップA8で、少なくとも、必要情報として抽出される文字列に対応する必要情報手掛かり情報を含む会話単位を選択する方法としては、必要情報として抽出される文字列に対応する必要情報手掛かり情報のみを含む会話単位を選択する方法や、必要情報として抽出される文字列に対応する必要情報手掛かり情報と、必要情報手掛かり情報リストに示されている他の必要情報手掛かり情報のうちの1つあるいは複数を含む会話単位を選択する方法等を適宜組み合わせて用いることができる。
【0031】
ステップA9では、ステップA8で選択した会話単位に含まれている音声認識情報に、ステップA6で選択した必要情報リストのスロット番号Nに挿入される必要情報に対応する情報要求手掛かり情報25aが存在するか否か、すなわち、必要情報に関する情報要求対話状態であるか否かを判別する。情報要求手掛かり情報25aが存在することを判別した場合、すなわち、情報要求対話状態であることを判別した場合には、ステップA10に進む。情報要求手掛かり情報25aが存在しない場合、すなわち、情報要求対話状態であることが判別されなかった場合には、ステップA8で選択した会話単位に含まれている音声認識情報から必要情報を抽出することができないと判断し、ステップA16に進む。
ステップA10では、ステップA8で選択した会話単位に含まれている音声認識情報に、必要情報に対応する情報要求手掛かり情報25aに後続して、必要情報に対応する要求受理手掛かり情報25bが存在するか否か、すなわち、必要情報に関する情報要求対話状態から必要情報に関する要求受理対話状態に遷移したか否かを判別する。情報要求対話状態から要求受理対話状態に遷移した場合にはステップA11に進み、遷移してない場合にはステップA15に進む。
ステップA11では、ステップA8で選択した会話単位に含まれている音声認識情報に、必要情報に対応する情報要求手掛かり情報25aに後続して、必要情報に対応する要求受理手掛かり情報25b、さらに、必要情報に対応する情報開示手掛かり情報25cが存在するか否か、すなわち、必要情報に関する情報要求対話状態から、必要情報に関する要求受理対話状態、さらに、必要情報に関する情報開示対話状態に遷移したか否かを判別する。情報要求対話状態から要求受理対話状態、さらに、情報開示対話状態に遷移した場合にはステップA12に進み、遷移してない場合にはステップA15に進む。
ステップA12では、ステップA8で選択した会話単位に含まれている音声認識情報に、必要情報に対応する情報要求手掛かり情報25aに後続して、必要情報に対応する要求受理手掛かり情報25b、必要情報に対応する情報開示手掛かり情報25c、さらに、必要情報に対応する情報受理手掛かり情報が存在するか否か、すなわち、必要情報に関する情報要求対話状態から、必要情報に関する要求受理対話状態、必要情報に関する情報開示対話状態、さらに、必要情報に関する情報受理対話状態に遷移したか否かを判別する。情報要求対話状態から要求受理対話状態、情報開示対話状態、さらに、情報受理対話状態に遷移した場合にはステップA13に進み、遷移してない場合にはステップA15に進む。
【0032】
ステップA13では、必要情報を抽出し、抽出した必要情報を、ステップA6で選択した必要情報リストの、スロット番号Nに対応するスロットに挿入する。例えば、必要情報が[契約者名]の場合には、人の名前を示す必要情報手掛かり情報[品詞:人名]に該当する文字列を抽出する。また、必要情報が[契約者住所]の場合には、住所を示す必要情報手掛かり情報[品詞:地名]に該当する文字列を抽出する。また、必要情報が[契約者電話番号]の場合には、数字の組み合わせを示す必要情報手掛かり情報[品詞:数詞]に該当する文字列を抽出する。
ステップA14では、Nが、ステップA6で選択した必要情報リストの総スロット数に等しいか否かを判別する。Nが必要情報リストの総スロット数に等しい場合には、処理を終了し、等しくない場合には、ステップA17に進む。
【0033】
ステップA15では、ステップA8で選択した会話単位に含まれている音声認識情報から、ステップA6で選択した必要情報リストの、スロット番号Nに挿入する必要情報に対応する情報要求手掛かり情報25aを全て判別したか否かを判別する。情報要求手掛かり情報25aを全て判別した場合には、ステップA16に進み。情報要求手掛かり情報25aを全て判別していない場合には、ステップA9に戻り、残りの音声認識情報に存在する情報要求手掛かり情報25aを判別する。
ステップA16では、ステップA6で選択した必要情報リストの、スロット番号Nのスロットに挿入される必要情報を抽出する手掛かりとなる必要情報手掛かり情報を含む会話単位を全て選択したか否かを判別する。スロット番号Nのスロットに挿入される必要情報を抽出する手掛かりとなる必要情報手掛かり情報を含む会話単位を全て選択していない場合には、ステップA8に戻り、スロット番号Nのスロットに挿入される必要情報を抽出する手掛かりとなる必要情報手掛かり情報を含む他の会話単位を選択する。スロット番号Nのスロットに挿入される必要情報を抽出する手掛かりとなる必要情報手掛かり情報を含む会話単位を全て選択した場合には、ステップA14に進む。
ステップA17では、スロット番号Nに「1」を加算した後、ステップA8に戻り、ステップA6で選択した必要情報リストの、次のスロット番号N(=N+1)のスロットに挿入される必要情報の抽出処理を繰り返す。
ステップA6〜A17の処理は、対話状態遷移判別手段17によって実行される。
【0034】
第1の実施の形態では、対話状態が、情報要求対話状態、要求受理対話状態、情報開示対話状態、情報受理対話状態の順に遷移したことを判別することによって必要情報を抽出した。ここで、通常の対話では、情報要求対話状態から情報開示対話状態に遷移することがある。すなわち、要求受理対話状態が存在しない場合がある。
以下に、対話状態が、情報要求対話状態、情報開示対話状態、情報受理対話状態の順に遷移したことを判別することによって必要情報を抽出する、本発明の音声信号処理装置の第2の実施の形態を説明する。第2の実施の形態の音声信号処理装置も、第1の実施の形態の音声信号処理装置と同様に、一方の話者から他方の話者に用件を依頼する際における話者間の対話時の音声信号から、依頼された用件を遂行するために必要な必要情報を抽出する音声信号処理装置として好適に用いることができる。
第2の実施の形態の音声信号処理装置は、第1の実施の形態の音声信号処理装置と同様に、処理手段10、記憶手段20、入力手段30、出力手段40を有している。ただ、第2の実施の形態では、対話状態が、情報要求対話状態、情報開示対話状態、情報受理対話状態の順に遷移したことを判別することによって必要情報を抽出するため、図1に示されている対話状態判別情報データベース25の要求受理手掛かり情報25b、対話状態遷移判別手段17の要求受理対話状態判別手段17bが省略されている。他の構成は、第1の実施の形態の音声信号処理装置と同様である。
【0035】
顧客と企業のサービスセンターの受付者(オペレータ)との間の対話時の音声信号(音声信号に対応する音声認識情報)から、第2の実施の形態の対話状態遷移判別手段17によって対話状態の繊維を判別する方法の概要が図11に示されている。なお、第2の実施の形態では、破線矢印で示されている順に対話状態が遷移したことを判別する。
先ず、受付者は、情報要求手掛かり情報を顧客に発する。例えば、情報要求手掛かり情報「[(必要情報)]をお願いします。」を発する。
顧客は、受付者から発せられた情報要求手掛かり情報を確認すると、情報開示手掛かり情報を受付者に発する。例えば、「[(必要情報)]です。」を発する。
受付者は、顧客から発せられた情報開示手掛かり情報を確認すると、情報受理手掛かり情報を顧客に発する。例えば、「ありがとうございます。」を発する。
これにより、[(必要情報)]に対して、対話状態が、情報要求対話状態、情報開示対話状態、情報受理対話状態の順に遷移したことを判別し、[(必要情報)]を抽出する。
【0036】
次に、第2の実施の形態の音声信号処理装置の動作を、図8に示されているフローチャートを参照して説明する。第2の実施の形態の音声信号処理装置では、対話状態が要求受理対話状態にあることを判別しないため、ステップA10が省略されている。
すなわち、ステップA9において、選択した会話単位に含まれている音声認識情報から情報要求手掛かり情報25aを判別した場合には、破線矢印で示されているように、ステップA11に進む。
他の処理は、第1の実施の形態の音声信号処理装置と同様である。
【0037】
次に、本実施の形態の動作を、顧客から電力会社に[電気の使用停止]を依頼する場合について具体的に説明する。
図9および図10には、[電気の使用停止]を依頼する際の、顧客と電力会社のサービスセンターの受付者(オペレータ)との間での対話時の音声信号を、テキスト情報を含む音声認識情報に変換した後、文書C1〜C49を作成した例が示されている。
【0038】
先ず、音声認識情報に基づいて対話の用件が判別される。この場合、例えば、文書C3「電気の停止をお願いしたいのですが。」に含まれている文字列「停止」が、用件[電気の使用停止]に対応する必要情報手掛かり情報リスト(図6参照)中の必要情報手掛かり情報[停止]と一致するため、この対話の用件(顧客から電力会社に依頼するサービスの内容)が[電気の使用停止]であることが判別される。音声認識情報から対話の用件を判別する方法としては、これ以外の種々の方法を用いることができる。
次に、音声認識情報(文書C1〜C49に含まれている音声認識情報)は、会話単位判別情報データベース22に会話単位判別情報として記憶されている会話単位終点判別情報と会話単位終点判別所に基づいて会話単位S1〜S15に分割される。図9および図10では、実線で囲まれている音声認識情報が会話単位始点判別情報であり、破線で囲まれている音声認識情報が会話単位終点判別情報である。例えば、文書C1の「おはようございます」(始めの挨拶の表現)、文書C6の「それでは」および文書C8の「では」および文書C11の「次に」(話題を変える表現)等が会話単位始点判別情報として判別され、文書C5の「かしこまりました」(確認の表現)、文書C10の「ありがとうございました」(お礼の表現)、文書C48の「失礼いたします」(終わりの挨拶の表現)等が会話終点判別情報として判別される。
【0039】
また、分割した会話単位に、判別した用件に対応する必要情報リストに示されている必要情報を抽出する手掛かりとなる必要情報手掛かり情報が含まれていれば、当該必要情報手掛かり情報が当該会話単位に付与される。例えば、用件が[電気の使用停止]である場合には、図4に示されている、用件[電気の使用停止]に対応する必要情報リストで示されている必要情報を抽出する手掛かりとなる必要情報手掛かり情報が付与される。用件[電気の使用停止]における、必要情報に対応する必要情報手掛かり情報の一例が図5に示されている。
図9では、例えば、会話単位S1に含まれている文字列「○○受付センター」、「△△」に基づいて、必要情報[受付者名]に対応する必要情報手掛かり情報[受付センター]、[品詞:人名]が会話単位S1に付与されている。また、文字列「電気の停止」、「電気を止める」に基づいて、必要情報[使用停止日]、[使用停止時刻]に対応する必要情報手掛かり情報[停止]、[停め]が会話単位S1付与されている。また、会話単位S3に含まれている文字列「お客様番号」、「00 11 22 33」に基づいて、必要情報[お客様番号]を抽出する手掛かりとなる必要情報手掛かり情報[お客様番号]、[品詞:数詞]が会話単位S3に付与されている。また、会話単位S4に含まれている文字列「契約者」、「名前」、「□□□□」に基づいて、必要情報[契約者名]を抽出する手掛かりとなる必要情報手掛かり情報[契約者]、[名前]、[品詞:人名]が会話単位S4に付与されている。
また、図10では、例えば、会話単位S8に含まれている文字列「X月」、「Y日」、「火曜日」、「12時」に基づいて、必要情報[使用停止日]、[使用停止時刻]を抽出する手掛かりとなる必要情報手掛かり情報「月」、「日」、「時」、「曜」、[品詞:数詞]が会話単位S8に付与されている。また、会話単位S9に含まれている文字列「X月」、「Y日」、「火曜日」、「12時」、「停め」に基づいて、必要情報[使用停止日]、[使用停止時刻]を抽出する手掛かりとなる必要情報手掛かり情報「月」、「日」、「時」、「曜」、[停め]、[品詞:数詞]が会話単位S9に付与されている。また、会話単位S12に含まれている文字列「引越し」、「住所」、「DD市EE4−5−6 FFマンション 202」に基づいて、必要情報[契約者移転先住所]を抽出する手掛かりとなる必要情報手掛かり情報[引越]、[住所]、[品詞:地名]が付与されている。
【0040】
そして、音声認識情報に基づいて対話状態の遷移を判別することによって、判別した用件に対応する必要情報リストで示されている必要情報を抽出する。例えば、情報要求対話状態、要求受理対話状態、情報開示対話状態、情報受理対話状態の順に遷移したこと、あるいは、情報要求対話状態、情報開示対話状態、情報受理対話状態の順に遷移したことを判別することによって必要情報を抽出する。この時、必要情報を抽出する手掛かりとなる必要情報手掛かり情報を含む会話単位を選択する。
対話状態の遷移を判別することによって必要情報を抽出する処理の具体例を図12〜図14により説明する。なお、図12、図13は、対話状態が情報要求対話状態、情報開示対話状態、情報受理対話状態の順に遷移したことを判別する例であり、図14は、対話状態が情報要求対話状態、要求受理対話状態、情報開示対話状態、情報受理対話状態の順に遷移したことを判別する例である。
【0041】
対話の用件[電気の使用停止]に対する必要情報[お客様番号]を抽出する処理が図12に示されている。図12では、図4に示されているスロット番号B002の必要情報[お客様番号]を抽出する手掛かりとなる必要情報手掛かり情報を含む会話単位として、必要情報手掛かり情報[お客様番号]、[品詞:数詞]が付与されている会話単位S3が選択されている。
受付者から顧客への対話内容を示す文書C8には、必要情報[お客様番号]の要求を表す表現「お客様番号を左からお願いします」が含まれている。これにより、文書C8から、必要情報[お客様番号]を要求した情報要求対話状態であることが判別される。
文書C8に後続する、顧客から受付者への対話内容を示す文書C9には、必要情報[お客様番号]を示す文字列に対応する文字列「00 11 22 33」が含まれている。これにより、文書C9から、必要情報[お客様番号]を開示した情報開示対話状態であることが判別される。
文書C9に後続する、受付者から顧客への対話内容を示す文書C10には、必要情報[お客様番号]の確認を表す表現「00 11 22 33ですね、ありがとうございます」が含まれている。これにより、文書C10から、必要情報[お客様番号]を受理した情報受理対話状態であることが判別される。
以上により、必要情報[お客様番号]に関して、会話単位S3において、対話状態が情報要求対話状態、情報開示対話状態、情報受理対話状態の順に遷移したことが判別され、必要情報である[お客様番号]として、必要情報[お客様番号]を示す必要情報手掛かり情報[品詞:数詞]に該当する文字列「00112233」が抽出される。
【0042】
対話の用件[電気の使用停止]に対する必要情報[契約者名]を抽出する処理が図13に示されている。図13では、図4に示されているスロット番号B003の必要情報[契約者名]を抽出する手掛かりとなる必要情報手掛かり情報を含む会話単位として、必要情報手掛かり情報[契約者]、[名前]、[品詞:人名]が付与されている会話単位S4が選択されている。
受付者から顧客への対話内容を示す文書C11には、必要情報[契約者名]の要求を表す表現「ご契約者様のお名前をお願いします」が含まれている。これにより、文書C11から、必要情報[契約者名]を要求した情報要求対話状態であることが判別される。
文書C11に後続する、顧客から受付者への対話内容を示す文書C12には、必要情報[契約者名]を示す文字列に対応する文字列「□□□□」が含まれている。これにより、文書C12から、必要情報[契約者名]を開示した情報開示対話状態であることが判別される。
文書C12に後続する、受付者から顧客への対話内容を示す文書C13には、必要情報[契約者名]の確認を表す表現「□□□□ですね、ありがとうございます」が含まれている。これにより、文書C13から、必要情報[契約者名]を受理した情報受理対話状態であることが判別される。
以上により、必要情報[契約者名]に関して、会話単位S4において、対話状態が情報要求対話状態、情報開示対話状態、情報受理対話状態の順に遷移したことが判別され、必要情報である[契約者名]として、必要情報[契約者名]を示す必要情報手掛かり情報[品詞:人名]に該当する文字列「□□□□」が抽出される。
【0043】
対話の用件[電気の使用停止]に対する必要情報[契約者移転先電話番号]を抽出する処理が図14に示されている。図14では、図4に示されているスロット番号B011の必要情報[契約者移転先電話番号]を抽出する手掛かりとなる必要情報手掛かり情報を含む会話単位として、必要情報手掛かり情報[引越]、[電話](あるいは[携帯])、[番号]、[品詞:数詞]が付与されている会話単位S13が選択されている。
受付者から顧客への対話内容を示す文書C37には、必要情報[契約者移転先電話番号]の要求を表す表現「お引越し先の電話番号をお願いします」が含まれている。これにより、文書C37から、必要情報[契約者移転先電話番号]を要求した情報要求対話状態であることが判別される。
文書C37に後続する、顧客から受付者への対話内容を示す文書C38には、必要情報[契約者移転先電話番号]の要求を受理したことを表す表現「わかりました」が含まれている。これにより、文書C38から、必要情報[契約者移転先電話番号]の要求を受理した要求受理対話状態であることが判別される。
文書C39に後続する、顧客から受付者への対話内容を示す文書C41には、必要情報[契約者移転先電話番号]を示す文字列に対応する文字列「090 0000 1111」が含まれている。これにより、文書C41から、必要情報[契約者移転先電話番号]を開示した情報開示対話状態であることが判別される。
文書C41に後続する、受付者から顧客への対話内容を示す文書C42には、必要情報[契約者移転先電話番号]の確認を表す表現「090 0000 1111ですね、ありがとうございます」が含まれている。これにより、文書C42から、必要情報[契約者移転先電話番号]を受理した情報受理対話状態であることが判別される。
以上により、必要情報[契約者移転先電話番号]に関して、会話単位S13において、対話状態が情報要求対話状態、要求受理対話状態、情報開示対話状態、情報受理対話状態の順に遷移したことが判別され、必要情報である[契約者移転先電話番号]として、必要情報[契約者移転先電話番号]を示す必要情報手掛かり情報[品詞:数詞]に該当する文字列「09000001111」が抽出される。
【0044】
なお、例えば、会話単位S14には、必要情報[使用停止日]、[使用停止時刻]、[契約者名]、[契約者住所]に対応する必要情報手掛かり情報[月]、[日]、[時]、[曜]、[停め]、[品詞:数詞]、[品詞:地名]が付与されているが、会話単位S14内では前述した対話状態の遷移が生じていない。このため、対話状態遷移判別手段17は、会話単位S14に含まれている音声認識情報からは、前述した対話状態の遷移を判別することができない。すなわち、会話単位S14からは必要情報が抽出されない。
【0045】
以上のように、前述した実施の形態では、話者間の対話時の音声信号(音声信号から作成された音声認識情報)から、対話状態が、用件に対する必要情報に関して、情報要求対話状態、要求受理対話状態、情報開示対話状態、情報受理対話状態の順に遷移したことを判別することによって、あるいは、情報要求対話状態、情報開示対話状態、情報受理対話状態の順に遷移したことを判別することによって必要情報を抽出している。これにより、話者間の対話時の音声信号から、話者間の対話の用件に対する必要情報(例えば、一方の話者から他方の話者に依頼した用件を遂行するのに必要な必要情報)を精度よく抽出することができる。特に、前述した本実施の形態では、音声認識情報を会話単位に分割し、会話単位の中で対話状態の遷移を判別(対話進行をトレース)することによって必要情報を抽出しているため、必要情報をより精度よく検出することができる。また、会話単位に、必要情報を抽出する手掛かりとなる必要情報手掛かり情報が含まれていれば、当該必要情報手掛かり情報を当該会話単位に付与し、必要情報を抽出する際には、必要情報を抽出する手掛かりとなる必要情報手掛かり情報が含まれている会話単位を選択しているため、必要情報をより精度よく抽出することができ、また、必要情報を抽出するための処理負担を軽減することができる。
【0046】
なお、本発明は、コンピュータに、前述した処理手段(処理手段を構成する管理手段、音声認識手段、会話単位分割手段、用件判別手段、必要情報手掛かり情報付与手段、対話状態遷移判別手段等)の処理を実行させるためのプログラムあるいはプログラムが記憶された記憶媒体として構成することもできる。
【0047】
本願発明は、前述した実施の形態の構成に限定されず、種々の変更、追加、削除が可能である。
用件判別手段15は、音声認識情報に基づいて対話の用件を判別したが、対話の用件を判別する方法としては、これ以外の種々の方法を用いることができる。例えば、入力手段30に設けられている入力キーを操作することによって、あるいは、入力手段30に設けられている表示画面の入力部を選択することによって、入力手段30から、用件を示す用件識別情報を入力する方法を用いることができる。この場合、図8に示されているステップA4において、用件判別手段15は、入力手段30を介して入力された用件識別情報に基づいて、対話の用件を判別する。このような用件判別手段15を用いることにより、用件を判別する処理が容易となる。
会話単位を判別するために用いられる会話単位判別情報は、対話の用件等に応じて適宜設定することができる。
音声信号から抽出する必要情報は、対話の用件等に応じて適宜設定することができる。
必要情報を抽出する手掛かりとなる必要情報手掛かり情報は、必要情報に応じて適宜設定することができる。
音声認識情報を会話単位に分割するとともに、必要情報を抽出する手掛かりとなる必要情報手掛かり情報を会話単位に付与したが、会話単位に分割する処理や、会話単位に必要情報手掛かり情報を付与する処理は省略することもできる。この場合でも、対話状態の遷移を判別することによって必要情報を抽出するため、必要情報を精度よく抽出することができる。
対話状態を判別するために用いられる対話状態判別情報は、対話の用件等に応じて適宜設定することができる。
対話の用件としては、一方の話者から他方の話者に依頼する用件の内容に応じて適宜設定可能である。
入力手段30や出力手段40は、処理手段10と通信回線を介して接続可能な遠方の端末装置に設けられている入力手段や出力手段を用いることができる。
【符号の説明】
【0048】
10 処理手段
11 管理手段
12 必要情報抽出手段
13 音声認識手段
14 会話単位分割手段
15 用件判別手段
16 必要情報手掛かり情報付与手段
17 対話状態遷移判別手段
17a 情報要求対話状態判別手段
17b 要求受理対話状態判別手段
17c 情報開示対話状態判別手段
17d 情報受理対話状態判別手段
20 記憶手段
21 音声信号データベース
22 会話単位判別情報データベース
23 必要情報データベース
24 必要情報手掛かり情報データベース
25 対話状態判別情報データベース
25a 情報要求手掛かり情報
25b 要求受理手掛かり情報
25c 情報開示手掛かり情報
25d 情報受理手掛かり情報
26 音声認識情報データベース
30 入力手段
40 出力手段

【特許請求の範囲】
【請求項1】
用件に対する話者間の対話時の音声信号から、前記用件に係る必要情報を抽出する音声信号処理装置であって、
記憶手段と、処理手段と、入力手段と、出力手段を備えており、
前記記憶手段は、必要情報データベースと、対話状態判別情報データベースを有し、
前記必要情報データベースには、用件に係る必要情報を示す必要情報リストが用件に対応して記憶されており、
前記対話状態判別情報データベースには、必要情報を要求した対話状態であることを判別するための情報要求手掛かり情報、必要情報を開示した対話状態であることを判別するための情報開示手掛かり情報および必要情報を受理した対話状態であることを判別するための情報受理手掛かり情報が記憶されており、
前記処理手段は、音声認識手段と、用件判別手段と、対話状態遷移判別手段と、管理手段を有し、
前記音声認識手段は、前記入力手段から入力された話者間の対話時の音声信号を音声認識して音声認識情報を出力し、
前記用件判別手段は、前記音声認識手段から出力された音声認識情報に基づいて、話者間の対話の用件を判別し、
前記対話状態遷移判別手段は、前記音声認識手段から出力された音声認識情報と、前記対話状態判別情報データベースに記憶されている情報要求手掛かり情報、情報開示手掛かり情報および情報受理手掛かり情報に基づいて、話者間の対話状態が、必要情報を要求した対話状態、必要情報を開示した対話状態、必要情報を受理した対話状態の順に遷移したことを判別することにより、前記用件判別手段によって判別された用件に対応して前記必要情報データベースに記憶されている必要情報リストで示されている必要情報を抽出し、
前記管理手段は、前記対話状態遷移判別手段によって抽出された必要情報を前記出力手段から出力することを特徴とする音声信号処理装置。
【請求項2】
用件に対する話者間の対話時の音声信号から、前記用件に係る必要情報を抽出する音声信号処理装置であって、
記憶手段と、処理手段と、入力手段と、出力手段を備えており、
前記記憶手段は、必要情報データベースと、対話状態判別情報データベースを有し、
前記必要情報データベースには、用件に係る必要情報を示す必要情報リストが用件に対応して記憶されており、
前記対話状態判別情報データベースには、必要情報を要求した対話状態であることを判別するための情報要求手掛かり情報、必要情報を開示した対話状態であることを判別するための情報開示手掛かり情報および必要情報を受理した対話状態であることを判別するための情報受理手掛かり情報が記憶されており、
前記処理手段は、音声認識手段と、用件判別手段と、対話状態遷移判別手段と、管理手段を有し、
前記音声認識手段は、前記入力手段から入力された話者間の対話時の音声信号を音声認識して音声認識情報を出力し、
前記用件判別手段は、前記入力手段から入力された用件識別情報に基づいて、当該話者間の対話の用件を判別し、
前記対話状態遷移判別手段は、前記音声認識手段から出力された音声認識情報と、前記対話状態判別情報データベースに記憶されている情報要求手掛かり情報、情報開示手掛かり情報および情報受理手掛かり情報に基づいて、話者間の対話状態が、必要情報を要求した対話状態、必要情報を開示した対話状態、必要情報を受理した対話状態の順に遷移したことを判別することにより、前記用件判別手段によって判別された用件に対応して前記必要情報データベースに記憶されている必要情報リストで示されている必要情報を抽出し、
前記管理手段は、前記対話状態遷移判別手段によって抽出された必要情報を前記出力手段から出力することを特徴とする音声信号処理装置。
【請求項3】
請求項1または2に記載の音声信号処理装置であって、
前記対話状態判別情報データベースには、さらに、必要情報の要求を受理した対話状態であることを判別するための要求受理手掛かり情報が記憶されており、
前記対話状態遷移判別手段は、前記音声認識手段から出力された音声認識情報と、前記対話状態判別情報データベースに記憶されている情報要求手掛かり情報、要求受理手掛かり情報、情報開示手掛かり情報および情報受理手掛かり情報に基づいて、話者間の対話状態が、必要情報を要求した対話状態、必要情報の要求を受理した対話状態、必要情報を開示した対話状態、必要情報を受理した対話状態の順に遷移したことを判別し、判別結果に基づいて、前記用件判別手段によって判別された用件に対応して前記必要情報データベースに記憶されている必要情報リストで示される必要情報を抽出することを特徴とする音声信号処理装置。
【請求項4】
請求項1〜3のいずれかに記載の音声信号処理装置であって、
前記記憶手段は、さらに、会話単位判別情報データベースと必要情報手掛かり情報データベースを有し、
前記会話単位判別情報データベースには、音声認識情報を会話単位に分割するための会話単位判別情報が記憶されており、
前記必要情報手掛かり情報データベースには、必要情報を抽出するための手掛かりとなる必要情報手掛かり情報を示す必要情報手掛かり情報リストが用件に対応して記憶されており、
前記処理手段は、さらに、会話単位分割手段と、必要情報手掛かり情報付与手段を有し、
前記会話単位分割手段は、前記会話単位判別情報データベースに記憶されている会話単位判別情報に基づいて、前記音声認識手段から出力された音声認識情報を会話単位に分割し、
前記必要情報手掛かり情報付与手段は、前記会話単位分割手段で分割された会話単位に、前記用件判別手段によって判別された用件に対応して前記必要情報手掛かり情報データベースに記憶されている必要情報手掛かり情報リストで示されている必要情報手掛かり情報が含まれている場合に、当該必要情報手掛かり情報を当該会話単位に付与し、
前記対話状態遷移判別手段は、必要情報を抽出する手掛かりとなる必要情報手掛かり情報を含む会話単位を選択し、選択した会話単位に含まれている音声認識情報に基づいて当該必要情報を抽出することを特徴とする音声信号処理装置。
【請求項5】
コンピュータに請求項1〜4のいずれかに記載の前記処理手段の処理を実行させるためのプログラム。
【請求項6】
コンピュータに請求項1〜4のいずれかに記載の前記処理手段の処理を実行させるためのプログラムが記録された記憶媒体。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate


【公開番号】特開2012−247912(P2012−247912A)
【公開日】平成24年12月13日(2012.12.13)
【国際特許分類】
【出願番号】特願2011−117999(P2011−117999)
【出願日】平成23年5月26日(2011.5.26)
【出願人】(000213297)中部電力株式会社 (811)
【Fターム(参考)】