説明

音声データ主題推定装置およびこれを用いたコールセンタ

【課題】音声データからその音声データの主題を推定する装置において、データベースに格納されている関連度およびキーワードを更新することができる音声データ主題推定装置およびそれを用いたコールセンタを提供することを目的とする。
【解決手段】 音声データ主題推定装置1は、主題とキーワードと関連度とが格納された主題データベース2と、音声データを音声認識した音声認識データから抽出したキーワード(抽出キーワード)と音声認識データから推定した推定主題(主題A)とを取得し、さらに、主題データベース2を参照して、主題Aに係るキーワード(キーワードB)を取得し、抽出キーワードとキーワードBとが一致するか否かを判定する判定部10と、判定結果に基づき、主題データベース2に格納された主題Aに係るキーワードを登録する主題DB登録部11と、主題Aに係るキーワードの関連度を更新する主題DB更新部12と、を備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声データとして記憶された会話内容の主題を推定する音声データ主題推定装置およびこれを用いたコールセンタに関するものである。
【背景技術】
【0002】
電話中の会話の内容を録音する通話録音や、相手が不在時に電話にメッセージを残す内線電話交換機のボイスメールや留守番電話の録音メッセージを管理する際に、録音データが何の用件についてのものであるか否かを的確に判断できる主題やキーワード等の情報が必要である。
【0003】
ユーザが録音データの主題(用件)を容易に知ることができる録音データ主題検出装置が特許文献1に開示されている。
従来、録音データが何の用件についてのものであるか否かを判断できる情報を取得するには、録音データを音声認識して、文書データに変換し、文章データと、予め登録されたキーワードとを照合して該キーワードの出現回数を検出し、検出した出現回数と、予め登録されたそのキーワードの重要度とに基づいて、そのキーワードが主題に適しているか否かを判定し、適していると判定されたすべてのキーワードを、録音データの主題として出力していた。
【0004】
【特許文献1】特開2004−96502号公報(段落0010〜0014、図1)
【発明の開示】
【発明が解決しようとする課題】
【0005】
従来の主題検出装置は、音声データを変換した文書データから抽出する「キーワード」が、予めデータベースに登録されたものであり、キーワードをデータベースに追加する手段や、キーワードの重要度(関連度)を更新する手段がない。
そのため、主題に適したキーワードが抽出されているかを示す抽出精度を上げることが困難であった。したがって、主題検出装置の使用期間が長くなるにつれて、抽出精度が下がり、重要度の価値の変化に対応できなくなったキーワードや、データベースに登録されていない重要なキーワードが増える傾向にあった。そのため、抽出されたキーワードから推定される主題が、会話の主題と一致しなくなることがあった。
【0006】
また、キーワードの重要度を変更し、抽出精度を調整しても、その調整が適しているのかを確認するには、多くの音声データを必要とした。
【0007】
また、従来の主題検出装置で推定される主題の出力結果は、キーワードである単語が列記されているに過ぎず、文章ではないため、出力された単語から利用者が主題を連想する必要があった。そのため、主題に適さないキーワードが推定されることで、利用者の解釈により、主題が異なるものもあった。
【0008】
そこで、本発明は、音声データからその音声データの主題を推定する装置において、データベースに格納されている関連度およびキーワードを更新することができる音声データ主題推定装置およびこれを用いたコールセンタを提供することを目的とする。
【課題を解決するための手段】
【0009】
前記目的を達成するために、請求項1に係る音声データ主題推定装置は、前記音声データが記憶されたデータ記憶部と、前記音声データを音声認識して、音声認識データを生成する音声認識部と、辞書に掲載される語彙を格納する用語データベースと、前記音声認識データの文字列と、前記用語データベースに格納された前記語彙とが一致するキーワードを抽出するキーワード抽出部と、データの主題と、前記主題に係るキーワードと、前記主題と前記キーワードとの関係が数値化された関連度とが格納された主題データベースと、前記主題データベースを参照して、前記キーワード抽出部が抽出した抽出キーワードとの関連度が最も大きい主題を推定主題とする主題推定部と、前記主題データベースを参照して、前記推定主題に係るキーワードを取得し、この取得した主題キーワード(キーワードB)と、前記抽出キーワードとが一致するか否かを判定する判定部と、前記判定部により不一致と判定された不一致キーワードを、前記推定主題に係るキーワードとして、前記主題データベースに登録する主題DB登録部と、前記判定部により一致すると判定された前記主題キーワードの関連度を更新する主題DB更新部と、を備えることを特徴とする。
【0010】
請求項2に係る音声データ主題推定装置は、前記主題推定部が、入力主題が入力される入力部と、前記入力主題と前記推定主題とが一致するか否かを判定し、一致した主題を推定主題(主題A)とする主題判定部と、を備えることを特徴とする。
【0011】
請求項3に係る音声データ主題推定装置は、前記主題データベースに、前記主題判定部にて前記入力主題と前記推定主題とが一致した履歴の総数であるサンプル数が格納され、前記主題判定部が、判定結果が一致した場合に、前記主題データベースを参照して、前記推定主題に係るサンプル数に1を加え、前記主題推定部が、前記音声認識データの文字列と、前記主題データベースに格納されたキーワードとが一致するキーワードを抽出し、抽出したキーワードに係る主題と、その主題のサンプル数と、を取得し、前記主題に係るキーワードの関連度を合算して、さらに前記主題のサンプル数で除した平均関連度が最も大きい主題を推定主題とすることを特徴とする。
【0012】
請求項4に係る音声データ主題推定装置は、前記主題判定部が、さらに、前記主題データベースを参照して、前記推定主題と前記主題データベースに登録済みの主題とが一致するか否かを判定し、一致しない場合に、前記用語データベースを参照して、前記入力部から入力される概要データの文字列と、前記用語データベースに格納された前記語彙とが一致するキーワードを抽出する概要キーワード抽出部と、前記推定主題と、前記概要キーワード抽出部が抽出した概要キーワードとを前記主題データベースに登録する主題DB新規登録部と、を備えることを特徴とする。
【0013】
請求項5に係るコールセンタは、前記音声データ主題推定装置を設けることを特徴とする。
【発明の効果】
【0014】
本発明によれば、音声データからその音声データの主題を推定する装置において、データベースに格納されている関連度およびキーワードを更新することができるため、音声データに対して最適な主題を推定することができる音声データ主題推定装置およびこれを用いたコールセンタを提供することができる。
【発明を実施するための最良の形態】
【0015】
次に、本発明の実施形態について、適宜図面を参照しながら詳細に説明する。
【0016】
(第1の実施形態)
図1は、本発明の第1の実施形態である音声データ主題推定装置の構成図である。
図1に示すように、第1の実施形態に係る音声データ主題推定装置1は、主題データベース2と、用語データベース3と、データ記憶部4とを備え、具体的には、RAM(random access memory)、ROM(read-only memory)、HDD(hard disk drive)等の記憶装置で構成される。
図1に示すように、第1の実施形態に係る音声データ主題推定装置1は、音声認識部5、入力部6、主題推定部7、主題判定部8、キーワード抽出部9、判定部10、主題DB登録部11、および、主題DB更新部12を備え、具体的には、CPU(central processing unit)等の制御装置で構成される。
さらに、図1に示すように、第1の実施形態に係る音声データ主題推定装置1は、入力部6を備え、具体的には、キーボード、マウス等の入力装置、モニタ等の出力装置で構成される。
第1の実施形態に係る音声データ主題推定装置1は、前記した制御装置、記憶装置、入力装置、出力装置等のハードウエア資源と、オペレーティングシステム(OS)、アプリケーションを含むソフトウエアプログラムとを備えて、実現される。
【0017】
主題データベース2には、予め登録されたデータの主題と、その主題に係るキーワードと、主題とキーワードの関係を数値で示す関連度と、サンプル数(詳細は後記)とが対応付けられて、格納されている。
【0018】
用語データベース3には、国語辞典や百科事典等に掲載される語彙が記憶されている。そして、必要に応じて新たな語彙を用語データベース3に追加することもできる。
【0019】
データ記憶部4には、音声データが記憶されている。
音声データは、主に人の声が、ボイスレコーダやカセットテープレコーダ、録音機能付きミニディスク(MD:Mini Disk)プレーヤ等の録音機器により録音されたデジタルデータである。
【0020】
入力部6は、データが入力される装置であり、PC(Personal Computer)のキーボードからの直接入力や、GUI(Graphical User Interface)を用いて、モニタの画面に表示される画像をマウス等で選択することでデータを入力するものである。また、モニタをタッチパネル式にし、タッチパネルに触れて文字を選択してデータを入力してもよい。
【0021】
音声認識部5は、データ記憶部4から音声データを取得し、音声認識処理を行い、音声認識データを生成する。なお、音声認識処理は、生成される音声認識データは、テキストデータが好ましい。
【0022】
主題推定部7は、音声認識データを音声認識部5から取得し、音声認識データの文字列と、主題データベース2に記憶されたキーワードとを照合して、一致するキーワード(照合キーワード)を抽出する。そして、主題データベース2を参照して、照合キーワードに係る主題を抽出する。次に、主題推定部7は、主題データベース2を参照して、抽出した各主題のサンプル数を取得する。そして、抽出した各主題に対して、抽出したキーワードの関連度を合算し、合算された関連度をサンプル数で割り、抽出した各主題の推定値を算出する。最後に主題推定部7は、推定値が最も大きい主題を、推定した主題とする。
【0023】
主題判定部8は、入力部6から入力されたデータ(入力主題)と、主題推定部7から入力されたデータ(推定主題)とが一致するか否かを判定し、一致した場合には、判定部10に一致した一致データ(一致主題=入力主題=推定主題)を送出する。また、一致した場合には、主題データベース2を参照して、一致主題と一致するデータベース2に登録された主題を検索し、その主題に係るサンプル数に“1”を加える。つまり、サンプル数とは、主題判定部8にて、入力主題と推定主題がこれまでに一致した履歴の総数である。
【0024】
キーワード抽出部9は、音声認識データを音声認識部5から取得し、音声認識データの文字列と、用語データベース3に記憶された語彙とを照合して、一致する語彙(抽出キーワード)を抽出する処理を行う。
【0025】
判定部10は、主題判定部8から送出されるデータ(一致主題)を取得し、主題データベース2を参照して、一致主題と一致する主題を検索し、その主題(一致主題)に係る主題キーワード(キーワードB)を取得し、主題キーワードと、キーワード抽出部9が抽出した抽出キーワードとが、一致するか否かを判定し、判定結果(一致するキーワードまたは一致しないキーワード)を送出する。
【0026】
主題DB登録部11は、判定部10から送出された一致しない抽出キーワード(不一致キーワード)を取得する。そして、主題データベース2を参照して、不一致キーワードを、推定された音声データの主題(一致主題)に係るキーワードとして、追加登録する。
【0027】
主題DB更新部12は、判定部10から送出された一致する抽出キーワード(一致キーワード)を取得する。そして、主題DB更新部12は、主題データベース2を参照して、推定された音声データの主題(一致主題)に係る一致キーワードの関連度を更新する。
【0028】
以下に、図2および図3に示すフローチャートを用い、第1の実施形態に係る音声データ主題推定装置1が音声データの主題を推定し、推定する際に用いた主題データベース2を更新する処理について説明する。
【0029】
予め、利用者が、音声データを音声データ主題推定装置1のデータ記憶部4に記憶させておく(図2,S101)。
音声認識部5は、データ記憶部4から音声データを取得し、音声認識処理を行い、音声認識データを生成する(S102)。
主題推定部7は、音声認識データを音声認識部5から取得する(S103)。さらに、主題推定部7は、主題データベース2に格納された主題とキーワードと関連度に基づいて、音声データの主題を推定する(S104)。
【0030】
図4に示す主題データベース2と音声データ(音声認識データ)の一例と、図5に示すフローチャートを用いて、S104にて示す音声データの主題を推定する処理の詳細を説明する。
図4に示す主題データベース2は、主題とキーワードと関連度とサンプル数の情報を格納している。主題に『解約の質問』、『振込みの確認』、『口座作成の質問』、『住所変更の質問』等が登録され、それら主題に係るキーワードとして『解約』、『手続き』、『支店』、『口座』等が登録されている。そして、それぞれのキーワードには、主題との関連度が数値で示されている。例えば、主題『解約の質問』とキーワード『解約』との関連度は“30”である。また、関連度の“−”は未登録であることを示す。例えば、主題『振込みの確認』には、キーワード『解約』が登録されていないことを示す。そして、関連度の数値が“0”以上であれば、そのキーワードが主題に登録されていることを示す。
【0031】
主題推定部7は、音声認識データ(「虎ノ門支店で口座解約の手続きをしたい」)の文字列と、主題データベース2に登録されたキーワードとを照合して、一致するキーワード(照合キーワード)を抽出する(S201)。この場合、図4に示す主題データベース2に登録された、『解約』、『手続き』、『支店』、『口座』という照合キーワードを抽出する。
そして、主題推定部7は、主題データベース2から、照合キーワードに係る主題を抽出する(S202)。この場合、『解約の質問』、『振込みの確認』、『口座作成の質問』という主題を抽出する。
【0032】
次に、主題推定部7は、主題データベース2を参照して、抽出した各主題のサンプル数を取得する(S203)。この場合、『解約の質問』が“30”、『振込みの確認』が“22”、『口座作成の質問』が“20”のサンプル数を取得する。
主題推定部7は、抽出した各主題に対して、次のように、照合キーワードの関連度を合算し、サンプル数で割り、抽出した各主題の推定値を算出する(S204)。
【0033】
<1.解約の質問>
関連度の合算=解約:30+手続き:22+支店:0+口座:11=63
推定値=63÷サンプル数:30=2.1
<2.振込みの確認>
関連度の合算=解約:なし+手続き:16+支店:8+口座:2=26
推定値=26÷サンプル数:22=1.2
<3.口座作成の質問>
関連度の合算=解約:なし+手続き:12+支店:6+口座:18=36
推定値=36÷サンプル数:20=1.8
【0034】
そして、主題推定部7は、推定値が最も大きい『解約の質問』を、推定した主題とする(S205)。
再び、図2のS104に続いて、図3に示すフローチャートを用いて処理を説明する。
主題判定部8は、利用者が入力部6を介して入力したデータ(入力主題)と、主題推定部7から推定された主題(推定主題)とを取得する(図3,S105)。例えば、入力主題『解約の質問』と、推定主題『解約の質問』を取得する。
【0035】
次に、主題判定部8は、入力主題と推定主題とが一致するか否かを判定する(S106)。
一致しない場合(S106,No)、音声データ主題推定装置1は一連の処理を終了する。
一方、一致する場合(S106,Yes)、一致する主題(入力主題=推定主題=一致主題(主題A))について、主題判定部8は、主題データベース2を参照して、主題Aと一致する主題データベース2に登録された主題を検索し、その主題に係るサンプル数に“1”を加える(S107)。例えば、主題A『解約の質問』のサンプル数“30”に“1”を加え、“31”にする。
そして、主題判定部8は、主題Aを判定部10に送出する(S108)。
【0036】
キーワード抽出部9は、音声認識データを音声認識部5から取得する(S109)。例えば、音声認識データ『虎ノ門支店での口座解約の手続き』を取得する。
そして、キーワード抽出部9は、音声認識データの文字列と、用語データベース3に記憶された語彙とを照合して、一致する語彙(抽出キーワード)を抽出する(S110)。例えば、『支店』、『口座』、『解約』、『手続き』を抽出する。
【0037】
判定部10は、S108にて主題判定部8から送出される主題A(『解約の質問』)と、S110にてキーワード抽出部9が抽出した語彙(抽出キーワード群:『支店』、『口座』、『解約』、『手続き』)とを取得する(S111)。そして、判定部10は、主題データベース2を参照して、主題Aに係るキーワード群B(『口座』、『解約』、『手続き』、『変更』)を取得する(S112)。
【0038】
次に、判定部10は、取得したキーワード群B(『口座』、『解約』、『手続き』、『変更』)と、(S110で抽出した)抽出キーワード群(『支店』、『口座』、『解約』、『手続き』)とで、抽出キーワード群の中でキーワード群Bに含まれるキーワードと一致しない抽出キーワード(不一致キーワードX)があるか否かを判定する(S113)。
<判定結果>
一致しない抽出キーワード(不一致キーワードX)=『支店』
一致する抽出キーワード(一致キーワードY)=『口座』、『解約』、『手続き』
【0039】
不一致キーワードXがある場合(S113,Yes)、その不一致キーワードXを主題DB登録部11に送出する(S114)。主題DB登録部11は、取得した不一致キーワードXを、主題データベース2に、主題Aに係るキーワードとして、関連度“0”で登録する(S115)。これにより、主題データベース2に、主題A(『解約の質問』)に係るキーワードとして『支店』が関連度“0”で登録される(図4はこの状態を示す)。
そして、登録後は、S113に戻り、他にキーワードBと一致しない不一致キーワードXがあるか否かを判定する。
【0040】
一方、不一致キーワードXがない場合(S113,No)、一致キーワードYを主題DB更新部12に送出する(S116)。主題DB更新部12は、取得した一致キーワードYと一致する主題Aに係るキーワードBの関連度に“1”を加える(S117)。以上により、図4に示す主題データベースに登録された主題(主題A『解約の質問』)の各キーワードの関連度は、『解約』が“30→31”となり、『手続き』が“22→23”となり、『口座』が“11→12”となる。
そして、主題DB更新部12は、主題データベース2の主題、キーワード、関連度を更新する(S118)。そして、音声データ主題推定装置1は処理を終了する。
【0041】
第1の実施形態によれば、音声データ主題推定装置1が備える主題データベース2に、登録された主題とその主題に係るキーワードとの関連度を高めることができるため、音声データ主題推定装置1は、音声データから抽出されたキーワードと関連度が高い主題を推定することができる。つまり、音声データに適した主題が推定される。
【0042】
(第2の実施形態)
本発明の第2の実施形態に係る音声データ主題推定装置1aは、図6に示すように、第1の実施形態に係る音声データ主題推定装置1の構成(図1)にさらに、概要キーワード抽出部13、主題DB新規登録部14を加え、主題判定部8aに機能が追加される。
入力部6は、入力データと概要データとが入力される。入力データには、音声データの主題(入力主題)が含まれ、概要データには、その主題に係る情報が含まれる。
【0043】
主題判定部8aは、入力部6から取得した入力主題(主題)と、主題推定部7から取得した推定主題(主題)とが一致するか否かを判定する。一致した場合、さらに、主題データベース2を参照して、一致する主題(入力主題=推定主題=一致主題)が、主題データベース2に登録されているか否かを判定する。登録されている場合、判定部10に登録済主題(一致主題)を送出し、登録されていない場合、概要キーワード抽出部13に未登録主題(一致主題)を送出する処理を行う。
【0044】
概要キーワード抽出部13は、主題判定部8aから未登録主題を取得する。さらに、入力部6から概要データを取得し、用語データベース3に記憶された、辞書に記載された語彙を参照して、概要データに含まれる語彙と一致する語彙(概要キーワード)を抽出する処理を行う。
主題DB新規登録部14は、概要キーワード抽出部13から未登録主題と、概要キーワードを取得し、未登録主題を主題、概要キーワードをその主題に係るキーワードとして、主題データベース2に登録する処理を行う。
【0045】
このように、第2の実施形態に係る音声データ主題推定装置1aは、前記の概要キーワード抽出部13と、主題DB新規登録部14と、を備えることで、主題データベース2に主題と、その主題に係るキーワードを登録することができる。
【0046】
以下に、図7に示すフローチャートを用い、第2の実施形態に係る音声データ主題推定装置1aが主題データベース2に主題と、その主題に係るキーワードを登録する処理について説明する。
主題推定部7により行われる処理は、前記のS101〜S104(図2)の処理と同じであるため、説明を省略する。
【0047】
主題判定部8aは、利用者が入力部6を介して入力したデータ(入力主題)と、主題推定部7から推定された主題(推定主題)を取得する(図7,S301)。例えば、入力主題『ATMの場所の質問』と、推定主題『ATMの場所の質問』とを取得する。
【0048】
次に、主題判定部8aは、入力主題と推定主題とが一致するか否かを判定する(S302)。
一致しない場合(S302,No)、音声データ主題推定装置1は一連の処理を終了する。
一致する場合(S302,Yes)、主題判定部8aは、主題データベース2を参照して、一致主題(入力主題=推定主題)と一致する主題を検索し、一致主題が登録されているか否かを判定する(S303)。
【0049】
一致主題が登録されている場合(S303,Yes)、主題判定部8aは、主題データベース2に登録されている登録済主題(一致主題(主題A))に係るサンプル数に“1”を加える(S304)。そして、主題判定部8aは、主題Aを判定部10に送出する(S305)。その後の処理(S306)は、前記のS111〜S118(図3)の処理と同じであるため、説明を省略する。
【0050】
一方、一致主題が登録されていない場合(S303,No)、主題判定部8aは、未登録主題(一致主題)を概要キーワード抽出部13に送出する(S307)。
概要キーワード抽出部13は、主題判定部8aから送出された未登録主題と、利用者が入力部6を介して入力した概要データとを取得する(S308)。例えば、未登録主題『ATMの場所の質問』と、概要データ『虎ノ門駅近くの支店に設置されたATMはどこにありますか?』を取得する。
【0051】
そして、概要キーワード抽出部13は、概要データの文字列と、用語データベース3に記憶された語彙とを照合して、一致する語彙(概要キーワード)を抽出する(S309)。例えば、『駅』、『支店』、『設置』、『ATM』を抽出する。
次に、未登録主題と抽出した語彙(概要キーワード:『駅』、『支店』、『設置』、『ATM』)を主題DB新規登録部14に送出する(S310)。
【0052】
主題DB新規登録部14は、未登録主題(『ATMの場所の質問』)と概要キーワード(『駅』、『支店』、『設置』、『ATM』)を取得する(S311)。そして、主題DB新規登録部14は、未登録主題を主題、概要キーワードをその主題に係るキーワードとして、関連度“0”で、主題データベース2に登録する(S312)。登録後、音声データ主題推定装置1は処理を終了する。
【0053】
第2の実施形態によれば、音声データ主題推定装置1aが備える主題データベース2に、未登録であった主題やその主題に係るキーワードを追加して登録することができる。
【0054】
(音声データ主題推定装置を備えるコールセンタ)
本発明の実施形態に係る音声データ主題推定装置を、銀行のコールセンタに用いた実施例を示す。
【0055】
図8は、音声データ主題推定装置1を備えるコールセンタの構成図である。銀行のコールセンタ100は、CTサーバ101と、複数のオペレータ端末102と、複数の電話103とを備える。
CTサーバ101と、オペレータ端末102とは、LAN104等の通信回線で接続されており、通信回線を介して、データの送受信を行う。
電話103は、卓上電話でもよいし、例えば、IP(Internet Protocol)電話を用いることで、図8に示すように、ヘッドセットと接続されたオペレータ端末102が電話機能を有してもよい。
【0056】
CTサーバ101には、前記実施形態に係る音声データ主題推定装置1、1aが含まれる。CTサーバ101は他に、ユーザ300からかかってきた電話を各オペレータに振り分ける電話交換手段や、各オペレータ端末102のモニタに必要な情報を表示する手段や、その情報を記憶する手段、各オペレータ端末102から入力された情報を記憶する手段等、コールセンタを運営するために必要な構成を備える。
【0057】
オペレータ端末102は、PCと、モニタ、キーボード、マウス等の入出力装置と、ボイスレコーダ等の録音機器とで構成される。このオペレータ端末102の入力装置が、入力部6に該当し、録音機器により録音された音声データが、LAN104を介して、CTサーバ101内のデータ記憶部4に保存される。
ユーザ300からの電話をオペレータ105が受けることで、オペレータ端末102は、電話をかけたユーザ300とオペレータ105との会話を自身が備える録音機器に記憶する。
【0058】
前記構成を備えることで、音声データ主題推定装置1(図1)を、銀行のコールセンタに用いることが可能となる。
例えば、ユーザ300から電話にて「虎ノ門支店で口座解約の手続きをしたい」という質問があった場合に、オペレータが電話の内容に基づいて、主題に『解約の質問』、概要データに『虎ノ門支店での口座解約の手続き』を入力する。
また、音声データ主題推定装置1により、音声データ「虎ノ門支店で口座解約の手続きをしたい」から、主題『解約の質問』が推定される(図5、S205)。
前記処理が行われることで、音声データ主題推定装置1は、主題データベース2に登録された主題『解約の質問』に係るキーワード『支店』の追加や、キーワード『口座』、『解約』、『手続き』の関連度の更新をすることができる。
これにより、『解約の質問』は、キーワード『口座』、『解約』、『手続き』との関連度が増し、そのキーワードを含む音声データに対して、『解約の質問』を主題として推定する確率を高めることができる。
よって、当該処理により、音声データ主題推定装置1は、ユーザ300からの質問に対して、主題を正しく推定する精度を上げることができる。
【0059】
また、音声データ主題推定装置1を含むCTサーバ101に、オペレータ端末102を介して新たな主題と概要データを入力するとき、入力部6には、キーボードやマウス等を使ってもよいし、オペレータ105の操作ログを用いてもよい。
【0060】
入力部6にオペレータ105の操作ログを用いる場合を示す。
オペレータ端末102のモニタに表示されるすべての画面には、1画面につき1つのタイトルと、1つ以上の語彙が付与されている。
これにより、オペレータ105が、顧客との対話中に最も長い時間表示した画面に付与されたタイトルを、入力部6に入力された主題(入力主題)とすることができる。
そして、オペレータ105が、顧客との対話中に表示した全画面に付与された語彙を、第2の実施形態の音声データ主題推定装置1aのとき、概要キーワード抽出部13が抽出した語彙(概要キーワード)とすることができる。そして、オペレータ105の操作ログを用いて、主題判定部8aは入力主題、主題DB新規登録部14は概要キーワードを取得することができる。
また、オペレータ105の操作ログを用いることで、各抽出キーワードの関連度を、対話中に画面に表示された合計時間に応じて決めることができる。
例えば、表示時間が、30秒未満であれば“0”、30秒以上1分未満であれば“1”、1分以上5分未満であれば“2”、5分以上であれば“3”等である。そして、S114(図3)の処理の際に、主題DB更新部12は、これらの関連度の数値を、主題Aに係るキーワードBの関連度に加えることができる。
前記するように、入力手段にオペレータの操作ログを用いることで、オペレータが入力装置を用いて、主題を入力することなく、主題データベース2の更新を行うことができる。
【0061】
本発明は、主題推定装置の使用期間が長くなっても、データベースに対して、キーワードの追加、主題とキーワードの関連度を変更、あるいは主題とキーワードの新規登録ができるため、音声データに対して最適な主題を推定するためのデータベースを提供することができる。
【0062】
主題データベースの更新が頻繁に行われる、新たな機能を頻繁に追加するシステムや、データの更新が頻繁に行われるシステムに対して、本発明を用いることで、次のような効果が得られる。
【0063】
以上、本発明の実施形態について説明したが、本発明はこれに限定されるものではなく、その趣旨を変えない範囲で実施することができる。
例えば、PBX(電話交換機)に音声データ主題推定装置1を備えることで、電話の質問内容をシステムが自動で認識できる。そのため、質問内容とその質問に回答できる部署や人を関連付けたデータベースを追加して備えることで、発信者の電話の質問内容に応じて、質問を回答できる部署や人に電話を転送するシステムを作ることができる。これにより、発信者は、たらい回しにされることから解放される。
【0064】
例えば、ATM(自動現金預払機)に音声データ主題推定装置1を備えることで、操作者が、ATMに取り付けられたマイクに向かって発話するだけで、所望する処理をシステムが自動で認識することができるため、ATMのタッチパネルを操作して、所望する処理が完了するまで、画面をタッチし続けるという煩わしい操作から解放される。
【図面の簡単な説明】
【0065】
【図1】本発明の第1の実施形態である音声データ主題推定装置の構成図である。
【図2】本発明の第1の実施形態である音声データ主題推定装置の処理手順を示すフローチャートである(処理前半)。
【図3】本発明の第1の実施形態である音声データ主題推定装置の処理手順を示すフローチャートである(処理後半)。
【図4】主題データベースと入力データの一例である。
【図5】音声データの主題を推定する処理手順を示すフローチャートである。
【図6】本発明の第2の実施形態である音声データ主題推定装置の構成図である。
【図7】本発明の第2の実施形態である音声データ主題推定装置の処理手順を示すフローチャートである。
【図8】本発明の実施形態に係る音声データ主題推定装置を、銀行のコールセンタに用いた構成図である。
【符号の説明】
【0066】
1 音声データ主題推定装置
2 主題データベース
3 用語データベース
4 データ記憶部
5 音声認識部
6 入力部
7 主題推定部
8 主題判定部
9 キーワード抽出部
10 判定部
11 主題DB登録部
12 主題DB更新部
13 概要キーワード抽出部
14 主題DB新規登録部
100 コールセンタ
101 CTサーバ
102 オペレータ端末
103 電話
104 LAN
105 オペレータ
200 公衆回線網
300 ユーザ

【特許請求の範囲】
【請求項1】
音声データを音声認識して、抽出したキーワードから前記音声データの主題を推定する音声データ主題推定装置であって、
前記音声データが記憶されたデータ記憶部と、
前記音声データを音声認識して、音声認識データを生成する音声認識部と、
辞書に掲載される語彙を格納する用語データベースと、
前記音声認識データの文字列と、前記用語データベースに格納された前記語彙とが一致するキーワードを抽出するキーワード抽出部と、
データの主題と、前記主題に係るキーワードと、前記主題と前記キーワードとの関係が数値化された関連度とが格納された主題データベースと、
前記主題データベースを参照して、前記キーワード抽出部が抽出した抽出キーワードとの関連度が最も大きい主題を推定主題とする主題推定部と、
前記主題データベースを参照して、前記推定主題に係るキーワードを取得し、この取得した主題キーワードと、前記抽出キーワードとが一致するか否かを判定する判定部と、
前記判定部により不一致と判定された不一致キーワードを、前記推定主題に係るキーワードとして、前記主題データベースに登録する主題DB登録部と、
前記判定部により一致すると判定された前記主題キーワードの関連度を更新する主題DB更新部と、
を備えることを特徴とする音声データ主題推定装置。
【請求項2】
前記主題推定部は、
入力主題が入力される入力部と、
前記入力主題と前記推定主題とが一致するか否かを判定し、一致した主題を推定主題とする主題判定部と、
を備えることを特徴とする請求項1に記載の音声データ主題推定装置。
【請求項3】
前記主題データベースには、前記主題判定部にて前記入力主題と前記推定主題とが一致した履歴の総数であるサンプル数が格納され、
前記主題判定部は、判定結果が一致した場合に、前記主題データベースを参照して、前記推定主題に係るサンプル数に1を加え、
前記主題推定部は、前記音声認識データの文字列と、前記主題データベースに格納されたキーワードとが一致するキーワードを抽出し、抽出したキーワードに係る主題と、その主題のサンプル数と、を取得し、前記主題に係るキーワードの関連度を合算して、さらに前記主題のサンプル数で除した平均関連度が最も大きい主題を推定主題とすることを特徴とする請求項2に記載の音声データ主題推定装置。
【請求項4】
前記主題判定部は、さらに、前記主題データベースを参照して、前記推定主題と前記主題データベースに登録済みの主題とが一致するか否かを判定し、
一致しない場合に、前記用語データベースを参照して、前記入力部から入力される概要データの文字列と、前記用語データベースに格納された前記語彙とが一致するキーワードを抽出する概要キーワード抽出部と、
前記推定主題と、前記概要キーワード抽出部が抽出した概要キーワードとを前記主題データベースに登録する主題DB新規登録部と、
を備えることを特徴とする請求項2または請求項3に記載の音声データ主題推定装置。
【請求項5】
請求項1乃至請求項4の何れか1項に記載の音声データ主題推定装置を設けたことを特徴とするコールセンタ。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate


【公開番号】特開2010−2973(P2010−2973A)
【公開日】平成22年1月7日(2010.1.7)
【国際特許分類】
【出願番号】特願2008−159042(P2008−159042)
【出願日】平成20年6月18日(2008.6.18)
【出願人】(000000295)沖電気工業株式会社 (6,645)
【Fターム(参考)】