説明

文章分類装置および文章分類方法

【課題】通話から得られた文章に対して高い精度で分類を行うことができる文章分類装置を提供すること。
【解決手段】通話音声の音声データに対する音声認識結果である文章を第1の種別と第2の種別とに分類する文章分類方法。この方法は、文章を入力する工程(S1000〜S1100)と、入力文章に含まれる語句の第1の種別の文章における出現頻度を、語句の第1の種別の文章における出現頻度と語句の第2の種別の文章における出現頻度との加算値で除した値から、入力文章が第1の種別であることの確からしさを示す確率値を求め、求めた確率値に基づいて入力文章を分類する工程(S1200〜S2100)とを有し、分類工程において、前述の値を、音声認識結果としての信頼度がより低い語句ほど確率値に与える影響がより抑えられるように補正する(S1500)。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、通話音声の音声データに対する音声認識結果である文章を分類する文章分類装置および文章分類方法に関する。
【背景技術】
【0002】
受信メールの中からスパムメールを抽出する等、文章をその内容に応じて自動で分類する文章分類装置が、従来存在する。
【0003】
例えば、非特許文献1記載の文章分類装置(以下「従来装置」という)は、過去の受信メールから統計学的に生成されるコンテンツベースフィルタを用いて、メールを分類する。
【0004】
より具体的には、従来装置は、過去のスパムメールおよび非スパムメールの蓄積データから、ベイズ推定により、単語毎に以下の式(1)で表されるスパム確率p(w)を求める。ここで、ngoodは、蓄積データにおける非スパムメールの総数であり、nbadは、蓄積データにおけるスパムメールの総数である。また、bは、蓄積データのスパムメールにおけるその単語の出現回数であり、gは、蓄積データの非スパムメールにおけるその単語の出現回数である。また、処理の対象となるi番目の単語を記号wによって表す。
【0005】
【数1】

【0006】
すなわち、スパム確率p(w)は、過去のスパムメールにおける単語wの出現頻度と過去の非スパムメールにおける単語の出現頻度との加算値で、過去のスパムメールにおける単語wの出現頻度を除した値である。
【0007】
そして、従来装置は、受信メールに出現する各単語wのスパム確率p(w)から、以下の式(2)〜式(5)を用いて、受信メールがスパムメールであることの尤度(以下「スパム確率S」という)を求める。ここで、nは、単語wの、蓄積された全てのクレーム電話における出現回数であり、b+gである。xは、過去の通話に一度も出現していない単語が始めて通話に出現したときにその通話がクレーム電話である予測確率として、予め設定される定数(例えば0.5)である。sは、定数xが通話の分類に与える影響の強さとして予め設定される定数(例えば1)である。
【数2】

【数3】

【数4】

【数5】

【0008】
そして、従来装置は、スパム確率Sが所定の閾値(例えば0.5)を超えるメールを、スパムメールに分類する。すなわち、従来装置は、単語の出現回数を学習データとするベイジアンフィルタを用いて、メールの分類を行う。メールの文章には、スパムメールにおいてのみ高頻度に出現する単語や、非スパムメールにおいてのみ高頻度に出現する単語が、多く存在する。したがって、従来装置は、受信メールの分類を高い精度で行うことができる。
【0009】
ところで、近年、コールセンターやコンタクトセンター等に設けられたCTI(computer telephony integration)システムにおいて、通話音声を音声認識処理によりテキスト化することが広く行われている。これにより、オペレータ自身や、スーパーバイザおよびセンター管理者等(以下「管理者」という)は、通話内容を簡単に確認および解析することができ、サービスの向上に役立てることができる。
【0010】
特に、苦情の訴えが顧客の主目的である通話(以下「クレーム電話」という)の内容を管理者が確認することは重要である。そこで、膨大な数の通話の中からクレーム電話を効率よくピックアップするために、過去のクレーム電話および非クレーム電話に基づくコンテンツベースフィルタを用いて、通話を自動で分類する装置が望まれる。
【0011】
ところが、通話のような会話文の場合、メールと異なり、遠回しな表現が使われたり途中で話題が変わったりするなどして、主目的の事柄に関する単語に比べてその他の単語の方が多くなることがある。特に過去の出現回数が少ない単語の場合、クレーム単語であるか非クレーム単語であるかを正しく判定することは困難である。例えば、非クレーム電話であるにもかかわらず、過去に1回だけクレーム電話で使用された単語が出現したとき、クレーム電話に誤分類される可能性が高くなる。
【0012】
この点、上述の従来装置は、式(2)に示す通り、過去の通話における出現回数がより高い単語ほどよりスパム確率p(w)に近付くように、補正を行っている。これにより、従来装置は、過去の出現回数が低い単語による誤分類を低減することを可能にしている。
【先行技術文献】
【非特許文献】
【0013】
【非特許文献1】渡部綾太、外、「スパムメールの教科書」、株式会社データハウス、006年10月20日、p.106−112
【発明の概要】
【発明が解決しようとする課題】
【0014】
しかしながら、従来装置では、通話から音声認識処理により得られた文章の分類においては、分類の精度を向上させることが難しいという問題がある。
【0015】
理由は、以下の通りである。音声認識における誤認識の発生頻度は、通常、メール文章作成における誤入力の発生頻度に比べて高い。したがって、従来装置の手法では、クレーム電話に顕著な単語(以下「クレーム単語」という)と、その他の通常の単語(以下「非クレーム単語」という)との間の取り違えに起因した誤分類が発生する可能性が高い。
【0016】
また、会話文の場合、メールと異なり、相手の反応によって文章全体の長さが変化するため、クレーム単語および非クレーム単語の出現回数に幅がある。したがって、例えば、クレーム電話が他の話題で長くなったとき、非クレーム単語の出現回数に対するクレーム単語の出現回数の比率が低くなり、クレーム電話であるにもかかわらず非クレーム電話に誤分類される可能性が高い。
【0017】
本発明の目的は、通話から得られた文章に対して高い精度で分類を行うことができる文章分類装置および文章分類方法を提供することである。
【課題を解決するための手段】
【0018】
本発明の文章分類装置は、通話音声の音声データに対する音声認識結果である文章を第1の種別と第2の種別とに分類する文章分類装置であって、前記文章を入力する入力手段と、入力文章に含まれる語句の前記第1の種別の文章における出現頻度を、前記語句の前記第1の種別の文章における出現頻度と前記語句の前記第2の種別の文章における出現頻度との加算値で除した値から、前記入力文章が前記第1の種別であることの確からしさを示す確率値を求め、求めた前記確率値に基づいて前記入力文章を分類する分類手段とを有し、前記分類手段は、前記値を、前記音声認識結果としての信頼度がより低い語句ほど前記確率値に与える影響がより抑えられるように補正する。
【0019】
本発明の文章分類方法は、通話音声の音声データに対する音声認識結果である文章を第1の種別と第2の種別とに分類する文章分類方法であって、前記文章を入力する工程と、入力文章に含まれる語句の前記第1の種別の文章における出現頻度を、前記語句の前記第1の種別の文章における出現頻度と前記語句の前記第2の種別の文章における出現頻度との加算値で除した値を算出する工程と、算出した前記値から、前記入力文章が前記第1の種別であることの確からしさを示す確率値を求め、求めた前記確率値に基づいて前記入力文章を分類する工程とを有し、前記分類工程において、前記値を、前記音声認識結果としての信頼度がより低い語句ほど前記確率値に与える影響がより抑えられるように補正する。
【発明の効果】
【0020】
本発明によれば、語句の音声認識精度を考慮した分類を行うことができるので、通話から得られた文章に対して高い精度で分類を行うことができる。
【図面の簡単な説明】
【0021】
【図1】本発明の実施の形態1に係る文章分類装置を含むコールセンターシステムの構成の一例を示すシステム構成図
【図2】本実施の形態1に係る通話録音・分類装置の構成を示すブロック図
【図3】本実施の形態1に係る通話録音・分類装置の動作を示すフローチャート
【図4】本発明の実施の形態2に係る通話録音・分類装置の構成を示すブロック図
【図5】本実施の形態2に係る通話録音・分類装置の動作を示すフローチャート
【図6】本実施の形態2における分析範囲を説明するための図
【発明を実施するための形態】
【0022】
以下、本発明の各実施の形態について、図面を参照して詳細に説明する。
【0023】
(実施の形態1)
図1は、本発明の実施の形態に係る文章分類装置を含むコールセンターシステムの構成の一例を示すシステム構成図である。
【0024】
図1において、コールセンターシステム100は、顧客端末200−1〜200−Mと、オペレータ端末300−1〜300−Nと、本実施の形態に係る文章分類装置を含む通話録音・分類装置400と、音声認識サーバ500とを有する。
【0025】
顧客端末200−1〜200−Mとオペレータ端末300−1〜300−Nとは、通信網600を介して、通話可能に接続されている。通話録音・分類装置400は、通信網600とオペレータ端末300−1〜300−Nとの間に配置されている。通話録音・分類装置400と音声認識サーバ500とは、例えばLAN(local area network)を介して通信可能に接続されている。
【0026】
顧客端末200−1〜200−Mは、通話機能を有する顧客側の装置であり、例えば、固定電話機、携帯電話機、IP電話機能を有するパーソナルコンピュータである。
【0027】
オペレータ端末300−1〜300−Nは、通話機能および情報処理機能を有するコールセンター側の装置であり、例えば、IP電話機能を有するパーソナルコンピュータと通話用のヘッドセットとのユニットである。
【0028】
通話録音・分類装置400は、顧客端末200とオペレータ端末300との間の通話音声を録音し、録音音声の音声データを、呼の識別情報(以下「呼情報」という)を付加した状態で管理する。
【0029】
また、通話録音・分類装置400は、後述の音声認識サーバ500を用いて、通話音声の音声データに対する音声認識の結果を取得し、取得した音声認識結果のデータに基づいて、各通話を、クレーム電話と非クレーム電話とに分類する。より具体的には、通話録音・分類装置400は、通話に含まれる単語に対するベイズ推定により得られる値に基づいて、通話の分類を行う。そして、このとき、通話録音・分類装置400は、ベイズ推定により得られる値を、過去の通話における出現回数がより低い単語ほど分類結果に与える影響がより抑えられるように、かつ、スコアがより低い単語ほど分類結果に与える影響がより抑えられるように、補正する。スコアとは、例えば、音声認識の音響的尤度と言語的確率とから算出される値であり、各単語の音声認識結果としての信頼度の高さを示す値である。補正および分類の詳細については後述する。
【0030】
音声認識サーバ500は、音声認識処理を行う装置であり、例えば、LAN機能を有するパーソナルコンピュータである。音声認識サーバ500は、通話録音・分類装置400から依頼を受けて音声認識を行い、各単語のスコアを付加した音声認識結果を、通話録音・分類装置400へ送信する。
【0031】
なお、本実施の形態では、音声認識処理のうち、音声データから特徴量を抽出する処理は通話録音・分類装置400において行われ、抽出された特徴量に基づいて音声認識を行う処理は音声認識サーバ500において行われる。
【0032】
通信網600は、インターネット、公衆電話回線網等である。
【0033】
このような構成を有するコールセンターシステム100は、顧客端末200−1〜200−Mとオペレータ端末300−1〜300−Nとの間での各通話を、クレーム電話と非クレーム電話とに分類することができる。すなわち、コールセンターシステム100は、膨大な通話の中からクレーム電話を効率良くピックアップすることができる。
【0034】
また、コールセンターシステム100は、単語のクレーム電話における出現頻度および非クレーム電話における出現頻度だけでなく、過去の通話における出現回数をも考慮して分類を行うので、通話から得られた文章に対して高い精度で分類を行うことができる。
【0035】
また、上述の通り、音声認識処理に基づく通話の分類の場合、誤認識によって誤分類が発生する可能性がある。例えば、ある非クレーム電話において顧客が発話した「それでは、どうしましょうか。」という文章が、「それでは、上司ましょうか。」と誤認識されたとする。「上司」は、非クレーム電話に比べてクレーム電話により頻出する単語の1つである。したがって、このような場合、通話が、非クレーム電話であるにもかかわらず、クレーム通話に誤分類されてしまう可能性が高くなる。
【0036】
そこで、本実施の形態に係る通話録音・分類装置400は、上述の通り、スコアを考慮した通話の分類を行う。これにより、本実施の形態に係るコールセンターシステム100は、誤分類の可能性を低減することが可能となる。例えば、上述の例の場合、コールセンターシステム100は、元々の発話音声が「どうし」であり、「上司」のスコアが低くなることから、通話をクレーム通話に誤分類するのを防ぐことができる。
【0037】
次に、本発明に係る通話録音・分類装置400の構成について説明する。
【0038】
図2は、通話録音・分類装置400の構成を示すブロック図である。
【0039】
図2に示すように、通話録音・分類装置400は、音声データ入力部410、特徴抽出部420、通話蓄積部430、通話分類部440、操作受付部450、および情報出力部460を有する。
【0040】
音声データ入力部410は、通信網600を介して顧客端末200から音声データを入力して記憶し、記憶する音声データを、特徴抽出部420へ出力する。音声データ入力部410は、各音声データに、呼情報を付加する。
【0041】
特徴抽出部420は、音声データ入力部410から入力された音声データの発話区間から特徴量を抽出して、特徴量の時系列データに呼情報を付加した特徴量データを生成する。そして、特徴抽出部420は、生成した特徴量データを音声認識サーバ500へ出力し、音声認識サーバ500に対して音声認識処理の実行を指示する。
【0042】
この結果、音声認識サーバ500では、特徴量データから、予め用意された音響モデルデータ、辞書データ、言語モデルデータを用いて、発話音声を示すテキストデータが、音声認識結果として生成される。そして、音声認識サーバ500からは、呼情報が付加された音声認識結果が、通話録音・分類装置400へ出力される。
【0043】
通話録音・分類装置400の通話蓄積部430は、クレーム電話と非クレーム電話とに分類された過去の通話の音声認識結果を蓄積する。
【0044】
通話分類部440は、音声認識サーバ500から入力された音声認識結果に基づいて、各通話を、クレーム電話と非クレーム電話とに分類する。より具体的には、通話録音・分類装置400は、通話蓄積部430を参照して、通話に含まれる各単語の、過去のクレーム電話における出現頻度(以下「クレーム時頻度」という)および過去の非クレーム電話における出現頻度(以下「非クレーム時頻度」という)を算出する。そして、通話分類部440は、クレーム時頻度および非クレーム時頻度から、ベイズ推定により、通話に含まれる単語毎の苦情確率を算出する。苦情確率は、クレーム時頻度と非クレーム時頻度との加算値でクレーム時頻度を除した値であり、上述のスパム確率p(w)に相当するものである。
【0045】
そして、通話分類部440は、苦情確率を、過去の通話における出現回数に応じて補正し、更に、スコアがより低い単語ほどその影響が抑えられるように補正した補正苦情確率に基づいて、通話の分類を行う。そして、通話分類部440は、分類が完了した通話の音声認識結果を、その分類結果と対応付けて、通話蓄積部430に格納する。クレーム時頻度、非クレーム時頻度、出現回数、苦情確率、および通話の分類の詳細については後述する。
【0046】
操作受付部450は、例えば、キーボードおよびマウスであり、通話録音・分類装置400に対する各種操作を受け付ける。
【0047】
情報出力部460は、例えば液晶ディスプレイである。情報出力部460は、例えば、通話蓄積部430に格納する音声認識結果のうち、クレーム電話に分類された通話の呼情報を一覧表示する。そして、情報出力部460は、例えば操作受付部450を介して通話の選択を受け付け、選択された通話の音声認識結果を、例えば話者毎に区別して、時系列で表示する。
【0048】
また、通話録音・分類装置400は、図示しないが、CPU(central processing unit)、制御プログラムを格納したROM(read only memory)等の記憶媒体、RAM(random access memory)等の作業用メモリ、および通信回路等によって実現することができる。この場合、上記した各部の機能は、CPUが制御プログラムを実行することにより実現される。
【0049】
このような構成を有する通話録音・分類装置400は、通話に含まれる各単語のクレーム時頻度、非クレーム時頻度、過去の通話における出現回数、およびスコアに基づいて、通話をクレーム電話と非クレーム電話とに分類することができる。
【0050】
次に、通話録音・分類装置400の動作について説明する。
【0051】
図3は、通話録音・分類装置400の動作を示すフローチャートである。
【0052】
通話蓄積部430にクレーム電話と非クレーム電話とに分類された過去の通話の音声認識結果が十分な数蓄積されていない間は、通話録音・分類装置400による分類精度を向上させることが難しい。したがって、この期間は、例えば、管理者が各音声認識結果を目で確認し、手入力で分類操作を行う。ここでは、過去の通話の音声認識結果が、通話蓄積部430に既に十分に蓄積されているものとして説明を行う。
【0053】
まず、ステップS1000において、音声データ入力部410は、顧客端末200とオペレータ端末300との間で行われる通話の音声データを入力し、入力した音声データを、特徴抽出部420へ出力する。
【0054】
そして、ステップS1100において、特徴抽出部420は、入力された音声データに対して音声認識処理を行う。具体的には、特徴抽出部420は、音声データに対して発話区間の検出および発話区間の特徴量抽出を行い、特徴量データを音声認識サーバ500へ出力して、その音声認識結果を返送させる。
【0055】
そして、ステップS1200において、通話分類部440は、通話の音声認識結果が音声認識サーバ500から返送されると、音声認識結果の中から、例えば前方から順に、単語wを1つ選択する。
【0056】
そして、ステップS1300において、通話分類部440は、選択中の単語wの苦情確率を算出する。より具体的には、通話分類部440は、例えば、通話蓄積部430から、クレーム電話の総数nbad、非クレーム電話の総数ngood、全てのクレーム電話における選択中の単語wの出現回数b、および全ての非クレーム電話における選択中の単語wの出現回数gを取得する。なお、通話分類部440は、1つの通話に対する処理において、通話蓄積部430に蓄積されたクレーム電話の総数nbadおよび非クレーム電話の総数ngoodを既に取得している場合には、これらの取得処理を省略しても良い。
【0057】
そして、通話分類部440は、上述の式(1)を用いて、単語wの苦情確率p(w)を算出する。ここで、「スパム確率」を「苦情確率」、「スパムメール」を「クレーム電話」にそれぞれ置き換えるものとする。
【0058】
そして、ステップS1400において、通話分類部440は、選択中の単語wの補正苦情確率を算出する。本実施の形態における補正苦情確率は、過去の通話における単語wの出現回数を考慮して、苦情確率p(w)を補正した値である。
【0059】
より具体的には、通話分類部440は、例えば、上述の以下の式(2)を用いて、単語wの補正苦情確率f(w)を算出する。
【0060】
補正苦情確率f(w)は、選択中の単語wの過去の通話における登場回数が多いほど、苦情確率p(w)により近い値となり、登場回数が少ないほど、xの値により近い値となる。
【0061】
例えば、x=0.5、s=1であり、過去の通話のうち一度だけクレーム電話に出現した単語が通話に出現した場合を想定する。この場合、従来の苦情確率p(w)は1となるのに対し、本実施の形態の補正苦情確率f(w)は0.75となる。
【0062】
そして、ステップS1500において、通話分類部440は、補正苦情確率f(w)と、選択中の単語のスコアとに基づいて、スコアを考慮した補正苦情確率g(w)を算出する。より具体的には、通話分類部440は、例えば、以下の式(6)を用いて、単語の補正苦情確率g(w)を算出する。ここで、Score(w)は、単語のスコアである。sscoreは、スコアScore(w)が通話の分類に与える影響の強さとして設定される定数(例えば10)である。
【0063】
【数6】

【0064】
補正苦情確率g(w)は、選択中の単語wのスコアが高いほど、補正苦情確率f(w)に近い値となり、スコアが低いほど、補正苦情確率f(w)の影響がより少なく、0.5の値により近い値、つまり、より中間的な値となる。
【0065】
例えば、f(w)=0.75、sscore=1、Score(w)=0.9の場合、補正苦情確率g(w)は、0.62となる。一方、例えば、f(w)=0.75、sscore=1、Score(w)=0.2の場合、補正苦情確率g(w)は、0.54となる。
【0066】
そして、ステップS1600において、通話分類部440は、補正苦情確率g(w)の算出処理が行われていない単語wが残っている間は、ステップS1200へ戻り、ステップS1200〜S1400の処理を繰り返す(S1600:NO)。そして、通話分類部440は、音声認識結果の全ての単語wについて補正苦情確率g(w)を算出すると(S1600:YES)、ステップS1700へ進む。ここで、音声認識結果の全ての単語とは、音声認識結果に含まれる全ての単語wでも良いし、音声認識結果に含まれる単語から助詞や間投詞を取り除いた残り等、特定の単語wの全てでも良い。
【0067】
ステップS1700において、通話分類部440は、通話の苦情通話確率Sを算出する。より具体的には、通話分類部440は、例えば、以下の式(7)、(8)を用いて、クレーム電話尤度Pおよび非クレーム電話尤度Qを算出する。ここで、mは、処理の対象となっている通話において補正苦情確率g(w)が算出された単語wの個数である。
【0068】
【数7】

【数8】

【0069】
そして、通話分類部440は、例えば、算出したクレーム電話尤度Pおよび非クレーム電話尤度Qから、上述の式(5)を用いて、通話の苦情通話確率Sを算出する。
【0070】
すなわち、苦情通話確率Sは、通話全体において補正苦情確率g(w)が高いほど高くなる値である。したがって、苦情通話確率Sは、過去のクレーム電話により顕著な単語がより多く出現するほど高くなるものの、過去の出現回数が低い単語、およびスコアが低い単語については、その影響が抑えられる。
【0071】
そして、ステップS1800において、通話分類部440は、算出した苦情通話確率Sが閾値Sthを超えているか否かを判断する。閾値Sthは、クレーム電話と非クレーム電話とを分類する基準として、実験や経験測等によって予め設定された値であり、例えば、0.6である。あるいは、閾値Sthは、例えば上位10%の通話が含まれるような値としてもよい。通話分類部440は、苦情通話確率Sが閾値Sthを超えている場合は(S1800:YES)、ステップS1900へ進み、苦情通話確率Sが閾値Sth以下である場合は(S1800:NO)、ステップS2000へ進む。
【0072】
ステップS1900において、通話分類部440は、処理対象となっている通話をクレーム電話に分類する。より具体的には、通話分類部440は、例えば、処理対象となっている通話の音声認識結果を、クレーム電話に分類されたことを示す分類情報を付加した状態で、通話蓄積部430に格納する。そして、通話分類部440は、ステップS2100へ進む。
【0073】
一方、ステップS2000において、通話分類部440は、処理対象となっている通話を非クレーム電話に分類する。より具体的には、通話分類部440は、例えば、処理対象となっている通話の音声認識結果を、非クレーム電話に分類されたことを示す分類情報を付加した状態で、通話蓄積部430に格納する。そして、通話分類部440は、ステップS2100へ進む。
【0074】
ステップS2100において、通話分類部440は、ユーザ操作等によって通話の分類処理の終了が指示されたか否かを判断する。通話分類部440は、通話の分類処理の終了が指示されていない場合は(S2100:NO)、ステップS1000へ戻り、通話の分類処理の終了が指示された場合は(S2100:YES)、一連の処理を終了する。
【0075】
このような動作により、通話録音・分類装置400は、従来の単語毎の苦情確率を、過去の通話における出現回数に基づいて補正した値に基づいて、通話の分類を行うことができる。また、通話録音・分類装置400は、分類された通話を分類結果が分かる状態で蓄積し、後の通話の分類に役立てることができる。
【0076】
ここで、参考のために、スコアを考慮した苦情確率の補正を行った場合と行わない場合との分類結果を、数値の具体例を挙げて比較する。5つの単語w、w、w、w、wにより構成される通話が存在し、各単語の補正苦情確率が、f(w)=0.6、f(w)=0.5、f(w)=0.6、f(w)=0.4、f(w)=0.7であったとする。また、各単語のスコアは、Score(w)=1.0、Score(w)=1.0、Score(w)=0.8、Score(w)=1.0、Score(w)=0.4であったとする。すなわち、例えば、単語wは、補正苦情確率f(w)が高いものの、スコアScore(w)が低く、非クレーム単語がクレーム単語に誤認識された可能性が高い単語である。
【0077】
スコアを考慮しない場合、すなわち、補正苦情確率f(w)をそのまま用いた場合、苦情通話確率Sは、以下の式(9)〜(11)のように計算され、56.0%となる。
【0078】
【数9】

【数10】

【数11】

【0079】
一方、各単語の補正苦情確率は、g(w)=0.6、g(w)=0.5、g(w)=0.59、g(w)=0.4、g(w)=0.66となる。したがって、スコアを考慮した場合、すなわち、補正苦情確率g(w)を用いた場合、苦情通話確率Sは、上述の式(7)、(8)を用いて、以下の式(12)〜(14)のように計算され、55.5%となる。
【0080】
【数12】

【数13】

【数14】

【0081】
ここで、閾値Sth=0.558(55.8%)であったとする。この場合、通話は、スコアを考慮しない場合には、クレーム電話に分類されるが、スコアを考慮する本実施の形態の手法では、非クレーム電話に分類される。
【0082】
以上説明したように、本実施の形態に係るコールセンターシステム100は、過去の通話における出現回数が低い単語ほどその影響をより抑えた状態で、通話に含まれる各単語のクレーム時頻度および非クレーム時頻度に基づいて、通話を分類する。これにより、コールセンターシステム100は、過去の通話における出現回数が低い単語、つまり、クレーム単語であるか否かを断定するのが不適当な単語の出現によって、分類精度が低下するのを、防ぐことができる。
【0083】
また、本実施の形態に係るコールセンターシステム100は、音声認識処理におけるスコアが低い単語ほどその影響をより抑えた状態で、通話に含まれる各単語のクレーム時頻度および非クレーム時頻度に基づいて、通話の分類を行う。これにより、コールセンターシステム100は、通常の単語が別のクレーム単語に誤認識されたり、その逆の誤認識の発生によって分類精度が低下するのを、防ぐことができる。
【0084】
なお、通話録音・分類装置400は、定数s、定数x、定数sscore、閾値Sthの少なくとも1つに対するユーザ調整を受け付けることが望ましい。クレーム電話の定義は、通常、ユーザ毎および環境毎に異なる。定数s、定数x、定数sscore、閾値Sthを調整可能とすることにより、より多くのクレーム電話の定義において、高い精度の分類結果を得ることが可能となる。
【0085】
また、通話録音・分類装置400は、顧客の音声とオペレータの音声とで通話を分離してそれぞれをグループ化し、あるいは顧客毎およびオペレータ毎に通話を分離してそれぞれをグループ化し、グループ毎に通話の分類処理を行っても良い。顧客とオペレータでは、発する単語の傾向が異なる。また、同じ内容であっても、発する単語の傾向には個人差がある。したがって、このようにグループ毎に通話の分類処理を行うことにより、通話の分類精度を向上させることができる。
【0086】
(実施の形態2)
本発明の実施の形態2は、通話におけるクレーム単語の出現密度を考慮して通話の分類を行う例である。
【0087】
図4は、本実施の形態に係る通話録音・分類装置の構成を示すブロック図であり、実施の形態1の図2に対応するものである。図2と同一部分には同一符号を付し、これについての説明を省略する。なお、本実施の形態に係る通話録音・分類装置は、実施の形態1の図1に示すコールセンターシステム100に、実施の形態1に係る通話録音・分類装置400に置き換えて配置されるものとする。
【0088】
図4に示すように、本実施の形態に係る通話録音・分類装置400aは、実施の形態1の通話分類部440に代えて、これとは異なる動作を行う通話分類部440aを有する。
【0089】
通話分類部440aは、音声認識サーバ500から入力された音声認識結果に含まれる各単語wの補正苦情確率g(w)を算出する。ここまでは、実施の形態1の通話分類部440の処理と同様である。
【0090】
上述の通り、通話の分類の場合、クレーム電話であるにもかかわらず、通話が長いような場合には全体としてクレーム単語の出現頻度が低くなり、非クレーム電話に分類されるという事態が発生し得る。例えば、10分の通話で途中の1分間だけ顧客が苦情を訴えているクレーム電話は、非クレーム電話に誤分類される可能性が高い。
【0091】
そこで、本実施の形態の通話分類部440aは、補正苦情確率g(w)を、更に、クレーム単語の出現密度がより高い単語ほどより高い値となるように補正して、通話を分類する。より具体的には、通話分類部440aは、通話に対して短い時間幅の移動窓を設定し、移動窓によって囲まれた範囲(以下「分析範囲」という)毎に苦情通話確率Sを算出する。そして、通話分類部440aは、いずれかの分析範囲において苦情通話確率Sが高いとき、その通話をクレーム電話に分類する。上述の例では、苦情が訴えられている1分間を含む分析範囲の苦情通話確率Sは高くなるため、誤分類の可能性を低減することが可能となる。
【0092】
図5は、通話録音・分類装置400aの動作を示すフローチャートであり、実施の形態1の図3に対応するものである。図3と同一部分には同一ステップ番号を付し、これについての説明を省略する。
【0093】
通話分類部440aは、音声認識結果の全ての単語wの補正苦情確率g(w)を算出すると(S1600:YES)、ステップS1610aへ進む。
【0094】
ステップS1610aにおいて、通話分類部440aは、音声認識結果の前方から所定の間隔で単位長さの移動窓を設定し、例えば音声認識結果の前方から順に、移動窓によって囲まれた分析範囲を1つ選択する。
【0095】
図6は、分析範囲を説明するための図である。ここで、処理の対象となるj番目の分析範囲を記号rによって表す。図6に示すように、通話分類部440aは、通話全体の時間710に対して、同一の時間幅の分析範囲r、r、r、・・・を、一定の間隔720、720、・・・で設定する。隣り合う分析範囲rは、互いに重複していることが望ましい。すなわち、間隔720は、分析範囲rよりも短いことが望ましい。これにより、クレーム単語が頻出する区間があるにもかかわらず、その区間が分断されて苦情通話確率Sが大幅に低くなってしまう事態を、防ぐことができる。
【0096】
なお、分析範囲の幅は、時間幅、音声認識結果の文字数、発言単位の数等を基準として、設定することができる。分析範囲の幅は、大きいほど確率の精度が増し(ノイズに左右され難くなり)、小さいほど時間の精度が増す(時間分解能が高くなる)、というトレードオフの関係にあるため、用途に応じて最適な値に設定される必要がある。
【0097】
そして、図5のステップS1710aにおいて、通話分類部440aは、選択中の分析範囲rの苦情通話確率S(r)を算出する。すなわち、通話分類部440aは、選択中の分析範囲に含まれる全ての単語wの補正苦情確率g(w)から、例えば上述の式(7)、式(8)、式(5)を用いて、の分析範囲の苦情通話確率S(r)を算出する。
【0098】
そして、ステップS1720aにおいて、通話分類部440aは、苦情通話確率S(r)の算出処理が行われていない分析範囲rが残っている間は、ステップS1610aへ戻り、ステップS1610a、S1710aの処理を繰り返す(S1720a:NO)。そして、通話分類部440aは、音声認識結果の全ての分析範囲rについて苦情通話確率S(r)を算出すると(S1720a:YES)、ステップS1810aへ進む。
【0099】
そして、ステップS1810aにおいて、通話分類部440aは、算出した分析範囲r毎の苦情通話確率S(r)の最大値が、第1の閾値Sth1を超えているか否かを判断する。第1の閾値Sth1は、クレーム電話と非クレーム電話とを分類する基準として、実験や経験測等によって予め設定された値である。通話分類部440aは、苦情通話確率S(r)の最大値が第1の閾値Sth1を超えている場合は(S1810a:YES)、ステップS1900へ進み、苦情通話確率S(r)の最大値が第1の閾値Sth1以下である場合は(S1810a:NO)、ステップS1820aへ進む。
【0100】
ステップS1820aにおいて、通話分類部440aは、算出した分析範囲r毎の苦情通話確率S(r)の平均値が、第2の閾値Sth2を超えているか否かを判断する。第2の閾値Sth2は、クレーム電話と非クレーム電話とを分類する基準として、実験や経験測等によって予め設定された値である。通話分類部440aは、苦情通話確率S(r)の平均値が第2の閾値Sth2を超えている場合は(S1820a:YES)、ステップS1900へ進み、苦情通話確率S(r)の平均値が第2の閾値Sth2以下である場合は(S1820a:NO)、ステップS2000へ進む。
【0101】
通話分類部440aは、実施の形態1と同様に、ステップS1900に処理が進んだ場合には、処理の対象となっている通話をクレーム電話に分類し、ステップS2000に処理が進んだ場合には、処理の対象となっている通話を非クレーム電話に分類する。
【0102】
このような処理により、通話分類部440aは、クレーム単語の出現回数が低くても、ある分析範囲rにおける出現密度が特に高い場合には、その通話をクレーム電話に分類する。また、通話分類部440aは、クレーム単語の出現密度が高い分析範囲rが特に存在していなくても、通話全体での出現密度がある程度高い場合には、その通話をクレーム電話に分類する。
【0103】
また、通話分類部440aは、クレーム単語の出現回数が高くても、出現密度が特に高い分析範囲rが存在せず、かつ、通話全体での出現密度がある程度低い場合には、その通話を非クレーム電話に分類する。例えば、ごくたまにしかクレーム単語が出現していないにもかかわらず、通話時間が長いためにクレーム単語の総数が多くなってしまった非クレーム電話は、非クレーム電話に正しく分類されることになる。
【0104】
このように、本実施の形態に係る通話録音・分類装置400aは、通話におけるクレーム単語の出現密度が低いほどその影響をより抑えた状態で、通話を分類する。また、通話におけるクレーム単語の出現密度が高いほどその影響をより強めた状態で、通話を分類する。これにより、通話録音・分類装置400aは、クレーム単語の出現頻度が高いものの出現密度が低い通話や、クレーム単語の出現頻度が低いものの出現密度が高い通話を、より高い精度で分類することができる。
【0105】
なお、通話録音・分類装置400aは、ステップS1810aの条件またはステップS1820aの条件を満たす分析範囲の個数が一定の閾値を超えた通話のみを、クレーム電話に分類しても良い。また、通話録音・分類装置400aは、ステップS1810aの条件またはステップS1820aの条件を満たす分析範囲が連続する個数の最大値が一定の閾値を超えた通話のみを、クレーム電話に分類しても良い。
【0106】
また、以上説明した各実施の形態では、本発明を、コールセンターシステムにおいて顧客端末とオペレータ端末との間の通話をクレーム電話と非クレーム電話に分類する通話録音・分類装置に適用したが、分類種別および分類対象は、これに限定されない。例えば、本発明は、通話を、お礼を主目的とする電話とその他の電話とに分類する通話録音・分類装置に適用することができる。また、本発明は、店頭での顧客と店員との会話を、苦情の訴えを主目的とする会話とその他の会話とに分類する装置に適用することができる。
【0107】
また、各実施の形態では、苦情確率が、単語単位、つまり、ユニグラム(unigram)単位で行われる例について説明したが、文章分類装置は、苦情確率を、バイグラム(bigram)、トライグラム(trigram)等、N−gramの連続する単語列を単位として、算出しても良い。
【0108】
会話文の場合、上述の通り、単語をクレーム電話に顕著なものであるか否かを正しく区別することが困難な場合がある。したがって、文章分類装置は、N−gramの連続する単語列を単位として苦情確率を算出することにより、文章の分類精度を向上させることが可能となる。
【0109】
例えば、「連絡が無いんだけど。」という通話を想定する。「連絡が無い」というフレーズは、クレーム電話に顕著である。したがって、「連絡が無いんだけど。」という通話は、クレーム電話に分類されるべきものである。ところが、個々の単語のクレーム時頻度と非クレーム時頻度との間には大きな差が無いため、単語単位での苦情確率を用いる場合、通話がクレーム電話に分類される可能性は低くなる。この点、トライグラム単位での苦情確率を用いる場合には、「連絡が無い」の部分の苦情確率が高くなるため、通話がクレーム電話に分類される可能性を高くすることが可能となる。
【0110】
なお、文章分類装置は、単語単位での苦情確率と他のN−gramの連続する単語列を単位とする苦情確率との両方を用いて、文章の分類を行っても良い。この場合、文章分類装置は、例えば、単語単位での苦情確率に基づいて算出した苦情通話確率と、N−gramの連続する単語列を単位とする苦情確率に基づいて算出した苦情通話確率との平均値等を、閾値との比較対象となる苦情通話確率とすれば良い。
【0111】
また、苦情確率の算出の単位によらず、文章分類装置は、助詞や間投詞等、文脈に関係の無い単語を予め演算の対象から除外することが望ましい。これにより、意味のある単語に絞り込むことでができ、精度を向上させることが可能となる。
【産業上の利用可能性】
【0112】
本発明に係る文章分類装置および文章分類方法は、通話から得られた文章に対して高い精度で分類を行うことができる文章分類装置および文章分類方法として有用である。
【符号の説明】
【0113】
100 コールセンターシステム
200 顧客端末
300 オペレータ端末
400、400a 通話録音・分類装置
410 音声データ入力部
420 特徴抽出部
430 通話蓄積部
440、440a 通話分類部
450 操作受付部
460 情報出力部
500 音声認識サーバ
600 通信網


【特許請求の範囲】
【請求項1】
通話音声の音声データに対する音声認識結果である文章を第1の種別と第2の種別とに分類する文章分類装置であって、
前記文章を入力する入力手段と、
入力文章に含まれる語句の前記第1の種別の文章における出現頻度を、前記語句の前記第1の種別の文章における出現頻度と前記語句の前記第2の種別の文章における出現頻度との加算値で除した値から、前記入力文章が前記第1の種別であることの確からしさを示す確率値を求め、求めた前記確率値に基づいて前記入力文章を分類する分類手段と、を有し、
前記分類手段は、
前記値を、前記音声認識結果としての信頼度がより低い語句ほど前記確率値に与える影響がより抑えられるように補正する、
文章分類装置。
【請求項2】
前記分類手段は、
前記値を、前記語句の前記第1の種別の文章および前記第2の種別の文章での出現回数がより低い語句ほど前記確率値に与える影響がより抑えられるように補正する、
請求項1記載の文章分類装置。
【請求項3】
前記分類手段は、
前記値を、前記語句の前記入力文章における出現密度がより低い語句ほど前記確率値に与える影響がより抑えられるように補正する、
請求項1記載の文章分類装置。
【請求項4】
前記分類手段は、
前記入力文章に設定した移動窓によって囲まれた複数の分析範囲のそれぞれについて、前記分析範囲が前記第1の種別であることの確からしさを示す確率値を求め、求めた複数の前記確率値の最大値を、前記入力文章が前記第1の種別であることの確からしさを示す確率値とする、
請求項3記載の文章分類装置。
【請求項5】
前記語句は、単語である、
請求項1記載の文章分類装置。
【請求項6】
前記語句は、N−gramの連続する単語列である、
請求項1記載の文章分類装置。
【請求項7】
前記入力文章は、会話文であり、前記第1の種別は、苦情の訴えが主目的であると推定される会話の種別であり、前記第2の種別は、苦情の訴えが主目的ではないと推定される会話の種別である、
請求項1記載の文章分類装置。
【請求項8】
通話音声の音声データに対する音声認識結果である文章を第1の種別と第2の種別とに分類する文章分類方法であって、
前記文章を入力する工程と、
入力文章に含まれる語句の前記第1の種別の文章における出現頻度を、前記語句の前記第1の種別の文章における出現頻度と前記語句の前記第2の種別の文章における出現頻度との加算値で除した値を算出する工程と、
算出した前記値から、前記入力文章が前記第1の種別であることの確からしさを示す確率値を求め、求めた前記確率値に基づいて前記入力文章を分類する工程と、を有し、
前記分類工程において、前記値を、前記音声認識結果としての信頼度がより低い語句ほど前記確率値に与える影響がより抑えられるように補正する、
文章分類方法。


【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2011−123706(P2011−123706A)
【公開日】平成23年6月23日(2011.6.23)
【国際特許分類】
【出願番号】特願2009−281304(P2009−281304)
【出願日】平成21年12月11日(2009.12.11)
【出願人】(398018021)株式会社アドバンスト・メディア (23)
【Fターム(参考)】