説明

音声認識装置及び音声認識処理方法

【課題】 音声認識処理を行う場合に、優先度に応じて音声認識処理を行うことができる音声認識装置及び音声認識処理方法を提供することを目的とする。
【解決手段】 音声認識装置300は、音声データを外部から取得し、取得した音声データを一次出力データベース303へ記録し、一次出力データベース303に記録される音声データを、処理すべき優先度に応じた条件を記憶する優先度メモリ305に記憶される条件と比較し、条件に一致した音声データをその条件の優先度に応じて音声認識処理を行わせるとともに、その音声データに対する追加処理を音声認識処理部306に対して指示する。音声認識処理された音声認識結果は、格納処理部307によって音声認識結果データベース300Dへ優先度と関連付けされて格納される。

【発明の詳細な説明】
【技術分野】
【0001】
本発明の実施形態は、例えば、コールセンタシステムで用いられる音声認識装置の優先度付けによる処理に関する。
【背景技術】
【0002】
通信販売、製品やサービスのサポートデスク、又は資料請求等の対応を行うコールセンタシステムでは、ユーザとオペレータとの通話を録音し、録音された音声を音声認識装置によって音声認識を行ってテキスト化し、通話終了後に内容をテキストで確認することができるようになっている。このような音声認識を行うコールセンタシステムでは、録音された順番に音声認識処理を実施している。この音声認識処理は、コールセンタで同時に多数の通話が録音されることから通話と同時に処理されるような処理速度ではない。コールセンタで録音された1日分の録音データの音声認識処理は、例えば、録音された日の翌日、又は翌々日に完了する。すなわち、コールセンタシステムでの音声認識処理は、上記のように時間がかかり、通話内容をテキストで確認することができるまでに相当の時間を要していた。
【0003】
ところで、コールセンタにおける音声認識処理に関し、発信者がオペレータ端末と接続されるまでの間の発信者の音声を音声認識し、音声認識の結果、NGワードと一致した場合に待呼の順番を優先的に先頭に変更させるシステムが知られている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2008−219741号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、コールセンタにおける音声認識処理自体を優先的に行うことはできなく、すぐに通話内容をテキストで確認したい場合や先に音声認識処理を行うべき処理に応対することができない。
【0006】
そこで、目的は、音声認識処理を行う場合に、優先度に応じて音声認識処理を行うことができる音声認識装置及び音声認識処理方法を提供することにある。
【課題を解決するための手段】
【0007】
上記目的を達成するための音声認識装置は、音声データを外部から取得する音声取得手段と、前記音声データを、前記音声取得手段により記録される一次出力データベースと、処理すべき優先度に応じた条件及び前記条件での追加処理の情報を記憶する優先度メモリと、音声データを音声認識してテキスト化する音声認識処理手段と、前記一次出力データベースに記録される前記音声データを、前記優先度メモリに記憶される条件と比較し、前記条件に一致した音声データを前記条件の優先度に応じて前記音声認識処理手段へ出力するとともに、前記音声認識処理手段へ出力する音声データに対する追加処理を前記音声認識処理手段に対して指示する優先度制御手段と、前記音声認識処理手段により音声認識処理された音声認識結果を音声認識結果データベースへ格納する格納処理手段とを備えることを特徴とする。
【0008】
また、上記目的を達成するための音声認識処理方法は、 音声データを外部から取得する音声取得ステップと、前記音声データを、前記音声取得ステップにより一次出力データベースへ記録する一次記録ステップと、音声データを音声認識してテキスト化する音声認識処理ステップと、前記一次出力データベースに記録される前記音声データを、処理すべき優先度に応じた条件及び前記条件での追加処理の情報を記憶する優先度メモリに記憶される条件と比較し、前記追加処理を指示して前記条件に一致した音声データを前記条件の優先度に応じて音声認識処理を行わせる優先度制御ステップと、前記音声認識処理ステップにより音声認識処理された音声認識結果を音声認識結果データベースへ格納する格納処理ステップとを有することを特徴とする。
【図面の簡単な説明】
【0009】
【図1】本発明の一実施の形態に係るコールセンタシステムの構成を示すブロック図。
【図2】図1のコールセンタシステムに設けられる音声認識装置の構成を示すブロック図。
【図3】図2の音声認識装置が備える一次出力データベースに記録される音声データの管理情報の例を示す図。
【図4】図1の音声認識結果データベースに記録される音声認識結果の記録例を示す図。
【図5】図2の音声認識装置における優先度に応じた音声認識処理の動作を示すシーケンス図。
【発明を実施するための形態】
【0010】
以下、図面を参照しながら、本実施形態に係る音声認識装置及び音声認識処理方法を説明する。
【0011】
図1は、一実施の形態を示すコールセンタシステムの構成を示すブロック図である。このコールセンタシステムは、例えばIP化されたシステムであり、IP交換装置100、通話録音装置200、通話音声データベース200D、音声認識装置300、音声認識結果データベース300D、顧客データベース400D、及び、電話端末11、12(以下、電話端末10と総称する。)を有する。
【0012】
IP交換装置100は、IP網400及びLAN(ローカルエリアネットワーク)と接続され、IP網400からの発信を電話端末10へ着信させる。また、IP交換装置100は、電話端末10からの発信を発信先へ接続する。さらに、IP交換装置100は、電話端末10との通話の音声データを、LANを介して通話録音装置200へ送る。
【0013】
通話録音装置200は、LANを介してIP交換装置100からその通話の音声データを受け取り、受け取った音声データを通話音声データベース200Dへ記録する。また、通話録音装置200は、音声データ毎にオペレータの識別番号や発信番号等の管理情報を関連付けして通話音声データベース200Dへ記録する。この管理情報は、IP交換装置100から通話録音装置200へ音声データとともにオペレータの識別番号や発信番号を送られてくる。または、オペレータの識別番号、発信番号、後述する業務番号は、オペレータによるPC20の操作に基づき通話録音装置200に送られてもよい。なお、通話音声データベース200Dには、録音した順に音声データ及びその管理情報が記録される。
【0014】
音声認識装置300は、通話録音装置200によって通話音声データベース200Dに記録された音声データを取得するために、通話音声録音装置200に対して通話音声取得要求を行って音声データを取得する。また、音声認識装置300は、取得した音声データを音声認識してテキスト化し、音声認識結果データベース300Dへ記録する。
【0015】
顧客データベース400Dは、このコールセンタで応対する顧客の情報を記録する。後述するPC(パーソナルコンピュータ)20によって、顧客情報が読み出される。
【0016】
電話端末10は、IP交換装置100とLANを介して接続され、オペレータにより外部との通話に用いられる。なお、電話端末10は、LANに接続されるPC20と予め対応付けされてもよく、電話端末10とPCとが対応付けされている場合は、電話応対中のオペレータがPC20を操作することにより、顧客データベース400Dに記録された顧客情報を閲覧又は更新を行うことができる。このような、電話端末10、PC20、及び顧客データベース400Dの連携技術は、CTI(Computer Telephony Integration)と呼ばれる。
【0017】
なお、図1では電話端末10は2台のみ示したが、LANには多数の電話端末が接続される。
【0018】
図2は、音声認識装置300の構成を示す機能ブロック図である。音声認識装置300は、LANインタフェース(I/F)部301、音声取得処理部302、一次出力データベース303、優先度制御部304、優先度メモリ305、音声認識処理部306、格納処理部307、及び、登録処理部308を備える。
【0019】
音声取得処理部302は、例えば、定期的に通話録音装置200に対して通話音声取得要求を行い、この通話音声取得要求に応じて通話録音装置200から送られてくる音声データとこの音声データに関連付けされた管理情報をLANインタフェース部301から受け取って一次出力データベース303に書き込む。また、次に音声データを取得した場合は、一次出力データベース303内に未だ残っている音声データの管理情報の次に今回取得した音声データの管理情報を書き込む。すなわち、取得した順に音声データが並べられる。
【0020】
一次出力データベース303に書き込まれる情報は、通話音声データベース200Dに記録される情報と同様である。一次出力データベース303に記録される情報の例を図3に示す。図3には、音声データを識別するための「通話1」等の通話識別番号、発信番号、後述する業務番号、及び、オペレータの識別番号が記録される。例えば、「通話1」は、発信番号が030−1111−2222、業務番号が21、オペレータが佐藤さん(オペレータ識別番号が011452)であることが記録されている。「通話2」以降についても、同様に記録されている。
【0021】
優先度メモリ305は、優先すべき音声データに関する情報を記憶し、優先度制御部304によって優先度情報を参照される。なお、この優先すべき音声データに関する情報は、例えば、コールセンタでの応対業務内容を示す業務番号、重要顧客の発信番号、又は、新人オペレータの識別番号等である。ここで、業務番号とは、キャンペーンに関する通話、修理に関する通話、問合せに関する通話等、オペレータの応対業務内容に応じてあらかじめ割り振られた番号である。特定の業務番号を優先することは、特定のキャンペーンについての集計を行う際、集計タイミングが近づいている場合にそのキャンペーンに関する通話の音声データを先に音声認識を行う場合に有効である。また、重要顧客のニーズをいち早く生かすために重要顧客の発信番号を優先して音声認識したり、新人オペレータの教育のために特定のオペレータが応対した通話の音声を優先して音声認識したりすることが可能になる。
【0022】
また、優先度メモリ305には、優先すべき音声データに関する情報とともに、通常の音声認識処理であるテキスト化を行った後にそのテキストに対してどのような処理を行うかという追加処理の情報を関連付けされる。この追加処理は、例えば、怒りや喜び等の感情を分析する感情分析処理、特定のキーワードを抽出するキーワード抽出処理、頻発するキーワードやキーワードの組合せによって話題を特定する話題特定処理
優先度制御部304は、優先度メモリ305に記憶される優先すべき通話の音声データに関する管理情報と、一次出力データベース303に書き込まれた音声データの発信番号、業務番号、オペレータ識別番号等とを照合し、一次出力データベース303に書き込まれた音声データが優先すべき処理対象か否かを、一次出力データベース303に書き込まれた管理情報の順に判断する。また、優先度制御部304は、優先して処理すべき音声データと判断した音声データを、一次出力データベース303から読み出して順に音声認識処理部306へ出力する。優先して処理すべき音声データがなければ、優先して処理しなくてよい音声データを、一次出力データベース303に書き込まれた順に音声認識処理部306へ出力する。また、優先度制御部304は、一次出力データベース303から音声データを音声認識処理部306へ出力する場合に、優先度メモリ305に記憶される優先すべき処理対象の追加処理を音声認識処理部306に対して指示する。また、優先度制御部304は、一次出力データベース303から音声データを音声認識処理部306へ出力する場合に、出力した音声データの管理情報に優先度情報を付加して格納処理部307へ出力する。
【0023】
なお、優先度制御部304はタイマを備え、一定時間のみ優先して処理しなくてよい音声データを音声認識処理部306へ出力するようにしてもよい。この場合、優先度制御部304は、タイマがタイムアウトした場合に、タイムアウトを音声取得処理部302に通知し、音声取得処理部302は、このタイムアウトの通知を契機に通話録音装置200に対して通話音声取得要求を行うようにしてもよい。
【0024】
このように、タイマを用いて優先しなくてよい音声データを音声認識処理部306へ出力する処理を一定時間に限定し、タイムアウトした場合に次に録音された音声データを取得するようにすることで、優先して処理すべき音声データを優先して処理することができる。タイマがない場合は、一次出力データベース303に優先して処理すべき音声データが無くなるまで、優先しなくてよい音声データの音声認識処理を行うことができないが、このタイマを用い音声データの取得と連動させることで、優先しなくてよい音声データについての音声認識処理を少しずつ(優先度を下げて)行うことができる。
【0025】
音声認識処理部306は、内部にバッファを備え、優先度制御部304によりそのバッファに音声データが書き込まれる。音声認識処理部306は、そのバッファに書き込まれた音声データを書き込まれた順に音声認識処理を行い、音声認識した結果としてテキストデータを格納処理部307に出力する。このとき、追加処理の指定がある処理であれば、キーワード抽出処理等の追加処理を行い、追加処理の結果も格納処理部307に出力する。
【0026】
格納処理部307は、音声認識処理部306から受け取った音声認識結果であるテキストデータ及び追加処理の結果を、優先度制御部304から送られてくる優先度情報が付加された管理情報と照合し、テキストデータ及び追加処理の結果を、顧客情報(発信番号や顧客ID)、業務番号、オペレータの情報、優先度、追加処理内容等と関連付けて音声認識結果データベース300Dへ記録する。また、例えば、優先して処理されたものとそうでないものとを別フォルダで管理するようにしてもよい。音声認識結果データベース300Dの音声認識結果の記録の例は、図4に示される。この例では、通話1は、優先すべき処理対象であり、追加処理内容は話題抽出である。また、基本の音声認識結果は、「修理をお願いしたいのですが…」というテキストであり、追加処理結果(ここでは話題特定処理の結果)は、「修理」である。
【0027】
このように、分類したり優先か否かをユーザが識別可能にしたりして音声認識結果データベース300Dへ記録することで、音声データをテキストで確認したい場合に優先して確認すべきものがわかりやすくなる。
【0028】
登録処理部308は、LANインタフェース部301から入力される優先度情報の登録要求に応じて、優先度情報を優先度メモリ305に記憶する。例えば、オペレータがPC20を操作して音声認識装置300に対して優先度情報の登録要求を行う。このとき、顧客に応じた優先度情報の登録要求を行う場合は、PC20から顧客データベース400Dを参照して、顧客の情報を閲覧する。
【0029】
図5は、音声認識装置における優先度に応じた音声認識処理の動作を示すシーケンス図である。
【0030】
まず、音声取得処理部302は、通話録音装置200に対して通話音声要求通知を出力して音声データとその管理情報とをLANインタフェース301から受け取り(S1)、一次出力データベース303に書き込む(S2)。優先度制御部304は、一次出力データベース303に書き込まれた音声データの管理情報と優先度メモリ305とを照合して、優先すべき処理対象が有るか否かを判断する(S3)。優先すべき処理対象がある場合(ステップS3でYes)は、一次出力データベース303に記憶される管理情報の順に優先度を判定し(S4)、判定の結果、優先すべき処理対象であれば(ステップS4で優先)優先すべき音声データを音声認識処理部306へ出力する(S5)。このとき、優先度制御部304は、その音声データの管理情報を格納処理部307へ出力する。また、優先度制御部304は、その音声データに対して行う追加処理を音声認識処理部306に対して指定する。その後、優先すべき処理対象の有無の判断を行う(S3)。また、優先度判定の結果、優先すべき処理対象でなければ(ステップS4で非優先)その音声データを一次出力DBから取り出さず、次の音声データの優先度判断を続ける(S6)。
【0031】
ステップS3で優先すべき処理対象が無い場合(ステップS3でNo)は、優先でない音声データを一次出力データベース303から取り出して音声認識処理部306へ出力する。このとき、優先度制御部304は、その音声データの管理情報を格納処理部307へ出力する。その後、タイマがタイムアウトしたか否かを判断し(S8)、タイムアウトしていなければ(ステップS8でNo)ステップS7の優先でない音声データを音声認識処理部306へ出力する処理を継続し、タイムアウトした場合(ステップS8でYes)は、ステップS1へ戻り音声データを通話録音装置200から取得する。
【0032】
以上のように、音声認識装置に音声認識処理を優先して行うべき条件を予め記憶しておき、その条件と一致した音声データを音声認識処理することで、音声認識処理を優先度に応じて処理することができる。また、音声認識結果を、優先か否かをユーザが識別可能にして音声認識結果データベース300Dへ記録することで、テキストを確認する場合に、優先のものを纏めて確認することができる。
【0033】
また、音声認識処理行う際に、基本の音声認識処理である音声データのテキスト化だけでなく、音声データに応じて追加の音声認識処理を行うようにすることで、音声認識処理を通話毎に最適化することが可能となり、処理効率が向上する。すなわち、追加サービスを全ての音声データに適用すると音声認識処理の負荷上昇が見込まれるが、追加サービスの適用対象を優先度に応じて限定することで全ての音声データに対して処理を追加する必要がなくなり、処理効率が上昇する。
【0034】
本発明は、以上の構成に限定されるものではなく、種々の変形が可能である。例えば、上記実施形態では、音声認識装置300が備える優先度制御部304は、一次出力データベース303に記録されている音声データの優先度を判断した後に一次出力データベース303から音声データを取り出して音声認識処理部306へ出力したが、優先度制御部304は、内部にメモリを備えて、一次出力データベースから音声データの管理情報(または管理情報と音声データと)を取得し、非優先と判断された音声データについては、その管理情報(または管理情報と音声データと)を一次出力データベースへ戻すようにしてもよい。また、優先度制御部304は、一次出力データベース303に記録されている音声データの優先度を判断した後に優先すべき処理を音声認識処理部306へ出力する場合、その時点では一次出力データベース303からその処理対象の音声データを削除せずに処理済のステータスを付加し、後に纏めて削除するようにしてもよい。さらに、上記実施形態では、優先度を、優先または非優先としたが、優先の度合いによって3つ以上の段階に分けて、優先度の高いものから処理するようにしてもよい。
【0035】
なお、本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
【符号の説明】
【0036】
10,11,12…電話端末、20…PC、100…IP交換装置、200…通話録音装置、200D…通話音声データベース、300…音声認識装置、300D…音声認識結果データベース、301…LANインタフェース部、302…音声取得処理部、303…一次出力データベース、304…優先度制御部。305…優先度メモリ、306…音声認識処理部、307…格納処理部、308…登録処理部、400…IP網。

【特許請求の範囲】
【請求項1】
音声データを外部から取得する音声取得手段と、
前記音声データを、前記音声取得手段により記録される一次出力データベースと、
処理すべき優先度に応じた条件及び前記条件での追加処理の情報を記憶する優先度メモリと、
音声データを音声認識してテキスト化する音声認識処理手段と、
前記一次出力データベースに記録される前記音声データを、前記優先度メモリに記憶される条件と比較し、前記条件に一致した音声データを前記条件の優先度に応じて前記音声認識処理手段へ出力するとともに、前記音声認識処理手段へ出力する音声データに対する追加処理を前記音声認識処理手段に対して指示する優先度制御手段と、
前記音声認識処理手段により音声認識処理された音声認識結果を音声認識結果データベースへ格納する格納処理手段と
を備えることを特徴とする音声認識装置。
【請求項2】
前記追加処理は、前記音声データのテキスト化の処理の後に行う、感情分析処理、キーワード抽出処理、又は話題特定処理の少なくとも何れか1つを含む処理であることを特徴とする請求項1に記載の音声認識装置。
【請求項3】
前記格納処理手段は、前記音声認識処理手段により音声認識処理された音声認識結果を前記音声認識結果データベースへ格納する場合に、前記優先度及び前記追加処理と関連付けて前記音声認識結果データベースへ格納することを特徴とする請求項1又は請求項2に記載の音声認識装置。
【請求項4】
音声データを外部から取得する音声取得ステップと、
前記音声データを、前記音声取得ステップにより一次出力データベースへ記録する一次記録ステップと、
音声データを音声認識してテキスト化する音声認識処理ステップと、
前記一次出力データベースに記録される前記音声データを、処理すべき優先度に応じた条件及び前記条件での追加処理の情報を記憶する優先度メモリに記憶される条件と比較し、前記追加処理を指示して前記条件に一致した音声データを前記条件の優先度に応じて音声認識処理を行わせる優先度制御ステップと、
前記音声認識処理ステップにより音声認識処理された音声認識結果を音声認識結果データベースへ格納する格納処理ステップと
を有することを特徴とする音声認識処理方法。
【請求項5】
前記追加処理は、前記音声データのテキスト化の処理の後に行う、感情分析処理、キーワード抽出処理、又は話題特定処理の少なくとも何れか1つを含む処理であることを特徴とする請求項4に記載の音声認識装置。
【請求項6】
前記格納処理手段は、前記音声認識処理手段により音声認識処理された音声認識結果を前記音声認識結果データベースへ格納する場合に、前記優先度及び前記追加処理と関連付けて前記音声認識結果データベースへ格納することを特徴とする請求項4又は請求項5に記載の音声認識処理方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate


【公開番号】特開2012−203066(P2012−203066A)
【公開日】平成24年10月22日(2012.10.22)
【国際特許分類】
【出願番号】特願2011−65279(P2011−65279)
【出願日】平成23年3月24日(2011.3.24)
【出願人】(000003078)株式会社東芝 (54,554)
【Fターム(参考)】