説明

音声制御システム、音声制御装置、音声制御方法および音声制御プログラム

【課題】ユーザの通話を監視して感情的な音声や危険語句をオペレータに伝達する前にマスキングなどにより一律に変換処理を行なうため、オペレータに判断を委ねることなく通話内容を制御すること。
【解決手段】ユーザ端末とオペレータ端末との通話を公衆電話網を介して確立させる電話交換手段と、電話交換手段により確立された通話をモニタしてユーザ端末とオペレータ端末との通話内容を音声情報として取得する通話モニタ手段と、通話モニタ手段により取得された音声情報中に認識されるユーザ端末の音声から、あらかじめ定められた特定の感情を表わす感情的音声または否定的な語彙を含む特定語彙の音声のうちいずれかの不穏当音声を検出する不穏当音声検出手段と、不穏当音声検出手段により検出された不穏当音声を制御した制御音声を生成する音声生成手段と、を備えることを特徴とする。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声制御技術に関する。
【背景技術】
【0002】
上記技術分野において、特許文献1に示されているように、音声の感情部分の音量およびピッチ変動量を算出して、所定内に収まるように音量およびピッチ変動量を変換する技術が知られている。
【0003】
また、特許文献2に示されているように、発話音声データから危険語句を検出すると、対応モードに応じて危険語句の音量を下げるなどの変換処理を行なう技術が知られている。さらに、発話音声データの音声ピッチの変動量が所定の変動量に達する回数が所定の回数以上である場合に、ユーザが感情的に発話しているものとして通話受付を他のオペレータに切り換える技術が知られている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2004-252085号公報
【特許文献2】特開2009-159558号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、上記特許文献1に記載の技術では、音声の感情部分の音量およびピッチ変動量を変換するに過ぎず、音声を他の音声に代替したりマスキングしたりすることはできなかった。
【0006】
また、上記特許文献2に記載の技術では、危険語句を検出して音量を下げるなどの変換処理を行なうとしてもあらかじめ設定された内容で処理されるため、オペレータのストレスを軽減することに必ずしも効果的ではなかった。また、音声ピッチの変動の検出によりユーザが感情的に発話しているものと判定しても、通話を続行するか否かオペレータに判断させるため、感情的な発話をオペレータに伝達することを回避できなかった。
【0007】
本発明の目的は、上述の課題を解決する技術を提供することにある。
【課題を解決するための手段】
【0008】
上記目的を達成するため、本発明に係るシステムは、
ユーザ端末とオペレータ端末との通話を公衆電話網を介して確立させる電話交換手段と、
前記電話交換手段により確立された前記通話をモニタして前記ユーザ端末と前記オペレータ端末との通話内容を音声情報として取得する通話モニタ手段と、
前記通話モニタ手段により取得された前記音声情報中に認識される前記ユーザ端末の音声から、あらかじめ定められた特定の感情を表わす感情的音声または否定的な語彙を含む特定語彙の音声のうちいずれかの不穏当音声を検出する不穏当音声検出手段と、
前記不穏当音声検出手段により検出された前記不穏当音声を制御した制御音声を生成する音声生成手段と、
を備えることを特徴とする。
【0009】
上記目的を達成するため、本発明に係る装置は、
ユーザ端末とオペレータ端末との通話を公衆電話網を介して確立させる電話交換手段により確立された前記通話をモニタして前記ユーザ端末と前記オペレータ端末との通話内容を音声情報として取得する通話モニタ手段と、
前記通話モニタ手段により取得された前記音声情報から認識される前記ユーザ端末の音声から、あらかじめ定められた特定の感情を表わす感情的音声または否定的な語彙を含む特定語彙の音声のうちいずれかの不穏当音声を検出する不穏当音声検出手段と、
前記不穏当音声検出手段により検出された前記不穏当音声を制御した制御音声を生成する音声生成手段と、
を備えることを特徴とする。
【0010】
上記目的を達成するため、本発明に係る方法は、
ユーザ端末とオペレータ端末との通話を公衆電話網を介して確立させる電話交換手段により確立された前記通話をモニタして前記ユーザ端末と前記オペレータ端末との通話内容を音声情報として取得する通話モニタステップと、
前記通話モニタステップにより取得された前記音声情報から認識される前記ユーザ端末の音声から、あらかじめ定められた特定の感情を表わす感情的音声または否定的な語彙を含む特定語彙の音声のうちいずれかの不穏当音声を検出する不穏当音声検出ステップと、
前記不穏当音声検出ステップにより検出された前記不穏当音声を制御した制御音声を生成する音声生成ステップと、
を備えることを特徴とする。
【0011】
上記目的を達成するため、本発明に係るプログラムは、
ユーザ端末とオペレータ端末との通話を公衆電話網を介して確立させる電話交換手段により確立された前記通話をモニタして前記ユーザ端末と前記オペレータ端末との通話内容を音声情報として取得する通話モニタステップと、
前記通話モニタステップにより取得された前記音声情報から認識される前記ユーザ端末の音声から、あらかじめ定められた特定の感情を表わす感情的音声または否定的な語彙を含む特定語彙の音声のいずれかの不穏当音声を検出する不穏当音声検出ステップと、
前記不穏当音声検出ステップにより検出された前記不穏当音声を制御した制御音声を生成する音声生成ステップと、
をコンピュータに実行させることを特徴とする。
【発明の効果】
【0012】
本発明によれば、ユーザの通話を監視して感情的な音声や危険語句をオペレータに伝達する前にマスキングなどにより一律に変換処理を行なうため、オペレータにストレスを感じさせることなく通話内容を制御可能である。
【図面の簡単な説明】
【0013】
【図1】本発明の第1実施形態に係る音声制御システムの構成を示すブロック図である。
【図2】本発明の第2実施形態に係る音声制御システムの構成を示すブロック図である。
【図3】本発明の第2実施形態に係る音声制御システムの動作手順を示すシーケンス図である。
【図4】本発明の第2実施形態に係る音声制御システムの処理手順を示すフローチャートである。
【図5】本発明の第2実施形態に係る不穏当音声検出部のハードウェア構成を示す図である。
【図6】本発明の第3実施形態に係る音声制御システムの構成を示すブロック図である。
【図7】本発明の第4実施形態に係る音声制御システムの構成を示すブロック図である。
【図8】本発明の第5実施形態に係る音声制御システムの構成を示すブロック図である。
【発明を実施するための形態】
【0014】
以下に、本発明を実施するための形態について、図面を参照して、例示的に詳しく説明記載する。ただし、以下の実施の形態に記載されている、構成、数値、処理の流れ、機能要素などは一例に過ぎず、その変形や変更は自由であって、本発明の技術範囲を以下の記載に限定する趣旨のものではない。
【0015】
[第1実施形態]
本発明の第1実施形態としての音声制御システム100について、図1を用いて説明する。音声制御システム100は、ユーザ端末111とオペレータ端末112との通話を制御する。
【0016】
図1に示すように、音声制御システム100は、電話交換機101と、通話モニタ部102と、不穏当音声検出部103と、音声生成部104とを含む。また、音声制御システム100は、ユーザ端末111と、オペレータ端末112と、公衆電話網120とを含む。
【0017】
電話交換機101は、ユーザ端末111と、オペレータ端末112との通話を確立させる。通話モニタ部102は、電話交換機101により確立された通話をモニタしてユーザ端末111とオペレータ端末112との通話内容を音声情報として取得する。
【0018】
不穏当音声検出部103は、通話モニタ部102により取得された音声情報中に認識されるユーザ端末111の音声から、あらかじめ定められた特定の感情を表わす感情的音声または否定的な語彙を含む特定語彙の音声のうちいずれかの不穏当音声を検出する。
【0019】
音声生成部104は、不穏当音声検出部103により検出された不穏当音声を制御した制御音声を生成する。
【0020】
以上の構成および動作により、本実施形態における音声制御システムはユーザの通話を監視して感情的な音声や危険語句をオペレータに伝達する前にマスキングなどにより一律に変換処理を行なうため、オペレータにストレスを感じさせることなく通話内容を制御可能である。
【0021】
[第2実施形態]
次に本発明の第2実施形態に係る音声制御システム200について、図2を用いて説明する。図2は、本実施形態に係る音声制御システム200の概略構成を示す図である。
【0022】
図2に示すように、音声制御システム200は、電話交換機201と、通話モニタ部202と、不穏当音声検出部203と、ユーザ端末211と、オペレータ端末212と、公衆電話網220とを含む。電話交換機201は、音声生成部204と、バッファリング部210とを有する。不穏当音声検出部203は、感情判定部205と、感情制御指示部206と、語彙判定部207と、語彙制御指示部208と、特定語彙記憶部209とを有する。なお、本実施形態において特定語彙記憶部209は、不穏当音声検出部203の外部に設置された構成であるが、不穏当音声検出部203の内部に含まれる構成であってもよい。
【0023】
ユーザ端末211は、公衆電話網220を介して電話交換機201に接続される。通話モニタ部202は電話交換機201から、ユーザ端末211より発信された音声を取得して記憶部(不図示)に記憶する。通話モニタ部202は、取得した音声を不穏当音声検出部203の感情判定部205と語彙判定部207とに伝達する。
【0024】
感情判定部205は、通話モニタ部202より伝達されたユーザ端末の音声(通話内容)から認識される音声中に、特定の感情を表わす感情的音声(不穏当音声)が含まれるか否か判定する。特定の感情とは、気持ちが高揚した状態であって、主に話者の怒りの感情を伴う状態である。感情的音声とは、主に話者が怒りの感情を伴う状態で発せられる音声であり、たとえば怒鳴り声や平常の会話時の音量と比べて大きな音量など、一定の音量以上の音声である。
【0025】
感情判定部205は、ユーザ端末211の音声(通話内容)から認識される音声中に、感情的音声(不穏当音声)が含まれると判定した場合には、感情制御指示部206に判定結果を通知する。感情制御指示部206は、感情判定部205より通知された感情的音声をオペレータ端末212に直接伝達しないように制御する指示を行なう。感情的音声の制御方法は、たとえば、感情的音声の音量をあらかじめ定められた音量以下に下げたり、感情的音声を他の音で打ち消したり(マスキング)、他の音声で代替するなどの処理により行なう。なお、音量を下げることには、無音にすることも含まれる。
【0026】
語彙判定部207は、通話モニタ部202より伝達されたユーザ端末211の音声(通話内容)に特定語彙(不穏当音声)が含まれるか否か判定する。特定語彙とは、オペレータが聴取した際に不快に感じる語彙であり、例えば相手を誹謗中傷する言葉や脅迫的な言葉など、否定的な意味の言葉を含む語彙である。
【0027】
特定語彙は特定語彙記憶部209にあらかじめ格納されている。また、特定語彙は本実施形態が利用されるコールセンタの業種や、コールセンタが対象とする商品またはサービスに応じて、ユーザ端末211の音声に含まれる特定語彙を抽出して適宜追加され、更新される。特定語彙記憶部209は、特定語彙として不穏当音声を格納するだけでなく、コールセンタが対応する特定分野の業務において多用される専門用語やコールセンタの業務において一般的に使用される語彙(一般語彙)を記憶してもよい。語彙判定部207は、ユーザ端末211の音声中に、特定語彙記憶部209に格納された専門用語や一般語彙以外の語彙が含まれると判定すると、この判定した語彙を特定語彙に該当するものとして語彙制御指示部208に伝達してもよい。
【0028】
語彙判定部207は、ユーザ端末211からの音声(通話内容)に特定語彙記憶部209に記憶されている特定語彙が含まれると判定した場合には、判定結果を語彙制御指示部208に通知する。語彙制御指示部208は、語彙判定部207より通知された特定語彙をオペレータ端末212に直接伝達しないように制御する指示を行なう。特定語彙の制御方法は、たとえば、特定語彙を含む音声を消去したり(ミュート)、特定語彙の音声を他の音で打ち消したり(マスキング)、または特定語彙を他の語彙に代替したりするなどの処理により行なう。
【0029】
電話交換機201に含まれる音声生成部204は、感情制御指示部206および/または語彙制御指示部208による指示に基づいてユーザ端末211からの感情的音声および/または特定語彙(不穏当音声)を制御した制御音声を生成する。
【0030】
はじめに、感情制御指示部206による感情的音声の制御指示に対応した、制御音声の生成について説明する。音声生成部204は、感情的音声の音量をあらかじめ定められた音量以下に下げるか、無音にする。これにより、オペレータ端末212で対応するオペレータが不快に感じない音量として聴取することができる。また、音声生成部204は、感情的音声を他の音で打ち消す(マスキングする)。これにより、ユーザ端末211からの感情的音声は、オペレータ端末212において他の音に打ち消されるか、聴取しがたい音声として伝えられるため、感情的音声を聴取されることはなく、オペレータが不快に感じることはない。さらに、音声生成部204は、感情的音声を他の音声で代替する。これにより、ユーザ端末211からの感情的音声は、オペレータ端末212に直接伝達されることはなく、オペレータの不快感を減殺することができる。
【0031】
次に、語彙制御指示部208による特定語彙の制御指示に対応した、制御音声の生成について説明する。音声生成部204は、ユーザ端末211からの特定語彙の音声を消去する。また、音声生成部204は、特定語彙の音声を他の音で打ち消す(マスキング)。これにより、オペレータ端末212で対応するオペレータが不快に感じる音声を伝達することを回避できる。さらに、音声生成部204は、特定語彙の音声を他の語彙に代替する。これにより、対応するオペレータが不快に感じることを回避できる。
【0032】
たとえば、ユーザ端末211からの音声に「〜をしろ。」、「〜をやれ。」のような命令調の音声が含まれる場合には、音声生成部204は、「〜をして下さい。」のように丁寧調に変換した音声を生成する。
【0033】
音声生成部204は、代替音声や打ち消し音を記憶する記憶部(不図示)を有する。そして、記憶部に記憶された代替音声や打ち消し音は適宜更新される。
【0034】
バッファリング部210は、音声生成部204において、感情制御指示部206および/または語彙制御指示部208による指示に基づいて音声が生成される際に、ユーザ端末211とオペレータ端末212との会話に支障が生じないように音声情報を一時保存する。バッファリング部210は、このバッファリングを通話内容の解析が十分可能な時間内で行なう。
【0035】
電話交換機201は、音声生成部204において生成された音声(通話内容)を、ユーザ端末211からの音声としてオペレータ端末212に伝達する。以上の一連の動作により、ユーザ端末211とオペレータ端末212との通話が成立する。
【0036】
図3は、本実施形態における電話交換機201と、通話モニタ部202と、不穏当音声検出部203(感情判定部205、感情制御指示部206、語彙判定部207、語彙制御指示部208)との動作手順を示すシーケンス図である。
【0037】
ステップS301において、電話交換機201は、公衆電話網220より受信したユーザ端末211からの音声情報を通話モニタ部202に伝達する。ステップS303において、通話モニタ部202は、電話交換機201から伝達された音声情報を不穏当音声検出部203の感情判定部205と、語彙判定部207とに伝達する。ステップS305において、感情判定部205は、ユーザ端末211からの音声中に感情的音声が含まれていると判定すると、感情制御指示部206に判定結果を通知する。ステップS307において、感情制御指示部206は、感情的音声に対応する最適な音声制御指示を決定する。ステップS309において、感情制御指示部206は、決定した感情的音声の制御指示を音声生成部204に送信する。
【0038】
ステップS311において、語彙判定部207は、特定語彙記憶部209に記憶された特定語彙に該当する語彙がユーザ端末211からの音声中に含まれていると判定すると、語彙制御指示部208に判定結果を通知する。ステップS313において、語彙制御指示部208は、特定語彙に対応する最適な音声制御指示を決定する。ステップS315において、語彙制御指示部208は、決定した特定語彙の制御指示を音声生成部204に送信する。
【0039】
ステップS317において、電話交換機201の音声生成部204は、感情制御指示部206および/または語彙制御指示部208からの制御指示を受け付けると、制御指示にしたがった制御音声を生成する。ステップS319において、電話交換機201のバッファリング部210は、音声生成部204において生成された音声がオペレータ端末212に伝達されるまで、ユーザ端末211とオペレータ端末212との会話に支障が生じないように音声情報を一時保存する。ステップS321において、電話交換機201は、音声生成部204において生成された音声をオペレータ端末212に送信する。
【0040】
図4は、本実施形態における音声制御システム200の処理手順を示すフローチャートである。
【0041】
ステップS401において、電話交換機201は、ユーザ端末211から音声情報を受け付ける。ステップS403において、通話モニタ部202は、電話交換機201において受け付けられたユーザ端末211からの音声情報を取得する。ステップS405において、通話モニタ部202は、電話交換機201から取得した音声を不穏当音声検出部203の感情判定部205と語彙判定部207とに伝達する。
【0042】
ステップS407において、感情判定部205は、音声に感情的音声が含まれるか否かの判定を行なう。感情的音声が含まれないと判定した場合には、ステップS403の処理に戻る。一方、感情的音声が含まれると判定した場合には、ステップS411の処理に進む。また、ステップS409において、語彙判定部207は音声情報中に特定語彙が含まれるか否かの判定を行ない、特定語彙が含まれると判定した場合には、ステップS411の処理に進む。
【0043】
ステップS411において、感情制御指示部206は、感情判定部205において判定された感情的音声を制御するのに最適な手段を選択して、音声生成部204に制御指示を送信する。また、語彙制御指示部208は、語彙判定部207において判定された特定語彙を制御するのに最適な手段を選択して、音声生成部204に制御指示を送信する。ステップS413において、音声生成部204は、受け付けた感情的音声の制御指示および/または特定語彙の制御指示に基づいて、音声情報を制御して音声を生成する。ステップS415において、電話交換機201は、音声生成部204において生成された音声をオペレータ端末212に送信する。
【0044】
不穏当音声検出部203の内部構成について、図5を用いて説明する。不穏当音声検出部203は、CPU510、ROM520、通信制御部530、RAM540、およびストレージ550を備えている。CPU510は中央処理部であって、様々なプログラムを実行することにより不穏当音声検出部203全体を制御する。ROM520は、リードオンリメモリであり、CPU510が最初に実行すべきブートプログラムの他、各種パラメータ等を記憶している。また、RAM540は、ランダムアクセスメモリである。RAM540は、伝達された音声情報541と、感情的音声542と、特定語彙543と、感情制御指示544と、語彙制御指示545とを有する。
【0045】
一方、ストレージ550は、感情的音声判定プログラム551と、特定語彙判定プログラム552と、感情制御指示プログラム553と、語彙制御指示プログラム554とを有する。また、通信制御部530は、他の端末とのネットワークを介した通信を制御する。
【0046】
伝達された音声情報541は、通話モニタ部202から不穏当音声検出203に伝達された、ユーザ端末211からの音声である。感情的音声542は、感情判定部205に伝達されたユーザ端末211からの音声に含まれた感情的音声である。特定語彙543は、語彙判定部207に伝達されたユーザ端末211からの音声に含まれる特定語彙である。
【0047】
感情制御指示544は、感情判定部205において感情的音声と判定された音声を制御するために、感情制御指示部206において選択された最適な制御指示である。語彙制御指示545は、語彙判定部207において特定語彙と判定された音声を制御するために、語彙制御指示部208において選択された最適な制御指示である。
【0048】
感情的音声判定プログラム551は、ユーザ端末211からの音声中に感情的音声が含まれるか否かの判定を行なう。感情的音声であるか否かの判定は、音量があらかじめ定められた音量以上に達するか否か、またはユーザ端末211からの音声の話速があらかじめ定められたピッチ以上に達するか否かにより判定する。
【0049】
特定語彙判定プログラム552は、ユーザ端末211からの音声情報中に特定語彙が含まれるか否かの判定を行なう。特定語彙であるか否かの判定は、特定語彙記憶部209にあらかじめ記憶された特定語彙に該当するか否かにより判定する。
【0050】
感情制御指示プログラム553は、感情的音声判定プログラム551により感情的音声であると判定された音声を制御するために最適な制御指示として、音量の消去や他の音声で代替を選択する。
【0051】
語彙制御指示プログラム554は、特定語彙判定プログラム552により特定語彙であると判定された音声を制御するために最適な制御指示として、音量の消去や他の音で特定語彙のマスキングを選択する。
【0052】
以上の構成および動作により、本実施形態における音声制御システムは、ユーザの通話を監視して感情的音声や特定語彙をオペレータに伝達する前に一律に変換処理を行うため、通話内容に何ら影響を生じさせることなく通話内容を制御することが可能である。
【0053】
[第3実施形態]
次に本発明の第3実施形態に係る600について、図6を用いて説明する。図6は、本実施形態に係る音声制御システム600の構成を説明するための図である。本実施形態に係る音声制御システム600は、上記第2実施形態と比べると、音声生成部604が独立した構成である点で異なる。その他の構成および動作は、第2実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
【0054】
音声生成部604は、感情制御指示部206および語彙制御指示部208からの制御指示に基づいてユーザ端末211の音声を制御するための制御音声を生成する。音声生成部604は、生成した音声を電話交換機601に送信すると、バッファリング部210を介してオペレータ端末212に伝達される。
【0055】
以上の構成および動作により、本実施形態における音声制御システムは、ユーザの通話を監視して感情的音声や特定語彙をオペレータに伝達する前に一律に変換処理を行うため、通話内容に何ら影響を生じさせることなく通話内容を制御することが可能である。
[第4実施形態]
次に本発明の第4実施形態に係る700について、図7を用いて説明する。図7は、本実施形態に係る音声制御システム700の構成を説明するための図である。本実施形態に係る音声制御システム700は、上記第2実施形態と比べると、不穏当音声検出部703に音声生成部704を有する点で異なる。その他の構成および動作は、第2実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
【0056】
不穏当音声検出部703の感情制御指示部206および語彙制御指示部208は、制御指示を音声生成部704に伝達する。音声生成部704は、各制御指示に基づいてユーザ端末211の音声を制御するための制御音声を生成する。音声生成部704は、生成した音声を電話交換機701に送信する。バッファリング部210は、音声生成部704から生成された音声が電話交換機701に送信されるまで、ユーザ端末211とオペレータ端末212との会話に支障が生じないように音声情報を一時保存する。
【0057】
以上の構成および動作により、本実施形態における音声制御システムは、ユーザの通話を監視して感情的音声や特定語彙をオペレータに伝達する前に一律に変換処理を行うため、通話内容に何ら影響を生じさせることなく通話内容を制御することが可能である。
【0058】
[第5実施形態]
次に本発明の第5実施形態に係る800について、図8を用いて説明する。図8は、本実施形態に係る音声制御システム800の構成を説明するための図である。本実施形態に係る音声制御システム800は、上記第2実施形態と比べると、通話モニタ部202を有さず、電話交換機201から不穏当音声検出部803にユーザ端末211の音声が直接伝達される点で異なる。その他の構成および動作は、第2実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
【0059】
不穏当音声検出部803は、電話交換機201からユーザ端末211の音声情報を直接取得する。不穏当音声検出部803は、取得した音声情報を記憶する記憶部(不図示)を有してもよい。
【0060】
以上の構成および動作により、本実施形態における音声制御システムは、ユーザの通話を監視して感情的音声や特定語彙をオペレータに伝達する前に一律に変換処理を行うため、通話内容に何ら影響を生じさせることなく通話内容を制御することが可能である。
【0061】
[他の実施形態]
以上、本発明の実施形態について詳述したが、それぞれの実施形態に含まれる別々の特徴を如何様に組み合わせたシステムまたは装置も、本発明の範疇に含まれる。
【0062】
また、本発明は、複数の機器から構成されるシステムに適用されてもよいし、単体の装置に適用されてもよい。さらに、本発明は、実施形態の機能を実現する情報処理プログラムが、システムあるいは装置に直接あるいは遠隔から供給される場合にも適用可能である。したがって、本発明の機能をコンピュータで実現するために、コンピュータにインストールされるプログラム、あるいはそのプログラムを格納した媒体、そのプログラムをダウンロードさせるWWW(World Wide Web)サーバも、本発明の範疇に含まれる。
【0063】
[実施形態の他の表現]
上記の実施形態の一部または全部は、以下の付記のようにも記載されうるが、以下には限られない。
(付記1)
ユーザ端末とオペレータ端末との通話を公衆電話網を介して確立させる電話交換手段と、
前記電話交換手段により確立された前記通話をモニタして前記ユーザ端末と前記オペレータ端末との通話内容を音声情報として取得する通話モニタ手段と、
前記通話モニタ手段により取得された前記音声情報中に認識される前記ユーザ端末の音声から、あらかじめ定められた特定の感情を表わす感情的音声または否定的な語彙を含む特定語彙の音声のうちいずれかの不穏当音声を検出する不穏当音声検出手段と、
前記不穏当音声検出手段により検出された前記不穏当音声を制御した制御音声を生成する音声生成手段と、
を備えることを特徴とする音声制御システム。
(付記2)
前記不穏当音声検出手段は、
前記感情的音声が前記ユーザ端末からの前記音声に含まれるか否か判定する感情判定手段と、
判定された前記感情的音声を前記オペレータ端末に直接伝達しないように制御することを指示する感情制御指示手段と、
前記特定語彙が前記ユーザ端末からの前記音声に含まれるか否か判定する語彙判定手段と、
判定された前記特定語彙を前記オペレータ端末に直接伝達しないように制御することを指示する語彙制御指示手段と、
を備えることを特徴とする付記1に記載の音声制御システム。
(付記3)
前記感情制御指示手段は、前記ユーザ端末からの前記感情的音声が前記特定の感情を表わす場合には前記音声の音量をあらかじめ定められた音量以下に下げ、または前記音声を他の音を用いてマスキングし、他の音声で代替することにより、前記感情的音声を前記オペレータ端末に直接伝達することを回避する指示を出すことを特徴とする請求項2に記載の音声制御システム。
(付記4)
前記語彙制御指示手段は、前記ユーザ端末からの前記音声に前記特定語彙が含まれる場合には前記特定語彙の音声を消去しまたは他の音を用いてマスキングし、前記特定語彙を他の語彙に代替することにより、前記特定語彙を前記オペレータ端末に直接伝達することを回避する指示を出すことを特徴とする請求項2または3に記載の音声制御システム。
(付記5)
前記特定語彙を記憶する特定語彙記憶手段をさらに有することを特徴とする請求項1ないし4に記載の音声制御システム。
(付記6)
前記特定語彙記憶手段は、特定分野において多用される用語や語彙を特定語彙としてあらかじめ記憶することを特徴とする請求項5に記載の音声制御システム。
(付記7)
前記特定語彙記憶手段に記憶される前記特定語彙は、前記感情判定部または前記語彙判定部のいずれかに伝達された前記音声情報から抽出されて更新されることを特徴とする請求項5または6に記載の音声制御システム。
(付記8)
ユーザ端末とオペレータ端末との通話を公衆電話網を介して確立させる電話交換手段により確立された前記通話をモニタして前記ユーザ端末と前記オペレータ端末との通話内容を音声情報として取得する通話モニタ手段と、
前記通話モニタ手段により取得された前記音声情報から認識される前記ユーザ端末の音声から、あらかじめ定められた特定の感情を表わす感情的音声または否定的な語彙を含む特定語彙の音声のうちいずれかの不穏当音声を検出する不穏当音声検出手段と、
前記不穏当音声検出手段により検出された前記不穏当音声を制御した制御音声を生成する音声生成手段と、
を備えることを特徴とする音声制御装置。
(付記9)
ユーザ端末とオペレータ端末との通話を公衆電話網を介して確立させる電話交換手段により確立された前記通話をモニタして前記ユーザ端末と前記オペレータ端末との通話内容を音声情報として取得する通話モニタステップと、
前記通話モニタステップにより取得された前記音声情報から認識される前記ユーザ端末の音声から、あらかじめ定められた特定の感情を表わす感情的音声または否定的な語彙を含む特定語彙の音声のうちいずれかの不穏当音声を検出する不穏当音声検出ステップと、
前記不穏当音声検出ステップにより検出された前記不穏当音声を制御した制御音声を生成する音声生成ステップと、
を備えることを特徴とする音声制御方法。
(付記10)
ユーザ端末とオペレータ端末との通話を公衆電話網を介して確立させる電話交換手段により確立された前記通話をモニタして前記ユーザ端末と前記オペレータ端末との通話内容を音声情報として取得する通話モニタステップと、
前記通話モニタステップにより取得された前記音声情報から認識される前記ユーザ端末の音声から、あらかじめ定められた特定の感情を表わす感情的音声または否定的な語彙を含む特定語彙の音声のいずれかの不穏当音声を検出する不穏当音声検出ステップと、
前記不穏当音声検出ステップにより検出された前記不穏当音声を制御した制御音声を生成する音声生成ステップと、
をコンピュータに実行させることを特徴とする音声制御プログラム。

【特許請求の範囲】
【請求項1】
ユーザ端末とオペレータ端末との通話を公衆電話網を介して確立させる電話交換手段と、
前記電話交換手段により確立された前記通話をモニタして前記ユーザ端末と前記オペレータ端末との通話内容を音声情報として取得する通話モニタ手段と、
前記通話モニタ手段により取得された前記音声情報中に認識される前記ユーザ端末の音声から、あらかじめ定められた特定の感情を表わす感情的音声または否定的な語彙を含む特定語彙の音声のうちいずれかの不穏当音声を検出する不穏当音声検出手段と、
前記不穏当音声検出手段により検出された前記不穏当音声を制御した制御音声を生成する音声生成手段と、
を備えることを特徴とする音声制御システム。
【請求項2】
前記不穏当音声検出手段は、
前記感情的音声が前記ユーザ端末からの前記音声に含まれるか否か判定する感情判定手段と、
判定された前記感情的音声を前記オペレータ端末に直接伝達しないように制御することを指示する感情制御指示手段と、
前記特定語彙が前記ユーザ端末からの前記音声に含まれるか否か判定する語彙判定手段と、
判定された前記特定語彙を前記オペレータ端末に直接伝達しないように制御することを指示する語彙制御指示手段と、
を備えることを特徴とする請求項1に記載の音声制御システム。
【請求項3】
前記感情制御指示手段は、前記ユーザ端末からの前記感情的音声が前記特定の感情を表わす場合には前記音声の音量をあらかじめ定められた音量以下に下げ、または前記音声を他の音を用いてマスキングし、他の音声で代替することにより、前記感情的音声を前記オペレータ端末に直接伝達することを回避する指示を出すことを特徴とする請求項2に記載の音声制御システム。
【請求項4】
前記語彙制御指示手段は、前記ユーザ端末からの前記音声に前記特定語彙が含まれる場合には前記特定語彙の音声を消去しまたは他の音を用いてマスキングし、前記特定語彙を他の語彙に代替することにより、前記特定語彙を前記オペレータ端末に直接伝達することを回避する指示を出すことを特徴とする請求項2または3に記載の音声制御システム。
【請求項5】
前記特定語彙を記憶する特定語彙記憶手段をさらに有することを特徴とする請求項1ないし4に記載の音声制御システム。
【請求項6】
前記特定語彙記憶手段は、特定分野において多用される用語や語彙を特定語彙としてあらかじめ記憶することを特徴とする請求項5に記載の音声制御システム。
【請求項7】
前記特定語彙記憶手段に記憶される前記特定語彙は、前記感情判定部または前記語彙判定部のいずれかに伝達された前記音声情報から抽出されて更新されることを特徴とする請求項5または6に記載の音声制御システム。
【請求項8】
ユーザ端末とオペレータ端末との通話を公衆電話網を介して確立させる電話交換手により確立された前記通話をモニタして前記ユーザ端末と前記オペレータ端末との通話内容を音声情報として取得する通話モニタ手段と、
前記通話モニタ手段により取得された前記音声情報から認識される前記ユーザ端末の音声から、あらかじめ定められた特定の感情を表わす感情的音声または否定的な語彙を含む特定語彙の音声のうちいずれかの不穏当音声を検出する不穏当音声検出手段と、
前記不穏当音声検出手段により検出された前記不穏当音声を制御した制御音声を生成する音声生成手段と、
を備えることを特徴とする音声制御装置。
【請求項9】
ユーザ端末とオペレータ端末との通話を公衆電話網を介して確立させる電話交換手段により確立された前記通話をモニタして前記ユーザ端末と前記オペレータ端末との通話内容を音声情報として取得する通話モニタステップと、
前記通話モニタステップにより取得された前記音声情報から認識される前記ユーザ端末の音声から、あらかじめ定められた特定の感情を表わす感情的音声または否定的な語彙を含む特定語彙の音声のうちいずれかの不穏当音声を検出する不穏当音声検出ステップと、
前記不穏当音声検出ステップにより検出された前記不穏当音声を制御した制御音声を生成する音声生成ステップと、
を備えることを特徴とする音声制御方法。
【請求項10】
ユーザ端末とオペレータ端末との通話を公衆電話網を介して確立させる電話交換手段により確立された前記通話をモニタして前記ユーザ端末と前記オペレータ端末との通話内容を音声情報として取得する通話モニタステップと、
前記通話モニタステップにより取得された前記音声情報から認識される前記ユーザ端末の音声から、あらかじめ定められた特定の感情を表わす感情的音声または否定的な語彙を含む特定語彙の音声のいずれかの不穏当音声を検出する不穏当音声検出ステップと、
前記不穏当音声検出ステップにより検出された前記不穏当音声を制御した制御音声を生成する音声生成ステップと、
をコンピュータに実行させることを特徴とする音声制御プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate


【公開番号】特開2013−46088(P2013−46088A)
【公開日】平成25年3月4日(2013.3.4)
【国際特許分類】
【出願番号】特願2011−180217(P2011−180217)
【出願日】平成23年8月22日(2011.8.22)
【出願人】(000004237)日本電気株式会社 (19,353)
【Fターム(参考)】