説明

回線毎感情検出機能を有する電話制御装置

【課題】
音声データに、笑い,怒り,哀愁,楽しみなどにみられる感情の検出と、音声データの中に繰り返し音声が有るときに、感情検出機能に入力する音声データ量を削減して利用効率を上げる技術を提供する。
【解決手段】
感情検出は、音声データを蓄積する音声蓄積転送部2111と、繰り返し音声を検出する音声繰り返し処理部2112と、繰り返した音声は音声データは音声選択部2113から音声データを音声数値化処理部2114に送り,繰り返さない音声は、音声選択部2113から音声データの転送を停止させて感情を求める。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、電話主装置および電話機に係り、特に回線毎に感情表示をする電話システムにおける感情種別とその強度を電話機に表示する電話主装置および電話機に関する。
【背景技術】
【0002】
特許文献1には、音声信号から人の感情を検出するために、音声信号を入力し、入力した音声信号から音声の強度,音声の出現速度を表すテンポ及び音声の各単語内の強度変化パターンを表す抑揚をそれぞれ検出し、検出された音声の強度,音声のテンポ及び音声の抑揚のそれぞれについて変化量を求め、求めた変化量に基づいて、怒り,悲しみ及び喜びのそれぞれの感情状態を検出する技術が開示されている。
【0003】
今後、上述した感情状態を検出する機能は電話主装置やコールセンター向けのCTI(Computer Telephony Integration)等の電話装置に実装し、電話応対時の補助機能としての実用化が望まれる。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2002−091482号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら上述した感情状態を検出する機能は、回線毎に送信音声と受信音声それぞれに割り当てる必要があり、複数回線を収容する電話主装置やコールセンターにおいては、収容する通話回線の回線数に応じてと感情検出機能を搭載する必要があるため部品コストの増加につながる。また、感情の変化が見られない音声期間であっても、音声情報を全て感情検出機に入力するので、感情検出機能の利用効率が低いという問題があった。
【0006】
本発明は上記事情に鑑みて為されたものであり、本発明の目的は、音声データに、笑い,怒り,哀愁,楽しみなどにみられる感情状態の検出と、感情検出機能に入力する音声データ量を削減して感情検出機能の利用効率を上げる技術を提供する。
【課題を解決するための手段】
【0007】
上記の課題を解決するために本発明では、複数の回線を収容して呼を制御する電話制御装置において、送話音声または受話音声を分析して送話者の喜怒哀楽に係る感情の度合いを検出して数値化する感情検出手段と、前記複数の回線の各々の送話音声または受話音声の有音期間を検出する有音検出手段と、前記回線を選択して当該選択した回線を流れる送話音声または受話音声を前記感情検出手段に入力する回線選択手段と、を有し、前記有音検出手段が有音期間を検出する毎に、前記回線選択手段は当該回線を流れる送話音声または受話音声を一定時間以上前記感情検出手段に入力し、前記感情検出手段は入力された送話音声または受話音声を分析して送話者の喜怒哀楽に係る感情の度合いを検出し、前記検出した感情の度合いに係る情報を当該回線もしくは送話者と関連付けて記憶する、または所定の宛先へ通知することを特徴とする。
【発明の効果】
【0008】
本発明によれば、複数回線を有する通信機器において、通話中の回線より少ない数の感情検出機能で感情検出できるようになり、感情検出機能の利用効率を向上し部品コストを削減することができる。
【図面の簡単な説明】
【0009】
【図1】本発明の全体構成図である。
【図2】主装置の機能ブロック図である。
【図3】感情検出部の詳細な機能ブロック構成図である。
【図4】主装置の感情検出処理を説明するためのフローチャートである。
【図5】感情認識処理例を説明する図である。
【図6】繰り返し音声および非繰り返し音声の判定例を説明するための図である。
【発明を実施するための形態】
【0010】
以下、本発明の実施の形態について、実施例を用い、図面を参照しながら詳細に説明する。なお、実質同一部位には同じ参照番号を振り、説明は繰り返さない。
【0011】
まず、図1を参照して、本発明の全体構成を説明する。図1は、本発明の全体構成図である。
【0012】
図1において、本システムはIP外線5、主装置200、LAN(Local Area Network)4、電話機100とから構成される。
【0013】
IP外線5は、IP網3と主装置200を接続する。主装置200は、電話機100の通信について呼を制御する。主装置200は、電話機100からの音声データを受けて電話機100へ感情表示を指示する。また、主装置200は、IP網3を介して、図示しないIP網3上の電話端末と電話機100との間の呼制御処理と音声データの転送処理をする。LAN4は、IP内線を構成する。電話機100−1、100−2は、LAN4に接続して、通話および感情表示する。なお以降、場合によっては番号の後のハイフン“−”以下を省略して説明することもある。
【0014】
次に図2のブロック図を用いて主装置200の動作を説明する。図2は主装置200の機能ブロック図である。
【0015】
図2において、主装置200は、LANインターフェイス201、WANインターフェイス202、通信制御部203、呼制御管理部204、音声通信部205、状態管理部206、記憶部207、感情データ送信部208、表示配列部209、アラーム処理部210、感情検出部211とから構成される。
【0016】
LANインターフェイス部201は、LAN4と接続するためのインターフェイスである。
【0017】
WANインターフェイス部202は、IP外線5と接続するためのインターフェイスである。
【0018】
通信制御部203は、送信元あるいは送信先へパケットを転送するための通信処理をする。通信制御部203では、呼制御に関する情報は呼制御管理部204、音声であれば音声通信部205、感情データの送信であれば感情データ送信部208へデータを転送する。
【0019】
呼制御管理部204は、電話機100から到着した発信、着信、終話などの通信呼を処理して、通信制御部203に送る。また、呼制御管理部204は、電話機100と通話相手が使用する回線の割り当て、割り当てた回線の接続状態を示す回線情報を状態管理部206に送る。
【0020】
音声通信部205は、状態管理部206から音声転送情報を受けて、通信制御部203から受けた複数回線の音声データを通話相手の音声に載せ替えて、音声データを通信制御部203に送る。また、音声通信部205は、状態管理部206から通話中の回線情報を受けて、通話中の音声データを 感情検出部211に送る。
【0021】
状態管理部206は、呼制御管理部204から回線情報を受けて、音声データを相手の音声に載せ替える為の音声転送情報を音声通信部205に送る。また、状態管理部206は、感情検出部211から感情数値化情報が受けると、記憶部207から表示形式を読み出して、感情配列部209とアラーム処理部210に送る。
【0022】
記憶部207は、感情データを電話機100に表示させるための表示形式が格納され、回線接続に合わせて表示形式が選択される。
【0023】
感情データ送信部208は、アラーム処理部110からアラーム情報を受け取るまたは、表示配列部209から感情表示データを受け取ると、電話機100に送信するためのパケットを生成し通信制御部203を介して電話機100に送信する。
【0024】
表示配列部209は、状態管理部206から感情数値化情報と表示形式と回線情報を送ると、電話機100に表示させる感情表示データを作り感情データ送信部208に送る。
【0025】
アラーム処理部210は、状態管理部206から感情数値化情報と表示形式を受けると感情数値化情報の値が閾値を超えていると、LED,LCD表示または音声で伝えるためのアラーム情報を作り、感情データ送信部208に送る。
【0026】
感情検出部211は、音声データから感情の種類と感情の度合いを数値化した感情数値化情報を状態管理部206に送る。
【0027】
次に図3を参照して、感情検出部211の詳細な動きを説明をする。図3は、感情検出部211の詳細な機能ブロック構成図である。
【0028】
図3において、感情検出部211は、音声蓄積転送部2111,音声繰り返し処理部2112,音声選択部2113,音声数値化処理部2114,音声データ転送部2115から構成される。
【0029】
音声蓄積転送部2111は、収容する回線数に応じて複数用意され、音声通信制御部205から受けた音声パケットの音声データを取り出して、取り出した音声データを一時蓄積し、一時蓄積した蓄積音声データと蓄積しない非蓄積音声データを音声繰り返し処理部2112に送る。
【0030】
音声繰り返し処理部2112は、収容する回線数に応じて複数用意(本明細書ではn回線とする)され、音声蓄積処理2111から送られた蓄積音声データと非蓄積音声データを用いて、繰り返し音声か否かを判定する。ここで、繰り返し音声とは驚いたときに見ることが出来る語尾が伸びる音や頷きに見ることが出来る同じ音を繰り返す音声のことを意味する。
【0031】
繰り返し音声か否かを判定する方法として、エコーキャンセラに見られる音声一致手段を用い、非蓄積音声データと蓄積音声データの差分した音から繰り返しの判定をおこなう。
【0032】
音声選択部2113は、音声データを選択して感情数値化処理部2114に送る。また、繰り返し音声の期間を示す繰り返し音声期間と回線情報を感情データ転送部2115に送る。
【0033】
感情数値化処理部2114は、所定の数用意され(本明細書ではm個(n>m>0))非繰り返し音声が入力される。非繰り返し音声が入力されると、喜怒哀楽などの感情に分類して数値化した感情数値化情報が出力される。
【0034】
感情データ転送部2115は、音声選択部2113から受け取った繰り返し音声期間、回線情報と感情数値化処理部2114から受け取った感情数値化情報を対応付けて、状態管理部206に送る。
【0035】
具体的な繰り返し音声期間および感情数値化情報の抽出イメージを図6を用いて説明する。
【0036】
図6は、繰り返し音声および非繰り返し音声の判定例を説明するための図である。
【0037】
通話中の音声は、発音開始すると非蓄積音声データ601と蓄積して利用する蓄積転送された蓄積音声データ602に分けられる。非蓄積音声データ601と蓄積転送された蓄積音声データ602を比べて、不一致となる音声が、非繰り返し音声603になる。最初に、「ワッハッ」の非繰り返し音声603が感情数値化処理部2114に送られて、感情が「楽しい」(例えば)と感情の度合が「30」(例えば)が得られる。
【0038】
次の音声は、繰り返し音声を示す604「ー」になるので、音声繰り返し処理部2112が繰り返し音声期間を算出し、繰り返し音声期間の「5秒」(例えば)が得られる。得られた繰り返し音声期間を音声選択部2113を介して2115に渡す。
【0039】
このようにして、感情データ転送部2115は音声データの感情数値化情報として感情、感情の度合、繰り返し音声期間を得られる。
【0040】
次に図4のフローチャートを用いて受信した音声パケットから感情データ検知し、電話機100に感情表示データ・アラーム情報を送信するまでの動作を説明する。
【0041】
図4は、主装置200の感情検出処理を説明するためのフローチャートである。
【0042】
尚、本フローは、所定の電話装置100およびIP網3に接続する所定の通話相手(図示せず)が呼接続し、通話を開始する毎に開始する。
【0043】
通信制御部203は、通話中の電話装置100または通話相手から音声パケットを受信すると(S401、Yes)、音声パケットの音声データ抽出して(S402)音声通信部205に渡す。
【0044】
なお、音声パケットの受信について主装置200は、電話装置100が通話相手に送る送話の音声パケット、電話装置100が通話相手から受け取る受話の音声パケットのそれぞれを受信するが、それぞれの音声パケットを識別しているものとする。
【0045】
音声通信部205は、受信した音声データから音が含まれているかどうか判定し(S403)、音が含まれていなければ(S403、No)、ステップ401に戻って次の音声パケットの受信を待つ。
【0046】
音が含まれていれば(S403、Yes)、音声通信部205は有音データの音声データを抽出し、無音になるまで抽出し続ける(S404〜S406)。そして音声通信部205は抽出した有音データを感情検出部211に渡す。
【0047】
有音データを渡された感情検出部211は繰り返し応答処理を行い(S407)、非繰り返し音声を抽出する。次に感情検出部211は任意の感情数値化処理部2114を選択し(S408)、感情数値化処理が可能かどうか判断する(S409)。
【0048】
感情数値化処理が不可能の場合(S409、No)、感情検出部211は他の選択していない感情数値化処理部2114を選択して(S410)処理可能な感情数値化処理部2114が見つかるまで同じ動作を繰り返す。
【0049】
具体的にはまず感情数値化処理部2114−1を選択し、当該感情数値化処理部2114−1が処理中かどうかを判断する。処理中の場合、感情検出部211は感情数値化処理部2114−1、感情数値化処理部2114−2、感情数値化処理部2114−3・・・感情数値化処理部2114−mの順に選択していく。
【0050】
感情数値化処理が可能の場合(S409、Yes)、感情検出部211は感情数値化処理を行い、感情数値化情報を算出する(S411)。そして算出した感情数値化情報をアラーム処理部210および表示配列部209に渡す。
【0051】
アラーム処理部210および表示配列部209は受け取った感情数値化情報から感情表示データ・
アラーム情報を生成し、感情データ送信部208および通信制御部203と連動して電話機100に送信する(S412)。
【0052】
このように、繰り返し音声の感情処理を省略することで、空いている感情処理部2114を、新たな音声データに振り分けることで、感情数値化処理部2114の利用効率を向上する。
【0053】
図5を参照して、主装置200の感情数値化処理例の動作を説明する。図5では、電話機100−1送話501と図示しないIP網3に接続された相手端末の送話を電話機100−1受話502で通話中の音声を示す。また、電話機100−2送話S503と電話機100−2受話504も同様に通話中の音声を示す。感情数値化処理部に入力する音声505は、感情数値化処理部2114に送る音声を示す。感情数値化情報506は、音声データから感情数値化情報が出力された事を示す。
【0054】
第1送話感情認識結果507は、電話機100−1送話から得られた感情数値化情報を示す。第1受話感情認識結果508は、電話機100−1受話から得られた感情数値化情報を示す。第2送話感情認識結果509は、電話機100−2送話から得られた感情数値化情報を示す。第2受話感情認識結果510は、電話機100−2受話から得られた感情数値化情報を示す。第1送話感情認識結果511は、電話機100−1送話から得られた感情数値化情報を示す。第1受話感情認識結果512は、電話機100−1受話から得られた感情数値化情報を示す。
【0055】
音声選択部2113では、電話機100−1送話,電話機100−1受話,電話機100−2送話,電話機100−2受話が入力されて、感情数値化処理部に入力する音声505が出力される。出力された音声は、音声数値化処理部2114に送られて、喜怒哀楽等の感情認識結果が、感情数値化情報506として出力される。
【0056】
以上、本実施例について説明した。
【0057】
上述した実施例に拠れば、通話の音声データから有音区間を抽出して、有音区間のみ空いている感情数値化処理部2114で感情数値化処理する。これにより回線数よりも少ない感情検出機能で効率的に感情検出することが出来る。
【0058】
また、上述した実施例に拠れば、抽出した有音区間をさらに繰り返し音声処理で非繰り返し音声と折り返し音声に分類し、非繰り返し音声のみを感情数値化処理部2114で感情数値化処理する。これによりさらに効率的に感情検出することが出来る。
【符号の説明】
【0059】
100…電話機
200…主装置
201…LANインターフェース部
202…WANインターフェース部
203…通信制御部
204…制御管理部
205…音声通信部
206…感情検出部
207…記憶部
208…感情データ送信部
209…表示配列部
210…アラーム処理部
211…感情検出部
2111…音声蓄積転送部
2112…音声繰り返し処理部
2113…音声選択部
2114…感情数値化処理部
2115…感情データ転送部
3…IP網
4…LAN
5…IP外線


【特許請求の範囲】
【請求項1】
複数の回線を収容して呼を制御する電話制御装置において、
送話音声または受話音声を分析して送話者の喜怒哀楽に係る感情の度合いを検出して数値化する感情検出手段と、前記複数の回線の各々の送話音声または受話音声の有音期間を検出する有音検出手段と、前記回線を選択して当該選択した回線を流れる送話音声または受話音声を前記感情検出手段に入力する回線選択手段と、を有し、
前記有音検出手段が有音期間を検出する毎に、前記回線選択手段は当該回線を流れる送話音声または受話音声を一定時間以上前記感情検出手段に入力し、前記感情検出手段は入力された送話音声または受話音声を分析して送話者の喜怒哀楽に係る感情の度合いを検出し、前記検出した感情の度合いに係る情報を当該回線もしくは送話者と関連付けて記憶する、または所定の宛先へ通知することを特徴とする回線毎感情検出機能を有する電話制御装置。
【請求項2】
請求項1に記載の電話制御装置において、
前記回線選択手段は、入力された音声が一定周期で発音する繰り返し音声のときに前記感情検出手段への音声入力を停止させる音声停止手段と、前記音声停止手段で止められた期間を求める音声停止期間測定手段を、更に有し、
非繰り返し音声から得られた感情と、繰り返し音声の時間を用いて、感情表示する事を特徴とする回線毎感情検出機能を有する電話制御装置。
【請求項3】
請求項1または2に記載の電話制御装置において、
前記回線選択手段は、連続する音声の時に繰り返し音声で分割して感情検出することを特徴とする、回線毎感情検出機能を有する電話制御装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2012−54892(P2012−54892A)
【公開日】平成24年3月15日(2012.3.15)
【国際特許分類】
【出願番号】特願2010−197997(P2010−197997)
【出願日】平成22年9月3日(2010.9.3)
【出願人】(000134707)株式会社ナカヨ通信機 (522)
【Fターム(参考)】