コミュニケーション・エラーを検出するシステムおよび方法

【課題】チャット・システムや電話等の機器を用いた実際のコミュニケーションの場面から、具体的なコミュニケーション・エラーの事例を自動的に抽出する。
【解決手段】処理対象の会話データを取得するデータ取得部１１０と、このデータ取得部１１０により取得された会話データを形態素解析し、解析結果に基づき会話における情報伝達の度合いを表す特徴量を求め、求めた特徴量に基づきコミュニケーション・エラーが生じているか否かを判定するコミュニケーション・エラー検出部１２０と、このコミュニケーション・エラー検出部１２０によりコミュニケーション・エラーが生じていると判定された場合に、このコミュニケーション・エラーの内容を示すエラー・データを作成し、コミュニケーション・エラー・データベース２１０、プロファイル・データベース２２０、メタ・データ・データベース２３０に格納するエラー・データ作成部１３０と、を備える。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、チャット・システムや電話等の会話データを解析し、コミュニケーション・エラーを検出するシステムおよび方法等に関する。
【背景技術】
【０００２】
今日、インターネット・リレー・チャット（Internet Relay Chat：ＩＲＣ）等によるチャット・システムや電話等、通信機器を用いたコミュニケーション手段（システム）が広く普及している。この種のシステムでは、いわゆるコミュニケーション・エラーを低減するための支援手段が設けられているものがある（例えば、特許文献１参照）。
【０００３】
特許文献１に記載された従来技術は、多義性を持つ語などの特定の語がコミュニケーション・エラーの原因となると仮定し、そのような語を収集し、システムに蓄積している。そして、会話中の発言内にシステムに蓄積されている語が含まれているか否かを判定し、含まれていると判断した場合は利用者に提示（警告）する。
【０００４】
【特許文献１】特開２００７−４２０１０号公報
【発明の開示】
【発明が解決しようとする課題】
【０００５】
コミュニケーション・エラーを低減するための技術においては、実際に行われているチャットや会話等のコミュニケーションの中から、コミュニケーション・エラーが生じている可能性のある部分を抽出することが必要である。しかし、上記の従来技術では、処理に必要なリソースとして、コミュニケーション・エラーの原因となり得る語を事前に収集する必要があり、実用的なシステムの構築に多大な手間を要していた。
【０００６】
また、コミュニケーション・エラーを引き起こす原因となる語は、必ずしも多義性を持つ語などの特定の語に限定されない。そして、コミュニケーション・エラーの発生は、話者ごとの環境などにも依存する。したがって、コミュニケーション・エラーを引き起こす原因となる語を特定する等のような、予め決められたルールに基づいて、個別の話者に対応する精度の高い支援システムを構築するのは困難であった。
【０００７】
本発明は、このような課題に鑑みて成されたものであり、チャット・システムや電話等の機器を用いた実際のコミュニケーションの場面から、具体的なコミュニケーション・エラーの事例を自動的に抽出することを目的とする。
【課題を解決するための手段】
【０００８】
上記の目的を達成するため、本発明は、次のようなシステムとして実現される。このシステムは、会話データにおけるコミュニケーション・エラーを検出するシステムであって、処理対象の会話データを取得する取得部と、この取得部により取得された会話データを形態素解析し、解析結果に基づき会話における情報伝達の度合いを表す特徴量を求め、求めた特徴量に基づきコミュニケーション・エラーが生じているか否かを判定する判定部と、この判定部によりコミュニケーション・エラーが生じていると判定された場合に、このコミュニケーション・エラーの内容を示すエラー・データを作成し、データベースに格納するエラー・データ作成部と、を備える。
【０００９】
より詳細には、このシステムにおいて、判定部は、
・単独で伝達されるべき情報を持つ語である内容語の数
・複数の発言の間で重複している内容語の数
・コミュニケーション・エラーを明示的に示す特定の語の数
のうち、少なくとも１つを特徴量として求める。そして、
会話データにおける特定の話者の最終発言に含まれる内容語の数が、それまでのその話者の発言における内容語の数の平均に対して一定以上少ない場合、
会話データにおける特定の話者の最終発言に含まれる内容語のうち、その特定の話者の直前の発言に含まれる内容語と重複する語の割合が一定以上ある場合、
会話データにおける特定の話者の最終発言に含まれる内容語の数、および、会話データにおける他の話者の最終発言に含まれる内容語の数が、それまでの特定の話者の発言における内容語の数の平均に対して一定以上少ない場合、
会話データにおける特定の話者の最終発言に含まれる内容語に対する特定の語の割合が一定以上ある場合、
のいずれか１つ、または複数の条件が成り立つ場合に、コミュニケーション・エラーが生じていると判定する。
【００１０】
さらに詳細には、判定部は、形態素解析により得られる品詞の情報に基づき、助詞以外の語、あるいは形容詞、副詞、接続詞、名詞、動詞または疑問詞のいずれかに該当する語を内容語として、その数を求める。
【００１１】
また、本発明は、次のような方法としても実現される。この方法は、コンピュータが会話データにおけるコミュニケーション・エラーを検出する方法であって、処理対象の会話データの文を形態素解析するステップと、形態素解析の結果に基づき会話における情報伝達の度合いを表す特徴量として、
・単独で伝達されるべき情報を持つ語である内容語の数
・複数の発言の間で重複している内容語の数
・コミュニケーション・エラーを明示的に示す特定の語の数
のうち、少なくとも１つを求めるステップと、特徴量に基づきコミュニケーション・エラーが生じているか否かを判定するステップと、コミュニケーション・エラーが生じていると判定された場合に、そのコミュニケーション・エラーの内容を示すエラー・データを作成し、データベースに格納するステップと、を含む。
【００１２】
さらに本発明は、コンピュータを制御して上記のシステムにおける各機能を実現させるプログラム、または上記の方法における各ステップに対応する処理をコンピュータに実行させるプログラムとしても実現される。このプログラムは、例えば光ディスクや磁気ディスク、半導体メモリ、その他の記録媒体に格納して配布したり、ネットワークを介して配信したりすることにより提供することができる。
【発明の効果】
【００１３】
以上のように構成された本発明によれば、チャット・システムや電話等の機器を用いた実際のコミュニケーションの場面から、具体的なコミュニケーション・エラーの事例を自動的に抽出することが可能となる。
【発明を実施するための最良の形態】
【００１４】
以下、添付図面を参照して、本発明の実施形態について詳細に説明する。
＜システム構成＞
図１は、本実施形態によるコミュニケーション・エラー抽出システムの構成例を示す図である。
図１を参照すると、本実施形態のシステムは、チャットや電話での会話データからコミュニケーション・エラーが生じている箇所を抽出するデータ処理装置１００と、データ処理装置１００により抽出されたコミュニケーション・エラーに関する情報を蓄積するデータ格納部２００とを備える。データ処理装置１００は、データ取得部１１０と、コミュニケーション・エラー検出部１２０と、エラー・データ作成部１３０とを備える。また、データ格納部２００は、コミュニケーション・エラー・データベース（ＤＢ）２１０と、プロファイル・データベース（ＤＢ）２２０と、メタ・データ・データベース（ＤＢ）２３０とを格納している。
【００１５】
図２は、図１のコミュニケーション・エラー抽出システムを実現するコンピュータのハードウェア構成例を示す図である。
図２に示すコンピュータ１０は、演算手段であるＣＰＵ（Central Processing Unit）１０ａと、記憶手段であるメイン・メモリ１０ｃおよび磁気ディスク装置（ＨＤＤ：Hard Disk Drive）１０ｇを備える。また、ネットワークを介して外部装置に接続するためのネットワーク・インタフェース・カード１０ｆと、表示出力を行うためのビデオ・カード１０ｄおよび表示装置１０ｊと、音声出力を行うための音声機構１０ｈとを備える。さらに、キーボードやマウス等の入力デバイス１０ｉを備える。
【００１６】
図２に示すように、メイン・メモリ１０ｃおよびビデオ・カード１０ｄは、システム・コントローラ１０ｂを介してＣＰＵ１０ａに接続されている。また、ネットワーク・インタフェース・カード１０ｆ、磁気ディスク装置１０ｇ、音声機構１０ｈおよび入力デバイス１０ｉは、Ｉ／Ｏコントローラ１０ｅを介してシステム・コントローラ１０ｂと接続されている。各構成要素は、システム・バスや入出力バス等の各種のバスによって接続される。例えば、ＣＰＵ１０ａとメイン・メモリ１０ｃの間は、システム・バスやメモリ・バスにより接続される。また、ＣＰＵ１０ａと磁気ディスク装置１０ｇ、ネットワーク・インタフェース・カード１０ｆ、ビデオ・カード１０ｄ、音声機構１０ｈ、入力デバイス１０ｉ等との間は、ＰＣＩ（Peripheral Components Interconnect）、ＰＣＩＥｘｐｒｅｓｓ、シリアルＡＴＡ（AT Attachment）、ＵＳＢ（Universal Serial Bus）、ＡＧＰ（Accelerated Graphics Port）等の入出力バスにより接続される。
【００１７】
なお、図２は、本実施形態が適用されるのに好適なコンピュータのハードウェア構成を例示するに過ぎず、実際の各サーバが図示の構成に限定されないことは言うまでもない。例えば、ビデオ・カード１０ｄを設ける代わりに、ビデオメモリのみを搭載し、ＣＰＵ１０ａにてイメージ・データを処理する構成としても良い。また、音声機構１０ｈを独立した構成とせず、システム・コントローラ１０ｂやＩ／Ｏコントローラ１０ｅを構成するチップセットの機能として備えるようにしても良い。また、補助記憶装置として磁気ディスク装置１０ｇの他に、各種の光学ディスクやフレキシブル・ディスクをメディアとするドライブを設けても良い。表示装置１０ｊとしては、主として液晶ディスプレイが用いられるが、その他、ＣＲＴディスプレイやプラズマ・ディスプレイ等、任意の方式のディスプレイを用いて良い。
【００１８】
図１に示したシステムにおいて、データ処理装置１００のコミュニケーション・エラー検出部１２０およびエラー・データ作成部１３０は、例えば図２に示したコンピュータ１０において、メイン・メモリ１０ｃに読み込まれたプログラムをＣＰＵ１０ａが実行することにより実現される。データ取得部１１０は、例えば図２に示したコンピュータ１０において、ネットワーク・インタフェース・カード１０ｆおよびプログラム制御されたＣＰＵ１０ａにより実現される。また、データ格納部２００は、例えば図２に示したコンピュータ１０において、メイン・メモリ１０ｃや磁気ディスク装置１０ｇ等の記憶手段により実現される。
【００１９】
データ取得部１１０は、チャットや電話による会話データを外部から取得する。具体的には、例えばチャットの会話データの場合、チャットのセッションを管理するチャット・システムのサーバやセッションに参加している端末から取得する。また、電話の会話の場合、会話音声を音声認識システムによりテキスト化された会話データを取得する。これらのチャット・システムや音声認識システムは、既存のシステムを用いることができる。また、データ取得部１１０は、取得した会話データを、後述するウィンドウ幅ごとにコミュニケーション・エラー検出部１２０に渡す。
【００２０】
コミュニケーション・エラー検出部１２０は、データ取得部１１０から取得したウィンドウ幅ごとの会話データから、聞き返しや話者が混乱している等のコミュニケーション・エラーが生じている部分を検出する。一般に、会話等のコミュニケーションは、次のような特徴を持つ。

・会話、チャットは少なくとも一方向の情報伝達がある。
・（一人または複数の）話者はある目的を達成するために、情報を随時提供していく。
【００２１】
この特徴を利用して、

・常に情報が発信されているか
・情報が十分に提供されているか
・新しい情報が随時提供されているか
・コミュニケーション・エラーを明示的に示す特定の語があるか

等の観点から評価が行われ、その評価結果に基づいて、コミュニケーション・エラーが生じているか否かを判定する。すなわち、コミュニケーション・エラー検出部１２０は、会話データにおいてコミュニケーション・エラーが生じているか否かを判定する判定部として機能する。
【００２２】
具体的には、会話データを適当な枠組みで区切り、その枠（以下、ウィンドウ）内での会話のやり取りにおいて、

・内容語の数（同一の語を除く）
・複数の発言の間で重複している内容語の数
・コミュニケーション・エラーを明示的に示す特定の語の数

を求める。そして、得られた内容語や特定の語の数に応じて、コミュニケーション・エラーが発生したか否かが判定される。ここで、内容語とは、その語単独で内容（伝達されるべき情報）を持つ語であり、助詞等を除いた語である。また、コミュニケーション・エラーを明示的に示す特定の語とは、例えばチャットのセッション等で「？？？」という語句（文字列）が入力されている場合等におけるその文字列であり、予めどのような語句（文字列）が該当するかを決めておく。コミュニケーション・エラー検出部１２０による検出処理のさらに詳細な内容については、後述する。
【００２３】
エラー・データ作成部１３０は、コミュニケーション・エラー検出部１２０により検出された、コミュニケーション・エラーの生じている箇所（以下、エラー箇所）の情報に基づいてエラー・データを作成し、データ格納部２００のデータベース２１０〜２３０に格納する。エラー・データとしては、エラーの内容を記録したデータ、話者の情報を記録したデータ、エラーに対する付加情報を記録したデータが作成される。
【００２４】
コミュニケーション・エラーＤＢ２１０は、エラー・データ作成部１３０により作成された、エラーの内容を記録したデータを格納する。
図３は、コミュニケーション・エラーＤＢ２１０の構成例を示す図である。
図３に示す例では、各エラー箇所に付与されたエラーＩＤと、そのエラー箇所における話者を識別するための話者ＩＤと、発言内容（テキスト）と、その発言に含まれる内容語とが、関連付けられて格納されている。
【００２５】
プロファイルＤＢ２２０は、エラー・データ作成部１３０により作成された、話者の情報を記録したデータを格納する。
図４は、プロファイルＤＢ２２０の構成例を示す図である。
図４に示す例では、会話のセッションにおける話者を識別するための話者ＩＤと、その話者に関する情報（以下、話者情報）として社員情報とが関連付けられて格納されている。話者ＩＤ自体は個々の会話のセッションにおける話者を識別するに過ぎないが、話者ＩＤと話者情報とを関連付けておくことにより、話者から当該話者に関連するエラー・データを特定することができることとなる。話者情報としては、本実施形態が適用されるシステム（チャット・システムや電話での会話をテキスト化して処理するシステム）の用途等に応じて、有用な情報を任意に用いて良い。例えば、社内チャット・システムであれば、図４に示すように社員情報を話者情報として用いることができる。また、コール・センターであれば、顧客ＩＤなどの顧客情報を話者情報として用いることができる。これらの話者情報は、例えば本実施形態が適用されるシステムのデータベース等から取得することができる。
【００２６】
メタ・データＤＢ２３０は、エラー・データ作成部１３０により作成された、エラーに対する付加情報を記録したデータを格納する。
図５は、メタ・データＤＢ２３０の構成例を示す図である。
図５に示す例では、各エラー箇所に付与されたエラーＩＤと、メタ・データとが関連付けられて格納されている。メタ・データとしては、コミュニケーション・エラーの発生理由や注意事項などの情報を記録することができる。なお、エラーに対してメタ・データを付加するか否かは、任意である。メタ・データの入力については、話者が会話後に、コミュニケーション・エラーとして判定された部分を参照して記入しても良い。また、コール・センターなどでは、エージェントの教育を担当する管理者がガイドを記入することも考えられる。
【００２７】
＜コミュニケーション・エラーの検出処理＞
次に、コミュニケーション・エラー検出部１２０による検出処理について、具体例を挙げて詳細に説明する。
事前の設定として、会話データのうちコミュニケーション・エラーの検出対象を特定するための枠組みであるウィンドウの幅（ｗ）と、コミュニケーション・エラーか否かを判定するための閾値（ｔｈ）を定め、登録する。ここで、ウィンドウの幅（ｗ）は、会話データ全体の中のコミュニケーション・エラーの検出対象となる範囲を示す。例えば、話者Ａの発言、話者Ｂの発言、話者Ａの発言、という３つの発言ターンを対象としてコミュニケーション・エラーの検出を行うならば、ｗ＝３となる。
【００２８】
図６は、コミュニケーション・エラー検出部１２０およびエラー・データ作成部１３０の処理の手順を示すフローチャートである。
図６を参照すると、コミュニケーション・エラー検出部１２０は、チャットや電話による会話（コミュニケーション）が進むにつれて、ウィンドウ幅（ｗ）分の会話データＤｉ（Ｄ１、Ｄ２、Ｄ３、・・・）をデータ取得部１１０から取得する（ステップ６０１）。
以下の動作例では、ウィンドウの幅（ｗ）をｗ＝３とし、話者をＡ、Ｂの２名とする。また、会話データＤｉにおける話者Ａの発言数をｎａ、話者Ｂの発言数をｎｂとする。そして、会話データＤｉにおける話者Ａの各発言をターンごとにＡ１、Ａ２、・・・、Ａｎａ、話者Ｂの各発言をターンごとにＢ１、Ｂ２、・・・、Ｂｎｂとする。
【００２９】
具体例を挙げると、ある時点で取得したｗ＝３の会話データＤｉを、

Ａ：Ａｇｒｅｅ？
Ｂ：Ｎｏ．
Ａ：？？？ｗｈｙ？

とする。この会話データＤｉは、チャットにおいてやり取りされた会話の一部とする。話者Ａの発言における「？？？」は、チャットにおいて、話者が相手の発言の意味を理解しかねているときに、慣習的に入力される文字列であるものとする。このとき、会話データＤｉにおいて、話者Ａ、Ｂの発言は、Ａ１、Ｂ１、Ａ２の順で行われており、話者Ａの発言数ｎａ＝２、話者Ｂの発言数ｎｂ＝１である。
【００３０】
次に、コミュニケーション・エラー検出部１２０は、データ取得部１１０から取得した会話データＤｉに対して形態素解析処理を行う（ステップ６０２）。この解析により、会話データＤｉの分から切り出された単語の品詞情報が抽出される。形態素解析処理には、既存の任意の技術を用いて良い。
【００３１】
次に、コミュニケーション・エラー検出部１２０は、各話者の発言に関して、コミュニケーション・エラーの判定に用いられる特徴量を求める（ステップ６０３）。ここで、特徴量は、例えば次の３つの量とすることができる。

・ｃｎｔ（Ａｉ）：発言Ａｉ（ｉ：１≦ｉ≦ｎａ）に含まれる内容語の数（同一の語を除く）
・ｄｐ（Ａｉ，Ａｊ）：発言Ａｉと発言Ａｊ（ｊ：１≦ｊ≦ｎａ、ｊ≠ｉ）にそれぞれ含まれる内容語のうち、重複する語の数
・ｃｎｆ（Ａｉ）：発言Ａｉに含まれる語のうち、コミュニケーション・エラーを明示的に示す語句（文字列）や表現として事前に登録されている語の数
【００３２】
内容語の抽出は、ステップ６０２で得られた品詞情報に基づいて行われる。内容語として選択される品詞は、その語単独で内容（伝達されるべき情報）を持たない助詞等を除いたものであり、例えば、形容詞、副詞、接続詞、名詞、動詞、疑問詞とすることができる。また、特徴量ｃｎｆ（Ａｉ）を求めるために事前に登録されている語（以下、登録語）には、システムごとに個別に登録した語句（文字列）の他、感嘆詞などの特定の種類の語を含んでも良い。
【００３３】
次に、コミュニケーション・エラー検出部１２０は、ステップ６０３で求めた特徴量を用いた判定基準を適用して、コミュニケーション・エラーが生じているか否かを判定する（ステップ６０４、６０５）。判定基準としては、例えば次に示すような指標を用いた基準を適用することができる。なお、以下の例では話者Ａの発言に関してのみ記載しているが、話者Ｂの発言に関しても同様に計算する。
【００３４】
・指標１
ｌｅｓｓｉｎｆｏ（Ａｎａ）＝｛ａｖｅｒａｇｅ（Ａ）−ｃｎｔ（Ａｎａ）｝／ａｖｅｒａｇｅ（Ａ）
ただし、
ａｖｅｒａｇｅ（Ａ）＝｛ｃｎｔ（Ａ１）＋・・・＋ｃｎｔ（Ａ（ｎａ−１）｝／（ｎａ−１）

すなわち、ａｖｅｒａｇｅ（Ａ）はｎａ−１番目の発言までの話者Ａの発言における内容語の量の平均を表す。したがって、ｌｅｓｓｉｎｆｏ（Ａｎａ）は、会話データＤｉにおける話者Ａの最終発言Ａｎａにおける内容語の量が、それまでの話者Ａの発言における内容語の量の平均と比べてどのように変化したかを示す指標である。内容語の量が最終発言Ａｎａにおいて突然少なくなれば、ｌｅｓｓｉｎｆｏ（Ａｎａ）の値が大きくなる。このことは、ｌｅｓｓｉｎｆｏ（Ａｎａ）の値が大きくなると、話者Ａから提供される情報量が急激に減少したことを意味する。したがって、コミュニケーション・エラーが生じているか否かを判断する基準とすることができる。
【００３５】
・指標２
ｎｏｔ＿ｎｅｗ（Ａｎａ，Ａ（ｎａ−１））＝ｄｐ（Ａｎａ，Ａ（ｎａ−１））／ｃｎｔ（Ａｎａ）

ｎｏｔ＿ｎｅｗ（Ａｎａ，Ａ（ｎａ−１））は、会話Ｄｉにおける話者Ａの最終発言Ａｎａにおいて、内容語のうち話者Ａの一つ前の発言Ａ（ｎａ−１）における内容語と重複する語の割合を示した指標である。同じ発言を繰り返した場合等に、ｎｏｔ＿ｎｅｗ（Ａｎａ，Ａ（ｎａ−１））の値が大きくなる。このことは、ｎｏｔ＿ｎｅｗ（Ａｎａ，Ａ（ｎａ−１））の値が大きくなると、話者Ａから提供される新たな情報が減少したことを意味する。したがって、コミュニケーション・エラーが生じているか否かを判断する基準とすることができる。
【００３６】
・指標３
ｎｏ＿ｕｐｄａｔｅ（Ａｎａ，Ｂｎｂ）＝ｍｉｎ（ｌｅｓｓｉｎｆｏ（Ａｎａ），（ａｖｅｒａｇｅ（Ａ）−ｃｎｔ（Ｂｎｂ））／ａｖｅｒａｇｅ（Ａ））

ｎｏ＿ｕｐｄａｔｅ（Ａｎａ，Ｂｎｂ）は、上述したｌｅｓｓｉｎｆｏ（Ａｎａ）、または、話者Ａの発言における内容語の量の平均に対する話者Ｂの最終発言Ｂｎｂにおける内容語の相対的な量のうち、小さい方を示す指標である。話者Ａの最終発言Ａｎａにおける内容語の量がそれまでの発言と比べて少なく、かつ話者Ｂの最終発言Ｂｎｂにおける内容語の量もそれまでの話者Ａの発言に比べて少ない場合に、ｎｏ＿ｕｐｄａｔｅ（Ａｎａ，Ｂｎｂ）の値が大きくなる。このことは、ｎｏ＿ｕｐｄａｔｅ（Ａｎａ，Ｂｎｂ）の値が大きくなると、話者Ａから提供される情報量が急激に減少し、かつ話者Ｂから提供される情報量も少ないため、話者間の情報の伝達が滞っていることを意味する。したがって、コミュニケーション・エラーが生じているか否かを判断する基準とすることができる。
【００３７】
・指標４
ｃｏｎｆｕｓｉｎｇ（Ａｎａ）＝ｃｎｆ（Ａｎａ）／ｃｎｔ（Ａｎａ）

ｃｏｎｆｕｓｉｎｇ（Ａｎａ）は、話者Ａの最終発言Ａｎａにおいて、コミュニケーション・エラーを明示的に示す登録語の量と内容語の量との比を示す指標である。発言のほとんどが登録語である場合等に、ｃｏｎｆｕｓｉｎｇ（Ａｎａ）の値が大きくなる。このことは、ｃｏｎｆｕｓｉｎｇ（Ａｎａ）の値が大きくなると、話者間の情報の伝達が滞っていることを意味する。したがって、コミュニケーション・エラーが生じているか否かを判断する基準とすることができる。
【００３８】
コミュニケーション・エラー検出部１２０は、以上の４つの指標を用い、予め定めた基準に従って、コミュニケーション・エラーが生じているか否かを判定する。具体的には、上記の指標のうち、いずれか１つまたは複数の指標において、評価値が事前に設定された閾値（ｔｈ）を越えた場合に、コミュニケーション・エラーが生じていると判定する。実際のシステムにおいては、例えば、ｅｖａｌ（ｌｅｓｓｉｎｆｏ，ｎｏｔ＿ｎｅｗ，ｎｏ＿ｕｐｄａｔｅ，ｃｏｎｆｕｓｉｎｇ）という関数を用意する。この関数は、上記の指標の評価値を引数とし、

・引数のいずれか１つでも事前設定の閾値ｔｈを越えた場合にｙｅｓを返す
・引数のうち２つ以上の値が事前設定の閾値ｔｈを越えた場合にｙｅｓを返す

といった規則に基づいて、コミュニケーション・エラーか否か（ｙｅｓ／ｎｏ）を返す。
【００３９】
以上の判定処理の結果、コミュニケーション・エラーが生じていると判定された場合（ステップ６０５でＹｅｓ）、現在の会話データＤｉをエラー・データ作成部１３０に渡し、エラー・データの作成処理に移行する。そして、コミュニケーション・エラー検出部１２０は、次の会話データＤｉを取得してステップ６０１以降の処理を繰り返す。一方、コミュニケーション・エラーが生じていないと判定された場合（ステップ６０５でＮｏ）、コミュニケーション・エラー検出部１２０は、現在の会話データＤｉに対する処理を終了し、次の会話データＤｉを取得してステップ６０１以降の処理を繰り返す。
【００４０】
なお、コミュニケーション・エラー検出部１２０がデータ取得部１１０から取得する会話データＤｉは、話者の１発言ごとにずらしながら順次取得しても良いし、ウィンドウ幅（ｗ）ごとにずらしながら順次取得しても良い。具体的には、例えばデータ取得部１１０が取得する元の会話データが、話者Ａ、ＢによるＡ１、Ｂ１、Ａ２、Ｂ２、Ａ３、Ｂ３という発言で構成されている場合を考える。このとき、ウィンドウ幅ｗ＝３とすると、会話データＤ１をＡ１、Ｂ１、Ａ２、会話データＤ２をＢ１、Ａ２、Ｂ２、会話データＤ３をＡ２、Ｂ２、Ａ３、というように１発言ずつずらしても良い。また、会話データＤ１をＡ１、Ｂ１、Ａ２、会話データＤ２をＢ２、Ａ３、Ｂ３、というようにウィンドウ幅（ｗ）の単位でずらしても良い。
【００４１】
エラー・データ作成部１３０は、コミュニケーション・エラー検出部１２０から取得した会話データＤｉのエラー・データを作成し、データ格納部２００の各データベース２１０〜２３０に格納する（ステップ６０６）。コミュニケーション・エラーＤＢ２１０には、会話データＤｉの各発言のテキストと、内容語についての情報が格納される。具体的には、次の会話データＤｉの場合、図３に示した構成のデータがコミュニケーション・エラーＤＢ２１０に格納される。

Ａ：Ａｇｒｅｅ？
Ｂ：Ｎｏ．
Ａ：Ｏｈ？？？ｗｈｙ？

なお、図３においては、上記の会話データＤｉから抽出されたコミュニケーション・エラーに対してエラーＩＤ「ＣＥ００１」が付与され、話者Ａに話者ＩＤ「ＣＰ００１」、話者Ｂに話者ＩＤ「ＣＰ００２」が付与されている。
【００４２】
また、プロファイルＤＢ２２０には、話者ＩＤ「ＣＰ００１」の話者（話者Ａ）と、話者ＩＤ「ＣＰ００２」の話者（話者Ｂ）の話者情報が格納される。図４に示した例では、話者ＩＤ「ＣＰ００１」に対して「社員情報００１」という話者情報が格納され、話者ＩＤ「ＣＰ００２」に対して「社員情報００２」という話者情報が格納されている。これらの話者情報は、外部データベース（例えば、社内チャットの場合、社員情報管理用のデータベース等）から取得される。
【００４３】
話者ＩＤは、その話者ＩＤが付与された特定のコミュニケーション・エラーを含む会話データＤｉにおける話者を識別する情報に過ぎない。例えば、図３、４における話者ＩＤ「ＣＰ００１」、「ＣＰ００２」は、エラーＩＤ「ＣＥ００１」のコミュニケーション・エラーを含む会話データＤｉにおける話者Ａと話者Ｂとを識別する。しかし、この話者ＩＤを話者情報に関連付けておくことにより、他の会話データＤｉにおける同一話者のコミュニケーション・エラーを検索することが可能となる。例えば、社員情報００１をキーとすることで、話者ＩＤ「ＣＰ００１」を話者に含むエラーＩＤ「ＣＥ００１」の会話データＤｉと共に、同じく社員情報００１に対応する話者ＩＤを話者に含む会話データが検出される。このため、例えば特定の話者についてのコミュニケーション・エラーの情報を集め、話者ごとの癖や傾向を調べることが可能となる。
【００４４】
また、メタ・データＤＢ２３０には、コミュニケーション・エラーの内容に基づき、注意事項等の種々の付加情報が、必要に応じて格納される。図５に示したメタ・データＤＢ２３０の例では、エラーＩＤ「ＣＥ００１」に関する付加情報は格納されていない。
【００４５】
＜コミュニケーション・エラー検出の具体例＞
次に、具体的な会話データＤｉを処理対象として、本実施形態によるコミュニケーション・エラー検出の具体例を説明する。
図７に処理対象である会話データＤｉの例文を示す。
図７に示す例文は、いずれも英文であり、レンタカー会社の予約センターでの電話会話を書き起こしたものである。また、各例文にはＣｕｓｔｏｍｅｒとＡｇｅｎｔにより交互になされた４つの発言が記載されているが、このうち、後の３つの発言をウィンドウ幅ｗ＝３の会話データＤｉとして切り出し、処理対象とする。すなわち、例文１の会話データＤｉにおいては、Ａｇｅｎｔの発言数ｎ（Ａｇｅｎｔ）＝２、Ｃｕｓｔｏｍｅｒの発言数ｎ（Ｃｕｓｔｏｍｅｒ）＝１である。また、閾値（ｔｈ）をｔｈ＝０．６とする。
【００４６】
例文１では、Ａｇｅｎｔによる発言について、本実施形態によるコミュニケーション・エラー検出を適用する。
まず、Ａｇｅｎｔの最初の発言「ｏｋ．ｓｏｐｉｃｋｉｎｇｕｐｔｈｅｃａｒｆｒｏｍｎｅｗＯｒｌｅａｎｓｏｎｗｈｉｃｈｄａｔｅ．」から内容語を抽出すると、「ｏｋ」、「ｐｉｃｋｉｎｇｕｐ」、「ｃａｒ」、「ｎｅｗＯｒｌｅａｎｓ」、「ｗｈｉｃｈ」、「ｄａｔｅ」の６語が抽出される。次に、Ａｇｅｎｔの２番目の発言「ｏｎｗｈｉｃｈｄａｔｅ．」から内容語を抽出すると、「ｗｈｉｃｈ」、「ｄａｔｅ」の２語が抽出される。
【００４７】
Ａｇｅｎｔの発言数ｎ（Ａｇｅｎｔ）＝２であるので、ａｖｅｒａｇｅ（Ａｇｅｎｔ）の値は、Ａｇｅｎｔの最初の発言における内容語の数に等しい。すなわち、ａｖｅｒａｇｅ（Ａｇｅｎｔ）＝６である。次に、ｌｅｓｓｉｎｆｏ（Ａｇｅｎｔ）を計算すると、

ｌｅｓｓｉｎｆｏ（Ａｇｅｎｔ）＝（６−２）／６＝０．６６６６

となる。閾値ｔｈ＝０．６であるから、ｌｅｓｓｉｎｆｏ（Ａｇｅｎｔ）＞ｔｈとなり、コミュニケーション・エラー検出部１２０は、会話データＤｉに関してコミュニケーション・エラーが生じていると判定する。
【００４８】
例文２の会話データＤｉは、Ａｇｅｎｔの発言数ｎ（Ａｇｅｎｔ）＝１、Ｃｕｓｔｏｍｅｒの発言数ｎ（Ｃｕｓｔｏｍｅｒ）＝２である。この例文２において、Ｃｕｓｔｏｍｅｒによる発言について、本実施形態によるコミュニケーション・エラー検出を適用する。
例文２では、Ｃｕｓｔｏｍｅｒの最初の発言「Ｓｈｉｎｙｏｋｏｈａｍａ」と、２番目の発言「Ｓｈｉｎｙｏｋｏｈａｍａ」とが同一語句のみを含んでいる。したがって、ｎｏｔ＿ｎｅｗ（Ａｇｅｎｔ）を計算すると、

ｎｏｔ＿ｎｅｗ（Ａｇｅｎｔ）＝１／１＝１．０

となる。閾値ｔｈ＝０．６であるから、ｎｏｔ＿ｎｅｗ（Ａｇｅｎｔ）＞ｔｈとなり、コミュニケーション・エラー検出部１２０は、会話データＤｉに関してコミュニケーション・エラーが生じていると判定する。
【００４９】
この他、コミュニケーション・エラーの検出処理の説明等で提示した例文、

Ａ：Ａｇｒｅｅ？
Ｂ：Ｎｏ．
Ａ：Ｏｈ？？？ｗｈｙ？

の場合、話者Ａの最終発言に、コミュニケーション・エラーを明示的に示す語として事前に登録されている感嘆詞「Ｏｈ」および文字列「？？？」が含まれている。したがって、ｃｏｎｆｕｓｉｎｇ（Ａ）を計算すると、内容語が「Ｏｈ」、「？？？」、「ｗｈｙ」の３語であり、そのうちコミュニケーション・エラーを明示的に示す登録語が「Ｏｈ」、「？？？」の２語であるから、

ｃｏｎｆｕｓｉｎｇ（Ａ）＝２／３＝０．６６６６

となる。閾値ｔｈ＝０．６であるから、ｃｏｎｆｕｓｉｎｇ（Ａ）＞ｔｈとなり、コミュニケーション・エラー検出部１２０は、会話データＤｉに関してコミュニケーション・エラーが生じていると判定する。
【００５０】
＜適用例＞
次に、本実施形態が適用されるテキスト処理システムについて説明する。
図８は、テキスト処理システムの構成例を示す図である。
図８に示すシステムは、データ処理装置１００と、データ格納部２００と、ランタイム実行部３００と、エラー・データ抽出部４００と、情報通知部５００とを備える。これらの構成のうち、データ処理装置１００およびデータ格納部２００は、図１に示した本実施形態のコミュニケーション・エラー抽出システムと同様である。また、エラー・データ抽出部４００および情報通知部５００は、データ処理装置１００およびデータ格納部２００と同一のコンピュータ上に構成されても良い。
【００５１】
ランタイム実行部３００は、会話セッションを実行し管理する。具体的には、例えば、チャット・システムにおいて、チャット・サーバにより提供されるチャットのセッションの管理機能や、電話での会話をテキスト化して処理するシステムにより提供される管理機能により実現される。システムの実施態様によっては、データ処理装置１００およびデータ格納部２００と同一のコンピュータ上に構成されても良い。このランタイム実行部３００は、会話セッションの開始時に、会話セッションに参加する話者の情報や会話セッションで用いられる言語の情報等、会話セッションの属性を表す情報をエラー・データ抽出部４００に渡す。
【００５２】
エラー・データ抽出部４００は、ランタイム実行部３００により実行される会話セッションごとに、その会話セッションの属性に応じたエラー・データをデータ格納部２００から取得し、保持する。具体的には、ランタイム実行３００から取得した会話セッションに参加する話者のプロファイルに基づいて、会話セッションに参加する話者情報に対応する話者情報をプロファイルＤＢにおいて検索する。そして、検索された話者情報に関連付けられている話者ＩＤを用いて、その話者が過去に遭遇したコミュニケーション・エラーのエラー・データをデータ格納部２００のコミュニケーション・エラーＤＢ２１０から抽出し、保持する。また、抽出されたコミュニケーション・エラーにメタ・データが付加されている場合、そのメタ・データをメタ・データＤＢ２３０から取得し、保持する。
【００５３】
なお、プロファイルＤＢを検索する場合、会話セッションに参加する話者と同一の話者のみを検索することも可能であるし、話者情報を利用して、国籍や使用言語が同じ話者を検索することも可能である。どの範囲で話者を検索するかは、テキスト処理システムの利用目的や利用態様などに応じて任意に定めれば良い。
【００５４】
情報通知部５００は、ランタイム実行部３００により実行される会話セッションにおいて、コミュニケーション・エラーが発生しやすい場面で、コミュニケーション・エラーに関する情報（警告等）を出力する。具体的には、会話セッションにおけるウィンドウ幅（ｗ）の範囲のテキストと、エラー・データ抽出部４００により保持されているコミュニケーション・エラーのテキストとを比較し、これらが類似している場合に、そのコミュニケーション・エラーに付加されているメタ・データの内容を記載したメッセージを、話者に通知する。話者への通知は、例えば、話者が使用している端末装置の表示画面にポップアップ・ウィンドウを開いて表示したり、音声出力したりすることによって実現される。
【００５５】
また、図８に示すシステムでは、ランタイム実行部３００による会話セッションの実行に伴い、データ処理装置１００のデータ取得部１１０が、その会話セッションでなされた発言のテキストを逐次取得する。そして、図６に示した手順により、コミュニケーション・エラー検出部１２０およびエラー・データ作成部１３０による処理が行われ、検出されたコミュニケーション・エラーのエラー・データがデータ格納部２００の各データベース２１０、２２０、２３０に随時追加登録されていく。
【００５６】
一方、データ処理装置１００のコミュニケーション・エラー検出部１２０により抽出された内容語の情報は、情報通知部５００にも送られる。情報通知部５００は、取得した内容語の情報を用いて、会話セッションにおける発言のテキストとコミュニケーション・エラーのテキストとを比較し、類似しているか否かを判断する。
【００５７】
テキストの類似判定について、具体例を挙げて説明する。
エラー・データ抽出部４００により、図９に示すようなコミュニケーション・エラーのエラー・データが保持されており、会話セッションにおいて、次のような会話があったものとする。

Ａ：ｍｉｎｄｍｙｓｍｏｋｉｎｇ？
Ｂ：Ｙｅｓ．
Ａ：ｗｈｙ？？

この会話データにおいて、各話者Ａ、Ｂの発言から抽出される内容語は、次のようになる。

Ａ：｛ｍｉｎｄ，ｍｙ，ｓｍｏｋｉｎｇ，ｗｈｙ｝
Ｂ：｛ｙｅｓ｝
【００５８】
話者Ａの話者ＩＤが「ＣＰ０２０」、話者Ｂの話者ＩＤが「ＣＰ０２１」である場合、上記の会話データと図９に示すエラー・データとが比較され、単語の一致率に基づいて類否判断が行われる。
まず、話者Ａの発言について、上記会話データ｛ｍｉｎｄ，ｍｙ，ｓｍｏｋｉｎｇ，ｗｈｙ｝と、図９のエラー・データ｛ｙｏｕ，ｍｉｎｄ，ｍｙ，ｓｍｏｋｉｎｇ，ｒｅａｌｌｙ｝との単語の一致率を調べる。これら２つのデータに表れる単語の総数（同一の単語を除く）は、「ｍｉｎｄ」、「ｍｙ」、「ｓｍｏｋｉｎｇ」、「ｗｈｙ」、「ｙｏｕ」、「ｒｅａｌｌｙ」の６個であり、そのうち両データに含まれる単語は、「ｍｉｎｄ」、「ｍｙ」、「ｓｍｏｋｉｎｇ」の３個である。したがって、単語の一致率を、３／６＝０．５と算出する。同様に話者Ｂの発言について会話データとエラー・データの単語の一致率を調べると、１／１＝１．０と算出される。
【００５９】
次に、各話者Ａ、Ｂの発言における単語の一致率の平均を求め、ウィンドウ幅（ｗ）の会話データ全体での単語の一致率とする。上記の例では、（０．５＋１．０）／２＝０．７５と算出される。
同様の計算が、エラー・データ抽出部４００に保持されている全てのエラー・データに対して行われる。そして、一定の基準を満足するエラー・データを類似するエラー・データと判定する。ここで、判定基準としては、実際の運用に即して任意に定め得るが、例えば、単語の一致率が予め定めた閾値（例えば０．７）以上のエラー・データとしたり、最大の一致率を持つエラー・データとしたりすることができる。類似すると判定されたエラー・データに、メタ・データが付加されていた場合は、上述したように、メタ・データの内容が抽出されて、話者へのメッセージとして通知される。
【００６０】
以上、本実施形態について説明したが、本発明の技術的範囲は上記実施形態に記載の範囲には限定されない。例えば、上記実施形態では、会話データの各発言のテキストから３種類の特徴量を求め、４つの指標に基づいてコミュニケーション・エラーが生じているか否かの判定を行ったが、必ずしもこれら全てを組み合わせて用いなくても良い。例えば、４つの指標のうち、いくつかを選択して判定に用いるようにしても構わない。その他、上記実施形態に、種々の変更または改良を加えたものも、本発明の技術的範囲に含まれることは、特許請求の範囲の記載から明らかである。
【図面の簡単な説明】
【００６１】
【図１】本実施形態によるコミュニケーション・エラー抽出システムの構成例を示す図である。
【図２】図１のコミュニケーション・エラー抽出システムを実現するコンピュータのハードウェア構成例を示す図である。
【図３】本実施形態のコミュニケーション・エラーＤＢの構成例を示す図である。
【図４】本実施形態のプロファイルＤＢの構成例を示す図である。
【図５】本実施形態のメタ・データＤＢの構成例を示す図である。
【図６】本実施形態のコミュニケーション・エラー検出部およびエラー・データ作成部の処理の手順を示すフローチャートである。
【図７】本実施形態の処理対象である会話データの例文を示すである。
【図８】本実施形態が適用されるテキスト処理システムの構成例を示す図である。
【図９】エラー・データ抽出部により抽出されたエラー・データの例を示す図である。
【符号の説明】
【００６２】
１０ａ…ＣＰＵ、１０ｃ…メイン・メモリ、１０ｇ…磁気ディスク装置、１００…データ処理装置、１１０…データ取得部、１２０…コミュニケーション・エラー検出部、１３０…エラー・データ作成部、２００…データ格納部、２１０…コミュニケーション・エラー・データベース（ＤＢ）、２２０…プロファイル・データベース（ＤＢ）、２３０…メタ・データ・データベース（ＤＢ）

【特許請求の範囲】
【請求項１】
会話データにおけるコミュニケーション・エラーを検出するシステムであって、
処理対象の会話データを取得する取得部と、
前記取得部により取得された前記会話データを形態素解析し、解析結果に基づき会話における情報伝達の度合いを表す特徴量を求め、求めた特徴量に基づきコミュニケーション・エラーが生じているか否かを判定する判定部と、
前記判定部によりコミュニケーション・エラーが生じていると判定された場合に、当該コミュニケーション・エラーの内容を示すエラー・データを作成し、データベースに格納するエラー・データ作成部と、
を備える、システム。
【請求項２】
前記判定部は、
・単独で伝達されるべき情報を持つ語である内容語の数
・複数の発言の間で重複している前記内容語の数
・コミュニケーション・エラーを明示的に示す特定の語の数
のうち、少なくとも１つを前記特徴量として求める、請求項１に記載のシステム。
【請求項３】
前記判定部は、前記形態素解析により得られる品詞の情報に基づき、助詞以外の語を前記内容語として、その数を求める、請求項２に記載のシステム。
【請求項４】
前記判定部は、前記形態素解析により得られる品詞の情報に基づき、形容詞、副詞、接続詞、名詞、動詞または疑問詞のいずれかに該当する語を前記内容語として、その数を求める、請求項２に記載のシステム。
【請求項５】
前記判定部は、
少なくとも、単独で伝達されるべき情報を持つ語である内容語の数を前記特徴量として求め、
前記会話データにおける特定の話者の最終発言に含まれる前記内容語の数が、それまでの当該話者の発言における前記内容語の数の平均に対して一定以上少ない場合に、コミュニケーション・エラーが生じていると判定する、請求項１に記載のシステム。
【請求項６】
前記判定部は、
少なくとも、単独で伝達されるべき情報を持つ語である内容語のうち複数の発言の間で重複しているものの数を前記特徴量として求め、
前記会話データにおける特定の話者の最終発言に含まれる前記内容語のうち、当該話者の直前の発言に含まれる前記内容語と重複する語の割合が一定以上ある場合に、コミュニケーション・エラーが生じていると判定する、請求項１に記載のシステム。
【請求項７】
前記判定部は、
少なくとも、単独で伝達されるべき情報を持つ語である内容語の数を前記特徴量として求め、
前記会話データにおける特定の話者の最終発言に含まれる前記内容語の数、および、当該会話データにおける他の話者の最終発言に含まれる前記内容語の数が、それまでの当該特定の話者の発言における前記内容語の数の平均に対して一定以上少ない場合に、コミュニケーション・エラーが生じていると判定する、請求項１に記載のシステム。
【請求項８】
前記判定部は、
少なくとも、単独で伝達されるべき情報を持つ語である内容語の数、および当該内容語のうちでコミュニケーション・エラーを明示的に示す特定の語の数を前記特徴量として求め、
前記会話データにおける特定の話者の最終発言に含まれる前記内容語に対する前記特定の語の割合が一定以上ある場合に、コミュニケーション・エラーが生じていると判定する、請求項１に記載のシステム。
【請求項９】
前記判定部は、
・単独で伝達されるべき情報を持つ語である内容語の数
・複数の発言の間で重複している前記内容語の数
・コミュニケーション・エラーを明示的に示す特定の語の数
のうち、少なくとも１つを前記特徴量として求め、
前記会話データにおける特定の話者の最終発言に含まれる前記内容語の数が、それまでの当該話者の発言における前記内容語の数の平均に対して一定以上少ない場合、
前記会話データにおける特定の話者の最終発言に含まれる前記内容語のうち、当該話者の直前の発言に含まれる前記内容語と重複する語の割合が一定以上ある場合、
前記会話データにおける特定の話者の最終発言に含まれる前記内容語の数、および、当該会話データにおける他の話者の最終発言に含まれる前記内容語の数が、それまでの当該特定の話者の発言における前記内容語の数の平均に対して一定以上少ない場合、
前記会話データにおける特定の話者の最終発言に含まれる前記内容語に対する前記特定の語の割合が一定以上ある場合、
のいずれか１つ、または複数の条件が成り立つ場合に、コミュニケーション・エラーが生じていると判定する、請求項１に記載のシステム。
【請求項１０】
会話データにおけるコミュニケーション・エラーを検出するシステムであって、
処理対象の会話データを取得する取得部と、
前記取得部により取得された前記会話データを形態素解析し、解析結果に基づき会話における情報伝達の度合いを表す特徴量を求め、得られた特徴量に基づきコミュニケーション・エラーが生じているか否かを判定する判定部と、
前記判定部によりコミュニケーション・エラーが生じていると判定された場合に、当該コミュニケーション・エラーの内容を示すエラー・データを作成し、データベースに格納するエラー・データ作成部とを備え、
前記判定部は、
・単独で伝達されるべき情報を持つ語である内容語の数
・複数の発言の間で重複している前記内容語の数
・コミュニケーション・エラーを明示的に示す特定の語の数
を前記特徴量として求め、
前記会話データにおける特定の話者の最終発言に含まれる前記内容語の数が、それまでの当該話者の発言における前記内容語の数の平均に対して一定以上少ない場合、
前記会話データにおける特定の話者の最終発言に含まれる前記内容語のうち、当該話者の直前の発言に含まれる前記内容語と重複する語の割合が一定以上ある場合、
前記会話データにおける特定の話者の最終発言に含まれる前記内容語の数、および、当該会話データにおける他の話者の最終発言に含まれる前記内容語の数が、それまでの当該特定の話者の発言における前記内容語の数の平均に対して一定以上少ない場合、
前記会話データにおける特定の話者の最終発言に含まれる前記内容語に対する前記特定の語の割合が一定以上ある場合、
のいずれか１つ、または複数の条件が成り立つ場合に、コミュニケーション・エラーが生じていると判定する、システム。
【請求項１１】
コンピュータが会話データにおけるコミュニケーション・エラーを検出する方法であって、
処理対象の会話データの文を形態素解析するステップと、
前記形態素解析の結果に基づき会話における情報伝達の度合いを表す特徴量として、
・単独で伝達されるべき情報を持つ語である内容語の数
・複数の発言の間で重複している前記内容語の数
・コミュニケーション・エラーを明示的に示す特定の語の数
のうち、少なくとも１つを求めるステップと、
前記特徴量に基づきコミュニケーション・エラーが生じているか否かを判定するステップと、
コミュニケーション・エラーが生じていると判定された場合に、当該コミュニケーション・エラーの内容を示すエラー・データを作成し、データベースに格納するステップと、
を含む、方法。
【請求項１２】
前記コミュニケーション・エラーが生じているか否かを判定するステップでは、
前記会話データにおける特定の話者の最終発言に含まれる前記内容語の数が、それまでの当該話者の発言における前記内容語の数の平均に対して一定以上少ない場合、
前記会話データにおける特定の話者の最終発言に含まれる前記内容語のうち、当該話者の直前の発言に含まれる前記内容語と重複する語の割合が一定以上ある場合、
前記会話データにおける特定の話者の最終発言に含まれる前記内容語の数、および、当該会話データにおける他の話者の最終発言に含まれる前記内容語の数が、それまでの当該特定の話者の発言における前記内容語の数の平均に対して一定以上少ない場合、
前記会話データにおける特定の話者の最終発言に含まれる前記内容語に対する前記特定の語の割合が一定以上ある場合、
のいずれか１つ、または複数の条件が成り立つ場合に、コミュニケーション・エラーが生じていると判定する、請求項１１に記載の方法。
【請求項１３】
コンピュータに、
処理対象の会話データの文を形態素解析する処理と、
前記形態素解析の結果に基づき会話における情報伝達の度合いを表す特徴量として、
・単独で伝達されるべき情報を持つ語である内容語の数
・複数の発言の間で重複している前記内容語の数
・コミュニケーション・エラーを明示的に示す特定の語の数
のうち、少なくとも１つを求める処理と、
前記特徴量に基づきコミュニケーション・エラーが生じているか否かを判定する処理と、
コミュニケーション・エラーが生じていると判定された場合に、当該コミュニケーション・エラーの内容を示すエラー・データを作成し、データベースに格納する処理と、
を実行させる、プログラム。
【請求項１４】
前記コミュニケーション・エラーが生じているか否かを判定する処理では、
前記会話データにおける特定の話者の最終発言に含まれる前記内容語の数が、それまでの当該話者の発言における前記内容語の数の平均に対して一定以上少ない場合、
前記会話データにおける特定の話者の最終発言に含まれる前記内容語のうち、当該話者の直前の発言に含まれる前記内容語と重複する語の割合が一定以上ある場合、
前記会話データにおける特定の話者の最終発言に含まれる前記内容語の数、および、当該会話データにおける他の話者の最終発言に含まれる前記内容語の数が、それまでの当該特定の話者の発言における前記内容語の数の平均に対して一定以上少ない場合、
前記会話データにおける特定の話者の最終発言に含まれる前記内容語に対する前記特定の語の割合が一定以上ある場合、
のいずれか１つ、または複数の条件が成り立つ場合に、コミュニケーション・エラーが生じていると、前記コンピュータに判定させる、請求項１３に記載のプログラム。

【図１】

【図２】

【図３】

【図４】

【図５】

【図６】

【図７】

【図８】

【図９】

【公開番号】特開２０１０−６１５５５（Ｐ２０１０−６１５５５Ａ）
【公開日】平成２２年３月１８日（２０１０．３．１８）
【国際特許分類】

物理学 (1,541,580)
- 計算；計数 (381,677)
  - 管理目的，商用目的，金融目的，経営目的，監督目的または予測目的... (55,954)
    - 特定の業種，例．医療，公益事業，観光業または法律業，に特に適合... (24,192)
  - 電気的デジタルデータ処理 (228,215)
    - メモリ，入力／出力装置または中央処理ユニットの間の情報または他... (29,400)

【出願番号】特願２００８−２２８７２２（Ｐ２００８−２２８７２２）
【出願日】平成２０年９月５日（２００８．９．５）
【出願人】（３９０００９５３１）インターナショナル・ビジネス・マシーンズ・コーポレーション (4,084)
【氏名又は名称原語表記】ＩＮＴＥＲＮＡＴＩＯＮＡＬ　ＢＵＳＩＮＥＳＳ　ＭＡＳＣＨＩＮＥＳ　ＣＯＲＰＯＲＡＴＩＯＮ
【復代理人】
【識別番号】１００１０４８８０
【弁理士】
【氏名又は名称】古部　次郎
【復代理人】
【識別番号】１００１１８２０１
【弁理士】
【氏名又は名称】千田　武
【復代理人】
【識別番号】１００１１８１０８
【弁理士】
【氏名又は名称】久保　洋之

[ Back to top ]

コミュニケーション・エラーを検出するシステムおよび方法

メニュー

スポンサーリンク

次の公報 »

« 前の公報

コミュニケーション・エラーを検出するシステムおよび方法

メニュー

スポンサー リンク

次の公報 »

« 前の公報

スポンサーリンク