説明

対話型指導支援装置及び対話型指導支援方法

【課題】対象者に負担をかけることなく行動変容ステージの自動判定を可能とすることで、対話型指導の効率化と指導内容の均質化を図る。
【解決手段】対話型指導支援装置は、対話型指導における指導者と対象者との会話を記録した発話記録データを取得する発話記録取得部と、前記発話記録データに含まれる会話を文単位に分解する分解部と、2つの文の間の連続性を、前記分解部で得られた文の全ての組み合わせについて、評価する連続性評価部と、前記連続性評価部で得られた連続性に基づき、他の文に与える影響の強さを表す特徴量である影響度と他の文との関連の強さを表す特徴量である関連度とを、それぞれの文について算出する特徴量計算部と、影響度と関連度からなる特徴量空間に、前記対象者が発話した文の特徴量をマッピングする分布マップ作成部と、前記特徴量空間における特徴量の分布パターンに基づき、前記対象者の行動変容ステージを判定する判定部と、を備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、保健指導などの対話型指導を支援するための技術に関する。
【背景技術】
【0002】
2008年4月より、メタボリックシンドローム(内臓脂肪症候群)対策として特定検診・特定保健指導制度が開始され、特定検診でメタボリックシンドローム又はその予備軍と判定された人は、専門家による保健指導を所定の期間受けることが義務付けられることとなった。しかしながら、特定保健指導の対象となる者は約2000万人にのぼると予想されるのに対して、保健指導にあたる保健師の数は約4万人しか存在していない。しかも、行動科学のスキルを持つ保健師となると、その数は非常に限られてしまうという問題が指摘されている。
【0003】
対話形式の指導で高い効果を得るためには、指導者が指導対象者の現在の行動変容ステージ(意識レベル)を正しく把握し、そのステージに応じた適切な指導を対象者に与えることで、改善に向けた行動変容を促すことが必要とされる。以下は、行動心理学に基づく行動変容ステージモデルの一例である。
【0004】
(1)無関心期:6ヶ月以内に行動を変える気がない状態。
必要性の自覚をもたせるための指導が必要。
(2)関心期:6ヶ月以内に行動を変える気がある状態。
動機及び自信をつけさせるための指導が必要。
(3)準備期:1ヶ月以内に行動を変える気がある状態。
行動計画のコミットが必要。
(4)行動期:行動を変えて6ヶ月以内の状態。
ご褒美やフォローを与えることが必要。
(5)維持期:行動を変えて6ヶ月以上の状態。
【0005】
しかしながら、対象者との会話から行動変容ステージを客観的に特定するのは極めて難しく、指導者個人の経験やスキルに依存して指導内容が大きくばらついてしまうという問題があった。
【0006】
そこで従来は、アンケートにより対象者の意識レベルを特定することが一般に行われている。また特許文献1では、意識レベルを調査・確認するための質問を画面に表示して、対象者に回答を入力させ、その回答内容に基づいて意識レベルを判定しアドバイスを出力する装置が提案されている。この装置は、手書きのアンケートを電子化したものに相当する。しかし、このようなアンケートによる方式では、意識レベルの判定のためだけに多くの質問を行う必要があり非効率的である。またアンケートの実施は、指導者と対象者の双方に負担が発生するため好ましくない。
【特許文献1】特開2002−358372号公報
【発明の開示】
【発明が解決しようとする課題】
【0007】
本発明は上記実情に鑑みてなされたものであって、その目的とするところは、対象者に負担をかけることなく行動変容ステージの自動判定を可能とすることで、対話型指導の効率化と指導内容の均質化を図ることにある。
【課題を解決するための手段】
【0008】
上記目的を達成するために本発明は、以下の構成を採用する。
【0009】
本発明に係る対話型指導支援装置は、対話型指導における指導者と対象者との会話を記録した発話記録データを取得する発話記録取得部と、前記発話記録データに含まれる会話を文単位に分解する分解部と、2つの文の間の連続性を、前記分解部で得られた文の全ての組み合わせについて、評価する連続性評価部と、前記連続性評価部で得られた連続性に基づき、他の文に与える影響の強さを表す特徴量である影響度と他の文との関連の強さを表す特徴量である関連度とを、それぞれの文について算出する特徴量計算部と、影響度と関連度からなる特徴量空間に、前記対象者が発話した文の特徴量をマッピングする分布マップ作成部と、前記特徴量空間における特徴量の分布パターンに基づき、前記対象者の行動変容ステージを判定する判定部と、を備える。
【0010】
この構成によれば、指導者(保健師などの専門家)と対象者との会話を記録した発話記録データから、対象者の行動変容ステージ(意識レベル)を自動で判定することができる。したがって、指導者は、対面指導の時間は対象者との会話に集中できるため、効率的である。また、対象者の行動変容ステージが自動的に且つ客観的に判定されるので、指導者の経験やスキルとは無関係に指導内容の均質化が可能となる。
【0011】
ここで、前記連続性評価部は、第1の文字列と第2の文字列の組み合わせを定義した判定条件を含む評価ルールを予め有しており、2つの文のうちの第1の文が前記第1の文字列を含み、且つ、第2の文が前記第2の文字列を含んでいる場合に、この2つの文が連続性を有していると判定することが好ましい。
【0012】
これにより、文同士の連続性(因果関係ということもできる)を簡単な処理で評価することが可能となる。
【0013】
学習用データを用いて前記評価ルールの判定条件を自動生成する判定条件生成部をさらに備え、前記学習用データは、連続性を有する第1の文と第2の文のペアで構成されており、前記判定条件生成部は、前記学習用データに含まれるそれぞれの文の種類を、その文に含まれる記述に基づいて識別し、前記学習用データの中から、第1の文の種類と第2の文の種類の組み合わせが同じであって、且つ、第1の文と第2の文のそれぞれに同一又は類似の単語が含まれているペアを抽出し、抽出された各ペアから、第1の文における前記記述又は/及び前記単語を第1の文字列、第2の文における前記記述又は/及び前記単語を第2の文字列とする判定条件を生成することが好ましい。
【0014】
これにより、連続性の評価に用いる評価ルールの自動生成が可能になるとともに、このようにして生成した評価ルールを用いることで会話文の連続性を精度よく判定可能となる。
【0015】
会話文には、省略や照応が多かったり、間投詞や倒置が含まれていたりするため、一般的な形態素解析(単語)や構文解析(係り受けなど)のみでは文脈(つまり文の連続性)を評価することが困難である。これに対して、本発明は、(1)会話文でも語尾などから文の種類を識別可能である、(2)連続し得る文の種類の組み合わせは決まっている、(3)2つの文が、連続し得る文の種類の組み合わせの関係にあり、一方の文に含まれる単語と他方の文に含まれる単語との間に関連があれば、2つの文が連続するとみなすことができる、というアイデアに基づき、上記のような判定条件及び評価方法を採用している。
【0016】
すなわち、「第1の文の種類と第2の文の種類の組み合わせが同じ」ペアを抽出する処理は、多数の学習用データの中から(2)の「連続し得る文の種類の組み合わせ」を検出することと等価である。また、「第1の文と第2の文のそれぞれに同一又は類似の単語が
含まれているペアを抽出」する処理は、第1の文と第2の文に共起する頻度が高い単語(類語含む)の組み合わせを検出することと等価である。2つの文に共起する頻度が高いということはその2つの単語には関連性があるとみなすことができる。したがって、「第1の文における前記記述又は/及び前記単語を第1の文字列、第2の文における前記記述又は/及び前記単語を第2の文字列とする判定条件」を用いて評価する処理は、上記(3)の「2つの文が、連続し得る文の種類の組み合わせの関係にあり、一方の文に含まれる単語と他方の文に含まれる単語との間に関連」があるか否かを評価する処理と等価である。
【0017】
前記判定部は、各行動変容ステージに対応する分布パターンを定義したテンプレートを予め備えており、前記特徴量空間における特徴量の分布パターンを各テンプレートと照合することにより、該当する行動変容ステージを特定することが好ましい。
【0018】
行動変容ステージごとに指導情報を予め記憶しており、前記判定部によって判定された行動変容ステージに応じて指導情報を出力する出力部をさらに備えることが好ましい。
【0019】
これにより、対象者に行動変容を促すのに最適な指導情報を指導者に提供できるため、対話型指導の一層の効率化、及び均質化を図ることができる。
【0020】
本発明は、上記手段の少なくとも一部を有する対話型指導支援装置として捉えてもよいし、コンピュータネットワークを介して通信可能な端末と対話型指導支援サーバからなる対話型指導支援システムとして捉えてもよい。また、本発明は、上記処理の少なくとも一部を含む対話型指導支援方法、または、かかる方法の各ステップをコンピュータに実行させるためのプログラムやそのプログラムを記録した記録媒体として捉えることもできる。なお、上記手段および処理の各々は可能な限り互いに組み合わせて本発明を構成することができる。
【0021】
例えば、本発明に係る対話型指導方法は、コンピュータが、対話型指導における指導者と対象者との会話を記録した発話記録データを取得する取得ステップと、前記発話記録データに含まれる会話を文単位に分解する分解ステップと、2つの文の間の連続性を、前記分解ステップで得られた文の全ての組み合わせについて、評価する連続性評価ステップと、前記連続性評価ステップで得られた連続性に基づき、他の文に与える影響の強さを表す特徴量である影響度と他の文との関連の強さを表す特徴量である関連度とを、それぞれの文について算出する特徴量計算ステップと、影響度と関連度からなる特徴量空間に、前記対象者が発話した文の特徴量をマッピングする分布マップ作成ステップと、前記特徴量空間における特徴量の分布パターンに基づき、前記対象者の行動変容ステージを判定する判定ステップと、を実行するものである。
【発明の効果】
【0022】
本発明によれば、対象者に負担をかけることなく行動変容ステージの自動判定が可能となる。これにより、対話型指導の効率化と指導内容の均質化を図ることができる。
【発明を実施するための最良の形態】
【0023】
以下に図面を参照して、この発明の好適な実施の形態を例示的に詳しく説明する。本実施形態の対話型指導支援装置は、指導者と対象者(クライアント)との会話を記録した発話記録データから、対象者の行動変容ステージ(意識レベル)を自動判定する装置である。例えば、カウンセリング終了時にその場で判定結果を出力し、指導内容の策定に役立てたり(オンライン分析)、カウンセリングの記録を後で分析し次回の指導に役立てたり(オフライン分析)、という利用を想定している。この装置は、保健師が行う保健指導をはじめとして、対話形式で行われる各種の対話型指導に利用可能である。
【0024】
<システム構成>
図1は、本発明の実施形態に係る保健指導支援装置の機能ブロック図である。
【0025】
保健指導支援装置は、発話記録取得部10、分解部11、連続性評価部12、特徴量計算部13、分布マップ作成部14、判定部15、及び、指導情報出力部16を備えている。保健指導支援装置は、CPU(中央演算処理装置)、メモリ(主記憶装置)、補助記憶装置、表示装置、入力装置などを備えた汎用のコンピュータで構成可能であり、上記各機能はCPUがメモリ又は補助記憶装置に格納されたプログラムを実行し、必要に応じて各種ハードウエア資源を制御することにより実現されるものである。
【0026】
(発話記録取得部)
発話記録取得部10は、発話記録データをメモリに読み込む機能である。発話記録データは、補助記憶装置若しくは外部記憶メディアから読み込まれるか、又は、コンピュータネットワークを介して他のコンピュータから読み込まれる。
【0027】
図2Aは、発話記録データの一例を示している。発話記録データには、少なくとも、指導者と対象者それぞれの発話が含まれる。図2Aの例では、指導者の発話が記号→で始まり、対象者の発話が記号<>で囲まれた形式となっており、両者の発話が容易に区別できるようになっている。なお発話記録データの形式はこれに限らず、タグなどで構造化されたテキストデータでもよいし、バイナリ形式のデータでもよい。また発話記録データとして会話を録音した音声データを用いることも好ましい。
【0028】
(分解部)
分解部11は、文章解析ルールを用いて発話記録データを解析し、発話記録に含まれる会話を文単位に分解する機能である。単純には、改行文字、句点、疑問符、感嘆符、ピリオドなどの特定の文字を検出することで、文の終端を判別することが可能である。なお発話記録データとして音声データが与えられた場合には、分解部11が音声認識により音声データをテキストデータに変換した後、文単位への分解処理を行う。
【0029】
図2Bは、図2Aの発話記録データを分解して得られた文データの一例を示している。この例に示すように、それぞれの文データは話者を示す情報と関連づけられた状態で格納される。
【0030】
(連続性評価部)
図3は、連続性評価部12の詳細な構成を示すブロック図である。連続性評価部12は、図3に示すように、(1)評価ルールに基づいて2つの文の間の連続性を評価する判定処理部120と、(2)学習用データを用いて評価ルールを自動生成する判定条件生成部121の2つの機能から構成される。
【0031】
ここではまず図3〜図6を参照して判定処理部120による連続性評価処理について説明することとし、判定条件生成部121の説明は後で行う。図4は連続性評価処理の流れを示すフローチャートであり、図5は連続性評価に利用される評価ルールの一例を示す図である。また図6は連続性評価結果の一例を示す図である。
【0032】
文1記憶部122と文2記憶部123にはそれぞれ分解部11で得られた文データが格納される。判定処理部120は、評価対象とする文1、文2をそれぞれ文1記憶部122、文2記憶部123から読み込み、評価ルール124に照合する(ステップS40)。
【0033】
評価ルールは、図5に示されるように、判定条件と設定値を含む形式のデータである。判定条件は、原則として、文1が含むべき第1の文字列と文2が含むべき第2の文字列の
組み合わせを定義するものである。評価対象の文1が第1の文字列を含み、且つ、文2が第2の文字列を含んでいた場合には、文1と文2の間に連続性ありと判定される。ここで「連続性」とは2つの文の会話としての成立度合いを示す尺度である。設定値は連続性(成立度合い)の強さを表す値であり、0〜1の範囲の値をとる。値0は、会話として明らかに成立しない組み合わせであることを表し、値が1に近づくほど連続性が強いことを表している。
【0034】
例えば図5の評価ルール1では、第1の文字列として「*調子*どうですか?」が、第2の文字列として「*まあまあ*」が設定されている。記号「*」はワイルドカード(任意の文字列)である。すなわち、文1が「調子」という単語を含み「どうですか?」という記述で終わる文であり、且つ、文2が「まあまあ」という単語を含んでいれば、この文1、文2は評価ルール1の判定条件を満たし、連続性は1と判断される。
【0035】
全ての評価ルールとの照合が行われ、文1、文2が判定条件を満たす評価ルールが発見された場合には(ステップS41;Yes)、該当ルールの設定値を文1から文2への連続性の強さを表す評価値として設定する(ステップS42)。一方、文1、文2が判定条件を満たす評価ルールが存在しなかった場合には(ステップS41;No)、文1から文2への評価値を0に設定する(ステップS43)。
【0036】
上記ステップS40〜S43の処理は、分解部11で得られた文の全ての組み合わせに対して繰り返される。これにより、2つの文の全通りの組み合わせについて連続性が評価され、その結果が図3の評価結果記憶部125に格納される。
【0037】
図6は、連続性の評価結果をマトリクスで示したものである。マトリクス中の数値が、縦n番目の文から横m番目の文への連続性の評価値を表している。この例では、「縦1:一万歩は大丈夫そうですね?」から「横2:そうですね、ちょっと遠回りしたりして歩くようにしています。」に対しては連続性あり(評価値=1)という評価結果が得られているが、「縦1:一万歩は大丈夫そうですね?」から「横6:和食中心でいいですね」に対しては連続性なし(評価値=0)という結果が得られたことが分かる。
【0038】
(特徴量計算部)
特徴量計算部13は、連続性評価部12で得られた連続性に基づき、それぞれの文の特徴量を算出する機能である。ここでは、文の特徴量として、他の文に与える影響の強さを表す特徴量である「影響度」と、他の文との関連の強さを表す特徴量である「関連度」の2つを用いる。
【0039】
ここで図7を参照して、影響度と関連度の算出方法を説明する。なお、図7では説明を簡単にするため5つの文での計算例を示すが、数十から数百の文を含む実際の発話記録データの場合も同様の方法で影響度と関連度を算出可能である。
【0040】
図7Aは連続性評価部12で得られた連続性評価値のマトリクスである。この例では、「文1→文2」、「文2→文3」、「文2→文4」、「文3→文4」、「文5→文4」の5つの組み合わせの評価値が1となっている。まず特徴量計算部13は、このマトリクスに基づき文同士の到達可能性を評価し、図7Bに示す可到達行列を生成する。到達可能性とは、文同士が直接又は間接的に連続性を有していることをいう。例えば、同じ文同士「文1→文1」や直接の連続性がある「文1→文2」は到達可能な組み合わせである。また「文1→文2」と「文2→文3」を順に辿ることにより、文1から文3へとつながるので、「文1→文3」も到達可能な組み合わせとなる。図7Bの可到達行列では、到達可能な組み合わせの値が1、到達不可能な組み合わせの値が0に設定される。
【0041】
次に、特徴量計算部13は、可到達行列の行ごとに到達可能性を合算し、それぞれの文のD値を求める。また、列ごとに到達可能性を合算して、それぞれの文のR値を求める。続いて特徴量計算部13は、それぞれの文について(D+R)の値と(D−R)の値を算出する。この(D+R)の値が関連度であり、(D−R)の値が影響度である。
【0042】
(分布マップ作成部)
分布マップ作成部14は、影響度と関連度からなる特徴量空間に、対象者が発話した文の特徴量をマッピングし、分布マップを作成する機能である。
【0043】
図8に分布マップの一例を示す。横軸が関連度、縦軸が影響度である。影響度と関連度の値は文の内容に応じて一定の傾向を示す。例えば「肥満解消にすべきことは何?」というような本質的な問いかけ(Know−Why)の文は、影響度が大きく関連度は小さい傾向にあり、また「毎日一万歩は歩いている。」というような具体的な手法・課題(Know−How)を述べている文は、影響度がマイナスの値をとる傾向にある。また感想を述べているような文は、影響度も関連度も大きくなる傾向にある。したがって、この分布マップにおける特徴量分布には、対象者の発話の内容の傾向が現れる。
【0044】
(判定部)
判定部15は、特徴量空間における特徴量の分布パターンに基づき、対象者の行動変容ステージ(意識レベル)を判定する機能である。具体的には、判定部15は、各行動変容ステージに対応する分布パターンを定義したテンプレートを予め備えており、分布マップ作成部14で得られた分布マップを各テンプレートと照合することによって、該当する行動変容ステージを特定する。
【0045】
図9は、テンプレートの一例を示している。「無関心期」ステージのテンプレートは、影響度がマイナスの領域に特徴量が集中したパターンである。無関心期には話の内容が具体的なものや単なる回答に偏り、話者自身が問いかけを行うことが少ないため、このような分布パターンになることが多い。「関心期」ステージのテンプレートは、特徴量が分散して現れるパターンである。これは話者の興味や話題が多様になってきたことを意味している。「準備期」ステージのテンプレートは、影響度がプラスの領域に特徴量の集中がみられるパターンである。準備期ステージでは、話者からの問いかけや話題の提供が多くなる一方で、行動を開始していないため具体的な話が少ないので、このようなパターンとなる。「行動期」ステージのテンプレートは、影響度がプラスの領域とマイナスの領域の2箇所に特徴量が集中したパターンである。実際に行動している話者の会話には、指導内容に対する興味や問いかけと、行動内容の報告などの具体的な話題とが適度に含まれるため、このようなバランスのとれたパターンが現れる。
【0046】
テンプレートと照合する際には、判定部15は、まず対象者の特徴量分布をクラスタリングする。クラスタ数が1で、且つ、影響度がマイナスの領域にクラスタが存在した場合には、「無関心期」と判定される。クラスタ数が1で、且つ、影響度がプラスの領域にクラスタが存在した場合には、「準備期」と判定される。クラスタ数が2で、各クラスタが影響度のプラスとマイナスに適度に分離していたら、「行動期」と判定される。なおクラスタ数が2であるが、クラスタ間の距離が小さい場合には、「準備期」若しくは「無関心期」に分類される。クラスタ数が3以上の場合は「関心期」と判定される。
【0047】
判定部15の判定結果は表示装置に出力される。指導者はその判定結果をみることで、対象者の行動変容ステージ(意識レベル)を把握でき、指導内容の策定に役立てることができる。さらに、判定部15の判定結果は指導情報出力部16にも引き渡される。
【0048】
(指導情報出力部)
指導情報出力部16は、判定部15によって判定された行動変容ステージに応じて、最適な指導情報を出力する機能である。図1に示すように、本装置は、過去の事例やノウハウをもとに作成された指導情報を予め記憶しているアシストルールベースを備えている。指導情報とは、指導者(保健師)による対話型指導をアシストするための情報、資料、マニュアルなどである。この例では、アシストルールベース内に、無関心期の対象者向けに「肥満の恐ろしさ」という名称のデータが、関心期の対象者向けに「運動のススメ」というデータが、準備期の対象者向けに「計画立案の手引き」というデータが、行動期の対象者向けに「ほめ方マニュアル」というデータが、それぞれ用意されている。なお装置上で閲覧可能であれば指導情報のデータ形式はどのようなものでもよい。例えば、HTML、XML、PDF、プレーンテキストでもよいし、ワードやエクセルやパワーポイントなどのデータでもよい。
【0049】
指導者は出力された指導情報をみることで、当該対象者の行動変容ステージに適した指導を行うことができる。
【0050】
<評価ルールの生成>
次に、連続性評価部12の判定条件生成部121による評価ルールの生成処理について詳しく説明する。
【0051】
図10は、判定条件生成部121の詳細な構成を示すブロック図である。判定条件生成部121は、文の種類識別部1210、類似文抽出部1211、条件生成部1212から構成され、学習用データ、文の種類識別表、シソーラス、禁止語集を参照して判定条件の生成を行う。
【0052】
図11は、文の種類識別部1210の処理を説明するための図である。学習用データとしては、連続性を有する文のペア(文1、文2)の集合が与えられる。典型的には、保健指導の過去の発話記録から抽出された会話文が学習用データとして利用される。評価ルールの信頼性を確保するために、できるだけ多くの学習用データを準備することが好ましい。
【0053】
文の種類識別部1210は、学習用データに含まれるそれぞれの文の種類を識別する。文の種類としては、「疑問」、「返答」、「挨拶」、「ほめる」、「提案」、「同意」などがある。文の種類識別表には文の種類とその代表的な表現とを対応付けたテーブルが予め用意されており、文の種類識別部1210は、文の語尾などの記述を各代表的表現と照合することによって文の種類を特定する。例えば、No.1のペアの文1「調子はどうですか?」は「どうですか?」という記述を根拠として「疑問」であると識別され、また文2「ぼちぼちだと思います。」は「だと思います。」という記述を根拠として「返答」であると識別される。このNo.1のペアには、文1の種類と文2の種類の組み合わせ「疑問→返答」を表す情報が割り当てられる。同様にして学習用データに含まれる全てのペアについて、文の種類が割り当てられる。なお図11下段の文中の下線は、文の種類の判定根拠となった記述を示している。
【0054】
図12は、類似文抽出部1211の処理を説明するための図である。類似文抽出部1211は、学習用データの中から、文の種類の組み合わせが同じペアを抽出する。図12の上段は「疑問→返答」という組み合わせのペアの抽出例である。次に、類似文抽出部1211は、シソーラスを参照して、文1と文2のそれぞれに同一又は類似の単語が含まれているペアを抽出する。例えば、No.1のペアの文1「調子はどうですか?」及び文2「ぼちぼちだと思います。」を基準とした場合、文1から「調子」、文2から「ぼちぼち」という単語が抽出される。そして、「調子」と同一の単語若しくは同義語を文1に含み、且つ、「ぼちぼち」と同一の単語若しくは同義語を文2に含むようなペアが類似文として
抽出される。図12の例では、シソーラスから、「調子」と「あんばい」、「ぼちぼち」と「まあまあ」と「まずまず」がそれぞれ同義語と判断され、No.1,2,5の3つのペアが抽出される。なお図12下段の文中の矩形は、類似文の判定根拠なった単語を示している。
【0055】
図13は、条件生成部1212の処理を説明するための図である。条件生成部1212は、類似文抽出部1211で抽出された各ペアから、判定条件を生成する。このとき、類似文抽出時に選択した単語と文の種類判定時に参酌した記述とから、判定条件が生成される。文の種類識別表には「文の種類」と「条件に記述を反映するか否かを表す情報」とを対応付けたテーブルが予め用意されている。「返答」や「同意」など、語尾が省略される可能性の高い文の種類では、条件に記述を反映するか否かを表す情報に「No」が設定される。
【0056】
例えば、No.1のペアの場合、文1から単語「調子」と記述「どうですか?」が抽出され、文1用の条件である第1の文字列「*調子*どうですか?」が生成される。一方、文2からは単語「ぼちぼち」のみが抽出され(文2の種類が返答であるため)、文2用の条件である第2の文字列「*ぼちぼち*」が生成される。その結果、判定条件「S1=“*調子*どうですか?” AND S2=“*ぼちぼち*”」という評価ルールが生成される。
【0057】
以上の処理により、学習用データから評価ルールが自動生成された後、必要に応じてユーザによる評価ルールの追加・編集が行われる。図14は、作成された評価ルールの一例を示している。このうちRuleNo.1,2,5,7は上述した処理により自動生成されたルールであり、RuleNo.3,4,6,8,9,10は手動で追加されたルールである。図14において、「S1」、「S2」はそれぞれ評価対象の文1、文2である。また「p1 AND p2」は、p1、p2ともに真ならば真であることを示す。「s=“str”」は、文sが文字列strに等しければ真であることを示す(*はワイルドカードである)。「s.preSentence.valueWith(s’)」は、文s’と文sの一つ前に続く文との間の設定値である。「s.words」は、文sに含まれる単語の集合である。「s.words.containAnyof(words)」は、文sに含まれる単語の集合が単語集合wordsの禁止語でないいずれか(あるいはその同義語、広義/狭義語、関連語)を含んでいるなら真であることを示す。「s.words.contain(word)」は、文sに含まれる単語の集合が単語word(あるいはその同義語、広義/狭義語、関連語)を含んでいるならば真であることを示す。図15は、シソーラスの例と禁止語集の例を示している。
【0058】
このようにして作成された評価ルール及びそれを用いた評価手法は特に会話文の連続性を評価するのに好適である。会話文には、省略や照応が多かったり、間投詞や倒置が含まれていたりするため、一般的な形態素解析(単語)や構文解析(係り受けなど)のみでは文脈(つまり文の連続性)を評価することが困難である。これに対して、本実施形態の評価ルール及び評価手法は、(1)会話文でも語尾などから文の種類を識別可能である、(2)連続し得る文の種類の組み合わせは決まっている、(3)2つの文が、連続し得る文の種類の組み合わせの関係にあり、一方の文に含まれる単語と他方の文に含まれる単語との間に関連があれば、2つの文が連続するとみなすことができる、というアイデアに基づくものである。
【0059】
すなわち、類似文抽出部1211が学習用データの中から文の種類の組み合わせが同じペアを抽出する処理は、(2)の「連続し得る文の種類の組み合わせ」を検出することと等価である。また、類似文抽出部1211が同一の単語又は同義語が含まれているペアを抽出する処理は、文1と文2に共起する頻度が高い単語(類語含む)の組み合わせを検出
することと等価である。2つの文に共起する頻度が高いということはその2つの単語には関連性があるとみなすことができる。したがって、類似文抽出時に選択した単語や文の種類判定時に参酌した記述を含む判定条件を用いて評価する処理は、上記(3)の「2つの文が、連続し得る文の種類の組み合わせの関係にあり、一方の文に含まれる単語と他方の文に含まれる単語との間に関連」があるか否かを評価する処理と等価である。
【0060】
<実施例>
では、具体的な事例を用いて、本装置の利点を説明する。
【0061】
以下の2つの発話記録の例それぞれについて、対象者の行動変容ステージの判定を行う。なお、例1、例2ともに保健師の発話内容は同じであり、対象者の発話した文の数は同じである。一見するだけでは、対象者の行動変容ステージがどこにあるのかを判別するのは難しい。
【0062】
(例1)
保健師:最近の調子はどうですか?
対象者:まあまあかな。
保健師:工夫なさっていることはありますか?
対象者:休日は散歩しているよ。ほか、春雨ヌードルを毎日食べているね。ジムにも通いだしたんだ、どうだ、やる気まんまんだろう?例のダイエットティーもほぼ毎日飲んでいる。
保健師:とはいえ、ここ一ヶ月ほどの記録をみると体重は増加傾向みたいですが。
対象者:うーん、歩数が足りないのかなぁ。それとも昼は揚げ物が多いからか。
保健師:対策として、何かお考えですか?
対象者:歩くよりも水泳のほうががんばれそうな気がしているんです、最近。また、嫁さんに聞いた炭水化物ダイエットも試してみるよ。
【0063】
(例2)
保健師:最近の調子はどうですか?
対象者:まあまあかな。
保健師:工夫なさっていることはありますか?
対象者:先日教えてもらったとおり、もう歳だし、自律神経は弱まっているだろうからねぇ。まずは自律神経の強化を図りたいなぁと。具体的には、休日は散歩したりして。平日の職場での移動には階段を使ったり。
保健師:とはいえ、ここ一ヶ月ほどの記録をみると体重は増加傾向みたいですが。
対象者:うーん、食事面では特に制限していないからかなぁ。昼は油っこい揚げ物が多いしなぁ。
保健師:対策として、何かお考えですか?
対象者:揚げ物を控えてみるよ。まずは、好物のとんかつを食べないようにしてみる。
【0064】
(1)例1の場合
図16は、図14の評価ルールと図15のシソーラス及び禁止語集を用いて、例1の文の連続性を評価した結果を示している。例えば、「最近調子はどうですか?」と「まあまあかな。」は、RuleNo.1を満たす。また「工夫なさっていることはありますか?」と「休日は散歩しているよ。」は、RuleNo.9を満たしている(「散歩」は「工夫」の関連語)。図17は、図16の評価結果に基づき作成した分布マップを示している。この分布マップでは影響度がマイナスの領域に特徴量が集中しているため、図9のテンプレートに照らし「無関心期」と判定される。
【0065】
(2)例2の場合
図18は、図14の評価ルールと図15のシソーラス及び禁止語集を用いて、例2の文の連続性を評価した結果を示している。これに基づき作成した分布マップが図19である。この分布マップでは影響度がプラスの領域とマイナスの領域のそれぞれに特徴量の分布が現れているため、「行動期」と判定される。
【0066】
<本実施形態の利点>
以上述べた本実施形態の構成によれば、指導者(保健師などの専門家)と対象者との会話を記録した発話記録データから、対象者の行動変容ステージ(意識レベル)を自動で判定することができる。したがって、指導者は、対面指導の時間は対象者との会話に集中できるため、効率的である。また、対象者の行動変容ステージが自動的に且つ客観的に判定されるので、指導者の経験やスキルとは無関係に指導内容の均質化が可能となる。
【0067】
また、上記評価ルールによれば、文同士の連続性を簡単な処理で評価することが可能である。さらに、文の種類と単語の関連性に着目して連続性を評価しているので、会話文の連続性を精度よく判定することができる。これは、対話型指導における発話記録データの解析に極めて有用である。
【0068】
さらに、判定した行動変容ステージに応じた適切な指導情報を出力することで、対象者に行動変容を促すのに最適な指導情報を指導者に提供できるため、対話型指導の一層の効率化、及び均質化を図ることができる。
【0069】
なお、上記実施形態は本発明の一具体例にすぎない。本発明の範囲は上記実施形態に限られることなく、種々の変形が可能である。
【図面の簡単な説明】
【0070】
【図1】図1は、本発明の実施形態に係る保健指導支援装置の機能ブロック図である。
【図2】図2Aは、発話記録データの一例であり、図2Bは、発話記録データを分解して得られた文データの一例である。
【図3】図3は、連続性評価部の詳細な構成を示すブロック図である。
【図4】図4は、連続性評価処理の流れを示すフローチャートである。
【図5】図5は、連続性評価に利用される評価ルールの一例を示す図である。
【図6】図6は、連続性評価結果の一例を示す図である。
【図7】図7は、影響度と関連度の算出方法を説明する図である。
【図8】図8は、分布マップの一例を示す図である。
【図9】図9は、テンプレートの一例を示す図である。
【図10】図10は、判定条件生成部の詳細な構成を示すブロック図である。
【図11】図11は、文の種類識別部の処理を説明するための図である。
【図12】図12は、類似文抽出部の処理を説明するための図である。
【図13】図13は、条件生成部の処理を説明するための図である。
【図14】図14は、評価ルールの一例を示す図である。
【図15】図15は、シソーラスの例と禁止語集の例を示す図である。
【図16】図16は、例1の文の連続性評価結果である。
【図17】図17は、例1の文の分布マップである。
【図18】図18は、例2の文の連続性評価結果である。
【図19】図19は、例2の文の分布マップである。
【符号の説明】
【0071】
10 発話記録取得部
11 分解部
12 連続性評価部
13 特徴量計算部
14 分布マップ作成部
15 判定部
16 指導情報出力部
120 判定処理部
121 判定条件生成部
122 文1記憶部
123 文2記憶部
124 評価ルール
125 評価結果記憶部
1210 文の種類識別部
1211 類似文抽出部
1212 条件生成部

【特許請求の範囲】
【請求項1】
対話型指導における指導者と対象者との会話を記録した発話記録データを取得する発話記録取得部と、
前記発話記録データに含まれる会話を文単位に分解する分解部と、
2つの文の間の連続性を、前記分解部で得られた文の全ての組み合わせについて、評価する連続性評価部と、
前記連続性評価部で得られた連続性に基づき、他の文に与える影響の強さを表す特徴量である影響度と他の文との関連の強さを表す特徴量である関連度とを、それぞれの文について算出する特徴量計算部と、
影響度と関連度からなる特徴量空間に、前記対象者が発話した文の特徴量をマッピングする分布マップ作成部と、
前記特徴量空間における特徴量の分布パターンに基づき、前記対象者の行動変容ステージを判定する判定部と、
を備えることを特徴とする対話型指導支援装置。
【請求項2】
前記連続性評価部は、第1の文字列と第2の文字列の組み合わせを定義した判定条件を含む評価ルールを予め有しており、2つの文のうちの第1の文が前記第1の文字列を含み、且つ、第2の文が前記第2の文字列を含んでいる場合に、この2つの文が連続性を有していると判定することを特徴とする請求項1に記載の対話型指導支援装置。
【請求項3】
学習用データを用いて前記評価ルールの判定条件を自動生成する判定条件生成部をさらに備え、
前記学習用データは、連続性を有する第1の文と第2の文のペアで構成されており、
前記判定条件生成部は、
前記学習用データに含まれるそれぞれの文の種類を、その文に含まれる記述に基づいて識別し、
前記学習用データの中から、第1の文の種類と第2の文の種類の組み合わせが同じであって、且つ、第1の文と第2の文のそれぞれに同一又は類似の単語が含まれているペアを抽出し、
抽出された各ペアから、第1の文における前記記述又は/及び前記単語を第1の文字列、第2の文における前記記述又は/及び前記単語を第2の文字列とする判定条件を生成することを特徴とする請求項2に記載の対話型指導支援装置。
【請求項4】
前記判定部は、各行動変容ステージに対応する分布パターンを定義したテンプレートを予め備えており、前記特徴量空間における特徴量の分布パターンを各テンプレートと照合することにより、該当する行動変容ステージを特定することを特徴とする請求項1〜3のうちいずれか1項に記載の対話型指導支援装置。
【請求項5】
行動変容ステージごとに指導情報を予め記憶しており、前記判定部によって判定された行動変容ステージに応じて指導情報を出力する出力部をさらに備えることを特徴とする請求項1〜4のうちいずれか1項に記載の対話型指導支援装置。
【請求項6】
コンピュータが、
対話型指導における指導者と対象者との会話を記録した発話記録データを取得する取得ステップと、
前記発話記録データに含まれる会話を文単位に分解する分解ステップと、
2つの文の間の連続性を、前記分解ステップで得られた文の全ての組み合わせについて、評価する連続性評価ステップと、
前記連続性評価ステップで得られた連続性に基づき、他の文に与える影響の強さを表す
特徴量である影響度と他の文との関連の強さを表す特徴量である関連度とを、それぞれの文について算出する特徴量計算ステップと、
影響度と関連度からなる特徴量空間に、前記対象者が発話した文の特徴量をマッピングする分布マップ作成ステップと、
前記特徴量空間における特徴量の分布パターンに基づき、前記対象者の行動変容ステージを判定する判定ステップと、
を実行することを特徴とする対話型指導支援方法。
【請求項7】
請求項6に記載の対話型指導支援方法の各ステップをコンピュータに実行させるためのプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate