説明

感性辞書編集支援システム及びプログラム

【課題】自然文からユーザの価値判断が示されている表現を抽出する際に参照する感性辞書を効率的に編集できるように支援する技術の実現。
【解決手段】事物に対する肯定/否定の価値判断を表す感性用語と、肯定/否定の何れであるかを示す極性との組合せを格納しておく感性辞書記憶部18と、複数の用語について、各用語の類義語を定義したデータが格納された類義語辞書記憶部34と、起点語が入力された場合に、この起点語をキーに類義語辞書記憶部34を検索して起点語の類義語を抽出し、各類義語をキーに類義語辞書記憶部34を検索して各類義語の類義語を抽出し、抽出された用語のリストを含む感性用語登録画面80を生成してクライアント端末58に送信し、この画面80を介してリスト中の1または複数の用語を選択する情報と、各用語の極性を指定する情報が入力された場合に、選択された用語を指定された極性に関連付けて感性辞書記憶部18に格納する辞書編集支援部38を備えた。

【発明の詳細な説明】
【技術分野】
【0001】
この発明は感性辞書編集システム及びプログラムに係り、特に、事物に対する肯定/否定の価値判断を表す感性用語と、肯定/否定の何れであるかを示す属性との組合せからなる感性辞書を、効率的に編集できるように支援する技術に関する。
【背景技術】
【0002】
具体的な商品やサービス(以下「商品等」)に対するエンドユーザの主観的な評価(感想)は、現行商品等の改良や次世代商品等の開発にとって極めて重要な指針となるため、各企業はエンドユーザから集めたアンケート結果を様々な観点から分析し、あるいはネット上の電子掲示板にアクセスし、自社商品等に対する評価をチェックすることを行っている。
【0003】
また、このような人手による分析作業の効率化を図るため、電子化された文章(アンケート情報)をコンピュータを用いて自動解析することにより、特定の商品等に対するエンドユーザの評価を抽出する技術が既に提案されている。
例えば、特許文献1にあっては、所定の対象に対する情動表現を含む文章に対して形態素処理や構文解析処理を施した後、多数の情動表現が登録されたアフェクトターム辞書を参照して、当該文章から情動表現を抽出すると共に、各情動表現の属性(ネガ/ポジ等)を集計し、その結果を外部に出力する技術が開示されている。
この結果、「口紅」という評価対象に関し、色つや、におい、付け心地、パッケージといった複数の評価軸毎に、否定的評価と肯定的評価の分布状況を提示することが可能となる。
【特許文献1】特開2003−248681
【発明の開示】
【発明が解決しようとする課題】
【0004】
このように、従来の分析技術を用いることにより、評価対象である商品等に対するエンドユーザの好き嫌いや良し悪しといった、二者択一的な評価を自動集計することが実現できる。
ところで、自然文で記述されたテキストからユーザの価値判断が示されている部分を高精度で抽出するためには、参照する辞書の登録内容(登録語数及び属性設定の適否)を充実させることが不可欠となる。
しかしながら、特許文献1を含め、このような辞書(以下「感性辞書」)の編集を効率化させるための支援技術はこれまで存在しなかった。
【0005】
この発明は、このような従来の問題を解決するために案出されたものであり、自然文からユーザの価値判断が示されている表現を抽出する際に参照する感性辞書を、効率的に編集できるように支援する技術の実現を目的としている。
【課題を解決するための手段】
【0006】
上記の目的を達成するため、請求項1に記載した感性辞書編集支援システムは、事物に対する肯定/否定の価値判断を表す感性用語と、肯定/否定の何れであるかを示す属性との組合せを格納しておく感性辞書記憶手段と、複数の用語について、各用語の類義語を定義したデータが格納された類義語辞書記憶手段と、起点語が入力された場合に、この起点語をキーに上記類義語辞書記憶手段を検索し、当該起点語の類義語を抽出する手段と、抽出された用語のリストを含む感性用語登録画面を生成し、外部に出力する手段と、この画面を介して、上記リスト中の1または複数の用語を選択する情報と、各用語の属性を指定する情報が入力された場合に、選択された用語を指定された属性に関連付けて上記感性辞書記憶手段に格納する手段とを備えたことを特徴としている。
上記「属性」としては、例えば「+」や「−」の極性が該当するが、「肯定」や「否定」、あるいは「P」や「N」等であってもよい(以下同様)。
上記「外部に出力する」とは、感性用語登録画面をディスプレイに表示させることや、同画面をクライアント端末に送信することが該当する(以下同様)。
【0007】
請求項2に記載した感性辞書編集支援システムは、事物に対する肯定/否定の価値判断を表す感性用語と、肯定/否定の何れであるかを示す属性との組合せを格納しておく感性辞書記憶手段と、複数の用語について、各用語の類義語を定義したデータが格納された類義語辞書記憶手段と、起点語が入力された場合に、この起点語をキーに上記類義語辞書記憶手段を検索し、当該起点語の類義語を抽出する手段と、各類義語をキーに上記類義語辞書記憶手段を検索し、各類義語の類義語を抽出する手段と、抽出された用語のリストを含む感性用語登録画面を生成し、外部に出力する手段と、この画面を介して、上記リスト中の1または複数の用語を選択する情報と、各用語の属性を指定する情報が入力された場合に、選択された用語を指定された属性に関連付けて上記感性辞書記憶手段に格納する手段とを備えたことを特徴としている。
【0008】
請求項3に記載した感性辞書編集支援システムは、請求項1または2に記載のシステムであって、さらに、上記リストに掲げられた各用語には選択入力用のチェックボックスが設けられており、上記感性用語登録画面上には肯定の属性での登録を求めるボタンと、否定の属性での登録を求めるボタンとが設けられており、上記チェックボックスに対するチェック入れによって1または複数の用語の選択情報が入力され、上記何れかのボタンを押下することによって、全選択用語に対する属性の指定情報が入力されることを特徴としている。
【0009】
請求項4に記載した感性辞書編集支援システムは、請求項1または2に記載のシステムであって、さらに、上記リストに掲げられた各用語には選択入力用のチェックボックスと、属性選択用の入力項目が設けられており、上記チェックボックスに対するチェック入れによって1または複数の用語の選択情報が入力され、上記入力項目に対する選択入力によって、各選択用語対する属性の指定情報が入力されることを特徴としている。
【0010】
請求項5に記載した感性辞書編集支援システムは、事物に対する肯定/否定の価値判断を表す感性用語と、肯定/否定の何れであるかを示す属性との組合せを格納しておく感性辞書記憶手段と、文書ファイルに対して形態素処理を施し、当該文書ファイルに含まれる複数のテキスト文を形態素単位に分解する形態素解析手段と、各文に含まれる形態素または形態素の組合せからなる表現が、上記感性辞書記憶手段に格納された感性用語に該当するか否かを判定し、該当する場合には当該表現に対して組み合わされている上記肯定/否定の何れかの属性を示す属性タグを関連付ける手段と、否定文を構成する際に用いられる否定表現を格納しておく否定表現記憶手段と、各文に含まれる形態素または形態素の組合せからなる表現が、上記否定表現記憶手段に格納された否定表現に該当するか否かを判定し、該当する場合には当該表現に対して否定表現であることを示す否定表現タグを関連付ける手段と、各文に関連付けられた属性タグの種類と、否定表現タグの有無との組合せパターンに基づいて、当該文が否定評価文か肯定評価文かを判定し、否定評価文に対してはネガ判定タグを付与すると共に、肯定評価文に対してはポジ判定タグを付与する手段と、感性用語候補と、プラス/マイナスの何れかの極性を備えたポイントとの組合せを格納しておく感性用語候補記憶手段と、上記文書ファイル中における、同種のネガ判定タグまたはポジ判定タグを付与された文に挟まれた、何れの判定タグをも付与されていない文を探索し、当該ターゲット文から所定の品詞の形態素または形態素の組合せからなる表現を感性用語候補として抽出する手段と、ネガ判定タグが付与された文に挟まれたターゲット文が上記の否定表現を含まない場合には、当該ターゲット文から抽出した感性用語候補に対してマイナスのポイントを付与し、当該ターゲット文が上記の否定表現を含む場合には、当該ターゲット文から抽出した感性用語候補に対してプラスのポイントを付与し、ポジ判定タグが付与された文に挟まれたターゲット文が上記の否定表現を含まない場合には、当該ターゲット文から抽出した感性用語候補に対してプラスのポイントを付与し、当該ターゲット文が上記の否定表現を含む場合には、当該ターゲット文から抽出した感性用語候補に対してマイナスのポイントを付与する手段と、各感性用語候補及びポイントを上記感性用語候補記憶手段に格納する手段と、上記感性用語候補記憶手段に格納された各感性用語候補のポイントを集計する手段と、ポイントの絶対値が所定の閾値以上の感性用語候補を推奨用語として抽出し、各推奨用語及びそれぞれの極性を列記した推奨用語リストを生成する手段と、上記推奨用語リストを含む感性用語登録画面を生成し、外部に出力する手段と、この画面を介して、上記推奨用語リスト中の1または複数の推奨用語を選択する情報が入力された場合に、選択された推奨用語及びその極性に対応した属性を上記感性辞書記憶手段に格納する手段とを備えたことを特徴としている。
【0011】
請求項6に記載した感性辞書編集支援システムは、請求項1〜5のシステムであって、さらに、上記感性辞書記憶手段に格納された少なくとも一部の感性用語を抽出して削除対象リストを生成し、このリストを含む感性用語削除画面をディスプレイに表示させる手段と、この画面を介して、特定の感性用語を削除対象として選択する情報が入力された場合に、選択された感性用語に関するデータを上記感性辞書記憶手段から削除する手段とを備えたことを特徴としている。
【0012】
請求項7に記載した感性辞書編集支援プログラムは、コンピュータを、事物に対する肯定/否定の価値判断を表す感性用語と、肯定/否定の何れであるかを示す属性との組合せを格納しておく感性辞書記憶手段、複数の用語について、各用語の類義語を定義したデータが格納された類義語辞書記憶手段、起点語が入力された場合に、この起点語をキーに上記類義語辞書記憶手段を検索し、当該起点語の類義語を抽出する手段、抽出された用語のリストを含む感性用語登録画面を生成し、外部に出力する手段、この画面を介して、上記リスト中の1または複数の用語を選択する情報と、各用語の属性を指定する情報が入力された場合に、選択された用語を指定された属性に関連付けて上記感性辞書記憶手段に格納する手段として機能させることを特徴としている。
【発明の効果】
【0013】
請求項1に記載の感性辞書編集支援システム及び請求項7に記載の感性辞書編集支援プログラムによれば、ユーザが入力した起点語に類似する用語が登録画面上にリスト表示されるため、ユーザはその中から必要な用語を選択すると共に、それぞれの属性を指定することにより、起点語に類似する用語について感性辞書記憶手段にまとめて登録することができる。この結果、感性辞書の登録作業を効率化することが可能となる。
【0014】
請求項2に記載の感性辞書編集支援システムの場合、ユーザが入力した起点語の類義語のみならず、各類義語の類義語までが登録画面上に登録候補としてリスト表示されるため、ユーザはより広い範囲の関連語について、まとめて登録することが可能となる。
【0015】
請求項3に記載の感性辞書編集支援システムによれば、リストに列挙された各用語のチェックボックスにチェックを入れると共に、肯定または否定の何れかの属性のボタンを押下するだけで、登録対象となる用語の選択と、それぞれの属性の指定が完了するため、感性辞書の登録作業をより効率化することが可能となる。
【0016】
請求項4に記載の感性辞書編集支援システムによれば、リストに列挙された各用語のチェックボックスにチェックを入れると共に、当該用語の属性選択用の入力項目に所定の入力を行うだけで、登録対象となる用語の選択と、それぞれの属性の指定が完了するため、感性辞書の登録作業をより効率化することが可能となる。
【0017】
請求項5に記載の感性辞書編集支援システムにあっては、「同種の評価文は連続した固まりとなって文章中に登場する傾向があるため、同種の評価文に挟まれた文は前後の文と同種の評価文(否定評価文または肯定評価文)となる確率が高い」という仮定に則り、テキスト文から自動的に推奨用語が抽出され、その属性と共に画面上にリスト表示されるため、ユーザはその中から必要な用語を選択することにより、感性用語を感性辞書記憶手段に効率的に登録することが可能となる。
【0018】
請求項6に記載の感性辞書編集支援システムによれば、不要な感性用語をまとめて削除可能となり、辞書のメンテナンス性の向上に資する。
【発明を実施するための最良の形態】
【0019】
図1は、この発明に係る感性分析システム10の機能構成を示すブロック図であり、文書登録部12と、文書記憶部14と、文書解析部16と、感性辞書記憶部18と、否定表現記憶部20と、ネガ/ポジ判定部22と、主題認定部24と、意図表現記憶部26と、意図抽出部28と、分析結果記憶部30と、評価軸類似表現記憶部32と、類義語辞書記憶部34と、分析結果評価部36と、辞書編集支援部38と、感性用語候補記憶部39と、感性用語候補抽出部40とから構成される。
【0020】
上記の文書登録部12、文書解析部16、ネガ/ポジ判定部22、主題認定部24、意図抽出部28、分析結果評価部36、辞書編集支援部38、感性用語候補抽出部40は、サーバコンピュータのCPUが、OS及びアプリケーションプログラムに従って必要な処理を実行することによって実現される。
【0021】
また、上記の文書記憶部14、感性辞書記憶部18、否定表現記憶部20、意図表現記憶部26、分析結果記憶部30、評価軸類似表現記憶部32、類義語辞書記憶部34、感性用語候補記憶部39は、同コンピュータのハードディスク内に設けられている。
【0022】
感性辞書記憶部18には、図2に示すように、汎用辞書群42と、複数のドメイン別辞書群44が格納されている。また、汎用辞書群42には、単語辞書45、二項関係辞書46、慣用句辞書47、擬態語辞書48の各辞書が含まれている。さらに、各ドメイン別辞書群44には、単語辞書49、二項関係辞書50、擬態語辞書51の各辞書がそれぞれ含まれている。
【0023】
図3は、汎用辞書群42に属する単語辞書45の登録データを例示するものであり、「感性用語」、「読みがな」及び「極性」のデータ項目を備えたレコードが多数格納されている。
ここで「感性用語」のデータ項目には、「おいしい」や「うまい」、「まずい」等、事物に対する肯定/否定(良し悪し)に関する人間の主観的な価値判断を表す名詞や形容詞等が格納されている。また、極性のデータ項目には、当該感性用語の意味内容が肯定的な場合には「+」の符号が、否定的な場合には「−」の符号が設定されている。
【0024】
汎用辞書群42に属する二項関係辞書46にも、図示は省略したが、「感性用語」、「読みがな」、「極性」のデータ項目を備えたレコードが多数登録されている。
ここで「二項関係」とは、例えば「値段が高い」のように、二つの単語が助詞を介して組み合わされることにより、初めて一つの具体的な価値判断が生じる言葉を意味している。
すなわち、「高い」という形容詞は、一般的には肯定的な意味合いを観念させるものであるが、「値段が高い」や「危険性が高い」、「腐食性が高い」のように、主語によっては否定的な意味合いが生じる場合がある。あるいは逆に、「低い」という形容詞は、一般的には否定的な意味合いを観念させるものであるが、「危険性が低い」や「毒性が低い」、「違法性が低い」のように、主語によって肯定的な意味合いが生じる場合がある。
このため二項関係辞書46には、このように二つの単語の組合せによって具体的な価値判断を表すこととなる言葉について、「+」または「−」の極性が付与されている。
【0025】
汎用辞書群42に属する慣用句辞書47にも、図示は省略したが、「感性用語」、「読みがな」、「極性」のデータ項目を備えたレコードが多数登録されている。
具体的には、「馬の耳に念仏(感性用語)/−(極性)」、「雨降って地固まる(感性用語)/+(極性)」、「片腹痛い(感性用語)/−(極性)」、「覆水盆に返らず(感性用語)/−(極性)」、「出藍の誉れ(感性用語)/+(極性)」のように、諺や格言のように価値判断を伴う慣用句が「感性用語」のデータ項目に充填されると共に、各慣用句の意味合いが肯定的なものである場合には「+」が、否定的なものである場合には「−」が「極性」のデータ項目に充填されている。
【0026】
汎用辞書群42に属する擬態語辞書48にも、図示は省略したが、「感性用語」、「読みがな」、「極性」のデータ項目を備えたレコードが多数登録されている。
具体的には、「わくわく(感性用語)/+(極性)」、「ほっこり(感性用語)/+(極性)」、「ざわざわ(感性用語)/−(極性)」、「ぎとぎと(感性用語)/−(極性)」のように、価値判断を伴う擬態語が「感性用語」のデータ項目に充填されると共に、各擬態語の意味合いが肯定的なものである場合には「+」が、否定的なものである場合には「−」が「極性」のデータ項目に充填されている。
【0027】
各ドメイン別辞書群44に属する単語辞書49、二項関係辞書50、擬態語辞書51にも、図示は省略したが、「感性用語」、「読みがな」、「極性」のデータ項目を備えたレコードがそれぞれ多数登録されている。
ただし、各ドメイン別辞書群は、それぞれ特定のカテゴリ(業界、商品分野、サービス分野)毎に用意されており、当該カテゴリに特有の感性用語や極性が登録されている。
【0028】
否定表現記憶部20には、図示は省略したが、否定文を作る際に用いられる多数の否定表現パターンが格納されている。例えば、「思えません」、「思えない」、「いえません」、「いえない」、「いえぬ」、「ありません」、「ない」、「感じません」、「感じない」、「考えません」、「考えない」等が該当する。
【0029】
感性分析システム10は、Webサーバ54とネットワーク接続されており、Webサーバ54はインターネット56を介して複数のクライアント端末58と接続される。
クライアント端末58は、OS及びWebブラウザを搭載したPC等よりなる。
【0030】
つぎに、この感性分析システム10の利用方法について説明する。
まずユーザは、クライアント端末58からWebサーバ54にアクセスし、ID及びパスワードを入力してログインした後、サービスメニューから「感性分析サービス」を選択する。
この結果、Webサーバ54からクライアント端末58に対して分析条件指定画面が送信される。
【0031】
図4は、この分析条件指定画面60の一例を示すものであり、分析対象ファイル指定欄61と、評価軸指定欄62とを備えている。
【0032】
まず、分析対象ファイル指定欄61は、ユーザ側で事前に準備した文書ファイルを指定する欄である。すなわち、ユーザが参照ボタン63をクリックすると、クライアント端末58のドライブ構造を示すファイル選択ウィンドウがWebブラウザ上に表示される。これに対しユーザは、特定のドライブ名やその配下のフォルダ名をクリックして展開させ、特定の文書ファイルを指定する。
図においては、「09 12 アンケート結果.csv」という文書ファイルが指定されている。この文書ファイルには、ユーザである「ABC観光ホテル」の宿泊客から集めたアンケート文が複数格納されている。
【0033】
評価軸指定欄62は、分析対象ファイルに含まれた各文に対する分析項目を指定する欄であり、予めユーザの属する業界毎に設定された標準の評価軸が、デフォルトで複数列挙されている。
図においては、ユーザIDに関連付けられた業種コードが「ホテル・旅館業界」であるため、「価格」、「料理」、「部屋」、「風呂」、「立地」、「宴会」、「設備」等が表示されている。
これに対しユーザは、不要な評価軸のチェックボックスに入れられたチェックを外すことにより、当該評価軸を分析項目から除外することができる。
【0034】
以上の設定を完了したユーザが、分析開始ボタン64をクリックすると、クライアント端末58からWebサーバ54に対して、感性分析リクエストが送信される。
この際、ユーザが指定した文書ファイルと、ユーザが設定した評価軸、及びユーザIDに関連付けられた業種コードが、Webサーバ54に送信される。
これを受けたWebサーバ54は、クライアント端末58からアップロードされた文書ファイルを感性分析システム10に送信し、分析を依頼する。
【0035】
以下、図5のフローチャートに従い、この感性分析システム10における処理手順を説明する。
まず、感性分析システム10の文書登録部12は、Webサーバ54から送信された文書ファイルを、文書記憶部14に格納する(S10)。この文書ファイルには、ユーザが設定した評価軸及びユーザの業種コードが関連付けられている。
【0036】
つぎに文書解析部16が起動し、文書記憶部14に格納された文書ファイルを取り出し、当該文書ファイル中の各文について形態素解析処理を施す(S12)。
ここで「形態素解析」とは、自然言語で記述された文を、意味を有する最小の言語単位である形態素に分解し、それぞれの品詞を特定する処理をいう。この形態素解析処理は公知技術であり、例えば以下のようなフリーソフトを形態素解析エンジンとして用いることができる。
■MeCab(http://mecab.sourceforge.net/)
■ChaSen(http://chasen.naist.jp/hiki/ChaSen/)
【0037】
つぎに文書解析部16は、形態素に分解された各文について、構文解析処理を施す(S14)。
ここで「構文解析」とは、各文に含まれる文節間の係り受け構造を特定する処理をいう。この構文解析自体も公知技術であり、例えば以下のようなフリーソフトを構文解析エンジンとして用いることができる。
■KNP(http://nlp.kuee.kyoto-u.ac.jp/nl-resource/knp.html)
■CaboCha(http://chasen.org/~taku/software/cabocha/)
【0038】
文書解析部16による解析処理が完了すると、ネガ/ポジ判定部22によるネガ/ポジ判定処理が実行される(S16)。
以下、図6のフローチャートに従い、ネガ/ポジ判定処理の具体的な手順について説明する。
【0039】
まずネガ/ポジ判定部22は、感性辞書記憶部18内に格納された各種感性辞書を参照し、各文を構成する形態素または形態素の組合せの中で、感性辞書に登録された感性用語に該当するものを探索する(S16-01)。
そして、特定の形態素または形態素の組合せにマッチする感性用語が感性辞書中に存在していた場合、ネガ/ポジ判定部22はその感性用語の極性を表すタグ(<+>または<−>)を当該表現に付与する(S16-02)。
【0040】
この際、例えば文中に「値段が少し高い」という表現があり、二項関係辞書46中に「値段が高い(感性用語)/−(極性)」の登録例が存在した場合に、ネガ/ポジ判定部22は構文解析の処理結果を参照することにより、「値段が少し高い」に対して<−>のタグを付与することができる。
すなわち、文書解析部16による構文解析処理により、当該文中の「値段が」の文節が「高い」の文節に係ることを示す解析データが生成されているため、ネガ/ポジ判定部22はこの解析データに基づき、二項関係辞書46中の「値段が高い」の極性を「値段が少し高い」の表現に適用可能となる。
【0041】
つぎにネガ/ポジ判定部22は、否定表現記憶部20を参照し、各文を構成する形態素または形態素の組合せ中で、否定表現記憶部20に登録された否定表現パターンに合致する表現を探索する(S16-03)。
そして、否定表現記憶部20中に文中の形態素または形態素の組合せにマッチする否定表現パターンが登録されていた場合、ネガ/ポジ判定部22はその表現(形態素または形態素の組合せ)に対して否定表現タグ(<否定>)を付与する(S16-04)。
【0042】
つぎにネガ/ポジ判定部22は、各文に付与された極性タグと否定表現タグとの組合せに独自の文法ルールを適用することにより、文全体が否定的か肯定的かの判定を行う(S16-05)。
そして、「否定的」との判定結果が出た場合、ネガ/ポジ判定部22は当該否定評価文に「<N>(Negative)」のネガ判定タグを付与し、「肯定的」との判定結果が出た場合には、当該肯定評価文に「<P>(Positive)」のポジ判定タグを付与する(S16-06)。
【0043】
例えば、図7(a)に示すように、「料理は、おいしいと思いました。」という文の場合、「おいしい」の形態素に<+>の極性タグが付与されており、<否定>タグは付与されていないため、ネガ/ポジ判定部22は文全体を「肯定的」と認定し、<P>のポジ判定タグを関連付ける。
【0044】
これに対し、図7(b)に示すように、「料理は、おいしいとは思いませんでした。」という文の場合、「おいしい」の形態素に<+>の極性タグが付与されているが、それよりも後方に位置する「思いません」の部分に<否定>タグが付与されているため、ネガ/ポジ判定部22は文全体を「否定的」と認定し、<N>のネガ判定タグを関連付ける。
【0045】
また、図7(c)に示すように、「料理は、まずかったです。」という文の場合、「まずかっ」の形態素に<−>の極性が付与されており、<否定>タグは付与されていないため、ネガ/ポジ判定部22は文全体を「否定的」と認定し、<N>のネガ判定タグを関連付ける。
【0046】
これに対し、図7(d)に示すように、「料理は、まずくはありませんでした。」という文の場合、「まずく」の形態素に<−>の極性が付与されているが、それよりも後方に位置する「ありません」の部分に<否定>タグが付与されているため、ネガ/ポジ判定部22は文全体を「肯定的」と認定し、<P>のポジ判定タグを関連付ける。
【0047】
ネガ/ポジ判定部22によるネガ/ポジ判定処理が完了すると、主題認定部24による主題認定処理が実行される(S18)。
ここで「主題認定処理」とは、ネガ/ポジの評価対象を特定する処理を意味する。
【0048】
この主題を特定するため主題認定部24は、まず文中における格要素「〜は」、「〜が」、「〜も」を探索し、これらの助詞が付属している自立語(主格)を主題と認定し、その旨を示す<主題>のタグを付与する。図7で示した各例文の場合、「料理」が主題に該当する。
【0049】
文によっては、主格が省略されている場合がある。例えば、図8に示すように、「(1) 部屋が蒸し暑くて寝苦しかった。」の文に続く「(2) しかもかび臭かった。」では、主格が省略されている。このような場合、主題認定部24は前の文の主題である「部屋」を後の文に継承させ、(2)の文の主題として「部屋」を認定する。
【0050】
この主題の継承は、連続する文の間に限定されるものではなく、主格の存在しない文が続いた場合には、次々と継承される。
図8においては、「(3) 静かなのがせめてもの救いだった。」の文にも、(1)の文の「部屋」が主格として継承されている。そして、新たな主格である「料理は」を有する(4)の文が登場した時点で、「部屋」の主題としての継承が停止されている。
【0051】
当該文中に主格が存在せず、かつ、継承すべき主格を備えた先行文が存在しない場合、主題認定部24は当該文中に連体修飾語が含まれているか否かを探索し、連体修飾語を発見した場合にはその修飾先の形態素を主題と認定する。
例えば、「いい香り。」という文の場合、主格が省略されているが、「香り」という名詞(体言)を修飾している連体修飾語「いい(<+>)」が存在しているため、主題認定部24は「香り」を当該文の主題と認定する。
【0052】
主題認定部24による主題認定処理が完了すると、意図抽出部28による意図抽出処理が実行される(S20)。
ここで「意図」とは、発言者(文執筆者)の主観的な目的や意向、思惑を意味しており、「不満」や「疑問」、「要望」、「予想外」等に類型化できる概念である。
上記のネガ/ポジ判定部22の抽出対象が、個別の主題に対する発言者の「良い/悪い」という二元論的な価値判断であるのに対し、意図抽出処理の対象となるものは、良し悪しの価値判断の背後に潜む発言目的や、良し悪しの価値判断から離れた発言者の読み手に対する意向や主張、メッセージとなる。
【0053】
まず意図抽出部28は、意図表現記憶部26を参照し、各文中の表現(形態素または形態素の組合せ)とのマッチングを実行する。
すなわち、図9に示すように、意図表現記憶部26に格納された各レコードは、「意図表現」と「意図類型」のデータ項目を備えている。そこで意図抽出部28は、この意図表現にマッチする表現を各文中において探索し、該当する表現を発見した場合には、対応する意図類型の類型タグを当該表現に関連付ける。
【0054】
例えば、図10(a)に示すように、「夕食が粗末なので、もう少し品数を増やして下さい。」という文が与えられた場合、意図抽出部28は「下さい」の文字列が意図表現記憶部26に存在することを探知した後、「下さい」の意図類型である「要望」に対応した<要望>の意図類型タグを当該表現に関連付ける。
因みに、この文については文全体が「否定的」であることを示す<N>のネガ判定タグが付与されている。
【0055】
また、図10(b)に示すように、「値段が良心的なのには驚きました。」という文が与えられた場合、意図抽出部28は「驚き」の文字列が意図表現記憶部26に存在することを探知した後、「驚き」に対応した<予想外>の意図類型タグを当該表現に付与する。
この文については、文全体が「肯定的」であることを示す<P>のポジ判定タグが付与されている。
【0056】
また、図10(c)に示すように、「アクセスが悪いのに送迎サービスさえありません。」という文が与えられた場合、意図抽出部28は「さえありません」の文字列が意図表現記憶部26に存在することを探知した後、「さえありません」に対応した<不満>の意図類型タグを当該文に付与する。
この文については、文全体が「否定的」であることを示す<N>のネガ判定タグが付与されている。
【0057】
さらに、図10(d)に示すように、「当方の頼み方がいけなかったのでしょうか?」という文が与えられた場合、意図抽出部28は「でしょうか」の文字列が意図表現記憶部26に存在することを探知した後、「でしょうか」に対応した<疑問>の意図類型タグを当該文に付与する。
この文の場合、ネガ/ポジの判定結果を示すタグは付与されていない。
【0058】
分析対象ファイルに含まれる全ての文について意図抽出処理が完了すると、意図抽出部28は、これまでの分析結果を分析結果記憶部30に格納する(S22)。
ここで「分析結果」とは、各文に対して主題タグや極性タグ、否定表現タグ、ネガ/ポジ判定タグ、意図類型タグを付与した分析結果データが該当する。
【0059】
つぎに、分析結果評価部36によって分析結果画面が生成される(S24)。
この分析結果表示画面は、Webサーバ54を経由してクライアント端末58に送信される(S26)。
【0060】
図11及び図12は、クライアント端末のWebブラウザ上に表示された分析結果画面70の一例を示すものであり、ネガ/ポジ分析結果表示欄71(図11)と、意図抽出結果表示欄72(図12)を備えている。
【0061】
まず、ネガ/ポジ分析結果表示欄71には、総合評価、価格、料理、部屋、風呂、立地の評価軸を備えたレーダーチャート73が表示されており、各評価軸におけるネガ/ポジの割合が、折れ線図形74の頂角の位置(目盛り)によって表現されている。
すなわち、外側から3番目の目盛り75がネガ/ポジの割合が50対 50で均衡している位置であり、これよりも外側に頂角がある場合にはポジの割合がネガの割合を上回っており、内側に頂角がある場合にはネガの割合がポジの割合を上回っていることを示している。
【0062】
図の例では、価格と料理の評価軸についてのみ、頂角がネガ側に位置しており、総合評価を含め他の評価軸では頂角がポジ側に位置しているため、全体としてはポジが優勢であるといえる。特に、立地と部屋の評価軸に関しては、頂角が外側に大きく張り出しており、エンドユーザ(利用客)からの評価が高いことが見て取れる。
【0063】
ネガ/ポジ分析結果の見せ方はレーダーチャート73に限定されるものではなく、評価軸単位でネガとポジの比率(%)を表したグラフを表示したり、単純にネガ/ポジの割合や数を数値で表示したりすることもできる。
【0064】
つぎに、意図抽出結果表示欄72には、意図分類チャート76が表示されている。
この意図分類チャート76は、意図類型に対応した複数の意図類型ボタン77a〜77nを備えており、各ボタン77a〜77nには価格や料理等の評価軸に対応したアンカーテキストが、それぞれツリー状に表示されている。
【0065】
例えば、「予想外」のボタン77nには「72件」の数字が表示されており、分析対象文書中に<予想外>の意図類型タグが設定された文が延べ72件含まれていたことが示されている。
また、この72件の文の中で、「評価軸:価格」のものが15件、「評価軸:料理」のものが21件、「評価軸:部屋」のものが11件、「評価軸:風呂」のものが13件、「評価軸:立地」のものが8件、「その他(評価軸なし)」のものが4件であったことが示されている。
「不満」ボタン77aや「要望」ボタン77b、「疑問」ボタン(図示省略)等についても同様に、「価格」、「料理」、「部屋」、「風呂」、「立地」、「その他」のアンカーテキストがツリー状に表示されている。
【0066】
ここでユーザが、任意のアンカーテキスト(例えば「不満」ボタン77a配下の「■料理(21件)」)にマウスポインタ78を翳すと、ポップアップウインドウ79が画面上に開いて原文が箇条書きでリスト表示される。
また、ユーザが任意のアンカーテキストにマウスポインタ78を重ねてクリックすると、別ウィンドウが開いて原文がリスト表示される(図示省略)。
この結果ユーザは、発言者の料理に対する具体的な不満を個別に確認することができる。この原文のリストは、分析結果評価部36によって生成されたものである。
【0067】
つぎに、図13のフローチャートに従い、この分析結果画面70の生成に係る処理手順を説明する。
まず、分析結果評価部36は、当該文書ファイルに関連付けられた評価軸である「価格」、「料理」、「部屋」、「風呂」、「立地」を取得する(S24-01)。
つぎに分析結果評価部36は、評価軸類似表現記憶部32に格納された業界毎の評価軸類似表現辞書を参照し、各評価軸の展開語を特定する(S24-02)。
【0068】
図14は、評価軸類似表現記憶部32に格納されたホテル・旅館業界用の評価軸類似表現辞書の具体例を示している。
例えば、「価格」の評価軸については、「価格」の他に、「料金」、「値段」、「宿泊料」、「宿代」等の類義語や関連語が類似表現として格納されている。これらの類似表現は、一般的な類義語辞書等を参照し、また個々の業界の特性を考慮しつつ、ユーザの属する業界毎に編纂されたものである。
このため、「価格」の評価軸について、「価格」や「料金」、「値段」といった一般的な呼び名の他に、「宿泊料」、「宿代」のようにホテル・旅館業界に特有の呼び名が列記されている。
また、飲食業界に属するユーザに対してサービスを提供する場合には、「宿泊料」や「宿代」の代わりに「飲食代」や「飲み代」等の類似表現が列記された、飲食業界用の評価軸類似表現辞書が適用されることとなる。
【0069】
つぎに分析結果評価部36は、文書ファイルに含まれる各文の「主題」として認定された文字列と、上記の類似表現とをマッチングさせ、該当する文に対応の評価軸を関連付ける(S24-03)。
例えば、図10(a)の「夕食が粗末なので、もう少し品数を増やして下さい。」という文の場合、主題である「夕食」の文字列が評価軸「料理」の類似表現として登録されているため、分析結果評価部36は「料理」の評価軸識別コードを当該文に関連付ける。
【0070】
また、図10(b)の「値段が良心的なのには驚きました。」という文の場合、主題である「値段」の文字列が評価軸「価格」の類似表現として登録されているため、分析結果評価部36は「価格」の評価軸識別コードを当該文に関連付ける。
【0071】
また、図10(c)の「アクセスが悪いのに送迎サービスさえありません。」という文の場合、主題である「アクセス」の文字列が評価軸「立地」の類似表現として登録されているため、分析結果評価部36は「立地」の評価軸識別コードを当該文に関連付ける。
【0072】
これに対し、図10(d)の「当方の頼み方がいけなかったのでしょうか?」という文の場合、主題である「頼み方」の文字列は何れの評価軸でも類似表現として登録されていないため、分析結果評価部36は「その他」の評価軸識別コードを関連付ける。
【0073】
つぎに分析結果評価部36は、ユーザが選択した複数の評価軸の識別コードが付与された文を文書ファイルから抽出した後、各文に設定されたネガ/ポジ判定タグ<P>及び<N>の数を集計する(S24-04)。
【0074】
例えば、「価格」の評価軸識別コードが付与された文が全部で80個あり、その中で<P>のタグが付された文が45個、<N>のタグが付された文が30個、<P>及び<N>の何れも付与されていない文が5個あった場合、分析結果評価部36は以下の集計結果を生成する。
[評価軸:価格]
<P>(ポジ):45個
<N>(ネガ):30個
【0075】
また、「料理」の識別コードが付与された文が全部で60個あり、その中で<P>のタグが付された文が18個、<N>のタグが付された文が25個、<P>及び<N>の何れも付与されていない文が17個あった場合、分析結果評価部36は以下の集計結果を生成する。
[評価軸:料理]
<P>(ポジ):18個
<N>(ネガ):25個
【0076】
つぎに分析結果評価部36は、上記の集計結果を反映させたレーダーチャート73を生成する(S24-05)。
この際、分析結果評価部36は、各評価軸のポジ数を合計した総合ポジ数を算出すると共に、各評価軸のネガ数を合計した総合ネガ数を算出し、両者の割合をレーダーチャート73の総合評価の項目にプロットする。
【0077】
つぎに分析結果評価部36は、各文に付与された意図類型及び評価軸毎に文の数を集計し、意図分類チャート76を生成する(S24-06)。この際、分析結果評価部36は「意図類型×評価軸」単位で文書ファイルから文を抽出して原文表示用のリストを生成し、各評価軸のアンカーテキストに関連付けておく。
最後に分析結果評価部36は、上記のレーダーチャート73及び意図分類チャート76を備えた分析結果画面70を生成する(S24-07)。
【0078】
上記においては、分析結果画面70を介して分析結果がユーザに提示される例を示したが、ユーザは分析結果記憶部30に格納された文書ファイルを直接参照することも可能である。
すなわち、分析結果記憶部30には、各文に対して主題タグや極性タグ、否定表現タグ、ネガ/ポジ判定タグ、意図類型タグを付与した文書ファイルが格納されているため、ユーザは分析結果評価部36及びWebサーバ54経由で送信された検索画面(図示省略)上で適当な検索キー(例えば「意図類型:予想外」や「ネガ/ポジ判定結果:ネガ」)を設定することにより、分析結果記憶部30から必要な情報を自由に取り出すことができる。
【0079】
この感性分析システム10の信頼性や分析精度を高めるためには、感性辞書記憶部18内に格納された各種辞書類の登録内容(登録語数及び設定極性の適否)を充実させることが重要となる。
このため感性分析システム10は、感性辞書のメンテナンスを支援する機能を備えている。以下、辞書のメンテナンス方法について説明する。
【0080】
まずシステム10の管理者は、クライアント端末58からWebサーバ54にアクセスし、ID及びパスワードを入力してログインした後、管理者用のサービスメニューから「辞書メンテナンスサービス/感性用語登録」を選択する。
この結果、Webサーバ54からクライアント端末58に対して「感性用語登録画面」が送信される。
【0081】
図15は、この感性用語登録画面80の一例を示すものであり、対象辞書選択欄81と、起点語指定欄82を備えている。
これに対し管理者は、対象辞書選択欄81における「▼」ボタン83をクリックしてプルダウンメニューを開き、任意の辞書を選択する。図においては「汎用/単語辞書」が選択されているが、他の「汎用/二項関係辞書」、「汎用/慣用句辞書」、「汎用/擬態語辞書」を選択することもできる。また、「ホテル・旅館業界用/単語辞書」、「ITサービス業界用/二項関係辞書」、「家電業界用/擬態語辞書」のように、ドメイン別の各種辞書類を編集対象として指定することもできる。
【0082】
つぎに管理者は、起点語指定欄82の入力フィールド84に類義語展開の起点となるべき用語を入力する。図においては「感動」が入力されている。
つぎに、管理者が展開ボタン85をクリックすると、クライアント端末58からWebサーバ54に対して、展開語の表示リクエストが送信される。
これを受けたWebサーバ54は、辞書編集支援部38に対して「感動」に関する展開語の抽出を依頼する。
【0083】
以下、図16のフローチャートに従い、辞書編集支援部38における処理手順を説明する。
まず、Webサーバ54から起点語を受信した辞書編集支援部38は(S30)、起点語をキーに類義語辞書記憶部34内の類義語辞書を検索し、「感動」という用語の類義語を一次展開語として抽出する(S32)。
つぎに辞書編集支援部38は、抽出した各一次展開語をキーに再度類義語辞書を検索し、それぞれの類義語を「感動」の二次展開語として抽出する(S34)。
つぎに辞書編集支援部38は、一次展開語のリストと二次展開語のリストを生成し、Webサーバに送信する(S36)。
【0084】
これを受けたWebサーバ54は、一次展開語リストと二次展開語リストを備えた感性用語登録画面80を生成し、クライアント端末58に再送信する。
図示の通り、一次展開語リスト86には、「感動」、「うなる」、「心が動く」、「心が躍る」、「心に深く感じる」、「感嘆」、「感銘」、「胸キュン」等、起点語及びその類義語が列記されている。
また、二次展開語リスト87には、「うめく」、「呻吟」、「唸る」、「趣旨を変える」、「心移り」等の用語が列記されている。この二次展開語は、上記の通り一次展開語として抽出された類義語の類義語であり、例えば「うめく(二次展開語)」は「うなる(一次展開語)」の類義語に、「心移り(二次展開語)」は「心が動く(一次展開語)」の類義語に該当する。
【0085】
管理者は、この一次展開語リスト86及び二次展開語リスト87に列記された用語の登録の要否を個別に検討し、登録が必要と判断した場合には対応のチェックボックスにチェックを入れる。
必要な用語に対するチェック入れを完了した管理者がプラス登録ボタン88をクリックすると、クライアント端末58からWebサーバ54に対して、リスト中においてチェックが入れられた用語を特定する情報と、これらの用語について「+」の極性での登録を求めるリクエストが送信される。
【0086】
これを受けたWebサーバ54は、辞書編集支援部38に対して、管理者が選択した各用語について、「+」の極性を付して対応の辞書に登録するように依頼する。
Webサーバ54からの依頼を受信した辞書編集支援部38は(S38)、Webサーバ54から送信された各用語を、対応の辞書に追加登録する(S40)。
この際、辞書編集支援部38は、各用語の「極性」として「+」を設定する。また、類義語辞書から取得しておいた各用語の読みがなを、「読みがな」のデータ項目に追加する。また、送信された用語の中に、対応の辞書中に既に登録済みのものが存在した場合、上書更新される。
【0087】
上記においては、「起点語:感動」の一次展開語及び二次展開語について「+」の極性での登録を求める例を示したが、例えば「起点語:ださい」の一次展開語及び二次展開語について「−」の極性での登録を求める場合、管理者は必要な用語に対するチェック入れを行った後、マイナス登録ボタン89をクリックすればよい。
【0088】
また上記のように、プラス登録ボタン88やマイナス登録ボタン89のクリックにより、チェックが入れられた全ての用語について何れか一方の極性をまとめて指定する代わりに、各用語について個別に極性を設定する方式を採用してもよい。
具体的には、用語単位で極性選択用の入力項目(例えばラジオボタン)を設けておき、その選択入力に応じて極性の指定がなされるように構成することが当てはまる。
【0089】
上記においては、起点語の類義語である一次展開語の他に、各一次展開語の類義語である二次展開語をも抽出し、感性用語登録画面80上に一次展開語リスト86及び二次展開語リスト87を表示させる例を説明したが、一次展開語のみをリスト表示するように構成を簡素化することもできる。
【0090】
管理者は、辞書に登録された感性用語の削除を行うこともできる。
この場合、管理者は管理者用のサービスメニューから「辞書メンテナンスサービス/感性用語削除」を選択する。
この結果、Webサーバ54からクライアント端末58に対して「感性用語削除画面」が送信される。
【0091】
図17は、この感性用語削除画面90の一例を示すものであり、対象辞書選択欄91と、極性選択欄92を備えている。
これに対し管理者は、対象辞書選択欄91における「▼」ボタン93をクリックしてプルダウンメニューを開き、任意の辞書を選択する。図においては「汎用/単語辞書」が選択されているが、他の辞書類を編集対象として指定することもできる。
【0092】
つぎに管理者は、極性選択欄92における「▼」ボタン94をクリックしてプルダウンメニューを開き、任意の極性を選択する。図においては「マイナス」の極性が選択されている。
つぎに、管理者が抽出ボタン95をクリックすると、クライアント端末58からWebサーバ54に対して、マイナス設定語の表示リクエストが送信される。
これを受けたWebサーバ54は、辞書編集支援部38に対して極性として「−」が設定された感性用語の抽出を依頼する。
【0093】
以下、図18のフローチャートに従い、辞書編集支援部38における処理手順を説明する。
まず、Webサーバ54から上記の依頼を受信した辞書編集支援部38は(S50)、感性辞書記憶部18内における対応辞書から、「−」の極性が設定された感性用語を全て抽出する(S52)。
つぎに辞書編集支援部38は、抽出した各感性用語のリストを生成し、Webサーバ54に送信する(S54)。
【0094】
これを受けたWebサーバ54は、マイナス設定語リストを備えた感性用語削除画面90を生成し、クライアント端末58に再送信する。
図示の通り、マイナス設定語リスト96には、「あぶない」、「危ない」、「あぶなげない」、「あざとい」、「浅ましい」等のマイナス設定語が列記されている。
【0095】
管理者は、このマイナス設定語リスト96に列記された感性用語の要否を個別に検討し、辞書に登録しておく必要がないと判断した場合には対応のチェックボックスにチェックを入れる。
必要な感性用語に対するチェック入れを完了した管理者が削除ボタン97をクリックすると、クライアント端末58からWebサーバ54に対して、リスト中においてチェックが入れられた感性用語を特定する情報と、これらの感性用語について削除を求めるリクエストが送信される。
【0096】
これを受けたWebサーバ54は、辞書編集支援部38に対して、管理者が選択した各感性用語について削除するように依頼する。
Webサーバ54からの依頼を受信した辞書編集支援部38は(S56)、Webサーバ54から送信された各感性用語のレコードを、対応の辞書から削除する(S58)。
【0097】
上記においては、マイナス設定語の一括削除を求める場合について説明したが、管理者が極性選択欄92においてプラスを選択した場合にも、実質的に上記と同様の処理が実行される。
すなわち、極性として「+」が設定された感性用語の抽出依頼をWebサーバ54から受信した辞書編集支援部38は(S50)、感性辞書記憶部18内における対応辞書から、「+」の極性が設定された感性用語を全て抽出する(S52)。
つぎに辞書編集支援部38は、抽出した各感性用語のリストを生成し、Webサーバ54に送信する(S54)。
【0098】
これを受けたWebサーバ54は、プラス設定語リストを備えた感性用語削除画面90を生成し、クライアント端末58に送信する。
これに対し管理者は、このプラス設定語リストに列記された感性用語の要否を個別に検討し、辞書に登録しておく必要がないと判断した場合には対応のチェックボックスにチェックを入れる。
必要な感性用語に対するチェック入れを完了した管理者が削除ボタン97をクリックすると、クライアント端末58からWebサーバ54に対して、リスト中においてチェックが入れられた感性用語を特定する情報と、これらの感性用語について削除を求めるリクエストが送信される。
【0099】
これを受けたWebサーバ54は、辞書編集支援部38に対して、管理者が選択した各感性用語について削除するように依頼する。
Webサーバ54からの依頼を受信した辞書編集支援部38は(S56)、Webサーバ54から送信された各感性用語のレコードを、対応の辞書から削除する(S58)。
【0100】
また、上記のように管理者が選択した極性単位で一括削除を行う代わりに、極性を問わず全登録感性用語について一括削除するように構成することもできる。
この場合、感性用語削除画面90には辞書登録済みの感性用語及びその極性が列記された感性用語リストが表示され、管理者は各感性用語及びその極性に基づいて要否を判断する。そして管理者は、不要と判断した感性用語のチェックボックスにチェックを入れて、削除ボタン97をクリックする。
登録件数が多い場合には、リストアップされる用語の種類を絞り込むためのボタン(例えば「あ行表示ボタン」等)を画面上に設けておき、一度に表示される用語の数を調整することが望ましい。
【0101】
このシステム10は、管理者に対して感性用語候補を推奨する機能をも備えている。すなわち、管理者が管理者用のサービスメニューから「辞書メンテナンスサービス/感性用語リコメンド登録」を選択すると、Webサーバ54からクライアント端末58に対して「感性用語リコメンド登録画面」が送信される。
【0102】
図19は、この感性用語リコメンド登録画面100の一例を示すものであり、対象辞書選択欄102と、推奨用語リスト104を備えている。
これに対し管理者は、対象辞書選択欄102における「▼」ボタン106をクリックしてプルダウンメニューを開き、任意の辞書を選択する。図においては「汎用/単語辞書」が選択されているが、他の辞書類を編集対象として指定することもできる。
【0103】
つぎに管理者は、推奨用語リスト104に列記された推奨用語と、その極性(+/−)を個別に検討し、追加登録が必要と判断した場合には対応のチェックボックスにチェックを入れる。
必要な推奨用語に対するチェック入れを完了した管理者が登録ボタン108をクリックすると、クライアント端末58からWebサーバ54に対して、リスト中においてチェックが入れられた推奨用語を特定する情報と、これらの用語について対応の極性での登録を求めるリクエストが送信される。
【0104】
これを受けたWebサーバ54は、辞書編集支援部38に対して、管理者が選択した各推奨用語について、「+」または「−」の極性を付して対応の辞書に登録するように依頼する。
【0105】
Webサーバ54からの依頼を受信した辞書編集支援部38は、Webサーバ54から送信された各推奨用語を、対応の辞書に感性用語として追加登録する。この際、辞書編集支援部38は各感性用語の「極性」として、推奨用語に関連付けられていた極性を設定する。
【0106】
上記の推奨用語リスト104は、感性用語候補記憶部39の登録データを参照することにより、辞書編集支援部38によって生成される。
すなわち、感性用語候補記憶部39には、図20(a)に示すように、「感性用語候補」及び「ポイント」のデータ項目を備えたレコードが多数格納されている。各感性用語候補のポイントには、プラスまたはマイナスの符号が付された数値「1」が格納されている。
【0107】
Webサーバ54から推奨用語リストの生成依頼を受けた辞書編集支援部38は、感性用語候補記憶部39に格納された同一の感性用語候補間でポイントを集計し、図20(b)に示すように、集計ポイントの絶対値が大きい順に整列させる。
そして、所定の閾値以上の絶対値(例えば±15以上)を備えた感性用語候補を推奨用語として抽出して推奨用語リスト104を生成した後、Webサーバ54に送信する。Webサーバ54は、この推奨用語リスト104を組み入れた感性用語リコメンド登録画面100を生成し、管理者のクライアント端末58に送信する。
【0108】
感性用語候補記憶部39の登録データは、感性用語候補抽出部40が、分析結果記憶部30に蓄積された文書ファイルを解析することにより、生成される。
以下、図21のフローチャートに従い、感性用語候補抽出に係る処理手順を説明する。
【0109】
まず感性用語候補抽出部40は、分析結果記憶部30内の登録データを読み出す(S60)。上記の通り、分析結果記憶部30には、ネガ/ポジ判定処理、主題認定処理及び意図抽出処理が完了し、極性タグや否定タグ、ネガ/ポジ判定タグ、意図類型タグが該当の文に付与されている。
【0110】
これらの中で、感性用語候補抽出部40はネガ/ポジ判定タグの有無に着目し、同種のネガ/ポジ判定タグを付与された文に挟まれている、ネガ/ポジ判定タグが付与されていない文を探索する(S62)。
【0111】
例えば、図22(b)の「主人公もイケメンだし。」という文は、<P>のポジ判定タグが付与された(a)「ラストのシーンが良かった。」の文と、同じく<P>のポジ判定タグが付与された (c)「次回作も楽しみになった。」の文に挟まれており、なおかつ自身にはネガ/ポジ判定タグが付与されていないため、感性用語候補抽出部40は(b)の文をターゲット文と認識する。(b)の文についてネガ/ポジ判定タグが付与されていないのは、この文を構成する要素の中に、感性辞書中に登録された感性用語が含まれていないことに起因する。
【0112】
つぎに感性用語候補抽出部40は、ターゲット文中から形容詞、動詞、名詞を感性用語候補として抽出し(S64)、これに「+1」のポイントを関連付けた上で、感性用語候補記憶部39に登録する(S66)。図22(b)の文からは、「主人公」及び「イケメン」が抽出される。
【0113】
上記とは逆に、ネガ/ポジ判定タグが付与されていない文の前後に<N>のネガ判定タグが付与された文が存在していた場合、感性用語候補抽出部40は、この否定評価文に挟まれたターゲット文の中から抽出した形容詞、動詞、名詞を感性用語候補として抽出すると共に、これに「−1」のポイントを関連付けて感性用語候補記憶部39に登録する。
【0114】
感性用語候補抽出部40による上記の処理は、「同種の評価文は連続した固まりとなって文章中に登場する傾向があるため、同種の評価文に挟まれた文は前後の文と同種の評価文(否定評価文または肯定評価文)となる確率が高い」という仮定に基づいている。
【0115】
もちろん、文章によってはこの仮定に反する場合(例えば、否定評価文間に肯定的な論調の文が挟まれている場合)も当然に生じ得る。このような場合、感性用語候補抽出部40はターゲット文から抽出した用語に誤った極性のポイントを付与してしまうことになるが、上記のようにポイント集計後に一定以上の絶対値を備えた用語のみが推奨用語としてリスト104中に列挙され、しかも最終的には人間がその採否を判断する仕組みであるため、特に問題は生じない。それよりも、大量の文書ファイル中から感性用語候補を日々収集することが可能となるため、類義語辞書には収録されていないような最新の感性用語を感性辞書中に追加できるメリットが大きいといえる。
【0116】
なお、ターゲット文が<否定>タグが付与された否定表現を含むものである場合、感性用語候補抽出部40はこの<否定>タグの存在に対応したポイントの極性を導く。
例えば、図22(b)の文が「主人公もブサメンじゃなかったし。」であった場合、前後の文が肯定評価文であるため、(b)の文も全体として肯定評価文となる筈であるが、「なかった」の表現に<否定>タグが付与されているため、感性用語候補抽出部40は、当該文から抽出した「主人公」及び「ブサメン」に「−」の極性を認定する。
反対に、前後を否定評価文に挟まれたターゲット文に<否定>タグが付与されていた場合、感性用語候補抽出部40は、当該文から抽出した感性用語候補に「+」の極性を認定する。
【0117】
上記においては、この発明に係る感性分析システム10を、Webブラウザを搭載したクライアント端末58に各種画面(HTMLファイル)がWebサーバ54経由で送信されるWebシステムとして具体化した例を説明したが、このシステム10を実現するためのコンピュータプログラムをPC等のコンピュータにセットアップした、所謂スタンドアロン型のシステムとして具体化することも当然に可能である。
【図面の簡単な説明】
【0118】
【図1】この発明に係る感性分析システムの機能構成を示すブロック図である。
【図2】感性辞書の構成例を示す模式図である。
【図3】汎用辞書群に属する単語辞書の登録データを示すテーブルである。
【図4】分析条件指定画面の一例を示す図である。
【図5】感性分析システムにおける処理手順を示すフローチャートである。
【図6】ネガ/ポジ判定処理の手順を示すフローチャートである。
【図7】具体的な文に対するネガ/ポジ判定処理の実行例を示す図である。
【図8】具体的な文に対する主題継承処理の実行例を示す図である。
【図9】意図表現記憶部の登録データを示すテーブルである。
【図10】具体的な文に対する意図表現抽出処理の実行例を示す図である。
【図11】分析結果画面の一例を示す図である。
【図12】分析結果画面の一例を示す図である。
【図13】分析結果画面の生成に係る処理手順を示すフローチャートである。
【図14】評価軸類似表現辞書の登録データを示すテーブルである。
【図15】感性用語登録画面の一例を示す図である。
【図16】感性用語登録に係る処理手順を示すフローチャートである。
【図17】感性用語削除画面の一例を示す図である。
【図18】感性用語削除に係る処理手順を示すフローチャートである。
【図19】感性用語リコメンド登録画面の一例を示す図である。
【図20】感性用語候補の具体例を示す図である。
【図21】感性用語候補抽出の処理手順を示すフローチャートである。
【図22】感性用語候補抽出処理の実行例を示す図である。
【符号の説明】
【0119】
10 感性分析システム
12 文書登録部
14 文書記憶部
16 文書解析部
18 感性辞書記憶部
20 否定表現記憶部
22 ネガ/ポジ判定部
24 主題認定部
26 意図表現記憶部
28 意図抽出部
30 分析結果記憶部
32 評価軸類似表現記憶部
34 類義語辞書記憶部
36 分析結果評価部
38 辞書編集支援部
42 汎用辞書群
44 ドメイン別辞書群
45 汎用/単語辞書
46 汎用/二項関係辞書
47 汎用/慣用句辞書
48 汎用/擬態語辞書
49 ドメイン別/単語辞書
50 ドメイン別/二項関係辞書
51 ドメイン別/擬態語辞書
54 Webサーバ
56 インターネット
58 クライアント端末
60 分析条件指定画面
61 分析対象ファイル指定欄
62 評価軸指定欄
63 参照ボタン
64 分析開始ボタン
70 分析結果画面
71 ネガ/ポジ分析結果表示欄
72 意図抽出結果表示欄
73 レーダーチャート
74 折れ線図形
76 意図分類チャート
77a 意図分類ボタン
77b 意図分類ボタン
77n 意図分類ボタン
78 マウスポインタ
79 ポップアップウインドウ
80 感性用語登録画面
81 対象辞書選択欄
82 起点語指定欄
84 入力フィールド
85 展開ボタン
86 一次展開語リスト
87 二次展開語リスト
88 プラス登録ボタン
89 マイナス登録ボタン
90 感性用語削除画面
91 対象辞書選択欄
92 極性選択欄
95 抽出ボタン
96 マイナス設定語リスト
97 削除ボタン
100 感性用語リコメンド登録画面
102 対象辞書選択欄
104 推奨用語リスト
108 登録ボタン

【特許請求の範囲】
【請求項1】
事物に対する肯定/否定の価値判断を表す感性用語と、肯定/否定の何れであるかを示す属性との組合せを格納しておく感性辞書記憶手段と、
複数の用語について、各用語の類義語を定義したデータが格納された類義語辞書記憶手段と、
起点語が入力された場合に、この起点語をキーに上記類義語辞書記憶手段を検索し、当該起点語の類義語を抽出する手段と、
抽出された用語のリストを含む感性用語登録画面を生成し、外部に出力する手段と、
この画面を介して、上記リスト中の1または複数の用語を選択する情報と、各用語の属性を指定する情報が入力された場合に、選択された用語を指定された属性に関連付けて上記感性辞書記憶手段に格納する手段と、
を備えたことを特徴とする感性辞書編集支援システム。
【請求項2】
事物に対する肯定/否定の価値判断を表す感性用語と、肯定/否定の何れであるかを示す属性との組合せを格納しておく感性辞書記憶手段と、
複数の用語について、各用語の類義語を定義したデータが格納された類義語辞書記憶手段と、
起点語が入力された場合に、この起点語をキーに上記類義語辞書記憶手段を検索し、当該起点語の類義語を抽出する手段と、
各類義語をキーに上記類義語辞書記憶手段を検索し、各類義語の類義語を抽出する手段と、
抽出された用語のリストを含む感性用語登録画面を生成し、外部に出力する手段と、
この画面を介して、上記リスト中の1または複数の用語を選択する情報と、各用語の属性を指定する情報が入力された場合に、選択された用語を指定された属性に関連付けて上記感性辞書記憶手段に格納する手段と、
を備えたことを特徴とする感性辞書編集支援システム。
【請求項3】
上記リストに掲げられた各用語には、選択入力用のチェックボックスが設けられており、上記感性用語登録画面上には肯定の属性での登録を求めるボタンと、否定の属性での登録を求めるボタンとが設けられており、
上記チェックボックスに対するチェック入れによって1または複数の用語の選択情報が入力され、
上記何れかのボタンを押下することによって、全選択用語に対する属性の指定情報が入力されることを特徴とする請求項1または2に記載の感性辞書編集支援システム。
【請求項4】
上記リストに掲げられた各用語には、選択入力用のチェックボックスと、属性選択用の入力項目が設けられており、
上記チェックボックスに対するチェック入れによって1または複数の用語の選択情報が入力され、
上記入力項目に対する選択入力によって、各選択用語対する属性の指定情報が入力されることを特徴とする請求項1または2に記載の感性辞書編集支援システム。
【請求項5】
事物に対する肯定/否定の価値判断を表す感性用語と、肯定/否定の何れであるかを示す属性との組合せを格納しておく感性辞書記憶手段と、
文書ファイルに対して形態素処理を施し、当該文書ファイルに含まれる複数のテキスト文を形態素単位に分解する形態素解析手段と、
各文に含まれる形態素または形態素の組合せからなる表現が、上記感性辞書記憶手段に格納された感性用語に該当するか否かを判定し、該当する場合には当該表現に対して組み合わされている上記肯定/否定の何れかの属性を示す属性タグを関連付ける手段と、
否定文を構成する際に用いられる否定表現を格納しておく否定表現記憶手段と、
各文に含まれる形態素または形態素の組合せからなる表現が、上記否定表現記憶手段に格納された否定表現に該当するか否かを判定し、該当する場合には当該表現に対して否定表現であることを示す否定表現タグを関連付ける手段と、
各文に関連付けられた属性タグの種類と、否定表現タグの有無との組合せパターンに基づいて、当該文が否定評価文か肯定評価文かを判定し、否定評価文に対してはネガ判定タグを付与すると共に、肯定評価文に対してはポジ判定タグを付与する手段と、
感性用語候補と、プラス/マイナスの何れかの極性を備えたポイントとの組合せを格納しておく感性用語候補記憶手段と、
上記文書ファイル中における、同種のネガ判定タグまたはポジ判定タグを付与された文に挟まれた、何れの判定タグをも付与されていない文を探索し、当該ターゲット文から所定の品詞の形態素または形態素の組合せからなる表現を感性用語候補として抽出する手段と、
ネガ判定タグが付与された文に挟まれたターゲット文が上記の否定表現を含まない場合には、当該ターゲット文から抽出した感性用語候補に対してマイナスのポイントを付与し、当該ターゲット文が上記の否定表現を含む場合には、当該ターゲット文から抽出した感性用語候補に対してプラスのポイントを付与し、ポジ判定タグが付与された文に挟まれたターゲット文が上記の否定表現を含まない場合には、当該ターゲット文から抽出した感性用語候補に対してプラスのポイントを付与し、当該ターゲット文が上記の否定表現を含む場合には、当該ターゲット文から抽出した感性用語候補に対してマイナスのポイントを付与する手段と、
各感性用語候補及びポイントを上記感性用語候補記憶手段に格納する手段と、
上記感性用語候補記憶手段に格納された各感性用語候補のポイントを集計する手段と、
ポイントの絶対値が所定の閾値以上の感性用語候補を推奨用語として抽出し、各推奨用語及びそれぞれの極性を列記した推奨用語リストを生成する手段と、
上記推奨用語リストを含む感性用語登録画面を生成し、外部に出力する手段と、
この画面を介して、上記推奨用語リスト中の1または複数の推奨用語を選択する情報が入力された場合に、選択された推奨用語及びその極性に対応した属性を上記感性辞書記憶手段に格納する手段と、
を備えたことを特徴とする感性辞書編集支援システム。
【請求項6】
上記感性辞書記憶手段に格納された少なくとも一部の感性用語を抽出して削除対象リストを生成し、このリストを含む感性用語削除画面をディスプレイに表示させる手段と、
この画面を介して、特定の感性用語を削除対象として選択する情報が入力された場合に、選択された感性用語に関するデータを上記感性辞書記憶手段から削除する手段と、
を備えたことを特徴とする請求項1〜5の何れかに記載の感性辞書編集支援システム。
【請求項7】
コンピュータを、
事物に対する肯定/否定の価値判断を表す感性用語と、肯定/否定の何れであるかを示す属性との組合せを格納しておく感性辞書記憶手段、
複数の用語について、各用語の類義語を定義したデータが格納された類義語辞書記憶手段、
起点語が入力された場合に、この起点語をキーに上記類義語辞書記憶手段を検索し、当該起点語の類義語を抽出する手段、
抽出された用語のリストを含む感性用語登録画面を生成し、外部に出力する手段、
この画面を介して、上記リスト中の1または複数の用語を選択する情報と、各用語の属性を指定する情報が入力された場合に、選択された用語を指定された属性に関連付けて上記感性辞書記憶手段に格納する手段、
として機能させることを特徴とする感性辞書編集支援プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22】
image rotate


【公開番号】特開2012−3574(P2012−3574A)
【公開日】平成24年1月5日(2012.1.5)
【国際特許分類】
【出願番号】特願2010−139012(P2010−139012)
【出願日】平成22年6月18日(2010.6.18)
【出願人】(000155469)株式会社野村総合研究所 (1,067)
【Fターム(参考)】