説明

グラフ生成装置及びグラフ生成プログラム

【課題】第1のグラフ及び第2のグラフの差を示す情報を付与しない場合に比べて、生成されるグラフ同士の差を利用者が認識し易くなる、グラフ生成装置及びグラフ生成プログラムを提供する。
【解決手段】有向グラフを比較するように指示されると、対応するデータを全データ記憶部44から抽出し、各集合に含まれる語の頻度を計数して頻度の順位データを生成し、記憶部45に記憶する。分類部60は、各集合に含まれる語を記憶部45に記憶されている規則に従って、順位データを参照して分類する。表示変更情報付与部62は分類に応じて、語の視覚的表示を変更するための表示変更情報を各語に付与する。グラフ生成部48は、表示変更情報に基づいて指示された語に関する視覚的表示を他と異ならせて比較対象の集合の有向グラフを生成し、コメント生成部64は、分類に応じてコメントを生成し、生成された有向グラフ及びコメントを表示部50に表示する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、グラフ生成装置及びグラフ生成プログラムに関する。
【背景技術】
【0002】
特許文献1には、設定されたキーワードに応じて検索対象文書群から前記キーワードを持つ文書を検索結果文書として検出すること、ある単語が前記検索結果文書群中のいくつの文書に表れるかを意味する単語の文書頻度を検出すること、前記単語が検索対象文書群全体においていくつの文書に出現するかを意味する単語の全体文書頻度を検出すること、前記単語の文書頻度と単語の全体文書頻度との比を意味する頻度比を導出すること、前記文書頻度を所定の関係で頻度クラスに区分分けして各単語の文書頻度に応じて各単語を頻度クラスに対応させること、各頻度クラスから適当数の単語を単語の頻度比の大きさ順位特徴語として抽出すること、抽出された特徴語をグラフ形式またはリスト形式で表示することとよちなることを特徴とする文献検索支援方法が記載されている。
【0003】
特許文献2には、複数の文単位を含んでなる解析対象の文単位集合において出現する語をグラフ表示するグラフ表示装置において、文単位に対応づけて当該文単位に出現する語を記憶する記憶手段と、文単位集合中の文単位に出現する語について当該文単位集合における頻度を記憶手段を参照して計算する頻度計算手段と、上記頻度計算手段が計算した頻度を参照して、上記文単位集合において頻度が上位のL(2以上の整数)個以下の語を特定する語特定手段と、上記語特定手段で特定された語の各々について、上記文単位集合あら、当該語を含む文単位からなる部分集合を導出する部分集合導出手段と、上記部分集合に対応する語および導出もとの文単位集合に対応する語から導出先の部分集合に対応する語へのリンクを表示する表示手段とを有し、上記部分集合導出手段は、ルートの文単位集合から開始して繰り返し部分集合を導出することを特徴とするグラフ表示装置が記載されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開平10−074210号公報
【特許文献2】特開2009−128949号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
本発明は、第1のグラフ及び第2のグラフの差を示す情報を付与しない場合に比べて、生成されるグラフ同士の差を利用者が認識し易くなる、グラフ生成装置及びグラフ生成プログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
上記目的を達成するために、請求項1に記載のグラフ生成装置は、全体集合を構成する複数の文から語の出現頻度を計数し、計数した出現頻度に応じて、語同士の関係を示すグラフを予め定められた規則により生成する生成手段と、第1の集合を構成する文に含まれる語の出現頻度に応じて前記生成手段で生成された第1のグラフ及び第2の集合を構成する文に含まれる語の出現頻度に応じて前記生成手段で生成された第2のグラフの差を視覚的に表示するための表示情報を、前記第1の集合を構成する文に含まれる語の出現頻度及び前記第2の集合を構成する文に含まれる語の出現頻度に基づいて生成し、生成された前記表示情報を前記第1のグラフ及び前記第2のグラフの少なくとも一方に付与する付与手段と、前記付与手段により前記表示情報が付与された前記第1のグラフ及び前記第2のグラフの少なくとも一方を出力する出力手段と、を備える。
【0007】
請求項2に記載のグラフ生成装置は、請求項1に記載のグラフ生成装置において、前記第1の集合における出現頻度の順位及び前記第2の集合における出現頻度の順位に基づいて予め定められた規則と、前記表示情報と、の対応関係を記憶する記憶部と、前記第1の集合における出現頻度の順位と、前記第2の集合における出現頻度の順位と、の違いに基づいて予め定められた規則に従って、語を分類する分類手段と、を備え、前記付与手段は、前記対応関係と、前記分類手段の分類と、に基づいて前記表示情報を生成し、生成された前記表示情報を前記第1のグラフ及び前記第2のグラフの少なくとも一方に付与する。
【0008】
請求項3に記載のグラフ生成装置は、請求項2に記載のグラフ生成装置において、前記表示情報は、前記第1のグラフ及び前記第2のグラフの少なくとも一方の語に関する表示を前記分類に応じて他の語に関する表示とは異ならせる情報である。
【0009】
請求項4に記載のグラフ生成装置は、請求項1から請求項3のいずれか1項に記載のグラフ生成装置において、前記付与手段は、前記第1のグラフ及び前記第2のグラフの差を表す文章を生成する文章生成手段を備え、前記表示情報は、前記生成手段により生成された文章を表示させるための情報である。
【0010】
請求項5に記載のグラフ生成装置は、請求項1から請求項4のいずれか1項に記載のグラフ生成装置において、前記生成手段が生成する前記グラフは、有向グラフである。
【0011】
請求項6に記載のグラフ生成装置は、請求項1から請求項5のいずれか1項に記載のグラフ生成装置において、前記第2の集合は、前記第1の集合の部分集合である。
【0012】
請求項7に記載のグラフ生成装置は、請求項1から請求項5のいずれか1項に記載のグラフ生成装置において、前記第1の集合及び前記第2の集合は、第3の集合の部分集合である。
【0013】
請求項8に記載のグラフ生成プログラムは、集合を構成する複数の文から語の出現頻度を計数し、計数した出現頻度に応じて、語同士の関係を示すグラフを予め定められた規則によって生成手段により生成するステップと、第1の集合を構成する文に含まれる語の出現頻度に応じて前記生成手段で生成された第1のグラフ及び第2の集合を構成する文に含まれる語の出現頻度に応じて前記生成手段で生成された第2のグラフの差を視覚的に表示するための表示情報を、前記第1の集合を構成する文に含まれる語の出現頻度及び前記第2の集合を構成する文に含まれる語の出現頻度に基づいて生成し、生成された前記表示情報を前記第1のグラフ及び前記第2のグラフの少なくとも一方に付与手段により付与するステップと、前記付与手段により前記表示情報が付与された前記第1のグラフ及び前記第2のグラフの少なくとも一方を出力手段により出力するステップと、を備えた処理をコンピュータに実行させるためのものである。
【発明の効果】
【0014】
請求項1及び請求項8に記載の発明によれば、第1のグラフ及び第2のグラフの差を示す情報を付与しない場合に比べて、生成されるグラフ同士の差を利用者が認識し易くなる。
【0015】
請求項2に記載の発明によれば、記憶している対応関係と分類とに基づいて表示情報が生成されない場合に比べて、容易に表示情報が生成される。
【0016】
請求項3に記載の発明によれば、語に関する表示を異ならせない場合に比べて、生成されるグラフ同士の差を利用者が認識し易くなる。
【0017】
請求項4に記載の発明によれば、グラフの差を表す文章が表示されない場合に比べて、生成されるグラフ同士の差を利用者が認識し易くなる。
【0018】
請求項5に記載の発明によれば、他の種類のグラフで示された場合に比べて、生成されるグラフ同士の差を利用者が認識し易くなる効果が高くなる。
【0019】
請求項6に記載の発明によれば、本構成を有しない場合に比べて、全体集合と部分集合との差を利用者が認識しやすくなる。
【0020】
請求項7に記載の発明によれば、本構成を有しない場合に比べて、部分集合同士の差を利用者が認識し易くなる。
【図面の簡単な説明】
【0021】
【図1】本実施の形態に係る有向グラフを生成するための基本的な構成を備えたグラフ生成装置の概略構成の一例を示すブロック図である。
【図2】本実施の形態に係るグラフ生成装置の動作の一例を模式的に説明するための説明図である。
【図3】本実施の形態に係るグラフ生成装置の制御部で実行される処理の具体的一例を示すフローチャートである。
【図4】本実施の形態に係る語出現データの一例を説明するための説明図である。
【図5】本実施の形態に係る係り受け関係を含む語出現データの具体的一例を説明するための説明図である。
【図6】本実施の形態に係るノードデータ及びリンクデータの一例を説明するための説明図である。
【図7】本実施の形態に係るグラフ生成装置で生成された有向グラフの具体的一例を示したグラフである。
【図8】本実施の形態に係るグラフ生成装置の概略構成の具体的一例を示すブロック図である。
【図9】本実施の形態に係る全データ記憶部に記憶されている携帯電話に関するアンケートのデータの具体的一例を説明するための説明図である。
【図10】本実施の形態に係るグラフ生成装置の制御部で実行される処理の具体的一例を示すフローチャートである。
【図11】本実施の形態に係るグラフ生成装置の記憶部に記憶される全体集合の順位データの具体的一例を説明するための説明図である。
【図12】本実施の形態に係るグラフ生成装置の記憶部に記憶される女性集合の順位データの具体的一例を説明するための説明図である。
【図13】本実施の形態に係るグラフ生成装置の記憶部に記憶される男性集合の順位データの具体的一例を説明するための説明図である。
【図14】本実施の形態に係るグラフ生成装置の記憶部に記憶されている語を分類するための規則、及び当該規則により分類された語の具体的位一例を説明するための説明図である。
【図15】本実施の形態に係るグラフ生成装置の記憶部に記憶されているコメントを生成するための定型文の具体的一例を説明するための説明図である。
【図16】本実施の形態に係るグラフ生成装置により全体集合の有向グラフと女性集合の有向グラフとを比較した場合の差を視覚的に示した有向グラフの具体的一例を示す有向グラフである。
【図17】本実施の形態に係るグラフ生成装置により生成され、図16に示した有向グラフと共に表示されるコメントの具体的一例を説明するための説明図である。
【図18】比較例として、差が視覚的に表示されていない女性集合の有向グラフの具体的一例を示す有向グラフである。
【図19】本実施の形態に係るグラフ生成装置により全体集合の有向グラフと男性集合の有向グラフとを比較した場合の差を視覚的に示した有向グラフの具体的一例を示す有向グラフである。
【図20】本実施の形態に係るグラフ生成装置により生成され、図19に示した有向グラフと共に表示されるコメントの具体的一例を説明するための説明図である。
【図21】比較例として、差が視覚的に表示されていない男性集合の有向グラフの具体的一例を示す有向グラフである。
【図22】本実施の形態に係るグラフ生成装置により女性集合の有向グラフと男性集合の有向グラフとを比較した場合の差を視覚的に示した有向グラフの具体的一例を示す有向グラフである。
【図23】本実施の形態に係るグラフ生成装置により女性集合の有向グラフと比較した際の全体集合の有向グラフと、男性集合の有向グラフと比較した際の全体集合の有向グラフとを比較した場合の差を視覚的に示した有向グラフの具体的一例を示す有向グラフである。
【発明を実施するための形態】
【0022】
以下、図面を参照して本発明の実施の形態を詳細に説明する。なお、本実施の形態のグラフ生成装置は、具体的一例として、有向グラフを生成して表示するグラフ生成装置である。
【0023】
まず、本実施の形態のグラフ生成装置で有向グラフを生成するための原理的な構成について説明する。有向グラフを生成するための基本的な構成を備えたグラフ生成装置を図1に示す。
【0024】
図1に示した本実施の形態のグラフ生成装置10は、例えば、アンケートの回答を解析目的として、回答内に含まれる自由形式のコメント(1または複数の文からなる文単位)等の傾向を当該コメントに含まれる語同士の関係を示すグラフを生成してユーザに対して提示する。なお、自由形式のコメントに併せて、固定形式の回答(選択肢、または固定語)を用いてもよい。
【0025】
本実施の形態では、図2に示すように、表示する語と、語の間の関係(リンク)とを特定する。具体的には次の処理により特定を行う。
【0026】
(1)コメントの集合(全体集合)に含まれる語の頻度を求める。
【0027】
(2)頻度の高い順にL個の部分集合を作る。以下では、Lを幅と呼ぶことがある。
【0028】
(3)部分集合の各々について、処理(2)を行う。これをM回繰り返す。以下では、Mを深さと呼ぶこともある。
【0029】
このようにして部分集合を幅L、深さMで導出し、導出した部分集合の作成に用いた語を表示対象の語として選択し、導入元の集合から導入先の集合への関係を導入元の集合から特定された語から、導入先の集合から特定された語へのリンクとし、特定した語及びリンクからなるグラフを生成して表示する。
【0030】
図1に示すように、本実施の形態のグラフ生成装置10は、制御部12、全データ記憶部14、形態解析部16、グラフ生成部18、及び表示部20を備えて構成されている。
【0031】
制御部12は、グラフ生成装置10全体の制御を行うものであり、具体的には、CPU22、ROM24、及びRAM26を含んで構成されている。CPU22で実行される制御の制御プログラム25は、ROM24に格納されている。なお、本実施の形態では、制御プログラム25は、予め格納されている構成としているがこれに限らず、制御プログラム25をCD−ROMやリムーバブルディスク等の記録媒体等に記憶しておき記録媒体から制御部12にインストールするようにしてもよいし、インターネット等の通信回線を介して外部装置から制御部10にインストールするようにしてもよい。RAM26は、CPU22で制御プログラム25を実行する際の作業用の領域を確保するものである。
【0032】
全データ記憶部14は、アンケートの回答等、コメントを含む全データを記憶する機能を有するものである。
【0033】
形態解析部16は、アンケートに含まれるコメントを解析し、有向グラフを生成するための元となる語出現データを生成し、記憶する機能を有するものである。形態解析部16は、語出現データ生成部28及び語出現データ記憶部30を含んで構成されており、さらに語出現データ生成部28は、単語分解部32及び係り受け関係抽出部33を有して構成されている。
【0034】
本実施の形態の語出現データとは、例えば、図4に示すデータ構造の語出現データである。図4に示した例では、語出現データはコメント番号、語ID、コメント(アンケートの回答)に付与された複数の属性の値を含むが、これに限定されない。属性は、性別、年齢(年齢範囲)、居住地範囲等である。1のコメントにN個の異なり語が含まれる場合には、N個の語出現データが準備される。準備対象の語を名詞等の品詞で限定してもよい。
【0035】
語出現データの具体的な例は、図4に示した例に限定されない。より好ましい具体的一例を図5に示す。図5に示した語出現データは、コメント番号、述部を受け部とする係り受け関係、コメント(文)、属性値(「fact」欄)を含んで構成されている。例えば、最上行のデータは、コメント番号が5137で、述部(受け部)が「よい」で名詞部(係り部)が「メンバー」である。係り部が助詞の「は」、「が」、「を」、「に」、及び「で」等で区分して表示されるので、係り受け関係を参照するだけで全体としての意味内容の把握が容易になる。このように、係り受け関係が示された語出現データを用いることが好ましいため、本実施の形態では、図5に示した係り受け関係が示された語出現データを用いている。
【0036】
語出現データ生成部28の単語分解部32は、全データ記憶部14に記憶されているコメントを1文毎に、単語に分解して形態素解析を行う機能を有しており、係り受け関係抽出部33は、単語分解部32で分解された単語の係り受け関係を抽出する機能を有している。なお、形態素解析及び係り受け関係の抽出等は周知の手法を用いて行えばよい。
【0037】
語出現データ記憶部30は、語出現データ生成部28により生成された語出現データを記憶する機能を有するものである。
【0038】
グラフ生成部18は、語出現データ記憶部30に記憶されている語出現データに基づいて有向グラフを生成する機能を有するものであり、頻度計算部34、語特定部36、及び部分集合導出部38を含んで構成されている。
【0039】
頻度計算部34は、対象語の各々が出現するコメントが、対象となる集合内にいくつあるかを計算するものであり、典型的には、語ID毎に当該語出現データを含む語出現データの個数を計算するものであるが、これに限定されない。語毎のコメント数のヒストグラムを生成するものであれば、どのような手法を採用してもよい。
【0040】
語特定部36は、頻度計算部34で計算された語の頻度に基づいて、頻度が1位からL位までのL個の語を特定する。
【0041】
部分集合導出部38は、図2を参照して説明した手順で指定された集合から部分集合を導出していくものであり、その際、頻度計算部34に対して導入元の集合を指定し、語特定部36から特定された語を取得する。部分集合導出部38は、特定した語から図6(a)に一例を示すノードデータを取得し、また部分集合の導入元および導入先に基づいて図6(b)に一例を示すリンクデータを取得する。ノードデータはノードID、語ID、語(文字列)、ノードに対応する部分集合に含まれるコメントの個数(要素数)等を含むが、これに限定されない。リンクデータは、リンクID、ソースノード(親、導出元)のノードID、ターゲットノード(子、導出先)のノードIDを含むが、これに限定されない。
【0042】
有向グラフ生成部39は、部分集合導出部38からノードデータおよびリンクデータを取得して有向グラフのネットワーク構造を決定し、表示部20は、有向グラフの表示を行う。ネットワーク構造は予め定められた手法により決定され、特に限定されないが、例えば、「キーグラフ」(http://www2.kke.co.jp/keygraph)やAT&T社の「GraphViz」(http://www.graphviz.org)等のネットワーク構造を表示(可視化)するツールを利用すればよい。表示部20の表示例(有向グラフの例)を図9に示す。図9に示すように、有向グラフは、対象となるコメント集合全体において出現する語をリンクで結びつけるものである。語(ノード)やリンクの大きさ、太さ、色等をコメントの頻度等に応じて可変させてもよい。
【0043】
本実施の形態のグラフ生成装置10の動作例を説明する。図3は、グラフ生成装置10の動作例を示したフローチャートであり、当該フローチャートに示した処理は、グラフ生成装置10の制御部12で実行される。
【0044】
ステップ100では、全データ記憶部14から1文を取り出し、次のステップ102では、単語分解部32で当該1文を単語に分解し、次のステップ104では、さらに係り受け関係抽出部33で係り受け関係を抽出して語出現データを生成する。そして、生成した語出現データを次のステップ106では、語出現データ記憶部30に記憶させる。
【0045】
次のステップ108では全データ記憶部14に記憶されている全文に対して上記ステップ100〜106の処理を行ったか否かを判断する。未だ行っていない場合は、否定されてステップ100に戻り、本処理を繰り返し、行った(終了した)場合は、肯定されてステップ110へ進む。
【0046】
なお本実施の形態では、上記ステップ100〜108の処理を形態解析処理と称する。
【0047】
ステップ110では、コメントの全体集合を頻度計算の対象に設定する。次のステップ112では、頻度計算部34で各語の頻度を計算する。次のステップ114では、語特定部36で頻度が上位のL個以下の語を選択し、次のステップ116では、部分集合導出部38で選択語について当該語を含む部分集合を抽出し、探索する。例えば、深さ優先(バックトラック法)で部分集合を探索する場合には、図6(a)(L=2の例)に示すように、1〜Nの部分集合を探索し、最上位の1個の語を選択していく。幅優先で部分集合を探索する場合には、図6(b)(L=2の例)に示すように1〜Nの部分集合を探索していく。次のステップ118では、ノード/リンクデータを生成して記憶する。ノード/リンクデータの記憶箇所は、語出現データ記憶部30を用いてもよいし、他の記憶部(例えばグラフ生成部18内に設けられた記憶部)を用いてもよい。
【0048】
次のステップ120では、選択語に対応する部分集合を頻度計算の対象に設定し、次のステップ122では、終了条件が満たされるかどうかを判断する。終了条件が満たされない場合は、否定されてステップ112に戻り、本処理を繰り返し、満たされた場合は、肯定されてステップ124へ進む。なお、終了条件は、指定された深さまで語が特定され終わった場合や、上限数の語が特定された場合や、下限数以上のメッセージを含む集合が無くなった場合等が挙げられるが、これに限定されず、予め定めておけばよい。
【0049】
次のステップ124では、有向グラフ生成部39がノードデータ及びリンクデータを用いて予め定められたグラフ生成手法(上述の「キーグラフ」や「GraphViz」等)を用いて有向グラフを生成し、次のステップ126では、生成された有向グラフを表示部20に表示させる。
【0050】
なお本実施の形態では、上記ステップ110〜124の処理をグラフ生成処理と称する。
【0051】
本実施の形態のグラフ生成装置10により生成された有向グラフとして、携帯電話に関する自由形式のアンケートの回答であるコメントの集合から生成した有向グラフの具体的一例を図7に示す。なお、本実施の形態で例示する有向グラフでは、出現頻度が高く他の語と多くの関係を持つ上位5つの語を斜線で塗りつぶされた円の中に示している。有向グラフのリンクをたどることにより、どのようなことが語られているのかが把握される。図7に示した例では、有向グラフ上に分布された語の配置に基づいてどのような事柄が話題になっているかを把握することが容易になる。
【0052】
次に、上述した有向グラフを生成するための原理的構成を備えた本実施の形態のグラフ生成装置(図8、グラフ生成装置40)の構成及びその動作について詳細に説明する。なお、具体的一例として、携帯電話に関するアンケートに含まれるコメントを解析した有向グラフを生成する場合について詳細に説明する。
【0053】
図8に、本実施の形態のグラフ生成装置40の概略構成を示す。なお、本実施の形態のグラフ生成装置40は、上述のグラフ生成装置10と略同様の構成を含むため、略同様の構成、及びその動作については詳細な説明を省略する。
【0054】
本実施の形態のグラフ生成装置40は、制御部42、ユーザインターフェイス部43、全データ記憶部44、記憶部45、形態解析部46、グラフ生成部48、付与部49、及び表示部50を含んで構成されている。
【0055】
グラフ生成装置40の制御部42はグラフ生成装置10の制御部12に対応し、全データ記憶部44は全データ記憶部14に対応し、形態解析部46は形態解析部16に対応し、グラフ生成部48はグラフ生成部18に対応し、表示部50は表示部20に対応する。
【0056】
また、制御部42に含まれるCPU52はCPU22に対応し、ROM54はROM24に対応し、RAM56はRAM26に対応する。本実施の形態の制御プログラム55は、制御プログラム25と同様にROM54に記憶される。
【0057】
また、図8では図示を省略したが、形態解析部46は、上述の形態解析部16と同様に、単語分解部及び係り受け関係抽出部33を含む語出現データ生成部と、語出現データ記憶部と、を含んで構成されている。グラフ生成部48は、上述のグラフ生成部18と同様に、頻度計算部と、語特定部と、部分集合導出部と、有向グラフ生成部39と、を含んで構成されている。
【0058】
本実施の形態のユーザインターフェイス部43は、ユーザが検索語等の設定を行うための機能を有するものである。具体的一例としては、キーボード、タッチパネル、及びディスプレイ等が挙げられる。
【0059】
全データ記憶部44には、全データ記憶部14と同様に、アンケートの回答等、コメントを含む全データを記憶する機能を有するものである。全データ記憶部44にデータを記憶させるには、ユーザインターフェイス部43によりユーザがデータを入力するようにしてもよいし、データが記録されている記録媒体から取得するようにしてもよいし、インターネット等の通信回線を介して外部装置から取得するようにしてもよい。全データ記憶部44に記憶されている携帯電話に関するアンケートのデータの具体的一例を図9に示す。図9に示した携帯電話に関するアンケートのデータは、コメントの番号を示すコメントIDと、属性として性別及び年齢、及びコメントを含んで構成されている。
【0060】
また、記憶部45は、予め、表示情報と語を分類するための規則との対応関係(詳細後述)や、コメントの定型文(詳細後述)等が記憶されている。また、付与部49でグラフ同士(集合同士)を比較して、表示情報を付与する際に用いるデータ(詳細後述)等を記憶する機能を有するものである。
【0061】
本実施の形態の付与部49は、グラフ生成部48により生成されるグラフ同士を比較して、グラフ同士の差を視覚的に表示するための表示情報を付与する機能を有するものであり、分類部60、表示変更情報付与部62、及びコメント生成部64を含んで構成されている。なお、本実施の形態では、表示情報の具体的例として、有向グラフ中に示される語の視覚的な表示を変更するための表示変更情報、及びグラフ同士の差を表すコメントについて説明する。分類部60は、グラフ同士の差を示す情報に対応付けられている分類に、予め定められた規則に従って語を分類する機能を有している。表示変更情報付与部62は分類部60の分類に応じて、グラフ中に表示する語の色等、語に関する情報を変更させる機能を有するものである。また、コメント生成部64は、分類部60の分類に応じて、グラフ生成部48により生成されるグラフ同士の差を表すコメントを生成する機能を有するものである。
【0062】
次に、本実施の形態のグラフ生成装置40の動作例を説明する。図10は、グラフ生成装置40の動作例を示したフローチャートであり、当該フローチャートに示した処理は、グラフ生成装置40の制御部42で実行される。なお、図10は、ユーザから指示された複数の集合同士の差をユーザが認識し易いように有向グラフを生成し、表示するための処理を示しており、予め全データ記憶部44に全データが記憶されており、形態解析部46により語出現データが生成され、形態解析部46の語出現データ記憶部(図示省略)に記憶された状態になっている。
【0063】
本処理は、ユーザインターフェイス部43を介してユーザから、有向グラフを作成し、比較するように指示された場合に実行される。なお、本実施の形態では、具体的一例として、ユーザから、携帯電話に関するアンケート全体(全体集合)の有向グラフ、当該アンケートのうち、女性が回答したアンケート(部分集合、女性集合という)の有向グラフ、及び当該アンケートのうち、男性が回答したアンケート(部分集合、男性集合という)の有向グラフを生成し、それぞれ比較するよう指示された場合について説明する。
【0064】
ステップ200では、比較に用いるデータを生成する集合を設定する。本実施の形態では、全体集合、女性集合、及び男性集合のいずれかを設定する。次のステップ202では、設定された集合に該当するデータを全データ記憶部44から抽出する。本実施の携帯では、全体集合が設定された場合には、全データ記憶部44に記憶されている全データを抽出する。また、女性集合が設定された場合には、全データ記憶部44に記憶されているデータのうち、属性が「女性」であるデータを検索し、抽出する。また、男性集合が設定された場合には、全データ記憶部44に記憶されているデータのうち、属性が「男性」であるデータを検索し、抽出する。
【0065】
次のステップ204では、設定した集合を構成する文に含まれる語の頻度を頻度計算部34により計算し、頻度順に語を並べた順位データを生成し、記憶部45に記憶させる。順位データの具体的例を図11〜図13に示す。図11は、全体集合における語の頻度の順位データ(順位が1〜20番目までの順位順のデータ)の具体的一例であり、図12は、女性集合における語の頻度の順位データ(順位が1〜20番目までの順位順のデータ)の具体的一例であり、また図13は、男性集合における語の頻度の順位データ(順位が1〜20番目までの順位順のデータ)の具体的一例である。
【0066】
次のステップ206では、他の集合を設定するか否かについて判断する。本実施の形態では、全体集合、女性集合、及び男性集合のいずれかについてまだ設定されていない場合は、肯定されてステップ200に戻って本処理を繰り返す。一方、全ての集合について設定し、順位データを記憶部45に記憶させた場合は、否定されてステップ208へ進む。
【0067】
ステップ208では、分類部60により、各集合に含まれている語を予め定められた規則に従って分類する。本実施の形態では、語を分類するための規則は予め記憶部45に記憶されている。図14に、本実施の形態の語を分類するための規則の具体的一例を示す。なお、図14では、当該規則に従って、後述の処理により語が分類された状態を示している。
【0068】
語を分類するための規則は、出現頻度の順位に基づいて予め定められている。例えば、図14に示すように、「全ての集合にある(全ての集合において順位が20位以内)」、「全体集合及び女性集合にある(全体集合及び女性集合で順位が20位以内、かつ男性集合で順位が20位よりも低い)」、「女性集合のみにある(女性集合のみで順位が20位以上)」、「女性集合のみで上位にある(女性集合のみで順位が5位以上)」、及び「女性集合でのみ上位から外れた(女性集合で順位が5位よりも低い、かつ全体集合及び男性集合で順位が5位以上)」等が規則として予め定められている。分類部60は、図11〜図13に具体的一例を示した順位データを比較し、当該規則に従って語を分類する。
【0069】
次のステップ210では、表示変更情報付与部62により、ステップ208で行った分類に基づいて表示変更情報を付与する。本実施の形態では、表示情報変更情報と、上述の語を分類するための規則と、の対応関係が予め定められており、当該対応関係が上述の規則と共に記憶部45に記憶されている(図14参照)。従って、記憶部45に記憶されている当該対応関係に基づいて各語に変更情報を付与する。
【0070】
次のステップ212では、比較させる有向グラフを生成する。具体的には、図3に示したステップ110〜124のグラフ生成処理を行い、ユーザからユーザインターフェイス部43を介して指示された集合の有向グラフを生成する。なお、本実施の形態では、上述の表示変更情報により、何れの集合の有向グラフの語の表示を変更するかについても上述の語を分類するための規則に対応して記憶部45に予め記憶されている。図14に示した具体的一例では、「全体」、「女性」、及び「男性」の欄に「1」、「0」で示した数値がこれにあたる。「1」が示されている集合中では、分類されている語の表示を変更する一方、「0」が示されている集合中では、分類されている語の表示は変更しない。本処理では、各語の表示を、何れの集合においてどのように変更するかを図14を参照し、グラフ生成部48で有向グラフを生成する。
【0071】
次のステップ214では、コメント生成部64により、ステップ208で行った分類に基づいてコメントを生成する。本実施の形態では、語の分類に応じてコメントの定型文が予め定められており、記憶部45に記憶されている。記憶部45に記憶されているコメントの定型文の具体的一例を図15に示す。図15に示した「番号」は、図14に具体的一例を示した語の分類の「番号」に対応している。なお、図14に示したコメントの定型文のうち、「○○○」は、変数を示しており、分類された語(対応する分類番号の語)が記載される。
【0072】
コメント生成部64は、語の分類に基づいて、記憶部45に記憶されている定型文からコメントを生成する。なお、図14に示した全てのコメント(番号1〜13)を生成する必要はなく、比較する集合の種類に応じたコメントのみを生成したり、ユーザインターフェイス部43を介してユーザにより選択指示されたコメントを生成したり、する等してもよい。
【0073】
次のステップ216では、ステップ212で生成された比較させる有向グラフ、及びステップ214で生成されたコメントを表示部50に表示させた後、本処理を終了する。
【0074】
本実施の形態のグラフ生成装置40により有向グラフ同士の差が視覚的に示された具体的例を示す。全体集合の有向グラフと女性集合の有向グラフとを比較する場合について示す。図16は、全体集合の有向グラフと女性集合の有向グラフとを比較した場合の差を視覚的に示した具体的一例を示しており、図17は、図16に示した有向グラフと共に表示されるコメントの具体的一例を示している。また、比較例として、グラフ生成装置10により生成した女性集合の有向グラフ(差が視覚的に示されていない有向グラフ)を図18に示す。なお、図16においては図示の都合上、オレンジ色で表示すべきところを二重丸「◎」で図示し、グレー色で表示すべきところを三角「△」で図示し、紫色で表示すべき所を四角「□」で図示している。以下、他の図においても、図16と同様に色を異ならせて表示すべきところを、語を囲む図形の形状を異ならせて表示することにより図示している。
【0075】
全体集合の有向グラフ(図7)と、部分集合である女性集合の有向グラフ(図18)と、では、形状が大きく異なっており、語が配置されている位置等も異なっているため、単に図7及び図18を比較するのみでは、両者の差が、視覚的に認識しづらい。一方、図16に示すように、本実施の形態では、二つの有向グラフの差に当たる語の表示が他と異なって視覚的に表示されるため、ユーザは、両者の差を認識し易くなる。なお、両者の差を表したコメントは表示しなくてもよいが、表示することにより、ユーザは、両者の差をより認識し易くなる。
【0076】
また、全体集合の有向グラフと男性集合の有向グラフとを比較する場合について示す。図19は、全体集合の有向グラフと男性集合の有向グラフとを比較した場合の差を視覚的に示した具体的一例を示しており、図20は、図19に示した有向グラフと共に表示されるコメントの具体的一例を示している。また、比較例として、グラフ生成装置10により生成した男性集合の有向グラフ(差が視覚的に示されていない有向グラフ)を図21に示す。上述の場合と同様に、単に図7及び図21を比較する場合よりも、図19に示すように、二つの有向グラフの差に当たる語の表示を他と異ならせて視覚的に表示させることにより、ユーザは、両者の差を認識し易くなる。
【0077】
さらに、男性集合の有向グラフと女性集合の有向グラフとを比較した場合の差を視覚的に示した具体的一例を図22に示す。なお、この場合、図17に示したコメント及び図20に示したコメントを共に表示させるとよい。このように部分集合同士を比較する場合においても、上述の場合と同様に、単に図18及び図21を比較する場合よりも、図29に示すように、二つの有向グラフの差に当たる語の表示を他と異ならせて視覚的に表示させることにより、ユーザは、両者の差を認識し易くなる。
【0078】
なお本実施の形態では、全体集合の有向グラフと部分集合の有向グラフとを比較する場合、同一の全体集合における部分集合の有向グラフ同士を比較する場合について説明したがこれに限らない。例えば、女性集合の有向グラフと比較した際の全体集合の有向グラフと、男性集合の有向グラフと比較した際の全体集合の有向グラフと、を比較した場合の差を視覚的に示した具体的一例を図23に示す。なお、この場合、図17に示したコメント及び図20に示したコメントを共に表示させるとよい。図23では、両者共に、全体集合の有向グラフであるが、それぞれ違う対象と比較した場合の差が視覚的に示されている。図23に示されるように、比較対象毎の差の違いをユーザは、認識しやすくなる。
【0079】
また、例えば、年度の異なる携帯電話のアンケートの全体集合同士を比較するようにしてもよいし、携帯電話のアンケートと一般電話のアンケートとを比較するようにしてもよい。このように、全く異なる集合の有向グラフ同士を比較するようにしてもよい。
【0080】
以上説明したように、本実施の形態では、記憶部45に、語を分類するための規則、当該規則と表示変更情報との対応関係、コメントの定型文等が予め記憶されている。ユーザから有向グラフ(集合)の比較を行うように指示されると、付与部49は、属性に基づいて、指示された集合に該当するデータを全データ記憶部44から抽出し、各集合に含まれる語の頻度を計数して頻度の順位データを生成し、記憶部45に記憶する。分類部60は、各集合に含まれている語を記憶部45に記憶されている規則に従って、順位データを参照して分類する。表示変更情報付与部62は分類部60の分類に応じて、有向グラフ中の語の視覚的表示を変更するための表示変更情報を、各語に付与する。グラフ生成部48は、表示変更情報に基づいて指示された語に関する視覚的表示を他と異ならせて、比較対象の集合の有向グラフを生成する。また、コメント生成部64は、分類部60の分類に応じてコメントを生成する。さらに、生成された有向グラフ及びコメントを表示部50に表示する。
【0081】
これにより、比較する有向グラフ同士の差が視覚的に表示されるため、比較する有向グラフ同士の差を示す情報を付与しない場合に比べて、比較対象の有向グラフ同士の差をユーザが認識し易くなる。また、有向グラフ同士の差が認識しやすくなることにより、認識された差に基づく有向グラフの特徴が認識しやすくなる。
【0082】
なお、本実施の形態では、比較する有向グラフの両者の差(語)を視覚的に他と異ならせて表示しているがこれに限らず、一方の有向グラフのみについて異ならせるようにしてもよい。
【0083】
また、本実施の形態では、視覚的に他と異ならせて表示させる具体的一例として、他の語と色を異ならせたり、各語を囲む図形の線の種類を変えたりしているがこれに限らない。語そのものを異ならせてもよいし、各語を囲む図形を異ならせてもよい。具体的には、語の字体、大きさ、色、等を異ならせてもよいし、各語を囲む図形の形、大きさ、色、線種等を異ならせてもよい。
【0084】
また、本実施の形態では、同時に2つの有向グラフを表示させる場合を例示したがこれに限らず、複数の集合、例えば全部(全体集合、女性集合、及び男性集合)の集合に関する有向グラフを表示させるようにしてもよい。
【0085】
また、本実施の形態では、生成された有向グラフを表示部50に表示させるようにしているがこれに限らず、インターネット等の通信回線を介して他の装置(コンピュータ)等に出力するようにしてもよいし、プリントアウトして出力するようにしてもよい。また、表示部50は、ユーザインターフェイス部43と共用であってもよい。
【0086】
また、本実施の形態では、有向グラフを生成するグラフ生成装置40について説明したがこれに限らず、棒グラフ等その他の種類のグラフを生成するものであってもよくグラフの種類は限定されない。なお、有向グラフでは、生成されたグラフ同士の見かけの形状が大きく異なるため有向グラフを生成する場合に、より効果が高くなる。
【符号の説明】
【0087】
10、40 グラフ生成装置
12、42 制御部
14、44 全データ記憶部
16、46 形態解析部
18、48 グラフ生成部
20、50 表示部
25、55 制御プログラム
43 ユーザインターフェイス部
45 記憶部
49 付与部
60 分類部
62 表示変更情報付与部
64 コメント生成部

【特許請求の範囲】
【請求項1】
集合を構成する複数の文から語の出現頻度を計数し、計数した出現頻度に応じて、語同士の関係を示すグラフを予め定められた規則により生成する生成手段と、
第1の集合を構成する文に含まれる語の出現頻度に応じて前記生成手段で生成された第1のグラフ及び第2の集合を構成する文に含まれる語の出現頻度に応じて前記生成手段で生成された第2のグラフの差を視覚的に表示するための表示情報を、前記第1の集合を構成する文に含まれる語の出現頻度及び前記第2の集合を構成する文に含まれる語の出現頻度に基づいて生成し、生成された前記表示情報を前記第1のグラフ及び前記第2のグラフの少なくとも一方に付与する付与手段と、
前記付与手段により前記表示情報が付与された前記第1のグラフ及び前記第2のグラフの少なくとも一方を出力する出力手段と、
を備えたグラフ生成装置。
【請求項2】
前記第1の集合における出現頻度の順位及び前記第2の集合における出現頻度の順位に基づいて予め定められた規則と、前記表示情報と、の対応関係を記憶する記憶部と、
前記第1の集合における出現頻度の順位と、前記第2の集合における出現頻度の順位と、の違いに基づいて予め定められた規則に従って、語を分類する分類手段と、
を備え、
前記付与手段は、前記対応関係と、前記分類手段の分類と、に基づいて前記表示情報を生成し、生成された前記表示情報を前記第1のグラフ及び前記第2のグラフの少なくとも一方に付与する請求項1に記載のグラフ生成装置。
【請求項3】
前記表示情報は、前記第1のグラフ及び前記第2のグラフの少なくとも一方の語に関する表示を前記分類に応じて他の語に関する表示とは異ならせる情報である、請求項2に記載のグラフ生成装置。
【請求項4】
前記付与手段は、前記第1のグラフ及び前記第2のグラフの差を表す文章を生成する文章生成手段を備え、前記表示情報は、前記生成手段により生成された文章を表示させるための情報である、請求項1から請求項3のいずれか1項に記載のグラフ生成装置。
【請求項5】
前記生成手段が生成する前記グラフは、有向グラフである請求項1から請求項4のいずれか1項に記載のグラフ生成装置。
【請求項6】
前記第2の集合は、前記第1の集合の部分集合である、請求項1から請求項5のいずれか1項に記載のグラフ生成装置。
【請求項7】
前記第1の集合及び前記第2の集合は、第3の集合の部分集合である、請求項1から請求項5のいずれか1項に記載のグラフ生成装置。
【請求項8】
集合を構成する複数の文から語の出現頻度を計数し、計数した出現頻度に応じて、語同士の関係を示すグラフを予め定められた規則によって生成手段により生成するステップと、
第1の集合を構成する文に含まれる語の出現頻度に応じて前記生成手段で生成された第1のグラフ及び第2の集合を構成する文に含まれる語の出現頻度に応じて前記生成手段で生成された第2のグラフの差を視覚的に表示するための表示情報を、前記第1の集合を構成する文に含まれる語の出現頻度及び前記第2の集合を構成する文に含まれる語の出現頻度に基づいて生成し、生成された前記表示情報を前記第1のグラフ及び前記第2のグラフの少なくとも一方に付与手段により付与するステップと、
前記付与手段により前記表示情報が付与された前記第1のグラフ及び前記第2のグラフの少なくとも一方を出力手段により出力するステップと、
を備えた処理をコンピュータに実行させるためのグラフ生成プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22】
image rotate

【図23】
image rotate


【公開番号】特開2011−170615(P2011−170615A)
【公開日】平成23年9月1日(2011.9.1)
【国際特許分類】
【出願番号】特願2010−33721(P2010−33721)
【出願日】平成22年2月18日(2010.2.18)
【出願人】(000005496)富士ゼロックス株式会社 (21,908)
【Fターム(参考)】