説明

表示装置、表示方法およびプログラム

【課題】単語間の関連性を視覚化することを目的とする。
【解決手段】文書管理DBに格納されている文書情報に含まれる単語間の関連性を表示する文書分析サーバによる表示方法であって、文書分析サーバが、文書情報に含まれる単語間の関連度を算出し、算出した関連度に対応した距離に単語を配置した単語間ネットワークを生成し、単語間ネットワークにおいて、関連度の高い単語間を結ぶ線を表示し、関連度の低い単語間を結ぶ線を表示しないことによって、単語間ネットワークから、単語間系統図302を生成し、生成した単語間系統図302を表示部に表示させることを特徴とする。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、表示装置、表示方法およびプログラムの技術に関する。
【背景技術】
【0002】
従来、文書群においてキーワードとなる単語を抽出し、その単語間の関連度を算出し、さらに、その関連度に基づいて抽出した単語を表示画面上に表示することで、単語間の関係を視覚化する技術が提案されている。
例えば、特許文献1では複数の情報アイテムを検索し、この情報アイテムの相互の類似性によって、類似する情報アイテムをノードアレイ内の類似するノードに表示する情報検索装置および方法が開示されている。
さらに、特許文献2では生物学データのような様々なデータ集合を編成および操作して、データ間の傾向、相関およびその他の有用な関係を視覚的に識別を容易にする、複数のデータタイプを同時に視覚表示および操作するための方法、装置が開示されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2008−276768号公報
【特許文献2】特開2004−133903号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、単語間の関連度を視覚化する際、ユーザにとって単語間の関連性が分かりやすいのは、単語をネットワーク構造やツリー構造のノードとして表示することである。また、弱い関連性を示す単語間の関係より、強い関連性を示す単語間の関係を視覚化することが有用であることがしばしばある。
【0005】
この点に関し、特許文献1や、特許文献2に記載の技術では、単語間の関連性によるネットワーク構造や、ツリー構造を表示していない。
【0006】
このような背景に鑑みて本発明がなされたのであり、本発明は、単語間の関連性を視覚化することを目的とする。
【課題を解決するための手段】
【0007】
前記課題を解決するため、本発明は、記憶部に格納されているデータに含まれる単語間の関連性を表示する表示装置であって、前記データに含まれる単語間の関連度を算出する関連度算出部と、前記算出した関連度に対応した距離に単語を配置した単語間ネットワークを生成する単語間ネットワーク生成部と、前記単語間ネットワークにおいて、前記関連度の高い単語間を結ぶ線を表示し、前記関連度の低い単語間を結ぶ線を表示しないことによって、前記単語間ネットワークから、単語間系統図を生成する単語間系統図生成部と、前記生成した単語間系統図を表示部に表示させる表示処理部と、を有することを特徴とする。
その他の解決手段については実施形態中で適宜記載する。
【発明の効果】
【0008】
本発明によれば、単語間の関連性を視覚化することができる。
【図面の簡単な説明】
【0009】
【図1】本実施形態に係る文書分析システムの構成例を示す図である。
【図2】本実施形態に係る文書分析サーバの構成例を示す図である。
【図3】本実施形態に係る単語間系統図の表示例を示す図である。
【図4】本実施形態に係る文書管理DBに格納されている情報の例を示す図である。
【図5】本実施形態に係る文書分析処理の手順を示すフローチャートである。
【図6】本実施形態に係る文書別単語出現数リストの別の例を示す図である。
【図7】本実施形態に係る単語間系統図生成処理の手順を示す図である。
【図8】本実施形態に係る項目間関連度リストの例を示す図である。
【図9】正距離表示による単語間系統図の例を示す図である。
【図10】本実施形態に係る単語間系統図の別の表示例を示す図である(その1)。
【図11】本実施形態に係る単語間系統図の別の表示例を示す図である(その2)。
【図12】本実施形態に係る単語間系統図の別の表示例を示す図である(その3)。
【発明を実施するための形態】
【0010】
次に、本発明を実施するための形態(「実施形態」という)について、適宜図面を参照しながら詳細に説明する。なお、本実施形態において同様の要素については同一の符号を付して説明を省略する。
【0011】
《システム構成》
図1は、本実施形態に係る文書分析システムの構成例を示す図である。
文書分析システム5は、文書分析サーバ1(表示装置)、文書管理DB(Data Base:記憶部)3、文書管理サーバ2、およびクライアント端末4を有してなる。
文書管理DB3は、文書群に関する情報(文書情報401:図4)などを格納している。文書管理サーバ2は、文書管理DB3の文書情報401などを文書管理サーバ2へ送信する機能を有する。文書分析サーバ1は、文書管理サーバ2から送信された情報を基に、文書群に表れるキーワードなどの関連性を分析する機能を有する。クライアント端末4は、文書分析サーバ1から分析結果を取得して、ディスプレイなどに表示する機能を有する。なお、図1に示すように、文書管理サーバ2、文書管理DB3、およびクライアント端末4は複数設置してもよいし、各々1台としてもよい。
【0012】
なお、文書分析サーバ1は、社内LAN(Local Area Network)などにより文書管理サーバ2およびクライアント端末4に接続している。同様に、文書管理サーバ2は、社内LANなどにより文書管理DB3と接続している。
さらに、本実施形態において文書分析サーバ1、文書管理サーバ2、文書管理DB3およびクライアント端末4は異なる装置であるが、これに限らず、これらのうち、少なくとも2台が一体となった装置であってもよい。
【0013】
《装置構成》
図2は、本実施形態に係る文書分析サーバの構成例を示す図である。
文書分析サーバ1は、情報の送受信を行う送受信部30、キーボードやマウスなどの入力部40、ディスプレイなどの表示部50、情報を処理する処理部10、および情報を格納する記憶部20を有してなる。
処理部10は、文書別単語出現数リスト生成処理部11、文書別単語重要度リスト生成処理部12、単語間関連度リスト生成処理部13(関連度算出部)、単語間ネットワーク生成処理部14(単語間ネットワーク生成部)、単語間系統図生成処理部15(単語間系統図生成部)、および表示処理部16を有してなる。
【0014】
文書別単語出現数リスト生成処理部11は、文書に出現するすべての単語の出現数を文書毎にリストとした文書別単語出現数リスト21を生成する処理を行う。
文書別単語重要度リスト生成処理部12は、文書別単語出現数リスト生成処理部11が生成した文書別単語出現数リスト21を基に、文書毎における単語の重要度を算出し、文書別単語重要度リスト22を生成する処理を行う。
単語間関連度リスト生成処理部13は、文書別単語重要度リスト生成処理部12が生成した文書別単語重要度リスト22を基に、単語間の関連度を算出し、単語間関連度リスト23を生成する処理を行う。
【0015】
単語間ネットワーク生成処理部14は、単語間関連度リスト生成処理部13が生成した単語間関連度リスト23を基に、単語間の関連度で重み付けした単語のネットワークである単語間ネットワークを生成する処理を行う。
単語間系統図生成処理部15は、単語間ネットワーク生成処理部14が生成した単語間ネットワークから、関連度の高い単語間を結ぶ線を表示し、関連度の低い単語間を結ぶ線を非表示とした単語間系統図を生成する処理を行う。
表示処理部16は、単語間系統図生成処理部15が生成した単語間系統図を表示情報として、表示部50に表示させたり、送受信部30を介してクライアント端末4に表示させたりする。
なお、各部11〜16の詳細な処理は図5および図7を参照して後記する。また、各部10〜16は、図示しないROM(Read Only Memory)や、図示しないHD(Hard Disk)に格納されたプログラムが、図示しないRAM(Random Access Memory)に展開され、図示しないCPU(Central Processing Unit)によって実行されることによって具現化する。
【0016】
記憶部20には、文書別単語出現数リスト生成処理部11が生成した文書別単語出現数リスト21や、文書別単語重要度リスト生成処理部12が生成した文書別単語重要度リスト22や、単語間関連度リスト生成処理部13が生成した単語間関連度リスト23などが格納されている。各リスト21〜23については、図5などを参照して後記する。
【0017】
《表示例》
図3は、本実施形態に係る単語間系統図の表示例を示す図である。
図3に示す系統図表示画面300は、2つの系統図表示エリア301a,301bと文書一覧表示エリア310を有してなる。
図3に示すように、2つの系統図表示エリア301a,301bには、それぞれ単語間系統図302a,302b(302)が表示されている。単語間系統図302には、文書情報401(図4)からキーワードとして抽出された単語がラベル303の形式で表示され、各ラベル303は線304で結ばれている。各ラベル303間の距離は該当する単語間の関連度に対応している。また、各ラベル303に表示されている円305は、色や、大きさで該当する単語の重要度や、単語に関連する値などを示している。円305については、図10を参照して後記する。なお、ラベル303におけるカッコ内の数字は、単語の出現した文書数を示す。
また、文書一覧表示エリア310には、単語間系統図301に表示されている単語が含まれる文書名の一覧を表示している。
【0018】
《文書管理DB》
図4は、本実施形態に係る文書管理DBに格納されている情報の例を示す図である。
文書管理DB3には、図4(a)に示すような文書情報401が格納されている。文書情報401は、文書の属性に関する情報である文書属性情報402と、文書に記載してある内容を示す記述内容情報403とを有してなる。
、図4(a)に示すように文書属性情報402は文書の表題、文書作成の開始日、文書作成の完了日、作成者が所属する部署、文書の作成者、文書が関連する分野、文書に係るプロジェクトに費やされた金額の規模、文書に関連するプロジェクトの進捗などの情報が格納されている。
記述内容情報403は、図4(a)に示すように文書における各項目(課題、実現方式、計画など)の記述内容が格納されている。なお、図4(a)において、各行は各文書の情報に相当する。
【0019】
さらに、文書管理DB3には、図4(b)に示すような組織情報410や、図4(c)に示すようなスケジュール情報420や、図4(d)に示すような部品情報430を格納してもよい。
図4(b)に示す組織情報410は、本部、部、課、・・・といった会社組織などの階層関係に関する情報が格納されている。図4(c)に示すスケジュール情報420は、どの社員が、どの時間に、どの場所にいたかを示す情報である。図4(d)に示す部品情報430は、親部品、子部品など部品間の階層関係や、子部品の機能など部品に関する情報が格納されている。親部品および子部品の関係とは、例えばモータが親部品とすれば、コイルが子部品となるように、親部品を構成する個々の部品を子部品とする関係である。
また、図4に示す各情報の他にも店舗情報のような情報が文書管理DB3に格納されていてもよい。
【0020】
《文書分析処理》
次に、図1、図2、図4を適宜参照しながら、図5に沿って文書分析処理の流れを説明する。
図5は、本実施形態に係る文書分析処理の手順を示すフローチャートである。
【0021】
(文書別単語出現数リスト生成処理:S101)
まず、クライアント端末4や、入力部40を介して処理部10が文書分析要求を取得すると、文書別単語出現数リスト生成処理部11が文書情報401を基に文書別単語出現数リスト21を生成する(S101)。
具体的には、文書別単語出現数リスト生成処理部11が文書管理サーバ2から文書管理DB3に格納されている文書情報401を取得する。そして、文書別単語出現数リスト生成処理部11は文書情報401の記述内容情報403に対し形態素解析をおこなって単語を抽出すると同時に、単語の出現数をカウントして文書別単語出現数リスト21を生成する。
なお、文書別単語出現数リスト21は、図5に示すような形式の他に図6の文書別単語出現数リスト21aで示すように文書属性情報402と、文書別単語出現数リスト21と同様の構成を有する単語出現数情報404を合わせた形式でもよい。
【0022】
(文書別単語重要度リスト生成処理:S102)
次に、文書別単語重要度リスト生成処理部12が、ステップS101で生成した文書別単語出現数リスト21を基に文書別単語重要度リスト22を生成する(S102)。
具体的には、文書別単語重要度リスト生成処理部12は、例えばtf−idf(Term Frequency-Inverse Document Frequency)法による式(1)から文書毎における各単語の重要度を算出する。
【0023】
重要度=処理対象文書での処理対象単語の出現頻度/処理対象単語の出現文書頻度 ・・・ (1)
【0024】
文書別単語重要度リスト生成処理部12は、式(1)による重要度の算出を各単語、各文書に対して行い文書別単語重要度リスト22を生成する。
なお、tf−idf法に限らず、以下の方法による単語の重要度算出も可能である。
(a)特定の文字列を含む単語の重要度を予め決定しておく。例えば、「技術」を含む単語の重要度を「0.6」とする。
(b)所定の組織が管理する一覧表に含まれる単語の重要度を決定しておく。例えば、組織が保有する「製品一覧表」に記載されている単語である場合には、重要度を「0.8」とする。
【0025】
(単語間関連度リスト生成処理:S103)
そして、単語間関連度リスト生成処理部13は、ステップS102で生成した文書別単語重要度リスト22を基に各単語間の関連度を算出し、単語間関連度リスト23を生成する(S103)。
具体的には、単語間関連度リスト生成処理部13は、例えばベクトル空間法による式(2)から各単語間の関連度を算出する。
【0026】
単語間関連度=(w1・w2)/(|w1|・|w2|) ・・・ (2)
【0027】
ここで、w1、w2は、単語における重要度のベクトル(以下、重要度ベクトル)である。重要度ベクトルは、(文書1における重要度,文書2における重要度,文書3における重要度,・・・)で表される。例えば、図5における文書別単語重要度リスト22を参照すると、アルミニウムの重要度ベクトルは(0.4,0.3,0.4)であり、○○部品の重要度ベクトルは(0,0.6,0.4)である。
そして、(w1・w2)は、2つの単語における重要度ベクトルの内積であり、|w1|、|w2|は各重要度ベクトルのノルムである。つまり、式(2)は2つの単語間における重要度ベクトルのなす角度による余弦の値を示している。
【0028】
単語間関連度リスト生成処理部13は、文書別単語重要度リスト22におけるすべての単語の対に関して式(2)の単語間関連度を算出する。
【0029】
(単語間ネットワーク生成処理:S104)
そして、単語間ネットワーク生成処理部14が、ステップS103で生成した単語間関連度リスト23を基に、各単語間の関連度を重みとしたネットワークである単語間ネットワーク501を生成する(S104)。
具体的には、単語間関連度リスト23における関連度を各単語を示すラベル間の距離に対応させたネットワークを生成する。
【0030】
(単語間系統図生成処理:S105)
次に、単語間系統図生成処理部15が、ステップS104で生成した単語間ネットワーク501から関連度の低い線を非表示とし、関連度の高い線を表示することによって単語間系統図502を生成する(S105)。
【0031】
ステップS105における単語間系統図生成処理の一例を、図2を参照しつつ、図7に沿って説明する。
図7は、本実施形態に係る単語間系統図生成処理の手順を示す図である。なお、図7(a)で単語間系統図生成処理の一例であるフローチャートを示し、図7(b)で単語間系統図の生成例を示す。
まず、単語間系統図生成処理部15は、単語間ネットワーク(ただし、各単語間には線は引かれていない状態)から単語を1つ選択する(S201)。このとき、選択される単語は、単語間ネットワーク中のどの単語を選択してもよい。ここでは、図7(b)における重要度が最も高い単語「A」を選択するが、表示処理部16が、単語間ネットワークを表示部50やクライアント端末4の表示部(不図示)に表示させ、ユーザが入力部40やクライアント端末4の入力部(不図示)を介して任意の単語を選択してもよい。
【0032】
次に、単語間系統図生成処理部15は、ステップS201で選択した単語と関連度が最も高い単語を選択し(S202)、ステップS201で選択した単語と、ステップS202で選択した単語間の線を表示する(S203)。
単語間ネットワークでは、単語間の距離は関連度に従っているので、図7(b)の例において、単語間系統図生成処理部15は単語「A」に最も近い単語「B」が選択され、単語「A」,「B」間の線701が表示される。
【0033】
そして、単語間系統図生成処理部15は、まだ選択されていない単語のうちで、今まで選択した単語群と関連度の最も高い単語を選択し(S204)、選択された単語と、今まで選択した単語群のうちで、ステップS204で選択された単語と最も高い単語との間の線を表示する(S205)。
ここで、今まで選択した単語群とは、図7(b)の例の場合、単語「A」、「B」である。ステップS205において、単語間系統図生成処理部15は、単語「A」、「B」のどちらか一方との距離が最短距離である単語「D」を選択し、線702を表示する。つまり、選択されていない単語「C」、「D」、「E」、「F」、「G」のうち、単語「A]、「B」の少なくとも一方との関連度が、他の選択されていない単語より高い単語「D]を選択する。単語「D」は、単語「A」より単語「B」との関連度が高いので単語「B」、「D」間に線702を表示する。
【0034】
続いて、単語間系統図生成処理部15は、すべての単語が選択済みであるか否かを判定する(S206)。
ステップS206の結果、すべての単語を選択していない場合(S206→No)、単語間系統図生成処理部15は、ステップS204へ処理を戻す。今回における単語群は、単語「A」、「B」、「D」であるので、これらの単語との距離が最短である単語「E」が選択され、線703が表示される。つまり、選択されていない単語「C」、「E」、「F」、「G」のうち、単語「A」、「B」、「D」の少なくとも1つとの関連度が、他の選択されていない単語より高い単語「E」を選択する。単語「E」は、単語「A」、「B」より単語「D」との関連度が高いので単語「D」、「E」間に線703を表示する。
【0035】
これを繰り返すことにより、図7(b)に示すような単語間系統図が生成される。
なお、予め閾値を定めておき、単語間系統図生成処理部15は、ステップS206で、選択されていない単語が存在しても、その単語が、これまでに選択された、どの単語とも関連度が前記した閾値以下である場合、その単語への線を表示しないこととしてもよい。

【0036】
ステップS206の結果、すべての単語を選択済みである場合(S206→Yes)、単語間系統図生成処理部15は文書分析処理を終了する。
なお、本実施形態では、単語間系統図の生成に図7に示す方法を用いたが、これに限らず、予め設定されている閾値以上の関連度を示す単語間の線のみ表示してもよい。なお、単語間系統図の生成方法として、図7に示す方法の他にSplit Decomposition法や、Neighbor Net法を用いることも可能である。
【0037】
ここでは、図4における文書情報401の記述内容情報403に出現する単語の単語間系統図を生成したが、文書属性情報402を用いて単語間系統図を生成することも可能である。
図8は、本実施形態に係る項目間関連度リストの例を示す図である。
図8に示す項目間関連度リスト23aは、図5の単語間関連度リスト23に相当するリストであり、文書別単語出現数リスト生成処理部11が、図4の文書属性情報402における部署、作成者、分野を参照し、文書中に登場する部署名、作者名、分野名をカウントして、文書別単語出現数リスト21を生成する。以下、文書別単語重要度リスト生成処理部12および単語間関連度リスト生成処理部13が図5のステップS102,S103の処理を行うことによって、図8に示す項目間関連度リスト23aを生成する。そして、単語間ネットワーク生成処理部14および単語間系統図生成処理部15がステップS104,S105の処理を行うことによって、図8の項目間関連度リスト23aを基にした単語間系統図を生成することができる。
このように、別の情報を基にして生成された単語間系統図は、図3に示すように一画面内に並べて表示することができる。
【0038】
また、図4に示す組織情報410や、スケジュール情報420や、部品情報430を用いて単語間系統図を生成してもよい。
組織情報410によれば、例えば同じ部や、同じ課に属する人物同士は関連度が高いと評価しうる。スケジュール情報420によれば、例えば、同時間帯に同じ場所にいる人物同士は関連度が高いと評価しうる。部品情報430は、同じ親部品に属する子部品同士は関連度が高いと評価しうる。
【0039】
《表示例》
次に、図9〜図12を参照して本実施形態に関する単語間系統図の例を示す。
図9は、ラベル間の距離、正しく関連度を距離に反映した正距離表示による単語間系統図を示している。図3に示すような通常時の単語間系統図は関連度が小さいものは近く、関連度が大きいものは遠くにラベルを配置しているものの、その距離は関連度を正確に反映していない。ユーザが、クライアント端末4や、入力部40を介して、特定のラベルを指定し、ラベル間の距離を関連度に対応させる正距離表示の指示を与えることにより、表示処理部16は、特定されたラベルからの距離が正確に関連度に対応付ける正距離表示を行う。図9の例では、ユーザがラベル901を指定して、正距離表示を指示したため、ラベル901を中心とした同心円が表示され、さらに、このラベル901からの距離が、ラベル901に表示されている単語の関連度に対応している正距離表示が行われている。
【0040】
図10は、本実施形態に係る単語間系統図の別の表示例を示すものである。
図10(a)では、図6と同様の文書別単語出現数リスト21aを示し、図10(b)では、系統図表示画面を示している。
図10(b)における系統図表示画面1000は、別の情報から生成した単語間系統図を表示する系統図表示エリア1002,1003が並べて表示されている画面例である。
系統図表示画面1000は、文書属性情報表示エリア1001を有しており、図10(b)の例では、図10(a)の文書別単語出現数リスト21aにおいて、単語間系統図に表示されている単語が検出された文書の「表題」に関する情報が表示されている。なお、文書属性情報表示エリア1001は、表題に限らず、作成日や、部署や、作成者に関する情報が表示されてもよい。これらの情報は、図示しない属性情報表示切替ボタンが選択入力されることにより表示されてもよい。
また、系統図表示エリア1002では「技術用語の系統図」として文書別単語出現数リスト21aの単語出現数を基に生成された単語間系統図が表示され、系統図表示エリア1003では「人の系統図」として、文書別単語出現数リスト21aの「作成者」の項目を基に、同一の文書に記載されている文書数が多い人ほど関連度が高いとした単語間系統図が表示されている。
【0041】
ラベルの周囲の円1010,1011は所定の値の大きさを示しており、例えば系統図表示画面1002における円1010や、円1011の大きさは関係規模の値と対応している。ここで、関係規模とは、図10(a)の文書別単語出現数リスト21aにおいて、該当する単語が出現する文書の規模を足し合わせたものである。例えば、アルミニウムの関係規模は、「アルミニウム」という単語が文書別単語出現数リスト21aにおけるすべての文書に登場しているため、10+20+15=45(M¥)である。同様に、「山田太郎」も文書別単語出現数リスト21aにおける文書のすべてに係わっているので、関係規模は10+20+15=45(M¥)となる。なお、図10(b)において、円1010,1011のハッチングの種類は、全重要度の値を示している。全重要度とは、図5に示す文書別単語重要度リスト22の列を足し合わせたものである。例えば、図5の文書別単語重要度リスト22より、「アルミニウム」の全重要度の値は、0.4+0.3+0.4=1.1となる。なお、ハッチングにおいて、異なる角度の斜線のハッチングも異なるハッチングの種類であるものとする。
また、「アルミニウム」と、「加工」は、文書別単語出現数リスト21aにおけるすべての文書に出現しているのに、円1010の大きさが異なっているのは、文書別単語出現数リスト21aにおいて表示されていない文書についても関係規模を算出した結果である。
【0042】
なお、本実施形態では、円1010,1011の大きさや、ハッチングの種類を関係規模や、全重要度に対応させたが、これに限らず、関係規模をハッチングの種類に対応させ、全重要度を円1010,1011の大きさに対応させてもよいし、文書に関連するプロジェクトの進捗度など、単語に関連する他の情報を対応させてもよい。また、本実施形態では、ハッチングの種類の代わりに色で区別してもよい。
【0043】
図11は、本実施形態に係る単語間系統図の別の表示例を示すものである。
系統図表示エリア1002aのように、ユーザがクライアント端末4や、入力部40を介してラベルや線をクリックなどすると、表示処理部16が、クリックされたラベルや線を非表示としてもよい。図11における「×」は、そのラベルや線が非表示となっていることを示す。
【0044】
また、文書分析サーバ1は、図11において、非表示となったラベルに表示されている単語や、線(関連度)を単語間ネットワークから省いて、再度単語間系統図を生成してもよい。この場合、単語間関連度リスト23から、選択入力された単語が関連している行や列を削除したり、選択入力された線に対応する関連度を削除したりした後、単語間ネットワーク生成処理部14が単語間ネットワークを生成してもよいし、単語間ネットワーク生成処理部14が生成した単語間ネットワークから、選択入力された単語や、線を削除した後、単語間系統図生成処理部15が単語間系統図を生成してもよい。
【0045】
ユーザがクライアント端末4や、入力部40を介して、文書分析サーバ1に指示を与えることにより、表示処理部16は系統図表示エリア1003aのように指示を与えられたラベルを中央に系統図表示エリア1003aの中央に配置し、そのラベルを中心とした同心円を表示させてもよい。これにより、ユーザが中心に配置したラベルとその他のラベルとの距離を確認することができる。指示は、例えば右クリックによって表示されるメニューから選択するなどして行われる。
【0046】
また、ラベルをダブルクリックなどすると、他の系統図表示エリアに表示されているラベルのうち、ダブルクリックしたラベルと関連度の高いラベルが強調表示されてもよい。図11の例では、「アルミニウム」のラベルをダブルクリックすることによって、系統図表示エリア1003aにおいて「アルミニウム」と関連性が高い「山田太郎」のラベルが強調表示されている。「アルミニウム」と「山田太郎」との関連性は、例えば「山田太郎」が作成者である文書に「アルミニウム」がどれだけの頻度で出現するか、などで定義できる。
【0047】
図12は、本実施形態係る単語間系統図の別の表示例を示す図である。
図12(a)における系統図表示エリア1201に表示されている単語間系統図は、図10における系統図表示エリア1002,1003に表示されている単語間系統図を統合して表示したものである。系統図表示エリア1002,1003にそれぞれ表示されていたラベル間で関連度の高いラベルは破線で結ばれている。「山田太郎」、「佐藤花子」、「鈴木一郎」などの人に関する単語と、「アルミニウム」、「○○部品」、「加工」など技術に関する単語との関連度は、前記したように、例えば「山田太郎」が作成者である文書に「アルミニウム」がどれだけの頻度で出現するか、などで定義できる。
【0048】
また、図12(b)示す系統図表示エリア1210のように、単語間系統図と時間軸とを統合して表示することも可能である。
図12(b)では、図10の系統図表示エリア1003に表示されている単語間系統図におけるラベルの長さが、その人物が会社または部署に在職していた期間に対応した長さとなって表示されている。これらは、記憶部20に人物が会社や、部署にいた期間を示す情報を予め格納しておくことによって実現できる。つまり、記憶部20に単語が示す内容が関連する時間を記憶しておき、表示処理部16が、ラベルの長さをラベル内の単語が示す内容が関連する時間に比例した長さとして表示してもよい。
【符号の説明】
【0049】
1 文書分析サーバ(表示装置)
2 文書管理サーバ
3 文書管理DB(記憶部)
4 クライアント端末
5 文書分析システム
10 処理部
11 文書別単語出現数リスト生成処理部
12 文書別単語重要度リスト生成処理部
13 単語間関連度リスト生成処理部(関連度算出部)
14 単語間ネットワーク生成処理部(単語間ネットワーク生成部)
15 単語間系統図生成処理部(単語間系統図生成部)
16 表示処理部
20 記憶部
21 文書別単語出現数リスト
22 文書別単語重要度リスト
23 単語間関連度リスト
30 送受信部
20 入力部
40 表示部



【特許請求の範囲】
【請求項1】
記憶部に格納されているデータに含まれる単語間の関連性を表示する表示装置であって、
前記データに含まれる単語間の関連度を算出する関連度算出部と、
前記算出した関連度に対応した距離に単語を配置した単語間ネットワークを生成する単語間ネットワーク生成部と、
前記単語間ネットワークにおいて、前記関連度の高い単語間を結ぶ線を表示し、前記関連度の低い単語間を結ぶ線を表示しないことによって、前記単語間ネットワークから、単語間系統図を生成する単語間系統図生成部と、
前記生成した単語間系統図を表示部に表示させる表示処理部と、
を有することを特徴とする表示装置。
【請求項2】
前記データは、1以上の文書データである
ことを特徴とする請求項1に記載の表示装置。
【請求項3】
前記単語間系統図生成部は、
前記単語間ネットワークから、任意の単語である第1の単語を選択し、
前記選択した単語との関連度が最も高い単語である第2の単語を選択し、
選択されていない単語のうち、前記第1の単語および前記第2の単語の少なくとも一方との関連度が、他の選択されていない単語より高い単語を第3の単語として選択し、
選択されていない単語のうち、前記第1の単語、前記第2の単語および前記第3の単語の少なくとも1つとの関連度が、他の選択されていない単語より高い単語を第4の単語として選択することを繰り返すことにより、前記単語間系統図を生成する
ことを特徴とする請求項1に記載の表示装置。
【請求項4】
前記関連度に対応した距離とは、前記関連度に比例する距離である
ことを特徴とする請求項1に記載の表示装置。
【請求項5】
前記表示処理部は、
前記単語の外側に円を表示し、
前記円を、該当する前記単語に関連する値で強調表示する
ことを特徴とする請求項1に記載の表示装置。
【請求項6】
前記表示処理部は、
入力部を介して選択入力されたラベルを表示画面の中央に表示させる
ことを特徴とする請求項1に記載の表示装置
【請求項7】
前記表示処理部は、
異なる前記データから得られた複数の前記単語間系統図を、1つの表示画面内に表示させる
ことを特徴とする請求項1に記載の表示装置。
【請求項8】
前記表示処理部は、
異なる前記データから得られた複数の前記単語間系統図を、1つの単語間系統図にまとめて表示する
ことを特徴とする請求項1に記載の表示装置
【請求項9】
前記単語で示す内容が関連している時間に関する情報が前記記憶部に記憶されており、
前記表示処理部は、
当該単語をラベル内に表示し、
当該ラベルの長さを、前記ラベル内に表示されている単語で示す内容が関連している時間に比例した長さとする
ことを特徴とする請求項1に記載の表示装置。
【請求項10】
前記表示処理部は、
表示部に表示されている単語および線が、入力部を介して選択入力されると、当該単語および線を非表示とする
ことを特徴とする請求項1に記載の表示装置。
【請求項11】
前記単語間系統図生成部は、前記選択入力された単語および線を前記単語間ネットワークから削除して、再度単語間系統図を生成する
ことを特徴とする請求項10に記載の表示装置。
【請求項12】
記憶部に格納されているデータに含まれる単語間の関連性を表示する表示装置による表示方法であって、
前記表示装置が、
前記データに含まれる単語間の関連度を算出し、
前記算出した関連度に対応した距離に単語を配置した単語間ネットワークを生成し、
前記単語間ネットワークにおいて、前記関連度の高い単語間を結ぶ線を表示し、前記関連度の低い単語間を結ぶ線を表示しないことによって、前記単語間ネットワークから、単語間系統図を生成し、
前記生成した単語間系統図を表示部に表示させる
ことを特徴とする表示方法。
【請求項13】
前記データは、1以上の文書データである
ことを特徴とする請求項12に記載の表示方法。
【請求項14】
前記表示装置が、
前記単語間ネットワークから、任意の単語である第1の単語を選択し、
前記選択した単語との関連度が最も高い単語である第2の単語を選択し、
選択されていない単語のうち、前記第1の単語および前記第2の単語の少なくとも一方との関連度が、他の選択されていない単語より高い単語を第3の単語として選択し、
選択されていない単語のうち、前記第1の単語、前記第2の単語および前記第3の単語の少なくとも1つとの関連度が、他の選択されていない単語より高い単語を第4の単語として選択することを繰り返すことにより、前記単語間系統図を生成する
ことを特徴とする請求項12に記載の表示方法。
【請求項15】
前記関連度に対応した距離とは、前記関連度に比例する距離である
ことを特徴とする請求項12に記載の表示方法。
【請求項16】
前記表示装置が、
前記単語の外側に円を表示し、
前記円を、該当する前記単語に関連する値で強調表示する
ことを特徴とする請求項12に記載の表示方法。
【請求項17】
前記表示装置が、
入力部を介して選択入力されたラベルを表示画面の中央に表示させる
ことを特徴とする請求項12に記載の表示方法。
【請求項18】
前記表示装置が、
異なる前記データから得られた複数の前記単語間系統図を、1つの表示画面内に表示させる
ことを特徴とする請求項12に記載の表示方法。
【請求項19】
前記表示装置が、
異なる前記データから得られた複数の前記単語間系統図を、1つの単語間系統図にまとめて表示する
ことを特徴とする請求項12に記載の表示方法。
【請求項20】
前記単語で示す内容が関連している時間に関する情報が前記記憶部に記憶されており、
前記表装置が、
当該単語をラベル内に表示し、
当該ラベルの長さを、前記ラベル内に表示されている単語で示す内容が関連している時間に比例した長さとする
ことを特徴とする請求項12に記載の表示方法。
【請求項21】
前記表示装置が、
表示部に表示されている単語および線が、入力部を介して選択入力されると、当該単語および線を非表示とする
ことを特徴とする請求項12に記載の表示方法。
【請求項22】
前記表示装置が、
前記選択入力された単語および線を前記単語間ネットワークから削除して、再度単語間系統図を生成する
ことを特徴とする請求項12に記載の表示方法。
【請求項23】
請求項12から請求項22のいずれか一項に記載の表示方法をコンピュータに実行させることを特徴とするプログラム。


【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate