説明

意思決定支援システム

【課題】データマイニング手法で、必要な情報を利用しやすい形態で提供し、ユーザの意思決定を支援する。
【解決手段】記憶装置のデータベースに辞書群及びシナリオ定義群を登録する条件設定処理手段と、データベースに登録された辞書群及びシナリオ定義群を参照しながら、データマイニングの手法に基づいてネットワーク上に存在する情報を検索し、分析し,抽出する検索・分析・抽出処理手段と、検索・分析・抽出処理手段により出力された抽出情報の有用性を判断する判断処理手段と、有用と判断した抽出情報の検索、分析、抽出に用いた辞書群及びシナリオ定義群を整備し、記憶装置のデータベースに登録して再利用可能とした辞書・シナリオDB成長生成処理手段と、有用と判断した抽出情報を、表示装置または出力装置により任意のフォーマットで出力する報告書作成処理手段とを備える意思決定支援システム。

【発明の詳細な説明】
【技術分野】
【0001】
この発明は、さまざまな評価テーマ(課題)に対してユーザが意思決定するために、在野のデータベース等からデータマイニングの手法によって文書情報等を検索、分析、抽出し、その結果により意思決定を行うことを支援するシステムに関するもので、例えば行政機関や民間企業等において、将来有望な事業の選定等に役立つ情報を提供しようとするものである。
【背景技術】
【0002】
ユーザがある評価テーマについて合理的な意思決定をするためには、種々の観点から多くの情報を収集し、検討して、これらを総合的に考慮した上で判断することが重要である。このため、例えば、近年のインターネットの急速な発達に伴い、インターネットを利用して所望の情報を得るために、多種多様の「検索エンジン」が提供され、利用されている。この種の「検索エンジン」は通常、ユーザが1乃至複数のキーワードを入力して検索することで、そのキーワードを含むWebサイトや文書情報等を所定の順番で列挙するものである。この列挙の順番は、各「検索エンジン」で定められている一定のルールに従って決定されるもので、ユーザが真に欲しい情報が、最初に表示される性格のものではない。従って、ユーザは列挙されたそれぞれの情報を見て、個々に有用かどうかの判断をしなければならない。
【0003】
そこで、近年では、特定のデータベースから意思決定に役立つ有用な情報を得るため、いわゆるデータマイニングの手法が採用されている。例えば、特許文献1に記載のものは、データ解析方法に関するものであって、不良要因等の抽出のため、データ分布特徴量を目的変数として回帰木分析等のデータマイニングを行うことが開示されている。そして、より詳しくは、半導体データの歩留まりの解析に関するものである。
【0004】
また、特許文献2に記載のものは、政策データマイニング装置等に関するもので、多くの属性からなる事例を蓄積したデータベースを用いて、意思決定者に有益な知識を発見するためのデータマイニング技術が開示されている。
【0005】
また、特許文献3に記載のものは、意思決定支援システム等に関するものであって、テキストマイニング手法を有効活用し、所与のテーマに関連する多くの世人の意見に基づいての複数の論点を参照することにより、合理的且つ妥当性のある決定支援のための判断情報を提供するものである。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2003−142361号公報
【特許文献2】特開2006−139469号公報
【特許文献3】特開2007−241901号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、これらの意思決定手法は、固有のテーマに特化して構築されたものであり、汎用性が低いものであった。即ち、当初のテーマが固定的であり、そのテーマの評価に適するデータベース等を検索して、一定の情報を得るものであり、様々なテーマに関して汎用的に利用されるものではなかった。また、その操作性も、一般的なユーザには難しく、高度の熟練を有するマイニングの専門家が利用するものであった。
【0008】
本発明は、汎用型のマイニングエンジンにより、ユーザが利用しやすいマンマシンインターフェースを実現するとともに、最終的に真に必要な各種情報を、特に熟練を要することなく何人でも得ることができるように、利用しやすい形態で提供し、ユーザの意思決定を支援するシステムを提供しようとするものである。
【課題を解決するための手段】
【0009】
上述した課題を解決するため、本発明は、意思決定支援システムとして、
記憶装置に設けるデータベースに入力装置を介して辞書群及びシナリオ定義群を登録する条件設定処理手段と、
前記データベースに登録された辞書群及びシナリオ定義群を参照しながら、中央処理装置によりデータマイニングの手法に基づいてネットワーク上に存在する情報を検索し、分析し,抽出する検索・分析・抽出処理手段と、
前記検索・分析・抽出処理手段により出力された抽出情報の有用性を判断する判断処理手段と、
有用と判断した抽出情報の検索、分析、抽出に用いた辞書群及びシナリオ定義群を整備し、前記記憶装置のデータベースに登録して再利用可能として、辞書群及びシナリオ定義群を自己成長させるようにした辞書・シナリオDB成長生成処理手段と、
前記有用と判断した抽出情報を、表示装置または出力装置により任意のフォーマットで出力する報告書作成処理手段と、
を備えるものとした。
【0010】
ここで、上記データベースに登録される辞書群とは、具体的には、検索辞書、分析辞書、抽出辞書からなるもので、それぞれの辞書は、与えられた評価テーマに基づいて任意に設定した評価項目ごとに作成し、評価項目を制御するために参照する評価項目に関する用語群からなり、カテゴリでグループ化及び階層化され、管理されたデータ構造を有するものである。
【0011】
さらに、上記各辞書は、評価項目ごとの着目用語群をレイア定義部とカテゴリ定義部に分類した構造で、レイア定義部を行項目、カテゴリ定義部を列項目とした二次元配列構造を採用し、レイア定義部には評価レベルが同等の用語群を定義し、カテゴリ定義部には類似性、共通性が高い用語群をグループ化しながら階層構造で分類した用語群を定義する。
【0012】
また、上記データベースに登録されるシナリオ定義群とは、具体的には、検索シナリオ定義、分析シナリオ定義、抽出シナリオ定義からなるもので、上記辞書群に登録された評価項目ごとの用語群とそれらを論理演算で評価する方法を定義したデータ構造を有し、データマイニングの手法により所定の論理式で構築するものである。
【0013】
そして、上記シナリオ定義群は、ブール論理による論理的算法の体系を用いて論理演算式を構築したものとした。
【0014】
また、データベースには、さらに、評価項目ごとに重要度をランク設定した評価項目重み付け定義を登録してあるものとした。
【0015】
一方、上記検索・分析・抽出処理手段は、上記辞書群及びシナリオ定義群を参照しながら、公知または独自の検索エンジンを用いてネットワーク上に存在する情報を検索し,分析し,抽出するものであり、シナリオ定義で構築した論理式に従ってデータマイニング手法に基づいて段階的に繰り返し行う。
【0016】
また、上記判断処理手段は、上記検索・分析・抽出処理手段で抽出した情報を結果表示処理手段により視覚的に出力した評価項目ごとの抽出情報をオペレータが確認し、その有用性を判断するものとした。
【0017】
また、上記辞書・シナリオDB成長生成処理手段は、上記判断処理手段で有用とした抽出情報を抽出する際に用いた辞書群及びシナリオ定義群を整備し、標準的な辞書群及びシナリオ定義群としてデータベースに登録して再利用可能とするとともに、辞書群及びシナリオ定義群を自己成長させるものとした。
【0018】
また、上記報告書作成処理手段は、上記判断処理手段で有用とした抽出情報を、評価項目ごとに理解しやすい形式で出力するものであり、マトリクス表、レーダーチャートなどの数値化及びビジュアル化した二次元表示、あるいは立体的な三次元表示のフォーマット等、任意の態様で表示するものとした。
【0019】
そして、上記ネットワークは、ワールドワイドウエブ(WWW)システム、及び、ネットワークに接続される各種ローカルパスであるものとした。
【発明の効果】
【0020】
上述した本発明に係る意思決定支援システムは、ユーザが、評価テーマに関して任意に評価項目と、それに関連する用語の辞書群やシナリオ定義群を設定し、これを参照して、データマイニングの手法に基づいてネットワーク上に存在する情報を検索し、分析し,抽出するようにし、その結果を利用しやすい任意のフォーマットで出力するようにしたものであるから、評価テーマに適応した客観的な評価結果を得ることが可能となり、ユーザの意思決定に有効な資料を提供できるものである。
【0021】
また、辞書群やシナリオ定義群は再利用可能であるとともに、適宜自己成長するようにしているので、熟練を要することなく熟練者と同じ手法でデータマイニングを可能とし、支援情報の取得が容易である。
【0022】
また、辞書群やシナリオ定義群は、ユーザが評価テーマに応じて任意に設定可能であるから、種々の課題に対して柔軟に対応できるものであり、汎用性の高いシステムを構築することができた。そのため、行政機関や民間企業等、広範囲での活用が見込まれるほか、一般個人の情報抽出手段としても幅広い利用が可能な優れた発明である。
【図面の簡単な説明】
【0023】
【図1】本発明に係る意思決定支援システムの概要を示す流れ図である。
【図2】本発明に係る意思決定支援システムをより詳細に示す流れ図である。
【図3】本発明システムを実施するためのハードウェアの機器構成を示すものである。
【図4】シナリオ定義を作成する手順を示す概念図である。
【図5】辞書の基本構造の例を示すものである。
【図6】検索辞書の具体例である。
【図7】分析辞書の具体例である。
【図8】シナリオ定義の具体例を示す概念図である。
【図9】検索処理の論理式を図示したものである。
【図10】分析処理において、その対象文書の評価項目にコスト付けしたマップの例を示すものである。
【図11】コスト付けした評価項目の重要度を判定する例を示すものである。
【図12】図10の評価項目のマップのコスト表示を変更した状態を示すものである。
【図13】評価項目のマップの判定着目評価項目を選択した状態を示すものである。
【発明を実施するための形態】
【0024】
以下、本発明に係る意思決定支援システムの好ましい実施形態を添付した図面に従って説明する。図3において、1は中央処理装置、2は入力装置、3は記憶装置、4は表示装置、5は出力装置、6はネットワークである。これらの装置は、適宜なインターフェースによって相互に接続されている。
【0025】
本発明に係る意思決定支援システムは、上記ハードウェア資産を使用し、図1及び図2に示す手段及び手順に従って実現される。
【0026】
図1において、11は条件設定処理手段、12は検索・分析・抽出処理手段、13は判断処理手段、14は辞書・シナリオDB成長生成処理手段、15は報告書作成処理手段である。さらに、図2において、16はブール演算処理手段、17は結果表示処理手段である。以下、それぞれの手段の機能について説明する。
【0027】
先ず、条件設定処理手段11について説明する。ユーザには所定の評価テーマ(課題)が与えられるが、ユーザは、この与えられた評価テーマに対して複数の評価項目を設定する。この評価項目は、評価の判断基準となるような性質の項目であり、ユーザが評価テーマに応じて任意に設定可能である。また、評価テーマによっては、予め設定され、上記記憶装置3のデータベース3aに登録されている評価項目を適宜選択して設定することも可能である。
【0028】
例えば、評価テーマとして、ある事業の有望性について判断する場合には、a)先進性(希少性)、b)代替性、c)類似性、d)市場競合性(有望性)などを評価項目として設定することができる。ここで、先進性とは、何らかの優位性を持つことをいい、希少性とは、類似事項が極めて少ない場合をいう。また、代替性とは、機能的置換に関する可能性の有無の分布(位置付け)をいう。類似性とは、同等性が多数存在する場合をいう。さらに、市場競合性(有望性)とは、対象とする項目に対して、代替性と併せて市場に存在する製品との置換可能性の参考意見の提示(マーケティングの視点)をいう。ただし、これらの評価項目は例示であり、上述したように、個々の評価テーマに応じて、ユーザが適当と思われる評価項目を任意に設定する。
【0029】
次に、ユーザは設定した評価項目ごとに検索辞書11a、分析辞書11b、抽出辞書11cを作成する。ここで辞書とは、評価項目を制御するために参照する、評価項目に関する用語群からなり、それぞれがカテゴリでグループ化及び階層化され、管理されたデータ構造を有するものとする。具体的には、ユーザが、下述する検索・分析・抽出手段12で参照する検索範囲、分析項目、抽出条件等を特定するための用語群を決定し、これら一連の処理に使用する用語群を辞書形式で構築したもので、適宜なインターフェースにより、入力装置2を介して、記憶装置3に形成される所定のデータベース3aに登録する。
【0030】
なお、この辞書群11a、11b、11cは、ユーザが直接、追記及び削除して利用するほか、下述する一連の処理の途中で、辞書・シナリオDB成長生成処理手段14を通じて用語が追加される自己成長機能を有する。このように自己成長した辞書は、標準的なものとして再利用される。
【0031】
また、この条件設定処理手段11では、ユーザは、これらの用語群の参照の手順及び組合せをシナリオとして定義する。ここでシナリオとは、下述する検索、分析、抽出処理に用いる前記辞書群に登録された評価項目の用語群とそれらの評価方法(論理演算)を定義したデータ構造を有するものとする。具体的にはデータマイニングの手法により組み立てた論理演算式である。本実施形態ではブール論理による論理的算法の体系を用いることを予定しており、ブール論理に基づき、所望の論理演算式を構築する。但し、特にこれに限定するものではなく、種々の論理手段を採用できる。
【0032】
このシナリオも、ユーザが、上記辞書群11a、11b、11cに対応して、検索シナリオ定義11d、分析シナリオ定義11e、抽出シナリオ定義11fを設定し、入力装置2を介して、記憶装置3に形成される所定のデータベース3aに登録する。
【0033】
なお、このシナリオ定義群11d、11e、11fは、ユーザが直接定義するほか、予め前記データベース3aに登録されたものを利用することができ、さらに、下述する一連の処理の途中で、辞書・シナリオDB成長生成処理手段14を通じて既にマイニングに成功したシナリオ定義を再利用可能に登録することもあり、標準的なシナリオとして利用される。
【0034】
さらに、上記条件設定処理手段11では、評価項目ごとに重要度をランク設定し、評価項目重み付け定義を行う。この評価項目重み付け定義も、ユーザが、入力装置2を介して、記憶装置3に形成される所定のデータベース3aに登録する。
【0035】
次に、検索・分析・抽出処理手段12について説明する。上記条件設定処理手段11により、データベース3aには、辞書群、シナリオ群、評価項目重み付け定義等が登録されているので、ここでは、これらを参照し、中央処理装置1によりデータマイニング手法に基づいて、検索処理、分析処理、抽出処理を行う。
【0036】
即ち、検索処理では、検索辞書11a、検索シナリオ定義11dを参照して、接続されたネットワーク6上の各種文書情報等を検索する作業を行う。検索辞書11aはグループ化、階層化されているので、検索を繰り返しながら検索範囲を次第に絞り込んで必要と思われる情報を検索する。例えば、検索シナリオ定義11dに従って作成したブール論理の演算式を用い、ブール演算処理手段16により検索を実行する。
【0037】
分析処理では、分析辞書11b、分析シナリオ定義11eを参照して、検索処理で検索した結果得られた情報をさらに分析する作業を行う。例えば、辞書に定義されているキーワードやその関連語が情報内でどのように使用されているかについて分析し、その前後関係、使用頻度などから、その情報の重要度等を判断、分析する。この分析処理でも、ブール論理を用いて繰り返し演算実行する。この分析情報の重要度の具体的判定方法については、後述する。
【0038】
抽出処理では、抽出辞書11c、抽出シナリオ定義11fを参照しながら、上記検索、分析した情報の中から、真に必要な情報を抽出する作業を行う。
【0039】
これら検索・分析・抽出の作業は、従来からある公知の検索エンジンや独自に構築した高精度の検索エンジン等を用い、評価項目重み付け定義等も参照して行う。また、段階的に検索範囲、分析範囲、抽出範囲を定義し、それらの作業を繰り返し行うことで、情報を絞り込む作業を行う。このとき、各シナリオ定義をブール論理に従って構築した論理式を用いるので、精度の高い、いわば熟練者の手法に似たデータマイニングを行うことが可能であり、最終的に抽出した情報は、当初の評価テーマに的確に対応した情報となり、それを使用した意思決定に有効な資料とすることができる。
【0040】
なお、ネットワーク6におけるサーチ対象としては、インターネットに代表されるWWW(ワールドワイドウエブ)や、各種研究機関等が独自に備えるローカルパスでネットワークに接続されたものなど、極めて広範囲に存在する各種情報を対象とし、それらが有する利用可能な限りの文書情報、書籍情報、論文情報等から検索する。また、その言語領域としては、利用可能情報の多い英語圏と日本語圏とをそれぞれ対象として、評価テーマに応じて適宜選択する。
【0041】
次に、判断処理手段13について説明する。この判断処理手段13は、例えば、上記検索・分析・抽出処理手段12で抽出した情報を結果表示処理手段17により視覚的に出力した評価項目毎の抽出情報を、オペレータが確認し、その情報で満足できるかを判断する作業を行う。この抽出情報の具体的な処理については、後述する。
【0042】
この判断処理手段13で、オペレータが満足できると判断した場合は、次段の辞書・シナリオDB成長生成処理手段14に移行する。一方、満足できないと判断した場合は、条件設定処理手段11に戻り、各辞書群やシナリオ定義群の見直し及び修正を行い、再度検索・分析・抽出処理を行うことになる。
【0043】
次に、辞書・シナリオDB成長生成処理手段14について説明する。上記判断処理手段13で、オペレータが満足できると判断した場合、その作業に用いた辞書群やシナリオ定義群は、データマイニングや評価の手段として有効であると考えることができる。そこで、これらの辞書群やシナリオ定義群は、この辞書・シナリオDB成長生成処理手段14で整備され、標準的な辞書やシナリオ定義としてデータベース3aに登録し、再利用可能とするとともに、辞書群やシナリオ定義群を自己成長させるようにしている。この作業により、本意思決定支援システムは、同一又は類似の評価テーマに柔軟に対応できるから、より汎用性が高くなり、さまざまな評価テーマに対して広く適用できるようになる。そして、これにより、条件設定処理手段11における辞書群やシナリオ定義群の作成の手間が軽減され、特別の熟練を有さない一般的なユーザであっても、本意思決定支援システムを有効に活用できるようになる。
【0044】
次に、報告書作成処理手段15について説明する。上記判断処理手段13で、オペレータが満足できると判断した抽出情報は、表示装置4または出力装置5により評価項目ごとにユーザに理解しやすい形式で出力される。即ち、当初に任意設定した評価項目とその重み付けによる評価基準に基づいて、数値的に格付けされた客観情報が提供される。この報告書作成処理手段15により出力されるものとしては、例えば、マトリクス表やレーダーチャートなどの数値化表現、ビジュアル表現したものを印字したものや、ディスプレイ上に3Dで立体的に表示したものなど、オペレータがその内容を判断しやすいようにしたものが好ましい。ただし、これらに限定されず、評価テーマに応じて、任意の出力フォーマットが適宜選択可能である。
【0045】
このように最終的に報告書として出力された抽出情報は、当初に設定した評価テーマに対する評価項目ごとに、最適な情報が数値化、ビジュアル化されているので、ユーザはその報告書をもとに、評価テーマに対する客観的な判断が可能であり、その意思を決定するための有効な支援資料となる。
【0046】
続いて、上述した意思決定支援システムについて、その具体的実施例の一部を提示して説明する。ここでは、例題の評価テーマとして、「今後の自動車におけるCO2削減の有望性(CO2量、電力、コスト(製造、運用))の調査」という評価テーマが与えられたものとして説明する。
【0047】
この評価テーマで有望性を評価する検索、分析、抽出のシナリオ定義を決定する場合、例えば、図4に示すような手順が想定される。即ち、先ず、検索の分野を定義する用語を決定する。ここでは、「自動車」とする。次に分析のための用語の組み合わせや関係を決定する。ここでは、「CO2、削減」のグループと、「モーター、エンジン」のグループとする。さらに抽出するための用語条件を決定する。ここでは「市場競合性(有望性)」とする。
【0048】
この手順をもとに、具体的に検索辞書、分析辞書、抽出辞書に登録する用語を決定することになる。ここで、先に、各辞書の基本的な構造について説明する。なお、辞書の基本構造は、それぞれの辞書で共通する構造を有している。図5は、辞書の基本構造の例を示すもので、評価項目ごとに着目用語群を「レイア定義部」と「カテゴリ定義部」に分類して管理する構造である。即ち、「レイア定義部」を行項目とし、「カテゴリ定義部」を列項目とした二次元配列構造を採用する。「レイア定義部」には、評価レベルが同等の用語群を定義する。一方「カテゴリ定義部」には、類似性、共通性が高い用語群をグループ化しながら階層構造(例えば、図5の評価項目4)で分類された用語群を定義する。
【0049】
次に検索辞書と分析辞書について、その具体例を説明する。図6は、検索辞書の具体例である。即ち、例題の評価テーマから、WWW検索における次の論理を成立する評価項目で辞書を作成する。

S1 :自動車
S2 :CO2 ∩ 削減
S41 :モーター ∩ エンジン
【0050】
図7は、分析辞書の具体例である。即ち、例題の評価テーマで検索から得られた文書群(情報)を分析及び抽出する次の論理を成立する評価項目で辞書を作成する。

<レイア定義部>
評価項目3 :S3 :電力 ∩ コスト
評価項目4 :S41:モーター ∪ エンジン
<カテゴリ定義部>
評価項目4:
グループ1:K1〜K5:
モーター ∩ 電池
太陽 ∪ 燃料 ∪ Liイオン ∪ Neイオン ∪ バイオ
グループ2:K6〜K7:
エンジン ∩ 燃料
水素 ∪ エタノール
【0051】
次に、シナリオ定義の具体例について説明する。評価のシナリオ定義は、検索、分析、抽出ともに、図8に示すように、step−1からstep−nまでの評価項目の用語群の組み合わせから必要なものを選択して評価の条件を決定する。そして、この選択された組み合わせの論理演算式を作成し、これをシナリオ定義とする。例えば、検索処理の場合、先に図6に示した辞書を用いて以下の論理式が成立する。

Rn={S1} ∩ {S2} ∩ {S41}
但し、S1 :自動車
S2 :CO2 ∩ 削減
S41 :モーター ∩ エンジン

これを図示すると、図9のようになる。即ち、図の斜線部分が検索結果となる。
【0052】
以下、分析処理、抽出処理は、この検索結果を対象にして、順次同様の手順で、それぞれ作成した辞書に従って論理式を作成して、絞り込みを行うことになる。このようにして、最終的に設定した評価テーマに関する意思決定に必要な情報が抽出されることになり、意思決定の助けとなる。
【0053】
続いて、上述した本願発明の意思決定支援システムにおいて比較的重要な地位を占める処理について説明する。先ず、検索・分析・抽出処理手段12の分析処理において、分析情報の重要度の判定方法について、図10から図12に従って具体例を説明する。前段の検索処理で検索した結果得られた文書群をEnとし、個々の文書ei中の全ての文を対象に、判定処理の重要度をコストとして作成する。即ち、検索された分析対象の文書群Enにおいて、個々の文書eiの中に評価項目Snが存在する場合、文書eiの評価項目Snにコスト(例えば”1”)付けを行う。図10では、評価項目、S1/k1,S2/k1,S2/k2,S41/k1,S42/k1,S43/k3を含む文書e1の評価項目Snにコスト付けをしたマップの例を示している。
【0054】
次に、コスト付けした評価項目Snに対して、更に、重要度のコスト付けを行う。即ち、文書eiに含まれるすべての文に対して、1文内に同時に出現する関係にあるSnの集合Anに対して重要度のコストPsを定義する。図11にはSnとAnの包含関係を示している。なお、Psは次式で決定する。

Ps=[評価項目Snの持つコスト]×N (N:正の整数値)

ここで、重み付けNの決定は、任意な評価項目のカテゴリの優先度で決定する。
【0055】
一例として、下記の文章に含まれているSnの組み合わせに含まれる個数で重要度Psを判定する場合の例を図11で説明する。

自動車モーターLiイオン 電池が 着目されている。」
S1 S41/k1 S43/k3 S42/k1

ここで、Anを構成するSnの個数(2個以上)の最大値をAn−maxとすると、Anの組み合わせに包含される組み合わせ(下記An1,An2等)を持つSnに重み付け(Sn個数/An−maxを補整した値)を施す。図11では、AnのSnの個数4がAn−maxなので、重み付けNの値を4に決定する。
【0056】
これらを例示すると以下のようになる。

Snの組み合わせ Sn個数/An−max Ps
An1=[S1,S41/k1,S43/k3,S42/k1] 4/4 4

An2=[S41/k1,S42/k1] 2/4 2
An3=[S1,S41/k1] 2/4 2
【0057】
また、図12は、N=4を決定したときのSnマップのコスト表示を変更した状態を示している。
【0058】
このように、評価項目Snの出現コスト、1文書内に同時に出現する関係にあるSnの集合Anに付加される重要度Psコストを分析対象文書のすべてに対してSnマップに反映して評価判断基準情報として生成する。そして、このSnマップにより、分析・抽出処理手段12の分析処理において、分析情報の重要度の判定を行う。
【0059】
次に、判断処理手段13において、上記検索・分析・抽出処理手段12で抽出した情報を結果表示処理手段17により視覚的に出力する評価項目毎の抽出情報の処理について説明する。即ち、複雑なシナリオで抽出された文書群のシナリオ要素をユーザが理解及び評価容易な視覚重視の評価情報として生成する。図13には、分析対象文書eiの判定処理の判定コストである重要度Psについて、さらに必要に応じて重みを反映したSnマップを作成し、判定着目評価項目を選択した状態を示している。この図13(a)において、レイア階層(行)は[S1,S41,S42,S43]、カテゴリ定義(列)は[k1,k3]とした場合を示している。そして、このPsから着目したセルに関係する文書群eiの関係をマップ化(グラフ化)した状態を同図(b)に示している。このように着目セルだけのマップを作成することで、視覚を重視した利用しやすい評価情報として提供できる。
【0060】
以上説明したように、本発明に係る意思決定支援システムは、評価テーマに関して、ユーザが任意に評価項目や各種辞書を定義し、検索等の処理を行い、その結果を抽出出力するものである。そして、任意設定した評価基準に基づいて数値的に格付けした情報を提供することで主観的な評価を可能な限り排除し、情報に客観性を持たせるようにしている。また、最終的な結論出力前に中間評価判断を行い、より絞り込んだ支援情報を提供するものである。
【0061】
そして、その手法としては、評価項目ごとに対応する標準的な辞書群を構成し、さらに利用の都度、必要に応じて追記、削除するとともに、マイニングに成功した最終の用語群は再度辞書群に戻して自己成長させるようにしている。また、マイニング手順はシナリオ化し、熟練を要することなく熟練者と同じ手法でデータマイニングを可能としているほか、これにも自己成長機能を保有させて再利用可能としている。
【0062】
これらにより、本発明システムは、次のような先進性を有するものとなっている。即ち、従来と異なり、汎用的なデータマイニングエンジンとして機能し、種々の課題に対して柔軟に対応できるものとなっている。そして、豊富な辞書群を用意し、その辞書群には自己成長機能を有するものである。また、マイニング手順の自動化に当たり、「ブール論理」と組み合わせた「手順シナリオ」定義方式を採用し、抽出完了した「シナリオ」は、類似用途の利用に際し、再利用が可能である。さらに。複数の被テーマを同時にマイニングするものであり、マイニングの範囲を拡張して種々の用途に汎用的に応用できるものである。
【0063】
そのため、以下のようなユーザにおいて、広範囲に利用が可能である。即ち、シンクタンク的な組織体や特定のテーマで広く一般へ定期的公報を必要とする組織体などの行政機関や、同様にシンクタンク的な組織や金融分野企業の企業評価、事業評価の金融光学的評価の裏付け情報の獲得等の民間企業での活用が見込まれる。また、製造業における経営戦略立案部門、商品企画開発、研究開発部門や、企業買収(M&A)を目的とした組織等での利用も可能である。さらに、ベンチャー企業やその起業を目的とした個人による利用、その他一般個人の情報抽出手段として幅広い利用を見込むことができる優れた発明である。この場合、独立した調査・情報提供企業として成立するほか、ASP(アプリケーションサービスプロバイダ)サービスの形態で提供することもできる。
【符号の説明】
【0064】
1 中央処理装置
2 入力装置
3 記憶装置
3a データベース
4 表示装置
5 出力装置
6 ネットワーク
11 条件設定処理手段
11a 検索辞書
11b 分析辞書
11c 抽出辞書
11d 検索シナリオ定義
11e 分析シナリオ定義
11f 抽出シナリオ定義
12 検索・分析・抽出処理手段
13 判断処理手段
14 辞書・シナリオDB成長生成処理手段
15 報告書作成処理手段
16 ブール演算処理手段
17 結果表示処理手段

【特許請求の範囲】
【請求項1】
記憶装置に設けるデータベースに入力装置を介して辞書群及びシナリオ定義群を登録する条件設定処理手段と、
前記データベースに登録された辞書群及びシナリオ定義群を参照しながら、中央処理装置によりデータマイニングの手法に基づいてネットワーク上に存在する情報を検索し、分析し,抽出する検索・分析・抽出処理手段と、
前記検索・分析・抽出処理手段により出力された抽出情報の有用性を判断する判断処理手段と、
有用と判断した抽出情報の検索、分析、抽出に用いた辞書群及びシナリオ定義群を整備し、前記記憶装置のデータベースに登録して再利用可能として、辞書群及びシナリオ定義群を自己成長させるようにした辞書・シナリオDB成長生成処理手段と、
前記有用と判断した抽出情報を、表示装置または出力装置により任意のフォーマットで出力する報告書作成処理手段と、
を備えた意思決定支援システム。
【請求項2】
データベースに登録される辞書群は、検索辞書、分析辞書、抽出辞書からなり、それぞれ与えられた評価テーマに基づいて任意に設定した評価項目ごとに作成し、評価項目を制御するために参照する評価項目に関する用語群からなり、カテゴリでグループ化及び階層化され、管理されたデータ構造を有するものである請求項1記載の意思決定支援システム。
【請求項3】
上記各辞書は、評価項目ごとの着目用語群をレイア定義部とカテゴリ定義部に分類した構造で、レイア定義部を行項目、カテゴリ定義部を列項目とした二次元配列構造を採用し、レイア定義部には評価レベルが同等の用語群を定義し、カテゴリ定義部には類似性、共通性が高い用語群をグループ化しながら階層構造で分類した用語群を定義する請求項2記載の意思決定支援システム。
【請求項4】
データベースに登録されるシナリオ定義群は、検索シナリオ定義、分析シナリオ定義、抽出シナリオ定義からなり、上記辞書群に登録された評価項目ごとの用語群とそれらを論理演算で評価する方法を定義したデータ構造を有し、データマイニングの手法により所定の論理式が構築されたものである請求項1から請求項3のいずれか1項記載の意思決定支援システム。
【請求項5】
上記シナリオ定義群は、ブール論理による論理的算法の体系を用いて論理演算式を構築したものである請求項4記載の意思決定支援システム。
【請求項6】
データベースには、さらに、評価項目ごとに重要度をランク設定した評価項目重み付け定義を登録してある請求項1から請求項5のいずれか1項記載の意思決定支援システム。
【請求項7】
検索・分析・抽出処理手段は、上記辞書群及びシナリオ定義群を参照しながら、公知または独自の検索エンジンを用いてネットワーク上に存在する情報を検索し,分析し,抽出するものであり、シナリオ定義で構築した論理式に従ってデータマイニング手法に基づいて段階的に繰り返し行う請求項1から請求項6のいずれか1項記載の意思決定支援システム。
【請求項8】
判断処理手段は、上記検索・分析・抽出処理手段で抽出した情報を結果表示処理手段により視覚的に出力した評価項目ごとの抽出情報をオペレータが確認し、その有用性を判断するものである請求項1から請求項7のいずれか1項記載の意思決定支援システム。
【請求項9】
辞書・シナリオDB成長生成処理手段は、上記判断処理手段で有用とした抽出情報を抽出する際に用いた辞書群及びシナリオ定義群を整備し、標準的な辞書群及びシナリオ定義群としてデータベースに登録して再利用可能とするとともに、辞書群及びシナリオ定義群を自己成長させるものである請求項1から請求項8のいずれか1項記載の意思決定支援システム。。
【請求項10】
報告書作成処理手段は、上記判断処理手段で有用とした抽出情報を、評価項目ごとに理解しやすい形式で出力するものであり、マトリクス表、レーダーチャートなどの数値化及びビジュアル化した二次元表示、あるいは立体的な三次元表示のフォーマットで表示するものである請求項1から請求項9のいずれか1項記載の意思決定支援システム。
【請求項11】
上記ネットワークは、ワールドワイドウエブ(WWW)システム、及び、ネットワークに接続される各種ローカルパスである請求項1から請求項10のいずれか1項記載の意思決定支援システム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate