モデル作成支援システム、モデル作成支援方法、モデル作成支援プログラム
【課題】蓄積されたモデルを使用してモデルの構造を抽出し、抽出された構造を用いて予測モデルを改良できる作成支援システムを提供する。
【解決手段】モデル作成支援システム1では、情報処理装置15a〜15cで共分散構造を用いて現象を分析してモデルを作成し、作成中に支援システムに作成支援を依頼すると、対象モデルの観測変数と潜在変数と変数の接続関係とがモデル管理部4で取得され管理される。そして、モデル抽出部7の類似構造抽出部78が対象モデルとモデル記録部に蓄積された参照モデルとを比較し、対象モデルの部分構造と類似する構造を有する参照モデルの部分構造を類似構造として抽出し、抽出した類似構造をモデル管理部が情報処理装置に通知する。
【解決手段】モデル作成支援システム1では、情報処理装置15a〜15cで共分散構造を用いて現象を分析してモデルを作成し、作成中に支援システムに作成支援を依頼すると、対象モデルの観測変数と潜在変数と変数の接続関係とがモデル管理部4で取得され管理される。そして、モデル抽出部7の類似構造抽出部78が対象モデルとモデル記録部に蓄積された参照モデルとを比較し、対象モデルの部分構造と類似する構造を有する参照モデルの部分構造を類似構造として抽出し、抽出した類似構造をモデル管理部が情報処理装置に通知する。
【発明の詳細な説明】
【技術分野】
【0001】
例えば、店舗における月々の売上のように、変動する現象を予測するために使われるモデルの作成を支援するコンピュータシステムに関する。
【背景技術】
【0002】
近年、センサーネットワークの普及に伴い、産業上の様々な現象(例えば、売上、環境、機械、バイタル等に関する現象)を示すデータの収集が容易になりつつある。このようなデータは、小売店、保守現場等の様々な現場において有用な情報となりうる。そこで、このようなデータに対して、統計モデル(数式)を適用して、データで示される現象の本質を理解し、さらに、将来の現象の予測や特性の変化の早期発見することが試みられている。
【0003】
このような試みの1つとして、過去の現象を示すデータに対して回帰分析を行い、その現象を回帰方程式により表したモデルを作成することが挙げられる。このモデルを使うことによって、過去の現象の分析または、将来の現象を予測が可能になる。回帰方程式では、対象となる現象が目的変数(被説明変数)で表され、その現象に影響を与える因子は説明変数で表される。下記式(1)は、回帰方程式の一例であり、線形多重回帰の回帰方程式である。下記式(1)において、Yは目的変数、X1、X2は説明変数、a、b、cは定数である。特にbおよびcは偏回帰係数と呼ばれる。
【0004】
Y = a+b・X1+c・X2 ――――(1)
一例として、店舗における売上を予測する場合に、上記式(1)において、目的変数Yを売上の予測値とし、品揃え度合いを示す値を説明変数X1に、商品の平均価格を説明変数X2とすることができる。この場合、複数の店舗(例えば、複数のチェーン店)における過去の売上、品揃え、平均価格のデータを用いて、定数a、b、cを求めることができる。その結果、例えば、店舗経営者は、式(1)により、品揃えおよび商品価格それぞれの売上への寄与度合いを比較することができるし、品揃えおよび商品価格から売上を予測することもできる。
【0005】
このように、ある現象を分析または予測するためのモデルの回帰方程式を作成する場合、現象を説明する因子となる説明変数を何にするかが重要である。説明変数の選択の仕方によって予測精度が変わってくるからである。このような適切な説明変数の決定は、現場の分析者の経験、勘および試行錯誤に頼らざるを得なかった。
そこで、最適なモデルを得るために、予測モデルによる予測値と実測値との誤差を計算し、誤差が大きい場合に予測モデルを更新する予測装置が開示されている(例えば、特許文献1参照)。また、別の例として、複数の予測モデルに時系列実績データを適用した場合の予測データを用いて、提供する予測モデルを選択する方法も開示されている(例えば、特許文献2参照)。
【特許文献1】特開平9―95917号公報
【特許文献2】特開2001−22729号公報
【発明の開示】
【発明が解決しようとする課題】
【0006】
上記特許文献1および2は、ある特定の現象についての予測モデルを改良するための予測装置および方法である。したがって、蓄積された大量のモデルを使用して予測モデルを改良することができない。また、回帰分析処理により予測を行っているので、観測変数からモデルの主要な構造を抽出し、抽出された構造を用いて予測モデルを改良するのが困難である。
【0007】
本発明の課題は、蓄積されたモデルを使用してモデルの構造を抽出し、抽出された構造を用いて予測モデルを改良できる作成支援システム、モデル作成支援方法、モデル作成支援プログラムを提供することにある。
【課題を解決するための手段】
【0008】
開示したモデル作成支援システムでは、データを持つ複数の観測変数及びデータを持たない複数の潜在変数の和集合と、変数の接続関係を表す複数のパスと、で表現されたモデルが参照モデルとしてモデル記録部に蓄積される。この参照モデルは、過去に情報処理装置で作成されたモデルでもよいし、過去に別のシステムで作成されたモデルでもよい。情報処理装置が現象を、共分散構造を用いて分析してモデルを生成すると、対象モデルの観測変数と潜在変数とパスで表現された作成途中のモデルがモデル管理部で取得される。そして、情報処理装置から対象モデルの作成支援を依頼されると、モデル抽出部の類似構造抽出部が対象モデルと蓄積された参照モデルとを比較し、対象モデルの全体構造又は部分構造と類似する構造を有する参照モデルの全体構造又は部分構造を、類似構造として抽出し、抽出した類似構造がモデル管理部により情報処理装置に通知される。
【0009】
ここでは、対象モデルの作成途中に情報処理装置からモデルの作成支援を依頼されると、モデル記録部に蓄積された参照モデルと対象モデルとを比較し、参照モデルから対象モデルの全体構造又は部分構造と似ている類似構造を抽出できるので、蓄積された参照モデルを使用してモデルの構造を抽出して抽出された構造を用いて対象モデル(予測モデル)を改良できる。
【発明の効果】
【0010】
開示のシステムでは、蓄積された参照モデルと作成途中の対象モデルと比較し、参照モデルから対象モデルの全体構造又は部分構造と似ている類似構造を抽出できるので、蓄積された参照モデルを使用してモデルの構造を抽出して抽出された構造を用いて対象モデルを改良できる。
【発明を実施するための最良の形態】
【0011】
図1は、本実施形態に係るモデル作成支援システムの機能構成、すなわち、モデル作成支援プログラムの構成を現場の情報処理装置とともに示すブロック図である。モデル作成支援システム1は、情報処理装置15a、15bおよび15cに、たとえばネットワークを介して接続されている。情報処理装置15a〜15cは、それぞれ、現場のある特定の現象を示すデータを分析してモデルを作成し、このモデルを用いて将来の現象を予測する装置である。このモデルは、対象となる現象に寄与する因子に対応する観測変数と潜在変数とを用いた多変量解析で得られた共分散構造のデータである。
【0012】
(情報処理装置の構成)
情報処理装置15aは、各現場のモデルを作成及び更新するモデル作成・更新部151と、作成した各現場のモデルに各現場の実データを適用して実証分析を行うモデル実証部152と、作成した各現場のモデルを管理するローカルモデル管理部153と、を有している。また、現場の実データを格納する実データベース154と、現場の統計モデルの部品構成、検定値等の評価尺度、モデル作成方法、及びモデル解釈情報を格納するモデルデータベース155と、モデル作成支援システム1との入出力を行うためのインターフェース(IF)部156と、を有している。
【0013】
(情報処理装置の動作)
情報処理装置15aの概略動作について、一例としてB大学でのアンケート結果により学生の嗜好を抽出するモデルBを作成する場合を例に説明する。この場合、情報処理装置15aのモデル作成更新部151は、共分散構造を用いてアンケート結果から、たとえば、図2に示すようなモデルBを作成していく。
【0014】
ここで、共分散構造のモデルは、複数の観測変数及び複数の潜在変数の和集合と、変数間の接続関係を表す複数のパスと、で表現される。
図2では、矩形枠で記載されたアンケートの問題が観測変数である。観測変数は、直接観測することが可能であり多変量データとして測定値すなわちデータを持っている変数である。一方、楕円枠で記載されたものが潜在変数である。潜在変数は、モデルに導入された直接観測されないデータを持たない変数である。この潜在変数は観測変数や他の潜在変数等の間にあって、他の変数の間に相関をもたらす潜在した共通原因として導入される。パスは、変数間の接続関係やその接続関係の信頼性や有意性を表すように構成されている。
【0015】
ここで、図2に示したモデルBは、図3に示すような構成要素のデータに基づいて表現され、情報処理装置15a及びモデル作成システム1では、この表現を数式として記述した図4に示すような構造方程式で表されて記述されている。なお、構造方程式は、変数のベクター=設定箇所にパス係数を記した構造行列×変数のベクター+誤差のベクターで表している。
【0016】
図3のモデルBの構造方程式の構成要素(観測変数、潜在変数、及びパス)において、変数は、たとえば、素材の識別情報と、モデルインスタンスの識別情報と、変数タイプと、変数の名称と、観測変数の名称を示す実データの識別情報とで構成されている。また、パスは、たとえば、素材識別情報と、パス識別情報と、パスの起点の変数と、パスの終点の変数と、変数の関連性を表す係数値と、パス係数の検定当計量と、パス係数の有意性(信頼性)とで構成されている。有意性は検定統計量に基づいて決定されている。
【0017】
具体的には、図2において、数値は、各変数間のパスの係数値を示している。また、有意性を示す「*」は、この実施形態では、三段階で有意性を評価している。
図4の構造行列のj行i列の成分は、j番目の構成要素(変数)からi番目の構成要素(変数)に引かれたパスの係数値を示している。また、eQ1,eQ2・・・は、各構成要素(変数)につながる誤差を示している。なお、潜在変数には誤差が設定されないため潜在変数そのものが置かれている。また、各パスの検定統計量は、それぞれのパスのIDとともにモデルインスタンスデータベース52に記録される。
【0018】
共分散構造分析においては、構造方程式のモデルから計算される、変数間の分散共分散と、実際に観測される分散、共分散を比較して、尤度などの基準を満たすように、パスの係数値の適切な推定値を決定する。その際、個々の推定値が統計的に無意味ではないと検定されるほど、パスの検定値は高くなる。
情報処理装置15aの操作者のモデル作成操作によって、アンケート結果を対象とした構造方程式モデルの観測変数と、潜在変数と、が決まり、モデルをアンケート結果に適用することで、分析結果(推定結果)が決まる。これらモデルの部品と分析結果(推定結果)が図3に示す構成要素のデータ表現例で示され、モデルデータベース155に格納される。それらは、数式の比較や利用者への情報提示などの必要に応じて、図4に示す構造方程式として展開され、利用される。
【0019】
図2から図4に示されたモデルBの作成の途中の状態で、操作者が情報処理装置15aからネットワークを介してモデル作成支援システム1をアクセスして作成支援を依頼すると、モデル作成支援システム1が動作して類似の部分構造を有する図6に示すモデルAを抽出し、さらに類似するモデルAの全体構造又は部分構造を抽出して情報処理装置15a〜15cに提示する。
【0020】
(モデル作成支援システムの構成)
モデル作成支援システム1は、図1に示すように、各情報処理装置15a〜15cで使用されるモデルの作成や更新を支援するためのシステムである。モデル作成支援システム1は、各情報処理装置15a〜15cからモデルに関する情報を集めて蓄積しておき、情報処理装置15aから種々の要求があると、蓄積した情報を使って情報処理装置15a〜15cそれぞれで有用なモデルを作成するための支援データを生成し、各情報処理装置15a〜15cに出力する。
【0021】
モデル作成支援システム1は、インターフェース部156にネットワークを介して接続されたインターフェース部2と、ローカルモデル対応部3と、モデル管理部4と、モデル記録部5と、距離計算部6と、モデル抽出部7と、を備えている。
(ローカルモデル対応部の構成)
ローカルモデル対応部3は、現場の情報処理装置15a〜15cに対応してモデル作成支援システム1側で各情報処理装置15a〜15cのモデルの作成・改良の支援をモデル管理部4に要求するものである。ローカルモデル対応部3は、現場のモデル情報を取得するローカルモデル情報取得部31と、蓄積された参照モデルから現場の対象モデルのよりよい代替モデルを作成するローカルモデル提案部32と、を有している。ローカルモデル情報取得部31は、各情報処理装置15a〜15cで作成した現場のモデルの各部品の構成や検定値等の評価尺度、モデル作成方法及び解釈情報を取得する。
【0022】
(モデル管理部の構成)
モデル管理部4は、ローカルモデル対応部3を介して情報処理装置15a〜15cで作成した対象モデルを取得するとともに、各情報処理装置15a〜15cへの支援情報の通知等の管理を行う。また、モデル管理部4は、ローカルモデル対応部3やモデル記録部5やモデル抽出部7の動作を管理する。
【0023】
(モデル記録部の構成)
モデル記録部5は、各情報処理装置15a〜15cのモデルの部品とローカルモデル情報取得部31で取得した現場のモデルやそれとは別に取得したモデル等の各部品の構成や検定値等の評価尺度、モデル作成方法及び解釈情報を格納する。具体的には、モデル記録部5は、モデルの部品を管理するためのモデル部品データベース51と、モデルの構成変数等のモデルのインスタンスを管理するモデルインスタンスデータベース52と、を備えている。モデル部品データベース51には、前述した図3に示すような内容、すなわち、モデルの観測変数名や潜在変数名やパスの起点と終点の変数名などがモデル部品のIDに関連付けて格納されている。これらは、構造方程式のパーツを格納するデータベースである。すなわち、構造方程式は、これらのデータベースにあるパーツを利用して構築される。
【0024】
モデル部品データベース51には、部品としての観測変数(たとえ、アンケートの質問等)の情報を格納する観測変数データベース53と、部品としての潜在変数(たとえば、共感力、創造力、創発力、感性力等の、観測変数に使われる変数のキーワード(例:経常利益、人間に興味がある、年齢、授業は面白かったか)と、各観測変数が取り扱う情報の種別(例:自然数、整数、離散、質的変数)を格納する潜在変数データベース54と、部品としての変数間のパスのうち実績があるものを格納するパスデータベース55と、格納したモデルに関連する外部情報(たとえば、[業種間距離情報:売り上げ規模:小売り<地域スーパー<百貨店<大型スーパー]、[業界地理情報:IYスーパー:千葉県、UNスーパー:愛知県])を格納するモデル関連外部情報データベース56と、を含んでいる。なお、パスは原則としてどの変数間にも引けるので、パスデータベース55にはあくまで事例の参考としてパスが記録されており、パスデータベース55に存在しない起点と終点の変数の間にパスを引いてはいけないということではない。
【0025】
モデルインスタンスデータベース52には、図5に示すように、作成済みモデルの題名、観測変数、潜在変数、パス、パスの検定値、実データ(たとえばアンケート結果)、モデルのパターン、モデルの作成方法、及びモデルの解釈情報が格納されている。また、図4に示したようなモデル毎の構造方程式の展開を可能とする、各モデルの構成要素のデータが、図3に示す形式で格納されている。
【0026】
(距離計算部の構成)
距離計算部6は、モデル全体、部分、及び各変数間の距離を計算するものである。具体的には、モデルの距離では、複数のモデルの一致性を基準にして計算する。また、次に、モデルの構成要素がきわめて類似しているもの、モデルの統計的なつながりがきわめて類似しているものは、一致度が高い。距離には、外的属性間距離と、変数属性間距離と、パス構造間距離と、パス係数間距離と、パス係数符号間距離と、パス係数有意性間距離と、モデル性能間距離と、の7種類の距離尺度がある。これらの7種類の距離のうち、モデル性能間距離を除く距離尺度は、モデルの全体構造ではなく部分構造にも適用することができる。
【0027】
これらの7種類の距離の説明を以下に行う。
外的属性間距離は、モデルの題名や対象業界、対象標本、実行時期等の一致性に基づく距離である。外的属性間距離の完全一致の状態とは、対象とする属性が完全に一致する場合である。しかし、標本まで一致するということは同じモデルであることになるので、通常、外的属性間距離が0になることはないと考えられる。
【0028】
変数属性間距離は、構造方程式を構成する観測変数の識別情報群や潜在変数の識別情報などの識別情報の属性の一致性に基づく距離である。変数属性間距離の完全一致の状態とは、2つのモデルにおいて、観測変数のID群、及び、潜在変数群のIDが完全に一致している状態のことである。これは複数のモデルの比較において現実にありうると考えられる。なお、変数間属性距離は、観測変数間距離、潜在変数間距離の2つから構成される。
【0029】
パス構造間距離は、構造方程式を構成する観測変数及び潜在変数の間に引かれたパスの一致性に基づく距離である。パス構造間距離の完全一致の状態とは、パスの元になる構成要素(潜在変数や観測変数)が完全に一致している状態のことである。従って完全に一致しておらず類似の関係にある場合は、その類似距離の影響を受ける。また、不一致のパスは、不一致パス数として計算され互いのモデル距離を遠ざける。
【0030】
パス係数間距離は、構造方程式を構成する観測変数及び潜在変数の間に引かれたパスに対して推定された係数値の一致性に基づく距離である。パス係数間距離の完全一致の状態とは、パス構造間距離と同様に、パスの元になる構成要素(潜在変数や観測変数)が完全に一致している状態のことである。従って完全に一致しておらず類似の関係にある場合は、その類似距離の影響を受ける。また、不一致のパスは、不一致パス数として計算され互いのモデル距離を遠ざける。
【0031】
パス係数符号間距離は、構造方程式を構成する観測変数及び潜在変数の間に引かれたパスに対して推定された係数の符号の一致性に基づく距離である。パス係数符号間距離の完全一致の状態とは、パス構造間距離と同様に、パスの元になる構成要素(潜在変数や観測変数)が完全に一致している状態のことである。従って完全に一致しておらず類似の関係にある場合は、その類似距離の影響を受ける。また、不一致のパスは、不一致パス数として計算され互いのモデル距離を遠ざける。
【0032】
パス係数有意性間距離は、構造方程式を構成する観測変数及び潜在変数の間に引かれたパスに対して推定された係数の検定値の有意な箇所の一致性に基づく距離である。パス係数有意性間距離の完全一致の状態とは、パス構造間距離と同様に、パスの元になる構成要素(潜在変数や観測変数)が完全に一致している状態のことである。従って完全に一致しておらず類似の関係にある場合は、その類似距離の影響を受ける。また、不一致のパスは、不一致パス数として計算され互いのモデル距離を遠ざける。
【0033】
モデル性能間距離とは、構造方程式全体の成績を表す尺度である適合度検定値などの性能尺度の一致性に基づく距離である。モデル性能間距離が完全一致の状態とは、それぞれのモデルの性能尺度の値が一致している状態のことである。
以下に、モデルBと、図6から図8に示す兵庫県A芸術大学学生調査のアンケート調査結果の作成済みのモデルであるモデルAとの間での距離計算について説明する。なお、3以上のモデルが与えられても、基本的には、2つのモデルずつの間の距離を計算し、その結果を座標空間にマッピングすることにより、3つ以上のモデルの距離を求めることができる。3つ以上のモデルのモデル間距離を算出する場合は、平均値、偏差、最大値、最小値、中央値を指標とすればよい。
【0034】
モデルAは、図6に示すような関係で図示される。また、モデルAの構成要素のデータは、図3と同様に図7に示される。さらに、その構造方程式は図4と同様に図8に示される。
外的属性間距離の場合、たとえば図9に示すように、2つのモデルA,Bに対して5種類の指標の一致性を計算し、それらの類似性の平均値を距離と見なす。なお、個々の距離計算において、必要であれば、モデル関連外部情報データベース56に蓄えられた蓄積データを利用する。
【0035】
ここでは、5種類の指標として、たとえばモデルの題名、モデル用途、モデル作成者、調査対象、モデルの調査時期を選択している。そして、モデルの題名及び用途に関しては、完全に一致しているので、距離を1に設定している。また、モデル作成者は、福祉大学と、芸術大学であるので、類似度で半分程度あるとして距離を0.5と設定している。調査対象は280名と300名であるので、(280/300)×1.0として距離を0.933に設定する。調査時期は、1年のずれを0と評価し、1ヶ月のずれは、双方の月の遅い方から1年前を起点とした場合、9/12と計算されるので、距離は0.75と設定される。
【0036】
これらの5種類の距離の平均を計算することにより、外的属性間距離は、(1+1+0.5+0.93+0.75)/5=0.837と算出される。
構成要素間距離の場合、双方のモデルのキーワードが一致するように配置し、双方の距離を計算し、その平均値を構成要素間距離とする。モデルAとモデルBでの並べ替え結果の構成要素間距離の一例を図10に示す。この例では、潜在変数は名称的には全く一致していない。一方、観測変数間の一致度は高く、13の観測変数のうち11の観測変数で一致している。したがって、観測変数の距離は、11/13=0.846と設定され、潜在変数の距離は、0と設定される。
【0037】
パス構造間距離の場合、双方のモデルのパスが一致するように配置し、双方の距離を計算する。通常、終点と起点の名称が一致していれば、距離は1となる。モデルAとモデルBでの配置結果の一例を図11に示す。この例の場合には、名称未設定な潜在変数を含む一部の潜在変数間のパスのみに距離が計算されている。ここでは、全体の距離は、パス1から5までが0.5×5=2.5であり、その他が−11であるので0となる。最も高い部分の距離は0.5となる。
【0038】
パス係数間距離の場合、双方のモデルの同じ箇所ないし類似箇所のパスが一致するように配置し、双方の相関係数(それぞれの値の組み合わせを2つのベクトルとみなしたときの、2つのベクトルの向く方向の一致性)を計算し、その値をパス係数間距離とする。モデルAとモデルBでの並べ替え結果のパス係数間距離の一例を図12に示す。図12では、全体の相関係数で距離を表すと、0.3911になるが、但し、双方にパス係数がある上位5つのパスのみでベクトルを作って計算した場合に関して言えば、相関係数で表された距離は0.849となり、高い値を示す。
【0039】
パス符号間距離は、双方のパス係数の符号の正負の一致性を測る指標である。パス符号間距離の場合、図13に示すように、双方のモデルのパスが一致するように配置し、符号が一致していれば1、不一致なら−1とする。該当がない場合も−1とする。そして全体平均を、符号間距離とする。この例では全体平均は負になるので、0となる。但し、双方にパス係数がある上位5つのパスに関して言えば、一致度は1である。
【0040】
パス係数有意性間距離では、各パス係数は、t検定を行い、信頼区間に基づく検定値が計算される。その値に対して、図14に示すように、5%有意であれば1点、1%有意であれば2点を与える。そして、双方のモデルのパスが一致するように配置し、双方の検定値について、図14に示す指標dを計算し、それぞれの値の平均値をパス係数有意性間距離とする。図14に示す例では、全体では、距離は0.281になり、双方にパス係数が上位の5つのパスでは、0.9になる。
【0041】
モデル性能間距離は、各モデルは、完全適合モデルからどのくらいずれるのかを示すものであり、例えば、適合度カイ二乗という指標で評価することができる。その適合度検定におけるp値の有意性について、パス係数有意生間距離の場合と同様に5%有意であれば1点、1%有意であれば3点を与える。そして、双方のモデルのパスが一致するように配置し、双方の検定値について、前述した指標dを計算し、それぞれの値の平均値をモデル性能間距離とする。この距離は、0〜1の間の値を取るようになっている。また、この測度は、構造方程式全体に関わるものであり、部分構造について適用することは統計学的厳密性を損ねることになる。従って、全体モデルに対してのみ使える指標である。なお、モデルAは作成済みの完成したモデルであるのに対し、モデルBは作成途中のモデルであるので、モデルBの評価できない。従って、AとBのモデル性能間距離は測れない。
【0042】
このような構成の距離計算部6では、モデル抽出部7からの計算依頼があると、依頼に応じて複数のモデルの全体構造又は部分構造の距離を計算する。
距離計算部6でモデルの距離計算を行う場合、たとえば、図15に示すように、ステップP1で、計算対象のモデルのペアを作成する。ステップP2では、与えられたモデルペアについて、前述した7種の距離尺度のうち、計算可能な尺度を計算可能な距離尺度について計算を行う。ステップP3では、各距離尺度において、重視する尺度に基づいて加重平均値を計算し、モデルペア間距離とする。また、部分構造が抽出されると、部分構造毎に同様な処理を行う。ステップP4では、モデル群が3つ以上の場合、各ペアの距離に基づいて、マッピングを行い。平均値、偏差、最大値、最小値、中央値を計算して、代表指標とする。
【0043】
(モデル抽出部の構成)
モデル抽出部7は、モデル又はモデルの少なくとも一部分を種々の特性に基づいて抽出するものである。モデル抽出部7は、モデル構造特性抽出・活用促進部71と、モデル安定/部分独立構造抽出部72と、類似モデル抽出部73と、潜在変数抽出部74と、着目モデル性能監視部75と、を有している。
【0044】
モデル構造特性抽出・活用促進部71は、モデルの構造的な特徴により抽出された、たとえば類似モデルの推薦等を行う。モデル構造特性抽出・活用促進部71には、モデル構造データベース76と、モデル性能データベース77とが接続されている。モデル構造データベース76には、抽出されたモデルの構造的な特性(たとえば、類似構造や部分安定構造や部分独立構造等)が格納されている。モデル性能データベース77には、抽出されたモデルの時間的に変化する性能が格納されている。
【0045】
モデル安定/部分独立構造抽出部72は、モデルの中で部分的に安定している構造や部分的に独立性が高い構造を抽出する。類似モデル抽出部73は、あるモデルについて他のモデルの中から類似したモデルを抽出する。具体的には、距離計算部6に対象モデル(たとえばモデルB)に類似する参照モデルとの距離の計算を依頼し、その距離計算結果により類似する参照モデルの全体構造又は部分構造を類似構造として抽出する。また、ある参照モデルと別の参照モデルとの距離の計算を距離計算部6に依頼して共通構造や集約構造を抽出する。さらに、参照モデルと対象モデルの作成方法を比較して作成方法が類似する参照モデルを類似作成方法のモデルとして抽出する。類似モデル抽出部73は、類似構造抽出部78と、共通構造/集約構造抽出部79と、類似作成方法抽出部80とを有している。
【0046】
類似構造抽出部78は、前述したように距離計算部6からの距離計算結果に基づいて、情報処理装置15a〜15cから取得したモデル(対象モデルの一例)と構造的に類似したモデルをモデル記録部5に蓄積されたモデル(参照モデルの一例)から抽出するものである。
共通構造/集約構造抽出部79は、モデル記録部5に蓄積された複数のモデル群について、共通性が高いモデルやそれぞれを集約的(相補的)に重ね合わせて抽出されたモデルを取り出す。類似作成方法抽出部80は、モデルの作成方法について類似するモデルを抽出する。
【0047】
潜在変数抽出部74は、対象モデルと類似する参照モデルを参考に、潜在変数を抽出する。着目モデル性能監視部75は、何らかの基準(たとえば、あるモデルと類似するモデルという基準)で着目するようになったモデルに対して性能を監視するものである。仮想モデルの場合は、構成要素となっている複数の実モデルの性能から類推して組み立てたモデルの性能を監視する。
【0048】
(モデル作成支援システムの動作)
次に、モデル作成支援システム1の動作について、図16から図21に示す処理手順を示すフローチャートに基づいて説明する。
モデル支援作成システム1では、図16のステップS1で情報処理装置15a〜15cからの支援依頼を待つ。情報処理装置15a〜15cの操作者は、モデル作成中に支援を受けたい場合は、その旨を、ネットワークを介してモデル作成支援システム1に通知する。その通知が来るとステップS2に移行する。ステップS2では、情報処理装置15a〜15cのモデルデータベース155にある対象モデルの潜在変数や観測変数やパス(接続関係の一例)をローカルモデル情報取得部31で取得する。ステップS3では、情報処理装置15aから15cから部分構造抽出依頼があるか否かを判断する。ステップS4では、情報処理装置15aから15cから類似モデル抽出依頼があるか否かを判断する。ステップS5では、情報処理装置15aから15cから潜在変数抽出依頼があるか否かを判断する。
【0049】
部分構造抽出依頼があった場合には、ステップS3からステップS6に移行する。ステップS6では、図17に示す、部分構造抽出処理を実行する。類似モデル抽出依頼があったときは、ステップS4からステップS7に移行する。ステップS7では、情報処理装置15aから15cから類似構造抽出依頼があったか否かを判断する。ステップS8では、情報処理装置15aから15cから共通構造/集約構造抽出依頼があったか否かを判断する。ステップS9では、情報処理装置15aから15cから類似作成方法抽出依頼があったか否かを判断する。
【0050】
類似構造抽出依頼があった場合には、ステップS7からステップS10に移行する。ステップS10では、図18に示す類似構造抽出処理を実行する。共通構造/集約構造抽出依頼があった場合には、ステップS8からステップS11に移行する。ステップS11では、図19に示す共通構造/集約構造抽出処理を実行する。類似作成方法抽出依頼があった場合には、ステップS9からステップS12に移行する。ステップS10では、図20に示す類似作成方法抽出処理を実行する。
【0051】
潜在変数抽出依頼があった場合には、ステップS5からステップS13に移行する。ステップS13では、図21に示す潜在変数抽出処理を実行する。
図17に示す部分構造抽出処理は、モデルの構造を比較しやすくするために行われる処理である。情報処理装置15a〜15cの操作者は、複雑なモデル同士を比較する際に部分構造の抽出依頼をする。部分構造抽出処理では、部分独立構造又は部分安定構造を抽出する。図11において、ステップS21で部分構造の抽出依頼が独立構造の抽出依頼であるのか安定構造の抽出依頼であるのかを判断する。ここで、独立構造というのは、あるモデルの1又は複数の変数からなる部分構造が他の部分構造に対して関連性が少なく独立していると見なされる部分構造をいう。また、安定構造とは、独立構造の中からさらにパスの統計的な優位性を示す信頼性すなわち検定値が高く安定している組み合わせのことである。安定構造の抽出依頼があると判断すると、ステップS21からステップS22に移行する。
【0052】
ステップS22では、パスの統計的な優位性もパスの識別条件に加える。独立構造の抽出依頼であるとするとステップS21からステップS23に移行する。ステップS23では、モデルの各変数のパス先とパス数を調査する。ステップS24では、各変数の片方向又は双方向の一次隣接変数群からn次隣接変数群を探索し、それらの偏在性を計算することにより共通構造を抽出する。ステップS25では、共通構造から片方向でもよいから独占的にパスを張っている変数を探し、その変数を共通構造の関連変数と見なして部分独立構造又は部分安定構造として抽出する。ステップS26では、部分構造の抽出依頼が終了したか否かを判断し、終了依頼があるとメインルーチンに戻り、終了依頼が無い場合はステップS21に戻る。
【0053】
図22に示したいちごショートケーキの総合的なおいしさを調査するためのアンケート結果のモデルCを用いて実際の部分構造抽出処理の内容を説明する。ここでは、モデルCの全体構造は、アンケートの問である観測変数Q1〜Q16及び潜在変数L1〜L7の和集合と、それらの変数のつなぐパスとを有している。図23にモデルCの構造方程式を示している。そして、ステップS23で各変数のパス先とパス数とを調査し、ステップS25で共通構造を抽出し、ステップS26で共通構造にパスを張っている変数を探すと、図24及び図25に示すように、潜在変数L1からL3と、観測変数Q1−Q3,Q6,Q7で構成される部分構造が抽出される。図24及び図25において、破線で囲んだ部分の独立性が高いのでこの部分を切り出して部分構造として抽出する。この部分構造は、パス係数の値が大きく、かつt検定値の有意性が高いため、部分安定構造であると判断される。この部分安定構造は、モデル名とともにモデル構造データベース76に記録される。
【0054】
また、図24及び図25には図示されていないが、潜在変数L4及び観測変数Q4,Q5が部分安定構造として抽出される。さらに、潜在変数L5,L6及び観測変数Q8,Q10,Q13,Q15は、潜在変数L5と観測変数Q13のパスに統計的な有意性が見られないため、部分安定構造ではなく、部分独立構造として抽出される。これらも、モデル構造データベース76に記録される。
【0055】
また、図6に示すモデルAの場合、同様にして、潜在変数L3,L4及び観測変数Q7−Q12を部分独立構造として抽出したり、潜在変数L1,L2及び観測変数Q1,Q3−Q6を部分安定構造として抽出したりすることが可能である。同様に、図2に示すモデルBの場合、潜在変数L5及び観測変数Q7,Q9と、潜在変数L6及び観測変数Q10−Q12を部分独立構造として抽出することが可能である。
【0056】
ここでは、複雑なモデル構造から他の部分構造との関連性が少ない独立構造を抽出しているので、部分構造の比較を容易に行うことができる。また、安定構造を抽出した場合には、信頼性が高い独立構造を使用して比較を行うことにより、より信頼性が高いモデルを構築できる。
図18に示す類似構造抽出処理では、作成中の対象モデルの部分構造に対して、すでに結果が出ている参照モデルの部分構造と、を距離計算部6に距離計算を依頼した結果を見て類似構造を抽出する。
【0057】
類似構造の抽出依頼があると、図18のステップS31で、類似構造を抽出する際に有意性も判定条件にあるか否かを判断する。情報処理装置15a〜15cの操作者は有意性を判定条件にするか否かを予め設定することも可能である。優位性も判定条件に含まれる場合は、ステップS32に移行し、パス係数の検定値が大きなパスは、有意性の大小も判定に利用するように設定し、ステップS33に移行する。なお、ステップS32では、有意性を判定条件に含める場合であっても、検定値がまだ決まっていない未検定パスがあるとき、統計値は使用しないと言う限定条件が付加される。有意性が判定条件にない場合は、ステップS32をスキップしてステップS33に移行する。
【0058】
ステップS33では参照モデルの部分構造の全てを探索し終わったか否かを判断する。参照モデルの全ての部分構造を探索し終わった場合はステップS31に戻る。まだ部分構造が残っている場合はステップS34に移行する。ステップS34では、対象モデルの部分構造及び参照モデルの部分構造の計算結果から共通変数を抽出する。ステップS35では、対象モデルの部分構造と参照モデルの部分構造の比較のために、おのおのの構造行列において、等価もしくは類似の変数(=観測変数、潜在変数)が同一行に並ぶように順番を入れ替える。ここで、類似性は計算された変数の名前の距離で判定し、いずれかの構造が有する名称未設定の潜在変数は、パス関係の距離の計算結果により類似性を判断して、いずれかの構造が有する潜在変数と対応づけて配置する。
【0059】
ステップS36では、構造行列の各変数の比較により、同一の構造を抽出する。ステップS37では、対象モデル側の共通構造の隣接変数を集める(1次〜n次隣接)。ステップS38では、参照モデル側の共通構造の隣接変数を集める(1次〜n次隣接)。ステップS39では、対象モデルと参照モデルのそれぞれの隣接変数を比較し、対象モデルにおける隣接性が低く、参照モデルにおける隣接性(かつ安定性)が高い隣接変数を抽出する。ステップS40では、抽出群の中から、対象構造との共通度が高い類似構造と、共通度が高い隣接変数を選択して類似構造として抽出する。ステップS41では、部分構造の抽出依頼が終了したか否かを判断し、終了依頼があるとメインルーチンに戻り、終了依頼が無い場合はステップS31に戻る。
【0060】
図2に示すモデルBを作成中の情報処理装置15a〜15cのいずれかから類似構造の抽出依頼をすると、距離計算部6によりモデルBと参照モデルとの距離が計算され、図6から図8に示すようなA芸術大学のモデルAの調査結果が類似モデルとして抽出される。そして、抽出されたモデルAの構造から図26に示す部分構造が類似構造として抽出される。具体的には、図27に示すように、構造行列を見て、モデルAの潜在変数L3,L4と、モデルBの潜在変数L5,L6とは観測変数との間に有意なパスの距離がしきい値を超えており、接続パターンが似ていると判断し、類似構造を抽出する。
【0061】
類似構造が抽出されると、図28に示すように、モデル作成支援システム1は、抽出された類似構造に基づき、潜在変数の名称の推薦及び観測変数に対する潜在変数の設定の推薦するために、これらのデータはモデル構造特性抽出・活用促進部71からモデル提案部32に送られ、情報処理装置15aに出力される。情報処理装置15aの操作者は推薦された名称及び潜在変数を見て、それでよければ、推薦された名称及び変数を作成途中のモデルBに当てはめる。
【0062】
ここでは、現場の情報処理装置が作成した対象モデルを蓄積されたモデルから得られる参照モデルと比較し、参照モデルから対象モデルの部分構造と似ている類似構造を抽出できるので、蓄積されたモデルを使用してモデルの構造を抽出して抽出された構造を用いて予測モデルを改良できる。
図19の共通・集約構造抽出処理では、モデル作成支援システム内にある複数のモデルのモデル間に共通の部分構造がある場合にその共通構造を抽出する。この処理は、ローカルモデル対応部3の依頼による行われる場合と、直接依頼をうけないが、よりよい推薦のために、夜間バッチなどで実行される場合とがある。その結果は、モデル構造特性抽出・活用促進部71に送られ、よい良いモデル提案に利用される。共通構造又は集約構造の抽出依頼があると、図19のステップS51で、類似構造を抽出する際に有意性も判定条件にあるか否かを判断する。情報処理装置15a〜15cの操作者は有意性を判定条件にするか否かを予め設定する。優位性も判定条件に含まれる場合は、ステップS52に移行し、検定値が大きい有意パスは、統計値も判定に利用するように設定し、ステップS53に移行する。なお、ステップS52では、有意性を判定条件に含める場合であっても、検定値がまだ決まっていない未検定パスがあるとき、統計値は使用しないと言う限定条件が付加される。有意性が判定条件にない場合は、ステップS52をスキップしてステップS53に移行する。
【0063】
ステップS53では対象モデルの部分構造の全てを探索し終わったか否かを判断する。参照モデルの全ての部分構造を探索し終わった場合はステップS51に戻る。まだ部分構造が残っている場合はステップS54に移行する。ステップS54では、対象モデルの部分構造の共通変数を抽出する。ステップS55では、複数の対象モデルの部分構造の比較のために、おのおのの構造行列において、等価もしくは類似の変数(=観測変数、潜在変数)が同一行に並ぶように順番を入れ替える。ここで、類似性は変数の名前の距離で判定し、いずれかの構造が有する名称未設定の潜在変数は、パス関係の類似性によって、いずれかの構造が有する潜在変数と対応づけて配置する。
【0064】
ステップS56では、構造行列の各変数の比較により、共通構造を抽出する。ステップS57では、対象モデル側の共通構造の隣接変数を集めて共通構造を抽出する(1次〜n次隣接)。ステップS58では、依頼が共通構造か集約構造かを判断する。集約構造の依頼の場合は、ステップS59に移行し、複数の対象モデルの構造における共通構造の隣接変数を集める(1次〜n次隣接)。ステップS60では、複数の対象モデルのそれぞれの隣接変数を比較し、構造間で共通性が高いものを比較し、共通構造に隣接変数を付加して集約構造として抽出ステップSステップS61に移行する。共通構造の依頼の場合は、ステップS58からステップS61に移行する。ステップS61では、共通・集約構造の抽出依頼が終了したか否かを判断し、終了依頼があるとメインルーチンに戻り、終了依頼が無い場合はステップS51に戻る。
【0065】
次に、図29に示すように、神戸−大阪間の阪神高速神戸線及び湾岸線のモデルDと、大阪−京都間の名神高速及び第2京阪のモデルEと、から共通構造を抽出する場合を例に説明する。この場合、図30に示した調査Dの構造行列と、図31に示した調査Eの構造行列とからステップS55で、等価若しくは類似する変数が同一行に並ぶように順番を入れ替える。この入れ替え結果を図32に示す。図32では、図29に灰色で示した変数を並べ替えて同一行に並ぶように配置している。そして、潜在変数L1−L3と観測変数Q1−Q3,Q5,Q7を含む共通構造を抽出している。
【0066】
ここでは、複数のモデルから共通構造やその周辺も含めた集約構造を抽出できるので、信頼性が高いモデルの部品を作成することができ、それらを使用してさらに信頼性が高いモデルを構築できるようになる。
図20の類似作成方法抽出処理では、図20のステップS71で、モデル記録部4にある全参照モデルの構造の探索が終了したか否かを判断する。全ての参照モデルの構造を探索していない場合は、ステップS72に移行する。ステップS72では、モデルインスタンスデータベース52を参照して参照モデルの構造の作成方法が判明しているか否かを判断する。作成方法が判明していない場合は、ステップS72からステップS73に移行して探索処理を回避しステップS72に戻る。作成方向が判明している場合は、ステップS72からステップS74に移行する。ステップS74では、参照モデルの構造の作成方法と対象モデルの構造の作成方法とを比較する。ステップS75では、比較結果により、参照モデルと対象モデルとで作成方法が同じか否かを判断する。同じ場合は、ステップS76に移行し、参照モデルと対象モデルとで出発点モデルが同一か否かを判断する。ここで出発点モデルとは、共分散構造分析をどの状態で作成し始めたかである。共分散構造分析は、パスの引き方の自由度が大きく、通常は、試行錯誤を経てモデルが作成される。しかし、何がしかのモデルパターン(例:飽和モデル、MIMICモデル)を出発点として、少しずつパスを削りながら安定したモデルに至った経緯が記述してあれば、それも、あるモデルと、別のモデルの類似性を示す根拠になる。
【0067】
出発点モデルが同一の場合は、ステップS77に移行する。ステップS78では使用している評価指針が類似又は同一か否かを判断する。この指針は、通常は、適合度カイ二乗検定であるが、他にも、GFI,AGFIなどの指標が使われることがある。指標が同一の場合はステップS78に移行する。ステップS78では、実行手順が同一か否かを判断する。ここで、実行手順とは、パスを変化させていく過程のことであり、通常はラ分析者がヒューリスティック(ランダム)に「行うが、ある方針のもとで行う場合は、この手順も、あるモデルと別のモデルの作成法右方における類似性を測る根拠になる。実行手段が同一の場合は、ステップS79に移行し、参照モデルの構造を作成方向の類似した構造として記録する。ステップS80では、終了依頼がなされたか否かを判断する。終了依頼がなされていない場合はステップS71に戻り、終了依頼がなされた場合はメインルーチンに戻る。
【0068】
一方、ステップS75からステップS78の判断が同一でないと判断されると、ステップS80に移行する。また、全ての参照モデルの構造の探索を終了するとステップS71からステップS81に移行する。ステップS81では、作成方法の類似性のランキングを、S75〜S78の評価結果の総合値として計算し、ランキング上位の参照モデル群を抽出する。この処理が終わると、ステップS80に移行する。
【0069】
なお、この結果(例:上位3位の参照モデル群)も、現場モデルの作成支援に利用される。例えば、モデル構造特性抽出・活用促進部71を介してローカルモデル提案部32が情報処理装置15a〜15cに推薦する。
ここでは、作成方法が類似する既知の参照モデルを抽出できるので、それを参照してモデルを構築でき、より信頼性が高いモデルを容易に作成できる。
【0070】
図21の潜在変数抽出処理では、図21のステップS91で対象モデルに対して 少なくとも一つの類似構造を有するモデル有るか否かを判断する。類似構造がある場合は、ステップS92に移行する。ステップS92では、対象モデルの名称未設定な潜在変数について、参照モデルの構造的に同じ場所に名称付き潜在変数が設定されているか否かを判断する。参照モデルの同じ場所に名称付きの潜在変数がある場合には、ステップS93に移行する。ステップS93では、参照モデル側の潜在変数の名称を対象モデルへの推薦オブジェクトとする。
【0071】
名称付きの潜在変数がない場合は、ステップS92からステップS94に移行する。ステップS94では、対象モデルと参照モデルを比較し、観測変数や潜在変数の類似性が高く、 参照モデルにのみ存在する潜在変数があるか否かを判断する。類似性が高い潜在変数が参照モデルだけにある場合はステップS95に移行する。ステップS95では、参照モデル側の潜在変数と既存の変数に張られているパスとを対象モデルへの推薦オブジェクトとする。類似性が高い潜在変数が参照モデルだけにない場合にはステップS96に移行する。ステップS96では、推薦オブジェクトがある場合は、モデル構造特性抽出・活用促進部71に伝える。すると、モデル構造特性抽出・活用促進部71が推薦オブジェクトをローカルモデル提案部32に出力し、ローカルモデル提案部32が情報処理装置15a〜15cに推薦する。
【0072】
ここでは、図28に示すように、対象モデルであるモデルBに、参照モデルである図2に示すモデルAと類似した部分構造(類似構造)がある場合、モデルBに対して潜在変数の名称が推薦される。具体的には、モデルBの名称なしの潜在変数L5,L6と同じ場所にあるモデルAの名称付きの潜在変数L3,L4の名称が、モデルBの潜在変数の名称として推薦される。このため、情報処理装置15a〜15cの操作者は、この推薦を受けて名称の採否を決定でき、潜在変数の名称設定の作業を簡素化でき、モデル作成の効率を向上させることができ、作成工数の削減を図ることができる。
【0073】
また、同じ場所に名称付きの潜在変数がなくても、対象モデルの観測変数や潜在変数と類似性が高い潜在変数が 参照モデルにのみ存在する場合は、対象モデルの図7に波線で示す部分に参照モデルの類似性が高い潜在変数を推薦している。具体的には、参照モデル側の潜在変数と既存の変数に張られているパスとを対象モデルへの推薦オブジェクトとしている。このため、潜在変数を考えることなく、潜在変数及び観測変数や潜在変数とのパスを生成できるので、分析性能や予測精度が高いモデルを容易に作成できる。
【0074】
以上の実施形態に関し、さらに以下の付記を開示する。
(付記)
(付記1)
共分散構造分析を用いて、分析対象となる現象を表す構造のモデルを作成して前記現象を分析する情報処理装置にアクセス可能なモデル作成支援システムであって、
データを持つ複数の観測変数及びデータを持たない複数の潜在変数の和集合と、前記変数間の接続関係を表す複数のパスと、で表現されたモデルを参照モデルとして蓄積するモデル記録部と、
前記分析対象となる現象を表す前記複数の観測変数及び前記複数の潜在変数の和集合と、前記複数のパスと、で表現された作成途中の対象モデルを、前記情報処理装置から取得するモデル管理部と、
前記情報処理装置から前記対象モデルの作成支援を依頼されると、前記対象モデルと前記モデル蓄積部に蓄積された参照モデルとを比較し、前記対象モデルの構成要素の全体構造又は部分構造と類似する前記参照モデルの、全体構造又は部分構造を、類似構造として抽出する類似構造抽出部を含むモデル抽出部と、を備え、
前記モデル管理部は、前記類似構造抽出部により抽出された類似構造を、前記情報処理装置に通知する、モデル作成支援システム。
【0075】
(付記2)
前記モデル抽出部は、
前記類似構造が抽出された前記対象モデルの前記部分構造に名称未設定の未設定潜在変数がある場合、前記参照モデルにおいて、前記未設定潜在変数に相当する潜在変数を抽出し、
前記類似構造の元となった前記参照モデルの構成要素に潜在変数が存在する場合、前記対象モデルの同一箇所に存在しないことを確認して、前記潜在変数を抽出する潜在変数抽出部をさらに有し、
前記モデル管理部は、前記抽出された潜在変数を前記情報処理装置に通知する、付記1に記載のモデル作成支援システム。
【0076】
(付記3)
前記モデル抽出部は、前記独立構造から、前記観測変数及び前記潜在変数の和集合における相互のパスが有意性を有する構造を安定構造として抽出する安定構造抽出部をさらに有する、付記1又は2に記載のモデル作成支援システム。
(付記4)
前記モデル抽出部は、前記独立構造から、前記観測変数及び前記潜在変数相互の接続関係が有意な潜在変数を含む構造を抽出して安定構造を抽出する安定構造抽出部をさらに有する、付記3に記載のモデル作成支援システム。
【0077】
(付記5)
前記モデル抽出部は、複数の前記参照モデルから部分構造を抽出し、前記抽出された部分構造から共通性の高い共通構造を抽出する共通構造抽出部をさらに有する、付記1から4のいずれか1項に記載のモデル作成支援システム。
(付記6)
前記モデル抽出部は、複数の前記参照モデルから部分構造を抽出し、前記抽出された部分構造を集約した集約構造を抽出する集約構造抽出部をさらに有する、付記5に記載のモデル作成支援システム。
【0078】
(付記7)
前記モデル抽出部は、前記対象モデルのモデル作成方法と類似する作成方法の参照モデルを抽出する類似作成方法抽出部をさらに有する、付記1から6のいずれか1項に記載のモデル作成支援システム。
(付記8)
前記モデル抽出部は、所定の参照モデルの実データに対する性能を時系列的に監視するモデル性能監視部をさらに有する、付記1から7のいずれか1項に記載のモデル作成支援システム。
【0079】
(付記9)
前記モデル抽出部は、前記類似構造を含む前記モデルの構造的な特徴を格納するモデル構造データベースをさらに有する、付記1から8のいずれか1項に記載のモデル作成支援システム。
(付記10)
共分散構造分析を用いて、分析対象となる現象を表す構造のモデルを作成して前記現象を分析する情報処理装置にアクセス可能なコンピュータが実行するモデル作成支援方法であって、
データを持つ複数の観測変数及びデータを持たない複数の潜在変数の和集合と、前記変数間の接続関係を表す複数のパスと、で表現されたモデルを参照モデルとして蓄積するモデル記録ステップと、
前記コンピュータが備えるモデル管理部が、前記情報処理装置から、分析対象となる対象モデルの複数の前記観測変数及び複数の前記潜在変数の和集合と、複数の前記パスとで表現された作成途中の対象モデルを取得するモデル管理ステップと、
前記情報処理装置から前記対象モデルの作成支援を依頼されたとき、前記対象モデルと前記モデル蓄積部に蓄積された前記参照モデルとを比較し、前記対象モデルの構成要素の全体構造又は部分構造、と類似する前記参照モデルの全体構造又は部分構造を、類似構造として抽出する類似構造抽出部ステップと、を備え、
前記モデル管理部が前記類似構造抽出部により抽出された類似構造を前記情報処理装置に通知する通知ステップと、
を含むモデル作成支援方法。を含むモデル作成支援方法。
【0080】
(付記11)
共分散構造分析を用いて、分析対象となる現象を表す構造のモデルを作成して前記現象を分析する情報処理装置にアクセス可能なコンピュータが実行するモデル作成支援プログラムであって、
データを持つ複数の観測変数及びデータを持たない複数の潜在変数の和集合と、前記変数間の接続関係を表す複数のパスと、で表現されたモデルを参照モデルとして蓄積するモデル記録機能と、
前記コンピュータが備えるモデル管理部が、分析対象となる対象モデルの複数の前記観測変数と複数の前記潜在変数の和集合及び、複数の前記パスとで表現された作成途中の対象モデルを取得するモデル管理機能と、
前記情報処理装置から前記対象モデルの作成支援を依頼されたとき、前記対象モデルと前記モデル蓄積部に蓄積された参照モデルとを比較し、前記対象モデルの構成要素の全体構造又は部分構造、と類似する前記参照モデルの、全体構造又は部分構造を、類似構造として抽出する類似構造抽出機能と、
前記モデル管理部が前記類似構造抽出部により抽出された類似構造を、前記情報処理装置に通知する通知機能と、
を実現するモデル作成支援プログラム。
【産業上の利用可能性】
【0081】
開示されたモデル作成支援システムは、ある特定の現象を示すデータを分析してモデルを作成し、このモデルを用いて将来の現象を予測する情報処理装置によるモデル作成を、予測精度を高めて作成するのに有用である。
【図面の簡単な説明】
【0082】
【図1】開示のモデル作成支援システムの機能ブロック図。
【図2】モデルBの構造を示すパス図。
【図3】モデルBの構成要素のデータ表現例を示す図。
【図4】モデルBの構造方程式の一例を示す図。
【図5】モデルインスタンスデータベースの格納内容の一例を示す図。
【図6】モデルAの構造を示すパス図。
【図7】モデルAの構成要素のデータ表現例を示す図。
【図8】モデルAの構造方程式の一例を示す図。
【図9】モデルAとモデルBとの外的属性間距離を説明する図。
【図10】モデルAとモデルBとの構成要素間距離を説明する図。
【図11】モデルAとモデルBとのパス構造間距離を説明する図。
【図12】モデルAとモデルBとのパス係数間距離を説明する図。
【図13】モデルAとモデルBとのパス係数符号間距離を説明する図。
【図14】モデルAとモデルBとのパス係数有意性間距離を説明する図。
【図15】距離計算処理の流れを示すフローチャート。
【図16】モデル作成支援システムのメインルーチンのフローチャート。
【図17】部分構造抽出処理サブルーチンのフローチャート。
【図18】類似構造抽出処理サブルーチンのフローチャート。
【図19】共通・集約構造抽出処理サブルーチンのフローチャート。
【図20】類似作成方法抽出処理サブルーチンのフローチャート。
【図21】潜在変数抽出処理サブルーチンのフローチャート。
【図22】モデルCの構造を示すパス図。
【図23】モデルCの構造方程式を示す図。
【図24】モデルCから部分安定構造として抽出された部分を示すパス図。
【図25】モデルCの部分安定構造の構造方程式を示す図。
【図26】モデルBの類似構造の抽出された部分の構造を示すパス図。
【図27】モデルA,Bの類似する構造の構造行列を示す図。
【図28】モデルBの潜在変数の名称を推薦された部分の構造を示すパス図。
【図29】モデルD,Eを示すパス図。
【図30】モデルDの構造行列を示す図。
【図31】モデルEの構造行列を示す図。
【図32】モデルD,Eの共通構造の構造行列を示す図。
【符号の説明】
【0083】
1 モデル作成支援システム
4 ローカルモデル管理部
5 モデル記録部
7 モデル抽出部
15a〜15c 情報処理装置
72 部分安定・部分独立構造抽出部
73 類似モデル抽出部
74 潜在変数抽出部
78 類似構造抽出部
79 共通構造/集約構造抽出部
80 類似作成方法抽出部
【技術分野】
【0001】
例えば、店舗における月々の売上のように、変動する現象を予測するために使われるモデルの作成を支援するコンピュータシステムに関する。
【背景技術】
【0002】
近年、センサーネットワークの普及に伴い、産業上の様々な現象(例えば、売上、環境、機械、バイタル等に関する現象)を示すデータの収集が容易になりつつある。このようなデータは、小売店、保守現場等の様々な現場において有用な情報となりうる。そこで、このようなデータに対して、統計モデル(数式)を適用して、データで示される現象の本質を理解し、さらに、将来の現象の予測や特性の変化の早期発見することが試みられている。
【0003】
このような試みの1つとして、過去の現象を示すデータに対して回帰分析を行い、その現象を回帰方程式により表したモデルを作成することが挙げられる。このモデルを使うことによって、過去の現象の分析または、将来の現象を予測が可能になる。回帰方程式では、対象となる現象が目的変数(被説明変数)で表され、その現象に影響を与える因子は説明変数で表される。下記式(1)は、回帰方程式の一例であり、線形多重回帰の回帰方程式である。下記式(1)において、Yは目的変数、X1、X2は説明変数、a、b、cは定数である。特にbおよびcは偏回帰係数と呼ばれる。
【0004】
Y = a+b・X1+c・X2 ――――(1)
一例として、店舗における売上を予測する場合に、上記式(1)において、目的変数Yを売上の予測値とし、品揃え度合いを示す値を説明変数X1に、商品の平均価格を説明変数X2とすることができる。この場合、複数の店舗(例えば、複数のチェーン店)における過去の売上、品揃え、平均価格のデータを用いて、定数a、b、cを求めることができる。その結果、例えば、店舗経営者は、式(1)により、品揃えおよび商品価格それぞれの売上への寄与度合いを比較することができるし、品揃えおよび商品価格から売上を予測することもできる。
【0005】
このように、ある現象を分析または予測するためのモデルの回帰方程式を作成する場合、現象を説明する因子となる説明変数を何にするかが重要である。説明変数の選択の仕方によって予測精度が変わってくるからである。このような適切な説明変数の決定は、現場の分析者の経験、勘および試行錯誤に頼らざるを得なかった。
そこで、最適なモデルを得るために、予測モデルによる予測値と実測値との誤差を計算し、誤差が大きい場合に予測モデルを更新する予測装置が開示されている(例えば、特許文献1参照)。また、別の例として、複数の予測モデルに時系列実績データを適用した場合の予測データを用いて、提供する予測モデルを選択する方法も開示されている(例えば、特許文献2参照)。
【特許文献1】特開平9―95917号公報
【特許文献2】特開2001−22729号公報
【発明の開示】
【発明が解決しようとする課題】
【0006】
上記特許文献1および2は、ある特定の現象についての予測モデルを改良するための予測装置および方法である。したがって、蓄積された大量のモデルを使用して予測モデルを改良することができない。また、回帰分析処理により予測を行っているので、観測変数からモデルの主要な構造を抽出し、抽出された構造を用いて予測モデルを改良するのが困難である。
【0007】
本発明の課題は、蓄積されたモデルを使用してモデルの構造を抽出し、抽出された構造を用いて予測モデルを改良できる作成支援システム、モデル作成支援方法、モデル作成支援プログラムを提供することにある。
【課題を解決するための手段】
【0008】
開示したモデル作成支援システムでは、データを持つ複数の観測変数及びデータを持たない複数の潜在変数の和集合と、変数の接続関係を表す複数のパスと、で表現されたモデルが参照モデルとしてモデル記録部に蓄積される。この参照モデルは、過去に情報処理装置で作成されたモデルでもよいし、過去に別のシステムで作成されたモデルでもよい。情報処理装置が現象を、共分散構造を用いて分析してモデルを生成すると、対象モデルの観測変数と潜在変数とパスで表現された作成途中のモデルがモデル管理部で取得される。そして、情報処理装置から対象モデルの作成支援を依頼されると、モデル抽出部の類似構造抽出部が対象モデルと蓄積された参照モデルとを比較し、対象モデルの全体構造又は部分構造と類似する構造を有する参照モデルの全体構造又は部分構造を、類似構造として抽出し、抽出した類似構造がモデル管理部により情報処理装置に通知される。
【0009】
ここでは、対象モデルの作成途中に情報処理装置からモデルの作成支援を依頼されると、モデル記録部に蓄積された参照モデルと対象モデルとを比較し、参照モデルから対象モデルの全体構造又は部分構造と似ている類似構造を抽出できるので、蓄積された参照モデルを使用してモデルの構造を抽出して抽出された構造を用いて対象モデル(予測モデル)を改良できる。
【発明の効果】
【0010】
開示のシステムでは、蓄積された参照モデルと作成途中の対象モデルと比較し、参照モデルから対象モデルの全体構造又は部分構造と似ている類似構造を抽出できるので、蓄積された参照モデルを使用してモデルの構造を抽出して抽出された構造を用いて対象モデルを改良できる。
【発明を実施するための最良の形態】
【0011】
図1は、本実施形態に係るモデル作成支援システムの機能構成、すなわち、モデル作成支援プログラムの構成を現場の情報処理装置とともに示すブロック図である。モデル作成支援システム1は、情報処理装置15a、15bおよび15cに、たとえばネットワークを介して接続されている。情報処理装置15a〜15cは、それぞれ、現場のある特定の現象を示すデータを分析してモデルを作成し、このモデルを用いて将来の現象を予測する装置である。このモデルは、対象となる現象に寄与する因子に対応する観測変数と潜在変数とを用いた多変量解析で得られた共分散構造のデータである。
【0012】
(情報処理装置の構成)
情報処理装置15aは、各現場のモデルを作成及び更新するモデル作成・更新部151と、作成した各現場のモデルに各現場の実データを適用して実証分析を行うモデル実証部152と、作成した各現場のモデルを管理するローカルモデル管理部153と、を有している。また、現場の実データを格納する実データベース154と、現場の統計モデルの部品構成、検定値等の評価尺度、モデル作成方法、及びモデル解釈情報を格納するモデルデータベース155と、モデル作成支援システム1との入出力を行うためのインターフェース(IF)部156と、を有している。
【0013】
(情報処理装置の動作)
情報処理装置15aの概略動作について、一例としてB大学でのアンケート結果により学生の嗜好を抽出するモデルBを作成する場合を例に説明する。この場合、情報処理装置15aのモデル作成更新部151は、共分散構造を用いてアンケート結果から、たとえば、図2に示すようなモデルBを作成していく。
【0014】
ここで、共分散構造のモデルは、複数の観測変数及び複数の潜在変数の和集合と、変数間の接続関係を表す複数のパスと、で表現される。
図2では、矩形枠で記載されたアンケートの問題が観測変数である。観測変数は、直接観測することが可能であり多変量データとして測定値すなわちデータを持っている変数である。一方、楕円枠で記載されたものが潜在変数である。潜在変数は、モデルに導入された直接観測されないデータを持たない変数である。この潜在変数は観測変数や他の潜在変数等の間にあって、他の変数の間に相関をもたらす潜在した共通原因として導入される。パスは、変数間の接続関係やその接続関係の信頼性や有意性を表すように構成されている。
【0015】
ここで、図2に示したモデルBは、図3に示すような構成要素のデータに基づいて表現され、情報処理装置15a及びモデル作成システム1では、この表現を数式として記述した図4に示すような構造方程式で表されて記述されている。なお、構造方程式は、変数のベクター=設定箇所にパス係数を記した構造行列×変数のベクター+誤差のベクターで表している。
【0016】
図3のモデルBの構造方程式の構成要素(観測変数、潜在変数、及びパス)において、変数は、たとえば、素材の識別情報と、モデルインスタンスの識別情報と、変数タイプと、変数の名称と、観測変数の名称を示す実データの識別情報とで構成されている。また、パスは、たとえば、素材識別情報と、パス識別情報と、パスの起点の変数と、パスの終点の変数と、変数の関連性を表す係数値と、パス係数の検定当計量と、パス係数の有意性(信頼性)とで構成されている。有意性は検定統計量に基づいて決定されている。
【0017】
具体的には、図2において、数値は、各変数間のパスの係数値を示している。また、有意性を示す「*」は、この実施形態では、三段階で有意性を評価している。
図4の構造行列のj行i列の成分は、j番目の構成要素(変数)からi番目の構成要素(変数)に引かれたパスの係数値を示している。また、eQ1,eQ2・・・は、各構成要素(変数)につながる誤差を示している。なお、潜在変数には誤差が設定されないため潜在変数そのものが置かれている。また、各パスの検定統計量は、それぞれのパスのIDとともにモデルインスタンスデータベース52に記録される。
【0018】
共分散構造分析においては、構造方程式のモデルから計算される、変数間の分散共分散と、実際に観測される分散、共分散を比較して、尤度などの基準を満たすように、パスの係数値の適切な推定値を決定する。その際、個々の推定値が統計的に無意味ではないと検定されるほど、パスの検定値は高くなる。
情報処理装置15aの操作者のモデル作成操作によって、アンケート結果を対象とした構造方程式モデルの観測変数と、潜在変数と、が決まり、モデルをアンケート結果に適用することで、分析結果(推定結果)が決まる。これらモデルの部品と分析結果(推定結果)が図3に示す構成要素のデータ表現例で示され、モデルデータベース155に格納される。それらは、数式の比較や利用者への情報提示などの必要に応じて、図4に示す構造方程式として展開され、利用される。
【0019】
図2から図4に示されたモデルBの作成の途中の状態で、操作者が情報処理装置15aからネットワークを介してモデル作成支援システム1をアクセスして作成支援を依頼すると、モデル作成支援システム1が動作して類似の部分構造を有する図6に示すモデルAを抽出し、さらに類似するモデルAの全体構造又は部分構造を抽出して情報処理装置15a〜15cに提示する。
【0020】
(モデル作成支援システムの構成)
モデル作成支援システム1は、図1に示すように、各情報処理装置15a〜15cで使用されるモデルの作成や更新を支援するためのシステムである。モデル作成支援システム1は、各情報処理装置15a〜15cからモデルに関する情報を集めて蓄積しておき、情報処理装置15aから種々の要求があると、蓄積した情報を使って情報処理装置15a〜15cそれぞれで有用なモデルを作成するための支援データを生成し、各情報処理装置15a〜15cに出力する。
【0021】
モデル作成支援システム1は、インターフェース部156にネットワークを介して接続されたインターフェース部2と、ローカルモデル対応部3と、モデル管理部4と、モデル記録部5と、距離計算部6と、モデル抽出部7と、を備えている。
(ローカルモデル対応部の構成)
ローカルモデル対応部3は、現場の情報処理装置15a〜15cに対応してモデル作成支援システム1側で各情報処理装置15a〜15cのモデルの作成・改良の支援をモデル管理部4に要求するものである。ローカルモデル対応部3は、現場のモデル情報を取得するローカルモデル情報取得部31と、蓄積された参照モデルから現場の対象モデルのよりよい代替モデルを作成するローカルモデル提案部32と、を有している。ローカルモデル情報取得部31は、各情報処理装置15a〜15cで作成した現場のモデルの各部品の構成や検定値等の評価尺度、モデル作成方法及び解釈情報を取得する。
【0022】
(モデル管理部の構成)
モデル管理部4は、ローカルモデル対応部3を介して情報処理装置15a〜15cで作成した対象モデルを取得するとともに、各情報処理装置15a〜15cへの支援情報の通知等の管理を行う。また、モデル管理部4は、ローカルモデル対応部3やモデル記録部5やモデル抽出部7の動作を管理する。
【0023】
(モデル記録部の構成)
モデル記録部5は、各情報処理装置15a〜15cのモデルの部品とローカルモデル情報取得部31で取得した現場のモデルやそれとは別に取得したモデル等の各部品の構成や検定値等の評価尺度、モデル作成方法及び解釈情報を格納する。具体的には、モデル記録部5は、モデルの部品を管理するためのモデル部品データベース51と、モデルの構成変数等のモデルのインスタンスを管理するモデルインスタンスデータベース52と、を備えている。モデル部品データベース51には、前述した図3に示すような内容、すなわち、モデルの観測変数名や潜在変数名やパスの起点と終点の変数名などがモデル部品のIDに関連付けて格納されている。これらは、構造方程式のパーツを格納するデータベースである。すなわち、構造方程式は、これらのデータベースにあるパーツを利用して構築される。
【0024】
モデル部品データベース51には、部品としての観測変数(たとえ、アンケートの質問等)の情報を格納する観測変数データベース53と、部品としての潜在変数(たとえば、共感力、創造力、創発力、感性力等の、観測変数に使われる変数のキーワード(例:経常利益、人間に興味がある、年齢、授業は面白かったか)と、各観測変数が取り扱う情報の種別(例:自然数、整数、離散、質的変数)を格納する潜在変数データベース54と、部品としての変数間のパスのうち実績があるものを格納するパスデータベース55と、格納したモデルに関連する外部情報(たとえば、[業種間距離情報:売り上げ規模:小売り<地域スーパー<百貨店<大型スーパー]、[業界地理情報:IYスーパー:千葉県、UNスーパー:愛知県])を格納するモデル関連外部情報データベース56と、を含んでいる。なお、パスは原則としてどの変数間にも引けるので、パスデータベース55にはあくまで事例の参考としてパスが記録されており、パスデータベース55に存在しない起点と終点の変数の間にパスを引いてはいけないということではない。
【0025】
モデルインスタンスデータベース52には、図5に示すように、作成済みモデルの題名、観測変数、潜在変数、パス、パスの検定値、実データ(たとえばアンケート結果)、モデルのパターン、モデルの作成方法、及びモデルの解釈情報が格納されている。また、図4に示したようなモデル毎の構造方程式の展開を可能とする、各モデルの構成要素のデータが、図3に示す形式で格納されている。
【0026】
(距離計算部の構成)
距離計算部6は、モデル全体、部分、及び各変数間の距離を計算するものである。具体的には、モデルの距離では、複数のモデルの一致性を基準にして計算する。また、次に、モデルの構成要素がきわめて類似しているもの、モデルの統計的なつながりがきわめて類似しているものは、一致度が高い。距離には、外的属性間距離と、変数属性間距離と、パス構造間距離と、パス係数間距離と、パス係数符号間距離と、パス係数有意性間距離と、モデル性能間距離と、の7種類の距離尺度がある。これらの7種類の距離のうち、モデル性能間距離を除く距離尺度は、モデルの全体構造ではなく部分構造にも適用することができる。
【0027】
これらの7種類の距離の説明を以下に行う。
外的属性間距離は、モデルの題名や対象業界、対象標本、実行時期等の一致性に基づく距離である。外的属性間距離の完全一致の状態とは、対象とする属性が完全に一致する場合である。しかし、標本まで一致するということは同じモデルであることになるので、通常、外的属性間距離が0になることはないと考えられる。
【0028】
変数属性間距離は、構造方程式を構成する観測変数の識別情報群や潜在変数の識別情報などの識別情報の属性の一致性に基づく距離である。変数属性間距離の完全一致の状態とは、2つのモデルにおいて、観測変数のID群、及び、潜在変数群のIDが完全に一致している状態のことである。これは複数のモデルの比較において現実にありうると考えられる。なお、変数間属性距離は、観測変数間距離、潜在変数間距離の2つから構成される。
【0029】
パス構造間距離は、構造方程式を構成する観測変数及び潜在変数の間に引かれたパスの一致性に基づく距離である。パス構造間距離の完全一致の状態とは、パスの元になる構成要素(潜在変数や観測変数)が完全に一致している状態のことである。従って完全に一致しておらず類似の関係にある場合は、その類似距離の影響を受ける。また、不一致のパスは、不一致パス数として計算され互いのモデル距離を遠ざける。
【0030】
パス係数間距離は、構造方程式を構成する観測変数及び潜在変数の間に引かれたパスに対して推定された係数値の一致性に基づく距離である。パス係数間距離の完全一致の状態とは、パス構造間距離と同様に、パスの元になる構成要素(潜在変数や観測変数)が完全に一致している状態のことである。従って完全に一致しておらず類似の関係にある場合は、その類似距離の影響を受ける。また、不一致のパスは、不一致パス数として計算され互いのモデル距離を遠ざける。
【0031】
パス係数符号間距離は、構造方程式を構成する観測変数及び潜在変数の間に引かれたパスに対して推定された係数の符号の一致性に基づく距離である。パス係数符号間距離の完全一致の状態とは、パス構造間距離と同様に、パスの元になる構成要素(潜在変数や観測変数)が完全に一致している状態のことである。従って完全に一致しておらず類似の関係にある場合は、その類似距離の影響を受ける。また、不一致のパスは、不一致パス数として計算され互いのモデル距離を遠ざける。
【0032】
パス係数有意性間距離は、構造方程式を構成する観測変数及び潜在変数の間に引かれたパスに対して推定された係数の検定値の有意な箇所の一致性に基づく距離である。パス係数有意性間距離の完全一致の状態とは、パス構造間距離と同様に、パスの元になる構成要素(潜在変数や観測変数)が完全に一致している状態のことである。従って完全に一致しておらず類似の関係にある場合は、その類似距離の影響を受ける。また、不一致のパスは、不一致パス数として計算され互いのモデル距離を遠ざける。
【0033】
モデル性能間距離とは、構造方程式全体の成績を表す尺度である適合度検定値などの性能尺度の一致性に基づく距離である。モデル性能間距離が完全一致の状態とは、それぞれのモデルの性能尺度の値が一致している状態のことである。
以下に、モデルBと、図6から図8に示す兵庫県A芸術大学学生調査のアンケート調査結果の作成済みのモデルであるモデルAとの間での距離計算について説明する。なお、3以上のモデルが与えられても、基本的には、2つのモデルずつの間の距離を計算し、その結果を座標空間にマッピングすることにより、3つ以上のモデルの距離を求めることができる。3つ以上のモデルのモデル間距離を算出する場合は、平均値、偏差、最大値、最小値、中央値を指標とすればよい。
【0034】
モデルAは、図6に示すような関係で図示される。また、モデルAの構成要素のデータは、図3と同様に図7に示される。さらに、その構造方程式は図4と同様に図8に示される。
外的属性間距離の場合、たとえば図9に示すように、2つのモデルA,Bに対して5種類の指標の一致性を計算し、それらの類似性の平均値を距離と見なす。なお、個々の距離計算において、必要であれば、モデル関連外部情報データベース56に蓄えられた蓄積データを利用する。
【0035】
ここでは、5種類の指標として、たとえばモデルの題名、モデル用途、モデル作成者、調査対象、モデルの調査時期を選択している。そして、モデルの題名及び用途に関しては、完全に一致しているので、距離を1に設定している。また、モデル作成者は、福祉大学と、芸術大学であるので、類似度で半分程度あるとして距離を0.5と設定している。調査対象は280名と300名であるので、(280/300)×1.0として距離を0.933に設定する。調査時期は、1年のずれを0と評価し、1ヶ月のずれは、双方の月の遅い方から1年前を起点とした場合、9/12と計算されるので、距離は0.75と設定される。
【0036】
これらの5種類の距離の平均を計算することにより、外的属性間距離は、(1+1+0.5+0.93+0.75)/5=0.837と算出される。
構成要素間距離の場合、双方のモデルのキーワードが一致するように配置し、双方の距離を計算し、その平均値を構成要素間距離とする。モデルAとモデルBでの並べ替え結果の構成要素間距離の一例を図10に示す。この例では、潜在変数は名称的には全く一致していない。一方、観測変数間の一致度は高く、13の観測変数のうち11の観測変数で一致している。したがって、観測変数の距離は、11/13=0.846と設定され、潜在変数の距離は、0と設定される。
【0037】
パス構造間距離の場合、双方のモデルのパスが一致するように配置し、双方の距離を計算する。通常、終点と起点の名称が一致していれば、距離は1となる。モデルAとモデルBでの配置結果の一例を図11に示す。この例の場合には、名称未設定な潜在変数を含む一部の潜在変数間のパスのみに距離が計算されている。ここでは、全体の距離は、パス1から5までが0.5×5=2.5であり、その他が−11であるので0となる。最も高い部分の距離は0.5となる。
【0038】
パス係数間距離の場合、双方のモデルの同じ箇所ないし類似箇所のパスが一致するように配置し、双方の相関係数(それぞれの値の組み合わせを2つのベクトルとみなしたときの、2つのベクトルの向く方向の一致性)を計算し、その値をパス係数間距離とする。モデルAとモデルBでの並べ替え結果のパス係数間距離の一例を図12に示す。図12では、全体の相関係数で距離を表すと、0.3911になるが、但し、双方にパス係数がある上位5つのパスのみでベクトルを作って計算した場合に関して言えば、相関係数で表された距離は0.849となり、高い値を示す。
【0039】
パス符号間距離は、双方のパス係数の符号の正負の一致性を測る指標である。パス符号間距離の場合、図13に示すように、双方のモデルのパスが一致するように配置し、符号が一致していれば1、不一致なら−1とする。該当がない場合も−1とする。そして全体平均を、符号間距離とする。この例では全体平均は負になるので、0となる。但し、双方にパス係数がある上位5つのパスに関して言えば、一致度は1である。
【0040】
パス係数有意性間距離では、各パス係数は、t検定を行い、信頼区間に基づく検定値が計算される。その値に対して、図14に示すように、5%有意であれば1点、1%有意であれば2点を与える。そして、双方のモデルのパスが一致するように配置し、双方の検定値について、図14に示す指標dを計算し、それぞれの値の平均値をパス係数有意性間距離とする。図14に示す例では、全体では、距離は0.281になり、双方にパス係数が上位の5つのパスでは、0.9になる。
【0041】
モデル性能間距離は、各モデルは、完全適合モデルからどのくらいずれるのかを示すものであり、例えば、適合度カイ二乗という指標で評価することができる。その適合度検定におけるp値の有意性について、パス係数有意生間距離の場合と同様に5%有意であれば1点、1%有意であれば3点を与える。そして、双方のモデルのパスが一致するように配置し、双方の検定値について、前述した指標dを計算し、それぞれの値の平均値をモデル性能間距離とする。この距離は、0〜1の間の値を取るようになっている。また、この測度は、構造方程式全体に関わるものであり、部分構造について適用することは統計学的厳密性を損ねることになる。従って、全体モデルに対してのみ使える指標である。なお、モデルAは作成済みの完成したモデルであるのに対し、モデルBは作成途中のモデルであるので、モデルBの評価できない。従って、AとBのモデル性能間距離は測れない。
【0042】
このような構成の距離計算部6では、モデル抽出部7からの計算依頼があると、依頼に応じて複数のモデルの全体構造又は部分構造の距離を計算する。
距離計算部6でモデルの距離計算を行う場合、たとえば、図15に示すように、ステップP1で、計算対象のモデルのペアを作成する。ステップP2では、与えられたモデルペアについて、前述した7種の距離尺度のうち、計算可能な尺度を計算可能な距離尺度について計算を行う。ステップP3では、各距離尺度において、重視する尺度に基づいて加重平均値を計算し、モデルペア間距離とする。また、部分構造が抽出されると、部分構造毎に同様な処理を行う。ステップP4では、モデル群が3つ以上の場合、各ペアの距離に基づいて、マッピングを行い。平均値、偏差、最大値、最小値、中央値を計算して、代表指標とする。
【0043】
(モデル抽出部の構成)
モデル抽出部7は、モデル又はモデルの少なくとも一部分を種々の特性に基づいて抽出するものである。モデル抽出部7は、モデル構造特性抽出・活用促進部71と、モデル安定/部分独立構造抽出部72と、類似モデル抽出部73と、潜在変数抽出部74と、着目モデル性能監視部75と、を有している。
【0044】
モデル構造特性抽出・活用促進部71は、モデルの構造的な特徴により抽出された、たとえば類似モデルの推薦等を行う。モデル構造特性抽出・活用促進部71には、モデル構造データベース76と、モデル性能データベース77とが接続されている。モデル構造データベース76には、抽出されたモデルの構造的な特性(たとえば、類似構造や部分安定構造や部分独立構造等)が格納されている。モデル性能データベース77には、抽出されたモデルの時間的に変化する性能が格納されている。
【0045】
モデル安定/部分独立構造抽出部72は、モデルの中で部分的に安定している構造や部分的に独立性が高い構造を抽出する。類似モデル抽出部73は、あるモデルについて他のモデルの中から類似したモデルを抽出する。具体的には、距離計算部6に対象モデル(たとえばモデルB)に類似する参照モデルとの距離の計算を依頼し、その距離計算結果により類似する参照モデルの全体構造又は部分構造を類似構造として抽出する。また、ある参照モデルと別の参照モデルとの距離の計算を距離計算部6に依頼して共通構造や集約構造を抽出する。さらに、参照モデルと対象モデルの作成方法を比較して作成方法が類似する参照モデルを類似作成方法のモデルとして抽出する。類似モデル抽出部73は、類似構造抽出部78と、共通構造/集約構造抽出部79と、類似作成方法抽出部80とを有している。
【0046】
類似構造抽出部78は、前述したように距離計算部6からの距離計算結果に基づいて、情報処理装置15a〜15cから取得したモデル(対象モデルの一例)と構造的に類似したモデルをモデル記録部5に蓄積されたモデル(参照モデルの一例)から抽出するものである。
共通構造/集約構造抽出部79は、モデル記録部5に蓄積された複数のモデル群について、共通性が高いモデルやそれぞれを集約的(相補的)に重ね合わせて抽出されたモデルを取り出す。類似作成方法抽出部80は、モデルの作成方法について類似するモデルを抽出する。
【0047】
潜在変数抽出部74は、対象モデルと類似する参照モデルを参考に、潜在変数を抽出する。着目モデル性能監視部75は、何らかの基準(たとえば、あるモデルと類似するモデルという基準)で着目するようになったモデルに対して性能を監視するものである。仮想モデルの場合は、構成要素となっている複数の実モデルの性能から類推して組み立てたモデルの性能を監視する。
【0048】
(モデル作成支援システムの動作)
次に、モデル作成支援システム1の動作について、図16から図21に示す処理手順を示すフローチャートに基づいて説明する。
モデル支援作成システム1では、図16のステップS1で情報処理装置15a〜15cからの支援依頼を待つ。情報処理装置15a〜15cの操作者は、モデル作成中に支援を受けたい場合は、その旨を、ネットワークを介してモデル作成支援システム1に通知する。その通知が来るとステップS2に移行する。ステップS2では、情報処理装置15a〜15cのモデルデータベース155にある対象モデルの潜在変数や観測変数やパス(接続関係の一例)をローカルモデル情報取得部31で取得する。ステップS3では、情報処理装置15aから15cから部分構造抽出依頼があるか否かを判断する。ステップS4では、情報処理装置15aから15cから類似モデル抽出依頼があるか否かを判断する。ステップS5では、情報処理装置15aから15cから潜在変数抽出依頼があるか否かを判断する。
【0049】
部分構造抽出依頼があった場合には、ステップS3からステップS6に移行する。ステップS6では、図17に示す、部分構造抽出処理を実行する。類似モデル抽出依頼があったときは、ステップS4からステップS7に移行する。ステップS7では、情報処理装置15aから15cから類似構造抽出依頼があったか否かを判断する。ステップS8では、情報処理装置15aから15cから共通構造/集約構造抽出依頼があったか否かを判断する。ステップS9では、情報処理装置15aから15cから類似作成方法抽出依頼があったか否かを判断する。
【0050】
類似構造抽出依頼があった場合には、ステップS7からステップS10に移行する。ステップS10では、図18に示す類似構造抽出処理を実行する。共通構造/集約構造抽出依頼があった場合には、ステップS8からステップS11に移行する。ステップS11では、図19に示す共通構造/集約構造抽出処理を実行する。類似作成方法抽出依頼があった場合には、ステップS9からステップS12に移行する。ステップS10では、図20に示す類似作成方法抽出処理を実行する。
【0051】
潜在変数抽出依頼があった場合には、ステップS5からステップS13に移行する。ステップS13では、図21に示す潜在変数抽出処理を実行する。
図17に示す部分構造抽出処理は、モデルの構造を比較しやすくするために行われる処理である。情報処理装置15a〜15cの操作者は、複雑なモデル同士を比較する際に部分構造の抽出依頼をする。部分構造抽出処理では、部分独立構造又は部分安定構造を抽出する。図11において、ステップS21で部分構造の抽出依頼が独立構造の抽出依頼であるのか安定構造の抽出依頼であるのかを判断する。ここで、独立構造というのは、あるモデルの1又は複数の変数からなる部分構造が他の部分構造に対して関連性が少なく独立していると見なされる部分構造をいう。また、安定構造とは、独立構造の中からさらにパスの統計的な優位性を示す信頼性すなわち検定値が高く安定している組み合わせのことである。安定構造の抽出依頼があると判断すると、ステップS21からステップS22に移行する。
【0052】
ステップS22では、パスの統計的な優位性もパスの識別条件に加える。独立構造の抽出依頼であるとするとステップS21からステップS23に移行する。ステップS23では、モデルの各変数のパス先とパス数を調査する。ステップS24では、各変数の片方向又は双方向の一次隣接変数群からn次隣接変数群を探索し、それらの偏在性を計算することにより共通構造を抽出する。ステップS25では、共通構造から片方向でもよいから独占的にパスを張っている変数を探し、その変数を共通構造の関連変数と見なして部分独立構造又は部分安定構造として抽出する。ステップS26では、部分構造の抽出依頼が終了したか否かを判断し、終了依頼があるとメインルーチンに戻り、終了依頼が無い場合はステップS21に戻る。
【0053】
図22に示したいちごショートケーキの総合的なおいしさを調査するためのアンケート結果のモデルCを用いて実際の部分構造抽出処理の内容を説明する。ここでは、モデルCの全体構造は、アンケートの問である観測変数Q1〜Q16及び潜在変数L1〜L7の和集合と、それらの変数のつなぐパスとを有している。図23にモデルCの構造方程式を示している。そして、ステップS23で各変数のパス先とパス数とを調査し、ステップS25で共通構造を抽出し、ステップS26で共通構造にパスを張っている変数を探すと、図24及び図25に示すように、潜在変数L1からL3と、観測変数Q1−Q3,Q6,Q7で構成される部分構造が抽出される。図24及び図25において、破線で囲んだ部分の独立性が高いのでこの部分を切り出して部分構造として抽出する。この部分構造は、パス係数の値が大きく、かつt検定値の有意性が高いため、部分安定構造であると判断される。この部分安定構造は、モデル名とともにモデル構造データベース76に記録される。
【0054】
また、図24及び図25には図示されていないが、潜在変数L4及び観測変数Q4,Q5が部分安定構造として抽出される。さらに、潜在変数L5,L6及び観測変数Q8,Q10,Q13,Q15は、潜在変数L5と観測変数Q13のパスに統計的な有意性が見られないため、部分安定構造ではなく、部分独立構造として抽出される。これらも、モデル構造データベース76に記録される。
【0055】
また、図6に示すモデルAの場合、同様にして、潜在変数L3,L4及び観測変数Q7−Q12を部分独立構造として抽出したり、潜在変数L1,L2及び観測変数Q1,Q3−Q6を部分安定構造として抽出したりすることが可能である。同様に、図2に示すモデルBの場合、潜在変数L5及び観測変数Q7,Q9と、潜在変数L6及び観測変数Q10−Q12を部分独立構造として抽出することが可能である。
【0056】
ここでは、複雑なモデル構造から他の部分構造との関連性が少ない独立構造を抽出しているので、部分構造の比較を容易に行うことができる。また、安定構造を抽出した場合には、信頼性が高い独立構造を使用して比較を行うことにより、より信頼性が高いモデルを構築できる。
図18に示す類似構造抽出処理では、作成中の対象モデルの部分構造に対して、すでに結果が出ている参照モデルの部分構造と、を距離計算部6に距離計算を依頼した結果を見て類似構造を抽出する。
【0057】
類似構造の抽出依頼があると、図18のステップS31で、類似構造を抽出する際に有意性も判定条件にあるか否かを判断する。情報処理装置15a〜15cの操作者は有意性を判定条件にするか否かを予め設定することも可能である。優位性も判定条件に含まれる場合は、ステップS32に移行し、パス係数の検定値が大きなパスは、有意性の大小も判定に利用するように設定し、ステップS33に移行する。なお、ステップS32では、有意性を判定条件に含める場合であっても、検定値がまだ決まっていない未検定パスがあるとき、統計値は使用しないと言う限定条件が付加される。有意性が判定条件にない場合は、ステップS32をスキップしてステップS33に移行する。
【0058】
ステップS33では参照モデルの部分構造の全てを探索し終わったか否かを判断する。参照モデルの全ての部分構造を探索し終わった場合はステップS31に戻る。まだ部分構造が残っている場合はステップS34に移行する。ステップS34では、対象モデルの部分構造及び参照モデルの部分構造の計算結果から共通変数を抽出する。ステップS35では、対象モデルの部分構造と参照モデルの部分構造の比較のために、おのおのの構造行列において、等価もしくは類似の変数(=観測変数、潜在変数)が同一行に並ぶように順番を入れ替える。ここで、類似性は計算された変数の名前の距離で判定し、いずれかの構造が有する名称未設定の潜在変数は、パス関係の距離の計算結果により類似性を判断して、いずれかの構造が有する潜在変数と対応づけて配置する。
【0059】
ステップS36では、構造行列の各変数の比較により、同一の構造を抽出する。ステップS37では、対象モデル側の共通構造の隣接変数を集める(1次〜n次隣接)。ステップS38では、参照モデル側の共通構造の隣接変数を集める(1次〜n次隣接)。ステップS39では、対象モデルと参照モデルのそれぞれの隣接変数を比較し、対象モデルにおける隣接性が低く、参照モデルにおける隣接性(かつ安定性)が高い隣接変数を抽出する。ステップS40では、抽出群の中から、対象構造との共通度が高い類似構造と、共通度が高い隣接変数を選択して類似構造として抽出する。ステップS41では、部分構造の抽出依頼が終了したか否かを判断し、終了依頼があるとメインルーチンに戻り、終了依頼が無い場合はステップS31に戻る。
【0060】
図2に示すモデルBを作成中の情報処理装置15a〜15cのいずれかから類似構造の抽出依頼をすると、距離計算部6によりモデルBと参照モデルとの距離が計算され、図6から図8に示すようなA芸術大学のモデルAの調査結果が類似モデルとして抽出される。そして、抽出されたモデルAの構造から図26に示す部分構造が類似構造として抽出される。具体的には、図27に示すように、構造行列を見て、モデルAの潜在変数L3,L4と、モデルBの潜在変数L5,L6とは観測変数との間に有意なパスの距離がしきい値を超えており、接続パターンが似ていると判断し、類似構造を抽出する。
【0061】
類似構造が抽出されると、図28に示すように、モデル作成支援システム1は、抽出された類似構造に基づき、潜在変数の名称の推薦及び観測変数に対する潜在変数の設定の推薦するために、これらのデータはモデル構造特性抽出・活用促進部71からモデル提案部32に送られ、情報処理装置15aに出力される。情報処理装置15aの操作者は推薦された名称及び潜在変数を見て、それでよければ、推薦された名称及び変数を作成途中のモデルBに当てはめる。
【0062】
ここでは、現場の情報処理装置が作成した対象モデルを蓄積されたモデルから得られる参照モデルと比較し、参照モデルから対象モデルの部分構造と似ている類似構造を抽出できるので、蓄積されたモデルを使用してモデルの構造を抽出して抽出された構造を用いて予測モデルを改良できる。
図19の共通・集約構造抽出処理では、モデル作成支援システム内にある複数のモデルのモデル間に共通の部分構造がある場合にその共通構造を抽出する。この処理は、ローカルモデル対応部3の依頼による行われる場合と、直接依頼をうけないが、よりよい推薦のために、夜間バッチなどで実行される場合とがある。その結果は、モデル構造特性抽出・活用促進部71に送られ、よい良いモデル提案に利用される。共通構造又は集約構造の抽出依頼があると、図19のステップS51で、類似構造を抽出する際に有意性も判定条件にあるか否かを判断する。情報処理装置15a〜15cの操作者は有意性を判定条件にするか否かを予め設定する。優位性も判定条件に含まれる場合は、ステップS52に移行し、検定値が大きい有意パスは、統計値も判定に利用するように設定し、ステップS53に移行する。なお、ステップS52では、有意性を判定条件に含める場合であっても、検定値がまだ決まっていない未検定パスがあるとき、統計値は使用しないと言う限定条件が付加される。有意性が判定条件にない場合は、ステップS52をスキップしてステップS53に移行する。
【0063】
ステップS53では対象モデルの部分構造の全てを探索し終わったか否かを判断する。参照モデルの全ての部分構造を探索し終わった場合はステップS51に戻る。まだ部分構造が残っている場合はステップS54に移行する。ステップS54では、対象モデルの部分構造の共通変数を抽出する。ステップS55では、複数の対象モデルの部分構造の比較のために、おのおのの構造行列において、等価もしくは類似の変数(=観測変数、潜在変数)が同一行に並ぶように順番を入れ替える。ここで、類似性は変数の名前の距離で判定し、いずれかの構造が有する名称未設定の潜在変数は、パス関係の類似性によって、いずれかの構造が有する潜在変数と対応づけて配置する。
【0064】
ステップS56では、構造行列の各変数の比較により、共通構造を抽出する。ステップS57では、対象モデル側の共通構造の隣接変数を集めて共通構造を抽出する(1次〜n次隣接)。ステップS58では、依頼が共通構造か集約構造かを判断する。集約構造の依頼の場合は、ステップS59に移行し、複数の対象モデルの構造における共通構造の隣接変数を集める(1次〜n次隣接)。ステップS60では、複数の対象モデルのそれぞれの隣接変数を比較し、構造間で共通性が高いものを比較し、共通構造に隣接変数を付加して集約構造として抽出ステップSステップS61に移行する。共通構造の依頼の場合は、ステップS58からステップS61に移行する。ステップS61では、共通・集約構造の抽出依頼が終了したか否かを判断し、終了依頼があるとメインルーチンに戻り、終了依頼が無い場合はステップS51に戻る。
【0065】
次に、図29に示すように、神戸−大阪間の阪神高速神戸線及び湾岸線のモデルDと、大阪−京都間の名神高速及び第2京阪のモデルEと、から共通構造を抽出する場合を例に説明する。この場合、図30に示した調査Dの構造行列と、図31に示した調査Eの構造行列とからステップS55で、等価若しくは類似する変数が同一行に並ぶように順番を入れ替える。この入れ替え結果を図32に示す。図32では、図29に灰色で示した変数を並べ替えて同一行に並ぶように配置している。そして、潜在変数L1−L3と観測変数Q1−Q3,Q5,Q7を含む共通構造を抽出している。
【0066】
ここでは、複数のモデルから共通構造やその周辺も含めた集約構造を抽出できるので、信頼性が高いモデルの部品を作成することができ、それらを使用してさらに信頼性が高いモデルを構築できるようになる。
図20の類似作成方法抽出処理では、図20のステップS71で、モデル記録部4にある全参照モデルの構造の探索が終了したか否かを判断する。全ての参照モデルの構造を探索していない場合は、ステップS72に移行する。ステップS72では、モデルインスタンスデータベース52を参照して参照モデルの構造の作成方法が判明しているか否かを判断する。作成方法が判明していない場合は、ステップS72からステップS73に移行して探索処理を回避しステップS72に戻る。作成方向が判明している場合は、ステップS72からステップS74に移行する。ステップS74では、参照モデルの構造の作成方法と対象モデルの構造の作成方法とを比較する。ステップS75では、比較結果により、参照モデルと対象モデルとで作成方法が同じか否かを判断する。同じ場合は、ステップS76に移行し、参照モデルと対象モデルとで出発点モデルが同一か否かを判断する。ここで出発点モデルとは、共分散構造分析をどの状態で作成し始めたかである。共分散構造分析は、パスの引き方の自由度が大きく、通常は、試行錯誤を経てモデルが作成される。しかし、何がしかのモデルパターン(例:飽和モデル、MIMICモデル)を出発点として、少しずつパスを削りながら安定したモデルに至った経緯が記述してあれば、それも、あるモデルと、別のモデルの類似性を示す根拠になる。
【0067】
出発点モデルが同一の場合は、ステップS77に移行する。ステップS78では使用している評価指針が類似又は同一か否かを判断する。この指針は、通常は、適合度カイ二乗検定であるが、他にも、GFI,AGFIなどの指標が使われることがある。指標が同一の場合はステップS78に移行する。ステップS78では、実行手順が同一か否かを判断する。ここで、実行手順とは、パスを変化させていく過程のことであり、通常はラ分析者がヒューリスティック(ランダム)に「行うが、ある方針のもとで行う場合は、この手順も、あるモデルと別のモデルの作成法右方における類似性を測る根拠になる。実行手段が同一の場合は、ステップS79に移行し、参照モデルの構造を作成方向の類似した構造として記録する。ステップS80では、終了依頼がなされたか否かを判断する。終了依頼がなされていない場合はステップS71に戻り、終了依頼がなされた場合はメインルーチンに戻る。
【0068】
一方、ステップS75からステップS78の判断が同一でないと判断されると、ステップS80に移行する。また、全ての参照モデルの構造の探索を終了するとステップS71からステップS81に移行する。ステップS81では、作成方法の類似性のランキングを、S75〜S78の評価結果の総合値として計算し、ランキング上位の参照モデル群を抽出する。この処理が終わると、ステップS80に移行する。
【0069】
なお、この結果(例:上位3位の参照モデル群)も、現場モデルの作成支援に利用される。例えば、モデル構造特性抽出・活用促進部71を介してローカルモデル提案部32が情報処理装置15a〜15cに推薦する。
ここでは、作成方法が類似する既知の参照モデルを抽出できるので、それを参照してモデルを構築でき、より信頼性が高いモデルを容易に作成できる。
【0070】
図21の潜在変数抽出処理では、図21のステップS91で対象モデルに対して 少なくとも一つの類似構造を有するモデル有るか否かを判断する。類似構造がある場合は、ステップS92に移行する。ステップS92では、対象モデルの名称未設定な潜在変数について、参照モデルの構造的に同じ場所に名称付き潜在変数が設定されているか否かを判断する。参照モデルの同じ場所に名称付きの潜在変数がある場合には、ステップS93に移行する。ステップS93では、参照モデル側の潜在変数の名称を対象モデルへの推薦オブジェクトとする。
【0071】
名称付きの潜在変数がない場合は、ステップS92からステップS94に移行する。ステップS94では、対象モデルと参照モデルを比較し、観測変数や潜在変数の類似性が高く、 参照モデルにのみ存在する潜在変数があるか否かを判断する。類似性が高い潜在変数が参照モデルだけにある場合はステップS95に移行する。ステップS95では、参照モデル側の潜在変数と既存の変数に張られているパスとを対象モデルへの推薦オブジェクトとする。類似性が高い潜在変数が参照モデルだけにない場合にはステップS96に移行する。ステップS96では、推薦オブジェクトがある場合は、モデル構造特性抽出・活用促進部71に伝える。すると、モデル構造特性抽出・活用促進部71が推薦オブジェクトをローカルモデル提案部32に出力し、ローカルモデル提案部32が情報処理装置15a〜15cに推薦する。
【0072】
ここでは、図28に示すように、対象モデルであるモデルBに、参照モデルである図2に示すモデルAと類似した部分構造(類似構造)がある場合、モデルBに対して潜在変数の名称が推薦される。具体的には、モデルBの名称なしの潜在変数L5,L6と同じ場所にあるモデルAの名称付きの潜在変数L3,L4の名称が、モデルBの潜在変数の名称として推薦される。このため、情報処理装置15a〜15cの操作者は、この推薦を受けて名称の採否を決定でき、潜在変数の名称設定の作業を簡素化でき、モデル作成の効率を向上させることができ、作成工数の削減を図ることができる。
【0073】
また、同じ場所に名称付きの潜在変数がなくても、対象モデルの観測変数や潜在変数と類似性が高い潜在変数が 参照モデルにのみ存在する場合は、対象モデルの図7に波線で示す部分に参照モデルの類似性が高い潜在変数を推薦している。具体的には、参照モデル側の潜在変数と既存の変数に張られているパスとを対象モデルへの推薦オブジェクトとしている。このため、潜在変数を考えることなく、潜在変数及び観測変数や潜在変数とのパスを生成できるので、分析性能や予測精度が高いモデルを容易に作成できる。
【0074】
以上の実施形態に関し、さらに以下の付記を開示する。
(付記)
(付記1)
共分散構造分析を用いて、分析対象となる現象を表す構造のモデルを作成して前記現象を分析する情報処理装置にアクセス可能なモデル作成支援システムであって、
データを持つ複数の観測変数及びデータを持たない複数の潜在変数の和集合と、前記変数間の接続関係を表す複数のパスと、で表現されたモデルを参照モデルとして蓄積するモデル記録部と、
前記分析対象となる現象を表す前記複数の観測変数及び前記複数の潜在変数の和集合と、前記複数のパスと、で表現された作成途中の対象モデルを、前記情報処理装置から取得するモデル管理部と、
前記情報処理装置から前記対象モデルの作成支援を依頼されると、前記対象モデルと前記モデル蓄積部に蓄積された参照モデルとを比較し、前記対象モデルの構成要素の全体構造又は部分構造と類似する前記参照モデルの、全体構造又は部分構造を、類似構造として抽出する類似構造抽出部を含むモデル抽出部と、を備え、
前記モデル管理部は、前記類似構造抽出部により抽出された類似構造を、前記情報処理装置に通知する、モデル作成支援システム。
【0075】
(付記2)
前記モデル抽出部は、
前記類似構造が抽出された前記対象モデルの前記部分構造に名称未設定の未設定潜在変数がある場合、前記参照モデルにおいて、前記未設定潜在変数に相当する潜在変数を抽出し、
前記類似構造の元となった前記参照モデルの構成要素に潜在変数が存在する場合、前記対象モデルの同一箇所に存在しないことを確認して、前記潜在変数を抽出する潜在変数抽出部をさらに有し、
前記モデル管理部は、前記抽出された潜在変数を前記情報処理装置に通知する、付記1に記載のモデル作成支援システム。
【0076】
(付記3)
前記モデル抽出部は、前記独立構造から、前記観測変数及び前記潜在変数の和集合における相互のパスが有意性を有する構造を安定構造として抽出する安定構造抽出部をさらに有する、付記1又は2に記載のモデル作成支援システム。
(付記4)
前記モデル抽出部は、前記独立構造から、前記観測変数及び前記潜在変数相互の接続関係が有意な潜在変数を含む構造を抽出して安定構造を抽出する安定構造抽出部をさらに有する、付記3に記載のモデル作成支援システム。
【0077】
(付記5)
前記モデル抽出部は、複数の前記参照モデルから部分構造を抽出し、前記抽出された部分構造から共通性の高い共通構造を抽出する共通構造抽出部をさらに有する、付記1から4のいずれか1項に記載のモデル作成支援システム。
(付記6)
前記モデル抽出部は、複数の前記参照モデルから部分構造を抽出し、前記抽出された部分構造を集約した集約構造を抽出する集約構造抽出部をさらに有する、付記5に記載のモデル作成支援システム。
【0078】
(付記7)
前記モデル抽出部は、前記対象モデルのモデル作成方法と類似する作成方法の参照モデルを抽出する類似作成方法抽出部をさらに有する、付記1から6のいずれか1項に記載のモデル作成支援システム。
(付記8)
前記モデル抽出部は、所定の参照モデルの実データに対する性能を時系列的に監視するモデル性能監視部をさらに有する、付記1から7のいずれか1項に記載のモデル作成支援システム。
【0079】
(付記9)
前記モデル抽出部は、前記類似構造を含む前記モデルの構造的な特徴を格納するモデル構造データベースをさらに有する、付記1から8のいずれか1項に記載のモデル作成支援システム。
(付記10)
共分散構造分析を用いて、分析対象となる現象を表す構造のモデルを作成して前記現象を分析する情報処理装置にアクセス可能なコンピュータが実行するモデル作成支援方法であって、
データを持つ複数の観測変数及びデータを持たない複数の潜在変数の和集合と、前記変数間の接続関係を表す複数のパスと、で表現されたモデルを参照モデルとして蓄積するモデル記録ステップと、
前記コンピュータが備えるモデル管理部が、前記情報処理装置から、分析対象となる対象モデルの複数の前記観測変数及び複数の前記潜在変数の和集合と、複数の前記パスとで表現された作成途中の対象モデルを取得するモデル管理ステップと、
前記情報処理装置から前記対象モデルの作成支援を依頼されたとき、前記対象モデルと前記モデル蓄積部に蓄積された前記参照モデルとを比較し、前記対象モデルの構成要素の全体構造又は部分構造、と類似する前記参照モデルの全体構造又は部分構造を、類似構造として抽出する類似構造抽出部ステップと、を備え、
前記モデル管理部が前記類似構造抽出部により抽出された類似構造を前記情報処理装置に通知する通知ステップと、
を含むモデル作成支援方法。を含むモデル作成支援方法。
【0080】
(付記11)
共分散構造分析を用いて、分析対象となる現象を表す構造のモデルを作成して前記現象を分析する情報処理装置にアクセス可能なコンピュータが実行するモデル作成支援プログラムであって、
データを持つ複数の観測変数及びデータを持たない複数の潜在変数の和集合と、前記変数間の接続関係を表す複数のパスと、で表現されたモデルを参照モデルとして蓄積するモデル記録機能と、
前記コンピュータが備えるモデル管理部が、分析対象となる対象モデルの複数の前記観測変数と複数の前記潜在変数の和集合及び、複数の前記パスとで表現された作成途中の対象モデルを取得するモデル管理機能と、
前記情報処理装置から前記対象モデルの作成支援を依頼されたとき、前記対象モデルと前記モデル蓄積部に蓄積された参照モデルとを比較し、前記対象モデルの構成要素の全体構造又は部分構造、と類似する前記参照モデルの、全体構造又は部分構造を、類似構造として抽出する類似構造抽出機能と、
前記モデル管理部が前記類似構造抽出部により抽出された類似構造を、前記情報処理装置に通知する通知機能と、
を実現するモデル作成支援プログラム。
【産業上の利用可能性】
【0081】
開示されたモデル作成支援システムは、ある特定の現象を示すデータを分析してモデルを作成し、このモデルを用いて将来の現象を予測する情報処理装置によるモデル作成を、予測精度を高めて作成するのに有用である。
【図面の簡単な説明】
【0082】
【図1】開示のモデル作成支援システムの機能ブロック図。
【図2】モデルBの構造を示すパス図。
【図3】モデルBの構成要素のデータ表現例を示す図。
【図4】モデルBの構造方程式の一例を示す図。
【図5】モデルインスタンスデータベースの格納内容の一例を示す図。
【図6】モデルAの構造を示すパス図。
【図7】モデルAの構成要素のデータ表現例を示す図。
【図8】モデルAの構造方程式の一例を示す図。
【図9】モデルAとモデルBとの外的属性間距離を説明する図。
【図10】モデルAとモデルBとの構成要素間距離を説明する図。
【図11】モデルAとモデルBとのパス構造間距離を説明する図。
【図12】モデルAとモデルBとのパス係数間距離を説明する図。
【図13】モデルAとモデルBとのパス係数符号間距離を説明する図。
【図14】モデルAとモデルBとのパス係数有意性間距離を説明する図。
【図15】距離計算処理の流れを示すフローチャート。
【図16】モデル作成支援システムのメインルーチンのフローチャート。
【図17】部分構造抽出処理サブルーチンのフローチャート。
【図18】類似構造抽出処理サブルーチンのフローチャート。
【図19】共通・集約構造抽出処理サブルーチンのフローチャート。
【図20】類似作成方法抽出処理サブルーチンのフローチャート。
【図21】潜在変数抽出処理サブルーチンのフローチャート。
【図22】モデルCの構造を示すパス図。
【図23】モデルCの構造方程式を示す図。
【図24】モデルCから部分安定構造として抽出された部分を示すパス図。
【図25】モデルCの部分安定構造の構造方程式を示す図。
【図26】モデルBの類似構造の抽出された部分の構造を示すパス図。
【図27】モデルA,Bの類似する構造の構造行列を示す図。
【図28】モデルBの潜在変数の名称を推薦された部分の構造を示すパス図。
【図29】モデルD,Eを示すパス図。
【図30】モデルDの構造行列を示す図。
【図31】モデルEの構造行列を示す図。
【図32】モデルD,Eの共通構造の構造行列を示す図。
【符号の説明】
【0083】
1 モデル作成支援システム
4 ローカルモデル管理部
5 モデル記録部
7 モデル抽出部
15a〜15c 情報処理装置
72 部分安定・部分独立構造抽出部
73 類似モデル抽出部
74 潜在変数抽出部
78 類似構造抽出部
79 共通構造/集約構造抽出部
80 類似作成方法抽出部
【特許請求の範囲】
【請求項1】
共分散構造分析を用いて、分析対象となる現象を表す構造のモデルを作成して前記現象を分析する情報処理装置にアクセス可能なモデル作成支援システムであって、
データを持つ複数の観測変数及びデータを持たない複数の潜在変数の和集合と、前記変数間の接続関係を表す複数のパスと、で表現されたモデルを参照モデルとして蓄積するモデル記録部と、
前記分析対象となる現象を表す前記複数の観測変数及び前記複数の潜在変数の和集合と、前記複数のパスと、で表現された作成途中の対象モデルを、前記情報処理装置から取得するモデル管理部と、
前記情報処理装置から前記対象モデルの作成支援を依頼されると、前記対象モデルと前記モデル蓄積部に蓄積された参照モデルとを比較し、前記対象モデルの構成要素の全体構造又は部分構造と類似する前記参照モデルの、全体構造又は部分構造を、類似構造として抽出する類似構造抽出部を含むモデル抽出部と、を備え、
前記モデル管理部は、前記類似構造抽出部により抽出された類似構造を、前記情報処理装置に通知する、モデル作成支援システム。
【請求項2】
前記モデル抽出部は、
前記類似構造が抽出された前記対象モデルの前記部分構造に名称未設定の未設定潜在変数がある場合、前記参照モデルにおいて、前記未設定潜在変数に相当する潜在変数を抽出し、
前記類似構造の元となった前記参照モデルの構成要素に潜在変数が存在する場合、前記対象モデルの同一箇所に存在しないことを確認して、前記潜在変数を抽出する潜在変数抽出部をさらに有し、
前記モデル管理部は、前記抽出された潜在変数を前記情報処理装置に通知する、請求項1に記載のモデル作成支援システム。
【請求項3】
前記モデル抽出部は、前記参照モデルの複数の構造から、他の構造と関連するパスが少ない、1又は複数の観測変数及び潜在変数の和集合を含む構造を独立構造として抽出する独立構造抽出部をさらに有する、請求項1又は2に記載のモデル作成支援システム。
【請求項4】
前記モデル抽出部は、前記独立構造から、前記観測変数及び前記潜在変数の和集合における相互のパスが有意性を有する構造を安定構造として抽出する安定構造抽出部をさらに有する、請求項3に記載のモデル作成支援システム。
【請求項5】
前記モデル抽出部は、複数の前記参照モデルから部分構造を抽出し、前記抽出された部分構造から共通性の高い共通構造を抽出する共通構造抽出部をさらに有する、請求項1から4のいずれか1項に記載のモデル作成支援システム。
【請求項6】
前記モデル抽出部は、複数の前記参照モデルから部分構造を抽出し、前記抽出された部分構造を集約した集約構造を抽出する集約構造抽出部をさらに有する、請求項1から4のいずれか1項に記載のモデル作成支援システム。
【請求項7】
前記モデル抽出部は、前記対象モデルのモデル作成方法と類似する作成方法の参照モデルを抽出する類似作成方法抽出部をさらに有する、請求項1から6のいずれか1項に記載のモデル作成支援システム。
【請求項8】
前記モデル抽出部は、所定の参照モデルの実データに対する性能を時系列的に監視するモデル性能監視部をさらに有する、請求項1から7のいずれか1項に記載のモデル作成支援システム。
【請求項9】
共分散構造分析を用いて、分析対象となる現象を表す構造のモデルを作成して前記現象を分析する情報処理装置にアクセス可能なコンピュータが実行するモデル作成支援方法であって、
データを持つ複数の観測変数及びデータを持たない複数の潜在変数の和集合と、前記変数間の接続関係を表す複数のパスと、で表現されたモデルを参照モデルとして蓄積するモデル記録ステップと、
前記コンピュータが備えるモデル管理部が、前記情報処理装置から、分析対象となる対象モデルの複数の前記観測変数及び複数の前記潜在変数の和集合と、複数の前記パスとで表現された作成途中の対象モデルを取得するモデル管理ステップと、
前記情報処理装置から前記対象モデルの作成支援を依頼されたとき、前記対象モデルと前記モデル蓄積部に蓄積された前記参照モデルとを比較し、前記対象モデルの構成要素の全体構造又は部分構造、と類似する前記参照モデルの全体構造又は部分構造を、類似構造として抽出する類似構造抽出部ステップと、を備え、
前記モデル管理部が前記類似構造抽出部により抽出された類似構造を前記情報処理装置に通知する通知ステップと、
を含むモデル作成支援方法。を含むモデル作成支援方法。
【請求項10】
共分散構造分析を用いて、分析対象となる現象を表す構造のモデルを作成して前記現象を分析する情報処理装置にアクセス可能なコンピュータが実行するモデル作成支援プログラムであって、
データを持つ複数の観測変数及びデータを持たない複数の潜在変数の和集合と、前記変数間の接続関係を表す複数のパスと、で表現されたモデルを参照モデルとして蓄積するモデル記録機能と、
前記コンピュータが備えるモデル管理部が、分析対象となる対象モデルの複数の前記観測変数と複数の前記潜在変数の和集合及び、複数の前記パスとで表現された作成途中の対象モデルを取得するモデル管理機能と、
前記情報処理装置から前記対象モデルの作成支援を依頼されたとき、前記対象モデルと前記モデル蓄積部に蓄積された参照モデルとを比較し、前記対象モデルの構成要素の全体構造又は部分構造、と類似する前記参照モデルの、全体構造又は部分構造を、類似構造として抽出する類似構造抽出機能と、
前記モデル管理部が前記類似構造抽出部により抽出された類似構造を、前記情報処理装置に通知する通知機能と、
を実現するモデル作成支援プログラム。
【請求項1】
共分散構造分析を用いて、分析対象となる現象を表す構造のモデルを作成して前記現象を分析する情報処理装置にアクセス可能なモデル作成支援システムであって、
データを持つ複数の観測変数及びデータを持たない複数の潜在変数の和集合と、前記変数間の接続関係を表す複数のパスと、で表現されたモデルを参照モデルとして蓄積するモデル記録部と、
前記分析対象となる現象を表す前記複数の観測変数及び前記複数の潜在変数の和集合と、前記複数のパスと、で表現された作成途中の対象モデルを、前記情報処理装置から取得するモデル管理部と、
前記情報処理装置から前記対象モデルの作成支援を依頼されると、前記対象モデルと前記モデル蓄積部に蓄積された参照モデルとを比較し、前記対象モデルの構成要素の全体構造又は部分構造と類似する前記参照モデルの、全体構造又は部分構造を、類似構造として抽出する類似構造抽出部を含むモデル抽出部と、を備え、
前記モデル管理部は、前記類似構造抽出部により抽出された類似構造を、前記情報処理装置に通知する、モデル作成支援システム。
【請求項2】
前記モデル抽出部は、
前記類似構造が抽出された前記対象モデルの前記部分構造に名称未設定の未設定潜在変数がある場合、前記参照モデルにおいて、前記未設定潜在変数に相当する潜在変数を抽出し、
前記類似構造の元となった前記参照モデルの構成要素に潜在変数が存在する場合、前記対象モデルの同一箇所に存在しないことを確認して、前記潜在変数を抽出する潜在変数抽出部をさらに有し、
前記モデル管理部は、前記抽出された潜在変数を前記情報処理装置に通知する、請求項1に記載のモデル作成支援システム。
【請求項3】
前記モデル抽出部は、前記参照モデルの複数の構造から、他の構造と関連するパスが少ない、1又は複数の観測変数及び潜在変数の和集合を含む構造を独立構造として抽出する独立構造抽出部をさらに有する、請求項1又は2に記載のモデル作成支援システム。
【請求項4】
前記モデル抽出部は、前記独立構造から、前記観測変数及び前記潜在変数の和集合における相互のパスが有意性を有する構造を安定構造として抽出する安定構造抽出部をさらに有する、請求項3に記載のモデル作成支援システム。
【請求項5】
前記モデル抽出部は、複数の前記参照モデルから部分構造を抽出し、前記抽出された部分構造から共通性の高い共通構造を抽出する共通構造抽出部をさらに有する、請求項1から4のいずれか1項に記載のモデル作成支援システム。
【請求項6】
前記モデル抽出部は、複数の前記参照モデルから部分構造を抽出し、前記抽出された部分構造を集約した集約構造を抽出する集約構造抽出部をさらに有する、請求項1から4のいずれか1項に記載のモデル作成支援システム。
【請求項7】
前記モデル抽出部は、前記対象モデルのモデル作成方法と類似する作成方法の参照モデルを抽出する類似作成方法抽出部をさらに有する、請求項1から6のいずれか1項に記載のモデル作成支援システム。
【請求項8】
前記モデル抽出部は、所定の参照モデルの実データに対する性能を時系列的に監視するモデル性能監視部をさらに有する、請求項1から7のいずれか1項に記載のモデル作成支援システム。
【請求項9】
共分散構造分析を用いて、分析対象となる現象を表す構造のモデルを作成して前記現象を分析する情報処理装置にアクセス可能なコンピュータが実行するモデル作成支援方法であって、
データを持つ複数の観測変数及びデータを持たない複数の潜在変数の和集合と、前記変数間の接続関係を表す複数のパスと、で表現されたモデルを参照モデルとして蓄積するモデル記録ステップと、
前記コンピュータが備えるモデル管理部が、前記情報処理装置から、分析対象となる対象モデルの複数の前記観測変数及び複数の前記潜在変数の和集合と、複数の前記パスとで表現された作成途中の対象モデルを取得するモデル管理ステップと、
前記情報処理装置から前記対象モデルの作成支援を依頼されたとき、前記対象モデルと前記モデル蓄積部に蓄積された前記参照モデルとを比較し、前記対象モデルの構成要素の全体構造又は部分構造、と類似する前記参照モデルの全体構造又は部分構造を、類似構造として抽出する類似構造抽出部ステップと、を備え、
前記モデル管理部が前記類似構造抽出部により抽出された類似構造を前記情報処理装置に通知する通知ステップと、
を含むモデル作成支援方法。を含むモデル作成支援方法。
【請求項10】
共分散構造分析を用いて、分析対象となる現象を表す構造のモデルを作成して前記現象を分析する情報処理装置にアクセス可能なコンピュータが実行するモデル作成支援プログラムであって、
データを持つ複数の観測変数及びデータを持たない複数の潜在変数の和集合と、前記変数間の接続関係を表す複数のパスと、で表現されたモデルを参照モデルとして蓄積するモデル記録機能と、
前記コンピュータが備えるモデル管理部が、分析対象となる対象モデルの複数の前記観測変数と複数の前記潜在変数の和集合及び、複数の前記パスとで表現された作成途中の対象モデルを取得するモデル管理機能と、
前記情報処理装置から前記対象モデルの作成支援を依頼されたとき、前記対象モデルと前記モデル蓄積部に蓄積された参照モデルとを比較し、前記対象モデルの構成要素の全体構造又は部分構造、と類似する前記参照モデルの、全体構造又は部分構造を、類似構造として抽出する類似構造抽出機能と、
前記モデル管理部が前記類似構造抽出部により抽出された類似構造を、前記情報処理装置に通知する通知機能と、
を実現するモデル作成支援プログラム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【図21】
【図22】
【図23】
【図24】
【図25】
【図26】
【図27】
【図28】
【図29】
【図30】
【図31】
【図32】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【図21】
【図22】
【図23】
【図24】
【図25】
【図26】
【図27】
【図28】
【図29】
【図30】
【図31】
【図32】
【公開番号】特開2009−266158(P2009−266158A)
【公開日】平成21年11月12日(2009.11.12)
【国際特許分類】
【出願番号】特願2008−118238(P2008−118238)
【出願日】平成20年4月30日(2008.4.30)
【出願人】(000005223)富士通株式会社 (25,993)
【Fターム(参考)】
【公開日】平成21年11月12日(2009.11.12)
【国際特許分類】
【出願日】平成20年4月30日(2008.4.30)
【出願人】(000005223)富士通株式会社 (25,993)
【Fターム(参考)】
[ Back to top ]