評価装置及びそのコンピュータプログラム
【課題】評価対象データに対して、予め定められる特定の尺度に対応する複数の視点からのスコアの算出を行うことで、複数の視点からの分析を可能とする評価装置を提供する。
【解決手段】入力部10は、複数の指標によって示されるデータを含む評価対象データと、評価対象データを評価する基準となるモデル構成用データとを入力する。部分空間構成部11は、入力部10が入力するモデル構成用データを、予め定められる所定の尺度に基づいて複数のデータ群に分類し、分類される前記データ群ごとに、当該データ群に含まれるモデル構成用データに基づいてデータ群ごとの部分空間を構成する。部分空間修正部14は、精度を高めるように部分空間の修正を行う。スコア算出部18は、部分空間のそれぞれと、評価対象データから生成されるベクトルとが成す角度を算出し、算出した角度に基づいてスコアを算出する。
【解決手段】入力部10は、複数の指標によって示されるデータを含む評価対象データと、評価対象データを評価する基準となるモデル構成用データとを入力する。部分空間構成部11は、入力部10が入力するモデル構成用データを、予め定められる所定の尺度に基づいて複数のデータ群に分類し、分類される前記データ群ごとに、当該データ群に含まれるモデル構成用データに基づいてデータ群ごとの部分空間を構成する。部分空間修正部14は、精度を高めるように部分空間の修正を行う。スコア算出部18は、部分空間のそれぞれと、評価対象データから生成されるベクトルとが成す角度を算出し、算出した角度に基づいてスコアを算出する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、例えば企業の財務情報などの評価を行う評価装置及びそのコンピュータプログラムに関する。
【背景技術】
【0002】
従来、企業における大量の財務情報に基づいて、統計的な手法により特定の尺度に基づいて企業ごとのスコアを算出し、与信や投資の格付けなどを行うことが行われている。例えば、企業の倒産可能性をランキングする場合、ある特定の尺度として倒産可能性が高いものから非倒産の可能性が高いものを示す1つの尺度を適用し、統計的な手法により、企業の倒産確率をスコアとして算出して、与信を判断することが行われる。
【0003】
このような統計的な手法の従来技術として、特許文献1に記載の「定性データを使用した倒産確率予測システム」などで使用されているロジットモデルがある。
【0004】
ロジットモデルでは、以下のような手順で企業のスコアを算出する。
(1)与えられたモデル構成用のデータ、すなわち倒産対象企業の財務指標などの指標1から指標nまでの値を使って以下の式(1)に示されるようなモデルを構成する。ここで、式(1)のxnは分析に用いる指標であり、anは指標に係る係数であり、モデルの構成とは、具体的には以下の式(1)においてa1からanまでの係数パラメータを推定することである。
【0005】
【数1】
【0006】
(2)式(1)に対して評価対象企業のデータを代入してスコアを算出する。
上記の(1)及び(2)の手順により、あるモデルに基づいた評価対象企業ごとのスコアを算出することが可能となる(非特許文献1参照)。
【特許文献1】特開2003−216804号公報
【非特許文献1】木島正明、小守林克哉、“信用リスク評価の数理モデル”,出版社:朝倉書店
【発明の開示】
【発明が解決しようとする課題】
【0007】
しかしながら、上記の従来技術では、ある特定の尺度として倒産可能性が高いものから非倒産の可能性が高いものを示す1つの尺度を適用した場合に得られる単独のモデルを用いるため、算出したスコアによる分析の結果を解釈する際に利用可能な情報は、モデルに付与される係数の大小のみであり、十分に分析の結果を解釈できないという問題があった。
【0008】
また、上記の従来技術では、分析に使用する指標を決定する際、複数の分析結果や統計量の比較に基づいて、事前に分析に有効と考えられるものを人手によって設計されており、試行錯誤を要するという問題がある。
【0009】
また、さらに、上記の従来技術では、構成したモデルを用いて企業ごとのスコアを算出した結果、十分な精度が得られなかった場合、算出されたスコアに基づいてモデルを修正することができないという問題がある。
【0010】
本発明は、上記問題を解決すべくなされたもので、その目的は、評価対象データに対して、予め定められる特定の尺度に対応する複数の視点からのスコアの算出を行うことで、複数の視点からの分析を可能とする評価装置及びそのコンピュータプログラムを提供することにある。
【0011】
また、本発明は、人手によらずに有効な指標を抽出することを可能とする評価装置及びそのコンピュータプログラムを提供することにある。
【0012】
また、本発明は、構成したモデルに基づいて算出されるスコアにおいて十分な精度が得られない場合に、モデルを修正することを可能とする評価装置及びそのコンピュータプログラムを提供することにある。
【課題を解決するための手段】
【0013】
上記問題を解決するために、本発明は、複数の指標によって示されるデータを含む評価対象データと、前記評価対象データを評価する基準となるモデル構成用データとを入力する入力手段と、前記入力手段が入力する前記モデル構成用データを、予め定められる所定の尺度に基づいて複数のデータ群に分類し、分類される前記データ群ごとに、当該データ群に含まれる前記モデル構成用データに基づいて前記データ群ごとの部分空間を構成する部分空間構成手段と、前記部分空間構成手段によって構成される複数の部分空間のそれぞれと、前記入力手段が入力する評価対象データから生成されるベクトルとが成す角度を算出し、算出した角度に基づいて当該評価対象データのスコアを算出するスコア算出手段と、を備えたことを特徴とする評価装置である。
【0014】
本発明は、上記に記載の発明において、前記部分空間構成手段により構成される複数の部分空間と、前記入力手段が入力する前記モデル構成用データと、予め前記モデル構成用データごとに定められる前記モデル構成用データが本来属する前記データ群を示す情報と、に基づいて所定の演算を行うことにより前記部分空間を空間内で移動させ、前記モデル構成用データが移動後の部分空間に基づいて分類されることにより属することとなるデータ群を示す情報と、前記本来属するデータ群の情報との一致する割合が一定割合になるまで前記部分空間を移動させる部分空間修正手段を備え、前記スコア算出手段は、前記部分空間修正手段による移動後の複数の部分空間のそれぞれと、前記入力手段が入力する評価対象データから生成されるベクトルとが成す角度を算出し、算出した角度に基づいて当該評価対象データのスコアを算出することを特徴とする。
【0015】
本発明は、上記に記載の発明において、前記スコア算出手段は、前記複数の部分空間が2つ存在する場合、一方の部分空間と、前記入力手段が入力する評価対象データから生成されるベクトルとが成す第1の角度と、他方の部分空間と、前記入力手段が入力する評価対象データから生成されるベクトルとが成す第2の角度とを算出し、算出した前記第1の角度と第2の角度の差を算出し、算出した差をスコアとすることを特徴とする。
【0016】
本発明は、上記に記載の発明において、前記部分空間のそれぞれと、前記指標ごとの基底ベクトルとに基づいて、前記指標ごとの関連度を算出し、算出した前記部分空間ごとの関連度に基づいて、前記指標ごとの有効度を算出する有効指標抽出手段を備えたことを特徴とする。
【0017】
本発明は、上記に記載の発明において、前記有効指標抽出手段は、前記部分空間が2つ存在する場合に、前記指標ごとに一方の部分空間の関連度から他方の部分空間の関連度を減算し、減算して得られた値を前記指標ごとの有効度として出力することを特徴とする。
【0018】
本発明は、評価装置のコンピュータに、複数の指標によって示されるデータを含む評価対象データと、前記評価対象データを評価する基準となるモデル構成用データとを入力するステップと、入力される前記モデル構成用データを、予め定められる所定の尺度に基づいて複数のデータ群に分類し、分類される前記データ群ごとに、当該データ群に含まれる前記モデル構成用データに基づいて前記データ群ごとの部分空間を構成するステップと、構成される複数の部分空間のそれぞれと、前記入力手段が入力する評価対象データから生成されるベクトルとが成す角度を算出し、算出した角度に基づいて当該評価対象データのスコアを算出するステップと、を実行させるためのコンピュータプログラムである。
【発明の効果】
【0019】
この発明によれば、評価装置は、複数の指標によって示されるデータを含む評価対象データと、評価対象データを評価する基準となるモデル構成用データとを入力する。入力するモデル構成用データを、予め定められる所定の尺度に基づいて複数のデータ群に分類し、分類されるデータ群ごとに、当該データ群に含まれるモデル構成用データに基づいてデータ群ごとの部分空間を構成する。そして、構成される複数の部分空間のそれぞれと、前記入力手段が入力する評価対象データから生成されるベクトルとが成す角度を算出し、算出した角度に基づいて当該評価対象データのスコアを算出する構成とした。これにより、モデル構成用データから予め定められる所定の尺度に対応して構成される複数の部分空間に基づいて、評価対象データごとのスコアを算出することができ、所定の尺度に対応する複数の視点からのスコアを得て、複数の視点からの分析を可能とすることができる。
【0020】
また、本発明によれば、評価装置は、構成される複数の部分空間と、入力されるモデル構成用データと、予めモデル構成用データごとに定められるモデル構成用データが本来属するデータ群を示す情報と、に基づいて所定の演算を行うことにより部分空間を空間内で移動させる。また、モデル構成用データが移動後の部分空間に基づいて分類されることにより属することとなるデータ群を示す情報と、本来属するデータ群の情報との一致する割合が一定割合になるまで部分空間を移動させる構成とした。これにより、構成したモデル、すなわち部分空間に基づいて算出されるスコアにおいて十分な精度が得られない場合に、部分空間を移動させることでモデルを修正し、算出されるスコアの精度を向上させることができる。
【0021】
また、本発明によれば、評価装置は、複数の部分空間が2つ存在する場合、一方の部分空間と、入力される評価対象データから生成されるベクトルとが成す第1の角度と、他方の部分空間と、入力される評価対象データから生成されるベクトルとが成す第2の角度とを算出し、算出した第1の角度と第2の角度の差を算出し、算出した差をスコアとする構成とした。これにより、第1の角度と、第2の角度とに基づいて、所定の尺度における加点及び減点の両面の分析が可能となる。
【0022】
また、本発明によれば、評価装置は、部分空間のそれぞれと、指標ごとの基底ベクトルとに基づいて、指標ごとの関連度を算出し、算出した部分空間ごとの関連度に基づいて、指標ごとの有効度を算出する構成とした。これにより、それぞれの部分空間に対応するモデルの特徴を指標ごとの有効度として定量的に示すことができ、人手によらずに有効な指標を抽出することが可能となる。
【0023】
また、本発明によれば、評価装置は、部分空間が2つ存在する場合に、指標ごとに一方の部分空間の関連度から他方の部分空間の関連度を減算し、減算して得られた値を指標ごとの有効度として出力する構成とした。これにより、これにより、それぞれの部分空間に対応するモデルの特徴を有効度として定量的に示すことができる。また、さらに差分によって示されるモデル間における重要な指標を定量的及び視覚的に把握することが可能となり、設計工数を削減することが可能となる。
【発明を実施するための最良の形態】
【0024】
以下、本発明の一実施形態を図面を参照して説明する。
図1は、本実施形態による評価装置100を示す概略ブロック図である。評価装置100は例えば、企業の財務情報などの評価に用いられる装置であり、以下評価対象のデータとして企業のデータを適用して記載する。
【0025】
評価装置100において、入力部10は、モデル構成用企業データと、評価対象企業データ及びモデル構成用パラメータを入力し、モデル構成用パラメータ及びモデル構成用企業データをモデル構成用企業データベース(以下、DBと記載)13に記録し、評価対象企業データを評価対象企業DB17に記録する。
【0026】
部分空間構成部11は、入力部10から入力されるモデル構成用データに基づいて、特定の尺度に基づいた部分空間を2つ構成する。ここで、特定の尺度とは、例えば、評価として企業の倒産可能性を評価する場合、倒産確率を特定の尺度とすることができる。倒産確率を特定の尺度とした場合、倒産する確率は0〜100%の値で示され、当該値に基づいて、例えば、倒産確率が50%以上の評価対象を「尺度の値の大きい側」として倒産企業群とし、倒産確率が50%未満の評価対象を「尺度の値の小さい側」として非倒産企業群とすることで2つの部分空間に分けることが可能となる。
【0027】
部分空間修正部12は、部分空間構成部11が構成した部分空間を、後述する適応的学習手法により、最終的に出力されるスコアの精度を高めるように部分空間を修正し、部分空間情報として部分空間データベース(以下、DBと記載)14に記録する。
【0028】
有効指標抽出部15は、部分空間DB14から部分空間情報を読み出し、読み出した部分空間情報に対応する部分空間の関連度とその差分を算出し、算出した関連度と差分とを有効指標DB16に記録する。スコア算出部18は、部分空間DB14から部分空間情報を読み出し、評価対象企業DB17から評価対象企業データを読み出し、読み出した部分空間情報に対応する部分空間における評価対象企業データのスコアを算出し、算出したスコアをスコア算出結果出力部19に出力する。スコア算出結果出力部19は、スコア算出部18から入力されるスコアを値の順に並べて画面等に出力するか、あるいは記憶媒体等に記録する。
【0029】
なお、部分空間構成部11は、入力部10から入力されるモデル構成用データを用いるのではなく、モデル構成用企業DB13からモデル構成用データを読み出し、読み出したモデル構成用データを用いるようにしてもよい。
【0030】
次に図2から図9を参照して、評価装置100の動作について説明する。
図2から図5はそれぞれ、部分空間構成部11、部分空間修正部12、スコア算出部18及び有効指標抽出部15の処理を示したフローチャートであり、図6から図9は、当該処理の手順を概念的に示した図である。
【0031】
最初に、図2及び図6を参照して部分空間構成部11の処理について説明する。
図2において、まず最初に部分空間構成部11は、入力部10からモデル構成用企業データ及び部分空間を構成するKL展開に用いられる部分空間の寄与率を定めるモデル構成用パラメータが入力される(ステップSa1)。ここで、モデル構成用企業データは、n×p行列(n:サンプル数(モデルとなる企業の数)、p:次元)で表される。具体的には図6の「手順1」に示されるようにA〜B社の企業のデータとして「売上高」、「売上原価」、「従業員数」が示された場合、n=3となり、p=3となる。また、モデル構成用パラメータは、データが有する情報量(具体的にはデータの分散)のうち、どの程度をKL展開で構成される部分空間で近似するか、すなわちデータが有する誤差情報をどれだけ取り除くかに基づいて定められる値であり、0〜100%の値が設定される。
【0032】
次に、部分空間構成部11は、予め定められる特定の尺度の値に基づいて、モデル構成用企業データの中の企業ごとにラベルを割り当て、モデル構成用企業データを2つのデータ群に分割する。例えば、特定の尺度が倒産と非倒産の2値データで表されるラベルとして与えられる場合、そのラベルを用いてサンプルを倒産企業群と非倒産企業群のような2つのデータ群に分類する。また、特定の尺度が上述したように倒産確率等の0〜100%の連続値あるいはそれに順ずる値で与えられる場合には、尺度の値の分布において尺度の値の大きい側、小さい側の両側から所定の値のサンプルを選択して、倒産企業群と非倒産企業群に分類することができる。なお、上述した例では倒産確率の50%を境界として「尺度の値の大きい側」と「尺度の値の小さい側」とを分けたが、この分け方は確率値が半分の50%には限られず、例えば、分割されるサンプル数が同じになるような尺度で分けるようにしてもよい。
【0033】
このとき、分類されるモデル構成用企業データは、A(m×p行列)とB((n−m)×p行列)で表されることになる(ステップSa2)。具体的には、図6の手順1のイメージ図に示されるように「売上高」、「売上原価」、「従業員数」という3つの指標がある場合、各企業のモデル構成用企業データは、3次元の空間の1点に配置され、特定の尺度である倒産確率に基づいて倒産企業群と非倒産企業群の2つのデータ群に分類する。
【0034】
次に、部分空間構成部11は、分類した2つのデータ群のそれぞれに対して、自己相関行列を算出し、算出した自己相関行列に対してKL(Karhunen-Loeve)展開を適用する。KL展開を用いることによって、自己相関行列から部分空間を構成するための基底行列を算出することができる。例えば、上記のように2つのデータ群に分けられたモデル構成用企業データA及びBに対して自己相関行列を算出するとAA’及びBB’として示され、それぞれの基底行列は、KL展開によりA’(p×q行列)及びB’(p×r行列)として算出される。なお、qとrは、上述した寄与率パラメータであるモデル構成用パラメータにより定められる値である。そして、部分空間構成部11は、算出した基底行列から部分空間を構成し(ステップSa3)、構成した部分空間を部分空間DB14に記録するとともに部分空間修正部12に出力する(ステップSa4)。
【0035】
なお、上記のKL展開とは、類別すべきカテゴリを特徴ベクトル成分の分布から形成される部分空間への射影を通して判定する統計的手法として知られている部分空間法において、変換するベクトル成分の固有ベクトル、すなわち上述した基底行列を計算するために用いられる手法である。このような固有ベクトルを算出できる計算方法であればKL展開以外の方法であっても適用することが可能である。
【0036】
次に、図3を参照しつつ部分空間修正部12の処理について説明する。
部分空間修正部12は、部分空間構成部11から出力される部分空間構成部11が構成した2つの部分空間の情報を取得し、モデル構成用企業DB13からモデル構成用企業データを読み出す(ステップSb1)。次に、部分空間修正部12は、2つの部分空間の情報と、モデル構成用企業データとに基づいて、スコアを算出する。ここで、スコアの算出は、2つの部分空間A’とB’のぞれぞれと、個々のモデル構成用企業データから構成されるベクトルとの成す角度の差を算出することによって行われる。すなわち、部分空間A’(p×q行列)とベクトルの成す角度をangleAとし、部分空間B’(p×r行列)とベクトルの成す角度をangleBとした場合、その差分であるangleA−angleBがスコアの値となる。
【0037】
次に、部分空間修正部12は、算出したスコアを降順に並べて、特定の尺度により分類を行い、さらに次式(2)で示される再現率を算出することで評価を行う(ステップSb2)。
【0038】
【数2】
【0039】
なお、式(2)の分母である「倒産企業群の企業数」とは、モデル構成用企業データの各データに予め対応付けて記憶されている本来分類されるべきデータ群を示す情報、例えば、倒産あるいは非倒産のデータ群を示す情報に基づいて算出される数値である。
【0040】
次に、部分空間修正部12は、適応的学習によって部分空間の修正を行う。具体的には、部分空間を構成した基となる自己相関行列AA’とBB’に対して平均学習部分空間法に基づく次式(3)を適用することによって行う。
【0041】
【数3】
【0042】
式(3)において、Rには自己相関行列でありAA’あるいはBB’が代入される。下付き添え字のtは、更新時刻、あるいは更新回数を示している。また、γは更新幅のパラメータであり、予め更新させたい度合いに従って、例えば0.4程度の定数が設定される。
【0043】
R及びγの上付き添え字i及びkは、クラスラベルであり、例えばモデル構成用企業データAのラベルをaとし、モデル構成用企業データBのラベルをbとした場合には、i、kは、aあるいはbとなる。例えば、t=0の場合、R0aは、AA’に対応し、R0bは、BB’に対応する。
【0044】
また、R及びγの上付き添え字が(i,k)あるいは(k,i)のように2つあるものは、誤って分類されたサンプルに基づく行列であることを示している。例えば、Rt(i,k)は、Rt−1(i)を用いてスコアを算出し、算出したスコアに基づいて分類が行われたときに、本来iとして分類されるべきサンプルがk(i≠k)に分類された場合に、当該kに分類されたサンプルを検出し、検出したサンプルから生成される行列Cの自己相関行列CC’に対応する。
【0045】
ここで、図7を参照しつつ、式(3)によって行われる適応的学習について説明する。学習前の部分空間として図7の(適応的学習の方法)の(a)の図に示されるような状態が存在したとする。式(3)のi=a:倒産を示すラベル、k=b:非倒産を示すラベルとした場合、式(3)の右辺のそれぞれは以下のような適応的学習の処理を示すことになる。
【0046】
(第1項):Rt−1a:t−1時点で基礎となる倒産企業の自己相関行列の項である。
(第2項):γ(a,b)Rt(a,b):真のラベルが倒産であるのに、非倒産として分類されたため、倒産のサンプルを取り込むように部分空間を回転及び移動させるために加算を行う自己相関行列の項である。
(第3項):−γ(b,a)Rt(b,a):真のラベルが非倒産であるのに、倒産として分類されたため、非倒産のサンプルを遠ざけるように部分空間を回転及び移動させるために減算を行う自己相関行列の項である。
【0047】
図7の(b)の図が、第2項及び第3項の処理を2次元平面上で概念的に示した図であり、縦軸及び横軸は上記した指標に対応する。倒産企業の部分空間は、誤って分類されたサンプルを取り込むように回転及び移動し、非倒産企業の部分空間は、誤って分類されたサンプルから離れるように回転及び移動することになる。そして最終的に図7の(c)の図に示すように全てのサンプルについて本来分類されるべき部分空間に含まれることになる(ステップSb3)。
【0048】
次に、部分空間修正部12は、修正された部分空間に基づいて、再現率を算出し、前回の再現率と今回算出した再現率とに基づいて比較を行う(ステップSb4)。例えば、今回の再現率を前回の再現率で割った割合の値が予め定められる一定割合値を超えていない場合には、修正を進めるためステップSb4の処理に戻り、超えている場合には、部分空間の情報を出力し、部分空間DB14に記録する(ステップSb5)。
【0049】
次に、図4を参照しつつスコア算出部18の処理について説明する。
まず最初に、スコア算出部18は、部分空間修正部12によって構成され、部分空間DB14に記録された部分空間の情報を部分空間DB14から読み出す。また、評価対象企業データを評価対象企業DB17から読み出す(ステップSc1)。ここで、評価対象企業データは、n’×p行列(n’:サンプル数、p:次元)で構成されているとする。
【0050】
次に、スコア算出部18は、図8の手順3に示すように、読み出した部分空間の情報によって示される部分空間と、読み出した評価対象企業データとに基づいて、各評価対象企業データのスコアを算出する。スコアの算出は、部分空間修正部12の処理において説明したように、部分空間ごとの評価対象企業データから構成されるベクトルとの成す角度を算出し、算出した角度の差がスコアとなる(ステップSc2)。
【0051】
次に、スコア算出部は、他の評価対象企業データが存在するか否かを判定する(ステップSc3)。他の評価対象企業データが存在する場合には、ステップSc2の処理を繰り返し、他の評価対象企業が存在しない場合には、スコアをスコア算出結果出力部19に出力して処理を終了する(ステップSc4)。
【0052】
次に、図5を参照しつつ有効指標抽出部15の処理について説明する。有効指標の抽出とは、例えば、倒産と非倒産の2つのモデルが存在する場合に、倒産と非倒産を分類する高い要因となっている指標を抽出することである。
【0053】
まず最初に有効指標抽出部15は、部分空間修正部12によって構成され、部分空間DB14に記録された部分空間の情報を部分空間DB14から読み出す(ステップSd1)。次に、読み出した各部分空間に対して、分析指標の基底ベクトルとの角度を算出し、算出した角度を、モデルと分析指標との関連度する。また、さらに各部分空間から得られる関連度について差分を算出する(ステップSd2)。そして、算出した関連度及び差分を有効指標DB16に記録する(ステップSd3)。
【0054】
図9は、図5の処理の具体例を示した図である。図9では、部分空間として倒産と非倒産の2つの部分空間が存在し、指標として「売上高」、「原価」、「販管費」、「負債比率」の4つの指標が存在する場合についての有効指標抽出を示している。そして、非倒産及び倒産の部分空間と各指標の基底ベクトルとの角度を算出して、関連度とし、さらに、非倒産と倒産の関連度の差を算出して、大きい値の順に並べることで「負債比率」が非倒産と倒産を分類する最も高い要因となっており、この指標が倒産企業を特徴付けるものとなっていることが視覚的に示されている。
【0055】
(実際の企業データを用いた実施例)
次に、図10から図13を参照して、上記の評価装置100を実際の企業データに適用して分析を行った実施例について説明する。
【0056】
モデル構成用データ及び評価対象データとして、日経メディアマーケティング株式会社のデータバンクNEEDS財務データを用い、モデル構成用データとして2002年度のデータを利用し、評価用データとして2003年度のデータを使用している。サンプル数は、2002年度のデータにおいて195社であり、2003年度のデータにおいて190社である。また、分析には112個の指標を用いた。
【0057】
上記の実施形態では特定の尺度として「倒産」を例として説明したが、当該実施例では知的財産価値の一手法である「知の潜在力」を特定の尺度としており、当該尺度に基づいて2002年度のサンプルと2003年度のサンプルを予め分類した。分類結果は、2002年度のサンプルである195社は、上位(知の潜在力ありとして分類される企業)が97社であり、下位(知の潜在力なしとして分類される企業)98社として分類され、2003年度のサンプルである190社は、上位92社、下位98社として分類された。
【0058】
図10は、評価装置100を適用し、実際のスコアの算出を行った結果のうち、上位19社の結果を示した図である。図10において、「知の潜在力あり」の項目に示される数値は、知の潜在力ありに対応する部分空間と当該企業の評価対象企業データから構成されるベクトルとの成す角度であり、「知の潜在力なし」の項目に示される数値は、知の潜在力なしに対応する部分空間と当該企業の評価対象企業データから構成されるベクトルとの成す角度である。また、「差分」の項目は、「知の潜在力あり」の項目の数値と「知の潜在力なし」の項目の数値との差であり、当該「差分」の値がスコアとなる。
【0059】
図11は、評価装置100における部分空間修正部12において適応的学習を行うことにより部分空間の修正を行った場合の精度の向上度合い示した図である。「差分」の項目の値は、スコアの値に基づいて「知の潜在力あり」に分類された企業数に基づいて、次式(4)により算出された再現率を示した値である。また、「あり」の項目の値は、図10の「知の潜在力あり」の項目の数値に基づいて「知の潜在力あり」に分類された企業数に基づいて、次式(4)により算出された再現率を示した値である。また、「なし」の項目の値は、図10の「知の潜在力なし」の項目の数値に基づいて「知の潜在力あり」に分類された企業数に基づいて、次式(4)により算出された再現率を示した値である。
【0060】
【数4】
【0061】
図11(a)は、フィードバック前、すなわち部分空間の修正を行う前の精度であり、図11(b)は、フィードバックを行った後の精度であり、いずれの項目においても再現率が向上していることが示されている。
【0062】
図12は、評価装置100の有効指標抽出部15により算出された指数ごとの関連度の値を可視化するために、生成されたグラフを示したものである。図12の菱形のマーク(あり)で示されたグラフは、「知の潜在力あり」の部分空間に基づいて算出された関連度であり、四角のマーク(なし)で示されたグラフは、「知の潜在力なし」の部分空間に基づいて算出された関連度である。三角のマーク(差分)で示されたグラフは「知の潜在力あり」の部分空間に基づいて算出された関連度と「知の潜在力なし」の部分空間に基づいて算出された関連度との差であり、図12の最も右の指標である「従業員数」が最も「知の潜在力あり」と「知の潜在力なし」を分ける最も高い要因になっていることが示されている。
【0063】
図13は、本実施形態に係る評価装置100による精度と従来のロジットモデルによる精度を比較するための図である。図13に示されるように、本実施形態では、部分空間を修正する前(フィードバック前)であっても、部分空間を修正した後(フィードバック後)であっても、従来のロジットモデルによる精度よりも高い精度が得られている。
【0064】
なお、上記の実施形態では、例として企業のデータを用いたが、本発明はこれに限られず、指標によって示される様々なデータを対象とすることができる。
また、上記の実施形態では、特定の尺度に対応する視点数を2つとしたが、本発明はこれに限られず、複数の視点数により実施することも可能である。
【0065】
上述の評価装置は内部に、コンピュータシステムを有している。そして、上述した部分空間構成部11、部分空間修正部12、スコア算出部18、有効指標抽出部15に係る処理は、プログラムの形式でコンピュータ読み取り可能な記録媒体に記憶されており、このプログラムをコンピュータが読み出して実行することによって、上記処理が行われる。ここでコンピュータ読み取り可能な記録媒体とは、磁気ディスク、光磁気ディスク、CD−ROM、DVD−ROM、半導体メモリ等をいう。また、このコンピュータプログラムを通信回線によってコンピュータに配信し、この配信を受けたコンピュータが当該プログラムを実行するようにしても良い。
【図面の簡単な説明】
【0066】
【図1】本実施形態に係る評価装置の内部構成を示すブロック図である。
【図2】同実施形態に係る部分空間構築部に係る処理を示したフローチャートである。
【図3】同実施形態に係る部分空間修正部に係る処理を示したフローチャートである。
【図4】同実施形態に係るスコア算出部に係る処理を示したフローチャートである。
【図5】同実施形態に係る有効指標抽出部に係る処理を示したフローチャートである。
【図6】同実施形態に係る部分空間構築部に係る処理の概念図である。
【図7】同実施形態に係る部分空修正部に係る処理の概念図である。
【図8】同実施形態に係るスコア算出部に係る処理の概念図である。
【図9】同実施形態に係る有効指標抽出部に係る処理の概念図である。
【図10】本実施形態に係る評価装置を適用した実施結果(その1)を示した図である。
【図11】本実施形態に係る評価装置を適用した実施結果(その2)を示した図である。
【図12】本実施形態に係る評価装置を適用した有効指標抽出の実施結果を示した図である。
【図13】本実施形態に係る評価装置を適用した実施結果と従来技術の実施結果を示した図である。
【符号の説明】
【0067】
10 入力部
11 部分空間構成部
12 部分空間修正部
18 スコアリング部
100 評価装置
【技術分野】
【0001】
本発明は、例えば企業の財務情報などの評価を行う評価装置及びそのコンピュータプログラムに関する。
【背景技術】
【0002】
従来、企業における大量の財務情報に基づいて、統計的な手法により特定の尺度に基づいて企業ごとのスコアを算出し、与信や投資の格付けなどを行うことが行われている。例えば、企業の倒産可能性をランキングする場合、ある特定の尺度として倒産可能性が高いものから非倒産の可能性が高いものを示す1つの尺度を適用し、統計的な手法により、企業の倒産確率をスコアとして算出して、与信を判断することが行われる。
【0003】
このような統計的な手法の従来技術として、特許文献1に記載の「定性データを使用した倒産確率予測システム」などで使用されているロジットモデルがある。
【0004】
ロジットモデルでは、以下のような手順で企業のスコアを算出する。
(1)与えられたモデル構成用のデータ、すなわち倒産対象企業の財務指標などの指標1から指標nまでの値を使って以下の式(1)に示されるようなモデルを構成する。ここで、式(1)のxnは分析に用いる指標であり、anは指標に係る係数であり、モデルの構成とは、具体的には以下の式(1)においてa1からanまでの係数パラメータを推定することである。
【0005】
【数1】
【0006】
(2)式(1)に対して評価対象企業のデータを代入してスコアを算出する。
上記の(1)及び(2)の手順により、あるモデルに基づいた評価対象企業ごとのスコアを算出することが可能となる(非特許文献1参照)。
【特許文献1】特開2003−216804号公報
【非特許文献1】木島正明、小守林克哉、“信用リスク評価の数理モデル”,出版社:朝倉書店
【発明の開示】
【発明が解決しようとする課題】
【0007】
しかしながら、上記の従来技術では、ある特定の尺度として倒産可能性が高いものから非倒産の可能性が高いものを示す1つの尺度を適用した場合に得られる単独のモデルを用いるため、算出したスコアによる分析の結果を解釈する際に利用可能な情報は、モデルに付与される係数の大小のみであり、十分に分析の結果を解釈できないという問題があった。
【0008】
また、上記の従来技術では、分析に使用する指標を決定する際、複数の分析結果や統計量の比較に基づいて、事前に分析に有効と考えられるものを人手によって設計されており、試行錯誤を要するという問題がある。
【0009】
また、さらに、上記の従来技術では、構成したモデルを用いて企業ごとのスコアを算出した結果、十分な精度が得られなかった場合、算出されたスコアに基づいてモデルを修正することができないという問題がある。
【0010】
本発明は、上記問題を解決すべくなされたもので、その目的は、評価対象データに対して、予め定められる特定の尺度に対応する複数の視点からのスコアの算出を行うことで、複数の視点からの分析を可能とする評価装置及びそのコンピュータプログラムを提供することにある。
【0011】
また、本発明は、人手によらずに有効な指標を抽出することを可能とする評価装置及びそのコンピュータプログラムを提供することにある。
【0012】
また、本発明は、構成したモデルに基づいて算出されるスコアにおいて十分な精度が得られない場合に、モデルを修正することを可能とする評価装置及びそのコンピュータプログラムを提供することにある。
【課題を解決するための手段】
【0013】
上記問題を解決するために、本発明は、複数の指標によって示されるデータを含む評価対象データと、前記評価対象データを評価する基準となるモデル構成用データとを入力する入力手段と、前記入力手段が入力する前記モデル構成用データを、予め定められる所定の尺度に基づいて複数のデータ群に分類し、分類される前記データ群ごとに、当該データ群に含まれる前記モデル構成用データに基づいて前記データ群ごとの部分空間を構成する部分空間構成手段と、前記部分空間構成手段によって構成される複数の部分空間のそれぞれと、前記入力手段が入力する評価対象データから生成されるベクトルとが成す角度を算出し、算出した角度に基づいて当該評価対象データのスコアを算出するスコア算出手段と、を備えたことを特徴とする評価装置である。
【0014】
本発明は、上記に記載の発明において、前記部分空間構成手段により構成される複数の部分空間と、前記入力手段が入力する前記モデル構成用データと、予め前記モデル構成用データごとに定められる前記モデル構成用データが本来属する前記データ群を示す情報と、に基づいて所定の演算を行うことにより前記部分空間を空間内で移動させ、前記モデル構成用データが移動後の部分空間に基づいて分類されることにより属することとなるデータ群を示す情報と、前記本来属するデータ群の情報との一致する割合が一定割合になるまで前記部分空間を移動させる部分空間修正手段を備え、前記スコア算出手段は、前記部分空間修正手段による移動後の複数の部分空間のそれぞれと、前記入力手段が入力する評価対象データから生成されるベクトルとが成す角度を算出し、算出した角度に基づいて当該評価対象データのスコアを算出することを特徴とする。
【0015】
本発明は、上記に記載の発明において、前記スコア算出手段は、前記複数の部分空間が2つ存在する場合、一方の部分空間と、前記入力手段が入力する評価対象データから生成されるベクトルとが成す第1の角度と、他方の部分空間と、前記入力手段が入力する評価対象データから生成されるベクトルとが成す第2の角度とを算出し、算出した前記第1の角度と第2の角度の差を算出し、算出した差をスコアとすることを特徴とする。
【0016】
本発明は、上記に記載の発明において、前記部分空間のそれぞれと、前記指標ごとの基底ベクトルとに基づいて、前記指標ごとの関連度を算出し、算出した前記部分空間ごとの関連度に基づいて、前記指標ごとの有効度を算出する有効指標抽出手段を備えたことを特徴とする。
【0017】
本発明は、上記に記載の発明において、前記有効指標抽出手段は、前記部分空間が2つ存在する場合に、前記指標ごとに一方の部分空間の関連度から他方の部分空間の関連度を減算し、減算して得られた値を前記指標ごとの有効度として出力することを特徴とする。
【0018】
本発明は、評価装置のコンピュータに、複数の指標によって示されるデータを含む評価対象データと、前記評価対象データを評価する基準となるモデル構成用データとを入力するステップと、入力される前記モデル構成用データを、予め定められる所定の尺度に基づいて複数のデータ群に分類し、分類される前記データ群ごとに、当該データ群に含まれる前記モデル構成用データに基づいて前記データ群ごとの部分空間を構成するステップと、構成される複数の部分空間のそれぞれと、前記入力手段が入力する評価対象データから生成されるベクトルとが成す角度を算出し、算出した角度に基づいて当該評価対象データのスコアを算出するステップと、を実行させるためのコンピュータプログラムである。
【発明の効果】
【0019】
この発明によれば、評価装置は、複数の指標によって示されるデータを含む評価対象データと、評価対象データを評価する基準となるモデル構成用データとを入力する。入力するモデル構成用データを、予め定められる所定の尺度に基づいて複数のデータ群に分類し、分類されるデータ群ごとに、当該データ群に含まれるモデル構成用データに基づいてデータ群ごとの部分空間を構成する。そして、構成される複数の部分空間のそれぞれと、前記入力手段が入力する評価対象データから生成されるベクトルとが成す角度を算出し、算出した角度に基づいて当該評価対象データのスコアを算出する構成とした。これにより、モデル構成用データから予め定められる所定の尺度に対応して構成される複数の部分空間に基づいて、評価対象データごとのスコアを算出することができ、所定の尺度に対応する複数の視点からのスコアを得て、複数の視点からの分析を可能とすることができる。
【0020】
また、本発明によれば、評価装置は、構成される複数の部分空間と、入力されるモデル構成用データと、予めモデル構成用データごとに定められるモデル構成用データが本来属するデータ群を示す情報と、に基づいて所定の演算を行うことにより部分空間を空間内で移動させる。また、モデル構成用データが移動後の部分空間に基づいて分類されることにより属することとなるデータ群を示す情報と、本来属するデータ群の情報との一致する割合が一定割合になるまで部分空間を移動させる構成とした。これにより、構成したモデル、すなわち部分空間に基づいて算出されるスコアにおいて十分な精度が得られない場合に、部分空間を移動させることでモデルを修正し、算出されるスコアの精度を向上させることができる。
【0021】
また、本発明によれば、評価装置は、複数の部分空間が2つ存在する場合、一方の部分空間と、入力される評価対象データから生成されるベクトルとが成す第1の角度と、他方の部分空間と、入力される評価対象データから生成されるベクトルとが成す第2の角度とを算出し、算出した第1の角度と第2の角度の差を算出し、算出した差をスコアとする構成とした。これにより、第1の角度と、第2の角度とに基づいて、所定の尺度における加点及び減点の両面の分析が可能となる。
【0022】
また、本発明によれば、評価装置は、部分空間のそれぞれと、指標ごとの基底ベクトルとに基づいて、指標ごとの関連度を算出し、算出した部分空間ごとの関連度に基づいて、指標ごとの有効度を算出する構成とした。これにより、それぞれの部分空間に対応するモデルの特徴を指標ごとの有効度として定量的に示すことができ、人手によらずに有効な指標を抽出することが可能となる。
【0023】
また、本発明によれば、評価装置は、部分空間が2つ存在する場合に、指標ごとに一方の部分空間の関連度から他方の部分空間の関連度を減算し、減算して得られた値を指標ごとの有効度として出力する構成とした。これにより、これにより、それぞれの部分空間に対応するモデルの特徴を有効度として定量的に示すことができる。また、さらに差分によって示されるモデル間における重要な指標を定量的及び視覚的に把握することが可能となり、設計工数を削減することが可能となる。
【発明を実施するための最良の形態】
【0024】
以下、本発明の一実施形態を図面を参照して説明する。
図1は、本実施形態による評価装置100を示す概略ブロック図である。評価装置100は例えば、企業の財務情報などの評価に用いられる装置であり、以下評価対象のデータとして企業のデータを適用して記載する。
【0025】
評価装置100において、入力部10は、モデル構成用企業データと、評価対象企業データ及びモデル構成用パラメータを入力し、モデル構成用パラメータ及びモデル構成用企業データをモデル構成用企業データベース(以下、DBと記載)13に記録し、評価対象企業データを評価対象企業DB17に記録する。
【0026】
部分空間構成部11は、入力部10から入力されるモデル構成用データに基づいて、特定の尺度に基づいた部分空間を2つ構成する。ここで、特定の尺度とは、例えば、評価として企業の倒産可能性を評価する場合、倒産確率を特定の尺度とすることができる。倒産確率を特定の尺度とした場合、倒産する確率は0〜100%の値で示され、当該値に基づいて、例えば、倒産確率が50%以上の評価対象を「尺度の値の大きい側」として倒産企業群とし、倒産確率が50%未満の評価対象を「尺度の値の小さい側」として非倒産企業群とすることで2つの部分空間に分けることが可能となる。
【0027】
部分空間修正部12は、部分空間構成部11が構成した部分空間を、後述する適応的学習手法により、最終的に出力されるスコアの精度を高めるように部分空間を修正し、部分空間情報として部分空間データベース(以下、DBと記載)14に記録する。
【0028】
有効指標抽出部15は、部分空間DB14から部分空間情報を読み出し、読み出した部分空間情報に対応する部分空間の関連度とその差分を算出し、算出した関連度と差分とを有効指標DB16に記録する。スコア算出部18は、部分空間DB14から部分空間情報を読み出し、評価対象企業DB17から評価対象企業データを読み出し、読み出した部分空間情報に対応する部分空間における評価対象企業データのスコアを算出し、算出したスコアをスコア算出結果出力部19に出力する。スコア算出結果出力部19は、スコア算出部18から入力されるスコアを値の順に並べて画面等に出力するか、あるいは記憶媒体等に記録する。
【0029】
なお、部分空間構成部11は、入力部10から入力されるモデル構成用データを用いるのではなく、モデル構成用企業DB13からモデル構成用データを読み出し、読み出したモデル構成用データを用いるようにしてもよい。
【0030】
次に図2から図9を参照して、評価装置100の動作について説明する。
図2から図5はそれぞれ、部分空間構成部11、部分空間修正部12、スコア算出部18及び有効指標抽出部15の処理を示したフローチャートであり、図6から図9は、当該処理の手順を概念的に示した図である。
【0031】
最初に、図2及び図6を参照して部分空間構成部11の処理について説明する。
図2において、まず最初に部分空間構成部11は、入力部10からモデル構成用企業データ及び部分空間を構成するKL展開に用いられる部分空間の寄与率を定めるモデル構成用パラメータが入力される(ステップSa1)。ここで、モデル構成用企業データは、n×p行列(n:サンプル数(モデルとなる企業の数)、p:次元)で表される。具体的には図6の「手順1」に示されるようにA〜B社の企業のデータとして「売上高」、「売上原価」、「従業員数」が示された場合、n=3となり、p=3となる。また、モデル構成用パラメータは、データが有する情報量(具体的にはデータの分散)のうち、どの程度をKL展開で構成される部分空間で近似するか、すなわちデータが有する誤差情報をどれだけ取り除くかに基づいて定められる値であり、0〜100%の値が設定される。
【0032】
次に、部分空間構成部11は、予め定められる特定の尺度の値に基づいて、モデル構成用企業データの中の企業ごとにラベルを割り当て、モデル構成用企業データを2つのデータ群に分割する。例えば、特定の尺度が倒産と非倒産の2値データで表されるラベルとして与えられる場合、そのラベルを用いてサンプルを倒産企業群と非倒産企業群のような2つのデータ群に分類する。また、特定の尺度が上述したように倒産確率等の0〜100%の連続値あるいはそれに順ずる値で与えられる場合には、尺度の値の分布において尺度の値の大きい側、小さい側の両側から所定の値のサンプルを選択して、倒産企業群と非倒産企業群に分類することができる。なお、上述した例では倒産確率の50%を境界として「尺度の値の大きい側」と「尺度の値の小さい側」とを分けたが、この分け方は確率値が半分の50%には限られず、例えば、分割されるサンプル数が同じになるような尺度で分けるようにしてもよい。
【0033】
このとき、分類されるモデル構成用企業データは、A(m×p行列)とB((n−m)×p行列)で表されることになる(ステップSa2)。具体的には、図6の手順1のイメージ図に示されるように「売上高」、「売上原価」、「従業員数」という3つの指標がある場合、各企業のモデル構成用企業データは、3次元の空間の1点に配置され、特定の尺度である倒産確率に基づいて倒産企業群と非倒産企業群の2つのデータ群に分類する。
【0034】
次に、部分空間構成部11は、分類した2つのデータ群のそれぞれに対して、自己相関行列を算出し、算出した自己相関行列に対してKL(Karhunen-Loeve)展開を適用する。KL展開を用いることによって、自己相関行列から部分空間を構成するための基底行列を算出することができる。例えば、上記のように2つのデータ群に分けられたモデル構成用企業データA及びBに対して自己相関行列を算出するとAA’及びBB’として示され、それぞれの基底行列は、KL展開によりA’(p×q行列)及びB’(p×r行列)として算出される。なお、qとrは、上述した寄与率パラメータであるモデル構成用パラメータにより定められる値である。そして、部分空間構成部11は、算出した基底行列から部分空間を構成し(ステップSa3)、構成した部分空間を部分空間DB14に記録するとともに部分空間修正部12に出力する(ステップSa4)。
【0035】
なお、上記のKL展開とは、類別すべきカテゴリを特徴ベクトル成分の分布から形成される部分空間への射影を通して判定する統計的手法として知られている部分空間法において、変換するベクトル成分の固有ベクトル、すなわち上述した基底行列を計算するために用いられる手法である。このような固有ベクトルを算出できる計算方法であればKL展開以外の方法であっても適用することが可能である。
【0036】
次に、図3を参照しつつ部分空間修正部12の処理について説明する。
部分空間修正部12は、部分空間構成部11から出力される部分空間構成部11が構成した2つの部分空間の情報を取得し、モデル構成用企業DB13からモデル構成用企業データを読み出す(ステップSb1)。次に、部分空間修正部12は、2つの部分空間の情報と、モデル構成用企業データとに基づいて、スコアを算出する。ここで、スコアの算出は、2つの部分空間A’とB’のぞれぞれと、個々のモデル構成用企業データから構成されるベクトルとの成す角度の差を算出することによって行われる。すなわち、部分空間A’(p×q行列)とベクトルの成す角度をangleAとし、部分空間B’(p×r行列)とベクトルの成す角度をangleBとした場合、その差分であるangleA−angleBがスコアの値となる。
【0037】
次に、部分空間修正部12は、算出したスコアを降順に並べて、特定の尺度により分類を行い、さらに次式(2)で示される再現率を算出することで評価を行う(ステップSb2)。
【0038】
【数2】
【0039】
なお、式(2)の分母である「倒産企業群の企業数」とは、モデル構成用企業データの各データに予め対応付けて記憶されている本来分類されるべきデータ群を示す情報、例えば、倒産あるいは非倒産のデータ群を示す情報に基づいて算出される数値である。
【0040】
次に、部分空間修正部12は、適応的学習によって部分空間の修正を行う。具体的には、部分空間を構成した基となる自己相関行列AA’とBB’に対して平均学習部分空間法に基づく次式(3)を適用することによって行う。
【0041】
【数3】
【0042】
式(3)において、Rには自己相関行列でありAA’あるいはBB’が代入される。下付き添え字のtは、更新時刻、あるいは更新回数を示している。また、γは更新幅のパラメータであり、予め更新させたい度合いに従って、例えば0.4程度の定数が設定される。
【0043】
R及びγの上付き添え字i及びkは、クラスラベルであり、例えばモデル構成用企業データAのラベルをaとし、モデル構成用企業データBのラベルをbとした場合には、i、kは、aあるいはbとなる。例えば、t=0の場合、R0aは、AA’に対応し、R0bは、BB’に対応する。
【0044】
また、R及びγの上付き添え字が(i,k)あるいは(k,i)のように2つあるものは、誤って分類されたサンプルに基づく行列であることを示している。例えば、Rt(i,k)は、Rt−1(i)を用いてスコアを算出し、算出したスコアに基づいて分類が行われたときに、本来iとして分類されるべきサンプルがk(i≠k)に分類された場合に、当該kに分類されたサンプルを検出し、検出したサンプルから生成される行列Cの自己相関行列CC’に対応する。
【0045】
ここで、図7を参照しつつ、式(3)によって行われる適応的学習について説明する。学習前の部分空間として図7の(適応的学習の方法)の(a)の図に示されるような状態が存在したとする。式(3)のi=a:倒産を示すラベル、k=b:非倒産を示すラベルとした場合、式(3)の右辺のそれぞれは以下のような適応的学習の処理を示すことになる。
【0046】
(第1項):Rt−1a:t−1時点で基礎となる倒産企業の自己相関行列の項である。
(第2項):γ(a,b)Rt(a,b):真のラベルが倒産であるのに、非倒産として分類されたため、倒産のサンプルを取り込むように部分空間を回転及び移動させるために加算を行う自己相関行列の項である。
(第3項):−γ(b,a)Rt(b,a):真のラベルが非倒産であるのに、倒産として分類されたため、非倒産のサンプルを遠ざけるように部分空間を回転及び移動させるために減算を行う自己相関行列の項である。
【0047】
図7の(b)の図が、第2項及び第3項の処理を2次元平面上で概念的に示した図であり、縦軸及び横軸は上記した指標に対応する。倒産企業の部分空間は、誤って分類されたサンプルを取り込むように回転及び移動し、非倒産企業の部分空間は、誤って分類されたサンプルから離れるように回転及び移動することになる。そして最終的に図7の(c)の図に示すように全てのサンプルについて本来分類されるべき部分空間に含まれることになる(ステップSb3)。
【0048】
次に、部分空間修正部12は、修正された部分空間に基づいて、再現率を算出し、前回の再現率と今回算出した再現率とに基づいて比較を行う(ステップSb4)。例えば、今回の再現率を前回の再現率で割った割合の値が予め定められる一定割合値を超えていない場合には、修正を進めるためステップSb4の処理に戻り、超えている場合には、部分空間の情報を出力し、部分空間DB14に記録する(ステップSb5)。
【0049】
次に、図4を参照しつつスコア算出部18の処理について説明する。
まず最初に、スコア算出部18は、部分空間修正部12によって構成され、部分空間DB14に記録された部分空間の情報を部分空間DB14から読み出す。また、評価対象企業データを評価対象企業DB17から読み出す(ステップSc1)。ここで、評価対象企業データは、n’×p行列(n’:サンプル数、p:次元)で構成されているとする。
【0050】
次に、スコア算出部18は、図8の手順3に示すように、読み出した部分空間の情報によって示される部分空間と、読み出した評価対象企業データとに基づいて、各評価対象企業データのスコアを算出する。スコアの算出は、部分空間修正部12の処理において説明したように、部分空間ごとの評価対象企業データから構成されるベクトルとの成す角度を算出し、算出した角度の差がスコアとなる(ステップSc2)。
【0051】
次に、スコア算出部は、他の評価対象企業データが存在するか否かを判定する(ステップSc3)。他の評価対象企業データが存在する場合には、ステップSc2の処理を繰り返し、他の評価対象企業が存在しない場合には、スコアをスコア算出結果出力部19に出力して処理を終了する(ステップSc4)。
【0052】
次に、図5を参照しつつ有効指標抽出部15の処理について説明する。有効指標の抽出とは、例えば、倒産と非倒産の2つのモデルが存在する場合に、倒産と非倒産を分類する高い要因となっている指標を抽出することである。
【0053】
まず最初に有効指標抽出部15は、部分空間修正部12によって構成され、部分空間DB14に記録された部分空間の情報を部分空間DB14から読み出す(ステップSd1)。次に、読み出した各部分空間に対して、分析指標の基底ベクトルとの角度を算出し、算出した角度を、モデルと分析指標との関連度する。また、さらに各部分空間から得られる関連度について差分を算出する(ステップSd2)。そして、算出した関連度及び差分を有効指標DB16に記録する(ステップSd3)。
【0054】
図9は、図5の処理の具体例を示した図である。図9では、部分空間として倒産と非倒産の2つの部分空間が存在し、指標として「売上高」、「原価」、「販管費」、「負債比率」の4つの指標が存在する場合についての有効指標抽出を示している。そして、非倒産及び倒産の部分空間と各指標の基底ベクトルとの角度を算出して、関連度とし、さらに、非倒産と倒産の関連度の差を算出して、大きい値の順に並べることで「負債比率」が非倒産と倒産を分類する最も高い要因となっており、この指標が倒産企業を特徴付けるものとなっていることが視覚的に示されている。
【0055】
(実際の企業データを用いた実施例)
次に、図10から図13を参照して、上記の評価装置100を実際の企業データに適用して分析を行った実施例について説明する。
【0056】
モデル構成用データ及び評価対象データとして、日経メディアマーケティング株式会社のデータバンクNEEDS財務データを用い、モデル構成用データとして2002年度のデータを利用し、評価用データとして2003年度のデータを使用している。サンプル数は、2002年度のデータにおいて195社であり、2003年度のデータにおいて190社である。また、分析には112個の指標を用いた。
【0057】
上記の実施形態では特定の尺度として「倒産」を例として説明したが、当該実施例では知的財産価値の一手法である「知の潜在力」を特定の尺度としており、当該尺度に基づいて2002年度のサンプルと2003年度のサンプルを予め分類した。分類結果は、2002年度のサンプルである195社は、上位(知の潜在力ありとして分類される企業)が97社であり、下位(知の潜在力なしとして分類される企業)98社として分類され、2003年度のサンプルである190社は、上位92社、下位98社として分類された。
【0058】
図10は、評価装置100を適用し、実際のスコアの算出を行った結果のうち、上位19社の結果を示した図である。図10において、「知の潜在力あり」の項目に示される数値は、知の潜在力ありに対応する部分空間と当該企業の評価対象企業データから構成されるベクトルとの成す角度であり、「知の潜在力なし」の項目に示される数値は、知の潜在力なしに対応する部分空間と当該企業の評価対象企業データから構成されるベクトルとの成す角度である。また、「差分」の項目は、「知の潜在力あり」の項目の数値と「知の潜在力なし」の項目の数値との差であり、当該「差分」の値がスコアとなる。
【0059】
図11は、評価装置100における部分空間修正部12において適応的学習を行うことにより部分空間の修正を行った場合の精度の向上度合い示した図である。「差分」の項目の値は、スコアの値に基づいて「知の潜在力あり」に分類された企業数に基づいて、次式(4)により算出された再現率を示した値である。また、「あり」の項目の値は、図10の「知の潜在力あり」の項目の数値に基づいて「知の潜在力あり」に分類された企業数に基づいて、次式(4)により算出された再現率を示した値である。また、「なし」の項目の値は、図10の「知の潜在力なし」の項目の数値に基づいて「知の潜在力あり」に分類された企業数に基づいて、次式(4)により算出された再現率を示した値である。
【0060】
【数4】
【0061】
図11(a)は、フィードバック前、すなわち部分空間の修正を行う前の精度であり、図11(b)は、フィードバックを行った後の精度であり、いずれの項目においても再現率が向上していることが示されている。
【0062】
図12は、評価装置100の有効指標抽出部15により算出された指数ごとの関連度の値を可視化するために、生成されたグラフを示したものである。図12の菱形のマーク(あり)で示されたグラフは、「知の潜在力あり」の部分空間に基づいて算出された関連度であり、四角のマーク(なし)で示されたグラフは、「知の潜在力なし」の部分空間に基づいて算出された関連度である。三角のマーク(差分)で示されたグラフは「知の潜在力あり」の部分空間に基づいて算出された関連度と「知の潜在力なし」の部分空間に基づいて算出された関連度との差であり、図12の最も右の指標である「従業員数」が最も「知の潜在力あり」と「知の潜在力なし」を分ける最も高い要因になっていることが示されている。
【0063】
図13は、本実施形態に係る評価装置100による精度と従来のロジットモデルによる精度を比較するための図である。図13に示されるように、本実施形態では、部分空間を修正する前(フィードバック前)であっても、部分空間を修正した後(フィードバック後)であっても、従来のロジットモデルによる精度よりも高い精度が得られている。
【0064】
なお、上記の実施形態では、例として企業のデータを用いたが、本発明はこれに限られず、指標によって示される様々なデータを対象とすることができる。
また、上記の実施形態では、特定の尺度に対応する視点数を2つとしたが、本発明はこれに限られず、複数の視点数により実施することも可能である。
【0065】
上述の評価装置は内部に、コンピュータシステムを有している。そして、上述した部分空間構成部11、部分空間修正部12、スコア算出部18、有効指標抽出部15に係る処理は、プログラムの形式でコンピュータ読み取り可能な記録媒体に記憶されており、このプログラムをコンピュータが読み出して実行することによって、上記処理が行われる。ここでコンピュータ読み取り可能な記録媒体とは、磁気ディスク、光磁気ディスク、CD−ROM、DVD−ROM、半導体メモリ等をいう。また、このコンピュータプログラムを通信回線によってコンピュータに配信し、この配信を受けたコンピュータが当該プログラムを実行するようにしても良い。
【図面の簡単な説明】
【0066】
【図1】本実施形態に係る評価装置の内部構成を示すブロック図である。
【図2】同実施形態に係る部分空間構築部に係る処理を示したフローチャートである。
【図3】同実施形態に係る部分空間修正部に係る処理を示したフローチャートである。
【図4】同実施形態に係るスコア算出部に係る処理を示したフローチャートである。
【図5】同実施形態に係る有効指標抽出部に係る処理を示したフローチャートである。
【図6】同実施形態に係る部分空間構築部に係る処理の概念図である。
【図7】同実施形態に係る部分空修正部に係る処理の概念図である。
【図8】同実施形態に係るスコア算出部に係る処理の概念図である。
【図9】同実施形態に係る有効指標抽出部に係る処理の概念図である。
【図10】本実施形態に係る評価装置を適用した実施結果(その1)を示した図である。
【図11】本実施形態に係る評価装置を適用した実施結果(その2)を示した図である。
【図12】本実施形態に係る評価装置を適用した有効指標抽出の実施結果を示した図である。
【図13】本実施形態に係る評価装置を適用した実施結果と従来技術の実施結果を示した図である。
【符号の説明】
【0067】
10 入力部
11 部分空間構成部
12 部分空間修正部
18 スコアリング部
100 評価装置
【特許請求の範囲】
【請求項1】
複数の指標によって示されるデータを含む評価対象データと、前記評価対象データを評価する基準となるモデル構成用データとを入力する入力手段と、
前記入力手段が入力する前記モデル構成用データを、予め定められる所定の尺度に基づいて複数のデータ群に分類し、分類される前記データ群ごとに、当該データ群に含まれる前記モデル構成用データに基づいて前記データ群ごとの部分空間を構成する部分空間構成手段と、
前記部分空間構成手段によって構成される複数の部分空間のそれぞれと、前記入力手段が入力する評価対象データから生成されるベクトルとが成す角度を算出し、算出した角度に基づいて当該評価対象データのスコアを算出するスコア算出手段と、
を備えたことを特徴とする評価装置。
【請求項2】
前記部分空間構成手段により構成される複数の部分空間と、前記入力手段が入力する前記モデル構成用データと、予め前記モデル構成用データごとに定められる前記モデル構成用データが本来属する前記データ群を示す情報と、に基づいて所定の演算を行うことにより前記部分空間を空間内で移動させ、前記モデル構成用データが移動後の部分空間に基づいて分類されることにより属することとなるデータ群を示す情報と、前記本来属するデータ群の情報との一致する割合が一定割合になるまで前記部分空間を移動させる部分空間修正手段を備え、
前記スコア算出手段は、
前記部分空間修正手段による移動後の複数の部分空間のそれぞれと、前記入力手段が入力する評価対象データから生成されるベクトルとが成す角度を算出し、算出した角度に基づいて当該評価対象データのスコアを算出することを特徴とする請求項1に記載の評価装置。
【請求項3】
前記スコア算出手段は、
前記複数の部分空間が2つ存在する場合、一方の部分空間と、前記入力手段が入力する評価対象データから生成されるベクトルとが成す第1の角度と、他方の部分空間と、前記入力手段が入力する評価対象データから生成されるベクトルとが成す第2の角度とを算出し、算出した前記第1の角度と前記第2の角度の差を算出し、算出した差をスコアとすることを特徴とする請求項1または2に記載の評価装置。
【請求項4】
前記部分空間のそれぞれと、前記指標ごとの基底ベクトルとに基づいて、前記指標ごとの関連度を算出し、算出した前記部分空間ごとの関連度に基づいて、前記指標ごとの有効度を算出する有効指標抽出手段を備えたことを特徴とする請求項1から3のいずれか1つに記載の評価装置。
【請求項5】
前記有効指標抽出手段は、
前記部分空間が2つ存在する場合に、前記指標ごとに一方の部分空間の関連度から他方の部分空間の関連度を減算し、減算して得られた値を前記指標ごとの有効度として出力することを特徴とする請求項4に記載の評価装置。
【請求項6】
評価装置のコンピュータに、
複数の指標によって示されるデータを含む評価対象データと、前記評価対象データを評価する基準となるモデル構成用データとを入力するステップと、
入力される前記モデル構成用データを、予め定められる所定の尺度に基づいて複数のデータ群に分類し、分類される前記データ群ごとに、当該データ群に含まれる前記モデル構成用データに基づいて前記データ群ごとの部分空間を構成するステップと、
構成される複数の部分空間のそれぞれと、前記入力手段が入力する評価対象データから生成されるベクトルとが成す角度を算出し、算出した角度に基づいて当該評価対象データのスコアを算出するステップと、
を実行させるためのコンピュータプログラム。
【請求項1】
複数の指標によって示されるデータを含む評価対象データと、前記評価対象データを評価する基準となるモデル構成用データとを入力する入力手段と、
前記入力手段が入力する前記モデル構成用データを、予め定められる所定の尺度に基づいて複数のデータ群に分類し、分類される前記データ群ごとに、当該データ群に含まれる前記モデル構成用データに基づいて前記データ群ごとの部分空間を構成する部分空間構成手段と、
前記部分空間構成手段によって構成される複数の部分空間のそれぞれと、前記入力手段が入力する評価対象データから生成されるベクトルとが成す角度を算出し、算出した角度に基づいて当該評価対象データのスコアを算出するスコア算出手段と、
を備えたことを特徴とする評価装置。
【請求項2】
前記部分空間構成手段により構成される複数の部分空間と、前記入力手段が入力する前記モデル構成用データと、予め前記モデル構成用データごとに定められる前記モデル構成用データが本来属する前記データ群を示す情報と、に基づいて所定の演算を行うことにより前記部分空間を空間内で移動させ、前記モデル構成用データが移動後の部分空間に基づいて分類されることにより属することとなるデータ群を示す情報と、前記本来属するデータ群の情報との一致する割合が一定割合になるまで前記部分空間を移動させる部分空間修正手段を備え、
前記スコア算出手段は、
前記部分空間修正手段による移動後の複数の部分空間のそれぞれと、前記入力手段が入力する評価対象データから生成されるベクトルとが成す角度を算出し、算出した角度に基づいて当該評価対象データのスコアを算出することを特徴とする請求項1に記載の評価装置。
【請求項3】
前記スコア算出手段は、
前記複数の部分空間が2つ存在する場合、一方の部分空間と、前記入力手段が入力する評価対象データから生成されるベクトルとが成す第1の角度と、他方の部分空間と、前記入力手段が入力する評価対象データから生成されるベクトルとが成す第2の角度とを算出し、算出した前記第1の角度と前記第2の角度の差を算出し、算出した差をスコアとすることを特徴とする請求項1または2に記載の評価装置。
【請求項4】
前記部分空間のそれぞれと、前記指標ごとの基底ベクトルとに基づいて、前記指標ごとの関連度を算出し、算出した前記部分空間ごとの関連度に基づいて、前記指標ごとの有効度を算出する有効指標抽出手段を備えたことを特徴とする請求項1から3のいずれか1つに記載の評価装置。
【請求項5】
前記有効指標抽出手段は、
前記部分空間が2つ存在する場合に、前記指標ごとに一方の部分空間の関連度から他方の部分空間の関連度を減算し、減算して得られた値を前記指標ごとの有効度として出力することを特徴とする請求項4に記載の評価装置。
【請求項6】
評価装置のコンピュータに、
複数の指標によって示されるデータを含む評価対象データと、前記評価対象データを評価する基準となるモデル構成用データとを入力するステップと、
入力される前記モデル構成用データを、予め定められる所定の尺度に基づいて複数のデータ群に分類し、分類される前記データ群ごとに、当該データ群に含まれる前記モデル構成用データに基づいて前記データ群ごとの部分空間を構成するステップと、
構成される複数の部分空間のそれぞれと、前記入力手段が入力する評価対象データから生成されるベクトルとが成す角度を算出し、算出した角度に基づいて当該評価対象データのスコアを算出するステップと、
を実行させるためのコンピュータプログラム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【公開番号】特開2006−318013(P2006−318013A)
【公開日】平成18年11月24日(2006.11.24)
【国際特許分類】
【出願番号】特願2005−137203(P2005−137203)
【出願日】平成17年5月10日(2005.5.10)
【出願人】(000102728)株式会社エヌ・ティ・ティ・データ (438)
【公開日】平成18年11月24日(2006.11.24)
【国際特許分類】
【出願日】平成17年5月10日(2005.5.10)
【出願人】(000102728)株式会社エヌ・ティ・ティ・データ (438)
[ Back to top ]