評価装置及びそのコンピュータプログラム

【課題】評価対象データに対して、予め定められる特定の尺度に対応する複数の視点からのスコアの算出を行うことで、複数の視点からの分析を可能とする評価装置を提供する。
【解決手段】入力部１０は、複数の指標によって示されるデータを含む評価対象データと、評価対象データを評価する基準となるモデル構成用データとを入力する。部分空間構成部１１は、入力部１０が入力するモデル構成用データを、予め定められる所定の尺度に基づいて複数のデータ群に分類し、分類される前記データ群ごとに、当該データ群に含まれるモデル構成用データに基づいてデータ群ごとの部分空間を構成する。部分空間修正部１４は、精度を高めるように部分空間の修正を行う。スコア算出部１８は、部分空間のそれぞれと、評価対象データから生成されるベクトルとが成す角度を算出し、算出した角度に基づいてスコアを算出する。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、例えば企業の財務情報などの評価を行う評価装置及びそのコンピュータプログラムに関する。
【背景技術】
【０００２】
従来、企業における大量の財務情報に基づいて、統計的な手法により特定の尺度に基づいて企業ごとのスコアを算出し、与信や投資の格付けなどを行うことが行われている。例えば、企業の倒産可能性をランキングする場合、ある特定の尺度として倒産可能性が高いものから非倒産の可能性が高いものを示す１つの尺度を適用し、統計的な手法により、企業の倒産確率をスコアとして算出して、与信を判断することが行われる。
【０００３】
このような統計的な手法の従来技術として、特許文献１に記載の「定性データを使用した倒産確率予測システム」などで使用されているロジットモデルがある。
【０００４】
ロジットモデルでは、以下のような手順で企業のスコアを算出する。
（１）与えられたモデル構成用のデータ、すなわち倒産対象企業の財務指標などの指標１から指標ｎまでの値を使って以下の式（１）に示されるようなモデルを構成する。ここで、式（１）のｘ_ｎは分析に用いる指標であり、ａ_ｎは指標に係る係数であり、モデルの構成とは、具体的には以下の式（１）においてａ_１からａ_ｎまでの係数パラメータを推定することである。
【０００５】
【数１】

【０００６】
（２）式（１）に対して評価対象企業のデータを代入してスコアを算出する。
上記の（１）及び（２）の手順により、あるモデルに基づいた評価対象企業ごとのスコアを算出することが可能となる（非特許文献１参照）。
【特許文献１】特開２００３−２１６８０４号公報
【非特許文献１】木島正明、小守林克哉、“信用リスク評価の数理モデル”，出版社：朝倉書店
【発明の開示】
【発明が解決しようとする課題】
【０００７】
しかしながら、上記の従来技術では、ある特定の尺度として倒産可能性が高いものから非倒産の可能性が高いものを示す１つの尺度を適用した場合に得られる単独のモデルを用いるため、算出したスコアによる分析の結果を解釈する際に利用可能な情報は、モデルに付与される係数の大小のみであり、十分に分析の結果を解釈できないという問題があった。
【０００８】
また、上記の従来技術では、分析に使用する指標を決定する際、複数の分析結果や統計量の比較に基づいて、事前に分析に有効と考えられるものを人手によって設計されており、試行錯誤を要するという問題がある。
【０００９】
また、さらに、上記の従来技術では、構成したモデルを用いて企業ごとのスコアを算出した結果、十分な精度が得られなかった場合、算出されたスコアに基づいてモデルを修正することができないという問題がある。
【００１０】
本発明は、上記問題を解決すべくなされたもので、その目的は、評価対象データに対して、予め定められる特定の尺度に対応する複数の視点からのスコアの算出を行うことで、複数の視点からの分析を可能とする評価装置及びそのコンピュータプログラムを提供することにある。
【００１１】
また、本発明は、人手によらずに有効な指標を抽出することを可能とする評価装置及びそのコンピュータプログラムを提供することにある。
【００１２】
また、本発明は、構成したモデルに基づいて算出されるスコアにおいて十分な精度が得られない場合に、モデルを修正することを可能とする評価装置及びそのコンピュータプログラムを提供することにある。
【課題を解決するための手段】
【００１３】
上記問題を解決するために、本発明は、複数の指標によって示されるデータを含む評価対象データと、前記評価対象データを評価する基準となるモデル構成用データとを入力する入力手段と、前記入力手段が入力する前記モデル構成用データを、予め定められる所定の尺度に基づいて複数のデータ群に分類し、分類される前記データ群ごとに、当該データ群に含まれる前記モデル構成用データに基づいて前記データ群ごとの部分空間を構成する部分空間構成手段と、前記部分空間構成手段によって構成される複数の部分空間のそれぞれと、前記入力手段が入力する評価対象データから生成されるベクトルとが成す角度を算出し、算出した角度に基づいて当該評価対象データのスコアを算出するスコア算出手段と、を備えたことを特徴とする評価装置である。
【００１４】
本発明は、上記に記載の発明において、前記部分空間構成手段により構成される複数の部分空間と、前記入力手段が入力する前記モデル構成用データと、予め前記モデル構成用データごとに定められる前記モデル構成用データが本来属する前記データ群を示す情報と、に基づいて所定の演算を行うことにより前記部分空間を空間内で移動させ、前記モデル構成用データが移動後の部分空間に基づいて分類されることにより属することとなるデータ群を示す情報と、前記本来属するデータ群の情報との一致する割合が一定割合になるまで前記部分空間を移動させる部分空間修正手段を備え、前記スコア算出手段は、前記部分空間修正手段による移動後の複数の部分空間のそれぞれと、前記入力手段が入力する評価対象データから生成されるベクトルとが成す角度を算出し、算出した角度に基づいて当該評価対象データのスコアを算出することを特徴とする。
【００１５】
本発明は、上記に記載の発明において、前記スコア算出手段は、前記複数の部分空間が２つ存在する場合、一方の部分空間と、前記入力手段が入力する評価対象データから生成されるベクトルとが成す第１の角度と、他方の部分空間と、前記入力手段が入力する評価対象データから生成されるベクトルとが成す第２の角度とを算出し、算出した前記第１の角度と第２の角度の差を算出し、算出した差をスコアとすることを特徴とする。
【００１６】
本発明は、上記に記載の発明において、前記部分空間のそれぞれと、前記指標ごとの基底ベクトルとに基づいて、前記指標ごとの関連度を算出し、算出した前記部分空間ごとの関連度に基づいて、前記指標ごとの有効度を算出する有効指標抽出手段を備えたことを特徴とする。
【００１７】
本発明は、上記に記載の発明において、前記有効指標抽出手段は、前記部分空間が２つ存在する場合に、前記指標ごとに一方の部分空間の関連度から他方の部分空間の関連度を減算し、減算して得られた値を前記指標ごとの有効度として出力することを特徴とする。
【００１８】
本発明は、評価装置のコンピュータに、複数の指標によって示されるデータを含む評価対象データと、前記評価対象データを評価する基準となるモデル構成用データとを入力するステップと、入力される前記モデル構成用データを、予め定められる所定の尺度に基づいて複数のデータ群に分類し、分類される前記データ群ごとに、当該データ群に含まれる前記モデル構成用データに基づいて前記データ群ごとの部分空間を構成するステップと、構成される複数の部分空間のそれぞれと、前記入力手段が入力する評価対象データから生成されるベクトルとが成す角度を算出し、算出した角度に基づいて当該評価対象データのスコアを算出するステップと、を実行させるためのコンピュータプログラムである。
【発明の効果】
【００１９】
この発明によれば、評価装置は、複数の指標によって示されるデータを含む評価対象データと、評価対象データを評価する基準となるモデル構成用データとを入力する。入力するモデル構成用データを、予め定められる所定の尺度に基づいて複数のデータ群に分類し、分類されるデータ群ごとに、当該データ群に含まれるモデル構成用データに基づいてデータ群ごとの部分空間を構成する。そして、構成される複数の部分空間のそれぞれと、前記入力手段が入力する評価対象データから生成されるベクトルとが成す角度を算出し、算出した角度に基づいて当該評価対象データのスコアを算出する構成とした。これにより、モデル構成用データから予め定められる所定の尺度に対応して構成される複数の部分空間に基づいて、評価対象データごとのスコアを算出することができ、所定の尺度に対応する複数の視点からのスコアを得て、複数の視点からの分析を可能とすることができる。
【００２０】
また、本発明によれば、評価装置は、構成される複数の部分空間と、入力されるモデル構成用データと、予めモデル構成用データごとに定められるモデル構成用データが本来属するデータ群を示す情報と、に基づいて所定の演算を行うことにより部分空間を空間内で移動させる。また、モデル構成用データが移動後の部分空間に基づいて分類されることにより属することとなるデータ群を示す情報と、本来属するデータ群の情報との一致する割合が一定割合になるまで部分空間を移動させる構成とした。これにより、構成したモデル、すなわち部分空間に基づいて算出されるスコアにおいて十分な精度が得られない場合に、部分空間を移動させることでモデルを修正し、算出されるスコアの精度を向上させることができる。
【００２１】
また、本発明によれば、評価装置は、複数の部分空間が２つ存在する場合、一方の部分空間と、入力される評価対象データから生成されるベクトルとが成す第１の角度と、他方の部分空間と、入力される評価対象データから生成されるベクトルとが成す第２の角度とを算出し、算出した第１の角度と第２の角度の差を算出し、算出した差をスコアとする構成とした。これにより、第１の角度と、第２の角度とに基づいて、所定の尺度における加点及び減点の両面の分析が可能となる。
【００２２】
また、本発明によれば、評価装置は、部分空間のそれぞれと、指標ごとの基底ベクトルとに基づいて、指標ごとの関連度を算出し、算出した部分空間ごとの関連度に基づいて、指標ごとの有効度を算出する構成とした。これにより、それぞれの部分空間に対応するモデルの特徴を指標ごとの有効度として定量的に示すことができ、人手によらずに有効な指標を抽出することが可能となる。
【００２３】
また、本発明によれば、評価装置は、部分空間が２つ存在する場合に、指標ごとに一方の部分空間の関連度から他方の部分空間の関連度を減算し、減算して得られた値を指標ごとの有効度として出力する構成とした。これにより、これにより、それぞれの部分空間に対応するモデルの特徴を有効度として定量的に示すことができる。また、さらに差分によって示されるモデル間における重要な指標を定量的及び視覚的に把握することが可能となり、設計工数を削減することが可能となる。
【発明を実施するための最良の形態】
【００２４】
以下、本発明の一実施形態を図面を参照して説明する。
図１は、本実施形態による評価装置１００を示す概略ブロック図である。評価装置１００は例えば、企業の財務情報などの評価に用いられる装置であり、以下評価対象のデータとして企業のデータを適用して記載する。
【００２５】
評価装置１００において、入力部１０は、モデル構成用企業データと、評価対象企業データ及びモデル構成用パラメータを入力し、モデル構成用パラメータ及びモデル構成用企業データをモデル構成用企業データベース（以下、ＤＢと記載）１３に記録し、評価対象企業データを評価対象企業ＤＢ１７に記録する。
【００２６】
部分空間構成部１１は、入力部１０から入力されるモデル構成用データに基づいて、特定の尺度に基づいた部分空間を２つ構成する。ここで、特定の尺度とは、例えば、評価として企業の倒産可能性を評価する場合、倒産確率を特定の尺度とすることができる。倒産確率を特定の尺度とした場合、倒産する確率は０〜１００％の値で示され、当該値に基づいて、例えば、倒産確率が５０％以上の評価対象を「尺度の値の大きい側」として倒産企業群とし、倒産確率が５０％未満の評価対象を「尺度の値の小さい側」として非倒産企業群とすることで２つの部分空間に分けることが可能となる。
【００２７】
部分空間修正部１２は、部分空間構成部１１が構成した部分空間を、後述する適応的学習手法により、最終的に出力されるスコアの精度を高めるように部分空間を修正し、部分空間情報として部分空間データベース（以下、ＤＢと記載）１４に記録する。
【００２８】
有効指標抽出部１５は、部分空間ＤＢ１４から部分空間情報を読み出し、読み出した部分空間情報に対応する部分空間の関連度とその差分を算出し、算出した関連度と差分とを有効指標ＤＢ１６に記録する。スコア算出部１８は、部分空間ＤＢ１４から部分空間情報を読み出し、評価対象企業ＤＢ１７から評価対象企業データを読み出し、読み出した部分空間情報に対応する部分空間における評価対象企業データのスコアを算出し、算出したスコアをスコア算出結果出力部１９に出力する。スコア算出結果出力部１９は、スコア算出部１８から入力されるスコアを値の順に並べて画面等に出力するか、あるいは記憶媒体等に記録する。
【００２９】
なお、部分空間構成部１１は、入力部１０から入力されるモデル構成用データを用いるのではなく、モデル構成用企業ＤＢ１３からモデル構成用データを読み出し、読み出したモデル構成用データを用いるようにしてもよい。
【００３０】
次に図２から図９を参照して、評価装置１００の動作について説明する。
図２から図５はそれぞれ、部分空間構成部１１、部分空間修正部１２、スコア算出部１８及び有効指標抽出部１５の処理を示したフローチャートであり、図６から図９は、当該処理の手順を概念的に示した図である。
【００３１】
最初に、図２及び図６を参照して部分空間構成部１１の処理について説明する。
図２において、まず最初に部分空間構成部１１は、入力部１０からモデル構成用企業データ及び部分空間を構成するＫＬ展開に用いられる部分空間の寄与率を定めるモデル構成用パラメータが入力される（ステップＳａ１）。ここで、モデル構成用企業データは、ｎ×ｐ行列（ｎ：サンプル数（モデルとなる企業の数）、ｐ：次元）で表される。具体的には図６の「手順１」に示されるようにＡ〜Ｂ社の企業のデータとして「売上高」、「売上原価」、「従業員数」が示された場合、ｎ＝３となり、ｐ＝３となる。また、モデル構成用パラメータは、データが有する情報量（具体的にはデータの分散）のうち、どの程度をＫＬ展開で構成される部分空間で近似するか、すなわちデータが有する誤差情報をどれだけ取り除くかに基づいて定められる値であり、０〜１００％の値が設定される。
【００３２】
次に、部分空間構成部１１は、予め定められる特定の尺度の値に基づいて、モデル構成用企業データの中の企業ごとにラベルを割り当て、モデル構成用企業データを２つのデータ群に分割する。例えば、特定の尺度が倒産と非倒産の２値データで表されるラベルとして与えられる場合、そのラベルを用いてサンプルを倒産企業群と非倒産企業群のような２つのデータ群に分類する。また、特定の尺度が上述したように倒産確率等の０〜１００％の連続値あるいはそれに順ずる値で与えられる場合には、尺度の値の分布において尺度の値の大きい側、小さい側の両側から所定の値のサンプルを選択して、倒産企業群と非倒産企業群に分類することができる。なお、上述した例では倒産確率の５０％を境界として「尺度の値の大きい側」と「尺度の値の小さい側」とを分けたが、この分け方は確率値が半分の５０％には限られず、例えば、分割されるサンプル数が同じになるような尺度で分けるようにしてもよい。
【００３３】
このとき、分類されるモデル構成用企業データは、Ａ（ｍ×ｐ行列）とＢ（（ｎ−ｍ）×ｐ行列）で表されることになる（ステップＳａ２）。具体的には、図６の手順１のイメージ図に示されるように「売上高」、「売上原価」、「従業員数」という３つの指標がある場合、各企業のモデル構成用企業データは、３次元の空間の１点に配置され、特定の尺度である倒産確率に基づいて倒産企業群と非倒産企業群の２つのデータ群に分類する。
【００３４】
次に、部分空間構成部１１は、分類した２つのデータ群のそれぞれに対して、自己相関行列を算出し、算出した自己相関行列に対してＫＬ(Karhunen-Loeve)展開を適用する。ＫＬ展開を用いることによって、自己相関行列から部分空間を構成するための基底行列を算出することができる。例えば、上記のように２つのデータ群に分けられたモデル構成用企業データＡ及びＢに対して自己相関行列を算出するとＡＡ’及びＢＢ’として示され、それぞれの基底行列は、ＫＬ展開によりＡ’（ｐ×ｑ行列）及びＢ’（ｐ×ｒ行列）として算出される。なお、ｑとｒは、上述した寄与率パラメータであるモデル構成用パラメータにより定められる値である。そして、部分空間構成部１１は、算出した基底行列から部分空間を構成し（ステップＳａ３）、構成した部分空間を部分空間ＤＢ１４に記録するとともに部分空間修正部１２に出力する（ステップＳａ４）。
【００３５】
なお、上記のＫＬ展開とは、類別すべきカテゴリを特徴ベクトル成分の分布から形成される部分空間への射影を通して判定する統計的手法として知られている部分空間法において、変換するベクトル成分の固有ベクトル、すなわち上述した基底行列を計算するために用いられる手法である。このような固有ベクトルを算出できる計算方法であればＫＬ展開以外の方法であっても適用することが可能である。
【００３６】
次に、図３を参照しつつ部分空間修正部１２の処理について説明する。
部分空間修正部１２は、部分空間構成部１１から出力される部分空間構成部１１が構成した２つの部分空間の情報を取得し、モデル構成用企業ＤＢ１３からモデル構成用企業データを読み出す（ステップＳｂ１）。次に、部分空間修正部１２は、２つの部分空間の情報と、モデル構成用企業データとに基づいて、スコアを算出する。ここで、スコアの算出は、２つの部分空間Ａ’とＢ’のぞれぞれと、個々のモデル構成用企業データから構成されるベクトルとの成す角度の差を算出することによって行われる。すなわち、部分空間Ａ’（ｐ×ｑ行列）とベクトルの成す角度をａｎｇｌｅＡとし、部分空間Ｂ’（ｐ×ｒ行列）とベクトルの成す角度をａｎｇｌｅＢとした場合、その差分であるａｎｇｌｅＡ−ａｎｇｌｅＢがスコアの値となる。
【００３７】
次に、部分空間修正部１２は、算出したスコアを降順に並べて、特定の尺度により分類を行い、さらに次式（２）で示される再現率を算出することで評価を行う（ステップＳｂ２）。
【００３８】
【数２】

【００３９】
なお、式（２）の分母である「倒産企業群の企業数」とは、モデル構成用企業データの各データに予め対応付けて記憶されている本来分類されるべきデータ群を示す情報、例えば、倒産あるいは非倒産のデータ群を示す情報に基づいて算出される数値である。
【００４０】
次に、部分空間修正部１２は、適応的学習によって部分空間の修正を行う。具体的には、部分空間を構成した基となる自己相関行列ＡＡ’とＢＢ’に対して平均学習部分空間法に基づく次式（３）を適用することによって行う。
【００４１】
【数３】

【００４２】
式（３）において、Ｒには自己相関行列でありＡＡ’あるいはＢＢ’が代入される。下付き添え字のｔは、更新時刻、あるいは更新回数を示している。また、γは更新幅のパラメータであり、予め更新させたい度合いに従って、例えば０．４程度の定数が設定される。
【００４３】
Ｒ及びγの上付き添え字ｉ及びｋは、クラスラベルであり、例えばモデル構成用企業データＡのラベルをａとし、モデル構成用企業データＢのラベルをｂとした場合には、ｉ、ｋは、ａあるいはｂとなる。例えば、ｔ＝０の場合、Ｒ_０^ａは、ＡＡ’に対応し、Ｒ_０^ｂは、ＢＢ’に対応する。
【００４４】
また、Ｒ及びγの上付き添え字が（ｉ，ｋ）あるいは（ｋ，ｉ）のように２つあるものは、誤って分類されたサンプルに基づく行列であることを示している。例えば、Ｒ_ｔ^{（ｉ，ｋ）}は、Ｒ_ｔ−１^（ｉ）を用いてスコアを算出し、算出したスコアに基づいて分類が行われたときに、本来ｉとして分類されるべきサンプルがｋ（ｉ≠ｋ）に分類された場合に、当該ｋに分類されたサンプルを検出し、検出したサンプルから生成される行列Ｃの自己相関行列ＣＣ’に対応する。
【００４５】
ここで、図７を参照しつつ、式（３）によって行われる適応的学習について説明する。学習前の部分空間として図７の（適応的学習の方法）の（ａ）の図に示されるような状態が存在したとする。式（３）のｉ＝ａ：倒産を示すラベル、ｋ＝ｂ：非倒産を示すラベルとした場合、式（３）の右辺のそれぞれは以下のような適応的学習の処理を示すことになる。
【００４６】
（第１項）：Ｒ_ｔ−１^ａ：ｔ−１時点で基礎となる倒産企業の自己相関行列の項である。
（第２項）：γ^{（ａ，ｂ）}Ｒ_ｔ^{（ａ，ｂ）}：真のラベルが倒産であるのに、非倒産として分類されたため、倒産のサンプルを取り込むように部分空間を回転及び移動させるために加算を行う自己相関行列の項である。
（第３項）：−γ^{（ｂ，ａ）}Ｒ_ｔ^{（ｂ，ａ）}：真のラベルが非倒産であるのに、倒産として分類されたため、非倒産のサンプルを遠ざけるように部分空間を回転及び移動させるために減算を行う自己相関行列の項である。
【００４７】
図７の（ｂ）の図が、第２項及び第３項の処理を２次元平面上で概念的に示した図であり、縦軸及び横軸は上記した指標に対応する。倒産企業の部分空間は、誤って分類されたサンプルを取り込むように回転及び移動し、非倒産企業の部分空間は、誤って分類されたサンプルから離れるように回転及び移動することになる。そして最終的に図７の（ｃ）の図に示すように全てのサンプルについて本来分類されるべき部分空間に含まれることになる（ステップＳｂ３）。
【００４８】
次に、部分空間修正部１２は、修正された部分空間に基づいて、再現率を算出し、前回の再現率と今回算出した再現率とに基づいて比較を行う（ステップＳｂ４）。例えば、今回の再現率を前回の再現率で割った割合の値が予め定められる一定割合値を超えていない場合には、修正を進めるためステップＳｂ４の処理に戻り、超えている場合には、部分空間の情報を出力し、部分空間ＤＢ１４に記録する（ステップＳｂ５）。
【００４９】
次に、図４を参照しつつスコア算出部１８の処理について説明する。
まず最初に、スコア算出部１８は、部分空間修正部１２によって構成され、部分空間ＤＢ１４に記録された部分空間の情報を部分空間ＤＢ１４から読み出す。また、評価対象企業データを評価対象企業ＤＢ１７から読み出す（ステップＳｃ１）。ここで、評価対象企業データは、ｎ’×ｐ行列（ｎ’：サンプル数、ｐ：次元）で構成されているとする。
【００５０】
次に、スコア算出部１８は、図８の手順３に示すように、読み出した部分空間の情報によって示される部分空間と、読み出した評価対象企業データとに基づいて、各評価対象企業データのスコアを算出する。スコアの算出は、部分空間修正部１２の処理において説明したように、部分空間ごとの評価対象企業データから構成されるベクトルとの成す角度を算出し、算出した角度の差がスコアとなる（ステップＳｃ２）。
【００５１】
次に、スコア算出部は、他の評価対象企業データが存在するか否かを判定する（ステップＳｃ３）。他の評価対象企業データが存在する場合には、ステップＳｃ２の処理を繰り返し、他の評価対象企業が存在しない場合には、スコアをスコア算出結果出力部１９に出力して処理を終了する（ステップＳｃ４）。
【００５２】
次に、図５を参照しつつ有効指標抽出部１５の処理について説明する。有効指標の抽出とは、例えば、倒産と非倒産の２つのモデルが存在する場合に、倒産と非倒産を分類する高い要因となっている指標を抽出することである。
【００５３】
まず最初に有効指標抽出部１５は、部分空間修正部１２によって構成され、部分空間ＤＢ１４に記録された部分空間の情報を部分空間ＤＢ１４から読み出す（ステップＳｄ１）。次に、読み出した各部分空間に対して、分析指標の基底ベクトルとの角度を算出し、算出した角度を、モデルと分析指標との関連度する。また、さらに各部分空間から得られる関連度について差分を算出する（ステップＳｄ２）。そして、算出した関連度及び差分を有効指標ＤＢ１６に記録する（ステップＳｄ３）。
【００５４】
図９は、図５の処理の具体例を示した図である。図９では、部分空間として倒産と非倒産の２つの部分空間が存在し、指標として「売上高」、「原価」、「販管費」、「負債比率」の４つの指標が存在する場合についての有効指標抽出を示している。そして、非倒産及び倒産の部分空間と各指標の基底ベクトルとの角度を算出して、関連度とし、さらに、非倒産と倒産の関連度の差を算出して、大きい値の順に並べることで「負債比率」が非倒産と倒産を分類する最も高い要因となっており、この指標が倒産企業を特徴付けるものとなっていることが視覚的に示されている。
【００５５】
（実際の企業データを用いた実施例）
次に、図１０から図１３を参照して、上記の評価装置１００を実際の企業データに適用して分析を行った実施例について説明する。
【００５６】
モデル構成用データ及び評価対象データとして、日経メディアマーケティング株式会社のデータバンクＮＥＥＤＳ財務データを用い、モデル構成用データとして２００２年度のデータを利用し、評価用データとして２００３年度のデータを使用している。サンプル数は、２００２年度のデータにおいて１９５社であり、２００３年度のデータにおいて１９０社である。また、分析には１１２個の指標を用いた。
【００５７】
上記の実施形態では特定の尺度として「倒産」を例として説明したが、当該実施例では知的財産価値の一手法である「知の潜在力」を特定の尺度としており、当該尺度に基づいて２００２年度のサンプルと２００３年度のサンプルを予め分類した。分類結果は、２００２年度のサンプルである１９５社は、上位（知の潜在力ありとして分類される企業）が９７社であり、下位（知の潜在力なしとして分類される企業）９８社として分類され、２００３年度のサンプルである１９０社は、上位９２社、下位９８社として分類された。
【００５８】
図１０は、評価装置１００を適用し、実際のスコアの算出を行った結果のうち、上位１９社の結果を示した図である。図１０において、「知の潜在力あり」の項目に示される数値は、知の潜在力ありに対応する部分空間と当該企業の評価対象企業データから構成されるベクトルとの成す角度であり、「知の潜在力なし」の項目に示される数値は、知の潜在力なしに対応する部分空間と当該企業の評価対象企業データから構成されるベクトルとの成す角度である。また、「差分」の項目は、「知の潜在力あり」の項目の数値と「知の潜在力なし」の項目の数値との差であり、当該「差分」の値がスコアとなる。
【００５９】
図１１は、評価装置１００における部分空間修正部１２において適応的学習を行うことにより部分空間の修正を行った場合の精度の向上度合い示した図である。「差分」の項目の値は、スコアの値に基づいて「知の潜在力あり」に分類された企業数に基づいて、次式（４）により算出された再現率を示した値である。また、「あり」の項目の値は、図１０の「知の潜在力あり」の項目の数値に基づいて「知の潜在力あり」に分類された企業数に基づいて、次式（４）により算出された再現率を示した値である。また、「なし」の項目の値は、図１０の「知の潜在力なし」の項目の数値に基づいて「知の潜在力あり」に分類された企業数に基づいて、次式（４）により算出された再現率を示した値である。
【００６０】
【数４】

【００６１】
図１１（ａ）は、フィードバック前、すなわち部分空間の修正を行う前の精度であり、図１１（ｂ）は、フィードバックを行った後の精度であり、いずれの項目においても再現率が向上していることが示されている。
【００６２】
図１２は、評価装置１００の有効指標抽出部１５により算出された指数ごとの関連度の値を可視化するために、生成されたグラフを示したものである。図１２の菱形のマーク（あり）で示されたグラフは、「知の潜在力あり」の部分空間に基づいて算出された関連度であり、四角のマーク（なし）で示されたグラフは、「知の潜在力なし」の部分空間に基づいて算出された関連度である。三角のマーク（差分）で示されたグラフは「知の潜在力あり」の部分空間に基づいて算出された関連度と「知の潜在力なし」の部分空間に基づいて算出された関連度との差であり、図１２の最も右の指標である「従業員数」が最も「知の潜在力あり」と「知の潜在力なし」を分ける最も高い要因になっていることが示されている。
【００６３】
図１３は、本実施形態に係る評価装置１００による精度と従来のロジットモデルによる精度を比較するための図である。図１３に示されるように、本実施形態では、部分空間を修正する前（フィードバック前）であっても、部分空間を修正した後（フィードバック後）であっても、従来のロジットモデルによる精度よりも高い精度が得られている。
【００６４】
なお、上記の実施形態では、例として企業のデータを用いたが、本発明はこれに限られず、指標によって示される様々なデータを対象とすることができる。
また、上記の実施形態では、特定の尺度に対応する視点数を２つとしたが、本発明はこれに限られず、複数の視点数により実施することも可能である。
【００６５】
上述の評価装置は内部に、コンピュータシステムを有している。そして、上述した部分空間構成部１１、部分空間修正部１２、スコア算出部１８、有効指標抽出部１５に係る処理は、プログラムの形式でコンピュータ読み取り可能な記録媒体に記憶されており、このプログラムをコンピュータが読み出して実行することによって、上記処理が行われる。ここでコンピュータ読み取り可能な記録媒体とは、磁気ディスク、光磁気ディスク、ＣＤ−ＲＯＭ、ＤＶＤ−ＲＯＭ、半導体メモリ等をいう。また、このコンピュータプログラムを通信回線によってコンピュータに配信し、この配信を受けたコンピュータが当該プログラムを実行するようにしても良い。
【図面の簡単な説明】
【００６６】
【図１】本実施形態に係る評価装置の内部構成を示すブロック図である。
【図２】同実施形態に係る部分空間構築部に係る処理を示したフローチャートである。
【図３】同実施形態に係る部分空間修正部に係る処理を示したフローチャートである。
【図４】同実施形態に係るスコア算出部に係る処理を示したフローチャートである。
【図５】同実施形態に係る有効指標抽出部に係る処理を示したフローチャートである。
【図６】同実施形態に係る部分空間構築部に係る処理の概念図である。
【図７】同実施形態に係る部分空修正部に係る処理の概念図である。
【図８】同実施形態に係るスコア算出部に係る処理の概念図である。
【図９】同実施形態に係る有効指標抽出部に係る処理の概念図である。
【図１０】本実施形態に係る評価装置を適用した実施結果（その１）を示した図である。
【図１１】本実施形態に係る評価装置を適用した実施結果（その２）を示した図である。
【図１２】本実施形態に係る評価装置を適用した有効指標抽出の実施結果を示した図である。
【図１３】本実施形態に係る評価装置を適用した実施結果と従来技術の実施結果を示した図である。
【符号の説明】
【００６７】
１０入力部
１１部分空間構成部
１２部分空間修正部
１８スコアリング部
１００評価装置

【特許請求の範囲】
【請求項１】
複数の指標によって示されるデータを含む評価対象データと、前記評価対象データを評価する基準となるモデル構成用データとを入力する入力手段と、
前記入力手段が入力する前記モデル構成用データを、予め定められる所定の尺度に基づいて複数のデータ群に分類し、分類される前記データ群ごとに、当該データ群に含まれる前記モデル構成用データに基づいて前記データ群ごとの部分空間を構成する部分空間構成手段と、
前記部分空間構成手段によって構成される複数の部分空間のそれぞれと、前記入力手段が入力する評価対象データから生成されるベクトルとが成す角度を算出し、算出した角度に基づいて当該評価対象データのスコアを算出するスコア算出手段と、
を備えたことを特徴とする評価装置。
【請求項２】
前記部分空間構成手段により構成される複数の部分空間と、前記入力手段が入力する前記モデル構成用データと、予め前記モデル構成用データごとに定められる前記モデル構成用データが本来属する前記データ群を示す情報と、に基づいて所定の演算を行うことにより前記部分空間を空間内で移動させ、前記モデル構成用データが移動後の部分空間に基づいて分類されることにより属することとなるデータ群を示す情報と、前記本来属するデータ群の情報との一致する割合が一定割合になるまで前記部分空間を移動させる部分空間修正手段を備え、
前記スコア算出手段は、
前記部分空間修正手段による移動後の複数の部分空間のそれぞれと、前記入力手段が入力する評価対象データから生成されるベクトルとが成す角度を算出し、算出した角度に基づいて当該評価対象データのスコアを算出することを特徴とする請求項１に記載の評価装置。
【請求項３】
前記スコア算出手段は、
前記複数の部分空間が２つ存在する場合、一方の部分空間と、前記入力手段が入力する評価対象データから生成されるベクトルとが成す第１の角度と、他方の部分空間と、前記入力手段が入力する評価対象データから生成されるベクトルとが成す第２の角度とを算出し、算出した前記第１の角度と前記第２の角度の差を算出し、算出した差をスコアとすることを特徴とする請求項１または２に記載の評価装置。
【請求項４】
前記部分空間のそれぞれと、前記指標ごとの基底ベクトルとに基づいて、前記指標ごとの関連度を算出し、算出した前記部分空間ごとの関連度に基づいて、前記指標ごとの有効度を算出する有効指標抽出手段を備えたことを特徴とする請求項１から３のいずれか１つに記載の評価装置。
【請求項５】
前記有効指標抽出手段は、
前記部分空間が２つ存在する場合に、前記指標ごとに一方の部分空間の関連度から他方の部分空間の関連度を減算し、減算して得られた値を前記指標ごとの有効度として出力することを特徴とする請求項４に記載の評価装置。
【請求項６】
評価装置のコンピュータに、
複数の指標によって示されるデータを含む評価対象データと、前記評価対象データを評価する基準となるモデル構成用データとを入力するステップと、
入力される前記モデル構成用データを、予め定められる所定の尺度に基づいて複数のデータ群に分類し、分類される前記データ群ごとに、当該データ群に含まれる前記モデル構成用データに基づいて前記データ群ごとの部分空間を構成するステップと、
構成される複数の部分空間のそれぞれと、前記入力手段が入力する評価対象データから生成されるベクトルとが成す角度を算出し、算出した角度に基づいて当該評価対象データのスコアを算出するステップと、
を実行させるためのコンピュータプログラム。

【図１】