説明

多次元データ選択装置及び多次元データ選択方法及び多次元データ選択プログラム

【課題】一般の多次元データ分析において、次元の重要度を定義することにより、重要な次元を選択的に提示する。
【解決手段】次元重要度算出部102は、次元データ記録部101に記憶されたn次元のデータから、m(mはn>m≧1となる整数)次元のデータの組み合わせを複数抽出し、抽出した組み合わせごとに、m次元空間におけるデータの分布の特徴を処理装置により分析する。次元選択部104は、次元重要度算出部102により算出された各組み合わせの重要度に基づいて、いずれかの組み合わせを選択する。データ提示部105は、次元選択部104により選択された組み合わせを構成するm次元のデータを出力装置により出力する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、多次元データ選択装置及び多次元データ選択方法及び多次元データ選択プログラムに関するものである。本発明は、特に、多次元データ可視化のための情報選択装置及び情報選択方法及び情報選択プログラムに関するものである。
【背景技術】
【0002】
一般にデータ分析において、データの特徴を把握するための手段として、データを視覚的に提示したいという要求がある。しかしながら、多くの場合において、可視化の対象となるデータはその次元数が多いために、そのままでは可視化に適さないという問題がある。これは、ヒトの視覚が基本的に3次元程度しか認識できないことに起因している。提示すべきデータの次元数がこれを超えた場合には、これらのデータを視覚的に提示することには困難が生じる。
【0003】
このような問題に対して、低次元の組み合わせを複数同時に提示する手法や、高次元情報を色や形状に対応させることで低次元空間にマッピングして提示する手法等が提案されている(例えば、特許文献1〜3参照)。また、特異値分解や、自己組織化マップ等により、多次元データの特徴を保持しつつ、より低次元のデータに変換する手法も提案されている(例えば、特許文献4〜6参照)。また、多次元データのうち、有用な次元を選択的に提示する手法も提案されている(例えば、特許文献7,8)。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開平4−219862号公報
【特許文献2】特開2006−65482号公報
【特許文献3】特開平3−100423号公報
【特許文献4】特開2001−75642号公報
【特許文献5】特表2002−509303号公報
【特許文献6】特開2007−226639号公報
【特許文献7】特開2004−252797号公報
【特許文献8】特開2007−42016号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
実際の分析においては、上記のように従来から提案されている手法を用いたとしても、視覚的に提示可能な次元数に対して、提示すべき次元数が多過ぎるという場合がある。例えば、空調機の動作を分析する際には、温度に関する代表的なデータ項目、即ち、次元として、室内温度、室外温度、冷媒入口温度、冷媒出口温度等を分析する必要がある。これらの次元に加えて、湿度、圧力、流量、電力等についても同様に複数の次元があり、さらには複数の空調機の動作を同時に分析すること等を考えると、容易に次元数が爆発する。このような分析においては、特許文献1〜3のような手法では、全体の一部の次元しか提示することができないという課題がある。また、特許文献4〜6のような手法では、低次元化してもなお視覚的に提示するには次元が多過ぎるか、又は、低次元化し過ぎることにより、元のデータの持つ特徴が喪失するという課題がある。
【0006】
このような、本質的に提示すべき次元数が多過ぎるために視覚的な提示が困難であるという課題に対して、元のデータのうち重要と思われる次元を選択的に提示することで、分析作業を効率化する手法が考えられる。特許文献7においては、過去の分析において重要と判定された次元を記憶する方法が開示されている。また、特許文献8においては、ルールの分布から次元の重要度を判定する方法が開示されている。しかしながら、特許文献7の方法では、未知の次元の重要度を判定することができないという課題があり、特許文献8の方法では、ルールの定義されない一般の分析への適用方法は明らかでない。
【0007】
本発明は、例えば、一般の多次元データ分析において、次元の重要度を定義することにより、重要な次元を選択的に提示することを目的とするものである。
【課題を解決するための手段】
【0008】
本発明の一の態様に係る多次元データ選択装置は、
n(nはn≧3となる整数)次元のデータを予め記憶する記憶装置と、データの演算を行う処理装置と、データの出力を行う出力装置とを具備するとともに、
前記記憶装置に記憶されたn次元のデータから、m(mはn>m≧1となる整数)次元のデータの組み合わせを複数抽出し、抽出した組み合わせごとに、m次元空間におけるデータの分布の特徴を前記処理装置により分析し、当該分析結果に基づいて、各組み合わせの重要度を前記処理装置により算出する重要度算出部と、
前記重要度算出部により算出された各組み合わせの重要度に基づいて、いずれかの組み合わせを選択する選択部と、
前記選択部により選択された組み合わせを構成するm次元のデータを前記出力装置により出力するデータ出力部とを備えることを特徴とする。
【発明の効果】
【0009】
本発明の一の態様によれば、多次元データ選択装置の重要度算出部が、一般の多次元データ分析におけるn次元のデータから、m次元のデータの組み合わせを複数抽出し、抽出した組み合わせごとに、m次元空間におけるデータの分布の特徴を分析し、当該分析結果に基づいて、各組み合わせの重要度を算出するため、重要な次元を選択的に提示することが可能となる。
【図面の簡単な説明】
【0010】
【図1】実施の形態1に係る情報選択装置の構成を示すブロック図である。
【図2】実施の形態1に係る情報選択装置の構成例を示すブロック図である。
【図3】実施の形態1に係る(a)次元データ及び(b)次元重要度の記録形式を示す模式図である。
【図4】実施の形態1に係る情報選択装置のハードウェア構成の一例を示す図である。
【図5】実施の形態1に係る情報選択装置の動作を示すフローチャートである。
【図6】実施の形態1に係る重要度算出処理の手順を示すフローチャートである。
【図7】実施の形態1に係るデータ提示処理の手順を示すフローチャートである。
【図8】(a)実施の形態2及び(b)実施の形態3に係る2次元の組み合わせでデータがプロットされたグラフを示すフローチャートである。
【発明を実施するための形態】
【0011】
以下、本発明の実施の形態について、図を用いて説明する。
【0012】
実施の形態1.
図1は、本実施の形態に係る多次元データ可視化のための情報選択装置10の構成を示すブロック図である。
【0013】
図1において、多次元データ可視化のための情報選択装置10(多次元データ選択装置の一例)は、次元抽出部100、次元データ記録部101、次元重要度算出部102、次元重要度記録部103、次元選択部104、データ提示部105を備える。
【0014】
次元抽出部100は、評価の対象となる次元、及び、次元に対応するデータを取得するものである。次元データ記録部101は、次元抽出部100によって抽出された次元に対応するデータを記録するものである。次元重要度算出部102(重要度算出部の一例)は、次元データ記録部101に記録された次元の重要度を算出するものである。次元重要度記録部103は、次元重要度算出部102により算出された次元の重要度を蓄積するものである。次元選択部104(選択部の一例)は、次元重要度記録部103に蓄積された重要度情報に基づき、可視化に用いる次元の選択を行うものである。データ提示部105(データ出力部の一例)は、次元選択部104により選択された次元に基づき、データの提示を行うものである。
【0015】
上記のように、情報選択装置10は、多次元データの可視化を行うものであり、以下の構成により、次元又は次元の組み合わせに対して、重要度を算出することにより、重要度の高い次元又は次元の組み合わせを優先的に提示可能とすることを特徴とする。
(1)重要度算出対象とする次元及び次元データを抽出する次元抽出部100
(2)抽出された次元データを記録する次元データ記録部101
(3)抽出された次元データから次元の重要度を算出する次元重要度算出部102
(4)算出された次元重要度を記録する次元重要度記録部103
(5)次元の重要度に基づいて提示すべき次元を選択する次元選択部104
(6)選択された次元データを提示するデータ提示部105
【0016】
図2は、多次元データ可視化のための情報選択装置10の構成例を示すブロック図である。以下では、この例に基づいて、本実施の形態の詳細を述べる。
【0017】
図2において、多次元データ可視化のための情報選択装置10は、前述したように、次元抽出部100、次元データ記録部101、次元重要度算出部102、次元重要度記録部103、次元選択部104、データ提示部105を備えるほか、多次元データ源201を備える。
【0018】
また、情報選択装置10は、図2に示していない処理装置、記憶装置、入力装置、出力装置等のハードウェアを備える。ハードウェアは情報選択装置10の各部によって利用される。例えば、処理装置は、情報選択装置10の各部でデータや情報の演算、加工、読み取り、書き込み等を行うために利用される。記憶装置は、そのデータや情報を記憶するために利用される。また、入力装置は、そのデータや情報を入力するために、出力装置は、そのデータや情報を出力するために利用される。
【0019】
多次元データ源201は、分析の対象となるデータを格納するものである。例えば、センサによって得られる物理的な計測量やアンケートによって得られる回答等を記録したものである。多次元データ源201は、記憶装置に実装されるものとする。なお、多次元データ源201として、外部のデータベース等を利用してもよい。
【0020】
次元抽出部100は、次元抽出手法により、多次元データ源201より次元を処理装置で抽出し、抽出した次元データを次元データ記録部101に記録する。ここで、次元抽出手法とは、多次元データ源201に蓄積されたデータを、何らかの処理により1次元に投影する任意の手法をいう。例えば、RDB(リレーショナルデータベース)におけるカラムの抽出のように、データの次元を直接指定する手法や、次元圧縮手法のように、データを特定の処理により変換して次元を抽出する手法等が次元抽出手法に相当する。また、次元データとは、多次元データ源201のデータのうち、上記の次元抽出手法により抽出された次元に投影されたデータのことである。
【0021】
次元データ記録部101は、後述する次元重要度算出部102における分析に使用するため、次元データを保持する。この次元データは、後述する次元選択部104によって該当する次元が選択された際に、データ提示部105に渡される。次元データ記録部101は、記憶装置に実装されるものとする。
【0022】
次元データ記録部101においては、図3(a)に示されるような記録形式により、次元データを管理する。次元データは、次元データ間のデータをひも付ける次元データID(識別子)と、当該次元データIDのデータに対応する次元データ値から構成される。また、各次元データは、次元を表すID(次元ID)により管理される。例えば、RDBにより実現する場合には、次元IDはテーブル名に相当し、次元データIDはテーブルを結合する際にキーとなる主キーに相当し、次元データ値は元となるデータを当該次元に投影した際の値となる。
【0023】
具体的には、次元データ記録部101は、n(nはn≧3となる整数)次元のデータとして、例えば、設備に係る測定データを記憶する。設備とは、ある場所、建物等に設置される装置、機器、システム等のことをいう。具体例としては、空調機が挙げられる。この場合、多次元データ源201は、室内温度、室外温度、冷媒入口温度、冷媒出口温度等、温度に係る測定データや、湿度、圧力、流量、電力等に係る測定データを記憶する。前述したように、室内温度、室外温度、冷媒入口温度、冷媒出口温度等は、各々が1つの次元となる。図3(a)に示されるような記録形式を用いた場合、次元データ記録部101は、例えば、室内温度、室外温度、冷媒入口温度、冷媒出口温度の各次元の測定データをテーブルに格納するRDBを構成する。例えば、室内温度の測定データを格納するテーブルには、室内温度に対応する次元IDが割り当てられ、室内温度の測定時刻に対応する次元データIDごとに、室内温度の測定値である次元データ値が格納される。そして、室外温度の測定データを格納するテーブルには、室外温度に対応する次元IDが割り当てられ、「室内温度」テーブルと同様の次元データIDごとに、室外温度の測定値である次元データ値が格納される。これにより、「室内温度」テーブルと「室外温度」テーブルに格納された同時刻の測定値を示す次元データ値は、次元データIDでひも付けられるため、後述するように、室内温度と室外温度との次元の組み合わせについてデータの分布の特徴を分析することができる。「冷媒入口温度」テーブル、「冷媒出口温度」テーブルについても同様となる。なお、次元データIDは、時刻に対応するID以外に、複数の空調機の各々を識別するIDや空調機が設置された位置を識別するIDであってもよいし、これらの組み合わせのIDであってもよい。
【0024】
次元データ記録部101は、次元データの更新頻度に応じて、DB又はメモリ上のキャッシュ等として提供されることが望ましいが、次元抽出部100が十分に高速な場合には次元データ記録部101を設けず、都度次元データの再計算を処理装置で行ってもよい。
【0025】
次元重要度算出部102は、次元データ記録部101に記録された次元データ又は次元データの組み合わせに対して、その次元又は次元の組み合わせにおけるデータの分布の特徴を処理装置で数値化することにより、重要度を算出するものである。算出された重要度は、対応する次元又は次元の組み合わせを表す識別子とともに、次元重要度記録部103に記録される。重要度を数値化する際の指標としては、データの分布形状に関するパラメータである、平均、分散、一様性、分離度、外れ値の割合(外れ値の数)、外れ値の平均からの距離等が好適である。また、周波数特性(フーリエ変換の結果)や特定パターンとの相関等もデータの形状を抽出する指標として好適である。
【0026】
なお、重要度の算出は、全ての次元又は次元の組み合わせについて行われることが望ましいが、分析対象の特徴や分析の目的から明らかに不要と判定されるものについては、重要度算出の対象から除外してもよい。本実施の形態の趣旨は、ユーザが容易に認識可能な次元数において、適切な次元の組み合わせを提供することにある。よって、一般的には次元の組み合わせ数は1ないし2次元を想定している。しかし、全く同じ理由から、ユーザが十分に理解し易いと判断する次元数であれば、3つ以上の次元の組み合わせを用いてもよい。
【0027】
上記のように、次元重要度算出部102は、次元データ記録部101に記憶されたn次元のデータから、n次元よりも次元数が小さいm(mはn>m≧1となる整数)次元のデータの組み合わせを複数抽出し、抽出した組み合わせごとに、m次元空間におけるデータの分布の特徴を処理装置により分析する。そして、当該分析結果に基づいて、各組み合わせの重要度を処理装置により算出する。
【0028】
前述した空調機の温度に係る測定データの例では、次元重要度算出部102は、例えば、「室内温度」テーブルと「室外温度」テーブルに格納された次元データ値(測定値)を、対応する次元データID(時刻)ごとに、2次元平面にプロットし(あるいは、これに相当する演算処理を行い)、2次元平面におけるデータの分離度(分布の特徴の一例)の計算を処理装置により行う。そして、次元重要度算出部102は、当該計算結果に基づいて、室内温度と室外温度との2次元の組み合わせの重要度を処理装置により算出する。例えば、次元重要度算出部102は、計算したデータの分離度の大きさに比例させて、当該組み合わせの重要度の高さを決定する(分離度が大きいものほど重要度を高くする)。あるいは、計算したデータの分離度の大きさに反比例させて、当該組み合わせの重要度の高さを決定する(分離度が小さいものほど重要度を高くする)。あるいは、予め定められた算出式を用いて、データの分離度を重要度に換算する。なお、次元重要度算出部102は、2次元平面におけるデータの外れ値の検定(例えば、空調機の故障に関する分析を行う際に有効)、2次元空間におけるデータと特定の関数との相関の計算(例えば、空調機の特性に関する分析を行う際に有効)、2次元空間におけるデータの一様性の検定(例えば、空調機の試験に関する分析を行う際に有効)等を処理装置により行い、当該計算結果又は当該検定結果に基づいて、当該組み合わせの重要度を算出してもよい。次元重要度算出部102は、室内温度と室外温度との2次元の組み合わせ以外にも、室内温度と冷媒入口温度との2次元の組み合わせ、室内温度と冷媒出口温度との2次元の組み合わせ、室外温度と冷媒入口温度との2次元の組み合わせ、室外温度と冷媒出口温度との2次元の組み合わせ、冷媒入口温度と冷媒出口温度との2次元の組み合わせについても、同様に重要度を算出する。
【0029】
なお、次元重要度算出部102は、次元データ記録部101に記憶されたn次元のデータから、上記の例のように2次元のデータの組み合わせを抽出するほか、3次元又は4次元以上のデータの組み合わせを抽出してもよい。前述した空調機の温度に係る測定データの例で3次元のデータの組み合わせを抽出する場合、次元重要度算出部102は、例えば、「室内温度」テーブルと「室外温度」テーブルと「冷媒入口温度」テーブルに格納された次元データ値(測定値)を、対応する次元データID(時刻)ごとに、3次元空間にプロットし(あるいは、これに相当する演算処理を行い)、3次元空間におけるデータの分離度(分布の特徴の一例)の計算を処理装置により行う。そして、次元重要度算出部102は、当該計算結果に基づいて、室内温度と室外温度と冷媒入口温度との3次元の組み合わせの重要度を処理装置により算出する。次元重要度算出部102は、それ以外にも、室内温度と室外温度と冷媒入口温度との3次元の組み合わせ、室内温度と冷媒入口温度と冷媒出口温度との3次元の組み合わせ、室外温度と冷媒入口温度と冷媒出口温度との3次元の組み合わせについても、同様に重要度を算出する。
【0030】
次元重要度記録部103は、次元重要度算出部102によって算出された次元の重要度を記録する。
【0031】
次元重要度記録部103においては、図3(b)に示されるような記録形式により、次元重要度を管理する。次元重要度は、重要度算出の対象となった次元のID(次元ID)又は次元の組み合わせのID(次元IDの組み合わせ)と、当該次元又は次元の組み合わせに対して算出された重要度の値(次元重要度値)から構成される。また、複数の異なる目的を持った評価による重要度に対して、次元重要度IDを付与して個別に管理してもよい。例えば、RDBにより実現する場合には、次元重要度IDはテーブル名に相当し、次元IDのカラムを組み合わせる次元数だけ用意して、次元IDとヌル値を組み合わせることにより、次元IDの組み合わせを表現し、さらに当該タプルに次元重要度値を付加することで、上記構成が実現される。
【0032】
前述した空調機の温度に係る測定データの例では、次元重要度記録部103は、次元重要度算出部102により算出された室内温度と室外温度との2次元の組み合わせ等の重要度を記憶する。図3(b)に示されるような記録形式を用いた場合、次元重要度記録部103は、例えば、1つの次元重要度IDが割り当てられたテーブルに、室内温度と室外温度との2次元の組み合わせに対応する次元IDとして、室内温度の次元IDと室外温度の次元IDとの組み合わせを格納し、これに対応する次元重要度値として、次元重要度算出部102により算出された室内温度と室外温度との2次元の組み合わせの重要度を格納する。室内温度と冷媒入口温度との2次元の組み合わせ、室外温度と冷媒入口温度との2次元の組み合わせ、室内温度と冷媒出口温度との2次元の組み合わせ、室外温度と冷媒出口温度との2次元の組み合わせについても、同様に、当該テーブルに、次元IDごとに次元重要度値を格納する。
【0033】
次元選択部104は、次元重要度記録部103に記録された重要度を用いてユーザに提示すべき次元を選択し、選択された次元に対応する次元データを次元データ記録部101より取得し、データ提示部105に提供する。提示すべき次元は、処理装置により自動で選択されてもよいし、入力装置を介してユーザにより手動で選択されてもよい。いずれにおいても、重要度の高い次元又は次元の組み合わせを優先的に提示できることが望ましい。
【0034】
上記のように、次元選択部104は、次元重要度算出部102により算出された各組み合わせの重要度に基づいて、いずれかの組み合わせを選択する。例えば、次元選択部104は、前述したように次元重要度記録部103によってテーブルに格納されている次元重要度値のうち、最高値又は最も値が高い所定数の次元重要度値を選択する。あるいは、次元選択部104は、次元の組み合わせ及び対応する次元重要度値の一覧を出力装置により画面等に出力してユーザ(例えば、空調機等の設備の管理者)に選択を促し、入力装置によりユーザから入力を受け付け、ユーザによる入力に基づいて次元重要度値を選択する。
【0035】
データ提示部105は、次元選択部104より提供された次元データを可視化して出力装置に出力する。可視化手法としては、主に散布図、ヒストグラム等の1ないし2次元の可視化手法を想定するが、ユーザが十分に理解し易いと判断すれば、より高次の可視化手法を採用してもよい。また、可視化の手段は、PC(パーソナルコンピュータ)画面への表示やプリンタによる印刷、その他上記の可視化手法による可視化に適した任意の手段であってよい。
【0036】
上記のように、データ提示部105は、次元選択部104により選択された組み合わせを構成するm次元のデータを出力装置により出力する。具体的には、データ提示部105は、次元選択部104により選択された組み合わせを構成するm次元のデータを出力装置(例えば表示装置や印刷装置)によりグラフ等として画面に表示したり、紙に印刷したりする。例えば、データ提示部105は、次元選択部104により選択された組み合わせについてm次元空間におけるデータの分布を示すグラフを表計算ソフトウェアの描画モジュール等を用いて出力装置により表示する。前述した空調機の温度に係る測定データの例で、次元選択部104により室内温度と室外温度との2次元の組み合わせが選択されたとすると、データ提示部105は、「室内温度」テーブルと「室外温度」テーブルに格納された次元データ値(測定値)を、対応する次元データID(時刻)ごとに、2次元平面にプロットして作成したグラフを出力装置により表示する。また、データ提示部105は、次元選択部104により選択された組み合わせを構成するm次元のデータを、上記提示方法に利用することを目的として、出力装置(例えば通信装置)によりCSV(Comma・Separated・Values)形式等で出力してもよい。この際に重要度を出力する方法としては、図3(b)の形式による付加情報を出力する方法や、重要度の高い順番にカラムを列挙する方法等がある。
【0037】
図4は、情報選択装置10のハードウェア構成の一例を示す図である。
【0038】
図4において、情報選択装置10は、コンピュータであり、LCD901(Liquid・Crystal・Display)(表示装置)、キーボード902(K/B)、マウス903、FDD904(Flexible・Disk・Drive)、CDD905(Compact・Disc・Drive)、プリンタ906(印刷装置)といったハードウェアデバイスを備えている。これらのハードウェアデバイスはケーブルや信号線で接続されている。LCD901の代わりに、CRT(Cathode・Ray・Tube)、あるいは、その他の表示装置が用いられてもよい。マウス903の代わりに、タッチパネル、タッチパッド、トラックボール、ペンタブレット、あるいは、その他のポインティングデバイスが用いられてもよい。
【0039】
情報選択装置10は、プログラムを実行するCPU911(Central・Processing・Unit)を備えている。CPU911は、処理装置の一例である。CPU911は、バス912を介してROM913(Read・Only・Memory)、RAM914(Random・Access・Memory)、通信ボード915(通信装置)、LCD901、キーボード902、マウス903、FDD904、CDD905、プリンタ906、HDD920(Hard・Disk・Drive)と接続され、これらのハードウェアデバイスを制御する。HDD920の代わりに、フラッシュメモリ、光ディスク装置、メモリカードリーダライタ又はその他の記憶媒体が用いられてもよい。
【0040】
RAM914は、揮発性メモリの一例である。ROM913、FDD904、CDD905、HDD920は、不揮発性メモリの一例である。これらは、記憶装置の一例である。通信ボード915、キーボード902、マウス903、FDD904、CDD905は、入力装置の一例である。また、通信ボード915、LCD901、プリンタ906は、出力装置の一例である。
【0041】
通信ボード915は、LAN(Local・Area・Network)等に接続されている。通信ボード915は、LANに限らず、IP−VPN(Internet・Protocol・Virtual・Private・Network)、広域LAN、ATM(Asynchronous・Transfer・Mode)ネットワークといったWAN(Wide・Area・Network)、あるいは、インターネットに接続されていても構わない。LAN、WAN、インターネットは、ネットワークの一例である。
【0042】
HDD920には、オペレーティングシステム921(OS)、ウィンドウシステム922、プログラム群923、ファイル群924が記憶されている。プログラム群923のプログラムは、CPU911、オペレーティングシステム921、ウィンドウシステム922により実行される。プログラム群923には、本実施の形態の説明において「〜部」として説明する機能を実行するプログラムが含まれている。プログラムは、CPU911により読み出され実行される。ファイル群924には、本実施の形態の説明において、「〜データ」、「〜情報」、「〜ID(識別子)」、「〜フラグ」、「〜結果」として説明するデータや情報や信号値や変数値やパラメータが、「〜ファイル」や「〜データベース」や「〜テーブル」の各項目として含まれている。「〜ファイル」や「〜データベース」や「〜テーブル」は、RAM914やHDD920等の記憶媒体に記憶される。RAM914やHDD920等の記憶媒体に記憶されたデータや情報や信号値や変数値やパラメータは、読み書き回路を介してCPU911によりメインメモリやキャッシュメモリに読み出され、抽出、検索、参照、比較、演算、計算、制御、出力、印刷、表示といったCPU911の処理(動作)に用いられる。抽出、検索、参照、比較、演算、計算、制御、出力、印刷、表示といったCPU911の処理中、データや情報や信号値や変数値やパラメータは、メインメモリやキャッシュメモリやバッファメモリに一時的に記憶される。
【0043】
本実施の形態の説明において用いるブロック図やフローチャートの矢印の部分は主としてデータや信号の入出力を示す。データや信号は、RAM914等のメモリ、FDD904のフレキシブルディスク(FD)、CDD905のコンパクトディスク(CD)、HDD920の磁気ディスク、光ディスク、DVD(Digital・Versatile・Disc)、あるいは、その他の記録媒体に記録される。また、データや信号は、バス912、信号線、ケーブル、あるいは、その他の伝送媒体により伝送される。
【0044】
本実施の形態の説明において「〜部」として説明するものは、「〜回路」、「〜装置」、「〜機器」であってもよく、また、「〜ステップ」、「〜工程」、「〜手順」、「〜処理」であってもよい。即ち、「〜部」として説明するものは、ROM913に記憶されたファームウェアで実現されていても構わない。あるいは、「〜部」として説明するものは、ソフトウェアのみ、あるいは、素子、デバイス、基板、配線といったハードウェアのみで実現されていても構わない。あるいは、「〜部」として説明するものは、ソフトウェアとハードウェアとの組み合わせ、あるいは、ソフトウェアとハードウェアとファームウェアとの組み合わせで実現されていても構わない。ファームウェアとソフトウェアは、プログラムとして、フレキシブルディスク、コンパクトディスク、磁気ディスク、光ディスク、DVD等の記録媒体に記憶される。プログラムはCPU911により読み出され、CPU911により実行される。即ち、プログラムは、本実施の形態の説明で述べる「〜部」としてコンピュータを機能させるものである。あるいは、プログラムは、本実施の形態の説明で述べる「〜部」の手順や方法をコンピュータに実行させるものである。
【0045】
図5は、情報選択装置10の動作(本実施の形態に係る情報選択方法、本実施の形態に係る情報選択プログラムの処理手順)を示すフローチャートである。
【0046】
ステップS101(次元抽出処理)において、次元抽出部100は、多次元データ源201からデータを取得し、次元抽出手法を用いて次元データを処理装置により抽出し、次元データ記録部101に記録する。
【0047】
ステップS102(重要度算出処理)において、次元重要度算出部102は、次元データ記録部101から次元データを取得し、次元重要度を処理装置により算出した後、次元重要度記録部103に次元重要度を記録する。ステップS102の詳細については、図6を用いて後述する。
【0048】
ステップS103(データ提示処理)において、次元選択部104は、次元重要度記録部103に記録された次元重要度を基に、提示すべき次元を処理装置により選択し、該当する次元に対応する次元データを次元データ記録部101より取得する。データ提示部105は、次元選択部104により選択された次元データを出力装置により提示する。ステップS103の詳細については、図7を用いて後述する。
【0049】
ステップS101、S102、S103の各処理は、各処理が前提とするデータが提供される範囲において、独立に実行可能である。よって、ステップS101、S102、S103は必ずしも図5に示した順序で実行される必要はなく、常に全ての処理を実行する必要もない。
【0050】
図6は、重要度算出処理(図5のステップS102)の手順を示すフローチャートである。
【0051】
ステップS201において、次元重要度算出部102は、次元データ記録部101に記録された次元データに含まれる次元のうち、重要度の算出が必要な次元又は次元の組み合わせを処理装置により判定する。判定により、重要度の算出が必要とされる次元がない場合は、処理を終了する。なお、判定方法としては、例えば、どの次元又はどの次元の組み合わせについて重要度を算出するか(あるいは算出しないか)を示す情報を予め記憶装置に記憶しておき、この情報を参照して重要度の算出が必要な次元又は次元の組み合わせを判定したり、ある次元のデータ数が所定数以上ない場合に当該次元又は当該次元を含む組み合わせを重要度の算出が必要ないものであると判定したりすることが考えられる。
【0052】
ステップS202(次元データ抽出処理)において、次元重要度算出部102は、ステップS201において重要度の算出が必要と判定した次元又は次元の組み合わせに対応する次元データを、次元データ記録部101から取得する。
【0053】
ステップS203(次元重要度算出処理)において、次元重要度算出部102は、ステップS202において取得した次元データに対して、予め決められた(記憶装置に記憶された)指標に基づき、重要度の算出を処理装置により行う。
【0054】
ステップS204(次元重要度記録処理)において、次元重要度算出部102は、ステップS203において算出した次元重要度を次元重要度記録部103に記録し、ステップS201に戻る。
【0055】
図7は、データ提示処理(図5のステップS103)の手順を示すフローチャートである。
【0056】
ステップS301(次元重要度取得処理)において、次元選択部104は、次元重要度記録部103より次元重要度値を取得する。
【0057】
ステップS302(次元選択処理)において、次元選択部104は、ステップS301において取得された次元重要度に基づき、提示すべき次元の選択を処理装置により行う。次元選択処理においては、重要度の高い次元又は重要度の高い次元の組み合わせが優先的に提示されることが望ましく、重要度が高い次元又は重要度の高い次元の組み合わせを順次選択するか、あるいは、重要度が上位の次元又は重要度が上位の次元の組み合わせをまとめて選択する等の手法が好適である。
【0058】
ステップS303(次元データ提示処理)において、次元選択部104は、ステップS302において選択した次元又は次元の組み合わせに対する次元データを、次元データ記録部101より取得し、これをデータ提示部105に渡すことにより、データを出力装置により提示する。
【0059】
以上のように、本実施の形態によれば、一般の多次元データ分析において、重要な次元を選択的に提示することが可能となる。
【0060】
実施の形態2.
実施の形態1に係る多次元データ可視化のための情報選択装置10において、次元重要度算出部102における重要度の指標として、分離度を用いた態様について説明する。
【0061】
図8(a)は、分離度を重要度の指標として次元を選択した際の、次元データ提示結果の模式図である。縦軸と横軸に示された山型のグラフは、それぞれの軸方向における次元データのヒストグラムを模したものである。
【0062】
左図は分離度の低い次元による提示結果であり、ほとんどの点が1箇所に集中していることが分かる。一方、右図は分離度の高い次元による提示結果であり、点の集合が複数形成されていることが分かる。このように、分離度を重要度の指標とすることで、2次元にプロットした際に複数のクラスタを形成する次元の組み合わせを抽出する効果を得る。
【0063】
例えば、正常データと故障データを見分ける場合を考える。一般に正常データと故障データがきれいに分離されることは稀であり、多次元データのうちどの次元をもって分離すべきかは明確でない。よって、様々な次元における断面、即ち、次元の組み合わせによって、データを吟味することで正常データと故障データを見分ける手法を模索することになる。このような場合、上記分離度による重要度の指標を用いることで、分離度合いの高い次元の組み合わせが優先的に提示されるため、分析作業を効率化する効果を得る。
【0064】
また、例えば、ビル管理において部屋の使われ方を見たい場合、分離度が高いものほど重要度を高くすることで、同様の効果を得ることができる。例えば、サーバルームがあるビルでは部屋ごとの室内温度と消費電力との2次元の組み合わせについてデータの分離度が大きくなることが予想される。したがって、このような組み合わせが選択されることで、サーバルームの有無や割合(数)を容易に把握することができるようになる。
【0065】
なお、分離度の計算手法としては、判別分析手法や、Parzen・Kernelを用いた近似等を用いることができる。
【0066】
以上のように、次元重要度算出部102は、分離度を重要度の評価指標とすることができる。
【0067】
実施の形態3.
実施の形態1に係る多次元データ可視化のための情報選択装置10において、次元重要度算出部102における重要度の指標として、外れ値の割合を用いた態様について説明する。
【0068】
図8(b)は、外れ値の割合を重要度の指標として次元を選択した際の、次元データ提示結果の模式図である。図の中央部にある灰色部(例えば、直径3σ(平均の3倍)の円とする)は、多数の次元データが含まれる領域を模したものである。
【0069】
左図は外れ値の割合が少ない次元による提示結果であり、ほとんどの点が中央部に集中していることが分かる。一方、右図は外れ値の割合が多い次元による提示結果であり、中央部から外れた点が多数見られることが分かる。このように、外れ値の割合(全データの数に対する、灰色部の中にプロットされたデータの数の割合)を重要度の指標とすることで、2次元にプロットした際に分布の中心から外れた点が多い次元の組み合わせを抽出する効果を得る。
【0070】
例えば、異常状態にある機器を発見する場合を考える。一般に他の機器と異なる挙動を示す機器は異常であると考えられるが、多次元データの分析においては多くの機器が何らかの意味で異常である。よって、真に異常であるかどうかは、様々な次元における断面、すなわち次元の組み合わせによって、データを吟味することで判定することになる。このような場合、外れ値の割合を重要度の指標として用いることで、外れ値の多い次元の組み合わせが優先的に提示されるため、外れ値の発生した原因を効率的に分析可能とする効果を得る。
【0071】
なお、外れ値の計算手法としては、分散を基準としてその定数倍を超えるものを外れ値とする手法や、特定の分布形状を仮定して分布形状からの外れの度合いを用いる手法等を用いることができる。
【0072】
以上のように、次元重要度算出部102は、外れ値の割合を重要度の評価指標とすることができる。
【0073】
前述したように、次元重要度算出部102は、外れ値の割合、外れ値の平均からの距離、分散、一様性、特定パターンとの相関係数等を重要度の評価指標とすることができる。
【0074】
以上、本発明の実施の形態について説明したが、これらのうち、2つ以上の実施の形態を組み合わせて実施しても構わない。あるいは、これらのうち、1つの実施の形態を部分的に実施しても構わない。あるいは、これらのうち、2つ以上の実施の形態を部分的に組み合わせて実施しても構わない。
【符号の説明】
【0075】
10 情報選択装置、100 次元抽出部、101 次元データ記録部、102 次元重要度算出部、103 次元重要度記録部、104 次元選択部、105 データ提示部、201 多次元データ源、901 LCD、902 キーボード、903 マウス、904 FDD、905 CDD、906 プリンタ、911 CPU、912 バス、913 ROM、914 RAM、915 通信ボード、920 HDD、921 オペレーティングシステム、922 ウィンドウシステム、923 プログラム群、924 ファイル群。

【特許請求の範囲】
【請求項1】
n(nはn≧3となる整数)次元のデータを予め記憶する記憶装置と、データの演算を行う処理装置と、データの出力を行う出力装置とを具備するとともに、
前記記憶装置に記憶されたn次元のデータから、m(mはn>m≧1となる整数)次元のデータの組み合わせを複数抽出し、抽出した組み合わせごとに、m次元空間におけるデータの分布の特徴を前記処理装置により分析し、当該分析結果に基づいて、各組み合わせの重要度を前記処理装置により算出する重要度算出部と、
前記重要度算出部により算出された各組み合わせの重要度に基づいて、いずれかの組み合わせを選択する選択部と、
前記選択部により選択された組み合わせを構成するm次元のデータを前記出力装置により出力するデータ出力部とを備えることを特徴とする多次元データ選択装置。
【請求項2】
前記重要度算出部は、抽出した組み合わせごとに、m次元空間におけるデータの分離度の計算と、m次元空間におけるデータの外れ値の検定と、m次元空間におけるデータと特定の関数との相関の計算と、m次元空間におけるデータの一様性の検定とのいずれかを前記処理装置により行い、当該計算結果又は当該検定結果に基づいて、各組み合わせの重要度を前記処理装置により算出することを特徴とする請求項1に記載の多次元データ選択装置。
【請求項3】
前記記憶装置は、前記n次元のデータとして、設備に係る測定データを記憶し、
前記選択部は、前記重要度算出部により算出された各組み合わせの重要度の一覧を前記出力装置により出力し、出力した一覧に基づいて設備管理者にいずれかの組み合わせを選択させることを特徴とする請求項1又は2に記載の多次元データ選択装置。
【請求項4】
前記出力部は、前記選択部により選択された組み合わせを構成するm次元のデータを前記出力装置によりグラフとして画面に表示することを特徴とする請求項1から3までのいずれかに記載の多次元データ選択装置。
【請求項5】
コンピュータの記憶装置が、n(nはn≧3となる整数)次元のデータを記憶し、
前記コンピュータの処理装置が、前記記憶装置に記憶されたn次元のデータから、m(mはn>m≧1となる整数)次元のデータの組み合わせを複数抽出し、抽出した組み合わせごとに、m次元空間におけるデータの分布の特徴を分析し、当該分析結果に基づいて、各組み合わせの重要度を算出し、
前記処理装置が、算出された各組み合わせの重要度に基づいて、いずれかの組み合わせを選択し、
前記コンピュータの出力装置が、選択された組み合わせを構成するm次元のデータを出力することを特徴とする多次元データ選択方法。
【請求項6】
n(nはn≧3となる整数)次元のデータを予め記憶する記憶装置と、データの演算を行う処理装置と、データの出力を行う出力装置とを具備するコンピュータにより実行される多次元データ選択プログラムであって、
前記記憶装置に記憶されたn次元のデータから、m(mはn>m≧1となる整数)次元のデータの組み合わせを複数抽出し、抽出した組み合わせごとに、m次元空間におけるデータの分布の特徴を処理装置により分析し、当該分析結果に基づいて、各組み合わせの重要度を処理装置により算出する重要度算出処理と、
前記重要度算出処理により算出された各組み合わせの重要度に基づいて、いずれかの組み合わせを選択する選択処理と、
前記選択処理により選択された組み合わせを構成するm次元のデータを出力装置により出力するデータ出力処理とをコンピュータに実行させることを特徴とする多次元データ選択プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate


【公開番号】特開2011−28483(P2011−28483A)
【公開日】平成23年2月10日(2011.2.10)
【国際特許分類】
【出願番号】特願2009−172934(P2009−172934)
【出願日】平成21年7月24日(2009.7.24)
【出願人】(000006013)三菱電機株式会社 (33,312)
【Fターム(参考)】