説明

センサにより取得されたサンプルのストリームにおける変化を検出する方法

【課題】この発明方法は、センサによって取得されたサンプルのストリームにおける変化を検出する。
【解決手段】時間経過とともにセンサにより取得されたサンプルストリームがバッファに順次保存され、バッファが時間的に前方にスライドするサンプルのウィンドウを形成するように、バッファが満杯のとき、最も古いサンプルが捨てられて新しいサンプルが保存される。各新しいサンプルに対し、バッファは、サンプルのすべての可能な対の隣接する第1および第2サブウィンドウを含むサブウィンドウへ分割され、最新サンプルが1対のサブウィンドウの第2サブウィンドウに保存される。サンプルの各対の隣接するサブウィンドウの第1および第2サブウィンドウ間の差が求められ、最大差がメリットスコアとして割り当てられる。メリットスコアが所定の閾値より大きければ、サンプルストリームにおける変化を送信する。変化は、突然でも緩やかでもよい。

【発明の詳細な説明】
【技術分野】
【0001】
この発明は一般に、センサで機器および環境を監視する技術、特にセンサのサンプルにおける変化を検出する技術に関する。
【背景技術】
【0002】
センサデータ
これまで、センサによる機器および/または環境のリアルタイムの詳細な監視は、大規模で高価な、安全性およびミッション・クリティカルな設置に対してのみ経済的に実現可能であった。ところで、コンピュータ技術の飛躍的進歩、更に詳しく言うと、安価なセンサネットワーク、安価な無線通信、および強力な埋め込みプロセッサの到来は、電気モーター、タービン、電力開閉装置、冷暖房空調機器などの非常に安価な装置に対してばかりでなく、製油、食品加工、製品製造、大規模環境などの産業プロセスの拡大し続けている領域に対しても、器機状態監視(ECM)技術を実施することを可能にした。
【0003】
その結果生じる、センサネットワークから絶えず流れているセンサデータの量の増加は、データをモニタ(監視)する仕事を課されたどんな人間の監視者をも速やかに圧倒するであろう。速やかかつ正確にセンサデータを処理するという問題への唯一の実行可能な解決策は、自動化された変化検出(ACD)方法を開発することである。そのような自動化手法は、よく訓練された人間の監視者の能力と汎用性(融通性)に達しそうにないが、自動化手法は、センサデータストリームにおける特定のイベントを探すように設計されると、まだ非常に効果的であり、かつ正確である場合がある。
【0004】
これらのイベントの中で最も重要なものの1つはセンサデータにおける突然の変化である。そのような突然の変化を検出するのは、取るに足りない問題でない。その理由は、すべての、しかし、最も簡単なデータストリーム以外のすべてのデータストリームは、そのデータを生成する処理における変化が全く起こらないときでさえも、変化するからである。これは、たとえば、データがダイナミカル(動的)システムから来るときのように、処理の自然変動によって、または、測定誤差や隠れ変数などによるノイズによって、引き起こされるかもしれない。そのような場合、突然の変化の検出は統計的に行われる。すなわち、その問題は、その変化の前後に、データがサンプリングされた確率分布間の相違(差)を検出することに帰着する。製造への応用では、このタスクはしばしば統計的プロセス制御(SPC)と呼ばれる。SPCでは、その目的は、データの制御内の分布から或る他の制御しきれない分布への逸脱を検出することにある。
【0005】
累積集計(CUSUM)
制御内(可能)および制御外(不可)の分布が既知のパラメトリック形式を有し、それぞれのパラメータが既知であるときには、累積集計(CUSUM)処理手順が最適であることが知られている。パージュ(Page)、「連続測検査スキーム(Continuous Inspection Schemes)」、バイオメトリカ(Biometrika)41、pp.100−114、1954、およびバッセビル他(Basseville et al.)、「突然の変化の検出:理論と応用(Detection of Abrupt Changes:Theory and Application)」、 エングルウッド クリフ、ニュージャージー:プレンティスホール(Englewood Cliffs、NJ:Prentice Hall)、1993。
【0006】
ところで、制御内(可能)およびすべての制御外(不能)分布の明確なモデリングは、典型的には、困難(面倒)で高価なプロセスであり、解決困難でさえあるかもしれない。
したがって、単に、センサデータストリームを検査してそれらの確率分布に関して推論することによって、如何なる変化をも検出できる方法を提供することが望ましい。
【0007】
突然の変化の検出
現時刻tでは、センササンプルストリームからのd次元データベクトルはxである。
突然の変化を検出する問題は、そのような変化が現在時刻tで起こったか、またはその前に起こったかを判別することである。この問題に対する重要な前提は、変化が永続的である、すなわち、変化が起こった後、その後のリーディング(読み、解釈)が新しい分布からくると、仮定することである。これは、変化が破壊的であるとき、すなわち装置が故障するとき、産業機器に対して典型的な状況である。
【0008】
その変化の前のすべてのセンサのサンプルは、独立しており、分布p(x)からサンプリングされた、同じように分布している(i.i.d.)確率変数であると仮定される。同様に、変化の後のすべてのサンプルは分布p(x)からサンプリングされたi.i.d.変数であると仮定される。
【0009】
分布p(x)およびp(x)が既知であるとき、パージュ(Page)は、その2つの分布に対して電流サンプルの対数尤度を累算して、助変数(g=S−m)に基づいて、次式に対する決定を行うCUSUM処理手順について説明している。
【0010】
【数1】

【0011】
所定の閾値hに対して、g>hの場合には、変化が生じたことが宣言される。
この決定は、与えられた偽陽性率に対して検出確率を最大にすることに関して最適になることを示すことができる。
【0012】
ところで、CUSUM方法には、分布p(x)およびp(x)の両方をあらかじめ知っていなければならないという重大な欠点がある。産業機器の通常運転または或る環境における正常な状態に対して正確な確率分布p(x)を特定することは、典型的には、その器機を設計した、まさしく当該技術者でさえも困難であり、かつ骨が折れることである。制御不能な場合に対してすべての可能な分布p(x)を特定することは、率直に言えば、不可能であるかもしれない。その上、これらの分布に対して、正しいパラメトリック形式は利用できないかもしれない。
【0013】
CUSUMのこれらの限界は、よりデータ駆動型であり、あらかじめ特定された分布に頼らない自動化された変化検出(ACD)に対する代替方法の大規模な研究に拍車をかけた。この研究の重要な方向は、ノンパラメトリック統計学を使用することである。たとえば、ランク統計、ブロドスキー他(Brodsky et al.),「変化点におけるノンパラメトリック法の問題(Nonparametric Methods in Change−Point Problems)」、クルワー(Kluwer)、1991。
【0014】
機械学習
この研究の別のラインは、機械学習に基づくACD方法に焦点を合わせている。機械学習で、基本的な考えは、仮定された変化点の前後のサンプルから2つの確率分布を「学習(適合)」し、そして、しばしば情報理論的な距離尺度を使用して、2つの分布の差に対するテストをすることである。たとえば、クルバック・ライブラー・ダイバージェンス(Kullback−Leibler divergence)や、レニー・ダイバージェンス(Renyi divergence)、グーハ他(Guha et al.)、「エントロピーと情報距離のストリーミングおよびサブリニア近似(Streaming and sublinear approximation of entropy and information distances)」、SODA’06の論文集、pp.733.742、エーシーエム プレス(ACM Press)、2006など。しかしながら、そのような方法には、多くの問題点がある。
【0015】
第1の問題は、複数のサンプルから2つの分布を学習することである。2つの分布がガウス形として知られているとき、2つのサブウィンドウに対するサンプル平均とバリアンス(変化)を求めることができ、そして、スチューデントのt‐統計量を使用することで2つの分布を比較できる。ゴセット(Gosset)、「平均の確率誤差(The probable error of the mean)」、バイオメトリカ(Biometrika)、1908。
【0016】
さらに重要なケース(場合)は、これらの分布の2つの確率密度関数(pdfs)がガウス形でないときである。たとえば、それらの分布が幾つかの異なるモードを切り換えるシステムによりマルチモーダルであるときに、ガウシャンミックスチャモデル(ガウス形混合モデル)は、通常、マルチモーダル分布をモデル化するためには素晴らしい選択であるが、この特定の問題に対してはあまり良くない解決策である。その理由は、ガウス形混合モデルがパラメトリックであり、その適合には各パラメータの複数回の繰り返し調整が必要なためである。ヘイスティー他(Hastie et al.)、「統計的学習の要素(The Elements of Statistical Learning)」、スプリンガー(Springer)、2001。多くの可能な変化点を考えるとき、これは法外に時間がかかる。このために、そのような方法は、スピード(時間)が重視される応用には向かない。
【0017】
さらに良い代替策は、パーゼンの核密度推定値(Parzen’s kernel density estimate)などのメモリベースの方法を使用することである。パーゼン(Parzen)、「確率密度関数とモードの推定に関して(On estimation of a probability density function and mode)」、Ann.Math.Stat.33、pp.1065−1076、1962、また、確率密度関数のナダラヤ・ワトソン推定(the Nadaraya−Watson estimate of a probability density function)として知られている、ヘイスティー他を参照。この方法では、確率密度p(x)は核値(kernel values)の正規化された合計として表わされる。
【0018】
【数2】

【0019】
ここで、wは適宜選択された核関数であり、また、x,i=1,nは、モデル化されるべき分布から得られたサンプルである。その核に対してポピュラーな選択は、ガウス分布および第2サブウィンドウ3立方(tricubic)分布である。
【0020】
第2の問題は、それらの2つの分布を、それらのサンプルからの適合後に、比較することである。幾つかのポピュラーな方法は、周知のクルバック・ライブラー・ダイバージェンス(KLダイバージェンス)などの情報理論的な距離尺度を使う。
【0021】
【数3】

【0022】
KLダイバージェンスを使用するときの主な困難は、複数のサンプルxのドメイン全体に亘って統合(積分)する必要性である。これは、1次元のドメインでさえ時間がかかる場合があり、多変量の場合には不可能であるかもしれない。レニー(Renyi)ダイバージェス、ジェンセン・シャノン(Jensen−Shannon)距離、ブレグマン(Bregman)ダイバージェンス、およびヘリンジャー・マツシタ・バッタチャリヤ(Hellinger−Matsushita−Bhattacharya)距離などの他のポピュラーな情報理論的な距離尺度を使用しても、同様の統合(積分)に関連した困難につながる。
【0023】
その結果、多くの研究は、これらの距離の近似計算に集中した。たとえば、グーハ他(Guha et al.)は、多項式時間で上記距離の大部分に対して近似計算できる幾つかの多項式時間近似方式(PTAS)について記述している。しかし、理論上の観点からは貴重であるが、同様のPTASの方法は、実用的応用においてモニタ(監視)するために使用できる実用的方法をそれほどもたらしそうにない。
【発明の開示】
【発明が解決しようとする課題】
【0024】
機械学習に基づく他の方法は、2つのpdfが推測されるサンプルを保存するバッファの2つのサブウィンドウを使用する。そのウィンドウのサイズ(寸法)を大きくすれば、データがサンプリングされた真実のpdfへの漸近適合性(asymptotic fit)は良くなる。ところが、ウィンドウの寸法が大きいならば、新しいサンプルは非常にゆっくり変更後の分布に影響し始め、その結果、分布に実際の変化が起きる検出時間を増大させて、突然の変化を検出するのを難しくする。
【課題を解決するための手段】
【0025】
この発明の実施の形態は、センササンプルのストリームにおける如何なる変化をも検出するための、矛盾に対処する方法を提供する。この発明は、可能な変化点の前後で、変化する寸法のサブウィンドウを使用する。これは、変化後の小さな寸法のサブウィンドウ、たとえば唯1つのサンプルに対して、激烈なまたは突然の変化に対する迅速な反応を可能にすると共に、より大きなウィンドウから学習された分布を使用することによって、より微妙な変化への感度の向上を可能にする。このアイデアを直接実施すると、O(N)への計算の複雑性(計算量)の増大をもたらす。しかし、この発明の実施の形態は、このような複雑さの増大を減少させる方法を効率的に実現することを提供する。
【0026】
この発明の実施の形態は、多変量センササンプルストリームにおける如何なる変化をも検出するための方法を提供する。すなわち、本方法は、リアルタイムで突然の変化を検出できると共に、より長い時間帯に亘って、ゆっくり生じる変化をも検出できる。本方法は、変化の前後でデータ分布の明確なモデルを利用できないときに、適用できる。
【発明の効果】
【0027】
本方法は、メモリ(記憶)バッファに保存されたサンプルのスライディングウィンドウで作動する。バッファは、最新のN個のサンプルを保存する。各新しいサンプルにより、バッファから最も古いサンプルを置き換えて削除する。本方法は、可能な変化が起こったかもしれない時間の前後の、サンプルの2つの隣接するサブウィンドウへの、バッファのすべての可能な分割を考える。サンプルの各対の隣接するサブウィンドウ間の差が求められ、最大の差がメリット(長所)スコアとして割り当てられる。そして、メリットスコアが所定の閾値より大きければ、サンプルのストリームにおける変化を送信することができる。
【0028】
本方法の1つの実施の形態は、サンプルのサブウィンドウの対の間の平均ユークリッド距離を決定変数として測定する。本方法の他の実施の形態は、従来のCUSUM方法に基づいている。しかし、対照的に、従来の方法では、確率密度関数は未知であるが、本方法は、既知の分布の対数尤度推定値を使用する代わりに、パーゼン(Parzen)の核密度推定値で分布を推測する。
【発明を実施するための最良の形態】
【0029】
実施の形態1.
図1Aは、センサ102により機器および/または環境103から時間経過とともに順次取得された多変量センサデータサンプルストリーム101における如何なる変化をも検出するための方法100を示す。サンプル101はバッファ170に保存(記憶)110され、そこでは、バッファ170が時間的に前方にスライド(移動)するサンプルのウィンドウを形成するように、バッファ170が満杯のとき、最も古いサンプルが捨てられ、新しいサンプルが保存される。
【0030】
次に、各新しいサンプルに対して、バッファは、可能な変化が生じたかもしれない時間171の前後のサンプルのすべての可能な対の隣接するサブウィンドウ111へ分割され120、最も新しいサンプルがその1対のサブウィンドウの第2のサブウィンドウに保存される。サンプルの各対のすべての可能な隣接するサブウィンドウ111間の差131が決定される130。最大の差はメリット(長所)スコアとして割り当てられ、そして、それは閾値化され140、またメリットスコアが所定の閾値より大きければ、変化151は送信される150。
【0031】
この発明のすべての実施の形態は可変サイズを有するサンプルの複数組の近接するウィンドウで作動する。すなわち、本方法は、サイズNのサンプルのバッファ170のすべての可能なパーティション(分割)を考える。両方の方法は、そのメモリバッファのすべての可能な分割を考える計算コストを可成り減少させるのに利用できる共通の計算構造を共有する。両方の方法は、最新のセンササンプルを含むバッファΓで働き、そのバッファΓは、便宜的に、x(最も古いサンプル)からx(最も新しいサンプル)まで常に再番号付けされる。すなわち、該バッファは、時間的に前方にスライド(移動)する複数のサンプルの1つのウィンドウである。
【0032】
差の処理手順130αは、変化がそのバッファにおける複数のサンプルのスパン(期間)内に起こった可能性に比例する定量的なメリットスコアΥαを決定する。特に、メリットスコアΥαは、バッファ170の2つのサブウィンドウ間の距離尺度でありうるが、これに限定されるものではない。典型的には、従来の方法は、単にそのバッファを複数のサンプルの2つの等しいサブウィンドウに分割して、これら2つの等しい部分の差に対して検定(テスト)される。対照的に、我々は、そのバッファを、単一のサンプルを保存するサブウィンドウを含む、すべての可能な対のサブウィンドウに分割する。
【0033】
図に1Bに示すように、ベクトルxの形式の、サンプル101の時間的に順序づけられたウィンドウが、バッファ170に連続して(順番に)保存される。以下に述べる方法は、複数のセンササンプルxの1つのウィンドウの複数のサブウィンドウのすべての可能な対のインデックス(i、j)を考える。そこで、1≦i≦j≦Nであり、複数のサンプルx152を格納するバッファΓ170は2つの隣接するサブウィンドウγi,j−1およびγj,Nに分割される。
【0034】
ここで、時間tは左から右へ増大し、次式が成立する。
【0035】
【数4】

【0036】
図2Aは、サンプル1〜Nを有するバッファ170を示す。インデックスiを有するサンプルは、その対の第1のサブウィンドウの始まり(開始)を定義し、また、インデックスjを有するサンプルは第2のサブウィンドウの第1のサンプルを定義し、また、それぞれ分割171に関連する、仮定された変化点を定義する。第1のサブウィンドウのエンド(終端)のサンプルは、インデックスj−1を有し、その1対のサブウィンドウが接近(隣接)することを保証するが、第2のサブウィンドウのエンド(終端)は常に最も新しいサンプル(x)である。
【0037】
2つのサブウィンドウで保存されたサンプルの2つのサブセット(部分集合)は、それぞれ不等数のサンプルを持つことができる。1つのサブウィンドウは、単一のサンプルから構成されさえするかもしれない。したがって、複数のサンプルのサブウィンドウは一つまたは複数のサンプルを含むことができ、すなわち、1つのサブウィンドウ内のサンプルの数は範囲[1、N−1]でありうる。
【0038】
差すなわちメリットスコアΥα(i,j)が、リストに載っている制約条件にしたがって、各可能な対のサブウィンドウに対して求められるならば、全体のメリットスコアは、次式に示すように、すべての分割に亘って最大である。
【0039】
【数5】

【0040】
次に、モデリングの問題は、何れのメリットスコアを使用すべきかを判別することである。コンピュータの問題は、各新しいサンプルxに対して計算上効率的な方法でこれを行うことである。
【0041】
メモリベースのグラフ理論的な処理手順(MB−GT)
図2Bに示されるように、2の間の差200(距離)に複数のサンプルの2つのサブウィンドウ221−222の2つの分布211−212間の差200(距離)を求めるという問題に対する1つの解決策は、それらの複数のサンプル自体の間の平均距離(差)を求めることである。各サンプルは多次元のユークリッド空間におけるデータ点であるから、複数のサンプルxおよびxのサブウィンドウ間の固有距離尺度(natural distance measure)はそれらのユークリッド距離であり、次式で表される。
k,l=||x−x||.
【0042】
上記のように特定されたインデックス対(i、j)により定義された特別の分割に対して、次式に示すように、複数のサンプルの2つのサブウィンドウ間の平均距離を求めることができる。
【0043】
【数6】

【0044】
このメモリベースのグラフ理論的な方法は、次式のように、メリットスコアを有する。
【0045】
【数7】

【0046】
各Cijを求めることはO(N)の複雑さ(コンプレクシティ)であり、考慮すべきO(N)個のそのような項(ターム)があり、全体の複雑さはO(N)である。この複雑さは、実際的応用のためには、容認できない。
【0047】
ところで個々のCij項の判定には、計算の複雑性をO(N)まで引き下げるために利用できる或る程度の冗長度と反復的な構造がある。
【0048】
ここで、我々が次式のように定義する。
【0049】
【数8】

【0050】
このとき、次のような再帰的な関係が成立する。
【0051】
【数9】

【0052】
図3に示されるように、これらの再帰(リカランス)は次のような効率的な計算プロセスを示唆する。値βi,jおよびC’i,jは概念的にマトリクスと同様のデータ構造301−302で保存される。このマトリクスは制約条件i<jによる上三角行列である。計算は、定義上は零である単一の要素C’N,Nを有する、このマトリクスの最下段の行310から始めることができる。前の行より1つ上の各行1≦i≦Nに対して、最下段から最上段に進んで行き、次の2つの工程が行なわれる。
1)すべての値βi,jが、それらの直ぐ右隣のサンプルから、右から左に進んで、次の再帰式を使用して再帰的に計算される。
【0053】
【数10】

【0054】
2)すべての値C’i,jが、各値βi,jおよび現在の行の直ぐ下の行の値C’i+1,jから、再帰式C’i,j=C’i+1,j+βi,jを使用して計算される。
【0055】
メリットスコアΥαを求めることは、正規化を行いかつ最大値を求めるだけなので、個々の項C’i,jの計算と同時に行うことができる。このため、すべての値C’i,jおよびβi,jをバッファに保存する必要はない。値βの現在行iに対してN個のサンプルのサイズのバッファを確保し、また、C’i,jおよびC’i+1,jに対して同じサイズの2つのバッファを確保すれば充分である。したがって、この処理手順に関するメモリ要求条件はO(N)に過ぎず、また、計算の複雑さはO(N)に過ぎない。
【0056】
メモリベースのCUSUM処理手順(MB−CUSUM)
図4Aに示されるように、この発明の第2の実施の形態は、本方法が或るモデリング条件の下で最適な変化の検出を実現するのを可能にする確率的な基礎を有する。サンプルの分布が未知であるので、我々は最初にパーゼンの核密度推定値、たとえば、ガウスまたは3立方(tricubic)確率分布関数で分布について学習する。図4Aでは、垂直軸が分布の確率密度、また水平軸が時間を表す。
【0057】
同時に、非常に異なる理論的基盤にもかかわらず、第2の方法は実施の形態1と同様の計算構造を持っている。我々は、同様に重要な計算の複雑さの改善を実現するために、この構造を如何に活用できるかについて説明する。
【0058】
CUSUMの導出に続いて、私たちはバッファ170に保存されたN個のサンプル内の可能な変化に関して以下の仮説を考える。
【0059】
【数11】

【0060】
ここで、我々は、最新のN−i+1のサンプルが取得されたが、何ら変化が生じないという帰無(ヌル)仮説Hi,0と、そのような変化が生じたという複数の対立仮説Hi,jについて考える。始めのインデックスiを導入することによって、我々は、テストされる仮説のセット(組)を、ウィンドウ内のN個のすべてのサンプルを必ずしも使用するわけではないものに拡大している。
【0061】
本願に引用して援用するネイマン・ピアソンの補助定理(ホーエル他(Hoel et al.)、「仮説検定(Testing Hypotheses)」、統計理論への入門の第3章(Ch.3 in Introduction to Statistical Theory)、ニューヨーク(New York):ホートン・ミフリン(Houghton Mifflin),pp.56−67,1971)によれば、それぞれの特定の仮説Hi,jとHi,0を検定(テスト)するときに行うことができる最も良い検定、すなわち偽の帰無(false null)仮説を棄却する最も高い確率を有する検定は、次式で表す尤度比である。
【0062】
【数12】

【0063】
便宜的に、対数尤度比率Si,j=log(Λij)が一般的に使用される。我々の方法では、我々は、真のpdf(pおよびp)を、式(1)に示すように、それらの核密度推定値で置換して、次式(5)を得る。
【0064】
【数13】

【0065】
ここで、wl、kはその対のサンプル(x、x)対するカーネルウエイト(kernel weight)であり、また、ウエイトwl,k=w(dl,k)が成立する。最大尤度原理を使用することによって、この処理手順に対するメリットスコアは次式により表される。
【0066】
【数14】

【0067】
上述のように、メリットスコアの計算は、O(N)の計算複雑さを有する。しかし、このメリットスコアは、計算複雑さを減少させるのに再び利用できるこの発明の実施の形態の方法に対するメリットスコアに類似する構造を有する。
【0068】
再び、図4Bに示すように、我々は、概念的にウィンドウSi,jおよびV’i,j401−402の値を三角形のデータ構造において組織化して、次式のように助変数を定義できる。
【0069】
【数15】

【0070】
計算すべき項はO(N)vi,jであるように見えるが、式(5)を次式のように再帰的に再公式化する。
【0071】
【数16】

【0072】
これにより、我々は、必ずしもすべての項が必要になるわけではないことを確信できる。さらにμ’=μ、およびv’i,j=vi,jを定義することによって、我々は、効率的な処理手順に対する基礎として以下の式を使用できる。
【0073】
【数17】

【0074】
v’i,jに対する項だけが再帰的であること、すなわちμに対する項は直接的に計算されることに注意すべきである。これらの式は以下の処理手順を示唆する。
【0075】
S1:式(8)ごとに、μ’をj=1,Nに対して直接的に計算する。
この計算は複雑さO(N)を有するが、その結果をO(N)スペースに保存することができる。
【0076】
S2:マトリクスSi,jの各行i=N,1に対して、最下段行410(i=N)から始めて、第1行(i=1)まで上方に移動して、以下の2つの工程を行なう。
S2.1:式(8)ごとに、i+1とNとの間のjの各値に対して、下の行の対応するv’i+1,jおよびwj,iからv’i,jを計算する。
S2.2:Nとi+1との間のjの各値に対して、式(Si,j=Si,j+1+logμ’−logv’i,j+log(j−i)−log(N−j+1)を使用して、すべてのi=1,Nに対して、Si,N+1=0から始めて、Si,jをその直ぐ右の値Si,j+1から計算する。この工程における計算は、厳密に右から左(j=N、i+1)へ進む。
【0077】
図5は、さらに詳細に判別する第1のメモリベースのグラフ理論的な(MB−GT)方法に対する擬似コードを示す。図3は判別する第2のメモリベースの累積集計(MB−CUSUM)方法に対する変数を示し、また、図4は擬似コードをさらに詳細に示す。
【0078】
この発明は好適な実施の形態を例に挙げて説明したが、この発明の精神および範囲内で種々の他の改変および変更を行うことができることを理解すべきである。したがって、添付クレームの目的は、この発明の真実の精神および範囲に含まれるようなすべての変形例および変更例をカバーすることである。
【図面の簡単な説明】
【0079】
【図1A】この発明の実施の形態1による多変量センサデータサンプルストリームにおける変化を検出するための方法のフロー図である。
【図1B】この発明の実施の形態1によるセンササンプルを保存(記憶)するバッファのブロック図である。
【図2A】互いに等しくない(不等の)サブウィンドウに分割された、図2のバッファのブロック図である。
【図2B】この発明の実施の形態1によるサンプル値の異なる分布のブロック図である。
【図3】この発明の実施の形態1によるサンプルの差を求めるための三角形のデータ構造のブロック図である。
【図4A】この発明の実施の形態1による核関数である。
【図4B】この発明の実施の形態1による三角形のデータ構造のブロック図である。
【図5】この発明の実施の形態1によるセンサデータにおける突然の変化を検出するためのメモリベースのグラフ理論的な(MB−GT)方法のための擬似コードのブロック図である。
【図6】この発明の実施の形態1によるセンサデータにおける突然の変化を検出するためのメモリベースの累積集計(MB−CUSUM)方法で使用される変数のブロック図である。
【図7】メモリベースの累積集計方法で使用される擬似コードのブロック図である。

【特許請求の範囲】
【請求項1】
センサにより取得されたサンプルのストリームにおける変化を検出する方法であって、
時間経過とともにセンサにより取得されたサンプルのストリームをバッファに順次保存する工程であって、前記バッファでは、該バッファが時間的に前方にスライドするサンプルのウィンドウを形成するように、該バッファが満杯のとき、最も古いサンプルが捨てられて、新しいサンプルが保存される工程と、
各新しいサンプルに対して、前記バッファを、サンプルのすべての可能な対の隣接する、第1サブウィンドウおよび第2サブウィンドウを含むサブウィンドウへ分割する工程であって、最も新しいサンプルが1対のサブウィンドウの第2サブウィンドウに保存される工程と、
サンプルの各対の隣接するサブウィンドウの第1サブウィンドウおよび第2サブウィンドウ間の差を求める工程と、
最大の差をメリットスコアとして割り当てる工程と、
前記メリットスコアが所定の閾値より大きければ、前記サンプルのストリームにおける変化を送信する工程と、
を含む方法。
【請求項2】
前記変化は時間的に突然生じる、請求項1の方法。
【請求項3】
前記変化は時間経過とともに比較的ゆっくり生じる、請求項1の方法。
【請求項4】
前記サンプルの分布は未知である、請求項1の方法。
【請求項5】
前記差は、前記第1サブウィンドウと前記第2サブウィンドウにおける前記サンプルの値の間のユークリッド距離である、請求項1の方法。
【請求項6】
前記第1サブウィンドウおよび前記第2のサブウィンドウは、不等数のサンプルを有する、請求項1の方法。
【請求項7】
前記バッファにおけるサンプルの数がNであり、前記サブウィンドウのサンプルの数が[1、N−1]の範囲でありうる、請求項1の方法。
【請求項8】
差判定の複雑さはO(N)であり、ここで、Nは前記バッファに保存されたサンプルの数である、請求項1の方法。
【請求項9】
前記第1サブウィンドウおよび第2サブウィンドウのサンプルの値はそれぞれの三角マトリクスで保存され、前記差はすぐ隣同士のサンプルから再帰的に求められる、請求項1の方法。
【請求項10】
パーゼンの核推定値を使用することにより前記分布を推測する工程をさらに備える、請求項1の方法。
【請求項11】
前記差は、前記核推定値の対数尤度の累積集計処理手順を使用して求められる、請求項10の方法。

【図1A】
image rotate

【図1B】
image rotate

【図2A】
image rotate

【図2B】
image rotate

【図3】
image rotate

【図4A】
image rotate

【図4B】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2008−268182(P2008−268182A)
【公開日】平成20年11月6日(2008.11.6)
【国際特許分類】
【外国語出願】
【出願番号】特願2008−16533(P2008−16533)
【出願日】平成20年1月28日(2008.1.28)
【出願人】(597067574)ミツビシ・エレクトリック・リサーチ・ラボラトリーズ・インコーポレイテッド (484)
【住所又は居所原語表記】201 BROADWAY, CAMBRIDGE, MASSACHUSETTS 02139, U.S.A.
【Fターム(参考)】