説明

周期判定装置、周期判定方法および周期判定プログラム

【課題】時系列データの周期性を客観的に判定する。
【解決手段】時系列データの周期性を判定する周期判定装置100を提供する。受付部206は、時系列データおよび周期の設定値を受け付ける。DFT変換部216は、時系列データをフーリエ変換してフーリエ係数ベクトルを得る。フーリエ係数調整部218は、フーリエ係数ベクトルを調整し、異なる調整レベルの複数のフーリエ係数ベクトルを得る。逆DFT変換部220は、フーリエ係数ベクトルを逆フーリエ変換し、逆変換データを得る。BIC計算部228は、逆変換データのBICを計算する。周期判定部234は、BICが最小の逆変換データに対応するフーリエ係数ベクトル中に、設定値の周期のスペクトルが含まれるか判定する。出力部208は、周期判定部の判定結果を出力する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、周期判定装置、周期判定方法および周期判定プログラムに関する。
【背景技術】
【0002】
分子生物学の分野では、遺伝子の発現量やタンパク質の活性、量などの変化について時間を追って観察し、周期的な変動が見られるかどうか、どんな周期での変動があるかを調べることがある。また、社会科学の分野でも、株価の変動、人口構成の変動、季節ごとの商品売り上げの変動などについて時間を追って観察し、周期的な変動が見られるかどうか、どんな周期での変動があるかを調べることがある。
【0003】
従来の信号分析装置としては、例えば特許文献1に記載されたものがある。この信号分析装置は、時間差零付近の自己相関係数を用いる代わりに、時間差が信号ピークの1ピッチだけ離れた時点を中心とするある領域内の自己相関関数を用いて線形予測係数を求めることで雑音除去を可能にし、抽出精度の向上化を図ろうとするものである旨、この文献には記載されている。
【特許文献1】特開昭59−632号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
しかしながら、特許文献1に記載の信号分析装置では、分析結果が主観的・恣意的になる可能性があった。すなわち、この装置で信号ピークの周期の判定を行う場合、自己相関解析を行うため、信号ピークの有する周期を判定するには、信号ピークがコピーされ、ずらされて元の信号ピーク自身に重ねられる。そして、信号ピークが重なっている部分で相関係数が計算され、相関係数の極大値が十分大きければその周期を持つと判定される。
【0005】
したがって、この装置では、相関係数の極大値がどれくらい大きければ十分であるとして設定された周期を持つと判定してもよいかについて、あらかじめ判定基準を決めておく必要がある。そのため、特許文献1に記載の信号分析装置では、判定基準を定めるために試行錯誤、経験的判断を行うので、分析結果が主観的・恣意的になる可能性があった。
【0006】
本発明は上記事情に鑑みてなされたものであり、時系列データの周期性を客観的に判定する技術を提供することを目的とする。
【課題を解決するための手段】
【0007】
本発明によれば、時系列データの周期性を判定する周期判定装置であって、この時系列データを受け付ける時系列データ受付部と、周期の設定値を受け付ける周期受付部と、この時系列データをフーリエ変換してフーリエ係数ベクトルを得るフーリエ変換部と、この時系列データに対応するフーリエ係数ベクトルに対して、このフーリエ係数ベクトルに含まれるフーリエ係数の少なくとも一部を削除して単純化する調整を行い、単純化の程度によって調整レベルが異なる複数の調整フーリエ係数ベクトルを得るフーリエ係数ベクトル調整部と、この複数の調整フーリエ係数ベクトルをそれぞれ逆フーリエ変換し、複数の逆変換データを得る逆フーリエ変換部と、この複数の逆変換データのそれぞれの情報量基準を計算する情報量基準計算部と、この情報量基準が最小のこの逆変換データに対応するこのフーリエ係数ベクトル中に、この設定値の周期のスペクトルが含まれるか判定する周期判定部と、この周期判定部の判定結果を出力する出力部と、を備える周期判定装置が提供される。
【0008】
本発明によれば、単純化の程度によって調整レベルが異なる複数の調整フーリエ係数ベクトルをそれぞれ逆フーリエ変換して得られる、複数の逆変換データのそれぞれの情報量基準を計算するため、計算により情報量基準が最小または極小になるフーリエ係数ベクトルを求めることができる。このため、判定基準を定めるための試行錯誤、経験的判断を低減できる。その結果、主観的または恣意的な判断基準の混入が抑制され、時系列データの周期性を客観的に判定できる。
【0009】
なお、以上の構成要素の任意の組合せ、本発明の表現を方法、装置、システム、記録媒体、コンピュータプログラムなどの間で変換したものもまた、本発明の態様として有効である。
【発明の効果】
【0010】
本発明によれば、単純化の程度によって調整レベルが異なる複数の調整フーリエ係数ベクトルをそれぞれ逆フーリエ変換して得られる、複数の逆変換データのそれぞれの情報量基準を計算するため、時系列データの周期性を客観的に判定できる。
【発明を実施するための最良の形態】
【0011】
<研究内容の説明>
以下、本発明の実施の形態について説明する。以下の説明では、まず、本発明者らが行った研究に基づいて本発明を説明する。
【0012】
1)はじめに
分子生物学の分野では、遺伝子の発現量やタンパク質の活性、量などの変化について時間を追って観察し、周期的な変動が見られるかどうか、どんな周期での変動があるかを調べることがある。一番多いのは24時間周期の変動があるかどうかの判断をすることだが、この判断を自動化するための方法を考案した。考案した方法では周期は24時間に限らず、任意の周期性を判定できる。
【0013】
判断のために必要な材料は、判定対象の時系列データと、判定したい周期性の周期のみである。次節に述べる一般的に用いられている方法はいずれも、各手法特有の判断基準を外部から与える必要があるが、考案手法ではそれが必要なく、判定を行う人物の恣意性を抑制し、客観的な判断を自動化できる。また目的の周期の周期性が小さい場合にもそれを拾うことができる。
【0014】
2)一般に用いられる手法
ある時系列データ(以下原信号)が与えられた時、それが周期性を持つかどうかを判定するのに用いられる方法は、一般的にコサイナー法、自己相関解析、自己回帰分析、フーリエ解析の4種類である。今回考案した方法に対する既存の手法として、以下に簡単に説明する。
【0015】
2.1 コサイナー法
Cosinor method。原信号(xtとする)に対して以下のモデルを最小二乗法などで当てはめ、近似誤差が小さければそのモデルを採用し、モデルの持つ周期性が原信号にもある、と判断する方法。
【0016】
t=Acos(2πBt+C)
tは時刻である。この式におけるA、B、Cを最適化し近似式を求める。Bが周波数、つまり周期の逆数である。Bを目的の周波数に固定してAとCを最適化し、近似精度が良ければその周期を持つと判断しても良い。いずれにせよ、どの程度近似が良ければモデルを採用するのか(その周期を持つと判定するのか)をあらかじめ決めておく必要がある。また現実問題として、ある程度A、B、Cの値の見当が付いていないと最適化できないことが多い。
【0017】
2.2 自己相関解析
Autocorrelation analysis。原信号と、原信号の時刻だけをずらした信号の相関係数を計算し、相関係数が大きければ、そのずれが原信号の周期であると判定する方法。ずれが大きくなると相関係数を計算するための点が少なくなるので、原信号の長さに近い大きな周期は判定できない。ずれを0から大きくしていってその都度相関係数を計算し、相関係数が極大または最大となるずれをもって周期とすることもできる。
【0018】
自己相関解析においても、どの程度相関係数が大きくなればその周期を持つとみなすのか、相関係数が最大の時にどの程度の値になればよいのか、あらかじめ決めておく必要がある。
【0019】
2.3 自己回帰分析
Autoregression model。時刻tにおける原信号の値を、t以前のn個の点での原信号の値の線形結合で表現するモデル(自己回帰モデル)を推定し、どのくらい前の時刻の値がその時刻に強い影響を持つかから周期性を判定する。モデルは以下の式で表される。
【0020】
t=Σ(i=1→n)cit-i
なお、Σ(i=1→n)f(i)は、i=1からi=nまでのf(i)の和を意味する。nの値は原信号のサンプリング点数に対してあまり大きくすることはできない。このモデルを原信号に対して最小二乗法などで当てはめ、近似精度がいい場合に、n個のciのうち最も大きな物は、時刻tに対してどれくらい過去なのかを見る。tとciの時刻のずれが周期となり、近似精度が良ければその周期を原信号が持つと判断する。
【0021】
自己回帰分析では、最大の係数以外にも、値の大きな係数に対応する時間を周期として持つとも判断でき、複合周期の信号の判定を行うことができる。しかし、自己回帰分析においても、近似精度がどの程度良ければいいのか、また係数がどの程度大きければいいのかなどをあらかじめ決めておく必要がある。
【0022】
2.4 フーリエ解析
Fourier analysis。原信号は、時刻が離散のデータであるため、これに離散フーリエ変換(得られるスペクトルも離散になる変換)を適用し、原信号のサンプリング点数と同じ個数の、複素数のフーリエ係数を得る。得られたフーリエ係数のうち、その絶対値が大きなものに対応する周期を原信号が持つ、と判断する。
【0023】
前節の自己回帰分析同様、この方法でも複合周期の判定ができるが、やはり係数がどの程度大きければいいのかなどをあらかじめ決めておく必要がある。
【0024】
3)考案手法
判断基準として、情報量規準(Information Criterion)を導入する。それに必要となるモデルにはフーリエ級数と正規分布を用いる。情報量規準を用いることで、判定のための指標の設定が不必要になる。また離散フーリエ変換(Descrete FourierTransform,DFT)により抽出した周波数成分を選ぶことで、どの周期成分を取捨選択しているのか、明確にすることができる。
【0025】
この方法では、原信号を離散フーリエ変換して得られた複素係数ベクトルから、いくつかの係数を零に置き換えたベクトルを作ってモデルとし、零にした係数が多く、かつ逆離散フーリエ変換で原信号に近い信号が得られるモデルを探索する。考えられる全てのモデルについて情報量規準を計算し、情報量規準を最小にするモデルの中に、注目している周期に対応する係数が含まれているかどうかで、原信号がその周期性を持っているかどうかを判断する。以下に手順を列挙する。
【0026】
1.原信号を離散フーリエ変換する。
【0027】
2.得られたフーリエ係数のうち、どれの絶対値を零にすれば情報量規準を極小化できるか、その組み合わせを探索する。係数が多く探索に時間がかかる場合には発見的探索法で準最適な組み合わせを探索する。情報量規準は以下の手順で計算する。
【0028】
・どの係数を零にするかを決める。係数が少なく計算時間が待てる範囲なら、全ての組み合わせを試す。
・フーリエ逆変換し、得られる時系列データと原信号の平均二乗誤差を計算する。
・零になっていないフーリエ係数の個数と平均二乗誤差から情報量規準を計算する。
【0029】
3.情報量規準が極小になった時に零になっていないフーリエ係数に、目的の周期に対応するものがあれば、原信号はその周期の周期性を持つと判断する。なければその周期性はないと判断する。
【0030】
4)考案手法の詳細
注目している周期Lがある時、ある時系列データがその周期での周期性を持っているかどうかを判定する。
【0031】
4.1 判定対象と判定結果
判定対象は、サンプリング時刻が有限個の離散的な点であり、観測値が実数である時系列データ(以下原信号と呼ぶ)である。nを3以上の整数とするとき、n個の時刻ti(1≦i≦n)と、各tiにおける値xi(1≦i≦n)の二つのn次実数ベクトルで定義される。xiは時刻の関数であり、xi=x(ti)と表され、たとえば、遺伝子の発現量の変化などである。n<3の場合は考案手法での周期性の判定は行わない。
【0032】
考案手法を適用後、判定結果として、周期性を持つかどうかが示される。
【0033】
4.2 アルゴリズム
Step1.原信号を離散フーリエ変換する。
離散フーリエ変換を原信号に適用し、n次の複素数ベクトルとしてフーリエ係数を得る。離散フーリエ変換とは、虚数単位をjとするとき、以下の式の係数ckを求めることである。
【0034】
x(ti)=Σ(k=1→n)ckexp{jk(2π/n)}
なお、Σ(k=1→n)f(k)は、k=1からk=nまでのf(k)の和を意味する。
【0035】
係数ck は以下の式で求められる。
k=1/NΣ(i=1→n)x(ti)exp{−jk(2π/n)i}
なお、Σ(i=1→n)f(i)は、i=1からk=nまでのf(i)の和を意味する。
【0036】
係数ck(1≦k≦n)はn次複素数ベクトルである。またはnが偶数の場合ck=cn-k+1、nが奇数の場合ck=cn-k+2(k≧2)である。ベクトルckはフーリエ係数であるが、原信号に対してスペクトルともと呼ぶ。
【0037】
Step2.情報量規準を最小化するモデルを探索する。
情報量規準にはいくつかの種類があるが、モデルを定義するのに必要なパラメータの個数と、モデルによる原信号の再現精度のバランスを取る指標であり、モデルから計算される実数値である。パラメータが少ないほど、再現精度がよいほど情報量規準は小さな値を取り、情報量規準を最小、あるいは極小にするモデルが最も良いモデルとされる。単純、シンプルかつ現象を精度よく再現するモデルほど良い、という指標である。
【0038】
この場合のモデルはフーリエ係数ベクトルである。係数ベクトルを逆離散フーリエ変換(inverse DFT,iDFT)することで時系列データを得るが、原信号から得られた係数ベクトルをそのままiDFTすると原信号が得られる。係数ベクトルのうちいくつかの係数を零にしてiDFTすると、原信号と異なる信号が得られる。どれを、またいくつの係数を零にするかで原信号との差がどの程度になるかは変わるが、多くの係数を零にしても原信号とよく似た信号が得られる場合、数少ない係数で原信号を再現できた、と考えることができる。
【0039】
1からNのiに対して、以下を行う。Nはnより小さな整数で、2(n/2)1/2程度の値とする。
【0040】
(a)n個の係数のうちi個を選び出すすべての組み合わせに対して以下を行う。選び出す際、選び出された係数をckとすると、nが偶数の時はcn-k+1、nが奇数の時はcn-k+2は選び出されないようにする。以下の方法で求められるモデルのうち、情報量規準が最小となるモデルを最良のモデルとする。
【0041】
(b)選び出すやり方はnが大きくなると膨大な数になるため、計算機による処理時間が現実的ではない場合には、以下の方法で計算する情報量規準を目的関数として、遺伝的アルゴリズムなどの発見的探索手法を適用して準最適解を求め、それをもって最良のモデルとする。
【0042】
i)原信号から得られる係数ベクトルのうち、選び出されたi個の係数を零にする。同時に、選び出された係数をckとすると、nが偶数の時はcn-k+1、nが奇数の時はcn-k+2も零にする。
【0043】
ii)i個の係数が零になった係数ベクトルを逆離散フーリエ変換する。
【0044】
iii)得られた信号と原信号、零になっていない係数の個数(p=n−2i個)から、情報量規準を計算する。情報量規準はたとえば赤池情報量規準(AIC)の場合は
AIC=nlog2π+nlogσ^2+n+2(p+1)
なお、σ^は、σの上に^が位置する記号を意味する。
【0045】
ベイズ情報量規準(BIC)の場合は
BIC=nlog2π+nlogσ^2+n+(p+1)logn
に従って計算する。ここでσは原信号と逆離散フーリエ変換で得られた信号との平均二乗誤差で、逆離散フーリエ変換で得られた信号をx^iとすると以下の式で得られる。
【0046】
π=1/nΣ(i=1→n)(xi−x^i2
なお、x^iは、xiの上に^が位置する記号を意味する。
【0047】
Step3.判定する。
最良のモデルに、着目する周期に対応するフーリエ係数が含まれているかどうかを調べる。含まれていれば、その周期の周期性を持つ、含まれていなければ持たない、と判断する。
【0048】
5)具体例
5.1 判別対象
DNAマイクロアレイによって得られた遺伝子発現データを想定する。実験開始後12時間から観測を開始し、4時間おきに12回、44時間分の時系列データを原信号とする。従って原信号は12次の実数ベクトルである。
【0049】
5.2 周期性がある、と判定される例
5.2.1 データの準備
以下の原信号を判定したいとする。これは遺伝子の発現強度を4時間おきに観察したもので、t=0が実験開始後12時間、以下t=1は16時間、t=2は20時間のようなサンプリング時刻であるとする。
【0050】
X(t)=(0.2466, 0.2592, 0.3861, 0.4785, 0.1748, 0.0776, 0.3137, 0.2497, 0.3972, 0.4654, 0.2951, 0.039)
【0051】
原信号は12次の実数ベクトルであり、トータルの観察時間は44時間分である。44時間の整数で割っても24時間にはならないので、零詰め(zero−padding)と呼ばれる方法で、トータルの観察時間を24で除して割り切れるように、原信号の前後に0を付け加える。
【0052】
x(t)=(0, 0, 0, 0.2466, 0.2592, 0.3861, 0.4785, 0.1748, 0.0776, 0.3137, 0.2497, 0.3972, 0.4654, 0.2951, 0.039, 0, 0, 0, 0)
【0053】
前に3、後ろに4個の0を加えることで、トータルの観察時間は72時間になり、24の整数倍(3倍)になる。これにより、iDFTで24時間周期に対応する係数が得られることになる。以下、このx(t)を原信号とする。
【0054】
5.2.2 離散フーリエ変換
原信号x(t)にDFTを適用すると、以下のフーリエ係数が得られる。12次の複素数ベクトルである。
【0055】
c(f)=(3.3836,-1.5543 - 0.6156i,-0.5312 - 0.6937i, 0.3880 + 1.0122i,-0.0641 - 0.1025i,-0.2024 - 0.1692i, 0.4449 + 0.3820i, 0.0214 - 0.3824i,-0.1293 + 0.0117i,-0.0647 - 0.1671i,-0.0647 + 0.1671i,-0.1293 - 0.0117i, 0.0214 + 0.3824i, 0.4449 - 0.3820i,-0.2024 + 0.1692i,-0.0641 + 0.1025i, 0.3880 - 1.0122i,-0.5312 + 0.6937i,-1.5543 + 0.6156i)
【0056】
各複素数の絶対値を計算した12次の実数ベクトルが以下のスペクトルである。
【0057】
s(f)=(0.6026, 0.1471, 0.0402, 0.0618, 0.0008, 0.0037, 0.0181, 0.0077, 0.0009, 0.0017, 0.0017, 0.0009, 0.0077, 0.0181, 0.0037, 0.0008,0.0618, 0.0402, 0.1471)
【0058】
スペクトルの小さな係数から一つずつ零に置き換えていき、その都度フーリエ逆変換して前出の式に従ってBICを計算すると、以下のようにBICの値が変化する。
【0059】
零にした個数 BIC
1 5.9442
2 6.0141
3 5.8658
4 2.5739
5 0.7070
6 8.5316
7 6.8247
8 6.4746
9 1.0095
【0060】
BICが最小になるのは5個の係数を零にした時である。この時のフーリエ係数は
*(f)=(3.3836,-1.5543 - 0.6156i,-0.5312 - 0.6937i, 0.3880 + 1.0122i, 0, 0, 0.4449 + 0.3820i, 0, 0, 0, 0, 0, 0, 0.4449 - 0.3820i, 0, 0, 0.3880 - 1.0122i,-0.5312 + 0.6937i,-1.5543 + 0.6156i)
となる。
【0061】
トータルの観察時間72時間を24で割ると3であり、この場合係数の個数は奇数なので、3+1=4番目のフーリエ係数が24時間に対応する成分の係数である。BICを最小にする上のc*では4番目の係数は残っており、この場合の原信号は24時間周期を持つと判定される。
【0062】
5.3 周期性がない、と判定される例
5.3.1 データの準備
次は、以下の信号を判定したいとする。
【0063】
X(t)=(-1.4654,-1.4850,-1.2409,-1.4725,-1.3649,-1.7453,-1.6136, -1.0707,-1.4604,-1.2874,-1.6219,-1.2768)
【0064】
この例では値が全て負の値であるが、そのことは判定には影響しない。前例と同様に零詰めで以下のようにしたものを原信号とする。
【0065】
x(t)=(0, 0, 0,-1.4654,-1.4850,-1.2409,-1.4725,-1.3649,-1.7453,-1.6136, -1.0707,-1.4604,-1.2874,-1.6219,-1.2768, 0, 0, 0, 0)
【0066】
次元数やサンプリング時刻など、実数値以外の条件は前例と同じである。
【0067】
5.3.2 離散フーリエ変換
原信号を離散フーリエ変換すると、以下のフーリエ係数を得る。
【0068】
c(f)=(-17.1048, 7.5483 + 2.7759i, 2.4006 + 1.6724i,-0.5611 - 0.1781i,-0.1600 - 3.0635i, -0.1939 - 0.3906i,-0.4484 + 0.6868i,-1.4494 + 1.3974i, 0.7866 - 0.2388i, 0.6297 + 0.2199i, 0.6297 - 0.2199i, 0.7866 + 0.2388i,-1.4494 - 1.3974i,-0.4484 - 0.6868i,-0.1939 + 0.3906i, -0.1600 + 3.0635i,-0.5611 + 0.1781i, 2.4006 - 1.6724i, 7.5483 - 2.7759i)
【0069】
各複素数の絶対値を計算した12次の実数ベクトルが以下のスペクトルである。
【0070】
s(f)=(15.3987, 3.4043, 0.4505, 0.0182, 0.4953, 0.0100, 0.0354, 0.2133, 0.0356, 0.0234, 0.0234, 0.0356, 0.2133, 0.0354, 0.0100, 0.4953, 0.01820.45053.4043)
【0071】
スペクトルの小さな係数から一つずつ零に置き換えていき、その都度フーリエ逆変換してBICを計算すると、以下のようにBICの値が変化する。
【0072】
零にした個数 BIC
1 40.5022
2 39.9164
3 37.4113
4 36.3092
5 27.7080
6 34.6197
7 37.5438
8 34.4794
9 33.3881
【0073】
BICが最小になるのは前例と同じく、5個の係数を零にした時である。この時のフーリエ係数は
*(f)=(-17.1048, 7.5483 + 2.7759i, 2.4006 + 1.6724i, 0,-0.1600 - 3.0635i, 0, 0,-1.4494 + 1.3974i, 0, 0, 0, 0,-1.4494 - 1.3974i, 0, 0,-0.1600 + 3.0635i, 0, 2.4006 - 1.6724i, 7.5483 - 2.7759i)
となる。
【0074】
この場合も4番目のフーリエ係数が24時間に対応する成分の係数である。BICを最小にする上のc*では4番目の係数は零に置き換わっている。従って、原信号は24時間周期を持たないと判定される。
【0075】
<周期判定装置の説明>
以下、上述の研究内容に基づいて構成される本発明の周期判定装置の実施の形態について、図面を用いて説明する。また、この装置を含む周期判定システム、この装置を用いる周期判定方法、この装置を実行するための周期判定プログラムについても説明する。尚、すべての図面において、同様な構成要素には同様の符号を付し、適宜説明を省略する。
【0076】
図1は、実施の形態に係る周期判定システムの全体構成を示した機能ブロック図である。周期判定システム1000は、周期判定装置100を備え、周期判定装置100は、時系列データの周期性を判定する。特に、本実施の形態に係る周期判定装置100は、遺伝子発現データをマイクロアレイにより経時的に分析して得られる時系列データに対する特定の周期性の有無またはどんな周期での変動があるかの判定法に用いられるものである。
【0077】
周期判定装置100は、時系列データおよび周期の設定値を外部から受け付ける受付部206を備える。また、周期判定装置100は、情報量基準が最小または極小となるフーリエ係数ベクトルを探索する探索部202を備える。さらに、周期判定装置100は、情報量基準が最小または極小となるフーリエ係数ベクトルが、設定周期に対応するスペクトルを含むか否か判定する判定部204を備える。そして、周期判定装置100は、探索部202および判定部204の探索結果または判定結果を出力する出力部208を備える。
【0078】
さらに、周期判定システム1000は、周期判定装置100に対する操作を受け付ける操作部106を備える。また、周期判定システム1000は、マイクロアレイの遺伝子発現データを分析するためのマイクロアレイ分析装置102およびスキャナ104を備える。また、周期判定システム1000は、外部ネットワーク112を介して別のPC(パーソナルコンピュータ)108およびサーバ110に接続している。受付部206は、これらの操作部106、スキャナ104、外部ネットワーク112などから情報を取得することができる。
【0079】
また、周期判定システム1000は、周期判定装置100から出力された探索結果または判定結果を画像として表示する画像表示装置114を備える。また、周期判定システム1000は、周期判定装置100から出力された探索結果または判定結果を印刷するプリンタ116を備える。さらに、周期判定システム1000は、周期判定装置100から出力された探索結果または判定結果を外部ネットワーク118を介して取得する別のPC(パーソナルコンピュータ)120およびサーバ122を備える。そして、出力部208は、これらの画像表示装置114、プリンタ116、外部ネットワーク118などに情報を出力することができる。
【0080】
図2は、図1に示す周期判定システムに含まれる周期判定装置の内部構成を示した機能ブロック図である。周期判定装置100は、時系列データを受け付ける受付部206(時系列データ受付部)を備える。受付部206(周期受付部)は、周期の設定値も受け付ける。
【0081】
周期判定装置100の探索部202は、受付部206から取得した元データを格納する元データ記憶部210を備える。そして、探索部202は、元データ記憶部210の格納する元データが時系列データの形式でない場合には、元データを時系列データの形式に変換する時系列データ作成部212を備える。
【0082】
また、探索部202は、時系列データをフーリエ変換してフーリエ係数ベクトルを得るDFT変換部216(フーリエ変換部)を備える。さらに、探索部202は、DFT変換部216から取得したフーリエ係数ベクトルを格納するフーリエ係数ベクトル記憶部214を備える。
【0083】
さらに、探索部202は、時系列データに対応するフーリエ係数ベクトルに対して、フーリエ係数ベクトルに含まれるフーリエ係数の少なくとも一部を削除して単純化する調整を行い、単純化の程度によって調整レベルが異なる複数の調整フーリエ係数ベクトルを得るフーリエ係数調整部218(フーリエ係数ベクトル調整部)を備える。
【0084】
また、探索部202は、複数の調整フーリエ係数ベクトルをそれぞれ逆フーリエ変換し、複数の逆変換データを得る逆DFT変換部220(逆フーリエ変換部)を備える。そして、探索部202は、逆DFT変換部220から取得した複数の逆変換データを格納する逆変換データ記憶部222を備える。
【0085】
また、探索部202は、複数の逆変換データのそれぞれの情報量基準を計算するBIC計算部228(情報量基準計算部)を備える。さらに、探索部202は、BIC計算部228から取得した複数のBICの計算値を格納するBIC計算値記憶部230を備える。なお、BIC計算値記憶部230内には、元データおよび逆変換データのIDおよびBIC計算値が対になって格納されている。このため、このIDは、元データおよび逆変換データをフーリエ変換して得られるフーリエ係数ベクトルにもそれぞれ対応している。
【0086】
一方、周期判定装置100の判定部204は、下記のように、判定されるべき周期を設定する機能と、探索部202の探索結果に基づいて原信号の時系列データが設定周期を持つかを判定する機能とを備える。
【0087】
判定部204は、まず、周期設定部224を有し、周期設定部224は、受付部206から取得した情報に基づいて、判定すべき周期を設定する。そして、判定部204は、周期設定部224から取得した周期の設定値を格納する設定周期記憶部226を備える。
【0088】
また、判定部204は、周期判定部234を有し、この周期判定部234が、下記に説明するように、情報量基準であるBICが最小の逆変換データに対応するフーリエ係数ベクトル中に、設定値の周期のスペクトルが含まれるか否かを判定し、これにより、原信号における設定周期の有無を判定する。
【0089】
周期判定部234の処理に関連して、判定部204は、適切モデル判定部232を有する。適切モデル判定部232は、BIC計算値記憶部230から取得したBICの計算値に基づいて適切モデルを判定する。ここで、BIC計算値記憶部230には、複数のBICが記憶されている。適切モデル判定部232は、BICが最小になる逆変換データに対応する調整フーリエ係数ベクトルを求め、その調整フーリエ係数ベクトルを適切モデルとして特定する。
【0090】
周期判定部234は、適切モデル判定部232により求められた適切モデルの調整フーリエ係数ベクトルを参照する。そして、周期判定部234は、調整フーリエ係数ベクトルに、設定周期のピークが含まれるか否かを判定する。そして、周期判定部234は、設定周期のピークが含まれれば、原信号が設定周期を含むと判定する。一方、周期判定部234は、設定周期のピークが含まれなければ、原信号が設定周期を含まないと判定する。
【0091】
このようにして、周期判定部234は、BICのような情報量基準が最小の逆変換データに対応するフーリエ係数ベクトル中に、設定値の周期のスペクトルが含まれるか否かを判定しており、これにより、原信号における設定周期の有無が判定されている。
【0092】
そして、周期判定部234の判定結果は、出力部208から出力される。
【0093】
図3は、図1に示す周期判定システムに含まれるマイクロアレイ分析装置およびスキャナの内部構成を示した機能ブロック図である。上述の周期判定装置100で処理される元データである時系列データは、遺伝子発現量の時系列データである。具体的には、上述の周期判定装置100で処理される時系列データは、下記のようにしてマイクロアレイの各セルを検出して得られる時系列データである。
【0094】
マイクロアレイ分析装置102は、サンプルDNAがスポットされたスライドアレイを設置するスライドアレイ設置部302を備える。また、マイクロアレイ分析装置102は、生体試料から所定の時間間隔でサンプリングされ、標識プローブされたサンプルRNAを、スライドアレイ中にアプライする標識プローブアプライ部304を備える。
【0095】
さらに、マイクロアレイ分析装置102は、スライドアレイ中にスポットされたサンプルDNAと、スライドアレイ中にアプライされた標識プローブ済みのサンプルRNAとをハイブリダイゼーションさせるハイブリダイゼーション部306を備える。そして、マイクロアレイ分析装置102は、ハイブリダイゼーションされた標識プローブ済みのRNAを蛍光発光処理する蛍光発光処理部308を備える。
【0096】
また、スキャナ104は、蛍光発光処理部308により発光処理されたスライドアレイを蛍光スキャンする蛍光スキャン部310を備える。さらに、スキャナ104は、蛍光スキャン部310により取得された蛍光スキャンデータを解析してサンプルRNAの発現データを生成するスキャンデータ解析部312を備える。
【0097】
図4は、実施の形態に係る周期判定システムの変形例に含まれるマイクロアレイ分析装置、スキャナおよびサーバの内部構成を示した機能ブロック図である。この変形例のマイクロアレイ分析装置102も、図3で示したマイクロアレイ分析装置102と同様に、スライドアレイ設置部402と、標識プローブアプライ部404と、ハイブリダイゼーション部406と、蛍光発光処理部408と、を備える。
【0098】
この変形例のスキャナ104は、蛍光発光処理部308により発光処理されたスライドアレイを蛍光スキャンする蛍光スキャン部410を備える。また、この変形例のスキャナ104は、蛍光スキャン部410により取得された蛍光スキャンデータを格納するスキャンデータ記憶部412を備える。さらに、この変形例のスキャナ104は、スキャンデータ記憶部412から取得した蛍光スキャンデータを、外部ネットワーク426を介してサーバ110に出力する出力部414を備える。
【0099】
そして、この変形例のサーバ110は、スキャナ104から外部ネットワーク426を介して蛍光スキャンデータを受け付けるスキャンデータ受付部416を備える。また、この変形例のサーバ110は、スキャンデータ受付部416で受け付けた蛍光スキャンデータを格納するスキャンデータ記憶部418を備える。
【0100】
さらに、この変形例のサーバ110は、スキャンデータ記憶部418に格納されている蛍光スキャンデータを取得して解析し、サンプルRNAの発現データを生成するスキャンデータ解析部420を備える。そして、この変形例のサーバ110は、スキャンデータ解析部420により生成されるサンプルRNAの発現データを格納する解析データ記憶部422を備える。また、この変形例のサーバ110は、解析データ記憶部422に格納されたサンプルRNAの発現データを取得し、外部ネットワーク112を介して周期判定装置100に出力する出力部424を備える。
【0101】
図5は、図2に示す周期判定装置に含まれるDFT変換部の内部構成を示した機能ブロック図である。DFT変換部216は、元データ記憶部210、逆変換データ記憶部222または設定周期記憶部226から元データ、逆変換データまたは周期の設定値を取得する受付部502を備える。なお、受付部502が周期の設定値を取得する理由は、後述するゼロ詰め処理部506で周期の設定値を用いるためである。また、DFT変換部216は、受付部502が取得した元データをDFT変換(離散フーリエ変換)する変換処理部504を備える。
【0102】
さらに、DFT変換部216は、受付部502が取得した元データおよび周期の設定値を対比し、元データ(時系列データ)の全長時間幅が周期の設定値の倍数ではない場合には、元データ(時系列データ)をゼロ詰め処理して全長時間幅が周期の設定値の倍数となるように変換するゼロ詰め処理部506を備える。この場合、変換処理部504は、ゼロ詰め処理部506による変換済データをフーリエ変換する。
【0103】
このゼロ詰め処理部506が設けられているため、サンプリングは等間隔でなくでもよい。等間隔でなくても、ゼロ詰め(zero padding)で等間隔データにすることができるためである。
【0104】
また、DFT変換部216は、受付部502が取得した元データを解析し、元データ(時系列データ)が等間隔データでない場合には、元データ(時系列データ)を補間処理して等間隔データに変換する補間処理部508を備える。この場合、変換処理部504は、補間処理部508により変換済みの等間隔データをフーリエ変換する。
【0105】
この補間処理部508が設けられているため、全サンプリング時間は、目的の周期の整数倍でなくてもよい。複数のサンプリング間隔がある時は、間隔同士の最大公約数的な値をあらたなサンプリング時刻とし、データがない時点の信号の値は0とする。このようにすれば、全サンプリング時間が目的の周期の整数倍になるようにゼロ詰めすることができるためである。
【0106】
元データ(時系列データ)は、DFT変換部216により、複数のピーク(スペクトル)を有するフーリエ係数ベクトルに変換される。DFT変換部216は、変換処理部504においてフーリエ変換された変換データ(フーリエ係数ベクトル)をフーリエ係数ベクトル記憶部214に出力する出力部510を備える。
【0107】
図6は、図2に示す周期判定装置に含まれるフーリエ係数調整部の内部構成を示した機能ブロック図である。フーリエ係数調整部218は、フーリエ係数ベクトル記憶部214からフーリエ係数ベクトルを取得する受付部602を備える。
【0108】
また、フーリエ係数調整部218は、受付部602が取得したフーリエ係数ベクトルに対応する多項式の各項のフーリエ係数のうち絶対値が最小のフーリエ係数を判定する絶対値最小フーリエ係数判定部604を備える。さらに、フーリエ係数調整部218は、絶対値最小フーリエ係数判定部604が最小であると判定したフーリエ係数を0に置換する絶対値最小フーリエ係数0置換部606を備える。そして、フーリエ係数調整部218は、絶対値最小フーリエ係数0置換部606が処理したフーリエ係数調整済みのフーリエ係数ベクトルをフーリエ係数ベクトル記憶部214に出力する出力部608を備える。
【0109】
これらの受付部602、絶対値最小フーリエ係数判定部604、絶対値最小フーリエ係数0置換部606、出力部608が順にフーリエ係数ベクトルを処理することにより、絶対値が小さいフーリエ係数が0に置換され、フーリエ係数ベクトルのピーク本数が減少して、フーリエ係数ベクトルがモデルとして単純化される。フーリエ係数調整部218では、絶対値最小フーリエ係数判定部604、絶対値最小フーリエ係数0置換部606の処理が繰り返して複数回行われる。これにより、単純化の程度によって調整レベルが異なる複数の調整フーリエ係数ベクトルが得られる。
【0110】
その結果、フーリエ係数調整部218の機能により、フーリエ係数ベクトル記憶部214内には、元データをフーリエ変換して得られる元のフーリエ係数ベクトルにくわえて、元のフーリエ係数ベクトルとは異なる調整レベルの複数のフーリエ係数ベクトルが格納されることとなる。
【0111】
なお、フーリエ係数ベクトル(フーリエ係数ベクトル)の調整レベルとは、フーリエ係数ベクトルに対応する時系列データの単純化の程度を示す指標である。この調整レベルは、係数ベクトルのうち零にされた係数の個数により表される。あるいは、この調整レベルは、フーリエ係数ベクトルをグラフ化した場合のスペクトルのピーク本数により表される。
【0112】
また、上記のフーリエ係数調整部218の処理を多項式のフーリエ係数の変化の観点から見れば、フーリエ係数調整部218(フーリエ係数ベクトル調整部)は、フーリエ係数ベクトル記憶部214から取得したフーリエ係数ベクトルに対応する多項式の各項のフーリエ係数のうち絶対値が小さい方から段階的にそのフーリエ係数を有する項削除し、削除項数が異なる複数の多項式を得る多項式調整部として機能することになる。
【0113】
また、この処理をピークの本数変化の観点から見れば、フーリエ係数調整部218(フーリエ係数ベクトル調整部)は、フーリエ係数ベクトル記憶部214から取得したフーリエ係数ベクトルに含まれるフーリエ係数の絶対値に対応するピーク高さの小さい方から段階的にそのピークに対応するフーリエ係数を削除し、調整レベルが異なる複数の調整フーリエ係数ベクトルとして、ピーク削除本数が異なる複数の調整フーリエ係数ベクトルを生成する機能を有することになる。
【0114】
また、具体的には、フーリエ係数調整部218は、上述の「研究内容の説明」で説明したように、原信号を離散フーリエ変換して得られた複素係数ベクトルから、いくつかの係数を零に置き換えたベクトルを作ってモデルデータである複数のフーリエ係数ベクトル(フーリエ係数ベクトル)を作成する。この場合、どの係数を零にするかを決める際に、係数が少なく計算時間が待てる範囲なら、絶対値の小さい係数から段階的に削減して得られる組み合わせにくわえて、全ての組み合わせを試してもよい。
【0115】
図7は、図2に示す周期判定装置に含まれる適切モデル判定部および周期判定部の内部構成を示した機能ブロック図である。適切モデル判定部232は、BIC計算値記憶部230から元データおよび逆変換データのIDおよびBIC計算値を取得する受付部702を備える。
【0116】
また、適切モデル判定部232は、受付部702が取得したBIC計算値のうち最小または極小のBIC計算値を判定する最小BIC値判定部704を備える。
【0117】
さらに、適切モデル判定部232は、最小BIC値判定部704によりBIC計算値が最小または極小であると判定された元データまたは逆変換データのID(元データおよび逆変換データをフーリエ変換して得られるフーリエ係数ベクトルにも対応するID)を選択する最小BIC値対応フーリエ係数ベクトル選択部706を備える。
【0118】
そして、適切モデル判定部232は、最小BIC値対応フーリエ係数ベクトル選択部706により選択されたIDを周期判定部324に出力する出力部708を備える。
【0119】
また、周期判定部234は、適切モデル判定部232から最小BIC値対応フーリエ係数ベクトル選択部706により選択されたIDを取得し、設定周期記憶部226から周期の設定値を取得する受付部710を備える。
【0120】
さらに、周期判定部234は、受付部710が取得したBIC計算値が最小または極小であると判定された元データまたは逆変換データのIDに対応するフーリエ係数ベクトルを、フーリエ係数ベクトル取得部214から取得する最小BIC値対応フーリエ係数ベクトル取得部712を備える。
【0121】
そして、周期判定部234は、最小BIC値対応フーリエ係数ベクトル取得部712により取得されたフーリエ係数ベクトル(情報量基準が最小または極小の逆変換データに対応するフーリエ係数ベクトル)中に、受付部710が取得した設定値の周期のスペクトルが含まれるか判定する設定周期有無判定部714を備える。
【0122】
また、周期判定部234は、設定周期有無判定部714による判定結果を示す出力レポートを作成する出力レポート作成部716を備える。
【0123】
出力レポート作成部716は、情報量基準が最小または極小の逆変換データに対応するフーリエ係数ベクトル中に設定値の周期のスペクトルに対応するフーリエ係数が含まれる場合には、設定値の周期が存在する旨のレポートを作成する。一方、出力レポート作成部716は、情報量基準が最小または極小の逆変換データに対応するフーリエ係数ベクトル中に設定値の周期のスペクトルに対応するフーリエ係数が含まれない場合には、設定値の周期が存在しない旨のレポートを作成する。
【0124】
さらに、周期判定部234は、出力レポート作成部716の作成したレポートを出力部208に出力するレポート出力部718を備える。
【0125】
なお、具体的には、上述の「研究内容の説明」で説明したように、BIC計算部228は、調整レベルが異なる複数のモデルデータ(フーリエ係数ベクトル)について情報量規準(BIC)を計算し、得られた複数のBIC計算値をBIC計算値記憶部230に格納する。
【0126】
適切モデル判定部232は、BIC計算値記憶部230から複数のBIC計算値を取得し、BIC計算値を最小または極小にするフーリエ係数ベクトルのIDを選択する。適切モデル判定部232は、このIDを周期判定部234にわたす。
【0127】
周期判定部234は、適切モデル判定部232から取得したIDに対応するBIC計算値を最小または極小にするフーリエ係数ベクトルの中に、注目している周期(設定周期)に対応する係数が含まれているかどうかで、原信号がその周期性を持っているかどうかを判断する。
【0128】
以下、実施の形態に係る周期判定装置の動作について説明する。
図8は、実施の形態に係る周期判定装置の動作について説明するためのフローチャートである。周期判定装置100は、受付部206が元データおよび周期の設定値を受け付けることにより一連の動作をスタートさせる。
【0129】
まず、受付部206は、受け付けた元データを元データ記憶部210に渡す。また、受付部206は、受け付けた周期の設定値を周期設定部224に渡す。元データを取得した元データ記憶部210は、元データを格納する。このとき、n=サンプリング時刻数の場合に、数値nを元データと対にして元データ記憶部210に格納する。
【0130】
一方、周期の設定値を取得した周期設定部224は、周期の設定値を設定周期記憶部226に格納する。このとき、周期設定部224は、周期の設定値の単位を変換する必要がある場合には、取得した設定値の数値および単位を変換したうえで、設定値および単位を対にして設定周期記憶部226に格納する。
【0131】
次いで、時系列データ作成部212は、元データ記憶部210に格納されている元データを取得し、元データが時系列データでない場合には、元データを時系列データに変換して元データ記憶部210に格納する。このときも、n=サンプリング時刻数の場合に、数値nを変換した時系列データと対にして元データ記憶部210に格納する。
【0132】
続いて、DFT変換部216は、元データ記憶部210から元データ(原信号)を取得し、離散フーリエ変換する(S102)。そして、DFT変換部216は、元データ(原信号)を離散フーリエ変換して得られるフーリエ係数ベクトルをフーリエ係数ベクトル記憶部214に格納する。このとき、n=サンプリング時刻数の場合に、数値nをフーリエ係数ベクトルと対にしてフーリエ係数ベクトル記憶部214に格納する(S104)。
【0133】
また、DFT変換部216は、設定周期記憶部226から周期の設定値を取得し、元データの全長時間幅が周期の設定値の倍数ではない場合には、元データをゼロ詰め処理して全長時間幅が周期の設定値の倍数となるように変換したうえで、離散フーリエ変換する。あるいは、DFT変換部216は、元データが等間隔データでない場合には、元データを補間処理して等間隔データに変換し、この等間隔データを離散フーリエ変換する。
【0134】
次いで、DFT変換部216は、フーリエ係数調整回数i=0に設定し、数値i=0を現在処理中のフーリエ係数ベクトルおよび対応する元データ(原信号)と対にしてフーリエ係数ベクトル記憶部214に格納する(S106)。そして、フーリエ係数調整部218は、フーリエ係数ベクトル記憶部214からi=0に対応するフーリエ係数ベクトルを取得し、絶対値がi番目に小さなフーリエ係数を0に置換して、i=1に対応するフーリエ係数ベクトルを生成する(S108)。このとき、フーリエ係数ベクトルに対応するスペクトルデータが左右対称なので、2つの同じ大きさのフーリエ係数が同時に消えることになる。また、フーリエ係数調整部218は、置換したフーリエ係数ベクトルをi=1と対にしてフーリエ係数ベクトル記憶部214に格納する。
【0135】
さらに、逆DFT変換部220は、フーリエ係数ベクトル記憶部214からi=1に対応するフーリエ係数ベクトルを取得し、フーリエ係数ベクトルをフーリエ逆変換してi=1に対応する逆変換データを得る(S110)。そして、逆DFT変換部220は、逆変換データをi=1と対にして逆変換データ記憶部222に格納する。
【0136】
続いて、BIC計算部228は、逆変換記憶部222からi=1に対応する逆変換データを取得し、逆変換データのBIC(情報量基準)を計算する(S112)。そして、BIC計算部228は、BIC(情報量基準)をi=1と対にしてBIC計算値記憶部230に格納する。
【0137】
次に、DFT変換部216は、前回設定したフーリエ係数調整回数i=0について、i=n/2であるか否か判定する(S114)。このとき、n=サンプリング時刻数(例えば24)であるので、未だ成立していない(No)として、i=i+1(すなわちフーリエ係数調整回数i=1)として、次のサイクルに進む(S116)。
【0138】
すなわち、フーリエ係数調整回数i=1として、フーリエ係数調整部218は、フーリエ係数ベクトル記憶部214からi=1に対応するフーリエ係数ベクトルを取得し、絶対値がi番目に小さなフーリエ係数を0に置換して、i=2に対応するフーリエ係数ベクトルを生成する(S108)。さらに、上述と同様に、ステップ110、ステップ112、ステップ114、ステップ116を繰り返す。このサイクルを12回繰り返すと、ステップ114でi=n/2が成立する(Yes)として、ステップ118に進む。
【0139】
なお、上述のステップ114で、i=n/2であるか否か判定する理由は、フーリエ変換されたフーリエ係数ベクトルに対応するスペクトルデータが左右対称であり、ステップ108の処理でフーリエ係数が2つずつ0になるからである。
【0140】
このようにしてステップ110、ステップ112、ステップ114、ステップ116を繰り返すことにより、小さいフーリエ係数を順次削除した複数の調整フーリエ係数ベクトルが得られる。すなわち、単純化の程度によって調整レベルが異なる複数の調整フーリエ係数ベクトルを得ることができる。この処理は、上述の「研究の説明」で述べたように、原信号である時系列データを離散フーリエ変換して得られた複素係数ベクトルから、いくつかの係数を零に置き換えた複数の異なる複素係数ベクトルを得ることに相当している。また、上述の一連の処理により、これらの調整フーリエ係数ベクトルにそれぞれ対応する複数のBIC計算値が得られる。
【0141】
そして、ステップ118では、適切モデル判定部232が、BIC計算値記憶部230に格納されているBIC計算値を取得し、最小のBIC計算値および対応するIDを判定する。次いで、周期判定部234は、適切モデル判定部232から最小のBIC計算値および対応するIDを取得し、設定周期記憶部226から周期の設定値を取得する。また、周期判定部234は、最小のBIC計算値に対応するIDに基づいて、BIC計算値が最小の逆変換データに対応するフーリエ係数ベクトルをフーリエ係数ベクトル記憶部214から取得する。
【0142】
続いて、周期判定部234は、BIC計算値が最小の逆変換データに対応する調整フーリエ係数ベクトルおよび設定値の周期を対比して、調整フーリエ係数ベクトル中に設定値の周期のスペクトルに対応するフーリエ係数が含まれるか判定する。つまり、周期判定部234は、情報量基準が最小の時に目的の周期の係数が残っているか判定する(S118)。
【0143】
そして、周期判定部234は、情報量基準が最小の時に目的の周期の係数が残っている(Yes)と判定すると、原信号はその周期性を持つ旨の判定結果を出力部208を介して出力する(S120)。一方、周期判定部234は、情報量基準が最小の時に目的の周期の係数が残っていない(No)と判定すると、原信号はその周期性を持たない旨の判定結果を出力部208を介して出力する(S122)。
【0144】
上述の一連のステップを完了すると、周期判定装置100は、動作を終了する。
【0145】
以下、実施の形態に係る周期判定装置の処理するデータのデータ構造およびデータの画像表示について説明する。
【0146】
図9は、実施の形態に係る周期判定方法の概念を説明するためのグラフである。図9の横軸は、サンプリングの時刻を表す。一方、図9の縦軸は、遺伝子発現強度を表す。周期判定装置100は、例えば、図9のグラフの下部の実線で示される観察された時系列データ(遺伝子発現系列の時系列データ)に、図9のグラフの上部の点線で示される純粋な24時間周期の波が含まれているか否かを判定するために用いられる。
【0147】
図10は、実施の形態における周期性判定方法を説明する図である。図10の左側の列は、原信号の時系列データと近似曲線(単純化モデルの逆変換データ)のグラフであり、横軸は時系列データのサンプリング時刻であり、縦軸は時系列データの強度である。図10の右側の列は、時系列データのフーリエ係数ベクトルに対応するスペクトルデータのグラフであり、横軸はスペクトルの周波数であり、縦軸はスペクトルのピークの絶対値を表す。なお、フーリエ係数ベクトルに対応するスペクトルデータのグラフは、y軸を挟んで左右対称となるが、図10には右半分のみが示されている。また、図10右端には、対応するBIC計算値が示されている。
【0148】
図10において、左の列の最上段は、原信号の時系列データである。このデータがフーリエ変換され、最上段右側のフーリエ係数ベクトルに対応するスペクトルデータが得られる。そして、矢印で示される最小ピークが削除され、2段目のモデル化されたフーリエ係数ベクトルに対応するスペクトルデータが得られる。このスペクトルデータのモデルに対応するフーリエ係数ベクトルから逆フーリエ変換により左側の時系列データが得られ、さらにこの時系列データから右端のBIC計算値が算出される。
【0149】
同様にして、順次矢印で示された最小ピークが削除されて、フーリエ係数ベクトルに対応するスペクトルデータのモデルが単純化されていく。そして、各モデルに対応するフーリエ係数ベクトルから左の列の逆変換データが得られ、逆変換データからBIC計算値が算出される。
【0150】
図10より、フーリエ係数ベクトルに対応するスペクトルデータのうち、ピーク高さが最小のスペクトルのピークから順番に削除(調整)されていく様子がわかる。また、対応するBIC計算値をみると、スペクトルの調整(削除)本数が2本のときに(上から3段目)、BIC計算値が−10.0となり、最小となることがわかる。この3段目のスペクトルデータに対応するフーリエ係数ベクトルが、周期性判定で用いられることになる。
【0151】
図11は、実施の形態に係る周期判定装置が受け付ける時系列データの構成を説明するためのデータ構造図である。周期判定装置100の受付部206は、このようなテーブル構造からなる時系列データを受け付けることができる。
【0152】
図11(a)は、上述の「研究内容の説明」の項目で説明した「周期性がある、と判定される例」に対応する時系列データのテーブルである。図11(b)は、上述の「研究内容の説明」の項目で説明した「周期性がない、と判定される例」に対応する時系列データのテーブルである。
【0153】
以下、実施の形態に係る周期判定装置の作用効果について説明する。
実施の形態に係る周期判定装置100によれば、単純化の程度によって異なる調整レベルの複数のフーリエ係数ベクトルを逆フーリエ変換して得られる逆変換データのBICを計算するため、計算によりBICが最小または極小になるフーリエ係数ベクトルを求めることができる。このため、判定基準を定めるための試行錯誤、経験的判断を低減できる。その結果、主観的または恣意的な判断基準の混入が抑制され、時系列データの周期性を客観的に判定できる。
【0154】
また、実施の形態に係る周期判定装置100によれば、フーリエ係数調整部218は、フーリエ係数ベクトルに対応するスペクトルデータのうちピーク高さの小さい方から段階的にピークを削除し、調整レベルが異なる複数の調整フーリエ係数ベクトルとして、ピーク削除本数が異なる複数のスペクトルデータに対応する調整フーリエ係数ベクトルを生成する絶対値最小フーリエ係数0置換部606を含む。このため、判定基準を定めるための試行錯誤、経験的判断を低減できる。その結果、主観的または恣意的な判断基準の混入が抑制され、時系列データの周期性を客観的に判定できる。
【0155】
また、実施の形態に係る周期判定装置100によれば、フーリエ係数調整部218は、フーリエ係数ベクトルに含まれるフーリエ係数のうち絶対値が小さい方から段階的に該フーリエ係数を有する項を削除し、削除項数が異なる複数の多項式を得る絶対値最小フーリエ係数0置換部606を含む。このため、判定基準を定めるための試行錯誤、経験的判断を低減できる。その結果、主観的または恣意的な判断基準の混入が抑制され、時系列データの周期性を客観的に判定できる。
【0156】
また、実施の形態に係る周期判定装置100によれば、DFT変換部216は、時系列データが等間隔データでない場合には、時系列データを補間処理して等間隔データに変換し、この等間隔データをフーリエ変換する補間処理部508を備える。このため、DFT変換部216は、等間隔データでない時系列データであっても、離散フーリエ変換することができる。その結果、周期判定装置100では、周期性の判定可能な時系列データの時間間隔の適用範囲を拡大することができる。
【0157】
また、実施の形態に係る周期判定装置100によれば、DFT変換部216は、時系列データの全長時間幅が周期の設定値の倍数ではない場合には、時系列データをゼロ詰め処理して全長時間幅が周期の設定値の倍数となるように変換するゼロ詰め処理部506を備える。このため、DFT変換部216は、データの全長時間幅が周期の設定値の倍数ではない時系列データであっても、離散フーリエ変換することができる。その結果、周期判定装置100では、周期性の判定可能な時系列データのデータの全長時間幅の適用範囲を拡大することができる。
【0158】
また、実施の形態に係る周期判定装置100は、生命現象、社会現象などで観察される時系列データの周期性の判定に適している。周期判定装置100は、生命現象、社会現象などの中でも、遺伝子発現データの時系列データの周期性の判定に特に適している。周期判定装置100は、遺伝子発現データの時系列データの中でも、マイクロアレイの各セルを検出して得られるデータの時系列データの周期性の判定にとりわけ適している。
【0159】
以下、周期判定装置100の作用効果について、図面を用いてさらに詳細に説明する。
図12は、コサイナー法の概念について説明するためのグラフである。図12の横軸は、サンプリングの時刻を表す。一方、図12の縦軸は、遺伝子発現強度などの時系列データを表す。
【0160】
コサイナー法では、最良近似の三角関数を、周期、振幅、頂点位相などを基準に判定する。例えば、図11のグラフの実線で示される観察された時系列データ(遺伝子発現系列の時系列データ)に、図11のグラフの点線で示されるcos曲線を最小二乗法などで当てはめ、近似誤差が小さければそのモデルを採用し、モデルの持つ周期性が原信号にもあると判断する。
【0161】
このように、近似誤差が十分に小さい場合にデータもその周期を持つと判断するため、閾値となる二乗誤差などを経験的に定めておく必要がある。すなわち、どの程度近似が良ければモデルを採用するのか(その周期を持つと判定するのか)をあらかじめ決めておく必要がある。また現実問題として、ある程度cos曲線の見当が付いていないと最適化できないことが多い。このため、試行錯誤、経験的判断が必要となり、周期判定結果が恣意的、主観的になりやすい。
【0162】
図13は、自己相関解析の概念について説明するためのグラフである。図13の横軸は、サンプリングの時刻を表す。一方、図13の縦軸は、遺伝子発現強度などの時系列データを表す。
【0163】
自己相関解析では、原信号と、原信号の時刻だけずらされた信号の相関係数を計算し、相関係数が大きければ、そのずれが原信号の周期であると判定する。例えば、図13のグラフの実線で示される観察された時系列データ(遺伝子発現系列の時系列データ)をずれ幅分だけずらされてコピーされ、自分自身と重ねられて、斜線部分(重なっている部分)で相関係数が計算される。そして、ずれ幅を少しずつ変化させながら、相関係数が最大になるずれ幅を探す。その結果、相関関数の極大値が十分大きければその周期を持つと判定する。
【0164】
自己相関解析でも、どの程度相関係数が大きくなればその周期を持つとみなすのか、相関係数が最大の時にどの程度の値になればよいのか、あらかじめ決めておく必要がある。このため、試行錯誤、経験的判断が必要となり、周期判定結果が恣意的、主観的になりやすい。
【0165】
このようなコサイナー法および自己相関法と異なり、本実施の形態の周期性判定装置100は、情報量基準値を算出することで客観的な解析を実現している。
【0166】
次に、従来のフーリエ変換による周期性解析(以下、単に従来のフーリエ解析という)と本実施の形態の周期性解析との相違点を説明する。本実施の形態は、単なるフーリエ解析ではなく、情報量基準を使った判定をフーリエ変換と組み合わせており、これにより、以下に説明するように、従来のフーリエ解析にはできない周期性解析を可能としており、より詳細には、従来のフーリエ解析には適用できない種類の時系列データ(例えば、遺伝子発現データ)の周期性判定を可能としている。
【0167】
図14(a)は、従来のフーリエ解析に適したフーリエ係数ベクトルに対応するスペクトルデータの模式図である。図14(a)では、単一の大きなピークが現れている。従来方法は、この大きなピークが目的の周期と一致するか否かを判定している。そして、従来方法の解析対象は、一般には、フーリエ変換によって図14(a)のような単一の大きなピークが現れることが予め分かっている時系列データであった。言い換えれば、従来は、単一の大きなピークが出るデータへと、解析対象が限られていた。
【0168】
一方、図14(b)は、本実施の形態で用いられた遺伝子発現量の時系列データをフーリエ変換したフーリエ係数ベクトルに対応するスペクトルデータの模式図である。図14(b)に示されるように、遺伝子発現量のデータをフーリエ変換すると、複数の大きなピークが現れる。しかも、最大のピークが目的の周期に対応しているとは限らない。2番目、3番目、あるいはそれより小さいピークが目的の周期と対応しているかもしれない。したがって、単一の大きなピークの有無を判定する従来のフーリエ解析は、図14(b)のような遺伝子発現量のデータには使えない。
【0169】
また、従来のフーリエ解析を応用し、所定の順位までに目的周期のピークが含まれているかを判定することも考えられる。しかし、所定の順位を設定する時点で、すなわち、何番目までのピークを考慮するかという判断において、恣意的・主観的判断が混入してしまい、客観的な判定結果を得にくくなる。
【0170】
これに対して、本実施の形態は、上述のように、フーリエ係数ベクトルに対応するスペクトルデータから小さいピークを順次削除していき、各削除時点のフーリエ係数ベクトルに基づいて情報量基準を算出している(具体的には、フーリエ係数ベクトルの逆変換データからBIC等を算出している)。そして、情報量基準が最小のフーリエ係数ベクトルに対応するスペクトルデータを適切モデルとし、適切モデルに目的の周期がまだ残っていれば、対象の時系列データが目的の周期を含むと判定する。このような処理を行っているので、図14(b)のようなデータの周期性も好適に判定できる。すなわち、目的の周期が対応するピークの大きさが2番目以下であったとしても、周期性の判定ができる。しかも、客観的な情報量である情報量基準を処理しているので、周期判定結果が恣意的、主観的になるのを回避できる。
【0171】
実際に、試験実装として、12422個の遺伝子×12点の時系列データをMAC OS X、MATLABを利用して、上述の実施形態の周期判定装置により周期判定したところ、約2分で信頼性の高い判定結果を得ることができた。
【0172】
以上、図面を参照して本発明の実施形態について述べたが、これらは本発明の例示であり、上記以外の様々な構成を採用することもできる。
【0173】
例えば、上記実施の形態では情報量基準をBIC(Baysian Information Criterion)としたが、AIC(赤池情報基準)であってもよい。また、BIC、AIC以外にも、モデルと信号の差、およびモデルのパラメータ数から計算できるものであれば、情報量基準として用いることができる。
【0174】
また、フーリエ変換を用いる場合でも、真の値の周囲に散らばっているものを観測したはずであるので、分布関数をあらかじめ設定しておくことが必要である。この場合、正規分布を仮定すると、分散だけを考慮すればよい(データとモデルの差の残差分散でよい)。このため、分布関数が未知の場合には、正規分布を仮定することで情報量基準を計算できる。
【0175】
また、フーリエ変換としては、DFT(離散フーリエ変換)のみならず、データが所要の条件を満たしていれば、FFT(高速フーリエ変換)も行うことができる。この場合にも、複数のピークを有するフーリエ係数ベクトルが得られるので、上述と同様の作用効果が得られる。
【0176】
また、上記実施の形態では、生物的データについて説明したが、株価指数などの社会的データについても、元データとして用いると、客観的に周期性を判定することができる。株価指数などの社会的データも、フーリエ変換すると、複数の大きなピークを有するフーリエ係数ベクトルとなる場合が多いからである。
【0177】
例えば、本発明の態様として、周期判定プログラムを計算機上にソフトウェアとして実装することこができる。ハードウェア、ソフトウェアとも、市販のものでかまわない。例えば、ハードウェアとして、スーパーコンピューター、PC、サーバなど使用可能である。また、ソフトウェアとして、ウィンドウズ(登録商標)XP、MAC OS X、MATLABなどを使用可能である。
【0178】
また、上記実施の形態では、充分に適したモデルを得るために、フーリエ係数を一つずつ減らしていく方法を用いているが、特に限定されず、全数探索あるいは近似探索で最もよいモデルを探すこともできる。この際、全数探索では、フーリエ係数ベクトルに含まれるどのフーリエ係数を0にするか、あり得るすべての組合せについて、情報量基準を計算して最良のモデルを決める。
【0179】
一方、近似探索は、時系列データの時点数が多くて全数探索がいわゆる組合せの激増などで事実上困難なときに、最良とは限らないが最良に近いモデルを探す方法全般を指す。近似探索には、遺伝的アルゴリズム、シミュレーティド・アニーリングなどがある。
【産業上の利用可能性】
【0180】
以上のように、本発明にかかる周期判定装置は、時系列データの周期性を客観的に判定することができるという効果を有し、周期判定装置、周期判定方法および周期判定プログラム等として有用である。
【図面の簡単な説明】
【0181】
【図1】実施の形態に係る周期判定システムの全体構成を示した機能ブロック図である。
【図2】図1に示す周期判定システムに含まれる周期判定装置の内部構成を示した機能ブロック図である。
【図3】図1に示す周期判定システムに含まれるマイクロアレイ分析装置およびスキャナの内部構成を示した機能ブロック図である。
【図4】実施の形態に係る周期判定システムの変形例に含まれるマイクロアレイ分析装置、スキャナおよびサーバの内部構成を示した機能ブロック図である。
【図5】図2に示す周期判定装置に含まれるDFT変換部の内部構成を示した機能ブロック図である。
【図6】図2に示す周期判定装置に含まれるフーリエ係数調整部の内部構成を示した機能ブロック図である。
【図7】図2に示す周期判定装置に含まれる適切モデル判定部および周期判定部の内部構成を示した機能ブロック図である。
【図8】実施の形態に係る周期判定装置の動作について説明するためのフローチャートである。
【図9】実施の形態に係る周期判定方法の概念を説明するためのグラフである。
【図10】実施の形態に係る周期判定方法におけるフーリエ係数ベクトルに対応するスペクトルデータの調整について説明するためのグラフである。
【図11】実施の形態に係る周期判定装置が受け付ける時系列データの構成を説明するためのデータ構造図である。
【図12】コサイナー法の概念について説明するためのグラフである。
【図13】自己相関解析の概念について説明するためのグラフである。
【図14】一般的にフーリエ変換による解析の対象となるデータのフーリエ係数ベクトルに対応するスペクトルデータおよび生物的データのフーリエ係数ベクトルに対応するスペクトルデータの典型的な違いについて説明するためのグラフである。
【符号の説明】
【0182】
1000 周期判定システム
100 周期判定装置
102 マイクロアレイ分析装置
104 スキャナ
106 操作部
108 PC
110 サーバ
112 外部ネットワーク
114 画像表示装置
116 プリンタ
118 外部ネットワーク
120 PC
122 サーバ
202 探索部
204 判定部
206 受付部
208 出力部
210 元データ記憶部
212 時系列データ作成部
214 フーリエ係数ベクトル記憶部
216 DFT変換部
218 フーリエ係数調整部
220 逆DFT変換部
222 逆変換データ記憶部
224 周期設定部
226 設定周期記憶部
228 BIC計算部
230 BIC計算値記憶部
232 適切モデル判定部
234 周期判定部
302 スライドアレイ設置部
304 標識プローブアプライ部
306 ハイブリダイゼーション部
308 蛍光発光処理部
310 蛍光スキャン部
312 スキャンデータ解析部
402 スライドアレイ設置部
404 標識プローブアプライ部
406 ハイブリダイゼーション部
408 蛍光発光処理部
410 蛍光スキャン部
412 スキャンデータ記憶部
414 出力部
416 スキャンデータ受付部
418 スキャンデータ記憶部
420 スキャンデータ解析部
422 解析データ記憶部
424 出力部
426 外部ネットワーク
502 受付部
504 変換処理部
506 ゼロ詰め処理部
508 補間処理部
510 出力部
602 受付部
604 絶対値最小フーリエ係数判定部
606 絶対値最小フーリエ係数0置換部
608 出力部
702 受付部
704 最小BIC値判定部
706 最小BIC値対応フーリエ係数ベクトル選択部
708 出力部
710 受付部
712 最小BIC値対応フーリエ係数ベクトル取得部
714 設定周期有無判定部
716 出力レポート作成部
718 レポート出力部

【特許請求の範囲】
【請求項1】
時系列データの周期性を判定する周期判定装置であって、
前記時系列データを受け付ける時系列データ受付部と、
周期の設定値を受け付ける周期受付部と、
前記時系列データをフーリエ変換してフーリエ係数ベクトルを得るフーリエ変換部と、
前記時系列データに対応するフーリエ係数ベクトルに対して、前記フーリエ係数ベクトルに含まれるフーリエ係数の少なくとも一部を削除して単純化する調整を行い、単純化の程度によって調整レベルが異なる複数の調整フーリエ係数ベクトルを得るフーリエ係数ベクトル調整部と、
前記複数の調整フーリエ係数ベクトルをそれぞれ逆フーリエ変換し、複数の逆変換データを得る逆フーリエ変換部と、
前記複数の逆変換データのそれぞれの情報量基準を計算する情報量基準計算部と、
前記情報量基準が最小または極小の前記逆変換データに対応する前記フーリエ係数ベクトル中に、前記設定値の周期のスペクトルが含まれるか判定する周期判定部と、
前記周期判定部の判定結果を出力する出力部と、
を備える周期判定装置。
【請求項2】
請求項1に記載の周期判定装置において、
前記フーリエ係数ベクトル調整部は、前記時系列データに対応するフーリエ係数ベクトルに対して絶対値が小さいフーリエ係数から優先的に削除して単純化する調整を行い、単純化の程度によって調整レベルが異なる複数の調整フーリエ係数ベクトルを得る周期判定装置。
【請求項3】
請求項1または2記載の周期判定装置において、
前記フーリエ係数ベクトル調整部は、前記フーリエ係数ベクトルから削除される前記フーリエ係数の組合せとして、前記フーリエ係数ベクトルに含まれる前記フーリエ係数から構成可能なすべての組合せを用いる周期判定装置。
【請求項4】
請求項1乃至3いずれかに記載の周期判定装置において、
前記フーリエ係数ベクトル調整部は、前記フーリエ係数ベクトルに含まれるフーリエ係数の少なくとも一部を削除するフーリエ係数削除部を含み、前記調整レベルが異なる複数の調整フーリエ係数ベクトルとして、フーリエ係数削除数が異なる複数の調整フーリエ係数ベクトルを生成する周期判定装置。
【請求項5】
請求項1乃至4いずれかに記載の周期判定装置において、
前記フーリエ係数ベクトル調整部は、前記調整レベルが異なる複数の調整フーリエ係数ベクトルとして、前記時系列データに対応する前記フーリエ係数ベクトルから削除される前記フーリエ係数の組合せが異なる複数の調整フーリエ係数ベクトルを生成する周期判定装置。
【請求項6】
請求項1乃至5いずれかに記載の周期判定装置において、
前記フーリエ変換部は、前記時系列データが等間隔データでない場合には、前記時系列データを補間処理して等間隔データに変換し、該等間隔データをフーリエ変換するように構成されている周期判定装置。
【請求項7】
請求項1乃至6いずれかに記載の周期判定装置において、
前記フーリエ変換部は、前記時系列データの全長時間幅が前記周期の設定値の倍数ではない場合には、前記時系列データをゼロ詰め処理して全長時間幅が前記周期の設定値の倍数となるように変換し、該変換済データをフーリエ変換するように構成されている周期判定装置。
【請求項8】
請求項1乃至7いずれかに記載の周期判定装置において、
前記時系列データは、遺伝子発現量の時系列データである周期判定装置。
【請求項9】
請求項1乃至8いずれかに記載の周期判定装置において、
前記時系列データは、マイクロアレイの各セルを検出して得られる時系列データである周期判定装置。
【請求項10】
時系列データの周期性を判定する周期判定方法であって、
前記時系列データをフーリエ変換してフーリエ係数ベクトルを得るステップと、
前記時系列データに対応するフーリエ係数ベクトルに対して、前記フーリエ係数ベクトルに含まれるフーリエ係数の少なくとも一部を削除して単純化する調整を行い、単純化の程度によって調整レベルが異なる複数の調整フーリエ係数ベクトルを得るステップと、
前記複数の調整フーリエ係数ベクトルをそれぞれ逆フーリエ変換し、複数の逆変換データを得るステップと、
前記複数の逆変換データのそれぞれの情報量基準を計算するステップと、
前記情報量基準が最小または極小の前記逆変換データに対応する前記フーリエ係数ベクトル中に、所定の周期のスペクトルが含まれるか判定するステップと、
を含む周期判定方法。
【請求項11】
時系列データの周期性を判定する処理をコンピュータに実行させるための周期判定プログラムであって、
前記時系列データを受け付けるステップと、
周期の設定値を受け付けるステップと、
前記時系列データをフーリエ変換してフーリエ係数ベクトルを得るステップと、
前記時系列データに対応するフーリエ係数ベクトルに対して、前記フーリエ係数ベクトルに含まれるフーリエ係数の少なくとも一部を削除して単純化する調整を行い、単純化の程度によって調整レベルが異なる複数の調整フーリエ係数ベクトルを得るステップと、
前記複数の調整フーリエ係数ベクトルをそれぞれ逆フーリエ変換し、複数の逆変換データを得るステップと、
前記複数の逆変換データのそれぞれの情報量基準を計算するステップと、
前記情報量基準が最小または極小の前記逆変換データに対応する前記フーリエ係数ベクトル中に、所定の周期のスペクトルが含まれるか判定するステップと、
前記周期判定部の判定結果を出力するステップと、
をコンピュータに実行させる周期判定プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate


【公開番号】特開2006−259789(P2006−259789A)
【公開日】平成18年9月28日(2006.9.28)
【国際特許分類】
【出願番号】特願2005−72172(P2005−72172)
【出願日】平成17年3月15日(2005.3.15)
【出願人】(301021533)独立行政法人産業技術総合研究所 (6,529)
【Fターム(参考)】