質量信号のノイズ低減処理方法及び装置
【課題】三次元データに直接的にWavelet解析を適用してノイズ低減処理を行う方法を提供すること。
【解決手段】空間分布を有する質量スペクトル情報を処理する際に、全体のデータを三次元データ(x、y平面に位置情報を、z軸方向にスペクトル情報を格納する)とみなした上で、スペクトル方向とピーク値分布方向(平面内方向)とで、それぞれに好適な基底関数を適用し、三次元的なwaveletノイズ低減処理をすることにより、より効果的なノイズ低減方法を提供する。
【解決手段】空間分布を有する質量スペクトル情報を処理する際に、全体のデータを三次元データ(x、y平面に位置情報を、z軸方向にスペクトル情報を格納する)とみなした上で、スペクトル方向とピーク値分布方向(平面内方向)とで、それぞれに好適な基底関数を適用し、三次元的なwaveletノイズ低減処理をすることにより、より効果的なノイズ低減方法を提供する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、質量分析スペクトルのデータ処理方法に関し、とりわけノイズ低減処理に関するものである。
【背景技術】
【0002】
ヒトゲノム(genome)配列の解読完了後、生命現象の実際の担い手であるタンパク質を解析するプロテオーム(proteome)解析が注目を集めている。タンパク質の直接解析が疾患の原因究明、創薬、テーラーメード医療の実現につながると考えられるからである。プロテオーム解析が注目される別の理由として、転写産物であるRNAの発現解析、すなわちトランスクリプトーム(transcriptome)解析ではタンパク質の発現を十分予測することができないことがわかってきたことや、翻訳後修飾されたタンパク質の修飾部位や立体構造をゲノム情報から得ることが難しいこと、なども挙げられる。
【0003】
プロテオーム解析の対象となるタンパク質の種類は細胞当たり数万種ある一方、それぞれの発現量は分子数にして一細胞当たり100から100万程度と見積もられている。対象タンパク質を発現している細胞は生体のうちの一部分であることも考えると、それぞれのタンパク質の生体内での発現量は極めて微量である。また、プロテオーム解析においてはゲノム解析で用いる増幅手法を使用することができないため、プロテオーム解析における検出系は事実上、高感度な質量分析に限られる。
【0004】
プロテオーム解析の手順は、
(1)二次元電気泳動や高速液体クロマトグラフィー(HPLC)による分離精製
(2)分離精製したタンパク質のトリプシン消化(trypsin digestion or tryptic digestion)
(3)ペプチド断片混合物の質量分析
(4)タンパク質データベースとの照合によるタンパク質の同定
が一般的である。この手法はペプチドマスフィンガープリンティング法( PMF法:peptide mass fingerprinting method)と呼ばれている。PMF法の質量分析では、イオン化手法、質量分析計としてそれぞれMALDI、TOF型質量分析計を用いるのが一般的である。
【0005】
上記の他に、イオン化手法、質量分析計としてそれぞれESI、イオントラップ型質量分析計を用い、各ペプチドについてMS/MS測定を行った後、得られるプロダクトイオンリストを用いて検索を行う方法もある。この検索にはMatrix Science社製のプロテオーム解析用検索エンジンMASCOT(R)などが使用される。この方法は通常のPMF法に比べ情報量が多く複雑となるが、連続したアミノ酸列の帰属まで確認できるため、通常のPMF法より精度の高いタンパク質同定が可能となる。
【0006】
この他、最近注目される関連技術として、フーリエ変換型の質量分析計を用いた超精密質量分析によるタンパク質やペプチド断片の同定法、ペプチドのMS/MSスペクトルを用い、De novo sequencingと呼ばれる数学的演算処理でアミノ酸配列を算出する方法、生体組織切片における注目細胞(数千個)を、laser microdissection法を用いて切り出す前処理方法、ペプチド断片混合物に含まれる特定ペプチドの定量を目的としたselected reaction monitoring法(SRM法)やmultiple reaction monitoring法(MRM法)と呼ばれる質量分析手法、などが挙げられる。
【0007】
一方、病理検査等において、組織における特異抗原の可視化が求められる。これまでのところ、病理検査においては、免疫染色法(免染)を用いて特異抗原タンパク質を染色する手法が主に用いられている。乳がんを例に挙げれば、ホルモン療法の判断基準となる ER(ホルモン依存性腫瘍に発現するエストロゲンレセプター) や、ハーセプチン投与の判断基準となる HER2 (進行の速い悪性がんに見られる膜タンパク質)が免染により可視化される。しかしながら免染には、抗体の持つ不安定性や、抗原抗体反応効率の制御の難しさに起因する再現性不良の問題がある。また今後、この機能診断のニーズが高まった場合、例えば数100種以上のタンパク質を同時に検出する必要が生じた場合、現在の免染では対応できなくなるという問題がある。
【0008】
また、さらには、特異抗原の可視化は細胞レベルで求められる場合がある。たとえば、がん幹細胞に関する研究においては、腫瘍組織の一部の分画のみが免疫不全マウスへの異種移植後に腫瘍を形成することが明らかになったことから、腫瘍組織の成長が腫瘍幹細胞の分化や自己再生の能力に依存していると理解されつつある。このような研究においては、組織全体ではなく、組織中における個々の細胞において、特異抗原の発現分布を観察することが必要となる。
【0009】
以上の様に、腫瘍組織などに発現しているタンパク質を、細胞レベルで網羅的に可視化することが求められるが、そのような解析方法として、飛行時間型二次イオン質量分析法(TOF-SIMS法)をはじめとする二次イオン質量分析法(SIMS法)による測定が候補になっている。SIMS法による測定では、質量分析情報を二次元で、しかも高い空間分解能で得ることができる。また、このとき、質量スペクトルの各ピーク値分布の同定を容易にし、結果として質量スペクトルの空間分布に対応するタンパク質の同定を従来よりも確実かつ短時間で行うため、全体のデータを三次元データ(xy平面に位置情報を、z軸方向に各位置に対応するスペクトル情報を格納する)とみなしてデータ処理することもある。
【0010】
SIMS法は、試料に一次イオンビームを照射し、試料から分離された二次イオンを検出することにより、空間各点の質量スペクトルを得る方法である。例えば、TOF-SIMS法においては、二次イオンの飛行時間が、イオンの質量Mと電荷に依存していることを利用して、空間各点の質量スペクトルを得ることができる。但し、イオンの検出は離散的な過程であり、検出数が多くない場合には、ノイズの影響を無視することができない。そのため、各種手法を適用したノイズ低減処理が行われている。
【0011】
ノイズ低減手法にも各種あるが、特許文献1においては、Wavelet解析を用いて、二枚以上の二次元画像を解析し、両者の相関を考えることによって効果的にノイズ低減を行う手法が提案されている。また、非特許文献1においては、SIMS image に対して二次元のWavelet解析を用い、確率過程(ガウス or ポアソン過程)を考慮したノイズ低減手法が提案されている。
【0012】
なお、上記の「細胞レベル」とは、少なくとも一つ一つの細胞を識別できるレベルを意味する。細胞の径は、神経細胞などの大きなものは約50μmであるものの、概ね10μmから20μmの範囲にある。したがって、細胞レベルの二次元分布像を取得するには空間分解能が10μm以下であることが必要であり、好ましくは5μm以下、さらに好ましくは2μm以下、より好ましくは1μm以下である。空間分解能は、例えばナイフエッジの試料の線分析結果から決定することができる。なお空間分解能は「該試料の境界の両側において、片側に配置した物質に起因する信号強度がそれぞれ20%、80%となる二点間の距離」という一般的な定義に基づき決定される。
【先行技術文献】
【特許文献】
【0013】
【特許文献1】特開2007−209755:画像化方法におけるノイズリダクション方法、メモリ媒体および断層撮影システム
【非特許文献】
【0014】
【非特許文献1】Chemometrics and Intelligent Laboratory Systems 34(1996)263-273:De-noising of SIMS images via wavelet shrinkage
【発明の概要】
【発明が解決しようとする課題】
【0015】
従来、Wavelet解析を適用したノイズ低減処理においては、一次元の時系列もしくは、二次元の平面内のデータに対する処理が行われていた。
【0016】
一方で、例えば細胞レベルでSIMSにより質量分析を行う場合には、空間の各点の位置情報及び、その各点の位置に対応する質量スペクトルの情報が得られることになる。そのため、SIMSにより得られたデータに対して二次元のWavelet解析を適用したノイズ低減処理をするには、連続的な特性を持つ位置情報と離散的な特性を持つ質量スペクトルとの双方について、それぞれWavelet解析をする必要がある。これらのデータを三次元データ(xy平面に位置情報を、z軸方向にスペクトル情報を格納する)とみなして一括してデータを処理することは従来から行われていたが、この三次元データに直接的にWavelet解析を適用してのノイズ低減処理は行われていなかった。
【0017】
また、従来は、SIMS法により得られた二次元の平面内データに対してWavelet解析を適用したノイズ低減処理を適用する場合でも、各軸方向に対して、同じ基底関数を適用した処理が行われていた。
【0018】
しかしながら、空間各点における質量スペクトルはピーク値を多数持つ様な離散的な分布を示すのに対して、そのピーク値の空間分布(トータルでは、例えばインスリン等の空間分布に対応する)は、ある程度連続的な分布になることが想定される。従って、このデータに対してWavelet解析を適用したノイズ低減処理を行う際に、各方向に同じ基底関数を適用する処理を行うことは通常望ましくない。
【0019】
そこで本発明においては、上記三次元データに直接的にWavelet解析を適用してノイズ低減処理を行う方法を提供することを目的とする。また、本発明は、スペクトル方向とピーク値分布方向(平面内方向)とに対し、それぞれに好適な基底関数を適用することにより、より効果的なノイズ低減方法を提供することをさらなる目的とする。
【課題を解決するための手段】
【0020】
上記課題に鑑み、本発明に係る二次元質量スペクトルのノイズ低減処理方法は、xy平面内に組成分布を持つ試料について、xy平面上の各点の質量スペクトルを測定することにより得られる、二次元質量スペクトルのノイズ低減処理方法において、xy平面の各点のz軸方向に質量スペクトルデータを格納して三次元データを生成した上で、三次元のWavelet解析を適用しノイズ低減処理を行なうことを特徴とする。
【0021】
また、本発明に係る質量分析装置は、xy平面内に組成分布を持つ試料について、xy平面上の各点の質量スペクトルを測定することにより得られる、二次元質量スペクトルのノイズ低減処理方法において、xy平面の各点のz軸方向に質量スペクトルデータを格納して三次元データを生成した上で、三次元のWavelet解析を適用しノイズ低減処理を行なうことを特徴とする。
【発明の効果】
【0022】
本発明によれば、空間分布を有する質量スペクトルにおいて、質量スペクトルの離散的なデータ特性と、質量スペクトルの連続的な空間分布を加味した上で、両者を同時かつ高速にノイズ低減処理を行うことが可能になる。それによって、質量スペクトルの各ピーク値分布の同定が容易になり、結果として質量スペクトルの空間分布に対応するタンパク質の同定が従来よりも確実かつ短時間で行える様になる。
【図面の簡単な説明】
【0023】
【図1】測定した質量スペクトル信号とリファレンス信号から生成した三次元信号の模式図である。
【図2】三次元のWavelet解析における多重解像度解析の処理を示す模式図である。
【図3】三次元のWavelet解析において、各方向に適用する処理を示す模式図である。
【図4】三次元のWavelet解析において、各方向に適用する処理の順序を示す模式図である。
【図5】リファレンス信号に対して、Wavelet解析を適用して取得した各スケールの成分値から、ノイズ低減の際の閾値を決定することを示す模式図である。
【図6】設定したウェーブレット係数の絶対値が閾値以下の成分を0にし、Wavelet逆変換を行ってノイズが除去された質量信号を生成することを示す模式図である。
【図7】質量分析の対象となる試料及びその試料に対して質量分析を行うことにより得られるデータを示す模式図である。
【図8】空間分布を有する質量スペクトルを模擬するサンプルデータである。
【図9】サンプルデータのx軸方向とz軸方向の分布を示す図である。
【図10】サンプルデータのx軸方向とz軸方向に対して、Haar基底関数を用いたノイズ低減処理を行った結果である。
【図11】サンプルデータのx軸方向とz軸方向に対して、Coiflet基底関数を用いたノイズ低減処理を行った結果である。
【図12】サンプルデータのx軸方向にはHaar基底関数を、z軸方向にはCoiflet基底関数を用いたノイズ低減処理を行った結果である。
【図13】図10〜12の結果の一部分を拡大したものである。
【図14】本発明のフローチャートである。
【図15】本発明を搭載した質量分析装置の模式図である。
【図16】三次元Wavelet処理前後のHER2断片に対応する質量スペクトル分布である。
【図17】HER2タンパク質の免疫染色を実施し、染色強度を白色で示した光学顕微鏡像である。
【図18】ノイズ低減処理前後の、ある一点における質量スペクトル分布である。
【図19】バックグラウンドノイズの低減処理の効果を示したものである。
【図20】ノイズ低減処理前後の質量信号の変化量を閾値に対してプロットしたものである。
【図21】ノイズ低減処理前後の質量信号の変化量の、閾値の変化に対する2階導関数を閾値に対してプロットしたものである。
【発明を実施するための形態】
【0024】
以下、本発明の実施の形態について、フローチャートと図面とを参照しながら具体的に説明する。なお、以下の具体例は本発明にかかる最良の実施形態の一例ではあるが、本発明はかかる具体的形態に限定されるものではない。本発明は、xy平面内に組成分布を持つ試料の測定であり、xy平面の各点の位置情報及び、その各点の位置に対応する質量情報のスペクトルが得られれば、いかなる測定方法によって得た結果のノイズ低減処理にも適用可能である。なお、以下において、上記xy平面の各点の位置情報に対応する質量情報のスペクトルを、二次元質量スペクトルと記載する。
【0025】
なお、以下の実施形態においては、空間各点において質量信号を含まないバックグラウンド信号を取得し、このバックグラウンド信号をリファレンス信号としてノイズ低減処理の際の閾値を設定している。しかし、バックグラウンド信号は取得せずに、質量信号自体の分散値や標準偏差からこの閾値を設定してもよい。
【0026】
図14に示すのは、本発明におけるノイズ低減処理のフローチャートである。以下においては、このフローチャートの順に、図面を参照しながら説明する。
【0027】
図14の1においては、空間の各点において、TOF-SIMS法などにより質量スペクトルデータを測定する。次に、図14の2においては、測定したデータから、信号を測定した二次元平面上の位置情報及びその二次元平面上の各点の質量スペクトルからなる三次元データを生成する。
【0028】
図1(a)に示すのは、空間各点において測定した質量スペクトルから生成した三次元データの模式図である。この三次元空間の各点を(x、y、z)で表現すると、(x、y)は信号を測定した二次元平面(xy平面)に対応し、z軸はxy平面上の各点における質量スペクトルに対応している。従って、(x、y)には、信号を測定した平面座標値が格納されており、zにはm/zに対応する質量信号のカウント値が格納されていることになる。
【0029】
図1(b)に示すのは、空間各点において測定した質量信号がない場合のバックグラウンド信号から生成した三次元データの模式図である。三次元空間の各点を(x、y、z)で表現すると、(x、y)は信号を測定した二次元平面に対応し、z軸はバックグラウンドスペクトルに対応している。従って、(x、y)には、信号を測定した平面座標値が格納されており、zにはバックグラウンド(リファレンス)信号のカウント値が格納されていることになる。このリファレンス信号は、ノイズ低減の際の閾値設定に用いることができる。
【0030】
次に図14の3と4においては、前記生成した三次元データに対してWavelet順方向変換を適用する。
【0031】
Wavelet変換においては、信号f(t)と、時間的(もしくは空間的)に局在する構造を有する基底関数Ψ(t)との畳み込み積分を行う(式1)。基底関数Ψ(t)には、スケールパラメータと呼ばれるパラメータaと、シフトパラメータと呼ばれるパラメータbが含まれており、スケールパラメータは周波数に、シフトパラメータは時間(空間)方向の位置に対応する(式2)。Wavelet変換W(a,b)では、この基底関数と、信号との畳み込み積分を行うことにより、信号f(t)のスケール及びシフトに関する時間周波数解析を行い、信号f(t)の周波数及び位置に関する相関を評価する。
(式1)
【数1】
(式2)
【数2】
またWavelet変換は、上述した連続Wavelet変換の表現以外に離散的な表現も可能である。この離散的な表現形式を、離散Wavelet変換と呼んでいる。離散Wavelet変換においては、スケーリング数列pk とスケーリング係数skj-1との積和により、1つ上のレベル(解像度の低い)のスケーリング係数sj を求める(式3)。また、ウェーブレット数列qk とスケーリング係数skj-1との積和により、1つ上のレベルのウェーブレット係数wj を求める(式4)。この式3、4は二つのレベルj-1とjとでの、スケーリング係数とウェーブレット係数との関係を表すことから、ツースケール関係と呼ばれている。また、この様に複数のレベルのスケーリング関数とウェーブレット関数を用いた解析を、多重解像度解析という。
(式3)
【数3】
(式4)
【数4】
図2(a)は、前記生成した三次元の質量信号に対して、Wavelet解析を適用した例を示している。Wavelet解析を1回適用するごとに、データの各辺のサイズが1/2となるスケーリング係数データとそれ以外の部分であるウェーブレット係数データが生成される。三次元の場合、Wavelet解析を1回適用するごとに、処理対象となる信号が(1/2)3=1/8に減っていくので、高速に処理できる。
【0032】
図2(b)は、前記生成した三次元のリファレンス信号に対して、Wavelet解析を適用した例を示している。基本的な処理は質量信号の場合と同様である。
【0033】
図3は、前記生成した三次元の質量信号に対して、Wavelet解析を各x、y、z軸方向に適用した例を示している。
【0034】
図3(a)は、三次元の領域に格納された元信号を示している。
【0035】
図3(b)は、x方向変換(式5)により、1つ上のレベルのスケーリング係数とウェーブレット係数を求める様子を示している。
(式5)
【数5】
【0036】
図3(c)は、y方向変換(式6)をx方向変換の結果に適用することにより、1つ上のレベルのスケーリング係数とウェーブレット係数を求める様子を示している。
(式6)
【数6】
【0037】
図3(d)は、z方向変換(式7)をy方向変換の結果に適用することにより、1つ上のレベルのスケーリング係数とウェーブレット係数を求める様子を示している。
(式7)
【数7】
【0038】
なお、式中のp、qは基底関数固有の数列である。本発明においては、x、y軸方向とz軸方向とに同一の関数を用いてもよいが、それぞれに好適な異なる基底関数を適用することにより、より効率的にノイズ低減処理をすることができる。x、y軸方向とz軸方向とにそれぞれに異なる基底関数を適用するとき、x、y軸方向の質量スペクトルのピーク値の空間分布については、連続的な分布特性を有することから連続的な信号に適した基底関数(例えば、Haar、Daubechies等)を適用する。また、質量スペクトル方向(z軸方向)の質量スペクトルデータは、ピーク値を多数持つ様な離散的な分布特性を有するので、中心軸に対して対称かつ中心軸において最大値をとる
様な基底関数(例えば、Coiflet、Symlet、Spline等)を適用する。基底関数の満たすべき性質としてシフト直交性があり(式8)、「中心軸に対して対称かつ中心軸において最大値をとる」基底関数は必然的に「スパイク状のピーク分布を有する」基底関数となる
(式8)
【数8】
【0039】
次に図14の5においては、リファレンス信号から、ノイズ低減処理の際の閾値を決定し、ウェーブレット係数の絶対値がこの閾値以下の信号成分を0に設定する。なおこの閾値は、リファレンス信号によらず、質量信号自体の標準偏差等の値から設定してもよい。また、閾値を設定する方法は限定されることはなく、wavelet解析を用いたノイズ除去におけるあらゆる公知の方法で閾値を設定することができる。
【0040】
図5は、リファレンス信号を参照してノイズ低減処理の際の閾値を決定する処理を、模式的に示したものである。ノイズのウェーブレット係数はすべてのレベルに現れるため、(b)のリファレンス信号の各レベルにおけるウェーブレット係数の絶対値の大きさから、ノイズ低減処理の閾値を設定する。設定した閾値をもとに、(a)の信号成分のうちウェーブレット係数の絶対値が閾値以下のものを0に設定する。なお、ここで、信号成分を0に設定した部分を圧縮して保持しておくことも可能である。
【0041】
ノイズのウェーブレット係数の絶対値は質量信号のウェーブレット係数の絶対値よりも小さいことが知られているため、ノイズのウェーブレット係数の絶対値よりも大きく、かつ質量信号のウェーブレット係数の絶対値よりも小さい値を閾値とし、この閾値以下のウェーブレット係数を持つ信号成分を0にすることにより、効率的にノイズを除去することができる。
【0042】
なお、リファレンス信号からノイズ低減処理の際の閾値を決定してもよいが、リファレンス信号を用いずに、仮に設定した閾値を少しずつ変化させて、それぞれの閾値におけるノイズ低減の効果を評価することにより最適な閾値を決定してもよい。ノイズ低減の効果を評価する手法としては、例えば、ノイズ低減処理前後の信号の変化量を、前記した様な、信号の標準偏差の変化量から見積ればよい。閾値が、丁度リファレンス信号を除去する様な大きさの前後では、ノイズ低減処理の効果が大きく変化するため、ノイズ低減処理前後の信号の変化量は大きくなる。
【0043】
ノイズ低減処理前後の信号の変化量から、閾値の最適値を決定するためには、例えば、ノイズ低減処理前後の、閾値の変化に対する信号の変化量の2階導関数の符合変化に着目すればよい。閾値の最適値付近では、ノイズ低減処理前後の信号の変化量は大きくなるため、必然的にその2階導関数の符合の正負は逆転する。そのため、その符号変化をみて、閾値の最適値を決定することができる。
【0044】
次に図14の6、7においては、前記設定した、ウェーブレット係数の絶対値が閾値以下の信号成分を0にした信号に対して、各軸方向に順方向変換の場合とは逆順で同一の基底関数を適用し、逐次Wavelet逆変換を行うことにより、 三次元Wavelet逆変換を行う。
【0045】
図4は、前記三次元Wavelet順変換と逆変換において軸を処理する順番を逆順とし、さらにそれぞれの軸方向については順変換と逆変換とで同一の基底関数を用いることを示す模式図である。
【0046】
三次元Wavelet逆変換においては、基底関数と、Wavelet変換との畳み込み積分を行うことにより、元の信号を復元する(式9)。
(式9)
【数9】
【0047】
Wavelet逆変換は、順変換の場合と同様に離散的な表現も可能である。この場合、スケーリング数列pk とスケーリング関数列skjとの積和と、ウェーブレット数列qk とウェーブレット関数列wkjとの積和により、1つ下のレベル(解像度の高い)のスケーリング関数列sj-1 を求める。
(式10)
【数10】
【0048】
図6は、前記、ウェーブレット係数の絶対値が閾値以下の成分を0にした後に、Wavelet逆変換することにより、図6(a)に示すもとの質量信号のノイズが図6(b)で低減する様子を模式的に示している。
【0049】
なお、本発明は、上記の具体的形態を実行する装置によっても実現することができる。図15は、本発明を搭載した装置全体の構成を示している。1は試料を、2は信号の検出器を示している。また、3は取得した信号に対して上記の処理を行なう信号処理装置を、4は信号処理結果を画面に表示する画像表示装置を示している。
【0050】
また、本発明は、上記の具体的形態を実行するソフトウェア(コンピュータプログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理によっても実現されうる。
【実施例1】
【0051】
以下、本発明の実施例1について説明する。図7は、質量分析のターゲットとなる試料を示している。1は基板を、2はインクジェットで塗布した直径30μm程度のインスリン分布である。
【0052】
まず、x、y軸方向の質量スペクトルのピーク値の空間分布については、(a)の様に連続的な分布特性を有することから、Haar基底関数を適用してノイズ低減処理を行うことが好ましい。一方、z軸方向の質量スペクトルデータは、ピーク値を多数持つ、(b)の様な離散的な分布特性を有するので、Coiflet(N=2) 基底関数を適用してノイズ低減の処理を行うことが好ましい。なお、本実施例では、各信号成分の値の標準偏差から(式11)に従って閾値を求め、閾値以下のデータを0にすることによりノイズ低減処理を行った。(式11)において、Nは処理対象のデータの総数、σは、分散値の平方根で定義される標準偏差である。
(式11)
【数11】
【0053】
図8は、図7で示した様な系を模擬するサンプルデータの、x−z面を切り出したものである。(a)は元の信号分布を、(b)は元の信号にノイズを加えた信号分布を示している。
【0054】
図9は、図8(b)のx方向とz方向の信号分布を図示するものである。図9(a)は図8(b)の信号分布を、(a)‐xはx軸方向の信号分布を、(a)‐zはz軸方向の信号分布を示している。
【0055】
図10は、サンプルデータ(a)と、サンプルデータのx軸とz軸方向に、それぞれHaar基底関数を用いたWaveletノイズ低減処理を適用した結果を示している(b)。
【0056】
図11は、サンプルデータ(a)と、サンプルデータのx軸とz軸方向に、それぞれCoiflet基底関数を用いたWaveletノイズ低減処理を適用した結果を示している(b)。
【0057】
図12は、サンプルデータ(a)と、サンプルデータのx軸方向にはHaar基底関数を、z軸方向にはCoiflet基底関数を用いたWaveletノイズ低減処理を適用した結果を示している(b)。
【0058】
図13は図10〜図12のノイズ低減処理の結果の一部分を拡大したものであり、(a)が図10(b)の一部を、(b)が図11(b)の一部を、(c)が図12(b)の一部を拡大したものに対応している。それぞれの例においてノイズは低減されているものの、x方向とz方向とに同一の基底関数を用いた(a)と(b)においては輪郭部分の欠損やボケが発生していることがわかる。一方、x方向とz方向とのそれぞれに好適な異なる基底関数を用いた(c)においては、その様なことが生じておらず、各軸方向において好適な基底関数を逐次的に適用する本発明の効果を確認することができる。
【実施例2】
【0059】
以下、本発明の実施例2について説明する。本実施例においては、ION-TOF社製 TOF-SIMS5型装置(商品名)を用い、トリプシン消化処理を施したHER2タンパク質の発現レベル2+の組織切片(Pantomics社製)に対して、以下の条件でSIMS測定を行った。
一次イオン:25kV Bi+、0.6pA(パルス電流値)、マクロラスター・スキャンモード
一次イオンのパルス周波数:5kHz(200μs/shot)
一次イオンパルス幅:約0.8ns
一次イオンビーム直径:約0.8μm
測定範囲:4mm × 4mm
二次イオンの測定画素数:256×256
積算時間:1画素512shots, 1回スキャン(約150分)
二次イオンの検出モード:正イオン
【0060】
得られたSIMSデータには、測定画素ごとに位置を示すXY座標情報と、1shotにおける質量スペクトルが記録されている。例えば、測定画素ごとに、HER2タンパク質の消化断片の一つ(KYTMR)にナトリウム原子が1つ吸着した質量数に該当するピーク(KYTMR+Na:m/z720.35)の面積強度を足し合わせ、XY座標情報に合わせて描画することでHER2消化断片の分布図を得る事ができる。また、この消化断片の分布情報より、元のHER2タンパク質の分布を知ることも可能である。
【0061】
図16(a)に、HER2タンパク質の消化断片(KYTMR+Na)の質量数に相当するピークの分布図を示す。なお図16(a)において、中央部で黒く表示されている円状の領域は、信号強度が低くなっているが、これはトリプシン消化処理の際のハンドリングミスによるものである。また、図16(b)は、図16(a)のデータに対して(x、y)を信号を測定した二次元平面に対応させ、z軸を質量スペクトルに対応させて三次元Waveletノイズ低減処理を行った後のピークの分布図を示すものである。
【0062】
図17は、HER2タンパク質の発現レベル2+の組織切片(Pantomics社製)に対して、HER2タンパク質の免疫染色を行い、これを光学顕微鏡で観察したものである。図17では、HER2タンパク質の発現が多いところほど白く表示されている。また、SIMS測定に供した試料と免疫染色を行った試料は、同一病変組織(パラフィンブロック)から切出した隣接切片であり、同一ではない。
【0063】
図16と図17を比較すると、図16(b)では、図17で白く表示されている部分が図16(a)よりも強調されており、三次元Waveletノイズ低減処理によりノイズ信号が除去され、HER2タンパク質に対応する信号とバックグラウンドノイズのコントラスト比が向上することがわかる。
【0064】
図18(a)は、図16(a)のある一点における質量スペクトルを示している。また、図18(b)は、同じ点におけるノイズ低減処理後のスペクトルを示している。このノイズ低減処理の前後では、質量スペクトル中の各ピーク面積はほぼ不変であり、定量性が保たれていることがわかる。
【0065】
図19は、図18(a)(b)の一部を拡大して重ねて表示したものである(薄い線が図18(a)に示すノイズ低減処理前のスペクトルを、太く濃い線が図18(b)に示す同処理後のスペクトルをそれぞれ示している)。以上示した様に、(x、y)を信号を測定した二次元平面に対応させ、z軸を質量スペクトルに対応させた三次元データにおける三次元Waveletノイズ低減処理により、バックグラウンドノイズが好適に除去されるため、ノイズと質量信号のコントラスト比を向上させることができる。
【0066】
図20は、ノイズ低減処理前後の差分信号の標準偏差(すなわち除去された信号成分の大きさ)を、閾値(ここでの閾値は、信号自身の標準偏差で規格化されている)を変化させてプロットしたものである。図中の点線で囲んだ、閾値が0.14〜0,18の間で、ノイズ低減処理前後の差分信号の標準偏差は、大きく変化していることから、この値付近でノイズ低減の効果が大きいことがわかる。
【0067】
図21は、前記ノイズ低減処理前後の差分信号の標準偏差の、閾値の変化に対する2階導関数をプロットしたものである。ノイズ低減処理の効果が大きくなる前後で、当該2階導関数は、正(閾値0.12)から負(閾値 0.14)へと変化し、再び正(閾値 0.18)になっていることがわかる。本実施例においては、図中の点線で囲んだ、当該2階導関数が、正から負へと変化し、さらに正へと変化する際に、X軸と交わる点を、最適な閾値と設定した。かかる点は、複数存在するものの、当該2階導関数の正値と負値の積の絶対値が最大になる点を、最もノイズ低減処理が効果的になされる点であると考えれば、一意に決定することができる。
【産業上の利用可能性】
【0068】
本発明は、病理診断をより効果的に支援するツールとして利用することができる。
【技術分野】
【0001】
本発明は、質量分析スペクトルのデータ処理方法に関し、とりわけノイズ低減処理に関するものである。
【背景技術】
【0002】
ヒトゲノム(genome)配列の解読完了後、生命現象の実際の担い手であるタンパク質を解析するプロテオーム(proteome)解析が注目を集めている。タンパク質の直接解析が疾患の原因究明、創薬、テーラーメード医療の実現につながると考えられるからである。プロテオーム解析が注目される別の理由として、転写産物であるRNAの発現解析、すなわちトランスクリプトーム(transcriptome)解析ではタンパク質の発現を十分予測することができないことがわかってきたことや、翻訳後修飾されたタンパク質の修飾部位や立体構造をゲノム情報から得ることが難しいこと、なども挙げられる。
【0003】
プロテオーム解析の対象となるタンパク質の種類は細胞当たり数万種ある一方、それぞれの発現量は分子数にして一細胞当たり100から100万程度と見積もられている。対象タンパク質を発現している細胞は生体のうちの一部分であることも考えると、それぞれのタンパク質の生体内での発現量は極めて微量である。また、プロテオーム解析においてはゲノム解析で用いる増幅手法を使用することができないため、プロテオーム解析における検出系は事実上、高感度な質量分析に限られる。
【0004】
プロテオーム解析の手順は、
(1)二次元電気泳動や高速液体クロマトグラフィー(HPLC)による分離精製
(2)分離精製したタンパク質のトリプシン消化(trypsin digestion or tryptic digestion)
(3)ペプチド断片混合物の質量分析
(4)タンパク質データベースとの照合によるタンパク質の同定
が一般的である。この手法はペプチドマスフィンガープリンティング法( PMF法:peptide mass fingerprinting method)と呼ばれている。PMF法の質量分析では、イオン化手法、質量分析計としてそれぞれMALDI、TOF型質量分析計を用いるのが一般的である。
【0005】
上記の他に、イオン化手法、質量分析計としてそれぞれESI、イオントラップ型質量分析計を用い、各ペプチドについてMS/MS測定を行った後、得られるプロダクトイオンリストを用いて検索を行う方法もある。この検索にはMatrix Science社製のプロテオーム解析用検索エンジンMASCOT(R)などが使用される。この方法は通常のPMF法に比べ情報量が多く複雑となるが、連続したアミノ酸列の帰属まで確認できるため、通常のPMF法より精度の高いタンパク質同定が可能となる。
【0006】
この他、最近注目される関連技術として、フーリエ変換型の質量分析計を用いた超精密質量分析によるタンパク質やペプチド断片の同定法、ペプチドのMS/MSスペクトルを用い、De novo sequencingと呼ばれる数学的演算処理でアミノ酸配列を算出する方法、生体組織切片における注目細胞(数千個)を、laser microdissection法を用いて切り出す前処理方法、ペプチド断片混合物に含まれる特定ペプチドの定量を目的としたselected reaction monitoring法(SRM法)やmultiple reaction monitoring法(MRM法)と呼ばれる質量分析手法、などが挙げられる。
【0007】
一方、病理検査等において、組織における特異抗原の可視化が求められる。これまでのところ、病理検査においては、免疫染色法(免染)を用いて特異抗原タンパク質を染色する手法が主に用いられている。乳がんを例に挙げれば、ホルモン療法の判断基準となる ER(ホルモン依存性腫瘍に発現するエストロゲンレセプター) や、ハーセプチン投与の判断基準となる HER2 (進行の速い悪性がんに見られる膜タンパク質)が免染により可視化される。しかしながら免染には、抗体の持つ不安定性や、抗原抗体反応効率の制御の難しさに起因する再現性不良の問題がある。また今後、この機能診断のニーズが高まった場合、例えば数100種以上のタンパク質を同時に検出する必要が生じた場合、現在の免染では対応できなくなるという問題がある。
【0008】
また、さらには、特異抗原の可視化は細胞レベルで求められる場合がある。たとえば、がん幹細胞に関する研究においては、腫瘍組織の一部の分画のみが免疫不全マウスへの異種移植後に腫瘍を形成することが明らかになったことから、腫瘍組織の成長が腫瘍幹細胞の分化や自己再生の能力に依存していると理解されつつある。このような研究においては、組織全体ではなく、組織中における個々の細胞において、特異抗原の発現分布を観察することが必要となる。
【0009】
以上の様に、腫瘍組織などに発現しているタンパク質を、細胞レベルで網羅的に可視化することが求められるが、そのような解析方法として、飛行時間型二次イオン質量分析法(TOF-SIMS法)をはじめとする二次イオン質量分析法(SIMS法)による測定が候補になっている。SIMS法による測定では、質量分析情報を二次元で、しかも高い空間分解能で得ることができる。また、このとき、質量スペクトルの各ピーク値分布の同定を容易にし、結果として質量スペクトルの空間分布に対応するタンパク質の同定を従来よりも確実かつ短時間で行うため、全体のデータを三次元データ(xy平面に位置情報を、z軸方向に各位置に対応するスペクトル情報を格納する)とみなしてデータ処理することもある。
【0010】
SIMS法は、試料に一次イオンビームを照射し、試料から分離された二次イオンを検出することにより、空間各点の質量スペクトルを得る方法である。例えば、TOF-SIMS法においては、二次イオンの飛行時間が、イオンの質量Mと電荷に依存していることを利用して、空間各点の質量スペクトルを得ることができる。但し、イオンの検出は離散的な過程であり、検出数が多くない場合には、ノイズの影響を無視することができない。そのため、各種手法を適用したノイズ低減処理が行われている。
【0011】
ノイズ低減手法にも各種あるが、特許文献1においては、Wavelet解析を用いて、二枚以上の二次元画像を解析し、両者の相関を考えることによって効果的にノイズ低減を行う手法が提案されている。また、非特許文献1においては、SIMS image に対して二次元のWavelet解析を用い、確率過程(ガウス or ポアソン過程)を考慮したノイズ低減手法が提案されている。
【0012】
なお、上記の「細胞レベル」とは、少なくとも一つ一つの細胞を識別できるレベルを意味する。細胞の径は、神経細胞などの大きなものは約50μmであるものの、概ね10μmから20μmの範囲にある。したがって、細胞レベルの二次元分布像を取得するには空間分解能が10μm以下であることが必要であり、好ましくは5μm以下、さらに好ましくは2μm以下、より好ましくは1μm以下である。空間分解能は、例えばナイフエッジの試料の線分析結果から決定することができる。なお空間分解能は「該試料の境界の両側において、片側に配置した物質に起因する信号強度がそれぞれ20%、80%となる二点間の距離」という一般的な定義に基づき決定される。
【先行技術文献】
【特許文献】
【0013】
【特許文献1】特開2007−209755:画像化方法におけるノイズリダクション方法、メモリ媒体および断層撮影システム
【非特許文献】
【0014】
【非特許文献1】Chemometrics and Intelligent Laboratory Systems 34(1996)263-273:De-noising of SIMS images via wavelet shrinkage
【発明の概要】
【発明が解決しようとする課題】
【0015】
従来、Wavelet解析を適用したノイズ低減処理においては、一次元の時系列もしくは、二次元の平面内のデータに対する処理が行われていた。
【0016】
一方で、例えば細胞レベルでSIMSにより質量分析を行う場合には、空間の各点の位置情報及び、その各点の位置に対応する質量スペクトルの情報が得られることになる。そのため、SIMSにより得られたデータに対して二次元のWavelet解析を適用したノイズ低減処理をするには、連続的な特性を持つ位置情報と離散的な特性を持つ質量スペクトルとの双方について、それぞれWavelet解析をする必要がある。これらのデータを三次元データ(xy平面に位置情報を、z軸方向にスペクトル情報を格納する)とみなして一括してデータを処理することは従来から行われていたが、この三次元データに直接的にWavelet解析を適用してのノイズ低減処理は行われていなかった。
【0017】
また、従来は、SIMS法により得られた二次元の平面内データに対してWavelet解析を適用したノイズ低減処理を適用する場合でも、各軸方向に対して、同じ基底関数を適用した処理が行われていた。
【0018】
しかしながら、空間各点における質量スペクトルはピーク値を多数持つ様な離散的な分布を示すのに対して、そのピーク値の空間分布(トータルでは、例えばインスリン等の空間分布に対応する)は、ある程度連続的な分布になることが想定される。従って、このデータに対してWavelet解析を適用したノイズ低減処理を行う際に、各方向に同じ基底関数を適用する処理を行うことは通常望ましくない。
【0019】
そこで本発明においては、上記三次元データに直接的にWavelet解析を適用してノイズ低減処理を行う方法を提供することを目的とする。また、本発明は、スペクトル方向とピーク値分布方向(平面内方向)とに対し、それぞれに好適な基底関数を適用することにより、より効果的なノイズ低減方法を提供することをさらなる目的とする。
【課題を解決するための手段】
【0020】
上記課題に鑑み、本発明に係る二次元質量スペクトルのノイズ低減処理方法は、xy平面内に組成分布を持つ試料について、xy平面上の各点の質量スペクトルを測定することにより得られる、二次元質量スペクトルのノイズ低減処理方法において、xy平面の各点のz軸方向に質量スペクトルデータを格納して三次元データを生成した上で、三次元のWavelet解析を適用しノイズ低減処理を行なうことを特徴とする。
【0021】
また、本発明に係る質量分析装置は、xy平面内に組成分布を持つ試料について、xy平面上の各点の質量スペクトルを測定することにより得られる、二次元質量スペクトルのノイズ低減処理方法において、xy平面の各点のz軸方向に質量スペクトルデータを格納して三次元データを生成した上で、三次元のWavelet解析を適用しノイズ低減処理を行なうことを特徴とする。
【発明の効果】
【0022】
本発明によれば、空間分布を有する質量スペクトルにおいて、質量スペクトルの離散的なデータ特性と、質量スペクトルの連続的な空間分布を加味した上で、両者を同時かつ高速にノイズ低減処理を行うことが可能になる。それによって、質量スペクトルの各ピーク値分布の同定が容易になり、結果として質量スペクトルの空間分布に対応するタンパク質の同定が従来よりも確実かつ短時間で行える様になる。
【図面の簡単な説明】
【0023】
【図1】測定した質量スペクトル信号とリファレンス信号から生成した三次元信号の模式図である。
【図2】三次元のWavelet解析における多重解像度解析の処理を示す模式図である。
【図3】三次元のWavelet解析において、各方向に適用する処理を示す模式図である。
【図4】三次元のWavelet解析において、各方向に適用する処理の順序を示す模式図である。
【図5】リファレンス信号に対して、Wavelet解析を適用して取得した各スケールの成分値から、ノイズ低減の際の閾値を決定することを示す模式図である。
【図6】設定したウェーブレット係数の絶対値が閾値以下の成分を0にし、Wavelet逆変換を行ってノイズが除去された質量信号を生成することを示す模式図である。
【図7】質量分析の対象となる試料及びその試料に対して質量分析を行うことにより得られるデータを示す模式図である。
【図8】空間分布を有する質量スペクトルを模擬するサンプルデータである。
【図9】サンプルデータのx軸方向とz軸方向の分布を示す図である。
【図10】サンプルデータのx軸方向とz軸方向に対して、Haar基底関数を用いたノイズ低減処理を行った結果である。
【図11】サンプルデータのx軸方向とz軸方向に対して、Coiflet基底関数を用いたノイズ低減処理を行った結果である。
【図12】サンプルデータのx軸方向にはHaar基底関数を、z軸方向にはCoiflet基底関数を用いたノイズ低減処理を行った結果である。
【図13】図10〜12の結果の一部分を拡大したものである。
【図14】本発明のフローチャートである。
【図15】本発明を搭載した質量分析装置の模式図である。
【図16】三次元Wavelet処理前後のHER2断片に対応する質量スペクトル分布である。
【図17】HER2タンパク質の免疫染色を実施し、染色強度を白色で示した光学顕微鏡像である。
【図18】ノイズ低減処理前後の、ある一点における質量スペクトル分布である。
【図19】バックグラウンドノイズの低減処理の効果を示したものである。
【図20】ノイズ低減処理前後の質量信号の変化量を閾値に対してプロットしたものである。
【図21】ノイズ低減処理前後の質量信号の変化量の、閾値の変化に対する2階導関数を閾値に対してプロットしたものである。
【発明を実施するための形態】
【0024】
以下、本発明の実施の形態について、フローチャートと図面とを参照しながら具体的に説明する。なお、以下の具体例は本発明にかかる最良の実施形態の一例ではあるが、本発明はかかる具体的形態に限定されるものではない。本発明は、xy平面内に組成分布を持つ試料の測定であり、xy平面の各点の位置情報及び、その各点の位置に対応する質量情報のスペクトルが得られれば、いかなる測定方法によって得た結果のノイズ低減処理にも適用可能である。なお、以下において、上記xy平面の各点の位置情報に対応する質量情報のスペクトルを、二次元質量スペクトルと記載する。
【0025】
なお、以下の実施形態においては、空間各点において質量信号を含まないバックグラウンド信号を取得し、このバックグラウンド信号をリファレンス信号としてノイズ低減処理の際の閾値を設定している。しかし、バックグラウンド信号は取得せずに、質量信号自体の分散値や標準偏差からこの閾値を設定してもよい。
【0026】
図14に示すのは、本発明におけるノイズ低減処理のフローチャートである。以下においては、このフローチャートの順に、図面を参照しながら説明する。
【0027】
図14の1においては、空間の各点において、TOF-SIMS法などにより質量スペクトルデータを測定する。次に、図14の2においては、測定したデータから、信号を測定した二次元平面上の位置情報及びその二次元平面上の各点の質量スペクトルからなる三次元データを生成する。
【0028】
図1(a)に示すのは、空間各点において測定した質量スペクトルから生成した三次元データの模式図である。この三次元空間の各点を(x、y、z)で表現すると、(x、y)は信号を測定した二次元平面(xy平面)に対応し、z軸はxy平面上の各点における質量スペクトルに対応している。従って、(x、y)には、信号を測定した平面座標値が格納されており、zにはm/zに対応する質量信号のカウント値が格納されていることになる。
【0029】
図1(b)に示すのは、空間各点において測定した質量信号がない場合のバックグラウンド信号から生成した三次元データの模式図である。三次元空間の各点を(x、y、z)で表現すると、(x、y)は信号を測定した二次元平面に対応し、z軸はバックグラウンドスペクトルに対応している。従って、(x、y)には、信号を測定した平面座標値が格納されており、zにはバックグラウンド(リファレンス)信号のカウント値が格納されていることになる。このリファレンス信号は、ノイズ低減の際の閾値設定に用いることができる。
【0030】
次に図14の3と4においては、前記生成した三次元データに対してWavelet順方向変換を適用する。
【0031】
Wavelet変換においては、信号f(t)と、時間的(もしくは空間的)に局在する構造を有する基底関数Ψ(t)との畳み込み積分を行う(式1)。基底関数Ψ(t)には、スケールパラメータと呼ばれるパラメータaと、シフトパラメータと呼ばれるパラメータbが含まれており、スケールパラメータは周波数に、シフトパラメータは時間(空間)方向の位置に対応する(式2)。Wavelet変換W(a,b)では、この基底関数と、信号との畳み込み積分を行うことにより、信号f(t)のスケール及びシフトに関する時間周波数解析を行い、信号f(t)の周波数及び位置に関する相関を評価する。
(式1)
【数1】
(式2)
【数2】
またWavelet変換は、上述した連続Wavelet変換の表現以外に離散的な表現も可能である。この離散的な表現形式を、離散Wavelet変換と呼んでいる。離散Wavelet変換においては、スケーリング数列pk とスケーリング係数skj-1との積和により、1つ上のレベル(解像度の低い)のスケーリング係数sj を求める(式3)。また、ウェーブレット数列qk とスケーリング係数skj-1との積和により、1つ上のレベルのウェーブレット係数wj を求める(式4)。この式3、4は二つのレベルj-1とjとでの、スケーリング係数とウェーブレット係数との関係を表すことから、ツースケール関係と呼ばれている。また、この様に複数のレベルのスケーリング関数とウェーブレット関数を用いた解析を、多重解像度解析という。
(式3)
【数3】
(式4)
【数4】
図2(a)は、前記生成した三次元の質量信号に対して、Wavelet解析を適用した例を示している。Wavelet解析を1回適用するごとに、データの各辺のサイズが1/2となるスケーリング係数データとそれ以外の部分であるウェーブレット係数データが生成される。三次元の場合、Wavelet解析を1回適用するごとに、処理対象となる信号が(1/2)3=1/8に減っていくので、高速に処理できる。
【0032】
図2(b)は、前記生成した三次元のリファレンス信号に対して、Wavelet解析を適用した例を示している。基本的な処理は質量信号の場合と同様である。
【0033】
図3は、前記生成した三次元の質量信号に対して、Wavelet解析を各x、y、z軸方向に適用した例を示している。
【0034】
図3(a)は、三次元の領域に格納された元信号を示している。
【0035】
図3(b)は、x方向変換(式5)により、1つ上のレベルのスケーリング係数とウェーブレット係数を求める様子を示している。
(式5)
【数5】
【0036】
図3(c)は、y方向変換(式6)をx方向変換の結果に適用することにより、1つ上のレベルのスケーリング係数とウェーブレット係数を求める様子を示している。
(式6)
【数6】
【0037】
図3(d)は、z方向変換(式7)をy方向変換の結果に適用することにより、1つ上のレベルのスケーリング係数とウェーブレット係数を求める様子を示している。
(式7)
【数7】
【0038】
なお、式中のp、qは基底関数固有の数列である。本発明においては、x、y軸方向とz軸方向とに同一の関数を用いてもよいが、それぞれに好適な異なる基底関数を適用することにより、より効率的にノイズ低減処理をすることができる。x、y軸方向とz軸方向とにそれぞれに異なる基底関数を適用するとき、x、y軸方向の質量スペクトルのピーク値の空間分布については、連続的な分布特性を有することから連続的な信号に適した基底関数(例えば、Haar、Daubechies等)を適用する。また、質量スペクトル方向(z軸方向)の質量スペクトルデータは、ピーク値を多数持つ様な離散的な分布特性を有するので、中心軸に対して対称かつ中心軸において最大値をとる
様な基底関数(例えば、Coiflet、Symlet、Spline等)を適用する。基底関数の満たすべき性質としてシフト直交性があり(式8)、「中心軸に対して対称かつ中心軸において最大値をとる」基底関数は必然的に「スパイク状のピーク分布を有する」基底関数となる
(式8)
【数8】
【0039】
次に図14の5においては、リファレンス信号から、ノイズ低減処理の際の閾値を決定し、ウェーブレット係数の絶対値がこの閾値以下の信号成分を0に設定する。なおこの閾値は、リファレンス信号によらず、質量信号自体の標準偏差等の値から設定してもよい。また、閾値を設定する方法は限定されることはなく、wavelet解析を用いたノイズ除去におけるあらゆる公知の方法で閾値を設定することができる。
【0040】
図5は、リファレンス信号を参照してノイズ低減処理の際の閾値を決定する処理を、模式的に示したものである。ノイズのウェーブレット係数はすべてのレベルに現れるため、(b)のリファレンス信号の各レベルにおけるウェーブレット係数の絶対値の大きさから、ノイズ低減処理の閾値を設定する。設定した閾値をもとに、(a)の信号成分のうちウェーブレット係数の絶対値が閾値以下のものを0に設定する。なお、ここで、信号成分を0に設定した部分を圧縮して保持しておくことも可能である。
【0041】
ノイズのウェーブレット係数の絶対値は質量信号のウェーブレット係数の絶対値よりも小さいことが知られているため、ノイズのウェーブレット係数の絶対値よりも大きく、かつ質量信号のウェーブレット係数の絶対値よりも小さい値を閾値とし、この閾値以下のウェーブレット係数を持つ信号成分を0にすることにより、効率的にノイズを除去することができる。
【0042】
なお、リファレンス信号からノイズ低減処理の際の閾値を決定してもよいが、リファレンス信号を用いずに、仮に設定した閾値を少しずつ変化させて、それぞれの閾値におけるノイズ低減の効果を評価することにより最適な閾値を決定してもよい。ノイズ低減の効果を評価する手法としては、例えば、ノイズ低減処理前後の信号の変化量を、前記した様な、信号の標準偏差の変化量から見積ればよい。閾値が、丁度リファレンス信号を除去する様な大きさの前後では、ノイズ低減処理の効果が大きく変化するため、ノイズ低減処理前後の信号の変化量は大きくなる。
【0043】
ノイズ低減処理前後の信号の変化量から、閾値の最適値を決定するためには、例えば、ノイズ低減処理前後の、閾値の変化に対する信号の変化量の2階導関数の符合変化に着目すればよい。閾値の最適値付近では、ノイズ低減処理前後の信号の変化量は大きくなるため、必然的にその2階導関数の符合の正負は逆転する。そのため、その符号変化をみて、閾値の最適値を決定することができる。
【0044】
次に図14の6、7においては、前記設定した、ウェーブレット係数の絶対値が閾値以下の信号成分を0にした信号に対して、各軸方向に順方向変換の場合とは逆順で同一の基底関数を適用し、逐次Wavelet逆変換を行うことにより、 三次元Wavelet逆変換を行う。
【0045】
図4は、前記三次元Wavelet順変換と逆変換において軸を処理する順番を逆順とし、さらにそれぞれの軸方向については順変換と逆変換とで同一の基底関数を用いることを示す模式図である。
【0046】
三次元Wavelet逆変換においては、基底関数と、Wavelet変換との畳み込み積分を行うことにより、元の信号を復元する(式9)。
(式9)
【数9】
【0047】
Wavelet逆変換は、順変換の場合と同様に離散的な表現も可能である。この場合、スケーリング数列pk とスケーリング関数列skjとの積和と、ウェーブレット数列qk とウェーブレット関数列wkjとの積和により、1つ下のレベル(解像度の高い)のスケーリング関数列sj-1 を求める。
(式10)
【数10】
【0048】
図6は、前記、ウェーブレット係数の絶対値が閾値以下の成分を0にした後に、Wavelet逆変換することにより、図6(a)に示すもとの質量信号のノイズが図6(b)で低減する様子を模式的に示している。
【0049】
なお、本発明は、上記の具体的形態を実行する装置によっても実現することができる。図15は、本発明を搭載した装置全体の構成を示している。1は試料を、2は信号の検出器を示している。また、3は取得した信号に対して上記の処理を行なう信号処理装置を、4は信号処理結果を画面に表示する画像表示装置を示している。
【0050】
また、本発明は、上記の具体的形態を実行するソフトウェア(コンピュータプログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理によっても実現されうる。
【実施例1】
【0051】
以下、本発明の実施例1について説明する。図7は、質量分析のターゲットとなる試料を示している。1は基板を、2はインクジェットで塗布した直径30μm程度のインスリン分布である。
【0052】
まず、x、y軸方向の質量スペクトルのピーク値の空間分布については、(a)の様に連続的な分布特性を有することから、Haar基底関数を適用してノイズ低減処理を行うことが好ましい。一方、z軸方向の質量スペクトルデータは、ピーク値を多数持つ、(b)の様な離散的な分布特性を有するので、Coiflet(N=2) 基底関数を適用してノイズ低減の処理を行うことが好ましい。なお、本実施例では、各信号成分の値の標準偏差から(式11)に従って閾値を求め、閾値以下のデータを0にすることによりノイズ低減処理を行った。(式11)において、Nは処理対象のデータの総数、σは、分散値の平方根で定義される標準偏差である。
(式11)
【数11】
【0053】
図8は、図7で示した様な系を模擬するサンプルデータの、x−z面を切り出したものである。(a)は元の信号分布を、(b)は元の信号にノイズを加えた信号分布を示している。
【0054】
図9は、図8(b)のx方向とz方向の信号分布を図示するものである。図9(a)は図8(b)の信号分布を、(a)‐xはx軸方向の信号分布を、(a)‐zはz軸方向の信号分布を示している。
【0055】
図10は、サンプルデータ(a)と、サンプルデータのx軸とz軸方向に、それぞれHaar基底関数を用いたWaveletノイズ低減処理を適用した結果を示している(b)。
【0056】
図11は、サンプルデータ(a)と、サンプルデータのx軸とz軸方向に、それぞれCoiflet基底関数を用いたWaveletノイズ低減処理を適用した結果を示している(b)。
【0057】
図12は、サンプルデータ(a)と、サンプルデータのx軸方向にはHaar基底関数を、z軸方向にはCoiflet基底関数を用いたWaveletノイズ低減処理を適用した結果を示している(b)。
【0058】
図13は図10〜図12のノイズ低減処理の結果の一部分を拡大したものであり、(a)が図10(b)の一部を、(b)が図11(b)の一部を、(c)が図12(b)の一部を拡大したものに対応している。それぞれの例においてノイズは低減されているものの、x方向とz方向とに同一の基底関数を用いた(a)と(b)においては輪郭部分の欠損やボケが発生していることがわかる。一方、x方向とz方向とのそれぞれに好適な異なる基底関数を用いた(c)においては、その様なことが生じておらず、各軸方向において好適な基底関数を逐次的に適用する本発明の効果を確認することができる。
【実施例2】
【0059】
以下、本発明の実施例2について説明する。本実施例においては、ION-TOF社製 TOF-SIMS5型装置(商品名)を用い、トリプシン消化処理を施したHER2タンパク質の発現レベル2+の組織切片(Pantomics社製)に対して、以下の条件でSIMS測定を行った。
一次イオン:25kV Bi+、0.6pA(パルス電流値)、マクロラスター・スキャンモード
一次イオンのパルス周波数:5kHz(200μs/shot)
一次イオンパルス幅:約0.8ns
一次イオンビーム直径:約0.8μm
測定範囲:4mm × 4mm
二次イオンの測定画素数:256×256
積算時間:1画素512shots, 1回スキャン(約150分)
二次イオンの検出モード:正イオン
【0060】
得られたSIMSデータには、測定画素ごとに位置を示すXY座標情報と、1shotにおける質量スペクトルが記録されている。例えば、測定画素ごとに、HER2タンパク質の消化断片の一つ(KYTMR)にナトリウム原子が1つ吸着した質量数に該当するピーク(KYTMR+Na:m/z720.35)の面積強度を足し合わせ、XY座標情報に合わせて描画することでHER2消化断片の分布図を得る事ができる。また、この消化断片の分布情報より、元のHER2タンパク質の分布を知ることも可能である。
【0061】
図16(a)に、HER2タンパク質の消化断片(KYTMR+Na)の質量数に相当するピークの分布図を示す。なお図16(a)において、中央部で黒く表示されている円状の領域は、信号強度が低くなっているが、これはトリプシン消化処理の際のハンドリングミスによるものである。また、図16(b)は、図16(a)のデータに対して(x、y)を信号を測定した二次元平面に対応させ、z軸を質量スペクトルに対応させて三次元Waveletノイズ低減処理を行った後のピークの分布図を示すものである。
【0062】
図17は、HER2タンパク質の発現レベル2+の組織切片(Pantomics社製)に対して、HER2タンパク質の免疫染色を行い、これを光学顕微鏡で観察したものである。図17では、HER2タンパク質の発現が多いところほど白く表示されている。また、SIMS測定に供した試料と免疫染色を行った試料は、同一病変組織(パラフィンブロック)から切出した隣接切片であり、同一ではない。
【0063】
図16と図17を比較すると、図16(b)では、図17で白く表示されている部分が図16(a)よりも強調されており、三次元Waveletノイズ低減処理によりノイズ信号が除去され、HER2タンパク質に対応する信号とバックグラウンドノイズのコントラスト比が向上することがわかる。
【0064】
図18(a)は、図16(a)のある一点における質量スペクトルを示している。また、図18(b)は、同じ点におけるノイズ低減処理後のスペクトルを示している。このノイズ低減処理の前後では、質量スペクトル中の各ピーク面積はほぼ不変であり、定量性が保たれていることがわかる。
【0065】
図19は、図18(a)(b)の一部を拡大して重ねて表示したものである(薄い線が図18(a)に示すノイズ低減処理前のスペクトルを、太く濃い線が図18(b)に示す同処理後のスペクトルをそれぞれ示している)。以上示した様に、(x、y)を信号を測定した二次元平面に対応させ、z軸を質量スペクトルに対応させた三次元データにおける三次元Waveletノイズ低減処理により、バックグラウンドノイズが好適に除去されるため、ノイズと質量信号のコントラスト比を向上させることができる。
【0066】
図20は、ノイズ低減処理前後の差分信号の標準偏差(すなわち除去された信号成分の大きさ)を、閾値(ここでの閾値は、信号自身の標準偏差で規格化されている)を変化させてプロットしたものである。図中の点線で囲んだ、閾値が0.14〜0,18の間で、ノイズ低減処理前後の差分信号の標準偏差は、大きく変化していることから、この値付近でノイズ低減の効果が大きいことがわかる。
【0067】
図21は、前記ノイズ低減処理前後の差分信号の標準偏差の、閾値の変化に対する2階導関数をプロットしたものである。ノイズ低減処理の効果が大きくなる前後で、当該2階導関数は、正(閾値0.12)から負(閾値 0.14)へと変化し、再び正(閾値 0.18)になっていることがわかる。本実施例においては、図中の点線で囲んだ、当該2階導関数が、正から負へと変化し、さらに正へと変化する際に、X軸と交わる点を、最適な閾値と設定した。かかる点は、複数存在するものの、当該2階導関数の正値と負値の積の絶対値が最大になる点を、最もノイズ低減処理が効果的になされる点であると考えれば、一意に決定することができる。
【産業上の利用可能性】
【0068】
本発明は、病理診断をより効果的に支援するツールとして利用することができる。
【特許請求の範囲】
【請求項1】
xy平面内に組成分布を持つ試料について、xy平面上の各点の質量スペクトルを測定することにより得られる、二次元質量スペクトルのノイズ低減処理方法において、xy平面の各点のz軸方向にその点における質量スペクトルデータを格納して三次元データを生成した上で、三次元のWavelet解析を適用しノイズ低減処理を行なうことを特徴とする二次元質量スペクトルのノイズ低減処理方法。
【請求項2】
前記Wavelet解析が、
x、y軸方向とz軸方向とで異なる基底関数を適用してそれぞれの軸方向に三次元Wavelet順変換を行う工程と、
前記Wavelet順変換を行った後に、ウェーブレット係数の絶対値が閾値以下の信号を除去する工程と、
前記閾値以下の信号を除去した後に、順方向変換の場合とは適用する軸の順番を逆順にし、かつ各軸方向には順変換と同一の基底関数を適用して、三次元Wavelet逆変換を行う工程とを含むことにより、
ノイズの低減された信号を得ることを特徴とする請求項1に記載の二次元質量スペクトルのノイズ低減処理方法。
【請求項3】
前記Wavelet解析において、少なくとも信号のz軸方向には「中心軸に対して対称かつ中心軸において最大値をとる」基底関数を適用することを特徴とする請求項1又は2に記載の二次元質量スペクトルのノイズ低減処理方法。
【請求項4】
前記ノイズ低減処理方法において、質量信号を含まないリファレンス信号を取得し、該リファレンス信号の各レベルにおけるウェーブレット係数の絶対値の大きさから、ノイズ低減の際の閾値を決定することを特徴とする請求項1〜3のいずれか1項に記載の二次元質量スペクトルのノイズ低減処理方法。
【請求項5】
前記ノイズ低減処理方法において、複数の閾値を仮に設定し、設定した仮の閾値のそれぞれにおけるノイズ低減処理の前後での質量信号の変化量から、ノイズ低減の際の閾値を決定することを特徴とする請求項1〜3のいずれか1項に記載の二次元質量スペクトルのノイズ低減処理方法。
【請求項6】
前記ノイズ低減処理方法において、ノイズ低減処理の前後での質量信号の変化量の、閾値の変化に対する2階導関数を用いて、その符号変化から閾値の値を決定することを特徴とする請求項5に記載の二次元質量スペクトルのノイズ低減処理方法。
【請求項7】
xy平面内に組成分布を持つ試料について、xy平面上の各点の質量スペクトルを測定することにより得られる二次元質量スペクトルのノイズ低減処理装置において、xy平面の各点のz軸方向に質量スペクトルデータを格納して三次元データを生成した上で、三次元のWavelet解析を適用しノイズ低減処理を行なうことを特徴とする質量分析装置。
【請求項8】
前記Wavelet解析において、
x、y軸方向とz軸方向とで異なる基底関数を適用してそれぞれの軸方向に三次元Wavelet順変換を行う工程と、
前記Wavelet順変換を行った後に、ウェーブレット係数の絶対値が閾値以下の信号を除去する工程と、
前記閾値以下の信号を除去した後に、順方向変換の場合とは適用する軸の順番を逆順にし、かつ各軸方向には順変換と同一の基底関数を適用して、三次元Wavelet逆変換を行う工程とを行うことにより、
ノイズの低減された信号を得ることを特徴とする請求項7に記載の質量分析装置。
【請求項9】
前記Wavelet解析において、少なくとも信号のz軸方向には「中心軸に対して対称かつ中心軸において最大値をとる」基底関数を適用することを特徴とする請求項7又は8に記載の質量分析装置
【請求項10】
前記Wavelet解析において、質量信号を含まないリファレンス信号から、ノイズ低減の際の閾値を決定することを特徴とする請求項7〜9のいずれか1項に記載の質量分析装置
【請求項11】
前記Wavelet解析において、複数の閾値を仮に設定し、設定した仮の閾値のそれぞれによるノイズ低減処理の前後での質量信号の変化量から、ノイズ低減の際の閾値を決定することを特徴とする請求項7〜9のいずれか1項に記載の質量分析装置。
【請求項12】
前記Wavelet解析において、ノイズ低減処理の前後での質量信号の変化量の、閾値の変化に対する2階導関数を用いて、その符号変化から閾値の値を決定することを特徴とする請求項11に記載の質量分析装置。
【請求項13】
請求項1〜6のいずれか1項に記載の二次元質量スペクトルのノイズ低減処理方法をコンピュータで実行するためのコンピュータプログラム。
【請求項1】
xy平面内に組成分布を持つ試料について、xy平面上の各点の質量スペクトルを測定することにより得られる、二次元質量スペクトルのノイズ低減処理方法において、xy平面の各点のz軸方向にその点における質量スペクトルデータを格納して三次元データを生成した上で、三次元のWavelet解析を適用しノイズ低減処理を行なうことを特徴とする二次元質量スペクトルのノイズ低減処理方法。
【請求項2】
前記Wavelet解析が、
x、y軸方向とz軸方向とで異なる基底関数を適用してそれぞれの軸方向に三次元Wavelet順変換を行う工程と、
前記Wavelet順変換を行った後に、ウェーブレット係数の絶対値が閾値以下の信号を除去する工程と、
前記閾値以下の信号を除去した後に、順方向変換の場合とは適用する軸の順番を逆順にし、かつ各軸方向には順変換と同一の基底関数を適用して、三次元Wavelet逆変換を行う工程とを含むことにより、
ノイズの低減された信号を得ることを特徴とする請求項1に記載の二次元質量スペクトルのノイズ低減処理方法。
【請求項3】
前記Wavelet解析において、少なくとも信号のz軸方向には「中心軸に対して対称かつ中心軸において最大値をとる」基底関数を適用することを特徴とする請求項1又は2に記載の二次元質量スペクトルのノイズ低減処理方法。
【請求項4】
前記ノイズ低減処理方法において、質量信号を含まないリファレンス信号を取得し、該リファレンス信号の各レベルにおけるウェーブレット係数の絶対値の大きさから、ノイズ低減の際の閾値を決定することを特徴とする請求項1〜3のいずれか1項に記載の二次元質量スペクトルのノイズ低減処理方法。
【請求項5】
前記ノイズ低減処理方法において、複数の閾値を仮に設定し、設定した仮の閾値のそれぞれにおけるノイズ低減処理の前後での質量信号の変化量から、ノイズ低減の際の閾値を決定することを特徴とする請求項1〜3のいずれか1項に記載の二次元質量スペクトルのノイズ低減処理方法。
【請求項6】
前記ノイズ低減処理方法において、ノイズ低減処理の前後での質量信号の変化量の、閾値の変化に対する2階導関数を用いて、その符号変化から閾値の値を決定することを特徴とする請求項5に記載の二次元質量スペクトルのノイズ低減処理方法。
【請求項7】
xy平面内に組成分布を持つ試料について、xy平面上の各点の質量スペクトルを測定することにより得られる二次元質量スペクトルのノイズ低減処理装置において、xy平面の各点のz軸方向に質量スペクトルデータを格納して三次元データを生成した上で、三次元のWavelet解析を適用しノイズ低減処理を行なうことを特徴とする質量分析装置。
【請求項8】
前記Wavelet解析において、
x、y軸方向とz軸方向とで異なる基底関数を適用してそれぞれの軸方向に三次元Wavelet順変換を行う工程と、
前記Wavelet順変換を行った後に、ウェーブレット係数の絶対値が閾値以下の信号を除去する工程と、
前記閾値以下の信号を除去した後に、順方向変換の場合とは適用する軸の順番を逆順にし、かつ各軸方向には順変換と同一の基底関数を適用して、三次元Wavelet逆変換を行う工程とを行うことにより、
ノイズの低減された信号を得ることを特徴とする請求項7に記載の質量分析装置。
【請求項9】
前記Wavelet解析において、少なくとも信号のz軸方向には「中心軸に対して対称かつ中心軸において最大値をとる」基底関数を適用することを特徴とする請求項7又は8に記載の質量分析装置
【請求項10】
前記Wavelet解析において、質量信号を含まないリファレンス信号から、ノイズ低減の際の閾値を決定することを特徴とする請求項7〜9のいずれか1項に記載の質量分析装置
【請求項11】
前記Wavelet解析において、複数の閾値を仮に設定し、設定した仮の閾値のそれぞれによるノイズ低減処理の前後での質量信号の変化量から、ノイズ低減の際の閾値を決定することを特徴とする請求項7〜9のいずれか1項に記載の質量分析装置。
【請求項12】
前記Wavelet解析において、ノイズ低減処理の前後での質量信号の変化量の、閾値の変化に対する2階導関数を用いて、その符号変化から閾値の値を決定することを特徴とする請求項11に記載の質量分析装置。
【請求項13】
請求項1〜6のいずれか1項に記載の二次元質量スペクトルのノイズ低減処理方法をコンピュータで実行するためのコンピュータプログラム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図14】
【図15】
【図18】
【図20】
【図21】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図16】
【図17】
【図19】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図14】
【図15】
【図18】
【図20】
【図21】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図16】
【図17】
【図19】
【公開番号】特開2011−180134(P2011−180134A)
【公開日】平成23年9月15日(2011.9.15)
【国際特許分類】
【出願番号】特願2011−23875(P2011−23875)
【出願日】平成23年2月7日(2011.2.7)
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】
【公開日】平成23年9月15日(2011.9.15)
【国際特許分類】
【出願日】平成23年2月7日(2011.2.7)
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】
[ Back to top ]