説明

質量分析データ処理装置

【課題】顕微質量分析により収集されたMSイメージングデータに対する統計的な解析処理により、試料を特徴付けるm/zの分布などの有用な情報を提供しつつ、その解析結果の信頼度などをユーザが容易に評価・検証できるようにする。
【解決手段】試料上の2つの関心領域に含まれる画素のMSイメージングデータに対し統計的仮説検定を実施してm/z毎のp値を算出し、p値が設定された有意水準以上となるm/zを求める。この特定のm/zにおけるp値、該m/zにおける二次元強度分布画像、該m/z付近の平均マススペクトル拡大図、該m/zの強度分布を示す箱髭図、正規確率プロット図などを同一の解析画面内に表示するとともに、実測による平均マススペクトルにおけるm/z付近のピークが理論的な同位体ピーククラスタに適合するか否かを示す指標値を算出し、それを同じ画面内に表示し、検定結果の信頼度の検証に利用できるようにする。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、試料の二次元領域内の複数の微小領域で質量分析を実行して収集される質量分析イメージジングデータを解析する質量分析データ処理装置に関する。
【背景技術】
【0002】
生体組織等の試料の形態観察を行うと同時に、その試料上の所定領域に存在する分子の分布を測定する装置として、顕微質量分析装置或いはイメージング質量分析装置などと呼ばれる装置が開発されている(特許文献1〜3、非特許文献1、2など参照)。こうした装置によれば、試料をすり潰したり破砕したりすることなく試料の形態をほぼ維持したまま、顕微観察により指定した試料上の任意の領域に含まれる特定の質量電荷比m/zを有するイオンの分布画像を得ることが可能であり、特に、生化学分野、医療・薬学分野などにおいて、例えば生体内細胞に含まれるタンパク質等の分布情報を得るといった応用が期待されている。本明細書では、上述したような質量分析装置で収集されるデータを質量分析イメージングデータと呼ぶ。
【0003】
分析対象の試料に関する所望の情報、例えば試料を特徴付ける物質の種類やその量の分布、などを人間が容易に把握できるようにするには、収集した質量イメージングデータに対して適切な解析処理を実行し、その結果を適切な態様で表示することが重要である。試料上の或る程度の面積の二次元領域について質量分析イメージングデータを取得した場合、このデータは多数の測定点(微小領域)のマススペクトルデータを含む。そのため、データの量は極めて膨大である。そこで、このような膨大な量の質量分析イメージングデータに対し、仮説検定や多変量解析などといった統計的手法を利用して有意な情報を得るための手法が従来提案されている。
【0004】
例えば統計的仮説検定を利用する方法として、非引用文献3に記載のものがある。この文献に記載の方法では、まず、高分解能の光学画像において既存の画像編集ソフトウエアを使用して形態情報に基づく生物学的マスクを作成し、検定対象の領域をレーザスポット(質量分析イメージング画像の画素)単位で特定する(同文献の図4参照)。その後に、1[Da]毎に区切った全ての質量電荷比において、検定対象の領域から得られたマススペクトルデータと比較対象のサンプルで同様に指定した領域から得られたマススペクトルデータとについてマン−ホイットニ(Mann-Whitney)のU検定を実施し、その検定の結果得られるスコアを表示するようにしている(同文献の図5参照)。この場合、大きなスコアを与える質量電荷比は比較対象のサンプルとほぼ等しい量が含まれる物質を表しており、その二次元分布を表示することによって、検定結果が妥当であることを確認したとされている。
【0005】
一方、主成分分析(PCA=Principal Component Analysis)、独立成分分析(ICA=Independent Component Analysis)、因子分析(FA=Factor Analysis)などの多変量解析を利用する方法としては、引用文献4、5などに記載のものが知られている。多変量解析の結果は、因子毎に、スコアとローディングとを表示するのが一般的である。例えば引用文献4では、対象試料の光学画像とともに、主成分分析により得られたローディングを散布図、スコアを二次元分布画像として表示している(同文献の図1参照)。また、引用文献5では、ローディングを質量電荷比に対するスペクトルとして表示するようにしている(同文献の図3、6、7、9参照)。
【0006】
上述したように統計的仮説検定や多変量解析は質量分析イメージングデータの解析に有用な手法であることは確かであるが、適切な結果が得られない場合もよくある。そのため、得られた結果をユーザ(分析者)が検証したり、信頼に足るものか否か判断したりする必要がある。
【0007】
例えば統計的仮説検定はあくまでも確率的な事象に基づくものであるので、検定スコアを根拠にした判断を重視し過ぎることは適切でない。このため、検定結果は仮説を検討するための候補であると考え、分析者が別の観点からデータを容易に再確認できるようにして、候補の中から最も確からしいものを選択できるようにすることが望ましい。しかしながら、上記のような従来技術は、設定された有意水準よりも大きなスコアを示す質量分析イメージング画像を表示する機能を有するのみであって、分析者が統計的仮説検定結果を検討するための考慮はなされていない。
【0008】
一方、多変量解析では、各因子のローディングから判断した特徴的な質量電荷比のピーク単体の強度分布が、必ずしもスコアの二次元分布に一致しない可能性がある。また、ローディングをスペクトルとして考える場合、ローディングの値がマイナスになると、それが科学的に何を意味するかを解釈することが難しい。上記の従来技術ではこうした問題に対する考慮がなされておらず、分析者がデータを再確認したり検証したりすることは容易ではない。
【先行技術文献】
【特許文献】
【0009】
【特許文献1】特開2007−66533号公報
【特許文献2】特開2007−157353号公報
【特許文献3】特開2007−257851号公報
【非特許文献】
【0010】
【非特許文献1】小河潔、ほか5名、「顕微質量分析装置の開発」、島津評論、株式会社島津製作所、平成18年3月31日発行、第62巻、第3・4号、p.125−135
【非特許文献2】原田高宏、ほか8名、「顕微質量分析装置による生体組織分析」、島津評論、株式会社島津製作所、2008年4月24日発行、第64巻、第3・4号、p.139−146
【非特許文献3】マクセンス(Maxence Wisztorski)ほか、「 エクスプローリング・ジ・アセンブリ・オブ・アン・オルガニズム・ユージング・マルディ・イメージング:ア・システムズ・アプローチ・トゥ・アンダースタンディング・エンブリオニック・デベロップメント(Exploring the Assembly of an Organism using MALDI Imaging: A Systems Approach to Understanding Embryonic Development)」、プロシーディング・オブ・ザ・56ス・エーエスエムエス( Proceedings of the 56th ASMS.)、WPH-164(2008)
【非特許文献4】松山、ほか2名、「MALDIイメージングデータの統計学的手法を用いた解析」、日本質量分析学会、第55回質量分析総合討論会(2007)、2P-22-B09、pp.262-263
【非特許文献5】リーンダート(Leendert A. Klerk)、ほか4名、「イクステンディッド・データ・アナリシス・ストラテジーズ・フォー・ハイ・リゾリューション・イメージング・マス:ニュー・メソッズ・トゥー・ディール・ウィズ・イクストリームリー・ラージ・イメージ・ハイパースペクトラル・データセッツ(Extended data analysis strategies for high resolution imaging MS: New methods to deal with extremely large image hyperspectral datasets)」、インターナショナル・オブ・マス ・スペクトロメトリー(International of Mass Spectrometry)、260 (2007)、pp. 222-236
【発明の概要】
【発明が解決しようとする課題】
【0011】
本発明は上記課題を解決するためになされたものであり、その目的とするところは、質量分析イメージングデータを統計的に解析する際に、統計的仮説検定や多変量解析の結果を分析者が適切に利用し、試料に対する質量分析イメージング結果から有用で信頼性の高い情報を得ることができる質量分析データ処理装置を提供することにある。
【課題を解決するための手段】
【0012】
上記課題を解決するために成された本発明は、試料上の二次元領域内に設定された複数の微小領域に対する質量分析を実行可能な質量分析装置により収集されたデータを処理する質量分析データ処理装置であって、
a)二次元領域内に含まれる複数の微小領域に対するマススペクトルデータに対する統計的仮説検定又は多変量解析を行う解析演算手段と、
b)前記解析演算手段による解析により特定された質量電荷比のピークが同位体ピーククラスタに属するものである可能性を調べ、その可能性を表す指標値を算出する同位体ピーク判定手段と、
c)前記解析演算手段による解析結果を示すグラフ表示、その解析により特定された質量電荷比におけるピーク強度の二次元分布を示すグラフ表示、その質量電荷比付近の所定の質量電荷比範囲のマススペクトルを示すグラフ表示、及び、前記同位体ピーク判定手段により算出された指標値、が配置された表示画面を作成する表示処理手段と、
を備えることを特徴としている。
【0013】
統計的仮説検定としては周知の様々な検定、例えばt検定などのパラメトリックな検定手法、U検定などのノンパラメトリックな検定手法のいずれでも用いることができる。また多変量解析についても同様に周知の様々な多変量解析手法、例えば主成分分析、判別分析、因子分析などを用いることができる。
【0014】
上記解析演算手段が統計的仮説検定を行うものである場合、該解析演算手段は、予め設定された仮説について2つの二次元領域(関心領域)内の複数の微小領域におけるマススペクトルデータに対する検定を実施し、例えば質量電荷比毎のp値をそれぞれ求める。その統計的仮説検定についての有意水準αが予め与えられた場合、p値が有意水準αを超えるような質量電荷比は有意な質量電荷比であると判定される。そこで、表示処理手段は、例えば、解析結果として質量電荷比とp値との関係を示すスペクトル状のグラフを作成して表示するほか、有意と判定された特定の質量電荷比におけるピーク強度の空間分布(二次元分布)を示すグラフ表示や、その質量電荷比付近の所定の質量電荷比範囲のマススペクトル拡大図などを同一の表示画面上に表示する。特定の質量電荷比が複数見いだされた場合には、例えば質量電荷比の値の順序又は得られたp値の順序などに従って、上記のようなグラフ表示を列挙すればよい。
【0015】
一方、上記解析演算手段が多変量解析を行うものである場合、該解析演算手段は、二次元領域内の複数のマススペクトルデータから、質量電荷比と空間的位置とを行列要素とするデータマトリクスを作成し、そのデータマトリクスに対して主成分分析等の多変量解析を実施する。主成分分析の場合には、複数の主成分毎のローディングとスコアとが解析結果として得られる。そこで、表示処理手段は、例えば解析結果として、主成分毎のスコアの二次元分布画像や主成分毎のローディングと質量電荷比との関係を示すスペクトル状のグラフを作成して同一表示画面上に表示する。また、主成分毎のローディングが大きい(その主成分への寄与が大きい)順に質量電荷比を特定し、その特定の質量電荷比におけるピーク強度の空間分布(二次元分布)を示すグラフ表示や、その質量電荷比付近の所定の質量電荷比範囲のマススペクトル拡大図などを同一の表示画面上に表示する。
【0016】
統計的仮説検定、多変量解析のいずれの場合にも、同位体ピーク判定手段は、上述したように特定された質量電荷比のピークを含んで同位体ピーククラスタ(同位体ピーク群)であると推定される各ピークの強度比の実測値と理論値との類似性を調べることにより、特定された質量電荷比のピークが同位体ピーククラスタに属すると認められるか否かを判定し、その結果を指標値として算出する。表示処理手段は、この指標値を上記表示画面内に表示する。
【0017】
同位体ピーククラスタに属する複数のピークの強度比を算出するには、与えられた質量電荷比から構成元素の種類と個数とを推定することが必要であるが、そのために、例えば特開2007−263641号公報に記載の手法、つまり後述するアベラジンモデルを用いた手法が有用である。或る質量電荷比を有するピークが同位体ピーククラスタに適合しない、つまり同位体ピーククラスタに属する可能性が低いと判定された場合には、そのピークはノイズピークである可能性が高いと判断することができる。したがって、その結果から、その特定の質量電荷比における統計的仮説検定や多変量解析の結果が目的試料の解析に利用可能であるか否か、つまり信頼性が高い結果であるか否かを判断することが可能となる。
【0018】
なお、同位体ピーククラスタに属する複数のピークは質量電荷比は相違するものの同一物質由来のピークである。したがって、統計的仮説検定や多変量解析により、複数の質量電荷比が特定された場合に、それら質量電荷比を有するピークが同位体ピーククラスタに適合すると判定され、且つそれらの統計的仮説検定又は多変量解析の解析結果が一致していれば、その解析結果の信頼性は高いと考えられる。そこで、本発明に係る質量分析データ処理装置では、好ましくは、前記同位体ピーク判定手段により同一の同位体ピーククラスタに属すると判定された複数のピークの統計的仮説検定又は多変量解析の解析計算結果の一致度を判定する一致度判定手段をさらに備える構成とするとよい。
【発明の効果】
【0019】
本発明に係る質量分析データ処理装置によれば、いわゆる顕微質量分析装置で収集された試料上の二次元領域の質量分析イメージングデータに対し統計的仮説検定や多変量解析を適用して、その二次元領域に存在する特徴的な物質の種類や物質の分布、或いは複数の物質の関係性などに関する有用な情報を得ることができるとともに、そうした解析結果が信頼に足るものであるか否かを分析者が容易に検証することができるようになる。
【図面の簡単な説明】
【0020】
【図1】本発明に係る質量分析データ処理装置を利用した顕微質量分析システムの一実施例(第1実施例)の全体構成図。
【図2】第1実施例の顕微質量分析システムにおける質量分析イメージングの取得及びデータ処理の手順を示すフローチャート。
【図3】処理を試みた試料(印刷物)の模式図。
【図4】第1実施例の顕微質量分析システムにおける解析画面の一例を示す図。
【図5】第1実施例の顕微質量分析システムにおける解析画面の一例を示す図。
【図6】第2実施例の顕微質量分析システムにおける質量分析イメージングの取得及びデータ処理の手順を示すフローチャート。
【図7】第2実施例の顕微質量分析システムにおける解析画面の一例を示す図。
【図8】第2実施例の顕微質量分析システムにおける解析画面の一例を示す図。
【発明を実施するための形態】
【0021】
[第1実施例]
以下、本発明に係る質量分析データ処理装置を用いた顕微質量分析システムの一実施例(第1実施例)について、添付の図面を参照して説明する。図1は本実施例の顕微質量分析システムの全体構成図である。
【0022】
この顕微質量分析システムは、内部が略大気圧に維持される気密チャンバ1と、ターボ分子ポンプなどの図示しない真空ポンプによって内部が高真空度の真空雰囲気に維持される真空チャンバ10と、を備える。気密チャンバ1の内部には、試料3が載置された試料ステージ2が、モータ等を含む駆動機構5によりガイド4に沿ってX方向に大きくスライド往復動可能に配設されている。図1中に、試料ステージ2を実線で示した位置が分析位置P2であり、点線で示した位置が観察位置P1である。試料ステージ2は、駆動機構5によって、ガイド4に沿ったX方向だけでなく、これと水平方向に直交するY方向、及び、高さ方向であるZ方向にも所定の範囲で移動可能となっている。
【0023】
観察位置P1の上部の気密チャンバ1外側にはCCDカメラを含む撮像部6が設置され、この撮像部6と対向するように気密チャンバ1内部には透過照明部7が設置されている。試料ステージ2が観察位置P1にあるとき、透過照明部7から出射した光が試料ステージ2に形成されている開口を通して試料3の下面に当たり、その透過光による試料像を撮像部6により観察可能である。撮像部6で取得された画像信号は画像処理部23に送られ、ここで画像処理されて後述する表示部26に表示可能な二次元画像が形成される。
【0024】
分析位置P2の上部の気密チャンバ1外側には、試料3の表面に微小径に絞ったレーザ光を照射するためにレーザ光照射部8が配設されている。また、気密チャンバ1の内部には、レーザ光の照射に応じて試料3から発生したイオンを真空チャンバ10に輸送するためのイオン輸送管11のイオン採取口が、試料3に対向して配設されている。真空チャンバ10内には、イオンを収束させつつ後段に送るイオン輸送光学系12、13と、イオンを一時的に保持するイオントラップ14と、イオンを質量電荷比(m/z)に応じて分離するリフレクトロン型の飛行時間型質量分析器15と、飛行時間型質量分析器15で分離されたイオンを検出する検出器16と、が配設されている。
【0025】
検出器16による検出信号はアナログ/デジタル変換器17でデジタル値に変換されてデータ処理部18に入力され、ここで各イオンの飛行時間が質量電荷比に換算されてマススペクトルが作成される。また、データ処理部18は、測定点毎に得られるマススペクトルデータに対し後述するようなデータ処理を実行し、その結果を制御部20を通して表示部26の画面上に表示する。
【0026】
この顕微質量分析システム全体の制御を司る制御部20は、分析制御部21を通してイオントラップ14などの質量分析部の動作を制御するほか、ステージ駆動部22を介して駆動機構5により試料ステージ2の移動を制御し、レーザ駆動部24を介してレーザ光照射部8からのレーザ光の出射を制御する。また、制御部20には、分析者が操作や指示を与える操作部25と、試料3の二次元観察画像や質量分析結果である二次元物質分布画像などを表示するための表示部26が接続されている。なお、制御部20、分析制御部21、データ処理部18などの機能の少なくとも一部は、パーソナルコンピュータに搭載した専用のソフトウエアを実行することにより実現することができる。
【0027】
本実施例の顕微質量分析システムでは、試料上の二次元領域に対して得られた質量分析イメージングデータ(マススペクトルデータ)を解析して表示するデータ処理にその特徴を有する。このデータ処理の一例について、図2〜図6により詳細に説明する。図2は質量分析イメージングデータの取得及びデータ処理の手順を示すフローチャート、図3は処理を試みた試料(印刷物)の模式図、図4及び図5は表示部26に表示される解析画面(ウインドウ)の一例を示す図である。
【0028】
第1実施例による顕微質量分析システムにおいて、データ処理部18は収集されたマススペクトルデータに対して統計的仮説検定による解析を実行する。周知のように統計的仮説検定には様々な手法があるが、ここでは、ユーザ(分析者)が試料3上に設定した2つの二次元的な関心領域A、Bにおいて、「領域A内の画素群と領域B内の画素群とについて、同じ質量電荷比m/zで観測されるピーク強度の平均値の差はゼロである」という帰無仮説に対するt検定を行った解析例を示す。
【0029】
この例では、インクジェットプリンタで印刷されたカラー図形を試料として想定している。このカラー図形は、図3に示すように、矩形状の観測領域内に、シアンインクで左上半分の三角形を描画する(図3(a)参照)とともに、同領域内にマゼンタインクで右上半分の三角形を描画した(図3(b)参照)ものであり、両インクが重なった上部の三角形の領域ではシアンとマゼンタの二色が混合されている(図3(c)参照)。
【0030】
まず制御部20の制御の下に、試料ステージ2上に用意された試料3に対する質量分析イメージング測定を実行する(ステップS1)。即ち、試料3上の所定の二次元範囲を格子状に細かく区切った各微小領域について、レーザ光照射部8から小径に絞ったレーザ光を照射し、それによって試料3から放出された各種イオンの質量分析を実行してマススペクトルデータを取得する。駆動機構5により試料ステージ2をX方向及びY方向にそれぞれ所定微小距離だけ移動させながら質量分析を繰り返すことにより、所定の二次元範囲内の各微小領域のマススペクトルデータをそれぞれ収集する。
【0031】
データ処理部18は上記のように収集された質量分析イメージングデータに基づき、全イオン電流(TIC=total ion current)による質量分析イメージング画像を作成し、図4に示すような解析画面30内の関心領域設定部31に描出する(ステップS2)。ここで関心領域設定部31内に描出される2つの質量分析イメージング画像は同じものである。
【0032】
分析者は、操作部25による操作(例えばマウスのドラッグ操作など)により、上記のように描出されたTICによる2つの質量分析イメージング画像上で、比較したい関心領域(ROI)をそれぞれ指定する(ステップS3)。図4において、関心領域設定部31に描出された質量分析イメージング画像上に重ねて表示されている略三角形の枠31a、31bが分析者により指定された関心領域を示す境界線である。2つの質量分析イメージング画像のうち、左側が関心領域A(region A)を示す枠31aが重畳された画像であり、右側が関心領域B(region B)を示す枠31bが重畳された画像である。
【0033】
比較すべき2つの関心領域が指定されると、データ処理部18は各関心領域に含まれる各画素(測定点)のマススペクトルデータを収集する。そして、そのマススペクトルデータから質量電荷比毎にイオン強度の平均値を計算し、その計算結果に基づいて平均マススペクトルを作成して、関心領域設定部31の右隣のマススペクトル表示部32にそのグラフを表示する(ステップS4)。ここでは、2つの関心領域A、B内の平均マススペクトルの比較を容易にするために、関心領域Aのスペクトル強度はプラス値(上向き)で、関心領域Bのスペクトル強度はマイナス値(下向き)で表示している。つまり、強度=0を示す横軸を中心として、上側が関心領域Aの平均マススペクトル、下側が関心領域Bのマススペクトルである。
【0034】
次に、データ処理部18は、2つの関心領域A、Bについての統計的仮説検定を実施し、その検定により求めたp値を質量電荷比との関係でグラフ化して表示する(ステップS5)。本例では、次の三段階の検定を行うものとする。即ち、第1段階として、各関心領域で特定の質量電荷比におけるピーク強度の「母集団が正規分布に従う(つまり正規性がある)か否か」の検定を行う。次に第2段階として、2つの関心領域A、Bの両方で、上記第1段階の検定で正規性が棄却されなかった質量電荷比において「2つの関心領域の母分散は同じである(つまり等分散性を有する)」という仮説に対し検定を行う。そして第3段階として、「2つの関心領域の標本の平均値は等しい(等平均値である)」という仮説について、上記第2段階の検定で等分散性が棄却されなかった場合にはt検定、等分散性が棄却された場合はウェルチ(Welch)のt検定を行うものとする。
【0035】
データ処理部18は、上述したような仮説に基づく検定を行うことにより各質量電荷比におけるp値を取得すると、横軸を質量電荷比、縦軸をp値とするスペクトル状のグラフを作成し、解析画面30中のp値スペクトル表示部34に表示する。図4の例では、各質量電荷比における等平均値の検定(第3段階の検定)におけるp値スペクトルが表示されているが、このグラフ上部の表示メニュー34aにより、正規性検定(第1段階の検定)のp値スペクトルや等分散性検定(第2段階の検定)のp値スペクトルに表示を切り替えることが可能である。
【0036】
分析者は、こうしたp値スペクトルとマススペクトル表示部32に表示される平均マススペクトルとを比較することで、検定の妥当性(検定の仮説の妥当性)を判断することができる。例えば一般的には、平均マススペクトルにおいてピーク強度が小さすぎる質量電荷比における検定結果(p値)は信頼性が低いと考えることができる。なお、このように平均マススペクトルとp値スペクトルとで同一質量電荷比における値の比較を容易にするために、両グラフの横軸は連動して拡大・縮小されるようになっている。
【0037】
分析者は、解析画面30内の有意水準設定部33に縦に3つ並べて表示されているテキストボックスにおいて、正規性の検定、等分散性の検定、及び、等平均値の検定、のそれぞれの検定に用いられる有意水準αを設定する(ステップS6)。
【0038】
さらに分析者は、検定結果選択部35に表示されているテキストボックスにおいて、後述のステップS9で表示する検定結果の種類を選択する(ステップS7)。ここで選択可能な表示の種類は、等平均値の検定において、「関心領域Aの平均値と関心領域Bの平均値が等しい」、「関心領域Aの平均値が関心領域Bの平均値よりも大きい」、又は、「関心領域Aの平均値が関心領域Bの平均値よりも小さい」、のいずれかである。
【0039】
有意水準設定部33に表示されている「Calc」ボタンが分析者によりクリックされると、データ処理部18は、ステップS6で設定された有意水準αに基づく検定結果の判定処理を実行する(ステップS8)。具体的には、設定された有意水準αよりも大きなp値を有する質量電荷比のみが仮説に対して有意であると判定され、特徴的な質量電荷比として抽出される。
【0040】
次にデータ処理部18は、有意であると判定した検定結果を解析画面30内の検定結果表示部36中に複数の態様で表示する(ステップS9)。本例では、関心領域A内の平均値と関心領域Bの平均値が等しいと検定された質量電荷比のデータとして、その質量電荷比におけるp値がp値表示部361に数値で表示され、その質量電荷比における二次元強度分布画像である質量分析イメージング画像が、質量分析イメージング画像表示部362に表示される。具体的には、図4において、p値表示部361の最上段に、m/z=575.1の3段階の検定におけるp値が表示され、その右方の質量分析イメージング画像表示部362に、関心領域Aを明示した質量分析イメージング画像、及び関心領域Bを明示した質量分析イメージング画像、が横に並べて表示されている。
【0041】
質量分析イメージング画像の右方の平均マススペクトル拡大図表示部363には、左方の質量電荷比近辺における(例えば図4の最上段であればm/z=575.1近辺における)平均マススペクトルの拡大図が表示される。その右方の箱髭図表示部364には、左方の質量電荷比近辺におけるピーク強度のばらつき度合を関心領域毎に示す箱髭図(ボックスプロット)が表示される。この箱髭図は、ピーク強度の中央値、中央値のばらつき、第1四分位点と第3四分位点、異常値などを表すもので、検定とは異なる観点で統計値を視覚化するのに役立つ。さらに、右端の正規確率プロット図表示部365には、左方の質量電荷比近辺におけるピーク強度の正規確率プロット図が表示される。この正規確率プロット図はデータの分布が正規分布しているか否かを目視で判断するためのグラフであり、検定とは異なる観点でデータが正規分布しているということを立証したり仮説が誤っていることを示唆したりするのに役立つ。
【0042】
さらにデータ処理部18は、上記検定により特定された、つまり有意であると判定された質量電荷比におけるピークについて、同位体ピーククラスタ(同一の元素組成を有するイオンに由来し、イオン中の同位体組成の相違によって異なる質量電荷比を示す複数本のピークから成るピーク群)に属する可能性の高さを調べ、その結果得られる指標値である適合度を解析画面30内に表示する(ステップS10)。
【0043】
具体的には、或る特定の質量電荷比Mが与えられたときに、アベラジン(Averagine)モデルを用いて、質量電荷比Mから元の物質の元素組成(元素種類と各元素の個数)を推定し、その元素組成から推定される同位体ピーククラスタに属する複数のピークの強度比の理論値を計算する。そして、実際に得られた平均マススペクトル上で質量電荷比Mの近辺の複数のピークの強度比を求め、理論と実測のピーク強度パターンの一致の度合いを示す指標値である適合度fを計算する。この適合度fはピーク強度パターンが完全に一致したときに1となるようにする。
【0044】
上記アベラジンモデルは、観測ピークの質量電荷比から構成元素を推定するために、センコらが、文献(Michel W. Senko et.al,「デターミネイション・オブ・モノアイソトピック・マシズ・アンド・イオン・ポピュレイションズ・フォー・ラージ・バイオモレキュルズ・フロム・リゾルブド・アイソトピック・ディストリビューションズ (Determination of monoisotopic masses and ion populations for large biomolecules from resolved isotopic distributions)」、Journal of American Soc. Mass Spectom., 6, pp.229-233,(1995))で提案したものである。
【0045】
ここで提案されているアベラジンモデルはタンパク質データベースの統計的解析からアミノ酸の平均組成を求めたもので、C4.93847.75831.35771.47730.0417をユニットアミノ酸配列とする。このユニットはモノアイソトピックの元素質量電荷比で計算するとm/z=111.0543[Da]となる。例えば1000[Da]における同位体ピーククラスタを計算するために使用する元素組成は、9.0046(=1000/111.0543)ユニットのアベラジンモデルの構成元素数を四捨五入により整数化した後に(C44701213、m/z=974.5185[Da])、与えられた質量電荷比に近付けるべく水素元素Hの数を適宜増減させて求めることができる(C44951213、m/z=999.71s[Da])。
【0046】
なお、アベラジンモデルを用いた同位体ピーククラスタのピーク強度比の計算手法については、特開2007−263641号公報などに既に開示されているものである。
【0047】
図4では、或る質量電荷比について上記のようにして求めた同位体ピーククラスタとしての適合度fを、平均マススペクトル拡大図表示部363内に表示されている平均マススペクトル拡大図枠内の右上部(符号366の部分)に表示している。本例では、m/z=575.1における同位体ピーククラスタ適合度fは0.92であり、この質量電荷比のピークは或る物質由来の同位体ピーククラスタに属する1つのピークであると考えられる。これにより、分析者は、この質量電荷比におけるt検定の解析結果は信頼に足るものであると判断することができる。
【0048】
また、平均マススペクトル拡大図表示部363内に表示されている平均マススペクトル拡大図をマススペクトル表示部32に表示されている全質量電荷比範囲の平均マススペクトルと比較することで、この特定の質量電荷比のピークについて最大ピークに対する相対的強度を容易に把握することができる。あまりに小さいピークに対する検定結果は信頼度が低いと考えられる。こうした判断の補助のために、最大ピークに対するピーク強度比を数値で表示するとさらに好ましい。
【0049】
図4の例では、検定結果表示部36の2段目、3段目には、関心領域Aの平均値と関心領域Bの平均値とが等しいと考えられる質量電荷比の別の候補、即ち、m/z=576.1、m/z=577.1の結果が最上段と同様に表示されている。このとき、m/z=576.1やm/z=577.1における同位体ピーククラスタ適合度fの値がm/z=575.1における同位体ピーククラスタ適合度fの値と一致していることから、これら質量電荷比のピークはm/z=575.1である物質の同位体ピーククラスタである可能性が高いと判断できる。そして、同じ物質の同位体ピーククラスタで同じ検定結果が得られているので、検定結果の信頼度は高いと推定することができる。
【0050】
ここでは、或る質量電荷比のピークについて同位体ピークが同じ検定結果を示す場合に、検定結果表示部36の左端に示している質量電荷比の数値をハイライト表示している。図4では、m/z=576.1、m/z=577.1、m/z=578.1がいずれもハイライト表示されている(図4では太字として見えている)。即ち、本例では、同一の同位体ピーククラスタに属すると判定された複数ピークの解析計算結果の一致度を示すため、ハイライト表示を用いている。なお、検定結果表示部36の左端のスライダを操作することにより、他の質量電荷比の候補を表示することが可能である。
【0051】
分析者は、上述したように解析画面30上に表示された様々なグラフや数値を見て検定結果の妥当性を判断し、さらに検討が必要であると判断すれば(ステップS11でYes)、ステップS6に戻って有意水準αや表示される結果の種類を変更し、目的とする解析に関連する質量電荷比の候補を探すようにすればよい。
【0052】
上記のようなデータ処理の利点を図5を用いて説明する。図5は、図4と同じ質量分析イメージングデータに対する検定結果であるが、正規性検定の有意水準αを図4の場合よりも大幅に低い0.01に設定し、検定結果の表示種類を「関心領域Aの平均値が関心領域Bの平均値よりも大きい」に設定したものである。
【0053】
図5では、検定結果表示部36の左端のスライダ操作により、4番目〜6番目の質量電荷比の候補の検定結果を表示しているが、5番目に表示されたm/z=768.1の検定結果を見ると、質量分析イメージング画像表示部362に表示されている質量分析イメージング画像のうえでは、関心領域Aが関心領域Bよりもピーク強度が大きいように見えるものの、平均マススペクトル拡大図で同位体ピーククラスタのパターンは確認できない。また、同位体ピーククラスタ適合度fは0.52と低く、正規確率プロット図で関心領域Bの正規性が疑わしいことから、ノイズの影響等により、関心領域Aで関心領域Bよりもピーク強度が大きいように見えるだけである可能性が高いと理解できる。
【0054】
また、その上の4番目に表示されたm/z=1153.2を見ると、箱髭図において関心領域B(右側)のボックスの下側の長さが上側に比べ異常に短く、ピーク強度の分布が歪んでいることが分かる。但し、この場合には、関心領域Bのピーク強度はゼロに近いために分布に歪みが生じているだけであり、m/z=1153.2において関心領域Aで関心領域Bよりもピーク強度が大きいと理解することは正しいと考えられる。平均マススペクトル全体図と各平均マススペクトル拡大図とを比較した場合にも、m/z=768.1のピークは小さすぎるため有意な結論を導くことは困難であると思われるが、m/z=1153.2は或る程度の大きさを持ったピークであるので有意な質量電荷比の候補と考えてもよいと理解できる。さらに、m/z=1153.2では同位体ピーククラスタ適合度fが高く、同じ同位体ピーククラスタに属するm/z=1152.2とm/z=1154.2のt検定の結果(図に表示せず)も一致しているので、分析者はこれが意味のある解析結果であると理解することができる。このことは、m/z=1153.2の文字がハイライト表示されていることから、m/z=1152.2とm/z=1154.2の結果を表示しなくても、解析計算結果の一致度が高いことがわかる。
【0055】
さらにまた、6番目に表示されたm/z=576.8の平均マススペクトル拡大図を見ると、同位体ピークの存在が確認できる。また、左端のm/z=576.8の数値がハイライト表示されていることから、この質量電荷比のピークの同位体ピークでも同じ検定結果が得られている(つまり解析計算結果の一致度が高い)ことが分かる。こうしたことから、この質量電荷比についての検定結果の信頼度は高いと理解することができる。
【0056】
以上のように、第1実施例による顕微質量分析システムによれば、分析者が任意に設定した2つの関心領域内の質量分析イメージングデータの総合的な比較を統計的仮説検定により行うとともに、その検定結果が信頼できるか否かを同位体ピーククラスタ適合度や解析計算結果の一致度などによって容易に推測することが可能となる。
【0057】
上記第1実施例による顕微質量分析システムでは、以下のような変形例が考えられる。
[第1の変形例]
図2に示したフローチャートのステップS2の処理では、全イオン電流による質量分析イメージング画像を表示するようにしていたが、これに代えて、試料の質量分析イメージングデータを取得した際に試料を顕微撮影した光学画像を表示し、この光学画像上で分析者が関心領域を指定できるようにしてもよい。これにより、試料の表面形状や色などの外観から、比較すべき関心領域を設定することが容易になる。もちろん、こうした光学画像と質量分析イメージング画像とを併用して、より適切な関心領域を設定できるようにしてもよい。
【0058】
[第2の変形例]
上記説明ではステップS5で実施される統計的仮説検定としてt検定を用いていたが、検定の手法はこれに限るものではない。例えば、t検定を行う代わりにU検定を用いることもできる。これにより、パラメトリックな検定ではなく、ノンパラメトリックな検定(つまり正規性を仮定しない検定)を行うことができる。
【0059】
[第3の変形例]
上記説明では、解析画面30内のマススペクトル表示部32に平均マススペクトルを表示していたが、これに代えて、関心領域A、B毎にその領域内の全ての画素のマススペクトルを重ね表示するようにしてもよい。これにより、スペクトル強度のばらつきを理解することが容易になる。
【0060】
[第4の変形例]
検定結果表示部36に表示される箱髭図や正規確率プロット図は、一般に、統計量プロット図と呼ばれるものである。このほか、同じ統計量プロット図として、散布図、分位数−分位数プロット図、などを利用してもよい。散布図は、特定の複数の質量電荷比のピーク強度の関係が各関心領域内で同じであるか否かを判断するのに役立つ。また、分位数−分位数プロット図は、2つの関心領域のピークが同じ分布によるものであるか否かを判定するために有用である。
【0061】
[第2実施例]
次いで、統計的仮説検定ではなく多変量解析を用いて質量分析イメージングデータを処理する実施例(第2実施例)による顕微質量分析システムについて説明する。ここでは多変量解析として主成分分析(PCA)を用いるものとするが、他の多変量解析を利用することもできる。
【0062】
システムの基本的な構成は図1と同じであるので説明を省略し、図6〜図8により、第2実施例における特徴的なデータ処理を説明する。図6は図2に相当するフローチャートであり、図7及び図8は解析画面の一例である。以下の説明で使用する、つまり処理対象とする質量分析イメージングデータは第1実施例と同じである。
【0063】
まず、データ処理部18は、質量分析部により取得した質量分析イメージングデータをファイルダイアログより選択して読み込み(ステップS21)、次に、質量分析時に撮影した上記ファイルに対応する光学画像を解析画面40の光学画像表示部41に表示する(ステップS22)。
【0064】
分析者が、抽出ピーク数と質量電荷比誤差の許容幅とを含むピーク抽出条件をダイアログにより入力すると(ステップS23)、データ処理部18はこの入力された情報に基づいて各マススペクトルに対しピーク検出を行う(ステップS24)。各観察点(画素)でそれぞれピーク検出が行われて質量電荷比が求まると、観察点の位置情報(例えばアドレス)を行、質量電荷比(検出されたピークの質量電荷比)を列とする、イオン強度のデータマトリクスを作成する(ステップS25)。
【0065】
解析画面40のグループ分け条件設定部42には処理対象の画素について、全ての画素を対象とする(Whole)、奇数番目の画素のみを対象とする(Odd)、偶数番目の画素のみを対象とする(Even)、の3つの選択肢が用意されており、分析者はいずれかを選択する。図7の例では「全ての画素を対象とする」が選択されており、ステップS26からS28へと進むが、それ以外の2つの選択肢のいずれかが選択されている場合には、奇数番目又は偶数番目の画素のデータのみが抽出されて(ステップS27)、ステップS28へと進む。
【0066】
また解析画面40のスケーリング方法設定部43には主成分分析の際のスケーリング方法の種類がメニューにより用意されており、分析者は適宜の方法を選択する。図7の例では、「Pareto scaling」が選択されているから、データ処理部18はこれをデータに適用する(ステップS28)。そして、データ処理部18はデータマトリクスについて主成分分析を実施する(ステップS29)。周知のように、主成分分析は、多数の変数をより少数の指標値でもって表わすようにするもので、詳しくは、例えば、宮下芳勝、佐々木慎一著「ケモメトリックス」、共立出版(1995年)などの文献にその方法が記載されている。また、主成分分析の演算処理をパーソナルコンピュータやワークステーション上で行うためのソフトウエアは種々のものが容易に入手可能である。したがって、ここでは主成分分析の詳細な説明は省略する。
【0067】
主成分分析により、返り値として、複数の主成分毎に、その主成分に対する各観察点のスコア、及び各質量電荷比に対応するローディングが得られる。また、主成分分析により、各主成分の分散値が求まり、これから第1主成分の寄与率や第1主成分から第n主成分までの累積寄与率が求まる。
【0068】
スケーリング方法設定部43で軸回転法が選択されている場合には(ステップS30でYes)、因子軸個数設定部44における分析者の設定に基づいて、因子軸の個数を決定した上で軸回転操作を行う。因子軸個数設定部44で自動(Auto)が選択されている場合には(ステップS31でNo)、上記の寄与率又は固有値により採用する主成分の数を決定し、それを因子軸の個数とする(ステップS32)。一方、分析者の数値入力により因子軸個数設定部44で因子軸の個数が指定されている場合には、ステップS32を経ずステップS33へ進む。そして、ステップS29による主成分分析の結果に対し所定の因子軸の個数を設定した軸回転処理を施すことにより、新たなスコア及びローディングを取得する(ステップS33)。図7の例では、軸回転法として「Varimax」が選択され、因子軸の個数は「10」が指定されている。
【0069】
以上によりデータに対する主成分分析に関連した計算が終了するから、その後、データ処理部18は主成分分析の結果を解析画面40内に表示する。即ち、寄与情報表示部45に、各主成分の寄与率をバーでもって表示するとともに、累積寄与率を曲線でもって表示する(ステップS34)。また、各主成分のスコアを二次元分布画像としてスコア分布画像表示部46に表示する(ステップS35)。図7では明らかでないが、例えば、カラースケールは、主成分毎に0からスコアの最大値までの範囲をカラースケールとし、画像の上部にスコアの最大値を表示している。図7の例では、最上段の第1主成分について、スコアの最大値が2445.9と示されている。2段目の第2主成分ではスコア最大値が795.9、3段目の第3主成分ではスコア最大値が548.1と示されているため、主成分間のスコアの比較を容易に行うことができる。
【0070】
また、スコア分布画像表示部46の右方のローディング表示部47には、各主成分のローディングを質量電荷比に対応したスペクトルとして表示している(ステップS36)。このスペクトルの上部には主成分の番号(#)と寄与率とを示し、さらにローディングの絶対値上位5つについては質量電荷比m/zも明示している。通常、主成分分析の解析結果を見る場合には、ローディングそのものの絶対値ではなく、相対的な値で考察を行うことが多い。図7の例では、m/zー576.9、577.3の同位体ピークのローディングが相対的に大きいことがすぐに理解できる。
【0071】
さらにローディング表示部47の右方の特定質量電荷比結果表示部48に、ローディングの絶対値の降順で各イオン強度の二次元分布画像と平均マススペクトル拡大図とを横に並べて表示する(ステップS37)。ここでは、平均マススペクトル拡大図の横軸を、二次元分布画像と同一の質量電荷比を中心とする±10[Da]の範囲としているが、これに限るものではない。図7では明らかでないが、各イオン強度の二次元分布画像では、質量電荷比毎に0から最大強度までの範囲をカラースケールとし、画像の上部に質量電荷比の値とともに強度の最大値を示している。図7の最上段の例では、m/z=576.9のピークの最大強度が1030、m/z=577.3のピークの最大強度も1030となっている。
【0072】
統計的仮説検定の場合と同様に、平均マススペクトル拡大図において同位体ピーククラスタが存在するか否かを調べることは、主成分分析(或いは他の多変量解析)の結果の信頼性の指標となる。即ち、同位体イオンのピーク強度比を反映したピークパターンは元素組成に固有であるため、実測に基づく平均マススペクトル拡大図に表示されるピークのパターンと理論的なピークパターンとの比較から、平均マススペクトル拡大図上のピークがノイズピークであるか特定元素由来のピークであるかの判別が可能となる。そこで、上記第1実施例におけるステップS10と同様の処理により、実測の平均マススペクトルにおける同位体ピーククラスタについてのピーク強度比を理論的に求まるピーク強度比と比較し、同位体ピーククラスタとしての適合度fを算出し、平均マススペクトル拡大図の枠内に(符号49a)表示している。
【0073】
また、同位体ピーククラスタを構成する複数のピークが或る1つの主成分に現れれば、1つの物質が1つの主成分として現れていることになるので、主成分分析の結果の信頼性が高いと考えられる。或る1つの特定物質由来のピークであれば、ローディング表示部47に表示される主成分のローディングスペクトルには1つの同位体ピーククラスタに属する複数のイオンピークがまとめて表示される筈である。そこで、ここでは、平均マススペクトル拡大図上の同位体ピーククラスタだけでなく、ローディングスペクトルにおいても同位体ピーククラスタの適合度gを算出し、これを平均マススペクトル拡大図の枠内に(符号49b))表示している。同位体ピーククラスタの適合度gは、同一の同位体ピーククラスタに属すると判定された複数のピークの解析計算結果の一致度と捉えることができる。図7の例では、第1主成分に大きく現れるm/z=576.9のピークは、平均マススペクトルにおける同位体ピーククラスタ適合度fが0.95、ローディングスペクトルにおける同位体ピーククラスタ適合度gが0.93と、いずれもかなり高い値である。したがって、この主成分分析の結果は信頼度が高いと言うことができる。
【0074】
なお、上記ステップS34〜S38の処理による表示は、主成分分析で得られた各主成分について行われる。但し、図7に示すように、一度に表示可能な主成分の数は3つ、主成分毎のイオン強度の二次元分布画像及び平均マススペクトル拡大図の表示は2つの質量電荷比に限られるので、垂直方向のスライダの操作により主成分の切り替えを、水平方向のスライダの操作により質量電荷比の切り替えをできるようにしている。
【0075】
また、スコア分布画像表示部46に表示される主成分のスコア二次元分布画像と、特定質量電荷比結果表示部48に表示される特定の質量電荷比におけるイオン強度の二次元分布画像とのパターンの類似性を調べることも有効である。図8に示す例では、最下段に表示されている第6主成分のスコアの二次元分布画像と、m/z=768.1におけるイオン強度の二次元分布画像とが明らかに異なるので、主成分分析の結果の信頼性が低いと言える。このような評価を容易に行うために、2つの二次元分布画像の相関値を算出し、これを表示するようにしてもよい。
【0076】
なお、主成分のローディングに現れる特定の質量電荷比に対し、統計的仮説検定の結果を確認することも有効である。このために、第1実施例における解析画面30のp値表示部361に表示されるテキストボックスに質量電荷比の値を入力すると、その質量電荷比に対する検定結果が表示されるようにしてもよい。
【0077】
また、上記実施例はいずれも本発明の一例にすぎず、本発明の趣旨の範囲で適宜変形、修正、追加等を行っても本願特許請求の範囲に包含されることは当然である。
【符号の説明】
【0078】
1…気密チャンバ
2…試料ステージ
3…試料
4…ガイド
5…駆動機構
6…撮像部
7…透過照明部
8…レーザ光照射部
10…真空チャンバ
11…イオン輸送管
12、13…イオン輸送光学系
14…イオントラップ
15…飛行時間型質量分析器
16…検出器
17…アナログ/デジタル変換器
18…データ処理部
20…制御部
21…分析制御部
22…ステージ駆動部
23…画像処理部
24…レーザ駆動部
25…操作部
26…表示部
30、40…解析画面
31…関心領域設定部
32…マススペクトル表示部
33…有意水準設定部
34…p値スペクトル表示部
34a…表示メニュー
35…検定結果選択部
36…検定結果表示部
361…p値表示部
362…質量分析イメージング画像表示部
363…平均マススペクトル拡大図表示部
364…箱髭図表示部
365…正規確率プロット図表示部
41…光学画像表示部
42…グループ分け条件設定部
43…スケーリング方法設定部
44…因子軸個数設定部
45…寄与情報表示部
46…スコア分布画像表示部
47…ローディング表示部
48…特定質量電荷比結果表示部

【特許請求の範囲】
【請求項1】
試料上の二次元領域内に設定された複数の微小領域に対する質量分析を実行可能な質量分析装置により収集されたデータを処理する質量分析データ処理装置であって、
a)二次元領域内に含まれる複数の微小領域に対するマススペクトルデータに対する統計的仮説検定又は多変量解析を行う解析演算手段と、
b)前記解析演算手段による解析により特定された質量電荷比のピークが同位体ピーククラスタに属するものである可能性を調べ、その可能性を表す指標値を算出する同位体ピーク判定手段と、
c)前記解析演算手段による解析結果を示すグラフ表示、その解析により特定された質量電荷比におけるピーク強度の二次元分布を示すグラフ表示、その質量電荷比付近の所定の質量電荷比範囲のマススペクトルを示すグラフ表示、及び、前記同位体ピーク判定手段により算出された指標値、が配置された表示画面を作成する表示処理手段と、
を備えることを特徴とする質量分析データ処理装置。
【請求項2】
請求項1に記載の質量分析データ処理装置であって、
前記解析演算手段は、2つの領域にそれぞれ含まれる複数の微小領域に対するマススペクトルデータから各領域毎に平均マススペクトルを求め、その2つの平均マススペクトルを比較するべく統計的仮説検定を行うことを特徴とする質量分析データ処理装置。
【請求項3】
請求項2に記載の質量分析データ処理装置であって、
前記表示処理手段は、2つの領域の平均マススペクトルを前記表示画面内に配置することを特徴とする質量分析データ処理装置。
【請求項4】
請求項2に記載の質量分析データ処理装置であって、
前記解析演算手段は、統計的仮説検定により得られたp値が設定された有意水準以上である質量電荷比を、前記特定された質量電荷比とすることを特徴とする質量分析データ処理装置。
【請求項5】
請求項1に記載の質量分析データ処理装置であって、
前記解析演算手段は、所定領域に含まれる複数の微小領域におけるマススペクトルデータに対しピーク抽出を行ってピークが存在する質量電荷比を求め、質量電荷比と微小領域の位置とを行列要素とする主成分分析を多変量解析として行うことを特徴とする質量分析データ処理装置。
【請求項6】
請求項5に記載の質量分析データ処理装置であって、
前記解析演算手段は、主成分毎に得られるローディング値が高い質量電荷を、前記特定された質量電荷比とすることを特徴とする質量分析データ処理装置。
【請求項7】
請求項1に記載の質量分析データ処理装置であって、
前記同位体ピーク判定手段により同一の同位体ピーククラスタに属すると判定された複数のピークの統計的仮説検定又は多変量解析の解析計算結果の一致度を判定する一致度判定手段をさらに備えることを特徴とする質量分析データ処理装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図6】
image rotate

【図4】
image rotate

【図5】
image rotate

【図7】
image rotate

【図8】
image rotate


【公開番号】特開2010−261882(P2010−261882A)
【公開日】平成22年11月18日(2010.11.18)
【国際特許分類】
【出願番号】特願2009−114261(P2009−114261)
【出願日】平成21年5月11日(2009.5.11)
【出願人】(000001993)株式会社島津製作所 (3,708)
【Fターム(参考)】