質量分析データ解析方法及び解析装置
【課題】質量分析イメージングデータを解析する際に同一物質由来の同位体ピーク群を正確に識別してモノアイソトピックイオンピークを選別するとともに同一物質由来のアダクトイオンピークを識別して重複するピークを除去することで無駄な情報のないデータを取得する。
【解決手段】ピークピッキングにより取得したデータから、ピクセル番号を縦方向、m/z値を横方向とし要素が強度値であるデータマトリクスを生成し(S3)、m/z毎にピクセル空間における強度のノルムを1にするようにデータの規格化を実行した上で、m/z方向にクラスタリングを行ってピーク(m/z値)を複数のクラスタに分類する(S5、S6)。同一物質由来の同位体ピークやアダクトイオンピークが同一クラスタ内に集約される確率が高まるので、クラスタ内でm/z差や強度を利用し不要な同位体イオンピーク等を除去する(S7、S8)ことにより、的確に不要ピークを除去できる。
【解決手段】ピークピッキングにより取得したデータから、ピクセル番号を縦方向、m/z値を横方向とし要素が強度値であるデータマトリクスを生成し(S3)、m/z毎にピクセル空間における強度のノルムを1にするようにデータの規格化を実行した上で、m/z方向にクラスタリングを行ってピーク(m/z値)を複数のクラスタに分類する(S5、S6)。同一物質由来の同位体ピークやアダクトイオンピークが同一クラスタ内に集約される確率が高まるので、クラスタ内でm/z差や強度を利用し不要な同位体イオンピーク等を除去する(S7、S8)ことにより、的確に不要ピークを除去できる。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、試料の2次元領域内の複数の微小領域に対しそれぞれ質量分析を実行して収集される質量分析イメージジングデータを解析する質量分析データ解析方法及び解析装置に関する。
【背景技術】
【0002】
生体組織等の試料の形態観察を行うと同時に、その試料上の所定領域に存在する物質(分子)の分布を測定する装置として、顕微質量分析装置或いはイメージング質量分析装置などと呼ばれる装置が開発されている(非特許文献1など参照)。こうした装置によれば、試料をすり潰したり破砕したりすることなく試料の形態をほぼ維持したまま、顕微観察に基づいて指定された試料上の任意の領域に含まれる特定の質量電荷比m/zをもつイオンの分布画像(マッピング画像)を得ることが可能であり、特に、生化学分野、医療・薬学分野などにおいて、例えば生体内細胞に含まれる特定のタンパク質等の成分の分布情報を得るといった応用が期待されている。
【0003】
イメージング質量分析において試料に関する所望の情報、例えば試料を特徴付ける物質の種類やその濃度分布などを分析者が容易に把握できるようにするには、収集した質量分析イメージングデータに対して適切な解析処理を実行し、その結果を適切な態様で表示することが重要である。試料上の或る程度の面積の2次元領域に対する質量分析イメージングデータを取得した場合、このデータは多数の測定点(微小領域)のマススペクトルデータを含む。そのため、データの量は極めて膨大になる。このような膨大な量のデータから、人間が目で見て有意な情報を導出することは、多大な時間と労力とを要する。
【0004】
或る測定領域において特異的分布を示す質量電荷比を把握するには、一般的に、まず質量分析スペクトルデータに対しピーク検出を実行することにより解析対象ピークの質量電荷比を選出する(非特許文献2参照)。ピーク検出手法の一例としては、マススペクトル上で信号強度が高い順に指定された個数のピークを抽出し、このピークの質量電荷比を解析対象とする方法が知られている。この方法では、信号強度のみに依存したピーク選出が行われるため、同一物質に由来するモノアイソトピックピークや同位体ピークが互いに識別されることなく信号強度が或る程度以上大きいピークは全て選出されてしまう。そのため、マススペクトルから所定個数のピークを選出しても、実際には同じ物質由来の同位体ピークが含まれている(つまり選出されるピークが実質的に重複したものとなる)ことがよくある。これを避けるには、マススペクトトル上で同一物質由来のモノアイソトピックピークと同位体ピークとを識別する、又は、同一物質由来の複数の同位体ピークが属する同位体ピーク群を識別することが必要である。
【0005】
同一物質由来のモノアイソトピックピークと同位体ピークとが共存するマススペクトルにおいて、両ピークを識別する方法として特許文献1に記載の方法がある。これは、実測のマススペクトル上で1つの同位体ピーク群に属すると推定される複数の同位体ピークの強度比と各元素の天然同位体比などに基づいて理論的に計算される同位体ピークの強度比とを比較し、強度比が一致すると判断される同位体ピーク群を選別した上で、該同位体ピーク群に含まれるピークの中からモノアイソトピックイオンピークを選別するという方法である。しかしながら、この方法は基本的に1つのマススペクトルを対象とした処理を行うものである。そのため、この方法を質量分析イメージジングデータの解析に用いる場合には、1つの微小領域に対して得られたマススペクトル毎に同様の処理を繰り返し行う必要があり、この処理自体に膨大な時間が掛かる。また、得られる結果(ピークのm/z値)は各微小領域で別個になされた処理によるものであるため、イメージングデータとして扱うためには各微小領域の結果(m/z値)間に対応付けを行う必要があり面倒である。さらに、測定条件によっては複数の同位体ピークの強度比が理論通りにならない場合があるが、そうした場合には本方法を適用することができない。
【0006】
質量分析イメージングデータに限定したモノアイソトピックピーク/同位体ピークの識別方法としては、特許文献2に記載の方法がある。この方法では、マススペクトル上のピークの強度比を基に選出した同位体ピーク候補のマッピング画像をそれぞれ作成し、そのマッピング画像の類似性を判断して同一物質由来の同位体ピークが属する同位体クラスタとそれに含まれるモノアイソトピックピークとを決定するようにしている。しかしながら、複数のマッピング画像の類似性を自動的に判断することは難しいため、分析担当者が画像の類似性を目視で判断する作業が必要となるが、そうした判断には個人差が伴うので、結果の安定性や客観性を保つのが困難である。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】特開2006−284305号公報
【特許文献2】国際公開2008/126151号パンフレット
【非特許文献】
【0008】
【非特許文献1】小河潔、ほか5名、「顕微質量分析装置の開発」、島津評論、株式会社島津製作所、平成18年3月31日発行、第62巻、第3・4号、p.125-135
【非特許文献2】リアム(Liam A. McDonnell)、ほか4名、「イメージング・マス・スペクトロメトリー・データ・リダクション:オートメイテッド・フューチャー・アイデンティフィケイション・アンド・イクストラクション(Imaging Mass Spectrometry Data Reduction : Automated Feature Identification and Extraction)」、アメリカン・ソサイエティ・フォー・マス・スペクトロメトリー(American Society for Mass Spectrometry)、2010年、21、p.1969-1978
【発明の概要】
【発明が解決しようとする課題】
【0009】
本発明は上記課題を解決するためになされたものであり、その目的とするところは、イメージング質量分析により収集されたデータに対しピーク検出を実行し解析対象ピークの質量電荷比を求める際に、測定条件とは無関係に且つ分析担当者等の判断に依らずに、高い精度で以て同一物質由来のモノアイソトピックピーク/同位体ピークを識別してピーク選出を行うことができる質量分析データ解析方法及び解析装置を提供することにある。
【課題を解決するための手段】
【0010】
上記課題を解決するために成された第1発明は、試料上の2次元領域内に設定された複数の微小領域に対してそれぞれ所定質量電荷比範囲に亘る質量分析を実行することにより収集されたデータを解析処理する質量分析データ解析方法であって、
a)前記微小領域毎に得られるマススペクトルデータに対しピーク検出処理を実行してピークの強度と質量電荷比とを含むピーク情報を収集するピーク検出ステップと、
b)前記ピーク検出ステップにより得られた各微小領域のピーク情報を集め、全てのピークについて質量電荷比毎に空間強度分布を比較可能であるように、各微小領域における強度値を規格化する強度規格化ステップと、
c)前記強度規格化ステップによる規格化後の質量電荷比毎の空間強度分布に対してクラスタリングを用いることにより、前記ピーク情報に含まれる質量電荷比を所定数のクラスタに分類するクラスタリング実行ステップと、
d)同一クラスタに分類された複数の質量電荷比について、少なくともその質量電荷比の差を利用して同一物質由来のイオンの質量電荷比を識別する識別ステップと、
を有することを特徴としている。
【0011】
また第2発明に係る質量分析データ解析装置は、第1発明に係る質量分析データ解析方法を実施するための装置であって、試料上の2次元領域内に設定された複数の微小領域に対してそれぞれ所定質量電荷比範囲に亘る質量分析を実行することにより収集されたデータを解析処理する質量分析データ解析装置において、
a)前記微小領域毎に得られるマススペクトルデータに対しピーク検出処理を実行してピークの強度と質量電荷比とを含むピーク情報を収集するピーク検出手段と、
b)前記ピーク検出手段により得られた各微小領域のピーク情報を集め、全てのピークについて質量電荷比毎に空間強度分布を比較可能であるように、各微小領域における強度値を規格化する強度規格化手段と、
c)前記強度規格化手段による規格化後の質量電荷比毎の空間強度分布に対してクラスタリングを用いることにより、前記ピーク情報に含まれる質量電荷比を所定数のクラスタに分類するクラスタリング実行手段と、
d)同一クラスタに分類された複数の質量電荷比について、少なくともその質量電荷比の差を利用して同一物質由来のイオンの質量電荷比を識別する識別手段と、
を備えることを特徴としている。
【0012】
第1発明に係る質量分析データ解析方法の具体的な一態様として、上記識別ステップでは、同一クラスタに分類された複数の質量電荷比について、質量電荷比の差と前記規格化がなされない強度情報とを用いて同一物質由来の同位体群に属する質量電荷比を識別し、同一同位体群に属する複数の質量電荷比の中でモノアイソトピックピークに対応する質量電荷比のみを選出するものとすることができる。即ち、質量電荷比毎の空間強度分布に対するクラスタリングを利用して、各元素の主同位体(最も存在比の大きな安定同位体)のみを含むモノアイソトピックイオンに対応したピークと、主同位体以外の同位体を少なくとも一部含む同位体イオンに対応したピークとを識別することができる。
【0013】
また第1発明に係る質量分析データ解析方法の具体的な別の態様として、上記識別ステップではさらに、同一クラスタに分類された複数の質量電荷比について、質量電荷比の差を用いて同一物質由来の複数のアダクトイオンピークに対応する質量電荷比を識別し、同一物質由来の複数のアダクトイオンピークの中で1つのピークに対応する質量電荷比を選出するものとすることができる。なお、アダクトイオンとは目的とするイオンにNa、Kなどのアルカリ金属やアンモニア等の特定の成分が付加したイオンである。
【0014】
元素毎に同位体の天然存在比は決まっているため、同一物質由来であって構成元素の同位体のみが相違する各種イオンは、絶対的な強度はそれぞれ異なるものの、類似した空間強度分布を示す。そのため、各微小領域における強度値を規格化すると、空間強度分布における強度の絶対値の影響はなくなるから、同一物質に由来し同位体のみが異なる或いは別の成分が付加して質量電荷比が相違する空間強度分布において、クラスタリング手法でいうところの距離は小さくなる。それにより、クラスタリング実行ステップにおいてクラスタリングが実行されたときに、同一物質に由来する異なる質量電荷比の空間強度分布が同一クラスタとして分類される確率が高くなり、識別ステップにおいて例えば同一物質由来のモノアイソトピックイオンと同位体イオンにそれぞれ対応したピークを識別することが可能となる。
【0015】
なお、クラスタリング実行ステップにおいてクラスタリングを実行する際に、クラスタ数が少なすぎると1つのクラスタに入る質量電荷比の数が多すぎて同一物質由来イオンの識別精度の低下に繋がる。一方、クラスタ数が多すぎると同一物質に由来するイオンの空間強度分布が異なるクラスタに入ってしまう可能性が高まり、やはり識別精度の低下に繋がる。こうした問題に対しては、クラスタ数を予め指定するのではなく、クラスタリング実行ステップにおいてクラスタリングを実行する際に例えば分散分析法を用いて最適又はそれに近いクラスタ数を自動的に決定するようにするとよい。
【発明の効果】
【0016】
本発明に係る質量分析データ解析方法及び解析装置によれば、上述したように質量電荷比毎の空間強度分布の絶対的な強度の影響は排除されるため、同位体イオンの強度比が理論通りにならないような測定条件の下で取得されたデータについても、高い精度で以て同一物質由来のモノアイソトピックイオンと同位体イオンとを識別して目的とするモノアイソトピックピークを選出したり、高い精度で以て同一物質由来の複数のアダクトピークの中から1つを選出したりすることができる。また、従来一般的に、生体試料の質量分析を行うに際し、不要なアダクトイオンの発生を防止するために特殊な前処理を行う場合もあるが、本発明によれば、こうした前処理を行わなくても不要なアダクトイオンピークを除去できるので、前処理の手間を省くことができる。
【0017】
さらにまた、本発明に係る質量分析データ解析方法及び解析装置によれば、質量電荷比毎の空間強度分布を分析担当者が目視で比較・判断する必要がないので、分析担当者の負担が軽減される、分析担当者の経験や技量に依存しない安定性・正確性の高いモノアイソトピックピーク/同位体ピーク識別が可能である、高いスループットを実現できる、といった利点もある。
【図面の簡単な説明】
【0018】
【図1】本発明に係る質量分析データ解析装置を利用したイメージング質量分析装置の一実施例の概略構成図。
【図2】本実施例のイメージング質量分析装置におけるマススペクトルデータ収集動作の概略説明図。
【図3】本実施例のイメージング質量分析装置における特徴的なデータ解析動作のフローチャート。
【図4】ピクセル空間におけるノルム規格化の説明図。
【図5】m/z値毎のノルム規格化の説明図。
【図6】マウス網膜を試料として得られたマススペクトルデータから抽出されたリン脂質由来ピークの例。
【図7】データの規格化を行わずにHCAを試みた場合における各クラスタに分類された空間強度分布とクラスタ内平均空間強度分布を示す図。
【図8】データの規格化を行わずにHCAを試みた場合における各クラスタに分類された空間強度分布とクラスタ内平均空間強度分布を示す図。
【図9】データの規格化を行わずにHCAを試みた場合における各クラスタでのピーク選別結果を示す図。
【図10】データの規格化を実施した上でHCAを試みた場合における各クラスタに分類された空間強度分布とクラスタ内平均空間強度分布を示す図。
【図11】データの規格化を実施した上でHCAを試みた場合における各クラスタに分類された空間強度分布とクラスタ内平均空間強度分布を示す図。
【図12】データの規格化を実施した上でHCAを試みた場合における各クラスタでのピーク選別結果を示す図。
【図13】本発明によるピーク識別・除去処理適用前及び適用後の平均マススペクトルを示す図。
【発明を実施するための形態】
【0019】
以下、本発明に係る質量分析データ解析装置を用いたイメージング質量分析装置の一実施例について、添付図面を参照して説明する。図1は本実施例によるイメージング質量分析装置の概略構成図である。
【0020】
このイメージング質量分析装置は、試料8上の2次元測定対象領域8aの顕微観察を行うとともに該領域8a内のイメージング質量分析を実行するイメージング質量分析本体部1と、イメージング質量分析本体部1で収集された質量分析スペクトルデータを解析処理するデータ処理部2と、質量分析スペクトルデータを記憶しておくデータ記憶部3と、イメージング質量分析本体部1で撮影された画像信号を処理して顕微画像を構成する顕微画像処理部4と、それら各部を制御する制御部5と、制御部5に接続された操作部6及び表示部7と、を備える。
【0021】
イメージング質量分析本体部1は例えば、非特許文献1などに記載のように、MALDIイオン源、イオン輸送光学系、イオントラップ、飛行時間型質量分析器、などを含み、所定サイズの微小領域に対する所定質量電荷比範囲に亘る質量分析を実行する。図示しないが、イメージング質量分析本体部1は試料8が載置されたステージを互いに直交するx、yの2軸方向に高精度で移動させる駆動部を含み、試料8を所定ステップ幅で移動させる毎に所定質量電荷比範囲に亘る質量分析を実行することにより、任意の2次元測定対象領域8aに対する質量分析スペクトルデータの収集が可能である。なお、データ処理部2、データ記憶部3、顕微画像処理部4、制御部5、などの機能の少なくとも一部は、パーソナルコンピュータに搭載された専用の処理・制御ソフトウエアを実行することにより達成される。
【0022】
本実施例のイメージング質量分析装置は、イメージング質量分析本体部1により収集された膨大な量の質量分析スペクトルデータを解析処理して表示部7の画面上に表示するデータ処理部2におけるデータ解析処理にその特徴を有する。この特徴的なデータ解析処理の一例について、図2及び図3により詳細に説明する。図2は本実施例のイメージング質量分析装置におけるマススペクトルデータ収集動作の概略説明図、図3は本実施例のイメージング質量分析装置における特徴的なデータ解析手順を示すフローチャートである。
【0023】
イメージング質量分析本体部1では、図2に示すように、試料8上に設定された所定の2次元測定対象領域8a内をx方向、y方向にそれぞれ細かく区分した微小領域8b毎にマススペクトルデータが得られる。このマススペクトルデータは所定の質量電荷比範囲に亘る強度信号を示すマススペクトルを構成するデータである。なお、微小領域8bは図2に示すように2次元測定対象領域8a内全体に密に設けられていなくてもよく、例えば疎らに存在していてもよい。
【0024】
通常、微小領域8bの1辺の長さは試料8が載置されたステージの移動ステップ幅により決まる。後述する或る質量電荷比における空間強度分布を示すマッピング画像では、1個の微小領域8b毎にカラー2次元表示画像上の表示色が定められる。したがって、色付けなどの画像処理上ではこの微小領域が最小単位となるので、画像処理上のピクセルと微小領域とは同義であり、以下の説明では微小領域をピクセルと呼ぶ。即ち、図2に示すように、ここでは2次元測定対象領域8a内に格子状にピクセルが配列されている。
【0025】
2次元測定対象領域8aに対する質量分析イメージングデータ(以下の説明ではピクセル毎のマススペクトルデータであるが、これはMS2スペクトルデータ等のMSnスペクトルデータでもよい)がデータ記憶部3に格納されている状態でデータ解析処理の開始が指示されると、まずデータ処理部2はデータ記憶部3から処理対象である質量分析イメージングデータを読み込み(ステップS1)、マススペクトル毎に、つまり各ピクセルに対するデータ毎に、ピークピッキング処理を実行して有意なピークを抽出する(ステップS2)。具体的には、マススペクトル毎に、例えば信号強度が高いピークから順に所定個数のピークを選別する。これにより、信号強度の小さなノイズピークは除去される。なお、ピークピッキングの手法はこれに限るものでなく、例えば、信号強度が高くても予め指定された特定のm/zやm/z範囲のピークは選出から除外する、逆に、信号強度が低くても予め指定された特定のm/zやm/z範囲のピークは優先的に選出する、といった処理を加えることも考えられる。
【0026】
上述のようにピクセル毎にピークピッキングを行って得られるデータ、つまりピーク情報は、ピークのm/z値と強度値とである。そこで、このデータを、縦方向にピクセル番号、横方向にm/z値をとり、各要素をピークの強度値とするデータマトリクスの形式に整理する(ステップS3)。もちろん、行と列とは入れ替え可能である。図5(a)はデータマトリクスの一例であり、この図ではM1、M2、…がm/z値であり、P11、P12、…がピークの強度値である。
【0027】
次に、データマトリクス上のデータについて必要に応じてスケーリングを実行する(ステップS4)。スケーリングは、例えば極端に強度の大きなデータがあった場合に、解析がそれに支配されすぎないようにするために行われる。具体的なスケーリングの手法としては、平均値や標準偏差がデータに反映されるようにするために、まず全ての強度値の平均を計算してこれを各強度値から減算し(つまり平均中心化が行われ)、次いで強度値の分散(標準偏差)で除するような手法が挙げられる。しかしながら一般に、マススペクトルピークのようなデータに対してはパレートスケーリングがより有利である。パレートスケーリングでは、平均中心化が行われた後、その値は分散の平方根で除される。
【0028】
次に、スケーリングのなされた又はなされていないデータマトリクス中のデータに対し、各m/z値についてのピクセル空間における強度のノルム(つまりデータマトリクスの各行のノルムを1にする)ように強度値を規格化する(ステップS5)。
【0029】
図4はピクセル空間における強度のノルム規格化の概念を示す図である。図4はX1、X2、X3の3個のピクセルにおける強度を3軸とするピクセル空間において、ピクセルX2に存在するm/z700,m/z701,m/z702の3つの同位体イオンのプロット点を示すもので、(a)は規格化前、(b)は規格化後である。規格化前の状態では、図4(a)に示すように、強度の相違する3つの同位体イオンm/z700,m/z701,m/z702に対応するプロット点はX2軸上の異なる位置に存在する。ピクセル空間における強度のノルムを1にすることは、各プロット点における強度をそれ自身で除することを意味する。そのため、規格化後には、図4(b)に示すように、3つの同位体イオンm/z700,m/z701,m/z702に対応するプロット点はX2軸上の同一点に重なる。ピクセル空間内の任意のプロット点は全て半径が1である球面状に位置するようになる。
【0030】
具体的には、図5(a)に示すデータマトリクスでは、縦方向の1列が或る特定のm/z値に対するピクセル空間上の強度値であるから、この縦方向のノルムをそれぞれ求め(この例ではQ1、Q2、…)、各m/z値毎に上記の求めたノルムで各強度値を除する(図5(b)参照)。これによってm/z値毎にノルムが1であるように全ての強度値が規格化される。
【0031】
次に、上記のようにm/z値毎にノルムが1になるように規格化されたデータマトリスクに対し、m/z方向に階層的クラスタリング(HCA)を行うことにより、m/z値又はm/z値毎の空間強度分布(つまりはデータマトリクスの1列毎のデータ集合)を複数のクラスタに分類する(ステップS6)。このときに、クラスタの数は予め設定せずに、例えば分散分析法などの既知の様々な手法のいずれかにより自動的に決定するようにし、分析担当者等による外部からの入力設定は不要とする。
【0032】
同位体ピーク群(同一物質から発生し構成元素の同位体のみが相違するイオンに由来する複数のピーク)に属するピークのm/z値の空間強度分布は、それぞれ絶対的な強度は異なるものの、いずれも類似した空間分布を示す。データマトリクスにおいてノルムを1(又は他の所定値)にするように各強度値を規格化することは、強度の絶対値の影響を排除して空間強度分布を比較可能とする意味を持つ。そのため、ステップS5の規格化処理により、規格化前と比較して同位体ピーク間の距離(例えばユークリッド距離などの階層的クラスタリングに使用される距離)が小さくなるから、階層的クラスタリングにおいて同一クラスタにまとめられる可能性が高くなる。その結果、同位体ピーク群を含む類似した空間強度分布をもつピークのm/z値が同一クラスタにまとめられることになる。
【0033】
また、質量分析では、目的分子のイオン化の過程で該イオンに様々な成分が付加したアダクトイオンが生成されることがあるが、こうしたアダクトイオンピークのm/z値の空間強度分布も、それぞれ絶対的な強度は異なるものの、いずれも類似した空間分布を示す。したがって、上記のような規格化後に階層的クラスタリングを実行することにより、同一物質由来で異なるm/zを持つアダクトイオンピークのm/z値も高い確率で同一クラスタにまとめられることになる。
【0034】
ここで、図3に示すデータ処理をマウス網膜切片を試料として収集された質量分析イメージングデータに対して適用した場合の実例を挙げる。この質量分析イメージングデータから測定対象の全領域に対するm/z値毎の最大強度を求めて最大強度マススペクトルを作成し、該マススペクトルから強度が上位である100個のピークをピッキングしたところ、図6に示す5種類のリン脂質とみられるピークが選出された。また、図6に示すように、それら5種類のプロトン付加イオン([M+H]+)のほか、質量電荷比差からみてナトリウム付加イオン、カリウム付加イオンとみられるイオンもそれぞれ観測された。
【0035】
上記のように選出したピークのm/z値を図5(a)に示すm/z値、M1、M2、…としてデータマトリクスを作成し、ステップS5の規格化の処理を行わずにステップS6の階層的クラスタリングを実行した。階層的クラスタリングでは、個体間距離を標準化ユークリッド距離とし、クラスタ間距離をウォード法による定義によるものとした。この場合、不整合係数により判断した最適クラスタ数は4となり、全てのm/z値が4つのクラスタのいずれかに分類された。図7及び図8は、このときの[1]〜[4]の各クラスタに分類されたm/z値に対応する空間強度分布画像(マッピング画像)及びクラスタ内平均空間強度分布画像を示す図である。図7から分かるように、クラスタ[1]と[2]とに含まれる空間強度分布画像はかなり類似しているにも拘わらず2つのクラスタに分けられてしまっている。逆に、クラスタ[3]や[4]では、かなり異なる傾向の空間強度分布画像が同一クラスタ内に分類されてしまっている。
【0036】
図9は図7及び図8に示したクラスタリング結果に基づくピーク識別結果を示す図である。図9において○印等の記号で示したm/z値は図6に示したリン脂質由来のイオンピークに対応したものである。この5種類のリン脂質由来のイオンピークに着目すると、同一物質由来であるにも拘わらず異なるクラスタに分類されてしまっている。こうしたことから、ステップS5の処理を省略した階層的クラスタリングでは、同一物質由来の同位体ピーク群やアダクトイオンピークが同一クラスタに集約されず、このクラスタリング結果から以降の同位体イオン・アダクトイオン識別処理を実行しても正しい結果が得られないことが分かる。
【0037】
一方、図10及び図11は、ステップS5の規格化の処理を行った上でステップS6の階層的クラスタリングを実行した場合における、[1]〜[4]の各クラスタに分類されたm/z値に対応する空間強度分布画像及びクラスタ内平均空間強度分布画像を示す図である。図10及び図11から、類似した空間強度分布を示すm/z値は同じクラスタに集約されており、クラスタ毎に空間強度分布の傾向の相違が顕著であることが分かる。この結果からだけでも、同一物質由来の同位体イオンやアダクトイオンピークが同一クラスタに含まれている可能性が高いことが見てとれる。
【0038】
図3に戻り説明を続けると、上述のようにデータマトリクス上の全てのm/z値を複数のクラスタに分類した後、各クラスタ内で同位体ピーク群を見つける。具体的には、イオンの価数が1である場合には同位体イオン同士の質量電荷比差は1Daであるから、同一クラスタ内で約1Da差であるm/z値が存在するか否かを調べ、存在したならばそれらを同位体ピーク群候補とであるとみなし、その中で最小のm/z値をモノアイソトピックピーク候補とみなす。ただし、全く異なる物質由来のイオン同士のm/z値差が偶然に1Da程度になることはあり得るから、上記候補が実際に同位体ピーク群であるか否かを確認するために、強度比の情報を利用する。具体的には、同位体ピーク群に含まれるピークの中のモノアイソトピック候補のピーク強度から、同位体の天然存在比に基づいて理論的な同位体ピーク強度比を算出し、この理論比と実際の同位体ピーク群候補の強度比とを比較することにより、真の同位体ピーク群とみなせるか否かを判定する。そして、実際の同位体ピーク群であると判定された場合には、モノアイソトピックピークに対応するm/z値のみを残し他の同位体ピーク情報を消去する。一方、約1Daのm/z値のピーク群でありながら同位体ピーク群でない場合には、いずれのピーク情報も消去せずに残す(ステップS7)。
【0039】
図12は図10及び図11に示したクラスタリング結果に基づくピーク識別結果を示す図である。図12において背景を塗り潰したセル内のm/z値は上記処理により除去されたピークを表す。○印等の記号で示したm/z値は図6に示したリン脂質由来のイオンピークに対応したものである。また、同位体ピークであると判定された場合には'isotopic'、アダクトイオンピークであるとあると判定された場合には'M+H'、'M+Na'、'M+K' を、各m/z値の下に記載している。この図12を見れば、同位体イオンが存在する場合にはモノアイソトピックピークを残し、それ以外のピークが消去されたことが分かる。なお、同位体ピーク群を構成しない単独ピークの情報については、消去せずにそのまま残す。
【0040】
なお、同位体ピークの強度算出手法の一例としては、従来、アミノ酸配列の元素組成を算出するために用いられているアベレージネ(Averagine)モデルを用いてもよい。アベレージネモデルの詳細は、センコ(Michel W. Senko)ほか、「デターミネイション・オブ・モノアイソトピック・マシズ・アンド・イオン・ポピュレイションズ・フォー・ラージ・バイオモレキュルズ・フロム・リゾルブド・アイソトピック・ディストリビューションズ (Determination of monoisotopic masses and ion populations for large biomolecules from resolved isotopic distributions)」、ジャーナル・オブ・アメリカン・ソサイエティ・マス・スペクトロメトリー(Journal of American Soc. Mass Spectom.)、6、1995年、pp.229-233等の文献に開示されている。
【0041】
次に、ステップS7の処理により残された各クラスタ内のピークにおいて、既知のアダクトイオンの質量電荷比差に相当するピーク対を見つけ、これを同一物質由来のアダクトイオンピーク群候補とみなす。そして、このうち全測定領域での平均強度が最も大きいピークを代表の単一ピークとして残し、他のアダクトイオンピーク情報を消去する(ステップS8)。図12の結果を見れば、階層的クラスタリングにより図6に示した5種類のリン脂質アダクトイオンピークは同一のクラスタに集約されていたため、質量電荷比差によるアダクトイオンピークが的確に識別できていることが分かる。
【0042】
ステップS7、S8により、同一物質由来であって重複しているとみなせるピーク(m/z値)が除去されたならば、残された各クラスタのピークを集約し、このピーク情報からステップS3で作成したものと同様の形式のデータマトリクスを再構成する(ステップS9)。これにより、同位体ピークやアダクトイオンピークなど、解析に有用でないピーク情報を削除して情報量を減らしたデータマトリクスを得ることができるから、再構成されたデータマトリクスに基づいて例えば特異的分布を示すm/z値のマッピング画像を精度よく取得することが可能となる。
【0043】
図13は上記例の平均マススペクトルであり、(a)は上述した同位体イオン・アダクトイオンピーク除去処理実行前の状態、(b)は同位体イオン・アダクトイオンピーク除去処理実行後の状態である。なお、図中に○印等の記号で示したm/z値は図6に示したリン脂質由来のイオンピークに対応したものである。図13から、図6中の5種類のリン脂質由来アダクトイオンピークそれぞれにおいて、平均強度が最も大きいピーク以外を消去できたことが確認できる。なお、この例では、上述した同位体イオン・アダクトイオンピーク除去処理によって、100個のピークのうち35個のピークが消去されている。
【0044】
上記実施例は本発明の一例にすぎず、本発明の趣旨の範囲で適宜変形、修正、追加を行っても本願特許請求の範囲に包含されることは当然である。例えば、上記実施例では、クラスリングとして階層的クラスタリングを実行していたが、非階層的クラスタリングを利用してもよい。
【符号の説明】
【0045】
1…イメージング質量分析本体部
2…データ処理部
3…データ記憶部
4…顕微画像処理部
5…制御部
6…操作部
7…表示部
8…試料
8a…2次元測定対象領域
8b…微小領域(ピクセル)
【技術分野】
【0001】
本発明は、試料の2次元領域内の複数の微小領域に対しそれぞれ質量分析を実行して収集される質量分析イメージジングデータを解析する質量分析データ解析方法及び解析装置に関する。
【背景技術】
【0002】
生体組織等の試料の形態観察を行うと同時に、その試料上の所定領域に存在する物質(分子)の分布を測定する装置として、顕微質量分析装置或いはイメージング質量分析装置などと呼ばれる装置が開発されている(非特許文献1など参照)。こうした装置によれば、試料をすり潰したり破砕したりすることなく試料の形態をほぼ維持したまま、顕微観察に基づいて指定された試料上の任意の領域に含まれる特定の質量電荷比m/zをもつイオンの分布画像(マッピング画像)を得ることが可能であり、特に、生化学分野、医療・薬学分野などにおいて、例えば生体内細胞に含まれる特定のタンパク質等の成分の分布情報を得るといった応用が期待されている。
【0003】
イメージング質量分析において試料に関する所望の情報、例えば試料を特徴付ける物質の種類やその濃度分布などを分析者が容易に把握できるようにするには、収集した質量分析イメージングデータに対して適切な解析処理を実行し、その結果を適切な態様で表示することが重要である。試料上の或る程度の面積の2次元領域に対する質量分析イメージングデータを取得した場合、このデータは多数の測定点(微小領域)のマススペクトルデータを含む。そのため、データの量は極めて膨大になる。このような膨大な量のデータから、人間が目で見て有意な情報を導出することは、多大な時間と労力とを要する。
【0004】
或る測定領域において特異的分布を示す質量電荷比を把握するには、一般的に、まず質量分析スペクトルデータに対しピーク検出を実行することにより解析対象ピークの質量電荷比を選出する(非特許文献2参照)。ピーク検出手法の一例としては、マススペクトル上で信号強度が高い順に指定された個数のピークを抽出し、このピークの質量電荷比を解析対象とする方法が知られている。この方法では、信号強度のみに依存したピーク選出が行われるため、同一物質に由来するモノアイソトピックピークや同位体ピークが互いに識別されることなく信号強度が或る程度以上大きいピークは全て選出されてしまう。そのため、マススペクトルから所定個数のピークを選出しても、実際には同じ物質由来の同位体ピークが含まれている(つまり選出されるピークが実質的に重複したものとなる)ことがよくある。これを避けるには、マススペクトトル上で同一物質由来のモノアイソトピックピークと同位体ピークとを識別する、又は、同一物質由来の複数の同位体ピークが属する同位体ピーク群を識別することが必要である。
【0005】
同一物質由来のモノアイソトピックピークと同位体ピークとが共存するマススペクトルにおいて、両ピークを識別する方法として特許文献1に記載の方法がある。これは、実測のマススペクトル上で1つの同位体ピーク群に属すると推定される複数の同位体ピークの強度比と各元素の天然同位体比などに基づいて理論的に計算される同位体ピークの強度比とを比較し、強度比が一致すると判断される同位体ピーク群を選別した上で、該同位体ピーク群に含まれるピークの中からモノアイソトピックイオンピークを選別するという方法である。しかしながら、この方法は基本的に1つのマススペクトルを対象とした処理を行うものである。そのため、この方法を質量分析イメージジングデータの解析に用いる場合には、1つの微小領域に対して得られたマススペクトル毎に同様の処理を繰り返し行う必要があり、この処理自体に膨大な時間が掛かる。また、得られる結果(ピークのm/z値)は各微小領域で別個になされた処理によるものであるため、イメージングデータとして扱うためには各微小領域の結果(m/z値)間に対応付けを行う必要があり面倒である。さらに、測定条件によっては複数の同位体ピークの強度比が理論通りにならない場合があるが、そうした場合には本方法を適用することができない。
【0006】
質量分析イメージングデータに限定したモノアイソトピックピーク/同位体ピークの識別方法としては、特許文献2に記載の方法がある。この方法では、マススペクトル上のピークの強度比を基に選出した同位体ピーク候補のマッピング画像をそれぞれ作成し、そのマッピング画像の類似性を判断して同一物質由来の同位体ピークが属する同位体クラスタとそれに含まれるモノアイソトピックピークとを決定するようにしている。しかしながら、複数のマッピング画像の類似性を自動的に判断することは難しいため、分析担当者が画像の類似性を目視で判断する作業が必要となるが、そうした判断には個人差が伴うので、結果の安定性や客観性を保つのが困難である。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】特開2006−284305号公報
【特許文献2】国際公開2008/126151号パンフレット
【非特許文献】
【0008】
【非特許文献1】小河潔、ほか5名、「顕微質量分析装置の開発」、島津評論、株式会社島津製作所、平成18年3月31日発行、第62巻、第3・4号、p.125-135
【非特許文献2】リアム(Liam A. McDonnell)、ほか4名、「イメージング・マス・スペクトロメトリー・データ・リダクション:オートメイテッド・フューチャー・アイデンティフィケイション・アンド・イクストラクション(Imaging Mass Spectrometry Data Reduction : Automated Feature Identification and Extraction)」、アメリカン・ソサイエティ・フォー・マス・スペクトロメトリー(American Society for Mass Spectrometry)、2010年、21、p.1969-1978
【発明の概要】
【発明が解決しようとする課題】
【0009】
本発明は上記課題を解決するためになされたものであり、その目的とするところは、イメージング質量分析により収集されたデータに対しピーク検出を実行し解析対象ピークの質量電荷比を求める際に、測定条件とは無関係に且つ分析担当者等の判断に依らずに、高い精度で以て同一物質由来のモノアイソトピックピーク/同位体ピークを識別してピーク選出を行うことができる質量分析データ解析方法及び解析装置を提供することにある。
【課題を解決するための手段】
【0010】
上記課題を解決するために成された第1発明は、試料上の2次元領域内に設定された複数の微小領域に対してそれぞれ所定質量電荷比範囲に亘る質量分析を実行することにより収集されたデータを解析処理する質量分析データ解析方法であって、
a)前記微小領域毎に得られるマススペクトルデータに対しピーク検出処理を実行してピークの強度と質量電荷比とを含むピーク情報を収集するピーク検出ステップと、
b)前記ピーク検出ステップにより得られた各微小領域のピーク情報を集め、全てのピークについて質量電荷比毎に空間強度分布を比較可能であるように、各微小領域における強度値を規格化する強度規格化ステップと、
c)前記強度規格化ステップによる規格化後の質量電荷比毎の空間強度分布に対してクラスタリングを用いることにより、前記ピーク情報に含まれる質量電荷比を所定数のクラスタに分類するクラスタリング実行ステップと、
d)同一クラスタに分類された複数の質量電荷比について、少なくともその質量電荷比の差を利用して同一物質由来のイオンの質量電荷比を識別する識別ステップと、
を有することを特徴としている。
【0011】
また第2発明に係る質量分析データ解析装置は、第1発明に係る質量分析データ解析方法を実施するための装置であって、試料上の2次元領域内に設定された複数の微小領域に対してそれぞれ所定質量電荷比範囲に亘る質量分析を実行することにより収集されたデータを解析処理する質量分析データ解析装置において、
a)前記微小領域毎に得られるマススペクトルデータに対しピーク検出処理を実行してピークの強度と質量電荷比とを含むピーク情報を収集するピーク検出手段と、
b)前記ピーク検出手段により得られた各微小領域のピーク情報を集め、全てのピークについて質量電荷比毎に空間強度分布を比較可能であるように、各微小領域における強度値を規格化する強度規格化手段と、
c)前記強度規格化手段による規格化後の質量電荷比毎の空間強度分布に対してクラスタリングを用いることにより、前記ピーク情報に含まれる質量電荷比を所定数のクラスタに分類するクラスタリング実行手段と、
d)同一クラスタに分類された複数の質量電荷比について、少なくともその質量電荷比の差を利用して同一物質由来のイオンの質量電荷比を識別する識別手段と、
を備えることを特徴としている。
【0012】
第1発明に係る質量分析データ解析方法の具体的な一態様として、上記識別ステップでは、同一クラスタに分類された複数の質量電荷比について、質量電荷比の差と前記規格化がなされない強度情報とを用いて同一物質由来の同位体群に属する質量電荷比を識別し、同一同位体群に属する複数の質量電荷比の中でモノアイソトピックピークに対応する質量電荷比のみを選出するものとすることができる。即ち、質量電荷比毎の空間強度分布に対するクラスタリングを利用して、各元素の主同位体(最も存在比の大きな安定同位体)のみを含むモノアイソトピックイオンに対応したピークと、主同位体以外の同位体を少なくとも一部含む同位体イオンに対応したピークとを識別することができる。
【0013】
また第1発明に係る質量分析データ解析方法の具体的な別の態様として、上記識別ステップではさらに、同一クラスタに分類された複数の質量電荷比について、質量電荷比の差を用いて同一物質由来の複数のアダクトイオンピークに対応する質量電荷比を識別し、同一物質由来の複数のアダクトイオンピークの中で1つのピークに対応する質量電荷比を選出するものとすることができる。なお、アダクトイオンとは目的とするイオンにNa、Kなどのアルカリ金属やアンモニア等の特定の成分が付加したイオンである。
【0014】
元素毎に同位体の天然存在比は決まっているため、同一物質由来であって構成元素の同位体のみが相違する各種イオンは、絶対的な強度はそれぞれ異なるものの、類似した空間強度分布を示す。そのため、各微小領域における強度値を規格化すると、空間強度分布における強度の絶対値の影響はなくなるから、同一物質に由来し同位体のみが異なる或いは別の成分が付加して質量電荷比が相違する空間強度分布において、クラスタリング手法でいうところの距離は小さくなる。それにより、クラスタリング実行ステップにおいてクラスタリングが実行されたときに、同一物質に由来する異なる質量電荷比の空間強度分布が同一クラスタとして分類される確率が高くなり、識別ステップにおいて例えば同一物質由来のモノアイソトピックイオンと同位体イオンにそれぞれ対応したピークを識別することが可能となる。
【0015】
なお、クラスタリング実行ステップにおいてクラスタリングを実行する際に、クラスタ数が少なすぎると1つのクラスタに入る質量電荷比の数が多すぎて同一物質由来イオンの識別精度の低下に繋がる。一方、クラスタ数が多すぎると同一物質に由来するイオンの空間強度分布が異なるクラスタに入ってしまう可能性が高まり、やはり識別精度の低下に繋がる。こうした問題に対しては、クラスタ数を予め指定するのではなく、クラスタリング実行ステップにおいてクラスタリングを実行する際に例えば分散分析法を用いて最適又はそれに近いクラスタ数を自動的に決定するようにするとよい。
【発明の効果】
【0016】
本発明に係る質量分析データ解析方法及び解析装置によれば、上述したように質量電荷比毎の空間強度分布の絶対的な強度の影響は排除されるため、同位体イオンの強度比が理論通りにならないような測定条件の下で取得されたデータについても、高い精度で以て同一物質由来のモノアイソトピックイオンと同位体イオンとを識別して目的とするモノアイソトピックピークを選出したり、高い精度で以て同一物質由来の複数のアダクトピークの中から1つを選出したりすることができる。また、従来一般的に、生体試料の質量分析を行うに際し、不要なアダクトイオンの発生を防止するために特殊な前処理を行う場合もあるが、本発明によれば、こうした前処理を行わなくても不要なアダクトイオンピークを除去できるので、前処理の手間を省くことができる。
【0017】
さらにまた、本発明に係る質量分析データ解析方法及び解析装置によれば、質量電荷比毎の空間強度分布を分析担当者が目視で比較・判断する必要がないので、分析担当者の負担が軽減される、分析担当者の経験や技量に依存しない安定性・正確性の高いモノアイソトピックピーク/同位体ピーク識別が可能である、高いスループットを実現できる、といった利点もある。
【図面の簡単な説明】
【0018】
【図1】本発明に係る質量分析データ解析装置を利用したイメージング質量分析装置の一実施例の概略構成図。
【図2】本実施例のイメージング質量分析装置におけるマススペクトルデータ収集動作の概略説明図。
【図3】本実施例のイメージング質量分析装置における特徴的なデータ解析動作のフローチャート。
【図4】ピクセル空間におけるノルム規格化の説明図。
【図5】m/z値毎のノルム規格化の説明図。
【図6】マウス網膜を試料として得られたマススペクトルデータから抽出されたリン脂質由来ピークの例。
【図7】データの規格化を行わずにHCAを試みた場合における各クラスタに分類された空間強度分布とクラスタ内平均空間強度分布を示す図。
【図8】データの規格化を行わずにHCAを試みた場合における各クラスタに分類された空間強度分布とクラスタ内平均空間強度分布を示す図。
【図9】データの規格化を行わずにHCAを試みた場合における各クラスタでのピーク選別結果を示す図。
【図10】データの規格化を実施した上でHCAを試みた場合における各クラスタに分類された空間強度分布とクラスタ内平均空間強度分布を示す図。
【図11】データの規格化を実施した上でHCAを試みた場合における各クラスタに分類された空間強度分布とクラスタ内平均空間強度分布を示す図。
【図12】データの規格化を実施した上でHCAを試みた場合における各クラスタでのピーク選別結果を示す図。
【図13】本発明によるピーク識別・除去処理適用前及び適用後の平均マススペクトルを示す図。
【発明を実施するための形態】
【0019】
以下、本発明に係る質量分析データ解析装置を用いたイメージング質量分析装置の一実施例について、添付図面を参照して説明する。図1は本実施例によるイメージング質量分析装置の概略構成図である。
【0020】
このイメージング質量分析装置は、試料8上の2次元測定対象領域8aの顕微観察を行うとともに該領域8a内のイメージング質量分析を実行するイメージング質量分析本体部1と、イメージング質量分析本体部1で収集された質量分析スペクトルデータを解析処理するデータ処理部2と、質量分析スペクトルデータを記憶しておくデータ記憶部3と、イメージング質量分析本体部1で撮影された画像信号を処理して顕微画像を構成する顕微画像処理部4と、それら各部を制御する制御部5と、制御部5に接続された操作部6及び表示部7と、を備える。
【0021】
イメージング質量分析本体部1は例えば、非特許文献1などに記載のように、MALDIイオン源、イオン輸送光学系、イオントラップ、飛行時間型質量分析器、などを含み、所定サイズの微小領域に対する所定質量電荷比範囲に亘る質量分析を実行する。図示しないが、イメージング質量分析本体部1は試料8が載置されたステージを互いに直交するx、yの2軸方向に高精度で移動させる駆動部を含み、試料8を所定ステップ幅で移動させる毎に所定質量電荷比範囲に亘る質量分析を実行することにより、任意の2次元測定対象領域8aに対する質量分析スペクトルデータの収集が可能である。なお、データ処理部2、データ記憶部3、顕微画像処理部4、制御部5、などの機能の少なくとも一部は、パーソナルコンピュータに搭載された専用の処理・制御ソフトウエアを実行することにより達成される。
【0022】
本実施例のイメージング質量分析装置は、イメージング質量分析本体部1により収集された膨大な量の質量分析スペクトルデータを解析処理して表示部7の画面上に表示するデータ処理部2におけるデータ解析処理にその特徴を有する。この特徴的なデータ解析処理の一例について、図2及び図3により詳細に説明する。図2は本実施例のイメージング質量分析装置におけるマススペクトルデータ収集動作の概略説明図、図3は本実施例のイメージング質量分析装置における特徴的なデータ解析手順を示すフローチャートである。
【0023】
イメージング質量分析本体部1では、図2に示すように、試料8上に設定された所定の2次元測定対象領域8a内をx方向、y方向にそれぞれ細かく区分した微小領域8b毎にマススペクトルデータが得られる。このマススペクトルデータは所定の質量電荷比範囲に亘る強度信号を示すマススペクトルを構成するデータである。なお、微小領域8bは図2に示すように2次元測定対象領域8a内全体に密に設けられていなくてもよく、例えば疎らに存在していてもよい。
【0024】
通常、微小領域8bの1辺の長さは試料8が載置されたステージの移動ステップ幅により決まる。後述する或る質量電荷比における空間強度分布を示すマッピング画像では、1個の微小領域8b毎にカラー2次元表示画像上の表示色が定められる。したがって、色付けなどの画像処理上ではこの微小領域が最小単位となるので、画像処理上のピクセルと微小領域とは同義であり、以下の説明では微小領域をピクセルと呼ぶ。即ち、図2に示すように、ここでは2次元測定対象領域8a内に格子状にピクセルが配列されている。
【0025】
2次元測定対象領域8aに対する質量分析イメージングデータ(以下の説明ではピクセル毎のマススペクトルデータであるが、これはMS2スペクトルデータ等のMSnスペクトルデータでもよい)がデータ記憶部3に格納されている状態でデータ解析処理の開始が指示されると、まずデータ処理部2はデータ記憶部3から処理対象である質量分析イメージングデータを読み込み(ステップS1)、マススペクトル毎に、つまり各ピクセルに対するデータ毎に、ピークピッキング処理を実行して有意なピークを抽出する(ステップS2)。具体的には、マススペクトル毎に、例えば信号強度が高いピークから順に所定個数のピークを選別する。これにより、信号強度の小さなノイズピークは除去される。なお、ピークピッキングの手法はこれに限るものでなく、例えば、信号強度が高くても予め指定された特定のm/zやm/z範囲のピークは選出から除外する、逆に、信号強度が低くても予め指定された特定のm/zやm/z範囲のピークは優先的に選出する、といった処理を加えることも考えられる。
【0026】
上述のようにピクセル毎にピークピッキングを行って得られるデータ、つまりピーク情報は、ピークのm/z値と強度値とである。そこで、このデータを、縦方向にピクセル番号、横方向にm/z値をとり、各要素をピークの強度値とするデータマトリクスの形式に整理する(ステップS3)。もちろん、行と列とは入れ替え可能である。図5(a)はデータマトリクスの一例であり、この図ではM1、M2、…がm/z値であり、P11、P12、…がピークの強度値である。
【0027】
次に、データマトリクス上のデータについて必要に応じてスケーリングを実行する(ステップS4)。スケーリングは、例えば極端に強度の大きなデータがあった場合に、解析がそれに支配されすぎないようにするために行われる。具体的なスケーリングの手法としては、平均値や標準偏差がデータに反映されるようにするために、まず全ての強度値の平均を計算してこれを各強度値から減算し(つまり平均中心化が行われ)、次いで強度値の分散(標準偏差)で除するような手法が挙げられる。しかしながら一般に、マススペクトルピークのようなデータに対してはパレートスケーリングがより有利である。パレートスケーリングでは、平均中心化が行われた後、その値は分散の平方根で除される。
【0028】
次に、スケーリングのなされた又はなされていないデータマトリクス中のデータに対し、各m/z値についてのピクセル空間における強度のノルム(つまりデータマトリクスの各行のノルムを1にする)ように強度値を規格化する(ステップS5)。
【0029】
図4はピクセル空間における強度のノルム規格化の概念を示す図である。図4はX1、X2、X3の3個のピクセルにおける強度を3軸とするピクセル空間において、ピクセルX2に存在するm/z700,m/z701,m/z702の3つの同位体イオンのプロット点を示すもので、(a)は規格化前、(b)は規格化後である。規格化前の状態では、図4(a)に示すように、強度の相違する3つの同位体イオンm/z700,m/z701,m/z702に対応するプロット点はX2軸上の異なる位置に存在する。ピクセル空間における強度のノルムを1にすることは、各プロット点における強度をそれ自身で除することを意味する。そのため、規格化後には、図4(b)に示すように、3つの同位体イオンm/z700,m/z701,m/z702に対応するプロット点はX2軸上の同一点に重なる。ピクセル空間内の任意のプロット点は全て半径が1である球面状に位置するようになる。
【0030】
具体的には、図5(a)に示すデータマトリクスでは、縦方向の1列が或る特定のm/z値に対するピクセル空間上の強度値であるから、この縦方向のノルムをそれぞれ求め(この例ではQ1、Q2、…)、各m/z値毎に上記の求めたノルムで各強度値を除する(図5(b)参照)。これによってm/z値毎にノルムが1であるように全ての強度値が規格化される。
【0031】
次に、上記のようにm/z値毎にノルムが1になるように規格化されたデータマトリスクに対し、m/z方向に階層的クラスタリング(HCA)を行うことにより、m/z値又はm/z値毎の空間強度分布(つまりはデータマトリクスの1列毎のデータ集合)を複数のクラスタに分類する(ステップS6)。このときに、クラスタの数は予め設定せずに、例えば分散分析法などの既知の様々な手法のいずれかにより自動的に決定するようにし、分析担当者等による外部からの入力設定は不要とする。
【0032】
同位体ピーク群(同一物質から発生し構成元素の同位体のみが相違するイオンに由来する複数のピーク)に属するピークのm/z値の空間強度分布は、それぞれ絶対的な強度は異なるものの、いずれも類似した空間分布を示す。データマトリクスにおいてノルムを1(又は他の所定値)にするように各強度値を規格化することは、強度の絶対値の影響を排除して空間強度分布を比較可能とする意味を持つ。そのため、ステップS5の規格化処理により、規格化前と比較して同位体ピーク間の距離(例えばユークリッド距離などの階層的クラスタリングに使用される距離)が小さくなるから、階層的クラスタリングにおいて同一クラスタにまとめられる可能性が高くなる。その結果、同位体ピーク群を含む類似した空間強度分布をもつピークのm/z値が同一クラスタにまとめられることになる。
【0033】
また、質量分析では、目的分子のイオン化の過程で該イオンに様々な成分が付加したアダクトイオンが生成されることがあるが、こうしたアダクトイオンピークのm/z値の空間強度分布も、それぞれ絶対的な強度は異なるものの、いずれも類似した空間分布を示す。したがって、上記のような規格化後に階層的クラスタリングを実行することにより、同一物質由来で異なるm/zを持つアダクトイオンピークのm/z値も高い確率で同一クラスタにまとめられることになる。
【0034】
ここで、図3に示すデータ処理をマウス網膜切片を試料として収集された質量分析イメージングデータに対して適用した場合の実例を挙げる。この質量分析イメージングデータから測定対象の全領域に対するm/z値毎の最大強度を求めて最大強度マススペクトルを作成し、該マススペクトルから強度が上位である100個のピークをピッキングしたところ、図6に示す5種類のリン脂質とみられるピークが選出された。また、図6に示すように、それら5種類のプロトン付加イオン([M+H]+)のほか、質量電荷比差からみてナトリウム付加イオン、カリウム付加イオンとみられるイオンもそれぞれ観測された。
【0035】
上記のように選出したピークのm/z値を図5(a)に示すm/z値、M1、M2、…としてデータマトリクスを作成し、ステップS5の規格化の処理を行わずにステップS6の階層的クラスタリングを実行した。階層的クラスタリングでは、個体間距離を標準化ユークリッド距離とし、クラスタ間距離をウォード法による定義によるものとした。この場合、不整合係数により判断した最適クラスタ数は4となり、全てのm/z値が4つのクラスタのいずれかに分類された。図7及び図8は、このときの[1]〜[4]の各クラスタに分類されたm/z値に対応する空間強度分布画像(マッピング画像)及びクラスタ内平均空間強度分布画像を示す図である。図7から分かるように、クラスタ[1]と[2]とに含まれる空間強度分布画像はかなり類似しているにも拘わらず2つのクラスタに分けられてしまっている。逆に、クラスタ[3]や[4]では、かなり異なる傾向の空間強度分布画像が同一クラスタ内に分類されてしまっている。
【0036】
図9は図7及び図8に示したクラスタリング結果に基づくピーク識別結果を示す図である。図9において○印等の記号で示したm/z値は図6に示したリン脂質由来のイオンピークに対応したものである。この5種類のリン脂質由来のイオンピークに着目すると、同一物質由来であるにも拘わらず異なるクラスタに分類されてしまっている。こうしたことから、ステップS5の処理を省略した階層的クラスタリングでは、同一物質由来の同位体ピーク群やアダクトイオンピークが同一クラスタに集約されず、このクラスタリング結果から以降の同位体イオン・アダクトイオン識別処理を実行しても正しい結果が得られないことが分かる。
【0037】
一方、図10及び図11は、ステップS5の規格化の処理を行った上でステップS6の階層的クラスタリングを実行した場合における、[1]〜[4]の各クラスタに分類されたm/z値に対応する空間強度分布画像及びクラスタ内平均空間強度分布画像を示す図である。図10及び図11から、類似した空間強度分布を示すm/z値は同じクラスタに集約されており、クラスタ毎に空間強度分布の傾向の相違が顕著であることが分かる。この結果からだけでも、同一物質由来の同位体イオンやアダクトイオンピークが同一クラスタに含まれている可能性が高いことが見てとれる。
【0038】
図3に戻り説明を続けると、上述のようにデータマトリクス上の全てのm/z値を複数のクラスタに分類した後、各クラスタ内で同位体ピーク群を見つける。具体的には、イオンの価数が1である場合には同位体イオン同士の質量電荷比差は1Daであるから、同一クラスタ内で約1Da差であるm/z値が存在するか否かを調べ、存在したならばそれらを同位体ピーク群候補とであるとみなし、その中で最小のm/z値をモノアイソトピックピーク候補とみなす。ただし、全く異なる物質由来のイオン同士のm/z値差が偶然に1Da程度になることはあり得るから、上記候補が実際に同位体ピーク群であるか否かを確認するために、強度比の情報を利用する。具体的には、同位体ピーク群に含まれるピークの中のモノアイソトピック候補のピーク強度から、同位体の天然存在比に基づいて理論的な同位体ピーク強度比を算出し、この理論比と実際の同位体ピーク群候補の強度比とを比較することにより、真の同位体ピーク群とみなせるか否かを判定する。そして、実際の同位体ピーク群であると判定された場合には、モノアイソトピックピークに対応するm/z値のみを残し他の同位体ピーク情報を消去する。一方、約1Daのm/z値のピーク群でありながら同位体ピーク群でない場合には、いずれのピーク情報も消去せずに残す(ステップS7)。
【0039】
図12は図10及び図11に示したクラスタリング結果に基づくピーク識別結果を示す図である。図12において背景を塗り潰したセル内のm/z値は上記処理により除去されたピークを表す。○印等の記号で示したm/z値は図6に示したリン脂質由来のイオンピークに対応したものである。また、同位体ピークであると判定された場合には'isotopic'、アダクトイオンピークであるとあると判定された場合には'M+H'、'M+Na'、'M+K' を、各m/z値の下に記載している。この図12を見れば、同位体イオンが存在する場合にはモノアイソトピックピークを残し、それ以外のピークが消去されたことが分かる。なお、同位体ピーク群を構成しない単独ピークの情報については、消去せずにそのまま残す。
【0040】
なお、同位体ピークの強度算出手法の一例としては、従来、アミノ酸配列の元素組成を算出するために用いられているアベレージネ(Averagine)モデルを用いてもよい。アベレージネモデルの詳細は、センコ(Michel W. Senko)ほか、「デターミネイション・オブ・モノアイソトピック・マシズ・アンド・イオン・ポピュレイションズ・フォー・ラージ・バイオモレキュルズ・フロム・リゾルブド・アイソトピック・ディストリビューションズ (Determination of monoisotopic masses and ion populations for large biomolecules from resolved isotopic distributions)」、ジャーナル・オブ・アメリカン・ソサイエティ・マス・スペクトロメトリー(Journal of American Soc. Mass Spectom.)、6、1995年、pp.229-233等の文献に開示されている。
【0041】
次に、ステップS7の処理により残された各クラスタ内のピークにおいて、既知のアダクトイオンの質量電荷比差に相当するピーク対を見つけ、これを同一物質由来のアダクトイオンピーク群候補とみなす。そして、このうち全測定領域での平均強度が最も大きいピークを代表の単一ピークとして残し、他のアダクトイオンピーク情報を消去する(ステップS8)。図12の結果を見れば、階層的クラスタリングにより図6に示した5種類のリン脂質アダクトイオンピークは同一のクラスタに集約されていたため、質量電荷比差によるアダクトイオンピークが的確に識別できていることが分かる。
【0042】
ステップS7、S8により、同一物質由来であって重複しているとみなせるピーク(m/z値)が除去されたならば、残された各クラスタのピークを集約し、このピーク情報からステップS3で作成したものと同様の形式のデータマトリクスを再構成する(ステップS9)。これにより、同位体ピークやアダクトイオンピークなど、解析に有用でないピーク情報を削除して情報量を減らしたデータマトリクスを得ることができるから、再構成されたデータマトリクスに基づいて例えば特異的分布を示すm/z値のマッピング画像を精度よく取得することが可能となる。
【0043】
図13は上記例の平均マススペクトルであり、(a)は上述した同位体イオン・アダクトイオンピーク除去処理実行前の状態、(b)は同位体イオン・アダクトイオンピーク除去処理実行後の状態である。なお、図中に○印等の記号で示したm/z値は図6に示したリン脂質由来のイオンピークに対応したものである。図13から、図6中の5種類のリン脂質由来アダクトイオンピークそれぞれにおいて、平均強度が最も大きいピーク以外を消去できたことが確認できる。なお、この例では、上述した同位体イオン・アダクトイオンピーク除去処理によって、100個のピークのうち35個のピークが消去されている。
【0044】
上記実施例は本発明の一例にすぎず、本発明の趣旨の範囲で適宜変形、修正、追加を行っても本願特許請求の範囲に包含されることは当然である。例えば、上記実施例では、クラスリングとして階層的クラスタリングを実行していたが、非階層的クラスタリングを利用してもよい。
【符号の説明】
【0045】
1…イメージング質量分析本体部
2…データ処理部
3…データ記憶部
4…顕微画像処理部
5…制御部
6…操作部
7…表示部
8…試料
8a…2次元測定対象領域
8b…微小領域(ピクセル)
【特許請求の範囲】
【請求項1】
試料上の2次元領域内に設定された複数の微小領域に対してそれぞれ質量分析を実行することにより収集されたデータを解析処理する質量分析データ解析方法であって、
a)前記微小領域毎に得られるマススペクトルデータに対しピーク検出処理を実行してピークの強度と質量電荷比とを含むピーク情報を収集するピーク検出ステップと、
b)前記ピーク検出ステップにより得られた各微小領域のピーク情報を集め、全てのピークについて質量電荷比毎に空間強度分布を比較可能であるように、各微小領域における強度値を規格化する強度規格化ステップと、
c)前記強度規格化ステップによる規格化後の質量電荷比毎の空間強度分布に対しクラスタリングを用いることにより、空間強度分布に対応付けられた質量電荷比を所定数のクラスタに分類するクラスタリング実行ステップと、
d)同一クラスタに分類された複数の質量電荷比について、少なくとも質量電荷比の差を利用して同一物質由来のイオンに対するピークを識別する識別ステップと、
を有することを特徴とする質量分析データ解析方法。
【請求項2】
請求項1に記載の質量分析データ解析方法であって、
前記識別ステップでは、同一クラスタに分類された複数の質量電荷比について、質量電荷比の差と前記規格化がなされない強度情報とを用いて同一物質由来の同位体群に属するピークを識別し、同一同位体群に属するピークの中でモノアイソトピックピークのみを選出することを特徴とする質量分析データ解析方法。
【請求項3】
請求項2に記載の質量分析データ解析方法であって、
前記識別ステップではさらに、同一クラスタに分類された複数の質量電荷比について、質量電荷比の差を用いて同一物質由来の複数のアダクトイオンピークを識別し、同一物質由来の複数のアダクトイオンピークの中で1つのピークを選出することを特徴とする質量分析データ解析方法。
【請求項4】
試料上の2次元領域内に設定された複数の微小領域に対してそれぞれ質量分析を実行することにより収集されたデータを解析処理する質量分析データ解析装置であって、
a)前記微小領域毎に得られるマススペクトルデータに対しピーク検出処理を実行してピークの強度と質量電荷比とを含むピーク情報を収集するピーク検出手段と、
b)前記ピーク検出手段により得られた各微小領域のピーク情報を集め、全てのピークについて質量電荷比毎に空間強度分布を比較可能であるように、各微小領域における強度値を規格化する強度規格化手段と、
c)前記強度規格化手段による規格化後の質量電荷比毎の空間強度分布に対しクラスタリングを用いることにより、空間強度分布に対応付けられた質量電荷比を所定数のクラスタに分類するクラスタリング実行手段と、
d)同一クラスタに分類された複数の質量電荷比について、少なくとも質量電荷比の差を利用して同一物質由来のイオンに対するピークを識別する識別手段と、
を備えることを特徴とする質量分析データ解析装置。
【請求項5】
請求項4に記載の質量分析データ解析装置であって、
前記識別手段は、同一クラスタに分類された複数の空間強度分布について、質量電荷比の差と前記規格化がなされない強度情報とを用いて同一物質由来で質量電荷比が相違する同位体群に属するものを識別し、同一同位体群の中でモノアイソトピックピークのみを選出することを特徴とする質量分析データ解析装置。
【請求項6】
請求項5に記載の質量分析データ解析装置であって、
前記識別手段はさらに、同一クラスタに分類された複数の空間強度分布について、質量電荷比の差を用いて同一物質由来の複数のアダクトイオンピークを識別し、同一物質由来の複数のアダクトイオンピークの中で1つのみを選出することを特徴とする質量分析データ解析装置。
【請求項1】
試料上の2次元領域内に設定された複数の微小領域に対してそれぞれ質量分析を実行することにより収集されたデータを解析処理する質量分析データ解析方法であって、
a)前記微小領域毎に得られるマススペクトルデータに対しピーク検出処理を実行してピークの強度と質量電荷比とを含むピーク情報を収集するピーク検出ステップと、
b)前記ピーク検出ステップにより得られた各微小領域のピーク情報を集め、全てのピークについて質量電荷比毎に空間強度分布を比較可能であるように、各微小領域における強度値を規格化する強度規格化ステップと、
c)前記強度規格化ステップによる規格化後の質量電荷比毎の空間強度分布に対しクラスタリングを用いることにより、空間強度分布に対応付けられた質量電荷比を所定数のクラスタに分類するクラスタリング実行ステップと、
d)同一クラスタに分類された複数の質量電荷比について、少なくとも質量電荷比の差を利用して同一物質由来のイオンに対するピークを識別する識別ステップと、
を有することを特徴とする質量分析データ解析方法。
【請求項2】
請求項1に記載の質量分析データ解析方法であって、
前記識別ステップでは、同一クラスタに分類された複数の質量電荷比について、質量電荷比の差と前記規格化がなされない強度情報とを用いて同一物質由来の同位体群に属するピークを識別し、同一同位体群に属するピークの中でモノアイソトピックピークのみを選出することを特徴とする質量分析データ解析方法。
【請求項3】
請求項2に記載の質量分析データ解析方法であって、
前記識別ステップではさらに、同一クラスタに分類された複数の質量電荷比について、質量電荷比の差を用いて同一物質由来の複数のアダクトイオンピークを識別し、同一物質由来の複数のアダクトイオンピークの中で1つのピークを選出することを特徴とする質量分析データ解析方法。
【請求項4】
試料上の2次元領域内に設定された複数の微小領域に対してそれぞれ質量分析を実行することにより収集されたデータを解析処理する質量分析データ解析装置であって、
a)前記微小領域毎に得られるマススペクトルデータに対しピーク検出処理を実行してピークの強度と質量電荷比とを含むピーク情報を収集するピーク検出手段と、
b)前記ピーク検出手段により得られた各微小領域のピーク情報を集め、全てのピークについて質量電荷比毎に空間強度分布を比較可能であるように、各微小領域における強度値を規格化する強度規格化手段と、
c)前記強度規格化手段による規格化後の質量電荷比毎の空間強度分布に対しクラスタリングを用いることにより、空間強度分布に対応付けられた質量電荷比を所定数のクラスタに分類するクラスタリング実行手段と、
d)同一クラスタに分類された複数の質量電荷比について、少なくとも質量電荷比の差を利用して同一物質由来のイオンに対するピークを識別する識別手段と、
を備えることを特徴とする質量分析データ解析装置。
【請求項5】
請求項4に記載の質量分析データ解析装置であって、
前記識別手段は、同一クラスタに分類された複数の空間強度分布について、質量電荷比の差と前記規格化がなされない強度情報とを用いて同一物質由来で質量電荷比が相違する同位体群に属するものを識別し、同一同位体群の中でモノアイソトピックピークのみを選出することを特徴とする質量分析データ解析装置。
【請求項6】
請求項5に記載の質量分析データ解析装置であって、
前記識別手段はさらに、同一クラスタに分類された複数の空間強度分布について、質量電荷比の差を用いて同一物質由来の複数のアダクトイオンピークを識別し、同一物質由来の複数のアダクトイオンピークの中で1つのみを選出することを特徴とする質量分析データ解析装置。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図13】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図2】
【図3】
【図4】
【図5】
【図6】
【図13】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【公開番号】特開2012−247198(P2012−247198A)
【公開日】平成24年12月13日(2012.12.13)
【国際特許分類】
【出願番号】特願2011−116601(P2011−116601)
【出願日】平成23年5月25日(2011.5.25)
【出願人】(000001993)株式会社島津製作所 (3,708)
【Fターム(参考)】
【公開日】平成24年12月13日(2012.12.13)
【国際特許分類】
【出願日】平成23年5月25日(2011.5.25)
【出願人】(000001993)株式会社島津製作所 (3,708)
【Fターム(参考)】
[ Back to top ]