説明

LC−MALDIで得られたデータの比較解析方法

【課題】液体クロマトグラフィー(LC)によって分離した試料の画分をサンプルプレート上に所定の順番で所定の位置にスポットし、これらの画分をマトリックス支援レーザー脱離イオン化(MALDI)法によるイオン化部を備えたタンデム質量分析(MS/MS)計に供して得られたプリカーサーイオンの相同性を判定する方法を提供する。
【解決手段】(1)第一の試料に由来するプリカーサーイオンが取得されたサンプルプレート上の位置に対して、第二の試料に由来するプリカーサーイオンが取得されたサンプルプレート上の位置が所定の関係を満たし、かつ、(2)両プリカーサーイオンのプロダクトイオン群の比較により両プリカーサーイオンに相同性があるとされた場合に、相同性有と判定するステップを含む方法。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、液体クロマトグラフィーを前処理としたマトリックス支援レーザー脱離イオン化質量分析法(以下MALDI-MSと略称する場合がある)によって取得されたデータの分析方法に関する。
【背景技術】
【0002】
近年、様々な生物におけるゲノムプロジェクトの完了や、質量分析装置(以下MSと略称する場合がある)の発達により、生物のタンパク質を網羅的に解析するプロテオーム解析が盛んに行われるようになった。質量分析装置はイオン化部と測定部の組み合わせにより様々な方式があるが、生命科学の分野で多く用いられているものがイオン化部にマトリックス支援レーザー脱離イオン化(以下MALDIと略称する場合がある)法を採用したMALDI-MSである。
【0003】
MALDI法ではマトリックスと呼ばれる試薬を分析試料に混合し、そこにレーザーを当ててマトリックス分子および試料分子をイオン化する。マトリックスはレーザーのエネルギーを効率的に吸収し、試料分子のイオン化を補助する働きがある。MALDI法は分析試料の前処理が簡便であること、マトリックスの選択により様々な生体分子の分析が可能であることから、この方式を採用した質量分析装置は生物系・医学系の現場を中心に広く利用されている。
【0004】
MALDI法の特筆すべきブレイクスルーとして、2002年にノーベル化学賞を受賞した田中らの改良がある。1987年に田中らが行ったマトリックスの改良は、それまで分析が困難であったタンパク質の安定なイオン化を可能にし、生命科学分野へのMALDI-MSの普及を促した。当時のマトリックスはコバルトの粉末とグリセリンとを混合したものであったが、現在では主にα-シアノ-4-ヒドロキシケイ皮酸(CHCA)や2,5-ジヒドロキシ安息香酸(DHB)といった有機化合物が使われている。
【0005】
マトリックスは溶媒に溶解された後、MALDIサンプルプレートと呼ばれる導電性のプレート上で分析試料とともに結晶化される。サンプルプレートは質量分析装置内の試料室に挿入され、そこで混晶にレーザーが照射される。レーザーのエネルギーによってイオン化されたマトリックス分子および分析試料分子は、質量分析部で質量および電荷に応じて分離され、検出器に至る。検出された電荷は時系列に沿って処理され、マススペクトルとなる。
【0006】
質量分析を行うには、前もって分析試料を精製しておく必要がある。従来、精製の手段としては電気泳動による分離が主であったが、近年では各種のクロマトグラフィー装置も利用されている。前処理にクロマトグラフィー装置を用いる利点は、大量の分析試料を高解像度で分離できることにある。
【0007】
クロマトグラフィーと質量分析装置とを直結したオンラインのシステムとしては、液体クロマトグラフィー装置(以下LC)を接続したLC/MS、ガスクロマトグラフィー装置(以下GC)を接続したGC/MSなどがある。LC/MSのイオン化部にはエレクトロスプレーイオン化(ESI)法や大気圧化学イオン化(APCI)法が、GC/MSのイオン化部には電子衝撃イオン化(EI)法や化学イオン化(CI)法が採用される。一般にLC/MSやGC/MSと言った場合には、これらのような直結型の装置を指す。
【0008】
ESI法などを採用したLC/MSは、LCで分離されてくる液相の分析試料を順次イオン化して質量分析部へ送ることができるため、スループットや網羅性に優れる。ゆえに大規模なプロテオーム解析ではLC/MSが用いられる場合が多い。LC/MSは市場規模も大きく、様々な解析法に対応したフリーウェア(非特許文献1)、商用ソフトウェアが公開されている(非特許文献2、3)。
【0009】
MALDI法とクロマトグラフィーを組み合わせることも可能である。しかし、MALDI法では前述のように分析試料をMALDIサンプルプレートにのせ、マトリックスとともにウェル上で一度結晶化させる必要があるため、液相の分離を行うLCと直接接続してオンラインで分析を行うことが困難である。そこで、LCとMALDI-MSとの間にフラクションコレクタと呼ばれる装置を介在させ、これらを連携させることが行われている。フラクションコレクタは、LCから溶出されてくる試料を一定量ずつ区切ってMALDIサンプルプレート上のウェルへ自動的に一定の順序でスポットする装置であり、各社から製品が発売されている(非特許文献4、5、6、7)。このような装置を利用してLCとMALDI-MSとを連携させたシステムはLC-MALDIやLC-MALDI-MSと呼ばれる。
【0010】
LC-MALDIの利点としては、普及しているMALDI-MSを利用して網羅性の高いプロテオーム解析が可能であること、LCとMALDIの工程を物理的・時間的に切り離す事が可能であるために、離れた研究室や研究機関間で各工程の分業が可能であること、MALDIサンプルプレートにスポットした試料を繰り返し分析できること、試料を多数のウェルに振り分けることでMALDI法に特有のイオン化抑制効果を低減できること、MALDI法では多価イオンが生成しづらいためにマススペクトルの解釈や処理が容易であること、などが挙げられる。
【0011】
逆にLC-MALDIの欠点としては、フラクションコレクタが必要であること、スポッティングと結晶化の過程を踏むためにLC/MSと比べてスループットが劣ること、試料を一定量ごとにまとめてスポットするためにLCの溶出時間の分解能が失われ、一つのスペクトル中に多数のピーク含まれること、同じ理由でそれぞれのピークについてLCからの正確な溶出時間情報が失われること、などが挙げられる。
【0012】
上記の理由から、LC-MALDI と一般的なLC/MSとでは、装置から得られるデータの性質や形式が異なる。したがって、前掲のLC/MS用のデータ解析ソフトウェアをLC-MALDIに流用することはできない。しかしLC-MALDIはLC/MSと比べて普及しておらず、対応しているデータ解析ソフトウェアも少ない。LC-MALDI用のソフトウェアとしては、フラクションコレクタや質量分析装置に附属して機器の制御やデータの取得を行うためのもの(例として非特許文献5中のソフトウェアパッケージ、PROTEINEER-LC)が主である。
【0013】
LC-MALDIのデータ解析に特化したソフトウェアとしては、DYNACOM社製のTWiP(非特許文献8)がある。TWiPは、LC-MALDIと島津製作所の同位体試薬であるNBS試薬キット(非特許文献9)を利用する、発現量変動解析のためのソフトウェアである。分析対象の試料と基準となる試料とを質量数の異なる同位体で標識し、質量差に基づいて相同なピークを検出して量的変化を捉える。
【0014】
しかしTWiPと同位体標識による方法は、質量差から予想されるペアピークを認識するために、分析対象の試料と基準となる試料の両方に存在するペプチド断片しか認識できない。試料間での最も有意な違いである、一方の試料にのみ存在する特異的なピークの存在を見落としてしまうという欠点がある。
【先行技術文献】
【特許文献】
【0015】
【特許文献1】特開2009−156722号公報
【特許文献2】特開2004−502934号公報
【非特許文献】
【0016】
【非特許文献1】「代謝制御」平成17年度採択研究代表者 小田吉哉 「定量的メタボロミクスとプロテオミクスの融合」 平成20年度実績報告 [online] URL http://www.jst.go.jp/kisoken/crest/report/heisei20/pdf/pdf18/18-001.pdf
【非特許文献2】LCMS // LCMS-IT-TOF メタボロミクス解析ソフトウェアProfiler [online] URL http://www.an.shimadzu.co.jp/lcms/it-tof6.htm
【非特許文献3】Nonlinear Dynamics社 Progenesis LC-MS[online] URL http://www.scrum-net.co.jp/products/nonlinear/progenesis_lcms.htm
【非特許文献4】[SHIMADZU BIOTECH] MALDIプレート用スポッティング装置AccuSpot[online] URL http://www.shimadzu-biotech.jp/products/accu/index.html
【非特許文献5】製品案内:PROTEINEER fc | ブルカー・ダルトニクス[online] URL http://www.bruker.jp/daltonics/product/proteineer-fc.html
【非特許文献6】ヤマト科学 MALDI-TOF MS用ダイレクトナノLC/MALDIプレートスポッティングシステムDiNa Map System[online] URL http://www.yamato-net.co.jp/support/catalog/pdf/p782_dina.pdf
【非特許文献7】Agilent 1200 シリーズ LCマイクロコレクタ/スポッタ | アジレント・テクノロジー株式会社[online] URL http://www.chem-agilent.com/contents.php?id=38079
【非特許文献8】DYNACOM 定量的プロテオーム解析支援ソフト トゥイップ[online] URL http://www.dynacom.co.jp/products/package/twip/twip_20060914.pdf
【非特許文献9】[SHIMADZU BIOTECH] 13CNBS Stable Isotope Labeling Kit-N 定量的発現プロテオーム解析用安定同位体標識キット[online] URL http://www.shimadzu-biotech.jp/products/nbs/index.html
【発明の開示】
【発明が解決しようとする課題】
【0017】
本発明の目的は、LC-MALDIのシステム特性を利用したデータ解析ソフトウェアを提供することである。
【0018】
生命科学においては、異なる2つの試料間の差異を検出することが頻繁に要求される。例えば野生株と変異株、正常状態と病理状態など、対象群と処理群との差異から生命現象を見出す作業である。これはプロテオームなどLC-MALDIが利用される局面においても同様である。プロテオームによって得られるデータの量は膨大であり、差異の検出においてもコンピュータの利用が不可欠である。前述のTWiPは、このような要求に答えるソフトウェアの一つである。しかしTWiPによる安定同位体標識を利用した相同ピーク認識は、上述のとおり2つの試料間に共通して見出されるピークの量的変化を認識するのみであり、一方の試料に特異的なピークを検出できないという欠点がある。
【0019】
加えて、TWiPはタンパク質をトリプシン等で消化したペプチド断片の一次マススペクトル、いわゆるプリカーサーイオンスペクトルの分析のみ対応している。ポストソース分解(PSD)や衝突誘起解離(CID)によるタンデム質量分析(以下MS/MS)を行って得られたプロダクトイオンスペクトルの分析は想定されていない。むしろMS/MSのような詳細な分析の候補となるピークを選び出す段階に寄与するソフトウェアである。
【課題を解決するための手段】
【0020】
上記のような課題を解決すべく、本発明者らは、LC-MALDIとMS/MSを組み合わせて得られる大量のデータの比較解析を行うためのソフトウェアを開発するに至った。
【0021】
本明細書において、質量分析に関する用語は、日本質量分析学会編纂のマススペクトロメトリー関連用語集(2009年、ISBN 4-906661-02-2)に準拠した。例外として、イオンの質量を統一原子質量単位と該イオンの電荷数で割って得られる無次元量であるm/zに対し、該用語集では推奨されない質量電荷比の呼称を使用もしくは併記する場合がある。これはm/zを日本語で説明的に表現する用語が存在しないこと、従来m/zと質量電荷比が等価なものとして当業者に扱われてきた事情に鑑みたことによる。ゆえに本明細書において、質量電荷比とm/zとは互換的に使用される。
【0022】
LC-MALDIとMS/MSを組み合わせたシステムからは、分析試料に関する様々な情報が得られる。その中で特に重要かつ本発明に関するものが以下の5つである。
1)プリカーサーイオンのm/z
2)該プリカーサーイオンが取得されたサンプルプレート上の位置(具体的には、ウェルの位置)
3)該プリカーサーイオンに対してMS/MSを行って得られたプロダクトイオンスペクトル
4)該プロダクトイオンスペクトルを構成するプロダクトイオン群のm/z
5)該プロダクトイオン群のピーク強度
MALDIサンプルプレートの各ウェルにスポットされたサンプルにレーザーを照射し、イオン化された分子群から構成される一次スペクトルがプリカーサーイオンスペクトルである。このスペクトルを構成するイオンの中で、特にMS/MSの対象として選ばれたイオンをプリカーサーイオンと呼ぶ。プリカーサーイオンは該イオンのm/zおよび該イオンが取得されたウェルの位置により一意に識別される。
特定のプリカーサーイオンに対してMS/MSを実行して得られた二次スペクトルがプロダクトイオンスペクトルである。プロダクトイオンスペクトルを構成する個々のピークに対応するイオンをプロダクトイオンと呼ぶ。本明細書において、一つのプリカーサーイオンに由来するプロダクトイオンの集合をプロダクトイオン群と呼ぶ。本発明の方法の対象となるデータは、上記1)から5)もしくはそれらに準ずる内容の情報を含んでいるものとする。
【0023】
本発明者らは、これらの情報がLC-MALDIより得られるデータの相同性を判断するパラメータとして有用であると考え、着目した。本発明の特徴は、プリカーサーイオンが取得されたサンプルプレート上の位置を相同性の判定のパラメータの一つとして利用する点にある。
【0024】
プリカーサーイオンが取得されたサンプルプレート上の位置は、フラクションコレクタが該プリカーサーイオンを含む液滴をウェルにスポットした時間、すなわち該プリカーサーイオンがLCから溶出された時間を反映している。溶出時間は該プリカーサーイオンの物性およびLCで用いられたカラムや抽出溶媒などの実施条件から一意に決定される要素である。ゆえに実施条件が同じ場合、分析試料自体の差異などに由来する撹乱はあるものの、同じプリカーサーイオンは同じかもしくはその近傍のウェルに含まれる事が期待される。従ってサンプルプレート上の位置情報は、そこに含まれるプリカーサーイオンの相同性を判断するパラメータとして有用である。特開2009−156722号公報(特許文献1)及び特開2004−502934号公報(特許文献2)は、LC-MALDIにおいてLCの保持時間に沿って近接するいくつかの部分に同じ成分が存在する可能性があることを記載するが、サンプルプレート上の位置情報の使用及び有用性については何ら開示していない。また、サンプルプレート上の位置情報は通常MS/MSの最終データに保存されているので、MS/MSの最終データに含まれる内容のみを利用して相同性の判定の精度向上を図ることができる。
【0025】
また、プリカーサーイオンの情報に基づく比較を行う第一のステップの後、プロダクトイオン群同士の比較を行う第二のステップを実施して相同性を判定する場合、サンプルプレート上の位置情報を用いてプリカーサーイオンをスクリーニングすることで第一のステップの精度を向上させ、計算量の多い第二のステップの比較に移行する頻度を低下させて、解析に要する時間を短縮することができる。第二のステップの比較ではプロダクトイオン群同士の総当り比較が行われるため、プロダクトイオン数の二乗に比例して計算量が増える。これを行う回数を最小限に留めることで、プロテオーム解析の過程で生まれる大量のデータを速やかに、少ない計算機資源で解析することが可能となる。
【0026】
本発明者らはこれらの着想に基づき、LC-MALDIから得られるデータの相同性を判定する方法を確立した。さらに多数のデータを一括処理する方法を併せて確立し、本発明を完成するに至った。
【0027】
したがって本発明は、その一局面によれば下記の方法を提供する。
液体クロマトグラフィーによって分離した試料の画分をサンプルプレート上に所定の順番で所定の位置にスポットし、これらの画分をマトリックス支援レーザー脱離イオン化法によるイオン化部を備えたタンデム質量分析計に供して得られたプリカーサーイオンの相同性を判定する方法であって、(1)第一の試料に由来するプリカーサーイオンが取得されたサンプルプレート上の位置に対して、第二の試料に由来するプリカーサーイオンが取得されたサンプルプレート上の位置が所定の関係を満たし、かつ、(2)両プリカーサーイオンのプロダクトイオン群の比較により両プリカーサーイオンに相同性があるとされた場合に、相同性有と判定するステップを含むことを特徴とする方法。
【0028】
本発明の方法は、比較すべき一対のプリカーサーイオン(ここにおいて、一方のプリカーサーイオンは第一の試料から得られ、他方のプリカーサーイオンは第二の試料から得られる)が上記(1)の要件と上記(2)の要件の両者を充足した時に、相同性有と判定するものである。この場合、上記(1)の要件の判定及び上記(2)の要件の判定は、何れを先行させてもよい。しかし、下記の本発明の実施例のように、上記(1)の要件を充足した場合のみ、上記(2)の要件の判定を行う方が、上述の通り上記(2)の要件の判定についての計算量が軽減されるので、好ましい。
したがって、本発明の好ましい実施形態によれば、前記ステップは、
(1)第一の試料に由来するプリカーサーイオンが取得されたサンプルプレート上の位置に対して、第二の試料に由来するプリカーサーイオンが取得されたサンプルプレート上の位置が所定の関係を満たすことを判定する第一のステップと、
(2)第一のステップにおいてサンプルプレート上の位置が所定の範囲内にあると判定された両プリカーサーイオンのプロダクトイオン群の比較により両プリカーサーイオンに相同性があるかどうか判定する第二のステップと、
を含んでなる。
【0029】
また、本発明において、液体クロマトグラフィーによって分離した試料の画分をサンプルプレート上に所定の順番で所定の位置にスポットすることが要求されるが、どの画分がサンプルプレート上のどの位置にスポットされたかが記録されていて、スポットされた各画分の溶出順が再現できればよく、必ずしも、隣接する画分をサンプルプレートの隣接するウェルにスポットする必要はない。しかしながら、簡便性の点から、画分を溶出順にサンプルプレートの隣接するウェルに順次スポットし、隣接する画分が隣接するウェルにスポットされるようにすることが好ましい。なお、第一の試料と第二の試料は、同一の条件で液体クロマトグラフィーによって分離されることが好ましい。第一の試料と第二の試料の分離条件が異なる場合には、予めそれぞれの試料に標準物質を添加したり、試料に含まれる帰属の明確なイオンを内部標準として採用するなどの方法により、分離条件の違いに起因する溶出時間のずれを検出し、これを相同性の判定条件に加味して補正できるようにする必要がある。
【0030】
また、上記第一のステップは、さらに、公知の方法と同様に、両プリカーサーイオンの質量電荷比が所定の関係を満たすことを判定するステップを備えてもよい。すなわち、上記第一のステップで、両プリカーサーイオンが取得されたサンプルプレート上の位置が所定の関係を満たすと判定された場合でも、両プリカーサーイオンの質量電荷比が所定の関係を満たさないと判定された場合は、相同性無と判定し、両プリカーサーイオンの質量電荷比が所定の関係を満たすと判定された場合は、上記第二のステップで相同性を判定するようにしてもよい。
【0031】
本発明の上記(2)の要件における両プレカーサーイオンのプロダクトイオン群の比較は、通常、プロダクトイオン群の質量電荷比及びピーク強度を比較することにより行うことができる。
【0032】
また本発明の方法は、プリカーサーイオンの1対1の比較のみならず、多対1や多対多の比較に応用することができる。すなわち、第一の試料に由来する複数のプリカーサーイオンと第二の試料に由来する単一のプリカーサーイオンとの相同性を判定する場合(多対1)は、第一の試料に由来する複数のプリカーサーイオンより選択された一つのプリカーサーイオンと第二の試料に由来する単一のプリカーサーイオンとの相同性を本発明の方法に従って判定した後、第一の試料に由来する複数のプリカーサーイオンより選択された他の一つのプリカーサーイオンと第二の試料に由来する単一のプリカーサーイオンとの相同性を本発明の方法に従って判定する手順を繰り返すことにより、相同性の判定が行える。同様に、第一の試料に由来する単一のプリカーサーイオンと第二の試料に由来する複数のプリカーサーイオンとの相同性を判定する場合(多対1)や、第一の試料に由来する複数のプリカーサーイオンと第二の試料に由来する複数のプリカーサーイオンとの相同性を判定する場合(多対多)も、上記と同様に本発明の方法を繰り返すことにより、相同性の判定が行える。
【0033】
また本発明は、さらに、相同性が判定された複数のプリカーサーイオンから、相同性有と判定されたプリカーサーイオンの集合または相同性無と判定されたプリカーサーイオンの集合を取り出すステップを備えてもよく、さらには、ディスプレイや印刷物等に該集合を出力するなどの表示ステップを備えてもよい。
【0034】
また本発明の方法は、コンピュータを用いて実施することができる。したがって、本発明は、さらに他の局面によれば下記発明を提供する。
液体クロマトグラフィーによって分離した試料の画分をサンプルプレート上に所定の順番で所定の位置にスポットし、これらの画分をマトリックス支援レーザー脱離イオン化法によるイオン化部を備えたタンデム質量分析計に供して得られたプリカーサーイオンの相同性を判定するためのコンピュータプログラムであって、(1)第一の試料に由来するプリカーサーイオンが取得されたサンプルプレート上の位置に対して、第二の試料に由来するプリカーサーイオンが取得されたサンプルプレート上の位置が所定の関係を満たし、かつ、(2)両プリカーサーイオンのプロダクトイオン群の比較により両プリカーサーイオンに相同性があるとされた場合に、相同性有と判定するステップを含むことを特徴とするコンピュータプログラム、又は、該コンピュータプログラムを記録したコンピュータ読み取り可能な記録媒体。
【発明の効果】
【0035】
本発明によれば、LC-MALDIを用いてMS/MSを行って得られたデータ同士を比較し、それらが相同なものであるか、異なるものであるかを高精度で判定することが可能となった。また大量のデータ同士を迅速に比較し、相同性を持つデータの集合や、逆に特定の試料にのみ含まれるデータの集合を容易に得ることが可能となった。本発明の方法により選別されたデータを、データベース検索プログラムにクエリとして渡すことで、複数の試料に共通して含まれる物質、特定の試料にのみ含まれる物質を高い精度で同定することができる。
【発明を実施するための最良の形態】
【0036】
本明細書において、以下、本発明の方法や機器構成についてはタンパク質由来のペプチドの分析を例に説明する。タンパク質は生体内で多くの生理的プロセスに関与していること、検索対象となるデータベースが充実していることなどから特に分析される機会が多く、本発明の方法の実施対象として主要なものであると考えられる。ただし、本発明の適用範囲はタンパク質由来のペプチドに限定されるものではない。LCやMALDI-MSの一般的な使用法に鑑みれば、他のペプチド、脂質、糖、核酸、タンパク質、合成ポリマー、およびこれらの混合物、これらが修飾を受けたもの、これらの複数種類が結合したものなど、LCによる分離を経てMALDI-MSにおけるMS/MSが可能な試料である限り、本発明の方法の実施対象となり得る。
【0037】
LC-MALDIによって得られるデータの形式は、典型的にはイオンの情報が記述されたテキストファイルである。本発明の実施例で用いた島津製作所の機器およびソフトウェアでは、独自形式のスペクトルファイルの他に、データベース検索ソフトウェアであるMASCOTおよびMASCOT Daemon(マトリックスサイエンス社)に対応したテキストのファイル形式の分析結果が得られる。その一部は実施例に示す。また仕様が公開されている汎用的なデータ形式として、mzData形式(http://www.psidev.info/index.php?q=node/80#mzdata)などがある。ただし、本発明の適用範囲はテキストファイルに記録されたデータに限定されるものではなく、本発明の方法の実施に必要な情報を含んでいる限り、どのような形式でもかまわない。分析に用いる質量分析装置やソフトウェアの種類によって、またユーザーのデータの管理方法によって、様々な形態のデータを扱う場合が想定される。例えばデータはバイナリファイルや、ファイルではなくリレーショナルデータベースにレコードとして格納されたものであってもかまわない。また複数のデータを扱う場合、データは分析試料ごとに単一のファイルにデータリストとして収められていても、あるいは任意の単位で分かれた複数のファイルであってもかまわない。
【0038】
本発明の方法がコンピュータ上で動作するソフトウェアによって実現される場合、本発明を実現するソフトウェアは、いかなるプログラム言語で記述されてもかまわない。例えばコードの頻繁な改変を要する場合にはインタプリタ方式のプログラミング言語、大量のデータを高速で処理する場合にはコンパイラ方式のプログラミング言語で記述するなど、実施者の用途に応じて選択できる。
【0039】
本発明を実現するソフトウェアが動作するハードウェアは、該ソフトウェアが動作する限りいかなるハードウェアでもかまわない。小規模な解析にはパーソナルコンピュータ、大規模な解析にはワークステーションや大型計算機など、実施者の用途に応じて選択できる。これらのハードウェアは、汎用計算機であってもよく、または本発明の方法を実現するソフトウェアを組み込んだ専用機器や、専用機器を含む解析システムとして提供されてもよい。
【0040】
本発明を実施するうえで設定する必要がある、上記(1)の要件における「所定の関係」(例えば、比較する1対のプリカーサーイオンが由来する画分同士の溶出順位の差の許容限度)や、上記第一のステップで所望により判定されるプリカーサーイオンの質量電荷比の「所定の関係」(例えば、比較する1対のプリカーサーイオン同士の質量電荷比の差の許容限度)などの閾値は、使用する分析機器の精度や実施者の過去の経験などに基づいて、実施者が適宜設定できる。また本発明の方法の実施結果を比較マトリクス図(具体的には図2、実施例で説明)に書き出して参照することで、結果を目視しながらフィードバックを繰り返して適切な閾値を選ぶことも可能である。これらのような数値決定の過程をソフトウェアによって自動化し、本発明の方法と連携させることによって、閾値を動的に設定することもできる。
【0041】
本発明の方法を実現するアルゴリズムの詳細は、実施例に示す。ただしこの例示的なアルゴリズムは、幾つかの方法により拡張できることが好ましい。実施例においては上記第一のステップと上記第二のステップとは独立した過程であるが、例えば上記第一のステップで所定の関係を満たすと判定されたプリカーサーイオンが相同である蓋然性が高ければ上記第二のステップの比較で用いる閾値を低くし、逆に上記第一のステップで所定の関係を満たすと判定されたプリカーサーイオンが相同である蓋然性が低ければ上記第二のステップの閾値を高くしてより厳しい判定を行う、などの改変が考えられる。
【0042】
本発明の方法によって比較された結果は、テキスト形式で作業ログとして出力したり、可視的な比較マトリクス図やデータの包含関係を示すベン図として出力したりすることができる。また、処理の対象となったデータファイルやレコードの内部に、新たな項やフィールドを設け、そこに判定の結果を記述することもできる。別法として、処理全体のパフォーマンスを重視するならば、比較結果を出力する過程を省略し、相同なデータの集合または相同でないデータの集合の作成のみを行うこともできる。
【実施例】
【0043】
単細胞紅藻Cyanidioschyzon merolae(シアニディオシゾン・メローラ、以下シゾン)の葉緑体分裂装置を材料として、以下の実験を行った。シゾンは細胞小器官の単離法が確立されていること、光条件によって細胞周期を同調させた培養が可能であること、ゲノム情報が完全解読されていることなどから、葉緑体分裂の研究においてモデル生物として利用されている単細胞藻類である。
分析試料の調製はYoshida et al. 2006の方法に従った。光同調培養によって細胞周期を同調させたシゾンの培養系から、間期と分裂期の細胞をそれぞれサンプリングした。細胞をフレンチプレスによって物理的に破砕した後、界面活性剤処理によって膜系を溶解させ、密度勾配遠心によって葉緑体の分裂装置を単離した。以上の工程により得られた、間期の細胞に由来する葉緑体分裂装置と分裂期の細胞に由来する葉緑体分裂装置とを非イオン性界面活性剤であるオクチルグルコシドで可溶化し、分析試料とした。これらの試料を以下それぞれ間期サンプル、分裂期サンプルと呼ぶ。
【0044】
LC-MALDIの機器構成を説明する。LCは島津製作所ProminenceシリーズのHPLCを用いた。送液ユニットにはLC-20Adnano、トラップカラムにはL-column ODS、分離カラムにはモノリス型ODSを用いた。検出器にはジーエルサイエンス社の紫外可視検出器MU701、フラクションコレクタには島津製作所のAccuSpot、質量分析装置は島津製作所のAXIMA-TOF2を用いた。
HPLCの移動相にはトリフルオロ酢酸(TFA)とアセトニトリル(MeCN)を用い、65分間でMeCN濃度を10%から80%まで変化させ、流速1μl/minにて固定相から試料を溶出した。マトリックスとしてはCHCA(溶媒0.1% TFA+70% MeCN、添加時の流速2.7μl/min)を用いた。溶出されたサンプルはAccuSpot によって10秒毎にMALDIサンプルプレート上のウェルに順次スポットされ、間期サンプル・分裂期サンプルからそれぞれ384ずつ、合計768のスポットを得た。なお、スポットの順番は、ウェルのナンバリングの順番に従った。
【0045】
質量分析はAXIMA-TOF2の制御ソフトウェアであるKratos Analytical社製Shimadzu Biotech Launchpadからリフレクトロンモードの自動分析モードにて行った。分析設定は以下のように行った。
1)一つのウェルについて、最初にプリカーサーイオンスペクトルを取得する。
2)該プリカーサーイオンスペクトルの中から、ピーク強度に基づいて最大9個の有意なプリカーサーイオンを選択する。選択に値する強度のプリカーサーイオンが含まれない場合には以下の手順を省略し、次のウェルの分析へ移る。
3)それぞれのプリカーサーイオンに対してMS/MSを行い、プロダクトイオンスペクトルを取得する。
4)プロダクトイオンスペクトルの中から、ピーク強度に基づいて40個のプロダクトイオンを選択する。
5)取得した情報を記録し、次のウェルの分析へ移る。
6)上記の手順を繰り返し、384ヶ所のウェルを分析する。
この手順を経て、プリカーサーイオンのm/z、プリカーサーイオンが取得されたウェルの位置、プロダクトイオンスペクトルを構成する40個のプロダクトイオン群のm/zおよびピーク強度などの情報を得た。
【0046】
分析の結果、間期サンプルでは1770個、分裂期サンプルでは2000個のプリカーサーイオンが選択された。これらのプリカーサーイオンからはプロダクトイオンスペクトルが取得され、それぞれ70800個、80000個のプロダクトイオンのm/zおよびピーク強度が得られた。
【0047】
本実施例で得られたデータリストの冒頭部を以下に例示する。ファイル形式はテキストファイルである。
【0048】
#Generated by: Shimadzu Biotech Launchpad 2.9.0.20090423

BEGIN IONS
TITLE="380-01-04-16-972-0001"
PEPMASS=972.112698 #Monoisotopic parent mass converted to average mass
69.553451 208.782730
81.189221 227.407715
87.102240 194.800308
120.802460 199.514313
148.074630 208.867783
178.270482 215.040237
188.191324 200.349854
203.051050 243.305008
232.555640 400.067047
285.243322 220.309723
311.047473 239.137558
342.505211 227.958115
352.137630 221.912903
366.910394 279.571991
370.376326 221.070374
376.631525 231.490173
478.242245 385.577850
544.857414 374.178406
547.501031 438.071411
550.360622 377.747559
557.402083 388.775513
568.244924 416.930939
571.906657 459.858154
575.866285 418.673889
693.642359 727.524536
720.847259 736.569031
728.364812 775.131592
735.962377 925.092712
744.863465 928.978699
748.373898 916.462524
755.954325 880.141479
762.831294 718.646729
864.344841 1220.819458
882.299345 1636.807373
892.143029 1412.451660
909.402658 2141.953369
919.234859 1347.742920
926.522635 4387.279785
936.652930 1600.116455
945.636016 2003.659912
END IONS

BEGIN IONS
TITLE="13-00-03-02-1985-0001"
PEPMASS=1986.169291 #Monoisotopic parent mass converted to average mass
175.322745 459.046021
319.550525 285.396790
327.164492 293.305725
(以下省略)
【0049】
上記データの構造について説明する。#記号で開始される一行目は、アプリケーションが自動的に付加したコメント行である。この行のように#記号が含まれる行は、#記号以右はコメントとして扱われ、処理の対象とならない。BEGIN IONS行とEND IONS行がイオン情報の開始と終了を表し、この間が一つのプリカーサーイオンとそれに由来するプロダクトイオン群のデータとなる。TITLE行はウェルの位置情報などからなる情報であり、プリカーサーイオンを一意に識別する。PEPMASS行はプリカーサーイオンのm/zを示す。PEPMASS行の次からEND IONSの前の行までがプロダクトイオン群の情報であり、左側の数字がプロダクトイオンのm/z、右側の数字がプロダクトイオンのピーク強度を示す。
【0050】
本発明を実現するためにソフトウェアを作成した。作成にはインタプリタ方式のプログラミング言語であるPerl(Active Perl v5.6.1)を用いた。該ソフトウェアはMicrosoft Windows(登録商標)XPをオペレーティングシステムとして搭載したパーソナルコンピュータ上で実行した。
【0051】
ソフトウェアの処理の流れをフローチャートとして図1に示す。本実施例では間期サンプルのデータ群を図中のデータリストA、分裂期サンプルのものをデータリストBとして処理した。間期サンプルのデータを先頭から一つずつ順に抽出し、そのそれぞれについて分裂期サンプルの全てのデータと照合する。照合は後述する一段階目の比較から行い、基準を超えた場合にのみ二段階目の比較を行う。
【0052】
以下、データ比較の過程について詳述する。一段階目の比較において、プリカーサーイオンの質量電荷比の比較は下記の式1に基づいた。
abs($divpepmass[$i] - $intpepmass[$j]) <= $pepmasstol 式1
式中、$divpepmass[$i]は分裂期サンプルのi番目のプリカーサーイオンのm/z、$intpepmass[$j]は間期サンプルのj番目のプリカーサーイオンのm/zである。これらの差の絶対値を絶対値関数absによって求め、誤差許容値$pepmasstolと比較した。$pepmasstolの値は、データ取得時の誤差許容値に基づいて0.3とした。なお、$pepmasstolの値は、リフレクトロンモードにおいて一般的には、0.1〜0.5の範囲で設定することが好ましい。
また一段階目の比較において、ウェルの位置の比較は下記の式2に基づいた。
abs($divrt[$i] - $intrt[$j]) <= $rttolmin 式2
式中、$divrt[$i]は分裂期サンプルのi番目のプリカーサーイオンが取得されたウェルの位置、$intrt[$j]は間期サンプルのj番目のプリカーサーイオンが取得されたウェルの位置である。質量電荷比と同様に差の絶対値を求め、誤差許容値$rttolminと比較した。$ rttolminの値は全ウェル数(384)の10%に基づいて38とした。なお、$ rttolminの値は、一般的には、全ウェル数の3%〜15%の範囲で設定することが好ましい。
上記の比較をiについて1番目から1770番目まで、jについて1番目から2000番目までを二次元的に走査し、総当りで行った。式1および式2がともに真である場合、プリカーサーイオンの類似度が基準を超えたと判断し、二段階目の比較を行った。
【0053】
二段階目の比較において、プロダクトイオンの質量電荷比の比較は下記の式3に基づいた。
abs($divfragion[0][$i][$k] - $intfragion[0][$j][$l]) <= $fragmasstol式3
式中、$divfragion[0][$i][$k]は分裂期サンプルのi番目のプリカーサーイオンに由来するk番目のプロダクトイオンのm/z、$intfragion[0][$j][$l]は間期サンプルのj番目のプリカーサーイオンに由来するl番目のプロダクトイオンのm/zである。これらの差の絶対値を求め、誤差許容値$fragmasstolと比較した。$fragmasstolの値はデータ取得時の誤差許容値に基づいて1.3とした。なお、$fragmasstolの値は、一般的には、0.5〜2.0の範囲で設定することが好ましい。
また二段階目の比較において、ピーク強度の比較は下記の式4に基づいた。
$divfragion[1][$i][$k] + $intfragion[1][$j][$l] >= $pithreshold 式4
式中、$divfragion[1][$i][$k] は分裂期サンプルのi番目のプリカーサーイオンに由来するk番目のプロダクトイオンのピーク強度、$intfragion[1][$j][$l] は間期サンプルのj番目のプリカーサーイオンに由来するl番目のプロダクトイオンのピーク強度である。これらの和を強度の強度基準値$pithresholdと比較した。$pithresholdは1500とした。なお、$pithresholdは、スペクトルの品質や、プロダクトイオンのピーク認識の精度、数値化のアルゴリズムなどに応じて、適宜設定することが好ましい。
上記の比較をk、lのそれぞれ1番目から40番目までを二次元的に走査し、総当りで行った。式3および式4がともに真である場合、プロダクトイオンの類似度が基準を超えたと判断した。
【0054】
二段階目の比較の結果を記録するために、変数$similarityを定義した。$similarityは一段階目の比較から二段階目の比較へ移行する時に、毎回0で初期化される変数である。二段階目の比較において式3および式4がともに真であった場合、$similarityの値に1を加算する。40個のプロダクトイオンについて比較が終了した時に$similarityが10以上、すなわち40個のうち少なくとも10個のプロダクトイオンに類似が見られれば、プリカーサーイオンを相同なものと判定する。
【0055】
上記の処理の結果、間期サンプルと分裂期サンプルとで522個のプリカーサーイオンが相同なものと判定された。すなわち間期サンプルの1770個のうち、間期サンプルに特異的なものが1248個、同じく分裂期サンプルでは2000個のうち1478個であった。この照合結果は比較マトリクスおよび作業ログとして出力された。
この処理結果に基づき、分裂期サンプルのデータを、分裂期サンプルに特異的なものと間期サンプルと相同性が見られたものとに分割した。これにより、分裂期サンプルからは間期にも存在するタンパク質に由来するプリカーサーイオンが差し引かれ、分裂期特異的なタンパク質に由来するプリカーサーイオンが残ったと予想される。
【0056】
処理の効果を確認するため、分裂期サンプルの処理前のデータ(プリカーサーイオン数2000個)と、間期サンプルと相同性が見られたものを差し引いたデータ(同1478個)を用いて、シゾンのゲノムデータベースに対してMASCOTによる検索を行った。検索結果を表1に示す。
データベース検索の結果、CMN262CやCME019Cといった細胞小器官の分裂に関与する既知のタンパク質の遺伝子や、CMD101CやCMJ069CといったGTP結合タンパク質の遺伝子のが、処理後において順位が顕著に上昇した。GTP結合タンパク質は、GTPおよびその加水分解物であるGDPと結合して様々な機能を持つタンパク質のファミリーであり、細胞骨格タンパク質などの生合成や輸送の調節に関わる。したがってこれらのGTP結合タンパク質も、細胞分裂の制御に関することが予想される。
逆に、CMV157C、CMV051C、CMV063C、CMV158Cなど葉緑体にコードされている光合成関連タンパク質の遺伝子は、軒並み順位が変動しないか低下した。これは、間期サンプルにもこれらのタンパク質に由来するプリカーサーイオンが存在しており、それが比較解析によって差し引かれたことを示している。従ってこれらのタンパク質は、細胞周期に非特異的に発現しているタンパク質であると予想される。
このように、本発明の方法によって、分裂期に特異的に存在すると予想されるタンパク質を効率的に抽出することができた。
【0057】
【表1】

【0058】
次に、プリカーサーイオンの相同性の判定においてウェルの位置情報を加味することの優位性を、図を参照しながら説明する。図2は間期サンプルと分裂期サンプルとを、設定を変えて照合した結果の比較マトリクスを図示したものである。横軸は間期サンプルのプリカーサーイオンであり、左から順に1番目から1770番目を表す。縦軸は分裂期サンプルのプリカーサーイオンであり、上から順に1番目から2000番目を表す。縦軸と横軸の交点に黒点がついている部分は、対応する縦軸と横軸のプリカーサーイオンが相同と判定されたことを示す。比較の詳細な方法やパラメータは上記の実施例に準じる、
(I)は、一段階目のプリカーサーイオンの比較の際にウェルの位置を考慮せず、プリカーサーイオンのm/zのみで判定した場合のマトリクスである。左上から右下にかけて黒点がシグモイド型に集中しており、この曲線に沿った黒点が、真に相同なプリカーサーイオン同士を相同と判定したものであることが予想される。しかし(I)では曲線の近傍以外にも、マトリクス全体に多くの黒点が分布している。これらは本来異なるプリカーサーイオンを相同とみなした、偽陽性の判定によるものと予想される。
偽陽性を減らすため、二段階目のプロダクトイオンの照合において判定の閾値を(I)の設定よりも上げた結果を(II)に示す。具体的には、40個のプロダクトイオンの照合において、(I)では10個以上が相同と判定されればプリカーサーイオンを相同と判定していたところ、この基準を15個以上に変更したものである。その結果、マトリクス全体に散在する黒点の個数は減ったものの、曲線に沿った黒点も減少している。これは本来相同とみなすべき組み合わせを見落とした、偽陰性の判定が増加したためと予想される。曲線上の黒点の減少は、マトリクスの右下において特に顕著である。
プロダクトイオン照合時の閾値を10に戻し、一段階目の比較でウェルの位置を考慮したものが(III)である。この設定は上記実施例と同じである。(III)では(I)と比べてマトリクス全体に散在する黒点を減らしながら、(II)よりも曲線に沿った黒点の減少を抑えることができた。これらの結果から、一段階目の比較においてウェルの位置情報を加味することは、プリカーサーイオンの相同性の判定に有効であることが示された。
【0059】
以上の実施形態は、本発明の例示や理解の補助を目的としたものにすぎず、特許請求の範囲に記載された保護範囲を限定するものではない。
【0060】
(実施例の参考文献)
Yoshida Y, Kuroiwa H, Misumi O, Nishida K, Yagisawa F, Fujiwara T, Nanamiya H, Kawamura F, Kuroiwa T.
Isolated chloroplast division machinery can actively constrict after stretching.
Science. 2006 Sep 8;313(5792):1435-8.PMID: 16960006
【産業上の利用可能性】
【0061】
本発明はLC-MALDIによって得られたデータの処理方法として汎用性があり、様々な局面で利用可能である。本発明によって、生体組織やそれに由来する抽出物、あるいは化学工業製品など、様々な試料における差分解析が可能となる。その一部を例示するならば、正常組織と病理組織のプロテオームを本発明で比較することによって、後者に特異的に発現する因子や逆に後者で失われる因子、いわゆるバイオマーカーを見出すことができる。これを創薬プロセスに組み込むことで、製薬における生産性の向上や、あらたな創薬ターゲットの発見などが期待される。また化学工業や食品工業などの現場においては、複数の同一製品を比較することで、製品の品質のばらつきや製品に含まれるコンタミネーションをチェックしたり、新品と経年品とを比較して経年劣化による組成変化を検出したりするなど、品質管理にも寄与することが考えられる。
逆に複数の試料間で共通するデータに着目するならば、様々な生体組織に共通して存在する因子を見出し、これをコントロールや標準物質として利用することができる。品質管理においては、異なる製品に共通して含まれる因子を見出すことで、製造環境に由来するユニバーサルなコンタミネーションを検出するなどの利用法が考えられる。
【図面の簡単な説明】
【0062】
【図1】多対多のデータを比較する場合における、本発明の解析方法の手順を示すフローチャート。
【図2】プリカーサーイオンの相同性の判定において、ウェルの位置情報を加味することの有用性を示す、処理結果の比較マトリクス図。

【特許請求の範囲】
【請求項1】
液体クロマトグラフィーによって分離した試料の画分をサンプルプレート上に所定の順番で所定の位置にスポットし、これらの画分をマトリックス支援レーザー脱離イオン化法によるイオン化部を備えたタンデム質量分析計に供して得られたプリカーサーイオンの相同性を判定する方法であって、(1)第一の試料に由来するプリカーサーイオンが取得されたサンプルプレート上の位置に対して、第二の試料に由来するプリカーサーイオンが取得されたサンプルプレート上の位置が所定の関係を満たし、かつ、(2)両プリカーサーイオンのプロダクトイオン群の比較により両プリカーサーイオンに相同性があるとされた場合に、相同性有と判定するステップを含むことを特徴とする方法。
【請求項2】
前記ステップは、
(1)第一の試料に由来するプリカーサーイオンが取得されたサンプルプレート上の位置に対して、第二の試料に由来するプリカーサーイオンが取得されたサンプルプレート上の位置が所定の関係を満たすことを判定する第一のステップと、
(2)第一のステップにおいてサンプルプレート上の位置が所定の関係を満たすと判定された両プリカーサーイオンのプロダクトイオン群の比較により両プリカーサーイオンに相同性があるかどうか判定する第二のステップと、
を含む請求項1に記載の方法。
【請求項3】
上記第一のステップは、さらに、両プリカーサーイオンの質量電荷比が所定の関係を満たすことを判定するステップを備えている、請求項2に記載の方法。
【請求項4】
上記(2)の要件における両プレカーサーイオンのプロダクトイオン群の比較は、プロダクトイオン群の質量電荷比及びピーク強度を比較することにより行われる、請求項1又は2に記載の方法。
【請求項5】
さらに、相同性が判定された複数のプリカーサーイオンから、相同性有と判定されたプリカーサーイオンの集合または相同性無と判定されたプリカーサーイオンの集合を取り出すステップを備えている、請求項1に記載の方法。
【請求項6】
さらに、前記集合を表示するステップを備えてなる請求項5に記載の方法。
【請求項7】
液体クロマトグラフィーによって分離した試料の画分をサンプルプレート上に所定の順番で所定の位置にスポットし、これらの画分をマトリックス支援レーザー脱離イオン化法によるイオン化部を備えたタンデム質量分析計に供して得られたプリカーサーイオンの相同性を判定するためのコンピュータプログラムであって、(1)第一の試料に由来するプリカーサーイオンが取得されたサンプルプレート上の位置に対して、第二の試料に由来するプリカーサーイオンが取得されたサンプルプレート上の位置が所定の関係を満たし、かつ、(2)両プリカーサーイオンのプロダクトイオン群の比較により両プリカーサーイオンに相同性があるとされた場合に、相同性有と判定するステップを含むことを特徴とするコンピュータプログラム、又は、該コンピュータプログラムを記録したコンピュータ読み取り可能な記録媒体。
【請求項8】
前記ステップは、
(1)第一の試料に由来するプリカーサーイオンが取得されたサンプルプレート上の位置に対して、第二の試料に由来するプリカーサーイオンが取得されたサンプルプレート上の位置が所定の関係を満たすことを判定する第一のステップと、
(2)第一のステップにおいてサンプルプレート上の位置が所定の関係を満たすと判定された両プリカーサーイオンのプロダクトイオン群の比較により両プリカーサーイオンに相同性があるかどうか判定する第二のステップと、
を含む請求項7に記載のコンピュータプログラム、又は、該プログラムを記録したコンピュータ読み取り可能な記録媒体。
【請求項9】
上記第一のステップは、さらに、両プリカーサーイオンの質量電荷比が所定の関係を満たすことを判定するステップを備えている、請求項8に記載のコンピュータプログラム、又は、該プログラムを記録したコンピュータ読み取り可能な記録媒体。
【請求項10】
上記(2)の要件における両プレカーサーイオンのプロダクトイオン群の比較は、プロダクトイオン群の質量電荷比及びピーク強度を比較することにより行われる、請求項7又は8に記載のコンピュータプログラム、又は、該プログラムを記録したコンピュータ読み取り可能な記録媒体。
【請求項11】
さらに、相同性が判定された複数のプリカーサーイオンから、相同性有と判定されたプリカーサーイオンの集合または相同性無と判定されたプリカーサーイオンの集合を取り出すステップを備えている、請求項7に記載のコンピュータプログラム、又は、該プログラムを記録したコンピュータ読み取り可能な記録媒体。
【請求項12】
さらに、前記集合を表示するステップを備えてなる請求項11に記載のコンピュータプログラム、又は、該プログラムを記録したコンピュータ読み取り可能な記録媒体。

【図1】
image rotate

【図2】
image rotate


【公開番号】特開2012−52940(P2012−52940A)
【公開日】平成24年3月15日(2012.3.15)
【国際特許分類】
【出願番号】特願2010−196367(P2010−196367)
【出願日】平成22年9月2日(2010.9.2)
【国等の委託研究の成果に係る記載事項】(出願人による申告)平成21年度独立行政法人農業・食品産業技術総合研究機構「イノベーション創出基礎的研究推進事業」産業技術力強化法第19条の適用を受けるもの
【出願人】(300071579)学校法人立教学院 (42)
【Fターム(参考)】