説明

コンステレーションマッピングおよびそれらの使用

本発明は、生物学的試料間で生体分子を比較するためのコンピュータによる方法およびシステムを特徴としている。これらの方法において、質量分析測定値が、2種またはそれ以上の試料中の生体分子について得られる。次にこれらの測定値は、本明細書に説明された方法により処理および解析され、それらをより比較可能なものとする。本発明者らは、この技術を「コンステレーションマッピング」(CM)と称する。得られたデータであるコンステレーションマップを用い、試料間の生体分子の存在量を比較することができ、リアルタイムで行う場合は、これを使用し、後のLC/MS-MSのために示差的存在量の生体分子を選択することができる。

【発明の詳細な説明】
【技術分野】
【0001】
発明の分野
本発明は、質量分析、バイオインフォマティクス、およびコンピュータを利用した分子生物学の分野に関する。特に本発明は、2種またはそれ以上の試料の生体分子の存在量を比較することに関する。
【背景技術】
【0002】
発明の背景
近年のゲノムおよびプロテオミクス研究に関する努力は、全体的な細胞および組織スケールでの生命分子を基礎とした分子の理解を非常に高めている。特に、生物の生体分子の時間的および空間的発現は、健常および疾患の両方において生じる生命のプロセスに寄与することが一層明らかになっている。科学は、いかにして遺伝的欠損が遺伝疾患を引き起こすかという理解から、癌のような複雑な医学的障害の病因において、複数の遺伝的欠損が環境因子と相互作用することの重要性の理解へと前進している。科学的証拠は、いくつかの極めて重要な遺伝子およびそれらのタンパク質産物の発現の変化および複数の欠損が、ヒトの癌において、重要な原因的役割を果たしていることを明らかにする。その他の複雑な疾患は、同様の分子基盤を有している。従って、生物の生体分子の発現と、健康または罹患した状態との間に確立することができる相関関係がより完全でかつ信頼できるようになると、より良く疾患を診断および治療することができる。何万種もの生体分子(例えば、タンパク質、脂質、核酸、糖質、代謝産物、およびそれらの組合せ)を各々が含み得る、異なる生物学的試料からの生体分子発現の効率的および迅速な比較を可能にする方法は、このような相関関係を決定する最も可能性が高い機会を提供するために必要である。例えばプロテオミクスデータは、遺伝子発現プロファイリングのような、他のデータ型からは正確に予測することができない、機能性分子の実際の発現レベルおよびそれらの翻訳後修飾を反映している。
【0003】
試料中のタンパク質の系統的同定および特徴付けに関連しているプロテオミクスの中心的な目標は、2種またはそれ以上の試料間のタンパク質組成を比較することができるようになることである。この目標を達成するのに重要なことは、唯一の試料または試料型に存在する全てのタンパク質、およびいくつかの試料または試料型に存在するが存在量が異なるタンパク質を同定する能力である。
【0004】
二つの生体分子が同じかまたは同等であると判断される方法は、生体分子のフィールド内の特定の生体分子を同定するために使用される方法、ならびに試料から集められたデータの完全性に依存する。しかしながら、組織試料由来の全領域のタンパク質を提示すると、タンパク質を比較のために同定および整合することは非常な困難となり得る。通常、試料中の全てのタンパク質の比較は、複雑なタンパク質混合物を、特定のタンパク質について特徴的移動位置を有する数百または数千のスポットに分ける、二次元(2D)ゲル電気泳動により実現される。ゲルおよび試料が適切に調製されかつ流されている場合には、ゲルパターンは、移動変量の補正により直接比較することができるが、ゲルの再現性は、実験室毎に、更には両性物質(ampholine)の異なるロットによっても、極めて可変性である。理論的には、各スポットは、一種類のタンパク質を表わし、各スポットの強度は、存在するタンパク質量の測定値とみなされる。このスポット中に存在するタンパク質は、次に質量分析または他の方法により、より完全に同定することができる;しかし、そのスポットの全フィールドはいうまでもなく、単独のタンパク質スポットの更なる同定でも、かなりの時間、労力および経費がかかる。2D電気泳動法は、いくつかの他の欠点も有し、その中で最も重要なものは、膜タンパク質同定の困難さである。一般に2-D電気泳動は、高疎水性分子の排除に関する問題点、および高荷電(高酸性または高塩基性)分子に加え、非常に小さい分子もしくは非常に大きい分子の検出における問題点を有する。加えて低存在量または中程度の存在量のタンパク質の検出も困難であり、これは配列解析のための十分な材料を収集するために、数個のゲルを流すことを必要としうる。2Dゲルスポットはまた、極めて大きい場合があり、このことはゲルの大部分にわたってタンパク質を希釈し、タンパク質の検出および正確な定量をより困難にしている。加えて、タンパク質、特に密接に関連したタンパク質または変種タンパク質の同時移動(co-migration)は、特定のタンパク質の適切な同定および定量の両方を妨害し得る。
【0005】
他方、一次元(1D)ゲル電気泳動は、少なくとも可溶性タンパク質および膜タンパク質の両方の研究を可能にするタンパク質分離に一般に適用可能な道具である。しかし、タンパク質の複雑な混合物が分析される場合、分離の際に50〜100本のタンパク質バンドしか、典型的に検出可能に作成されず、従って1Dゲル中の1本のバンドは、1種よりも多いタンパク質を含むことがある。この理由のために、1本のバンドの強度は、典型的には試料中の単独のタンパク質の存在量を反映せず、同様に同定も問題が多くなる。例えば、単独のバンドの質量分析は、異なる濃度でバンド内に存在する、一種のみではないにしても数種(例えば、10〜20種)のタンパク質の同定につながると考えられる。
【0006】
質量分析それ自身は、細胞内容物または細胞成分などの、分子の複雑な混合物を分析する方法の選択肢である。質量分析は、生体分子の分離および精製を可能にするクロマトグラフィーの適当な方法と組合せた場合、生体分子の同定および定量のためのデータ、ならびに異なる試料を例えるか、または識別するパターンのためのデータを、作成および分析する出発点を提供する。
【0007】
その最も基本において、質量分析は、生体分子の質量、および特定の走査に関するそれらの強度(イオン数)に関するデータを作成する。特異的分子の断片化パターンも作成することができるが、分子の更なる同定に使用することができるこれらの特徴的スペクトルは、最初の走査において作成された定量的データ(イオン数)には結びつけられない。この基本的データから構造情報を誘導するため、または、DNAもしくはタンパク質のようなポリマーの場合は、断片化パターンから配列情報を得るため、配列情報から供与源タンパク質を決定するため、および配列/同一性情報を定量データに連結するために、補助的努力が必要である。
【0008】
ある定量的質量分析技術は、異なる同位体タグを各被験試料のペプチドへ結合することに頼っている。この方法論の例は、同位体コード化アフィニティー標識法(ICAT)と称される(Hanら(2001)、Nat. Biotechnol. 19:946-51参照(PMID: 11581660))。この方法は、システイン残基に特異的な反応性基、リンカー鎖およびビオチン化部分を含むアルキル化剤などにより、タンパク質を誘導体化することからなる。このアルキル化剤は、リンカー鎖内の8個の水素原子(軽)または8個の重水素原子(重)に対応する軽型および重型を含む。二つの試料を比較する場合、一方の試料からの全てのペプチドを、軽タグで標識し、および他方の試料からの全てのペプチドを、重タグで標識する。次に両方の試料を混合し、トリプシンで消化し、そして同時に分析する。その結果質量スペクトルにおいて、同じペプチドに対応しているが重タグおよび軽タグの間で正確な質量差(8Da)だけ異なるイオン対が同定される。従ってこれらのイオンは、同じペプチドに対応しているが、二つの異なる試料に由来している。この方法は、二つの試料からの対応するペプチドの存在量の直接的比較を可能にする。試料を直接比較することができるにも関わらず、この技術は一般に、システイン残基を含む全てのペプチドは、分析される前に化学的に修飾されなければならないという制限を有する。このような修飾は、経費および時間の両面でより費用がかかる。これらは更に、反応が完了しない場合に、精度においても経費がかかり、または処理時間に起因した遅延は、タンパク質の分解につながる。更に化学的修飾は、ペプチド中の特異的アミノ酸システインの存在を必要とし、このことはペプチドの大半はこの分析に適していないことを意味する。この要件は、この方法の多種多様なタンパク質への適用可能性を大きく低下している。ICAT法は、MS/MS実験におけるビオチン化された断片イオン由来の干渉強度も生じ、ペプチド配列情報を決定する能力を妨害する。
【0009】
別の標識法は、水の軽同位体および重同位体を使用する。異なるタンパク質プール由来のトリプシンペプチドは、16Oおよび18O水で、C-末端標識される。この方法は、MS/MS実験におけるb-型およびy-型断片イオンの識別に使用される(Schevshenkoら(1997)、Rapid Commun. Mass Spectrom. 11:1015-1024)。この方法は同じく、アデノウイルスの二つの血清型においてタンパク質の異なる発現をモニタリングするためにも使用される(Yaoら(2001)、Anal. Chem.、73:2836-2842)。前述のように、タンパク質プールは、個別に消化され、標識され、および質量分析による分析のために組み合わされる。次に発現プロファイルが、重イオンの軽イオンに対する比を基に得られる。この方法は同じく、分析前にペプチドまたはタンパク質が標識されることを必要とし、従ってICATのように、不完全な反応、基質の非感受性により苦慮することがあり、余分な経費および余分な調製時間は、制限のある恐らく不安定な試料を害する可能性により、全てをより経費のかかるものにしている。これらの問題点は、生きている生物からこのような試料を調製することのさらなる課題により、一層悪くなる。
【0010】
質量分析データを使用する方法は、2種またはそれ以上の試料の構成生体分子を同定および比較するために、生体分子に関する理論的または推定された保持時間に依拠することがある。このような方法は、質量分析の前に試料を誘導体化または標識する必要性を回避することはできるが、偽陽性および偽陰性を生じ得る誤差を被ることがあり、比較精度を制限し、そのバリデーションを妨害し、そのプロセスを遅延する。例えクロマトグラフィーカラムの流量のような、装置特性の最小の変化により誘導される試料間の変動性であっても、容易に予測可能ではなく、誤差を増大し得る。
【0011】
従って質量分析データにおける存在する生体分子の比較に関する既存の方法は、生物学的試料の要素の、迅速で、正確で、自動化され、かつ経済的であることに加え、定性的、定量的、および特異的な判定を実行する能力を改善する必要がある。例えば、分析前には化学的に修飾されず、かつ試料の変動性を最小化するペプチドを含有する試料中のペプチド存在量を比較するために、質量分析データを使用した改良方法の必要性が存在する。更に生物学的試料間のタンパク質の相対的存在量を容易に比較し、並びに創薬の標的としてタンパク質を同定および特徴決定することができるための継続的かつ顕著な必要性が存在する。本発明は、これらの必要性を満たし、更に他の関連した利点を提供する。
【発明の開示】
【0012】
発明の概要
本発明は、生物学的試料間で生体分子を比較するためのコンピュータによる方法およびシステムを特徴とする。これらの方法において、質量分析測定値は、2種またはそれ以上の試料中の生体分子について得られる。その後、これらの測定値は、それらをより比較可能なものにするために本明細書に説明された方法により処理および解析される。本発明者らは、この技術を「コンステレーションマッピング(Constellation Mapping)」(CM)と称する。得られたデータであるコンステレーションマップを、試料間で生体分子存在量を比較するために使用することができ、かつ実時間で行われる場合は、後に続くLC/MS-MS獲得(acquisition)のためのLC-MS走査から示差的存在量の生体分子を選択するために使用することができる。LC/MS-MSスペクトルの結果は、ペプチドおよびタンパク質などの生体分子を同定するために使用することができる。このCM技術は、その有無または発現の変化が対象の疾患または状態に関係する個々の生体分子を迅速かつ正確に同定することを可能にする。このような生体分子(例えば、タンパク質)は、治療剤として、治療的介入の標的として、または診断、予後判定および治療に対する反応の評価のマーカーとして、有用である可能性がある。CM技術は、発現パターンが関心対象の疾患または状態に関連する生体分子のセットの迅速な同定も可能であり、生体分子のそのようなセットは、診断、予後判定および治療に対する反応の評価のための生物学的マーカーの集合を提供する。
【0013】
一つの局面において、本発明は、生物学的試料中の生体分子の存在量を決定する方法を特徴としている。一般にこの方法は、複数の生体分子を含有する生物学的試料を提供する段階;生体分子の複数のイオンを発生する段階;複数のイオンに対し質量分析測定を行い、これにより生体分子に関するイオン数を得る段階;イオンを生体分子へ割当てる段階;および、生体分子のイオン数を積算し、これにより生物学的試料中の生体分子の存在量を決定する段階を含む。存在量の計算は、MIPS(「質量強度プロファイリングシステムおよびその使用(Mass Intensity Profiling System and Uses Thereof)」、米国実用特許出願第10/293,076号)について使用されるものに類似してよい。
【0014】
特に、本発明は、試料中の2種またはそれ以上の多いペプチドの存在量を決定および比較するための方法およびシステムを特徴とするが、更に下記の方法を他の生体分子に適用してもよい。これらの方法は、1種または複数種のLC/MS走査から得られる質量分析のデータ解析を基にしている。
【0015】
本発明は更に、LC-MS走査からの生体分子の、その対応するLC-MS/MS断片化スペクトル(得られる場合)への迅速な整合を特徴としている。ペプチドに関して、例えばこれは、LC-MS/MSベースの配列データのペプチド存在量データとの結合を可能にする。
【0016】
別の態様において、CMは、存在量を予め計算し、または計算せずに、かつ1種または複数種のペプチドまたはタンパク質を予め同定し、または同定せず、1種または複数種の試料中の1種または複数種のペプチドまたはタンパク質の存在量を照会するために使用することができる。
【0017】
様々な態様において、ペプチド存在量の計算は、絶対的または相対的であってよい。一般に存在量は例えば、電荷状態、同位体、修飾された状態、またはそれらの組合せのサブセットなどの、試料内の一貫した選択を基にしたイオン数の総和により決定される。
【0018】
試料データを新たに作成する必要はない。比較に使用される1種または複数種のデータセットは、試料データの同じセット内、並びに/または参照試料、操作された試料、代表的試料、組合せ試料および/もしくは理論的試料を含むが、これらに限定されない、1種または複数種の他のデータのセットに由来しても良い。このデータは、スクラッチ(scratch)から処理される必要はないが、同位体マップまたはペプチドマップからのように、中間レベルでの処理を選択してもよい。比較は、反復プロセスまたは累積プロセスの一部であることができる。
【0019】
様々な態様において、試料中のペプチドまたはタンパク質は、1種または複数種のペプチドまたはタンパク質のリストの製作の全体または一部として使用することができ、これは次に別のリストと組合わせるか、または同じもしくは別の試料の更なる解析におけるLC/MS-MSによるスペクトル決定のための選択のような、照会(クエリー)、整合(マッチング)、または管理データ収集のために、直接的もしくは間接的に使用することができる。
【0020】
本発明は更に、2種またはそれ以上の生物学的試料中の生体分子存在量の比較のためのコンピュータで実行される方法を特徴としている。このコンピュータで実行される方法は、一般に質量分析データを入力する段階、重心計算(centroiding)およびノイズ低減をする段階、同位体マップを製作する段階、ペプチドを検出および中心化する段階(centering)、ペプチドマップを製作する段階、ペプチドマップを整列化し、これにより生物学的試料中の生体分子の示差的存在量を決定する段階を含む。
【0021】
一般に本発明は、質量分析データを入力する段階、重心計算およびノイズ低減をする段階、同位体マップを製作する段階、ペプチドを検出および中心化する段階、ペプチドマップを製作する段階、ペプチドマップを整列化し、これにより生物学的試料中の生体分子の示差的存在量を決定する段階を含む、2種またはそれ以上の生物学的試料間で生体分子の存在量を比較するための、1種または複数種のプログラムを備える、コンピュータで読取り可能なメモリーを特徴とする。
【0022】
更に別の局面において、本発明は、システムがプロセッサおよびプロセッサに接続されたメモリーを備え、ここでメモリーが、ノイズ低減モジュール、ペプチド検出モジュール、および/またはペプチドマップアラインメントモジュールの、1種または複数種をコードしている態様を含む:。
【0023】
別の局面において、本発明は、複数の生体分子に関するイオン数を含む質量分析データを入力する段階;生体分子にイオンを帰属させる段階;生体分子のイオン数を積算し、これにより生物学的試料中の生体分子の存在量を決定する段階;ならびに、生体分子の存在量を表示する段階を含む、使用者に生物学的試料中の生体分子の存在量に関する情報を表示する方法を特徴とする。一つの態様において、本方法は、メモリーに生体分子の存在量を記憶させる段階を更に含み得る。
【0024】
前述の局面のいずれかの様々な態様において、生体分子は、誘導体化されなくても良く、および/または標識されなくても良い。この生体分子は、切断された生体分子であってもよい。好ましい態様において、生体分子は、酵素で切断される。しかし一般に、これらの方法は、生体分子の同位体標識またはアルキル化のような、切断以外の修飾を必要とせず、すなわち、切断された生体分子は、誘導体化されないか、および/または標識されなくても良い。望ましいならば、本発明は、生物学的試料中の1種または複数の内部標準の包含を特徴とする。
【0025】
更に別の態様において、コンピュータ手法は、イオンの非荷電質量を計算することにより、イオンを生体分子に帰属させる。あるいはイオンは、例えば、ペプチド質量フィンガープリント法のような、質量フィンガープリント法により、生体分子に帰属させることができる。更に別の態様において、コンピュータ手法は、生体分子に対応するイオンのイオン数を積算する。この積算は好ましくは、1種または複数の電荷状態、同位体、走査、生体分子の断片、分離の画分、またはそれらの組合せの全体にわたる。別の態様において、本発明は更に、MS分析前の複数の生体分子の分離を特徴としている。典型的には、このような分離は、当技術分野において公知の標準の方法を用い実行される。これらの方法は、クロマトグラフィー、電気泳動、免疫分離(例えば、磁気ビーズの使用)、または遠心分離を含むが、これらに限定されない。イオンの保持時間は、1種または複数の内部標準を用いて補正することができる。
【0026】
前述の局面のいずれかの様々な他の態様において、生体分子は、典型的にはタンパク質または修飾されたタンパク質である。好ましくは、このタンパク質は、単離されたオルガネラから得られる。単離されたオルガネラの例は、ミトコンドリア、葉緑体、ER、ゴルジ、エンドソーム、リソソーム、ファゴソーム、ペルオキシソーム、分泌小胞、輸送小胞、核、および形質膜を含むが、これらに限定されるものではない。他の細胞成分から得られたタンパク質も、本発明において有用である。これらのタンパク質は、細胞質ゾルタンパク質または細胞骨格タンパク質を含む。
【0027】
好ましい態様において、質量分析測定値は、例えばMS/MS分析により、生体分子のイオンの構造情報または配列情報を集めることにより得られる。生体分子またはそのイオンは、照会により構造分析または配列分析(例えば、MS/MS分析)について選択されてもよい。一つの態様において、包含または除外リストを用い、どのイオンに構造または配列分析が施されるかが決定される。本発明の方法およびシステムは更に、データベースからイオン配列を含むタンパク質を同定するための、コンピュータ手法の使用を特徴としている。手法の例は、Mascot(登録商標)、Protein Lynx Global Server、SEQUEST(登録商標)/TurboSEQUEST、PEPSEQ、SpectrumMill、またはSonar MS/MSを含む。このような手法を用い検索されるデータベースの例は、Genbank(登録商標)、EMBL、NCBI、MSDB、SWISS-PROT(登録商標)、TrEMBL、dbEST、またはヒトゲノム配列(Human Genome Sequence)データベースである。更に、これらの方法およびシステムは、イオンをデータベースから同定されたタンパク質に帰属させるために、コンピュータ手法を使用する。
【0028】
前述の局面のいずれかの様々な別の態様において、本発明は、対照生物学的試料に対する生体分子の存在量を計算すること、および対照生物学的試料に対する複数の生体分子の存在量を計算することを特徴としている。典型的には、生体分子セットの存在量測定値は、疾患または状態を診断するために使用される。加えて、存在量は、薬物の標的とする生体分子を決定するために使用される。このような標的は、対照試料と比べ、生物学的試料中の生体分子の存在量の増加もしくは減少、または生体分子の有無を評価することにより同定される。生体分子の存在量を用い、生体分子のアイソフォーム量、または生体分子の天然の修飾量を決定することもできる。
【0029】
「イオンの生体分子への割当て」は、質量分析において観察されたイオンが発生された生体分子を特定することを意味する。イオンは、生体分子またはそれらの断片に割当てることができる。そのような割当ては、例えば、分子量、または他の物理化学的特徴を基にすることができる。この割当ては、イオンの分子量の決定およびその質量を既知の生体分子と整合することを基に、またはデータベース検索に使用することができる、イオンに関する構造情報もしくは配列情報を同定するMS/MSなどからのデータを基に、行うこともできる。
【0030】
「生体分子」は、生物学的試料中に存在する有機分子を意味し、これはペプチド、ポリペプチド、タンパク質、転写後修飾されたペプチドもしくはタンパク質(例えば、グリコシル化、リン酸化、またはアシル化されたペプチド)、オリゴ糖、多糖、脂質、核酸、および代謝産物を含む。生体分子は、それらの天然の状態において、単離され、精製され、標識され、誘導体化され、切断され、断片化されるか、それらの組合せであることができる。好ましくは、生体分子は標識されないかまたは誘導体化されない。より好ましくは、これらは、標識されずかつ誘導体化されない。好ましくは、生体分子はタンパク質およびペプチドであり、より好ましくはこれらはプロテアーゼ、好ましくはトリプシンにより切断される。
【0031】
「生物学的試料」(または「試料」)は、いわゆる単細胞微生物(細菌および酵母など)、ならびに多細胞生物(植物および動物など、例えば脊椎動物または哺乳類、特に健常または見かけ上健常なヒト被験者、または診断もしくは検査されるべき状態または疾患に罹患したヒト患者)を含む、任意の生きている生物から得られるか、排泄されるか、または分泌される、固形または液体の試料を意味する。生物学的試料は、任意の部位(血液、血漿、血清、尿、胆汁、髄液、房水もしくは硝子体液、または任意の体分泌物など)、排出液(膿瘍または任意の他の感染部位もしくは炎症部位から得られた液体など)、または関節から得られた液体(正常な関節もしくは慢性リウマチのような疾患に罹患した関節など)から得られた生物学的液体であって良い。あるいは、生物学的試料は、臓器または組織(生検もしくは剖検標本を含む)から得ることができ、あるいは細胞(初代細胞もしくは培養細胞のいずれか)、または任意の細胞、組織もしくは臓器により馴化された(conditioned)培地を含むことができる。望ましいならば、生物学的試料には、予備的分離技術を含む、予備処理が施される。例えば細胞または組織は、抽出され、ならびに例えば細胞の異なる部分に認められるタンパク質または薬物のような、個別の細胞下画分中の生体分子の分離分析のために細胞下分画を施すことができる。試料は、例えばゲルのバンドのような、試料のサブセットとして分析することができる。
【0032】
「CM」は、コンステレーションマッピングを意味する。
【0033】
「画分」は、分離の一部を意味する。画分は、例えばLC(液体クロマトグラフィー)などにおける所定の時間枠内に得られた液量に対応することができる。画分は、ゲル電気泳動により促進された生体分子の分離におけるバンドのように、分離における空間的位置に対応することもできる。
【0034】
「インジェクション」は、それにより測定値が作成されうる、質量分析器へのインジェクションを意味する。
【0035】
「生体分子のイオン数の積算」は、m/z値の規定された範囲内のデータに関するイオン数を総計算することを意味する。この語句は同じく、2種またはそれ以上のイオンの積算されたイオン数を総計算することも意味する。例えば、異なる電荷状態、同位体、分離の画分、走査、または生体分子の断片で認められたイオンを、積算することができる。
【0036】
「強度の正規化」は、一般に線形回帰によるデータの1種または複数種のセットにおける強度値の調節を意味し、これはMIPS(「質量強度プロファイリングシステムおよびそれらの使用」、米国実用特許出願第10/293,076号)によるペプチド存在量の計算のような、データセット間のより相対的な比較を可能にする。
【0037】
「LC」は、液体クロマトグラフィーを意味する。
【0038】
「LC-MS」または「LC-MS」は、当該技術分野において公知である、質量分析を連結した液体クロマトグラフィーを意味する。
【0039】
「LC-MS-MS」または「LC-MS/MS」は、当該技術分野において公知である、縦列質量分析を連結した液体クロマトグラフィーを意味する。
【0040】
「MS-MS」または「MS/MS」は、当該技術分野において公知である、縦列質量分析を意味する。
【0041】
「前駆体」は、例えば、潜在的なペプチドもしくはタンパク質または配列もしくは同一性が未知のものなどの、生体分子を意味する。一般にこれは、MS/MSによる配列決定のような、二次的同定作業に先立つ、質量分析調査走査データにおける潜在的なペプチドを意味する。「前駆体」は、それらの質量またはそれらの保持時間を比較することにより同定されることが多い。このような保持時間は、実験的または理論的であることができる。理論的保持時間は、補正されることが多く、ここでは1種または複数種の内部標準が使用され、試料間で同等の保持時間を生じる。推定された保持時間を用い、走査内で前駆体を探索することができる。「前駆体」は、「ペプチド」と互換的に使用されることが多く、完全長タンパク質から個々の構成的ペプチドを区別するために使用することができる。
【0042】
用語「タンパク質」は、1個のアミノ酸(またはアミノ酸残基)のα炭素に結合したカルボン酸基のカルボキシル炭素原子が、隣接アミノ酸のα炭素に結合したアミノ基のアミノ窒素原子と共有結合する場合に形成される、ペプチド結合を介して連結された、2個またはそれ以上の個別のアミノ酸のポリマーを意味する。用語「タンパク質」は、その意味において、「ポリペプチド」および「ペプチド」(これらは、時々、本明細書において互換的に使用することができる)を、更には翻訳後修飾およびそれらの断片を含むと理解される。それは単数または集合的に使用されても良く、複数のアイソフォーム、変種、修飾物、関連ファミリーのメンバー等に言及しても良い。加えて、複数のポリペプチドサブユニット(例えば、インスリン受容体、シトクロムb/cl複合体、およびリボソーム)または他の成分(例えば、RNA分子)を含むタンパク質も、本明細書において使用されるように「タンパク質」の意味に含まれることは理解されるであろう。同様に、タンパク質およびポリペプチドの断片も、本発明の範囲内であり、かつ本明細書においては「タンパク質」、「ポリペプチド」もしくは「ペプチド」、「トリプシンペプチド」、または「切断断片」と称しても良い。「構成要素ペプチド」は、その配列が、より大きいペプチドまたは完全長タンパク質の配列の直鎖状サブセットであるようなペプチドである。特定のタンパク質の「構成要素ペプチド」は、グループとして、そのタンパク質を形成しているもののセットまたはサブセットである。通常これは、タンパク質を形成するトリプシンペプチドのセットのような、特定の切断断片に限定されたサブセットである。「完全長タンパク質」は、メッセンジャーRNA(mRNA)によりコードされ、かつそれから翻訳されたタンパク質、ならびにその翻訳後修飾物を意味する。完全長タンパク質は、本明細書に説明されたような、コンピュータ手法によるデータベース検索により同定することができる。「ペプチド」または「タンパク質」は、「ペプチド検出」と記述する際などの、特異的ではあるが、非限定的な生体分子の典型として文書中において使用されても良い。
【0043】
「照会」とは、一般的に問いに答えるための、特定の作用の選択を意味する。照会の一例において、ソフトウェアにより保存されたリストを基に、イオンをMS/MSに供してもよい。あるいは、MS/MSに供されるイオンを手作業により選択することができる。この手作業による選択も、照会である。
【0044】
「走査」は、単独の試料からの質量スペクトルを意味する。測定される分離画分の各々は走査を生じる。生体分子が複数の分析される画分中にある場合は、その生体分子の質量スペクトルは、複数の走査に存在する。
【0045】
「誘導体化されない」生体分子またはその断片とは、その天然の状態から化学的に変更されていない生体分子またはその断片を意味する。誘導体化は、生体分子またはそれらの断片の非-天然の合成の間、またはその後の操作もしくは処理の間に起こり得る。
【0046】
「標識されない」生体分子またはそれらの断片とは、生体分子またはその断片に天然に合成された生体分子と異なる物理化学特性をもたらす、外来性標識(例えば、同位体標識または放射標識)で誘導体化されない、生体分子またはその断片を意味する。
【0047】
本発明のコンステレーションマッピングは、例えば質量分析インジェクションの対の中で検出されたペプチドを整列化するために使用することができる、バイオインフォマティクスの道具である。インジェクション対は、LC-MS対LC-MS;LC-MS対LC-MS-MS;または、LC-MS-MS対LC-MS-MSのいずれかであることができる。ペプチドアラインメントは、パターン整合および反復改良法を利用し製作される。
【0048】
本発明の方法およびシステムは、多くの有意な利点を提供する。例えば、これらの方法およびシステムは、生物学的試料の誘導体化または標識に頼ることなく、生体分子の存在量の直接比較を可能にする方法で、質量分析およびデータ解析を組合せている。本発明は、液体クロマトグラフィー(LC)カラムオフセットのような全般的な保持時間シフト(global retention time shift)に対して強固であり、かつ部分的保持時間シフト(local retention time shift)に対し強固であり、インジェクションからのデータを同等にするようにそれらを調節し、かつひとつのLCシステムから別のものへの生体分子溶出を推定するために使用することができる非線形の保持時間変換関数を作成する。質量スペクトル全体からの情報も、参照インジェクションを必要とせずに、発現レベルの決定および保持時間変動の補正に使用することができる。典型的には、コンステレーションマッピングを使用せずに、質量スペクトルに存在する大量の情報は廃棄され、特定のイオン強度、または、特定のペプチドの配列、またはペプチド質量のリストのようなサブセットのみが、解析されるであろう。コンステレーションマッピングは、生体分子の存在量の比較に有用な、共通の生体分子を基にしたインジェクション対の間での強度の正規化を決定するが、しかし生体分子アラインメントおよび保持時間補正は、強度とは無関係であり、そのため著しく異なるインジェクションに適用することができる。
【0049】
CMは、インジェクション間で共有された生体分子の検出に加え、それらのインジェクションに固有の生体分子の同定を可能にする。並びに、コンステレーションマッピングは極めて迅速であるので、自動化の採用は、解析に必要な時間を大きく短縮し、これにより大規模プロテオミクス試験において必要であるような、数千種のペプチドアラインメントが可能になる。
【0050】
本発明のその他の特徴および利点は、以下の図面および詳細な説明、並びに「特許請求の範囲」から明らかであろう。
【0051】
発明の詳細な説明
本発明は、2種またはそれ以上の試料間で、定性的、定量的またはそれら両方で、1種または複数種の生体分子の、保持時間オフセットを作成し、かつ存在量を比較するための方法およびソフトウェアを特徴としている。ひとつの適用において、本発明の方法およびシステムを用い、例えば、相対発現レベルの変動を決定するか、または相対発現の比が予め設定された値を上回るもしくは下回るようなペプチドを同定するために、2種またはそれ以上の試料中に存在する多数のペプチドを比較する。その後、発現プロファイルの統計解析を用い、疾患診断および創薬などのための、ペプチドマーカーを同定することができる。
【0052】
生物学的試料
本発明の方法を用い、生物学的試料中の1つまたは複数の生体分子の発現プロファイルを、モニタリングすることが出来る。本発明の方法において有用な生体分子の例は、例えば、ペプチド、ポリペプチド、タンパク質、翻訳後修飾されたペプチド(例えば、グリコシル化、リン酸化、またはアシル化されたペプチド)、オリゴ糖および多糖、脂質、核酸、ならびに代謝産物などの、生物学的試料中に存在する任意の分子を含む。単細胞の微生物(細菌および酵母など)、ならびに多細胞生物(植物および動物、例えば脊椎動物または哺乳類、ならびに特に健常なもしくは見かけ上健常なヒト被験者、または診断もしくは検査されるべき状態もしくは疾患に罹患したヒト患者)を含む、いずれかの生存している生物から得られるか、排出されるか、または分泌される、固形または液体試料を含むが、これらに限定されない、事実上あらゆる生物学的試料が、本発明の方法において有用である。生物学的試料は、任意の部位(血液、血漿、血清、尿、胆汁、髄液、房水もしくは硝子体液、または体の分泌物など)、排出液(膿瘍または任意の他の感染もしくは炎症部位から得られる液体など)、または関節から得られる液体(正常な関節または慢性リウマチのような疾患に罹患した関節など)から得られる生物学的液体であって良い。あるいは、生物学的試料は、臓器または組織(生検または剖検標本を含む)から得ることができ、あるいは細胞(初代細胞もしくは培養細胞のいずれか)または任意の細胞、組織もしくは臓器により馴化された培地を含むことができる。望ましいならば、生物学的試料には、予備的分離技術を含む、予備処理が施される。例えば、細胞または組織は抽出され、例えば細胞の異なる部分に認められるタンパク質または薬物のような、個別の細胞下画分中の生体分子の分離分析のために、細胞下分画に供してもよい。このような分画法の例は、De Duve((1965) J. Theor. Biol. 6:33-59)に説明されている。
【0053】
タンパク質を分析する場合、望ましいならば、生物学的試料は、存在する非-ペプチド性物質の量を減少させるために、精製される。更に望ましいならば、タンパク質-含有試料を切断し、分析のためのより小さいペプチドが作成される。このペプチドの切断は、一般に、酵素的に、例えばトリプシン、エステラーゼ、もしくはキモトリプシンでの消化により、または化学的に、例えば臭化シアンにより達成される。タンパク質の特異的位置での切断は、これらのペプチド配列が分かっている場合に、作成されるより小さいペプチドの質量の予測を可能にすることが出来る。比較されるべき全ての試料は、典型的には同じ方法で処理される。
【0054】
本明細書において説明された方法で実行される場合に、望ましいならば、参照試料が含まれてもよい。この参照試料は典型的には、既知量の生体分子を含むか、または例えば非疾患組織のような、既知の供与源に由来することができる。参照試料は、公知の生体分子から合成することができる。加えて、未知の試料は、相対存在量を決定するために、参照資料と比較することができる。参照試料は、適当ならば、内部標準として作用するために、他の試料と一緒にしてもよい。
【0055】
生体分子の分離
前述のいずれかの生体分子を分離する多種多様な技術が、当業者に周知であり(例えば、Laemmli、Nature 1970、227:680-685;Washburnら、Nat. Biotechnol. 2001、19:242-7;Schaggerら、Anal. Biochem. 1991、199:223-31)、かつ本発明に従い使用することができる。
【0056】
一つの適用において、本発明の方法は、タンパク質の複雑な混合物を研究するために使用される。例証として、タンパク質の混合物を、等電点(例えば、クロマトフォーカシングまたは等電点フォーカシングにより)および/または、電気泳動移動度(例えば、非変性電気泳動、または2-メルカプトエタノールもしくはジチオスレイトールのような還元剤へ予め曝露するか、もしくは曝露しない、尿素もしくはドデシル硫酸ナトリウム(SDS)のような変性剤の存在における電気泳動による)を基に、いずれか適当なマトリックス上でのLC、FPLCおよび/またはHPLCを含むクロマトグラフィーにより(例えば、ゲル濾過クロマトグラフィー、イオン交換クロマトグラフィー、逆相クロマトグラフィー、またはアフィニティークロマトグラフィー、例えば固定化抗体または磁気ビーズ上に固定されたレクチンもしくは免疫グロブリンによる)、および/または遠心分離(例えば、等密度遠心または速度遠心)により、分離することができる。
【0057】
場合によっては、2種の異なるペプチドは、質量分析計の分解能内で同じ質量を有することがあり、このことはこれらの2種のペプチドの存在量の決定を困難にする。質量分析による分析前のペプチドの分離は、同一質量の2種のペプチドの存在量の分解を可能にする。その後分離画分の多くのスペクトルが得られるが、これらのスペクトルは典型的には、そのペプチドからのイオンピーク数を減らし、このことは所定のスペクトルの分析を単純化する。
【0058】
ひとつの態様において、タンパク質の混合物は、当該技術分野において公知の方法に従い、1Dゲル電気泳動により分離される。分離されたタンパク質を含むレーンは、ゲルから切り出され、画分に分離される。その後これらのタンパク質は、酵素により消化される。その後各画分中に生成されたペプチドは、質量分析により分析される。例えば、正常組織および腫瘍組織からの細胞膜画分由来のタンパク質は、可溶化され、1D SDSポリアクリルアミドゲル電気泳動(PAGE)により分画される。ゲルは、24個の同等のバンドに切断され、各バンドはトリプシンにより消化され、ナノ-液体クロマトグラフィー-質量分析(LC-MS)による分析のためのペプチドが得られる。各ペプチド画分は、QTOF(四重極飛行時間型)質量分析装置へのエレクトロスプレーにより連結された、ナノ-液体クロマトグラフィーC18カラムに注入される。
【0059】
別の態様において、ペプチドは、当技術分野において公知の方法に従い、2Dゲル電気泳動により分離される。その後これらのタンパク質は、酵素により消化され、ならびに各画分中に生成された消化ペプチドは、次に切出され、質量分析により分析される。更に別の態様において、ペプチドは、当技術分野において公知の方法により、多次元LCを含むが、これに限定されない、液体クロマトグラフィー(LC)により分離される。LC画分は、収集しおよび分析することができ、または溶離液は、実時間分析のために質量分析計に直接連結することができる。LCを使用し、ゲル電気泳動により得られた画分を更に分離することができる。LC中のペプチドの保持時間(RT)の記録は、複数の画分中のそのペプチドの同定を可能にする。この同定は典型的には、正確な存在量を得るために有用である。前記態様のいずれかにおいて、所定のペプチドは、画分がどのようにして得られたかに依存して、複数の画分中に存在しうる。
【0060】
質量分析
質量分析技術を用い生体分子を分析する例証的方法は、当技術分野において周知である(Godovac-Zimmermannら(2001)、 Mass Spectrom. Rev. 20:1-57(PMID:10344271);Gygiら(2000)、Proc. Natl. Acad. Sci. U.S.A. 97:9390-9395(PMID:10920198))。
【0061】
ペプチドに関連する適用において、ペプチドは、質量分析計へ進入する前に、例えば電子スプレーイオン化によりイオン化され、その後望ましいならば異なる種類の質量スペクトルが得られる。質量分析計の正確な種類は、本明細書に開示される方法にとって重要ではない。例えば、サーベイ走査において、試料中の電荷をもつペプチドの質量スペクトルが記録される。更に1種または複数のペプチドのアミノ酸配列が、マトリックス支援レーザー脱離/イオン化-飛行時間質量分析(MALDI-TOF MS)、電子スプレーイオン化質量分析(ESI MS)、またはタンデム質量分析(MS/MS)のような、適当な質量分析技術により決定される。MS/MS走査において、サーベイ走査において検出された特異的イオンが選択され、衝突チャンバーへ進入する。MS/MSのためにイオンを規定する能力は、特異的前駆体についてのデータの獲得をもたらすが、他の前駆体を排除する可能性がある。これらのイオンは、予め定められたリストまたは照会により規定することができる。リストは、包含リスト(すなわち、リスト上のイオンにMS/MSが施される)または除外リスト(すなわち、リスト上のイオンにMS/MSが施されない)であってよい。その後衝突チャンバー内で発生する一連の断片自身が、質量分析により分析され、こうして得られたスペクトルが記録され、かつ例えば、このように処理された特定のペプチドのアミノ酸配列を同定するために使用されても良い。次にこの配列は、ペプチド質量のような他の情報と共に、例えばタンパク質を同定するために使用することができる。MS/MSサイクルに供されるイオンは、使用者により定義されるか、または測定器(spectrometer)により自動的に決定されてよい。
【0062】
好ましい態様において、比較されるべき試料間の変動性は、インターリーブ(interleaving)により最小化される。例えば質量分析は、試料1のバンド1について行われ、次に同じ機器の同じカラム上で試料2のバンド1について行われ、その後MS-MSが、試料1のバンド1について、その後試料2のバンド1について行われ、その後各試料のバンド2について行われる(図2参照)。同じく好ましい態様において、コンステレーションマッピングが、リアルタイムで実行され、MS-MSについて示差的存在量のペプチドの選択を可能にすることにより、変動性を最小化し、その結果インターリーブのパターンを辿ることができる。
【0063】
コンステレーションマッピング(CM)
質量スペクトルを解析するソフトウェアは、典型的には、イオンが誘導された生体分子を同定するために使用される。しかしLC-MS走査の比較は、保持時間内で部分的非線形変動が生じた場合、非常に困難となり得る。本明細書に説明されたように、自動化された方法は、2種またはそれ以上の試料について記録された質量スペクトルの処理を可能にし、その結果試料中の生体分子の包括的比較を実現し、かつ示差的存在量の生体分子が固定され、リアルタイムで実行されるものを含み得る、後のMS-MSラウンドのために、選択される。
【0064】
本明細書に説明された方法は、事実上任意のコンピュータシステムを用い、かつ下記の例証的プログラムに従い実行される。図1は、例証的コンピュータシステムを示す。コンピュータシステム2は、内部コンポーネントおよび外部コンポーネントを備える。内部コンポーネントは、メモリー6に連結されたプロセッサー4を備える。外部コンポーネントは、例えば、ハードディスクドライブのような大容量記憶装置8、例えば、キーボードおよびマウスのような使用者入力装置10、例えばモニターのようなディスプレイ12、ならびに通常、データおよび処理作業を共有することができるようにコンピュータシステムを他のコンピュータへ接続することが可能な、ネットワークリンク14を備える。プログラムは、操作時に、このシステム2のメモリー6へロードされる。これらのプログラムは、例えば、コンピュータシステムを管理するMicrosoft Windowsのようなオペレーションシステム16、本発明の方法を実行するプログラムを補助する共通言語および関数を符号化するソフトウェア18、ならびに処理言語または記号パッケージ(symbolic package)内に本発明の方法を符号化するソフトウェア20を含んでいる。この方法をプログラムするために使用することができる言語は、Microsoft社のVisual C/C++であるが、これに限定されるものではない。好ましい適用において、本発明の方法は、等式の記号入力および処理の高レベルの特定化を可能にする、数学的ソフトウェアパッケージにおいてプログラムされ、これはこれらのプログラムの実行において使用される手順を含み、これにより使用者は処理用の個別の等式または手順をプログラムする必要性から解放される。この目的に有用な数学的ソフトウェアパッケージの例は、Mathworks社(Natick、MA)によるMatlabである。Matlabソフトウェアを使用し、多重プロセッサーにおける処理を支援する、パラレルバーチャルマシン(Parallel Virtual Machine、PVM)モジュールおよびメッセージパッシングインターフェース(Message Passing Interface、MPI)に適用することもできる。このPVMおよびMPIの本明細書の方法による実行は、当技術分野において公知の方法を用いて達成される。あるいは、このソフトウェアまたはその一部は、当技術分野において公知の方法により専用の回路に符号化される。CMは本明細書において記載される方法を手動で実施する場合に比べて、解析のスピードを有意に増加させる。
【0065】
ひとつの適用において、本発明は、タンパク質を研究するためのコンピュータで実行されたモジュールを特徴としている。このようなモジュールは、ここで、本発明の方法の例として説明される。他の生体分子は、同様のモジュールを用いて研究することができる。望ましいならば、CMは、解析に必要な時間を短縮するために、マルチプロセシング環境において、同時に実行することができる。このマルチプロセシング環境は、例えば、システム(例えば、Linux-ベースのPC)のクラスター、またはマルチプロセッサ(例えば、Sun Microsystems社製)のサーバーを含み、本明細書の方法は、当該技術分野において公知の方法を用い、そのような分散型ネットワーク上で実行される(Taylor et al.(1997) Journal of Parallel and Distributed Computing 45:166-175参照)。
【0066】
例示的なCMのフローチャートは、図2に示されている。実線の長方形は、CMのプロセシング要素を表し、点線の長方形は、CM内でないプロセシング要素を表し、および長方形を伴わない記入項目はデータファイルである。各要素は、以下に詳細に説明され、プロセシングモジュールとして例示されている。このフローチャートは、本発明の方法を例示するために提示されており、これを限定するものではない。
【0067】
ノイズ低減および重心計算
質量分析装置による生物学的試料の分析において、この装置は、試料中の異なるイオンを記録する。各走査において測定される値は、m/z(質量/電荷比)、並びにイオンの強度または周波数である(これはLCからの保持時間値も持つ)。高感度の装置は、MSサーベイ走査により生じた生データを、大きい割合のバックグラウンドノイズにより悩ませる結果となり、これはデータの解釈において課題をもたらす。ノイズ強度は可変性なので、弱いシグナルとノイズを識別することは困難である。かつ、ノイズを伴う生データのサイズは、解析の複雑さのために、下流のプロセシングを時間および演算能力に関して非効率かつ非実践的にする。しかし感度限界もまた、質量分析装置の最低計数のために、1個の生体分子(同じ化学組成の異なるイオン)に関するイオン数をm/z値の範囲の全域に広げることにより、この複雑さを増大する。例えば、電荷2を持つ質量900の5種の分子が、質量分析により観察される。「実際の」m/zは、「理想的」m/z、すなわち900/2=450であるが、質量分析装置の測定値は、「実際の」m/zのサンプリングであり−この質量分析装置は、これらのペプチド全てをm/zにおいて正確に450.000000としては読みとらず、ほとんどの場合、その装置の最低係数だけ実際の値とは異なり、5種の異なるm/z値(例えば、449.93、450.01、450.06、450.0、449.99)を示し、これは強度1の5種のペプチド(またはノイズ)として解釈されるが、これらは実際には、強度5である1種のペプチドを表している。従ってノイズ低減モジュールは、精度、感度、および速度を大きく増大し、ペプチド検出モジュールのためのデータ源を提供する同位体マップを製作する。
【0068】
図3は、ノイズ低減モジュール(NRM)の要素を詳述するフローチャートである。実線の長方形は、NRMのプロセシング要素を表し、点線の長方形は、NRM内でないプロセシング要素を表し、長方形を伴わない記入項目はデータファイルである。各要素は、以下に詳細に説明される。このフローチャートは、本発明の方法を例示するために提示されており、これを限定するものではない。
【0069】
データフォーマット変換
生の質量分析データファイルは、典型的には、分離の各画分に関する、MS走査または一連のサーベイ走査およびMS/MSサイクルからなる。各質量スペクトルは、例えば、LCに関する溶出時間またはゲル電気泳動に関する画分、またはそれら両方に対応している。各サーベイ走査は、質量分析計により検出された各m/z値のイオンの数を記録する。生の質量分析データファイルは、Micromass社(Beverly、MA)のMassLynxを含むが、これらに限定されない、様々な公に入手できるソフトウェアパッケージにより作成することができる。CMを、例えばMassLynxと統合するために、MassLynx内のソフトウェアは、例えば、質量分析計からのデータ(例えばMassLynx format.raw)をASCIIまたはNetCDFフォーマットに変換する。質量分析データを得るための別のソフトウェアパッケージは、同様の変換ソフトウェアを有する。あるいは、データ変換のためのソフトウェアは、当技術分野において公知の方法を用いて書かれており、かつそのモジュール内に含まれる。任意に、データ変換は、複数のファイルの併合(merger)を含んでよい。ファイル併合は、特定の前駆体の存在量のような、ファイル要素の併合を含んでもよい。
【0070】
重心計算
イオン種(ions of a species)(特定の生体分子および同じ荷電状態であるが、m/z値が異なる、イオン数測定値)は、生体分子の「実際の」m/z値のまわりの分布として、質量分析装置により記録される(前記「ノイズ低減および重心計算」を参照)。重心計算は、生体分子について質量分析器が生じる値(イオン種)の範囲を集約(consolidate)にするために行われる。重心計算アルゴリズムは、当該技術分野において一般に公知である。従って特定の荷電状態の各生体分子に関して獲得されたデータは、単独のm/z値および関連したイオン数により表される。例えば、重心計算アルゴリズムは、これらのイオン種を表すために、5個のm/z値の平均である前述の例の5種のイオンに関する単独の「実際の」m/zを計算し、その強度を合計することができ(例えば、m/z=449.998、強度=5)、これは次にイオン分布を置き換えるために使用することができる。重心計算されたデータは次に、イオン種の走査全体にわたり積分される。
【0071】
ノイズ除去
重心計算されたデータは点検され、部分的ノイズが取り除かれる。ひとつの態様において、ノイズ除去は、強度の低いイオン数全て、またはある閾値を下回るイオン数の単純な削除である。イオン強度の閾値は、ペプチドイオン由来のシグナルを、ノイズシグナルから識別するために定義される。この閾値は、最大エントロピー法を含むが、これに限定されない、当該技術分野において公知の方法を用いることにより、全ての走査について推定することができる。
【0072】
同位体マップ作成
重心計算されおよびノイズ低減されたデータは、試料中の生体分子に関する質量-対-電荷比(m/z)、保持時間(rt)、および強度の3種を含む、LC-MS(またはLC-MS-MS)データに関する同位体マップを製作するために、処理される。従って生体分子は、生体分子(例えば、ペプチド)の電荷に応じた推定可能な質量差で間隔をとった一連の同位体として、同位体マップ内に表すことができる。一般にこのようなマップは、インジェクションからのデータに関して製作される。ひとつの態様において、マップはテキストファイルとして作成される。関連のある態様において、テキストファイルは可視化されてもよい(例えば、図4、5、6および7参照)。
【0073】
ペプチド検出
同位体マップは、それらの質量、保持時間、荷電状態および強度によりペプチドを表している(図4参照)。ペプチドの質量、保持時間および強度は、同位体マップにおけるペプチドの同位体の第一の同位体における最も強力なピークに相当している。これは、ペプチドの「中心」と称されている。同位体におけるペプチド中心の検出は、下記の特性を基にしている:
・ペプチドの同位体は、保持時間の全体にわたって分布され、そのため、ランダムノイズから識別することができる。
・ペプチドの同位体の間隔および強度はモデル化することができ、そのため、同位体マップ内に認めることができる。
ペプチド検出には4段階が存在する:極大質量の決定、極大保持時間の決定、同位体密度を基にした極大値の排除、およびピーク電荷の決定。これらの段階に続き、ペプチドマップを製作することができる。
【0074】
図8は、ペプチド検出モジュール(PDM)の要素の詳細を示すフローチャートである。実線の長方形は、PDMのプロセシング要素を表し、点線の長方形は、PDM内ではないプロセシング要素を表し、および長方形を伴わない記載事項はデータファイルである。各要素は、以下に詳細に説明される。このフローチャートは、本発明の方法を例示するために提示されており、これを限定するものではない。
【0075】
極大質量
同位体マップ内において、所定の走査(すなわち、保持時間)内に全ての極大値が見出される。極大値は、同位体の幅であるように典型的に設定された、質量ウィンドウにより定義される。ほとんどのデータ点は極大値ではないため、データの量を有意に低下させる。
【0076】
極大保持時間
同位体マップ内において、ピークに中心がある質量および保持時間ウィンドウ内の極大値である全てのピークが見出される。この段階は、効率を良くするために先の段階において極大質量であることが決定されたようなピークについてのみ行われる。質量および保持時間ウィンドウは、典型的には全同位体を取り囲むように定義される。上記のように、この段階によりデータ量は有意に減少する。
【0077】
同位体密度
孤立した極大値を取り除くために、上方および下方の両方に有意な数の極大質量を有する極大保持時間のみが残された。これは、同位体は有するが、ノイズは典型的に有さない特性である。
【0078】
ピーク中心および電荷検出
残存するピークの中で、ペプチド中心であるものが検出され、電荷が決定される。各ピークについて、それが電荷kのペプチドのペプチド中心であるという仮説が評価される。これは、推定の第2、第3および/または第4の同位体の同位体中心の存在について調べることにより達成される。これらの同位体の強度は、一貫性を保つために、推定ペプチド中心の強度と比較される。電荷決定および同位体検出の方法は、本明細書に参照として組入れられる、米国実用特許出願第10/293,076号の「質量強度プロファイリングシステムおよびその使用」に認められるものを含むかまたはこれに類似していてもよい。
【0079】
ペプチドマップ作成
腫瘍組織のような、生物学的試料からの同位体マップは、典型的に、保持時間および質量/電荷比により分離された、可視できる数千のペプチドイオンを有する。この画像は複雑であるが、個々のペプチドは容易に検出することができる。しかしこれらの画像は、迅速かつ信頼できるプロセスを患者全体にわたり比較するには、余りにもデータ集約的である。この理由から、各同位体マップは、図9、10、11、および12に示されるように、ペプチドマップに変換される。各複合したペプチド同位体の印は、図5右下に示したように、そのペプチドの質量、電荷、保持時間、および存在量により示された、単独の点に置き換えられる。従って、ペプチドマップは、処理された同位体マップデータ(図4参照)から作成することができ、各ペプチド(または生体分子)は、質量-対-電荷比(m/z)、保持時間(rt)、電荷(ch)、および強度の四つ組を含む。この大きく単純化されたデータセットは、多くの試料の全域にわたる迅速かつ正確な比較を可能にする。一つの態様において、このマップは、テキストファイルとして作成される。関連した態様において、このテキストファイルは、可視化されてもよい(例えば、図12参照)。
【0080】
ペプチドマップの整列化
2種のペプチド(または生体分子)マップAおよびBがあるとすると、示差存在量のペプチドを決定するために、Aのペプチドを、Bのペプチドに整合させなければならない(図16参照)。解析がうまくいくためには、試料間のペプチドの正確な整合が不可欠である。キャピラリーナノ-液体クロマトグラフィーポンプの流量は再現性に限界があるために、所定のペプチドの保持時間は、特に異なる液体クロマトグラフィーカラムまたはポンプ間で比較する場合には、実行毎に2%変動し得る。この変動性も、実行間で異なり、いずれかの方向に最大2分のオフセットを生じる。これに対処するために、2種またはそれ以上の試料を比較する場合に、保持時間が合致するように、動的オフセット補正が考案されている。このオフセットは、各時点でのパターン整合を基にし、その結果図17に示されるように、高度に異常な挙動であっても対応する能力を生じる。参照インジェクションは不要であり、2回のLC-MSインジェクションを直接比較することができる。RT補正も、強度値から独立しており、このためペプチド含量および強度が変動すると予想される条件下であっても、依然として良好に実行される。ペプチド含量が変動する同一でない試料をプロファイリングし、かつ差異を検出することができる。1種または他の試料に固有のそのようなペプチドも同じくこのプロセスにおいて同定され、相関直線から外れた点として示される(図17)。
【0081】
まとめると、インジェクション対(LC-MS対LC-MS;LC-MS対LC-MS-MS(例えば図18参照);または、LC-MS-MS対LC-MS-MS)のペプチドアラインメントを容易に使用し、下記のような情報を作成することができる:
・比較されるインジェクション対間のカラム保持オフセット。
・インジェクション1からインジェクション2への保持時間変換関数。
・インジェクション1からインジェクション2への線形強度正規化関数。
・インジェクション1およびインジェクション2に関する共有ペプチドおよび固有ペプチドのリスト。
例えば、図17は、予測されたカラムオフセット(黒色実線)およびインジェクション対に関する保持時間変換関数を示している。図20は、インジェクション1からインジェクション2への整列化されたペプチドの強度を比較する強度散乱プロットを示している。
【0082】
アルゴリズム
繰り返しになるが、質量および保持時間の変動のために、ペプチドマップのアラインメントは、単純明快ではない。特に保持時間の変動は、部分的基礎(local basis)を圧縮および/または拡大する可能性があり、このため、線形(linear)アラインメントスキームは、乏しい結果を生じ得る。質量の変動性は保持時間の変動性に対して低いので、ペプチドを整合させることの課題は、主にBのペプチドに対するAのペプチドの保持時間をマッピングする関数を探すことである。
【0083】
このアルゴリズムは、ふたつの主要な段階を有する:
1.インジェクション対の間でのカラムオフセットを予測する。
2.インジェクション対の間での部分的保持時間変換を予測する。
これらの段階は更に細かく分割され、ペプチドマップアラインメントの工程は、5段階として説明することができる:隣接ペプチドの決定、保持時間のクラスター化、最良の調節、反復および最適化、並びに調節の適用。
【0084】
図13は、ペプチドマップアラインメントモジュール(PMAM)の要素を詳述するフローチャートである。実線の長方形は、PMAMのプロセシング要素を表し、点線の長方形は、PMAM内ではないプロセシング要素を表し、長方形を伴わない記載事項はデータファイルである。このフローチャートは、本発明の方法を例示するために提示されており、これを限定するものではない。各要素(アルゴリズムの5段階)に加え、任意の開始段階を、以下に詳細に説明する。
【0085】
(任意)情報の少ない分子の排除
全てのペプチドを使用し、rt変動を補正することができる。しかし任意で、質の高い保持時間変換関数を導き出すために、単独に荷電したペプチドまたは低強度のペプチドのような情報の少ないペプチドを省略することができる。これらのペプチドは後に、下記の段階5(調節の適用)前に、復元することができる。
【0086】
1)隣接ペプチド
ペプチドは、m/z、rtおよび任意で電荷を整合させることにより、インジェクション間で緩く整列化される:Aの中の各ペプチドpについて、pと電荷が同じで、かつpの予め定義された質量および保持時間ウィンドウ内にあるB中の全てのペプチドであるような、Bの中のpの隣接ペプチドを定義する。質量および保持時間ウィンドウは、システムの変動性によって決まる。m/z整合の許容度は、典型的に非常に正確である(0.10Da未満)。電荷に関する整合が使用される場合、これは正確である。rt整合の許容度は、アラインメントの適用に応じて、緩く定義されるが、典型的には8分未満である。これらの整合は、図17に赤色で示されている。以下の段階は、pをB中の隣接ペプチドの一つに正確に整合させるための試みである。
【0087】
2)保持時間のクラスター化
カラムオフセットは、緩く整合したペプチド全てに関する保持時間オフセットの分布を解析することによって、例えば低保持時間から高保持時間へp中のペプチドを分類し、ペプチドを保持時間が類似した(すなわち、予め定義された差異内の)ペプチドクラスターへ無作為に群別化することによって、決定される。これらの群別化は、保持時間クラスターと称される。これらのクラスター内ペプチドは、類似した保持時間を有するので、アルゴリズムは、これら全てのペプチド保持時間を同量によって調節することを試みると考えられる。典型的に、この分布モードが、カラムオフセットを定義するために使用されるが、任意の中心性の測度が使用され得る。
【0088】
3)最良調節
各保持時間クラスターについて、最適保持時間調節が決定される。制約事項としては、クラスター内の全てのペプチドは、B中の隣接ペプチドの内一つにしか整合させることが出来ないということ、および保持時間調節は、クラスター内の全てのペプチドにより共有されることである。アルゴリズム上は、最適保持時間調節は、整数計画法(inter programming)を含む多くの方法により決定することができる。典型的には、カラムオフセットの+/-2分以内(またはいくつかの別の実験的に決定された値)の整合ペプチドが、更なる解析のために残される。中央値平滑化ウィンドウ(median smoothing window)が、保持時間に沿って適用され、部分的保持時間オフセット値を得る。この結果、図17に示した青色線を生じる。
【0089】
4)反復および最適化
段階2および3は、k回反復され、最適解が保持される。最適解は、全ての保持時間クラスターにわたり保持時間調節を最小にするものである。
【0090】
5)調節の適用
最適保持時間調節は、全ての保持時間クラスターに適用される。ペプチドが、その隣接ペプチドのひとつの予め定義された保持時間閾値内にある場合、それらは整合される。典型的には、中央値平滑化関数の+/-0.5分以内(またはいくつかの別の実験的に決定された値)に整合したペプチドは、最終的に整合したペプチドとして選択される。そうでなければ、このペプチドは、整合しないままであり、AまたはBに固有であると考えられる。強度の正規化は、整合したペプチドの線形回帰(linear regression)により決定される。
【0091】
示差的存在量
試料間でのペプチド整合に続いて、各ペプチドについての相対存在量が決定される。存在量は、質量分析により検出されるピーク強度または容積の関数(m/z、rt、および強度により定義される)であり(図21参照)、その自動化された計算は、「質量強度プロファイリングシステムおよびその使用(米国実用特許出願第10/293,076号)」に開示されたものなどの方法に頼ることができる。各ペプチドは、固有のイオン化能を有し、絶対的存在量を決定することは難しいが、ペプチドの相対的存在量は、同様の複雑さの試料中におけるその濃度に直接関連している。
【0092】
システムの変動性に依存した所定の閾値よりも存在量における差異が大きい整合ペプチド、および任意でいずれかの整合しないペプチドは、MS-MSのために選択されても良い(図2参照)。ペプチドマップ間の示差的存在量は、図16および20に例示されたように、可視化され得る。
【0093】
ペプチド/タンパク質同定
試料中の多数のペプチドは、MS/MS解析により同定することができる。MS/MSサイクルは、選択されたペプチドに関するペプチド配列情報を産生し、これは次に包括的にデータベース検索に使用されてもよい。質量分析の生データは、Matrix Science社(ロンドン、英国)のMascot、Micromass社のProteinLynx Global Server、Thermo Finnigan社(サンノゼ、CA)のSEQUEST/TurboSEQUEST、またはProteoMetrics社(ニューヨーク、NY)のSonar MS/MSなどの手段を使用した化合物、例えばタンパク質の同定に供される。例えば、コンピュータを使用し、整合するアミノ酸配列、または、予測アミノ酸配列が実験的に決定されたアミノ酸配列に適合する核酸(発現配列タグ(EST)を含む)を求めて利用可能なデータベースを検索する。この目的のために有用な例示的データベースは、Genbank、EMBL、NCBI、MSDB、SWISS-PROT、TrEMBL、dbEST、ヒトゲノム配列データベース、またはユーザーが定義したデータベースを含むが、これらに限定されない。選択されたペプチドを含むデータベース中の化合物に関する配列情報を、次に特定の切断技術を用いて、その化合物に由来した他のペプチドリストを製作するために使用することができる。この解析により、解析中の試料中に存在する可能性があるタンパク質のリストが生じる。
【0094】
画分またはバンド全体にわたる積算
質量分析により分析される試料が1Dゲルから切出される場合、ペプチドはいくつかのバンド中に現れる可能性があるため、観察されたペプチドの存在量は、典型的に隣接バンド全体にわたり積算される。その後隣接バンド内の同一ペプチドが、例えば質量、保持時間、およびMS/MSにより同定される。試料が多次元LC(例えば、2D)により分析される場合は、その存在量は典型的には、塩画分(salt fraction)全体にわたり積算される。積算は、マップ生成前のデータ、または二つもしくはそれ以上のマップからのデータに対して行われる。
【0095】
個別のペプチド存在量の統計解析
ペプチド質量、それらの存在量、および保持時間のリストが、様々な分析、例えば質量フィンガープリント法によるタンパク質同定;更なるMS/MSラウンドのためのペプチド定義によるタンパク質同定;タンパク質のペプチド対象範囲を増大し、かつファミリー内の類似タンパク質間、またはスプライス変種間および多型間の識別を補助しうる、整合MS/MSおよび質量フィンガープリント法を組合せるタンパク質同定;ならびに、分析される試料中の低存在量のタンパク質に対応する、生の質量分析データ中に存在する低存在量のペプチドの決定などに使用される。
【0096】
発現プロファイリング
本発明の方法を用い、試料中の、例えばタンパク質のような、生体分子またはそれらの断片の相対存在量を決定することができる(図13参照)。分析される試料は、参照試料または試料群と比較される。この比較または発現プロファイルは、例えば、タンパク質のような生体分子が、参照と比べ異常に高いまたは低い量で存在するかどうかを決定するために使用される。参照試料に対する試料中の種の発現の差異の決定は、例えば患者における疾患の診断、集団における自然の分散(variance)の決定、または個体における遺伝子型の決定に使用される。個体に関する、または患者の集団の全域の、正常細胞と腫瘍細胞の間のタンパク質存在量の比較が適用例である。
【0097】
薬物標的
一旦タンパク質が公共のまたは個人のデータベースにおいて同定されたならば、このタンパク質をコードしている遺伝子は、クローニングされ、細菌、酵母または哺乳類宿主細胞へ導入される。このような遺伝子がデータベースにおいて同定されないならば、このタンパク質をコードしている遺伝子は、前述の方法により決定されたそのタンパク質のアミノ酸配列をコードしているプローブの縮重セットを用いて、クローニングされる。データベースが、実験により決定されたタンパク質のアミノ酸配列をコードする1種または複数の部分的ヌクレオチド配列を含む場合は、このような部分的ヌクレオチド配列(またはそれらの相補体)は、遺伝子のクローニングのためのプローブとして利用され、縮重セットの使用の必要性が避けられる。
【0098】
このような組換えタンパク質を発現するように遺伝的に操作された細胞をスクリーニングプログラムに使用して、例えば治療的投与のために、組換えタンパク質と特異的に相互作用するか、または大量の組換えタンパク質を産生するような、他のタンパク質または薬物を同定することができる。
【0099】
加えて、当技術分野において公知の標準方法を使用するポリクローナル抗体またはモノクローナル抗体の作成のために、本発明に従い同定されたタンパク質を用い、例えばこのタンパク質をマウス、ラット、またはウサギのような動物に投与することにより、抗体を作成することができる。このような抗体は、診断および予後判定試験において、ならびに例えば抗体アフィニティークロマトグラフィーによる大量のタンパク質の精製において有用である。抗体は、癌の治療において使用されるもののような、免疫療法に使用することもできる。
【0100】
その他の態様
本明細書において参照された全ての特許、特許出願、および刊行物は、本明細書に参照として組み入れられる。
【図面の簡単な説明】
【0101】
【図1】本発明のコンピュータシステムの態様の例を図示している。
【図2】ペプチドマップを製作および整列化する場合の、コンステレーションマッピング法の例を示している。1)試料1は、この図示した場合において、1Dゲルのバンド上で、LC/MSデータを獲得することにより、質量分析により解析される。LC/MSデータは、データフォーマット変換、重心計算およびノイズ低減を受け、これらは一般にファイルサイズを縮小する。これは、データ(m/z、保持時間、電荷、強度、および面積など)の獲得のためのペプチド検出において使用される、同位体マップを生じ、次にペプチドマップを生じる。2)第二の試料に関して1)に従う手法が続き、この場合は、試料1について解析されたバンドに相当する試料2の1Dゲルのバンドについて図示されている。1および2のペプチドマップは整列化され、異なる存在量を示すペプチドが決定される。その後LC/MS-MSデータが、示差的存在量のペプチドについて獲得され(標的化されたLC/MS-MS)、その後ペプチドおよび/またはタンパク質が同定される。1、2、3および4の獲得は、試料の変動性を最小化するために同じカラムを用い、同じ質量分析装置上でインターリーブされる。
【図3】例示的ノイズ低減モジュールのフローチャートを示している。
【図4】同位体マップの例を示す。強度は濃淡で示し、より明るい陰はより高い強度を示す。m/zおよびrtの大きさは、各々、横軸および縦軸に表している。
【図5】nLC-MS解析により作成された同位体マップの例を示している。左側に示された完全インジェクションプロファイルは、質量/電荷比(縦軸)および保持時間(分)(横軸)により分離された、数千種のペプチドイオンを示している。拡大された領域を、右上に示し、(図6において見られるものと同様)かつ単独のペプチドイオンの同位体プロファイルを右下に示す。(これは図7に示したものと同様)。
【図6】中分解能の同位体マップの例を示している(xおよびy軸は図5に対し交換されている)。
【図7】高分解能の同位体マップの例を示している(xおよびy軸は図5に対し交換されている)。同位体群により生じた線状のパターンに注意のこと。
【図8】ペプチド検出モジュールフローチャートの例を示している。
【図9】ペプチドマップに変換された同位体マップの例を示している。上側パネルに示された複合同位体マップは、下側パネルに示されたより低い複雑性のペプチドマップに変換されている。各ペプチド同位体プロファイルは、ペプチドの質量、電荷、保持時間および存在量からなる単独の点で置き換えられる。記号は、電荷が+1、+2、+3および+4(丸、十字、三角、四角)のペプチドの検出を表す。
【図10】ペプチド検出の例である。ペプチドの「中心化」を示すために、対応するペプチドマップ(例えば図9参照)を、それが誘導された同位体マップに重ねている。
【図11】ペプチド検出を図示している。ペプチドの「中心化」を示すために、対応するペプチドマップ(例えば図9参照)を、それが誘導された同位体マップに重ねている。
【図12】ペプチドマップの例を示している。様々な形状(三角、丸、四角、十字)が、イオンの電荷状態を示している。
【図13】ペプチドマップアラインメントモジュールのフローチャートの例を示している。
【図14】ペプチドマップアラインメントを受けるふたつの代表的ペプチドマップを示している。
【図15】図16との比較のための、完全走査の1/40の領域における、代表的な整列化ペプチドマップ(マップA)を示している。
【図16】整列化されたペプチドマップ(AおよびB)の間の視覚化された差異の完全走査の1/40の領域における表示を示しており、この場合において、マップBから整合しなかったペプチドは丸で囲んで示している。二つの整列化されたマップのマップAを表している図15と比較されたい。
【図17】保持時間変換関数を示す。動的オフセットルーチンの例は、異なるポンプ、異なるカラム、またはポンプ速度の振れ(fluctuations)により導入される変動性とは無関係の、二つの異なるLC-MSスペクトルにおけるペプチドの整合を可能にしている。青色の線は、確実にペプチドを整合するのに必要な、学習性保持時間補正関数である。この線の近傍の丸は、試料間で整合している。この線から大きく外れた丸は、整合せず、従って第一の試料に固有なものである。
【図18】LC-MSからのマップと、LC-MS-MSからのマップとのアラインメントを示している。右上は、LC-MS-MSの断片化スペクトルが示され、対応するペプチドマップの一部は右下に示されている。左下は、LC-MSインジェクションからのペプチドマップの一部である。
【図19】コンステレーションマッピングを使用する、15回のインジェクションにわたる変動係数の分布を図示している。
【図20】あるインジェクションから別のものへ整列化されたペプチドの強度を比較する、強度分散プロットを図示している。
【図21】強度または容積からのペプチド存在量の計算を図示している。

【特許請求の範囲】
【請求項1】
生物学的試料の質量分析インジェクションからのデータに関する同位体マップを製作する方法であり:
a)生物学的試料の質量分析インジェクションからの該データについて、ノイズ低減モジュールによるノイズ低減および重心計算(Centroiding)を行う段階;および
b)ノイズ低減されおよび重心計算されたデータから同位体マップを作成し、これにより同位体マップを製作する段階
を含む方法。
【請求項2】
生物学的試料が、標識されない生体分子で構成される、請求項1記載の方法。
【請求項3】
生物学的試料が、誘導体化されない生体分子で構成される、請求項1記載の方法。
【請求項4】
生物学的試料が、標識されずかつ誘導体化されない生体分子で構成される、請求項1記載の方法。
【請求項5】
生物学的試料が、切断された生体分子で構成される、請求項1記載の方法。
【請求項6】
生体分子が、酵素により切断される、請求項5記載の方法。
【請求項7】
酵素がトリプシンである、請求項6記載の方法。
【請求項8】
生物学的試料の質量分析インジェクションからのデータに関する同位体マップからペプチドマップを製作する方法であり:
a)ペプチド検出モジュールにより、同位体マップに対してペプチド検出を行う段階、および
b)ペプチド検出の結果からペプチドマップを作成し、これによりペプチドマップを製作する段階
を含む方法。
【請求項9】
各々が生物学的試料の質量分析インジェクションを表しているペプチドマップ対から、ペプチドマップを整列化するための関数を決定する方法であり:
a)ペプチドマップ対に対して、ペプチドマップアラインメントモジュールにより、ペプチドマップアラインメントを行う段階;および
b)インジェクション対の間でのカラムオフセットを決定する段階;および
c)インジェクション対の間での保持時間変換関数を決定する段階
を含む方法。
【請求項10】
各々が生物学的試料の質量分析インジェクションを表しているペプチドマップ対から、ペプチドマップを整列化するための方法であり、ペプチドマップ対に対して、ペプチドマップアラインメントモジュールにより、ペプチドマップアラインメントを行い、これにより整列化されたペプチドマップを製作する段階
を含む方法。
【請求項11】
生物学的試料の質量分析インジェクション対から示差的かつ固有に発現された生体分子を決定する方法であり:
a)試料に関する同位体マップを製作する段階;
b)同位体マップからペプチドマップを製作する段階;
c)ペプチドマップを整列化する段階;および
d)整列化されたマップ間の差異を決定する段階
を含む方法。
【請求項12】
LC-MS-MS断片化スペクトルへ、LC-MSインジェクションからの生体分子を整合させる方法であり:
a)インジェクションに関する同位体マップを製作する段階;
b)同位体マップからペプチドマップを製作する段階;
c)ペプチドマップを整列化する段階;および
d)整合している生体分子を決定する段階
を含む方法。
【請求項13】
生物学的試料の質量分析インジェクションからのデータに関する同位体マップを製作する、コンピュータで実行される方法であり:
a)生物学的試料の質量分析インジェクションからのデータを入力し、これに対してノイズ低減モジュールによるノイズ低減および重心計算を行う段階;および
b)ノイズ低減されかつ重心計算されたデータからの同位体マップを作成し、これにより同位体マップを製作する段階
を含む方法。
【請求項14】
生物学的試料が、標識されない生体分子で構成される、請求項13記載のコンピュータで実行される方法。
【請求項15】
生物学的試料が、誘導体化されない生体分子で構成される、請求項13記載のコンピュータで実行される方法。
【請求項16】
標識されずかつ誘導体化されない生体分子で構成される、請求項13記載のコンピュータで実行される方法。
【請求項17】
生物学的試料が、切断された生体分子で構成される、請求項13記載のコンピュータで実行される方法。
【請求項18】
生体分子が、酵素により切断される、請求項17記載のコンピュータで実行される方法。
【請求項19】
酵素がトリプシンである、請求項18記載のコンピュータで実行される方法。
【請求項20】
生物学的試料の質量分析インジェクションからのデータに関する同位体マップからペプチドマップを製作するための、コンピュータで実行される方法であり:
a)同位体マップを入力する段階;
b)ペプチド検出モジュールにより、該同位体マップ上に対してペプチド検出を行う段階;および
c)ペプチド検出の結果からペプチドマップを作成し、これによりペプチドマップを製作する段階
を含む方法。
【請求項21】
各々が生物学的試料の質量分析インジェクションを表しているペプチドマップ対から、ペプチドマップを整列化する関数を決定するための、コンピュータで実行される方法であり:
a)ペプチドマップ対を入力する段階;
b)ペプチドマップ対に対し、ペプチドマップアラインメントモジュールにより、ペプチドマップアラインメントを行う段階;
c)インジェクション対の間でのカラムオフセットを決定する段階;および
d)インジェクション対の間での保持時間変換関数を決定する段階
を含む方法。
【請求項22】
各々が生物学的試料の質量分析インジェクションを表しているペプチドマップ対からペプチドマップを整列化するための、コンピュータで実行される方法であり:
ペプチドマップ対を入力する段階、該ペプチドマップ対に対してペプチドマップアラインメントモジュールによりペプチドマップアラインメントを行う段階、およびこれにより整列化されたペプチドマップを製作する段階
を含む方法。
【請求項23】
生物学的試料の質量分析インジェクション対から示差的かつ固有に発現された生体分子を決定する、コンピュータで実行される方法であり:
a)該インジェクションからデータを入力する段階;
b)試料に関する同位体マップを製作する段階;
c)同位体マップからペプチドマップを製作する段階;
d)ペプチドマップを整列化する段階;および
e)整列化されたマップ間の差異を決定する段階
を含む方法。
【請求項24】
LC-MS-MS断片化スペクトルへ、LC-MSインジェクションからの生体分子を整合させる、コンピュータで実行される方法であり:
a)該インジェクションからのデータを入力する段階;
b)インジェクションに関する同位体マップを製作する段階;
c)同位体マップからペプチドマップを製作する段階;
d)ペプチドマップを整列化する段階;および
e)整合している生体分子を決定する段階
を含む方法。
【請求項25】
生物学的試料の質量分析インジェクションからのデータに関する同位体マップを製作するためのプログラムが保存されている、コンピュータで読取り可能なメモリーであり:
a)生物学的試料の質量分析インジェクションからのデータを入力として受取り、それに対してノイズ低減モジュールによるノイズ低減および重心計算を実行する、コンピュータコード;および
b)ノイズ低減されかつ重心計算されたデータから同位体マップを作成し、これにより同位体マップを製作するコンピュータコード
を含むコンピュータで読取り可能なメモリー。
【請求項26】
生物学的試料が、標識されない生体分子で構成される、請求項25記載のコンピュータで読取り可能なメモリー。
【請求項27】
生物学的試料が、誘導体化されない生体分子で構成される、請求項25記載のコンピュータで読取り可能なメモリー。
【請求項28】
生物学的試料が、標識されずかつ誘導体化されない生体分子で構成される、請求項25記載のコンピュータで読取り可能なメモリー。
【請求項29】
生物学的試料が、切断された生体分子で構成される、請求項25記載のコンピュータで読取り可能なメモリー。
【請求項30】
生体分子が、酵素により切断される、請求項29記載のコンピュータで読取り可能なメモリー。
【請求項31】
酵素がトリプシンである、請求項30記載のコンピュータで読取り可能なメモリー。
【請求項32】
生物学的試料の質量分析インジェクションからのデータに関する同位体マップからペプチドマップを製作するためのプログラムを保存している、コンピュータで読取り可能なメモリーであり:
a)同位体マップを入力として受け取るコンピュータコード;
b)同位体マップに対して、ペプチド検出モジュールにより、ペプチド検出を実行するコンピュータコード;および
c)ペプチド検出の結果からペプチドマップを作成し、これによりペプチドマップを製作するコンピュータコード
を含む、コンピューターで読み取り可能なメモリー。
【請求項33】
各々が生物学的試料の質量分析インジェクションを表しているペプチドマップ対から、ペプチドマップを整列化する関数を決定するためのプログラムを保存している、コンピュータで読取り可能なメモリーであり:
a)ペプチドマップ対を入力として受け取るコンピュータコード;
b)ペプチドマップ対に対して、ペプチドマップアラインメントモジュールにより、ペプチドマップアラインメントを実行するコンピュータコード;
c)インジェクション対の間でのカラムオフセットを決定するコンピュータコード;および
d)インジェクション対の間での保持時間変換関数を決定するコンピュータコード
を含む、コンピュータで読み取り可能なメモリー。
【請求項34】
各々が生物学的試料の質量分析インジェクションを表しているペプチドマップ対から、ペプチドマップを整列化するためのプログラムを保存している、コンピュータで読取り可能なメモリーであり、ペプチドマップ対を入力として受取るコンピュータコード、該ペプチドマップ対に対してペプチドマップアラインメントモジュールによりペプチドマップアラインメントを行い、これにより整列化したペプチドマップを製作するコンピュータコード
を含む、コンピュータで読み取り可能なメモリー。
【請求項35】
生物学的試料の質量分析インジェクション対から示差的かつ固有に発現された生体分子を決定するためのプログラムを保存している、コンピュータで読取り可能なメモリーであり:
a)該インジェクションからのデータを入力として受け取るコンピュータコード;
b)試料に関する同位体マップを製作するコンピュータコード;
c)同位体マップからペプチドマップを製作するコンピュータコード;
d)ペプチドマップを整列化するコンピュータコード;および
e)整列化されたマップ間の差異を決定するコンピュータコード
を含む、コンピュータで読み取り可能なメモリー。
【請求項36】
LC-MS-MS断片化スペクトルへ、LC-MSインジェクションからの生体分子を整合させるためのプログラムを保存している、コンピュータで読取り可能なメモリーであり:
a)該インジェクションからのデータを入力として受け取るコンピュータコード;
b)インジェクションに関する同位体マップを製作するコンピュータコード;
c)同位体マップからペプチドマップを製作する同位体マップ;
d)ペプチドマップを整列化するコンピュータコード;および
e)整合している生体分子を決定するコンピュータコード
を含む、コンピューターで読み取り可能なメモリー。
【請求項37】
プロセッサ及び該プロセッサに接続されたメモリーを備える、生物学的試料の質量分析インジェクションからのデータに関する同位体マップを製作するためのコンピュータシステムであり、該メモリーが1種または複数種のプログラムをコードし、該1種または複数種のプログラムが:
a)生物学的試料の質量分析インジェクションからのデータを入力として受取り、それに対してノイズ低減モジュールによるノイズ低減および重心計算を実行するコンピュータコード;および
b)ノイズ低減されかつ重心計算されたデータから同位体マップを作成し、これにより同位体マップを製作するコンピュータコード
を含む方法を該プロセッサに実行させる、コンピュータシステム。
【請求項38】
生物学的試料が、標識されない生体分子で構成される、請求項37記載のコンピュータシステム。
【請求項39】
生物学的試料が、誘導体化されない生体分子で構成される、請求項37記載のコンピュータシステム。
【請求項40】
生物学的試料が、標識さずかつ誘導体化されない生体分子から構成される、請求項37記載のコンピュータシステム。
【請求項41】
生物学的試料が、切断された生体分子で構成される、請求項37記載のコンピュータシステム。
【請求項42】
該生体分子が、酵素により切断される、請求項41記載のコンピュータシステム。
【請求項43】
酵素がトリプシンである、請求項42記載のコンピュータシステム。
【請求項44】
プロセッサおよび該プロセッサに接続されたメモリーを備える、生物学的試料の質量分析インジェクションからのデータに関する同位体マップからペプチドマップを製作するためのコンピュータシステムであり、該メモリーが、1種または複数種のプログラムをコードし、該1種または複数種のプログラムが:
a)同位体マップを入力として受け取るコンピュータコード;
b)該同位体マップに対して、ペプチド検出モジュールにより、ペプチド検出を実行するコンピュータコード;および
c)ペプチド検出の結果からペプチドマップを作成し、これによりペプチドマップを製作するコンピュータコード
を含む方法を該プロセッサに実行させる、コンピュータシステム。
【請求項45】
プロセッサおよび該プロセッサに接続されたメモリーを備える、各々が生物学的試料の質量分析インジェクションを表しているペプチドマップ対から、ペプチドマップを整列化する関数を決定するためのコンピュータシステムであり、該メモリーが1種または複数種のプログラムをコードし、該1種または複数種のプログラムが:
a)ペプチドマップ対を入力として受け取るコンピュータコード;
b)ペプチドマップ対に対して、ペプチドマップアラインメントモジュールにより、ペプチドマップアラインメントを実行するコンピュータコード;
c)インジェクション対の間でのカラムオフセットを決定するコンピュータコード;および
d)インジェクション対の間での保持時間変換関数を決定するコンピュータコード
を含む方法を該プロセッサに実行させる、コンピュータシステム。
【請求項46】
プロセッサおよび該プロセッサに接続されたメモリーを備える、各々が生物学的試料の質量分析インジェクションを表しているペプチドマップ対から、ペプチドマップを整列化するためのコンピュータシステムであり、該メモリーが1種または複数種のプログラムをコードし、該1種または複数種のプログラムが、ペプチドマップ対を入力として受取るコンピュータコード、および該ペプチドマップ対に対してペプチドマップアラインメントモジュールによりペプチドマップアラインメントを行い、これにより整列化したペプチドマップを製作するコンピュータコード
を含む方法を該プロセッサに実行させる、コンピュータシステム。
【請求項47】
プロセッサおよび該プロセッサに接続されたメモリーを備える、生物学的試料の質量分析インジェクション対から示差的かつ固有に発現された生体分子を決定するためのコンピュータシステムであり、該メモリーが1種または複数種のプログラムをコードし、該1種または複数種のプログラムが:
a)該インジェクションからのデータを入力として受け取るコンピュータコード;
b)試料に関する同位体マップを製作するコンピュータコード;
c)同位体マップからペプチドマップを製作するコンピュータコード;
d)ペプチドマップを整列化するコンピュータコード;および
e)整列化されたマップ間の差異を決定するコンピュータコード
を含む方法を該プロセッサに実行させる、コンピュータシステム。
【請求項48】
プロセッサおよび該プロセッサに接続されたメモリーを備える、LC-MS-MS断片化スペクトルへ、LC-MSインジェクションからの生体分子を整合化させるためのコンピュータシステムであり、該メモリーが1種または複数種のプログラムをコードし、該1種または複数種のプログラムが:
a)該インジェクションからのデータを入力として受け取るコンピュータコード;
b)インジェクションに関する同位体マップを製作するコンピュータコード;
c)同位体マップからペプチドマップを製作するコンピュータコード;
d)ペプチドマップを整列化するコンピュータコード;および
e)整合している生体分子を決定するコンピュータコード
を含む方法を該プロセッサに実行させる、コンピュータシステム。
【請求項49】
生物学的試料の質量分析インジェクションからのデータに関する同位体マップについての情報を表示する方法であり:
a)生物学的試料の質量分析インジェクションからのデータを入力する段階;
b)該データに対してノイズ低減モジュールによるノイズ低減および重心計算を実行する段階;
c)ノイズ低減されかつ重心計算されたデータからの同位体マップを作成し、これにより同位体マップを製作する段階;および
d)該同位体マップ上についての情報を使用者に表示する段階
を含む方法。
【請求項50】
生物学的試料が、標識されない生体分子で構成される、請求項49記載の方法。
【請求項51】
生物学的試料が、誘導体化されない生体分子で構成される、請求項49記載の方法。
【請求項52】
生物学的試料が、標識されずかつ誘導体化されない生体分子で構成される、請求項49記載の方法。
【請求項53】
生物学的試料が、切断された生体分子で構成される、請求項49記載の方法。
【請求項54】
生体分子が、酵素により切断される、請求項53記載の方法。
【請求項55】
酵素がトリプシンである、請求項54記載の方法。
【請求項56】
生物学的試料の質量分析インジェクションからのデータに関する同位体マップから製作されたペプチドマップについての情報を表示する方法であり:
a)同位体マップを入力する段階;
b)ペプチド検出モジュールにより、該同位体マップに対してペプチド検出を実行する段階;
c)ペプチド検出の結果からペプチドマップを作成し、これによりペプチドマップを製作する段階;および
d)ペプチドマップについての情報を使用者に表示する段階
を含む方法。
【請求項57】
各々が生物学的試料の質量分析インジェクションを表しているペプチドマップ対から、ペプチドマップを整列化する関数についての情報を表示する方法であり:
a)ペプチドマップ対を入力する段階;
b)ペプチドマップ対に対して、ペプチドマップアラインメントモジュールにより、ペプチドマップアラインメントを実行する段階;
c)インジェクション対の間でのカラムオフセットを決定する段階;
d)インジェクション対の間での保持時間変換関数を決定する段階;および
e)該関数についての情報を使用者に表示する段階
を含む方法。
【請求項58】
各々が生物学的試料の質量分析インジェクションを表しているペプチドマップ対からのペプチドマップアラインメントに関する情報を表示する方法であり、ペプチドマップ対を入力する段階、および該ペプチドマップ対に対して、ペプチドマップアラインメントモジュールにより、ペプチドマップアラインメントを実行し、これにより整列化されたペプチドマップを製作し、該整列化されたペプチドマップについての情報を使用者に表示する段階を含む、方法。
【請求項59】
生物学的試料の質量分析インジェクション対から示差的かつ固有に発現された生体分子についての情報を表示する方法であり:
a)該インジェクションからのデータを入力する段階;
b)試料に関する同位体マップを製作する段階;
c)同位体マップからペプチドマップを製作する段階;
d)ペプチドマップを整列化する段階;
e)整列化されたマップ間での差異を決定する段階;および
f)該差異に関する情報を使用者に表示する段階
を含む方法。
【請求項60】
LC-MS-MS断片化スペクトルへ、LC-MSインジェクションから整合させた生体分子についての情報を表示する方法であり:
a)該インジェクションからのデータを入力する段階;
b)インジェクションに関する同位体マップを製作する段階;
c)同位体マップからペプチドマップを製作する段階;
d)ペプチドマップを整列化する段階;
e)整合している生体分子を決定する段階;および
f)該整合している生体分子に関する情報を使用者に表示する段階
を含む方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate


【公表番号】特表2006−510875(P2006−510875A)
【公表日】平成18年3月30日(2006.3.30)
【国際特許分類】
【出願番号】特願2004−554860(P2004−554860)
【出願日】平成15年11月21日(2003.11.21)
【国際出願番号】PCT/IB2003/006376
【国際公開番号】WO2004/049385
【国際公開日】平成16年6月10日(2004.6.10)
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
WINDOWS
Linux
【出願人】(504111598)カプリオン ファーマシューティカルズ インコーポレーティッド (3)
【Fターム(参考)】