説明

ペアとなる同位体群の発見

ペプチド、代謝物物質又は他の物質のペアとなる同位体群を見つけ出す技術は、特徴を同定する必要なしに、実行される。適切な同位体標識技術、例えばSILAC又はICATが使用できる。当該技術は単一同位体に基づく重軽標識ペプチドをペアとすることにより同位体ペアを同定できる。技術は、ユーザーによって調節可能な所定許容範囲内で保持時間および質量/電荷を有する同位体群を検索する。多様な標識サイトは逆標識と同様に支持され、バイアスを抑制又は減らす。多様な複製は、合成画像にマージされ得る。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、生物学的サンプルにおいてペアとなる特徴を見いだす方法およびそのためのシステムに関する。
【背景技術】
【0002】
同位体標識(isotopic labeling)は、様々な分子又は原子レベルで生物学的サンプルを観察するために同位体を使用する2つの技術のうちの1つである。一方の技術は放射性同位体を利用する。他方の技術は、多少の非放射性同位体又は安定同位体を使用する。観察は、分析される生物学的サンプルにおける様々な安定同位体の相対量を決定する装置である例えば質量分析計などの機器を用いた安定同位体の相対存在率の測定によってなされる。
【発明の概要】
【0003】
この概要は、詳細な説明において詳述する概念の選択を単純化した形態で導入するために提供される。この概要は特許請求の範囲に記載される主題事項の重要な特徴を特定することを意図されておらず、特許請求の範囲に記載される主題事項の範囲を決定する補助として使用されることも意図されていない。
【0004】
本発明に従って、方法、コンピュータ可読媒体およびシステムが提供される。本発明の1つの方法形態は、生物学的サンプルにおいてペアとなる特徴を見いだす方法を含む。該方法は、特徴ある核酸配列を同定する必要なく、コントロールサンプルとコントロールサンプルに追跡関係を有する処理サンプルとが調製サンプルとしまとめられる実験から、合成画像を形成することを含む。該方法は、合成画像から興味ある特徴のペア(興味ある特徴の1つのペアの1つのメンバが追跡関係に従ってペアの他のメンバに関連している)を見いだすことを更に含み、追跡関係は合成画像上のペアの両メンバを見つける制約条件を記載している。
【0005】
本発明の他の態様に従って、本発明のコンピュータ可読媒体形態は、生物学的サンプルにおいてペアとなる特徴を見いだす方法を実行するために、その上に格納されるコンピュータ実行可能命令を有するコンピュータ可読媒体を含む。該方法は、特徴ある核酸配列を同定する必要なく、コントロールサンプルとコントロールサンプルに追跡関係を有する処理サンプルとが調製サンプルとしてまとめられる実験から、合成画像を形成することを含む。該方法は、合成画像から興味ある特徴のペア(興味ある特徴の1つのペアの1つのメンバが追跡関係に従ってペアの他のメンバに関連している)を見いだすことを更に含み、追跡関係は合成画像上のペアの両メンバを見つける制約条件を記載している。
【0006】
本発明の他の態様に従って、本発明のシステム形態は、興味あるペアとなる特徴を見いだすシステムを含む。該システムは、コントロールサンプルおよび処理サンプルが処理のために一緒に従属される調製サンプルを受容するための1つのまとまりのクロマトグラフィ機器および質量分析機器を含む。該システムは、調製サンプルから合成画像を生成しかつ処理して、特徴を抽出しかつ特徴を計算する画像処理パイプラインをさらに含む。該システムは、特徴ある核酸配列をまず同定する必要なく、合成画像から特徴を処理して、関係に従って互いに関連している興味ある特徴のペアを見いだすペア特徴処理器をさらに含む。
【図面の簡単な説明】
【0007】
本発明の前述の態様および付随する利点の多くは、添付の図面を参照しながら、以下の詳細な説明を参照することで、より理解され、さらに容易に評価されるであろう。
【図1】ペアとなる特徴のペア形成を定義する関係を有する生物学的サンプルのペアとなる特徴を見つけるための典型的なシステムを例示しているブロック図である。
【図2】ペアとなる特徴のペア形成を定義する関係を有する生物学的サンプルのペアとなる特徴を見つけるための典型的なペア特徴処理器を例示しているブロック図である。
【図3】保持時間を表示しているx軸および質量/電荷を表示しているy軸を有する標識によって分離される同位体群の典型的なグラフを例示している画像の線図である。
【図4A】本発明の様々な実施例による同位体標識に連結したバイアスおよびその抑制又は減少を示す典型的なグラフを例示している画像の線図である。
【図4B】本発明の様々な実施例による同位体標識に連結したバイアスおよびその抑制又は減少を示す典型的なグラフを例示している画像の線図である。
【図4C】本発明の様々な実施例による同位体標識に連結したバイアスおよびその抑制又は減少を示す典型的なグラフを例示している画像の線図である。
【図5A】関係による生物学的サンプルの興味あるペアとなる特徴を見つけるための典型的な方法を例示しているプロセス図である。
【図5B】関係による生物学的サンプルの興味あるペアとなる特徴を見つけるための典型的な方法を例示しているプロセス図である。
【図5C】関係による生物学的サンプルの興味あるペアとなる特徴を見つけるための典型的な方法を例示しているプロセス図である。
【図5D】関係による生物学的サンプルの興味あるペアとなる特徴を見つけるための典型的な方法を例示しているプロセス図である。
【図5E】関係による生物学的サンプルの興味あるペアとなる特徴を見つけるための典型的な方法を例示しているプロセス図である。
【図5F】関係による生物学的サンプルの興味あるペアとなる特徴を見つけるための典型的な方法を例示しているプロセス図である。
【図5G】関係による生物学的サンプルの興味あるペアとなる特徴を見つけるための典型的な方法を例示しているプロセス図である。
【図5H】関係による生物学的サンプルの興味あるペアとなる特徴を見つけるための典型的な方法を例示しているプロセス図である。
【図5I】関係による生物学的サンプルの興味あるペアとなる特徴を見つけるための典型的な方法を例示しているプロセス図である。
【図5J】関係による生物学的サンプルの興味あるペアとなる特徴を見つけるための典型的な方法を例示しているプロセス図である。
【図5K】関係による生物学的サンプルの興味あるペアとなる特徴を見つけるための典型的な方法を例示しているプロセス図である。
【発明を実施するための形態】
【0008】
これから明らかにするように、本発明の様々な実施例は、実験的又は生物学的関係により関連する特徴あるペアを発見する前に、例えば正確なタンパク質配列を決定するなど、特徴を同定する問題を認識する。また、本発明の様々な実施例は、よりよくノイズを減らしかつ弱い発現を有する特徴のより良好な検出のため、調製サンプルとしてLC/MS機器に付託された多様なサンプルから、又は多様な複製から形成される合成画像を使用する。さらに、本発明の様々な実施例は、逆転された同位体標識が同位体標識プロセスに関連するバイアス(bias)を抑制又は減少できる。
【0009】
興味あるペアとなる特徴が生物学的サンプルから発見されるシステム100は、図1に示される。一般的に、実験は、コントロールのものおよび処理されたもの、非病気のものおよび病気のもの、健康のものおよび罹患のもの、等々2つのものの間の比較とすることができる。プロテオミクス実験において、科学者はタンパク質が導かれた条件に関して異なってふるまうかどうかについて知ることを望んでいる。代謝実験においては、科学者は代謝物が導かれた条件に関して異なってふるまうかどうかについて知ることを望んでいる。薬物治療、治療的な結果および毒性リスクをよりよく理解するために最適に本発明の様々な実施例に影響を及ぼすことができる多くの他のタイプの実験がある。
【0010】
本発明の様々な実施例によっては、最初に特徴を同定しなければならないことなく、生物学的サンプルのペアとなる特徴が発見されるようにできる。ペアとした後、様々な実施例によっては、特異に又は非特異に発現された特徴が目標とされた同定へ進むようにできる。今、ペアとされたそれらの特徴は、以前に同定されなかった場合でも、ペプチド(又はタンパク質)配列又は代謝物の同定のためのタンデム型質量分析又は他の一連の機器に送り出され得る。ペプチド、タンパク質又は代謝物の同定(又は他の生物学的同定)の後、これらの特徴は、ペプチド配列、タンパク質配列又は代謝物の情報(又は他の生物学的情報)によってアノテーションが行われ得る。
【0011】
図1に戻ると、コントロールサンプル102Aは保存される。処理された処理サンプル1 104Aは、処理条件を経たコントロールサンプルの事例である。さらに、処理サンプル1 104Aに添加又はその中で認識されることは、追跡されるべきそのコントロールサンプル102Aとの関係を許容する追跡である。1つの適切な追跡は、適切な同位体標識技術、例えばSILAC又はICATを使用している標識の添加である。原子質量単位の選択された数、例えば6ダルトンは、処理サンプル1 104Aに標識をつけるために用いる。この選択された数又は標識は、それらが合成画像上にて見つかる特徴あるペアとして表示されるときに、コントロールサンプル102Aおよび処理サンプル1 104Aの関係を追跡するために後にシステム100で使われるであろう。ペアとなる特徴の一方のメンバはおそらくコントロールサンプル102Aから由来して、ペアとなる特徴の他方のメンバはおそらく処理サンプル1 104Aから由来する。図1にて示したように、処理サンプル1 104Aを標識するために用いた標識は、「標識A」と称される。
【0012】
コントロールサンプル102Aおよび処理サンプル1 104A(標識A)は、システム100に単一の実行として付託される調製サンプル106として調製され得る。コントロールサンプル102Aおよび処理サンプル1 104A(標識A)が1つの調製サンプル106としてシステム100に入ることができることによって、本発明の様々な実施例は、実験に偽(falsity)を入れる機器依存変動を抑制又は減らすことができる。抑制又は減少する機器依存変動については、発見された特徴は、コントロールサンプル102Aおよび処理サンプル1 104A(標識A)に原因があるとすることができる。例えば、処理サンプル1 104A(標識A)の発現レベルがコントロールサンプル102Aと比べて差異がある場合、差は処理条件に原因があるとすることができ、かならずしも機器依存変動によらないとすることができる。
【0013】
いくつかの同位体標識技術、例えばSILACは、実験に偽を入れる標識依存バイアスを加える。本発明の様々な実施例は、標識反転実験プロトコルをサポートすることによって標識依存バイアスを抑制又は減らす。例えば、コントロールサンプル102Aは、処理サンプル1 104Aを標識するために以前に使われた選択された原子質量単位の数、例えば6ダルトンによって、標識(標識A)され得る。他方において、処理サンプル1 104Aは標識されない。標識されたコントロールサンプルは現在コントロールサンプル102Bとして参照され、そして、非標識の処理サンプルは現在処理サンプル1 104Bとして参照される。コントロールサンプル102B(標識A)および処理サンプル1 104Bは、システム100に単一の実行として付託される調製サンプル106として、コントロールサンプル102Aおよび処理サンプル1 104A(標識A)と共に調製され得る。両方のコントロールサンプル102A、102B(標識A)および処理サンプル1 104A(標識A)、104Bが1つの調製サンプル106としてシステム100に入ることを許すことによって、標識反転実験的プロトコルは実行され、そして、標識バイアスが抑制され又は減少される。
【0014】
システム100は、また、1つの調製サンプル106としてシステム100に入れるためにコントロールサンプル102A、102B(標識A)および処理サンプル1 104A(標識A)、104Bと共に集められ得る追加の実験を適応させることができる。例えば、同じコントロールサンプルを使用することに関する他の実験において、コントロールサンプル102Aと同一であるコントロールサンプル102Cが提供される。処理サンプル2 104Cは、処理サンプル1 104A(標識A)が従属した処理条件と異なる他の処理条件を経たコントロールサンプル102Cの事例のサンプルである。処理サンプル2 104Cは、類似した同位体標識技術を使用するが、異なる原子質量単位の数、例えば12ダルトン(標識B)を使用して標識される。
【0015】
標識依存バイアスを抑制又は減らすために、コントロールサンプル102Cおよび処理サンプル2 104C(標識B)は、また、標識反転実験プロトコルに従属させることができる。例えば、コントロールサンプル102Cは、処理サンプル2 104Cを標識するために以前に使われた選択された原子質量単位の数、例えば12ダルトンによって、標識(標識B)され得る。他方において、処理サンプル2 104Cは標識されない。標識されたコントロールサンプルは現在コントロールサンプル102Dとして参照され、そして、非標識の処理サンプルは現在処理サンプル2 104Dとして参照される。コントロールサンプル102D(標識B)および処理サンプル2 104Dは、システム100に単一の実行として付託される調製サンプル106として、コントロールサンプル102A−102Cおよび処理サンプル1 104A−102Cと共に調製され得る。両方のコントロールサンプル102A−102Dおよび処理サンプル1 104A−104Dが1つの調製サンプル106としてシステム100に入ることを許すことによって、標識反転実験的プロトコルは実行され、そして、標識バイアスが抑制され又は減少される。
【0016】
調製サンプル106は、LC/MS機器108 110に付託される。LC/MS機器108 110は、生物学的特徴、例えばペプチドを2次元(保持時間と質量/電荷)で分離され得る。所定の保持時間において、1次元連続体が興味ある質量/電荷範囲で得られることが可能である。生物学的特徴は連続体中の同位体ピークとして示される。ピーク強度は、興味ある生物学的特徴と関連する非放射性の安定同位体の相対的な存在率に対し比例すると想定される。結局、x軸として参照されている保持時間およびy軸として参照されている質量/電荷については、順番に集められた1次元の質量分析計の連続体は、2次元のデータセットを形成する。
【0017】
画像処理パイプライン112は、LC/MS機器108 110から得られた2次元のデータセットから、特徴特性および発現プロファイルを含む特徴リストを作り出す。画像処理パイプライン112は、いくつかの関係によって他の特徴と関連する特徴が更なる科学的研究のためのペアとされるように、特徴抽出を容易にする。画像処理パイプライン112のいくつかのコンポーネント(図示せず)は、画像前処理(データ補間、画像位置合せ、画像ノイズフィルタリング、バックグラウンド補正、および合成画像形成)を実行する合成画像生成器と、画像特徴抽出(ピーク、同位体群および電荷群)を実行して、特徴特性を計算する合成画像処理器とを含む。画像処理パイプライン112の出力は、特徴およびそれらの特性のリストを含む。
【0018】
特徴とそれらの特性のリストは、ペア特徴処理器118に提供される。同位体標識を使用して、ペア特徴処理器118は、特徴の1つのペアの一方のメンバが原子質量単位の数によって特徴あるペアの他方のメンバに関係するかどうか調査する。(もちろん、関係の他のタイプが使われる場合、原子質量単位の数においてでなく他の指標によって、関係は発見され得る。)言い換えれば、所定の保持時間にて、必然的に時間内ではないが、特徴あるペアは、初めに原子質量単位の数によって分離されるように発見されるはずである。合成画像のy軸が質量/電荷を参照するとすると、特徴あるペアは所定の保持時間の間にy軸に沿って、垂直に見つけられ得る。例えば、所定の同位体ピークがコントロールサンプル、例えばコントロールサンプル102Aの発現を表示する場合、人は、原子質量単位の数、例えば6ダルトンで分離された処理サンプル1 104A(標識A)の発現を表示する他の同位体ピークを見つけると予想するだろう。結局は、ペア特徴処理器118が特徴あるペアを集め、特性計算を実行し、例えば更なる特異の又は非特異の解析のために強度の比率を決定する。例えば、特徴あるペアおよびそれらの特性は、異なる医薬品供与量下のタンパク質発現が異なる処理条件102A−102D、104A−104Dの異なる実験のために発生するかどうか、について明かりをともす助けになり得る。
【0019】
図2は、画像処理パイプライン112が合成画像生成器202から成ることを示す。合成画像生成器202は、合成画像204を生成する。本技術分野では、画像を一緒に合成画像にマージすることが、ノイズを減らし生物学上重要であるが弱く発現する特徴を保持することを認識していなかった。前に議論したように、この合成画像の興味ある領域は、そのいくつかは逆標識された(標識A、B)であるコントロールサンプル102A−102Dから特徴を表示することができ、そして、そのいくつかは標識された(標識A、B)である処理サンプル1、2 104A−104Dから特徴を表示できる。合成画像処理器206は、特徴のリスト、例えば同位体ピーク、同位体群および電荷群を見つけるために合成画像204を処理する。合成画像処理器206も、これらの特徴の特性およびプロファイルを算出する。
【0020】
以前では、本技術分野はペアとなる特徴を見つける前に特徴の序列を決定することによって全ての特徴を同定しようとしていた。本技術分野は、特徴を同定するステップが興味あるペアとなる特徴とわかる前に起こす必要はないと認識していなかった。時々、低い発現レベルを有する、又は、処理条件が発現を抑制するそれらの特徴を同定することは可能ではない。その上、何千もの特徴があり得、その全部を同定することは能率が悪い。したがって、ペアのメンバでなく、生物学的重要な関係を有することができないそれらの特徴のために、それらが同定される必要はない。ペア形成前に全ての特徴を同定する試みは、科学的な発見を遅くするかもしれない。
【0021】
ペア特徴処理器118は、図2でより詳細に示される。ペア特徴処理器118は特徴序列器208から成り、それは合成画像処理器206によって生成される特徴のリストをとって、特徴のリストをランキングする。ランキングは、最も強いシグナルの特性を有するそれらの特徴が優先順位処理を持たせるような序列に、特徴を配置する。例えば、ランキングは、それらが最初に処理されるように、最大ピーク強度および/又は最大質量/電荷を有する特徴が最初にリストされる降順においてなされ得る。このような方法で、本発明の様々な実施例は、興味ある特徴のペアを示し、誤った道に解析を導くノイズが多い特徴を避ける可能性のあるそれらの特徴に、初期リソースを集中させる。
【0022】
ペア特徴検出器210は、ランキングされた特徴のリストを受信して、興味あるペアとなる特徴を見つける。前述のように、各々のペアは、コントロールサンプル102A−102Dから由来する特徴と、処理サンプル104A−104Dから由来する他の特徴とで構成される。興味ある特徴のペアが見つけられた後、情報、例えばタンパク質配列を同定することが欠如しているそれらの特徴のために、目標の同定は進めることができる。タンデム質量分析計又は他の同定装置は、それらの特徴のための核酸配列又はアミノ酸配列を得られるようにブレークダウンが生じる特定の特徴上にトリガーをセットされ得る。再び、前の議論のように、生物学的理由のために、時々、生物学上重大である特徴は、システム100による実行において現れることはなかった。全部をマージする合成画像の使用は一緒に進行し、たとえ特徴が順方向に標識されたものでは現れず、失敗で逆方向に標識されたものでは現れ成功する場合であっても、これらの特徴が合成画像に現れ、いくつかの関係によって関連する興味ある特徴のペアが発見され得る。生物学上有意特徴が次の解析のために捕らえられる限り、特徴が現れる本発明の様々な実施例は重要ではない。
【0023】
特徴序列器208は、ペア特徴検出器210に、リストの最も弱い特徴に最も強い特徴を提供する。ペア特徴検出器210は最も強い特徴で開始し、関係、例えば原子質量単位の数(重みによる関係)を原因として生じるので、特徴のリストを解析してペア形成のための候補である対応する特徴を決定する。例えば、原子質量単位の数が6ダルトンである場合、ペア形成のための候補特徴はユーザー定義可能な許容差の範囲内で、約6ダルトンのように見えるはずであり、所定の保持時間の間、ユーザー定義可能な他の許容差の範囲内の最も強い特徴から離れている。1つの実施例において、保持時間許容範囲は、10秒にデフォルト設定する。ユーザーは、質量/電荷許容範囲と同様に保持時間許容範囲が機器変化を適応させるように調整できる。
【0024】
興味ある特徴の1つのペアを発見した後に、ペア特徴検出器210は、特徴の序列されたリストからペアを除去する。ペア特徴検出器210は、特徴の序列されたリストの次の最も強い特徴に集中して、それらをペアにするための最も強い特徴と一致する他の特徴を発見しようと試みる。ペア特徴検出器210は最も強い特徴でペア形成のための候補であるいくつかの数の特徴を見つけることが可能である。これが起こるときに、ペア特徴検出器210は、特徴の序列されたリストの最も強い特徴に関して、最大の質量かつ最も近い保持時間を有する他の全ての候補特徴から候補特徴を選ぶ。ペア特徴検出器210が候補特徴を見つけるために使用できる計算リソースを制限するために、保持時間許容範囲は、ペア特徴検出器210が候補特徴を見つけることを敢行できる範囲を定義する。同様に、質量/電荷許容範囲は、ペア特徴検出器210が候補特徴を見つけることができる範囲を定義するために用いる。1つの実施例において、質量/電荷方向のデフォルトの許容範囲は、0.1ppmであって、機器およびそのオペレーティングモードに依存する。
【0025】
特徴序列器208によって受信される1つのタイプの特徴は、同位体群である。多様な同位体群があり得る。1つの同位体群はいくつかの同位体ピークを有することができ、そして、他の同位体群は異なるいくつかの同位体ピークを有することができる。多数の同位体群があり得る。ペア特徴検出器210はユーザーが選択可能なしきい値、デフォルトで4、によって興味ある特徴のペアのための検索を制限する。換言すれば、ペア形成のための候補であってもよい同位体ピークのための第4の同位体群に注目した後に、ペア特徴検出器210は、追加の候補を見つけるために他の同位体群を越えて危険を冒さない。
【0026】
ペア特徴検出器210は、2つの同位体群間の共通の同位体ピークの数を決定して、共通な数に集中して、共通の同位体ピークの数の部分でない余分な同位体ピークを無視する。例えば、第1の同位体群は、最も低い多数/電荷を有する同位体ピークから始まっている3つの同位体ピークを有する。ペア特徴検出器210はペアとなる特徴を第2の同位体群で見つけることができたが、しかし、この第2の同位体群は5つの同位体ピークを有する。1つの実施例において、共通の同位体ピークの数をつくるために、ペア特徴検出器210は、第2の同位体群の最も高い質量/電荷の同位体ピークを無視すると共に、第1の同位体群の3つの最も低い質量/電荷の同位体ピーク並びに第2の同位体群の3つの最も低い質量/電荷の同位体ピークの使用を選ぶことができる。もう1つの実施例では、共通の同位体ピークの数は、最も大きい強度を有する同位体ピークから選ばれることができる。例えば、ペア特徴検出器210は、両方の第1および第2の同位体群の最も大きい強度を有する3つの同位体ピークを使用するほうを選ぶことができる。
【0027】
ペア特徴検出器210によって発見された興味あるペアとなる特徴は、ペア特徴特性処理器212に転送される。1つの処理された特性は、強度の比率を含む。ペア特徴特性処理器212は、処理サンプルを表示するペアのメンバとしての1つの同位体群の同位体ピークの強度を獲得して、当該強度を合計して被除数にする。ペア特徴特性処理器212は、それから、コントロールサンプルを表示するペアのメンバとしての他の同位体群の同位体ピークの強度を獲得して、当該強度を合計して除数にする。比率は、被除数および除数から生成される。ペア特徴特性処理器212は比率のセットを生成する。これらの比率から、ペア特徴特性処理器212は、発現情報が検索され得るためのプロファイリングパラメータを生成する。1つのプロファイリングパラメータは比率の常用対数を獲得することであり、その後、常用対数のエラーが算出され特徴あるペアの各々のためのp値を得る。
【0028】
p値は特異性検出のために使われる。ユーザーは、特異性しきい値をセットするためにペア特徴特性探索器214を使用できる。ペア特徴特性探索器214は特異性しきい値未満のp値を有するペアを集め、それらのペアをさらなる解析のためにユーザーに提示する。例えば、ペア特徴特性探索器214によって発見された特徴の1つのペアを近づいて見る際に、ユーザーはペアのメンバが情報を同定することを欠いていることがあると決定できる。ユーザーは、ペアのメンバを目標として機器にその核酸又はアミノ酸配列を決定させるためにタンデム型質量分析プロセスの特定の保持時間で、トリガーメカニズムをセットできる。これは、全ての特徴を同定する必要性を避け、そして、その代わりに、実験的又は生物学的関係を有するそれらの特徴が更なる発見のために焦点として前面に引き出される。
【0029】
余談だが、ペア特徴特性処理器212は、規格化を実行することができる。強度の比率が規格化レベル未満の場合、比率は情報を加えることができず、比率は除去され得る。1つの規格化技術は、コントロールサンプルの平均を得るため、コントロールサンプルの全ての同位体ピークを合計すること、同位体ピークの数によって割ることを含む。同様に、処理サンプルの平均は、処理サンプルの全ての同位体ピークを合計し、同位体ピークの数によって割ることによって得られる。コントロールサンプルおよび処理サンプルの平均が類似していない場合、スケーリングプロセスが実行され、重大でない比率を取り除くため規格化レベルを生成する。
【0030】
グラフ300は、共通のサンプルおよび処理サンプルを表している興味ある特徴を含む合成画像を視覚的に説明する。図3を参照のこと。グラフ300は質量/電荷次元の参照であるy軸と保持時間次元の参照であるx軸とを含む。特定の保持時間で、3つの同位体群特徴が現れる。3つの同位体群のうちの1つはコントロール同位体群304を含み、それはコントロールサンプルを表示する。コントロール同位体群304は、4つの同位体ピーク302を含む。4つの同位体ピーク302は、コントロールサンプルを処理サンプルと関係づけるペアのメンバであってもよい。
【0031】
3つの同位体群の他の1つは、3つの同位体ピーク308を有する処理された同位体群A310を含む。処理された同位体群A310はコントロール同位体群304として類似した保持時間に沿って現れ、そして、3つの同位体ピーク308はコントロール同位体群304の同位体ピーク302とのペア形成のための候補であってもよい。処理された同位体群A310は、いくつかの原子質量単位によって標識された処理サンプルを表すことができ、処理された同位体群A310をコントロール同位体群304から、同位体標識において使用された原子質量単位の量、例えば6ダルトンにて離す。共通の同位体ピークの数は、同位体ピーク302および308の数の差を与えたペア特徴処理器118によって確立され得る。例えば、同位体ピーク308に3つの同位体ピークがあり、同位体ピーク302に4つの同位体ピークがある。この例では、共通の同位体ピークの数は、処理された同位体群A310が3つの同位体ピーク308を有する事から、3つに指定され得る。
【0032】
他の実験がLC/MS機器108 110に付託される同じ調製サンプルの一部であった場合、処理された他のサンプルの表現は、5つの同位体ピーク314を有するグラフ300、例えば処理された同位体群B316、に現れ得る。同じ共通のサンプルが使われた場合、処理された同位体群B316の5つの同位体ピーク314のいくつかはコントロール同位体群304の同位体ピーク302とのペアとされてもよい。共通の同位体ピークの数は決定され、それはこの場合4である。共通の同位体ピークを確立するための方式が同位体群304、310および316の最も低い同位体ピークに基づく場合、ライン306は3つの段階を有する。ライン306の最下段段階は、最も低い同位体ピーク302が中間の段階によって参照される最も低い同位体ピーク308とのペアであり得ることを示し、そして、さらに、ライン306の最上部段階によって参照されるように、最も低い同位体ピーク302は最も低い同位体ピーク314とのペアであり得る。残るライン312、318および320は、他のペア形成を示す。
【0033】
グラフ300は、本発明の様々な実施例上の焦点が、或る関係に従う互いに関連する特徴あるペアを発見することであることを示す。グラフ300は、類似した保持時間に現れている同位体群を示し、そして、これらの同位体群は或る質量/電荷によって分離され、それは関係を定義することができる。これらの関係は、ペア特徴処理器118が興味ある特徴のペアを発見できる制約条件を定義する。いくつかの上記の例において、同位体標識は処理サンプルに添加された。他の例(図示せず)において、同位体標識を使用することの代わりに、ペア特徴処理器118は、他の制約条件、例えば特定の分子の存在、その他に基づく関係を見つけることができる。また他の例(図示せず)において、ペア特徴処理器118は、代謝物、例えば獲得した原子の存在又は原子の減失、その他に基づく関係を見つけることができる。
【0034】
いくつかの実験は望まないバイアスを導く。例えば、処理サンプルに同位体標識を付ける際に、バイアスは導かれ得る。いくつかのペプチドは、一定の標識−依存比率のバイアスを呈する。これらのバイアスは、上昇調整、下降調整、あるいは、両方に向かう調整に現れ得る。処理サンプルの結果発現は、また、同じバイアスを含むことができる。本技術分野は、このバイアスが実験結果を強化するために取り除かれなければならないと認識していなかった。図4A−図4Cにて図示したように、グラフ402−406は、逆標識実験プロトコルが実行された後のバイアスの除去を示す。全てのグラフ402−406において、y軸は比率の自然対数を参照し、x軸はペアとなる特徴の基準化された強度の自然対数を参照する。グラフ402(順方向標識された特徴を表示する)およびグラフ404(それは、逆方向標識された特徴を表示する)は、クラスタから離れてバイアスを示す。逆標識実験プロトコルを実行した後に、これらのバイアスは、グラフ406で示すように、消える。
【0035】
図5A−図5Kは、生物学的サンプルの興味あるペアとなる特徴を見つけるための方法5000を例示する。開始ブロックから、方法5000は、継続ターミナル(「ターミナルA」)および出口ターミナル(「ターミナルB」)の間で定義される一組の方法ステップ5002へ進む。方法ステップ5002のセットは、特徴特性(feature characteristic)の特徴抽出および計算のための合成画像を生成するため調製サンプルの生成およびその処理を記載する。
【0036】
ターミナルA(図5B)から、方法5000はブロック5008へ進み、ここでコントロールサンプルが実験のために保存される。処理サンプルは、異なる表現型的又は処理条件の実験から生成される。ブロック5010を参照のこと。処理サンプルは、原子質量単位の特定数、例えば6ダルトンから構成された非放射性の安定同位体を使用する同位体トレーサを含むように標識される。ブロック5012を参照のこと。方法はそれから判断ブロック5014へ進み、ここで実験のプロトコルが標識反転を必要とするかどうか決定するためにテストが実行される。判断ブロック5014でのテストの解答がYESである場合、方法5000は他の継続ターミナル(「ターミナルAl」)へ進む。判断ブロックでのテストの解答がNOである場合、方法5000は他の継続ターミナル(「ターミナルA2」)へ進む。
【0037】
ターミナルAl(図5C)から、コントロールサンプルの事例は、処理サンプルの標識で使ったものと同一の原子質量単位の数からなる同位体トレーサによって、標識される。ブロック5016を参照のこと。処理サンプルの事例は、同位体トレーサによって標識されずに保存される。ブロック5018を参照のこと。次に、判断ブロック5020で、テストは、異なる表現型的又は処理条件の他の実験があるかどうか決定するために実行される。判断ブロック5020でのテストの解答がNOである場合、方法は他の継続ターミナル(「ターミナルA3」)に続く。判断ブロック5020でのテストの解答がYESである場合、方法は、ブロック5022に続き、ここで新規な同位体トレーサが原子質量単位の他の数(他の標識)、例えば12ダルトンで構成される非放射性の安定同位体を使用している標識として選ばれる。ステップ5008−5018は、新規な実験のための新規な同位体トレーサを使用して繰り返される。ブロック5024を参照のこと。方法は、それからターミナルA2に続く。
【0038】
ターミナルA3(図5D)から、方法5000はブロック5026へ進み、ここで1以上の実験から標識された又は非標識された調製されたコントロールサンプルおよび処理サンプルが一緒に集められ、LC/MS機器に付託のための調製サンプルとして調製される。合成画像が、y軸で質量/電荷、x軸で保持時間、z軸で同位体ピークの値の3次元の質量分析スペクトラムを含むように生成される。方法は、それから出口ターミナルBに続く。
【0039】
ターミナルB(図5A)から、方法5000は一組の方法ステップ5004へ進み、ステップ5004は、継続ターミナル(「ターミナルC」)および出口ターミナル(「ターミナルD」)の間で定義される。方法ステップ5004のセットは、ペアとなる特徴、例えばペアとなる同位体ピーク又は特定の関係によって関連する他のペアを見つける。
【0040】
ターミナルC(図5E)から、方法5000はブロック5032へ進み、ここで同位体ピークの強度により降順にて、特徴が序列される。強度で序列された特徴は、同位体ピークの質量により降順にて、更に序列される。ブロック5034を参照のこと。方法5000はそれから序列されたリストの第1の同位体ピークを選び、それは最も強い強度を有する最も高く序列された同位体ピークである。ブロック5038を参照のこと。方法は、第1の同位体ピークが帰属する同位体群(第1の同位体群)を決定する。ブロック5040を参照のこと。方法は、他の継続ターミナル(「ターミナルC3」)に続く。方法は、保持時間内および質量/電荷許容差の範囲内にて、第2の同位体群において、標識された同位体ピークを見つけるために序列されたリストを捜す。ブロック5042を参照のこと。方法は発見した同位体ピークを強調する(note)が、それは、潜在的候補又はペアとなる同位体群のメンバとして、原子質量単位の数、例えば6ダルトンで、第1の同位体ピークから間隔を置いて配置される。ブロック5044を参照のこと。方法は、他の継続ターミナル(「ターミナルCl」)に続く。
【0041】
ターミナルCl(図5F)から、方法5000は判断ブロック5046へ進み、ここで第2の同位体群の他の標識された同位体ピークがあるかどうか決定するためにテストが実行される。判断ブロック5046でのテストの解答がNOである場合、方法5000は他の継続ターミナル(「ターミナルC4」)へ進む。判断ブロック5046でのテストの解答がYESである場合、方法5000は他の判断ブロックへ進み、ここで、他の標識された同位体ピークが保持時間内および質量/電荷許容差の範囲内であるかどうか決定するための他のテストが実行される。判断ブロック5048でのテストの解答がNOである場合、方法はターミナルC4に続く。判断ブロック5048でのテストの解答がYESである場合、方法はターミナルC3に続く。
【0042】
ターミナルC4(図5G)から、方法5000はブロック5050へ進み、ここで、方法5000が全ての候補又は潜在的メンバから、保持時間の第1の同位体ピークに最も近くて、原子質量単位の数(標識)に離間する最も近くのものを選ぶ。選択されたメンバはペアとなる同位体群のメンバになり、そして、他のメンバは第1の同位体ピークである。ブロック5052を参照のこと。選択されたメンバは、第2の同位体群の同位体ピークであり、かつ、第1の同位体群の第1の同位体ピークと対応し、序列されたリストから除去される。ブロック5054を参照のこと。テストは、追加の同位体群を検索するための制限に達したかどうか決定するために判断ブロック5056で実行される。判断ブロック5056でのテストの解答がYESである場合、方法5000は他の継続ターミナル(「ターミナルC5」)に続く。判断ブロック5056でのテストの解答がNOである場合、方法5000は、ブロック5058に続き、ここで、方法はペアとなる同位体ピークを含むことができる他の同位体群のための検索に、原子質量単位の他の数を使用する。方法はそれからターミナルC3へ進み、そしてブロック5042へ戻って進み、ここで上記の処理ステップが繰り返される。
【0043】
ターミナルC5(図5H)から、方法5000はブロック5060へ進み、ここで、第1の同位体群からの第1の同位体ピークが序列されたリストから除去される。テストは、ペアとなる同位体ピークのための更なる検索に種をまく(seed)制限に達したかどうか決定するために判断ブロック5062で実行される。判断ブロック5062でのテストの解答がYESである場合、方法は出口ターミナルDへ進む。判断ブロック5062でのテストの解答がNOである場合、方法はブロック5064へ進み、ここで、方法5000は、序列されたリストにおいて、最も強い強度を有する最も高く序列された同位体ピークである他の同位体ピークを選ぶ。そして、方法はターミナルC3に続き、そしてブロック5042へ戻って進み、ここで上記の処理ステップが繰り返される。
【0044】
出口ターミナルD(図5A)から、方法5000は方法ステップ5006のセットへ進み、ステップ5006は、継続ターミナル(「ターミナルE」)および出口ターミナル(「ターミナルF」)の間で定義される。方法ステップのセットは、興味あるペアとなる特徴を発見するために実行される検索のためのペアとなる特徴特性の計算を記載する。
【0045】
ターミナルE(図5I)から、方法5000はブロック5066へ進み、ここで、方法は、各々の同位体群がコントロールサンプルからの同位体ピークと処理サンプルから他の同位体ピークとを含んでいる一組のペアとなる同位体群を発見する。1つの同位体群に帰属する1つのペアの全てのメンバの強度の合計が算出される。例えば、各々のペアがコントロールサンプルから由来するメンバを含んでいる3つのペアがある場合、コントロールサンプルから由来する3つのメンバのピーク強度が合計される。処理サンプルから由来する残りの3つのメンバのピーク強度が合計される。比率は、被除数として処理サンプルからの同位体ピークの強度の合計と除数としてコントロールサンプルからの同位体ピークの強度の合計とを取ることによって、各々のペアのために生成される。ブロック5068を参照のこと。常用対数は、各々の比率についてとられる。ブロック5070を参照のこと。各々の比率の各々の常用対数のエラーが算出される。ブロック5072を参照のこと。ペアとなる同位体群の他の特性は、方法によって算出される。ブロック5074を参照のこと。方法は、他の継続ターミナル(「ターミナルE1」)へ進む。
【0046】
ターミナルE1(図5J)から、方法5000はブロック5076へ進み、ここで、p値が全てのペアとなる同位体群の比率の常用対数のために生成される。特異性検出のため、ユーザーが特異性しきい値を特定する。ブロック5078を参照のこと。テストは、p値がしきい値より小さいかどうか決定するために実行される。判断ブロック5080を参照のこと。判断ブロック5080でのテストの解答がNOである場合、方法5000はブロック5082へ進み、ここで、実験がしきい値によって特異に発現されなかったとする。方法は、他の継続ターミナル(「ターミナルE2」)に続く。判断ブロック5080でのテストの解答がYESである場合、方法5000はブロック5084へ進み、ここで、しきい値未満のp値を有する特徴のリストがユーザーに提示される。方法は、出口ターミナルFに続き、実行を終了する。
【0047】
ターミナルE2(図5K)から、方法5000はブロック5086へ進み、ここで、方法5000が同定(identification)なしで特徴を同定する(identify)。テストは、ユーザーが目標とされた解析を実行することを望むかどうか決定するために判断ブロック5088で実行される。判断ブロック5088でのテストの解答がNOである場合、方法5000は出口ターミナルFへ進んで、実行を終了する。判断ブロック5088でのテストの解答がYESである場合、方法5000はブロック5090へ進み、ここで、ユーザーが目標とされた解析のため、それらの特徴を選ぶために生成された特徴リストを使用する。タンデム型質量分析技術は、選択された特徴からのペプチド配列および他の情報を同定するために用いられる。ブロック5092を参照のこと。方法は、出口ターミナルFに続き、実行を終了する。
【0048】
明示の実施例が示され記載されると共に、様々な変更が本発明の精神と範囲から逸脱することなく、その中でされ得ることはいうまでもない。

【特許請求の範囲】
【請求項1】
生物学的サンプルにおいてペアとなる特徴を見いだす方法であって、
特徴ある核酸配列を同定する必要なしに、コントロールサンプルと前記コントロールサンプルに追跡関係を有する処理サンプルとが調製サンプルとしてまとめられる実験から、合成画像を形成するステップと、
前記合成画像から興味ある特徴のペアを見つけるステップであって、興味ある特徴の1つのペアの1つのメンバが前記追跡関係に従って前記ペアの他のメンバに関連しており、前記追跡関係は前記合成画像上の前記ペアの両メンバを見つける制約条件を記載している、ステップと
を備えることを特徴とする方法。
【請求項2】
非放射性の安定同位体の原子質量単位のいくつかの数で、前記処理サンプルの事例を同位体標識することにより、前記追跡関係が生成される一方で、前記コントロールサンプルの事例が同位体標識を経ないことを特徴とする請求項1の方法。
【請求項3】
前記コントロールサンプルの事例は、処理サンプルの同位体標識で使ったものと同一の原子質量単位の数からなる同位体標識で逆標識することにより、前記追跡関係が生成される一方で、前記処理サンプルの事例が同位体標識を経ないことを特徴とする請求項2の方法。
【請求項4】
代謝実験における1つまたは複数の分子の添加又は減失を追跡することにより、前記追跡関係が生成されることを特徴とする請求項1の方法。
【請求項5】
興味ある特徴のペアを見いだすことは同位体群を見いだすことを含み、同位体群の各々はコントロールサンプル又は処理サンプルを表し、興味ある特徴のペアを見いだすことは興味ある特徴のペアを検索するために共通の同位体ピークの数を決定することを含むことを特徴とする請求項1の方法。
【請求項6】
比率の自然対数を計算することをさらに含み、前記比率は被除数および除数からなり、前記被除数は処理サンプルを表示するペアのメンバとしての1つの同位体群の同位体ピークの強度の合計であり、前記除数はコントロールサンプルを表示するペアのメンバとしての他の同位体群の同位体ピークの強度の合計であることを特徴とする請求項1の方法。
【請求項7】
前記比率の自然対数の比率のエラーを計算して該比率のp値を生成することをさらに含み、該p値が処理サンプルの特異性発現レベルを示すことを特徴とする請求項6の方法。
【請求項8】
コンピュータに、生物学的サンプルにおいてペアとなる特徴を見いだす方法を実行させるためのコンピュータ実行可能命令を格納するコンピュータ読み取り可能な記憶媒体であって、
前記方法は、
特徴ある核酸配列を同定する必要なしに、コントロールサンプルと前記コントロールサンプルに追跡関係を有する処理サンプルとが調製サンプルとしてまとめられる実験から、合成画像を形成するステップと、
前記合成画像から興味ある特徴のペアを見つけるステップであって、興味ある特徴の1つのペアの1つのメンバが前記追跡関係に従って前記ペアの他のメンバに関連しており、前記追跡関係は前記合成画像上の前記ペアの両メンバを見つける制約条件を記載している、ステップと
を備えることを特徴とするコンピュータ読み取り可能な記憶媒体。
【請求項9】
非放射性の安定同位体の原子質量単位のいくつかの数で、前記処理サンプルの事例を同位体標識することにより、前記追跡関係が生成される一方で、前記コントロールサンプルの事例が同位体標識を経ないことを特徴とする請求項8のコンピュータ読み取り可能な記憶媒体。
【請求項10】
前記コントロールサンプルの事例は、処理サンプルの同位体標識で使ったものと同一の原子質量単位の数からなる同位体標識で逆標識することにより、前記追跡関係が生成される一方で、前記処理サンプルの事例が同位体標識を経ないことを特徴とする請求項9のコンピュータ読み取り可能な記憶媒体。
【請求項11】
代謝実験における1つまたは複数の分子の添加又は減失を追跡することにより、前記追跡関係が生成されることを特徴とする請求項8のコンピュータ読み取り可能な記憶媒体。
【請求項12】
興味ある特徴のペアを見いだすことは同位体群を見いだすことを含み、同位体群の各々はコントロールサンプル又は処理サンプルを表し、興味ある特徴のペアを見いだすことは興味ある特徴のペアを検索するために共通の同位体ピークの数を決定することを含むことを特徴とする請求項8のコンピュータ読み取り可能な記憶媒体。
【請求項13】
比率の自然対数を計算することをさらに含み、前記比率は被除数および除数からなり、前記被除数は処理サンプルを表示するペアのメンバとしての1つの同位体群の同位体ピークの強度の合計であり、前記除数はコントロールサンプルを表示するペアのメンバとしての他の同位体群の同位体ピークの強度の合計であることを特徴とする請求項8のコンピュータ読み取り可能な記憶媒体。
【請求項14】
前記比率の自然対数の比率のエラーを計算して該比率のp値を生成することをさらに含み、該p値が処理サンプルの特異性発現レベルを示すことを特徴とする請求項13のコンピュータ読み取り可能な記憶媒体。
【請求項15】
興味あるペアとなる特徴を見いだすシステムであって、
コントロールサンプルおよび処理サンプルが処理のために一緒に従属される調製サンプルを受容する1つのまとまりのクロマトグラフィ機器および質量分析機器と、
前記調製サンプルから合成画像を生成しかつ処理して、特徴を抽出しかつ特性を計算する画像処理パイプラインと、
特徴ある核酸配列をまず同定する必要なしに、前記合成画像から特徴を処理して、関係に従って互いに関連している興味ある特徴のペアを見いだすペア特徴処理器と
を含むことを特徴とするシステム。
【請求項16】
前記画像処理パイプラインは、データ補間、画像位置合せ、画像ノイズフィルタリング、バックグラウンド補正、および合成画像形成を実行する合成画像生成器を含むことを特徴とする請求項15のシステム。
【請求項17】
前記画像処理パイプラインは、ピーク、同位体群および電荷群を含む特徴を抽出し、かつ、特徴特性を計算する合成画像処理器を含むことを特徴とする請求項16のシステム。
【請求項18】
前記ペア特徴処理器は、優先順位処理のために最初に最も強いシグナルの特性を有する特徴を序列する特徴序列器を含むことを特徴とする請求項15のシステム。
【請求項19】
前記ペア特徴処理器は、合成画像を検索することによって関係に従って興味ある特徴のペアを見つけ出すペア特徴検出器を含むことを特徴とする請求項18のシステム。
【請求項20】
前記ペア特徴処理器は、比率の自然対数のエラーを獲得することからp値を生成するペア特徴特性処理器を含み、前記比率の各々は被除数および除数からなり、被除数は処理サンプルを表示するペアのメンバとしての1つの同位体群の同位体ピークの強度の合計であり、除数はコントロールサンプルを表示するペアのメンバとしての他の同位体群の同位体ピークの強度の合計であることを特徴とする請求項19のシステム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4A】
image rotate

【図4B】
image rotate

【図4C】
image rotate

【図5A】
image rotate

【図5B】
image rotate

【図5C】
image rotate

【図5D】
image rotate

【図5E】
image rotate

【図5F】
image rotate

【図5G】
image rotate

【図5H】
image rotate

【図5I】
image rotate

【図5J】
image rotate

【図5K】
image rotate


【公表番号】特表2010−529459(P2010−529459A)
【公表日】平成22年8月26日(2010.8.26)
【国際特許分類】
【出願番号】特願2010−511308(P2010−511308)
【出願日】平成20年6月4日(2008.6.4)
【国際出願番号】PCT/US2008/065820
【国際公開番号】WO2009/025920
【国際公開日】平成21年2月26日(2009.2.26)
【出願人】(500046438)マイクロソフト コーポレーション (3,165)
【Fターム(参考)】