合成画像を使用した生物学的特徴の発見

調製された生物試料から関心対象の一部分または特性を抽出する画像処理システムである。この画像処理システムの１つの適切な用途はバイオマーカーを見つけ出すことである。しかし他の多くの適切な用途もあり得る。本システムのいくつかの構成要素は画像の前処理（データの補間、保持時間の調整、画像ノイズのフィルタ処理、バックグラウンドの推定、および合成画像の形成）；画像特徴の抽出（ピーク、同位体群、および荷電群）；および特徴特性と発現統計値、差異のある発現、および差異のない発現の計算を含む。本システムの出力はさらなる発見を補助するための関心対象の一部または特性の候補一覧表を含む。

【発明の詳細な説明】
【技術分野】
【０００１】
本出願は本願明細書に参照で組み入れられる２００５年１１月１０日提出の米国特許仮出願第６０／７３５６９１号明細書の優先権を権利主張するものである。
【０００２】
本発明は概して画像処理に関し、さらに特定すると調製された生物試料の画像を分析することでさらなる分析のために関心対象の特徴を発見する過程に関する。
【背景技術】
【０００３】
新薬開発の成功率を向上させるために、製薬会社はますますバイオマーカーの使用に頼ってきた。バイオマーカーは多くの意味を伴う用語であり、そのうちの１つは関心対象の生物学的処理、法則、または成果の指標として役立ち得る１つまたは複数の測定値を含むこともあり得る。例えば、前立腺に特異的な抗原は前立腺の疾病に関して一般的に使用される診断用バイオマーカーである。理想的なバイオマーカーは薬剤治療のメカニズムのさらに優れた理解、治療成果のさらに優れた予測とモニタリング、および薬剤の毒性に付随する危険のさらに優れた管理につながることが可能である。
【発明の開示】
【発明が解決しようとする課題】
【０００４】
理想的なバイオマーカーは関心対象の生物学的状態に敏感で特異的でなければならないのみでなく、理想的なバイオマーカーは好ましくは血液、尿、および脳脊髄液などの体液中で検出および測定を行うことが簡単かつ便利でなければならない。しかしマイクロアレイによる大規模な遺伝子発現分析は関連するバイオマーカーを識別することに役立ってきた。適切なバイオマーカーはしばしば遺伝子ではなくタンパク質、タンパク質断片、代謝産物、その他である。このケースの理由の１つは、組織特異性の遺伝子発現の変異が体液中で容易に測定できないことである。タンパク質の識別および測定に関連する多くの技術的課題にもかかわらず、現在の努力は関連するタンパク質バイオマーカーを見つけることに焦点を絞られている。
【課題を解決するための手段】
【０００５】
この概説は下記で詳細な説明においてさらに述べられる概念の選択を単純化した形で導入するために提供される。この概説は特許請求される主題事項の主要な特徴を特定することを意図されておらず、特許請求される主題事項の範囲を決定する補助として使用されることも意図されていない。
【０００６】
本発明によると、画像処理パイプライン、システム、生物学的画像前処理装置、および方法が提供される。本発明の１つのコンピュータ導入可能な画像処理パイプラインの形態は、調製された生物試料が多様な処理状態の発現実験から得られる過程からデータを収集するための収集装置を含む。このパイプラインはさらに、収集装置からのデータを処理するため、および合成画像を形成するための画像処理装置を含む。このパイプラインはピーク、同位体群、および荷電群を含む合成画像から特徴特性を抽出するための画像特徴抽出装置もやはり含む。
【０００７】
本発明のさらなる態様によると、本発明のシステムの形態は画像のセットを作り出すために調製生物試料を処理するための機器の収集を含む。この機器の収集は液体クロマトグラフィ機器および質量分析計を含む。本システムはさらに、画像のセットから作り出される合成画像を処理するための画像処理装置を含む。画像処理パイプラインは特徴特性、発現プロファイル、および候補の特徴リストを作り出す。
【０００８】
本発明のさらなる態様によると、本発明の生物学的画像前処理装置の形態は未加工のＬＣ／ＭＳデータを補間し、ラスタ化し、フィルタにかけて二次元画像へとマップ化するためにラスタライザと組み合わされた補間装置を含む。この前処理装置はさらに、多様な処理群の指標である二次元画像を合成画像へと組み合わせて融合させるために群間画像融合装置と組み合わされた群内複製コンバイナを含む。
【０００９】
本発明のさらなる態様によると、本発明の方法の形態は多様な画像の中でクロマトグラムの保持時間の不一致を取り除くための方法を含む。本方法はすべての複製の中で全体的な調整不良を削減するために元の未加工データを歪めることによって調整した二次元ＬＣ／ＭＳラスタ化画像を発生させる工程を含む。本方法はさらに、組合せ画像を形成するために各々の処理群の中で複製を組み合わせる工程、および合成画像を形成するために最大画素強度を取り込むことによって処理群の間からの組合せ画像を融合させる工程を含む。
【００１０】
本発明のさらなる態様によると、本発明の方法の形態は画像特徴を抽出するための方法を含む。本方法は合成画像上で関連した非ゼロ画素から同位体ピークを識別する工程を含む。本方法はさらに、質量／荷電方向、保持時間方向、または両方における２つ以上の同位体ピークで構成される識別された同位体ピークを分割する工程を含む。
【００１１】
本発明のさらなる態様によると、本発明の方法の形態は生物学的特徴を抽出するための方法を含む。本方法は合成画像を形成するために多様な処理状態の画像を処理する工程を含む。本方法はさらに、合成画像内の特定の場所における平均値、中央値、最大値、最小値、および標準偏差から成る群から選択されるバックグラウンドノイズパラメータよりも上の強度を有する合成画像内の関連した画素から同位体ピークを見つけ出す工程を含む。
【００１２】
本発明のさらなる態様によると、本発明の方法の形態は合成画像内で見つけ出された同位体ピークを分割するための方法を含む。本方法は同位体ピークが他の同位体ピークの幅分布よりも広い幅を有するかどうか判定することによって重なり合った同位体ピークを検出する工程を含む。本方法はさらに、保持時間方向および質量／荷電方向において重なり合った同位体ピークを分割する工程を含む。
【００１３】
本発明のさらなる態様によると、本発明の方法の形態は同位体群に関して荷電状態を推定するための方法を含む。本方法はランク表の頂点からのピークの保持時間の重心付近の個別連続体の加重和によってＭＳ連続体を構築する工程を含む。本方法はさらに、様々な荷電状態に関して複数の理想モデルをＭＳ連続体に整合させる工程、および最良整合を与える理想モデルを判定する工程を含む。理想モデルの荷電状態は同位体群の荷電状態である。
【００１４】
本発明のさらなる態様によると、本発明の方法の形態は複製を表わす画像を調整させるための方法を含む。本方法は重なり合いのセット内の第１の最終変位値と第２の最終変位値を判定するために、ターゲットの画像がマスター画像と調整する程度を評価する相関係数および重なり適合値を計算する工程を含む。本方法はさらに、第１と第２の最終変位値が互いに近接範囲内にある場合に時間間隔に関して最終変位値を作り出すために第１と第２の最終変位値を平均する工程を含む。本方法は複数の時間間隔に関して複数の最終変位値を作り出すために上記の工程を繰り返す工程もやはり含み、各々の最終変位値は画像をラスタ化してそれらを調整させるために補間関数を作り出すための基準点である。
【００１５】
本発明の前述の態様および多くの付随する利点は、これらが添付の図面と結び付けて取り入れられるときに以下の詳細な説明を参照することによってさらによく理解されるので、さらに容易に評価されるであろう。
【発明を実施するための最良の形態】
【００１６】
画像処理パイプライン１１２の様々な実施形態はペプチドの特徴抽出および発現差異解析などといった特徴抽出と解析を容易にする。図１参照。画像処理パイプラインの一実施形態は薬剤開発過程でタンパク質のバイオマーカー発見に使用するためのものである。画像処理パイプラインの他の実施形態はバイオマーカーに加えて他のタイプの発見のために使用されることもあり得る。画像処理パイプライン１１２への入力は、調製生物試料１０６が液体クロマトグラフィ機器１０８および質量分析計１１０にかけられる過程から集められた未加工データ２０２（図２Ａ参照）のセットである。このデータは多様な表現型の発現実験１０４Ａ−１０４Ｃまたは鑑別薬剤投与下でのタンパク質発現などといった処理状態１０２Ａ−１０２Ｃから得られる。各々の条件に関して、いくつかの生物学的複製からの測定データが利用可能であることもあり得る。画像処理パイプライン１１２の一実施形態は、様々な表現型において異なる、または異ならない発現レベル、もしくは薬剤治療によって変えられる発現レベルを有するこれらのペプチドまたはタンパク質の発見を容易にする。画像処理パイプラインの他の実施形態は他の生物学的特徴の発見を容易にする。
【００１７】
画像処理パイプライン１１２の主要要素のうちのいくつかは生物学的画像前処理装置２０４によって遂行される画像前処理（データ補間、画像調整、画像ノイズのフィルタ処理、バックグラウンド補正、および合成画像の形成）、画像特徴抽出装置２０８によって遂行される画像特徴抽出（ピーク、同位体群、および荷電群）、特徴特性の計算、および発現統計プロセッサ２１２によって遂行される発現統計、および発現解析プロセッサ２１６によって遂行される発現差異または非差異の解析を含む。図２Ａ参照。画像処理パイプラインの出力は（１）生物学的特徴とそれらの特性の一覧表２１０、（２）３つの集大成レベル（ピーク、同位体群、および荷電群）におけるすべての条件でのすべての複製の発現プロファイル２１４、および（３）後に続くターゲット化される識別のための、差異を有して、または差異を有さず発現された特徴の一覧表２１８を含む。
【００１８】
液体クロマトグラフィ（ＬＣ）および質量分析法（ＭＳ）の手法はゲル不使用のタンパク質発現のプロファイリングの焦点になっている。調製生物試料（例えば分解されたタンパク質試料からのペプチド）がクロマトグラフィカラムから溶出され、イオン化され、引き続いてイオントラップ内で分析される。当業者によって理解されるであろうが、異なる方法の様々な実施形態が分光法または分光分析法のいずれかのタイプに応用可能である。質量分析法は大きなダイナミックレンジ全体にわたってすべてのタイプのタンパク質および代謝産物の敏感な検出と識別を提供するので、プロテオミクスおよび代謝学の研究のために使用される道具である。検出されるイオン強度が試料成分濃度に加えてイオン化効率、検出器の効率、試料のサイズ、および試料の流量などの要因によって決まり得ることを前提として、他の適切な定量化方法が使用される。質量分析法のためのタンパク質およびペプチドのイオン化は従来からＭＡＬＤＩ（マトリックス支援レーザ脱離イオン化）またはＥＳＩ（エレクトロスプレーイオン化）を使用するが、異なる方法の様々な実施形態がいずれかの適切な現在または将来のイオン化方法、ならびにイオントラップ型、飛行時間型、もしくは四重極型分析器などのいずれかの適切な検出方法を使用することもあり得る。さらに、異なる方法の様々な実施形態が、特に電子衝突イオン化（ＥＩ）を使用してガスクロマトグラフィ−質量分析法（ＧＣ−ＭＳ）から得られるデータを使用することも可能である。
【００１９】
ペプチドなどの多様な生物学的特徴は２つの次元（保持時間と質量／荷電）で分けられる。所定の保持時間について、一次元連続体が関心対象の質量／荷電範囲で得られることが可能である。ペプチドは連続体の中のピークとして示されるが、しかし関心対象の他の生物学的特徴がピークとして示されることもやはりあり得る。ピーク強度は関心対象の生物学的特徴の潤沢度に比例すると想定される。質量／荷電の連続体は規定されたサンプリング速度または可変のサンプリング速度で繰り返し収集される。概念上、順々に収集された一次元の質量分析の連続体が二次元のデータセットを形成する。強度が第三の次元であれば、様々なピークはレリーフマップ上の個別の丘として現れる。
【００２０】
本発明の様々な実施形態によって可能にされる１つの探索法は異なる実験条件の中で発現強度が変わった、または変わらなかったペプチドまたはタンパク質を見つけることである。ペプチドまたはタンパク質に関連しない他の探索法もやはり可能である。ペプチドまたはタンパク質は有用なバイオマーカーを識別するさらなる検証のための候補になることが可能である。本発明のいくつかの実施形態は未加工のＬＣ／ＭＳデータと差異を有するかまたは有さないペプチドピークまたは同位体群の発現検出との間のデータ処理に焦点を絞る。これらのピークは識別されなかった場合にはペプチド配列の識別のためにタンデム型質量分析に送られてもよい。
【００２１】
図１は画像処理パイプライン１１２を含むシステム１００のブロック図である。パイプライン１１２への入力は多様な処理状態下または表現型の実験１０４Ａ−１０４Ｃからの調製生物試料１０６である未加工のＬＣ／ＭＳデータのセットである。各々の条件において、しばしばいくつかの生物学的または技術的複製１０２Ａ−１０２Ｃがある。生物学的複製１０２Ａ−１０２Ｃは異なる動物または細胞株などからの試料である。技術的複製は同じ動物試料の繰り返されたＬＣ／ＭＳ運転である。画像処理パイプラインからの出力は特徴的特性、発現プロファイル、および差異のある、または差異のない特徴一覧表を含む。まとめて生物学的候補リスト１１６参照。
【００２２】
特徴的特性は３つのレベルすなわちピーク、同位体群、および荷電群における生物学的特徴３００について情報を提供する。図３参照。これらの特性はピーク保持時間の始まりから終わり、ピーク質量／荷電の始まりから終わり、質量／荷電の中央値、荷電状態、質量その他を含む。所定のピークについて、特性はすべての条件におけるすべてのデータ複製に当てはまる。図３はピーク３０６−３１０、同位体群３０４−３０８、および荷電群３０２を例示している。ピークは特定の保持時間範囲とｍ／ｚ範囲における輪郭によって規定される二次元のＬＣ／ＭＳ強度の丘である。同位体群は同じ荷電状態の同位体ピークの群である。２つの隣り合う同位体ピーク間の質量差は１つの元素が別の元素へと変えられるときに獲得される中性子の割り増し質量の結果である。１つの特定の同位体状態について、複数のピークが存在することが可能である。これは特に低い信号対ノイズ比の状況に関して特に真実である。複数の同位体群が異なった荷電状態で検出されることもあり得る。荷電群は一緒に属するそれらの同位体群を含む。
【００２３】
各々のＬＣ／ＭＳ運転について、発現プロファイルが３つの集大成、すなわちピーク、同位体群、および荷電群で与えられることが可能である。各々のプロファイルは特定の運転から得られる強度および他の発現統計値を含む。例えば、ピーク強度はピーク境界輪郭の中のすべての非ゼロ画素の強度測定値の総和であるピーク表面下の量として規定される。発現プロファイルは発現差異検出などといった後に続く発現データ解析のための定量的基礎である。差異特徴一覧表はタンデム型質量分析法によるペプチド／タンパク質識別のために選択された特徴（ピークまたは同位体群）の小セットである。この一覧表はＡＮＯＶＡなどの統計学的仮説検定による差異検出の結果、または教師なし学習（クラスタリング）もしくは教師あり学習（分類）方法の結果、またはそれらのうちのいくつかもしくはそれらすべての組合せであることもあり得る。ペプチド／タンパク質識別の後、この一覧表内の特徴がペプチド／タンパク質配列情報によって注釈を付けられるであろう。注釈を付けられた特徴の発現プロファイルは背後にある生物学を理解するための後に続く解析に使用されることが可能である。もちろん、同様に背後にある生物学を理解するために本発明の様々な実施形態によって与えられる非差異検出が使用されることもやはりあり得る。
【００２４】
図４Ａ−４Ｃは図２Ａに素子２０４として示された生物学的画像前処理装置４００Ａ−４００Ｂおよび図２Ａに素子２０８として示された画像特徴抽出装置４００Ｃの詳細なブロック図である。入力は各々の中にいくつかの生物学的または技術的複製があるいくつかの異なる処理群のタンパク質試料に由来する未加工のＬＣ／ＭＳデータのセット４０２である。このモジュールの機能はデータラスタ化装置４０４によって遂行されるデータのラスタ化；群内および群間の保持時間調整のためのアライナ４１６ならびに画像歪曲装置および再ラスタ化装置４１８によって遂行される保持時間の調整；ノイズ除去装置４０６、４１０、および４２６によって遂行される画像ノイズのフィルタ処理；バックグラウンド補正装置４２８；保持時間の縞の除去装置４０８；正規化装置４１４；強度中央値計算器４２２および強度標準偏差計算器４２４；およびピーク識別器と標識化装置４４２、ピーク事前分析装置と分割器４４４、ピーク特性処理装置４４６、同位体群識別器４５０、および荷電群識別器４５４による特徴抽出のための１つの合成画像４４０の形成を含む。ラスタ化機能は未加工のＬＣ／ＭＳデータ４０２を補間し、後に続く画像処理のためにすべてのデータを共通の二次元画像格子にマップ化する。時間調整機能は多様な複製のＬＣ／ＭＳ運転の中のクロマトグラムの保持時間の不一致を取り除く。
【００２５】
時間の調整には３つの段階がある。例えば図５Ｂ−５Ｓ−１参照。最初に、一実施形態では初期のラスタ化の前に事前調整段階において全体的な時間の調整不良が推定されるが他の実施形態ではこの段階は場合によって設けられる。次いで、一実施形態では別々の工程で局所的な群内の調整不良および局所的な群間の調整不良が推定されるが、別の実施形態では局所的な群内の調整不良と局所的な群間の調整不良の両方が１つの工程で算出される。合計の調整不良は３つの成分の組合せである。調整した二次元ＬＣ／ＭＳラスタ化画像４２０はすべての複製の中の合計の調整不良を削減するように元の未加工データを歪めることによって作り出される。二次元画像内の空間的ノイズは信頼性があって堅調な画像特徴抽出を確実にするために前処理装置内のいくつかの場所においてフィルタで除去される。各々の処理群内の複製は画素強度の平均化によって１つの画像へと組み合わされる。組み合わされた画像すべての中の最大画素強度を取り込むなどといった適切な技法を使用することによって１つの合成画像４４０が作り出される。合成画像４４０はこれでもって画像特徴抽出装置４００Ｃが関心対象の様々な生物学的特徴を得るように働く情報である。
【００２６】
図４Ｃは画像特徴抽出装置の詳細なブロック図である。その入力は（図２Ａに素子２０４として例示される）生物学的特徴前処理装置４００Ａ−４００Ｂからの合成画像４４０である。最初に、ピークが関連した非ゼロ画素として規定される。各々のピークは特有の指数でラベリングされる。いくつかの実際のピークが誤って１つの大きい結合したピークとして識別されることもあり得る。画像事前解析機能において、これらの結合したピークの多くは識別されてｍ／ｚまたは保持時間方向で分割される。分割の後にピークの合計数が増やされる。新たなピークの指数がこれらの新たに分割されたピークに割り当てられる。ピークのｍ／ｚ中央値と幅；ピークの時間中央値と幅などといったピーク特性が算出される。同位体群識別機能において、同じ同位体群に属するピークが識別される。荷電状態、モノアイソトピックｍ／ｚ、およびペプチド質量などといった同位体群特性が推定される。各々の同位体群に特有の同位体群指数が割り当てられる。多くの同位体群が１つのピークを含むに過ぎないこともあり得る。このケースでは、ゼロ荷電が割り当てられる。（荷電が知られていないのでゼロ荷電はこれらの同位体群をラベリングする方法である。）同位体群を識別するとき、重なり合ったピークが識別される。この重複のケースでは、ピークが分割不可能であれば１つのピークが２つの同位体群に属してもよい。引き続く同位体群識別機能において、異なる荷電状態を有するが同様の保持時間とペプチド質量を有する同位体群が１つの荷電群に割り当てられる。
【００２７】
図２Ａは発現統計処理装置２１２および発現解析処理装置２１６を含む。発現統計処理装置２１２は３つの集大成レベル、すなわちピーク、同位体群、および荷電群において強度、強度誤差、および存在判定ｐ値などの発現統計値を推定する。ピークレベルにおいて、ピーク輪郭境界の中の画素強度の総和である発現強度を推定するために、画像特徴抽出装置によって作り出されたピーク特性に基づいて各々の調整したＬＣ／ＭＳ画像４２０内でピークが識別される。次いで、技術に特異的な誤差モデルが強度誤差を推定するために適用される。その結果は各々のＬＣ／ＭＳ画像について１つのピークレベル発現プロファイルである。同位体群レベルにおいて、その入力はピークレベル発現プロファイルと同位体群特性である。同位体群に関して発現推定量を得るために、１つの同位体群における複数のピークの発現統計値が一体に「圧搾」される。同位体群の強度はこの同位体群に含まれるピーク強度の総和として規定される。結果的に生じる同位体群強度の強度誤差もやはり推定される。出力は各々のＬＣ／ＭＳ画像について１つの同位体群レベルの発現プロファイルである。同位体群レベルにおいて、その入力は同位体群発現プロファイルと同位体群特性を含み、出力は同位体群発現プロファイルである。
【００２８】
本発明の様々な実施形態が、関心対象の生物学的特徴に密接に関連する代表的ピークまたは同位体群の一覧表の発見を容易にする。これらのペプチド／タンパク質などといった生物学的特徴は多様な薬剤処理の中で統計学的に有意に差異のある、または差異のない発現のどちらかを明示し、場合によっては、薬剤の効能または毒性の予測にさえつながる。関心対象の例えばペプチド／タンパク質などといった代表的な生物学的特徴の一致は後に続くタンデム型質量分析法による配列識別の間に発見されると思われるが、これらの生物学的特徴がさらに早期に発見されることもやはりあり得る。発現解析処理装置では、関心対象の生物学的特徴の一覧表を導き出すために発現プロファイルがすべてのレベルにおいて使用されることが可能である。多くの関連した生物学的特徴の一覧表を得るための多くの適切でかつ異なる統計学的およびデータマイニングの方法があり得る。一般的に使用される発現差異検出方法はｔ検定およびＡＮＯＶＡなどのパラメトリック仮説検定、およびウィルコクソン検定および他のランクまたは順列に基づく検定などのノンパラメトリック検定を含む。一般的に使用されるデータマイニングの方法はクラスタリングアルゴリズムなどの教師なし学習および分類子などの教師あり学習を含む。
【００２９】
本発明の様々な実施形態のうちの一例の画像処理パイプラインは従来の分析化学機器の感度、精度、および再現性の限界を克服するかまたは削減する。以下で、図５Ａ−１−５Ａ−２２は生物試料中で関心対象の特徴を識別するための方法５０００を記述している。説明を平易にするために、図５Ａ−１−５Ａ−２２によって例示される方法５０００の記述は３つの部分に分割される。最初に、方法５０００は方法５０００に関連した様々な技術的主題事項のさらに広い理解を可能にするために一般的に検討される。次に、図５Ａ−１−５Ａ−２２によって例示されるような方法５００の特定の工程が、方法の流れが識別され得るように述べられる。最後に、生物試料中で関心対象の特徴を識別するために使用される技術のさらに深い理解を可能にするために様々な技術的主題事項に関して数学的な基盤が検討される。
【００３０】
概して、図５Ｖ−５Ｚ、５Ａ−２−５Ａ−２１はＬＣ／ＭＳラスタ化画像から生物学的特徴を抽出するために画像処理技術を使用する一例の画像特徴抽出装置によって実施される方法を例示している。最初にピークおよび同位体群が識別されて、これらが差異を有して発現されるか差異を有さずに発現されるかに関係なくラベリングされる。
【００３１】
差異を有するか差異を有さない検出は抽出されるピーク強度情報に頼っている。図５Ｖ−５Ｚ、５Ａ−２−５Ａ−２１の様々な方法工程はペプチド／タンパク質などの相対的発現潤沢度を測定し、差異を有するか差異を有さない発現を検出する。潤沢度測定値は高い信号対ノイズ比を有する。本発明の様々な実施形態は後に確率ｐ値を組み合わせるのではなく最初に高い信号対ノイズ比を達成するように複数の画素強度測定値を組み合わせる。同位体ピークの組み合わされた強度からの同位体群強度は普通では個々のピークからの強度よりも高い信号対ノイズ比を有する。本発明の様々な実施形態は個々のピークのみでなく同位体群および荷電群もやはり識別する。
【００３２】
いくつかの実施形態における図５Ｖ−５Ｚ、５Ａ−２−５Ａ−２２の方法工程は最初にピークと同位体群を抽出し、次いで発現の差異を測定するなどの発現解析を遂行する。このピークに基づく手法は正確な保持時間調整の必要性を削減する。ピークが適切に抽出される限り、ピーク形状とピーク位置の小さい変動は後に続く解析に殆ど悪影響を有さない。
【００３３】
本発明の様々な実施形態の二次元画像処理技術は多数のラスタ化ＬＣ／ＭＳ画像からの情報を活用する。生物学的ピークと同位体群はある一定の形状を有するので、信号対ノイズ比を向上させるために画像処理フィルタが使用されることが可能であり、それらのピーク、同位体群、および荷電などのそれらの特性を検出するために画像パターン認識法が使用されることが可能である。図５Ｖ−５Ｚ、５Ａ−２−５Ａ−２１における画像処理工程は特徴抽出における信号対ノイズ比をさらに向上させるために調査中の複数の実験複製からの情報を活用する。測定ノイズを削減するために複製からの複数の画像が一体に組み合わされる（平均される）ことが可能である。一層高い信号対ノイズ比は特徴抽出を一層正確で信頼性のあるものにする。
【００３４】
様々な実施形態における図５Ｂ−５Ｕで例示されるような方法工程はＬＣ／ＭＳ画像ノイズ削減のために形態学的フィルタを使用する。ＬＣ／ＭＳデータは通常では測定ノイズを有する。このノイズは図５Ｖ−５Ｚ、５Ａ−２−５Ａ−２１で例示される方法工程におけるピーク抽出を難しくする。従来式のフィルタは実際の信号のピークとノイズのピークに影響を及ぼす。形態学的フィルタは画像の内容物の特定の形状に基づいて画像を変える画像フィルタ処理法のセットに属する。例えば、２値の形態学的浸食フィルタは２値画像内の白色特徴を縮小させることが可能である。ある一定のサイズよりも小さい特徴は除去されるであろう。別の例に関すると、２値の形態学的拡張フィルタは白色特徴を拡張するであろう。一例の画像処理パイプラインにおいて、ＬＣ／ＭＳ画像ノイズを削減するために浸食フィルタと拡張フィルタが様々な場所で適用される。
【００３５】
図５Ｂ−５Ｕで例示されるような方法工程はノイズを含むＬＣ／ＭＳ画像のバックグラウンド情報を推定する。画像のバックグラウンドノイズは、たとえ情報信号がないときでさえＭＳ機器から入る低レベルの無秩序な示度数である。ノイズから信号ピークを抽出するために、バックグラウンドノイズのレベルを推定することが望ましい。バックグラウンド情報はまた、ＬＣ／ＭＳ強度測定に関して誤差モデルを構築するためにも望ましい。バックグラウンドノイズの推定量は、一実施形態では、バックグラウンドノイズの統計学的性質を推定することによって一例の画像処理パイプライン内で達成される。例えば、様々な形態学的フィルタによって除去されることが可能な非ゼロデータはバックグラウンドノイズであると考えられる。バックグラウンドの平均値と標準偏差はＬＣ／ＭＳ画像の区分けされた領域内のこれらの画素から直接推定されることが可能である。画像のうちの異なる領域では平均値と標準偏差は異なる。バックグラウンドの推定のための画素の選択は必ずしも任意の強度閾値に基づく必要はないが、いくつかの実施形態では画像内の信号とノイズとの間の空間的差異に基づくので、本発明の様々な実施形態のバックグラウンド推定方法は図５Ｖ−５Ｚ、５Ａ−２−５Ａ−２１で例示される方法工程に関連して検討されるようにさらに優れたＬＣ／ＭＳ画像特徴抽出を容易にする。
【００３６】
ここで、方法の流れが識別され得るように、図５Ａ−１−５Ａ−２２によって例示されるような方法５００の特定の工程が述べられる。図５Ａ−１−５Ａ−２２は生物試料中で関心対象の特徴を識別するための方法５０００を例示している。開始ブロックから、方法５０００は続行末端（「末端Ａ」）と出口末端（「末端Ｂ」）との間に規定される方法工程５００２のセットに進む。方法工程５００２のセットは生物学的実験から得られる調製生物試料の画像の前処理を記述する。
【００３７】
末端Ａ（図５Ｂ）から、方法５０００は多様な表現型または処理状態の発現実験が遂行されるブロック５００８に進む。様々な生物学的実験から得られる調製生物試料がブロック５０１０で収集される。ブロック５０１２において、調製生物試料がイオン化されて液体クロマトグラフィ（ＬＣ）処理を受けることで溶出試料を作り出す。液体クロマトグラフィ処理からの溶出試料はブロック５０１４で質量分析計（ＭＳ）へと供給される。ブロック５０１６において、ＭＳスペクトルが特定の保持時間で、かつ一定もしくは変化するサンプリング速度で繰り返し収集される。未加工のＬＣ／ＭＳデータはｍ／ｚがｙ軸であって保持時間がｘ軸である場合の画像からのＭＳスペクトルの収集物の形である。次いで本方法は別の続行末端（「末端Ａ１」）に進む。
【００３８】
末端Ａ１（図５Ｃ−１）から、本方法は場合によっては複数の複製の多様なＬＣ／ＭＳ運転の中の全体的な時間の調整不良を取り除くことによって保持時間の事前調整を遂行する。ブロック５０２０参照。ブロック５０２２において、本方法はＬＣ／ＭＳ画像を作り出すために未加工のＬＣ／ＭＳデータを補間することによってデータのラスタ化を遂行する。次いで本方法はブロック５０２４で、強度が画像のうちの下側９０％のランクを占める画素を除外する。ブロック５０２６において、ゼロよりも大きい強度を備えた画素に関して原型のビットマスクがＬＣ／ＭＳ画像から作り出される。事前に調整された最大ピーク幅を使用して数学的形態学的オープン操作がビットマスクに対して実行される。ブロック５０２８参照。ブロック５０３０において、ＲＴ次元のオープン操作がビットマスクの多数の小さい特徴を除去してＲＴ縞として規定される特徴を再構成する。ブロック５０３２において、ＲＴ縞がＲＴおよびｍ／ｚ次元で拡張させられてそれらのサイズに戻る条件付きの拡張操作が次に起こる。次いで本方法は別の続行末端（「末端ＡＡ１」）へと続く。
【００３９】
末端ＡＡ１（図５Ｃ−２）から、方法５０００はブロック５０３４へと進み、ここでは本方法がビットマスクを反転させる。反転したビットマスクがＬＣ／ＭＳ画像と掛け算される（論理的「終了」操作）ことでＲＴ縞が取り除かれる。次いで本方法は、場合によってはブロック５０３８において正規化を実行する。システム１００によって作り出される各々のＬＣ／ＭＳ画像について上記の工程が繰り返される。次いで本方法は別の続行末端（「末端Ａ２」）に進む。
【００４０】
末端Ａ２（図５Ｄ）から、方法５０００はラスタ化画像の中から候補の画像が選択されるブロック５０４０に進む。ブロック５０４２において、候補の画像の強度の基礎ピークが測定され、これが候補の画像内で各々の時間点について最高強度値を決定する。ブロック５０４４において本方法は基礎ピーク強度測定に関して標準偏差を計算する。ブロック５０４６において、測定するべきさらに多くの画像があるかどうか判定するために検定が実行される。判定ブロック５０４６においてこの検定に対する答えがＹＥＳであれば方法５０００は別の続行末端（「末端Ａ３」）に進み、上記で特定された処理工程が繰り返されるブロック５０４０にスキップして戻る。そうでない場合、判定ブロック５０４６においてこの検定に対する答えがＮＯであれば方法５０００はブロック５０４８へと進み、ここでは基礎ピーク強度において最も高い標準偏差を備えた画像が解析に関して高いコントラストで多くの明確な画像特徴を有すると思われるのでマスター画像であると選択される。次いで方法５０００は別の続行末端（「末端Ａ４」）に進む。
【００４１】
末端Ａ４（図５Ｅ）から、方法５０００はブロック５０５０に進み、ここでは画像が画像内のデータの密度によって決まる特定の幅の時間の縦列（例えば１．５分）の中に分割される。やはり図２Ｂの線図２２０参照。ブロック５０５２において、各々の列は画像内のデータの密度によって決まるある高さの様々な横列のｍ／ｚ部分領域（例えば２０ｍ／ｚ）の中にさらに分割される。やはり図２Ｂの線図２２０参照。ブロック５０５４において、ある縦列内のある横列におけるマスター画像の部分領域が調整解析のために選択される。次いで本方法は別の続行末端（「末端Ａ５」）へと続く。
【００４２】
末端Ａ５（図５Ｅ）から、方法５０００はブロック５０５６に進み、ここでは重なり合いを作り出すためにターゲット画像の部分領域がマスターの部分領域全体にわたって段階を（変位段階当たり１つまたは複数の画素などの増分で）変位またはスライドさせされる。図２Ｃの線図２２２参照。ブロック５０５８において、本方法はどの程度良好にこの段階が調整されるか定量化するために相関係数（段階変位値）の計算を始める。ブロック５０６０において、ターゲット画像の部分領域に関する最小強度値が見出される（ここでは強度はゼロよりも大きい）。様々な部分領域（ターゲット画像とマスター画像）内の画素の強度が最小強度値で引き算される。ブロック５０６２参照。次いで本方法は別の続行末端（「末端Ａ６」）に進む。
【００４３】
末端Ａ６（図５Ｆ）から、本方法はブロック５０６４に進み、ここでは本方法は重なり合った画素位置のターゲット画素とマスター画素を見る。ターゲットまたはマスターの画素強度のどちらかがゼロよりも大きいかどうか判定するための検定が判定ブロック５０６６において実行される。判定ブロック５０６６の検定に対する答えがＮＯであれば本方法は別の続行末端（「末端ＡＳ」）へと続く。そうでない場合、判定ブロック５０６６の検定に対する答えがＹＥＳであれば本方法は別の判定ブロック５０６８に進み、ここではターゲットまたはマスターの画素強度のどちらかがゼロであるかどうか判定するための検定が実行される。判定ブロック５０６８の検定に対する答えがＹＥＳであれば本方法はブロック５０７０に進み、ここでは特定の画素位置に関してゼロ値が１でインクリメントされる。次いで本方法は別の続行末端（「末端Ａ７」）へと続く。そうでない場合、判定ブロック５０６８の検定に対する答えはＮＯであり、本方法は末端Ａ７に進む。
【００４４】
末端Ａ７（図５Ｇ）から、方法５０００はブロック５０７２に進み、ここでは高強度と低強度の画素の両方が相関係数に対する影響を有することを可能にするための計算が為される（例えばターゲット画素の強度のｌｏｇ_１０とマスター画素の強度のｌｏｇ_１０が取り入れられる）。ブロック５０７４において、特定の画素位置に関してターゲットとマスターの画素の強度の計算値がターゲットのアレイとマスターのアレイそれぞれに置かれる。次いで本方法は末端Ａ８（図５Ｇ）に進み、さらに判定ブロック５０７６に進み、ここでは重なりの中のすべての画素が解析されたかどうか判定するための検定が実行される。判定ブロック５０７６の検定に対する答えがＮＯであれば本方法は末端Ａ６に進み、上記で特定された処理工程が繰り返されるブロック５０６４へとスキップして戻る。そうでない場合、判定ブロック５０７６の検定に対する答えはＹＥＳであり、方法５０００はターゲットのアレイとマスターのアレイに蓄えられた強度計算値から相関係数が算出されるブロック５０７８に進む。ブロック５０８０において、特定の段階に関して相関係数が相関係数のアレイに蓄えられる。次いで本方法は別の続行末端（「末端Ａ９」）へと続く。
【００４５】
末端Ａ９（図５Ｈ）から、方法５０００はブロック５０８２に進み、ここでは本方法はどの程度良好にこの段階が調整されるか定量化するために重なり適合値（別の段階変位値）の計算を始める。次いで本方法はブロック５０８４において重なり合った画素位置のターゲットの画素とマスターの画素を見る。次に判定ブロック５０８６において、マスターの画素の強度がゼロよりも大きいかどうか判定するための検定が実行される。判定ブロック５０８６の検定に対する答えがＮＯであれば本方法は別の続行末端（「末端Ａ１２」）へと続く。そうでない場合、判定ブロック５０８６の検定に対する答えはＹＥＳであり、本方法は判定ブロック５０８８に進み、ここではターゲットの画素の強度がゼロに等しいかどうか判定するための別の検定が実行される。判定ブロック５０８８の検定に対する答えがＹＥＳであれば本方法は別の続行末端（「末端Ａ１０」）に進む。そうでない場合、判定ブロック５０８８の検定に対する答えはＮＯであり、方法５０００は別の続行末端（「末端Ａ１３」）に進む。
【００４６】
末端Ａ１０（図５Ｉ）から、方法５０００はブロック５０９０に進み、ここでは（マスターの画素の強度がゼロよりも大きいこと、およびターゲットの画素の強度がゼロであることを示す）第１のカウンタがインクリメントされる。方法５０００は別の続行末端（「末端Ａ１３」）に進む。末端Ａ１２（図５Ｉ）から、方法５０００は判定ブロック５０９２に進み、ここではマスターの画素の強度がゼロに等しいかどうか判定するための検定が実行される。判定ブロック５０９２の検定に対する答えがＮＯであれば本方法は末端Ａ１３に進む。そうでない場合、判定ブロック５０９２の検定に対する答えはＹＥＳであり、本方法は判定ブロック５０９４に進み、ここではターゲットの画素の強度がゼロよりも大きいかどうか判定するための別の検定が実行される。判定ブロック５０９４の検定に対する答えがＹＥＳであれば本方法は別の続行末端（「末端Ａ１１」）に進む。そうでない場合、判定ブロック５０９４の検定に対する答えはＮＯであり、本方法は末端Ａ１３に進む。
【００４７】
末端Ａ１１（図５Ｊ）から、方法５０００はブロック５０９６に進み、ここでは（マスターの画素の強度がゼロに等しいこと、およびターゲットの画素の強度がゼロよりも大きいことを示す）第２のカウンタがインクリメントされる。次いで方法５０００は末端Ａ１３（図５Ｊ）に進み、判定ブロック５０９８へと続き、ここでは重なりの中のすべての画素が解析されたかどうか判定するための検定が実行される。判定ブロック５０９８の検定に対する答えがＮＯであれば方法５０００は別の続行末端（「末端Ａ１４」）に進み、ブロック５０８４へとスキップして戻り、上記で特定された処理工程が繰り返される。そうでない場合、判定ブロック５０９８の検定に対する答えはＹＥＳであり、本方法はブロック５１００に進み、ここでは第１と第２のカウンタの合計の負を取り入れることによって重なり適合値が算出される。ブロック５１０２において、特定の段階に関して重なり適合値がやはり段階変位のアレイに蓄えられる（本質的に、このアレイは２つの領域、相関係数、および重なり適合値のアレイである）。方法５０００は別の続行末端（「末端Ａ１５」）に進む。
【００４８】
末端Ａ１５（図５Ｋ）から、方法５０００は判定ブロック５１０４に進み、ここではターゲットの部分領域がマスターの部分領域全部を横切ってスライドさせられたかどうか判定するための検定が実行される。判定ブロック５１０４の検定に対する答えがＮＯであれば本方法は末端Ａ５（図５Ｅ）に進み、ブロック５０５６へとスキップして戻り、上記で特定された処理工程が繰り返される。そうでない場合、判定ブロック５１０４の検定に対する答えはＹＥＳであり、本方法はブロック５１０６に進み、ここでは（ターゲットの部分領域がマスターの部分領域の位置の上で導かれる場所を示す）各々の段階変位に関して、段階変位のアレイを使用して頂点が算出される。ブロック５１０８において、これらの頂点は各々の頂点の高さに基づいて下に進む順序で一覧表の中に仕分けされる。次いで本方法はブロック５１１０において一覧表の最上欄から頂点を選択する。次いで方法５０００は別の続行末端（「末端Ａ１６」）に進む。
【００４９】
末端Ａ１６（図５Ｌ）から、方法５０００は判定ブロック５１１２に進み、ここでは頂点が屈曲と屈曲との間の最小数の点を有するかどうか判定するための検定が実行される。判定ブロック５１１２の検定に対する答えがＹＥＳであれば本方法は別の続行末端（「末端Ａ１８」）に進む。そうでない場合、判定ブロック５１１２の検定に対する答えはＮＯであり、本方法はブロック５１１４に進み、ここでこの頂点は一覧表から除去される。次いで本方法は判定ブロック５１１６に進み、ここでは考察するべきさらに多くの頂点があるかどうか判定するための別の検定が実行される。判定ブロック５１１６の検定に対する答えがＮＯであれば本方法は別の続行末端（「末端Ａ２０」）に進む。そうでない場合、判定ブロック５１１６の検定に対する答えはＹＥＳであり、本方法は別の続行末端（「末端Ａ１７」）に進む。
【００５０】
末端Ａ１８（図５Ｍ）から、方法５０００は判定ブロック５１１８に進み、ここでは２番目に高い頂点が適切な閾値で最高の頂点よりも低いかどうか判定するための検定が実行される。判定ブロック５１１８の検定に対する答えがＮＯであれば本方法は別の続行末端（「末端Ａ１９」）に進む。末端Ａ１９（図５Ｌ）から、本方法はブロック５１１４へとスキップして戻り、ここでは上記で特定された処理工程が繰り返される。そうでない場合、判定ブロック５１１８の検定に対する答えはＹＥＳであり、本方法はブロック５１２０に進み、ここでは本方法はマスターとターゲットの部分領域の間の高い相関を示し、かつ見込まれる調整の場所を示す頂点を頂点のアレイの中に蓄える。次いで方法５０００は末端Ａ２０（図５Ｍ）に進み、さらに判定ブロック５１２２に進み、ここでは考察するべきさらに多くのターゲットの部分領域が異なる横列の中にあるかどうか判定するための検定が実行される。判定ブロック５１２２の検定に対する答えがＹＥＳであれば本方法は末端Ａ２１（図５Ｅ）へと続き、ここでは上記で特定された処理工程が繰り返される。そうでない場合、判定ブロック５１２２の検定に対する答えはＮＯであり、方法５０００は別の続行末端（「末端Ａ２２」）に進む。
【００５１】
末端Ａ２２（図５Ｎ）から、方法５０００はブロック５１２４に進み、ここでは本方法は相関係数技法の最終解析を始める。ブロック５１２６において、段階変位のアレイ内に蓄えられた変位値に関してヒストグラムが、０．２０などの適切な瓶サイズを使用して作成される。ブロック５１２８においてこのヒストグラムは、ヒストグラム内の各々の瓶に属する員数に基づいた順序で下に進んで仕分けされる。ブロック５１３０において、最高位のランクにある瓶内の値のすべてが平均されることでこの技法に関して最終の変位値を決定する。判定ブロック５１３２において、最高位にランク付けされた瓶が最小の員数を有するかどうか判定するための検定が実行される。判定ブロック５１３２の検定に対する答えがＹＥＳであれば本方法は別の続行末端（「末端Ａ２３」）に進む。そうでない場合、判定ブロック５１３２の検定に対する答えはＮＯであり、本方法は別の続行末端（「末端Ａ２４」）に進む。
【００５２】
末端Ａ２３（図５Ｏ）から、方法５０００は判定ブロック５１３４に進み、ここでは２番目にランク付けされた瓶が１番目にランク付けされた瓶の構成要素の９０％を有するかどうか判定するための検定が実行される。判定ブロック５１３４の検定に対する答えがＮＯであれば本方法は別の続行末端（「末端Ａ２４」）に進む。判定ブロック５１３４の検定に対する答えがＹＥＳであれば本方法はブロック５１３６に進み、ここでは１番目および２番目にランク付けされた瓶の構成要素が一緒に平均されることで最終の変位値を作り出す。判定ブロック５１３８において、最終の変位値が相関係数から算出されるかどうか判定するための検定が実行される。判定ブロック５１３８の検定に対する答えがＮＯであれば本方法は末端Ａ２４に進む。そうでない場合、判定ブロック５１３８の検定に対する答えはＹＥＳであり、本方法はブロック５１４０に進み、ここではこの最終の変位値が（相関係数解析のために）第１の最終変位値として保存される。ブロック５１４０の実行の後に、本方法は末端Ａ２４に進む。
【００５３】
末端Ａ２４（図５Ｐ）から、方法５０００は判定ブロック５１４２に進み、ここでは重なり適合値技法の最終解析が起こったかどうか判定するための検定が実行される。判定ブロック５１４２の検定に対する答えがＮＯであれば方法５０００は末端Ａ２２に進み、ここで一巡してブロック５１２４（図５Ｎ）に戻り、上記で特定された処理工程が繰り返される。そうでない場合、判定ブロック５１４２の検定に対する答えはＹＥＳであり、本方法はブロック５１４４に進み、ここでは第２の最終変位値が（重なり適合解析のための）第１の最終変位値として保存される。次いで本方法はブロック５１４６に進み、ここでは第１と第２の最終変位値が互いに近接範囲内にあるかどうか判定するための検定が実行される。判定ブロック５１４６の検定に対する答えがＮＯであれば方法５０００はブロック５１４８に進み、ここでは必要とされる調整の度合いに対する合意が欠如しているので最終変位値が破棄され、別の縦列を使用して処理が再開される。方法５０００は別の続行末端（「末端Ａ２６」）に進む。判定ブロック５１４６の検定に対する答えがＹＥＳであれば本方法は別の続行末端（「末端Ａ２５」）に進む。
【００５４】
末端Ａ２５（図５Ｑ）から、方法５０００はブロック５１５０に進み、ここでは特定の時間間隔（格子の縦列の幅）に関して最終変位値を作り出すために第１と第２の最終変位値が平均される。判定ブロック５１５２において、ターゲットの画像のすべての縦列が解析されたかどうか判定するための検定が実行される。判定ブロック５１５２の検定に対する答えがＮＯであれば方法５０００は末端Ａ２１に進み、ブロック５０５４（図５Ｅ）へとスキップして戻り、上記で特定された処理工程が繰り返される。そうでない場合、判定ブロック５１５２の検定に対する答えはＹＥＳであり、本方法はブロック５１５４に進み、ここではラスタ化画像のすべてが解析されたかどうか判定するための別の検定が実行される。判定ブロック５１５４の検定に対する答えがＮＯであれば本方法は末端Ａ４（図５Ｅ）に進み、一巡してブロック５０５０に戻り、上記で特定された処理工程が繰り返される。そうでない場合、判定ブロック５１４４の検定に対する答えはＹＥＳであり、方法５０００は末端Ａ２６に進む。
【００５５】
末端Ａ２６（図５Ｒ）から、各々の画像の各々の縦列の幅に関して変位値を規定するスプライン関数などの補間関数を作り出すために各々の平均最終変位値が基準点として使用される。ブロック５１５６参照。ブロック５１５８において、本方法は本方法が画像を再びラスタ化し、それゆえに画像を歪めるときに画像内の補間を使用して未加工データを再び補間する。ブロック５１６０において、二次元画像内の空間ノイズが形態学的画像ノイズフィルタによってフィルタ処理される。ブロック５１６２において本方法はＬＣ／ＭＳ画像の強度中央値を計算してデータベース内に保存する。ブロック５１６４において、本方法はＬＣ／ＭＳ画像の強度の標準偏差を計算してデータベース内に保存する。次いで方法５０００は別の続行末端（「末端Ａ２７」）に進む。
【００５６】
末端Ａ２７（図５Ｓ−１）から、方法５０００はＬＣ／ＭＳ画像のノイズを除去してバックグラウンドを補正するための工程をブロック５１６６において開始する。ブロック５１６８において、高解像度のＭＳ機器が使われたかどうか判定するための検定が実行される。判定ブロック５１６８の検定に対する答えがＮＯであれば方法５０００は別の続行末端（「末端ＡＫ１」）に進む。そうでない場合、判定ブロック５１６８の検定に対する答えはＹＥＳであり、本方法は別の続行末端（「末端ＡＡ１」）に進み、さらにブロック５１７０に進み、ここでは本方法はＬＣ／ＭＳ画像上で形態学的ビットオープン操作を実行するための工程を開始する。ブロック５１７２において本方法はゼロよりも上の強度に関してＬＣ／ＭＳ画像からビットマスクを作り出す。ブロック５１７４において、形態学的オープン操作がビットマスク上で実行され、ある構造的サイズを伴うノイズを除去する。次いで方法５００は別の続行末端（「末端ＡＡ２」）に進む。
【００５７】
末端ＡＡ２（図５Ｓ−２）から、方法５０００はブロック５１７６に進み、ビットマスクをＬＣ／ＭＳ画像に適用してビットオープンのＬＣ／ＭＳ画像を作り出す。次いで本方法は別の続行末端（「末端ＡＢ１」）に進み、さらにブロック５１７８に進み、ここでは本方法はビットオープンのＬＣ／ＭＳ画像のバックグラウンド補正を実行するための工程を開始する。判定ブロック５１８０において、さらに少数の中央値仕分けが必要とされるかどうか判定するための検定が実行される。判定ブロック５１８０の検定に対する答えがＹＥＳであれば方法５０００は別の続行末端（「末端ＡＤ１」）に進む。そうでない場合、判定ブロック５１８０の検定に対する答えはＮＯであり、本方法は別の続行末端（「末端ＡＣ１」）に進み、次いでブロック５１８２に進み、ここでは（ｍ／ｚ方向で２ｎ＋１、ＲＴ方向で１の寸法の）直線的な窓がＬＣ／ＭＳ画像の第１の画素に置かれる。次いでブロック５１８４において、本方法は直線的な窓内の画素の強度中央値を算出する。本方法は別の続行末端（「末端ＡＣ２」）に進む。
【００５８】
末端ＡＣ２（図５Ｓ−３）から、方法５０００はブロック５１８６に進み、ここでは強度中央値が直線的窓の中心に位置する画素に割り当てられる。ブロック５１８８において、上記で検討された工程５１８４−５１８６がＬＣ／ＭＳ画像の特定の横列内の各々の画素について繰り返される。上記で検討された工程はまた、ブロック５１９０においてＬＣ／ＭＳ画像内の各々の横列についても繰り返される。ブロック５１９２において、（ＲＴ方向で２ｍ＋１、ｍ／ｚ方向で１の寸法の）直線的な窓がＬＣ／ＭＳ画像の第１の画素に置かれる。ブロック５１９４において、本方法は直線的な窓内の画素の強度中央値を算出する。ブロック５１９６において、強度中央値が直線的窓の中心に位置する画素に割り当てられる。ブロック５１９８において、上記で検討された工程５１９４−５１９６がＬＣ／ＭＳ画像の特定の縦列内の各々の画素について繰り返される。次いで本方法は別の続行末端（「末端ＡＣ３」）へと続く。
【００５９】
末端ＡＣ３（図５Ｓ−４）から、上記で検討された工程がブロック５２００においてＬＣ／ＭＳ画像内の各々の縦列について繰り返される。ブロック５２０２において、上記で検討された工程が各々のＬＣ／ＭＳ画像について繰り返される。次いで本方法は別の続行末端（「末端ＡＢ２」）へと続く。末端ＡＢ１（図５Ｓ−４）から、方法５０００はブロック５２０４に進み、ここでは本方法はＬＣ／ＭＳ画像を矩形の塊のセットへと分割する。ブロック５２０６において、本方法は１つの塊を取り上げて特定の横列内のすべての画素の強度中央値を算出する。ブロック５２０８においてこの強度中央値がこの塊のうちの特定の横列の中心に位置する画素に割り当てられる。ブロック５２１０において、上記で検討された工程５２０６−５２０８がこの塊のうちの各々の横列について繰り返される。次いで本方法は別の続行末端（「末端ＡＤ２」）へと続く。
【００６０】
末端ＡＤ２（図５Ｓ−５）から、方法５０００はブロック５２１２に進み、ここでは本方法は１つの塊を取り上げて特定の縦列内のすべての画素の強度中央値を算出する。ブロック５２１４においてこの強度中央値がこの塊のうちの特定の縦列の中心に位置する画素に割り当てられる。ブロック５２１６において、上記で検討された工程５２１２−５２１４がこの塊のうちの各々の縦列について繰り返される。上記で検討された工程５２０６−５２１６はすべての塊についてもやはり繰り返される。ブロック５２１８参照。ブロック５２２０において、本方法は１つの塊のうちの特定の横列の強度中央値、および水平方向で最も近接する塊のうちの相当する横列の強度中央値を取り上げる。強度中央値を割り当てられた２つの画素の間の横列内の各々の画素の強度がブロック５２２２において補間される。ブロック５２２４において、上記で検討された工程５２２０−５２２２がすべての塊について繰り返されることで横列中央値画像を作り出す。次いで本方法は別の続行末端（「末端ＡＤ３」）に進む。
【００６１】
末端ＡＤ３（図５Ｓ−６）から、方法５０００はブロック５２２６において１つの塊のうちの特定の縦列の強度中央値、および垂直方向で最も近接する塊のうちの相当する縦列の強度中央値を取り上げる。ブロック５２２８において、強度中央値を割り当てられた２つの画素の間の縦列内の各々の画素の強度が補間される。ブロック５２３０において、上記で検討された工程５２２６−５２２８がすべての塊について繰り返されることで縦列中央値画像を作り出す。次いで方法５０００は別の続行末端（「末端ＡＢ２」）に進む。末端ＡＢ２（図５Ｓ−６）から、方法５０００はブロック５２３２に進み、ここでは横列中央値画像と縦列中央値画像の両方の中の画素位置について、本方法は同一場所に位置する２つの画素の最大強度値を取り上げる。ブロック５２３４においてこの最大値が同一場所に位置する２つの画素に相当する第３の画像（バックグラウンド画像）内の場所に割り当てられる。上記で検討された工程５２３２−５２３４がブロック５２３６において横列中央値画像と縦列中央値画像内のすべての画素について繰り返される。ブロック５２３８において、補正されたＬＣ／ＭＳ画像を作り出すために本方法は元のＬＣ／ＭＳ画像からバックグラウンド画像を引き算する。次いで本方法は別の続行末端（「末端ＡＢ３」）へと続く。
【００６２】
末端ＡＢ３（図５Ｓ−７）から、方法５０００はブロック５２４０に進み、ここでは本方法が塊を使用する場合には本方法は後に続く分析のために塊の中央値と標準偏差を計算する。ブロック５２４２において、本方法が塊を使用しない場合には本方法は後に続く分析のための中央値と標準偏差を計算する。いくつかの補正されたＬＣ／ＭＳ画像を作り出すために、上記で検討された工程が各々の元のＬＣ／ＭＳ画像について繰り返される。次いで方法５０００は別の続行末端（「末端ＡＥ１」）に進む。末端ＡＥ１（図５Ｓ−７）から、方法５０００はブロック５２４６に進み、ＬＣ／ＭＳ画像をＲＴ次元で平滑化するための工程を開始する。ブロック５２４８において、本方法は１つの保持時間におけるすべての画素の強度を直線的に取り上げ、一次元高速フーリエ変換を使用してそれらを周波数領域に持ち込む。ブロック５２５０において、あるノイズタイプが周波数領域への変換によって除去される。方法５０００は別の続行末端（「末端ＡＥ２」）に進む。
【００６３】
末端ＡＥ２（図５Ｓ−８）から、方法５０００はブロック５２５２に進み、ここでは本方法はＳ字型（ｓｉｇｍｏｉｄａｌ）またはガウス式ローパスフィルタのどちらかを順々に、または同時に作り出す。ブロック５２５４において本方法はローパスフィルタを、その変曲点が一次元高速フーリエ変換の周波数スペクトルの中心になるように移動させる。ブロック５２５６において本方法はＳ字型またはガウス式ローパスフィルタで一次元高速フーリエ変換に加重し、それゆえにスプリアス高周波成分を取り除く。ブロック５２５８において、本方法は一次元逆高速フーリエ変換を使用して１つの保持時間におけるすべての画素の強度を直線的に時間領域へと持ち込む。ブロック５２６０において本方法は逆高速フーリエ変換の実数部分を保持して虚数部分すべてを除去する。ブロック５２６２において、本方法はある画素の強度を、逆高速フーリエ変換の適用後にそれらの強度が負であればゼロに設定する。上記で検討された工程がブロック５２６４においてＬＣ／ＭＳ画像のすべての保持時間、およびすべてのＬＣ／ＭＳ画像について繰り返される。方法５０００は別の続行末端（「末端ＡＪ１」）に進む。
【００６４】
末端ＡＪ１（図５Ｓ−９）から、方法５０００は判定ブロック５２６６に進み、ここではデータが（データの１５％未満が非ゼロの値を有するような）まばらであるかどうか判定するための検定が実行される。判定ブロック５２６６の検定に対する答えがＮＯであれば方法５０００は別の続行末端（「末端ＡＧ１」）に進む。そうでない場合、判定ブロック５２６６の検定に対する答えはＹＥＳであり、本方法は別の続行末端（「末端ＡＦ１」）に進み、さらにブロック５２６８に進み、ここでは本方法はまばらなデータに関して閾値マスクを決定するための工程を開始する。ブロック５２７０において、本方法はＬＣ／ＭＳ画像から、ゼロよりも上のそれらの強度に関してゼロよりも上のビットマスクを作る。同時に、ブロック５２７２において本方法は前に末端ＡＢ３とＡＥ１との間で計算されたＬＣ／ＭＳ画像に関する標準偏差または標準偏差のセットを入手する。標準偏差のセットが入手されれば本方法はブロック５２７４において標準偏差の中央値を算出する。方法５０００は別の続行末端（「末端ＡＦ２」）に進む。
【００６５】
末端ＡＦ２（図５Ｓ−１０）から、方法５０００はブロック５２７６に進み、ここでは本方法は標準偏差よりも下の強度をゼロに設定することによって標準偏差ビットマスクを作り出す。ブロック５２７８において、本方法は標準偏差マスク上で数学的形態学的拡張操作を実行する。ブロック５２８０において拡張操作はゼロよりも上のビットマスクの構造によって抑制される。次いで本方法はブロック５２８２において閾値マスクを作り出す。次いで方法５０００は別の続行末端（「末端ＡＡ３」）に進む。末端ＡＧ１（図５Ｓ−１０）から、方法５０００はブロック５２８４に進み、ここでは本方法はまばらでないデータに関して閾値マスクを決定するための工程を開始する。ブロック５２８６において、本方法はＬＣ／ＭＳ画像から、ゼロよりも上のそれらの強度に関してゼロよりも上のビットマスクを作る。本方法は別の続行末端（「末端ＡＧ２」）へと続く。
【００６６】
末端ＡＧ２（図５Ｓ−１１）から、方法５０００はブロック５２８８に進み、ここでは本方法は前に末端ＡＢ３とＡＥ１との間で計算されたＬＣ／ＭＳ画像に関する標準偏差または標準偏差のセットを同時に入手する。標準偏差のセットが入手されれば本方法はブロック５２９０において標準偏差の中央値を算出する。ブロック５２９２において、本方法は閾値として標準偏差または標準偏差の中央値を使用して閾値よりも下の強度をゼロに設定する。方法５０００は別の続行末端（「末端ＨＨ１」）に進む。本方法はブロック５２９４へと続き、ここでは本方法はＬＣ／ＭＳ画像を平滑化するための工程を開始する。ブロック５２９６において、本方法はｍ／ｚ次元でＬＣ／ＭＳ画像を平滑化するための工程を開始する。本方法は別の続行末端（「末端ＡＩ２」）へと続く。
【００６７】
末端ＡＩ２（図５Ｓ−１２）から、方法５０００はブロック５３００において１つのｍ／ｚ走査におけるすべての画素の強度を直線的に取り上げ、一次元高速フーリエ変換を使用してそれらを周波数領域へと持ち込む。ブロック５３０２において、本方法はＳ字型またはガウス式ローパスフィルタのどちらかを順々に、または同時に作り出す。ブロック５３０４において本方法はローパスフィルタを、その変曲点が一次元高速フーリエ変換の周波数スペクトルの中心になるように移動させる。ブロック５３０６において本方法はＳ字型またはガウス式ローパスフィルタで一次元高速フーリエ変換に加重し、それゆえにスプリアス高周波成分を取り除く。次に、ブロック５３０８において、本方法は一次元逆高速フーリエ変換を使用して１つのｍ／ｚ走査におけるすべての画素の強度を直線的に時間領域へと持ち込む。ブロック５３１０において本方法は逆高速フーリエ変換の実数部分を保持して虚数部分すべてを除去する。ブロック５３１２において、上記で検討された工程がＬＣ／ＭＳ画像のすべてのｍ／ｚ走査、およびすべてのＬＣ／ＭＳ画像について繰り返される。本方法は別の続行末端（「末端ＡＨ２」）に進む。
【００６８】
末端ＡＨ２（図５Ｓ−１３）から、方法５０００はＲＴ次元でＬＣ／ＭＳ画像を平滑化するために末端ＡＥ１とＡＥ３との間の工程を開始する。ブロック５３１４参照。次いで本方法は別の続行末端（「末端ＡＧ３」）へと続く。本方法はさらにブロック５３１６に進み、ここでは本方法は標準偏差よりも下の強度をゼロに設定することによって標準偏差ビットマスクを作り出す。ブロック５３１８において、閾値マスクを作り出すために本方法は標準偏差ビットマスクとゼロよりも上のビットマスクを交差させる。本方法は別の続行末端（「末端ＡＡ３」）に進み、さらにブロック５３２０に進み、ここでは本方法はＬＣ／ＭＳ画像に閾値マスクを適用する（掛け算する、または論理的「終了」）ことでバックグラウンドを補正する。本方法は別の続行末端（「末端Ａ２８」）に進む。
【００６９】
末端ＡＫ１（図５Ｓ−１４）から、方法５０００はブロック５３２２においてＬＣ／ＭＳ画像を平滑化するために末端ＡＨ１とＡＧ３との間の工程を開始する。ブロック５３２４において、本方法はＬＣ／ＭＳ画像のバックグラウンドを補正するために末端ＡＢ１とＡＥ１との間の工程を開始する。ブロック５３２６において本方法は閾値マスクを決定するために末端ＡＪ１とＡＡ３との間の工程を開始する。次に、ブロック５３２８において、方法５０００はＬＣ／ＭＳ画像に閾値マスクを適用する（掛け算する、または論理的「終了」）ことでバックグラウンドを補正する。方法５０００は末端Ａ２８に進み、さらにブロック５３３０に進み、ここでは各々の処理群の中の複製が、複製を横切る画素の強度を平均することによって１つの画像の中に組み合わされる。方法５０００は別の続行末端（「末端ＡＬ１」）に進む。
【００７０】
末端ＡＬ１（図５Ｓ−１５）から、方法５０００はブロック５３３２において群内複製の組合せ画像を矩形の断片に割って部分画像を形成する。ブロック５３３４において、各々の部分画像の画素強度の標準偏差が算出される。ブロック５３３６において強度が（上記で算出された）２つの標準偏差よりも下の画素についてビットマスクが作り出される。ブロック５３３８において、工程５３３６にて作り出されたビットマスクがＬＣ／ＭＳ画像に適用される。ブロック５３４０において、各々の部分画像の画素強度の標準偏差が再計算される。ブロック５３４２において、部分画像の再計算された標準偏差を使用して二次元補間が実行される。ブロック５３４４において、元の群内複製組合せ画像に対して数学的形態学的グレースケール拡張操作が実行される。次いで本方法は別の続行末端（「末端ＡＬ２」）へと続く。
【００７１】
末端ＡＬ２（図５Ｓ−１６）から、ブロック５３４６において、グレースケール拡張の結果がいずれの場所でも補間画像よりも大きい別のビットマスクが作り出される。ブロック５３４８では、上記の工程５３４６で作り出されたビットマスクに対して数学的形態学的オープン操作が実行される。ブロック５３５０において、オープンビットマスクが元の群内複製組合せ画像と共に適用される（掛け算される、または論理的「終了」）。ブロック５３５２において、上記の工程が画素の強度を表わす浮動小数点値を伴うマスク処理されたＬＣ／ＭＳ画像を作り出す。上記の工程がブロック５３５４において各々の群内複製組合せ画像について繰り返される。ブロック５３５６において本方法は様々な群の組合せ画像を取り入れ、各々の画素位置のすべての組合せ画像の中で（群間）強度を融合させる。次いで方法５０００は別の続行末端（「末端ＡＭ１」）に進む。
【００７２】
末端ＡＭ１（図５Ｓ−１７）から、方法５０００はブロック５３５８において特徴マスクを作るための工程を開始する。本方法はブロック５３６０において群間画像内の大きくて連続的な領域を取り除くための工程を開始する。これらの大きくて連続的な領域は多数の無関係な混入物質の溶出に由来するノイズおよびバックグラウンドによって引き起こされることがあり得る。本方法は別の続行末端（「末端ＡＮ１」）に進む。本方法はさらにブロック５３６２に進み、ここでは本方法は元の群間画像の形態学的平滑化を始めるための工程を開始する。ブロック５３６４において、１つの画素半径の構造的素子を使用して形態学的グレースケールオープン処理が実行される。ブロック５３６６において、１つの画素半径の構造的素子を使用して形態学的グレースケールクローズ処理が実行される。ブロック５３６８において上記の工程５３６４−５３６６が、構造的素子のサイズを直径で１から５画素のサイズまで増大させながら繰り返される。存続する画素は関心対象の生物学的特徴の発見に関する信号を含むと考えられる。ブロック５３７０において、これらの形態学的平滑化工程の終わりに第１の画像が作り出される。次いで方法５０００は別の続行末端（「末端ＡＮ２」）に進む。
【００７３】
末端ＡＮ２（図５Ｓ−１８）から、形態学的平滑化の工程と同時に本方法はブロック５３７２において元の群間画像に対して形態学的グレースケールオープン処理を実行する。ブロック５３７４において、本方法はＲＴ次元でＬＣ／ＭＳ画像を平滑化するために末端ＡＥ１とＡＥ３との間の工程を開始して第２の画像を作り出す。ブロック５３７６において本方法は第１の画像を平滑化するために末端ＡＨ１とＡＧ３との間の工程を開始する。ブロック５３７８において、本方法はこの第１の画像の強度に対する第２の画像の強度の比を取り込むことによって信号の平滑化能力を判定する。ブロック５３８０において、関心対象の見込まれる特徴を示す適切な（例えば近似し過ぎる）比の値を備えた画素位置に関して第２のビットマスクが実行される。ブロック５３８２において、約１の半径の構造的素子を備えた第２のビットマスクに対して二次元形態学的オープン操作が実行される。ブロック５３８４において、強度がゼロよりも大きい画素に関して第１のビットマスクが第１の画像から形成される。方法５０００は別の続行末端（「末端ＡＮ３」）に進む。
【００７４】
末端ＡＮ３（図５Ｓ−１９）から、ブロック５３８６において形態学的オープン操作が最大許容ピーク幅で（例えば１０−１１画素の長さで）、第１のビットマスクに対してｍ／ｚ次元で実行される。ブロック５３８８において、ＲＴとｍ／ｚ次元の両方であるが元の第１のビットマスクによって制約されて（調節もやはりされて）形態学的拡張操作がオープン処理された第１のビットマスクに対して実行される。ブロック５３９０において、本方法は連続的ノイズを伴わないマスクを作り出すために第２のマスクを反転された（論理的補数の）第１のマスクと交差させる（論理的ＡＮＤ）。連続的ノイズを伴わないマスクがブロック５３９４の元の群間画像に適用される（掛け算される、または論理的に「ＡＮＤ処理される」）。次いで本方法は別の続行末端（「末端ＡＭ２」）へと続き、さらにブロック５３９６に進み、ここでは強度がゼロよりも大きい画素に関してビットマスクが同時に元の群間画像から作り出される。次いで本方法は別の続行末端（「末端ＡＭ３」）へと続く。
【００７５】
末端ＡＭ３（図５Ｓ−２０）から、ブロック５３９８において例えば２などの適切な半径を備えたダイヤモンド形状の構造素子を使用して形態学的オープン操作がビットマスクに対して実行される。ブロック５４００において、本方法は大きい連続的領域が除去された群間画像を平滑化するための末端ＡＨ１とＡＧ３との間の工程を開始する。以下の技法はラプラス変換によって検出されるエッジ間の負の値として表わされるアーチファクトを得るためにラプラス変換を使用する。これらのアーチファクトはピークを含めた関心対象の見込まれる生物学的特徴の領域を位置特定するために使用される。ピークの頂点付近にあって関心対象の見込まれる生物学的特徴を位置特定する能力を不明瞭にしかねないノイズを避けるためにラプラス変換がガウス変換と併せて使用される。工程５３９８でオープン操作を受けたビットマスクが平滑化された群間画像に適用されることで前ＬｏＧ（ガウシアンのラプラシアン（ＬａｐｌａｃｉａｎｏｆａＧａｕｓｓｉａｎ））画像を作り出す。ブロック５４０２参照。方法５０００は別の続行末端（「末端ＡＯ１」）に進み、ブロック５４０４にさらに進み、ここでは本方法はガウス関数カーネルの適切な放射状ラプラシアン（１または２のσを備えた７×７カーネルなど）を作り出す。ブロック５４０６において、本方法はまたｍ／ｚ次元でガウス関数カーネルの適切な線形ラプラシアン（１または２のσを備えた７×７など）も作り出す。ブロック５４０８において、負の値の第１のマスクを作り出すために前ＬｏＧ画像が放射状ＬｏＧカーネルと重畳される。次いで本方法は別の続行末端（「末端ＡＯ２」）へと続く。
【００７６】
末端ＡＯ２（図５Ｓ−２１）から、負の値の第２のマスクを作り出すためにブロック５４１０において前ＬｏＧ画像が線形ＬｏＧカーネルと重畳される。ブロック５４１２において、スポットのマスクを作り出すために第１と第２のマスクが交差させられる（掛け算される、または論理的に「ＡＮＤ処理される」）。次いで本方法は別の続行末端（「末端ＡＭ４」）へと続き、さらにブロック５４１６に進み、ここでは本方法は大きい連続的領域が除去された群間画像を反転させる。ブロック５４１８において、ウォーターシェッド流域間の線を見つけるために本方法は反転された画像にウォーターシェッド変換を実行する。ウォーターシェッド変換は前にガウス変換のラプラシアンによって分離されなかったピークなどの融合した生物学的特徴を別々に分割するのに役立つ。ブロック５４２０において本方法はウォーターシェッド流域間の線に基づいてビットマスクを作り出す。本方法は別の続行末端（「末端ＡＭ５」）に進む。
【００７７】
末端ＡＭ５（図５Ｓ−２２）から、方法５０００はブロック５４２２においてウォーターシェッド線ビットマスクを反転させる。ブロック５４２４において、特徴のマスクを作り出すために本方法はウォーターシェッド線ビットマスクとスポットのマスクを交差させる（または掛け算する、または論理的に「終了させる」）。ブロック５４２６において、範囲２、１のボックス構造素子を使用して二次元の形態学的オープン操作が特徴のマスクに対して実行される。ブロック５４２８において、本方法は関心対象のピークおよび他の特徴を識別するために次の段階で使用される合成画像および特徴のマスクを作り出す。次いで本方法は末端Ｂに進む。
【００７８】
末端Ｂ（図５Ａ−１）から、方法５０００は続行末端（「末端Ｃ」）と別の続行末端（「末端Ｄ」）との間に規定される方法工程のセット５００４に進む。方法工程のセット５００４はピーク、同位体群、および荷電群を含めた画像特徴を抽出する。
【００７９】
末端Ｃ（図５Ｔ）から、方法５０００は画像特徴に関してｉのｍ／ｚ値とｊの時間点の強度としてｘ_ｉ，ｊを規定する。ブロック５４３０参照。ブロック５４３２において、本方法は画像特徴の最大強度としてピーク強度を規定する。ブロック５４３４において、本方法は合成画像の上に（複数の格子横列と格子縦列を備えた）格子を重ね合わせる。次いで本方法は別の続行末端（「末端Ｃ１」）へと続く。
【００８０】
末端Ｃ１（図５Ｕ）から、方法５０００はブロック５４３６において様々な特徴の境界を算出する。ブロック５４３８において、本方法は他の特徴パラメータを算出する。次いで本方法は別の続行末端（「末端Ｃ２」）へと続く。
【００８１】
末端Ｃ２（図５Ｖ）から、方法５０００は非ゼロ画素などのある値の関連した複数画素を検索することによって合成画像内でピークを抽出する。ブロック５４４０参照。判定ブロック５４４２において、ピークが見つけられたかどうか判定するための検定が実行される。判定ブロック５４４２の検定に対する答えがＮＯであれば本方法は別の続行末端（「末端Ｃ３」）へと続き、ブロック５４４０へとスキップして戻り、ここでは上記で特定された処理工程が繰り返される。判定ブロック５４４２の検定に対する答えがＹＥＳであれば本方法はブロック５４４４へと続き、ここでは本方法は見つけられたピークを指数などの特有の指示子でラベリングする。本方法は判定ブロック５４４６に進み、ここではさらに多くの関連した非ゼロ画素があるかどうか判定するための別の検定が実行される。判定ブロック５４４６の検定に対する答えがＹＥＳであれば本方法は末端Ｃ３に進み、ブロック５４４０へとスキップして戻り、ここでは上記で特定された処理工程が繰り返される。そうでない場合、判定ブロック５４４６の検定に対する答えはＮＯであり、本方法は別の続行末端（「末端Ｃ４」）へと続く。
【００８２】
末端Ｃ４（図５Ｗ）から、方法５０００はブロック５４４８においてｍ／ｚ方向で重なり合ったピークの解析を開始する。ブロック５４５０において、本方法は格子横列（ｍ／ｚ方向）のすべてのピークのピーク強度中央値を計算する。ブロック５４５２において、本方法はピーク強度中央値よりも高いピーク強度を有する格子横列内ピークである高い格子横列ピークを計算する。ブロック５４５４において本方法は高い格子横列ピークのｍ／ｚ幅中央値およびその偏差に基づいて（重なり合うピークを区切る）幅閾値を計算する。ブロック５４５６において、本方法はピークｍ／ｚの重心の幅を計算する。ピークの重心の幅が幅閾値以上であるかどうか判定するための検定が判定ブロック５４５８において実行される。判定ブロック５４５８の検定に対する答えがＮＯであれば本方法は別の続行末端（「末端Ｃ５」）に進む。そうでない場合、判定ブロック５４５８の検定に対する答えはＹＥＳであり、本方法は別の続行末端（「末端Ｃ１５」）に進む。
【００８３】
末端Ｃ５（図５Ｘ）から、方法５０００は判定ブロック５４６０に進み、ここでは格子横列内のすべてのピークが解析されたかどうか判定するための検定が実行される。判定ブロック５４６０の検定に対する答えがＮＯであれば方法５０００はブロック５４６２に進み、ここでは本方法は重なり解析のために格子横列の中の他のピークを選択する。次いで本方法は別の続行末端（「末端Ｃ６」）へと続き、一巡してブロック５４５６（図５Ｗ）に戻り、ここでは上記で特定された処理工程が繰り返される。そうでない場合、判定ブロック５４６０の検定に対する答えはＹＥＳであり、本方法は判定ブロック５４６４に進み、ここではすべての格子横列が解析されたかどうか判定するための別の検定が実行される。判定ブロック５４６４の検定に対する答えがＮＯであれば本方法はブロック５４６８に進み、ここでは本方法は重なり解析のために別の格子横列を選択する。次いで本方法は別の続行末端（「末端Ｃ７」）に進み、スキップしてブロック５４５０へと戻り、ここでは上記で特定された処理工程が繰り返される。そうでない場合、判定ブロック５４６４の検定に対する答えはＹＥＳであり、本方法は別の続行末端（「末端Ｃ１１」）に進む。
【００８４】
末端Ｃ１５（図５Ｙ）から、方法５０００は判定ブロック５４７０に進み、ここでは本方法が高いコントラストの分割を実行しているかどうか判定するための検定が実行される。判定ブロック５４７０の検定に対する答えがＹＥＳであれば本方法は別の続行末端（「末端Ｃ８」）に進む。そうでない場合、判定ブロック５４７０の検定に対する答えはＮＯであり、本方法はブロック５４７２に進み、ここでは本方法は低いコントラストの分割を実行し始める。次いで本方法は別の続行末端（「末端Ｃ１７」）へと続く。
【００８５】
末端Ｃ８（図５Ｚ）から、方法５０００はブロック５４７４に進み、ここでは本方法は重なり合うピークの高いコントラストの分割を始める。ブロック５４７６において、本方法は重なり合うピークを記述する点の配列（ｘ１，ｘ２，．．．，ｘｎ）を入手し、各々の点は対応する強度を備えている。十分な数（例えば４つ）の分割するべき点があるかどうか判定するための検定が判定ブロック５４７８において実行される。判定ブロック５４７８の検定に対する答えがＮＯであれば方法５０００は別の続行末端（「末端Ｃ１０」）に進む。そうでない場合、判定ブロック５４７８の検定に対する答えはＹＥＳであり、本方法はブロック５４８０に進み、ここでは本方法は２つの直ぐ隣りの接近点よりも低い強度を備えた点である配列内の落ち込みを見つける。ブロック５４８２において、本方法はコントラスト閾値（例えば０．１などといったコントラストレベルと配列の最大強度との積）を計算する。次いで本方法は別の続行末端（「末端Ｃ９」）へと続く。
【００８６】
末端Ｃ９（図５Ａ−２）から、方法５０００は判定ブロック５４８４に進み、ここでは落ち込みのうちの１つがコントラスト閾値よりも小さい強度を有するかどうか判定するための検定が実行される。判定ブロック５４８４の検定に対する答えがＮＯであれば本方法は末端Ｃ１０に進む。そうでない場合、判定ブロック５４８４の検定に対する答えはＹＥＳであり、本方法はブロック５４８６に進み、ここでは重なり合うピークは高いコントラストであって分割可能である。ブロック５４８８において、本方法は閾値（例えば配列の標準偏差と最大値との積）よりも小さい強度を備えた点のすべての関連したセットを見つける。本方法はブロック５４９０において複数の点の関連したセット内の最小落ち込み（または多くある場合には第１の最小落ち込み）を見つける。ブロック５４９２において、本方法は重なり合うピークを最小落ち込みの点において分割する。ブロック５４９４において、本方法は特有の指示子で分割ピークをラベリングし、原初の特有の指示子がピークのうちの一方に再使用される。本方法は末端Ｃ１０に進む。
【００８７】
末端Ｃ１０（図５Ａ−３）から、方法５０００は判定ブロック５４９６に進み、ここでは本方法がｍ／ｚ方向で解析しているかどうか判定するための検定が実行される。判定ブロック５４９６の検定に対する答えがＹＥＳであれば本方法は末端Ｃ５に進み、スキップして判定ブロック５４６０へと戻り、上記で特定された処理工程が繰り返される。そうでない場合、判定ブロック５４９６の検定に対する答えはＮＯであり、本方法は別の続行末端（「末端Ｃ１４」）に進む。末端Ｃ１１（図５Ａ−３）から、方法５０００はブロック５４９８に進み、ここでは本方法は保持時間方向で重なり合うピークの解析を開始する。ブロック５５００において、本方法は合成画像内のすべてのピークのピーク強度中央値を計算する。ブロック５５０２において本方法は、ピーク強度中央値よりも高いピーク強度を有するピークである高ピークを計算する。次いで本方法は別の続行末端（「末端Ｃ１２」）へと続く。
【００８８】
末端Ｃ１２（図５Ａ−４）から、方法５０００は偏差期間内のすべての高ピークの時間幅中央値に基づいて（重なり合うピークを区切る）幅閾値を計算する。ブロック５５０４参照。ブロック５５０６において、本方法は高ピークに関してピーク時間の重心の幅を計算する。本方法は判定ブロック５５０８に進み、ここではピークの重心の幅が幅閾値以上であるかどうか判定するための検定が実行される。判定ブロック５５０８の検定に対する答えがＹＥＳであれば本方法は末端Ｃ１５に進み、スキップして判定ブロック５４７０へと戻り、上記で特定された処理工程が繰り返される。そうでない場合、判定ブロック５５０８の検定に対する答えはＮＯであり、本方法は別の続行末端（「末端Ｃ１４」）に進む。
【００８９】
末端Ｃ１４（図５Ａ−５）から、方法５０００は判定ブロック５５１０に進み、ここではすべての高ピークが解析されたかどうか判定するための検定が実行される。判定ブロック５５１０の検定に対する答えがＮＯであれば方法５０００は別の続行末端（「末端Ｃ１３」）に進み、スキップしてブロック５５０６へと戻り、ここでは上記で特定された処理工程が繰り返される。そうでない場合、判定ブロック５５１０の検定に対する答えはＹＥＳであり、本方法は判定ブロック５５１２に進み、ここでは重なり解析が繰り返されるべきかどうか判定するための他の検定が実行される。判定ブロック５５１２の検定に対する答えがＹＥＳであれば本方法は末端Ｃ４に進み、スキップして判定ブロック５４４８（図５Ｗ）へと戻り、上記で特定された処理工程が繰り返される。そうでない場合、判定ブロック５５１２の検定に対する答えはＮＯであり、本方法は別の続行末端（「末端Ｃ２０」）に進む。
【００９０】
末端Ｃ１７（図５Ａ−６）から、方法５０００はブロック５５１４においてガウス関数を使用して重なり合うピークをモデル化する。ブロック５５１６において、複数のガウス関数の最良適合を見出すために最適化処理が重なり合うピークに適用される。ブロック５５１８において、完全に重なり合って分割不可能である場合の推定については仮説は構成されない。ブロック５５２０において、仮説のない確率が真であるかどうか判定するためにｐ値が供給される。ｐ値が閾値よりも小さいかどうか判定するための検定が判定ブロック５５２２において実行される。判定ブロック５５２２の検定に対する答えがＮＯであれば本方法はブロック５５２４に進み、ここでは帰無仮説が真であり、ピークは分割不可能である。方法５０００は末端Ｃ１０へと続き、一巡して判定ブロック５４９６へと戻り、上記で特定された処理工程が繰り返される。そうでない場合、判定ブロック５５２２の検定に対する答えはＹＥＳであり、本方法は別の続行末端（「末端Ｃ１８」）に進む。
【００９１】
末端Ｃ１８（図５Ａ−７）から、方法５０００は判定ブロック５５２６に進み、ここでは帰無仮説は拒絶され、ピークは分割可能である。ブロック５５２８において、本方法は重なり合いまたは結合の場所を判定するためにガウス関数を使用する。本法はまた、各々の個別ピークから重なり合うかまたは結合したピークへの強度の寄与もブロック５５３０において判定する。重なり合いの場所で分割が起こるはずであるかどうか判定するための検定がブロック５５３２において実行される。判定ブロック５５３２の検定に対する答えがＮＯであれば本方法は別の続行末端（「末端Ｃ１９」）に進む。そうでない場合、判定ブロック５５３２の検定に対する答えはＹＥＳであり、本方法はガウス関数によって判定された場所を使用してブロック５５３４においてピークを分割する。ブロック５５３６において、本方法は分割されたピークを特有の指示子でラベリングし、原初の特有の指示子がピークのうちの一方に再使用される。次いで本方法は末端Ｃ１０へと続き、一巡して判定ブロック５４９６へと戻り、上記で特定された処理工程が繰り返される。
【００９２】
末端Ｃ１９（図５Ａ−８）から、方法５０００は特に広い幅を備えたピークの曲線の下の面積または表面の下の体積を使用してブロック５５３８において合計強度を判定する。ブロック５５４０において、本方法は特に広い幅を備えたピークの中の各々のピークの強度割合を計算する。本方法はこれらのピークの下の面積の比に基づいた割合強度を使用してブロック５５４２においてピークを分割する。ブロック５５４４において、本方法は分割されたピークを特有の指示子でラベリングし、原初の特有の指示子がピークのうちの一方に再使用される。次いで本方法は末端Ｃ１０へと続き、一巡して判定ブロック５４９６へと戻り、上記で特定された処理工程が繰り返される。末端Ｃ２０（図５Ａ−８）から、本方法はブロック５５４６に進み、ここでは本方法は過度に幅広の時間のピークを整える。次いで本方法は別の続行末端（「末端Ｃ２１」）に進む。
【００９３】
末端Ｃ２１（図５Ａ−９）から、方法５０００は理想ピークに関してクロマトグラムモデルを作成するためにブロック５５４８において修正マクスウェル分布関数などのモデルを使用する。ブロック５５５０において、本方法は合成画像からのピークに対する近似的整合を得るようにモデルのパラメータを調節する。本方法はピークに関して整合がどの程度優れているか判定するピーク時間の点数をブロック５５５２において作り出す（完全な整合については点数は１であり、ノイズの多いピークについては点数は０に向かう傾向を有する）。ブロック５５５４において、本方法は様々な他の時間特徴特性を計算する。判定ブロック５５５６において検定が実行され、ここではすべてのピークが特徴付けられたかどうか判定される。判定ブロック５５５６の検定に対する答えがＹＥＳであれば本方法は別の続行末端（「末端Ｃ２２」）に進む。判定ブロック５５５６の検定に対する答えがＮＯであれば本方法は末端Ｃ２１に進み、ブロック５５４８へとスキップして戻り、上記で特定された処理工程が繰り返される。
【００９４】
末端Ｃ２２（図５Ａ−１０）から、方法５０００はガウス分布関数などのモデルを使用してｍ／ｚ方向のピークの特性を判定するためにブロック５５５８においてモデルを作成する。ブロック５５６０において、本方法は合成画像からのピークに対する近似的整合を得るようにモデルのパラメータを調節することでモデルを修正する。本方法はスペクトルピークの品質を判定するためにブロック５５６２においてｍ／ｚピークの点数を作り出す（ピークが汚染されていないときに点数は１であり、汚染されたピークについては点数は０に向かう傾向を有する）。ブロック５５６４において本方法は様々な他のｍ／ｚ特徴特性を計算する。すべてのピークが特徴付けられたかどうか判定するための検定が判定ブロック５５６６において実行される。判定ブロック５５６６の検定に対する答えがＹＥＳであれば本方法は別の続行末端（「末端Ｃ２３」）へと続く。
【００９５】
判定ブロック５５６６の検定に対する答えがＮＯであれば本方法は末端Ｃ２２に進み、ブロック５５５８へとスキップして戻り、上記で特定された処理工程が繰り返される。末端Ｃ２３（図５Ａ−１１）から、方法５０００はブロック５５６８に進み、ここでは本方法は保持時間方向の強度（Ｒ_Ｔ）、ｍ／ｚ方向の強度（Ｒ_Ｍ）、および時間の点数（Ｒ_Ｓ）によってすべてのピークをランク付けする。ブロック５５７０において、本方法はＲ＝Ｒ_Ｓ＋（Ｒ_Ｔ＋Ｒ_Ｍ）／２などといった適切な式を使用して総合的なランクを計算する。最大のＲ点数を備えた特徴が１番目に記載され、２番目に大きいＲ点数が２番目に記載されるなどのように本方法はブロック５５７２において総合的なランクの順序を組み直す。ブロック５５７４において、同位体群を見つけるために本方法は総合的なランクで１番目に記載されたピークである種ピークを選択する。本方法はブロック５５７６においてピークモデルを使用して荷電点数を計算すること、および最高の荷電点数を備えた荷電を選択することによって種ピークの荷電を見出すことを試みる。ブロック５５７８において、本方法は低いｍ／ｚ方向に向かって同位体ピークを探す。次いで本方法は別の続行末端（「末端Ｃ２４」）に進む。
【００９６】
末端Ｃ２４（図５Ａ−１２）から、方法５０００は判定ブロック５５８０に進み、ここでは本方法が検索のｍ／ｚ方向を切り換えるべきかどうか判定するための検定が実行される。判定ブロック５５８０の検定に対する答えがＹＥＳであれば本方法は種ピークのｍ／ｚ位置よりも高いｍ／ｚレベルを検索するために正の同位体番号（Ｋ）を繰り返すことによってブロック５５８２において同位体ピークを探す。次いで本方法は別の続行末端（「末端Ｃ２５」）へと続く。そうでない場合、判定ブロック５５８０の検定に対する答えはＮＯであり、本方法はブロック５５８４に進み、ここでは本方法は種ピークのｍ／ｚ位置よりも低いｍ／ｚレベルを検索するために負の同位体番号（Ｋ）を繰り返すことによって同位体ピークを探す。本方法は末端２５へと続き、さらにブロック５５８６に進み、ここでは本方法は同位体ピークを検索するための同位体領域の幅を種ピークの時間幅と同等と見なす。本方法はブロック５５８８において種ピークの重心の幅、同位体番号（Ｋ）、中性子質量、および荷電に基づいて同位体の中心領域を規定する。本方法はブロック５５９０において種ピークの定数および格子調節されたｍ／ｚ幅に基づいて同位体領域の高さを規定する。本方法は別の続行末端（「末端Ｃ２６」）に進む。
【００９７】
末端Ｃ２６（図５Ａ−１３）から、方法５０００は判定ブロック５５９２に進み、ここでは本方法がすべての方向で同位体ピークを検索したかどうか判定するための検定が実行される。判定ブロック５５９２の検定に対する答えがＹＥＳであれば本方法は別の続行末端（「末端Ｃ３０」）に進む。判定ブロック５５９２の検定に対する答えがＮＯであれば本方法はブロック５５９４に進み、ここでは本方法は同位体領域の中で同位体番号（Ｋ）によって識別される同位体位置の候補ピークを見つける。ブロック５５９６において本方法は同位体強度、種同位体強度、これまでに計算された最大同位体強度、および先行する同位体の同位体強度に基づいて商を計算する。判定ブロック５５９８において検定が実行され、ここでは候補ピークの強度が受容可能であることを商が示すかどうか判定される。判定ブロック５５９８の検定に対する答えがＮＯであれば本方法は末端Ｃ２４に進み、一巡して判定ブロック５５８０へと戻り、上記で特定された処理工程が繰り返される。そうでない場合、判定ブロック５５９８の検定に対する答えはＹＥＳであり、本方法は別の続行末端（「末端Ｃ２７」）に進む。
【００９８】
末端Ｃ２７（図５Ａ−１４）から、候補のピークが同位体のｍ／ｚの強度／形状モデルおよび同位体の時間の強度／形状モデルと完全に整合する単純な位置に関してブロック５５６０において帰無仮説が構築される。候補のピークが同位体群の一部として受容され得るか拒絶されるか判断するためにブロック５６０２においてｍ／ｚ方向と時間方向の両方でｐ値が供給される。時間方向は保持時間方向である。ブロック５６０４において、本方法はガウス関数を使用して候補のピークを同位体モデルと比較する。候補のピークのｐ値が受容閾値よりも大きいかどうか判定するための検定が判定ブロック５６０６において実行される。判定ブロック５６０６の検定に対する答えがＹＥＳであれば本方法はブロック５６０８に進み、ここでは候補のピークが特定の同位体群で識別する特有の指示子でラベリングされる。次いで本方法は別の続行末端（「末端Ｃ２８」）へと続く。そうでない場合、判定ブロック５６０６の検定に対する答えはＮＯであり、本方法は別の続行末端（「末端Ｃ２９」）に進む。
【００９９】
末端Ｃ２８（図５Ａ−１５）から、方法５０００はブロック５６１０に進み、ここでは帰無仮説は真であり、候補のピークはその構成要素が種ピークである同位体群に属する。候補のピークはブロック５６１２においてランク付けから除外される。次いで本方法は末端Ｃ２４へと続き、一巡して判定ブロック５５８０へと戻り、ここでは本方法は上記で検討された処理工程を実行するように進行する。末端Ｃ２９（図５Ａ−１５）から、ｐ値が拒絶閾値よりも小さいかどうか判定するための検定が実行される判定ブロック５６１４が実行される。判定ブロック５６１４の検定に対する答えがＮＯであれば本方法はブロック５６１６へと続き、ここでは候補のピークは後に他の同位体群が発見されたピークを主張することもあり得るケースでは本方法によって保留状態に置かれる。次いで本方法は末端Ｃ２４へと続き、判定ブロック５５８０へとスキップして戻り、ここでは上記で特定された処理工程が繰り返される。そうでない場合、判定ブロック５６１４の検定に対する答えはＹＥＳであり、本方法はブロック５６１８に進み、ここでは発見されたピークは同位体群の構成要素ではない。次いで本方法は末端Ｃ２４へと続き、判定ブロック５５８０へとスキップして戻り、ここでは上記で特定された処理工程が繰り返される。
【０１００】
末端Ｃ３０（図５Ａ−１６）から、方法５０００はブロック５６２０において同位体群を特有の指示子でラベリングする。ブロック５６２２において、他の同位体群のピークおよび荷電の発見を妨害しないように本方法は種ピークをランク付けから除外する。判定ブロック５６２４において検定が実行され、ここでは解析されるべきさらに多くの種ピークがあるかどうか判定される。判定ブロック５６２４の検定に対する答えがＹＥＳであれば方法５０００は別の続行末端（「末端Ｃ３１」）に進む。そうでない場合、判定ブロック５６２４の検定に対する答えはＮＯであり、本方法はブロック５６２６に進み、ここでは本方法は複数の同位体群に属するピークを有する同位体群を除外する。次いで本方法は別の続行末端（「末端Ｃ３２」）へと続く。
【０１０１】
末端Ｃ３２（図５Ａ−１７）から、方法５０００は判定ブロック５６２８に進み、ここでは本方法が単一の同位体を検出するかどうか判定するための検定が実行される。判定ブロック５６２８の検定に対する答えがＮＯであれば本方法は別の続行末端（「末端Ｃ３３」）に進む。そうでない場合、判定ブロック５６２８の検定に対する答えはＹＥＳであり、本方法はブロック５６３０に進み、ここでは本方法は同位体群の質量を計算し始める。同位体群の質量は荷電（Ｇ）、陽子質量、および最も下の検出同位体の中の第１のピークのｍ／ｚ強度の重心に基づく積である。ブロック５６３２参照。次いで本方法は別の続行末端（「末端Ｃ３９」）へと続く。
【０１０２】
末端Ｃ３３（図５Ａ−１８）から、方法５０００は最も下の同位体位置のピークの最も下のｍ／ｚ強度の重心を使用することによって最初に質量を推定する。ブロック５６３４参照。ブロック５６３６において、本方法は各々の同位体の中のピークの最大のモデルＲＴ強度を使用することによって観測される分布を計算する。本方法はブロック５６３８において理論的同位体分布を観測される同位体分布と比較し、最良整合が見つけられるまでそれらを変位させ、結果として整数偏位につながる。同位体群の質量はこの整数偏位を使用して再計算される。ブロック５６４０参照。次いで本方法は末端Ｃ３９へと続き、さらに判定ブロック５６４２に進み、ここでは解析されるべきさらに多くの同位体群があるかどうか判定するための検定が実行される。判定ブロック５６４２の検定に対する答えがＮＯであれば本方法は別の続行末端（「末端Ｃ３４」）に進む。そうでない場合、判定ブロック５６４２の検定に対する答えはＹＥＳであり、本方法は末端Ｃ３２に進み、判定ブロック５６２８へとスキップして戻り、上記で特定された処理工程が繰り返される。
【０１０３】
末端Ｃ３３（図５Ａ−１９）から、方法５０００は同じ質量と保持時間を有するが異なる荷電状態を有する同位体群のセットである荷電群を見つけ始める。ブロック５６４４参照。ブロック５６４６において、本方法は単一の同位体ピークを備えた同位体群を発見処理から除外する。本方法は同位体群内のすべてのピークに関する平均ＲＴ点数のランクと同位体群内のすべてのピークの最大ピーク強度のランクの和である総合的ランク（Ｒ）をブロック５６４８において計算する。ブロック５６５０において、総合的ランクが各々の同位体群について作り出され、高い点数を有する同位体群が１番目にランク付けされて順序を決められる。ブロック５６５２において、種同位体群（種）が選択される。ブロック５６５４において境界が画定され、境界の中には種から由来する質量の単位に基づき、かつ種のＲＴの重心から由来する時間のある単位の中にある候補の同位体群がある。ブロック５６５６において、検査のために候補の同位体群が選択される。次いで本方法は別の続行末端（「末端Ｃ３４」）へと続く。
【０１０４】
末端Ｃ３４（図５Ａ−２０）から、２つの同位体群が同位体群の重心モデル、同位体群のＲＴ強度の重心モデルに基づいて同じ群に属するという仮定についてブロック５６５８において帰無仮説が構築される。ブロック５６６０において、同位体群が荷電群の一部として受容され得るか拒絶されるか評価するためにｐ値が供給される。ブロック５６６２において本方法はガウス関数を使用して候補の同位体群をモデルと比較する。候補の同位体群のｐ値が閾値よりも大きいかどうか判定するための検定が判定ブロック５６６４において実行される。判定ブロック５６６４の検定に対する答えがＮＯであれば本方法は別の続行末端（「末端Ｃ３５」）に進む。そうでない場合、判定ブロック５６６４の検定に対する答えはＹＥＳであり、本方法はブロック５６６６に進み、ここでは帰無仮説は真であり、候補の同位体群はその構成要素が種同位体群である荷電群に属する。本方法はブロック５６６８に進み、ここでは候補の同位体群がランク付けから除外される。次いで方法５０００は末端Ｃ３５に進む。
【０１０５】
末端Ｃ３５（図５Ａ−２１）から、方法５０００は判定ブロック５６７０に進み、ここでは考察するべきさらに多くの候補同位体群があるかどうか判定するための検定が実行される。判定ブロック５６７０の検定に対する答えがＹＥＳであれば本方法は別の続行末端（「末端Ｃ３７」）に進み、ブロック５６５６へとスキップして戻り、ここでは上記で特定された処理工程が繰り返される。そうでない場合、判定ブロック５６７０の検定に対する答えはＮＯであり、本方法はブロック５６７２に進み、ここでは種がランク付けから除外される。判定ブロック５６７４において別の検定が実行され、ここでは考察するべき他の種同位体群があるかどうか判定される。判定ブロック５６７４の検定に対する答えがＹＥＳであれば本方法は別の続行末端（「末端Ｃ３６」）に進み、ブロック５６５２へとスキップして戻り、ここでは上記で特定された処理工程が繰り返される。そうでない場合、判定ブロック５６７４の検定に対する答えはＮＯであり、本方法は末端Ｄに進む。
【０１０６】
末端Ｄ（図５Ａ−１）から、方法５０００は続行末端（「末端Ｅ」）と別の末端（「末端Ｆ」）との間に規定される方法工程のセット５００６に進む。方法工程のセット５００６は生物試料中の関心対象の実例の一覧表を作り出すための発現統計値の解析を述べている。
【０１０７】
末端Ｅ（図５Ａ−２２）から、方法５０００はブロック５６７６に進み、ここでは本方法は発現特性を計算する。本方法はブロック５６７８において３つの集大成レベル（ピーク、同位体群、および電荷群）ですべての条件におけるすべての複製の発現プロファイルを作り出す。本方法はブロック５６８０において誤差モデルを計算する。ブロック５６８２において、本方法はピークの絞り込みを実行する。本方法はブロック５６８４においてすべての実例の特徴とそれらの特性の一覧表を作り出す。ブロック５６８６において、本方法は並列の質量分析処理を使用して配列決定を実行する。次いで本方法は末端Ｆへと続き、実行を終了する。
【０１０８】
ここで、生物試料中の関心対象の特徴を識別するための様々な技法の中への数学的基礎が検討される。図５Ｂ−５Ｕは画像レジストレーションに基づいた保持時間の調整および時間の歪曲に関する方法工程を例示している。ピークなどの画像特徴に関すると、ＬＣ／ＭＳ画像におけるピークの保持時間は繰り返される運転でしばしばわずかに変わる。多様な処理の中で生物学的特徴判定を定量的に比較するために、様々な実施形態における保持時間の変動は同じ生物学的特徴から由来するピークが複数の運転全体にわたって適切に調整させられるように補正されなければならない。
【０１０９】
本発明の様々な実施形態における時間調整と偏位補正の方法はピーク抽出に頼らなくてもよい。画像レジストレーションに基づいてもよい。画像レジストレーション法は必ずしも抽出される必要のない画像内容における類似性に基づいて画像を整合させて調整させる。図５Ｂ−５Ｕに例示された方法工程は保持時間の偏位を補正するように画像レジストレーションを適用する。各々のＬＣ／ＭＳ画像は小さい格子の中に切り取られる。各々の格子の中の小さい矩形画像断片を保持時間方向または他の方向で変位させることによって、図５Ｂ−５Ｕに例示された方法工程は選択されたマスター画像への断片の整合を検索して見つけ出す。原初の場所から最良整合の場所への変位は所定の保持時間領域に関して１つの偏位推定を提供する。本方法工程はその時間の格子からすべての偏位推定を考察することによってその時間に関するさらに信頼性のある偏位推定を導き出すように続く。次いで本方法工程は複数の偏位推定を使用して滑らかな時間偏位推定曲線を構築する。
【０１１０】
図５Ｂ−５Ｕに例示された方法工程はある群もしくは条件の中の複製全体にわたる調整不良もしくは偏位、またはある群もしくは条件全体にわたる組合せの群画像と関連する調整不良を推定するために多様な補正係数技法を使用する様々な実施形態を検討しているが、いくつかの実施形態は以下のように２つの部分窓の間の絶対差の最小値の技法を使用して調整不良または偏位を推定する。保持時間のわずかな揺れまたはドリフトは試料間で識別されることが可能な分子イオンの数を限定することが可能である。様々な実施形態の方法工程が下記で検討されるようにラスタ化ＬＣ／ＭＳフィルタ処理画像データに調整を適用する。
【０１１１】
画像レジストレーションに基づく保持時間の調整がここで述べられるように実行される。ＬＣ／ＭＳ測定において、最新のＭＳ機器で測定される荷電測定（ｍ／ｚ）全体にわたる質量の精度と再現性の両方が、ＬＣ機器のみから由来する保持時間での精度と再現性よりもはるかに優れている。ペプチドなどの所定の生物学的特徴に関すると、ＬＣ／ＭＳ画像内の代表的なピークの保持時間は繰り返される運転（複製）でしばしばわずかに変わるであろう。多様な処理全体にわたってペプチド測定を比較するために、同じペプチドから由来するピークが複数の運転全体にわたって適切に調整することができるように考え得る保持時間の変位を識別して補正することが望ましい。いくつかの実施形態における時間の調整および変位の補正はピーク抽出に頼る必要がなく、代わりに画像レジストレーションに頼る。画像レジストレーション法は画像自体の類似性に基づいて画像を整合および調整させる。これらの画像特性が抽出される必要はない。様々な実施形態は、後にピークの抽出と識別に助力するように使用されることが可能な時間調整のさらに良好な感触を得るために窓内の画素全体および二次元の整合を観察する。
【０１１２】
このようにして、保持時間の偏位を補正するために画像レジストレーションが使用される。様々な実施形態における方法工程が矩形格子を規定する小さい窓の中に各々のＬＣ／ＭＳ画像を切り取る。格子の小さい矩形画像断片を保持時間方向で変位させることによって、本方法工程は選択されたマスター画像への断片の最良整合を検索して見つけ出す。原初の場所から最良整合を与える場所への変位は所定の保持時間の偏位に関する推定を提供する。本方法工程は特定の時間範囲の質量／荷電の窓およびすべての利用可能な質量／荷電の値の縦列の上下から得られる偏位推定を考慮することによって変位推定を導き出す。滑らかな時間偏位推定曲線は多様な連続的時間領域に関して複数の偏位推定を遡ることによって計算される。推定された偏位を考慮に入れた後に（未加工データから出発する）ＬＣ／ＭＳ画像の各々を再生するために下記で検討されるような画像のラスタ化および補間方法が使用される。この処理は歪曲である。歪められた画像がおそらく適切に調整させられる。
【０１１３】
さらに特定すると、偏位の計算は以下のように起こる。方法工程がすべてのスライドの中からマスターを選択する。このマスタースライドは調整の対照のスライドである。多数の明確な特徴を有するこのスライドを有すること、すなわち高いコントラストを有することが望ましい。この基準スライドは最初にスライドに関して基準ピーク強度（ＢＰＩ）を計算し、次いでこの測定値に関して標準偏差を計算することによって選択される。ＢＰＩにおいて最も高い標準偏差を備えたスライドがこの群のためのマスタースライドになる。基準ピーク強度は各々の時間点に関する最も高い強度値のことを称する。本質的に、これは保持時間に対するすべての質量／荷電の測定の二次元の要約を供給し、したがってクロマトグラムである。
【０１１４】
次に、本方法工程は画像を格子化する。マスターに対して調整させられる各々のスライドは最初に所定の幅の（重複しない）時間の縦列の中に分割される。次いで各々の縦列が重複しない質量／荷電部分窓の中にさらに分割される。各々の時間縦列に関して数個から多数個の部分窓を有することによって、本方法工程は構成要素部分窓の各々に関する個々の推定量を質量／荷電方向で組み合わせることで縦列に関して最終調整を推定することが可能であり、すなわち１つの縦列に関するすべての推定量はその縦列に関する変位の複製推定量と考えられる。
【０１１５】
次に、本方法工程は部分窓を整合させることを試みる。本方法工程はクエリーの画像（マスター）の各々の部分窓をターゲット画像に対して滑動させる（この滑動はマスターに対して調整させられる）。最良の変位であり得る場所を判定するために本方法工程はこれを一度に１画素、実際のサンプリング時間調整から左と右に行う。この滑動は一度に１画素でなくてもよく、粗検索の方式と同様の方式で為されることもやはり可能である。本方法工程が各々の方向に滑動させる画素の合計数は感知されるデータの精度によって決まるであろう。検索間隔が大きくなるにつれて、調整は一層計算上難しい要求になるであろう。調整のサンプリング時間の−３分から＋３分などといった適切な時間枠の中で検索窓を網羅する程度の多くの画素を滑動させることが殆どのケースで十分である。そうでないケースでは、滑動を整合に近付けるためにＢＰＩに基づいた事前変位調整が為されることもあり得る。比較される２つの部分画像間の最良整合を与える滑動点を判定するために、本方法工程はクエリー部分窓内の画素について画素強度間の絶対差の平均を計算する。計算をこれらの画素のみに限定することが重要であり、なぜならば画素の数は類似性の測定基準に影響を与え、かつ計算のための画素の数を変えることは付加的な偏りを計算の中に導入するからである。したがって、２つの部分窓の間の距離は各々の変位ｊについて以下のように計算され、これがｔ_０−３とｔ_０＋３との間の時間、またはあるべき検索窓を決定するいずれかの他の幅へと形を変え、出願人らは画素の絶対差
【数１】

によって画素の平均を計算し、クエリー画像部分窓（Ｑ）のｉ番目の画素の強度のある場所、および画像を現在の（時間ｔ_０における）試料調整の左および右にｊ画素変位させた後の相当する場所を計算する。結果として得られる差異の配列は比較される部分画像について最良整合がある最小値に到達するであろう。ノイズを除去した形態学的フィルタの以前の適用はこの最小値の発見の機会を増進することができる。部分窓に関して信頼性のある推定がないとこの最小値が存在しないことも見込まれ、様々な実施形態は下記で検討される誤差モデルを使用して絶対差に関する誤差の推定量を計算する。マスターを作り、したがってクエリー窓が高いコントラストを有することによって、差異は下方向で、または谷状の形状で現れると思われる。しかしながら時々、ターゲットの部分画像はクエリーの部分画像よりも強い特徴を有し、絶対差の平均を取ることは上への上昇を引き起こしかねず、これは下記で述べられる低頻度法を使用した最小値の判定を不明瞭にする。これらの稀なケースでは、差異の計算は逆にされ、本方法工程は代わりに同じ方式であるがターゲットの画素から引き算されたクエリー画素で規定される距離を最小化しようと試みる。
【０１１６】
次に、本方法工程は画素の絶対差の各々に関する誤差について推定量を計算する。この標準誤差概算は以下のように計算され、
【数２】

式中、
【数３】

はクエリーの部分画像（Ｑ）およびクエリー内の画素に関するターゲットの部分画像（Ｔ）内の画素の各々に関する分散の和であり、Ｎ_Ｑはクエリーの部分窓内の画素の数である。次に、本方法工程は推定をブートストラップする。本方法工程が調整させている各々の部分窓について、本方法工程はマスターに対する差異に関する推定量に加えてこれらの差異の標準誤差の推定量を有する。ここで本方法工程は差異
【数４】

の１つの曲線の最小値を取り、これを整合と呼ぶ。しかしながら、この推定量がどの程度優れているかの測定を有することが望ましい。整合を与える時間変位の推定を洗練し、かつ誤差情報をもたらすために本方法工程はブートストラッピング技法を使用する。すなわち、差異の無作為の試料を作り出すために平均の絶対差付近で標準誤差が使用され、これらの試料の各々について本方法工程は整合につながる変位、すなわち部分窓間の差異を最小にする変位を見つけ出す。
【０１１７】
次に、本方法工程は逆ガウス関数を適合させることを試みる。２つの部分窓の間の絶対差の最小によって示される整合を見つけ出すために、本方法工程は窓の中の低頻度の変化を考慮する。したがって、最小差異を見つけ出すために本方法工程は作り出された無作為試料の各々に逆ガウス関数として形作られる谷状の関数を適合させ、ガウス関数適合の最小を見つけ出す。次いで部分窓に関する理想的な変位がすべてのブートストラップ推定量の中央値として計算される。対応する加重がすべてのブートストラップ推定量の絶対偏差中央値（ＭＡＤ）、すなわち中央値からの偏差の中央値として計算される。ここでは数学的処理
【数５】

がある。
【０１１８】
次に、本方法工程は加重された平均を縦列に関して計算する。縦列の変位ｓｈｉｆｔ_ｃｏｌの不偏最小分散推定量（ＵＭＶＥ）がここで以下
【数６】

のように部分窓の変位と加重の対（Ｙ_ｋ，ｗ_ｋ）を使用して計算されることが可能である。これが不偏で最小の分散であることを保証するために、加重ｗ_ｋは各々の窓に関する分散推定量の逆数、すなわち
【数７】

として規定される。
【０１１９】
次に、本方法工程は外れ値の縦列推定量を平坦化する。縦列変位が隣りの変位から極端に異なり得るケースを避けるために、本方法工程は最終縦列変位にＴｕｋｅｙの双加重３点移動平均を通過させる。言い換えると、本方法工程は各々の変位を取り上げ、その隣りの縦列の変位を観察し、それらの間の偏差中央値に比例する方式で値を調節する。次に、本方法工程は三次スプラインを使用して補間する。個々の変位縦列に適合させられると三次スプラインは滑らかに変化する変換を計算するための推定を行い、これが未加工データに適用されることで調整させるであろう。時間方向で調整させるためにいったん滑らかな変換が決定されると、本方法工程はこの変換を実施し、したがってすべての試料を同期させることが可能である。
【０１２０】
本方法工程は条件間で調整させることを試みる。上記で述べられた同じ画像レジストレーションが条件間に適用される。群間複製画像に関して歪曲および（下記で述べられる）再ラスタ化が起こるとその後、これらは各々の画素に関して群内のすべての複製の平均を取ることによって組み合わされる。次いでこれらの組み合わされた画像は上記で述べられた同じ画像レジストレーション処理に通され、各々の条件に関して群間変位が計算される。未加工画像データに適用される最終変位は（もしもあれば）事前変位、時間内変位、および時間間変位の集合体であろう。
【０１２１】
次に、本方法工程は画像歪曲および再ラスタ化を実行する。上記で述べられた工程を通じて滑らかな時間指標変換が導き出されると、ここで本方法工程は未加工の画像に戻り、再ラスタ化するときに未加工データを補間する。新たなラスタ化が基本の特徴抽出および他の下流の解析に必要とされる。このときデータはそれらの原初のサンプリング時間を画像レジストレーションに基づく時間調整アルゴリズム（事前変位、群内および群間補正）によって規定される３つの集合体で変位させることを通じて補正することによってインデックスを付けられるであろう。新たな（ラスタ化された）データはデータポイントに関する補正された時間インデックスを使用して線形補間によって得られる。各々の格子点に関するデータが、隣接を決定する過程に新たに調節された時間インデックスを使用し、右および左に隣り合う点を使用して補間される。結果として得られるラスタ化画像はその最良調整に歪められ、すなわち時間調整計算結果が指示した事柄に応じて所定の位置に引き伸ばされ、または縮められる。それらの保持時間におけるいずれの不一致も除去されており、本方法工程は特徴の解析を伴って進行する準備ができている。
【０１２２】
調整不良または偏位がこれまでまたはこれ以降に検討される技法によって推定されるとその後、時間調整処理によって計算された推定偏位を考慮に入れた後に未加工データからＬＣ／ＭＳ画像の各々を再生するために画像のラスタ化および補間が使用されることが可能である。これらの新たな画像はこれまでのいくつかの実施形態およびこれ以降の他の実施形態で説明されるように特徴抽出のために歪められ、かつ調整させられる。図５Ｂ−５Ｕに例示された本方法工程は様々な補間技法を使用することもあり得る。いくつかの実施形態では、この補間技法は二次元空間における線形補間に基づいている。補間される値は１つの次元で保持時間および別の次元で荷電上の質量（または質量／荷電）を含む二次元空間内の画像点の強度である。
【０１２３】
様々な実施形態において、１つの技法に基づく複製の群に関して入力の未加工データを多様な未加工の質量／荷電座標に基づいて同じ質量／荷電格子に変換するために質量／荷電補間処理が画像処理の最初に使用される。この質量／荷電補間処理は質量／荷電格子が規則的でないことを想定している。この質量／荷電補間処理への入力データは未加工の保持時間データの一次元アレイ、未加工の質量／荷電データの二次元アレイ、未加工の強度データの二次元アレイ、結果として得られる質量／荷電格子点を表わす一次元アレイを含む。この処理は未加工の保持時間と質量／荷電格子点に関して格子強度の二次元アレイを作り出す。さらに特定すると、この質量／荷電補間処理は以下の工程を含む。各々の質量／荷電格子点に関する左隣りと右隣りについて線形補間が実行される。どのような変化も伴わずに保持時間座標が維持される。距離閾値は使用されない。両方の隣接格子点が同じである場所で質量／荷電補間処理は補間を控える。
【０１２４】
いくつかの実施形態では、解析において高輝度ピーク情報が重要であり、かつ孤立した点が除外されなければならないとき、調整画像処理工程に先行して高速の保持時間補間処理が使用される。この高速の保持時間補間処理は保持時間格子が一定の保持段階を伴って規則的であることを想定している。この高速の保持時間補間処理への入力データは未加工の保持時間情報の一次元アレイ、前に作成された格子に属する質量／荷電情報の二次元アレイ、強度情報の二次元アレイ、保持時間格子段階、および補間距離閾値を含む。この高速の保持時間補間処理は保持時間と質量／荷電格子点に関して格子強度の二次元アレイを作り出す。さらに特定すると、この高速の保持時間補間処理の様々な工程は各々の保持時間格子点に関して左隣りと右隣りの距離に基づく線形補間を使用する工程を含む。どのような変化も伴わずに質量／荷電座標が維持される。格子点が特定の補間距離の内側で左隣りと右隣りを有さない場合、本処理は結果としてゼロの強度を作り出す。
【０１２５】
様々な実施形態において、保持時間方向の正確な補間のために適応保持時間補間処理が使用される。どのような変化も伴わずに質量／荷電座標が維持される。結果として生じる格子点は変位した入力の未加工保持座標に基づいている。結果として生じる強度情報は入力規模のベクトルに基づいて規模決定される。この適応保持時間補間処理への入力データは未加工の保持時間情報の一次元アレイ、前に作成された格子に属する質量／荷電情報の二次元アレイ、強度情報の二次元アレイ、保持時間格子段階、１つの主補間距離閾値、ソリッド補間距離閾値、小補間距離閾値、保持時間変位の一次元アレイ、および強度規模係数の一次元アレイを含む。この適応保持時間補間処理は保持時間と質量／荷電格子点に関して格子強度の二次元アレイを作り出す。この適応保持時間補間処理の工程は点が直ぐ隣りを有するかどうか判定するための最初の検定で始まる補間決定系統図によって要約されることが可能である。この最初の検定に対する答えがＮＯであればこの格子の値はゼロである。この最初の検定に対する答えがＹＥＳであればこの点が両側に隣りを有するかどうか判定するための第２の検定が実行される。第２の検定に対する答えがＹＥＳであれば本処理が線形補間を適用することで格子値を得る。そうでない場合、第２の検定に対する答えがＮＯであれば、この点が一方の側でソリッドであるかどうか判定するための第３の検定が実行される。第３の検定に対する答えがＹＥＳであれば本処理がゼロ代入で線形補間を適用する。第３の検定に対する答えがＮＯであれば、本処理はこの点が孤立した点であるかどうか判定するための第４の検定を実行する。第４の検定に対する答えがＹＥＳであれば本処理は孤立点の値を使用する。そうでない場合、第４の検定に対する答えはＮＯであり、格子の値はゼロであると判定される。さらに特定すると、この適応保持時間補間処理の工程は各々の保持時間格子点に関する左隣りと右隣りの距離に基づいた線形補間である。主補間距離の内側で隣り（直ぐ隣り）が見つけ出され、各々の未加工の保持時間座標に保持時間変位が適用される。格子点の一方の側に直ぐ隣りが１つあるのみである場合、本処理はこれがどのような種類の点であるか見出そうと試みる。ソリッド距離閾値の距離（いくつかの実施形態では主補間距離の約２倍）内で一方の側にさらに多くの点がある場合、結果となる強度は特定の法則に基づいて算出される。最初に、本処理はゼロ強度および最も近いソリッド点までの距離に等しい距離で直ぐ隣りと対称の位置を備えた新たな仮の未加工の点を作り出す。新たな仮の点が現在の保持格子点から別の側にあれば、格子強度値は直ぐ隣りと新たな仮の点の線形補間であり、そうでない場合、結果となる強度はゼロである。本処理のこの部分は画像ピーク境界をさらに滑らかにすることに役立つ。直ぐ隣りがソリッドでなければ、本処理は孤立点を補間すること（または大きくすること）を控える。このケースでは、本処理は小補間距離（主補間距離の半分）内に直ぐ隣りがあるかどうか観察するようにチェックしている。保持時間格子および未加工の点が小距離内にあれば、格子強度は未加工の強度に等しく設定される。そうでない場合、これはゼロに設定される。すべての結果的強度は、いくつかの実施形態では入力の規模係数を使用して規模を決められる。
【０１２６】
いくつかの実施形態では、保持時間方向で極端に長い画像ストライプを除外するために篩い分けフィルタ処理操作が実行される。この操作はビット単位であり、一度に画像全体で作用するように為されることが可能である。篩い分けフィルタ処理操作への入力データは画像強度の二次元ビットアレイ、保持時間ピーク長さ閾値、保持時間ギャップ長さ、および質量／電荷ギャップ長さを含む。この篩い分けフィルタ処理操作は画像強度の篩い分けされた二次元ビットアレイを作り出す。さらに特定すると、この篩い分けフィルタ処理操作の工程は保持時間方向および質量／荷電方向のギャップの除去を含む。本操作は４つの保持格子段階に等しい保持ギャップ長さおよび２つの質量／荷電格子段階に等しい質量／荷電ギャップ長さに基づいている。この除去は標準的な形態学的拡張フィルタによって実行される。ギャップの除去の後、保持時間ピーク長さ閾値よりも大きい保持時間長さを備えた質量／荷電ストライプを（例えば強度をゼロに設定することによって）除去するために新たな画像が保持時間方向でフィルタにかけられる。
【０１２７】
図５Ｂ−５Ｕに例示された方法工程はピーク特徴抽出のための合成画像を形成することにもやはり役立つ。特徴抽出のための一例の方法は画像調整の後に実行される。図５Ｖ−５Ｚ、５Ａ−２−５Ａ−２１参照。本方法は最初に各々の処理群の中の（利用可能であれば）複製を、複製全体にわたって画素強度を平均することによって組み合わせる。各々の処理群の組合せ画像は個々の複製の画像内の比よりも高い信号対ノイズ比を有する。次いで、本方法はすべての処理群からの組合せ画像を、各々の画素位置ですべての組合せ画像の中の最大強度を取り入れるなどといった様々な適切な技法によって１つの合成画像へと融合させる。
【０１２８】
これらの処理状態のうちのいずれか１つに生物学的特徴が存在する限り、これらのピークが合成画像内に現れると思われる。ピークはバックグラウンドノイズパラメータよりも上の強度、例えば特定の場所における平均値、中央値、最大値、最小値、または標準偏差などを有する関連画素を観察することによって見つけ出されることが可能である。合成画像から抽出されたピークは組合せ前のすべての個別画像内のすべてのピークに整合するはずである。合成画像から抽出されたピーク輪郭境界は、いくつかの実施形態では、個々のＬＣ／ＭＳ運転の各々の画像内のピーク発現強度（表面の下の体積）を推定するために使用されることが可能である。このようにして、本発明の様々な実施形態は最初に画像整合、２番目にピーク抽出を実行する。
【０１２９】
本発明の様々な実施形態において、実験条件が現行の実験と新たな実験との間で同様であるとき、両方の実験におけるすべてのＬＣ／ＭＳ画像が一体に組み合わされ、調整させられ、特徴抽出のための１つの合成画像を形成することが可能である。前に識別された同位体群を新たな合成画像内で見つけ出すことは困難ではないはずなので、いくつかの実施形態では本方法は事前に利用可能なペプチド情報を使用して新たな実験に注釈を付ける。残り分のピークは前の実験で注釈を付けられなかったピークである。
【０１３０】
本発明の様々な実施形態がＬＣ／ＭＳピークおよびピーク−同位体群特性に関するパラメトリックモデルを含む。合成画像から抽出されたピークはまだノイズであることもあり得る。画像内に示される実験アーチファクトはピーク特徴として抽出されることもやはり可能である。本発明の様々な実施形態は、これらのピークがどの程度現実のピークであってアーチファクトまたはノイズから形成されたピークではないように見えるかに基づく点数が割り当てられることができるようにこれらのピークを特徴付けるための方法を可能にする。ピークの特徴付けおよび採点法は後の様々な解析における偽の陽性をフィルタで除去することに役立つ。
【０１３１】
本発明の様々な実施形態によってピークの特徴付けに関して少なくとも２つのパラメトリックモデルが利用可能にされる。第１は修正マクスウェル分布関数などの適切な分布関数または溶出の物理的特性を述べるいずれかの他の適切な関数を使用する理想的なＬＣ保持時間ピークに関するクロマトグラムモデルである。ピークの特徴付けの間、モデルのパラメータは合成画像から抽出されたピークに整合するモデルを見つけ出すように最適化される。時間ピークの点数はこの整合がどの程度優れているか判定する。完全な整合については点数は１である。ピークがノイズを含むかまたはアーチファクトであるとき、点数はゼロに向かって減少する。第２のモデルは、ガウス分布関数などの適切な分布関数または質量連続体分解能特性を述べるいずれかの他の適切な関数を使用するＭＳ連続体の中のｍ／ｚピークのためのものである。ｍ／ｚピークの点数はｍ／ｚ方向でピークの品質を特徴付ける。ｍ／ｚピークが汚染されておらず、かつ良好に画定されているときに点数は１に近い。抽出されたピークが汚染されているかまたは２つの重なり合うピークの組合せであるとき、ｍ／ｚピークの点数は落ちる。
【０１３２】
同位体群の優秀性を採点するためにいくつかの他のパラメータが利用可能である。（１）平均の時間ピーク点数は同位体群内のすべてのピークの時間ピーク点数の平均である。（２）平均のｍ／ｚピーク点数は同位体群内のすべてのピークのｍ／ｚピークの点数の平均である。（３）時間ピーク調整不良点数は同位体群内のＰＣ時間ピークの重心の、平均重心からの相対的偏差を判定する。すべてのピークが同じ保持時間に中心を置く優れた同位体群はゼロに近い点数を与える。（４）ｍ／ｚ分布点数は同位体群内の測定されたＭＳスペクトルの同位体ピーク強度分布がどの程度理論的同位体強度分布に整合するか判定する。良好に整合した同位体群は１に近い点数を有する。整合の乏しい同位体群はゼロに近い点数を有する。（５）ｍ／ｚ分布点数に関するｐ値はｍ／ｚ分布点数がどの程度信頼できるか信用の測定値を提供する。同位体群内で検出された同位体ピークの数が２または３などと極端に小さいとき、たとえ整合が完全であると見えても偶然の機会による整合の確率が高い。このケースでは、ｐ値は１に近い。見つけ出された整合が偶然の事象でありそうにないとき、ｐ値は小さく、ゼロに近い。
【０１３３】
図５Ｖ−５Ｚ、５Ａ−２−５Ａ−２１に例示された方法工程は重なり合うピークを検出して分割する。初期のピーク抽出の期間中、不可避的にいくつかの重なり合うピークが誤って１つの大きいピークとして検出されることもあり得る。これらの重なり合うピークは様々な実施形態において検出されて分割されなければならない。一例の画像処理パイプラインは時間方向とｍ／ｚ方向で別々に重なり合うピークを検出して分割する。各々の方向で、他のピークの全体的な幅の分布と比べて異常に広い幅を有するピークが検出される。次いで、可能であればこれらの広いピークが分割される。検出と分割のための方法工程は、分割可能なピークが分割されることを確実にするために数回繰り返される。分割後、本方法工程は再びピークをチェックし、いくつかの長期持続ピークの保持時間の長いテールを削除する。
【０１３４】
重なった幅広のピークを検出するために、一実施形態では、すべてのピークについてピーク幅の分布（ヒストグラム）が計算される。ピーク幅を規定するための多くの適切な方式がある。１つの適切な方式はピーク重心幅を使用することであり、これは一実施形態ではピークの各時間点と重心との間の強度で加重された差異の二乗の平方根の４倍として規定される。重なり合ったピークを分割するために役立つように統計モデルに基づく手法が展開される。いくつかの実施形態において、各々のピークはガウス関数でモデル化される。重なり合ったピークは複数の混ざり合ったガウス形状のピークを含む。多数ガウスモデルの最良適合を見つけ出すために測定ピークに最適化処理が適用される。すべてのピークが完全に重なり合って分割不可能であるケースについては帰無仮説が構築される。仮説検定のｐ値は帰無仮説が真である可能性を判定する。ｐ値が小さいとき、本方法は帰無仮説を拒絶する。言い換えると、ピークは分割可能である。ｐ値の閾値を望ましいレベルに設定することによって、重なり合ったピークを正しく識別する信用性が選択的に管理されることが可能である。この統計学的手法は根拠のない法則とカットオフに基づく重複検出方法よりもはるかに客観的で強固である。最適化された多数ガウスモデルは分割の方法を規定するために使用されることもやはり可能である。２ピークモデルの例では、重複の位置および各個別ピークからの重複ピークへの強度寄与を判定することを２つのガウス関数が可能にする。この情報でもって、２つのピークを重複の位置で分割すること、または測定された合計強度（曲線の下の面積または表面の下の体積）の中の各ピークの強度画分を２つのモデル化されたピークの下の面積の比に基づいて計算することが可能である。
【０１３５】
図５Ｖ−５Ｚ、５Ａ−２−５Ａ−２１に例示された方法工程は荷電状態、同位体群の識別、および荷電群を推定するための統計学的パターン認識手法を提供する。本方法工程はピークを同位体群に関連付けるための統計学的パターン認識手法を提供する。本方法では任意の時間およびｍ／ｚ範囲の閾値を使用する必要はない。様々な実施形態においてユーザは受容可能な感度および特異性確率を規定する。これらの確率閾値は任意である必要がない。いくつかの実施形態ではこれらはユーザのリスク許容度に基づいている。一実施形態によると、最初に本方法工程は、検出されたピークをピーク強度、時間ピークの点数、およびｍ／ｚピークの点数の順で下に進むようにランク付けする。同位体群識別はランク表の初めにある高度に発現されて最良に見えるピークから開始される。同位体群が識別されると次いで、この同位体群に属するすべてのピークがランク表から除外される。次いで、本方法工程は一覧表を下に進み、一覧表に残っている次の最良ピークに取り組む。
【０１３６】
図５Ｖ−５Ｚ、５Ａ−２−５Ａ−２１に例示された方法工程の中のピーク関連付け処理は同位体の荷電状態の推定によって決まる。本発明の様々な実施形態において、荷電の推定方法は複雑な試料から入来するデータと同等のデータと連携する。本方法工程は、一実施形態では、ランク表の最上位から由来する主ピークの保持時間重心付近の個別連続体の加重された和によって最初にＭＳ連続体を構築する。加重は重心から遠く離れたものよりも重心付近の保持時間を有する連続体に関してさらに大きい。この加重された平均化方法は信号対ノイズ比を増大させ、隣り合う同位体群からのピークの影響を減少させる。次いで多様な荷電状態における理想モデルが作成される。各々のモデルは加重された総和の連続体に整合させられ、本方法工程は最良整合を有する１つを見つけ出す。最良整合したモデルの荷電状態は、１つまたは複数の同位体群を見つけ出すために本方法工程がピーク関連付けに適用する荷電である。
【０１３７】
所定の最上位ランクのピークとその荷電状態に関して、本方法工程は同じ同位体群に属する同位体ピークを検索する。これらの同位体ピークは最上位ランクのピークよりも低いかまたは高いｍ／ｚを有していてもよい。各々の見込まれる同位体に関して、本方法工程は検出されたピークを理論的モデルと比較する。本方法工程は検出されたピークがモデルと完全に整合する帰無仮説を構築する。本方法工程は予期される同位体として検出されたピークが受容され得るかまたは拒絶されるか判断するためにｍ／ｚ方向と保持時間方向の両方で仮説検定のｐ値を使用する。検出感度を制御するために受容ｐ値（例えば＞０．６）が使用されてもよく、検出特異性を制御するために拒絶ｐ値（例えば＜０．１）が使用されてもよい。中間のｐ値について、いくつかの他の同位体群が検出されたピークを受容同位体または重複同位体として主張するかどうか調べるために監視項目リストが維持される。一実施形態では、本方法工程は２つの同位体群のｐ値が受容レベルよりも低く、かつ拒絶レベルよりも高いときに１つのピークが両方の同位体群によって権利主張されることを許容する。ｐ値の閾値を適切に設定することによってユーザは検出の感度と特異性においてリスク許容度を制御することが可能である。目標検出の感度および特異性の受容判定基準は多様なｍ／ｚ、発現の潤沢度、信号対ノイズ状態において一貫性を維持する。さらに、検出されたピーク強度と整合させるための所定の質量および荷電の理論的同位体強度分布の使用は計算を促進する。
【０１３８】
前に検討したように、ＬＣ／ＭＳデータ解析に関する誤差モデルが供給される。ＬＣ／ＭＳ強度測定はノイズに対応しなければならないと見込まれる。一例の画像処理パイプラインにおける誤差モデルは画素強度測定におけるノイズを特定する。一実施形態ではＬＣ／ＭＳの誤差モデルは３つの誤差成分すなわち付加誤差、ポアソン誤差、および分数誤差を有する。この誤差モデルは画素強度測定に関して強度誤差推定を提供する。方法工程５Ａ−２２は画素強度の誤差をピークレベルおよび同位体群レベルに適切に広めることによってピーク強度（ピークの中の画素強度の和）および同位体群強度の誤差を推定する。この誤差モデルは複製の数が小さいときに解析時の偽の陽性を減少させることに役立つ。強度変換方法に基づく誤差モデルもやはり発現の差異に関するＡＮＯＶＡまたは他の統計的検定中に強度分散を安定させるために使用されることが可能である。
【０１３９】
さらに特定すると、モデル化された誤差の分散は
【数８】

として推定され、式中ｉおよびｊは保持時間および質量／荷電方向全体にわたって繰り返し、Ｉは強度測定値である。分散は強度依存性分散のテイラー級数展開として見られることが可能である。機器依存性のパラメータであるポアソン（ＰＯＩＳＳＯＮ）および分数（ＦＲＡＣＴＩＯＮ）は誤差モデル展開中の特定の質量分析計などといった所定の機器技法タイプについて推定される。技法が不変であり続ける限りこれらは一定である。ポアソンノイズと分数ノイズは異なる機器においてわずかに異なることもあり得るが、これらは普通では機器の所定の一部について経時的に安定している。付加成分をモデル化するための多数の見込まれる方法がある。これまでおよびこれ以降に述べられるような特徴抽出処理は画像特徴を取り囲む画素に基づくいくつかのバックグラウンド推定を提供する。どのようなバックグラウンド測定法が使用されるかに関係なく、所定の特徴に関していくつかの実施形態は上記の誤差モデルの付加項をモデル化するために１つのスポットよりもはるかに大きい周囲領域からの平均化された情報を使用する。誤差モデルを展開するとき、ポアソン（ＰＯＩＳＳＯＮ）と分数（ＦＲＡＣＴＩＯＮ）のパラメータに関する値が推定される。
【０１４０】
これまでの検討は図５Ａ−１−５Ａ−２２に例示された方法工程を概して述べている。これ以降の検討はこれらの方法工程をさらに詳しくさらに記述する。要約すると、本方法は形態学的フィルタを適用し、かつバックグラウンドノイズを推定し；複製を組合せ；組み合わされてかつフィルタにかけられた複数画像を融合させることで１つの合成画像を形成し；画像特徴をラベリングし；重なり合ったピークを分割し；特徴パラメータを計算し；同位体ピークをグループ化し；同位体群を集合させ；ピーク統計値を計算し；荷電群統計値を計算し；差分解析または非差分解析などのピークレベル解析を実行し；差分解析または非差分解析などの同位体群レベル解析を実行し；差分解析または非差分解析などの荷電群レベル解析を実行する。
【０１４１】
図５Ｄ−５ＲはＬＣ／ＭＳ画像を調整させるための方法工程を例示している。図５Ｄはマスター画像を決定するための方法工程を例示している。実験において複製を表わすすべての他の画像を調整させるためにマスターまたは基準の画像が使用される。補間された基準ピーク強度データの最も高い標準偏差を備えた画像がマスターとして使用される。
【０１４２】
図５Ｅ−５Ｒは複製を表わす画像を調整させるための方法工程を例示している。複製を表わす通常の画像（複製画像）は約４０から７０分の保持時間を有する。普通、常にではないが複製画像は時間方向で非線形の様式でマスター画像と整合していない。この問題に対処するために、本方法は１．５分などといった適切な時間間隔で調整変位値を計算する。変位値が決定されるとき、不整合の問題を補正するために（適切な質量／荷電範囲に関して）所定の保持時間の点が変位させられる。さらに特定すると、これらの変位値はいくつかの実施形態では、複製画像内の各時間点について変位値を指示するスプライン関数または区分線形関数などの補間関数を作り出すための基準点として使用される。様々な実施形態において、複製画像またはターゲット画像は１．５分×２０質量／荷電レベルなどといった適切な部分領域へと論理的に分割される。部分領域のサイズはＬＣ／ＭＳデータの密度に基づいて変わることがあり得る。いくつかの実施形態では、ターゲット画像は縦列内で６０−８０の部分領域を有する。変位値は単一の時間間隔の中で変化するであろうが、変位値の冗長測定は本方法が時間間隔の各縦列について最良の変位値を選択することを可能にする。精度を高めるために、様々な実施形態において本方法は、限定はされないが各部分領域またはセルについて２つの測定技法を使用する。これは本方法が両方の技法に関して各時間間隔について最終の変位値を決定することを可能にするが、すべての技法が数倍のδの中で一致しない場合に本方法がこの時間間隔について変位値全体を破棄することもやはり可能にする。ターゲット画像の各々の部分領域に関する実際の変位値は測定技法によって計算された最終の変位値を平均することによって決定される。
【０１４３】
セル毎の変位値を実際に決定するために、複製の部分領域がさらに大きいマスターの部分領域全域にわたって変位させられる。いくつかの実施形態では、変位段階毎の適切な画素数（ｎ数）が例えば１画素変位させられる。各々の変位段階で、２つの段階変位値が様々な実施形態において計算される。これらの段階変位値はターゲット画像が下地のマスター画像にどの程度良好に整合するかを表わす段階変位のアレイの中に置かれる。各々の段階変位値が多様な測定技法から計算される。これらの段階変位値は現在の段階がどの程度良好に調整させられるかを定量化する。段階相関値を計算するためにいずれの数の技法が使用されることもあり得るが、本方法は相関係数技法および重なり適合値技法を使用する。
【０１４４】
相関係数技法に関すると、本方法は最初に強度がゼロよりも大きい部分領域について最小ターゲット強度値を見つけ出す。次に、部分領域内のすべてのターゲット画素がその強度から引き算される最小値を有する。同じことがマスターの部分領域について繰り返される。次に、部分領域内の点すべてが反復される。データ全体にわたるこの反復の間に、ターゲットの画素強度がゼロよりも大きいかまたはマスターの画素強度がゼロよりも大きければ、値のうちの一方がゼロである場合を除いて両方の強度値に常用対数が適用され、一方がゼロであるケースでは常用対数を適用せずに単純にゼロが使用される。マスターとターゲットの常用対数の強度値は対応するマスターおよびターゲットのアレイに加えられる。これら２つのアレイから相関係数が計算される。常用対数の強度は高強度と低強度の画素の両方が段階変位値に影響を有することを可能にするために使用される。
【０１４５】
他方の測定技法は重なり適合値技法と呼ばれ、以下の数学的処理、すなわち、−（ゼロマスター非ゼロ複製カウント＋ゼロ複製非ゼロマスターカウント）に基づいており、ここでゼロマスター非ゼロ複製カウントおよびゼロ複製非ゼロマスターカウントはカウンタである。重なり適合値技法を実行する過程において、本方法はターゲットとマスターの部分領域の間の重なりの量を観察する。いくつかの実施形態では計算に強度値が使用されず、重なり適合値に対する同じ影響を画像の極端に低い強度部分および画像の極端に高い強度部分に与える。２つの部分領域が調整状態にあるとき、重なり適合値はゼロに近付くはずであり、非ゼロ強度を有するターゲット内のすべての画素について対応する非ゼロ強度の画素がマスター内にあることを示す。最良の重なり適合値を判定するためにこの技法は重なりのさらに全体的な光景を重視した。最良整合がこの技法のための重なり適合値の収集体の中の最も高い値になるように負記号が上記の式の係数に入れられる。
【０１４６】
測定値の２つのアレイが２つの技法を実行する過程において作り出される（一方のアレイは相関係数を記述し、他方のアレイは重なり適合値を記述する）。次いでこれらのアレイが最も高いピークを見つけ出すための方法によって検索され、最も高いピークの最大におけるターゲットとマスターの部分領域間の最良相関を示す。測定値のアレイは（いくつかの実施形態では３点を使用して得られるが他の実施形態では他の適切な数の点が使用されることもあり得る）適用される実行手段を有する。本方法は調整値のこれらのアレイの各々について最も高いピークを見つけ出す。理想的なケースは最も正確な変位場所を示す単一の急勾配ピークを備えたグラフである。図２Ｅ参照。グラフのピークがピーク高さに基づいて下に進む順序で置かれて仕分けされるとき、以下の判定基準が満たされれば最大ピークが本方法によって使用されるであろう。第１に、ピークはいくつかの数の点を有さなければならない。いくつかの実施形態では１０点が検出されるが、しかし様々な実施形態において外れ値の拒絶がどの程度活発であるかに応じていずれの数であることもあり得る。外れ値は関心対象のものではない特徴である。さらに特定すると、ピークを作る２つの変曲点の間の点の数は１０以上でなければならない。第２に、２番目に高いピークが最も高いピークのいくらかの百分率、例えば４５％よりも高くてはならないが、しかしこの百分率は縦列毎にいくつの複製の部分領域が使用されるか、および外れ値の拒絶がどの程度活発であるかに応じて変わることがあり得る。多数の小さい複製の部分領域を伴うと、おそらく高い数の冗長相関値が理由で本方法は外れ値の拒絶にさらに積極的になることが見込まれる。さらに少なくて大きい複製の部分領域を伴うと、積極的な外れ値の拒絶は過度に多くのデータを退けかねない。
【０１４７】
各々のターゲットの部分領域について変位値が決定されたとき、複数の技法を使用して各々の技法に関する変位値のすべてが調べられることで技法毎の最終の縦列の変位値を決定する。各々の技法はいくつかの実施形態では独立して取り扱われる。単一の技法に関する時間間隔縦列内の変位値のすべてが０．２０などといった適切な瓶サイズを使用してヒストグラムの中に瓶処理されるが、しかし瓶サイズは調整がどの程度正確である必要があるかに応じて変わることがあり得る。大きい瓶サイズは時間間隔に関して実行できる変位値を見つけ出す機会を増大させるであろうが、しかし最終の変位値の正確さを下げるであろう。技法に関していったん変位値がヒストグラム内に入れられると、ヒストグラムはこのヒストグラムの各々の瓶に属する構成要素の数に基づいて下に進む順序で仕分けされる。次いでこの技法について最終の変位値を決定するために最も高い瓶内の値のすべてが平均される。最終の変位値を決定するために以下の判定基準が様々な実施形態において本方法によって使用される。最多構成要素を備えた瓶はいくつかの実施形態では少なくとも４つの構成要素を有さなければならないが、しかしこの数は外れ値の拒絶がどの程度活発である必要があるかに応じて異なることがあり得る。２番目に多い構成要素を備えた瓶が最大瓶の構成要素数の９０％以内を有する場合、最終の変位値を作り出すために両方の瓶の構成要素が平均される。
【０１４８】
時間間隔縦列についていくつかの最終変位値が計算された後、（異なる測定技法を使用して）最終の変位値が以下の判定基準に基づいて単一の変位値へと組み合わされる。すべての技法に関する変位値は様々な実施形態において０．１５分などといった互いのいくらかの適切な時間の中になければならないが、これは調整がどの程度正確である必要があるかに基づいて異なることがあり得る。時間間隔毎の最終の変位値を作り出すためにこれらの技法から得られる変位値が一緒に平均される。次いでこれらの個々の変位値は各々の保持時間に関して正確な保持時間変位値を補間するための基準点として使用される。
【０１４９】
図５Ｔ−５Ｚ、５Ａ−２−５Ａ−２１における本方法の１つの目的は合成画像から画像特徴を抽出することである。図５Ｔにおいて本方法は特徴抽出を容易にするために合成画像全体にわたって（複数の格子横列と格子縦列を備えた）格子を重ね合わせるための工程を検討している。格子の線は等間隔であるが、しかし本方法はこれに制約される必要はない。この格子は特徴が格子横列、格子縦列、または格子セル内に区分されることを可能にする。この格子は計算に使用されることが可能ないくつかのパラメータを有する。例えば、「質量／荷電ピーク幅中央値」格子パラメータはその特徴がピーク強度中央値よりも大きい特徴のピーク強度を有する格子横列内のすべての特徴の質量／荷電重心幅の中央値である。
【０１５０】
本方法は図５Ｕにおいて特徴の境界および特徴のパラメータを計算するための工程を検討している。多数の適切なパラメータが計算されることができる。特徴の体積は特徴
【数９】

のすべての強度の和として規定される。ｘ_ｉ，ｊがピークに関するｉ番目の質量／荷電値とｊ番目の時間点を表わすとすると、質量／荷電強度は特定の質量／荷電値
【数１０】

に関する強度の和であり、保持時間強度は保持時間値
【数１１】

に関する強度の和である。「特徴の強度平方和」パラメータは特徴
【数１２】

の強度平方和である。「特徴画素」パラメータはゼロよりも大きい強度を備えたデータ点の数である。「特徴の質量／荷電基本出発点」パラメータは、存在するとすれば、特徴の最初の質量／荷電値に先行する質量／荷電値であり、そうでない場合、特徴の最初の質量／荷電値である。「特徴の質量／荷電基本終点」パラメータは、存在するとすれば、特徴の最後の質量／荷電値の後の質量／荷電値であり、そうでない場合、特徴の最後の質量／荷電値である。「特徴の質量／荷電ピーク強度」パラメータは最大の質量／荷電強度
【数１３】

である。「特徴の質量／荷電重心」パラメータは特徴に関する質量／荷電値の重心であって質量／荷電強度によって加重された重心である。この重心は
【数１４】

として規定され、式中、ｗは保持時間または質量／荷電のベクトルであり、ｘは強度加重のベクトルである。「特徴の質量／荷電重心幅」パラメータは特徴に関する質量／荷電値の重心幅であって質量／荷電強度によって加重された重心幅として規定される。「重心幅」はいくつかの実施形態では標準偏差重心の４倍として規定され、これは
【数１５】

として規定され、式中、ｃは重心であり、ｗは保持時間または質量／荷電のベクトルであり、ｘは強度加重のベクトルである。「特徴の質量／荷電重心歪み」パラメータは特徴に関する質量／荷電値の重心歪みであって質量／荷電強度によって加重された重心歪みである。この重心歪みは
【数１６】

として規定され、式中、ｃは重心であり、ｗは保持時間または質量／荷電のベクトルであり、ｘは強度加重のベクトルである。「特徴の質量／荷電ピーク」パラメータは最大の質量／荷電強度を有する質量／荷電値であり、同じ最大質量／荷電強度を有する複数の質量／荷電値がある場合、本方法は様々な実施形態において中央のインデックスによって識別される中央の質量／荷電値を選択し、中央のインデックスは丸め処理によって計算され、例えば質量／荷電値がインデックスｎ１，ｎ２，．．．，ｎｋによってインデックスを付けられる場合、ピークの質量／荷電値はｎｋ／２によってインデックスを付けられた値であり、ｋ／２は次の整数へと丸められる。「特徴の時間ピーク」パラメータは最大の時間強度を有する時間値である。「特徴の時間重心」パラメータは特徴に関する保持時間値の重心であって保持時間強度によって加重された重心である。「特徴の時間重心幅」パラメータは特徴に関する保持時間値の重心幅であって保持時間強度によって加重された重心幅である。「特徴の時間重心歪み」パラメータは特徴に関する保持時間値の重心歪みであって保持時間強度によって加重された重心歪みである。「特徴の時間基本出発点」パラメータは、存在するとすれば、特徴の最初の時間点に先行する時間点であり、そうでない場合、特徴の最初の時間点である。「特徴の時間基本終点」パラメータは、存在するとすれば、特徴の最後の時間点の後の時間点であり、そうでない場合、特徴の最後の時間点である。「特徴の時間ピーク強度」パラメータは最大の保持時間強度である。
【０１５１】
本方法は図５Ｖにおいて、ある値範囲よりも上の非ゼロなどの関連した画素のアイランドを探すことによってピーク、特徴のタイプを抽出するための工程を検討している。画像の特徴は関心対象のものであることが見込まれるペプチドなどの生物学的特徴に相当し、これは合成画像内のピークとして現れる。画像特徴はもう１つの強度がピークを形成する質量／荷電次元と保持時間次元の二次元空間の領域である。各々の画像特徴が質量／荷電と保持時間座標内で特徴を完全に取り囲む最小の矩形を含む境界を有する。
【０１５２】
本方法は図５Ｗ−５Ｚ、５Ａ−２−５Ａ−８において、複数の特徴（例えば複数のピーク）を表わす特徴を見つけ出すための工程を検討しており、これらを別々の特徴に分割する。総括すると、いくつかの実施形態では、複数の特徴が質量／荷電方向または保持時間方向で重なり合っている場合にこれらが分割される。いったん特徴が重なり合っていると判定されると、２つの手順のうちの１つを使用してこれが分割される。ピークと中間の谷との間に十分に大きい差がある場合（高コントラストの特徴）、どのようなモデル適合の必要も伴わずに谷で分割が為される。そうでない場合、２ピークのガウスモデルを幅広の特徴に適合させることによって谷がさらに正確に判定される。さらに特定すると、最初に高コントラストの幅広の特徴が分割される。分割は質量／荷電および保持時間方向で交互に、３回などといったいくつかの繰り返しで為される。言い換えると、以下の工程、すなわち質量／荷電で重なり合った特徴を見つけ出して高コントラストのものを分割する工程、および保持時間で重なり合った特徴を見つけ出して高コントラストのものを分割する工程が複数回繰り返される。その後、低コントラストの重なり合った特徴が分割される。前のように、分割は質量／荷電および保持時間方向で交互に、３回などといったいくつかの繰り返しで為される。特徴が分割またはトリミングされるときは常に、特徴の境界および他の特徴パラメータがいくつかの実施形態において再計算される。様々な実施形態において、質量／荷電中央値および保持時間の幅と偏差がいずれの分割にも先行して特徴に対して計算される。
【０１５３】
図５Ｗ−５Ｙは質量／荷電方向で重なり合ったピークを見つけ出すための方法工程を例示している。本方法は同じ質量／荷電格子横列の中の平均的な特徴に比べて質量／荷電方向で異常に幅広である特徴を以下のように見つけ出す。本方法は高い格子横列特長を、ピーク強度中央値よりも大きいピーク強度を有する所定の格子横列内の特徴のサブセットであると規定する。すべての特徴の中でピーク強度中央値が計算される。質量／荷電幅中央値ｗは高い格子横列特徴の質量／荷電幅の中央値である。質量／荷電幅中央値の標準偏差はｓ_ｗ＝１．４８３＊ｍｅｄｉａｎ（｜ｗ_ｉ−ｗ｜）として計算される。本方法は、質量／荷電幅の重心ｗ_ｉが定数と（ｗ＋ｓ_ｗ）の積以上であれば特徴を重なり合った質量／荷電特徴として印を付け、ここでこの定数はいくつかの実施形態では２に設定される。
【０１５４】
図５Ｙ、５Ａ−３−５Ａ−５は保持時間方向で重なり合ったピークを見つけ出すための方法工程を例示している。本方法は高い特徴を、ピーク強度中央値よりも大きいピーク強度を有するすべての特徴のサブセットであると規定する。すべての特徴の中でピーク強度中央値が計算される。保持時間幅の中央値ｗはすべての高い特徴の時間幅の中央値である。保持時間幅中央値の標準偏差はｓ_ｗ＝１．４８３^＊ｍｅｄｉａｎ（｜ｗ_ｉ−ｗ｜）として計算される。本方法は、保持時間幅の重心ｗ_ｉが定数と（ｗ＋ｓ_ｗ）の積以上であれば特徴を重なり合った保持時間特徴として印を付け、ここでこの定数は様々な実施形態において５に設定される。
【０１５５】
図５Ｚ、５Ａ−２−５Ａ−３は重なり合ったピークの高コントラスト分割を実行するための方法工程を例示しており、所望通りに繰り返されることが可能である。本方法工程は質量／荷電方向で重なり合ったピークかまたは保持時間方向で重なり合ったピークを分割するために再使用可能である。重なり合ったピークとそれらの谷は値の配列ｘ１，ｘ２，．．．，ｘｎによって記述され、これらはグラフ上に提示可能である。高コントラスト分割はこの配列を対応するグラフの最も低い谷で２つの断片に分割することを試みる。配列が少なくとも４つの点を有していれば、高コントラスト分割を実施するための図５Ｚ、５Ａ−２−５Ａ−３に例示された方法工程が実行される。本方法はＭを配列の最大値であると規定する。次いで本方法は２つの直ぐ隣りよりも低い値を備えた点である落ち込みを見つけ出す。落ち込みのうちの１つがコントラストレベルを表わす定数と配列の最大値Ｍから形成される積よりも小さい値を有すれば、本方法は高コントラスト分割が実行されることが可能な高コントラスト配列を見つけ出している。この定数はいずれの適切なレベルに設定されてもよく、１つの適切なレベルは０．１である。本方法は、ピーク振幅が標準偏差と配列の最大値Ｍの積よりも小さい特徴の点のすべての関連したセットを見つけ出す。点のセットは、これが隣り合う要素で構成されれば関連付けられる。言い換えると、ある整数ａ、ｂについてａがｋ以下であってかつｋがｂ以下である場合のすべての点ｘ_ｋである。いくつかの実施形態では本方法は特徴のエッジ（例えばａが１またはｂがｎである場合）にあるセットを無視する。点の各々のそのようなセットについて、本方法はその中の最小落ち込みを見つけ出す。複数の最小があれば、本方法は様々な実施形態において最初のものを選択する。最小落ち込みの点が分割点になる。
【０１５６】
図５Ｙ、５Ａ−６−５Ａ−８は重なり合ったピークの低コントラスト分割を実行するための方法工程を例示しており、所望通りに繰り返されることが可能である。本方法は２ピークのガウスモデルを特徴に適合させるために最小二乗法非線形適合を使用する。次いで本方法は分割するための点を選択する。本方法はモデルのパラメータの初期推定である多様な入力パラメータを除いて質量／荷電方向かまたは保持時間方向のどちらかで再使用可能である。数学的に、２ピーク強度モデルは２つの単一ピークのガウスモデルの加算で構成され、これらが同じ偏差
【数１７】

を共有し、式中、Ｙ_１、Ｙ_２は２つの重なり合ったピーク振幅であり、ｃ_１、ｃ_２はピーク中心であり、ｗは共有する幅である。図２Ｅは様々なパラメータに関して２ピークモデルが上記の数学的処理から図式的にどのように見え得るかを例示している。２つのピーク中心（ｃ_１、ｃ_２）および共有する幅が与えられると、すべてのピークが完全に重なり合って分割不可能である場所の推測を検定するためにｐ値が以下、すなわち
【数１８】

のように計算されることが可能である。
【０１５７】
本方法はモデルのパラメータについて初期推定のピーク中心（ｃ_１，ｃ_２）とピーク振幅（Ｙ_１，Ｙ_２）、および幅ｗを選択する。この選択は質量／荷電方向および保持時間方向に関して異なることがあり得る。本方法はパラメータであるピーク中心（ｃ_１，ｃ_２）およびピーク振幅（Ｙ_１，Ｙ_２）を選択するために最小二乗法非線形適合を使用する。次いで本方法は谷の点を、２つのガウスモデルが同じ振幅を有する２つの中心の間の点として規定する。谷に最も近いデータポイントが最初の２つまたは最後の２つのデータポイントのうちの１つである場合、またはｐ値が０．１などといったある閾値よりも上である場合に本方法は分割を放棄する。本方法が重なり合ったピークを分割するとき、本方法はいくつかの実施形態において谷の点を最少の点を有する特徴の位置に置く。
【０１５８】
質量／荷電方向での低コントラスト分割に関すると、本方法は２ピークのガウスモデルに関して初期パラメータを以下のように推定する。本方法は質量／荷電方向でピークを見つけ出す。言い換えると、本方法は値が点ｘ_ｋ−１およびｘ_ｋ＋１よりも大きい点ｘ_ｋを見つけ出す。２ピークよりも少なければ、本方法は様々な実施形態において重なり合ったピークを分割することを控える。そうでない場合、本方法は２つの最も高いピークを使用して重なり合ったピークを分割する。初期パラメータに関すると、本方法はいくつかの実施形態において２つのピークの位置および強度を使用する。両方のガウスモデルの標準偏差ｗに関すると、本方法は様々な実施形態において１．５などといった定数と商（４などといった別の定数で割り算された質量／荷電中央値）の積を使用する。
【０１５９】
保持時間方向の低コントラスト分割に関すると、たとえ単一ピークの時間強度モデルが必ずしもガウス関数でなくても本方法は上記で示されたように２ピークのガウスモデルをやはり使用する。本方法はスライドするｋ時間点の窓サイズを使用してピークと落ち込みを見つけ出し、ここでｋは奇数である。ｋで表わされるようなスライドする窓のサイズはいくつかの実施形態では積（３ｍ）と積（２ｄ）の商であり、ここでｍはすべての特徴の時間幅中央値であり、ｄは測定と測定の間の時間間隔である。本方法は様々な実施形態においてｋを最も近い整数に丸める。ｋが偶数であれば、本方法はこれを奇数にするためにｋを１でインクリメントする。
【０１６０】
本方法はこのスライドする窓を連続的なｋ点の配列すべてに適用する。窓の中心が窓に関して最小値または最大値であれば、本方法はそれに応じて落ち込みまたはピークとしてこれに印を付ける。２つ以上のピークがある場合、本方法は２つの最も大きいピークを選択する。１つのピークと少なくとも１つの落ち込みがある場合、本方法はピークに対向する落ち込みの側で最大値を見つけ出すことによって第２のピークをシミュレートする。これが不可能であれば、本方法は重なり合ったピークを分割することを控える。初期パラメータに関すると、本方法はいくつかの実施形態において２つの選択されたピークの位置と強度を使用する。両方のガウスモデルの標準偏差に関すると、本方法は様々な実施形態において１．５などといった定数と商（４などといった別の定数で割り算された保持時間幅中央値）の積を使用する。
【０１６１】
重なり合ったピークが分割されると次いで、本方法は広過ぎるピークを保持時間方向で整えることを試みる。図５Ａ−８参照。本方法は最初に以下の条件、すなわち商（重心幅で割り算された時間範囲）が２などといった定数よりも大きいという条件を満たした時間ピークを見つけ出す。この条件が真であれば、本方法は広過ぎるピークを見つけ出したと見込まれる。本方法はこれらのピークの最小値と最大値の側を重心の中心から１つの重心幅に切り取るように進行する。
【０１６２】
図５Ａ−９−５Ａ−１０は上記で検討された方法工程において見つけ出されたピークを特徴付けるための方法工程を例示している。図５Ａ−９は保持時間方向でピークを特徴付けるための方法工程を例示している。「特徴のモデル化時間ピーク」パラメータはモデル化された時間強度が最大であるモデル軸値である。「特徴のモデル化時間重心幅」パラメータはモデル化時間強度で加重されたモデル軸値の重心の幅である。「特徴のモデル化時間ピーク強度」パラメータは時間強度モデルによって計算された強度の最大値である。保持時間方向の保持時間強度モデルは修正マクスウェル分布関数によってモデル化される。パラメータＹ（振幅）、ｔ_ｓ（変位）、ｗ（幅）、およびｄ（偏位）が与えられると、特徴に関する時間強度は以下、すなわち
【数１９】

のように数学的にモデル化される。ｘがｔ_ｓよりも小さい場合、本方法はｙをゼロに設定する。ｙがゼロよりも小さい場合、本方法はｙをゼロに設定する。定数ｄはゼロ以上であって１以下である。関数（ｙ＝ｘ^２ｅｘｐ（１−ｘ^２））はｘが１に等しいときに１の最大値を有し、それにより、ｘがｔ_ｓとｗの和と等価であるときに時間強度が最大になる。パラメータＹ、ｔ_ｓ、およびｗは最小二乗法非線形適合を使用して適合処理される。初期値は以下のようにして時間強度によって加重された時間の重心を使用して設定される。振幅Ｙは最大時間強度を（１−ｄ）の残差で割り算することから形成される商であると見なされる。幅ｗは残差（時間重心の中心を開始時間で引き算する）と他の残差（１−ｄ）の商であると見なされる。変位ｔ_ｓは（時間重心の中心を幅ｗで引き算する）残差であると見なされる。パラメータｄは、いくつかの実施形態では、最小二乗法適合を使用して適合処理されず、その初期値はこれ以降で特定されるようにモデル偏位である。
【０１６３】
本発明の様々な実施形態の方法によって計算されるモデル偏位はこれまでに検討された時間強度モデルに使用されるゼロと１との間の数である。様々な実施形態において、モデル偏位は特徴が以下のようにして分割されるとその後に最初に計算される。すなわち、本方法はｍとＭをすべての特徴の最小および最大のピーク強度の常用対数であるとそれぞれ規定する。本方法はＵをｍと、０．８などといった定数と残差（Ｍ−ｍ）の積の和である、言い換えるとＵ＝ｍ＋０．８（Ｍ−ｍ）であると規定する。本方法はＬをｍと、０．１などといった定数と残差（Ｍ−ｍ）の積の和である、言い換えるとＬ＝ｍ＋０．１（Ｍ−ｍ）であると規定する。本方法はさらにｐを特徴のピーク強度の常用対数であると規定する。本方法はｐを以下のようにしてＬとＵの中にあると固定する。すなわちｐがＵよりも大きければ本方法はｐをＵに等しいと設定する。そうでない場合、ｐがＬよりも小さければ本方法はｐをＬに等しいと設定する。特定の特徴に関するモデル偏位が、別の残差（Ｕ−Ｌ）で割り算された定数ｃと残差（Ｕ−ｐ）の積である（ｃ＊（Ｕ−ｐ）／（Ｕ−Ｌ））に設定される。この定数は０．８などといった適切な値であってもよい。いくつかの実施形態では、モデル偏位は最も近い０．１の倍数に丸められる。やはり様々な実施形態において、モデル偏位は保持時間ピーク点数を計算することによって調節されるが、これはこれ以降に述べられる。一実施形態では、偏位はゼロと初期偏位との間の最大値に設定され、妥当な点数を作り出す。他の実施形態では、偏位が他の値に設定されることもあり得る。
【０１６４】
保持時間ピークの点数は実際の保持時間強度と保持時間強度モデルによってモデル化された保持時間強度との間のピアソンの相関係数などの相関係数である。質量／荷電強度について為されるように、実際のデータが保持時間の各々の端部を越えた１つのデータポイントに広げられる。モデル偏位（時間強度モデルにおけるパラメータｄ）を調節するために保持時間ピークの点数計算が使用される。点数が規定されない場合、ｄは０．１などといった定数でデクリメントされ、点数が数字になるまで、またはｄがゼロに到達するまで計算が本発明の様々な実施形態の方法によって再度為される。ｎ対の点を使用して計算されるピアソン相関値ｒに関してピアソン相関のｐ値は
【数２０】

によって与えられる。本方法は以下の条件、すなわちｋは（ｎ−２）に等価であり、ｔは自由度ｋでｔ分布のように分布させられ、ｐは
【数２１】

として規定するものである場合、Ｉは不完全なベータ関数である。数学的処理は
【数２２】

に変形する。ピアソン相関の点数はｒと残差（１−ｐ）の積であり、ここでｒはピアソン相関であり、ｐは対応するｐ値である。１つのデータポイントのみがある場合、様々な実施形態において点数は本方法によってゼロに設定される。
【０１６５】
図Ａ−１０は質量／荷電方向でピークを特徴付けるための方法工程を例示している。ピーク振幅Ｙ、中心（ｃ）、および幅（ｗ）が与えられると、特徴に関する質量／荷電強度は以下の数学的処理、すなわち
【数２３】

でガウス関数としてモデル化される。中心ｃおよび標準偏差ｓは重心計算を通じて計算される。特徴の質量／荷電強度の点数がやはり本方法によって計算される。質量／荷電強度ピークおよび重心標準偏差が正であれば、ピークの点数はモデルの（延長された）質量／荷電軸を使用する、質量／荷電強度に関するデータとモデルとの間のピアソン相関の点数である。
【０１６６】
図５Ａ−１１−５Ａ−１６は、同位体ピークの集合である同位体群を見つけ出すための方法工程を例示している。同じ保持時間点に直ぐ近くの質量／荷電値を備えていくつかのピークがしばしば存在する。これは同位体によって引き起こされる。（生物学的特徴がペプチドであれば、同位体は異なる中性子数を備えた原子を有する同じペプチドの構成要素である。）本方法工程は図５Ａ−１１−５Ａ−１６において、いくつかの実施形態では一層大きくかつ最良の形状の特徴が１番目と考えられるように最初にすべての特徴を仕分けすることによって隣り合う同位体ピークの群を見つけ出す。次いで本方法は各々の特徴を順番に取り上げ、取り上げられた特徴が種特徴であり、種特徴で一団にされるべき他の特徴を見つけ出す。
【０１６７】
いくつかの実施形態では、本方法は少なくとも以下の３つのランク、すなわち一実施形態ではｒ_ｔ＝ピーク保持時間強度またはピーク画素強度などのピーク強度によるランク；ｒ_ｍ＝ピーク質量／荷電の点数によるランク；およびｒ_ｓ＝保持時間の点数によるランクを組み合わせることによってすべての特徴をランク付けする。本方法はｒ_ｓと、２などといった定数でｒ_ｔとｒ_ｍの和を割り算した商との和である組合せのランクｒを計算する。本方法はこのランクを反転し、それにより、様々な実施形態において、一層高い点数／強度を備えた特徴が１番目にリストアップされる。本方法はランク付けされた順番で特徴を処理する。言い換えると、最も大きい特徴が最初に調べられる。
【０１６８】
図５Ａ−１５はある特徴を破棄する代わりに、他の同位体群への後の分類のために該特徴を保持するための方法工程を例示している。特徴が同位体群の中にグループ化されるとき、これらは受容、拒絶、または保留状態に置くように分類される。同位体ピークを同位体群の中にグループ化するための方法の最後に、各々のピークは１つまたは複数の同位体群に属する。ピークが複数の同位体群に属する場合、このピークはさらなる解析のために保留状態に置かれる。そうでない場合、ピークは単一の同位体群に受け入れられる。ピークが同位体群内に保留状態で置かれるように分類され、かつ別の同位体群に受け入れられる場合、２番目の分類はやはり保留状態に置かれるように変えられる。これは種特徴にもやはり適用される。
【０１６９】
図５Ａ−１１−５Ａ−１６によって例示される方法工程は、様々な実施形態において、ピークの原初の強度の代わりに時間で加重された強度を使用する。点ｉ、ｊにおいて種特徴に相対して時間で加重された強度は数学的に
【数２４】

として規定され、式中、Ｉ_ｉｊは加重されていない強度であり、Ｔ_ｊは種特徴の時間強度（すなわちこの縦列に関する種特徴のすべての横列全体にわたる強度の和）である。いくつかの実施形態では、ある時間に始まって特定の時間に終わるようにインデックスｊが繰り返される。時間で加重された強度はいずれの質量／荷電の点（横列）についても規定されるが、開始特徴の境界の中にある時間点（縦列）についてのみ規定される。時間で加重された質量／荷電強度は種特徴の境界の中のすべての時間点全体にわたって時間で加重された強度の和である。
【０１７０】
いくつかの実施形態では、本方法は特徴の質量／荷電強度幅を同位体群の種特徴の格子横列内の特徴中央値とさらに一致するように調節する。この調節は以下のようにして為される。本方法は種特徴が属する格子時間点を見つけ出す。本方法はｗ_ｇを格子の質量／荷電重心幅の中央値として規定し、Ｓｗ_ｇを格子の質量／荷電重心幅の標準偏差として規定し、ｗ_ｆを現在の特徴の質量／荷電重心幅として規定する。本方法はｗ_ｆがｗ_ｇと、５などといった定数とＳｗ_ｇの積との和よりも大きければ調節された幅をｗ_ｇとして計算する。そうでない場合、調節された幅は以下の数学的処理の最大（ｗ_ｇ，ｗ_ｆ）の結果に等しい。格子調節された質量／荷電の幅は加重されていない質量／荷電強度を使用する。
【０１７１】
図５Ａ−１１は、同位体ピークを一体に集めるために一例の画像処理パイプラインが荷電状態をさらによく理解することに役立つように荷電の点数を見つけ出す方法工程を例示している。整数値の荷電ｚについての荷電の点数は荷電量と質量の差の組合せにより変位させられるピークモデルを適用すること、およびモデル化質量／荷電強度の観察された時間加重質量／荷電強度との内積を計算することによって計算される。荷電の点数の計算への入力は区分（ベクトル）についての質量／荷電値であるｘ；この区分の時間加重質量／荷電強度であるｙ；モデルに使用するためのピーク中心であるｃ_０；モデルに使用するためのピーク幅であるｗ_０；整数値の荷電数であるｚを含む。本方法は以下の数学、すなわち
【数２５】

によるｘ値に質量／荷電強度モデルを適用することによって荷電の点数を計算する。一実施形態では、本方法は１の値を備えたＹ；４などといった定数で割り算されたｗ_０の商の値を備えたｓ；およびｃ_０と、ｚで割り算された定数ｋと中性子質量の積との和の値を備えたｃを使用する。本方法は以下の要素（−２，−１，１，２）のセット全体にわたってｋ回繰り返す。本方法は４つのベクトルｙ’（ｋ）を得る。荷電の点数は、いくつかの実施形態では、（ｙ・［ｙ’（−２）＋２ｙ’（−１）＋２ｙ’（１）＋ｙ’（２）］）として数学的に規定される。
【０１７２】
図５Ａ−１１は荷電状態を見つけ出すための方法工程を例示するように続く。種特徴を与えられると、本方法は特徴の質量／荷電重心に置かれた質量／荷電中心を備えた原初の画像の区分を観察することによってその荷電を見つけ出すことを試みる。質量／荷電幅は、様々な実施形態において、標準偏差と２．２などといった定数の積によって設定される。この区分の時間座標は、いくつかの実施形態では、開始特徴の時間座標と同じである。関心対象の区分にある間に、本方法は種特徴の特徴強度をゼロにする。次に、本方法は保持時間軸に沿って時間加重強度を加算することによってこの区分の加重質量／荷電強度を計算する。本方法はさらにｗ_０を特徴の格子調節された質量／荷電幅として；ｃ_ｆを開始特徴の質量／荷電重心として規定し；ｐ_ｆを開始特徴の質量／荷電ピークとして規定し；ｐ_ｆがｃ_ｆと、１／４などといった定数とｗ_０の積との残差以上である場合、またはｐ_ｆがｃ_ｆと、１／４などといった定数とｗ_０の積との和以下である場合にｃ_０をｃ_ｆとして規定し、そうでない場合、ｃ_０をｐ_ｆに等しいと見なす。次いで本方法は上記で計算されたようなパラメータｃ_０、ｗ_０を使用して１，２，．．．，１５などといったある範囲のｚについて荷電の点数を計算する。次いで本方法は最も高い点数を有する荷電ｚを選択する。同位体群パラメータの質量／荷電のδは（ｃ_０−ｃ_ｆ）の残差として規定される。
【０１７３】
図５Ａ−１１−５Ａ−１６は同位体群についてピークを見つけ出すための方法工程の実行を例示している。本方法はピークモデルを種ピークから（さらに下の質量／荷電レベルに向かって）下に移動させ、次いでピークモデルを種ピークから（さらに上の質量／荷電レベルに向かって）上に移動させることによって同位体ピークを探す。各々の下または上の段で本方法は保持時間方向で種特徴と同じ範囲を有する矩形同位体領域；（ｃ_０＋ｋ^＊Ｍ_ｎ／ｚ）の和（式中、Ｍ_ｎは中性子質量であり、ｋは方法が上への移動によって同位体ピークを探しているときに正の整数であって本方法が下への移動によって同位体ピークを探しているときに負の整数である同位体番号である）に等価である質量／荷電方向での中心；４などといった定数とｗ_０の積（ここでｗ_０は種特徴の格子調節された質量／荷電幅である）に等価である質量／荷電方向での高さを規定する。
【０１７４】
この同位体（特にｋ）についての候補ピークはその境界が上記で規定された同位体領域に交差するピークである。この同位体に関して候補ピークがなければ、本方法は特定の方向で観察することを止める。各々の方向（下方向または上方向）で、本方法は様々な実施形態において最大で１０などといったある数の同位体の場所を探す。いくつかの実施形態では、同位体群の候補ピークを分類するために本発明の様々な実施形態の方法によって使用される、例えば同位体強度；質量／荷電の強度および形状；および時間の強度および形状などのいくつかの異なる判定基準がある。これらの判定基準の各々が候補ピークを受容、拒絶、または保留状態に置かれるように分類する。様々な判定基準が１つの分類の中で組合せ可能である。
【０１７５】
様々な実施形態において、同位体強度の判定基準は同位体領域のピーク強度を除いて候補特徴のどのような特性も使用する必要がない。同位体強度ｐ_ｋは同位体領域内の時間加重強度の最大値である。種同位体強度ｐ_０は種特徴内の時間加重強度の最大値である。ｐ_ｍａｘを、ｐ_０を含めて（下方向および上方向で）これまで計算されたすべての同位体強度の最大同位体強度とする。ｐ’を、先行する同位体の同位体強度とする。同位体位置ｋが正であれば、本方法はｐ’をｐ_ｋ−１と同等であると規定する。そうでない場合、本方法はｐ’をｐ_ｋ＋１と同等であると規定する。商の絶対値が０．６などといった定数よりも小さければ同位体位置ｋに関する候補特徴が受け入れられる。商の被除数は同位体強度ｐ_ｋと先行する同位体ｐ’の同位体強度の残差である。商の除数は最大同位体強度ｐ_ｍａｘと同位体強度ｐ_ｋの最大値である。そうでない場合、商がこの定数よりも小さくなければこの特徴は拒絶される。これまで述べられたような同位体強度判定基準を使用する代わりに、いくつかの実施形態では、強度を理論的分布関数と比較することによって特徴が受容または拒絶される。
【０１７６】
質量／荷電および時間強度の判定基準に関すると、本方法は候補ピークと予期される理論的ピークが偶然異なっているかどうか判定する候補ピークのｐ値を計算する。次いで本方法は、いくつかの実施形態では２つの閾値ｐ_ｌｏｗとｐ_ｈｉｇｈを使用することによって候補ピークを受容、拒絶、または保留状態に置かれるように分類する。ｐ値がｐ_ｈｉｇｈ以上であれば候補ピークは受容される。ｐ_ｌｏｗがｐ値よりも小さく、かつｐ値がｐ_ｈｉｇｈよりも小さければ、他の同位体ピークがその同位体群の構成要素として候補ピークを主張するかどうか調べるためにこの候補ピークは保留状態に置かれる。ｐ値がｐ_ｌｏｗ以下であれば候補ピークは拒絶される。ｐ_ｌｏｗとｐ_ｈｉｇｈに関して、いずれの適切な閾値が使用されることもあり得る。例えば、質量／荷電強度に関する一対の適切な閾値は０．４と同一視されるｐ_ｈｉｇｈおよび０．０５と同一視されるｐ_ｌｏｗを含む。別の例として、時間強度に関する一対の適切な閾値は０．６と同一視されるｐ_ｈｉｇｈおよび０．２と同一視されるｐ_ｌｏｗを含む。
【０１７７】
質量／荷電強度のｐ値は、一実施形態では、以下のような方法によって計算される。本方法はｗ_０を種特徴の格子調節された質量／荷電幅として規定し、ｗを候補特徴の格子調節された質量／荷電幅として規定する。（両方の幅が種特徴の格子横列を使用して格子調節される。）付け加えると、本方法はｃを候補特徴の質量／荷電重心として規定する。質量／荷電強度のｐ値は一実施形態では以下、すなわち
【数２６】

のように数学的に計算される。この数学における定数は他の実施形態において異なることもあり得る。
【０１７８】
時間強度のｐ値は、一実施形態では、本方法によって以下のように計算される。本方法はｔ_０、Ｓ_ｔ０を種特徴の時間強度重心および標準偏差として規定し、ｔ、Ｓ_ｔを候補特徴の時間強度重心および標準偏差として規定する。本方法は、一実施形態では、ｐ値を以下、すなわち
【数２７】

のように数学的に規定する。この数学における定数は他の実施形態において異なることもあり得る。
【０１７９】
本方法は、候補ピークが３つの判定基準すべてによって受け入れられれば同位体群の中に受容されるように候補ピークを規定する。候補ピークは、時間強度の判定基準に従って受け入れられ、かつ他の２つの判定基準のうちの一方によって受け入れられ、またこの候補ピークが複数の他の同位体群の中に既に保留状態に置かれていなければ保留状態に置かれる。そうでない場合、候補ピークは拒絶される。各々の候補ピークが同位体群に関して受け入れられると分類された後、この候補ピークが他の同位体群に関して考慮されなくなるように本方法はこれをランク付けから除外する。本方法はまた、様々な実施形態において、２つの同位体群の中に保留状態に置かれるように分類された候補ピークを除外する。
【０１８０】
上記で示されたように、本方法が同位体群に属する特徴を見つけ出すとその後、本方法は受容されるように分類された特徴をランク付けから除外し、それにより、これらの特徴は他の同位体群の特徴および荷電を見つけ出すことを妨げない。いくつかの実施形態では、本方法は２つの同位体群において保留状態に置かれるように分類された特徴もやはり除外する。同位体群が保留状態に置かれた特徴のみを有する場合、本方法はこの同位体群を除外し、この特徴を他の同位体群に受容されるようにする。図５Ａ−１６参照。各々の同位体が判定されるとその後、様々な実施形態において、以下の同位体パラメータが計算される。「主同位体特徴」パラメータは最大モデル化ピーク保持時間強度を備えた特徴であり；「同位体強度」パラメータはモデル化ピーク保持時間強度であり；「同位体質量／荷電重心」パラメータは主同位体特徴の質量／荷電重心であり；「同位体質量／荷電重心幅」パラメータは主同位体特徴の質量／荷電重心幅である。
【０１８１】
図５Ａ−１７−５Ａ−１８は同位体群の質量を計算するための方法工程を例示している。同位体群の質量と同位体群のモノアイソトープとの間には関係がある。モノアイソトープは特定の同位体群に関して最も低い同位体であり、最も低い質量／荷電を有する。荷電群の生物学的特徴の質量は以下の数学的処理、すなわち
【数２８】

によってモノアイソトープ（最も低い質量／荷電を備えた画像特徴）から計算され、式中、ｚは荷電（整数値）であり、Ｍ_ｐは陽子の質量であり、ｍは計算されるべき生物学的特徴の質量であり、Ｉ_ｍｚはモノアイソトープの質量／荷電である。最初に、本方法はモノアイソトープの質量／荷電を最も低い検出同位体の第１の特徴の質量／荷電強度重心として推定する。この推定でもって、同位体群の質量は数学的に以下、すなわち（ｍ＝ｚ（Ｉ_ｍｚ−Ｍ_ｐ））のように導き出される。
【０１８２】
モノアイソトープを見つけ出して同位体群の質量を計算するために、本方法はいくつかの観察された同位体に基づいてモノアイソトープが位置するはずの場所を外挿することによってモノアイソトープの場所を推定する。ペプチド質量などの所定の生物学的特徴の質量に関して、同位体ピークの理論的分布がある。いくつかの実施形態では、本方法はこの理論的分布を計算することを控えるが、その代わりにｍ１、ｍ２などといったある質量に関して理論的分布の集計バージョンを使用する。いったん本方法が質量推定ｍを有すると、本方法は質量がｍ_ｋ以上であってかつ定数とｍ_ｋの和以下になるように、分布表に使用するための集計された質量ｍ_ｋを選択する。様々な実施形態において、理論的分布は１の最大値を有するように規模を決められる。本方法は最初の同位体位置で特徴の最も低い質量／荷電強度重心を使用することによって最初に質量を推定する。同位体に受容される特徴があれば、いくつかの実施形態では、本方法はこれらを推定のために使用する。次に、本方法は観察された分布を、各々の同位体の中のピークの最大モデル化保持時間強度を使用して計算する。観察された分布が１の最大値を有するように本方法は観察された分布の規模を決める。次いで、本方法は理論的同位体分布を観察された同位体分布と比較し、本方法が最良整合を見つけ出すまでこれら２つの分布を互いに対して変位させる。２つの分布を理論的分布と観察された分布との間の絶対差の和として比較するために点数が作り出されて使用される。いくつかの実施形態では、本方法は２つの分布のうちの一方が完全に他方に重なり合うように偏位を考慮する。結果として生じる整数値の偏位は観察された同位体番号に加算することでそれらが理論的同位体番号と整合するようにそれらを補正するものである。（偏位は正、負、またはゼロであることがあり得る。）本方法が最良偏位を見つけ出したとき、本方法は変位させられた観察分布と比較したときの理論的分布の相関係数およびｐ値を計算する。
【０１８３】
図５Ａ−１８は同位体群の質量を再計算するための方法工程を例示している。理論的同位体分布と観察された同位体分布との間の偏位が知られているとき、本方法は同位体群の中のすべての同位体に関して同位体質量／荷電重心を使用して以下のように同位体群質量を再計算する。モノアイソトープの質量／荷電Ｉ_ｍｚは数学的に
【数２９】

として規定され、式中、ｋは（補正された）同位体番号であり、ｍｚ（ｋ）は同位体ｋに関する同位体質量／荷電重心であり、Ｍ_ｎは中性子の質量であり、ｚは同位体群の荷電状態である。同位体群質量は前のように（ｍ＝ｚ（Ｉ_ｍｚ−Ｍ_ｐ））で数学的に規定される。質量幅は以下、すなわち（ｚ^＊ｍｚｗｉｄｔｈ（ｋ））のようにｚで掛け算された同位体質量／荷電重心幅の平均として規定される。
【０１８４】
本方法はまた、様々な実施形態において、同位体群が他の同位体群にもやはり保留状態に置かれる、保留状態に置かれた特徴のみを有しているかどうか判定する。そうであれば本方法は、いくつかの実施形態では、この同位体群を除外し、特徴が他の同位体群に受容され得るかどうか見るためにチェックする。様々な実施形態において、いくつかの同位体群のパラメータが計算される。例えば、同位体群の質量は（前に計算されたような）補正された質量として規定される。同位体群の質量幅は上記で規定される通りである。同位体群の特徴は最大ピーク強度を備えた特徴である。同位体群の保持時間強度重心は同位体群の特徴の保持時間強度重心である。
【０１８５】
図５Ａ−１９−５Ａ−２１は荷電によって決まる同位体群の集合である荷電群を見つけ出すための方法工程を例示している。荷電群は同じ質量および保持時間を有するが異なる荷電状態を有する同位体群のセットである。本方法は、一実施形態では、各々の同位体群が１つおよび唯一の荷電群の中にある状態になるように同位体群を荷電群へと統合する。他の実施形態では他の同位体群構成もあり得る。本方法は、いくつかの実施形態では、非ゼロの荷電を有する同位体群を統合する。様々な実施形態において、本方法は単一ピークを備えた同位体群を考慮することを控える。最初に、本方法は同位体群内のすべての画像特徴に関して平均の保持時間点数でランク付けされる同位体群を含むランクｒ_ｔを形成することによって同位体群をランク付けする。本方法はまた、同位体群内のすべての特徴の最大ピーク強度によってランク付けされる同位体群を含む他のランクｒ_Ｉを形成する。次いで本方法は（和ｒ_ｔ＋ｒ_Ｉである）組合せランクｒを作り出し、一層高い点数／強度を備えた特徴が１番目にリストアップされるように組合せランクによって同位体群を再び順序付ける。
【０１８６】
組合せランクから、本方法は異なる荷電を備えた他の同位体群を探すことによって荷電群を形成する処理を以下のようにして開始するために種同位体群を選択する。本方法は先ず（荷電１へと下がる）徐々に小さい荷電状態を探す。次いで本方法は所望の荷電状態にあってかつ種同位体群質量重心からある一定の質量の単位（例えば１０）の中、および開始の同位体群保持時間重心から時間の単位ｔ_ｗの中にある同位体群を探す。本方法は、ｔ_ｗが種同位体群のピーク特徴の保持時間重心幅であるが２分間などといったある一定の保持時間期間未満ではないと規定する。これらの境界の中にある同位体群はグループ化するための候補の同位体群である。本方法は候補の同位体群を分類するために少なくとも２つの判定基準を使用し、これらの判定基準は同位体群の質量重心および同位体群の保持時間強度重心を含む。各々の判定基準は２つの同位体群を同じ荷電群内にあるように受容するかまたは拒絶するためにｐ値のカットオフを使用する。２つの同位体群が両方の判定基準を通過すればこれらは同じ荷電群に属する。
【０１８７】
各々の候補同位体群について、本方法は候補同位体群と種同位体群との間の質量ｐ値および保持時間ｐ値を以下のようにして判定する。質量重心ｃ１、ｃ２、および対応する重心偏差ｓ１、ｓ２が与えられると質量ｐ値（ｐ_ｍａｓｓ）は数学的に
【数３０】

として規定される。保持時間重心ｃ１、ｃ２、および対応する重心偏差ｓ１、ｓ２が与えられると保持時間ｐ値（ｐ_ｒｔ）は数学的に
【数３１】

として規定される。全体的ｐ値はｐ_ｍａｓｓとｐ_ｒｔの積であるｐである。次いで本方法はｐ_{ｃｕｔｏｆｆ}よりも大きいｐ_ｍａｓｓおよびｐ_{ｃｕｔｏｆｆ}よりも大きいｐ_ｒｔを有する候補同位体群を選択する。本方法はｐ_{ｃｕｔｏｆｆ}を０．６などといった適切な閾値の定数であると規定する。これらの判定基準を通過する複数の候補同位体群があれば、本方法は荷電群内の包含のために最も高い全体的ｐ値を有する１つの候補同位体群を選択する。いったん同位体群が荷電群内に包含されると、本方法はこれを別の荷電群に関して再び考慮することを控える。
【０１８８】
本方法はいくつかの同位体群パラメータを計算する。例えば、「主同位体特徴」パラメータは最大の特徴モデル化時間ピーク強度を備えた同位体特徴である。「受容特徴カウント」パラメータは同位体群に受容された（特有の）特徴の数である。「重複特徴カウント」パラメータは同位体群内の重なり合った特徴の数である（すなわちこれらはまた他の同位体群内にある）。「合計同位体ｃｎｔ」パラメータは検出された同位体の数である。「群荷電状態」パラメータは同位体群の整数値である荷電状態である。「質量／荷電δ」パラメータは種特徴の質量／荷電重心と同位体群に関して同位体を見つけ出すために使用される質量／荷電との間の差分である。「質量重心幅」パラメータは荷電状態で掛け算された、各々の同位体における主特徴の平均質量／荷電重心である。「モノアイソトピック質量／荷電」パラメータは各々の同位体に関して計算されたモノラルの質量／荷電の平均であり、１つの同位体に関して、モノラルの質量／荷電は以下の数学的処理、すなわち（ｍｚ−ｋ＊Ｍ_ｎ／ｚ）によって計算され、式中、ｍｚは主同位体特徴の質量／荷電重心であり、ｋは（分布偏位によって調節された）同位体番号であり、Ｍ_ｎは中性子の質量であり、ｚは荷電状態である。「質量重心」パラメータは同位体群の質量であり、（ｍｚ−Ｍ_ｐ）＊ｚに等価であり、式中、ｍｚはモノアイソトピックｍｚであり、ｚは荷電状態であり、Ｍ_ｐは陽子の質量である。「モノアイソトピック位置偏位」パラメータは最初に検出された同位体の同位体番号であり、この偏位は検出された同位体分布と理論的な同位体分布を調整させることによって検出される。「平均時間ピーク点数」パラメータは同位体群内のすべての特徴全体にわたる平均の特徴時間ピーク点数である。「平均質量／荷電ピーク点数」パラメータは同位体群内のすべての特徴全体にわたる平均の特徴質量／荷電ピーク点数である。「時間ピーク調整不良点数」パラメータは（Ｓ_ｃ／ｗ）として計算され、式中、Ｓ_ｃはすべての特徴の保持時間重心の標準偏差であり、ｗは同位体群内のすべての特徴の平均の保持時間重心幅である。「質量／荷電ピーク分布点数」パラメータは理論的同位体分布と観察された同位体分布との間のピアソン相関である。「質量／荷電ピーク分布点数ｐ値」パラメータは質量／荷電ピーク分布点数に付随するｐ値である。「最大同位体ｎｕｍ」パラメータはピーク同位体の同位体番号であり、ピーク同位体は同位体群内の最も高い特徴ピーク強度を備えた特徴を有する同位体である。「最大同位体ピーク強度」パラメータはピーク同位体の特徴ピーク強度である。「最大同位体質量／荷電重心」パラメータはピーク同位体の特徴質量／荷電重心パラメータである。「最大同位体質量／荷電重心幅」パラメータはピーク同位体の特徴質量／荷電重心幅パラメータである。「最大同位体時間重心」パラメータはピーク同位体の特徴時間重心パラメータである。「最大同位体時間重心幅」パラメータはピーク同位体の特徴時間重心幅パラメータである。「最大同位体時間基準開始点」パラメータはピーク同位体の特徴時間基準開始点パラメータである。「最大同位体時間基準終了点」パラメータはピーク同位体の特徴時間基準終了点パラメータである。「最大同位体ｍｚ基準開始点」パラメータはピーク同位体の特徴質量／荷電基準開始点パラメータである。「最大同位体質量／荷電基準終了点」パラメータはピーク同位体の特徴質量／荷電基準終了点パラメータである。「同位体時間基準開始点」パラメータは同位体群内のすべての特徴のうちの最小の特徴時間基準開始点である。「同位体時間基準終了点」パラメータは同位体群内のすべての特徴のうちの最大の特徴時間基準終了点である。「同位体質量／荷電基準開始点」パラメータは同位体群内のすべての特徴のうちの最小の特徴質量／荷電基準開始点である。「同位体質量／荷電基準終了点」パラメータは同位体群内のすべての特徴のうちの最大の特徴質量／荷電基準終了点である。
【０１８９】
例証となる実施形態が具体的に示されて述べられてきたが、本発明の精神と範囲から逸脱することなく、これに様々な変更が為され得ることは理解されるであろう。
【図面の簡単な説明】
【０１９０】
【図１】一例の画像処理パイプラインを含む一例のシステムを例示するブロック図である。
【図２Ａ】さらなる発見と分析のために関心対象の生物学的候補を抽出するための一例の画像処理パイプラインを例示するブロック図である。
【図２Ｂ】均一に間隔を開けられた水平および垂直の線で形成された格子と重ね合わされるラスタ化された画像を例示する絵図である。
【図２Ｃ】調整を定量化するための様々な計算に関してマスターの部分領域全体にわたってスライド可能なターゲットの部分領域を例示する絵図である。
【図２Ｄ】見込まれる調整の場所の指標である係数値の頂点を例示する絵図である。
【図２Ｅ】２ピークモデルがどのようであり得るかを数学的に例示する図である。
【図３】本発明の様々な実施形態によって検出されるピーク、同位体群、および荷電群を例示する絵図である。
【図４Ａ】一例の画像処理パイプラインの構成要素である一例の生物学的画像前処理装置を例示するブロック図である。
【図４Ｂ】一例の画像処理パイプラインの構成要素である一例の生物学的画像前処理装置の別の部分を例示するブロック図である。
【図４Ｃ】一例の画像処理パイプラインの一例の画像特徴抽出用構成要素を例示するブロック図である。
【図５Ａ−１】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ａ−２】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ａ−３】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ａ−４】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ａ−５】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ａ−６】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ａ−７】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ａ−８】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ａ−９】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ａ−１０】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ａ−１１】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ａ−１２】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ａ−１３】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ａ−１４】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ａ−１５】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ａ−１６】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ａ−１７】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ａ−１８】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ａ−１９】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ａ−２０】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ａ−２１】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ａ−２２】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ｂ】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ｃ−１】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ｃ−２】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ｄ】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ｅ】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ｆ】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ｇ】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ｈ】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ｉ】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ｊ】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ｋ】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ｌ】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ｍ】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ｎ】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ｏ】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ｐ】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ｑ】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ｒ】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ｓ−１】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ｓ−２】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ｓ−３】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ｓ−４】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ｓ−５】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ｓ−６】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ｓ−７】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ｓ−８】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ｓ−９】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ｓ−１０】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ｓ−１１】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ｓ−１２】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ｓ−１３】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ｓ−１４】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ｓ−１５】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ｓ−１６】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ｓ−１７】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ｓ−１８】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ｓ−１９】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ｓ−２０】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ｓ−２１】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ｓ−２２】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ｔ】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ｕ】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ｖ】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ｗ】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ｘ】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ｙ】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。
【図５Ｚ】生物試料中で関心対象の特徴を識別するための方法を例示する工程図である。

【特許請求の範囲】
【請求項１】
調製された生物試料が多様な処理状態の発現実験から得られる過程からデータを収集するための収集装置と、
収集装置からのデータを処理するため、および合成画像を形成するための画像処理装置と、
ピーク、同位体群、および荷電群を含む合成画像から特徴特性を抽出するための画像特徴抽出装置とを含む、コンピュータで実施可能な画像処理パイプライン。
【請求項２】
画像処理装置が保持時間の縞の除去装置、データ補間装置、画像調整装置、ノイズ除去装置、およびバックグラウンド補正装置を含む、請求項１に記載のコンピュータで実施可能な画像処理パイプライン。
【請求項３】
収集装置がデータを収集する過程が、調製された生物試料をクロマトグラフィ処理にかける工程を含む、請求項１に記載のコンピュータで実施可能な画像処理パイプライン。
【請求項４】
収集装置がデータを収集する過程が、調製された生物試料を質量分析処理にかける工程を含む、請求項１に記載のコンピュータで実施可能な画像処理パイプライン。
【請求項５】
ピーク、同位体群、および荷電群で構成される群から選択される３つの集大成レベルにおけるすべての条件での複製の発現プロファイルを作り出すために特徴特性を処理するための発現統計値処理装置をさらに含む、請求項１に記載のコンピュータで実施可能な画像処理パイプライン。
【請求項６】
生物学的ターゲット識別のために、差異を有して、および差異を有さず発現された特徴に関する候補一覧表を作り出すために発現プロファイルを処理するための発現解析処理装置をさらに含む、請求項５に記載のコンピュータで実施可能な画像処理パイプライン。
【請求項７】
調製された生物試料を処理して画像のセットを作り出すための、クロマトグラフィ機器と質量分析計を含む機器の収集物と、
画像のセットから作り出される合成画像を処理するための画像処理装置と、特徴特性、発現プロファイル、および候補特徴一覧表を作り出す画像処理パイプラインとを含む、生物学的特徴を発見するためのシステム。
【請求項８】
特徴特性が、ピーク、同位体群、および荷電群を含む３つのレベルにおける生物学的特徴について情報を提供する、請求項７に記載のシステム。
【請求項９】
ピークが、特定の保持時間範囲および質量／荷電範囲での輪郭によって規定される同位体ピークであり、同位体群が同じ荷電状態の同位体ピークの群であり、荷電群が同位体群の収集体である、請求項８に記載のシステム。
【請求項１０】
特徴特性がピーク保持時間の開始点と終了点、ピーク質量／荷電の開始点と終了点、質量／荷電の重心、荷電状態、および質量で構成される群から選択される、請求項９に記載のシステム。
【請求項１１】
発現プロファイルが、ピークの境界輪郭の中にあるすべての非ゼロの画素の強度測定値の和であるピーク強度についてのプロファイルを含む、請求項７に記載のシステム。
【請求項１２】
候補特徴一覧表がタンパク質識別のために選択されるピークまたは同位体群のセットである、請求項７に記載のシステム。
【請求項１３】
未加工のＬＣ／ＭＳデータを補間、ラスタ化、およびフィルタ処理することで二次元画像にマップ化するためにデータラスタライザと組み合わされた補間装置と、
多様な処理群の指標である二次元画像を合成画像に組み合わせて融合させるために群間画像融合装置と組み合わされた群内複製コンバイナとを含む、生物学的画像前処理装置。
【請求項１４】
未加工のＬＣ／ＭＳデータを受け取り、未加工のＬＣ／ＭＳデータを事前調整させ、かつラスタ化することで事前調整したデータを作り出すためにデータラスタライザと組み合わされた保持時間事前調整装置をさらに含む、請求項１３に記載の生物学的画像前処理装置。
【請求項１５】
データラスタライザと組み合わされた補間装置が二次元画像を作り出すために事前調整データを受け取り、生物学的画像前処理装置が、二次元画像をフィルタにかけることでフィルタ処理された二次元画像の第１のセットを作り出すために第１の形態学的画像ノイズフィルタをさらに含む、請求項１４に記載の生物学的画像前処理装置。
【請求項１６】
フィルタ処理された二次元画像の第１のセットを調整させることで調整画像のセットを作り出すために群間保持時間調整装置と組み合わされた群内保持時間調整装置をさらに含む、請求項１５に記載の生物学的画像前処理装置。
【請求項１７】
未加工ＬＣ／ＭＳデータと調整画像の両方を受け取り、調整画像を歪曲させ、歪曲画像を作り出すために再ラスタ化装置と組み合わされた画像歪曲装置をさらに含む、請求項１６に記載の生物学的画像前処理装置。
【請求項１８】
歪曲画像をフィルタにかけてフィルタ処理された二次元画像の第２のセットを作り出すために第２の形態学的画像ノイズフィルタをさらに含む、請求項１７に記載の生物学的画像前処理装置。
【請求項１９】
フィルタ処理された二次元画像の第２のセットのバックグラウンドノイズを推定することで補償された画像のセットを作り出すためにバックグラウンドノイズ推定装置をさらに含む、請求項１８に記載の生物学的画像前処理装置。
【請求項２０】
補償された画像のセットをフィルタにかけてフィルタ処理された二次元画像の第３のセットを作り出すために第３の形態学的画像ノイズフィルタをさらに含む、請求項１９に記載の生物学的画像前処理装置。
【請求項２１】
群内複製コンバイナがフィルタ処理された二次元画像の第３のセットを組み合わせることで組合せ画像のセットを作り出す、請求項２０に記載の生物学的画像前処理装置。
【請求項２２】
群間画像融合装置が組合せ画像のセットを融合させることで融合画像を作り出す、請求項２１に記載の生物学的画像前処理装置。
【請求項２３】
融合画像を受け取り、合成画像を供給するために第４の形態学的画像ノイズフィルタをさらに含む、請求項２２に記載の生物学的画像前処理装置。
【請求項２４】
多様な画像の中でクロマトグラムの保持時間の不一致を取り除くための方法であって、
原初の未加工データを歪めることですべての複製の中で合計の調整不良を減少させることによって調整した二次元ＬＣ／ＭＳラスタ化画像を作り出す工程と、
組合せ画像を形成するために各々の処理群の中の複製を組み合わせる工程、および合成画像を形成するために、最大画素強度を取り込むことによって処理群間からの組合せ画像を融合させる工程とを含む、方法。
【請求項２５】
データのラスタ化措置の実行に先行して全体的な時間の調整不良が推定される事前調整措置を実行する工程をさらに含む、請求項２４に記載の方法。
【請求項２６】
原初の未加工データを補間することおよびデータを共通の二次元画像格子にマップ化することによってデータのラスタ化措置を実行する工程をさらに含む、請求項２４に記載の方法。
【請求項２７】
組合せ画像を形成するために複製を組み合わせる工程が画素強度の平均化によって実行される、請求項２４に記載の方法。
【請求項２８】
画像特徴を抽出するための方法であって、
合成画像上で関連した非ゼロ画素から同位体ピークを識別する工程と、
質量／荷電方向、保持時間方向、または両方で２つ以上の同位体ピークから成る識別同位体ピークを分割する工程とを含む、方法。
【請求項２９】
各々の同位体ピークを特有の指数でラベリングする工程をさらに含む、請求項２８に記載の方法。
【請求項３０】
ピーク質量／荷電の重心、ピーク質量／荷電の幅、ピーク時間の重心、およびピーク時間の幅で構成される群から選択される同位体ピーク特性を計算する工程をさらに含む、請求項２９に記載の方法。
【請求項３１】
同位体群に属する同位体ピークを識別する工程、および同位体群を特有の同位体群指数でラベリングする工程をさらに含む、請求項３０に記載の方法。
【請求項３２】
荷電状態、モノアイソトピック質量／荷電、およびペプチド質量で構成される群から選択される同位体群特性を計算する工程をさらに含む、請求項３１に記載の方法。
【請求項３３】
１つの同位体ピークのみを備えた同位体群を知られていない荷電を備えた荷電群に属すると識別する工程をさらに含む、請求項３２に記載の方法。
【請求項３４】
異なる荷電状態を有する同位体群を、これらが同様の保持時間およびペプチド質量を有していれば１つの荷電群に属すると割り当てる工程をさらに含む、請求項３３に記載の方法。
【請求項３５】
生物学的特徴を抽出するための方法であって、
合成画像を形成するために多様な処理状態の画像を処理する工程と、
合成画像内の特定の場所における平均値、中央値、最大値、最小値、および標準偏差で構成される群から選択されるバックグラウンドノイズパラメータよりも上の強度を有する合成画像内の関連画素から同位体ピークを見つけ出す工程とを含む、方法。
【請求項３６】
多様な未加工質量／荷電座標に基づいた入力の未加工データを同じ質量／荷電格子に変換することによって質量／荷電の補間を実行する工程をさらに含む、請求項３５に記載の方法。
【請求項３７】
見つけ出された同位体ピークを、見つけ出された同位体ピークがどの程度理想的ピークに近いか、およびどの程度アーチファクトおよびノイズから形成されていないかに基づいて点数を割り当てることによって特徴付ける工程をさらに含む、請求項３５に記載の方法。
【請求項３８】
溶出の物理的特性を述べる適切な分布関数を使用して、理想的ＬＣ保持時間ピークに関してクロマトグラムモデルを形成する工程をさらに含み、クロマトグラムモデルがモデルパラメータを含む、請求項３７に記載の方法。
【請求項３９】
見つけ出された同位体ピークが、クロマトグラムモデルのモデルパラメータを最適化して整合がどの程度優れているかの指標である点数を作り出すことによって特徴付けられ、整合が殆ど完全であれば点数が１に向かう傾向を有し、見つけ出された同位体ピークがノイズの多いものであれば点数がゼロに向かう傾向を有する、請求項３８に記載の方法。
【請求項４０】
質量連続体分解能特性を述べる適切な分布関数を使用して、理想的な質量／荷電ピークに関してモデルを形成する工程をさらに含む、請求項３９に記載の方法。
【請求項４１】
見つけ出された同位体ピークが質量／荷電ピークの点数を計算することによって特徴付けられ、質量／荷電ピークが汚染されてなく、かつ良好に規定されていれば質量／荷電ピークの点数が１に向かう傾向を有し、見つけ出された同位体ピークが汚染されているかまたは２つの重なり合うピークの組合せであれば点数がゼロに向かう傾向を有する、請求項４０に記載の方法。
【請求項４２】
様々な同位体群に属する同位体ピークを識別する工程、および様々な同位体群を特徴付ける同位体群の点数を計算する工程をさらに含み、同位体群の点数が、同位体群内のすべてのピークの時間ピークの点数の平均値である平均時間ピーク点数、同位体群内のすべてのピークの質量／荷電ピークの点数の平均値である平均質量／荷電ピーク点数、同位体群内の時間ピークの重心の平均重心からの相対的偏差を判定する時間ピーク調整不良の点数、同位体群がどの程度良好に理論的同位体強度分布に整合するか判定する質量／荷電分布の点数、および質量／荷電分布の点数の信頼性の信用度の大きさを与える質量／荷電分布の点数に関するｐ値で構成される群から選択される、請求項４１に記載の方法。
【請求項４３】
合成画像内で見つけ出された同位体ピークを分割するための方法であって、
同位体ピークが他の同位体ピークの幅分布よりも広い幅を有するかどうか判定することによって重なり合った同位体ピークを検出する工程と、
保持時間方向および質量／荷電方向で重なり合った同位体ピークを分割する工程とを含む、方法。
【請求項４４】
重なり合った同位体ピークを検出する工程に先行してすべての同位体ピークについて幅分布を計算する、請求項４３に記載の方法。
【請求項４５】
他の同位体ピークの幅分布よりも広い幅を有する同位体ピークに適合させるために多重ガウス関数モデルを適用する工程をさらに含む、請求項４４に記載の方法。
【請求項４６】
すべてのピークが完全に重なり合って分割不可能なケースに関して帰無仮説を構築する工程をさらに含む、請求項４５に記載の方法。
【請求項４７】
多重ガウス関数モデルを適用する行為が予め判定されたｐ値よりも小さい値を作り出すかどうか判定する工程をさらに含み、そうであれば帰無仮説が誤りであって同位体ピークが分割可能であることを判定する、請求項４６に記載の方法。
【請求項４８】
分割する工程が、重なり合った同位体ピークを多重ガウス関数モデルの適用によって示される位置で分割する工程を含む、請求項４７に記載の方法。
【請求項４９】
同位体群について荷電状態を推定するための方法であって、
ランク表の最上位から由来するピークの保持時間重心付近の個別連続体の加重和によってＭＳ連続体を構築する工程と、
様々な荷電状態に関する複数の理想モデルをＭＳ連続体に整合させる工程、および最良整合を与える理想モデルを判定する工程とを含み、理想モデルの荷電状態が同位体群の荷電状態である、方法。
【請求項５０】
加重和が、重心から遠く離れた連続体よりも重心付近に保持時間を有する連続体に関してさらに大きい、請求項４９に記載の方法。
【請求項５１】
ランク表の最上位から由来するピークに基づいて同位体ピークを理想モデルと比較することによって、同位体群に属する同位体ピークを検索する工程をさらに含む、請求項５０に記載の方法。
【請求項５２】
同位体ピークが理想モデルに完全に整合する帰無仮説を構築する工程をさらに含む、請求項５１に記載の方法。
【請求項５３】
同位体ピークが同位体群に属するものとして受容されるか拒絶されるか判断するために保持時間方向と質量／荷電方向の両方で仮説検定のｐ値を評価する工程をさらに含む、請求項５２に記載の方法。
【請求項５４】
仮説検定によって受容も拒絶もされない同位体ピークを、これらの同位体ピークが他の同位体群に属し得るかどうか見るための後に続く検定のために維持する工程をさらに含む、請求項５３に記載の方法。
【請求項５５】
複製を表わす画像を調整させるための方法であって、
重なり合いのセットの中の第１の最終変位値と第２の最終変位値を判定するために、ターゲットの画像がマスターの画像と調整する程度を判定する相関係数と重なり適合値を計算する工程と、
第１と第２の最終変位値が互いに近傍にあれば、この時間間隔について最終変位値を作り出すために第１と第２の最終変位値を平均する工程と、
複数の時間間隔について複数の最終変位値を作り出すために上記の工程を繰り返す工程とを含み、各々の最終変位値が、画像をラスタ化してこれらを調整させるために補間関数を作り出すための基準点である、方法。
【請求項５６】
重なり合いのセットが、時間間隔全体にわたってターゲットの画像をマスターの画像に対して変位させる工程から作り出される、請求項５５に記載の方法。
【請求項５７】
マスターの画像がラスタ化された画像から選択され、ラスタ化画像のセットの中の他の画像に比べて測定された基準ピーク強度において最も高い標準偏差を有する、請求項５６に記載の方法。
【請求項５８】
相関係数がターゲットのアレイとマスターのアレイ内に蓄えられた強度計算から基礎を置かれ、強度計算が、重なり合った画素位置におけるターゲット画像の画素の強度の常用対数と重なり合った画素位置におけるマスター画像の画素の強度の常用対数を取ることによって計算される、請求項５７に記載の方法。
【請求項５９】
重なり適合値が第１と第２のカウンタの和の負を取る工程に基づき、重なり合った画素位置におけるマスター画像の画素強度がゼロよりも大きいことおよび重なり合った画素位置においてターゲット画像の画素強度がゼロであることを第１のカウンタが示し、重なり合った画素位置におけるマスター画像の画素強度がゼロに等しくされることおよび重なり合った画素位置にけるターゲット画像の画素強度がゼロよりも大きいことを第２のカウンタが示す、請求項５８に記載の方法。
【請求項６０】
各々の重なり合いに関して頂点が計算され、変曲点間で最小数の点を有してかつ隣り合う点によって閾値で隔てられる頂点が見込まれる調整の場所を示す、請求項５９に記載の方法。

【図１】

【図２Ａ】

【図２Ｂ】

【図２Ｃ】

【図２Ｄ】

【図２Ｅ】

【図３】

【図４Ａ】

【図４Ｂ】

【図４Ｃ】

【図５Ａ−１】

【図５Ａ−２】

【図５Ａ−３】

【図５Ａ−４】

【図５Ａ−５】

【図５Ａ−６】

【図５Ａ−７】

【図５Ａ−８】

【図５Ａ−９】

【図５Ａ−１０】

【図５Ａ−１１】

【図５Ａ−１２】

【図５Ａ−１３】

【図５Ａ−１４】

【図５Ａ−１５】

【図５Ａ−１６】

【図５Ａ−１７】

【図５Ａ−１８】

【図５Ａ−１９】

【図５Ａ−２０】

【図５Ａ−２１】

【図５Ａ−２２】

【図５Ｂ】

【図５Ｃ−１】

【図５Ｃ−２】

【図５Ｄ】

【図５Ｅ】

【図５Ｆ】

【図５Ｇ】

【図５Ｈ】

【図５Ｉ】

【図５Ｊ】

【図５Ｋ】

【図５Ｌ】

【図５Ｍ】

【図５Ｎ】

【図５Ｏ】

【図５Ｐ】

【図５Ｑ】

【図５Ｒ】

【図５Ｓ−１】

【図５Ｓ−２】

【図５Ｓ−３】

【図５Ｓ−４】

【図５Ｓ−５】

【図５Ｓ−６】

【図５Ｓ−７】

【図５Ｓ−８】

【図５Ｓ−９】

【図５Ｓ−１０】

【図５Ｓ−１１】

【図５Ｓ−１２】

【図５Ｓ−１３】

【図５Ｓ−１４】

【図５Ｓ−１５】

【図５Ｓ−１６】

【図５Ｓ−１７】

【図５Ｓ−１８】

【図５Ｓ−１９】

【図５Ｓ−２０】

【図５Ｓ−２１】

【図５Ｓ−２２】

【図５Ｔ】

【図５Ｕ】

【図５Ｖ】

【図５Ｗ】

【図５Ｘ】

【図５Ｙ】

【図５Ｚ】

【公表番号】特表２００９−５１６１７２（Ｐ２００９−５１６１７２Ａ）
【公表日】平成２１年４月１６日（２００９．４．１６）
【国際特許分類】

物理学 (1,541,580)
- 測定；試験 (294,940)
  - 材料の化学的または物理的性質の決定による材料の調査または分析 (128,275)
    - 電気的，電気化学的，または磁気的手段の利用による材料の調査また... (17,622)
      - ガスのイオン化の調査によるもの；放電の調査によるもの，例．陰極... (3,117)
    - 吸着，吸収もしくは類似現象，またはイオン交換，例．クロマトグラ... (6,699)
      - カラムクロマトグラフィ (6,313)
        
        信号解析 (414)
        
        グループ３０／０４から３０／８６のうちの１つに含まれないもので... (1,717)
        
        カラムクロマトグラフィに特に用いられる検出器 (977)
        
        質量分析計 (493)

【出願番号】特願２００８−５４０２７７（Ｐ２００８−５４０２７７）
【出願日】平成１８年１１月１３日（２００６．１１．１３）
【国際出願番号】ＰＣＴ／ＵＳ２００６／０４４１６６
【国際公開番号】ＷＯ２００７／０５９１１７
【国際公開日】平成１９年５月２４日（２００７．５．２４）
【出願人】（５０５４４１９０４）ロゼッタ　インファーマティックス　エルエルシー (9)
【Ｆターム（参考）】

その他の電気的手段による材料の調査、分析 (22,023)

[ Back to top ]

合成画像を使用した生物学的特徴の発見

メニュー

スポンサーリンク

次の公報 »

« 前の公報

合成画像を使用した生物学的特徴の発見

メニュー

スポンサー リンク

次の公報 »

« 前の公報

スポンサーリンク