関心領域処理

【課題】関心領域処理を提供すること。
【解決手段】前処理された生体サンプルが、液体クロマトグラフィ／質量分析機器にかけられた後、変動を示すデジタルイメージが、生成される。これらの変動のいくつかは、関心対象であり得る一方で、他のいくつかは、関心対象ではない。関心領域内の変動が、互いに関連付けられることが可能であり、さらに生物学的特徴を分類するように生成される相関スコアが、科学的発見を助ける。また、変動の形状特性が、形状スコアによって計算されることも可能である。マイクロ整列配置方法が、マクロ整列配置を用いる必要なしに相関計算を助ける。

【発明の詳細な説明】
【技術分野】
【０００１】
（関連出願の相互参照）
本出願は、参照により本明細書に組み込まれている、２００８年１０月２３日に出願した米国特許仮出願第６１／１０７，９８８号の利益を主張する。
【０００２】
発明は関心領域処理に関する。
【背景技術】
【０００３】
生物試料の分析は、そのような試料を含有する成分が複雑に混じり合っていることを考慮すると、困難である。ほとんどの分析機器は、１つの成分の影響を別の成分の影響と完全に分離することができず、しばしば、関連する信号が小さい、または濃度が低いことがある。このため、重なり合う、ノイズの多い信号が普通であり、相当調査して、有用な情報を明らかにすることが要求される。このような人間による調査は時間がかかり、主観的である可能性があり、さらに、重要な特徴が容易に軽視される、または見過ごされる可能性がある。一部の事例では、従来の分析技術を適用すると、誤ることもある。このため、改良された分析方法および分析装置が必要とされる。
【発明の概要】
【課題を解決するための手段】
【０００４】
この要約は、以下の発明の詳細な説明の中で詳しく述べられている考え方を選出したものを簡単な形式で紹介するものである。この要約は、クレームされた発明の対象を述べることを意図したものでも、クレームされた発明の対象の範囲を決定することを補助するために使用されることを意図したものでもない。
【０００５】
この主題の一つの形態は、関心領域プロセッサを含み、この関心領域プロセッサは、ある構成イメージの中のある関心領域を、その構成イメージの中のそれ以外の関心領域を整列させる必要なしに、その他の構成イメージの中の対応する関心領域と整列させる、マイクロアライナを備えている。さらに、関心領域プロセッサは、関心領域内で見られる変動の信頼性を表す相関スコアを生成し、関連のある潜在的な生物学的特徴を挙げるように構成された相関エバリュエータを含んでいる。
【０００６】
この主題の別の形態は、生物学的特徴を発見するために関心領域を処理する方法を含むことであり、この方法は、ある構成イメージの関心領域を、いずれの構成イメージの中の関心領域とマクロ整列させる必要なしに、その他の構成イメージの中の対応する関心領域とマイクロアライニングすることを含む。この方法はさらに、対応する関心領域中のマスクされたピクセルに対する相関スコアを計算することを含む。ここで相関スコアは関心領域内の変動の信頼性を表す。
【０００７】
この主題のさらに別の形態は、生物学的特徴を発見するように関心領域を処理する方法を実施するためのコンピューター実行可能命令を有するコンピューター可読媒体を含むことであり、このコンピューター可読媒体は、その構成イメージとその他の構成イメージの中の関心領域とマクロ整列させる必要なしに、ある構成イメージの中のある関心領域をその他の構成イメージの中のその他の関心領域とマイクロアライニングすることを含む。この方法はさらに、対応する関心領域中のマスクされたピクセルと他の関心領域中のマスクされたピクセルに対する相関スコアを計算することを含む。その相関スコアは関心領域内で見られる変動の信頼性を表す。
【０００８】
本発明の以上、およびその他の目的、特徴、および利点は、添付の図を参照して進められる以下の詳細な説明から、より明白となろう。
【０００９】
この主題の以上の態様、および付随する利点の多くは、添付の図面と併せて解釈される場合に、以下の詳細な説明を参照することによって、これらの態様および利点がよりよく理解されるにつれ、より容易に認められるようになろう。
【図面の簡単な説明】
【００１０】
【図１】前処理をされた生体サンプルを研究者の生体研究の対象のリストへ提供する処理をする構成を示すブロック図である。
【図２】関心領域処理サブシステムの典型的な構成を示すブロック図である。
【図３−１】３Ａ〜３Ｄをまとめて示す図であり、主題の一実施形態における、時間伸縮された構成イメージ、ならびに合成イメージを示す図である。
【図３−２】３Ｅおよび３Ｆをまとめて示す図であり、この主題の一実施形態における、合成イメージから検出された関心領域を示す図である。
【図４】４Ａ〜４Ｄはそれぞれ、この主題の一実施形態における、典型的な拡大プロセスを示す図である。
【図５】５Ａ〜５Ｄはそれぞれ、この主題の一実施形態における、典型的なマイクロ整列技術を示す図である。
【図６】６Ａ〜６Ｅはそれぞれ、この主題の一実施形態における、関心領域の再定義を示す図である。
【図７】７Ａ〜７Ｆはそれぞれ、この主題の一実施形態における、相互にマイクロ整列されたスニペットの部分を示す図である。
【図８】８Ａ〜８Ｄはそれぞれ、この主題の一実施形態における、典型的なマスク、および様々なマスクされたスニペットを示す図である。
【図９】この主題の一実施形態における、イメージスニペットをシリアル化することによって導き出された構成ベクトルと、典型的なコンセンサスベクトルとを含む典型的なテーブルを示す図である。
【図１０】この主題の一実施形態における、典型的なコンセンサスベクトル対典型的な構成ベクトルのグラフである。
【図１１】この主題の一実施形態における、各構成ベクトルの個々の同化の後に図１０のデータ点のグラフを示す図である。
【図１２】この主題の一実施形態における、図１１におけるデータへの線形回帰を示す図である。
【図１３Ａ】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図１３Ｂ】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図１３Ｃ】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図１３Ｄ】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図１３Ｅ】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図１３Ｆ】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図１３Ｇ】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図１３Ｈ】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図１３Ｉ１】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図１３Ｉ２】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図１３Ｊ】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図１３Ｋ】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図１３Ｌ】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図１３Ｍ】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図１３Ｎ−１】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図１３Ｎ−２】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図１３Ｏ】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図１３Ｐ】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図１３Ｑ】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図１３Ｒ】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図１３Ｓ】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図１３Ｔ】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図１３Ｕ】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図１３Ｖ】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図１３Ｗ】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図１３Ｘ】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図１３Ｙ】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図１４Ａ】生物学的特徴を発見するように関心領域を処理するための実施形態を示す図である。
【図１４Ｂ】生物学的特徴を発見するように関心領域を処理するための実施形態を示す図である。
【図１４Ｃ】生物学的特徴を発見するように関心領域を処理するための実施形態を示す図である。
【図１４Ｄ】生物学的特徴を発見するように関心領域を処理するための実施形態を示す図である。
【図１４Ｅ】生物学的特徴を発見するように関心領域を処理するための実施形態を示す図である。
【図１４Ｆ】生物学的特徴を発見するように関心領域を処理するための実施形態を示す図である。
【図１４Ｇ】生物学的特徴を発見するように関心領域を処理するための実施形態を示す図である。
【図１４Ｈ】生物学的特徴を発見するように関心領域を処理するための実施形態を示す図である。
【図１４Ｉ】生物学的特徴を発見するように関心領域を処理するための実施形態を示す図である。
【図１４Ｊ】生物学的特徴を発見するように関心領域を処理するための実施形態を示す図である。
【図１４Ｋ】生物学的特徴を発見するように関心領域を処理するための実施形態を示す図である。
【図１４Ｌ】生物学的特徴を発見するように関心領域を処理するための実施形態を示す図である。
【図１４Ｍ】生物学的特徴を発見するように関心領域を処理するための実施形態を示す図である。
【図１４Ｎ】生物学的特徴を発見するように関心領域を処理するための実施形態を示す図である。
【図１４Ｏ】生物学的特徴を発見するように関心領域を処理するための実施形態を示す図である。
【図１４Ｐ】生物学的特徴を発見するように関心領域を処理するための実施形態を示す図である。
【図１４Ｑ】生物学的特徴を発見するように関心領域を処理するための実施形態を示す図である。
【図１４Ｒ】生物学的特徴を発見するように関心領域を処理するための実施形態を示す図である。
【図１４Ｓ】生物学的特徴を発見するように関心領域を処理するための実施形態を示す図である。
【図１５】開示される方法の実施に適した代表的なハードウェアおよびコンピューティング環境を示す概略図である。
【図１６Ａ】周辺勾配スコア付けを示す図である。
【図１６Ｂ】周辺勾配スコア付けを示す図である。
【図１６Ｃ】周辺勾配スコア付けを示す図である。
【図１６Ｄ】周辺勾配スコア付けを示す図である。
【図１６Ｅ】周辺勾配スコア付けを示す図である。
【図１６Ｆ】周辺勾配スコア付けを示す図である。
【図１７】前処理スコア付けを示す図である。
【図１８】接線体積比スコア付けを示す図である。
【発明を実施するための形態】
【００１１】
本出願および特許請求の範囲において使用される、「或る」および「この」という単数形は、文脈によりそうでないことが明確に規定されない限り、複数形を含む。さらに、「含む」という用語は、「備える」を意味する。さらに、「結合された」という用語は、結合されたアイテムの間の中間要素の存在を排除しない。
【００１２】
本明細書で説明されるシステム、装置、および方法は、いかなる観点においても全く限定されるように構成されるべきものではない。代わりに、本開示は、様々な開示される実施形態のすべての新奇で、自明でない特徴および態様の、単独の状態、および互いとの様々な組合せの状態、および部分的組合せの状態を対象とする。開示されるシステム、方法、および装置は、これらのシステム、方法、および装置のいずれの特定の態様もしくは特徴、またはいずれの特定の組合せにも限定されず、また開示されるシステム、方法、および装置が、いずれの一つ以上の特定の利点が存在すること、または問題が解決されることを要求することもない。動作理論は、説明を円滑にすべきものであるが、開示されるシステム、方法、および装置は、そのような動作理論に限定されない。
【００１３】
開示される方法のうちのいくつかの方法の動作は、都合よく説明するためにある特定の順序で説明されるものの、この説明のやり方は、以下に示される特定の言い回しによって特定の順序付けが要求されない限り、再整理を包むものと理解されたい。例えば、順次に説明される動作は、一部の事例において、並べ替えられること、または同時に実行されることが可能である。さらに、簡潔にするため、開示されるシステム、方法、および装置が、他のシステム、方法、および装置と併せて使用されることが可能であるような様々な仕方を、添付の図は示していない場合がある。さらに、この説明は開示される方法を説明するのに、「もたらす」および「提供する」のような語を使用することがある。これらの語は、実行される実際の動作を高いレベルに抽象化したものである。これらの用語に対応する実際の動作は、特定の実施形態に依存して異なり、当業者によって容易に識別可能である。
【００１４】
以下の説明を簡潔にするため、一部の数学的評価技術は、複数ステップの計算として示される。他の例では、場合によって、１つまたは複数のステップにおいてこのような解析が行われる。このような数学的技術は例であって、開示される例にさらなる技術および変形を使用することも可能であり、一部の事例では、より単純な、またはより迅速な計算をもたらすことが可能である。
【００１５】
質量分析を、液体クロマトグラフィ、ゲル電気泳動、ガスクロマトグラフィ、およびイオン拡散などの他の分離技術と組み合わせて行うことが可能である。このような技術の組合せによって得られたデータを、ｎ次元データセットとして表すことができる。例えば、クロマトグラフ保持時間および質量スペクトルの質量対電荷比を、第１の軸および第２の軸の座標として使用することができる。これらの座標に関する信号強度を、データ値の２次元アレイとして表すことができ、さらにそのようなデータをイメージまたはイメージデータと呼ぶことができる。
【００１６】
質量分析および液体クロマトグラフィは、生体サンプルの評価に適用できる２つの重要な分離技術であり、さらにＬＣ／ＭＳデータセット（本明細書でイメージまたはイメージデータと呼ばれる）を以下の説明において使用するが、他の形式のデータを使用することも可能である。通常の生物試料は、タンパク質、炭水化物、脂質、および代謝産物の混合を含むが、その他の化学試料または生物試料を同様に調べることもでき、さらに開示される方法および装置は、非生物試料にも適用できる。
【００１７】
開示される方法および装置のいくつかの例は薬学研究に属する。薬学医療（ｐｈａｒｍａｃｅｕｔｉｃａｌｍｅｄｉｃａｌ）研究は、病状または医薬を使用した治療に対する反応などの生理学的状態の指標である生化学物質を特定することを対象とすることがある。そのような化学物質の１つまたは複数の物質を、生体指標と呼ぶ。生体指標は、病状または他の生理学的状態を診断するのに使用できる。生体指標は、研究室において臨床エンドポイントの代わりに使用でき、そのような生体指標はサロゲートエンドポイントと呼ばれる。サロゲートエンドポイントを、人間に対しまたは動物に対してさえ使用することなしに、医薬品の開発に使用することができる。薬品開発は、試験管の中でサロゲートエンドポイントの試験を行うことから始めることができる。
【００１８】
一般的な順序として、試料に関係する化学的混合物を液体クロマトグラフィ機器／質量分析機器の中に導入できるように、生検標本、血液、唾液、羊水などの生体試料を処理する。次に、得られたデータ（保持時間およびｍ／ｚ比の関数としての信号強度）から、この複雑な混合物中の生化学物質が同定される。この公開されている方法および装置を用いると、データの一部分を選択することによって、生物学的に、より関係のあるデータを同定することができる。具体的には、これらの方法および装置を用いると、関心対象の信号を汚染する可能性があるノイズまたは他の余計な信号から関心の対象となっている部分を分離、または抽出することによって、ＬＣ／ＭＳデータから１つまたは複数の知りたい化学物質のＳＮ比の向上した信号を同定することができる。１つまたは複数の成分（ｍｏｉｅｔｉｅｓ）に関連する信号部分を除去、または部分的に除去し、詳細に信号特徴を調べることができる。例えば、ある特定の成分に関連するピークを、その他のピークがより明確にされ得るように除去することができる。
【００１９】
公開されている通り分析データを解析することにより、複雑に混じり合っている化学物質をより良く分離および同定することができる。研究者は、健康な対象と疾患のある対象、および／または治療を受けていない対象と治療を受けている対象に関して、この解析プロセスを繰り返すことができる。このようにして同定された、健康な対象と疾患のある対象または治療を受けている対象と治療を受けている対象の間の化学物質成分の違いに基づいて、生体指標を定義することができる。この生体指標を、臨床エンドポイントの代わりに使用するサロゲートエンドポイントとする場合もある。そのような生体指標を、薬品開発において診断指標および治療指標に使用できる。
【００２０】
代表的な実施形態として、本明細書において、ＬＣ（液体クロマトグラフィ）およびＭＳ（質量分析）に基づいた画像について述べる。通常、信号強度はＬＣ保持時間およびＭＳ質量対電荷比（ｍ／ｚ）の関数として記録され、この記録された信号強度をイメージデータアレイとして格納、または処理することができる。本明細書における便宜上、通常、保持時間を水平線（ｘ軸）にとり、ｍ／ｚを垂直線（ｙ軸）にとる。他の例では、ＬＣ保持時間またはｍ／ｚ比の代わりに、または加えて、他の形式のデータを使用する。例えば、ＣＧ（ガスクロマトグラフィ）、イオン分光法、ゲル電気泳動、イオン拡散、または質量分析飛行時間などのデータを使用できる。
【００２１】
以下の例において、生体サンプルの評価に関連する解析結果が、レプリケートと呼ばれるデジタル画像としてキャプチャされる。強度変動は、レプリケート上に散乱されている。前述したとおり、従来の評価技術ではレプリケート上の様々な強度の変動の関係を同定することができない。いわゆる「時間伸縮法」を使用して、これらの強度の変動を調整することで、ノイズである変動を同定し、ノイズでない強度の変動を明らかにすることは可能であるが、一部の強度の変動を整列させると他の強度の変動の不整が生じ、この不整の生じた変動が重要な特徴を表す変動である場合もある。
【００２２】
図１は、生体サンプルを処理して生物学的特徴を検出するためのシステムを示す。このシステム１００では１つまたは複数の生体サンプル１０２を入手する。各生体サンプル１０２は、通常、同一または同様または異なる処置条件１０４の処置を受ける。システム１００は、この処置に基づいて生体サンプル１０６を準備し、そのように準備された生体サンプル１０６は、様々な液体クロマトグラフィおよび質量分析処理を利用したＬＣ／ＭＳ機器１０８によってさらに処理される。この処理の結果は１つまたは複数のＬＣ／ＭＳイメージ、レプリケート、または構成イメージの形式で得られる。これら結果は、専用プロセッサなどの１つまたは複数のハードウェア処理デバイスとして、および／または汎用コンピューターなどの１つまたは複数のコンピューティングデバイス上で実行されるソフトウェアとして提供される関心領域プロセッサ１１０に送られ、さらに処理される。関心領域の形状および相互関係に基づく様々なスコアにより、システム１００が、ＬＣ／ＭＳ処理機器１０８によって前処理された生体サンプル１０６から抽出された生物学的特徴を分類し、さらなる調査のために１名または複数名の研究者に送られる、または提示されることが可能な生物学的候補リスト１１２を提供できるようになる。
【００２３】
図２に関心領域プロセッサ１１０をより詳細に示す。関心領域プロセッサ１１０はデータセレクタ２０２を含む。データセレクタ２０２は、実験の定義、１つまたは複数の実験条件とこれらのイメージとの関係、または生物学的変異とこれらのイメージとの関係などに基づいて、イメージの集合体を選択する。イメージの集合体中の各イメージをＬＣ／ＭＳ（液体クロマトグラフィ／質量分析）イメージまたはレプリケートまたは構成イメージと呼ぶことができる。構成イメージの集合体はデータセレクタによって定義される様々な関心領域を含む。イメージデータベースからこの集合体を抽出することができ、あるいは適切なイメージが生成されるように、データセレクタをＬＣ／ＭＳ機器または他の機器（試料準備機器を含む）に結合することができる。
【００２４】
各関心領域を様々な方法で定義することは可能であるが、すべての方法は、関心領域を定義するために適切な強度の変動を使用する。合成イメージ上のピークの検出は、関心領域を定義するために使用できる１つの適切な強度の変動であり、このような定義（境界座標、区域など）は、構成イメージの集合体の中の関心領域を定義するのに使用され、それぞれのイメージは対応する関心領域を含む。これらの構成イメージを、合成イメージを形成する、構成イメージの平均化または最大投射（ｍａｘｉｍａｌｐｒｏｊｅｃｔｉｏｎ）などの適切な技術によって、合成イメージを生成するために使用することができる。（最大投射における、各ｘ、ｙ座標の組での構成イメージのいずれかに関連する最大値が、合成イメージの強度として選択される。）合成イメージ上のスポットなどの変動によって特徴境界が決定する。（本明細書で使用されるスポットとは、構成イメージの中で接触している区域を成す強度のピークである。）特徴的な境界、およびこれらの特徴的な境界から生じるマスクは他の構成イメージ上の対応する関心領域を同定するのに使用される。異なる構成イメージからの対応するピークは、通常、重なり合うか、または合成イメージ上で非常に近接している。
【００２５】
関心領域プロセッサ１１０はマイクロアライナ２０４を含む。マイクロアライナ２０４は、液体クロマトグラフィプロセスでの不確実な、または不十分な補正を補うために保持時間に沿って整列配置させる。一実施形態において、マイクロアライナ２０４は、ある関心領域のピクセルおよびそれに対応する関心領域を保持時間に沿って整列配列する。構成イメージの他の部分および構成イメージの他の関心領域は、考慮されず、関心領域のこれらの部分が同一の保持時間を有する場合でさえ影響を受けない。１回に１つだけの関心領域に、このように的を絞ることにより、従来の時間伸縮法の場合には可能でない整列配置が可能になる。
【００２６】
マイクロアライナ２０４は構成イメージの中の関心領域を整列配置するが、その構成イメージの境界はあらかじめ検出されている関心領域から得られている。検出は合成イメージを使用して行うことができる。構成イメージにおける関心領域のマイクロ整列配置は、スコア付けに役立てることができ、これらのスコアは、科学的発見を助ける、生物学的特徴またはそれらの欠如などの手がかりを明らかにする。スコア付けは、構成イメージが既に整列配置している場合、マイクロ整列配置なしに進めることができる。一部の事例においては、関心領域検出器２０６などを用いてマイクロ整列配置の後に関心領域の境界を再定義することが、関心領域の近傍におけるノイズを除去または最小限に抑えるのに有効であることがある。
【００２７】
マイクロアライナ２０４は、合成イメージが存在しない場合であっても関心領域の整列配置を改善することが可能である。この事例では、様々な構成イメージ上の関心領域は、これらの構成イメージ上で互いに対応する場合同定される。次に、マイクロアライナ２０４は対応する関心領域の一組を整列配置させる。マイクロ整列配置における合成イメージの１つの用法は、複数の構成イメージからの関心領域を関連付けることである。対応する関心領域の複数の組を合成イメージなしに同定できる場合、対応する関心領域のそれらの組をマイクロ整列配置できる。
【００２８】
関心領域プロセッサ１１０は関心領域検出器２０６を含む。マイクロ整列配置が実行された場合、関心領域検出器２０６は実行前の関心領域の検出を修正することができる。実行前の関心領域は、できの悪い整列配置が行われた構成イメージからなる合成イメージから検出された可能性がある。実行前の関心領域の境界が構成イメージの中の関心領域を見出すのに使用される場合、これらの関心領域が関心対象ではないピクセルを含んでいる場合がある。このようなピクセルはノイズであり、周囲のバックグラウンドおよび近傍の低質部分など、関心対象のピクセルを含む信号と区別すべき部分である。合成スニペット（関心領域などの合成イメージの一部分）を作成することによって、実行前の関心領域を、関心対象のピクセルをより多く、ノイズなどの関心対象でないピクセルをより少なく含むように再定義できる。ノイズが少なければ、信号はよりよく同定されるようになり、科学的発見につながる生物学的手がかりを明らかにするためのよりよいスコア付けができるようになる。
【００２９】
関心領域プロセッサ１１０はデータエクストラクタ２０８を含む。合成スニペットにおいて実行前の関心領域が再定義され、その中の関心対象のピクセルの位置を記述するために、２次元マスクが作成される。この２次元マスクは対応する関心対象（イメージスニペット）を得るのに使用され、それぞれの関心対象は構成イメージの関心領域に対応している。マイクロ整列配置が実行されている場合、マイクロ整列配置がすでになされた構成イメージを使用することが、対応する関心領域を得るために好ましい。これらマスクされたイメージスニペットは、スコア付けのために最終的に使用される２次元関心領域を構成する。これらマスクされたイメージスニペットから、特徴的なクロマトグラフおよび特徴的な質量スペクトルが得られる。また、各２次元イメージスニペットのシリアル化されたバージョンが作成される。
【００３０】
関心領域プロセッサ１１０は、相関エバリュエータ２１０を含む。相関エバリュエータ２１０は、質量／電荷スペクトル、液体クロマトグラフィクロマトグラフ、またはシリアル化されたイメージスニペットなどの、マスクされたイメージスニペットの中の対応する関心領域を比較して、相関スコアを算出する。関心領域の相互関係をスコア付けする際、相関イバリュエータ２１０は１つまたは複数のマイクロ整列配置がなされたイメージスニペットの中の対応する関心領域を選択する。正確には、相関スコアは、単一の処置条件および／または生物学的変種に属するレプリケートである構成イメージの集合体から算出される。このような相関スコアはピークなどの変動の信頼度を示す。大きな変動が予期される状況において、低い相関スコアは、重要な生物学的事象を示す可能性がある。複数の処置条件および／または生物学的変種が関与している場合、相関スコアを１つまたは複数の処置条件の特定の一組から導き出すことができ、あるいはそれぞれのレプリケートまたは処置条件にそれぞれ異なる重みを付けたスコア付けを行うことができる。これらのオプションから、低いスコアが低い再現性に起因し、重要な生物学的変異に起因するのではないことが明らかである。
【００３１】
対応する関心領域を定義する信号をそれぞれが含む、統計的に十分な数の構成イメージが存在する状況において、相関イバリュエータ２１０は条件内相関スコア付けを用い、選択された構成イメージの中の各関心領域（ピークまたは特徴などの変動）に均等に重みを付ける。データセレクタ２０２は、単一の、処置条件または生物学的変異を含むように構成イメージ選択を制限することがある。選択された構成イメージのうちの、１つの構成イメージの中の関心領域の中に変動が存在し、他の構成イメージの関心領域の中には存在しない場合、相関イバリュエータ２１０はその変動は信頼できないとみなし低い相関スコアが予期されることがある。
【００３２】
スコアが複数の生物学的変異および／または複数の実験条件から導き出される状況では相関イバリュエータ２１０は構成要素で重みを付ける相関スコア付けを使用する。さらに、そのような構成要素で重みを付ける相関スコア付けは、前述したような条件内相関スコア付けを可能にするために、単一の処置条件または生物学的変異に対して存在する構成イメージが非常に少ない状況に適している。したがって、複数の処置条件および生物学的変異からのイメージが使用される。構成要素重み付き相関スコア付けは、対応する関心領域の一組からの各関心領域（ピークなどの変動）の関連性を別々に考慮する。一つの変動内で、構成要素重み付き相関スコア付けは、関心領域内で見出された特性に基づき各構成イメージの関心領域に重み付けを行う。重み付けは、構成イメージ上の関心領域から導き出される他のスコアに基づくことも可能である。例えば、相関イバリュエータ２１０は、構成イメージの中の関心領域内の（ピーク体積、ピーク高などの）強度を使用できる。さらなる例として、信号がない場合、相関イバリュエータ２１０は、欠如した信号に関する重みは０であることを決定する。
【００３３】
関心領域プロセッサ１１０は、形状スコアラ２１２を含む。形状スコアラ２１２は関心領域での形状特性に関する形状スコアを計算する。形状スコアは、保持時間対称性、ピーク頂点からの保持時間単調性、面積、体積、最大高、標準偏差、面積対称性比、質量／電荷対称性、ピーク頂点からの質量／電荷単調性、前処理、周辺勾配、および接線体積比などのあらゆる形状に及ぶ。形状スコアは、単一のイメージに対して計算されるが、イメージは、個別の構成イメージまたは他のイメージの合成であっても良い。形状スコアは、関心領域に含まれる信号が科学的発見をさらに発展させるかどうかを研究者に示す。様々な関心領域における信号変動は、（グレースケールスポットなどの）２次元オブジェクトとして現れるため、これらの変動をその形状によって記述できる。有用な関心領域は、楕円形の区域、対照的な強度分布、領域重心からの強度の単調な減少などの一般的な形状特性を含む傾向がある。これらおよびその他の形状特性を使用すると、単一の構成イメージからの関心領域、または複数の構成イメージからの関心領域の集合体を分類できる。
【００３４】
前述したとおり、保持時間対称性、ピーク頂点からの保持時間単調性、面積、体積、最大値、標準偏差、面積対称性比、質量／電荷対称性、ピーク頂点からの質量／電荷単調性、立体感、周辺勾配、および接線体積比などの特徴に基づいてイメージにスコアを割り当てる幾何学的な方法が多数存在する。そのようなスコア付けのいくつかの例が、以下に説明される。
【００３５】
周辺勾配スコア付けを、代表的なＬＣ／ＭＳスポット、特徴、またはピーク１６００を表す図１６Ａ〜図１６Ｆに参照として示す。ピクセル輝度をグレースケール符号化する。図１６Ｂに示すように、スポット１６００の外側ピクセル１６０２は１ピクセル侵食操作によって除去される。外側ピクセル１６０２を図１６Ｃに示す。外周部ピクセル１６０２の平均輝度は、スポット１６００の外周部輝度として定義される。内周部ピクセル１６０４が、図１６Ｄ〜図１６Ｅに示されるとおり、さらなる１ピクセル侵食操作によって除去される。内周部ピクセル１６０４の平均輝度は、スポット１６００の内周部輝度として定義される。スポット１６０２の周辺勾配は外周部輝度に対する内周部輝度の比として定義される。信頼できるスポットは、約０．８、１．０、１．５、２．０またはそれより大きい勾配を超える周辺勾配を有する。外周部ピクセル１６０２および内周部ピクセル１６０４除去後の侵食操作されたスポット１６０６を図１６Ｆに示す。
【００３６】
立体感スコア付けは、平面オブジェクトを囲み、さらに凸状の反りだけを有する（すなわち、変曲がない）最小の２次元形状の内周部として定義された凸状の外殻に基づく。凸状の外殻を、伸ばした輪ゴムでオブジェクトの周囲をとめたといった形状として視覚化できる。凸状の外殻との類比により、凸状のライニングをオブジェクトに完全に囲まれた最も大きい凸形状の輪郭として定義することができる。凸状の外殻および凸状のライニングの、くぼみを有する形状１７０２、および突起を有する形状１７１２のものを図１７に示す。形状１７０２は、凸状の外殻１７０４および凸状のライニング１７０６を有する。形状１７１２は、凸状の外殻１７１４および凸状のライニング１７１６を有する。これらの定義に基づき、立体感を２つの方法で定義することができる。外殻立体感はオブジェクトの中にも入っている凸状の外郭の中のピクセルの数の割合である。ライニング立体感は凸状のライニングの中にも入っているオブジェクトの中のピクセルの割合として定義される。外殻立体感は、くぼみによってよりも突起によってより大きく影響され、ライニング立体感は、突起によってよりもくぼみによってより大きく影響される。立体感スコアの範囲は０から１まで取ることができる。１に近い立体感スコアはより信頼できるスポットを示す。スコアは０．５から１．０まで、０．６から１．０まで、または０．８から１．０までの範囲をとることが好ましい。
【００３７】
図１８は、接線体積比に基づくスコア付けを示す。一例であるピーク曲線１８００を参照すると、線分１８０４が、ピーク頂点１８０２からピーク終点１８０６まで延びている。線分１８０４およびピーク曲線１８０２は、凹状の下方区域１８１０（ピーク曲線１８０４とピーク曲線１８０２の間における、線分１８０４より上の区域）、および凹状の上方区域１８１２（ピーク曲線１８０４とピーク曲線１８０２の間における、線分１８０４より下の区域）を決定する。接線体積比は凹状の下方体積に対する凹状の上方体積の比として定義される。接線体積比は、０から無限大までの範囲をとることが可能であるが、約０．５、０．７５、１．０、２．０、３．０、５．０、および１０より大きいスコアが好ましく、しかしその他の範囲をとることもできる。少なくとも約３．０の接線体積比が好ましい例もある。
【００３８】
関心領域プロセッサ１１０はスコアコンバイナ２１４を含む。関心対象の生物学的特徴を明らかにし関心対象でない生物学的特徴を消去するように、スコアクラシファイア２１６において関心領域を分類する新たなスコアを導き出すために、スコアを単独で使用しても多くの適切な仕方で組み合わせてもよい。分類することによって関心領域を格付けしフィルタリングできるようになる。例えば、最高位に格付けされた関心領域以外はすべて消去することを望む科学者がいるかもしれない。コンピューター自動化によって、科学者との意思疎通なしに、様々なスコアによって定量化されたいくつかの標準を満たす関心領域を明らかにすることを実行できる。これらのスコアは、少なくとも２つのタイプ、すなわち、形状特性スコアおよび相関スコアから選択される。
【００３９】
図３Ａ〜図３Ｄは、マイクロ整列配置を行う前の構成イメージ３００ａ、構成イメージ３００ｂ、および構成イメージ３００ｃの従来の時間伸縮を示し、これらから合成イメージ３００ｄが得られる。構成イメージのそれぞれは、ピークとして現れる４つの変動を示す。合成イメージ３００ｄは、これらの変動のうち１つが整列配置しているが残りの変動は不整配置であることを示す。この主題の様々な実施形態において、マイクロ整列配置は、１回に１つの関心領域を整列配置させ構成イメージにおける残りの関心領域は考慮しない。様々な変動が、地形図の場合と同様に等強度線を表す等高線として現れることに留意されたい。図３Ｅ〜図３Ｆは関心領域の検出を示す。関心領域の一組は、変動３００ｅの境界を同定することによって合成イメージの中で見出される。これらの変動を除去すると、関心領域３００ｆの組によって示されるとおり長方形の境界３００ｆが残る。望ましくないノイズである可能性がある、重なり合う変動（等高線の干渉）に注目されたい。
【００４０】
図４Ａ〜図４Ｄは、変動をよりよくマイクロ整列配置させる変動の境界の時間的拡大を示す。合成イメージ４００ａの中の変動の境界は、保持時間における逆方向の拡大および保持時間における順方向の拡大を示す矢印を有する長方形として示される。同様に、合成イメージ４００ａの中の変動に対応する構成イメージ４００ｂの中の変動の境界が拡大される。さらに、合成イメージ４００ａの中の変動に対応する構成イメージ４００ｃの中の変動の境界が同様に拡大される。さらに、合成イメージ４００ａの中の変動に対応する構成イメージ４００ｄの中の変動の境界が拡大される。一実施形態において、１保持時間幅分早く、１保持時間幅分遅く拡大され、したがって、関心領域は現時点で保持時間次元において３倍長くなるが、より小さく拡大、またはより大きく拡大して使用することもできる。
【００４１】
図５Ａ〜図５Ｄは、マイクロ整列配置ウインドウ５００ａに基づく様々な関心領域５００ｂ、５００ｃ、および５００ｄのマイクロ整列配置を示す。図２におけるマイクロアライナ２０４に関連する説明を参照されたい。図５Ａ〜図５Ｄに示すように、マイクロ整列配置は、様々な構成イメージにおける他の関心領域をマイクロ整列配置させない。関心領域５００ｂ、５００ｃ、および５００ｄは、保持時間次元において移動されており、すべての関心領域５００ｂ、５００ｃ、および５００ｄが現時点で互いに整列配置されて見える。構成イメージの他の部分は整列配置していない。
【００４２】
図６Ａは、関心領域５００ｂ、５００ｃ、および５００ｄを多重化して形成した合成イメージ６００ａをマイクロ整列配置した変動を示す。図６Ｂは、マイクロ整列配置した変動を、余分な背景を消去する境界６００ｂとよりよくあわせるための、合成イメージ信号変動の修正された領域定義を示す。境界６００ｂを使用して、図６Ｃ〜図６Ｅに示されるとおり、さらに図２に示される関心領域検出器２０６を参照して説明されるとおり、様々な構成イメージにおける境界６００ｂによって規定された境界に基づいて、関心領域（イメージスニペット）６００ｃ、６００ｄ、６００ｅは割り当てられる。イメージスニペット６００ｃ、６００ｄ、６００ｅにおける、これらの新たにマイクロ整列配置した、対応する領域は、マイクロ整列配置の前と比べて比較分析によりよく適している。合成イメージおよび合成イメージを構成するイメージのその他の関心領域は、すべての関心領域のマイクロ整列配置が実行されるように同様のプロセスを経る。多くの事例において、領域再定義を行うと、より小さい領域に、信号がより多く、ノイズがより少なく含まれるようになり、同様に干渉する信号がより少なく含まれるようになる。
【００４３】
図７Ａ、図７Ｃ、および図７Ｄは、余計な背景区域を除くように関心領域が再定義されている、マイクロ整列配置したイメージスニペット７００ａ、７００ｂ、および７００ｃを示す。図７Ｂ、図７Ｄ、および図７Ｆは、関心対象の生物学的特徴を分類するための相関スコアを生成した後の相関分析に適したピクセルを明確にするために、マイクロ整列させられたイメージスニペット７００ａ、７００ｂ、および７００ｃの上に置かれた、重ね合わされたピクセルマップ７００ｄ、７００ｅ、および７００ｆを示す。位置（１、４、４１、および４４）におけるピクセルは、マスクされた関心領域の外に存在するので考慮されない。従来の分析とは異なり、この主題の様々な実施形態において、関心領域を領域的に再定義して、形状特性のよりよいスコアをもたらすことに留意されたい。さらに、１つの構成イメージからのピクセルが、別の構成イメージの同一の位置におけるピクセルと比較され得るため、このようなピクセルごとの比較を活用して、関心対象の生物学的特徴を分類するための相関スコアがよりうまく生成されることが可能である。
【００４４】
図８Ａは、いくつかの行といくつかの列を含む２次元マスク８００ａを示す。各行と各列の交点を項Ｕ_ijとする。ここでｉ、ｊは、行位置および列位置をそれぞれ特定する正の整数である。このような命名法をマスクにおけるすべてのピクセルに適用できる。図８Ｂは、マスク８００ａによって明らかにされる様々な輝度値を示す、マスクされたスニペット８００ｂを示す。図８Ｃは、マスク８００ａによって明らかにされる様々な輝度値をやはり示す、別のマスクされたスニペット８００ｃを同様に示す。同様に、図８Ｄは、マスク８００ａによって明らかにされる様々な輝度値をさらに示す、さらなるマスクされたスニペット８００ｄを示す。
【００４５】
図９は、行および列に対応するデータを含むテーブル９００を示す。第１の列は、マスク８００ａによって確立されたピクセルラベルを含み、マスク化された２次元イメージスニペット８００ｂ、８００ｃ、および８００ｄをシリアル化するのに使用される。第２、第３、および第４の列は構成ベクトルを表し、さらにマスクされたスニペット８００ｂ、８００ｃ、および８００ｄから得られ、テーブル９００の第１の列によって決定される順序でシリアル化されたピクセル輝度値を含む。第５の列は、「コンセンサス」と名付けられ、先行する３つの列からのデータから計算されたコンセンサスベクトルデータを含む。一実施形態において、コンセンサスベクトルデータは、先行する３つの列の算術平均である。
【００４６】
図１０は、テーブル９００のデータ点からなるグラフ１０００を示す。具体的には、コンセンサスベクトル（テーブル９００の第５の列に示される値）が、各構成ベクトル（値が、テーブル９００の第２の列、第３の列、および第４の列に示される）と対にされる。相関イバリュエータ２１０が、ベクトル同化のために後に使用される、プロットされた線のそれぞれの傾きおよび切片（ｉｎｔｅｒｃｅｐｔｓ）を算出する。グラフ１０００は、すべての構成値に関する応答値としてコンセンサス値をプロットする。これらの関係から同化パラメータを評価できる。原点にある切片との線形関係が存在する場合、与えられた構成ベクトルに関する同化パラメータは、コンセンサスベクトルの値に合わせられた線の傾きである。
【００４７】
図１１は、図１０に示されるデータから導き出された別のグラフ１１００を示す。構成ベクトルの（テーブル９００の第２の列、第３の列、および第４の列に示される）値は、それぞれの線形フィットから求めた傾きを掛けて修正されている。つまり、同化は、各構成ベクトルに、コンセンサスベクトル対それぞれの構成ベクトルの傾きを掛けることによって行われている。同化の後、コンセンサスベクトルに対する各構成ベクトルの線形フィットの傾きは、１により近い。
【００４８】
図１２は、データが、図１１に示されるグラフ１１００にグラフ化されているデータと同一のデータを用いたグラフ１２００である。グラフ１２００は、これら３つの構成ベクトルの区別をしていない。コンセンサスベクトルからの輝度と、同化されたすべての構成ベクトルの輝度との間の関係から、モデルがたてられる。つまり、イメージスニペットの間の区別は取り除かれており、最もよくフィットしている線がプロットされている。相関スコアはグラフ１２００の中の点の或る線に対するフィッティングに基づく。例えば、線形フィットへの最小二乗回帰の相関スコアが、データが互いにどれだけよく相関するかを示す。
【００４９】
図１３Ａ〜図１３Ｙは、生物学的特徴を発見するために関心領域を処理する方法１３０００を示す。方法１３０００は、開始ブロックから方法ステップの一組１３００２に進む。方法ステップの一組１３００２は継続端子（「端子Ａ」）と終了端子（「端子Ｂ」）の間と定義される。方法ステップの一組１３００２はデータ選択プロセスの実行を表す。ここで、データは前処理された生体サンプルから抽出される。端子Ａ（図１３Ｄ）から、方法１３０００は、ブロック１３０１８に進んで、ＬＣ／ＭＳイメージ（構成イメージ）の一組を生成するＬＣ／ＭＳ処理を実行する。ブロック１３０２０で、オプションとして、時間伸縮アルゴリズムを実行して構成イメージのセットを整列配置させる。ブロック１３０２２で、構成イメージの一組から合成イメージが形成される。次に、方法１３０００は、ブロック１３０２４で、合成イメージの中の（ピークの検出などの）変動の検出により、合成イメージの中の関心領域を同定する。ブロック１３０２６で、合成イメージの中の様々な関心領域を規定する座標を得る。これらの座標を使用して、方法１３０００は、ブロック１３０２８で、合成イメージの中のそれぞれの関心領域と関係する構成イメージにおける様々な関心領域を規定する。ブロック１３０３０で、或る基準（実験上の定義、実験条件、または生物学的変異）に基づいて、構成イメージのサブセットを選択するよう命令される。次に、方法１３０００は、終了端子Ｂに進む。
【００５０】
構成イメージのサブセットは、１つの構成イメージからの単一の関心領域に関係する、または構成イメージの集合体に対応する関心領域の一組（構成イメージごとに１つの関心領域）に適切であると思われるスコアを生成するために、後のスコア付けプロセスに加わる。相関スコア付けのための構成イメージを選択する際に、（イオンとして登録された）化学物質が、１つの条件において存在するが、別の条件においては存在しない場合があることを認識することが適切である。選択された構成イメージが、複数の処置条件または複数の生物学的変異からである場合、１つの条件において信号が存在しない状態が、別の条件において化学物質の存在によって現れた別の信号が存在する状態と比較されるため、（ピークなどの）重要な変動との相関が弱いことが予想される。これらのスコアは、信頼できるデータを信頼できないデータから区別するのに使用できる場合があるので、いくつかの条件の間の関係のある変動が、信頼できないと誤認される可能性がある。様々な構成イメージから関連する領域を表す適切な条件を選択することによって、この状況に対処することができる。例えば、或る時点で或る特定の条件を表すスコアのなかかの平均スコア、中心スコア、最良スコア、最悪スコア、または最も強力なスコアを選択することができる。すべての構成イメージの関心領域が、この１つのスコアを引き継ぐ。この方法を、条件内相関スコア付けと名付け、後段で説明する。原則として、この方法は条件にかかわらず２つ以上のイメージに適用できる。代替として、異なる統計方法を使用することにより、化学物質が条件のいくつかにおいてだけ現れる、複数の条件を元に重み付けした構成要素を、使用できるようになる。この後者の方法は、構成要素重み付き相関スコア付けと名付けられ、後段で説明される。この方法は、或る条件における構成イメージの数が少なく、疑わしい統計的結論が生じるような事例において使用できる。
【００５１】
端子Ｂ（図１３Ａ）から、方法１３０００は、継続端子（「端子Ｃ」）と終了端子（「端子Ｄ」）の間に規定される方法ステップの一組１３００４に進む。方法ステップ１３００４の一組は、オプションであるマイクロ整列配置プロセスを実行して、マクロ整列配置を用いる必要なしに関心領域を整列配置させる。
【００５２】
端子Ｃ（図１３Ｅ）から、方法１３０００は、まだ処理のためにスコア付けされていない合成イメージの中の元の関心領域を同定するブロック１３０３２に進む。ブロック１３０３４で、方法は、合成イメージの中の元の関心領域と関係する構成イメージのサブセットの中の関心領域を同定する。ブロック１３０３６で、方法は、合成イメージの中の元の関心領域の幅を（保持時間次元において）測定する。次に、方法は、様々な構成イメージにおける同定された各関心領域に、同一の測定された幅を持たせる（ブロック１３０３８を参照されたい）。ブロック１３０４０で、方法は、同定された各関心領域の幅を、保持時間次元において逆方向および順方向にさらに拡大する。この拡大により、関心領域の初期定義において除外されている可能性がある、関係のある信号を含めることができる。一実施形態において、測定された幅だけ両方向に拡大し、幅を３倍増加させる。この方法は、オプションとして、ブロック１３０４２で、１などの許容誤差だけ変更された中心Ｍ／Ｚにおけるクロマトグラフに的を絞るように、同定された各関心領域の高さを減少させる。ブロック１３０４４で、方法は、マイクロ整列配置のためのマスタイメージを同定するプロセスを開始する。次に、方法は、別の継続端子（「端子Ｃ１」）に進む。
【００５３】
端子Ｃ１（図１３Ｆ）から、方法１３０００は、元の関心領域がマスタスニペットとして選択されるかどうかを判定する試験が実行される判定ブロック１３０４６に進む。判定ブロック１３０４６における試験への答えが、「いいえ」である場合、方法１３０００は、マスタスニペットが、構成イメージおよび合成イメージのなかから選択されるブロック１３０４８に進む。次に、方法は、別の継続端子（「端子Ｃ７」）に進む。代わりに、判定ブロック１３０４６における試験への答えが、「はい」である場合、方法は、別の継続端子（「端子Ｃ２」）に進む。
【００５４】
端子Ｃ２（図１３Ｆ）から、方法１３０００は、方法が、元の関心領域と互いに関係する構成イメージのサブセットにおける関心領域を（見込まれるマスタスニペットとして）見出すことを開始するブロック１３０５０に進む。ブロック１３０５２で、元の関心領域は、行列Ｕ＝ｕ_ijであり、さらに見込まれるマスタスニペットは、Ｖ＝ｖ_ikと定義される。ブロック１３０５４に示されるとおり、変数ｋは、ｎが、元の関心領域の（ピクセル単位の）幅である、ｊ−ｎ，．．．，ｊ＋ｎの範囲をとり、変数ｉは、質量／電荷次元において１からｍまでの範囲をとり、さらに変数ｊは、保持時間次元に沿って１からｎまでの範囲をとる。ブロック１３０５６で、ｖ（ｑ）が、見込まれるマスタスニペットから導き出される。変数ｑは、保持時間シフト（ｒｅｔｅｎｔｉｏｎｔｉｍｅｓｈｉｆｔ）を表し、ブロック１３０５６に示されるとおり、−ｎから，．．．，ｎまでの範囲をとる。次に、方法１３０００は、別の継続端子（「端子Ｃ３」）に進む。
【００５５】
端子Ｃ３（図１３Ｇに示される）から、方法は、ブロック１３０５８で、正規化された相互相関最大値ｔ₁（ｑ）を計算することを準備する。ブロック１３０６０で、方法は、この項を計算する。
【００５６】
【数１】

【００５７】
項
【００５８】
【数２】

【００５９】
は、前述の数学演算の結果である。ブロック１３０６２で、方法は、以下の項をさらに計算する。
【００６０】
【数３】

【００６１】
得られた結果
【００６２】
【数４】

【００６３】
は、そのような数学演算の結果である。方法１３０００は、ブロック１３０６４に進み、以下の項
【００６４】
【数５】

【００６５】
からｔ₁（ｑ）を計算する。
【００６６】
方法１３０００は、別の継続端子（「端子Ｃ４」）に進む。端子Ｃ４（図１３Ｇ）から、方法は、被除数と除数の商である線形相関係数最大値ｔ₂（ｑ）を計算することを準備するブロック１３０６６に進む。ブロック１３０６８で、被除数が、以下のとおり計算される。
【００６７】
【数６】

【００６８】
ブロック１３０７０で、除数が、以下のとおり、計算される。
【００６９】
【数７】

【００７０】
次に、方法１３０００は、別の継続端子（「端子Ｃ５」）に進む。
【００７１】
端子Ｃ５（図１３Ｈ）から、方法は、正規化された最小二乗差最小値ｔ₃（ｑ）を計算することを準備する。ブロック１３０７２を参照されたい。方法は、以下の式を計算する。
【００７２】
【数８】

【００７３】
ブロック１３０７４を参照されたい。次に、方法は、別の継続端子（「端子Ｃ６」）に進む。端子Ｃ６（図１３Ｈ）から、方法は、関心領域に関するスコアが、正規化された相互相関最大値、線形相関係数最大値、および正規化された最小二乗差最小値のなかから選択されるブロック１３０７６に進む。方法１３０００は、評価されるべき別の関心領域が存在するかどうかを判定する試験が実行される判定ブロック１３０７８に進む。判定ブロック１３０７８における試験への答えが、「はい」である場合、方法は、端子Ｃ２に進み、上記で定められた処理ステップが繰り返されるブロック１３０５０にループバックする。そうではなく、判定ブロック１３０７８における試験への答えが、「いいえ」である場合、方法は、合成イメージの中の元の関心領域と最もよく相関するスコアを有する関心領域が、マイクロ整列のためのマスタスニペットとして選択されるブロック１３０８０に進む。次に、方法は、別の継続端子（「端子Ｃ７」）に進む。
【００７４】
端子Ｃ７（図１３Ｉ１）から、方法は、マスタスニペットとのマイクロ整列配置のために、サブセットにおける構成イメージの中の関心領域（イメージスニペット）を選択する。ブロック１３０８２を参照されたい。マスタスニペットは、行列Ｕ＝ｕ_ijであり、さらにマイクロ整列配列させられるイメージスニペットは、Ｖ＝ｖ_ikと定義される。ブロック１３０８４を参照されたい。さらに、ｎは、元の関心領域の（ピクセル単位の）幅であり、さらにｉは、質量／電荷次元において１からｍまでの範囲をとり、さらにｊは、保持時間次元に沿って１からｎまでの範囲をとり、さらにｋは、保持時間次元に沿ってｊ−ｎからｊ＋ｎまでの範囲をとる。ブロック１３０８３、１３０８５を参照されたい。ｖ（ｑ）は、−ｍ，．．．，ｎの範囲にあるｋを（保持時間次元において）ｑ移動させることによって、イメージスニペットｖ_ikから導き出される。ブロック１３０８６を参照されたい。ｑは、ｋ−ｑ≠ｊであるため、マッチしないピクセルを除外して、マスタスニペットｕ_ijに対するｖ（ｑ）の輝度の適切な相関に基づいて、計算される。ブロック１３０８８を参照されたい。時間整列配置の様々な方法を使用できる。以下は、いくつかの方法の例である。
【００７５】
ｔ₁（ｑ）が端子Ｃ３、Ｃ４の間に示されている正規化された相互相関最大値を使用して最大化されるように、ｑの１つの値が計算される。ブロック１３０９０を参照されたい。方法１３０００は、別の継続端子（「端子Ｃ１１」）に進む。
【００７６】
端子Ｃ１１（図１３Ｉ２）から、ｔ₂（ｑ）が端子Ｃ４、Ｃ５の間に示されている線形相関係数最大値を使用して最大化されるように、ｑの別の値が計算される。ブロック１３０９２を参照されたい。ｔ₃（ｑ）が端子Ｃ５、Ｃ６の間に示される正規化された最小二乗差最小値を使用して最小化されるように、ｑのさらなる値が計算される。ブロック１３０９４を参照されたい。次に、方法１３０００は、別の継続端子（「端子Ｃ８」）に進む。
【００７７】
端子Ｃ８（図１３Ｊ）から、方法は、適切なマイクロ整列配置を同定する相関が存在するかどうかを判定する試験が実行される判定ブロック１３０９６に進む。判定ブロック１３０９６における試験への答えが、「はい」である場合、マスタスニペットとの適切な相関をもたらす移動されたイメージスニペットは、さらなる処理のために保持される。ブロック１３０９８を参照されたい。次に、方法は、別の継続端子（「端子Ｃ９」）に進む。判定ブロック１３０９６における試験への答えが、「いいえ」である場合、方法は、別の判定ブロック１３１００に進み、重心整列配列が使用されるべきかどうかを判定する試験が実行される。判定ブロック１３１００における試験への答えが、「はい」である場合、方法は、イメージスニペットの最大値または重心が、マスタスニペットの最大値または重心と一致するように、イメージスニペットの保持時間を移動させる。ブロック１３１０２を参照されたい。次に、方法は、端子Ｃ９に進む。判定ブロック１３１００における試験への答えが、「いいえ」である場合、方法は、別の継続端子（「端子Ｃ１０」）に進む。
【００７８】
端子Ｃ１０（図１３Ｋ）から、方法は、適応整列配置などの別の整列配置方法が使用されるべきかどうかを判定する試験が実行される判定ブロック１３１０４に進む。判定ブロック１３１０４における試験への答えが、「はい」である場合、方法は、その別の形態の整列配置を実行して、マスタスニペットに対してイメージスニペットをマイクロ整列配置させる。ブロック１３１０６を参照されたい。次に、方法は、端子Ｃ９に進む。判定ブロック１３１０４における試験への答えが、「いいえ」である場合、方法は、端子Ｃ９に進み、マイクロ整列配置のための別の関心領域が存在するかどうかを判定する試験が実行される判定ブロック１３１０８にさらに進む。判定ブロック１３１０８における試験への答えが、「はい」である場合、方法は、端子Ｃ７に進み、以上に示された処理ステップが繰り返されるブロック１３０８２にループバックする。そうではなく、判定ブロック１３１０８における試験への答えが「いいえ」である場合、方法は、終了端子Ｄに進む。
【００７９】
端子Ｄ（図１３Ａ）から、方法１３０００は、継続端子（「端子Ｅ」）と終了端子（「端子Ｆ」）の間に規定される方法ステップのセット１３００６に進む。方法ステップのセット１３００６は、後のスコア付けプロセスに適したピクセルに的を絞る改訂された関心領域検出プロセスを実行する。
【００８０】
端子Ｅ（図１３Ｌ）から、方法は、マイクロ整列配置が実行されたかどうかを判定する試験が実行される判定ブロック１３１１０に進む。判定ブロック１３１１０における試験への答えが、「いいえ」である場合、方法は、終了端子Ｆに進む。そうではなく、判定ブロック１３１１０における試験への答えが、「はい」である場合、方法は、ブロック１３１１２で、（合成イメージの中の元の関心領域とは異なる）合成スニペットを作成するステップを実行する。
【００８１】
ブロック１３１１４で、方法は、移動されたイメージスニペットの諸部分を、それらの部分が元の関心領域およびマスタスニペットｕ_ijと重なり合う場合、（ピクセルごとに）組み合わせて、イメージｖ_ikに関するｋ−ｑ＝ｊがｑだけ移動されるようにする。ブロック１３１１６で、方法は、新たに作成された合成イメージスニペットに従い、関心領域を再検出する。方法は、閾値化、分水界分析、ラプラスガウシアン（ＬａｐｌａｃｅｏｆＧａｕｓｓｉａｎ）畳み込みによる水平エッジ検出または径方向エッジ検出によって（ピーク検出またはスポット検出などの）変動を検出して、合成スニペットの中で新たなピークマスクを同定する。ブロック１３１１８を参照されたい。ブロック１３１２０で、方法は、スクリプト化されたピクセルの２次元マスクの使用を含め、関心領域を記述する方法を選択する。この２次元マスクは、相関スコアおよび形状スコアの計算に加わるピクセルを同定する。次に、方法は、終了端子Ｆに進む。
【００８２】
端子Ｆ（図１３Ｂ）から、方法１３０００は、継続端子（「端子Ｇ」）と終了端子（「端子Ｈ」）の間に示される方法ステップの一組１３００８に進む。方法ステップの組１３００８は、データ抽出を実行して、スコア付けプロセスを準備する。端子Ｇ（図１３Ｍ）から、方法は、サブセットの各構成イメージに２次元マスクを適用して、新たな関心領域を獲得する。ブロック１３１２２を参照されたい。次に、方法１３０００は、各２次元イメージがシリアル化されるブロック１３１２３に進む。このことは、各スニペットに関して、方法が、ピクセル輝度の１次元ベクトルを生成することを意味する。つまり、１つのスニペットからのピクセル輝度の数値が、ベクトルを形成するように線形のやり方で１列に並べられる。マスクされた区域がＰ個のピクセルを含むスニペットを与えられ、方法は、１からＰまでの固有の番号で各ピクセルにラベルを付ける。これらの番号は、２Ｄイメージスニペットの輝度に対して長さＰのベクトルの輝度を設定する任意のピクセル順序を確立する。具体的には、ベクトルの中の位置ｊにおける輝度が、ラベルがｊである２Ｄイメージスニペットの中のピクセルの輝度に設定される。つまり、これらのラベルは、２Ｄイメージスニペットの輝度を長さＰのベクトルの輝度に関係付ける、任意のピクセル順序を構成する。関係するマスクされたすべての関心領域に関して同一の順序が使用される限り、任意のピクセル順序を使用できる。このベクトルは、同一のマスクでマスクされておりさらに同一の順序でシリアル化されている、他のイメージスニペットと互いに関係付けられる。ブロック１３１２４で、方法は、構成イメージの各関心領域（構成スニペット）から特徴的なクロマトグラムを決定する。或る許容誤差を有する中心ｍ／ｚを有するマスクされたピクセルのクロマトグラムが使用される場合に、これらの特徴的なクロマトグラムを決定できる。許容誤差は、通常１ピクセルであるが、０からイメージスニペットの境界までの範囲をとることができる。それぞれのイメージスニペットにおけるマスクされたピクセルの重心または最大値の使用を含め任意の適切な技術において、中心ｍ／ｚを決定できる。代替として、各保持時間ですべてのｍ／ｚにわたって、マスクされたピクセルを積分または平均することによって、特徴的なクロマトグラムを得ることもできる。
【００８３】
ブロック１３１２６で、方法は、構成イメージの各関心領域（構成スニペット）から特徴的な質量スペクトルを決定する。イメージスニペットの特徴的なクロマトグラムの許容誤差を有する、輝度最大値または重心の、保持時間において、それぞれの特徴的なスペクトルをとることができる。許容差は通常１ピクセルであるが、０からイメージスニペットの境界までの範囲をとることができる。代替として、各ｍ／ｚ間隔ですべての保持時間にわたって、マスクされたピクセルを積分または平均することによって、特徴的なスペクトルを得ることもできる。
【００８４】
ブロック１３１２８で、方法は、形状特性を抽出するために、構成スニペットが関係する合成スニペットをメンバが含む可能性がある、構成スニペットの一組のメンバを選択する。ブロック１３１３０で、方法は、相関スコアを計算するために、構成スニペットが関係する合成スニペットをメンバが含む可能性がある、構成スニペットのセットのメンバをさらに選択する。次に、方法は、終了端子Ｈに進む。
【００８５】
端子Ｈ（図１３Ｂ）から、方法１３０００は、継続端子（「端子Ｉ」）と終了端子（「端子Ｊ」）の間に示される方法ステップの一組１３０１０に進む。方法ステップの組１３０１０は、質量／電荷スペクトル、液体クロマトグラフクロマトグラム、および／またはシリアル化された２次元ＬＣ／ＭＳスニペットのなかから選択されたデータの組に関して、相関スコアを計算する。
【００８６】
端子Ｉ（図１３Ｎ１）から、方法１３０００は、方法が、（シリアル化されたイメージ、クロマトグラム、またはスペクトルの）いずれのタイプのデータを処理するかを決定することを準備するブロック１３１３１に進む。方法は、関係する関心領域のシリアル化されたスニペットに関する相関スコアを方法が既に計算しているかどうかを判定する試験が実行される判定ブロック１３１３２に進む。判定ブロック１３１３２における試験への答えが、「いいえ」である場合、方法１３０００は、ブロック１３１３３に進む。そうではなく、判定ブロック１３１３２における試験への答えが、「はい」である場合、方法は、別の継続端子（「端子Ｉ１Ａ」）に進む。ブロック１３１３３で、各構成要素につき１つの、シリアル化されたイメージスニペットが、相関のために準備される。シリアル化されたイメージスニペットは、行列としてひとまとめにされることが可能な等しい長さのベクトルの一組とみなされる。方法は、別の継続端子（「端子Ｉ２」）に進む。端子Ｉ１Ａ（図１３Ｎ２）から、方法１３０００は、方法が、関係する関心領域のクロマトグラムに関する相関スコアを既に計算しているかどうかを判定する試験が実行される判定ブロック１３１３４に進む。判定ブロック１３１３４における試験への答えが、「いいえ」である場合、方法１３０００は、ブロック１３１３５に進む。そうではなく、判定ブロック１３１３４における試験への答えが、「はい」である場合、方法は、ブロック１３１３６に進む。ブロック１３１３５で、各構成要素につき１つのクロマトグラムが相関のために準備される。クロマトグラムは、行列としてひとまとめにされることが可能な等しい長さのベクトルの一組と考えられる。ブロック１３１３６で、各構成要素につき１つのスペクトルが、相関のために準備される。スペクトルは、行列としてひとまとめにされることが可能な等しい長さのベクトルの一組と考えられる。方法は、別の継続端子（「端子Ｉ２」）に進む。
【００８７】
端子Ｉ２（図１３Ｏ）から、方法は、ｎ×ｍ行列を構成する１次元ベクトルの集合体を使用して相関スコア（信号信頼性の測度）を決定することを始めるブロック１３１４０に進む。相関イバリュエータ２１０への入力データは、１つの構成イメージスニペットをそれぞれが表す、等しい長さの順序付けられたベクトルの一組である。この組は、ブロック１３１２４において決定されたクロマトグラム、またはブロック１３１２６において決定されたスペクトル、または共通の関心領域に属する、ブロック１３１２３において決定された、シリアル化された（ピークなどの）２次元変動を含むことがある。相関イバリュエータ２１０の出力データは、これらのベクトルが、互いにどれだけよく相関するかを示すスコアである。この相関は、信号信頼性の評価基準と解釈される。方法は、ブロック１３１４２で、構成イメージ１、２、３、．．．、ｎを表すベクトルを取り上げ、これらのベクトルを、すべて長さｍの構成ベクトルａ₁、ａ₂、ａ₃、．．．、ａ_nとして表す。ブロック１３１４４で、これらの構成ベクトルは、以下のとおり、ｎが、構成イメージの数であり、さらにｍが、相関させられることが可能なデータ点の数である、ｎ×ｍ行列Ａ＝ａ_ijを形成する。
【００８８】
【数９】

【００８９】
行列Ａは、相関イバリュエータ２１０への入力である。
【００９０】
ブロック１３１４６で、方法は、コンセンサスベクトルを決定することを始める。方法は、構成ベクトル異常値が除外されるべきかどうかを判定する試験が実行される判定ブロック１３１４８に進む。判定ブロック１３１４８における試験への答えが、「いいえ」である場合、方法は、別の継続端子（「端子Ｉ４」）に進む。判定ブロック１３１４８における試験への答えが、「はい」である場合、方法は、方法が、中心傾向ベクトルに対して最小の相関係数を生成する構成ベクトルを見出すブロック１３１５０に進む。方法は、別の継続端子（「端子Ｉ３」）に進む。
【００９１】
端子Ｉ３（図１３Ｐ）から、方法は、異常値であることを見出された構成ベクトルを、コンセンサスベクトルの決定に参加することから除外する。ブロック１３１５２を参照されたい。代替として、中心傾向ベクトルと（最高のピアソンの相関係数をもって）最もよく相関するベクトルが、ａ₁、ａ₂、ａ₃、．．．、ａ_nのなかから見出されることが可能である。このシナリオにおいて、最もよく相関するベクトルは、新たなコンセンサスベクトルである。
【００９２】
次に、方法は、ブロック１３１５４に続いている継続端子Ｉ４に進み、相関イバリュエータが、行列Ａにおける構成ベクトルの組、ａ₁、ａ₂、ａ₃、．．．、ａ_nのなかから中心傾向を適切に表すコンセンサスベクトルｂを作成する。方法１３０００は、平均ベクトルが使用されるべきかどうかを判定する試験が実行されるブロック１３１５６に進む。判定ブロック１３１５６における試験への答えが、「いいえ」である場合、方法は、別の継続端子（「端子Ｉ５」）に進む。そうではなく、判定ブロック１３１５６における試験への答えが、「はい」である場合、方法は、コンセンサスベクトルが以下のとおり計算されるブロック１３１５８に進む。
【００９３】
【数１０】

【００９４】
次に、方法は、別の継続端子（「端子Ｉ７」）に進む。
【００９５】
端子Ｉ５（図１３Ｑ）から、方法１３０００は、平均ベクトルが使用されるべきかどうかを判定する試験が実行される判定ブロック１３１６０に進む。判定ブロック１３１６０における試験への答えが、「いいえ」である場合、方法は、別の継続端子（「端子Ｉ６」）に進む。そうではなく、判定ブロック１３１６０における試験への答えが、「はい」である場合、方法は、コンセンサスベクトルが以下のとおり計算されるブロック１３１６２に進む。
ｂ_i＝ｍｅｄｉａｎ（ａ_ij）、ただし、ｊ＝１，．．．，ｎ
【００９６】
次に、方法は、別の継続端子（「端子Ｉ７」）に進む。
【００９７】
端子Ｉ６（図１３Ｑ）から、方法１３０００は、相関を使用して、中心傾向ベクトルと（より高いピアソンの相関係数をもって）適切に相関するベクトルが、ａ₁、ａ₂、ａ₃、．．．、ａ_nのなかから決定され、さらにそのベクトルをコンセンサスベクトルと定義するブロック１３１６４に進む。行列におけるベクトルの組の中の輝度の差が、生物学的特徴を発見するために重要である。しかし、この主題の様々な実施形態において、表現の量の差が焦点になっているのではなく、代わりに、相関イバリュエータ２１０は、信号が、関心領域内で１つの構成イメージから別の構成イメージに相関するかどうかを判定する。
【００９８】
同化プロセスによって、信号の大きさの一貫した差を考慮することなしに、関係する関心領域の間の信号が相関をもてるようになる。ブロック１３１６６を参照されたい。次に、方法は、端子Ｉ７に進む。端子Ｉ７（図１３Ｒ）から、方法は、式ｘ_j＝ｃ_j＋ｓ_jａ_jなどのスケーリング変換または線形変換を使用して、構成ベクトルａ₁、ａ₂、ａ₃、．．．、ａ_nのそれぞれを、コンセンサスベクトルｂに独立に同化させる。項ｘ_jは、第ｊ番の構成ベクトルａ_jの同化された形態である。ブロック１３１７０を参照されたい。ｃ_jおよびｓ_jは、コンセンサスベクトルｂに構成ベクトルａ_jを線形フィットさせて決定される。ブロック１３１７２を参照されたい。ブロック１３１７４で、コンセンサスベクトルｂに対する各構成ベクトルａ_jの最小二乗線形相関を使用して、パラメータｃ_jおよびｓ_jを、式ｂ＝ｃ_j＋ｓ_jａ_jから決定できる。方法１３０００は、構成イメージのデータが、適格であるかどうかを判定する試験が実行される判定ブロック１３１７６に進む。適格なデータは、ａ_ij＞０、ｂ_i＞０、ｃ_j＝０、およびｓ_j＞０である、線形関係によってモデル化されることが可能である。このモデルは、（ピークなどの）現れた変動が分離され、さらに背景が無視できるという前提に基づいて、構成ベクトルを同化させる。イメージスニペットが、大きく異なる背景を含む範囲内で、原点を通るように強制される線形回帰は、より大きい変動をもたらし、そのため、より低い相関スコアをもたらす可能性がある。
【００９９】
判定ブロック１３１７６における試験への答えが、「いいえ」である場合、方法は、別の継続端子（「端子Ｉ８」）に進む。そうではなく、判定ブロック１３１７６における試験への答えが、「はい」である場合、方法は、別の継続端子（「端子Ｉ９」）に進む。
【０１００】
端子Ｉ８（図１３Ｓ）から、項ｃ_jは、被除数と除数の商である。ブロック１３１７８を参照されたい。ブロック１３１８０で、項ｃ_jの被除数が、以下のとおり計算される。
【０１０１】
【数１１】

【０１０２】
ブロック１３１８２で、項ｃ_jの除数が、以下のとおり計算される。
【０１０３】
【数１２】

【０１０４】
ブロック１３１８４で、項ｓ_jは、被除数と除数の商である。項ｓ_jの被除数は、以下のとおり計算される。
【０１０５】
【数１３】

【０１０６】
ブロック１３１８８で、項ｓ_jの除数が、以下のとおり計算される。
【０１０７】
【数１４】

【０１０８】
ブロック１３１９０で、変数ｉは、ベクトルにおける輝度信号（ピクセル）の順序付けを表すｉ＝１．．．ｍの範囲にあり、さらに変数ｊは、構成基準を表すｊ＝１．．．ｎの範囲にある。次に、方法は、別の継続端子（「端子Ｉ１０」）に進む。
【０１０９】
端子Ｉ９（図１３Ｔ）から、方法は、項ｃ_jが０に等しいブロック１３１９２に進む。ブロック１３１９４で、項ｓ_jが、以下のとおり計算される。
【０１１０】
【数１５】

【０１１１】
方法は、別の継続端子（「端子Ｉ１０」）に進み、さらに、得られた、同化された構成ベクトルの集合体ｘ₁、ｘ₂、ｘ₃、．．．、ｘ_nが、ｎ×ｍ行列Ｘ、すなわち、ｘ_ij＝ｃ_j＋ａ_ijを構成するブロック１３１９６にさらに進む。
【０１１２】
ブロック１３１９８から、方法は、構成ベクトルｘ₁、ｘ₂、ｘ₃、．．．、ｘ_nに適用されるべき重み付けベクトルを計算することを始める。次に、方法は、構成要素重み付き相関が使用されるべきかどうかを判定する試験が実行される判定ブロック１３２００に進む。判定ブロック１３２００における試験への答えが、「いいえ」である場合、方法は、別の継続端子（「端子Ｉ１１」）に進む。そうではなく、判定ブロック１３２００における試験への答えが、「はい」である場合、方法は、別の継続端子（「端子Ｉ１２」）に進む。
【０１１３】
端子Ｉ１１（図１３Ｕ）から、方法は、条件内相関に関して、重み付けが、すべての構成ベクトルに関して等しい（重み１）ブロック１３２０２に進む。条件内スコア付けに関する重み付けベクトルは、次のとおり計算される。ｗ_j＝１。次に、方法は、別の継続端子（「端子Ｉ１３」）に進む。端子Ｉ１２（図１３Ｕ）から、方法は、構成要素重み付き相関に関して、重みが或る関数であり、さらに構成要素重み付きスコア付けに関して様々な重み付けベクトルが、可能であるブロック１３２０６に進む。１つの典型的な機能は、コンセンサスベクトルからの差を最小限に抑えるために使用された同化の関数を含む。より高いスケーリングは、より低い重み付けにつながる。つまり、コンセンサスからの差を最小限に抑えるために要求される構成要素のスケーリングの量は、重みに反比例する可能性がある。代替として、重み付けは、所与の構成要素の重要度に基づくことが可能である。輝度（体積）によって重要度をモデル化できる。各構成要素ｊが、スカラー重みｗ_jを受け取る。ただし、ｊはｊ＝１からｎまでであり、さらにｎは、構成要素の数である。
【０１１４】
構成要素重み付きスコア付けに関する重み付けベクトルの３つの例を示す。第１の例では、ベクトルをスケーリングすることにより、対応する信号と雑音が等しい仕方でスケーリングされるモデルを与えることができる。スケーリングされたベクトルの重み付けは、以下のとおり、スケーリング値の逆数であることが可能である。
【０１１５】
【数１６】

【０１１６】
第２の例では、０でない切片が、相当な背景信号が存在することを示すと仮定できる。この事例では、重み付けは、以下のとおりモデル化されることが可能である。
【０１１７】
【数１７】

【０１１８】
第３の例では、重み付けのモデルは、スケーリングされていない（同化されていない）関心領域の積分された輝度に基づく。このモデルは、関心領域内で最大の輝度を有する構成要素が、最も重要であることを前提とする。
【０１１９】
【数１８】

【０１２０】
ただし、ｉ＝１．．．ｍであるａ_ijは、第ｊ番の構成要素のベクトル化された輝度である。積分された輝度を、第１の例、または第２の例からの重みと組み合わせることによって、第３の例を以下のように拡張できる。
【０１２１】
【数１９】

【０１２２】
次に、方法は、端子Ｉ１３（図１３Ｕ）に進み、さらに方法が、コンセンサスベクトルに、同化された構成ベクトルの集合体を相関させて、相関スコアＲ₁、Ｒ₂、Ｒ₃、．．．、Ｒ_nを導き出すことを始めるブロック１３２０８にさらに進む。ブロック１３２１０で、（同化された構成ベクトルの集合体を表す）行列ｘとコンセンサスベクトルｂが、対にされて、ｎ×ｍ点の一組（ｘ_ij，ｂ_i）が形成される。ブロック１３２１２で、最小二乗フィット法に従って、方法は、これらの点をｂ＝ｃ＋ｓｘにフィットさせ、これにより、相関係数、切片ｃ、および傾きｓがもたらされる。ブロック１３２１４で、相関係数は、関心領域に関する変更されたピアソンの相関スコアＲ１であることが適しており、このスコアＲ１は、被除数と除数から計算された商Ｒ₁（ｓ＞０）である。次に、方法は、別の継続端子（「端子Ｉ１４」）に進む。
【０１２３】
端子Ｉ１４（図１３Ｖ）から、相関係数の被除数が、以下のとおり計算される。すなわち、
【０１２４】
【数２０】

【０１２５】
ブロック１３２１６を参照されたい。ブロック１３２１８で、除数が、以下のとおり計算される。
【０１２６】
【数２１】

【０１２７】
ブロック１３２２０における制約が、以下のとおり与えられる。
Ｒ₁（ｓ≦０）＝０
ブロック１３２２２で、項ｔが、以下のとおり与えられる。
【０１２８】
【数２２】

【０１２９】
ブロック１３２２４で、方法は、被除数と除数の商である傾き相関係数ｓを計算する。ブロック１３２２６で、傾きの被除数が、以下のとおり計算される。
【０１３０】
【数２３】

【０１３１】
ブロック１３２２８で、傾きの除数が、以下のとおり計算される。
【０１３２】
【数２４】

【０１３３】
ブロック１３２３０で、相関スコアＲ２が、以下のとおり計算される。すなわち、
Ｒ₂（ｓ＞０）＝ｅｘｐ（−｜ｌｎ（ｓ）｜）
次に、方法は、別の継続端子（「端子Ｉ１５」）に進む。
【０１３４】
端子Ｉ１５（図１３Ｗ）から、制約が、以下のとおり与えられる。
Ｒ₂（ｓ≦０）＝０
方法１３０００は、方法が、被除数と除数の商である切片相関係数ｃを計算するブロック１３２３４に進む。切片の被除数が、以下のとおり計算される。
【０１３５】
【数２５】

【０１３６】
切片の除数は、ブロック１３２３８で以下のとおり計算される。すなわち、
【０１３７】
【数２６】

【０１３８】
ブロック１３２４０で、相関スコアＲ３が、以下のとおり計算される。
【０１３９】
【数２７】

【０１４０】
項σ_b²が、以下のとおり計算される。
【０１４１】
【数２８】

【０１４２】
ブロック１３２４４で、項
【０１４３】
【数２９】

【０１４４】
が、以下のとおり計算される。
【０１４５】
【数３０】

【０１４６】
次に、方法は、別の継続端子（「端子Ｉ１６」）に進む。端子Ｉ１６（図１３Ｘ）から、以下のとおり、相関スコアＲ４が計算され、これにより、線形相関が存在する確率が決定される。
Ｒ₄＝１−Ｐ_c（Ｒ₁，ｍ）
【０１４７】
ブロック１３２４６を参照されたい。ブロック１３２４８で、項
Ｐ_c（Ｒ₁，ｍ）
が、所与の相関係数Ｒ１が、長さｍのコンセンサスベクトルｂを使用して偶然に生成されたという帰無仮説を試験する。つまり、方法１３０００は、線形相関が存在する確率（Ｒ₄）を決定することができ、さらにこの確率を使用して、Ｒ₁を変更できる。帰無仮説の確率Ｐ_c（Ｒ₁，ｍ）は、所与の相関係数Ｒ₁が、長さｍのベクトルｂを使用して偶然に生成されたということである。この帰無仮説は、線形回帰に関するピアソンの相関係数Ｒ、および自由度の数値（ｆ＝ｍ−２）が与えられ、行列Ａまたはベクトルｘにおける「スケーリングされた構成ベクトル」が、「繰り返されるコンセンサスベクトル」ｂまたはｙと相関していないことを言明する。Ｐ_c（Ｒ₁，ｍ）は、無相関の輝度のｍのランダムなサンプルの線形相関が、Ｒ₁以上の相関係数をもたらす確率である。次に、方法は、方法が、３つすべてのタイプのベクトルの相関スコア、すなわち、シリアル化されたイメージスニペット、クロマトグラム、およびスペクトルを既に計算しているかどうかを判定する試験が実行される判定ブロック１３２４９に進む。判定ブロック１３２４９における試験への答えが、「はい」である場合、方法は、端子（「端子Ｊ」）に進む。そうではなく、判定ブロック１３２４９における試験への答えが、「いいえ」である場合、方法は、端子Ｉに戻り、以上に示された処理ステップが繰り返されるブロック１３２４８にループバックする。
【０１４８】
端子Ｊ（図１３Ｂ）から、方法１３０００は、継続端子（「端子Ｋ」）と終了端子（「端子Ｌ」）の間に規定される方法ステップのセット１３０１２に進む。方法ステップのセット１３０１２は、関心領域の形状特性を計算する。端子Ｋ（図１３Ｘ）から、方法は、合成スニペットおよびイメージスニペットから特定された関心領域の形状に関する形状特性スコア付けを実行するブロック１３２５０に進む。次に、方法は、別の継続端子（「端子Ｋ１」）に進む。
【０１４９】
端子Ｋ１（図１３Ｙ）から、方法１３０００は、端子Ｇ、Ｈの間（ブロック１３１２２）で示される、マスクされた２次元関心領域に関する形状特性を特定するブロック１３２５２に進む。ブロック１３２５４で、方法は、端子Ｇ、Ｈの間（ブロック１３１２４）で特定されるクロマトグラムに関する形状特性を特定する。ブロック１３２５６で、方法は、端子Ｇ、Ｈの間（ブロック１３１２６）で特定される質量スペクトルに関する形状特性を特定する。次に、方法は、終了端子Ｌに進む。
【０１５０】
端子Ｌ（図１３Ｃ）から、方法１３０００は、継続端子（「端子Ｍ」）と終了端子（「端子Ｎ」）の間で規定される方法ステップの一組１３０１４に進む。方法ステップの組１３０１４は、選択されたアルゴリズムに従ってスコアを組み合わせ、評価する。端子Ｍ（図１３Ｙ）から、方法１３０００は、様々な仕方でスコアを組み合わせて、関心領域を分類する新たなスコアを導き出す。ブロック１３２５８を参照されたい。
【０１５１】
第１の例として、合成イメージからの形状特性を組み合わされることができる。任意の構成イメージセットから導き出された合成イメージ上の単一の関心領域から形状特性を導き出すことができる。この方法は、合成イメージを含むよく整列配置させられた構成要素を要求し、さらにこの方法には、マイクロ整列配置および領域再定義が役に立つ可能性がある。単一の関心領域からの様々な形状特性（信頼度、楕円同化など）が組み合わされて、新たな形状特性を作成できる。
【０１５２】
第２の例として、個々の構成要素からの形状特性を組み合わすことができる。１つのタイプの形状特性（信頼度、楕円同化など）を、或る特徴の範囲内の関心領域のような対応する関心領域から組み合わせることができる。この方法は、合成イメージを要求せず、したがって、マイクロ整列配置も要求しないが、この方法には、領域再定義が役立つ可能性がある。
【０１５３】
第３の例として、個別の構成要素内の形状特性を組み合わせることができる。多くのタイプの形状特性（信頼度、楕円同化など）を、新たな形状特性を作成するように単一の関心領域から組み合わせることができる。この新たな形状特性を、次に、所与の構成要素の一組からの対応する関心領域の同一の形状特性タイプと組み合わせてもよい。
【０１５４】
第４の例として、相関スコアを、組み合わせることができる。研究者は、個々の構成要素の組合せである最終スコアを求める可能性がある。そのようなスコアによって、研究者は、役に立つ方法で関心領域を格付けできる。１つのベクトルの組からの様々な相関スコアＲ₁、Ｒ₂、Ｒ₃、．．．Ｒ_nが、１が最適な相関を示す、０から１までの範囲をとる確率として解釈され得る場合、これらのスコアを乗算によって組み合わせて、やはり０から１までの範囲をとる合成スコアを作成できる。各スコアＲ_iには、そのスコアＲ_iの寄与を強調する、または強調をやめるように個々に重み付けできる。Ｒ_iに関する重み付けｗ_iは、指数である。結果は、完全なスコアが１である、０から１までの範囲内のスコアである。
【０１５５】
【数３１】

【０１５６】
ｗ（ｉ）は、第ｉ番のスコアに関する重み付け係数である。ｗ_(i)＝１などの等しい重み付けが、使用され得る。また、ｗ（１）＝ｗ（４）、ｗ（２）＝ｗ（３）、およびｗ（１）＝２^*ｗ（２）などの他の重み付けも、有用である。１つの適切な重み付けは、次のとおりである。Ｒ＝Ｒ₁²Ｒ₂¹Ｒ₃¹Ｒ₄²。
【０１５７】
第５の例として、異なる構成イメージからの形状特性スコアを組み合わせることができる。個々の形状スコアから特徴／合成スコアを作成するのに、以下の式が、注目される。すなわち、
【０１５８】
【数３２】

【０１５９】
Ｉは、スコア付けされた関心領域の積分された輝度である。
【０１６０】
引継ぎを考慮すると、相関スコア、または相関スコアの組合せのいずれかが、構成要素の組、または１つのイメージから、関心領域全体（複合体、構成要素の組、個々の構成要素）に帰せられることが可能である。例えば、最大条件内相関スコアは、すべての構成イメージ上の関心領域を表すことも可能である。単一構成要素スコアは、単一の関心領域を参照し、さらに、合成イメージではなく、単一のイメージを主に参照する。
【０１６１】
形状特性スコアの引継ぎを考慮すると、形状特性は、単一のイメージスニペット上の単一の関心領域から導き出されるスコアである。この単一のイメージスニペットは、１つの構成要素（レプリケート）からであってもよく、あるいは複数の重ね合わされたイメージスニペット（複合体）からの合成イメージであることも可能である。構成イメージスニペットの集合体からの複数の形状特性を組み合わせて、これらの構成イメージのセット、およびこれらの構成イメージの複合体の関心領域に属する、うまく形作られたスコアを形成できる。
【０１６２】
相関スコアの引継ぎを考慮すると、或る関心領域、および条件のような複数の構成要素セットが存在することが与えられ、各構成要素セットから相関スコアを導き出すことができる。これらの相関スコアの１つが、関心領域を表すように選択される。この選択は、様々な方法（例えば、最良、最悪、中央値、算術平均、幾何平均、または輝度重み付き算術平均）に基づくことが可能である。いずれの方法が使用されるべきかの選択は、研究者の期待に依存する。
【０１６３】
構成要素（例えば、条件）のすべての組が、分析され、スコア付けされた後、最良のスコアを有する構成セットが、一般に、関心領域を表すように選択され（さらに、関心領域によって引き継がれ）る。このアプローチの理由は、重要で相関する信号を、その信号が１組の構成要素の中でしか現れない場合でさえ、認識することである。処置条件の違いに起因するピークの差が、一般に、実験の焦点である。一組の条件における最良スコアは、それらの条件のいくつかが低いスコアを有する場合でさえ、研究者には興味深いデータとなる場合がある。
【０１６４】
相関スコアと形状特性スコアに関する組合せの方法に関して、新たなスコアを形成するように相関スコアを他の幾何形状スコアと組み合わせることができる。複数の条件を含む関心領域によって引き継がれるスコアは、構成要素重み付きスコア、最良条件スコア、または最も強力な条件の条件スコアであることが可能である。
【０１６５】
【数３３】

【０１６６】
およびｉ_ijが、条件ｊにおけるピクセルの輝度である、最高の値を有する条件に属するスコアである。
【０１６７】
次に、方法は、端子Ａと端子Ｂの間で、具体的にはブロック１３２０６において示される、すべての関心領域に関するスコアを既に計算しているかどうかを判定する試験が実行される判定ブロック１３２６０に進む。判定ブロック１３２６０における試験への答えが、「はい」である場合、方法は、ブロック１３２６２に進む。そうではなく、判定ブロック１３２６０における試験への答えが、「いいえ」である場合、方法は、端子Ｃに戻り、さらに以上に述べた処理ステップが繰り返されるブロック１３２５８にループバックする。ブロック１３２６２で、方法は、将来の評価を可能にするデータベースの中にスコアを格納する。次に、方法は、終了端子Ｎに進む。端子Ｎ（図１３Ｃ）から、方法１３０００は、分類されたスコアによって明らかにされた生物学的候補が、将来の探究のために研究者に送られる、継続端子（「端子Ｏ」）と終了端子（「端子Ｐ」）の間に示された方法ステップの一組１３０１６に進む。端子Ｐを超えて進んで、方法１３０００は、実行を終了する。
【０１６８】
図１４Ａ〜図１４Ｓは、生物学的特徴を発見するように関心領域を処理するための他の実施形態を示す。図１４Ａ、図１４Ｂは、検出された関心領域にスコアが付けられることを示す。１組のスニペット（関心領域）に属するスコアを生成するように同時実行ブランチを使用することを示す図１４Ａ、図１４Ｂにおけるブロックが、図１４Ｃ〜図１４Ｅによってより詳細に示される。図１４Ｃ〜図１４Ｅによって示される同時実行の代替として、図１４Ｆ、図１４Ｇは、１組のスニペット（関心領域）に属するスコアを生成する直線実行ブランチを示す。図１４Ｈ、図１４Ｉは、Ｎ個のマスクされたイメージスニペットのＰ個の輝度値をシリアル化することに関連付け、Ｐ×Ｎ行列の中に入れるステップを示すことによって、図１４Ｃ〜図１４Ｇにおけるブロックをより詳細に示す。具体的には、入力値は、Ｐ個の輝度値をそれぞれが有する、Ｎ個の等しくマスクされたイメージの一組である。各２Ｄイメージは、１Ｄベクトルとなる。これらのベクトルは、各列がこれらのイメージの１つを表し、各行が同等の（ｃｏｍｐａｒａｂｌｅ）ピクセルを表すＰ×Ｎ行列を構成する。出力値は、このＰ×Ｎ行列である。図１４Ｊは、Ｎ個のマスクされた（２Ｄ）イメージスニペットのそれぞれから形状特性の一組を抽出することと結び付けられたステップを示すことによって、図１４Ｃ〜図１４Ｇにおけるブロックをより詳細に示す。具体的には、入力値は、Ｎ個の等しくマスクされたイメージスニペットである。方法は、各イメージスニペットからのＧ個の形状特性を特定する。出力値は、Ｇ個の値のＮ個の組である。
【０１６９】
図１４Ｋは、関心領域を定義するマスキングプロセスを示す。異なるイメージからそれぞれが導き出された、これら３つの対応するスニペットから、共通のマスクが形成される。この決定は、これら３つのスニペットの複合体、および領域再定義である新たなピーク検出に基づくことがある。代替として、マスクは、これら３つのスニペット上の個々のピーク検出に基づくことが可能である。図１４Ｌは、イメージ輝度を、アイソ曲線（ｉｓｏ−ｃｕｒｖｅ）（等高線）またはピクセル輝度によって表せること、およびこれらの輝度をマスクできることを示す。図１４Ｍは、それぞれのマスクされた２Ｄイメージスニペットを使用して、特徴的なクロマトグラム、特徴的なスペクトル、およびピクセル輝度のシリアル化された集合体を生成できることを示す。図１４Ｎは、平均ｍ／ｚスペクトルが、マスクされた２Ｄイメージスニペットから導き出されるプロセスを示す。図１４Ｏは、平均クロマトグラムが、マスクされた２Ｄイメージスニペットから導き出されるプロセスを示す。図１４Ｐは、２Ｄイメージスニペットを、ピクセル輝度の１Ｄベクトルにシリアル化するシリアル化プロセスを示す。ピクセル輝度の数値は線形につなぎ合わせてあることもある。ピクセルの順序は、スニペットの間で一貫していなければならない。このベクトルは、同一の順序でシリアル化されている他のイメージスニペットと互いに関係付けられる。図１４Ｑ〜図１４Ｓは、３つのイメージからのイメージスニペットが、どのように処理されて、それぞれ、相関イバリュエータへの適切な入力値である、異なる行列にされるかを示す。図１４Ｑは、これら３つの列のそれぞれがベクトルである準備プロセスを示す。各ベクトルは、マスクされたイメージスニペットの平均質量スペクトルである。これら３つのベクトルは一緒になって、相関イバリュエータへの適切な入力である２Ｄ行列を構成する。図１４Ｒは、これら３つの列のそれぞれがベクトルである準備プロセスを示す。各ベクトルは、異なるマスクされたイメージスニペットの平均クロマトグラムである。これら３つのベクトルは一緒になって、相関イバリュエータへの適切な入力である２Ｄ行列を構成する。図１４Ｓは、これら３つの列のそれぞれがベクトルである準備プロセスを示す。各ベクトルは、異なるマスクされたイメージスニペットからのシリアル化されたピクセル輝度の例である。これら３つのベクトルは一緒になって、相関イバリュエータへの適切な入力である２Ｄ行列を構成する。
【０１７０】
実例的な実施形態が、示され、説明されてきたが、本発明の趣旨および範囲を逸脱することなく、これらの実施形態に様々な変更が行われ得ることが認められよう。
【０１７１】
以上の方法の実施に適した代表的なコンピューティング環境が、図１５に示される。図１５、および以下の説明は、開示される技術が実施されることが可能である典型的なコンピューティング環境の簡単な、一般的説明を与えることを意図している。必須ではないものの、開示される技術は、ＰＣ（パーソナルコンピューター）によって実行される、プログラムモジュールなどのコンピューター実行可能命令の一般的な表現において説明される。一般に、プログラムモジュールには、特定のタスクを実行する、または特定の抽象データ型を実装するルーチン、プログラム、オブジェクト、コンポーネント、データ構造などが含まれる。さらに、開示される技術は、ハンドヘルドデバイス、マルチプロセッサシステム、マイクロプロセッサベースの家庭用電子機器もしくはプログラマブル家庭用電子機器、ネットワークＰＣ、ミニコンピューター、メインフレームコンピューターなどを含む、他のコンピューターシステム構成を使用して実施されてもよい。また、開示される技術は、通信ネットワークを介してリンクされたリモート処理デバイスによってタスクが実行される、分散コンピューティング環境において実施されてもよい。分散コンピューティング環境では、ローカルメモリー記憶デバイスとリモートメモリー記憶デバイスの両方の中にプログラムモジュールを配置できる。
【０１７２】
図１５を参照すると、開示される技術を実施するための典型的なシステムは、１つまたは複数の処理装置１５０２、システムメモリー１５０４、およびシステムメモリー１５０４を含む様々なシステムコンポーネントを１つまたは複数の処理装置１５０２に結合するシステムバス１５０６を含む、典型的な従来のＰＣ１５００の形態の汎用コンピューティングデバイスを含む。システムバス１５０６は、様々なバスアーキテクチャのいずれかを使用する、メモリーバスまたはメモリーコントローラ、周辺バス、およびローカルバスを含む、いくつかのタイプのバス構造のいずれかであることが可能である。典型的なシステムメモリー１５０４は、ＲＯＭ（読み取り専用メモリー）１５０８およびＲＡＭ（ランダムアクセスメモリー）１５１０を含む。ＰＣ１５００内部の要素間で情報の転送を助ける基本ルーチンを含むＢＩＯＳ（基本入出力システム）１５１２が、ＲＯＭ１５０８の中に格納される。
【０１７３】
典型的なＰＣ１５００は、ハードディスクに対して読み取りまたは書き込みを行うためのハードディスクドライブ、リムーバブル磁気ディスクに対して読み取りまたは書き込みを行うための磁気ディスクドライブ、およびリムーバブル光ディスク（ＣＤ−ＲＯＭまたは他の光媒体などの）に対して読み取りまたは書き込みを行うための光ディスクドライブなどの、１つまたは複数の記憶デバイス１５３０をさらに含む。そのような記憶デバイスは、それぞれ、ハードディスクドライブインタフェース、磁気ディスクドライブインタフェース、および光ドライブインタフェースによってシステムバス１５０６に接続されることが可能である。これらのドライブ、および関連するコンピューター可読媒体は、コンピューター可読命令、データ構造、プログラムモジュール、およびその他のデータの不揮発性ストレージをＰＣ１５００に提供する。また、磁気カセット、フラッシュメモリーカード、デジタルビデオディスク、ＣＤ、ＤＶＤ、ＲＡＭ、ＲＯＭなどの、ＰＣによってアクセスされることが可能なデータを格納することができる他のタイプのコンピューター可読媒体を、典型的な動作環境において使用できる。
【０１７４】
オペレーティングシステム、１つまたは複数のアプリケーションプログラム、他のプログラムモジュール、およびプログラムデータを含む、いくつかのプログラムモジュールを、記憶デバイス１５３０の中に格納することもある。ユーザは、キーボードや、マウスなどのポインティングデバイスなどの１つまたは複数の入力デバイス１５４０を介して、ＰＣ１５００にコマンドおよび情報を入力することもある。その他の入力デバイスには、デジタルカメラ、マイクロホン、ジョイスティック、ゲームパッド、サテライトディッシュ、スキャナなどが含まれることがある。これら、およびその他の入力デバイスは、しばしば、システムバス１５０６に結合されたシリアルポートインタフェースを介して１つまたは複数の処理装置１５０２に接続されるが、パラレルポート、ゲームポート、またはＵＳＢ（ユニバーサルシリアルバス）などの他のインタフェースによって接続されてもよい。モニタ１５４６、または他のタイプのディスプレイデバイスも、ビデオアダプタなどのインタフェースを介してシステムバス１５０６に接続される。スピーカやプリンタ（図示せず）などの他の周辺出力デバイスを、含めてもよい。一部の例において、処理された構成イメージデータは、表示、または印刷、あるいはそれ以外の方法で提示される。一部の実施例において、中間結果が、表示されることも可能である。
【０１７５】
ＰＣ１５００は、リモートコンピューター１５６０などの１つまたは複数のリモートコンピューターへの論理接続を使用するネットワーク化された環境において動作することもある。一部の例において、１つまたは複数のネットワーク接続または通信接続１５５０が含められる。リモートコンピューター１５６０は、別のＰＣ、サーバ、ルータ、ネットワークＰＣ、あるいはピアデバイスもしくは他の一般的なネットワークノードであることがあり、ＰＣ１５００に関連して前述した要素の多くまたはすべてを通常含むが、メモリー記憶デバイス１５６２だけを図１５に示している。パーソナルコンピューター１５００および／またはリモートコンピューター１５６０は、ロジカル、ＬＡＮ（ローカルエリアネットワーク）およびＷＡＮ（ワイドエリアネットワーク）に接続されることが可能である。そのようなネットワーキング環境は、オフィス、企業全体のコンピューターネットワーク、イントラネット、およびインターネットにおいて一般的である。
【０１７６】
ＬＡＮネットワーキング環境において使用される場合、ＰＣ１５００は、ネットワークインタフェースを介してＬＡＮに接続される。ＷＡＮネットワーキング環境において使用される場合、ＰＣ１５００は、通常、インターネットなどのＷＡＮを介して通信を確立するためのモデムまたは他の手段を含む。ネットワーク化された環境では、パーソナルコンピューター１５００に関連して説明されるプログラムモジュール、またはそのようなモジュールのいくつかの部分を、リモートメモリー記憶デバイスの中、あるいはＬＡＮ上、またはＷＡＮ上の他の場所に格納できる。図示されるネットワーク接続は、典型例であり、コンピューター間で通信リンクを確立する他の手段が使用されてもよい。
【０１７７】
例示される実施形態を参照して我々の発明の原理を説明し、例示してきたが、例示される実施形態は、そのような原理を逸脱することなく、構成および詳細が変更され得ることが認識されよう。例えば、ソフトウェアで示される、例示される実施形態の要素が、ハードウェアで実施されてもよく、ハードウェアで示される、例示される実施形態の要素が、ソフトウェアで実施されてもよい。また、任意の実施例からの技術を、その他の実施例の任意の１つまたは複数において説明される技術と組み合わせることもできる。本発明の原理が適用されることが可能な多くの可能な実施形態に鑑みて、例示される実施形態は、本発明の実施例であり、本発明の範囲の限定として解釈されるべきではないことを認識されたい。例えば、本明細書で説明されるシステムおよびツールの様々なコンポーネントが、機能および使用において組み合わされてもよい。したがって、我々は、特許請求の範囲の範囲および趣旨に含まれるすべての主題を我々の発明として主張する。以上のセクションにおいて具体的に扱われる代替は、単に典型例であり、本明細書で説明される実施形態の可能なすべての代替を成すものではない。開示される発明の原理が適用されることが可能な多くの可能な実施形態に鑑みて、例示される実施形態は、本発明の好ましい実施例に過ぎず、本発明の範囲を限定するものと解釈されるべきではないことを認識されたい。むしろ、本発明の範囲は、添付の特許請求の範囲によって規定される。したがって、我々は、特許請求の範囲の範囲および趣旨に含まれるすべてを、我々の発明として主張する。
【０１７８】
（付録）
同化スケーリング係数を導き出すこと、特に想定および単純化に関して、輝度（イオンカウント）は、
ｙ＝ｃ＋ｓｘ
にデータをフィットできる溶離物質（ｅｌｕｔｉｎｇｍａｔｅｒｉａｌ）に関して線形であると仮定される。
【０１７９】
ピークは、分離され、ノイズの他には背景を全く有さないと想定される。つまり、与えられた保持時間および質量／電荷において、１つの種（イオン）だけが利用可能であると仮定される。この想定が有効でない範囲では、スコア付けされたピークはそれほど有用ではなく、さらにこの属性は、より弱い相関を有する劣悪なフィットに反映される。これらの想定のもと、以下のとおり、原点に切片を有しさらに正の傾きを有する線形関数へのフィットに線形相関を単純化できる。
ｙ＝ｓｘ、ｓ＞０
【０１８０】
一般的な誤差モデルに関して、この線形関係からの点（ｘ_i，ｙ_i）のずれ（ｄｉｓｃｒｅｐａｎｃｉｅｓ）を使用して誤差Eをモデル化できる。Ｅ_iは、関数ｆによって記述される、傾きｓを与えられた、点ｉにおけるずれに基づく誤差の部分である。
Ｅ_i（_s）＝ｆ（ｘ_i，ｙ_i）
【０１８１】
Ｅ（_s）は、傾きｓを与えられた、点（ｘ_i，ｙ_i）に対する線のフィットの誤差である。
【０１８２】
【数３４】

【０１８３】
誤差解決に関して、誤差最小化が、以下によってモデル化される。
【０１８４】
【数３５】

【０１８５】
スケーリング係数ｓは、以下のとおり解決される。
【０１８６】
【表１】

【０１８７】
１つの構成ベクトルの中で値をｘ_iに設定でき、コンセンサスベクトルの値をｙ_iに設定できる。ｓでスケーリングすることによってｘをｙに「同化する」ことが要求されることが与えられ、誤差はｘ_iの範囲内にあるという想定を行うことができる。したがって、一般に、スケーリング係数は、以下のとおり選択される。
【０１８８】
【数３６】

【０１８９】
特定の誤差モデルの精緻化（ｅｌａｂｏｒａｔｉｏｎ）を考慮すると、原点における切片および
【０１９０】
【数３７】

【０１９１】
という誤差を仮定する線形同化に関してスケーリング係数を導き出せる。線形関数に関するフィットの誤差を、原点を通る正の傾きを使用して推定できる。この関数へのフィットの誤差を、点（ｘ_i，ｙ_i）の集合体より推定できる。ｘ値およびｙ値のずれは、以下のように表せる。
【０１９２】
【数３８】

【０１９３】
誤差を、以下のとおり求めることができる。
【０１９４】
【数３９】

【０１９５】
傾き（ｓ）に関する誤差（Ｅ）の変化は、以下のとおりである。
【０１９６】
【数４０】

【０１９７】
【数４１】

【０１９８】
を０に設定することにより、以下を求めることができる。
【０１９９】
【数４２】

【特許請求の範囲】
【請求項１】
関心領域プロセッサであって、
少なくとも２つの構成イメージの一組における関心領域を選択するように構成されたデータセレクタと、
前記選択された関心領域を整列配置させるように構成されたマイクロアライナと、
前記マイクロ整列配置させられた関心領域に基づいて評価スコアを生成するように構成されたイバリュエータと
を含むことを特徴とする関心領域プロセッサ。
【請求項２】
前記イバリュエータは、前記マイクロ整列させられた関心領域に基づいて相関スコアを生成するように構成された相関イバリュエータであり、前記相関スコアは、前記関心領域内の一般的な変動の信頼性に関連することを特徴とする請求項１に記載の関心領域プロセッサ。
【請求項３】
前記イバリュエータは、前記マイクロ整列させられた関心領域の形状特性にスコア付けするように構成された形状スコアラであることを特徴とする請求項１に記載の関心領域プロセッサ。
【請求項４】
前記データセレクタは、単一の処置条件、単一の生物学的変異、複数の処置条件、および複数の生物学的変異に関連するクロマトグラフィ／質量スペクトルメトリイメージから成るグループから構成イメージの一組を選択するように構成されることを特徴とする請求項２に記載の関心領域プロセッサ。
【請求項５】
前記マイクロ整列させられた関心領域の境界を再定義するように構成された関心領域検出器をさらに含むことを特徴とする請求項２に記載の関心領域プロセッサ。
【請求項６】
２次元マスクを生成し、前記２次元マスクに基づいて再定義された関心領域をもたらすように構成されたデータエクストラクタをさらに含むことを特徴とする請求項５に記載の関心領域プロセッサ。
【請求項７】
保持時間対称性、ピーク頂点からの保持時間単調性、面積、体積、最大値、標準偏差、面積対称性比、質量／電荷対称性、前記ピーク頂点からの質量／電荷単調性、信頼度、周辺勾配、および接線体積比の少なくとも１つに基づいて選択された１つまたは複数の構成イメージの形状特性にスコア付けするように構成された形状スコアラをさらに含むことを特徴とする請求項２に記載の関心領域プロセッサ。
【請求項８】
形状スコアと相関スコアの少なくともいずれかを組み合わせるように構成されたスコアコンバイナをさらに含むことを特徴とする請求項２に記載の関心領域プロセッサ。
【請求項９】
関心対象の特徴を分類するようにスコアを格付けするように構成されたスコアクラシファイアをさらに含むことを特徴とする請求項８に記載の関心領域プロセッサ。
【請求項１０】
関心領域を処理するための方法であって、
少なくとも２つの対応する関心領域の組を互いにマイクロ整列配置させ、各関心領域は、異なる構成イメージからであるステップと、
関心領域の一組に基づいて相関スコアを計算するステップと、
前記相関スコアにスコア付けするステップと
を含むことを特徴とする関心領域を処理するための方法。
【請求項１１】
前記関心領域は、ピクセルアレイとして表され、各ピクセルは、少なくとも第１の座標値と第２の座標値、および輝度に関連付けられる方法であって、第１の次元がシリアル化された構成イメージの数を示し、第２の次元がシリアル化された輝度の数を示す２次元アレイを形成するように前記関心領域内のピクセルをシリアル化するステップをさらに含み、前記相関スコアは、前記シリアル化された輝度に基づいて計算されることを特徴とする請求項１０に記載の方法。
【請求項１２】
前記関心領域に関連する前記シリアル化された輝度は、対応する構成ベクトルを定義する方法であって、前記構成ベクトルに基づいて中心傾向を表すコンセンサスベクトルを計算し、前記コンセンサスベクトルは、算術平均または算術中央値として計算されるステップをさらに含むことを特徴とする請求項１１に記載の方法。
【請求項１３】
前記構成イメージは、クロマトグラフィ／質量スペクトルメトリイメージであることを特徴とする請求項１２に記載の方法。
【請求項１４】
各クロマトグラフィ保持時間に関して複数の質量対電荷比に関連するピクセル輝度を組み合わせることによって、集約されたクロマトグラムを生成するステップをさらに含むことを特徴とする請求項１３に記載の方法。
【請求項１５】
一般的なランダムな順序に基づいて、前記ピクセルアレイをシリアル化するステップをさらに含むことを特徴とする請求項１３に記載の方法。
【請求項１６】
各質量対電荷比に関して複数の保持時間に関するピクセル輝度を組み合わせることによって、集約された質量スペクトログラムを生成するステップをさらに含むことを特徴とする請求項１３に記載の方法。
【請求項１７】
コンピューター可読媒体であって、
少なくとも２つの関心領域の一組を互いにマイクロ整列配置させ、各関心領域は異なる構成イメージからであるステップと、
前記関心領域内のマスクされたピクセルに関する相関スコアを計算し、前記相関スコアは、前記関心領域内の変動の信頼性を示すステップと
を含む、多次元分離に関連する構成イメージにおける関心領域を処理するための方法を実施するためのコンピューター実行可能命令を格納していることを特徴とするコンピューター可読媒体。
【請求項１８】
各関心領域の幅を、選択された幅拡大率だけ、保持時間次元において逆方向および順方向で拡大するステップをさらに含むことを特徴とする請求項１７に記載のコンピューター可読媒体。
【請求項１９】
前記方法は、関心領域のマイクロ整列配列のためのマスタスニペットを同定するステップをさらに含むことを特徴とする請求項１８に記載のコンピューター可読媒体。
【請求項２０】
正規化された相互相関最大値、線形相関係数最大値、および正規化された最小二乗差最小値から成るグループから選択されたメトリックを使用して相関をもたらすシフト量を決定するステップをさらに含むことを特徴とする請求項１８に記載のコンピューター可読媒体。
【請求項２１】
前記方法は、相関ベースのシフト量が利用可能でないことを特定し、さらに重心整列配置または適応整列配置に基づいてマイクロ整列配置を行うステップをさらに含むことを特徴とする請求項１７に記載のコンピューター可読媒体。
【請求項２２】
前記方法は、帰無仮説試験に基づいて線形相関に関連する相関スコアを計算するステップをさらに含むことを特徴とする請求項１７に記載のコンピューター可読媒体。

【図１】