関心領域処理
【課題】関心領域処理を提供すること。
【解決手段】前処理された生体サンプルが、液体クロマトグラフィ/質量分析機器にかけられた後、変動を示すデジタルイメージが、生成される。これらの変動のいくつかは、関心対象であり得る一方で、他のいくつかは、関心対象ではない。関心領域内の変動が、互いに関連付けられることが可能であり、さらに生物学的特徴を分類するように生成される相関スコアが、科学的発見を助ける。また、変動の形状特性が、形状スコアによって計算されることも可能である。マイクロ整列配置方法が、マクロ整列配置を用いる必要なしに相関計算を助ける。
【解決手段】前処理された生体サンプルが、液体クロマトグラフィ/質量分析機器にかけられた後、変動を示すデジタルイメージが、生成される。これらの変動のいくつかは、関心対象であり得る一方で、他のいくつかは、関心対象ではない。関心領域内の変動が、互いに関連付けられることが可能であり、さらに生物学的特徴を分類するように生成される相関スコアが、科学的発見を助ける。また、変動の形状特性が、形状スコアによって計算されることも可能である。マイクロ整列配置方法が、マクロ整列配置を用いる必要なしに相関計算を助ける。
【発明の詳細な説明】
【技術分野】
【0001】
(関連出願の相互参照)
本出願は、参照により本明細書に組み込まれている、2008年10月23日に出願した米国特許仮出願第61/107,988号の利益を主張する。
【0002】
発明は関心領域処理に関する。
【背景技術】
【0003】
生物試料の分析は、そのような試料を含有する成分が複雑に混じり合っていることを考慮すると、困難である。ほとんどの分析機器は、1つの成分の影響を別の成分の影響と完全に分離することができず、しばしば、関連する信号が小さい、または濃度が低いことがある。このため、重なり合う、ノイズの多い信号が普通であり、相当調査して、有用な情報を明らかにすることが要求される。このような人間による調査は時間がかかり、主観的である可能性があり、さらに、重要な特徴が容易に軽視される、または見過ごされる可能性がある。一部の事例では、従来の分析技術を適用すると、誤ることもある。このため、改良された分析方法および分析装置が必要とされる。
【発明の概要】
【課題を解決するための手段】
【0004】
この要約は、以下の発明の詳細な説明の中で詳しく述べられている考え方を選出したものを簡単な形式で紹介するものである。この要約は、クレームされた発明の対象を述べることを意図したものでも、クレームされた発明の対象の範囲を決定することを補助するために使用されることを意図したものでもない。
【0005】
この主題の一つの形態は、関心領域プロセッサを含み、この関心領域プロセッサは、ある構成イメージの中のある関心領域を、その構成イメージの中のそれ以外の関心領域を整列させる必要なしに、その他の構成イメージの中の対応する関心領域と整列させる、マイクロアライナを備えている。さらに、関心領域プロセッサは、関心領域内で見られる変動の信頼性を表す相関スコアを生成し、関連のある潜在的な生物学的特徴を挙げるように構成された相関エバリュエータを含んでいる。
【0006】
この主題の別の形態は、生物学的特徴を発見するために関心領域を処理する方法を含むことであり、この方法は、ある構成イメージの関心領域を、いずれの構成イメージの中の関心領域とマクロ整列させる必要なしに、その他の構成イメージの中の対応する関心領域とマイクロアライニングすることを含む。この方法はさらに、対応する関心領域中のマスクされたピクセルに対する相関スコアを計算することを含む。ここで相関スコアは関心領域内の変動の信頼性を表す。
【0007】
この主題のさらに別の形態は、生物学的特徴を発見するように関心領域を処理する方法を実施するためのコンピューター実行可能命令を有するコンピューター可読媒体を含むことであり、このコンピューター可読媒体は、その構成イメージとその他の構成イメージの中の関心領域とマクロ整列させる必要なしに、ある構成イメージの中のある関心領域をその他の構成イメージの中のその他の関心領域とマイクロアライニングすることを含む。この方法はさらに、対応する関心領域中のマスクされたピクセルと他の関心領域中のマスクされたピクセルに対する相関スコアを計算することを含む。その相関スコアは関心領域内で見られる変動の信頼性を表す。
【0008】
本発明の以上、およびその他の目的、特徴、および利点は、添付の図を参照して進められる以下の詳細な説明から、より明白となろう。
【0009】
この主題の以上の態様、および付随する利点の多くは、添付の図面と併せて解釈される場合に、以下の詳細な説明を参照することによって、これらの態様および利点がよりよく理解されるにつれ、より容易に認められるようになろう。
【図面の簡単な説明】
【0010】
【図1】前処理をされた生体サンプルを研究者の生体研究の対象のリストへ提供する処理をする構成を示すブロック図である。
【図2】関心領域処理サブシステムの典型的な構成を示すブロック図である。
【図3−1】3A〜3Dをまとめて示す図であり、主題の一実施形態における、時間伸縮された構成イメージ、ならびに合成イメージを示す図である。
【図3−2】3Eおよび3Fをまとめて示す図であり、この主題の一実施形態における、合成イメージから検出された関心領域を示す図である。
【図4】4A〜4Dはそれぞれ、この主題の一実施形態における、典型的な拡大プロセスを示す図である。
【図5】5A〜5Dはそれぞれ、この主題の一実施形態における、典型的なマイクロ整列技術を示す図である。
【図6】6A〜6Eはそれぞれ、この主題の一実施形態における、関心領域の再定義を示す図である。
【図7】7A〜7Fはそれぞれ、この主題の一実施形態における、相互にマイクロ整列されたスニペットの部分を示す図である。
【図8】8A〜8Dはそれぞれ、この主題の一実施形態における、典型的なマスク、および様々なマスクされたスニペットを示す図である。
【図9】この主題の一実施形態における、イメージスニペットをシリアル化することによって導き出された構成ベクトルと、典型的なコンセンサスベクトルとを含む典型的なテーブルを示す図である。
【図10】この主題の一実施形態における、典型的なコンセンサスベクトル対典型的な構成ベクトルのグラフである。
【図11】この主題の一実施形態における、各構成ベクトルの個々の同化の後に図10のデータ点のグラフを示す図である。
【図12】この主題の一実施形態における、図11におけるデータへの線形回帰を示す図である。
【図13A】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図13B】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図13C】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図13D】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図13E】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図13F】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図13G】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図13H】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図13I1】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図13I2】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図13J】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図13K】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図13L】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図13M】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図13N−1】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図13N−2】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図13O】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図13P】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図13Q】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図13R】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図13S】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図13T】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図13U】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図13V】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図13W】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図13X】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図13Y】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図14A】生物学的特徴を発見するように関心領域を処理するための実施形態を示す図である。
【図14B】生物学的特徴を発見するように関心領域を処理するための実施形態を示す図である。
【図14C】生物学的特徴を発見するように関心領域を処理するための実施形態を示す図である。
【図14D】生物学的特徴を発見するように関心領域を処理するための実施形態を示す図である。
【図14E】生物学的特徴を発見するように関心領域を処理するための実施形態を示す図である。
【図14F】生物学的特徴を発見するように関心領域を処理するための実施形態を示す図である。
【図14G】生物学的特徴を発見するように関心領域を処理するための実施形態を示す図である。
【図14H】生物学的特徴を発見するように関心領域を処理するための実施形態を示す図である。
【図14I】生物学的特徴を発見するように関心領域を処理するための実施形態を示す図である。
【図14J】生物学的特徴を発見するように関心領域を処理するための実施形態を示す図である。
【図14K】生物学的特徴を発見するように関心領域を処理するための実施形態を示す図である。
【図14L】生物学的特徴を発見するように関心領域を処理するための実施形態を示す図である。
【図14M】生物学的特徴を発見するように関心領域を処理するための実施形態を示す図である。
【図14N】生物学的特徴を発見するように関心領域を処理するための実施形態を示す図である。
【図14O】生物学的特徴を発見するように関心領域を処理するための実施形態を示す図である。
【図14P】生物学的特徴を発見するように関心領域を処理するための実施形態を示す図である。
【図14Q】生物学的特徴を発見するように関心領域を処理するための実施形態を示す図である。
【図14R】生物学的特徴を発見するように関心領域を処理するための実施形態を示す図である。
【図14S】生物学的特徴を発見するように関心領域を処理するための実施形態を示す図である。
【図15】開示される方法の実施に適した代表的なハードウェアおよびコンピューティング環境を示す概略図である。
【図16A】周辺勾配スコア付けを示す図である。
【図16B】周辺勾配スコア付けを示す図である。
【図16C】周辺勾配スコア付けを示す図である。
【図16D】周辺勾配スコア付けを示す図である。
【図16E】周辺勾配スコア付けを示す図である。
【図16F】周辺勾配スコア付けを示す図である。
【図17】前処理スコア付けを示す図である。
【図18】接線体積比スコア付けを示す図である。
【発明を実施するための形態】
【0011】
本出願および特許請求の範囲において使用される、「或る」および「この」という単数形は、文脈によりそうでないことが明確に規定されない限り、複数形を含む。さらに、「含む」という用語は、「備える」を意味する。さらに、「結合された」という用語は、結合されたアイテムの間の中間要素の存在を排除しない。
【0012】
本明細書で説明されるシステム、装置、および方法は、いかなる観点においても全く限定されるように構成されるべきものではない。代わりに、本開示は、様々な開示される実施形態のすべての新奇で、自明でない特徴および態様の、単独の状態、および互いとの様々な組合せの状態、および部分的組合せの状態を対象とする。開示されるシステム、方法、および装置は、これらのシステム、方法、および装置のいずれの特定の態様もしくは特徴、またはいずれの特定の組合せにも限定されず、また開示されるシステム、方法、および装置が、いずれの一つ以上の特定の利点が存在すること、または問題が解決されることを要求することもない。動作理論は、説明を円滑にすべきものであるが、開示されるシステム、方法、および装置は、そのような動作理論に限定されない。
【0013】
開示される方法のうちのいくつかの方法の動作は、都合よく説明するためにある特定の順序で説明されるものの、この説明のやり方は、以下に示される特定の言い回しによって特定の順序付けが要求されない限り、再整理を包むものと理解されたい。例えば、順次に説明される動作は、一部の事例において、並べ替えられること、または同時に実行されることが可能である。さらに、簡潔にするため、開示されるシステム、方法、および装置が、他のシステム、方法、および装置と併せて使用されることが可能であるような様々な仕方を、添付の図は示していない場合がある。さらに、この説明は開示される方法を説明するのに、「もたらす」および「提供する」のような語を使用することがある。これらの語は、実行される実際の動作を高いレベルに抽象化したものである。これらの用語に対応する実際の動作は、特定の実施形態に依存して異なり、当業者によって容易に識別可能である。
【0014】
以下の説明を簡潔にするため、一部の数学的評価技術は、複数ステップの計算として示される。他の例では、場合によって、1つまたは複数のステップにおいてこのような解析が行われる。このような数学的技術は例であって、開示される例にさらなる技術および変形を使用することも可能であり、一部の事例では、より単純な、またはより迅速な計算をもたらすことが可能である。
【0015】
質量分析を、液体クロマトグラフィ、ゲル電気泳動、ガスクロマトグラフィ、およびイオン拡散などの他の分離技術と組み合わせて行うことが可能である。このような技術の組合せによって得られたデータを、n次元データセットとして表すことができる。例えば、クロマトグラフ保持時間および質量スペクトルの質量対電荷比を、第1の軸および第2の軸の座標として使用することができる。これらの座標に関する信号強度を、データ値の2次元アレイとして表すことができ、さらにそのようなデータをイメージまたはイメージデータと呼ぶことができる。
【0016】
質量分析および液体クロマトグラフィは、生体サンプルの評価に適用できる2つの重要な分離技術であり、さらにLC/MSデータセット(本明細書でイメージまたはイメージデータと呼ばれる)を以下の説明において使用するが、他の形式のデータを使用することも可能である。通常の生物試料は、タンパク質、炭水化物、脂質、および代謝産物の混合を含むが、その他の化学試料または生物試料を同様に調べることもでき、さらに開示される方法および装置は、非生物試料にも適用できる。
【0017】
開示される方法および装置のいくつかの例は薬学研究に属する。薬学医療(pharmaceutical medical)研究は、病状または医薬を使用した治療に対する反応などの生理学的状態の指標である生化学物質を特定することを対象とすることがある。そのような化学物質の1つまたは複数の物質を、生体指標と呼ぶ。生体指標は、病状または他の生理学的状態を診断するのに使用できる。生体指標は、研究室において臨床エンドポイントの代わりに使用でき、そのような生体指標はサロゲートエンドポイントと呼ばれる。サロゲートエンドポイントを、人間に対しまたは動物に対してさえ使用することなしに、医薬品の開発に使用することができる。薬品開発は、試験管の中でサロゲートエンドポイントの試験を行うことから始めることができる。
【0018】
一般的な順序として、試料に関係する化学的混合物を液体クロマトグラフィ機器/質量分析機器の中に導入できるように、生検標本、血液、唾液、羊水などの生体試料を処理する。次に、得られたデータ(保持時間およびm/z比の関数としての信号強度)から、この複雑な混合物中の生化学物質が同定される。この公開されている方法および装置を用いると、データの一部分を選択することによって、生物学的に、より関係のあるデータを同定することができる。具体的には、これらの方法および装置を用いると、関心対象の信号を汚染する可能性があるノイズまたは他の余計な信号から関心の対象となっている部分を分離、または抽出することによって、LC/MSデータから1つまたは複数の知りたい化学物質のSN比の向上した信号を同定することができる。1つまたは複数の成分(moieties)に関連する信号部分を除去、または部分的に除去し、詳細に信号特徴を調べることができる。例えば、ある特定の成分に関連するピークを、その他のピークがより明確にされ得るように除去することができる。
【0019】
公開されている通り分析データを解析することにより、複雑に混じり合っている化学物質をより良く分離および同定することができる。研究者は、健康な対象と疾患のある対象、および/または治療を受けていない対象と治療を受けている対象に関して、この解析プロセスを繰り返すことができる。このようにして同定された、健康な対象と疾患のある対象または治療を受けている対象と治療を受けている対象の間の化学物質成分の違いに基づいて、生体指標を定義することができる。この生体指標を、臨床エンドポイントの代わりに使用するサロゲートエンドポイントとする場合もある。そのような生体指標を、薬品開発において診断指標および治療指標に使用できる。
【0020】
代表的な実施形態として、本明細書において、LC(液体クロマトグラフィ)およびMS(質量分析)に基づいた画像について述べる。通常、信号強度はLC保持時間およびMS質量対電荷比(m/z)の関数として記録され、この記録された信号強度をイメージデータアレイとして格納、または処理することができる。本明細書における便宜上、通常、保持時間を水平線(x軸)にとり、m/zを垂直線(y軸)にとる。他の例では、LC保持時間またはm/z比の代わりに、または加えて、他の形式のデータを使用する。例えば、CG(ガスクロマトグラフィ)、イオン分光法、ゲル電気泳動、イオン拡散、または質量分析飛行時間などのデータを使用できる。
【0021】
以下の例において、生体サンプルの評価に関連する解析結果が、レプリケートと呼ばれるデジタル画像としてキャプチャされる。強度変動は、レプリケート上に散乱されている。前述したとおり、従来の評価技術ではレプリケート上の様々な強度の変動の関係を同定することができない。いわゆる「時間伸縮法」を使用して、これらの強度の変動を調整することで、ノイズである変動を同定し、ノイズでない強度の変動を明らかにすることは可能であるが、一部の強度の変動を整列させると他の強度の変動の不整が生じ、この不整の生じた変動が重要な特徴を表す変動である場合もある。
【0022】
図1は、生体サンプルを処理して生物学的特徴を検出するためのシステムを示す。このシステム100では1つまたは複数の生体サンプル102を入手する。各生体サンプル102は、通常、同一または同様または異なる処置条件104の処置を受ける。システム100は、この処置に基づいて生体サンプル106を準備し、そのように準備された生体サンプル106は、様々な液体クロマトグラフィおよび質量分析処理を利用したLC/MS機器108によってさらに処理される。この処理の結果は1つまたは複数のLC/MSイメージ、レプリケート、または構成イメージの形式で得られる。これら結果は、専用プロセッサなどの1つまたは複数のハードウェア処理デバイスとして、および/または汎用コンピューターなどの1つまたは複数のコンピューティングデバイス上で実行されるソフトウェアとして提供される関心領域プロセッサ110に送られ、さらに処理される。関心領域の形状および相互関係に基づく様々なスコアにより、システム100が、LC/MS処理機器108によって前処理された生体サンプル106から抽出された生物学的特徴を分類し、さらなる調査のために1名または複数名の研究者に送られる、または提示されることが可能な生物学的候補リスト112を提供できるようになる。
【0023】
図2に関心領域プロセッサ110をより詳細に示す。関心領域プロセッサ110はデータセレクタ202を含む。データセレクタ202は、実験の定義、1つまたは複数の実験条件とこれらのイメージとの関係、または生物学的変異とこれらのイメージとの関係などに基づいて、イメージの集合体を選択する。イメージの集合体中の各イメージをLC/MS(液体クロマトグラフィ/質量分析)イメージまたはレプリケートまたは構成イメージと呼ぶことができる。構成イメージの集合体はデータセレクタによって定義される様々な関心領域を含む。イメージデータベースからこの集合体を抽出することができ、あるいは適切なイメージが生成されるように、データセレクタをLC/MS機器または他の機器(試料準備機器を含む)に結合することができる。
【0024】
各関心領域を様々な方法で定義することは可能であるが、すべての方法は、関心領域を定義するために適切な強度の変動を使用する。合成イメージ上のピークの検出は、関心領域を定義するために使用できる1つの適切な強度の変動であり、このような定義(境界座標、区域など)は、構成イメージの集合体の中の関心領域を定義するのに使用され、それぞれのイメージは対応する関心領域を含む。これらの構成イメージを、合成イメージを形成する、構成イメージの平均化または最大投射(maximal projection)などの適切な技術によって、合成イメージを生成するために使用することができる。(最大投射における、各x、y座標の組での構成イメージのいずれかに関連する最大値が、合成イメージの強度として選択される。)合成イメージ上のスポットなどの変動によって特徴境界が決定する。(本明細書で使用されるスポットとは、構成イメージの中で接触している区域を成す強度のピークである。)特徴的な境界、およびこれらの特徴的な境界から生じるマスクは他の構成イメージ上の対応する関心領域を同定するのに使用される。異なる構成イメージからの対応するピークは、通常、重なり合うか、または合成イメージ上で非常に近接している。
【0025】
関心領域プロセッサ110はマイクロアライナ204を含む。マイクロアライナ204は、液体クロマトグラフィプロセスでの不確実な、または不十分な補正を補うために保持時間に沿って整列配置させる。一実施形態において、マイクロアライナ204は、ある関心領域のピクセルおよびそれに対応する関心領域を保持時間に沿って整列配列する。構成イメージの他の部分および構成イメージの他の関心領域は、考慮されず、関心領域のこれらの部分が同一の保持時間を有する場合でさえ影響を受けない。1回に1つだけの関心領域に、このように的を絞ることにより、従来の時間伸縮法の場合には可能でない整列配置が可能になる。
【0026】
マイクロアライナ204は構成イメージの中の関心領域を整列配置するが、その構成イメージの境界はあらかじめ検出されている関心領域から得られている。検出は合成イメージを使用して行うことができる。構成イメージにおける関心領域のマイクロ整列配置は、スコア付けに役立てることができ、これらのスコアは、科学的発見を助ける、生物学的特徴またはそれらの欠如などの手がかりを明らかにする。スコア付けは、構成イメージが既に整列配置している場合、マイクロ整列配置なしに進めることができる。一部の事例においては、関心領域検出器206などを用いてマイクロ整列配置の後に関心領域の境界を再定義することが、関心領域の近傍におけるノイズを除去または最小限に抑えるのに有効であることがある。
【0027】
マイクロアライナ204は、合成イメージが存在しない場合であっても関心領域の整列配置を改善することが可能である。この事例では、様々な構成イメージ上の関心領域は、これらの構成イメージ上で互いに対応する場合同定される。次に、マイクロアライナ204は対応する関心領域の一組を整列配置させる。マイクロ整列配置における合成イメージの1つの用法は、複数の構成イメージからの関心領域を関連付けることである。対応する関心領域の複数の組を合成イメージなしに同定できる場合、対応する関心領域のそれらの組をマイクロ整列配置できる。
【0028】
関心領域プロセッサ110は関心領域検出器206を含む。マイクロ整列配置が実行された場合、関心領域検出器206は実行前の関心領域の検出を修正することができる。実行前の関心領域は、できの悪い整列配置が行われた構成イメージからなる合成イメージから検出された可能性がある。実行前の関心領域の境界が構成イメージの中の関心領域を見出すのに使用される場合、これらの関心領域が関心対象ではないピクセルを含んでいる場合がある。このようなピクセルはノイズであり、周囲のバックグラウンドおよび近傍の低質部分など、関心対象のピクセルを含む信号と区別すべき部分である。合成スニペット(関心領域などの合成イメージの一部分)を作成することによって、実行前の関心領域を、関心対象のピクセルをより多く、ノイズなどの関心対象でないピクセルをより少なく含むように再定義できる。ノイズが少なければ、信号はよりよく同定されるようになり、科学的発見につながる生物学的手がかりを明らかにするためのよりよいスコア付けができるようになる。
【0029】
関心領域プロセッサ110はデータエクストラクタ208を含む。合成スニペットにおいて実行前の関心領域が再定義され、その中の関心対象のピクセルの位置を記述するために、2次元マスクが作成される。この2次元マスクは対応する関心対象(イメージスニペット)を得るのに使用され、それぞれの関心対象は構成イメージの関心領域に対応している。マイクロ整列配置が実行されている場合、マイクロ整列配置がすでになされた構成イメージを使用することが、対応する関心領域を得るために好ましい。これらマスクされたイメージスニペットは、スコア付けのために最終的に使用される2次元関心領域を構成する。これらマスクされたイメージスニペットから、特徴的なクロマトグラフおよび特徴的な質量スペクトルが得られる。また、各2次元イメージスニペットのシリアル化されたバージョンが作成される。
【0030】
関心領域プロセッサ110は、相関エバリュエータ210を含む。相関エバリュエータ210は、質量/電荷スペクトル、液体クロマトグラフィクロマトグラフ、またはシリアル化されたイメージスニペットなどの、マスクされたイメージスニペットの中の対応する関心領域を比較して、相関スコアを算出する。関心領域の相互関係をスコア付けする際、相関イバリュエータ210は1つまたは複数のマイクロ整列配置がなされたイメージスニペットの中の対応する関心領域を選択する。正確には、相関スコアは、単一の処置条件および/または生物学的変種に属するレプリケートである構成イメージの集合体から算出される。このような相関スコアはピークなどの変動の信頼度を示す。大きな変動が予期される状況において、低い相関スコアは、重要な生物学的事象を示す可能性がある。複数の処置条件および/または生物学的変種が関与している場合、相関スコアを1つまたは複数の処置条件の特定の一組から導き出すことができ、あるいはそれぞれのレプリケートまたは処置条件にそれぞれ異なる重みを付けたスコア付けを行うことができる。これらのオプションから、低いスコアが低い再現性に起因し、重要な生物学的変異に起因するのではないことが明らかである。
【0031】
対応する関心領域を定義する信号をそれぞれが含む、統計的に十分な数の構成イメージが存在する状況において、相関イバリュエータ210は条件内相関スコア付けを用い、選択された構成イメージの中の各関心領域(ピークまたは特徴などの変動)に均等に重みを付ける。データセレクタ202は、単一の、処置条件または生物学的変異を含むように構成イメージ選択を制限することがある。選択された構成イメージのうちの、1つの構成イメージの中の関心領域の中に変動が存在し、他の構成イメージの関心領域の中には存在しない場合、相関イバリュエータ210はその変動は信頼できないとみなし低い相関スコアが予期されることがある。
【0032】
スコアが複数の生物学的変異および/または複数の実験条件から導き出される状況では相関イバリュエータ210は構成要素で重みを付ける相関スコア付けを使用する。さらに、そのような構成要素で重みを付ける相関スコア付けは、前述したような条件内相関スコア付けを可能にするために、単一の処置条件または生物学的変異に対して存在する構成イメージが非常に少ない状況に適している。したがって、複数の処置条件および生物学的変異からのイメージが使用される。構成要素重み付き相関スコア付けは、対応する関心領域の一組からの各関心領域(ピークなどの変動)の関連性を別々に考慮する。一つの変動内で、構成要素重み付き相関スコア付けは、関心領域内で見出された特性に基づき各構成イメージの関心領域に重み付けを行う。重み付けは、構成イメージ上の関心領域から導き出される他のスコアに基づくことも可能である。例えば、相関イバリュエータ210は、構成イメージの中の関心領域内の(ピーク体積、ピーク高などの)強度を使用できる。さらなる例として、信号がない場合、相関イバリュエータ210は、欠如した信号に関する重みは0であることを決定する。
【0033】
関心領域プロセッサ110は、形状スコアラ212を含む。形状スコアラ212は関心領域での形状特性に関する形状スコアを計算する。形状スコアは、保持時間対称性、ピーク頂点からの保持時間単調性、面積、体積、最大高、標準偏差、面積対称性比、質量/電荷対称性、ピーク頂点からの質量/電荷単調性、前処理、周辺勾配、および接線体積比などのあらゆる形状に及ぶ。形状スコアは、単一のイメージに対して計算されるが、イメージは、個別の構成イメージまたは他のイメージの合成であっても良い。形状スコアは、関心領域に含まれる信号が科学的発見をさらに発展させるかどうかを研究者に示す。様々な関心領域における信号変動は、(グレースケールスポットなどの)2次元オブジェクトとして現れるため、これらの変動をその形状によって記述できる。有用な関心領域は、楕円形の区域、対照的な強度分布、領域重心からの強度の単調な減少などの一般的な形状特性を含む傾向がある。これらおよびその他の形状特性を使用すると、単一の構成イメージからの関心領域、または複数の構成イメージからの関心領域の集合体を分類できる。
【0034】
前述したとおり、保持時間対称性、ピーク頂点からの保持時間単調性、面積、体積、最大値、標準偏差、面積対称性比、質量/電荷対称性、ピーク頂点からの質量/電荷単調性、立体感、周辺勾配、および接線体積比などの特徴に基づいてイメージにスコアを割り当てる幾何学的な方法が多数存在する。そのようなスコア付けのいくつかの例が、以下に説明される。
【0035】
周辺勾配スコア付けを、代表的なLC/MSスポット、特徴、またはピーク1600を表す図16A〜図16Fに参照として示す。ピクセル輝度をグレースケール符号化する。図16Bに示すように、スポット1600の外側ピクセル1602は1ピクセル侵食操作によって除去される。外側ピクセル1602を図16Cに示す。外周部ピクセル1602の平均輝度は、スポット1600の外周部輝度として定義される。内周部ピクセル1604が、図16D〜図16Eに示されるとおり、さらなる1ピクセル侵食操作によって除去される。内周部ピクセル1604の平均輝度は、スポット1600の内周部輝度として定義される。スポット1602の周辺勾配は外周部輝度に対する内周部輝度の比として定義される。信頼できるスポットは、約0.8、1.0、1.5、2.0またはそれより大きい勾配を超える周辺勾配を有する。外周部ピクセル1602および内周部ピクセル1604除去後の侵食操作されたスポット1606を図16Fに示す。
【0036】
立体感スコア付けは、平面オブジェクトを囲み、さらに凸状の反りだけを有する(すなわち、変曲がない)最小の2次元形状の内周部として定義された凸状の外殻に基づく。凸状の外殻を、伸ばした輪ゴムでオブジェクトの周囲をとめたといった形状として視覚化できる。凸状の外殻との類比により、凸状のライニングをオブジェクトに完全に囲まれた最も大きい凸形状の輪郭として定義することができる。凸状の外殻および凸状のライニングの、くぼみを有する形状1702、および突起を有する形状1712のものを図17に示す。形状1702は、凸状の外殻1704および凸状のライニング1706を有する。形状1712は、凸状の外殻1714および凸状のライニング1716を有する。これらの定義に基づき、立体感を2つの方法で定義することができる。外殻立体感はオブジェクトの中にも入っている凸状の外郭の中のピクセルの数の割合である。ライニング立体感は凸状のライニングの中にも入っているオブジェクトの中のピクセルの割合として定義される。外殻立体感は、くぼみによってよりも突起によってより大きく影響され、ライニング立体感は、突起によってよりもくぼみによってより大きく影響される。立体感スコアの範囲は0から1まで取ることができる。1に近い立体感スコアはより信頼できるスポットを示す。スコアは0.5から1.0まで、0.6から1.0まで、または0.8から1.0までの範囲をとることが好ましい。
【0037】
図18は、接線体積比に基づくスコア付けを示す。一例であるピーク曲線1800を参照すると、線分1804が、ピーク頂点1802からピーク終点1806まで延びている。線分1804およびピーク曲線1802は、凹状の下方区域1810(ピーク曲線1804とピーク曲線1802の間における、線分1804より上の区域)、および凹状の上方区域1812(ピーク曲線1804とピーク曲線1802の間における、線分1804より下の区域)を決定する。接線体積比は凹状の下方体積に対する凹状の上方体積の比として定義される。接線体積比は、0から無限大までの範囲をとることが可能であるが、約0.5、0.75、1.0、2.0、3.0、5.0、および10より大きいスコアが好ましく、しかしその他の範囲をとることもできる。少なくとも約3.0の接線体積比が好ましい例もある。
【0038】
関心領域プロセッサ110はスコアコンバイナ214を含む。関心対象の生物学的特徴を明らかにし関心対象でない生物学的特徴を消去するように、スコアクラシファイア216において関心領域を分類する新たなスコアを導き出すために、スコアを単独で使用しても多くの適切な仕方で組み合わせてもよい。分類することによって関心領域を格付けしフィルタリングできるようになる。例えば、最高位に格付けされた関心領域以外はすべて消去することを望む科学者がいるかもしれない。コンピューター自動化によって、科学者との意思疎通なしに、様々なスコアによって定量化されたいくつかの標準を満たす関心領域を明らかにすることを実行できる。これらのスコアは、少なくとも2つのタイプ、すなわち、形状特性スコアおよび相関スコアから選択される。
【0039】
図3A〜図3Dは、マイクロ整列配置を行う前の構成イメージ300a、構成イメージ300b、および構成イメージ300cの従来の時間伸縮を示し、これらから合成イメージ300dが得られる。構成イメージのそれぞれは、ピークとして現れる4つの変動を示す。合成イメージ300dは、これらの変動のうち1つが整列配置しているが残りの変動は不整配置であることを示す。この主題の様々な実施形態において、マイクロ整列配置は、1回に1つの関心領域を整列配置させ構成イメージにおける残りの関心領域は考慮しない。様々な変動が、地形図の場合と同様に等強度線を表す等高線として現れることに留意されたい。図3E〜図3Fは関心領域の検出を示す。関心領域の一組は、変動300eの境界を同定することによって合成イメージの中で見出される。これらの変動を除去すると、関心領域300fの組によって示されるとおり長方形の境界300fが残る。望ましくないノイズである可能性がある、重なり合う変動(等高線の干渉)に注目されたい。
【0040】
図4A〜図4Dは、変動をよりよくマイクロ整列配置させる変動の境界の時間的拡大を示す。合成イメージ400aの中の変動の境界は、保持時間における逆方向の拡大および保持時間における順方向の拡大を示す矢印を有する長方形として示される。同様に、合成イメージ400aの中の変動に対応する構成イメージ400bの中の変動の境界が拡大される。さらに、合成イメージ400aの中の変動に対応する構成イメージ400cの中の変動の境界が同様に拡大される。さらに、合成イメージ400aの中の変動に対応する構成イメージ400dの中の変動の境界が拡大される。一実施形態において、1保持時間幅分早く、1保持時間幅分遅く拡大され、したがって、関心領域は現時点で保持時間次元において3倍長くなるが、より小さく拡大、またはより大きく拡大して使用することもできる。
【0041】
図5A〜図5Dは、マイクロ整列配置ウインドウ500aに基づく様々な関心領域500b、500c、および500dのマイクロ整列配置を示す。図2におけるマイクロアライナ204に関連する説明を参照されたい。図5A〜図5Dに示すように、マイクロ整列配置は、様々な構成イメージにおける他の関心領域をマイクロ整列配置させない。関心領域500b、500c、および500dは、保持時間次元において移動されており、すべての関心領域500b、500c、および500dが現時点で互いに整列配置されて見える。構成イメージの他の部分は整列配置していない。
【0042】
図6Aは、関心領域500b、500c、および500dを多重化して形成した合成イメージ600aをマイクロ整列配置した変動を示す。図6Bは、マイクロ整列配置した変動を、余分な背景を消去する境界600bとよりよくあわせるための、合成イメージ信号変動の修正された領域定義を示す。境界600bを使用して、図6C〜図6Eに示されるとおり、さらに図2に示される関心領域検出器206を参照して説明されるとおり、様々な構成イメージにおける境界600bによって規定された境界に基づいて、関心領域(イメージスニペット)600c、600d、600eは割り当てられる。イメージスニペット600c、600d、600eにおける、これらの新たにマイクロ整列配置した、対応する領域は、マイクロ整列配置の前と比べて比較分析によりよく適している。合成イメージおよび合成イメージを構成するイメージのその他の関心領域は、すべての関心領域のマイクロ整列配置が実行されるように同様のプロセスを経る。多くの事例において、領域再定義を行うと、より小さい領域に、信号がより多く、ノイズがより少なく含まれるようになり、同様に干渉する信号がより少なく含まれるようになる。
【0043】
図7A、図7C、および図7Dは、余計な背景区域を除くように関心領域が再定義されている、マイクロ整列配置したイメージスニペット700a、700b、および700cを示す。図7B、図7D、および図7Fは、関心対象の生物学的特徴を分類するための相関スコアを生成した後の相関分析に適したピクセルを明確にするために、マイクロ整列させられたイメージスニペット700a、700b、および700cの上に置かれた、重ね合わされたピクセルマップ700d、700e、および700fを示す。位置(1、4、41、および44)におけるピクセルは、マスクされた関心領域の外に存在するので考慮されない。従来の分析とは異なり、この主題の様々な実施形態において、関心領域を領域的に再定義して、形状特性のよりよいスコアをもたらすことに留意されたい。さらに、1つの構成イメージからのピクセルが、別の構成イメージの同一の位置におけるピクセルと比較され得るため、このようなピクセルごとの比較を活用して、関心対象の生物学的特徴を分類するための相関スコアがよりうまく生成されることが可能である。
【0044】
図8Aは、いくつかの行といくつかの列を含む2次元マスク800aを示す。各行と各列の交点を項Uijとする。ここでi、jは、行位置および列位置をそれぞれ特定する正の整数である。このような命名法をマスクにおけるすべてのピクセルに適用できる。図8Bは、マスク800aによって明らかにされる様々な輝度値を示す、マスクされたスニペット800bを示す。図8Cは、マスク800aによって明らかにされる様々な輝度値をやはり示す、別のマスクされたスニペット800cを同様に示す。同様に、図8Dは、マスク800aによって明らかにされる様々な輝度値をさらに示す、さらなるマスクされたスニペット800dを示す。
【0045】
図9は、行および列に対応するデータを含むテーブル900を示す。第1の列は、マスク800aによって確立されたピクセルラベルを含み、マスク化された2次元イメージスニペット800b、800c、および800dをシリアル化するのに使用される。第2、第3、および第4の列は構成ベクトルを表し、さらにマスクされたスニペット800b、800c、および800dから得られ、テーブル900の第1の列によって決定される順序でシリアル化されたピクセル輝度値を含む。第5の列は、「コンセンサス」と名付けられ、先行する3つの列からのデータから計算されたコンセンサスベクトルデータを含む。一実施形態において、コンセンサスベクトルデータは、先行する3つの列の算術平均である。
【0046】
図10は、テーブル900のデータ点からなるグラフ1000を示す。具体的には、コンセンサスベクトル(テーブル900の第5の列に示される値)が、各構成ベクトル(値が、テーブル900の第2の列、第3の列、および第4の列に示される)と対にされる。相関イバリュエータ210が、ベクトル同化のために後に使用される、プロットされた線のそれぞれの傾きおよび切片(intercepts)を算出する。グラフ1000は、すべての構成値に関する応答値としてコンセンサス値をプロットする。これらの関係から同化パラメータを評価できる。原点にある切片との線形関係が存在する場合、与えられた構成ベクトルに関する同化パラメータは、コンセンサスベクトルの値に合わせられた線の傾きである。
【0047】
図11は、図10に示されるデータから導き出された別のグラフ1100を示す。構成ベクトルの(テーブル900の第2の列、第3の列、および第4の列に示される)値は、それぞれの線形フィットから求めた傾きを掛けて修正されている。つまり、同化は、各構成ベクトルに、コンセンサスベクトル対それぞれの構成ベクトルの傾きを掛けることによって行われている。同化の後、コンセンサスベクトルに対する各構成ベクトルの線形フィットの傾きは、1により近い。
【0048】
図12は、データが、図11に示されるグラフ1100にグラフ化されているデータと同一のデータを用いたグラフ1200である。グラフ1200は、これら3つの構成ベクトルの区別をしていない。コンセンサスベクトルからの輝度と、同化されたすべての構成ベクトルの輝度との間の関係から、モデルがたてられる。つまり、イメージスニペットの間の区別は取り除かれており、最もよくフィットしている線がプロットされている。相関スコアはグラフ1200の中の点の或る線に対するフィッティングに基づく。例えば、線形フィットへの最小二乗回帰の相関スコアが、データが互いにどれだけよく相関するかを示す。
【0049】
図13A〜図13Yは、生物学的特徴を発見するために関心領域を処理する方法13000を示す。方法13000は、開始ブロックから方法ステップの一組13002に進む。方法ステップの一組13002は継続端子(「端子A」)と終了端子(「端子B」)の間と定義される。方法ステップの一組13002はデータ選択プロセスの実行を表す。ここで、データは前処理された生体サンプルから抽出される。端子A(図13D)から、方法13000は、ブロック13018に進んで、LC/MSイメージ(構成イメージ)の一組を生成するLC/MS処理を実行する。ブロック13020で、オプションとして、時間伸縮アルゴリズムを実行して構成イメージのセットを整列配置させる。ブロック13022で、構成イメージの一組から合成イメージが形成される。次に、方法13000は、ブロック13024で、合成イメージの中の(ピークの検出などの)変動の検出により、合成イメージの中の関心領域を同定する。ブロック13026で、合成イメージの中の様々な関心領域を規定する座標を得る。これらの座標を使用して、方法13000は、ブロック13028で、合成イメージの中のそれぞれの関心領域と関係する構成イメージにおける様々な関心領域を規定する。ブロック13030で、或る基準(実験上の定義、実験条件、または生物学的変異)に基づいて、構成イメージのサブセットを選択するよう命令される。次に、方法13000は、終了端子Bに進む。
【0050】
構成イメージのサブセットは、1つの構成イメージからの単一の関心領域に関係する、または構成イメージの集合体に対応する関心領域の一組(構成イメージごとに1つの関心領域)に適切であると思われるスコアを生成するために、後のスコア付けプロセスに加わる。相関スコア付けのための構成イメージを選択する際に、(イオンとして登録された)化学物質が、1つの条件において存在するが、別の条件においては存在しない場合があることを認識することが適切である。選択された構成イメージが、複数の処置条件または複数の生物学的変異からである場合、1つの条件において信号が存在しない状態が、別の条件において化学物質の存在によって現れた別の信号が存在する状態と比較されるため、(ピークなどの)重要な変動との相関が弱いことが予想される。これらのスコアは、信頼できるデータを信頼できないデータから区別するのに使用できる場合があるので、いくつかの条件の間の関係のある変動が、信頼できないと誤認される可能性がある。様々な構成イメージから関連する領域を表す適切な条件を選択することによって、この状況に対処することができる。例えば、或る時点で或る特定の条件を表すスコアのなかかの平均スコア、中心スコア、最良スコア、最悪スコア、または最も強力なスコアを選択することができる。すべての構成イメージの関心領域が、この1つのスコアを引き継ぐ。この方法を、条件内相関スコア付けと名付け、後段で説明する。原則として、この方法は条件にかかわらず2つ以上のイメージに適用できる。代替として、異なる統計方法を使用することにより、化学物質が条件のいくつかにおいてだけ現れる、複数の条件を元に重み付けした構成要素を、使用できるようになる。この後者の方法は、構成要素重み付き相関スコア付けと名付けられ、後段で説明される。この方法は、或る条件における構成イメージの数が少なく、疑わしい統計的結論が生じるような事例において使用できる。
【0051】
端子B(図13A)から、方法13000は、継続端子(「端子C」)と終了端子(「端子D」)の間に規定される方法ステップの一組13004に進む。方法ステップ13004の一組は、オプションであるマイクロ整列配置プロセスを実行して、マクロ整列配置を用いる必要なしに関心領域を整列配置させる。
【0052】
端子C(図13E)から、方法13000は、まだ処理のためにスコア付けされていない合成イメージの中の元の関心領域を同定するブロック13032に進む。ブロック13034で、方法は、合成イメージの中の元の関心領域と関係する構成イメージのサブセットの中の関心領域を同定する。ブロック13036で、方法は、合成イメージの中の元の関心領域の幅を(保持時間次元において)測定する。次に、方法は、様々な構成イメージにおける同定された各関心領域に、同一の測定された幅を持たせる(ブロック13038を参照されたい)。ブロック13040で、方法は、同定された各関心領域の幅を、保持時間次元において逆方向および順方向にさらに拡大する。この拡大により、関心領域の初期定義において除外されている可能性がある、関係のある信号を含めることができる。一実施形態において、測定された幅だけ両方向に拡大し、幅を3倍増加させる。この方法は、オプションとして、ブロック13042で、1などの許容誤差だけ変更された中心M/Zにおけるクロマトグラフに的を絞るように、同定された各関心領域の高さを減少させる。ブロック13044で、方法は、マイクロ整列配置のためのマスタイメージを同定するプロセスを開始する。次に、方法は、別の継続端子(「端子C1」)に進む。
【0053】
端子C1(図13F)から、方法13000は、元の関心領域がマスタスニペットとして選択されるかどうかを判定する試験が実行される判定ブロック13046に進む。判定ブロック13046における試験への答えが、「いいえ」である場合、方法13000は、マスタスニペットが、構成イメージおよび合成イメージのなかから選択されるブロック13048に進む。次に、方法は、別の継続端子(「端子C7」)に進む。代わりに、判定ブロック13046における試験への答えが、「はい」である場合、方法は、別の継続端子(「端子C2」)に進む。
【0054】
端子C2(図13F)から、方法13000は、方法が、元の関心領域と互いに関係する構成イメージのサブセットにおける関心領域を(見込まれるマスタスニペットとして)見出すことを開始するブロック13050に進む。ブロック13052で、元の関心領域は、行列U=uijであり、さらに見込まれるマスタスニペットは、V=vikと定義される。ブロック13054に示されるとおり、変数kは、nが、元の関心領域の(ピクセル単位の)幅である、j−n,...,j+nの範囲をとり、変数iは、質量/電荷次元において1からmまでの範囲をとり、さらに変数jは、保持時間次元に沿って1からnまでの範囲をとる。ブロック13056で、v(q)が、見込まれるマスタスニペットから導き出される。変数qは、保持時間シフト(retention time shift)を表し、ブロック13056に示されるとおり、−nから,...,nまでの範囲をとる。次に、方法13000は、別の継続端子(「端子C3」)に進む。
【0055】
端子C3(図13Gに示される)から、方法は、ブロック13058で、正規化された相互相関最大値t1(q)を計算することを準備する。ブロック13060で、方法は、この項を計算する。
【0056】
【数1】
【0057】
項
【0058】
【数2】
【0059】
は、前述の数学演算の結果である。ブロック13062で、方法は、以下の項をさらに計算する。
【0060】
【数3】
【0061】
得られた結果
【0062】
【数4】
【0063】
は、そのような数学演算の結果である。方法13000は、ブロック13064に進み、以下の項
【0064】
【数5】
【0065】
からt1(q)を計算する。
【0066】
方法13000は、別の継続端子(「端子C4」)に進む。端子C4(図13G)から、方法は、被除数と除数の商である線形相関係数最大値t2(q)を計算することを準備するブロック13066に進む。ブロック13068で、被除数が、以下のとおり計算される。
【0067】
【数6】
【0068】
ブロック13070で、除数が、以下のとおり、計算される。
【0069】
【数7】
【0070】
次に、方法13000は、別の継続端子(「端子C5」)に進む。
【0071】
端子C5(図13H)から、方法は、正規化された最小二乗差最小値t3(q)を計算することを準備する。ブロック13072を参照されたい。方法は、以下の式を計算する。
【0072】
【数8】
【0073】
ブロック13074を参照されたい。次に、方法は、別の継続端子(「端子C6」)に進む。端子C6(図13H)から、方法は、関心領域に関するスコアが、正規化された相互相関最大値、線形相関係数最大値、および正規化された最小二乗差最小値のなかから選択されるブロック13076に進む。方法13000は、評価されるべき別の関心領域が存在するかどうかを判定する試験が実行される判定ブロック13078に進む。判定ブロック13078における試験への答えが、「はい」である場合、方法は、端子C2に進み、上記で定められた処理ステップが繰り返されるブロック13050にループバックする。そうではなく、判定ブロック13078における試験への答えが、「いいえ」である場合、方法は、合成イメージの中の元の関心領域と最もよく相関するスコアを有する関心領域が、マイクロ整列のためのマスタスニペットとして選択されるブロック13080に進む。次に、方法は、別の継続端子(「端子C7」)に進む。
【0074】
端子C7(図13I1)から、方法は、マスタスニペットとのマイクロ整列配置のために、サブセットにおける構成イメージの中の関心領域(イメージスニペット)を選択する。ブロック13082を参照されたい。マスタスニペットは、行列U=uijであり、さらにマイクロ整列配列させられるイメージスニペットは、V=vikと定義される。ブロック13084を参照されたい。さらに、nは、元の関心領域の(ピクセル単位の)幅であり、さらにiは、質量/電荷次元において1からmまでの範囲をとり、さらにjは、保持時間次元に沿って1からnまでの範囲をとり、さらにkは、保持時間次元に沿ってj−nからj+nまでの範囲をとる。ブロック13083、13085を参照されたい。v(q)は、−m,...,nの範囲にあるkを(保持時間次元において)q移動させることによって、イメージスニペットvikから導き出される。ブロック13086を参照されたい。qは、k−q≠jであるため、マッチしないピクセルを除外して、マスタスニペットuijに対するv(q)の輝度の適切な相関に基づいて、計算される。ブロック13088を参照されたい。時間整列配置の様々な方法を使用できる。以下は、いくつかの方法の例である。
【0075】
t1(q)が端子C3、C4の間に示されている正規化された相互相関最大値を使用して最大化されるように、qの1つの値が計算される。ブロック13090を参照されたい。方法13000は、別の継続端子(「端子C11」)に進む。
【0076】
端子C11(図13I2)から、t2(q)が端子C4、C5の間に示されている線形相関係数最大値を使用して最大化されるように、qの別の値が計算される。ブロック13092を参照されたい。t3(q)が端子C5、C6の間に示される正規化された最小二乗差最小値を使用して最小化されるように、qのさらなる値が計算される。ブロック13094を参照されたい。次に、方法13000は、別の継続端子(「端子C8」)に進む。
【0077】
端子C8(図13J)から、方法は、適切なマイクロ整列配置を同定する相関が存在するかどうかを判定する試験が実行される判定ブロック13096に進む。判定ブロック13096における試験への答えが、「はい」である場合、マスタスニペットとの適切な相関をもたらす移動されたイメージスニペットは、さらなる処理のために保持される。ブロック13098を参照されたい。次に、方法は、別の継続端子(「端子C9」)に進む。判定ブロック13096における試験への答えが、「いいえ」である場合、方法は、別の判定ブロック13100に進み、重心整列配列が使用されるべきかどうかを判定する試験が実行される。判定ブロック13100における試験への答えが、「はい」である場合、方法は、イメージスニペットの最大値または重心が、マスタスニペットの最大値または重心と一致するように、イメージスニペットの保持時間を移動させる。ブロック13102を参照されたい。次に、方法は、端子C9に進む。判定ブロック13100における試験への答えが、「いいえ」である場合、方法は、別の継続端子(「端子C10」)に進む。
【0078】
端子C10(図13K)から、方法は、適応整列配置などの別の整列配置方法が使用されるべきかどうかを判定する試験が実行される判定ブロック13104に進む。判定ブロック13104における試験への答えが、「はい」である場合、方法は、その別の形態の整列配置を実行して、マスタスニペットに対してイメージスニペットをマイクロ整列配置させる。ブロック13106を参照されたい。次に、方法は、端子C9に進む。判定ブロック13104における試験への答えが、「いいえ」である場合、方法は、端子C9に進み、マイクロ整列配置のための別の関心領域が存在するかどうかを判定する試験が実行される判定ブロック13108にさらに進む。判定ブロック13108における試験への答えが、「はい」である場合、方法は、端子C7に進み、以上に示された処理ステップが繰り返されるブロック13082にループバックする。そうではなく、判定ブロック13108における試験への答えが「いいえ」である場合、方法は、終了端子Dに進む。
【0079】
端子D(図13A)から、方法13000は、継続端子(「端子E」)と終了端子(「端子F」)の間に規定される方法ステップのセット13006に進む。方法ステップのセット13006は、後のスコア付けプロセスに適したピクセルに的を絞る改訂された関心領域検出プロセスを実行する。
【0080】
端子E(図13L)から、方法は、マイクロ整列配置が実行されたかどうかを判定する試験が実行される判定ブロック13110に進む。判定ブロック13110における試験への答えが、「いいえ」である場合、方法は、終了端子Fに進む。そうではなく、判定ブロック13110における試験への答えが、「はい」である場合、方法は、ブロック13112で、(合成イメージの中の元の関心領域とは異なる)合成スニペットを作成するステップを実行する。
【0081】
ブロック13114で、方法は、移動されたイメージスニペットの諸部分を、それらの部分が元の関心領域およびマスタスニペットuijと重なり合う場合、(ピクセルごとに)組み合わせて、イメージvikに関するk−q=jがqだけ移動されるようにする。ブロック13116で、方法は、新たに作成された合成イメージスニペットに従い、関心領域を再検出する。方法は、閾値化、分水界分析、ラプラスガウシアン(Laplace of Gaussian)畳み込みによる水平エッジ検出または径方向エッジ検出によって(ピーク検出またはスポット検出などの)変動を検出して、合成スニペットの中で新たなピークマスクを同定する。ブロック13118を参照されたい。ブロック13120で、方法は、スクリプト化されたピクセルの2次元マスクの使用を含め、関心領域を記述する方法を選択する。この2次元マスクは、相関スコアおよび形状スコアの計算に加わるピクセルを同定する。次に、方法は、終了端子Fに進む。
【0082】
端子F(図13B)から、方法13000は、継続端子(「端子G」)と終了端子(「端子H」)の間に示される方法ステップの一組13008に進む。方法ステップの組13008は、データ抽出を実行して、スコア付けプロセスを準備する。端子G(図13M)から、方法は、サブセットの各構成イメージに2次元マスクを適用して、新たな関心領域を獲得する。ブロック13122を参照されたい。次に、方法13000は、各2次元イメージがシリアル化されるブロック13123に進む。このことは、各スニペットに関して、方法が、ピクセル輝度の1次元ベクトルを生成することを意味する。つまり、1つのスニペットからのピクセル輝度の数値が、ベクトルを形成するように線形のやり方で1列に並べられる。マスクされた区域がP個のピクセルを含むスニペットを与えられ、方法は、1からPまでの固有の番号で各ピクセルにラベルを付ける。これらの番号は、2Dイメージスニペットの輝度に対して長さPのベクトルの輝度を設定する任意のピクセル順序を確立する。具体的には、ベクトルの中の位置jにおける輝度が、ラベルがjである2Dイメージスニペットの中のピクセルの輝度に設定される。つまり、これらのラベルは、2Dイメージスニペットの輝度を長さPのベクトルの輝度に関係付ける、任意のピクセル順序を構成する。関係するマスクされたすべての関心領域に関して同一の順序が使用される限り、任意のピクセル順序を使用できる。このベクトルは、同一のマスクでマスクされておりさらに同一の順序でシリアル化されている、他のイメージスニペットと互いに関係付けられる。ブロック13124で、方法は、構成イメージの各関心領域(構成スニペット)から特徴的なクロマトグラムを決定する。或る許容誤差を有する中心m/zを有するマスクされたピクセルのクロマトグラムが使用される場合に、これらの特徴的なクロマトグラムを決定できる。許容誤差は、通常1ピクセルであるが、0からイメージスニペットの境界までの範囲をとることができる。それぞれのイメージスニペットにおけるマスクされたピクセルの重心または最大値の使用を含め任意の適切な技術において、中心m/zを決定できる。代替として、各保持時間ですべてのm/zにわたって、マスクされたピクセルを積分または平均することによって、特徴的なクロマトグラムを得ることもできる。
【0083】
ブロック13126で、方法は、構成イメージの各関心領域(構成スニペット)から特徴的な質量スペクトルを決定する。イメージスニペットの特徴的なクロマトグラムの許容誤差を有する、輝度最大値または重心の、保持時間において、それぞれの特徴的なスペクトルをとることができる。許容差は通常1ピクセルであるが、0からイメージスニペットの境界までの範囲をとることができる。代替として、各m/z間隔ですべての保持時間にわたって、マスクされたピクセルを積分または平均することによって、特徴的なスペクトルを得ることもできる。
【0084】
ブロック13128で、方法は、形状特性を抽出するために、構成スニペットが関係する合成スニペットをメンバが含む可能性がある、構成スニペットの一組のメンバを選択する。ブロック13130で、方法は、相関スコアを計算するために、構成スニペットが関係する合成スニペットをメンバが含む可能性がある、構成スニペットのセットのメンバをさらに選択する。次に、方法は、終了端子Hに進む。
【0085】
端子H(図13B)から、方法13000は、継続端子(「端子I」)と終了端子(「端子J」)の間に示される方法ステップの一組13010に進む。方法ステップの組13010は、質量/電荷スペクトル、液体クロマトグラフクロマトグラム、および/またはシリアル化された2次元LC/MSスニペットのなかから選択されたデータの組に関して、相関スコアを計算する。
【0086】
端子I(図13N1)から、方法13000は、方法が、(シリアル化されたイメージ、クロマトグラム、またはスペクトルの)いずれのタイプのデータを処理するかを決定することを準備するブロック13131に進む。方法は、関係する関心領域のシリアル化されたスニペットに関する相関スコアを方法が既に計算しているかどうかを判定する試験が実行される判定ブロック13132に進む。判定ブロック13132における試験への答えが、「いいえ」である場合、方法13000は、ブロック13133に進む。そうではなく、判定ブロック13132における試験への答えが、「はい」である場合、方法は、別の継続端子(「端子I1A」)に進む。ブロック13133で、各構成要素につき1つの、シリアル化されたイメージスニペットが、相関のために準備される。シリアル化されたイメージスニペットは、行列としてひとまとめにされることが可能な等しい長さのベクトルの一組とみなされる。方法は、別の継続端子(「端子I2」)に進む。端子I1A(図13N2)から、方法13000は、方法が、関係する関心領域のクロマトグラムに関する相関スコアを既に計算しているかどうかを判定する試験が実行される判定ブロック13134に進む。判定ブロック13134における試験への答えが、「いいえ」である場合、方法13000は、ブロック13135に進む。そうではなく、判定ブロック13134における試験への答えが、「はい」である場合、方法は、ブロック13136に進む。ブロック13135で、各構成要素につき1つのクロマトグラムが相関のために準備される。クロマトグラムは、行列としてひとまとめにされることが可能な等しい長さのベクトルの一組と考えられる。ブロック13136で、各構成要素につき1つのスペクトルが、相関のために準備される。スペクトルは、行列としてひとまとめにされることが可能な等しい長さのベクトルの一組と考えられる。方法は、別の継続端子(「端子I2」)に進む。
【0087】
端子I2(図13O)から、方法は、n×m行列を構成する1次元ベクトルの集合体を使用して相関スコア(信号信頼性の測度)を決定することを始めるブロック13140に進む。相関イバリュエータ210への入力データは、1つの構成イメージスニペットをそれぞれが表す、等しい長さの順序付けられたベクトルの一組である。この組は、ブロック13124において決定されたクロマトグラム、またはブロック13126において決定されたスペクトル、または共通の関心領域に属する、ブロック13123において決定された、シリアル化された(ピークなどの)2次元変動を含むことがある。相関イバリュエータ210の出力データは、これらのベクトルが、互いにどれだけよく相関するかを示すスコアである。この相関は、信号信頼性の評価基準と解釈される。方法は、ブロック13142で、構成イメージ1、2、3、...、nを表すベクトルを取り上げ、これらのベクトルを、すべて長さmの構成ベクトルa1、a2、a3、...、anとして表す。ブロック13144で、これらの構成ベクトルは、以下のとおり、nが、構成イメージの数であり、さらにmが、相関させられることが可能なデータ点の数である、n×m行列A=aijを形成する。
【0088】
【数9】
【0089】
行列Aは、相関イバリュエータ210への入力である。
【0090】
ブロック13146で、方法は、コンセンサスベクトルを決定することを始める。方法は、構成ベクトル異常値が除外されるべきかどうかを判定する試験が実行される判定ブロック13148に進む。判定ブロック13148における試験への答えが、「いいえ」である場合、方法は、別の継続端子(「端子I4」)に進む。判定ブロック13148における試験への答えが、「はい」である場合、方法は、方法が、中心傾向ベクトルに対して最小の相関係数を生成する構成ベクトルを見出すブロック13150に進む。方法は、別の継続端子(「端子I3」)に進む。
【0091】
端子I3(図13P)から、方法は、異常値であることを見出された構成ベクトルを、コンセンサスベクトルの決定に参加することから除外する。ブロック13152を参照されたい。代替として、中心傾向ベクトルと(最高のピアソンの相関係数をもって)最もよく相関するベクトルが、a1、a2、a3、...、anのなかから見出されることが可能である。このシナリオにおいて、最もよく相関するベクトルは、新たなコンセンサスベクトルである。
【0092】
次に、方法は、ブロック13154に続いている継続端子I4に進み、相関イバリュエータが、行列Aにおける構成ベクトルの組、a1、a2、a3、...、anのなかから中心傾向を適切に表すコンセンサスベクトルbを作成する。方法13000は、平均ベクトルが使用されるべきかどうかを判定する試験が実行されるブロック13156に進む。判定ブロック13156における試験への答えが、「いいえ」である場合、方法は、別の継続端子(「端子I5」)に進む。そうではなく、判定ブロック13156における試験への答えが、「はい」である場合、方法は、コンセンサスベクトルが以下のとおり計算されるブロック13158に進む。
【0093】
【数10】
【0094】
次に、方法は、別の継続端子(「端子I7」)に進む。
【0095】
端子I5(図13Q)から、方法13000は、平均ベクトルが使用されるべきかどうかを判定する試験が実行される判定ブロック13160に進む。判定ブロック13160における試験への答えが、「いいえ」である場合、方法は、別の継続端子(「端子I6」)に進む。そうではなく、判定ブロック13160における試験への答えが、「はい」である場合、方法は、コンセンサスベクトルが以下のとおり計算されるブロック13162に進む。
bi=median(aij)、ただし、j=1,...,n
【0096】
次に、方法は、別の継続端子(「端子I7」)に進む。
【0097】
端子I6(図13Q)から、方法13000は、相関を使用して、中心傾向ベクトルと(より高いピアソンの相関係数をもって)適切に相関するベクトルが、a1、a2、a3、...、anのなかから決定され、さらにそのベクトルをコンセンサスベクトルと定義するブロック13164に進む。行列におけるベクトルの組の中の輝度の差が、生物学的特徴を発見するために重要である。しかし、この主題の様々な実施形態において、表現の量の差が焦点になっているのではなく、代わりに、相関イバリュエータ210は、信号が、関心領域内で1つの構成イメージから別の構成イメージに相関するかどうかを判定する。
【0098】
同化プロセスによって、信号の大きさの一貫した差を考慮することなしに、関係する関心領域の間の信号が相関をもてるようになる。ブロック13166を参照されたい。次に、方法は、端子I7に進む。端子I7(図13R)から、方法は、式xj=cj+sjajなどのスケーリング変換または線形変換を使用して、構成ベクトルa1、a2、a3、...、anのそれぞれを、コンセンサスベクトルbに独立に同化させる。項xjは、第j番の構成ベクトルajの同化された形態である。ブロック13170を参照されたい。cjおよびsjは、コンセンサスベクトルbに構成ベクトルajを線形フィットさせて決定される。ブロック13172を参照されたい。ブロック13174で、コンセンサスベクトルbに対する各構成ベクトルajの最小二乗線形相関を使用して、パラメータcjおよびsjを、式b=cj+sjajから決定できる。方法13000は、構成イメージのデータが、適格であるかどうかを判定する試験が実行される判定ブロック13176に進む。適格なデータは、aij>0、bi>0、cj=0、およびsj>0である、線形関係によってモデル化されることが可能である。このモデルは、(ピークなどの)現れた変動が分離され、さらに背景が無視できるという前提に基づいて、構成ベクトルを同化させる。イメージスニペットが、大きく異なる背景を含む範囲内で、原点を通るように強制される線形回帰は、より大きい変動をもたらし、そのため、より低い相関スコアをもたらす可能性がある。
【0099】
判定ブロック13176における試験への答えが、「いいえ」である場合、方法は、別の継続端子(「端子I8」)に進む。そうではなく、判定ブロック13176における試験への答えが、「はい」である場合、方法は、別の継続端子(「端子I9」)に進む。
【0100】
端子I8(図13S)から、項cjは、被除数と除数の商である。ブロック13178を参照されたい。ブロック13180で、項cjの被除数が、以下のとおり計算される。
【0101】
【数11】
【0102】
ブロック13182で、項cjの除数が、以下のとおり計算される。
【0103】
【数12】
【0104】
ブロック13184で、項sjは、被除数と除数の商である。項sjの被除数は、以下のとおり計算される。
【0105】
【数13】
【0106】
ブロック13188で、項sjの除数が、以下のとおり計算される。
【0107】
【数14】
【0108】
ブロック13190で、変数iは、ベクトルにおける輝度信号(ピクセル)の順序付けを表すi=1...mの範囲にあり、さらに変数jは、構成基準を表すj=1...nの範囲にある。次に、方法は、別の継続端子(「端子I10」)に進む。
【0109】
端子I9(図13T)から、方法は、項cjが0に等しいブロック13192に進む。ブロック13194で、項sjが、以下のとおり計算される。
【0110】
【数15】
【0111】
方法は、別の継続端子(「端子I10」)に進み、さらに、得られた、同化された構成ベクトルの集合体x1、x2、x3、...、xnが、n×m行列X、すなわち、xij=cj+aijを構成するブロック13196にさらに進む。
【0112】
ブロック13198から、方法は、構成ベクトルx1、x2、x3、...、xnに適用されるべき重み付けベクトルを計算することを始める。次に、方法は、構成要素重み付き相関が使用されるべきかどうかを判定する試験が実行される判定ブロック13200に進む。判定ブロック13200における試験への答えが、「いいえ」である場合、方法は、別の継続端子(「端子I11」)に進む。そうではなく、判定ブロック13200における試験への答えが、「はい」である場合、方法は、別の継続端子(「端子I12」)に進む。
【0113】
端子I11(図13U)から、方法は、条件内相関に関して、重み付けが、すべての構成ベクトルに関して等しい(重み1)ブロック13202に進む。条件内スコア付けに関する重み付けベクトルは、次のとおり計算される。wj=1。次に、方法は、別の継続端子(「端子I13」)に進む。端子I12(図13U)から、方法は、構成要素重み付き相関に関して、重みが或る関数であり、さらに構成要素重み付きスコア付けに関して様々な重み付けベクトルが、可能であるブロック13206に進む。1つの典型的な機能は、コンセンサスベクトルからの差を最小限に抑えるために使用された同化の関数を含む。より高いスケーリングは、より低い重み付けにつながる。つまり、コンセンサスからの差を最小限に抑えるために要求される構成要素のスケーリングの量は、重みに反比例する可能性がある。代替として、重み付けは、所与の構成要素の重要度に基づくことが可能である。輝度(体積)によって重要度をモデル化できる。各構成要素jが、スカラー重みwjを受け取る。ただし、jはj=1からnまでであり、さらにnは、構成要素の数である。
【0114】
構成要素重み付きスコア付けに関する重み付けベクトルの3つの例を示す。第1の例では、ベクトルをスケーリングすることにより、対応する信号と雑音が等しい仕方でスケーリングされるモデルを与えることができる。スケーリングされたベクトルの重み付けは、以下のとおり、スケーリング値の逆数であることが可能である。
【0115】
【数16】
【0116】
第2の例では、0でない切片が、相当な背景信号が存在することを示すと仮定できる。この事例では、重み付けは、以下のとおりモデル化されることが可能である。
【0117】
【数17】
【0118】
第3の例では、重み付けのモデルは、スケーリングされていない(同化されていない)関心領域の積分された輝度に基づく。このモデルは、関心領域内で最大の輝度を有する構成要素が、最も重要であることを前提とする。
【0119】
【数18】
【0120】
ただし、i=1...mであるaijは、第j番の構成要素のベクトル化された輝度である。積分された輝度を、第1の例、または第2の例からの重みと組み合わせることによって、第3の例を以下のように拡張できる。
【0121】
【数19】
【0122】
次に、方法は、端子I13(図13U)に進み、さらに方法が、コンセンサスベクトルに、同化された構成ベクトルの集合体を相関させて、相関スコアR1、R2、R3、...、Rnを導き出すことを始めるブロック13208にさらに進む。ブロック13210で、(同化された構成ベクトルの集合体を表す)行列xとコンセンサスベクトルbが、対にされて、n×m点の一組(xij,bi)が形成される。ブロック13212で、最小二乗フィット法に従って、方法は、これらの点をb=c+sxにフィットさせ、これにより、相関係数、切片c、および傾きsがもたらされる。ブロック13214で、相関係数は、関心領域に関する変更されたピアソンの相関スコアR1であることが適しており、このスコアR1は、被除数と除数から計算された商R1(s>0)である。次に、方法は、別の継続端子(「端子I14」)に進む。
【0123】
端子I14(図13V)から、相関係数の被除数が、以下のとおり計算される。すなわち、
【0124】
【数20】
【0125】
ブロック13216を参照されたい。ブロック13218で、除数が、以下のとおり計算される。
【0126】
【数21】
【0127】
ブロック13220における制約が、以下のとおり与えられる。
R1(s≦0)=0
ブロック13222で、項tが、以下のとおり与えられる。
【0128】
【数22】
【0129】
ブロック13224で、方法は、被除数と除数の商である傾き相関係数sを計算する。ブロック13226で、傾きの被除数が、以下のとおり計算される。
【0130】
【数23】
【0131】
ブロック13228で、傾きの除数が、以下のとおり計算される。
【0132】
【数24】
【0133】
ブロック13230で、相関スコアR2が、以下のとおり計算される。すなわち、
R2(s>0)=exp(−|ln(s)|)
次に、方法は、別の継続端子(「端子I15」)に進む。
【0134】
端子I15(図13W)から、制約が、以下のとおり与えられる。
R2(s≦0)=0
方法13000は、方法が、被除数と除数の商である切片相関係数cを計算するブロック13234に進む。切片の被除数が、以下のとおり計算される。
【0135】
【数25】
【0136】
切片の除数は、ブロック13238で以下のとおり計算される。すなわち、
【0137】
【数26】
【0138】
ブロック13240で、相関スコアR3が、以下のとおり計算される。
【0139】
【数27】
【0140】
項σb2が、以下のとおり計算される。
【0141】
【数28】
【0142】
ブロック13244で、項
【0143】
【数29】
【0144】
が、以下のとおり計算される。
【0145】
【数30】
【0146】
次に、方法は、別の継続端子(「端子I16」)に進む。端子I16(図13X)から、以下のとおり、相関スコアR4が計算され、これにより、線形相関が存在する確率が決定される。
R4=1−Pc(R1,m)
【0147】
ブロック13246を参照されたい。ブロック13248で、項
Pc(R1,m)
が、所与の相関係数R1が、長さmのコンセンサスベクトルbを使用して偶然に生成されたという帰無仮説を試験する。つまり、方法13000は、線形相関が存在する確率(R4)を決定することができ、さらにこの確率を使用して、R1を変更できる。帰無仮説の確率Pc(R1,m)は、所与の相関係数R1が、長さmのベクトルbを使用して偶然に生成されたということである。この帰無仮説は、線形回帰に関するピアソンの相関係数R、および自由度の数値(f=m−2)が与えられ、行列Aまたはベクトルxにおける「スケーリングされた構成ベクトル」が、「繰り返されるコンセンサスベクトル」bまたはyと相関していないことを言明する。Pc(R1,m)は、無相関の輝度のmのランダムなサンプルの線形相関が、R1以上の相関係数をもたらす確率である。次に、方法は、方法が、3つすべてのタイプのベクトルの相関スコア、すなわち、シリアル化されたイメージスニペット、クロマトグラム、およびスペクトルを既に計算しているかどうかを判定する試験が実行される判定ブロック13249に進む。判定ブロック13249における試験への答えが、「はい」である場合、方法は、端子(「端子J」)に進む。そうではなく、判定ブロック13249における試験への答えが、「いいえ」である場合、方法は、端子Iに戻り、以上に示された処理ステップが繰り返されるブロック13248にループバックする。
【0148】
端子J(図13B)から、方法13000は、継続端子(「端子K」)と終了端子(「端子L」)の間に規定される方法ステップのセット13012に進む。方法ステップのセット13012は、関心領域の形状特性を計算する。端子K(図13X)から、方法は、合成スニペットおよびイメージスニペットから特定された関心領域の形状に関する形状特性スコア付けを実行するブロック13250に進む。次に、方法は、別の継続端子(「端子K1」)に進む。
【0149】
端子K1(図13Y)から、方法13000は、端子G、Hの間(ブロック13122)で示される、マスクされた2次元関心領域に関する形状特性を特定するブロック13252に進む。ブロック13254で、方法は、端子G、Hの間(ブロック13124)で特定されるクロマトグラムに関する形状特性を特定する。ブロック13256で、方法は、端子G、Hの間(ブロック13126)で特定される質量スペクトルに関する形状特性を特定する。次に、方法は、終了端子Lに進む。
【0150】
端子L(図13C)から、方法13000は、継続端子(「端子M」)と終了端子(「端子N」)の間で規定される方法ステップの一組13014に進む。方法ステップの組13014は、選択されたアルゴリズムに従ってスコアを組み合わせ、評価する。端子M(図13Y)から、方法13000は、様々な仕方でスコアを組み合わせて、関心領域を分類する新たなスコアを導き出す。ブロック13258を参照されたい。
【0151】
第1の例として、合成イメージからの形状特性を組み合わされることができる。任意の構成イメージセットから導き出された合成イメージ上の単一の関心領域から形状特性を導き出すことができる。この方法は、合成イメージを含むよく整列配置させられた構成要素を要求し、さらにこの方法には、マイクロ整列配置および領域再定義が役に立つ可能性がある。単一の関心領域からの様々な形状特性(信頼度、楕円同化など)が組み合わされて、新たな形状特性を作成できる。
【0152】
第2の例として、個々の構成要素からの形状特性を組み合わすことができる。1つのタイプの形状特性(信頼度、楕円同化など)を、或る特徴の範囲内の関心領域のような対応する関心領域から組み合わせることができる。この方法は、合成イメージを要求せず、したがって、マイクロ整列配置も要求しないが、この方法には、領域再定義が役立つ可能性がある。
【0153】
第3の例として、個別の構成要素内の形状特性を組み合わせることができる。多くのタイプの形状特性(信頼度、楕円同化など)を、新たな形状特性を作成するように単一の関心領域から組み合わせることができる。この新たな形状特性を、次に、所与の構成要素の一組からの対応する関心領域の同一の形状特性タイプと組み合わせてもよい。
【0154】
第4の例として、相関スコアを、組み合わせることができる。研究者は、個々の構成要素の組合せである最終スコアを求める可能性がある。そのようなスコアによって、研究者は、役に立つ方法で関心領域を格付けできる。1つのベクトルの組からの様々な相関スコアR1、R2、R3、...Rnが、1が最適な相関を示す、0から1までの範囲をとる確率として解釈され得る場合、これらのスコアを乗算によって組み合わせて、やはり0から1までの範囲をとる合成スコアを作成できる。各スコアRiには、そのスコアRiの寄与を強調する、または強調をやめるように個々に重み付けできる。Riに関する重み付けwiは、指数である。結果は、完全なスコアが1である、0から1までの範囲内のスコアである。
【0155】
【数31】
【0156】
w(i)は、第i番のスコアに関する重み付け係数である。w(i)=1などの等しい重み付けが、使用され得る。また、w(1)=w(4)、w(2)=w(3)、およびw(1)=2*w(2)などの他の重み付けも、有用である。1つの適切な重み付けは、次のとおりである。R=R12R21R31R42。
【0157】
第5の例として、異なる構成イメージからの形状特性スコアを組み合わせることができる。個々の形状スコアから特徴/合成スコアを作成するのに、以下の式が、注目される。すなわち、
【0158】
【数32】
【0159】
Iは、スコア付けされた関心領域の積分された輝度である。
【0160】
引継ぎを考慮すると、相関スコア、または相関スコアの組合せのいずれかが、構成要素の組、または1つのイメージから、関心領域全体(複合体、構成要素の組、個々の構成要素)に帰せられることが可能である。例えば、最大条件内相関スコアは、すべての構成イメージ上の関心領域を表すことも可能である。単一構成要素スコアは、単一の関心領域を参照し、さらに、合成イメージではなく、単一のイメージを主に参照する。
【0161】
形状特性スコアの引継ぎを考慮すると、形状特性は、単一のイメージスニペット上の単一の関心領域から導き出されるスコアである。この単一のイメージスニペットは、1つの構成要素(レプリケート)からであってもよく、あるいは複数の重ね合わされたイメージスニペット(複合体)からの合成イメージであることも可能である。構成イメージスニペットの集合体からの複数の形状特性を組み合わせて、これらの構成イメージのセット、およびこれらの構成イメージの複合体の関心領域に属する、うまく形作られたスコアを形成できる。
【0162】
相関スコアの引継ぎを考慮すると、或る関心領域、および条件のような複数の構成要素セットが存在することが与えられ、各構成要素セットから相関スコアを導き出すことができる。これらの相関スコアの1つが、関心領域を表すように選択される。この選択は、様々な方法(例えば、最良、最悪、中央値、算術平均、幾何平均、または輝度重み付き算術平均)に基づくことが可能である。いずれの方法が使用されるべきかの選択は、研究者の期待に依存する。
【0163】
構成要素(例えば、条件)のすべての組が、分析され、スコア付けされた後、最良のスコアを有する構成セットが、一般に、関心領域を表すように選択され(さらに、関心領域によって引き継がれ)る。このアプローチの理由は、重要で相関する信号を、その信号が1組の構成要素の中でしか現れない場合でさえ、認識することである。処置条件の違いに起因するピークの差が、一般に、実験の焦点である。一組の条件における最良スコアは、それらの条件のいくつかが低いスコアを有する場合でさえ、研究者には興味深いデータとなる場合がある。
【0164】
相関スコアと形状特性スコアに関する組合せの方法に関して、新たなスコアを形成するように相関スコアを他の幾何形状スコアと組み合わせることができる。複数の条件を含む関心領域によって引き継がれるスコアは、構成要素重み付きスコア、最良条件スコア、または最も強力な条件の条件スコアであることが可能である。
【0165】
【数33】
【0166】
およびiijが、条件jにおけるピクセルの輝度である、最高の値を有する条件に属するスコアである。
【0167】
次に、方法は、端子Aと端子Bの間で、具体的にはブロック13206において示される、すべての関心領域に関するスコアを既に計算しているかどうかを判定する試験が実行される判定ブロック13260に進む。判定ブロック13260における試験への答えが、「はい」である場合、方法は、ブロック13262に進む。そうではなく、判定ブロック13260における試験への答えが、「いいえ」である場合、方法は、端子Cに戻り、さらに以上に述べた処理ステップが繰り返されるブロック13258にループバックする。ブロック13262で、方法は、将来の評価を可能にするデータベースの中にスコアを格納する。次に、方法は、終了端子Nに進む。端子N(図13C)から、方法13000は、分類されたスコアによって明らかにされた生物学的候補が、将来の探究のために研究者に送られる、継続端子(「端子O」)と終了端子(「端子P」)の間に示された方法ステップの一組13016に進む。端子Pを超えて進んで、方法13000は、実行を終了する。
【0168】
図14A〜図14Sは、生物学的特徴を発見するように関心領域を処理するための他の実施形態を示す。図14A、図14Bは、検出された関心領域にスコアが付けられることを示す。1組のスニペット(関心領域)に属するスコアを生成するように同時実行ブランチを使用することを示す図14A、図14Bにおけるブロックが、図14C〜図14Eによってより詳細に示される。図14C〜図14Eによって示される同時実行の代替として、図14F、図14Gは、1組のスニペット(関心領域)に属するスコアを生成する直線実行ブランチを示す。図14H、図14Iは、N個のマスクされたイメージスニペットのP個の輝度値をシリアル化することに関連付け、P×N行列の中に入れるステップを示すことによって、図14C〜図14Gにおけるブロックをより詳細に示す。具体的には、入力値は、P個の輝度値をそれぞれが有する、N個の等しくマスクされたイメージの一組である。各2Dイメージは、1Dベクトルとなる。これらのベクトルは、各列がこれらのイメージの1つを表し、各行が同等の(comparable)ピクセルを表すP×N行列を構成する。出力値は、このP×N行列である。図14Jは、N個のマスクされた(2D)イメージスニペットのそれぞれから形状特性の一組を抽出することと結び付けられたステップを示すことによって、図14C〜図14Gにおけるブロックをより詳細に示す。具体的には、入力値は、N個の等しくマスクされたイメージスニペットである。方法は、各イメージスニペットからのG個の形状特性を特定する。出力値は、G個の値のN個の組である。
【0169】
図14Kは、関心領域を定義するマスキングプロセスを示す。異なるイメージからそれぞれが導き出された、これら3つの対応するスニペットから、共通のマスクが形成される。この決定は、これら3つのスニペットの複合体、および領域再定義である新たなピーク検出に基づくことがある。代替として、マスクは、これら3つのスニペット上の個々のピーク検出に基づくことが可能である。図14Lは、イメージ輝度を、アイソ曲線(iso−curve)(等高線)またはピクセル輝度によって表せること、およびこれらの輝度をマスクできることを示す。図14Mは、それぞれのマスクされた2Dイメージスニペットを使用して、特徴的なクロマトグラム、特徴的なスペクトル、およびピクセル輝度のシリアル化された集合体を生成できることを示す。図14Nは、平均m/zスペクトルが、マスクされた2Dイメージスニペットから導き出されるプロセスを示す。図14Oは、平均クロマトグラムが、マスクされた2Dイメージスニペットから導き出されるプロセスを示す。図14Pは、2Dイメージスニペットを、ピクセル輝度の1Dベクトルにシリアル化するシリアル化プロセスを示す。ピクセル輝度の数値は線形につなぎ合わせてあることもある。ピクセルの順序は、スニペットの間で一貫していなければならない。このベクトルは、同一の順序でシリアル化されている他のイメージスニペットと互いに関係付けられる。図14Q〜図14Sは、3つのイメージからのイメージスニペットが、どのように処理されて、それぞれ、相関イバリュエータへの適切な入力値である、異なる行列にされるかを示す。図14Qは、これら3つの列のそれぞれがベクトルである準備プロセスを示す。各ベクトルは、マスクされたイメージスニペットの平均質量スペクトルである。これら3つのベクトルは一緒になって、相関イバリュエータへの適切な入力である2D行列を構成する。図14Rは、これら3つの列のそれぞれがベクトルである準備プロセスを示す。各ベクトルは、異なるマスクされたイメージスニペットの平均クロマトグラムである。これら3つのベクトルは一緒になって、相関イバリュエータへの適切な入力である2D行列を構成する。図14Sは、これら3つの列のそれぞれがベクトルである準備プロセスを示す。各ベクトルは、異なるマスクされたイメージスニペットからのシリアル化されたピクセル輝度の例である。これら3つのベクトルは一緒になって、相関イバリュエータへの適切な入力である2D行列を構成する。
【0170】
実例的な実施形態が、示され、説明されてきたが、本発明の趣旨および範囲を逸脱することなく、これらの実施形態に様々な変更が行われ得ることが認められよう。
【0171】
以上の方法の実施に適した代表的なコンピューティング環境が、図15に示される。図15、および以下の説明は、開示される技術が実施されることが可能である典型的なコンピューティング環境の簡単な、一般的説明を与えることを意図している。必須ではないものの、開示される技術は、PC(パーソナルコンピューター)によって実行される、プログラムモジュールなどのコンピューター実行可能命令の一般的な表現において説明される。一般に、プログラムモジュールには、特定のタスクを実行する、または特定の抽象データ型を実装するルーチン、プログラム、オブジェクト、コンポーネント、データ構造などが含まれる。さらに、開示される技術は、ハンドヘルドデバイス、マルチプロセッサシステム、マイクロプロセッサベースの家庭用電子機器もしくはプログラマブル家庭用電子機器、ネットワークPC、ミニコンピューター、メインフレームコンピューターなどを含む、他のコンピューターシステム構成を使用して実施されてもよい。また、開示される技術は、通信ネットワークを介してリンクされたリモート処理デバイスによってタスクが実行される、分散コンピューティング環境において実施されてもよい。分散コンピューティング環境では、ローカルメモリー記憶デバイスとリモートメモリー記憶デバイスの両方の中にプログラムモジュールを配置できる。
【0172】
図15を参照すると、開示される技術を実施するための典型的なシステムは、1つまたは複数の処理装置1502、システムメモリー1504、およびシステムメモリー1504を含む様々なシステムコンポーネントを1つまたは複数の処理装置1502に結合するシステムバス1506を含む、典型的な従来のPC1500の形態の汎用コンピューティングデバイスを含む。システムバス1506は、様々なバスアーキテクチャのいずれかを使用する、メモリーバスまたはメモリーコントローラ、周辺バス、およびローカルバスを含む、いくつかのタイプのバス構造のいずれかであることが可能である。典型的なシステムメモリー1504は、ROM(読み取り専用メモリー)1508およびRAM(ランダムアクセスメモリー)1510を含む。PC1500内部の要素間で情報の転送を助ける基本ルーチンを含むBIOS(基本入出力システム)1512が、ROM1508の中に格納される。
【0173】
典型的なPC1500は、ハードディスクに対して読み取りまたは書き込みを行うためのハードディスクドライブ、リムーバブル磁気ディスクに対して読み取りまたは書き込みを行うための磁気ディスクドライブ、およびリムーバブル光ディスク(CD−ROMまたは他の光媒体などの)に対して読み取りまたは書き込みを行うための光ディスクドライブなどの、1つまたは複数の記憶デバイス1530をさらに含む。そのような記憶デバイスは、それぞれ、ハードディスクドライブインタフェース、磁気ディスクドライブインタフェース、および光ドライブインタフェースによってシステムバス1506に接続されることが可能である。これらのドライブ、および関連するコンピューター可読媒体は、コンピューター可読命令、データ構造、プログラムモジュール、およびその他のデータの不揮発性ストレージをPC1500に提供する。また、磁気カセット、フラッシュメモリーカード、デジタルビデオディスク、CD、DVD、RAM、ROMなどの、PCによってアクセスされることが可能なデータを格納することができる他のタイプのコンピューター可読媒体を、典型的な動作環境において使用できる。
【0174】
オペレーティングシステム、1つまたは複数のアプリケーションプログラム、他のプログラムモジュール、およびプログラムデータを含む、いくつかのプログラムモジュールを、記憶デバイス1530の中に格納することもある。ユーザは、キーボードや、マウスなどのポインティングデバイスなどの1つまたは複数の入力デバイス1540を介して、PC1500にコマンドおよび情報を入力することもある。その他の入力デバイスには、デジタルカメラ、マイクロホン、ジョイスティック、ゲームパッド、サテライトディッシュ、スキャナなどが含まれることがある。これら、およびその他の入力デバイスは、しばしば、システムバス1506に結合されたシリアルポートインタフェースを介して1つまたは複数の処理装置1502に接続されるが、パラレルポート、ゲームポート、またはUSB(ユニバーサルシリアルバス)などの他のインタフェースによって接続されてもよい。モニタ1546、または他のタイプのディスプレイデバイスも、ビデオアダプタなどのインタフェースを介してシステムバス1506に接続される。スピーカやプリンタ(図示せず)などの他の周辺出力デバイスを、含めてもよい。一部の例において、処理された構成イメージデータは、表示、または印刷、あるいはそれ以外の方法で提示される。一部の実施例において、中間結果が、表示されることも可能である。
【0175】
PC1500は、リモートコンピューター1560などの1つまたは複数のリモートコンピューターへの論理接続を使用するネットワーク化された環境において動作することもある。一部の例において、1つまたは複数のネットワーク接続または通信接続1550が含められる。リモートコンピューター1560は、別のPC、サーバ、ルータ、ネットワークPC、あるいはピアデバイスもしくは他の一般的なネットワークノードであることがあり、PC1500に関連して前述した要素の多くまたはすべてを通常含むが、メモリー記憶デバイス1562だけを図15に示している。パーソナルコンピューター1500および/またはリモートコンピューター1560は、ロジカル、LAN(ローカルエリアネットワーク)およびWAN(ワイドエリアネットワーク)に接続されることが可能である。そのようなネットワーキング環境は、オフィス、企業全体のコンピューターネットワーク、イントラネット、およびインターネットにおいて一般的である。
【0176】
LANネットワーキング環境において使用される場合、PC1500は、ネットワークインタフェースを介してLANに接続される。WANネットワーキング環境において使用される場合、PC1500は、通常、インターネットなどのWANを介して通信を確立するためのモデムまたは他の手段を含む。ネットワーク化された環境では、パーソナルコンピューター1500に関連して説明されるプログラムモジュール、またはそのようなモジュールのいくつかの部分を、リモートメモリー記憶デバイスの中、あるいはLAN上、またはWAN上の他の場所に格納できる。図示されるネットワーク接続は、典型例であり、コンピューター間で通信リンクを確立する他の手段が使用されてもよい。
【0177】
例示される実施形態を参照して我々の発明の原理を説明し、例示してきたが、例示される実施形態は、そのような原理を逸脱することなく、構成および詳細が変更され得ることが認識されよう。例えば、ソフトウェアで示される、例示される実施形態の要素が、ハードウェアで実施されてもよく、ハードウェアで示される、例示される実施形態の要素が、ソフトウェアで実施されてもよい。また、任意の実施例からの技術を、その他の実施例の任意の1つまたは複数において説明される技術と組み合わせることもできる。本発明の原理が適用されることが可能な多くの可能な実施形態に鑑みて、例示される実施形態は、本発明の実施例であり、本発明の範囲の限定として解釈されるべきではないことを認識されたい。例えば、本明細書で説明されるシステムおよびツールの様々なコンポーネントが、機能および使用において組み合わされてもよい。したがって、我々は、特許請求の範囲の範囲および趣旨に含まれるすべての主題を我々の発明として主張する。以上のセクションにおいて具体的に扱われる代替は、単に典型例であり、本明細書で説明される実施形態の可能なすべての代替を成すものではない。開示される発明の原理が適用されることが可能な多くの可能な実施形態に鑑みて、例示される実施形態は、本発明の好ましい実施例に過ぎず、本発明の範囲を限定するものと解釈されるべきではないことを認識されたい。むしろ、本発明の範囲は、添付の特許請求の範囲によって規定される。したがって、我々は、特許請求の範囲の範囲および趣旨に含まれるすべてを、我々の発明として主張する。
【0178】
(付録)
同化スケーリング係数を導き出すこと、特に想定および単純化に関して、輝度(イオンカウント)は、
y=c+sx
にデータをフィットできる溶離物質(eluting material)に関して線形であると仮定される。
【0179】
ピークは、分離され、ノイズの他には背景を全く有さないと想定される。つまり、与えられた保持時間および質量/電荷において、1つの種(イオン)だけが利用可能であると仮定される。この想定が有効でない範囲では、スコア付けされたピークはそれほど有用ではなく、さらにこの属性は、より弱い相関を有する劣悪なフィットに反映される。これらの想定のもと、以下のとおり、原点に切片を有しさらに正の傾きを有する線形関数へのフィットに線形相関を単純化できる。
y=sx、s>0
【0180】
一般的な誤差モデルに関して、この線形関係からの点(xi,yi)のずれ(discrepancies)を使用して誤差Eをモデル化できる。Eiは、関数fによって記述される、傾きsを与えられた、点iにおけるずれに基づく誤差の部分である。
Ei(s)=f(xi,yi)
【0181】
E(s)は、傾きsを与えられた、点(xi,yi)に対する線のフィットの誤差である。
【0182】
【数34】
【0183】
誤差解決に関して、誤差最小化が、以下によってモデル化される。
【0184】
【数35】
【0185】
スケーリング係数sは、以下のとおり解決される。
【0186】
【表1】
【0187】
1つの構成ベクトルの中で値をxiに設定でき、コンセンサスベクトルの値をyiに設定できる。sでスケーリングすることによってxをyに「同化する」ことが要求されることが与えられ、誤差はxiの範囲内にあるという想定を行うことができる。したがって、一般に、スケーリング係数は、以下のとおり選択される。
【0188】
【数36】
【0189】
特定の誤差モデルの精緻化(elaboration)を考慮すると、原点における切片および
【0190】
【数37】
【0191】
という誤差を仮定する線形同化に関してスケーリング係数を導き出せる。線形関数に関するフィットの誤差を、原点を通る正の傾きを使用して推定できる。この関数へのフィットの誤差を、点(xi,yi)の集合体より推定できる。x値およびy値のずれは、以下のように表せる。
【0192】
【数38】
【0193】
誤差を、以下のとおり求めることができる。
【0194】
【数39】
【0195】
傾き(s)に関する誤差(E)の変化は、以下のとおりである。
【0196】
【数40】
【0197】
【数41】
【0198】
を0に設定することにより、以下を求めることができる。
【0199】
【数42】
【技術分野】
【0001】
(関連出願の相互参照)
本出願は、参照により本明細書に組み込まれている、2008年10月23日に出願した米国特許仮出願第61/107,988号の利益を主張する。
【0002】
発明は関心領域処理に関する。
【背景技術】
【0003】
生物試料の分析は、そのような試料を含有する成分が複雑に混じり合っていることを考慮すると、困難である。ほとんどの分析機器は、1つの成分の影響を別の成分の影響と完全に分離することができず、しばしば、関連する信号が小さい、または濃度が低いことがある。このため、重なり合う、ノイズの多い信号が普通であり、相当調査して、有用な情報を明らかにすることが要求される。このような人間による調査は時間がかかり、主観的である可能性があり、さらに、重要な特徴が容易に軽視される、または見過ごされる可能性がある。一部の事例では、従来の分析技術を適用すると、誤ることもある。このため、改良された分析方法および分析装置が必要とされる。
【発明の概要】
【課題を解決するための手段】
【0004】
この要約は、以下の発明の詳細な説明の中で詳しく述べられている考え方を選出したものを簡単な形式で紹介するものである。この要約は、クレームされた発明の対象を述べることを意図したものでも、クレームされた発明の対象の範囲を決定することを補助するために使用されることを意図したものでもない。
【0005】
この主題の一つの形態は、関心領域プロセッサを含み、この関心領域プロセッサは、ある構成イメージの中のある関心領域を、その構成イメージの中のそれ以外の関心領域を整列させる必要なしに、その他の構成イメージの中の対応する関心領域と整列させる、マイクロアライナを備えている。さらに、関心領域プロセッサは、関心領域内で見られる変動の信頼性を表す相関スコアを生成し、関連のある潜在的な生物学的特徴を挙げるように構成された相関エバリュエータを含んでいる。
【0006】
この主題の別の形態は、生物学的特徴を発見するために関心領域を処理する方法を含むことであり、この方法は、ある構成イメージの関心領域を、いずれの構成イメージの中の関心領域とマクロ整列させる必要なしに、その他の構成イメージの中の対応する関心領域とマイクロアライニングすることを含む。この方法はさらに、対応する関心領域中のマスクされたピクセルに対する相関スコアを計算することを含む。ここで相関スコアは関心領域内の変動の信頼性を表す。
【0007】
この主題のさらに別の形態は、生物学的特徴を発見するように関心領域を処理する方法を実施するためのコンピューター実行可能命令を有するコンピューター可読媒体を含むことであり、このコンピューター可読媒体は、その構成イメージとその他の構成イメージの中の関心領域とマクロ整列させる必要なしに、ある構成イメージの中のある関心領域をその他の構成イメージの中のその他の関心領域とマイクロアライニングすることを含む。この方法はさらに、対応する関心領域中のマスクされたピクセルと他の関心領域中のマスクされたピクセルに対する相関スコアを計算することを含む。その相関スコアは関心領域内で見られる変動の信頼性を表す。
【0008】
本発明の以上、およびその他の目的、特徴、および利点は、添付の図を参照して進められる以下の詳細な説明から、より明白となろう。
【0009】
この主題の以上の態様、および付随する利点の多くは、添付の図面と併せて解釈される場合に、以下の詳細な説明を参照することによって、これらの態様および利点がよりよく理解されるにつれ、より容易に認められるようになろう。
【図面の簡単な説明】
【0010】
【図1】前処理をされた生体サンプルを研究者の生体研究の対象のリストへ提供する処理をする構成を示すブロック図である。
【図2】関心領域処理サブシステムの典型的な構成を示すブロック図である。
【図3−1】3A〜3Dをまとめて示す図であり、主題の一実施形態における、時間伸縮された構成イメージ、ならびに合成イメージを示す図である。
【図3−2】3Eおよび3Fをまとめて示す図であり、この主題の一実施形態における、合成イメージから検出された関心領域を示す図である。
【図4】4A〜4Dはそれぞれ、この主題の一実施形態における、典型的な拡大プロセスを示す図である。
【図5】5A〜5Dはそれぞれ、この主題の一実施形態における、典型的なマイクロ整列技術を示す図である。
【図6】6A〜6Eはそれぞれ、この主題の一実施形態における、関心領域の再定義を示す図である。
【図7】7A〜7Fはそれぞれ、この主題の一実施形態における、相互にマイクロ整列されたスニペットの部分を示す図である。
【図8】8A〜8Dはそれぞれ、この主題の一実施形態における、典型的なマスク、および様々なマスクされたスニペットを示す図である。
【図9】この主題の一実施形態における、イメージスニペットをシリアル化することによって導き出された構成ベクトルと、典型的なコンセンサスベクトルとを含む典型的なテーブルを示す図である。
【図10】この主題の一実施形態における、典型的なコンセンサスベクトル対典型的な構成ベクトルのグラフである。
【図11】この主題の一実施形態における、各構成ベクトルの個々の同化の後に図10のデータ点のグラフを示す図である。
【図12】この主題の一実施形態における、図11におけるデータへの線形回帰を示す図である。
【図13A】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図13B】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図13C】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図13D】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図13E】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図13F】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図13G】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図13H】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図13I1】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図13I2】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図13J】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図13K】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図13L】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図13M】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図13N−1】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図13N−2】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図13O】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図13P】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図13Q】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図13R】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図13S】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図13T】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図13U】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図13V】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図13W】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図13X】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図13Y】生物学的特徴を発見するように関心領域を処理するための典型的な方法を示すプロセス図である。
【図14A】生物学的特徴を発見するように関心領域を処理するための実施形態を示す図である。
【図14B】生物学的特徴を発見するように関心領域を処理するための実施形態を示す図である。
【図14C】生物学的特徴を発見するように関心領域を処理するための実施形態を示す図である。
【図14D】生物学的特徴を発見するように関心領域を処理するための実施形態を示す図である。
【図14E】生物学的特徴を発見するように関心領域を処理するための実施形態を示す図である。
【図14F】生物学的特徴を発見するように関心領域を処理するための実施形態を示す図である。
【図14G】生物学的特徴を発見するように関心領域を処理するための実施形態を示す図である。
【図14H】生物学的特徴を発見するように関心領域を処理するための実施形態を示す図である。
【図14I】生物学的特徴を発見するように関心領域を処理するための実施形態を示す図である。
【図14J】生物学的特徴を発見するように関心領域を処理するための実施形態を示す図である。
【図14K】生物学的特徴を発見するように関心領域を処理するための実施形態を示す図である。
【図14L】生物学的特徴を発見するように関心領域を処理するための実施形態を示す図である。
【図14M】生物学的特徴を発見するように関心領域を処理するための実施形態を示す図である。
【図14N】生物学的特徴を発見するように関心領域を処理するための実施形態を示す図である。
【図14O】生物学的特徴を発見するように関心領域を処理するための実施形態を示す図である。
【図14P】生物学的特徴を発見するように関心領域を処理するための実施形態を示す図である。
【図14Q】生物学的特徴を発見するように関心領域を処理するための実施形態を示す図である。
【図14R】生物学的特徴を発見するように関心領域を処理するための実施形態を示す図である。
【図14S】生物学的特徴を発見するように関心領域を処理するための実施形態を示す図である。
【図15】開示される方法の実施に適した代表的なハードウェアおよびコンピューティング環境を示す概略図である。
【図16A】周辺勾配スコア付けを示す図である。
【図16B】周辺勾配スコア付けを示す図である。
【図16C】周辺勾配スコア付けを示す図である。
【図16D】周辺勾配スコア付けを示す図である。
【図16E】周辺勾配スコア付けを示す図である。
【図16F】周辺勾配スコア付けを示す図である。
【図17】前処理スコア付けを示す図である。
【図18】接線体積比スコア付けを示す図である。
【発明を実施するための形態】
【0011】
本出願および特許請求の範囲において使用される、「或る」および「この」という単数形は、文脈によりそうでないことが明確に規定されない限り、複数形を含む。さらに、「含む」という用語は、「備える」を意味する。さらに、「結合された」という用語は、結合されたアイテムの間の中間要素の存在を排除しない。
【0012】
本明細書で説明されるシステム、装置、および方法は、いかなる観点においても全く限定されるように構成されるべきものではない。代わりに、本開示は、様々な開示される実施形態のすべての新奇で、自明でない特徴および態様の、単独の状態、および互いとの様々な組合せの状態、および部分的組合せの状態を対象とする。開示されるシステム、方法、および装置は、これらのシステム、方法、および装置のいずれの特定の態様もしくは特徴、またはいずれの特定の組合せにも限定されず、また開示されるシステム、方法、および装置が、いずれの一つ以上の特定の利点が存在すること、または問題が解決されることを要求することもない。動作理論は、説明を円滑にすべきものであるが、開示されるシステム、方法、および装置は、そのような動作理論に限定されない。
【0013】
開示される方法のうちのいくつかの方法の動作は、都合よく説明するためにある特定の順序で説明されるものの、この説明のやり方は、以下に示される特定の言い回しによって特定の順序付けが要求されない限り、再整理を包むものと理解されたい。例えば、順次に説明される動作は、一部の事例において、並べ替えられること、または同時に実行されることが可能である。さらに、簡潔にするため、開示されるシステム、方法、および装置が、他のシステム、方法、および装置と併せて使用されることが可能であるような様々な仕方を、添付の図は示していない場合がある。さらに、この説明は開示される方法を説明するのに、「もたらす」および「提供する」のような語を使用することがある。これらの語は、実行される実際の動作を高いレベルに抽象化したものである。これらの用語に対応する実際の動作は、特定の実施形態に依存して異なり、当業者によって容易に識別可能である。
【0014】
以下の説明を簡潔にするため、一部の数学的評価技術は、複数ステップの計算として示される。他の例では、場合によって、1つまたは複数のステップにおいてこのような解析が行われる。このような数学的技術は例であって、開示される例にさらなる技術および変形を使用することも可能であり、一部の事例では、より単純な、またはより迅速な計算をもたらすことが可能である。
【0015】
質量分析を、液体クロマトグラフィ、ゲル電気泳動、ガスクロマトグラフィ、およびイオン拡散などの他の分離技術と組み合わせて行うことが可能である。このような技術の組合せによって得られたデータを、n次元データセットとして表すことができる。例えば、クロマトグラフ保持時間および質量スペクトルの質量対電荷比を、第1の軸および第2の軸の座標として使用することができる。これらの座標に関する信号強度を、データ値の2次元アレイとして表すことができ、さらにそのようなデータをイメージまたはイメージデータと呼ぶことができる。
【0016】
質量分析および液体クロマトグラフィは、生体サンプルの評価に適用できる2つの重要な分離技術であり、さらにLC/MSデータセット(本明細書でイメージまたはイメージデータと呼ばれる)を以下の説明において使用するが、他の形式のデータを使用することも可能である。通常の生物試料は、タンパク質、炭水化物、脂質、および代謝産物の混合を含むが、その他の化学試料または生物試料を同様に調べることもでき、さらに開示される方法および装置は、非生物試料にも適用できる。
【0017】
開示される方法および装置のいくつかの例は薬学研究に属する。薬学医療(pharmaceutical medical)研究は、病状または医薬を使用した治療に対する反応などの生理学的状態の指標である生化学物質を特定することを対象とすることがある。そのような化学物質の1つまたは複数の物質を、生体指標と呼ぶ。生体指標は、病状または他の生理学的状態を診断するのに使用できる。生体指標は、研究室において臨床エンドポイントの代わりに使用でき、そのような生体指標はサロゲートエンドポイントと呼ばれる。サロゲートエンドポイントを、人間に対しまたは動物に対してさえ使用することなしに、医薬品の開発に使用することができる。薬品開発は、試験管の中でサロゲートエンドポイントの試験を行うことから始めることができる。
【0018】
一般的な順序として、試料に関係する化学的混合物を液体クロマトグラフィ機器/質量分析機器の中に導入できるように、生検標本、血液、唾液、羊水などの生体試料を処理する。次に、得られたデータ(保持時間およびm/z比の関数としての信号強度)から、この複雑な混合物中の生化学物質が同定される。この公開されている方法および装置を用いると、データの一部分を選択することによって、生物学的に、より関係のあるデータを同定することができる。具体的には、これらの方法および装置を用いると、関心対象の信号を汚染する可能性があるノイズまたは他の余計な信号から関心の対象となっている部分を分離、または抽出することによって、LC/MSデータから1つまたは複数の知りたい化学物質のSN比の向上した信号を同定することができる。1つまたは複数の成分(moieties)に関連する信号部分を除去、または部分的に除去し、詳細に信号特徴を調べることができる。例えば、ある特定の成分に関連するピークを、その他のピークがより明確にされ得るように除去することができる。
【0019】
公開されている通り分析データを解析することにより、複雑に混じり合っている化学物質をより良く分離および同定することができる。研究者は、健康な対象と疾患のある対象、および/または治療を受けていない対象と治療を受けている対象に関して、この解析プロセスを繰り返すことができる。このようにして同定された、健康な対象と疾患のある対象または治療を受けている対象と治療を受けている対象の間の化学物質成分の違いに基づいて、生体指標を定義することができる。この生体指標を、臨床エンドポイントの代わりに使用するサロゲートエンドポイントとする場合もある。そのような生体指標を、薬品開発において診断指標および治療指標に使用できる。
【0020】
代表的な実施形態として、本明細書において、LC(液体クロマトグラフィ)およびMS(質量分析)に基づいた画像について述べる。通常、信号強度はLC保持時間およびMS質量対電荷比(m/z)の関数として記録され、この記録された信号強度をイメージデータアレイとして格納、または処理することができる。本明細書における便宜上、通常、保持時間を水平線(x軸)にとり、m/zを垂直線(y軸)にとる。他の例では、LC保持時間またはm/z比の代わりに、または加えて、他の形式のデータを使用する。例えば、CG(ガスクロマトグラフィ)、イオン分光法、ゲル電気泳動、イオン拡散、または質量分析飛行時間などのデータを使用できる。
【0021】
以下の例において、生体サンプルの評価に関連する解析結果が、レプリケートと呼ばれるデジタル画像としてキャプチャされる。強度変動は、レプリケート上に散乱されている。前述したとおり、従来の評価技術ではレプリケート上の様々な強度の変動の関係を同定することができない。いわゆる「時間伸縮法」を使用して、これらの強度の変動を調整することで、ノイズである変動を同定し、ノイズでない強度の変動を明らかにすることは可能であるが、一部の強度の変動を整列させると他の強度の変動の不整が生じ、この不整の生じた変動が重要な特徴を表す変動である場合もある。
【0022】
図1は、生体サンプルを処理して生物学的特徴を検出するためのシステムを示す。このシステム100では1つまたは複数の生体サンプル102を入手する。各生体サンプル102は、通常、同一または同様または異なる処置条件104の処置を受ける。システム100は、この処置に基づいて生体サンプル106を準備し、そのように準備された生体サンプル106は、様々な液体クロマトグラフィおよび質量分析処理を利用したLC/MS機器108によってさらに処理される。この処理の結果は1つまたは複数のLC/MSイメージ、レプリケート、または構成イメージの形式で得られる。これら結果は、専用プロセッサなどの1つまたは複数のハードウェア処理デバイスとして、および/または汎用コンピューターなどの1つまたは複数のコンピューティングデバイス上で実行されるソフトウェアとして提供される関心領域プロセッサ110に送られ、さらに処理される。関心領域の形状および相互関係に基づく様々なスコアにより、システム100が、LC/MS処理機器108によって前処理された生体サンプル106から抽出された生物学的特徴を分類し、さらなる調査のために1名または複数名の研究者に送られる、または提示されることが可能な生物学的候補リスト112を提供できるようになる。
【0023】
図2に関心領域プロセッサ110をより詳細に示す。関心領域プロセッサ110はデータセレクタ202を含む。データセレクタ202は、実験の定義、1つまたは複数の実験条件とこれらのイメージとの関係、または生物学的変異とこれらのイメージとの関係などに基づいて、イメージの集合体を選択する。イメージの集合体中の各イメージをLC/MS(液体クロマトグラフィ/質量分析)イメージまたはレプリケートまたは構成イメージと呼ぶことができる。構成イメージの集合体はデータセレクタによって定義される様々な関心領域を含む。イメージデータベースからこの集合体を抽出することができ、あるいは適切なイメージが生成されるように、データセレクタをLC/MS機器または他の機器(試料準備機器を含む)に結合することができる。
【0024】
各関心領域を様々な方法で定義することは可能であるが、すべての方法は、関心領域を定義するために適切な強度の変動を使用する。合成イメージ上のピークの検出は、関心領域を定義するために使用できる1つの適切な強度の変動であり、このような定義(境界座標、区域など)は、構成イメージの集合体の中の関心領域を定義するのに使用され、それぞれのイメージは対応する関心領域を含む。これらの構成イメージを、合成イメージを形成する、構成イメージの平均化または最大投射(maximal projection)などの適切な技術によって、合成イメージを生成するために使用することができる。(最大投射における、各x、y座標の組での構成イメージのいずれかに関連する最大値が、合成イメージの強度として選択される。)合成イメージ上のスポットなどの変動によって特徴境界が決定する。(本明細書で使用されるスポットとは、構成イメージの中で接触している区域を成す強度のピークである。)特徴的な境界、およびこれらの特徴的な境界から生じるマスクは他の構成イメージ上の対応する関心領域を同定するのに使用される。異なる構成イメージからの対応するピークは、通常、重なり合うか、または合成イメージ上で非常に近接している。
【0025】
関心領域プロセッサ110はマイクロアライナ204を含む。マイクロアライナ204は、液体クロマトグラフィプロセスでの不確実な、または不十分な補正を補うために保持時間に沿って整列配置させる。一実施形態において、マイクロアライナ204は、ある関心領域のピクセルおよびそれに対応する関心領域を保持時間に沿って整列配列する。構成イメージの他の部分および構成イメージの他の関心領域は、考慮されず、関心領域のこれらの部分が同一の保持時間を有する場合でさえ影響を受けない。1回に1つだけの関心領域に、このように的を絞ることにより、従来の時間伸縮法の場合には可能でない整列配置が可能になる。
【0026】
マイクロアライナ204は構成イメージの中の関心領域を整列配置するが、その構成イメージの境界はあらかじめ検出されている関心領域から得られている。検出は合成イメージを使用して行うことができる。構成イメージにおける関心領域のマイクロ整列配置は、スコア付けに役立てることができ、これらのスコアは、科学的発見を助ける、生物学的特徴またはそれらの欠如などの手がかりを明らかにする。スコア付けは、構成イメージが既に整列配置している場合、マイクロ整列配置なしに進めることができる。一部の事例においては、関心領域検出器206などを用いてマイクロ整列配置の後に関心領域の境界を再定義することが、関心領域の近傍におけるノイズを除去または最小限に抑えるのに有効であることがある。
【0027】
マイクロアライナ204は、合成イメージが存在しない場合であっても関心領域の整列配置を改善することが可能である。この事例では、様々な構成イメージ上の関心領域は、これらの構成イメージ上で互いに対応する場合同定される。次に、マイクロアライナ204は対応する関心領域の一組を整列配置させる。マイクロ整列配置における合成イメージの1つの用法は、複数の構成イメージからの関心領域を関連付けることである。対応する関心領域の複数の組を合成イメージなしに同定できる場合、対応する関心領域のそれらの組をマイクロ整列配置できる。
【0028】
関心領域プロセッサ110は関心領域検出器206を含む。マイクロ整列配置が実行された場合、関心領域検出器206は実行前の関心領域の検出を修正することができる。実行前の関心領域は、できの悪い整列配置が行われた構成イメージからなる合成イメージから検出された可能性がある。実行前の関心領域の境界が構成イメージの中の関心領域を見出すのに使用される場合、これらの関心領域が関心対象ではないピクセルを含んでいる場合がある。このようなピクセルはノイズであり、周囲のバックグラウンドおよび近傍の低質部分など、関心対象のピクセルを含む信号と区別すべき部分である。合成スニペット(関心領域などの合成イメージの一部分)を作成することによって、実行前の関心領域を、関心対象のピクセルをより多く、ノイズなどの関心対象でないピクセルをより少なく含むように再定義できる。ノイズが少なければ、信号はよりよく同定されるようになり、科学的発見につながる生物学的手がかりを明らかにするためのよりよいスコア付けができるようになる。
【0029】
関心領域プロセッサ110はデータエクストラクタ208を含む。合成スニペットにおいて実行前の関心領域が再定義され、その中の関心対象のピクセルの位置を記述するために、2次元マスクが作成される。この2次元マスクは対応する関心対象(イメージスニペット)を得るのに使用され、それぞれの関心対象は構成イメージの関心領域に対応している。マイクロ整列配置が実行されている場合、マイクロ整列配置がすでになされた構成イメージを使用することが、対応する関心領域を得るために好ましい。これらマスクされたイメージスニペットは、スコア付けのために最終的に使用される2次元関心領域を構成する。これらマスクされたイメージスニペットから、特徴的なクロマトグラフおよび特徴的な質量スペクトルが得られる。また、各2次元イメージスニペットのシリアル化されたバージョンが作成される。
【0030】
関心領域プロセッサ110は、相関エバリュエータ210を含む。相関エバリュエータ210は、質量/電荷スペクトル、液体クロマトグラフィクロマトグラフ、またはシリアル化されたイメージスニペットなどの、マスクされたイメージスニペットの中の対応する関心領域を比較して、相関スコアを算出する。関心領域の相互関係をスコア付けする際、相関イバリュエータ210は1つまたは複数のマイクロ整列配置がなされたイメージスニペットの中の対応する関心領域を選択する。正確には、相関スコアは、単一の処置条件および/または生物学的変種に属するレプリケートである構成イメージの集合体から算出される。このような相関スコアはピークなどの変動の信頼度を示す。大きな変動が予期される状況において、低い相関スコアは、重要な生物学的事象を示す可能性がある。複数の処置条件および/または生物学的変種が関与している場合、相関スコアを1つまたは複数の処置条件の特定の一組から導き出すことができ、あるいはそれぞれのレプリケートまたは処置条件にそれぞれ異なる重みを付けたスコア付けを行うことができる。これらのオプションから、低いスコアが低い再現性に起因し、重要な生物学的変異に起因するのではないことが明らかである。
【0031】
対応する関心領域を定義する信号をそれぞれが含む、統計的に十分な数の構成イメージが存在する状況において、相関イバリュエータ210は条件内相関スコア付けを用い、選択された構成イメージの中の各関心領域(ピークまたは特徴などの変動)に均等に重みを付ける。データセレクタ202は、単一の、処置条件または生物学的変異を含むように構成イメージ選択を制限することがある。選択された構成イメージのうちの、1つの構成イメージの中の関心領域の中に変動が存在し、他の構成イメージの関心領域の中には存在しない場合、相関イバリュエータ210はその変動は信頼できないとみなし低い相関スコアが予期されることがある。
【0032】
スコアが複数の生物学的変異および/または複数の実験条件から導き出される状況では相関イバリュエータ210は構成要素で重みを付ける相関スコア付けを使用する。さらに、そのような構成要素で重みを付ける相関スコア付けは、前述したような条件内相関スコア付けを可能にするために、単一の処置条件または生物学的変異に対して存在する構成イメージが非常に少ない状況に適している。したがって、複数の処置条件および生物学的変異からのイメージが使用される。構成要素重み付き相関スコア付けは、対応する関心領域の一組からの各関心領域(ピークなどの変動)の関連性を別々に考慮する。一つの変動内で、構成要素重み付き相関スコア付けは、関心領域内で見出された特性に基づき各構成イメージの関心領域に重み付けを行う。重み付けは、構成イメージ上の関心領域から導き出される他のスコアに基づくことも可能である。例えば、相関イバリュエータ210は、構成イメージの中の関心領域内の(ピーク体積、ピーク高などの)強度を使用できる。さらなる例として、信号がない場合、相関イバリュエータ210は、欠如した信号に関する重みは0であることを決定する。
【0033】
関心領域プロセッサ110は、形状スコアラ212を含む。形状スコアラ212は関心領域での形状特性に関する形状スコアを計算する。形状スコアは、保持時間対称性、ピーク頂点からの保持時間単調性、面積、体積、最大高、標準偏差、面積対称性比、質量/電荷対称性、ピーク頂点からの質量/電荷単調性、前処理、周辺勾配、および接線体積比などのあらゆる形状に及ぶ。形状スコアは、単一のイメージに対して計算されるが、イメージは、個別の構成イメージまたは他のイメージの合成であっても良い。形状スコアは、関心領域に含まれる信号が科学的発見をさらに発展させるかどうかを研究者に示す。様々な関心領域における信号変動は、(グレースケールスポットなどの)2次元オブジェクトとして現れるため、これらの変動をその形状によって記述できる。有用な関心領域は、楕円形の区域、対照的な強度分布、領域重心からの強度の単調な減少などの一般的な形状特性を含む傾向がある。これらおよびその他の形状特性を使用すると、単一の構成イメージからの関心領域、または複数の構成イメージからの関心領域の集合体を分類できる。
【0034】
前述したとおり、保持時間対称性、ピーク頂点からの保持時間単調性、面積、体積、最大値、標準偏差、面積対称性比、質量/電荷対称性、ピーク頂点からの質量/電荷単調性、立体感、周辺勾配、および接線体積比などの特徴に基づいてイメージにスコアを割り当てる幾何学的な方法が多数存在する。そのようなスコア付けのいくつかの例が、以下に説明される。
【0035】
周辺勾配スコア付けを、代表的なLC/MSスポット、特徴、またはピーク1600を表す図16A〜図16Fに参照として示す。ピクセル輝度をグレースケール符号化する。図16Bに示すように、スポット1600の外側ピクセル1602は1ピクセル侵食操作によって除去される。外側ピクセル1602を図16Cに示す。外周部ピクセル1602の平均輝度は、スポット1600の外周部輝度として定義される。内周部ピクセル1604が、図16D〜図16Eに示されるとおり、さらなる1ピクセル侵食操作によって除去される。内周部ピクセル1604の平均輝度は、スポット1600の内周部輝度として定義される。スポット1602の周辺勾配は外周部輝度に対する内周部輝度の比として定義される。信頼できるスポットは、約0.8、1.0、1.5、2.0またはそれより大きい勾配を超える周辺勾配を有する。外周部ピクセル1602および内周部ピクセル1604除去後の侵食操作されたスポット1606を図16Fに示す。
【0036】
立体感スコア付けは、平面オブジェクトを囲み、さらに凸状の反りだけを有する(すなわち、変曲がない)最小の2次元形状の内周部として定義された凸状の外殻に基づく。凸状の外殻を、伸ばした輪ゴムでオブジェクトの周囲をとめたといった形状として視覚化できる。凸状の外殻との類比により、凸状のライニングをオブジェクトに完全に囲まれた最も大きい凸形状の輪郭として定義することができる。凸状の外殻および凸状のライニングの、くぼみを有する形状1702、および突起を有する形状1712のものを図17に示す。形状1702は、凸状の外殻1704および凸状のライニング1706を有する。形状1712は、凸状の外殻1714および凸状のライニング1716を有する。これらの定義に基づき、立体感を2つの方法で定義することができる。外殻立体感はオブジェクトの中にも入っている凸状の外郭の中のピクセルの数の割合である。ライニング立体感は凸状のライニングの中にも入っているオブジェクトの中のピクセルの割合として定義される。外殻立体感は、くぼみによってよりも突起によってより大きく影響され、ライニング立体感は、突起によってよりもくぼみによってより大きく影響される。立体感スコアの範囲は0から1まで取ることができる。1に近い立体感スコアはより信頼できるスポットを示す。スコアは0.5から1.0まで、0.6から1.0まで、または0.8から1.0までの範囲をとることが好ましい。
【0037】
図18は、接線体積比に基づくスコア付けを示す。一例であるピーク曲線1800を参照すると、線分1804が、ピーク頂点1802からピーク終点1806まで延びている。線分1804およびピーク曲線1802は、凹状の下方区域1810(ピーク曲線1804とピーク曲線1802の間における、線分1804より上の区域)、および凹状の上方区域1812(ピーク曲線1804とピーク曲線1802の間における、線分1804より下の区域)を決定する。接線体積比は凹状の下方体積に対する凹状の上方体積の比として定義される。接線体積比は、0から無限大までの範囲をとることが可能であるが、約0.5、0.75、1.0、2.0、3.0、5.0、および10より大きいスコアが好ましく、しかしその他の範囲をとることもできる。少なくとも約3.0の接線体積比が好ましい例もある。
【0038】
関心領域プロセッサ110はスコアコンバイナ214を含む。関心対象の生物学的特徴を明らかにし関心対象でない生物学的特徴を消去するように、スコアクラシファイア216において関心領域を分類する新たなスコアを導き出すために、スコアを単独で使用しても多くの適切な仕方で組み合わせてもよい。分類することによって関心領域を格付けしフィルタリングできるようになる。例えば、最高位に格付けされた関心領域以外はすべて消去することを望む科学者がいるかもしれない。コンピューター自動化によって、科学者との意思疎通なしに、様々なスコアによって定量化されたいくつかの標準を満たす関心領域を明らかにすることを実行できる。これらのスコアは、少なくとも2つのタイプ、すなわち、形状特性スコアおよび相関スコアから選択される。
【0039】
図3A〜図3Dは、マイクロ整列配置を行う前の構成イメージ300a、構成イメージ300b、および構成イメージ300cの従来の時間伸縮を示し、これらから合成イメージ300dが得られる。構成イメージのそれぞれは、ピークとして現れる4つの変動を示す。合成イメージ300dは、これらの変動のうち1つが整列配置しているが残りの変動は不整配置であることを示す。この主題の様々な実施形態において、マイクロ整列配置は、1回に1つの関心領域を整列配置させ構成イメージにおける残りの関心領域は考慮しない。様々な変動が、地形図の場合と同様に等強度線を表す等高線として現れることに留意されたい。図3E〜図3Fは関心領域の検出を示す。関心領域の一組は、変動300eの境界を同定することによって合成イメージの中で見出される。これらの変動を除去すると、関心領域300fの組によって示されるとおり長方形の境界300fが残る。望ましくないノイズである可能性がある、重なり合う変動(等高線の干渉)に注目されたい。
【0040】
図4A〜図4Dは、変動をよりよくマイクロ整列配置させる変動の境界の時間的拡大を示す。合成イメージ400aの中の変動の境界は、保持時間における逆方向の拡大および保持時間における順方向の拡大を示す矢印を有する長方形として示される。同様に、合成イメージ400aの中の変動に対応する構成イメージ400bの中の変動の境界が拡大される。さらに、合成イメージ400aの中の変動に対応する構成イメージ400cの中の変動の境界が同様に拡大される。さらに、合成イメージ400aの中の変動に対応する構成イメージ400dの中の変動の境界が拡大される。一実施形態において、1保持時間幅分早く、1保持時間幅分遅く拡大され、したがって、関心領域は現時点で保持時間次元において3倍長くなるが、より小さく拡大、またはより大きく拡大して使用することもできる。
【0041】
図5A〜図5Dは、マイクロ整列配置ウインドウ500aに基づく様々な関心領域500b、500c、および500dのマイクロ整列配置を示す。図2におけるマイクロアライナ204に関連する説明を参照されたい。図5A〜図5Dに示すように、マイクロ整列配置は、様々な構成イメージにおける他の関心領域をマイクロ整列配置させない。関心領域500b、500c、および500dは、保持時間次元において移動されており、すべての関心領域500b、500c、および500dが現時点で互いに整列配置されて見える。構成イメージの他の部分は整列配置していない。
【0042】
図6Aは、関心領域500b、500c、および500dを多重化して形成した合成イメージ600aをマイクロ整列配置した変動を示す。図6Bは、マイクロ整列配置した変動を、余分な背景を消去する境界600bとよりよくあわせるための、合成イメージ信号変動の修正された領域定義を示す。境界600bを使用して、図6C〜図6Eに示されるとおり、さらに図2に示される関心領域検出器206を参照して説明されるとおり、様々な構成イメージにおける境界600bによって規定された境界に基づいて、関心領域(イメージスニペット)600c、600d、600eは割り当てられる。イメージスニペット600c、600d、600eにおける、これらの新たにマイクロ整列配置した、対応する領域は、マイクロ整列配置の前と比べて比較分析によりよく適している。合成イメージおよび合成イメージを構成するイメージのその他の関心領域は、すべての関心領域のマイクロ整列配置が実行されるように同様のプロセスを経る。多くの事例において、領域再定義を行うと、より小さい領域に、信号がより多く、ノイズがより少なく含まれるようになり、同様に干渉する信号がより少なく含まれるようになる。
【0043】
図7A、図7C、および図7Dは、余計な背景区域を除くように関心領域が再定義されている、マイクロ整列配置したイメージスニペット700a、700b、および700cを示す。図7B、図7D、および図7Fは、関心対象の生物学的特徴を分類するための相関スコアを生成した後の相関分析に適したピクセルを明確にするために、マイクロ整列させられたイメージスニペット700a、700b、および700cの上に置かれた、重ね合わされたピクセルマップ700d、700e、および700fを示す。位置(1、4、41、および44)におけるピクセルは、マスクされた関心領域の外に存在するので考慮されない。従来の分析とは異なり、この主題の様々な実施形態において、関心領域を領域的に再定義して、形状特性のよりよいスコアをもたらすことに留意されたい。さらに、1つの構成イメージからのピクセルが、別の構成イメージの同一の位置におけるピクセルと比較され得るため、このようなピクセルごとの比較を活用して、関心対象の生物学的特徴を分類するための相関スコアがよりうまく生成されることが可能である。
【0044】
図8Aは、いくつかの行といくつかの列を含む2次元マスク800aを示す。各行と各列の交点を項Uijとする。ここでi、jは、行位置および列位置をそれぞれ特定する正の整数である。このような命名法をマスクにおけるすべてのピクセルに適用できる。図8Bは、マスク800aによって明らかにされる様々な輝度値を示す、マスクされたスニペット800bを示す。図8Cは、マスク800aによって明らかにされる様々な輝度値をやはり示す、別のマスクされたスニペット800cを同様に示す。同様に、図8Dは、マスク800aによって明らかにされる様々な輝度値をさらに示す、さらなるマスクされたスニペット800dを示す。
【0045】
図9は、行および列に対応するデータを含むテーブル900を示す。第1の列は、マスク800aによって確立されたピクセルラベルを含み、マスク化された2次元イメージスニペット800b、800c、および800dをシリアル化するのに使用される。第2、第3、および第4の列は構成ベクトルを表し、さらにマスクされたスニペット800b、800c、および800dから得られ、テーブル900の第1の列によって決定される順序でシリアル化されたピクセル輝度値を含む。第5の列は、「コンセンサス」と名付けられ、先行する3つの列からのデータから計算されたコンセンサスベクトルデータを含む。一実施形態において、コンセンサスベクトルデータは、先行する3つの列の算術平均である。
【0046】
図10は、テーブル900のデータ点からなるグラフ1000を示す。具体的には、コンセンサスベクトル(テーブル900の第5の列に示される値)が、各構成ベクトル(値が、テーブル900の第2の列、第3の列、および第4の列に示される)と対にされる。相関イバリュエータ210が、ベクトル同化のために後に使用される、プロットされた線のそれぞれの傾きおよび切片(intercepts)を算出する。グラフ1000は、すべての構成値に関する応答値としてコンセンサス値をプロットする。これらの関係から同化パラメータを評価できる。原点にある切片との線形関係が存在する場合、与えられた構成ベクトルに関する同化パラメータは、コンセンサスベクトルの値に合わせられた線の傾きである。
【0047】
図11は、図10に示されるデータから導き出された別のグラフ1100を示す。構成ベクトルの(テーブル900の第2の列、第3の列、および第4の列に示される)値は、それぞれの線形フィットから求めた傾きを掛けて修正されている。つまり、同化は、各構成ベクトルに、コンセンサスベクトル対それぞれの構成ベクトルの傾きを掛けることによって行われている。同化の後、コンセンサスベクトルに対する各構成ベクトルの線形フィットの傾きは、1により近い。
【0048】
図12は、データが、図11に示されるグラフ1100にグラフ化されているデータと同一のデータを用いたグラフ1200である。グラフ1200は、これら3つの構成ベクトルの区別をしていない。コンセンサスベクトルからの輝度と、同化されたすべての構成ベクトルの輝度との間の関係から、モデルがたてられる。つまり、イメージスニペットの間の区別は取り除かれており、最もよくフィットしている線がプロットされている。相関スコアはグラフ1200の中の点の或る線に対するフィッティングに基づく。例えば、線形フィットへの最小二乗回帰の相関スコアが、データが互いにどれだけよく相関するかを示す。
【0049】
図13A〜図13Yは、生物学的特徴を発見するために関心領域を処理する方法13000を示す。方法13000は、開始ブロックから方法ステップの一組13002に進む。方法ステップの一組13002は継続端子(「端子A」)と終了端子(「端子B」)の間と定義される。方法ステップの一組13002はデータ選択プロセスの実行を表す。ここで、データは前処理された生体サンプルから抽出される。端子A(図13D)から、方法13000は、ブロック13018に進んで、LC/MSイメージ(構成イメージ)の一組を生成するLC/MS処理を実行する。ブロック13020で、オプションとして、時間伸縮アルゴリズムを実行して構成イメージのセットを整列配置させる。ブロック13022で、構成イメージの一組から合成イメージが形成される。次に、方法13000は、ブロック13024で、合成イメージの中の(ピークの検出などの)変動の検出により、合成イメージの中の関心領域を同定する。ブロック13026で、合成イメージの中の様々な関心領域を規定する座標を得る。これらの座標を使用して、方法13000は、ブロック13028で、合成イメージの中のそれぞれの関心領域と関係する構成イメージにおける様々な関心領域を規定する。ブロック13030で、或る基準(実験上の定義、実験条件、または生物学的変異)に基づいて、構成イメージのサブセットを選択するよう命令される。次に、方法13000は、終了端子Bに進む。
【0050】
構成イメージのサブセットは、1つの構成イメージからの単一の関心領域に関係する、または構成イメージの集合体に対応する関心領域の一組(構成イメージごとに1つの関心領域)に適切であると思われるスコアを生成するために、後のスコア付けプロセスに加わる。相関スコア付けのための構成イメージを選択する際に、(イオンとして登録された)化学物質が、1つの条件において存在するが、別の条件においては存在しない場合があることを認識することが適切である。選択された構成イメージが、複数の処置条件または複数の生物学的変異からである場合、1つの条件において信号が存在しない状態が、別の条件において化学物質の存在によって現れた別の信号が存在する状態と比較されるため、(ピークなどの)重要な変動との相関が弱いことが予想される。これらのスコアは、信頼できるデータを信頼できないデータから区別するのに使用できる場合があるので、いくつかの条件の間の関係のある変動が、信頼できないと誤認される可能性がある。様々な構成イメージから関連する領域を表す適切な条件を選択することによって、この状況に対処することができる。例えば、或る時点で或る特定の条件を表すスコアのなかかの平均スコア、中心スコア、最良スコア、最悪スコア、または最も強力なスコアを選択することができる。すべての構成イメージの関心領域が、この1つのスコアを引き継ぐ。この方法を、条件内相関スコア付けと名付け、後段で説明する。原則として、この方法は条件にかかわらず2つ以上のイメージに適用できる。代替として、異なる統計方法を使用することにより、化学物質が条件のいくつかにおいてだけ現れる、複数の条件を元に重み付けした構成要素を、使用できるようになる。この後者の方法は、構成要素重み付き相関スコア付けと名付けられ、後段で説明される。この方法は、或る条件における構成イメージの数が少なく、疑わしい統計的結論が生じるような事例において使用できる。
【0051】
端子B(図13A)から、方法13000は、継続端子(「端子C」)と終了端子(「端子D」)の間に規定される方法ステップの一組13004に進む。方法ステップ13004の一組は、オプションであるマイクロ整列配置プロセスを実行して、マクロ整列配置を用いる必要なしに関心領域を整列配置させる。
【0052】
端子C(図13E)から、方法13000は、まだ処理のためにスコア付けされていない合成イメージの中の元の関心領域を同定するブロック13032に進む。ブロック13034で、方法は、合成イメージの中の元の関心領域と関係する構成イメージのサブセットの中の関心領域を同定する。ブロック13036で、方法は、合成イメージの中の元の関心領域の幅を(保持時間次元において)測定する。次に、方法は、様々な構成イメージにおける同定された各関心領域に、同一の測定された幅を持たせる(ブロック13038を参照されたい)。ブロック13040で、方法は、同定された各関心領域の幅を、保持時間次元において逆方向および順方向にさらに拡大する。この拡大により、関心領域の初期定義において除外されている可能性がある、関係のある信号を含めることができる。一実施形態において、測定された幅だけ両方向に拡大し、幅を3倍増加させる。この方法は、オプションとして、ブロック13042で、1などの許容誤差だけ変更された中心M/Zにおけるクロマトグラフに的を絞るように、同定された各関心領域の高さを減少させる。ブロック13044で、方法は、マイクロ整列配置のためのマスタイメージを同定するプロセスを開始する。次に、方法は、別の継続端子(「端子C1」)に進む。
【0053】
端子C1(図13F)から、方法13000は、元の関心領域がマスタスニペットとして選択されるかどうかを判定する試験が実行される判定ブロック13046に進む。判定ブロック13046における試験への答えが、「いいえ」である場合、方法13000は、マスタスニペットが、構成イメージおよび合成イメージのなかから選択されるブロック13048に進む。次に、方法は、別の継続端子(「端子C7」)に進む。代わりに、判定ブロック13046における試験への答えが、「はい」である場合、方法は、別の継続端子(「端子C2」)に進む。
【0054】
端子C2(図13F)から、方法13000は、方法が、元の関心領域と互いに関係する構成イメージのサブセットにおける関心領域を(見込まれるマスタスニペットとして)見出すことを開始するブロック13050に進む。ブロック13052で、元の関心領域は、行列U=uijであり、さらに見込まれるマスタスニペットは、V=vikと定義される。ブロック13054に示されるとおり、変数kは、nが、元の関心領域の(ピクセル単位の)幅である、j−n,...,j+nの範囲をとり、変数iは、質量/電荷次元において1からmまでの範囲をとり、さらに変数jは、保持時間次元に沿って1からnまでの範囲をとる。ブロック13056で、v(q)が、見込まれるマスタスニペットから導き出される。変数qは、保持時間シフト(retention time shift)を表し、ブロック13056に示されるとおり、−nから,...,nまでの範囲をとる。次に、方法13000は、別の継続端子(「端子C3」)に進む。
【0055】
端子C3(図13Gに示される)から、方法は、ブロック13058で、正規化された相互相関最大値t1(q)を計算することを準備する。ブロック13060で、方法は、この項を計算する。
【0056】
【数1】
【0057】
項
【0058】
【数2】
【0059】
は、前述の数学演算の結果である。ブロック13062で、方法は、以下の項をさらに計算する。
【0060】
【数3】
【0061】
得られた結果
【0062】
【数4】
【0063】
は、そのような数学演算の結果である。方法13000は、ブロック13064に進み、以下の項
【0064】
【数5】
【0065】
からt1(q)を計算する。
【0066】
方法13000は、別の継続端子(「端子C4」)に進む。端子C4(図13G)から、方法は、被除数と除数の商である線形相関係数最大値t2(q)を計算することを準備するブロック13066に進む。ブロック13068で、被除数が、以下のとおり計算される。
【0067】
【数6】
【0068】
ブロック13070で、除数が、以下のとおり、計算される。
【0069】
【数7】
【0070】
次に、方法13000は、別の継続端子(「端子C5」)に進む。
【0071】
端子C5(図13H)から、方法は、正規化された最小二乗差最小値t3(q)を計算することを準備する。ブロック13072を参照されたい。方法は、以下の式を計算する。
【0072】
【数8】
【0073】
ブロック13074を参照されたい。次に、方法は、別の継続端子(「端子C6」)に進む。端子C6(図13H)から、方法は、関心領域に関するスコアが、正規化された相互相関最大値、線形相関係数最大値、および正規化された最小二乗差最小値のなかから選択されるブロック13076に進む。方法13000は、評価されるべき別の関心領域が存在するかどうかを判定する試験が実行される判定ブロック13078に進む。判定ブロック13078における試験への答えが、「はい」である場合、方法は、端子C2に進み、上記で定められた処理ステップが繰り返されるブロック13050にループバックする。そうではなく、判定ブロック13078における試験への答えが、「いいえ」である場合、方法は、合成イメージの中の元の関心領域と最もよく相関するスコアを有する関心領域が、マイクロ整列のためのマスタスニペットとして選択されるブロック13080に進む。次に、方法は、別の継続端子(「端子C7」)に進む。
【0074】
端子C7(図13I1)から、方法は、マスタスニペットとのマイクロ整列配置のために、サブセットにおける構成イメージの中の関心領域(イメージスニペット)を選択する。ブロック13082を参照されたい。マスタスニペットは、行列U=uijであり、さらにマイクロ整列配列させられるイメージスニペットは、V=vikと定義される。ブロック13084を参照されたい。さらに、nは、元の関心領域の(ピクセル単位の)幅であり、さらにiは、質量/電荷次元において1からmまでの範囲をとり、さらにjは、保持時間次元に沿って1からnまでの範囲をとり、さらにkは、保持時間次元に沿ってj−nからj+nまでの範囲をとる。ブロック13083、13085を参照されたい。v(q)は、−m,...,nの範囲にあるkを(保持時間次元において)q移動させることによって、イメージスニペットvikから導き出される。ブロック13086を参照されたい。qは、k−q≠jであるため、マッチしないピクセルを除外して、マスタスニペットuijに対するv(q)の輝度の適切な相関に基づいて、計算される。ブロック13088を参照されたい。時間整列配置の様々な方法を使用できる。以下は、いくつかの方法の例である。
【0075】
t1(q)が端子C3、C4の間に示されている正規化された相互相関最大値を使用して最大化されるように、qの1つの値が計算される。ブロック13090を参照されたい。方法13000は、別の継続端子(「端子C11」)に進む。
【0076】
端子C11(図13I2)から、t2(q)が端子C4、C5の間に示されている線形相関係数最大値を使用して最大化されるように、qの別の値が計算される。ブロック13092を参照されたい。t3(q)が端子C5、C6の間に示される正規化された最小二乗差最小値を使用して最小化されるように、qのさらなる値が計算される。ブロック13094を参照されたい。次に、方法13000は、別の継続端子(「端子C8」)に進む。
【0077】
端子C8(図13J)から、方法は、適切なマイクロ整列配置を同定する相関が存在するかどうかを判定する試験が実行される判定ブロック13096に進む。判定ブロック13096における試験への答えが、「はい」である場合、マスタスニペットとの適切な相関をもたらす移動されたイメージスニペットは、さらなる処理のために保持される。ブロック13098を参照されたい。次に、方法は、別の継続端子(「端子C9」)に進む。判定ブロック13096における試験への答えが、「いいえ」である場合、方法は、別の判定ブロック13100に進み、重心整列配列が使用されるべきかどうかを判定する試験が実行される。判定ブロック13100における試験への答えが、「はい」である場合、方法は、イメージスニペットの最大値または重心が、マスタスニペットの最大値または重心と一致するように、イメージスニペットの保持時間を移動させる。ブロック13102を参照されたい。次に、方法は、端子C9に進む。判定ブロック13100における試験への答えが、「いいえ」である場合、方法は、別の継続端子(「端子C10」)に進む。
【0078】
端子C10(図13K)から、方法は、適応整列配置などの別の整列配置方法が使用されるべきかどうかを判定する試験が実行される判定ブロック13104に進む。判定ブロック13104における試験への答えが、「はい」である場合、方法は、その別の形態の整列配置を実行して、マスタスニペットに対してイメージスニペットをマイクロ整列配置させる。ブロック13106を参照されたい。次に、方法は、端子C9に進む。判定ブロック13104における試験への答えが、「いいえ」である場合、方法は、端子C9に進み、マイクロ整列配置のための別の関心領域が存在するかどうかを判定する試験が実行される判定ブロック13108にさらに進む。判定ブロック13108における試験への答えが、「はい」である場合、方法は、端子C7に進み、以上に示された処理ステップが繰り返されるブロック13082にループバックする。そうではなく、判定ブロック13108における試験への答えが「いいえ」である場合、方法は、終了端子Dに進む。
【0079】
端子D(図13A)から、方法13000は、継続端子(「端子E」)と終了端子(「端子F」)の間に規定される方法ステップのセット13006に進む。方法ステップのセット13006は、後のスコア付けプロセスに適したピクセルに的を絞る改訂された関心領域検出プロセスを実行する。
【0080】
端子E(図13L)から、方法は、マイクロ整列配置が実行されたかどうかを判定する試験が実行される判定ブロック13110に進む。判定ブロック13110における試験への答えが、「いいえ」である場合、方法は、終了端子Fに進む。そうではなく、判定ブロック13110における試験への答えが、「はい」である場合、方法は、ブロック13112で、(合成イメージの中の元の関心領域とは異なる)合成スニペットを作成するステップを実行する。
【0081】
ブロック13114で、方法は、移動されたイメージスニペットの諸部分を、それらの部分が元の関心領域およびマスタスニペットuijと重なり合う場合、(ピクセルごとに)組み合わせて、イメージvikに関するk−q=jがqだけ移動されるようにする。ブロック13116で、方法は、新たに作成された合成イメージスニペットに従い、関心領域を再検出する。方法は、閾値化、分水界分析、ラプラスガウシアン(Laplace of Gaussian)畳み込みによる水平エッジ検出または径方向エッジ検出によって(ピーク検出またはスポット検出などの)変動を検出して、合成スニペットの中で新たなピークマスクを同定する。ブロック13118を参照されたい。ブロック13120で、方法は、スクリプト化されたピクセルの2次元マスクの使用を含め、関心領域を記述する方法を選択する。この2次元マスクは、相関スコアおよび形状スコアの計算に加わるピクセルを同定する。次に、方法は、終了端子Fに進む。
【0082】
端子F(図13B)から、方法13000は、継続端子(「端子G」)と終了端子(「端子H」)の間に示される方法ステップの一組13008に進む。方法ステップの組13008は、データ抽出を実行して、スコア付けプロセスを準備する。端子G(図13M)から、方法は、サブセットの各構成イメージに2次元マスクを適用して、新たな関心領域を獲得する。ブロック13122を参照されたい。次に、方法13000は、各2次元イメージがシリアル化されるブロック13123に進む。このことは、各スニペットに関して、方法が、ピクセル輝度の1次元ベクトルを生成することを意味する。つまり、1つのスニペットからのピクセル輝度の数値が、ベクトルを形成するように線形のやり方で1列に並べられる。マスクされた区域がP個のピクセルを含むスニペットを与えられ、方法は、1からPまでの固有の番号で各ピクセルにラベルを付ける。これらの番号は、2Dイメージスニペットの輝度に対して長さPのベクトルの輝度を設定する任意のピクセル順序を確立する。具体的には、ベクトルの中の位置jにおける輝度が、ラベルがjである2Dイメージスニペットの中のピクセルの輝度に設定される。つまり、これらのラベルは、2Dイメージスニペットの輝度を長さPのベクトルの輝度に関係付ける、任意のピクセル順序を構成する。関係するマスクされたすべての関心領域に関して同一の順序が使用される限り、任意のピクセル順序を使用できる。このベクトルは、同一のマスクでマスクされておりさらに同一の順序でシリアル化されている、他のイメージスニペットと互いに関係付けられる。ブロック13124で、方法は、構成イメージの各関心領域(構成スニペット)から特徴的なクロマトグラムを決定する。或る許容誤差を有する中心m/zを有するマスクされたピクセルのクロマトグラムが使用される場合に、これらの特徴的なクロマトグラムを決定できる。許容誤差は、通常1ピクセルであるが、0からイメージスニペットの境界までの範囲をとることができる。それぞれのイメージスニペットにおけるマスクされたピクセルの重心または最大値の使用を含め任意の適切な技術において、中心m/zを決定できる。代替として、各保持時間ですべてのm/zにわたって、マスクされたピクセルを積分または平均することによって、特徴的なクロマトグラムを得ることもできる。
【0083】
ブロック13126で、方法は、構成イメージの各関心領域(構成スニペット)から特徴的な質量スペクトルを決定する。イメージスニペットの特徴的なクロマトグラムの許容誤差を有する、輝度最大値または重心の、保持時間において、それぞれの特徴的なスペクトルをとることができる。許容差は通常1ピクセルであるが、0からイメージスニペットの境界までの範囲をとることができる。代替として、各m/z間隔ですべての保持時間にわたって、マスクされたピクセルを積分または平均することによって、特徴的なスペクトルを得ることもできる。
【0084】
ブロック13128で、方法は、形状特性を抽出するために、構成スニペットが関係する合成スニペットをメンバが含む可能性がある、構成スニペットの一組のメンバを選択する。ブロック13130で、方法は、相関スコアを計算するために、構成スニペットが関係する合成スニペットをメンバが含む可能性がある、構成スニペットのセットのメンバをさらに選択する。次に、方法は、終了端子Hに進む。
【0085】
端子H(図13B)から、方法13000は、継続端子(「端子I」)と終了端子(「端子J」)の間に示される方法ステップの一組13010に進む。方法ステップの組13010は、質量/電荷スペクトル、液体クロマトグラフクロマトグラム、および/またはシリアル化された2次元LC/MSスニペットのなかから選択されたデータの組に関して、相関スコアを計算する。
【0086】
端子I(図13N1)から、方法13000は、方法が、(シリアル化されたイメージ、クロマトグラム、またはスペクトルの)いずれのタイプのデータを処理するかを決定することを準備するブロック13131に進む。方法は、関係する関心領域のシリアル化されたスニペットに関する相関スコアを方法が既に計算しているかどうかを判定する試験が実行される判定ブロック13132に進む。判定ブロック13132における試験への答えが、「いいえ」である場合、方法13000は、ブロック13133に進む。そうではなく、判定ブロック13132における試験への答えが、「はい」である場合、方法は、別の継続端子(「端子I1A」)に進む。ブロック13133で、各構成要素につき1つの、シリアル化されたイメージスニペットが、相関のために準備される。シリアル化されたイメージスニペットは、行列としてひとまとめにされることが可能な等しい長さのベクトルの一組とみなされる。方法は、別の継続端子(「端子I2」)に進む。端子I1A(図13N2)から、方法13000は、方法が、関係する関心領域のクロマトグラムに関する相関スコアを既に計算しているかどうかを判定する試験が実行される判定ブロック13134に進む。判定ブロック13134における試験への答えが、「いいえ」である場合、方法13000は、ブロック13135に進む。そうではなく、判定ブロック13134における試験への答えが、「はい」である場合、方法は、ブロック13136に進む。ブロック13135で、各構成要素につき1つのクロマトグラムが相関のために準備される。クロマトグラムは、行列としてひとまとめにされることが可能な等しい長さのベクトルの一組と考えられる。ブロック13136で、各構成要素につき1つのスペクトルが、相関のために準備される。スペクトルは、行列としてひとまとめにされることが可能な等しい長さのベクトルの一組と考えられる。方法は、別の継続端子(「端子I2」)に進む。
【0087】
端子I2(図13O)から、方法は、n×m行列を構成する1次元ベクトルの集合体を使用して相関スコア(信号信頼性の測度)を決定することを始めるブロック13140に進む。相関イバリュエータ210への入力データは、1つの構成イメージスニペットをそれぞれが表す、等しい長さの順序付けられたベクトルの一組である。この組は、ブロック13124において決定されたクロマトグラム、またはブロック13126において決定されたスペクトル、または共通の関心領域に属する、ブロック13123において決定された、シリアル化された(ピークなどの)2次元変動を含むことがある。相関イバリュエータ210の出力データは、これらのベクトルが、互いにどれだけよく相関するかを示すスコアである。この相関は、信号信頼性の評価基準と解釈される。方法は、ブロック13142で、構成イメージ1、2、3、...、nを表すベクトルを取り上げ、これらのベクトルを、すべて長さmの構成ベクトルa1、a2、a3、...、anとして表す。ブロック13144で、これらの構成ベクトルは、以下のとおり、nが、構成イメージの数であり、さらにmが、相関させられることが可能なデータ点の数である、n×m行列A=aijを形成する。
【0088】
【数9】
【0089】
行列Aは、相関イバリュエータ210への入力である。
【0090】
ブロック13146で、方法は、コンセンサスベクトルを決定することを始める。方法は、構成ベクトル異常値が除外されるべきかどうかを判定する試験が実行される判定ブロック13148に進む。判定ブロック13148における試験への答えが、「いいえ」である場合、方法は、別の継続端子(「端子I4」)に進む。判定ブロック13148における試験への答えが、「はい」である場合、方法は、方法が、中心傾向ベクトルに対して最小の相関係数を生成する構成ベクトルを見出すブロック13150に進む。方法は、別の継続端子(「端子I3」)に進む。
【0091】
端子I3(図13P)から、方法は、異常値であることを見出された構成ベクトルを、コンセンサスベクトルの決定に参加することから除外する。ブロック13152を参照されたい。代替として、中心傾向ベクトルと(最高のピアソンの相関係数をもって)最もよく相関するベクトルが、a1、a2、a3、...、anのなかから見出されることが可能である。このシナリオにおいて、最もよく相関するベクトルは、新たなコンセンサスベクトルである。
【0092】
次に、方法は、ブロック13154に続いている継続端子I4に進み、相関イバリュエータが、行列Aにおける構成ベクトルの組、a1、a2、a3、...、anのなかから中心傾向を適切に表すコンセンサスベクトルbを作成する。方法13000は、平均ベクトルが使用されるべきかどうかを判定する試験が実行されるブロック13156に進む。判定ブロック13156における試験への答えが、「いいえ」である場合、方法は、別の継続端子(「端子I5」)に進む。そうではなく、判定ブロック13156における試験への答えが、「はい」である場合、方法は、コンセンサスベクトルが以下のとおり計算されるブロック13158に進む。
【0093】
【数10】
【0094】
次に、方法は、別の継続端子(「端子I7」)に進む。
【0095】
端子I5(図13Q)から、方法13000は、平均ベクトルが使用されるべきかどうかを判定する試験が実行される判定ブロック13160に進む。判定ブロック13160における試験への答えが、「いいえ」である場合、方法は、別の継続端子(「端子I6」)に進む。そうではなく、判定ブロック13160における試験への答えが、「はい」である場合、方法は、コンセンサスベクトルが以下のとおり計算されるブロック13162に進む。
bi=median(aij)、ただし、j=1,...,n
【0096】
次に、方法は、別の継続端子(「端子I7」)に進む。
【0097】
端子I6(図13Q)から、方法13000は、相関を使用して、中心傾向ベクトルと(より高いピアソンの相関係数をもって)適切に相関するベクトルが、a1、a2、a3、...、anのなかから決定され、さらにそのベクトルをコンセンサスベクトルと定義するブロック13164に進む。行列におけるベクトルの組の中の輝度の差が、生物学的特徴を発見するために重要である。しかし、この主題の様々な実施形態において、表現の量の差が焦点になっているのではなく、代わりに、相関イバリュエータ210は、信号が、関心領域内で1つの構成イメージから別の構成イメージに相関するかどうかを判定する。
【0098】
同化プロセスによって、信号の大きさの一貫した差を考慮することなしに、関係する関心領域の間の信号が相関をもてるようになる。ブロック13166を参照されたい。次に、方法は、端子I7に進む。端子I7(図13R)から、方法は、式xj=cj+sjajなどのスケーリング変換または線形変換を使用して、構成ベクトルa1、a2、a3、...、anのそれぞれを、コンセンサスベクトルbに独立に同化させる。項xjは、第j番の構成ベクトルajの同化された形態である。ブロック13170を参照されたい。cjおよびsjは、コンセンサスベクトルbに構成ベクトルajを線形フィットさせて決定される。ブロック13172を参照されたい。ブロック13174で、コンセンサスベクトルbに対する各構成ベクトルajの最小二乗線形相関を使用して、パラメータcjおよびsjを、式b=cj+sjajから決定できる。方法13000は、構成イメージのデータが、適格であるかどうかを判定する試験が実行される判定ブロック13176に進む。適格なデータは、aij>0、bi>0、cj=0、およびsj>0である、線形関係によってモデル化されることが可能である。このモデルは、(ピークなどの)現れた変動が分離され、さらに背景が無視できるという前提に基づいて、構成ベクトルを同化させる。イメージスニペットが、大きく異なる背景を含む範囲内で、原点を通るように強制される線形回帰は、より大きい変動をもたらし、そのため、より低い相関スコアをもたらす可能性がある。
【0099】
判定ブロック13176における試験への答えが、「いいえ」である場合、方法は、別の継続端子(「端子I8」)に進む。そうではなく、判定ブロック13176における試験への答えが、「はい」である場合、方法は、別の継続端子(「端子I9」)に進む。
【0100】
端子I8(図13S)から、項cjは、被除数と除数の商である。ブロック13178を参照されたい。ブロック13180で、項cjの被除数が、以下のとおり計算される。
【0101】
【数11】
【0102】
ブロック13182で、項cjの除数が、以下のとおり計算される。
【0103】
【数12】
【0104】
ブロック13184で、項sjは、被除数と除数の商である。項sjの被除数は、以下のとおり計算される。
【0105】
【数13】
【0106】
ブロック13188で、項sjの除数が、以下のとおり計算される。
【0107】
【数14】
【0108】
ブロック13190で、変数iは、ベクトルにおける輝度信号(ピクセル)の順序付けを表すi=1...mの範囲にあり、さらに変数jは、構成基準を表すj=1...nの範囲にある。次に、方法は、別の継続端子(「端子I10」)に進む。
【0109】
端子I9(図13T)から、方法は、項cjが0に等しいブロック13192に進む。ブロック13194で、項sjが、以下のとおり計算される。
【0110】
【数15】
【0111】
方法は、別の継続端子(「端子I10」)に進み、さらに、得られた、同化された構成ベクトルの集合体x1、x2、x3、...、xnが、n×m行列X、すなわち、xij=cj+aijを構成するブロック13196にさらに進む。
【0112】
ブロック13198から、方法は、構成ベクトルx1、x2、x3、...、xnに適用されるべき重み付けベクトルを計算することを始める。次に、方法は、構成要素重み付き相関が使用されるべきかどうかを判定する試験が実行される判定ブロック13200に進む。判定ブロック13200における試験への答えが、「いいえ」である場合、方法は、別の継続端子(「端子I11」)に進む。そうではなく、判定ブロック13200における試験への答えが、「はい」である場合、方法は、別の継続端子(「端子I12」)に進む。
【0113】
端子I11(図13U)から、方法は、条件内相関に関して、重み付けが、すべての構成ベクトルに関して等しい(重み1)ブロック13202に進む。条件内スコア付けに関する重み付けベクトルは、次のとおり計算される。wj=1。次に、方法は、別の継続端子(「端子I13」)に進む。端子I12(図13U)から、方法は、構成要素重み付き相関に関して、重みが或る関数であり、さらに構成要素重み付きスコア付けに関して様々な重み付けベクトルが、可能であるブロック13206に進む。1つの典型的な機能は、コンセンサスベクトルからの差を最小限に抑えるために使用された同化の関数を含む。より高いスケーリングは、より低い重み付けにつながる。つまり、コンセンサスからの差を最小限に抑えるために要求される構成要素のスケーリングの量は、重みに反比例する可能性がある。代替として、重み付けは、所与の構成要素の重要度に基づくことが可能である。輝度(体積)によって重要度をモデル化できる。各構成要素jが、スカラー重みwjを受け取る。ただし、jはj=1からnまでであり、さらにnは、構成要素の数である。
【0114】
構成要素重み付きスコア付けに関する重み付けベクトルの3つの例を示す。第1の例では、ベクトルをスケーリングすることにより、対応する信号と雑音が等しい仕方でスケーリングされるモデルを与えることができる。スケーリングされたベクトルの重み付けは、以下のとおり、スケーリング値の逆数であることが可能である。
【0115】
【数16】
【0116】
第2の例では、0でない切片が、相当な背景信号が存在することを示すと仮定できる。この事例では、重み付けは、以下のとおりモデル化されることが可能である。
【0117】
【数17】
【0118】
第3の例では、重み付けのモデルは、スケーリングされていない(同化されていない)関心領域の積分された輝度に基づく。このモデルは、関心領域内で最大の輝度を有する構成要素が、最も重要であることを前提とする。
【0119】
【数18】
【0120】
ただし、i=1...mであるaijは、第j番の構成要素のベクトル化された輝度である。積分された輝度を、第1の例、または第2の例からの重みと組み合わせることによって、第3の例を以下のように拡張できる。
【0121】
【数19】
【0122】
次に、方法は、端子I13(図13U)に進み、さらに方法が、コンセンサスベクトルに、同化された構成ベクトルの集合体を相関させて、相関スコアR1、R2、R3、...、Rnを導き出すことを始めるブロック13208にさらに進む。ブロック13210で、(同化された構成ベクトルの集合体を表す)行列xとコンセンサスベクトルbが、対にされて、n×m点の一組(xij,bi)が形成される。ブロック13212で、最小二乗フィット法に従って、方法は、これらの点をb=c+sxにフィットさせ、これにより、相関係数、切片c、および傾きsがもたらされる。ブロック13214で、相関係数は、関心領域に関する変更されたピアソンの相関スコアR1であることが適しており、このスコアR1は、被除数と除数から計算された商R1(s>0)である。次に、方法は、別の継続端子(「端子I14」)に進む。
【0123】
端子I14(図13V)から、相関係数の被除数が、以下のとおり計算される。すなわち、
【0124】
【数20】
【0125】
ブロック13216を参照されたい。ブロック13218で、除数が、以下のとおり計算される。
【0126】
【数21】
【0127】
ブロック13220における制約が、以下のとおり与えられる。
R1(s≦0)=0
ブロック13222で、項tが、以下のとおり与えられる。
【0128】
【数22】
【0129】
ブロック13224で、方法は、被除数と除数の商である傾き相関係数sを計算する。ブロック13226で、傾きの被除数が、以下のとおり計算される。
【0130】
【数23】
【0131】
ブロック13228で、傾きの除数が、以下のとおり計算される。
【0132】
【数24】
【0133】
ブロック13230で、相関スコアR2が、以下のとおり計算される。すなわち、
R2(s>0)=exp(−|ln(s)|)
次に、方法は、別の継続端子(「端子I15」)に進む。
【0134】
端子I15(図13W)から、制約が、以下のとおり与えられる。
R2(s≦0)=0
方法13000は、方法が、被除数と除数の商である切片相関係数cを計算するブロック13234に進む。切片の被除数が、以下のとおり計算される。
【0135】
【数25】
【0136】
切片の除数は、ブロック13238で以下のとおり計算される。すなわち、
【0137】
【数26】
【0138】
ブロック13240で、相関スコアR3が、以下のとおり計算される。
【0139】
【数27】
【0140】
項σb2が、以下のとおり計算される。
【0141】
【数28】
【0142】
ブロック13244で、項
【0143】
【数29】
【0144】
が、以下のとおり計算される。
【0145】
【数30】
【0146】
次に、方法は、別の継続端子(「端子I16」)に進む。端子I16(図13X)から、以下のとおり、相関スコアR4が計算され、これにより、線形相関が存在する確率が決定される。
R4=1−Pc(R1,m)
【0147】
ブロック13246を参照されたい。ブロック13248で、項
Pc(R1,m)
が、所与の相関係数R1が、長さmのコンセンサスベクトルbを使用して偶然に生成されたという帰無仮説を試験する。つまり、方法13000は、線形相関が存在する確率(R4)を決定することができ、さらにこの確率を使用して、R1を変更できる。帰無仮説の確率Pc(R1,m)は、所与の相関係数R1が、長さmのベクトルbを使用して偶然に生成されたということである。この帰無仮説は、線形回帰に関するピアソンの相関係数R、および自由度の数値(f=m−2)が与えられ、行列Aまたはベクトルxにおける「スケーリングされた構成ベクトル」が、「繰り返されるコンセンサスベクトル」bまたはyと相関していないことを言明する。Pc(R1,m)は、無相関の輝度のmのランダムなサンプルの線形相関が、R1以上の相関係数をもたらす確率である。次に、方法は、方法が、3つすべてのタイプのベクトルの相関スコア、すなわち、シリアル化されたイメージスニペット、クロマトグラム、およびスペクトルを既に計算しているかどうかを判定する試験が実行される判定ブロック13249に進む。判定ブロック13249における試験への答えが、「はい」である場合、方法は、端子(「端子J」)に進む。そうではなく、判定ブロック13249における試験への答えが、「いいえ」である場合、方法は、端子Iに戻り、以上に示された処理ステップが繰り返されるブロック13248にループバックする。
【0148】
端子J(図13B)から、方法13000は、継続端子(「端子K」)と終了端子(「端子L」)の間に規定される方法ステップのセット13012に進む。方法ステップのセット13012は、関心領域の形状特性を計算する。端子K(図13X)から、方法は、合成スニペットおよびイメージスニペットから特定された関心領域の形状に関する形状特性スコア付けを実行するブロック13250に進む。次に、方法は、別の継続端子(「端子K1」)に進む。
【0149】
端子K1(図13Y)から、方法13000は、端子G、Hの間(ブロック13122)で示される、マスクされた2次元関心領域に関する形状特性を特定するブロック13252に進む。ブロック13254で、方法は、端子G、Hの間(ブロック13124)で特定されるクロマトグラムに関する形状特性を特定する。ブロック13256で、方法は、端子G、Hの間(ブロック13126)で特定される質量スペクトルに関する形状特性を特定する。次に、方法は、終了端子Lに進む。
【0150】
端子L(図13C)から、方法13000は、継続端子(「端子M」)と終了端子(「端子N」)の間で規定される方法ステップの一組13014に進む。方法ステップの組13014は、選択されたアルゴリズムに従ってスコアを組み合わせ、評価する。端子M(図13Y)から、方法13000は、様々な仕方でスコアを組み合わせて、関心領域を分類する新たなスコアを導き出す。ブロック13258を参照されたい。
【0151】
第1の例として、合成イメージからの形状特性を組み合わされることができる。任意の構成イメージセットから導き出された合成イメージ上の単一の関心領域から形状特性を導き出すことができる。この方法は、合成イメージを含むよく整列配置させられた構成要素を要求し、さらにこの方法には、マイクロ整列配置および領域再定義が役に立つ可能性がある。単一の関心領域からの様々な形状特性(信頼度、楕円同化など)が組み合わされて、新たな形状特性を作成できる。
【0152】
第2の例として、個々の構成要素からの形状特性を組み合わすことができる。1つのタイプの形状特性(信頼度、楕円同化など)を、或る特徴の範囲内の関心領域のような対応する関心領域から組み合わせることができる。この方法は、合成イメージを要求せず、したがって、マイクロ整列配置も要求しないが、この方法には、領域再定義が役立つ可能性がある。
【0153】
第3の例として、個別の構成要素内の形状特性を組み合わせることができる。多くのタイプの形状特性(信頼度、楕円同化など)を、新たな形状特性を作成するように単一の関心領域から組み合わせることができる。この新たな形状特性を、次に、所与の構成要素の一組からの対応する関心領域の同一の形状特性タイプと組み合わせてもよい。
【0154】
第4の例として、相関スコアを、組み合わせることができる。研究者は、個々の構成要素の組合せである最終スコアを求める可能性がある。そのようなスコアによって、研究者は、役に立つ方法で関心領域を格付けできる。1つのベクトルの組からの様々な相関スコアR1、R2、R3、...Rnが、1が最適な相関を示す、0から1までの範囲をとる確率として解釈され得る場合、これらのスコアを乗算によって組み合わせて、やはり0から1までの範囲をとる合成スコアを作成できる。各スコアRiには、そのスコアRiの寄与を強調する、または強調をやめるように個々に重み付けできる。Riに関する重み付けwiは、指数である。結果は、完全なスコアが1である、0から1までの範囲内のスコアである。
【0155】
【数31】
【0156】
w(i)は、第i番のスコアに関する重み付け係数である。w(i)=1などの等しい重み付けが、使用され得る。また、w(1)=w(4)、w(2)=w(3)、およびw(1)=2*w(2)などの他の重み付けも、有用である。1つの適切な重み付けは、次のとおりである。R=R12R21R31R42。
【0157】
第5の例として、異なる構成イメージからの形状特性スコアを組み合わせることができる。個々の形状スコアから特徴/合成スコアを作成するのに、以下の式が、注目される。すなわち、
【0158】
【数32】
【0159】
Iは、スコア付けされた関心領域の積分された輝度である。
【0160】
引継ぎを考慮すると、相関スコア、または相関スコアの組合せのいずれかが、構成要素の組、または1つのイメージから、関心領域全体(複合体、構成要素の組、個々の構成要素)に帰せられることが可能である。例えば、最大条件内相関スコアは、すべての構成イメージ上の関心領域を表すことも可能である。単一構成要素スコアは、単一の関心領域を参照し、さらに、合成イメージではなく、単一のイメージを主に参照する。
【0161】
形状特性スコアの引継ぎを考慮すると、形状特性は、単一のイメージスニペット上の単一の関心領域から導き出されるスコアである。この単一のイメージスニペットは、1つの構成要素(レプリケート)からであってもよく、あるいは複数の重ね合わされたイメージスニペット(複合体)からの合成イメージであることも可能である。構成イメージスニペットの集合体からの複数の形状特性を組み合わせて、これらの構成イメージのセット、およびこれらの構成イメージの複合体の関心領域に属する、うまく形作られたスコアを形成できる。
【0162】
相関スコアの引継ぎを考慮すると、或る関心領域、および条件のような複数の構成要素セットが存在することが与えられ、各構成要素セットから相関スコアを導き出すことができる。これらの相関スコアの1つが、関心領域を表すように選択される。この選択は、様々な方法(例えば、最良、最悪、中央値、算術平均、幾何平均、または輝度重み付き算術平均)に基づくことが可能である。いずれの方法が使用されるべきかの選択は、研究者の期待に依存する。
【0163】
構成要素(例えば、条件)のすべての組が、分析され、スコア付けされた後、最良のスコアを有する構成セットが、一般に、関心領域を表すように選択され(さらに、関心領域によって引き継がれ)る。このアプローチの理由は、重要で相関する信号を、その信号が1組の構成要素の中でしか現れない場合でさえ、認識することである。処置条件の違いに起因するピークの差が、一般に、実験の焦点である。一組の条件における最良スコアは、それらの条件のいくつかが低いスコアを有する場合でさえ、研究者には興味深いデータとなる場合がある。
【0164】
相関スコアと形状特性スコアに関する組合せの方法に関して、新たなスコアを形成するように相関スコアを他の幾何形状スコアと組み合わせることができる。複数の条件を含む関心領域によって引き継がれるスコアは、構成要素重み付きスコア、最良条件スコア、または最も強力な条件の条件スコアであることが可能である。
【0165】
【数33】
【0166】
およびiijが、条件jにおけるピクセルの輝度である、最高の値を有する条件に属するスコアである。
【0167】
次に、方法は、端子Aと端子Bの間で、具体的にはブロック13206において示される、すべての関心領域に関するスコアを既に計算しているかどうかを判定する試験が実行される判定ブロック13260に進む。判定ブロック13260における試験への答えが、「はい」である場合、方法は、ブロック13262に進む。そうではなく、判定ブロック13260における試験への答えが、「いいえ」である場合、方法は、端子Cに戻り、さらに以上に述べた処理ステップが繰り返されるブロック13258にループバックする。ブロック13262で、方法は、将来の評価を可能にするデータベースの中にスコアを格納する。次に、方法は、終了端子Nに進む。端子N(図13C)から、方法13000は、分類されたスコアによって明らかにされた生物学的候補が、将来の探究のために研究者に送られる、継続端子(「端子O」)と終了端子(「端子P」)の間に示された方法ステップの一組13016に進む。端子Pを超えて進んで、方法13000は、実行を終了する。
【0168】
図14A〜図14Sは、生物学的特徴を発見するように関心領域を処理するための他の実施形態を示す。図14A、図14Bは、検出された関心領域にスコアが付けられることを示す。1組のスニペット(関心領域)に属するスコアを生成するように同時実行ブランチを使用することを示す図14A、図14Bにおけるブロックが、図14C〜図14Eによってより詳細に示される。図14C〜図14Eによって示される同時実行の代替として、図14F、図14Gは、1組のスニペット(関心領域)に属するスコアを生成する直線実行ブランチを示す。図14H、図14Iは、N個のマスクされたイメージスニペットのP個の輝度値をシリアル化することに関連付け、P×N行列の中に入れるステップを示すことによって、図14C〜図14Gにおけるブロックをより詳細に示す。具体的には、入力値は、P個の輝度値をそれぞれが有する、N個の等しくマスクされたイメージの一組である。各2Dイメージは、1Dベクトルとなる。これらのベクトルは、各列がこれらのイメージの1つを表し、各行が同等の(comparable)ピクセルを表すP×N行列を構成する。出力値は、このP×N行列である。図14Jは、N個のマスクされた(2D)イメージスニペットのそれぞれから形状特性の一組を抽出することと結び付けられたステップを示すことによって、図14C〜図14Gにおけるブロックをより詳細に示す。具体的には、入力値は、N個の等しくマスクされたイメージスニペットである。方法は、各イメージスニペットからのG個の形状特性を特定する。出力値は、G個の値のN個の組である。
【0169】
図14Kは、関心領域を定義するマスキングプロセスを示す。異なるイメージからそれぞれが導き出された、これら3つの対応するスニペットから、共通のマスクが形成される。この決定は、これら3つのスニペットの複合体、および領域再定義である新たなピーク検出に基づくことがある。代替として、マスクは、これら3つのスニペット上の個々のピーク検出に基づくことが可能である。図14Lは、イメージ輝度を、アイソ曲線(iso−curve)(等高線)またはピクセル輝度によって表せること、およびこれらの輝度をマスクできることを示す。図14Mは、それぞれのマスクされた2Dイメージスニペットを使用して、特徴的なクロマトグラム、特徴的なスペクトル、およびピクセル輝度のシリアル化された集合体を生成できることを示す。図14Nは、平均m/zスペクトルが、マスクされた2Dイメージスニペットから導き出されるプロセスを示す。図14Oは、平均クロマトグラムが、マスクされた2Dイメージスニペットから導き出されるプロセスを示す。図14Pは、2Dイメージスニペットを、ピクセル輝度の1Dベクトルにシリアル化するシリアル化プロセスを示す。ピクセル輝度の数値は線形につなぎ合わせてあることもある。ピクセルの順序は、スニペットの間で一貫していなければならない。このベクトルは、同一の順序でシリアル化されている他のイメージスニペットと互いに関係付けられる。図14Q〜図14Sは、3つのイメージからのイメージスニペットが、どのように処理されて、それぞれ、相関イバリュエータへの適切な入力値である、異なる行列にされるかを示す。図14Qは、これら3つの列のそれぞれがベクトルである準備プロセスを示す。各ベクトルは、マスクされたイメージスニペットの平均質量スペクトルである。これら3つのベクトルは一緒になって、相関イバリュエータへの適切な入力である2D行列を構成する。図14Rは、これら3つの列のそれぞれがベクトルである準備プロセスを示す。各ベクトルは、異なるマスクされたイメージスニペットの平均クロマトグラムである。これら3つのベクトルは一緒になって、相関イバリュエータへの適切な入力である2D行列を構成する。図14Sは、これら3つの列のそれぞれがベクトルである準備プロセスを示す。各ベクトルは、異なるマスクされたイメージスニペットからのシリアル化されたピクセル輝度の例である。これら3つのベクトルは一緒になって、相関イバリュエータへの適切な入力である2D行列を構成する。
【0170】
実例的な実施形態が、示され、説明されてきたが、本発明の趣旨および範囲を逸脱することなく、これらの実施形態に様々な変更が行われ得ることが認められよう。
【0171】
以上の方法の実施に適した代表的なコンピューティング環境が、図15に示される。図15、および以下の説明は、開示される技術が実施されることが可能である典型的なコンピューティング環境の簡単な、一般的説明を与えることを意図している。必須ではないものの、開示される技術は、PC(パーソナルコンピューター)によって実行される、プログラムモジュールなどのコンピューター実行可能命令の一般的な表現において説明される。一般に、プログラムモジュールには、特定のタスクを実行する、または特定の抽象データ型を実装するルーチン、プログラム、オブジェクト、コンポーネント、データ構造などが含まれる。さらに、開示される技術は、ハンドヘルドデバイス、マルチプロセッサシステム、マイクロプロセッサベースの家庭用電子機器もしくはプログラマブル家庭用電子機器、ネットワークPC、ミニコンピューター、メインフレームコンピューターなどを含む、他のコンピューターシステム構成を使用して実施されてもよい。また、開示される技術は、通信ネットワークを介してリンクされたリモート処理デバイスによってタスクが実行される、分散コンピューティング環境において実施されてもよい。分散コンピューティング環境では、ローカルメモリー記憶デバイスとリモートメモリー記憶デバイスの両方の中にプログラムモジュールを配置できる。
【0172】
図15を参照すると、開示される技術を実施するための典型的なシステムは、1つまたは複数の処理装置1502、システムメモリー1504、およびシステムメモリー1504を含む様々なシステムコンポーネントを1つまたは複数の処理装置1502に結合するシステムバス1506を含む、典型的な従来のPC1500の形態の汎用コンピューティングデバイスを含む。システムバス1506は、様々なバスアーキテクチャのいずれかを使用する、メモリーバスまたはメモリーコントローラ、周辺バス、およびローカルバスを含む、いくつかのタイプのバス構造のいずれかであることが可能である。典型的なシステムメモリー1504は、ROM(読み取り専用メモリー)1508およびRAM(ランダムアクセスメモリー)1510を含む。PC1500内部の要素間で情報の転送を助ける基本ルーチンを含むBIOS(基本入出力システム)1512が、ROM1508の中に格納される。
【0173】
典型的なPC1500は、ハードディスクに対して読み取りまたは書き込みを行うためのハードディスクドライブ、リムーバブル磁気ディスクに対して読み取りまたは書き込みを行うための磁気ディスクドライブ、およびリムーバブル光ディスク(CD−ROMまたは他の光媒体などの)に対して読み取りまたは書き込みを行うための光ディスクドライブなどの、1つまたは複数の記憶デバイス1530をさらに含む。そのような記憶デバイスは、それぞれ、ハードディスクドライブインタフェース、磁気ディスクドライブインタフェース、および光ドライブインタフェースによってシステムバス1506に接続されることが可能である。これらのドライブ、および関連するコンピューター可読媒体は、コンピューター可読命令、データ構造、プログラムモジュール、およびその他のデータの不揮発性ストレージをPC1500に提供する。また、磁気カセット、フラッシュメモリーカード、デジタルビデオディスク、CD、DVD、RAM、ROMなどの、PCによってアクセスされることが可能なデータを格納することができる他のタイプのコンピューター可読媒体を、典型的な動作環境において使用できる。
【0174】
オペレーティングシステム、1つまたは複数のアプリケーションプログラム、他のプログラムモジュール、およびプログラムデータを含む、いくつかのプログラムモジュールを、記憶デバイス1530の中に格納することもある。ユーザは、キーボードや、マウスなどのポインティングデバイスなどの1つまたは複数の入力デバイス1540を介して、PC1500にコマンドおよび情報を入力することもある。その他の入力デバイスには、デジタルカメラ、マイクロホン、ジョイスティック、ゲームパッド、サテライトディッシュ、スキャナなどが含まれることがある。これら、およびその他の入力デバイスは、しばしば、システムバス1506に結合されたシリアルポートインタフェースを介して1つまたは複数の処理装置1502に接続されるが、パラレルポート、ゲームポート、またはUSB(ユニバーサルシリアルバス)などの他のインタフェースによって接続されてもよい。モニタ1546、または他のタイプのディスプレイデバイスも、ビデオアダプタなどのインタフェースを介してシステムバス1506に接続される。スピーカやプリンタ(図示せず)などの他の周辺出力デバイスを、含めてもよい。一部の例において、処理された構成イメージデータは、表示、または印刷、あるいはそれ以外の方法で提示される。一部の実施例において、中間結果が、表示されることも可能である。
【0175】
PC1500は、リモートコンピューター1560などの1つまたは複数のリモートコンピューターへの論理接続を使用するネットワーク化された環境において動作することもある。一部の例において、1つまたは複数のネットワーク接続または通信接続1550が含められる。リモートコンピューター1560は、別のPC、サーバ、ルータ、ネットワークPC、あるいはピアデバイスもしくは他の一般的なネットワークノードであることがあり、PC1500に関連して前述した要素の多くまたはすべてを通常含むが、メモリー記憶デバイス1562だけを図15に示している。パーソナルコンピューター1500および/またはリモートコンピューター1560は、ロジカル、LAN(ローカルエリアネットワーク)およびWAN(ワイドエリアネットワーク)に接続されることが可能である。そのようなネットワーキング環境は、オフィス、企業全体のコンピューターネットワーク、イントラネット、およびインターネットにおいて一般的である。
【0176】
LANネットワーキング環境において使用される場合、PC1500は、ネットワークインタフェースを介してLANに接続される。WANネットワーキング環境において使用される場合、PC1500は、通常、インターネットなどのWANを介して通信を確立するためのモデムまたは他の手段を含む。ネットワーク化された環境では、パーソナルコンピューター1500に関連して説明されるプログラムモジュール、またはそのようなモジュールのいくつかの部分を、リモートメモリー記憶デバイスの中、あるいはLAN上、またはWAN上の他の場所に格納できる。図示されるネットワーク接続は、典型例であり、コンピューター間で通信リンクを確立する他の手段が使用されてもよい。
【0177】
例示される実施形態を参照して我々の発明の原理を説明し、例示してきたが、例示される実施形態は、そのような原理を逸脱することなく、構成および詳細が変更され得ることが認識されよう。例えば、ソフトウェアで示される、例示される実施形態の要素が、ハードウェアで実施されてもよく、ハードウェアで示される、例示される実施形態の要素が、ソフトウェアで実施されてもよい。また、任意の実施例からの技術を、その他の実施例の任意の1つまたは複数において説明される技術と組み合わせることもできる。本発明の原理が適用されることが可能な多くの可能な実施形態に鑑みて、例示される実施形態は、本発明の実施例であり、本発明の範囲の限定として解釈されるべきではないことを認識されたい。例えば、本明細書で説明されるシステムおよびツールの様々なコンポーネントが、機能および使用において組み合わされてもよい。したがって、我々は、特許請求の範囲の範囲および趣旨に含まれるすべての主題を我々の発明として主張する。以上のセクションにおいて具体的に扱われる代替は、単に典型例であり、本明細書で説明される実施形態の可能なすべての代替を成すものではない。開示される発明の原理が適用されることが可能な多くの可能な実施形態に鑑みて、例示される実施形態は、本発明の好ましい実施例に過ぎず、本発明の範囲を限定するものと解釈されるべきではないことを認識されたい。むしろ、本発明の範囲は、添付の特許請求の範囲によって規定される。したがって、我々は、特許請求の範囲の範囲および趣旨に含まれるすべてを、我々の発明として主張する。
【0178】
(付録)
同化スケーリング係数を導き出すこと、特に想定および単純化に関して、輝度(イオンカウント)は、
y=c+sx
にデータをフィットできる溶離物質(eluting material)に関して線形であると仮定される。
【0179】
ピークは、分離され、ノイズの他には背景を全く有さないと想定される。つまり、与えられた保持時間および質量/電荷において、1つの種(イオン)だけが利用可能であると仮定される。この想定が有効でない範囲では、スコア付けされたピークはそれほど有用ではなく、さらにこの属性は、より弱い相関を有する劣悪なフィットに反映される。これらの想定のもと、以下のとおり、原点に切片を有しさらに正の傾きを有する線形関数へのフィットに線形相関を単純化できる。
y=sx、s>0
【0180】
一般的な誤差モデルに関して、この線形関係からの点(xi,yi)のずれ(discrepancies)を使用して誤差Eをモデル化できる。Eiは、関数fによって記述される、傾きsを与えられた、点iにおけるずれに基づく誤差の部分である。
Ei(s)=f(xi,yi)
【0181】
E(s)は、傾きsを与えられた、点(xi,yi)に対する線のフィットの誤差である。
【0182】
【数34】
【0183】
誤差解決に関して、誤差最小化が、以下によってモデル化される。
【0184】
【数35】
【0185】
スケーリング係数sは、以下のとおり解決される。
【0186】
【表1】
【0187】
1つの構成ベクトルの中で値をxiに設定でき、コンセンサスベクトルの値をyiに設定できる。sでスケーリングすることによってxをyに「同化する」ことが要求されることが与えられ、誤差はxiの範囲内にあるという想定を行うことができる。したがって、一般に、スケーリング係数は、以下のとおり選択される。
【0188】
【数36】
【0189】
特定の誤差モデルの精緻化(elaboration)を考慮すると、原点における切片および
【0190】
【数37】
【0191】
という誤差を仮定する線形同化に関してスケーリング係数を導き出せる。線形関数に関するフィットの誤差を、原点を通る正の傾きを使用して推定できる。この関数へのフィットの誤差を、点(xi,yi)の集合体より推定できる。x値およびy値のずれは、以下のように表せる。
【0192】
【数38】
【0193】
誤差を、以下のとおり求めることができる。
【0194】
【数39】
【0195】
傾き(s)に関する誤差(E)の変化は、以下のとおりである。
【0196】
【数40】
【0197】
【数41】
【0198】
を0に設定することにより、以下を求めることができる。
【0199】
【数42】
【特許請求の範囲】
【請求項1】
関心領域プロセッサであって、
少なくとも2つの構成イメージの一組における関心領域を選択するように構成されたデータセレクタと、
前記選択された関心領域を整列配置させるように構成されたマイクロアライナと、
前記マイクロ整列配置させられた関心領域に基づいて評価スコアを生成するように構成されたイバリュエータと
を含むことを特徴とする関心領域プロセッサ。
【請求項2】
前記イバリュエータは、前記マイクロ整列させられた関心領域に基づいて相関スコアを生成するように構成された相関イバリュエータであり、前記相関スコアは、前記関心領域内の一般的な変動の信頼性に関連することを特徴とする請求項1に記載の関心領域プロセッサ。
【請求項3】
前記イバリュエータは、前記マイクロ整列させられた関心領域の形状特性にスコア付けするように構成された形状スコアラであることを特徴とする請求項1に記載の関心領域プロセッサ。
【請求項4】
前記データセレクタは、単一の処置条件、単一の生物学的変異、複数の処置条件、および複数の生物学的変異に関連するクロマトグラフィ/質量スペクトルメトリイメージから成るグループから構成イメージの一組を選択するように構成されることを特徴とする請求項2に記載の関心領域プロセッサ。
【請求項5】
前記マイクロ整列させられた関心領域の境界を再定義するように構成された関心領域検出器をさらに含むことを特徴とする請求項2に記載の関心領域プロセッサ。
【請求項6】
2次元マスクを生成し、前記2次元マスクに基づいて再定義された関心領域をもたらすように構成されたデータエクストラクタをさらに含むことを特徴とする請求項5に記載の関心領域プロセッサ。
【請求項7】
保持時間対称性、ピーク頂点からの保持時間単調性、面積、体積、最大値、標準偏差、面積対称性比、質量/電荷対称性、前記ピーク頂点からの質量/電荷単調性、信頼度、周辺勾配、および接線体積比の少なくとも1つに基づいて選択された1つまたは複数の構成イメージの形状特性にスコア付けするように構成された形状スコアラをさらに含むことを特徴とする請求項2に記載の関心領域プロセッサ。
【請求項8】
形状スコアと相関スコアの少なくともいずれかを組み合わせるように構成されたスコアコンバイナをさらに含むことを特徴とする請求項2に記載の関心領域プロセッサ。
【請求項9】
関心対象の特徴を分類するようにスコアを格付けするように構成されたスコアクラシファイアをさらに含むことを特徴とする請求項8に記載の関心領域プロセッサ。
【請求項10】
関心領域を処理するための方法であって、
少なくとも2つの対応する関心領域の組を互いにマイクロ整列配置させ、各関心領域は、異なる構成イメージからであるステップと、
関心領域の一組に基づいて相関スコアを計算するステップと、
前記相関スコアにスコア付けするステップと
を含むことを特徴とする関心領域を処理するための方法。
【請求項11】
前記関心領域は、ピクセルアレイとして表され、各ピクセルは、少なくとも第1の座標値と第2の座標値、および輝度に関連付けられる方法であって、第1の次元がシリアル化された構成イメージの数を示し、第2の次元がシリアル化された輝度の数を示す2次元アレイを形成するように前記関心領域内のピクセルをシリアル化するステップをさらに含み、前記相関スコアは、前記シリアル化された輝度に基づいて計算されることを特徴とする請求項10に記載の方法。
【請求項12】
前記関心領域に関連する前記シリアル化された輝度は、対応する構成ベクトルを定義する方法であって、前記構成ベクトルに基づいて中心傾向を表すコンセンサスベクトルを計算し、前記コンセンサスベクトルは、算術平均または算術中央値として計算されるステップをさらに含むことを特徴とする請求項11に記載の方法。
【請求項13】
前記構成イメージは、クロマトグラフィ/質量スペクトルメトリイメージであることを特徴とする請求項12に記載の方法。
【請求項14】
各クロマトグラフィ保持時間に関して複数の質量対電荷比に関連するピクセル輝度を組み合わせることによって、集約されたクロマトグラムを生成するステップをさらに含むことを特徴とする請求項13に記載の方法。
【請求項15】
一般的なランダムな順序に基づいて、前記ピクセルアレイをシリアル化するステップをさらに含むことを特徴とする請求項13に記載の方法。
【請求項16】
各質量対電荷比に関して複数の保持時間に関するピクセル輝度を組み合わせることによって、集約された質量スペクトログラムを生成するステップをさらに含むことを特徴とする請求項13に記載の方法。
【請求項17】
コンピューター可読媒体であって、
少なくとも2つの関心領域の一組を互いにマイクロ整列配置させ、各関心領域は異なる構成イメージからであるステップと、
前記関心領域内のマスクされたピクセルに関する相関スコアを計算し、前記相関スコアは、前記関心領域内の変動の信頼性を示すステップと
を含む、多次元分離に関連する構成イメージにおける関心領域を処理するための方法を実施するためのコンピューター実行可能命令を格納していることを特徴とするコンピューター可読媒体。
【請求項18】
各関心領域の幅を、選択された幅拡大率だけ、保持時間次元において逆方向および順方向で拡大するステップをさらに含むことを特徴とする請求項17に記載のコンピューター可読媒体。
【請求項19】
前記方法は、関心領域のマイクロ整列配列のためのマスタスニペットを同定するステップをさらに含むことを特徴とする請求項18に記載のコンピューター可読媒体。
【請求項20】
正規化された相互相関最大値、線形相関係数最大値、および正規化された最小二乗差最小値から成るグループから選択されたメトリックを使用して相関をもたらすシフト量を決定するステップをさらに含むことを特徴とする請求項18に記載のコンピューター可読媒体。
【請求項21】
前記方法は、相関ベースのシフト量が利用可能でないことを特定し、さらに重心整列配置または適応整列配置に基づいてマイクロ整列配置を行うステップをさらに含むことを特徴とする請求項17に記載のコンピューター可読媒体。
【請求項22】
前記方法は、帰無仮説試験に基づいて線形相関に関連する相関スコアを計算するステップをさらに含むことを特徴とする請求項17に記載のコンピューター可読媒体。
【請求項1】
関心領域プロセッサであって、
少なくとも2つの構成イメージの一組における関心領域を選択するように構成されたデータセレクタと、
前記選択された関心領域を整列配置させるように構成されたマイクロアライナと、
前記マイクロ整列配置させられた関心領域に基づいて評価スコアを生成するように構成されたイバリュエータと
を含むことを特徴とする関心領域プロセッサ。
【請求項2】
前記イバリュエータは、前記マイクロ整列させられた関心領域に基づいて相関スコアを生成するように構成された相関イバリュエータであり、前記相関スコアは、前記関心領域内の一般的な変動の信頼性に関連することを特徴とする請求項1に記載の関心領域プロセッサ。
【請求項3】
前記イバリュエータは、前記マイクロ整列させられた関心領域の形状特性にスコア付けするように構成された形状スコアラであることを特徴とする請求項1に記載の関心領域プロセッサ。
【請求項4】
前記データセレクタは、単一の処置条件、単一の生物学的変異、複数の処置条件、および複数の生物学的変異に関連するクロマトグラフィ/質量スペクトルメトリイメージから成るグループから構成イメージの一組を選択するように構成されることを特徴とする請求項2に記載の関心領域プロセッサ。
【請求項5】
前記マイクロ整列させられた関心領域の境界を再定義するように構成された関心領域検出器をさらに含むことを特徴とする請求項2に記載の関心領域プロセッサ。
【請求項6】
2次元マスクを生成し、前記2次元マスクに基づいて再定義された関心領域をもたらすように構成されたデータエクストラクタをさらに含むことを特徴とする請求項5に記載の関心領域プロセッサ。
【請求項7】
保持時間対称性、ピーク頂点からの保持時間単調性、面積、体積、最大値、標準偏差、面積対称性比、質量/電荷対称性、前記ピーク頂点からの質量/電荷単調性、信頼度、周辺勾配、および接線体積比の少なくとも1つに基づいて選択された1つまたは複数の構成イメージの形状特性にスコア付けするように構成された形状スコアラをさらに含むことを特徴とする請求項2に記載の関心領域プロセッサ。
【請求項8】
形状スコアと相関スコアの少なくともいずれかを組み合わせるように構成されたスコアコンバイナをさらに含むことを特徴とする請求項2に記載の関心領域プロセッサ。
【請求項9】
関心対象の特徴を分類するようにスコアを格付けするように構成されたスコアクラシファイアをさらに含むことを特徴とする請求項8に記載の関心領域プロセッサ。
【請求項10】
関心領域を処理するための方法であって、
少なくとも2つの対応する関心領域の組を互いにマイクロ整列配置させ、各関心領域は、異なる構成イメージからであるステップと、
関心領域の一組に基づいて相関スコアを計算するステップと、
前記相関スコアにスコア付けするステップと
を含むことを特徴とする関心領域を処理するための方法。
【請求項11】
前記関心領域は、ピクセルアレイとして表され、各ピクセルは、少なくとも第1の座標値と第2の座標値、および輝度に関連付けられる方法であって、第1の次元がシリアル化された構成イメージの数を示し、第2の次元がシリアル化された輝度の数を示す2次元アレイを形成するように前記関心領域内のピクセルをシリアル化するステップをさらに含み、前記相関スコアは、前記シリアル化された輝度に基づいて計算されることを特徴とする請求項10に記載の方法。
【請求項12】
前記関心領域に関連する前記シリアル化された輝度は、対応する構成ベクトルを定義する方法であって、前記構成ベクトルに基づいて中心傾向を表すコンセンサスベクトルを計算し、前記コンセンサスベクトルは、算術平均または算術中央値として計算されるステップをさらに含むことを特徴とする請求項11に記載の方法。
【請求項13】
前記構成イメージは、クロマトグラフィ/質量スペクトルメトリイメージであることを特徴とする請求項12に記載の方法。
【請求項14】
各クロマトグラフィ保持時間に関して複数の質量対電荷比に関連するピクセル輝度を組み合わせることによって、集約されたクロマトグラムを生成するステップをさらに含むことを特徴とする請求項13に記載の方法。
【請求項15】
一般的なランダムな順序に基づいて、前記ピクセルアレイをシリアル化するステップをさらに含むことを特徴とする請求項13に記載の方法。
【請求項16】
各質量対電荷比に関して複数の保持時間に関するピクセル輝度を組み合わせることによって、集約された質量スペクトログラムを生成するステップをさらに含むことを特徴とする請求項13に記載の方法。
【請求項17】
コンピューター可読媒体であって、
少なくとも2つの関心領域の一組を互いにマイクロ整列配置させ、各関心領域は異なる構成イメージからであるステップと、
前記関心領域内のマスクされたピクセルに関する相関スコアを計算し、前記相関スコアは、前記関心領域内の変動の信頼性を示すステップと
を含む、多次元分離に関連する構成イメージにおける関心領域を処理するための方法を実施するためのコンピューター実行可能命令を格納していることを特徴とするコンピューター可読媒体。
【請求項18】
各関心領域の幅を、選択された幅拡大率だけ、保持時間次元において逆方向および順方向で拡大するステップをさらに含むことを特徴とする請求項17に記載のコンピューター可読媒体。
【請求項19】
前記方法は、関心領域のマイクロ整列配列のためのマスタスニペットを同定するステップをさらに含むことを特徴とする請求項18に記載のコンピューター可読媒体。
【請求項20】
正規化された相互相関最大値、線形相関係数最大値、および正規化された最小二乗差最小値から成るグループから選択されたメトリックを使用して相関をもたらすシフト量を決定するステップをさらに含むことを特徴とする請求項18に記載のコンピューター可読媒体。
【請求項21】
前記方法は、相関ベースのシフト量が利用可能でないことを特定し、さらに重心整列配置または適応整列配置に基づいてマイクロ整列配置を行うステップをさらに含むことを特徴とする請求項17に記載のコンピューター可読媒体。
【請求項22】
前記方法は、帰無仮説試験に基づいて線形相関に関連する相関スコアを計算するステップをさらに含むことを特徴とする請求項17に記載のコンピューター可読媒体。
【図1】
【図2】
【図3−1】
【図3−2】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13A】
【図13B】
【図13C】
【図13D】
【図13E】
【図13F】
【図13G】
【図13H】
【図13I1】
【図13I2】
【図13J】
【図13K】
【図13L】
【図13M】
【図13N−1】
【図13N−2】
【図13O】
【図13P】
【図13Q】
【図13R】
【図13S】
【図13T】
【図13U】
【図13V】
【図13W】
【図13X】
【図13Y】
【図14A】
【図14B】
【図14C】
【図14D】
【図14E】
【図14F】
【図14G】
【図14H】
【図14I】
【図14J】
【図14K】
【図14L】
【図14M】
【図14N】
【図14O】
【図14P】
【図14Q】
【図14R】
【図14S】
【図15】
【図16A】
【図16B】
【図16C】
【図16D】
【図16E】
【図16F】
【図17】
【図18】
【図2】
【図3−1】
【図3−2】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13A】
【図13B】
【図13C】
【図13D】
【図13E】
【図13F】
【図13G】
【図13H】
【図13I1】
【図13I2】
【図13J】
【図13K】
【図13L】
【図13M】
【図13N−1】
【図13N−2】
【図13O】
【図13P】
【図13Q】
【図13R】
【図13S】
【図13T】
【図13U】
【図13V】
【図13W】
【図13X】
【図13Y】
【図14A】
【図14B】
【図14C】
【図14D】
【図14E】
【図14F】
【図14G】
【図14H】
【図14I】
【図14J】
【図14K】
【図14L】
【図14M】
【図14N】
【図14O】
【図14P】
【図14Q】
【図14R】
【図14S】
【図15】
【図16A】
【図16B】
【図16C】
【図16D】
【図16E】
【図16F】
【図17】
【図18】
【公開番号】特開2010−117351(P2010−117351A)
【公開日】平成22年5月27日(2010.5.27)
【国際特許分類】
【外国語出願】
【出願番号】特願2009−244695(P2009−244695)
【出願日】平成21年10月23日(2009.10.23)
【出願人】(500046438)マイクロソフト コーポレーション (3,165)
【Fターム(参考)】
【公開日】平成22年5月27日(2010.5.27)
【国際特許分類】
【出願番号】特願2009−244695(P2009−244695)
【出願日】平成21年10月23日(2009.10.23)
【出願人】(500046438)マイクロソフト コーポレーション (3,165)
【Fターム(参考)】
[ Back to top ]