説明

独立成分画像化

本発明は、情報インデックス部分空間についての混合した観察から部分的に独立および/またはガウス様ソースを盲目的に分離するための部分独立成分解析(PICA)技法を記載し、これは、独立成分画像化において種々の適用を可能にする。本発明は、独立および/または非ガウス部分の観察のみを用いて脱混合マトリクスを推定する。詳細には、大きな分離エラーを生じるすべてのデータポイントを用いるよりもむしろ、データポイントのサブセットを同定して、そのためこのようなサブセットについて定義した部分ソースプロファイルは、統計学的に独立および/または非ガウス型である。本発明は、このような技法の完全な実行を記載し、その工程およびパラメータは、情報理論に基づく神経計算アルゴリズムを用いて達成および推定され得る。本発明はまた、制御された場合および現実世界の問題の両方におけるアプローチの原理を証明し、そしてこのような技法の多くの拡張した適用を記載する。

【発明の詳細な説明】
【技術分野】
【0001】
関連出願の前後参照
本出願は、2002年2月25日に出願された「独立成分画像化」という題の米国仮特許出願第60/358,891号に関連する。上記出願の全体の開示および内容は、本明細書に参考として援用される。
【0002】
技術分野
本発明は、一般的に、統計シグナルプロセシングおよびその画像化への適用に関し、そしてより詳しくは、混合した観察からの独立成分画像化のための方法および/または関連の装置に関する。
【背景技術】
【0003】
スポット化cDNAマイクロアレイは、遺伝子発現の大スケール解析のための強力な新しいツールに有望である。この技術を用いて、組織試料由来の相対的mRNA発現レベルが、数千の遺伝子について同時にアッセイされ得る。このような包括的な検討は、遺伝子調節のこれまでに認識されていないパターンを明らかにするようであり、そしてJ. Khan、J.S. Wei、M. Ringner、L.H. Saal、M. Lananyi、F. Westermann、F. Berthold、M. Schwab、C.R. Antonescu、C. Peterson、およびP.S. Meltzer、「Classification and diagnostics prediction of cancers using gene expression profiling and artificial neural networks」、Nature Medicine、7巻、6号、673-679頁、2000年6月[以下、Khanらという];およびT.R. Golub、D.K. Slonim、P. Tamayo、C. Huard、M. Gaasenbeek、J.P. Mesirov、H. Coller、M.L. Loh、J.R. Downing、M.A. Caligiuri、C.D. Bloomfield、およびE.S. Lander、「Molecular classification of cancer: class discovery and class prediction by gene expression monitoring」、Science、286巻、531-537頁、1999年10月[以下、Golubらという](これらの全体の内容および開示は本明細書に参照として援用される)によって示されるようなさらなる研究を保証する新しい仮説を作り出す。一方、分子ターゲットしたコントラスト剤、リガンド、および画像化プローブの開発に顕著な進歩があった。このような画像化能力は、Z. Szabo、P.F. Kao、W.B. Mathews、H.T. Ravert、J.L. Musachio、U. Scheffel、およびR.F. Dannals、「Positron emission tomography of 5HT reuptake sites in the human brain with C11McN5652 extraction of characteristic images by artificial neural network analysis」、Behavioural Brain Research、73巻、221-224頁、1996年[以下、Szaboらという];ならびにL. Cinotti、J.P. Bazin、R. DiPaola、H. Susskind、およびA.B. Brill、「Processing of Xe127 regional pulmonary ventilation by factor analysis and compartmental modeling」、IEEE Trans. Med. Imaging、10巻、3号、437-444頁(1991年)(これらの全体の内容および開示は本明細書に参照として援用される)によって示されるように、生きている組織における重要な疾患を引き起こす生理学的および分子プロセスの可視化および解明を可能にし得る。
【0004】
分子画像化における主な障害の1つは、臨床的にセットしているソースに由来する情報の意味を取りそして解釈する能力である。例えば、固形腫瘍の場合、チャレンジの1つは、部分体積効果、すなわち、KhanらおよびGolubらに示されるように、間質夾雑によって生じる腫瘍試料内の不均質性である。マイクロアレイ発現およびデータ解析の盲目的な適用により、基礎の腫瘍生物学よりもむしろ、試料中の間質夾雑の割合を反映する徴候を抽出することになり得た。間質細胞における遺伝子発現を排除する効果的な計算ツールが非常に所望される。さらに、脳において神経トランスポーターを画像化するには、血液脳関門を通過する高脂溶性の放射性リガンドの経路が必要である。しかし、脂溶性は、白質において高い非特異的結合性および保持の危険性を有し、そしてSzaboらによって示されるように、特異的認識部位への結合を測定するために使用される推定キネティックパラメータの偏在を生じ得る。混合した結合の分離は、比較研究において特異的結合部位の真の分布を見出すために重要である。
【発明の開示】
【発明が解決しようとする課題】
【0005】
アルゴリズム方法論が存在し、例えば、主として数学的理論である独立成分解析(ICA)、および公衆に利用可能なICA原理の神経ネットワーク導入であるFastICAアルゴリズム、ならびにこれらの方法論のいくつかの改変が挙げられる。しかし、現実世界の問題に対するICA/FastICA技法の適用には制限がある。基本的な方法論は、基礎のソースが非ガウス分布とは完全に統計学的におよび互いに独立でなければならないような、重要な制限を受け、これは、ほとんどの現実世界の状況で達成することは困難である。したがって、このような制限に関してのICA方法論の改善および独立成分画像化に対するこのような改善した技術の拡大した適用の必要がある。
【課題を解決するための手段】
【0006】
したがって、本発明の目的は、部分独立成分解析に対する統計学的に理に適った神経計算アプローチ/アルゴリズムを提供することである。
【0007】
本発明のさらなる目的は、独立成分画像化へのこのような部分独立成分解析アプローチを提供することである。
【0008】
本発明のさらなる目的は、独立成分画像化のために部分独立成分解析を行うための装置を提供することである。
【0009】
本発明のさらなる目的は、ソースの観察を定義するインデックス部分空間を同定するためのインデックス選択方法および装置を提供することであり、ここでは、このようなインデックス部分空間について、ソースシグナル/画像が独立であるか、または少なくとも元のシグナル/画像よりも独立である。
【0010】
本発明のさらなる目的は、ソースの観察を定義するインデックス部分空間を同定するためのインデックス選択方法および装置を提供することであり、ここでは、このようなインデックス部分空間について、ソースシグナル/画像が非ガウス型であるか、または少なくとも元のシグナル/画像よりもガウス型ではない。
【0011】
本発明のさらなる目的は、ソース間の独立性および/または非ガウス性への各インデックスの寄与を測定するために、散乱プロット(すなわち、ソース試料の同時分布)についての線形および/または非線形の回帰/相関解析を提供することである。
【0012】
本発明のさらなる目的は、ソース間の独立性および/または非ガウス性への各インデックスの寄与を測定するために、散乱プロット(すなわち、ソース試料の同時分布)についての線形および/または非線形の回帰/相関解析を行うための装置を提供することである。
【0013】
本発明のさらなる目的は、多重認識を用いてソース間の独立性への各インデックスの寄与を測定するために、加重フィッシャー基準に基づくクラスター解析(すなわち、可分性)による線形および/または非線形の回帰/相関解析を提供することである。
【0014】
本発明のさらなる目的は、多重認識を用いてソース間の独立性への各インデックスの寄与を測定するために、加重フィッシャー基準に基づくクラスター解析(すなわち、可分性)による線形および/または非線形の回帰/相関解析を行うための装置を提供することである。
【0015】
本発明のさらなる目的は、従来のICA(すなわち、再スケーリングおよび順列)に付随する曖昧な問題を解決し得る反復標準化方法および装置を提供することである。
【0016】
本発明のさらなる目的は、マイクロアレイ発現研究(mRNAおよびタンパク質)において、ICAおよび/またはPICA方法を部分体積修正に適用することである。
【0017】
本発明のさらなる目的は、ダイナミック陽電子放射トモグラフィー研究において、ICAおよび/またはPICA方法を結合分離に適用することである。
【0018】
本発明のさらなる目的は、単一または多数の画像化プローブが用いられる陽電子放射トモグラフィーおよび磁気共鳴画像化によるレセプター画像化において、ICAおよび/またはPICA方法を結合分離に適用することである。
【0019】
本発明のさらなる目的は、単一または多数の画像化プローブが用いられる陽電子放射トモグラフィーおよび光学画像化による遺伝子発現画像化において、ICAおよび/またはPICA方法をシグナル分離に適用することである。
【0020】
本発明のさらなる目的は、多重エネルギーX線によるおよび/または多重分光投影超音波による解剖学的画像化において、ICAおよび/またはPICA方法をシグナル分離に適用することである。
【0021】
本発明のさらなる目的は、遺伝子発現のタイムコースに基づく遺伝子調節研究(すなわち、調節ネットワーク、経路発見)において、ICAおよび/またはPICA方法を基本的因子抽出に適用することである。
【0022】
本発明のさらなる目的は、同じ被験物の画像がある時間にわたって撮られる現在および将来の画像化研究において、ICAおよび/またはPICA方法を変化検出および解析に適用することである。
【0023】
本発明のさらなる目的は、検出したシグナルがいくつかの基礎のソースの混合物である現在および将来の解剖、機能、および分子画像化において、ICAおよび/またはPICA方法をシグナル分離に適用することである。
【0024】
本発明の第1の広い局面によれば、画像を解析する方法が提供され、この方法は、観察のディジタル画像を獲得する工程であって、該ディジタル画像が観察データである、工程;該観察データをベクトル化して観察ベクトルx(i)を生成する工程;脱混合マトリクスWを決定する工程;出力ベクトルy(i)=Wx(i)を決定する工程;ソースベクトルS(i)を回復する工程であって、S(i)=y(i)である、工程;および該ソースベクトルS(i)を利用して該画像を解析する工程を含む。
【0025】
本発明の第2の広い局面によれば、画像を解析するための装置が提供され、この装置は、観察のディジタル画像を獲得するための手段であって、該ディジタル画像が観察データである、手段;該観察データをベクトル化して観察ベクトルx(i)を生成するための手段;脱混合マトリクスWを決定するための手段;出力ベクトルy(i)=Wx(i)を決定するための手段;ソースベクトルS(i)を回復するための手段であって、S(i)=y(i)である、手段;および該ソースベクトルS(i)を利用して該画像を解析するための手段を含む。
【0026】
本発明の第3の広い局面によれば、画像を解析するための装置が提供され、この装置は、(A)観察のディジタル画像を獲得するための手段であって、該データ画像が観察データである、手段;(B)該観察データをベクトル化して観察ベクトルx(i)を生成するための手段;(C)脱混合マトリクスWを決定するための手段であって、該脱混合マトリクスが(1)観察データを中央に置いてその平均をゼロにする手段であって、ここでC=E[xx]である、手段;(2)最初の脱混合マトリクスWを選択するための手段;(3)k=1、・・・mについて、y=Wx、β=−E[yg(y)]、α=−(β+E[g'(y)])−1を計算する手段;(4)W+diag(α)(diag(β)+E[(g)(y)(y)])WによってWを更新するための手段;および(5)W←(WCW)-1/2Wによって非相関化および標準化するための手段を含む装置を用いることによって決定される、手段;(D)出力ベクトルy(i)=Wx(i)を決定するための手段であって、該出力ベクトルが、(1)j=0についてFに関してFastICAによってy(j)=W(j)xを推定するための手段;(2)次の式
【0027】
【数1】

【0028】
に従ってインデックス部分空間Iを同定するための手段;(3)Iに関してFastICAによってy(i+1)=W(j+1)(j)を推定するための手段;および(4)F−Iに関してy(i+1)=W(j+1)(j)を計算するための手段を含む装置によって決定される、手段;(E)ソースベクトルS(i)を回復するための手段であって、ここでS(i)=y(∞)である、手段;および(F)該ソースベクトルS(i)を利用して該画像を解析するための手段を備える。
【0029】
本発明の他の目的および特徴は、好適な実施態様の以下の詳細な説明から明らかである。
【発明を実施するための最良の形態】
【0030】
本発明は、例としての添付の図面と共に説明される。
【0031】
本発明を説明する前に、いくつかの用語を定義することが好都合である。以下の定義が本出願全体を通して使用されることが理解されるべきである。
【0032】
定義
用語の定義が通常用いられる用語の意味から逸脱する場合、出願人は、特に指示がない限り、以下に提供される定義を利用することを意図する。
【0033】
本発明の目的では、用語「独立成分解析(ICA)」とは、混合したシグナルから隠れたソースを分離するための統計学的および/または神経計算技法をいう。
【0034】
本発明の目的では、用語「独立成分画像化(ICI)」とは、混合した多次元(一次元を含む)シグナルからの隠れたソースを分離するための統計学的および/または神経計算技法をいう。代替の用語は「独立成分再構成」である。
【0035】
本発明の目的では、用語「部分独立成分解析(PICA)」とは、ソースが少なくとも一部は統計学的におよび互いに独立である(すなわち、ソースが統計学的におよび互いに独立であるソース観察を定義するインデックス部分空間が存在する)ことのみが必要である混合したシグナルから隠れたソースを分離するための統計学的および/または神経計算技法をいう。
【0036】
本発明の目的では、用語「Fast独立成分解析(FastICA)」とは、基本ICAモデルを推定する効率的な計算アルゴリズムの群をいう。
【0037】
本発明の目的では、用語「Fast部分独立成分解析(FastPICA)」とは、FastICAの延長として、部分ICAモデルを推定する効率的な計算アルゴリズムの群をいう。
【0038】
本発明の目的では、用語「陽電子放射トモグラフィー(PET)」とは、生理学的プロセスまたは分子事象を画像化するために陽電子を放射する放射性同位元素で標識したリガンドまたは基質を使用するトモグラフィーの画像化技法をいう。
【0039】
本発明の目的では、用語「主成分解析(PCA)」とは、データセットの主成分を抽出することを目的とする統計学的データ解析方法をいう。
【0040】
本発明の目的では、用語「因子解析(FA)」とは、混合したシグナルから隠れた因子を抽出することを目的とする統計学的データ解析方法をいう。
【0041】
本発明の目的では、用語「部分体積修正(PVC)」とは、間質細胞において遺伝子発現プロファイルを排除する特異的に設計された計算解析ツールをいう。
【0042】
本発明の目的では、用語「ブラインド部分独立ソース分離(BPISS)」とは、ソースおよび混合モデルについての何らの事前知識なしに、ソースが少なくとも一部は統計学的におよび互いに独立でなければならない(すなわち、ソースが統計学的におよび互いに独立であるソース観察を定義するインデックス部分空間が存在する)ことのみが必要である、混合したシグナルから隠れたソースを分離するための統計学的および/または神経計算技法をいう。
【0043】
本発明の目的では、用語「画像を解析する」とは、画像の成分が目標を定めた適用領域(例えば、癌の分子分類、画像に基づく診断など)における使用のために分離されるプロセスをいう。
【0044】
説明
本発明は、一般的に、情報部分空間についての複合観察に基づく部分独立成分画像化のための方法および装置を記載する。脱混合マトリクスは、画像化中に収集したデータポイントの全体のセットから同定および分離される観察の独立および/または非ガウス部分に由来する。この技法は、強力であり、そしてデータがマルチプローブ、マルチスペクトル、マルチキネティック、およびマルチエネルギープロセスを用いて獲得される場合に複合記号画像化が実現され得る新しい画像化パラダイムを約束する。本発明の方法はまた、因子画像が収集したすべてのデータポイントを用いて、次いで従来の独立成分解析を用いて生成される場合に生じる大きな分離エラーを回避する。
【0045】
特に、本発明は、独立成分画像化への神経計算アプローチを記載する。本発明の1つの好ましい実施態様は、情報インデックス部分空間について盲目的に混合した画像ソースを分離する。パターンの回復は、独立成分解析によって達成され得、そのパラメータは、インフォマクス原理を用いて推定され得る。本発明はまた、例えば、cDNAマイクロアレイ発現における部分体積修正および陽電子放射トモグラフィーにおける神経トランスポーター結合分離への、アプローチおよびその適用の理論上のロードマップを使用させる。
【0046】
胸部X線用の二重エネルギーを含む従来の画像化方法は、Wataru Itoら、「Improvement of Detection in Computed Radiography by New Single-Exposure Dual-Energy Subtraction」、Medical Imaging VI: Image Processing、1652巻、386-96 (1992)(この全体の内容および開示は本明細書に参考として援用される)に議論されている。エネルギーサブトラクションプロセシングによって画像を得るために、単一曝露方法または二重曝露方法のいずれかを使用し得る。単一曝露方法は、1回の曝露では体の動きによる誤登録を生じないので有利である。X線エネルギーは、2つの画像化プレート間の金属フィルターの挿入によって分離される。単一曝露方法では、完全なスペクトルエネルギー画像が、金属フィルターの前面の第1の画像化プレート(IP)上に記録され、そして高エネルギー画像が、フィルターの反対側の第2のIP上に記録される。したがって、高エネルギー画像は、あまりコントラストを示さない。
【0047】
このような従来の方法を用いると、種々の組織および骨は、X線について異なる吸収特徴を有する。検出器は、対象物のタイプおよび曝露時間の関数である光子の数を検出する。画像は、X線によって生成され、そしてそのそれぞれの強度は、画像プレートで受けたX線の関数である。フィルム自体は、受けた光子に対して非線形応答である。上記の状況は、次の方程式によって示され得る:Det=f(タイプ;曝露時間);強度=g(Det)。
【0048】
実際、フィルムの強度(観察)と対象物のタイプ(ターゲット)との間のいくつかの関係を確立する上記のプロセシングパラメータについての情報を集めるために、ファントムが用いられ得る。H&D曲線(光学密度に対するX線曝露)が生成されて、ターゲットと観察との間の関係を見出す。
【0049】
従来の方法は2つの工程を含む。第1に、画像化システムの物理的ファントム測定を用いて脱混合マトリクスを決定する。第1の工程は、数学的に行われない。第2に、数学的方法を用いてノイズを減少させる。第2のノイズ減少工程は、従来の方法では必須である。
【0050】
本発明がこの第1の工程で数学的計算を使用しそしてノイズ減少が結果を損なうことなく省略され得る点で、本発明はこのような従来の方法とは異なる。例えば、第1の工程が各患者または被験体に採用されなくてもよく、これがコストおよび時間を節約しそして効率を上昇させるので、本発明は従来の方法よりも有利である。
【0051】
本発明は、独立成分解析(ICA)の使用を包含し、これは、A. Hyvarinen、J. Karhunen、およびE. Oja、Independent Component Analysis、New York: John Wiley (2001)(その全体の内容および開示は参考として本明細書に援用される)に議論されるように、混合したシグナルから隠れたソースを分離するための統計学的および神経計算技法である。ICAは、一般的に、観察した多変量データについての生成モデルを定義し、ここでデータ変量は、いくつかの未知の潜在性変量の混合物であり、そして混合するシステムも未知であると仮定され得る。潜在性変量が非ガウス型でありそして互いに独立である場合、S. Haykin、Neural Networks: A Comprehensive Foundation、第2版、New Jersey: Prentice-Hall (1999)(この全体の内容および開示は参考として本明細書に援用される)によって示されるように、これらの独立成分は、ICAによって見出され得る。
【0052】
本発明の方法はまた、ガウス型ソースに有用であり得、これは従来のICAのもう1つの制限;すなわち、ソースが非ガウス型でなければならないこと;を緩和する。
【0053】
ICAを厳密に記載するために、ランダムソースベクトルは、以下のように定義され得る:
s(i)=[s1(i),s2(i),・・・,sm(i)]、ここで、m成分は、統計学的に互いに独立の非ガウス型ソースによって供給され得る。ベクトルs(i)は、入力−出力特徴が、混合マトリクスとも呼ばれる非特異m×mマトリクスAによって定義され得る、線形システムに適用され得る。結果は、以下の方程式1で示すようにs(i)に関連するm×1観察ベクトルx(i)=[x1(i),x2(i),・・・,xm(i)]であり得る:
【0054】
x(i)=As(i) 方程式1
【0055】
これは、観察したデータが潜在性成分を混合するプロセスによってどのように生じ得るかを説明する。
【0056】
ソースベクトルs(i)および混合マトリクスAは、両方とも未知であり得る。おそらく、観察ベクトルx(i)は公知であり得る。x(i)が与えられると、タスクは脱混合マトリクスWを見出すことであり、そのため、元のソースベクトルs(i)は、以下の方程式2に示すように、出力ベクトルy(i)から回復され得る:
【0057】
y(i)=Wx(i) 方程式2
【0058】
ここで、ソースシグナルs(i)、観察ベクトルx(i)、および脱混合シグナルy(i)は、情報インデックス空間i=1,2,・・・,nについてすべてゼロ平均シグナルであり得る。ブラインドソース問題は、以下のように示され得る:「観察ベクトルx(i)のn独立実現が与えられると、混合マトリクスAの逆数の推算値を見出す」。
【0059】
この管理されない学習問題の解決は、インデックスの各シグナル成分および順列の任意のスケーリングを除いては、ICAによって実行され得る。言い換えれば、個々の列が混合マトリクスAのインデックスの再スケーリングおよび順列である、脱混合マトリクスWを見出すことが可能であり得る。ICAは、主成分解析(PCA)または因子解析(FA)の拡張として見なされ得る。PCA/FAは、方向ベクトルを直交性を拘束しながら独立性を二次まで強制するのみであり得るが、ICAは、出力ベクトルの個々の成分において統計的独立性を強制しそして直交拘束はない。ICAは、特別な状況では、古典的方法が完全にできない場合に基礎のソースを見出すことが可能であり得る。
【0060】
非ガウス性の最大化および最大の可能性を含むICAのモデルを推定するためのいくつかの方法が存在し得る。ほとんどの推定原理および対象の関数は、少なくとも理論においては等価である。情報理論によって示唆されると、ICA推定についての整然としたおよびさらに厳密なフレームワークは、インフォマクス原理のユーティリティであり得る。これは、以下の方程式3で示すように、神経ネットワークの出力エントロピーを最大化することに基づき得る:
【0061】
【数2】

【0062】
ここで、I(.)は、統計学的依存性の十分に動機付けされた情報理論の尺度である、相互情報を示す。このような出力エントロピーを最大化することが、入力xと出力yとの間の相互情報(すなわち、情報フロー)を最大化すること、その可能性の予測を最大化すること、およびm出力変量間の相互情報を最小化することと等価であることが示され得る。FastICAアルゴリズムが開発されており、そして以下のように要約される:
【0063】
1.データを中央に置いてその平均をゼロおよびC=E[xx]にする;
2.最初の脱混合マトリクスWを選択する;
3.k=1、・・・mについて、y=Wx、β=−E[yg(y)]、α=−(β+E[g'(y)])−1を計算する;
4.W+diag(α)(diag(β)+E[(g)(y)(y)])WによってWを更新する;
5.W←(WCW)-1/2Wによって非相関化および標準化する;および
6.収束しないならば、工程3に戻る、
【0064】
ここで、非線形関数gは、tanh関数であり得、そして予測は試料平均であり得る。
【0065】
マイクロアレイ発現における部分体積修正
cDNAマイクロアレイを用いる遺伝子発現プロファイリングに基づいて、各試料の表示を、各軸が1遺伝子の発現レベルを示すd次元遺伝子発現空間におけるポイントとして記載する。多重アレイからの測定を用いる発現データの比較を行う場合、データを標準化することの質問が生じ、そしてm試料における各遺伝子の発現レベルは、Y. Wang、J. Lu、R. Lee、Z. Gu、およびR. Clarke、「Iterative normalization of cDNA microarray data」、IEEE Trans. Info. Tech. Biomed.、6巻、1号(2002年3月)(この全体の内容および開示は参考として本明細書に援用される)に示されるように、m次元空間におけるポイントを定義すると見なされる。上記のように、バイオプシー試料は、インビボで腫瘍増殖の遺伝子発現パターンを提供するが、これは、周囲の間質細胞の割合において全体の差異を有し得る。このような「夾雑」は、代表的には、生体医学の興味ではない。バイオプシー試料が悪性細胞および間質細胞の両方を含むという先験的知見に基づいて、本発明は、ICA技法を用いてこれらの2つのソースを分離することを提案する。
【0066】
情報インデックス空間F={i=1,・・・,n-1,n,n+1,・・・,d}について、s1(i)およびs2(i)を2つの組織ソース、すなわち悪性細胞および間質細胞によって供給される遺伝子iの発現レベルにする。結果は、以下の方程式4に示すように、遺伝子発現プロファイルに関連する2×1観察ベクトルである:
【0067】
x(i)=As(i) 方程式4
【0068】
ここで、x1(i)およびx2(i)は2つのバイオプシー試料に由来する遺伝子iの観察された混合発現レベルである。タスクは、混合マトリクスAの逆数を推定しそしてソースプロファイルs(i)を回復することである。これは、本明細書では部分体積修正(PVC)という。PVCは、観察の実現を生じる種々の位置から取った組織試料が、ソースの種々の混合物を有する点で、主として空間多様度を利用する。
【0069】
しかし、従来技術のICA技法のPVCへの直接適用は、しばしばs(i)の不満足な回復を導く。ソースプロファイルs(i)またはそれらの最初の推定値y(0)(i)の同時分布でのより接近した外観により、これらがFについて統計学的に独立ではなく、したがって基本的ICAモデルがもはや保持されないことが決定されている。これは、驚くべきことではない。なぜなら、分子生物学によって示唆される合理的な仮定では、ほとんどの遺伝子の発現レベルは種々の表現型にわたってほとんどの状況について変化しないと予測され、そして標準化はこれらの定常発現した遺伝子に基づいて行われるからである。このようなサブセットについて定義された部分ソースプロファイルはより独立であり、そしてそれらの周辺密度は、それらの元のソースプロファイルおよびFについて定義された密度よりも、ガウス型密度とはかなり離れているので、良好なソース分離は、分化発現した遺伝子のサブセットを用いて達成され得る。
【0070】
本発明は、PVCに対して部分ICA(PICA)技法を使用する。大きな分離エラーを生じる遺伝子をすべて使用するよりも、本発明は、分化発現した遺伝子のみからなりそして混合した発現プロファイルを分離するための情報インデックス部分空間I={i=1,・・・,n-1,n}を反復して同定することを試みる。PICA技法は、情報インデックス部分空間Iを定義しているy(0)(i)(またはx(i))の分散プロット(すなわち、同時分布)について幾何学的基準を構築することによって提供され得る。詳細には、遺伝子iは、2つの試料にわたるその発現レベルが方程式5を満たすならば、Iのメンバーとして選択される:
【0071】
【数3】

【0072】
ここで、εは、先験的に決定した閾値であり、そして分離の性能はIに非常に依存する。良好なインデックス部分空間Iが同定され得る前に、Fについて定義された元のソースプロファイルは、合理的に推定される必要がある。推定は、結局、PICAによるPVCに対する分離の最終目標である。したがって、FastPICAアルゴリズムは、以下のようにまとめられ得る:
【0073】
1.j=0に対してFについてFastICAによってy(j)=W(j)xを推定する;
2.方程式5に従ってインデックス部分空間Iを同定する;
3.IについてFastICAによってy(i+1)=W(j+1)(j)を推定する;
4.F−Iについてy(i+1)=W(j+1)(j)を計算する;および
5.収束しないならば、工程2に戻る。
【0074】
図1は、遺伝子発現マイクロアレイプロファイリング、すなわちBSSにおける組織異種性修正へのPICAの独特の適用を示す。臨床設定では、ほとんどのニードルバイオプシーは、変異した細胞(例えば、癌細胞)および周囲の正常細胞(例えば、間質細胞)の両方を含む。マイクロアレイ遺伝子発現プロファイリングは、混合した細胞集団からシグナルを獲得し得る。このアプローチは、複合シグナルを盲目的に分解するための計算方法を使用し、したがって純粋な細胞集団の元の遺伝子発現プロファイルを回復し得る。
【0075】
本発明のインデックス選択スキームが、高次相関を考慮するために非線形(例えば、区分線形)回帰/相関解析を用いることによって拡張され得ることが理解されるべきであり、これは統計学的独立に等価であることが示され得る。
【0076】
PETにおける神経トランスポーター結合分離
近年、脳における神経トランスポーターを画像化するための全体の範囲の放射性リガンドが開発されている。C11McN+5652のようないくつかのリガンドは、そのターゲット(例えば、セロトニントランスポーター(SERT))に対して非常に感受性であるが、非特異的結合成分が顕著である。特異的結合部位の真の分布および関連するキネティックパラメータの推定は、多くの理由のため必須の工程である。タスクは、小脳、線条体、および大脳皮質のような結合部位での放射性リガンドの異なるキネティックスに基づいて混合された特異的および非特異的結合成分を分解することである。
【0077】
R.N. Gunn、Steve R. Gunn、およびV.J. Cunningham、「Positron emission tomography compartmental models」、J. Cerebral Blood Flow and Metabolism、21巻、6号、635-652頁 (2001)(この全体の内容および開示は参考として本明細書に援用される)に示されるように、コンパートメントモデルによって示唆されると、弛緩相の間の特異的結合C(t)および非特異的結合+遊離および捕捉されたリガンドCNS(t)は、以下の方程式6によって示されるように関連する:
【0078】
【数4】

【0079】
ここで、kは、循環に戻る非特異的結合部位からの放出であり、kは、特異的結合部位への結合であり、そしてkは、特異的結合部位からの放出である。このようなコンパートメント解析に関しては2つの主な潜在的な制限がある。第1は、キネティクス成分が、しばしば外部で検出されて、濃度の間違った測定になり得る。第2の問題は、空間情報の欠如に特異的である。したがって、異なるキネティクスを含む種々の領域は、測定において計算されるが、1つのピクセルから他のピクセルまでは未知の割合である。
【0080】
本発明は、以下の因子化された時間−空間関数として時間tおよびピクセルiでの特異的結合および非特異的結合活性を再定義する:C(t,i)=L(t)R(i)およびCNS(t,i)=LNS(t)RNS(i)、ここで、R(i)は、ピクセルiでのレセプター密度であり、そしてL(t)は、時間tでのリガンドアベイラビリティである。因子化した時間−空間コンパートメントモデルは、以下の方程式7に示される:
【0081】
【数5】

【0082】
ここで、L(t)R(i)およびLNS(t)RNS(i)は、それぞれ特異的および非特異的結合ポテンシャルと解釈される。このような線形状態方程式への解決が、以下で方程式8に示される以下の一般形態をとることが示され得る:
【0083】
【数6】

【0084】
ここで、H(t,t0)は、遷移マトリクスである。観察したPETシグナルx(t,t0)=C(t,i)+CNS(t,i)は、以下で方程式9で示すように表され:
【0085】
【数7】

【0086】
そしてコンパートメントモデリングおよび因子解析を明瞭に統一し、各因子(すなわち、基本キネティクス)h(t,t0)は、リガンドアベイラビリティの時間経過として解釈され、そして各因子画像(すなわち、因子重量)は、レセプター密度の空間分布として解釈される。
【0087】
ダイナミック観察x(t,i)に基づいて、反復した主成分解析によって因子および因子重量の両方を推定するために、因子解析が開発されてきた。しかし、再構築エラーを最小化する判断基準は、結合分離に関して最適以下である。なぜなら、このような判断基準は、二次までの因子画像の独立性を強制するのみであり得、そしてh(t,t0)のカラムベクトルを直角にさせ、むしろあまり全体分離を生じないからである。特異的および非特異的結合部位の空間パターンが統計学的に独立でありそして関連するファーマコキネティクスが時間について異なるが必ずしも直角にならないという先験的な知見に基づいて、本発明は、本明細書に記載のようにICA技法を用いて混合した結合成分を分離し得る。
【0088】
情報インデックス部分空間(すなわち、脳組織領域内)について、特異的および非特異的結合部位は、2つの統計学的に独立したソースとして定義される。結果は、以下で方程式10に示されるような結合部位密度に関連するm×1観察ベクトルである:
【0089】
【数8】

【0090】
ここで、結合分離は、観察の実現を生じる種々の時間について取った画像がソースの異なる混合物を有する点で、主として一時的多様性を利用し、そしてタスクは、ファーマコキネティクスマトリクスH(t,t0)の逆数を推定し、そして因子画像R(i)を回復することである。m>2なので、基本的従来技術のICAモデルはもはや保持されない。このような場合に混合物についてICAを行うことは、特別な注意が必要である。したがって、本発明は、このような必要条件を満たすスキームを提案する。
【0091】
本発明は、単一画像分離問題についてのFastPICA方法の性能を証明する。観察を、図2Aに示す2つのディジタル画像から生成した。それぞれは、独特のバックグラウンドおよび対象物パターン(すなわち、タイヤおよびコイン)および対応する分散プロットである。画像を、ランダムに生成した2×2非特異的マトリクスによって混合した。得られた画像を、対応する分散プロットとともに図2Bに示す。
【0092】
FastICAおよびFastPICAアルゴリズムの数回の実行についての実験を行い、それぞれは異なるランダム混合マトリクスである。図2Cおよび2Dは、代表的な結果を示す。この実験では、FastPICA方法の基本原理および有能な性質は、観察の独立部分のみを用いるFastPICA方法について明らかであり、図2Dでは2つの画像パターンをうまく分離し、これは図2CではFastICAによってうまく回復されていなかった。
【0093】
第2の実験は、現実のマイクロアレイ遺伝子発現についてのPVCにおけるFastPICAの効果を報告する。データセットは、神経芽細胞腫および非ホジキンリンパ腫細胞腫瘍の2つの試料からの2308の実際の遺伝子発現からなる。ソースおよび混合したシグナルを、それぞれ図3Aおよび3Bに示す。この場合、2つの遺伝子発現プロファイルは、ほとんどの遺伝子について明らかに依存的である。FastICAの最初の適用に基づいて、遺伝子選択を行い、続いてFastPICAを行う。
【0094】
元の2308遺伝子を、2つのクラス間の区別力によってランク付けし、そして上位の256遺伝子をFastPICA解析用に保持した。この結果を図3Cに示す。図3CのFastPICAによるブラインドソース分離は、図3Aの元のシグナルとほぼ完全に平行配置した。他の遺伝子セットを用いる多くの独立した試行は、同様の結果に達した。この技法の最適性はデータ依存的であり得るが、このような適用において、結果はこのFastPICA方法を非常に効果的なツールにする。
【0095】
図4は、ICA(中央)およびPICA(右)方法による脳(左)および再構成した因子画像(レセプターの空間分布)の観察したダイナミック陽電子放射トモグラフィー(PET)を示す。
【0096】
例えば、中心的な問題がノイズの減少である脳および癌研究のために多数の放射性リガンドを用いること、混合しているマトリクスを推定すること、および比較研究の標準化などの、独立成分画像化へのFastPICAのさらなる適用は、本発明の範囲内と意図される。
【0097】
ブラインド部分独立ソース分離(BPISS)をカバーする広い意味で、ICAおよび/またはPICAの両方のいくつかの他の適用が、以下のように考えられる。
【実施例】
【0098】
実施例I
本発明の方法または装置は、例えば、マイクロアレイ発現における部分体積修正、およびおそらく、機能的ゲノム解析における遺伝子発現、プロテオミクスにおけるタンパク質発現などのような、シグナルが混合または夾雑している場合の多くの他の生物工学/生体医学のシグナル抽出適用のために使用され得る。
【0099】
例えば、図5は、遺伝子発現マイクロアレイプロファイリングにおける組織異種性修正についてのPICA−BSSの結果を示す。左列は、精製した細胞株研究からのグラウンドトルースを示す。右列は、PICA−BSSを用いて回復したソースシグナルを示す。各行は、異なる数の分化発現した遺伝子を用いる分解結果に対応する。
【0100】
実施例II
多数のリガンド(すなわち、プローブ、コントラスト剤など)のファーマコキネティクスは、時間について種々の結合部位にと関連して種々の行動をとるので、本発明の方法は、ダイナミック画像化シーケンスから異なる結合部位(すなわち、レセプター、リポーターなど)を盲目的に分離するために、PET(機能的/分子画像化)について用いられ得る。本発明は、多重結合分離(すなわち、2成分より多い)を可能にするが、従来技術の方法である因子解析(FA)は、2成分のみ、すなわち、特異的および非特異的結合を分離するために使用されてきた。
【0101】
実施例III
本発明の方法は、ヒト身体の二重エネルギー(DualE)および多重エネルギー(MultiE)X線画像化に使用され得る。X線(ならびに多くの他の透過または発光エネルギー)は、軟組織、骨などのような種々の材料と相互作用する場合に、そのエネルギーレベルについて異なる吸収スペクトルを有するからである。獲得したシグナル/画像は、異なる成分の混合物である。このようなメカニズムは、本発明のICA/PICAモデルを満たす。
【0102】
実施例IV
図6に示すように、PICAの適用、すなわちBSSは、乳癌腫瘍の透過性パターン分解(例えば、微小血管の速い流れ対遅い流れ)を行うために用いられ得、そしてダイナミックコントラスト強調磁気共鳴画像で示され得る。この方法を用いて、3つの重要なパラメータ(血液容量、血管透過性、および血管潅流)が定量され得る。
【0103】
実施例V
図7に示すように、PICAに基づくBSSは、混合した試料から異なる細胞集団を分離するために使用され得る。混合した2つの細胞集団を左に、そして分離した細胞集団を右に示す。
【0104】
本発明の方法はまた、防御/保安画像化適用を含む、広範な種々の他の画像化適用における使用に拡張され得る。
【0105】
本発明は、添付の図面を参照してその好適な実施態様と共に十分に説明されているが、種々の変更および改変が当業者に明らかであり得ることが理解されるべきである。このような変更および改変は、本発明から逸脱しなければ、添付の請求の範囲によって定義される本発明の範囲に含まれると理解されるべきである。
【図面の簡単な説明】
【0106】
【図1】遺伝子発現マイクロアレイプロファイリング、すなわちBSSにおける組織異種性修正へのPICAの独特の適用を示す。
【図2】図2Aは、2つの元のソースおよび対応する分散プロットを示し、図2Bは、元のソースの2つの混合物および対応する分散プロットを示し、そして図2Cおよび2Dは、画像分離におけるFastICAおよびFastPICAの結果ならびに回復した分散プロットを示す。
【図3】図3Aは、マイクロアレイ遺伝子発現の2つの元のソースを示し、図3Bは、2つの元のソースの2つの混合物を示し、そして図3Cは、FastPICAによる遺伝子発現における部分体積修正を示す。
【図4】ICA(中央)およびPICA(右)方法による脳(左)および再構成した因子画像(レセプターの空間分布)の観察したダイナミック陽電子放射トモグラフィー(PET)を示す。
【図5】遺伝子発現マイクロアレイプロファイリングにおける組織異種性修正のための、異なる数の分化して発現させた遺伝子を用いて、PICA−BSSによる元の遺伝子発現プロファイルおよび回復した遺伝子発現プロファイルの結果および比較を示す。
【図6】乳癌腫瘍の透過性パターン分解を行うために用いたPICAの適用、すなわちBSSを示し(例えば、微小血管を通る速い流れ対遅い流れ)、そしてこれは、ダイナミックコントラスト強調磁気共鳴画像によって獲得され得る。
【図7】混合した試料から異なる細胞集団を分離するために使用されるPICAに基づくBSSの結果を示す。

【特許請求の範囲】
【請求項1】
画像を解析する方法であって、
A.観察のディジタル画像を獲得する工程であって、該ディジタル画像が観察データである、工程;
B.該観察データをベクトル化して、観察ベクトルx(i)を生成する工程;
C.脱混合マトリクスWを決定する工程;
D.出力ベクトルy(i)=Wx(i)を決定する工程;
E.ソースベクトルS(i)を回復する工程であって、ここでS(i)=y(i)である工程;および
F.該ソースベクトルS(i)を利用して、該画像を解析する工程、
を含む、方法。
【請求項2】
前記統計学的に互いに独立なソースがガウス型である、請求項1に記載の方法。
【請求項3】
前記統計学的に互いに独立なソースが非ガウス型である、請求項1に記載の方法。
【請求項4】
前記脱混合マトリクスを決定する工程が、以下の工程:
A.前記観察データを中央に置いてその平均をゼロにする工程であって、ここでC=E[xx]である、工程;
B.最初の脱混合マトリクスWを選択する工程;
C.k=1、・・・mについて、y=Wx、β=−E[yg(y)]、α=−(β+E[g'(y)])−1を計算する工程;
D.W+diag(α)(diag(β)+E[(g)(y)(y)])WによってWを更新する工程;
E.W←(WCW)-1/2Wによって非相関化および標準化する工程;および
F.収束しないならば、工程Cに戻る工程であって、そうでなければWが決定されている工程、
を含む、請求項1に記載の方法。
【請求項5】
前記出力ベクトルy(i)を決定する工程が、以下の工程:
A.j=0についてFに関してFastICAによってy(j)=W(j)xを推定する工程;
B.次式
【数1】

に従ってインデックス部分空間Iを同定する工程;
C.Iに関してFastICAによってy(i+1)=W(j+1)(j)を推定する工程;
D.F−Iに関してy(i+1)=W(j+1)(j)を計算する工程;および
E.収束しないならば、工程Bに戻る工程であって、そうでなければy(i)が決定されている工程、
を含む、請求項1に記載の方法。
【請求項6】
前記観察データをベクトル化する工程が、以下の観察ベクトル
【数2】

になる、請求項1に記載の方法。
【請求項7】
画像を解析する方法であって、
A.観察のディジタル画像を獲得する工程であって、該データ画像が観察データである、工程;
B.該観察データをベクトル化して、観察ベクトルx(i)を生成する工程;
C.脱混合マトリクスWを決定する工程であって、該脱混合マトリクスが、
1.観察データを中央に置いてその平均をゼロにする工程であって、ここでC=E[xx]である、工程;
2.最初の脱混合マトリクスWを選択する工程;
3.k=1、・・・mについて、y=Wx、β=−E[yg(y)]、α=−(β+E[g'(y)])−1を計算する工程;
4.W+diag(α)(diag(β)+E[(g)(y)(y)])WによってWを更新する工程;
5.W←(WCW)-1/2Wによって非相関化および標準化する工程;および
6.収束しないならば、工程3に戻る工程であって、そうでなければWが決定されている工程、
によって決定される、工程;
D.出力ベクトルy(i)=Wx(i)を決定する工程であって、該出力ベクトルが
1.j=0についてFに関してFastICAによってy(j)=W(j)xを推定する工程;
2.次式
【数3】

に従ってインデックス部分空間Iを同定する工程;
3.Iに関してFastICAによってy(i+1)=W(j+1)(j)を推定する工程;
4.F−Iに関してy(i+1)=W(j+1)(j)を計算する工程;および
5.収束しないならば、工程2に戻る工程であって、そうでなければy(i)が決定されている工程、
によって決定される、工程;
E.ソースベクトルS(i)を回復する工程であって、ここでS(i)=y(i)である工程;および
F.該ソースベクトルS(i)を利用して、該画像を解析する工程、
を含む、方法。
【請求項8】
前記統計学的に互いに独立なソースがガウス型である、請求項7に記載の方法。
【請求項9】
前記統計学的に互いに独立なソースが非ガウス型である、請求項7に記載の方法。
【請求項10】
画像を解析するための装置であって、
A.観察のディジタル画像を獲得するための手段であって、該ディジタル画像が観察データである、手段;
B.該観察データをベクトル化して、観察ベクトルx(i)を生成するための手段;
C.脱混合マトリクスWを決定するための手段;
D.出力ベクトルy(i)=Wx(i)を決定するための手段;
E.ソースベクトルS(i)を回復するための手段であって、ここでS(i)=y(i)である手段;および
F.該ソースベクトルS(i)を利用して、該画像を解析するための手段、
を備える、装置。
【請求項11】
前記統計学的に互いに独立なソースがガウス型である、請求項10に記載の装置。
【請求項12】
前記統計学的に互いに独立なソースが非ガウス型である、請求項10に記載の装置。
【請求項13】
前記脱混合マトリクスを決定するための手段が、
A.前記観察データを中央に置いてその平均をゼロにするための手段であって、ここでC=E[xx]である、手段;
B.最初の脱混合マトリクスWを選択するための手段;
C.k=1、・・・mについて、y=Wx、β=−E[yg(y)]、α=−(β+E[g'(y)])−1を計算するための手段;
D.W+diag(α)(diag(β)+E[(g)(y)(y)])WによってWを更新するための手段;および
E.W←(WCW)-1/2Wによって非相関化および標準化するための手段、
を含む、請求項10に記載の装置。
【請求項14】
前記出力ベクトルy(i)を決定するための手段が、
A.j=0についてFに関してFastICAによってy(j)=W(j)xを推定するための手段;
B.次式
【数4】

に従ってインデックス部分空間Iを同定するための手段;
C.Iに関してFastICAによってy(i+1)=W(j+1)(j)を推定するための手段;および
D.F−Iに関してy(i+1)=W(j+1)(j)を計算するための手段、
を含む、請求項10に記載の装置。
【請求項15】
前記観察データをベクトル化するための手段が、以下の観察ベクトル
【数5】

になる、請求項10に記載の装置。
【請求項16】
画像を解析するための装置であって、
A.観察のディジタル画像を獲得するための手段であって、該データ画像が観察データである、手段;
B.該観察データをベクトル化して、観察ベクトルx(i)を生成するための手段;
C.脱混合マトリクスWを決定するための手段であって、該脱混合マトリクスが、
1.観察データを中央に置いてその平均をゼロにするための手段であって、ここでC=E[xx]である、手段;
2.最初の脱混合マトリクスWを選択するための手段;
3.k=1、・・・mについて、y=Wx、β=−E[yg(y)]、α=−(β+E[g'(y)])−1を計算するための手段;
4.W+diag(α)(diag(β)+E[(g)(y)(y)])WによってWを更新するための手段;および
5.W←(WCW)-1/2Wによって非相関化および標準化するための手段、
を含む装置を用いることによって決定される、手段;
D.出力ベクトルy(i)=Wx(i)を決定するための手段であって、該出力ベクトルが、
1.j=0についてFに関してFastICAによってy(j)=W(j)xを推定するための手段;
2.次式
【数6】

に従ってインデックス部分空間Iを同定するための手段;
3.Iに関してFastICAによってy(i+1)=W(j+1)(j)を推定するための手段;および
4.F−Iに関してy(i+1)=W(j+1)(j)を計算するための手段、
を含む装置によって決定される、手段;
E.ソースベクトルS(i)を回復するための手段であって、ここでS(i)=y(∞)である手段;および
F.該ソースベクトルS(i)を利用して、該画像を解析するための手段、
を備える、装置。
【請求項17】
前記統計学的に互いに独立なソースがガウス型である、請求項16に記載の装置。
【請求項18】
前記統計学的に互いに独立なソースが非ガウス型である、請求項16に記載の装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公表番号】特表2006−507552(P2006−507552A)
【公表日】平成18年3月2日(2006.3.2)
【国際特許分類】
【出願番号】特願2003−571703(P2003−571703)
【出願日】平成15年2月25日(2003.2.25)
【国際出願番号】PCT/US2003/005265
【国際公開番号】WO2003/073064
【国際公開日】平成15年9月4日(2003.9.4)
【出願人】(595020702)ザ、キャソリック、ユニバーシティ、オブ、アメリカ (1)
【氏名又は名称原語表記】THE CATHOLIC UNIVERSITY OF AMERICA
【Fターム(参考)】