説明

マルチパラメータデータ解析の方法及び装置

一態様では、マルチパラメータデータセットから1以上の表現型を識別する方法(200)に関する。方法(200)は、マルチパラメータデータセットの内部でパラメータの各対の間での相関を測定するステップ(202)と、解析パラメータセットを形成するために、所定のマルチパラメータデータ解析セットの内部で相関のあるパラメータ値を修正するステップ(204)と、マルチパラメータデータセットから1以上の表現型を識別するために、解析パラメータセットを用いてマルチパラメータデータセットを解析するステップ(206)とを含んでいる。本発明の様々な実施形態を、例えば生物学的細胞解析のための自動ハイコンテントスクリーニング(HCS)装置(100)に用いることができる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は一般的には、マルチパラメータデータの解析の方法及び装置に関する。さらに具体的には、本発明は、1以上の表現型を識別するためのマルチパラメータデータの解析に関する。かかる表現型を用いて、本発明の様々な実施形態を、例えば生物学的細胞画像解析を用いる自動ハイコンテントスクリーニング(HCS)に用いることができる。
【背景技術】
【0002】
HCS、すなわち自動細胞内イメージング及び画像解析の細胞信号伝達経路及びプロセスの研究への応用[1]は、極めて情報量の多い生物学的データを生成する高速で対費用効果の高い手段として産学で広く採用されている。HCSは研究者に対し、インサイツ及び状況での細胞生物学の詳細な研究のための強力な技術及び応用を提供し、結果として、大規模なマルチパラメータデータセットを例えば様々なそれぞれの画像に対応して生成する。
【0003】
多くの研究において、このデータの完全な可能性は十分に開発され又は活用されるに至っていない。平均及び標準偏差の利用のような標準的なデータ解析及び比較方法がハイスループットスクリーニング(HTS)で常用されているが、これらの方法は細胞群応答を平均することによりHCSデータにおける潜在的なパターン及び傾向を不明確にする。
【0004】
この不明確化の単純な例が化学的阻害剤又はRNAi研究において生じており、例えばHTS尺度によって平均応答として測定された50%の低下が、全ての細胞における50%阻害を表わしている場合もあれば、或いは細胞の50%で100%阻害であり残りは影響を受けていないことを表わしている場合もある。
【0005】
この状況は、細胞の強度データ又は空間的データの典型的な分布(正規分布している場合もあるが稀である)によってさらに悪化し、このように平均及び標準偏差はデータ分布の記述子としては不十分になっている。
【0006】
結果的に、平均化された応答に基づく標本間でのHCSデータの比較は、データを十分に活用しないばかりか多くの場合に不正確である可能性が高い。
【0007】
標準的なデータ平均化手法の制限から、HCSデータにおいて細胞群のデータ及び分布を比較するために、コルモゴロフ−スミルノフ(Kolmogorov−Smirnov)(KS)距離[2]の利用のような様々なノンパラメトリック解析方法が採用されるようになってきた[3,4]。
【0008】
例えば、Altschuler等は、画像処理ソフトウェアからの自動データ収集及びこのデータの統計解析に基づく細胞の解析のための方法及びシステムを記載している[5]。記載されている方法は、標本内KS距離を群差の計量として利用すること、及び群内での記述子のばらつきの計量(例えば標準偏差)によって除算することによりKS距離を正規化する手段を含んでいる。
【先行技術文献】
【特許文献】
【0009】
【特許文献1】米国特許出願公開第2006/0154236号明細書
【非特許文献】
【0010】
【非特許文献1】S. A. Haney, P. LaPan, J. Pan and J. Zhang, “High-content screening moves to the front of the line,” Drug Discovery Today, Vol. 11, No. 19-20, pp. 889-894, October 2006
【非特許文献2】S. Siegel and N. J. Castellan, Non-Parametric Statistics for the Behavioural Sciences, McGraw-Hill, New York, USA, 2nd Edition, 1988
【非特許文献3】Z. E. Perlman, M. D. Slack, Y. Feng, T. J. Mitchison, L. F. Wu and S. J. Altschuler, “Multidimensional drug profiling by automated microscopy,” Science, Vol. 306, pp. 1194-1198, 12 November 2004
【非特許文献4】B. Zhang, X. Gu, U. Uppalapati, M. A. Ashwell, D. S. Leggett and C. J. Li, “High-content fluorescent-based assay for screening activators of DNA damage checkpoint pathways,” Journal of Biomolecular Screening, Vol. 13, No. 6, pp. 538-543, 19 June 2008
【発明の概要】
【発明が解決しようとする課題】
【0011】
しかしながら、かかるノンパラメトリックデータ解析方法の利用は従来の手法の改善ではあるが、特にHCS/HTSによって典型的に生成される極めて大規模なマルチパラメータデータセットを解析するためにはさらに高速でさらに正確なデータ解析手法に対する必要性が依然存在している。
【0012】
従って、本発明は、従来のデータ解析方法に関連する以上に述べた欠点に鑑みて考案されたものである。
【課題を解決するための手段】
【0013】
本発明の第一の態様では、マルチパラメータデータセットから1以上の表現型を識別する方法が提供される。この方法は、マルチパラメータデータセットの内部でパラメータの各対の間での相関を測定するステップと、解析パラメータセットを形成するために、所定のマルチパラメータデータ解析セットの内部で相関のあるパラメータ値を修正するステップと、マルチパラメータデータセットから1以上の表現型を識別するために、上述の解析パラメータセットを用いてマルチパラメータデータセットを解析するステップとを含んでいる。
【0014】
本発明の第二の態様では、1以上のマルチパラメータデータセットの自動ハイコンテントスクリーニング(HCS)のための装置が提供される。この装置は、マルチパラメータデータセットの内部でパラメータの各対の間での相関を測定するように動作可能なプロセッサを含んでいる。プロセッサはまた、解析パラメータセットを形成するために、マルチパラメータデータセットについて所定のマルチパラメータデータ解析セットの内部で相関のあるパラメータ値を修正し、マルチパラメータデータセットから1以上の表現型を識別するために、上述の解析パラメータセットを用いてマルチパラメータデータセットを解析するように動作可能である。
【0015】
所定のマルチパラメータデータ解析セットの内部での相関のあるパラメータ値の修正は、例えばパラメータ値のゼロへの修正、又はさらに詳細な解析からのパラメータ除去を含めて、相関測定から導かれる1以上の因子を用いたパラメータ値の乗算又は他の演算による修正を含み得る。
【0016】
独立なパラメータすなわち実質的に相関のないパラメータで形成される解析パラメータセットから表現型を決定することにより、全体的なデータ処理時間が短縮される。
【0017】
また、この手法は加えて、表現型のさらに正確な測定を提供し、これにより、例えばHCS/HTSシステムにおいて改善された特徴認識を高速で自動的に行なうことが可能になる。
【図面の簡単な説明】
【0018】
以下、本発明の様々な態様及び実施形態を添付図面に関連して記載する。
【図1】本発明の一実施形態に係る1以上のマルチパラメータデータセットの自動ハイコンテントスクリーニング(HCS)のための装置を示す図である。
【図2】本発明の様々な態様によるマルチパラメータデータセットから1以上の表現型を識別する方法を示す図である。
【図3】本発明の様々な実施形態に係る二つのデータ群の間でのコルモゴロフ−スミルノフ(KS)距離を決定する原理を示す図である。
【図4】本発明の様々な実施形態に用いられる標本内及び標本間でのKS距離決定の図である。
【図5】本発明の一実施形態でのデータパラメータと表現型マップ次元との間の関係を示す図である。
【図6】本発明の一態様による解析のためのデータを導くのに用いられるマイトマイシンCの濃度を高めながら処理された細胞のハイコンテントスクリーニングからの典型的な画像を示す図である。
【図7】本発明の一態様による解析のためのデータを導くのに用いられるマイトマイシンCの濃度を高めながら処理された細胞のハイコンテントスクリーニングから導かれる核面積データを示す図である。
【図8】本発明の一態様による解析のためのデータを導くのに用いられるマイトマイシンCの濃度を高めながら処理された細胞のハイコンテントスクリーニングから導かれる核周長データを示す図である。
【図9】本発明の一態様による解析のためのデータを導くのに用いられるマイトマイシンCの濃度を高めながら処理された細胞のハイコンテントスクリーニングから導かれる核加重付き相対慣性モーメントデータを示す図である。
【図10】本発明の一態様による解析のためのデータを導くのに用いられるマイトマイシンCの濃度を高めながら処理された細胞のハイコンテントスクリーニングから導かれる核長さデータを示す図である。
【図11】本発明の一態様によるマイトマイシンCの濃度を高めながら処理された細胞のハイコンテントスクリーニングから導かれる標本内KS距離計量データを示す図である。
【図12】本発明の一態様によるマイトマイシンCの濃度を高めながら処理された細胞のハイコンテントスクリーニングから導かれる標本間KS距離計量データを示す図である。
【図13】本発明の一態様による標本内及び標本間のKS距離測定から導かれる表現型マップを示す図である。
【図14】本発明の一態様による表現型マップの小成分への分解を示す図である。
【図15】本発明の一態様によるMMCの濃度を高めながら処理された細胞の表現型マップから導かれる表現型スコアを示す図である。
【発明を実施するための形態】
【0019】
図1は、本発明の一実施形態に係る1以上のマルチパラメータデータセットの自動ハイコンテントスクリーニング(HCS)の装置100を示す。装置100は分かり易くするために概略図示されており、光120aを発生する光源102を含んでいる。
【0020】
光120aは集光装置104によって集束させられて鏡検プレート108に入射する。鏡検プレート108は、撮影されるウェル又はスポット109のアレイを含み得る。集光装置104は、光120bを鏡検プレート108において焦平面に集束させることができる。鏡検プレート108は消耗品として提供されることができ、スポット109は幾つかの形式の細胞(例えば哺乳動物細胞)と相互作用することが可能な様々な物質を含み得る。
【0021】
様々な実施形態では、鏡検プレート108は、装置100の内部で当該鏡検プレート108を整列させる助けとなるように設けられた少なくとも一つの基準目印(図示されていない)を含み得る。例えば、1以上の着色染料をスポット109の内部に設けることができる。かかる着色染料は、装置100の内部での鏡検プレート108の相対的な位置決めに関するデータを導くために、様々なイメージングシステムによって識別され得る。例えば、装置100は、GE Healthcare Life Sciences社(英国バッキンガムシャー州リトルチャルフォント)から市販のGE In−Cell Analyzer 1000(商標)であってよく、この装置は四つの色チャネルを用いて画像鏡検プレート108を撮影することができる。従って、装置100の内部での鏡検プレート108の配置に関するデータを得るために、一つの色チャネルを様々なスポット109に設けられている色付きの基準目印を撮影するための専用にすることができる。
【0022】
装置100はまた、検出器システム112及び並進機構(図示されていない)を含んでいる。並進機構は、光120bの焦点を鏡検プレート108に対して移動させる(例えば鏡検プレート108をxy平面において移動させることにより)ように構成されている。これにより、複数の画像を個々のスポット109のそれぞれから取得することが可能になる。加えて、並進機構はまた、例えばスポット109に焦点を合わせるために図1に示すz方向において鏡検プレート108を移動させるように動作可能であってもよい。
【0023】
幾つかの実施形態については、一度に1個のスポットのみが撮影される。取得される画像は、細胞及び細胞レベル以下の形態を分解するのに十分な拡大率を有する。現状のGE In−Cell Analyzer 1000(商標)では、このために単一のスポットよりも僅かに小さい視野を有する20倍の対物レンズを利用する場合がある。しかしながら、本発明の様々な方法は、例えばGE In−Cell Analyzer 1000(商標)において4倍の対物レンズを用いて4個〜6個スポット/画像で撮影する相対的に低倍率での拡大撮影にも対応する。
【0024】
開口絞り106が光源102と検出器システム112との間に選択随意で設けられ、開口絞り106の寸法は可変であってよい。例えば、様々な異なる寸法の可動式開口を所定位置まで回転させてもよいし、連続可変式のアイリス型ダイヤフラムを設けてもよい。画像コントラストは、開口絞り106の開口設定を変化させることにより制御され得る。
【0025】
開口絞り106を通過した集束光120bは、透過撮影モードでは標本鏡検プレート108を通過する。個々のスポット109に隣接する物質に関係する画像情報と共に変調を受けた発散光120cが対物レンズ110によって収集され、集束させられて120d検出器システム112に入射し、この光を用いて該当スポット109についての原画像を形成する。
【0026】
本発明の方法の様々な実施形態は用いられる撮影モダリティに独立であり、例えば透過型の幾何学的構成でも反射型の幾何学的構成でも作用し得る。GE In−Cell Analyzer 1000(商標)での撮影の場合には、落射型蛍光モードを用いることができ、基準目印スポット及び細胞からのアッセイ信号の両方が異なる励起波長及び放出波長において撮影される。しかしながら、干渉し合わない限り混成撮影モードを展開することを妨げるものは原則として存在しない。例えば、基準目印を付けるために非蛍光染料を用い、落射蛍光によってアッセイ信号を検出しながら反射型又は透過型の幾何学的構成において吸光度によって基準目印を検出することも可能である。
【0027】
検出器システム112は、鏡検プレート108から複数の画像を取得するように動作可能であり、各々の画像がそれぞれのマルチパラメータデータセットとして電子形態で表わされ得る。例えば、それぞれの異なるスポット109又は異なる時間点での同じスポット109の画像を各々表わす幾つかのマルチパラメータデータセットを得ることができる。このようにして、隣り合ったスポット109の間の差又は同じスポット109の範囲内で生ずる時間的変化を解析することができる。
【0028】
また、検出器システム112は、プロセッサ114に結合されて動作可能であり、次にプロセッサ114はマルチパラメータデータセットを処理するように動作可能である。プロセッサ114は、一つのマルチパラメータデータセットの内部でパラメータの各対(ペア)の間での相関を測定するように動作可能である。例えば、細胞の周長、径及び楕円率等のようなパラメータを対単位の態様で評価して、両者の間の定量化された相関度を決定することができる。
【0029】
次いで、プロセッサ114は、解析パラメータセットを形成するために、マルチパラメータデータセットについて所定のマルチパラメータデータ解析セットの内部で相関のあるパラメータ値を修正するように動作可能である。所定のマルチパラメータデータ解析セットは、例えば特定の細胞画像について測定され得る全てのパラメータのリストを含み得る。次いで、かかるリストを、例えば所定の値よりも大きい相関閾値を有する一対のパラメータの一方を除去するようにプロセッサ114によって整理することができる。例えば、プロセッサ114は、細胞特徴の周長及び径が95%を上回る相関を有すると決定することができ、このようにしてマルチパラメータデータセットから、決定されるべきパラメータとしては周長を除去する。適当に改訂された決定されるべきパラメータのリストが解析パラメータセットとして記憶される。
【0030】
プロセッサ114はまた、マルチパラメータデータセットから1以上の表現型を識別するために、解析パラメータセットを用いてマルチパラメータデータセットを解析するように動作可能である。例えば、プロセッサ114は、各々の適当な細胞特徴毎に、解析パラメータセットにおいて各々のパラメータの値を逐次決定することができる。かかる細胞特徴がマルチパラメータデータセットによって画定される画像において多数回にわたり生ずる場合には、元の所定のマルチパラメータデータ解析セットを整理すれば、データ処理のオーバヘッドが確実に減少する。これにより、マルチパラメータデータセットの解析が高速化する。加えて、様々な特徴の識別も、最終的なマルチパラメータデータセット解析からのあらゆる相関のあるパラメータの除去によって統計学的に改善される。また、かかる手法はまた、必ずしも予め決められているのではなく解析されているデータに適応させることができるように、データ解析に用いられるパラメータの動的/自動修正を提供する。
【0031】
さらに、プロセッサ114は、複数のマルチパラメータデータセットから1以上の表現型を識別して、表現型同士の間の変動を識別するためにマルチパラメータデータセットからのそれぞれの表現型を比較するように動作可能であり得る。例えば、プロセッサ114を用いて、一つの画像からの表現型をもう一つの画像の表現型と比較することができる。かかる手法は、スポット109に与えられている細胞の統制(対照)標本を、スポット109の他のものに与えられている類似しているが処理済みの細胞と比較することを可能にする。
【0032】
装置100についての有利なオプションは、複数のマルチパラメータデータセットについて1以上のそれぞれの解析パラメータセットを形成し、相関関係がマルチパラメータデータセットの間で保たれているか否かを決定するためにこれらの解析パラメータセットを比較するようにさらに動作可能なプロセッサ114を設けるものである。様々なパラメータの間で相関に空間的な変動(例えばスポット109のアレイにわたる)及び/又は時間的な変動が生じているか否かを決定することにより、従来は利用可能でない追加情報を得ることができる。
【0033】
例えば、細胞核が死んで(例えばアポトーシスを介して)、小断片に分割される場合がある。これらの断片は一般的には、同じ全体的形状(例えば円形及び卵形等)を有し得る。この場合には、撮影された径及び周長に関係するパラメータは、当初の細胞核及び断片の両方について相対的に高い相関度を有する。しかしながら、アポトーシスのプロセスで、核が形状を変化させて放射状(星形)の形態になる場合があり、この後者の形態では、径及び周長に関係するパラメータの間での相関の測定値は低下する。故に、様々な表現型の間での相関のレベルを監視することにより、様々な生物学的プロセスに関する潜在的に有用な追加情報を得ることができる。
【0034】
様々な実施形態では、相関は、所定のマルチパラメータデータ解析セットにおける表現型同士の間で行なわれるノンパラメトリックの統計学的な対単位の測定を用いることにより決定され得る。例えば、後にあらためて詳述されるコルモゴロフ−スミルノフ(KS)距離測定解析を用いることができる。KS距離測定解析手法の利用は、比較的高速であるため幾つかの実施形態ではは好ましい。しかしながら、当業者は、他の様々な相関測定手法を代用し得ることを認められよう。
【0035】
加えて、プロセッサ114は、並進機構(図示されていない)を制御して光源102のスポットプレート108に対する焦点位置を移動させるように構成され得る。プロセッサ114は例えば、かかるタスクを実行するように適当にプログラムされている従来のコンピュータシステムの一部として設けられてもよいし、ディジタル信号プロセッサ(DSP)、専用の特定応用向け集積回路(ASIC)、及び適当に構成されたファームウェア等によって設けられてもよい。
【0036】
本発明の様々な実施形態の装置100は、1以上のカメラを備える顕微鏡と、ハイコンテントスクリーニング装置として用いられ得るプロセッサ114とを含み得る。1以上のマルチパラメータデータセットによって表わされる画像は、自動解析のために装置100によって形成されてもよいし、記憶装置から与えられてもよいし、プロセッサ114に送信等されてもよい。かかる自動解析を提供する様々な方法について、以下、非限定的な実例によってさらに詳細に説明する。
【0037】
図2は、本発明の様々な態様によるマルチパラメータデータセットから1以上の表現型を識別する方法200を示す。マルチパラメータデータセットは、例えば上の図1に関連して記載されている形式の装置100を用いて与えられる画像に対応するデータを含み得る。
【0038】
方法200は、マルチパラメータデータセットの内部でパラメータの各対の間での相関を測定するステップ202を含んでいる。次いで、ステップ204において、解析パラメータセットを形成するために、所定のマルチパラメータデータ解析セットの内部からの相関のあるパラメータを修正する。
【0039】
相関のあるパラメータ値の修正は、例えばパラメータ値のゼロへの修正、又はさらに詳細な解析からのパラメータの完全除去を含めて、相関測定から導かれる1以上の因子を用いたパラメータ値の乗算又は他の演算による修正を含み得る。
【0040】
ステップ206では、マルチパラメータデータセットから1以上の表現型を識別するために、解析パラメータセットを用いてマルチパラメータデータセットを解析する。方法200の作用範囲を提供する様々な手法については、後にあらためて詳述する。
【0041】
方法200を用いて、マルチパラメータデータ解析セット同士の間に変化が生じているか否かを決定することができる。例えば、方法200を用いて、薬物誘発効果を経時的に検出することができる。これらの効果は定性化及び定量化を行なうことが可能なものであって、寸法パラメータの変化、ネクローシス、及びミトーシス(細胞分裂)等のような現象及びプロセスを含み得る。
【0042】
方法200は、自動画像解析例えば薬物アッセイ等でのハイスループットスクリーニング(HTS)に用いられ得る。マルチパラメータデータセットは、顕微鏡画像のような細胞データを含み得る。本発明の様々な態様では、従来の方法とは対照的に、データ検定は、データセット内(intra-data set)方式よりも寧ろデータセット間(inter-data set)方式で実行され得る。
【0043】
方法200は、事前に記憶及び送信等されている画像に対して適用されてもよいし、「オンザフライ(on-the-fly)」で取得されて処理されてもよい。方法200は、ハードウェア、ファームウェア及びソフトウェアの1又は複数を含むプロセッサを用いて具現化され得る。例えば、プロセッサは、従来のパーソナルコンピュータ(PC)、ASIC及びDSP等を用いていてもよいし、且つ/又は装置は方法200を具現化するようにアップグレードされたGE社のIn-Cell Miner(商標)ソフトウェアパッケージを用いたGE In−Cell Analyzer 1000(商標)を含んでいてもよい。また、本書に記載するような付加的な作用範囲も、方法200を具現化する様々な実施形態によって提供され得る。
【0044】
本発明の様々な実施形態では、方法200は、様々なソフトウェア構成要素を用いた装置によって具現化され得る。かかるソフトウェア構成要素は、例えばインターネットを介して装置に送信されるアップグレードの形態で装置に提供され得る。
【0045】
図3は、本発明の様々な実施形態に係る二つのデータ群の間のコルモゴロフ−スミルノフ(KS)距離を決定する原理を示す。
【0046】
例えば、Altschuler等の方法[5]を用いることができるが、この方法自体は、パラメータ同士の間の相関を検出するために標本間KS距離を利用することも、一定範囲のパラメータにわたる表現型変化を検出するためにサマリスコアを生成する目的で標本内距離計量と組み合わせて標本間KS距離計量を利用することも教示している訳ではない。
【0047】
KS距離測定値は、図3で分かるように二つのデータセットの内部でのデータの度数分布の比較によって容易に生成される。標準的な分布のヒストグラム(所与のデータ値についてのデータ点(すなわち細胞)の個数又は度数としてグラフ化されたデータ)の累積度数分布曲線(所与のデータ値についてのデータの累積割合(cumulative fraction)としてグラフ化されたデータ)への変換によって、複雑な分布を有する二つのデータ群を類似した関数として比較して、分布の差を累積度数関数同士の間の最大垂直距離すなわちKS距離として表わすことが可能になる。
【0048】
KS距離測定は、一つの細胞群にわたる解析パラメータの分布における正規性又は非正規性についての事前知識なしに用いることができ、不等の大きさを有するデータセット、例えば様々な数の細胞を含む二つの細胞群からのデータを比較するのに用いることができるため、KS距離を利用することにより、二つの細胞群から導かれるデータの差についての偏りのない比較計量が得られ、この計量の利用によってHCSアッセイからのデータの品質が著しく向上することが判明している。
【0049】
KS距離又は他のノンパラメトリック比較計量を利用することにより、多くの異なるパラメータを含む極めて複雑なHCSデータセットを解析することが可能になり、例えば細胞に対する化合物の投与量及び/又は曝露時間の効果を、距離計量を利用して二つの群からのデータ例えば統制細胞及び薬物処理済み細胞が著しく異なっているか否かを決定することにより正確に測定することが可能になる。
【0050】
HCSでのマルチパラメータデータの取得において生ずる一般的な問題は、画像解析によって抽出された多くの定量的なパラメータから、何れのパラメータが独立パラメータ(すなわち異なる細胞現象に関係しておりかかる現象の計量となるパラメータ)であり、何れのパラメータが相関のあるパラメータ(すなわち同じ細胞現象に関係しておりかかる現象の計量となるパラメータ)であるかを決定することにある。例えば細胞核の形態学的測定では、幾つかのパラメータは相関しているものと期待される。すなわち核の面積、長さ及び周長の測定値は全て単一の対象に関係しており幾何学的に関係付けられる。稍複雑な例では、パラメータの対又はグループが、研究者側にとっては明らかでない異なる手段によって同じ細胞現象の計量となり、故に直接的に又は間接的に相関している場合がある。従って、数学的に相関している測定パラメータと生物学的に相関している測定パラメータとの間を見分ける必要がある。
【0051】
検出されないデータ相関は、HCAにおいて標準になりつつある多パラメータ型アッセイでの重要な問題点である。すなわち、細胞表現型は統制群に対する様々なパラメータにおける一連のKS距離計量を含む表現型シグネチャーを用いて記述され画定され得るが、データ深さが大きくなると表現型差を画定するために多数のKS距離計量を要求する。このような場合に、表現型変化はパラメータ同士の間の潜在的な相関の知見なしに多数のパラメータにおいて検出され得るため、データの解釈に問題が生ずる場合がある。これにより、表現型変化の過大推定が生じたり、表現型同士の間を見分けられなくなったりする場合があり、表現型のクラスタ生成又は他の順位決定に、相関のあるパラメータによる偏りが生ずる(すなわち別個のパラメータを介して同じ細胞現象を2回測定する)。
【0052】
パラメータの相関は、相関の存在が既知であればかかるパラメータの利用価値を下落させたり無効化したりするものでは必ずしもない。例えば、上述のように、核形態に関連するパラメータは相関を呈し得ることが期待され、例えば核の径又は長さは核周長に相関する。核形状が不変である場合には2個のパラメータの間の相関も不変であるし、一つの細胞群の内部で生ずる表現型変化についての情報を与える際にはこれらのパラメータの一方の測定値は冗長となる。しかしながら、核形状が特定の処理によって変化したとすると、パラメータ同士の間の相関度は変化する可能性が高い。例えば、核が大多数円形であった形態から星形へ変化すると、星形の核は径又は長さに対して遥かに大きい周長を有するため径又は長さと周長との間の緊密な相関は著しく変化する。故に、パラメータ同士の間の相関の知見及びかかる相関の変化の検出は、HCSデータから細胞表現型の変化を正確に特性決定するために利用可能なデータを増加させる。
【0053】
本発明の幾つかの態様による一つの方法は、標本同士の間(標本内)及び付加的に標本の内部(標本間)でのKS距離、又は他の適用可能な群比較計量の測定計算を実行することにより、多パラメータ型HCAデータにおけるパラメータ相関の問題を扱うことを図る。標本間解析を新規に利用することにより、
i)2以上のパラメータが相関を有しているか否かを確定する手段、
ii)標本内距離計量と標本間距離計量との組み合わせを利用して、マルチパラメータデータに基づいて表現型シグネチャーを図形的に表わす表現型マップを生成する手段、
iii)標本間測定を利用して、標本内測定から生成されるデータに加重して順位を決定し、一定範囲の測定パラメータにわたり二つの細胞群の間の累積差を要約する単一の表現型スコア計量を生成する手段、及び
iv)標本間距離計量を用いてパラメータ相関の変化の測定によって付加的な表現型特性決定データを与える手段
を提供する。
【0054】
図4は、本発明の様々な実施形態では用いられる標本内KS距離決定及び標本間KS距離決定の図を示す。
【0055】
KS距離又は他のノンパラメトリック群比較計量を用いるときに、検定標本と統制標本との間のKS距離、例えば薬物に曝露された細胞群から導かれるデータと薬物を存在させない場合の等価な細胞群から導かれるデータとの間のKS距離を算出することは標準的な作業である。典型的な研究では、この作業は、細胞群を検定物質に濃度を高めながら曝露して、統制群に対する各々の処理済み群について一連のKS距離を別個に算出することを含み得る。
【0056】
かかるアプローチを図4に示し、同図では、2種類の条件(C1及びC2)の下にある細胞群を2個のパラメータ(P1及びP2)について解析し、これら2個のパラメータについての標本内KS距離(KS1及びKS2)を算出している。条件C1と条件C2との間で標本に生ずる表現型変化の性質に依存して、各パラメータについての標本内KS値も呼応して変化する。パラメータの分布がC1及びC2との間で著しく変化するシナリオAでは、KS1及びKS2は両方とも大きくなる。C1とC2との間でP1の分布が著しく変化するが、P2の分布は余り変化しないシナリオBでは、KS1は大きくなりKS2は小さくなる。かかる測定は標準的な作業を反映しており、複数の検定条件の下で細胞群に生ずる細胞パラメータの変化の定量的な測定を可能にする。
【0057】
従来の解析方法について頻繁に遭遇する問題は、標本内KS距離(KS1及びKS2)は検定標本と統制標本との間での個々のパラメータの分布の差についての情報を提供するが、2個のパラメータが相関を示しているか否かの指標を与えず、故に同じ現象を測定して解析に冗長性を招き得ることである。この事例がシナリオAに示されており、KS1及びKS2の両方が大きい値を与えているが、このことだけでは二つの距離計量が同じ細胞現象に関係しているのか異なる細胞現象に関係しているのかの指標を与えない。
【0058】
本発明の幾つかの態様の方法では、KS距離又は他の適当なノンパラメトリック距離計量を含み得る標本内距離計量(すなわち異なる処理条件の下での同じパラメータの分布の比較)の利用が、同じ標本における異なるパラメータの分布を比較する付加的な標本間距離計量(すなわち同じ処理条件の下での異なるパラメータの分布の比較)の利用によって強化される。
【0059】
これらの標本間測定が図4ではKS3及びKS4として示されており、これらの測定は、条件C1及びC2の下での測定パラメータP1とパラメータP2との間の相関度を決定する手段を提供する。シナリオAでは、パラメータP1及びP2の両方の分布がC1とC2との間で変化しているが、両パラメータともC1及びC2において一定の相関度を示唆する類似した分布を有し、かかるシナリオAでは標本間KS距離KS3及びKS4の測定が、かかる相関を検定する手段を提供する。このシナリオでは、標本内KS距離値と標本間KS距離値との間の関係は、
【0060】
【数1】

【0061】
となり、標本内測定についてはKS1及びKS2の値が大きいのでC1とC2との間での両パラメータにおける変化が著しいことを示し、標本間測定についてはKS3値及びKS4値が小さいのでC1及びC2の両方での2個のパラメータの分布の間の差が類似していることを示し、P1とP2との間の高い相関度を示す。
【0062】
対照的に、シナリオBでは、P1の分布のみがC1とC2との間で著しく変化し、P2は実質的に同じ分布のままである。このシナリオでは、標本内KS距離値と標本間KS距離値との間の関係は、
【0063】
【数2】

【0064】
となり、標本内測定についてはKS1の値が大きいのでP1の分布の変化がC1とC2との間で著しいことを示し、KS2の値が小さいのでP2の分布がC1及びC2との間で保存されていることを示し、標本間測定については、KS3値が小さいのでP1及びP2の分布が類似していることを示して、C1ではこれらのパラメータに相関があることを示すことができ、KS4の値が大きいのでC2ではP1とP2との間に相関が存在しないことを示す。
【0065】
結果的に、本発明の様々な態様での方法による標本内距離計量と標本間の距離計量との組み合わせは、
i)パラメータ同士の間の相関についての検定(全ての条件において小さい標本間KS距離の検出)、及び
ii)諸条件の間でのパラメータ相関の変化の強調(条件間にわたって変化する標本間KS距離の検出)
のための新たな方法を提供する。
【0066】
第一の態様はHCSでのデータ収集を最適化するときに重要なものであり、すなわち相関のあるデータ(すなわち同じ現象を異なる手段によって記述するデータ)の収集は冗長な作業であってデータ記憶及び処理時間の無駄になる。第二の態様はHCSデータの情報量を最大化するときに重要なものであり、すなわち2個のパラメータが相関を変化させているとの情報は、既存のパラメータから付加的な情報を与え得る(例えば対象の寸法パラメータの相関の変動は、個々のパラメータからは自明でない対象の形態の変化に関係する情報を与え得る)。
【0067】
当業者には、上述のような二つの条件の下であれ、また大規模HCSスクリーニングプログラムにおいて見受けられ得るように、様々な条件が異なる物質や物質の濃度に異なる時間にわたり細胞群を曝露すること又は単独で若しくは組み合わせた他の変化する条件に相当し得るようなさらに大規模な条件系列の下であれ、2個のパラメータが分布及び相関において様々な変化の程度を呈する場合に、かかる2個のパラメータの間での様々な挙動を含むさらに他のシナリオが可能であることが明らかとなろう。さらにまた、当業者には、標本内解析と標本間解析とを組み合わせたときに本発明の各態様において具現化される同じ原理を2よりも多いパラメータに対し適用することができ、但し標本間距離計算については対単位の比較の数が幾何級数的に増大する可能性があることが明らかとなろう。
【0068】
図5は、本発明の一実施形態におけるデータパラメータと表現型マップ次元との間の関係を示す。
【0069】
本発明の一実施形態に係る一つの方法をさらに大きいデータセットに適用したものについて図5に示す。パラメータの個数がPである任意のHCSパラメータセットについて、利用可能な対単位の標本間距離測定の数は、次の通りである。
【0070】
【数3】

【0071】
全P個のパラメータについてこれらの標本間距離測定(すなわち所与の処理条件における各々のパラメータの分布の間での全ての距離)を標本内距離測定(すなわち所与の処理条件における個々のパラメータの分布と統制条件の下での同じパラメータの分布との間の全ての距離)と組み合わせると、距離測定の合計数Mが得られる。
【0072】
【数4】

【0073】
式中、Mは、パラメータPのセットについて全ての利用可能な距離計量を表わす表現型距離マップとしてのデータの図形的表現の次元の数であって、図5に示すようにPの幾何学的関数として増加する。
【0074】
典型的な表現型距離マップを4個のパラメータP1、P2、P3及びP4について図5に示す。マップの各々の軸は、KS距離測定について利用可能な範囲に対応して0から1まで目盛られており、各々の軸は、標本内計量(P1、P2、P3及びP4)についてのKS距離値、及び6個の利用可能な標本間距離計量(P1−P2、P1−P3、P1−P4、P2−P3、P2−P4及びP3−P4)についてのKS距離値を示す。
【実施例1】
【0075】
多パラメータ型細胞データの生成及び解析
CHO−K1細胞を、5%FBSを加えたハムF12培地において細胞6000個/ウェルとしてGE Healthcare 96 well MatriPlateに接種し、標準的な組織培養条件の下で24時間にわたりインキュベートした。マイトマイシンC(MMC)溶液を培地に加えてアッセイにおける最終的な濃度を0mM〜10mMとし、細胞をさらに48時間にわたりインキュベートした。培地をウェルから取り出して、細胞200mLのリン酸緩衝生理食塩水(PBS)で1回洗浄し、続いて室温において30分間にわたりエタノールにおいて固定した。核を室温において15分間にわたり5mMのHoechst(商標)33342(Sigma社)によって染色し、細胞を200mLのPBSで洗浄した。
【0076】
細胞は、20倍対物レンズでのGE Healthcare IN Cell Analyzer 1000(商標)によってv3.5取得ソフトウェア(GE Healthcare社から市販)を用いて撮影された。画像はオンライン細胞計数を用いて取得されて、最小で細胞1000個/ウェルを取得した。画像を核の面積、長さ、周長及び加重付き慣性モーメント(WMOI)についてGE IN Cell Investigator(商標)ソフトウェア(GE Healthcare社から市販)を用いて解析した。
【0077】
図6は、マイトマイシンCの濃度を高めながら処理された細胞のハイコンテントスクリーニングからの典型的な画像を示す。
【0078】
DNA鎖切断を生ずる周知の染色体異常誘発剤であるMMCによる細胞の処理は、細胞周期のG2期での細胞周期中断に関連する核面積の増大、ミトーシスにおける損傷を受けた染色体の誤った分離を通じた小核の形成、並びに高濃度では核断片化及び分解に関連する核の形状及び組織構造の変化等を含め、核形態に著しい変化を起こす。核の寸法、形状及び形態の変化は、図6に示すHCS画像取得からの典型的な画像において明瞭に見える。画像A、B及びCは、それぞれ0μM、0.16μM及び2.5μMのMMCによって処理された細胞の典型的な核形態を示しており、画像B(0.16μMのMMC)の嵌め込み画像はさらに拡大した核の像であって、関連する小核が染色体異常誘発DNA損傷から生じていることを示している。
【0079】
4個の核形態パラメータが自動画像解析を用いて画像から抽出され、同じ濃度のMMCに曝露された再現標本からのデータを組み合わせて、図7〜図10に示すような4個のパラメータの各々についての群分布ヒストグラムを得た。図7〜図10の各々において、1コマ目のデータは統制細胞からのものであり、2コマ目〜12コマ目のデータはMMC0.01μM〜10μMの範囲にわたるMMC処理細胞からのものである。
【0080】
標本内測定を用いたデータのKS距離解析(すなわちMMCが存在しない場合の細胞データと、0.01μM〜10μMの範囲にわたるMMCの所与の濃度での細胞データとの間でのKS距離の計算)を行ない、得られたデータを図11に示す。このデータは、全4個の測定パラメータについてKS距離の明らかな投与量依存型増大を示しており、無処理細胞に対するこれらのパラメータの著しい投与量依存型変化を示す。核の面積、長さ及び周長の3個のパラメータは、全MMC濃度範囲にわたり殆ど同等の無処理細胞からのKS距離を示した。また、WMOI(核の内部でのDNA染色ピクセル強度値の分布の計量)も投与量依存型変化を示したが、程度は他の3個の測定パラメータとは異なっていた。
【0081】
全6個の可能なパラメータ対(面積−長さ、面積−WMOI、長さ−WMOI、面積−周長、長さ−周長、周長−WMOI)について、同じMMC濃度における2個のパラメータについてのデータ分布の間でのKS距離の計算によって標本間KS距離を算出した。異種の次元を有する様々なパラメータに対してKS距離計量を実行するために、下式の関数を用いてパラメータ値を0〜1の範囲に正規化した(Pnorm)。
【0082】
【数5】

【0083】
標本間KS測定の結果を図12に示す(対単位の距離計量は次のように示す。A−L:面積−長さ、A−W:面積−WMOI、L−W:長さ−WMOI、A−P:面積−周長、L−P:長さ−周長、P−W:周長−WMOI)。データは、パラメータ同士の間の関係において、限定しないが下記を含めて標本間KS距離計算によって明らかにされる多くの明瞭なパターンを示す。
i)面積及び長さ(A−L)は、全MMC濃度範囲にわたって一定の小さいKS距離を示し、これら2個のパラメータが高い相関度を有する類似した分布を示していることを示す。これら二つの形態学的計量は両方とも核寸法によって直接影響されるため、このデータは、核はMMC処理後に寸法が増大しているが、面積と長さとの間の関係を変化させる形態学的変化(例えば円形から卵形への変化)を蒙っていないことを示す。
ii)長さ及びWMOI(L−W)は、MMC濃度範囲の殆どにわたって一定の高いKS距離を示し、これら2個のパラメータが低い相関度を有すること、すなわち核の内部でのDNA強度分布が核長さには関係していないことを示す。
iii)周長及びWMOI(P−W)は、これらのパラメータについて標本内KS距離の場合に観察されたものと反対の態様でのKS距離の投与量依存型の変化を示し、すなわち周長分布とWMOI分布との間での標本間KS距離がMMC濃度と共に減少しており、これら2個のパラメータが、低投与量においては相関していないが高投与量においては相関するようになり、増加する核周長とDNA分布との間の何らかの形態の関係性が絡んだ表現型の変化を示唆している。
iv)面積及び周長(A−W)は、低MMC濃度及び高MMC濃度において小さいKS標本間距離を示し、中間的な濃度ではKS距離の増大を示し、低いMMC濃度、中間的なMMC濃度及び高いMMC濃度において2種又は3種の表現型クラスが生じている可能性を示す。
【0084】
DNA損傷を誘発するMMCのような薬剤による細胞の処理が、細胞の内部で生じる複雑な事象系列を導いてMMC濃度に関係付けられる一定範囲の表現型を帰結することは周知である。低濃度では、細胞はDNA損傷を修復することができ、細胞周期の進行には殆ど又は全く影響を与えず、核形態及び小核形成には小さい変動しか生じない。高いMMC濃度では、結果的にさらに高レベルのDNA損傷が生じており、この損傷が細胞に対してさらに大きいDNA修復負担を課し、著しい細胞周期遅延及び小核形成の増大、並びに核構造の他の変化を帰結する。さらに一層高いMMC投与量ではDNA損傷の範囲が十分に高くなるためこのことをきっかけとして細胞がアポトーシスを経て、核形態の甚だしい変化及び核分解を伴う。
【0085】
これらの相互に関係するプロセスの全てがMMC処理された細胞に極めて複雑な事象の系列を生じさせ、MMCの様々な濃度において観察される表現型に対して直接的に又は間接的に影響する。細胞の大規模な群の内部で生ずる事象の複雑さは、標本内群データ分布のような従来の解析的アプローチでは十分に明らかではない(図11)。付加的な標本間群データ分布比較計量を用いた本発明の各態様による方法の適用(図12)によって、従来の解析では明らかでない表現型変化を示すデータのパターンが明らかになる。
【0086】
標本内距離計量と標本間距離計量との組み合わせを用いて、様々な処理条件での測定パラメータの変動及び相互関係を要約する表現型マップ(図13)を生成することができる。かかるマップによって、投与量−応答プロットのような従来の図形的表現では十分に明らかでなかったHCS解析データの傾向及び相互関係の速やかな視覚的同化が可能になる。
【0087】
前述で図5に示すように、表現型距離マップの複雑さは解析されるパラメータの個数と共に幾何級数的に増大するが、これらの複雑なマップを図14に示すように一連のより単純な要素に分解してさらに詳細な解析を支援することができる。
【0088】
最も単純な場合(図14のA)では、3個のパラメータから導かれる表現型マップが3本の軸を有し、パラメータ(P1及びP2)の各々について標本内距離計量に1本ずつであり、1本は利用可能な対単位の標本間距離計量(P1−P2)のみについてのものである。解析されるパラメータの個数が3まで増大すると、マップの複雑さが少し増大して(図14のB)6本の軸となり、パラメータ(P1、P2及びP3)の各々について標本内距離計量に1本ずつであり、3本は対単位の標本間距離計量(P1−P2、P1−P3及びP2−P3)についてのものである。解析されるパラメータの個数がさらに増大すると、距離マップ軸の本数は増大して、前述のように軸の本数Mは式4によってパラメータPの数に関係付けられる。
【0089】
パラメータの個数及び結果的な表現型距離マップの複雑さのレベルを問わず、任意のかかるマップを分解して、各々が単一の対単位の比較を表わす一定数の単純な成分にすることができる。故に、図14に示すように、3個のパラメータの解析から導かれるM=6(図14のB)であるマップを分解して、一連の成分要素B1、B2及びB3にすることができる。次元Mの任意の所与の表現型マップについて、成分要素の個数は式3によって定義されるようなものとなる。
【0090】
表現型マップを対単位の比較に基づく成分に分解すると、個々の対に対し、当該パラメータ対についての標本内距離スコア(D)及び標本間距離スコア(d)に基づく表現型変化スコア(S)を与えることが可能になる。
【0091】
【数6】

【0092】
式中、スコアは当該対について算出される標本間距離に基づく加重を施され、すなわち大きい標本間距離を有して相関の欠如を示す2個のパラメータは、低い標本間距離スコアを付けられた同じパラメータ値よりも高いスコアを生成する。
【0093】
1よりも多い成分を含む複雑なマップでは、これらのスコアを各々の成分について算出することができ、個々のスコアを加算してHCS解析において測定される全てのパラメータを考慮に入れた累積スコアを求めることにより、全体的な表現型変化スコアを算出することができる。一定範囲のMMC濃度によって処理されて四つの核形態パラメータについて解析された細胞の累積表現型スコアを図15に示す。
【0094】
当業者には、本発明の各態様による方法に記載されているように標本内KS距離計量と標本間KS距離計量とを組み合わせる原理に基づいて、さらに他の形式のデータ比較及び累積スコア決定が可能であることが容易に理解されよう。例えば、パラメータ同士の間の相関度を確定するために、異なるパラメータ同士の間でのKS距離計量を統制群において求めた基準標本間距離計量を付加的に含めると、さらに詳細な対単位の比較及び表現型スコア決定を施すことが可能になる。
【0095】
この統制群標本間距離計量という付加的な因子を用いると、パラメータの個々の対に対し、統制群の標本間距離スコア(dc)及び処理済み群の標本間距離スコア(dt)の両方と組み合わせた両パラメータについての標本内距離スコア(D)に基づいて下式の表現型変化スコア(S)を与えることが可能になり、ここでのスコアは2種の条件の下でのパラメータの相関度を考慮に入れたものとなる。
【0096】
【数7】

【0097】
このアプローチは、一定範囲の条件にわたる相関変化を考慮に入れることを可能にする。例えば、2個のパラメータが統制標本でも検定標本でも相関していない(dc及びdtが両方とも高い)ようなシナリオでは得られるスコアが最大になり、2個のパラメータが統制標本及び検定標本の何れでも相関している場合(dc及びdtが両方とも低い)に得られるスコアが最小になることと対照的である。
【0098】
全てのパラメータ対についてこの演算を実行し、加算して累積スコアを生成すると、測定された全てのHCSパラメータに基づいてデータを要約する方法が与えられる。
【0099】
以上の方法、及び本発明の他の関係する実施形態は、標本間の群分布距離計量及び標本内の群分布距離計量の両方の利用を包含しており、極めて複雑なHCSデータセットを、大規模スクリーニングプログラムにわたり容易に比較され得る計量として統合して要約することができる。本発明の様々な態様及び実施形態の方法は、薬物、RNAi又は他の大規模スクリーニングプログラムの評価に有用であり、かかる方法によるマルチパラメータデータの統合によって、組み合わされた表現型パラメータに基づいてスクリーニングヒットを識別することが可能になり、また異なる表現型クラスを生成する異なる処理効果を異なる累積表現型スコアによって識別して分離することが可能になる。
【0100】
最終的な解析パラメータセットから相関のあるパラメータを除去することにより、本発明の様々な態様及び実施形態は、例えば小規模な解析を実行し、相関のあるパラメータを決定し、次いで相関のあるパラメータを、より大規模な解析のために後に用いられる解析パラメータセットから省くことにより、解析効率を高めることができる。
【0101】
本発明の様々な態様及び実施形態はまた、又は代替的に、測定された相関に関してパラメータ値を修正する際に、相関のあるパラメータが表現型スコア(1又は複数)に過大な影響を及ぼさないように表現型スコアが記述パラメータの加重付き集計を含むようにして、修正されるパラメータを保ったまま修正することを可能にする。
【0102】
本発明を様々な実施形態に関して記載したが、当業者は、多くの異なる実施形態及び変形が可能であることを認められよう。かかる全ての変形及び実施形態は、特許請求の範囲によって画定される本発明の範囲内に含まれるものとする。
【0103】
参考文献
1. S. A. Haney, P. LaPan, J. Pan and J. Zhang, “High-content screening moves to the front of the line,” Drug Discovery Today, Vol. 11, No. 19-20, pp. 889-894, October 2006
2. S. Siegel and N. J. Castellan, Non-Parametric Statistics for the Behavioural Sciences, McGraw-Hill, New York, USA, 2nd Edition, 1988
3. Z. E. Perlman, M. D. Slack, Y. Feng, T. J. Mitchison, L. F. Wu and S. J. Altschuler, “Multidimensional drug profiling by automated microscopy,” Science, Vol. 306, pp. 1194-1198, 12 November 2004
4. B. Zhang, X. Gu, U. Uppalapati, M. A. Ashwell, D. S. Leggett and C. J. Li, “High-content fluorescent-based assay for screening activators of DNA damage checkpoint pathways,” Journal of Biomolecular Screening, Vol. 13, No. 6, pp. 538-543, 19 June 2008
5. US 2006/0154236 (Altschuler et al)
認められる場合には以上の参考文献の内容を参照により全体として本出願に援用する。
【符号の説明】
【0104】
100:自動ハイコンテントスクリーニング(HCS)装置
102:光源
104:集光装置
106:開口絞り
108:鏡検プレート
109:ウェル(スポット)
110:対物レンズ
112:検出器システム
114:プロセッサ
120a、120b:光
120c:発散光
120d:集束光
200:マルチパラメータデータセットから1以上の表現型を識別する方法

【特許請求の範囲】
【請求項1】
マルチパラメータデータセットから1以上の表現型を識別する方法(200)であって、
前記マルチパラメータデータセットの内部でパラメータの各対の間での相関を測定するステップ(202)と、
解析パラメータセットを形成するために、所定のマルチパラメータデータ解析セットの内部で相関のあるパラメータ値を修正するステップ(204)と、
前記マルチパラメータデータセットから1以上の表現型を識別するために、前記解析パラメータセットを用いて前記マルチパラメータデータセットを解析するステップ(206)と
を含む方法。
【請求項2】
複数のマルチパラメータデータセットから1以上の表現型を識別するステップと、前記マルチパラメータデータセットからのそれぞれの表現型の間の変動を識別するためにそれぞれの表現型を比較するステップとをさらに含む、請求項1記載の方法(200)。
【請求項3】
複数のマルチパラメータデータセットについて1以上のそれぞれの解析パラメータセットを形成するステップと、相関関係が前記マルチパラメータデータセット同士の間で保たれているか否かを決定するために前記解析パラメータセットを比較するステップとをさらに含む、請求項1又は請求項2記載の方法(200)。
【請求項4】
相関が、前記所定のマルチパラメータデータ解析セットにおいて前記表現型同士の間で行なわれるノンパラメトリックの統計学的な対単位の測定により決定される、請求項1乃至請求項3のいずれか1項記載の方法(200)。
【請求項5】
前記ノンパラメトリックの統計学的な対単位の測定が、コルモゴロフ−スミルノフ(KS)距離測定解析を含む、請求項4記載の方法(200)。
【請求項6】
前記所定のマルチパラメータデータ解析セットの内部で相関のあるパラメータ値を修正する前記ステップ(204)は、前記解析パラメータセットから所定の閾値を超える相関を有する一対のパラメータの一方を除去することを含む、請求項1乃至請求項5のいずれか1項記載の方法(200)。
【請求項7】
請求項1乃至請求項6のいずれか1項記載の方法(200)を具現化するようにデータ処理装置を構成するように動作可能である機械命令を備えるコンピュータプログラムプロダクト。
【請求項8】
1以上のマルチパラメータデータセットの自動ハイコンテントスクリーニング(HCS)のための装置(100)であって、
マルチパラメータデータセットの内部でパラメータの各対の間での相関を測定し、
解析パラメータセットを形成するために、前記マルチパラメータデータセットについて所定のマルチパラメータデータ解析セットの内部で相関のあるパラメータ値を修正して、
前記マルチパラメータデータセットから1以上の表現型を識別するために、前記解析パラメータセットを用いて前記マルチパラメータデータセットを解析する
ように動作可能であるプロセッサ(114)を備える装置(100)。
【請求項9】
前記プロセッサ(114)は、複数のマルチパラメータデータセットから1以上の表現型を識別して、前記マルチパラメータデータセットからのそれぞれの表現型の間の変動を識別するためにそれぞれの表現型を比較するようにさらに動作可能である、請求項8記載の装置(100)。
【請求項10】
前記プロセッサ(114)は、複数のマルチパラメータデータセットについて1以上のそれぞれの解析パラメータセットを形成して、相関関係が前記マルチパラメータデータセット同士の間で保たれているか否かを決定するために前記解析パラメータセットを比較するようにさらに動作可能である、請求項8又は請求項9記載の装置(100)。
【請求項11】
前記プロセッサ(114)は、前記所定のマルチパラメータデータ解析セットにおいて前記表現型同士の間で行なわれるノンパラメトリックの統計学的な対単位の測定を用いることにより相関を決定するようにさらに動作可能である、請求項8乃至請求項10のいずれか1項記載の装置(100)。
【請求項12】
前記ノンパラメトリックの統計学的な対単位の測定が、コルモゴロフ−スミルノフ(KS)距離測定解析の利用を含む、請求項11記載の装置(100)。
【請求項13】
前記プロセッサ(114)が、前記解析パラメータセットから所定の閾値を超える相関を有する一対のパラメータの一方を除去することにより、相関のあるパラメータ値を修正するようにさらに動作可能である、請求項8乃至請求項12のいずれか1項記載の装置(100)。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate


【公表番号】特表2012−524893(P2012−524893A)
【公表日】平成24年10月18日(2012.10.18)
【国際特許分類】
【出願番号】特願2012−506521(P2012−506521)
【出願日】平成22年4月23日(2010.4.23)
【国際出願番号】PCT/EP2010/055439
【国際公開番号】WO2010/122147
【国際公開日】平成22年10月28日(2010.10.28)
【出願人】(398048914)ジーイー・ヘルスケア・ユーケイ・リミテッド (30)
【Fターム(参考)】