生物検体を処理するための複数の波長を用いる方法およびシステム
検体スライドに保持された1もしくは2つ以上の生物検体を処理するための方法およびシステム。検体中の対象物のイメージを取得し、取得したイメージ中の目的とする対象物を識別する。識別された目的とする対象物の追加のイメージを複数の波長で取得することができる。目的とする対象物の細胞の特徴をイメージから抽出し、これを用いて、抽出された特徴を用いる確率モデルに基づき、例えば、正常または疑わしい/異常、として検体を分類することができる。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、生物検体の特性決定または分類のためのシステムおよび方法に関する。
【背景技術】
【0002】
医療業界では、細胞検査技師を例とする実験技術者にとって、特定の種類の細胞の存在について細胞検体のレビューを行う必要性が多くの場合存在する。例えば、現在、頚膣パパニコロウ(cervical−vaginal Papanicolaou)(Pap)スメアスライドのレビューを行う必要性が存在する。Papスメアは、癌性および前癌性頚部病変を検出するための強力なツールである。頚部スクリーニングおよびその他の検体のスクリーニングの信頼性ならびに有効性は、前癌性病変を診断し(感度)、同時に偽陽性の診断を避ける(特異性)その能力によって評価される。その結果、これらの基準は細胞学的解釈の正確性に依存する。
【0003】
従来から、病理学者は、個々の細胞核の特徴を調べることによる生物検体に対する単一細胞分析、またはスライド上に現れる細胞の構造の特徴的なパターンを探索することによる生物検体に対するコンテクスト分析(contextual analysis)を行うことができる。このレビューのプロセスを促進するために、複数の顕微鏡スライドを処理する自動スクリーニングシステムが開発されてきた。典型的なシステムでは、イメージング装置(imager)を操作して、各々がスライドの異なる部分を示す、細胞検体スライドの一連のイメージを取得する。次に、プロセッサまたはコントローラがこのイメージデータを処理し、検体に関する定量的な予後情報が提供される。この診断情報の提供に際して、プロセッサは、単一細胞分析もしくはコンテクスト分析のいずれか、またはその両方を実施することができる。
【0004】
いくつかの自動化スクリーニングシステムでは、プロセッサは、診断情報を用いて、各々の検体の中の正常、および異常もしくは疑わしい生物物質の間の線引きを行う。すなわち、プロセッサは、細胞検査技師を最も適切である細胞に集中させ、残りの細胞をさらなるレビューから除外するという能力を有する。この場合、スクリーニング装置は、診断情報を用いて最も適切である生物対象物、およびそのスライド上の位置を決定する。この位置情報がレビュー用の顕微鏡へ提供され、これは、細胞検査技師によるレビューのために、自動的に識別された位置へと進み、生物対象物に焦点を合わせる。細胞検査技師は、次に、病理学者によるさらなるレビューのために、その最も適切である生物対象物(例えば、悪性または前悪性細胞に一貫する特質を持つ対象物)に電子的な標識を行うことができる。
【0005】
例えば、1つの自動システムでは、対象物または「目的とする対象物」(OOI)が、イメージデータに基づいて識別される。対象物またはOOIは、検体の個々の細胞および細胞クラスターの形態を取っていてよい。このシステムは、例えば、特定の細胞または対象物が悪性腫瘍または前悪性腫瘍などの異常な状態を有するリスクの程度に基づいて、識別された領域または対象物を分類するように構成することができる。例えば、プロセッサは、核の合計の(nuclear integrated)または平均の光学密度について対象物を評価し、その光学密度の値に応じて対象物をランク付けすることができる。対象物は、その相対的なランクおよび座標と共に、続いての処理、レビュー、または分析のために、保存することができる。イメージデータおよびOOIを処理する公知のイメージングシステムおよび方法のさらなる局面は、特許文献1に記載されている。
【0006】
一般的に、自動スクリーニングシステムの使用は、技術者の注意が、疑わしいスライド、または各スライド中の限られた数のより適切である対象物に集中されるため、効率的である。しかし、自動スクリーニングシステムは、改良することができる。例えば、偽陽性または「偽異常」という結果の割合を低減するために、自動システムがアーチファクトを処理する方法を改良することができる。アーチファクトは、診断的価値を持たない対象物と見なすことができる。偽陽性の1つの原因はアーチファクトの存在であり、これは、検体サンプル中に大量に存在し得るもので、異常検体に類似する大きな暗い対象物であり得る。アーチファクトは、正常細胞を含む対象物よりも上位にランク付けされ得る。
【0007】
例えば、異常核と比較して、正常核は通常、DNAの量が少なく、構造(texture)も少ない。最上位にランク付けされた対象物においてアーチファクトの存在なしでは、正常スライド中の細胞の大部分は、緊密に分布したDNA量を有する。しかし、異常細胞に類似する非常に数多くのアーチファクトが、大部分の正常細胞よりも上位にランク付けされ、これらのアーチファクトは、データモデリングにおいて偽の警告を発する。これらのアーチファクトのために、実際の細胞がランク付けされ、「最上位の」DNA量を有する細胞のリストに正しく提示されることができなくなる場合がある。従って、自動システムは、レビューすべき細胞を選択するのではなく、むしろ、アーチファクトが異常細胞であると間違って認識してしまい、異常核よりも上位にランク付けされるアーチファクトを選択してしまう。この結果、実際に細胞を有する対象物を選択する数、および細胞検査技師によるレビューに値する異常対象物を選択する数が減ることとなり、その結果として、分析および診断の正確性が低下し、誤ったものとなる可能性がある。
【0008】
偽陽性の発生は、時に、自動イメージング装置の能力または構成に限界があることに起因する。すなわち、自動イメージング装置は、それに提供される検体およびデータ、ならびにそのプログラミングによって制限され得る。例えば、演算処理上の理由から、イメージング装置は通常、モノクロの白黒イメージを解析に用いる。公知のモノクロシステムの例は、ベクトンディッキンソンカンパニー、1 ベクトンドライブ、フランクリンレイクス、ニュージャージー(Becton Dickinson Company,1 Becton Drive,Franklin Lakes,New Jersey)、およびサイティックコーポレーション、250 キャンパスドライブ、マールボロ、マサチューセッツ(Cytyc Corporation,250 Campus Drive,Marlborough,Massachusetts)、より入手可能である。しかし、検体は、広範囲にわたるスペクトルデータ、およびサンプルの特性決定または分類に用いることができるその他の情報を提供し得る。しかし、モノクロイメージングおよび解析システムを用いる場合、このその他のデータを利用することができない。
【先行技術文献】
【特許文献】
【0009】
【特許文献1】米国特許公開第2004/0254738A1号
【発明の概要】
【0010】
1つの態様は、検体キャリア(specimen carrier)上の生物検体を分類して、その検体にさらなる分析が必要かどうかを決定するための方法に関する。この方法は、検体中の対象物のイメージを取得すること、およびそのイメージ中の目的とする対象物を識別することを含む。この方法は、さらに、識別された目的とする対象物の追加のイメージを複数の異なる波長にて取得すること、識別された目的とする対象物の細胞の特徴を追加のイメージから抽出すること、および抽出された細胞の特徴に基づく確率モデルに従って検体を分類し、その検体にさらなる分析が必要かどうかを決定すること、を含む。
【0011】
別の態様は、検体キャリア上の生物検体を自動的に分類して、その検体にさらなる分析が必要かどうかを決定するための方法に関する。この方法は、検体中の対象物のイメージを取得すること、および取得されたイメージから目的とする対象物を識別することを含む。この方法は、さらに、識別された目的とする対象物の追加のイメージを複数の異なる波長にて取得すること、識別された目的とする対象物の核に関連する特徴を追加のイメージから抽出すること、および抽出された核に関連する特徴に基づく確率モデルに従って検体を分類すること、を含む。確率モデルは、第一および第二の確率関数を含む。第一の確率関数は、識別された目的とする対象物がアーチファクトである確率を示し、第二の確率関数は、部分的に、第一の確率関数の結果に基づく。第一および第二の確率関数を組み合わせて用いることにより、検体を分類し、その検体にさらなる分析が必要かどうかを決定する。
【0012】
さらなる態様は、複数の波長の光を利用する生物検体の処理の方法に関し、生物検体中の対象物のイメージを取得すること、および取得されたイメージ中の目的とする対象物を識別すること、を含む。この方法は、さらに、識別された目的とする対象物の追加のイメージを複数の異なる波長にて取得すること、および識別された目的とする対象物の細胞の特徴を追加のイメージから抽出すること、を含む。
【0013】
さらに別の態様は、複数の波長の光を利用する生物検体の分類の方法に関し、生物検体中の対象物のイメージを取得すること、および取得されたイメージ中の目的とする対象物を識別すること、を含む。この方法は、さらに、生物検体の目的とする対象物の追加のイメージを複数の異なる波長にて取得すること、目的とする対象物の細胞の特徴を取得されたイメージから抽出すること、および抽出された細胞の特徴に基づいて生物検体を分類すること、を含む。
【0014】
さらなる態様は、複数の波長の光を利用する生物検体の分類の方法に関し、生物検体の目的とする対象物のイメージを複数の波長で取得すること、目的とする対象物の細胞の特徴を取得されたイメージから抽出すること、および抽出された細胞の特徴に基づいて生物検体を分類すること、を含む。
【0015】
別の態様によると、検体キャリア上に保持された生物検体を分類してその生物検体にさらなる分析が必要かどうかを決定するための生物スクリーニングシステムは、イメージング部材およびイメージング部材と操作可能に連結されたプロセッサを含む。イメージング部材は、生物検体中の対象物のデジタルイメージデータを取得するように構成され、プロセッサは、そのデジタルイメージデータから目的とする対象物を処理し、識別するように構成される。イメージング部材は、さらに、識別された目的とする対象物の追加のイメージを複数の異なる波長にて取得するようにも構成される。プロセッサは、識別された目的とする対象物の細胞の特徴を追加のイメージから抽出し、および抽出された細胞の特徴キャリアに基づき、確率モデルに従って生物検体を分類し、その生物検体にさらなる分析が必要かどうかを決定するようにさらに構成される。
【0016】
さらなる態様によると、検体キャリア上に保持された生物検体を分類して生物検体にさらなる分析が必要かどうかを決定するための生物スクリーニングシステムは、イメージング部材およびイメージング部材と操作可能に連結されたプロセッサを含む。イメージング部材は、生物検体中の対象物のイメージを取得するように構成され、プロセッサは、取得されたイメージから目的とする対象物を処理し、識別するように構成される。イメージング部材は、識別された目的とする対象物の追加のイメージを複数の異なる波長にて取得するようにさらに構成される。プロセッサは、識別された目的とする対象物の核に関連する特徴を異なる波長にて取得された追加のイメージから抽出し、および測定された細胞の特徴に基づく確率モデルに従って生物検体を分類するようにさらに構成される。確率モデルは、第一および第二の確率関数を含む。第一の確率関数は、選択された対象物がアーチファクトである確率を示し、第二の確率関数は、部分的に、第一の確率関数の結果に基づく。第一および第二の確率関数を組み合わせて用いることにより、生物検体を分類して、その生物検体にさらなる分析が必要かどうかを決定する。
【0017】
さらなる別の選択肢としての態様は、イメージング部材およびイメージング部材と操作可能に連結されたプロセッサを含む、生物検体分類システムに関する。イメージング部材は、生物検体の目的とする対象物のイメージを複数の異なる波長にて取得するように構成され、プロセッサは、取得されたイメージから細胞に関連する特徴を抽出し、抽出された細胞に関連する特徴に基づいて生物検体を分類するように構成される。
【0018】
1もしくは2つ以上の態様では、抽出または測定された細胞の特徴は、核に関連する特徴であり、例えば、核内での光学濃度の標準偏差、核内での光学濃度の変動、核の補正された光学濃度、および核の境界の形状である。
【0019】
1もしくは2つ以上の態様では、分類に用いられる確率モデルは、2つの確率関数を含み、例えば、事後確率関数である。1つの確率関数は、生物検体の識別された目的とする対象物がアーチファクトである平均確率を示し、もう一方の確率関数は、部分的に、第一の確率関数の結果に基づく。両方の確率関数が、異なる数および種類の抽出された核に関連する特徴に基づいていてよい。例えば、第一の確率関数は、核の構造、核内での光学濃度の標準偏差、核内での光学濃度の変動、核の補正された光学濃度、および核の境界の形状のうちの1もしくは2つ以上、またはすべてに基づいていてよく、第二の確率関数は、第一の確率関数の結果、ならびに識別された目的とする対象物の細胞の核のイメージのピクセルのグレー値コントラスト(gray value contrast)の平均、および識別された目的とする対象物の細胞の核のイメージのピクセルのグレー値コントラストの範囲のうちの1もしくは2つ以上、に基づいていてよい。第一および第二の確率関数の結果は、グラフのフォーマットにプロットまたは表示して生物検体を分類し、検体にさらなるレビューが必要かどうか、または検体の群のどの検体にさらなるレビューが必要かを決定することができる。
【図面の簡単な説明】
【0020】
ここで、全体を通して同一の符号が対応する部分を表す図面を参照する:
【0021】
【図1】図1は、生物検体スライドを分類し、そのスライドに1つの態様に従って分析またはレビューを行うべきかどうかを決定するためのシステムのブロック図である。
【図2】図2は、生物検体スライドの平面図である。
【図3】図3は、複数の波長の光を用い、1つの態様に従う確率モデルにより生物検体スライドを分類するためのシステムのブロック図である。
【図4】図4は、複数の波長の光を用い、1つの態様に従う確率モデルにより生物検体スライドを分類するための方法のフローチャートである。
【図5】図5は、細胞およびアーチファクトを含む生物検体の対象物の一部分を一般的に示す図である。
【図6】図6は、種々の態様に用いられる複数の確率関数を含む確率モデルを示す図である。
【図7】図7は、対象物がアーチファクトである確率を決定するために種々の態様で用いられる第一の確率関数を一般的に示すフローチャートである。
【図8】図8は、別の態様に従う第一の確率関数のフローチャートである。
【図9】図9は、生物検体が正常である確率を決定するために種々の態様で用いられる第二の確率関数を一般的に示すフローチャートである。
【図10】図10は、別の態様に従う第二の確率関数のフローチャートである。
【図11】図11は、第一および第二の確率関数によって得られたデータをどのようにグラフにプロットすることができるかを一般的に示す図である。
【図12】図12は、図11に示すグラフでプロットした、正常および異常スライドを表す試験データポイントを示す。
【図13】図13は、図12に示される試験の際に識別された対象物を示す表である。
【図14】図14は、態様を実現することができ、イメージングステーション、サーバー、およびレビューステーションを含む、別の選択肢としての生物検体分析システムを示す図である。
【図15】図15は、態様を実現することができ、一体化されたイメージングおよびレビュー機能を含む、別の選択肢としての生物検体分析システムを示す図である。
【発明を実施するための形態】
【0022】
図1および2を参照すると、態様に従う多波長生物検体スクリー二ングシステム(multi−wavelength biological specimen screening systems)100および方法は、スライド110またはその他の適切なキャリアに保持された生物検体(例:細胞検体)112のイメージを取得し、目的とする対象物(OOI)を例とする対象物を識別し、次に、選択された対象物またはOOI(一般に「OOI」と称する)のイメージを、複数の異なる波長にて取得する。OOIの細胞の核に関連する特徴を例とする細胞の特徴に関連するデータを、多スペクトルイメージ(multi−spectral images)から決定、抽出、または測定する。説明を簡略化するために、OOIの細胞の特徴の抽出について述べる。このデータは、分類の目的に、およびその他の応用に用いることができる。
【0023】
1つの態様によると、スクリーニングシステム100は、複数の波長にて取得されたOOIのイメージから抽出された核の特徴に関するデータを用いる確率モデル120に従い、生物検体112を「正常」または「疑わしい」として分類するように構成またはプログラムされる。例えば、図1に示すように、処理すべき生物検体スライド110の数が1000個である場合、検体分類システム100の態様は、複数の波長を用い、確率モデル120に従ってスライド110を自動的に分類することができ、それにより、特定のスライド、例えばスライド1〜300および700〜1000、が正常スライド130として分類され、その他のスライド、例えばスライド301〜699、が疑わしいスライド140として分類される。当然のことであるが、正常および疑わしいスライド130、140の数およびグループ分けは、説明の目的で提供するものである。従って、図1の場合、「正常」130検体またはスライドは、細胞検査技師によるさらなるレビューもしくは分析を必要としない検体112またはスライド110である。一般的に、スライド110は、非癌性または非前癌性検体112を有する場合に、正常130として分類される。「疑わしい」140検体またはスライドは、異常である可能性があるかまたは異常であり、癌性または前癌性細胞を含んでいてよい。
【0024】
「正常」130または「疑わしい」140としての分類は、態様の最終決定または結果として、すなわち、検体112またはスライド110にさらなる分析またはレビューが必要かどうか、として図1に示す。細胞検査技師は、次に、正常スライド130ではなく、疑わしいスライド140へ自身の注意を集中させることができる。この方法により、検体、スライド110に関する価値のある情報が複数の波長を用いることで得られ、この情報を用いて、アーチファクトによる偽陽性の頻度を低減して検体112が分類され、それによって、さらなるレビューのためにスライド110がより正確で効率的に分類および選択される結果となる。
【0025】
1つの態様によると、多波長生物スクリーニングシステム100は、細胞頚部または膣検体(Papスメアスライド上で通常見られる)などの生物または細胞検体112を有する一連の顕微鏡スライド110を処理するように構成される。この場合、細胞は、異常、軽度扁平上皮内病変(LGSIL)もしくは高度扁平上皮内病変(HGSIL)などの悪性腫瘍または前悪性腫瘍、ならびにその他のあらゆる細胞学的区分(例:感染、細胞溶解)を反映していてよい。検体112は、通常、薄細胞層(thin cytological layer)としてスライド110上に配置される。好ましくは、カバーグラス(図示せず)が検体112に接着され、それによって、検体112がスライド110上の適切な位置に固定される。検体112は、適切ないかなる染料で染色してもよく、ThinPrep(登録商標)核染料などである。
【0026】
態様を用いて、さらに、血液、尿、精液、乳、痰、粘液、胸水、骨盤液、滑液、腹水、体腔洗浄液(body cavity washes)、アイブラッシング(eye brushing)、皮膚擦過検体(skin scrapings)、頬側拭き取り検体、膣内拭き取り検体、papスメア、直腸内拭き取り検体、吸引液、針生検検体、例えば手術または検死によって得られた組織片、血漿、血清、脊髄液、リンパ液、皮膚の外部分泌物、気道、腸管、および泌尿生殖器管、涙、唾液、腫瘍、臓器、微生物培養物、ウィルス、ならびにインビトロでの細胞培養物成分のサンプル、を含むその他の種類の生物検体112の「正常」130または「疑わしい」140としての特性決定または分類も、複数の波長を用いて行うことができる。本明細書は、細胞頚部または膣検体112(Papスメアスライド上の)を参照して態様を実現することができる1つの方法を説明しており、態様は、様々な種類の組織および細胞に応用可能であることは理解されたい。システムおよび方法の態様のさらなる局面を、図3〜15を参照して説明する。
【0027】
図3を参照すると、1つの態様では、生物検体スライド110の分類または特性決定のための生物検体スクリーニングシステム300は、カメラまたはその他のイメージング部材310、顕微鏡320、生物検体スライド110および顕微鏡320を通して光332をカメラ310へ提供する光源330、生物検体スライド110を支持する電動式ステージ340、イメージプロセッサ350、ならびに付属のメモリまたは記憶装置360(一般にメモリ360と称する)を含む。メモリ360は、イメージプロセッサ350の一部分であってよく、または別個の部材であってもよい。
【0028】
イメージプロセッサ350および/またはメモリ360は、確率モデル120を記憶またはこれにアクセス可能であり、それを用いて、生物検体112を「正常」130または「疑わしい」140として分類する。確率モデル120は、ハードウェア、ソフトウェア、またはこれらの組み合わせの形態であってよい。例えば、確率モデル120は、一連のプログラムされた命令、および/またはメモリ360に記憶され、イメージプロセッサ350によって取得された検体データと合わせてイメージプロセッサ350によって実行されるデータの形態であってよい。確率モデル120は、別個のプロセッサもしくはコントローラの一部で実行されてもよい。
【0029】
カメラ310は、種々の公知のデジタルカメラのうちの1つであってよく、光源330は、単一の光源、または図3に示すように、複数の個別の光源を含んでいてよい。図3は、システム300が複数の光源330を含んでよいことを一般的に説明するために、3つの光源330a〜c(一般に光源330と称する)を示している。以下でさらに詳細に考察するように、OOIの所望される多波長分析を達成するために、必要に応じて様々な数の光源330を使用可能であること、および図3は、システム300が複数の光源330を含んでよいことを一般的に説明するために提供されること、については理解されたい。
【0030】
1つの態様によると、スクリーニングおよび分類システム300は、複数の光源330を含み、その各々が異なる波長の光332を発する。この目的のために適する光源330は、発光ダイオード(LED)であろう。他の態様では、光源330は、1もしくは2つ以上のプリズム(図示せず)、および/またはフィルター334を透過した光332が所望される波長または波長範囲を有するように1もしくは2つ以上の光学フィルター334などの1もしくは2つ以上のその他の光学部材と対となっていてよい。態様に用いることができるフィルターの例としては、二色性フィルター、干渉フィルター、フィルターホイールが挙げられる。フィルター334は、顕微鏡320、および検体112の一部分をイメージングするためのカメラ310に提供される光332の波長を変化させるように調節または選択することができる。液晶波長可変フィルターも用いることができる。適切なシステム300の部材のさらなる局面は、米国特許第2004/0253616 A1号に記載されている。
【0031】
図4を参照すると、1つの態様に従う方法400において、光332は、光源330からステージ340および顕微鏡320を通ってカメラ310へと指向され、このカメラが、工程405にて生物検体112のデジタルイメージを取得する。より詳細には、細胞検体112を有するスライド110が、顕微鏡320の視野に対してスライド110を移動または走査させる電動式ステージ340上に載せられ、一方、カメラ310が、光源330によって発光される光332により、生物検体112の全体またはその一部分にわたるイメージを捕捉する。例えば、カメラ310によって取得された各々のイメージの各ピクセルは、その光透過率に応じて8ビット値(0から255)に変換することができ、「00000000」が、ピクセルを透過する最も少ない光の量に対して割り当てられ、「11111111」が、ピクセルを透過する最も多い光の量に対して割り当てられる。スキャン速度および/または取得されるイメージの数を最大とすることができるように、カメラ310のシャッター速度は、比較的速いことが好ましい。スライド110に保持される生物検体112は、カセット(図示せず)内に収容されていてよく、その場合、スライド110は、連続する方法で、それぞれのカセットから取り出され、デジタルイメージを取得され、その後カセットに戻される。
【0032】
工程410では、取得されたイメージまたはイメージデータがイメージプロセッサ350へ提供され、このイメージプロセッサが、別名として目的とする対象物(OOI)とも称される最も適切であるもしくはランクの最も高い対象物を識別するために、イメージまたはイメージデータ312上で種々の操作を実行する。例えば、イメージプロセッサ350は、最も関連性が高いと思われる約20もしくは40個の対象物、またはその他の適切な数の対象物を識別することができる。この目的のために、イメージプロセッサ350は、米国2004/0253616に記載の一次および二次セグメント化(segmentation)を実施し、個々の対象物およびクラスター化した対象物の各々に対する種々の特徴を測定、決定、または抽出し、続いて、これらの特徴の測定された値に基づいて各対象物に対する対象物スコアを算出することができる。このスコアに基づいて、イメージプロセッサ350は、目的とする対象物(OOI)と見なされる対象物およびクラスター化した対象物を識別または選択することができ、その位置は、今後の参照のためにメモリに記憶させることができる。
【0033】
図5を参照すると、イメージプロセッサ350は、細胞質502および核504を含む細胞500を含有するOOI(その一部分またはそれが図5に示される)を識別するように試行するが、選択されたOOIは、そうではなく、アーチファクト510であり得る。アーチファクト510の選択は、OOIとして識別され分析されるべきその他の細胞含有対象物を除外する結果となり得る。態様は、検体112を正常130または疑わしい140として分類する目的で、有利に、OOIがアーチファクト510である可能性がどの程度であるかを判定する。態様は、この情報を用いて生物検体112のレビューを改善し、アーチファクト510を細胞含有対象物、例えば、細胞500を含み、アーチファクトではない次にランクの高い対象物、に置き換えることができる。
【0034】
より具体的には、図4を再度参照すると、工程415にて、最初の検体イメージから複数のOOIをイメージングおよび識別した後、システム300は、図3を参照して上記で考察したように、別個の光源300、または1もしくは2つ以上のフィルター334を用いた複数の異なる波長におけるOOIの追加のイメージの取得へと進む。1つの態様によると、各OOIは、19種類の異なる波長を例とする、約3から約30種類の異なる波長にてイメージングすることができる。1つの態様によると、OOIのイメージングに用いられる波長の範囲は、約410nmから約720nmであってよく、例えば約440nmから約720nmである。工程420では、イメージプロセッサ350は、OOIの多波長デジタルイメージに種々の操作を実行して、多波長OOIイメージから種々の核に関連する特徴を測定、決定、または抽出する。異なる波長でのOOIの追加のイメージの取得およびこれらのイメージからの特徴の抽出に関するさらなる詳細は、米国特許公開第2006/0245630A1号に提供されている。工程425では、多波長OOIイメージから抽出された核に関連する特徴を用いる確率モデル120に従って、生物検体112を正常130または疑わしい140として分類または特性決定する。
【0035】
図6を参照すると、1つの態様によれば、生物検体112は、複数の確率関数(例:複数の事後確率関数)を用いる確率モデル600に従って分類または特性決定される。1つの態様によると、確率モデル600を用いて、OOIがアーチファクト510である可能性がどの程度であるか、および生物検体112が正常130である可能性がどの程度であるかも示すことができる。次にこのデータを組み合わせて用いて、検体112が正常130であるかまたは疑わしい140であるかについての分類を行う。
【0036】
図6に示す態様では、確率モデル600は、2つの異なる確率関数610および620を含み、これらは、1つの態様によると、事後確率関数であってよい。確率関数610、620はいずれも、核に関連する特徴612、622を用いる。1つの態様によると、図6に一般的に示されるように、確率関数610、620は、核に関連する異なる特徴612、622を用いる。
【0037】
図示した態様では、第二の確率関数620が、核に関連する特徴622および第一の確率関数610の結果を用いる。すなわち、第一の確率関数610は、核に関連する特徴612に基づき、第二の確率関数620とは独立しており、一方、第二の確率関数620は、核に関連する特徴622および第一の確率関数610を用いる。図7および8は、態様に従う第一の確率関数610をさらに示しており、図9および10は、態様に従う第二の確率関数620をさらに示している。
【0038】
図7を参照すると、1つの態様によれば、確率モデルを用いる生物検体112を分類または特性決定する方法700は、選択されたOOIが細胞500ではなくアーチファクト510である確率または可能性の決定に用いられる第一の確率関数610を含む。最上位にランク付けされた対象物またはOOIが細胞500ではなくアーチファクト510である可能性がどの程度であるかについての確率を決定することにより、最上位にランク付けされた対象物の中にアーチファクト510が存在するパーセントを決定することができる。
【0039】
1つの態様に従う方法700は、複数の異なる波長にて取得されたOOIのイメージを用いて、各OOIの核に関連する特徴612を抽出または測定することを含む。多波長イメージから抽出された核に関連する特徴を測定することにより、単一のグレーレベルまたはモノクロイメージから抽出された特徴と比較して、OOI中の細胞に関するより詳細な情報が提供される。1つの態様では、これは、複数の波長で得られたOOIのイメージに基づき、例えば核の構造、光学濃度、および形状を含む核に関連する特徴612を測定または決定することを含む。構造とは、隣接するピクセルと比較した任意のピクセルの値を意味する。光学濃度は、吸光度の測定値である。多波長イメージにおける光学濃度の変動は、例えば、OOIがアーチファクト510である可能性がどの程度であるかを決定するのに用いられる重要な情報を提供する。形状とは、核の外形の不規則性を意味する。特定の特徴が単波長イメージから抽出され、その他の特徴が多波長イメージから抽出されるという場合もあり得る。例えば、構造の特徴は、単波長イメージ(例:約570nm)から抽出することができ、光学濃度の特徴は、多波長イメージ(例:約520nmおよび630nm)から抽出することができる。
【0040】
工程710では、抽出された特徴の測定値612を用いて、OOIがアーチファクト510である確率を決定する。これを各OOIについて実施する。従って、工程710の結果は、確率値の集合であり、各OOIが特定の確率値(例:小数またはパーセント)と関連付けられている。次に、工程715では、工程710で得られた確率値の平均を算出することにより、平均確率を決定する。例えば、第一のOOIがアーチファクト510である確率が0.4であり、第二のOOIがアーチファクト510である確率が0.8であり、第三のOOIがアーチファクト510である確率が0.5である場合は、OOI(またはその他の対象物)がアーチファクトである平均確率(別名として「APA」とも称する)は、(0.8+0.4+0.5)/3、または約0.57である。工程715の結果は、任意の検体112に対するOOIが、実際の細胞500よりも多いアーチファクト510から成る平均確率である。
【0041】
図8を参照すると、1つの態様によれば、APAを決定するための方法800は、各々のOOIについて核に関連する複数の特徴612を測定することを含む。1つの態様では、これは、複数の波長で得られたOOIのイメージに基づき、核の構造、光学濃度、および形状を含む核に関連する特徴612を測定または決定することを含む。例えば、1つの態様では、これは、工程805にて各OOIの核の構造を測定、決定、または抽出すること、工程810にて核内での光学濃度の標準偏差を測定、決定、または抽出すること、工程815にて核内での光学濃度の変動を測定、決定、または抽出すること、工程820にて核の補正された光学濃度を測定、決定、または抽出すること、および工程825にて核の境界の形状を測定、決定、または抽出すること、を含む。このデータを有した後、工程830にて、選択されたOOIがアーチファクト510である可能性がどの程度であるかについての第一の確率、例えば第一の事後確率、を算出する。工程835では、工程825にて決定された個々の確率値に基づき、選択されたOOIがアーチファクト510である可能性がどの程度であるかについての平均確率を算出する。
【0042】
図示した態様では、方法800は、5種類の核に関連する特徴612を含む。他の態様では、方法800は、5種類未満の核に関連する特徴612または5種類超の核に関連する特徴612を例とする、異なる数の核に関連する特徴612を含んでよい。さらに、工程805〜825に列挙した5種類の核に関連する特徴以外の異なる核に関連する特徴612も用いることができる。従って、図8は、第一の確率関数610の一例を示すために提供されるものである。
【0043】
図9を参照すると、生物検体112が正常130である可能性がどの程度であるかを決定する方法900は、工程905にて、選択されたOOIがアーチファクト510である可能性がどの程度であるかについての平均確率を決定すること(例:図7および8を参照して考察したAPAを用いて)、および、次に、工程910にて核に関連する特徴622を決定すること、を含む。工程915では、生物検体112が正常130である確率を、平均確率(工程905)と測定された核に関連する特徴(工程910)との組み合わせに基づいて決定する。工程920では、第一および第二の確率関数によって得られたデータの組み合わせを次に用いて、生物検体112を正常130または疑わしい140として分類する。
【0044】
図10は、生物検体112が正常130である可能性がどの程度であるかを決定するための方法1000の1つの態様を示すものであり、工程1005にて、APA、または選択されたOOIがアーチファクト510である可能性がどの程度であるかについての平均確率を決定すること、および核のイメージのピクセルのグレー値に対応する核に関連する特徴622を決定すること、を含む。これは、工程1010にて、核内での平均グレー値コントラストを決定すること、および工程1015にて、核内でのグレー値コントラストの範囲を決定すること、を含んでよい。このデータを有した後、工程1020にて、生物検体112が正常130である確率を、第一の確率関数610(APA)および決定されたグレー値コントラストデータ(工程1010および1015)に基づいて決定する。第一および第二の確率関数によって得られたデータの組み合わせを次に用いて、生物検体112を正常130または疑わしい140として分類する。
【0045】
図11を参照すると、検体112を正常130または疑わしい140として分類することを目的として、第一の確率関数610によって得られたデータおよび第二の確率関数620によって得られたデータを、適切なグラフ1100にプロットすることができる。図示した態様では、グラフ1100は、xおよびy軸を含む二次元グラフである。y軸1102は、第一の確率関数610、すなわち、対象物がアーチファクトである平均確率または「APA」を表す。グラフ1100のx軸1104は、第二の確率関数620、すなわち、生物検体が正常130検体である可能性がどの程度であるかを表す。従って、xおよびy軸、1102および1104の値は、小数またはパーセントの値として表される(例:20%、60%)。従って、第一の確率関数610は、境界線上の正常130検体またはスライドが、アーチファクトに起因する可能性が最も高いことを確認することを含み、ならびに、第二の確率関数620については、これを用いて、境界線上の正常130であるケース(高いアーチファクト数である)を正常130として分類し、これらがさらなるレビューまたは分析を必要としないように安全に選別することができることを確認する。
【0046】
図12は、図11で示されたグラフ1100に、互いに対してプロットされた第一および第二の確率関数610、620を用いて行われた試験で得られたデータを投入したグラフを示す。図12における各試験データポイントは、生物検体112を有するスライド110を表す。データポイントは、OOIを識別することによって得られた。識別された異なる種類のOOIを、図13のチャート1300にまとめる。チャートの第一のカラム1301は、対象物の種類を識別し、第二のカラム1302は、対象物として識別された異なる種類のアーチファクト510(グループ分け1301によって識別される)を含む、特定の種類の対象物の数を示す。
【0047】
この特定の試験では、OOIのイメージは、約440〜720nmの範囲の19種類の異なる波長で取得した。この多波長イメージを用いて10種類の異なる核に関連する特徴を次に分析し、190の異なる核に関連する特徴を得た。形状、光学濃度、および構造を含む核に関連する特徴612を第一の確率関数610に用い、形状、光学濃度、および構造を含む核に関連する特徴622を第二の確率関数620に用いた。
【0048】
特徴の選択は、種々の基準に基づいて行ってよい。この特定の例では、特徴の選択は、例えばピアソンの積率相関を用いて、特徴の値をあらかじめ割り当てたグループに相関させることに基づいて行った。本例におけるあらかじめ割り当てたグループは、「細胞」および「アーチファクト」であり、細胞およびアーチファクトについて、これらの選択された特徴に対する共分散行列を演算処理する。試験対象物の間でグループ平均からのマハラノビスの距離を算出し、そのグループ平均からの距離が最小値である場合に、試験対象物はその区分に属する。各対象物が「アーチファクト」の区分に属する可能性がどの程度であるかについての事後確率を用いて、第一の確率関数、または対象物が「アーチファクト」である平均確率(「APA」)を算出する。
【0049】
個々のスライド110を表す得られたデータポイントを、図12に示すようにグラフ1100にプロットする。グラフ1100は、直線1201、1204により4つの四半分、1211、1212、1213、1214に分割される。横方向の直線1202は、第一の確率関数610の値によって定められ、縦方向の直線1204は、第二の確率関数620の値によって定められる。グラフ1100は、299個の検体スライド110を表すデータポイントを含む。正しく正常130として分類された正常スライドまたは検体130は「X」1220で表され、正常130としては分類されず、疑わしい140として分類された正常スライドまたは検体130は「丸」1221で表され、正常130として分類されなかった異常もしくは疑わしいスライドまたは検体140は「囲んだX」1222で表され、正常130として分類されてしまった異常もしくは疑わしいスライドまたは検体140は「囲んだ丸」(1223)で表される。従って、態様に基づいて、図示した例では、データポイント1220に対応する検体は、細胞検査技師によるレビューを受け、一方、データポイント1221、1222、および1223に対応する検体は、細胞検査技師によるレビューを受けない。
【0050】
より具体的には、299個の検体スライド100のうち、225個のスライドが、疑わしいまたは異常140である検体を含み、残りの74個のスライドが、正常130である検体を含んでいた。態様を試験し、第一および第二の確率関数610、620に基づいて、この74個の正常130検体スライドのうちのいくつを正しく正常130として分類することができたかを判定した。
【0051】
より詳細には、x軸1104は、第二の確率関数620を用いて決定される、検体112が正常130である確率を表すことから、十分に高いx軸1104の値を持つ検体スライド110を正常130として分類することができる。同様に、アーチファクト510は、異常細胞に類似することが多いが異常細胞ではなく、従って、正常130として分類することが可能であることから、十分に高いy軸の値1102を持つスライド110も正常130として分類することができる。従って、態様により、スライド110は、対応するデータポイントが上部右側の四半分1211の範囲内に入るように、x軸1104に沿った十分に高いx軸1104または第一の確率関数(APA)の値、およびy軸1102に沿った十分に高い第二の確率関数(正常である確率)の値を持つ対応するデータポイントに基づいて、有利に、正常130として分類することができる。
【0052】
図示した態様では、正常130である可能性が最も高いスライド110は、第一の値1202よりも大きい、例えば約0.3よりも大きい第一の確率関数610またはAPAの値、ならびに第二の値1204よりも大きい、例えば約0.4よりも大きい第二の確率関数620の値を持つスライドである。これらのポイント1202、1204でxおよびy軸を通って延びる直線の交差によって定められる上部右側の四半分1211内のこれらのデータポイントに対応する検体スライド110を用いて、対応するスライドを正常130として分類することができる(「X」1220で識別される)。従って、細胞検査技師は、データポイント1220(「X)に対応するスライドをレビューまたは分析する必要がなく、態様は、これらのスライドをさらなるレビューから有利に除外する。
【0053】
図示した例では、74個の正常130スライドのうちの37個が正しく正常130として分類された(「X」1220で識別される)。残りの37個の正常130スライドのほとんどは(「丸」1221で識別される)、x軸1104の値または第二の確率関数620の値が低く、対応するデータポイントが上部左側の四半分1212の範囲内に含まれたため、最初は正常130として分類されず、疑わしい140として分類された。データポイント1221(丸)に対応するスライドは、疑わしい140として分類され、従って、細胞検査技師によるさらなるレビューおよび分析が必要であると識別されることになる。従って、態様により、正常130スライドの約50%(「X」1220で識別される)、および全スライド110の約12%が、細胞検査技師によって考慮され得るスライドのプールから有利に除外された。
【0054】
図示した例では、正常130として上部右側の四半分1211に誤って分類された異常検体(「囲まれた丸」1223として識別される)が1つ存在した。その結果、この異常検体1223は、正常130として分類されたことから、細胞検査技師によって検査されないこととなった。しかし、正常130として識別されたおよそ47個のスライドのうち、誤って正常130として分類された異常スライドは僅かに1個であった(囲まれた「丸」1223として識別される)。この低いエラー率は、細胞検査技師の手作業によるレビューで得られるエラー率よりも良好であると考えられる。従って、少数の異常140スライドが、疑わしい140として分類されるべき場合に正常130として分類される場合があり得るものの、エラー率は十分に低く、そのようなエラーは、正常130スライドの約50%を識別することで細胞検査技師の負担を軽減し、細胞検査技師の注意をより適切である疑わしいまたは異常スライド140に集中させるという能力に対する許容範囲内のトレードオフを提示するものと考えられる。
【0055】
残りの3つの四半分内(上部左側1212、下部左側1213、および下部右側1214四半分)のデータポイントは、最初に正常として分類されなかった正常130検体(「丸」1221として識別される)、および「異常」または「正常でない」として正しく分類された異常検体140(囲んだ「X」1222として識別される)を表す。イメージプロセッサ350は、このデータを処理して、特定のスライド110が細胞検査技師によるレビューを受けるべきかどうかに関する指示を作り出すか、またはどのスライド110が細胞検査技師のレビューを要するかを識別することができる(例:上部右側の四半分1211内に含まれず、最初は第一および第二の確率関数610、620を用いて正常130として分類されなかったためにレビューすべきであるスライド110、のリストを作成することにより)。
【0056】
図3に示すイメージングシステムの例を参照して態様を説明するが、その他のイメージングシステム構成を用いてよく、態様が実現されるイメージングシステムは、図3に一般的に示されるように、その他のシステム部材と共に用いるか、これらに付随させるか、またはこれらと連結してよい。例えば、図14を参照すると、態様を実現することができる別のシステムは、イメージング装置1410(例:図3に示すような、または別の適切なイメージング装置)、イメージプロセッサ350、メモリ360および確率モデル120、ならびにFOIプロセッサ1422およびルーティングプロセッサ1424などのその他の付随する部材を含むサーバー1420、ならびに、別個の顕微鏡1432および電動式ステージ1434を含むレビューステーション1430、を有する。図14に示すシステム構成のさらなる局面は、米国特許出願公開第2004/0253616A1号に記載されている。さらに、態様は、例えば図14に示すように、独立したまたは単独のイメージングシステムで実現することができ、または、サイティックコーポレーションから入手可能であり、図15に一般的に示されるI2イメージング/レビューシステムなどの、イメージングおよびレビューの両方の能力を含む一体化されたシステム1500で実現することもできる。
【0057】
さらに、態様を用いて、態様をいかに実現することができるかに関する例として提供される細胞頚部または膣検体以外の様々な種類の検体を処理および分析することができる。さらに、態様は、スライドおよびバイアルを含む種々の検体キャリアに収容または保持された検体を含むことができる。さらに、態様を、異なる種類の検体の分類に適用することができ、その他の目的に用いてもよいことは理解されたい。
【0058】
態様は、様々な数の波長および種々の核に関連する特徴で取得されたイメージから得られたデータに基づく第一および第二の確率関数610、620(例:事後確率関数)を含んでもよい。種々の光学部材およびこれらの組み合わせを用いて、複数の波長の光を発生させることができる。さらに、異なる数の核に関連する特徴を、第一および第二の確率関数を用いて値を決定する目的に用いることができる。従って、5つの核に関連する特徴を用いる第一の確率関数、ならびに第一の確率関数および2つの核に関連する特徴を用いる第二の確率関数は、態様をいかに実現することができるかに関する例を示すために提供されるものであり、その他の態様は、異なる種類および数の核に関連する特徴の使用を含んでよい。さらに、確率モデルは、上述の確率モデルの変形を含んでよい。
【0059】
さらに、態様は、生物検体分類システムと共に用いられ、本明細書にて前述した機能のすべてまたは一部を具体化するコンピュータプログラム製品として具体化することができる。そのような実現は、ディスケット、CD‐ROM、ROM、もしくはハードディスクを例とするコンピュータ読み取り可能媒体などの有形媒体上に固定されるか、またはモデムもしくはその他のインターフェースデバイスを介してコンピュータシステムへ伝送可能である、一連のコンピュータ読み取り可能である命令を含んでよい。
【技術分野】
【0001】
本発明は、生物検体の特性決定または分類のためのシステムおよび方法に関する。
【背景技術】
【0002】
医療業界では、細胞検査技師を例とする実験技術者にとって、特定の種類の細胞の存在について細胞検体のレビューを行う必要性が多くの場合存在する。例えば、現在、頚膣パパニコロウ(cervical−vaginal Papanicolaou)(Pap)スメアスライドのレビューを行う必要性が存在する。Papスメアは、癌性および前癌性頚部病変を検出するための強力なツールである。頚部スクリーニングおよびその他の検体のスクリーニングの信頼性ならびに有効性は、前癌性病変を診断し(感度)、同時に偽陽性の診断を避ける(特異性)その能力によって評価される。その結果、これらの基準は細胞学的解釈の正確性に依存する。
【0003】
従来から、病理学者は、個々の細胞核の特徴を調べることによる生物検体に対する単一細胞分析、またはスライド上に現れる細胞の構造の特徴的なパターンを探索することによる生物検体に対するコンテクスト分析(contextual analysis)を行うことができる。このレビューのプロセスを促進するために、複数の顕微鏡スライドを処理する自動スクリーニングシステムが開発されてきた。典型的なシステムでは、イメージング装置(imager)を操作して、各々がスライドの異なる部分を示す、細胞検体スライドの一連のイメージを取得する。次に、プロセッサまたはコントローラがこのイメージデータを処理し、検体に関する定量的な予後情報が提供される。この診断情報の提供に際して、プロセッサは、単一細胞分析もしくはコンテクスト分析のいずれか、またはその両方を実施することができる。
【0004】
いくつかの自動化スクリーニングシステムでは、プロセッサは、診断情報を用いて、各々の検体の中の正常、および異常もしくは疑わしい生物物質の間の線引きを行う。すなわち、プロセッサは、細胞検査技師を最も適切である細胞に集中させ、残りの細胞をさらなるレビューから除外するという能力を有する。この場合、スクリーニング装置は、診断情報を用いて最も適切である生物対象物、およびそのスライド上の位置を決定する。この位置情報がレビュー用の顕微鏡へ提供され、これは、細胞検査技師によるレビューのために、自動的に識別された位置へと進み、生物対象物に焦点を合わせる。細胞検査技師は、次に、病理学者によるさらなるレビューのために、その最も適切である生物対象物(例えば、悪性または前悪性細胞に一貫する特質を持つ対象物)に電子的な標識を行うことができる。
【0005】
例えば、1つの自動システムでは、対象物または「目的とする対象物」(OOI)が、イメージデータに基づいて識別される。対象物またはOOIは、検体の個々の細胞および細胞クラスターの形態を取っていてよい。このシステムは、例えば、特定の細胞または対象物が悪性腫瘍または前悪性腫瘍などの異常な状態を有するリスクの程度に基づいて、識別された領域または対象物を分類するように構成することができる。例えば、プロセッサは、核の合計の(nuclear integrated)または平均の光学密度について対象物を評価し、その光学密度の値に応じて対象物をランク付けすることができる。対象物は、その相対的なランクおよび座標と共に、続いての処理、レビュー、または分析のために、保存することができる。イメージデータおよびOOIを処理する公知のイメージングシステムおよび方法のさらなる局面は、特許文献1に記載されている。
【0006】
一般的に、自動スクリーニングシステムの使用は、技術者の注意が、疑わしいスライド、または各スライド中の限られた数のより適切である対象物に集中されるため、効率的である。しかし、自動スクリーニングシステムは、改良することができる。例えば、偽陽性または「偽異常」という結果の割合を低減するために、自動システムがアーチファクトを処理する方法を改良することができる。アーチファクトは、診断的価値を持たない対象物と見なすことができる。偽陽性の1つの原因はアーチファクトの存在であり、これは、検体サンプル中に大量に存在し得るもので、異常検体に類似する大きな暗い対象物であり得る。アーチファクトは、正常細胞を含む対象物よりも上位にランク付けされ得る。
【0007】
例えば、異常核と比較して、正常核は通常、DNAの量が少なく、構造(texture)も少ない。最上位にランク付けされた対象物においてアーチファクトの存在なしでは、正常スライド中の細胞の大部分は、緊密に分布したDNA量を有する。しかし、異常細胞に類似する非常に数多くのアーチファクトが、大部分の正常細胞よりも上位にランク付けされ、これらのアーチファクトは、データモデリングにおいて偽の警告を発する。これらのアーチファクトのために、実際の細胞がランク付けされ、「最上位の」DNA量を有する細胞のリストに正しく提示されることができなくなる場合がある。従って、自動システムは、レビューすべき細胞を選択するのではなく、むしろ、アーチファクトが異常細胞であると間違って認識してしまい、異常核よりも上位にランク付けされるアーチファクトを選択してしまう。この結果、実際に細胞を有する対象物を選択する数、および細胞検査技師によるレビューに値する異常対象物を選択する数が減ることとなり、その結果として、分析および診断の正確性が低下し、誤ったものとなる可能性がある。
【0008】
偽陽性の発生は、時に、自動イメージング装置の能力または構成に限界があることに起因する。すなわち、自動イメージング装置は、それに提供される検体およびデータ、ならびにそのプログラミングによって制限され得る。例えば、演算処理上の理由から、イメージング装置は通常、モノクロの白黒イメージを解析に用いる。公知のモノクロシステムの例は、ベクトンディッキンソンカンパニー、1 ベクトンドライブ、フランクリンレイクス、ニュージャージー(Becton Dickinson Company,1 Becton Drive,Franklin Lakes,New Jersey)、およびサイティックコーポレーション、250 キャンパスドライブ、マールボロ、マサチューセッツ(Cytyc Corporation,250 Campus Drive,Marlborough,Massachusetts)、より入手可能である。しかし、検体は、広範囲にわたるスペクトルデータ、およびサンプルの特性決定または分類に用いることができるその他の情報を提供し得る。しかし、モノクロイメージングおよび解析システムを用いる場合、このその他のデータを利用することができない。
【先行技術文献】
【特許文献】
【0009】
【特許文献1】米国特許公開第2004/0254738A1号
【発明の概要】
【0010】
1つの態様は、検体キャリア(specimen carrier)上の生物検体を分類して、その検体にさらなる分析が必要かどうかを決定するための方法に関する。この方法は、検体中の対象物のイメージを取得すること、およびそのイメージ中の目的とする対象物を識別することを含む。この方法は、さらに、識別された目的とする対象物の追加のイメージを複数の異なる波長にて取得すること、識別された目的とする対象物の細胞の特徴を追加のイメージから抽出すること、および抽出された細胞の特徴に基づく確率モデルに従って検体を分類し、その検体にさらなる分析が必要かどうかを決定すること、を含む。
【0011】
別の態様は、検体キャリア上の生物検体を自動的に分類して、その検体にさらなる分析が必要かどうかを決定するための方法に関する。この方法は、検体中の対象物のイメージを取得すること、および取得されたイメージから目的とする対象物を識別することを含む。この方法は、さらに、識別された目的とする対象物の追加のイメージを複数の異なる波長にて取得すること、識別された目的とする対象物の核に関連する特徴を追加のイメージから抽出すること、および抽出された核に関連する特徴に基づく確率モデルに従って検体を分類すること、を含む。確率モデルは、第一および第二の確率関数を含む。第一の確率関数は、識別された目的とする対象物がアーチファクトである確率を示し、第二の確率関数は、部分的に、第一の確率関数の結果に基づく。第一および第二の確率関数を組み合わせて用いることにより、検体を分類し、その検体にさらなる分析が必要かどうかを決定する。
【0012】
さらなる態様は、複数の波長の光を利用する生物検体の処理の方法に関し、生物検体中の対象物のイメージを取得すること、および取得されたイメージ中の目的とする対象物を識別すること、を含む。この方法は、さらに、識別された目的とする対象物の追加のイメージを複数の異なる波長にて取得すること、および識別された目的とする対象物の細胞の特徴を追加のイメージから抽出すること、を含む。
【0013】
さらに別の態様は、複数の波長の光を利用する生物検体の分類の方法に関し、生物検体中の対象物のイメージを取得すること、および取得されたイメージ中の目的とする対象物を識別すること、を含む。この方法は、さらに、生物検体の目的とする対象物の追加のイメージを複数の異なる波長にて取得すること、目的とする対象物の細胞の特徴を取得されたイメージから抽出すること、および抽出された細胞の特徴に基づいて生物検体を分類すること、を含む。
【0014】
さらなる態様は、複数の波長の光を利用する生物検体の分類の方法に関し、生物検体の目的とする対象物のイメージを複数の波長で取得すること、目的とする対象物の細胞の特徴を取得されたイメージから抽出すること、および抽出された細胞の特徴に基づいて生物検体を分類すること、を含む。
【0015】
別の態様によると、検体キャリア上に保持された生物検体を分類してその生物検体にさらなる分析が必要かどうかを決定するための生物スクリーニングシステムは、イメージング部材およびイメージング部材と操作可能に連結されたプロセッサを含む。イメージング部材は、生物検体中の対象物のデジタルイメージデータを取得するように構成され、プロセッサは、そのデジタルイメージデータから目的とする対象物を処理し、識別するように構成される。イメージング部材は、さらに、識別された目的とする対象物の追加のイメージを複数の異なる波長にて取得するようにも構成される。プロセッサは、識別された目的とする対象物の細胞の特徴を追加のイメージから抽出し、および抽出された細胞の特徴キャリアに基づき、確率モデルに従って生物検体を分類し、その生物検体にさらなる分析が必要かどうかを決定するようにさらに構成される。
【0016】
さらなる態様によると、検体キャリア上に保持された生物検体を分類して生物検体にさらなる分析が必要かどうかを決定するための生物スクリーニングシステムは、イメージング部材およびイメージング部材と操作可能に連結されたプロセッサを含む。イメージング部材は、生物検体中の対象物のイメージを取得するように構成され、プロセッサは、取得されたイメージから目的とする対象物を処理し、識別するように構成される。イメージング部材は、識別された目的とする対象物の追加のイメージを複数の異なる波長にて取得するようにさらに構成される。プロセッサは、識別された目的とする対象物の核に関連する特徴を異なる波長にて取得された追加のイメージから抽出し、および測定された細胞の特徴に基づく確率モデルに従って生物検体を分類するようにさらに構成される。確率モデルは、第一および第二の確率関数を含む。第一の確率関数は、選択された対象物がアーチファクトである確率を示し、第二の確率関数は、部分的に、第一の確率関数の結果に基づく。第一および第二の確率関数を組み合わせて用いることにより、生物検体を分類して、その生物検体にさらなる分析が必要かどうかを決定する。
【0017】
さらなる別の選択肢としての態様は、イメージング部材およびイメージング部材と操作可能に連結されたプロセッサを含む、生物検体分類システムに関する。イメージング部材は、生物検体の目的とする対象物のイメージを複数の異なる波長にて取得するように構成され、プロセッサは、取得されたイメージから細胞に関連する特徴を抽出し、抽出された細胞に関連する特徴に基づいて生物検体を分類するように構成される。
【0018】
1もしくは2つ以上の態様では、抽出または測定された細胞の特徴は、核に関連する特徴であり、例えば、核内での光学濃度の標準偏差、核内での光学濃度の変動、核の補正された光学濃度、および核の境界の形状である。
【0019】
1もしくは2つ以上の態様では、分類に用いられる確率モデルは、2つの確率関数を含み、例えば、事後確率関数である。1つの確率関数は、生物検体の識別された目的とする対象物がアーチファクトである平均確率を示し、もう一方の確率関数は、部分的に、第一の確率関数の結果に基づく。両方の確率関数が、異なる数および種類の抽出された核に関連する特徴に基づいていてよい。例えば、第一の確率関数は、核の構造、核内での光学濃度の標準偏差、核内での光学濃度の変動、核の補正された光学濃度、および核の境界の形状のうちの1もしくは2つ以上、またはすべてに基づいていてよく、第二の確率関数は、第一の確率関数の結果、ならびに識別された目的とする対象物の細胞の核のイメージのピクセルのグレー値コントラスト(gray value contrast)の平均、および識別された目的とする対象物の細胞の核のイメージのピクセルのグレー値コントラストの範囲のうちの1もしくは2つ以上、に基づいていてよい。第一および第二の確率関数の結果は、グラフのフォーマットにプロットまたは表示して生物検体を分類し、検体にさらなるレビューが必要かどうか、または検体の群のどの検体にさらなるレビューが必要かを決定することができる。
【図面の簡単な説明】
【0020】
ここで、全体を通して同一の符号が対応する部分を表す図面を参照する:
【0021】
【図1】図1は、生物検体スライドを分類し、そのスライドに1つの態様に従って分析またはレビューを行うべきかどうかを決定するためのシステムのブロック図である。
【図2】図2は、生物検体スライドの平面図である。
【図3】図3は、複数の波長の光を用い、1つの態様に従う確率モデルにより生物検体スライドを分類するためのシステムのブロック図である。
【図4】図4は、複数の波長の光を用い、1つの態様に従う確率モデルにより生物検体スライドを分類するための方法のフローチャートである。
【図5】図5は、細胞およびアーチファクトを含む生物検体の対象物の一部分を一般的に示す図である。
【図6】図6は、種々の態様に用いられる複数の確率関数を含む確率モデルを示す図である。
【図7】図7は、対象物がアーチファクトである確率を決定するために種々の態様で用いられる第一の確率関数を一般的に示すフローチャートである。
【図8】図8は、別の態様に従う第一の確率関数のフローチャートである。
【図9】図9は、生物検体が正常である確率を決定するために種々の態様で用いられる第二の確率関数を一般的に示すフローチャートである。
【図10】図10は、別の態様に従う第二の確率関数のフローチャートである。
【図11】図11は、第一および第二の確率関数によって得られたデータをどのようにグラフにプロットすることができるかを一般的に示す図である。
【図12】図12は、図11に示すグラフでプロットした、正常および異常スライドを表す試験データポイントを示す。
【図13】図13は、図12に示される試験の際に識別された対象物を示す表である。
【図14】図14は、態様を実現することができ、イメージングステーション、サーバー、およびレビューステーションを含む、別の選択肢としての生物検体分析システムを示す図である。
【図15】図15は、態様を実現することができ、一体化されたイメージングおよびレビュー機能を含む、別の選択肢としての生物検体分析システムを示す図である。
【発明を実施するための形態】
【0022】
図1および2を参照すると、態様に従う多波長生物検体スクリー二ングシステム(multi−wavelength biological specimen screening systems)100および方法は、スライド110またはその他の適切なキャリアに保持された生物検体(例:細胞検体)112のイメージを取得し、目的とする対象物(OOI)を例とする対象物を識別し、次に、選択された対象物またはOOI(一般に「OOI」と称する)のイメージを、複数の異なる波長にて取得する。OOIの細胞の核に関連する特徴を例とする細胞の特徴に関連するデータを、多スペクトルイメージ(multi−spectral images)から決定、抽出、または測定する。説明を簡略化するために、OOIの細胞の特徴の抽出について述べる。このデータは、分類の目的に、およびその他の応用に用いることができる。
【0023】
1つの態様によると、スクリーニングシステム100は、複数の波長にて取得されたOOIのイメージから抽出された核の特徴に関するデータを用いる確率モデル120に従い、生物検体112を「正常」または「疑わしい」として分類するように構成またはプログラムされる。例えば、図1に示すように、処理すべき生物検体スライド110の数が1000個である場合、検体分類システム100の態様は、複数の波長を用い、確率モデル120に従ってスライド110を自動的に分類することができ、それにより、特定のスライド、例えばスライド1〜300および700〜1000、が正常スライド130として分類され、その他のスライド、例えばスライド301〜699、が疑わしいスライド140として分類される。当然のことであるが、正常および疑わしいスライド130、140の数およびグループ分けは、説明の目的で提供するものである。従って、図1の場合、「正常」130検体またはスライドは、細胞検査技師によるさらなるレビューもしくは分析を必要としない検体112またはスライド110である。一般的に、スライド110は、非癌性または非前癌性検体112を有する場合に、正常130として分類される。「疑わしい」140検体またはスライドは、異常である可能性があるかまたは異常であり、癌性または前癌性細胞を含んでいてよい。
【0024】
「正常」130または「疑わしい」140としての分類は、態様の最終決定または結果として、すなわち、検体112またはスライド110にさらなる分析またはレビューが必要かどうか、として図1に示す。細胞検査技師は、次に、正常スライド130ではなく、疑わしいスライド140へ自身の注意を集中させることができる。この方法により、検体、スライド110に関する価値のある情報が複数の波長を用いることで得られ、この情報を用いて、アーチファクトによる偽陽性の頻度を低減して検体112が分類され、それによって、さらなるレビューのためにスライド110がより正確で効率的に分類および選択される結果となる。
【0025】
1つの態様によると、多波長生物スクリーニングシステム100は、細胞頚部または膣検体(Papスメアスライド上で通常見られる)などの生物または細胞検体112を有する一連の顕微鏡スライド110を処理するように構成される。この場合、細胞は、異常、軽度扁平上皮内病変(LGSIL)もしくは高度扁平上皮内病変(HGSIL)などの悪性腫瘍または前悪性腫瘍、ならびにその他のあらゆる細胞学的区分(例:感染、細胞溶解)を反映していてよい。検体112は、通常、薄細胞層(thin cytological layer)としてスライド110上に配置される。好ましくは、カバーグラス(図示せず)が検体112に接着され、それによって、検体112がスライド110上の適切な位置に固定される。検体112は、適切ないかなる染料で染色してもよく、ThinPrep(登録商標)核染料などである。
【0026】
態様を用いて、さらに、血液、尿、精液、乳、痰、粘液、胸水、骨盤液、滑液、腹水、体腔洗浄液(body cavity washes)、アイブラッシング(eye brushing)、皮膚擦過検体(skin scrapings)、頬側拭き取り検体、膣内拭き取り検体、papスメア、直腸内拭き取り検体、吸引液、針生検検体、例えば手術または検死によって得られた組織片、血漿、血清、脊髄液、リンパ液、皮膚の外部分泌物、気道、腸管、および泌尿生殖器管、涙、唾液、腫瘍、臓器、微生物培養物、ウィルス、ならびにインビトロでの細胞培養物成分のサンプル、を含むその他の種類の生物検体112の「正常」130または「疑わしい」140としての特性決定または分類も、複数の波長を用いて行うことができる。本明細書は、細胞頚部または膣検体112(Papスメアスライド上の)を参照して態様を実現することができる1つの方法を説明しており、態様は、様々な種類の組織および細胞に応用可能であることは理解されたい。システムおよび方法の態様のさらなる局面を、図3〜15を参照して説明する。
【0027】
図3を参照すると、1つの態様では、生物検体スライド110の分類または特性決定のための生物検体スクリーニングシステム300は、カメラまたはその他のイメージング部材310、顕微鏡320、生物検体スライド110および顕微鏡320を通して光332をカメラ310へ提供する光源330、生物検体スライド110を支持する電動式ステージ340、イメージプロセッサ350、ならびに付属のメモリまたは記憶装置360(一般にメモリ360と称する)を含む。メモリ360は、イメージプロセッサ350の一部分であってよく、または別個の部材であってもよい。
【0028】
イメージプロセッサ350および/またはメモリ360は、確率モデル120を記憶またはこれにアクセス可能であり、それを用いて、生物検体112を「正常」130または「疑わしい」140として分類する。確率モデル120は、ハードウェア、ソフトウェア、またはこれらの組み合わせの形態であってよい。例えば、確率モデル120は、一連のプログラムされた命令、および/またはメモリ360に記憶され、イメージプロセッサ350によって取得された検体データと合わせてイメージプロセッサ350によって実行されるデータの形態であってよい。確率モデル120は、別個のプロセッサもしくはコントローラの一部で実行されてもよい。
【0029】
カメラ310は、種々の公知のデジタルカメラのうちの1つであってよく、光源330は、単一の光源、または図3に示すように、複数の個別の光源を含んでいてよい。図3は、システム300が複数の光源330を含んでよいことを一般的に説明するために、3つの光源330a〜c(一般に光源330と称する)を示している。以下でさらに詳細に考察するように、OOIの所望される多波長分析を達成するために、必要に応じて様々な数の光源330を使用可能であること、および図3は、システム300が複数の光源330を含んでよいことを一般的に説明するために提供されること、については理解されたい。
【0030】
1つの態様によると、スクリーニングおよび分類システム300は、複数の光源330を含み、その各々が異なる波長の光332を発する。この目的のために適する光源330は、発光ダイオード(LED)であろう。他の態様では、光源330は、1もしくは2つ以上のプリズム(図示せず)、および/またはフィルター334を透過した光332が所望される波長または波長範囲を有するように1もしくは2つ以上の光学フィルター334などの1もしくは2つ以上のその他の光学部材と対となっていてよい。態様に用いることができるフィルターの例としては、二色性フィルター、干渉フィルター、フィルターホイールが挙げられる。フィルター334は、顕微鏡320、および検体112の一部分をイメージングするためのカメラ310に提供される光332の波長を変化させるように調節または選択することができる。液晶波長可変フィルターも用いることができる。適切なシステム300の部材のさらなる局面は、米国特許第2004/0253616 A1号に記載されている。
【0031】
図4を参照すると、1つの態様に従う方法400において、光332は、光源330からステージ340および顕微鏡320を通ってカメラ310へと指向され、このカメラが、工程405にて生物検体112のデジタルイメージを取得する。より詳細には、細胞検体112を有するスライド110が、顕微鏡320の視野に対してスライド110を移動または走査させる電動式ステージ340上に載せられ、一方、カメラ310が、光源330によって発光される光332により、生物検体112の全体またはその一部分にわたるイメージを捕捉する。例えば、カメラ310によって取得された各々のイメージの各ピクセルは、その光透過率に応じて8ビット値(0から255)に変換することができ、「00000000」が、ピクセルを透過する最も少ない光の量に対して割り当てられ、「11111111」が、ピクセルを透過する最も多い光の量に対して割り当てられる。スキャン速度および/または取得されるイメージの数を最大とすることができるように、カメラ310のシャッター速度は、比較的速いことが好ましい。スライド110に保持される生物検体112は、カセット(図示せず)内に収容されていてよく、その場合、スライド110は、連続する方法で、それぞれのカセットから取り出され、デジタルイメージを取得され、その後カセットに戻される。
【0032】
工程410では、取得されたイメージまたはイメージデータがイメージプロセッサ350へ提供され、このイメージプロセッサが、別名として目的とする対象物(OOI)とも称される最も適切であるもしくはランクの最も高い対象物を識別するために、イメージまたはイメージデータ312上で種々の操作を実行する。例えば、イメージプロセッサ350は、最も関連性が高いと思われる約20もしくは40個の対象物、またはその他の適切な数の対象物を識別することができる。この目的のために、イメージプロセッサ350は、米国2004/0253616に記載の一次および二次セグメント化(segmentation)を実施し、個々の対象物およびクラスター化した対象物の各々に対する種々の特徴を測定、決定、または抽出し、続いて、これらの特徴の測定された値に基づいて各対象物に対する対象物スコアを算出することができる。このスコアに基づいて、イメージプロセッサ350は、目的とする対象物(OOI)と見なされる対象物およびクラスター化した対象物を識別または選択することができ、その位置は、今後の参照のためにメモリに記憶させることができる。
【0033】
図5を参照すると、イメージプロセッサ350は、細胞質502および核504を含む細胞500を含有するOOI(その一部分またはそれが図5に示される)を識別するように試行するが、選択されたOOIは、そうではなく、アーチファクト510であり得る。アーチファクト510の選択は、OOIとして識別され分析されるべきその他の細胞含有対象物を除外する結果となり得る。態様は、検体112を正常130または疑わしい140として分類する目的で、有利に、OOIがアーチファクト510である可能性がどの程度であるかを判定する。態様は、この情報を用いて生物検体112のレビューを改善し、アーチファクト510を細胞含有対象物、例えば、細胞500を含み、アーチファクトではない次にランクの高い対象物、に置き換えることができる。
【0034】
より具体的には、図4を再度参照すると、工程415にて、最初の検体イメージから複数のOOIをイメージングおよび識別した後、システム300は、図3を参照して上記で考察したように、別個の光源300、または1もしくは2つ以上のフィルター334を用いた複数の異なる波長におけるOOIの追加のイメージの取得へと進む。1つの態様によると、各OOIは、19種類の異なる波長を例とする、約3から約30種類の異なる波長にてイメージングすることができる。1つの態様によると、OOIのイメージングに用いられる波長の範囲は、約410nmから約720nmであってよく、例えば約440nmから約720nmである。工程420では、イメージプロセッサ350は、OOIの多波長デジタルイメージに種々の操作を実行して、多波長OOIイメージから種々の核に関連する特徴を測定、決定、または抽出する。異なる波長でのOOIの追加のイメージの取得およびこれらのイメージからの特徴の抽出に関するさらなる詳細は、米国特許公開第2006/0245630A1号に提供されている。工程425では、多波長OOIイメージから抽出された核に関連する特徴を用いる確率モデル120に従って、生物検体112を正常130または疑わしい140として分類または特性決定する。
【0035】
図6を参照すると、1つの態様によれば、生物検体112は、複数の確率関数(例:複数の事後確率関数)を用いる確率モデル600に従って分類または特性決定される。1つの態様によると、確率モデル600を用いて、OOIがアーチファクト510である可能性がどの程度であるか、および生物検体112が正常130である可能性がどの程度であるかも示すことができる。次にこのデータを組み合わせて用いて、検体112が正常130であるかまたは疑わしい140であるかについての分類を行う。
【0036】
図6に示す態様では、確率モデル600は、2つの異なる確率関数610および620を含み、これらは、1つの態様によると、事後確率関数であってよい。確率関数610、620はいずれも、核に関連する特徴612、622を用いる。1つの態様によると、図6に一般的に示されるように、確率関数610、620は、核に関連する異なる特徴612、622を用いる。
【0037】
図示した態様では、第二の確率関数620が、核に関連する特徴622および第一の確率関数610の結果を用いる。すなわち、第一の確率関数610は、核に関連する特徴612に基づき、第二の確率関数620とは独立しており、一方、第二の確率関数620は、核に関連する特徴622および第一の確率関数610を用いる。図7および8は、態様に従う第一の確率関数610をさらに示しており、図9および10は、態様に従う第二の確率関数620をさらに示している。
【0038】
図7を参照すると、1つの態様によれば、確率モデルを用いる生物検体112を分類または特性決定する方法700は、選択されたOOIが細胞500ではなくアーチファクト510である確率または可能性の決定に用いられる第一の確率関数610を含む。最上位にランク付けされた対象物またはOOIが細胞500ではなくアーチファクト510である可能性がどの程度であるかについての確率を決定することにより、最上位にランク付けされた対象物の中にアーチファクト510が存在するパーセントを決定することができる。
【0039】
1つの態様に従う方法700は、複数の異なる波長にて取得されたOOIのイメージを用いて、各OOIの核に関連する特徴612を抽出または測定することを含む。多波長イメージから抽出された核に関連する特徴を測定することにより、単一のグレーレベルまたはモノクロイメージから抽出された特徴と比較して、OOI中の細胞に関するより詳細な情報が提供される。1つの態様では、これは、複数の波長で得られたOOIのイメージに基づき、例えば核の構造、光学濃度、および形状を含む核に関連する特徴612を測定または決定することを含む。構造とは、隣接するピクセルと比較した任意のピクセルの値を意味する。光学濃度は、吸光度の測定値である。多波長イメージにおける光学濃度の変動は、例えば、OOIがアーチファクト510である可能性がどの程度であるかを決定するのに用いられる重要な情報を提供する。形状とは、核の外形の不規則性を意味する。特定の特徴が単波長イメージから抽出され、その他の特徴が多波長イメージから抽出されるという場合もあり得る。例えば、構造の特徴は、単波長イメージ(例:約570nm)から抽出することができ、光学濃度の特徴は、多波長イメージ(例:約520nmおよび630nm)から抽出することができる。
【0040】
工程710では、抽出された特徴の測定値612を用いて、OOIがアーチファクト510である確率を決定する。これを各OOIについて実施する。従って、工程710の結果は、確率値の集合であり、各OOIが特定の確率値(例:小数またはパーセント)と関連付けられている。次に、工程715では、工程710で得られた確率値の平均を算出することにより、平均確率を決定する。例えば、第一のOOIがアーチファクト510である確率が0.4であり、第二のOOIがアーチファクト510である確率が0.8であり、第三のOOIがアーチファクト510である確率が0.5である場合は、OOI(またはその他の対象物)がアーチファクトである平均確率(別名として「APA」とも称する)は、(0.8+0.4+0.5)/3、または約0.57である。工程715の結果は、任意の検体112に対するOOIが、実際の細胞500よりも多いアーチファクト510から成る平均確率である。
【0041】
図8を参照すると、1つの態様によれば、APAを決定するための方法800は、各々のOOIについて核に関連する複数の特徴612を測定することを含む。1つの態様では、これは、複数の波長で得られたOOIのイメージに基づき、核の構造、光学濃度、および形状を含む核に関連する特徴612を測定または決定することを含む。例えば、1つの態様では、これは、工程805にて各OOIの核の構造を測定、決定、または抽出すること、工程810にて核内での光学濃度の標準偏差を測定、決定、または抽出すること、工程815にて核内での光学濃度の変動を測定、決定、または抽出すること、工程820にて核の補正された光学濃度を測定、決定、または抽出すること、および工程825にて核の境界の形状を測定、決定、または抽出すること、を含む。このデータを有した後、工程830にて、選択されたOOIがアーチファクト510である可能性がどの程度であるかについての第一の確率、例えば第一の事後確率、を算出する。工程835では、工程825にて決定された個々の確率値に基づき、選択されたOOIがアーチファクト510である可能性がどの程度であるかについての平均確率を算出する。
【0042】
図示した態様では、方法800は、5種類の核に関連する特徴612を含む。他の態様では、方法800は、5種類未満の核に関連する特徴612または5種類超の核に関連する特徴612を例とする、異なる数の核に関連する特徴612を含んでよい。さらに、工程805〜825に列挙した5種類の核に関連する特徴以外の異なる核に関連する特徴612も用いることができる。従って、図8は、第一の確率関数610の一例を示すために提供されるものである。
【0043】
図9を参照すると、生物検体112が正常130である可能性がどの程度であるかを決定する方法900は、工程905にて、選択されたOOIがアーチファクト510である可能性がどの程度であるかについての平均確率を決定すること(例:図7および8を参照して考察したAPAを用いて)、および、次に、工程910にて核に関連する特徴622を決定すること、を含む。工程915では、生物検体112が正常130である確率を、平均確率(工程905)と測定された核に関連する特徴(工程910)との組み合わせに基づいて決定する。工程920では、第一および第二の確率関数によって得られたデータの組み合わせを次に用いて、生物検体112を正常130または疑わしい140として分類する。
【0044】
図10は、生物検体112が正常130である可能性がどの程度であるかを決定するための方法1000の1つの態様を示すものであり、工程1005にて、APA、または選択されたOOIがアーチファクト510である可能性がどの程度であるかについての平均確率を決定すること、および核のイメージのピクセルのグレー値に対応する核に関連する特徴622を決定すること、を含む。これは、工程1010にて、核内での平均グレー値コントラストを決定すること、および工程1015にて、核内でのグレー値コントラストの範囲を決定すること、を含んでよい。このデータを有した後、工程1020にて、生物検体112が正常130である確率を、第一の確率関数610(APA)および決定されたグレー値コントラストデータ(工程1010および1015)に基づいて決定する。第一および第二の確率関数によって得られたデータの組み合わせを次に用いて、生物検体112を正常130または疑わしい140として分類する。
【0045】
図11を参照すると、検体112を正常130または疑わしい140として分類することを目的として、第一の確率関数610によって得られたデータおよび第二の確率関数620によって得られたデータを、適切なグラフ1100にプロットすることができる。図示した態様では、グラフ1100は、xおよびy軸を含む二次元グラフである。y軸1102は、第一の確率関数610、すなわち、対象物がアーチファクトである平均確率または「APA」を表す。グラフ1100のx軸1104は、第二の確率関数620、すなわち、生物検体が正常130検体である可能性がどの程度であるかを表す。従って、xおよびy軸、1102および1104の値は、小数またはパーセントの値として表される(例:20%、60%)。従って、第一の確率関数610は、境界線上の正常130検体またはスライドが、アーチファクトに起因する可能性が最も高いことを確認することを含み、ならびに、第二の確率関数620については、これを用いて、境界線上の正常130であるケース(高いアーチファクト数である)を正常130として分類し、これらがさらなるレビューまたは分析を必要としないように安全に選別することができることを確認する。
【0046】
図12は、図11で示されたグラフ1100に、互いに対してプロットされた第一および第二の確率関数610、620を用いて行われた試験で得られたデータを投入したグラフを示す。図12における各試験データポイントは、生物検体112を有するスライド110を表す。データポイントは、OOIを識別することによって得られた。識別された異なる種類のOOIを、図13のチャート1300にまとめる。チャートの第一のカラム1301は、対象物の種類を識別し、第二のカラム1302は、対象物として識別された異なる種類のアーチファクト510(グループ分け1301によって識別される)を含む、特定の種類の対象物の数を示す。
【0047】
この特定の試験では、OOIのイメージは、約440〜720nmの範囲の19種類の異なる波長で取得した。この多波長イメージを用いて10種類の異なる核に関連する特徴を次に分析し、190の異なる核に関連する特徴を得た。形状、光学濃度、および構造を含む核に関連する特徴612を第一の確率関数610に用い、形状、光学濃度、および構造を含む核に関連する特徴622を第二の確率関数620に用いた。
【0048】
特徴の選択は、種々の基準に基づいて行ってよい。この特定の例では、特徴の選択は、例えばピアソンの積率相関を用いて、特徴の値をあらかじめ割り当てたグループに相関させることに基づいて行った。本例におけるあらかじめ割り当てたグループは、「細胞」および「アーチファクト」であり、細胞およびアーチファクトについて、これらの選択された特徴に対する共分散行列を演算処理する。試験対象物の間でグループ平均からのマハラノビスの距離を算出し、そのグループ平均からの距離が最小値である場合に、試験対象物はその区分に属する。各対象物が「アーチファクト」の区分に属する可能性がどの程度であるかについての事後確率を用いて、第一の確率関数、または対象物が「アーチファクト」である平均確率(「APA」)を算出する。
【0049】
個々のスライド110を表す得られたデータポイントを、図12に示すようにグラフ1100にプロットする。グラフ1100は、直線1201、1204により4つの四半分、1211、1212、1213、1214に分割される。横方向の直線1202は、第一の確率関数610の値によって定められ、縦方向の直線1204は、第二の確率関数620の値によって定められる。グラフ1100は、299個の検体スライド110を表すデータポイントを含む。正しく正常130として分類された正常スライドまたは検体130は「X」1220で表され、正常130としては分類されず、疑わしい140として分類された正常スライドまたは検体130は「丸」1221で表され、正常130として分類されなかった異常もしくは疑わしいスライドまたは検体140は「囲んだX」1222で表され、正常130として分類されてしまった異常もしくは疑わしいスライドまたは検体140は「囲んだ丸」(1223)で表される。従って、態様に基づいて、図示した例では、データポイント1220に対応する検体は、細胞検査技師によるレビューを受け、一方、データポイント1221、1222、および1223に対応する検体は、細胞検査技師によるレビューを受けない。
【0050】
より具体的には、299個の検体スライド100のうち、225個のスライドが、疑わしいまたは異常140である検体を含み、残りの74個のスライドが、正常130である検体を含んでいた。態様を試験し、第一および第二の確率関数610、620に基づいて、この74個の正常130検体スライドのうちのいくつを正しく正常130として分類することができたかを判定した。
【0051】
より詳細には、x軸1104は、第二の確率関数620を用いて決定される、検体112が正常130である確率を表すことから、十分に高いx軸1104の値を持つ検体スライド110を正常130として分類することができる。同様に、アーチファクト510は、異常細胞に類似することが多いが異常細胞ではなく、従って、正常130として分類することが可能であることから、十分に高いy軸の値1102を持つスライド110も正常130として分類することができる。従って、態様により、スライド110は、対応するデータポイントが上部右側の四半分1211の範囲内に入るように、x軸1104に沿った十分に高いx軸1104または第一の確率関数(APA)の値、およびy軸1102に沿った十分に高い第二の確率関数(正常である確率)の値を持つ対応するデータポイントに基づいて、有利に、正常130として分類することができる。
【0052】
図示した態様では、正常130である可能性が最も高いスライド110は、第一の値1202よりも大きい、例えば約0.3よりも大きい第一の確率関数610またはAPAの値、ならびに第二の値1204よりも大きい、例えば約0.4よりも大きい第二の確率関数620の値を持つスライドである。これらのポイント1202、1204でxおよびy軸を通って延びる直線の交差によって定められる上部右側の四半分1211内のこれらのデータポイントに対応する検体スライド110を用いて、対応するスライドを正常130として分類することができる(「X」1220で識別される)。従って、細胞検査技師は、データポイント1220(「X)に対応するスライドをレビューまたは分析する必要がなく、態様は、これらのスライドをさらなるレビューから有利に除外する。
【0053】
図示した例では、74個の正常130スライドのうちの37個が正しく正常130として分類された(「X」1220で識別される)。残りの37個の正常130スライドのほとんどは(「丸」1221で識別される)、x軸1104の値または第二の確率関数620の値が低く、対応するデータポイントが上部左側の四半分1212の範囲内に含まれたため、最初は正常130として分類されず、疑わしい140として分類された。データポイント1221(丸)に対応するスライドは、疑わしい140として分類され、従って、細胞検査技師によるさらなるレビューおよび分析が必要であると識別されることになる。従って、態様により、正常130スライドの約50%(「X」1220で識別される)、および全スライド110の約12%が、細胞検査技師によって考慮され得るスライドのプールから有利に除外された。
【0054】
図示した例では、正常130として上部右側の四半分1211に誤って分類された異常検体(「囲まれた丸」1223として識別される)が1つ存在した。その結果、この異常検体1223は、正常130として分類されたことから、細胞検査技師によって検査されないこととなった。しかし、正常130として識別されたおよそ47個のスライドのうち、誤って正常130として分類された異常スライドは僅かに1個であった(囲まれた「丸」1223として識別される)。この低いエラー率は、細胞検査技師の手作業によるレビューで得られるエラー率よりも良好であると考えられる。従って、少数の異常140スライドが、疑わしい140として分類されるべき場合に正常130として分類される場合があり得るものの、エラー率は十分に低く、そのようなエラーは、正常130スライドの約50%を識別することで細胞検査技師の負担を軽減し、細胞検査技師の注意をより適切である疑わしいまたは異常スライド140に集中させるという能力に対する許容範囲内のトレードオフを提示するものと考えられる。
【0055】
残りの3つの四半分内(上部左側1212、下部左側1213、および下部右側1214四半分)のデータポイントは、最初に正常として分類されなかった正常130検体(「丸」1221として識別される)、および「異常」または「正常でない」として正しく分類された異常検体140(囲んだ「X」1222として識別される)を表す。イメージプロセッサ350は、このデータを処理して、特定のスライド110が細胞検査技師によるレビューを受けるべきかどうかに関する指示を作り出すか、またはどのスライド110が細胞検査技師のレビューを要するかを識別することができる(例:上部右側の四半分1211内に含まれず、最初は第一および第二の確率関数610、620を用いて正常130として分類されなかったためにレビューすべきであるスライド110、のリストを作成することにより)。
【0056】
図3に示すイメージングシステムの例を参照して態様を説明するが、その他のイメージングシステム構成を用いてよく、態様が実現されるイメージングシステムは、図3に一般的に示されるように、その他のシステム部材と共に用いるか、これらに付随させるか、またはこれらと連結してよい。例えば、図14を参照すると、態様を実現することができる別のシステムは、イメージング装置1410(例:図3に示すような、または別の適切なイメージング装置)、イメージプロセッサ350、メモリ360および確率モデル120、ならびにFOIプロセッサ1422およびルーティングプロセッサ1424などのその他の付随する部材を含むサーバー1420、ならびに、別個の顕微鏡1432および電動式ステージ1434を含むレビューステーション1430、を有する。図14に示すシステム構成のさらなる局面は、米国特許出願公開第2004/0253616A1号に記載されている。さらに、態様は、例えば図14に示すように、独立したまたは単独のイメージングシステムで実現することができ、または、サイティックコーポレーションから入手可能であり、図15に一般的に示されるI2イメージング/レビューシステムなどの、イメージングおよびレビューの両方の能力を含む一体化されたシステム1500で実現することもできる。
【0057】
さらに、態様を用いて、態様をいかに実現することができるかに関する例として提供される細胞頚部または膣検体以外の様々な種類の検体を処理および分析することができる。さらに、態様は、スライドおよびバイアルを含む種々の検体キャリアに収容または保持された検体を含むことができる。さらに、態様を、異なる種類の検体の分類に適用することができ、その他の目的に用いてもよいことは理解されたい。
【0058】
態様は、様々な数の波長および種々の核に関連する特徴で取得されたイメージから得られたデータに基づく第一および第二の確率関数610、620(例:事後確率関数)を含んでもよい。種々の光学部材およびこれらの組み合わせを用いて、複数の波長の光を発生させることができる。さらに、異なる数の核に関連する特徴を、第一および第二の確率関数を用いて値を決定する目的に用いることができる。従って、5つの核に関連する特徴を用いる第一の確率関数、ならびに第一の確率関数および2つの核に関連する特徴を用いる第二の確率関数は、態様をいかに実現することができるかに関する例を示すために提供されるものであり、その他の態様は、異なる種類および数の核に関連する特徴の使用を含んでよい。さらに、確率モデルは、上述の確率モデルの変形を含んでよい。
【0059】
さらに、態様は、生物検体分類システムと共に用いられ、本明細書にて前述した機能のすべてまたは一部を具体化するコンピュータプログラム製品として具体化することができる。そのような実現は、ディスケット、CD‐ROM、ROM、もしくはハードディスクを例とするコンピュータ読み取り可能媒体などの有形媒体上に固定されるか、またはモデムもしくはその他のインターフェースデバイスを介してコンピュータシステムへ伝送可能である、一連のコンピュータ読み取り可能である命令を含んでよい。
【特許請求の範囲】
【請求項1】
検体キャリア(specimen carrier)上の生物検体を分類して、前記検体にさらなる分析が必要かどうかを決定するための方法であって、前記方法は:
前記検体中の対象物のイメージを取得すること;
前記イメージ中の目的とする対象物を識別すること;
前記識別された目的とする対象物の追加のイメージを複数の異なる波長にて取得すること;
前記識別された目的とする対象物の細胞の特徴を前記追加のイメージから抽出すること;および、
前記抽出された細胞の特徴に基づく確率モデルに従って前記検体を分類し、前記検体にさらなる分析が必要かどうかを決定すること、
を含む、方法。
【請求項2】
前記識別された目的とする対象物の前記追加のイメージが、4つ以上の異なる波長で取得される、請求項1または2に記載の方法。
【請求項3】
前記抽出された細胞の特徴が、核に関連する特徴である、請求項1に記載の方法。
【請求項4】
前記の核に関連する特徴が、核の構造(texture)、核内での光学濃度の標準偏差、核内での光学濃度の変動、核の補正された光学濃度、および核の境界の形状を含む、請求項3に記載の方法。
【請求項5】
前記確率モデルが、第一の確率関数および第二の確率関数を含み、前記第一および第二の確率関数の結果を用いて、前記検体を分類し、前記検体にさらなる分析が必要かどうかを決定する、請求項1から4のいずれか1項に記載の方法。
【請求項6】
前記第一の確率関数が、検体の識別された目的とする対象物がアーチファクトである平均確率を示し、前記第二の確率関数が、部分的に、前記第一の確率関数の結果に基づくものである、請求項5に記載の方法。
【請求項7】
前記抽出された細胞の特徴が、核に関連する特徴であり、前記第一の確率関数が、
核の構造、
核内での光学濃度の標準偏差、
核内での光学濃度の変動、
核の補正された光学濃度、および、
核の境界の形状、
の1もしくは2つ以上を含む抽出された核に関連する特徴に基づくものである、請求項5に記載の方法。
【請求項8】
前記第二の確率関数が、
識別された目的とする対象物の細胞の核のイメージのピクセルのグレー値コントラスト(gray value contrast)の平均、および、
識別された目的とする対象物の細胞の核のイメージのピクセルのグレー値コントラストの範囲、
を含む核に関連する特徴に基づくものである、請求項7に記載の方法。
【請求項9】
前記第一および第二の確率関数が、第一および第二の事後確率関数を含む、請求項5に記載の方法。
【請求項10】
前記第二の確率関数の結果に対する前記第一の確率関数の結果の図による表示を作製し、前記検体が前記図による表示に基づいて分類されることをさらに含む、請求項5に記載の方法。
【請求項11】
検体キャリア上に保持された生物検体を分類して、前記生物検体にさらなる分析が必要かどうかを決定するための生物スクリーニングシステムであって、前記システムは:
前記生物検体中の対象物のデジタルイメージデータを取得するように構成されるイメージング部材;
前記デジタルイメージデータから目的とする対象物を処理し、識別するように構成されるプロセッサ、
を含み、
前記イメージング部材は、前記識別された目的とする対象物の追加のイメージを複数の異なる波長にて取得するようにさらに構成され、
前記プロセッサは、前記識別された目的とする対象物の細胞の特徴を前記追加のイメージから抽出し、そして抽出された細胞の特徴キャリアに基づく確率モデルに従って前記生物検体を分類して、前記生物検体にさらなる分析が必要かどうかを決定するようにさらに構成される、
生物スクリーニングシステム。
【請求項12】
前記イメージング部材が、識別された目的とする対象物の追加のイメージを4種類以上の異なる波長にて取得するように構成される、請求項11に記載のシステム。
【請求項13】
前記抽出された細胞の特徴が、核に関連する特徴である、請求項11または12に記載のシステム。
【請求項14】
前記確率モデルが、第一の確率関数および第二の確率関数を含み、前記第一および第二の確率関数の結果を用いて、前記検体を分類し、前記検体にさらなる分析が必要かどうかを決定する、請求項11に記載のシステム。
【請求項15】
前記第一の確率関数が、検体の識別された目的とする対象物がアーチファクトである平均確率を示し、前記第二の確率関数が、部分的に、前記第一の確率関数の結果に基づくものである、請求項14に記載のシステム。
【請求項1】
検体キャリア(specimen carrier)上の生物検体を分類して、前記検体にさらなる分析が必要かどうかを決定するための方法であって、前記方法は:
前記検体中の対象物のイメージを取得すること;
前記イメージ中の目的とする対象物を識別すること;
前記識別された目的とする対象物の追加のイメージを複数の異なる波長にて取得すること;
前記識別された目的とする対象物の細胞の特徴を前記追加のイメージから抽出すること;および、
前記抽出された細胞の特徴に基づく確率モデルに従って前記検体を分類し、前記検体にさらなる分析が必要かどうかを決定すること、
を含む、方法。
【請求項2】
前記識別された目的とする対象物の前記追加のイメージが、4つ以上の異なる波長で取得される、請求項1または2に記載の方法。
【請求項3】
前記抽出された細胞の特徴が、核に関連する特徴である、請求項1に記載の方法。
【請求項4】
前記の核に関連する特徴が、核の構造(texture)、核内での光学濃度の標準偏差、核内での光学濃度の変動、核の補正された光学濃度、および核の境界の形状を含む、請求項3に記載の方法。
【請求項5】
前記確率モデルが、第一の確率関数および第二の確率関数を含み、前記第一および第二の確率関数の結果を用いて、前記検体を分類し、前記検体にさらなる分析が必要かどうかを決定する、請求項1から4のいずれか1項に記載の方法。
【請求項6】
前記第一の確率関数が、検体の識別された目的とする対象物がアーチファクトである平均確率を示し、前記第二の確率関数が、部分的に、前記第一の確率関数の結果に基づくものである、請求項5に記載の方法。
【請求項7】
前記抽出された細胞の特徴が、核に関連する特徴であり、前記第一の確率関数が、
核の構造、
核内での光学濃度の標準偏差、
核内での光学濃度の変動、
核の補正された光学濃度、および、
核の境界の形状、
の1もしくは2つ以上を含む抽出された核に関連する特徴に基づくものである、請求項5に記載の方法。
【請求項8】
前記第二の確率関数が、
識別された目的とする対象物の細胞の核のイメージのピクセルのグレー値コントラスト(gray value contrast)の平均、および、
識別された目的とする対象物の細胞の核のイメージのピクセルのグレー値コントラストの範囲、
を含む核に関連する特徴に基づくものである、請求項7に記載の方法。
【請求項9】
前記第一および第二の確率関数が、第一および第二の事後確率関数を含む、請求項5に記載の方法。
【請求項10】
前記第二の確率関数の結果に対する前記第一の確率関数の結果の図による表示を作製し、前記検体が前記図による表示に基づいて分類されることをさらに含む、請求項5に記載の方法。
【請求項11】
検体キャリア上に保持された生物検体を分類して、前記生物検体にさらなる分析が必要かどうかを決定するための生物スクリーニングシステムであって、前記システムは:
前記生物検体中の対象物のデジタルイメージデータを取得するように構成されるイメージング部材;
前記デジタルイメージデータから目的とする対象物を処理し、識別するように構成されるプロセッサ、
を含み、
前記イメージング部材は、前記識別された目的とする対象物の追加のイメージを複数の異なる波長にて取得するようにさらに構成され、
前記プロセッサは、前記識別された目的とする対象物の細胞の特徴を前記追加のイメージから抽出し、そして抽出された細胞の特徴キャリアに基づく確率モデルに従って前記生物検体を分類して、前記生物検体にさらなる分析が必要かどうかを決定するようにさらに構成される、
生物スクリーニングシステム。
【請求項12】
前記イメージング部材が、識別された目的とする対象物の追加のイメージを4種類以上の異なる波長にて取得するように構成される、請求項11に記載のシステム。
【請求項13】
前記抽出された細胞の特徴が、核に関連する特徴である、請求項11または12に記載のシステム。
【請求項14】
前記確率モデルが、第一の確率関数および第二の確率関数を含み、前記第一および第二の確率関数の結果を用いて、前記検体を分類し、前記検体にさらなる分析が必要かどうかを決定する、請求項11に記載のシステム。
【請求項15】
前記第一の確率関数が、検体の識別された目的とする対象物がアーチファクトである平均確率を示し、前記第二の確率関数が、部分的に、前記第一の確率関数の結果に基づくものである、請求項14に記載のシステム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【公表番号】特表2010−540931(P2010−540931A)
【公表日】平成22年12月24日(2010.12.24)
【国際特許分類】
【出願番号】特願2010−527016(P2010−527016)
【出願日】平成20年9月12日(2008.9.12)
【国際出願番号】PCT/US2008/076205
【国際公開番号】WO2009/045699
【国際公開日】平成21年4月9日(2009.4.9)
【出願人】(507130015)サイテック コーポレイション (18)
【Fターム(参考)】
【公表日】平成22年12月24日(2010.12.24)
【国際特許分類】
【出願日】平成20年9月12日(2008.9.12)
【国際出願番号】PCT/US2008/076205
【国際公開番号】WO2009/045699
【国際公開日】平成21年4月9日(2009.4.9)
【出願人】(507130015)サイテック コーポレイション (18)
【Fターム(参考)】
[ Back to top ]