染色体状態の評価方法および評価システム

染色体テリトリを含む細胞を撮影した画像情報に基づいて、細胞の状態を評価する方法を提供する。この方法は、前記画像から、前記染色体テリトリを抽出するステップ（Ｓ２０）と、前記染色体テリトリの配置状態を標準化した後、当該配置状態を定量化するステップ（Ｓ２２）と、定量化された前記染色体テリトリの配置状態に基づき、前記細胞の状態を評価するステップ（Ｓ２６）と、を含む。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、細胞周期の間期における染色体テリトリの配置状態に基づき、細胞および細胞に含まれる染色体の状態を評価する方法およびシステムに関する。
【背景技術】
【０００２】
従来、染色体の形態は細胞周期の分裂期における凝縮した状態でしか観測することができなかった。しかし、近年の可視化技術（３Ｄ−ＦＩＳＨ、共焦点レーザ顕微鏡）の発達により、細胞周期の間期における染色体の配置や形態を観測することが可能になってきた。このような可視化技術により、間期における細胞の核内において、個々の染色体が互いに混ざり合うことのない領域に分かれて存在することが明らかになってきた（非特許文献１、非特許文献２）。以下、個々の染色体が核内において占有する領域を染色体テリトリ（ｃｈｒｏｍｏｓｏｍｅｔｅｒｒｉｔｏｒｙ）という。
【非特許文献１】Ｔ．Ｃｒｅｍｅｒ，Ｃ．Ｃｒｅｍｅｒ，ＣＨＲＯＭＯＳＯＭＥＴＥＲＲＩＴＯＲＩＥＳＮＵＣＬＥＡＲＡＲＣＨＩＴＥＣＴＵＲＥＡＮＤＶＥＮＥＲＥＧＵＬＡＴＩＯＮＩＮＭＡＭＭＡＬＩＡＮＣＥＬＬＳ，ＮＡＴＵＲＥＲＥＶＩＥＷＳ｜ＧＥＮＥＴＩＣＳ，ｖｏｌ．２，ｐｐ．２９２−３０１，２００１
【非特許文献２】田辺秀之、「染色体テリトリー：間期核における染色体の核内配置と核高次構造に関する最近の研究」、Ｅｎｖｉｒｏｎ．ＭｕｔａｇｅｎＲｅｓ．，２５、１１〜２２頁、２００３
【特許文献１】特開２００１−９２９８０号公報
【発明の開示】
【０００３】
【０００４】
ところで、正常細胞から腫瘍細胞への変化、および良性腫瘍細胞から悪性腫瘍細胞への変化は、遺伝子の変異や遺伝子の転座によっておこると考えられている。非特許文献２には、空間的に近接して配置されている染色体テリトリどうしは、互いに遠方に配置されているものに比べ、転座を起こす確率が高いという考え方が記載されている。
【０００５】
以上のことから、染色体テリトリどうしの空間配置を検討することにより、細胞の変化を評価することが期待される。しかし、従来、染色体テリトリどうしの空間配置を定量的に解析し、細胞の変化を評価する技術は提供されていない。
【０００６】
本出願の発明者らは、細胞周期の間期における染色体テリトリの配置状態を調べることにより、細胞の状態を評価し、評価結果に基づき、癌等の疾患の診断の指標とすることを目的とし、以下の発明を考案した。
【０００７】
本発明によれば、染色体テリトリを含む細胞を撮影した画像情報に基づいて、細胞の状態を評価する方法であって、画像から、染色体テリトリを抽出するステップと、染色体テリトリの配置状態を標準化した後、当該配置状態を定量化するステップと、定量化された染色体テリトリの配置状態に基づき、細胞の状態を評価するステップと、を含むことを特徴とする評価方法が提供される。
【０００８】
ここで、配置状態は、細胞の核内における染色体テリトリの相対位置、染色体テリトリの主軸の方向、および染色体テリトリの広がりの少なくともいずれか１つを含むことができる。また、標準化とは、複数の細胞における染色体領域の形状を統一した指標で定量化するための処理である。このような処理を行うことにより、複数の細胞について、統一した指標で定量化を行うことができる。
【０００９】
ここで、細胞の状態を評価するとは、細胞に含まれる染色体状態を評価すること、ならびに細胞に生じた変化、細胞の形態異常の予期、染色体転座、および細胞に生じた変化に基づく癌等の疾患に罹患している可能性を評価することをいう。本発明の評価方法によれば、染色体テリトリの形状を定量化することができるので、定量化した結果に基づき、細胞の形態異常や疾患の有無を早期に検知することが期待できる。
【００１０】
細胞を撮影した画像は、細胞の核を核断面で画像化した複数の画像とすることができ、染色体テリトリを抽出するステップは、複数の画像から染色体テリトリをそれぞれ抽出し、これらを合成して染色体テリトリ像を３次元で抽出することができる。
【００１１】
本発明の評価方法において、染色体テリトリを抽出するステップにおいて、細胞の核を抽出するとともに当該核内に含まれる染色体テリトリを抽出することができ、配置状態を定量化するステップは、核の形状を標準化するステップと、標準化前の核および標準化後の核の形状変化に基づいて、染色体テリトリの座標を変換するステップと、を含むことができる。ここで、核の形状変化とは、かたちが変化すること、および大きさが変化することのいずれも含んでよい。染色体テリトリの座標を変換するステップは、標準化前の核と染色体テリトリとの相対関係、および標準化後の核と染色体テリトリとの相対関係に基づいて座標変換を行うことができる。
【００１２】
本発明の評価方法は、複数の細胞の配置状態を定量化した結果を統計処理するステップをさらに含むことができ、細胞の状態を評価するステップにおいて、一の細胞の配置状態を定量化した結果と統計処理の結果とに基づき、一の細胞の状態を評価することができる。
【００１３】
本発明の評価方法において、統計処理するステップは、複数の細胞の配置状態を定量化した結果に基づき、配置状態の定量化結果の標準値を算出するステップを含むことができ、細胞の状態を評価するステップにおいて、一の細胞の配置状態を定量化した結果と標準値とに基づき、一の細胞の状態を評価することができる。
【００１４】
本発明の評価方法において、標準値を算出するステップは、複数の細胞の染色体の配置を定量化した結果の平均値を算出するステップを含むことができる。
【００１５】
本発明によれば、染色体テリトリを含む細胞を撮影した画像情報に基づいて、細胞の状態を評価する方法であって、画像から、複数の染色体テリトリをそれぞれ抽出するステップと、複数の染色体テリトリの配置状態を定量化するステップと、複数の細胞の配置状態を定量化した結果を統計処理するステップと、一の細胞の配置状態を定量化した結果と、統計処理の結果とに基づき、一の細胞の状態を評価するステップと、を含むことを特徴とする評価方法が提供される。
【００１６】
このように一の細胞の染色体テリトリの配置状態を定量した結果を統計処理の結果と比較することにより、その一の細胞の異常度を評価することができる。また、本発明の評価方法によれば、染色体テリトリの形状を定量化することができるので、定量化した結果に基づき、細胞の形態異常や疾患の有無を早期に検知することが期待できる。
【００１７】
本発明の評価方法において、配置状態は、複数の染色体テリトリ間の距離、または複数の染色体テリトリの配置方向の少なくともいずれか１つを含むことができる。
【００１８】
本発明の評価方法において、定量化するステップは、複数の染色体テリトリ間の距離を算出するステップを含むことができる。
【００１９】
本発明の評価方法において、距離を算出するステップは、複数の染色体テリトリそれぞれの重心を算出するステップと、重心間の距離を算出するステップと、を含むことができる。
【００２０】
また、本発明の評価方法において、距離を算出するステップは、以下のようにすることもできる。
【００２１】
本発明の評価方法において、距離を算出するステップは、マハラノビスの距離を用いて染色体テリトリ間の距離を算出するステップを含むことができる。
【００２２】
本発明の評価方法において、距離を算出するステップは、染色体テリトリの境界間の距離を算出するステップを含むことができる。ここで、染色体テリトリの境界間の距離としては、境界間の最短距離を用いることができる。
【００２３】
本発明の評価方法において、距離を算出するステップは、複数の染色体テリトリの形状をそれぞれ正規分布で近似するステップと、染色体テリトリそれぞれの正規分布の平均値を算出するステップと、平均値間の距離を算出するステップと、を含むことができる。
【００２４】
本発明の評価方法において、距離を算出するステップは、複数の染色体テリトリそれぞれの骨格線を検出するステップと、骨格線の重心を算出するステップと、重心間の距離を算出するステップと、を含むことができる。
【００２５】
本発明の評価方法において、前記定量化するステップは、前記複数の染色体テリトリの配置方向を定量化するステップを含むことができる。
【００２６】
本発明の評価方法において、前記配置方向を定量化するステップは、前記複数の染色体テリトリの主軸をそれぞれ検出するステップと、前記主軸の角度を算出するステップと、を含むことができる。
【００２７】
本発明の評価方法において、主軸を検出するステップは、複数の染色体テリトリの形状を正規分布で近似するステップと、近似した染色体テリトリの形状に基づき、染色体テリトリそれぞれの正規分散の平均値および共分散行列を算出するステップと、共分散行列を固有値分解するステップと、を含むことができる。
【００２８】
本発明によれば、染色体テリトリを含む細胞を撮影した画像情報に基づいて、細胞の状態を評価する方法であって、画像から、細胞の核および染色体テリトリをそれぞれ抽出するステップと、核および染色体テリトリの配置状態を定量化するステップと、複数の細胞の配置状態を定量化した結果を統計処理するステップと、一の細胞の配置状態を定量化した結果と、統計処理の結果とに基づき、一の細胞の状態を評価するステップと、を含むことを特徴とする評価方法が提供される。
【００２９】
本発明の評価方法において、定量化するステップは、核内の基準点と染色体テリトリとの間の距離を算出するステップを含むことができる。ここで、核内の基準点とは、たとえば、核壁、または重心とすることができる。
【００３０】
本発明の評価方法において、染色体テリトリの配置状態を定量化するステップは、染色体テリトリの配置状態を標準化するステップをさらに含み、染色体テリトリの配置状態を標準化した後に、当該配置状態を定量化することができる。
【００３１】
本発明の評価方法において、統計処理するステップは、複数の細胞の配置状態を定量化した結果に基づき、配置状態の定量化結果の標準値を算出するステップを含むことができ、細胞の状態を評価するステップにおいて、一の細胞の配置状態を定量化した結果と、標準値とに基づき、一の細胞の状態を評価することができる。
【００３２】
本発明の評価方法において、標準値を算出するステップは、複数の細胞の配置状態を定量化した結果の平均値を算出するステップを含むことができる。
【００３３】
本発明によれば、染色体テリトリを含む細胞を撮影した画像情報に基づいて、細胞の状態を評価する方法であって、画像から、細胞の核および複数の染色体テリトリをそれぞれ抽出するステップと、核の形状を標準化するステップと、染色体テリトリの座標を、標準化前の核および標準化後の核の形状変化に応じて定められた一定の基準に従って変換するステップと、変換された染色体テリトリの重心をそれぞれ算出するステップと、複数の染色体テリトリの重心間の距離を算出するステップと、複数の細胞について、得られた重心間の距離を統計処理するステップと、一の細胞の重心間の距離と、統計処理の結果とに基づき、一の細胞の状態を評価するステップと、を含むことを特徴とする評価方法が提供される。
【００３４】
本発明の評価方法において、細胞の状態を評価するステップは、ｔ検定を用いて一の細胞の配置状態を定量化した結果と統計処理の結果との差異を定量化するステップを含むことができる。
【００３５】
本発明の評価方法において、細胞の状態を評価するステップは、カイ２乗検定を用いて一の細胞の配置状態を定量化した結果と統計処理の結果との差異を定量化するステップを含むことができる。
【００３６】
本発明によれば、染色体テリトリを含む細胞を撮影した画像情報に基づいて、細胞の状態を評価するシステムであって、画像から、染色体テリトリを抽出する抽出処理部と、抽出した染色体テリトリの配置状態を定量化する定量化処理部と、配置状態を定量化した結果を記憶する記憶部と、複数の細胞の配置状態を定量化した結果を統計処理する統計処理部と、一の細胞の配置状態を定量化した結果と、統計処理の結果とに基づき、一の細胞の状態を評価する評価部と、を含むことを特徴とする評価システムが提供される。
【００３７】
本発明の評価システムにおいて、定量化処理部は、画像から抽出した染色体テリトリの配置状態を標準化し、染色体テリトリの配置状態を標準化した後に、当該配置状態を定量化することができる。
【００３８】
本発明の評価システムにおいて、抽出処理部は、細胞の核を抽出するとともに当該核内に含まれる染色体テリトリを抽出することができ、定量化処理部は、核の形状を標準化し、標準化前の核および標準化後の核の形状変化に基づいて、染色体テリトリの座標を変換することができる。
【００３９】
本発明によれば、コンピュータに、染色体テリトリを含む細胞を撮影した画像情報に基づいて、細胞の状態を評価させるためのプログラムであって、コンピュータを、画像から、染色体テリトリを抽出する手段、染色体テリトリの配置状態を標準化した後、当該配置状態を定量化する手段、定量化された染色体テリトリの配置状態に基づき、細胞の状態を評価する手段、として機能させることを特徴とするプログラムが提供される。
【００４０】
本発明によれば、コンピュータに、染色体テリトリを含む細胞を撮影した画像情報に基づいて、細胞の状態を評価させるためのプログラムであって、コンピュータを、画像から、染色体テリトリを抽出する抽出処理手段、抽出した染色体テリトリの配置状態を定量化する定量化処理手段、配置状態を定量化した結果を記憶する記憶手段、複数の細胞の配置状態を定量化した結果を統計処理する統計処理手段、一の細胞の配置状態を定量化した結果と、統計処理の結果とに基づき、一の細胞の状態を評価する評価手段、として機能させることを特徴とするプログラムが提供される。
【００４１】
本発明の評価方法において、画像は、それぞれ属性値を有する複数のピクセルにより構成され、染色体テリトリを抽出するステップは、画像を複数のクラスに分類するステップと、クラスのいずれかを染色体テリトリを表す領域として画像から抽出するステップと、を含むことができる。ここで、分類するステップは、クラスそれぞれの属性値を示す属性パラメータおよびクラスそれぞれの混合比率の初期値を設定するステップと、属性パラメータおよび混合比率に基づき、複数のピクセルのそれぞれがクラスそれぞれに分類されるクラス帰属確率を算出するステップと、属性パラメータおよび混合比率により規定される混合確率分布、および帰属確率に基づき、推定の良さを示す評価関数を算出し、当該評価関数が所定の条件を満たすか否かを判定するステップと、評価関数が所定の条件を満たさない場合、属性パラメータおよび混合比率を更新するステップと、評価関数が所定の条件を満たすときの属性パラメータおよび混合比率に基づき、複数のピクセルを複数のクラスのいずれかに分類するステップと、を含むことを特徴とする。
【００４２】
この方法を用いることにより、画像から染色体テリトリを精度良く抽出することができる。染色体テリトリを精度良く抽出することにより、染色体テリトリの定量化結果のばらつきを低減することができ、細胞の状態を良好に評価することができる。
【００４３】
本発明の評価方法において、クラス帰属確率を算出するステップは、複数のピクセルをその属性値に応じて複数の部分空間に分解するステップと、部分空間に含まれるピクセルの割合を示す粗視化経験確率分布を算出するステップと、属性パラメータおよび混合比率に基づき、部分空間のそれぞれがクラスそれぞれに分類される粗視化クラス帰属確率を算出するステップと、を含むことができ、評価関数を算出するステップは、属性パラメータおよび混合比率により規定される混合確率分布を部分空間内で平均化して粗視化混合確率分布を算出するステップを含むことができ、粗視化経験確率分布、粗視化混合確率分布、および粗視化クラス帰属確率に基づき、評価関数を算出することができる。
【００４４】
このような粗視化を行うことにより、処理時間を大幅に短縮することができる。以下、粗視化処理を詳細に説明する。
【００４５】
本発明の染色体テリトリの抽出方法としては、以下のものも有効である。
（１）抽出の対象となる像を含む画像に対し、画像上の各ピクセルを複数のクラスに分類し、所望の領域を抽出する抽出方法において、
画像の各ピクセルが取り得る属性値全体から構成されるデータ空間を、所与の解像度で部分空間に分解し、該各部分空間に属性値を取るピクセルの集合と、該ピクセルの属性値の平均と、該ピクセルの個数とを保持する粗視化データ空間を構成する第１の工程と、
各部分空間のピクセル数を画像に含まれる全ピクセル数で除し、粗視化データ空間上の粗視化経験確率分布を算出する第２の工程と、
各クラスの属性を規定するクラスパラメータおよびクラスの混合比率を初期化する第３の工程と、
クラスパラメータからクラスが指定されたもとでの条件付き確率分布を算出し、当該条件付き確率分布を各部分空間内で平均化することによって粗視化条件付き確率分布を算出する第４の工程と、
クラスの混合比率に粗視化条件付き確率分布を乗じることにより、各ピクセルが各クラスに帰属する確率であるクラス帰属確率を算出する第５の工程と、
クラスパラメータおよびクラスの混合比率を更新する第６の工程と、
粗視化条件付き確率分布を用いて、評価関数を算出する第７の工程と、
評価関数が所与の終了条件を満たしているか否かを調べる第８の工程と、
評価関数が所与の終了条件を満たしたときのクラスパラメータ、クラスの混合比率、およびクラス帰属確率に基づいて、各ピクセルが属するクラスを決定し、所望の領域を抽出する第９の工程と、
を含むことを特徴とする抽出方法。
【００４６】
ここで、評価関数としては、粗視化対数尤度を用いることができる。このとき、第６の工程において、評価関数を増加させるようにクラスパラメータおよびクラスの混合比率を更新することができる。また、第３の工程において、クラスの数を初期化することもできる。また、クラスの数は、予め所与の値を設定しておくこともできる。また、本発明の抽出方法において、第８の工程において、評価関数が所与の条件を満たすまで、第４、第５、第６、第７、および第８の工程を繰り返すことができる。
【００４７】
（２）上記（１）に記載の抽出方法において、
第４の工程において、粗視化条件付き確率分布を算出する際に、各部分空間に含まれるピクセルの属性値の平均値を算出し、該平均値を用いて各部分空間における粗視化条件付き確率分布を算出することを特徴とする抽出方法。
【００４８】
（３）上記（１）または（２）に記載の抽出方法において、
粗視化の解像度が元の解像度であるかを調べる第１０の工程と、
部分空間の解像度を元の解像度へ復元する第１１の工程と、をさらに含み、
部分空間の解像度を元の解像度へ復元した後に、第１の工程〜第８の工程を行い、
第３の工程において、第９の工程におけるクラスパラメータおよびクラスの混合比率を初期値として用いることを特徴とする抽出方法。
【００４９】
（４）上記（１）乃至（３）いずれかに記載の抽出方法において、
第９の工程において、前記評価関数が所与の終了条件を満たしたときのクラスの混合比率に画像に含まれる全ピクセル数を乗じることにより各クラスに属するピクセル数を算出し、クラス帰属確率が高い順から前記ピクセル数のピクセルを選択することにより各クラスに属するピクセルを決定することを特徴とする抽出方法。
【００５０】
（５）上記（１）乃至（４）いずれかに記載の抽出方法において、
第７の工程において、評価関数としてＡＩＣを用い、第６の工程において評価関数を減少させるようパラメータを変更することを特徴とする抽出方法。
【００５１】
（６）上記（１）乃至（４）いずれかに記載の抽出方法において、
第７の工程において、評価関数としてＭＤＬ（ＭｉｎｉｍｕｍＤｅｓｃｒｉｐｔｉｏｎＬｅｎｇｔｈ，最小記述長）を用い、第６の工程において該評価関数を減少させるようパラメータを変更することを特徴とする抽出方法。
【００５２】
（７）上記（１）乃至（４）いずれかに記載の抽出方法において、
第７の工程において、評価関数としてストラクチュラル・リスク（ＳｔｒｕｃｔｕｒａｌＲｉｓｋ）を用い、第６の工程において該評価関数を減少させるようパラメータを変更することを特徴とする抽出方法。
【００５３】
（８）上記（１）乃至（７）いずれかに記載の抽出方法において、
第３の工程において、
各部分空間どうしが近傍にあるか否かを定義する近傍半径と、クラスの数を設定し（ステップＢ１）、
各部分空間ごとに、各部分空間の代表値を設定し（ステップＢ２）、
分類対象部分空間の集合を設定し（ステップＢ３）、
分類対象部分空間の集合の中から、粗視化経験確率の最も高い部分空間を選択し（ステップＢ４）、
粗視化経験確率の最も高い部分空間の代表値との距離が、近傍半径以内である代表値を持つ部分空間すべてを、近傍集合として選択し（ステップＢ５）、
すでに分類が完了したクラスに含まれる部分空間の代表値と、近傍集合に含まれる部分空間の代表値との間の最短距離が、近傍半径よりも大きいか否かを調べ（ステップＢ６）、
ステップＢ６において、すでに分類が完了したクラスに含まれる部分空間の代表値と近傍集合に含まれる部分空間の代表値との間の最短距離が近傍半径よりも大きければ、近傍集合を新規クラスとするとともに分類対象部分空間から近傍集合を削除し（ステップＢ７）、
ステップＢ６において、すでに分類が完了したクラスに含まれる部分空間の代表値と近傍集合に含まれる部分空間の代表値との間の最短距離が近傍半径より小さければ、近傍集合をすでに分類済みのクラスに追加するとともに分類対象部分空間から近傍集合を削除し（ステップＢ８）、
分類対象部分空間が空集合であるか否かを調べ（ステップＢ９）、
ステップＢ９において、分類対象部分空間が空集合でなければ、ステップＢ４以下を繰り返し、
ステップＢ９において、分類対象部分空間が空集合であれば、分類が完了したクラスの数が所与の数以上あるか否かを調べ（ステップＢ１０）、
ステップＢ１０において、分類が完了したクラスの数が所与の数よりも少なければ、近傍半径を縮小し（ステップＢ１１）、ステップＢ３以下を繰り返し、
ステップＢ１０において、分類対象部分空間が空集合であり、かつ分類済みのクラスの数が所与の数よりも多ければ、各クラス内でクラスパラメータを算出し、これをクラスパラメータの初期値とするとともに、各クラス内に含まれる部分空間の数の比率をクラスの混合比率の初期値とする（ステップＢ１２）、
ことを特徴とする抽出方法。
【００５４】
なお、ステップＢ７およびＢ８において、すでに分類が完了したクラスに含まれる部分空間の代表値と近傍集合に含まれる部分空間の代表値との間の最短距離が近傍半径と等しい場合、いずれの処理を行ってもよい。
【００５５】
（９）抽出の対象となる像を含む画像に対し、画像上の各ピクセルを複数のクラスに分類し、所望の領域を抽出する抽出装置において、
画像を読み込む入力装置と、
画像の各ピクセルが取り得る属性値全体から構成されるデータ空間を、所与の解像度で部分空間に分解し、該各部分空間に属性値を取るピクセルの集合と、該ピクセルの属性値の平均と、該ピクセルの個数を保持し、粗視化データ空間を構成する領域粗視化装置と、
各部分空間のピクセル数を画像に含まれる全ピクセル数で割り、粗視化データ空間上の粗視化経験分布を算出する粗視化経験確率分布算出装置と、
各クラスの属性を規定するクラスパラメータおよびクラスの混合比率を初期化し、各クラスの属性を規定するクラスパラメータから、クラスが指定されたもとでの条件付き確率分布を算出し、クラスが指定されたもとでの条件付き確率分布を、各部分空間内で平均化することによって粗視化条件付き確率分布を算出する粗視化条件付き確率分布装置と、
粗視化条件付き確率分布から画像各ピクセルが各クラスに帰属する確率であるクラス帰属確率を算出するクラス帰属確率算出装置と、
クラスパラメータおよびクラスの混合比率を更新するパラメータ更新装置と、
粗視化条件付き確率分布を用いて、評価関数を算出する評価関数算出装置と、
評価関数が所与の終了条件を満たしているか否かを調べ、評価関数が所与の終了条件を満たしたときのクラスパラメータ、クラスの混合比率、およびクラス帰属確率に基づいて、各ピクセルが属するクラスを決定し、所望の領域を抽出する領域抽出装置と、
抽出した領域を出力する出力装置と、
を有することを特徴とする抽出装置。
【００５６】
ここで、評価関数算出装置は、評価関数として、粗視化対数尤度、ＡＩＣ、ＭＤＬ、またはストラクチュラル・リスクを用いることができる。評価関数算出装置が評価関数として粗視化対数尤度を用いるとき、パラメータ更新装置は、評価関数を増加させるように、クラスパラメータおよびクラスの混合比率を更新することができる。また、評価関数算出装置が評価関数としてＡＩＣ、ＭＤＬ、またはストラクチュラル・リスクのいずれかを用いるとき、パラメータ更新装置は、評価関数を減少させるようにクラスパラメータおよびクラスの混合比率を更新することができる。
【００５７】
（１０）上記（９）に記載の抽出装置において、
評価関数が所与の終了条件を満たしていることが確認されたのち、粗視化の解像度が元の解像度であるかを調べ、データ空間の解像度を元の解像度へ復元する解像度復元装置をさらに有することを特徴とする抽出装置。
【００５８】
以下、上記（１）乃至（１０）に記載の抽出方法および抽出装置の作用を説明する。
上記（１）に記載の抽出方法においては、画像を構成する各ピクセルの持つ属性値を確率変数と見なし、推定したピクセル値の確率分布に基づいて所望の領域を抽出する。ここで、属性値としては、たとえばモノクロ画像ならば輝度の値、カラー画像ならば赤（Ｒ）、緑（Ｇ）、青（Ｂ）の色要素の強度等を用いることができる。
【００５９】
ここで、所望の領域を抽出するために、各ピクセルを、各ピクセルの属性値に基づいて類似の属性を持つ複数のグループに分類する。本明細書においては、類似の属性を持つピクセルの集合をクラスと呼ぶ。各クラスは、たとえばそのクラスに属する属性値の平均値や分散等によって特徴づけられるものとする。以下、これらクラスの特徴をそのクラスの「クラスパラメータ」とよび、φ_ｉ（ｉ＝１，，，ｋ）で表す。ここで、ｋはクラスの数である。ここで、ｊ番目のピクセルが、ｘ_ｊという属性値を取る確率は、次の混合分布で表現できる。
【００６０】
【数１】

【００６１】
ここで、ｆ（ｘ_ｊ｜φ_ｉ）は、データがｉ番目のクラスから発生していると仮定したときの条件付確率分布、ｗ_ｉは各クラスの混合比率で、
【００６２】
【数２】

を満たす。
【００６３】
画像がモノクロ画像の場合、ｘ_ｊは、０から２５５等の整数値で表される。また、画像がカラー画像の場合、ｘ_ｊは、ＲＧＢの色要素の値を成分とした３次元ベクトル（ｘ_ｊ１，ｘ_ｊ２，ｘ_ｊ３）で表される。ここで、各ｘ_ｊｌ（ｌ＝１，２，３）は、たとえば０から２５５の整数値を取る。
【００６４】
混合比率ｗ_ｉは、異なるクラスに属する領域の面積比（２次元領域の場合）または体積比（３次元領域の場合）を表す。たとえば、平均輝度２００、輝度の標準偏差が２０という特徴で表される明るい画像領域（クラス１とする）と、平均輝度５０、輝度の標準偏差が１０という特徴で表される暗い領域（クラス２とする）の二つの領域から構成されるモノクロ画像があるとする。また、その画像の面積の７割を明るい領域が、３割を暗い領域が占めているとする。この場合、クラスの数はｋ＝２、クラスパラメータはφ_１＝（２００，２０），φ_２＝（５０，１０）であり、この画像の混合分布は、
【００６５】
【数３】

と表現することができる。
【００６６】
以下、クラスの混合比率ｗ_ｉとクラスパラメータφ_ｉをまとめてθ_ｉと示す。以下において単に「パラメータ」というときはこのθ_ｉを意味する。
【００６７】
上記（１）に記載の抽出方法では、以下のように定義される平均対数尤度
【００６８】
【数４】

を最大にするパラメータを推定し、推定したパラメータの情報を利用して領域抽出を行う。ここでｎは画像に含まれるピクセル数である。このような統計手法は最尤法と呼ばれている。しかしながら、平均対数尤度を最大にするパラメータを推定することは、一般に困難である。そこで、この平均対数尤度のかわりに次の量
【００６９】
【数５】

で表される完全対数尤度の期待値Ｑを用いてパラメータを推定することができる。
ここで、
【００７０】
【数６】

は、ｊ番目のピクセルがｉ番目のクラスに帰属する確率である。本発明ではこれをクラス帰属確率という。Ｑが増大するようにパラメータを更新すれば、上述の平均対数尤度Ｌも必ず増大することは、数学的に証明されている（たとえばＡ．Ｐ．Ｄｅｍｐｓｔｅｒ，Ｎ．Ｍ．Ｌａｉｒｄ，ａｎｄＤ．Ｂ．Ｒｕｂｉｎ，ＭａｘｉｍｕｍＬｉｋｅｌｉｈｏｏｄＦｒｏｍＩｎｃｏｍｐｌｅｔｅＤａｔａｖｉａＴｈｅＥＭＡｌｇｏｒｉｔｈｍ，Ｊ．Ｒｏｙ．Ｓｔａｔ．Ｓｏｃ．，ｖｏｌ．３０，ｐｐ．２０５−２４８，１９７７（以下、非特許文献３という））。
【００７１】
本発明において、パラメータを推定し、推定されたパラメータから実際に領域を抽出する手順を説明する。
まず適当な初期パラメータから開始し、式（５）で与えられるクラス帰属確率を求める。次にＱを増加させるようにパラメータｗおよびφを更新し、改めてＱを算出する。最終的にＱが増加しなくなるまでこの手順を繰り返す。最終的にＱが増加しなくなったときのパラメータｗおよびφを用いて領域を抽出する。ｋ個のクラスのうち、たとえばｉ番目のクラスに属するピクセルを抽出するためには、まず各ピクセルのｉ番目のクラスへの帰属確率の値を調べる。ついで、その確率値が一定値以上のピクセルをそのクラスに属するものとして分類する。すべてのピクセルをそれぞれのクラスに分類し終わった時点で、ｋ個のクラスの中から所望の属性を持ったクラスを選択し、そのクラスに属するピクセルを画像から抽出すれば、所望の領域を自動的に抽出することができる。
【００７２】
本発明では、このＱの最大化を高速に行うために、粗視化確率分布を導入する。粗視化確率分布は、データが取り得る値全体からなる空間（以下、データ空間と呼ぶ）を互いに交わらないＮ個の部分空間に分解し、各部分空間に確率を割り当てることによって構成される。
【００７３】
具体的には、ｊ番目の部分空間における粗視化された条件付き確率分布を
【００７４】
【数７】

で定義し、粗視化条件付き確率分布を
【００７５】
【数８】

とする。ここで、Ａ_ｊはｊ番目の部分空間である。Ｄをデータ空間全体とすると、
【００７６】
【数９】

を満たす。またＩ_Ａ（ｘ）は、データ値が部分空間Ａに含まれるときに１、それ以外の時に０となる指示関数で、
【００７７】
【数１０】

は、Ａの測度である（データ空間が２次元のときにはＡの面積を、３次元空間のときは体積を表す。）。
【００７８】
このように定義された粗視化条件付き確率分布を用いると、上記式（４）に示したＱは、
【００７９】
【数１１】

と書き換えることができる。ここで
【００８０】
【数１２】

は粗視化された経験確率分布、
【００８１】
【数１３】

は粗視化されたクラス帰属確率である。この式（９）で与えられる粗視化された完全対数尤度を最大化することによって、次の粗視化平均対数尤度
【００８２】
【数１４】

を最大化することができる。
【００８３】
元のＱと比較すると、式（４）で与えられるＱが全データに関して和をとっているのに対し、式（９）で与えられる粗視化された完全対数尤度は、部分空間に関してのみ和を取っている。後に示すように、このような粗視化を行うことにより計算量を大幅に軽減することができる。たとえば、５１２×５１２ピクセルの画像の場合、式（４）を用いると、２６万個以上のデータについて和を取る必要があるが、本発明の粗視化分布を用いた場合、部分空間に関する和を１０００個程度にまで軽減することができ、高速な推定を行うことができる。
【００８４】
さらに、上記（２）に記載の抽出方法では、各部分空間における粗視化された確率値を、その部分空間に含まれるデータの平均値における確率値で近似する。
【００８５】
【数１５】

ここで、
【００８６】
【数１６】

は、ｊ部分空間Ａ_ｊに含まれるデータの平均値である。この近似によって、部分空間内における積分（あるいは総和）操作を省略することができ、さらに計算量を軽減することができる。
【００８７】
さらに、粗視化確率分布を用いて推定したパラメータを初期値とし、元の解像度で再度推定を行うこともできる。この場合、粗視化確率分布を用いてすでにほぼ最適なパラメータが得られているため、最初から元の解像度で推定を行う場合に比較して、パラメータの逐次更新の回数がはるかに少なくてすむため、高精度な推定を高速に行うことができる。
【００８８】
さらに、領域を抽出する際、推定された混合比率ｗ_ｉに全ピクセル数を掛け、ｉ番目の領域に属するピクセル数を推定する処理を行うこともできる。そして領域帰属確率の高い順に上位ｎ_ｉ個をこの領域に属するピクセルとして抽出する。この方法により、どの値までの確率値をその領域に属しているものと見なすか、という閾値を自動的に決定することができる。本発明において、染色体テリトリの形状状態を定量化し、その定量結果に基づいて細胞の状態を評価するためには、画像から染色体テリトリを精度良く抽出する必要がある。このように閾値を自動的に決定することにより、染色体テリトリを精度良く抽出することができる。
【００８９】
さらに、評価関数としては、それぞれＡＩＣ、ＭＤＬ、ストラクチュラル・リスクを用い、その値がもっとも小さい結果を与えるモデルを選択することもできる。評価関数としてＡＩＣ、ＭＤＬ、またはストラクチュラル・リスクを用いた場合、過剰なパラメータ数を用いると評価関数の値が増加してしまうため、最適なパラメータ数を推定することが可能となる。これにより、画像が何種類の領域から形成されているかの適切な領域数を推定することができる。
【００９０】
以上のように、画像から染色体テリトリを抽出する際に、粗視化処理を行うと、粗視化処理を行わない場合に比べて、条件付き確率分布やクラス帰属確率の計算量を大幅に削減することができるため、染色体テリトリの抽出に要する時間を大幅に短縮することができる。このような処理の結果推定されるクラスパラメータは、粗視化処理を行わない場合に比べて精度が劣ることになるが、本発明の抽出方法では、クラスパラメータから算出されるクラス帰属確率に基づいて領域抽出を行うため、粗視化による誤差の影響をうけることなく精度良く領域抽出を行うことが可能である。
【００９１】
以上、本発明の構成について説明したが、これらの構成を任意に組み合わせたものも本発明の態様として有効である。また、本発明の表現を他のカテゴリーに変換したものもまた本発明の態様として有効である。
【００９２】
本発明の評価方法によれば、細胞周期の間期における染色体テリトリの配置状態を定量化することができる。これにより、細胞の状態を統計的に評価することもできる。
【図面の簡単な説明】
【００９３】
上述した目的、およびその他の目的、特徴および利点は、以下に述べる好適な実施の形態、およびそれに付随する以下の図面によってさらに明らかになる。
【００９４】
【図１】本発明の実施の形態における細胞の状態の評価方法の処理手順を示すフローチャートである。
【図２】図１に示した処理手順を実行する本実施の形態における評価装置を示すブロック図である。
【図３】図２に示した抽出処理部を示すブロック図である。
【図４】抽出処理部の処理手順を示すフローチャートである。
【図５】粗視化したときの粗視化データ空間および部分空間を示す図である。
【図６】粗視化経験分布に基づいて、パラメータの初期値を決定する処理手順を示したフローチャートである。
【図７】図６を参照して説明した手順を具体的に説明する図である。
【図８】抽出処理部の他の例を示すブロック図である。
【図９】図８に示した抽出処理部の処理手順を示すフローチャートである。
【図１０】染色体テリトリの配置状態を定量化する処理手順を示すフローチャートである。
【図１１】染色体テリトリの座標を変換する様子を示す模式図である。
【図１２】標準球内に座標変換された複数の染色体テリトリおよび染色体テリトリを示す図である。
【図１３】評価装置の他の例を示すブロック図である。
【図１４】本実施の形態における抽出処理部により抽出された染色体テリトリを示す図である。
【図１５】細胞分化前と細胞分化後の細胞群において、最近接位置にある第１２番染色体と第１６番染色体のテリトリの重心間距離を、標準化した核の半径に対する相対値で比較した図である。
【図１６】核形状の標準化を施す前の、細胞分化前と細胞分化後における第１２番染色体の動径分布を示す図である。
【図１７】核形状の標準化を施した後の、細胞分化前の細胞分化後における第１２番染色体の動径分布を示す図である。
【発明を実施するための最良の形態】
【００９５】
図１は、本発明の実施の形態における、細胞の状態の評価方法の処理手順を示すフローチャートである。
まず、染色体テリトリを含む細胞を撮影した画像から、染色体テリトリの像を抽出する（Ｓ２０）。本実施の形態において、３次元画像から細胞の核および複数の染色体テリトリの像をそれぞれ抽出する。その後、染色体テリトリの配置状態を定量化する（Ｓ２２）。染色体テリトリの配置状態を定量化した結果は保存される。複数の検体について、ステップ２０およびステップ２２の処理を行い、複数の検体の定量化結果を蓄積する（Ｓ２４）。また、ある検体について、ステップ２０およびステップ２２の処理を行い、定量化した結果をステップ２４で蓄積された複数の検体の定量化結果と比較して、その検体における細胞状態を評価する（Ｓ２６）。
【００９６】
図２は、図１に示した処理手順を実行する本実施の形態における評価装置を示すブロック図である。
評価装置１００は、画像取得部１０２と、抽出処理部１０４と、定量化処理部１０６と、評価部１１０と、出力部１１２、と、定量化結果記憶部１１４とを含む。画像取得部１０２は、染色体テリトリを含む細胞を撮影した３次元画像を取得する。抽出処理部１０４は、３次元画像から染色体テリトリの像を抽出する。定量化処理部１０６は、染色体テリトリの配置状態を定量化する。定量化処理部１０６は、定量化した結果を定量化結果記憶部１１４に保存する。評価部１１０は、ある検体の定量化結果を定量化結果記憶部１１４に記憶された複数の検体の定量化結果と比較して、その検体の細胞状態を評価する。出力部１１２は、抽出処理部１０４による染色体領域の像の抽出結果や、評価部１１０による細胞状態の評価結果を出力する。出力部１１２は、たとえばディスプレイ装置やプリンタ等により構成することができる。
【００９７】
以下、図１に示した各手順を説明する。
（染色体テリトリの抽出（Ｓ２０））
染色体テリトリを含む細胞の３次元画像は、３Ｄ−ＦＩＳＨ（Ｆｌｕｏｒｅｓｃｅｎｔｉｎｓｉｔｕｈｙｂｒｉｄｉｚａｔｉｏｎ）法を用いて得ることができる。画像取得部１０２は、画像スキャナやデジタルカメラ等により構成することができ、３Ｄ−ＦＩＳＨ法を用いて得られた画像を読み取ることができる。また、画像取得部１０２は、生物顕微鏡に接続されたコンピュータにより構成することもでき、ネットワークを通して画像を直接入力することも可能である。
【００９８】
以下、３Ｄ−ＦＩＳＨ法の手順を説明する。
カバーグラス上で細胞を培養し、ＰＦＡ（Ｐａｒａｆｏｒｍａｌｄｅｈｙｄｅ）で細胞を固定する。つづいて、ＴｒｉｔｏｎＸ１００溶液で処理を行う。次いで、液体窒素を使用し、凍結融解を数回繰り返す。その後、塩酸処理およびペプシン処理を行う。これにより、細胞膜および核膜が部分的に破壊され、プローブの浸透性を高めることができる。また、以上の処理により、核以外の部分をある程度除去することができる。
【００９９】
つづいて、細胞を再度固定し、約７５℃でＤＮＡを変性させる。これにより、ＤＮＡの二本鎖が一本鎖となる。ここへ、標識したプローブ（目的の染色体テリトリ、および核と相補的なＤＮＡ断片）を加え、約３７℃で反応させると、プローブが目的の染色体テリトリおよび核に相補的に結合する。プローブには、目的の染色体テリトリの種類および核毎に異なる波長によって発色する色素が付けられている。これにより、特定の色素が発色する波長を照射することにより、その色素のみを特異的に発色させることができる。
【０１００】
以上のようにして準備した試料に共焦心レーザ顕微鏡を用いて特定の波長を照射し、目的の染色体テリトリを含む画像を得る。各染色体テリトリを含む画像、および核を含む画像を重ね合わせることにより、複数の染色体テリトリを含む画像を得ることができる。
以下、このようにして得られた画像に施す処理を説明する。以下、単に「染色体テリトリ」、「核」というときは、染色体テリトリや核そのものではなく、画像上における染色体テリトリ像および核の像を示す。
【０１０１】
図２に示した抽出処理部１０４は、以上のようにして得られた画像から、染色体テリトリを抽出する画像処理を行う。本実施の形態において、抽出処理部１０４は、複数のピクセルを含む画像を複数のクラスに分類し、複数のクラスをそれぞれ染色体テリトリおよび核に対応付けることにより、画像から染色体テリトリおよび核の像を抽出する。この際、抽出処理部１０４は、各ピクセルに輝度が異なる複数の輝度源の存在を仮定し、各輝度源がそのピクセルに属する確率、および画像における輝度源の混合比率に基づいてクラス分類を行う。
【０１０２】
このような手法は、たとえば特開２００１−９２９８０号公報（以下特許文献１という。）に記載されている。特許文献１においては、画像データから、画像上の各ピクセルが領域の各々に属する領域帰属確率の期待値を算出し、領域帰属確率と領域パラメータから求められる混合確率分布に基づいて評価関数を算出し、そのときの領域帰属確率に基づいて各領域を分離し、分離された領域に基づいて輪郭を抽出する手法が記載されている。本実施の形態においては、この手法にさらに粗視化の概念を導入し、最適なパラメータを高速に求める。
【０１０３】
図３は、図２に示した抽出処理部１０４を示すブロック図である。図４は、抽出処理部１０４の処理手順を示すフローチャートである。
【０１０４】
本発明の実施の形態における抽出処理部１０４は、画像データを読み込む入力装置１とデータ空間粗視化装置２と、パラメータ更新装置６と、粗視化経験確率分布算出装置３と、粗視化条件付き確率分布算出装置４と、クラス帰属確率算出装置５と、評価関数算出装置７と、領域抽出装置８と、出力装置９とを含む。
【０１０５】
入力装置１は、上述したような３Ｄ−ＦＩＳＨ法により得られた細胞のカラー画像を画像取得部１０２から入力する（ステップＡ１）。入力装置１は、読み込んだデータをデータ空間粗視化装置２に送る。
【０１０６】
データ空間粗視化装置２は、データ空間を互いに交わらないＮ個の部分空間に分解し、粗視化データ空間を構成する（ステップＡ２）。ここで、データ空間とは、画像の各ピクセルが取り得る属性値全体の集合を意味する。たとえば標準的グレースケールの画像において、各ピクセルの属性は輝度によって表すことができ、輝度は通常０から２５５の整数値で表現される１次元空間である。また、標準的なカラー画像の場合ならば、Ｒ、Ｇ、Ｂ各色要素に対し、通常０から２５５の整数値で表現される３次元空間となる。
【０１０７】
データ空間粗視化装置２は、たとえば解像度を８とすると、ＲＧＢの各値を８ずつに区切り、８×８×８の立方体を１つの部分空間とすることができる。解像度は３次元の軸で同一でなくともよい。たとえばＲ軸をｈ_１ずつ、Ｇ軸をｈ_２ずつ、Ｂ軸をｈ_３ずつに区切って粗視化してもよく、各部分空間が重なりを持たず、かつ全データ空間をもれなく覆うことができればよい。以下において、解像度ｈで粗視化する、と表現する場合は、ｈ×ｈ×ｈでＲＧＢの各値を区切ることを意味する。
【０１０８】
また、データ空間粗視化装置２は、各部分空間に値を取るピクセルの集合（ピクセルの番号）と、それらのピクセルの属性値の平均と、ピクセルの個数を保持する。
【０１０９】
図５は、解像度ｈ_１×ｈ_２×ｈ_３で粗視化したときの粗視化データ空間１１、および部分空間１２を示す。
たとえばｊ番目のピクセルの属性値ｘ_ｊが、Ｒ＝１２８、Ｇ＝２５５、Ｂ＝１８である場合、解像度８で粗視化すると、このピクセルは、（１６、３１、２）なる指標で指定される部分空間に値を取る。このことを以下では、ｘ_ｊがこの部分空間に含まれる、と表現する。
【０１１０】
図３に戻り、データ空間粗視化装置２は、粗視化データ空間を構成した後、各部分空間に含まれるピクセルの番号と、ピクセルの個数を粗視化経験確率分布算出装置３に送る。
【０１１１】
粗視化経験確率分布算出装置３は、粗視化経験確率分布を算出する（ステップＡ３）。ここで粗視化経験確率分布とは、粗視化データ空間の各部分空間に含まれる観測データを、全ピクセル数で割った値から算出された確率分布を表す。粗視化経験確率分布算出装置３は、粗視化経験確率分布を粗視化条件付き確率分布算出装置４に送る。
【０１１２】
粗視化条件付き確率分布算出装置４は、クラスパラメータを初期化する（ステップＡ４）。パラメータの初期値の決定手順は後述する。また、粗視化条件付き確率分布算出装置４は、粗視化条件付き確率分布を算出する（ステップＡ５）。粗視化条件付き確率分布は、具体的には、以下のように算出する。ここでは、ｊ番目のピクセル値がｉ番目のクラスから発生しているとした条件のもとでの条件付き確率が、以下のような多次元正規分布
【０１１３】
【数１７】

で与えられているとする。ここで、ｘは、ＲＧＢ各色の値からなる３次元ベクトル、μ_ｉはｉ番目のクラスの平均色を表す３次元ベクトル、Σ_ｉはｉ番目のクラスの共分散行列であり、｜Σ_ｉ｜，Σ_ｉ^−１はそれぞれ行列Σ_ｉの行列式、逆行列を表す。また、（ｘ−μ_ｉ）^Ｔは転置を表す。
画像がグレースケールの場合、ｊ番目のピクセル値がｉ番目のクラスから発生しているとした条件のもとでの条件付き確率は、以下のような一次元正規分布
【数１８】

で与えられる。ここにおけるｘは輝度の値を示すスカラー値、μ_ｉはｉ番目のクラスの平均輝度を表すスカラー値、σ_ｉはｉ番目のクラスの輝度の標準偏差である。
【０１１４】
粗視化条件付き確率分布算出装置４は、この条件付き確率を式（６）で与えられる式で計算する。このとき、各部分空間の測度ｍ（Ａ_ｊ）は、各部分空間の体積となる。たとえば、解像度８で一様に粗視化した場合、８×８×８＝５１２となる。
【０１１５】
粗視化条件付き確率分布算出装置４は、粗視化条件付き確率分布を式（１３）によって近似することもできる。この方法により、パラメータを更新するたびに式（６）で与えられる演算をする必要がなくなり、計算量を大幅に削減することができる。
【０１１６】
粗視化条件付き確率分布算出装置４は、粗視化経験確率分布に基づいてパラメータの初期値を決定することも可能である。各部分空間を大雑把にクラス分類し、分類の結果得られた各クラス内で平均値や分散値を求め、これらの値をパラメータ推定の初期値とする。
【０１１７】
図６は、粗視化経験分布に基づいて、パラメータの初期値を決定する処理手順を示したフローチャートである。以下、図６を参照して、パラメータの初期値を設定する手順を説明する。
【０１１８】
まず、ステップＢ１において、近傍半径と、分類すべきクラスの個数とを設定する。近傍半径とは、その範囲内にあるすべての部分空間を同じクラスに属するとみなし、大雑把にクラス分類をするための基準値のことである。たとえばカラー画像の場合、同じような色のピクセルどうしはＲＧＢ値も近く、したがって同じクラスに分類するのが自然であると考えられるからである。
【０１１９】
近傍半径が大きすぎる場合、所望のクラス数に到達する前に分類が完了してしまう場合がある。その場合、後述するように、近傍半径を縮小して再度クラス分類を行う。そのため、最終的には必要な数のクラスに分類することができる。したがってこの近傍半径の初期値は十分大きな値、たとえば５０等に設定する。分類すべきクラスの個数は、所与の値をそのまま用いる。
【０１２０】
次に、ステップＢ２において、各部分空間ごとに、各部分空間の代表値を設定する。各部分空間の代表値としては、たとえば部分空間の中央値等を用いることができる。以下では、これら代表値間の距離を部分空間の距離とする。
【０１２１】
次に分類対象となる部分空間の集合を設定する（ステップＢ３）。以下ではこの集合をΩと書く。Ωの初期値は、データを含む全部分空間全体から成る集合とする。また分類済みクラスの数ｉを１とし、分類済みクラスＣ_ｉの初期値を空集合とする。
【０１２２】
次に、Ωに属する部分空間の中から、粗視化経験確率の最も高い部分空間を選択する（ステップＢ４）。この部分空間をＡ_Ｓと書く。次に、Ωに属する部分空間とＡ_Ｓとの距離を調べ、近傍半径ｒ以内にある部分空間をすべて選択し、これを近傍集合とする（ステップＢ５）。以下では、近傍集合をＢ_Ｓと書く。
【０１２３】
次に、すでに分類が完了しているクラスＣ_ｉに含まれる部分空間と、近傍集合Ｂ_Ｓに含まれる部分空間との最短距離を求め、近傍半径ｒよりも大きいか否かを調べる（ステップＢ６）。もしこの最短距離がｒよりも大きいならば、近傍集合Ｂ_Ｓは、すでに分類が完了したクラスと十分異なる属性を持ち、かつ高い確率で出現しているから、新しいクラスと見なしてよい。したがって、近傍集合をそのまま新規クラスとして採用する。Ｂ_Ｓは分類が完了したので、分類対象集合Ωから削除する。図６においてはこの削除を、記号を用いて「Ω←Ω＼Ｂｓ」と示す。Ωを更新した後、ステップＢ４に戻る（ステップＢ７）。
【０１２４】
すでに分類が完了しているクラスＣ_ｉに含まれる部分空間と、近傍集合Ｂ_Ｓに含まれる部分空間との最短距離が、近傍半径ｒよりも小さければ、近傍集合Ｂ_ＳはＣ_ｉと属性が近いと考えられるため、Ｂ_ＳをＣ_ｉに統合する。Ｂ_Ｓは分類が完了したので、分類対象集合Ωから削除する（ステップＢ８）。
【０１２５】
次に、Ωが空集合であるか否かを調べ（ステップＢ９）、空集合でなければ、ステップＢ４へ進み、Ωが空集合であれば、分類が完了したクラスの数がｋ個以上あるか否かを調べ（ステップＢ１０）、ｋ個以下なら近傍半径に１より小さい定数をかけて近傍半径を縮小する。この定数としては、たとえば０．９等の値を用いることができる。その後、ステップＢ３以下を繰り返す。
【０１２６】
ステップＢ９において、Ωが空集合であり、かつ分類済みのクラスの数が所与の数よりも多ければ、所望の数のクラス分類が完了しているので、各クラス内でクラスパラメータを算出し、これをクラスパラメータの初期値とし、また各クラス内に含まれる部分空間の数の比率をクラスの混合比率の初期値とする（ステップＢ１２）。
【０１２７】
図７は、図６を参照して説明した手順を具体的に説明する図である。ここではデータ空間が一次元であるとし、全部で１０個の部分空間が設定されていると仮定する（図７（ａ））。図７（ａ）において、横軸は部分空間の番号を表し、縦軸は粗視化経験確率分布を表す。以下では処理の流れを直観的に説明することに主眼を置くため、粗視化経験確率値や部分空間の代表値、近傍半径については具体的な数値は用いない。
【０１２８】
ステップＢ１において、たとえばクラス数を２とし、近傍半径をｒとする。ステップＢ２において、各部分空間の代表値を設定する。ステップＢ３において、分類対象集合Ωの初期値は、データを含んだ全部分空間とするので、
Ω＝｛Ａ_３，Ａ_４，Ａ_５，Ａ_６，Ａ_７，Ａ_８｝
となる。Ａ_１、Ａ_２、Ａ_９、およびＡ_１０は、粗視化確率が０、すなわちこれらの部分空間に含まれるデータは観測されていないので、分類対象集合には含めない。
【０１２９】
ステップＢ４で、分類対象集合に含まれる部分空間の中で、最も高い粗視化経験確率を持つＡ７を選び、これをＡｓとする（図７（ａ））。ステップＢ５で、Ａ_７から近傍半径ｒ内にある部分空間を選択し、これをＢｓとする。図７（ａ）に示された近傍半径内にある部分空間は、Ａ_５、Ａ_６、Ａ_７、およびＡ_８であるから、
Ｂｓ＝｛Ａ_５，Ａ_６，Ａ_７，Ａ_８｝
となる（図７（ｂ））。
【０１３０】
ステップＢ６において、分類されているクラスはまだないので、このＢ_Ｓをそのまま最初のクラスＣ_１として採用し、分類対象集合からＢ_１を取り除き、ステップＢ４に戻る。図７（ｂ）において、粗視化経験確率の高さを示す棒グラフが白抜きで表されているのは、部分空間が分類対象集合から除かれたことを表す。
【０１３１】
ステップＢ４において、残りの分類対象集合の中で最も高い粗視化経験確率を持つものは、Ａ_４であるから、これを新たにＡ_Ｓとする（図７（ｃ））。ステップＢ５で、Ａ_４から近傍半径ｒ内にある部分空間を選択して、これをＢ_Ｓとする。ここでは、
Ｂ_Ｓ＝｛Ａ_３，Ａ_４｝となる。
【０１３２】
ステップＢ６で、分類済みのクラス、すなわち
Ｃ_１＝｛Ａ_５，Ａ_６，Ａ_７，Ａ_８｝
を調べると、Ａ４から近傍半径ｒ内にあるＡ_５およびＡ_６を含んでいる。したがって現在のＢ_Ｓを分類済みのクラスＣ_１に統合する（図７（ｄ））。
【０１３３】
これで分類対象集合は空となり、すべての部分空間の分類が完了したことになるが、分類されたクラス数は１であり、所望のクラス数２に達していない（ステップＢ１０）。したがって近傍半径を縮小し（ステップＢ１１）、ステップＢ３以下を繰り返す。
【０１３４】
以下、縮小された半径をｒ’とし（図７（ｅ））、上述の説明と同様の手続きを繰り返す。ただし、今回は近傍半径が縮小されているため、以下のような違いが生じる。すなわち、Ａ_７の近傍半径ｒ’内にある部分空間は、今回の場合
Ｂ_Ｓ＝｛Ａ_６，Ａ_７，Ａ_８｝
となる（図７（ｆ））。
このＢ_Ｓをそのまま最初のクラスＣ_１として採用し、残りの分類対象集合の中から最も高い粗視化経験確率を持つＡ_４を選ぶ（図７（ｇ））。Ａ_４から近傍半径ｒ’内にある部分空間は、
Ｂ_Ｓ＝｛Ａ_３，Ａ_４，Ａ_５｝
となる。今回は、分類済みのクラスＣ_１の中に、Ａ_４から近傍半径ｒ’内にある部分空間は存在しないので、現在のＢ_Ｓを新規クラスＣ_２として採用する（図７（ｈ））。これですべての部分空間が所望の二つのクラスに分類されたことになる。
【０１３５】
大雑把なクラス分類が完了すれば、分類されたクラス内で平均や分散を求め、以降で行う推定の初期パラメータとすることができる。このような方法でパラメータの初期値を設定することにより、この後の計算量を削減して領域抽出を高速に行うことができる。また、初期パラメータを適切に設定することは、粗視化対数尤度の最大化の過程で局所最適解に陥ることを防止する上で有効である。
【０１３６】
図３に戻り、粗視化条件付き確率分布算出装置４は、このようにして求めたパラメータを初期値として粗視化条件付き確率分布を求めることができる。粗視化条件付き確率分布算出装置４は、求めた粗視化条件付き確率分布をクラス帰属確率算出装置５に送る。
【０１３７】
クラス帰属確率算出装置５は、式（１１）を用いてクラス帰属確率を算出する（ステップＡ６）。このクラス帰属確率は、ｊ番目の部分空間に含まれるピクセルが、ｉ番目のクラスに属する確率を表す。したがって、画像各ピクセルに対してこのクラス帰属確率を算出し、確率の高いクラスに各ピクセルを分類することによって、領域抽出が容易に行うことが可能となる。クラス帰属確率算出装置５は、算出したクラス帰属確率をパラメータ更新装置６に送る。
【０１３８】
パラメータ更新装置６は、式（９）を最大化するようにパラメータを更新する。具体的には、以下のようにパラメータを更新する。
【０１３９】
【数１９】

ここで、
【０１４０】
【数２０】

は、ベクトルｕ，ｖのｉ成分とｊ成分の積ｕ_ｉｖ_ｊをｉｊ成分に持つマトリクスを表す。また、
【０１４１】
【数２１】

は、式（１４）で定義される、ｊ番目の部分空間Ａ_ｊに含まれるデータの平均値である。
【０１４２】
画像がグレースケールの場合、ｗｉ、μｉの更新は、ｘとして輝度値を用いて同様に行うことができ、標準偏差σの更新は、
【数２２】

となる。
すでに述べたように、このようにパラメータを更新すれば、式（９）で与えられる粗視化された完全対数尤度は増加し、したがって式（１２）で与えられる粗視化平均対数尤度も増加する（非特許文献３）。パラメータ更新装置６は、パラメータを更新した後、更新したパラメータを評価関数算出装置７に送る。評価関数算出装置７は、式（１２）を用いて粗視化対数尤度を算出する（ステップＡ８）。
【０１４３】
また、評価関数としては、式（１２）で示した粗視化対数尤度の他に、以下に説明する赤池の情報量基準（ＡＩＣ：ＡｋａｉｋｅＩｎｆｏｒｍａｔｉｏｎＣｒｉｔｅｒｉｏｎ）、ＭＤＬ、またはストラクチュラル・リスクを用いることもできる。
まず、ＡＩＣを説明する。
【０１４４】
【数２３】

ここで、ＡＩＣが小さいほど良い推定結果であるとする評価関数を用いることも可能である。ここでｍは、全パラメータの個数を表す。ＡＩＣは粗視化対数尤度にマイナスを掛けた量に比例するため、パラメータ変更装置６で行う更新によってＡＩＣは減少する方向に変化する。また、パラメータに比例する項が付加されているため、同じ粗視化対数尤度ならばパラメータの少ないモデルを用いた推定結果の方が良いとする。この評価関数を用いることにより、データへの過剰な適合が抑制され、雑音に強い推定を行うことが可能となる。
【０１４５】
また、以下のＭＤＬ、
【０１４６】
【数２４】

を用いても同様な効果が得られる。
【０１４７】
さらに、ストラクチュラル・リスク（ＳｔｒｕｃｔｕｒａｌＲｉｓｋ）
【０１４８】
【数２５】

を用いても同様な効果が得られる。ここでηは式（２１）が確率ηで成り立つことを表し、通常０．０１等の値を用いる。ｃ，ａ_１，ａ_２は、確率分布の性質によって決まる定数であるが、通常ｃ＝１，ａ_１＝１，ａ_２＝１等の値が用いられる。ｈはＶＣ次元と呼ばれるものであり、パラメータの数に比例する量である。
【０１４９】
評価関数算出装置７は、評価関数の変化が所与の終了条件を満たしているか否かを調べ、終了条件が満たされていれば領域抽出装置８に現在のパラメータを送り、終了条件が満たされていなければ粗視化条件付き確率分布算出装置４に現在のパラメータを送る（ステップＡ９）。終了条件としては、たとえば現時点での評価関数値と前回算出した評価関数値の差を現時点での評価関数値で割り、その値の絶対値が０．０００１以下であるか否か、等の条件を用いることができる。
【０１５０】
領域抽出装置８は、評価関数算出装置７からパラメータを受け取り、パラメータの情報を用いて領域を抽出する（ステップＡ１０）。たとえば、ｉ番目のクラスに属する領域を抽出するには、クラス帰属確率の値をｊ＝１からｊ＝Ｎまで調べ、その確率がある値（閾値）以上の部分空間をｉ番目のクラスに属する部分空間とする。次に、その部分空間に含まれるピクセルを調べ、これらのピクセルをｉ番目の領域であるとして抽出する。クラス帰属確率の閾値としては、たとえば０．５を用いれば、所望の結果を得ることができる。
【０１５１】
領域抽出装置８は、自動的に閾値を設定することも可能である。そのためには以下の処理を行う。ｉ番目の領域を抽出するためには、まず推定されたクラスの混合比率ｗ_ｉに全ピクセル数を掛け、各クラスに属するピクセル数の推定値を求める。この数をｎ_ｉとする。
【０１５２】
次に、クラス帰属確率をｊ＝１からｊ＝Ｎまで調べ、値の高い部分空間から順に、その部分空間に含まれるピクセルを抽出し、抽出したピクセルがｎ_ｉに到達するまで続ける。ｎ_ｉ番目に抽出したピクセルの番号を１とすると、式（１１）の粗視化されたクラス帰属確率の値が、ｉ番目の領域に属する確率の閾値となる。このように自動的に設定された閾値を用いることにより、画像から染色体テリトリを精度良く抽出することができる。また、次のようにしても同様な効果を得ることができる。まず、全ピクセルに対して、式（１１）で表される帰属確率を計算する。これによって、ｋ個のクラスそれぞれへの帰属確率がピクセルごとに得られる。次に、ｉ番目のクラスへの帰属確率がもっとも高いピクセルのみを抽出する。こうして抽出されたピクセルの数は、上に述べたｎ_ｉにほぼ一致するはずである。これらのピクセルの中で最大の輝度と最小の輝度を持つピクセルを調べれば、ｉ番目のクラスに属する輝度の上限値と下限値が自動的に得られる。染色体テリトリの領域は、画像上で輝度の高い領域として表示されているはずであるから、最大の平均輝度を持つクラスを対象として上に述べた手続きを行えば、染色体テリトリ領域を自動的に抽出することが可能となる。領域抽出装置８は、領域抽出が完了した後、抽出した領域のデータを出力装置９へ送る。
【０１５３】
以上で説明した、データ空間粗視化装置２、粗視化経験分布算出装置３、粗視化条件付き確率分布４、クラス帰属確率算出装置５、パラメータ更新装置６、評価関数算出装置７、領域抽出装置８は、たとえば、パーソナルコンピュータやワークステーション、あるいはスーパーコンピュータ等の計算機を用いて構築することができる。出力装置９は、領域抽出装置８から領域データを受け取り、図２の定量化処理部１０６に出力する（ステップＡ１１）。また、出力装置９からの出力は、出力部１１２によって表示することもできる。
【０１５４】
図８は、抽出処理部１０４の他の例を示すブロック図である。図９は、図８に示した抽出処理部１０４の処理手順を示すフローチャートである。以下、図３および図４を参照して説明したのと同様の構成要素には同様の符号を付し、適宜説明を省略する。
【０１５５】
ここで、領域復元装置１０は、粗視化確率分布を用いたパラメータ推定が完了した後、粗視化の解像度が元の解像度に等しいかを調べ（ステップＡ１２）、粗視化されていれば、データを元の解像度に戻す（ステップＡ１３）。粗視化されていなければ、元の解像度での推定が完了していることを意味するため、元の解像度で推定されたパラメータを領域抽出装置８に送る。データを元の解像度に戻すには、粗視化の解像度をデータ属性値の最小単位に設定し（たとえば１）、第１の実施の形態に述べた方法と全く同一の方法を繰り返せばよい。この場合、図３および図４を参照して説明した方法よりも推定に時間を要するようになるが、より高い精度でパラメータを推定することができ、結果としてより精度の高い領域抽出が可能となる。また、粗視化確率分布を用いて推定したパラメータは、すでに最適なパラメータの近傍に推定されているため、最初から高い解像度で推定を行うよりも少ない回数のパラメータ更新で最適パラメータが推定でき、はるかに高速に領域抽出を行うことができる。
【０１５６】
（配置状態定量化（Ｓ２２））
図２に戻り、定量化処理部１０６は、染色体テリトリの配置状態の定量化に先立ち、抽出処理部１０４により抽出された染色体テリトリの座標を一定の基準に従って変換して標準化する処理を行う。このような処理を行うことにより、複数の検体について、統一した基準で、染色体テリトリの配置状態を定量化することができる。これにより、複数の検体における染色体テリトリの配置状態の定量化結果を統計処理等することができる。
【０１５７】
図１０は、染色体テリトリの配置状態を定量化する処理手順を示すフローチャートである。図１１は、染色体テリトリの座標を変換する様子を示す模式図である。以下、図１０および図１１を参照して座標変換の処理手順を説明する。
【０１５８】
定量化処理部１０６は、図１１（ａ）に示すような細胞の核１２０を標準化する（図１０、Ｓ１００）。ここでは、まず、細胞の核１２０の重心Ｐ_０および体積Ｖを算出する。つづいて、図１１（ｂ）に示すように、重心Ｐ_０を中心とし、体積Ｖとなる標準球１２４を算出する。ここで、細胞の核１２０には染色体テリトリ１２２が含まれる。ここでは図示していないが、細胞の核１２０は、複数の染色体テリトリを含むことができる。
【０１５９】
つづいて、細胞の核１２０および標準球１２４の形状およびサイズに応じて、染色体テリトリ１２２の座標を変換する（図１０、Ｓ１０２）。具体的には、図１１（ｃ）に示すように、標準球１２４の中心（重心Ｐ_０と同じ）および染色体テリトリ１２２内の各点ｐを通る直線ｌを想定し、直線ｌ上において、中心Ｐ_０と細胞の核１２０の表面までの距離Ｒを算出する。同時に、直線ｌ上において、中心Ｐ_０と標準球１２４の表面までの距離ｒ_０を算出する。ここで、図１１（ｄ）に示すように、染色体テリトリ１２２内の点ｐを標準球１２０内の点に変換すると、標準球１２０内における座標ｐ’は、
ｐ’＝ｒ_０／Ｒ×（ｐ−Ｐ_０）＋Ｐ_０
となる。染色体テリトリ１２２内のすべての点に対して同様に変換することにより、標準球１２４内に座標変換された染色体テリトリ１２６を得ることができる。
【０１６０】
本実施の形態において、定量化処理部１０６は、以上のような染色体テリトリの座標変換を行った後、染色体テリトリの配置状態を定量化する（図１０、Ｓ１０４）。
【０１６１】
図１２は、標準球１２４内に座標変換された複数の染色体テリトリ１２６ａおよび染色体テリトリ１２６ｂを示す図である。ここでは、配置状態の定量化結果として、複数の染色体テリトリ間の距離を用いる例を示す。定量化処理部１０６は、このように座標変換された染色体テリトリ１２６ａおよび染色体テリトリ１２６ｂ間の距離を算出する。
【０１６２】
以上のような染色体テリトリの座標変換処理を行うことにより、種々の形状の複数の検体における染色体テリトリの配置状態の定量化結果を統一された指標で処理することができる。また、細胞の核は、同じ細胞であっても、時期によって種々の形状をとり得る。本実施の形態において、このような座標変換処理を行うことにより、このような時期の違いによる細胞の核の形状の変化の影響を排除して、染色体テリトリの配置状態を適切に定量化することができる。
【０１６３】
さらに、配置状態の定量化結果として染色体テリトリ間の距離を用いる場合、定量化処理部１０６は、染色体テリトリ間の距離を標準球１２４の半径で除した値を定量化の結果とすることができる。これにより、それぞれ核の大きさが異なる複数の検体における染色体テリトリの配置状態の定量化結果を統一された指標で処理することができる。
【０１６４】
次に、染色体テリトリの配置状態を定量化する方法を説明する。
染色体テリトリの配置状態は、複数の染色体テリトリ間の距離、染色体テリトリの広がり、配置方向、および染色体テリトリと核内の基準点との距離等を用いて定量化することができる。
【０１６５】
複数の染色体テリトリ間の距離を用いて定量化を行う場合、複数の染色体テリトリ間の距離は、種々の方法で算出したものを用いることができる。
【０１６６】
たとえば、定量化処理部１０６は、各染色体テリトリの重心をそれぞれ算出し、重心間の距離を算出することができる。ここで、重心とは、染色体テリトリを構成する各ピクセルの比重が等しいと仮定した面積の重心のことである。
各染色体テリトリの重心位置としては、例えば輝度の値で重みをとった重心
Ｘ_Ｇ＝Σ_ｊＩ_ｊｘ_ｊ／Σ_ｊＩ_ｊ
を用いることもできる。ここで、Ｉ_ｊは位置ｘ_ｊにおけるピクセルの輝度値である。また、重心の代わりに最も輝度値が高いピクセルの位置を用いてもよい。以下では、単純な重心を例に説明するが、重み付き重心や最大輝度のピクセル位置を用いた場合でも同様な方法で染色体間の距離を定義することができる。
【０１６７】
また、定量化処理部１０６は、複数の染色体テリトリの境界間の距離を算出することもできる。ここで、染色体テリトリの境界間の距離とは、たとえば、複数の染色体テリトリの表面の最短距離である。
【０１６８】
また、定量化処理部１０６は、複数の染色体テリトリの形状をそれぞれ正規分布で近似し、これらの染色体テリトリそれぞれの正規分布の平均値を算出し、平均値間の距離を算出することもできる。また、複数の染色体テリトリの形状をそれぞれ正規分布で近似した後に上述したように各染色体テリトリの重心を算出して重心間の距離を算出したり、境界間の距離を算出することもできる。
【０１６９】
また、定量化処理部１０６は、複数の染色体テリトリそれぞれの骨格線を検出し、各骨格線の重心を算出し、重心間の距離を算出することもできる。
【０１７０】
また、定量化処理部１０６は、複数の染色体テリトリ間の距離を、マハラノビス（Ｍａｈａｌａｎｏｂｉｓ）の距離、バタチャリア（Ｂｈａｔｔａｃｈａｒｙｙａ）の距離、カルバック−ライブラー（Ｋｕｌｌｂａｃｋ−Ｌｅｉｂｌｅｒ）の距離、対称カルバック−ライブラーの距離、および絶対距離により算出することもできる。
【０１７１】
マハラノビスの距離は、以下の式に従って算出することができる。
【０１７２】
【数２６】

ここで、μ_ｉ（ｉ＝１，２）は平均ベクトル、Σは、
【０１７３】
【数２７】

で定義されるクラス内共分散行列、ｗ_１、ｗ_２は、クラスの混合比率を示す。
【０１７４】
バタチャリアの距離は、以下の式に従って算出することができる。
【０１７５】
【数２８】

【０１７６】
カルバック−ライブラーの距離は、以下の式に従って算出することができる。
【０１７７】
【数２９】

ここで、ｐ_ｉ（ｉ＝１，２）は、平均ベクトルμ_ｉ，共分散行列Σ_ｉの多次元正規分布を示す。
【０１７８】
対称カルバック−ライブラーの距離は、以下の式に従って算出することができる。
【０１７９】
【数３０】

【０１８０】
絶対距離は、以下の式に従って算出することができる。
【０１８１】
【数３１】

【０１８２】
染色体テリトリの広がりを用いて定量化を行う場合、たとえば、染色体テリトリの形状を正規分布を用いて近似する方法を用いることができる。これにより、染色体テリトリの広がりの方向と大きさを定量化することができる。具体的には、もとの画像に対し、輝度の値を染色体テリトリの存在する確率の大きさと見なして、混合正規分布で近似する。この処理は、上述した抽出処理部１０４による染色体テリトリの抽出方法と同様の手順で行うことができる。この際、画像上の各ピクセルの座標を２次元の確率ベクトルと見なし、その位置における輝度の値を確率値と見なす。なお、輝度を確率値として扱うために、画像中の全ピクセルの輝度値の総和を求め、その値で各ピクセルの輝度値を除し、正規化しておく。このようにして、染色体テリトリの形状を定量化する。
【０１８３】
染色体テリトリは、細胞の核内においてある程度広がりをもって存在しており、この広がりの形状は染色体どうし、あるいは核膜を通した外部との相互作用の生じ易さと関係があると考えられる。従って、染色体テリトリの配置状態を定量化する際に、染色体テリトリの広がりの形状を考慮することにより、細胞の状態を精度良く評価できることが期待される。
【０１８４】
染色体テリトリ間の配置方向を用いて定量化を行う場合、各染色体テリトリの主軸を検出し、それらの主軸がなす角度を定量化した結果とすることができる。染色体テリトリの主軸も、たとえば上述したような正規分布を用いて算出することができる。このように、染色体テリトリの形状を正規分布で近似することにより、各染色体テリトリの広がりの主軸を明瞭にすることができる。
【０１８５】
このとき、推定されるパラメータは、
Ｐ（ｗ_１，μ_１，Σ_１，ｗ_２，μ_２，Σ_２）＝ｗ_１×Φ（μ_１，Σ_１）＋ｗ_２×Φ（μ_２，Σ_２）
となる。ここでΦ（μ，Σ）は２次元正規分布であり、μは平均値、Σは共分散行列である。この結果得られたパラメータｗは広がりの大きさの比率、μは広がりの中心位置、Σは広がりの主軸を表す。さらに、共分散行列を固有値分解し、広がりの主軸を具体的に得る。以上のように、形状を定量化することにより、染色体テリトリどうしの配置状態を数値化することができる。
【０１８６】
二つの染色体テリトリの配置状態を考慮するとき、二つの染色体テリトリの広がりの主軸が平行である場合の方が、垂直である場合よりも、互いに相互作用する面積が大きく、影響を及ぼしやすいと考えられる。従って、染色体テリトリの配置状態を定量化する際には、染色体テリトリの広がりの形状や配置方向を考慮することにより、細胞の状態をより精度良く評価できることが期待される。
【０１８７】
染色体テリトリと核内の基準点との距離を用いて定量化を行う場合、核内の基準点は、核膜や重心とすることができる。また、この場合、核膜とは、上述した方法で算出した標準球の表面とすることができる。一般に、染色体が細胞の核内の外縁部に存在している方が中心部に存在しているときよりも遺伝的に活性な状態にあることが知られている。従って、染色体テリトリと細胞の核膜との距離や染色体テリトリと細胞の核膜との距離を定量化することにより、その細胞の遺伝的な活性を評価できることが期待される。
【０１８８】
定量化処理部１０６は、以上の方法を単独または複数用いて染色体テリトリの配置状態を定量化することができる。複数の方法で定量化した結果を用いることにより、細胞の状態をより詳細に評価することができる。
【０１８９】
（評価（Ｓ２６））
細胞の状態の評価は、種々の方法で行うことができるが、複数の検体について得られた定量化結果を統計処理しておき、統計処理を行った結果と比較することにより、ある検体の細胞の状態を評価することができる。
【０１９０】
統計処理は、種々の方法を用いることができるが、たとえば統計処理部１０８は、複数の検体の染色体テリトリの配置状態を定量化した結果の標準値を算出することができる。この場合、標準値としては、配置状態を定量化した結果の平均値を用いることができる。このようにして標準値を算出した場合、ある検体の染色体テリトリの配置状態を定量化した結果を標準値と比較することにより、その検体の細胞の状態を評価することができる。この場合、評価装置１００は、図１３に示すように、図２に示した構成に加えて、統計処理部１０８および統計結果記憶部１１６を含むことができる。統計処理部１０８は、たとえば上記の標準値を算出し、統計結果記憶部１１６に標準値を保存する。評価部１１０は、ある検体の定量化結果を標準値と比較することにより、その検体の細胞の状態を評価することができる。
【０１９１】
また、統計処理は、各検体の染色体テリトリの配置状態を定量化した結果と、その検体の提供者の実際の診断結果とを対応付けて記憶する処理とすることもできる。たとえば、癌等の疾患の罹患者から採取した細胞の染色体テリトリの配置状態の定量化データと、非罹患者から採取した細胞の染色体テリトリの配置状態の定量化データとを準備しておくことができる。評価部１１０は、ある被験者から採取した細胞の染色体テリトリの配置状態の定量化結果が、いずれの定量化データに近いかを判断することにより、その被験者が罹患しているか否かを評価することができる。
【０１９２】
本実施の形態において、染色体テリトリの配置状態を定量化した結果を用いて細胞の状態を評価し、その結果に基づいて疾患の有無を判断する。染色体テリトリの配置状態の変化は、細胞に形態的変化が生じるよりも早い段階で生じるため、疾患の早期発見が期待できる。
【０１９３】
また、統計処理部１０８は、複数の検体から得られた定量化結果に基づき、ニューラルネットワークを構築することができる。ここで、たとえば、複数の染色体テリトリ間の距離、染色体テリトリの広がり、配置方向、および染色体テリトリと核内の基準点との距離等、種々の方法で定量化した複数の結果を入力パラメータとすることができる。評価部１１０は、ニューラルネットワークの出力により細胞の状態を評価することができる。
【０１９４】
さらに、評価部１１０は、ｔ検定やカイ２乗検定を用いて一の検体の配置状態を定量化した結果と統計処理の結果との差異を定量化することができる。
【実施例】
【０１９５】
脂肪細胞（２５番細胞および１３番細胞）を用い、３次元のカラー画像（５５４×５７６）を得た。ここで、カラー画像は、それぞれ、１６番染色体、１２番染色体、および核と相補的に結合するプローブを用いて３Ｄ−ＦＩＳＨ法により得た。
【０１９６】
画像取得部１０２により、このようなカラー画像を入力した。抽出処理部１０４は、粗視化解像度を８とし、クラスの数を３として上述した粗視化領域抽出法を用いて画像から染色体テリトリおよび核を抽出した。クラスは、１２番染色体の染色体テリトリ、１６番染色体の染色体テリトリ、核それぞれに割り当てた。
【０１９７】
この結果、図１４に示すように、１２番染色体の染色体テリトリ（クラス１）、１６番染色体の染色体テリトリ（クラス２）、細胞核（クラス３）が抽出された。図１４は、抽出した画像を示す。
【０１９８】
つづいて、定量化処理部１０６により、１６番染色体の染色体テリトリおよび１２番染色体の染色体テリトリの重心間の距離を算出した。１６番染色体および１２番染色体には、相同染色体が含まれるが、それらのうち、１６番染色体および１２番染色体間の最短距離を採用した。染色体テリトリの距離が最も近い箇所で転座等の相互作用が生じると考えられるからである。
【０１９９】
まず、画像データから抽出された細胞核の標準球を算出し、１２番染色体の染色体テリトリおよび１６番染色体の染色体テリトリを規定化した。ここで、染色体テリトリは、ほぼ平坦な形状を有していたため、ｚ方向における変換は行わず、二次元の変換を行った。三次元の変換を行う場合も同様の処理手順とすることができる。
【０２００】
このようにして変換を行った後、２５番細胞および１３番細胞における、１２番染色体と１６番染色体の重心間の距離をそれぞれ算出した。その結果、２５番細胞における重心間の距離は３．３８μｍ、１３番細胞における重心間の距離は４．１２μｍであった。
【０２０１】
次に、染色体テリトリの重心間距離を、細胞群間で統計的に比較した例を図１５に示す。図１５の縦軸は、最近接位置にある第１２番染色体および第１６番染色体のテリトリの重心間距離を、標準化された核の半径で正規化した相対値である。ａは、細胞分化前（細胞が成熟する前）の細胞群における第１２−１６染色体テリトリ間の相対距離（０．４１）を示し、ｂは、細胞分化後（細胞が成熟した後）の細胞群における１２−１６染色体テリトリ間の相対距離（０．３３）を示す。これによって、最近接位置における染色体テリトリ同士が、細胞分化後に有意（ｐ＜０．０５）に近づくことが明らかになった。この結果は、大きさや形状の異なる細胞群に対して、実施の形態に記載された標準化方法を適用することにより、初めて得られたものである。
【０２０２】
次に、通常の測定ではとらえることが困難な染色体配置の変化を、実施の形態にかかる細胞核形状の標準化によって明らかにした例を示す。
【０２０３】
図１６は、第１２番染色体位置の核内における動径分布である。図１６（ａ）は、細胞分化前（細胞が成熟する前）の動径分布を示す図であり、また、図１６（ｂ）は細胞分化後（細胞が成熟した後）の動径分布を示す図である。横軸は、核の重心からの距離（μｍ）、縦軸は相対頻度を表す。通常の測定では核形状が異なるため、ここでは重心からの距離は実測値を用いて表している。この図からは、細胞分化の前後における染色体配置の変化は明らかではない。
【０２０４】
これに対し、本実施形態において説明した標準化処理を行った後の第１２番染色体の動径分布を図１７に示す。図１７（ａ）は、細胞分化前の動径分布を示し、図１７（ｂ）は、細胞分化後の動径分布を示す。また、横軸は核の重心からの相対位置距離（％）、縦軸は相対頻度を表す。本実施形態に記載した核形状の標準化によって、染色体の動径位置を全細胞について同じ基準で比較することが可能となり、細胞分化の前後において分布が有意に（ｐ＜０．０５）核の内部に向かってずれることがわかった。
【０２０５】
以上に示したように、本実施形態記載の方法によって、本来検出することができなかった細胞の状態変化をとらえることが可能になる。
【０２０６】
以上、本発明を実施の形態および実施例に基づいて説明した。この実施の形態および実施例はあくまで例示であり、種々の変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。

【特許請求の範囲】
【請求項１】
染色体テリトリを含む細胞を撮影した画像情報に基づいて、細胞の状態を評価する方法であって、
前記画像から、前記染色体テリトリを抽出するステップと、
前記染色体テリトリの配置状態を標準化した後、当該配置状態を定量化するステップと、
定量化された前記染色体テリトリの配置状態に基づき、前記細胞の状態を評価するステップと、
を含むことを特徴とする評価方法。
【請求項２】
請求の範囲第１項に記載の評価方法において、
前記染色体テリトリを抽出するステップにおいて、前記細胞の核を抽出するとともに当該核内に含まれる前記染色体テリトリを抽出し、
前記配置状態を定量化するステップは、前記核の形状を標準化するステップと、標準化前の前記核および標準化後の前記核の形状変化に基づいて、前記染色体テリトリの座標を変換するステップと、を含むことを特徴とする評価方法。
【請求項３】
請求の範囲第１項または第２項に記載の評価方法において、
複数の細胞の前記配置状態を定量化した結果を統計処理するステップをさらに含み、
前記細胞の状態を評価するステップにおいて、一の細胞の前記配置状態を定量化した結果と前記統計処理の結果とに基づき、前記一の細胞の状態を評価することを特徴とする評価方法。
【請求項４】
請求の範囲第３項に記載の評価方法において、
前記統計処理するステップは、複数の細胞の前記配置状態を定量化した結果に基づき、前記配置状態の定量化結果の標準値を算出するステップを含み、
前記細胞の状態を評価するステップにおいて、一の細胞の前記配置状態を定量化した結果と前記標準値とに基づき、前記一の細胞の状態を評価することを特徴とする評価方法。
【請求項５】
染色体テリトリを含む細胞を撮影した画像情報に基づいて、細胞の状態を評価する方法であって、
前記画像から、複数の染色体テリトリをそれぞれ抽出するステップと、
前記複数の染色体テリトリの配置状態を定量化するステップと、
複数の細胞の前記配置状態を定量化した結果を統計処理するステップと、
一の細胞の前記配置状態を定量化した結果と、前記統計処理の結果とに基づき、前記一の細胞の状態を評価するステップと、
を含むことを特徴とする評価方法。
【請求項６】
請求の範囲第５項に記載の評価方法において、
前記配置状態は、前記複数の染色体テリトリ間の距離、または前記複数の染色体テリトリの配置方向の少なくともいずれか１つを含むことを特徴とする評価方法。
【請求項７】
請求の範囲第５項または第６項に記載の評価方法において、
前記定量化するステップは、前記複数の染色体テリトリ間の距離を算出するステップを含むことを特徴とする評価方法。
【請求項８】
請求の範囲第７項に記載の評価方法において、
前記距離を算出するステップは、
前記複数の染色体テリトリそれぞれの重心を算出するステップと、
前記重心間の距離を算出するステップと、
を含むことを特徴とする評価方法。
【請求項９】
請求の範囲第５項乃至第８項いずれかに記載の評価方法において、
前記定量化するステップは、前記複数の染色体テリトリの配置方向を定量化するステップを含むことを特徴とする評価方法。
【請求項１０】
請求の範囲第９項に記載の評価方法において、
前記配置方向を定量化するステップは、
前記複数の染色体テリトリの主軸をそれぞれ検出するステップと、
前記主軸の角度を算出するステップと、
を含むことを特徴とする評価方法。
【請求項１１】
染色体テリトリを含む細胞を撮影した画像情報に基づいて、細胞の状態を評価する方法であって、
前記画像から、前記細胞の核および前記染色体テリトリをそれぞれ抽出するステップと、
前記核および前記染色体テリトリの配置状態を定量化するステップと、
複数の細胞の前記配置状態を定量化した結果を統計処理するステップと、
一の細胞の前記配置状態を定量化した結果と、前記統計処理の結果とに基づき、前記一の細胞の状態を評価するステップと、
を含むことを特徴とする評価方法。
【請求項１２】
請求の範囲第１１項に記載の評価方法において、
前記定量化するステップは、前記核内の基準点と前記染色体テリトリとの間の距離を算出するステップを含むことを特徴とする評価方法。
【請求項１３】
請求の範囲第５項乃至第１２項いずれかに記載の評価方法において、
前記染色体テリトリの配置状態を定量化するステップは、前記染色体テリトリの配置状態を標準化するステップをさらに含み、前記染色体テリトリの配置状態を標準化した後に、当該配置状態を定量化することを特徴とする評価方法。
【請求項１４】
請求の範囲第１３項に記載の評価方法において、
前記統計処理するステップは、複数の細胞の前記配置状態を定量化した結果に基づき、前記配置状態の定量化結果の標準値を算出するステップを含み、
前記細胞の状態を評価するステップにおいて、一の細胞の前記配置状態を定量化した結果と、前記標準値とに基づき、前記一の細胞の状態を評価することを特徴とする評価方法。
【請求項１５】
請求の範囲第１項乃至第１４項いずれかに記載の評価方法において、
前記配置状態は、前記細胞の核内における前記染色体テリトリの相対位置、前記染色体テリトリの主軸の方向、および前記染色体テリトリの広がりの少なくともいずれか１つを含むことを特徴とする評価方法。
【請求項１６】
請求の範囲第１項乃至第１５項いずれかに記載の評価方法において、
前記画像は、それぞれ属性値を有する複数のピクセルにより構成され、
前記染色体テリトリを抽出するステップは、
前記画像を複数のクラスに分類するステップと、
前記クラスのいずれかを前記染色体テリトリを表す領域として前記画像から抽出するステップと、を含み、
前記分類するステップは、
前記クラスそれぞれの属性値を示す属性パラメータおよび前記クラスそれぞれの混合比率の初期値を設定するステップと、
前記属性パラメータおよび前記混合比率に基づき、前記複数のピクセルのそれぞれが前記クラスそれぞれに分類されるクラス帰属確率を算出するステップと、
前記属性パラメータおよび前記混合比率により規定される混合確率分布、および前記帰属確率に基づき、推定の良さを示す評価関数を算出し、当該評価関数が所定の条件を満たすか否かを判定するステップと、
前記評価関数が前記所定の条件を満たさない場合、前記属性パラメータおよび前記混合比率を更新するステップと、
前記評価関数が前記所定の条件を満たすときの前記属性パラメータおよび前記混合比率に基づき、前記複数のピクセルを前記複数のクラスのいずれかに分類するステップと、
を含むことを特徴とする評価方法。
【請求項１７】
請求の範囲第１６項に記載の評価方法において、
前記クラス帰属確率を算出するステップは、
前記複数のピクセルをその属性値に応じて複数の部分空間に分解するステップと、
前記部分空間に含まれるピクセルの割合を示す粗視化経験確率分布を算出するステップと、
前記属性パラメータおよび前記混合比率に基づき、前記部分空間のそれぞれが前記クラスそれぞれに分類される粗視化クラス帰属確率を算出するステップと、を含み、
前記評価関数を算出するステップは、前記属性パラメータおよび前記混合比率により規定される混合確率分布を前記部分空間内で平均化して粗視化混合確率分布を算出するステップを含み、前記粗視化経験確率分布、前記粗視化混合確率分布、および前記粗視化クラス帰属確率に基づき、前記評価関数を算出することを特徴とする評価方法。
【請求項１８】
染色体テリトリを含む細胞を撮影した画像情報に基づいて、細胞の状態を評価するシステムであって、
前記画像から、前記染色体テリトリを抽出する抽出処理部と、
抽出した前記染色体テリトリの配置状態を定量化する定量化処理部と、
前記配置状態を定量化した結果を記憶する記憶部と、
複数の細胞の前記配置状態を定量化した結果を統計処理する統計処理部と、
一の細胞の前記配置状態を定量化した結果と、前記統計処理の結果とに基づき、前記一の細胞の状態を評価する評価部と、
を含むことを特徴とする評価システム。
【請求項１９】
請求の範囲第１８項に記載の評価システムにおいて、
前記定量化処理部は、前記画像から抽出した前記染色体テリトリの配置状態を標準化し、前記染色体テリトリの配置状態を標準化した後に、当該配置状態を定量化することを特徴とする評価システム。
【請求項２０】
請求の範囲第１９項に記載の評価システムにおいて、
前記抽出処理部は、前記細胞の核を抽出するとともに当該核内に含まれる前記染色体テリトリを抽出し、
前記定量化処理部は、前記核の形状を標準化し、標準化前の前記核および標準化後の前記核の形状変化に基づいて、前記染色体テリトリの座標を変換することを特徴とする評価システム。
【請求項２１】
コンピュータに、染色体テリトリを含む細胞を撮影した画像情報に基づいて、細胞の状態を評価させるためのプログラムであって、
コンピュータを、
前記画像から、前記染色体テリトリを抽出する手段、
前記染色体テリトリの配置状態を標準化した後、当該配置状態を定量化する手段、
定量化された前記染色体テリトリの配置状態に基づき、前記細胞の状態を評価する手段、
として機能させることを特徴とするプログラム。
【請求項２２】
コンピュータに、染色体テリトリを含む細胞を撮影した画像情報に基づいて、細胞の状態を評価させるためのプログラムであって、
コンピュータを、
前記画像から、前記染色体テリトリを抽出する抽出処理手段、
抽出した前記染色体テリトリの配置状態を定量化する定量化処理手段、
前記配置状態を定量化した結果を記憶する記憶手段、
複数の細胞の前記配置状態を定量化した結果を統計処理する統計処理手段、
一の細胞の前記配置状態を定量化した結果と、前記統計処理の結果とに基づき、前記一の細胞の状態を評価する評価手段、
として機能させることを特徴とするプログラム。

【図１】