細胞の品質を予測する予測モデルの構築法、予測モデルの構築用ブログラム、該プログラムを記録した記録媒体、予測モデルの構築用装置
【課題】細胞培養における品質を予測する情報処理モデルを提供することを課題とする。
【解決手段】(1)同種の細胞を培養した二つ以上のサンプルを用意するステップ;(2)培養時間の異なる二つ以上の時点(予測時)において各サンプルの細胞を撮影し、画像を取得するステップ;(3)ステップ(2)で取得した各画像を解析し、細胞の形態に関する二つ以上の指標について数値データを生成するステップ;(4)予測目標の実測データをサンプル毎に用意するステップ、及び(5)ステップ(3)で生成した数値データを入力値とし、ステップ(4)で用意した実測データを教師値としてファジィニューラルネットワーク解析し、予測に有効な指標の組合せを示すファジィルールに基づいて出力値を算出する予測モデルを構築するステップ、によって細胞の品質を予測する。
【解決手段】(1)同種の細胞を培養した二つ以上のサンプルを用意するステップ;(2)培養時間の異なる二つ以上の時点(予測時)において各サンプルの細胞を撮影し、画像を取得するステップ;(3)ステップ(2)で取得した各画像を解析し、細胞の形態に関する二つ以上の指標について数値データを生成するステップ;(4)予測目標の実測データをサンプル毎に用意するステップ、及び(5)ステップ(3)で生成した数値データを入力値とし、ステップ(4)で用意した実測データを教師値としてファジィニューラルネットワーク解析し、予測に有効な指標の組合せを示すファジィルールに基づいて出力値を算出する予測モデルを構築するステップ、によって細胞の品質を予測する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、細胞の品質(増殖率や残存分裂回数など)を予測するための予測モデル(情報処理モデル)を構築する方法、予測モデルの構築用プログラム、当該プログラムを記録した記録媒体、及び予測モデルの構築用装置等に関する。
【背景技術】
【0002】
細胞の培養とは、生体(ヒト・動物・植物)の細胞を生体外において増殖させる操作であり、細胞の機能性研究以外にも、細胞を用いた医療(細胞治療・再生医療)や、細胞を利用した検査(毒性検査・癌化検査)などで必要とされる手技を言う。従来、研究で細胞を扱う際には、単一の株化した均一な細胞を扱うことが多いが、近年では治療や再生医療の研究においては、ヒト由来の個体差の大きい細胞を扱うことが多くなってきている。現状では、細胞の品質評価の基準で明確なものは存在しない。
【0003】
細胞培養において、細胞の品質(生産性・活性・コンタミネーションなど)は単一の要因ではなく、複数の要因が複雑に影響するため、複数の基礎的な手技の組み合わせでのみ定量できるものであり、操作的に煩雑であった。たとえば細胞の生産性(回収量)の定量は、培養した細胞を酵素処理などに供した後に回収し、血球計算板や、電気伝導度などを指標としたセルカウンターを用いて測定するものであり、1回の定量に数十分を要する。また、細胞の活性の定量は、産生因子の測定や可視化を、染色や指示薬などを投じて行うものであり、1回の定量に数時間を要する。細胞のコンタミネーションの定量は、細胞マーカーと呼ばれる特異的タンパク質を染色する操作や、PCR法を利用したものが多く、1回の定量に数時間かかる手技によってのみ行われる。さらに、染色の結果は数値化が難しく、感覚的に評価する場合が多い。細胞の培養操作や判断基準に関しては、Culture of animal cells -a manual of basic technique- fifth edition, Freshney RI, Wiley-liss (A John Wiley & Sons, INC., Publication), ISBN 0-471-45329-3;細胞工学別冊 目で見る実験ノートシリーズ 「バイオ実験 イラストレイテッド6 すくすく育て細胞培養」渡邉利雄著、秀潤社、ISBN 4-87962-162-5などの細胞培養の教科書に詳述されるが、すべての操作において試薬を準備する必要があるだけでなく、経験を必要とした判断が必須である。現実的には、このような教科書的な手技や手法は、そのままでは機能しないことも多く、実際の研究者は自分の細胞や施設に合わせて手技手法の最適化をする必要があった。
【0004】
また、細胞の品質評価の多くは破壊的測定であるという問題がある。即ち、測定するための細胞を試薬と混合したり、物理的に破砕したりして行う必要がある。このため、少量しか無いような細胞の測定は非常に困難であり、測定した細胞そのものを治療に用いたいと考える細胞治療・再生医療などにおいては正確な品質評価は不能であった。
さらに、これまでの品質の判定は、人間の経験によるもののみであった。多項目の品質の測定結果が存在するとき、これを総合的にどう判断するかは非画一的であり、多くの場合は医師や専門の研究者によって経験的に判断されるものであった。このような判断は非常に曖昧であるため、細胞培養には技術者が常に必要とされ、工業化やフランチャイズは困難であった。特に、細胞株のような均一系ではなく、臨床現場における患者細胞のようなヘテロジェネイシティ(不均一性)に富んだ細胞群の品質測定には、画一的な判断方法の適応が難しく、基準化も困難であった。
本願に関連する文献を以下に列挙する。
【非特許文献1】Reinhold Nafe, Kea Franz, Wolfgang Schlote, and Berthold Schneider: Clinical Cancer Research, Vol.11 2141-2148, March 15, 2005
【非特許文献2】Vladimir Kirillov, Elena Stebenyaeva, Andrey PaPlevka, and Evgeny Demidchik: MICROSCOPY RESEARCH AND TECHNIQUE 69:721-728(2006)
【発明の開示】
【発明が解決しようとする課題】
【0005】
前述のような細胞品質評価の困難性から、細胞培養に関連する医療・検査・事業は、工業化や自動化が非常に難しい。工業化・自動化が困難を極める技術は、コストが高いだけでなく、安定性・安全性が保証されない。このため、再生医療のように治療に細胞を使うような医療は言うまでもなく、細胞を使った薬剤毒性評価やスクリーニングについても実用化への途は遠い。
【0006】
ところで、細胞品質評価の難しさは三つの原因に大分できる。一つ目は、評価対象である細胞が非常に不安定かつ不均一なものであることである。即ち、同じ細胞であっても個体や由来が異なれば性質も大きく異なり、全く同じ遺伝的背景をもった同種の細胞であっても、施設での扱い方や試薬への応答が若干異なる。さらに、多くの細胞は不均一な状態で存在し、互いに相互作用することで千変万化の変化を示す。このため、ある品質を持つという状態に至る過程は複合的であり、人間の頭で整理できるような少ない因子では説明ができない。結果、たくさんの定量・検査をしないと細胞の品質を評価することができない。二つ目の原因は、評価後の細胞を利用したいと考えたとき、評価手技・技術が未発達であるということである。現在の分子生物学的な評価方法は、破壊的な評価しか行えない。即ち、測定した細胞は、死んでいるか、試薬が混在しているため、その後、治療などの本来の目的に用いることが難しい。また、品質に関して多項目の測定が必要なとき、これらの手技は煩雑で時間が非常にかかり、非効率的である。三つ目の原因は、品質の判断が画一的に行えていないということである。即ち、どんなにたくさんの細胞の品質評価を行っても、多様性のある結果をうまく数値化・基準化することができず、技術者の経験にだけ委ねている問題である。このような経験や感覚だけに頼った評価は、正確に他人に伝達することができず、より工業化を困難にしている。
そこで本発明は、細胞培養における品質を予測する情報処理モデルを提供することを課題とする。
【課題を解決するための手段】
【0007】
前述の問題を解決するためには、三つの原因に対して対策を講じる必要がある。一つ目の問題である「細胞の不均一性」は、根本的に解決することはできない。しかしながら、このような不均一性の把握は、すべての要因(特徴)を総合的に理解しようとすると不可能であるが、たくさんの要因の中から出来る限り共通性(ルール性)のある特徴の組み合わせを見つけることができれば、把握することが可能である。本発明者らは、細胞の形態に着目し、細胞の形態をあらゆる指標(数値パラメータ)へと変換し、その膨大な情報の中から人間には思いつくことが不可能である指標の組み合わせを抽出する方法を確立した。指標の組み合わせには、知識情報処理手法の一つであるファジィニューラルネットワーク(Fuzzy Neural Network)を用い、教師値となる値をできるだけ正確に予測できるようなモデルを構築し、入力値(形態に関する指標)の組み合わせを選択することに成功した。一つのモデルとして、ヒト線維芽細胞の1日目、3日目の細胞形態画像情報から、3〜4個の細胞形態の情報を組み合わせれば有効に14日後に回収できる細胞数を予測できるモデルを確立した。本発明者らの手法の比較として、従来、作業者が感覚的に利用する指標を用いて予測したところ、予測精度は良くなかった。
二つ目の問題である「現状の評価方法の不適合さ」を解消するため、本発明者らは試薬の混入や細胞の破壊を一切伴わない、細胞の画像情報だけを使う評価方法を確立した。通常、1枚の細胞の画像からは、様々な指標を得ることができる。また、細胞の品質を連続的にモニタリングすると、各指標の変化量や変化率、特徴量、主成分などをさらに抽出することができる。同じ細胞を観察し続ける必要はなく、培養環境をなるべく反映するように複数の写真を撮影することによって実現することができる。具体的には、細胞の画像を、画像解析ソフトを利用して数値化するが、その後これらの数値を統計解析・数学的変換・多変量解析することによって、市販のソフトウエアから得られる情報の数十倍のデータに置換・変換する。この情報を用いて、その後ファジィニューラルネットワークを用いたモデリングを行い、目的とする品質指標(生産性・活性・コンタミネーション)を正確に予測できる、指標の組み合わせを網羅的に探索する。このようにして得られた指標を使って構築された予測モデルを用いれば、従来の評価方法と異なり、非破壊的方法で優れた予測結果を得ることができる。
三つ目の問題である、「品質判断の非画一性」は、本発明者らの構築した情報処理モデルによって解消される。情報処理モデルとは、即ち、多くの関係性のデータを蓄積した「判断能力を持ったデータベース」である。これまで、熟練者が感覚で感じ取っていた細胞形態の指標は、どの指標の組み合わせが有用なのか決定された後に機械学習される。たくさんのデータの学習を通じ、構築した情報処理モデルは一人の専門家のように予測が行えるため、ソフトウエアとして利用すれば、初心者でも、どの施設でも同じ品質評価の判断をすることができる。さらに、本法に利用するファジィニューラルネットワークは、モデル構造をルールとして数値化することができるという特徴をもつ。即ち、ある品質を得るに至った複数の要因の組み合わせを、ルール表として示すことができる。
以上の通り、本発明者らは、「細胞形態を用いた情報処理モデル」を利用することによって上記各問題を解決することに成功した。当該成果に基づき、以下に列挙する発明が提供される。
[1]細胞の品質を予測する予測モデルを構築する方法であって、
(1)同種の細胞を培養した二つ以上のサンプルを用意するステップ、
(2)培養時間の異なる二つ以上の時点(予測時)において各サンプルの細胞を撮影し、画像を取得するステップ、
(3)ステップ(2)で取得した各画像を解析し、細胞の形態に関する二つ以上の指標について数値データを生成するステップ、
(4)予測目標の実測データをサンプル毎に用意するステップ、及び
(5)ステップ(3)で生成した数値データを入力値とし、ステップ(4)で用意した実測データを教師値としてファジィニューラルネットワーク解析し、予測に有効な指標の組合せを示すファジィルールに基づいて出力値を算出する予測モデルを構築するステップ、
を含む方法。
[2]細胞の品質が、細胞増殖率、残存分裂可能時間、残存分裂可能回数、分化度、活性度、特定の因子やタンパク質などの産生能、異常度、腫瘍化度、癌化度、又は異種細胞の混在による危険度である、[1]に記載の方法。
[3]細胞が間葉系細胞又は上皮細胞である、[1]又は[2]に記載の方法。
[4]サンプルの数が10以上である、[1]〜[3]のいずれか一項に記載の方法。
[5]予測時の数が3以上である、[1]〜[4]のいずれか一項に記載の方法。
[6]予測時の間隔が1日以上である、[1]〜[5]のいずれか一項に記載の方法。
[7]細胞の形態に関する指標の数が50以上である、[1]〜[6]のいずれか一項に記載の方法。
[8]細胞の形態に関する指標が、以下のa、b及びcの組合せで規定される指標である、[1]〜[7]のいずれか一項に記載の方法。
a:細胞の面積、細胞の内部の空洞・穴の面積、細胞の周囲長、水平方向の細胞の幅、細胞の長軸長、細胞の短軸長、細胞の水平に対する角度、細胞を線と仮定したときの長軸長、細胞を線と仮定したときの短軸長、細胞の円形度、細胞の楕円形度、細胞の内接円の半径、細胞の外接円の半径、細胞の中心から全周への長さ平均、細胞を円と仮定したときの半径、細胞を球と仮定した場合の体積、細胞の長軸を軸にして短軸の周りを一回転させたときの疑似体積、細胞の短軸を軸にして長軸の周りを一回転させたときの疑似体積、細胞の面積と同じ断面積を持つ球の表面積、及び細胞単位ではなく細胞集塊単位で認識した場合における上記全項目、並びに集塊状に固まって成長した細胞(コロニー)における細胞の密度、コロニー中の細胞本体でない面積のいずれか、
b:平均、標準偏差及び合計のいずれか、
c:特定の予測時の値、特定の予測時から次の予測時までの変化量、及び変化量の経時的変化のいずれか。
[9]ステップ(5)において二つ以上の予測モデルを構築する、[1]〜[8]のいずれか一項に記載の方法。
[10]ステップ(5)が以下のステップからなる、[1]〜[9]のいずれか一項に記載の方法、
(5−1)ステップ(3)で生成した数値データを入力値とし、ステップ(4)で用意した実測データを教師値としてファジィニューラルネットワーク解析し、二つ以上の予測モデルを構築するステップ、及び
(5−2)構築された予測モデルの中から、その出力値が、ステップ(4)で用意した実測データに最も近い予測モデルを選択するステップ、
を含む方法。
[11]
予測に有効な指標の組合せが3又は4個の指標の組合せからなる、[1]〜[10]のいずれか一項に記載の方法。
[12]ステップ(5)の前に、ステップ(3)で生成した数値データを解析し、変動の大きい数値データを与える指標を除去するステップを行う、[1]〜[11]のいずれか一項に記載の方法。
[13]細胞の品質の予測に有効な指標の組合せを得る方法であって、
(1)同種の細胞を培養した二つ以上のサンプルを用意するステップ、
(2)培養時間の異なる二つ以上の時点(予測時)において各サンプルの細胞を撮影し、画像を取得するステップ、
(3)ステップ(2)で取得した各画像を解析し、細胞の形態に関する二つ以上の指標について数値データを生成するステップ、
(4)予測目標の実測データをサンプル毎に用意するステップ、及び
(5)ステップ(3)で生成した数値データを入力値とし、ステップ(4)で用意した実測データを教師値としてファジィニューラルネットワーク解析し、予測に有効な指標の組合せを示すファジィルールに基づいて出力値を算出する予測モデルを構築するステップ、
(6)ステップ(5)で構築された予測モデルからファジィルールを抽出するステップ、
を含む方法。
[14][1]〜[12]のいずれか一項に記載の方法で構築された予測モデルを用いて細胞の品質を予測することを特徴とする、細胞の品質を予測する方法。
[15][1]〜[12]のいずれか一項に記載の方法で構築された予測モデルを用いて細胞の品質を予測する方法であって、
(1)被検細胞の撮影画像から、細胞の品質の予測に有効な指標の組合せに含まれる各指標について数値データを生成するステップ、
(2)数値データを予測モデルに入力して解析するステップ、及び
(3)算出された出力値に基づき細胞の品質を判断するステップ、
を含む方法。
[16]細胞の品質を予測する予測モデルを構築するためにコンピュータを、
培養時間の異なる二つ以上の時点(予測時)に撮影した画像の解析によって生成した、細胞の形態に関する二つ以上の指標についての数値データを入力値とし、予測目標の実測データを教師値としてファジィニューラルネットワーク解析し、予測に有効な指標の組合せを示すファジィルールに基づいて出力値を算出する予測モデルを構築するする手段、
として機能させるためのプログラム。
[17]細胞の品質を予測する予測モデルを構築するためにコンピュータを、
培養時間の異なる二つ以上の時点(予測時)に撮影した画像を解析し、細胞の形態に関する二つ以上の指標について数値データを生成する手段、及び
数値データを入力値とし、予測目標の実測データを教師値としてファジィニューラルネットワーク解析し、予測に有効な指標の組合せを示すファジィルールに基づいて出力値を算出する予測モデルを構築する手段、
として機能させるためのプログラム。
[18]画像解析により実測データを生成する手段を更に備える、[17]に記載のプログラム。
[19]ファジィニューラルネットワーク解析の前に、数値データを解析し、変動の大きい数値データを与える指標を除去する手段を更に備える、[16]〜[18]のいずれか一項に記載のプログラム。
[20][16]〜[19]のいずれか一項に記載のプログラムを記録した、コンピュータ読み取り可能な記録媒体。
[21]細胞の品質を予測する予測モデルを構築する装置であって、
培養時間の異なる二つ以上の時点(予測時)に撮影した画像の解析によって生成した、細胞の形態に関する二つ以上の指標についての数値データを入力値とし、予測目標の実測データを教師値としてファジィニューラルネットワーク解析し、予測に有効な指標の組合せを示すファジィルールに基づいて出力値を算出する予測モデルを構築するする手段、
を備えてなる装置。
[22]細胞の品質を予測する予測モデルを構築する装置であって、
培養時間の異なる二つ以上の時点(予測時)に撮影した画像を解析し、細胞の形態に関する二つ以上の指標について数値データを生成する手段、及び
数値データを入力値とし、予測目標の実測データを教師値としてファジィニューラルネットワーク解析し、予測に有効な指標の組合せを示すファジィルールに基づいて出力値を算出する予測モデルを構築する手段、
を備えてなる装置。
[23]画像解析により実測データを生成する手段を更に備える、[22]に記載の装置。
[24]ファジィニューラルネットワーク解析の前に、数値データを解析し、変動の大きい数値データを与える指標を除去する手段を更に備える、[21]〜[23]のいずれか一項に記載の装置。
【発明を実施するための最良の形態】
【0008】
1.予測モデル構築法
本発明の第1の局面は、細胞の品質を予測する予測モデルを構築する方法(予測モデル構築法)に関する。ここで「予測モデル」とは、所定の情報(入力)に基づき予測(出力)をする情報処理モデルのことをいう。本発明の予測モデル構築法によって構築される「予測モデル」は、細胞の形態に関する情報に基づいて細胞の品質を予測する。予測の対象(即ち、細胞の品質)のことを本発明では「予測目標」ともいう。
【0009】
本発明において予測目標となる「細胞の品質」は、増殖率、残存分裂可能時間、残存分裂可能回数(残存ダブリング数)、分化度、活性度、特定の因子やタンパク質などの産生能、異常度、腫瘍化度、癌化度、及び異種細胞の混在率による危険度などである。このように本発明の適用範囲は広範に及ぶものであり、その汎用性は高い。
【0010】
ここでの「増殖率」とは、基準時から所定時間経過時までの細胞数の変化率(所定時間経過後の細胞数/基準時の細胞数)である。基準時は典型的には培養開始時である。但し、これに限られるものではなく、任意の時点を基準時にすることができる。
【0011】
一般的な正常細胞は、ある特定の回数だけ分裂すると、その後分裂できなくなり、死滅する。「残存分裂可能時間」とは、分裂できなくなるまでに残された時間のことである。換言すれば、分裂能を維持できる残存時間のことである。「残存分裂可能回数(ダブリング数)」とは、残された分裂回数(あと何回分裂可能か)のことである。
【0012】
「分化度」とは、培養中に分化(例えば前駆細胞から成熟細胞への分化や、多分化能幹細胞から特定の細胞系譜への分化など)が予定された細胞がどの分化段階にあるかを示す指標である。分化度を決定するために、細胞の形態、細胞表面マーカー(タンパク質)の発現の有無又は発現量、特定の因子の産生の有無又は産生量などが利用されている。
【0013】
「活性度」とは、ある特定の因子などによって活性化された状態に変化し得る細胞の活性化の程度を表す指標である。活性度を決定するために、細胞の形態、細胞表面マーカーの発現の有無又は発現量、特定の因子の産生の有無又は産生量などが利用されている。
【0014】
「特定の因子やタンパク質などの産生能」とは、特定物質の産生の有無又は産生量によって特徴付けられる細胞の識別に利用される指標である。「特定の因子」の例として各種サイトカイン、各種ホルモンを挙げることができる。また「タンパク質」の例として、酵素、抗体を挙げることができる。
【0015】
「異常度」、「腫瘍化度」及び「癌化度」はいずれも細胞の異常な状態を表す指標であり、細胞の形態、核の形態、核型、分裂(増殖)速度、無秩序な増殖の有無、特定の腫瘍細胞によく見られるような細胞表面マーカーの発現の有無又は発現量などに基づいて決定される。
【0016】
生体から採取した細胞を培養する以上、目的の細胞と異なる細胞が混在する可能性がある。細胞製剤に代表されるように、生体への移植が予定された細胞を得る場合、混在細胞によって予想外の副作用(膿胞化、炎症、血管新生の阻害、神経伸張の阻害など)が生ずる可能性があることから、混在細胞の比率(混在率)は重要である。混在細胞が非常に少数であれば、目的の細胞が先に養分の採取することなどによって混在細胞は次第に駆逐されていくことが多いが、組織様構造を形成できるほどに混在細胞が存在する場合には上記の如き副作用の発生が懸念される。本発明では、目的の細胞と異なる細胞が混在することによる副作用ないし悪影響が生ずる可能性の度合を「異種細胞の混在による危険度」という。
【0017】
予測モデルの予測精度(予測の確度)は特に限定されない。但し、本発明の方法によれば予測精度の高い結果をもたらす予測モデルが構築される。予測モデルによる予測精度を高めるためには、サンプル数及び/又は予測時の数を増加させる、または複数の予測モデルの多数決評価を行うとよい。
【0018】
以下、図1に示す具体例を参照しながら、本発明の予測モデル構築法の各ステップを詳細に説明する。
【0019】
(1)サンプルの用意(図1のa)
本発明ではまず、同種の細胞を培養した二つ以上のサンプルを用意する。細胞の種類は特に限定されず、哺乳動物(ヒト、サル、ウシ、ウマ、ウサギ、マウス、ラット、モルモット、ハムスター等)の各種細胞、例えば心筋細胞、平滑筋細胞、脂肪細胞、線維芽細胞、骨細胞、軟骨細胞、破骨細胞、実質細胞、表皮角化細胞(ケラチノサイト)、上皮細胞(皮膚表皮細胞、角膜上皮細胞、結膜上皮細胞、口腔粘膜上皮、毛包上皮細胞、口腔粘膜上皮細胞、気道粘膜上皮細胞、腸管粘膜上皮細胞など)、内皮細胞(角膜内皮細胞、血管内皮細胞など)、神経細胞、グリア細胞、脾細胞、膵臓β細胞、メサンギウム細胞、ランゲルハンス細胞、肝細胞、又はこれらの前駆細胞、或いは間葉系幹細胞(MSC)、胚性幹細胞(ES細胞)、胚性生殖細胞(EG細胞)、又は成体幹細胞などを使用することができる。また、正常細胞の他、癌細胞など何らかの異常を来した細胞、或いはHeLa細胞、CHO細胞、Vero細胞、HEK293細胞、HepG2細胞、Cos−7細胞、NIH3T3細胞、Sf9細胞などの株化された細胞等を採用することができる。
上皮細胞や間葉系細胞などの接着性の細胞は、その二次元的な画像解析が容易であることから、本発明の方法に特に適する。
【0020】
通常、サンプル数が多いほど解析結果の精度が高まり、より優れた予測モデルの構築が可能になる。しかし、サンプル数の増加は操作の煩雑化やデータ処理量の増大を引き起こす。そこで、サンプル数を好ましくは10〜1000、更に好ましくは30〜500とする。尚、後述の実施例に示す通り、サンプル数を30にした場合であっても、優れた予測モデルを構築できることが確認された。
原則、全てのサンプルについて培養条件を同一とする。精度の良い予測を可能とする予測モデルを構築するためである。但し、播種密度についてはサンプル間で統一しても、統一しなくてもよい。播種密度を統一しない場合、播種密度の相違をも考慮した解析を行うことができる。
【0021】
(2)画像の取得(図1のa)
次に、培養時間の異なる二つ以上の時点において各サンプルの細胞を撮影し、画像を取得する。本発明では当該時点のことを「予測時」とよぶ。予測時は任意に設定可能であるが、培養開始後1時間目〜20目の間に予測時を設定するとよい。予測時の具体例を挙げると培養開始後1日目、2日目、3日目、4日目、5日目、6日目、7日目、8日目、9日目、10日、11日目、12日目、13日目、14日目、15日目、16日目、17日目、18日目、19日目、20日目である。このように日単位によるのではなく、秒単位、分単位、時間単位、又は週単位で予測時を設定してもよい。予測時が培養初期であることが好ましい。将来の細胞の品質を予測する予測モデルを構築する場合において、早い段階での予測が可能となるからである。尚、培養開始から7日目までを「培養初期」とする。
【0022】
予測時の数は二つ以上である限り、特に限定されない。予測時の数が多いほど解析結果の精度が高まり、より優れた予測モデルの構築が可能になるといえる。一方で、予測時の数の増加は操作の煩雑化やデータ処理量の増大を引き起こす。そこで、予測時の数を好ましくは2〜20、更に好ましくは2〜10、より一層好ましくは2〜5とする。また、予測時の数を増加した方が優れた予測モデルを構築できる可能性が示唆された場合には(予測時の数の増大による確度の増大)、多点の予測時(コマ送りの動画など)を、数値解析(フーリエ変換や微分)などによって2〜5の数の積算変化量の値に圧縮するとよい。尚、後述の実施例に示す通り、予測時の数を2にした場合であっても、優れた予測モデルを構築できることが確認された。
【0023】
ある予測時と次の予測時との間隔は特に限定されない。ここでの間隔の例を示せば、1〜数十秒、1分〜数十分、1時間〜数時間、1日〜数日である。具体例を示せば、第1の予測時を培養開始後1日目とし、第2の予測時を培養開始後3日目とする。ただし、3以上の予測時を設定する場合には、予測時の間隔が全て同一である必要はない。
【0024】
細胞の撮影及び画像の取得には市販の装置を使用すればよい。本発明に使用可能な装置の例として、倒立型顕微鏡Olympus series(例えばIX81。オリンパス株式会社)、顕微鏡カメラDP12(オリンパス株式会社)、顕微鏡カメラ用ソフト(DP controller。オリンパス株式会社)、Metamorph (Molecular Device社)、カメラ一体型細胞観察装置セルウオッチャー(コアフロント株式会社)を挙げることができる。
【0025】
(3)画像解析(図1のb)
次に、取得した各画像を解析し、細胞の形態に関する二つ以上の指標について数値データを生成する。画像の解析(処理)には市販の画像解析ソフトウエアを使用すればよい。本発明で使用可能な画像解析ソフトウエアの例として、Metamorph (Molecular Device社)、Image J (米National Institute of Health配布無償ソフト)、NIH Image (米National Institute of Health配布無償ソフト)を挙げることができる。
【0026】
信頼性の高い解析結果を得るためにはノイズを適切に除去することが重要である。そこで本発明の好ましい形態では、図1に示すように、ノイズ除去、形態認識、数値化という、大別して3ステップで画像解析を行う。本発明では例えば次の方法でノイズを除去する。まず、画像の二値化(例えば細胞を白、背景を黒にする)をする。続いて、ノイズの大多数は細胞に比べて遙かに小さい面積であるとの前提の下、白で表示された物体の中で一定面積よりも小さいものをノイズとみなし、それらを除去する。ノイズの除去の際には、実際の細胞数とノイズを除去した後の細胞数との差(誤差)を全サンプルについて計算し、最も誤差が少なくなる値を閾値として採用するとよい。閾値の設定を予測時毎に行うことによって、より信頼性の高い画像解析を行うことができる。
【0027】
形態認識に続く数値化では、細胞の形態に関する指標(以下、特段の説明のない限り、「指標」は「細胞の形態に関する指標」のことを指す)を数値データとして抽出する。ここでの指標として、以下のa、b及びcの組合せで規定される指標を用いることができる。
a:細胞の面積、細胞の内部の空洞・穴の面積、細胞の周囲長、水平方向の細胞の幅、細胞の長軸長、細胞の短軸長、細胞の水平に対する角度、細胞を線と仮定したときの長軸長、細胞を線と仮定したときの短軸長、細胞の円形度、細胞の楕円形度、細胞の内接円の半径、細胞の外接円の半径、細胞の中心から全周への長さ平均、細胞を円と仮定したときの半径、細胞を球と仮定した場合の体積、細胞の長軸を軸にして短軸の周りを一回転させたときの疑似体積、細胞の短軸を軸にして長軸の周りを一回転させたときの疑似体積、細胞の面積と同じ断面積を持つ球の表面積、及び細胞単位ではなく細胞集塊単位で認識した場合における上記全項目、並びに集塊状に固まって成長した細胞(コロニー)における細胞の密度、コロニー中の細胞本体でない面積のいずれか;
b:平均、標準偏差及び合計のいずれか;
c:特定の予測時の値、特定の予測時から次の予測時までの変化量、及び変化量の経時的変化のいずれか。
【0028】
bにおける「平均」とは、一つの画像に含まれる全細胞について得たaの値を細胞数で除したものである。「標準偏差」及び「合計」も同様に、一つの画像に含まれる全細胞について得たaの値を基に算出される。
また、cにおける「特定の予測時の値」は、予測時毎の値である。例えば二つの予測時(第1予測時及び第2予測時)を設定した場合、第1予測時の値と第2予測時の値が用いられることになる。一方、「特定の予測時から次の予測時までの変化量」とは、特定の予測時の値と次の予測時の値の差又は商である。二つの予測時(第1予測時及び第2予測時)を設定した場合を例にとれば、(第2予測時の値)−(第1予測時の値)、(第2予測時の値)/(第1予測時の値)が「特定の予測時から次の予測時までの変化量」に該当する。これら全てを用いることにしても、差のみ或いは商のみを用いることにしてもよい。また、「変化量の経時的変化」は、二つの変化量の差又は商として算出される。三つの予測時(第1予測時、第2予測時及び第3予測時)を設定した場合、{(第3予測時の値)−(第2予測時の値)}−{(第2予測時の値)−(第1予測時の値)}、{(第3予測時の値)−(第2予測時の値)}/{(第2予測時の値)−(第1予測時の値)}、{(第3予測時の値)/(第2予測時の値)}−{(第2予測時の値)/(第1予測時の値)}、{(第3予測時の値)/(第2予測時の値)}/{(第2予測時の値)/(第1予測時の値)}が「変化量の経時的変化」に該当する。これら全てを用いることにしても、この中から選択される一又は二以上の値を用いることにしてもよい。
尚、すべての予測時の値をフーリエ変換・微分するなどして積算変化量を一つ以上の圧縮された数値に変換し、これを利用してもよい。
【0029】
ここで、指標の具体例を示す。aとして面積及び楕円形度を採用し、bとして平均を採用し、cとして特定の予測時の値、及び特定の予測時から次の予測時までの変化量を採用し、予測時(第1予測時及び第2予測時)を二つとした場合には、以下に示す合計8個(2×1×4)の指標が用いられることになる。
(1)第1予測時の面積の平均値、(2)第3予測時の面積の平均値、(3)第3予測時の面積の平均値から第1予測時の面積の平均値を引いた値、(4)第3予測時の面積の平均値を第1予測時の面積の平均値で除した値、(5)第1予測時の楕円形度の平均値、(6)第3予測時の楕円形度の平均値、(7)第3予測時の楕円形度の平均値から第1予測時の楕円形度の平均値を引いた値、(8)第3予測時の楕円形度の平均値を第1予測時の楕円形度の平均値で除した値
このように、指標の数はa、b及びcの数と測定時の数に依存する。
【0030】
ファジィニューラルネット解析の精度を高めるためには、数値データの数は多い方がよい。従って、数値データ化可能な指標をできるだけ多く抽出するとよい。指標の数は例えば10〜1000である。好ましくは50以上の指標を用いる。
【0031】
(4)実測データの用意(図1のa)
このステップでは、予測目標となる実測データをサンプル毎に用意する。実測データは後のファジィニューラルネット解析で教師値(目的の出力値)として利用される。「実測データ」とは、予測目標に応じて各サンプルを実際に測定・解析することによって取得される、細胞の品質を表す数値データである。例えばステップ(3)と同様に画像解析によって実測データを得ることができる。但し、必要な実測データが得られる限り、測定・解析の手段は特に問わない。
例えば、予測目標が「培養開始から所定時間経過後までの増殖率」であれば、所定時間経過後のサンプルの細胞数と、培養開始時の細胞数を測定し、次式によって「実測データ」を得ることができる。
(数1)
増殖率=(所定時間経過後のサンプルの細胞数)/(培養開始時の細胞数)
【0032】
培養開始時を基準にするのではなく、培養開始後のある時点を基準とし、そこから所定時間経過後までの増殖率を「予測目標」としてもよい。その場合は次式によって「実測データ」を得ることができる。
(数2)
増殖率=(所定時間経過後のサンプルの細胞数)/(培養開始後のある時点の細胞数)
【0033】
他の例として、予測目標が「残存分裂時間」であれば、細胞が分裂しなくなるまで培養を継続し、培養開始時からの所要時間を計測する。そして次式によって「実測データ」を得る。
(数3)
残存分裂時間=所要時間−(培養開始から予測時までの経過時間)
【0034】
尚、細胞が分裂しなくなるまでの所要時間を、予測時を基準に算出した場合は、「所要時間」=「実測データ」となる。
【0035】
更に他の例として、予測目標が「残存分裂回数(ダブリング数)」であれば、細胞が分裂しなくなるまで培養を継続することによって総分裂回数を測定する。併せて予測時までの分裂回数を測定する。そして次式によって「実測データ」を得る。尚、分裂回数は細胞数を基に算出することができる。
(数4)
残存分裂回数=総分裂回数−(予測時までの分裂回数)
【0036】
(5)予測モデル(FNNモデル)の構築(図1のA)
次に、ステップ(3)で生成した数値データを入力値として、ステップ(4)で用意した実測データを教師値としてファジィニューラルネットワーク(FNN)解析を行い、予測モデルを構築する。このFNN解析においては、予測に有効な指標の組合せを示すファジィルールに基づいて出力値を算出する予測モデルが構築される。出力値が実測データに近い程、即ち出力値と実測データとの誤差が小さいほど、精度のよい予測モデルとなる。
後述のようにFNNモデルはファジィルールを抽出できるという特徴を持つ。本発明によって構築される予測モデルからは、予測に有効な指標の組合せを示すファジィルールを抽出できることになる。
【0037】
ここで「ファジィニューラルネットワーク」とは、人工ニューラルネットワーク(Artificial Neural Network; ANN)とファジィ推論を組み合わせた方法をいい、ファジイ推論の欠点であるメンバーシップ関数の決定を人間に頼るという部分を回避すべく、ANNをファジィ推論に組み込み、その自動決定を行う方法である。学習機械のひとつであるANN(図2)は、生体の脳における神経回路網を数学的にモデル化したものであり、以下の特徴を持つ。ANNにおける学習は、目的の出力値(教師値)をもつ学習用のデータ(入力値; X)を用いて、バックプロパゲーション法(Back propagation; BP法)により教師値と出力値(Y)の誤差が小さくなるように、図2におけるノード(○で記載)とノード(○で記載)をつなぐ回路における結合荷重を変え、その出力値が教師値に近づくようにモデルを構築する過程であり、このBP法を用いれば、ANNは学習により自動的に知識を獲得することができる。そして、最終的に学習に用いていないデータを入力することにより、そのモデルの汎用性を評価することができる。従来、メンバーシップ関数の決定は、人間の感覚に頼っていたが、上で述べたようなANNをファジイ推論に組み込むことで自動的なメンバーシップ関数の同定が可能になる。これがFNNである。ANNと同様に、BP法を用いることによりネットワークに与えられた入出力関係を、結合荷重を変化させることで自動的に同定しモデル化することができる。FNNは、学習後のモデルを解析することでファジィ推論のように人間に理解しやすい言語的なルール(一例として図3の右下の吹き出しを参照)として知識を獲得できるという特徴をもっている。つまり、FNNは、その構造、特徴から、細胞の形態的特徴を表した数値のような変数の組み合わせにおける最適なファジィ推論の組み合わせを自動決定し、予測目標に関する推定と、予測に有効な指標の組合せを示すルールの生成を同時に行うことができる。
【0038】
FNNの構造は入力層、シグモイド関数に含まれるパラメータWc、Wgを決定するメンバーシップ関数部分(前件部)、Wfを決定し、入力と出力の関係をルールとして取り出すことが可能なファジィルール部分(後件部)、出力層の4層から成り立っている(図3)。FNNのモデル構造を決定する結合荷重にはWc、Wg、Wfがある。結合荷重Wcは、メンバーシップ関数に用いられるシグモイド関数の中心位置、Wgは中心位置での傾きを決定する(図4)。モデル内では、入力値がファジィ関数により、人間の感覚的に近い柔軟性を持って表現される(一例として図3の左下の吹き出しを参照)。結合荷重Wfは各ファジイ領域の推定結果に対する寄与を表しており、Wfよりファジィルールを導くことができる。即ち、モデル内の構造はあとから解読でき、ルールとして書き起こすことができる(一例として図3の右下の吹き出しを参照)。
【0039】
FNN解析におけるファジィルールの作成には結合荷重のひとつであるWf値が用いられる。Wf値が正の値で大きいと、そのユニットは「予測に有効である」と判定されることに対する寄与が大きく、そのルールに当てはまった指標は「有効である」と判断される。Wf値が負の値で小さいと、そのユニットは「予測に有効でない」と判定されることに対する寄与が大きく、そのルールに当てはまった指標は「有効でない」と判断される。
【0040】
FNN解析によって二つ以上の予測モデルを構築することにしてもよい。即ち、本発明の一態様では、ステップ(5)として次のステップ(5−1)及び(5−2)が行われる。
(5−1)ステップ(3)で生成した数値データを入力値とし、ステップ(4)で用意した実測データを教師値としてファジィニューラルネットワーク解析し、二つ以上の予測モデルを構築するステップ。
(5−2)構築された予測モデルの中から、その出力値が、ステップ(4)で用意した実測データに最も近い予測モデルを選択するステップ。
【0041】
(6)ノイズの除去(図1のc)
本発明の一態様では、FNN解析(即ちステップ(5))の前にノイズの除去を行う。ここでのノイズの除去は、変動の大きな指標(ブレの大きな指標)を除去することをいう。ノイズの除去は後述の実施例2に示すようなCV値(変動係数)を利用して行うことができる。統計解析によってノイズの除去を行うこともできる。二つ以上の手法を組み合わせてノイズの除去を行うとよい。
FNN解析の前にノイズの除去を行って入力値を選定することにより、構築される予測モデルの予測精度を高めることができる。
【0042】
2.細胞の品質の予測に有効な指標の組合せを得る方法
以上の構築法によれば、細胞の品質を予測する予測モデルが構築されるとともに、細胞の品質の予測に有効な指標の組合せがファジィルールとして得られる。そこで本発明の第2の局面は、次のステップを含むことを特徴とする、細胞の品質の予測に有効な指標の組合せを得る方法を提供する。
(1)同種の細胞を培養した二つ以上のサンプルを用意するステップ、
(2)培養時間の異なる二つ以上の時点(予測時)において各サンプルの細胞を撮影し、画像を取得するステップ、
(3)ステップ(2)で取得した各画像を解析し、細胞の形態に関する二つ以上の指標について数値データを生成するステップ;
(4)予測目標の実測データをサンプル毎に用意するステップ;
(5)ステップ(3)で生成した数値データを入力値とし、ステップ(4)で用意した実測データを教師値としてファジィニューラルネットワーク解析し、予測に有効な指標の組合せを示すファジィルールに基づいて出力値を算出する予測モデルを構築するステップ;及び
(6)ステップ(5)で構築された予測モデルからファジィルールを抽出するステップ。
【0043】
ここでのステップ(1)〜(5)については、予測モデルの構築法の欄で説明した通りである。この方法においても、予測モデルの構築法と同様に、FNN解析(即ちステップ(5))の前にノイズを除去するステップを行うことが好ましい。
【0044】
3.細胞の品質の予測
本発明の構築法で構築された予測モデルは、細胞の品質の予測に利用される。そこで本発明は第3の局面として、本発明の構築法で構築された予測モデルを用いて細胞の品質を予測することを特徴とする、細胞の品質を予測する方法も提供する。本発明の予測法では次のステップが実施される。
(1)被検細胞の撮影画像から、細胞の品質の予測に有効な指標の組合せに含まれる各指標について数値データを生成するステップ;
(2)数値データを予測モデルに入力して解析するステップ;及び
(3)算出された出力値に基づき細胞の品質を判断するステップ。
【0045】
ステップ(1)における「被検細胞」とは、その品質を調べることが予測目標となる細胞である。被検細胞には、予測モデルの構築の際にサンプルとして利用された細胞と同種の細胞が用いられる。例えば、ヒト線維芽細胞をサンプルとして予測モデルを構築した場合には、被検細胞もヒト線維芽細胞である。
【0046】
4.予測モデル構築用プログラム、記録媒体、及び装置
本発明は他の局面として、本発明の構築法をコンピュータに実行させるためのプログラムを提供する。本発明のプログラムは、細胞の品質を予測する予測モデルを構築するためにコンピュータを、(a)培養時間の異なる二つ以上の時点(予測時)に撮影した画像の解析によって生成した、細胞の形態に関する二つ以上の指標についての数値データを入力値とし、予測目標の実測データを教師値としてファジィニューラルネットワーク解析し、予測に有効な指標の組合せを示すファジィルールに基づいて出力値を算出する予測モデルを構築するする手段、として機能させる。この手段(a)は、本発明の構築法のステップ(5)に対応する。
【0047】
本発明の構築法のステップ(2)及び(3)に対応する処理も併せて実行されるようにプログラムを構成してもよい。即ち、この態様のプログラムはコンピュータを、(i)培養時間の異なる二つ以上の時点(予測時)に撮影した画像を解析し、細胞の形態に関する二つ以上の指標について数値データを生成する手段、及び(ii)数値データを入力値とし、予測目標の実測データを教師値としてファジィニューラルネットワーク解析し、予測に有効な指標の組合せを示すファジィルールに基づいて出力値を算出する予測モデルを構築する手段、として機能させる。
【0048】
また、本発明の構築法のステップ(4)に対応する処理も併せて実行されるようにプログラムを構成してもよい。即ち、この態様のプログラムはコンピュータを、画像解析により実測データを生成する手段としても機能させる。当該手段による処理は、例えば、上記手段(i)による処理の後に行われる。
【0049】
さらに、本発明の構築法のステップ(6)に対応する処理も併せて実行されるようにプログラムを構成してもよい。即ち、この態様のプログラムはコンピュータを、ファジィニューラルネットワーク解析の前に、数値データを解析し、変動の大きい数値データを与える指標を除去する手段としても機能させる。
【0050】
更に本発明は、本発明のプログラムを読み取り可能に記録した記録媒体を提供する。本発明の記録媒体は汎用又は専用コンピュータが読み取り可能なものであって、そこには本発明のプログラムが記録されている。本発明の記録媒体は可搬型であっても固定型であってもよい。記録媒体の形態の具体例として、CD-ROM、フレキシブルディスク(FD)、DVD、ハードディスク、半導体メモリを挙げることができる。
【0051】
更に本発明は、本発明の構築法を実行する装置、即ち細胞の品質を予測する予測モデルを構築する装置を提供する。本発明の装置の一態様は、培養時間の異なる二つ以上の時点(予測時)に撮影した画像の解析によって生成した、細胞の形態に関する二つ以上の指標についての数値データを入力値とし、予測目標の実測データを教師値としてファジィニューラルネットワーク解析し、予測に有効な指標の組合せを示すファジィルールに基づいて出力値を算出する予測モデルを構築する手段を備える。本発明の装置の他の態様は、培養時間の異なる二つ以上の時点(予測時)に撮影した画像を解析し、細胞の形態に関する二つ以上の指標について数値データを生成する手段、及び数値データを入力値とし、予測目標の実測データを教師値としてファジィニューラルネットワーク解析し、予測に有効な指標の組合せを示すファジィルールに基づいて出力値を算出する予測モデルを構築する手段を備える。
画像解析により実測データを生成する手段、及び/又はファジィニューラルネットワーク解析の前に、数値データを解析し、変動の大きい数値データを与える指標を除去する手段を更に備える装置としてもよい。
【0052】
本発明の装置の好ましい態様は、本発明のプログラムがハードディスク装置等の記憶装置に格納されたコンピュータである。本発明の設計装置のハードウェア構成の一例を図5に示す。この構成例では、装置全体を統括的に制御する主制御部10と、主制御部10に接続された主記憶部装置20及び一時記憶装置30と、入出力制御部40を介して主制御部10に接続される入力装置50及び出力装置60とが備えられる。
主制御部10はOS(Operating System)等の制御プログラム、各種の処理手順を規定したプログラム、及び所要データを格納するための内部メモリを有する。
主記憶装置20には、本発明による処理を実行するためのプログラムが格納される。本発明による処理が二つ以上のプログラムによって実行されることにしてもよい。主記憶装置20には上記プログラムの他、各種のデータベース、テーブル、ファイル等が必要に応じて格納される。
一時記憶装置30は、入力されたデータ、および算出された数値データ等を一時的に記憶する。
入力装置50は例えばキーボードやマウス等のポインティングデバイスからなる。また、出力装置60は例えばディスプレイ・モニター、プリンターなどからなる。
【0053】
、
図1及び5を参照しながら、上記ハードウェア構成の設計装置による処理を説明する。尚、この例では、FNN解析の前にノイズを除去(不要な指標を除去)することにしている。
まず、キーボードなどの入力装置50を介して、実験データ及び画像解析結果が入力されると主制御部10は、主記憶装置20に格納された所定のプログラムの指令に従い、ノイズの除去を行う(ステップc)。その後、データ処理(数値整理、統計解析、データ化)を実行する(ステップd)。次に、生成した数値データを入力値として詠み込む(ステップe)。続いて、更にノイズを除去した後、データ分割及び整理を行う(ステップf)。生成したデータは一時記憶装置30に格納される(ステップg)。
次に主制御部10は、主記憶装置20に格納されたプログラムの指令に従い一時記憶手段30に格納された数値データを呼び出し、当該数値データを入力変数としてファジィニューラルネットワーク解析(FNN解析)を行い、予測モデルを構築する。FNN解析は大別して変数選択機能(A1)とモデル構築機能(A2)から構成される。変数選択機能においては、モデル荷重の初期化、学習(モデル構築)、評価(評価基準値の算出)、評価値に沿ったモデル荷重の修正、最終予測モデル(荷重データの保存)、及びモデル構築データ以外のデータの評価が順に実行される。この一連の処理は最適な条件が設定されるまで繰り返される。一方、モデル構築機能においては、モデル荷重の初期化、学習(モデル構築)、評価(評価基準値の算出)、評価値に沿ったモデル荷重の修正、最終予測モデル(荷重データの保存)、及びモデル構築データ以外のデータの評価が順に実行される。この一例の処理は最適な条件が設定されるまで繰り返され、最終的に予測モデルが構築される。
【0054】
以上のようにして構築された予測モデルのデータは一時記憶装置30に格納される。続いて主制御部10は、主記憶装置20に格納されたプログラムの指令に従い一時記憶装置30に格納された予測モデルのデータを呼び出し、当該予測モデルに基づいて、細胞の品質を予測する一又は二以上のルールを抽出する。抽出されたルールは主記憶装置20又は一時記憶装置30に格納されるとともに、自動的又はオペレーターの要求に応じて出力装置60に出力される。尚、主記憶装置20又は一時記憶装置30には上記ルールに関するデータファイルの他、必要に応じて、予測モデルを表すデータファイル、予測モデルの正確性に関するファイルが蓄積される。これらのファイルは自動的又はオペレーターの要求に応じて出力装置60に出力される。
【実施例1】
【0055】
<細胞の増殖率を予測する予測モデルの構築>
現在、患者の組織から得られる細胞を大量に培養して治療に用いる再生医療が注目されている。治療日までに必要な量の細胞を回収するためには、培養中に増殖のし易さや細胞種間のコンタミネーションを起こしていないかなどといった細胞の品質を管理していく必要がある。そこで、培養初期における予測に基づいてその後の培養を自動で管理する技術の開発を目指し、予測に重要な指標の組み合わせを探索した。
【0056】
1.実験手法(図6)
患者10人から採取してきた繊維芽細胞を、1人につき3サンプル用意し、計30サンプルを実験に使用した。各サンプルを14日間培養し、その間毎日写真撮影した。得られた画像のうち、1日目のものと3日目のものを画像処理し、数値化できる形態指標を可能な限り抽出した。具体的には、細胞の面積、細胞の内部の空洞・穴の面積、細胞の周囲長、水平方向の細胞の幅、細胞の長軸長、細胞の短軸長、細胞の水平に対する角度、細胞を線と仮定したときの長軸長、細胞を線と仮定したときの短軸長、細胞の円形度、細胞の楕円形度、細胞の内接円の半径、細胞の外接円の半径、細胞の中心から全周への長さ平均、細胞を円と仮定したときの半径、細胞を球と仮定した場合の体積、細胞の長軸を軸にして短軸の周りを一回転させたときの疑似体積、細胞の短軸を軸にして長軸の周りを一回転させたときの疑似体積、細胞の面積と同じ断面積を持つ球の表面積、及び細胞単位ではなく細胞集塊単位で認識した場合における上記全項目を数値化し、画像ごとの全細胞の平均及び標準偏差を算出した。平均及び標準偏差のそれぞれについて、1日目の値、3日目の値、さらには1日目〜3日目の値の増加率(3日目の値/1日目の値)及び差(3日目の値/1日目の値)を計算し、計180の指標とした。このようにして得られた180指標を情報処理解析し、14日後の増殖率の予測する予測モデルの構築と、予測に重要な指標の組み合わせを抽出した。
【0057】
2.画像処理(図7、8)
画像処理には画像処理ソフトMetamorph(Molecular Device社)を用いた。細胞と背景の識別には、細胞以外の部分で細胞と認識されてしまうノイズの発生が問題となる。そこで、ノイズを除去するためにまず、細胞を白に背景を黒に変換する二値化を行った。続いて、ノイズの大多数は細胞に比べて遙かに小さい面積であることから、白い物体の中である一定面積より小さいものをノイズとみなし、それらを除去する方法を考案した。このようにすれば、1細胞ごとの形態観測を行いすべての細胞の形を数値化することが出来る。
【0058】
最適なノイズ除去をもたらす閾値を求めるべく、以下の検討をした(図8)。ノイズの面積の閾値を26ピクセル〜40ピクセルの間で設定し、実際の細胞数とノイズ除去後の細胞数との差を誤差として計算した。30サンプルすべてについて当該計算を行った場合に最も誤差が少なくなる閾値を採用した。尚、画像中の細胞数を目測することによって実際の細胞数を求めた。図8の上段のグラフは、1日目の画像と3日目の画像それぞれについて、横軸にノイズ面積の閾値を、縦軸に誤差の総和を表したものである。1日目の画像では36ピクセルの閾値で、3日目の画像では30ピクセルの閾値で最も誤差が小さくなることがわかる。そこで、この閾値を用いて1日目の各画像及び3日目の各画像を処理したところ、ノイズの除去が良好に行われることが示された(図8の下段)。このように、1日目の画像と3日目の画像のそれぞれについて、ノイズ除去のための閾値を一つに設定出来たことによって、画像処理をほとんど自動で行うことが可能となり、処理時間が短縮化された。
【0059】
3.FNN解析
本実験ではファジィニューラルネットワーク(FNN)を解析に用いた。FNNは手本となる入力値と出力値(教師値)を与えることによって、その間にある関係を学習し、複雑な関係をモデル化することができる(図9)。また、入力と出力の関係をファジィルールとして自動抽出することができるという特徴も有する。
入力値に細胞の形態に関する180指標、出力値に14日間の増殖率の値を用いてモデル構築を行った(図9)。そして、「出力値である14日間の増殖率」が「実測した増殖率(教師値)」に最も近いモデルを選択し、そのモデルに関して増殖率予測を行うとともに、ファジィルールも抽出した(図9)。
【0060】
FNN解析の結果、14日間の増殖率の予測に有効な指標の組合せとして、以下の3指標の組み合わせが得られた(図10)。一つ目の指標は、楕円形度の標準偏差の1日目から3日目にかけた増加率である。楕円形度は、長軸を短軸で除した値である。当該指標の値は、増加率が大きい場合、1日目から3日目にかけてばらつきが大きくなる。二つ目の指標は、1日目の穴の面積の平均である。この指標は、核の存在で生じる凹凸が検出されるものであり、細胞の広がり具合に影響する。広がりすぎて厚みのない細胞では核の凹凸が強調され画像的な穴が生じる。一方、広がらず厚みのある正常な紡錘形の細胞では核の位置の凹凸があまり検出されない。三つ目の指標は、1日目の円形度の平均である。円形度は次式で算出される。円に近いほど円形度が1に近くなる。
(数5)
円形度=4πA/P2(但し、A:面積、P:周囲長、0<円形度≦1)
【0061】
4.予測モデルの検証
(1)従来法との比較
以上の通り、細胞形態を表す3指標の組合せが選択された。従来、人が判断する場合は一般的に、培養初期の増殖具合と細胞の播種密度に基づいて感覚的に増殖率を予測していた。このような従来の方法と本法を比較するため、増殖具合を示す指標「1日目から3日目にかけての細胞数の増加率」又は播種密度を示す指標「1日目の面積の合計」のみを用いてFNN解析した。結果を図11に示す。左のグラフは、「1日目から3日目にかけての細胞数の増加率」を指標として予測した場合の結果である。一方、右のグラフは「1日目の面積の合計」を指標として予測した場合の結果である。尚、両グラフとも、横軸は実測した14日間の増殖率、縦軸は予測した14日間の増殖率である。これらのグラフからわかるように、精度の良い予測はできなかった。つまり、人の判断だけでは予測が不可能だということが示された。
【0062】
(2)指標の数と解析精度の関係
抽出に成功した3指標を用いて14日間の増殖率を予測した。図12の左のグラフに示すように、増殖率の良否に関係なく、精度の良い予測が出来ている。この結果より、予測に有効な指標の組合せを抽出できていることが確認された。
次に、これらの3指標をすべて用いる必要があるのかどうかを検討した。具体的には、「楕円形度の標準偏差の1日目から3日目にかけた増加率」という一つの指標だけで予測を行った。その結果、増殖率が良いか悪いかの違いは予測できるものの、増殖率が2.5倍または5倍前後の値でしか予測せず、十分な予測ができないことが明らかとなった(図12の右のグラフ)。その他の指標についても一つの指標のみで予測したが、同様に十分な予測はできなかった(結果を図示せず)。また、二つの指標の組合せによる予測も試みたが、3指標を用いた予測に比べて精度が低かった(結果を図示せず)。
以上の通り、3指標を組み合わせて用いることによって初めて高い精度の予測が可能であることが確認された。
【0063】
(3)ファジィルールの抽出
続いて、抽出された3指標と増殖率との関係を調べるため、ファジィルールを作成した(図13)。表中の各数値は、そのルールが増殖率にどれだけ影響するかを示している。数値が大きいほど増殖率を大きくするルールであると理解される。
最も数値が大きかったルールに注目すれば、一つ目の指標が大きく、二つ目の指標が小さく、且つ三つ目の指標が大きいときに14日間の増殖率が最大になることがわかる。一方、最も数値の小さかったルールに注目すれば、一つ目の指標が小さく、二つ目の指標が大きく、且つ三つ目の指標が小さいときに14日間の増殖率が最小になることがわかる。この正反対のルールでは、3指標の大少もそれぞれ逆の関係になる。
【0064】
実際に増殖率が最大であったサンプルの画像と、増殖率が最小であったサンプルの画像を図14に示す。これらの画像を見ると、図13に示したファジィルールに感覚的に当てはまることがわかる。このように、人間が感覚的に判断していた指標を限定された三つの形態指標の組み合わせとしてルール化でき、人の感覚に依らない安定した基準で判断、予測が可能となった。
【0065】
(4)新たなサンプルを用いた予測
最後に、3指標を組み合わせた予測モデルの有用性を確認する実験を行った。予測モデルの構築の際に使用していない新たなサンプル(8人から採取した計24サンプル)を用意し、予測モデルを使用したFNN解析によって14日間の増殖率を予測した(図15の上段)。結果を図15の下段のグラフに示す。線で囲んだサンプルを除いて、精度の高い予測ができていることがわかる。尚、全サンプルについて精度の高い予測ができないサンプルが発生した一因は、患者の細胞には非常に大きな個体差が存在し、今回の予測モデルではすべての患者の特徴を反映するにはデータサンプルが足りなかったことと考えられる。
【0066】
5.まとめ
画像解析とFNN解析を組み合わせたことによって、細胞の増殖率を精度良く予測できる予測モデルの構築に成功した。また、増殖率の予測に有効な3指標の組合せを発見し、それをルール化することにも成功した。さらには、画像処理方法の確立により、短時間での解析が可能となった。
本法によれば高精度で細胞の品質予測を行える。将来の増殖率が大きいと予測された場合はそのまま培養を続けることにし、小さい場合は廃棄、継代培養する、または添加因子を加えるなどといった対策をとる等、細胞培養法の効率化・最適化のために本法が活用されることが期待される。
【実施例2】
【0067】
<ノイズ除去によるFNNモデルの最適化>
予測精度を向上することを目指し、以下の検討を行った。
【0068】
1.実験手法
実施例1と同様に、線維芽細胞のサンプル(10人、計30サンプル)を用意し、細胞の形態に関する指標(180指標)を抽出した。
【0069】
2.画像処理
画像処理には画像処理ソフトMetamorph(Molecular Device社)を用いた。各画像について細胞を白に背景を黒に変換する二値化を行った。その際、実施例1での検討結果に基づきノイズを除去し、すべての細胞の形を数値化した。
次に、変動(ブレ)のある変数を除去することを検討した(図16)。まず、閾値による値の変動をC.V値(変動係数)で数値化した。C.V値とは次式で算出される値であり、数値のブレ具合を判断する指標として一般に利用されている。
(数6)
C.V値(変動係数)=(標準偏差/平均値)×100
【0070】
C.V値<30の場合を「変動が少ない」とし、画像の8割以上が「変動が少ない」のであればその指標は変動が少ない指標(ブレない指標)と判断した。例えば指標「面積平均」の場合、64画像中40画像がC.V値<30であったことから、40/60=63%であり、変動が大きい指標(ブレる指標)と判断した。46指標について検討したところ、変動が大きい指標(ブレる指標)は16あった(図17)。全指標について同様の検証を行い、変動が大きい指標を全て除去した。
変動の多い指標を排除した後に残った120指標を入力値とし、出力値に14日間の増殖率を用いて実施例1と同様のFNN解析を行った。その結果、高い精度で予測可能な予測モデルが複数構築され、予測に有効な指標の組合せが抽出された(図18)。図18に示した指標の組合せの中で最良のものは、1日目と3日目の楕円形度の差(Ell.formfactorStd.Dev5)、3日目の内接円の標準偏差(InnerradiusStd.Dev3)、1日目から3日目にかけての細胞数の増加率(TotalareaCount4)であった。また、4つの指標を入力値として同様にFNN解析することによって抽出された、予測に有効な指標の組合せを図19の表に示す。
【0071】
図18に示した組合せの中から最上位のものについてファジィルールを作成した(図20)。表中の各数値は、そのルールが増殖率にどれだけ影響するかを示している。数値が大きいほど増殖率を大きくするルールであると理解される。数値が最大のルールと2番目に大きなルールに注目すれば、一つ目の指標が大きく、且つ二つ目の指標が小さいときに増殖率が高くなるといえる。一方、数値が最小のルールと2番目に小さなルールに注目すれば、一つ目の指標が小さく、且つ三つ目の指標が小さいときに14日間の増殖率が低くなるといえる。このように、人間が感覚的に判断していた指標を限定された三つの形態指標の組み合わせとしてルール化でき、人の感覚に依らない安定した基準で判断、予測が可能となった。
【0072】
次に、最適な指標の組合せを用いて、新たなサンプルを用いて実際に予測させた(図21左)。その結果、高い精度で予測できることが確認された(図21右)。これにより、変動の大きな指標(ブレの大きな指標)を予め除去した上でFNN解析すれば、より精度の高い予測モデルが構築されることが示された。
【実施例3】
【0073】
<ダブリング数(残存分裂回数)を予測する予測モデルの構築>
ダブリング数、即ち「あと何回、ダブリング(分裂)可能か」を予測目標とする予測モデルの構築を行った。
1.実験手法(図22)
継代数が1〜4の上皮細胞を3プレートずつ用意した。各サンプルを培養し、分裂しなくなるまでの間、24時間毎に撮影した。培養開始から24時間目、48時間目及び96時間目の画像について画像処理し(図23、24)、227の形態指標を抽出した(図25)。具体的には、画像中の個々の細胞の面積、細胞の内部の空洞・穴の面積、細胞の周囲長、水平方向の細胞の幅、細胞の長軸長、細胞の短軸長、細胞の水平に対する角度、細胞を線と仮定したときの長軸長、細胞を線と仮定したときの短軸長、細胞の円形度、細胞の楕円形度、細胞の内接円の半径、細胞の外接円の半径、細胞の中心から全周への長さ平均、細胞を円と仮定したときの半径、細胞を球と仮定した場合の体積、細胞の長軸を軸にして短軸の周りを一回転させたときの疑似体積、細胞の短軸を軸にして長軸の周りを一回転させたときの疑似体積、細胞の面積と同じ断面積を持つ球の表面積、及び細胞単位ではなく細胞集塊単位で認識した場合における上記全項目を数値化し、画像ごとの全細胞の平均、標準偏差及び合計を算出した。また、集塊状に固まって成長した細胞(コロニー)における細胞の密度、コロニー中の細胞本体でない面積についても、画像毎に平均、標準偏差及び合計を算出した。
以上の指標を24時間目、48時間目及び96時間目の画像について算出し、計227指標を抽出した。このようにして得られた227指標を情報処理解析し、ダブリング数の予測をする予測モデルの構築と、予測に重要な指標の組み合わせの抽出を行った。
【0074】
2.画像処理
画像処理には画像処理ソフトMetamorph(Molecular Device社)を用いた。画像処理では三段階の処理(背景の補正、画像の二値化、細胞の情報を数値化)を行った(図23、24)。まず、背景におけるモヤや濃淡を検出し、これを画像中から削除した(背景の補正)。次に、残った細胞だけの画像を二値化することで、より鮮明に細胞の輪郭を浮き彫りにした(二値化)。この際、全画像中からランダムに抽出した幾つかの画像において、目視で細胞と確認した数に対して誤差が最も小さくなるように、ノイズとしてゴミを除くピクセル数を様々に検討して選択し、最適な値を閾値として細胞以外のゴミ・ノイズを除去した。その後、Metamorphソフトの特徴である細胞認識を行い、各細胞における特徴量を項目別に測定し、数値化した。
【0075】
3.FNN解析
入力値に細胞の形態に関する227指標、出力値にダブリング数の値を用いてFNN解析し、予測モデルを構築した。そして、「出力値であるダブリン数」が「実測したダブリン偶数(教師値)」に最も近いモデルを選択した。また、最適な予測モデルからファジィルールを抽出した。
その結果、以下の4指標の組み合わせ、即ち、長軸を軸とした回転体の体積の平均(指標A)、円形度の平均(指標B)、平均面積で個数換算したものの平均(指標C)、同じ面積の円を回転させた球体の体積の合計(指標D)、が得られた。抽出に成功した4指標を用いてダブリング数を予測した結果、精度の良い予測ができた(図26)。このように、予測に有効な指標の組合せを抽出できていることが確認された。
【0076】
続いて、これらの4指標とダブリング数との関係を調べるため、ファジィルールを作成した(図27)。表中の数値はそのルールがダブリング数にどれだけ影響するかを示しており、数値が大きいほどダブリング数を大きくするルールとなる。
ルール表より、指標C及びDが小さいことが品質の良い細胞の条件であり、培養途中で指標Aが大きくなり且つ指標Bが小さくなるとダブリング数が急激に低下することがわかる。また、最も数値が大きかったルールに着目すれば、指標Aが小さく、指標Bが大きく、指標Cが小さく、且つ指標Dが小さいときに、最もダブリング数が多くなることがわかる。一方、最も数値の小さかったルールに着目すれば、指標Aが大きく、指標Bが小さく、指標Cが小さく、且つ指標Dが小さいときに、最もダブリング数が少なくなることがわかる。
ルール表全体を考察すれば、品質の良い細胞の条件は、「細胞の縁の明るい部分が拡がっていないこと」、「細胞の形が丸いこと」、「コロニーの大きさがどれも等しいこと」、「コロニーが小さくまとまっていること」であるといえる。
【産業上の利用可能性】
【0077】
本発明により構築される予測モデルを利用すれば、破壊的な操作を伴うことなく、培養細胞の品質を高精度で予測可能となる。従って、本発明は培養細胞の品質管理に有用である。本発明の予測法によれば、品質を評価した細胞そのものを目的の作業に使うことができる。従って、再生医療・細胞治療では、品質評価を行いながら安定した品質で細胞を供給できる。また、薬物の毒性試験などに用いる細胞の場合には、リアルタイムで品質の変化を観察しながら効率的スクリーニングも行い得る。細胞の癌化などの検査においては、非常に簡便に低コストで品質評価(癌化の可能性など)を可能とし得る。
また、本発明によれば、品質評価の低コスト化(熟練作業者などを雇用する必要が無いこと、連続的にリアルタイム観察ができるので自動化が可能なこと、自動培養装置などのインテリジェント化が可能で工業化を促進できること、高価な検査用試薬を削減できることなど)ももたらされる。
また、本発明の予測法では細胞のリアルタイム評価も可能となる。従って、細胞を使ったスクリーニングを効率化できること、自動培養装置などを利用してリアルタイムの状況・未来のリスクや傾向に応じたインテリジェントな操作の自動化が行えること、定点観測では見つからなかった細胞機能性の解析・研究が行えることなど、様々な効果がもたらされる。
さらには、本発明によれば細胞品質評価の基準化(細胞の品質管理に有効な指標をマップ化又はルール化表示できること、どのような形態になると品質の悪化につながるか、モデル構造から数値的な指標で基準を確立できることなど)が可能となる。
本発明には、細胞操作のフランチャイズ化への実現に向けた貢献も期待される。細胞操作のフランチャイズ化が実現すれば、多数の施設・医院などで、全く同じ品質評価の基準と判断を初心者が行えるようになる。また、遠隔地の施設・医院などの品質の管理や、無人評価が可能になる。
【0078】
この発明は、上記発明の実施の形態及び実施例の説明に何ら限定されるものではない。特許請求の範囲の記載を逸脱せず、当業者が容易に想到できる範囲で種々の変形態様もこの発明に含まれる。
本明細書の中で明示した論文、公開特許公報、及び特許公報などの内容は、その全ての内容を援用によって引用することとする。
【図面の簡単な説明】
【0079】
【図1】予測モデルの構築法の具体例を示すフローチャート。
【図2】ANNの構造を示す図。
【図3】FNNの構造を示す図。
【図4】シグモイド関数を示す図。
【図5】本発明の装置のハードウェア構成の一例。主制御部10、主記憶部装置20、一時記憶装置30、入出力制御部40、入力装置50及び出力装置60が備えられる。
【図6】細胞の増殖率を予測する予測モデルの構築手法を示す図。
【図7】画像処理方法を示す図。
【図8】ノイズの除去の検討。図8の上段は、横軸にノイズ面積の閾値を、縦軸に誤差の総和を表したグラフ(左:1日目の画像、右:3日目の画像)。図8の下段は、実際の細胞数とノイズ除去後の細胞数の関係を示すグラフ。左のグラフは、閾値を36ピクセルとして1日目の画像を処理した結果である。右のグラフは、閾値を30ピクセルとして3日目の画像を処理した結果である。横軸は実際の細胞数、縦軸はノイズ除去後の細胞数である。両グラフとも、実際の細胞数とノイズ除去後の細胞数の間に良好な比例関係が認められ、適切なノイズ除去が行われたことがわかる。
【図9】FNNの構造及び処理手順を示す図。
【図10】抽出に成功した3指標(細胞の増殖率予測に有効な指標)の組合せを説明する図。
【図11】従来法(一般的な人の判断指標)による予測結果を示す図。
【図12】抽出に成功した3指標で予測した結果と、1指標のみで予測した結果の比較。
【図13】細胞の増殖率を決定するファジィルール。
【図14】増殖率が最大のサンプルのデータ(上段)及び増殖率が最小のサンプルのデータ(下段)。
【図15】構築された予測モデルを用いた解析結果を示す図。
【図16】変動の大きい指標(ノイズ)の除去の検討。
【図17】変動の大きい指標(ノイズ)の除去の検討。
【図18】120指標を用いたFNN解析によって抽出された、指標の組合せを列挙した表である(3指標の組合せによるランキング)。入力数:120項目((46−16)指標×4)。出力値:1〜14日にかけての細胞増殖率(範囲1.74〜5.88)。解析条件はCV.5分割、入力数:4、変数選択:変数増加法、評価方法:学習データの誤差の平均値(ブラインドなし)とした。表中の記号・略号は次の通りである。1:1日目の画像、3:3日目の画像、4:(3日目の値)/(1日目の値)、5:(3日目の値)−(1日目の値)、Total:合計、Average:平均、Std.Dev:標準偏差、Count:細胞数、InnerradiusS.D3:3日の内接円半径のS.D、Ell.form factorS.D:楕円形度(短軸/長軸)S.Dの増加率、Height Average:高さの平均、Length S.D:長軸の標準偏差。
【図19】120指標を用いたFNN解析によって抽出された、指標の組合せを列挙した表である(4指標の組合せによるランキング)。入力数:120項目((46−16)指標×4)。出力値:1〜14日にかけての細胞増殖率(範囲1.74〜5.88)。解析条件はCV.5分割、入力数:4、変数選択:変数増加法、評価方法:学習データの誤差の平均値(ブラインドなし)とした。表中の記号・略号は次の通りである。1:1日目の画像、3:3日目の画像、4:(3日目の値)/(1日目の値)、5:(3日目の値)−(1日目の値)、Total:合計、Average:平均、Std.Dev:標準偏差、Count:細胞数、InnerradiusS.D3:3日の内接円半径のS.D、Ell.form factorS.D:楕円形度(短軸/長軸)S.Dの増加率、Height Average:高さの平均、Length S.D:長軸の標準偏差。
【図20】細胞の増殖率を決定するファジィルール(120指標を用いたFNN解析による)。
【図21】FNN解析によって抽出された指標の組み合わせ(左)と、構築された予測モデルを用いた解析結果(右)を示す図。
【図22】ダブリング数を予測する予測モデルの構築手法を示す図。
【図23】画像解析手法を示す図。
【図24】画像解析手法を示す図。
【図25】採用した227指標を示す図。
【図26】構築された予測モデルを用いた解析結果(上)と、抽出された指標の組み合わせ(下)を示す図。
【図27】ダブリング数を決定するファジィルール。
【符号の説明】
【0080】
10 主制御部
20 主記憶装置
30 一時記憶装置
40 入出力制御部
50 入力装置
60 出力装置
【技術分野】
【0001】
本発明は、細胞の品質(増殖率や残存分裂回数など)を予測するための予測モデル(情報処理モデル)を構築する方法、予測モデルの構築用プログラム、当該プログラムを記録した記録媒体、及び予測モデルの構築用装置等に関する。
【背景技術】
【0002】
細胞の培養とは、生体(ヒト・動物・植物)の細胞を生体外において増殖させる操作であり、細胞の機能性研究以外にも、細胞を用いた医療(細胞治療・再生医療)や、細胞を利用した検査(毒性検査・癌化検査)などで必要とされる手技を言う。従来、研究で細胞を扱う際には、単一の株化した均一な細胞を扱うことが多いが、近年では治療や再生医療の研究においては、ヒト由来の個体差の大きい細胞を扱うことが多くなってきている。現状では、細胞の品質評価の基準で明確なものは存在しない。
【0003】
細胞培養において、細胞の品質(生産性・活性・コンタミネーションなど)は単一の要因ではなく、複数の要因が複雑に影響するため、複数の基礎的な手技の組み合わせでのみ定量できるものであり、操作的に煩雑であった。たとえば細胞の生産性(回収量)の定量は、培養した細胞を酵素処理などに供した後に回収し、血球計算板や、電気伝導度などを指標としたセルカウンターを用いて測定するものであり、1回の定量に数十分を要する。また、細胞の活性の定量は、産生因子の測定や可視化を、染色や指示薬などを投じて行うものであり、1回の定量に数時間を要する。細胞のコンタミネーションの定量は、細胞マーカーと呼ばれる特異的タンパク質を染色する操作や、PCR法を利用したものが多く、1回の定量に数時間かかる手技によってのみ行われる。さらに、染色の結果は数値化が難しく、感覚的に評価する場合が多い。細胞の培養操作や判断基準に関しては、Culture of animal cells -a manual of basic technique- fifth edition, Freshney RI, Wiley-liss (A John Wiley & Sons, INC., Publication), ISBN 0-471-45329-3;細胞工学別冊 目で見る実験ノートシリーズ 「バイオ実験 イラストレイテッド6 すくすく育て細胞培養」渡邉利雄著、秀潤社、ISBN 4-87962-162-5などの細胞培養の教科書に詳述されるが、すべての操作において試薬を準備する必要があるだけでなく、経験を必要とした判断が必須である。現実的には、このような教科書的な手技や手法は、そのままでは機能しないことも多く、実際の研究者は自分の細胞や施設に合わせて手技手法の最適化をする必要があった。
【0004】
また、細胞の品質評価の多くは破壊的測定であるという問題がある。即ち、測定するための細胞を試薬と混合したり、物理的に破砕したりして行う必要がある。このため、少量しか無いような細胞の測定は非常に困難であり、測定した細胞そのものを治療に用いたいと考える細胞治療・再生医療などにおいては正確な品質評価は不能であった。
さらに、これまでの品質の判定は、人間の経験によるもののみであった。多項目の品質の測定結果が存在するとき、これを総合的にどう判断するかは非画一的であり、多くの場合は医師や専門の研究者によって経験的に判断されるものであった。このような判断は非常に曖昧であるため、細胞培養には技術者が常に必要とされ、工業化やフランチャイズは困難であった。特に、細胞株のような均一系ではなく、臨床現場における患者細胞のようなヘテロジェネイシティ(不均一性)に富んだ細胞群の品質測定には、画一的な判断方法の適応が難しく、基準化も困難であった。
本願に関連する文献を以下に列挙する。
【非特許文献1】Reinhold Nafe, Kea Franz, Wolfgang Schlote, and Berthold Schneider: Clinical Cancer Research, Vol.11 2141-2148, March 15, 2005
【非特許文献2】Vladimir Kirillov, Elena Stebenyaeva, Andrey PaPlevka, and Evgeny Demidchik: MICROSCOPY RESEARCH AND TECHNIQUE 69:721-728(2006)
【発明の開示】
【発明が解決しようとする課題】
【0005】
前述のような細胞品質評価の困難性から、細胞培養に関連する医療・検査・事業は、工業化や自動化が非常に難しい。工業化・自動化が困難を極める技術は、コストが高いだけでなく、安定性・安全性が保証されない。このため、再生医療のように治療に細胞を使うような医療は言うまでもなく、細胞を使った薬剤毒性評価やスクリーニングについても実用化への途は遠い。
【0006】
ところで、細胞品質評価の難しさは三つの原因に大分できる。一つ目は、評価対象である細胞が非常に不安定かつ不均一なものであることである。即ち、同じ細胞であっても個体や由来が異なれば性質も大きく異なり、全く同じ遺伝的背景をもった同種の細胞であっても、施設での扱い方や試薬への応答が若干異なる。さらに、多くの細胞は不均一な状態で存在し、互いに相互作用することで千変万化の変化を示す。このため、ある品質を持つという状態に至る過程は複合的であり、人間の頭で整理できるような少ない因子では説明ができない。結果、たくさんの定量・検査をしないと細胞の品質を評価することができない。二つ目の原因は、評価後の細胞を利用したいと考えたとき、評価手技・技術が未発達であるということである。現在の分子生物学的な評価方法は、破壊的な評価しか行えない。即ち、測定した細胞は、死んでいるか、試薬が混在しているため、その後、治療などの本来の目的に用いることが難しい。また、品質に関して多項目の測定が必要なとき、これらの手技は煩雑で時間が非常にかかり、非効率的である。三つ目の原因は、品質の判断が画一的に行えていないということである。即ち、どんなにたくさんの細胞の品質評価を行っても、多様性のある結果をうまく数値化・基準化することができず、技術者の経験にだけ委ねている問題である。このような経験や感覚だけに頼った評価は、正確に他人に伝達することができず、より工業化を困難にしている。
そこで本発明は、細胞培養における品質を予測する情報処理モデルを提供することを課題とする。
【課題を解決するための手段】
【0007】
前述の問題を解決するためには、三つの原因に対して対策を講じる必要がある。一つ目の問題である「細胞の不均一性」は、根本的に解決することはできない。しかしながら、このような不均一性の把握は、すべての要因(特徴)を総合的に理解しようとすると不可能であるが、たくさんの要因の中から出来る限り共通性(ルール性)のある特徴の組み合わせを見つけることができれば、把握することが可能である。本発明者らは、細胞の形態に着目し、細胞の形態をあらゆる指標(数値パラメータ)へと変換し、その膨大な情報の中から人間には思いつくことが不可能である指標の組み合わせを抽出する方法を確立した。指標の組み合わせには、知識情報処理手法の一つであるファジィニューラルネットワーク(Fuzzy Neural Network)を用い、教師値となる値をできるだけ正確に予測できるようなモデルを構築し、入力値(形態に関する指標)の組み合わせを選択することに成功した。一つのモデルとして、ヒト線維芽細胞の1日目、3日目の細胞形態画像情報から、3〜4個の細胞形態の情報を組み合わせれば有効に14日後に回収できる細胞数を予測できるモデルを確立した。本発明者らの手法の比較として、従来、作業者が感覚的に利用する指標を用いて予測したところ、予測精度は良くなかった。
二つ目の問題である「現状の評価方法の不適合さ」を解消するため、本発明者らは試薬の混入や細胞の破壊を一切伴わない、細胞の画像情報だけを使う評価方法を確立した。通常、1枚の細胞の画像からは、様々な指標を得ることができる。また、細胞の品質を連続的にモニタリングすると、各指標の変化量や変化率、特徴量、主成分などをさらに抽出することができる。同じ細胞を観察し続ける必要はなく、培養環境をなるべく反映するように複数の写真を撮影することによって実現することができる。具体的には、細胞の画像を、画像解析ソフトを利用して数値化するが、その後これらの数値を統計解析・数学的変換・多変量解析することによって、市販のソフトウエアから得られる情報の数十倍のデータに置換・変換する。この情報を用いて、その後ファジィニューラルネットワークを用いたモデリングを行い、目的とする品質指標(生産性・活性・コンタミネーション)を正確に予測できる、指標の組み合わせを網羅的に探索する。このようにして得られた指標を使って構築された予測モデルを用いれば、従来の評価方法と異なり、非破壊的方法で優れた予測結果を得ることができる。
三つ目の問題である、「品質判断の非画一性」は、本発明者らの構築した情報処理モデルによって解消される。情報処理モデルとは、即ち、多くの関係性のデータを蓄積した「判断能力を持ったデータベース」である。これまで、熟練者が感覚で感じ取っていた細胞形態の指標は、どの指標の組み合わせが有用なのか決定された後に機械学習される。たくさんのデータの学習を通じ、構築した情報処理モデルは一人の専門家のように予測が行えるため、ソフトウエアとして利用すれば、初心者でも、どの施設でも同じ品質評価の判断をすることができる。さらに、本法に利用するファジィニューラルネットワークは、モデル構造をルールとして数値化することができるという特徴をもつ。即ち、ある品質を得るに至った複数の要因の組み合わせを、ルール表として示すことができる。
以上の通り、本発明者らは、「細胞形態を用いた情報処理モデル」を利用することによって上記各問題を解決することに成功した。当該成果に基づき、以下に列挙する発明が提供される。
[1]細胞の品質を予測する予測モデルを構築する方法であって、
(1)同種の細胞を培養した二つ以上のサンプルを用意するステップ、
(2)培養時間の異なる二つ以上の時点(予測時)において各サンプルの細胞を撮影し、画像を取得するステップ、
(3)ステップ(2)で取得した各画像を解析し、細胞の形態に関する二つ以上の指標について数値データを生成するステップ、
(4)予測目標の実測データをサンプル毎に用意するステップ、及び
(5)ステップ(3)で生成した数値データを入力値とし、ステップ(4)で用意した実測データを教師値としてファジィニューラルネットワーク解析し、予測に有効な指標の組合せを示すファジィルールに基づいて出力値を算出する予測モデルを構築するステップ、
を含む方法。
[2]細胞の品質が、細胞増殖率、残存分裂可能時間、残存分裂可能回数、分化度、活性度、特定の因子やタンパク質などの産生能、異常度、腫瘍化度、癌化度、又は異種細胞の混在による危険度である、[1]に記載の方法。
[3]細胞が間葉系細胞又は上皮細胞である、[1]又は[2]に記載の方法。
[4]サンプルの数が10以上である、[1]〜[3]のいずれか一項に記載の方法。
[5]予測時の数が3以上である、[1]〜[4]のいずれか一項に記載の方法。
[6]予測時の間隔が1日以上である、[1]〜[5]のいずれか一項に記載の方法。
[7]細胞の形態に関する指標の数が50以上である、[1]〜[6]のいずれか一項に記載の方法。
[8]細胞の形態に関する指標が、以下のa、b及びcの組合せで規定される指標である、[1]〜[7]のいずれか一項に記載の方法。
a:細胞の面積、細胞の内部の空洞・穴の面積、細胞の周囲長、水平方向の細胞の幅、細胞の長軸長、細胞の短軸長、細胞の水平に対する角度、細胞を線と仮定したときの長軸長、細胞を線と仮定したときの短軸長、細胞の円形度、細胞の楕円形度、細胞の内接円の半径、細胞の外接円の半径、細胞の中心から全周への長さ平均、細胞を円と仮定したときの半径、細胞を球と仮定した場合の体積、細胞の長軸を軸にして短軸の周りを一回転させたときの疑似体積、細胞の短軸を軸にして長軸の周りを一回転させたときの疑似体積、細胞の面積と同じ断面積を持つ球の表面積、及び細胞単位ではなく細胞集塊単位で認識した場合における上記全項目、並びに集塊状に固まって成長した細胞(コロニー)における細胞の密度、コロニー中の細胞本体でない面積のいずれか、
b:平均、標準偏差及び合計のいずれか、
c:特定の予測時の値、特定の予測時から次の予測時までの変化量、及び変化量の経時的変化のいずれか。
[9]ステップ(5)において二つ以上の予測モデルを構築する、[1]〜[8]のいずれか一項に記載の方法。
[10]ステップ(5)が以下のステップからなる、[1]〜[9]のいずれか一項に記載の方法、
(5−1)ステップ(3)で生成した数値データを入力値とし、ステップ(4)で用意した実測データを教師値としてファジィニューラルネットワーク解析し、二つ以上の予測モデルを構築するステップ、及び
(5−2)構築された予測モデルの中から、その出力値が、ステップ(4)で用意した実測データに最も近い予測モデルを選択するステップ、
を含む方法。
[11]
予測に有効な指標の組合せが3又は4個の指標の組合せからなる、[1]〜[10]のいずれか一項に記載の方法。
[12]ステップ(5)の前に、ステップ(3)で生成した数値データを解析し、変動の大きい数値データを与える指標を除去するステップを行う、[1]〜[11]のいずれか一項に記載の方法。
[13]細胞の品質の予測に有効な指標の組合せを得る方法であって、
(1)同種の細胞を培養した二つ以上のサンプルを用意するステップ、
(2)培養時間の異なる二つ以上の時点(予測時)において各サンプルの細胞を撮影し、画像を取得するステップ、
(3)ステップ(2)で取得した各画像を解析し、細胞の形態に関する二つ以上の指標について数値データを生成するステップ、
(4)予測目標の実測データをサンプル毎に用意するステップ、及び
(5)ステップ(3)で生成した数値データを入力値とし、ステップ(4)で用意した実測データを教師値としてファジィニューラルネットワーク解析し、予測に有効な指標の組合せを示すファジィルールに基づいて出力値を算出する予測モデルを構築するステップ、
(6)ステップ(5)で構築された予測モデルからファジィルールを抽出するステップ、
を含む方法。
[14][1]〜[12]のいずれか一項に記載の方法で構築された予測モデルを用いて細胞の品質を予測することを特徴とする、細胞の品質を予測する方法。
[15][1]〜[12]のいずれか一項に記載の方法で構築された予測モデルを用いて細胞の品質を予測する方法であって、
(1)被検細胞の撮影画像から、細胞の品質の予測に有効な指標の組合せに含まれる各指標について数値データを生成するステップ、
(2)数値データを予測モデルに入力して解析するステップ、及び
(3)算出された出力値に基づき細胞の品質を判断するステップ、
を含む方法。
[16]細胞の品質を予測する予測モデルを構築するためにコンピュータを、
培養時間の異なる二つ以上の時点(予測時)に撮影した画像の解析によって生成した、細胞の形態に関する二つ以上の指標についての数値データを入力値とし、予測目標の実測データを教師値としてファジィニューラルネットワーク解析し、予測に有効な指標の組合せを示すファジィルールに基づいて出力値を算出する予測モデルを構築するする手段、
として機能させるためのプログラム。
[17]細胞の品質を予測する予測モデルを構築するためにコンピュータを、
培養時間の異なる二つ以上の時点(予測時)に撮影した画像を解析し、細胞の形態に関する二つ以上の指標について数値データを生成する手段、及び
数値データを入力値とし、予測目標の実測データを教師値としてファジィニューラルネットワーク解析し、予測に有効な指標の組合せを示すファジィルールに基づいて出力値を算出する予測モデルを構築する手段、
として機能させるためのプログラム。
[18]画像解析により実測データを生成する手段を更に備える、[17]に記載のプログラム。
[19]ファジィニューラルネットワーク解析の前に、数値データを解析し、変動の大きい数値データを与える指標を除去する手段を更に備える、[16]〜[18]のいずれか一項に記載のプログラム。
[20][16]〜[19]のいずれか一項に記載のプログラムを記録した、コンピュータ読み取り可能な記録媒体。
[21]細胞の品質を予測する予測モデルを構築する装置であって、
培養時間の異なる二つ以上の時点(予測時)に撮影した画像の解析によって生成した、細胞の形態に関する二つ以上の指標についての数値データを入力値とし、予測目標の実測データを教師値としてファジィニューラルネットワーク解析し、予測に有効な指標の組合せを示すファジィルールに基づいて出力値を算出する予測モデルを構築するする手段、
を備えてなる装置。
[22]細胞の品質を予測する予測モデルを構築する装置であって、
培養時間の異なる二つ以上の時点(予測時)に撮影した画像を解析し、細胞の形態に関する二つ以上の指標について数値データを生成する手段、及び
数値データを入力値とし、予測目標の実測データを教師値としてファジィニューラルネットワーク解析し、予測に有効な指標の組合せを示すファジィルールに基づいて出力値を算出する予測モデルを構築する手段、
を備えてなる装置。
[23]画像解析により実測データを生成する手段を更に備える、[22]に記載の装置。
[24]ファジィニューラルネットワーク解析の前に、数値データを解析し、変動の大きい数値データを与える指標を除去する手段を更に備える、[21]〜[23]のいずれか一項に記載の装置。
【発明を実施するための最良の形態】
【0008】
1.予測モデル構築法
本発明の第1の局面は、細胞の品質を予測する予測モデルを構築する方法(予測モデル構築法)に関する。ここで「予測モデル」とは、所定の情報(入力)に基づき予測(出力)をする情報処理モデルのことをいう。本発明の予測モデル構築法によって構築される「予測モデル」は、細胞の形態に関する情報に基づいて細胞の品質を予測する。予測の対象(即ち、細胞の品質)のことを本発明では「予測目標」ともいう。
【0009】
本発明において予測目標となる「細胞の品質」は、増殖率、残存分裂可能時間、残存分裂可能回数(残存ダブリング数)、分化度、活性度、特定の因子やタンパク質などの産生能、異常度、腫瘍化度、癌化度、及び異種細胞の混在率による危険度などである。このように本発明の適用範囲は広範に及ぶものであり、その汎用性は高い。
【0010】
ここでの「増殖率」とは、基準時から所定時間経過時までの細胞数の変化率(所定時間経過後の細胞数/基準時の細胞数)である。基準時は典型的には培養開始時である。但し、これに限られるものではなく、任意の時点を基準時にすることができる。
【0011】
一般的な正常細胞は、ある特定の回数だけ分裂すると、その後分裂できなくなり、死滅する。「残存分裂可能時間」とは、分裂できなくなるまでに残された時間のことである。換言すれば、分裂能を維持できる残存時間のことである。「残存分裂可能回数(ダブリング数)」とは、残された分裂回数(あと何回分裂可能か)のことである。
【0012】
「分化度」とは、培養中に分化(例えば前駆細胞から成熟細胞への分化や、多分化能幹細胞から特定の細胞系譜への分化など)が予定された細胞がどの分化段階にあるかを示す指標である。分化度を決定するために、細胞の形態、細胞表面マーカー(タンパク質)の発現の有無又は発現量、特定の因子の産生の有無又は産生量などが利用されている。
【0013】
「活性度」とは、ある特定の因子などによって活性化された状態に変化し得る細胞の活性化の程度を表す指標である。活性度を決定するために、細胞の形態、細胞表面マーカーの発現の有無又は発現量、特定の因子の産生の有無又は産生量などが利用されている。
【0014】
「特定の因子やタンパク質などの産生能」とは、特定物質の産生の有無又は産生量によって特徴付けられる細胞の識別に利用される指標である。「特定の因子」の例として各種サイトカイン、各種ホルモンを挙げることができる。また「タンパク質」の例として、酵素、抗体を挙げることができる。
【0015】
「異常度」、「腫瘍化度」及び「癌化度」はいずれも細胞の異常な状態を表す指標であり、細胞の形態、核の形態、核型、分裂(増殖)速度、無秩序な増殖の有無、特定の腫瘍細胞によく見られるような細胞表面マーカーの発現の有無又は発現量などに基づいて決定される。
【0016】
生体から採取した細胞を培養する以上、目的の細胞と異なる細胞が混在する可能性がある。細胞製剤に代表されるように、生体への移植が予定された細胞を得る場合、混在細胞によって予想外の副作用(膿胞化、炎症、血管新生の阻害、神経伸張の阻害など)が生ずる可能性があることから、混在細胞の比率(混在率)は重要である。混在細胞が非常に少数であれば、目的の細胞が先に養分の採取することなどによって混在細胞は次第に駆逐されていくことが多いが、組織様構造を形成できるほどに混在細胞が存在する場合には上記の如き副作用の発生が懸念される。本発明では、目的の細胞と異なる細胞が混在することによる副作用ないし悪影響が生ずる可能性の度合を「異種細胞の混在による危険度」という。
【0017】
予測モデルの予測精度(予測の確度)は特に限定されない。但し、本発明の方法によれば予測精度の高い結果をもたらす予測モデルが構築される。予測モデルによる予測精度を高めるためには、サンプル数及び/又は予測時の数を増加させる、または複数の予測モデルの多数決評価を行うとよい。
【0018】
以下、図1に示す具体例を参照しながら、本発明の予測モデル構築法の各ステップを詳細に説明する。
【0019】
(1)サンプルの用意(図1のa)
本発明ではまず、同種の細胞を培養した二つ以上のサンプルを用意する。細胞の種類は特に限定されず、哺乳動物(ヒト、サル、ウシ、ウマ、ウサギ、マウス、ラット、モルモット、ハムスター等)の各種細胞、例えば心筋細胞、平滑筋細胞、脂肪細胞、線維芽細胞、骨細胞、軟骨細胞、破骨細胞、実質細胞、表皮角化細胞(ケラチノサイト)、上皮細胞(皮膚表皮細胞、角膜上皮細胞、結膜上皮細胞、口腔粘膜上皮、毛包上皮細胞、口腔粘膜上皮細胞、気道粘膜上皮細胞、腸管粘膜上皮細胞など)、内皮細胞(角膜内皮細胞、血管内皮細胞など)、神経細胞、グリア細胞、脾細胞、膵臓β細胞、メサンギウム細胞、ランゲルハンス細胞、肝細胞、又はこれらの前駆細胞、或いは間葉系幹細胞(MSC)、胚性幹細胞(ES細胞)、胚性生殖細胞(EG細胞)、又は成体幹細胞などを使用することができる。また、正常細胞の他、癌細胞など何らかの異常を来した細胞、或いはHeLa細胞、CHO細胞、Vero細胞、HEK293細胞、HepG2細胞、Cos−7細胞、NIH3T3細胞、Sf9細胞などの株化された細胞等を採用することができる。
上皮細胞や間葉系細胞などの接着性の細胞は、その二次元的な画像解析が容易であることから、本発明の方法に特に適する。
【0020】
通常、サンプル数が多いほど解析結果の精度が高まり、より優れた予測モデルの構築が可能になる。しかし、サンプル数の増加は操作の煩雑化やデータ処理量の増大を引き起こす。そこで、サンプル数を好ましくは10〜1000、更に好ましくは30〜500とする。尚、後述の実施例に示す通り、サンプル数を30にした場合であっても、優れた予測モデルを構築できることが確認された。
原則、全てのサンプルについて培養条件を同一とする。精度の良い予測を可能とする予測モデルを構築するためである。但し、播種密度についてはサンプル間で統一しても、統一しなくてもよい。播種密度を統一しない場合、播種密度の相違をも考慮した解析を行うことができる。
【0021】
(2)画像の取得(図1のa)
次に、培養時間の異なる二つ以上の時点において各サンプルの細胞を撮影し、画像を取得する。本発明では当該時点のことを「予測時」とよぶ。予測時は任意に設定可能であるが、培養開始後1時間目〜20目の間に予測時を設定するとよい。予測時の具体例を挙げると培養開始後1日目、2日目、3日目、4日目、5日目、6日目、7日目、8日目、9日目、10日、11日目、12日目、13日目、14日目、15日目、16日目、17日目、18日目、19日目、20日目である。このように日単位によるのではなく、秒単位、分単位、時間単位、又は週単位で予測時を設定してもよい。予測時が培養初期であることが好ましい。将来の細胞の品質を予測する予測モデルを構築する場合において、早い段階での予測が可能となるからである。尚、培養開始から7日目までを「培養初期」とする。
【0022】
予測時の数は二つ以上である限り、特に限定されない。予測時の数が多いほど解析結果の精度が高まり、より優れた予測モデルの構築が可能になるといえる。一方で、予測時の数の増加は操作の煩雑化やデータ処理量の増大を引き起こす。そこで、予測時の数を好ましくは2〜20、更に好ましくは2〜10、より一層好ましくは2〜5とする。また、予測時の数を増加した方が優れた予測モデルを構築できる可能性が示唆された場合には(予測時の数の増大による確度の増大)、多点の予測時(コマ送りの動画など)を、数値解析(フーリエ変換や微分)などによって2〜5の数の積算変化量の値に圧縮するとよい。尚、後述の実施例に示す通り、予測時の数を2にした場合であっても、優れた予測モデルを構築できることが確認された。
【0023】
ある予測時と次の予測時との間隔は特に限定されない。ここでの間隔の例を示せば、1〜数十秒、1分〜数十分、1時間〜数時間、1日〜数日である。具体例を示せば、第1の予測時を培養開始後1日目とし、第2の予測時を培養開始後3日目とする。ただし、3以上の予測時を設定する場合には、予測時の間隔が全て同一である必要はない。
【0024】
細胞の撮影及び画像の取得には市販の装置を使用すればよい。本発明に使用可能な装置の例として、倒立型顕微鏡Olympus series(例えばIX81。オリンパス株式会社)、顕微鏡カメラDP12(オリンパス株式会社)、顕微鏡カメラ用ソフト(DP controller。オリンパス株式会社)、Metamorph (Molecular Device社)、カメラ一体型細胞観察装置セルウオッチャー(コアフロント株式会社)を挙げることができる。
【0025】
(3)画像解析(図1のb)
次に、取得した各画像を解析し、細胞の形態に関する二つ以上の指標について数値データを生成する。画像の解析(処理)には市販の画像解析ソフトウエアを使用すればよい。本発明で使用可能な画像解析ソフトウエアの例として、Metamorph (Molecular Device社)、Image J (米National Institute of Health配布無償ソフト)、NIH Image (米National Institute of Health配布無償ソフト)を挙げることができる。
【0026】
信頼性の高い解析結果を得るためにはノイズを適切に除去することが重要である。そこで本発明の好ましい形態では、図1に示すように、ノイズ除去、形態認識、数値化という、大別して3ステップで画像解析を行う。本発明では例えば次の方法でノイズを除去する。まず、画像の二値化(例えば細胞を白、背景を黒にする)をする。続いて、ノイズの大多数は細胞に比べて遙かに小さい面積であるとの前提の下、白で表示された物体の中で一定面積よりも小さいものをノイズとみなし、それらを除去する。ノイズの除去の際には、実際の細胞数とノイズを除去した後の細胞数との差(誤差)を全サンプルについて計算し、最も誤差が少なくなる値を閾値として採用するとよい。閾値の設定を予測時毎に行うことによって、より信頼性の高い画像解析を行うことができる。
【0027】
形態認識に続く数値化では、細胞の形態に関する指標(以下、特段の説明のない限り、「指標」は「細胞の形態に関する指標」のことを指す)を数値データとして抽出する。ここでの指標として、以下のa、b及びcの組合せで規定される指標を用いることができる。
a:細胞の面積、細胞の内部の空洞・穴の面積、細胞の周囲長、水平方向の細胞の幅、細胞の長軸長、細胞の短軸長、細胞の水平に対する角度、細胞を線と仮定したときの長軸長、細胞を線と仮定したときの短軸長、細胞の円形度、細胞の楕円形度、細胞の内接円の半径、細胞の外接円の半径、細胞の中心から全周への長さ平均、細胞を円と仮定したときの半径、細胞を球と仮定した場合の体積、細胞の長軸を軸にして短軸の周りを一回転させたときの疑似体積、細胞の短軸を軸にして長軸の周りを一回転させたときの疑似体積、細胞の面積と同じ断面積を持つ球の表面積、及び細胞単位ではなく細胞集塊単位で認識した場合における上記全項目、並びに集塊状に固まって成長した細胞(コロニー)における細胞の密度、コロニー中の細胞本体でない面積のいずれか;
b:平均、標準偏差及び合計のいずれか;
c:特定の予測時の値、特定の予測時から次の予測時までの変化量、及び変化量の経時的変化のいずれか。
【0028】
bにおける「平均」とは、一つの画像に含まれる全細胞について得たaの値を細胞数で除したものである。「標準偏差」及び「合計」も同様に、一つの画像に含まれる全細胞について得たaの値を基に算出される。
また、cにおける「特定の予測時の値」は、予測時毎の値である。例えば二つの予測時(第1予測時及び第2予測時)を設定した場合、第1予測時の値と第2予測時の値が用いられることになる。一方、「特定の予測時から次の予測時までの変化量」とは、特定の予測時の値と次の予測時の値の差又は商である。二つの予測時(第1予測時及び第2予測時)を設定した場合を例にとれば、(第2予測時の値)−(第1予測時の値)、(第2予測時の値)/(第1予測時の値)が「特定の予測時から次の予測時までの変化量」に該当する。これら全てを用いることにしても、差のみ或いは商のみを用いることにしてもよい。また、「変化量の経時的変化」は、二つの変化量の差又は商として算出される。三つの予測時(第1予測時、第2予測時及び第3予測時)を設定した場合、{(第3予測時の値)−(第2予測時の値)}−{(第2予測時の値)−(第1予測時の値)}、{(第3予測時の値)−(第2予測時の値)}/{(第2予測時の値)−(第1予測時の値)}、{(第3予測時の値)/(第2予測時の値)}−{(第2予測時の値)/(第1予測時の値)}、{(第3予測時の値)/(第2予測時の値)}/{(第2予測時の値)/(第1予測時の値)}が「変化量の経時的変化」に該当する。これら全てを用いることにしても、この中から選択される一又は二以上の値を用いることにしてもよい。
尚、すべての予測時の値をフーリエ変換・微分するなどして積算変化量を一つ以上の圧縮された数値に変換し、これを利用してもよい。
【0029】
ここで、指標の具体例を示す。aとして面積及び楕円形度を採用し、bとして平均を採用し、cとして特定の予測時の値、及び特定の予測時から次の予測時までの変化量を採用し、予測時(第1予測時及び第2予測時)を二つとした場合には、以下に示す合計8個(2×1×4)の指標が用いられることになる。
(1)第1予測時の面積の平均値、(2)第3予測時の面積の平均値、(3)第3予測時の面積の平均値から第1予測時の面積の平均値を引いた値、(4)第3予測時の面積の平均値を第1予測時の面積の平均値で除した値、(5)第1予測時の楕円形度の平均値、(6)第3予測時の楕円形度の平均値、(7)第3予測時の楕円形度の平均値から第1予測時の楕円形度の平均値を引いた値、(8)第3予測時の楕円形度の平均値を第1予測時の楕円形度の平均値で除した値
このように、指標の数はa、b及びcの数と測定時の数に依存する。
【0030】
ファジィニューラルネット解析の精度を高めるためには、数値データの数は多い方がよい。従って、数値データ化可能な指標をできるだけ多く抽出するとよい。指標の数は例えば10〜1000である。好ましくは50以上の指標を用いる。
【0031】
(4)実測データの用意(図1のa)
このステップでは、予測目標となる実測データをサンプル毎に用意する。実測データは後のファジィニューラルネット解析で教師値(目的の出力値)として利用される。「実測データ」とは、予測目標に応じて各サンプルを実際に測定・解析することによって取得される、細胞の品質を表す数値データである。例えばステップ(3)と同様に画像解析によって実測データを得ることができる。但し、必要な実測データが得られる限り、測定・解析の手段は特に問わない。
例えば、予測目標が「培養開始から所定時間経過後までの増殖率」であれば、所定時間経過後のサンプルの細胞数と、培養開始時の細胞数を測定し、次式によって「実測データ」を得ることができる。
(数1)
増殖率=(所定時間経過後のサンプルの細胞数)/(培養開始時の細胞数)
【0032】
培養開始時を基準にするのではなく、培養開始後のある時点を基準とし、そこから所定時間経過後までの増殖率を「予測目標」としてもよい。その場合は次式によって「実測データ」を得ることができる。
(数2)
増殖率=(所定時間経過後のサンプルの細胞数)/(培養開始後のある時点の細胞数)
【0033】
他の例として、予測目標が「残存分裂時間」であれば、細胞が分裂しなくなるまで培養を継続し、培養開始時からの所要時間を計測する。そして次式によって「実測データ」を得る。
(数3)
残存分裂時間=所要時間−(培養開始から予測時までの経過時間)
【0034】
尚、細胞が分裂しなくなるまでの所要時間を、予測時を基準に算出した場合は、「所要時間」=「実測データ」となる。
【0035】
更に他の例として、予測目標が「残存分裂回数(ダブリング数)」であれば、細胞が分裂しなくなるまで培養を継続することによって総分裂回数を測定する。併せて予測時までの分裂回数を測定する。そして次式によって「実測データ」を得る。尚、分裂回数は細胞数を基に算出することができる。
(数4)
残存分裂回数=総分裂回数−(予測時までの分裂回数)
【0036】
(5)予測モデル(FNNモデル)の構築(図1のA)
次に、ステップ(3)で生成した数値データを入力値として、ステップ(4)で用意した実測データを教師値としてファジィニューラルネットワーク(FNN)解析を行い、予測モデルを構築する。このFNN解析においては、予測に有効な指標の組合せを示すファジィルールに基づいて出力値を算出する予測モデルが構築される。出力値が実測データに近い程、即ち出力値と実測データとの誤差が小さいほど、精度のよい予測モデルとなる。
後述のようにFNNモデルはファジィルールを抽出できるという特徴を持つ。本発明によって構築される予測モデルからは、予測に有効な指標の組合せを示すファジィルールを抽出できることになる。
【0037】
ここで「ファジィニューラルネットワーク」とは、人工ニューラルネットワーク(Artificial Neural Network; ANN)とファジィ推論を組み合わせた方法をいい、ファジイ推論の欠点であるメンバーシップ関数の決定を人間に頼るという部分を回避すべく、ANNをファジィ推論に組み込み、その自動決定を行う方法である。学習機械のひとつであるANN(図2)は、生体の脳における神経回路網を数学的にモデル化したものであり、以下の特徴を持つ。ANNにおける学習は、目的の出力値(教師値)をもつ学習用のデータ(入力値; X)を用いて、バックプロパゲーション法(Back propagation; BP法)により教師値と出力値(Y)の誤差が小さくなるように、図2におけるノード(○で記載)とノード(○で記載)をつなぐ回路における結合荷重を変え、その出力値が教師値に近づくようにモデルを構築する過程であり、このBP法を用いれば、ANNは学習により自動的に知識を獲得することができる。そして、最終的に学習に用いていないデータを入力することにより、そのモデルの汎用性を評価することができる。従来、メンバーシップ関数の決定は、人間の感覚に頼っていたが、上で述べたようなANNをファジイ推論に組み込むことで自動的なメンバーシップ関数の同定が可能になる。これがFNNである。ANNと同様に、BP法を用いることによりネットワークに与えられた入出力関係を、結合荷重を変化させることで自動的に同定しモデル化することができる。FNNは、学習後のモデルを解析することでファジィ推論のように人間に理解しやすい言語的なルール(一例として図3の右下の吹き出しを参照)として知識を獲得できるという特徴をもっている。つまり、FNNは、その構造、特徴から、細胞の形態的特徴を表した数値のような変数の組み合わせにおける最適なファジィ推論の組み合わせを自動決定し、予測目標に関する推定と、予測に有効な指標の組合せを示すルールの生成を同時に行うことができる。
【0038】
FNNの構造は入力層、シグモイド関数に含まれるパラメータWc、Wgを決定するメンバーシップ関数部分(前件部)、Wfを決定し、入力と出力の関係をルールとして取り出すことが可能なファジィルール部分(後件部)、出力層の4層から成り立っている(図3)。FNNのモデル構造を決定する結合荷重にはWc、Wg、Wfがある。結合荷重Wcは、メンバーシップ関数に用いられるシグモイド関数の中心位置、Wgは中心位置での傾きを決定する(図4)。モデル内では、入力値がファジィ関数により、人間の感覚的に近い柔軟性を持って表現される(一例として図3の左下の吹き出しを参照)。結合荷重Wfは各ファジイ領域の推定結果に対する寄与を表しており、Wfよりファジィルールを導くことができる。即ち、モデル内の構造はあとから解読でき、ルールとして書き起こすことができる(一例として図3の右下の吹き出しを参照)。
【0039】
FNN解析におけるファジィルールの作成には結合荷重のひとつであるWf値が用いられる。Wf値が正の値で大きいと、そのユニットは「予測に有効である」と判定されることに対する寄与が大きく、そのルールに当てはまった指標は「有効である」と判断される。Wf値が負の値で小さいと、そのユニットは「予測に有効でない」と判定されることに対する寄与が大きく、そのルールに当てはまった指標は「有効でない」と判断される。
【0040】
FNN解析によって二つ以上の予測モデルを構築することにしてもよい。即ち、本発明の一態様では、ステップ(5)として次のステップ(5−1)及び(5−2)が行われる。
(5−1)ステップ(3)で生成した数値データを入力値とし、ステップ(4)で用意した実測データを教師値としてファジィニューラルネットワーク解析し、二つ以上の予測モデルを構築するステップ。
(5−2)構築された予測モデルの中から、その出力値が、ステップ(4)で用意した実測データに最も近い予測モデルを選択するステップ。
【0041】
(6)ノイズの除去(図1のc)
本発明の一態様では、FNN解析(即ちステップ(5))の前にノイズの除去を行う。ここでのノイズの除去は、変動の大きな指標(ブレの大きな指標)を除去することをいう。ノイズの除去は後述の実施例2に示すようなCV値(変動係数)を利用して行うことができる。統計解析によってノイズの除去を行うこともできる。二つ以上の手法を組み合わせてノイズの除去を行うとよい。
FNN解析の前にノイズの除去を行って入力値を選定することにより、構築される予測モデルの予測精度を高めることができる。
【0042】
2.細胞の品質の予測に有効な指標の組合せを得る方法
以上の構築法によれば、細胞の品質を予測する予測モデルが構築されるとともに、細胞の品質の予測に有効な指標の組合せがファジィルールとして得られる。そこで本発明の第2の局面は、次のステップを含むことを特徴とする、細胞の品質の予測に有効な指標の組合せを得る方法を提供する。
(1)同種の細胞を培養した二つ以上のサンプルを用意するステップ、
(2)培養時間の異なる二つ以上の時点(予測時)において各サンプルの細胞を撮影し、画像を取得するステップ、
(3)ステップ(2)で取得した各画像を解析し、細胞の形態に関する二つ以上の指標について数値データを生成するステップ;
(4)予測目標の実測データをサンプル毎に用意するステップ;
(5)ステップ(3)で生成した数値データを入力値とし、ステップ(4)で用意した実測データを教師値としてファジィニューラルネットワーク解析し、予測に有効な指標の組合せを示すファジィルールに基づいて出力値を算出する予測モデルを構築するステップ;及び
(6)ステップ(5)で構築された予測モデルからファジィルールを抽出するステップ。
【0043】
ここでのステップ(1)〜(5)については、予測モデルの構築法の欄で説明した通りである。この方法においても、予測モデルの構築法と同様に、FNN解析(即ちステップ(5))の前にノイズを除去するステップを行うことが好ましい。
【0044】
3.細胞の品質の予測
本発明の構築法で構築された予測モデルは、細胞の品質の予測に利用される。そこで本発明は第3の局面として、本発明の構築法で構築された予測モデルを用いて細胞の品質を予測することを特徴とする、細胞の品質を予測する方法も提供する。本発明の予測法では次のステップが実施される。
(1)被検細胞の撮影画像から、細胞の品質の予測に有効な指標の組合せに含まれる各指標について数値データを生成するステップ;
(2)数値データを予測モデルに入力して解析するステップ;及び
(3)算出された出力値に基づき細胞の品質を判断するステップ。
【0045】
ステップ(1)における「被検細胞」とは、その品質を調べることが予測目標となる細胞である。被検細胞には、予測モデルの構築の際にサンプルとして利用された細胞と同種の細胞が用いられる。例えば、ヒト線維芽細胞をサンプルとして予測モデルを構築した場合には、被検細胞もヒト線維芽細胞である。
【0046】
4.予測モデル構築用プログラム、記録媒体、及び装置
本発明は他の局面として、本発明の構築法をコンピュータに実行させるためのプログラムを提供する。本発明のプログラムは、細胞の品質を予測する予測モデルを構築するためにコンピュータを、(a)培養時間の異なる二つ以上の時点(予測時)に撮影した画像の解析によって生成した、細胞の形態に関する二つ以上の指標についての数値データを入力値とし、予測目標の実測データを教師値としてファジィニューラルネットワーク解析し、予測に有効な指標の組合せを示すファジィルールに基づいて出力値を算出する予測モデルを構築するする手段、として機能させる。この手段(a)は、本発明の構築法のステップ(5)に対応する。
【0047】
本発明の構築法のステップ(2)及び(3)に対応する処理も併せて実行されるようにプログラムを構成してもよい。即ち、この態様のプログラムはコンピュータを、(i)培養時間の異なる二つ以上の時点(予測時)に撮影した画像を解析し、細胞の形態に関する二つ以上の指標について数値データを生成する手段、及び(ii)数値データを入力値とし、予測目標の実測データを教師値としてファジィニューラルネットワーク解析し、予測に有効な指標の組合せを示すファジィルールに基づいて出力値を算出する予測モデルを構築する手段、として機能させる。
【0048】
また、本発明の構築法のステップ(4)に対応する処理も併せて実行されるようにプログラムを構成してもよい。即ち、この態様のプログラムはコンピュータを、画像解析により実測データを生成する手段としても機能させる。当該手段による処理は、例えば、上記手段(i)による処理の後に行われる。
【0049】
さらに、本発明の構築法のステップ(6)に対応する処理も併せて実行されるようにプログラムを構成してもよい。即ち、この態様のプログラムはコンピュータを、ファジィニューラルネットワーク解析の前に、数値データを解析し、変動の大きい数値データを与える指標を除去する手段としても機能させる。
【0050】
更に本発明は、本発明のプログラムを読み取り可能に記録した記録媒体を提供する。本発明の記録媒体は汎用又は専用コンピュータが読み取り可能なものであって、そこには本発明のプログラムが記録されている。本発明の記録媒体は可搬型であっても固定型であってもよい。記録媒体の形態の具体例として、CD-ROM、フレキシブルディスク(FD)、DVD、ハードディスク、半導体メモリを挙げることができる。
【0051】
更に本発明は、本発明の構築法を実行する装置、即ち細胞の品質を予測する予測モデルを構築する装置を提供する。本発明の装置の一態様は、培養時間の異なる二つ以上の時点(予測時)に撮影した画像の解析によって生成した、細胞の形態に関する二つ以上の指標についての数値データを入力値とし、予測目標の実測データを教師値としてファジィニューラルネットワーク解析し、予測に有効な指標の組合せを示すファジィルールに基づいて出力値を算出する予測モデルを構築する手段を備える。本発明の装置の他の態様は、培養時間の異なる二つ以上の時点(予測時)に撮影した画像を解析し、細胞の形態に関する二つ以上の指標について数値データを生成する手段、及び数値データを入力値とし、予測目標の実測データを教師値としてファジィニューラルネットワーク解析し、予測に有効な指標の組合せを示すファジィルールに基づいて出力値を算出する予測モデルを構築する手段を備える。
画像解析により実測データを生成する手段、及び/又はファジィニューラルネットワーク解析の前に、数値データを解析し、変動の大きい数値データを与える指標を除去する手段を更に備える装置としてもよい。
【0052】
本発明の装置の好ましい態様は、本発明のプログラムがハードディスク装置等の記憶装置に格納されたコンピュータである。本発明の設計装置のハードウェア構成の一例を図5に示す。この構成例では、装置全体を統括的に制御する主制御部10と、主制御部10に接続された主記憶部装置20及び一時記憶装置30と、入出力制御部40を介して主制御部10に接続される入力装置50及び出力装置60とが備えられる。
主制御部10はOS(Operating System)等の制御プログラム、各種の処理手順を規定したプログラム、及び所要データを格納するための内部メモリを有する。
主記憶装置20には、本発明による処理を実行するためのプログラムが格納される。本発明による処理が二つ以上のプログラムによって実行されることにしてもよい。主記憶装置20には上記プログラムの他、各種のデータベース、テーブル、ファイル等が必要に応じて格納される。
一時記憶装置30は、入力されたデータ、および算出された数値データ等を一時的に記憶する。
入力装置50は例えばキーボードやマウス等のポインティングデバイスからなる。また、出力装置60は例えばディスプレイ・モニター、プリンターなどからなる。
【0053】
、
図1及び5を参照しながら、上記ハードウェア構成の設計装置による処理を説明する。尚、この例では、FNN解析の前にノイズを除去(不要な指標を除去)することにしている。
まず、キーボードなどの入力装置50を介して、実験データ及び画像解析結果が入力されると主制御部10は、主記憶装置20に格納された所定のプログラムの指令に従い、ノイズの除去を行う(ステップc)。その後、データ処理(数値整理、統計解析、データ化)を実行する(ステップd)。次に、生成した数値データを入力値として詠み込む(ステップe)。続いて、更にノイズを除去した後、データ分割及び整理を行う(ステップf)。生成したデータは一時記憶装置30に格納される(ステップg)。
次に主制御部10は、主記憶装置20に格納されたプログラムの指令に従い一時記憶手段30に格納された数値データを呼び出し、当該数値データを入力変数としてファジィニューラルネットワーク解析(FNN解析)を行い、予測モデルを構築する。FNN解析は大別して変数選択機能(A1)とモデル構築機能(A2)から構成される。変数選択機能においては、モデル荷重の初期化、学習(モデル構築)、評価(評価基準値の算出)、評価値に沿ったモデル荷重の修正、最終予測モデル(荷重データの保存)、及びモデル構築データ以外のデータの評価が順に実行される。この一連の処理は最適な条件が設定されるまで繰り返される。一方、モデル構築機能においては、モデル荷重の初期化、学習(モデル構築)、評価(評価基準値の算出)、評価値に沿ったモデル荷重の修正、最終予測モデル(荷重データの保存)、及びモデル構築データ以外のデータの評価が順に実行される。この一例の処理は最適な条件が設定されるまで繰り返され、最終的に予測モデルが構築される。
【0054】
以上のようにして構築された予測モデルのデータは一時記憶装置30に格納される。続いて主制御部10は、主記憶装置20に格納されたプログラムの指令に従い一時記憶装置30に格納された予測モデルのデータを呼び出し、当該予測モデルに基づいて、細胞の品質を予測する一又は二以上のルールを抽出する。抽出されたルールは主記憶装置20又は一時記憶装置30に格納されるとともに、自動的又はオペレーターの要求に応じて出力装置60に出力される。尚、主記憶装置20又は一時記憶装置30には上記ルールに関するデータファイルの他、必要に応じて、予測モデルを表すデータファイル、予測モデルの正確性に関するファイルが蓄積される。これらのファイルは自動的又はオペレーターの要求に応じて出力装置60に出力される。
【実施例1】
【0055】
<細胞の増殖率を予測する予測モデルの構築>
現在、患者の組織から得られる細胞を大量に培養して治療に用いる再生医療が注目されている。治療日までに必要な量の細胞を回収するためには、培養中に増殖のし易さや細胞種間のコンタミネーションを起こしていないかなどといった細胞の品質を管理していく必要がある。そこで、培養初期における予測に基づいてその後の培養を自動で管理する技術の開発を目指し、予測に重要な指標の組み合わせを探索した。
【0056】
1.実験手法(図6)
患者10人から採取してきた繊維芽細胞を、1人につき3サンプル用意し、計30サンプルを実験に使用した。各サンプルを14日間培養し、その間毎日写真撮影した。得られた画像のうち、1日目のものと3日目のものを画像処理し、数値化できる形態指標を可能な限り抽出した。具体的には、細胞の面積、細胞の内部の空洞・穴の面積、細胞の周囲長、水平方向の細胞の幅、細胞の長軸長、細胞の短軸長、細胞の水平に対する角度、細胞を線と仮定したときの長軸長、細胞を線と仮定したときの短軸長、細胞の円形度、細胞の楕円形度、細胞の内接円の半径、細胞の外接円の半径、細胞の中心から全周への長さ平均、細胞を円と仮定したときの半径、細胞を球と仮定した場合の体積、細胞の長軸を軸にして短軸の周りを一回転させたときの疑似体積、細胞の短軸を軸にして長軸の周りを一回転させたときの疑似体積、細胞の面積と同じ断面積を持つ球の表面積、及び細胞単位ではなく細胞集塊単位で認識した場合における上記全項目を数値化し、画像ごとの全細胞の平均及び標準偏差を算出した。平均及び標準偏差のそれぞれについて、1日目の値、3日目の値、さらには1日目〜3日目の値の増加率(3日目の値/1日目の値)及び差(3日目の値/1日目の値)を計算し、計180の指標とした。このようにして得られた180指標を情報処理解析し、14日後の増殖率の予測する予測モデルの構築と、予測に重要な指標の組み合わせを抽出した。
【0057】
2.画像処理(図7、8)
画像処理には画像処理ソフトMetamorph(Molecular Device社)を用いた。細胞と背景の識別には、細胞以外の部分で細胞と認識されてしまうノイズの発生が問題となる。そこで、ノイズを除去するためにまず、細胞を白に背景を黒に変換する二値化を行った。続いて、ノイズの大多数は細胞に比べて遙かに小さい面積であることから、白い物体の中である一定面積より小さいものをノイズとみなし、それらを除去する方法を考案した。このようにすれば、1細胞ごとの形態観測を行いすべての細胞の形を数値化することが出来る。
【0058】
最適なノイズ除去をもたらす閾値を求めるべく、以下の検討をした(図8)。ノイズの面積の閾値を26ピクセル〜40ピクセルの間で設定し、実際の細胞数とノイズ除去後の細胞数との差を誤差として計算した。30サンプルすべてについて当該計算を行った場合に最も誤差が少なくなる閾値を採用した。尚、画像中の細胞数を目測することによって実際の細胞数を求めた。図8の上段のグラフは、1日目の画像と3日目の画像それぞれについて、横軸にノイズ面積の閾値を、縦軸に誤差の総和を表したものである。1日目の画像では36ピクセルの閾値で、3日目の画像では30ピクセルの閾値で最も誤差が小さくなることがわかる。そこで、この閾値を用いて1日目の各画像及び3日目の各画像を処理したところ、ノイズの除去が良好に行われることが示された(図8の下段)。このように、1日目の画像と3日目の画像のそれぞれについて、ノイズ除去のための閾値を一つに設定出来たことによって、画像処理をほとんど自動で行うことが可能となり、処理時間が短縮化された。
【0059】
3.FNN解析
本実験ではファジィニューラルネットワーク(FNN)を解析に用いた。FNNは手本となる入力値と出力値(教師値)を与えることによって、その間にある関係を学習し、複雑な関係をモデル化することができる(図9)。また、入力と出力の関係をファジィルールとして自動抽出することができるという特徴も有する。
入力値に細胞の形態に関する180指標、出力値に14日間の増殖率の値を用いてモデル構築を行った(図9)。そして、「出力値である14日間の増殖率」が「実測した増殖率(教師値)」に最も近いモデルを選択し、そのモデルに関して増殖率予測を行うとともに、ファジィルールも抽出した(図9)。
【0060】
FNN解析の結果、14日間の増殖率の予測に有効な指標の組合せとして、以下の3指標の組み合わせが得られた(図10)。一つ目の指標は、楕円形度の標準偏差の1日目から3日目にかけた増加率である。楕円形度は、長軸を短軸で除した値である。当該指標の値は、増加率が大きい場合、1日目から3日目にかけてばらつきが大きくなる。二つ目の指標は、1日目の穴の面積の平均である。この指標は、核の存在で生じる凹凸が検出されるものであり、細胞の広がり具合に影響する。広がりすぎて厚みのない細胞では核の凹凸が強調され画像的な穴が生じる。一方、広がらず厚みのある正常な紡錘形の細胞では核の位置の凹凸があまり検出されない。三つ目の指標は、1日目の円形度の平均である。円形度は次式で算出される。円に近いほど円形度が1に近くなる。
(数5)
円形度=4πA/P2(但し、A:面積、P:周囲長、0<円形度≦1)
【0061】
4.予測モデルの検証
(1)従来法との比較
以上の通り、細胞形態を表す3指標の組合せが選択された。従来、人が判断する場合は一般的に、培養初期の増殖具合と細胞の播種密度に基づいて感覚的に増殖率を予測していた。このような従来の方法と本法を比較するため、増殖具合を示す指標「1日目から3日目にかけての細胞数の増加率」又は播種密度を示す指標「1日目の面積の合計」のみを用いてFNN解析した。結果を図11に示す。左のグラフは、「1日目から3日目にかけての細胞数の増加率」を指標として予測した場合の結果である。一方、右のグラフは「1日目の面積の合計」を指標として予測した場合の結果である。尚、両グラフとも、横軸は実測した14日間の増殖率、縦軸は予測した14日間の増殖率である。これらのグラフからわかるように、精度の良い予測はできなかった。つまり、人の判断だけでは予測が不可能だということが示された。
【0062】
(2)指標の数と解析精度の関係
抽出に成功した3指標を用いて14日間の増殖率を予測した。図12の左のグラフに示すように、増殖率の良否に関係なく、精度の良い予測が出来ている。この結果より、予測に有効な指標の組合せを抽出できていることが確認された。
次に、これらの3指標をすべて用いる必要があるのかどうかを検討した。具体的には、「楕円形度の標準偏差の1日目から3日目にかけた増加率」という一つの指標だけで予測を行った。その結果、増殖率が良いか悪いかの違いは予測できるものの、増殖率が2.5倍または5倍前後の値でしか予測せず、十分な予測ができないことが明らかとなった(図12の右のグラフ)。その他の指標についても一つの指標のみで予測したが、同様に十分な予測はできなかった(結果を図示せず)。また、二つの指標の組合せによる予測も試みたが、3指標を用いた予測に比べて精度が低かった(結果を図示せず)。
以上の通り、3指標を組み合わせて用いることによって初めて高い精度の予測が可能であることが確認された。
【0063】
(3)ファジィルールの抽出
続いて、抽出された3指標と増殖率との関係を調べるため、ファジィルールを作成した(図13)。表中の各数値は、そのルールが増殖率にどれだけ影響するかを示している。数値が大きいほど増殖率を大きくするルールであると理解される。
最も数値が大きかったルールに注目すれば、一つ目の指標が大きく、二つ目の指標が小さく、且つ三つ目の指標が大きいときに14日間の増殖率が最大になることがわかる。一方、最も数値の小さかったルールに注目すれば、一つ目の指標が小さく、二つ目の指標が大きく、且つ三つ目の指標が小さいときに14日間の増殖率が最小になることがわかる。この正反対のルールでは、3指標の大少もそれぞれ逆の関係になる。
【0064】
実際に増殖率が最大であったサンプルの画像と、増殖率が最小であったサンプルの画像を図14に示す。これらの画像を見ると、図13に示したファジィルールに感覚的に当てはまることがわかる。このように、人間が感覚的に判断していた指標を限定された三つの形態指標の組み合わせとしてルール化でき、人の感覚に依らない安定した基準で判断、予測が可能となった。
【0065】
(4)新たなサンプルを用いた予測
最後に、3指標を組み合わせた予測モデルの有用性を確認する実験を行った。予測モデルの構築の際に使用していない新たなサンプル(8人から採取した計24サンプル)を用意し、予測モデルを使用したFNN解析によって14日間の増殖率を予測した(図15の上段)。結果を図15の下段のグラフに示す。線で囲んだサンプルを除いて、精度の高い予測ができていることがわかる。尚、全サンプルについて精度の高い予測ができないサンプルが発生した一因は、患者の細胞には非常に大きな個体差が存在し、今回の予測モデルではすべての患者の特徴を反映するにはデータサンプルが足りなかったことと考えられる。
【0066】
5.まとめ
画像解析とFNN解析を組み合わせたことによって、細胞の増殖率を精度良く予測できる予測モデルの構築に成功した。また、増殖率の予測に有効な3指標の組合せを発見し、それをルール化することにも成功した。さらには、画像処理方法の確立により、短時間での解析が可能となった。
本法によれば高精度で細胞の品質予測を行える。将来の増殖率が大きいと予測された場合はそのまま培養を続けることにし、小さい場合は廃棄、継代培養する、または添加因子を加えるなどといった対策をとる等、細胞培養法の効率化・最適化のために本法が活用されることが期待される。
【実施例2】
【0067】
<ノイズ除去によるFNNモデルの最適化>
予測精度を向上することを目指し、以下の検討を行った。
【0068】
1.実験手法
実施例1と同様に、線維芽細胞のサンプル(10人、計30サンプル)を用意し、細胞の形態に関する指標(180指標)を抽出した。
【0069】
2.画像処理
画像処理には画像処理ソフトMetamorph(Molecular Device社)を用いた。各画像について細胞を白に背景を黒に変換する二値化を行った。その際、実施例1での検討結果に基づきノイズを除去し、すべての細胞の形を数値化した。
次に、変動(ブレ)のある変数を除去することを検討した(図16)。まず、閾値による値の変動をC.V値(変動係数)で数値化した。C.V値とは次式で算出される値であり、数値のブレ具合を判断する指標として一般に利用されている。
(数6)
C.V値(変動係数)=(標準偏差/平均値)×100
【0070】
C.V値<30の場合を「変動が少ない」とし、画像の8割以上が「変動が少ない」のであればその指標は変動が少ない指標(ブレない指標)と判断した。例えば指標「面積平均」の場合、64画像中40画像がC.V値<30であったことから、40/60=63%であり、変動が大きい指標(ブレる指標)と判断した。46指標について検討したところ、変動が大きい指標(ブレる指標)は16あった(図17)。全指標について同様の検証を行い、変動が大きい指標を全て除去した。
変動の多い指標を排除した後に残った120指標を入力値とし、出力値に14日間の増殖率を用いて実施例1と同様のFNN解析を行った。その結果、高い精度で予測可能な予測モデルが複数構築され、予測に有効な指標の組合せが抽出された(図18)。図18に示した指標の組合せの中で最良のものは、1日目と3日目の楕円形度の差(Ell.formfactorStd.Dev5)、3日目の内接円の標準偏差(InnerradiusStd.Dev3)、1日目から3日目にかけての細胞数の増加率(TotalareaCount4)であった。また、4つの指標を入力値として同様にFNN解析することによって抽出された、予測に有効な指標の組合せを図19の表に示す。
【0071】
図18に示した組合せの中から最上位のものについてファジィルールを作成した(図20)。表中の各数値は、そのルールが増殖率にどれだけ影響するかを示している。数値が大きいほど増殖率を大きくするルールであると理解される。数値が最大のルールと2番目に大きなルールに注目すれば、一つ目の指標が大きく、且つ二つ目の指標が小さいときに増殖率が高くなるといえる。一方、数値が最小のルールと2番目に小さなルールに注目すれば、一つ目の指標が小さく、且つ三つ目の指標が小さいときに14日間の増殖率が低くなるといえる。このように、人間が感覚的に判断していた指標を限定された三つの形態指標の組み合わせとしてルール化でき、人の感覚に依らない安定した基準で判断、予測が可能となった。
【0072】
次に、最適な指標の組合せを用いて、新たなサンプルを用いて実際に予測させた(図21左)。その結果、高い精度で予測できることが確認された(図21右)。これにより、変動の大きな指標(ブレの大きな指標)を予め除去した上でFNN解析すれば、より精度の高い予測モデルが構築されることが示された。
【実施例3】
【0073】
<ダブリング数(残存分裂回数)を予測する予測モデルの構築>
ダブリング数、即ち「あと何回、ダブリング(分裂)可能か」を予測目標とする予測モデルの構築を行った。
1.実験手法(図22)
継代数が1〜4の上皮細胞を3プレートずつ用意した。各サンプルを培養し、分裂しなくなるまでの間、24時間毎に撮影した。培養開始から24時間目、48時間目及び96時間目の画像について画像処理し(図23、24)、227の形態指標を抽出した(図25)。具体的には、画像中の個々の細胞の面積、細胞の内部の空洞・穴の面積、細胞の周囲長、水平方向の細胞の幅、細胞の長軸長、細胞の短軸長、細胞の水平に対する角度、細胞を線と仮定したときの長軸長、細胞を線と仮定したときの短軸長、細胞の円形度、細胞の楕円形度、細胞の内接円の半径、細胞の外接円の半径、細胞の中心から全周への長さ平均、細胞を円と仮定したときの半径、細胞を球と仮定した場合の体積、細胞の長軸を軸にして短軸の周りを一回転させたときの疑似体積、細胞の短軸を軸にして長軸の周りを一回転させたときの疑似体積、細胞の面積と同じ断面積を持つ球の表面積、及び細胞単位ではなく細胞集塊単位で認識した場合における上記全項目を数値化し、画像ごとの全細胞の平均、標準偏差及び合計を算出した。また、集塊状に固まって成長した細胞(コロニー)における細胞の密度、コロニー中の細胞本体でない面積についても、画像毎に平均、標準偏差及び合計を算出した。
以上の指標を24時間目、48時間目及び96時間目の画像について算出し、計227指標を抽出した。このようにして得られた227指標を情報処理解析し、ダブリング数の予測をする予測モデルの構築と、予測に重要な指標の組み合わせの抽出を行った。
【0074】
2.画像処理
画像処理には画像処理ソフトMetamorph(Molecular Device社)を用いた。画像処理では三段階の処理(背景の補正、画像の二値化、細胞の情報を数値化)を行った(図23、24)。まず、背景におけるモヤや濃淡を検出し、これを画像中から削除した(背景の補正)。次に、残った細胞だけの画像を二値化することで、より鮮明に細胞の輪郭を浮き彫りにした(二値化)。この際、全画像中からランダムに抽出した幾つかの画像において、目視で細胞と確認した数に対して誤差が最も小さくなるように、ノイズとしてゴミを除くピクセル数を様々に検討して選択し、最適な値を閾値として細胞以外のゴミ・ノイズを除去した。その後、Metamorphソフトの特徴である細胞認識を行い、各細胞における特徴量を項目別に測定し、数値化した。
【0075】
3.FNN解析
入力値に細胞の形態に関する227指標、出力値にダブリング数の値を用いてFNN解析し、予測モデルを構築した。そして、「出力値であるダブリン数」が「実測したダブリン偶数(教師値)」に最も近いモデルを選択した。また、最適な予測モデルからファジィルールを抽出した。
その結果、以下の4指標の組み合わせ、即ち、長軸を軸とした回転体の体積の平均(指標A)、円形度の平均(指標B)、平均面積で個数換算したものの平均(指標C)、同じ面積の円を回転させた球体の体積の合計(指標D)、が得られた。抽出に成功した4指標を用いてダブリング数を予測した結果、精度の良い予測ができた(図26)。このように、予測に有効な指標の組合せを抽出できていることが確認された。
【0076】
続いて、これらの4指標とダブリング数との関係を調べるため、ファジィルールを作成した(図27)。表中の数値はそのルールがダブリング数にどれだけ影響するかを示しており、数値が大きいほどダブリング数を大きくするルールとなる。
ルール表より、指標C及びDが小さいことが品質の良い細胞の条件であり、培養途中で指標Aが大きくなり且つ指標Bが小さくなるとダブリング数が急激に低下することがわかる。また、最も数値が大きかったルールに着目すれば、指標Aが小さく、指標Bが大きく、指標Cが小さく、且つ指標Dが小さいときに、最もダブリング数が多くなることがわかる。一方、最も数値の小さかったルールに着目すれば、指標Aが大きく、指標Bが小さく、指標Cが小さく、且つ指標Dが小さいときに、最もダブリング数が少なくなることがわかる。
ルール表全体を考察すれば、品質の良い細胞の条件は、「細胞の縁の明るい部分が拡がっていないこと」、「細胞の形が丸いこと」、「コロニーの大きさがどれも等しいこと」、「コロニーが小さくまとまっていること」であるといえる。
【産業上の利用可能性】
【0077】
本発明により構築される予測モデルを利用すれば、破壊的な操作を伴うことなく、培養細胞の品質を高精度で予測可能となる。従って、本発明は培養細胞の品質管理に有用である。本発明の予測法によれば、品質を評価した細胞そのものを目的の作業に使うことができる。従って、再生医療・細胞治療では、品質評価を行いながら安定した品質で細胞を供給できる。また、薬物の毒性試験などに用いる細胞の場合には、リアルタイムで品質の変化を観察しながら効率的スクリーニングも行い得る。細胞の癌化などの検査においては、非常に簡便に低コストで品質評価(癌化の可能性など)を可能とし得る。
また、本発明によれば、品質評価の低コスト化(熟練作業者などを雇用する必要が無いこと、連続的にリアルタイム観察ができるので自動化が可能なこと、自動培養装置などのインテリジェント化が可能で工業化を促進できること、高価な検査用試薬を削減できることなど)ももたらされる。
また、本発明の予測法では細胞のリアルタイム評価も可能となる。従って、細胞を使ったスクリーニングを効率化できること、自動培養装置などを利用してリアルタイムの状況・未来のリスクや傾向に応じたインテリジェントな操作の自動化が行えること、定点観測では見つからなかった細胞機能性の解析・研究が行えることなど、様々な効果がもたらされる。
さらには、本発明によれば細胞品質評価の基準化(細胞の品質管理に有効な指標をマップ化又はルール化表示できること、どのような形態になると品質の悪化につながるか、モデル構造から数値的な指標で基準を確立できることなど)が可能となる。
本発明には、細胞操作のフランチャイズ化への実現に向けた貢献も期待される。細胞操作のフランチャイズ化が実現すれば、多数の施設・医院などで、全く同じ品質評価の基準と判断を初心者が行えるようになる。また、遠隔地の施設・医院などの品質の管理や、無人評価が可能になる。
【0078】
この発明は、上記発明の実施の形態及び実施例の説明に何ら限定されるものではない。特許請求の範囲の記載を逸脱せず、当業者が容易に想到できる範囲で種々の変形態様もこの発明に含まれる。
本明細書の中で明示した論文、公開特許公報、及び特許公報などの内容は、その全ての内容を援用によって引用することとする。
【図面の簡単な説明】
【0079】
【図1】予測モデルの構築法の具体例を示すフローチャート。
【図2】ANNの構造を示す図。
【図3】FNNの構造を示す図。
【図4】シグモイド関数を示す図。
【図5】本発明の装置のハードウェア構成の一例。主制御部10、主記憶部装置20、一時記憶装置30、入出力制御部40、入力装置50及び出力装置60が備えられる。
【図6】細胞の増殖率を予測する予測モデルの構築手法を示す図。
【図7】画像処理方法を示す図。
【図8】ノイズの除去の検討。図8の上段は、横軸にノイズ面積の閾値を、縦軸に誤差の総和を表したグラフ(左:1日目の画像、右:3日目の画像)。図8の下段は、実際の細胞数とノイズ除去後の細胞数の関係を示すグラフ。左のグラフは、閾値を36ピクセルとして1日目の画像を処理した結果である。右のグラフは、閾値を30ピクセルとして3日目の画像を処理した結果である。横軸は実際の細胞数、縦軸はノイズ除去後の細胞数である。両グラフとも、実際の細胞数とノイズ除去後の細胞数の間に良好な比例関係が認められ、適切なノイズ除去が行われたことがわかる。
【図9】FNNの構造及び処理手順を示す図。
【図10】抽出に成功した3指標(細胞の増殖率予測に有効な指標)の組合せを説明する図。
【図11】従来法(一般的な人の判断指標)による予測結果を示す図。
【図12】抽出に成功した3指標で予測した結果と、1指標のみで予測した結果の比較。
【図13】細胞の増殖率を決定するファジィルール。
【図14】増殖率が最大のサンプルのデータ(上段)及び増殖率が最小のサンプルのデータ(下段)。
【図15】構築された予測モデルを用いた解析結果を示す図。
【図16】変動の大きい指標(ノイズ)の除去の検討。
【図17】変動の大きい指標(ノイズ)の除去の検討。
【図18】120指標を用いたFNN解析によって抽出された、指標の組合せを列挙した表である(3指標の組合せによるランキング)。入力数:120項目((46−16)指標×4)。出力値:1〜14日にかけての細胞増殖率(範囲1.74〜5.88)。解析条件はCV.5分割、入力数:4、変数選択:変数増加法、評価方法:学習データの誤差の平均値(ブラインドなし)とした。表中の記号・略号は次の通りである。1:1日目の画像、3:3日目の画像、4:(3日目の値)/(1日目の値)、5:(3日目の値)−(1日目の値)、Total:合計、Average:平均、Std.Dev:標準偏差、Count:細胞数、InnerradiusS.D3:3日の内接円半径のS.D、Ell.form factorS.D:楕円形度(短軸/長軸)S.Dの増加率、Height Average:高さの平均、Length S.D:長軸の標準偏差。
【図19】120指標を用いたFNN解析によって抽出された、指標の組合せを列挙した表である(4指標の組合せによるランキング)。入力数:120項目((46−16)指標×4)。出力値:1〜14日にかけての細胞増殖率(範囲1.74〜5.88)。解析条件はCV.5分割、入力数:4、変数選択:変数増加法、評価方法:学習データの誤差の平均値(ブラインドなし)とした。表中の記号・略号は次の通りである。1:1日目の画像、3:3日目の画像、4:(3日目の値)/(1日目の値)、5:(3日目の値)−(1日目の値)、Total:合計、Average:平均、Std.Dev:標準偏差、Count:細胞数、InnerradiusS.D3:3日の内接円半径のS.D、Ell.form factorS.D:楕円形度(短軸/長軸)S.Dの増加率、Height Average:高さの平均、Length S.D:長軸の標準偏差。
【図20】細胞の増殖率を決定するファジィルール(120指標を用いたFNN解析による)。
【図21】FNN解析によって抽出された指標の組み合わせ(左)と、構築された予測モデルを用いた解析結果(右)を示す図。
【図22】ダブリング数を予測する予測モデルの構築手法を示す図。
【図23】画像解析手法を示す図。
【図24】画像解析手法を示す図。
【図25】採用した227指標を示す図。
【図26】構築された予測モデルを用いた解析結果(上)と、抽出された指標の組み合わせ(下)を示す図。
【図27】ダブリング数を決定するファジィルール。
【符号の説明】
【0080】
10 主制御部
20 主記憶装置
30 一時記憶装置
40 入出力制御部
50 入力装置
60 出力装置
【特許請求の範囲】
【請求項1】
細胞の品質を予測する予測モデルを構築する方法であって、
(1)同種の細胞を培養した二つ以上のサンプルを用意するステップ、
(2)培養時間の異なる二つ以上の時点(予測時)において各サンプルの細胞を撮影し、画像を取得するステップ、
(3)ステップ(2)で取得した各画像を解析し、細胞の形態に関する二つ以上の指標について数値データを生成するステップ、
(4)予測目標の実測データをサンプル毎に用意するステップ、及び
(5)ステップ(3)で生成した数値データを入力値とし、ステップ(4)で用意した実測データを教師値としてファジィニューラルネットワーク解析し、予測に有効な指標の組合せを示すファジィルールに基づいて出力値を算出する予測モデルを構築するステップ、
を含む方法。
【請求項2】
細胞の品質が、細胞増殖率、残存分裂可能時間、残存分裂可能回数、分化度、活性度、特定の因子やタンパク質などの産生能、異常度、腫瘍化度、癌化率、又は異種細胞の混在による危険度である、請求項1に記載の方法。
【請求項3】
細胞が間葉系細胞又は上皮細胞である、請求項1又は2に記載の方法。
【請求項4】
サンプルの数が10以上である、請求項1〜3のいずれか一項に記載の方法。
【請求項5】
予測時の数が3以上である、請求項1〜4のいずれか一項に記載の方法。
【請求項6】
予測時の間隔が1日以上である、請求項1〜5のいずれか一項に記載の方法。
【請求項7】
細胞の形態に関する指標の数が50以上である、請求項1〜6のいずれか一項に記載の方法。
【請求項8】
細胞の形態に関する指標が、以下のa、b及びcの組合せで規定される指標である、請求項1〜7のいずれか一項に記載の方法。
a:細胞の面積、細胞の内部の空洞・穴の面積、細胞の周囲長、水平方向の細胞の幅、細胞の長軸長、細胞の短軸長、細胞の水平に対する角度、細胞を線と仮定したときの長軸長、細胞を線と仮定したときの短軸長、細胞の円形度、細胞の楕円形度、細胞の内接円の半径、細胞の外接円の半径、細胞の中心から全周への長さ平均、細胞を円と仮定したときの半径、細胞を球と仮定した場合の体積、細胞の長軸を軸にして短軸の周りを一回転させたときの疑似体積、細胞の短軸を軸にして長軸の周りを一回転させたときの疑似体積、細胞の面積と同じ断面積を持つ球の表面積、及び細胞単位ではなく細胞集塊単位で認識した場合における上記全項目、並びに集塊状に固まって成長した細胞(コロニー)における細胞の密度、コロニー中の細胞本体でない面積のいずれか、
b:平均、標準偏差及び合計のいずれか、
c:特定の予測時の値、特定の予測時から次の予測時までの変化量、及び変化量の経時的変化のいずれか。
【請求項9】
ステップ(5)において二つ以上の予測モデルを構築する、請求項1〜8のいずれか一項に記載の方法。
【請求項10】
ステップ(5)が以下のステップからなる、請求項1〜9のいずれか一項に記載の方法、
(5−1)ステップ(3)で生成した数値データを入力値とし、ステップ(4)で用意した実測データを教師値としてファジィニューラルネットワーク解析し、二つ以上の予測モデルを構築するステップ、及び
(5−2)構築された予測モデルの中から、その出力値が、ステップ(4)で用意した実測データに最も近い予測モデルを選択するステップ、
を含む方法。
【請求項11】
予測に有効な指標の組合せが3又は4個の指標の組合せからなる、請求項1〜10のいずれか一項に記載の方法。
【請求項12】
ステップ(5)の前に、ステップ(3)で生成した数値データを解析し、変動の大きい数値データを与える指標を除去するステップを行う、請求項1〜11のいずれか一項に記載の方法。
【請求項13】
細胞の品質の予測に有効な指標の組合せを得る方法であって、
(1)同種の細胞を培養した二つ以上のサンプルを用意するステップ、
(2)培養時間の異なる二つ以上の時点(予測時)において各サンプルの細胞を撮影し、画像を取得するステップ、
(3)ステップ(2)で取得した各画像を解析し、細胞の形態に関する二つ以上の指標について数値データを生成するステップ、
(4)予測目標の実測データをサンプル毎に用意するステップ、及び
(5)ステップ(3)で生成した数値データを入力値とし、ステップ(4)で用意した実測データを教師値としてファジィニューラルネットワーク解析し、予測に有効な指標の組合せを示すファジィルールに基づいて出力値を算出する予測モデルを構築するステップ、
(6)ステップ(5)で構築された予測モデルからファジィルールを抽出するステップ、
を含む方法。
【請求項14】
請求項1〜12のいずれか一項に記載の方法で構築された予測モデルを用いて細胞の品質を予測することを特徴とする、細胞の品質を予測する方法。
【請求項15】
請求項1〜12のいずれか一項に記載の方法で構築された予測モデルを用いて細胞の品質を予測する方法であって、
(1)被検細胞の撮影画像から、細胞の品質の予測に有効な指標の組合せに含まれる各指標について数値データを生成するステップ、
(2)数値データを予測モデルに入力して解析するステップ、及び
(3)算出された出力値に基づき細胞の品質を判断するステップ、
を含む方法。
【請求項16】
細胞の品質を予測する予測モデルを構築するためにコンピュータを、
培養時間の異なる二つ以上の時点(予測時)に撮影した画像の解析によって生成した、細胞の形態に関する二つ以上の指標についての数値データを入力値とし、予測目標の実測データを教師値としてファジィニューラルネットワーク解析し、予測に有効な指標の組合せを示すファジィルールに基づいて出力値を算出する予測モデルを構築するする手段、
として機能させるためのプログラム。
【請求項17】
細胞の品質を予測する予測モデルを構築するためにコンピュータを、
培養時間の異なる二つ以上の時点(予測時)に撮影した画像を解析し、細胞の形態に関する二つ以上の指標について数値データを生成する手段、及び
数値データを入力値とし、予測目標の実測データを教師値としてファジィニューラルネットワーク解析し、予測に有効な指標の組合せを示すファジィルールに基づいて出力値を算出する予測モデルを構築する手段、
として機能させるためのプログラム。
【請求項18】
画像解析により実測データを生成する手段を更に備える、請求項17に記載のプログラム。
【請求項19】
ファジィニューラルネットワーク解析の前に、数値データを解析し、変動の大きい数値データを与える指標を除去する手段を更に備える、請求項16〜18のいずれか一項に記載のプログラム。
【請求項20】
請求項16〜19のいずれか一項に記載のプログラムを記録した、コンピュータ読み取り可能な記録媒体。
【請求項21】
細胞の品質を予測する予測モデルを構築する装置であって、
培養時間の異なる二つ以上の時点(予測時)に撮影した画像の解析によって生成した、細胞の形態に関する二つ以上の指標についての数値データを入力値とし、予測目標の実測データを教師値としてファジィニューラルネットワーク解析し、予測に有効な指標の組合せを示すファジィルールに基づいて出力値を算出する予測モデルを構築するする手段、
を備えてなる装置。
【請求項22】
細胞の品質を予測する予測モデルを構築する装置であって、
培養時間の異なる二つ以上の時点(予測時)に撮影した画像を解析し、細胞の形態に関する二つ以上の指標について数値データを生成する手段、及び
数値データを入力値とし、予測目標の実測データを教師値としてファジィニューラルネットワーク解析し、予測に有効な指標の組合せを示すファジィルールに基づいて出力値を算出する予測モデルを構築する手段、
を備えてなる装置。
【請求項23】
画像解析により実測データを生成する手段を更に備える、請求項22に記載の装置。
【請求項24】
ファジィニューラルネットワーク解析の前に、数値データを解析し、変動の大きい数値データを与える指標を除去する手段を更に備える、請求項21〜23のいずれか一項に記載の装置。
【請求項1】
細胞の品質を予測する予測モデルを構築する方法であって、
(1)同種の細胞を培養した二つ以上のサンプルを用意するステップ、
(2)培養時間の異なる二つ以上の時点(予測時)において各サンプルの細胞を撮影し、画像を取得するステップ、
(3)ステップ(2)で取得した各画像を解析し、細胞の形態に関する二つ以上の指標について数値データを生成するステップ、
(4)予測目標の実測データをサンプル毎に用意するステップ、及び
(5)ステップ(3)で生成した数値データを入力値とし、ステップ(4)で用意した実測データを教師値としてファジィニューラルネットワーク解析し、予測に有効な指標の組合せを示すファジィルールに基づいて出力値を算出する予測モデルを構築するステップ、
を含む方法。
【請求項2】
細胞の品質が、細胞増殖率、残存分裂可能時間、残存分裂可能回数、分化度、活性度、特定の因子やタンパク質などの産生能、異常度、腫瘍化度、癌化率、又は異種細胞の混在による危険度である、請求項1に記載の方法。
【請求項3】
細胞が間葉系細胞又は上皮細胞である、請求項1又は2に記載の方法。
【請求項4】
サンプルの数が10以上である、請求項1〜3のいずれか一項に記載の方法。
【請求項5】
予測時の数が3以上である、請求項1〜4のいずれか一項に記載の方法。
【請求項6】
予測時の間隔が1日以上である、請求項1〜5のいずれか一項に記載の方法。
【請求項7】
細胞の形態に関する指標の数が50以上である、請求項1〜6のいずれか一項に記載の方法。
【請求項8】
細胞の形態に関する指標が、以下のa、b及びcの組合せで規定される指標である、請求項1〜7のいずれか一項に記載の方法。
a:細胞の面積、細胞の内部の空洞・穴の面積、細胞の周囲長、水平方向の細胞の幅、細胞の長軸長、細胞の短軸長、細胞の水平に対する角度、細胞を線と仮定したときの長軸長、細胞を線と仮定したときの短軸長、細胞の円形度、細胞の楕円形度、細胞の内接円の半径、細胞の外接円の半径、細胞の中心から全周への長さ平均、細胞を円と仮定したときの半径、細胞を球と仮定した場合の体積、細胞の長軸を軸にして短軸の周りを一回転させたときの疑似体積、細胞の短軸を軸にして長軸の周りを一回転させたときの疑似体積、細胞の面積と同じ断面積を持つ球の表面積、及び細胞単位ではなく細胞集塊単位で認識した場合における上記全項目、並びに集塊状に固まって成長した細胞(コロニー)における細胞の密度、コロニー中の細胞本体でない面積のいずれか、
b:平均、標準偏差及び合計のいずれか、
c:特定の予測時の値、特定の予測時から次の予測時までの変化量、及び変化量の経時的変化のいずれか。
【請求項9】
ステップ(5)において二つ以上の予測モデルを構築する、請求項1〜8のいずれか一項に記載の方法。
【請求項10】
ステップ(5)が以下のステップからなる、請求項1〜9のいずれか一項に記載の方法、
(5−1)ステップ(3)で生成した数値データを入力値とし、ステップ(4)で用意した実測データを教師値としてファジィニューラルネットワーク解析し、二つ以上の予測モデルを構築するステップ、及び
(5−2)構築された予測モデルの中から、その出力値が、ステップ(4)で用意した実測データに最も近い予測モデルを選択するステップ、
を含む方法。
【請求項11】
予測に有効な指標の組合せが3又は4個の指標の組合せからなる、請求項1〜10のいずれか一項に記載の方法。
【請求項12】
ステップ(5)の前に、ステップ(3)で生成した数値データを解析し、変動の大きい数値データを与える指標を除去するステップを行う、請求項1〜11のいずれか一項に記載の方法。
【請求項13】
細胞の品質の予測に有効な指標の組合せを得る方法であって、
(1)同種の細胞を培養した二つ以上のサンプルを用意するステップ、
(2)培養時間の異なる二つ以上の時点(予測時)において各サンプルの細胞を撮影し、画像を取得するステップ、
(3)ステップ(2)で取得した各画像を解析し、細胞の形態に関する二つ以上の指標について数値データを生成するステップ、
(4)予測目標の実測データをサンプル毎に用意するステップ、及び
(5)ステップ(3)で生成した数値データを入力値とし、ステップ(4)で用意した実測データを教師値としてファジィニューラルネットワーク解析し、予測に有効な指標の組合せを示すファジィルールに基づいて出力値を算出する予測モデルを構築するステップ、
(6)ステップ(5)で構築された予測モデルからファジィルールを抽出するステップ、
を含む方法。
【請求項14】
請求項1〜12のいずれか一項に記載の方法で構築された予測モデルを用いて細胞の品質を予測することを特徴とする、細胞の品質を予測する方法。
【請求項15】
請求項1〜12のいずれか一項に記載の方法で構築された予測モデルを用いて細胞の品質を予測する方法であって、
(1)被検細胞の撮影画像から、細胞の品質の予測に有効な指標の組合せに含まれる各指標について数値データを生成するステップ、
(2)数値データを予測モデルに入力して解析するステップ、及び
(3)算出された出力値に基づき細胞の品質を判断するステップ、
を含む方法。
【請求項16】
細胞の品質を予測する予測モデルを構築するためにコンピュータを、
培養時間の異なる二つ以上の時点(予測時)に撮影した画像の解析によって生成した、細胞の形態に関する二つ以上の指標についての数値データを入力値とし、予測目標の実測データを教師値としてファジィニューラルネットワーク解析し、予測に有効な指標の組合せを示すファジィルールに基づいて出力値を算出する予測モデルを構築するする手段、
として機能させるためのプログラム。
【請求項17】
細胞の品質を予測する予測モデルを構築するためにコンピュータを、
培養時間の異なる二つ以上の時点(予測時)に撮影した画像を解析し、細胞の形態に関する二つ以上の指標について数値データを生成する手段、及び
数値データを入力値とし、予測目標の実測データを教師値としてファジィニューラルネットワーク解析し、予測に有効な指標の組合せを示すファジィルールに基づいて出力値を算出する予測モデルを構築する手段、
として機能させるためのプログラム。
【請求項18】
画像解析により実測データを生成する手段を更に備える、請求項17に記載のプログラム。
【請求項19】
ファジィニューラルネットワーク解析の前に、数値データを解析し、変動の大きい数値データを与える指標を除去する手段を更に備える、請求項16〜18のいずれか一項に記載のプログラム。
【請求項20】
請求項16〜19のいずれか一項に記載のプログラムを記録した、コンピュータ読み取り可能な記録媒体。
【請求項21】
細胞の品質を予測する予測モデルを構築する装置であって、
培養時間の異なる二つ以上の時点(予測時)に撮影した画像の解析によって生成した、細胞の形態に関する二つ以上の指標についての数値データを入力値とし、予測目標の実測データを教師値としてファジィニューラルネットワーク解析し、予測に有効な指標の組合せを示すファジィルールに基づいて出力値を算出する予測モデルを構築するする手段、
を備えてなる装置。
【請求項22】
細胞の品質を予測する予測モデルを構築する装置であって、
培養時間の異なる二つ以上の時点(予測時)に撮影した画像を解析し、細胞の形態に関する二つ以上の指標について数値データを生成する手段、及び
数値データを入力値とし、予測目標の実測データを教師値としてファジィニューラルネットワーク解析し、予測に有効な指標の組合せを示すファジィルールに基づいて出力値を算出する予測モデルを構築する手段、
を備えてなる装置。
【請求項23】
画像解析により実測データを生成する手段を更に備える、請求項22に記載の装置。
【請求項24】
ファジィニューラルネットワーク解析の前に、数値データを解析し、変動の大きい数値データを与える指標を除去する手段を更に備える、請求項21〜23のいずれか一項に記載の装置。
【図1】
【図2】
【図3】
【図4】
【図5】
【図8】
【図9】
【図12】
【図13】
【図15】
【図17】
【図18】
【図19】
【図20】
【図21】
【図26】
【図6】
【図7】
【図10】
【図11】
【図14】
【図16】
【図22】
【図23】
【図24】
【図25】
【図27】
【図2】
【図3】
【図4】
【図5】
【図8】
【図9】
【図12】
【図13】
【図15】
【図17】
【図18】
【図19】
【図20】
【図21】
【図26】
【図6】
【図7】
【図10】
【図11】
【図14】
【図16】
【図22】
【図23】
【図24】
【図25】
【図27】
【公開番号】特開2009−44974(P2009−44974A)
【公開日】平成21年3月5日(2009.3.5)
【国際特許分類】
【出願番号】特願2007−212116(P2007−212116)
【出願日】平成19年8月16日(2007.8.16)
【新規性喪失の例外の表示】特許法第30条第1項適用申請有り 掲載アドレス:http://www.jstage.jst.go.jp/browse/scej/2007/0/_contents/‐char/ja/ 掲載日 :平成19年2月19日
【出願人】(504139662)国立大学法人名古屋大学 (996)
【Fターム(参考)】
【公開日】平成21年3月5日(2009.3.5)
【国際特許分類】
【出願日】平成19年8月16日(2007.8.16)
【新規性喪失の例外の表示】特許法第30条第1項適用申請有り 掲載アドレス:http://www.jstage.jst.go.jp/browse/scej/2007/0/_contents/‐char/ja/ 掲載日 :平成19年2月19日
【出願人】(504139662)国立大学法人名古屋大学 (996)
【Fターム(参考)】
[ Back to top ]