説明

遺伝子発現量解析方法、遺伝子発現量解析プログラム及び遺伝子発現量解析装置

【課題】精度を向上し得る遺伝子発現量解析方法、遺伝子発現量解析プログラム及び遺伝子発現量会席装置を提案する。
【解決手段】標的細胞における複数の標的遺伝子に対する測定時間ごとの発現量を取得し、標的遺伝子ごとに、各時間の発現量のなかで最大の発現量と、最小の発現量とを抽出し、各時間での最大の発現量をもつ遺伝子数の分布と、各時間での最小の発現量をもつ遺伝子数の分布との相関係数を、該相関係数に対して与えられる閾値と比較する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、バイオアッセイ用の基盤などを用いて得られた遺伝子発現量に係る技術分野に属するものである。
【背景技術】
【0002】
従来、設計された複数のDNAプローブと、サンプル細胞から抽出されたmRNAを逆転写酵素で変換したcDNAとの相補鎖の形成量を蛍光強度により測定し、当該測定結果からサンプル細胞に発現している遺伝子発現量を検出する技術がある。
【0003】
この遺伝子発現量は、抽出対象のサンプル細胞に対する外部ストレスや、該サンプル細胞からmRNAを抽出するときの条件又は技量の相違等の外的要因によって変化するものである。したがって、遺伝子発現量自体に信頼性があるか否かについては重要な関心ごとになる。
【0004】
一般には、遺伝子発現量の経時的変位を解析する場合、増加対象となる遺伝子発現量や、高い値をもつ遺伝子発現量が着目される一方、減少対象となる遺伝子や、低い値をもつ遺伝子発現量は破棄される(例えば非特許文献1参照)。
【非特許文献1】Ido Amit, Ami Citri,Tal Shay,他、A module of negativefeedback regulators defines growth factor signaling、NATURE GENETICS、VOLUME39,NUMBER4,APRIL,2007、p.503-512
【発明の開示】
【発明が解決しようとする課題】
【0005】
しかしながら、破棄対象である減少対象の遺伝子発現量や、低い値をもつ遺伝子発現量も生物学的に精査する上では重要な要素である。したがって、一般に破棄対象とされる低域部分の遺伝子発現量の信頼性の有無を判断することができれば、遺伝子発現量の解析する上での精度の向上を期待できる。
【0006】
本発明は以上の点を考慮してなされたもので、精度を向上し得る遺伝子発現量解析方法、遺伝子発現量解析プログラム及び遺伝子発現量解析装置を提案しようとするものである。
【課題を解決するための手段】
【0007】
かかる課題を解決するため本発明は、遺伝子発現量解析方法であって、標的細胞における複数の標的遺伝子に対する測定時間ごとの発現量を取得する取得ステップと、標的遺伝子ごとに、各測定時間の発現量のなかで最大の発現量と、最小の発現量とを抽出する抽出ステップと、各測定時間での最大の発現量をもつ遺伝子の個数分布と、各測定時間での最小の発現量をもつ遺伝子の個数分布との相関係数を算出する算出ステップと、相関係数を、該相関係数に対して与えられる閾値と比較する比較ステップとを経る。
【0008】
また本発明は、遺伝子発現量解析プログラムであって、記憶手段に対して、標的細胞における複数の標的遺伝子に対する測定時間ごとの発現量を示すデータを記憶することを実行させ、演算手段に対して、標的遺伝子ごとに、各測定時間の発現量のなかで最大の発現量と、最小の発現量とを抽出すること、各測定時間での最大の発現量をもつ遺伝子の個数分布と、各測定時間での最小の発現量をもつ遺伝子の個数分布との相関係数を算出すること、演算手段に対して、相関係数を、該相関係数に対して与えられる閾値と比較することを実行させる。
【0009】
また本発明は、遺伝子発現量解析装置であって、標的細胞における複数の標的遺伝子に対する測定時間ごとの発現量を取得する取得手段と、標的遺伝子ごとに、各測定時間の発現量のなかで最大の発現量と、最小の発現量とを抽出し、各測定時間での最大の発現量をもつ遺伝子の個数分布と、各測定時間での最小の発現量をもつ遺伝子の個数分布との相関係数を算出する算出手段と、相関係数を、該相関係数に対して与えられる閾値と比較する比較手段とをもつ。
【発明の効果】
【0010】
出願人は、細胞に対する遺伝子発現量のうち、ある測定時刻で発現量が最小になる遺伝子と、同時刻に発現量が最大になる遺伝子とが測定時間ごとによい相関を呈していることを発見した。これは、細胞内に存する物質は一定に保とうとすることに起因して、遺伝子発現量の総量としてもおおよそ一定となることによるものと考えられる。
【0011】
したがって、本発明により算出される相関係数は、標的細胞に対する外部ストレスの条件や、該標的細胞からmRNAを抽出するときの条件又は技量の相違などを要因とする変位の影響が小さいほど、高い値を呈する。本発明は、この相関係数を、該相関係数に対して与えられる閾値と比較するので、一般に信頼性があるとされる増加傾向あるいは高い値の遺伝子群だけでなく、一般に信頼性に疑問が残るとされる減少傾向あるいは低い値の遺伝子群をも含めて、当該遺伝子発現量に対する信頼性の有無を高い精度で判断することができる。
【0012】
これに加えて、本発明は、一般に信頼性に疑問が残るとされる減少傾向あるいは低い値の遺伝子群の遺伝子発現量に信頼性がある否かの判断ができるため、当該遺伝子発現量から従来に比してより多面的に網羅解析を行うことが可能となる。
【発明を実施するための最良の形態】
【0013】
以下図面について本発明の一実施の形態を詳述する。
【0014】
(1)測定システムの全体構成
図1において、本実施の形態による測定システム1の全体構成を示す。この測定システム1は、蛍光強度読取装置3及び遺伝子発現量解析装置4を含む構成でなる。
【0015】
蛍光強度測定装置3は、測定ステージを有し、該測定ステージには核酸チップCPがセットされる。核酸チップCPは、標的細胞における全遺伝子に対応する核酸プローブが配される基盤である。
【0016】
この核酸チップCPでは、例えば図2に示すように、核酸プローブに(長波線で示す部分)対して、標的生物の細胞から抽出され、標識物質(黒丸で示す部分)を付加された標的核酸(短波線で示す部分)が与えられ、相補鎖の形成反応(以下、これをハイブリダイゼーションとも呼ぶ)が行われる。
【0017】
核酸プローブは、一般には、特定の遺伝子における全塩基配列に対となるヌクレオチドではなく、当該遺伝子において特異的とされる複数の塩基配列部分にそれぞれ対となるヌクレオチド断片(以下、これをプローブセットとも呼ぶ)としてデザインされる。また、各プローブセットに対するコントロールもデザインされる。プローブセットとコントロールとは、対ごとに、核酸チップCPに割り当てられた所定の領域に配列される。ちなみに、プローブ断片は、具体的には、18〜60[mer]程度のDNA(deoxyribonucleic acid) 断片、cDNA(complementary DNA) 断片又はPNA(peptide nucleic acid)などが適用される。
【0018】
一方、標的核酸は、核酸プローブとのハイブリダイゼーション対象とされる1本鎖のヌクレオチドである。一般に、標的核酸は、mRNA(pre-mRNAを含む)又はその断片そのものが用いられるのではなく、該mRNA又はその断片を逆転写酵素により変換したものが用いられる。
【0019】
他方、標識物質は、一般に、ビオチンまたはFITC(fluorescein isothiocyanate)等の蛍光色素とされるが、これに限定されるものではなく、例えば放射性同位元素等としてもよい。
【0020】
蛍光強度測定装置3(図1)は、測定指令が与えられた場合、測定ステージにセットされる核酸チップCPに対して、標的核酸に付加される標識物質の励起光を照射する。核酸チップCPに配される各遺伝子に対応する核酸プローブが標的核酸と相補鎖を形成している場合、該標的核酸に付加された標識物質が励起光により発光する。この発光量は、標的核酸と核酸プローブとの相補鎖の形成量と相関があり、該核酸プローブと相補鎖が形成される標的核酸の量が多いほど発光量が強くなる。
【0021】
また蛍光強度測定装置3は、励起光を照射した後に核酸プローブ及びコントロールでの発光量を読み取り、読み取った発光量EMのデータ(以下、これを蛍光強度データと呼ぶ)を出力するようになされている。
【0022】
遺伝子検定装置4は、例えば図3に示すように、継代した標的細胞から所定期間ごとに抽出される標的核酸と、同一の製品番号でなる別の核酸チップCPの核酸プローブとのハイブリダイゼーション結果から、読取時間t(mは自然数)ごとに標的生物における細胞での遺伝子G(nは自然数)の発現量GEを取得する。
【0023】
そして遺伝子発現量解析装置4は、遺伝子発現量GEから、当該遺伝子発現量に対する信頼の程度を示す値(以下、これを信頼指数とも呼ぶ)を算出し、この算出結果が信頼指数に対して与えられる閾値以上となる場合、このとき取得した遺伝子発現量GEを有用な情報として取り扱うようになされている。
【0024】
(2)遺伝子発現量解析装置の回路構成
次に、遺伝子発現量解析装置4の構成について説明する。この遺伝子発現量解析装置4は、図4に示すように、該遺伝子発現量解析装置4全体の制御を司るCPU(Central Processing Unit)10に対して各種ハードウェアを接続することにより構成される。
【0025】
具体的には、例えば、ROM(Read Only Memory)11、CPU10のワークメモリとなるRAM(Random Access Memory)12、操作部13、記憶部14、インターフェース15及び表示部16がバス17を介して接続される。
【0026】
ROM11には、遺伝子発現解析処理を実行するためのプログラム(以下、これを遺伝子発現解析プログラムとも呼ぶ)が格納され、またインターフェイス15は、蛍光強度測定装置3に対して有線又は無線を通じてアクセス可能とされる。
【0027】
CPU10は、ROM11に格納された遺伝子発現解析プログラムをRAM12に展開した場合、該遺伝子発現解析プログラムに基づいて記憶部14、インターフェース15及び表示部16を適宜制御し、遺伝子発現解析処理を実行するようになされている。
【0028】
(3)遺伝子発現解析プログラムに基づくCPUの処理内容
遺伝子発現解析プログラムをRAMに展開したCPU10は、機能的には、図4に示したように、蛍光強度取得部21、発現量演算部22、信頼指数算出部23及び解析部24の各部に分類することができる。
【0029】
蛍光強度取得部21は、操作部13から、核酸チップCPに対する蛍光強度の読取要求を待ち受け、該読取要求を受けた場合、インターフェース15を用いて、該インターフェース15に接続される蛍光強度読取装置3に対して読取要求する。
【0030】
また蛍光強度取得部21は、読取要求の応答として、蛍光強度読取装置3から蛍光強度を取得した場合、例えば取得日付及び取得番号を、当該核酸チップCPに関する識別子のデータ(以下、これをチップ識別データと呼ぶ)として生成するようになされている。
【0031】
発現量演算部22は、蛍光強度取得部21が蛍光強度データを取得した場合、該蛍光強度データに基づいて、プローブセットごとに遺伝子発現量を算出し、該算出した各プローブセットでの発現量を示すデータ(以下、これを発現量データと呼ぶ)をチップ識別データと関連付けて、記憶部14に保存するようになされている。
【0032】
遺伝子発現量は、標的細胞内において発現している遺伝子を示す推定量であり、標的核酸と核酸プローブとの相補鎖の形成量に相関する発光量から、発光量の割合として算出される。
【0033】
この実施の形態の場合、遺伝子発現量は、Affymetrix社のMAS(Micro Array Suite)と呼ばれるデータ解析ソフトウェアのバージョン5を用いて算出される。
【0034】
ここで、このMAS5を、1つのプローブセットに着目して簡単に説明する。MAS5では、(1)プローブセットにおける各プローブ断片での発光量から、局所的な物理的影響(バックグランド)が排除される。(2)各プローブ断片(パーフェクトマッチプローブと呼ばれる)の発光量が、当該プローブ断片と対応する断片コントロール(ミスマッチプローブと呼ばれる)との差に応じて適宜補正される。(3)各プローブ断片(パーフェクトマッチプローブと呼ばれる)の発光量が対数変換により遺伝子発現量として算出される。
【0035】
詳細には、I.S.Kohane/A.T.Kho/A.J.Butte、星田有人、統合ゲノミクスのためのマイクロアレイデータアナリシス、シュプリンガー・ジャパン出版、p.58−74を参照されたい。
【0036】
信頼指数算出部23は、操作部13から、信頼指数の算出開始要求を待ち受け、該算出開始要求を受けた場合、2以上のチップ識別データ(発現量データ)が記憶部14に保存されている否かを認識する。
【0037】
ここで、2以上のチップ識別データが記憶部14に存在しない場合、このことは、信頼指数の算出に要する、比較対象とすべき同一の標的細胞における遺伝子発現量が取得されていないことを意味する。この場合、信頼指数算出部23は、信頼指数が算出できない旨及びその原因を、例えば表示部16を介して通知する。
【0038】
これに対して、2以上のチップ識別データが記憶部14に存在する場合、信頼指数算出部23は、該記憶部14に保存される全てのチップ識別データと、該チップ識別データに関連付けられた発現量データとを用いて信頼指数を算出する。
【0039】
すなわち、信頼指数算出部23は、例えば図5に示すように、遺伝子ごとに、全読取時間t1−mにおける遺伝子発現量GEのなかで最大となる遺伝子発現量(以下、これを最大遺伝子発現量とも呼ぶ)GEnMAXと、最小となる遺伝子発現量(以下、これを最小遺伝子発現量とも呼ぶ)GEnMINとを抽出する。
【0040】
そして信頼指数算出部23は、例えば図6に示すように、各読取時間tでの最大遺伝子発現量GEnMAXをもつ遺伝子の個数分布(図6(A))と、各読取時間tでの最小遺伝子発現量GEnMINをもつ遺伝子の個数分布(図6(B))との相関係数を、信頼指数として求める。
【0041】
この図6はE−GEOD−6013をサンプルとし、A549細胞に対してヘミンを刺激として与えときの読取時間tごとの最大遺伝子発現量GEnMAXの遺伝子の個数分布と、該読取時間tごとの最小遺伝子発現量GEnMINの遺伝子の個数分布を示したものである。この図6における読取時間t〜tは、0,1,6,24,48[hours],7[days]である。
【0042】
細胞内では各種物質が一定量に保たれていることが一般に知られ(ホメオスタシス)、また細胞内におけるATP(アデノシン3リン酸)量と同調して、mRNAの構成材料となるCTP,GTP,UTPも一定となることが示唆されている(例えば、Faziol I. Ataullakhanov & Victor M. Vitvitsky, What determines the intracellular ATP oncentration, Bioscience Reports vol.22, Nos5&6,October & December 2002, p.501-p.511)。
【0043】
このことから、細胞内で発現する個々の遺伝子の遺伝子発現量は変化しても、該遺伝子発現量の総量としてはおおよそ一定となることが考えられる。したがって、読取時間tごとの最大遺伝子発現量GEnMAXの増減と、最小遺伝子発現量GEnMINの増減とは一定の関係をもって推移する傾向にある。このことは、本出願人により既に確認されている。
【0044】
ここで、図6以外の実験結果を図7〜図9に示す。図7はE−GEOD−6013をサンプルとし、A549細胞に対してアスベストを刺激として与えときの読取時間tごとの最大遺伝子発現量GEnMAXの遺伝子の個数分布(図7(A))、および、最小遺伝子発現量GEnMINの遺伝子の個数分布(図7(B))と、A549細胞に対して刺激を与えないときの読取時間tごとの最大遺伝子発現量GEnMAXの遺伝子の個数分布(図7(C))、および、最小遺伝子発現量GEnMINの遺伝子の個数分布(図7(D))を示したものである。この図7における読取時間t〜tは、図6と同一である。
【0045】
また図8は、E−GEOD−6013をサンプルとし、Beas2B細胞に対してアスベストを刺激として与えときの読取時間tごとの最大遺伝子発現量GEnMAXの遺伝子の個数分布(図8(A))、および、最小遺伝子発現量GEnMINの遺伝子の個数分布(図8(B))と、Beas2B細胞に対して刺激を与えないときの読取時間tごとの最大遺伝子発現量GEnMAXの遺伝子の個数分布(図8(C))、および、最小遺伝子発現量GEnMINの遺伝子の個数分布(図8(D))を示したものである。この図8における読取時間t〜tは、0,1,6,24,48[hours]である。
【0046】
また図9は、E−GEOD−5264をサンプルとし、3人のヒト気管支上皮細胞における読取時間tごとの最大遺伝子発現量GEnMAXの遺伝子の個数分布(図9(A)、図9(C)、図9(E))と、最小遺伝子発現量GEnMINの遺伝子の個数分布(図9(B)、図9(D)、図9(F))を示したものである。図9(A)及び図10(B)における読取時間t〜tは、0,1,4,8,10,14,21,28〔days〕であり、図10(C)及び図10(D)における読取時間t〜tは、0,4,8,10,12,14,17,21,28〔days〕であり、図10(E)及び図10(F)における読取時間t〜t11は、0,1,2,4,8,10,12,14,17,21,28〔days〕である。
【0047】
これら実験結果からも明らかなように、読取時間tごとの最大遺伝子発現量GEnMAXの増減と、最小遺伝子発現量GEnMINの増減とは一定の関係をもって推移していることが分かる。
【0048】
したがって、信頼指数算出部23によって求められる相関係数(信頼指数)が、該相関係数に対して与えられる閾値以上である場合、このことは、おおよそ一定の関係をもって推移していることから、当該関係をもつ遺伝子発現量には、標的細胞に対する外部ストレスの条件や、該標的細胞からmRNAを抽出するときの条件又は技量の相違などを要因とする変位が小さく、当該標的細胞での実際の遺伝子量に同等な真値であることを意味する。
【0049】
解析部24は、信頼指数算出部23により算出される相関係数(信頼指数)と、閾値とを比較し、該相関係数が閾値以上である場合、記憶部14に保存された発現量データのデータ信頼性が高いものと決定する。そして解析部24は、当該発現量データに対して、信頼指数算出部23によって求められる信頼指数が基準値を満たしていることを示す識別子を付加する。
【0050】
また解析部24は、データ信頼性が高いものと決定した場合、例えば、各遺伝子における経時変位を示すグラフを作成する処理やその他の解析処理を適宜施し、その解析結果を表示部16に表示するようになされている。
【0051】
これに対して、信頼指数算出部23によって求められる相関係数(信頼指数)が閾値未満である場合、解析部24は、記憶部14に保存された発現量データのデータ信頼性が低いものと決定する。そして解析部24は、当該発現量データに対して、信頼指数算出部23によって求められる信頼指数が基準値を満たしていないことを示す識別子を付加する。
【0052】
また解析部24は、データ信頼性が低いものと決定した場合、例えば、その旨を表示するとともに、当該記憶部14に保存された発現量データを破棄するか否かを選択させるようになされている。
【0053】
(4)遺伝子発現解析処理手順
次に、遺伝子発現解析プログラムに基づくCPUの処理手順について、図10に示すフローチャートを用いて説明する。
【0054】
すなわちCPU10は、例えば電源投入操作をトリガーとしてこの遺伝子発現解析処理手順を開始し、ステップSP1において核酸チップCPでの蛍光強度の読取要求を待ち受け、ステップSP2において信頼指数の算出開始要求を待ち受ける。
【0055】
CPU10は、蛍光強度の読取要求を受けた場合、ステップSP2に進んで、蛍光強度読取装置3に対して測定を開始させ、当該測定結果として蛍光強度読取装置3から与えられる蛍光強度データを取得する。
【0056】
そしてCPU10は、ステップSP3に進んで、蛍光強度データから遺伝子発現量を示す発現量データを生成し、これを記憶部14に保存した後にステップSP1に戻る。
【0057】
一方、CPU10は、信頼指数の算出開始要求を受けた場合、ステップSP4に進んで、記憶部14に保存されているデータに基づいて、信頼指数の算出に要する条件を満たすか否かを判定する。
【0058】
CPU10は、記憶部14に2以上の発現量データが存在していない場合には、ステップSP5に進んで、信頼指数の算出ができない旨及びその原因を通知し、ステップSP1に戻る。
【0059】
これに対してCPU10は、記憶部14に2以上の発現量データが存在する場合には、ステップSP6に進んで、遺伝子ごとに、全読取時間t1−mにおける遺伝子発現量GEのなかで最大遺伝子発現量GEnMAX及び最小遺伝子発現量GEnMINを抽出する(図5)。
【0060】
またCPU10は、続くステップSP7に進んで、各読取時間tでの最大遺伝子発現量GEnMAXの遺伝子の個数分布(6(A))と、該読取時間tでの最小遺伝子発現量GEnMINの遺伝子の個数分布(図6(B))との相関係数を、信頼指数として求め、次のステップSP8において、該相関係数に対して与えられる閾値と比較する。
【0061】
ここで、相関係数が閾値未満となる場合、このことは、上述のように、遺伝子発現量には、標的細胞に対する外部ストレスの条件や、該標的細胞からmRNAを抽出するときの条件又は技量の相違などを要因とする変位が大きく、当該標的細胞での実際の遺伝子量とはかけ離れた値となっていることを意味する。
【0062】
この場合、CPU10は、ステップSP9に進んで、記憶部14に保存された発現量データのデータ信頼性が低いものと決定する。このときCPU10は、当該発現量データに対して、信頼指数が基準値を満たしていないことを示す識別子を付加するとともに、信頼指数が基準値を満たしていないときの処理として規定されるデータ処理を実行した後、この遺伝子発現解析処理手順を終了する。
【0063】
これに対して、相関係数が閾値以上となる場合、CPU10は、ステップSP10に進んで、記憶部14に保存された発現量データのデータ信頼性が高いものと決定する。このときCPU10は、当該発現量データに対して、信頼指数が基準値を満たしていることを示す識別子を付加するとともに、信頼指数が基準値を満たしているときの処理として規定されるデータ処理を実行した後、この遺伝子発現解析処理手順を終了する。
【0064】
このようにしてCPU10は、遺伝子発現解析プログラムに基づいて遺伝子発現解析処理手順を実行するようになされている。
【0065】
(5)動作及び効果
以上の構成において、出願人は、ある測定時刻で発現量が最小になる遺伝子と、同時刻に発現量が最大になる遺伝子とが測定時間ごとによい相関を呈していることを発見した。これは、細胞内に存する物質は一定に保とうとすることに起因して、遺伝子発現量の総量としてもおおよそ一定となることによるものと考えられる。
【0066】
一般に、遺伝子発現量の経時的変位を解析する場合、増加対象となる遺伝子発現量や、高い値をもつ遺伝子発現量が着目される一方、減少対象となる遺伝子や、低い値をもつ遺伝子発現量は破棄される。
【0067】
これに対し、この遺伝子発現量解析装置4は、一般に破棄されてきた低値の遺伝子発現量を、着目対象となっている高値の遺伝子発現量との相関関係をもって、遺伝子発現量全体としての信頼性の有無を判定する(図5、図6)。
【0068】
具体的には、遺伝子ごとに、全読取時間t1−mにおける遺伝子発現量GEのなかから最大遺伝子発現量GEnMAX及び最小遺伝子発現量GEnMINを抽出し(図5)、読取時間tごとの最大遺伝子発現量GEnMAXの遺伝子の個数分布(図6(A))と、該読取時間tごとの最小遺伝子発現量GEnMINの遺伝子の個数分布(図6(B))との相関係数が閾値以上である場合、当該遺伝子発現量GEの信頼性が高いものとする。
【0069】
この相関係数は、上述のように細胞自体が有する恒常性に基づく遺伝子の発現量にはおおよそ一定の相関があるので、標的細胞に対する外部ストレスの条件や、該標的細胞からmRNAを抽出するときの条件又は技量の相違などを要因とする変位の影響が小さいほど、高い値を呈する。
【0070】
したがって、この遺伝子発現量解析装置4は、遺伝子発現量GEの信頼性の有無を高い精度で判断することができる。これに加えて、この遺伝子発現量解析装置4では、一般に信頼性に疑問が残るとされる減少傾向あるいは低い値の遺伝子群の遺伝子発現量に信頼性がある否かの判断ができるため、当該遺伝子発現量から従来に比してより多面的に網羅解析を行うことが可能となる。
【0071】
なお、遺伝子発現量GEは、標的細胞において発現され得る総遺伝子に対応する数に近くなればなるほど、最大遺伝子発現量GEnMAXの遺伝子数の分布(図6(A))と、最小遺伝子発現量GEnMINの遺伝子数の分布(図6(B))との変位が細かくなるため、その信頼性の有無を最も精度よく判断することができる。
【0072】
また、この遺伝子発現量解析装置4は、その相関関係を演算により求めているので、各読取時間tの遺伝子発現量GE間における特別なコントロールを用いなくとも、当該遺伝子発現量GEの信頼性が高いものであるか否かを判定することができる。
【0073】
通常、コントロールは、核酸チップCPに対しての指標となるものであり、核酸チップ間の指標となるものではない。したがって、同一の生物種で同一の細胞種に対して、異なる実験室で得られた発現量データを用いて、遺伝子発現量の変位などを解析する場合にも有用となる。
【0074】
また、この遺伝子発現量解析装置4は、遺伝子発現量GEを、複数の核酸プローブに対する標的核酸との相補鎖形成量がセンサによって読み取られた物理量(本実施の形態では発光量)から、バックグラウンド(局所的な物理的影響)等を排除する統計学的手法を用いて求める。
【0075】
したがって、この遺伝子発現量解析装置4は、相関係数の算出もととなるデータが真値に近い状態としたうえで相関係数を求めることができるため、より一段と遺伝子発現量GEにおける信頼性の有無を判断することができる。
【0076】
以上の構成によれば、最大遺伝子発現量GEnMAXの個数の分布(図6(A))と、最小遺伝子発現量GEnMINの個数の分布(図6(B))との相関係数によって当該遺伝子発現量GEの信頼性を判定するようにしたことにより、精度を向上し得る遺伝子発現量解析装置4を実現できる。
【0077】
(6)他の実施の形態
上述の実施の形態では、読取時間tごとの最大遺伝子発現量GEnMAXの遺伝子の個数分布(図6(A))と、該読取時間tごとの最小遺伝子発現量GEnMINの遺伝子の個数分布(図6(B))との相関係数が算出された。この算出手法を変形させることも可能である。
【0078】
具体的には、まず図11に示すように、各読取時間tのうち基準とすべき例えば読取時間tを決定し(図11(A))、各読取時間tの遺伝子発現量GEを、基準として決定した読取時間tの遺伝子発現量との比率に変換する(図11(B))。この変換により、初期の遺伝子発現量を基準としたときの、当該遺伝子Gでの変化の割合が得られることとなる。ちなみに、図11における各遺伝子発現量GEの値は便宜的に示したものであり、実際の数値ではない。
【0079】
また、図12に示すように、遺伝子ごとに、全読取時間t1−mにおける遺伝子発現量GEの比率のなかから最大比率(図12(A)における斜線部分)と、最小比率(図12(B)における横線部分)とを抽出する。
【0080】
この状態において、各最大比率のうち、有意に増加したボーダーとして基準の比率(「1」)よりも大きく設定される値(以下、これを有意増加ボーダー値とも呼ぶ)よりも大きい最大比率(図12(B)における左右斜線部分)をもつ遺伝子の個数分布と、各最小比率のうち、有意に減少したボーダーとして基準の比率よりも小さく設定される値(以下、これを有意減少ボーダー値とも呼ぶ)よりも小さい最小比率(図12(B)における縦横線部分)をもつ遺伝子の個数分布との相関係数を算出する。
【0081】
すなわち、相関係数は、基準との関係で変化が小さいとされる遺伝子群(有意増加ボーダー値以下かつ有意減少ボーダー値以上の範囲内にある比率をもつ遺伝子群)を除いた状態で得られることになる。この基準との関係で変化が小さいとされる遺伝子群は、標的細胞に対する外部ストレスの条件や、該標的細胞からmRNAを抽出するときの条件又は技量の相違などを要因とする変位の影響の依存度が比較的大きくなる。
【0082】
したがって、この基準との関係で変化が小さいとされる遺伝子群を含めた状態で相関係数を算出する上述の実施の形態に比べると、遺伝子発現量GEの信頼性の有無をより一段と高い精度で判断することが可能となる。
【0083】
ここで、実験結果を図13〜図16に示す。図13はE−GEOD−5264をサンプルとし、3人のヒト気管支上皮細胞における測定時間ごとの遺伝子発現量を用いて、有意増加ボーダー値よりも大きい最大比率をもつ遺伝子の分布(図13(A)、図13(C)、図13(E))と、有意減少ボーダー値よりも小さい最小比率をもつ遺伝子の分布(図13(B)、図13(D)、図13(F))を得たものである。この実験での有意増加ボーダー値は「2」とし、有意減少ボーダー値は「0.5」とした。この図13における測定時間は、図9と同様である。ちなみに測定時間t(0[hours])は、基準(比率が「1」)であるため、有意増加ボーダー値よりも大きい最大比率または有意減少ボーダー値よりも小さい最小比率となり得ないことから、分布に含まれることはない。
【0084】
また図14は、有意増加ボーダー値及び有意減少ボーダー値以外の条件を図13と同一として、有意増加ボーダー値よりも大きい最大比率をもつ遺伝子の分布(図14(A)、図14(C)、図14(E))と、有意減少ボーダー値よりも小さい最小比率をもつ遺伝子の分布(図14(B)、図14(D)、図14(F))を得たものである。この実験での有意増加ボーダー値は「1/0.7」とし、有意減少ボーダー値は「0.7」とした。
【0085】
一方、図15はE−GEOD−6031をサンプルとし、Beas2B細胞・A549細胞における測定時間ごとの遺伝子発現量と、Beas2B細胞・A549細胞に対してアスベストを刺激として与えたときの測定時間ごとの遺伝子発現量とを用いて、有意増加ボーダー値よりも大きい最大比率をもつ遺伝子の分布(図15(A)、図15(C)、図15(E)、図15(G))と、有意減少ボーダー値よりも小さい最小比率をもつ遺伝子の分布(図15(B)、図15(D)、図15(F)、図15(H))を得たものである。この実験での有意増加ボーダー値は「2」とし、有意減少ボーダー値は「0.5」とした。この図15(A)〜(D)における測定時間t〜tは図8と同様であり、図15(E)〜(H)における測定時間t〜tは図7と同様である。
【0086】
また図16は、有意増加ボーダー値及び有意減少ボーダー値以外の条件を図12と同一として、有意増加ボーダー値よりも大きい最大比率をもつ遺伝子の分布(図16(A)、図16(C)、図16(E)、図16(G))と、有意減少ボーダー値よりも小さい最小比率をもつ遺伝子の分布(図16(B)、図16(D)、図16(F)、図16(H))を得たものである。この実験での有意増加ボーダー値は「1/0.7」とし、有意減少ボーダー値は「0.7」とした。
【0087】
これら実験結果からも明らかなように、最大比率をもつ遺伝子の分布と、最小比率をもつ遺伝子の分布との個数(図中のプローブ数に相当)が異なっていても、良好な相関があることが分かる。また、図13と図14および図15と図16の比較からも分かるように、有意増加ボーダー値は「1/0.7」、有意減少ボーダー値は「0.7」としたときが最も相関の程度が良好であった。
【0088】
ただし、有意増加ボーダー値を「1/0.7」以外、有意減少ボーダー値を「0.7」以外とした場合であっても実質的には何ら問題がなかったことを出願人は確認している。また、基準に対する有意増加ボーダー値または有意減少ボーダー値までの幅は同一としたが、相違させた場合であっても実質的には何ら問題がなかったことを出願人は確認している。
【0089】
上述の実施の形態では、標的細胞における複数の標的遺伝子に対する測定時間ごとの発現量を取得する取得態様として、標的細胞から測定時間ごとに抽出される複数の標的核酸と核酸プローブとの相補鎖形成量から演算により遺伝子発現量GEが取得された。しかしながら、取得態様はこの実施の形態に限定されるものではない。例えば、標的細胞で発現される各mRNAを抽出し、これらをリアルタイムPCR(Polymerase Chain Reaction)を用いて、一定量に増殖することにより直接的に取得するといった態様も適用可能である。
【0090】
また例えば、遺伝子発現量を示すデータが格納されるデータ格納媒体から取得するといった態様も適用可能である。この態様を適用した場合、例えば遠方となる複数の実験場所で得られた遺伝子発現量を示すデータを用いて、同一の生物種で同一又は異なる細胞種での遺伝子発現量の変位などを解析する場合にも有用となる。
【0091】
なお、データ格納媒体としては、例えばフレキシブルディスク、CD−ROM(Compact Disk-Read Only Memory)、DVD(Digital Versatile Disc)等のパッケージメディアや、データが一時的若しくは永続的に格納される半導体メモリや磁気ディスク等がある。またこれらデータ格納媒体からデータを取得する方法としては、ローカルエリアネットワークやインターネット、ディジタル衛星放送等の有線又は無線の通信媒体を利用することができる。
【0092】
また、読取量として、上述の実施の形態では光学的に発光量を読み取るようにした。しかしながら、読取量はこの実施の形態に限定されるものではない。例えば、電磁学的に電気量又はインピーダンス量等を適用することもできる。要は、所定の物理量を読み取るセンサによって読み取られた読取量を適用することができる。なお、核酸チップCPとしては、例えば、Affymetrix社製、スタンフォード型等を適用することができ、これら以外のものを適用することもできる。
【0093】
また、読取場所として、上述の実施の形態では核酸チップCPとした。しかしながら、読取場所はこれに限定されるものではない。例えば、組織切片を適用することができ、これ以外の場所も適用することができる。
【0094】
また、遺伝子発現量の演算手法として、上述の実施の形態ではMASを適用した。しかしながら、演算手法はこれに限定されるものではなく、センサから読み取られた、相補鎖の形成量を示すデータを統計学的手法を用いて適切に補正するものであればよい。
【産業上の利用可能性】
【0095】
本発明は、遺伝子実験、医薬の創製又は患者の経過観察などのバイオ産業上において利用可能である。
【図面の簡単な説明】
【0096】
【図1】本実施の形態による測定システムの全体構成を示す概略図である。
【図2】核酸チップでのハイブリダイゼーションの説明に供する概略図である。
【図3】標的細胞における各読取時間での遺伝子発現量の取得の説明に供する概略図である。
【図4】遺伝子発現量解析装置の回路構成を示すブロック図である。
【図5】各遺伝子における最大及び最小の発現量の抽出の説明に供する概略図である。
【図6】実験結果(1)を示すグラフである。
【図7】実験結果(2)を示すグラフである。
【図8】実験結果(3)を示すグラフである。
【図9】実験結果(4)を示すグラフである。
【図10】遺伝子発現量解析処理手順を示すフローチャートである。
【図11】各遺伝子における発現量に対する基準との比率への変換の説明に供する略線図である。
【図12】各遺伝子における最大及び最小をとる発現量比率の抽出の説明に供する略線図である。
【図13】実験結果(5)を示すグラフである。
【図14】実験結果(6)を示すグラフである。
【図15】実験結果(7)を示すグラフである。
【図16】実験結果(8)を示すグラフである。
【符号の説明】
【0097】
1……測定システム、3……蛍光強度読取装置、4……遺伝子発現量解析装置、10……CPU、11……ROM、12……RAM、13……操作部、14……記憶部、15……インターフェイス、16……表示部、21……蛍光強度取得部、22……発現量演算部、23……信頼指数算出部、24……解析部、CP……核酸チップ、GE〜GE……遺伝子発現量。

【特許請求の範囲】
【請求項1】
標的細胞における複数の標的遺伝子に対する測定時間ごとの発現量を取得する取得ステップと、
上記標的遺伝子ごとに、各測定時間の発現量のなかで最大の発現量と、最小の発現量とを抽出する抽出ステップと、
各測定時間での上記最大の発現量をもつ遺伝子の個数分布と、各測定時間での上記最小の発現量をもつ遺伝子の個数分布との相関の程度を示す値を算出する算出ステップと、
上記値を、該相関係数に対して与えられる閾値と比較する比較ステップと
を有する遺伝子発現量解析方法。
【請求項2】
各測定時間の発現量を、基準とすべき時間の発現量との比率に変換する変換ステップをさらに有し、
上記抽出ステップでは、
上記標的遺伝子ごとに、各測定時間の発現量の比率のなかで最大の比率と、最小の比率とを抽出し、
上記算出ステップでは、
各測定時間での上記最大の比率のうち、有意に増加したボーダーとして基準の比率よりも大きく設定される値よりも大きい比率をもつ遺伝子の個数分布と、各測定時間での上記最小の比率のうち、有意に減少したボーダーとして基準の比率よりも小さく設定される値よりも小さい比率をもつ遺伝子の個数分布との上記値を算出する、請求項1に記載の遺伝子発現量解析方法。
【請求項3】
上記取得ステップでは、
上記標的細胞から測定時間ごとに抽出される複数の標的核酸と核酸プローブとの相補鎖形成量を、該核酸プローブのコントロールとの差に応じて補正して上記発現量を取得する、請求項2に記載の遺伝子発現量解析方法。
【請求項4】
上記取得ステップでは、
上記標的細胞で発現され得る全遺伝子に対する測定時間ごとの発現量を取得する、請求項3に記載の遺伝子発現量解析方法。
【請求項5】
記憶手段に対して、標的細胞における複数の標的遺伝子に対する測定時間ごとの発現量を示すデータを記憶することを実行させ、
演算手段に対して、上記標的遺伝子ごとに、各測定時間の発現量のなかで最大の発現量と、最小の発現量とを抽出すること、
各測定時間での上記最大の発現量をもつ遺伝子の個数分布と、各測定時間での上記最小の発現量をもつ遺伝子の個数分布との相関係数を算出すること、
上記演算手段に対して、上記相関係数を、該相関係数に対して与えられる閾値と比較することを実行させる遺伝子発現量解析プログラム。
【請求項6】
標的細胞における複数の標的遺伝子に対する測定時間ごとの発現量を取得する取得手段と、
上記標的遺伝子ごとに、各測定時間の発現量のなかで最大の発現量と、最小の発現量とを抽出し、各測定時間での上記最大の発現量をもつ遺伝子の個数分布と、各測定時間での上記最小の発現量をもつ遺伝子の個数分布との相関係数を算出する算出手段と、
上記相関係数を、該相関係数に対して与えられる閾値と比較する比較手段と
を有する遺伝子発現量解析装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate


【公開番号】特開2010−17111(P2010−17111A)
【公開日】平成22年1月28日(2010.1.28)
【国際特許分類】
【出願番号】特願2008−179255(P2008−179255)
【出願日】平成20年7月9日(2008.7.9)
【出願人】(000002185)ソニー株式会社 (34,172)
【Fターム(参考)】