説明

発現変動因子の評価方法、その方法をコンピュータに実行させるプログラム、およびその方法を実施する装置

【課題】少ない被検体の解析によって得られる遺伝子生成物量の変動を統計的に解析することにより、それら遺伝子の中から統計学的な有意確率をもって変動する遺伝子生成物を選択する解析方法の開発が急務であった。
【解決手段】本発明の方法、その方法をコンピュータに実行させるプログラム、およびそれら手段を備えた装置は、従来の統計的処理では過小評価されてしまう、疾病を伴うあるいは疾病に起因する遺伝子発現の変動についての統計的有意確率をより正確に評価し、実際に変動している遺伝子を正確に選択することを可能とした。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、医薬品開発において有用な発現変動因子の評価方法または選択方法、それら方法をコンピュータに実行させるプログラム、およびそれら方法を実施する装置に関する。より詳しくは、被検試料中に複数存在する測定因子の存在量又は活性値の変動を統計的に解析することにより、それら因子の中から統計学的な有意確率をもって変動する因子を評価する方法、さらにそれらを選択する方法、それらの方法をコンピュータに実行させるプログラム、およびそれら方法を実施する手段を備えた装置に関する。
【背景技術】
【0002】
従来、病気の診断は被検体の病因関連因子や病変部位の形態学的な差異によってなされていたが、形態学的な違いによる分類には明確な判断基準がないことにより、しばしば不正確であり、客観的な診断が困難な場合が多かった。
【0003】
様々な疾病を伴うあるいは疾病に起因する遺伝子発現は、正常状態での遺伝子発現から大きく変動することが知られている。逆に言えば、そのような遺伝子発現の変動を計測することによって、病気の状態を遺伝子発現のレベルから客観的に診断することが可能になると考えられ、マイクロアレイ解析技術により現実のものとなりつつある。
【0004】
昨今のマイクロアレイ解析技術の進歩により、1回の解析において数千〜数万個の遺伝子発現変動を解析することが可能となった。この解析結果のデータから、有意に変動した遺伝子を選択することができれば、正常状態の組織試料と、疾病状態の組織資料を比較することにより、疾病に伴う変動を客観的に捉えることが可能となる。この結果を通して、疾患の起きる機序やその原因を探索することも可能となる。さらに、疾病状態かどうかが不明な試料を解析すれば、疾病状態にあるかどうかを診断することも可能と考えられる。薬物投与した試料を用いて同様の解析をすることにより、薬物の作用機序や副作用の発現機序を解明することも可能と考えられる。
【0005】
このように応用範囲の広いマイクロアレイであるが、現在のマイクロアレイ技術が誤差を多く含むこともあり、変動遺伝子の選択手法の開発は重要な課題であった。
【0006】
現在、用いられている変動遺伝子の選択手法あるいは評価方法のうち、最も初歩的な選択手法としては、疾患により遺伝子発現量が2倍以上、あるいは半分以下になったものを選択する方法がある。しかし、蛍光シグナル強度の少ない遺伝子では測定誤差が相対的に大きいため、誤差によって2倍以上の変動が見られる。そのため、ある程度の蛍光シグナル強度の得られた遺伝子の中から、2倍以上の発現変動を示した遺伝子を選択することが多い。
【0007】
次に、統計的な手法として、それぞれの遺伝子の発現変動についてウェルチのt検定を行う方法も用いられる。正常サンプルと疾患サンプルの間で発現量に差があるかを、両者の発現量を用いてウェルチのt検定に付し、一定の基準を越えて有意となった遺伝子を発現変動遺伝子として扱う方法である。この方法は統計手法に基づいており、2倍以上の変動がないものでも、全サンプルデータから有意と判定されれば変動遺伝子と扱うことができる。ただし、マイクロアレイのデータをこの方法で解析した場合、統計における多重検定の問題が起こる。すなわち、p<0.05を有意として変動遺伝子を選択した場合、実際に変動がないデータであっても1万遺伝子のうち500遺伝子は、有意な遺伝子として選択されてしまう。そのため、閾値とするp値として、さらに小さい値を設定しなければならず、用いたアレイの数が少ない場合には、有意な変動遺伝子を得ることは難しくなる。
【0008】
マイクロアレイで測定する遺伝子数は数万にのぼる一方で、使用するサンプル数あるいはマイクロアレイ数を抑えることが期待される。疾患サンプルを多数収集することは難しい場合が多く、なるべく少数のサンプルで解析できることが好ましい。また、薬物投与などのサンプルでは、一つの検討を少数のサンプルで行えれば、タイムコースや濃度依存性などの検証を幅広く行うことが可能となる。
【0009】
しかし、先に述べたウェルチのt検定では、サンプル間のばらつきをもとに発現変動を評価するため、少ないサンプル数のデータの解析には不向きである。
【0010】
そこで、用いられる方法として、エラーモデルによる標準誤差の推定方法がある。一つの例としては、GeneSpringに搭載されたCross-Gene Error Modelがある。この方法は、マイクロアレイではサンプル数は少ないものの、遺伝子数は1万個以上にのぼる特性を利用し、遺伝子間でのばらつきをもとに、データに含まれる標準誤差を推定する方法である。全遺伝子データをその蛍光強度で並び替え、各蛍光強度で見られる誤差をプロットし、それぞれの蛍光強度における誤差の回帰曲線を算出する。各遺伝子の標準誤差に、得られた誤差の推定値を加味することにより、サンプル数が少ない場合でも、全遺伝子データにもとづいて推定された誤差値を用いることができる。このような方法により、蛍光シグナル強度の弱い遺伝子でもシグナル強度に応じた標準誤差を推定でき、少ないサンプル数のデータについても解析することが可能となる。その他のエラーモデルとしては、各社のアレイ技術にもとづき、それぞれのアレイ製品に特有なばらつきをもとにエラーモデルを構築する方法なども実用化されている。
【0011】
マイクロアレイの他に、抗体アレイなどを用いた多数の蛋白質量の変動の計測や、質量分析装置を用い、血液などの試料から多数の代謝産物の含有量を計測する方法も実用化されつつある。これらの手法も、多数の物質の変動を同時に捉えるため、マイクロアレイと同様に、有意な変動を捉える方法が課題となると考えられる。
【0012】
【非特許文献1】Rocke,D.M.、外1名、ジャーナル・オブ・コンピュテーショナル・バイオロジー(Journal of Computational Biology)、2001年、第8巻、第6号、p.557−569
【非特許文献2】Rocke,D.M.、外1名、テクノメトリクス(Technometrics)、1995年、第37巻、第2号、p.176−184
【発明の開示】
【発明が解決しようとする課題】
【0013】
少ない被検体の解析によって得られる遺伝子生成物量の変動を統計的に解析することにより、それら遺伝子の中から統計学的な有意確率をもって変動する遺伝子生成物を選択する解析方法の開発が急務であった。
【0014】
エラーモデルに基づく標準誤差を適用し、ウェルチのt検定を実施して発現変動遺伝子を評価しても、p値が0〜1に均等分布せず、このp値をもとにFDR値を算出しても、有意な発現変動遺伝子を取得することができない問題があった。
【0015】
そこで、有意な発現変動遺伝子を取得するためには、p値の算出過程を変更し、0〜1に均等分布するp値を算出する方法が必要であった。
【課題を解決するための手段】
【0016】
発明者らは、上記のような課題を解決するため鋭意検討した結果、本発明に係る方法が課題を解決することを見出し、本発明を完成した。
【0017】
すなわち、本発明は、
(1a)対照試料に対する被検試料における存在量又は活性値が統計的有意確率をもって変動する因子の評価方法、
(2a)対照試料および被検試料における因子の存在量又は活性値を示す測定値からなるデータセットを統計的処理に付することにより、対照試料に対する被検試料における当該因子の存在量又は活性値の変動についての有意確率を算出するステップを含むことを特徴とする前記(1a)記載の方法、
(3a)さらに、算出された有意確率に基づき、設定値未満の有意確率を有する当該因子を選択するステップを含むことを特徴とする前記(2a)記載の方法、
(4a)前記(2a)記載の方法の前に、対照試料および被検試料における因子の存在量又は活性値を測定するステップおよびその測定値からなるデータセットを構築するステップを含むことを特徴とする前記(2a)または(3a)記載の方法、
(5a)前記(2a)記載の統計的処理が、自由度を無限大に設定したウェルチのt検定に付することである前記(2a)乃至(4a)記載の方法、
(6a)前記(2a)記載の統計的処理が、(a)乱数発生プログラムを用いて模擬的に作成した、測定誤差を含むものの両群間で実質的な発現変動を伴わない対照試料および被検試料データ、
(b)対照試料および被検試料として同じ実施条件から得られた試料の測定値データ、および
(c)並び替え検定法を用いて対照試料および被検試料の組み合わせを入れ替えて作成した対照試料および被検試料データから選択されるデータを用いて、対照試料および被検試料を解析する時と同等のエラーモデルのもとで、因子毎に得られた有意確率が0〜1に均等分布するか否かに基づき、
(i)自由度を無限大に設定したウェルチのt検定および(ii)被検試料および対照試料の例数に基づいた自由度を採用したウェルチのt検定から選択される検定である前記(2a)乃至(4a)記載の方法、
(7a)前記(6a)記載の検定方法選択ステップにおいて、(i)自由度を無限大に設定したウェルチのt検定により適切な結果が得られた場合、あるいは
(ii)被検試料および対照試料の例数に基づいた自由度を採用したウェルチのt検定を行った結果、有意確率が0〜1の範囲の均等分布よりも誤差を越えて悪く見積もられた場合に、自由度を無限大に設定したウェルチのt検定により統計処理されることを特徴とする前記(5a)記載の方法、
(8a)(i)自由度を無限大に設定したウェルチのt検定、および(ii)被検試料および対照試料の例数に基づいた自由度を採用したウェルチのt検定から得られる結果が、実質的に異なる場合において、自由度を無限大に設定したウェルチのt検定を行う前記(5a)記載の方法、
(9a)(1)対照試料および被検試料における因子の存在量又は活性値を測定するステップ、
(2)(1)の測定値からなるデータセットを構築するステップ、
(3)(2)のデータセットを、自由度を無限大に設定したウェルチのt検定に付することにより、対照試料に対する被検試料における当該因子の存在量又は活性値の変動についての有意確率を算出するステップ、および
(4)算出された有意確率に基づき、設定値未満の有意確率を有する当該因子を選択するステップを含むことを特徴とする前記(1a)記載の方法、
(10a)因子が、遺伝子発現生成物である請求項前記(1a)記載の方法、
(11a)遺伝子発現生成物が、蛋白質、ペプチド、DNA、相補鎖DNA、RNA、メッセンジャーRNA、および相補鎖RNAから選択されるものからなる前記(10a)記載の方法、
(12a)遺伝子発現生成物が、メッセンジャーRNA、相補鎖DNA、または相補鎖RNAである前記(11a)記載の方法、
(13a)因子の存在量又は活性値を示す測定値が、遺伝子多型あるいは変異の測定値である前記(2a)記載の方法、
(14a) 前記(2a)記載のデータセットが、マイクロアレイによる測定データからなるデータセットである前記(2a)記載の方法、
(15a)被検試料および対照試料の例数が、4以下である前記(6a)記載の方法、
(16a)請求項3記載の設定値が、0.01〜0.1である前記(3a)記載の方法、
(17a)対照試料および被検試料における因子の数が、1000個以上である前記(2a)記載の方法、
(18a)被検試料が、病態組織もしくはそれに含まれる細胞またはそれらの抽出物であり、対照試料が相当する非病態組織もしくはそれに含まれる相当する細胞またはそれらの抽出物である前記(1a)記載の方法、
(19a)被検試料が、遺伝子改変生物の組織もしくはそれに含まれる細胞またはそれらの抽出物であり、対照試料がその非遺伝子改変生物の組織もしくはそれに含まれる相当する細胞またはそれらの抽出物である前記(1a)記載の方法、
(20a)被検試料が、生体作用物質を添加した組織もしくはそれに含まれる細胞またはそれらの抽出物であり、対照試料が相当する非添加組織もしくはそれに含まれる相当する細胞またはそれらの抽出物である前記(1a)記載の方法、
(21a)対照試料に対する被検試料における存在量又は活性値が統計的有意確率をもって変動する因子の評価方法をコンピュータに実行させるプログラム、
(22a)(1)対照試料および被検試料における因子の存在量又は活性値を示す測定値からなるデータセットを統計的処理に付することにより、対照試料に対する被検試料における当該因子の存在量又は活性値の変動についての有意確率を算出するステップ、および
(2)(1)において算出された有意確率に基づき、設定値未満の有意確率を有する当該因子を選択するステップをコンピュータに実行させることを特徴とする前記(21a)記載のプログラム、
(23a)対照試料に対する被検試料における存在量又は活性値が統計的有意確率をもって変動する因子の評価方法を実施する手段を備える装置、
(24a)(1)対照試料および被検試料における因子の存在量又は活性値を示す測定値からなるデータセットを統計的処理に付することにより、対照試料に対する被検試料における当該因子の存在量又は活性値の変動についての有意確率を算出するステップ、および
(2)(1)において算出された有意確率に基づき、設定値未満の有意確率を有する当該因子を選択するステップを実施する手段を備えることを特徴とする前記(23a)記載の装置、
(25a)対照試料に対する被検試料における存在量又は活性値が統計的有意確率をもって変動する因子の評価方法をコンピュータに実行させるプログラムが記録されたコンピュータ読取り可能な記録媒体、
(26a)対照試料に対する被検試料における存在量又は活性値が統計的有意確率をもって変動する因子の評価方法を用いて選択された因子群、ならびに
(27a)前記(26a)記載の因子が、その因子に相当する遺伝子である前記(26a)記載の因子群に関する。
【0018】
本発明明細書中、「試料」とは、組織や細胞など、実験を行う対象の試料を意味する。例えば、ヒトを含む哺乳動物あるいはその他の生物の個体、特定組織、または細胞など、これらの生物から採集され得る試料およびこれらの生物から樹立された培養細胞株およびそれらの抽出物などが挙げられる。
【0019】
本発明明細書中、「被検試料」とは、解析対象となる試料を意味する。例えば、病態組織、遺伝子改変生物より得られた組織、生体作用物質を投与した生物の組織自体、もしくはそれに含まれる細胞、またはそれらの抽出物などが挙げられる。
【0020】
本発明明細書中、「病態組織」としては、例えば、ヒトにおける疾患、例えば、脳血管疾患(例えば、脳梗塞、脳出血、高血圧性脳出血、クモ膜下出血、脳動脈瘤、一過性脳虚血など)、神経変性疾患(例えば、老人性痴呆型アルツハイマー病、パーキンソン症候群、パーキンソン病、進行性核上性麻痺、ハンチントン舞踏病、認知症など)、精神神経系疾患(例えば、気分障害、不安障害、心身症、ストレス関連障害、摂食障害、および精神作用物質使用による症状もしくはその依存症など)、虚血性疾患、心疾患(例えば、心筋梗塞、狭心症、解離性大動脈瘤、心筋炎、心膜炎、心不全、心臓弁膜症、心臓肥大、不整脈、発作性頻拍症、先天性心疾患など)、肝疾患(例えば、肝不全、肝硬変、急性肝炎、慢性肝炎、劇症肝炎、薬物性肝障害、急性ウイルス性肝炎、慢性ウイルス性肝炎、肝アミロイドーシス、アルコール性肝障害、肝機能障害など)、膵疾患(例えば、急性膵炎、慢性膵炎など)、糖尿性疾患(例えば、インスリン非依存性糖尿病、ケトーシス抵抗性糖尿病、若年者の成人発症型糖尿病、インスリン依存性糖尿病、ケトーシスに傾きやすい糖尿病、若年性糖尿病、インスリン不足性糖尿病、飢餓糖尿病、潜在性糖尿病、不安定型糖尿病、無症状糖尿病、膵性糖尿病、もしくは糖尿病前症など)、泌尿器系疾患(例えば、前立腺肥大症または神経因性膀胱疾患に伴う症状(排尿困難(排尿開始遅延、排尿時間延長、尿線細小、間欠排尿、二段排尿など)、頻尿、夜間頻尿、排尿痛など)、下部尿路症(例えば、下部尿路の閉塞疾患など)、下部尿路の炎症性疾患(感染など)、多尿など)、腎疾患(例えば、糸球体腎炎、腎硬化症、IgA腎症、急性糸球体腎炎、膜性増殖性糸球体腎炎、アレルギー性腎血尿など)、肺疾患(例えば、慢性閉塞性肺疾患、慢性気管支炎、肺炎、肺気腫、びまん性肺疾患、呼吸器感染症、喘息、肺循環障害、睡眠時無呼吸症候群など)、胃疾患(例えば、胃炎、胃潰瘍、胃下垂など)、消化器疾患(例えば、十二指腸潰瘍、食道静脈瘤など)、呼吸器系疾患(例えば、急性上気道感染症、急性鼻咽頭炎(かぜ)、急性副鼻腔炎、咽頭炎、急性咽頭炎、急性扁桃炎、急性喉頭炎、気管炎、急性気管支炎、インフルエンザによる肺炎、細菌性肺炎、急性細気管支炎、アレルギー性鼻炎、花粉によるアレルギー性鼻炎、慢性鼻炎,鼻咽頭炎、慢性副鼻腔炎、肺気腫、喘息、肺水腫、肺好酸球症、気胸など)、歯科疾患(例えば、歯周病、虫歯、口内炎、歯肉炎、口内炎、歯肉炎など)皮膚疾患(例えば、アトピー性皮膚炎、円形脱毛症、接触皮膚炎、乾癬、光線過敏症、シェーグレン症候群など)、骨疾患(例えば、骨粗鬆症、関節炎、関節リューマチ、変形性関節症、骨関節炎、骨形成不全症、骨軟化症、くる病、軟骨無形成症、骨軟化症、腎性骨異栄養症、変形性骨炎、大理石病など)、血液疾患(例えば、ヘモグロビン異常症、有棘赤血球増多症、貧血、白血病、急性白血病、急性骨髄性白血病、急性リンパ性白血病、慢性白血病、悪性リンパ腫など)、自己免疫疾患(例えば、糸球体腎炎、関節炎、拡張性心筋症様疾患、潰瘍性大腸炎、シェーグレン症候群、クローン病、全身性エリテマトーデス、慢性関節リウマチ、多発性硬化症、乾鮮、アレルギー性接触性皮膚炎、多発性筋炎、強皮症、結節せい動脈周囲炎、リウマチ熱、尋常性白斑、インスリン依存性糖尿病、ベーチェット病、橋本病など)、癌疾患(例えば、食道癌、胃癌、大腸癌、結腸癌、直腸癌、転移性肝癌、胆道癌、膵癌、胆嚢癌、胆管癌、肺癌、腺癌、扁平上皮癌、腎臓癌、前立腺癌、膀胱癌、睾丸癌、子宮体癌、子宮頚癌、絨毛癌、卵巣癌、膣・外陰部癌、皮膚癌、悪性黒色腫、口腔癌、上咽頭癌、中咽頭癌、舌癌、下咽頭癌、喉頭癌、甲状腺癌、乳癌、乳頭癌、濾胞癌、未分化癌、髄様癌、悪性リンパ腫、急性白血病、慢性骨髄性白血病、消化管悪性リンパ腫瘍、脳腫瘍、骨肉腫、骨転移癌、前立腺癌など)、眼疾患(例えば、急性結膜炎、ウイルス性結膜炎、季節性アレルギー性結膜炎、慢性結膜炎、通年性アレルギー性結膜炎、春季カタル、白内障、ぶどう膜炎、高血圧性網膜症、糖尿病性網膜症、緑内障、うっ血乳頭、乳頭炎など)、ウイルス感染疾患(例えば、ヒト肝炎ウイルス(B型肝炎、C型肝炎、A型肝炎またはE型肝炎)、ヒトレトロウイルス、ヒト免疫不全ウイルス(HIV1、HIV2)、ヒトT細胞白血病ウイルスまたはヒトTリンパ向性ウイルス(HTLV1、HTLV2)、単純ヘルペスウイルス1型および2型、エプスタイン・バーウイルス、サイトメガロウイルス、水痘−帯状疱疹ウイルス、ヒトヘルペスウイルス6を含むヒトヘルペスウイルス、ポリオウイルス、麻疹ウイルス、風疹ウイルス、日本脳炎ウイルス、おたふくウイルス、インフルエンザウイルスまたは風邪ウイルスとして挙げられるアデノウイルス、エンテロウイルス若しくはライノウイルス、重症急性呼吸器症候群(SARS)を発症するウイルス、エボラウイルス、または西ナイルウイルスの感染症など)、細菌感染疾患、および遺伝性疾患などの病態組織、サル、マウス、およびラットを含む哺乳動物その他の生物における上記疾患に対応する疾患、および上記疾患を模した状態の病態組織、ならびに遺伝子改変生物における病態組織を示す。
【0021】
本発明明細書中、「非病態組織」とは、病態組織と異なる条件から得られた対応する組織であって、対応する正常組織に限られない。
【0022】
本発明明細書中、「対照試料」とは、被検試料と比較される試料を示す。被検試料に行った処置などを施さないものとして、同時に取得される試料を用いる場合もあるが、これに限定されず、例えば、病態組織である被検試料に対する同一個体または同一組織における正常部位、病態組織である被検試料に対する異なる個体の同組織の正常部位、悪性度の高い癌から得られた試料に対する悪性度の低い癌から得られた試料、肝癌組織である被検試料に対する肝硬変組織、前立腺肥大である被検試料に対する正常な前立腺組織、前立腺癌である被検試料に対する正常な前立腺組織あるいは前立腺肥大組織、慢性骨髄性白血病細胞に対する慢性リンパ性白血病細胞、特定の生体作用物質を添加した試料に対するその物質を添加しなかった試料、特定の生体作用物質を添加した試料に対する他の物質を添加した試料、脳組織から得られた試料に対する脳以外の組織から得られた試料、特定の遺伝子改変動物に対するその改変遺伝子をもたない動物、特定の病態組織の試料に対する特定の生体作用物質添加試料、特定の病態組織の試料に対する特定の遺伝子改変動物の試料などが挙げられる。
【0023】
本発明明細書中、「因子」は、生物個体を構成し、測定対象となり得るものであって、その量、数、性質あるいは活性などの変化を検出できるもののすべてを含む。例えば、蛋白質、ペプチド、核酸(DNA、相補鎖DNA(cDNA)、RNA、メッセンジャーRNA(mRNA)、相補鎖RNA(cRNA)など)、抗体、自己抗原、脂質、糖質、代謝産物などの低分子、血液細胞およびウイルスなどが挙げられる。また、血清・血漿成分など、血清、血漿、尿、体液などの生体試料において検出される成分などが挙げられる。「因子」が、発現変動する遺伝子である場合には、定量的PCR法、DNAマイクロアレイ法などによって、その変動を測定することができる。
【0024】
本発明明細書中、「存在量」とは、各々の試料において、遺伝子、RNAあるいは蛋白質などである各因子が含まれる量、活性の強さなどの定量的または定性的に測定可能なものを示し、活性化体や変異体など特定の形態のものが含まれる割合、恒常的な発現の見られるmRNA量と比較したときの各因子のmRNA量のように、何らかの基準に対して相対的に示される量を含む。なお、因子が遺伝子である場合、その存在量の一例として各遺伝子の発現量も含まれる。
【0025】
本発明明細書中、「活性値」とは、各々の試料において、遺伝子、RNAあるいは蛋白質などである各因子の有する活性の強さなどの定量的または定性的に測定可能なものを示す。
【0026】
本発明明細書中、「測定値」とは、各々の試料において各因子の存在量、活性量などを測定した結果のデータを意味する。
【0027】
本発明明細書中、「統計的処理」とは、スチューデントあるいはウェルチのt検定、ウィルコクソンの順位和検定、ANOVA一元配置分散分析などの統計学に基づく処理方法を示し、自由度を無限大に設定したウェルチのt検定を含む。
【0028】
本発明明細書中、「データセット」とは、一つ以上の因子について、被検試料および対照試料から得られた測定値のデータを含む集合を意味する。測定値のデータセットとしては、例えば、(1)複数の対照試料の測定値と複数の被検試料の測定値、(2)被検試料および対照試料の測定値のそれぞれの平均値および各試料の測定値の標準偏差あるいは標準誤差、(3)被検試料および対照試料の測定値のそれぞれ平均値および各試料の測定値の因子分布からの推定を加味した標準偏差あるいは標準誤差などの対応する組み合わせである。
【0029】
本発明明細書中、「設定値」とは、変動因子の選択基準とするp値(有意確率)あるいはFDR値を意味する。
【0030】
本発明明細書中、「FDR値」とは、False Discovery Rate値の略であり、得られた変動因子の中に、どの程度の割合の偽陽性因子が含まれるかの推定値を示す。この値の算出法の一例を以下に示す。例えば10000個の因子を用いた実験において、p値0.01で有意な変動が見られる因子が1000個あったとする。しかし、この時、実質的に変動の無い実験においても、偶然に選ばれる因子数は10000×0.01=100個存在する。上記にて選択された1000個のうち、100個は偶然選択された偽陽性因子と考えられることから、この時のFDR値は100/1000=0.1となる。
【0031】
本発明明細書中、「有意確率(p値)」あるいは「p値」とは、ウェルチのt検定などの検定の結果として、検定対象とした2つ以上の群の間に変動が無い確率を示す。
【0032】
本発明明細書中、前記(2a)、(9a)におけるステップ(3)、(22a)におけるステップ(1)、および(24a)におけるステップ(1)の「対照試料に対する被検試料における因子の存在量又は活性値の変動についての有意確率を算出する」とは、指定された統計手法に基づいて、それぞれの因子について、被検試料のデータと対照試料のデータの間に差がない確率p値を算出することを意味する。
【0033】
本発明明細書中、前記(3a)、(9a)におけるステップ(4)、(22a)におけるステップ(2)、および(24a)におけるステップ(2)の「算出された有意確率に基づき、設定値未満の有意確率を有する当該因子を選択する」とは、例えば、有意確率0.05などの閾値を設定し、p値がこの閾値未満となった因子のみを選択し、さらに必要に応じて、画面への表示、印刷、因子リストの記憶媒体への保存、別の解析プログラムへの出力などを用いて利用者あるいは他のプログラムへ提示することを意味する。
【0034】
本発明明細書中、前記(4a)の「対照試料および被検試料における因子の存在量又は活性値を測定するステップおよびその測定値からなるデータセットを構築するステップ」とは、一つ以上の因子について、被検試料および対照試料から得られた測定値のデータを含む集合を意味する。例えば、測定値のデータセットとして挙げられる、(1)複数の対照試料の測定値と複数の被検試料の測定値、(2)被検試料および対照試料の測定値のそれぞれの平均値および各試料の測定値の標準偏差あるいは標準誤差、(3)被検試料および対照試料の測定値のそれぞれ平均値および各試料の測定値の因子分布からの推定を加味した標準偏差あるいは標準誤差などの対応する組み合わせを、コンピュータなどに入力するための一定の形式に従い配列することを意味する。
【0035】
本発明明細書中、「自由度を無限大に設定したウェルチのt検定」とは、二群間の測定値変動をIとし、二群をプールした標準誤差をEとする時、Z=I/Eを求め、標準正規分布においてZ値以上あるいはZ値以下の値を取る比率を有意確率(p値)とすることにより行うt検定を意味する。
【0036】
本発明明細書中、前記(6a)の「乱数発生プログラムを用いて模擬的に作成」とは、実際に実験を行わずに、コンピュータあるいはプログラム言語処理系に含まれる乱数発生ルーチンを用いて模擬的な実験を作成することを意味する。DNAマイクロアレイにおいては、例えば、誤差のない状態で得られた蛍光強度を1000とすると、これに対して−20%〜+25%程度の範囲で測定値を変化させる蛍光強度に比例した誤差と、もとの蛍光強度にかかわらず±200程度の範囲で測定値を変化させる誤差が発生する。そこで、本来得られるべき蛍光強度を因子(マイクロアレイにおいては遺伝子)毎に乱数によって設定した後に、これらの誤差を乱数発生ルーチンで得られた値に基づいて付加する。誤差の付加にあたっては、以下の手順を行い、誤差の分布が正規分布をとるようにする。まず、0〜1の範囲の乱数を乱数発生ルーチンで発生させる。この値から、標準正規分布の累積分布関数の逆関数の値をとる。具体的には、マイクロソフトエクセルであれば、normsinv(rand())関数によってこの値が得られる。次に、この値を2回算出し、それぞれに標準誤差の想定値を乗算した後に、これを蛍光強度比例の誤差と、蛍光強度に依存しない誤差に適用する。蛍光強度比例の誤差については、もとの蛍光強度の常用対数値(あるいは自然対数値)をとり、これに誤差を添加した後に、指数値をとって蛍光強度値に戻す。蛍光強度に依存しない誤差については、蛍光強度値に加算する。ただし、得られた蛍光強度値が負値となった場合は0、あるいは0.01(ただし、この場合は0.01以下の蛍光強度値をすべて補正)などの小さい正数に適宜補正する。本来得られるべき蛍光強度、および二つの要因による誤差の標準誤差は、実際のマイクロアレイデータと蛍光強度の分布と、模擬実験データが近くなるように設定する。マイクロアレイ以外の実験においても、その実験が持つ誤差の特性にもとづいて、同様にして模擬実験データを作成する。
【0037】
本発明明細書中、前記(6a)の「乱数発生プログラムを用いて模擬的に作成した、測定誤差を含むものの両群間で実質的な発現変動を伴わない対照試料および被検試料データ」とは、上記の方法によって作成したデータを、半分ずつに分け、対照試料・被検試料としたデータを意味する。この時、同じ因子については、「誤差のない状態で得られた蛍光強度」は全サンプルで同じとする。例えば、全因子についての蛍光強度データを4セット作成し、このうち2つを被検試料、この2つを対照試料として模擬実験データを作成する。
【0038】
本発明明細書中、「並び替え検定法」とは、複数個の対照試料および被検試料が存在するとき、この組み合わせを可能なすべての組み合わせを用いて入れ替え、新たな対照試料、被検試料データを作成し、これを用いてそれぞれの組み合わせについて以降の検定を行うことにより、実験条件間の変動とは関係なく両試料に含まれるデータのばらつきを評価する方法を示す。
【0039】
本発明明細書中、「被検試料または対照試料の例数」とは、同一の条件下から採取された被検試料または対照試料の数あるいはそれらの測定回数を意味する。すなわち、DNAマイクロアレイにおいて、4個の被検試料を用意し、このそれぞれからRNAサンプルを調製し、それぞれを1枚のアレイスライドにハイブリダイズし、それぞれのアレイスライドから1回ずつ蛍光強度を測定した場合、例数は4となる。1個の被検試料から2枚のアレイスライドを用意し、4回蛍光強度を測定した場合も例数4となるが、この場合には被検試料に含まれる誤差を除くことができないという問題点がある。
【0040】
本発明明細書中、前記(6a)における(ii)、(7a)における(ii)、および(8a)における(i)の「被検試料および対照試料の例数に基づいた自由度を採用したウェルチのt検定」とは、実験に用いた試料の例数を用いて自由度を算出する、通常の方法で行ったウェルチのt検定を意味する。
【0041】
本発明明細書中、前記(7a)における(ii)の「有意確率が0〜1の範囲の均等分布よりも誤差を越えて悪く見積もられた場合」とは、通常の方法のウェルチのt検定では統計的に誤りが存在するため、有意確率の分布に異常が認められる状態を意味する。例えば、有意確率p値0付近となるデータがほとんど得られない場合が挙げられる。この判定は以下のように行う。例えば、1万以上の因子のデータであり、有意確率p値0.01以下のデータが全く得られない、あるいは最小のp値が得られたものから5%程度のパーセンタイルにある因子のp値が0.1以上となる場合は、誤差を越えて悪く見積もられた場合となる。この判定は、解析対象となる一連の実験すべてを通して行われる。この判定には、対照試料と比較して被検試料で発現などが上昇した場合と、低下した場合について検定し、両方が悪く見積もられる必要がある。片側のみが悪く見積もられた場合には、実験データに偏りがあるためと判断される。また、一連の実験を通して、複数の条件でこの検定が可能な場合には、そのうちのある程度以上、例えば6割あるいは8割以上において見られた場合に、悪く見積もられたと判定する。
【0042】
本発明明細書中、前記(8a)の「(i)自由度を無限大に設定したウェルチのt検定および、(ii)被検試料および対照試料の例数に基づいた自由度を採用したウェルチのt検定から得られる結果が、実質的に異なる」における「実質的に異なる」とは、二つの結果が大きく異なることにより、各因子の存在量又は活性値の変動の評価や、変動した因子の選択などに実質的に影響が及ぶ程度に異なることを示す。ただし、得られた数値がわずかに異なるものの、丸め込んだ結果が同等である、あるいは選択される変動因子に変化が無いなど、実質的な影響の無い程度の場合を除く。この結果が実質的に異なる状況下では、自由度を無限大に設定したウェルチのt検定、あるいは従来法のウェルチのt検定のうち一方が正しい結果を算出すると考えられる。エラーモデルなどが適用され、従来法のウェルチが使用できない場合には、自由度を無限大に設定したウェルチのt検定が有用となる。
【0043】
本発明明細書中、「対照試料および被検試料における因子の存在量又は活性値を測定するステップ」は、因子、すなわち、蛋白質、ペプチド、DNA、相補鎖DNA(cDNA)、RNA、メッセンジャーRNA(mRNA)、相補鎖RNA(cRNA)、抗体、自己抗原、血清または血漿成分、血液細胞、およびウイルスなどの存在量を測定できる方法およびその方法に使用される装置によって実施することができる。例えば、cDNA、RNA、mRNA、またはcRNAの存在量を測定する方法としては、定量的PCR法、DNAマイクロアレイ法などが挙げられる。さらに、それら方法に使用される装置として、DNAマイクロアレイ法においては、DNAマイクロアレイ(DNAチップ)(例えば、アフィメトリクス社方式のオリゴヌクレオチドアレイ(GeneChipTM)など)およびDNAマイクロアレイ読み取り装置(例えば、Affymetrix 428 Array Scanner(アフィメトリクス社)、ScanArray(パーキンエルマー社)、GenePix 4000B MicroArray Scanner(アクソン社)など)を用いることができる。
【0044】
本発明明細書中、「遺伝子発現生成物」とは、遺伝子の発現によって生成される生体物質であって、例えば、蛋白質、ペプチド、核酸(DNA、相補鎖DNA(cDNA)、RNA、メッセンジャーRNA(mRNA)、相補鎖RNA(cRNA)などが挙げられる。
【0045】
本発明明細書中、「生物」としては、例えば、ヒト、サル、マウス、およびラットその他哺乳動物を含む動物、植物、バクテリア、酵母、および放線菌などの微生物、ならびにウイルスなどが挙げられる。
【0046】
本発明明細書中、「遺伝子変異」とは、遺伝子の化学的構造の変化であり、遺伝子を構成する塩基(デオキシアデノシン、デオキシシトシン、デオキシグアノシン、デオキシチミン)の異なる塩基への置換、欠損、挿入、修飾などが生じることである。遺伝子変異には、一世代において生じる体細胞変異(例えば、疾患を誘発する変異、免疫細胞での抗体遺伝子の変異)と遺伝する変異(例えば、SNP(1塩基遺伝子多型性))が含まれる。
【0047】
本発明明細書中、「マイクロアレイ」としては、例えば、DNAマイクロアレイ、タンパク質マイクロアレイなどが挙げられる。
【0048】
本発明明細書中、「DNAマイクロアレイ」としては、例えば、アジレント社、アフィメトリクス社などから発売されているオリゴDNAアレイ、その他のオリゴDNAアレイ、cDNAアレイなどの蛍光により発現量を捉えるアレイ、化学発光あるいはラジオアイソトープ量などのその他の手法により発現量を捉えるアレイなどが挙げられる。また、本発明にかかるDNAマイクロアレイは、文献(SCIENCE,VOL.270,p467−470(1995))に記載の方法により製造することができる。
【0049】
本発明明細書中、「タンパク質マイクロアレイ」としては、例えば、抗体アレイなどが挙げられる。
【0050】
本発明明細書中、「遺伝子改変生物」としては、例えば、受容体や酵素などをコードするゲノム上の遺伝子を破壊あるいは相当する改変遺伝子を導入した生物(例えば、ノックアウトマウス、トランスジェニックマウスなど)、これらの生物の細胞もしくはES細胞、特定条件下で標的の遺伝子の機能を停止あるいは発現するよう改変された生物(例えば、Cre−loxマウスなど)、ならびにデコイあるいはsiRNAなどを用いて特定のRNAの機能を阻害した生物などが挙げられる。
【0051】
本発明明細書中、「非遺伝子改変生物」とは、遺伝子改変生物と異なる条件により作製された動物または遺伝子工学的に操作されていない対応する生物を示す。
【0052】
本発明明細書中、「生体作用物質」とは、生体に存在する物質、天然に存在する物質、または人工的に合成された物質であって、生体に何らかの作用を示す物質である。例えば、リゾフォスファチジン酸およびスフィンゴシン−1−リン酸などの生理活性脂質、ホルモン、成長因子、サイトカイン、ケモカイン、およびアミン類などの情報伝達物質、アセチルコリン、グルタミン酸、グリシン、γ−アミノ酪酸、ドーパミン、アドレナリン、ノルアドレナリン、セロトニン、およびオピオイドなどの神経伝達物質、酵素などの蛋白質、生理活性ペプチドなどのペプチド酵素活性化剤・阻害剤、受容体作動薬・拮抗薬などの医薬品・医薬品候補物質、血清、エンドトキシン、毒素などが挙げられる。
【0053】
本発明明細書中、「非添加組織」とは、添加試料と異なる生体作用物質を添加した組織または当該生体作用物質を添加していない組織を示す。
【0054】
本発明明細書中、「因子群」とは、生物個体を構成し、測定対象となり得るすべての試料の組み合わせあるいは集合を意味し、例えば、発現変動遺伝子の組み合わせあるいは集合、さらに具体的には、本発明の実施により選択された遺伝子群を意味する。
【0055】
本発明明細書中、「因子に相当する遺伝子」とは、因子をその生成物とするゲノム遺伝子および/またはcDNAである。
【0056】
本発明のプログラムは、対照試料に対する被検試料における存在量又は活性値が統計的有意確率をもって変動する因子の評価方法であって、例えば、前記(2a)〜(20a)から選択される方法をコンピュータに実行させることができるよう構成される。さらに、前記(2a)〜(20a)の方法を構成する各ステップをそれぞれ実行させる、いわゆるプログラムのモジュールをも含む。
【0057】
本発明明細書中、「対照試料に対する被検試料における存在量又は活性値が統計的有意確率をもって変動する因子の評価方法をコンピュータに実行させるプログラム」における「コンピュータに実行させるプログラム」とは、本発明の方法または本発明の方法に含まれる各ステップをコンピュータに実行させ得るものであれば、いずれの表現形式によって構成されていてもよい。例えば、ソースプログラム(例えば、Basic言語、C言語、C++言語、Java(登録商標)言語、アセンブラ言語、スクリプト言語(例えば、Perl、Ruby、VBScript、ジャバスクリプト、Groovyなど))、それらに対応する実行形式のプログラム、ライブラリファイル、オブジェクトコード、バイトコード、およびこれらのプログラムに圧縮、暗号化などの変換を施したものをも含む。
【0058】
また、本発明のプログラムは、オペレーティングシステム(例えば、ウインドウズ(CE版を含む。)(登録商標)、UNIX(登録商標)、Linux(登録商標)、MacOS(登録商標)、TRON、PalmOS(登録商標)など)上で実行される形式のものであってもよい。
【0059】
さらに、本発明のプログラムは、Java(登録商標)仮想マシンなどの仮想マシンあるいはエミュレートソフトウェア上で実行される形式のものであってもよい。
【0060】
本発明明細書中、「対照試料に対する被検試料における存在量又は活性値が統計的有意確率をもって変動する因子の評価方法を実施する手段を備える装置」における「装置」とは、本発明の方法に含まれる各ステップを実施することができる手段を備える装置であれば、いずれのものでもよい。
【0061】
具体的には、コンピュータコンポーネント、すなわち、中央処理装置(CPU)などの演算処理装置に、必要に応じて主記憶装置、入力/出力(I/O)コントローラ、プログラムを蓄積したコンピュータ読み出し可能な記憶媒体を備えた装置、ネットワークインタフェースなどの通信装置、CRT表示装置あるいは液晶表示装置などの表示装置、キーボード・マウスなどの入力装置、プリンタ装置、スキャナ装置(例えば、本発明にかかる対照試料および被検試料における因子の存在量又は活性値を測定するステップを実施する装置(例えば、DNAマイクロアレイ読み取り装置など))などを内蔵し、あるいはこれらの装置を外部に接続したものから構成されるものを含む。
【0062】
コンピュータコンポーネントにおける「ネットワークインタフェース」は、有線および無線の装置を含み、インターネットに限らず、ローカルエリアネットワーク(特定の機器との1対1の接続を含む。)、あるいは専用回線などに接続されていても構わない。
【0063】
コンピュータコンポーネントにおける「コンピュータ読み出し可能な記憶媒体」としては、リムーバブルハードディスク、光磁気ディスク媒体(MO、MD(登録商標)など)、光ディスク媒体、磁気テープ媒体、磁気ディスク媒体(FDなど)、ハードディスク、ROM(EPROMを含む)、RAM(主記憶装置を含む)、フラッシュメモリ、メモリーカード、USBキー、ICカード、ICタグ、磁気カード、バーコード(二次元のものを含む)などの光学スキャナによる読み取り可能媒体、形状に基づく記憶媒体(パンチカードあるいは紙テープなど)、磁気ドラムなどを、一種類または複数を組み合わせて利用することができ、さらに、NAS、SANなどの有線・無線のネットワークで接続された記憶装置、および有線・無線のネットワークで接続された他のコンピュータシステムに装備されているものをも含み、本発明のプログラムを記憶しているものであっても構わない。
【0064】
コンピュータコンポーネントにおける、「プログラムを蓄積したコンピュータ読み出し可能な記憶媒体を備えた装置」とは、上記の「コンピュータ読み出し可能媒体」の読み込みあるいは読み書きが可能な装置を意味し、例えば、ROM、RAM、固定ディスク装置(例えば、ハードディスクドライブなど)、光学・磁気ディスク記憶装置(例えば、リムーバブルハードディスク、光ディスク記憶装置、FDドライブ、MOドライブ)、磁気テープ記憶装置などの記憶装置およびこれらの複数を組み合わせた物を意味する。
【0065】
コンピュータコンポーネントの形態は、例えば、ディスプレイ一体型パソコン、デスクトップパソコン、ノートパソコン、ワークステーション、サーバ機器、大型コンピュータ、汎用コンピュータ、スーパーコンピュータなどのコンピュータの形状を取るもの、ブレードPCのように一枚の基盤に搭載されたものの他、スキャナ装置・計測機器・実験機器など(例えば、DNAマイクロアレイの読み取り・解析装置など)に組み込まれているもの、あるいは、パームサイズPCや携帯電話などのような従来のパソコンよりも小型のものあるいは家電製品、業務用製品に含まれるもの、建物などの構造物や乗り物に組み込まれたもの(例えば、インテリジェントビルなど)などがあり得るが、これに限定されない。また、コンピュータコンポーネントは、ある用途のための使用を目的として(例えば、DNAマイクロアレイの読み取り・解析用途など)、あるいはパーソナルコンピュータと同等の動作をさせることを目的として、CPUに記憶媒体、入力装置、表示装置、電源装置などを必要に応じて接続して作成したものであっても構わない。
【0066】
本発明におけるコンピュータには、本発明の方法を実施する手段を備えることを特徴とする装置を構成するコンピュータコンポーネントをも含む。
【0067】
本発明の方法を実施する手段を備えることを特徴とする装置は、オペレーティングシステム(例えば、ウインドウズ(CE版を含む)(登録商標)、UNIX(登録商標)、Linux(登録商標)、MacOS(登録商標)、TRON、PalmOS(登録商標)など)を実行するものであってもよく、本発明のプログラムがそのオペレーティングシステム上で実行されてもよい。また、当該装置は、Java(登録商標)仮想マシンなどの仮想マシンあるいはエミュレートソフトウェアを実行するものであってもよく、本発明のプログラムがこの仮想マシンあるいはエミュレートソフトウェア上で実行されてもよい。
【0068】
本発明明細書中、「対照試料に対する被検試料における存在量又は活性値が統計的有意確率をもって変動する因子の評価方法をコンピュータに実行させるプログラムが記録されたコンピュータ読取り可能な記録媒体」における「プログラムが記録されたコンピュータ読取り可能な記録媒体」とは、本発明のプログラムを記録されたコンピュータ読取り可能な記録媒体である。例えば、リムーバブルハードディスク、光磁気ディスク媒体(例えば、MO、MD(登録商標)など)、光ディスク媒体、磁気テープ媒体、磁気ディスク媒体(例えば、FDなど)、ROM(例えば、EPROMを含む)、RAM、ハードディスクドライブ、フラッシュメモリ、メモリーカード、USBキー、ICカード、ICタグ、磁気カード、バーコード(二次元のものを含む。)などの光学スキャナによる読み取り可能媒体、形状に基づく記憶媒体(例えば、パンチカードあるいは紙テープなど)、磁気ドラムなどが挙げられ、このような記憶媒体を複数組み合わせたものも含まれる。
【0069】
光ディスク媒体には、例えばCD、CD−R/RW、DVD−R/RW/RAM/DVD+R/DVD+RW(登録商標)、ブルーレイディスク、HD DVD(登録商標)などが含まれ、「光ディスク記憶装置」は、光ディスク媒体を用いた記憶装置を意味する。
【0070】
磁気テープ媒体には、DAT、QIC、LTO(登録商標)、AIT、VXA(登録商標)、DDS、DLT(登録商標)、カセットテープ、ビデオテープなどが含まれ、「磁気テープ記憶装置」は磁気テープ媒体を用いた記憶装置を意味する。
【発明の効果】
【0071】
本発明の方法、その方法を実行させるコンピュータプログラム、およびその方法を実施する手段を備えた装置は、従来の統計的処理では評価できない、あるいは過小評価されてしまう、疾病を伴うあるいは疾病に起因する遺伝子発現の変動についての統計的有意確率をより正確に評価し、実際に変動している遺伝子を正確に選択することを可能とした。
【0072】
また、現在実用化が進められている多数の蛋白質あるいは代謝物の変動についても、統計的有意確率をより正確に評価し、実際に変動しているものを正確に選択することを可能にすると考えられる。
【発明を実施するための最良の形態】
【0073】
以下の実施例により本発明をさらに具体的に説明するが、本発明は実施例によって限定されることはない。
実施例1:DNAマイクロアレイ実験
前立腺組織(正常試料11例、前立腺肥大試料(病態試料)10例(Global Repository社より購入し、詳細は表1に示す。))のRNAをLow RNA Input Fluorescent Linear Amp Kit添付プロトコル(アジレント社)に従ってCy3で蛍光ラベル化した。共通コントロールとして、Human Universal Reference Total RNA(クローンテック社)とUniversal Human Reference RNA(ストラタジーン社)を等量混合した試料を同様にCy5で蛍光ラベル化した。
【0074】
【表1】

【0075】
DNAマイクロアレイはHuman 1A(アジレント社)を用いて、添付のプロトコルに従ってCy3ラベル試料とCy5ラベル試料を混合してハイブリダイゼーションを行った。ScanArray5000(パーキンエルマー社)で蛍光強度を測定した。蛍光強度を数値化するため、GenePix Pro 6.0(アクソン社)ソフトウェアを用いた。画像を取り込み、画像解析により蛍光強度を数値データに変換した。
実施例2:有意確率の計算
表1の正常試料を対照試料とし、前立腺肥大試料を被検試料として、各遺伝子の蛍光強度を全サンプルの平均で正規化したデータ(Cross-Gene Error Modelを適用)を本発明の自由度を無限大に設定したウェルチのt検定を用いて有意確率を求めた。
【0076】
従来法として、Cross-Gene Error Modelを適用せず、ANOVA一元配置分散分析で解析した結果と本発明の方法で解析した結果との比較を図1に示した。各遺伝子の蛍光強度と発現変動比を分散図とし、有意確率5%未満となった遺伝子を選択し、黒色の点で示した。
【0077】
その結果、従来法では変動比が1に近い遺伝子を多く含んでいるが、本発明の方法では変動が大きい遺伝子をより多く選択していた。よって、本発明により、発現が変動した遺伝子をより信頼性高く選択できることが示された。
【0078】
有意確率5%未満の遺伝子を発現変動遺伝子として選択した結果を表2〜8(表中、Genbank IDはGenbankにおける登録番号であり、p値は本発明の方法によって計算された有意確率、変動比とは対照資料に対する被検試料における発現量の比を表わす。(*)により特記されたGenbank IDは、アジレントアレイにおける識別IDを示し、“−”で示された一般名は命名されていないことを示す。表9においても同じ。)に示した。これらの遺伝子は前立腺肥大マーカー候補として考えられ、特に、表9にまとめた分泌タンパク質は前立腺外の血液、尿、精液中で検出できる前立腺肥大マーカーとして利用できると考えられた。
【0079】
【表2】

【0080】
【表3】

【0081】
【表4】

【0082】
【表5】

【0083】
【表6】

【0084】
【表7】

【0085】
【表8】

【0086】
【表9】

【産業上の利用可能性】
【0087】
本発明の方法、その方法をコンピュータに実行させるプログラム、およびそれら手段を備えた装置を使用することにより、ヒトその他哺乳動物の健康状態、疾病の種類、およびその進行度、治療効果、または薬効もしくは副作用の発現などに応じて発現変動する遺伝子、蛋白質などの生体分子を見いだすことが可能となり、例えば、医薬品開発や治療法開発、例えば、オーダーメイド医療の分野などにおいて極めて有用である。
【図面の簡単な説明】
【0088】
【図1】前立腺肥大試料での各遺伝子の蛍光強度と発現変動比の分散の比較(A)従来法、B)本発明を示す。)。

【特許請求の範囲】
【請求項1】
対照試料に対する被検試料における存在量又は活性値が統計的有意確率をもって変動する因子の評価方法。
【請求項2】
対照試料および被検試料における因子の存在量又は活性値を示す測定値からなるデータセットを統計的処理に付することにより、対照試料に対する被検試料における当該因子の存在量又は活性値の変動についての有意確率を算出するステップを含むことを特徴とする請求項1記載の方法。
【請求項3】
さらに、算出された有意確率に基づき、設定値未満の有意確率を有する当該因子を選択するステップを含むことを特徴とする請求項2記載の方法。
【請求項4】
請求項2記載の方法の前に、対照試料および被検試料における因子の存在量又は活性値を測定するステップおよびその測定値からなるデータセットを構築するステップを含むことを特徴とする請求項2または3記載の方法。
【請求項5】
請求項2記載の統計的処理が、自由度を無限大に設定したウェルチのt検定に付することである請求項2乃至4記載の方法。
【請求項6】
請求項2記載の統計的処理が、(a)乱数発生プログラムを用いて模擬的に作成した、測定誤差を含むものの両群間で実質的な発現変動を伴わない対照試料および被検試料データ、
(b)対照試料および被検試料として同じ実施条件から得られた試料の測定値データ、および
(c)並び替え検定法を用いて対照試料および被検試料の組み合わせを入れ替えて作成した対照試料および被検試料データから選択されるデータを用いて、対照試料および被検試料を解析する時と同等のエラーモデルのもとで、因子毎に得られた有意確率が0〜1に均等分布するか否かに基づき、
(i)自由度を無限大に設定したウェルチのt検定および(ii)被検試料および対照試料の例数に基づいた自由度を採用したウェルチのt検定から選択される検定である請求項2乃至4記載の方法。
【請求項7】
請求項6記載の検定方法選択ステップにおいて、(i)自由度を無限大に設定したウェルチのt検定により適切な結果が得られた場合、あるいは
(ii)被検試料および対照試料の例数に基づいた自由度を採用したウェルチのt検定を行った結果、有意確率が0〜1の範囲の均等分布よりも誤差を越えて悪く見積もられた場合に、自由度を無限大に設定したウェルチのt検定により統計処理されることを特徴とする請求項5記載の方法。
【請求項8】
(i)自由度を無限大に設定したウェルチのt検定、および(ii)被検試料および対照試料の例数に基づいた自由度を採用したウェルチのt検定から得られる結果が、実質的に異なる場合において、自由度を無限大に設定したウェルチのt検定を行う請求項5記載の方法。
【請求項9】
(1)対照試料および被検試料における因子の存在量又は活性値を測定するステップ、
(2)(1)の測定値からなるデータセットを構築するステップ、
(3)(2)のデータセットを、自由度を無限大に設定したウェルチのt検定に付することにより、対照試料に対する被検試料における当該因子の存在量又は活性値の変動についての有意確率を算出するステップ、および
(4)算出された有意確率に基づき、設定値未満の有意確率を有する当該因子を選択するステップを含むことを特徴とする請求項1記載の方法。
【請求項10】
因子が、遺伝子発現生成物である請求項1記載の方法。
【請求項11】
遺伝子発現生成物が、蛋白質、ペプチド、DNA、相補鎖DNA、RNA、メッセンジャーRNA、および相補鎖RNAから選択されるものからなる請求項10記載の方法。
【請求項12】
遺伝子発現生成物が、メッセンジャーRNA、相補鎖DNA、または相補鎖RNAである請求項11記載の方法。
【請求項13】
因子の存在量又は活性値を示す測定値が、遺伝子多型あるいは変異の測定値である請求項2記載の方法。
【請求項14】
請求項2記載のデータセットが、マイクロアレイによる測定データからなるデータセットである請求項2記載の方法。
【請求項15】
被検試料および対照試料の例数が、4以下である請求項6記載の方法。
【請求項16】
請求項3記載の設定値が、0.01〜0.1である請求項3記載の方法。
【請求項17】
対照試料および被検試料における因子の数が、1000個以上である請求項2記載の方法。
【請求項18】
被検試料が、病態組織もしくはそれに含まれる細胞またはそれらの抽出物であり、対照試料が相当する非病態組織もしくはそれに含まれる相当する細胞またはそれらの抽出物である請求項1記載の方法。
【請求項19】
被検試料が、遺伝子改変生物の組織もしくはそれに含まれる細胞またはそれらの抽出物であり、対照試料がその非遺伝子改変生物の組織もしくはそれに含まれる相当する細胞またはそれらの抽出物である請求項1記載の方法。
【請求項20】
被検試料が、生体作用物質を添加した組織もしくはそれに含まれる細胞またはそれらの抽出物であり、対照試料が相当する非添加組織もしくはそれに含まれる相当する細胞またはそれらの抽出物である請求項1記載の方法。
【請求項21】
対照試料に対する被検試料における存在量又は活性値が統計的有意確率をもって変動する因子の評価方法をコンピュータに実行させるプログラム。
【請求項22】
(1)対照試料および被検試料における因子の存在量又は活性値を示す測定値からなるデータセットを統計的処理に付することにより、対照試料に対する被検試料における当該因子の存在量又は活性値の変動についての有意確率を算出するステップ、および
(2)(1)において算出された有意確率に基づき、設定値未満の有意確率を有する当該因子を選択するステップをコンピュータに実行させることを特徴とする請求項21記載のプログラム。
【請求項23】
対照試料に対する被検試料における存在量又は活性値が統計的有意確率をもって変動する因子の評価方法を実施する手段を備える装置。
【請求項24】
(1)対照試料および被検試料における因子の存在量又は活性値を示す測定値からなるデータセットを統計的処理に付することにより、対照試料に対する被検試料における当該因子の存在量又は活性値の変動についての有意確率を算出するステップ、および
(2)(1)において算出された有意確率に基づき、設定値未満の有意確率を有する当該因子を選択するステップを実施する手段を備えることを特徴とする請求項23記載の装置。
【請求項25】
対照試料に対する被検試料における存在量又は活性値が統計的有意確率をもって変動する因子の評価方法をコンピュータに実行させるプログラムが記録されたコンピュータ読取り可能な記録媒体。
【請求項26】
対照試料に対する被検試料における存在量又は活性値が統計的有意確率をもって変動する因子の評価方法を用いて選択された因子群。
【請求項27】
請求項26記載の因子が、その因子に相当する遺伝子である請求項26記載の因子群。

【図1】
image rotate


【公開番号】特開2006−329780(P2006−329780A)
【公開日】平成18年12月7日(2006.12.7)
【国際特許分類】
【出願番号】特願2005−152834(P2005−152834)
【出願日】平成17年5月25日(2005.5.25)
【出願人】(000185983)小野薬品工業株式会社 (180)
【Fターム(参考)】