説明

肺腺癌を判別するための遺伝子セット

【課題】 本発明の課題は、肺癌の組織型、特に肺腺癌を判別する手段を提供することである。
【解決手段】 下記(i)〜(v)の工程により決定された遺伝子セットに含まれる遺伝子の発現を検出することを含む、肺腺癌を判別する方法:
(i)肺腺癌特異的に発現した遺伝子群の発現データを標準化する;
(ii)高判別能遺伝子の順位付けを行い、高判別能遺伝子リストを作成する;
(iii)高判別能遺伝子リストから遺伝子セットを選択する;
(iv)工程(iii)の遺伝子セットの判別能力評価を行う;
(v)判別能力を有する遺伝子セットを決定する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、肺癌の組織型を判別するための遺伝子セットに関する。より詳細には、肺癌の組織型特異的に発現した遺伝子群の発現情報を遺伝子判別分析手法に基づいて統計解析処理することにより同定した、肺癌の組織型の判別に有効な遺伝子セット、および肺癌原発巣組織における当該遺伝子セットの発現情報を用いて肺癌の組織型を判別する方法に関する。
【背景技術】
【0002】
日本における肺癌の死亡率はすべての癌の中で最も高く、近年、増加傾向が多少弱まったとはいえ、依然として増加傾向にある。それに対し、肺癌の病理学的な判定は、経験を積んだ一部の医師による判定に依存している状況である。
【0003】
一方、近年癌そのものに対する分子生物学的な研究は活発に進められている。例えば、肺癌においてはp53などの個々の遺伝子について報告がなされている。しかし、これらの遺伝子のいずれかに注目するだけでは、肺癌の特性を表現するには不十分であるため近年は後述するようにDNAマイクロアレイなどを用いることにより、一度に極めて多数の遺伝子の発現情報を得る試みがなされている。
【0004】
DNAマイクロアレイの測定で得られる大量の遺伝子発現データを統計学的に処理することで、癌の情報を導き出す方法がこれまでに検討されてきている。
【0005】
Golubらは、急性リンパ性白血病(ALL)と急性骨髄性白血病(AML)とは、「predictor」遺伝子群の発現パターンによって判別が可能であることを示した(非特許文献1)。現在の病理学診断を用いればALLとAMLを形態学的に区別することは、それほど困難なことではないが、この論文は、発現プロファイルによる癌の分類の可能性を示した最初の報告であり、これ以降の同様の論文に最も大きな影響を与え、その考え方の基本になっている。
【0006】
Alizadehらは、びまん性大細胞型B細胞リンパ腫患者の末梢血から分種したBリンパ球をサンプルとしてDNAマイクロアレイによる測定を行い、得られた遺伝子発現データの階層的クラスタリングを行うことにより、同病患者の末梢血Bリンパ球は、リンパ組織の胚中心に存在するB細胞に類似した遺伝子発現パターンを示す場合と、in vitroで活性化したB細胞に類似した遺伝子発現パターンを示す場合の2つの場合があることを見出した(非特許文献2)。両者の生存率をKaplan−Meierプロットで調べた結果、後者の発現パターンを示すB細胞を持つ患者は、前者の発現パターンを示すB細胞をもつ患者と比べて予後が悪いことが明らかとなった。加えて、従来からの病理学的診断にも続く予後予測に従うよりも、著者らの行った遺伝子発現情報のクラスタリングで得られた結果の方が、予後との相関性が高いことも明らかとなった。
【0007】
Alizadehらの研究結果は、遺伝子発現情報から臨床的に利用可能な法則性を導き出せたと言う点で、意義があるものといえる。しかし、当該結果は、びまん性大細胞型B細胞リンパ腫についてのみ検証されたに過ぎず、その法則がまったく新たな臨床例についても適用できるかどうかについての検証はなされていない。まして、癌の組織型の判別に適用することについては全く検討されていない。
【0008】
一方、肺癌の組織型特異的な遺伝子発現解析として、近年Wangらはマイクロアレイを用いて肺癌の組織型特異的に発現が高まっている遺伝子を抽出し、ワクチン開発に利用している(非特許文献3)。しかし、Wangらの研究においてリストされた遺伝子は、組織型特異的に発現が高まっている遺伝子群のみである。従って、組織型特異的に発現が低下している遺伝子群を含めた組織型特異的に発現が変動している遺伝子群と肺癌組織型との相関性については検証されていない。
【0009】
【非特許文献1】Science,vol.286,531−537,1999
【非特許文献2】Nature,vol.403,503−511,2000
【非特許文献3】Oncogene,vol.19(12),1519−1528,2000
【発明の開示】
【発明が解決しようとする課題】
【0010】
本発明の課題は、肺癌の組織型、特に肺腺癌を判別する手段を提供することである。
【課題を解決するための手段】
【0011】
本発明者らは、上記課題を解決すべく鋭意検討を行った結果、汎用のDNAマイクロアレイを用いた解析において、肺腺癌と肺腺癌以外の肺癌患者に由来する肺癌原発巣における遺伝子発現データを取得し、それらを統計解析したところ、肺腺癌の判別に有用な遺伝子セットを同定することに成功し、本発明を完成するに至った。
【0012】
すなわち、本発明は以下の発明を包含する。
(1)下記(i)〜(v)の工程により決定された遺伝子セットに含まれる遺伝子の発現を検出することを含む、肺腺癌を判別する方法:
(i)肺腺癌特異的に発現した遺伝子群の発現データを標準化する;
(ii)高判別能遺伝子の順位付けを行い、高判別能遺伝子リストを作成する;
(iii)高判別能遺伝子リストから遺伝子セットを選択する;
(iv)工程(iii)の遺伝子セットの判別能力評価を行う;
(v)判別能力を有する遺伝子セットを決定する。
(2)下記のアクセッション番号で特定される1番目から100番目まで順位付けされた高判別能遺伝子リストから選択される遺伝子を含む遺伝子セットであって、該遺伝子セットの肺腺癌判別率が50%以上である遺伝子セットに含まれる遺伝子の発現を検出することを含む、肺腺癌を判別する方法:
1. NM_004415、2. NM_002882、3. NM_004219、4. AF107495、5. NM_014896、6. NM_013442、7. NM_002046、8. NM_017458、9. NM_016730、10. NM_002592、11. NM_005563、12. NM_001440、13. NM_014880、14. NM_004175、15. NM_007208、16. NM_001780、17. NM_006430、18. NM_001896、19. NM_002492、20. NM_005918、21. NM_024101、22. NM_001463、23. NM_000520、24. NM_016589、25. NM_000574、26. X01677、27. NM_006120、28. NM_018091、29. NM_002306、30. NM_014245、31. NM_002629、32. NM_006938、33. NM_001436、34. NM_006560、35. NM_007283、36. NM_000365、37. NM_016471、38. NM_005973、39. NM_006429、40. NM_002123、41. NM_000204、42. NM_016056、43. NM_004894、44. NM_012114、45. NM_007017、46. NM_006304、47. NM_005804、48. NM_002106、49. NM_018368、50. NM_001719、51. NM_000365、52. NM_004585、53. NM_004804、54. NM_001689、55. NM_014144、56. NM_004052、57. NM_001862、58. NM_016582、59. NM_000317、60. NM_000532、61. NM_006003、62. NM_003096、63. K00558、64. XM_015513、65. NM_058216、66. NM_017819、67. NM_001866、68. NM_001444、69. XM_016257、70. NM_014050、71. NM_000715、72. NM_014312、73. NM_002415、74. NM_001021、75. NM_014373、76. NM_007178、77. NM_004315、78. NM_015874、79. NM_001679、80. NM_003400、81. NM_017873、82. NM_006053、83. NM_003746、84. K00558、85. XM_015840、86. NM_000895、87. NM_012325、88. NM_016100、89. NM_006325、90. NM_002084、91. NM_001891、92. NM_002121、93. NM_000291、94. NM_003347、95. NM_006634、96. NM_005690、97. NM_003859、98. NM_024522、99. NM_004851、100. NM_013341。
(3)遺伝子セットの肺腺癌判別率が70%以上である、(2)記載の方法。
(4)遺伝子セットが、高判別能遺伝子リストの少なくとも1番目から5番目までの遺伝子を含む、(2)または(3)記載の方法。
(5)遺伝子セットが、高判別能遺伝子リストの少なくとも1番目から40番目までの遺伝子を含む、(4)記載の方法。
(6)遺伝子セットが、高判別能遺伝子リストの1番目から40番目までの遺伝子から選択される少なくとも5の遺伝子を含む、(2)または(3)記載の方法。
(7)遺伝子セットが、高判別能遺伝子リストの1番目から40番目までの遺伝子から選択される少なくとも20の遺伝子を含む、(6)記載の方法。
(8)各遺伝子について検出された発現情報を統計解析処理することを含む、(1)〜(7)のいずれかに記載の方法。
(9)下記のアクセッション番号で特定される1番目から100番目まで順位付けされた高判別能遺伝子リストから選択される遺伝子を含む遺伝子セットにおける各遺伝子を特異的に増幅するための少なくとも15塩基長の連続したプライマー、または下記の1番目から100番目まで順位付けされた高判別能遺伝子リストから選択される遺伝子を含む遺伝子セットにおける各遺伝子に特異的にハイブリダイズする少なくとも15塩基長の連続したプローブを含み、該遺伝子セットの肺腺癌判別率が50%以上である、肺腺癌を判別するためのキット:
1. NM_004415、2. NM_002882、3. NM_004219、4. AF107495、5. NM_014896、6. NM_013442、7. NM_002046、8. NM_017458、9. NM_016730、10. NM_002592、11. NM_005563、12. NM_001440、13. NM_014880、14. NM_004175、15. NM_007208、16. NM_001780、17. NM_006430、18. NM_001896、19. NM_002492、20. NM_005918、21. NM_024101、22. NM_001463、23. NM_000520、24. NM_016589、25. NM_000574、26. X01677、27. NM_006120、28. NM_018091、29. NM_002306、30. NM_014245、31. NM_002629、32. NM_006938、33. NM_001436、34. NM_006560、35. NM_007283、36. NM_000365、37. NM_016471、38. NM_005973、39. NM_006429、40. NM_002123、41. NM_000204、42. NM_016056、43. NM_004894、44. NM_012114、45. NM_007017、46. NM_006304、47. NM_005804、48. NM_002106、49. NM_018368、50. NM_001719、51. NM_000365、52. NM_004585、53. NM_004804、54. NM_001689、55. NM_014144、56. NM_004052、57. NM_001862、58. NM_016582、59. NM_000317、60. NM_000532、61. NM_006003、62. NM_003096、63. K00558、64. XM_015513、65. NM_058216、66. NM_017819、67. NM_001866、68. NM_001444、69. XM_016257、70. NM_014050、71. NM_000715、72. NM_014312、73. NM_002415、74. NM_001021、75. NM_014373、76. NM_007178、77. NM_004315、78. NM_015874、79. NM_001679、80. NM_003400、81. NM_017873、82. NM_006053、83. NM_003746、84. K00558、85. XM_015840、86. NM_000895、87. NM_012325、88. NM_016100、89. NM_006325、90. NM_002084、91. NM_001891、92. NM_002121、93. NM_000291、94. NM_003347、95. NM_006634、96. NM_005690、97. NM_003859、98. NM_024522、99. NM_004851、100. NM_013341。
(10)遺伝子セットが、高判別能遺伝子リストの少なくとも1番目から5番目の遺伝子を含む、(9)記載のキット。
(11)遺伝子セットが、高判別能遺伝子リストの1番目から40番目までの遺伝子から選択される少なくとも5の遺伝子を含む、(9)記載のキット。
(12)下記のアクセッション番号で特定される1番目から100番目まで順位付けされた高判別能遺伝子リストから選択される遺伝子を含む遺伝子セットからなり、該遺伝子セットの肺腺癌判別率が50%以上である、肺腺癌を判別するためのマーカー遺伝子セット:
1. NM_004415、2. NM_002882、3. NM_004219、4. AF107495、5. NM_014896、6. NM_013442、7. NM_002046、8. NM_017458、9. NM_016730、10. NM_002592、11. NM_005563、12. NM_001440、13. NM_014880、14. NM_004175、15. NM_007208、16. NM_001780、17. NM_006430、18. NM_001896、19. NM_002492、20. NM_005918、21. NM_024101、22. NM_001463、23. NM_000520、24. NM_016589、25. NM_000574、26. X01677、27. NM_006120、28. NM_018091、29. NM_002306、30. NM_014245、31. NM_002629、32. NM_006938、33. NM_001436、34. NM_006560、35. NM_007283、36. NM_000365、37. NM_016471、38. NM_005973、39. NM_006429、40. NM_002123、41. NM_000204、42. NM_016056、43. NM_004894、44. NM_012114、45. NM_007017、46. NM_006304、47. NM_005804、48. NM_002106、49. NM_018368、50. NM_001719、51. NM_000365、52. NM_004585、53. NM_004804、54. NM_001689、55. NM_014144、56. NM_004052、57. NM_001862、58. NM_016582、59. NM_000317、60. NM_000532、61. NM_006003、62. NM_003096、63. K00558、64. XM_015513、65. NM_058216、66. NM_017819、67. NM_001866、68. NM_001444、69. XM_016257、70. NM_014050、71. NM_000715、72. NM_014312、73. NM_002415、74. NM_001021、75. NM_014373、76. NM_007178、77. NM_004315、78. NM_015874、79. NM_001679、80. NM_003400、81. NM_017873、82. NM_006053、83. NM_003746、84. K00558、85. XM_015840、86. NM_000895、87. NM_012325、88. NM_016100、89. NM_006325、90. NM_002084、91. NM_001891、92. NM_002121、93. NM_000291、94. NM_003347、95. NM_006634、96. NM_005690、97. NM_003859、98. NM_024522、99. NM_004851、100. NM_013341。
(13)高判別能遺伝子リストの少なくとも1番目から5番目までの遺伝子を含む、(12)記載のマーカー遺伝子セット。
(14)高判別能遺伝子リストの1番目から40番目までの遺伝子から選択される少なくとも5の遺伝子を含む、(12)記載のマーカー遺伝子セット。
【発明の効果】
【0013】
本発明により、肺癌の組織型、特に肺腺癌を判別する手段が提供される。
本発明により、肺腺癌とそれ以外の肺癌症例の判別に利用可能な遺伝子セットが提供される。本発明によれば、判別分析の手法を利用することにより、良好な判別率で肺腺癌を予測することができる。
【発明を実施するための最良の形態】
【0014】
遺伝子セットの決定方法
本発明は、下記(i)〜(v)の工程により決定された遺伝子セットに含まれる遺伝子の発現を検出することを含む、肺腺癌を判別する方法に関する:
(i)肺腺癌特異的に発現した遺伝子群の発現データを標準化する;
(ii)高判別能遺伝子の順位付けを行い、高判別能遺伝子リストを作成する;
(iii)高判別能遺伝子リストから遺伝子セットを選択する;
(iv)工程(iii)の遺伝子セットの判別能力評価を行う;
(v)判別能力を有する遺伝子セットを決定する。
【0015】
以下、遺伝子判別分析手法により肺腺癌を判別するための遺伝子セットを決定する方法の一実施形態について説明する。
【0016】
本発明において、遺伝子の発現検出は公知のマイクロアレイを用いて実施することができる。マイクロアレイとしては、目的の遺伝子の発現を検出できるものであれば特に制限されない。好適には、DNAマイクロアレイ、例えば、AceGene(登録商標)(Hitachi Software Engineering Co.,Ltd.)を用いることができる。
【0017】
まず、マイクロアレイによる解析に供するRNAまたはDNAを、哺乳動物、好ましくはヒトの肺癌巣組織および正常肺細胞より精製する。肺癌巣組織および正常肺細胞からRNAを単離・精製する方法、および単離したRNAからcDNAを作成する方法は公知である。得られたRNA量が少量である場合は、逆転写反応により第1鎖cDNAを合成した後、第2鎖のcDNAを合成し、それを鋳型としてアンチセンス鎖のRNA(aRNA:増幅RNA)を増幅してもよい。
【0018】
cDNAまたはaRNAとマイクロアレイ上の特定の遺伝子に対するプローブとのハイブリダイゼーションを検出するために、これらを標識する。例えば、放射性同位元素、化学発光化合物、重金属原子、分光学的マーカー、磁気マーカー、関連酵素、蛍光標識などで標識できる。それぞれの標識対象分子に応じた好適な標識方法は、当業者であれば適宜選択できる。蛍光標識が最も好ましく、蛍光標識には、例えば、フルオレセイン、ジクロロ−フルオレセイン、BODITY(商標)、ROX、ローダミン、Cy2、Cy3、Cy5、IRD40など種々のものが公知であり、いずれも用いてよいが、Cy3、Cy5が特に好ましい。Cy3またはCy5等による標識のためには、cDNAおよびaRNAのいずれの場合にも、合成の際にアミノアリルdUTPを取り込ませる。
【0019】
ハイブリダイゼーションの条件および方法等は、当業者によく知られている。例えば、ハイブリダイゼーションバッファーは、5×SSC、0.5%SDS、4×Denhardt’s solutionなどでよい。ハイブリダイゼーションは、35〜60℃、好ましくは42〜50℃、さらに好ましくは45℃で、2時間以上、好ましくは一晩以上行うとよい。ハイブリダイゼーション条件は、標識分子の量または検出感度等を含む種々の要因に応じて、当業者が適宜設定することができる。ハイブリダイゼーション後、アレイを洗浄して、標識分子を読み取り、シグナルを可視化し、定量化する。
【0020】
定量化された全プローブについて、標識分子由来の蛍光強度をテキスト形式の数値データとして得る。蛍光強度の低い部分は、バックグラウンドの影響を大きく受けるので、例えばCy3とCy5の蛍光強度が1000を超えているなどのカットオフを設けることにより、蛍光強度がカットオフを超えるデータのみを残し、蛍光強度の低いデータを棄却する。例えば、Cy3およびCy5それぞれについて、蛍光強度の値がバックグラウンド値に2標準偏差分だけ足した値よりも大きなプローブについてのデータを利用する。各プローブのCy3とCy5の蛍光強度値の比を算出し、検出感度の補正を行った標準化数値データを得る。
【0021】
データ中に存在する欠測値は、解析方法によっては何らかの方法で補間して、以降の解析に使用してもよい。補間の方法としてはさまざまなものが適用可能であるが、例えば補間する欠測値を含む症例についての全データの平均値に、その欠測値を含む遺伝子の全症例についてのデータの平均値を加えた値から、全症例についての全遺伝子のデータの平均値を引いた値をもって補間する方法がある。他には、Troyanskayaらの報告(Bioinformatics,vol.17,520−525,2001)において3種類の補間方法、すなわちK−Nearest Neighbors(KNN)method、Singular Value Decomposition(SVD)based methodおよびrow average methodによる補間などが挙げられる。これらのうちのいずれかの方法を適用することにより、すべての欠測値を補間することが可能である。場合により、欠測値の補間は実施しなくともよい。
【0022】
かくして選択される標準化数値データ(以下「標準化遺伝子発現データ」と称することもある)は、バックグラウンドの影響を受けておらず、かつ、正常肺組織との比較における肺腺癌巣の遺伝子発現の変動幅が個人差に起因する遺伝子発現変動幅を超えている遺伝子の発現情報を有しており、以降の統計解析の信頼性を確保することができるものである。
【0023】
上記のようにして得られた標準化遺伝子発現データを多変量解析することによって、統計学的処理を行い、遺伝子セットを選択する。
【0024】
以下、図1を参照することにより、遺伝子セットの決定手法の概略について説明する。
【0025】
手順101:
上記標準化遺伝子発現データ中の数値のそれぞれに対応するDNAマイクロアレイ上のプローブ番号のリストと症例番号のリストからなる標準化データマトリックスを用意する。
手順102:
テスト用のデータとして、標準化データマトリックスから1サンプル除去する。
手順103:
後述の高判別能遺伝子の順位付け処理によって、高い判別能力を持つ順番に遺伝子を並べたリスト(高判別能遺伝子リスト)を生成する。
手順104:
手順103によって作成された高判別能遺伝子リストの上位から順番に遺伝子を抜き取ることにより遺伝子セットを選択し、手順102において除去しておいたテスト用サンプルが肺腺癌であるかどうか判別を行う。判別の方法は、後述の手順301〜手順306に従う。
手順105:
テスト用に除去していたサンプルを元に戻す。
手順106:
解析の途中、サンプルは1度だけ除去される。1度も除去されていないサンプルが存在した場合、手順102に戻り、そのサンプルをテスト用サンプルとして除去して解析を進める。
手順107:
解析したすべての結果を総合し、遺伝子セットの判別率が評価基準以上であるならば、得られたその遺伝子セットを採択し、判別率が評価基準以下である場合、その遺伝子セットは採用せず、処理を終了する。以上の手順を繰りかえすことによって、遺伝子セットを決定する。
【0026】
図1における手順103の高判別能遺伝子の順位付け処理は、手順201〜204にしたがって実施される(図2)。本処理は、Golubらの方法(Science.vol.286,531−537,1999)に従って実施できる。処理は、標準化データマトリックス中に含まれる遺伝子を1つ1つ順に処理する。
【0027】
手順201:
ある遺伝子Nを処理対象とした際、サンプルは肺腺癌由来のサンプルか、肺腺癌以外の癌に由来するかラベルがつけられている。それぞれのラベルを基に以下の式1を用いて、その遺伝子が肺腺癌の判別分析にどの程度有用であるかを示す指標としてSignal To Noise Ratio値を計算する。
【0028】
[式1]

【0029】
式1中のμは肺腺癌サンプルの遺伝子発現比率の平均値、μIIは非肺腺癌サンプルの遺伝子発現比率の平均値、σは肺腺癌サンプルの遺伝子発現比率の標準偏差、σIIは非肺腺癌サンプルの遺伝子発現比率の標準偏差を表す。
【0030】
手順202:
各サンプルにつけられているラベルをランダムに入れ替えて、式1を用いて再度Signal to Noise Ratioの値を計算する。
手順203:
手順202の処理を所定の回数繰り返す。なお、Golubらは400回で行っていたが、本発明の実施例では手順202を1000回繰り返した。
手順204:
手順201、202によって計算された数値を元に、手順201において計算されたSignal To Noise Ratio値のpValueを計算し、pValueが一定値以上(p>=0.01)の遺伝子を除去する。
手順205:
標準化データマトリックスを手順202で計算されたSignal to Noise Ratioの順に並び替える。
【0031】
図1における手順104の遺伝子セットの判別能力評価は、手順103によって作成された、順位付け処理された高判別能遺伝子リストから選択した遺伝子セットについて実施される。本処理は、Golubらの方法(Science,前掲)に従って実施できる(図3)。手順103によって作成された、高判別能遺伝子リストを上位から一定個数ずつ抜き取って遺伝子セットを選択し、手順102で除去されたサンプルが肺腺癌であるかどうかを判別する。
【0032】
手順301:
手順102において、順位付けされた遺伝子リストの上位1〜N番目の遺伝子を抜き出した遺伝子セットを選択する。
手順302:
手順301によって、抜き出された遺伝子セットを利用して、手順102によって除去されている1サンプルが、肺腺癌か、肺腺癌以外かを判別するために、以下の式2を利用して、重み付投票値Vを計算する。
【0033】
[式2]

【0034】
遺伝子iに関して、式2中のμは、肺腺癌サンプルの遺伝子発現比率の平均値、μIIは非肺腺癌サンプルの遺伝子発現比率の平均値、xは判別したいサンプル中に含まれる遺伝子iの発現率の値、p(g,c)がSignal To Noise Ratioの値を表す。
【0035】
の値がμに近いかμIIに近いかによって、投票の方向を決定し、投票値としてVを利用する。
【0036】
手順303:
手順301によって抜き出された遺伝子セットに含まれる遺伝子すべてに対して、上記式2を利用して投票を行い、最終的に投票値の絶対値が大きいほうを、その遺伝子セットによって、決定された判別値とする。
手順304:
なお、手順302で得られた投票値を用いて、その予測がどの程度確からしいかをPrediction Scoreとして、以下の式3を用いて計算を行う。
Prediction Score:
【0037】
[式3]

【0038】
winは、勝った方に投票した投票値の総数であり、Vlooseは負けた方に投票した投票値の総数である。
【0039】
手順305:
手順102において除去されたサンプルは、事前に肺腺癌であるかどうかはわかっているので、今回予測された結果と比べて分析が当たっていたかどうかを調べる。
手順306:
Golubらの方法(Science,前掲)に従い、手順304で計算されたPrediction Scoreが、使用遺伝子数のルート1/2以下の場合、その判別結果は判定不能とする。
【0040】
図1の手順107においては、手順106までの処理において順位付けされた高判別能遺伝子リストの上位から順番に抜き出した遺伝子セットの判別率(正解数/(正解数+誤答数))を計算することによって当該遺伝子セットの判別能力評価を行う。通常、50%以上、好ましくは70%以上、より好ましくは90%以上、さらに好ましくは95%以上の判別率(判別能力)を有する遺伝子セットを、高判別能遺伝子セットとして決定する(図4)。
【0041】
そして、未知のサンプルにおける、決定された遺伝子セットに含まれる遺伝子の発現を検出し、得られた発現情報を手順301〜306に準じて統計処理すること、肺腺癌を判別することができる(図3および図6)。
【0042】
遺伝子リスト
本発明において、高判別能遺伝子リストは、好ましくは、以下の1番目から100番目まで順位付けされた遺伝子リストである(表1)。当該遺伝子リストに含まれる各遺伝子の塩基配列およびアミノ酸配列については、記載のアクセッション番号でGenBank(http://www.ncbi.nlm.nih.gov)に登録されている。
【0043】
【表1】


【0044】
上記遺伝子リストに含まれる遺伝子は、上記データベースに登録されている塩基配列で特定される遺伝子である。また、本発明における遺伝子リストに含まれる各遺伝子には、上記データベースに登録されている塩基配列からなる遺伝子、ならびに該遺伝子と機能的に同等な遺伝子が包含される。ここで「機能的に同等」とは、対象となる遺伝子によってコードされるポリペプチドが、上記データベースに登録された塩基配列からなる遺伝子によってコードされるポリペプチドと同等の生物学的機能、生化学的機能を有することを指す。
【0045】
あるポリペプチドと機能的に同等なポリペプチドをコードする遺伝子を調製する当業者によく知られた方法としては、ハイブリダイゼーション技術(Sambrook,J.et al.,Molecular Cloning 2nd ed.,9.47−9.58,Cold Spring Harbor Lab.press,1989)を利用する方法が挙げられる。なお、本明細書中において、「遺伝子」という用語には、DNAのみならずそのmRNAやcDNAも含むものとする。また、全長遺伝子のみならずESTも含むものとする。
【0046】
従って、各塩基配列で特定される遺伝子には、各塩基配列の全部または一部を含む塩基配列からなる遺伝子が包含される。塩基配列の一部とは、各塩基配列の一部分の塩基配列であって、ストリンジェントな条件下でハイブリダイズさせるのに十分な塩基配列の長さを有するものであり、例えば、少なくとも15塩基、好ましくは少なくとも100塩基、より好ましくは少なくとも200塩基の配列である。好ましくは各塩基配列において連続する少なくとも15塩基、好ましくは少なくとも100塩基、より好ましくは少なくとも200塩基の配列である。ここで「連続する」とは、基準とする塩基配列のうち連続した塩基配列を含むことを意味する。
【0047】
本明細書において、ストリンジェントな条件とは、特異的なハイブリッドが形成され、非特異的なハイブリッドが形成されない条件をいい、すなわち、各塩基配列に対し高い相同性(相同性または同一性が60%以上、好ましくは70%以上、より好ましくは80%以上、さらに好ましくは90%以上、最も好ましくは95%以上)を有するポリヌクレオチドがハイブリダイズする条件をいう。より具体的には、このような条件は、当該分野において周知慣用な手法、例えば、コロニーハイブリダイゼーション法、プラークハイブリダイゼーション法、マイクロアレイ法またはサザンブロットハイブリダイゼーション法などにおいて、具体的には、コロニーまたはプラーク由来のポリヌクレオチドを固定化したメンブランを用いて、0.7〜1.0MのNaCl存在下、65℃でハイブリダイゼーションを行った後、0.1〜2倍濃度のSSC(Saline Sodium Citrate;150mM 塩化ナトリウム、15mM クエン酸ナトリウム)溶液を用い、65℃でメンブランを洗浄することにより達成できる。
【0048】
これらの条件において、温度を上げる程に高い相同性を有するポリヌクレオチドが効率的に得られることが期待できる。但し、ハイブリダイゼーションのストリンジェンシーに影響する要素としては温度や塩濃度など複数の要素が考えられ、当業者であればこれら要素を適宜選択することで同様のストリンジェンシーを実現することが可能である。
【0049】
また、塩基配列情報を基に合成したプライマーを用いる遺伝子増幅法、例えば、ポリメラーゼ連鎖反応(PCR)法、LAMP法などを利用して、各遺伝子と機能的に同等な遺伝子を単離することも可能である。
【0050】
これらハイブリダイゼーション技術や遺伝子増幅技術により単離される、機能的に同等な遺伝子は、通常、アミノ酸配列レベルにおいて高い相同性を有する。高い相同性とは、アミノ酸レベルにおいて、通常、少なくとも50%以上の同一性、好ましくは75%以上の同一性、さらに好ましくは85%以上の同一性、さらに好ましくは95%以上の同一性を指す。
【0051】
アミノ酸配列や塩基配列の同一性は、Karlin and AltschulによるアルゴリズムBLAST(Proc.Natl.Acad.Sci.USA,vol.90,5873−5877,1993)によって決定することができる。このアルゴリズムに基づいて、BLASTNやBLASTXと呼ばれるプログラムが開発されている(Altschul et al.,J.Mol.Biol.vol.215,403−410,1990)。これらの解析方法の具体的な手法は公知である(http://www.ncbi.nlm.nih.gov.)。
【0052】
遺伝子セット
本発明における肺腺癌を判別するための好適な遺伝子セットは、1番目から100番目まで順位付けされた表1の遺伝子リストから選択される遺伝子を含む遺伝子セットであって、その肺腺癌判別率が50%以上、好ましくは70%以上、より好ましくは90%以上、さらに好ましくは95%以上の遺伝子セットである。ここで、肺腺癌判別率は上記の方法により決定されるものである。本発明における遺伝子セットは、表1の遺伝子リストから選択される少なくとも5遺伝子、好ましくは5〜50遺伝子、より好ましくは10〜40遺伝子、さらに好ましくは20〜30遺伝子を含む。
【0053】
より具体的には、本発明における肺腺癌を判別するための好適な遺伝子セットは、1番目から100番目まで順位付けされた表1の遺伝子リストの少なくとも1番目から5番目までの遺伝子、好ましくは少なくとも1番目から10番目までの遺伝子、さらに好ましくは少なくとも1番目から25番目までの遺伝子を含む。上記遺伝子リストにおいて、少なくとも1番目から30番目までの遺伝子を含む遺伝子セット、少なくとも1番目から35番目までの遺伝子を含む遺伝子セット、少なくとも1番目から40番目までの遺伝子を含む遺伝子セット、少なくとも1番目から45番目までの遺伝子を含む遺伝子セット、少なくとも1番目から50番目までの遺伝子を含む遺伝子セット、少なくとも1番目から55番目までの遺伝子を含む遺伝子セット、少なくとも1番目から60番目までの遺伝子を含む遺伝子セット、少なくとも1番目から80番目までの遺伝子を含む遺伝子セットが好ましく、少なくとも1番目から40番目までの遺伝子を含む遺伝子セットが最も好ましい。
【0054】
ここで例えば、「1番目から100番目まで順位付けされた表1の遺伝子リストの少なくとも1番目から40番目までの遺伝子を含む遺伝子セット」とは、1番目から40番目までの遺伝子以外の遺伝子を含んでいてもよいことを意味し、好ましくは1番目から100番目まで順位付けされた表1の遺伝子リストに含まれるその他の遺伝子を含む。
【0055】
また、好適な遺伝子セットの別の具体例としては、1番目から100番目まで順位付けされた表1の遺伝子リストの1番目から40番目までの遺伝子から選択される少なくとも5の遺伝子、好ましくは少なくとも10の遺伝子、さらに好ましくは少なくとも20の遺伝子、より好ましくは少なくとも30の遺伝子を含む遺伝子セットが挙げられる。
【0056】
ここで例えば、「上記遺伝子リストの1番目から40番目までの遺伝子から選択される少なくとも5の遺伝子を含む遺伝子セット」とは、上記と同様に、1番目から40番目までの遺伝子以外の遺伝子を含んでいてもよいことを意味し、好ましくは1番目から100番目まで順位付けされた表1の遺伝子リストに含まれるその他の遺伝子を含む。
【0057】
本発明の遺伝子セットに含まれる遺伝子のうちの、50%以上、好ましくは70%以上、より好ましくは80%以上、さらに好ましくは90%以上、最も好ましくは95%以上の遺伝子が、1番目から100番目まで順位付けされた表1の遺伝子リストに含まれる遺伝子であることが好ましい。
【0058】
本発明の遺伝子セットに含まれる遺伝子の数は、通常1〜100個、好ましくは5〜80個、より好ましくは10〜50個、さらに好ましくは20〜40個である。
【0059】
未知サンプルにおいて、これらの遺伝子セットに含まれる遺伝子の発現を検出することにより、肺腺癌を高い判別率で、確実に判別することができる。
【0060】
遺伝子の発現を検出する方法
本発明における肺腺癌を検出する方法は、被検体由来のサンプルにおいて、本発明の遺伝子セットに含まれる遺伝子の発現を検出することを含む。被検体由来のサンプル中における各遺伝子の発現を検出する方法としては、被検体由来のサンプル中の各遺伝子によってコードされるポリペプチドを検出する方法、被検体由来のサンプル中の各遺伝子の全部または一部であるポリヌクレオチド、特にmRNAを検出する方法が挙げられる。ここで、mRNAの検出には、該RNAから変換されたcDNA、cRNAおよびaRNAの検出も包含される。本明細書において、ポリヌクレオチドには、オリゴヌクレオチドも包含され、ポリペプチドには、オリゴペプチドおよびタンパク質が包含される。
【0061】
すなわち、本発明における肺腺癌を判別する方法は、上記遺伝子セットに含まれる遺伝子をマーカーとして用いるものである。以下に、本発明の一実施形態として、本発明の遺伝子セットに含まれる各遺伝子のmRNAを検出することにより、各遺伝子の発現を検出する方法について説明する。
【0062】
被検体由来のサンプル中のmRNAを検出する方法としては、各遺伝子を特異的に増幅するための、少なくとも15塩基長の連続したプライマーまたは各遺伝子に特異的にハイブリダイズする少なくとも15塩基長の連続したプローブを用いて被検体由来のサンプル中の各遺伝子の発現を検出する方法が挙げられる。
【0063】
該プライマーまたはプローブは、被検体由来のサンプル中に発現している各遺伝子のmRNAまたはmRNAから合成したcDNAまたはcRNAと特異的に結合することから、これらを用いてサンプル中の遺伝子の発現を検出することができる。
【0064】
本発明のプライマーは、各遺伝子の少なくとも一部を増幅するものであればよい。プライマーおよびプローブは、当業者に公知の手法に従って、設計することができる。プライマーおよびプローブ設計の留意点として、例えば以下を指摘することができる。
【0065】
プライマーとして実質的な機能を有する長さは、通常15塩基以上、好ましくは16〜50塩基であり、さらに好ましくは18〜30塩基である。またプローブとして実質的な機能を有する長さとしては、通常15塩基以上、好ましくは16〜1000塩基、さらに好ましくは50〜500塩基である。
【0066】
また設計の際には、プライマーまたはプローブの融解温度(Tm)を確認することが好ましい。Tmとは、任意のポリヌクレオチド鎖の50%がその相補鎖とハイブリッドを形成する温度を意味し、鋳型ポリヌクレオチドとプライマーまたはプローブとが二本鎖を形成してアニーリングまたはハイブリダイズするためには、アニーリングまたはハイブリダイゼーションの温度を最適化する必要がある。一方、この温度を下げすぎると非特異的な反応が起こるため、温度は可能な限り高いことが望ましい。従って、設計しようとするプライマーまたはプローブのTmは、増幅反応またはハイブリダイゼーションを行う上で重要な因子である。Tmの確認には、公知のプライマーまたはプローブ設計用ソフトウエアを利用することができ、本発明で利用可能なソフトウエアとしては、例えばOligoTM(National Bioscience Inc.)、GENETYX(ソフトウェア開発(株))などが挙げられる。またTmの確認は、ソフトウエアを使わず、自ら計算することによっても行うことができる。その場合には、最近接塩基対法(Nearest Neighbor Method)、Wallance法、GC%法等に基づく計算式を利用することができる。本発明では、平均Tmが約45〜65℃であることが好ましい。
【0067】
プライマーまたはプローブとして特異的なアニーリングまたはハイブリダイズが可能な条件としては、その他にもGC含量などがあり、そのような条件は当業者に周知である。
【0068】
上述のように設計したプライマーおよびプローブは、当業者に公知の方法に従って調製することができる。さらに、当業者には周知のように、プライマーまたはプローブには、アニーリングまたはハイブリダイズする部分以外の配列、例えばタグ配列などの付加配列が含まれていてもよく、上述したプライマーまたはプローブにそのような付加配列が付加されたものも本発明の範囲内に含まれるものとする。
【0069】
各遺伝子に特異的にハイブリダイズする少なくとも15塩基長の連続したプローブとしては、例えば、市販のマイクロアレイに含まれるプローブを用いることができる。例えば、AceGene(登録商標)(Hitachi Software Engineering Co.,Ltd.)に含まれるプローブが挙げられる。
【0070】
被検体由来のサンプルにおける各遺伝子の発現を検出するためには、上記プライマーおよび/またはプローブをそれぞれ増幅反応またはハイブリダイゼーション反応において用い、その増幅産物またはハイブリッド産物を検出する。
【0071】
被検体由来のサンプルとしては、血液、肺組織などの生体由来サンプルを対象とすることができ、好ましくは肺組織を用いる。
【0072】
本発明において、判別の対象となる被検体は、好ましくは哺乳動物、特にヒトである。
【0073】
増幅反応またはハイブリダイゼーション反応を行う場合には、通常は、被検体由来のサンプルから被検ポリヌクレオチドを調製する。被検ポリヌクレオチドは、DNAまたはRNAのいずれでもよい。DNAまたはRNAは、当技術分野で周知の方法を適宜使用して抽出することができる。例えば、DNAを抽出する場合には、フェノール抽出およびエタノール沈殿を行う方法、ガラスビーズを用いる方法など、またRNAを抽出する場合には、グアニジン−塩化セシウム超遠心法、ホットフェノール法、またはチオシアン酸グアジニウム−フェノール−クロロホルム(AGPC)法などを利用することができる。以上のように調製したサンプルまたは被検ポリヌクレオチドを用いて、以下に示す増幅反応および/またはハイブリダイゼーション反応を行う。
【0074】
抽出されたRNAはさらに精製してmRNAとして使用することが好ましい。精製方法は特に限定されないが、真核細胞の細胞質に存在するmRNAの多くは、その3’端にポリ(A)配列を持つため、この特徴を利用して、例えば、以下のように実施することができる。まず抽出した全RNAにビオチン化オリゴ(dT)プローブ を加えてポリ(A)+RNAを吸着させる。次に、ストレプトアビジンを固定化した常磁性粒子担体を加え、ビオチン/ストレプトアビジン間の結合を利用して、ポリ(A)+RNAを捕捉させる。洗浄操作の後、最後にオリゴ(dT)プローブからポリ(A)+RNAを溶出する。また、オリゴ(dT)セルロースカラムを用いてポリ(A)+RNAを吸着させ、これを溶出して精製する方法を採用してもよい。溶出されたポリ(A)+RNAは、さらに、ショ糖密度勾配遠心法等により分画してもよい。
【0075】
プライマーを用いて被検ポリヌクレオチドを鋳型とした増幅反応を行い、その特異的増幅反応を検出することにより、サンプル中の各遺伝子の発現を検出することができる。
【0076】
増幅手法としては、特に限定されないが、ポリメラーゼ連鎖反応(PCR)法の原理を利用した公知の方法、例えば、PCR法、RT−PCR法、リアルタイムPCR法等が挙げられる。その他の増幅手法としては、LAMP(Loop−mediated isothermal Amplification)法、ICAN(Isothermal and Chimeric primer−initiated Amplification of Nucleic acids)法、RCA(Rolling Circle Amplification)法、LCR(Ligase Chain Reaction)法、SDA(Strand Displacement Amplification)法などを挙げることができる。増幅は、増幅産物が検出可能なレベルになるまで行う。
【0077】
例えば、PCR法は、被検ポリヌクレオチドであるDNAを鋳型として、DNAポリメラーゼにより、一対のプライマー間の塩基配列を合成するものである。PCR法によれば、変性、アニーリングおよび合成からなるサイクルを繰り返すことによって、増幅断片を指数関数的に増幅させることができる。PCR法の最適条件は、当業者であれば容易に決定することができる。
【0078】
またRT−PCR法では、まず、被検ポリヌクレオチドであるRNAを鋳型として、逆転写酵素反応によりcDNAを作製し、その後、作製したcDNAを鋳型として一対のプライマーを用いてPCR法を行うものである。
【0079】
なお、増幅手法として競合PCR法やリアルタイムPCR法等の定量的PCR法などを採用することにより、定量的な検出が可能となる。リアルタイムPCR(TaqMan PCR)法では、5’端は蛍光色素(レポーター)で、3’端は蛍光色素(クエンチャー)で標識した、目的遺伝子の特定領域にハイブリダイズするプローブが使用される。プローブは、通常の状態ではクエンチャーによってレポーターの蛍光が抑制されている。この蛍光プローブ を目的遺伝子に完全にハイブリダイズさせた状態で、その外側からTaq DNAポリメラーゼを用いてPCRを行う。Taq DNAポリメラーゼによる伸長反応が進むと、そのエキソヌクレアーゼ活性により蛍光プローブ が5’端から加水分解され、レポーター色素が遊離し、蛍光を発する。リアルタイムPCR法は、この蛍光強度をリアルタイムでモニタリングすることにより、鋳型DNAの初期量を定量する。
【0080】
またLAMP法では、計6領域の塩基配列を認識する4種類のオリゴヌクレオチドからなるプライマー、鎖置換合成活性を有する核酸合成酵素、および基質を用い、熱変性工程を必要とせずに、終始等温で速やかに特異性の高い遺伝子増幅反応が進行する。LAMP法の最適条件は、当業者であれば容易に決定することができる。
【0081】
上記増幅反応後に特異的な増幅反応が起こったか否かを検出するには、増幅反応により得られる増幅産物を特異的に認識することができる公知の手段を用いることができる。例えば、アガロースゲル電気泳動法等を利用して、特定のサイズの増幅断片が増幅されているか否かを確認することにより、特異的な増幅反応を検出することができる。
【0082】
あるいは、増幅反応の過程で取り込まれるdNTPに、放射性同位体、蛍光物質、発光物質などの標識体を作用させ、この標識体を検出することができる。放射性同位体としては、32P、125I、35Sなどを用いることができる。また蛍光物質としては、例えば、フルオレセン(FITC)、スルホローダミン(SR)、テトラメチルローダミン(TRITC)などを用いることができる。また発光物質としてはルシフェリンなどを用いることができる。
【0083】
これら標識体の種類や標識体の導入方法等に関しては、特に制限されることはなく、従来公知の各種手段を用いることができる。例えば標識体の導入方法としては、放射性同位体を用いるランダムプライム法が挙げられる。
【0084】
標識したdNTPを取り込んだ増幅産物を観察する方法としては、上述した標識体を検出するための当技術分野で公知の方法であればいずれの方法でもよい。例えば、標識体として放射性同位体を用いた場合には、放射活性を、例えば液体シンチレーションカウンター、γ−カウンターなどにより計測することができる。また標識体として蛍光を用いた場合には、その蛍光を蛍光顕微鏡、蛍光プレートリーダーなどを用いて検出することができる。
【0085】
また、プローブを用いてサンプルまたは被検ポリヌクレオチドに対するハイブリダイゼーション反応を行い、その特異的結合(ハイブリッド)を検出することにより、各遺伝子の発現を検出することもできる。
【0086】
ハイブリダイゼーション反応は、プローブが特定のポリヌクレオチドのみと特異的に結合するような条件、すなわちストリンジェントな条件下で行う必要がある。そのようなストリンジェントな条件は当技術分野で周知であり、特に限定されない。ストリンジェントな条件としては、例えばナトリウム濃度が、10〜300mM、好ましくは20〜100mMであり、温度が25〜70℃、好ましくは42〜65℃における条件が挙げられる。
【0087】
ハイブリダイゼーションを行う場合には、プローブに蛍光標識(フルオレセイン、ローダミンなど)、放射性標識(32Pなど)、酵素標識(アルカリホスファターゼ、西洋ワサビパーオキシダーゼ等)、ビオチン標識等の適当な標識を付加することができる。従って、以下に述べる本発明の検出用キットには、上記のような標識を付加したプローブも含まれる。
【0088】
標識化プローブを用いた検出は、サンプルまたはそれから調製した被検ポリヌクレオチドとプローブとをハイブリダイズ可能なように接触させることを含む。「ハイブリダイズ可能なように」とは、上述したストリンジェントな条件下にて特異的な結合が起こる環境(温度、塩濃度)において、ということである。具体的には、サンプルもしくは被検ポリヌクレオチドまたはプローブをスライドグラス、メンブラン、マイクロタイタープレート等の適当な固相に固定化し、標識を付加した被検ポリヌクレオチドまたはプローブを添加することにより、プローブとサンプルまたは被検ポリヌクレオチドとを接触させてハイブリダイゼーション反応を行い、ハイブリダイズしなかったプローブまたは被検ポリヌクレオチドを除去した後、標識を検出する。標識が検出された場合には、サンプルにおいて各遺伝子が発現していることとなる。
【0089】
標識の濃度を指標とすることにより、定量的な検出が可能となる。標識化プローブを用いた検出方法の例としては、サザンハイブリダイゼーション法、ノーザンハイブリダイゼーション法、FISH(蛍光in situハイブリダイゼーション)法等を挙げることができる。
【0090】
その他の検出方法として、例えば、サブトラクション法(Sive,H.L.and John,T.St.(1988)Nucleic Acids Research 16,10937、Wang,Z.,and Brown,D.D.(1991)Proc.Natl.Acad.Sci.U.S.A.88,11505−11509)、ディファレンシャル・ディスプレイ法(Liang,P.,and Pardee,A.B.(1992)Science 257,967−971、Liang,P.,Averboukh,L.,Keyomarsi,K.,Sager,R.,and Pardee,A.B.(1992)Cancer Research 52,6966−6968)、ディファレンシャル・ハイブリダイゼーション法(John,T.St.,and Davis,R.W.Cell(1979)16,443−452)、また、適当なプローブを用いたクロスハイブリダイゼーション法(“Molecular Cloning,A Laboratory Manual”Maniatis,T.,Fritsch,E.F.,Sambrook,J.(1982)Cold Spring Harbor Lab.press)等が挙げられる。
【0091】
上記の方法によって検出された遺伝子発現データに基づき、未知サンプルにおける肺腺癌の判別方法(図6)に従って、肺腺癌を判別することができる。すなわちGolubらの方法に従い、上記の手順301〜306に準じた手順で、該サンプルが由来する被検体が肺腺癌か否かを判別することができる。
【0092】
肺腺癌を判別するためのキット
本発明はまた、肺腺癌を判別するためのキットに関する。該キットは、本発明の遺伝子セットに含まれる遺伝子の発現を検出する手段として、各遺伝子を特異的に増幅するための少なくとも15塩基長の連続したプライマー、または各遺伝子に特異的にハイブリダイズする少なくとも15塩基長の連続したプローブから選択される少なくとも1種を含む。このようなキットとしては、被検成分の種類に応じて各種のものが市販されており、本発明のキットも、本発明の遺伝子セットに含まれる各遺伝子の発現を検出する上記手段を用いることを除き、公知公用のキットに用いられている各要素によって構成することができる。各遺伝子の発現を検出するためのプライマーやプローブに加え、例えば、標識二次抗体、担体、洗浄バッファー、サンプル希釈液、酵素基質、反応停止液、標準物質等を含みうる。
【0093】
本発明により、肺腺癌の予測によって症例に応じたよりよい治療方針の選択が可能であり、または医療経済効果も期待できる。更に本発明の遺伝子セットは肺腺癌の原因として機能する遺伝子、もしくはそれに密接に関連した遺伝子である可能性が高い。従って、これら遺伝子およびその発現産物を標的として薬剤を開発することが期待できる。すなわち、本発明の遺伝子セットは、肺腺癌の治療法開発の標的としても期待できる。
【実施例】
【0094】
実施例1 高判別能遺伝子リストおよび遺伝子セットの決定
肺腺癌で特異的に発現している遺伝子の解析に使用する標識cDNAまたはRNAは、インフォームドコンセントを経て採取された52症例の肺癌巣組織から抽出されたそれぞれの全RNAを用いて調製した。32症例は肺腺癌と診断された症例、20症例は肺腺癌以外の癌と診断された症例である。
【0095】
まず、ヒト肺癌巣組織から全RNAを抽出した。さらに全RNAからは逆転写反応によって、cDNAを合成した。逆転写反応の際にはdNTPとアミノアリルdUTPを一定割合混合したものを加えて、アミノアリルdUTPを取り込んだcDNAを合成した。
【0096】
得られる全RNAが少ない場合は、逆転写反応によりcDNAを合成した後、2本鎖のcDNAを合成し、それを鋳型としてアンチセンス鎖のRNAを増幅した(aRNA:増幅RNA)。RNA増幅の際にdNTPとアミノアリルdUTPを一定の割合で混合したものを加えることで、アミノアリルdUTPを取り込んだaRNAを合成した。
【0097】
上記のcDNAまたはaRNAをエタノール沈殿した後、0.2M炭酸ナトリウムバッファー(NaHCO−NaCO(pH9.0))に溶解した。DMSOに溶解した蛍光色素(Cy3またはCy5)を加えて、常法に従い、cDNAまたはaRNAに取り込ませておいたアミノアリルdUTPとカップリング反応させ、cDNAまたはaRNAを蛍光標識した。有利の蛍光色素を精製により除去した後、aRNAについてはさらにフラグメンテーションバッファー(終濃度0.04M 酢酸トリアミノメタン(pH 8.1)、0.1M酢酸カリウム、0.03M酢酸マグネシウム)を加えて95℃で15分間反応し、aRNAを断片化した。
【0098】
次に、調製したcDNAまたはaRNAとマイクロアレイ(AceGene(登録商標)(Hitachi Software Engineering Co.,Ltd.))とのハイブリダイゼーションを行った。cDNAまたはaRNAにハイブリダイゼーションバッファー(終濃度5×SSC、0.5%SDS、4×Denhardt’s solution)を混合し、上記のマイクロアレイと45℃で一晩ハイブリダイゼーションした。ハイブリダイゼーション後、0.2×SSC−0.1%SDS溶液、0.1×SSC溶液で5分ずつ洗浄した後、蛍光読取装置にて画像をスキャンし、解析ソフト(例えば、DNASIS Array(登録商標)Hitachi software engineering)を用いてシグナル強度を定量化した。
【0099】
定量化された全プローブについて、Cy3とCy5の蛍光強度をテキスト形式の数値データとして得た。蛍光強度の低い部分は、バックグラウンドの影響を大きく受けるので、例えばCy3とCy5の蛍光強度が1000を超えるデータのみを残し、蛍光強度の低いプローブに対する遺伝子の発現データは棄却した。本実施例においては、Cy3およびCy5それぞれについて、蛍光強度の値がバックグラウンド値に2標準偏差分だけ足した値よりも大きなデータのみを利用した。各プローブのCy3とCy5の蛍光強度の比を算出し、検出感度の補正を行った標準化数値データを得た。上記の標準化数値データのうち、ハイブリダイゼーションに供した52症例の10%にあたる6症例以上のサンプルにおいてデータが取得できており(欠測値が5症例以下)、かつ52症例肺癌巣組織および正常肺組織のデータ内で、Cy3とCy5の比の最大値が、1.5倍以上の2738プローブに対応するデータのみを選択した。
【0100】
なお、本実施例においては、以降の処理で欠測値の補間を行わなくても処理が行える解析法を用いているので、欠測値の補間を行わなかった。
【0101】
かくして選択された標準化数値データは、バックグラウンドの影響を受けておらず、Cy3とCy5の検出感度の違いによる誤差も含まず、解析した症例の大半においてデータが取得されており、かつ、正常肺組織との比較における肺腺癌巣の遺伝子発現の変動幅が個人差に起因する遺伝子発現変動幅を超えている遺伝子の発現情報を有しており、以降の統計解析の信頼性を確保することができるものであった。
【0102】
上記標準化遺伝子発現データに基づき、Golubらの方法(Science,前掲)に従い、上記手順101〜107、手順201〜205、および手順301〜306により、高判別能遺伝子リストの作成および遺伝子セットの決定を実施した。本実施例で作成された高判別能遺伝子リストは、上記表1に記載した1番目から100番目まで順位付けされた遺伝子リストである。
【0103】
また本実施例においては、上記遺伝子リストの1番目から、それぞれ5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100番目までの遺伝子を含む各遺伝子セットについて、判別率を測定した。その結果を表2に示す。これらの遺伝子セットを用いた場合の判別率はいずれも95%以上であり、肺腺癌を判別するための遺伝子セットとして有用であることが明らかになった。
【0104】
【表2】

【0105】
上記遺伝子セットのうち、1番目から40番目までの40遺伝子からなる遺伝子セットを表3に示す。また、表3に示した遺伝子セットに5遺伝子を付け加えた45遺伝子からなる遺伝子セットを表4に、表3に示した遺伝子セットから5遺伝子を除いた35遺伝子からなる遺伝子セットを表5に示す。また、そのときの40遺伝子セットが、肺腺癌と、それ以外の癌の間で特異的に変化している様子を示すために、発現比率のカラーマップ表示を図5に記載した。図5においては、遺伝子の発現比率が増大しているものを赤く、減少しているものを黄緑で表示している。図5は表示上、変化を見やすくするために値を遺伝子方向に対して正規化している。同様に、45遺伝子セットの発現比率のカラーマップ表示を図7に、35遺伝子セットの発現比率のカラーマップ表示を図8に記載した。
【0106】
【表3】

【0107】
【表4】

【0108】
【表5】

【0109】
以上から、表1の遺伝子リストの1番目から40番目の遺伝子からなる遺伝子セット、これに5個の遺伝子を追加した45遺伝子セット、およびこれから5個の遺伝子を除いた35遺伝子セットは、いずれも肺腺癌の判別に有用であることがわかる。
【0110】
実施例2 肺腺癌の判別
実施例1で作成した表3〜表5に記載の遺伝子セットを遺伝子マーカーセットとし、図6の未知遺伝子サンプル判別法に従い、上記手法301〜306に準じて、テスト用のサンプル12症例が肺腺癌であるかどうかを判別した。
【0111】
サンプルとして、インフォームドコンセントを経て収集された、肺癌手術時に切除された肺腺癌試料7症例分およびその周辺部より分離された非肺腺癌試料5症例の計12症例のサンプルを準備した。
【0112】
各サンプルから前述のように全RNAを抽出し、これを常法に従い蛍光標識した。調製したRNAとDNAマイクロアレイ(AceGene(登録商標)(Hitachi Software Engineering Co.,Ltd.))とのハイブリダイゼーションを行った後に、洗浄を行い、蛍光読み取り装置にて画像をスキャンし、解析ソフト(DNASIS Array(登録商標)Hitachi software engineering)を用いてシグナル強度を定量化した。定量化された全プローブについてのCy3とCy5の傾向強度をテキスト形式の数値データとして得た。傾向強度の低い部分は、バックグラウンドの影響を大きく受けるので、前述の方法で無効なスポットのデータを除去し、Cy3とCy5の蛍光強度比をとることで、判別したいサンプルの遺伝子発現データを得た。得られた遺伝子発現データ(遺伝子発現情報)を、上記と同様に統計解析処理することにより、肺腺癌か否かの判別を行った。判別結果を表6にまとめた。
【0113】
【表6】

【0114】
表6に示すように、表3〜5に示す遺伝子セットを用いた場合の判別率はいずれも70%を上回っており、いずれの遺伝子セットも、肺腺癌判別に利用可能であることが実証された。
【図面の簡単な説明】
【0115】
【図1】遺伝子セットの決定手法の概略を示す。
【図2】高判別能遺伝子の順位付け処理の概要を示す。
【図3】遺伝子セットの判別能力評価の概要を示す。
【図4】遺伝子セット決定方法の概要を示す。
【図5】40遺伝子セットの発現比率のカラーマップ表示を示す
【図6】未知遺伝子サンプル判別法の概要を示す。
【図7】45遺伝子セットの発現比率のカラーマップ表示を示す。
【図8】30遺伝子セットの発現比率のカラーマップ表示を示す。

【特許請求の範囲】
【請求項1】
下記(i)〜(v)の工程により決定された遺伝子セットに含まれる遺伝子の発現を検出することを含む、肺腺癌を判別する方法:
(i)肺腺癌特異的に発現した遺伝子群の発現データを標準化する;
(ii)高判別能遺伝子の順位付けを行い、高判別能遺伝子リストを作成する;
(iii)高判別能遺伝子リストから遺伝子セットを選択する;
(iv)工程(iii)の遺伝子セットの判別能力評価を行う;
(v)判別能力を有する遺伝子セットを決定する。
【請求項2】
下記のアクセッション番号で特定される1番目から100番目まで順位付けされた高判別能遺伝子リストから選択される遺伝子を含む遺伝子セットであって、該遺伝子セットの肺腺癌判別率が50%以上である遺伝子セットに含まれる遺伝子の発現を検出することを含む、肺腺癌を判別する方法:
1. NM_004415、2. NM_002882、3. NM_004219、4. AF107495、5. NM_014896、6. NM_013442、7. NM_002046、8. NM_017458、9. NM_016730、10. NM_002592、11. NM_005563、12. NM_001440、13. NM_014880、14. NM_004175、15. NM_007208、16. NM_001780、17. NM_006430、18. NM_001896、19. NM_002492、20. NM_005918、21. NM_024101、22. NM_001463、23. NM_000520、24. NM_016589、25. NM_000574、26. X01677、27. NM_006120、28. NM_018091、29. NM_002306、30. NM_014245、31. NM_002629、32. NM_006938、33. NM_001436、34. NM_006560、35. NM_007283、36. NM_000365、37. NM_016471、38. NM_005973、39. NM_006429、40. NM_002123、41. NM_000204、42. NM_016056、43. NM_004894、44. NM_012114、45. NM_007017、46. NM_006304、47. NM_005804、48. NM_002106、49. NM_018368、50. NM_001719、51. NM_000365、52. NM_004585、53. NM_004804、54. NM_001689、55. NM_014144、56. NM_004052、57. NM_001862、58. NM_016582、59. NM_000317、60. NM_000532、61. NM_006003、62. NM_003096、63. K00558、64. XM_015513、65. NM_058216、66. NM_017819、67. NM_001866、68. NM_001444、69. XM_016257、70. NM_014050、71. NM_000715、72. NM_014312、73. NM_002415、74. NM_001021、75. NM_014373、76. NM_007178、77. NM_004315、78. NM_015874、79. NM_001679、80. NM_003400、81. NM_017873、82. NM_006053、83. NM_003746、84. K00558、85. XM_015840、86. NM_000895、87. NM_012325、88. NM_016100、89. NM_006325、90. NM_002084、91. NM_001891、92. NM_002121、93. NM_000291、94. NM_003347、95. NM_006634、96. NM_005690、97. NM_003859、98. NM_024522、99. NM_004851、100. NM_013341。
【請求項3】
遺伝子セットの肺腺癌判別率が70%以上である、請求項2記載の方法。
【請求項4】
遺伝子セットが、高判別能遺伝子リストの少なくとも1番目から5番目までの遺伝子を含む、請求項2または3記載の方法。
【請求項5】
遺伝子セットが、高判別能遺伝子リストの少なくとも1番目から40番目までの遺伝子を含む、請求項4記載の方法。
【請求項6】
遺伝子セットが、高判別能遺伝子リストの1番目から40番目までの遺伝子から選択される少なくとも5の遺伝子を含む、請求項2または3記載の方法。
【請求項7】
遺伝子セットが、高判別能遺伝子リストの1番目から40番目までの遺伝子から選択される少なくとも20の遺伝子を含む、請求項6記載の方法。
【請求項8】
各遺伝子について検出された発現情報を統計解析処理することを含む、請求項1〜7のいずれか1項記載の方法。
【請求項9】
下記のアクセッション番号で特定される1番目から100番目まで順位付けされた高判別能遺伝子リストから選択される遺伝子を含む遺伝子セットにおける各遺伝子を特異的に増幅するための少なくとも15塩基長の連続したプライマー、または下記の1番目から100番目まで順位付けされた高判別能遺伝子リストから選択される遺伝子を含む遺伝子セットにおける各遺伝子に特異的にハイブリダイズする少なくとも15塩基長の連続したプローブを含み、該遺伝子セットの肺腺癌判別率が50%以上である、肺腺癌を判別するためのキット:
1. NM_004415、2. NM_002882、3. NM_004219、4. AF107495、5. NM_014896、6. NM_013442、7. NM_002046、8. NM_017458、9. NM_016730、10. NM_002592、11. NM_005563、12. NM_001440、13. NM_014880、14. NM_004175、15. NM_007208、16. NM_001780、17. NM_006430、18. NM_001896、19. NM_002492、20. NM_005918、21. NM_024101、22. NM_001463、23. NM_000520、24. NM_016589、25. NM_000574、26. X01677、27. NM_006120、28. NM_018091、29. NM_002306、30. NM_014245、31. NM_002629、32. NM_006938、33. NM_001436、34. NM_006560、35. NM_007283、36. NM_000365、37. NM_016471、38. NM_005973、39. NM_006429、40. NM_002123、41. NM_000204、42. NM_016056、43. NM_004894、44. NM_012114、45. NM_007017、46. NM_006304、47. NM_005804、48. NM_002106、49. NM_018368、50. NM_001719、51. NM_000365、52. NM_004585、53. NM_004804、54. NM_001689、55. NM_014144、56. NM_004052、57. NM_001862、58. NM_016582、59. NM_000317、60. NM_000532、61. NM_006003、62. NM_003096、63. K00558、64. XM_015513、65. NM_058216、66. NM_017819、67. NM_001866、68. NM_001444、69. XM_016257、70. NM_014050、71. NM_000715、72. NM_014312、73. NM_002415、74. NM_001021、75. NM_014373、76. NM_007178、77. NM_004315、78. NM_015874、79. NM_001679、80. NM_003400、81. NM_017873、82. NM_006053、83. NM_003746、84. K00558、85. XM_015840、86. NM_000895、87. NM_012325、88. NM_016100、89. NM_006325、90. NM_002084、91. NM_001891、92. NM_002121、93. NM_000291、94. NM_003347、95. NM_006634、96. NM_005690、97. NM_003859、98. NM_024522、99. NM_004851、100. NM_013341。
【請求項10】
遺伝子セットが、高判別能遺伝子リストの少なくとも1番目から5番目の遺伝子を含む、請求項9記載のキット。
【請求項11】
遺伝子セットが、高判別能遺伝子リストの1番目から40番目までの遺伝子から選択される少なくとも5の遺伝子を含む、請求項9記載のキット。
【請求項12】
下記のアクセッション番号で特定される1番目から100番目まで順位付けされた高判別能遺伝子リストから選択される遺伝子を含む遺伝子セットからなり、該遺伝子セットの肺腺癌判別率が50%以上である、肺腺癌を判別するためのマーカー遺伝子セット:
1. NM_004415、2. NM_002882、3. NM_004219、4. AF107495、5. NM_014896、6. NM_013442、7. NM_002046、8. NM_017458、9. NM_016730、10. NM_002592、11. NM_005563、12. NM_001440、13. NM_014880、14. NM_004175、15. NM_007208、16. NM_001780、17. NM_006430、18. NM_001896、19. NM_002492、20. NM_005918、21. NM_024101、22. NM_001463、23. NM_000520、24. NM_016589、25. NM_000574、26. X01677、27. NM_006120、28. NM_018091、29. NM_002306、30. NM_014245、31. NM_002629、32. NM_006938、33. NM_001436、34. NM_006560、35. NM_007283、36. NM_000365、37. NM_016471、38. NM_005973、39. NM_006429、40. NM_002123、41. NM_000204、42. NM_016056、43. NM_004894、44. NM_012114、45. NM_007017、46. NM_006304、47. NM_005804、48. NM_002106、49. NM_018368、50. NM_001719、51. NM_000365、52. NM_004585、53. NM_004804、54. NM_001689、55. NM_014144、56. NM_004052、57. NM_001862、58. NM_016582、59. NM_000317、60. NM_000532、61. NM_006003、62. NM_003096、63. K00558、64. XM_015513、65. NM_058216、66. NM_017819、67. NM_001866、68. NM_001444、69. XM_016257、70. NM_014050、71. NM_000715、72. NM_014312、73. NM_002415、74. NM_001021、75. NM_014373、76. NM_007178、77. NM_004315、78. NM_015874、79. NM_001679、80. NM_003400、81. NM_017873、82. NM_006053、83. NM_003746、84. K00558、85. XM_015840、86. NM_000895、87. NM_012325、88. NM_016100、89. NM_006325、90. NM_002084、91. NM_001891、92. NM_002121、93. NM_000291、94. NM_003347、95. NM_006634、96. NM_005690、97. NM_003859、98. NM_024522、99. NM_004851、100. NM_013341。
【請求項13】
高判別能遺伝子リストの少なくとも1番目から5番目までの遺伝子を含む、請求項12記載のマーカー遺伝子セット。
【請求項14】
高判別能遺伝子リストの1番目から40番目までの遺伝子から選択される少なくとも5の遺伝子を含む、請求項12記載のマーカー遺伝子セット。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate


【公開番号】特開2007−6791(P2007−6791A)
【公開日】平成19年1月18日(2007.1.18)
【国際特許分類】
【出願番号】特願2005−192207(P2005−192207)
【出願日】平成17年6月30日(2005.6.30)
【出願人】(000233055)日立ソフトウエアエンジニアリング株式会社 (1,610)
【出願人】(501002172)株式会社DNAチップ研究所 (33)
【出願人】(304021831)国立大学法人 千葉大学 (601)
【Fターム(参考)】