説明

肥満診断方法

本明細書では、ヒトの腸内ミクロビオームに少なくとも一つの遺伝子が不在であるという判定に基づく新規の肥満診断方法が記載されている。

【発明の詳細な説明】
【技術分野】
【0001】
ヒト腸内微生物叢は、ヒトの健康および福利に対し影響を及ぼすものとして現在充分認知されている複雑な生態系を構成する。それはまさに、免疫系の成熟そして病原体によるコロニー形成に対する直接的障壁に寄与する。20世紀後半全体にわたり、感染症は劇的に減少してきており、主要な病原体は制御できるようになった。同じ時期に、多くの「免疫」疾患が、特に西欧社会において有病率を常に高めてきた。これに該当するのは、アレルギー、炎症性大腸炎、過敏性腸症候群、そして場合によっては代謝性障害や変性疾患、例えば肥満、メタボリック症候群、糖尿病および癌などである。ヒトゲノムの配列から、免疫疾患のリスクの増加と連関する遺伝子を観察することが可能となったが、これらの遺伝子における突然変異は、実際の症例のわずかな部分しか説明できない場合がほとんどであり、遺伝的素因が疾病を実際にひき起こすには環境的誘因が必要である。環境的要素のうち、近年、腸内微生物叢が中心的存在として大きく認知されてきている。
【背景技術】
【0002】
健康なヒトにおける腸内微生物叢の分子組成の分析は、顕著な個体間変動を指摘しているが、このことは、食物繊維の嫌気的消化などの腸内微生物叢の主要な機能が高度に保存されていることを考慮すると、逆説的であると思われるかもしれない。近年の高性能かつ培養非依存型の分子観察により、種の観点からのみならず遺伝子のレベルでのヒト腸内微生物叢内のコア、すなわち、保存されている主要な機能性に関与する可能性のある保存された一連の要素の記述が可能となった。
【0003】
現在の知識では、ヒト腸内微生物叢の正常な状態、すなわちノルモバイオシス(normobiosis)を特定する基準を定義づけすることが可能になっている。これはさらに、免疫疾患、代謝性疾患または変性疾患における、ノルモバイオシスからの特異的なひずみ、すなわち腸内毒素症を同定することを可能にしている。腸内毒素症を調査することは、ホメオスタシスおよびノルモバイオシスを回復または維持することを目的とする戦略の策定のための重要な情報を提供する最初の段階とみなすことができる。さらに、厳密に定義され充分に表現型が確認された疾病情況において腸内毒素症を特定する基準は、診断モデルを策定するための貴重な要素である。
【発明の概要】
【発明が解決しようとする課題】
【0004】
これまでは微生物叢の組成および/または多様性に限定されてきたものの、複数の疾患について腸内毒素症が疑われてきており、例えば肥満などいくつかの症例において、すでに部分的に記載されている。実際、我々のミクロビオームおよび健康表現型を直接変調させる上で決定的役割を果たしているのは、栄養である。バランスの悪い食生活は、腸内ミクロビオームを、健康のパートナーから慢性疾患における「病原体」へと変えてしまう可能性がある。証拠を積み重ねることにより、食生活が崩壊させた腸内微生物叢によって誘発される低悪性度の全身性かつ慢性の炎症を原因として、肥満および関連する代謝性疾患が発現するという仮説が裏づけられる。したがって、肥満を一貫性ある形で診断できるようにする新規の信頼性の高い方法に対するニーズがなおも存在する。
【0005】
大部分の腸内片利共生生物は、培養不能である。この制限を克服するためにゲノム戦略が開発されてきた(HamadyおよびKnight、Genome Res、19:1141−ll52、2009)。これらの戦略は、微生物叢のゲノムに含まれる遺伝子の集合体としてミクロビオームを定義づけすることを可能にした(Turnbaughら、Nature、449:804−8010、2007;HamadyおよびKnight、Genome Res.、19:1141−1152、2009)。ヒト腸内微生物叢の系統発生学上の核を構成する全ての個体が共有する少数の種の存在が、実証されている(Tapら、Environ Microbiol.、11(10):2574−2584、2009)。近年、メタゲノム解析は、576.7ギガベースの配列に対応するヒトの腸の330万個の非冗長微生物遺伝子の広範なカタログを同定するに至った(Qinら、Nature、2010、doi:10.1038/nature08821)。
【課題を解決するための手段】
【0006】
発明者らは、異なる個体におけるヒトの糞便由来のDNA断片の単離および配列決定に基づく方法を使用した。腸由来の微生物遺伝子の広範なカタログが現在入手可能であることから(Qinら、Nature、2010、doi:10.1038/nature08821)、特定の個体群(例えば肥満を患う患者群)における特定の配列のコピー数および頻度を計算することができる。こうして、特定の遺伝子の存在または不在と特定の病状の存在または不在との間の任意の相関関係を同定することが可能である。さらに、個体内の特定の遺伝子のコピー数を決定することが可能である。
【0007】
発明者らは、肥満患者群と痩せ型の健康な人の対照群との間で著しく異なっている遺伝子を同定することができた。これらの遺伝子は表1に列挙されている。前記遺伝子は、患者の場合よりも痩せ型の個体の場合の方が多い。この観察結果は、微生物遺伝子の総数が両方の個体群において異なるものでないため、統計学的に有意である。したがって、肥満を患う個体においては特定のヒト腸内微生物遺伝子の喪失が存在する。
【0008】
本発明の第1の態様は、少なくとも一つの遺伝子が個体の腸内ミクロビオームに不在であるか否かを判定するステップを含む、肥満診断方法である。「個体の腸内ミクロビオーム」とは、本明細書において、前記個体の微生物叢を構成する全ての遺伝子のことである。したがって、「個体の腸内ミクロビオーム」という用語は、前記個体の腸内に存在する全ての細菌の全ての遺伝子に対応する。
【0009】
遺伝子は、ミクロビオーム中のそのコピー数が一定の閾値よりも低い場合に、ミクロビオームに不在である。本発明によると、「閾値」とは、問題の遺伝子のコピー数が個体のミクロビオーム中のコピー数の高低に対応している試料の判別を可能にする値を意味するように意図されている。詳細には、コピー数が閾値以下である場合には、ミクロビオーム中のこの遺伝子のコピー数は低いとみなされ、一方コピー数が閾値を超える場合には、ミクロビオーム中のこの遺伝子のコピー数は高いとみなされる。低いコピー数とは、遺伝子がミクロビオームに不在であることを意味し、一方、高いコピー数は、遺伝子がミクロビオーム中に存在することを意味する。各々の遺伝子で、そして遺伝子のコピー数の測定に用いられる方法に応じて、最適な閾値は変動する場合がある。しかしながら、当業者であれば、コピー数(高低)がこの特定の遺伝子について公知である複数の個体のミクロビオームの解析に基づいて、かつ対照遺伝子のコピー数との比較に基づいて、それを容易に判定できる。
【0010】
本発明の方法はこうして、当業者が個体の腸内ミクロビオーム由来の遺伝子の存在または不在のみに基づいて病状を診断できるようにする。特定の遺伝子のコピー数とこの遺伝子を有する細菌細胞の数との間には直接的相関関係が存在する。本発明の方法はこうして、当業者がミクロビオームの解析により、腸内毒素症、すなわち微生物の平衡失調を検出できるようにする。腸内の種は、大部分が培養不能であるため、その全てが同定されているわけではなく、また同定は困難である。さらに、所与の個体の腸内に発見される大部分の種は希有であり、そのため、それらの検出は困難になっている(HamadyおよびKnight、Genome Res.、19:1141−1152、2009)。本発明のこの第1の態様において、前記遺伝子が帰属する細菌種の事前の同定は全く必要とされない。したがって、本発明の診断方法は、公知の腸内細菌種の個体群における変化を判定することに制限されず、分類学的にまだ特徴づけされていない細菌をも包含する。
【0011】
前記個体の腸内微生物DNAの試料を得るための方法はいくつか存在する(Sokolら、Inflamm.Bowel Dis.、14(6):858−867、2008)。例えば、結腸鏡検査によって得られる粘膜標本または生検材料を調製することが可能である。しかしながら、結腸鏡検査は、研究毎の採取手順が明確に定義されていない侵襲的処置である。同様にして、外科的処置を通して生検材料を得ることもまた可能である。しかしながら、結腸鏡検査よりもさらに増して、外科的処置は侵襲的処置であり、微生物個体群に対するその影響は未知である。好適であるのは、糞便分析であり、これは当該技術分野において信頼されて使用されてきた手順である(Bullockら、Curr Issues Intest Microbiol.;5(2):59−64、2004;Manichanhら、Gut、55:205−211、2006;Bakirら、Int J Syst Evol Microbiol、56(5):931−935、2006;Manichanhら、Nucl.Acids Res.、36(16):5180−5188、2008;Sokolら、Inflamm.Bowel Dis.、14(6):858−867、2008)。この手順の一例は、実験例の方法の節で記載されている。糞便は、1グラム(湿重量)あたり約1011個の細菌細胞を含み、細菌細胞は糞塊の約50%を構成する。糞便の微生物叢は、主に遠位大腸の微生物学を代表するものである。したがって、個体の糞便由来の微生物DNAを大量に単離し解析することは可能である。「微生物DNA」とは、本明細書において、ヒトの腸の常在細菌集団のいずれかに由来するDNAのことである。「微生物DNA」という用語は、コード配列と非コード配列の両方を包含する。詳細には、それは、完全な遺伝子に限定されず、コード配列のフラグメントをも含む。したがって、糞便の分析は非侵襲的処置であり、患者毎に直接比較可能で一貫性のある結果を提供する。
【0012】
したがって、好ましい実施形態においては、本発明の方法は、前記個体の糞便に由来する微生物DNAを得るステップを含む。さらに好ましい実施形態においては、前記個体由来の糞便が採取され、DNAが抽出され、個体の腸内ミクロビオームにおける少なくとも一つの遺伝子の存在または不在が判定される。遺伝子の存在または不在は、当業者にとって公知のあらゆる方法によって判定されてよい。例えば、前記個体のミクロビオーム全体の配列を決定し、前記遺伝子の存在または不在を、バイオインフォマティクスの手法を用いて検索してよい。このような戦略の一例は、実験例の方法の節で記載されている。代替的には、問題の遺伝子を、特異的プローブでのハイブリダイゼーション、例えばサザンハイブリダイゼーションによってミクロビオーム中で探してもよい。この特定の実施形態においてはサザンハイブリダイゼーションが完璧に適してはいるものの、それでもマイクロアレイを使用する方がさらに便利でかつ高感度であるということは、当業者には直ちに明らかである。さらに別の実施形態において、問題の遺伝子の存在は、増幅、詳細には定量的PCR(qPCR)によって検出されてよい。これらの技術(サザン、マイクロアレイ、qPCRなど)は現在、当業者が日常的に使用しているものであり、したがってここで詳述する必要はない。
【0013】
別の好ましい実施形態において、個体の腸内ミクロビオームでの不在または存在が判定される遺伝子は、表1に列挙されている遺伝子群から選択される。当業者であれば、テストされる遺伝子の数が多くなればなるほど結果の信頼度は高くなるということを難なく理解するであろう。別のさらなる好ましい実施形態によると、本発明の方法は、表1に列挙される遺伝子の少なくとも50%、より好ましくは表1の遺伝子の少なくとも75%、さらに一層好ましくは表1の遺伝子の少なくとも90%の存在または不在を決定するステップを含む。
【0014】
微生物叢内に見出される多数の細菌種が同定されていないものの、大部分の細菌がBacteroides、Clostridium、Fusobacterium、Eubacterium、Ruminococcus、Peptococcus、PeptostreptococcusおよびBifidobacteriumの属に帰属することがわかっている。EscherichiaおよびLactobacillusなどの他の属は、より少ない程度で存在する。これらの属に帰属する個別の種の中には同定されているものもあり、これらの種の遺伝子の一部は公知である。330万個の非冗長微生物遺伝子の同定を導いた広範なメタゲノム研究から、大部分の新しい配列の割当ても同様に可能になった。所与の種に帰属する遺伝子は、前記種の他の全ての遺伝子と同じ頻度で一個体内に存在する。こうして、本発明の方法を通して同定された遺伝子の各々について、さまざまな個体内で特定の細菌種に属することが公知である一組の遺伝子の存在または不在と前記遺伝子の存在または不在との間に、相関関係が存在するか否かを判定することが可能である。このような相関関係は、未知の遺伝子が前記特定の細菌種に帰属することを表す。したがって、発明者らは、一部の細菌種が肥満と連関し、一方、他の細菌種は痩せ型の表現型と連関する、ということを示した。肥満の表現型は、前記種の線形組合せによって予測され得る。すなわち、一個体の腸内に肥満の表現型と連関する細菌種が多く存在すればするほど、また前記個体の腸内の痩せ型の表現型と連関する種が少なければ少ないほど、前記個体が肥満を患う確率が高くなる。例えば、ある人の腸内のBacteronides pectinophilus、Eubacterium siraeumおよびClostridium phyto fermentansの不在およびAnaerotruncus colihominisの存在は、この人が肥満を患っていることを表す。
【0015】
当業者にとっては、本発明の遺伝子を、例えば肥満を患う患者の治療中に、バイオマーカーとして使用できるということは明白である。したがって、別の実施形態においては、本発明は、肥満治療の有効性をモニタリングするための方法を含む。治療が肥満に有効である場合、当初観察された腸内毒素症は漸進的に消失する。前記個体が肥満である場合、この個体の腸には一部の特異的遺伝子(例えば表1の遺伝子)が不在であるが、これらの遺伝子は治療中に再度出現する。したがって、この実施形態において、本発明の方法は、前記患者のミクロビオームに少なくとも一つの遺伝子が不在であるか否かをまず判定するステップと、治療を施すステップと、前記少なくとも一つの遺伝子が患者のミクロビオーム中に存在するか否かを判定するステップとを含んでいる。好ましい一実施形態において、本発明の方法は、治療の前と後に前記個体の糞便から微生物DNAを得るステップを含んでいる。さらに好ましい実施形態においては、前記個体由来の糞便は治療の前と後に採取され、DNAが抽出され、個体の腸内ミクロビオームにおける少なくとも一つの遺伝子の存在または不在が判定される。
【0016】
別の好ましい実施形態において、個体の腸内ミクロビオームでの不在または存在が判定される遺伝子は、表1に列挙されている遺伝子群から選択される。特定の一実施形態において、本発明の方法は、表1に列挙されている遺伝子の少なくとも50%、より好ましくは表1の遺伝子の少なくとも75%、さらに一層好ましくは表1の遺伝子の少なくとも90%の存在または不在を判定するステップを含む。
【0017】
本発明は同様に、肥満を患う患者の体内には不在であり痩せ型の健康な人の体内には存在する全ての遺伝子を含む、本発明の方法の実施に専用のキットをも含んでいる。詳細には、本発明は、肥満を患う患者の体内には不在であり痩せ型の人の体内には存在する全ての遺伝子に結合するプローブを含む、本発明に係る方法の実施に専用のマイクロアレイに関する。好ましい実施形態において、前記マイクロアレイは、核酸マイクロアレイである。本発明によると、「核マイクロアレイ」は、マイクロチップ、スライドガラスまたはミクロスフェアサイズのビーズであり得る基材に付着された異なる核酸プローブで構成されている。マイクロチップは、ポリマー、プラスチック、樹脂、多糖類、シリカもしくはシリカベースの材料、炭素、金属、無機ガラスまたはニトロセルロースで構成されていてよい。プローブは、核酸、例えばcDNA(「cDNAマイクロアレイ」)またはオリゴヌクレオチド(「オリゴヌクレオチドマイクロアレイ」、なおオリゴヌクレオチドの長さは約25〜約60塩基対以下である)であり得る。核酸技術の代替として、定量的PCRも使用してよく、したがって試験すべき遺伝子に特異的な増幅プライマーも本発明に係る方法を実施するために非常に有用である。したがって、本発明はさらに、肥満を患う患者の体内では不在であり健康な人の体内には存在する遺伝子に特異的な増幅プライマーまたは上述の通りの専用マイクロアレイを含む、患者の肥満診断専用キットに関する。これらのキットは、当業者が前記遺伝子の10%、25%、50%または75%を検出できるようにすることもあるが、前記遺伝子の90%、95%、97.5%さらには99%の検出を可能にする場合に最も有用である。したがって、本発明に係るマイクロアレイは、前記遺伝子の少なくとも10%、25%、50%または75%、好ましくは90%、95%、97.5%そしてさらに一層好ましくは少なくとも99%に結合するプローブを含む。同様にして、定量的PCR用のキットは、前記遺伝子の少なくとも10%、25%、50%または75%、好ましくは90%、95%、97.5%そしてさらに一層好ましくは少なくとも99%の増幅を可能にするプライマーを含むものである。好ましい実施形態において、肥満患者の体内には不在であり、痩せ型の人の体内には存在する遺伝子は、表1に列挙されている遺伝子である。
【図面の簡単な説明】
【0018】
【図1】BMI遺伝子の包括的分析:健康な個体にはより多くのBMI遺伝子が存在する。A)BMIに応じた一個体あたりの遺伝子の数のプロットは、肥満の個体に比べて痩せ型の個体において遺伝子が多いことを表している。B)遺伝子数によるランキングおよび20のグループによるビニングは、痩せ型が分布の最上部にあり、67名の痩せ型のうち50名が最初の3つのビン内にあることを示している。
【図2】A)4つの種の線形組合せが、規定されたレベル(遺伝子の少なくとも50%)でそれらを有するコホートの部分について肥満の表現型を充分に判別している。痩せ型および肥満の個体は、それぞれ青色および赤色の点で示されている。B)「優良種」の遺伝子の少なくとも半分を「不良」を上回って、または「不良種」の遺伝子の半分を「優良」を上回って有する個体のグループ(それぞれカットオフ>0.5および<−0.5)。
【0019】
方法
ヒト糞便試料の採取。デンマーク人の個体は、Inter−99コホート(Toftら、Prev.Med.、47:378−383、2008)由来であり、BMI(肥満度指数)および肥満/糖尿病への進行状況に応じて表現型が異なっていた。患者および健康な対照には、凍結させた排泄物試料の提供を求めた。新鮮な排泄物試料を自宅で採取し、試料を自宅の冷凍庫に保管することによって直ちに凍結させた。凍結した試料を、断熱発泡スチロールのコンテナを用いて病院まで運び、その後、分析まで−80℃で保管した。
【0020】
DNA抽出。各糞便試料の凍結したアリコート(200mg)を、250μlのチオシアン酸グアニジン、0.1Mのトリス(pH7.5)および40μlの10%N−ラウロイルサルコシン中に懸濁させた。その後、先に記述された通りに(Manichanhら、Gut、55:205−211、2006)、DNA抽出を行った。DNA濃度およびその分子サイズを、ナノドロップ(Thermo Scientific)およびアガロースゲル電気泳動によって推定した。
【0021】
DNAライブラリーの構築および配列決定。DNAライブラリーを、メーカーの指示(Illumina)にしたがって調製した。クラスタ生成、鋳型ハイブリダイゼーション、等温増幅、線形化、遮断および変性、ならびに配列決定用プライマーのハイブリダイゼーションを実施するために、他の箇所で記載されたものと同じワークフローを使用した。蛍光原画像を処理し配列を呼び出すために、塩基呼び出しパイプライン(IlluminaPipeline−0.3バージョン)を使用した。実験再現性の検証のために、最初の15の試料の各々について一つのライブラリー(クローンインサートサイズ200bp)を構築し、そして残りの109の試料の各々について、異なるクローンインサートサイズ(135bpおよび400bp)を有する二つのライブラリーを構築した。新規配列の生成と配列決定深度との間の最適なリターンを推定するため、Short Oligonucleotide Alignment Program(SOAP)(Liら、Bioinformatics、25:1966−1967、2009)、および95%の配列同一性というマッチ要件を用いて、試料MH0006およびMH0012から得られたIllumina GAリードを、同じ二つの試料(それぞれ156.9および154.7Mb)から生成された合計311.7Mbの468,335Sangerリードに対してアラインした。約4GbのIllumina配列で、Sangerリードの94%および89%(それぞれMH0006およびMH0012について)がカバーされた。それぞれMH0006およびMH0012について12.6および16.6Gbまでのさらなる広範な配列決定は、約95%までの中程度のカバー率の増加しかもたらさなかった。Sangerリードの90%超が、非常に高く均一なレベルまで、Illumina配列によってカバーされたが、これは、Illumina GA配列にはほとんどまたは全く偏りが存在しないことを表している。予期した通り、Illumina配列の大部分(それぞれM0006およびM0012について57%と74%)は新規のものであり、Sangerリード上にマッピングできなかった。この割合は、4および12〜16Gbの配列決定レベルで類似しており、新規のものの大部分が4Gbですでに捕捉されていることを裏付けている。
【0022】
本発明者らは、残りの122の試料について、3540万〜9760万のリードを生成し、平均は6250万リードであった。15の試料の最初のバッチの配列決定リード長は44bpであり、第2のバッチは75bpであった。
【0023】
使用された公開データ。GenBankに寄託されていた配列決定済みの細菌ゲノム(合計806ゲノム)を、2009年1月10日にNCBIデータベース(http://www.ncbi.nlm.nih.gov/)からダウンロードした。公知のヒト腸内細菌ゲノム配列を、HMPデータベース(http://www.hmpdacc−resources.org/cgi−bin/hmp_catalog/main.cgi)、GenBank(67ゲノム)、セントルイスのワシントン大学(85ゲノム、2009年4月バージョン、http://genome.wustl.edu/pub/organism/Microbes/Human_Gut_Microbiome/)からダウンロードし、MetaHITプロジェクト(17ゲノム、2009年9月バージョン、http://www.sanger.ac.uk/pathogens/metahit/)によって配列決定した。このプロジェクトで使用された他の腸内メタゲノムデータには、以下のものが含まれる:(1)登録番号SRA002775でNCBIからダウンロードされた、米国人個体から配列決定されたヒト腸内メタゲノムデータ(Zhangら、Proc.Natl Acad.Sci.USA、106:2365−2370、2009);(2)EMBL(http://www.bork.embl.de)でP.Borkのグループからダウンロードされた、日本人個体に由来するヒト腸内メタゲノムデータ(Kurokawaら、DNA Res.14:169−181、2007)。本研究において本発明者らが構築した統合NRデータベースは、NCBI−NRデータベース(2009年4月バージョン)および公知のヒト腸内細菌ゲノムに由来する全ての遺伝子を含んでいた。
【0024】
Illumina GAショートリード・デノボアセンブリ。各DNA試料の高品質ショートリードを、SOAPデノボアセンブラ(Li.& Zhu、Genome Res.、20(2):265−272、2010)によりアセンブルした。要するに、本発明者らはまず17merの頻度にしたがってアセンブリから存在度の低い配列をフィルタリングした。5未満の深度の17merを、アセンブリの前にスクリーニングしたが、これは、これらの低頻度配列がアセンブルされる可能性がきわめて低く、一方、それらを除去することで所要メモリーが著しく削減され、アセンブリは通常のスーパーコンピュータ(我々の研究機関では512GBメモリー)で実現可能なものとなると考えられるからである。次に、配列を一つずつ処理し、de Bruijnグラフのデータフォーマットを用いて、配列間のオーバーラップ情報を記憶した。単一のリードにより裏付けされたオーバーラップパスは信頼性が低く、除去された。配列決定のエラーまたは微生物株間の遺伝的ばらつきを原因とする短い低深度チップおよびバブルは、それぞれトリムおよびマージされた。リードパスを用いて、ごく小さな反復を解決した。最終的に、反復境界において連結を破断し、明確な連結をもつ連続配列をコンティグとして出力した。メタゲノム特殊モデルを選択し、パラメータ「−K21」および「−K23」をそれぞれ44bpと75bpのリードについて使用して、求められる最小の配列オーバーラップを表示した。独立して各試料についてデノボアセンブリを行った後、アセンブルされていない全てのリードを一緒にマージし、それらについてアセンブリを実施して、データの使用を最大限にし、各リードセット内での頻度は低いものの全ての試料のデータを合わせることによるアセンブリには充分な配列深度を有する微生物ゲノムをアセンブルした。
【0025】
Sangerリードを用いたIlluminaコンティグの検証。BLASTIN(WUBLAST2.0)を用いて、試料MH0006およびMH0012に由来するSangerリード(それぞれ156.9Mbおよび154.7Mb)を、同じ試料に由来するIlluminaコンティグ(長さが75bp超で同一性が95%超の単一の最良ヒット)に対してマッピングした。アライメントの片端においてアラインされていないまま残された少なくとも50個の塩基を両方の配列が有しているコリアリニティの崩壊について、各アライメントをスキャンした。このような崩壊は各々、コリアリニティが崩壊している場所におけるIlluminaコンティグ内のアセンブリエラーとみなされた。互いから30bp以内のエラーは、マージされた。エラーの両側の60bpについてのコンティグ構造と一致するSangerリードが存在する場合、エラーは廃棄された。比較のため、本発明者らは、MH0006由来の454のTitaniumリード(550Mbのリード)のNewbler2アセンブリに対してこれを反復した。本発明者らは、Illuminaアセンブリについてコンティグの1Mbあたり14.12個のエラーを推定しているが、これは、454のアセンブリのそれ(1Mbあたり20.73)に匹敵する。少なくとも一つのSangerリードをマッピングするIlluminaコンティグの98.7%は、マッピングされた領域の99.55%にわたりコリニアであったが、これは、このような454のコンティグの97.86%が、マッピングされた領域の99.48%にわたりコリニアであることに匹敵する。
【0026】
ヒト腸内ミクロビオームのカバー率の評価。最初の35bpの領域内の多くとも二つのミスマッチおよびリード配列全体にわたる90%の同一性を許容することにより、SOAPを用いて、アセンブルされたコンティグおよび公知の細菌ゲノムに対して、Illumina GAリードをアラインした。1×10−8、100bp超のアラインメント長、および最低90%の同一性カットオフでBLASTNを用いて、同じ基準に対して、Roche/454およびSanger配列決定リードをアラインした。SOAPにより、MH0006およびMH0012のGAリード、同じ試料からのSangerリードに対してアラインした場合、二つのミスマッチが許容され、同一性はリード配列全体にわたり95%に設定された。
【0027】
非冗長遺伝子セットの遺伝子予測および構築。所与の配列のGC含有量により推定されたジコドン頻度を使用し、かつ匿名ゲノム配列に基づきORFの全範囲を予測する、MetaGene(Noguchiら、Nucleic Acids Res.、34、5623−5630、2006)を用いて、124の試料各々のコンティグから、ならびにマージされたアセンブリのコンティグから、ORFを見出す。その後、予測されたORFをBLAT(Kentら、Genome Res.、12:656−664、2002)を用いて互いにアラインした。95%超の同一性、およびより短い遺伝子の90%にわたりカバーされたアライン長を有する遺伝子対を、グループにまとめた。次に遺伝子を共有するグループをマージし、マージされたグループの各々の中の最長のORFを用いてそのグループの代表とし、グループの他のメンバーを冗長性とした。したがって、本発明者らは、冗長性を排除することにより、予測された遺伝子の全てから非冗長遺伝子セットを組織した。最終的に、100bp未満の長さを有するORFがフィルタリングされた。NCBI遺伝子コード(Leyら、Nature Rev.Microbiol、.6:776−788、2008)を用いてORFをタンパク質配列に翻訳した。
【0028】
遺伝子の同定。存在度の低い遺伝子を同定することと同定のエラー率を削減することとの間のバランスを保つため、本発明者らは、個別のミクロビオーム中の遺伝子を同定するために必要とされるリードカバー率について設定された閾値の影響を調査した。同定に必要とされるリードの数が2から6に増加した時点で、遺伝子数は約2分の1に減少し、その後はゆっくりと変化した。それでも、希少な遺伝子を解析に含み入れるために、本発明者らは、2回のリードの閾値を選択した。
【0029】
遺伝子の分類学的割当て。予測された遺伝子の分類学的割当ては、統合NRデータベースに対するBLASTPアラインメントを用いて実施された。1×10−5より大きいe値でBLASTPアラインメントのヒットをフィルタリングし、各々の遺伝子について、e値≦10×トップヒットのe値により定義づけされた有意なマッチを、分類学的グループを区別するために保持した。その後、MEGAN(Husonら、Genome Res.、17:377−386、2007)で実行された最近共通祖先(LCA)ベースのアルゴリズムにより、各遺伝子の分類学的レベルを判定した。LCAベースのアルゴリズムは、割当てられた分類群の分類学的レベルが遺伝子の保存レベルを反映するような形で、遺伝子を分類群に割当てる。例えば、遺伝子が数多くの種に保存されていた場合、それは、種ではなくむしろLCAに割当てられた。
【0030】
遺伝子の機能的分類。BLASTPを用いて、e値≦1×10−5で、eggNOGデータベース(Jensenら、Nucleic Acids Res.、36:D250−D254、2008)およびKEGGデータベース(Kanehisaら、Nucleic Acids Res.、32:D277−D280、2004)内で予測された遺伝子のタンパク質配列を検索した。最低のe値を有するNOGホモログまたはKEGGホモログに応じて、遺伝子に注釈付けした。eggNOGデータベースは、COGデータベースおよびKOGデータベースの統合である。COGで注釈付けされた遺伝子は、25のCOGカテゴリーに分類され、KEGGにより注釈付けされた遺伝子は、KEGGパスウェイ内に割当てられた。
【0031】
最小腸内細菌ゲノムの決定。eggNOGクラスタに割当てられた非冗長遺伝子の数は、遺伝子の長さとクラスタコピー数で正規化された。クラスタを、正規化された遺伝子数によりランキングし、不可欠なBacillus subtilis遺伝子をコードするクラスタを含んでいた範囲を決定し、100個のクラスタの連続的グループ内のこれらのクラスタの割合を計算した。遺伝子クラスタの範囲の解析には、iPath画像以外に、KEGGの使用ならびにパスウェイの完全性およびそれらがコードするタンパク質機構の手動での確認を用いた。
【0032】
全機能的補体と最小メタゲノムの決定。本発明者らは、n個の個体(n=52〜124、1ビンあたり100の複製)のランダムな組合せ中に存在するオルソロググループおよび/または遺伝子ファミリーの合計数および共有数を計算した。この解析は、遺伝子クラスタの次の三つのグループについて実施された:(1)公知のeggNOGオルソロググループ(すなわち、[Uu]ncharacteri[sz]ed、[Uu]nknown、[Pp]redictedまたは[Pp]utativeという用語が存在するものを除く、機能的注釈付けを伴うグループ);(2)全てのeggNOGオルソロググループ;(3)以上の二つのカテゴリーに割当てされなかった残りの遺伝子から構築された遺伝子ファミリーを加えた、全てのオルソロググループ。ファミリーは、1.1の拡大要因と60のビットスコアカットオフでMCL(van Dongen、Ph.D.Thesis、Univ.Utrecht、2000)を用いて、総当たりBLASTPの結果からクラスタ化された。
【0033】
希薄度解析。メモリーによる制限のため100個の無作為にピックアップした試料について、EstimateSを用いて、全遺伝子豊富度の推定を行った。CV値は0.5超であったことから、Chao2豊富度推定量(従来のもの)およびICE豊富度推定量を計算し、二つのうちの大きい方の推定値(ICE)を使用した。この試料サイズについての推定値は、3,621,646個の遺伝子(ICE)であり、一方Sobs(Mao Tau)は3,090,575個の遺伝子、つまり85.3%であった。ICE推定量曲線は、完全な飽和状態にはならず、これは、最終的な決定的推定値を達成するためには、追加の試料を加える必要があることを示している。
【0034】
共通の細菌核。非常に類似した株の影響を除去し、コホートの個体中の公知の微生物種の存在を評価するために、本発明者らは基準セットとして650の配列決定された細菌ゲノムおよび古細菌ゲノムを使用した。このセットは、932個の公的に入手可能なゲノムで構成され、これらのゲノムは、90%の同一性カットオフと少なくとも80%の長さにわたる類似性とを用いて、類似性別にグループ分けされた。各グループから最大のゲノムのみが使用された。124の個体に由来するIlluminaリードを、種のプロファイリング解析のためにセットにマッピングし、同じ種に由来するゲノム(サイズを20%超異なるようにすることによる)を、手作業での検査によって、かつ配列が入手可能である場合には16Sベースのクラスタ化を用いることによって、キュレートした。
【0035】
個体間の微生物ゲノムの相対的存在度。本発明者らは、Illuminaリードを一意的にマッピングすることによりゲノムカバー率を計算し、それを1Gbの配列に正規化して、異なる個体における異なる配列決定レベルについて矯正した。カバー率を、各個体についての非冗長細菌ゲノムセットの全ての種にわたって合計し、この合計に対する各々の種の割合を計算した。
【0036】
種の共存ネットワーク。少なくとも一つの個体内で1%以上のIlluminaリードによるゲノムカバー率を有していた155の種について、本発明者らは、124の個体のコホート全体を通した配列決定深度(存在度)間のペアワイズ種間ピアソン相関を計算した。結果として得た11,175の種間相関から、グラフ内のノードサイズとして各々の種の平均ゲノムカバー率を表示するCytoscape(Shannonら、Genome Res.13:2498−2504、2003)を用いて、グラフの形で、−0.4未満または0.4超(n=342)の相関を視覚化した。
【0037】
結果
使用されたコホートおよび方法の要約説明。合計177名のデンマーク人個体が研究対象となった。これらの個体は、BMIが27.5未満の人67名(痩せ型で健康な対照)およびBMIが27.5超の110名の個体(肥満患者)を含んでいた。遺伝子330万個の遺伝子カタログ全体を、二つのグループ間で有意に異なっているものについて、順位和検索によって検索した。遺伝子サイズ(より大きな遺伝子はより大きい標的であり、より頻繁に見られる)および異なる個体についての配列決定範囲の差によって、遺伝子頻度を正規化した。有意に異なる遺伝子の数は、閾値およびグループ分割により影響される。手短かに言うと、p<10−4で1327の「BMI関連遺伝子」(本明細書中、BMI遺伝子とも呼ばれている)が発見された。
【0038】
BMI遺伝子の包括的解析。個体別に、有意に異なる遺伝子、すなわちBMI関連遺伝子をプロットした(図1A)。健康な個体におけるBMI遺伝子数の中央値は476であり、肥満患者においてはわずか179であった。遺伝子数の中央値は、二つのグループ間で非常に有意に異なっている(p<10−17、片側t検定)。遺伝子数で遺伝子をランキングし20のグループでビニングした場合、67のうち50の個体が最初の三つのビン内にあり、痩せ型の個体が分布の最上部にあることを示した(図1B)。
【0039】
全ての遺伝子およびBMI遺伝子の分布比較。ミクロビオームの全ての遺伝子およびBMI遺伝子の分布を比較した。BMI遺伝子に比べて、二つのグループの間で全遺伝子の数および頻度の差ははるかに小さいものである。BMI遺伝子の分布は、全遺伝子分布を単純には反映していない。したがって、肥満患者における遺伝子の喪失は、有意である。
【0040】
BMI関連種。330万からなるカタログ中の遺伝子に帰属する分類学的割当てを用いて、BMI遺伝子を種に割当てた(Qinら、Nature、2010、in press、doi:10.1038/nature08821)。BMI遺伝子の59.8%、ただし全遺伝子のわずか32.8%だけが、Firmicutes由来であることが発見された。一方で、Bacteroidetesの頻度は、BMI遺伝子について8.1%、ミクロビオームの全遺伝子については18.4%であった。したがって、肥満はFirmicutesの変化と連関する。種は、まず、BMI遺伝子のうちでそれらの種に割当てられた遺伝子の数によって同定された。その後、同じ種に由来する他の遺伝子をカタログから引き出し、異なる個体内で各々の種についての50の代表的遺伝子の存在を査定した(これは、種を同定するために現在行われている単一の16S遺伝子の使用と比較して全く遜色がなかった)。種は、マーカー遺伝子の少なくとも半分が一個体中に発見された場合に、存在するものとみなされた。健康な人と患者との間の分布の有意性は、カイ二乗検定を用いて、全コホート分布(67名対110名)と比較することによって推定された。Bacteronides pectinophilus、Eubacterium siraeumおよびClostridium phyto fermentansは、健康な個体群と連関した(それぞれ、p=2.1×10−3、p=3.5×10−4、およびp=6.1×10−4)。すなわちこれらは、肥満患者には不在である傾向にあった。一方で、Anaerotruncus colihominisは、患者コホートと連関した(p=1.4×10−2)。種の同定に基づいて、これら4つの種の線形組合せが、肥満の表現型を完全に予測することが実証された(図2A)。健康な個体および患者は、それぞれ青色および赤色の点として示されている。種の存在(縦座標)は、遺伝子の合計、すなわち(肥満と逆連関した)「優良種」の遺伝子から(肥満と連関した)「不良種」の遺伝子を差し引いたものに対応する。個体は、種の存在によってランキングされる(横座標)。個体は、「優良種」の遺伝子が上回っている場合、ランクの最上部にあり、健康である傾向をもち、一方、「不良種」の遺伝子が上回っている場合、その個体は右側にあり、病気を患う傾向をもつ。このことは、図2Bでも示されており、ここで個体のグループは、優良種の遺伝子の少なくとも半分を、不良種を上回って有するか、または不良種の遺伝子の半分を、優良種を上回って有する(それぞれ、カットオフ>0.5および<−0.5)。個体の分布は赤色および青色のバーで表され、分布の確率(カイ二乗)は、有意に異なる二つのグループの上に示されている。コホートの組成が、比較のために示されている。判別精度は、正しく分類された個体対誤って分類された個体として計算されている(正64、誤15)。
【0041】
【表1】

【表2】

【表3】

【表4】

【表5】

【表6】

【表7】

【表8】

【表9】

【表10】

【表11】

【表12】

【表13】

【表14】

【表15】

【表16】

【表17】

【表18】

【表19】

【表20】

【表21】

【表22】

【表23】

【表24】

【表25】

【表26】

【表27】

【表28】

【表29】

【表30】

【表31】

【表32】

【表33】

【表34】

【表35】

【表36】

【表37】

【表38】

【表39】

【表40】

【表41】

【表42】

【表43】

【表44】

【表45】

【表46】

【表47】

【表48】

【表49】

【表50】

【先行技術文献】
【非特許文献】
【0042】
【非特許文献1】Qinら、Nature、2010、doi:10.1038/nature08821
【非特許文献2】Sokolら、Inflamm.Bowel Dis.、14(6):858−867、2008
【図1A】

【図1B】

【図2A】

【図2B】






【特許請求の範囲】
【請求項1】
表1由来の少なくとも一つの遺伝子が、個体の腸内ミクロビオームに不在であるか否かを判定するステップを含む、肥満診断方法。
【請求項2】
表1の遺伝子の少なくとも50%、75%または90%が、前記個体の腸内ミクロビオームに不在である、請求項1に記載の方法。
【請求項3】
前記個体の糞便から微生物DNAを得るステップを含む、請求項1に記載の方法。
【請求項4】
治療を必要としている患者における肥満治療の有効性をモニタリングする方法において、前記患者のミクロビオームに少なくとも1つの遺伝子が不在であるか否かを最初に判定するステップと、治療を施すステップと、前記少なくとも一つの遺伝子が患者のミクロビオーム中に存在するか否かを判定するステップとを含む方法。
【請求項5】
表1の遺伝子の少なくとも50%、75%または90%が、治療前に前記個体の腸内ミクロビオームに不在である、請求項4に記載の方法。
【請求項6】
前記個体の糞便から微生物DNAを得る少なくとも一つのステップを含む、請求項4に記載の方法。
【請求項7】
表1の遺伝子の少なくとも10%、25%、50%、75%、90%、95%、97.5%または99%にハイブリダイズするプローブを含むマイクロアレイ。
【請求項8】
請求項7に記載のマイクロアレイまたは表1の遺伝子の少なくとも10%、25%、50%、75%、90%、95%、97.5%もしくは99%に特異的な増幅プライマーを含む、肥満診断用キット。

【公表番号】特表2013−520973(P2013−520973A)
【公表日】平成25年6月10日(2013.6.10)
【国際特許分類】
【出願番号】特願2012−555405(P2012−555405)
【出願日】平成23年3月1日(2011.3.1)
【国際出願番号】PCT/EP2011/053041
【国際公開番号】WO2011/107482
【国際公開日】平成23年9月9日(2011.9.9)
【出願人】(505129079)アンスティテュ ナシオナル ドゥ ラ ルシェルシュ アグロノミック (15)
【氏名又は名称原語表記】INSTITUT NATIONAL DE LA RECHERCHE AGRONOMIQUE
【Fターム(参考)】