祖先データを用いるゲノム解析の方法及びシステム
本開示は、個人のゲノムプロファイルを分析するとともに、祖先データを用い、遺伝子型と表現型との相関を決定することにより、個人の遺伝子型の表現型に対する相関を調べる方法及びシステムを提供する。
【発明の詳細な説明】
【背景技術】
【0001】
この出願は、2007年9月26日出願の米国仮出願60/975495に基づく優先権を主張するものであり、これを引用してその全内容を本明細書の一部とする。
【0002】
ヒトゲノムの配列決定及びヒトゲノミクスにおけるその他の近年の進歩は、任意の二人の人間の間のゲノム構成に99.9%を超える類似性があり得ることを明らかにした。個体間のDNAにおける比較的少数の変異は、表現型形質の相違を生じさせ、且つ、ヒトの多くの疾患や、様々な疾患への感受性や、疾患の処置への反応に関係している。個体間のDNAにおける変異は、コード領域及び非コード領域の両者に起こり、ゲノムDNA配列中の特定位置の塩基の変化ならびにDNAの挿入及び除去を包含する。ゲノム中の1個の塩基の位置に起こる変化を単一ヌクレオチド多型、又は「SNP」と称する。
【0003】
SNPはヒトゲノムにおいて比較的稀であるが、個体間のDNA配列変異の大部分を占めており、ヒトゲノムのおよそ1200塩基対に1個ある(国際HapMapプロジェクト。www.hapmap.orgを参照されたい)。より多くのヒト遺伝情報が得られるようになるにつれてSNPの複雑性が理解され始めるようになっている。また、ゲノムにおけるSNPの存在を、種々の疾患及び状態の存在及び/又は感受性と相関させることが始まりつつある。
【0004】
ヒト遺伝学において、これらの相関付け及びその他の進歩が成されるにつれて、一般に医療及び個人の健康は、患者が、他の因子よりも特に彼又は彼女のゲノム情報を考慮して適切な医薬及びその他の選択を行う、オーダーメイドアプローチへと向かっている。考慮に影響し得る重要な因子が、個体の祖先データ(家系)又は民族性である。例えば、異なる集団は、組換え率の変異、選択圧、又はボトルネック効果といった様々な考え得る理由のため、異なる連鎖不均衡パターンを有し得る。したがって、集団Aについて或る研究を行って、或る表現型に相関する遺伝子変異についてその集団内で特定のオッズ比が得られたとしても、集団Bにおいて同じオッズ比であると考えることはできない。したがって、個別的医療及びその他の決定を提供するための、祖先データを組み込んだ、個体のゲノムに特異的な情報を、該個体及びその介護者に提供する必要がある。
【発明の概要】
【課題を解決するための手段】
【0005】
本開示は、a)個体の遺伝子試料を取得し;b)その個体のゲノムプロファイルを作製し;c)その個体のゲノムプロファイルをヒト遺伝子型と表現型の相関の最新データベースと比較することにより、その個体の遺伝子型と表現型の相関を決定し;d)工程c)由来の結果をその個体又はその個体の健康管理者に報告し;e)さらなるヒト遺伝子型相関がわかった場合は、そのさらなるヒト遺伝子型相関を用いてヒト遺伝子型相関のデータベースを更新し;f)工程c)由来のその個体のゲノムプロファイル又はその一部をさらなるヒト遺伝子型相関と比較し、その個体のさらなる遺伝子型相関を決定することにより、その個体の遺伝子型相関を更新し;そして、g)工程f)由来の結果をその個体又はその個体の健康管理者に報告する、ことを含んでなる、個体の表現型に対する遺伝子型の相関を評価する方法を提供する。
【0006】
本開示はさらに、a)個体の遺伝子試料を取得し;b)その個体のゲノムプロファイルを作製し;c)その個体のゲノムプロファイルをヒト遺伝子型相関のデータベースと比較することにより、その個体の遺伝子型相関を決定し;d)その個体の遺伝子型相関の決定結果を安全な方法でその個体に提供し;e)さらなるヒト遺伝子型相関がわかった場合はさらなるヒト遺伝子型相関を用いてヒト遺伝子型相関のデータベースを更新し;f)その個体のゲノムプロファイル又はその一部をさらなるヒト遺伝子型相関と比較し、その個体のさらなる遺伝子型相関を決定することにより、その個体の遺伝子型相関を更新し;そして、g)その個体の遺伝子型相関の更新結果をその個体又はその個体の健康管理者に報告する、ことを含んでなる、個体の遺伝子型相関を評価するビジネス方法を提供する。
【0007】
本開示のさらなる局面は、a)各規則が少なくとも1個の遺伝子型及び少なくとも1個の表現型の相関を示すような規則を含んでなる規則の組を提供し;b)複数の個体の各々のゲノムプロファイルを含んでなるデータの組(ここで、各ゲノムプロファイルは複数の遺伝子型を含んでなる)を提供し;c)少なくとも1個の新たな規則(ここで、少なくとも1個の新たな規則とは、その規則の組において、かつて相互に相関していなかった遺伝子型及び表現型の相関を指す)によってこの規則の組を定期的に更新し;d)個体のうち少なくとも1個体のゲノムプロファイルに新たな各規則を適用し、それにより、その個体について少なくとも1個の遺伝子型を少なくとも1個の表現型と相関させ;そして場合により、e)その個体の表現型プロファイルを含んでなる報告を作製する、ことを含んでなる、個体の表現型プロファイルを作成する方法である。
【0008】
本開示はさらに、a)各規則が少なくとも1個の遺伝子型及び少なくとも1個の表現型の相関を示すような規則を含んでなる規則の組;b)少なくとも1個の新たな規則(ここで、少なくとも1個の新たな規則とは、その規則の組において、かつて相互に相関していなかった遺伝子型及び表現型の相関を指す)によってこの規則の組を定期的に更新するコード;c)複数の個体のゲノムプロファイルを含んでなるデータベース;d)個体の表現型プロファイルを決定するために、その個体のゲノムプロファイルにこの規則の組を適用するコード;及び、e)各個体のための報告を作製するコード、を含んでなるシステムを提供する。
【0009】
本開示はさらに、(a)(i)或る表現型に相関する遺伝子変異を含んでなる第一の連鎖不均衡(LD)パターン(ここで、この第一のLDパターンは第一の個体集団のものである);及び、(ii)その遺伝子変異を含んでなる第二のLDパターン(ここで、この第二のLDパターンは第二の個体集団のものである)、を比較し;(b)(a)における比較から、前記第二集団内の該表現型に相関している遺伝子変異の確率を決定し;(c)工程(b)の確率を使用することを含んでなる、該個体のゲノムプロファイルからの、前記表現型の遺伝子型相関の評価を行い;そして、(d)工程(c)由来の遺伝子型相関を含んでなる結果を、該個体又はその個体の健康管理者に報告すること、を含んでなる、個体の遺伝子型相関を評価する方法を提供する。幾つかの態様では、この方法はさらに、(e)さらなる遺伝子変異によって前記結果を更新する、ことを含んでなる。
【0010】
この確率はオッズ比(OR)であってよく、このORは既知のORから誘導できる。例えば、既知のORは、第一集団の表現型と相関する遺伝子変異についてのもの、例えば、科学雑誌に掲載されている遺伝子変異、例えばSNPについて公表されているORであってよい。幾つかの態様では、第一集団と第二集団は類似のLDパターンを有している。さらに本明細書には、(a)第一の個体集団における複数の遺伝子変異の各々について原因遺伝子変異の確率を決定し;(b)工程(a)の該確率の各々を、第二の個体集団における前記複数の遺伝子変異の各々についての確率とみなし;(c)工程(b)の確率を使用することを含んでなる、該個体のゲノムプロファイルからの、遺伝子型相関の評価を行い;そして、(d)工程(c)由来の遺伝子型相関を含んでなる結果を、該個体又はその個体の健康管理者に報告すること、を含んでなる、個体の遺伝子型相関を評価する方法を提供する。幾つかの態様では、この方法はさらに、(e)さらなる遺伝子変異によって前記結果を更新する、ことを含んでなる。
【0011】
既知の遺伝子変異、例えばSNPは、科学雑誌に公表されているORを伴う遺伝子変異であってよい。確率とはオッズ比(OR)であってよく、工程(a)の遺伝子変異の各々は、第一集団における表現型に相関する既知の遺伝子変異の近位にあり得る。例えば、各々の遺伝子変異は既知の遺伝子変異に対して連鎖不均衡であり得る。
【0012】
本明細書に開示する方法及びシステムの幾つかの態様では、遺伝子型相関をGCIスコアで報告する。第二集団は、典型的には第一集団とは異なる祖先の集団であり、その個体は第二集団の祖先を有する。幾つかの態様では、原因遺伝子変異は未知である。その遺伝子変異は単一ヌクレオチド多型(SNP)であってよい。
【0013】
本開示のもう一つの局面は、安全又は非安全な方法で上記方法及びシステムをネットワーク上で伝達することである。この報告は、オンラインポータルを介して、又は紙もしくはeメールによって実施できる。使用されるゲノムプロファイルは作製でき、遺伝子試料由来である。第三者がゲノムフロファイルを作製し、遺伝子試料を取得し、又は試料取得とゲノムプロファイル作製の両方を実施できる。遺伝子試料はDNA又はRNAであってよく、血液、毛髪、皮膚、唾液、精液、尿、糞便物質、汗及び口腔粘膜試料より成る群から選ばれる生体試料から取得できる。ゲノムプロファイルは安全なデータベース又はヴォールトに寄託できる。さらに、ゲノムプロファイルは単一ヌクレオチド多型プロファイルであってよく、幾つかの態様では、ゲノムプロファイルは、末端切除、挿入、除去、又は反復を含み得る。ゲノムプロファイルは、高密度DNAマイクロアレイ、RT−PCR、DNA配列決定、又は技術の組み合わせを使用して作製できる。
【0014】
本発明方法はさらに、HapMap集団(YRI、CEU、CHB、JPT、ASW、CHD、GIH、LWK、MEX、MKK、TSI)のうちいずれか、又は、アフリカ系アメリカ人、白色人種、アシュケナジー系ユダヤ人、スファラディー系ユダヤ人、インド人、太平洋諸島系、中東人、ドゥルーズ派、ベドウィン、南欧人、スカンジナビア人、東欧人、北アフリカ人、バスク人、西アフリカ人、又は東アフリカ人(但しこれらに限定される訳ではない)等のその他の任意の集団を含んでなる集団を包含する。
【0015】
本明細書に記載する全ての刊行物及び特許出願は、引用により、各々の個別刊行物又は特許出願が具体的且つ個別的に引用による本明細書への組み込みを示しているかのような程度まで、引用により本明細書の一部とされる。
【図面の簡単な説明】
【0016】
【図1】図1は、本発明方法の局面を説明するフローチャートである。
【図2】図2は、ゲノムDNA品質管理手段の一例である。
【図3】図3は、ハイブリダイゼーション品質管理手段の一例である。
【図4A】図4は、被験SNP及び効果推定値を伴う、公表された文献由来の代表的遺伝子型相関の表である。A〜I)は、単一遺伝子座遺伝子型相関を表し;J)は、二遺伝子座遺伝子型相関を表し;K)は、三遺伝子座遺伝子型相関を表し;L)は、A〜Kで使用された民族性及び国の略語の索引であり;M)は、A〜Kにおける短表現型名の略語、遺伝性、及びその遺伝性の出典の索引である。
【図4B】図4は、被験SNP及び効果推定値を伴う、公表された文献由来の代表的遺伝子型相関の表である。A〜I)は、単一遺伝子座遺伝子型相関を表し;J)は、二遺伝子座遺伝子型相関を表し;K)は、三遺伝子座遺伝子型相関を表し;L)は、A〜Kで使用された民族性及び国の略語の索引であり;M)は、A〜Kにおける短表現型名の略語、遺伝性、及びその遺伝性の出典の索引である。
【図4C】図4は、被験SNP及び効果推定値を伴う、公表された文献由来の代表的遺伝子型相関の表である。A〜I)は、単一遺伝子座遺伝子型相関を表し;J)は、二遺伝子座遺伝子型相関を表し;K)は、三遺伝子座遺伝子型相関を表し;L)は、A〜Kで使用された民族性及び国の略語の索引であり;M)は、A〜Kにおける短表現型名の略語、遺伝性、及びその遺伝性の出典の索引である。
【図4D】図4は、被験SNP及び効果推定値を伴う、公表された文献由来の代表的遺伝子型相関の表である。A〜I)は、単一遺伝子座遺伝子型相関を表し;J)は、二遺伝子座遺伝子型相関を表し;K)は、三遺伝子座遺伝子型相関を表し;L)は、A〜Kで使用された民族性及び国の略語の索引であり;M)は、A〜Kにおける短表現型名の略語、遺伝性、及びその遺伝性の出典の索引である。
【図4E】図4は、被験SNP及び効果推定値を伴う、公表された文献由来の代表的遺伝子型相関の表である。A〜I)は、単一遺伝子座遺伝子型相関を表し;J)は、二遺伝子座遺伝子型相関を表し;K)は、三遺伝子座遺伝子型相関を表し;L)は、A〜Kで使用された民族性及び国の略語の索引であり;M)は、A〜Kにおける短表現型名の略語、遺伝性、及びその遺伝性の出典の索引である。
【図4F】図4は、被験SNP及び効果推定値を伴う、公表された文献由来の代表的遺伝子型相関の表である。A〜I)は、単一遺伝子座遺伝子型相関を表し;J)は、二遺伝子座遺伝子型相関を表し;K)は、三遺伝子座遺伝子型相関を表し;L)は、A〜Kで使用された民族性及び国の略語の索引であり;M)は、A〜Kにおける短表現型名の略語、遺伝性、及びその遺伝性の出典の索引である。
【図4G】図4は、被験SNP及び効果推定値を伴う、公表された文献由来の代表的遺伝子型相関の表である。A〜I)は、単一遺伝子座遺伝子型相関を表し;J)は、二遺伝子座遺伝子型相関を表し;K)は、三遺伝子座遺伝子型相関を表し;L)は、A〜Kで使用された民族性及び国の略語の索引であり;M)は、A〜Kにおける短表現型名の略語、遺伝性、及びその遺伝性の出典の索引である。
【図4H】図4は、被験SNP及び効果推定値を伴う、公表された文献由来の代表的遺伝子型相関の表である。A〜I)は、単一遺伝子座遺伝子型相関を表し;J)は、二遺伝子座遺伝子型相関を表し;K)は、三遺伝子座遺伝子型相関を表し;L)は、A〜Kで使用された民族性及び国の略語の索引であり;M)は、A〜Kにおける短表現型名の略語、遺伝性、及びその遺伝性の出典の索引である。
【図4I】図4は、被験SNP及び効果推定値を伴う、公表された文献由来の代表的遺伝子型相関の表である。A〜I)は、単一遺伝子座遺伝子型相関を表し;J)は、二遺伝子座遺伝子型相関を表し;K)は、三遺伝子座遺伝子型相関を表し;L)は、A〜Kで使用された民族性及び国の略語の索引であり;M)は、A〜Kにおける短表現型名の略語、遺伝性、及びその遺伝性の出典の索引である。
【図4J】図4は、被験SNP及び効果推定値を伴う、公表された文献由来の代表的遺伝子型相関の表である。A〜I)は、単一遺伝子座遺伝子型相関を表し;J)は、二遺伝子座遺伝子型相関を表し;K)は、三遺伝子座遺伝子型相関を表し;L)は、A〜Kで使用された民族性及び国の略語の索引であり;M)は、A〜Kにおける短表現型名の略語、遺伝性、及びその遺伝性の出典の索引である。
【図4K】図4は、被験SNP及び効果推定値を伴う、公表された文献由来の代表的遺伝子型相関の表である。A〜I)は、単一遺伝子座遺伝子型相関を表し;J)は、二遺伝子座遺伝子型相関を表し;K)は、三遺伝子座遺伝子型相関を表し;L)は、A〜Kで使用された民族性及び国の略語の索引であり;M)は、A〜Kにおける短表現型名の略語、遺伝性、及びその遺伝性の出典の索引である。
【図4L】図4は、被験SNP及び効果推定値を伴う、公表された文献由来の代表的遺伝子型相関の表である。A〜I)は、単一遺伝子座遺伝子型相関を表し;J)は、二遺伝子座遺伝子型相関を表し;K)は、三遺伝子座遺伝子型相関を表し;L)は、A〜Kで使用された民族性及び国の略語の索引であり;M)は、A〜Kにおける短表現型名の略語、遺伝性、及びその遺伝性の出典の索引である。
【図4M】図4は、被験SNP及び効果推定値を伴う、公表された文献由来の代表的遺伝子型相関の表である。A〜I)は、単一遺伝子座遺伝子型相関を表し;J)は、二遺伝子座遺伝子型相関を表し;K)は、三遺伝子座遺伝子型相関を表し;L)は、A〜Kで使用された民族性及び国の略語の索引であり;M)は、A〜Kにおける短表現型名の略語、遺伝性、及びその遺伝性の出典の索引である。
【図5A】図5A〜Jは、効果推定値を伴う代表的遺伝子型相関の表である。
【図5B】図5A〜Jは、効果推定値を伴う代表的遺伝子型相関の表である。
【図5C】図5A〜Jは、効果推定値を伴う代表的遺伝子型相関の表である。
【図5D】図5A〜Jは、効果推定値を伴う代表的遺伝子型相関の表である。
【図5E】図5A〜Jは、効果推定値を伴う代表的遺伝子型相関の表である。
【図5F】図5A〜Jは、効果推定値を伴う代表的遺伝子型相関の表である。
【図5G】図5A〜Jは、効果推定値を伴う代表的遺伝子型相関の表である。
【図5H】図5A〜Jは、効果推定値を伴う代表的遺伝子型相関の表である。
【図5I】図5A〜Jは、効果推定値を伴う代表的遺伝子型相関の表である。
【図5J】図5A〜Jは、効果推定値を伴う代表的遺伝子型相関の表である。
【図6A】図6A〜Fは、代表的遺伝子型相関及び推定される相対リスクの表である。
【図6B】図6A〜Fは、代表的遺伝子型相関及び推定される相対リスクの表である。
【図6C】図6A〜Fは、代表的遺伝子型相関及び推定される相対リスクの表である。
【図6D】図6A〜Fは、代表的遺伝子型相関及び推定される相対リスクの表である。
【図6E】図6A〜Fは、代表的遺伝子型相関及び推定される相対リスクの表である。
【図6F】図6A〜Fは、代表的遺伝子型相関及び推定される相対リスクの表である。
【図7】図7は、報告の見本である。
【図8】図8は、解析システムならびにネットワーク上でのゲノム及び表現型プロファイルの伝達の模式図である。
【図9】図9は、本明細書に記載のビジネス方法の局面を説明するフローチャートである。
【図10】図10は、特定のオッズ比を有するCEU(白色人種祖先/民族性)における公表SNPの模式図であり、これは、異なる祖先背景を持つ異なる集団YRI(ヨルバ族系統/民族性。HapMapプロジェクトを参照されたい(http://hapmap.org/hapmappopulations.html.en))において同一であると考えることはできない。
【発明を実施するための形態】
【0017】
本開示は、個体又は個体群の保存されたゲノムプロファイルに基づいて表現型プロファイルを作製するための、及びその保存されたゲノムプロファイルに基づいて最初の及び更新された表現型プロファイルを容易に作製するための方法及びシステムを提供するものである。ゲノムプロファイルは、個体から取得した生体試料から遺伝子型を決定することによって製作する。個体から取得した生体試料は、そこから遺伝子試料が誘導できる任意の試料であってよい。試料は、綿棒採取口腔粘膜試料、唾液、血液、毛髪、又はその他いかなる種類の組織試料であってもよい。次いでその生体試料から遺伝子型を決定できる。遺伝子型は任意の遺伝子変異体もしくは生物学的マーカー、例えば単一ヌクレオチド多型(SNP)、ハプロタイプ、又はゲノムの配列であってよい。遺伝子型は個体のゲノム配列全体であってよい。遺伝子型は、数千又は数百万のデータ点を生成するハイスループット解析、例えば既知SNPの殆ど又は全てに対するマイクロアレイ解析によって導き出すことができる。別の態様では、遺伝子型はハイスループット配列決定によっても決定できる。
【0018】
遺伝子型は個体のゲノムプロファイルを形成する。このゲノムプロファイルはデジタル保存され、表現型プロファイルを作製する任意の時点で容易にアクセスできる。表現型プロファイルは、遺伝子型を表現型に相関させ又は関連づける規則を適用することにより作製する。規則は、遺伝子型と表現型の相関を証明する科学的研究に基づいて作製できる。相関は、一人又はそれ以上の専門家による委員会により監督又は検証される。個体のゲノムプロファイルに規則を適用することにより、個体の遺伝子型と表現型の関連性が決定できる。個体の表現型プロファイルはこの決定を有することになる。その決定は、該個体が所定の表現型を有する、又はその表現型を発現するであろうという、個体の遺伝子型及び所定の表現型の間の明確な関連性であるかも知れない。或いは、その個体が所定の表現型を持たない、又は発現しないであろう、という決定がなされるかも知れない。別の態様では、この決定は、個体が或る表現型を有する、又は発現するであろうというリスクファクター、推定、又は確率であるかも知れない。
【0019】
この決定は、幾つかの規則に基づいて行うことができ、例えば、複数の規則をゲノムプロファイルに適用して、個体の遺伝子型と特定の表現型の関連性を決定することができる。この決定はまた、個体に特有の因子、例えば民族性、性別、ライフスタイル、年齢、環境、家族の病歴、個人の病歴、及びその他の既知表現型を組み入れることもできる。この特有の因子の組み入れは、これらの因子を包含する既存の規則を改変することによるものであってよい。或いは、これらの因子によって別個の規則を作製し、既存の規則を適用した後に個体の表現型決定に適用することもできる。
【0020】
表現型は任意の測定可能な形質又は特徴、例えば或る疾患への感受性又は薬物処置に対する反応を包含できる。包含され得るその他の表現型は、身体的及び精神的特徴、例えば身長、体重、毛髪の色、眼の色、日焼けに対する感受性、サイズ、記憶、知性、楽観主義のレベル、及び一般気質である。表現型はさらに、他の個体又は生物との遺伝学的比較をも包含し得る。例えば、個体は自身のゲノムプロファイルと著明人のゲノムプロファイルの類似性に興味を持つかも知れない。また、彼等のゲノムプロファイルを、細菌、植物又は他の動物といった他の生物と比較させることができる。
【0021】
この開示の別の局面では、多数の遺伝子マーカーと1又はそれ以上の疾患又は状態の関連性についての情報を合し、解析して、Genetic Composite Index(GCI)スコアを求める(例えばPCT公報No.WO2008/067551に記載されており、これを引用により本明細書の一部とする)。このスコアは、既知のリスクファクター、ならびに他の情報及び推定、例えばアレル頻度及び疾患の有病率を組み込んでいる。GCIを使用して、或る疾患又は状態と、一組の遺伝子マーカーの複合効果の関連性を定性的に推定することができる。GCIスコアを使用して、遺伝学の訓練を受けていない人々に、彼等個人のいかなる疾患リスクが最新の科学研究に基づいて関連集団と比較されているかについての、信頼できる(即ち強固な)、理解可能な、そして/又は直感的な感覚を提供できる。PCT公報No.WO2008/067551に記載されているように、GCIスコアを使用してGCIプラススコアを作製することができる。GCIプラススコアは、リスク(例えば生涯リスク)、年齢により規定される有病率、及び/又は年齢により規定される該状態の出現率を包含する、全てのGCI仮定を含み得る。そこで、個体の生涯リスクをGCIプラススコアとして算出するが、それは、個体のGCIスコアを平均GCIスコアで除したものに比例する。平均GCIスコアは、類似の祖先背景を持つ個体群、例えば白色人種、アジア人、東インド人の群、又は共通の祖先背景を持つその他の群から決定できる。群は少なくとも5、10、15、20、25、30、35、40、45、50、55、又は60名の個体を含み得る。幾つかの態様では、平均値は少なくとも75、80、95、又は100名の個体から決定され得る。GCIプラススコアは、或る個体のGCIスコアを決定し、そのGCIスコアを平均相対リスクで除し、そして或る状態又は表現型についての生涯リスクを掛けることによって決定できる。例えば、PCT公報No.WO2008/067551のデータ、例えば図24の情報と共に図22及び/又は図25を利用して、図19に記載のようなGCIプラススコアを算出する。
【0022】
本開示は、本明細書に記載のGCIスコアの使用を包含するものであり、当業者は、本明細書に記載のGCIスコアに代わるGCIプラススコア又はその変形の使用を容易に理解できるであろう。或る態様では、GCIスコアを、目的とする疾患又は状態の各々について作製する。これらのGCIスコアを集めて或る個体のリスクプロファイルを作製できる。GCIスコアは、リスクプロファイルを作製するため、いかなる時点においても容易にアクセスできるよう、デジタル保存することができる。リスクプロファイルは、癌、心臓病、代謝性疾患、精神疾患、骨疾患、又は年齢発症疾患といった広範な疾患クラスに分類できる。広範な疾患クラスはさらに下位カテゴリーに細分できる。例えば、癌のような広範クラスでは、タイプ(非上皮性悪性腫瘍、上皮性悪性腫瘍、白血病等)、又は組織特異性(神経、乳房、卵巣、精巣、前立腺、骨、リンパ節、膵臓、食道、胃、肝臓、脳、肺、腎臓等)による癌の下位カテゴリーを列挙できる。
【0023】
別の態様では、GCIスコアが或る個体のために作製され、それが、少なくとも1つの疾患又は状態を獲得するその個体のリスク又は感受性について容易に理解できる情報を提供する。或る態様では、異なる疾患又は状態についての複数のGCIスコアを作製する。別の態様では、少なくとも1つのGCIスコアがオンラインポータルによってアクセス可能である。或いは、少なくとも1つのGCIスコアが紙の形態で提供され、その後の更新もまた紙で提供される。或る態様では、少なくとも1つのGCIスコアが、サービスに加入している個体である契約者に提供される。これに代わる態様では、非契約者に対してアクセスが提供され、この場合、非契約者は自身のGCIスコアのうち少なくとも1つへのアクセスが制限されるか、又は、作製された自身のGCIスコアのうち少なくとも1つに関する初期報告は取得できるが、更新された報告は、利用料を支払った時にのみ作製される。別の態様では、健康管理者及び健康管理提供者、例えば介護者、医師、及び遺伝カウンセラーもまた個体のGCIスコアのうち少なくとも1つにアクセスできる。
【0024】
個体について決定された相関表現型の集合体は、その個体の表現型プロファイルを共に含んでなる。表現型プロファイルはオンラインポータルによりアクセスできる。或いは、或る時点で存在する表現型プロファイルを紙の形態で提供し、その後の更新もまた紙の形態で提供できる。表現型プロファイルをオンラインポータルによって提供することもできる。オンラインポータルは、場合によっては安全なオンラインポータルであるかも知れない。表現型プロファイルへのアクセスは契約者に対して提供され、この契約者とは、表現型と遺伝子型の相関に関する規則を作製し、個体のゲノムプロファイルを決定し、該規則をそのゲノムプロファイルに適用し、そして該個体の表現型プロファイルを作製するサービスに加入している個体である。アクセスは非契約者に対しても提供され、この場合、非契約者は自身の表現型プロファイル及び/又は報告へのアクセスが制限されるか、又は、作製された初期の報告又は表現型プロファイルは取得できるが、更新された報告は、利用料を支払った時にのみ作製されるであろう。健康管理者及び健康管理提供者、例えば介護者、医師、及び遺伝カウンセラーもまた表現型プロファイルにアクセスできる。
【0025】
本開示のもう一つの局面では、ゲノムプロファイルは契約者及び非契約者について作製されてデジタル保存されるが、この表現型プロファイル及び報告へのアクセスは、契約者に限定される。別の変形では、契約者及び非契約者のいずれもが自身の遺伝子型及び表現型プロファイルにアクセスできるが、非契約者に対してはアクセスが限定されるか、又は限定された報告が作製され、一方、契約者は完全なアクセスができ、完全な報告が作製される。別の態様では、契約者及び非契約者のいずれもが初期には完全なアクセス又は完全な初期報告を取得できるが、契約者のみが、保存された自身のゲノムプロファイルに基づく更新報告にアクセスできる。
【0026】
基本的な契約モデルもまた存在し得る。基本契約は表現型プロファイルを提供できるが、ここで契約者は、自身のゲノムプロファイルに対して既存の全規則を適用するか、又は既存規則の一部を適用するかを選択できる。例えば、対応可能な疾患表現型についての規則のみを適用する選択を行うことができる。この基本契約は、契約クラス内に様々なレベルがあり得る。例えば、様々なレベルは、契約者が自身のゲノムプロファイルに相関させたい表現型の数によるかも知れず、又は、自身の表現型プロファイルにアクセスできる人間の数によるかも知れない。基本契約の別のレベルは、個体に特異的な因子、例えば年齢、性別、又は病歴といった既にわかっている表現型を表現型プロファイルに組み入れることかも知れない。
【0027】
基本契約のさらに別のレベルでは、個体が、或る疾患又は状態についての少なくとも1つのGCIスコアを作製できる。このレベルの変形では、個体は、少なくとも1つのGCIスコアの作製に用いられた解析における変化のために、少なくとも1つのGCIスコアに何らかの変化があった場合に、その疾患又は状態についての少なくとも1つのGCIスコアの自動更新がなされるような指示ができる。幾つかの態様では、その個体は、eメール、音声メッセージ、テキストメッセージ、郵便、又はファクシミリによって自動更新を通知され得る。
【0028】
契約者はさらに、自身の表現型プロファイル及びその表現型についての情報、例えばその表現型についての遺伝的及び医学的情報を有する報告を作製できる。例えば、その集団における該表現型の保有率、相関に使用された遺伝子変異体、該表現型を引き起こす分子メカニズム、該表現型の治療法、該表現型の処置選択肢、及び予防処置、を報告に盛り込むことができる。別の態様では、報告は、或る個体の遺伝子型と別の個体、例えば著名人又はその他の有名人の遺伝子型の類似といった情報をも盛り込んでいるかも知れない。類似性に関する情報には、相同性パーセント、同一変異体の数、及び似通った表現型といったものがあるが、これらに限定されない。これらの報告はさらに少なくとも1つのGCIスコアを含み得る。
【0029】
報告はさらに、その報告がオンラインでアクセスできる場合には、該表現型に関するさらなる情報を有する別のサイトへのリンク、オンラインサポートグループ及び同じ表現型又は1もしくはそれ以上の類似表現型を持つ人々のインターネット掲示板へのリンク、オンライン遺伝カウンセラーもしくは医師へのリンク、又は遺伝カウンセラーもしくは医師との電話もしくは対面予約へのリンクを提供し得る。報告が紙の形態である場合には、情報は、前記リンクのウェブサイトアドレス、又は遺伝カウンセラーもしくは医師の電話番号及び住所であってよい。契約者はまた、いずれの表現型を自身の表現型プロファイルに組み込み、どの情報を自身の報告に組み込むかを選択できる。表現型プロファイル及び報告はさらに、個体の健康管理者又は健康管理提供者、例えば介護者、医師、精神科医、心理学者、セラピスト、又は遺伝カウンセラーによるアクセスが可能であるかも知れない。契約者は、表現型プロファイル及び報告、又はそれらの一部を、そのような個体の健康管理者又は健康管理提供者にアクセス可能とさせるかどうかを選択することができる。
【0030】
本開示は、プレミアムレベルの契約をも包含できる。プレミアムレベル契約は、初期の表現型プロファイル及び報告の作製後もゲノムプロファイルをデジタルで維持し、最新研究により更新された相関を含む表現型プロファイル及び報告を作製する機会を契約者に提供する。別の態様では、契約者は、最新研究により更新された相関を含む報告及びリスクプロファイルを作製する機会を有する。研究によって遺伝子型及び表現型、疾患又は状態の間に新たな相関が判明すると、これら新たな相関に基づいて新しい規則が産み出され、既に保存され維持されているゲノムプロファイルに適用され得る。新しい規則は、かつていかなる表現型とも相関していなかった遺伝子型を相関させ、又は遺伝子型を新たな表現型と相関させ、又は既存の相関を改変し、又は遺伝子型及び疾患もしくは状態の間に新たに発見された関連性に基づくGCIスコアの調整基準を提供できる。契約者は、eメール又はその他の電子的手段により新たな相関について知らされ、もしその表現型が興味深いものであるならば、自身の表現型を新しい相関によって更新することを選択できる。契約者は、更新毎、幾つかの更新に対して、又は所定の期間(例えば、3ヶ月、6ヶ月、又は1年間)の無制限回数の更新に対して支払いを行う契約を選択できる。もう一つの契約レベルは、個体が表現型プロファイル又はリスクプロファイルをいつ更新するか選択する代わりに、新たな相関に基づいて新たな規則が作製された時はいつでも表現型プロファイル又はリスクプロファイルを自動更新させるというものである。
【0031】
もう一つの契約の局面では、表現型と遺伝子型の相関に関する規則を作製し、個体のゲノムプロファイルを決定し、そのゲノムプロファイルに該規則を適用し、そして該個体の表現型プロファイルを作製するサービスを、契約者が非契約者に紹介できる。契約者が紹介することにより契約者にはそのサービスの契約に割引料金が提供され、又は既存の契約がアップグレードされる。紹介された個体は、期間限定の無料アクセスか、又は割引契約料金が提供される。
【0032】
表現型プロファイル及び報告ならびにリスクプロファイル及び報告は、人間及び人間以外の個体について作製できる。例えば、個体には、他の哺乳動物、例えばウシ、ウマ、ヒツジ、イヌ、又はネコが含まれ得る。本明細書で使用する契約者とは、1又はそれ以上のサービスに対する購入又は支払いによりサービスを契約する人間の個体である。サービスには以下のもののうち1又はそれ以上が包含されるがこれらに限定される訳ではない:自身の又は別の個体、例えば契約者の子供又はペットのゲノムプロファイルを決定させること、表現型プロファイルを取得すること、その表現型プロファイルを更新させること、及び、自身のゲノム及び表現型プロファイルに基づく報告を取得すること。
【0033】
本開示の別の局面では、「現場配置」メカニズムを個体から収集して、個体のための表現型プロファイルを作製できる。好ましい態様では、或る個体は遺伝情報に基づいて初期表現型プロファイルを作製させることができるかも知れない。例えば、種々の表現型についてのリスクファクター及び勧奨される処置又は予防措置を含む初期表現型プロファイルが作製される。例えば、そのプロファイルは、或る状態のために利用可能な薬物治療についての情報、及び/又は食生活の変更又は運動レジメンに関する提案を含み得る。その個体は、自身の表現型プロファイルについて相談するために、医師又は遺伝カウンセラーに面会するか、又はウェブポータルもしくは電話により連絡を取るかを選択できる。その個体は、例えば特別な薬物治療をする、食生活を変える、等、何らかの一連の行動を取る決定をするかも知れない。
【0034】
次にその個体は、自身の身体状態の変化及びリスクファクターに起こり得る変化を評価するため、生体試料を提出できる。ゲノムプロファイル及び表現型プロファイルを作製する施設(又は関連施設、例えば遺伝子プロファイル及び表現型プロファイルを作製する事業体と契約した施設)に生体試料を直接提出することにより、変化を確定してもらうことができる。或いは、その個体は「現場配置」メカニズムを利用でき、その場合、個体は唾液、血液、又はその他の生体試料を自宅の検出装置にかけ、第三者に解析させ、そしてそのデータを送信して別の表現型プロファイルに組み込ませることができる。例えば、或る個体が、遺伝データに基づいて心筋梗塞(MI)の生涯リスクが高いと報告する初期表現型報告を受け取ったかも知れない。その報告にはさらに、MIのリスクを低下させるための予防措置についての勧奨、例えばコレステロール低下薬及び食生活の変更が記載されているかも知れない。その個体は、遺伝カウンセラー又は医師に連絡を取り、その報告及び予防措置について相談することを選択し、食生活を変えようと決める。新たな食生活でしばらく過ごした後に、その個体はかかりつけの医師の診察を受け、コレステロールレベルを測定してもらう。ゲノム情報を持っている事業体に新しい情報(コレステロールレベル)が伝達され(例えばインターネットを介して)、そして、この新しい情報が、心筋梗塞及び/又はその他の状態についての新たなリスクファクターを伴う該個体の新たな表現型プロファイルの作製に利用される。
【0035】
個体は、特定の薬物治療に対する自身の個別反応を決定するために「現場配置」メカニズム又は直接メカニズムを利用することもできる。例えば、或る薬物に対する反応を測定してもらい、その情報を利用して、より有効な処置を決定することができる。測定可能な情報には、代謝産物レベル、グルコースレベル、イオンレベル(例えば、カルシウム、ナトリウム、カリウム、鉄)、ビタミン、血球数、ボディー・マス・インデックス(BMI)、蛋白レベル、転写物レベル、心拍数、等があり(但しこれらに限定される訳ではない)、これらを容易に実施可能な方法で測定し、アルゴリズムに組み入れて初期ゲノムプロファイルと合し、改変された総体的なリスク推定スコアを決定することができる。
【0036】
「生体試料」という語は、個体の遺伝子試料がそこから単離できる任意の生物学的試料を指す。
【0037】
本明細書で使用する「遺伝子試料」とは、個体から取得又は誘導されるDNA及び/又はRNAを指す。
【0038】
本明細書で使用する「ゲノム」という語は、ヒトの細胞の核内に見出される染色体DNAの全体を意味することを意図している。「ゲノムDNA」という語は、ヒトの細胞の核に天然に存在する1又はそれ以上の染色体DNA分子、又は該染色体DNA分子の一部を指す。
【0039】
「ゲノムプロファイル」という語は、個体の遺伝子についての一組の情報、例えば特定のSNP又は突然変異の有無を指す。ゲノムプロファイルは個体の遺伝子型を包含する。ゲノムプロファイルはさらに、個体の実質上完全なゲノム配列であることもある。幾つかの態様では、ゲノムプロファイルは、個体の完全なゲノム配列の少なくとも60%、80%、又は95%であってよい。ゲノムプロファイルは個体の完全なゲノム配列のほぼ100%であってよい。ゲノムプロファイルに関して「その一部」とは、或る完全なゲノムのゲノムプロファイル部分集合に含まれるゲノムプロファイルを指す。
【0040】
「遺伝子型」という語は、個体のDNAの特定の遺伝子構成を指す。遺伝子型には、個体の遺伝子変異体及びマーカーが包含され得る。遺伝子マーカー及び変異体には、ヌクレオチド反復、ヌクレオチド挿入、ヌクレオチド除去、染色体転座、染色体複製、又はコピー数変異が包含され得る。コピー数変異は、マイクロサテライト反復、ヌクレオチド反復、動原体反復、又はテロメア反復が包含され得る。遺伝子型はさらにSNP、ハプロタイプ、又はディプロタイプを包含し得る。ハプロタイプとは、遺伝子座又はアレルを指すことがある。ハプロタイプはまた、統計的に関連性のある1本の染色分体上の単一ヌクレオチド多型(SNP)の組とも表現される。ディプロタイプは一組のハプロタイプである。
【0041】
単一ヌクレオチド多型又は「SNP」という語は、ヒト集団内でその遺伝子座に存在する窒素含有塩基の実体に関して、例えば少なくとも1パーセント(1%)の変動性を示す、染色体上の特定遺伝子座を指す。例えば、或る個体が、与えられた遺伝子の特定ヌクレオチド位置にアデノシン(A)を有する場合、別の個体がこの位置にシトシン(C)、グアニン(G)、又はチミン(T)を有すると、その特定位置にはSNPが存在するのである。
【0042】
本明細書で使用する「SNPゲノムプロファイル」という用語は、或る個体のゲノムDNA配列全体を通じた、SNP部位におけるその個体のDNAの塩基内容を指す。「SNPプロファイル」は、ゲノムプロファイル全体を指すことができるが、その一部、例えば特定遺伝子もしくは遺伝子群に関連し得る、より限局したSNPプロファイルを指すこともある。
【0043】
「表現型」という語は、個体の定量的形質又は特徴の描写に使用される。表現型には医学的及び非医学的状態が包含されるがこれらに限定される訳ではない。医学的状態には疾患及び障害が包含される。表現型はさらに、身体的特徴、例えば毛髪の色、生理的特徴、例えば肺活量、精神的特徴、例えば記憶保持、情緒的特徴、例えば怒りを制御する能力、民族性、例えば民族的背景、祖先、例えば個体の出自、ならびに年齢、例えば平均余命又は種々の表現型の発現年齢を包含する。表現型にはさらに、1個の遺伝子が1つの表現型に相関している単一遺伝子型、又は1以上の遺伝子が1つの表現型に相関している多遺伝子型がある。
【0044】
「規則」とは、遺伝子型と表現型の相関を定義するために用いられる。規則は、数値、例えばパーセント、リスクファクター、又は信頼スコアによって相関を定義できる。規則には、複数の遺伝子型と1つの表現型の相関を組み入れることができる。「規則の組」は、1以上の規則を含んでなる。「新たな規則」とは、現在それらについての規則が存在していない、遺伝子型と表現型の相関を示す規則である。新たな規則は、非相関遺伝子型と表現型を相関させるかも知れない。新たな規則はさらに、既に或る表現型と相関している遺伝子型と、かつて相関していたことのない表現型を相関させるかも知れない。「新たな規則」はさらに、別の規則を包含する他の因子によって改変された既存の規則であるかも知れない。既存の規則は、個体の既知の特徴、例えば民族性、祖先、地理、性別、年齢、家族歴、又は過去に決定されたその他の表現型が原因で改変されることがある。
【0045】
本明細書における「遺伝子型相関」の使用は、個体の遺伝子型、例えば或る突然変異又は突然変異群の存在と、或る表現型、例えば特定の疾患、状態、身体状態、及び/又は精神状態になり易くなる尤度との、統計学的相関を指す。特定の遺伝子型の存在下で或る表現型が観察される頻度は、特定表現型の遺伝子型相関の程度又は尤度を決定する。例えば、本明細書に詳述するように、アポリポ蛋白E4イソ型を生じさせるSNPは、早発性アルツハイマー病への罹患し易さと相関している。遺伝子型相関はまた、表現型への素因がない相関、又は負の相関をも指す。遺伝子型相関はさらに、或る表現型を有する又は或る表現型を有する素因のある個体の推定値を表し得る。遺伝子型相関は、数値、例えばパーセント、相対リスクファクター、効果推定値、又は信頼スコアによって示すことができる。
【0046】
「表現型プロファイル」という語は、或る個体の遺伝子型又は遺伝子型群に相関する複数の表現型の集合体を指す。表現型プロファイルは、或るゲノムプロファイルに1又はそれ以上の規則を適用することによって作製される情報、又は或るゲノムプロファイルに適用される遺伝子型相関についての情報を包含できる。表現型プロファイルは、1つの表現型に複数の遺伝子型を相関させる規則を適用することにより作製できる。確率又は推定値は、数値、例えばパーセント、数値的リスクファクター又は数値的信頼区間として表現できる。確率は、高、中、又は低で表現することもできる。表現型プロファイルはさらに、或る表現型の有無又は或る表現型を発現するリスクを示すこともある。例えば、或る表現型プロファイルは、青い眼、又は糖尿病を発症する高いリスクの存在を示すことがある。表現型プロファイルはさらに、或る医学的状態の予後予測、処置の有効性、又は処置への応答を示すことがある。
【0047】
リスクプロファイルという語は、1以上の疾患又は状態についてのGCIスコアの集合体を指す。GCIスコアは個体の遺伝子型と1又はそれ以上の疾患もしくは状態の間の関連性の解析に基づいている。リスクプロファイルは、疾患カテゴリーにグループ分けされたGCIスコアを表すことができる。さらにリスクプロファイルは、個体の年齢や様々なリスクファクターを調節する時にGCIスコアの変化を如何にして予測するかについての情報を示すことができる。例えば、特定の疾患についてのGCIスコアは、食生活の変更効果や実行される予防措置(禁煙、薬物投与、定型的両側乳房切断術、子宮摘出術)を考慮に入れることができる。GCIスコアは、数値尺度、グラフ表示、聴覚によるフィードバック又はこれらの任意の組み合わせとして表示できる。
【0048】
本明細書で使用する「オンラインポータル」という語は、コンピューター及びインターネットウェブサイト、電話、又は同様の情報へのアクセスを可能にするその他の手段を使用することにより個体が容易にアクセスできる情報源を指す。オンラインポータルは安全なウェブサイトであってよい。このウェブサイトは、他の安全及び非安全ウェブサイトへのリンク、例えば、その個体の表現型プロファイルを内包する安全なウェブサイト、又は特定の表現型を共有する個体のためのインターネット掲示板のような非安全ウェブサイトを提供することがある。
【0049】
特に指摘のない限り、本開示の実施は、分子生物学、細胞生物学、生化学、及び免疫学の常套的技術及び説明を使用でき、それらは当分野の通常の技術の範囲内にある。このような常套技術には、核酸単離、ポリマーアレイ合成、ハイブリダイゼーション、ライゲーション、及び標識を用いるハイブリダイゼーションの検出がある。適切な技術の具体的説明を本明細書で例示言及する。しかしながら、他の同等の常套的手法もまた利用できる。他の常套的技術及び説明は、Genome Analysis: A Laboratory Manual Series(Vols. I-IV)、PCR Primer: A Laboratory Manual、Molecular Cloning: A Laboratory Manual(全てCold Spring Harbor Laboratory Pressより);Stryer, L. (1995) Biochemistry(4th Ed.) Freeman, New York、Gait, “Oligonucleotide Synthesis: A Practical Approach” 1984, IRL Press, London, Nelson and Cox(2000); Lehninger, Principles of Biochemistry 3rd Ed., W.H. Freeman Pub., New York, N.Y.;及びBerg et al. (2002) Biochemistry, 5th Ed., W.H. Freeman Pub., New York, N.Y.といった標準的研究マニュアル及び教科書に見出すことができ、これらは全て引用によりその全内容を本明細書の一部とする。
【0050】
本開示の方法は、表現型に関する分子情報を個体に提供するための、該個体のゲノムプロファイルの解析を含む。本明細書に詳述するように、個体は遺伝子試料を提供し、そこから個人のゲノムプロファイルが作製される。このプロファイルを、確立され検証されたヒト遺伝子型相関のデータベースと比較することにより、その個体のゲノムプロファイルデータを遺伝子型相関について照会する。確立され検証された遺伝子型相関のデータベースは、同業者により審査された文献由来のものであり、さらに当該分野の1又はそれ以上の専門家、例えば遺伝学者、疫学者、又は統計学者より成る委員会により評価され監督される。好ましい態様では、評価済みの遺伝子型相関に基づいて規則を作製し、それを個体のゲノムプロファイルに適用して表現型プロファイルを作製する。個体のゲノムプロファイルの解析結果、表現型プロファイル、ならびに解釈及び支援情報が、個体又は該個体の健康管理者に提供され、該個体の健康管理のための個別的な選択ができるようにさせる。
【0051】
本開示の方法は図1に詳しく記載のとおりであるが、ここで、まず個体のゲノムプロファイルを作製する。個体のゲノムプロファイルは、遺伝子変異又はマーカーに基づく個体の遺伝子についての情報を含んでいる。遺伝子変異はゲノムプロファイルを構成する遺伝子型である。このような遺伝子変異又はマーカーには、単一ヌクレオチド多型、単一及び/又は多ヌクレオチド反復、単一及び/又は多ヌクレオチド除去、マイクロサテライト反復(典型的には5〜1000反復単位を伴う少数のヌクレオチド反復)、ジヌクレオチド反復、トリヌクレオチド反復、配列再編成(転座及び複製を含む)、コピー数変異(特定の遺伝子座の欠失及び獲得の両者)等があるが、これらに限定される訳ではない。その他の遺伝子変異には、染色体複製及び転座ならびに動原体及びテロメア反復がある。
【0052】
遺伝子型はさらにハプロタイプ及びディプロタイプを包含し得る。幾つかの態様では、ゲノムプロファイルは少なくとも100000、300000、500000又は1000000の遺伝子型を有し得る。幾つかの態様では、ゲノムプロファイルは個体の実質的に完全なゲノム配列であり得る。別の態様では、ゲノムプロファイルは個体の完全なゲノム配列の少なくとも60%、80%、又は95%である。ゲノムプロファイルは個体の完全なゲノム配列のほぼ100%であることがある。標的を含む遺伝子試料は、増幅されていないゲノムDNA又はRNA試料又は増幅されたDNA(又はcDNA)を包含するがこれらに限定されない。標的は、特に興味深い遺伝子マーカーを含むゲノムDNAの特定領域であるかも知れない。
【0053】
図1の工程102では、個体の遺伝子試料を個体の生体試料から単離する。そのような生体試料には、血液、毛髪、皮膚、唾液、精液、尿、糞便物質、汗、口腔粘膜、及び様々な身体組織が包含されるがこれらに限定される訳ではない。幾つかの態様では、個体が組織試料を直接採集し、例えば口腔粘膜試料は、個体が頬の内側に綿棒を当てることにより取得できる。唾液、精液、尿、糞便物質、又は汗といったその他の試料も個体自身によって供給できる。その他の生体試料は、瀉血士、看護師又は医師といった健康管理の専門家によって採取され得る。例えば、血液試料は看護師により個体から採取され得る。組織生検は健康管理の専門家によって行われ、試料を効率的に取得するためのキットもまた健康管理専門家は入手できる。小円筒状の皮膚を採取することができ、又は針を使用して組織又は液体の少量試料を採取できる。
【0054】
幾つかの態様では、個体の生体試料のために試料の採集容器付きのキットが個体に提供される。このキットはさらに、個体が自身の試料を直接採集するための指示書、例えばどれだけの量の毛髪、尿、汗、又は唾液を提供するか、を個体に提供できる。キットにはまた、個体が健康管理専門家に組織試料の採取を要請するための指示書が入っているかも知れない。キットには、試料が第三者により採取される場所が含まれており、例えば、キットが健康管理施設に提供され、次にその施設が個体から試料を集めることがある。さらにこのキットは、試料が試料処理施設に送付されるための返送用梱包材をも提供でき、その施設で遺伝子材料が生体試料から単離される(工程104)。
【0055】
幾つかの周知の生化学的及び分子生物学的方法のいずれかに従ってDNA又はRNAの遺伝子試料が生体試料から単離できる。例えばSambrook, et al., Molecular Cloning: A Laboratory Manual(Cold Spring Harbor Laboratory, New York)(1989)を参照されたい。生体試料からDNA又はRNAを単離するための市販のキット及び試薬も幾つかあり、例えばDNA Genetek、Gentra Systems、Qiagen、Ambion、及びその他の供給者から入手できるものがある。口腔粘膜試料キットは、例えばMasterAmp(登録商標) Buccal Swab DNA抽出キット(Epicentre Biotechnologies製)を容易に商業的に入手でき、Extract-N-Amp(登録商標)(Sigma Aldrich製)のような血液試料からのDNA抽出用キットもまた同様である。他の組織からのDNAは、組織をプロテアーゼ及び熱で消化し、試料を遠心分離し、フェノール−クロロホルムを用いて不要物質を抽出し、水相にDNAを残すことによって取得できる。次いでこのDNAをエタノール沈殿によりさらに単離できる。
【0056】
好ましい態様では、ゲノムDNAを唾液から単離する。例えば、DNA Genotekから入手できるDNA自己採集キット技術を用いて、個体が臨床処理のための唾液標本を採集する。都合の良いことにこの試料は室温で保存及び搬送できる。試料が処理のための適当な研究所に送付された後、典型的には採集キットの供給者により供給された試薬を用いて、熱変性及びプロテアーゼ消化により50℃で少なくとも1時間DNAを単離する。次にこの試料を遠心分離し、上清をエタノール沈殿させる。このDNAペレットを、その後の分析に適した緩衝液に懸濁する。
【0057】
別の態様では、遺伝子試料としてRNAを使用できる。特に、発現される遺伝子変異はmRNAから特定できる。「メッセンジャーRNA」又は「mRNA」という語は、プレmRNA転写物(群)、転写物プロセシング中間体、翻訳される準備が整った成熟mRNA(群)及び遺伝子もしくは遺伝子群の転写物、又はmRNA転写物(群)から誘導される核酸を包含するが、これらに限定されない。転写物プロセシングは、スプライシング、編集及び分解を含み得る。本明細書で使用する、mRNA転写物から誘導される核酸とは、その合成のためにmRNA転写物又はその部分配列が最終的に鋳型として働く核酸を指す。したがって、mRNAから逆転写されたcDNA、該cDNAから増幅されたDNA、増幅されたDNAから転写されたRNA等は全てmRNA転写物から誘導される。RNAは、当分野で既知の方法、例えば、PreAnalytiXから入手できるPAXgene(登録商標) Blood RNAシステムを使用する未分画全血からのRNA単離を利用して、幾つかの身体組織のいずれかから単離できる。典型的にはmRNAを用いてcDNAを逆転写し、次いでそれを遺伝子変異解析のために使用又は増幅する。
【0058】
ゲノムプロファイル解析に先立ち、典型的には遺伝子試料を、DNA又はRNAから逆転写されたcDNAのいずれかから増幅する。DNAは幾つかの方法で増幅でき、その多くはPCRを使用する。例えば、PCR Technology: Principles and Applications for DNA Amplification(Ed. H.A.Erlich, Freeman Press, NY, N.Y., 1992);PCR Protocols: A Guide to Methods and Applications(Eds. Innis, et al., Academic Press, San Diego, Calif., 1990);Mattila et al., Nucleic Acids Res. 19, 4967(1991);Eckert et al., PCR Methods and Applications 1, 17(1991);PCR(Eds. McPherson et al., IRL Press, Oxford);及び米国特許第4683202、4683195、4800159、4965188及び5333675号を参照されたく、これらの各々は引用によりその全内容を本明細書の一部とする。
【0059】
その他の好適な増幅法には、リガーゼ連鎖反応(LCR)(例えばWu and Wallace, Genomics 4, 560(1989)、Landegren et al., Science 241, 1077(1988)及びBarringer et al., Gene 89:117(1990))、転写増幅(Kwoh et al., Proc. Natl. Acad. Sci. USA, 86:1173-1177(1989)及びWO88/10315)、自己持続配列複製(Guatelli et al., Proc. Natl. Acad. Sci. USA, 87:1874-1878(1990)及びWO90/06995)、標的ポリヌクレオチド配列の選択的増幅(米国特許第6410276号)、コンセンサス配列プライムドポリメラーゼ連鎖反応(CP−PCR)(米国特許第4437975号)、任意にプライムされるポリメラーゼ連鎖反応(AP−PCR)(米国特許第5413909、5861245号)、核酸に基づく配列増幅(NABSA)、ローリングサークル増幅(RCA)、多置換増幅(MDA)(米国特許第6124120及び6323009号)及びサークル−トゥー−サークル増幅(C2CA)(Dahl et al., Proc. Natl. Acad. Sci., 101:4548-4553(2004))がある。(米国特許第5409818、5554517、及び6063603号を参照されたく、これらの各々は引用により本明細書の一部とする。)利用できるその他の増幅法は、米国特許第5242794、5494810、5409818、4988617、6063603及び5554517号ならびに米国特許出願第09/854317号に記載されており、これらの各々を引用して本明細書の一部とする。
【0060】
工程106におけるゲノムプロファイルの作製は、幾つかの方法のうちいずれかを用いて実施する。ゲノムプロファイルの作製は幾つかの方法のうちいずれかを用いて実施できる。遺伝子変異を特定する方法は当分野で幾つか知られており、幾つかの方法のうちいずれかによるDNA配列決定、PCRに基づく方法、フラグメント長多型アッセイ(制限フラグメント長多型(RFLP)、開裂フラグメント長多型(CFLP))、鋳型としてアレル特異的オリゴヌクレオチドを使用するハイブリダイゼーション法(例えばTaqManアッセイ及びマイクロアレイ。本明細書で後ほど述べる。)、プライマー伸張反応を用いる方法、質量分析(例えばMALDI−TOF/MS法)等があるが(例えばKwok, Pharmocogenomics 1:95-100(2000)に記載されている)、これらに限定される訳ではない。その他の方法には、インベーダー法、例えばモノプレックス及びバイプレックスインベーダーアッセイ(例えばThird Wave Technologies, Madison, WIより入手でき、Olivier et al., Nucl. Acids Res. 30:e53(2002)に記載されている)がある。
【0061】
或る態様では、SNPの特定及びプロファイル作製に高密度DNAアレイを使用する。このようなアレイは、Affymetrix及びIllumina(Affymetrix GeneChip(登録商標) 500K Assay Manual(Affymetrix, Santa Clara, CA)(引用により本明細書の一部とする);Sentrix(登録商標) humanHap650Y遺伝子型決定ビーズチップ(Illumina, San Diego, CA)を参照されたい)から市販されている。
【0062】
例えば、SNPプロファイルは、Affymetrix Genome Wide Human SNP Array 6.0を用いて900000以上のSNPを遺伝子型決定することにより作製できる。或いは、Affymetrix GeneChip Human Mapping 500K Array Setを用いることにより、全ゲノムサンプリング解析を通じて500000以上のSNPを決定できる。これらのアッセイでは、ヒトゲノムの小集団を、制限酵素消化されアダプターライゲーションされたヒトゲノムDNAを用いる単一プライマー増幅反応によって増幅する。次いで、図2に示すように、ライゲーションされたDNAの濃度を測定する。次に、増幅されたDNAをフラグメント化し、試料の品質を決定した後、工程106に進む。試料がPCR及びフラグメント化基準に合致していたならば、その試料を変性させ、標識し、次いで、被覆された石英表面の特定位置にある小DNAプローブで構成されるマイクロアレイにハイブリダイズさせる。増幅されたDNA配列の関数として、各プローブにハイブリダイズする標識の量を監視し、それにより、配列情報及び得られるSNP遺伝子型を求める。
【0063】
製造者の指示に従ってAffymetrix GeneChip 500K Assayを使用する。簡潔に述べると、まず、単離されたゲノムDNAをNspI又はStyI制限エンドヌクレアーゼのいずれかで消化する。次に、消化されたこのDNAを、それぞれNspI又はStyI制限消化されたDNAとアニーリングするNspI又はStyIアダプターオリゴヌクレオチドとライゲーションする。次いで、ライゲーション後のアダプター含有DNAをPCR増幅し、約200〜1100塩基対(ゲル電気泳動で確認)の増幅DNAフラグメントを得る。増幅基準に合致するPCR生成物をフラグメント化のために精製及び定量する。このPCR生成物を、最適なDNAチップハイブリダイゼーションのためにDNaseでフラグメント化する。フラグメント化の後、ゲル電気泳動で確認したところ、DNAフラグメントは250塩基対未満であり、平均して約180塩基対である。次に、フラグメント化基準に合致する試料をターミナルデオキシヌクレオチジルトランスフェラーゼを用いてビオチン化合物で標識する。次いでこの標識されたフラグメントを変性させ、GeneChip 250Kアレイにハイブリダイズさせる。ハイブリダイゼーション後、アレイを染色し、ストレプトアビジン・フィコエリスリン(SAPE)染色、次いでビオチン化抗ストレプトアビジン抗体(ヤギ)による抗体増幅工程、及びストレプトアビジン・フィコエリスリン(SAPE)による最終染色より成る三工程プロセスでスキャンする。標識の後、アレイをアレイ保持緩衝液で被覆し、Affymetrix GeneChip Scanner 3000のようなスキャナーでスキャンする。
【0064】
図3に示すように、製造者の指針に従い、Affymetrix GeneChip Human Mapping 500K Array Setのスキャンに従うデータの解析を実施する。簡潔に述べると、GeneChipオペレーティングソフト(GCOS)を用いて生データを獲得する。Affymetrix GeneChip Command Console(登録商標)を用いてデータを獲得することもできる。生データを獲得した後、GeneChip遺伝子型解析ソフト(GTYPE)で解析を行う。本開示の目的のため、80%を下回るGTYPEコールレートの試料は除外する。次に試料をBRLMM及び/又はSNiPerアルゴリズム解析で調べる。95%未満のBRLMMコールレート又は98%未満のSNiPerコールレートの試料は除外する。最後に関連性解析を行い、0.45未満のSNiPer品質指数及び/又は0.00001未満のHardy-Weinberg p値を有する試料を除外する。
【0065】
DNAマイクロアレイ解析に代わって、又はこれに加えて、別のハイブリダイゼーションに基づく方法、例えばTaqMan法及びその変法を使用することにより、SNP及び突然変異のような遺伝子変異が検出できる。TaqManPCR、反復TaqMan、及び実時間PCR(RT−PCR)のその他の変法(例えばLivak et al., Nature Genet., 9, 341-32(1995)及びRanade et al., Genome Res., 11, 1262-1268(2001)に記載されている)を本明細書に開示する方法に利用できる。幾つかの態様では、特定の遺伝子変異、例えばSNPのためのプローブを標識してTaqManプローブを作製する。このプローブは、典型的には少なくともおよそ12、15、18又は20塩基対の長さである。これらは大体10〜70、15〜60、20〜60、又は18〜22塩基対長であってよい。このプローブを、リポーター標識、例えばフルオロフォアで5’末端を、そして3’末端を該標識のクエンチャーで標識する。リポーター標識は、クエンチャーに非常に接近すると、例えば該プローブの長さ程に接近するとその蛍光が阻害又は消光される任意の蛍光分子であってよい。例えばリポーター標識は、6−カルボキシフルオレセイン(FAM)、テトラクロロフルオレセイン(TET)、又はそれらの誘導体のようなフルオロフォアであってよく、クエンチャーはテトラメチルローダミン(TAMRA)、ジヒドロシクロピロロインドールトリペプチド(MGB)又はそれらの誘導体であってよい。
【0066】
リポーターフルオロフォア及びクエンチャーがプローブの長さ分だけ隔てられて接近すると、蛍光が消光する。プローブが標的配列、例えば試料中のSNPを含む配列とアニーリングする時、5’から3’へのエキソヌクレアーゼ活性を持つDNAポリメラーゼ、例えばTaqポリメラーゼがプライマーを伸張させ、エキソヌクレアーゼ活性がプローブを開裂させ、リポーターをクエンチャーから分離し、その結果リポーターが蛍光を発する。このプロセスは例えばRT−PCRにおいて反復される。TaqManプローブは、典型的には、配列を増幅させるべく設計された2つのプライマー間に位置する標的配列と相補的である。したがって、各プローブが新たに作製されたPCR生成物とハイブリダイズできるため、PCR生成物の蓄積が、放出されるフルオロフォアの蓄積と相関し得る。放出されるフルオロフォアを測定し、存在する標的配列の量を決定できる。ハイスループット遺伝型決定のためのRT−PCR法を利用できる。
【0067】
遺伝子変異はDNA配列決定によっても特定できる。DNA配列決定を利用して個体のゲノム配列の実質的な部分、又は全体を配列決定できる。伝統的には、一般的DNA配列決定は、ポリアクリルアミドゲル分画化に基づいて鎖終止フラグメントの集団を分解してきた(Sanger et al., Proc. Natl. Acad. Sci. USA 74:5463-5467(1977))。DNA配列決定の速度及び容易さを高める代替方法が開発されており、且つその開発が続いている。例えば、ハイスループット及び単分子配列決定プラットフォームが454 Life Sciences(Branford, CT)(Margulies et al., Nature 437:376-380(2005));Solexa(Hayward, CA);Helicos BioSciences Corporation(Cambridge, MA)(米国特許出願第11/167046号(2005年6月23日出願))、及びLi-Cor Biosciences(Lincoln, NE)(米国特許出願第11/118031号(2005年4月29日出願))から市販されているか、又は開発中である。
【0068】
工程106で個体のゲノムプロファイルを作製した後、工程108でこのプロファイルをデジタル保存するが、その結果こうしたプロファイルは安全な方法でデジタル保存できる。このゲノムプロファイルを、データセットの一部として保存するためにコンピューター読み取り可能なフォーマットでコード化してデータベースとして保存するが、その場合、ゲノムプロファイルは「貯蔵」され、後に再びアクセスすることができる。このデータセットは複数のデータ点を含んでなり、ここで各データ点は或る個体に関連している。各データ点は複数のデータ要素を有し得る。1個のデータ要素はユニークな識別子であり、個体のゲノムプロファイルの特定に利用される。それはバーコードであってよい。別のデータ要素は遺伝子型情報、例えばSNP又は個体ゲノムのヌクレオチド配列である。遺伝子型情報に対応するデータ要素がデータ点に包含されていてもよい。例えば、遺伝子型情報がマイクロアレイ解析により特定されたSNPを含む場合、他のデータ要素は、マイクロアレイSNP識別番号、SNP rs番号、及び多型ヌクレオチドを包含するかも知れない。他のデータ要素は、遺伝子型情報の染色体位置、データの品質測定法、生データファイル、データの画像、及び抽出された強度スコアであってよい。
【0069】
身体的データ、医療データ、民族性、祖先、地理、性別、年齢、家族歴、既知の表現型、人口統計データ、暴露データ、ライフスタイルデータ、行動データ、及びその他の既知表現型等の個体の特異的因子もまたデータ要素として組み込むことができる。例えば因子には、個体の出生地、両親及び/又は祖父母、血縁者の祖先、居住地、祖先の居住地、環境条件、既知の健康状態、既知の薬物相互作用、家族の健康状態、ライフスタイル状況、食生活、運動習慣、結婚歴、及び身体測定値、例えば体重、身長、コレステロールレベル、心拍数、血圧、グルコースレベルならびに当分野で知られるその他の測定値が包含されるがこれらに限定される訳ではない。個体の血縁者又は祖先、例えば両親及び祖父母についての上記因子をデータ要素として組み込み、表現型又は状態に関する個体のリスクを決定するために利用することもできる。
【0070】
特別な因子が質問票又はその個体の健康管理者から得られることがある。その場合、「貯蔵された」プロファイルからの情報にアクセスし、希望に応じて利用することができる。例えば、個体の遺伝子型相関を最初に評価する場合、その個体の全情報(典型的には、ゲノム全体にわたる、又はゲノム全体から取得した、SNP又はその他のゲノム配列)が遺伝子型相関について解析される。その後の解析では、保存されもしくは貯蔵されたゲノムプロファイル由来の情報全体、又はその一部に、希望に応じて、又は必要に応じてアクセスすることができる。
【0071】
ゲノムプロファイルと遺伝子型相関のデータベースの比較
工程110では、科学文献から遺伝子型相関を取得する。遺伝子変異についての遺伝子型相関を、目的とする1又はそれ以上の表現型形質の有無について、そして遺伝子型プロファイルについて検査された個体集団の解析から決定する。次いで各々の遺伝子変異のアレル又はそのプロファイル中の多型を再検討し、特定アレルの有無が目的とする形質と関連しているかどうかを決定する。相関付けは標準的統計学的方法により実施でき、遺伝子変異及び表現型の特徴の間の統計学的に有意な相関を記録する。例えば、多型AのアレルA1の存在は心臓病と相関していることが決定づけられるかも知れない。さらなる例として、多型AにおけるアレルA1及び多型BにおけるアレルB1の共存が、癌のリスク増大に相関することが判明するかも知れない。解析結果は専門家の検討する文献に発表され、他の研究グループにより検証され、そして/又は専門家、例えば遺伝学者、統計学者、疫学者及び医師より成る委員会により解析され、さらには監督されるかも知れない。
【0072】
図4、5及び6は、ゲノムプロファイルに適用される規則の基礎とされ得る遺伝子型及び表現型の相関例である。例えば、図4A及びBでは、各列は表現型/遺伝子座/民族性に対応し、図4C〜Iは、これらの各列についての相関に関するさらなる情報を含む。一例として図4Aにおいて、図4Mに記載されるように短い表現型の名称の指標であるBCという「短い表現型名」は、乳癌の略語である。その遺伝子座の一般名である列BC 4では、遺伝子LSP1が乳癌に相関している。図4Cに示すように、この相関によって特定される公表された又は機能的なSNPはrs3817198であり、公表されているリスクアレルはCであり、非リスクアレルはTである。この公表されているSNP及びアレルは、刊行物、例えば図4E〜Gに記載の重要な公表文献によって特定されている。図4Eに記載のLSP1の例では、重要な公表文献はEaston et al., Nature 447:713-720(2007)である。
【0073】
或いは、相関は保存されたゲノムプロファイルから作製できる。例えば、保存されたゲノムプロファイルを持つ個体は、既知の表現型情報を同様に保存させることができる。この、保存されたゲノムプロファイル及び既知表現型の解析が、遺伝子型相関を産むかも知れない。一例として、保存ゲノムプロファイルを有する250例の個体が、過去に糖尿病と診断されているという保存された情報をも持っている。それらのゲノムプロファイルの解析を行い、糖尿病のない対照個体群と比較する。次に、過去に糖尿病と診断された個体が、対照群と比較して特定の遺伝子変異体を有する率が高いことを決定づけ、その特定遺伝子変異体及び糖尿病の間に遺伝子型相関が作製され得る。
【0074】
工程112では、特定表現型に対する遺伝子変異体の検証された相関に基づいて規則を作製する。規則は、例えば表1に列挙したように、相関している遺伝子型及び表現型に基づいて作製できる。相関に基づく規則は、図4及び5に記載のような効果推定値を作製するため、性別(例えば図4)又は民族性(図4及び5)といった他の因子を組み込むことができる。規則から導かれる他の尺度には、図6に記載のような相対リスク上昇推定値がある。効果推定値及び相対リスク上昇推定値は、公表文献によるものであってよく、又はその公表文献から算出されるものであってよい。或いは、規則は、保存されているゲノムプロファイル及び過去に判明した表現型から作製される相関に基づいていてもよい。
【0075】
好ましい態様では、遺伝子変異はSNPである。SNPは単一の部位に存在するが、
1個の部位に或るSNPアレルを有する個体はしばしば別の部位に特定のSNPアレルを有すると予想される。SNPと、個体を疾患又は状態に陥らせ易くするアレルの相関は、連鎖不均衡によって起こり、その場合、2又はそれ以上の遺伝子座におけるアレルの非ランダムな関連性が、組換えを介したランダムな形成から予想されるよりも、程度の差はあるものの、より頻繁に集団に起こる。
【0076】
その他の遺伝子マーカー又は変異体、例えばヌクレオチド反復又は挿入もまた、特定の表現型と関連していることが示されている遺伝子マーカーと連鎖不均衡であることがある。例えば、或るヌクレオチド挿入が或る表現型に相関し、或るSNPがそのヌクレオチド挿入と連鎖不均衡にある。このSNP及び表現型の間の相関に基づいて規則が作製される。このヌクレオチド挿入及び表現型の間の相関に基づく規則もまた作製できる。1個のSNPの存在が或るリスクファクターを与え、別のSNPが別のリスクファクターを与え、そしてそれらが合した時、リスクが増強し得るといったように、いずれかの規則又は両方の規則をゲノムプロファイルに適用できる。
【0077】
連鎖不均衡を通じて、或る疾患の素因となるアレルは、SNPの特定アレル又はSNPの特定アレルの組み合わせと一緒に分離する。染色体に沿ったSNPアレルの特定の組み合わせをハプロタイプと称し、それらが組み合わさって存在するDNA領域をハプロタイプブロックと称することができる。ハプロタイプブロックは1個のSNPで構成され得るが、典型的にはハプロタイプブロックは、個体間でのハプロタイプ多様性の低い、且つ一般に組換え頻度の低い、連続した2又はそれ以上のSNPを表す。ハプロタイプの特定は、或るハプロタイプブロックに存在する1又はそれ以上のSNPを特定することによって行うことができる。したがって、典型的にはSNPプロファイルを使用して、与えられたハプロタイプブロック中の全SNPの特定を必ずしも必要とせずに、ハプロタイプブロックの特定を行うことができる。
【0078】
SNPハプロタイプパターンと疾患、状態又は身体状態の間の遺伝子型相関が次第に判明しつつある。所定の疾患について、その疾患を有するとわかっている人々の群のハプロタイプパターンを、該疾患を持たない人々の群と比較する。多くの個体を解析することにより、集団における多型の頻度を決定し、次にそれらの頻度又は遺伝子型を特定表現型、例えば疾患又は状態と関連づけることができる。既知のSNP−疾患相関の例には、加齢性黄斑変性症における補体因子Hの多型(Klein et al., Science: 308:385-389(2005))及び肥満に関連するINS(登録商標)IG2遺伝子近傍の変異体(Herbert et al., Science: 312:279-283(2006))がある。その他の既知SNP相関には、CDKN2A及びBを包含する9p21領域の多型、例えば心筋梗塞に相関するrs10757274、rs2383206、rs13333040、rs2383207、及びrs10116277がある(Helgadottir et al., Science 316;1491-1493(2007);McPherson et al., Science 316:1488-1491(2007))。
【0079】
SNPは機能的であることも非機能的であることもある。例えば、機能的SNPは細胞機能に影響を及ぼし、それにより表現型を産むが、それに対して非機能的SNPは、機能の点で沈黙しているが機能的SNPと連鎖不均衡にあることがある。SNPは同義的であることも非同義的であることもある。同義的であるSNPとは、異なった形態が同じポリペプチド配列を導くSNP、及び非機能的SNPである。SNPが異なるポリペプチドを導く場合、そのSNPは非同義的であり、機能的であることもそうでないこともある。2又はそれ以上のハプロタイプであるディプロタイプの中のハプロタイプを特定するのに用いられるSNP又はその他の遺伝子マーカーもまた、ディプロタイプに関連する表現型の相関付けに利用できる。個体のハプロタイプ、ディプロタイプ、及びSNPプロファイルについての情報は、その個体のゲノムプロファイル中にあり得る。
【0080】
好ましい態様では、或る表現型と相関している別の遺伝子マーカーと連鎖不均衡にある遺伝子マーカーに基づいて規則が作製されるためには、その遺伝子マーカーは、当分野において連鎖不均衡を決定するために一般的に利用されるスコアである、r2又はD’スコアが0.5より大であるかも知れない。好ましい態様では、このスコアは0.6、0.7、0.8、0.90、0.95又は0.99より大である。その結果、本開示において、個体のゲノムプロファイルに表現型を相関させるために用いられる遺伝子マーカーは、表現型と相関する機能的又は公表されたSNPと同じであってもよいし異なっていてもよい。例えば、BC 4を使用すると、被験SNP及び公表SNPは同一であり、被験リスク及び非リスクアレルもまた公表されたリスク及び非リスクアレルと同一である(図4A及びC)。しかしながらBC 5、CASP8及び乳癌に対するその相関については、被験SNPはその機能的又は公表SNPと相違しており、公表されたリスク及び非リスクアレルに対する被験リスク及び非リスクアレルもまた異なっている。被験及び公表アレルは、ゲノムのプラス鎖の向きにあり、これらの事から、ホモ接合性のリスク又は非リスク遺伝子型が推論され、それは、個体、例えば契約者のゲノムプロファイルに適用される規則を生み出すことがある。
【0081】
被験SNPは「DIRECT」又は「TAG」SNPであってよい(図4E〜G、図5)。直接的SNPは、公表された又は機能的SNP、例えばBC 4と同じ被験SNPである。直接的SNPはさらに、ヨーロッパ人及びアジア人におけるSNP rs1073640(マイナーなアレルはAであり、他のアレルはGである)を利用して、FGFR2と乳癌との相関にも利用できる(Easton et al., Nature 447:1087-1093(2007))。やはりヨーロッパ人及びアジア人におけるFGFR2と乳癌の相関に対するもう一つの公表された又は機能的SNPはrs1219648である(Hunter et al., Nat. Genet. 39:870-874(2007))。タグSNPは、BC 5のように、被験SNPが機能的又は公表SNPのそれと相違している場所である。タグSNPは、CAMTA1(rs4908449)、9p21(rs10757274、rs2383206、rs13333040、rs2383207、rs10116277)、COL1A1(rs1800012)、FVL(rs6025)、HLA−DQA1(rs4988889、rs2588331)、eNOS(rs1799983)、MTHFR(rs1801133)、及びAPC(rs28933380)のSNPのようなその他の遺伝子変異体にも利用できる。
【0082】
SNPのデータベースは、例えば国際HapMapプロジェクト(www.hapmap.org、The International HapMap Consortium, Nature 426:789-796(2003)、及びThe International HapMap Consortium, Nature 437:1299-1320(2005)を参照されたい)、the Human Gene Mutation Database(HGMD)公開データベース(www.hgmd.orgを参照されたい)、及びSingle Nucleotide Polymorphismデータベース(dbSNP)(www.ncbi.nlm.nih.gov/SNP/を参照されたい)から公的に入手できる。これらのデータベースは、SNPハプロタイプを提供し、又はSNPハプロタイプパターンの決定を可能にする。したがって、これらのSNPデータベースにより、広範囲の疾患及び状態、例えば癌、炎症性疾患、心血管疾患、神経変性疾患、及び感染性疾患の根底に存在する遺伝子リスクファクターを調査することができる。その疾患又は状態は、処置及び治療法が現在存在する、対応可能なものであるかも知れない。処置には、予防的処置、ならびにライフスタイルの変更を包含する、症状及び状態を改善する処置が包含され得る。
【0083】
身体的形質、生理的形質、精神的形質、情緒的形質、民族性、祖先、及び年齢といったその他多くの表現型もまた調べることができる。身体的形質には、身長、髪の色、眼の色、身体、又は持久力、耐久力、及び敏捷性のような形質がある。精神的形質には、知性、記憶力、又は学習能力がある。民族性及び祖先には、祖先もしくは民族の特定、又は個体の祖先の起源がどこであるかが包含される。年齢は、個体の実年齢の確定であることもあり、又は、個体の遺伝的特徴が一般集団に対して該個体を位置づける年齢の決定であることもある。例えば、個体の実年齢は38歳であるが、その遺伝的特徴は、記憶力や身体の健康が平均28歳のものであると決定づけることがある。もう一つの年齢形質は、個体の推定寿命であり得る。
【0084】
別の表現型は、非医学的状態、例えば「楽しみ」の表現型を包含し得る。これらの表現型は、周知の個体、例えば外国の要人、政治家、著名人、発明家、運動選手、音楽家、芸術家、実業家、及び有名でない個体、例えば囚人との比較を包含し得る。その他の「楽しみ」の表現型は、他の生物、例えば細菌、昆虫、植物、又はヒト以外の動物との比較を包含し得る。例えば、個体は、自身のゲノムプロファイルが自分達のペットの犬や元大統領のゲノムプロファイルと比較してどうなのかを知ることに興味を持つかも知れない。
【0085】
工程114では、保存されたゲノムプロファイルに規則を適用して、工程116の表現型プロファイルを作製する。例えば、図4、5又は6に記載の情報は、個体のゲノムプロファイルに適用するための規則又は試験の基礎を形成し得る。この規則は、被験SNP及びアレルに関する情報、及び図4の効果推定値を包含でき、ここで、効果推定値のUNITSとは、効果推定値の単位、例えばOR、又はオッズ比(95%信頼区間)もしくは平均値である。効果推定値は好ましい態様における遺伝子型リスク(図4C〜G)、例えばホモ接合体にとってのリスク(homoz又はRR)、ヘテロ接合体のリスク(heteroz又はRN)、及びホモ接合体の非リスク(homoz又はNN)であってよい。別の態様では、効果推定値は保因者のリスクであってよく、それはRR又はRN対NNである。さらに別の態様では、効果推定値は、アレル、R対Nといったアレルリスクに基づいていてよい。二遺伝子座(図4J)又は三遺伝子座(図4K)の遺伝子型効果推定値(例えば、二遺伝子座効果推定値のための9個の可能な遺伝子型組み合わせについてはRRRR、RRNN等)もあり得る。公表HapMap中の被験SNP頻度もまた図4H及びIに記載する。
【0086】
或る状態についての推定リスクは、米国特許出願公開第20080131887号及びPCT公報第WO2008/067551号に列挙されるSNPに基づくものであってよい。幾つかの態様では、或る状態についてのリスクは少なくとも1個のSNPに基づくものであってよい。例えば、アルツハイマー(AD)、結腸直腸癌(CRC)、変形性関節症(OA)又は落屑性緑内障(XFG)についての個体リスク評価は1SNPに基づくものであり得る(例えば、ADについてはrs4420638、CRCについてはrs6983267、OAについてはrs4911178、そしてXFGについてはrs2165241)。肥満(BMIOB)、バセドウ病(GD)、又はヘモクロマトーシス(HEM)のようなその他の状態については、個体の推定リスクは少なくとも1又は2個のSNPに基づくものであり得る(例えば、BMIOBについてはrs9939609及び/又はrs9291171;GDについてはDRB1*0301 DQA1*0501及び/又はrs3087243;HEMについてはrs1800562及び/又はrs129128)。心筋梗塞(MI)、多発性硬化症(MS)、又は乾癬(PS)といった(但しこれらに限定されない)状態については、1、2、又は3個のSNPを利用してこれらの状態についての個体リスクを評価できる(例えば、MIについてはrs1866389、rs1333049、及び/又はrs6922269;MSについてはrs6897932、rs12722489、及び/又はDRB1*1501;PSについてはrs6859018、rs11209026、及び/又はHLAC*0602)。レストレスレッグス症候群(RLS)又はセリアック病(CelD)の個体リスク評価には、1、2、3、又は4個のSNP(例えば、RLSについてはrs6904723、rs2300478、rs1026732、及び/又はrs9296249;CelDについてはrs6840978、rs11571315、rs2187668、及び/又はDQA1*0301 DQB1*0302)。前立腺癌(PC)又は狼瘡(SLE)については、1、2、3、4、又は5個のSNPを利用してPC又はSLEの個体リスクを評価できる(例えば、PCについてはrs4242384、rs6983267、rs16901979、rs17765344、及び/又はrs4430796;SLEについてはrs12531711、rs10954213、rs2004640、DRB1*0301、及び/又はDRB1*1501)。個体の黄斑変性症(AMD)又は関節リウマチ(RA)についての生涯リスクを評価するには、1、2、3、4、5、又は6個のSNPを利用できる(例えば、AMDについてはrs10737680、rs10490924、rs541862、rs2230199、rs1061170、及び/又はrs9332739;RAについてはrs6679677、rs11203367、rs6457617、DRB*0101、DRB1*0401、1*0404)。個体の乳癌(BC)についての生涯リスクを評価するには、1、2、3、4、5、6又は7個のSNPを利用できる(例えばrs3803662、rs2981582、rs4700485、rs3817198、rs17468277、rs6721996及び/又はrs3803662)。個体のクローン病(CD)又は2型糖尿病(T2D)についての生涯リスクを評価するには、1、2、3、4、5、6、7、8、9、10、又は11個のSNPを利用できる(例えば、CDについてはrs2066845、rs5743293、rs10883365、rs17234657、rs10210302、rs9858542、rs11805303、rs1000113、rs17221417、rs2542151、及び/又はrs10761659;T2Dについてはrs13266634、rs4506565、rs10012946、rs7756992、rs10811661、rs12288738、rs8050136、rs1111875、rs4402960、rs5215、及び/又は1801282)。幾つかの態様では、リスク決定の基礎として使用されるSNPは、上記のSNP、又は米国特許公報第20080131887号又はPCT公報第WO2008/067551号に記載のようなその他のSNPと連鎖不均衡にあるかも知れない。
【0087】
個体の表現型プロファイルは幾つかの表現型を含み得る。特に、本開示方法による、疾患、又は、代謝、有効性及び/又は安全性を包含する起こり得る薬物反応といったその他の状態についての患者のリスク評価は、症状のある、又は発症前の、又は症状のない個体の如何に拘わらず、1又はそれ以上の疾患/状態誘発アレルの保因者を包含する個体において、症状のある、又は発症前の、又は症状のない個体における、複数の無関係の疾患及び状態への感受性の予測的又は診断的解析を可能にする。したがって、これらの方法は、特定の疾患又は状態の検査についての先入観無しに、疾患又は状態に対する個体の感受性の一般評価を提供する。例えば、本開示の方法は、個体のゲノムプロファイルに基づいて、表1、図4、5、又は6に列挙した幾つかの状態のうち任意のものに対するその個体の感受性評価を可能にする。この評価は好ましくは、それらの状態のうち2又はそれ以上、より好ましくはこれらの状態のうち3、4、5、10、20、50、100又はそれ以上についての情報を提供する。好ましい態様では、表現型プロファイルは、個体のゲノムプロファイルに少なくとも20の規則を適用することで導かれる。別の態様では、個体のゲノムプロファイルに少なくとも50の規則が適用される。表現型についての1個の規則を、単一遺伝子表現型に適用できる。1以上の規則を1個の表現型、例えば多遺伝子表現型又は単一遺伝子表現型に適用することもでき、この場合、1個の遺伝子の中にある複数の遺伝子変異体が、その表現型を持つ確率に影響する。
【0088】
個々の患者のゲノムプロファイルの初期スクリーニングの後に、さらなるヌクレオチド変異体が判明した場合、そのさらなるヌクレオチド変異体、例えばSNPと比較することにより、個体の遺伝子型相関の更新を行う(又はそれが取得できる)。例えば、新たな遺伝子型相関について科学文献を精査する、遺伝学分野において通常の技術を有する1又はそれ以上の人々が、工程110を、定期的に、例えば毎日、毎週、又は毎月実施することができる。次いでこの新たな遺伝子型相関を、一人又はそれ以上の当該分野の専門家より成る委員会がさらに検証できる。すると工程112もまた、検証された新たな相関に基づく新たな規則によって定期的に更新され得る。
【0089】
新たな規則は、既存の規則を持たない遺伝子型又は表現型を包含できる。例えば、いかなる表現型とも相関していない遺伝子型が、新たな又は既存の表現型と相関していることが発見される。新たな規則はさらに、いかなる遺伝子型も過去に相関していなかった表現型との相関についてのものであるかも知れない。新たな規則はさらに、既存の規則を有する遺伝子型及び表現型について決定されるかも知れない。例えば、遺伝子型A及び表現型Aの間の相関に基づく規則が存在する。新たな研究により、遺伝子型Bが表現型Aと相関することが明らかとなり、この相関に基づいて新たな規則が作られる。別の例は、表現型Bが遺伝子型Aに関連していることが発見され、それに従い新たな規則が作製できる。
【0090】
既知の、但し公表された科学文献では当初特定されていなかった相関に基づく発見に関して規則が作られることもある。例えば、遺伝子型Cが表現型Cと相関していることが報告される。別の刊行物は、遺伝子型Dが表現型Dと相関していることを報告する。表現型C及びDは関連症状、例えば表現型Cが息切れであり、表現型Dが小さな肺活量である。遺伝子型C及びD、ならびに表現型C及びDを持つ個体の既存の保存ゲノムプロファイルを用いる統計手段によって、又はさらなる研究によって、遺伝子型C及び表現型D、又は遺伝子型Dと表現型Cの間の相関が発見され検証される。すると新たに発見され検証された相関に基づき、新たな規則が作製できる。別の態様では、特定の又は関連する表現型を持つ幾つかの個体の保存ゲノムプロファイルを調査し、それらの個体に共通の遺伝子型を決定し、相関を決定できる。この相関に基づき新たな規則を作製できる。
【0091】
既存の規則を改変するために規則が作製されることもある。例えば、遺伝子型及び表現型の間の相関は、個体の既知の特徴、例えば該個体の民族性、祖先、地理、性別、年齢、家族歴、又はその他任意の既知表現型によって部分的に決定できる。これら既知の個体の特徴に基づいて規則を作製し、既存の規則に組み込み、改変された規則を提供することができる。適用されるべき改変規則の選択は、個体の特定の因子に依存するであろう。例えば、或る個体が遺伝子型Eを有する場合、表現型Eを有する個体が35%であるという確率に基づいて規則を作製できる。しかしながら、或る個体が特定の民族性を有する場合、その確率は5%である。この結果に基づいて新たな規則を作製し、その特定の民族性を持つ個体に適用することができる。或いは、35%という決定を含む既存の規則を適用し、次に該表現型について、民族性に基づく別の規則を適用することもできる。既知の個体の特徴に基づく規則は科学文献から決定でき、又は保存されたゲノムプロファイルの研究に基づいて決定することもできる。新たな規則が作製された時に工程114においてゲノムプロファイルにその新たな規則を付け加え且つ適用してもよいし、それらを定期的に、例えば少なくとも1年に1回適用してもよい。
【0092】
科学技術の進歩がより洗練されたSNPゲノムプロファイルの解明を可能にしているため、個体の疾患リスクの情報もまた拡大され得る。上に指摘したように、初期SNPゲノムプロファイルは500000個のSNPをスキャンするマイクロアレイ技術を用いて容易に作製できる。ハプロタイプブロックの性質を考慮すると、この数によって、個体ゲノム中の全SNPの代表プロファイルの取得が可能である。とは言え、ヒトゲノムにはおよそ1000万個のSNPが存在すると推定されている(国際HapMapプロジェクト; www.hapmap.org)。1000000、1500000、2000000、3000000、もしくはそれ以上のSNPのマイクロアレイ、又は全ゲノム配列決定といったように、科学技術の進歩が実用的で費用効率の高いSNPの解析をより洗練された詳細度で可能にするため、より詳細なSNPゲノムプロファイルが作製できる。同様に、費用効率の高い、より洗練されたSNPゲノムプロファイル解析及びSNP−疾患相関のマスターデータベースへの更新が、コンピューター解析法の進歩によって可能となる。
【0093】
工程116での表現型プロファイル作製の後、工程118に示すように、契約者又はその健康管理者は、オンラインポータル又はウェブサイトを介して彼等のゲノム又は表現型プロファイルにアクセスできる。工程120及び122に示すように、表現型プロファイルを含む報告ならびに表現型及びゲノムプロファイルに関する他の情報もまた、契約者又はその健康管理者に提供される。この報告は、印刷され、契約者のコンピューターに保存され、又はオンラインで閲覧できる。
【0094】
オンライン報告の見本を図7に示す。契約者は、1個の表現型又は1以上の表現型を表示させることを選択できる。契約者にはまた、種々の閲覧選択肢、例えば図7に示すように「迅速閲覧」選択肢があるかも知れない。表現型が医学的状態であり、この迅速報告中の様々な処置及び症状が、その処置についてのさらなる情報を含む他のウェブページにリンクしているかも知れない。例えば、薬剤の箇所をクリックすることにより、用法、費用、副作用、及び有効性についての情報を含むウェブサイトに導かれる。その薬剤を他の処置と比較することもできる。そのウェブサイトはさらに、その薬剤の製造者のウェブサイトにつながるリンクを含むかも知れない。別のリンクは、契約者が薬理ゲノム学的プロファイルを作製してもらう選択肢を提供でき、そのプロファイルは、契約者のゲノムプロファイルに基づく該薬剤に対して起こり得る反応等の情報を包含するであろう。予防措置、例えばフィットネス及び減量等の、薬剤の代替手段へのリンクもまた提供され、そして、ダイエット用サプリメント、ダイエット計画、及び近隣のヘルスクラブ、診療所、健康サービス提供者、日帰り入浴施設等へのリンクもまた提供され得る。教育及び情報ビデオ、利用可能な処置の要約、可能な治療法、及び一般的提言もまた提供され得る。
【0095】
オンライン報告はさらに、契約者に自身の表現型プロファイルに関するさらなる情報を求める機会を提供する、対面による医師との又は遺伝カウンセリング予約をスケジュールに入れるためのリンク、又は遺伝カウンセラーもしくは医師にオンラインでアクセスするためのリンクを提供できる。オンライン遺伝カウンセリング及び医師への質問へのリンクは、オンライン報告で提供されることもある。
【0096】
報告は、他のフォーマットで、例えば1個の表現型について総合的観点から閲覧することもでき、この場合、各カテゴリーのさらなる詳細が提供される。例えば、契約者が該表現型を発現する尤度についてのより詳細な統計、又は、典型的な症状もしくは表現型、例えば医学的状態の見本症状、又は身長のような身体の非医学的状態の範囲についてのさらなる情報、又は、遺伝子及び遺伝子変異体についてのさらなる情報、例えば集団における発生率、例えば全世界、もしくは様々な国、もしくは様々な年齢範囲もしくは性別における発生率についてのさらなる情報があるかも知れない。別の態様では、この報告は「楽しみ」の表現型についてのもの、例えば個体のゲノムプロファイルと有名人、例えばアルバート・アインシュタインのゲノムプロファイルの類似性についてのものであるかも知れない。この報告は、該個体のゲノムプロファイルとアインシュタインのゲノムプロファイルの類似性パーセントを表示し、さらに、アインシュタインと該個体の予想IQを表示することもできる。さらなる情報には、一般集団のゲノムプロファイルと彼等のIQを該個体及びアインシュタインのゲノムプロファイル及びIQと比較する方法が含まれるかも知れない。
【0097】
もう一つの態様では、報告は、契約者のゲノムプロファイルと相関する全表現型を表示できる。別の態様では、その報告は、或る個体のゲノムプロファイルと正の相関がある表現型のみを表示できる。別のフォーマットでは、該個体は、或る表現型のサブグループ、例えば医学的表現型のみ、又は実行可能な医学的表現型のみを表示させることを選択できる。例えば、実行可能な表現型及びそれらに相関する遺伝子型には、クローン病(IL23R及びCARD15に相関)、1型糖尿病(HLA−DR/DQに相関)、狼瘡(HLA−DRB1に相関)、乾癬(HLA−C)、多発性硬化症(HLA−DQA1)、バセドウ病(HLA−DRB1)、関節リウマチ(HLA−DRB1)、2型糖尿病(TCF7L2)、乳癌(BRCA2)、結腸癌(APC)、エピソード記憶(KIBRA)、及び骨粗鬆症(COL1A1)がある。該個体は、報告に、表現型の下位カテゴリー、例えば医学的状態として炎症性疾患のみを、又は非医学的状態として身体的形質のみを表示させるよう選択することもできる。
【0098】
個体が提出する、及び個体に伝達される情報は安全且つ秘密とすることができ、そのような情報へのアクセスは該個体により管理され得る。複雑なゲノムプロファイルから導かれる情報は、監督官庁により承認された、理解可能な、医学関連の、そして/又は衝撃的データとして該個体に供給され得る。情報は、一般的に関心が持たれ、医学関連でないこともある。情報は、ポータルインターフェース及び/又は郵送といった(但しこれらに限定されない)幾つかの手段によって安全に該個体に伝達できる。より好ましくは、該個体が安全且つ秘密にアクセスできるポータルインターフェースにより、情報が該個体に安全に(もし該個体がそれを選択したならば)提供される。そのようなインターフェースは、好ましくはオンライン、インターネットウェブサイトアクセスにより提供され、別法として、電話、又はプライベートで安全且つ容易に利用できるアクセスが可能なその他の手段により提供される。ゲノムプロファイル、表現型プロファイル、及び報告は、ネットワーク上でのデータ送信により、個体又はその健康管理者に提供される。
【0099】
したがって、図8は、それにより表現型プロファイル及び報告が作製される論理装置の代表例を示すブロック図である。図8は、ゲノムプロファイルを受信して保存し、遺伝子型相関を解析し、その遺伝子型相関解析に基づく規則を作製し、その規則をゲノムプロファイルに適用し、そして表現型プロファイル及び報告を作製する、コンピューターシステム(又はデジタル装置)800を示す。コンピューターシステム800は、メディア811及び/又はネットワークポート805(これは場合により、固定メディア812を有するサーバー809に接続することができる)からの指示を読み取る事のできる論理装置であると理解できる。図8に示すシステムは、CPU801、ディスクドライブ803、場合による入力装置、例えばキーボード815及び/又はマウス816及び場合によるモニター807を含む。データ通信は、示された通信メディアを通じてローカル又はリモート位置にあるサーバー809へと行うことができる。通信メディアは、任意のデータ送信及び/又は受信手段が包含され得る。例えば、通信メディアは、ネットワーク接続、ワイヤレス接続又はインターネット接続とすることができる。このような接続は、ワールド・ワイド・ウェブによる通信を提供できる。本開示に関するデータは、このようなネットワーク又は接続上で、当事者822が受信及び/又は検討するために送信できるということが想定されている。受信者822は、個体、契約者、健康管理提供者又は健康管理者であってよいが、これらに限定される訳ではない。或る態様では、コンピューター読み取り可能メディアは、生体試料又は遺伝子型相関の解析結果の送信に好適なメディアを包含する。このメディアは、個体対象の表現型プロファイルに関する結果を内包でき、ここで、そのような結果は本明細書に記載の方法を用いて誘導される。
【0100】
好ましくは個人ポータルが、個体がゲノムデータを受信し評価するための一次インターフェースとしての役割を有する。ポータルは、試料の、採集から検査及び結果に至る進行を、個体が追跡できるようにする。ポータルへのアクセスにより、個体に、彼等のゲノムプロファイルに基づく共通の遺伝疾患に対する相対リスクが伝えられる。契約者は、ゲノムプロファイルにどの規則を適用するかをポータルを通じて選択できる。
【0101】
或る態様では、1又はそれ以上のウェブページに表現型の一覧表があり、各表現型の隣に、契約者が自身の表現型プロファイルに含めることを選択できる囲みがある。表現型は、該表現型に関する情報にリンクしており、この情報は、契約者が自身の表現型プロファイルに含めることを望む表現型についてのインフォームド・チョイスを行う助けとなる。このウェブページはさらに、疾患群、例えば対処可能又は不可能な疾患として、表現型を体系づけてあるかも知れない。例えば契約者は、HLA−DQA1及びセリアック病といった対処可能な表現型のみを選択できる。契約者はまた、その表現型のための発症前又は発症後の処置を表示させることを選択できる。例えば、該個体は、セリアック病のための発症前処置(スクリーニング増大の他に)である、グルテン除去食という発症前処置のある対処可能な表現型を選択できる。もう一つの例は、スタチン、運動、ビタミン、及び精神活動というアルツハイマーの発症前処置である。血栓症はもう一つの例であり、経口避妊薬の回避及び長時間じっと座ることの回避という発症前処置がある。承認されている発症後処置のある表現型の一例は、CFHと相関している滲出型AMDであり、この場合、個体は該状態のためのレーザー処置を受けることができる。
【0102】
表現型を疾患又は状態の型又は種類、例えば神経系、心血管系、内分泌系、免疫系などによって体系づけることもできる。表現型を医学的及び非医学的表現型としてグループ分けすることもできる。ウェブページ上にあるその他の表現型のグループ分けには、身体的形質、生理的形質、精神的形質、又は情緒的形質によるものがある。ウェブページはさらに、1つの囲みを選ぶことにより表現型の1グループが選択されるセクションを提供できる。例えば、全表現型、医学関連表現型のみ、非医学関連表現型のみ、対処可能な表現型のみ、対処不可能な表現型のみ、異なる疾患群、又は「楽しみ」の表現型を選択することである。「楽しみ」の表現型は、著名人又はその他の有名な個体、又は他の動物もしくは他の生物との比較さえ包含できる。比較のために入手できるゲノムプロファイルの一覧表もまた、契約者が選択して自身のゲノムプロファイルと比較するために、ウェブページ上に提供され得る。
【0103】
オンラインポータルは、契約者がそのポータルをナビゲートし、特定の表現型を検索し、又は、特定の用語又は契約者の表現型プロファイルもしくは報告により明らかとなった情報を検索するのを助けるための検索エンジンをも提供できる。パートナーサービス及び製品提供にアクセスするリンクもまたポータルにより提供され得る。共通の又は類似の表現型を有する個体のためのサポートグループ、掲示板、及びチャットルームへのさらなるリンクもまた提供され得る。オンラインポータルはまた、契約者の表現型プロファイル中にある表現型に関するさらなる情報を記載する他のサイトへのリンクをも提供できる。オンラインポータルはまた、契約者が自身の表現型プロファイル及び報告を、友人、家族、又は健康管理者と共有できるサービスも提供できる。契約者は、表現型プロファイル中に明らかとなっているどの表現型を友人、家族、又は健康管理者と共有したいかを選択できる。
【0104】
表現型プロファイル及び報告は、個体に個人向け遺伝子型相関を提供する。個体に提供された遺伝子型相関を使用して、個人の健康管理及びライフスタイル選択を決定できる。遺伝子変異体及び処置が実行可能な疾患の間に強い相関が見出された場合、その遺伝子変異体の検出は、該疾患の処置及び/又は該個体の監視を開始する決定を助けるかも知れない。統計学的に有意な相関があるが強い相関ではないと思われる場合には、個体はその情報をかかりつけの医師と共に検討し、適切で有益な行動方針を決定できる。特定の遺伝子型相関の観点から個体にとって有益であると思われる行動指針には、治療処置の管理、処置の潜在的必要性もしくは処置の効果の監視、又は、食生活、運動、及びその他の個人的習慣/活動の点でライフスタイルを変えることが包含される。例えば、セリアック病のような対処可能な表現型には、グルテン除去食という発症前処置がある。同様に、遺伝子型相関情報を薬理ゲノム学を通じて適用し、特定の薬剤又は薬剤レジメンによる処置に対して個体が示すと予想される反応、例えば、特定の薬物処置の予想される有効性又は安全性を予測することができる。
【0105】
契約者は、自身の健康管理者、例えば医師又は遺伝カウンセラーにゲノムプロファイル及び表現型プロファイルを提供することを選択できる。このゲノムプロファイル及び表現型プロファイルは、健康管理者が直接アクセスでき、又は契約者が健康管理者に渡すコピーを印刷し、又はオンラインポータルを通じて、例えばオンライン報告書上のリンクによって健康管理者に直接送られるようにさせることができる。
【0106】
この関連情報の送達は、患者が医師と協力して行動する力を与えるであろう。特に、患者とその医師の話し合いは、個体のポータル及び医学情報へのリンク、ならびに患者のゲノム情報を彼等の医療記録へと結びつける能力によって力づけられる。医学情報は、予防及び健康情報を包含できる。本開示により患者個人に提供される情報によって、患者は自身の健康管理のためのインフォームド・チョイスを下せるようになる。このようにして、患者は、自身の個人的ゲノムプロファイル(遺伝的に継承されたDNA)が可能性を高めている疾患を回避及び/又は遅延させることを助ける選択を行えるであろう。加えて、患者は自身の特別な医学的ニーズに個人的に合致する処置レジメンを使用できるであろう。個体はさらに、万一疾病を発症し、医師が治療戦略を作製する助けとするためにこの情報が必要になった場合、自身の遺伝子型データにアクセスする能力を有するであろう。
【0107】
遺伝子型相関情報を遺伝カウンセリングと連携させて利用し、生殖ならびに母親、父親、及び/又は子供に対する潜在的な遺伝学上の懸念を考えているカップルに助言することができる。遺伝カウンセラーは情報を提供し、特定の状態又は疾患について高いリスクを示す表現型プロファイルを有する契約者をサポートすることができる。彼等はその障害についての情報を解釈し、遺伝パターン及び再現リスクを解析し、利用可能な選択肢を契約者と共に検討できる。遺伝カウンセラーはさらに、契約者を地域社会又は国のサポートサービスに紹介する、支持的カウンセリングを提供することもできる。遺伝カウンセリングには特別な契約プランが包含される。幾つかの態様では、遺伝カウンセリングは依頼から24時間以内にスケジュールが決められ、夜間、土曜、日曜、及び/又は祝日といった時間も利用できる。
【0108】
個人のポータルはさらに、初期のスクリーニングを超えたさらなる情報の送達を容易にする。個体は、自身の個人的遺伝子プロファイルに関する新たな科学的発見、例えば、自身の現在の又は潜在的な状態に対する新たな処置又は予防戦略に関する情報について知らされるであろう。この新たな発見はまた、彼等の健康管理者に送達されることもある。好ましい態様では、契約者又は彼等の健康管理提供者は、新たな遺伝子型相関及び契約者の表現型プロファイル中の表現型についての新たな研究について、eメールで知らされる。別の態様では、「楽しみ」の表現型についてのeメールが契約者に送信され、例えば、彼等のゲノムプロファイルがアブラハム・リンカーンのゲノムプロファイルと77%一致すること、そしてさらなる情報がオンラインポータルを通じて取得できることが、eメールで通知され得る。
【0109】
本開示はさらに、新たな規則を作製し、規則を改変し、規則を合し、規則の組を新たな規則によって定期的に更新し、ゲノムプロファイルのデータベースを安全に維持し、表現型プロファイルを決定するためにその規則をゲノムプロファイルに適用し、そして報告を作製するための、コンピューターコードのシステムを提供する。契約者に、新たな又は修正された相関、新たな又は修正された規則、ならびに例えば新たな予防及び健康情報、開発中の新たな治療法、又は利用可能な新しい処置を含む新たな又は修正された報告を通知するためのコンピューターコード。
ビジネス方法
【0110】
本開示は、患者のゲノムプロファイルを、確立された、医学に関連するヌクレオチド変異体の、臨床誘導されたデータベースと比較することに基づいた、個体の遺伝子型相関を評価するビジネス方法を提供する。本開示はさらに、当初知られていなかった新たな相関を評価するために、保存された個体のゲノムプロファイルを使用して、個体に別の生体試料の提出を要求することなく、更新された個体の表現型プロファイルを作製するビジネス方法を提供する。このビジネス方法を説明するフローチャートを図9に示す。
【0111】
最初に個体が、多数の一般的な人間の疾患、状態、及び身体状態について遺伝子型相関の個人的ゲノムプロファイルを請求及び購入する時、このビジネス方法の収益源が一部工程101において生み出される。依頼及び購入は、オンラインウェブポータル、オンライン保健サービス、及び個体のかかりつけ医師又は個人に医療処置を施す類似の施設を包含する(但しこれらに限定される訳ではない)様々なソースを通じて行うことができる。これに代わる態様では、ゲノムプロファイルが無料で提供され、収益源は工程103のような後の工程で生み出される。
【0112】
契約者又は顧客は、表現型プロファイルの購入を依頼する。依頼及び購入に応答して、工程103において顧客に遺伝子試料単離に用いられる生体試料採集キットが提供される。請求がオンライン、電話、又はその他の、顧客が採集キットを容易に物理的に入手できない手段で行われた場合には、迅速配送、例えば当日又は翌日配送できる宅配便により採集キットが提供される。この採集キットには、試料容器と共に、ゲノムプロファイル作製のため研究所に試料を迅速配送するための梱包剤が含まれている。キットにはさらに、その試料を、試料処理施設又は研究所に送付するための説明書、ならびに、顧客のゲノムプロファイル及び表現型プロファイルにアクセスする(これはオンラインポータルを通じて実施できる)ための説明書が含まれているかも知れない。
【0113】
上に詳説したように、ゲノムDNAは、幾つかのタイプの生体試料のうち任意のものから取得できる。好ましくは、ゲノムDNAは、例えばDNA Genotekから入手できる市販の採集キットを用いて唾液から単離する。顧客は、好都合なことに、採集キット内にあった容器に唾液試料を入れ、次いで容器をシールするのであるから、唾液及びこのようなキットを使用することにより、非侵襲性試料採集が可能である。加えて、唾液試料は室温で保存及び輸送できる。
【0114】
採集又は標本容器に生体試料を入れた後、工程105において顧客はこの試料を処理のために研究所へと送る。典型的には、顧客は、採集キット中に提供された梱包剤を使用して、試料を迅速配送、例えば当日又は翌日宅配便により研究所へ送達/送付することができる。
【0115】
試料を処理しゲノムプロファイルを作製する研究所は、適切な行政機関のガイドライン及び要件を遵守することができる。例えば米国では、処理する研究所は、食品医薬品局(FDA)又はメディケア・メディケイド・サービス・センター(CMS)のような1又はそれ以上の連邦政府関係機関及び/又は1又はそれ以上の州の機関によって規制されているかも知れない。米国では、臨床研究所は、1988年の臨床検査室改善修正法(CLIA)の下で認可承認される。
【0116】
工程107では、研究所が、前記のように試料を処理して、DNA又はRNAの遺伝子試料を単離する。次いで工程109においてこの単離された遺伝子試料の解析及びゲノムプロファイルの作製を実施する。好ましくはゲノムSNPプロファイルを作製する。上に述べたように、SNPプロファイルの作製には幾つかの方法が利用できる。好ましくは、高密度アレイ、例えばAffymetrix又はIllumina製の市販プラットフォームをSNPの特定及びプロファイル作製に使用する。例えばSNPプロファイルは、上でより詳細に記載したように、Affymetrix GeneChipアッセイを用いて作製できる。科学技術が発達するにつれて、高密度SNPプロファイルを作製できる他の技術供給メーカーが出るかも知れない。別の態様では、契約者のゲノムプロファイルは、契約者のゲノム配列である。
【0117】
個体のゲノムプロファイル作製の後、遺伝子型データを好ましくは暗号化し、工程111において取り込み、そして工程113において安全なデータベース又はヴォールトに寄託し、そこで将来の照会のためにその情報を保存する。ゲノムプロファイル及び関連情報は秘密とすることができ、この機密情報及びゲノムプロファイルへのアクセスは、該個体及び/又は彼もしくは彼女のかかりつけ医師の指示に従って限定される。その他の人間、例えば該個体の家族及び遺伝カウンセラーもまた契約者によりアクセスを許可されることがある。
【0118】
データベース又はヴォールトは処理する研究所の施設内にあってよい。或いはそのデータベースは別の場所にあるかも知れない。この場合、処理する研究所が作製したゲノムプロファイルデータは、工程111においてそのデータベースを有する別の施設へ持ち込まれる。
【0119】
個体のゲノムプロファイルを作製した後、工程115において、その個体の遺伝子変異を、確立された、医学に関連する遺伝子変異体の、臨床誘導されたデータベースと比較する。或いは、その遺伝子型相関は、例えば眼の色のような身体的形質、又は著名人とのゲノムプロファイルの類似性のような「楽しみ」の表現型といったように、医学に関連していないが、それでも尚、遺伝子型相関のデータベースに組み入れられるかも知れない。
【0120】
医学に関連したSNPは、科学文献及び関連情報源によって立証されたものであるかも知れない。非SNP遺伝子変異体もまた表現型と相関していることが立証されるかも知れない。一般に或る疾患に対するSNP相関は、その疾患を持つことがわかっている人々の群のハプロタイプパターンを、その疾患を持たない人々の群と比較することによって立証される。多くの個体を解析することにより、集団における多型の頻度を決定でき、一方これらの遺伝子型頻度を、特定の表現型、例えば疾患又は状態と関連付けることができる。或いは、この表現型は非医学的状態であるかも知れない。
【0121】
関連するSNP及び非SNP遺伝子変異体を、利用可能な公表文献によって決定するのではなく、保存された個体のゲノムプロファイルの解析を通じて決定することもできる。保存されたゲノムプロファイルを持つ個体は、過去に決定されている表現型を開示するかも知れない。個体の遺伝子型及び開示された表現型の解析を、その表現型を持たない個体と比較して相関を決定し、その後これを他のゲノムプロファイルに適用できる。自身のゲノムプロファイルを決定してもらった個体は、過去に決定されている表現型についての質問票に記入することがある。質問票には、医学的及び非医学的状態、例えば過去に診断された疾患、医学的状態の家族歴、ライフスタイル、身体的形質、精神的形質、社会生活、環境等についての質問が含まれる。
【0122】
或る態様では、個体は、質問票に記入した場合には自身のゲノムプロファイルを無料で決定してもらえるかも知れない。幾つかの態様では、自身の表現型プロファイル及び報告に自由にアクセスできるために、個体は定期的に質問票に記入することになっている。別の態様では、質問票に記入する個体は、例えば前の契約レベルより多くアクセスできる、又は、割引料金で契約を購入もしくは更新できる、等の、契約のアップグレード権を与えられる。
【0123】
工程121において医学関連遺伝子変異体のデータベースに寄託された全情報は、工程119で保証されたならば、まず、適切な行政機関により検討及び監督されると共に、科学的精確性及び重要性について研究/臨床諮問委員会により認可される。例えば米国では、FDAが遺伝子変異体(典型的にはSNP、転写レベル、又は突然変異)相関データの検証に利用されるアルゴリズムの承認を通じた監督を行う。工程123において、科学文献及びその他の関連情報源をさらなる遺伝子変異体と疾患又は状態の相関について監視し、それらの精確性及び重要性の検証ならびに行政機関の検討及び認可の後、工程125においてこれらの追加的遺伝子型相関をマスターデータベースに追加する。
【0124】
個体の全ゲノムプロファイルと組み合わせた、認可され検証された医学関連遺伝子変異体のデータベースによって、有利なことに、数多くの疾患又は状態について遺伝的リスク評価の実施が可能になる。個体のゲノムプロファイルを編集した後、個体のヌクレオチド(遺伝子)変異体又はマーカーを、特定表現型、例えば疾患、状態、又は身体的形質に相関したヒトヌクレオチド変異体のデータベースと比較することにより、個体の遺伝子型相関が決定できる。個体のゲノムプロファイルを遺伝子型相関のマスターデータベースと比較することにより、その個体は、或る遺伝的リスクファクターについて陽性又は陰性いずれであると判明したのか、そしてそれはどの程度であるのかを知らされる。個体は、広範囲の科学的に検証された疾患状態(例えば、アルツハイマー病、心血管疾患、血液凝固)についての相対リスク及び/又は素因のデータを受け取ることになるであろう。例えば、表1に記載の遺伝子型相関が包含される。さらに、データベース中のSNP疾患相関には、図4に示す相関が包含されるが、これらに限定される訳ではない。図5及び6に記載のその他の相関もまた包含される。故に本ビジネス方法は、それらの疾患及び状態がもたらし得るいかなる先入観も伴わずに、多数の疾患及び状態に対するリスクの解析を提供する。
【0125】
別の態様では、個体の全ゲノムプロファイルと組み合わされる遺伝子型相関は、非医学関連表現型、例えば「楽しみ」の表現型、又は毛髪の色のような身体的形質である。好ましい態様では、規則又は規則の組を、上記のように個体のゲノムプロファイル又はSNPプロファイルに適用する。ゲノムプロファイルへの規則の適用は、その個体の表現型プロファイルを産む。
【0126】
このようにして、新たな相関が発見され検証されると、ヒト遺伝子型相関のマスターデータベースが、さらなる遺伝子型相関によって拡大される。更新は、所望により、又は必要に応じて、データベース中に保存されている該個体のゲノムプロファイル由来の関連情報にアクセスすることによって実施できる。例えば、知られるようになった新たな遺伝子型相関は、特定の遺伝子変異体に基づくかも知れない。次いで個体がその新たな遺伝子型相関の影響を受け易いかどうかの決定を、その個体の全ゲノムプロファイルのうち当該遺伝子部分のみを取り出して比較することによって実施できる。
【0127】
好ましくはゲノムクエリーの結果を解析し、解釈して、わかり易いフォーマットでその個体に提示する。次いで工程117において、初期スクリーニングの結果を、上に詳説したように郵送又はオンラインポータルインターフェースを通じて安全な秘密の形態で患者に提供する。
【0128】
報告は、表現型プロファイル及びその表現型プロファイル中の表現型についてのゲノム情報、例えば、含まれる遺伝子についての基本的遺伝学又は異なる集団における遺伝子変異体の統計学を含み得る。報告に含まれ得る該表現型プロファイルに基づくその他の情報には、予防戦略、健康情報、治療法、症状の認識、早期検出計画、介入計画、及び該表現型の精確な特定及び下位分類がある。個体のゲノムプロファイルの初期スクリーニングに続いて、制御され管理された更新が実施され又は実施できる。
【0129】
新たな遺伝子型相関が出現し検証及び承認されると、マスターデータベースへの更新と共に個体のゲノムプロファイルの更新が行われ、それが利用可能となる。新たな遺伝子型相関に基づく新たな規則が初期のゲノムプロファイルに適用され、更新された表現型プロファイルが提供され得る。更新された遺伝子型相関プロファイルは、工程127において、該個体のゲノムプロファイルの関連部分を新たな遺伝子型相関と比較することによって作製できる。例えば、特定の遺伝子における変異に基づく新たな遺伝子型相関が発見されたならば、該個体のゲノムプロファイルのその遺伝子部分を新たな遺伝子型相関について解析することができる。そのような場合、既に適用されてしまった規則を含む規則の組全体ではなく1又はそれ以上の新たな規則を適用して更新された表現型プロファイルを作製できる。個体の更新された遺伝子型相関の結果は、工程129において安全な方法で提供される。
【0130】
初期及び更新表現型プロファイルは、契約者又は顧客に提供されるサービスである。ゲノムプロファイル解析に対する種々のレベルの契約及びそれらの組み合わせが提供され得る。同様に、契約レベルは、個体が自身の遺伝子型相関と共に受け取りを希望するサービス量の選択肢を個体に提供するために変わり得る。したがって、提供されるサービスレベルは個体が購入するサービスの契約レベルと共に変化するであろう。
【0131】
契約者にとって入門レベルの契約には、ゲノムプロファイル及び初期表現型プロファイルが含まれ得る。これは基本契約レベルである。この基本契約レベルの中に様々なサービスレベルがある。例えば、或る契約レベルは、遺伝カウンセリングの照会先、特定の疾患の予防又は処置に関する特別な見解を持つ医師、及びその他のサービス選択肢を提供できる。遺伝カウンセリングはオンライン又は電話で受けることができる。別の態様では、契約料金は個体が自身の表現型プロファイルとして選択する表現型の数によって変わり得る。別の選択肢は、契約者がオンライン遺伝カウンセリングへのアクセスを選択するかどうかである。
【0132】
別のシナリオでは、或る契約が、データベースにおける個体のゲノムプロファイルの維持と共に初期の全ゲノム遺伝子型相関を提供できる。このようなデータベースは、該個体がそれを選択した場合、安全なものであり得る。該個体が依頼及び追加の支払いを行うと、この初期解析に続き、後続の解析及びさらなる結果が作製される。これはプレミアムレベルの契約であるかも知れない。
【0133】
本ビジネス方法の或る態様では、個体のリスクの更新が行われ、対応する情報が契約ベースで個体に利用できるようにされる。更新は、プレミアムレベルの契約を購入する契約者が利用できる。遺伝子型相関解析の契約は、個体の好みに応じて、新たな遺伝子型相関の特定カテゴリー又は小集団による更新を提供できる。例えば、或る個体は、処置又は予防方針が知られている遺伝子型相関を知ることさえできたらよいかも知れない。追加の解析を実行させるかどうかについての個体の決定を助けるために、利用可能となった追加の遺伝子型相関に関する情報が提供される。そのような情報は都合の良いことに、契約者に郵送又はeメールで送られる。
【0134】
プレミアム契約の中には、基本契約において述べたようなさらなるレベルのサービスがあるかも知れない。プレミアムレベル内で他の契約モデルが提供されるかも知れない。例えば、最高レベルは契約者に無制限の更新及び報告を提供できる。新たな相関及び規則が決定されると、その契約者のプロファイルは更新される。このレベルでは、契約者は、無制限の数の個体、例えば家族及び健康管理者がアクセスすることを許可できる。この契約者はまた、オンライン遺伝カウンセラー及び医師に無制限にアクセスできる。
【0135】
プレミアムレベル内の次のレベルの契約は、より限定された局面、例えば限定数の更新を提供できる。契約者は、契約期間内に自身のゲノムプロファイルを限定された回数だけ、例えば年に4回更新させることができる。別の契約レベルでは、契約者は、自身の保存されたゲノムプロファイルを週に1回、月に1回、又は年に1回更新させることができる。別の態様では、契約者は、それらに対するゲノムプロファイルを更新するために、限定数の表現型のみを選択できる。
【0136】
個人ポータルもまた、個体にとっての、リスクもしくは相関の更新及び情報の更新についての契約の維持、又は、更新されたリスク評価及び情報の請求を、簡単に可能にスルであろう。上記のように、個体が様々なレベルの遺伝子型相関結果及び更新の選択ができるよう、種々の契約レベルが提供され、そして、契約者の個人ポータルを介して、様々な契約レベルが契約者によって選択され得る。
【0137】
これら契約選択肢のうちいかなるものも本ビジネス方法の収益源に寄与する。本ビジネス方法の収益源は新たな顧客及び契約者の追加によっても追加され、その場合、新たなゲノムプロファイルがデータベースに加えられる。
【0138】
【表1−1】
【0139】
【表1−2】
【0140】
【表1−3】
【0141】
【表1−4】
【0142】
【表1−5】
【0143】
【表1−6】
【0144】
【表1−7】
【0145】
【表1−8】
【0146】
【表1−9】
【0147】
【表1−10】
【0148】
【表1−11】
【0149】
【表1−12】
【0150】
【表1−13】
【0151】
【表1−14】
【0152】
【表1−15】
【0153】
【表1−16】
【0154】
【表1−17】
【0155】
【表1−18】
【0156】
【表1−19】
【0157】
【表1−20】
【0158】
【表1−21】
【0159】
祖先データの組み入れ
本開示はさらに、祖先データを組み入れることによりゲノムプロファイルを使用して表現型を相関させる、本明細書に記載のような方法及びシステムを提供する。したがって、個体の遺伝子型相関の評価はGCIスコアとして表現又は報告され、このGCIスコアの作製に際し、祖先データを組み入れることができる。例えば、GCIスコアの決定に用いられるORは、個体の祖先又は民族性に基づいて改変され得る。
【0160】
個体が或る状態を発現するリスクは、典型的にはその個体の遺伝的特徴及び環境に基づいている。遺伝的特徴に基づいてリスクを推定しようとする場合、現在の研究は、全ての遺伝子マーカー又は変異(例えばSNP)のうち、小集団が測定できるに過ぎないという事実により、限定され得る。特に、複雑な疾患については、数多くの遺伝的及び環境的因子の複雑な相互作用が或る状態の発現を導き、故にそのリスクに僅かな貢献をする数多くの遺伝子変異、例えばSNPがあり得る。現在の全ゲノム関連(WGA)研究は、通常、ゲノムの各領域を分離して考え、他の全ての遺伝的因子及び環境因子を未知のままにして、その領域内の特定SNP中の突然変異が該状態へのリスクに及ぼす効果が何であるかについての質問に答えようとするものである。数学的にはこれらの研究は、リスクの確率の周辺分布を、本質的にはSNPの関数として推定する(これらの分布を本明細書ではSNPの効果と称する)。
【0161】
その状態を発現するリスクは、1個の遺伝子変異又はSNPではなく、多数のSNP又はその他の遺伝子変異及び環境因子による影響を受けるかも知れない。故に、2つの集団で、ゲノム間のアレル分布及びそれらに影響を及ぼす環境因子が異なるならば、各々の集団において特定の遺伝子変異、例えばSNPの影響に潜在的相違があるかも知れない。この事は、このSNP及び他のSNP、他の遺伝子変異、又は環境因子の間に遺伝子−遺伝子又は遺伝子−環境相互作用がある場合、特に当てはまる。しかしながら、たとえ相互作用がない場合でも、他の遺伝的及び環境的因子の、異なる「背景分布」が、遺伝子変異、例えばSNPの効果に影響を及ぼし得る。したがって、理論に拘束される訳ではないが、異なる集団は、同じ遺伝子変異体、例えばSNPに関して異なった効果サイズを有し得る。ところが実際には、1以上の集団でその効果サイズが測定されたSNPがある、殆ど全ての既知の状態において、その測定された効果サイズは互いに極めて近いか、又は互いに少なくとも95%CI以内であった。その結果、幾つかの態様では、本発明で使用できる単純化仮定では、遺伝子変異、例えば原因SNPの効果サイズは、全集団にわたって事実上同一である。
【0162】
都合の悪いことに、効果サイズが集団を通じて同じであるという仮定をもってしても、原因遺伝子変異が未知、例えば原因SNPが遺伝子型決定できない又はされていないという事実が制限となる。幸運なことに、ゲノム上で極めて近位にあるSNP又はその他の遺伝子変異は、例えばLDの場合のように相関していることがあり、故に、たとえ原因SNPが測定されていなくても、原因の代用品としてタグSNPが利用できる(例えば図10を参照されたい)。しかしながら、異なる集団は、様々な考えられる理由、例えば組換え率の変異、選択圧、又はボトルネック効果のため、異なる連鎖不均衡パターンを有し得る。したがって幾つかの態様では、或る研究が集団Aについて実施され、その集団において特定のオッズ比が得られた場合、集団Bでそのオッズ比を想定することはできない。これは以下の例によって説明できる(図10を参照されたい)。例えば、白色人種(CEU)集団について研究を行い、SNPの1つについて大きな効果サイズが報告されている(「公表SNP」)。この例では、公表SNPは、原因SNPと共有されているLDブロックに属しており、よって原因SNP及び公表SNPの間のr∧2(相関係数の二乗)は1である。言い換えると、公表SNP及び原因SNPはCEU集団において完全に相関している。しかしながら、別の集団(この場合YRI、ヨルバ族)では、公表SNP及び原因SNPが異なるLDブロックにあるということもあるかも知れない。極端な場合、それらはr∧2=0をとることがあり、その場合、それらはその集団において互いに独立している。このような場合には、YRI集団について同じ研究が行われたとしても、公表SNPについての効果は見出されないであろう。したがって、顧客の基礎となっている集団及び最初に調査された集団のLDパターンを無視することにより、YRI個体のリスクを推定するのは誤りであろう。図10に記載の例は極端な事例であるが、実際には同様のパターンが、それほど極端ではない結果を伴って起こり得る。
【0163】
したがって、幾つかの態様では、本開示は、異なる祖先を持つ集団間の遺伝子座を比較することを含んでなる、個体の遺伝子型相関を評価する方法を提供する。例えば、第一の集団について求められたオッズ比は、第二の集団に適用されることもあればそれとは異なることもあるが、それはLDパターンのような因子次第である。例えば、AS(アジア人)については、使用されるオッズ比は、AS、YRI(ヨルバ族)、CEU(白色人種/ヨーロッパ人)祖先/民族の調査によるものであってよく(この順序)、何故ならYRIはCEUよりもLDが低いためである。幾つかの態様では、遺伝子座特異的祖先を混合集団に利用できる。
【0164】
幾つかの態様では、第一及び第二の集団は、アフリカ系アメリカ人、白色人種、アシュケナジー系ユダヤ人、スファラディー系ユダヤ人、インド人、太平洋諸島系、中東人、ドゥルーズ派、ベドウィン、南欧人、スカンジナビア人、東欧人、北アフリカ人、バスク人、西アフリカ人、東アフリカ人等のその他任意の集団を含んでなるが、これらに限定される訳ではない。特に指摘のない限り、第一及び第二の集団は、HapMap集団(YRI、CEU、CHB、JPT、ASW、CHD、GIH、LWK、MEX、MKK、TSI)のいずれかを含んでなる(但しこれらに限定される訳ではない)。HapMap集団の説明はhttp://hapmap.org/hapmappopulations.html.en及び同封書類に見出すことができる。
【0165】
【表1B】
【0166】
幾つかの態様では、表現型に対する個体の遺伝子型相関を評価する方法は、或る表現型と相関している遺伝子変異、例えばSNPを含んでなる第一の連鎖不均衡(LD)パターン(ここで、この第一LDパターンは第一の個体集団のものである);及び、その遺伝子変異(例えば該SNP)を含んでなる第二のLDパターン(ここで、この第二LDパターンは第二の個体集団のものである)を比較し;その比較から、第二集団にある表現型と相関している遺伝子変異の確率を決定し;そして、その確率を利用することを含んでなる、該個体のゲノムプロファイルからの、表現型の遺伝子型相関の評価を行い;そして、該個体又はその健康管理者に、該遺伝子型相関を含んでなる結果を報告することを含んでなる。
【0167】
例えば、第一集団Aについて、公表されたSNPであるPが、オッズ比OR[P,A]と共に報告されており、原因SNPであるCが未知であるとする。さらにこの例において、第二集団Bについて、標本サイズが充分大であるならば、A及びB中のCのオッズ比は同一、即ち、OR[C,A]=OR[C,B]であると仮定する。したがって、Cの位置がわかっている場合、OR[C,A]、BにおけるLDパターンを利用して最良のタグSNPを推定し、該集団内のCを捕捉することができる。しかしながら幾つかの態様では、Cの位置はCのオッズ比と同様未知である。ところが、あらゆるSNP S及び値Xについて、確率:Prob[S=C,OR[C,A]=X]│r∧2(P,S)inA,P,OR[P,A]]、即ち、集団AにおけるS及びP間の相関係数が与えられ、且つPがオッズ比OR[P,A]を持つ公表SNPであるとした時の、Sが、オッズ比Xを持つ原因SNPである確率(無限大の標本サイズであると仮定)が算出できる。この確率を算出するため、実際の調査ではSのオッズ比はCのオッズ比より低い値であるという事実を利用し、充分大きな標本サイズの場合にOR[S,A]がXに近づくとすると、この事が起こる確率は幾らであるかという質問に答えられる。原因SNPの分布及びそれらの効果サイズが与えられると、原因となる種々のSNPから求められた効果サイズの期待値(加重平均)を計算することにより、タグSNPの期待される効果サイズが決定できる。
【0168】
図10に示した例において、このLDブロックは完全なLDを有しているため、CEUブロック中の全SNPは因果性について同じ確率を有し、その効果サイズの分布は等しい(即ち、対数オッズ比は正規分布をしており、この場合、信頼区間がその標準偏差を決定する)。しかしながら、YRI中の公表SNPがその因果性に標識を付けることを目指している場合、このSNPの予想オッズ比は、公表オッズ比及び1の間の加重平均となり、その場合、この加重は、含まれるLDブロックの長さに相当する。
【0169】
したがって幾つかの態様では、ORの修正は、第一個体集団、又はリファレンス集団、例えば上の例に記載したCEUにおける複数の遺伝子変異の各々について、原因遺伝子変異の確率、例えばORを決定することを包含する方法(ただしこれに限定されない)によって決定できる。次にこのORを、別の個体集団又はリファレンス群、例えばYRIの個体のゲノムプロファイルからの遺伝子型相関の評価に利用し、該個体又はその健康管理者に、工程(c)由来の前記遺伝子型相関を含む結果を報告する。したがって、原因遺伝子変異体(例えば原因SNP)である確率の計算に利用される各遺伝子変異は、典型的には第一集団中の表現型に相関している既知の遺伝子変異、例えば公表されている遺伝子変異、例えば公表SNP、の近位にある。幾つかの態様では、原因遺伝子変異体(例えば原因SNP)である確率の計算に用いられる遺伝子変異の各々は、既知又は公表された遺伝子変異に対して連鎖不均衡にある。
【0170】
例えば、再度第一集団Aについて、公表SNPであるPが、オッズ比OR[P,A]と共に報告されており、原因SNPであるCが未知であるとする。そして、第二集団Bについて、標本サイズが充分大であるならば、A及びB中のCのオッズ比が同一、即ち、OR[C,A]=OR[C,B]であると仮定する。この例におけるもう一つの仮定で、検討された集団及び或る個体集団についてLDパターンがわかっているとする。例えば、CEU集団(第一集団)について調査がなされ、該個体はYRI集団(第二集団)に属していると仮定する。但しこの例は他集団に拡大できる。あらゆる位置において、リスクアレルR及び非リスクアレルNがあるとする。与えられたSNPにおいて考えられる3つの遺伝子型は、RR、RN、及びNNである。与えられたSNP S、遺伝子型G(これはRR、RN、又はNNのいずれかである)、及び個体集団Iについて、SNP Sに遺伝子型Gを持つIの中の個体数をF(S,I,G)と表示する。したがって、公表SNP PにおいてCEU集団で測定されるオッズ比は、
【数1】
[式中、CA及びCTは被験及び対照集団を表す]
で与えられる。同様に、集団Iにおける遺伝子型Gの頻度をf(S,I,G)と表す。SNPの対S1及びS2について、或る個体がG2をS2に持つ(CEUにおいて)とすると、該個体が遺伝子型G1をSNP S1に有する確率はPCEU(S1,G1│S2,G2)と表される。同様の表記法を第二集団YRIにも使用する。
【0171】
幾つかの態様では、アルゴリズムを使用して、第二集団のORを決定し、そのようにして或る表現型に対する個体の遺伝子型相関を、例えばGCIスコアの使用を通じて評価する。例えば、本明細書に開示するアルゴリズムの入力及び出力は、以下の情報を提供させることができる:
【0172】
1)SNPのリスト(例えばHapMapに開示されているもの)、及び、公表SNPである、もう一つの特別なSNP P。
【0173】
2)この調査で測定される上記SNP由来のSNPのリスト。
【0174】
3)公表SNP Pについて、以下のもののうち1つが既知であると想定される:
(a)被験対象及び対照についての調査に由来する遺伝子型カウント、即ち、F(P,CA,G)及びF(P,CT,G)の値はあらゆる遺伝子型Gについて既知である。
(b)或いは、遺伝子型オッズ比は、SNP P、それらの信頼区間、ならびに被験対象及び対照の総数について既知であると想定される。
【0175】
4)SNP S1、S2のあらゆる対、及び遺伝子型G1、G2のあらゆる対に関して、該アルゴリズムにPCEU(S1,G1│S2,G2)及びPYRI(S1,G1│S2,G2)が提供される。この情報は、HapMap又はその他のリファレンスデータセットから見出すことができる。
【0176】
次にこのアルゴリズムは、この調査の個体数が非常に多い(無限大に近づく)という仮定の下に、Pの近傍にある全てのSNP Sについて該SNPの予想オッズ比を出力できる。このアルゴリズムは、CEU(即ち第一集団)及びYRI(即ち第二集団)についての原因Cのオッズ比は、標本サイズが無限大に近づく時、同じ数に近づくという仮定を立てる。
【0177】
したがって、本明細書に開示のアルゴリズムは以下の主たる工程を包含できる(実施例5をも参照されたい):
【0178】
1)リファレンスデータセットに基づいてLD確率を求める。
【0179】
2)入力データとして与えられていない場合には、カウントF(P,CA,G)、F(P,CT,G)を求める(代替的1−b)。
【0180】
3)CEU中のPにおける被験対象及び対照の遺伝子型頻度について、n(nは非常に大きく、例えば>>1000000)例を抽出する。この抽出は、該カウントを前提として、f(P,CA,G)、f(P,CT,G)の事後分布に基づいている。
【0181】
4)各々の頻度例について、そして各々のSNP Sについて、
(a)Pにおける頻度及びPCEUに基づきf(S,CA,G)及びf(S,CT,G)を算出する。
(b)Sにおいて抽出されたアレル頻度に基づき、F(S,CA,G)、F(S,CT,G)の例を作製する。
(c)F(S)に基づき、そしてf(S)に基づき、Sについてのp値を算出する(後者は漸近的意義におけるp値である)。
(d)測定された全てのSNP SにわたってF(S)に基づく最小p値を求める。これがPでない場合、この例を棄却する。
(e)例が棄却されない場合、その例をf(S)に基づく最小p値と共に維持し、これがその例の原因SNPということになる。
【0182】
5)前相から、原因SNP C1・・・・Cnの組及びそれらに対応するオッズ比が導かれる。このような各原因SNPに対して、YRI集団について同じオッズ比が維持されると想定される。
(a)この情報を、CiにおけるYRI中での該遺伝子型頻度と共に使用して、あらゆる遺伝子型Gについて頻度fYRI(Ci,CA,G)を推定する。
(b)LD情報を使用して、あらゆるSNP SについてのfYRI(S,CA,G)、fYRI(S,CT,G)を推定し、これらの頻度に基づき漸近的オッズ比を算出する。
(c)各々のSNP Sについて、全例の漸近的オッズ比を平均し、期待される漸近的オッズ比を導く。
【0183】
幾つかの態様では、祖先データを利用して個体を下位群について評価できる。例えば本開示は、個体の遺伝子試料を入手し;該個体のゲノムプロファイルを作製し;該個体のゲノムプロファイルを、ヒトの、民族性、地理的起源、又は祖先との遺伝子型相関の現在のデータベースと比較することにより、該個体の1又はそれ以上のリファレンス下位群を決定し;そして、工程c)の結果を該個体又はその健康管理者に報告することを含んでなる、個体のリファレンス下位群を評価する方法を提供する。
【0184】
或る局面では、リファレンスデータセットは個体由来の遺伝子型決定データを複数セット含んでなり、この場合、本開示においては実質上全ゲノムが使用される。或る態様では、このリファレンスデータは、複数の個体の実質上ゲノム全体から得られた遺伝子型決定データを含む。その場合、或る態様では、実質上ゲノム全体とは、個体ゲノムの少なくとも80%(少なくとも81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%のゲノム範囲を包含するが、これらに限定されない)をカバーする遺伝子マーカーが検出されることを意味する。別の態様では、リファレンスデータに含まれる該個体由来の遺伝子型決定データセットの少なくとも75%が、各個体ゲノムの少なくとも80%をカバーする遺伝子マーカーからの情報を包含する。さらなる態様では、リファレンスデータに含まれる該個体由来の遺伝子型決定データセットの75%より多く(76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%より多く又は100%を包含するが、これらに限定されない)が、各個体ゲノムの少なくとも80%をカバーする遺伝子マーカーからの情報を包含する。
【0185】
或る態様では、リファレンスデータセットは、ヌクレオチド反復、ヌクレオチド挿入、ヌクレオチド除去、染色体転座、染色体複製、コピー数変異、マイクロサテライト反復、ヌクレオチド反復、動原体反復、もしくはテロメア反復、又はSNPを包含する(但しこれらに限定されない)複数の遺伝子マーカーに関する情報を包含する。別の態様では、リファレンスデータセットは、単一の遺伝子マーカー、例えばSNP又はマイクロサテライトに実質上限定される情報を包含する。その場合、リファレンスセットに含まれる遺伝子マーカーの少なくとも80%(遺伝子マーカーの少なくとも81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%を包含するが、これらに限定されない)が同じ型である。
【0186】
別の態様では、リファレンスデータセットは本質的に全ゲノムSNP遺伝子型決定データで構成される。幾つかの態様では、このSNPデータは、SNP特定及びプロファイル作製のための高密度DNAアレイを用いる個体のゲノム解析から誘導される。そのようなアレイには、Affymetrix及びIllumina(Affymetrix GeneChip(登録商標) 500K Assay Manual(Affymetrix, Santa Clara, CA)(引用により本明細書の一部とする);Sentrix(登録商標) humanHap650Y遺伝子型決定ビーズチップ(Illumina, San Diego, CA)を参照されたい)から市販されているものがあるが、これらに限定される訳ではない。幾つかの態様では、リファレンスセットは、本質上、Affymetrix Genome Wide Human SNP Array 6.0を利用して900000以上のSNPを遺伝子型決定することにより作製されたSNPデータで構成される。これに代わる態様では、Affymetrix GeneChip Human Mapping 500K Array Setを使用することにより、全ゲノム抽出解析を通じて500000以上のSNPを決定できる。
【0187】
別の態様では、リファレンスデータセットは、その遺伝子型データが含まれる各個体の民族性、地理的起源及び/又は祖先についての情報で構成される。或る態様では、前記情報はリファレンスデータセット、例えばHapMap又はGenographic Project(https://www3.nationalgeographic.com/genographic/) に存在する。別の態様では、前記情報は、例えば契約者又は非契約者によって自己申告される。別の態様では、契約者は、自身の民族性、地理的起源及び/又は祖先についての自己申告情報に対する報奨を受け取ることができる。別の態様では、契約者は自身の疾患状態についての自己申告情報(例えば、症状が現れている、又は遺伝的素因のある任意の疾患又は状態についての情報)に対する報奨を受け取ることができる。別の態様では、該個体は、この情報及び自身の遺伝子型を少なくとも1つのリファレンスデータセットに使用することの許可に対する報奨を受け取ることができる。幾つかの態様では、この報奨は、報奨金、サービス提供に対する割引、無料サービスの提供、サービスアップグレードの提供(例えば契約者のステータスの、基本会員カテゴリーからプレミアム会員カテゴリーへの向上)、血縁者への無料もしくは割引サービスの提供、又は第三者業者(例えばAmazon、Starbucks、WebMD)を利用する、割引、無料もしくは信用サービスの提供であってよい。関連する態様では、自身の民族性、地理的起源及び/又は祖先、又は疾患状態に関する情報を開示する契約者又は非契約者は、このような開示情報の使用可能性について助言を受けることができ、そして、インフォームド・コンセントを提供又は保留する機会が与えられる。
【0188】
或る態様では、リファレンスデータセットには、異なる民族性、地理的起源及び/又は祖先を持つ複数の個体からの情報が含まれる。別の態様では、リファレンスデータセットには、このリファレンスデータセットに表示されている民族性、地理的起源及び/又は祖先を有する各クラス由来の1以上の個体が含まれる。別の態様では、リファレンスデータセットには、このリファレンスデータセットに表示されている民族性、地理的起源及び/又は祖先を有する各クラス由来の5以上の個体が含まれる。別の態様では、リファレンスデータセットには、このリファレンスデータセットに表示されている民族性、地理的起源及び/又は祖先を有する各クラス由来の10以上の個体が含まれる。別の態様では、リファレンスデータセットには、このリファレンスデータセットに表示されている民族性、地理的起源及び/又は祖先を有する各クラス由来の20以上の個体が含まれる。
【0189】
別の態様では、リファレンスセット中に集められたデータを解析して、民族性、地理的起源及び/又は祖先を少なくとも1つの疾患又は状態及び遺伝子マーカー関連性と相関させる。別の態様では、自己申告された民族性、地理的起源及び/又は祖先を使用して、リスク解析のため、特定の疾患又は状態について注意を促すことができる。別の態様では、個体の民族性、地理的起源及び/又は祖先を、同様又は共通の民族性、地理的起源及び/又は祖先を持つ個体の下位群の中での遺伝子マーカーと疾患又は状態の関連性を、さらに解析(例えばコンピューターによる集団遺伝学研究)するために、彼等の遺伝子型と相関させる。例えば、共通の民族性、地理的起源及び/又は祖先を持つ或る個体群、例えばアシュケナジー系ユダヤ人は、テイ・サックス病のような疾患の子供を持つ尤度が極めて高い。アシュケナジー系ユダヤ人であると自己認識している個体の解析は、その個体の遺伝子マーカーを解析する際、この情報を考慮に入れて修正することができる。
【0190】
別の態様では、リファレンスデータセット中のデータをリファレンスデータ下位群に層化することができる。全体として考えると、1つの集団が複数の下位群を含み、それらが異なるアレル頻度を持っていることがある。1つの集団中の、異なるアレル頻度を有する複数の下位群の存在は、関連性研究の情報提供をより少なくすることがある。抽出された下位群に内在する異なるアレル頻度は、各群の中の疾患又は状態とは独立しているかもしれず、それらは連鎖不均衡又は疾患関連性について誤った結論を導きかねない。個体の遺伝子型を、リファレンスデータセット全体ではなくリファレンスデータ下位群と比較することは、誤ったアレル関連性により作られる過誤の尤度を低減させ得る。各々のリファレンスデータ下位群中のデータは、少なくとも1つの共通する特徴、例えば共通する民族性、地理的起源及び/又は祖先によって体系化できる。データが各下位群内に含まれている個体の遺伝子型をさらに解析して、特定の民族性、地理的起源及び/又は祖先を示唆する共通の遺伝子マーカーを特定する。これに代わる態様では、リファレンスセットに集められたデータを、少なくとも1つの疾患又は状態に関連する、そしてさらに少なくとも1つの民族性、地理的起源及び/又は祖先に関連する遺伝子マーカーに対して使用できる。
【0191】
或る態様では、個体が自己申告した少なくとも1つの民族的、地理的起源及び/又は祖先の形質を利用して、該個体の遺伝子型の解析を修正する。修正された解析は、少なくとも1つの自己認識された民族的、地理的起源及び/又は祖先の下位群にも共通している、疾患又は状態に関連する遺伝子マーカーに的を絞ることができる。これに代わる態様では、個体の民族性、地理的起源及び/又は祖先に関連する情報を、該個体の遺伝子型に基づいて決定する。例えば、或る個体の遺伝子型を少なくとも1つのリファレンスデータセットと比較し、該個体の民族性、地理的起源及び/又は祖先についての情報を決定するのに利用する。次いで、少なくとも1つの疾患又は状態との関連性を求めるために、この情報を該個体の遺伝子型解析に組み入れる。この解析は、少なくとも1つの疾患又は状態と関連している遺伝子マーカーに的を絞ることができ、それは少なくとも1つの民族性、地理的起源及び/又は祖先に関しても共通しているかも知れない。
【0192】
別の態様では、個体の民族性、地理的起源及び/又は祖先についての情報、及び、該個体の遺伝子マーカー解析から誘導された情報の両者を利用して、該個体が特定の民族性、地理的起源及び/又は祖先を共有している尤度を決定する。両タイプの情報を合することにより、遺伝子型解析から得られた情報を利用して、該個体の自己申告された民族性、地理的起源及び/又は祖先を検証し、誤りがあればそれを正すことができる。或る態様では、個体の民族性、地理的起源及び/又は祖先についての情報が自己申告される。これに代わる態様では、個体の民族性、地理的起源及び/又は祖先についての情報は推定される。個体の民族性、地理的起源及び/又は祖先の推定は、複雑な疾患又は状態の研究において集団構造を評価するための継続的手段を提供できる。個体の自己申告情報に基づいた、民族的、地理的起源及び/又は祖先によるグループ分けには、かなりの量の不均一性が存在し得る。例えば、個体の民族的、地理的起源及び/又は祖先の比率(例えば、ヨーロッパ人、北アフリカ人、アボリジニ等)を、公表されているアレル頻度に基づいて推定できる。推定された実例の個体の民族的、地理的起源及び/又は祖先の比率を自己申告情報の代わりに利用して、少なくとも1つの遺伝子マーカー及び少なくとも1つの疾患又は状態の間の関連性を研究することができる。次いで、遺伝的リスクモデルを利用して、推定された個体の民族的、地理的起源及び/又は祖先の比率に対する調整が、民族性、地理的起源及び/又は祖先に対する調整を行わなかったモデル、又は自己申告情報に基づくモデルと比較して、該データに対する、より良好なフィットを提供するかどうかを決定できる。次いで、最良のフィットを提供するモデルを利用して、少なくとも1つの疾患又は状態を獲得する個体のリスクを決定する。
【0193】
別の態様では、遺伝子型及び/又は自己申告データに基づく個体からの民族性、地理的起源及び/又は祖先の情報を利用して、該個体のゲノム全体への寄与の点で最も近いリファレンス下位群又は(複数の)下位群を数学的に決定できる。例えば、個体の遺伝子型が、彼/彼女が1以上の民族性、地理的起源及び/又は祖先を示す遺伝子マーカーを共有していることを示唆していることが決定されるかも知れない。この決定は、或る個体の血縁者のうち少なくとも一人が特定の民族的、地理的及び/又は祖先の起源に由来していることの尤度、及び場合によっては信頼区間(例えばX%±Yがある)を包含できる。この決定を利用して、類似の民族的、地理的及び/又は祖先起源を共有する個体における、典型的には少なくとも1つの疾患又は状態と関連している遺伝子マーカーについて、そして、前記の少なくとも1つの疾患又は状態を獲得するリスクについて、個体に知らせることができる。別の態様では、様々な民族的起源、地理的起源及び/又は祖先に由来する個体の全ゲノムへの寄与に関する情報を包含する報告を作製できる。例えば、報告には、或る個体の全ゲノムにわたる祖先の集計をパーセントで、例えば20%がアフリカ起源、30%がアジア起源、50%がヨーロッパ起源といったように記載できる。さらなる態様では、場合によっては、こうした報告は信頼区間を含むかも知れない(例えば20%±3がアフリカ起源、30%±5がアジア起源、50%±2がヨーロッパ起源といったように)。
【0194】
別の態様では、決定された個体の民族性、地理的起源及び/又は祖先を利用して、特定遺伝子座の解析に基づいた、個体の少なくとも1つの疾患又は状態の獲得リスクを決定できる。関連態様では、特定の民族性、地理的起源及び/又は祖先を持つ血縁者から、個体が前記遺伝子座を受け継いだ尤度、ならびに前記遺伝子座にあるアレル及び少なくとも1つの疾患又は状態の関連性、を特徴付ける少なくとも1個の遺伝子座について報告を作製できる。別の態様では、少なくとも2個の遺伝子座に特異的な関連性の結果を集計して、少なくとも1つの疾患又は状態を獲得する複合リスクが決定され得る。
【0195】
別の態様では、関連性研究で過去に報告された個体とは異なる民族性、地理的起源及び/又は祖先を有する個体が少なくとも1つの疾患又は状態を獲得するリスクを決定できる。別の態様では、該個体の遺伝子型と比較するためのリファレンスデータ下位群を見出すのを困難もしくは不可能にする、特異な又は稀な民族性、地理的起源及び/又は祖先を有する個体が、少なくとも1つの疾患又は状態を獲得するリスクを決定できる。例えば或る個体は、自身の民族性、地理的起源及び/又は祖先に直接関連し得る遺伝疾患を獲得するリスクを知りたいと思うかも知れない。幾つかの極端に稀な疾患、例えば眼咽頭筋ジストロフィーは、集団内の小さな限局された群の中でのみ見出されている。この性質を持つ疾患はしばしば一人の創始者又は限定された数の過去の疾患保因者にさかのぼることができる。この性質の疾患については、或る個体が最初の創始者又は疾患保因者と関係がないと確定できた場合、その個体をリスク群から除外することがしばしば可能である。或る態様では、共通する遺伝的背景又は共通する民族性、地理的起源及び/又は祖先を持つ他の個体について1又はそれ以上の関連性研究を実施するのが有益となるかも知れない。その場合、該個体の民族性、地理的起源及び/又は祖先を、推定又は自己申告情報により決定する。これらの調査は、個体の遺伝子型、民族性、地理的起源及び/又は祖先に関する情報を、少なくとも1つの疾患又は状態の状況に結びつけることができる。少なくとも二つの調査から得られた結果を比較して、遺伝子マーカーのアレル及び少なくとも1つの疾患又は状態の間に類似の関連性が観察されるかどうかを決定できる。結果は、調査された各集団における相関構造及びアレル頻度ならびにそれらの間の関係に依存し得る。さらに、前記調査を利用して、少なくとも1つの前記疾患又は状態への感受性に関連する遺伝子マーカーを特定できる。或る態様では、少なくとも1個の遺伝子マーカーについての少なくとも1個のアレルの不在を利用して、少なくとも1つの疾患又は状態に対するリスクから個体を排除する。これに代わる態様では、少なくとも1個の遺伝子マーカーについての少なくとも1個のアレルの存在を利用して、個体を、少なくとも1つの疾患又は状態に対するリスクがあると分類する。
【0196】
以下の実施例は本開示を例示及び説明するものである。本開示の範囲はこれらの実施例により限定されるものではない。
【実施例1】
【0197】
実施例1:SNPプロファイルの作製及び解析
個体に、そこからゲノムDNAが抽出される唾液試料(およそ4ml)を入れる、キット中の試料管(例えばDNA Genotekより入手可能)が提供される。この唾液試料が処理解析のためCLIA認定研究所に送付される。典型的にはこの試料は、採集キットに入って該個体に簡便に提供される輸送容器に入れて翌日配達便で該施設に送付される。
【0198】
好ましい態様では、ゲノムDNAを唾液から単離する。例えば、DNA Genotekから入手できるDNA自己採集キット技術を利用して、個体は、約4mlの唾液標本を臨床処理のために採集する。処理のための適当な研究所にこの試料が送達された後、典型的には採集キット供給者の供給する試薬を利用して、試料を50℃で少なくとも1時間熱変性及びプロテアーゼ消化することにより、DNAを単離する。次いでこの試料を遠心分離し、上清をエタノール沈殿させる。このDNAペレットを、その後の解析に適した緩衝液に懸濁する。
【0199】
個体のゲノムDNAを、周知の方法及び/又は採集キットの製造者が提供する方法に従い、唾液試料から単離する。一般に、試料をまず熱変性及びプロテアーゼ消化する。次に、試料を遠心分離し、上清を回収する。次いで上清をエタノール沈殿させて、ゲノムDNAおよそ5〜16ugを含有するペレットを得る。DNAペレットを10mM Tris pH7.6、1mM EDTA(TE)に懸濁する。このゲノムDNAを、アレイ製造者の提供する機器及び説明書を用いて市販の高密度SNPアレイ(例えばAffymetrix又はIlluminaより入手可能のもの)にハイブリダイズさせることにより、SNPプロファイルを作製する。該個体のSNPプロファイルを安全なデータベース又はヴォールトに寄託する。
【0200】
患者のデータ構造を、ゲノム中でのその存在が所定の疾患又は状態に相関している、確立した、医学関連SNPの臨床誘導データベースと比較することにより、リスク付与SNPについてクエリーを行う。このデータベースは、特定の疾患又は状態に対する特定SNP及びSNPハプロタイプの統計学的相関の情報を含んでいる。例えば、実施例IIIに示すように、アポリポ蛋白E遺伝子における多型はこの蛋白に異なるイソ型を生じさせ、これがアルツハイマー病発現の統計学的尤度に相関する。別の例としては、第V因子ライデンとして知られる血液凝固蛋白第V因子の変異体を持つ個体は、高い凝固傾向を有する。SNPが疾患又は状態の表現型に関連している幾つかの遺伝子を表1に示す。データベース中の情報は、科学的精確性及び重要性について研究/臨床諮問委員会によって承認され、また、行政機関の監督によって検討されるかも知れない。科学界からは追加的SNP−疾患相関が出現してくるため、データベースは絶えず更新される。
【0201】
個体のSNPプロファイルの解析結果を、オンラインポータル又は郵送によって患者に安全に提供する。患者には解釈及び支援情報、例えば実施例IVの第V因子ライデンについて示した情報が提供される。個体のSNPプロファイル情報への安全なアクセス、例えばオンラインポータルを通じたアクセスは、その患者の医師との話し合いを容易にし、患者がオーダーメイド医療の選択をできるようにさせる。
【実施例2】
【0202】
実施例2:遺伝子型相関の更新
個体の遺伝子型相関の初期決定を求める依頼に応えて、ゲノムプロファイルが作製され、遺伝子型相関が作られ、そして実施例1に記載のように該個体に結果が提供される。個体の遺伝子型相関の初期決定の後、追加の遺伝子型相関が判明すると、その後の更新された相関が決定され、又は決定され得る。契約者はプレミアムレベルの契約及び自身の遺伝子型プロファイルを持っており、それは安全なデータベースに維持される。更新された相関は、この保存された遺伝子型プロファイルに関して実行される。
【0203】
例えば、上の実施例1に記載したような初期の遺伝子型相関は、或る特定の個体がApoE4を持たず、よって若年性アルツハイマー病の素因を持たない、そしてこの個体が第V因子ライデンを持たないと確定できるかも知れない。この初期決定に続いて、新たな相関、例えば或る遺伝子、仮に遺伝子XYZにおける多型が、所定の状態、仮に状態321に相関していることが判明し立証されるかも知れない。この新たな遺伝子型相関は、ヒト遺伝子型相関のマスターデータベースに追加される。次いで、安全なデータベース中に保存されたその特定個体のゲノムプロファイルから、まず関連遺伝子XYZデータを回収することにより、該個体に更新が提供される。その特定個体の関連遺伝子XYZデータを、遺伝子XYZについての更新されたマスターデータベース情報と比較する。その特定個体の状態321への感受性又は遺伝的素因を、この比較から決定する。この決定の結果をその特定個体の遺伝子型相関に追加する。その特定個体が状態321への感受性があるか、又は遺伝的素因があるかどうかについての更新結果を、解釈及び支援情報と共に該個体に提供する。
【実施例3】
【0204】
実施例3:ApoE4遺伝子座及びアルツハイマー病の相関
アルツハイマー病(AD)のリスクは、ApoE2、ApoE3、及びApoE4と称するAPOEの3個のイソ型を生ずるアポリポ蛋白E(APOE)遺伝子の多型と相関していることが示されている。このイソ型は、APOE蛋白の残基112及び158における1又は2個のアミノ酸により、相互に異なっている。ApoE2は112/158にcys/cysを含み;ApoE3は112/158にcys/argを含み;そしてApoE2は112/158にarg/argを含む。表2に示すように、アルツハイマー病の若年発症リスクは、APOE ε4遺伝子コピーの数と共に上昇する。同様に、表3に示すように、ADの相対リスクはAPOEε4遺伝子コピーの数と共に上昇する。
【0205】
【表2】
【0206】
【表3】
【実施例4】
【0207】
実施例4:第V因子ライデン陽性患者のための情報
以下の情報は、第V因子ライデン遺伝子の存在を示すゲノムSNPプロファイルを有する個体に提供され得る情報の例である。該個体は、この情報が初期報告で提供される基本契約を結ぶことができる。
【0208】
第V因子ライデンとは何か?
第V因子ライデンは病気ではなく、両親から伝えられる特定の遺伝子の存在です。第V因子ライデンは、血液凝固に必要な蛋白第V(5)因子の変異体です。第V因子欠損のある人は、よりひどく出血し易く、一方第V因子ライデンを持つ人は凝固傾向の強い血液を持ちます。
【0209】
第V因子ライデン遺伝子を保有する人は、集団の残りの人々よりも血栓(血栓症)を発現するリスクが5倍高くなります。しかしながら、この遺伝子を持つ多くの人々は血栓に悩まされることが全くありません。英国及び米国において、人口の5パーセントが第V因子ライデン遺伝子を1個又はそれ以上持っていますが、これは実際に血栓症にかかる人の数より遙かに多いのです。
【0210】
如何にして第V因子ライデンを獲得するのか?
第V因子の遺伝子は両親から伝えられます。多くの遺伝形質と同様、1個の遺伝子は母親から、そして1個は父親から受け継がれます。したがって、2個の正常遺伝子、又は1個の第V因子ライデン遺伝子及び1個の正常遺伝子、又は2個の第V因子ライデン遺伝子を受け継ぐことが考えられます。1個の第V因子ライデン遺伝子を持つと血栓症を発現するリスクが僅かに高くなる結果となりますが、2個の遺伝子になると、このリスクはずっと高くなります。
【0211】
第V因子ライデンの症状は何か?
血栓(血栓症)のない限り、徴候はありません。
【0212】
危険なシグナルは何か?
最も一般的な問題は脚の血栓です。この問題は、脚が腫れ、痛みを持ち、赤くなることで示されます。より稀な場合には、肺の血栓(肺血栓症)が発現し、呼吸を困難にします。血栓のサイズにより、これは、殆ど気付かない程度から患者が重度の呼吸困難を経験する程度までの範囲となります。さらに稀な場合には、血栓が腕又は他の身体部分に起こり得ます。これらの血栓は、血液を心臓に送る静脈で形成され、動脈(これは心臓から血液を送り出します)では形成されないので、第V因子ライデンは冠状動脈血栓症のリスクを上昇させる訳ではありません。
【0213】
血栓を回避するために何ができるか?
第V因子ライデンは血栓を作るリスクを僅かに上昇させるに過ぎず、この状態の多くの人々は血栓症を一度も経験しません。血栓ができるのを回避するためにできることは数多くあります。長時間同じ姿勢で立っていたり座っていたりすることを避けて下さい。長距離を旅行する場合には、規則的に運動することが大切です − 血液を「停滞」させてはなりません。過体重や喫煙は血栓のリスクを大幅に上昇させます。第V因子ライデン遺伝子を保有する女性は、血栓症を起こす可能性が著しく上がるため、経口避妊薬を服用してはなりません。第V因子ライデン遺伝子を保有する女性は、妊娠もまた血栓症のリスクを高めるため、妊娠する前に医師の診察を受けるべきです。
【0214】
医師は如何にして第V因子ライデンを持っているかどうかを見出すのか?
第V因子ライデンの遺伝子は血液試料中に見出すことができます。
【0215】
脚又は腕の血栓は通常、超音波検査で検出できます。
【0216】
血栓はさらに、血栓を目立たせる物質を血液に注入後、X線で検出することもできます。肺の血栓は発見が困難ですが、医師は普通、放射性物質を使用して肺内の血流分布及び肺に至る空気の分布を調べます。この二つのパターンは一致するはずで、不一致は血栓の存在を示唆します。
【0217】
どのようにして第V因子ライデンを治療するのか?
第V因子ライデンを持つ人々は、血液が凝固し始めない限り治療を必要とせず、血液凝固が始まった場合、医師は、さらなる血栓を防止するために、ワルファリン(例えばマレバン)又はヘパリン等の血液をさらさらにする(抗凝固)薬を処方するでしょう。治療は通常3〜6ヶ月間継続させますが、血栓が幾つかある場合にはさらに長くなります。重症例では薬物治療過程を無期限に継続させ、極めて稀な例では血栓を外科的に除去する必要があるかも知れません。
【0218】
妊娠中、第V因子ライデンをどのように治療するのか?
第V因子ライデン遺伝子を2個持っている女性は、妊娠中ヘパリン凝固薬による治療を受ける必要があるでしょう。過去に自分自身が血栓を発現したことがある、又は血栓の家族歴を持つ、第V因子ライデン遺伝子を1個だけ持っている女性にも同じ適用を行います。
【0219】
第V因子ライデン遺伝子を保有する女性は全て、妊娠後半期に血栓を防止するための特別なストッキングを着用する必要があるかも知れません。出産後には抗凝固薬ヘパリンが処方されることがあります。
【0220】
予後
血栓の発現リスクは年齢と共に増大しますが、この遺伝子を保有する100歳を超える人々の調査では、それまでに血栓症にかかった人はごく僅かであることがわかりました。米国遺伝カウンセラー学会(NSGC)は、あなたの地域の遺伝カウンセラーの一覧表及び家族歴の創成についての情報を提供できます。www.nsgc.org/consumerでオンラインデータベースを検索して下さい。
【実施例5】
【0221】
実施例5:異なる祖先を持つ個体についてのオッズ比の作製
1.リファレンスデータセットに基づきLD確率を求める
【0222】
SNP S1、S2に遺伝子型の対(G1,G2)を持つHapMap個体の数を計数し、2個のSNPの結合分布を作製する。ベイズ法を用いて各々のSNPの周辺分布を合し、PCEU(S1,G1│S2,G2)(CEUは公表されているか、又は第一集団である)及びPYRI(S1,G1│S2,G2)(YRIは第二集団、該個体の祖先である)を推定する。
【0223】
2.入力データとして与えられていない場合にはカウントF(P,CA,G)、F(P,CT,G)を求める(代替的1−b)。
【0224】
入力データとして該カウントが与えられていない場合、以下のような等式の組を用いてそれらを求める:
【数2】
【0225】
【数3】
【0226】
上の等式において、UB(P,CEU,G)は、公表SNP Pにおける遺伝子型Gについてのオッズ比の信頼区間の上限である。M及びNは、それぞれこの調査における対照及び被験対象の数である。
【0227】
これらは6個の変数を持つ6個の等式である。F(P,CA,NN)及びF(P,CA,RN)の全数値の列挙を行う。このような値の対の各々について、一組の一次方程式を解くことにより、残りの変数を決定する2〜4の等式が提示され、そして最後の二つの等式を検証に使用する。実行時間はN2に拘束される。
【0228】
3.CEU中のPにおける被験対象及び対照の遺伝子型頻度のために、n(nは非常に大きく、例えば>>1000000)例を抽出する。この抽出は、該カウントを前提として、f(P,CA,G)、f(P,CT,G)の事後分布に基づいている。
【0229】
f(P)が与えられると、F(P)が見られる尤度を多項分布を前提として算出できる。f(P)の可能値に関して一様な事前確率を仮定することにより、確率Prob(f(P)│F(P))αProb(F(P)│f(P))がわかる。ギブス抽出法を利用してこの分布から抽出するため、MCMCアプローチを利用する。
【0230】
4.各々の頻度例について、そして各々のSNP Sについて:
【0231】
a)Pにおける頻度及びPCEUに基づきf(S,CA,G)及びf(S,CT,G)を算出する。
式:
【数4】
を用いて被験対象中のSにおける頻度を推定する。同様の式を対照にも使用できる。
【0232】
b)Sにおいて抽出されたアレル頻度に基づき、F(S,CA,G)、F(S,CT,G)の例を作製する。これは、Sにおいて該遺伝子型を表す多項確率変数を想定することにより行う。
【0233】
c)F(S)に基づき、そしてf(S)に基づき、Sについてのp値を算出する(後者は漸近的意義におけるp値である)。
【0234】
アーミテージのトレンド検定を利用して、F(S)に基づくp値を算出する。漸近的p値を算出するため、期待値と一致するカウント、例えばF(S,CA,G)を有する標本サイズNの被験対象及びNの対照が、Nf(S,CA,G)であると仮定する。
【0235】
d)測定された全てのSNP SにわたってF(S)に基づく最小p値を求める。これがPでない場合、この例を棄却する。
【0236】
e)棄却されなかった場合、その例をf(S)に基づく最小p値と共に維持し、これがその例の原因SNPということになる。
【0237】
5)前相は、原因SNP C1・・・・Cnの組及びそれらに対応するオッズ比を導く。このような各原因SNPについて、YRI集団について同じオッズ比が維持されると想定される。
【0238】
a)この情報を、CiにおけるYRI中での該遺伝子型頻度と共に使用して、あらゆる遺伝子型Gについて頻度fYRI(Ci,CA,G)を推定する。
【0239】
これを行うため、以下の等式を解く:
【0240】
【数5】
【0241】
fYRI(S,CT,G)はリファレンス集団(HapMap)から既知であると想定されるため、この等式には3個の欠落している変数がある。故に、上記の等式の組は一次方程式の組であり、効率的に解くことができる。
【0242】
b)LD情報を使用して、あらゆるSNP SについてのfYRI(S,CA,G)、fYRI(S,CT,G)を推定し、これらの頻度に基づき漸近的オッズ比を算出する。これは工程4(a)と同様の方法で実施する。
【0243】
c)各々のSNP Sについて、全例の漸近的オッズ比を平均し、期待される漸近的オッズ比を導く。
【0244】
次いでこのオッズ比を利用して個体の遺伝子型相関を決定する。
【0245】
本開示の好ましい態様を本明細書に示し説明してきたが、このような態様は例示のためにのみ提供されていることが当業者には明らかであろう。当業者にとっては、本開示から逸脱することなく、ここに多数の変形、変更、及び置換が存在するであろう。本明細書に記載される内容の態様に対する様々な代替形を、本開示の実施に際して利用できることを理解すべきである。以下の請求項は本開示の範囲を定義するものであり、これらの請求項の範囲内にある方法及び構造ならびにそれらの等価物は、それらによってカバーされることを意図している。
【背景技術】
【0001】
この出願は、2007年9月26日出願の米国仮出願60/975495に基づく優先権を主張するものであり、これを引用してその全内容を本明細書の一部とする。
【0002】
ヒトゲノムの配列決定及びヒトゲノミクスにおけるその他の近年の進歩は、任意の二人の人間の間のゲノム構成に99.9%を超える類似性があり得ることを明らかにした。個体間のDNAにおける比較的少数の変異は、表現型形質の相違を生じさせ、且つ、ヒトの多くの疾患や、様々な疾患への感受性や、疾患の処置への反応に関係している。個体間のDNAにおける変異は、コード領域及び非コード領域の両者に起こり、ゲノムDNA配列中の特定位置の塩基の変化ならびにDNAの挿入及び除去を包含する。ゲノム中の1個の塩基の位置に起こる変化を単一ヌクレオチド多型、又は「SNP」と称する。
【0003】
SNPはヒトゲノムにおいて比較的稀であるが、個体間のDNA配列変異の大部分を占めており、ヒトゲノムのおよそ1200塩基対に1個ある(国際HapMapプロジェクト。www.hapmap.orgを参照されたい)。より多くのヒト遺伝情報が得られるようになるにつれてSNPの複雑性が理解され始めるようになっている。また、ゲノムにおけるSNPの存在を、種々の疾患及び状態の存在及び/又は感受性と相関させることが始まりつつある。
【0004】
ヒト遺伝学において、これらの相関付け及びその他の進歩が成されるにつれて、一般に医療及び個人の健康は、患者が、他の因子よりも特に彼又は彼女のゲノム情報を考慮して適切な医薬及びその他の選択を行う、オーダーメイドアプローチへと向かっている。考慮に影響し得る重要な因子が、個体の祖先データ(家系)又は民族性である。例えば、異なる集団は、組換え率の変異、選択圧、又はボトルネック効果といった様々な考え得る理由のため、異なる連鎖不均衡パターンを有し得る。したがって、集団Aについて或る研究を行って、或る表現型に相関する遺伝子変異についてその集団内で特定のオッズ比が得られたとしても、集団Bにおいて同じオッズ比であると考えることはできない。したがって、個別的医療及びその他の決定を提供するための、祖先データを組み込んだ、個体のゲノムに特異的な情報を、該個体及びその介護者に提供する必要がある。
【発明の概要】
【課題を解決するための手段】
【0005】
本開示は、a)個体の遺伝子試料を取得し;b)その個体のゲノムプロファイルを作製し;c)その個体のゲノムプロファイルをヒト遺伝子型と表現型の相関の最新データベースと比較することにより、その個体の遺伝子型と表現型の相関を決定し;d)工程c)由来の結果をその個体又はその個体の健康管理者に報告し;e)さらなるヒト遺伝子型相関がわかった場合は、そのさらなるヒト遺伝子型相関を用いてヒト遺伝子型相関のデータベースを更新し;f)工程c)由来のその個体のゲノムプロファイル又はその一部をさらなるヒト遺伝子型相関と比較し、その個体のさらなる遺伝子型相関を決定することにより、その個体の遺伝子型相関を更新し;そして、g)工程f)由来の結果をその個体又はその個体の健康管理者に報告する、ことを含んでなる、個体の表現型に対する遺伝子型の相関を評価する方法を提供する。
【0006】
本開示はさらに、a)個体の遺伝子試料を取得し;b)その個体のゲノムプロファイルを作製し;c)その個体のゲノムプロファイルをヒト遺伝子型相関のデータベースと比較することにより、その個体の遺伝子型相関を決定し;d)その個体の遺伝子型相関の決定結果を安全な方法でその個体に提供し;e)さらなるヒト遺伝子型相関がわかった場合はさらなるヒト遺伝子型相関を用いてヒト遺伝子型相関のデータベースを更新し;f)その個体のゲノムプロファイル又はその一部をさらなるヒト遺伝子型相関と比較し、その個体のさらなる遺伝子型相関を決定することにより、その個体の遺伝子型相関を更新し;そして、g)その個体の遺伝子型相関の更新結果をその個体又はその個体の健康管理者に報告する、ことを含んでなる、個体の遺伝子型相関を評価するビジネス方法を提供する。
【0007】
本開示のさらなる局面は、a)各規則が少なくとも1個の遺伝子型及び少なくとも1個の表現型の相関を示すような規則を含んでなる規則の組を提供し;b)複数の個体の各々のゲノムプロファイルを含んでなるデータの組(ここで、各ゲノムプロファイルは複数の遺伝子型を含んでなる)を提供し;c)少なくとも1個の新たな規則(ここで、少なくとも1個の新たな規則とは、その規則の組において、かつて相互に相関していなかった遺伝子型及び表現型の相関を指す)によってこの規則の組を定期的に更新し;d)個体のうち少なくとも1個体のゲノムプロファイルに新たな各規則を適用し、それにより、その個体について少なくとも1個の遺伝子型を少なくとも1個の表現型と相関させ;そして場合により、e)その個体の表現型プロファイルを含んでなる報告を作製する、ことを含んでなる、個体の表現型プロファイルを作成する方法である。
【0008】
本開示はさらに、a)各規則が少なくとも1個の遺伝子型及び少なくとも1個の表現型の相関を示すような規則を含んでなる規則の組;b)少なくとも1個の新たな規則(ここで、少なくとも1個の新たな規則とは、その規則の組において、かつて相互に相関していなかった遺伝子型及び表現型の相関を指す)によってこの規則の組を定期的に更新するコード;c)複数の個体のゲノムプロファイルを含んでなるデータベース;d)個体の表現型プロファイルを決定するために、その個体のゲノムプロファイルにこの規則の組を適用するコード;及び、e)各個体のための報告を作製するコード、を含んでなるシステムを提供する。
【0009】
本開示はさらに、(a)(i)或る表現型に相関する遺伝子変異を含んでなる第一の連鎖不均衡(LD)パターン(ここで、この第一のLDパターンは第一の個体集団のものである);及び、(ii)その遺伝子変異を含んでなる第二のLDパターン(ここで、この第二のLDパターンは第二の個体集団のものである)、を比較し;(b)(a)における比較から、前記第二集団内の該表現型に相関している遺伝子変異の確率を決定し;(c)工程(b)の確率を使用することを含んでなる、該個体のゲノムプロファイルからの、前記表現型の遺伝子型相関の評価を行い;そして、(d)工程(c)由来の遺伝子型相関を含んでなる結果を、該個体又はその個体の健康管理者に報告すること、を含んでなる、個体の遺伝子型相関を評価する方法を提供する。幾つかの態様では、この方法はさらに、(e)さらなる遺伝子変異によって前記結果を更新する、ことを含んでなる。
【0010】
この確率はオッズ比(OR)であってよく、このORは既知のORから誘導できる。例えば、既知のORは、第一集団の表現型と相関する遺伝子変異についてのもの、例えば、科学雑誌に掲載されている遺伝子変異、例えばSNPについて公表されているORであってよい。幾つかの態様では、第一集団と第二集団は類似のLDパターンを有している。さらに本明細書には、(a)第一の個体集団における複数の遺伝子変異の各々について原因遺伝子変異の確率を決定し;(b)工程(a)の該確率の各々を、第二の個体集団における前記複数の遺伝子変異の各々についての確率とみなし;(c)工程(b)の確率を使用することを含んでなる、該個体のゲノムプロファイルからの、遺伝子型相関の評価を行い;そして、(d)工程(c)由来の遺伝子型相関を含んでなる結果を、該個体又はその個体の健康管理者に報告すること、を含んでなる、個体の遺伝子型相関を評価する方法を提供する。幾つかの態様では、この方法はさらに、(e)さらなる遺伝子変異によって前記結果を更新する、ことを含んでなる。
【0011】
既知の遺伝子変異、例えばSNPは、科学雑誌に公表されているORを伴う遺伝子変異であってよい。確率とはオッズ比(OR)であってよく、工程(a)の遺伝子変異の各々は、第一集団における表現型に相関する既知の遺伝子変異の近位にあり得る。例えば、各々の遺伝子変異は既知の遺伝子変異に対して連鎖不均衡であり得る。
【0012】
本明細書に開示する方法及びシステムの幾つかの態様では、遺伝子型相関をGCIスコアで報告する。第二集団は、典型的には第一集団とは異なる祖先の集団であり、その個体は第二集団の祖先を有する。幾つかの態様では、原因遺伝子変異は未知である。その遺伝子変異は単一ヌクレオチド多型(SNP)であってよい。
【0013】
本開示のもう一つの局面は、安全又は非安全な方法で上記方法及びシステムをネットワーク上で伝達することである。この報告は、オンラインポータルを介して、又は紙もしくはeメールによって実施できる。使用されるゲノムプロファイルは作製でき、遺伝子試料由来である。第三者がゲノムフロファイルを作製し、遺伝子試料を取得し、又は試料取得とゲノムプロファイル作製の両方を実施できる。遺伝子試料はDNA又はRNAであってよく、血液、毛髪、皮膚、唾液、精液、尿、糞便物質、汗及び口腔粘膜試料より成る群から選ばれる生体試料から取得できる。ゲノムプロファイルは安全なデータベース又はヴォールトに寄託できる。さらに、ゲノムプロファイルは単一ヌクレオチド多型プロファイルであってよく、幾つかの態様では、ゲノムプロファイルは、末端切除、挿入、除去、又は反復を含み得る。ゲノムプロファイルは、高密度DNAマイクロアレイ、RT−PCR、DNA配列決定、又は技術の組み合わせを使用して作製できる。
【0014】
本発明方法はさらに、HapMap集団(YRI、CEU、CHB、JPT、ASW、CHD、GIH、LWK、MEX、MKK、TSI)のうちいずれか、又は、アフリカ系アメリカ人、白色人種、アシュケナジー系ユダヤ人、スファラディー系ユダヤ人、インド人、太平洋諸島系、中東人、ドゥルーズ派、ベドウィン、南欧人、スカンジナビア人、東欧人、北アフリカ人、バスク人、西アフリカ人、又は東アフリカ人(但しこれらに限定される訳ではない)等のその他の任意の集団を含んでなる集団を包含する。
【0015】
本明細書に記載する全ての刊行物及び特許出願は、引用により、各々の個別刊行物又は特許出願が具体的且つ個別的に引用による本明細書への組み込みを示しているかのような程度まで、引用により本明細書の一部とされる。
【図面の簡単な説明】
【0016】
【図1】図1は、本発明方法の局面を説明するフローチャートである。
【図2】図2は、ゲノムDNA品質管理手段の一例である。
【図3】図3は、ハイブリダイゼーション品質管理手段の一例である。
【図4A】図4は、被験SNP及び効果推定値を伴う、公表された文献由来の代表的遺伝子型相関の表である。A〜I)は、単一遺伝子座遺伝子型相関を表し;J)は、二遺伝子座遺伝子型相関を表し;K)は、三遺伝子座遺伝子型相関を表し;L)は、A〜Kで使用された民族性及び国の略語の索引であり;M)は、A〜Kにおける短表現型名の略語、遺伝性、及びその遺伝性の出典の索引である。
【図4B】図4は、被験SNP及び効果推定値を伴う、公表された文献由来の代表的遺伝子型相関の表である。A〜I)は、単一遺伝子座遺伝子型相関を表し;J)は、二遺伝子座遺伝子型相関を表し;K)は、三遺伝子座遺伝子型相関を表し;L)は、A〜Kで使用された民族性及び国の略語の索引であり;M)は、A〜Kにおける短表現型名の略語、遺伝性、及びその遺伝性の出典の索引である。
【図4C】図4は、被験SNP及び効果推定値を伴う、公表された文献由来の代表的遺伝子型相関の表である。A〜I)は、単一遺伝子座遺伝子型相関を表し;J)は、二遺伝子座遺伝子型相関を表し;K)は、三遺伝子座遺伝子型相関を表し;L)は、A〜Kで使用された民族性及び国の略語の索引であり;M)は、A〜Kにおける短表現型名の略語、遺伝性、及びその遺伝性の出典の索引である。
【図4D】図4は、被験SNP及び効果推定値を伴う、公表された文献由来の代表的遺伝子型相関の表である。A〜I)は、単一遺伝子座遺伝子型相関を表し;J)は、二遺伝子座遺伝子型相関を表し;K)は、三遺伝子座遺伝子型相関を表し;L)は、A〜Kで使用された民族性及び国の略語の索引であり;M)は、A〜Kにおける短表現型名の略語、遺伝性、及びその遺伝性の出典の索引である。
【図4E】図4は、被験SNP及び効果推定値を伴う、公表された文献由来の代表的遺伝子型相関の表である。A〜I)は、単一遺伝子座遺伝子型相関を表し;J)は、二遺伝子座遺伝子型相関を表し;K)は、三遺伝子座遺伝子型相関を表し;L)は、A〜Kで使用された民族性及び国の略語の索引であり;M)は、A〜Kにおける短表現型名の略語、遺伝性、及びその遺伝性の出典の索引である。
【図4F】図4は、被験SNP及び効果推定値を伴う、公表された文献由来の代表的遺伝子型相関の表である。A〜I)は、単一遺伝子座遺伝子型相関を表し;J)は、二遺伝子座遺伝子型相関を表し;K)は、三遺伝子座遺伝子型相関を表し;L)は、A〜Kで使用された民族性及び国の略語の索引であり;M)は、A〜Kにおける短表現型名の略語、遺伝性、及びその遺伝性の出典の索引である。
【図4G】図4は、被験SNP及び効果推定値を伴う、公表された文献由来の代表的遺伝子型相関の表である。A〜I)は、単一遺伝子座遺伝子型相関を表し;J)は、二遺伝子座遺伝子型相関を表し;K)は、三遺伝子座遺伝子型相関を表し;L)は、A〜Kで使用された民族性及び国の略語の索引であり;M)は、A〜Kにおける短表現型名の略語、遺伝性、及びその遺伝性の出典の索引である。
【図4H】図4は、被験SNP及び効果推定値を伴う、公表された文献由来の代表的遺伝子型相関の表である。A〜I)は、単一遺伝子座遺伝子型相関を表し;J)は、二遺伝子座遺伝子型相関を表し;K)は、三遺伝子座遺伝子型相関を表し;L)は、A〜Kで使用された民族性及び国の略語の索引であり;M)は、A〜Kにおける短表現型名の略語、遺伝性、及びその遺伝性の出典の索引である。
【図4I】図4は、被験SNP及び効果推定値を伴う、公表された文献由来の代表的遺伝子型相関の表である。A〜I)は、単一遺伝子座遺伝子型相関を表し;J)は、二遺伝子座遺伝子型相関を表し;K)は、三遺伝子座遺伝子型相関を表し;L)は、A〜Kで使用された民族性及び国の略語の索引であり;M)は、A〜Kにおける短表現型名の略語、遺伝性、及びその遺伝性の出典の索引である。
【図4J】図4は、被験SNP及び効果推定値を伴う、公表された文献由来の代表的遺伝子型相関の表である。A〜I)は、単一遺伝子座遺伝子型相関を表し;J)は、二遺伝子座遺伝子型相関を表し;K)は、三遺伝子座遺伝子型相関を表し;L)は、A〜Kで使用された民族性及び国の略語の索引であり;M)は、A〜Kにおける短表現型名の略語、遺伝性、及びその遺伝性の出典の索引である。
【図4K】図4は、被験SNP及び効果推定値を伴う、公表された文献由来の代表的遺伝子型相関の表である。A〜I)は、単一遺伝子座遺伝子型相関を表し;J)は、二遺伝子座遺伝子型相関を表し;K)は、三遺伝子座遺伝子型相関を表し;L)は、A〜Kで使用された民族性及び国の略語の索引であり;M)は、A〜Kにおける短表現型名の略語、遺伝性、及びその遺伝性の出典の索引である。
【図4L】図4は、被験SNP及び効果推定値を伴う、公表された文献由来の代表的遺伝子型相関の表である。A〜I)は、単一遺伝子座遺伝子型相関を表し;J)は、二遺伝子座遺伝子型相関を表し;K)は、三遺伝子座遺伝子型相関を表し;L)は、A〜Kで使用された民族性及び国の略語の索引であり;M)は、A〜Kにおける短表現型名の略語、遺伝性、及びその遺伝性の出典の索引である。
【図4M】図4は、被験SNP及び効果推定値を伴う、公表された文献由来の代表的遺伝子型相関の表である。A〜I)は、単一遺伝子座遺伝子型相関を表し;J)は、二遺伝子座遺伝子型相関を表し;K)は、三遺伝子座遺伝子型相関を表し;L)は、A〜Kで使用された民族性及び国の略語の索引であり;M)は、A〜Kにおける短表現型名の略語、遺伝性、及びその遺伝性の出典の索引である。
【図5A】図5A〜Jは、効果推定値を伴う代表的遺伝子型相関の表である。
【図5B】図5A〜Jは、効果推定値を伴う代表的遺伝子型相関の表である。
【図5C】図5A〜Jは、効果推定値を伴う代表的遺伝子型相関の表である。
【図5D】図5A〜Jは、効果推定値を伴う代表的遺伝子型相関の表である。
【図5E】図5A〜Jは、効果推定値を伴う代表的遺伝子型相関の表である。
【図5F】図5A〜Jは、効果推定値を伴う代表的遺伝子型相関の表である。
【図5G】図5A〜Jは、効果推定値を伴う代表的遺伝子型相関の表である。
【図5H】図5A〜Jは、効果推定値を伴う代表的遺伝子型相関の表である。
【図5I】図5A〜Jは、効果推定値を伴う代表的遺伝子型相関の表である。
【図5J】図5A〜Jは、効果推定値を伴う代表的遺伝子型相関の表である。
【図6A】図6A〜Fは、代表的遺伝子型相関及び推定される相対リスクの表である。
【図6B】図6A〜Fは、代表的遺伝子型相関及び推定される相対リスクの表である。
【図6C】図6A〜Fは、代表的遺伝子型相関及び推定される相対リスクの表である。
【図6D】図6A〜Fは、代表的遺伝子型相関及び推定される相対リスクの表である。
【図6E】図6A〜Fは、代表的遺伝子型相関及び推定される相対リスクの表である。
【図6F】図6A〜Fは、代表的遺伝子型相関及び推定される相対リスクの表である。
【図7】図7は、報告の見本である。
【図8】図8は、解析システムならびにネットワーク上でのゲノム及び表現型プロファイルの伝達の模式図である。
【図9】図9は、本明細書に記載のビジネス方法の局面を説明するフローチャートである。
【図10】図10は、特定のオッズ比を有するCEU(白色人種祖先/民族性)における公表SNPの模式図であり、これは、異なる祖先背景を持つ異なる集団YRI(ヨルバ族系統/民族性。HapMapプロジェクトを参照されたい(http://hapmap.org/hapmappopulations.html.en))において同一であると考えることはできない。
【発明を実施するための形態】
【0017】
本開示は、個体又は個体群の保存されたゲノムプロファイルに基づいて表現型プロファイルを作製するための、及びその保存されたゲノムプロファイルに基づいて最初の及び更新された表現型プロファイルを容易に作製するための方法及びシステムを提供するものである。ゲノムプロファイルは、個体から取得した生体試料から遺伝子型を決定することによって製作する。個体から取得した生体試料は、そこから遺伝子試料が誘導できる任意の試料であってよい。試料は、綿棒採取口腔粘膜試料、唾液、血液、毛髪、又はその他いかなる種類の組織試料であってもよい。次いでその生体試料から遺伝子型を決定できる。遺伝子型は任意の遺伝子変異体もしくは生物学的マーカー、例えば単一ヌクレオチド多型(SNP)、ハプロタイプ、又はゲノムの配列であってよい。遺伝子型は個体のゲノム配列全体であってよい。遺伝子型は、数千又は数百万のデータ点を生成するハイスループット解析、例えば既知SNPの殆ど又は全てに対するマイクロアレイ解析によって導き出すことができる。別の態様では、遺伝子型はハイスループット配列決定によっても決定できる。
【0018】
遺伝子型は個体のゲノムプロファイルを形成する。このゲノムプロファイルはデジタル保存され、表現型プロファイルを作製する任意の時点で容易にアクセスできる。表現型プロファイルは、遺伝子型を表現型に相関させ又は関連づける規則を適用することにより作製する。規則は、遺伝子型と表現型の相関を証明する科学的研究に基づいて作製できる。相関は、一人又はそれ以上の専門家による委員会により監督又は検証される。個体のゲノムプロファイルに規則を適用することにより、個体の遺伝子型と表現型の関連性が決定できる。個体の表現型プロファイルはこの決定を有することになる。その決定は、該個体が所定の表現型を有する、又はその表現型を発現するであろうという、個体の遺伝子型及び所定の表現型の間の明確な関連性であるかも知れない。或いは、その個体が所定の表現型を持たない、又は発現しないであろう、という決定がなされるかも知れない。別の態様では、この決定は、個体が或る表現型を有する、又は発現するであろうというリスクファクター、推定、又は確率であるかも知れない。
【0019】
この決定は、幾つかの規則に基づいて行うことができ、例えば、複数の規則をゲノムプロファイルに適用して、個体の遺伝子型と特定の表現型の関連性を決定することができる。この決定はまた、個体に特有の因子、例えば民族性、性別、ライフスタイル、年齢、環境、家族の病歴、個人の病歴、及びその他の既知表現型を組み入れることもできる。この特有の因子の組み入れは、これらの因子を包含する既存の規則を改変することによるものであってよい。或いは、これらの因子によって別個の規則を作製し、既存の規則を適用した後に個体の表現型決定に適用することもできる。
【0020】
表現型は任意の測定可能な形質又は特徴、例えば或る疾患への感受性又は薬物処置に対する反応を包含できる。包含され得るその他の表現型は、身体的及び精神的特徴、例えば身長、体重、毛髪の色、眼の色、日焼けに対する感受性、サイズ、記憶、知性、楽観主義のレベル、及び一般気質である。表現型はさらに、他の個体又は生物との遺伝学的比較をも包含し得る。例えば、個体は自身のゲノムプロファイルと著明人のゲノムプロファイルの類似性に興味を持つかも知れない。また、彼等のゲノムプロファイルを、細菌、植物又は他の動物といった他の生物と比較させることができる。
【0021】
この開示の別の局面では、多数の遺伝子マーカーと1又はそれ以上の疾患又は状態の関連性についての情報を合し、解析して、Genetic Composite Index(GCI)スコアを求める(例えばPCT公報No.WO2008/067551に記載されており、これを引用により本明細書の一部とする)。このスコアは、既知のリスクファクター、ならびに他の情報及び推定、例えばアレル頻度及び疾患の有病率を組み込んでいる。GCIを使用して、或る疾患又は状態と、一組の遺伝子マーカーの複合効果の関連性を定性的に推定することができる。GCIスコアを使用して、遺伝学の訓練を受けていない人々に、彼等個人のいかなる疾患リスクが最新の科学研究に基づいて関連集団と比較されているかについての、信頼できる(即ち強固な)、理解可能な、そして/又は直感的な感覚を提供できる。PCT公報No.WO2008/067551に記載されているように、GCIスコアを使用してGCIプラススコアを作製することができる。GCIプラススコアは、リスク(例えば生涯リスク)、年齢により規定される有病率、及び/又は年齢により規定される該状態の出現率を包含する、全てのGCI仮定を含み得る。そこで、個体の生涯リスクをGCIプラススコアとして算出するが、それは、個体のGCIスコアを平均GCIスコアで除したものに比例する。平均GCIスコアは、類似の祖先背景を持つ個体群、例えば白色人種、アジア人、東インド人の群、又は共通の祖先背景を持つその他の群から決定できる。群は少なくとも5、10、15、20、25、30、35、40、45、50、55、又は60名の個体を含み得る。幾つかの態様では、平均値は少なくとも75、80、95、又は100名の個体から決定され得る。GCIプラススコアは、或る個体のGCIスコアを決定し、そのGCIスコアを平均相対リスクで除し、そして或る状態又は表現型についての生涯リスクを掛けることによって決定できる。例えば、PCT公報No.WO2008/067551のデータ、例えば図24の情報と共に図22及び/又は図25を利用して、図19に記載のようなGCIプラススコアを算出する。
【0022】
本開示は、本明細書に記載のGCIスコアの使用を包含するものであり、当業者は、本明細書に記載のGCIスコアに代わるGCIプラススコア又はその変形の使用を容易に理解できるであろう。或る態様では、GCIスコアを、目的とする疾患又は状態の各々について作製する。これらのGCIスコアを集めて或る個体のリスクプロファイルを作製できる。GCIスコアは、リスクプロファイルを作製するため、いかなる時点においても容易にアクセスできるよう、デジタル保存することができる。リスクプロファイルは、癌、心臓病、代謝性疾患、精神疾患、骨疾患、又は年齢発症疾患といった広範な疾患クラスに分類できる。広範な疾患クラスはさらに下位カテゴリーに細分できる。例えば、癌のような広範クラスでは、タイプ(非上皮性悪性腫瘍、上皮性悪性腫瘍、白血病等)、又は組織特異性(神経、乳房、卵巣、精巣、前立腺、骨、リンパ節、膵臓、食道、胃、肝臓、脳、肺、腎臓等)による癌の下位カテゴリーを列挙できる。
【0023】
別の態様では、GCIスコアが或る個体のために作製され、それが、少なくとも1つの疾患又は状態を獲得するその個体のリスク又は感受性について容易に理解できる情報を提供する。或る態様では、異なる疾患又は状態についての複数のGCIスコアを作製する。別の態様では、少なくとも1つのGCIスコアがオンラインポータルによってアクセス可能である。或いは、少なくとも1つのGCIスコアが紙の形態で提供され、その後の更新もまた紙で提供される。或る態様では、少なくとも1つのGCIスコアが、サービスに加入している個体である契約者に提供される。これに代わる態様では、非契約者に対してアクセスが提供され、この場合、非契約者は自身のGCIスコアのうち少なくとも1つへのアクセスが制限されるか、又は、作製された自身のGCIスコアのうち少なくとも1つに関する初期報告は取得できるが、更新された報告は、利用料を支払った時にのみ作製される。別の態様では、健康管理者及び健康管理提供者、例えば介護者、医師、及び遺伝カウンセラーもまた個体のGCIスコアのうち少なくとも1つにアクセスできる。
【0024】
個体について決定された相関表現型の集合体は、その個体の表現型プロファイルを共に含んでなる。表現型プロファイルはオンラインポータルによりアクセスできる。或いは、或る時点で存在する表現型プロファイルを紙の形態で提供し、その後の更新もまた紙の形態で提供できる。表現型プロファイルをオンラインポータルによって提供することもできる。オンラインポータルは、場合によっては安全なオンラインポータルであるかも知れない。表現型プロファイルへのアクセスは契約者に対して提供され、この契約者とは、表現型と遺伝子型の相関に関する規則を作製し、個体のゲノムプロファイルを決定し、該規則をそのゲノムプロファイルに適用し、そして該個体の表現型プロファイルを作製するサービスに加入している個体である。アクセスは非契約者に対しても提供され、この場合、非契約者は自身の表現型プロファイル及び/又は報告へのアクセスが制限されるか、又は、作製された初期の報告又は表現型プロファイルは取得できるが、更新された報告は、利用料を支払った時にのみ作製されるであろう。健康管理者及び健康管理提供者、例えば介護者、医師、及び遺伝カウンセラーもまた表現型プロファイルにアクセスできる。
【0025】
本開示のもう一つの局面では、ゲノムプロファイルは契約者及び非契約者について作製されてデジタル保存されるが、この表現型プロファイル及び報告へのアクセスは、契約者に限定される。別の変形では、契約者及び非契約者のいずれもが自身の遺伝子型及び表現型プロファイルにアクセスできるが、非契約者に対してはアクセスが限定されるか、又は限定された報告が作製され、一方、契約者は完全なアクセスができ、完全な報告が作製される。別の態様では、契約者及び非契約者のいずれもが初期には完全なアクセス又は完全な初期報告を取得できるが、契約者のみが、保存された自身のゲノムプロファイルに基づく更新報告にアクセスできる。
【0026】
基本的な契約モデルもまた存在し得る。基本契約は表現型プロファイルを提供できるが、ここで契約者は、自身のゲノムプロファイルに対して既存の全規則を適用するか、又は既存規則の一部を適用するかを選択できる。例えば、対応可能な疾患表現型についての規則のみを適用する選択を行うことができる。この基本契約は、契約クラス内に様々なレベルがあり得る。例えば、様々なレベルは、契約者が自身のゲノムプロファイルに相関させたい表現型の数によるかも知れず、又は、自身の表現型プロファイルにアクセスできる人間の数によるかも知れない。基本契約の別のレベルは、個体に特異的な因子、例えば年齢、性別、又は病歴といった既にわかっている表現型を表現型プロファイルに組み入れることかも知れない。
【0027】
基本契約のさらに別のレベルでは、個体が、或る疾患又は状態についての少なくとも1つのGCIスコアを作製できる。このレベルの変形では、個体は、少なくとも1つのGCIスコアの作製に用いられた解析における変化のために、少なくとも1つのGCIスコアに何らかの変化があった場合に、その疾患又は状態についての少なくとも1つのGCIスコアの自動更新がなされるような指示ができる。幾つかの態様では、その個体は、eメール、音声メッセージ、テキストメッセージ、郵便、又はファクシミリによって自動更新を通知され得る。
【0028】
契約者はさらに、自身の表現型プロファイル及びその表現型についての情報、例えばその表現型についての遺伝的及び医学的情報を有する報告を作製できる。例えば、その集団における該表現型の保有率、相関に使用された遺伝子変異体、該表現型を引き起こす分子メカニズム、該表現型の治療法、該表現型の処置選択肢、及び予防処置、を報告に盛り込むことができる。別の態様では、報告は、或る個体の遺伝子型と別の個体、例えば著名人又はその他の有名人の遺伝子型の類似といった情報をも盛り込んでいるかも知れない。類似性に関する情報には、相同性パーセント、同一変異体の数、及び似通った表現型といったものがあるが、これらに限定されない。これらの報告はさらに少なくとも1つのGCIスコアを含み得る。
【0029】
報告はさらに、その報告がオンラインでアクセスできる場合には、該表現型に関するさらなる情報を有する別のサイトへのリンク、オンラインサポートグループ及び同じ表現型又は1もしくはそれ以上の類似表現型を持つ人々のインターネット掲示板へのリンク、オンライン遺伝カウンセラーもしくは医師へのリンク、又は遺伝カウンセラーもしくは医師との電話もしくは対面予約へのリンクを提供し得る。報告が紙の形態である場合には、情報は、前記リンクのウェブサイトアドレス、又は遺伝カウンセラーもしくは医師の電話番号及び住所であってよい。契約者はまた、いずれの表現型を自身の表現型プロファイルに組み込み、どの情報を自身の報告に組み込むかを選択できる。表現型プロファイル及び報告はさらに、個体の健康管理者又は健康管理提供者、例えば介護者、医師、精神科医、心理学者、セラピスト、又は遺伝カウンセラーによるアクセスが可能であるかも知れない。契約者は、表現型プロファイル及び報告、又はそれらの一部を、そのような個体の健康管理者又は健康管理提供者にアクセス可能とさせるかどうかを選択することができる。
【0030】
本開示は、プレミアムレベルの契約をも包含できる。プレミアムレベル契約は、初期の表現型プロファイル及び報告の作製後もゲノムプロファイルをデジタルで維持し、最新研究により更新された相関を含む表現型プロファイル及び報告を作製する機会を契約者に提供する。別の態様では、契約者は、最新研究により更新された相関を含む報告及びリスクプロファイルを作製する機会を有する。研究によって遺伝子型及び表現型、疾患又は状態の間に新たな相関が判明すると、これら新たな相関に基づいて新しい規則が産み出され、既に保存され維持されているゲノムプロファイルに適用され得る。新しい規則は、かつていかなる表現型とも相関していなかった遺伝子型を相関させ、又は遺伝子型を新たな表現型と相関させ、又は既存の相関を改変し、又は遺伝子型及び疾患もしくは状態の間に新たに発見された関連性に基づくGCIスコアの調整基準を提供できる。契約者は、eメール又はその他の電子的手段により新たな相関について知らされ、もしその表現型が興味深いものであるならば、自身の表現型を新しい相関によって更新することを選択できる。契約者は、更新毎、幾つかの更新に対して、又は所定の期間(例えば、3ヶ月、6ヶ月、又は1年間)の無制限回数の更新に対して支払いを行う契約を選択できる。もう一つの契約レベルは、個体が表現型プロファイル又はリスクプロファイルをいつ更新するか選択する代わりに、新たな相関に基づいて新たな規則が作製された時はいつでも表現型プロファイル又はリスクプロファイルを自動更新させるというものである。
【0031】
もう一つの契約の局面では、表現型と遺伝子型の相関に関する規則を作製し、個体のゲノムプロファイルを決定し、そのゲノムプロファイルに該規則を適用し、そして該個体の表現型プロファイルを作製するサービスを、契約者が非契約者に紹介できる。契約者が紹介することにより契約者にはそのサービスの契約に割引料金が提供され、又は既存の契約がアップグレードされる。紹介された個体は、期間限定の無料アクセスか、又は割引契約料金が提供される。
【0032】
表現型プロファイル及び報告ならびにリスクプロファイル及び報告は、人間及び人間以外の個体について作製できる。例えば、個体には、他の哺乳動物、例えばウシ、ウマ、ヒツジ、イヌ、又はネコが含まれ得る。本明細書で使用する契約者とは、1又はそれ以上のサービスに対する購入又は支払いによりサービスを契約する人間の個体である。サービスには以下のもののうち1又はそれ以上が包含されるがこれらに限定される訳ではない:自身の又は別の個体、例えば契約者の子供又はペットのゲノムプロファイルを決定させること、表現型プロファイルを取得すること、その表現型プロファイルを更新させること、及び、自身のゲノム及び表現型プロファイルに基づく報告を取得すること。
【0033】
本開示の別の局面では、「現場配置」メカニズムを個体から収集して、個体のための表現型プロファイルを作製できる。好ましい態様では、或る個体は遺伝情報に基づいて初期表現型プロファイルを作製させることができるかも知れない。例えば、種々の表現型についてのリスクファクター及び勧奨される処置又は予防措置を含む初期表現型プロファイルが作製される。例えば、そのプロファイルは、或る状態のために利用可能な薬物治療についての情報、及び/又は食生活の変更又は運動レジメンに関する提案を含み得る。その個体は、自身の表現型プロファイルについて相談するために、医師又は遺伝カウンセラーに面会するか、又はウェブポータルもしくは電話により連絡を取るかを選択できる。その個体は、例えば特別な薬物治療をする、食生活を変える、等、何らかの一連の行動を取る決定をするかも知れない。
【0034】
次にその個体は、自身の身体状態の変化及びリスクファクターに起こり得る変化を評価するため、生体試料を提出できる。ゲノムプロファイル及び表現型プロファイルを作製する施設(又は関連施設、例えば遺伝子プロファイル及び表現型プロファイルを作製する事業体と契約した施設)に生体試料を直接提出することにより、変化を確定してもらうことができる。或いは、その個体は「現場配置」メカニズムを利用でき、その場合、個体は唾液、血液、又はその他の生体試料を自宅の検出装置にかけ、第三者に解析させ、そしてそのデータを送信して別の表現型プロファイルに組み込ませることができる。例えば、或る個体が、遺伝データに基づいて心筋梗塞(MI)の生涯リスクが高いと報告する初期表現型報告を受け取ったかも知れない。その報告にはさらに、MIのリスクを低下させるための予防措置についての勧奨、例えばコレステロール低下薬及び食生活の変更が記載されているかも知れない。その個体は、遺伝カウンセラー又は医師に連絡を取り、その報告及び予防措置について相談することを選択し、食生活を変えようと決める。新たな食生活でしばらく過ごした後に、その個体はかかりつけの医師の診察を受け、コレステロールレベルを測定してもらう。ゲノム情報を持っている事業体に新しい情報(コレステロールレベル)が伝達され(例えばインターネットを介して)、そして、この新しい情報が、心筋梗塞及び/又はその他の状態についての新たなリスクファクターを伴う該個体の新たな表現型プロファイルの作製に利用される。
【0035】
個体は、特定の薬物治療に対する自身の個別反応を決定するために「現場配置」メカニズム又は直接メカニズムを利用することもできる。例えば、或る薬物に対する反応を測定してもらい、その情報を利用して、より有効な処置を決定することができる。測定可能な情報には、代謝産物レベル、グルコースレベル、イオンレベル(例えば、カルシウム、ナトリウム、カリウム、鉄)、ビタミン、血球数、ボディー・マス・インデックス(BMI)、蛋白レベル、転写物レベル、心拍数、等があり(但しこれらに限定される訳ではない)、これらを容易に実施可能な方法で測定し、アルゴリズムに組み入れて初期ゲノムプロファイルと合し、改変された総体的なリスク推定スコアを決定することができる。
【0036】
「生体試料」という語は、個体の遺伝子試料がそこから単離できる任意の生物学的試料を指す。
【0037】
本明細書で使用する「遺伝子試料」とは、個体から取得又は誘導されるDNA及び/又はRNAを指す。
【0038】
本明細書で使用する「ゲノム」という語は、ヒトの細胞の核内に見出される染色体DNAの全体を意味することを意図している。「ゲノムDNA」という語は、ヒトの細胞の核に天然に存在する1又はそれ以上の染色体DNA分子、又は該染色体DNA分子の一部を指す。
【0039】
「ゲノムプロファイル」という語は、個体の遺伝子についての一組の情報、例えば特定のSNP又は突然変異の有無を指す。ゲノムプロファイルは個体の遺伝子型を包含する。ゲノムプロファイルはさらに、個体の実質上完全なゲノム配列であることもある。幾つかの態様では、ゲノムプロファイルは、個体の完全なゲノム配列の少なくとも60%、80%、又は95%であってよい。ゲノムプロファイルは個体の完全なゲノム配列のほぼ100%であってよい。ゲノムプロファイルに関して「その一部」とは、或る完全なゲノムのゲノムプロファイル部分集合に含まれるゲノムプロファイルを指す。
【0040】
「遺伝子型」という語は、個体のDNAの特定の遺伝子構成を指す。遺伝子型には、個体の遺伝子変異体及びマーカーが包含され得る。遺伝子マーカー及び変異体には、ヌクレオチド反復、ヌクレオチド挿入、ヌクレオチド除去、染色体転座、染色体複製、又はコピー数変異が包含され得る。コピー数変異は、マイクロサテライト反復、ヌクレオチド反復、動原体反復、又はテロメア反復が包含され得る。遺伝子型はさらにSNP、ハプロタイプ、又はディプロタイプを包含し得る。ハプロタイプとは、遺伝子座又はアレルを指すことがある。ハプロタイプはまた、統計的に関連性のある1本の染色分体上の単一ヌクレオチド多型(SNP)の組とも表現される。ディプロタイプは一組のハプロタイプである。
【0041】
単一ヌクレオチド多型又は「SNP」という語は、ヒト集団内でその遺伝子座に存在する窒素含有塩基の実体に関して、例えば少なくとも1パーセント(1%)の変動性を示す、染色体上の特定遺伝子座を指す。例えば、或る個体が、与えられた遺伝子の特定ヌクレオチド位置にアデノシン(A)を有する場合、別の個体がこの位置にシトシン(C)、グアニン(G)、又はチミン(T)を有すると、その特定位置にはSNPが存在するのである。
【0042】
本明細書で使用する「SNPゲノムプロファイル」という用語は、或る個体のゲノムDNA配列全体を通じた、SNP部位におけるその個体のDNAの塩基内容を指す。「SNPプロファイル」は、ゲノムプロファイル全体を指すことができるが、その一部、例えば特定遺伝子もしくは遺伝子群に関連し得る、より限局したSNPプロファイルを指すこともある。
【0043】
「表現型」という語は、個体の定量的形質又は特徴の描写に使用される。表現型には医学的及び非医学的状態が包含されるがこれらに限定される訳ではない。医学的状態には疾患及び障害が包含される。表現型はさらに、身体的特徴、例えば毛髪の色、生理的特徴、例えば肺活量、精神的特徴、例えば記憶保持、情緒的特徴、例えば怒りを制御する能力、民族性、例えば民族的背景、祖先、例えば個体の出自、ならびに年齢、例えば平均余命又は種々の表現型の発現年齢を包含する。表現型にはさらに、1個の遺伝子が1つの表現型に相関している単一遺伝子型、又は1以上の遺伝子が1つの表現型に相関している多遺伝子型がある。
【0044】
「規則」とは、遺伝子型と表現型の相関を定義するために用いられる。規則は、数値、例えばパーセント、リスクファクター、又は信頼スコアによって相関を定義できる。規則には、複数の遺伝子型と1つの表現型の相関を組み入れることができる。「規則の組」は、1以上の規則を含んでなる。「新たな規則」とは、現在それらについての規則が存在していない、遺伝子型と表現型の相関を示す規則である。新たな規則は、非相関遺伝子型と表現型を相関させるかも知れない。新たな規則はさらに、既に或る表現型と相関している遺伝子型と、かつて相関していたことのない表現型を相関させるかも知れない。「新たな規則」はさらに、別の規則を包含する他の因子によって改変された既存の規則であるかも知れない。既存の規則は、個体の既知の特徴、例えば民族性、祖先、地理、性別、年齢、家族歴、又は過去に決定されたその他の表現型が原因で改変されることがある。
【0045】
本明細書における「遺伝子型相関」の使用は、個体の遺伝子型、例えば或る突然変異又は突然変異群の存在と、或る表現型、例えば特定の疾患、状態、身体状態、及び/又は精神状態になり易くなる尤度との、統計学的相関を指す。特定の遺伝子型の存在下で或る表現型が観察される頻度は、特定表現型の遺伝子型相関の程度又は尤度を決定する。例えば、本明細書に詳述するように、アポリポ蛋白E4イソ型を生じさせるSNPは、早発性アルツハイマー病への罹患し易さと相関している。遺伝子型相関はまた、表現型への素因がない相関、又は負の相関をも指す。遺伝子型相関はさらに、或る表現型を有する又は或る表現型を有する素因のある個体の推定値を表し得る。遺伝子型相関は、数値、例えばパーセント、相対リスクファクター、効果推定値、又は信頼スコアによって示すことができる。
【0046】
「表現型プロファイル」という語は、或る個体の遺伝子型又は遺伝子型群に相関する複数の表現型の集合体を指す。表現型プロファイルは、或るゲノムプロファイルに1又はそれ以上の規則を適用することによって作製される情報、又は或るゲノムプロファイルに適用される遺伝子型相関についての情報を包含できる。表現型プロファイルは、1つの表現型に複数の遺伝子型を相関させる規則を適用することにより作製できる。確率又は推定値は、数値、例えばパーセント、数値的リスクファクター又は数値的信頼区間として表現できる。確率は、高、中、又は低で表現することもできる。表現型プロファイルはさらに、或る表現型の有無又は或る表現型を発現するリスクを示すこともある。例えば、或る表現型プロファイルは、青い眼、又は糖尿病を発症する高いリスクの存在を示すことがある。表現型プロファイルはさらに、或る医学的状態の予後予測、処置の有効性、又は処置への応答を示すことがある。
【0047】
リスクプロファイルという語は、1以上の疾患又は状態についてのGCIスコアの集合体を指す。GCIスコアは個体の遺伝子型と1又はそれ以上の疾患もしくは状態の間の関連性の解析に基づいている。リスクプロファイルは、疾患カテゴリーにグループ分けされたGCIスコアを表すことができる。さらにリスクプロファイルは、個体の年齢や様々なリスクファクターを調節する時にGCIスコアの変化を如何にして予測するかについての情報を示すことができる。例えば、特定の疾患についてのGCIスコアは、食生活の変更効果や実行される予防措置(禁煙、薬物投与、定型的両側乳房切断術、子宮摘出術)を考慮に入れることができる。GCIスコアは、数値尺度、グラフ表示、聴覚によるフィードバック又はこれらの任意の組み合わせとして表示できる。
【0048】
本明細書で使用する「オンラインポータル」という語は、コンピューター及びインターネットウェブサイト、電話、又は同様の情報へのアクセスを可能にするその他の手段を使用することにより個体が容易にアクセスできる情報源を指す。オンラインポータルは安全なウェブサイトであってよい。このウェブサイトは、他の安全及び非安全ウェブサイトへのリンク、例えば、その個体の表現型プロファイルを内包する安全なウェブサイト、又は特定の表現型を共有する個体のためのインターネット掲示板のような非安全ウェブサイトを提供することがある。
【0049】
特に指摘のない限り、本開示の実施は、分子生物学、細胞生物学、生化学、及び免疫学の常套的技術及び説明を使用でき、それらは当分野の通常の技術の範囲内にある。このような常套技術には、核酸単離、ポリマーアレイ合成、ハイブリダイゼーション、ライゲーション、及び標識を用いるハイブリダイゼーションの検出がある。適切な技術の具体的説明を本明細書で例示言及する。しかしながら、他の同等の常套的手法もまた利用できる。他の常套的技術及び説明は、Genome Analysis: A Laboratory Manual Series(Vols. I-IV)、PCR Primer: A Laboratory Manual、Molecular Cloning: A Laboratory Manual(全てCold Spring Harbor Laboratory Pressより);Stryer, L. (1995) Biochemistry(4th Ed.) Freeman, New York、Gait, “Oligonucleotide Synthesis: A Practical Approach” 1984, IRL Press, London, Nelson and Cox(2000); Lehninger, Principles of Biochemistry 3rd Ed., W.H. Freeman Pub., New York, N.Y.;及びBerg et al. (2002) Biochemistry, 5th Ed., W.H. Freeman Pub., New York, N.Y.といった標準的研究マニュアル及び教科書に見出すことができ、これらは全て引用によりその全内容を本明細書の一部とする。
【0050】
本開示の方法は、表現型に関する分子情報を個体に提供するための、該個体のゲノムプロファイルの解析を含む。本明細書に詳述するように、個体は遺伝子試料を提供し、そこから個人のゲノムプロファイルが作製される。このプロファイルを、確立され検証されたヒト遺伝子型相関のデータベースと比較することにより、その個体のゲノムプロファイルデータを遺伝子型相関について照会する。確立され検証された遺伝子型相関のデータベースは、同業者により審査された文献由来のものであり、さらに当該分野の1又はそれ以上の専門家、例えば遺伝学者、疫学者、又は統計学者より成る委員会により評価され監督される。好ましい態様では、評価済みの遺伝子型相関に基づいて規則を作製し、それを個体のゲノムプロファイルに適用して表現型プロファイルを作製する。個体のゲノムプロファイルの解析結果、表現型プロファイル、ならびに解釈及び支援情報が、個体又は該個体の健康管理者に提供され、該個体の健康管理のための個別的な選択ができるようにさせる。
【0051】
本開示の方法は図1に詳しく記載のとおりであるが、ここで、まず個体のゲノムプロファイルを作製する。個体のゲノムプロファイルは、遺伝子変異又はマーカーに基づく個体の遺伝子についての情報を含んでいる。遺伝子変異はゲノムプロファイルを構成する遺伝子型である。このような遺伝子変異又はマーカーには、単一ヌクレオチド多型、単一及び/又は多ヌクレオチド反復、単一及び/又は多ヌクレオチド除去、マイクロサテライト反復(典型的には5〜1000反復単位を伴う少数のヌクレオチド反復)、ジヌクレオチド反復、トリヌクレオチド反復、配列再編成(転座及び複製を含む)、コピー数変異(特定の遺伝子座の欠失及び獲得の両者)等があるが、これらに限定される訳ではない。その他の遺伝子変異には、染色体複製及び転座ならびに動原体及びテロメア反復がある。
【0052】
遺伝子型はさらにハプロタイプ及びディプロタイプを包含し得る。幾つかの態様では、ゲノムプロファイルは少なくとも100000、300000、500000又は1000000の遺伝子型を有し得る。幾つかの態様では、ゲノムプロファイルは個体の実質的に完全なゲノム配列であり得る。別の態様では、ゲノムプロファイルは個体の完全なゲノム配列の少なくとも60%、80%、又は95%である。ゲノムプロファイルは個体の完全なゲノム配列のほぼ100%であることがある。標的を含む遺伝子試料は、増幅されていないゲノムDNA又はRNA試料又は増幅されたDNA(又はcDNA)を包含するがこれらに限定されない。標的は、特に興味深い遺伝子マーカーを含むゲノムDNAの特定領域であるかも知れない。
【0053】
図1の工程102では、個体の遺伝子試料を個体の生体試料から単離する。そのような生体試料には、血液、毛髪、皮膚、唾液、精液、尿、糞便物質、汗、口腔粘膜、及び様々な身体組織が包含されるがこれらに限定される訳ではない。幾つかの態様では、個体が組織試料を直接採集し、例えば口腔粘膜試料は、個体が頬の内側に綿棒を当てることにより取得できる。唾液、精液、尿、糞便物質、又は汗といったその他の試料も個体自身によって供給できる。その他の生体試料は、瀉血士、看護師又は医師といった健康管理の専門家によって採取され得る。例えば、血液試料は看護師により個体から採取され得る。組織生検は健康管理の専門家によって行われ、試料を効率的に取得するためのキットもまた健康管理専門家は入手できる。小円筒状の皮膚を採取することができ、又は針を使用して組織又は液体の少量試料を採取できる。
【0054】
幾つかの態様では、個体の生体試料のために試料の採集容器付きのキットが個体に提供される。このキットはさらに、個体が自身の試料を直接採集するための指示書、例えばどれだけの量の毛髪、尿、汗、又は唾液を提供するか、を個体に提供できる。キットにはまた、個体が健康管理専門家に組織試料の採取を要請するための指示書が入っているかも知れない。キットには、試料が第三者により採取される場所が含まれており、例えば、キットが健康管理施設に提供され、次にその施設が個体から試料を集めることがある。さらにこのキットは、試料が試料処理施設に送付されるための返送用梱包材をも提供でき、その施設で遺伝子材料が生体試料から単離される(工程104)。
【0055】
幾つかの周知の生化学的及び分子生物学的方法のいずれかに従ってDNA又はRNAの遺伝子試料が生体試料から単離できる。例えばSambrook, et al., Molecular Cloning: A Laboratory Manual(Cold Spring Harbor Laboratory, New York)(1989)を参照されたい。生体試料からDNA又はRNAを単離するための市販のキット及び試薬も幾つかあり、例えばDNA Genetek、Gentra Systems、Qiagen、Ambion、及びその他の供給者から入手できるものがある。口腔粘膜試料キットは、例えばMasterAmp(登録商標) Buccal Swab DNA抽出キット(Epicentre Biotechnologies製)を容易に商業的に入手でき、Extract-N-Amp(登録商標)(Sigma Aldrich製)のような血液試料からのDNA抽出用キットもまた同様である。他の組織からのDNAは、組織をプロテアーゼ及び熱で消化し、試料を遠心分離し、フェノール−クロロホルムを用いて不要物質を抽出し、水相にDNAを残すことによって取得できる。次いでこのDNAをエタノール沈殿によりさらに単離できる。
【0056】
好ましい態様では、ゲノムDNAを唾液から単離する。例えば、DNA Genotekから入手できるDNA自己採集キット技術を用いて、個体が臨床処理のための唾液標本を採集する。都合の良いことにこの試料は室温で保存及び搬送できる。試料が処理のための適当な研究所に送付された後、典型的には採集キットの供給者により供給された試薬を用いて、熱変性及びプロテアーゼ消化により50℃で少なくとも1時間DNAを単離する。次にこの試料を遠心分離し、上清をエタノール沈殿させる。このDNAペレットを、その後の分析に適した緩衝液に懸濁する。
【0057】
別の態様では、遺伝子試料としてRNAを使用できる。特に、発現される遺伝子変異はmRNAから特定できる。「メッセンジャーRNA」又は「mRNA」という語は、プレmRNA転写物(群)、転写物プロセシング中間体、翻訳される準備が整った成熟mRNA(群)及び遺伝子もしくは遺伝子群の転写物、又はmRNA転写物(群)から誘導される核酸を包含するが、これらに限定されない。転写物プロセシングは、スプライシング、編集及び分解を含み得る。本明細書で使用する、mRNA転写物から誘導される核酸とは、その合成のためにmRNA転写物又はその部分配列が最終的に鋳型として働く核酸を指す。したがって、mRNAから逆転写されたcDNA、該cDNAから増幅されたDNA、増幅されたDNAから転写されたRNA等は全てmRNA転写物から誘導される。RNAは、当分野で既知の方法、例えば、PreAnalytiXから入手できるPAXgene(登録商標) Blood RNAシステムを使用する未分画全血からのRNA単離を利用して、幾つかの身体組織のいずれかから単離できる。典型的にはmRNAを用いてcDNAを逆転写し、次いでそれを遺伝子変異解析のために使用又は増幅する。
【0058】
ゲノムプロファイル解析に先立ち、典型的には遺伝子試料を、DNA又はRNAから逆転写されたcDNAのいずれかから増幅する。DNAは幾つかの方法で増幅でき、その多くはPCRを使用する。例えば、PCR Technology: Principles and Applications for DNA Amplification(Ed. H.A.Erlich, Freeman Press, NY, N.Y., 1992);PCR Protocols: A Guide to Methods and Applications(Eds. Innis, et al., Academic Press, San Diego, Calif., 1990);Mattila et al., Nucleic Acids Res. 19, 4967(1991);Eckert et al., PCR Methods and Applications 1, 17(1991);PCR(Eds. McPherson et al., IRL Press, Oxford);及び米国特許第4683202、4683195、4800159、4965188及び5333675号を参照されたく、これらの各々は引用によりその全内容を本明細書の一部とする。
【0059】
その他の好適な増幅法には、リガーゼ連鎖反応(LCR)(例えばWu and Wallace, Genomics 4, 560(1989)、Landegren et al., Science 241, 1077(1988)及びBarringer et al., Gene 89:117(1990))、転写増幅(Kwoh et al., Proc. Natl. Acad. Sci. USA, 86:1173-1177(1989)及びWO88/10315)、自己持続配列複製(Guatelli et al., Proc. Natl. Acad. Sci. USA, 87:1874-1878(1990)及びWO90/06995)、標的ポリヌクレオチド配列の選択的増幅(米国特許第6410276号)、コンセンサス配列プライムドポリメラーゼ連鎖反応(CP−PCR)(米国特許第4437975号)、任意にプライムされるポリメラーゼ連鎖反応(AP−PCR)(米国特許第5413909、5861245号)、核酸に基づく配列増幅(NABSA)、ローリングサークル増幅(RCA)、多置換増幅(MDA)(米国特許第6124120及び6323009号)及びサークル−トゥー−サークル増幅(C2CA)(Dahl et al., Proc. Natl. Acad. Sci., 101:4548-4553(2004))がある。(米国特許第5409818、5554517、及び6063603号を参照されたく、これらの各々は引用により本明細書の一部とする。)利用できるその他の増幅法は、米国特許第5242794、5494810、5409818、4988617、6063603及び5554517号ならびに米国特許出願第09/854317号に記載されており、これらの各々を引用して本明細書の一部とする。
【0060】
工程106におけるゲノムプロファイルの作製は、幾つかの方法のうちいずれかを用いて実施する。ゲノムプロファイルの作製は幾つかの方法のうちいずれかを用いて実施できる。遺伝子変異を特定する方法は当分野で幾つか知られており、幾つかの方法のうちいずれかによるDNA配列決定、PCRに基づく方法、フラグメント長多型アッセイ(制限フラグメント長多型(RFLP)、開裂フラグメント長多型(CFLP))、鋳型としてアレル特異的オリゴヌクレオチドを使用するハイブリダイゼーション法(例えばTaqManアッセイ及びマイクロアレイ。本明細書で後ほど述べる。)、プライマー伸張反応を用いる方法、質量分析(例えばMALDI−TOF/MS法)等があるが(例えばKwok, Pharmocogenomics 1:95-100(2000)に記載されている)、これらに限定される訳ではない。その他の方法には、インベーダー法、例えばモノプレックス及びバイプレックスインベーダーアッセイ(例えばThird Wave Technologies, Madison, WIより入手でき、Olivier et al., Nucl. Acids Res. 30:e53(2002)に記載されている)がある。
【0061】
或る態様では、SNPの特定及びプロファイル作製に高密度DNAアレイを使用する。このようなアレイは、Affymetrix及びIllumina(Affymetrix GeneChip(登録商標) 500K Assay Manual(Affymetrix, Santa Clara, CA)(引用により本明細書の一部とする);Sentrix(登録商標) humanHap650Y遺伝子型決定ビーズチップ(Illumina, San Diego, CA)を参照されたい)から市販されている。
【0062】
例えば、SNPプロファイルは、Affymetrix Genome Wide Human SNP Array 6.0を用いて900000以上のSNPを遺伝子型決定することにより作製できる。或いは、Affymetrix GeneChip Human Mapping 500K Array Setを用いることにより、全ゲノムサンプリング解析を通じて500000以上のSNPを決定できる。これらのアッセイでは、ヒトゲノムの小集団を、制限酵素消化されアダプターライゲーションされたヒトゲノムDNAを用いる単一プライマー増幅反応によって増幅する。次いで、図2に示すように、ライゲーションされたDNAの濃度を測定する。次に、増幅されたDNAをフラグメント化し、試料の品質を決定した後、工程106に進む。試料がPCR及びフラグメント化基準に合致していたならば、その試料を変性させ、標識し、次いで、被覆された石英表面の特定位置にある小DNAプローブで構成されるマイクロアレイにハイブリダイズさせる。増幅されたDNA配列の関数として、各プローブにハイブリダイズする標識の量を監視し、それにより、配列情報及び得られるSNP遺伝子型を求める。
【0063】
製造者の指示に従ってAffymetrix GeneChip 500K Assayを使用する。簡潔に述べると、まず、単離されたゲノムDNAをNspI又はStyI制限エンドヌクレアーゼのいずれかで消化する。次に、消化されたこのDNAを、それぞれNspI又はStyI制限消化されたDNAとアニーリングするNspI又はStyIアダプターオリゴヌクレオチドとライゲーションする。次いで、ライゲーション後のアダプター含有DNAをPCR増幅し、約200〜1100塩基対(ゲル電気泳動で確認)の増幅DNAフラグメントを得る。増幅基準に合致するPCR生成物をフラグメント化のために精製及び定量する。このPCR生成物を、最適なDNAチップハイブリダイゼーションのためにDNaseでフラグメント化する。フラグメント化の後、ゲル電気泳動で確認したところ、DNAフラグメントは250塩基対未満であり、平均して約180塩基対である。次に、フラグメント化基準に合致する試料をターミナルデオキシヌクレオチジルトランスフェラーゼを用いてビオチン化合物で標識する。次いでこの標識されたフラグメントを変性させ、GeneChip 250Kアレイにハイブリダイズさせる。ハイブリダイゼーション後、アレイを染色し、ストレプトアビジン・フィコエリスリン(SAPE)染色、次いでビオチン化抗ストレプトアビジン抗体(ヤギ)による抗体増幅工程、及びストレプトアビジン・フィコエリスリン(SAPE)による最終染色より成る三工程プロセスでスキャンする。標識の後、アレイをアレイ保持緩衝液で被覆し、Affymetrix GeneChip Scanner 3000のようなスキャナーでスキャンする。
【0064】
図3に示すように、製造者の指針に従い、Affymetrix GeneChip Human Mapping 500K Array Setのスキャンに従うデータの解析を実施する。簡潔に述べると、GeneChipオペレーティングソフト(GCOS)を用いて生データを獲得する。Affymetrix GeneChip Command Console(登録商標)を用いてデータを獲得することもできる。生データを獲得した後、GeneChip遺伝子型解析ソフト(GTYPE)で解析を行う。本開示の目的のため、80%を下回るGTYPEコールレートの試料は除外する。次に試料をBRLMM及び/又はSNiPerアルゴリズム解析で調べる。95%未満のBRLMMコールレート又は98%未満のSNiPerコールレートの試料は除外する。最後に関連性解析を行い、0.45未満のSNiPer品質指数及び/又は0.00001未満のHardy-Weinberg p値を有する試料を除外する。
【0065】
DNAマイクロアレイ解析に代わって、又はこれに加えて、別のハイブリダイゼーションに基づく方法、例えばTaqMan法及びその変法を使用することにより、SNP及び突然変異のような遺伝子変異が検出できる。TaqManPCR、反復TaqMan、及び実時間PCR(RT−PCR)のその他の変法(例えばLivak et al., Nature Genet., 9, 341-32(1995)及びRanade et al., Genome Res., 11, 1262-1268(2001)に記載されている)を本明細書に開示する方法に利用できる。幾つかの態様では、特定の遺伝子変異、例えばSNPのためのプローブを標識してTaqManプローブを作製する。このプローブは、典型的には少なくともおよそ12、15、18又は20塩基対の長さである。これらは大体10〜70、15〜60、20〜60、又は18〜22塩基対長であってよい。このプローブを、リポーター標識、例えばフルオロフォアで5’末端を、そして3’末端を該標識のクエンチャーで標識する。リポーター標識は、クエンチャーに非常に接近すると、例えば該プローブの長さ程に接近するとその蛍光が阻害又は消光される任意の蛍光分子であってよい。例えばリポーター標識は、6−カルボキシフルオレセイン(FAM)、テトラクロロフルオレセイン(TET)、又はそれらの誘導体のようなフルオロフォアであってよく、クエンチャーはテトラメチルローダミン(TAMRA)、ジヒドロシクロピロロインドールトリペプチド(MGB)又はそれらの誘導体であってよい。
【0066】
リポーターフルオロフォア及びクエンチャーがプローブの長さ分だけ隔てられて接近すると、蛍光が消光する。プローブが標的配列、例えば試料中のSNPを含む配列とアニーリングする時、5’から3’へのエキソヌクレアーゼ活性を持つDNAポリメラーゼ、例えばTaqポリメラーゼがプライマーを伸張させ、エキソヌクレアーゼ活性がプローブを開裂させ、リポーターをクエンチャーから分離し、その結果リポーターが蛍光を発する。このプロセスは例えばRT−PCRにおいて反復される。TaqManプローブは、典型的には、配列を増幅させるべく設計された2つのプライマー間に位置する標的配列と相補的である。したがって、各プローブが新たに作製されたPCR生成物とハイブリダイズできるため、PCR生成物の蓄積が、放出されるフルオロフォアの蓄積と相関し得る。放出されるフルオロフォアを測定し、存在する標的配列の量を決定できる。ハイスループット遺伝型決定のためのRT−PCR法を利用できる。
【0067】
遺伝子変異はDNA配列決定によっても特定できる。DNA配列決定を利用して個体のゲノム配列の実質的な部分、又は全体を配列決定できる。伝統的には、一般的DNA配列決定は、ポリアクリルアミドゲル分画化に基づいて鎖終止フラグメントの集団を分解してきた(Sanger et al., Proc. Natl. Acad. Sci. USA 74:5463-5467(1977))。DNA配列決定の速度及び容易さを高める代替方法が開発されており、且つその開発が続いている。例えば、ハイスループット及び単分子配列決定プラットフォームが454 Life Sciences(Branford, CT)(Margulies et al., Nature 437:376-380(2005));Solexa(Hayward, CA);Helicos BioSciences Corporation(Cambridge, MA)(米国特許出願第11/167046号(2005年6月23日出願))、及びLi-Cor Biosciences(Lincoln, NE)(米国特許出願第11/118031号(2005年4月29日出願))から市販されているか、又は開発中である。
【0068】
工程106で個体のゲノムプロファイルを作製した後、工程108でこのプロファイルをデジタル保存するが、その結果こうしたプロファイルは安全な方法でデジタル保存できる。このゲノムプロファイルを、データセットの一部として保存するためにコンピューター読み取り可能なフォーマットでコード化してデータベースとして保存するが、その場合、ゲノムプロファイルは「貯蔵」され、後に再びアクセスすることができる。このデータセットは複数のデータ点を含んでなり、ここで各データ点は或る個体に関連している。各データ点は複数のデータ要素を有し得る。1個のデータ要素はユニークな識別子であり、個体のゲノムプロファイルの特定に利用される。それはバーコードであってよい。別のデータ要素は遺伝子型情報、例えばSNP又は個体ゲノムのヌクレオチド配列である。遺伝子型情報に対応するデータ要素がデータ点に包含されていてもよい。例えば、遺伝子型情報がマイクロアレイ解析により特定されたSNPを含む場合、他のデータ要素は、マイクロアレイSNP識別番号、SNP rs番号、及び多型ヌクレオチドを包含するかも知れない。他のデータ要素は、遺伝子型情報の染色体位置、データの品質測定法、生データファイル、データの画像、及び抽出された強度スコアであってよい。
【0069】
身体的データ、医療データ、民族性、祖先、地理、性別、年齢、家族歴、既知の表現型、人口統計データ、暴露データ、ライフスタイルデータ、行動データ、及びその他の既知表現型等の個体の特異的因子もまたデータ要素として組み込むことができる。例えば因子には、個体の出生地、両親及び/又は祖父母、血縁者の祖先、居住地、祖先の居住地、環境条件、既知の健康状態、既知の薬物相互作用、家族の健康状態、ライフスタイル状況、食生活、運動習慣、結婚歴、及び身体測定値、例えば体重、身長、コレステロールレベル、心拍数、血圧、グルコースレベルならびに当分野で知られるその他の測定値が包含されるがこれらに限定される訳ではない。個体の血縁者又は祖先、例えば両親及び祖父母についての上記因子をデータ要素として組み込み、表現型又は状態に関する個体のリスクを決定するために利用することもできる。
【0070】
特別な因子が質問票又はその個体の健康管理者から得られることがある。その場合、「貯蔵された」プロファイルからの情報にアクセスし、希望に応じて利用することができる。例えば、個体の遺伝子型相関を最初に評価する場合、その個体の全情報(典型的には、ゲノム全体にわたる、又はゲノム全体から取得した、SNP又はその他のゲノム配列)が遺伝子型相関について解析される。その後の解析では、保存されもしくは貯蔵されたゲノムプロファイル由来の情報全体、又はその一部に、希望に応じて、又は必要に応じてアクセスすることができる。
【0071】
ゲノムプロファイルと遺伝子型相関のデータベースの比較
工程110では、科学文献から遺伝子型相関を取得する。遺伝子変異についての遺伝子型相関を、目的とする1又はそれ以上の表現型形質の有無について、そして遺伝子型プロファイルについて検査された個体集団の解析から決定する。次いで各々の遺伝子変異のアレル又はそのプロファイル中の多型を再検討し、特定アレルの有無が目的とする形質と関連しているかどうかを決定する。相関付けは標準的統計学的方法により実施でき、遺伝子変異及び表現型の特徴の間の統計学的に有意な相関を記録する。例えば、多型AのアレルA1の存在は心臓病と相関していることが決定づけられるかも知れない。さらなる例として、多型AにおけるアレルA1及び多型BにおけるアレルB1の共存が、癌のリスク増大に相関することが判明するかも知れない。解析結果は専門家の検討する文献に発表され、他の研究グループにより検証され、そして/又は専門家、例えば遺伝学者、統計学者、疫学者及び医師より成る委員会により解析され、さらには監督されるかも知れない。
【0072】
図4、5及び6は、ゲノムプロファイルに適用される規則の基礎とされ得る遺伝子型及び表現型の相関例である。例えば、図4A及びBでは、各列は表現型/遺伝子座/民族性に対応し、図4C〜Iは、これらの各列についての相関に関するさらなる情報を含む。一例として図4Aにおいて、図4Mに記載されるように短い表現型の名称の指標であるBCという「短い表現型名」は、乳癌の略語である。その遺伝子座の一般名である列BC 4では、遺伝子LSP1が乳癌に相関している。図4Cに示すように、この相関によって特定される公表された又は機能的なSNPはrs3817198であり、公表されているリスクアレルはCであり、非リスクアレルはTである。この公表されているSNP及びアレルは、刊行物、例えば図4E〜Gに記載の重要な公表文献によって特定されている。図4Eに記載のLSP1の例では、重要な公表文献はEaston et al., Nature 447:713-720(2007)である。
【0073】
或いは、相関は保存されたゲノムプロファイルから作製できる。例えば、保存されたゲノムプロファイルを持つ個体は、既知の表現型情報を同様に保存させることができる。この、保存されたゲノムプロファイル及び既知表現型の解析が、遺伝子型相関を産むかも知れない。一例として、保存ゲノムプロファイルを有する250例の個体が、過去に糖尿病と診断されているという保存された情報をも持っている。それらのゲノムプロファイルの解析を行い、糖尿病のない対照個体群と比較する。次に、過去に糖尿病と診断された個体が、対照群と比較して特定の遺伝子変異体を有する率が高いことを決定づけ、その特定遺伝子変異体及び糖尿病の間に遺伝子型相関が作製され得る。
【0074】
工程112では、特定表現型に対する遺伝子変異体の検証された相関に基づいて規則を作製する。規則は、例えば表1に列挙したように、相関している遺伝子型及び表現型に基づいて作製できる。相関に基づく規則は、図4及び5に記載のような効果推定値を作製するため、性別(例えば図4)又は民族性(図4及び5)といった他の因子を組み込むことができる。規則から導かれる他の尺度には、図6に記載のような相対リスク上昇推定値がある。効果推定値及び相対リスク上昇推定値は、公表文献によるものであってよく、又はその公表文献から算出されるものであってよい。或いは、規則は、保存されているゲノムプロファイル及び過去に判明した表現型から作製される相関に基づいていてもよい。
【0075】
好ましい態様では、遺伝子変異はSNPである。SNPは単一の部位に存在するが、
1個の部位に或るSNPアレルを有する個体はしばしば別の部位に特定のSNPアレルを有すると予想される。SNPと、個体を疾患又は状態に陥らせ易くするアレルの相関は、連鎖不均衡によって起こり、その場合、2又はそれ以上の遺伝子座におけるアレルの非ランダムな関連性が、組換えを介したランダムな形成から予想されるよりも、程度の差はあるものの、より頻繁に集団に起こる。
【0076】
その他の遺伝子マーカー又は変異体、例えばヌクレオチド反復又は挿入もまた、特定の表現型と関連していることが示されている遺伝子マーカーと連鎖不均衡であることがある。例えば、或るヌクレオチド挿入が或る表現型に相関し、或るSNPがそのヌクレオチド挿入と連鎖不均衡にある。このSNP及び表現型の間の相関に基づいて規則が作製される。このヌクレオチド挿入及び表現型の間の相関に基づく規則もまた作製できる。1個のSNPの存在が或るリスクファクターを与え、別のSNPが別のリスクファクターを与え、そしてそれらが合した時、リスクが増強し得るといったように、いずれかの規則又は両方の規則をゲノムプロファイルに適用できる。
【0077】
連鎖不均衡を通じて、或る疾患の素因となるアレルは、SNPの特定アレル又はSNPの特定アレルの組み合わせと一緒に分離する。染色体に沿ったSNPアレルの特定の組み合わせをハプロタイプと称し、それらが組み合わさって存在するDNA領域をハプロタイプブロックと称することができる。ハプロタイプブロックは1個のSNPで構成され得るが、典型的にはハプロタイプブロックは、個体間でのハプロタイプ多様性の低い、且つ一般に組換え頻度の低い、連続した2又はそれ以上のSNPを表す。ハプロタイプの特定は、或るハプロタイプブロックに存在する1又はそれ以上のSNPを特定することによって行うことができる。したがって、典型的にはSNPプロファイルを使用して、与えられたハプロタイプブロック中の全SNPの特定を必ずしも必要とせずに、ハプロタイプブロックの特定を行うことができる。
【0078】
SNPハプロタイプパターンと疾患、状態又は身体状態の間の遺伝子型相関が次第に判明しつつある。所定の疾患について、その疾患を有するとわかっている人々の群のハプロタイプパターンを、該疾患を持たない人々の群と比較する。多くの個体を解析することにより、集団における多型の頻度を決定し、次にそれらの頻度又は遺伝子型を特定表現型、例えば疾患又は状態と関連づけることができる。既知のSNP−疾患相関の例には、加齢性黄斑変性症における補体因子Hの多型(Klein et al., Science: 308:385-389(2005))及び肥満に関連するINS(登録商標)IG2遺伝子近傍の変異体(Herbert et al., Science: 312:279-283(2006))がある。その他の既知SNP相関には、CDKN2A及びBを包含する9p21領域の多型、例えば心筋梗塞に相関するrs10757274、rs2383206、rs13333040、rs2383207、及びrs10116277がある(Helgadottir et al., Science 316;1491-1493(2007);McPherson et al., Science 316:1488-1491(2007))。
【0079】
SNPは機能的であることも非機能的であることもある。例えば、機能的SNPは細胞機能に影響を及ぼし、それにより表現型を産むが、それに対して非機能的SNPは、機能の点で沈黙しているが機能的SNPと連鎖不均衡にあることがある。SNPは同義的であることも非同義的であることもある。同義的であるSNPとは、異なった形態が同じポリペプチド配列を導くSNP、及び非機能的SNPである。SNPが異なるポリペプチドを導く場合、そのSNPは非同義的であり、機能的であることもそうでないこともある。2又はそれ以上のハプロタイプであるディプロタイプの中のハプロタイプを特定するのに用いられるSNP又はその他の遺伝子マーカーもまた、ディプロタイプに関連する表現型の相関付けに利用できる。個体のハプロタイプ、ディプロタイプ、及びSNPプロファイルについての情報は、その個体のゲノムプロファイル中にあり得る。
【0080】
好ましい態様では、或る表現型と相関している別の遺伝子マーカーと連鎖不均衡にある遺伝子マーカーに基づいて規則が作製されるためには、その遺伝子マーカーは、当分野において連鎖不均衡を決定するために一般的に利用されるスコアである、r2又はD’スコアが0.5より大であるかも知れない。好ましい態様では、このスコアは0.6、0.7、0.8、0.90、0.95又は0.99より大である。その結果、本開示において、個体のゲノムプロファイルに表現型を相関させるために用いられる遺伝子マーカーは、表現型と相関する機能的又は公表されたSNPと同じであってもよいし異なっていてもよい。例えば、BC 4を使用すると、被験SNP及び公表SNPは同一であり、被験リスク及び非リスクアレルもまた公表されたリスク及び非リスクアレルと同一である(図4A及びC)。しかしながらBC 5、CASP8及び乳癌に対するその相関については、被験SNPはその機能的又は公表SNPと相違しており、公表されたリスク及び非リスクアレルに対する被験リスク及び非リスクアレルもまた異なっている。被験及び公表アレルは、ゲノムのプラス鎖の向きにあり、これらの事から、ホモ接合性のリスク又は非リスク遺伝子型が推論され、それは、個体、例えば契約者のゲノムプロファイルに適用される規則を生み出すことがある。
【0081】
被験SNPは「DIRECT」又は「TAG」SNPであってよい(図4E〜G、図5)。直接的SNPは、公表された又は機能的SNP、例えばBC 4と同じ被験SNPである。直接的SNPはさらに、ヨーロッパ人及びアジア人におけるSNP rs1073640(マイナーなアレルはAであり、他のアレルはGである)を利用して、FGFR2と乳癌との相関にも利用できる(Easton et al., Nature 447:1087-1093(2007))。やはりヨーロッパ人及びアジア人におけるFGFR2と乳癌の相関に対するもう一つの公表された又は機能的SNPはrs1219648である(Hunter et al., Nat. Genet. 39:870-874(2007))。タグSNPは、BC 5のように、被験SNPが機能的又は公表SNPのそれと相違している場所である。タグSNPは、CAMTA1(rs4908449)、9p21(rs10757274、rs2383206、rs13333040、rs2383207、rs10116277)、COL1A1(rs1800012)、FVL(rs6025)、HLA−DQA1(rs4988889、rs2588331)、eNOS(rs1799983)、MTHFR(rs1801133)、及びAPC(rs28933380)のSNPのようなその他の遺伝子変異体にも利用できる。
【0082】
SNPのデータベースは、例えば国際HapMapプロジェクト(www.hapmap.org、The International HapMap Consortium, Nature 426:789-796(2003)、及びThe International HapMap Consortium, Nature 437:1299-1320(2005)を参照されたい)、the Human Gene Mutation Database(HGMD)公開データベース(www.hgmd.orgを参照されたい)、及びSingle Nucleotide Polymorphismデータベース(dbSNP)(www.ncbi.nlm.nih.gov/SNP/を参照されたい)から公的に入手できる。これらのデータベースは、SNPハプロタイプを提供し、又はSNPハプロタイプパターンの決定を可能にする。したがって、これらのSNPデータベースにより、広範囲の疾患及び状態、例えば癌、炎症性疾患、心血管疾患、神経変性疾患、及び感染性疾患の根底に存在する遺伝子リスクファクターを調査することができる。その疾患又は状態は、処置及び治療法が現在存在する、対応可能なものであるかも知れない。処置には、予防的処置、ならびにライフスタイルの変更を包含する、症状及び状態を改善する処置が包含され得る。
【0083】
身体的形質、生理的形質、精神的形質、情緒的形質、民族性、祖先、及び年齢といったその他多くの表現型もまた調べることができる。身体的形質には、身長、髪の色、眼の色、身体、又は持久力、耐久力、及び敏捷性のような形質がある。精神的形質には、知性、記憶力、又は学習能力がある。民族性及び祖先には、祖先もしくは民族の特定、又は個体の祖先の起源がどこであるかが包含される。年齢は、個体の実年齢の確定であることもあり、又は、個体の遺伝的特徴が一般集団に対して該個体を位置づける年齢の決定であることもある。例えば、個体の実年齢は38歳であるが、その遺伝的特徴は、記憶力や身体の健康が平均28歳のものであると決定づけることがある。もう一つの年齢形質は、個体の推定寿命であり得る。
【0084】
別の表現型は、非医学的状態、例えば「楽しみ」の表現型を包含し得る。これらの表現型は、周知の個体、例えば外国の要人、政治家、著名人、発明家、運動選手、音楽家、芸術家、実業家、及び有名でない個体、例えば囚人との比較を包含し得る。その他の「楽しみ」の表現型は、他の生物、例えば細菌、昆虫、植物、又はヒト以外の動物との比較を包含し得る。例えば、個体は、自身のゲノムプロファイルが自分達のペットの犬や元大統領のゲノムプロファイルと比較してどうなのかを知ることに興味を持つかも知れない。
【0085】
工程114では、保存されたゲノムプロファイルに規則を適用して、工程116の表現型プロファイルを作製する。例えば、図4、5又は6に記載の情報は、個体のゲノムプロファイルに適用するための規則又は試験の基礎を形成し得る。この規則は、被験SNP及びアレルに関する情報、及び図4の効果推定値を包含でき、ここで、効果推定値のUNITSとは、効果推定値の単位、例えばOR、又はオッズ比(95%信頼区間)もしくは平均値である。効果推定値は好ましい態様における遺伝子型リスク(図4C〜G)、例えばホモ接合体にとってのリスク(homoz又はRR)、ヘテロ接合体のリスク(heteroz又はRN)、及びホモ接合体の非リスク(homoz又はNN)であってよい。別の態様では、効果推定値は保因者のリスクであってよく、それはRR又はRN対NNである。さらに別の態様では、効果推定値は、アレル、R対Nといったアレルリスクに基づいていてよい。二遺伝子座(図4J)又は三遺伝子座(図4K)の遺伝子型効果推定値(例えば、二遺伝子座効果推定値のための9個の可能な遺伝子型組み合わせについてはRRRR、RRNN等)もあり得る。公表HapMap中の被験SNP頻度もまた図4H及びIに記載する。
【0086】
或る状態についての推定リスクは、米国特許出願公開第20080131887号及びPCT公報第WO2008/067551号に列挙されるSNPに基づくものであってよい。幾つかの態様では、或る状態についてのリスクは少なくとも1個のSNPに基づくものであってよい。例えば、アルツハイマー(AD)、結腸直腸癌(CRC)、変形性関節症(OA)又は落屑性緑内障(XFG)についての個体リスク評価は1SNPに基づくものであり得る(例えば、ADについてはrs4420638、CRCについてはrs6983267、OAについてはrs4911178、そしてXFGについてはrs2165241)。肥満(BMIOB)、バセドウ病(GD)、又はヘモクロマトーシス(HEM)のようなその他の状態については、個体の推定リスクは少なくとも1又は2個のSNPに基づくものであり得る(例えば、BMIOBについてはrs9939609及び/又はrs9291171;GDについてはDRB1*0301 DQA1*0501及び/又はrs3087243;HEMについてはrs1800562及び/又はrs129128)。心筋梗塞(MI)、多発性硬化症(MS)、又は乾癬(PS)といった(但しこれらに限定されない)状態については、1、2、又は3個のSNPを利用してこれらの状態についての個体リスクを評価できる(例えば、MIについてはrs1866389、rs1333049、及び/又はrs6922269;MSについてはrs6897932、rs12722489、及び/又はDRB1*1501;PSについてはrs6859018、rs11209026、及び/又はHLAC*0602)。レストレスレッグス症候群(RLS)又はセリアック病(CelD)の個体リスク評価には、1、2、3、又は4個のSNP(例えば、RLSについてはrs6904723、rs2300478、rs1026732、及び/又はrs9296249;CelDについてはrs6840978、rs11571315、rs2187668、及び/又はDQA1*0301 DQB1*0302)。前立腺癌(PC)又は狼瘡(SLE)については、1、2、3、4、又は5個のSNPを利用してPC又はSLEの個体リスクを評価できる(例えば、PCについてはrs4242384、rs6983267、rs16901979、rs17765344、及び/又はrs4430796;SLEについてはrs12531711、rs10954213、rs2004640、DRB1*0301、及び/又はDRB1*1501)。個体の黄斑変性症(AMD)又は関節リウマチ(RA)についての生涯リスクを評価するには、1、2、3、4、5、又は6個のSNPを利用できる(例えば、AMDについてはrs10737680、rs10490924、rs541862、rs2230199、rs1061170、及び/又はrs9332739;RAについてはrs6679677、rs11203367、rs6457617、DRB*0101、DRB1*0401、1*0404)。個体の乳癌(BC)についての生涯リスクを評価するには、1、2、3、4、5、6又は7個のSNPを利用できる(例えばrs3803662、rs2981582、rs4700485、rs3817198、rs17468277、rs6721996及び/又はrs3803662)。個体のクローン病(CD)又は2型糖尿病(T2D)についての生涯リスクを評価するには、1、2、3、4、5、6、7、8、9、10、又は11個のSNPを利用できる(例えば、CDについてはrs2066845、rs5743293、rs10883365、rs17234657、rs10210302、rs9858542、rs11805303、rs1000113、rs17221417、rs2542151、及び/又はrs10761659;T2Dについてはrs13266634、rs4506565、rs10012946、rs7756992、rs10811661、rs12288738、rs8050136、rs1111875、rs4402960、rs5215、及び/又は1801282)。幾つかの態様では、リスク決定の基礎として使用されるSNPは、上記のSNP、又は米国特許公報第20080131887号又はPCT公報第WO2008/067551号に記載のようなその他のSNPと連鎖不均衡にあるかも知れない。
【0087】
個体の表現型プロファイルは幾つかの表現型を含み得る。特に、本開示方法による、疾患、又は、代謝、有効性及び/又は安全性を包含する起こり得る薬物反応といったその他の状態についての患者のリスク評価は、症状のある、又は発症前の、又は症状のない個体の如何に拘わらず、1又はそれ以上の疾患/状態誘発アレルの保因者を包含する個体において、症状のある、又は発症前の、又は症状のない個体における、複数の無関係の疾患及び状態への感受性の予測的又は診断的解析を可能にする。したがって、これらの方法は、特定の疾患又は状態の検査についての先入観無しに、疾患又は状態に対する個体の感受性の一般評価を提供する。例えば、本開示の方法は、個体のゲノムプロファイルに基づいて、表1、図4、5、又は6に列挙した幾つかの状態のうち任意のものに対するその個体の感受性評価を可能にする。この評価は好ましくは、それらの状態のうち2又はそれ以上、より好ましくはこれらの状態のうち3、4、5、10、20、50、100又はそれ以上についての情報を提供する。好ましい態様では、表現型プロファイルは、個体のゲノムプロファイルに少なくとも20の規則を適用することで導かれる。別の態様では、個体のゲノムプロファイルに少なくとも50の規則が適用される。表現型についての1個の規則を、単一遺伝子表現型に適用できる。1以上の規則を1個の表現型、例えば多遺伝子表現型又は単一遺伝子表現型に適用することもでき、この場合、1個の遺伝子の中にある複数の遺伝子変異体が、その表現型を持つ確率に影響する。
【0088】
個々の患者のゲノムプロファイルの初期スクリーニングの後に、さらなるヌクレオチド変異体が判明した場合、そのさらなるヌクレオチド変異体、例えばSNPと比較することにより、個体の遺伝子型相関の更新を行う(又はそれが取得できる)。例えば、新たな遺伝子型相関について科学文献を精査する、遺伝学分野において通常の技術を有する1又はそれ以上の人々が、工程110を、定期的に、例えば毎日、毎週、又は毎月実施することができる。次いでこの新たな遺伝子型相関を、一人又はそれ以上の当該分野の専門家より成る委員会がさらに検証できる。すると工程112もまた、検証された新たな相関に基づく新たな規則によって定期的に更新され得る。
【0089】
新たな規則は、既存の規則を持たない遺伝子型又は表現型を包含できる。例えば、いかなる表現型とも相関していない遺伝子型が、新たな又は既存の表現型と相関していることが発見される。新たな規則はさらに、いかなる遺伝子型も過去に相関していなかった表現型との相関についてのものであるかも知れない。新たな規則はさらに、既存の規則を有する遺伝子型及び表現型について決定されるかも知れない。例えば、遺伝子型A及び表現型Aの間の相関に基づく規則が存在する。新たな研究により、遺伝子型Bが表現型Aと相関することが明らかとなり、この相関に基づいて新たな規則が作られる。別の例は、表現型Bが遺伝子型Aに関連していることが発見され、それに従い新たな規則が作製できる。
【0090】
既知の、但し公表された科学文献では当初特定されていなかった相関に基づく発見に関して規則が作られることもある。例えば、遺伝子型Cが表現型Cと相関していることが報告される。別の刊行物は、遺伝子型Dが表現型Dと相関していることを報告する。表現型C及びDは関連症状、例えば表現型Cが息切れであり、表現型Dが小さな肺活量である。遺伝子型C及びD、ならびに表現型C及びDを持つ個体の既存の保存ゲノムプロファイルを用いる統計手段によって、又はさらなる研究によって、遺伝子型C及び表現型D、又は遺伝子型Dと表現型Cの間の相関が発見され検証される。すると新たに発見され検証された相関に基づき、新たな規則が作製できる。別の態様では、特定の又は関連する表現型を持つ幾つかの個体の保存ゲノムプロファイルを調査し、それらの個体に共通の遺伝子型を決定し、相関を決定できる。この相関に基づき新たな規則を作製できる。
【0091】
既存の規則を改変するために規則が作製されることもある。例えば、遺伝子型及び表現型の間の相関は、個体の既知の特徴、例えば該個体の民族性、祖先、地理、性別、年齢、家族歴、又はその他任意の既知表現型によって部分的に決定できる。これら既知の個体の特徴に基づいて規則を作製し、既存の規則に組み込み、改変された規則を提供することができる。適用されるべき改変規則の選択は、個体の特定の因子に依存するであろう。例えば、或る個体が遺伝子型Eを有する場合、表現型Eを有する個体が35%であるという確率に基づいて規則を作製できる。しかしながら、或る個体が特定の民族性を有する場合、その確率は5%である。この結果に基づいて新たな規則を作製し、その特定の民族性を持つ個体に適用することができる。或いは、35%という決定を含む既存の規則を適用し、次に該表現型について、民族性に基づく別の規則を適用することもできる。既知の個体の特徴に基づく規則は科学文献から決定でき、又は保存されたゲノムプロファイルの研究に基づいて決定することもできる。新たな規則が作製された時に工程114においてゲノムプロファイルにその新たな規則を付け加え且つ適用してもよいし、それらを定期的に、例えば少なくとも1年に1回適用してもよい。
【0092】
科学技術の進歩がより洗練されたSNPゲノムプロファイルの解明を可能にしているため、個体の疾患リスクの情報もまた拡大され得る。上に指摘したように、初期SNPゲノムプロファイルは500000個のSNPをスキャンするマイクロアレイ技術を用いて容易に作製できる。ハプロタイプブロックの性質を考慮すると、この数によって、個体ゲノム中の全SNPの代表プロファイルの取得が可能である。とは言え、ヒトゲノムにはおよそ1000万個のSNPが存在すると推定されている(国際HapMapプロジェクト; www.hapmap.org)。1000000、1500000、2000000、3000000、もしくはそれ以上のSNPのマイクロアレイ、又は全ゲノム配列決定といったように、科学技術の進歩が実用的で費用効率の高いSNPの解析をより洗練された詳細度で可能にするため、より詳細なSNPゲノムプロファイルが作製できる。同様に、費用効率の高い、より洗練されたSNPゲノムプロファイル解析及びSNP−疾患相関のマスターデータベースへの更新が、コンピューター解析法の進歩によって可能となる。
【0093】
工程116での表現型プロファイル作製の後、工程118に示すように、契約者又はその健康管理者は、オンラインポータル又はウェブサイトを介して彼等のゲノム又は表現型プロファイルにアクセスできる。工程120及び122に示すように、表現型プロファイルを含む報告ならびに表現型及びゲノムプロファイルに関する他の情報もまた、契約者又はその健康管理者に提供される。この報告は、印刷され、契約者のコンピューターに保存され、又はオンラインで閲覧できる。
【0094】
オンライン報告の見本を図7に示す。契約者は、1個の表現型又は1以上の表現型を表示させることを選択できる。契約者にはまた、種々の閲覧選択肢、例えば図7に示すように「迅速閲覧」選択肢があるかも知れない。表現型が医学的状態であり、この迅速報告中の様々な処置及び症状が、その処置についてのさらなる情報を含む他のウェブページにリンクしているかも知れない。例えば、薬剤の箇所をクリックすることにより、用法、費用、副作用、及び有効性についての情報を含むウェブサイトに導かれる。その薬剤を他の処置と比較することもできる。そのウェブサイトはさらに、その薬剤の製造者のウェブサイトにつながるリンクを含むかも知れない。別のリンクは、契約者が薬理ゲノム学的プロファイルを作製してもらう選択肢を提供でき、そのプロファイルは、契約者のゲノムプロファイルに基づく該薬剤に対して起こり得る反応等の情報を包含するであろう。予防措置、例えばフィットネス及び減量等の、薬剤の代替手段へのリンクもまた提供され、そして、ダイエット用サプリメント、ダイエット計画、及び近隣のヘルスクラブ、診療所、健康サービス提供者、日帰り入浴施設等へのリンクもまた提供され得る。教育及び情報ビデオ、利用可能な処置の要約、可能な治療法、及び一般的提言もまた提供され得る。
【0095】
オンライン報告はさらに、契約者に自身の表現型プロファイルに関するさらなる情報を求める機会を提供する、対面による医師との又は遺伝カウンセリング予約をスケジュールに入れるためのリンク、又は遺伝カウンセラーもしくは医師にオンラインでアクセスするためのリンクを提供できる。オンライン遺伝カウンセリング及び医師への質問へのリンクは、オンライン報告で提供されることもある。
【0096】
報告は、他のフォーマットで、例えば1個の表現型について総合的観点から閲覧することもでき、この場合、各カテゴリーのさらなる詳細が提供される。例えば、契約者が該表現型を発現する尤度についてのより詳細な統計、又は、典型的な症状もしくは表現型、例えば医学的状態の見本症状、又は身長のような身体の非医学的状態の範囲についてのさらなる情報、又は、遺伝子及び遺伝子変異体についてのさらなる情報、例えば集団における発生率、例えば全世界、もしくは様々な国、もしくは様々な年齢範囲もしくは性別における発生率についてのさらなる情報があるかも知れない。別の態様では、この報告は「楽しみ」の表現型についてのもの、例えば個体のゲノムプロファイルと有名人、例えばアルバート・アインシュタインのゲノムプロファイルの類似性についてのものであるかも知れない。この報告は、該個体のゲノムプロファイルとアインシュタインのゲノムプロファイルの類似性パーセントを表示し、さらに、アインシュタインと該個体の予想IQを表示することもできる。さらなる情報には、一般集団のゲノムプロファイルと彼等のIQを該個体及びアインシュタインのゲノムプロファイル及びIQと比較する方法が含まれるかも知れない。
【0097】
もう一つの態様では、報告は、契約者のゲノムプロファイルと相関する全表現型を表示できる。別の態様では、その報告は、或る個体のゲノムプロファイルと正の相関がある表現型のみを表示できる。別のフォーマットでは、該個体は、或る表現型のサブグループ、例えば医学的表現型のみ、又は実行可能な医学的表現型のみを表示させることを選択できる。例えば、実行可能な表現型及びそれらに相関する遺伝子型には、クローン病(IL23R及びCARD15に相関)、1型糖尿病(HLA−DR/DQに相関)、狼瘡(HLA−DRB1に相関)、乾癬(HLA−C)、多発性硬化症(HLA−DQA1)、バセドウ病(HLA−DRB1)、関節リウマチ(HLA−DRB1)、2型糖尿病(TCF7L2)、乳癌(BRCA2)、結腸癌(APC)、エピソード記憶(KIBRA)、及び骨粗鬆症(COL1A1)がある。該個体は、報告に、表現型の下位カテゴリー、例えば医学的状態として炎症性疾患のみを、又は非医学的状態として身体的形質のみを表示させるよう選択することもできる。
【0098】
個体が提出する、及び個体に伝達される情報は安全且つ秘密とすることができ、そのような情報へのアクセスは該個体により管理され得る。複雑なゲノムプロファイルから導かれる情報は、監督官庁により承認された、理解可能な、医学関連の、そして/又は衝撃的データとして該個体に供給され得る。情報は、一般的に関心が持たれ、医学関連でないこともある。情報は、ポータルインターフェース及び/又は郵送といった(但しこれらに限定されない)幾つかの手段によって安全に該個体に伝達できる。より好ましくは、該個体が安全且つ秘密にアクセスできるポータルインターフェースにより、情報が該個体に安全に(もし該個体がそれを選択したならば)提供される。そのようなインターフェースは、好ましくはオンライン、インターネットウェブサイトアクセスにより提供され、別法として、電話、又はプライベートで安全且つ容易に利用できるアクセスが可能なその他の手段により提供される。ゲノムプロファイル、表現型プロファイル、及び報告は、ネットワーク上でのデータ送信により、個体又はその健康管理者に提供される。
【0099】
したがって、図8は、それにより表現型プロファイル及び報告が作製される論理装置の代表例を示すブロック図である。図8は、ゲノムプロファイルを受信して保存し、遺伝子型相関を解析し、その遺伝子型相関解析に基づく規則を作製し、その規則をゲノムプロファイルに適用し、そして表現型プロファイル及び報告を作製する、コンピューターシステム(又はデジタル装置)800を示す。コンピューターシステム800は、メディア811及び/又はネットワークポート805(これは場合により、固定メディア812を有するサーバー809に接続することができる)からの指示を読み取る事のできる論理装置であると理解できる。図8に示すシステムは、CPU801、ディスクドライブ803、場合による入力装置、例えばキーボード815及び/又はマウス816及び場合によるモニター807を含む。データ通信は、示された通信メディアを通じてローカル又はリモート位置にあるサーバー809へと行うことができる。通信メディアは、任意のデータ送信及び/又は受信手段が包含され得る。例えば、通信メディアは、ネットワーク接続、ワイヤレス接続又はインターネット接続とすることができる。このような接続は、ワールド・ワイド・ウェブによる通信を提供できる。本開示に関するデータは、このようなネットワーク又は接続上で、当事者822が受信及び/又は検討するために送信できるということが想定されている。受信者822は、個体、契約者、健康管理提供者又は健康管理者であってよいが、これらに限定される訳ではない。或る態様では、コンピューター読み取り可能メディアは、生体試料又は遺伝子型相関の解析結果の送信に好適なメディアを包含する。このメディアは、個体対象の表現型プロファイルに関する結果を内包でき、ここで、そのような結果は本明細書に記載の方法を用いて誘導される。
【0100】
好ましくは個人ポータルが、個体がゲノムデータを受信し評価するための一次インターフェースとしての役割を有する。ポータルは、試料の、採集から検査及び結果に至る進行を、個体が追跡できるようにする。ポータルへのアクセスにより、個体に、彼等のゲノムプロファイルに基づく共通の遺伝疾患に対する相対リスクが伝えられる。契約者は、ゲノムプロファイルにどの規則を適用するかをポータルを通じて選択できる。
【0101】
或る態様では、1又はそれ以上のウェブページに表現型の一覧表があり、各表現型の隣に、契約者が自身の表現型プロファイルに含めることを選択できる囲みがある。表現型は、該表現型に関する情報にリンクしており、この情報は、契約者が自身の表現型プロファイルに含めることを望む表現型についてのインフォームド・チョイスを行う助けとなる。このウェブページはさらに、疾患群、例えば対処可能又は不可能な疾患として、表現型を体系づけてあるかも知れない。例えば契約者は、HLA−DQA1及びセリアック病といった対処可能な表現型のみを選択できる。契約者はまた、その表現型のための発症前又は発症後の処置を表示させることを選択できる。例えば、該個体は、セリアック病のための発症前処置(スクリーニング増大の他に)である、グルテン除去食という発症前処置のある対処可能な表現型を選択できる。もう一つの例は、スタチン、運動、ビタミン、及び精神活動というアルツハイマーの発症前処置である。血栓症はもう一つの例であり、経口避妊薬の回避及び長時間じっと座ることの回避という発症前処置がある。承認されている発症後処置のある表現型の一例は、CFHと相関している滲出型AMDであり、この場合、個体は該状態のためのレーザー処置を受けることができる。
【0102】
表現型を疾患又は状態の型又は種類、例えば神経系、心血管系、内分泌系、免疫系などによって体系づけることもできる。表現型を医学的及び非医学的表現型としてグループ分けすることもできる。ウェブページ上にあるその他の表現型のグループ分けには、身体的形質、生理的形質、精神的形質、又は情緒的形質によるものがある。ウェブページはさらに、1つの囲みを選ぶことにより表現型の1グループが選択されるセクションを提供できる。例えば、全表現型、医学関連表現型のみ、非医学関連表現型のみ、対処可能な表現型のみ、対処不可能な表現型のみ、異なる疾患群、又は「楽しみ」の表現型を選択することである。「楽しみ」の表現型は、著名人又はその他の有名な個体、又は他の動物もしくは他の生物との比較さえ包含できる。比較のために入手できるゲノムプロファイルの一覧表もまた、契約者が選択して自身のゲノムプロファイルと比較するために、ウェブページ上に提供され得る。
【0103】
オンラインポータルは、契約者がそのポータルをナビゲートし、特定の表現型を検索し、又は、特定の用語又は契約者の表現型プロファイルもしくは報告により明らかとなった情報を検索するのを助けるための検索エンジンをも提供できる。パートナーサービス及び製品提供にアクセスするリンクもまたポータルにより提供され得る。共通の又は類似の表現型を有する個体のためのサポートグループ、掲示板、及びチャットルームへのさらなるリンクもまた提供され得る。オンラインポータルはまた、契約者の表現型プロファイル中にある表現型に関するさらなる情報を記載する他のサイトへのリンクをも提供できる。オンラインポータルはまた、契約者が自身の表現型プロファイル及び報告を、友人、家族、又は健康管理者と共有できるサービスも提供できる。契約者は、表現型プロファイル中に明らかとなっているどの表現型を友人、家族、又は健康管理者と共有したいかを選択できる。
【0104】
表現型プロファイル及び報告は、個体に個人向け遺伝子型相関を提供する。個体に提供された遺伝子型相関を使用して、個人の健康管理及びライフスタイル選択を決定できる。遺伝子変異体及び処置が実行可能な疾患の間に強い相関が見出された場合、その遺伝子変異体の検出は、該疾患の処置及び/又は該個体の監視を開始する決定を助けるかも知れない。統計学的に有意な相関があるが強い相関ではないと思われる場合には、個体はその情報をかかりつけの医師と共に検討し、適切で有益な行動方針を決定できる。特定の遺伝子型相関の観点から個体にとって有益であると思われる行動指針には、治療処置の管理、処置の潜在的必要性もしくは処置の効果の監視、又は、食生活、運動、及びその他の個人的習慣/活動の点でライフスタイルを変えることが包含される。例えば、セリアック病のような対処可能な表現型には、グルテン除去食という発症前処置がある。同様に、遺伝子型相関情報を薬理ゲノム学を通じて適用し、特定の薬剤又は薬剤レジメンによる処置に対して個体が示すと予想される反応、例えば、特定の薬物処置の予想される有効性又は安全性を予測することができる。
【0105】
契約者は、自身の健康管理者、例えば医師又は遺伝カウンセラーにゲノムプロファイル及び表現型プロファイルを提供することを選択できる。このゲノムプロファイル及び表現型プロファイルは、健康管理者が直接アクセスでき、又は契約者が健康管理者に渡すコピーを印刷し、又はオンラインポータルを通じて、例えばオンライン報告書上のリンクによって健康管理者に直接送られるようにさせることができる。
【0106】
この関連情報の送達は、患者が医師と協力して行動する力を与えるであろう。特に、患者とその医師の話し合いは、個体のポータル及び医学情報へのリンク、ならびに患者のゲノム情報を彼等の医療記録へと結びつける能力によって力づけられる。医学情報は、予防及び健康情報を包含できる。本開示により患者個人に提供される情報によって、患者は自身の健康管理のためのインフォームド・チョイスを下せるようになる。このようにして、患者は、自身の個人的ゲノムプロファイル(遺伝的に継承されたDNA)が可能性を高めている疾患を回避及び/又は遅延させることを助ける選択を行えるであろう。加えて、患者は自身の特別な医学的ニーズに個人的に合致する処置レジメンを使用できるであろう。個体はさらに、万一疾病を発症し、医師が治療戦略を作製する助けとするためにこの情報が必要になった場合、自身の遺伝子型データにアクセスする能力を有するであろう。
【0107】
遺伝子型相関情報を遺伝カウンセリングと連携させて利用し、生殖ならびに母親、父親、及び/又は子供に対する潜在的な遺伝学上の懸念を考えているカップルに助言することができる。遺伝カウンセラーは情報を提供し、特定の状態又は疾患について高いリスクを示す表現型プロファイルを有する契約者をサポートすることができる。彼等はその障害についての情報を解釈し、遺伝パターン及び再現リスクを解析し、利用可能な選択肢を契約者と共に検討できる。遺伝カウンセラーはさらに、契約者を地域社会又は国のサポートサービスに紹介する、支持的カウンセリングを提供することもできる。遺伝カウンセリングには特別な契約プランが包含される。幾つかの態様では、遺伝カウンセリングは依頼から24時間以内にスケジュールが決められ、夜間、土曜、日曜、及び/又は祝日といった時間も利用できる。
【0108】
個人のポータルはさらに、初期のスクリーニングを超えたさらなる情報の送達を容易にする。個体は、自身の個人的遺伝子プロファイルに関する新たな科学的発見、例えば、自身の現在の又は潜在的な状態に対する新たな処置又は予防戦略に関する情報について知らされるであろう。この新たな発見はまた、彼等の健康管理者に送達されることもある。好ましい態様では、契約者又は彼等の健康管理提供者は、新たな遺伝子型相関及び契約者の表現型プロファイル中の表現型についての新たな研究について、eメールで知らされる。別の態様では、「楽しみ」の表現型についてのeメールが契約者に送信され、例えば、彼等のゲノムプロファイルがアブラハム・リンカーンのゲノムプロファイルと77%一致すること、そしてさらなる情報がオンラインポータルを通じて取得できることが、eメールで通知され得る。
【0109】
本開示はさらに、新たな規則を作製し、規則を改変し、規則を合し、規則の組を新たな規則によって定期的に更新し、ゲノムプロファイルのデータベースを安全に維持し、表現型プロファイルを決定するためにその規則をゲノムプロファイルに適用し、そして報告を作製するための、コンピューターコードのシステムを提供する。契約者に、新たな又は修正された相関、新たな又は修正された規則、ならびに例えば新たな予防及び健康情報、開発中の新たな治療法、又は利用可能な新しい処置を含む新たな又は修正された報告を通知するためのコンピューターコード。
ビジネス方法
【0110】
本開示は、患者のゲノムプロファイルを、確立された、医学に関連するヌクレオチド変異体の、臨床誘導されたデータベースと比較することに基づいた、個体の遺伝子型相関を評価するビジネス方法を提供する。本開示はさらに、当初知られていなかった新たな相関を評価するために、保存された個体のゲノムプロファイルを使用して、個体に別の生体試料の提出を要求することなく、更新された個体の表現型プロファイルを作製するビジネス方法を提供する。このビジネス方法を説明するフローチャートを図9に示す。
【0111】
最初に個体が、多数の一般的な人間の疾患、状態、及び身体状態について遺伝子型相関の個人的ゲノムプロファイルを請求及び購入する時、このビジネス方法の収益源が一部工程101において生み出される。依頼及び購入は、オンラインウェブポータル、オンライン保健サービス、及び個体のかかりつけ医師又は個人に医療処置を施す類似の施設を包含する(但しこれらに限定される訳ではない)様々なソースを通じて行うことができる。これに代わる態様では、ゲノムプロファイルが無料で提供され、収益源は工程103のような後の工程で生み出される。
【0112】
契約者又は顧客は、表現型プロファイルの購入を依頼する。依頼及び購入に応答して、工程103において顧客に遺伝子試料単離に用いられる生体試料採集キットが提供される。請求がオンライン、電話、又はその他の、顧客が採集キットを容易に物理的に入手できない手段で行われた場合には、迅速配送、例えば当日又は翌日配送できる宅配便により採集キットが提供される。この採集キットには、試料容器と共に、ゲノムプロファイル作製のため研究所に試料を迅速配送するための梱包剤が含まれている。キットにはさらに、その試料を、試料処理施設又は研究所に送付するための説明書、ならびに、顧客のゲノムプロファイル及び表現型プロファイルにアクセスする(これはオンラインポータルを通じて実施できる)ための説明書が含まれているかも知れない。
【0113】
上に詳説したように、ゲノムDNAは、幾つかのタイプの生体試料のうち任意のものから取得できる。好ましくは、ゲノムDNAは、例えばDNA Genotekから入手できる市販の採集キットを用いて唾液から単離する。顧客は、好都合なことに、採集キット内にあった容器に唾液試料を入れ、次いで容器をシールするのであるから、唾液及びこのようなキットを使用することにより、非侵襲性試料採集が可能である。加えて、唾液試料は室温で保存及び輸送できる。
【0114】
採集又は標本容器に生体試料を入れた後、工程105において顧客はこの試料を処理のために研究所へと送る。典型的には、顧客は、採集キット中に提供された梱包剤を使用して、試料を迅速配送、例えば当日又は翌日宅配便により研究所へ送達/送付することができる。
【0115】
試料を処理しゲノムプロファイルを作製する研究所は、適切な行政機関のガイドライン及び要件を遵守することができる。例えば米国では、処理する研究所は、食品医薬品局(FDA)又はメディケア・メディケイド・サービス・センター(CMS)のような1又はそれ以上の連邦政府関係機関及び/又は1又はそれ以上の州の機関によって規制されているかも知れない。米国では、臨床研究所は、1988年の臨床検査室改善修正法(CLIA)の下で認可承認される。
【0116】
工程107では、研究所が、前記のように試料を処理して、DNA又はRNAの遺伝子試料を単離する。次いで工程109においてこの単離された遺伝子試料の解析及びゲノムプロファイルの作製を実施する。好ましくはゲノムSNPプロファイルを作製する。上に述べたように、SNPプロファイルの作製には幾つかの方法が利用できる。好ましくは、高密度アレイ、例えばAffymetrix又はIllumina製の市販プラットフォームをSNPの特定及びプロファイル作製に使用する。例えばSNPプロファイルは、上でより詳細に記載したように、Affymetrix GeneChipアッセイを用いて作製できる。科学技術が発達するにつれて、高密度SNPプロファイルを作製できる他の技術供給メーカーが出るかも知れない。別の態様では、契約者のゲノムプロファイルは、契約者のゲノム配列である。
【0117】
個体のゲノムプロファイル作製の後、遺伝子型データを好ましくは暗号化し、工程111において取り込み、そして工程113において安全なデータベース又はヴォールトに寄託し、そこで将来の照会のためにその情報を保存する。ゲノムプロファイル及び関連情報は秘密とすることができ、この機密情報及びゲノムプロファイルへのアクセスは、該個体及び/又は彼もしくは彼女のかかりつけ医師の指示に従って限定される。その他の人間、例えば該個体の家族及び遺伝カウンセラーもまた契約者によりアクセスを許可されることがある。
【0118】
データベース又はヴォールトは処理する研究所の施設内にあってよい。或いはそのデータベースは別の場所にあるかも知れない。この場合、処理する研究所が作製したゲノムプロファイルデータは、工程111においてそのデータベースを有する別の施設へ持ち込まれる。
【0119】
個体のゲノムプロファイルを作製した後、工程115において、その個体の遺伝子変異を、確立された、医学に関連する遺伝子変異体の、臨床誘導されたデータベースと比較する。或いは、その遺伝子型相関は、例えば眼の色のような身体的形質、又は著名人とのゲノムプロファイルの類似性のような「楽しみ」の表現型といったように、医学に関連していないが、それでも尚、遺伝子型相関のデータベースに組み入れられるかも知れない。
【0120】
医学に関連したSNPは、科学文献及び関連情報源によって立証されたものであるかも知れない。非SNP遺伝子変異体もまた表現型と相関していることが立証されるかも知れない。一般に或る疾患に対するSNP相関は、その疾患を持つことがわかっている人々の群のハプロタイプパターンを、その疾患を持たない人々の群と比較することによって立証される。多くの個体を解析することにより、集団における多型の頻度を決定でき、一方これらの遺伝子型頻度を、特定の表現型、例えば疾患又は状態と関連付けることができる。或いは、この表現型は非医学的状態であるかも知れない。
【0121】
関連するSNP及び非SNP遺伝子変異体を、利用可能な公表文献によって決定するのではなく、保存された個体のゲノムプロファイルの解析を通じて決定することもできる。保存されたゲノムプロファイルを持つ個体は、過去に決定されている表現型を開示するかも知れない。個体の遺伝子型及び開示された表現型の解析を、その表現型を持たない個体と比較して相関を決定し、その後これを他のゲノムプロファイルに適用できる。自身のゲノムプロファイルを決定してもらった個体は、過去に決定されている表現型についての質問票に記入することがある。質問票には、医学的及び非医学的状態、例えば過去に診断された疾患、医学的状態の家族歴、ライフスタイル、身体的形質、精神的形質、社会生活、環境等についての質問が含まれる。
【0122】
或る態様では、個体は、質問票に記入した場合には自身のゲノムプロファイルを無料で決定してもらえるかも知れない。幾つかの態様では、自身の表現型プロファイル及び報告に自由にアクセスできるために、個体は定期的に質問票に記入することになっている。別の態様では、質問票に記入する個体は、例えば前の契約レベルより多くアクセスできる、又は、割引料金で契約を購入もしくは更新できる、等の、契約のアップグレード権を与えられる。
【0123】
工程121において医学関連遺伝子変異体のデータベースに寄託された全情報は、工程119で保証されたならば、まず、適切な行政機関により検討及び監督されると共に、科学的精確性及び重要性について研究/臨床諮問委員会により認可される。例えば米国では、FDAが遺伝子変異体(典型的にはSNP、転写レベル、又は突然変異)相関データの検証に利用されるアルゴリズムの承認を通じた監督を行う。工程123において、科学文献及びその他の関連情報源をさらなる遺伝子変異体と疾患又は状態の相関について監視し、それらの精確性及び重要性の検証ならびに行政機関の検討及び認可の後、工程125においてこれらの追加的遺伝子型相関をマスターデータベースに追加する。
【0124】
個体の全ゲノムプロファイルと組み合わせた、認可され検証された医学関連遺伝子変異体のデータベースによって、有利なことに、数多くの疾患又は状態について遺伝的リスク評価の実施が可能になる。個体のゲノムプロファイルを編集した後、個体のヌクレオチド(遺伝子)変異体又はマーカーを、特定表現型、例えば疾患、状態、又は身体的形質に相関したヒトヌクレオチド変異体のデータベースと比較することにより、個体の遺伝子型相関が決定できる。個体のゲノムプロファイルを遺伝子型相関のマスターデータベースと比較することにより、その個体は、或る遺伝的リスクファクターについて陽性又は陰性いずれであると判明したのか、そしてそれはどの程度であるのかを知らされる。個体は、広範囲の科学的に検証された疾患状態(例えば、アルツハイマー病、心血管疾患、血液凝固)についての相対リスク及び/又は素因のデータを受け取ることになるであろう。例えば、表1に記載の遺伝子型相関が包含される。さらに、データベース中のSNP疾患相関には、図4に示す相関が包含されるが、これらに限定される訳ではない。図5及び6に記載のその他の相関もまた包含される。故に本ビジネス方法は、それらの疾患及び状態がもたらし得るいかなる先入観も伴わずに、多数の疾患及び状態に対するリスクの解析を提供する。
【0125】
別の態様では、個体の全ゲノムプロファイルと組み合わされる遺伝子型相関は、非医学関連表現型、例えば「楽しみ」の表現型、又は毛髪の色のような身体的形質である。好ましい態様では、規則又は規則の組を、上記のように個体のゲノムプロファイル又はSNPプロファイルに適用する。ゲノムプロファイルへの規則の適用は、その個体の表現型プロファイルを産む。
【0126】
このようにして、新たな相関が発見され検証されると、ヒト遺伝子型相関のマスターデータベースが、さらなる遺伝子型相関によって拡大される。更新は、所望により、又は必要に応じて、データベース中に保存されている該個体のゲノムプロファイル由来の関連情報にアクセスすることによって実施できる。例えば、知られるようになった新たな遺伝子型相関は、特定の遺伝子変異体に基づくかも知れない。次いで個体がその新たな遺伝子型相関の影響を受け易いかどうかの決定を、その個体の全ゲノムプロファイルのうち当該遺伝子部分のみを取り出して比較することによって実施できる。
【0127】
好ましくはゲノムクエリーの結果を解析し、解釈して、わかり易いフォーマットでその個体に提示する。次いで工程117において、初期スクリーニングの結果を、上に詳説したように郵送又はオンラインポータルインターフェースを通じて安全な秘密の形態で患者に提供する。
【0128】
報告は、表現型プロファイル及びその表現型プロファイル中の表現型についてのゲノム情報、例えば、含まれる遺伝子についての基本的遺伝学又は異なる集団における遺伝子変異体の統計学を含み得る。報告に含まれ得る該表現型プロファイルに基づくその他の情報には、予防戦略、健康情報、治療法、症状の認識、早期検出計画、介入計画、及び該表現型の精確な特定及び下位分類がある。個体のゲノムプロファイルの初期スクリーニングに続いて、制御され管理された更新が実施され又は実施できる。
【0129】
新たな遺伝子型相関が出現し検証及び承認されると、マスターデータベースへの更新と共に個体のゲノムプロファイルの更新が行われ、それが利用可能となる。新たな遺伝子型相関に基づく新たな規則が初期のゲノムプロファイルに適用され、更新された表現型プロファイルが提供され得る。更新された遺伝子型相関プロファイルは、工程127において、該個体のゲノムプロファイルの関連部分を新たな遺伝子型相関と比較することによって作製できる。例えば、特定の遺伝子における変異に基づく新たな遺伝子型相関が発見されたならば、該個体のゲノムプロファイルのその遺伝子部分を新たな遺伝子型相関について解析することができる。そのような場合、既に適用されてしまった規則を含む規則の組全体ではなく1又はそれ以上の新たな規則を適用して更新された表現型プロファイルを作製できる。個体の更新された遺伝子型相関の結果は、工程129において安全な方法で提供される。
【0130】
初期及び更新表現型プロファイルは、契約者又は顧客に提供されるサービスである。ゲノムプロファイル解析に対する種々のレベルの契約及びそれらの組み合わせが提供され得る。同様に、契約レベルは、個体が自身の遺伝子型相関と共に受け取りを希望するサービス量の選択肢を個体に提供するために変わり得る。したがって、提供されるサービスレベルは個体が購入するサービスの契約レベルと共に変化するであろう。
【0131】
契約者にとって入門レベルの契約には、ゲノムプロファイル及び初期表現型プロファイルが含まれ得る。これは基本契約レベルである。この基本契約レベルの中に様々なサービスレベルがある。例えば、或る契約レベルは、遺伝カウンセリングの照会先、特定の疾患の予防又は処置に関する特別な見解を持つ医師、及びその他のサービス選択肢を提供できる。遺伝カウンセリングはオンライン又は電話で受けることができる。別の態様では、契約料金は個体が自身の表現型プロファイルとして選択する表現型の数によって変わり得る。別の選択肢は、契約者がオンライン遺伝カウンセリングへのアクセスを選択するかどうかである。
【0132】
別のシナリオでは、或る契約が、データベースにおける個体のゲノムプロファイルの維持と共に初期の全ゲノム遺伝子型相関を提供できる。このようなデータベースは、該個体がそれを選択した場合、安全なものであり得る。該個体が依頼及び追加の支払いを行うと、この初期解析に続き、後続の解析及びさらなる結果が作製される。これはプレミアムレベルの契約であるかも知れない。
【0133】
本ビジネス方法の或る態様では、個体のリスクの更新が行われ、対応する情報が契約ベースで個体に利用できるようにされる。更新は、プレミアムレベルの契約を購入する契約者が利用できる。遺伝子型相関解析の契約は、個体の好みに応じて、新たな遺伝子型相関の特定カテゴリー又は小集団による更新を提供できる。例えば、或る個体は、処置又は予防方針が知られている遺伝子型相関を知ることさえできたらよいかも知れない。追加の解析を実行させるかどうかについての個体の決定を助けるために、利用可能となった追加の遺伝子型相関に関する情報が提供される。そのような情報は都合の良いことに、契約者に郵送又はeメールで送られる。
【0134】
プレミアム契約の中には、基本契約において述べたようなさらなるレベルのサービスがあるかも知れない。プレミアムレベル内で他の契約モデルが提供されるかも知れない。例えば、最高レベルは契約者に無制限の更新及び報告を提供できる。新たな相関及び規則が決定されると、その契約者のプロファイルは更新される。このレベルでは、契約者は、無制限の数の個体、例えば家族及び健康管理者がアクセスすることを許可できる。この契約者はまた、オンライン遺伝カウンセラー及び医師に無制限にアクセスできる。
【0135】
プレミアムレベル内の次のレベルの契約は、より限定された局面、例えば限定数の更新を提供できる。契約者は、契約期間内に自身のゲノムプロファイルを限定された回数だけ、例えば年に4回更新させることができる。別の契約レベルでは、契約者は、自身の保存されたゲノムプロファイルを週に1回、月に1回、又は年に1回更新させることができる。別の態様では、契約者は、それらに対するゲノムプロファイルを更新するために、限定数の表現型のみを選択できる。
【0136】
個人ポータルもまた、個体にとっての、リスクもしくは相関の更新及び情報の更新についての契約の維持、又は、更新されたリスク評価及び情報の請求を、簡単に可能にスルであろう。上記のように、個体が様々なレベルの遺伝子型相関結果及び更新の選択ができるよう、種々の契約レベルが提供され、そして、契約者の個人ポータルを介して、様々な契約レベルが契約者によって選択され得る。
【0137】
これら契約選択肢のうちいかなるものも本ビジネス方法の収益源に寄与する。本ビジネス方法の収益源は新たな顧客及び契約者の追加によっても追加され、その場合、新たなゲノムプロファイルがデータベースに加えられる。
【0138】
【表1−1】
【0139】
【表1−2】
【0140】
【表1−3】
【0141】
【表1−4】
【0142】
【表1−5】
【0143】
【表1−6】
【0144】
【表1−7】
【0145】
【表1−8】
【0146】
【表1−9】
【0147】
【表1−10】
【0148】
【表1−11】
【0149】
【表1−12】
【0150】
【表1−13】
【0151】
【表1−14】
【0152】
【表1−15】
【0153】
【表1−16】
【0154】
【表1−17】
【0155】
【表1−18】
【0156】
【表1−19】
【0157】
【表1−20】
【0158】
【表1−21】
【0159】
祖先データの組み入れ
本開示はさらに、祖先データを組み入れることによりゲノムプロファイルを使用して表現型を相関させる、本明細書に記載のような方法及びシステムを提供する。したがって、個体の遺伝子型相関の評価はGCIスコアとして表現又は報告され、このGCIスコアの作製に際し、祖先データを組み入れることができる。例えば、GCIスコアの決定に用いられるORは、個体の祖先又は民族性に基づいて改変され得る。
【0160】
個体が或る状態を発現するリスクは、典型的にはその個体の遺伝的特徴及び環境に基づいている。遺伝的特徴に基づいてリスクを推定しようとする場合、現在の研究は、全ての遺伝子マーカー又は変異(例えばSNP)のうち、小集団が測定できるに過ぎないという事実により、限定され得る。特に、複雑な疾患については、数多くの遺伝的及び環境的因子の複雑な相互作用が或る状態の発現を導き、故にそのリスクに僅かな貢献をする数多くの遺伝子変異、例えばSNPがあり得る。現在の全ゲノム関連(WGA)研究は、通常、ゲノムの各領域を分離して考え、他の全ての遺伝的因子及び環境因子を未知のままにして、その領域内の特定SNP中の突然変異が該状態へのリスクに及ぼす効果が何であるかについての質問に答えようとするものである。数学的にはこれらの研究は、リスクの確率の周辺分布を、本質的にはSNPの関数として推定する(これらの分布を本明細書ではSNPの効果と称する)。
【0161】
その状態を発現するリスクは、1個の遺伝子変異又はSNPではなく、多数のSNP又はその他の遺伝子変異及び環境因子による影響を受けるかも知れない。故に、2つの集団で、ゲノム間のアレル分布及びそれらに影響を及ぼす環境因子が異なるならば、各々の集団において特定の遺伝子変異、例えばSNPの影響に潜在的相違があるかも知れない。この事は、このSNP及び他のSNP、他の遺伝子変異、又は環境因子の間に遺伝子−遺伝子又は遺伝子−環境相互作用がある場合、特に当てはまる。しかしながら、たとえ相互作用がない場合でも、他の遺伝的及び環境的因子の、異なる「背景分布」が、遺伝子変異、例えばSNPの効果に影響を及ぼし得る。したがって、理論に拘束される訳ではないが、異なる集団は、同じ遺伝子変異体、例えばSNPに関して異なった効果サイズを有し得る。ところが実際には、1以上の集団でその効果サイズが測定されたSNPがある、殆ど全ての既知の状態において、その測定された効果サイズは互いに極めて近いか、又は互いに少なくとも95%CI以内であった。その結果、幾つかの態様では、本発明で使用できる単純化仮定では、遺伝子変異、例えば原因SNPの効果サイズは、全集団にわたって事実上同一である。
【0162】
都合の悪いことに、効果サイズが集団を通じて同じであるという仮定をもってしても、原因遺伝子変異が未知、例えば原因SNPが遺伝子型決定できない又はされていないという事実が制限となる。幸運なことに、ゲノム上で極めて近位にあるSNP又はその他の遺伝子変異は、例えばLDの場合のように相関していることがあり、故に、たとえ原因SNPが測定されていなくても、原因の代用品としてタグSNPが利用できる(例えば図10を参照されたい)。しかしながら、異なる集団は、様々な考えられる理由、例えば組換え率の変異、選択圧、又はボトルネック効果のため、異なる連鎖不均衡パターンを有し得る。したがって幾つかの態様では、或る研究が集団Aについて実施され、その集団において特定のオッズ比が得られた場合、集団Bでそのオッズ比を想定することはできない。これは以下の例によって説明できる(図10を参照されたい)。例えば、白色人種(CEU)集団について研究を行い、SNPの1つについて大きな効果サイズが報告されている(「公表SNP」)。この例では、公表SNPは、原因SNPと共有されているLDブロックに属しており、よって原因SNP及び公表SNPの間のr∧2(相関係数の二乗)は1である。言い換えると、公表SNP及び原因SNPはCEU集団において完全に相関している。しかしながら、別の集団(この場合YRI、ヨルバ族)では、公表SNP及び原因SNPが異なるLDブロックにあるということもあるかも知れない。極端な場合、それらはr∧2=0をとることがあり、その場合、それらはその集団において互いに独立している。このような場合には、YRI集団について同じ研究が行われたとしても、公表SNPについての効果は見出されないであろう。したがって、顧客の基礎となっている集団及び最初に調査された集団のLDパターンを無視することにより、YRI個体のリスクを推定するのは誤りであろう。図10に記載の例は極端な事例であるが、実際には同様のパターンが、それほど極端ではない結果を伴って起こり得る。
【0163】
したがって、幾つかの態様では、本開示は、異なる祖先を持つ集団間の遺伝子座を比較することを含んでなる、個体の遺伝子型相関を評価する方法を提供する。例えば、第一の集団について求められたオッズ比は、第二の集団に適用されることもあればそれとは異なることもあるが、それはLDパターンのような因子次第である。例えば、AS(アジア人)については、使用されるオッズ比は、AS、YRI(ヨルバ族)、CEU(白色人種/ヨーロッパ人)祖先/民族の調査によるものであってよく(この順序)、何故ならYRIはCEUよりもLDが低いためである。幾つかの態様では、遺伝子座特異的祖先を混合集団に利用できる。
【0164】
幾つかの態様では、第一及び第二の集団は、アフリカ系アメリカ人、白色人種、アシュケナジー系ユダヤ人、スファラディー系ユダヤ人、インド人、太平洋諸島系、中東人、ドゥルーズ派、ベドウィン、南欧人、スカンジナビア人、東欧人、北アフリカ人、バスク人、西アフリカ人、東アフリカ人等のその他任意の集団を含んでなるが、これらに限定される訳ではない。特に指摘のない限り、第一及び第二の集団は、HapMap集団(YRI、CEU、CHB、JPT、ASW、CHD、GIH、LWK、MEX、MKK、TSI)のいずれかを含んでなる(但しこれらに限定される訳ではない)。HapMap集団の説明はhttp://hapmap.org/hapmappopulations.html.en及び同封書類に見出すことができる。
【0165】
【表1B】
【0166】
幾つかの態様では、表現型に対する個体の遺伝子型相関を評価する方法は、或る表現型と相関している遺伝子変異、例えばSNPを含んでなる第一の連鎖不均衡(LD)パターン(ここで、この第一LDパターンは第一の個体集団のものである);及び、その遺伝子変異(例えば該SNP)を含んでなる第二のLDパターン(ここで、この第二LDパターンは第二の個体集団のものである)を比較し;その比較から、第二集団にある表現型と相関している遺伝子変異の確率を決定し;そして、その確率を利用することを含んでなる、該個体のゲノムプロファイルからの、表現型の遺伝子型相関の評価を行い;そして、該個体又はその健康管理者に、該遺伝子型相関を含んでなる結果を報告することを含んでなる。
【0167】
例えば、第一集団Aについて、公表されたSNPであるPが、オッズ比OR[P,A]と共に報告されており、原因SNPであるCが未知であるとする。さらにこの例において、第二集団Bについて、標本サイズが充分大であるならば、A及びB中のCのオッズ比は同一、即ち、OR[C,A]=OR[C,B]であると仮定する。したがって、Cの位置がわかっている場合、OR[C,A]、BにおけるLDパターンを利用して最良のタグSNPを推定し、該集団内のCを捕捉することができる。しかしながら幾つかの態様では、Cの位置はCのオッズ比と同様未知である。ところが、あらゆるSNP S及び値Xについて、確率:Prob[S=C,OR[C,A]=X]│r∧2(P,S)inA,P,OR[P,A]]、即ち、集団AにおけるS及びP間の相関係数が与えられ、且つPがオッズ比OR[P,A]を持つ公表SNPであるとした時の、Sが、オッズ比Xを持つ原因SNPである確率(無限大の標本サイズであると仮定)が算出できる。この確率を算出するため、実際の調査ではSのオッズ比はCのオッズ比より低い値であるという事実を利用し、充分大きな標本サイズの場合にOR[S,A]がXに近づくとすると、この事が起こる確率は幾らであるかという質問に答えられる。原因SNPの分布及びそれらの効果サイズが与えられると、原因となる種々のSNPから求められた効果サイズの期待値(加重平均)を計算することにより、タグSNPの期待される効果サイズが決定できる。
【0168】
図10に示した例において、このLDブロックは完全なLDを有しているため、CEUブロック中の全SNPは因果性について同じ確率を有し、その効果サイズの分布は等しい(即ち、対数オッズ比は正規分布をしており、この場合、信頼区間がその標準偏差を決定する)。しかしながら、YRI中の公表SNPがその因果性に標識を付けることを目指している場合、このSNPの予想オッズ比は、公表オッズ比及び1の間の加重平均となり、その場合、この加重は、含まれるLDブロックの長さに相当する。
【0169】
したがって幾つかの態様では、ORの修正は、第一個体集団、又はリファレンス集団、例えば上の例に記載したCEUにおける複数の遺伝子変異の各々について、原因遺伝子変異の確率、例えばORを決定することを包含する方法(ただしこれに限定されない)によって決定できる。次にこのORを、別の個体集団又はリファレンス群、例えばYRIの個体のゲノムプロファイルからの遺伝子型相関の評価に利用し、該個体又はその健康管理者に、工程(c)由来の前記遺伝子型相関を含む結果を報告する。したがって、原因遺伝子変異体(例えば原因SNP)である確率の計算に利用される各遺伝子変異は、典型的には第一集団中の表現型に相関している既知の遺伝子変異、例えば公表されている遺伝子変異、例えば公表SNP、の近位にある。幾つかの態様では、原因遺伝子変異体(例えば原因SNP)である確率の計算に用いられる遺伝子変異の各々は、既知又は公表された遺伝子変異に対して連鎖不均衡にある。
【0170】
例えば、再度第一集団Aについて、公表SNPであるPが、オッズ比OR[P,A]と共に報告されており、原因SNPであるCが未知であるとする。そして、第二集団Bについて、標本サイズが充分大であるならば、A及びB中のCのオッズ比が同一、即ち、OR[C,A]=OR[C,B]であると仮定する。この例におけるもう一つの仮定で、検討された集団及び或る個体集団についてLDパターンがわかっているとする。例えば、CEU集団(第一集団)について調査がなされ、該個体はYRI集団(第二集団)に属していると仮定する。但しこの例は他集団に拡大できる。あらゆる位置において、リスクアレルR及び非リスクアレルNがあるとする。与えられたSNPにおいて考えられる3つの遺伝子型は、RR、RN、及びNNである。与えられたSNP S、遺伝子型G(これはRR、RN、又はNNのいずれかである)、及び個体集団Iについて、SNP Sに遺伝子型Gを持つIの中の個体数をF(S,I,G)と表示する。したがって、公表SNP PにおいてCEU集団で測定されるオッズ比は、
【数1】
[式中、CA及びCTは被験及び対照集団を表す]
で与えられる。同様に、集団Iにおける遺伝子型Gの頻度をf(S,I,G)と表す。SNPの対S1及びS2について、或る個体がG2をS2に持つ(CEUにおいて)とすると、該個体が遺伝子型G1をSNP S1に有する確率はPCEU(S1,G1│S2,G2)と表される。同様の表記法を第二集団YRIにも使用する。
【0171】
幾つかの態様では、アルゴリズムを使用して、第二集団のORを決定し、そのようにして或る表現型に対する個体の遺伝子型相関を、例えばGCIスコアの使用を通じて評価する。例えば、本明細書に開示するアルゴリズムの入力及び出力は、以下の情報を提供させることができる:
【0172】
1)SNPのリスト(例えばHapMapに開示されているもの)、及び、公表SNPである、もう一つの特別なSNP P。
【0173】
2)この調査で測定される上記SNP由来のSNPのリスト。
【0174】
3)公表SNP Pについて、以下のもののうち1つが既知であると想定される:
(a)被験対象及び対照についての調査に由来する遺伝子型カウント、即ち、F(P,CA,G)及びF(P,CT,G)の値はあらゆる遺伝子型Gについて既知である。
(b)或いは、遺伝子型オッズ比は、SNP P、それらの信頼区間、ならびに被験対象及び対照の総数について既知であると想定される。
【0175】
4)SNP S1、S2のあらゆる対、及び遺伝子型G1、G2のあらゆる対に関して、該アルゴリズムにPCEU(S1,G1│S2,G2)及びPYRI(S1,G1│S2,G2)が提供される。この情報は、HapMap又はその他のリファレンスデータセットから見出すことができる。
【0176】
次にこのアルゴリズムは、この調査の個体数が非常に多い(無限大に近づく)という仮定の下に、Pの近傍にある全てのSNP Sについて該SNPの予想オッズ比を出力できる。このアルゴリズムは、CEU(即ち第一集団)及びYRI(即ち第二集団)についての原因Cのオッズ比は、標本サイズが無限大に近づく時、同じ数に近づくという仮定を立てる。
【0177】
したがって、本明細書に開示のアルゴリズムは以下の主たる工程を包含できる(実施例5をも参照されたい):
【0178】
1)リファレンスデータセットに基づいてLD確率を求める。
【0179】
2)入力データとして与えられていない場合には、カウントF(P,CA,G)、F(P,CT,G)を求める(代替的1−b)。
【0180】
3)CEU中のPにおける被験対象及び対照の遺伝子型頻度について、n(nは非常に大きく、例えば>>1000000)例を抽出する。この抽出は、該カウントを前提として、f(P,CA,G)、f(P,CT,G)の事後分布に基づいている。
【0181】
4)各々の頻度例について、そして各々のSNP Sについて、
(a)Pにおける頻度及びPCEUに基づきf(S,CA,G)及びf(S,CT,G)を算出する。
(b)Sにおいて抽出されたアレル頻度に基づき、F(S,CA,G)、F(S,CT,G)の例を作製する。
(c)F(S)に基づき、そしてf(S)に基づき、Sについてのp値を算出する(後者は漸近的意義におけるp値である)。
(d)測定された全てのSNP SにわたってF(S)に基づく最小p値を求める。これがPでない場合、この例を棄却する。
(e)例が棄却されない場合、その例をf(S)に基づく最小p値と共に維持し、これがその例の原因SNPということになる。
【0182】
5)前相から、原因SNP C1・・・・Cnの組及びそれらに対応するオッズ比が導かれる。このような各原因SNPに対して、YRI集団について同じオッズ比が維持されると想定される。
(a)この情報を、CiにおけるYRI中での該遺伝子型頻度と共に使用して、あらゆる遺伝子型Gについて頻度fYRI(Ci,CA,G)を推定する。
(b)LD情報を使用して、あらゆるSNP SについてのfYRI(S,CA,G)、fYRI(S,CT,G)を推定し、これらの頻度に基づき漸近的オッズ比を算出する。
(c)各々のSNP Sについて、全例の漸近的オッズ比を平均し、期待される漸近的オッズ比を導く。
【0183】
幾つかの態様では、祖先データを利用して個体を下位群について評価できる。例えば本開示は、個体の遺伝子試料を入手し;該個体のゲノムプロファイルを作製し;該個体のゲノムプロファイルを、ヒトの、民族性、地理的起源、又は祖先との遺伝子型相関の現在のデータベースと比較することにより、該個体の1又はそれ以上のリファレンス下位群を決定し;そして、工程c)の結果を該個体又はその健康管理者に報告することを含んでなる、個体のリファレンス下位群を評価する方法を提供する。
【0184】
或る局面では、リファレンスデータセットは個体由来の遺伝子型決定データを複数セット含んでなり、この場合、本開示においては実質上全ゲノムが使用される。或る態様では、このリファレンスデータは、複数の個体の実質上ゲノム全体から得られた遺伝子型決定データを含む。その場合、或る態様では、実質上ゲノム全体とは、個体ゲノムの少なくとも80%(少なくとも81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%のゲノム範囲を包含するが、これらに限定されない)をカバーする遺伝子マーカーが検出されることを意味する。別の態様では、リファレンスデータに含まれる該個体由来の遺伝子型決定データセットの少なくとも75%が、各個体ゲノムの少なくとも80%をカバーする遺伝子マーカーからの情報を包含する。さらなる態様では、リファレンスデータに含まれる該個体由来の遺伝子型決定データセットの75%より多く(76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%より多く又は100%を包含するが、これらに限定されない)が、各個体ゲノムの少なくとも80%をカバーする遺伝子マーカーからの情報を包含する。
【0185】
或る態様では、リファレンスデータセットは、ヌクレオチド反復、ヌクレオチド挿入、ヌクレオチド除去、染色体転座、染色体複製、コピー数変異、マイクロサテライト反復、ヌクレオチド反復、動原体反復、もしくはテロメア反復、又はSNPを包含する(但しこれらに限定されない)複数の遺伝子マーカーに関する情報を包含する。別の態様では、リファレンスデータセットは、単一の遺伝子マーカー、例えばSNP又はマイクロサテライトに実質上限定される情報を包含する。その場合、リファレンスセットに含まれる遺伝子マーカーの少なくとも80%(遺伝子マーカーの少なくとも81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%を包含するが、これらに限定されない)が同じ型である。
【0186】
別の態様では、リファレンスデータセットは本質的に全ゲノムSNP遺伝子型決定データで構成される。幾つかの態様では、このSNPデータは、SNP特定及びプロファイル作製のための高密度DNAアレイを用いる個体のゲノム解析から誘導される。そのようなアレイには、Affymetrix及びIllumina(Affymetrix GeneChip(登録商標) 500K Assay Manual(Affymetrix, Santa Clara, CA)(引用により本明細書の一部とする);Sentrix(登録商標) humanHap650Y遺伝子型決定ビーズチップ(Illumina, San Diego, CA)を参照されたい)から市販されているものがあるが、これらに限定される訳ではない。幾つかの態様では、リファレンスセットは、本質上、Affymetrix Genome Wide Human SNP Array 6.0を利用して900000以上のSNPを遺伝子型決定することにより作製されたSNPデータで構成される。これに代わる態様では、Affymetrix GeneChip Human Mapping 500K Array Setを使用することにより、全ゲノム抽出解析を通じて500000以上のSNPを決定できる。
【0187】
別の態様では、リファレンスデータセットは、その遺伝子型データが含まれる各個体の民族性、地理的起源及び/又は祖先についての情報で構成される。或る態様では、前記情報はリファレンスデータセット、例えばHapMap又はGenographic Project(https://www3.nationalgeographic.com/genographic/) に存在する。別の態様では、前記情報は、例えば契約者又は非契約者によって自己申告される。別の態様では、契約者は、自身の民族性、地理的起源及び/又は祖先についての自己申告情報に対する報奨を受け取ることができる。別の態様では、契約者は自身の疾患状態についての自己申告情報(例えば、症状が現れている、又は遺伝的素因のある任意の疾患又は状態についての情報)に対する報奨を受け取ることができる。別の態様では、該個体は、この情報及び自身の遺伝子型を少なくとも1つのリファレンスデータセットに使用することの許可に対する報奨を受け取ることができる。幾つかの態様では、この報奨は、報奨金、サービス提供に対する割引、無料サービスの提供、サービスアップグレードの提供(例えば契約者のステータスの、基本会員カテゴリーからプレミアム会員カテゴリーへの向上)、血縁者への無料もしくは割引サービスの提供、又は第三者業者(例えばAmazon、Starbucks、WebMD)を利用する、割引、無料もしくは信用サービスの提供であってよい。関連する態様では、自身の民族性、地理的起源及び/又は祖先、又は疾患状態に関する情報を開示する契約者又は非契約者は、このような開示情報の使用可能性について助言を受けることができ、そして、インフォームド・コンセントを提供又は保留する機会が与えられる。
【0188】
或る態様では、リファレンスデータセットには、異なる民族性、地理的起源及び/又は祖先を持つ複数の個体からの情報が含まれる。別の態様では、リファレンスデータセットには、このリファレンスデータセットに表示されている民族性、地理的起源及び/又は祖先を有する各クラス由来の1以上の個体が含まれる。別の態様では、リファレンスデータセットには、このリファレンスデータセットに表示されている民族性、地理的起源及び/又は祖先を有する各クラス由来の5以上の個体が含まれる。別の態様では、リファレンスデータセットには、このリファレンスデータセットに表示されている民族性、地理的起源及び/又は祖先を有する各クラス由来の10以上の個体が含まれる。別の態様では、リファレンスデータセットには、このリファレンスデータセットに表示されている民族性、地理的起源及び/又は祖先を有する各クラス由来の20以上の個体が含まれる。
【0189】
別の態様では、リファレンスセット中に集められたデータを解析して、民族性、地理的起源及び/又は祖先を少なくとも1つの疾患又は状態及び遺伝子マーカー関連性と相関させる。別の態様では、自己申告された民族性、地理的起源及び/又は祖先を使用して、リスク解析のため、特定の疾患又は状態について注意を促すことができる。別の態様では、個体の民族性、地理的起源及び/又は祖先を、同様又は共通の民族性、地理的起源及び/又は祖先を持つ個体の下位群の中での遺伝子マーカーと疾患又は状態の関連性を、さらに解析(例えばコンピューターによる集団遺伝学研究)するために、彼等の遺伝子型と相関させる。例えば、共通の民族性、地理的起源及び/又は祖先を持つ或る個体群、例えばアシュケナジー系ユダヤ人は、テイ・サックス病のような疾患の子供を持つ尤度が極めて高い。アシュケナジー系ユダヤ人であると自己認識している個体の解析は、その個体の遺伝子マーカーを解析する際、この情報を考慮に入れて修正することができる。
【0190】
別の態様では、リファレンスデータセット中のデータをリファレンスデータ下位群に層化することができる。全体として考えると、1つの集団が複数の下位群を含み、それらが異なるアレル頻度を持っていることがある。1つの集団中の、異なるアレル頻度を有する複数の下位群の存在は、関連性研究の情報提供をより少なくすることがある。抽出された下位群に内在する異なるアレル頻度は、各群の中の疾患又は状態とは独立しているかもしれず、それらは連鎖不均衡又は疾患関連性について誤った結論を導きかねない。個体の遺伝子型を、リファレンスデータセット全体ではなくリファレンスデータ下位群と比較することは、誤ったアレル関連性により作られる過誤の尤度を低減させ得る。各々のリファレンスデータ下位群中のデータは、少なくとも1つの共通する特徴、例えば共通する民族性、地理的起源及び/又は祖先によって体系化できる。データが各下位群内に含まれている個体の遺伝子型をさらに解析して、特定の民族性、地理的起源及び/又は祖先を示唆する共通の遺伝子マーカーを特定する。これに代わる態様では、リファレンスセットに集められたデータを、少なくとも1つの疾患又は状態に関連する、そしてさらに少なくとも1つの民族性、地理的起源及び/又は祖先に関連する遺伝子マーカーに対して使用できる。
【0191】
或る態様では、個体が自己申告した少なくとも1つの民族的、地理的起源及び/又は祖先の形質を利用して、該個体の遺伝子型の解析を修正する。修正された解析は、少なくとも1つの自己認識された民族的、地理的起源及び/又は祖先の下位群にも共通している、疾患又は状態に関連する遺伝子マーカーに的を絞ることができる。これに代わる態様では、個体の民族性、地理的起源及び/又は祖先に関連する情報を、該個体の遺伝子型に基づいて決定する。例えば、或る個体の遺伝子型を少なくとも1つのリファレンスデータセットと比較し、該個体の民族性、地理的起源及び/又は祖先についての情報を決定するのに利用する。次いで、少なくとも1つの疾患又は状態との関連性を求めるために、この情報を該個体の遺伝子型解析に組み入れる。この解析は、少なくとも1つの疾患又は状態と関連している遺伝子マーカーに的を絞ることができ、それは少なくとも1つの民族性、地理的起源及び/又は祖先に関しても共通しているかも知れない。
【0192】
別の態様では、個体の民族性、地理的起源及び/又は祖先についての情報、及び、該個体の遺伝子マーカー解析から誘導された情報の両者を利用して、該個体が特定の民族性、地理的起源及び/又は祖先を共有している尤度を決定する。両タイプの情報を合することにより、遺伝子型解析から得られた情報を利用して、該個体の自己申告された民族性、地理的起源及び/又は祖先を検証し、誤りがあればそれを正すことができる。或る態様では、個体の民族性、地理的起源及び/又は祖先についての情報が自己申告される。これに代わる態様では、個体の民族性、地理的起源及び/又は祖先についての情報は推定される。個体の民族性、地理的起源及び/又は祖先の推定は、複雑な疾患又は状態の研究において集団構造を評価するための継続的手段を提供できる。個体の自己申告情報に基づいた、民族的、地理的起源及び/又は祖先によるグループ分けには、かなりの量の不均一性が存在し得る。例えば、個体の民族的、地理的起源及び/又は祖先の比率(例えば、ヨーロッパ人、北アフリカ人、アボリジニ等)を、公表されているアレル頻度に基づいて推定できる。推定された実例の個体の民族的、地理的起源及び/又は祖先の比率を自己申告情報の代わりに利用して、少なくとも1つの遺伝子マーカー及び少なくとも1つの疾患又は状態の間の関連性を研究することができる。次いで、遺伝的リスクモデルを利用して、推定された個体の民族的、地理的起源及び/又は祖先の比率に対する調整が、民族性、地理的起源及び/又は祖先に対する調整を行わなかったモデル、又は自己申告情報に基づくモデルと比較して、該データに対する、より良好なフィットを提供するかどうかを決定できる。次いで、最良のフィットを提供するモデルを利用して、少なくとも1つの疾患又は状態を獲得する個体のリスクを決定する。
【0193】
別の態様では、遺伝子型及び/又は自己申告データに基づく個体からの民族性、地理的起源及び/又は祖先の情報を利用して、該個体のゲノム全体への寄与の点で最も近いリファレンス下位群又は(複数の)下位群を数学的に決定できる。例えば、個体の遺伝子型が、彼/彼女が1以上の民族性、地理的起源及び/又は祖先を示す遺伝子マーカーを共有していることを示唆していることが決定されるかも知れない。この決定は、或る個体の血縁者のうち少なくとも一人が特定の民族的、地理的及び/又は祖先の起源に由来していることの尤度、及び場合によっては信頼区間(例えばX%±Yがある)を包含できる。この決定を利用して、類似の民族的、地理的及び/又は祖先起源を共有する個体における、典型的には少なくとも1つの疾患又は状態と関連している遺伝子マーカーについて、そして、前記の少なくとも1つの疾患又は状態を獲得するリスクについて、個体に知らせることができる。別の態様では、様々な民族的起源、地理的起源及び/又は祖先に由来する個体の全ゲノムへの寄与に関する情報を包含する報告を作製できる。例えば、報告には、或る個体の全ゲノムにわたる祖先の集計をパーセントで、例えば20%がアフリカ起源、30%がアジア起源、50%がヨーロッパ起源といったように記載できる。さらなる態様では、場合によっては、こうした報告は信頼区間を含むかも知れない(例えば20%±3がアフリカ起源、30%±5がアジア起源、50%±2がヨーロッパ起源といったように)。
【0194】
別の態様では、決定された個体の民族性、地理的起源及び/又は祖先を利用して、特定遺伝子座の解析に基づいた、個体の少なくとも1つの疾患又は状態の獲得リスクを決定できる。関連態様では、特定の民族性、地理的起源及び/又は祖先を持つ血縁者から、個体が前記遺伝子座を受け継いだ尤度、ならびに前記遺伝子座にあるアレル及び少なくとも1つの疾患又は状態の関連性、を特徴付ける少なくとも1個の遺伝子座について報告を作製できる。別の態様では、少なくとも2個の遺伝子座に特異的な関連性の結果を集計して、少なくとも1つの疾患又は状態を獲得する複合リスクが決定され得る。
【0195】
別の態様では、関連性研究で過去に報告された個体とは異なる民族性、地理的起源及び/又は祖先を有する個体が少なくとも1つの疾患又は状態を獲得するリスクを決定できる。別の態様では、該個体の遺伝子型と比較するためのリファレンスデータ下位群を見出すのを困難もしくは不可能にする、特異な又は稀な民族性、地理的起源及び/又は祖先を有する個体が、少なくとも1つの疾患又は状態を獲得するリスクを決定できる。例えば或る個体は、自身の民族性、地理的起源及び/又は祖先に直接関連し得る遺伝疾患を獲得するリスクを知りたいと思うかも知れない。幾つかの極端に稀な疾患、例えば眼咽頭筋ジストロフィーは、集団内の小さな限局された群の中でのみ見出されている。この性質を持つ疾患はしばしば一人の創始者又は限定された数の過去の疾患保因者にさかのぼることができる。この性質の疾患については、或る個体が最初の創始者又は疾患保因者と関係がないと確定できた場合、その個体をリスク群から除外することがしばしば可能である。或る態様では、共通する遺伝的背景又は共通する民族性、地理的起源及び/又は祖先を持つ他の個体について1又はそれ以上の関連性研究を実施するのが有益となるかも知れない。その場合、該個体の民族性、地理的起源及び/又は祖先を、推定又は自己申告情報により決定する。これらの調査は、個体の遺伝子型、民族性、地理的起源及び/又は祖先に関する情報を、少なくとも1つの疾患又は状態の状況に結びつけることができる。少なくとも二つの調査から得られた結果を比較して、遺伝子マーカーのアレル及び少なくとも1つの疾患又は状態の間に類似の関連性が観察されるかどうかを決定できる。結果は、調査された各集団における相関構造及びアレル頻度ならびにそれらの間の関係に依存し得る。さらに、前記調査を利用して、少なくとも1つの前記疾患又は状態への感受性に関連する遺伝子マーカーを特定できる。或る態様では、少なくとも1個の遺伝子マーカーについての少なくとも1個のアレルの不在を利用して、少なくとも1つの疾患又は状態に対するリスクから個体を排除する。これに代わる態様では、少なくとも1個の遺伝子マーカーについての少なくとも1個のアレルの存在を利用して、個体を、少なくとも1つの疾患又は状態に対するリスクがあると分類する。
【0196】
以下の実施例は本開示を例示及び説明するものである。本開示の範囲はこれらの実施例により限定されるものではない。
【実施例1】
【0197】
実施例1:SNPプロファイルの作製及び解析
個体に、そこからゲノムDNAが抽出される唾液試料(およそ4ml)を入れる、キット中の試料管(例えばDNA Genotekより入手可能)が提供される。この唾液試料が処理解析のためCLIA認定研究所に送付される。典型的にはこの試料は、採集キットに入って該個体に簡便に提供される輸送容器に入れて翌日配達便で該施設に送付される。
【0198】
好ましい態様では、ゲノムDNAを唾液から単離する。例えば、DNA Genotekから入手できるDNA自己採集キット技術を利用して、個体は、約4mlの唾液標本を臨床処理のために採集する。処理のための適当な研究所にこの試料が送達された後、典型的には採集キット供給者の供給する試薬を利用して、試料を50℃で少なくとも1時間熱変性及びプロテアーゼ消化することにより、DNAを単離する。次いでこの試料を遠心分離し、上清をエタノール沈殿させる。このDNAペレットを、その後の解析に適した緩衝液に懸濁する。
【0199】
個体のゲノムDNAを、周知の方法及び/又は採集キットの製造者が提供する方法に従い、唾液試料から単離する。一般に、試料をまず熱変性及びプロテアーゼ消化する。次に、試料を遠心分離し、上清を回収する。次いで上清をエタノール沈殿させて、ゲノムDNAおよそ5〜16ugを含有するペレットを得る。DNAペレットを10mM Tris pH7.6、1mM EDTA(TE)に懸濁する。このゲノムDNAを、アレイ製造者の提供する機器及び説明書を用いて市販の高密度SNPアレイ(例えばAffymetrix又はIlluminaより入手可能のもの)にハイブリダイズさせることにより、SNPプロファイルを作製する。該個体のSNPプロファイルを安全なデータベース又はヴォールトに寄託する。
【0200】
患者のデータ構造を、ゲノム中でのその存在が所定の疾患又は状態に相関している、確立した、医学関連SNPの臨床誘導データベースと比較することにより、リスク付与SNPについてクエリーを行う。このデータベースは、特定の疾患又は状態に対する特定SNP及びSNPハプロタイプの統計学的相関の情報を含んでいる。例えば、実施例IIIに示すように、アポリポ蛋白E遺伝子における多型はこの蛋白に異なるイソ型を生じさせ、これがアルツハイマー病発現の統計学的尤度に相関する。別の例としては、第V因子ライデンとして知られる血液凝固蛋白第V因子の変異体を持つ個体は、高い凝固傾向を有する。SNPが疾患又は状態の表現型に関連している幾つかの遺伝子を表1に示す。データベース中の情報は、科学的精確性及び重要性について研究/臨床諮問委員会によって承認され、また、行政機関の監督によって検討されるかも知れない。科学界からは追加的SNP−疾患相関が出現してくるため、データベースは絶えず更新される。
【0201】
個体のSNPプロファイルの解析結果を、オンラインポータル又は郵送によって患者に安全に提供する。患者には解釈及び支援情報、例えば実施例IVの第V因子ライデンについて示した情報が提供される。個体のSNPプロファイル情報への安全なアクセス、例えばオンラインポータルを通じたアクセスは、その患者の医師との話し合いを容易にし、患者がオーダーメイド医療の選択をできるようにさせる。
【実施例2】
【0202】
実施例2:遺伝子型相関の更新
個体の遺伝子型相関の初期決定を求める依頼に応えて、ゲノムプロファイルが作製され、遺伝子型相関が作られ、そして実施例1に記載のように該個体に結果が提供される。個体の遺伝子型相関の初期決定の後、追加の遺伝子型相関が判明すると、その後の更新された相関が決定され、又は決定され得る。契約者はプレミアムレベルの契約及び自身の遺伝子型プロファイルを持っており、それは安全なデータベースに維持される。更新された相関は、この保存された遺伝子型プロファイルに関して実行される。
【0203】
例えば、上の実施例1に記載したような初期の遺伝子型相関は、或る特定の個体がApoE4を持たず、よって若年性アルツハイマー病の素因を持たない、そしてこの個体が第V因子ライデンを持たないと確定できるかも知れない。この初期決定に続いて、新たな相関、例えば或る遺伝子、仮に遺伝子XYZにおける多型が、所定の状態、仮に状態321に相関していることが判明し立証されるかも知れない。この新たな遺伝子型相関は、ヒト遺伝子型相関のマスターデータベースに追加される。次いで、安全なデータベース中に保存されたその特定個体のゲノムプロファイルから、まず関連遺伝子XYZデータを回収することにより、該個体に更新が提供される。その特定個体の関連遺伝子XYZデータを、遺伝子XYZについての更新されたマスターデータベース情報と比較する。その特定個体の状態321への感受性又は遺伝的素因を、この比較から決定する。この決定の結果をその特定個体の遺伝子型相関に追加する。その特定個体が状態321への感受性があるか、又は遺伝的素因があるかどうかについての更新結果を、解釈及び支援情報と共に該個体に提供する。
【実施例3】
【0204】
実施例3:ApoE4遺伝子座及びアルツハイマー病の相関
アルツハイマー病(AD)のリスクは、ApoE2、ApoE3、及びApoE4と称するAPOEの3個のイソ型を生ずるアポリポ蛋白E(APOE)遺伝子の多型と相関していることが示されている。このイソ型は、APOE蛋白の残基112及び158における1又は2個のアミノ酸により、相互に異なっている。ApoE2は112/158にcys/cysを含み;ApoE3は112/158にcys/argを含み;そしてApoE2は112/158にarg/argを含む。表2に示すように、アルツハイマー病の若年発症リスクは、APOE ε4遺伝子コピーの数と共に上昇する。同様に、表3に示すように、ADの相対リスクはAPOEε4遺伝子コピーの数と共に上昇する。
【0205】
【表2】
【0206】
【表3】
【実施例4】
【0207】
実施例4:第V因子ライデン陽性患者のための情報
以下の情報は、第V因子ライデン遺伝子の存在を示すゲノムSNPプロファイルを有する個体に提供され得る情報の例である。該個体は、この情報が初期報告で提供される基本契約を結ぶことができる。
【0208】
第V因子ライデンとは何か?
第V因子ライデンは病気ではなく、両親から伝えられる特定の遺伝子の存在です。第V因子ライデンは、血液凝固に必要な蛋白第V(5)因子の変異体です。第V因子欠損のある人は、よりひどく出血し易く、一方第V因子ライデンを持つ人は凝固傾向の強い血液を持ちます。
【0209】
第V因子ライデン遺伝子を保有する人は、集団の残りの人々よりも血栓(血栓症)を発現するリスクが5倍高くなります。しかしながら、この遺伝子を持つ多くの人々は血栓に悩まされることが全くありません。英国及び米国において、人口の5パーセントが第V因子ライデン遺伝子を1個又はそれ以上持っていますが、これは実際に血栓症にかかる人の数より遙かに多いのです。
【0210】
如何にして第V因子ライデンを獲得するのか?
第V因子の遺伝子は両親から伝えられます。多くの遺伝形質と同様、1個の遺伝子は母親から、そして1個は父親から受け継がれます。したがって、2個の正常遺伝子、又は1個の第V因子ライデン遺伝子及び1個の正常遺伝子、又は2個の第V因子ライデン遺伝子を受け継ぐことが考えられます。1個の第V因子ライデン遺伝子を持つと血栓症を発現するリスクが僅かに高くなる結果となりますが、2個の遺伝子になると、このリスクはずっと高くなります。
【0211】
第V因子ライデンの症状は何か?
血栓(血栓症)のない限り、徴候はありません。
【0212】
危険なシグナルは何か?
最も一般的な問題は脚の血栓です。この問題は、脚が腫れ、痛みを持ち、赤くなることで示されます。より稀な場合には、肺の血栓(肺血栓症)が発現し、呼吸を困難にします。血栓のサイズにより、これは、殆ど気付かない程度から患者が重度の呼吸困難を経験する程度までの範囲となります。さらに稀な場合には、血栓が腕又は他の身体部分に起こり得ます。これらの血栓は、血液を心臓に送る静脈で形成され、動脈(これは心臓から血液を送り出します)では形成されないので、第V因子ライデンは冠状動脈血栓症のリスクを上昇させる訳ではありません。
【0213】
血栓を回避するために何ができるか?
第V因子ライデンは血栓を作るリスクを僅かに上昇させるに過ぎず、この状態の多くの人々は血栓症を一度も経験しません。血栓ができるのを回避するためにできることは数多くあります。長時間同じ姿勢で立っていたり座っていたりすることを避けて下さい。長距離を旅行する場合には、規則的に運動することが大切です − 血液を「停滞」させてはなりません。過体重や喫煙は血栓のリスクを大幅に上昇させます。第V因子ライデン遺伝子を保有する女性は、血栓症を起こす可能性が著しく上がるため、経口避妊薬を服用してはなりません。第V因子ライデン遺伝子を保有する女性は、妊娠もまた血栓症のリスクを高めるため、妊娠する前に医師の診察を受けるべきです。
【0214】
医師は如何にして第V因子ライデンを持っているかどうかを見出すのか?
第V因子ライデンの遺伝子は血液試料中に見出すことができます。
【0215】
脚又は腕の血栓は通常、超音波検査で検出できます。
【0216】
血栓はさらに、血栓を目立たせる物質を血液に注入後、X線で検出することもできます。肺の血栓は発見が困難ですが、医師は普通、放射性物質を使用して肺内の血流分布及び肺に至る空気の分布を調べます。この二つのパターンは一致するはずで、不一致は血栓の存在を示唆します。
【0217】
どのようにして第V因子ライデンを治療するのか?
第V因子ライデンを持つ人々は、血液が凝固し始めない限り治療を必要とせず、血液凝固が始まった場合、医師は、さらなる血栓を防止するために、ワルファリン(例えばマレバン)又はヘパリン等の血液をさらさらにする(抗凝固)薬を処方するでしょう。治療は通常3〜6ヶ月間継続させますが、血栓が幾つかある場合にはさらに長くなります。重症例では薬物治療過程を無期限に継続させ、極めて稀な例では血栓を外科的に除去する必要があるかも知れません。
【0218】
妊娠中、第V因子ライデンをどのように治療するのか?
第V因子ライデン遺伝子を2個持っている女性は、妊娠中ヘパリン凝固薬による治療を受ける必要があるでしょう。過去に自分自身が血栓を発現したことがある、又は血栓の家族歴を持つ、第V因子ライデン遺伝子を1個だけ持っている女性にも同じ適用を行います。
【0219】
第V因子ライデン遺伝子を保有する女性は全て、妊娠後半期に血栓を防止するための特別なストッキングを着用する必要があるかも知れません。出産後には抗凝固薬ヘパリンが処方されることがあります。
【0220】
予後
血栓の発現リスクは年齢と共に増大しますが、この遺伝子を保有する100歳を超える人々の調査では、それまでに血栓症にかかった人はごく僅かであることがわかりました。米国遺伝カウンセラー学会(NSGC)は、あなたの地域の遺伝カウンセラーの一覧表及び家族歴の創成についての情報を提供できます。www.nsgc.org/consumerでオンラインデータベースを検索して下さい。
【実施例5】
【0221】
実施例5:異なる祖先を持つ個体についてのオッズ比の作製
1.リファレンスデータセットに基づきLD確率を求める
【0222】
SNP S1、S2に遺伝子型の対(G1,G2)を持つHapMap個体の数を計数し、2個のSNPの結合分布を作製する。ベイズ法を用いて各々のSNPの周辺分布を合し、PCEU(S1,G1│S2,G2)(CEUは公表されているか、又は第一集団である)及びPYRI(S1,G1│S2,G2)(YRIは第二集団、該個体の祖先である)を推定する。
【0223】
2.入力データとして与えられていない場合にはカウントF(P,CA,G)、F(P,CT,G)を求める(代替的1−b)。
【0224】
入力データとして該カウントが与えられていない場合、以下のような等式の組を用いてそれらを求める:
【数2】
【0225】
【数3】
【0226】
上の等式において、UB(P,CEU,G)は、公表SNP Pにおける遺伝子型Gについてのオッズ比の信頼区間の上限である。M及びNは、それぞれこの調査における対照及び被験対象の数である。
【0227】
これらは6個の変数を持つ6個の等式である。F(P,CA,NN)及びF(P,CA,RN)の全数値の列挙を行う。このような値の対の各々について、一組の一次方程式を解くことにより、残りの変数を決定する2〜4の等式が提示され、そして最後の二つの等式を検証に使用する。実行時間はN2に拘束される。
【0228】
3.CEU中のPにおける被験対象及び対照の遺伝子型頻度のために、n(nは非常に大きく、例えば>>1000000)例を抽出する。この抽出は、該カウントを前提として、f(P,CA,G)、f(P,CT,G)の事後分布に基づいている。
【0229】
f(P)が与えられると、F(P)が見られる尤度を多項分布を前提として算出できる。f(P)の可能値に関して一様な事前確率を仮定することにより、確率Prob(f(P)│F(P))αProb(F(P)│f(P))がわかる。ギブス抽出法を利用してこの分布から抽出するため、MCMCアプローチを利用する。
【0230】
4.各々の頻度例について、そして各々のSNP Sについて:
【0231】
a)Pにおける頻度及びPCEUに基づきf(S,CA,G)及びf(S,CT,G)を算出する。
式:
【数4】
を用いて被験対象中のSにおける頻度を推定する。同様の式を対照にも使用できる。
【0232】
b)Sにおいて抽出されたアレル頻度に基づき、F(S,CA,G)、F(S,CT,G)の例を作製する。これは、Sにおいて該遺伝子型を表す多項確率変数を想定することにより行う。
【0233】
c)F(S)に基づき、そしてf(S)に基づき、Sについてのp値を算出する(後者は漸近的意義におけるp値である)。
【0234】
アーミテージのトレンド検定を利用して、F(S)に基づくp値を算出する。漸近的p値を算出するため、期待値と一致するカウント、例えばF(S,CA,G)を有する標本サイズNの被験対象及びNの対照が、Nf(S,CA,G)であると仮定する。
【0235】
d)測定された全てのSNP SにわたってF(S)に基づく最小p値を求める。これがPでない場合、この例を棄却する。
【0236】
e)棄却されなかった場合、その例をf(S)に基づく最小p値と共に維持し、これがその例の原因SNPということになる。
【0237】
5)前相は、原因SNP C1・・・・Cnの組及びそれらに対応するオッズ比を導く。このような各原因SNPについて、YRI集団について同じオッズ比が維持されると想定される。
【0238】
a)この情報を、CiにおけるYRI中での該遺伝子型頻度と共に使用して、あらゆる遺伝子型Gについて頻度fYRI(Ci,CA,G)を推定する。
【0239】
これを行うため、以下の等式を解く:
【0240】
【数5】
【0241】
fYRI(S,CT,G)はリファレンス集団(HapMap)から既知であると想定されるため、この等式には3個の欠落している変数がある。故に、上記の等式の組は一次方程式の組であり、効率的に解くことができる。
【0242】
b)LD情報を使用して、あらゆるSNP SについてのfYRI(S,CA,G)、fYRI(S,CT,G)を推定し、これらの頻度に基づき漸近的オッズ比を算出する。これは工程4(a)と同様の方法で実施する。
【0243】
c)各々のSNP Sについて、全例の漸近的オッズ比を平均し、期待される漸近的オッズ比を導く。
【0244】
次いでこのオッズ比を利用して個体の遺伝子型相関を決定する。
【0245】
本開示の好ましい態様を本明細書に示し説明してきたが、このような態様は例示のためにのみ提供されていることが当業者には明らかであろう。当業者にとっては、本開示から逸脱することなく、ここに多数の変形、変更、及び置換が存在するであろう。本明細書に記載される内容の態様に対する様々な代替形を、本開示の実施に際して利用できることを理解すべきである。以下の請求項は本開示の範囲を定義するものであり、これらの請求項の範囲内にある方法及び構造ならびにそれらの等価物は、それらによってカバーされることを意図している。
【特許請求の範囲】
【請求項1】
(a)(i)或る表現型に相関する遺伝子変異を含んでなる第一の連鎖不均衡(LD)パターン(ここで、この第一のLDパターンは第一の個体集団のものである);及び、
(ii)該遺伝子変異を含んでなる第二のLDパターン(ここで、この第二のLDパターンは第二の個体集団のものである)、
を比較し;
(b)(a)における比較から、該第二集団内の該表現型に相関している該遺伝子変異の確率を決定し;
(c)工程(b)の該確率を使用することを含んでなる、該個体のゲノムプロファイルからの、該表現型の遺伝子型相関の評価を行い;そして、
(d)工程(c)由来の遺伝子型相関を含んでなる結果を、該個体又は該個体の健康管理者に報告すること、
を含んでなる、表現型に対する個体の遺伝子型相関を評価する方法。
【請求項2】
工程(b)において、該確率がアレルの又は遺伝子型のオッズ比(OR)のいずれかである、請求項1に記載の方法。
【請求項3】
該ORが既知のORから誘導され、この既知のORが該第一集団についての該表現型に相関する該遺伝子変異についてのものである、請求項2に記載の方法。
【請求項4】
該第一集団及び該第二集団が類似のLDパターンを有する、請求項2に記載の方法。
【請求項5】
(a)第一の個体集団における複数の遺伝子変異の各々について原因遺伝子変異の確率を決定し;
(b)工程(a)の該確率の各々を、第二の個体集団における前記複数の遺伝子変異の各々についての確率とみなし;
(c)工程(b)の該確率を使用することを含んでなる、該個体のゲノムプロファイルからの、表現型に対する遺伝子型相関の評価を行い;そして、
(d)工程(c)由来の表現型に対する該遺伝子型相関を含んでなる結果を、該個体又はその個体の健康管理者に報告すること、
を含んでなる、表現型に対する個体の遺伝子型相関を評価する方法。
【請求項6】
工程(a)の該確率がORである、請求項5に記載の方法。
【請求項7】
工程(a)の該遺伝子変異の各々が、該第一集団における表現型に相関する既知の遺伝子変異の近位にある、請求項5に記載の方法。
【請求項8】
工程(a)の該遺伝子変異の各々が、前記既知の遺伝子変異と連鎖不均衡にある、請求項7に記載の方法。
【請求項9】
表現型に対する該遺伝子型相関がGCIスコアとして報告される、請求項1又は5に記載の方法。
【請求項10】
該第二集団が該第一集団とは異なる祖先を有する、請求項1又は5に記載の方法。
【請求項11】
該個体が該第二集団の祖先を有する、請求項1又は5に記載の方法。
【請求項12】
原因遺伝子変異が未知である、請求項1又は5に記載の方法。
【請求項13】
該遺伝子変異が単一ヌクレオチド多型(SNP)である、請求項1又は5に記載の方法。
【請求項14】
該報告が、ネットワーク上での該結果の伝達を含んでなる、請求項1又は5に記載の方法。
【請求項15】
該報告がオンラインポータルを介している、請求項1又は5に記載の方法。
【請求項16】
該報告が紙又はeメールによる、請求項1又は5に記載の方法。
【請求項17】
該報告が、安全な方法で報告することを含んでなる、請求項1又は5に記載の方法。
【請求項18】
該報告が、安全でない方法で報告することを含んでなる、請求項1又は5に記載の方法。
【請求項19】
該ゲノムプロファイルの作製が第三者による、請求項1又は5に記載の方法。
【請求項20】
該ゲノムプロファイルが遺伝子試料から作製される、請求項1又は5に記載の方法。
【請求項21】
第三者が該遺伝子試料を入手する、請求項20に記載の方法。
【請求項22】
該遺伝子試料がDNAである、請求項20に記載の方法。
【請求項23】
該遺伝子試料がRNAである、請求項20に記載の方法。
【請求項24】
該遺伝子試料が、血液、毛髪、皮膚、唾液、精液、尿、糞便物質、汗、及び口腔粘膜試料より成る群から選ばれる生体試料由来である、請求項20に記載の方法。
【請求項25】
該ゲノムプロファイルを安全なデータベース又はヴォールトに寄託する、請求項1又は5に記載の方法。
【請求項26】
該ゲノムプロファイルが単一ヌクレオチド多型プロファイルである、請求項1又は5に記載の方法。
【請求項27】
該ゲノムプロファイルが末端切除、挿入、除去、又は反復を含んでなる、請求項1又は5に記載の方法。
【請求項28】
該ゲノムプロファイルを高密度DNAマイクロアレイを用いて作製する、請求項1又は5に記載の方法。
【請求項29】
該ゲノムプロファイルをRT−PCRを用いて作製する、請求項1又は5に記載の方法。
【請求項30】
該ゲノムプロファイルをDNA配列決定を用いて作製する、請求項1又は5に記載の方法。
【請求項31】
(e)さらなる遺伝子変異によって該結果を更新する、ことをさらに含んでなる、請求項1又は5に記載の方法。
【請求項32】
請求項1又は2に記載の集団が、HapMap集団(YRI、CEU、CHB、JPT、ASW、CHD、GIH、LWK、MEX、MKK、TSI)のうちいずれか、又は、アフリカ系アメリカ人、白色人種、アシュケナジー系ユダヤ人、スファラディー系ユダヤ人、インド人、太平洋諸島系、中東人、ドゥルーズ派、ベドウィン、南欧人、スカンジナビア人、東欧人、北アフリカ人、バスク人、西アフリカ人、又は東アフリカ人(但しこれらに限定される訳ではない)等のその他の集団を含んでなる、請求項1又は5に記載の方法。
【請求項1】
(a)(i)或る表現型に相関する遺伝子変異を含んでなる第一の連鎖不均衡(LD)パターン(ここで、この第一のLDパターンは第一の個体集団のものである);及び、
(ii)該遺伝子変異を含んでなる第二のLDパターン(ここで、この第二のLDパターンは第二の個体集団のものである)、
を比較し;
(b)(a)における比較から、該第二集団内の該表現型に相関している該遺伝子変異の確率を決定し;
(c)工程(b)の該確率を使用することを含んでなる、該個体のゲノムプロファイルからの、該表現型の遺伝子型相関の評価を行い;そして、
(d)工程(c)由来の遺伝子型相関を含んでなる結果を、該個体又は該個体の健康管理者に報告すること、
を含んでなる、表現型に対する個体の遺伝子型相関を評価する方法。
【請求項2】
工程(b)において、該確率がアレルの又は遺伝子型のオッズ比(OR)のいずれかである、請求項1に記載の方法。
【請求項3】
該ORが既知のORから誘導され、この既知のORが該第一集団についての該表現型に相関する該遺伝子変異についてのものである、請求項2に記載の方法。
【請求項4】
該第一集団及び該第二集団が類似のLDパターンを有する、請求項2に記載の方法。
【請求項5】
(a)第一の個体集団における複数の遺伝子変異の各々について原因遺伝子変異の確率を決定し;
(b)工程(a)の該確率の各々を、第二の個体集団における前記複数の遺伝子変異の各々についての確率とみなし;
(c)工程(b)の該確率を使用することを含んでなる、該個体のゲノムプロファイルからの、表現型に対する遺伝子型相関の評価を行い;そして、
(d)工程(c)由来の表現型に対する該遺伝子型相関を含んでなる結果を、該個体又はその個体の健康管理者に報告すること、
を含んでなる、表現型に対する個体の遺伝子型相関を評価する方法。
【請求項6】
工程(a)の該確率がORである、請求項5に記載の方法。
【請求項7】
工程(a)の該遺伝子変異の各々が、該第一集団における表現型に相関する既知の遺伝子変異の近位にある、請求項5に記載の方法。
【請求項8】
工程(a)の該遺伝子変異の各々が、前記既知の遺伝子変異と連鎖不均衡にある、請求項7に記載の方法。
【請求項9】
表現型に対する該遺伝子型相関がGCIスコアとして報告される、請求項1又は5に記載の方法。
【請求項10】
該第二集団が該第一集団とは異なる祖先を有する、請求項1又は5に記載の方法。
【請求項11】
該個体が該第二集団の祖先を有する、請求項1又は5に記載の方法。
【請求項12】
原因遺伝子変異が未知である、請求項1又は5に記載の方法。
【請求項13】
該遺伝子変異が単一ヌクレオチド多型(SNP)である、請求項1又は5に記載の方法。
【請求項14】
該報告が、ネットワーク上での該結果の伝達を含んでなる、請求項1又は5に記載の方法。
【請求項15】
該報告がオンラインポータルを介している、請求項1又は5に記載の方法。
【請求項16】
該報告が紙又はeメールによる、請求項1又は5に記載の方法。
【請求項17】
該報告が、安全な方法で報告することを含んでなる、請求項1又は5に記載の方法。
【請求項18】
該報告が、安全でない方法で報告することを含んでなる、請求項1又は5に記載の方法。
【請求項19】
該ゲノムプロファイルの作製が第三者による、請求項1又は5に記載の方法。
【請求項20】
該ゲノムプロファイルが遺伝子試料から作製される、請求項1又は5に記載の方法。
【請求項21】
第三者が該遺伝子試料を入手する、請求項20に記載の方法。
【請求項22】
該遺伝子試料がDNAである、請求項20に記載の方法。
【請求項23】
該遺伝子試料がRNAである、請求項20に記載の方法。
【請求項24】
該遺伝子試料が、血液、毛髪、皮膚、唾液、精液、尿、糞便物質、汗、及び口腔粘膜試料より成る群から選ばれる生体試料由来である、請求項20に記載の方法。
【請求項25】
該ゲノムプロファイルを安全なデータベース又はヴォールトに寄託する、請求項1又は5に記載の方法。
【請求項26】
該ゲノムプロファイルが単一ヌクレオチド多型プロファイルである、請求項1又は5に記載の方法。
【請求項27】
該ゲノムプロファイルが末端切除、挿入、除去、又は反復を含んでなる、請求項1又は5に記載の方法。
【請求項28】
該ゲノムプロファイルを高密度DNAマイクロアレイを用いて作製する、請求項1又は5に記載の方法。
【請求項29】
該ゲノムプロファイルをRT−PCRを用いて作製する、請求項1又は5に記載の方法。
【請求項30】
該ゲノムプロファイルをDNA配列決定を用いて作製する、請求項1又は5に記載の方法。
【請求項31】
(e)さらなる遺伝子変異によって該結果を更新する、ことをさらに含んでなる、請求項1又は5に記載の方法。
【請求項32】
請求項1又は2に記載の集団が、HapMap集団(YRI、CEU、CHB、JPT、ASW、CHD、GIH、LWK、MEX、MKK、TSI)のうちいずれか、又は、アフリカ系アメリカ人、白色人種、アシュケナジー系ユダヤ人、スファラディー系ユダヤ人、インド人、太平洋諸島系、中東人、ドゥルーズ派、ベドウィン、南欧人、スカンジナビア人、東欧人、北アフリカ人、バスク人、西アフリカ人、又は東アフリカ人(但しこれらに限定される訳ではない)等のその他の集団を含んでなる、請求項1又は5に記載の方法。
【図1】
【図2】
【図3】
【図4A】
【図4B】
【図4C】
【図4D】
【図4E】
【図4F】
【図4G】
【図4H】
【図4I】
【図4J】
【図4K】
【図4L】
【図4M】
【図5A】
【図5B】
【図5C】
【図5D】
【図5E】
【図5F】
【図5G】
【図5H】
【図5I】
【図5J】
【図6A】
【図6B】
【図6C】
【図6D】
【図6E】
【図6F】
【図7】
【図8】
【図9】
【図10】
【図2】
【図3】
【図4A】
【図4B】
【図4C】
【図4D】
【図4E】
【図4F】
【図4G】
【図4H】
【図4I】
【図4J】
【図4K】
【図4L】
【図4M】
【図5A】
【図5B】
【図5C】
【図5D】
【図5E】
【図5F】
【図5G】
【図5H】
【図5I】
【図5J】
【図6A】
【図6B】
【図6C】
【図6D】
【図6E】
【図6F】
【図7】
【図8】
【図9】
【図10】
【公表番号】特表2010−539947(P2010−539947A)
【公表日】平成22年12月24日(2010.12.24)
【国際特許分類】
【出願番号】特願2010−527226(P2010−527226)
【出願日】平成20年9月26日(2008.9.26)
【国際出願番号】PCT/US2008/078035
【国際公開番号】WO2009/042975
【国際公開日】平成21年4月2日(2009.4.2)
【出願人】(509151876)ナビジェニクス インコーポレイティド (4)
【Fターム(参考)】
【公表日】平成22年12月24日(2010.12.24)
【国際特許分類】
【出願日】平成20年9月26日(2008.9.26)
【国際出願番号】PCT/US2008/078035
【国際公開番号】WO2009/042975
【国際公開日】平成21年4月2日(2009.4.2)
【出願人】(509151876)ナビジェニクス インコーポレイティド (4)
【Fターム(参考)】
[ Back to top ]