説明

ヌクレオチド配列を同定するための方法及びプローブ

本発明は、関連ヌクレオチド配列の群のメンバーを同定し得る標的ヌクレオチド配列のセットを同定するための方法であって、前記方法は、前記群の各メンバーのヌクレオチド配列を複数の部分配列に分割するステップを含み、前記部分配列の内の少なくとも2個が重複する方法を提供する。本方法は、HLAやKIR遺伝子座における対立遺伝子のアサインメントを可能にするプローブセットを生成するのに有用である。また本発明は上記方法によって同定される標的ヌクレオチド配列に特異的にハイブリダイズ可能なプローブセットを提供する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は分子生物学の分野に関する。更に具体的には、本発明は、関連ヌクレオチド配列の群のメンバーを同定する場合における、オリゴヌクレオチドプローブを作製するための方法とその使用とに関する。前記方法及びプローブは、個体における遺伝子の対立遺伝子を同定する際に使用できる。
【背景技術】
【0002】
ヒトゲノム計画は、ゲノムの1塩基多型(SNP(s))の重要性を強調してきた。この多型は、ゲノム全体を通じて平均100〜300塩基ごとに出現する。全てのヒトの遺伝子は99%超が同一であることが知られている一方で、種における遺伝的多様性の主要な要素をもたらしているのはSNPsの存在である。遺伝子の種々の対立遺伝子は、耐病性、医薬化合物に応答する能力、運動能力等、多岐に亘る特性を有する個体に種々の表現型を与え得る。
【0003】
植物ゲノムもまた、種々の特性をもたらし得るSNPsを含む。SNPsは、遺伝学的解析においてますます最適なマーカーになっており、そして農学的育種プログラムにおけるマーカーとして普通に使用されるものである。SNPsは、特定の遺伝子型を表現型に結びつけるために使用され得るだけでなく、細菌やウイルス等の多様な有機体を同定する際の「フィンガープリント」としても使用できる。
【0004】
或る遺伝子型を或る一個体のものであると特定できる能力は、多くの理由により重要である。幅広い概念としては、この能力には、用いられる有機体の被験遺伝子のヌクレオチド配列の同定が含まれる。この情報を提供する最も直接的な方法は、被験遺伝子を配列決定することである。自動配列決定がここ数年間で可能になってきたが、このプロセスは、依然として時間集約的で、且つ費用がかかるものである。
【0005】
直接的な配列決定の広範な利用には限界があり、その結果、各種対立遺伝子を同定するための多くの間接的方法が進歩してきた。最も簡単な方法の内の1つとしては、制限酵素断片長多型(RFLP)の使用がある。この方法は、ある特定のヌクレオチド配列に対する制限エンドヌクレアーゼの特異性に依拠する。故に、ある特定の配列が存在する場合、エンドヌクレアーゼはポリヌクレオチドを切断するが、存在しない場合、切断は起こらない。種々の遺伝子型は、ゲル電気泳動によって検出されるもの等の、制限酵素断片の種々のパターンにより検出されるものである。この方法の短所は、対立遺伝子の範囲内のSNPのいずれかに対して特異的なエンドヌクレアーゼが存在しない場合、対立遺伝子の全てがRFLPによって同定されるというわけではないということにある。これはよくあることであり、従ってRFLPの使用は著しく限定される。
【0006】
対立遺伝子を検出する別の方法には、ある対立遺伝子に見られる配列とは特異的に結合するが、他の対立遺伝子には結合しないオリゴヌクレオチドプローブの使用が含まれる。標的対立遺伝子に対するプローブの結合は、蛍光化合物又はラジオアイソトープ等のタグを使用して検出され得る。オリゴヌクレオチドプローブに基づく方法の課題は、遺伝子型を明確にするために極めて多くのプローブを使用する必要がありうるということである。ポリヌクレオチドのハイブリダイゼーションについての生物物理学に従えば、プローブの長さは限定されているため(通常、約65以下のヌクレオチド長)、被験遺伝子が最大プローブ長より長い場合、一連の種々のプローブがその遺伝子の全長をカバーするように設計される必要がある。被験遺伝子が多数の対立遺伝子、即ち多数のSNPsを有する場合、SNPsの密度が高い場合、或いはこれらの要因のいずれかが併存する場合、種々のプローブの数は増大する。
【0007】
本技術分野の課題の一例としては、臓器移植のための組織タイピングにおいて解析されることが多いヒト白血球抗原HLA−DRB遺伝子座がある。この遺伝子座には現在483の対立遺伝子が同定されており、そして270のヌクレオチドが可変的な第2エクソン内にある。単純な乗法によれば、この遺伝子座における遺伝子型を解明するために、プローブに対して130,410個の異なるヌクレオチド配列の変異(variation)が必要である。かかる多数の異なるオリゴヌクレオチドプローブを作製し、そして各プローブの試験試料とハイブリダイズする能力を評価することは、明らかに非常な負担である。更に、以前には未確認であった対立遺伝子の発見は続いており、このことにより、個体のHLAタイプを解明し得るプローブのセットを提供するという課題はより困難になっている。
【0008】
多数のプローブの使用に固有の課題は、「チップ」に何千ものプローブを結合して「マイクロアレイ」を形成することを可能にする固相技術の進歩によって部分的に解決されている。しかしマイクロアレイ技術には、多くのプローブを使用して遺伝子の全ての対立遺伝子を同定することが依然として必要であり、そして大きなプローブセットを操作するためのより便利なフォーマットがその技術により提供されるだけである。SNP検出のための現存のプローブは、標的DNA分子の物理的に離れた領域を標的とするものであって、そして多くの場合、SNPに隣接する配列が単形性(monomorphic)である場合に選択されるものである。このようなプローブの使用は、「再配列決定(resequencing)」として本技術分野で知られている。
【0009】
再配列決定は、全ての考えられるSNPsを同定し得る特別に設計されたプローブの使用に依拠する。グオ(Guo)ら(2002、Genome Research 12:447−457)は、各プローブが単一のSNPではなくSNPsの特定の組合せを示すように設計された20merのプローブを作製することにより、HLAタイピングのためのプローブを提供するという課題に対処する。この方法に伴う課題は、それが系統的でないということと、人間が思慮深くプローブを設計する必要があるということである。このプロセスにエラーの可能性が現実に存在すること考慮すると、プローブ設計プロセスを行った最後にプローブセットにより全ての対立遺伝子が同定されるのかどうかについては、不確実性が残されたままである。
【0010】
グオ(Guo)らにより提供される方法に伴う更なる課題は、プローブ長全体に亘ってSNP部位を含む必要があるということである。グオ(Guo)らの表1の考察により、多型部位が20塩基のプローブの5’末端から3’末端までに存在することが示される。プローブの端部に向かってハイブリダイゼーションの精度が低下することは本技術分野で知られており、故に、グオ(Guo)らの方法を使用するハイブリダイゼーション反応に誤差があると考えられることになる。特に、グオ(Guo)らによって設計されたプローブセットは、100のハイブリダイゼーションの中で32の偽陽性反応を結果としてもたらした。
【0011】
従って、ヌクレオチド配列内の全ての公知の多型を確実に同定し得るプローブセットを設計するための系統的方法を提供することによって従来技術の課題を解決又は改善することが、本発明の一様相である。
【0012】
文献、行為、材料、装置、物品等についての考察は、単に本発明の文脈を提供する目的のみで本明細書に記載されるものである。それらの内容のいずれか又は全てが先行技術の基礎の一部を構成するとか、本出願の各請求項の優先日より前に存在したがゆえに本発明に関連する分野における共通の一般的な知識であるとかいうことを示唆又は意味するものではない。
【発明の開示】
【発明が解決しようとする課題】
【0013】
第1の様相において、本発明は、関連ヌクレオチド配列の群のメンバーを同定し得る標的ヌクレオチド配列のセットを同定するための方法であって、前記方法が前記群の各メンバーのヌクレオチド配列を複数の部分配列に分割するステップを含み、前記部分配列の内の少なくとも2個が重複する方法を提供するものである。出願人は、考察下の配列を重複する部分配列に分割することによって、オリゴヌクレオチドプローブとのハイブリダイゼーションのための標的として有用な標的ヌクレオチド配列のセットを同定することが可能であることを見出した。好ましくは、前記部分配列の内の少なくとも1個が、1個超の他の部分配列と重複する。より好ましくは、前記部分配列の内の少なくとも1個が、2個超、3個超、4個超又は5個超の他の部分配列と重複する。
【0014】
長所としては、前記方法は、自動操作に適しており、そして多くの対立遺伝子及び/又は高密度のSNPsを有する遺伝子(例えば、主要組織適合遺伝子複合体(MHC)、T細胞レセプター、B細胞レセプター、免疫グロブリン、キラー抑制レセプター(KIR)のもの等)を解明し得るプローブを提供するために有用なものとして提案される。
【0015】
前記方法の一実施態様において、本出願において必要なプローブの数は、冗長なプローブを同定し、そしてプローブセットにおいてその冗長なプローブを除去するか又は含めないようにすることによって、有意に減少させ得る。オリゴヌクレオチドプローブのセットを設計することを目的として関連配列を解析する場合において、あるメンバーの配列内の多型が、別のメンバーの配列内に必ずしも存在するわけではないということは、本技術分野で理解されてこなかった。従って、全ての組合せが必ずしも関連配列の群の中に存在するというわけではないことから、あらゆる多型のあらゆる組合せをカバーするプローブを提供する必要はない。
【0016】
前記方法の別の一実施態様において、部分配列(及び部分配列に由来する任意のプローブ)の一以上は、当該一以上の部分配列の5’末端及び/又は3’末端に、又はこの末端の近傍に、1個以上の多型部位を含まない。前記方法の別の一実施態様において、部分配列の一以上は、当該一以上の部分配列の中心に、又はこの中心の近傍に、1個以上の多型部位を含む。プローブ端近くの多型部位を回避すること、及びプローブの中心にその部位を集めることにより、多くの偽陽性ハイブリダイゼーション反応が起こるように明らかに不正確に結合する、グオ(Guo)ら(2002)によって提供されたプローブの問題が解決される。
【0017】
別の一様相において、本発明は、本明細書に記載される方法によって同定される標的ヌクレオチド配列に特異的にハイブリダイズし得るプローブのセットを提供するものである。好ましくは、前記プローブは複数のエクソンをカバーし、そして全体的な対立遺伝子のアサインメント(assignment)を提供し得る。
【0018】
別の一様相において、本発明は、本明細書に記載されるプローブのセットを使用して関連ヌクレオチド配列の群のメンバーを同定する方法を提供するものである。前記方法は、通常、マイクロアレイチップに固定されるプローブを利用するものである。
【0019】
別の一様相において、本発明は、本明細書に記載される方法を実行し得るコンピュータ実行可能プログラム(ソフトウェア)を提供するものである。
【課題を解決するための手段】
【0020】
出願人は、関連ヌクレオチド配列の群のメンバーを同定し得るプローブを設計するための系統的な方法を提案する。従って、第1の態様において、本発明は、関連ヌクレオチド配列の群のメンバーを同定し得る標的ヌクレオチド配列のセットを同定するための方法であって、前記方法が前記群の各メンバーのヌクレオチド配列を複数の部分配列に分割するステップを含み、前記部分配列の内の少なくとも2個が重複する方法を提供するものである。
【0021】
出願人は、考察下の配列を重複する部分配列に分割することによって、オリゴヌクレオチドプローブとのハイブリダイゼーションに有用な標的ヌクレオチド配列のセットを同定することが可能であることを見出した。故に、部分配列の関連群は、種々のヌクレオチド配列を有する関連群の各メンバーで特定の遺伝子座をカバーし得る。本方法の一形態において、関連配列の群の各メンバーは多くの部分配列に分割される。所定のメンバー配列の中で、潜在的にかなりの数の部分配列が作製され得るように部分配列は互いに重複する。この方法は、連続的な部分配列の使用に基づく従来技術の方法とは明確に区別される。
【0022】
好ましくは、少なくとも1個の部分配列は、1個超の他の部分配列と重複する。より好ましくは、少なくとも1個の部分配列は、2個超、3個超、4個超又は5個超の他の部分配列と重複する。
【0023】
一連のプローブ長の重複する部分配列を作製するために用いられる重複の程度は、可能な限りの最小でよい。一連の25塩基の部分配列のための最小の重複の一例としては、第1の部分配列が1〜25のヌクレオチドをカバーするもの、第2の部分配列が25〜50のヌクレオチドをカバーするもの、第3の部分配列が50〜75のヌクレオチドをカバーするもの等がある。
【0024】
重複は、可能な限り最大の程度の重複であってよい。可能な限り最大の重複を有する一連の25塩基の部分配列のための一例としては、第1の部分配列が1〜25のヌクレオチドをカバーするもの、第2の部分配列が2〜26のヌクレオチドをカバーするもの、第3の部分配列が3〜27のヌクレオチドをカバーするもの等がある。
【0025】
本発明は、利用可能な最小と最大との間の任意の中間の程度の重複も含むものである。しかしながら、実質的に最大の重複を使用することが好ましい。なぜならば、これによって、プローブセットを設計する個体の側に要求される判断が最低限となるからである。使用する重複の程度が高くなると、関連配列に存在するSNPsのより多くの組合せをカバーする能力がより大きくなる。
【0026】
前記群のいずれか任意のメンバーを用いた前記方法を使用するために重複の量を固定する必要はない。また、部分配列の長さを固定する必要もない。何らかの利点が得られるかどうかを確認するために様々な部分配列長と部分配列間の重複の程度との効果を当業者が普通に検査することは可能であろう。
【0027】
重複の程度が大きいものが使用される場合、極めて多数の部分配列が作製されることは理解されよう。従って、極めて多数のプローブがプローブセットに含まれるであろう。マイクロアレイチップが多数のプローブを保持することは可能であるが、少なくとも経済的理由のためには、所定の分析に必要なプローブの数を限定することが望ましい。前記方法の一実施態様において、本出願において必要なプローブの数は、冗長なプローブを同定し、そしてプローブセットにおいて冗長なプローブを除去するか又は含めないようにすることによって、有意に減少させ得る。オリゴヌクレオチドプローブのセットを設計することを目的として関連配列を解析する場合において、あるメンバーの配列内の多型が、別のメンバーの配列内に必ずしも存在するわけではないということは、本技術分野で理解されてこなかった。従って、全ての組合せが必ずしも関連配列の群の中に存在するというわけではないことから、あらゆる多型のあらゆる組合せをカバーするプローブを提供する必要はない。この方法は、関連配列が非常に多型性であり、そして現在の技術水準が、群の全ての理論的なメンバーを同定するために必要以上に多くのプローブが必要であると予測していることからして、特に有用である。故に、好ましい一実施態様において、前記方法は、冗長性について部分配列の少なくとも一部を解析し、且つ、冗長であると同定された任意の部分配列の少なくとも一部を除去するステップを含む。
【0028】
冗長性のレベルの低下は、減算的アプローチを使用して達成され得る。例えば、全ての多型が群の全てのメンバーに存在すると仮定し、そしてその仮定に基づいて複数の部分配列を作製する。その後、冗長な配列の存在に関して複数の部分配列を解析し、それから冗長な配列を除去して固有の標的ヌクレオチド配列のセットを残す。いうまでもなく、標的ヌクレオチド部分配列のセットが有する、群のあらゆるメンバーを同定する能力は、全てのメンバー内に全ての多型が存在すると仮定する場合において作製される部分配列のより大きなセットと同じである。
【0029】
或いは、加算的方法が使用され得る。この方法では、すでに作製された全ての部分配列に照らして各々の新しく作製された部分配列を冗長性に関して解析していくことで、複数のプローブ長配列が逐次的に1個ずつ作製される。新しく作製された部分配列が冗長であることが判明した場合、それは標的ヌクレオチド配列のセットに付加されないが、さもなければ標的ヌクレオチド配列のセットに含まれる。加算的方法が使用されようと減算的方法が使用されようと、最終的な結果は同じことである:冗長性を有しないか、若しくは冗長性のレベルが低下した部分配列のセットであって、関連配列の群の全てのメンバーを同定し得るものが作製される。
【0030】
多くの理由により、メンバー配列を同定するために必要なプローブの数を限定することが望ましい。プローブを合成し、そしてそのプローブを保持するマイクロアレイチップを製造するコストは、ヌクレオチド配列を同定するための方法の実施の経済的実現可能性における重大な考慮すべき問題である。これは、単なる研究目的なのか、病理研究室内におけるもの等のハイスループットな商業的用途のものなのかという問題である。特に、ヌクレオチド配列が多くの代替形態を有し得る場合(即ち、関連配列の群内のメンバーの数が多い場合)、従来技術の方法は同程度に多くの異なる特異的なプローブを必要とする。故に、ヌクレオチド配列の1メンバーの存在に関するスクリーニングを行うために、調べるべき配列の長さ次第で何百又は何千もの個々のプローブが必要となることがある。
【0031】
ヌクレオチド配列のメンバーを同定するために必要なプローブの数を限定する別の理由は、ある種のプローブハイブリダイゼーション法の実用上の限界に関連する。例えば、標準的なドットブロット装置は、試料の塗布のためにわずか64のウェルしか有し得ず、それによりユーザは、1回の運転につきわずかに64種のプローブ、すなわち、わずか64種のヌクレオチド配列を同定する能力に限定される。更なる一実施例としては、マイクロアレイシステムを使用してヌクレオチド配列の極めて多数の代替形態を同定する場合がある。現時点では、標準的なマイクロアレイチップは、最高50万種のオリゴヌクレオチドプローブを保持し得る。これで十分であると見えるかもしれないが、幾つかの用途のためには、この数は不十分であり、そして全てのプローブに対応する多数のチップを調製することが必要となるであろう。
【0032】
前記方法の一実施態様において、部分配列(及び部分配列に由来するあらゆるプローブ)の一以上は、当該一以上の部分配列の5’末端及び/又は3’末端に、又はこの末端の近傍に1個以上の多型部位を含まない。前記方法の別の一実施態様において、部分配列の一以上は、当該一以上の部分配列の中心に、又はこの末端の近傍に1個以上の多型部位を含む。プローブの端部に向かって多型性部位を回避すること、及びプローブの中心にその部位を集めることにより、多くの偽陽性ハイブリダイゼーション反応が起こるように明らかに不正確に結合する、グオ(Guo)ら(2002)によって提供されたプローブの問題が解決する。
【0033】
関連核酸配列は、ゲノム、RNA、cDNA又はcRNAであり得る。ゲノムDNA試料は、通常、目的の領域に隣接するプライマーを使用して、アレイに適用する前に増幅に付される。ゲノムDNAは、事実上いかなる組織源(純粋な赤血球以外)からも得ることができる。例えば、好都合な組織サンプルとしては、全血、精液、唾液、涙液、尿、糞便材料、汗、口腔、皮膚及び毛髪等が挙げられる。多型部位を含むゲノムDNAの増幅によって、試料が得られる個体が多型部位でホモ接合性である場合には標的核酸の単一の種が作製され、或いはヘテロ接合性である場合には標的分子の2種が作製される。
【0034】
DNAは、当業者に公知のいずれかの適切な方法による分析のために調製してよく、その方法としては適切なプライマーを使用したPCRによるものが挙げられる。全てのゲノムを解析することが望まれる場合、全ゲノム増幅(WGA)の方法を用いてよい。市販のキットをこの方法のためにすぐに利用することができ、そのキットとしては、シグマアルドリッチ社(米国ミズーリ州セントルイス)製のGenoPlex(登録商標)Complete WGAキットが挙げられる。このキットは、ゲノムの、一連のテンプレートへのランダムな断片化に基づく。結果として生じる短いDNA鎖により、特定の3’末端及び5’末端を有するDNA断片のライブラリが作製される。ライブラリは初期に線形等温増幅を用いて複製され、その後、限定された回数の幾何学的(PCR)増幅を行う。WGA法は、血液カード、全血、頬綿棒、土壌、植物及びホルマリン固定パラフィン包埋組織を包含する種々の原料から精製されたゲノムDNAとの使用に適切である。
【0035】
mRNA試料もまた、多くの場合増幅に付される。この場合、増幅は、通常、逆転写の後に行う。全ての発現mRNAの増幅は、WO96/14839及びWO97/01603における記述の通りに実行され得る。試料が得られる個体が発現mRNAの中で発生する多型部位でヘテロ接合性である場合、二倍体試料からのRNA試料の増幅によって2種の標的分子が作製され得る。
【0036】
前記方法によって同定されるヌクレオチド部分配列は、その後、関連配列の群の全ての現在同定されるメンバーを同定し得るプローブセットを設計するために用いてよいことは明らかであろう。本明細書で用いる「標的ヌクレオチド配列」という用語は、実質的に特異的なプローブが作製され得る配列を意味する。プローブの作製については、更に以下で考察されるが、プローブは、通常、標的ヌクレオチド配列にハイブリダイズし得るオリゴヌクレオチドプローブである。
【0037】
出願人は、関連配列の群が多数のメンバーを有する場合及び/又はメンバーが多数の多型塩基を有する場合及び/又は多型塩基が2種超の代替形態を有する場合であっても、本技術分野において必要であると以前に考えられたよりもはるかに少ない数のプローブを使用して群のいずれかのメンバーを確定的に同定し得るプローブセットを作ることが可能であることを見出した。前記方法は、例えば、遺伝子座のいずれか任意の対立遺伝子を同定し得るプローブセットを製造するために使用してよく、そして対立遺伝子の数が非常に多い場合に特に有用である。対照的に、グオ(Guo)ら(2002)は、全体的な対立遺伝子のアサインメントを提供し得る複数のエクソンをカバーするためのプローブを設計するための実用的で確固とした方法を開示していない。
【0038】
当業者には、プローブ長の部分配列の長さが関連配列の群のメンバー間を区別する能力を提供するいずれの長さであってもよいことが理解されよう。
【0039】
マイクロアレイ用途のために使用するプローブは、通常、約25ヌクレオチド長であるが、より長いプローブ及びより短いプローブは本発明の文脈において有用であるものと考えられる。より短い有効長が、結合の特異性を提供するのに十分なヌクレオチドの必要性によって決定されてよく、そして約10ヌクレオチドから約15ヌクレオチドまでであってよい。「サブゲノム」が試験対象であるならば、15個未満のヌクレオチドのプローブを考えることができよう。この例としては、単一の単数染色体が試験対象であって、そして配列検出の特異性がヒトのゲノム全体の約30億個のヌクレオチドを解析するのに必要なプローブ長を必要としない場合がある。上限は、2重鎖領域を融解し、そしてポリヌクレオチドの1本鎖をアニールする必要性に関する物理的制約によって決定してよい。これは、約30から約50ヌクレオチドまでであってよい。上限は、A/T対と比較して2本鎖内の塩基を切り離すのに必要な融解温度が高いC/G塩基の比率により変化し得る。プローブの長さの実用的な上下限はあり得るが、これらの限度は本出願の詳細により変化するものであり、そして当業者であれば、日常的に行う、経験に基づく実験によって最適な長さのプローブを同定することが可能であろう。
【0040】
本発明の方法が、多数の関連ヌクレオチド配列間での区別を必要とする如何なる状況にも適用し得ることは理解されるであろう。本明細書において、用語「ヌクレオチド配列」及びその派生語は、デオキシリボ核酸(DNA)配列及びリボ核酸(RNA)配列を包含するものとする。関連ヌクレオチド配列は、最小レベルの配列同一性を示すヌクレオチド配列の如何なる群であってもよい。配列の同一性は、少なくとも50%、60%、70%、80%、90%、95%又は99%であるのが好ましい。例えば、関連配列が長く、一連のSNPsが配列全域に点在している場合には、同一性が99%を超えることもあり得る。
【0041】
関連配列は、タンパク質コード配列であっても、タンパク質非コード配列であってもよく、また、タンパク質コード配列とタンパク質非コード配列の組合せであってもよい。
【0042】
関連配列は、二倍体物質、半数体物質、三倍体物質又は倍数体物質に由来するものであってもよく、二倍体状態、半数体状態、三倍体状態又は倍数体状態に関する情報を提供するものであってもよい。
【0043】
半数体状態に関する情報を求める場合、本発明の方法は、DNA対立遺伝子をハプロタイプの階層(haplotype stratification)に確定的にアサインメントすることができるプローブを提供する上で有用である。遺伝子座の対立性(locus allelism)の概念は当該技術分野では知られているが、複数の領域に結合した遺伝子座の対立性(同義の変化を伴う対立遺伝子を含む)がハプロタイプの階層化に寄与することについては、理解されていなかった。こうして、ゲノム(二倍体)DNA用のプローブによって、ハプロタイプ(シス相)複対立遺伝子アサインメントに関する情報を得ることができる。具体的には、同義対立遺伝子(synonymous alleles)は、多遺伝子座染色体ハプロタイプセグメントにおけるユニットである。本明細書に記載の方法によって生成され、遺伝子座の対立性を特徴付けるプローブは、ハプロタイプ(haplotypy)である多遺伝子座の共対立性(co-allelism)のパターンの発見に寄与する。この概念はテロメアG及びF遺伝子座によって例示される。HLA−Gには23個の対立遺伝子が存在し、HLA−Fには20個の対立遺伝子が存在する。これら43個の対立遺伝子とセントロメアDPB1遺伝子座に存在する120個の対立遺伝子、更にこれらの間に存在する多数の対立遺伝子を組合せれば、有限の多遺伝子座対立遺伝子の変異(variation)を4Mb未満のMHC領域に及ぶハプロタイプとして割り付ける上で役立つであろう。
【0044】
関連配列は天然のものであっても、合成したものであってもよい。該配列は、動物や植物、微生物、細菌、ウイルス等のいずれの生物に由来してもよい。
【0045】
本発明の一態様において、関連配列はゲノムの同一領域を対象とする。例えば、あるエクソンの最初のヌクレオチドからその最後のヌクレオチドまでの領域である。この場合、25merプローブを用いようとすれば、プローブの設計は、プローブの13番目のヌクレオチド(即ち、中央のヌクレオチド)がエクソンの最初のヌクレオチドに対するように行うことができる。従って、最初のヌクレオチドがGであれば、プローブの13番目のヌクレオチドはCとなる。プローブの互いに隣接する12塩基領域が一方ではプレエクソン領域に対し、他方では更にエクソンに対することは明らかであろう。
【0046】
本発明の方法の一実施形態の一般的な操作は、図1に示す非常に簡略化した例を考慮して説明することができる。この説明では3個の関連ヌクレオチド配列(番号1、番号2及び番号3)を対象とするが、エクソンは左側、即ち5’末端から5番目のヌクレオチド(即ち、A)から開始する。エクソンの最初のヌクレオチドを1とすると、エクソンは2個のSNPsをポジション6及び11に有することになる(下線部)。9個のヌクレオチドから成る複数の部分配列(部分配列間で完全に重複する場合がある)を用いた。従って、第1の部分配列はポジション−4から開始し、ポジション+5で終了する。
【0047】
図1Aから明らかなように、関連配列の各々は、11個の9merの部分配列に分割される。これによって合計33個の部分配列が得られる(図1B)。重複する部分配列を除去し、17個のそれぞれ異なる部分配列を残す(図1C)。元の標的分子が二本鎖分子の場合、プローブ配列が相補的である必要がないことは、当業者であれば理解できるであろう。この場合、当業者によって選択される標的生成戦略に応じて、ヌクレオチド配列を直接プローブ配列として用いることもでき、ACAGGGGTGTCGTGCAAAGAACCTCに対して相補的にすることもできる。従って、dsDNAを最終標的生成に用いる場合、プローブはアレイ上のどちらか一方の鎖、又は両方の鎖を対象とすることができる。
【0048】
本例が単に、本発明の一態様に係る関連ヌクレオチド配列の群の各メンバーを区別することが可能なプローブセットを生成するのに必要なステップについて説明するだけのものであることを理解すべきである。この場合、プローブ数は約50%減少する。より複雑な系においては、プローブ数はより大幅に減少し、95%より多く減少することもある。
【0049】
本発明の方法によって、ヌクレオチド配列における多くの変異(variation)(例えば、欠失や置換、付加等)を解析することができる。本発明の一態様においては、関連ヌクレオチド配列はSNPsの存在を除いて同一である。
【0050】
SNPsは如何なる密度でも存在し得るが、SNPsが高密度で存在する場合、本発明の方法によって得られる利益がより大きくなる。ヌクレオチド配列のプローブ長領域内に2以上のSNPsが存在するような密度が好ましい。従来、所定領域におけるSNPsのあらゆる組合せをカバーするには多数のプローブが必要であると考えられていたため、SNPsを高密度で含む関連ヌクレオチド配列を区別する能力について以前は問題があった。これに関しては、HLAエクソン内のヌクレオチドの20%〜50%が多型(polymorphic)であり、多型部位の多くがクラスター化しているので、HLAタイピング用プローブセットを設計する上で特に問題となっていた。こうして、先行技術においては、HLAタイプを確定的に個体に帰属させるには実行不可能な数の異なるプローブが必要であることが予測されていた。
【0051】
群内の関連ヌクレオチド配列の数が2程度に少ないこともあり得るが、関連ヌクレオチド配列の数が多ければ本発明の方法によって得られる利益も大きくなることは明らかであろう。本発明の方法の好ましい態様においては、関連ヌクレオチド配列群内の関連ヌクレオチド配列の数は、100超、200超、300超、400超、500超、600超、700超、800超、900超又は1000超である。本発明は、関連ヌクレオチド配列の数が多く、SNPsの密度が高い場合に特に適用し得る。
【0052】
本発明の方法の好ましい態様において、関連ヌクレオチド配列は、ある遺伝子の複数の対立遺伝子である。個体間で、同一のタンパク質をコードするヒト遺伝子の配列が異なる場合があること(対立遺伝子)が知られている。解析する遺伝子の部分は、対立遺伝子特異的な情報が提供可能であれば如何なる部分であってもよい。例えば、多型部位はエクソンの長さ全域に亘って非ランダムに分布していることが多い。従って、遺伝子のある個別の領域だけをプローブの対象とすることが必要な場合もある。
【0053】
遺伝子の多くは数種の対立遺伝子を有しているにすぎないが、非常に多数の対立遺伝子を有する遺伝子もある。多数の対立遺伝子を有する遺伝子の例としては主に、超可変性を共通の特徴とする、免疫系に関与する遺伝子が挙げられる。そのような遺伝子の例としては、主要組織適合遺伝子複合体(MHC)やT細胞受容体、B細胞受容体、免疫グロブリン、キラー細胞抑制受容体(KIR)等の遺伝子が挙げられる。本明細書に記載の方法は関連ヌクレオチド配列の如何なる群に対しても有用であるが、関連ヌクレオチド配列が超可変性であればより大きな利益が得られることは理解されるであろう。超可変性が高密度SNPsとして存在する場合には更に大きな利益が得られる。
【0054】
上述のように、MHC遺伝子は非常に多型である。クラスI及びII MHCの膜貫通タンパク質は、移植適合性を評価する目的で組織タイピングに用いるヒト白血球抗原(HLA)系を構成する。クラスIタンパク質は3種類の遺伝子座、HLA−A、HLA−B及びHLA−Cによってコードされ、現在、これらの遺伝子座にはそれぞれ309個、563個及び167個の対立遺伝子が認識されている。
【0055】
クラスIIタンパク質はα鎖及びβ鎖を有し、遺伝子座DR、DQ及びDPによってコードされる。DR遺伝子座はα鎖に3個、β鎖に483個の対立遺伝子を有する。DQ遺伝子座はα鎖に25個、β鎖に56個の対立遺伝子を有する。DP遺伝子座はα鎖に20個、β鎖に107個の対立遺伝子を有する。従って、クラスI領域のみで、個体のHLA型をもたらす対立遺伝子の組合せが多く存在することが分かるであろう。
【0056】
歴史的には、HLAに基づく組織タイピングは、ヒト集団において同定されたHLA抗原に特異的な抗体を用いて血清学的に行われてきた。現在、多くのHLAタイピングはDNA法によって行われており、高レベルの対立遺伝子のアサインメントにはシークエンシング、又は配列等価法(sequence-equivalent method)が行われる。このようなDNAタイピングによって組織タイピングの感度や特異性の改善が期待される。しかし、DNAに基づく方法(プローブとしてのオリゴヌクレオチド配列を伴う)によって全てのHLA対立遺伝子を同定しようとする際の問題は、可能性のある対立遺伝子全てをカバーするのに非常に多数のプローブを必要とすることである。本発明は、管理可能な数である一方、公知の対立遺伝子全てを同定することも可能なプローブセットを提供することによって、このような問題を軽減するものである。
【0057】
HLA−DRβ遺伝子座は、現在、483個の対立遺伝子を有すると認識されているが、各対立遺伝子がエクソンのヌクレオチド全てに亘って分布しているSNPsの特有の組合せ/パターンであることが把握されない限り、必要なプローブは483個にすぎない(各対立遺伝子に対して1個)と思われるかもしれない。25mer塩基オリゴヌクレオチドプローブを用い、13番目のポジションのSNP対立遺伝子に12merが隣接するような、現在のマイクロアレイSNP検出を考えた場合、2対立遺伝子(di-allelic)SNPsの存在でさえ、プローブ設計において大きな問題になると当該技術分野では考えられてきた。従って、隣接領域が非単形性の場合、当該技術分野では、25mer領域内の公知のあらゆる組合せの(たとえ天然に存在しなくても)どのSNPsをもカバーするプローブを含めることが必要であると考えられてきた。当該技術分野においては、いずれの多型部位においても、該部位で生じることが知られている対立遺伝子数の4乗のプローブが必要であるとみなされている。従って、隣接する12mer領域の各々に2個のSNPsが含まれる場合、隣接領域両方においては、13番目のポジションのSNPをタイプするのに必要なプローブの数は少なくとも2の4乗=16個となる。
【0058】
出願人のアプローチは独創的であり、いずれかのプローブ長部分配列における全ての多型部位がHLA遺伝子座の対立遺伝子全てに存在するとは限らないという認識に基づいている。
【0059】
如何なる理論によっても限定されるものではないが、HLA遺伝子座の場合、理論的可能性は観察される対立遺伝子配列よりも約5〜20倍高くなることが提案される。複合高SNP密度遺伝子座の一例としては、HLA−DRB領域遺伝子座(発現される遺伝子:DRB1、DRB3、DRB4、DRB5;偽遺伝子(発現されない):DRB2、DRB6、DRB7、DRB8、DRB9)が挙げられる。この領域内の両方の遺伝子カテゴリーには(約)483個の同定された対立遺伝子が存在する。可変性の第2のエクソンには270個のヌクレオチドが存在する。単純に掛け算すると、この遺伝子座で遺伝子型を決定するのに必要なプローブの数は130,410個となる。この知見に対する主な理由が2種類あり得る。(i)SNPsは染色体長上に受け継がれ、そのことによりSNPの連関はランダムにならないため、SNPsの組合せが連鎖不平衡を示すこと。(ii)集団が「ボトルネック」を経た結果、一部の多SNP対立遺伝子が消失し、且つ自然選択や組換え性向等の集団的遺伝因子の影響を受け、他の多SNP対立遺伝子の頻度が相対的に増加すること。
【0060】
本発明によって、高多型系(HLA遺伝子座等)における遺伝子型の同定に必要なプローブの数を減少させることができ、あらゆる対立遺伝子を同定するのに必要なプローブ全てが単一の典型的なマイクロアレイチップ上に固定化できるようになる。
【0061】
対立遺伝子を確定的に同定するのに必要なプローブの最終的な数が考慮中の遺伝子座によって決まることは理解されるであろう。しかし、本発明の方法の好ましい態様においては、必要と考えられるプローブの理論的な数に対して50%、60%、70%、80%、90%又は95%より多くプローブ数を減少させることができることが期待される。
【0062】
冗長な部分配列を全て除去すれば、プローブ数を最小限に抑えることに関して最大の利益が得られると考えられるが、本発明においては冗長な部分配列を全て除去することは必須ではない。実際、ある例においては、部分配列にある程度の冗長性が維持されるべき場合、内部品質管理メカニズムがもたらされる点で有利である。プローブセットにおける冗長性は、遺伝子座全域に亘って冗長性が生じているという事実に起因し得る。従って、遺伝子座全域に亘る冗長性に関わる冗長なプローブは、品質管理の目的で本発明によって提供されるプローブセットにおいて維持され得る。一例として、HLAクラスI及びクラスII遺伝子座において対立遺伝子型を、且つKIR遺伝子座において遺伝子及び対立遺伝子型をアサインメントするためにプローブリストを作成する場合、約34,500個のプローブが同定される。このリストによって、HLAクラスI遺伝子座(A、B、C)における超可変性エクソン2及び3、及びクラスII遺伝子座(DRB、DQB、DPB)におけるエクソン2を含む変異(variation)が同定されると共に、KIR遺伝子座の最大10個のエクソンにおける公知の変異(variation)全てが同定される。このプローブのリストにおいては、例えば、HLA−A、HLA−B及びHLA−Cや、DPB、DQB及びDRB等を比較すると、直列反復配列によって2167個の重複配列が存在する。

プローブタグ プローブ配列
5522A_E3_232_2_25 TCCGCAGATACCTGGAGAACAGGAA
15458C_E3_232_4_25 TCCGCAGATACCTGGAGAACAGGAA

プローブタグ プローブ配列
9492B_E3_13_17_25 TCCAGAGGATGTTTGGCTGCGACCT
13765C_E3_13_10_25 TCCAGAGGATGTTTGGCTGCGACCT

プローブタグ プローブ配列
22138R_E2_155_21_25 TGTCGCCGAGTACTGGAACAGCCAG
17957Q_E2_155_9_25 TGTCGCCGAGTACTGGAACAGCCAG

プローブタグ プローブ配列
21088R_E2_105_3_25 TTCGACAGCGACGTGGGGGAGTTCC
17442Q_E2_105_3_25 TTCGACAGCGACGTGGGGGAGTTCC
1601lP_E2_99_l_25 TTCGACAGCGACGTGGGGGAGTTCC
【0063】
プローブは次のようにラベルする。
a=連続プローブ番号
F=A、B、C、P、Q、R、Kのいずれか
E=エクソン
c=エクソン番号
d=エクソンの25mer領域の最初の塩基
e=1−30、1はリファレンス(コンセンサス)、固有の対立遺伝子型が連続して続く
f=プローブ長
【0064】
本発明の一態様においては、複製プローブ配列が品質保証の技術的要素及び遺伝的要素の両方に寄与するように保持される。具体的には、1個のプローブとの真のハイブリダイゼーションは、第1の遺伝子座の対立遺伝子を同定する他の全てのプローブに対する反応性に相当するが、同じプローブ配列が第2の遺伝子座のどちらの対立遺伝子の不可欠構成要素でもない場合、第2の遺伝子座の対立遺伝子を反映する反応性とは異なる反応性が、その複製物に存在する。
【0065】
この内部品質管理メカニズムの作動の一例としては、解決の最低レベルが対立遺伝子系統又はファミリーである。DRBを考えた場合、13の系統が存在する(*01、*03、*04、*07、*08、*09、*10、*11、*12、*13、*14、*15、*16)。4個のDRB発現遺伝子座全てに対するプローブを含めることによって、DRB3、DRB4及びDRB5の有無により、DRB1プローブの反応性とは関係なく、DRB1対立遺伝子の系統型に関する情報が得られる。
【0066】
本発明のコンテクストにおいて、用語「冗長」とは、部分配列の第1のセットからその配列が除去された場合に、関連ヌクレオチド配列の群のメンバーを同定する能力に明らかな差がないことを意味するものとする。冗長性は完全なもの(即ち、ヌクレオチド配列において2個の部分配列が同一である場合)として考えてもよく、不完全なもの(例えば、2個の部分配列が物理的には同一ではないが、機能的に同一である場合)として考えてもよい。従って、用いるハイブリダイゼーション条件によっては、2個の異なるプローブが単一のヌクレオチド配列に結合することもある(従って、これらのプローブは機能的に同一である)。このようなことは、ハイブリダイゼーション条件のストリンジェンシーが比較的低い場合に予想される。
【0067】
冗長でない配列又は冗長性の低い配列は、DNAシークエンシングによって先に同定された対立遺伝子に基づいて生成する。新しい多型を含む新しい対立遺伝子が同定された場合、更なる標的配列をプローブセットに入れ、その新しい多型を確実に検出するようにすることが必要となり得る。その新しい多型が、冗長であることが先に見出された標的配列内で生じている場合、新しい多型の知見に鑑みて、その標的配列はプローブ標的として必要となるため、冗長でなくなる。
【0068】
本発明の方法の一態様において、該方法は自動化に適応し得る。先行技術の方法(例えば、グオ(Guo)ら(2002)の方法)においては、観察される全てのSNPsの組合せをカバーするプローブを同定するため、全ての関連ヌクレオチド配列について慎重に検討した結果に基づいてプローブを設計している。当然のことながら、これは非常に手間がかかるものであり、その成功・不成功は解析を行う個人の専門知識に左右される。関連配列の数が非常に多い場合や対立遺伝子の数が非常に多い場合、プローブを設計する作業は実行不可能となり得る。これに対し、本発明の方法は、ソフトウェアに基づくプローブセットの設計の形態でコンピュータでの実施に特に適応し得る。
【0069】
本発明の方法は、様々な部分配列長さの組合せや様々なレベルの部分配列間の重複(overlap)を包含し得る。本発明の非常に好ましい態様においては、部分配列が約25ヌクレオチド長であり、重複の度合いが最大である。
【0070】
関連配列は、ある遺伝子の全ての公知の対立遺伝子に由来する配列を含んでもよい。或いは、関連配列は、公知の配列や従来公知でない配列を含んでもよい。例えば、ある遺伝子の所定の位置に多型が見出されることや、その位置に2種の代替型の内の1種(例えば、A又はT)が存在し得ることが知られている。その位置にG又はCが存在するような「仮定的」配列を含むことができる。或いは、所定の位置で多型の存在が知られていなくてもその存在が推測される場合には、3種の代替型を対象とするプローブをプローブセットに組み込むことができる。更に、本発明によって、新しい対立遺伝子をもたらす新しいSNPsの組合せを検出することができる。これらのアプローチは非常にプローブを必要とするものであるが、本発明を用いることによって、必要なプローブ数の大幅な減少により、そのアプローチは実行可能となる。部分配列間の最大重複を用いた場合には、新しい対立遺伝子を見出す機会が多くなる。
【0071】
従来認識されていない対立遺伝子の存在が上述の内部品質管理メカニズムによって見出されることは理解されるであろう。公知の対立遺伝子に不一致なプローブ反応性によって、アッセイにおける誤差の存在、或いは新しい対立遺伝子の存在が示されるであろう。
【0072】
上述のように、解析する対立遺伝子は、タンパク質コード領域のみを対象としてもよく、非コード領域のみを対象としてもよい。或いは、非コード領域とタンパク質コード領域の組合せを用いてもよい。
【0073】
他の様相において、本発明は、本明細書に記載の方法によって同定される標的ヌクレオチド配列に特異的にハイブリダイズすることが可能なプローブのセットを提供する。本発明の一態様において、該プローブセットは、当該技術分野で公知の方法によって設計されたプローブセットと比べて冗長性のレベルが低い。
【0074】
標的部分配列が与えられれば、当業者であれば、各標的部分配列にハイブリダイズすることが可能なプローブを合成することができるであろう。プローブは同定する冗長でない配列に対して実質的に相補的である。標的を二本鎖テンプレートから生成する場合、プローブはセンスであってもアンチセンスであってもよい。プローブは当業者に公知の如何なる方法によっても作製することができるが、プローブの最終用途によって恐らく最も適切な方法が決まるであろう。例えば、プローブをマイクロアレイ環境で用いる場合、アレイの固体支持体マトリックスを形成するガラスやナイロンウェハ上にてin situでプローブを合成することができる。他の用途の場合、自動化装置(例えば、ベックマン1000M DNA合成機)上でプローブを合成した後、PCR等の方法に用いて対立遺伝子を検出することができる。或いは、プローブを作製後、固体支持体に結合させることもできる。
【0075】
等の本発明の方法によって設計されるプローブにおいて、ロックされた核酸(locked nucleic acid)のような改変ヌクレオチドを用いることによって如何なる利益が得られるか検討することは、十分に当業者の能力の範囲内である。
【0076】
品質保証の目的の場合、プローブセットには必要に応じて、標的配列に完全にマッチするアレイ上の各プローブに対する一対の「ミスマッチ」プローブを組み込む。ミスマッチプローブには、25塩基プローブ配列の中央に直接位置する単一のミスマッチが含まれる。サンプルが完全マッチプローブに結合すると測定可能な蛍光が得られるが、一対のミスマッチプローブを用いて、その測定範囲内の偽蛍光や夾雑蛍光を検出して排除する。ミスマッチプローブは、その対応物とほぼ同程度に効率的に非特異的配列とハイブリダイズするため、完全マッチパートナーに対して内部対照として機能し、クロスハイブリダイゼーション等に由来する偽シグナルを効率的に定量化し、遺伝子発現測定値や遺伝子型コール(genotype call)から差し引くことができる。
【0077】
プローブには標識物質を組み込んで検出を容易にすることができる。標識物質の例としては、Cy5やCy3、FITC、ローダミン、ビオチン、DIG、各種ラジオアイソトープが挙げられる。
【0078】
本発明に従って生成されるプローブ配列リストは、mRNA転写物内の他のエクソンや該エクソンに介在又は隣接する配列(イントロンや5’及び3’非翻訳領域、遺伝子間領域等)における更なる対立遺伝子の変異(variation)を含むように拡張することができる。
【0079】
本発明は、他の様相においては、本明細書に記載のプローブのセットを用いて関連ヌクレオチド配列の群のメンバーを同定する方法を提供する。これを達成する一方法ではマイクロアレイ技術を用いる。従って、本発明は、他の様相においては、固体マトリックス上に固定化された本明細書に記載のプローブのセットを提供する。本発明のこの態様の典型的な実施形態は、Affymetrix(登録商標)が販売しているGeneChip(登録商標)の技術において見出される。この技術は、以下によるフォトリソグラフィープロセスに依拠するものである。5インチ×5インチ(12.7cm×12.7cm)の石英ウェハを、作製されたDNAプローブの最初のヌクレオチドと該ウェハとの結合を防止する感光性化学化合物でコートする。リソグラフィーマスクを用いて光を遮断したり、ウェハ表面の特定の位置上に光を通したりする。次いで、アデニン、チミン、シトシン又はグアニンのいずれかを含む溶液でウェハ表面を満たすと、ガラス上の光照射によって脱保護された領域においてのみ結合が生じる。また、結合したヌクレオチドは感光性保護基を有するため、このサイクルを反復することができる。プローブを固定化する他の方法は、多数の企業、例えば、オックスフォード・ジーン・テクノロジー社(英国、オックスフォード)やアジレント・テクノロジー社(米国、カリフォルニア州パロアルト)、Nimblegen Systems Inc(米国、ウィスコンシン州マディソン)等によって提供されている。
【0080】
本発明は、他の様相においては、本明細書に記載の方法を実施することが可能なコンピュータ実行可能プログラム(ソフトウェア)を提供する。本発明を手作業で実施することもできるが、適切なソフトウェアの指示の下、パーソナルコンピュータ上で実施するのが好ましい。本明細書における開示があれば、当業者であれば、適切なコードを書いて本発明の方法を実施することができるであろう。0101対立遺伝子DRB1遺伝子座の擬似コードの例は次の通りである。
【0081】
【数1】

【0082】
ソフトウェアには、特定の対立遺伝子を決定するのに必要なプローブの数に関するパラメータの範囲の影響を検討するための能力(facility)を備えることができる。このようにして、必要なプローブの数を更に減少させることが可能である。例えば、ソフトウェアによって、ユーザがプローブ長部分配列の長さや部分配列の重複の度合い、2個の部分配列が冗長であるかどうか定めるためのルール等を定めることができる。実際、各パラメータの範囲を自動的に試験するためのアルゴリズムをソフトウェアに組み込んで、プローブ長部分配列の最小数(従って、プローブセット内のプローブの数)を得ることができる。また、かなり大きな二次構造を有していることや、融解温度が高すぎ又は低すぎて関連する標的に確実にハイブリダイズしないことが考えられる場合、プローブセットから任意のプローブを除去することもできる。適合性の不足を示す経験的プローブ最適化実験に基づいてプローブセットから任意のプローブを除去することができる。
【0083】
本発明が広範囲の技術分野に適用されることは理解されるであろう。本発明の方法を個体のジェノタイピングに用いた場合、医学分野では特に利益が得られることが期待される。本発明の方法は、(例えば、HLA遺伝子やKIR遺伝子、副組織適合性遺伝子座等を用いた)移植組織タイピングや、薬理ゲノミクス、DNA「フィンガープリンティング」等において特に有用であろう。プローブは、マイクロアレイ用途だけでなく、in situハイブリダイゼーションやスロットブロット、ドットブロット、コロニーハイブリダイゼーション、プラークハイブリダイゼーション、ノーザンブロッティング、サザンブロッティングを含むいずれの用途にも用いることができる。
【0084】
本発明は、マイクロアレイ解析の分野だけでなく、ヌクレオチド配列の解析に必要なそれぞれ異なるプローブの数を減少させることが必要又は望ましい、いずれの用途においても有用であることが期待される。本発明は、多数のヌクレオチド配列の中から特定のヌクレオチド配列を同定する作業を行うのに必要なプローブの数がチップの容量を超える程には多くない場合でも適用し得るであろう。プローブ数を最小限に抑えることによって、他の遺伝子座の試験を1個のチップ上で行うことができ、多数の遺伝子座を1個のチップ上で試験することができるようになる。当然のことながら、20個のチップを操作するのに比べて、1個のチップを操作する方が低コストになる。
【0085】
霊長類等の非ヒト動物において、例えば、候補医薬品の前臨床薬理ゲノミクス的評価にも用途が広がることが期待される。また、本発明は、例えば、除脂肪筋肉量(lean muscle content)等のパラメータを改善するための育種プログラムにおいて、経済的に重要な動物(例えば、ウシや家禽等)を試験する上でも有用であると考えられる。
【実施例】
【0086】
次の非限定的実施例を参照しつつ本発明について更に説明する。当業者であれば、HLA遺伝子座が天然に見出される最も可変的な遺伝子座の一部であることは理解されるであろう。HLA遺伝子座に対して機能し得る方法であれば、他のいずれの遺伝子座に対しても機能し得ることは理解されるであろう。
実施例1:HLA−DRB遺伝子座の確定的ジェノタイピングのためのオリゴヌクレオチドプローブセットの同定
プロトコルの概略
【0087】
本発明の方法によってHLAのDRB遺伝子座を解析し、該遺伝子座の公知の対立遺伝子のいずれかを同定することが可能なプローブセットを同定した。DRB遺伝子座は次の公知の対立遺伝子を有する。
DRB1*010101, DRB1*010102, DRB1*010103, DRB1*010201, DRB1*010202, DRB1*010203,
DRB1*010204, DRB1*0103, DRB1*0104, DRB1*0105, DRB1*0106, DRB1*0107, DRB1*0108,
DRB1*0109, DRB1*0110, DRB1*0111, DRB1*0112, DRB1*0113, DRB1*030101,
DRB1*030102, DRB1*030201, DRB1*030202, DRB1*0303, DRB1*0304, DRB1*030501,
DRB1*030502, DRB1*0306, DRB1*0307, DRB1*0308, DRB1*0309, DRB1*0310, DRB1*0311,
DRB1*0312, DRB1*0313, DRB1*0314, DRB1*0315, DRB1*0316, DRB1*0317, DRB1*0318,
DRB1*0319, DRB1*0320, DRB1*0321, DRB1*0322, DRB1*0323, DRB1*0324, DRB1*0325,
DRB1*0326, DRB1*0327, DRB1*0328, DRB1*040101, DRB1*040102, DRB1*0402,
DRB1*040301, DRB1*040302, DRB1*0404, DRB1*040501, DRB1*040502, DRB1*040503,
DRB1*040504, DRB1*0406, DRB1*040701, DRB1*040702, DRB1*040703, DRB1*0408,
DRB1*0409, DRB1*0410, DRB1*0411, DRB1*0412, DRB1*0413, DRB1*0414, DRB1*0415,
DRB1*0416, DRB1*0417, DRB1*0418, DRB1*0419, DRB1*0420, DRB1*0421, DRB1*0422,
DRB1*0423, DRB1*0424, DRB1*0425, DRB1*0426, DRB1*0427, DRB1*0428, DRB1*0429,
DRB1*0430, DRB1*0431, DRB1*0432, DRB1*0433, DRB1*0434, DRB1*0435, DRB1*0436,
DRB1*0437, DRB1*0438, DRB1*0439, DRB1*0440, DRB1*0441, DRB1*0442, DRB1*0443,
DRB1*0444, DRB1*0445, DRB1*0446, DRB1*0447, DRB1*0448, DRB1*0449, DRB1*0450,
DRB1*0451, DRB1*0452, DRB1*070101, DRB1*070102, DRB1*0703, DRB1*0704,
DRB1*0705, DRB1*0706, DRB1*0707, DRB1*0708, DRB1*0709, DRB1*080101,
DRB1*080102, DRB1*080201, DRB1*080202, DRB1*080203, DRB1*080302, DRB1*080401,
DRB1*080402, DRB1*080403, DRB1*080404, DRB1*0805, DRB1*0806, DRB1*0807,
DRB1*0808, DRB1*0809, DRB1*0810, DRB1*0811, DRB1*0812, DRB1*0813, DRB1*0814,
DRB1*0815, DRB1*0816, DRB1*0817, DRB1*0818, DRB1*0819, DRB1*0820, DRB1*0821,
DRB1*0822, DRB1*0823, DRB1*0824, DRB1*0825, DRB1*0826, DRB1*0827, DRB1*0828,
DRB1*0829, DRB1*090102, DRB1*0902, DRB1*0903, DRB1*0904, DRB1*100101,
DRB1*100102, DRB1*110101, DRB1*110102, DRB1*110103, DRB1*110104, DRB1*110105,
DRB1*1102, DRB1*1103, DRB1*110401, DRB1*110402, DRB1*1105, DRB1*110601,
DRB1*110602, DRB1*1107, DRB1*110801, DRB1*110802, DRB1*1109, DRB1*1110,
DRB1*1111, DRB1*111201, DRB1*111202, DRB1*1113, DRB1*1114, DRB1*1115,
DRB1*1116, DRB1*1117, DRB1*1118, DRB1*111901, DRB1*111902, DRB1*1120,
DRB1*1121, DRB1*1122, DRB1*1123, DRB1*1124, DRB1*1125, DRB1*1126, DRB1*112701,
DRB1*112702, DRB1*1128, DRB1*1129, DRB1*1130, DRB1*1131, DRB1*1132, DRB1*1133,
DRB1*1134, DRB1*1135, DRB1*1136, DRB1*1137, DRB1*1138, DRB1*1139, DRB1*1140,
DRB1*1141, DRB1*1142, DRB1*1143, DRB1*1144, DRB1*1145, DRB1*1146, DRB1*1147,
DRB1*1148, DRB1*1149, DRB1*1150, DRB1*1151, DRB1*1152, DRB1*1153, DRB1*1154,
DRB1*120101, DRB1*120102, DRB1*120201, DRB1*120202, DRB1*120302, DRB1*1204,
DRB1*1205, DRB1*1206, DRB1*1207, DRB1*1208, DRB1*1209, DRB1*1210, DRB1*1211,
DRB1*130101, DRB1*130102, DRB1*130103, DRB1*130201, DRB1*130202, DRB1*130301,
DRB1*130302, DRB1*1304, DRB1*1305, DRB1*1306, DRB1*130701, DRB1*130702,
DRB1*1308, DRB1*1309, DRB1*1310, DRB1*1311, DRB1*1312, DRB1*1313, DRB1*131401,
DRB1*131402, DRB1*1315, DRB1*1316, DRB1*1317, DRB1*1318, DRB1*1319, DRB1*1320,
DRB1*1321, DRB1*1322, DRB1*1323, DRB1*1324, DRB1*1325, DRB1*1326, DRB1*1327,
DRB1*1328, DRB1*1329, DRB1*1330, DRB1*1331, DRB1*1332, DRB1*1333, DRB1*1334,
DRB1*1335, DRB1*1336, DRB1*1337, DRB1*1338, DRB1*1339, DRB1*1340, DRB1*1341,
DRB1*1342, DRB1*1343, DRB1*1344, DRB1*1345, DRB1*1346, DRB1*1347, DRB1*1348,
DRB1*1349, DRB1*1350, DRB1*1351, DRB1*1352, DRB1*1353, DRB1*1354, DRB1*1355,
DRB1*1356, DRB1*1357, DRB1*1358, DRB1*1359, DRB1*1360, DRB1*1361, DRB1*1362,
DRB1*1363, DRB1*1364, DRB1*1365, DRB1*1366, DRB1*140101, DRB1*140102,
DRB1*1402, DRB1*140301, DRB1*140302, DRB1*1404, DRB1*140501, DRB1*140502,
DRB1*1406, DRB1*140701, DRB1*140702, DRB1*1408, DRB1*1409, DRB1*1410,
DRB1*1411, DRB1*1412, DRB1*1413, DRB1*1414, DRB1*1415, DRB1*1416, DRB1*1417,
DRB1*1418, DRB1*1419, DRB1*1420, DRB1*1421, DRB1*1422, DRB1*142301,
DRB1*142302, DRB1*1424, DRB1*1425, DRB1*1426, DRB1*1427, DRB1*1428, DRB1*1429,
DRB1*1430, DRB1*1431, DRB1*1432, DRB1*1433, DRB1*1434, DRB1*1435, DRB1*1436,
DRB1*1437, DRB1*1438, DRB1*1439, DRB1*1440, DRB1*1441, DRB1*1442, DRB1*1443,
DRB1*1444, DRB1*1445, DRB1*1446, DRB1*1447, DRB1*1448, DRB1*150101,
DRB1*150102, DRB1*150103, DRB1*150104, DRB1*150105, DRB1*150201, DRB1*150202,
DRB1*150203, DRB1*1503, DRB1*1504, DRB1*1505, DRB1*1506, DRB1*1507, DRB1*1508,
DRB1*1509, DRB1*1510, DRB1*1511, DRB1*1512, DRB1*1513, DRB1*1514, DRB1*1515,
DRB1*160101, DRB1*160102, DRB1*160201, DRB1*160202, DRB1*1603, DRB1*1604,
DRB1*160501, DRB1*160502, DRB1*1607, DRB1*1608, DRB2*0101, DRB3*010101,
DRB3*01010201, DRB3*01010202, DRB3*010103, DRB3*010104, DRB3*0102, DRB3*0103,
DRB3*0104, DRB3*0105, DRB3*0106, DRB3*0107, DRB3*0108, DRB3*0109, DRB3*0110,
DRB3*0111, DRB3*0201, DRB3*020201, DRB3*020202, DRB3*020203, DRB3*020204,
DRB3*0203, DRB3*0204, DRB3*0205, DRB3*0206, DRB3*0207, DRB3*0208, DRB3*0209,
DRB3*0210, DRB3*0211, DRB3*0212, DRB3*0213, DRB3*0214, DRB3*0215, DRB3*0216,
DRB3*0217, DRB3*0218, DRB3*0219, DRB3*00101, DRB3*030102, DRB3*0302,
DRB3*0303, DRB4*01010101, DRB4*0102, DRB4*01030101, DRB4*01030102N,
DRB4*010302, DRB4*010303, DRB4*010304, DRB4*0104, DRB4*0105, DRB4*0106,
DRB4*0107, DRB4*0201N, DRB4*0301N, DRB5*010101, DRB5*010102, DRB5*0102,
DRB5*0103, DRB5*0104, DRB5*0105, DRB5*0106, DRB5*0107, DRB5*0108N, DRB5*0109,
DRB5*0110N, DRB5*0111, DRB5*0112, DRB5*0113, DRB5*0202, DRB5*0203, DRB5*0204,
DRB5*0205, DRB6*0101, DRB6*0201, DRB6*0202, DRB7*010101, DRB7*010102,
DRB8*0101, 及びDRB9*0101.
【0088】
25ヌクレオチド長の部分配列を選択し、最大の配列の重複を用いて一連の部分配列を得た。第2のエクソンを解析の開始点として選択し、第1の25mer部分配列をその13番目のヌクレオチド(下の配列の下線部参照)が第2のエクソンの最初の塩基と位置合わせされるように配置した。これについては、多くのDRB対立遺伝子に典型的な参照配列を用いて以下に示す。
イントロン1 エクソン2 ...
GTGTCCCCACAGACGTTTCTTGTG...
ステップ1:第2のエクソンの1番目のヌクレオチドを中心とするプローブを選択するための部分配列を定める
【0089】
第1の被験部分配列は、イントロン1とエクソン2との境界あたりのDRB遺伝子座の25個のヌクレオチドから成る部分配列である。この第1の部分配列の生成は、エクソン1の1番目のヌクレオチド(下線部の「C」残基)に対して行われる:GTGTCCCCACAGACGTTTCTTGTG(この配列は26個の対立遺伝子において見出される参照配列である)。
ステップ2:第2のエクソンの2番目のヌクレオチドを中心とするプローブを選択するための部分配列を定める
【0090】
25mer部分配列が2番目のヌクレオチドを中心とする以外は、ステップ1のプロトコルを反復する。また、参照配列を考慮すると、25mer部分配列はTGTCCCCACAGCACGTTTCTTGTGGである。
ステップ3〜284.第2のエクソンの3〜284番目のヌクレオチドを中心とするプローブを選択するための部分配列を定める
【0091】
エクソンの各ヌクレオチドに対してステップ1のプロトコルを反復する。
ステップ285:25mer部分配列のプール
【0092】
DRB遺伝子座の各対立遺伝子についての25mer部分配列の全てを組合わせて、該遺伝子座の全ての対立遺伝子を同定することが可能な標的ヌクレオチド配列のセットを形成する。
ステップ286:冗長な部分配列の除去
【0093】
全ての部分配列を解析し、冗長な配列(正確にマッチするもの)を除去して、それぞれ異なる部分配列のみを残す。第2のエクソンの270個のヌクレオチド全てに対してプロセスを実施した場合、約5,500個のそれぞれ異なる部分配列が生成されるにすぎないであろうと推定される。これは、先行技術で予測されたプローブ数に対して大幅な減少となる。
実施例2:マイクロアレイチップの作成
【0094】
カスタム遺伝子チップアレイサービスを提供しているAffymetrix社のマイクロアレイチップ上に、プールされた5,500個の標的ヌクレオチド配列を直接合成した。
実施例3:プローブを用いた個体のDRB対立遺伝子のアサインメント、同定を行う
患者サンプル
【0095】
末梢血や口腔塗抹標本のDNA抽出は標準的技法である。マイクロアレイアッセイには約1,000ngのDNAが推奨される。
ロングPCR
【0096】
プライマーはイントロン内、エクソン内又はその組合せで位置し得る。例えば、HLA−DRBタイピングの場合、プライマーはイントロン1内の上流、及びエクソン6内の下流で選択する。アンプリコンは約5.1kbである。イントロン配列をプライマー部位として用いる上で不都合な点は、通常、対応するエクソン配列に比べて配列データが少なく、エクソンの対立遺伝子に対応するデータが欠如していることである。HLA−DRBの場合、公開データによって、プライマーを選択するためのイントロン1のデータが十分に得られる。しかし、このような場合においても、シークエンシングを更に行うとほぼ確実に新しいSNPsが現れる。新しいSNPsがプライマー配列内で生じた場合、その新しいバリアントを有する配列の増幅が複雑になることが予想され得る。エクソン配列はより広く研究されてきたため、代替法ではエクソン配列を用いる。HLA−DRBの場合、プライマーに適した部位がエクソン1内の更に上流に存在する。エクソン1及びエクソン6のプライマーを用いたアンプリコンは8kbのイントロン1の全長に及んでいるため、得られるアンプリコンの長さは13kbを超える。出願人は、市販のロングPCRキットが17kbの増幅に適していることを確認しているため、エクソンのみをプライマーとしたアンプリコンも好適である。
アンプリコンの断片化
【0097】
プロトコルプロセスは非特異的であり、その結果、アンプリコンはせん断され、チップに付着したプローブへの効率的なハイブリダイゼーションに必要な数十〜数百のヌクレオチドの断片となる。詳細については次の文献、GeneChip(登録商標)CustomSeqTM Resequencing(Array Protocol)Version 2.0、701231 Rev.3に記載されているが、該文献の全内容を本明細書の一部を構成するものとしてここに援用する。この文献は、Affymetrix社(テクニカルサポート)(米国、95051、カリフォルニア州サンタクララ、セントラルエクスプレスウェイ 3380)から得ることができる。
ハイブリダイゼーション
【0098】
詳細については、GeneChip(登録商標)CustomSeqTM Resequencing(Array Protocol)Version 2.0、701231 Rev.3に記載されている。
対立遺伝子アサインメント
【0099】
対立遺伝子アサインメントは、反復軽減(iterative reduction)アルゴリズム(ヘルムバーグ(Helmberg)W、ランザー(Lanzer)G、ザーン(Zahn)R、ワインマイヤ(Weinmayr)B、ワグナー(Wagner)T、アルバート(Albert)E.仮想DNA解析−−SSO、SSP及びシークエンシングに基づくタイピング結果の組合せ及び標準化された評価のための新しいツール、Tissue Antigens.1998 Jun;51(6):587〜92)によってプローブハイブリダイゼーションパターンを対立遺伝子配列の変異(variation)に関連付けることによって行う。
実施例4:HLA−A*0201(エソン2及び3)における対立遺伝子型のアサインメントのためのプローブセットの作製
次のHLA*0201のエクソン配列を用いて、HLA−A*0201をアサインメントするためのプローブセットを作製した。プローブ作製の目的のため、5’方向及び3’方向の両方において、隣接するイントロン領域内にエクソン配列をヌクレオチド12個分だけ伸ばした。
【0100】
エクソン2:
GCTCCCACTCCATGAGGTATTTCTTCACATCCGTGTCCCGGCCCGGCCGCGGGGAGCCCCGCTTCATCGCCGTGGGCTACGTGGACGACACGCAGTTCGTGCGGTTCGACAGCGACGCCGCGAGCCAGAGGATGGAGCCGCGGGCGCCGTGGATAGAGCAGGAGGGTCCGGAGTATTGGGACGGGGAGACACGGAAAGTGAAGGCCCACTCACAGACTCACCGAGTGGACCTGGGGACCCTGCGCGGCTACTACAACCAGAGCGAGGCCG
【0101】
エクソン3:
GTTCTCACACCGTCCAGAGGATGTATGGCTGCGACGTGGGGTCGGACTGGCGCTTCCTCCGCGGGTACCACCAGTACGCCTACGACGGCAAGGATTACATCGCCCTGAAAGAGGACCTGCGCTCTTGGACCGCGGCGGACATGGCAGCTCAGACCACCAAGCACAAGTGGGAGGCGGCCCATGTGGCGGAGCAGTTGAGAGCCTACCTGGAGGGCACGTGCGTGGAGTGGCTCCGCAGATACCTGGAGAACGGGAAGGAGACGCTGCAGCGCACGG
【0102】
25ヌクレオチド長の部分配列を選択し、最大重複を用いた。
【0103】
上述の超可変エクソン2/3領域を同定することが可能なプローブセットを図2に示す。上述のもの以外の超可変領域を同定したい場合には、各超可変領域に対してプローブ生成プロセスを繰り返す。次いで、冗長なプローブ配列を除去することができる。
【0104】
最後に、本明細書に記載の本発明の精神から逸脱することなく、他の様々な変更及び/又は改変がなされ得ることは理解されるであろう。
【図面の簡単な説明】
【0105】
【図1A】プローブセットを選択する方法の仮想的応用を示す。ここでは、3種の関連の19merの配列(番号1、番号2及び番号3)がある。エクソン内の最初のヌクレオチドを1位とすると(即ち、その中の5番目のヌクレオチド)、エクソンには2個のSNPsが6位と11位とにある(下線)。図1Aは、部分配列間で完全に重複する部分を有する9merの部分配列に分割される関連配列を示す。
【図1B】プローブセットを選択する方法の仮想的応用を示す。ここでは、3種の関連の19merの配列(番号1、番号2及び番号3)がある。エクソン内の最初のヌクレオチドを1位とすると(即ち、その中の5番目のヌクレオチド)、エクソンには2個のSNPsが6位と11位とにある(下線)。図1Bは、関連配列番号1と、番号2と、番号3とからプールされた全ての部分配列を示す。
【図1C】プローブセットを選択する方法の仮想的応用を示す。ここでは、3種の関連の19merの配列(番号1、番号2及び番号3)がある。エクソン内の最初のヌクレオチドを1位とすると(即ち、その中の5番目のヌクレオチド)、エクソンには2個のSNPsが6位と11位とにある(下線)。図1Cは、図1Bからの冗長な部分配列の除去後の部分配列のセットを示す。この仮想例は必ずしも本発明の全ての利点を示しているわけではなく、単に本発明の方法の好ましい形態の実施を示すことを目的としたものであるということを強調しておく。
【図2−1】HLA−A*0201(エクソン2及び3)のアサインメントのための、本発明により同定されるプローブ配列を示す。プローブ間の最大の重複を有する25merのプローブの長さが選択された。
【図2−2】HLA−A*0201(エクソン2及び3)のアサインメントのための、本発明により同定されるプローブ配列を示す。プローブ間の最大の重複を有する25merのプローブの長さが選択された。
【図2−3】HLA−A*0201(エクソン2及び3)のアサインメントのための、本発明により同定されるプローブ配列を示す。プローブ間の最大の重複を有する25merのプローブの長さが選択された。
【図2−4】HLA−A*0201(エクソン2及び3)のアサインメントのための、本発明により同定されるプローブ配列を示す。プローブ間の最大の重複を有する25merのプローブの長さが選択された。
【図2−5】HLA−A*0201(エクソン2及び3)のアサインメントのための、本発明により同定されるプローブ配列を示す。プローブ間の最大の重複を有する25merのプローブの長さが選択された。
【図2−6】HLA−A*0201(エクソン2及び3)のアサインメントのための、本発明により同定されるプローブ配列を示す。プローブ間の最大の重複を有する25merのプローブの長さが選択された。
【図2−7】HLA−A*0201(エクソン2及び3)のアサインメントのための、本発明により同定されるプローブ配列を示す。プローブ間の最大の重複を有する25merのプローブの長さが選択された。
【図2−8】HLA−A*0201(エクソン2及び3)のアサインメントのための、本発明により同定されるプローブ配列を示す。プローブ間の最大の重複を有する25merのプローブの長さが選択された。
【図2−9】HLA−A*0201(エクソン2及び3)のアサインメントのための、本発明により同定されるプローブ配列を示す。プローブ間の最大の重複を有する25merのプローブの長さが選択された。

【特許請求の範囲】
【請求項1】
関連ヌクレオチド配列の群のメンバーを同定し得る標的ヌクレオチド配列のセットを同定するための方法であって、前記方法は前記群の各メンバーのヌクレオチド配列を複数の部分配列に分割するステップを含み、前記部分配列の内の少なくとも2個が重複する方法。
【請求項2】
前記部分配列の内の少なくとも3個が互いに重複する、請求項1に記載の方法。
【請求項3】
前記部分配列の内の少なくとも4個が互いに重複する、請求項1に記載の方法。
【請求項4】
前記部分配列の内の少なくとも5個が互いに重複する、請求項1に記載の方法。
【請求項5】
重複が完全重複である、請求項1に記載の方法。
【請求項6】
前記部分配列の少なくとも一部をその冗長性について分析するステップを含む、請求項1に記載の方法。
【請求項7】
前記部分配列の一以上が、当該一以上の部分配列の5’及び/又は3’末端に、又はこの末端近傍に、一以上の多型部位を含んでいない、請求項1に記載の方法。
【請求項8】
前記部分配列の一以上が、当該一以上の部分配列の中心に、又はこの中心近傍に、一以上の多型部位を含む、請求項1に記載の方法。
【請求項9】
前記部分配列の一以上が、当該一以上の部分配列の中心に一個の多型部位を含む、請求項1に記載の方法。
【請求項10】
前記関連配列が、一以上のヌクレオチド多型の存在によって互いに異なる、請求項1に記載の方法。
【請求項11】
前記ヌクレオチド多型が一塩基多型である、請求項10に記載の方法。
【請求項12】
前記部分配列の長さがプローブ長である、請求項1に記載の方法。
【請求項13】
前記部分配列の長さが約10〜約50ヌクレオチド長である、請求項1に記載の方法。
【請求項14】
前記部分配列の長さが約15〜約35ヌクレオチド長である、請求項1に記載の方法。
【請求項15】
前記部分配列の長さが約25ヌクレオチド長である、請求項1に記載の方法。
【請求項16】
全部分配列が同一又は類似の長さである、請求項1に記載の方法。
【請求項17】
前記関連ヌクレオチド配列が少なくとも50%、60%、70%、80%、90%、95%、或いは99%の配列同一性を有する、請求項1に記載の方法。
【請求項18】
前記関連配列が、一塩基多型を高密度で示す、請求項1に記載の方法。
【請求項19】
前記関連配列が、タンパク質コード配列、タンパク質非コード配列、或いは、タンパク質コード配列とタンパク質非コード配列の組合せである、請求項1に記載の方法。
【請求項20】
前記関連配列が、ゲノムの同一領域を対象とする、請求項1に記載の方法。
【請求項21】
前記関連ヌクレオチド配列が遺伝子の対立遺伝子である、請求項1に記載の方法。
【請求項22】
前記関連ヌクレオチド配列の群における関連ヌクレオチド配列の数が100超、200超、300超、400超、500超、600超、700超、800超、900超、或いは1000超である、請求項1に記載の方法。
【請求項23】
前記関連ヌクレオチド配列が、免疫系に関与する遺伝子座の一部である、請求項1に記載の方法。
【請求項24】
前記座が、主要組織適合遺伝子複合体(MHC)、T細胞受容体、B細胞受容体、キラー細胞抑制受容体、或いは免疫グロブリンの座である、請求項23に記載の方法。
【請求項25】
前記座がヒト白血球抗原(HLA)系の座である、請求項23に記載の方法。
【請求項26】
前記座がクラスI又はクラスII MHCの膜貫通タンパク質の座である、請求項23に記載の方法。
【請求項27】
前記座が、遺伝子座DR、DQ、又はDPである、請求項23に記載の方法。
【請求項28】
前記標的ヌクレオチド配列のセットから少なくとも一個の冗長配列を除去すること又は含有させないことを含む、請求項6に記載の方法。
【請求項29】
前記方法が、前記標的ヌクレオチド配列のセットにおける配列の数を、理論的に予想されるプローブ数から少なくとも約5倍、10倍或いは20倍減少させる、請求項28に記載の方法。
【請求項30】
前記方法が、プローブ数を少なくとも約50%、60%、70%、80%、90%、或いは95%減少させる、請求項28に記載の方法。
【請求項31】
実質的に全ての冗長配列を前記プローブセットから除去するか又は含有させない、請求項28に記載の方法。
【請求項32】
前記方法は自動化に適応しうる、請求項1に記載の方法。
【請求項33】
前記方法は、前記関連配列において新たな多型部位或いは多型部位の新たな組合せを同定可能である、請求項1に記載の方法。
【請求項34】
請求項1に記載の方法によって同定される標的ヌクレオチド配列に特異的にハイブリダイズ可能なプローブセット。
【請求項35】
少なくとも一個のプローブが、Cy5、Cy3、FITC、ローダミン、ビオチン、DIG、及びラジオアイソトープからなる群から選択される標識を含む、請求項34に記載のプローブセット。
【請求項36】
固定化された請求項34に記載のプローブセットを含む固体マトリックス。
【請求項37】
前記固体マトリックスがマイクロアレイチップである、請求項36に記載の固体マトリックス。
【請求項38】
請求項34に記載のプローブセットを利用して、関連ヌクレオチド配列の群のメンバーを同定する方法。
【請求項39】
請求項34に記載のプローブセットを利用することを含む、確定的対立遺伝子アサインメント方法。
【請求項40】
請求項34に記載のプローブセットを利用することを含む、HLAシステムに基づいた移植組織タイピング方法。
【請求項41】
請求項34に記載のプローブセットを利用することを含む、新たな対立遺伝子の同定方法。
【請求項42】
請求項1に記載の方法を実行できる、コンピュータ実行可能コード。
【請求項43】
本願の図面或いは実施例の何れかに言及して実質的に記載されている、請求項1に記載の方法。

【図1A】
image rotate

【図1B】
image rotate

【図1C】
image rotate

【図2−1】
image rotate

【図2−2】
image rotate

【図2−3】
image rotate

【図2−4】
image rotate

【図2−5】
image rotate

【図2−6】
image rotate

【図2−7】
image rotate

【図2−8】
image rotate

【図2−9】
image rotate


【公表番号】特表2009−516516(P2009−516516A)
【公表日】平成21年4月23日(2009.4.23)
【国際特許分類】
【出願番号】特願2008−541540(P2008−541540)
【出願日】平成18年11月21日(2006.11.21)
【国際出願番号】PCT/AU2006/001740
【国際公開番号】WO2007/056825
【国際公開日】平成19年5月24日(2007.5.24)
【出願人】(508151895)シモンズ ハプロミクス リミテッド (3)
【氏名又は名称原語表記】SIMONS HAPLOMICS LIMITED
【Fターム(参考)】