説明

生物学的バーコード

本発明は、組成物および有用な方法を提供するものであって、それらは、サンプルが生物的サンプル、または非生物的サンプルであろうと、どのような種類のサンプルに対しても、識別、証明、または認証を行うことができる。さらに、本発明は、サンプルの識別に充てる組成物を提供し、このサンプルは、識別されたサンプルを生成する、組成物および方法を用いて一意的に識別され、ならびに、その組成物および方法を用いて生成されたサンプルを識別する、組成物および方法を用いて、一意的に識別される。例えば、二つ以上のオリゴヌクレオチドを含む、本発明の組成物は、サンプルに添加し得る。ここで、この二つ以上のオリゴヌクレオチドの各々は、オリゴヌクレオチドが添加されたサンプルに対して、特異的にハイブリダイズし得ない。

【発明の詳細な説明】
【技術分野】
【0001】
(関連出願)
本出願は、2003年4月29日に出願された、出願番号10/426,940の出願に対して優先権を主張するものであり、この出願は本願において参考として援用される。
【0002】
(技術分野)
本発明は、サンプルの妥当性、信頼性、または精度を確認するために、サンプルを識別する、組成物および方法に関し、そして、本発明は、より具体的には、バーコード化されたサンプルおよびアーカイブ、サンプルをバーコード化する方法、ならびに、バーコード化されたサンプルに対しての、識別方法、証明方法、および認証方法であり、このようなコード化は、生体分子、生体分子の改変形態、または生体分子の誘導体を用いて、行われ得る。
【背景技術】
【0003】
ヒトの患者からの匿名のDNAサンプルが液体状態であり、および操作中の間違いが起こりやすい場合、そのDNAサンプルの識別が困難となり得る。多くの他の生物学的サンプル、および複数の他の非生物学的サンプルは、見分けがつかないか、または識別における間違いが起こり得る。チューブ上のバーコードラベル、または容器上のバーコードラベルは、そのような識別上の問題に対して、部分的な解決策しか提供できない。なぜならば、それらのラベルは、剥がれ落ち得るか、不明瞭になり得るか、取り去られてしまい得るか、または、もしそうでなければ、読み取り不可能となり得る。さらに、このようなバーコードラベルは、容易に偽造される。核酸サンプルは、備え付けの識別コードを提供できるが、しかし、識別するための核酸の情報が手元にある、またはその情報が入手され得る場合においてのみ有用である。長い一意的なオリゴヌクレオチド配列は、識別の手段として添加されてきたが、しかし、この識別手段は、各々のサンプル、およびすべてのサンプルに対して一意的な配列が合成されることを必要とし、そして、そのオリゴヌクレオチドの配列を識別する費用のかかる配列決定分析が、必要とされる。本発明は、このような不十分な現在の識別方法に取り組み、そして、関連する利益を提供するものである。
【発明の開示】
【課題を解決するための手段】
【0004】
(要旨)
本発明は、サンプルの識別を可能にする組成物、その組成物によって一意的に識別されるサンプル、ならびに識別されるサンプルを製造する方法、およびそのように製造されたサンプルを識別する方法を提供する。例えば、二つ以上のオリゴヌクレオチドを含む、本発明の組成物は、サンプルに添加され得、ここで、この二つ以上のオリゴヌクレオチドの各々は、そのオリゴヌクレオチドが添加された上記サンプルに対して、特異的にハイブリダイズし得ず、上記オリゴヌクレオチドの各々は、互いに物理的差異または化学的差異を有し(例えば、それらの長さまたは配列)、そして、そのサンプルの識別を可能にする一意的な組合せとして存在する。
【0005】
一実施形態において、二つ以上のオリゴヌクレオチドおよびサンプルを含む組成物であり、このオリゴヌクレオチドは、第一のオリゴヌクレオチドセットとして表され、この第一のオリゴヌクレオチドセットは、上記サンプルに特異的にハイブリダイズし得ないオリゴヌクレオチドを含み、上記オリゴヌクレオチドは、約8ヌクレオチド〜50Kbヌクレオチドの長さを有するオリゴヌクレオチドを含む。上記第一のオリゴヌクレオチドセットは、オリゴヌクレオチドを含み、このオリゴヌクレオチドの各々は、上記第一のオリゴヌクレオチドセット中の他のオリゴヌクレオチドとの物理学的差異または化学的差異を有し、そして、必要に応じて、上記第一のオリゴヌクレオチドセットは、第一のプライマーセットとして表される一意的なプライマーペアに特異的にハイブリダイズし得る異なる配列をその中に有する一つ以上のオリゴヌクレオチドを含む。一つの局面では、オリゴヌクレオチドの長さが異なる。種々のさらなる局面では、上記セットは、二つのオリゴヌクレオチドを含み、A〜Bによって表され、そして上記一意的な組合せが、Bとともに、またはそれを含まずに、Aを含むか;Aとともに、またはそれを含まずに、Bを含む;上記セットは、三つのオリゴヌクレオチドを含み、A〜Cによって表され、そして上記一意的な組合せが、BもしくはCとともに、またはそれらを含まずに、Aを含むか;AもしくはCとともに、またはそれらを含まずに、Bを含むか;あるいは、AもしくはBとともに、またはそれらを含まずに、Cを含む;上記セットは、四つのオリゴヌクレオチドを含み、A〜Dによって表され、そして上記一意的な組合せが、BもしくはCもしくはDとともに、またはそれらを含まずに、Aを含むか;AもしくはCもしくはDとともに、またはそれらを含まずに、Bを含むか;AもしくはBもしくはDとともに、またはそれらを含まずに、Cを含むか;あるいは、AもしくはBもしくはCとともに、またはそれらを含まずに、Dを含む;上記セットは、五つのオリゴヌクレオチドを含み、A〜Eによって表され、そして上記一意的な組合せが、BもしくはCもしくはDもしくはEとともに、またはそれらを含まずに、Aを含むか;AもしくはCもしくはDもしくはEとともに、またはそれらを含まずに、Bを含むか;AもしくはBもしくはDもしくはEとともに、またはそれらを含まずに、Cを含むか;AもしくはBもしくはCもしくはEとともに、またはそれらを含まずに、Dを含むか;あるいは、AもしくはBもしくはCもしくはDとともに、またはそれらを含まずに、Eを含む;上記セットは、六つのオリゴヌクレオチドを含み、A〜Fによって表され、そして上記一意的な組合せが、BもしくはCもしくはDもしくはEもしくはFとともに、またはそれらを含まずに、Aを含むか;AもしくはCもしくはDもしくはEもしくはFとともに、またはそれらを含まずに、Bを含むか;AもしくはBもしくはDもしくはEもしくはFとともに、またはそれらを含まずに、Cを含むか;AもしくはBもしくはCもしくはEもしくはFとともに、またはそれらを含まずに、Dを含むか;AもしくはBもしくはCもしくはDもしくはFとともに、またはそれらを含まずに、Eを含むか;あるいは、AもしくはBもしくはCもしくはDもしくはEとともに、またはそれらを含まずに、Fを含む;あるいは、上記セットは、七つのオリゴヌクレオチドを含み、A〜Gによって表され、そして上記一意的な組合せが、BもしくはCもしくはDもしくはEもしくはFもしくはGとともに、またはそれらを含まずに、Aを含むか;AもしくはCもしくはDもしくはEもしくはFもしくはGとともに、またはそれらを含まずに、Bを含むか;AもしくはBもしくはDもしくはEもしくはFもしくはGとともに、またはそれらを含まずに、Cを含むか;AもしくはBもしくはCもしくはEもしくはFもしくはGとともに、またはそれらを含まずに、Dを含むか;AもしくはBもしくはCもしくはDもしくはFもしくはGとともに、またはそれらを含まずに、Eを含むか;AもしくはBもしくはCもしくはDもしくはEもしくはGとともに、またはそれらを含まずに、Fを含むか;あるいは、AもしくはBもしくはCもしくはDもしくはEもしくはFとともに、またはそれらを含まずに、Gを含む。
【0006】
さらなる実施形態において、一意的な組合せとしては、2〜5、5〜10、10〜15、15〜20、20〜25、25〜30、30〜40、40〜50、50〜75、75〜100、またはそれ以上のオリゴヌクレオチドの一意的な組合せが挙げられる。セット中のオリゴヌクレオチドは、同じ配列の長さか、または異なる配列の長さを有し得る。例えば、少なくとも一つ分のヌクレオチドが異なる。一つの局面では、上記オリゴヌクレオチドは、約10〜5000塩基対;10〜3000塩基対;12〜1000塩基対;12〜500塩基対;または15〜250塩基対;あるいは、約18〜250塩基対、20〜200塩基対、20〜150塩基対、25〜150塩基対、25〜100塩基対、または、25〜75塩基対の長さを有する。上記オリゴヌクレオチドは、一本鎖、二本鎖、または三本鎖の、デオキシリボ核酸(DNA)またはリボ核酸(RNA)であり得る。
【0007】
さらなる実施形態において、組成物は、2以上のオリゴヌクレオチドおよびサンプルを含み、この二つ以上のオリゴヌクレオチドは、二つ以上のオリゴヌクレオチドセット中に含まれる。一つの局面では、それゆえに、第二のオリゴヌクレオチドセットと表される、一つ以上のオリゴヌクレオチドを含む組成物であり、この第二のオリゴヌクレオチドセットは、上記サンプルに特異的にハイブリダイズし得ないオリゴヌクレオチドを含み、上記第二のオリゴヌクレオチドは、約8ヌクレオチド〜50Kbヌクレオチドの長さを有するオリゴヌクレオチドを含む。上記第二のオリゴヌクレオチドは、オリゴヌクレオチドを含み、このオリゴヌクレオチドの各々は、上記第二のオリゴヌクレオチドセット中の他のオリゴヌクレオチドとは物理学的差異または化学的差異を有し、そして、必要に応じて、上記第二のオリゴヌクレオチドセットは、第二のプライマーセットとして表される一意的なプライマーペアに特異的にハイブリダイズし得る異なる配列をその中に有する一つ以上のオリゴヌクレオチドを含む。さらなる局面では、さらなるセットからの一つ以上のオリゴヌクレオチドは、上記サンプルに添加され、ならびに、この一つ以上のオリゴヌクレオチドは、第一のオリゴヌクレオチドセットおよび第二のオリゴヌクレオチドセット中の一つ以上のオリゴヌクレオチドに添加される。例えば、第三のオリゴヌクレオチドセットと表される一つ以上のオリゴヌクレオチドであり、この第三のオリゴヌクレオチドセットは、上記サンプルに特異的にハイブリダイズし得ないオリゴヌクレオチドを含み、上記第三のオリゴヌクレオチドは、約8ヌクレオチド〜50Kbヌクレオチドの長さを有するオリゴヌクレオチドを含む。上記第三のオリゴヌクレオチドセットは、オリゴヌクレオチドを含み、このオリゴヌクレオチドの各々は、上記第三のオリゴヌクレオチドセット中の他のオリゴヌクレオチドとは物理学的差異または化学的差異を有し、そして、必要に応じて、上記第三のオリゴヌクレオチドセットは、第三のプライマーセットとして表される一意的なプライマーペアに特異的にハイブリダイズし得る異なる配列をその中に有する一つ以上のオリゴヌクレオチドを含む;第四のオリゴヌクレオチドセットと表される一つ以上のオリゴヌクレオチドであり、この第四のオリゴヌクレオチドセットは、上記サンプルに特異的にハイブリダイズし得ないオリゴヌクレオチドを含み、上記第四のオリゴヌクレオチドセットは、約8ヌクレオチド〜50Kbヌクレオチドの長さを有するオリゴヌクレオチドを含む。上記第四のオリゴヌクレオチドセットは、オリゴヌクレオチドを含み、このオリゴヌクレオチドの各々は、上記第四のオリゴヌクレオチドセット中の他のオリゴヌクレオチドとは物理学的差異または化学的差異を有し、そして、必要に応じて、上記第四のオリゴヌクレオチドセットは、第四のプライマーセットとして表される一意的なプライマーペアに特異的にハイブリダイズし得る異なる配列をその中に有する一つ以上のオリゴヌクレオチドを含む;第五のオリゴヌクレオチドセットと表される一つ以上のオリゴヌクレオチドであり、この第五のオリゴヌクレオチドセットは、上記サンプルに特異的にハイブリダイズし得ないオリゴヌクレオチドを含み、上記第五のオリゴヌクレオチドセットは、約8ヌクレオチド〜50Kbヌクレオチドの長さを有するオリゴヌクレオチドを含む。上記第五のオリゴヌクレオチドセットは、オリゴヌクレオチドを含み、このオリゴヌクレオチドの各々は、上記第五のオリゴヌクレオチドセット中の他のオリゴヌクレオチドとは物理学的差異または化学的差異を有し、そして、必要に応じて、上記第五のオリゴヌクレオチドセットは、第五のプライマーセットとして表される一意的なプライマーペアに特異的にハイブリダイズし得る異なる配列をその中に有する一つ以上のオリゴヌクレオチドを含む;第六のオリゴヌクレオチドセットと表される一つ以上のオリゴヌクレオチドであり、この第六のオリゴヌクレオチドセットは、上記サンプルに特異的にハイブリダイズし得ないオリゴヌクレオチドを含み、上記第六のオリゴヌクレオチドセットは、約8ヌクレオチド〜50Kbヌクレオチドの長さを有するオリゴヌクレオチドを含む。上記第六のオリゴヌクレオチドセットは、オリゴヌクレオチドを含み、このオリゴヌクレオチドの各々は、上記第六のオリゴヌクレオチドセット中の他のオリゴヌクレオチドとは物理学的差異または化学的差異を有し、そして、必要に応じて、上記第六のオリゴヌクレオチドセットは、第六のプライマーセットとして表される一意的なプライマーペアに特異的にハイブリダイズし得る異なる配列をその中に有する一つ以上のオリゴヌクレオチドを含む;枚挙にいとまがない。個別的な局面において、オリゴヌクレオチドの長さは異なる。さらなる局面において、第一のオリゴヌクレオチドセット、第二のオリゴヌクレオチドセット、第三のオリゴヌクレオチドセット、第四のオリゴヌクレオチドセット、第五のオリゴヌクレオチドセット、または第六のオリゴヌクレオチドセットなどの、オリゴヌクレオチドセット中の一つ以上のオリゴヌクレオチドは、第一のオリゴヌクレオチドセット、第二のオリゴヌクレオチドセット、第三のオリゴヌクレオチドセット、第四のオリゴヌクレオチドセット、第五のオリゴヌクレオチドセット、または第六のオリゴヌクレオチドセットなどの、オリゴヌクレオチドセット中のオリゴヌクレオチドに対して、同じ配列の長さか、または異なる配列の長さを有する。さらなる局面において、各々のさらなるオリゴヌクレオチドセット中の、一つ以上のオリゴヌクレオチドは、例えば、第三のオリゴヌクレオチドセット、第四のオリゴヌクレオチドセット、第五のオリゴヌクレオチドセット、第六のオリゴヌクレオチドセットなどのオリゴヌクレオチドセット中の、オリゴヌクレオチドであり、この一つ以上のオリゴヌクレオチドは、第一のオリゴヌクレオチドセット、第二のオリゴヌクレオチドセット、第三のオリゴヌクレオチドセット、第四のオリゴヌクレオチドセットなどの、オリゴヌクレオチドセット中のオリゴヌクレオチドに対して、同じ配列の長さか、または異なる配列の長さを有する。したがって、例えば、一つの局面において、第一のオリゴヌクレオチドセット中のオリゴヌクレオチド、第二のオリゴヌクレオチド中のオリゴヌクレオチド、第三のオリゴヌクレオチド中のオリゴヌクレオチド、第四のオリゴヌクレオチド中のオリゴヌクレオチド、第五のオリゴヌクレオチド中のオリゴヌクレオチド、または、第六のオリゴヌクレオチド中のオリゴヌクレオチドは、第二のオリゴヌクレオチド中のオリゴヌクレオチド、第三のオリゴヌクレオチド中のオリゴヌクレオチド、第四のオリゴヌクレオチド中のオリゴヌクレオチド、または、第五のオリゴヌクレオチド中のオリゴヌクレオチドの各々に対して、同じ配列の長さか、または異なる配列の長さを有する。
【0008】
その上さらなる実施形態において、プライマーセット中の一つ以上の一意的なプライマーペアを含む組成物である。例えば、このプライマーセットとは、上記プライマーセットとして表される一つ以上の上記オリゴヌクレオチドに対して、特異的にハイブリダイズする第一のプライマーセットを含む、第一のプライマーセットであり、この一意的なプライマーペアとは、第一のセット、第二のセット、第三のセット、第四のセット、第五のセット、第六のセットなどのセットとして表される、オリゴヌクレオチドを含む組成物である。
なおさらなる実施形態において、組成物は、プライマーセット中の一つ以上の一意的なプライマーペアを含む。例えば、第一のセット、第二のセット、第三のセット、第四のセット、第五のセット、第六のセットなどのセットとして表されるオリゴヌクレオチドは、第一のプライマーセット、第二のプライマーセット、第三のプライマーセット、第四のプライマーセット、第五のプライマーセット、第六のプライマーセットなどのプライマーセットを含み、これらのプライマーセットは、上記第一のセット、上記第二のセット、上記第三のセット、上記第四のセット、上記第五のセット、上記第六のセットなどのセットとして表される一つ以上の上記オリゴヌクレオチドと、特異的にハイブリダイズする。上記一意的なプライマーペア中の上記プライマーは、以下の長さのうちのどれかの長さを有し得る。以下の長さとは、例えば、約8〜250ヌクレオチド、10〜200ヌクレオチド、10〜150ヌクレオチド、10〜125ヌクレオチド、12〜100ヌクレオチド、12〜75ヌクレオチド、15〜60ヌクレオチド、15〜50ヌクレオチド、18〜50ヌクレオチド、20〜40ヌクレオチド、25〜40ヌクレオチド、または25〜35ヌクレオチドである。上記一意的なプライマーペア中の上記プライマーは、上記プライマーが結合するオリゴヌクレオチドの約9/10、4/5、3/4、7/10、3/5、1/2、2/5、1/3、3/10、1/4、1/5、1/6、1/7、1/8、1/10の長さを有し得る。プライマーは、上記オリゴヌクレオチドの3’末端もしくは5’末端の配列に対して、または上記3’末端付近もしくは5’末端付近の配列に対して結合し得る。プライマーは、例えば、上記オリゴヌクレオチドの3’末端もしく5’末端の約1〜25ヌクレオチド以内で、同じ長さもしくは異なる長さを有し得る。プライマーは、同じ長さもしくは異なるが長さを有し、例えば、上記一意的なプライマーペア中のプライマーの各々は、約0〜50塩基対、0〜25塩基対、0〜10塩基対、または0〜5塩基対の長さにおいて異なり;プライマーは、一つ以上の前記オリゴヌクレオチドのうちすべてまたは少なくとも一部分に対して、相補的である。例えば、40〜60%、60〜80%、80〜95%またはそれ以上(プライマーは100%相同である、または100%相補性を有する必要がない)であり;そして、プライマーは、配列に対して100%相補的であり得る。
【0009】
サンプルはどれでも、いずれのかの物理学的存在物を含む。代表的なサンプルは、薬、生物学的サンプルおよび非生物学的サンプルを含む。非生物学的サンプルはどれも、文書(例えば、証拠文書、遺言書、身分証明書、出生証明書、署名カード、運転免許書、社会保障カード、グリーンカード、パスポート、手紙、またはクレジットカードもしくはデビットカード)、通貨、証書、株券、契約書、札、芸術作品、記録媒体(例えば、デジタル記録媒体)、電子装置、装置もしくは楽器、宝石もしくは貴金属、または危険物(例えば、武器、弾薬、爆発物、または爆発物の調製に適している組成物)を含む。
【0010】
生物学的サンプルは、食品(牛肉、豚肉、子羊の肉、鳥、または魚のような肉類または野菜)、飲料(アルコール飲料またはノンアルコール飲料)を含む。生物学的サンプルは、組織サンプル、法医学的サンプル、および、例えば、血液、血漿、漿液、痰、精液、尿、粘液、または脳脊髄液のような流体を含む。生物学的サンプルはどれでも、生きている細胞もしくは生きていない細胞を含み、例えば、卵子もしくは精子、細菌もしくはウイルス、病原体、核酸(例えば、ヒトの核酸のような哺乳動物の核酸、もしくは非哺乳動物の核酸)、蛋白質、炭水化物をさらに含む。概して、核酸のサンプルは、上記オリゴヌクレオチドの異なる配列、または上記プライマーペアーの異なる配列に対して、50%未満の相同性を有し、このようなオリゴヌクレオチドまたはプライマーペアは、上記コードを生成するのを妨げる範囲で、上記核酸に対して、特異的にハイブリダイズし得ない。従って、個別的な局面おいて、細菌の核酸であり、そして、上記細菌の核酸に特異的にハイブリダイズせず、ウイルスの核酸であり、そして、上記ウイルスの核酸に特異的にハイブリダイズしない。
【0011】
オリゴヌクレオチド、例えば、ヌクレアーゼ耐性となるよう改変され得る。組成物は、保存剤を含み、例えば、ヌクレアーゼ阻害剤である、EDTA、EGTA、グアニジン、チオシアン酸塩、または尿酸である。オリゴヌクレオチドは、上記サンプルに対して、混合されている、加えられている、または埋め込まれている。例えば、上記オリゴヌクレオチドは、基材(透過性、半透過性、または不透過性の、二次元面または三次元構造体からなる基材、例えば、複数のウェル)に対して、結合している、利用されている、添付されている、または埋め込まれている。オリゴヌクレオチドは、上記基材からの物理学的な分離が可能、または、上記基材からの物理学的な分離が不可能であり、例えば、上記基材に結合するための十分量の前記サンプルが残されている条件下において、上記オリゴヌクレオチドは分離され得る。
【0012】
その上さらなる実施形態において、三つ以上の一意的なプライマーペアおよび二つ以上のオリゴヌクレオチドを含む組成物であり、必要に応じて、サンプルと結合する。ここで、この一意的なプライマーペアは、第一のプライマーセット、第二のプライマーセット、第三のプライマーセット、第四のプライマーセット、第五のプライマーセット、または、第六のプライマーセットなどのプライマーセットとして表され、この一意的なプライマーペアの各々は、異なる配列を有する。少なくとも二つの上記一意的なプライマーペアは、二つのオリゴヌクレオチドに対して、特異的にハイブリダイズし得、ここで、このオリゴヌクレオチドとは、第一のオリゴヌクレオチドセット、第二のオリゴヌクレオチドセット、第三のオリゴヌクレオチドセット、第四のオリゴヌクレオチドセット、第五のオリゴヌクレオチドセット、または、第六のオリゴヌクレオチドセットなどのオリゴヌクレオチドセットとして表される。上記オリゴヌクレオチドは、約8ヌクレオチド〜50Kbの長さを有し、このオリゴヌクレオチドの各々は、同じオリゴヌクレオチドセット中の他のオリゴヌクレオチドとの、物理的差異または化学的差異を有する。種々の局面において、組成物はさらなる一意的なプライマーペアを含む。この一意的なプライマーペアとは、例えば、四つ以上の一意的なプライマーペア、五つ以上の一意的なプライマーペア、六つ以上の一意的なプライマーペアである。更なる局面において、組成物は、さらなるオリゴヌクレオチド(例えば、3、4、5、6またはそれ以上のオリゴヌクレオチドなど)を含む。なおさらなる局面において、組成物は一つ以上のオリゴヌクレオチドを含み、このオリゴヌクレオチドは、第二のオリゴヌクレオチドセット、第三のオリゴヌクレオチドセット、第四のオリゴヌクレオチドセット、第五のオリゴヌクレオチドセット、第六のオリゴヌクレオチドセットなどのオリゴヌクレオチドセットとして表される。第二のオリゴヌクレオチド、第三のオリゴヌクレオチド、第四のオリゴヌクレオチド、第五のオリゴヌクレオチド、第六のオリゴヌクレオチドなどのオリゴヌクレオチドのオリゴヌクレオチドセットは、一意的な対応するプライマーペアに特異的にハイブリダイズし得る異なる配列をその中に有する、一つ以上のオリゴヌクレオチドを含む。この一意的に対応するプライマーペアとは、第二のプライマーセット、第三のプライマーセット、第四のプライマーセット、第五のプライマーセット、第六のプライマーセットなどのプライマーセットとして表される。第二のオリゴヌクレオチドセット、第三のオリゴヌクレオチドセット、第四のオリゴヌクレオチドセット、第五のオリゴヌクレオチドセット、第六のオリゴヌクレオチドセットなどのオリゴヌクレオチドは、上記サンプルに特異的にハイブリダイズし得ないオリゴヌクレオチドを含む。第二のオリゴヌクレオチドセット、第三のオリゴヌクレオチドセット、第四のオリゴヌクレオチドセット、第五のオリゴヌクレオチドセット、第六のオリゴヌクレオチドセットなどのオリゴヌクレオチドセットは、約8ヌクレオチド〜50Kbの長さを有するオリゴヌクレオチドを含む。第二のオリゴヌクレオチドセット、第三のオリゴヌクレオチドセット、第四のオリゴヌクレオチドセット、第五のオリゴヌクレオチドセット、第六のオリゴヌクレオチドセットなどのオリゴヌクレオチドセットは、オリゴヌクレオチドを含み、このオリゴヌクレオチドの各々は、第二のオリゴヌクレオチドセット、第三のオリゴヌクレオチドセット、第四のオリゴヌクレオチドセット、第五のオリゴヌクレオチドセット、第六のオリゴヌクレオチドセットなどのオリゴヌクレオチドセットを含む、他のオリゴヌクレオチドに対して、物理的差異または化学的差異を有する。
【0013】
なおさらなる実施形態において、本発明の組成物は、有機溶液もしくは水溶液であり、この溶液は、一つ以上の相(ポリメラーゼ連鎖反応(PCR)に適合)、スラリー、半固体、もしくは固体を含む。さらなる実施形態において、本発明の組成物は、キット中に含まれる。
【0014】
本発明は、生物学的タグされたサンプルを生成する方法を提供する。一実施形態において、サンプルに添加する二つ以上のオリゴヌクレオチドの組合せを選択する方法を含む。このオリゴヌクレオチドは、二つ以上のオリゴヌクレオチドセット中の、任意のオリゴヌクレオチドあり、上記サンプルに特異的にハイブリダイズし得ない。上記オリゴヌクレオチドは、8ヌクレオチド〜5000ヌクレオチドの長さを有し、そして、各々のセット中の上記オリゴヌクレオチドは、物理的差異もしくは化学的差異(例えば、オリゴヌクレオチドの長さもしくは配列)を有し、そして、各々のセット中の上記オリゴヌクレオチドは、上記サンプルに、二つ以上のオリゴヌクレオチドの組合せを添加する。ここで、上記サンプルを識別するオリゴヌクレオチドの組合せは、それによって、生物学的タグされたサンプルを生成する。ひとつの局面において、一つ以上の上記オリゴヌクレオチドは、一意的なプライマーペアに特異的にハイブリダイズし得る異なる配列をその中に含む。
【0015】
本発明は、さらに、生物学的タグ化されたサンプルを識別する方法を提供する。一実施形態において、二つ以上のオリゴヌクレオチドのサンプル中に存在または非存在を検出する方法を含む。ここで、このオリゴヌクレオチドは、生物的差異もしくは化学的差異に基づいて識別し、それによって、上記サンプル中のオリゴヌクレオチドの組合せを識別し;オリゴヌクレオチドの組合せとデータベースとを比較する。このデータベースは、特定のサンプルを識別する、既知の特定のオリゴヌクレオチドの組合せを含み;そして、上記データベース中の上記特定のオリゴヌクレオチドの組合せに基づいて、上記サンプルを識別する。上記データベースは、上記サンプル中の上記オリゴヌクレオチドの組合せと一致する。一つの局面において、サンプルの識別は、上記オリゴヌクレオチドの異なる長さに基づいて識別する。もうひとつの局面において、サンプルの識別は、上記オリゴヌクレオチドの異なる配列に基づいて識別する。さらなるもう一つの局面において、識別は、すべてのオリゴヌクレオチドの塩基配列決定を必要としない。例えば、上記サンプルを識別する一つ以上の上記オリゴヌクレオチドに対して、特異的にハイブリダイズする、プライマーもしくはプライマーペアに基づいた識別である。なおさらなるもう一つの局面において、識別は、上記オリゴヌクレオチドの異なる長さに基づいての識別か、または、異なる配列を有する二つ以上の一意的なプライマーペアに対してのハイブリダイゼーションを用いる識別であり、必要に応じて、増幅(例えば、PCR)される。
【0016】
本発明は、さらに生物コード化されたサンプルのアーカイブを提供するものである。一実施形態において、サンプルを含むアーカイブであり;そして、二つ以上のオリゴヌクレオチドを含む。このオリゴヌクレオチドは、上記サンプルに対して、特異的にハイブリダイズし得ず、このオリゴヌクレオチドは、約8〜50Kbの長さの異なる配列を有する。上記オリゴヌクレオチドの各々は、物理的差異もしくは化学的差異(例えば、長さもしくは配列)を有する。そして、必要に応じて、一つ以上の上記オリゴヌクレオチドは、一意的なプライマーペアに対して、特異的にハイブリダイズし得る異なる配列をその中に有する。上記オリゴヌクレオチドは、上記サンプルを識別する、一意的な組合せ中にあり;そして、上記生物コード化されたサンプルを記憶する記憶媒体である。
【0017】
本発明は、なおさらに生物コード化されたサンプルのアーカイブの生成する方法を提供するものである。一実施形態において、サンプルに添加する二つ以上のオリゴヌクレオチドの組合せの選択を含む方法であって、このオリゴヌクレオチドは、上記サンプルに対して、特異的にハイブリダイズし得ず、このオリゴヌクレオチドは、約8〜50Kbの長さを有する。上記オリゴヌクレオチドの各々は、物理的差異もしくは化学的差異(例えば、長さもしくは配列)を有し、一つ以上の上記オリゴヌクレオチドは、一意的なプライマーペアに対して、特異的にハイブリダイズし得る異なる配列をその中に有する;すなわち、二つ以上のオリゴヌクレオチドの組合せをサンプルに添加すること、および、上記生物コード化されたサンプルを記憶するための記憶媒体中の、上記生物コード化されたサンプルを配置することである。このオリゴヌクレオチドの組合せは、上記サンプルサンプルを識別する。
【0018】
基材およびアレイは、一つ以上のオリゴヌクレオチドをさらに含み得、それらの基材およびアレイの各々は、一つ以上のコードオリゴヌクレオチドに特異的にハイブリダイズし得る。一実施形態において、基材は、複数のポリヌクレオチド配列またはポリペプチドの配列を含み、この配列の各々は、この基材上の所定の位置に固定される。ここで、少なくとも二つの上記ポリヌクレオチド配列または上記ポリペプチドの配列は、標的配列と称され、そして、それらは互いに別個のものであり、そして、ポリヌクレオチド配列は、識別子オリゴヌクレオチドと称され、この識別子オリゴヌクレオチドは、上記標的配列に特異的にハイブリダイズし得る核酸に対して、特異的にハイブリダイズし得ない。別の実施形態において、基材は、複数のポリヌクレオチド配列を含み、この配列の各々は、この基材上の所定の位置に固定される。ここで、標的配列として称される、少なくとも二つのポリヌクレオチド配列は、互いに別個のものであり、そして、ここで、識別子オリゴヌクレオチドとして称される、少なくとも三つのポリヌクレオチド配列は、上記標的配列に特異的にハイブリダイズし得る核酸に対して、特異的にハイブリダイズし得ない。
【0019】
基材およびアレイを生成する方法、および上記生物学的タグまたは上記サンプルのコードを、基材およびアレイを用いて、識別する方法(コードを開発する方法)もまた提供する。一実施形態において、方法は、以下の工程を包含する:2つ以上のオリゴヌクレオチドの組合せを選択して基材に加える工程であって、上記オリゴヌクレオチドが、識別子オリゴヌクレオチドとして称され、各々は、コードヌクレオチドに特異的にハイブリダイズする工程;および、コードしたサンプル中に潜在的に存在する全てのオリゴヌクレオチドに特異的にハイブリダイズするのに十分な数で、上記基材に、上記二つ以上の識別子オリゴヌクレオチドを添加する工程。別の実施形態において、方法は、以下の工程を包含する:二つ以上の識別子オリゴヌクレオチドを含む基材を提供する工程であって、ここで、識別子オリゴヌクレオチドの数は、コードサンプル中に潜在的に存在する、すべてのオリゴヌクレオチドに特異的にハイブリダイズするのに十分である、工程;上記コードサンプルと上記基材を接触させる工程;および、上記識別子オリゴヌクレオチド、および、上記サンプル中に存在するコードヌクレオチドとの間の特異的なハイブリダイゼーションを検出して、それによって、上述のサンプル中に存在するコードオリゴヌクレオチドを識別する工程。コードオリゴヌクレオチドの組み合わせと、特定のサンプルを識別するための知られている一意的オリゴヌクレオチドの組み合わせを含むデータベースを比較することで、そのコードが同定され、したがって、そのサンプル中のオリゴヌクレオチドコードに同一なそのデータベース中の一意的なオリゴヌクレオチドの組み合わせに基づいて、そのサンプルが同定される。
【0020】
サンプルコードを識別し得る、基材のアーカイブおよび配列のアーカイブを生成する方法が、さらに提供される。一実施形態において、方法は、基材に添加する二つ以上の識別子オリゴヌクレオチドの組合せの選択する工程であって、この識別子オリゴヌクレオチドの各々は、対応するコードオリゴヌクレオチドに対して、特異的にハイブリダイズし得る、工程;基材に2以上の識別子オリゴヌクレオチドを加える工程であって、ここで、識別子オリゴヌクレオチドの数が、コードされたサンプル中に潜在的に存在する全てのオリゴヌクレオチドに対して特異的にハイブリダイズするのに十分である、工程;ならびに記憶媒体中に該基材またはアレイを配置する工程。
【0021】
生物学的タグ(コード)を生成または選択するため、生物学的タグ(コード)を識別するため、生物学的タグ(コード)をサンプルに適用するための、コンピューターシステム、媒体、および命令が、さらに提供される。一実施形態において、サンプルを識別するための生物学的タグを製造するためのデータおよび命令がコードされているコンピュータ読み取り可能媒体であって、これらのデータおよび命令は、装置に対して以下のような命令を実行させる:上記サンプルのための生物学的タグを識別する命令;その生物学的タグコードとオリゴヌクレオチドとの一意的な組合せを関連付け、ここで、このオリゴヌクレオチドの一意的な組合せによって、そのサンプルが識別される、命令;オリゴヌクレオチドの一意的な組合せをサンプルキャリア上の所定の位置に提供する、命令;およびその所定の位置とオリゴヌクレオチドとの一意的な組合せを結びつけるデータ記録を作成する命令。別の実施形態において、生物学的タグをサンプルキャリアに適用するためのデータおよび命令がコードされているコンピュータ読み取り可能媒体が、以下の命令を、装置に実行させる:選択された生物学的タグを含む容器から検索する命令であって、ここで、上記生物学的タグは、オリゴヌクレオチドの一意的な組合せを含む、命令;上記選択された生物学的タグが、利用可能であることを確認する命令;サンプルキャリア上の所定の位置に、上記生物学的タグを提供する命令;および、上記生物学的タグと上記所定の位置とを結びつけるデータ記録を作成する、命令。さらなる別の実施形態において、サンプルを識別するための生物学的タグを生成するコンピュータで実行する方法は、以下の工程を包含する:上記の生物学的タグとオリゴヌクレオチドの一意的な組合せを結びつける工程;およびサンプルキャリア上の所定の位置と、オリゴヌクレオチドの所定の組合せとを結びつけるデータレコードを作成する工程。なお別の実施形態において、生物学的タグサンプルを識別するためのコンピュータにおいて実行される方法は、以下の工程を包含する:コードオリゴヌクレオチドと基材上の所定の位置に維持されるそれぞれの(対応する)識別子オリゴヌクレオチドとの間の特異的なハイブリダイゼーションを検出する工程;上記検出する工程にしたがって生物学的タグ化サンプルに存在する1以上のコードオリゴヌクレオチドを識別する工程;上記生物学的タグされたサンプル中に存在する、上記コードオリゴヌクレオチドを、オリゴヌクレオチドの一意的な組合せと一意的なサンプルとを結びつけているデータ記録に対して比較する工程;そして、上記比較に対して応答する、上記生物学的タグされたサンプルを識別する工程。
【発明を実施するための最良の形態】
【0022】
(発明の詳細な説明)
本発明は、オリゴヌクレオチドを含む組成物の少なくとも一部分に基づいている。このオリゴヌクレオチドは、物理的もしくは化学的に(例えば、長さおよび/または配列において)他のオリゴヌクレオチドの各々とは異なり、そして、一意的な組合せ中にある。一意的なオリゴヌクレオチドを所定のサンプルに加えるかまたはそのオリゴヌクレオチドと所定のサンプルを混合することによって、すなわち、そのサンプルをコードすることによって、添加されたもしくは混合されたオリゴヌクレオチド群の組合せに基づいて、そのサンプルを識別させる。問い合わせサンプルうちのオリゴヌクレオチドの組合せ(「コード(化)」もしくは「生物学的タグ」)の決定よって、および、上記オリゴヌクレオチドの組合せと同一の一意的なサンプルの既知のオリゴヌクレオチドの組合せ(例えば、サンプルを識別する既知のオリゴヌクレオチドの組合せのデータベース)との比較によって、問い合わせサンプルは、それによって識別される。さらに、サンプルの識別、サンプルの確認、またはサンプルの認証が望まれる場合、オリゴヌクレオチドの一意的な組合せは、サンプルに添加され得る、または、混合され得る(サンプルを「コード」する、または「タグ化」する)。そしてこのサンプルは、サンプル中に存在するオリゴヌクレオチドの特定の一意的な組合せに基づいて、識別、確認、または認証され得る。
【0023】
本発明の非限定的な例において、各々のオリゴヌクレオチドは、他のオリゴヌクレオチドとの特異的なハイブリダイゼーションを避けるよう、25オリゴヌクレオチドのプールとは異なる配列を有する。そして、各々のオリゴヌクレオチドは、異なる長さ(この例では、五つの長さ:60ヌクレオチド、70ヌクレオチド、80ヌクレオチド、90ヌクレオチド、および100ヌクレオチド)を有し、九つはサンプルに添加される。サンプルに添加されたこの九つのオリゴヌクレオチド(「コード」)は、記録され、そして、コードはデータベースに必要に応じて記憶される。これらのオリゴヌクレオチドコードは、存在する各々のオリゴヌクレオチドに特異的にハイブリダイズするプライマーペアを用いて、作製される。この具体的な例において、考え得る25のオリゴヌクレオチド、および、5セットのプライマーペア(プライマーセット1〜5で表される)が存在する。プライマーセットの各々は、五つのオリゴヌクレオチドに特異的にハイブリダイズし、そしてそれゆえに、五つのプライマーセットを用いることにより、サンプル中に潜在的に存在するすべての25のオリゴヌクレオチドは、識別される。この例において、上記九つのオリゴヌクレオチドは、対応するプライマーペアに特異的にハイブリダイズするサンプル中に存在し、増幅に基づくポリメラーゼ連鎖反応(PCR)によって識別される。対照的に、他の16のオリゴヌクレオチドは、これらのオリゴヌクレオチドのサンプルに存在しておらず、これらに特異的にハイブリダイズするプライマーによって増幅できない。さらに、異なるプライマーのハイブリダイゼーションは、異なるオリゴヌクレオチドとの間でのハイブリダイゼーションであり、サンプルに実際に存在し、オリゴヌクレオチドの中で存在し得るオリゴヌクレオチドの識別に用いられる。
【0024】
PCRの後で、増幅産物を含んだ上記五つの反応液は、ここでこの説明図は、オリゴヌクレオチドの長さ、および、プライマーにハイブリダイズする範囲の配列の、両方を表し、この五つの反応液は、ゲル電気泳動を通して、サイズが分離される;各々の反応液は、一つのプライマーセットを表しており、合計五つのレーン中の一つのレーンとして分離される(ぞれぞれ、セット1〜5であり、これらは、図1のレーン2〜6に対応する)。この説明図においての作製された「バーコード」は、各々のレーンに増幅産物が分離されたパターンである。この説明図において、60塩基、70塩基、80塩基、90塩基、および100塩基のオリゴヌクレオチドは、コード番号1、2、3、4、および5に対して、各々が対応する。そして、このバーコードは、レーン2より始め、上部から下部へと読み取られ、次々と各々のレーンを読み取られ、534523151(図1A)のようになる。あるいは、上記バーコードは、二進数として示され、ここで、25の適切なオリゴヌクレオチドの各々は、60、70、80、90、および100の位置にある。ここで、すべての五つレーンは、存在または非存在に基づき、「1」または「0」で示され、オリゴヌクレオチド(増幅産物)の各々は、特定の位置にある。さらに、図1Aにおいて、対応する二進数は、10100 01000 10010 00101 10001として読み取れる。
【0025】
例示的な説明図(図1および図2)において、プライマーセットの各々は、少なくとも一つのオリゴヌクレオチドを増幅する。しかしながら、すべてのオリゴヌクレオチドが存在する必要がないので、所定のプライマーセットのオリゴヌクレオチドが、完全に存在しない場合もある。すなわち、オリゴヌクレオチドが存在しない場合のコードは、「0」で示される。したがって、例えば、プライマーセット#2うちのプライマーセットに特異的にハイブリダイズするオリゴヌクレオチドが存在しない場合、このコードは、「530523151」(図1B)のように読み取れ、そして、レーン2に対応する二進数は、各々の位置において、「0」となり、ここで、この二進数は、10100 00000 10010 00101 10001と読み取られる。
【0026】
上記例示的な説明図(図1および図2)において、「コード」を開発するために、25のオリゴヌクレオチドのプールからのすべてのオリゴヌクレオチドに特異的にハイブリダイズするすべてのプライマーペアは、増幅反応に用いられる。最初のスクリーンは、サンプルに実際に存在するオリゴヌクレオチドのためにあり、それゆえに、異なるプライマーのハイブリダイゼーション、および、対応するプライマーペアにハイブリダイズする、後に続くオリゴヌクレオチド群の増幅に基づく。さらに、サンプルに潜在的に存在する25のオリゴヌクレオチドの一つ一つのすべては、すべてのオリゴヌクレオチドに特異的にハイブリダイズするすべてのプライマーペアが上記スクリーン中に用いられるので、識別し得る。説明図において、五つのプライマーセットは、用いられ、各々のプライマーセットは、五つのプライマーペアを含んでいる。五つの分離した反応は、25のオリゴヌクレオチドのすべてを増幅する、各々のプライマーセット中の五つのプライマーペアにより、実行される。さらに、プライマーペアは、どの与えられた反応液中にも存在し得るけれども、もしプライマーペアに特異的にハイブリダイズするオリゴヌクレオチドが、その反応液に存在しない場合、このオリゴヌクレオチドは、増幅されない。
【0027】
その反応の後に、オリゴヌクレオチド群(増幅産物)は、これらの長さの差異に基づき、相互に異なっている。さらに、コードを作製する状況において、オリゴヌクレオチドは、オリゴヌクレオチドを識別するための、または、他オリゴヌクレオチドと互いに区別するために配列決定分析に供する必要のないコードを含む。したがって、本発明は、そのコード含むオリゴヌクレオチドが、そのコードを展開するめに配列決定されることを必要としない。
【0028】
例示的な説明図(図1および図2)において、「コード」は、オリゴヌクレオチドを含むサンプルを、五つの反応および別個の反応に分けることにより、作製される。例えば、コード化されたサンプルは、基材(例えば、小さな直径3mmのマトリックス)に適用され、または添加され、五つの部分に分けられる。そして、この基材の五つの部分の各々に対して、増幅反応が行われ、各反応は、異なるプライマーセットを有する。必要に応じて、オリゴヌクレオチド群は、まず基材より溶出され、そして、この溶出液は、五つの別個の反応に分けられる。別個の反応の代わりのアプローチにおいて、プライマーセットの各々とともに、五つの連続して起こる反応に役に立ち得る。例えば、もしオリゴヌクレオチドコードが、基材に適用され、または添加される場合、基材上の五つ連続して起こる増幅反応によって、および、次の反応を進める前の各反応後の増幅産物の除去によって、このコードは作製され得る。この増幅産物は、五つ連続して起こる各増幅反応からの産物であり、それゆえ、コードを作製するため別個に分離される。
【0029】
もし望まれた少数のオリゴヌクレオチドが用いられる場合、必要に応じて、一次元にある。オリゴヌクレオチドのセットもしくは増幅産物セットは、例えば、単一レーンのような、一次元において分離され得る。例えば、複数の一意的なコードが必要と予想されない場合、2、3、4、5、6、7、8、9、10などのオリゴヌクレオチドは、単一レーンのフォーマットでコードし得る。対応する単一のプライマーセットは、それゆえに、2、3、4、5、6、7、8、9、10などの数は、2、3、4、5、6、7、8、9、10などのオリゴヌクレオチドの各々を、検出または識別するための一意的なプライマーペアであり、これらは存在し得る。分離システムの十分な分解能を与えられた場合、本質的には、一次元で分離し得るオリゴヌクレオチドの数の上限はない。さらに、10〜15、15〜20、20〜25、25〜30、30〜35、35〜40、40〜45、45〜50、など、もしくはそれ以上のオリゴヌクレオチドがあり得、このオリゴヌクレオチドは、一次元で分離し得る。したがって、本発明の組成物は、一つ以上のオリゴヌクレオチドセット中に、際限のないオリゴヌクレオチドの数を含み得る。従って、所定のプライマーは、制限される必要はない;プライマーセット中のプライマーペアの数は、増幅することが所望されるオリゴヌクレオチドの数を反映する。例えば、10〜15、15〜20、20〜25、25〜30、30〜35、35〜40、40〜45、45〜50、など、もしくはそれ以上のオリゴヌクレオチドである。
【0030】
したがって、一実施形態において、本発明は、二つ以上の、オリゴヌクレオチドおよびサンプルを含む組成物を提供する;このオリゴヌクレオチドは、第一のオリゴヌクレオチドセットとして表され、この第一のオリゴヌクレオチドは、上記サンプルに特異的にハイブリダイズし得えないオリゴヌクレオチドを含む。このオリゴヌクレオチドセットは約8ヌクレオチド〜50Kbの長さを有するオリゴヌクレオチドを含み、この第一のオリゴヌクレオチドセットのオリゴヌクレオチドの各々は、この第一のオリゴヌクレオチドセットを含むほかのオリゴヌクレオチドとは異なる、物理的差異または化学的差異を有する(例えば、異なる長さ)。そして、上記第一のオリゴヌクレオチドセットのオリゴヌクレオチドの各々は、第一のプライマーセットとして表される一意的なプライマーペアに特異的にハイブリダイズし得る異なる配列をその中に有する。さらなる局面において、二つのオリゴヌクレオチドが、A〜Bによって表され、そしてこの組成物は、Bとともに、またはそれを含まずに、Aを含むか、Bだけを含む;三つのオリゴヌクレオチドが、A〜Cによって表され、そしてこの組成物が、BもしくはCとともに、またはそれらを含まずに、Aを含むか、AもしくはCとともに、またはそれらを含まずに、Bを含むか、あるいは、AもしくはBとともに、またはそれらを含まずに、Cを含む;四つのオリゴヌクレオチドが、A〜Dによって表され、そしてこの組成物が、BもしくはCもしくはDとともに、またはそれらを含まずに、Aを含むか、AもしくはCもしくはDとともに、またはそれらを含まずに、Bを含むか、AもしくはBもしくはDとともに、またはそれらを含まずに、Cを含むか、あるいは、AもしくはBもしくはCとともに、またはそれらを含まずに、Dを含む;五つのオリゴヌクレオチドが、A〜Eによって表され、そしてこの組成物が、BもしくはCもしくはDもしくはEとともに、またはそれらを含まずに、Aを含むか、AもしくはCもしくはDもしくはEとともに、またはそれらを含まずに、Bを含むか、AもしくはBもしくはDもしくはEとともに、またはそれらを含まずに、Cを含むか、AもしくはBもしくはCもしくはEとともに、またはそれらを含まずに、Dを含むか、あるいは、AもしくはBもしくはCもしくはDとともに、またはそれらを含まずに、Eを含む;六つのオリゴヌクレオチドが、A〜Fによって表され、そしてこの組成物が、BもしくはCもしくはDもしくはEもしくはFとともに、またはそれらを含まずに、Aを含むか、AもしくはCもしくはDもしくはEもしくはFとともに、またはそれらを含まずに、Bを含むか、AもしくはBもしくはDもしくはEもしくはFとともに、またはそれらを含まずに、Cを含むか、AもしくはBもしくはCもしくはEもしくはFとともに、またはそれらを含まずに、Dを含むか、AもしくはBもしくはCもしくはDもしくはFとともに、またはそれらを含まずに、Eを含むか、あるいは、AもしくはBもしくはCもしくはDもしくはEとともに、またはそれらを含まずに、Fを含む;七つのオリゴヌクレオチドが、A〜Gによって表され、そしてこの組成物が、A〜Gによって表され、そして前記一意的な組合せが、BもしくはCもしくはDもしくはEもしくはFもしくはGとともに、またはそれらを含まずに、Aを含むか、AもしくはCもしくはDもしくはEもしくはFもしくはGとともに、またはそれらを含まずに、Bを含むか、AもしくはBもしくはDもしくはEもしくはFもしくはGとともに、またはそれらを含まずに、Cを含むか、AもしくはBもしくはCもしくはEもしくはFもしくはGとともに、またはそれらを含まずに、Dを含むか、AもしくはBもしくはCもしくはDもしくはFもしくはGとともに、またはそれらを含まずに、Eを含むか、AもしくはBもしくはCもしくはDもしくはEもしくはGとともに、またはそれらを含まずに、Fを含むか、あるいは、AもしくはBもしくはCもしくはDもしくはEもしくはFとともに、またはそれらを含まずに、Gを含む。なおさらなる局面において、第一のオリゴヌクレオチドセットは、2〜5、5〜10、10〜15、15〜20、20〜25、25〜30、30〜40、40〜50、50〜100またはそれ以上のオリゴヌクレオチドの一意的な組合せからなる。
【0031】
本明細書中で用いられる場合、「物理的差異または化学的差異」との用語、ならびに、その文法上の語尾変化が伴ったものは、オリゴヌクレオチドを言及するのに使用される場合に、このオリゴヌクレオチドが、物理学的特徴または化学的特徴を有し、これらは一つ以上のオリゴヌクレオチドを相互に区別させることを意味する。換言すると、このオリゴヌクレオチドは、一つ以上の他のオリゴヌクレオチドと区別させる差異を有する。したがって、他のオリゴヌクレオチドの中に存在する際に識別される。物理学的差異の一つの具体的な例は、オリゴヌクレオチドの長さである。物理学的差異の他の具体的な例は、オリゴヌクレオチド配列である。オリゴヌクレオチドを互いに区別することを可能にするブル理的差異のさらなる例としては、電荷、溶解度、拡散速度、および吸収が挙げられる(このような差異は、オリゴヌクレオチドの長さおよび配列によって部分的に影響を受け得る)。化学的差異の例としては、本明細書中の上に記載されているような改変(例えば、分子ビーコン、放射性同位元素、蛍光部位、および他の標識)が挙げられる。先に述べたように、コードを作製する場合、オリゴヌクレオチドの配列決定は不要である。
【0032】
概して、便宜の目的で、ここで用いているオリゴヌクレオチドセットは、それらを増幅するのに用いるプライマーセットにより明示される。従って、例示的な説明図(図1および図2)において、プライマーセット#1はオリゴヌクレオチドセット#1を増幅し;プライマーセット#2はオリゴヌクレオチドセット#2を増幅し;プライマーセット#3はオリゴヌクレオチドセット#3を増幅し;プライマーセット#4はオリゴヌクレオチドセット#4を増幅し;プライマーセット#5はオリゴヌクレオチドセット#5を増幅し;プライマーセット#6はオリゴヌクレオチドセット#6を増幅し;プライマーセット#7はオリゴヌクレオチドセット#7を増幅し;プライマーセット#8はオリゴヌクレオチドセット#8を増幅し;プライマーセット#9はオリゴヌクレオチドセット#9を増幅し;プライマーセット#10はオリゴヌクレオチドセット#10を増幅するなどである。
【0033】
上記の例示的な説明図において、プライマーセット#1が増幅した産物(オリゴヌクレオチド群)は、レーン2上でサイズにて分離され、プライマーセット#2が増幅した産物(オリゴヌクレオチド群)は、レーン3上でサイズ分離をさせ、プライマーセット#3が増幅した産物(オリゴヌクレオチド群)は、レーン4上でサイズを分離させ、プライマーセット#4が増幅した産物(オリゴヌクレオチド群)は、レーン5上でサイズ分離をさせ、そして、プライマーセット#5が増幅した産物(オリゴヌクレオチド群)は、レーン6(図1)上でサイズ分離をさせる。しかしながら、もしプライマーが、既知の増幅産物、および、別個に分離される反応液の作製に用いられるのならば、増幅産物は、正確なコードを得るため一意的なレーン上で分離することを必要としない。すなわち、例えば、プライマーセット#1は、セット#1のオリゴヌクレオチドに、特異的にハイブリダイズし、そして増幅するというように、どのプライマーが増幅反応に用いられるかを知ることによって、増幅産物そしてそれゆえに、検出可能なオリゴヌクレオチドもさらに知り得る。従って、増幅産物は、どの順序(レーン)においても分離され得る。なぜなら、一意的なオリゴヌクレオチドに特異的にハイブリダイズするプライマーが知られているからである。例えば、プライマーセットの分離の順序が間違っているが(例えば、プライマーセット#1をレーン2に泳動し、そしてプライマーセット#2はレーン1に泳動する場合)、プライマーセット#1〜#5の順番で増幅産物を読み取ることによって、正しいコードが得られた場合、このコードは、レーン1(プライマーセット#2)の前にレーン2(プライマーセット#1)を読み取るだけで、補正され得る。したがって、増幅産物は、どんなコードの作製の順序であっても、分離し得る。なぜなら、これらコードは、正しいコードを提供する、プライマーセットの順序に対応して「読み取る」ことができ得るからである。
【0034】
例示的な説明図において(図1および図2)、オリゴヌクレオチドは、プライマーセット#1〜#5により増幅され、コードを作製する五つのレーン上で、別々のサイズに分離される(図1において、五つのレーンは、レーン#2のプライマーセットから始まる)。オリゴヌクレオチドが、1つのプライマーセットを用いて増幅した後に単一のレーンで画分されたほんはつめいのコードが使用されたとしても、複数のプライマーセットの使用、および、複数のレーン上のオリゴヌクレオチドの分離は、より便利なフォーマットを提供し、そして、一次元の(一レーン)分離に類似するフォーマット中に利用可能な一意的なコードの数を拡張する。異なるコードの組合せの数は、2n(m)として表され得る。ここで、「n」は、レーンあたりのオリゴヌクレオチド数を表しており、そして、「m」は、レーンの数を表している。さらに、この例示的な説明図において、25のオリゴヌクレオチドは、5×5フォーマット(5レーン中の1レーンあたり5オリゴヌクレオチド)中にあり、225異なるコードの組合せ、または、33,554,432コードを提供する。反対に、五つのオリゴヌクレオチドは、5×1フォーマット(1レーンあたり5オリゴヌクレオチド)中にあり、2の異なるコードの組合せ、すなわち32コードを提供する。
【0035】
例示的な説明図(図1および図2)において、単一レーン上で分離された増幅産物は(オリゴヌクレオチドセットの1セットは、プライマーセット1セットに対応)、相互に対に対して物理的または化学的に異なっており(例えば、異なる長さ、電荷、溶解度、拡散速度、吸収、または標識を有する)、これらは、相互に区別するためである。従って、利用可能なコードの数の増幅に加えて、複数のレーン上で分離する強みは、異なるレーン上で分離されたオリゴヌクレオチドまたは増幅産物が、一つ以上の同一の物理的特徴または化学的特徴を有し得、なおさらに、相互に区別し得るということである。例えば、二次元を用いることは、異なるセットのオリゴヌクレオチドに、同じ長さを有しさせる。これは、各セットが、他のセット群とは別個に分離されるからである(例えば、各セットは、異なるレーン上で分離される)。その上、各オリゴヌクレオチドは、同じ配列を有し得る。一定のレーンの増加で分離されたオリゴヌクレオチドの数において、オリゴヌクレオチドの広いサイズ幅は、それらを分離するためにあり、そして、その結果、コードを作製するための分離システムの大きな分解能が、必要とされ得る。さらに、長さを、既知のセット中のオリゴヌクレオチド群の間の区別に用いる場合、これは、この異なるセットのオリゴヌクレオチド群が、等しい同一の長さを有し得るからであり、コードに用いるオリゴヌクレオチドは、短い長さを有し得、そして、比較的に小さな分解能で分離され得る。サイズ分離のための多次元の使用は、少ないプライマーが所与の反応混合液中に存在しているので、一次元のものよりもさらに便利である。
【0036】
従って、本発明に従って、複数のオリゴヌクレオチドセットおよびサンプルを含む組成物が提供される。一実施形態において、オリゴヌクレオチドは、第一のオリゴヌクレオチドとして表され、サンプルに特異的にハイブリダイズし得えないオリゴヌクレオチドを含み、このオリゴヌクレオチドセットは約8ヌクレオチド〜50Kbの長さを有するオリゴヌクレオチドを含む。上記オリゴヌクレオチドの各々は、第一のオリゴヌクレオチドセットを構成する他のオリゴヌクレオチドとは物理学的差異または化学的差異(例えば、異なる長さ)を有し、オリゴヌクレオチドの各々は、第一のプライマーセットとして表される一意的なプライマーペアに特異的にハイブリダイズし得る異なる配列をその中に有し;ならびに、第二のオリゴヌクレオチドとして表されるオリゴヌクレオチドは、第二のプライマーセットとして表される一意的なプライマーペアに特異的にハイブリダイズし得る異なる配列をその中に有し、サンプルに特異的にハイブリダイズし得えず、長さが約8ヌクレオチド〜50Kbのオリゴヌクレオチドであり、そして、オリゴヌクレオチドの各々は、上記第二のオリゴヌクレオチドセットを構成する他のオリゴヌクレオチドとは物理学的差異または化学的差異(例えば、異なる長さ)を有する。
【0037】
別の実施形態において、組成物は、二つのオリゴヌクレオチドセットおよび第三のオリゴヌクレオチドセットを含む。この第三のオリゴヌクレオチドは、オリゴヌクレオチドを含み、各々に、第三のプライマーセットとして表される一意的なプライマーペアに特異的にハイブリダイズし得る異なる配列をその中に有し、サンプルに特異的にハイブリダイズし得えず、長さが約8ヌクレオチド〜50Kbのオリゴヌクレオチドであり、そして、オリゴヌクレオチドの各々は、上記第三のオリゴヌクレオチドセットを構成する他のオリゴヌクレオチドとは物理学的差異または化学的差異(例えば、異なる長さ)を有する。
【0038】
さらなる実施形態において、組成物は、三つのオリゴヌクレオチドセットおよび第四のオリゴヌクレオチドセットを含む。この第四のオリゴヌクレオチドは、オリゴヌクレオチドを含み、各々に、第四のプライマーセットとして表される一意的なプライマーペアに特異的にハイブリダイズし得る異なる配列をその中に有し、サンプルに特異的にハイブリダイズし得えず、長さが約8ヌクレオチド〜50Kbのオリゴヌクレオチドであり、そして、オリゴヌクレオチドの各々は、上記第四のオリゴヌクレオチドセットを構成する他のオリゴヌクレオチドとは物理学的差異または化学的差異(例えば、異なる長さ)を有する。
【0039】
なおさらなる実施形態において、組成物は、四つのオリゴヌクレオチドセットおよび第五のオリゴヌクレオチドセットを含む。この第五のオリゴヌクレオチドは、オリゴヌクレオチドを含み、各々に、第五のプライマーセットとして表される一意的なプライマーペアに特異的にハイブリダイズし得る異なる配列をその中に有し、サンプルに特異的にハイブリダイズし得えず、長さが約8ヌクレオチド〜50Kbのオリゴヌクレオチドであり、そして、オリゴヌクレオチドの各々は、上記第五のオリゴヌクレオチドセットを構成する他のオリゴヌクレオチドとは物理学的差異または化学的差異(例えば、異なる長さ)を有する。本発明の種々の局面において、組成物中に複数のオリゴヌクレオチドセットを含む。一つ以上のオリゴヌクレオチドは、第二のオリゴヌクレオチドセット、第三のオリゴヌクレオチドセット、第四のオリゴヌクレオチドセット、第五のオリゴヌクレオチドセット、第六のオリゴヌクレオチドセットなどのオリゴヌクレオチドセットである。このオリゴヌクレオチドは、物理的特徴または化学的特徴を有し、これは、他のどのオリゴヌクレオチドセット中の一つ以上のオリゴヌクレオチドと同じである(例えば、同一のヌクレオチドの長さ)。
【0040】
オリゴヌクレオチドの数は、コード化されたサンプルの作製のために選択され得、この数は、潜在的に大きいなサンプル数占めるのに十分最初に大きくなり得るか、または、コード化したサンプルの増加数として増加し得る。例えば、コード化されるサンプルが少ししかない場合、一次元において(一レーン)、二つの一意的なオリゴヌクレオチドは、四つ特有なコード(2)を提供する。例えば、二進数形態において、00、01、10、11であり;三つの一意的なオリゴヌクレオチドのためには、8の特有なコード(2)が利用可能であり、例えば、二進数形態において、000、001、010、100、011、110、101、111であり;四つの一意的なオリゴヌクレオチドのために、16の特有なコード(2)が利用可能であり;五つの一意的なオリゴヌクレオチドために、32の特有なコード(2)が利用可能である。利用可能なコードの数を広げるためには、異なるオリゴヌクレオチドの数の増加のみが必要である。例えば、六つの特有なオリゴヌクレオチドのために、64の一意的なコード(2)が利用可能であり;七つの特有なオリゴヌクレオチドのために、128の一意的なコード(2)が利用可能であり;八つのオリゴヌクレオチドには、利用可能な256のコードが存在し;九つのオリゴヌクレオチドには、利用可能な512のコードが存在し;10のオリゴヌクレオチドには、利用可能な1024のコードが存在し;11のオリゴヌクレオチドには、利用可能な2048のコードが存在し;12のオリゴヌクレオチドには、利用可能な4096のコードが存在し;13のオリゴヌクレオチドには、利用可能な8192のコードが存在し;14のオリゴヌクレオチドには、利用可能な16384のコードが存在し;15のオリゴヌクレオチドには、利用可能な32768のコードが存在し;16のオリゴヌクレオチドには、利用可能な65536のコードが存在し;17のオリゴヌクレオチドには、利用可能な131072のコードが存在し;18のオリゴヌクレオチドには、利用可能な262144のコードが存在し;19のオリゴヌクレオチドには、利用可能な524288のコードが存在し;20のオリゴヌクレオチドには、利用可能な1048576のコードが存在し;21のオリゴヌクレオチドには、利用可能な2097152のコードが存在し;22のオリゴヌクレオチドには、利用可能な4194304のコードが存在し;23のオリゴヌクレオチドには、利用可能な8388608のコードが存在し;24のオリゴヌクレオチドには、利用可能な16777216のコードが存在し;25のオリゴヌクレオチドには、利用可能な33554432のコード;などのコードがある。さらに、サンプルの数が利用可能なコードを超える場合、コード化するサンプルの数が未知である場合、または、利用可能なコードの数が見積もったサンプルの数を超過することが望まれる場合において、追加の異なるオリゴヌクレオチドは、オリゴヌクレオチドプールに添加され得る。このプールは、コードのために選択されるオリゴヌクレオチドからか、または、一意的なオリゴヌクレオチドの組合せの際限のない数を提供するための、異なるオリゴヌクレオチドの最初の大きな数に、利用され得るコードからのものであり、従って、一意的なコードである。例えば、30の異なるオリゴヌクレオチドは、10億を超える一意的なコード(正確には1073741824)を提供する。
【0041】
第三の次元が、コードを拡張するために追加され得る。第三の次元の追加は、2(m)npとして利用可能なコードの数を拡張する。この「p」は第三次元を表す。さらに、第三次元を例示的な説明図(図1および図2)のような5×5フォーマットに追加することにおいて、225(p)の異なる一意的なコードは利用可能である。第三次元の一例は、等電点または分子量に基づき得る。例えば、一意的なペプチドの標識は、ひとつ以上のオリゴヌクレオチド、および、分離されたコードに添加され得る。このコードは、等電点電気泳動のみもしくは分子量のみ、または、例えば、二次元ゲル電気泳動のような両方を組合せたものを用いて分離された。
【0042】
このコードは、さらなる情報を含む。例えば、コードは、チェックコードを含む。各レーンのオリゴヌクレオチド数を用いることにより、照合の印は、コードに埋め込み得る。例えば、図1Aのレーン2〜6は、各々に、2オリゴヌクレオチド、1オリゴヌクレオチド、2オリゴヌクレオチド、2オリゴヌクレオチド、および2オリゴヌクレオチドを有する。この例のチェックコードは、21222であり、図1Bのチェックコードは、20222である。
【0043】
このコードの出力は、所望される場合、オリジナルのサンプルまたはそのサンプルを供給した患者まで追跡することを可能にするいずれの特徴もそのコードが失うように「ハッシュ化」される。例えば、534523151中の各々の数は、1の増減により、それぞれ、645634262および423412040となる。
【0044】
「ハイブリダイゼーション」、「アニーリング」という用語、そしてその文法上の差異は、相補的な核酸配列との間の結合のことをいう。「特異的なハイブリダイゼーション」という用語は、別の配列に(例えば、プライマー)非共有結合を形成し得るオリゴヌクレオチドの言及の際に用いるか、または、別の配列に(例えば、オリゴヌクレオチド)非共有結合を形成し得るプライマーの言及の際に用い、この用語は、1)オリゴヌクレオチドから2)プライマーとの間で選択するハイブリダイゼーションを意味する。換言すると、オリゴヌクレオチド群の存在が、コードを作製するために識別し得る範囲で存在し得る(例えば、他のオリゴヌクレオチド、プライマー、核酸のサンプル、など)、他の核酸配列上で、プライマーおよびオリゴヌクレオチドは、優先的に相互にハイブリダイズする。
【0045】
適した正の制御または負の制御において、例えば、標的オリゴヌクレオチドおよび非標的オリゴヌクレオチド、または他の核酸は、一意的なプライマーペアとともに、増幅が検査され得、ここで、この一意的なプライマーペアとは、標的オリゴヌクレオチドに特異的なプライマーペアを保証するものである。したがって、上記標的オリゴヌクレオチドは、存在するならば、非標的オリゴヌクレオチド、非標的プライマー、または、コード作製を妨げる範囲で増幅されない他の核酸であるが、このプライマーペアにより増幅される。偽陰性は、例えば、コードのオリゴヌクレオチドは存在するが、しかし次の増幅では検出されないというものであり、この偽陰性は、コードのオリゴヌクレオチドを関連づけることにより検出され得、このコードは、可能性のある種々のコードとともに検出される。例えば、収集コードのゲル走査は、ユーザに、ゲル走査コードの一つで検出されたコードと適合させるため、エンドユーザに提供され得る。エンドユーザが限られたコード数を扱う場合、もし一つのオリゴヌクレオチドまたは2、3のオリゴヌクレオチドが検出されなくとも、収集コードは、ありうるコードのゲル走査で検出されたコードとの適合によって、簡単に識別し得る。このありうるコードとは、特に利用可能なありうるコードの数が大きい場合に、利用可能であり得る。さら具体的に例において、エンドユーザは、サンプル解析のためのアーカイブから10のコード化されたサンプルを、問い合わせる。コード化されたサンプルは、アーカイブから検索され、そして、後にサンプルを解析するエンドユーザに転送される。アーカイブから受け取ったサンプルと対応する、後に解析された一意的なサンプルを保証するために、エンドユーザは、それから、そのサンプルのためのコードの決定を望む。しかしながら、そのサンプル中のコードのオリゴヌクレオチドの一つは、コード解析の間、不完全なコードを作製する間は、検出されない。なぜなら、エンドユーザに転送されたすべてのサンプルのコードは既知であり、不完全なコードは、不完全なコードが最も線密に対応するコードに基づき、完全に完成し得る。あるいは、エンドユーザより受け取ったすべてのコードは作製され得、そして、不完全なコードを削除する工程によって作製される。
【0046】
二つの核酸配列がハイブリダイズするため、ハイブリダイゼーション反応の温度は、計算されたTM値(溶解温度)より低くなければならない。当業者に理解されるように、TM値は、相補的な配列との結合がもはや安定でない温度を表す。このTM値は、相補的な配列、長さ、組成(%GC)、核酸の種類(RNAに対してDNA)の総量、ならびに、塩、洗剤および反応液中の他の構成要素の総量に影響される。例えば、長いハイブリダイズする配列は、高い温度において安定である。RNA二本鎖もしくはDNAの二本鎖の安定性は、概して、RNA:RNA>RNA:DNA>DNA:DNAという順とおりである。すべてのこれらの要素は、特異的なハイブリダイゼーションを達成する適切な条件を設定するよう検討される(以下参照、例えば、Sambrook et al.,1989(前掲)に記載の、ハイブリダイゼーション技術、および、TM値の計算式)。概して、きびしい条件は、規定されたイオン強度およびpHで特異的な配列の溶解点(Tm)より約5℃低い温度が選択される。
【0047】
特異的なハイブリダイゼーションに用いる例示的な条件、および、例示的なコード(図1および図2)を作製する次の増幅は、例1において明らかにされる。ひとつのPCRの例示的な条件は、以下である:
緩衝液(1×):16mMの(NHSO、67mMのTris−HCl(25℃において8.8pH)、0.01%のTween20、1.5mMのMgCl;dNTP:各々、200μMのdNTP;プライマー濃度:62.5mMの各プライマー(五つすべてのプライマーペアは各反応中に存在する);酵素:2単位のBiolase(Taq;Bioline,Randolph,MA);PCRサイクル条件:93℃で2分間、55℃で1分間、72℃で2分間、その後、93℃で30秒間、55℃で30秒間、72℃で45秒間を29サイクル。条件は、例示的な条件を含め、様々である。例えば、プライマー濃度は、約20mMから100mM;酵素は、約1単位から4単位;PCRサイクル条件は、アニーリング温度は、約49℃〜59℃、および、変性、アニーリング、そして、伸長時間は、約30秒間〜2分間である。当然、当業者は、この条件は複数の含まれる要素に基づくと認識している。例えば、用いられるオリゴヌクレオチドおよびプライマーの数、それらの長さおよび相補性の範囲である。それらの当業者は、PCRに影響する要素に関しての当該分野の広範囲の知識を考慮して、適切な条件を決定し得る。(以下参照、例えば、Molecular Cloning:A Laboratory Manual3rded.,Joseph Sambrook,et al., Cold Spring Harbor Laboratory Press;(2001);Short Protocols in Molecular Biology4thed.,Frederick M.Ausubel(ed.),et al.,John Wiley & Sons;(1999);およびPcr(Basics:From Background to Bench)1sted.,M.J.McPherson et
al.,Spring Verlag(2000))。
【0048】
本明細書中で用いられる、「サンプルに特異的にハイブリダイズし得ない」および、それらの文法上の差異は、オリゴヌクレオチドもしくはプライマーの援用として用いられる際、これらは、一つ以上のオリゴヌクレオチドもしくはプライマーと、コード作製を妨げない核酸サンプルとの間の、特異的なハイブリダイゼーションが何も起きない範囲において、オリゴヌクレオチドもしくはプライマーがサンプル(例えば、核酸サンプル)に特異的にハイブリダイズし得ないことを意味する。さらに、例えば、サンプルがヒト性核酸の場合、一つ以上のオリゴヌクレオチドまたはプライマーと、例えば、コードの識別のような、オリゴヌクレオチドの検出/識別を妨げないヒト性核酸との間で起きる、非特異的ハイブリダイゼーションのどれも、概して、オリゴヌクレオチド配列のすべてもしくは一部分は非ヒト性(例えば、細菌性、ウィルス性、酵母性)である。
【0049】
オリゴヌクレオチドまたはプライマーは、サンプルに特異的にハイブリダイズする状況であり得、そして、いくらかのサンプル増幅は、偽陽性の作製をそれによって起こし得る。しかしながら、もし誤った産物のサイズが、オリゴヌクレオチドの予期されたサイズにめったにならなくとも、それは、コードの一部である。その上、閾値水準は、オリゴヌクレオチドの総量が、「存在」または「陽性」と考慮されるオリゴヌクレオチドのための閾値よりも高くなければならないという設定にされ得る。もし、オリゴヌクレオチドの総量または作製された増幅産物の総量が、閾値水準より高ければ、それから、産物は存在しているといえる。それに比べて、もし、上記総量が上記閾値水準より低ければ、それから、産物もしくは増幅産物は偽陽性といえる。関連する総量または他の数量の視覚による点検は、密度計またはゲルスキャナーを用いることで、所定の産物が正確な閾値より、上であるかまたは下であるかの決定に使用し得ることを意味する。
【0050】
それゆえに、相互に対して特異的にハイブリダイズするオリゴヌクレオチド群およびプライマー群は、オリゴヌクレオチド群またはプライマー群とコード作製を妨げない核酸サンプルとの間に起きるどんなハイブリダイゼーションであっても、サンプルに対して全くの非相補性になり得、このサンプルは、核酸であり、または、いくらかもしくは100%の相補性を有する。本明細書中で用いられる「サンプルに特異的にハイブリダイズし得ない」という意味は、サンプルに特異的にハイブリダイズするオリゴヌクレオチドまたはプライマー、および、サンプルの増幅が起こり得るが、しかし、コード作製を妨げない増幅であるという状況を含み、それゆえに、意図されたものである。「特異的なハイブリダイゼーションができ得ないこと」もまた、特異的なハイブリダイゼーションの欠如の言及に用いられ得る。このハイブリダイゼーションは、サンプルをコード化もしくはサンプルを標識するのに用いる異なるオリゴヌクレオチドの間で、増幅に用いるプライマーペアの間で、そして、プライマー群と非標的オリゴヌクレオチドとの間で、たとえいくらかのハイブリダイゼーションが起こる範囲だとしても、このハイブリダイゼーションは、コードが作製されることからコードを妨げない。
【0051】
さらに加えて、サンプルに付属するサンプル中に核酸が存在する際、それは、タンパク質サンプルまたは他のどの非核酸サンプルのためであり、ここで、核酸がたまたま存在し、しかし、コード化されたサンプルでない。この際、もしコード作製を妨げない核酸サンプルとのハイブリダイゼーションならば、オリゴヌクレオチドまたはプライマーは、核酸に対してさらに特異的にハイブリダイズし得る。なぜなら、どの産出された増幅産物のサイズも、オリゴヌクレオチドの予期されたサイズを有さない。このハイブリダイゼーションは、コード作製を妨げないないとしても、めったにない。その上に、サンプルに付属する核酸がある状況において、概して、プライマー群の総量は、コード作製が行われるのを妨げないような核酸よりも多い。
【0052】
さらに、本発明の一意的な実施形態において、オリゴヌクレオチド群またはプライマー群は、核酸であるサンプルに対して、約40%〜50%以下の相同性を有する。さらなる特異的な実施形態において、オリゴヌクレオチド群は、約0.5%〜50%以下の相同性を有する。例えば、45%、40%、35%、30%、25%、20%、15%、10%、5%、3%、もしくはそれ以下の核酸であるサンプルの相同性である。
【0053】
サンプルのコード化に用いるオリゴヌクレオチドは、どんな長さでもあり得る。例えば、オリゴヌクレオチド群は、8〜10ヌクレオチドから約100Kbの長さに及ぶ。特異的な実施形態において、オリゴヌクレオチドは、約10ヌクレオチドから約50Kbの長さ、約10ヌクレオチドから約25Kbの長さ、約10ヌクレオチドから約10Kbの長さ、約10ヌクレオチドから約5Kbの長さを有し;約12ヌクレオチドから約1000ヌクレオチド、約15ヌクレオチドから約500ヌクレオチド、約20ヌクレオチドから約250ヌクレオチド、または約25ヌクレオチドから約250ヌクレオチド、約30ヌクレオチドから約250ヌクレオチド、約35ヌクレオチドから約200ヌクレオチド、約40ヌクレオチドから約150ヌクレオチド、約40ヌクレオチドから約100ヌクレオチド、または、約50ヌクレオチドから約90ヌクレオチドの長さを有する。
【0054】
オリゴヌクレオチドの識別に用いられる物理的差異が長さである場合、この長さは少なくとも一つのヌクレオチドが異なる。概して、オリゴヌクレオチド群は、相互に配列の長さが異なる。例えば、1〜500ヌクレオチド、1〜300ヌクレオチド、1〜200ヌクレオチド、3〜200ヌクレオチド、5〜150ヌクレオチド、5〜120ヌクレオチド、5〜100ヌクレオチド、5〜75ヌクレオチド、もしくは、5〜50ヌクレオチドであり;または、2〜5ヌクレオチド、5〜10ヌクレオチド、10〜20ヌクレオチド、20〜30ヌクレオチド、30〜50ヌクレオチド、50〜100ヌクレオチド、100〜250ヌクレオチド、250〜500ヌクレオチド、もしくはそれ以上のヌクレオチドである。さらに一般的に、長さの差異は、ゲル電気泳動によるサイズ分画にとって便利な範囲になり得る。例えば、5ヌクレオチド、10ヌクレオチド、15ヌクレオチド、20ヌクレオチド、25ヌクレオチド、25ヌクレオチド、30ヌクレオチド、35ヌクレオチド、40ヌクレオチド、45ヌクレオチド、50ヌクレオチドの長さは、約20〜5000ヌクレオチドの範囲の長さを有するオリゴヌクレオチドのサイズにおいて、差異を検出するのに便利である。
【0055】
例示的な説明図において(図1および図2)、オリゴヌクレオチドは、増幅され、そして次に、ゲル電気泳動で分画される。コードは、しかしながら、コードを含むオリゴヌクレオチド群の間から区別し得る他の方法によって作製され得る。例えば、オリゴヌクレオチドが増幅されようが、されなくとも、サイズ除外、紙もしくはイオン交換クロマトグラフィー分画し得、または、電荷、溶解度、拡散もしくは吸収に基づき分離され得る。さらに、コードのオリゴヌクレオチドを識別する方法は、コード中に存在し得るオリゴヌクレオチド群の間から区別する方法を含む。
【0056】
例えば、サイズ分画またはディファレンシャルハイブリダイゼーションにより差異を見出せないほどの物理的差異もしくは化学的差異を有するオリゴヌクレオチドは、そのオリゴヌクレオチドを改変することを含む他の方法により区別され得る。以下に詳説されるように、オリゴヌクレオチドは、互いに区別するために様々な検出可能な部分のいずれかを使用して標識され得る。その結果、コードは、同一のヌクレオチド配列もしくはヌクレオチドの長さを有するが、しかし、それらを相互に区別させる、物理的差異もしくは化学的差異を有する。従って、このようなオリゴヌクレオチド(群)は、本願明細書において記載されるコードに含まれる場合、その存在、そして、その結果としてコードの同一性を決定づけるために、ハイブリダイズまたはその後の増幅に供されることを必要としない。
【0057】
本明細書中で用いられる、「異なる配列」という用語は、オリゴヌクレオチドの援用に用いる際、オリゴヌクレオチド群のヌクレオチド配列が、互いに区別し得るオリゴヌクレオチド群である範囲で、互いに異なっていることを意味する。「一意的なプライマーペアに特異的にハイブリダイズし得る」というオリゴヌクレオチドの異なる配列、または、「コードの一意的なオリゴヌクレオチドに特異的にハイブリダイズし得る」という識別子オリゴヌクレオチドは、それゆえに、プライマーもしくは識別子オリゴヌクレオチドのハイブリダイゼーションに適した、連続した配列を含む。例えば、このコードオリゴヌクレオチドは、潜在的に存在する他のオリゴヌクレオチド群からの差異のあるハイブリダイゼーションに基づき区別し得る。上記オリゴヌクレオチド群は、少なくとも一つのヌクレオチドのより、互いに配列が異なる。しかし、概して、このオリゴヌクレオチド群は、非特異的なハイブリダイゼーションを最小限にする、大きな差異を示す。例えば、上記オリゴヌクレオチド群中の、2〜5ヌクレオチド、5〜10ヌクレオチド、10〜20ヌクレオチド、20〜30ヌクレオチド、30〜50ヌクレオチド、50〜100ヌクレオチド、100〜250ヌクレオチド、250〜500ヌクレオチド、またはそれ以上のヌクレオチドは、他のオリゴヌクレオチド群とは異なる。差異のあるハイブリダイゼーション、そして、したがって、オリゴヌクレオチドの区別を達成する、ヌクレオチドの差異の数は、オリゴヌクレオチドのサイズ、オリゴヌクレオチドの配列、アッセイ条件(例えば、温度および緩衝液の組成のようなハイブリダイゼーションの条件)などにより、影響される。オリゴヌクレオチド配列の差異はさらに、オリゴヌクレオチド配列の全体の長さの百分率として、表現され得る。例えば、二つのオリゴヌクレオチドを比較する場合、ヌクレオチドの百分率は、互いに同一であるか、または、異なっているかのどちらかである。したがって、例えば、30bpのオリゴヌクレオチドにとって、その配列の20〜25%程が、そのOL1と別のオリゴヌクレオチド(OL2)とを区別するには、OL2と異なることが必要であり、ただし、OL1およびOL2の75〜80%同一な配列は、そのコードをつくることにおいて妨げとならない。
【0058】
「異なる配列」という用語は、オリゴヌクレオチドの援用に用いる際、コードを含むオリゴヌクレオチド群との間での区別に用いられる差異のあるハイブリダイゼーションうちのオリゴヌクレオチドをいう。これは、差異のあるプライマーハイブリダイゼーションがオリゴヌクレオチド群の識別に用いられない場合において、コード中の他のオリゴヌクレオチド群の存在を排除しない。例えば、プライマーペアがハイブリダイズする場合において、コードの二つ以上のオリゴヌクレオチドは、同一ヌクレオチド配列を有し得る。さらに、このオリゴヌクレオチド群は、長さもしくは差異のあるプライマーハイブリダイゼーションに基づき互いに別個のものでない。しかしながら、同じプライマーハイブリダイゼーションを有すオリゴヌクレオチド群は、異なる配列の長さ、または、何か他の物理的差異もしく化学的差異、例えば、電荷、溶解度、拡散吸収もしくはラベルのような差異を有し得る。ここで、これらは、互いに別個のものであり得る。例えば、共有プライマーハイブリダイゼーション部位を有すコードオリゴヌクレオチドは、プライマーハイブリダイゼーション部位の外側の異なる配列の存在により、互いに区別し得る。ここで、プライマーハイブリダイゼーション部位は、プライマー結合部位を配置する配列領域か、または、プライマー結合部位の間に配置されている配列領域のいずれかである。「非特異結合部位」のような配列領域の間の特異的なハイブリダイゼーション、および、相補的な識別子オリゴヌクレオチドは、一意的なコードオリゴヌクレオチドを識別する。したがって、プライマーペアが二つ以上のコードのオリゴヌクレオチドに特異的にハイブリダイズし得る場合において、コードのオリゴヌクレオチドは、同じヌクレオチド配列を有し得る。
【0059】
オリゴヌクレオチドの配列は、そのオリゴヌクレオチドの検出に用いるプライマーペアの配列もしくは識別子オリゴヌクレオチドを決定付ける。本明細書中で開示されるように、問い合わせサンプル中に潜在的に存在する各々のオリゴヌクレオチドに特異的にハイブリダイズする、一意的なプライマーペアもしくは識別子オリゴヌクレオチドを用いることは、すべてのオリゴヌクレオチドの検出を促進する。代表的には、その対応するプライマーペアは、そのオリゴヌクレオチド配列の部分にハイブリダイズする。したがって、そのプライマーまたは識別子オリゴヌクレオチドがハイブリダイズする配列領域は、そのオリゴヌクレオチドを検出するために既知である必要があるヌクレオチド配列のみである。換言すると、そのコードにおけるいずれかのオリゴヌクレオチドを検出もしくは識別するため、ハイブリダイゼーションに関与するヌクレオチド配列のみが、既知である必要がある。したがって、プライマーペアまたは識別子オリゴヌクレオチドとの特異的ハイブリダイゼーションに関与しないオリゴヌクレオチドのヌクレオチド配列は、いずれの配列であてもよく、未知の配列であってもよい。
【0060】
例えば、プライマーペアがオリゴヌクレオチドの5’末端もしくは3’末端にハイブリダイズする場合、ハイブリダイゼーション部位の間の介在配列は、どのような配列であってもよく、また、その配列は未知であってもよい。同様に、プライマーペアがオリゴヌクレオチドの5’末端付近もしくは3’末端付近にハイブリダイズする場合、ハイブリダイゼーション部位の間で、もしくは、プライマーハイブリダイズ部位を配置する配列の間の介在配列は、どのような配列であってもよく、また、その配列は未知であってもよい。同様に、識別子オリゴヌクレオチドの場合、対応する相補的なコードオリゴヌクレオチドにハイブリダイズしない一部分は、どのような配列であってもよく、また、その配列は未知であってもよい。どちらかの場合では、間に隣接するヌクレオチド、もしくは、ハイブリダイゼーション部位を配置するヌクレオチドは、どのような配列であってもよく、また、その配列は未知であってもよい。介在配列もしくは隣接配列は、異なるオリゴヌクレオチドに対して、非標的識別子オリゴヌクレオチドに対して、非標的プライマーに対して、もしくは、コード作製を妨げるような程度の核酸のサンプルに対して、ハイブリダイズしない。
【0061】
プライマーもしくは識別子オリゴヌクレオチドがハイブリダイズするオリゴヌクレオチドのヌクレオチド配列が、オリゴヌクレオチド(例えば、OL1)の同一性を順に示す、ハイブリダイゼーションの特異性を、与えるので、ハイブリダイゼーションに関与しないヌクレオチドは、ハイブリダイゼーションに関与しない異なるオリゴヌクレオチド(例えば、OL2)うちのヌクレオチドと、同一になり得る。例えば、もし一意的なオリゴヌクレオチドが、30ヌクレオチドの長さ(例えば、OL1)である場合、プライマーもしくは識別子オリゴヌクレオチドは、オリゴヌクレオチド中の14ヌクレオチドがハイブリダイゼーションに関与しないという意図のある8ヌクレオチドと、おなじくらい少なくなり得る。さらに、OL2、OL3、OL4、OL5、OL6,などに特異的にハイブリダイズするプライマーペーサー識別子オリゴヌクレオチドが、コード作製を妨げる程度のこの14ヌクレオチドにもまた、ハイブリダイズしない場合において、OL1中のこれら14の連続したヌクレオチドの、すべてもしくは一部分は、同じセット中もしくは異なるセット中の(例えば、OL2、OL3、OL4、OL5、OL6,など)、一つ以上の他のオリゴヌクレオチドと同一となり得る。従って、ハイブリダイゼーションに関与しないオリゴヌクレオチド中のヌクレオチド配列の領域は、他のオリゴヌクレオチドの、一部分もしくは全体に対して、同一となり得る。
【0062】
オリゴヌクレオチド中の一意的なプライマーペアと特異的にハイブリダイズし得る異なる配列の位置は、概して、オリゴヌクレオチドの5’末端上もしくは末端付近、および、3’末端上もしくは末端付近にある。オリゴヌクレオチド中の一意的なプライマーペアと特異的にハイブリダイズし得る異なる配列の位置は、オリゴヌクレオチドの長さに影響する。例えば、短いオリゴヌクレオチド群の、一意的なプライマーペアと特異的にハイブリダイズし得る異なる配列の位置は、概して、5’末端上もしくは末端付近、および、3’末端上もしくは末端付近にある。それに比べて、長いオリゴヌクレオチド群の、一意的なプライマーペアと特異的にハイブリダイズし得る異なる配列の位置は、5’末端および3’末端から、もっと離れ得る。オリゴヌクレオチドサイズの差異を識別に用いる場合、コード中もしくは増幅されたオリゴヌクレオチド産物中の、オリゴヌクレオチドの間での、サイズの差異のみが必要となる。さらに、もし、増幅の欠如うちにオリゴヌクレオチドが検出されたなら、オリゴヌクレオチドのサイズは、互いに異なっている。それに比べて、もし、増幅が例示的な説明図(図1および図2)のようなコード作製に用いられたなら、所定セット中のプライマーは、互いに異なるサイズを有す増幅産物を生成するセット中の(例えば、5’末端上および3末端上にない)オリゴヌクレオチドに、特異的にハイブリダイズすることのみが必要とされる。換言すると、プライマーが、異なるサイズを有す増幅産物を生成する位置上の、オリゴヌクレオチドと特異的にハイブリダイズする場合において、所定セット中のオリゴヌクレオチドは、同一の長さを有し得る。例として、二つのオリゴヌクレオチド、OL1およびOL2は、所定セット中にあり、各々は、50ヌクレオチドの長さを有する。コード作製する際、OL1の5’末端上および3’末端上に特異的にハイブリダイズするプライマーペアは、50ヌクレオチドの増幅産物を生成し、一方で、OL2の5’末端上および3’末端上の5ヌクレオチドに特異的にハイブリダイズするプライマーペアは、40ヌクレオチドの増幅産物を生成する。
【0063】
さらに、オリゴヌクレオチド中の一意的なプライマーペアと特異的にハイブリダイズし得る異なる配列の位置は、オリゴヌクレオチドの5’末端上および3’末端上に、ある必要ではないが、あり得る。一実施形態において、異なる配列は、オリゴヌクレオチドの3’末端および5’末端の、約0〜5ヌクレオチド、5〜10ヌクレオチド、10〜25ヌクレオチドの中に、配置される。別の実施形態において、異なる配列は、オリゴヌクレオチドの3’末端および5’末端の、約25〜50ヌクレオチド、または50〜100ヌクレオチドの中に、配置される。さらなる実施形態において、異なる配列は、オリゴヌクレオチドの3’末端および5’末端の、約100〜250ヌクレオチド、250〜500ヌクレオチド、500〜1000ヌクレオチド、または、1000〜5000ヌクレオチドの中に、配置される。
【0064】
本明細書中で用いられるように、「オリゴヌクレオチド」、「核酸」、「ポリヌクレオチド」、「プライマー」、および、「遺伝子」の用語は、自然の線状のオリゴマー、または、改変された単量体もしくは結合を含み、ここで、これらは、デオキシリボヌクレオチド、リボヌクレオチド、および、α−アノマー形態を含み、それらは、単量体から単量体への相互作用の一定のパターンにより、標的配列に特異的にハイブリダイズし得る。例えば、ワトソン−クリック型の塩基組合せ、塩基組み立て、ホーグステン型もしくは逆ホーグステン型の塩基組合せである。単量体群は、概して、ホスホジエステル結合、もしくは、ポリヌクレオチドを形成するそれの類似物により、結合される。オリゴヌクレオチドは、合成オリゴマー、センスもしくはアンチセンス、環状もしくは線状、一本鎖、二本鎖もしくは三本鎖の、DNAもしくはRNAであり得る。オリゴヌクレオチドが、「ATGCCTG」のような文字の配列により表される時はいつでも、ヌクレオチドは、5’から3’の左から右の方向である。
【0065】
本質的には、ポリマーが検出可能な場合、および、コード中に存在する他のポリマーから区別し得る場合において、一意的な配列を有するどのポリマーも、コードに用いられ得る。このポリマーは、例えば、NMRおよびFT−IRのような分光器により識別される、有機のポリマーもしくはアルキル鎖を含む。ポリマーは、それに付随する一つ以上のアミノ酸を含み、例えば、蛍光計で検出し得る、ニンヒドリンもしくはオプタルデハイドで誘導されたペプチドである。ポリマーは、ペプチド核酸(PNA)をさらに含み、これは、核酸模倣物も言及する。例えば、DNA模倣物であり、これは、自然のヌクレオチドを保持している間に、デオキシリボース核酸の骨格が、擬似ペプチドの骨格と取り替えられたものである。
【0066】
従って、オリゴヌクレオチドは、天然に存在するが非天然としては存在しないオリゴヌクレオチドに対して類似の、すべてまたは一部分である部分を含む。さらに、オリゴヌクレオチド群は、一つ以上の、変化した糖部分もしくは糖間結合を有し得る。オリゴヌクレオチド1以上のホスホジエステル結合は、オリゴヌクレオチドの安定性を増強する構造で置換され得る。このような置換の一意的な非限定的な例は、ホスホロチオエート結合、ホスホトリエステル、メチルホスホネート結合、アルキル短連鎖もしくはシクロアルキル構造、異種原子の短連鎖もしくは異種環式構造、およびモルホリン構造(米国特許番号5、034、506)含む。さらなる結合は、米国特許第5,223,618号および米国特許第5,378,825号に開示されたものを包含する。
【0067】
オリゴヌクレオチド群は、それゆえに、天然に存在するヌクレオチド、合成ヌクレオチド、およびそれの組合せのヌクレオチドを、さらに含む。天然に存在する塩基群は、アデニン、グアニン、シトシン、チミン、ウラシル、およびイノシンを含む。合成塩基の一意的な非限定的な例は、キサンチン、ヒポキサンチン、2−アミノアデニン、6−メチル、2−プロピルおよび他のアルキルアデニン、5−ハロウラシル、5−ハロシトシン、6−アザシトシンおよび6−アザチミン、擬似ウラシル、4−チウラシル、8−ハロアデニン、8−アミノアデニン、8−チオールアデニン、8−チオアルキルアデニン、8−ヒドロキシルアデニンおよび他の8−置換アデニン、8−ハログアニン、8−アミノグアニン、8−チオールグアニン、8−チオアルキルグアニン、8−ヒドロキシルグアニンおよび他の置換グアニン、他のアザアデニンおよびデアザアデニン、他のアザグアニンおよびデアザグアニン、5−トリフルオロメチルウラシル、5−トリフルオロシトシンおよびトリチル化塩基を含む。
【0068】
オリゴヌクレオチド群は、コードを保存するための合成の間または合成後に、ヌクレアーゼ耐性が作られ得る。オリゴヌクレオチド群は、安定性、ハイブリダイゼーション、または、分子の溶解度を改善するために、塩基の一部分、糖の一部分もしくはリン酸塩骨格が、改変され得る。例えば、オリゴヌクレオチドの5’末端は、一つ以上の改変されたヌクレオチド間結合(例えば、米国特許番号5,691,146)を含むことにより、ヌクレアーゼ耐性に変わり得る。
【0069】
オリゴヌクレオチド群のデオキシリボースリン酸塩骨格は、ペプチド核酸を生み出すよう(Hyrup et al.,Bioorg.Med.Chem.4:5(1996))改変され得る。PNAの中性の骨格は、低いイオン強度の条件下で、DNAおよびRNAに特異的にハイブリダイズさせる。PNAオリゴマーの合成は、固相鎖ペプチド合成プロトコル(例えば、Perry−O’Keefe et al.,Proc.Natl.Acad.Sci.USA93:14670(1996)参照)を用いて行われ得る。PNAは、ワトソン−クリック水素結合後、いわば配列に依存して、相補的なDNA配列および相補的RNA配列に、ハイブリダイズする。RNA−DNAハイブリダイゼーションは、塩基のミスマッチにより敏感であり;PNAは、単一ミスマッチ(Ray and Bengt,FASEB J.14:1041(2000))の水準まで高めた配列識別を保持し得る。PNAハイブリダイゼーションの高い配列特異性によって、二本鎖の不適当な結合は、熱による融解温度に相当に影響を及ぼす。PNAは、ラベルおよびラベルされたPNAを含むよう、さらに改変され得る。ここで、このラベルされたPNAは、コード中にあるか、または、プライマーとして、もしくは、コード中のラベルされたPNAを検出するプローブを含む。例えば、光を発するRNAプローブ(不斉シアニン色素チアゾールオレンジ(TO))が結合される。光を発するPNAが標的にハイブリダイズする際、染料は結合し、そして蛍光性となる(Svavnik et al., Analytical Biochem. 281:26(2000))。
【0070】
オリゴヌクレオチドを含む本発明の組成物は、例えば保存料のような、追加の成分、または、安定性を高める薬剤、もしくは、オリゴヌクレオチドの分解を阻害する薬剤を含み得る。保存料を含む一意的な非限定的な例は、例えば、EDTA、EGTA、グアニジン、チオシアン酸塩、および尿酸である。
【0071】
本明細書中で用いられるように、「一意的なプライマーペア」との用語は、アッセイ条件下、オリゴヌクレオチド標的に特異的にハイブリダイズするプライマーペアを意味する。本明細書に開示されるように、プライマーペアは、コード中に潜在的に存在する二つ以上のオリゴヌクレオチドに、ハイブリダイズし得る。一意的なプライマーペアは、プライマーは特異的にハイブリダイズし、そしてコードは作製されるというように、標的オリゴヌクレオチドの少なくとも一部分に相補的であることのみを必要とする。例えば、約8〜5ヌクレオチドのオリゴヌクレオチド配列は、ミスマッチを許容する;長い配列、特異的なハイブリダイゼーションに影響を及ぼさずに許容し得る、多数のミスマッチ数、従って、8〜15塩基の配列は、1〜3ミスマッチを許容し得;15〜20塩基の配列は、1〜4ミスマッチを許容し得;20〜25塩基の配列は、1〜5ミスマッチを許容し得;25〜30塩基の配列は、1〜6ミスマッチを許容し得るなどである。
【0072】
本明細書中で用いられるように、「識別子オリゴヌクレオチド」の用語は、アッセイの条件の下で、コードオリゴヌクレオチドに特異的にハイブリダイズするオリゴヌクレオチドを意味する。識別子オリゴヌクレオチドとコードオリゴヌクレオチドとの特異的なハイブリダイゼーションは、このようなハイブリダイゼーションの印であるシグナルが発出されることにより、存在するコードオリゴヌクレオチドを識別する。それにひきかえ、どのコードオリゴヌクレオチドにも特異的にハイブリダイズしない識別子オリゴヌクレオチドは、ハイブリダイゼーションの指標となるシグナルを発出しない。コードオリゴヌクレオチドに特異的にハイブリダイズする一意的なプライマーペアのように、識別子オリゴヌクレオチドは、同じ長さ、または、コードオリゴヌクレオチドに特異的にハイブリダイズするそれよりも、短いもしくは長い長さを有し得る。さらに、一意的なプライマーペアのように、識別子オリゴヌクレオチドは、識別子オリゴヌクレオチドがコードオリゴヌクレオチドに特異的にハイブリダイズし、そしてコードが作製されるというように、標的コードオリゴヌクレオチドの少なくとも一部分に相補的であるのみを必要とする。当然、長いオリゴヌクレオチド配列、より多数のヌクレオチドミスマッチは、識別子オリゴヌクレオチドと相補的な標的コードオリゴヌクレオチドとの間の、特異的なハイブリダイゼーションに影響を及ぼさずに、許容し得る。
【0073】
プライマーペアもしくは識別子オリゴヌクレオチドにおいて特異的なハイブリダイゼーションは、非標的オリゴヌクレオチドもしくは非標的識別子オリゴヌクレオチド、他のプライマー、または、コード作製を妨げる程度の核酸のサンプルに対して、有意にハイブリダイズしない。さらに、プライマーペアおよび識別子オリゴヌクレオチドは、非標的オリゴヌクレオチドとの、部分的な相補性を共有し得る。なぜなら、ハイブリダイゼーションの厳しさもしくは増幅条件の厳しさは、プライマーペアもしくは識別子オリゴヌクレオチドが、標的オリゴヌクレオチド(群)に優先的にハイブリダイズするということになり得るからである。例えば、30塩基のオリゴヌクレオチドの場合、10塩基のプライマーペア(プライマー#1およびプライマー#2)とともにあるOL1であり、40塩基のオリゴヌクレオチドの場合、10塩基のプライマーペア(プライマー#3およびプライマー#4)とともにあるOL2であり、プライマー#1およびプライマー#3、ならびに/または、プライマー#2およびプライマー#4は、配列同一性を共有し得る。例えば、1〜約5の連続するヌクレオチドは、コード作製を妨げずに、プライマー#1およびプライマー#3、ならびに/または、プライマー#2およびプライマー#4の間で、同一であり得る。長さが増大するにつれて、標的オリゴヌクレオチドと非相補的になり得る、プライマーもしくは識別子オリゴヌクレオチドの連続するヌクレオチドの数は、増加する。長さが増大するにつれて、標的オリゴヌクレオチドもしくは別のプライマーと非相補的にとなり得る、プライマーもしくは識別子オリゴヌクレオチドの連続するヌクレオチドの数は、同じく、増加する。一般に、コード作製を妨げずに、異なるオリゴヌクレオチドを目標とされた、プライマーもしくは識別子オリゴヌクレオチドの間で同一となり得る、連続するヌクレオチドの最大数は、約40〜60%となる。いずれにしても、プライマーおよび識別子オリゴヌクレオチドは、100%の相同性である必要がなく、または、標的オリゴヌクレオチドに100%の相補性を有する必要がない。
【0074】
プライマーペアおよび識別子オリゴヌクレオチドは、それらが標的オリゴヌクレオチドにハイブリダイズし得る場合、および、オリゴヌクレオチド増幅に機能し得る、コード作製に用いられる増幅である場合、どんな長さでもなり得る。本発明の具体的な実施形態において、一意的なプライマーペアの一つ以上のプライマーは、約8〜250ヌクレオチドの長さを有する。例えば、約10〜200ヌクレオチド、約10〜150ヌクレオチド、約10〜125ヌクレオチド、約12〜100ヌクレオチド、約12〜75ヌクレオチド、約15〜60ヌクレオチド、約15〜50ヌクレオチド、約18〜50ヌクレオチド、約20〜40ヌクレオチド、約25〜40ヌクレオチド、または、約25〜35ヌクレオチドである。本発明のさらなる実施形態において、一意的なプライマーペアの一つ以上のプライマーは、約9/10、約4/5、約3/4、約7/10、約3/5、約1/2、約2/5、約1/3、約3/10、約1/4、約1/5、約1/6、約1/7、約1/8、約1/10の、オリゴヌクレオチドの長さを有し、このオリゴヌクレオチドはプライマーに結合する。
【0075】
各々の、プライマーペア中のプライマー、プライマーセット中のプライマーペア、および異なるセットのプライマーは、同じ長さもしくは異なる長さを有し得る。本発明の具体的な実施形態において、所与の一意的なプライマーペア中の各プライマー、プライマーセット中の各プライマーペア、および、異なるセットのプライマーは、同じ長さを有するか、または、約1〜500ヌクレオチド、1〜250ヌクレオチド、約1〜100ヌクレオチド、約1〜50ヌクレオチド、約1〜25ヌクレオチド、約1〜10ヌクレオチド、または、約1〜5ヌクレオチドの長さが異なる。
【0076】
例示的な説明図(図1および図2)において、プライマーへの特異的なハイブリダイゼーションにより、および、次に続く増幅により、および、ゲル電気泳動を通してプライマーにハイブリダイズするオリゴヌクレオチドのサイズ分画により、コードは作製される。サイズ除外、イオン交換、紙および親和性クロマトグラフィー、核酸、溶解、吸着を含む、オリゴヌクレオチドのサイズ分画の代替的方法に加えて、コード作製の代替的方法がある。例えば、オリゴヌクレオチドは、増幅され得、それから後に、コードの基礎となり得る既知の長さの既知の断片を作製する酵素で分割され得る。もう一つの方法として、もしオリゴヌクレオチドの量が十分存在すれば、オリゴヌクレオチドは、ハイブリダイゼーションせずに、および、後の増幅せずに、および、直接的に視覚化(電気泳動のサイズ分画に続いてUV蛍光)せずに、サイズ分画され得る。さらに、オリゴヌクレオチド(群)は、検出され得、そしてそれゆえに、ハイブリダイゼーションもしくは増幅なしにコードが作製される。
【0077】
ハイブリダイゼーションもしくは増幅なしに、そしてさらに、異なる長さもしくは異なるハイブリダイゼーション配列を有すオリゴヌクレオチドなしに、コードのオリゴヌクレオチドを検出する別の方法は、一つ以上のオリゴヌクレオチドを、物理的にもしくは化学的に、改変することである。例えば、オリゴヌクレオチドは、分子標識を含むよう、改変され得る。一つの具体的な例は、ハイブリダイゼーションが存在しない場合においての、ステムループ標識であり、5’末端および3’末端がステムを含む場合に、オリゴヌクレオチドが、ステムループ構造を形成し、そして、ステムのある末端に配置された標識(蛍光プローブ、例えば、TMR)は、ステムの他の末端に配置された光消剤(例えば、DABCYL−CPG)に近接する。このステムループ構造において、標識はクエンチされ、それゆえ、オリゴヌクレオチドによる発光は存在しない。オリゴヌクレオチドが相補的な核酸にハイブリダイズする際、ステム構造は、崩壊され、蛍光プローブは、もはや、抑制されず、そして、オリゴヌクレオチドは、それから、蛍光シグナルを放つ(例えば、Tan et al.,Chem.Eur.J.6:1107(2000))。さらに、異なる発光スペクトルを有すオリゴヌクレオチド中の異なる標識を含むことにより、一意的な標識を含む各オリゴヌクレオチドは、増幅もしくはサイズ分画なしに発光スペクトルを単に検出することにより、識別され得る。別の具体例は、スコーピオンプローブアプローチであり、ここで、標識および消光剤とともにあるステムループ構造は、プライマーに結合される。プライマーが、標的オリゴヌクレオチドにハイブリダイズし、そして標的が増幅される際、プライマーは、ステムループを広げて伸長され、そして、ループは、それの標的配列の分子内にハイブリダイズし、そして、標識は、シグナルを放つ(例えば、Broude,N.E.Trends Biotechnol.20:249(2002))。標識の数が拡大するにつれて、利用可能な一意的なコードの数も拡大する。さらに、オリゴヌクレオチド群中の標識は、異なる長さといった、コードの物理的差異もしくは化学的差異を有する、他のオリゴヌクレオチドの組合せで用いられ得る。
【0078】
さらなる物理的改変もしくは化学的改変は、放射性同位体元素にラベルされた核酸(例えば、dCTP)、および、蛍光標識にラベルされたヌクレオチド(例えば、UTPまたはCTP)を含む、増幅もしくは分画なしのコード作製を、容易にする。ラベルの検出は、このようにラベルされたオリゴヌクレオチドの存在を示す。ラベルは、当業者によく知られた数多くの方法により、結合され得る。例えば、オリゴヌクレオチド(群)のプライマーペアが、ハイブリダイゼーションおよび後の増幅の、前に、間に、もしくは、後に、ラベルされる場合において、オリゴヌクレオチドは、オリゴヌクレオチド増幅の間の、ハイブリダイゼーションもしくは増幅なしに、直接的に標識され得る。代表的には、表sh聞きは、ハイブリダイゼーションの前に起こる。具体的な例において、ラベルされたプライマーもしくはラベルされたヌクレオチドを用いるPCRは、ラベルされた増幅産物を産出する。
【0079】
「直接標識」は、ハイブリダイゼーションより前にオリゴヌクレオチドに、直接的に付加される、もしくは、直接的に結合される。あるいは、プライマーもしくは増幅後の増幅産物に直接的に付加され得る標識は、当業者によく知られる方法、例えば、ニックトランスレーションもしくはエンドラベリングを用いることにより、完成される。間接標識は、ハイブリダイゼーション後のハイブリッド二本鎖に、付加される。例えば、間接標識(例えば、ビオチン)は、ハイブリダイゼーション前にオリゴヌクレオチドに結合する。次のハイブリダイゼーションにおいて、アビジン結合体化蛍光プローブは、オリゴヌクレオチドの検出を容易にするため、ビオチンを保有しているハイブリッド二重鎖に結合する。
【0080】
標識は、それゆえに、核酸が付加され得る組成物、もしくは、核酸に結合され得る組成物を含む。ここで、この核酸は、オリゴヌクレオチドを識別すること方法を提供する、分光器的な方法、光化学的な方法、生化学的な方法、免疫化学的な方法、電気的な方法、光学的な方法、もしくは化学的な方法によって検出可能である。有用な標識は、染色するためのビオチンを含む。この染色は、標識されたストレプトアビジン結合体、磁気ビーズ(例えば、DynabeadsTM)、蛍光染料(例えば、6−FAM,HEX,TET,TAMRA,ROX,JOE,5−FAM,R110,蛍光色素、テキサスレッド、ローダミン、リサミン、フィコエリトリン(Perkin Elmer Cetus)、Cy2,Cy3,CY3.5,Cy5、Cy5.5、Cy7、FluorX(Amersham Biosciences;Genisphere,Hatfield,PA))、放射性標識、酵素(例えば、セイヨウワサビペルオキシダーゼ、アルカリホスファターゼ、およびELISAに用いられる他の酵素)、アレクサ染料(Molecular Probes)、Q−ドット、および、比色分析の標識、例えば、コロイド金もしくは着色したグラスもしくはプラスチックビーズ(例えば、ポリスチレン、ポリプロピレン、ラテックスなど)、を用いて行われる。
【0081】
例示的な説明図(図1および図2)においてコードが作製される際、オリゴヌクレオチドは、プライマーセットと混合される。そのうえ、本発明は、サンプルとともに、もしくは、サンプルはなしに、複数の一意的なプライマーセット(例えば、二つ以上)、および、複数のオリゴヌクレオチド(例えば、二つ以上)を含む組成物、さらに提供する。
【0082】
一意的なプライマーペアは、所与のプライマーセット中にある。すなわち、コードの個別のオリゴヌクレオチドが一つ以上存在しようと、または、存在しなくとも、プライマーペアは、一つ以上のコードのオリゴヌクレオチドに、特異的にハイブリダイズし得る、および、増幅し得る。もし存在するなら、サイズにより区別されるオリゴヌクレオチドは増幅され、そして、増幅産物は、異なる長さを有する。種々の実施形態において、組成物は、三つ以上の一意的なプライマーペア、および、二つ以上のオリゴヌクレオチドを含み、ここで、この一意的なプライマーペアは、第一のプライマーセット、第二のプライマーセット、第三のプライマーセット、第四のプライマーセット、第五のプライマーセット、第六のプライマーセットなどのプライマーセットとして表される。一つ以上の一意的なプライマーペアは、異なる配列を有し、二つのオリゴヌクレオチドに特異的にハイブリダイズし得る、少なくとも二つの一意的なプライマーペアを有する。プライマーのハイブリダイズに対応するオリゴヌクレオチドは、第一のオリゴヌクレオチドセット、第二のオリゴヌクレオチドセット、第三のオリゴヌクレオチドセット、第四のオリゴヌクレオチドセット、第五のオリゴヌクレオチドセット、第六のオリゴヌクレオチドセットなどのオリゴヌクレオチドセットとして表される。このオリゴヌクレオチドは、約8ヌクレオチド〜50Kbの長さを有し、各々のセット中のオリゴヌクレオチドは、同じオリゴヌクレオチドセットを含む、他のオリゴヌクレオチドに対して、物理的差異もしくは化学的差異(例えば、異なる長さ)を有する。種々の局面において、セット中のプライマーの数は、四つ以上のプライマーペア、五つ以上のプライマーペア、六つもしくはそれ以上のプライマーペア(例えば、7、8、9、10、11、12、13、14、15、15〜20、20〜25など)である。種々のさらなる局面において、オリゴヌクレオチドの数は、3、4、5、6、もしくはそれ以上(例えば、7、8、9、10、11、12、13、14、15、15〜20、20〜25など)である。
【0083】
さらなる実施形態において、組成物は、第二のオリゴヌクレオチドセットで表される、一つ以上のオリゴヌクレオチドを含み、オリゴヌクレオチドの各々は、第二のプライマーセットからの一意的なプライマーペアに特異的にハイブリダイズする異なる配列をその中に有する。第二のオリゴヌクレオチドセットは、サンプルに特異的にハイブリダイズし得ないオリゴヌクレオチドを含み、約8ヌクレオチド〜50Kbの長さを含み、そして、第二のオリゴヌクレオチドセット中の他のオリゴヌクレオチドに対して、物理的差異もしくは化学的差異(例えば、異なる長さ)を有する。一つの局面において、第二のオリゴヌクレオチドの一つ以上のオリゴヌクレオチドは、第一のオリゴヌクレオチドセットのオリゴヌクレオチドと同じ長さを有する。さらなる実施形態において、組成物は、第三のオリゴヌクレオチドセットで表される、一つ以上のオリゴヌクレオチドを含み、オリゴヌクレオチドの各々は、第三のプライマーセットからの一意的なプライマーペアに特異的にハイブリダイズする異なる配列をその中に有する。第三のオリゴヌクレオチドセットは、サンプルに特異的にハイブリダイズし得ないオリゴヌクレオチドを含み、約8ヌクレオチド〜50Kbの長さを含み、そして、第三のオリゴヌクレオチドセット中のオリゴヌクレオチドに対して、物理的差異もしくは化学的差異(例えば、異なる長さ)を有する。さらなる局面において、第三のオリゴヌクレオチドの一つ以上のオリゴヌクレオチドは、第一のオリゴヌクレオチドセットもしくは第二のオリゴヌクレオチドセットのオリゴヌクレオチドと同じ長さを有する。
【0084】
本発明の組成物は、一つ以上のさらなるオリゴヌクレオチドセット(例えば、第四のセット、第五のセット、第六のセット、第七のセット、第八のセット、第九のセット、第十のセットなどのセット)を含み得る。さらなるオリゴヌクレオチドセットの各々は、対応するプライマーセット(例えば、第四のセット、第五のセット、第六のセット、第七のセット、第八のセット、第九のセット、第十のセットなどのセット)から、一意的なプライマーセットに特異的にハイブリダイズし得る異なる配列をその中に有するセット中の、オリゴヌクレオチドを含む。各々のさらなるオリゴヌクレオチドセット注の各々のオリゴヌクレオチドは、サンプルに特異的にハイブリダイズし得ず、約8ヌクレオチド〜50Kbの長さを有し、そして、そのオリゴヌクレオチドセット中の他のオリゴヌクレオチドに対して、物理的差異もしくは化学的差異(例えば、異なる長さ)を有する。
【0085】
本明細書中で用いられる、「サンプル」という用語は、物理的実体を意味し、ここで、本発明に対応するコード化(生物学的タグ)がされ得る。サンプルは、それゆえに、サンプルに対応するコードを有し得る材料を含む。サンプルは、それゆえに、生物学的システムに導入するのに適したサンプルとおなじくらいよい、非生物学的サンプルおよび生物学的サンプルを、含み得る。例えば、処方箋もしくは店頭の薬(例えば、薬剤)、化粧品、香水、食料もしくは飲料である。
【0086】
非生物学的サンプルの特異的な非限定の例は、文書を含む。例えば、手紙、コマーシャルペーパー、株券、債務証書、契約書、証拠文書、遺言物(例えば、遺書、遺言補足書、委託物)であり;身元確認方法もしくは認証方法、例えば、出生証明書、ライセンス証明書、署名カード、運転免許書、身分証明カード、社会保障カード、イミグレーションステータスカード、パスポート、指紋であり;流通証券、例えば、通貨、クレジットカードもしくはデビットカードである。非生物学的サンプルのさらなる非限定の例は、衣類および靴のような着用できる衣服を含み、容器、例えば、瓶(プラスチックもしくはグラス)、箱、かご、カプセル、アンプルを含み;ラベル、例えば、認証ラベルもしくは商標;芸術品;例えば、絵画、彫刻、絨毯およびタペストリー、写真、本を含み;収集可能な人工物もしくは歴史的人工物もしくは文化的人工物を含み;記録媒体、例えば、アナログ記憶装置もしくはデジタル記憶装置もしくは装置(例えば、ビデオカセット、CD、DVD、DV、MP3、携帯電話)を含み;電子装置、例えば、器械;アクセサリー、例えば、指輪、腕時計、腕輪、耳飾り、および首飾りを含み;宝石または貴金属、例えば、ダイヤモンド、金、白金を含み;そして、危険物、例えば、武器、弾薬、爆発物または爆発物もしくは爆発装置の調製に適している組成物を含む。
【0087】
生物学的サンプルの特異的な非限定な例は、食料、例えば、肉(例えば、牛肉、豚肉、子羊の肉、鳥、または魚)を含み、穀物および野菜を含み;そして、アルコール飲料もしくはノンアルコール飲料、例えば、ワインを含む。生物学的サンプルの非限定な例は、組織、および、すべての器官もしくはそのサンプル、法医学的サンプル、および、生物学的流体、例えば、血液(血液バンク)、血漿、漿液、痰、精液、尿、粘液、便および脳脊髄液を、さらに含む。生物学的サンプルのさらなる非限定的例は、生きている細胞または生きていない細胞、卵(受精卵または未受精卵)および精子(家畜または飼育サンプルを含む)。
生物学的サンプルのさらなる非限定な例は、細菌、ウイルス、酵母、または、マイコプラズマ、例えば、病原体(例えば、天然痘、炭疽)を含む。
【0088】
核酸のサンプルは、哺乳動物性核酸(例えば、ヒト)、細菌性核酸、ウイルス性核酸、古細菌の核酸および菌門の核酸(例えば、酵母)を含む。先に述べたように、このような核酸サンプルのコード化に用いるオリゴヌクレオチドは、コード作製を妨げないハイブリダイゼーションの範囲で、核酸サンプルに特異的にハイブリダイズしない。さらに、例えば、ヒト性の核酸である場合において、オリゴヌクレオチド群は、概して、ヒト性の核酸に特異的にハイブリダイズせず;細菌性の核酸である場合において、オリゴヌクレオチド群は、概して、細菌性の核酸に特異的にハイブリダイズせず;ウイルス性の核酸である場合において、オリゴヌクレオチド群は、概して、ウイルス性の核酸に特異的にハイブリダイズしないなどである。
【0089】
コードとサンプルとの間の関係は、サンプルを一意的に識別できるコードとの物理的関係である。このコードは、それゆえに、サンプルに結合するか、サンプルに連結するか、サンプルに浸透するか、サンプルと混合されるか、またはサンプルに関する他の方法で結合し得る。この関係は、コードとサンプルとの間の物理的接触を必要としない。むしろ、この関係は、サンプルおよびコードが、互い物理的接触をしようとも、または、しなくとも、コードにより識別されるサンプルという関係である。例えば、コードは、その中にサンプルを含む容器に、付与され得る(例えば、小瓶の外面上のラベル)。コードは、実際のサンプルのうちで、産物をひとまとめにすることに結び付けられ得る。コードは、ハウジングもしくは他の構造に、付与され得、ここで、このコードは、サンプルを一意的に識別し得るコードのサンプルとのなんらかの結びつきを、含む、もしくは、そうでなければ有し、このコードは、実際に物理的にサンプルを含まない。このコードおよびサンプルは、それゆえに、互いに物理的接触を必要としないが、サンプルを識別し得るコードの関係を有すことのみを必要とする。
【0090】
オリゴヌクレオチドは、サンプルおよび混合物が、付与され得る、もしくは、混合され得る。ここで、これらは、固体、半固体、液体、スラリー、例えば凍結乾燥のような乾燥物であり得る。オリゴヌクレオチドは、比較的、サンプルから分離できない。例えば、核酸のような生物学的サンプルと混合されたオリゴヌクレオチド群の場合、このオリゴヌクレオチド群は、サイズもしくは親和性に基づく電気泳動、カラムクロマトグラフィー、ハイブリダイゼーション、差異のある溶出のような、生物分子、または、生化学的技術もしくは生物理学的技術を用いて、サンプルから分離できる。
【0091】
ここに記載されるように、オリゴヌクレオチドは、サンプルから物理学的に簡単に分離可能サンプルとの関係であり得る。基材の例において、一つ以上のオリゴヌクレオチドは、サンプルが基材に付与されるのに十分残されている条件の下で、サンプルから物理学的に簡単に分離可能である。例えば、オリゴヌクレオチドが、乾燥固体媒体(例えば、ガスリーカード)に添加され、そして、サンプルが同じ乾燥固体媒体に同じように添加される際、両者は、媒体上の異なる位置に添付される。オリゴヌクレオチドもしくはサンプルの位置を知ることで、それらは、オリゴヌクレオチドもしくはサンプルが添付された基材の部分を取り除くことにより(例えば、パンチ)、物理的に簡単に分離され得る。別の例において、オリゴヌクレオチド群は、サンプル(群)を含むプレートの他のウェルとともに、マルチウェルプレートのウェルに分配され得る(例えば、96ウェルプレート)。オリゴヌクレオチド群は、それらが分配されたウェルからそれらを回収することによって(例えば、ピペットを用いて)、サンプルから物理的に分離される。
【0092】
どちらかの場合、つまり、コードのオリゴヌクレオチド群がサンプルに対して物理的に接触する場合か、または、コードのオリゴヌクレオチド群が結びついているが、しかし、物理的に接触しない場合、このオリゴヌクレオチド群は、コード作製するため、識別され得る。さらに、本発明は、コードのオリゴヌクレオチド群と、コードされたサンプルとの間の関係の自然力という点で限定されない。
【0093】
合成され得る、添付され得る、付与され得る、または、保管され得る、オリゴヌクレオチドおよびサンプルの基材は、本質的に、どんな物理的実体もしくは物理的材料であっても、中にもしくは上に、含まれている。例えば、二次元面、すなわち、透過性、半透過性、もしくは不透過性であり、硬いか柔らかいか、および、保存し得るか結合し得るか、または、そこへ添付されたものを有するか、または、オリゴヌクレオチドと混合されているかである。サンプルもしくはオリゴヌクレオチドを含む基材は(例えば、コードオリゴヌクレオチド、識別子オリゴヌクレオチド、もしくは、プライマーペア)、本明細書中で用いられる「キャリア基材」として表される。基材は、複数の基材を含み、例えば、二つ以上の基材のアーカイブである。
【0094】
基材は、乾燥固体媒体を含み、例えば、セルロース、ポリエステル、ナイロン、ガラス、プラスチック(アクリル、ポリスチレン、ポリプロピレン、ポリエチレン、ポリブチレン、ポリカーボネート、ポリウレタンなどを含む)、ポリサッカリド、ニトロセルロース、レジン、シリカ、または、シリコン、ポリシロキサン、ポリアセテート、炭素、金属、無機グラスおよびその混合物を含むシリカに基づく材料である。概して、基材の他の構造が用いられ得ても、基材は平ら(平坦)である。例えば、三次元の材料は、例えば、ビーズおよび小球体である。基材は、どんなサイズもしくは次元でもあり得る。代表的には、薬4平方センチメートル未満の表面積を有する。
【0095】
具体的な市販の乾燥固体媒体としては、例えば、ガスリーカード、IsoCode(Schleicher and Schuell)、およびFTA(Whatman)が挙げられる。セルロースおよびポリエステルの混合物を含む媒体は、以下の点において有用である。小さい分子量の核酸(例えば、コードを含むオリゴヌクレオチド群)は、セルロース成分、および、ポリエステル成分に優先的に結合する大きい分子量の核酸(例えば、ゲノムDNA)に、優先的に結合する。セルロース/ポリエステル混合物の特異的な例は、Lypore(Lydall)であり、これは、約10%のセルロース繊維および約90%のポリエステルを含む。適切の液体で乾燥固体媒体を洗うことで、もしくは、部分を取り除くこと(例えば、パンチ)で、媒体からオリゴヌクレオチドまたはサンプルを回収する。ここで、コードを作成が後に分析され得、もしくは、サンプルを分析が後に分析され得る。
【0096】
基材は泡状体を含み、例えば、吸収性の泡状体である。オリゴヌクレオチドもしくはサンプルを有するスポンジのような吸収性の泡状体の具体的な例において、この泡状体は、適切な液体で、濡れ得る、もしくは、濡れされ得る。そして、この泡状体は、オリゴヌクレオチドもしくはサンプルを含む液体を放出するため、搾り出され得る、もしくは、遠心分離機で分離され得る。基材は、互いのサンプルの混合もしくはオリゴヌクレオチドとサンプルとの混合を防ぐために、互いに分離された、切断された部分、区画、ウェル、容器、容器もしくはチューブ、を有する構造を含む。マルチウェルプレートは、概して、6〜1000ウェルを含み、このような構造の特有な非限定の例の一つである。
【0097】
基材は、生物分子もしくは生物学的材料を含む、二次元アレイもしくは三次元アレイをさらに含み、これは、「標的分子」、「標的配列」、もしくは「標的材料」としてここで言及される。このような基材は、サンプルのスクリーニング、サンプルの塩基配列決定、サンプルのマッピング、サンプルのフィンガープリンティング、および、サンプルの遺伝子型決定のために、有用である。生物分子が含まれる一意的な同一性は、既知もしくは未知になり得る。例えば、既知の核酸配列は、相補的な配列に特異的にハイブリダイズし、そしてそれゆえに、このような配列は、認識特異性という定義を有す。
【0098】
生物分子は、自然発生物もしくは人工物であり得る。生物分子は、概して、タンパク質の相互作用、特有の水素結合に関与する機能グループを含む。そして、この生物分子は、概して、少なくとも、アミン基、カルボニル基、ヒドロキシル基もしくはカルボキシル基を含む。一つ以上の上記機能グループに代用される、サイクルカーボンもしくはヘテロサイクル構造、または、芳香族もしくは多環芳香族構造をさらに含み得る。さらに、生物分子の具体的な例としては、低分子有機化合物が挙げられ、これは、例えば、薬品のような、約2,500ダルトン以下の分子量を有する。生物分子のさらなる具体的な例としては、核酸、タンパク質(抗体、レセプター、リガンド)、サッカリド、炭素水和物、レクチン、脂肪酸、脂質、ステロイド、プリン、ピリミジン、誘導体、構造の類似体およびその組合せが挙げられる。
【0099】
「プローブ」は、標的分子、標的配列、および、標的材料に対して、潜在的に相互作用する分子であり、例えば、このような核酸サンプルもしくはタンパク質サンプルのクエリーである。さらに、標的分子、標的配列、および、標的材料は、「抗プローブ」として表され得る。標的分子において、プローブは、本質的にどんな生物分子もしくは複数のこのような分子である。
【0100】
基材は、生物分子のどんな数も含み得る。例えば、約25、50、100、1,000、10,000、100,000、1,000,000、10,000,000、100,000,000、1,000,000,000、もしくはそれ以上より大きい、核酸配列もしくはタンパク質配列とともにあるアレイは、当業者に知られている。このような基材は、「遺伝子チップ」もしくは「アレイ」として援用され、この基材は、どんな核酸密度もしくはタンパク質密度も有し;密度が高くなればなるほど、所定のチップ上で選別され得る配列の数も大きくなる。さらに、非常に低い密度のアレイ、低い密度のアレイ、中程度の密度のアレイ、高い密度のアレイ、もしくは、非常に高い密度のアレイは、作られ得る。非常に低い密度のアレイは、1,000以下である。低い密度のアレイは、概して、10,000以下であり、約1,000〜約5,000が好ましい。中程度の密度のアレイは、約10,000〜約100,000である。高い密度のアレイは、約100,000〜約10,000,000である。例示的なアレイの密度は、平方センチメートルごとに少なくとも25分子である。いくらかのアレイにおいて、複数の基材は、異なる生物分子もしくは同一の生物分子のどちらかが、用いられ得る。さらに、例えば、大きなアレイは、複数の小さいアレイまたは基材を含み得る。
【0101】
アレイは、概して、所定の位置もしくは潜在的に区別し得る(アドレス可能な)位置に配置される複数の生物分子とともに、平面を有し、これは、標的分子と検出できるプローブとの間の相互作用(例えば、ハイブリダイゼーション)のためである。
この生物分子は、パターン中にあり得る。例えば、規則的なもしくは整然とした構成または配列、ならびに、無秩序な分配されたものである。規則的なパターンの例は、X−Y座標面中に、もしくは、「列」×「行」座標面中に配置された位置である(例えば、グリッドパターン)。「パターン」は、上記に記載される、一様なもしくは組織化された、基材の処理として表されるか、または、基材に付与される標的分子との間の、一様なもしくは組織化された、空間的な関係として表され、結果として別々の場所となる。
【0102】
相互作用を検出する適切な方法は、標的およびプローブの自然力に次第である。
例示的な方法は、当該分野で知られており、例えば、放射性種、酵素、基材、補因子、抑制因子、磁性粒子、重金属、および分光器的なラベルである。検出および計量の、高い解像度および高い感度は、ここに記載されているおよび当業者に知られている、蛍光プローブおよび発光性物質で、達成され得る。ハイブリダイゼーションシグナル検出方法、ならびに、シグナル検出およびシグナル密度データの実行の、方法および装置は以下に記載される。例えば、WO99/47964および米国特許番号5,143,854、米国特許番号5,547,839、米国特許番号5,578,832、米国特許番号5,631,734;米国特許番号5,800,992、米国特許番号5,834,758、米国特許番号5,856,092、米国特許番号5,902,723、米国特許番号5,936,324;米国特許番号5,981,956;米国特許番号6,025,601;米国特許番号6,090,555、米国特許番号6,141,096;米国特許番号6,185,030;米国特許番号6,201,639;米国特許番号6,218,803、および、米国特許番号6,225,625;ならびに、米国特許公開番号20030215841、および、米国特許公開番号20030073125.
核酸もしくはタンパク質(例えば、一つ以上のサンプル(群))のような生物分子は、概して、基材上で合成され、または、基材の表面の、所定の位置(アドレス)に付与される(例えば、共有結合もしくは非共有結合または化学結合によって、直接にまたは付加成分もしくは吸収もしくは光架橋によって)。これらの位置は、必要に応じて、所定される。各分子の位置は、概して、前後関係に依存して決められ、および、物理的に別々の場所に配置される。
【0103】
基材の表面は、改変されて、その結果、単一の種類の生物学的分子(例えば、特定の配列を有する核酸またはポリヌクレオチド)を有する別個の部位が、形成される。例えば、その基材は、生物学的分子を保持するウェルまたは小さな窪みのような物理学的配置を有する。基材中のウェルまたは窪みは、当該分野で公知の種々の技術を使用し製造され得る。これらの技術としては、例えば、フォトリソグラフィ技術、スタンプ技術、鋳型技術、および微細エッチング技術が挙げられる。
【0104】
この基材は、共有結合または非共有結合で、生体分子に結合されるように化学的に改変され得る。例示的な改変としては、化学的、静電気的、疎水性に、および親水性に官能化した部位ならびに粘着性物質が挙げられる。化学的改変としては、例えば、以下が挙げられる:生体分子に共有結合するために用いられ得る、化学基(例えば、アミノ基、カルボキシル基、オキソ基、チオール基)の付加;生体分子に結合するための粘着性物質の付加;生体分子の静電気的結合のための荷電基の付加;その部位に、差次的に、疎水性または親水性をその部位に付与して、その結果、その基材が、水に対する親和性(hydroaffinity)に基づいて、生体分子と結合するような化学官能基の付加。
【0105】
アレイ合成方法は、例えば、以下に記載されている:WO00/58516、WO99/36760、ならびに、米国特許番号5,143,854、米国特許番号5,242,974、米国特許番号5,252,743、米国特許番号5,324,633、米国特許番号5,384,261、米国特許番号5,405,783、米国特許番号5,424,186、米国特許番号5,451,683、米国特許番号5,482,867、米国特許番号5,491,074、米国特許番号5,527,681、米国特許番号5,550,215、米国特許番号5,571,639、米国特許番号5,578,832、米国特許番号5,593,839、米国特許番号5,599,695、米国特許番号5,624,711、米国特許番号5,631,734、米国特許番号5,795,716、米国特許番号5,831,070、米国特許番号5,837,832、米国特許番号5,856,101、米国特許番号5,858,659、米国特許番号5,936,324、米国特許番号5,968,740、米国特許番号5,974,164、米国特許番号5,981,185、米国特許番号5,981,956、米国特許番号6,025,601、米国特許番号6,033,860、米国特許番号6,040,193、米国特許番号6,090,555、米国特許番号6,136,269、米国特許番号6,269,846、および米国特許番号6,428,752;ならびに米国特許公開番号20040023367、米国特許公開番号20030157700、および米国特許公開番号20030119011。本発明において有用な核酸アレイは、Illumina(San Diego,CA)およびAffymetrix(Santa Clara,CA)から市販されている。
【0106】
基材は、生体分子のアレイの二次元構造のまたは三次元構造のアレイを含む。例えば、核酸またはタンパク質、および、その中の特定の核酸配列またはタンパク質配列であり、これらは、本発明に対応するようコード化され得る。さらに、例えば、この基材そのものは、多数の核酸配列またはタンパク質配列を含む基材が一意的なコードを有す場合において、サンプルになり得る。そのかわりに、基材上にある各々が別個の、一つ以上の一意的な核酸配列または一意的なタンパク質配列は、特定のコードを有し得る。例えば、一意的なオリゴヌクレオチドコードは、コード化されたサンプルを区別するために、基材上の一つ以上のサンプルに付与され得る。
【0107】
別の選択肢として、基材はオリゴヌクレオチドを含み得、このオリゴヌクレオチドは、サンプル中のコードを識別する、識別子オリゴヌクレオチドとして援用される。例えば、マイクロアレイ技術において、概して、生物学的サンプルは、標的分子を含むアレイと接触される。この標的分子は、そのサンプル中にあるプローブ分子(例えば、タンパク質または核酸)と、潜在的に相互に作用する。サンプルのプロファイルは作製される。例えば、遺伝子発現プロファイルであり、これは、サンプル中のプローブと相互に作用する特定の標的に基づく。「識別子オリゴヌクレオチド」を含むアレイは、コードのオリゴヌクレオチドに対して、特異的にハイブリダイズし得るオリゴヌクレオチドであり、アレイで分析されたサンプル中のコードを決定し得る。識別子オリゴヌクレオチドは、十分な数である。この数は、サンプル中に存在し得る可能性のあるすべてのコードオリゴヌクレオチドに対して、特異的にハイブリダイズし得る識別子オリゴヌクレオチドをまとめた数である。識別子オリゴヌクレオチドとコードオリゴヌクレオチドとの間の特異的なハイブリダイゼーションは、コード中に存在するオリゴヌクレオチドを識別し、シグナル(例えば、蛍光、化学発光)を発することにより、このようなハイブリダイゼーションを表示する。一方、どんなコードオリゴヌクレオチドにも特異的にハイブリダイズしない識別子オリゴヌクレオチドは、ハイブリダイゼーションを表示するシグナルを発さず、対応する相補的なコードオリゴヌクレオチド群がサンプル中に存在しないことを示す。
【0108】
各々の識別子オリゴヌクレオチドは、基材(例えば、アレイ)上の所定の場所または位置に固定される。例えば、識別子オリゴヌクレオチドは、一定のパターンで構成されたアレイ上か、または、列もしくは行のような他の構成上の指定アドレスに配置され得る。または、アレイの列および行の一区分、例えば、2×2パターンの「列×行」(4識別子オリゴヌクレオチド)、2×3もしくは3×2パターンの「列×行」(6識別子オリゴヌクレオチド)、3×3パターンの「列×行」(9識別子オリゴヌクレオチド)、3×4もしくは4×3パターンの「列×行」(12識別子オリゴヌクレオチド)、4×4パターンの「列×行」(16識別子オリゴヌクレオチド)、4×5もしくは5×4パターンの「列×行」(20識別子オリゴヌクレオチド)、5×5パターンの「列×行」(25識別子オリゴヌクレオチド)、などである。コード中のオリゴヌクレオチドと同様に、サンプル作製を妨げないハイブリダイゼーションの範囲で、識別子オリゴヌクレオチドもまた、サンプル中の核酸に対して、特異的にハイブリダイズしない。
【0109】
本発明に対応するオリゴヌクレオチドの一意的な組合せでコード化されたサンプルは、上記の識別子オリゴヌクレオチドを含む基材(例えば、アレイ)と接触し得る。コード化されたサンプルとの接触後に、識別子オリゴヌクレオチドは検出され、この識別子オリゴヌクレオチドは、サンプル中に存在するそれの相補的なコードに対して特異的にハイブリダイズする。前述と同様に、コードは、識別されるか、または、「デコード(化)」される。これは、オリゴヌクレオチド群がコード中に存在すること(陽性)、および、オリゴヌクレオチドがコード中に存在しないこと(陰性)に基づいている。前述のように、コード中の所与のオリゴヌクレオチドの存在または非存在は、必要に応じて、バーコード中の各ポジションとして表され得る。例えば、「1」は、一意的な識別子オリゴヌクレオチドに対するハイブリダイゼーションを示し、そして、「0」は、一意的な識別子オリゴヌクレオチドに対するハイブリダイゼーションが存在しないことを示す。
【0110】
上記識別子オリゴヌクレオチドを含む基材を用いることは、サンプルコードで、サンプルプロファイルを作製させる。このサンプルコードは、サンプルの同一性の内部検査を提供する。換言すると、したがって、サンプルコードおよびサンプルの同一性は、そのサンプルのプロファイルに対して、永続的にリンクされ、そして、関連付けられる。
【0111】
したがって、本発明は、基材を含む組成物を、さらに提供する。そして、多数のポリヌクレオチド配列またはポリペプチド配列の各々は、基材上の所定の位置に、固定される。一つの実施形態において、少なくとも二つのポリペプチド配列またはポリヌクレオチド配列は、標的配列として表され、および、互いに区別される。そして、少なくとも一つのポリヌクレオチド配列は、識別子オリゴヌクレオチドとして表され、標的配列に対して特異的にハイブリダイズし得ない核酸に、特異的にハイブリダイズしない。別の実施形態において、少なくとも二つのポリヌクレオチド配列は、互いに区別できる識別子オリゴヌクレオチドとして表され、そして、少なくとも三つのポリヌクレオチド配列は、識別子オリゴヌクレオチドとして表され、標的配列に対して特異的にハイブリダイズし得ない核酸に、特異的にハイブリダイズしない。種々の局面において、標的配列は、ライブラリー(例えば、ゲノムDNA,cDNAもしくはESTのような核酸;または、例えば、抗体、受容体、リガンドもしくはレクチンに結合する受容体といった結合分子であるポリペプチドライブラリー;または、酵素ライブラリー)を含む。例えば、哺乳類のライブラリーであり、このライブラリーは、少なくとも、10〜100、100〜1,000、1000〜10000、10000〜100000、またはそれ以上の標的配列を有する。
【0112】
識別子オリゴヌクレオチドの数は変動し得、コードまたは生物学的タグに潜在的に存在するあらゆるオリゴヌクレオチドを識別するために十分であることだけが必要であり得る。従って、2個の識別しオリゴヌクレオチドと5個の識別子オリゴヌクレオチド(またはコードオリゴヌクレオチドに対する特異的ハイブリダイゼーションにとって適している場合には、それ以上の識別子オリゴヌクレオチド(例えば、5個〜10個、10個〜15個、15個〜20個、20個〜25個、25個〜30個、30個〜50個、またはそれ以上の識別子オリゴヌクレオチド))との間で存在し得る。基材またはアレイ上に存在する場合、その識別子オリゴヌクレオチドは、代表的には、例えば、列または行でパターン化されて、識別を容易にすることが可能になる。
【0113】
コードまたは生物学的タグのオリゴヌクレオチドと同様に、サンプルが核酸を含む場合、識別子オリゴヌクレオチドは、コード形態が発生しないように、ハイブリダイゼーションを防止する程度まで、その核酸に特異的にハイブリダイゼーションすることができない。コードオリゴヌクレオチドと同様に、このようなハイブリダイゼーションは、サンプル標的配列と同じ種でない、コードオリゴヌクレオチドおよび対応する識別子オリゴヌクレオチドを用いて最小にされ得る。例えば、そのサンプル標的配列がヒトである場合、コードオリゴヌクレオチド、よって識別子オリゴヌクレオチドは、完全にヒトではない;そのサンプル標的配列が植物である場合、コードオリゴヌクレオチド、よって識別子オリゴヌクレオチドは、完全に植物ではない;そのサンプル標的配列が細菌である場合、コードオリゴヌクレオチド、よって識別子オリゴヌクレオチドは、完全に細菌ではない;そのサンプル標的配列がウイルスである場合、コードオリゴヌクレオチド、よって識別子オリゴヌクレオチドは、完全にウイルスでないなど。
【0114】
コードオリゴヌクレオチドを含むサンプルは、このような基材に直接接触され得るか、またはその基材と接触させる前に処置され得る。例えば、その基材と接触させる前に、サンプルまたはコードの量を増大させることが望ましい場合、そのコードまたはサンプルは、増幅され得る。従って、核酸サンプルに関しては、望ましい場合、核酸およびコードの量がともに、増大されて、ハイブリダイゼーション感受性またはハイブリダイゼーション検出を増大し、従って、基材での低コピー数の核酸配列またはコードオリゴヌクレオチドの検出を増大させ得る。
【0115】
本明細書で記載されるように、コードオリゴヌクレオチドは、共通プライマーセットを有するが、プライマー結合部位の間の内部配列またはプライマー結合部位に隣接する配列の間の内部配列が異なるように設計される。このようにして、サンプル中の全てのコードオリゴヌクレオチドは、1つのプライマーセットで増幅され得る。そのコードオリゴヌクレオチドは、特有の配列を含むので、特異的にハイブリダイズする識別子オリゴヌクレオチドは、そのコードオリゴヌクレオチドの特有の配列に相補的な配列を有するように設計され得る。例えば、2つのコードオリゴヌクレオチドのプライマー結合部位の間で異なる、間にある配列は、たとえ両方のコードオリゴヌクレオチドが、プライマー結合のための同じ配列を有しているとしても、互いから区別することを可能にする。この設計は、所定のプライマーセットのために生成され得るコード数を増大させ得る。
【0116】
本発明のこの局面のさらなる特徴は、コードオリゴヌクレオチドが、非常に特異的な情報を提供するために使用され得ることである。例えば、コードオリゴヌクレオチドは、特定の病院、診療所、研究機関、またはサンプルが得られた任意の他の供給源に割り当てられ得る。その割り当てられたコードは、そのコードが、そのサンプル供給源(例えば、そ
のコードが割り当てられた特定の病院、診療所など)を明確に識別するように、そのサンプルの供給源に特有である。このようなコードオリゴヌクレオチドは、そのサンプルとその供給源との間に関連性を提供し、それによって、そのサンプルがその供給源であることを追跡し、サンプルの誤った識別を最小にする手段を提供する。コードオリゴヌクレオチドは、特定の基材、アレイまたは研究の型を識別するために使用され得る。従って、そのコードが提供する情報は、二進数情報に限定されない。さらに、基材またはアレイ上でのオリゴヌクレオチドの位置はまた、情報を提供するために使用され得る。
【0117】
サンプル分析のために使用され得るアレイまたは基材上に、本明細書で示される特有の生物学的タグを含み、必要に応じて、識別子オリゴヌクレオチドを含むことによって得られるサンプル識別は、どんなときでもサンプルの追跡を可能にする。その特有のコードに基づいてサンプルを明らかに識別する能力は、サンプルを使用する手順の間に起こり得る、サンプルの誤った処理、表示の間違い(mislabeling)、または誤認による間違いを防止する。明らかなサンプル識別は、多数のサンプルが処理される場合、サンプルの誤認が間違ったデータをもたらし得る場合、およびサンプルが、複数の研究または複数手順に供される場合に、特に価値がある。例えば、遺伝子型研究は、代表的には、疾患と遺伝子座との間の関連性を検出するために、非常に多くのサンプルの分析を要する。明らかなサンプル識別は、誤り率が非常に低くても(1〜2%)、大きな影響を与える可能性があり、タイプI(偽陽性)およびタイプII(LOP;loss of power)両方のタイプの間違いが増えるので、重要である。サンプルスワップ(1つのサンプルが、別のサンプルとして誤って表示されるか、誤認されるか、または間違って扱われる)は、遺伝子型研究においては非常によくある間違いの元である。本発明は、とりわけ、固有に識別されるサンプルを生成するための組成物および方法、ならびにこのようなサンプルを識別するための組成物および方法を提供し、本発明は、このような間違いを低下させかつ排除するために使用され得る。
【0118】
本発明は、本明細書に記載される組成物を備えるキットを提供する。一実施形態において、キットは、1個以上のオリゴヌクレオチドセットにおいて2個以上のオリゴヌクレオチドを含み、適切な梱包材料へと梱包される。キットは、1以上のセットのオリゴヌクレオチド、1以上のセットのプライマー対(必要に応じて、単独でまたは互いに組み合わせて)を含み得る。キットは、代表的には、その成分の説明または使用(例えば、サンプルのコード付け)の説明を含むラベルまたは梱包挿入物を含む。キットは、さらなる成分(例えば、そのオリゴヌクレオチドに特異的にハイブリダイズするプライマー対)を含み得る。
【0119】
用語「梱包材料」とは、そのキットの成分を収容する物理的構造体をいう。その梱包材料は、その成分を無菌状態に維持し得、かつこのような目的で一般に使用される材料(例えば、紙、段ボール繊維、ガラス、プラスチック、ホイル、アンプルなど)から作られ得る。その表示または梱包挿入物は、適切な書面による説明(例えば、本発明の方法を実施するための)を含み得る。本発明のキットは、従って、本発明の方法においてそのキット成分を使用するための表示または説明書をさらに含み得る。説明書は、本明細書に記載される本発明の方法のいずれかを実施するための説明書を含み得る。その説明書は、例えば、そのキットの中の紙または厚紙に「印刷されたもの」であってもよいし、あるいはそのキットまたは梱包材料に貼付された表示であってもよいし、そのキットの成分を含むバイアルまたはチューブに貼付されていてもよい。説明書は、さらにコンピュータ読み取り可能な媒体(例えば、ディスク(フロッピー(登録商標)ディスケットまたはハードディスク)、光学CD(例えば、CD−ROM/RAMもしくはDVD−ROM/RAM、DV、MP3)、磁気テープ、電子保存媒体(例えば、RAMおよびROM)、ならびにこれらのハイブリッド(例えば、磁気保存媒体/光学保存媒体))に含まれ得る。
【0120】
本発明のキットは、個々の容器の中に閉じこめられたキットの各成分(例えば、オリゴヌクレオチド)を含み得、種々の容器の全てが1つの包装内に存在し得る。本発明のキットは、長期間(例えば、冷所での)保存用に設計され得る。
【0121】
本発明は、サンプルを識別するために、コードされる(すなわち、生物学的タグ化される)サンプルを生成する方法を提供する。一実施形態において、方法は、2個以上のオリゴヌクレオチドの組み合わせを選択して、そのサンプルに特異的にハイブリダイズできないサンプルに添加する工程であって、各々は、約8〜約50Kbのヌクレオチドの長さ、ならびに物理的または化学的差異(例えば、異なる長さ)を有し、その1以上のオリゴヌクレオチドは、その中に特有のプライマー対に特異的にハイブリダイズし得る異なる配列を有する、工程;ならびに2以上のオリゴヌクレオチドの組み合わせを、そのサンプルに添加する工程を包含する。そのオリゴヌクレオチドの組み合わせは、サンプルを識別し、従って、この方法は、生物学的タグ化サンプルを生成する。さらなる実施形態において、本発明の方法は、複数(例えば、2個、3個、4個、5個、6個、7個、8個、9個、10個など、またはより多い)オリゴヌクレオチドセットから1個以上のオリゴヌクレオチドを使用し、ここでさらなるオリゴヌクレオチドセットから1つ以上のオリゴヌクレオチドがサンプルに添加される。1つの特定の実施形態において、第2のセットからの1個以上のオリゴヌクレオチドが添加され、その第2のセットの1個以上のオリゴヌクレオチドは、その中に第2のプライマーセットの特有のプライマー対に特異的にハイブリダイズし得るが、サンプルには特異的にハイブリダイズできない異なる配列を有し、第2のセットの他のオリゴヌクレオチドとは異なる物理的差異または化学的差異(例えば、異なる長さ)を有し、約8〜50Kbのヌクレオチドを有する。別の特定の実施形態において、第3のオリゴヌクレオチドセットからの1個以上のオリゴヌクレオチドが添加され、その第3のセットの1個以上のオリゴヌクレオチドが、その中に第3のプライマーセットの特有のプライマー対に特異的にハイブリダイズし得るが、サンプルには特異的にハイブリダイズできない異なる配列を有し、第3のセットの他のオリゴヌクレオチドとは異なる物理的差異または化学的差異(例えば、異なる長さ)を有し、約8〜50Kbのヌクレオチドを有する。コードされたサンプルを生成する方法の一局面において、そのコードのオリゴヌクレオチドの1個以上は、サンプルから物理的に分離されているかまたは分離可能である。
【0122】
本発明はまた、コードされた(すなわち、「生物学的タグ化」)サンプルを識別する方法を提供する。一実施形態において、方法は、2個以上のオリゴヌクレオチドの存在または非存在をサンプル中で検出する工程であって、ここでこのオリゴヌクレオチドは、物理的差異または化学的差異(例えば、長さ)に基づいて識別され、それによって、そのサンプル中のオリゴヌクレオチドの組み合わせを識別する工程;そのオリゴヌクレオチドの組み合わせと、特定のサンプルを識別することが既知の特定のオリゴヌクレオチドの組み合わせのデータベースとを比較する工程;ならびにそのデータベース中の特定のオリゴヌクレオチドの組み合わせのどれが、そのサンプル中のオリゴヌクレオチドの組み合わせと同一であるかに基づいて、サンプルを識別する工程、を包含する。そのオリゴヌクレオチドの組み合わせは、そのオリゴヌクレオチドに特異的にハイブリダイズするプライマーまたはプライマー対(例えば、その後の増幅ありまたはなしでの差次的プライマーハイブリダイゼーション)に基づいて識別され得る。従って、別の実施形態において、方法は、1個以上のプライマーセットのうちの1個以上の特有のプライマーを、存在し得るオリゴヌクレオチドに特異的にハイブリダイズさせ、それにより、存在するオリゴヌクレオチドを識別する工程をさらに包含する。オリゴヌクレオチドは、存在するオリゴヌクレオチドに対するプライマー対ハイブリダイゼーションに基づいて識別され;サンプル中に存在する特定のオリゴヌクレオチドの組み合わせは、そのサンプルのコードである。オリゴヌクレオチドを識別/検出するための方法は、異なる配列を有する2個以上の特有のプライマー対に対するハイブリダイゼーション;ならびに異なる配列およびその後の増幅(例えば、PCR)を有する2個以上の特有のプライマー対に対するハイブリダイゼーションを包含する。さらなる局面において、サンプル中に存在する可能性があるオリゴヌクレオチドは、2個以上のオリゴヌクレオチドセット(例えば、2個、3個、4個、5個、6個、7個、8個、9個などのセット)から選択され、このようにして、本発明の方法は、異なるオリゴヌクレオチドセットからのオリゴヌクレオチドのどれが、存在するかを識別するために、2個以上のプライマーセットの1個以上の特有のプライマー対を、増幅ありまたはその後の増幅なしで存在し得るオリゴヌクレオチドにハイブリダイズさせる工程をさらに包含し得る。
【0123】
本発明は、さらに、コード化(すなわち、生物学的タグ化)サンプルのアーカイブを提供する。1つの実施形態において、生物学的タグ化サンプルのアーカイブは、1つ以上のサンプル;1つ以上のこのサンプルに特異的にハイブリダイズできない2つ以上のオリゴヌクレオチドであって、各オリゴヌクレオチドが、物理的差異または化学的差異(例えば、異なる長さ)、および約8〜50Kbヌクレオチドの長さを有し、1つ以上のこのオリゴヌクレオチドが、この1つ以上のサンプルを識別する一意的な組み合わせで、一意的なプライマーに特異的にハイブリダイズし得る、異なる配列をその中に有する、オリゴヌクレオチド;ならびにこのサンプルを保存するための保存媒体を含む。種々の局面において、アーカイブは、1〜10、10〜50、50〜100、100〜500、500〜1000、1000〜5000、5000〜10,000、10,000〜100,000、またはそれ以上のサンプルを含み、その1つ以上がコード化されている。
【0124】
本発明は、さらに、コード化(すなわち、生物学的タグ化)サンプルのアーカイブを作製する方法を提供する。一実施形態において、方法は、このサンプルに特異的にハイブリダイズできない2つ以上のオリゴヌクレオチドの組み合わせを選択する工程であって、各々が、化学的差異または物理的差異(例えば、異なる長さ)、および約8〜50Kbヌクレオチドの長さを有し、1つ以上のこのオリゴヌクレオチドが、一意的なプライマーに特異的にハイブリダイズし得る、異なる配列をその中に有する、工程;ならびに2つ以上のオリゴヌクレオチドの組み合わせをサンプルに添加する工程、を包含する。次いで、作製された生物学的タグ化サンプルを、保存媒体に配置する。
【0125】
保存媒体に配置された2つ以上のサンプルは、アーカイブを構成する。基材は、アーカイブに含まれ得、このアーカイブは、基材のための保存媒体を含む。このような基材は、本明細書中に記載されるように、サンプル、コードまたは生物学的タグ、1つ以上の識別子オリゴヌクレオチドを含み得る。
【0126】
本発明は、1つ以上の識別子オリゴヌクレオチドを含むアレイまたは基材を使用して、サンプルコードを識別する方法を提供する。1つの実施形態において、方法は、2つ以上の識別子オリゴヌクレオチドを含む基材を提供する工程であって、識別子オリゴヌクレオチドの数は、コード化サンプル中に潜在的に存在する全てのオリゴヌクレオチドに特異的にハイブリダイズするのに十分である、工程;この基材をコード化サンプルと接触させる工程;ならびにこの識別子オリゴヌクレオチドとこのサンプル中に存在するコードオリゴヌクレオチドとの間の特異的ハイブリダイゼーションを検出する工程を包含し、これによって、このサンプル中の存在するコードオリゴヌクレオチドを識別する。コードオリゴヌクレオチドと特定のサンプルを識別することが既知の特定のオリゴヌクレオチドの組み合わせを含むデータベースとを比較して、このサンプル中のオリゴヌクレオチドの組み合わせと同一のデータベース中の特定のオリゴヌクレオチドの組み合わせに基づいて、このサンプルを識別する。1つの局面において、コードのオリゴヌクレオチドは、コード化サンプルと基材またはアレイとを接触させる前に、増幅される。
【0127】
本発明は、さらに、サンプルコードを識別し得る基材およびアレイを作製する方法を提供する。1つの実施形態において、方法は、基材に添加するために、2つ以上の識別子オリゴヌクレオチドの組み合わせを選択する工程であって、この識別子オリゴヌクレオチドが、各々、対応するコードオリゴヌクレオチドに特異的にハイブリダイズし得る、工程;および2つ以上の識別子オリゴヌクレオチドの組み合わせをこの基材に添加する工程であって、識別子オリゴヌクレオチドの数が、コード化サンプル中に潜在的に存在する全てのオリゴヌクレオチドに特異的にハイブリダイズするのに十分である工程を包含する。代表的に、識別子オリゴヌクレオチドは、特異的ハイブリダイゼーション、従ってコードの識別を確実にするために、コードオリゴヌクレオチド配列に基づいて選択される。
【0128】
種々の局面において、2個と5個の間、5個と10個の間、10個と15個の間、15個と20個の間、20個と25の間、25個と30個の間、30個と50個の間、またはそれ以上の識別子オリゴヌクレオチドが、基材またはアレイに存在する。さらなる局面において、基材またはアレイは、他の情報(例えば、サンプルが由来する病院または診療所のようなサンプルの供給源)を提供するチェックコードまたは別のオリゴヌクレオチドを含む。なおさらなる局面において、識別子オリゴヌクレオチドは、アレイまたは基材上の予め決められた位置(アドレス)に、例えば、列または行のような順序づけられたパターンで配置される。
【0129】
サンプルコードを識別し得る基材およびアレイのアーカイブを作製する方法もまた提供される。1つの実施形態において、方法は、基材に添加するために、2つ以上の識別子オリゴヌクレオチドの組み合わせを選択する工程であって、この識別子オリゴヌクレオチドが、各々、対応するコードオリゴヌクレオチドに特異的にハイブリダイズし得る、工程;2つ以上の識別子オリゴヌクレオチドの組み合わせをこの基材に添加する工程であって、識別子オリゴヌクレオチドの数が、コード化サンプル中に潜在的に存在する全てのオリゴヌクレオチドに特異的にハイブリダイズするのに十分である工程;ならびに保存媒体に基材またはアレイを配置する工程を包含する。
【0130】
生物学的タグ化サンプルを作製すること、および特異性をもって特定のサンプルを識別するために生物学的タグを「読み取る」またはそれ以外で解釈することに関連する上記機能的局面のいくつかまたは全てが、コンピュータまたはマイクロプロセッサ制御下で作動可能な1つ以上の自動化システムによって容易にされ得ることが理解される。これに関して、サンプルに対して生物学的タグを作製するコンピュータ実行方法、ならびに生物学的タグをサンプルに適用するコンピュータ実行方法は、一般的に、図2〜5を特に参照して、以下に記載される機能を可能にするために十分な性能および処理帯域幅を有する処理コンポーネントを利用し得る。このような処理コンポーネントは、一般的に当該分野で公知であるか、または公知の原理に従って開発および作動可能な、コンピュータ、マイクロコンピューターもしくはマイクロコントローラー、プログラマブルロジックコントローラー、1つ以上のフィールドプログラマブルゲートアレイ、または任意の他の個々のハードウェアエレメントもしくは保存および処理操作において有用性を有するエレメントの組み合わせに埋め込まれ得るかまたはこれらを構成し得る。
【0131】
詳細には、用語「処理コンポーネント」は、この文脈において、一般的に、ハードウェア、ファームウエア、ソフトウェア、またはより詳細には、これらのいくつかの組み合わせをいい、適切に構成され、適切にプログラムされ、そして記録媒体にコードされるコンピュータ読み取り可能なインストラクションを実行可能するために作動可能であり、この処理コンポーネントによって、このインストラクションを実行する装置が本明細書中で特に記載されるような生物学的タグコードを作製するか、読み取るか、またはそれ以外で利用する。これに関して、処理コンポーネントは、さらに、種々の型の自動化装置、ロボットシステム、および他のコンピュータ制御可能デバイスに部分的なまたは完全なインストラクションを提供し得、独立した処理コンポーネントまたはこのような装置と関連するかもしくは一体化された電子素子の操作と連絡し、これらからのフィードバックを受容し、そして動的に影響するように作動可能であり得る。
【0132】
これに関して、生物学的タグサンプルを作製するためのデータおよびインストラクションをコードするコンピュータ読み取り可能媒体によって、容易に、このインストラクション実行する装置が、オリゴヌクレオチドの一意的な組み合わせを選択し得、以下に詳細に記載されるサンプルに添加し;オリゴヌクレオチドの一意的な組み合わせに関するデータ記録は、コンピュータまたは処理コンポーネントによってアクセス可能なデータベースまたは他のデータ構造で維持され得、図4および5を特に参照して以下に記載される機能を可能にし得ることが理解される。図1Aおよび1Bを特に参照して上に詳細に記載されるように、オリゴヌクレオチドは、各々が、サンプルに特異的にハイブリダイズし得るように選択され得る。さらに、オリゴヌクレオチドは、各々が、約8〜約5000ヌクレオチドの長さを有し得るように選択され得、各々が、特定の選択された物理的特性または化学的特性を有し得るように選択され得;特に、1つ以上のオリゴヌクレオチドが各々、上記一意的なプライマー対または識別子オリゴヌクレオチドに特異的にハイブリダイズし得る、異なる配列を中に有する。以下にさらに詳細に記載されるように、コンピュータ実行可能なインストラクションセットによって、自動化装置またはロボットデバイスが、オリゴヌクレオチドの一意的な組み合わせをサンプルと接触させ得るか、あるいはサンプルキャリア内の特定のウェルもしくは予め決められたウェル、またはサンプルキャリア上の特定の位置もしくは予め決められた位置と接触させ得る。処理コンポーネントによって選択されるオリゴヌクレオチドの特定の一意的な組み合わせは、サンプルキャリア上の特定の位置と関連し得、これを識別し得、これによって、サンプルキャリア上の生物学的タグ化サンプルまたは生物学的タグ化位置を作製し得る。オリゴヌクレオチドの各一意的な組み合わせと各一意的な生物学的タグ化サンプルまたはサンプルキャリア上の位置とを関連させるデータ記録は、例えば、上記データベースまたは他の適切なデータ構造で維持され得る。
【0133】
さらに、データと、生物学的タグ付きサンプルを識別するための命令とがコード化されたコンピュータ読み取り可能媒体によって、サンプルにおいて2つ以上のオリゴヌクレオチドの存在または不在を検出する命令を装置が実行可能になり得る。本明細書中で企図されるように、そのオリゴヌクレオチドは、一般には、物理的差異または化学的差異に基づいて、識別され得る。従って、自動装置により、そのサンプル中のオリゴヌクレオチドの特定の一意的な組み合わせが識別され得る。この機能は、サンプル分析の分野で一般的に公知である種々の自動検出技術にて実施され得るか、またはそのような自動検出技術を組み込み得る。このコンピュータ読み取り可能媒体は、装置が、そのオリゴヌクレオチドの一意的な組み合わせを、データベースと比較することを引き起こし得、個別の特定のサンプルを識別することおよび他の未知のサンプルを識別することが既知である特定のオリゴヌクレオチドの組み合わせのデータ記録を、そのデータ記録と、その未知のサンプルにおけるオリゴヌクレオチドの一意的な組み合わせとの比較に基づいて、比較する。
【0134】
上記に提供される詳細な説明に従って、データと、生物学的タグ付きサンプルのアーカイブを作製する命令とがコード化されたコンピュータ読み取り可能媒体は、装置が、その命令を実行して、オリゴヌクレオチドの一意的な組み合わせを選択にしてサンプルと結びつけるのを引き起こし得るかまたは可能にし得る。そのオリゴヌクレオチドは、適切にプログラムされた処理要素により自動的に選択され得、そして図1Aおよび図1Bに関して上記に示された構造的考慮事項および化学的考慮事項によって、自動的に選択され得ることが認識される。処理要素の制御下で作動する自動デバイスは、上記オリゴヌクレオチドの一意的な組み合わせを上記サンプルと接触させて、そのオリゴヌクレオチドの一意的な組み合わせがそのサンプルを識別して、生物学的タグ付きサンプルを作製するようにする。同様に、上記処理要素の制御下で作動する自動デバイスまたは半自動デバイスは、上記生物学的タグ付きサンプルを、その生物学的タグ付きサンプルを記憶するための記憶媒体アーカイブ設備中に配置し得、さらに、その記憶媒体および記憶位置をその生物学的タグ付きサンプルに結びつけるデータ記録を作製し得る。
【0135】
図2Aは、ゲル電気泳動を介してサイズに基づいて分画した後に作製されたコードを示し、かつそのコードを読み出すための二者択一的規約を示す、単純化したダイアグラムである。図2Bは、図2Bに示される規約に従って読み出されるバイナリーコードを示す、単純化されたダイアグラムである。具体的には、図2Aにおいて示されるゲルの各レーンは、順々に(すなわち、レーン1の後にレーン2、その後にレーン3というように)、かつ下から上へ(すなわち、図2Aにおいて塩基対のサイズが増加する方向で)読み出され得る。図2Bにおけるバイナリーコードは、上記の様式で上記ゲルが読み出され場合に抽出される、コード化された情報を示す。種々の装置および方法論が、電気泳動ゲルの結果を読み出すために使用され得る。本開示は、そのような電気泳動操作からデータを獲得するために使用される何らかの特定の技術には限定されるべきではないことが意図される。同様に、上記ゲルにおけるデータをコードするため、およびそのデータを読み出すかまたは解釈するために使用される規約は、多数の改変を受けることが可能であり、そのいずれも、本開示の範囲および企図には影響を与えない。
【0136】
本明細書中に記載されるように、サンプルおよびサンプルキャリアを、スポットするため、ローディングするため、生物学的タグを付けるため、または操作するための、種々のシステムおよび方法が、記載される。それに関して、図3Aは、サンプルキャリアの一実施形態を示す単純化されたダイアグラムであり、図3Bは、図3Aのサンプルキャリア上の種々の位置にて維持される1つの生物学的タグに関連付けされた例示的コードを示す単純化されたダイアグラムである。
【0137】
いくつかの実施形態において、サンプルキャリアは、一般には、複数のウェルのプレートにおいて実施され得るか、または複数のウェルのプレートを含み得る。そのプレートは、例えば、図3Aの実行において示されるような、384個の別個のウェルを使用し得る。他のプレート形態(例えば、96ウェルが挙げられる)もまた、一般的に使用され得る。代替的実施形態において、サンプルキャリアは、例えば、バイオチップ、アレイ、または他の基材において実施され得るかもしくはそれらを含み得、そして一般的には、格子または同様な座標系を含み得る。そのような座標系は、例えば、図3Aの実施形態におけるような、ウェルの番号付けされた行および文字付きの列を含むか、または複数のウェルのプレートと組み合わせて使用される他の何らかの座標規約を含み、あるいはアレイに関して、その座標系は、複数のアドレス指定可能な位置を特定もしくは唯一指定することによりサンプルキャリアの組織化およびサンプルの識別を容易にし得、それらの複数のアドレス指定可能な位置の各々は、別個のサンプルを含み得るかまたは別個のサンプルを支持し得る。
【0138】
図3Aのサンプルキャリアは、6つの別個のゾーンへとさらに組織化もしくは再分轄される。ゾーン1は、格子位置A1〜D10にあるウェルを含む。ゾーン2は、格子位置A15〜D24にあるウェルを含む、などのようになる。示される組織は、恣意的なものであり、望ましい場合にはより多くのゾーンもしくはより少ないゾーンを収容するように選択的に変更され得る。すなわち、サンプルキャリア上の任意の数もしくは配置の種々のゾーンまたは別個の領域が、便利な任意の位置にて確立され得る。同様に、試験管のアレイが、または試験管立てさえもが、望まれるかもしくは必要とされるようなゾーンへと、選択的に再分轄または他のように組織化され得る。図3Bにおいて示されるように、1つの生物学的タグコード(例えば、この例においては、図2Aおよび図2Bにおいて考慮される生物学的タグを示す)は、複数回使用され得、そしてゾーン指定コードまたは他の指標が、そのコードに付随している場合には、なお、別個のサンプルの一意的な識別を可能にする。例えば、コードに付随するバイナリー接尾辞「011」は、その生物学的タグがサンプルキャリアのゾーン3に関連付けられているかもしくはゾーン3に位置することの指標として解釈され得、一方、ゾーン4において維持されるかもしくはゾーン4に位置する同じ生物学的タグのコードは、バイナリー接尾辞「100」を含み得る。上記の様式では、図3Aの例示的サンプルキャリアと組み合わせて1つの生物学的タグを6回までの種々の回数使用しつつ、6つの別個のコードを許容もしくは可能にすることが、可能である。
【0139】
図4は、サンプルを識別する際に使用するための生物学的タグを作製する方法の一実施形態の一般的演算を示す、単純化されたフローダイアグラムである。例示的な図4の実施形態に従って、サンプルについての生物学的タグを作製するための方法は、一般的には、ブロック411において示されるような一意的なサンプルについて生物学的タグを作製する要求で始まり得る。ブロック411に企図されるように、オペレーターまたはユーザは、上記に示されるような処理要素にて実行することにより可能になる、ソフトウェアアプリケーション(例えば、Java(登録商標)スクリプト、または商業的ソフトウェアプログラムもしくは私有ソフトウェアプログラムにおいて実施され得るもの)にログインし得る。ログイン手順およびオペレーターによる適切な認証手順(例えば、当該分野で一般的に公知である手順)の際に、オペレーターは、特定の数の生物学的タグを要求し得、そのタグの各々は、一意的なサンプルを識別するために使用され得る。
【0140】
ブロック412において示されるように、(例えば、所定の順序または予め記録された順序で)その次に利用可能な生物学的タグコードが、識別されてバーコード標識プリンターへと送信され得る。10進法フォーマットを使用するいくつかの実施において、コード128バーコートが、使用され得る。いくつかの実施形態において、ブロック412において示される演算は、上記に示されるような処理要素の制御下で自動的に実施され得る。そのような自動的実施において、上記のソフトウェアアプリケーションは、データベースまたは他のデータ構造(例えば、ORACLETMデータベースもしくは他の私有データアーカイブ機構)を照会して、特定の参照システムもしくは生物学的タグ集団において利用可能な次の一意的な生物学的タグを検索する。それに関して、種々の実態または種々のアーカイブシステムが、一般的に1つ以上の生物学的タグを有し得る。しかし、この状況では、そのような一般的コードは、それでも、各々の個別のシステムにおいて一意的であり得る。あるいは、アーカイブもしくは実体識別子のセグメントもしくは順序は、作製された各生物学的タグに付随され得、実体間もしくはアーカイブシステム間で異なる生物学的タグオリゴヌクレオチドのさらに反復される順序もしくは組み合わせを作製することが、認識される。
【0141】
新たに確認された一意的な生物学的タグコードは、その処理要素により発行される適切な命令またはコントロールシグナルに対して応答する従来のバーコードプリンターへと、伝達または連絡され得る。あるいは、オペレーターは、1つ以上のルックアップ表もしくは参照表、スプレッドシートセル、または他のアーカイブ記録を調べて、特定の参照システム中の複数の生物学的タグコードのうちのどれが使用されていないかを確認し得、そして手動でかまたは少なくとも部分的にはオペレーターの介入に従って、その生物学的タグコードをバーコードプリンターへと送信し得る。具体的には、ブロック411および412における演算は、少なくとも部分的には手動でかまたはオペレーターの入力に従って実施され得ることが、認識される。完全に自動化された実施形態において、その処理要素は、すべての演算を制御し得る。さらに、またはあるいは、その処理要素は、例えば、バーコードプリント装置または他の自動デバイス中に存在するかまたはそれらに関連している、独立した処理要素もしくはプログラミング命令セットと組み合わせて作動し得る。
【0142】
ブロック413に示されるように、バーコード標識は、1つ以上の容器に適用され得、その後、それらは、混合装置中にロードされ得る。あるいは、ブロック412および413にて企図されバーコード標識に関して記載されている識別機能は、種々の型の識別方法のうちのいずれかに従って実施され得ることが、認識される。一次元バーコードおよび二次元バーコードは、特に自動光学システムまたは機械的読出し装置と組み合わせて使用された場合に、その点で特定の有用性を有し得る。いくつかの例示的実施形態に従って、何らかの型の識別指標(英数字および他のコードスキームが挙げられる)が、バーコード指標に加えてかまたはバーコード指標の代替物として、使用され得る。
【0143】
ブロック411および412における操作と同様に、ブロック413に例示される機能性(functionallity)は、例えば、処理素子の制御下で、適切に操作される自動もしくはロボット式の装置によって自動的に実施され得るか;あるいは、上記の機能は、操作者によって部分的に、もしくは完全に、手動で実行され得る。特に、操作者は、バーコードラベルを適用して容器を空にし、ラベル付けした容器を、混合装置または生物学的タグ物質もしくは溶液を受容するための他のデバイスに充填し得る。ブロック413に図示される操作に関して、「容器」は、例えば、試験管、マルチウェルプレート(例えば、96、384もしくは任意の他の数の別個のウェルを含むもの)、もしくはアレイ、または他の適切な基材(例えば、一般に公知で、かつ生物学的サンプルおよび非生物学的サンプルの分析技術の分野で採用されるもの)にて具体化され得るが、これらに限定されない。いくつかの実施形態において、処理素子の制御下で、生物学的タグ物質もしくは溶液を容器内に、または容器の媒体上に充填するための自動液体操作デバイスは、Hamilton Companyから現在入手可能なMicrolab Star液体処理装置にて、具体化され得るか、または、この装置を含み得、他の単一および複数のアームの液体処理システムが当該分野で一般に公知であり、本明細書中に示される機能を提供するように、適当に構成およびプログラム化され得る。
【0144】
ブロック414に示されるように、バルクオリゴヌクレオチド(bulk oligonucleotide)は、混合装置内にロードされ得る。ここで、この操作は、操作者によって、例えば、自動もしくはロボット式の処理機構を操作するように適切にプログラムされた処理素子の制御下で、完全にもしくは部分的のいずれかで実行され得る。この点に関して、そして、ある程度自動化されているか、または半自動化された実施形態に従って、各特定のバルクオリゴヌクレオチドは、その容器において固定されたバーコードもしくは他の指標により固有に識別され得、種々の型の機構、光学的デバイスもしくは電気機械的デバイスによって、同一物の正確な識別を可能にする。
【0145】
ブロック415に示されるように、この混合装置は、各バルクオリゴヌクレオチド容器を走査して、(各バルクオリゴヌクレオチドについての)位置情報をミキサー制御ソフトウェアに送信し得る。上記走査操作は、混合装置によって別個に実施され得;さらに、または代替的には、所望の走査手順もしくはパラメータに関するある程度の命令または完全な命令のセットが、上記のような独立した処理素子により送信され得る。同様に、上記の混合制御ソフトウェアは、例えば、混合装置に常駐し得るか、または、動的もしくは選択的に制御され得るか、または、送信された制御信号もしくはコマンドの命令により他に影響を受け得るか、または、このような外部もしくは独立した処理素子から他に通信され得る。ブロック416に示されるように、混合装置は、生物学的タグラベルをさらに走査して、デシマル情報を混合制御ソフトウェアに送信し得る;この状況で、デシマル情報は、一般に、特定の容器(例えば、マルチウェルプレートの特定のウェル)または媒体の座標位置に関連し得るか、またはこれらの指標となり得、この位置に各バルクオリゴヌクレオチドが供給されることが意図される。
【0146】
ブロック417に示されるように、制御ソフトウェアは、次いで、独立してか、または処理素子から受容したデータおよび支持と組み合わせて、デシマル情報および位置情報を、特定のウェル、試験管、容器または容器媒体の位置について特定の生物学的タグを生成するための命令を含むランファイルに翻訳し得る。いくつかの例示的な実施形態に従って、そして、実行されたコンピュータ、実質的に自動化された手順と呼応して、ランファイルは、生成された固有の生物学的タグおよび構成物のオリゴヌクレオチド自体のための所望もしくは特定の位置の両方に関するバイナリーデータで具体化され得るか、またはこのようなバイナリーデータを含み得る。
【0147】
次いで、混合装置は、ブロック418に例示されるように、ランファイル内に記憶された命令を実行し得る。ブロック418に表される手順に従って、選択された数および組み合わせのオリゴヌクレオチドを含む特定かつ固有の生物学的タグが作製され、そして、所定の容器内、または容器の基材もしくは媒体の所定の部分に置かれ得る。ブロック418に置かれたか、または提供された、一般的には、各オリゴヌクレオチド、そして具体的には、オリゴヌクレオチドの特定の組み合わせは、図1Aおよび1Bを特に参照して上に詳細に示されている、化学特性および構造的考察に従って選択され得る。ブロック419に示されるように、新しく作製された生物学的タグ物質を支持もしくは保有する1つ以上の容器は、混合装置から降ろされ、例えば、将来的な用途のために保存され得る;あるいは、この容器は、生物学的タグの作製の後、すぐに、もしくは実質的にすぐに使用され、必要に応じて、もしくは所望されるように、別個のサンプルを受容し得る。固有の生物学的タグの各々の特定の位置(すなわち、例えば、マルチウェルプレートの特定のウェル内、またはアレイ上の特定の座標位置)が、処理素子、混合装置またはその両方により、将来的な参照のために、そしてその位置に保存もしくは保管された特定のサンプルが、生物学的タグと適切に結合して、図1Aおよび1Bを特に参照して上に示されるように、後に実質的に道程され得ることを保証するために、記録され得ることが理解される。
【0148】
図5は、サンプルキャリアに生物学的タグを適用する方法の1つの実施形態の一般的な操作を例示する、単純化したフローチャートである。図4の方法と同様に、図5に図示される機能的ブロックの各々に図示される操作は、コンピュータ、または適切なデータおよび命令により符号化され、自動化もしくはロボット式のデバイスと組み合わせて作動する他の処理素子によって実行されるか、制御されるか、または容易にされ得る。
【0149】
ブロック511に示されるように、調製された容器(この中に生物学的タグ物質が維持される)または複数のこのような容器が、必要に応じて、または所望されるように、選択的に回収され得る。半自動の実施形態において、操作者は、例えば、1つ以上の事前混合生物学的タグのマルチウェルプレートまたは試験管を、在庫から回収し得る;あるいは、回収は、完全に自動化され得、処理素子からの制御信号または命令信号に対して反応するように実効され得る。1つ以上の回収生物学的タグ容器は、適切な装置またはデバイス(スポッティングロボット、または他の適切なプログラム化されたか、もしくは動的に制御可能な液体処理機器)内に搭載され得る。上に示されるように、種々の代替物が存在するか、または開発され得るが、現在Hamilton Companyにより製造、販売されているMicrolab Star液体処理装置は、いくつかの適用において特有の有用性を有し得る。
【0150】
ブロック512に示されるように、特定の生物学的タグは、(例えば、マルチウェルプレートの特定のウェル、またはラックもしくは他のアレイにおける特定の試験管に従って)識別され得、そして、付属するデータは、さらなる使用のために記録され得る;さらに、または代替的には、データは、制御ソフトウェアまたは、処理素子において実行される他のプログラミングスクリプトに伝達され得る。いくつかの実施形態に従って、スポッティングロボットまたは他の自動液体処理装置は、生物学的タグ容器上のラベルまたは他の識別指標を走査して、その識別を容易にし得る;図4を参照して、上に示されるように、このような指標は、従来の一次元もしくは二次元バーコードで具体化され得るか、またはこのようなバーコードを含み得るが、他の識別ストラテジーが採用され得る。いくつかの完全に自動化された実行において、種々の光学バーコードリーダー、または現在利用可能な機器リーディング装置が、このような識別手順に適切であり得る。
【0151】
ブロック513に示されるように、処理素子において(またはその制御下において)実行される制御ソフトウェアアプリケーションまたはコンピュータ読取り可能な命令セットは、例えば、データ記録を作製するか、記憶媒体に維持されるデータ構造内(例えば、データベース)のデータフィールドをアップデートし得る。作製もしくはアップデータされたデータ記録は、特に、使用されることが意図される固有の生物学的タグに関連し得、従って、データ構造に記憶される場合に、それに付属し得る。具体的には、処理素子は、1つ以上のデータ記録を記憶またはアップデートして、(ブロック512において)識別された特定の生物学的タグが引き続く操作においてスポッティングされる(すなわち、特定のサンプルスポッティング媒体と結合、接触、付着または他に組み合わせて使用される)という事実を表し得る。
【0152】
上に示されるようなデータを保存することに加え、そして、ブロック513においてさらに示されるように、処理素子は、生物学的タグオリゴヌクレオチドの組み合わせが、以前に使用されていないことを保証するために有効な命令を実行し得る;この決定に従って、特定の参照システムまたは検討中の生物学的タグコード集団(ユニバース)についてのデータ記録は、識別された生物学的タグに関する情報およびその付随するオリゴヌクレオチドの組み合わせについて検索または問い合わせされ得る。識別された生物学的タグが、参照システムまたは生物学的タグ集団においてすでに使用されている場合、エラーメッセージが手順を停止し得、そして、処理素子が、例えば、処理前に、操作者に入力を求め得る;あるいは、異なるもしくは代替的な生物学的タグが、高機能の処理実施形態において、処理素子により動的に割り当てられ得る。
【0153】
生物学的タグが以前に使用されていなかったことを確認する際に、データは、例えば、ラベルプリンター(ブロック514)に送信されるか、または、システムの要件および所望される識別プロトコールに依存して、別の選択されたデバイスに送信され得る。ブロック514に示さる操作に従って、ラベルは、一次元もしくは二次元のバーコード、またはサンプルキャリア内またはサンプルキャリア上の複数の生物学的タグの各々のそれぞれの意図される位置(例えば、マルチウェルプレートまたは他の容器、アレイ、もしくは基材)を特定する他の識別指標で具体化され得るか、またはこれらを含み得、引き続く操作において調製される。特に、ラベルは、識別され(ブロック512)、使用のために利用可能と確認された(ブロック513)生物学的タグの各々に付随するコード化されたデータを含むかまたは組み込み得、マルチウェルプレートの特定かつ固有のウェルが、例えば、特定かつ固有の生物学的タグオリゴヌクレオチドの組み合わせでスポッティングされる;あるいは、コード化されたデータは、アレイもしくは他の基材上の特定の座標位置と各生物学的タグとを関連付け得る。
【0154】
ブロック515に示されるように、上に示されるように作製されたラベルは、手動または自動で、例えば、処理素子の制御下のロボット式装置により、サンプルキャリア(すなわち、マルチウェルプレート、アレイまたは他の基材)に適用され得る。1つの例示的な実施形態において、サンプルキャリアは、各ウェルにFTAフィルタ要素を備える384ウェルプレートを含み得る。異なる型のプレート(例えば、異なる数のウェルを備える)がまた使用され得、異なる型のサンプル支持媒体が、FTAフィルタ要素に加えて、またはその代わりに採用され得ることが容易に理解される。以下の説明は、明瞭にするために、マルチウェルプレートを扱うが、サンプルキャリアがまた、図3Aを参照して上記されたように、アレイ、またはその上に配置されたか、もしくはそれと一体型になった、固有のアドレス可能な位置を有する他の基材で具体化され得るか、またはこれらを含み得る。
【0155】
プレートにおける各ウェル(スポットされていない未使用のフィルタ要素のみを含む)は、上記のような各それぞれのウェルをそれぞれの一意的な生物学的タグオリゴヌクレオチドの組み合わせに結びつけるラベルの適用の前には一意的ではなかったかもしれないことが理解される。このような実施形態に従って、それぞれの生物学的タグは、マルチウェルプレートにおける各それぞれの(そうでなければ未使用の)ウェルに関連付けられ得る;特定のウェルに引き続いて添加されるサンプルは、同様にそのサンプルを含むウェルに関連付けられる生物学的タグに従って、識別され得る。マルチウェルプレートの各ウェルがすでに異なるサンプルを含む、いくつかの別の実施形態において、生物学的タグは、サンプル、およびウェルプレート上のウェルの特定の位置に関連付けられ得る。
【0156】
上記のことに従って、それぞれの生物学的タグ溶液または化合物を含む(すなわち、一意的なオリゴヌクレオチドの組み合わせを含む)アリコート(例えば、5μLの体積)が、各それぞれのウェル内に含まれるフィルタ要素、基質材料、または他のサンプル支持媒体に、あるいは所定のサンプルキャリア上の各それぞれの位置に適用され得る。この適用(ブロック516に示される)は、処理構成要素の制御下で、任意の適切な液体処理装置によって実施され得る。サンプル支持媒体が、生物学的タグ溶液または化合物の適用の前に、サンプル材料と接触しない場合、サンプルキャリア上の各特定の位置がコードされ(すなわち、識別生物学的タグに関連付けられ)、そして別個のサンプルの受容の準備ができる。上記のように、サンプルキャリアが識別可能な位置に別個のサンプルをすでに含む場合、各それぞれのサンプルに関連するデータは、各それぞれのウェルに送達される生物学的タグにさらに関連付けられ得る。
【0157】
ブロック517に示されるように、スポッティングされたサンプルキャリアは、液体処理器から取り外され得、システムの要件または他の処理プロトコルに従って、汚染物を防止するために密封され得、そして例えば、在庫のため、または貯蔵の容易さを達成するために送達され得る。本明細書中で意図されるように、ブロック517に示される操作は、上記のもののような処理構成要素の制御下で、自動化処理装置またはロボットデバイスによって、全体的にかまたは部分的に実施され得るか、または容易にされ得る。さらに、または代替的に、スポットされたサンプルキャリア(適切に密封されている)は、さらなる操作のために、第三者に輸送され得る。
【0158】
図4および図5に示される関数ブロックの特定の配置および組織化は、他の可能性の排除のための操作の特定の順番も順序も示唆することを意図されない。例えば、ブロック511およびブロック512に示される操作は、逆にされても良く、または実質的に同時に実施されても良い;同様に、ブロック413およびブロック414に示される操作、ならびにブロック515およびブロック516に示される操作は、逆にされても、実質的に同時に実施されてもよい。いくつかの実施形態において、図4と図5との両方からのいくつかの操作は、所望のシステム機能性に従って、選択的に組み合わせられても省略されても良い;例えば、ブロック418およびブロック516に示される操作は、生物学的タグ溶液または化合物の選択された構成要素が、上記のようなサンプルキャリアの選択された部分に直接提供され得るように、組み合わせられ得る。当業者は、操作の特定の順序が、例えば、無数の要因(処理構成要素の容量および処理大域幅;処理構成要素において実行されるプログラミング命令の成功さおよび融通性;処理構成要素およびシステムソフトウェアによって制御されるかまたは影響を受ける、液体処理装置および他の自動化設備の、容量および制限;オリゴヌクレオチドの組み合わせの特異的化学;所望のスループット速度;ならびに他の問題が挙げられるが、これらに限定されない)に依存して、種々の改変の影響を受けやすくあり得ることを理解する。
【0159】
さらに、上記いくつかの例示的な実施形態に従って、識別子オリゴヌクレオチドは、生物学的タグのコードおよびサンプルの識別を容易にするために、使用され得る。各識別子オリゴヌクレオチドが、例えば、基材上の所定または他の既知の位置または場所(例えば
、アレイ)に固定される場合、サンプルを識別するコンピュータにより実行される方法は、特定のハイブリダイゼーションを検出するため、または他に、基質を分析するために使用される、種々の技術と組み合わせて、特定の用途を有し得る。例えば、アレイ上の識別子オリゴヌクレオチドは、どのコードオリゴヌクレオチドが、他の公知の生物学的タグ化サンプル中に存在するかを確認するために、ハイブリダイゼーションの結果が容易に使用され得るようなパターンまたは構成を有し得る。
【0160】
具体的には、一意的な組み合わせのオリゴヌクレオチドでコードされたサンプルは、特定の位置に、所定の構成または配置でこのような識別子オリゴヌクレオチドを含む基材(すなわち、アレイ)と接触され得る。コードサンプルとの接触に続いて、サンプル中に存在するその相補的コードオリゴヌクレオチドに特異的にハイブリダイズする識別子オリゴヌクレオチドが、特定の識別子オリゴヌクレオチドに対応することが既知である特定の位置で、検出され得る。上記の様式で、生物学的タグ化されたサンプルに対するコードは、どのオリゴヌクレオチドが存在し(すなわち、相補的な識別子オリゴヌクレオチドとハイブリダイズするオリゴヌクレオチド)、そしてどのオリゴヌクレオチドは存在しないか(すなわち、相補的な識別子オリゴヌクレオチドとハイブリダイズしないオリゴヌクレオチド)に基づいて、識別または「デコード」され得る。自動化装置またはコンピュータにより制御される装置は、基質からのデータを読み取るか、またはデータを獲得するために使用されえ、その結果、生物学的タグ化されたサンプルが、上記のように識別され得る。
【0161】
従って、生物学的タグ化されたサンプルを識別する、コンピュータにより実行される方法は、一般に、以下を包含し得る:コードオリゴヌクレオチドと、基材上(例えば、アレイまたはバイオチップ)の所定の位置に維持されたそれぞれの識別子オリゴヌクレオチドとの間の、特異的ハイブリダイゼーションを検出する工程;この検出に従って、生物学的タグ化されたサンプルに存在する1つ以上のコードオリゴヌクレオチドを識別する工程;この生物学的タグ化されたサンプル中に存在するコードオリゴヌクレオチドを、一意的なオリゴヌクレオチドの組み合わせを一意的なサンプルに結びつけるデータ記録と比較する工程;ならびにこの比較の原因である生物学的タグ化されたサンプルを識別する工程。いくつかの実施形態において、検出する工程は、2つ以上の識別子オリゴヌクレオチドが基材上の所定の位置に固定されている基材上で、ハイブリダイゼーションを分析する工程を包含し、ここで、これらの識別子オリゴヌクレオチドの各々は、他の全ての識別子オリゴヌクレオチドに存在する配列とは異なる配列を有し、そしてこれらの識別子オリゴヌクレオチドは、そのサンプル中に潜在的に存在する全てのコードオリゴヌクレオチドに特異的にハイブリダイズするために十分な数である。上で詳細に記載されたように、このような適用において用途を有する基材は、この基材上の所定の位置に固定された複数の核酸サンプルを備え得、これらの核酸サンプルは、ハイブリダイゼーションがコード識別を防止する程度には、コードオリゴヌクレオチドに特異的にハイブリダイズしない。
【0162】
別段規定されない限り、本明細書中で用いられる全ての専門用語および化学用語は、この発明に属する当業者に一般的に理解されるのと同じ意味を有する。方法および材料は、現在の発明を実行するもしくは試験する上で用いる、ここで記載されるものと、類似もしくは同じであるけれども、適した方法および材料が、ここで記載される。
【0163】
ここで引用されたすべての刊行物、特許および他の参考文献は、それらの全体が援用される。矛盾する場合、定義を含む本願明細書が優先する。
【0164】
本明細書中で用いられる単数形「a」および「an」および「the」は、文脈が明らかに他を示さない限り、複数形記号を含む。さらに、例えば、「オリゴヌクレオチドもしくはプライマーもしくはサンプル」への言及は、複数のこのようなオリゴヌクレオチド、プライマー、およびサンプル含む。そして、「オリゴヌクレオチドセット」もしくは「プライマーセット」は、一つ以上のオリゴヌクレオチドもしくはプライマーセットなどへの言及を含む。
【0165】
ここで説明する本発明は、肯定的な言語で記載される。それゆえに、本発明は、概して、本発明が含まないことに関しては、本明細書中に明示的に記載されていなとしても、本発明にはっきりとは含まれない局面は、それにもかかわらず、本質的にここで開示される。
【0166】
本発明の多くの実施形態は記載されてきた。それにもかかわらず、種々の改変は、本発明の精神および範囲を逸脱することなしに作り得ることが理解される。従って、次の例は、特許請求の範囲に記載される本発明の範囲を制限せず記載することを目的としている。
【実施例】
【0167】
(実施例1)
この実施例は、シングルセットで50塩基、75塩基、および100塩基のオリゴヌクレオチドを用いた例示的なコードを、説明している。
【0168】
そのコードおよび対応するプライマーを含むオリゴヌクレオチドは、非ヒト性遺伝子である、Arabidopsis thalianaリコピンベータシクラーゼ(登録番号U50739)をGenbankから選択し、Primer3プログラム:(http://www−genome.wi.mit.edu/cgi−bin/primer/primer3_www.cgi)のデフォルト設定を使用することによって設計をした。上記プライマーを一反応中で同時に用いるため、Primer3の出力結果から、類似した融解温度を有するプライマーペアを選択した。上記選択した配列が報告されたヒトの遺伝子およびヒトのEST配列に対して有意な一致を有さないように、Blast(http://www.nci.nlm.nih.gov/BLAST/)を用いて、Genbankの配列において冗長でないデータベース(nr)と比較し、確認した。
【0169】
【化6】

【0170】
上記オリゴヌクレオチド群は、溶液の媒体に適用した。各々の濃度が0.1μMの濃度のオリゴヌクレオチドの組合せとなるよう溶液を作製し、それから、3マイクロリットルの上記溶液を上記媒体(FTAもしくはIso−Code)に次いで適用し、そして、室温または室温の乾燥機中のいずれかで、乾かしておく。
【0171】
【化7】

【0172】
【化8】

【0173】
【化9】

【0174】
(実施例2)
この実施例は、二つのセット(セット#2およびセット#3)うちの、50塩基のオリゴヌクレオチド、60塩基のオリゴヌクレオチド、70塩基のオリゴヌクレオチド、80塩基のオリゴヌクレオチド、90塩基のオリゴヌクレオチド、および100塩基のオリゴヌクレオチドを用いた、例示的なコードを説明している。
【0175】
【化10】

【0176】
【化11】

【0177】
【化12】

【0178】
(データはセット2およびセット3により作製)
10塩基で分離されたプライマー群のセットの各々とともに、6%ポリアクリルアミドゲルが使用された(Invitrogen,Carlsbad)。PCR反応条件およびオリゴヌクレオチドの量は、上記されている。対応するPCRプライマーの濃度は、反応ごとに0.1μMから0.005μMまで希釈した。
【0179】
【化13】

【0180】
【化14】

【0181】
(生物学的タグの存在によるPCRの増進)
血液の付加より前のマトリックスへのオリゴヌクレオチドの付加は、PCR産物の量を増やす。オリゴヌクレオチドコードは、マトリックスに利用され、そして、血液の付加より前に完全に乾燥させる。
【0182】
【化15】

【0183】
(実施例3)
この実施例は、本発明の確実な実施形態において、一意的な固有特性を説明している。
【0184】
本発明中の固有特性とは、偽造の困難さである。この偽造とは、偽造者がコードを識別し得、これにより、そのコードを複製することである。オリゴヌクレオチド群の複数の(例えば、二つ以上)セットを用いる場合であって、ここで、その2つのセットに由来する少なくとも1つのオリゴヌクレオチドが同一の長さを有する場合、このオリゴヌクレオチドに特異的にハイブリダイズするプライマーを知ることなしにそのコードによって生成された特異的なバンドパターンを複製することは不可能である。例えば、オリゴヌクレオチドの増幅なしにゲル上の生物学的タグを視覚化するのに必須の、感度および分析を提供し得る技術的な方法は存在するものの、上記コードにおいて同じ長さを有する少なくとも二つのオリゴヌクレオチドが存在し、一次元上ではサイズを区別でき得ないために、このデータは、役に立たないデータになり得る。さらに、クローニングおよび配列決定を行うために、ランダムプライマーを用いたPCRであれば、上記コードを含んだオリゴヌクレオチドの配列を試み得るものの、これは、単に、その特有の混合物中に存在する最大のオリゴヌクレオチドまでのラダーを生成するものであって、正確なコードパターンを生成するものではない。そのコードを含むオリゴヌクレオチドが一本鎖である場合、一本鎖の配列をベクターにクローニングしてそのコードを含むオリゴヌクレオチドの組合せを解き、そして、複製する実際的な方法は存在しない。従って、計算能力を進歩させることで結果的には複製されてしまうような、コンピュータに基づく符号化(コード化)、電子認証マーカー、または電子「透かし」とは対照的に、本コードは、簡単に識別同定されず、それゆえに、それらのプライマーの配列を知ることなしには、複製することはできない。
【0185】
(実施例4)
この実施例は、生物学的タグに対して種々の非制限で特異的な用途について記載している。
【0186】
法医学的証拠の関連性の保全(Forensic Chain of Evidence Assurance):法医学的サンプル(例えば、血液および体液もしくは組織)は、紙、または、FTA(Whatman)またはIsoCode(Schleicher and Schuell)のような表面加工紙に基づく証拠収集キットを用いて、犯罪現場もしくは容疑者から収集する。バーコード化されたカードを、このカードに、日付、時間、場所、収集者、および関連情報を記載し残すために用いる。この収集カード上のサンプル(例えば、核酸)の解析が求められた場合、上記法医学的サンプルの収集カード上の一部分、例えば、サンプルが収集された場所を示す部分に、1mmもしくは2mmのパンチがあけられる。上記核酸は、Promegaおよび他の市販元より提供されている、市販のヒト身元確認キットを用いた後に、識別される。これらのキットは、細胞片を洗う緩衝液、および、ヒト身元確認をするための次に続くPCRに用いる精製した核酸の蛋白質を提供する。
【0187】
ヒトゲノムと共通な配列を有さないよう選んだ、一連の25の異なるオリゴヌクレオチドを、例示的な図(図1および図2)に説明されている生物学的バーコードのような一意的な生物学的バーコードを生成するために使用する。この一意的なバーコードは、合計5ng/cmで提供される集中セットにあり、このバーコードは、上記収集カードに添加され、および乾かされる。上記法医学的サンプルが分析された際、例えば、存在するDNAに基づくヒトの身元確認がされる場合、五つのさらなるPCR反応液が、上記生物学的バーコードの作製を含む。このPCR反応液がゲル電気泳動により分離された際、上記さらなる五つのレーンは、バーコードとして見えてくる。ここで、このバーコードは、上記ヒト身元確認情報に、および、上記の元の収集カードに直接関連付けられる。この方法は、サンプルの遺伝子工学的材料の分析に用いるコードと同じコードを生成する方法であるために、有利である。したがって、上記収集カードの情報の一意的なIDに直接リンクする上記コードは、サンプル収集に用いられる。研究所の技術者によって最初に間違えて識別されて上記カードにパンチされ得るとしても、パンチされた部分のバーコードが作製されるとすぐに、すべてのあいまいさは取り除かれる。さらなる特徴は、以下のとおりである。上記核酸サンプルおよび上記バーコードの両方を含むゲルの、綿密な走査またはデジタル画像は、個々の身元確認情報だけでなく、証拠に対して直接関連付けられて、上記法医学的サンプルが収集された場所を管理する確固たる関連性を保証する。
【0188】
価値の高い文書:通商文書、契約書、株券、貨幣などのような紙の文書は、一意的なオリゴヌクレオチドの組合せが提供するバーコードを、その文書および有効な複写にはめ込むことによって、本物であると証明を保証でき得る。もし上記文書の妥当性が疑わしい場合、その文書のサンプルはとりだされ、そして、コードが、例えば、PCRによる増幅および次のゲル電気泳動を通して展開される。もし上記バーコードが、存在しなかったり、期待されるコードと一致しなかったりした場合、この物品は偽造されたものである。同様に、任の貴重な物品に紙または編物の小切片を付着させることによって、その物品の認証を確実にし得る。
【0189】
さらに、二進数(存在している、または存在していない)のコードで、25のオリゴヌクレオチドに特異的にハイブリダイズする25のプライマーペアの使用することは、3400万を超す異なる文書の一意的な識別に用いられ得る。30のオリゴヌクレオチド、および、五つのプライマーペアの各々の六つのレーンを用いることにより、このシステムは、10億を超す異なる文書の一意的に識別に用いられ得る。コード材料が文書上の明確な位置に配置されている場合、例えば、文書上のレターヘッドの一部分、または、印刷情報の明示した一部分に配置されている場合、文書ごとの費用は、2セント、3セント以下となり得る。蝋もしくは他の封(有機的なもしくは無機的な)もまた、起こりうる損失もしくは分解から保護するため、コード材料に配置され得る。
【0190】
サンプルの保存またはアーカイブ保管:自動サンプル記憶装置(例えば、アーカイブ)において、研究用アセンブリは、このアーカイブからの複数のサンプルの選択すること、そして、これらを派生したプレートにアセンブリすること(概して、研究所のマイクロプレートは100ウェル〜1000ウェルからなり、ウェルの各々は、別個のサンプルを含み得る)からなる。この種類の臨床サンプルは、概して、各々が約100ドルであり、そのため、サンプルアセンブリにおける間違い、または、サンプルの検索中もしくはサンプルの検索後の災難によって、サンプルが無秩序な状態になり、極度に費用がかかり得る。このような危険のいくらかは、慎重な包装および工程設計(例えば、サンプルの保存、検索、および追跡)によって回避し得るといえども、上記サンプルがアーカイブに挿入され、その結果、このサンプルは他のサンプルと区別され得、そして、サンプルの元の供給源を戻って追跡するような場合には、各々のサンプルのコードは、さらなる保護を提供する。
【0191】
上記サンプル記憶装置に入るすべてのサンプルをコードし得る。けれども、すべてのサンプルをコードする必要はない。例えば、サンプル群は、上記記憶装置からの検索に基づいてコードされ得る。この場合、少数のコードのみが必要とされるので、より経済的であり、そして、アーカイブに入れるすべてのサンプル対してよりもむしろ、アーカイブに残すこれらのサンプルに対してのみ、コード化費用は、負われる。いずれにしても、上記オリゴヌクレオチドコードは、すべてのサンプルに対して、添加され得るまたは混合され得る。ここで、このサンプルとは、上記記憶装置に導入されたサンプル、または、この記憶装置に残すサンプルである。
【0192】
(実施例5)
本実施例は、サンプルに存在するコードの生成に用いる識別子オリゴヌクレオチドを含むマイクロアレイの、例示的なアプリケーションを記載している。
【0193】
(Illumina遺伝子発現プロファイリング)
コードを有するサンプルは、一部分のアレイが識別子オリゴヌクレオチドを有する、アレイに適用される。この識別子オリゴヌクレオチドは、このコードのすべてのオリゴヌクレオチドに対しての特異的なハイブリダイズに用いられ得る。例として、Illuminaアレイは、識別子オリゴヌクレオチドとともに、アレイの一列または一行の一部分を有し得る。この識別子オリゴヌクレオチド各々は、所定の位置にあり、サンプルコードを作製するためのものである。また、あるいは、上記ゲル電気泳動走査と同じような画像(2次元バーコード、図1参照)を提示するための5×6区分(30の識別子オリゴヌクレオチド)にセットされ得る。上記Illuminaシステムは、50マーに基づいており、この識別子オリゴヌクレオチドは、上記アレイを容易に含み得る。
【0194】
Illumina Sentrix(登録商標)Arrayマトリックスは、96のアレイクラスタを有する。各々の、複数サンプルのプラットフォーム内の各アレイクラスタは、遺伝子ごとに50マーのプローブとともに、700を超える遺伝子の問い合わせが可能である。このアレイマトリックスは、コードのオリゴヌクレオチドを含む特異的なDNA配列を識別する、顧客による仕様のオリゴヌクレオチドとともに、調製され得る。50ngを超えるDNAサンプルは、特異的なハイブリダイゼーションを検出するため、アレイに直接に適用され得る。このハイブリダイゼーションとは、サンプルDNAとアレイのオリゴヌクレオチドとのハイブリダゼーション、および、コードオリゴヌクレオチドと識別子オリゴヌクレオチドとのハイブリダイゼーションである。コードオリゴヌクレオチドに対する正のハイブリダイゼーションシグナルが存在する場合は、1で表現し、その応答がない場合は、0で表現するので、そのコード、それゆえに、そのサンプルを識別する二進数による数が提供される。サンプルが、Gen Vaultプレートのサンプルであった場合、二進数による数は、プレートの種類、プレート番号、および、十分な読み取りを確認するためのチェックコードも表示する。
【0195】
より具体的には、適切な供給源に由来する生物学的タグを含む核酸のサンプル(例えば、GenVault DNAストレージプレート)は、純粋なdsDNAとして溶出される。
サンプルの濃縮のような調製の後において、代表的には、溶出されたDNAの量は、50ng以下である。このDNAは、その後、高次複合型のPCRプロセスを用いて増幅され、この複合型PCRは、ハイブリダイゼーションおよび検出に用いるための十分量の核酸を提供する。その複合型PCRは、コードオリゴヌクレオチド群、ならびに他の目的のDNA配列に対して、特異的にハイブリダイズするプライマーペアを含んでいる。PCRの後で、核酸およびコードオリゴヌクレオチドの、増幅されたサンプルの混合液は、過剰なプライマーを除くよう、清浄化され、そして、必要に応じて、アレイのハイブリダイゼーションに適切な緩衝液を提供する。この増幅された混合液は、特異的なハイブリダイゼーションを可能にする条件下において、アレイに接触される。アレイの作製において、オリゴヌクレオチドの一意的な組合せによるサンプルの識別、および、目的の標的配列の存在または非存在、の両方は、すぐに明白になる。生成されたアレイのデジタル記録、および、このアレイ上にあるサンプルの識別のデジタル記録は、サンプルの同一性とサンプルのアレイデータとの間の直接的な関連付けを提供する。
【0196】
上述のように、生物学的タグは、概して、サンプルの同一性、供給源、患者のデータなどに関しての情報に結び付け得る。サンプル自体の中の生物学的タグを含むことによって(例えば、サンプル材料とともに、オリゴヌクレオチドの一意的な組合せが共通に配置されていることによって)、「読み取り」工程時、および、アレイデータの記録の再確認の後より前ならば、サンプル内の識別の確認は可能である。さらに、容器のバーコードもしくは特徴(例えば、複数のウェルプレートのような一意的なサンプルキャリアと付けられたもの)を、コンピュータもしくは他の処理に用いる部品の中へ読み取ることと同じように、および、生物学的タグと容器もしくはサンプルキャリアコードとを結びつけることと同じように、サンプルに結びついた生物学的タグコードを読み取ることによって、サンプル同一性、患者データ、および、所望の他のどの情報の間の変更不能な関連付けによって、そのサンプルと、一意的なコードを有する容器またはサンプルキャリアを関連付けるデータを介して、特定のサンプルのいずれをも追跡可能にされ得る。いくつかの実施形態において、上記に述べられたような容器コードは、サンプルに結ぶつく二進数の生物学的タグコードの十進数版を表し得、そして、この容器コードは、生物学的タグサンプルと、跡をたどるためもしくは追跡のために一意的なサンプルキャリアもしくはその位置とを結びつけるリンクとして、用いられ得る。具体的には、容器情報および他のデータは、ラベルを含んだバーコード、または、おおむね上記記載の他の特徴の中に、コードされ得;このようなラベルは、サンプルキャリアに添付され得、そしてまた、以下のさらなる情報を含み得る。例えば、サンプルキャリア種類の同一性、残されているサンプルの数などである。このようなデータは、検索を行う、ないしはさもなければ、サンプルキャリアの扱う、そして、そこから引き出されたもしくは除かれたサンプル材料を取り扱う、ソフトウェアもしくは自動化された装置によって、利用され得る。
【0197】
さらに、チェックコードによって、一意的なサンプルの生物学的タグコードの読み取りが十分であることの確認を、容易に実行し得る。例えば、このコードは、コードのオリゴヌクレオチド識別子のための、Illuminaアレイの一部分が用いられることによって、作製され得る。ここで、このコードは、患者Bの核酸として作製され得るコードとは異なる、患者Aの核酸として作製され得るコードなどといったような、コードである。上述の方法において、確認は、読み取りの正しさで構成され得る。その点において、もし、生物学的タグコード読み取りが、患者Aのサンプルであることを示すものの、チェックコードはそうでないと示す場合は、読み取りにおけるエラーは、このような矛盾の原因となり得る。あるいは、チェックコードおよび生物学的タグコードが一致する場合に、正確な読み取りが、確認され得る。このような状況にあるチェックコードは、セットオリゴヌクレオチド(例えば、5オリゴヌクレオチド)に組み入れられるかまたはそのオリゴヌクレオチドを含み得る。そのセットオリゴヌクレオチドの存在または非存在は、その生物学的タグを構成する他のオリゴヌクレオチドの関数である。いくつかの実施形態において、上記生物学的タグコードおよび上記チェックコードは、結合され得るか、または、そうでなければ、特定のサンプルの一意的な識別子としての役割を果たすように組み込まれえる。
【0198】
例示としてであって、限定としてではなく、5ビットCRC(サイクル重複確認)アルゴリズムが、チェックコードを決定するために実装され得る;このCRCは、当該分野において一般に公知であり、そして、二進数データの伝達(例えば、電子データの伝達)のためのチェックコードアプリケーションにおいて、有用性を有する。5ビットCRCは、コードの解読において、偽陰性もしくは偽陰性を簡単に識別し得る。そして、5ビットCRCは、管理できないデータの読み込み中の、レーン交換もしくはエラーを識別するのに十分である;これは、図2Aに示されているような5ビットレーン群を含む構成である場合、適切となり得る。あるいは、よりCRCを強めた処理装置は、一般に知られている原則どおりに、そして、ハードウェア設定および所望のシステム性能を有するシステムにどおりに、実行され得る。
【0199】
個人用コードは、与えられたサンプル識別するため、よりさらなる特殊性もしくは粒度とともに、使用され得る。例えば、個人用コードまたは組織用コードは、種々の他の適したアルゴリズムのどれも、または、使用に特定の設定が望まれる識別子に具体化され得るか、または、これらを含み得る;ある実施形態において、このような個人用コードは、上記に述べられたCRCチェックコードの付加に用いられ得るか、または、このコードの代わりに用いられ得る。上述の方法において、病院、診療所、研究および他の研究所、または、他の存在物のどれもが、特定の設定に一意的な「個人用コード」のフィールドを、用い得る。これは、サンプル識別精度の内部での確認および「予想外」のサンプルの確認として機能し得る。
【0200】
(Affymetrix GeneChip(登録商標)アレイ)
GeneChip(登録商標)アレイは、非常に高い濃度で、何百、何千ものオリゴヌクレオチドのプローブを含む。このプローブ群は、特異的なシグナルとバックグラウンドのシグナルとを区別させ、そして、密接に関連する標的配列群も区別させる。GeneChip(登録商標)アレイは、ここで、このアレイは、DNAおよびmRNAの分析に広い範囲で用いられてきたものであり、サンプル中に存在するコードを識別するための発明どおりの識別子オリゴヌクレオチドを含み得る。
【0201】
精製した二本鎖DNAのサンプルは、改変されたAffymetrixプロトコルを通して作製された、オリゴヌクレオチドの配列コードを含み、そして、GeneChip(登録商標)に適用される。必要に応じて、ビオチン化核酸を用いたサンプルのPCRは、DNA量、または、サンプル中に存在するコードオリゴヌクレオチドの量を増加させ得る。Illuminaサンプルにおいて、コード化されたサンプルは、GeneChip(登録商標)に適用される。サンプル中のコードオリゴヌクレオチドの非存在または存在は、GeneChip(登録商標)上の特定の位置の検出可能なシグナルの非存在または存在によって、決定される。ここで、このGeneChip(登録商標)は、コードオリゴヌクレオチドに特異的にハイブリダイズする識別子オリゴヌクレオチドを有する。連立の慣例的な核酸のハイブリダイゼーションは、サンプルとGeneChip(登録商標)アレイのオリゴヌクレオチドプローブとの間のハイブリダイゼーションであり、このGeneChip(登録商標)アレイは、選択されたSNPが存在するか検出するか、または、二本鎖DNAサンプルうちでヘテロな配列が変化を検出する
【図面の簡単な説明】
【0202】
【図1】図1Aおよび図1Bは代表的なコードを例証している。以下のコードは、長さに基づく増幅されたオリゴヌクレオチドの分別法により生成されたコードである。A)534523151、または二進数形態で、10100 01000 10010 00101 10001。レーンに関しては、以下のとおりである:レーン1、五つのオリゴヌクレオチドのラダーであり、それらの長さは、60ヌクレオチド、70ヌクレオチド、80ヌクレオチド、90ヌクレオチド、および、100ヌクレオチドであり;レーン2、プライマーセット#1によって増幅されたオリゴヌクレオチド;レーン3、プライマーセット#2によって増幅されたオリゴヌクレオチド;レーン4、プライマーセット#3によって増幅されたオリゴヌクレオチド;レーン5、プライマーセット#4によって増幅されたオリゴヌクレオチド;レーン6、プライマーセット#5によって増幅されたオリゴヌクレオチドである。セット1〜5は、上記五つのオリゴヌクレオチドセットの各々に対しての、多くの要素からなるプライマーセットである。図1Aおよび図1Bは代表的なコードを例証している。以下のコードは、長さに基づく増幅されたオリゴヌクレオチドの分別法により生成されたコードである。B)530523151、または二進数形態で、10100 00000 10010 00101 10001。レーンに関しては、以下のとおりである:レーン1、五つのオリゴヌクレオチドのラダーであり、それらの長さは、60ヌクレオチド、70ヌクレオチド、80ヌクレオチド、90ヌクレオチド、および、100ヌクレオチドであり;レーン2、プライマーセット#1によって増幅されたオリゴヌクレオチド;レーン3、プライマーセット#2によって増幅されたオリゴヌクレオチド;レーン4、プライマーセット#3によって増幅されたオリゴヌクレオチド;レーン5、プライマーセット#4によって増幅されたオリゴヌクレオチド;レーン6、プライマーセット#5によって増幅されたオリゴヌクレオチドである。
【図2】図2Aは、ゲル電気泳動による長さに基づくオリゴヌクレオチドの分別法によって生成されたコードの例証する、および、このコードを読み取る代わりの仕様を表示する、簡易図である。図2Bは、図2Bで表示した仕様と一致する、上記二進数コードの読み取りを表示する、簡易図である。
【図3】図3Aは、簡易図あって、図3Aは、サンプルキャリアの一実施形態を表示する簡易図である。図3Bは、図3Aのサンプルキャリア上の異なる位置に維持されている一つの生物学的タグと一致する、代表的なコードを表示する簡易図である。
【図4】図4は、サンプルの識別に使用する生物学的タグの生成方法の一実施形態において、全体の操作を表示する流れ図である。
【図5】図5は、生物学的タグをサンプルキャリアに利用する方法の一実施形態において、全体の操作を表示する流れ図である。

【特許請求の範囲】
【請求項1】
二つ以上のオリゴヌクレオチドおよびサンプルを含有する組成物であって、該オリゴヌクレオチドは、第一のオリゴヌクレオチドセットとして表され、該第一のオリゴヌクレオチドセットは、該サンプルに特異的にハイブリダイズし得えないオリゴヌクレオチドを含み、該オリゴヌクレオチドは約8ヌクレオチド〜50Kbの長さを有し、該第一のオリゴヌクレオチドセットは、オリゴヌクレオチドを含み、該オリゴヌクレオチドの各々は、該第一のオリゴヌクレオチドセットを構成する他のオリゴヌクレオチドとは物理学的差異または化学的差異を有し、該第一のオリゴヌクレオチドセットは、第一のプライマーセットとして表される一意的なプライマーペアに特異的にハイブリダイズし得る異なる配列をその中に有する一つ以上のオリゴヌクレオチドを含む、組成物。
【請求項2】
三つ以上の一意的なプライマーペア、および二つ以上のオリゴヌクレオチド含む組成物であって、ここで、該一意的なプライマーペアは、第一のプライマーセット、第二のプライマーセット、第三のプライマーセット、第四のプライマーセット、第五のプライマーセット、または第六のプライマーセットとして表され、該一意的なプライマーペアの各々は異なる配列を有し、少なくとも二つの該一意的なプライマーペアは、二つのオリゴヌクレオチドに特異的にハイブリダイズし得、ここで、該オリゴヌクレオチドは、第一のオリゴヌクレオチドセット、第二のオリゴヌクレオチドセット、第三のオリゴヌクレオチドセット、第四のオリゴヌクレオチドセット、第五のオリゴヌクレオチドセット、または第六のオリゴヌクレオチドセットとして表され、該オリゴヌクレオチドは、約8ヌクレオチド〜50Kbの長さを有し、該オリゴヌクレオチドは、各セットにおいて、同じオリゴヌクレオチドセットで構成される他のオリゴヌクレオチドとの物理学的差異または化学的差異を有する、組成物。
【請求項3】
三つ以上の一意的なプライマーペア、および二つ以上のオリゴヌクレオチド含む溶液性組成物であって、ここで、該一意的なプライマーペアは、第一のプライマーセット、第二のプライマーセット、第三のプライマーセット、第四のプライマーセット、第五のプライマーセット、または第六のプライマーセットとして表され、該一意的なプライマーペアの各々異なる配列を有し、少なくとも二つの該一意的なプライマーペアは、二つのオリゴヌクレオチドに特異的にハイブリダイズし得、ここで、該オリゴヌクレオチドは、第一のオリゴヌクレオチドセット、第二のオリゴヌクレオチドセット、第三のオリゴヌクレオチドセット、第四のオリゴヌクレオチドセット、第五のオリゴヌクレオチドセット、または第六のオリゴヌクレオチドセットとして表され、該オリゴヌクレオチドは、約8ヌクレオチド〜50Kbの長さを有し、該オリゴヌクレオチドは、各セットにおいて、同じオリゴヌクレオチドセットで構成される他のオリゴヌクレオチドとの物理学的差異または化学的差異を有する、組成物。
【請求項4】
サンプルを識別するための生物学的タグ化されたサンプルを製造する方法であって、以下aおよびb:
a.該サンプルに加える二つ以上のオリゴヌクレオチドの組合せを選択する工程であって、該オリゴヌクレオチドは、該サンプルに特異的にハイブリダイズし得ず、該オリゴヌクレオチドは、約8ヌクレオチド〜5000ヌクレオチドの長さを有し、該オリゴヌクレオチドの各々は、物理学的差異または化学的差異を有し、一つ以上の該オリゴヌクレオチドの各々は、一意的なプライマーペアに特異的にハイブリダイズし得る異なる配列をその中に有する工程;および
b.二つ以上のオリゴヌクレオチドの組合せを該サンプルに加える工程であって、ここで、該オリゴヌクレオチドの組合せは、該サンプルを識別し、それによって、該サンプルを識別する生物学的タグ化されたサンプルを製造する工程
を包含する方法。
【請求項5】
生物学的タグ化されたサンプルを識別する方法であって、以下aおよびbおよびc:
a.サンプル中において、二つ以上のオリゴヌクレオチドの存在または非存在を検出する工程であって、ここで、該オリゴヌクレオチドは、物理学的差異、もしくは化学的差異に基づいて識別され、それによって、該サンプル中のオリゴヌクレオチドの組合せを識別する、工程;
b.該オリゴヌクレオチドの組合せをデータベースと比較する工程であって、該データベースは、特定のサンプルを識別するための一意的なオリゴヌクレオチドの既知の組合せを含む、工程;および
c.該データベース中の一意的なオリゴヌクレオチドの組合せのうち、どれが該サンプル中のオリゴヌクレオチドの組合せと同一であるということに基づいて該サンプルを識別する、工程
を包含する方法。
【請求項6】
生物学的タグ化されたサンプルのアーカイブであって、以下aおよびbおよびc:
a.サンプル;
b.二つ以上のオリゴヌクレオチドであって、該オリゴヌクレオチドは、該サンプルに特異的にハイブリダイズし得ず、該オリゴヌクレオチドは、約8ヌクレオチド〜50Kbヌクレオチドの長さを有し、該オリゴヌクレオチドの各々は、物理学的差異または化学的差異を有し、一つ以上の該オリゴヌクレオチドは、一意的なプライマーペアに特異的にハイブリダイズし得る異なる配列をその中に有し、特有な組合せ中にある該オリゴヌクレオチドが、該サンプルを識別するオリゴヌクレオチド;および
c.前記生物学的タグ化されたサンプルを記憶するための記憶媒体
を備える、アーカイブ。
【請求項7】
生物学的タグ化されたサンプルのアーカイブを製造する方法であって、以下aおよびbおよびc:
a.サンプルに加えるための二つ以上のオリゴヌクレオチドの組合せを選択する工程であって、該オリゴヌクレオチドは、該サンプルに特異的にハイブリダイズし得ず、該オリゴヌクレオチドは、約8ヌクレオチド〜50Kbヌクレオチドの長さを有し、該オリゴヌクレオチドの各々は、物理学的差異または化学的差異を有し、一つ以上の該オリゴヌクレオチドは、一意的なプライマーペアに特異的にハイブリダイズし得る異なる配列をその中に有する、工程;および
b.該二つ以上のオリゴヌクレオチドの組合せを該サンプルに加える工程であって、ここで、該オリゴヌクレオチドの組合せが、該サンプルを識別し、それによって、該サンプルを識別する生物学的タグ化されたサンプルを製造する、工程;および
c.該生物学的タグ化されたサンプルを、該生物学的タグ化されたサンプルを記憶するために記憶媒体に配置する工程を包含する、方法。
【請求項8】
組成物であって、該組成物は、基材、該基材上の所定の位置に各々が固定された、複数のポリヌクレオチド配列または複数のポリペプチドの配列および識別子オリゴヌクレオチドと称されるポリヌクレオチド配列を含み、ここで、該ポリペプチドの配列またはポリヌクレオチド配列の少なくとも二つは、標的配列と称され、そして、それらは互いに別個のものであり、そして、該識別子オリゴヌクレオチドは、該標的配列に特異的にハイブリダイズし得る核酸に対して、特異的にハイブリダイズしない、組成物。
【請求項9】
組成物であって、基材および該基材上の所定の位置に各々が固定された、複数のポリヌクレオチド配列を含み、ここで、該ポリヌクレオチドの配列うちの少なくとも二つは、標的配列と称され、そしてそれらは互いに別個のものであり、そして、ここで、識別子オリゴヌクレオチドと称される少なくとも第三のポリヌクレオチド配列が、該標的配列に特異的にハイブリダイズし得る核酸に対して、特異的にハイブリダイズし得ない、組成物。
【請求項10】
請求項8または9に記載の組成物であって、ここで、少なくとも10〜100の標的配列がある、組成物。
【請求項11】
請求項8または9に記載の組成物であって、ここで、少なくとも100〜1000の標的配列がある、組成物。
【請求項12】
請求項8または9に記載の組成物であって、ここで、前記標的配列は、核酸ライブリー、またはポリペプチドライブラリーを含む、組成物。
【請求項13】
請求項12に記載の組成物であって、ここで、前記ライブラリーは、哺乳動物のライブラリーを含む、組成物。
【請求項14】
請求項8または9に記載の組成物であって、ここで、前記標的配列は、ゲノムライブラリー、cDNAライブラリー、またはESTライブラリーを含む、組成物。
【請求項15】
請求項8または9に記載の組成物であって、ここで、前記標的配列は、結合分子ライブラリー、または酵素ライブラリーを含む、組成物。
【請求項16】
請求項15に記載の組成物であって、ここで、前記結合分子は、抗体、レセプター、レセプター結合リガンドまたはれクチンを含む、組成物。
【請求項17】
請求項8または9に記載の組成物であって、ここで、少なくとも2〜5の識別子オリゴヌクレオチドがあり、各々の識別子オリゴヌクレオチドは、すべての他の識別子オリゴヌクレオチドに存在する配列と別個のものである配列を有する、組成物。
【請求項18】
請求項8または9に記載の組成物であって、ここで、少なくとも2〜5の識別子オリゴヌクレオチドまたは10〜15の識別子オリゴヌクレオチドがあり、各々の識別子オリゴヌクレオチドは、すべての他の識別子オリゴヌクレオチドに存在する配列と別個のものである配列を有する、組成物。
【請求項19】
請求項8または9に記載の組成物であって、ここで、少なくとも15〜20の識別子オリゴヌクレオチドまたは10〜15の識別子オリゴヌクレオチドがあり、各々の識別子オリゴヌクレオチドは、すべての他の識別子オリゴヌクレオチドに存在する配列と別個のものである配列を有する、組成物。
【請求項20】
請求項8または9に記載の組成物であって、ここで、少なくとも25〜30の識別子オリゴヌクレオチド、または30〜50の識別子オリゴヌクレオチドがあり、各々の識別子オリゴヌクレオチドは、すべての他の識別子オリゴヌクレオチドに存在する配列と別個のものである配列を有する、組成物。
【請求項21】
請求項8または9に記載の組成物であって、ここで、前記識別子オリゴヌクレオチドは、パターン形成された、組成物。
【請求項22】
請求項8または9に記載の組成物であって、ここで、前記識別子オリゴヌクレオチドは、行または列をパターン形成された、組成物。
【請求項23】
請求項8または9に記載の組成物であって、ここで、前記識別子オリゴヌクレオチドは、サンプルのコードから構成されるオリゴヌクレオチドに特異的にハイブリダイズし得、該サンプルは、核酸を含むが、核酸に対して特異的にハイブリダイズし得ない、組成物。
【請求項24】
請求項8または9に記載の組成物であって、ここで、各識別子オリゴヌクレオチドの配列のうち少なくとも一部分が、前記標的配列と同じ種ではない、組成物。
【請求項25】
請求項8または9に記載の組成物であって、ここで、前記識別子オリゴヌクレオチドは、前記標的配列が1以上のヒト配列を含む場合に、完全なヒトの配列ではない、組成物。
【請求項26】
請求項8または9に記載の組成物であって、ここで、前記識別子オリゴヌクレオチドは、前記標的配列が1以上の植物配列を含む場合に、完全な植物の配列ではない、組成物。
【請求項27】
請求項8または9に記載の組成物であって、ここで、前記識別子オリゴヌクレオチドは、前記標的配列が1以上の細菌配列を含む場合に、完全な細菌の配列ではない、組成物。
【請求項28】
請求項8または9に記載の組成物であって、ここで、前記識別子オリゴヌクレオチドは、前記標的配列が1以上のウイルス配列を含む場合に、完全なウイルスの配列ではない、組成物。
【請求項29】
請求項8または9に記載の組成物であって、ここで、前記基材は、セルロース、ポリエチレン、ポリプロピレン、ポリスチレン、金属、またはガラスを含む、組成物。
【請求項30】
請求項8または9に記載の組成物であって、ここで、前記標的配列は、前記支持体に、共有結合または非共有結合によって固定された、組成物。
【請求項31】
請求項8または9に記載の組成物であって、ここで、前記標的配列は、前記支持体に、結合部分、吸着、化学結合、または光架橋によって固定された、組成物。
【請求項32】
請求項8または9に記載の組成物であって、さらにアーカイブを含み、該アーカイブは前記基材のための記憶媒体を含む、組成物。
【請求項33】
請求項8または9に記載の組成物であって、ここで、前記基材は、複数の基材を含む、組成物。
【請求項34】
生物学的タグ化されたサンプルを製造するためのデータおよび命令がコード化された、コンピュータ読み取り可能媒体であって、該データおよび該命令は、
a.該サンプルに加えるためのオリゴヌクレオチドの一意的な組合せを選択し;
b.該オリゴヌクレオチドの一意的な組合せを該サンプルに接触させ、ここで、該オリゴヌクレオチドの一意的な組合せが、該サンプルを識別し、それによって、生物学的タグ化されたサンプルを製造し;そして
c.該オリゴヌクレオチドの一意的な組合せと、該生物学的タグ化されたサンプルとを結びつけるデータ記録を作る、
命令を装置にさらに実行させるようにする、コンピュータ読み取り可能媒体。
【請求項35】
請求項34に記載のコンピュータ読み取り可能媒体であって、データおよび命令がさらにコード化され;該データおよび該命令は、
a.データ構造から、複数のオリゴヌクレオチドと結びついたデータ記録から検索し;そして
b.該データ記録と一致する該オリゴヌクレオチドの一意的な組合せを選択する、
命令を装置にさらに実行させるようにする、コンピュータ読み取り可能媒体。
【請求項36】
請求項35に記載のコンピュータ読み取り可能媒体であって、データおよび命令がさらにコード化され;該データおよび該命令は、
前記オリゴヌクレオチドの一意的な組合せに含めるために、該サンプルに対して特異的にハイブリダイズし得ない前記ヌクレオチドのうちの1つを選択する
命令を装置にさらに実行させるようにする、コンピュータ読み取り可能媒体。
【請求項37】
請求項35に記載のコンピュータ読み取り可能媒体であって、データおよび命令がさらにコード化され;該データおよび該命令は、
前記オリゴヌクレオチドの一意的な組合せに含めるために、約8ヌクレオチド〜5000ヌクレオチドの長さを有する前記ヌクレオチドのうちの1つを選択する
命令を装置にさらに実行させるようにする、コンピュータ読み取り可能媒体。
【請求項38】
請求項35に記載のコンピュータ読み取り可能媒体であって、データおよび命令がさらにコード化され;該データおよび該命令は、
前記オリゴヌクレオチドの一意的な組合せに含めるために、各々が物理学的差異または化学的差異を有する前記ヌクレオチドのうちの1つを選択する
命令を装置にさらに実行させるようにする、コンピュータ読み取り可能媒体。
【請求項39】
請求項35に記載のコンピュータ読み取り可能媒体であって、データおよび命令がさらにコード化され;該データおよび該命令は、
前記オリゴヌクレオチドの一意的な組合せに含めるために、一意的プライマーペアに特異的にハイブリダイズし得る異なる配列を各々がその中に有する前記ヌクレオチドのうちの1つを選択する
命令を装置にさらに実行させるようにする、コンピュータ読み取り可能媒体。
【請求項40】
請求項35に記載のコンピュータ読み取り可能媒体であって、データおよび命令がさらにコード化され;該データおよび該命令は、
前記オリゴヌクレオチドの一意的な組合せに含めるために、一意的識別子オリゴヌクレオチドに特異的にハイブリダイズし得る異なる配列を各々がその中に有する前記ヌクレオチドのうちの1つを選択する
命令を装置にさらに実行させるようにする、コンピュータ読み取り可能媒体。
【請求項41】
請求項35に記載のコンピュータ読み取り可能媒体であって、データおよび命令がさらにコード化され;該データおよび該命令は、
オリゴヌクレオチドの一意的な組合せ中に、該オリゴヌクレオチドを含む溶液性組成物を調製する
命令を装置にさらに実行させるようにする、コンピュータ読み取り可能媒体。
【請求項42】
請求項41に記載のコンピュータ読み取り可能媒体であって、データおよび命令がさらにコード化され;該データおよび該命令は、
前記溶液性組成物と前記サンプルを接触させる
命令を装置にさらに実行させるようにする、コンピュータ読み取り可能媒体。
【請求項43】
請求項41に記載のコンピュータ読み取り可能媒体であって、データおよび命令がさらにコード化され;該データおよび該命令は、
サンプルキャリア上の所定の位置に、前記溶液性組成物を供給する
命令を装置にさらに実行させるようにする、コンピュータ読み取り可能媒体。
【請求項44】
生物学的タグ化サンプルを識別するためのデータおよび命令がコードされる、コンピュータ読み取り可能媒体であって、該データおよび該命令は、
a.2つ以上のオリゴヌクレオチドの存在または非存在をサンプル中で検出し、それによって、該サンプル中のオリゴヌクレオチドの組合せを識別し;
b.データベースと該オリゴヌクレオチドの組合せを比較し、該データベースは、各々の一意的なサンプルを識別するための一意的なオリゴヌクレオチドの既知の組合せのデータ記録を含み;そして
c.該データ記録と該サンプル中のオリゴヌクレオチドの組合せとの比較に基づいて、該サンプルを識別する、
命令を装置にさらに実行させるようにする、コンピュータ読み取り可能媒体。
【請求項45】
請求項44に記載のコンピュータ読み取り可能媒体であって、データおよび命令がさらにコード化され;該データおよび該命令は、
前記オリゴヌクレオチドの組合せ中の前記オリゴヌクレオチドの物理学的特徴および化学的特徴に基づいて、前記サンプルを識別する
命令を装置にさらに実行させるようにする、コンピュータ読み取り可能媒体。
【請求項46】
請求項45に記載のコンピュータ読み取り可能媒体であって、データおよび命令がさらにコード化され;該データおよび該命令は、
前記オリゴヌクレオチドの組合せ中の前記オリゴヌクレオチドの各々のそれぞれの長さに基づいて、前記サンプルを識別する
命令を装置にさらに実行させるようにする、コンピュータ読み取り可能媒体。
【請求項47】
請求項45に記載のコンピュータ読み取り可能媒体であって、データおよび命令がさらにコード化され;該データおよび該命令は、
前記オリゴヌクレオチドの組合せ中の前記オリゴヌクレオチドの各々に対して特異的にハイブリダイズするそれぞれのプライマーペアに基づいて該サンプルを識別する命令を装置にさらに実行させるようにする、コンピュータ読み取り可能媒体。
【請求項48】
請求項46に記載のコンピュータ読み取り可能媒体であって、データおよび命令がさらにコード化され;該データおよび該命令は、
前記オリゴヌクレオチドの組合せ中の前記オリゴヌクレオチドの各々に対して特異的にハイブリダイズするそれぞれの識別子オリゴヌクレオチドに基づいて前記サンプルを識別する命令を装置にさらに実行させるようにする、コンピュータ読み取り可能媒体。
【請求項49】
生物学的タグ化されたサンプルのアーカイブを作製するためのデータおよび命令がコードされた、コンピュータ読み取り可能媒体であって、該データおよび該命令は、
a.サンプルと結びつくオリゴヌクレオチドの組合せを選択し;
b.該オリゴヌクレオチドの組合せと該サンプルとを接触させ、ここで該オリゴヌクレオチドの組合せが該サンプルを識別し、それよって、生物タブ化したサンプルを作り;
c.該生物学的タグ化されたサンプルを保存するためのサンプルキャリアに、該生物学的タグ化されたサンプルを配置し;そして
d.該サンプルキャリアと該生物学的タグ化されたサンプルとが結びついたデータ記録を作る、
命令を装置にさらに実行させるようにする、コンピュータ読み取り可能媒体。
【請求項50】
請求項49に記載のコンピュータ読み取り可能媒体であって、データおよび命令がさらにコード化され;該データおよび該命令は、
a.データ構造から、複数のオリゴヌクレオチドと結びついたデータ記録を検索し;そして
b.前記データ記録と一致する前記オリゴヌクレオチドの組合せを選択する、
命令を装置にさらに実行させるようにする、コンピュータ読み取り可能媒体。
【請求項51】
請求項50に記載のコンピュータ読み取り可能媒体であって、データおよび命令がさらにコード化され;該データおよび該命令は、
前記オリゴヌクレオチドの一意的な組合せに含めるために、前記サンプルに対して特異的にハイブリダイズし得ない前記ヌクレオチドのうちの1つを選択する
命令を装置にさらに実行させるようにする、コンピュータ読み取り可能媒体。
【請求項52】
請求項51に記載のコンピュータ読み取り可能媒体であって、データおよび命令がさらにコード化され;該データおよび該命令は、
前記オリゴヌクレオチドの一意的な組合せに含めるために、約8ヌクレオチド〜約5000ヌクレオチドの長さを有する前記ヌクレオチドのうちの1つを選択する
命令を装置にさらに実行させるようにする、コンピュータ読み取り可能媒体。
【請求項53】
請求項51に記載のコンピュータ読み取り可能媒体であって、データおよび命令がさらにコード化され;該データおよび該命令は、
前記オリゴヌクレオチドの一意的な組合せに含めるために、各々が物理学的差異または化学的差異を有する前記ヌクレオチドのうちの1つを選択する
命令を装置にさらに実行させるようにする、コンピュータ読み取り可能媒体。
【請求項54】
請求項51に記載のコンピュータ読み取り可能媒体であって、データおよび命令がさらにコード化され;該データおよび該命令は、
前記オリゴヌクレオチドの組合せに含めるために、一意的プライマーペアに特異的にハイブリダイズし得る異なる配列を各々がその中に有する前記ヌクレオチドのうちの1つを選択する命令を装置にさらに実行させるようにする、コンピュータ読み取り可能媒体。
【請求項55】
請求項51に記載のコンピュータ読み取り可能媒体であって、データおよび命令がさらにコード化され;該データおよび該命令は、
前記オリゴヌクレオチドの一意的な組合せに含めるために、一意的な識別子オリゴヌクレオチドに特異的にハイブリダイズし得る異なる配列を各々がその中に有する前記ヌクレオチドのうちの1つを選択する
命令を装置にさらに実行させるようにする、コンピュータ読み取り可能媒体。
【請求項56】
請求項51に記載のコンピュータ読み取り可能媒体であって、データおよび命令がさらにコード化され;該データおよび該命令は、
該オリゴヌクレオチドの組合せ中に、該オリゴヌクレオチドを含む溶液性組成物を調製する
命令を装置にさらに実行させるようにする、コンピュータ読み取り可能媒体。
【請求項57】
請求項56に記載のコンピュータ読み取り可能媒体であって、データおよび命令がさらにコード化され;該データおよび該命令は、
前記溶液性組成物と前記サンプルを接触させる
命令を装置にさらに実行させるようにする、コンピュータ読み取り可能媒体。
【請求項58】
請求項56に記載のコンピュータ読み取り可能媒体であって、データおよび命令がさらにコード化され;該データおよび該命令は、
サンプルキャリア上の所定の位置に、前記溶液性組成物を供給する
命令を装置にさらに実行させるようにする、コンピュータ読み取り可能媒体。
【請求項59】
請求項49に記載のコンピュータ読み取り可能媒体であって、データおよび命令がさらにコード化され;該データおよび該命令は、
前記生物学的タグ化サンプルと、前記サンプルキャリアの特定のアドレス可能な位置と結びつけられたデータ記録を作製する
命令を装置にさらに実行させるようにする、コンピュータ読み取り可能媒体。
【請求項60】
サンプルを識別するため生物学的タグを作製するためのデータおよび命令がコードされた、コンピュータ読み取り可能媒体であって、該データおよび該命令は、
a.該サンプルについて生物学的タグコードを識別し;
b.該生物学的タグコードとオリゴヌクレオチドの一意的な組合せを結びつけ、ここで、 該オリゴヌクレオチドの一意的な組合せが該サンプルを識別し;
c.サンプルキャリア上の所定の位置に該オリゴヌクレオチドの一意的な組合せを提供し;そして
d.該所定の位置と該オリゴヌクレオチドの一意的な組合せとを関連付けたデータ記録を作る
命令を装置に実行させるようにする、コンピュータ読み取り可能媒体。
【請求項61】
請求項60に記載のコンピュータ読み取り可能媒体であって、さらにデータおよび命令がコード化され;該データおよび該命令は、
a.前記オリゴヌクレオチドの一意的な組合せ中の各々のオリゴヌクレオチドを含む溶液性組成物を調製し;そして
b.前記溶液性組成物を、サンプルキャリア上の所定の位置に供給する、
命令を装置にさらに実行させるようにする、コンピュータ読み取り可能媒体。
【請求項62】
請求項61に記載のコンピュータ読み取り可能媒体であって、さらにデータおよび命令がコード化され;該データおよび該命令は、
(i)前記溶液性組成物と前記サンプルとを接触させる、
命令を装置にさらに実行させるようにする、コンピュータ読み取り可能媒体。
【請求項63】
請求項60に記載のコンピュータ読み取り可能媒体であって、さらにデータおよび命令がコード化され;該データおよび該命令は、
a.データ構造から、複数の生物学的タグコードの利用可能性と結びついたデータ記録を検索し;そして
b.該データ記録と一致する前記生物学的タグコードを識別する、
命令を装置にさらに実行させるようにする、コンピュータ読み取り可能媒体。
【請求項64】
請求項60に記載のコンピュータ読み取り可能媒体であって、さらにデータおよび命令がコード化され;該データおよび該命令は、
a.データ構造から、複数のオリゴヌクレオチドと結びついたデータ記録を検索し;そして
b.前記オリゴヌクレオチドの一意的な組合せと、該データ記録と一致する前記生物学的タグコードとを結びつける、
命令を装置にさらに実行させるようにする、コンピュータ読み取り可能媒体。
【請求項65】
請求項64に記載のコンピュータ読み取り可能媒体であって、さらにデータおよび命令がコード化され;該データおよび該命令は、
(i)前記オリゴヌクレオチドの一意的な組合せに含めるために、一意的なプライマーペアに特異的にハイブリダイズし得る異なる配列を各々がその中に有する前記ヌクレオチドのうちの1つを選択する
命令を装置にさらに実行させるようにする、コンピュータ読み取り可能媒体。
【請求項66】
請求項64に記載のコンピュータ読み取り可能媒体であって、さらにデータおよび命令がコード化され;該データおよび該命令は、
(i)前記オリゴヌクレオチドの一意的な組合せに含めるために、一意的な識別子オリゴヌクレオチドに特異的にハイブリダイズし得る異なる配列を各々がその中に有する前記複数のヌクレオチドのうちの1つを選択する
命令を装置にさらに実行させるようにする、コンピュータ読み取り可能媒体。
【請求項67】
請求項60に記載のコンピュータ読み取り可能媒体であって、さらにデータおよび命令がコード化され;該データおよび該命令は、
(i)前記サンプルキャリアの前記所定の位置と前記オリゴヌクレオチドの一意的な組合せとを結びつける特徴を作製する
命令を装置にさらに実行させるようにする、コンピュータ読み取り可能媒体。
【請求項68】
請求項67に記載のコンピュータ読み取り可能媒体であって、さらにデータおよび命令がコード化され;該データおよび該命令は、
a.前記特徴を有するラベルを出力し;そして
b.該ラベルを前記サンプルキャリアにつける
命令を装置にさらに実行させるようにする、コンピュータ読み取り可能媒体。
【請求項69】
生物学的タグをサンプルキャリアにつけるためのデータおよび命令がコードされたコンピュータ読み取り可能媒体であって、該データおよび該命令は、
a.選択された生物学的タグを含む容器を検索し、該生物学的タグ化は、オリゴヌクレオチドの一意的な組合せから構成され;
b.該選択された生物学的タグが、使用のために利用可能であることを確認し;
c.サンプルキャリア上の所定の位置に、前記生物学的タグを提供し;そして
d.該生物学的タグと該所定の位置とを結びつけるデータ記録を作る、
命令を装置にさらに実行させるようにする、コンピュータ読み取り可能媒体。
【請求項70】
請求項69に記載のコンピュータ読み取り可能媒体であって、さらにデータおよび命令がコード化され;該データおよび該命令は、
(i)将来利用不可能な生物学的タグを識別するデータ記録を作る、
命令を装置にさらに実行させるようにする、コンピュータ読み取り可能媒体。
【請求項71】
請求項69に記載のコンピュータ読み取り可能媒体であって、さらにデータおよび命令がコード化され;
(i)前記生物学的タグと前記所定の位置とを結びつける特徴を作る、
命令を装置にさらに実行させるようにする、コンピュータ読み取り可能媒体。
【請求項72】
請求項71に記載のコンピュータ読み取り可能媒体であって、さらにデータおよび命令がコード化され;該データおよび該命令は、
a.前記特徴を有するラベルを出力し;そして
b.該ラベルを前記サンプルキャリアにつける
命令を装置にさらに実行させるようにする、コンピュータ読み取り可能媒体。
【請求項73】
請求項69に記載のコンピュータ読み取り可能媒体であって、さらにデータおよび命令がコード化され;
(i)前記生物学的タグと前記所定の位置に同時に位置づけられているサンプルとを結びつけるデータ記録を作成する
命令を装置にさらに実行させるようにする、コンピュータ読み取り可能媒体。
【請求項74】
サンプルを識別するための生物学的タグを作製するコンピュータで実施される方法であって、
a.該サンプルのための生物学的タグコードを識別する工程;
b.オリゴヌクレオチドの一意的な組合せと該生物学的タグコードとを結びつける工程;および
c.該オリゴヌクレオチドの一意的な組合せと、サンプルキャリア上の所定の位置とを結びつけたデータ記録を作成する工程、
を包含する、方法。
【請求項75】
請求項74に記載の方法であって、前記結びつける工程が、
複数のオリゴヌクレオチドを結びつけられたデータ記録を検索する工程;および
該検索と一致する該オリゴヌクレオチドの一意的な組合せを作成する工程
を包含する、方法。
【請求項76】
請求項75に記載の方法であって、ここで、前記作成する工程は、前記オリゴヌクレオチドの一意的な組合せに含めるために、約8〜約5000ヌクレオチドの長さを有するオリゴヌクレオチドを選択する工程
を包含する、方法。
【請求項77】
請求項75に記載の方法であって、ここで、前記作成する工程は、前記オリゴヌクレオチドの一意的な組合せに含めるために、各々が物理学的差異または化学的差異を有する前記ヌクレオチドを選択する工程
を包含する、方法。
【請求項78】
請求項75に記載の方法であって、ここで、前記作成する工程は、
前記オリゴヌクレオチドの一意的な組合せに含めるために、一意的なプライマーペアに特異的にハイブリダイズし得る異なる配列を各々がその中に有する前記ヌクレオチドのうちの1つを選択する工程
を包含する、方法。
【請求項79】
請求項75に記載の方法であって、ここで、前記作成する工程は、
前記オリゴヌクレオチドの一意的な組合せに含めるために、一意的な識別子オリゴヌクレオチドに特異的にハイブリダイズし得る異なる配列を各々がその中に有する前記ヌクレオチドのうちの1つを選択する工程
を包含する、方法。
【請求項80】
請求項74に記載の方法であって、ここで、前記識別する工程は、
利用可能な複数の生物学的タグコードを結びつけられたデータ記録を検索する工程、および該検索と一致する利用可能な生物学的タグコードを確認する工程
を包含する、方法。
【請求項81】
請求項80に記載の方法であって、ここで、前記作成する工程は、
将来利用不可能な前記生物学的タグを識別する工程
を包含する、方法。
【請求項82】
生物学的タグ化されたサンプルを識別するためのコンピュータで実施される方法であって、
該方法は、以下:
a.コードオリゴヌクレオチドと基材上の所定の位置に維持されたそれぞれの識別子オリゴヌクレオチドとの間での特異的なハイブリダイゼーションを検出する工程;
b.該検出に従って該生物学的タグ化したサンプル中に存在する1以上のオリゴヌクレオチドを識別する工程;
c.該生物学的タグ化したサンプル中に存在する該コードオリゴヌクレオチドを、一意的なサンプルとオリゴヌクレオチドの一意的な組合せと結びつけるデータ記録に対して比較する工程;および
d.該比較する工程に応答して該生物学的タグ化したサンプルを識別する工程
を包含する、方法。
【請求項83】
請求項82に記載の方法であって、ここで、
前記検出する工程は、基材上において二以上の識別子オリゴヌクレオチドが所定位置に固定された該基材上のハイブリダイゼーションを解析する工程
を包含し、ここで、該識別子オリゴヌクレオチドの各々が、全ての他の識別子オリゴヌクレオチドに存在する配列と別個のものである配列を有しており、そして、ここで、該識別子オリゴヌクレオチドが、該生物学的タグ化したサンプルにおいて潜在的に存在するコードオリゴヌクレオチドのそれぞれに特異的にハイブリダイズするのに十分な数である、
方法。
【請求項84】
請求項83に記載の方法であって、ここで、前記基材は、複数の核酸サンプルを含み、該核酸サンプルは、該基材上の所定の位置に固定化され、該基材は、そのハイブリダイゼーションがコード識別を妨げる程度にコードオリゴヌクレオチドに特異的にハイブリダイズし得ない、方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate


【公表番号】特表2007−535921(P2007−535921A)
【公表日】平成19年12月13日(2007.12.13)
【国際特許分類】
【出願番号】特願2007−511030(P2007−511030)
【出願日】平成17年4月28日(2005.4.28)
【国際出願番号】PCT/US2005/014904
【国際公開番号】WO2005/111212
【国際公開日】平成17年11月24日(2005.11.24)
【出願人】(505187666)ジェンボールト コーポレイション (7)
【Fターム(参考)】