オリゴヌクレオチド・アレイの設計に関する方法

例えばメチル化プロファイリング、チップオンチップ及び比較ゲノム・ハイブリダイゼーション実験といったプロトコルにおいて使用される酵素の自動選択を可能にする方法が提供される。この方法は、所与の実験に対してマイクロアレイ上のスペースを最大にすることもできる。これは、このマイクロアレイからの結果が改善されることを意味する。この方法は、マイクロアレイ上の重要なパターンの零点規正及び焦点も改善する。これは、例えば腫瘍対正常組織、アグレッシブ対非アグレッシブ、男性対女性といった２つの別々のクラスのサンプルを区別する能力を強化する。更に、コンピュータ可読媒体及びデバイスも提供される。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は一般に、オリゴヌクレオチド・アレイの検証の分野に関する。より詳細には、本発明は、方法に関し、更により詳細にはコンピュータ可読媒体に関する。
【背景技術】
【０００２】
オリゴヌクレオチド・アレイは、ＤＮＡシーケンスといった多数のオリゴヌクレオチド・シーケンスが、特定のパターンにおいて固定されるチップである。
【０００３】
研究しようとする機構に応じて、異なるオリゴヌクレオチド・アレイが設計されることができる。例えば、メチレーション・オリゴヌクレオチド・マイクロアレイ解析（ＭＯＭＡ）と呼ばれる、ある特定のタイプのマイクロアレイを用いて研究されることができるＤＮＡメチル化は、遺伝子制御において最も好適に研究された後成的な機構である。プロモータ領域に存在するいわゆるＣｐＧの豊富な領域のＤＮＡメチル化が、遺伝子抑制に関する機構として機能することができることが知られている。ＣｐＧアイランドは、ヌクレオチドＣ及びＧが豊富なゲノムの一部である。
【０００４】
当業者には良く知られるディファレンシャルメチル化を実験的に見つけ出す方法は、ディファレンシャルメチル化ハイブリダイゼーション、メチル化特有のシーケンス化、ＨＥＬＰアッセイ、亜硫酸水素塩シーケンス化、ＣｐＧアイランド・アレイ等を含む。
【発明の概要】
【発明が解決しようとする課題】
【０００５】
しかしながら、例えばＤＮＡ−タンパク質交互作用、遺伝子コピー数多型、ディファレンシャルメチル化遺伝子座等を見つけるため、遺伝子を照会するのに遺伝子表現が使用される多くの用途が存在することができる。
【０００６】
アレイ上で解析を実行するとき、どのシーケンスがアレイ上にあることになるかを選択する問題が常に存在する。人はできるだけ多いことを好むが、高密度のアレイを用いたとしても、充分な余地がない。標準的なＡｇｉｌｅｎｔアレイは、今日では２４４，０００本のプローブを含み、Ｎｉｍｂｌｅｇｅｎアレイは、３９５，０００本のプローブを覆う。プローブが５０ベース長であるＮｉｍｂｌｅｇｅｎアレイにおいて、２０，０００，０００のゲノムシーケンスが存在する。ヒトゲノムにおける３、０００、０００、０００ベースと比べると、アレイ上での配置に関して、どのシーケンスを優先させるべきかについて選択がなされなければならないことは明らかである。このアレイにより覆われることになるシーケンスを選択する従来の方法は、経験に基づいた推測又は試行錯誤によるものである。
【０００７】
従って、アレイを設計するための改良された方法が有利である。特に、柔軟性、コスト効率性及び／又は設計されたアレイを検証するための可能性が増加されることを可能にするアレイ設計方法が有利である。
【課題を解決するための手段】
【０００８】
従って、本発明は好ましくは、単独で又は任意の組合せにおいて従来技術における上述の欠点及び不都合点の１つ又は複数を緩和、軽減又は除去しようとするものであり、添付の特許請求の範囲に記載のデバイス、方法、コンピュータ可読媒体及びデータベースを提供することにより、少なくとも上述した問題を解決する。
【０００９】
本発明の目的は、オリゴヌクレオチド・アレイの設計及び検証に関する方法を提供することである。
【００１０】
本発明の１つの側面によれば、ある方法が提供され、この方法によれば、ゲノム注釈及び所望のシーケンスに関する情報が第１のデータベースに保存される。その後、クエリシーケンスに関する表現行列が、第１のデータベースに格納される情報に第２のデータベースを適用することにより構築される。第２のデータベースは、規制酵素に関する情報を有することができる。続いて、規制酵素のリスト及びプロファイリングに関するシーケンスのリストが、クエリシーケンスに関する表現行列から構築される。最終的に、オリゴヌクレオチド・アレイが、シーケンスのリストから設計される。
【００１１】
本発明の別の側面によれば、上記方法の使用が与えられ、そこでは、上記第２のデータベースが所望の規制酵素に関する情報及び／又は、上記規制酵素が適用されることになる順番を更に有し、設計に関して、オリゴヌクレオチド・アレイの検証に関するコンピュータ内でのプロトコルが開示される。
【００１２】
本発明の更に別の側面によれば、コンピュータ可読媒体が開示される。このコンピュータ可読媒体は、プロセッサにより処理されるコンピュータプログラムをその上で実現している。このコンピュータプログラムは、上記の方法を実行するのに適したコードセグメントを有する。
【００１３】
更に本発明の側面によれば、オリゴヌクレオチド・アレイの検証に関するデバイスが開示される。このデバイスは、上記の方法を実行するのに適したユニットを有する。
【００１４】
メチル化プロファイリング、チップオンチップ、及び比較ゲノム・ハイブリダイゼーション実験に関するプロトコルにおいて使用される酵素の自動選択を可能にする点で、本発明は従来技術を超える利点を持つ。また本発明は、所与の実験に対してマイクロアレイ上のスペースを最大にする。これは、マイクロアレイからの結果が改善されることを意味する。本発明は、マイクロアレイ上の重要なパターンの零点規正及び焦点も改善する。これは、例えば腫瘍対正常組織、アグレッシブ対非アグレッシブ、男性対女性といった２つの別々のクラスのサンプルを区別する能力を強化する。
【図面の簡単な説明】
【００１５】
【図１】ある実施形態によるアレイ設計プロセスの概略図である。
【図２】プロセッサによる処理のためのコンピュータプログラムがその上に実現されるコンピュータ可読媒体の概略図である。
【図３】オリゴヌクレオチド・アレイの設計及び検証のためのデバイスの概略図である。
【図４】図１において説明されるアレイ設計プロセスの更により詳細な概略図である。
【図５】別の実施形態による処理の概略図である。
【図６】図４及び図５において与えられる実施形態をまとめた方法である第３の実施形態の概略図である。
【図７】更なる実施形態による処理の概略図である。
【図８Ａ】ある実施形態によるタンパク質ＭｓｅＩのフラグメントの分布を視覚化するヒストグラムを示す図であって、サイズ分布を示しており、ｙ軸が周波数８１を表し、ｘ軸はサイズ８２を表す、図である。
【図８Ｂ】ある実施形態によるタンパク質ＭｓｅＩのフラグメントの分布を視覚化するヒストグラムを示す図であって、カバー率分布を示しており、ｙ軸が周波数８１を表し、ｘ軸はカバー率８３を表す、図である。
【図９Ａ】ある実施形態によるタンパク質ＭｓｐＩのフラグメントの分布を視覚化するヒストグラムを示す図であって、サイズ分布を示しており、ｙ軸が周波数９１を表し、ｘ軸はサイズ９２を表す、図である。
【図９Ｂ】ある実施形態によるタンパク質ＭｓｐＩのフラグメントの分布を視覚化するヒストグラムを示す図であって、カバー率分布を示しており、ｙ軸が周波数９１を表し、ｘ軸はカバー率９３を表す、図である。
【発明を実施するための形態】
【００１６】
本発明のこれら及び他の側面、特徴及び利点が、本発明の実施形態に関する以下の説明から明らかとなり、対応する図面を参照して説明されることになる。
【００１７】
ある実施形態によれば、あるプロトコルにおいて使用される酵素の自動選択を可能にする方法が提供される。これらのプロトコルはメチル化プロファイリング、チップオンチップ、比較ゲノム・ハイブリダイゼーション実験とすることができる。ある実施形態によれば、この方法は、所与の実験に対してマイクロアレイ上のスペースを最大にすることもできる。これは、マイクロアレイからの結果が改善されることを意味する。この方法は、マイクロアレイ上の重要なパターンの零点規正（zero-in）及び焦点も改善することができる。これは、例えば腫瘍対正常組織、アグレッシブ対非アグレッシブ、男性対女性といった２つの別々のクラスのサンプルを区別する能力を強化する。
【００１８】
当業者が本発明を実施することができるよう、本発明の複数の実施形態が、添付の図面を参照して以下更に詳細に説明されることになる。しかしながら、本発明は、多くの異なる形式において実現されることができ、本願明細書に記載される実施形態に限定されるものとして解釈されるべきでない。むしろ、この開示が、完全であり完結するよう、及び当業者に対して本発明の範囲を完全に伝えるように、これらの実施形態が提供される。これらの実施形態は本発明を限定するものではなく、本発明は添付の特許請求の範囲によってのみ限定される。更に、添付の図面において説明される特定の実施形態の詳細な記載において使用される用語は、本発明を限定することを目的とするものではない。
【００１９】
以下の記載は、ある方法、特にアレイを設計する方法に適用可能な本発明の実施形態に焦点を当てる。しかしながら、本発明は、この用途に限定されるものではなく、例えばＰＣＲベースの実験を設計するためのコンピュータ内でのプロトコルを含む他の多くの用途に適用されることができる点を理解されたい。この場合、ターゲットＤＮＡシーケンスが最終的な製品において利用可能であること及び増幅のための正しいプローブが選択されることを確実にするため、追加的な検証が必要とされる。
【００２０】
図４に記載の実施形態において、オリゴヌクレオチド・アレイの検証に関する方法１００が提供される。オリゴヌクレオチドの例は、ＤＮＡ、ＲＮＡ、ｃＤＮＡ等とすることができる。
【００２１】
ある実施形態によれば、オリゴヌクレオチド・アレイは、ＤＮＡアレイである。更なる実施形態によれば、ＤＮＡアレイは、ＤＮＡメチル化アレイである。
【００２２】
別の実施形態によれば、ＤＮＡアレイは、遺伝子発現プロファイルである。
【００２３】
更に別の実施形態によれば、ＤＮＡアレイは、ゲノムプロファイリングアレイである。ゲノムプロファイリングアレイ１７は、いくつかの実施形態によれば、シングルヌクレオチド多型アレイ又は遺伝子コピー数多型アレイとすることができる。
【００２４】
ある実施形態によれば、この方法１００は、コンピュータ内で設計されたプロトコルにおいてカバーされる必要がある関心シーケンスを有する第１のデータベース１２に、ゲノム注釈１０及び所望のシーケンス１１に関する情報を格納するステップを有する。
【００２５】
ある実施形態によれば、ゲノム注釈１０に関する情報は、例えばゲノム及び／又は遺伝子プロモータにおけるＣｐＧアイランドに関する情報である。別の実施形態によれば、所望のシーケンス１１に関する情報は、関心領域である。関心領域は、例えば癌遺伝子、腫瘍抑圧、マイクロＲＮＡ、テロメラーゼ、セントロメア及び／又はリピート（repeat）とすることができる。
【００２６】
更に、クエリシーケンス１４に関する表現行列が構築される。これは、第２のデータベース１３を適用することにより実行されることができる。データベース１３は、すべての既知の酵素及びそれらの個別の認識部位及び切断部位（シーケンス）を有することができる。データベース１３は、どんな酵素が使用に適しているか、及び／又はどんな順で酵素が適用されるべきかに関する情報も有することができる。
【００２７】
すると、規制酵素１５のリスト及びメチル化プロファイリング１６に適したシーケンスのリストが、クエリシーケンス１４に関する表現行列から構築されることができる。ステップ１４は、図５において利用可能なものの数値的表現を有することができる。理想的な酵素は、１００％のカバー率を持つすべてのフラグメントを持つことであり（図における左列）、０％の所でヒストグラムにおける棒がないことである。また、フラグメント長分布が、２００〜１０００のベース範囲に含まれることになる。ある実施形態によれば、これらの状態は、処理において動的にセットされ、設計されるアレイのタイプに基づき変化することができる。これは、アレイが固定長のアレイだけでなく、可変長のアレイとすることができるからである。こうして、プローブの長さは、変化することができる。これは、異なるサイズのフラグメント及び異なるサイズのプローブが、コンピュータ内での消化を用いて選択されることができることを意味する。すると、ＤＮＡメチル化アレイ１７が、シーケンスのリストから構築されることができる。こうして、メチル化アレイ１７は、図５に記載のフィルタ２２を通過したフラグメントを有する。するとこのプローブは、各フラグメントに関する標準的な基準に基づき設計され、当業者に知られる方法に基づきアレイ上で合成される。アレイ上に配置されることができるプローブの数は、アレイ製造の技術的な制限によってのみ制限される。
【００２８】
ある実施形態によれば、方法１００は、ＤＮＡアレイの検証に関するコンピュータ内のプロトコルを設計するために用いられることができる。
【００２９】
クエリシーケンス１４に関する表現行列をもたらす処理が、図５で更に説明される。第１のデータベース１２に格納されるＤＮＡシーケンス２０は、第２のデータベース１３に格納される第１の規制酵素２１を用いてコンピュータで消化される。ある実施形態によれば、ＤＮＡシーケンス２０は、完全なゲノムである。別の実施形態によれば、ＤＮＡシーケンス２０は、すべての既知の遺伝子のゲノムシーケンスである。更に別の実施形態によれば、ＤＮＡシーケンス２０は、計算的に又は実験的に得られたアイランドのシーケンスである。アイランドは、例えばＣｐＧアイランド又はアセチル化アイランドとすることができる。規制酵素認識部位及びその切断部位に基づき、第１のコンピュータ内での消化は、すべての可能なフラグメントを生み出す。
【００３０】
その後、第１の消化２１からのフラグメントをソートするため、第１のフィルタリング基準２２が適用される。ソートは、フラグメント長に基づき実行される。これは、所望の範囲に関して経験的に得られる値とすることができ、例えば２００〜１０００である。この範囲に含まれるフラグメントだけが、フィルタを通過し、次のステップにおいて使用される。
【００３１】
フィルタリング２２は、経験的に得られる基準に基づき、フラグメントを取り除くことができる。例えば、２００ｂｐ未満及び２０００ｂｐを超える長さを持つフラグメントが、取り除かれることができる。その後、フィルタリングされたフラグメントは、データベース１３に格納される情報に基づき、第２のコンピュータ内での消化２３に従属する。第２のコンピュータ内での消化の後、このフラグメントは、異なる酵素を用いる後続のコンピュータ内での消化を使用することにより、より小さな断片に切断されることができる。第２のコンピュータ内での消化２３は、第１の消化ステップ２１から残っている特定のシーケンスを取り除くために実行されることができる。
【００３２】
例えば、ほとんどの既知の遺伝子に加え、いくつかの余分なリピートシーケンスを全体のゲノムシーケンス１２のデータベースから得るよう、第１の消化２１が最適化することができる。この状態において、第２のコンピュータ内での消化ステップ２３が必要とされる。従って、第１の消化２１からのシーケンスの出力が、第２のステップ２３に対する入力として与えられる。ここで、コンピュータ内での消化２３の別のステップが、すべてのリピートシーケンスを取り除く最良の酵素を特定するため、規制酵素１３のデータベースを用いて、所望のフラグメント長範囲における既知の遺伝子部分を保ちつつ実行される。
【００３３】
更なる実施形態によれば、第１の消化２１及び第２の消化２３に類似する、任意の数の追加的なコンピュータ内での消化が、必要に応じて実行されることができる。それぞれの間で、コンピュータ内での消化が実行されることができる。フィルタリング基準は、第１のフィルタリング基準２２に似たものとすることができる。
【００３４】
すると、長さに基づかれるフラグメント２４の分布が実現される。フラグメント２４の分布は、分布ヒストグラム２５を用いて視覚化されることができ、及び／又はクエリシーケンス１４に関する表現行列に格納されることができる。
【表１】

【００３５】
この表は、最終的なプロトコルにおいてどの酵素を使用するべきかの決定法を明らかにする。各酵素の用途は、シーケンスの所望のターゲットグループについての異なる長さカバー率を生み出す。例えば、この場合、ＭｓｅＩは、最大のカバー率を生み出す。即ち、３１ＭＢのターゲットシーケンスを生み出し、トータルで４２．７ＭＢのタカイ−ジョーンズ規定に関するシーケンスを生み出す。同じことが、ガーディナー規定に関してもあてはまる。こうして、ＭｓｅＩに関する最大のカバー率は、タカイＣｐＧアイランド長及びガーディナーＣｐＧアイランド長の両方に基づき達成される。
【００３６】
ヒストグラム２５の例が、図８及び図９に示される。図８は、酵素ＭｓｅＩを用いた結果を示し、図９は、酵素ＭｓｐＩを用いた結果を示す。図８及び図９の数値結果は、図４の第２のデータベース１３及び図５におけるステップ２１から生じ、フィルタリング基準２２により、クエリシーケンス１４に関する表現行列から評価されることができる。このヒストグラムは、様々な規制酵素を用いるコンピュータ内での消化後、２００ｂｐ未満及び２０００ｂｐを超える長さのフラグメントの除去後、並びにその長さの５０％未満のＣｐＧアイランドをカバーするフラグメントの除去後の異なるゲノム長を示す。図８Ａ及び９Ａは、ビンが長さであるヒストグラムを示し（第１のビンは、０〜１００のヌクレオチド長、１０１〜２００のヌクレオチド長等である）、従って、どれくらいの数のフラグメントが、特定のヌクレオチド長であるかを反映する。こうしてヒストグラムは、フラグメントの長さに関する（length-wise）分布を示す。図８Ｂ及び９Ｂは、ビンが、ＣｐＧアイランドをカバーする（と交わる）フラグメントのパーセンテージ（例えば０〜１０％、１１〜２０％...）であるヒストグラムを示す。
【００３７】
図６による別の実施形態において、分布ヒストグラム２５を評価する方法が提供される。この評価は、求められるカバー率に対する、ヒストグラム２５ａ、２５ｂ、２５ｃ等の各ビンにおけるフラグメントの数に基づかれる。第１のヒストグラム２５ａは、特性の１つのセットを持つことができる。別のヒストグラム２５ｂは、特性の別のセットを持つことができる。更に別のヒストグラム２５ｃは、特性の更に別のセットを持つことができる。ヒストグラム２５ｂ及び２５ｃの間で、任意の数のヒストグラムが、評価３４の対象とされることができる。各ヒストグラムは、異なる酵素を用いる消化に対応する。評価３４に基づき、好ましい分布のフラグメントが選択される。これは、規制酵素１５のリストである。１つの良好な例は、単一のビンが他のビンを支配するのではなく、均一に分散されたビンを持つヒストグラムである。個別のビンに対する命令となる基準のリストは、

とするとき、各ヒストグラムＨに対して、
（ｉ）Ｈ（ｉ）≧ｈ_ｍｉｎ（例えばｈ_ｍｉｎ＝０．１）
（ｉｉ）Ｈ（ｉ）≦ｈ_ｍａｘ（例えばｈ_ｍａｘ＝０．８）
（ｉｉｉ）ｉ＝２、ｎ−１に対して、ΣＨ（ｉ）＝０．９
に基づきセットされる。
【００３８】
各消化ステップにおいて、所望の結果に基づき、規則のセットを変化させることが可能である。
【００３９】
ある実施形態によれば、フラグメントの望ましい収集を生み出すために適用される必要のある酵素の順の評価に成功した後、所与のフラグメントに対する最良の可能なプローブが、マイクロアレイ上で選択及び配置されることができる。別の実施形態によれば、フラグメントの望ましい収集を生み出すために適用される必要のある酵素の順の評価に成功した後、ＰＣＲ反応に対する最良の可能なプライマーが選択されることができる。図７に記載のある実施形態において、所望の特性を持つプローブを選択する方法が提供される。この方法に対する入力は、メチル化プロファイリング１６に関するシーケンスのリストである。シーケンスは、特定のオリゴヌクレオチド・アレイでの使用に適したシーケンスの第２のセットを生じさせる基準に基づき、ランク付け又はソートされるといった形で優先付けされる（ステップ４２）。これは、それらの長さに基づかれることができる（非常に短いフラグメント及び非常に長いフラグメントは、除外される。例えば、２００ベース未満又は１０００ベースを超える長さを持つフラグメントが除外される。）。フラグメントは、それらの個別のシーケンスに関連するゲノム注釈に基づき優先付けされることもできる。優先順位は、エキソン、プロモータ、ｍｉＲＮＡ、ＣｐＧアイランド、３'ＵＴＲ、（ヒストン）アセチル化アイランド、特定のヒストン修正アイランド（例えばヒストン３リジン４モノメチル化アイランド）上のフラグメントに関してより高くなる。他の実施形態では、特定の反復領域（例えばＬＩＮＥＳ、ＳＩＮＥＳ）が関心領域である。次に、これらのフラグメントに関して、マイクロアレイ上のフラグメントを表わすことができるプローブが設計されることができる。更に、フラグメントは、ハイブリダイゼーションモデルを用いて、ヌクレオチド頻度成分に基づき、即ちモノ−、ジ−、トリ−に基づき、優先付けされる。ハイブリダイゼーションモデルは、分類モデルであり、これは、マイクロアレイ上のプローブ性能を予測する。例えば、「良い」プローブと「悪い」プローブとを分類するようトレーニングされるサポートベクタマシン分類器が、プローブ設計及び選択のための分類モデルである。例えばヌクレオチドの頻度（モノ−、ジ−及びトリ−）、第２の構造スコア、アレイ上でのプローブとの整合能力といったパラメータの値が、構築される。すると、ハイブリダイゼーション分類モデルに基づきこれらのフラグメントを整合させるべく最良のプローブをソートするため、ハイブリダイゼーションモデルに基づかれるプロファイルが所与のアレイタイプに適用される（ステップ４３）。分類モデルは、多数のシーケンス及び熱力学特徴を考慮に入れる。シーケンス特徴は、モノ−、ジ−及びトリ−ヌクレオチドの頻度を有する。熱力学的特徴は、エントロピー、エンタルピー、融解温度、プロペラねじれ、ＤＮＡ可屈曲性等を有する。
【００４０】
フラグメント及びその代表的なプローブに対して、以下の特徴が、シーケンスに基づき計算されることができる。その特徴とは、ループを形成していないヌクレオチドの数、３'ＵＴＲ末端でのＣＧ成分、例えばＴＣＣ、ＣＴＣ、ＴＧＧ、ＡＧＧ、ＧＣＣといったトリヌクレオチドの頻度成分、融解温度（Ｔｍ）、可屈曲性、スタッキング・エネルギー、プロペラねじれ、アフィリシティ（aphilicity）、タンパク質誘導変形性、二重安定性−自由エネルギー、二重安定性−分裂エネルギー、ＤＮＡ変性、ＤＮＡ屈曲剛性、Ｂ−ＤＮＡねじれ、タンパク質−ＤＮＡねじれ及び／又はＺ−ＤＮＡの安定化エネルギーである。これは、従来技術において知られる任意の公知の計算ツール（又はデータベース）を用いて実行されることができる。例えば、Prabhat K. Mandal、Kamal Rawal、Ram Ramaswamy、Alok Bhattacharya、及びSudha Bhattacharyaによる「Identification of insertion hot spots for non-LTR retrotransposons: computational and biochemical application to Entamoeba histolytica, Nucleic Acids Res. 2006 November; 34(20): 5752-5763」に記載のＤＮＡスキャナを用いることができる。
【００４１】
ハイブリダイゼーション分類モデルから開発される決定規則（例えばプロファイル）に基づき、これらの特徴の値は、メートル法の距離を用いて、プロファイルに対して整合させられるべきである。プローブ−フラグメント・ペアに関するプロファイルに最も近い適合が、オリゴヌクレオチド・アレイ１７に関するプローブとして選択される（ステップ４４）。
【００４２】
以下は、２つのＭｓｐＩフラグメント（シーケンス）及びそれらの対応する特徴の例である。
【００４３】
ある実施形態によれば、ＳＥＱＩＤ番号１のシーケンスが

として与えられる。
【００４４】
特徴行列における特徴が計算されることができる。これらの特徴の名前は、表２に与えられる。特徴１〜４は、このシーケンスにおけるモノヌクレオチド、Ａ、Ｃ、Ｇ、Ｔの正規化された頻度である。特徴５〜２０は、ジヌクレオチド、即ちＡＡ、ＡＣ、ＡＧ、ＡＴ、ＣＡ、ＣＣ、ＣＧ、ＣＴ、ＧＡ、ＧＣ、ＧＧ、ＧＴ、ＴＡ、ＴＣ、ＴＧ、ＴＴの頻度である。特徴２１〜８４は、例えばＡＴＴ、ＡＴＡ、ＡＴＧといったトリヌクレオチドの正規化された頻度である。特徴８５〜１０３は、いわゆる熱力学的特徴と呼ばれる。特徴１０４〜１０７は、第２の構造特徴である。
【００４５】
以下は、ＳＥＱＩＤ１に関する特徴値であり、

となる。
【００４６】
同様に、ＳＥＱＩＤ２は、

であり、

という特徴を与える。
【表２】

【００４７】
規制酵素１５のリストが、プローブのセットに割り当てられる。このプローブは、アレイに付けられるとき、所望のフラグメントが信号を生み出す（即ち存在する）か、信号を生み出さない（即ち存在しない）かを確認することができる。プローブ選択に関して、（ここでも、用途についての知識に基づき）別々に開発されるハイブリダイゼーションモデルが適用されることができる。ＣｐＧアイランド・アレイに対して使用されるハイブリダイゼーションモデルのタイプは、比較ゲノム・ハイブリダイゼーションに関して使用されるモデルとは非常に異なることになる。
【００４８】
本発明による上記実施形態の用途及び使用は、様々であり、例えば生命科学における高スループット（ハイエンド）ディスカバリといった例示的な分野を含む。ここで、例えばＡｇｉｌｅｎｔ及びＲｏｃｈｅ（Ｎｉｍｂｌｅｇｅｎ）といった会社が、メチル化プロファイリングにおける高度実験に関するカスタムアレイ、ＤＮＡ−タンパク質交互作用（例えばヒストン修正）を研究するためのチップオンチップ実験に関するカスタムアレイを作っている。
【００４９】
同じ方法１００が、伝染病診断、遺伝学的スクリーニング、癌検査のための臨床診断法において使用される低コストのマイクロアレイを開発するために適用されることができる。例えばＧＥは、低コストのマイクロアレイ製品のラインを持つ。
【００５０】
上記のいくつかの実施形態による方法は、ユニットによって実行されることもできる。ユニットは、関連する作業を実行するのに通常使用される任意のユニット、例えばメモリを持つプロセッサといったハードウェアとすることができる。このプロセッサは、インテル又はＡＭＤプロセッサ、ＣＰＵ、マイクロプロセッサ、プログラマブル・インテリジェント・コンピュータ（ＰＩＣ）マイクロコントローラ、デジタル・シグナル・プロセッサ（ＤＳＰ）等の様々なプロセッサのいずれかとすることができる。しかしながら、本発明の範囲は、これらの特定のプロセッサに限定されるものではない。メモリは、情報を格納することができる任意のメモリとすることができる。例えば、倍密度ＲＡＭ（ＤＤＲ、ＤＤＲ２）、単密度ＲＡＭ（ＳＤＲＡＭ）、スタティックＲＡＭ（ＳＲＡＭ）、ダイナミックＲＡＭ（ＤＲＡＭ）、ビデオＲＡＭ（ＶＲＡＭ）等といったランダムアクセスメモリ（ＲＡＭ）とすることができる。メモリは、例えばＵＳＢといったフラッシュメモリ、コンパクトフラッシュ（登録商標）、スマートメディア、ＭＭＣメモリ、メモリスティック、ＳＤカード、ミニＳＤ、マイクロＳＤ、ｘＤカード、トランスフラッシュ及びマイクロドライブメモリ等とすることもできる。しかしながら、本発明の範囲は、これらの特定のメモリに限定されるものではない。
【００５１】
図２に記載の実施形態において、コンピュータ可読媒体２００が提供される。コンピュータ可読媒体２００は、この媒体上で実現される、プロセッサにより処理されるコンピュータプログラムを有する。このコンピュータプログラムは、ゲノム注釈１０及び所望のシーケンス１１に関する情報を第１のデータベース１２に保存するための第１のコードセグメント２０１と、第１のデータベース１２に格納される情報に規制酵素に関する情報を有する第２のデータベース１３を適用することにより、クエリシーケンス１４に関する表現行列を構築するための第２のコードセグメント２０１と、表現行列に基づき、規制酵素１５のリスト及びプロファイリング１６に関するシーケンスのリストを構築するための第３のコードセグメント２０３と、シーケンスのリストからＤＮＡアレイ１７を設計するための第４のコードセグメント２０４とを有する。
【００５２】
ある実施形態によれば、このコンピュータプログラムは、ＤＮＡアレイの検証に関するコンピュータ内でのプロトコルを設計するために使用される。
【００５３】
ある実施形態において、このコンピュータプログラムは、ＤＮＡメチル化アレイを検証する。別の実施形態によれば、このコンピュータプログラムは、遺伝子発現プロファイルを検証する。更なる実施形態によれば、このコンピュータプログラムは、ゲノムプロファイリングアレイを検証する。
【００５４】
ある実施形態によれば、コンピュータ内でのプロトコル設計に関するこのコンピュータプログラムは、臨床前又は実験的な研究における支援のための特殊なコンピュータの一部とすることができる。更なる実施形態によれば、このコンピュータプログラムは自動的な微小流体システムに結合されることができる。このシステムは、複数のウェルからの「ウェットな」入力を取る。入力の選択は、方法１００に基づき制御されることができる。
【００５５】
本発明は、ハードウェア、ソフトウェア、ファームウェア、又はこれらの任意の組み合わせを含む適切な形式で実現されることができる。しかしながら、好ましくは、本発明は、１つ又は複数のデータプロセッサ及び／又はデジタル信号プロセッサ上で実行されるコンピュータソフトウェアとして実現される。実施形態の要素及び部品は、任意の適切な方法で、物理的に、機能的に及び論理的に実現されることができる。実際、その機能は、単一のユニットで、複数のユニットで、又は他の機能ユニットの一部として実現されることができる。そのようなものとして、本発明は、単一のユニットで実現されることができるか、又は異なるユニット及びプロセッサ間に物理的及び機能的に分散されることができる。
【００５６】
図３に記載の実施形態において、あるデバイス３００が開示される。このデバイス３００は、いくつかの実施形態による方法１００を実行するためのユニットを有する。例えば、ＤＮＡアレイの検証を行う。このデバイス３００は、ゲノム注釈１０及び所望のシーケンス１１に関する情報を第１のデータベース１２に保存するよう構成される第１のユニット３０１を有する。このデバイス３００は更に、第１のデータベース１２に格納される情報に規制酵素に関する情報を有する第２のデータベース１３を適用することにより、クエリシーケンス１４に関する表現行列を構築するよう構成される第２のユニット３０２を有する。更に、このデバイス３００は、表現行列に基づき、規制酵素１５のリスト及びプロファイリング１６に関するシーケンスのリストを構築するよう構成される第３のユニット３０３を有する。最終的に、デバイス３００は、シーケンスのリストからＤＮＡアレイ１７を設計するよう構成される第４のユニット３０４を有する。
【００５７】
本発明が特定の実施形態を参照して上で説明されたが、これは、本書に記載される上記特定の形式に本発明が限定されることを目的とするものではない。むしろ、本発明は添付の請求項によってのみ限定され、上述した特定の実施形態以外の実施形態が、これらの添付した請求項の範囲内で同様に可能である。
【００５８】
特許請求の範囲において、「有する」という用語は、他の要素又はステップの存在を排除するものではない。更に、個別的に記載されていても、複数の手段、要素又は方法ステップが、例えば単一のユニット又はプロセッサにより実現されることもできる。更に、個別の特徴が異なる請求項に含まれることができるが、これらは可能であれば有利に結合されることができる。異なる請求項に含まれることは、これらの特徴の組み合わせが、実現できない及び／又は有利でないことを意味するものではない。更に、単数形の参照は、複数性を排除するものではない。「ａ」、「ａｎ」、「第１の」、「第２の」等の用語は、複数性を排除するものではない。請求項における参照符号は、単に明確化のための例として与えられ、請求項の範囲をいかなる態様でも限定するものとして解釈されるべきではない。

【特許請求の範囲】
【請求項１】
オリゴヌクレオチド・アレイの設計及び検証に関する方法において、
ゲノム注釈及び所望のシーケンスに関する情報を第１のデータベースに保存するステップと、
前記第１のデータベースに格納される前記情報に規制酵素に関する情報を有する第２のデータベースを適用することにより、クエリシーケンスに関する表現行列を構築するステップと、
前記表現行列に基づき、規制酵素のリスト及びプロファイリングに関するシーケンスのリストを構築するステップと、
前記プロファイリングに関するシーケンスのリストからオリゴヌクレオチド・アレイを設計するステップとを有する、方法。
【請求項２】
前記オリゴヌクレオチド・アレイを設計するステップが、
特定のオリゴヌクレオチド・アレイでの使用に適したシーケンスの第２のセットを生じさせるハイブリダイゼーションモデルを適用することにより、前記シーケンスのリストにおける前記シーケンスをランク付けするステップと、
前記オリゴヌクレオチド・アレイに関する所望のシーケンスを選択するステップとを有する、請求項１に記載の方法。
【請求項３】
前記ランク付けが、ヌクレオチド頻度コンテンツと、エキソンと、プロモータと、ｍｉＲＮＡと、ＣｐＧアイランドと、３'ＵＴＲと、（ヒストン）アセチル化アイランドと、特定のヒストン修正アイランドと、ＬＩＮＥＳ又はＳＩＮＥＳとの少なくとも１つに基づき実行される、請求項２に記載の方法。
【請求項４】
前記オリゴヌクレオチド・アレイが、プローブであるオリゴヌクレオチドを有するマイクロアレイである、請求項２又は３に記載の方法。
【請求項５】
前記第２のデータベースが更に、前記オリゴヌクレオチド・アレイを設計するのに適した規制酵素に関する情報及び／又は前記規制酵素が適用されることになる順番を有する、請求項１に記載の方法。
【請求項６】
オリゴヌクレオチド・アレイの検証に関するコンピュータ内でのプロトコルを設計するための、請求項５に記載の方法の使用。
【請求項７】
前記オリゴヌクレオチド・アレイが、オリゴヌクレオチド・メチル化アレイである、請求項１又は５に記載の方法。
【請求項８】
前記オリゴヌクレオチド・アレイが、遺伝子発現プロファイルである、請求項１又は５に記載の方法。
【請求項９】
前記オリゴヌクレオチド・アレイが、ゲノムプロファイリングアレイである、請求項１又は５に記載の方法。
【請求項１０】
前記ゲノムプロファイリングアレイが、シングルヌクレオチド多型アレイ又は遺伝子コピー数多型アレイである、請求項９に記載の方法。
【請求項１１】
プロセッサにより処理されるコンピュータプログラムを持つコンピュータ可読媒体であって、前記コンピュータプログラムが、
ゲノム注釈及び所望のシーケンスに関する情報を第１のデータベースに保存するための第１のコードセグメントと、
前記第１のデータベースに格納される前記情報に規制酵素に関する情報を有する第２のデータベースを適用することにより、クエリシーケンスに関する表現行列を構築するための第２のコードセグメントと、
前記表現行列に基づき、規制酵素のリスト及びプロファイリングに関するシーケンスのリストを構築するための第３のコードセグメントと、
前記シーケンスのリストからＤＮＡアレイを設計するための第４のコードセグメントとを有する、コンピュータ可読媒体。
【請求項１２】
オリゴヌクレオチド・アレイの検証に関するデバイスであって、
ゲノム注釈及び所望のシーケンスに関する情報を第１のデータベースに保存するよう構成される第１のユニットと、
前記第１のデータベースに格納される前記情報に規制酵素に関する情報を有する第２のデータベースを適用することにより、クエリシーケンスに関する表現行列を構築するよう構成される第２のユニットと、
前記表現行列に基づき、規制酵素のリスト及びプロファイリングに関するシーケンスのリストを構築するよう構成される第３のユニットと、
前記シーケンスのリストからオリゴヌクレオチド・アレイを設計するよう構成される第４のユニットとを有する、デバイス。

【図１】

【図２】

【図３】

【図４】

【図５】

【図６】

【図７】

【図８Ａ】

【図８Ｂ】

【図９Ａ】

【図９Ｂ】

【公表番号】特表２０１１−５２１６３６（Ｐ２０１１−５２１６３６Ａ）
【公表日】平成２３年７月２８日（２０１１．７．２８）
【国際特許分類】

【出願番号】特願２０１１−５１１１１９（Ｐ２０１１−５１１１１９）
【出願日】平成２１年５月１４日（２００９．５．１４）
【国際出願番号】ＰＣＴ／ＩＢ２００９／０５２００６
【国際公開番号】ＷＯ２００９／１４４６１１
【国際公開日】平成２１年１２月３日（２００９．１２．３）
【出願人】（５９００００２４８）コーニンクレッカ　フィリップス　エレクトロニクス　エヌ　ヴィ (12,071)
【出願人】（５１００４８０４８）

【Ｆターム（参考）】

[ Back to top ]

オリゴヌクレオチド・アレイの設計に関する方法

メニュー

スポンサーリンク

次の公報 »

« 前の公報

オリゴヌクレオチド・アレイの設計に関する方法

メニュー

スポンサー リンク

次の公報 »

« 前の公報

スポンサーリンク