Ｎ結合型グリカン構造を表すためのシステム及び方法

哺乳動物細胞培養物に由来する分泌性糖タンパク質中に一般に見出されるＮ結合型グリカン構造を表すための固定長英数コード。このコードは、予め割り当てられた英数の指標を使用することによって、異なる分枝でコアグリカン構造に結合した単糖を表す。本分岐−中心表示は、構造の可視化を可能にし、コードの数字的性質は、これを機械可読にする。差分演算子を定義することによって、さらなる分析のためにグリカン構造同士間を定量的に区別することができる。このコードは、検索可能な形式で情報管理システムに組み込むことができる。固定長の英数コードを使用して、オリゴ糖の少なくとも一部の構造を表すための方法も提供される。

【発明の詳細な説明】
【関連出願の相互参照】
【０００１】
[0001]本特許出願は、その全体が参照により本明細書に組み込まれている、２００７年６月１５日に出願された、米国特許仮出願第６０／９２９，１６３号明細書に基づき、この明細書からの優先権を主張する。
【発明の背景】
【０００２】
１．発明の分野
[0002]本発明は、コンピュータによって容易に記憶し、解釈することができる、グリカン構造を記述するためのシステムに関する。
【０００３】
２．関連技術
[0003]グリカンは、細胞中のいくつかの構造的機能及び調節機能において極めて重要な役割を果たすオリゴ糖の複雑な鎖である。グリカンは、ＤＮＡ及びタンパク質の後の最も重要なクラスの分子の１つと考えられているが、その研究を支え、進めるための情報科学的方法の開発は、他の種類のデータに利用可能なものより遅れている。グリカン構造及びその相互作用を分析するためのグリカンのデータベース及びアルゴリズムなどの情報科学資源の有用性が、ようやく近年になって増大してきた（ＰｅｒｅｚＳ、ＭｕｌｌｏｙＢ（２００５）「Ｐｒｏｓｐｅｃｔｓｆｏｒｇｌｙｃｏｉｎｆｏｒｍａｔｉｃｓ」、ＣｕｒｒＯｐｉｎＳｔｒｕｃｔＢｉｏｌ１５：５１７〜５２４（「Ｐｅｒｅｚら」）。そのような格差は、ＤＮＡ及びタンパク質のより単純な直線構造と比較して、炭水化物の構造的複雑性に主に起因する。ヌクレオチド及びアミノ酸残基は、それぞれ４個及び２０個の文字（ｌｅｔｔｅｒ）で表すことができるが、グリカン配列は、より大きな数の塩基残基から構成され、結合及び枝分れについての追加の情報を含む（ｖｏｎｄｅｒＬｉｅｔｈＣＷ（２００４）「Ａｎｅｎｄｏｒｓｅｍｅｎｔｔｏｃｒｅａｔｅｏｐｅｎｄａｔａｂａｓｅｓｆｏｒａｎａｌｙｔｉｃａｌｄａｔａｏｆｃｏｍｐｌｅｘｃａｒｂｏｈｙｄｒａｔｅｓ」、ＪＣａｒｂｏｈｙｄｒＣｈｅｍ２３：２７７〜２９７（「ｖｏｎｄｅｒＬｉｅｔｈＩ」）；ＬａｉｎｅＲＡ（１９９４）「Ａｃａｌｃｕｌａｔｉｏｎｏｆａｌｌｐｏｓｓｉｂｌｅｏｌｉｇｏｓａｃｃｈａｒｉｄｅｉｓｏｍｅｒｓｂｏｔｈｂｒａｎｃｈｅｄａｎｄｌｉｎｅａｒｙｉｅｌｄｓ１．０５×１０（１２）ｓｔｒｕｃｔｕｒｅｓｆｏｒａｒｅｄｕｃｉｎｇｈｅｘａｓａｃｃｈａｒｉｄｅ：ｔｈｅＩｓｏｍｅｒＢａｒｒｉｅｒｔｏｄｅｖｅｌｏｐｍｅｎｔｏｆｓｉｎｇｌｅ−ｍｅｔｈｏｄｓａｃｃｈａｒｉｄｅｓｅｑｕｅｎｃｉｎｇｏｒｓｙｎｔｈｅｓｉｓｓｙｓｔｅｍｓ」、Ｇｌｙｃｏｂｉｏｌｏｇｙ６：７５９〜７６７）。その結果、いくつかの研究プロジェクトは、他の研究者が自由に利用可能であり、種々の用途で相互運用可能にするグリカンデータを表す、適当なデジタル形式の欠如に悩まされている（ｖｏｎｄｅｒＬｉｅｔｈＣＷ、Ｂｏｈｎｅ−ＬａｎｇＡ、ＬｏｈｍａｎｎＫＫ、ＦｒａｎｋＭ（２００４）「Ｂｉｏｉｎｆｏｒｍａｔｉｃｓｆｏｒｇｌｙｃｏｍｉｃｓ：ｓｔａｔｕｓ，ｍｅｔｈｏｄｓ，ｒｅｑｕｉｒｅｍｅｎｔｓａｎｄｐｅｒｓｐｅｃｔｉｖｅｓ」、ＢｒｉｅｆＢｉｏｉｎｆｏｒｍ５：１６４〜１７８）。したがって、科学者によって容易に理解され、コンピュータによっても判読可能な、グリカン構造の表示のための、単純、柔軟で多用途のデータ形式を開発することが必要である（ＢｒａｚｍａＡ、ＫｒｅｓｔｙａｎｉｎｏｖａＭ、ＳａｒｋａｎｓＵ（２００６）「Ｓｔａｎｄａｒｄｓｆｏｒｓｙｓｔｅｍｓｂｉｏｌｏｇｙ」、ＮａｔＲｅｖＧｅｎｅｔ７：５９３〜６０５）。
【０００４】
[0004]現在、グリカン構造を記述するのに利用可能な数種の命名法が存在し、そのいくつかは図１ａ〜１ｄに例示されている。ＩＵＰＡＣ−ＩＵＢＭＢ（国際純正・応用化学連合及び国際生化学・分子生物学連合）では、グリカン構造を完全に記述するための拡張並びに省略されたテキスト形式が提供されている（ＭｃＮａｕｇｈｔＡＤ（１９９７）「Ｎｏｍｅｎｃｌａｔｕｒｅｏｆｃａｒｂｏｈｙｄｒａｔｅｓ」（ｒｅｃｏｍｍｅｎｄａｔｉｏｎｓ１９９６）．ＡｄｖＣａｒｂｏｈｙｄｒＣｈｅｍＢｉｏｃｈｅｍ５２：４３〜１７７）。省略された３文字コードは、個々の単糖単位を表し、それぞれの単位は、アノマーの記述子、並びに立体化学及び連結情報を伴う。しかし、ＩＵＰＡＣ記述は不明瞭であり、コンピュータで判読可能な形式ですべてのグリカンを包括的に記述するのに十分ではない。この制約を克服するために、ＬＩＮＵＣＳ（ＬＩｎｅａｒＮｏｔａｔｉｏｎｆｏｒＵｎｉｑｕｅｄｅｓｃｒｉｐｔｉｏｎｏｆＣａｒｂｏｈｙｄｒａｔｅＳｅｑｕｅｎｃｅ；炭水化物配列のユニークな記述のための線形表記法）が、グリコシド結合情報とともにＩＵＰＡＣ記述を拡張することによって、グリカンの線形表示を作り出すために開発された（Ｂｏｈｎｅ−ＬａｎｇＡ、ＬａｎｇＥ、ＦｏｒｓｔｅｒＴ、ｖｏｎｄｅｒＬｉｅｔｈＣＷ（２００１）「ＬＩＮＵＣＳ：ｌｉｎｅａｒｎｏｔａｔｉｏｎｆｏｒｕｎｉｑｕｅｄｅｓｃｒｉｐｔｉｏｎｏｆｃａｒｂｏｈｙｄｒａｔｅｓｅｑｕｅｎｃｅｓ」、ＣａｒｂｏｈｙｄｒＲｅｓ３３６：１〜１１）。別の利用可能な形式は、Ｇｌｙｃｏｍｉｎｄｓのリニアコード（ＬｉｎｅａｒＣｏｄｅ）（商標）であり、これは、枝分れの順序を求めるために特別な参照表を活用する（ＢａｎｉｎＥ、ＮｅｕｂｅｒｇｅｒＹ、ＡｌｔｓｈｕｌｅｒＹ、ＨａｌｅｖｉＡ、ＩｎｂａｒＯ、ＮｉｒＤ、ＤｕｋｌｅｒＡ（２００２）「Ａｎｏｖｅｌｌｉｎｅａｒｃｏｄｅｎｏｍｅｎｃｌａｔｕｒｅｆｏｒｃｏｍｐｌｅｘｃａｒｂｏｈｙｄｒａｔｅｓ」、ＴｒｅｎｄｓＧｌｙｃｏｓｃｉＧｌｙｃｏｔｅｃｈｎｏｌ１４：１２７〜１３７）。単糖単位及び連結は、この表示では１〜２文字によって表される。最近、データ記述言語として評判が高まりつつあるＸＭＬは、ＧＬＹＤＥなどのＸＭＬに基づくグリカン構造の表示の提案につながった（ＳａｈｏｏＳＳ、ＴｈｏｍａｓＣ、ＳｈｅｔｈＡ、ＨｅｎｓｏｎＣ、ＹｏｒｋＷＳ（２００５）「ＧＬＹＤＥ−ａｎｅｘｐｒｅｓｓｉｖｅＸＭＬｓｔａｎｄａｒｄｆｏｒｔｈｅｒｅｐｒｅｓｅｎｔａｔｉｏｎｏｆｇｌｙｃａｎｓｔｒｕｃｔｕｒｅ」、ＣａｒｂｏｈｙｄｒＲｅｓ３４０：２８０２〜２８０７）、及びＣａｂｏｓＭＬ（ＫｉｋｕｃｈｉＮ、ＫａｍｅｙａｍａＡ、ＮａｋａｙａＳ、ＩｔｏＨ、ＳａｔｏＴ、ＳｈｉｋａｎａｉＴ、ＴａｋａｈａｓｈｉＹ、ＮａｒｉｍａｔｓｕＨ（２００５）「Ｔｈｅｃａｒｂｏｈｙｄｒａｔｅｓｅｑｕｅｎｃｅｍａｒｋｕｐｌａｎｇｕａｇｅ（ＣａｂｏｓＭＬ）：ａｎＸＭＬｄｅｓｃｒｉｐｔｉｏｎｏｆｃａｒｂｏｈｙｄｒａｔｅｓｔｒｕｃｔｕｒｅｓ」、Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ２１：１７１７〜１７１８）。グリカン構造を記述するのに利用可能な追加の形式も存在し、これは他で概説されている（Ｐｅｒｅｚら；ｖｏｎｄｅｒＬｅｉｔｈＩ；ＴｏｕｋａｃｈＰ、ＪｏｓｈｉＨＪ、ＲａｎｚｉｎｇｅｒＲ、ＫｎｉｒｅｌＹ、ｖｏｎｄｅｒＬｉｅｔｈＣＷ（２００７）「Ｓｈａｒｉｎｇｏｆｗｏｒｌｄｗｉｄｅｄｉｓｔｒｉｂｕｔｅｄｃａｒｂｏｈｙｄｒａｔｅ−ｒｅｌａｔｅｄｄｉｇｉｔａｌｒｅｓｏｕｒｃｅｓ：ｏｎｌｉｎｅｃｏｎｎｅｃｔｉｏｎｏｆｔｈｅｂａｃｔｅｒｉａｌｃａｒｂｏｈｙｄｒａｔｅｓｔｒｕｃｔｕｒｅｄａｔａｂａｓｅａｎｄＧＬＹＣＯＳＣＩＥＮＣＥＳ．ｄｅ」、ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ３５：Ｄ２８０〜２８６）。
【０００５】
[0005]哺乳動物細胞株は、組換えタンパク質を作製するのに理想的であり、これは、グリコシル化などの翻訳後修飾を必要とする。グリコシル化は、様々な生物学的特性、例えば折り畳み、安定性及び効力などに対する効果を有するので、分泌性タンパク質の質は、結合したグリカン構造の一貫性に依存する。したがって、タンパク質グリコシル化の多様性を制御する取組みにおいて複雑なグリコシル化反応経路を研究することは、非常に活発な領域の研究である。
【０００６】
[0006]本発明は、これら及び他の課題を解決することに関する。
【発明の概要】
【０００７】
[0007]したがって、本発明の主な目的は、コンピュータによって容易に記憶し、解釈することができる、グリカン構造を記述するためのコンパクトな表記法を提供することである。
【０００８】
[0008]本発明の別の目的は、これらの複雑な経路を研究するためのコンピュータ支援分析手段の開発を促進することができる、グリカン構造の簡素化された英数（ａｌｐｈａ−ｎｕｍｅｒｉｃａｌ）表示を提供することである。
【０００９】
[0009]本発明のさらに別の目的は、テキストベースの表示と差し替えることができる、グリカン構造の簡素化された英数表示を提供することである。
【００１０】
[00010]本発明のさらに別の目的は、オリゴ糖の少なくとも一部の構造を表すための方法を提供することである。
【００１１】
[00011]本発明のこれら及び他の目的は、チャイニーズハムスター卵巣（ＣＨＯ）細胞などの操作された哺乳動物細胞株由来の分泌性糖タンパク質中に一般に観察されるＮ結合型グリカン構造を記述するための、以下で「ＧｌｙｃｏＤｉｇｉｔコード」と呼ぶ英数コードによって実現される。
【００１２】
[00012]本発明の一態様では、６字（ｃｈａｒａｃｔｅｒ）の英数コードを使用することによって、コア構造の異なる分岐に結合した単糖鎖に基づいてグリカン構造を記述する。本発明の別の態様では、ＧｌｙｃｏＤｉｇｉｔコードにおける構造は、１４字の全固定長に対して７つのディジット（ｄｉｇｉｔ）−文字対によって表される。英数コードの数字成分により、それぞれ構造についてのユニークな英数コードに基づいてグリカンを簡便に比較するための差分演算子及びアルゴリズムの開発が可能になる。
【００１３】
[00013]本発明の他の目的、特徴、及び利点は、添付の図面を含めた本明細書を読むことによって当業者に明らかとなるであろう。
【００１４】
[00014]本発明は、添付の図面を参照して、好適な実施形態の以下の詳細な説明を読むことによってより良好に理解され、図面中、同じ参照数字は、全体にわたって同じ要素を指す。
【図面の簡単な説明】
【００１５】
【図１ａ】絵を用いて構造を表すためにオックスフォード糖鎖生物学研究所（ＵＫ）によって提案された命名法から採用された記号を使用した、Ｎ結合型グリカン構造の記号表示を示す図である。
【図１ｂ】図１ａのＮ結合型グリカン構造のフルワード表示を示す図である。
【図１ｃ】ＬＩＮＵＣＳ形式を使用した、図１ａのＮ結合型グリカン構造の表示を示す図である。
【図１ｄ】リニアコード（商標）を使用した、図１ａのＮ結合型グリカン構造の表示を示す図である。
【図２】糖の追加の分岐が結合することができる可能な部位とともに、共通の五糖コア構造を共有するすべてのＮ結合型グリカンに共通の五糖コア構造を表す図である。
【図３】図２のコア構造からの可能な枝分れ、及び本発明のＧｌｙｃｏＤｉｇｉｔコードの第１の実施形態による６字の英数コードについてそれぞれのディジットのアンテナリーへの対応位置を示す図である。
【図４ａ】複合Ｎ結合型グリカンを絵で表した表示、及び本発明によるＧｌｙｃｏＤｉｇｉｔコードの第１の実施形態を使用した、その対応表示を示す図である。
【図４ｂ】高マンノースＮ結合型グリカンを絵で表した表示、及び本発明によるＧｌｙｃｏＤｉｇｉｔコードの第１の実施形態を使用した、その対応表示を示す図である。
【図４ｃ】ハイブリッドＮ結合型グリカンを絵で表した表示、及び本発明によるＧｌｙｃｏＤｉｇｉｔコードの第１の実施形態を使用した、その対応表示を示す図である。
【図５ａ】複合Ｎ結合型グリカンを絵で表した表示、及び本発明によるＧｌｙｃｏＤｉｇｉｔコードの第２の実施形態を使用した、その対応表示を示す図である。
【図５ｂ】高マンノースＮ結合型グリカンを絵で表した表示、及び本発明によるＧｌｙｃｏＤｉｇｉｔコードの第２の実施形態を使用した、その対応表示を示す図である。
【図５ｃ】ハイブリッドＮ結合型グリカンを絵で表した表示、及び本発明によるＧｌｙｃｏＤｉｇｉｔコードの第２の実施形態を使用した、その対応表示を示す図である。
【図６ａ】本発明によるＧｌｙｃｏＤｉｇｉｔコードの第２の実施形態を使用した、図６ａに表した複合型構造について、対応するＧｌｙｃｏＤｉｇｉｔコードの段階的表示を例示する図である。
【図６ｂ】本発明によるＧｌｙｃｏＤｉｇｉｔコードの第２の実施形態を使用した、図６ａに表した複合型構造について、対応するＧｌｙｃｏＤｉｇｉｔコードの段階的表示を例示する図である。
【図６ｃ】本発明によるＧｌｙｃｏＤｉｇｉｔコードの第２の実施形態を使用した、図６ａに表した複合型構造について、対応するＧｌｙｃｏＤｉｇｉｔコードの段階的表示を例示する図である。
【図６ｄ】本発明によるＧｌｙｃｏＤｉｇｉｔコードの第２の実施形態を使用した、図６ａに表した複合型構造について、対応するＧｌｙｃｏＤｉｇｉｔコードの段階的表示を例示する図である。
【図６ｅ】本発明によるＧｌｙｃｏＤｉｇｉｔコードの第２の実施形態を使用した、図６ａに表した複合型構造について、対応するＧｌｙｃｏＤｉｇｉｔコードの段階的表示を例示する図である。
【図６ｆ】本発明によるＧｌｙｃｏＤｉｇｉｔコードの第２の実施形態を使用した、図６ａに表した複合型構造について、対応するＧｌｙｃｏＤｉｇｉｔコードの段階的表示を例示する図である。
【図７】本発明の第１の実施形態による、２つのグリカンの対応するＧｌｙｃｏＤｉｇｉｔコードを使用して、この２つのグリカンの間の構造的な差異を見出すために差分演算子を使用することを例示する図である。
【図８】本発明の第２の実施形態による複合グリカン構造とハイブリッドＮ結合型グリカン構造の対応するＧｌｙｃｏＤｉｇｉｔコードを使用して、これらのグリカン構造の間の構造的な差異を見出すために差分演算子を使用することを例示する図である。
【図９】本発明によるＧｌｙｃｏＤｉｇｉｔコードの第１の実施形態を使用した、１つの構造を別の構造に変換するのに必要な２つのグリカン及び反応ステップを示す図である。
【図１０】グリカン反応の隣接行列にデータを入れるのに使用される、ｉｓｒｘｎ及びｒｘｍ行列関数についての擬似コードを示す図である。
【図１１ａ】階層的な様式で配列された、６４の２分岐グリカンの縮小したデータセットについてのグリカン及び反応リンクのネットワークの可視化の図である。
【図１１ｂ】図１１ａ中で１１ｂと示された範囲の拡大図である。
【図１２ａ】階層的な様式で配列された、ＣＨＯ細胞中で一般に分泌される１０２４種の複合型グリカンについての全体のグリコシル化ネットワークの可視化の図である。
【図１２ｂ】図１２ａ中で１２ｂと示された範囲の拡大図である。
【図１２ｃ】図１２ｂ中で１２ｃと示された範囲の拡大図である。
【図１３】図１ａ、２、３、４ａ〜４ｃ、５ａ〜５ｆ、６ａ〜６ｆ、７、８、及び９において使用される記号についての凡例である。
【好適な実施形態の詳細な説明】
【００１６】
[00038]図面に例示された本発明の好適な実施形態を説明することにおいて、特定の専門用語が明確さの目的で使用される。しかし、本発明は、そのように選択された特定の専門用語に限定されることは意図されておらず、それぞれの特定の要素は、同様の目的を果たすのに同様の様式で機能するすべての技術的な均等物を含むことが理解されるべきである。
【００１７】
[00039]方法
[00040]本発明の一態様は、オリゴ糖の少なくとも一部の構造を表すための方法である。表示は、コンピュータで容易に記憶され、分析されるものであることが好ましい。以下に説明される本発明の方法は、本明細書に記載される特定の「ＧｌｙｃｏＤｉｇｉｔ」コードを作成するのに適用することができるが、オリゴ糖の構造の異なる表示を作成するのにも適用することができることが理解されるであろう。
【００１８】
[00041]本発明の方法の第１の部分では、表示システムを作成し、以下のステップを含む。
[00042]（ａ）基本オリゴ糖構造を選択するステップと；
[00043]（ｂ）ステップ（ａ）で選択された基本構造上のいくつかの可能な置換ポイント（ｓｕｂｓｔｉｔｕｔｉｏｎｐｏｉｎｔ）を識別し、位置をそれぞれのポイントに割り当てるステップと；
[00044]（ｃ）ステップ（ｂ）からの置換ポイントに２字コードを割り当てるステップであり、「字」は任意のユニークな識別子を意味し、２字コードは、１番目の字及び２番目の字を有する、割り当てるステップと；
[00045]（ｄ）１番目の字及び２番目の字が一緒に、ステップ（ｂ）で識別された特定の置換ポイント上の残基を一意的に識別するように、２字コードの１番目の字に対して１つ又は複数のユニークな識別子、及び２字の２番目の字に対して１つ又は複数のユニークな識別子を割り当てるステップと；
[00046]（ｅ）ステップ（ｂ）で識別されたそれぞれの置換ポイントが、その置換ポイントについての可能な残基を識別する１組の２字コードを有するように、それぞれの置換ポイントについてステップ（ｄ）を繰り返すステップ。
【００１９】
[00047]ステップ（ａ）では、基本オリゴ糖構造が選択される。この基本構造は、対象とする非常に多数のオリゴ糖構造中に存在するものであることが好ましい。基本構造が「より大きい」ほど（即ち、対象とするオリゴ糖中の共通の構造的特徴の数がより大きいほど）表示システムの複雑さは小さくてすむ。
【００２０】
[00048]ステップ（ｂ）では、基本構造上のそれぞれの可能な置換ポイントが識別される。一般に、それぞれの可能な置換ポイントに、１〜ｘの数字が割り当てられ、これは、最終の構造的表現における位置に対応することになる。置換ポイントの数が大きいほど、この方法は、より複雑な構造を表すことができる。ステップ（ｃ）では、２字コードが選択され、「字」は、任意のユニークな識別子を意味する。一般に、１つの字（ｃｈａｒａｃｔｅｒ）は数字であり、１つは文字（ｌｅｔｔｅｒ）であるが、両方とも数字又は文字とすることができる。非ローマアルファベット、例えば、ロシア語、ギリシャ語、ヘブライ語なども使用することができる。
【００２１】
[00049]ステップ（ｄ）では、ステップ（ｃ）で選択された字の意味が割り当てられる。この例は、ＧｌｙｃｏＤｉｇｉｔコードに関して以下に詳細に論じるが、任意のシステムを使用することができる。それぞれの２字分類についての意味の組合せは、それぞれの予め選択された置換ポイントに存在する残基を具体的に定義するのに使用される。識別子は、対象とするすべてのものが網羅される限り、特定の置換ポイントのあらゆる１個の可能な残基を識別できる必要はないことに注意することは重要である。ステップ（ｅ）では、ステップ（ｂ）で識別されたそれぞれの置換ポイントについて、ステップ（ｄ）が繰り返される。
【００２２】
[00050]請求項に記載の方法の第２の部分では、上記で開発したシステムを特定のオリゴ糖に適用することを含む。
【００２３】
[00051]（ｆ）ステップ（ａ）で選択された基本オリゴ糖構造、及び場合によりその基本構造上の１つ又は複数の残基を含むオリゴ糖構造の構造を再検討するするステップと；
[00052]（ｇ）２字コードを、ステップ（ｆ）のオリゴ糖構造上の残基に割り当てることによって、ステップ（ｄ）及び（ｅ）で開発した２字コードを一致させ、これらをステップ（ｂ）で割り当てた位置に記録するステップ。
【００２４】
[00053]以下に詳細に説明されるＧｌｙｃｏＤｉｇｉｔコードは、この方法を使用して適用することができることが、当業者に明らかとなるであろう。
【００２５】
[00054]Ｎ結合型グリカン構造
[00055]Ｎ結合型グリコシル化は、図２に表した共通の五糖コア構造を共有するＮ結合型グリカンを有するすべての真核細胞において起こる。いくつかの単糖鎖は、様々なグリコシルトランスフェラーゼ酵素の作用によって、異なる連結位置でこのコア構造に結合することができる。Ｎ結合型グリカン構造は、高マンノース、複合、又はハイブリッドの亜型であることができる。高マンノースＮ結合型グリカンは、コア構造に連結したマンノース（Ｍａｎ）残基のみを含む一方、複合Ｎ結合型グリカンは、コアに結合したＮ−アセチルグルコサミン（ＧｌｃＮＡｃ）残基を有する。ハイブリッド亜型は、ＧｌｃＮＡｃ及び非置換マンノース残基の両方を有する分岐を含む。（ＶａｒｋｉＡら（編）（１９９９）Ｅｓｓｅｎｔｉａｌｓｏｆｇｌｙｃｏｂｉｏｌｏｇｙ．ＮｅｗＹｏｒｋ（ＵＳＡ）：ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒＬａｂｏｒａｔｏｒｙＰｒｅｓｓ（「Ｖａｒｋｉら」）。
【００２６】
[00056]図４ａ〜４ｃに示した本発明の第１の実施形態では、６字の英数コードが使用されることによって、図２に示されたコア構造の異なる分岐に結合した単糖鎖に基づいてグリカン構造が記述される。最初の４つの字は、上部及び下部のコアマンノース残基に連結した４つの可能なアンテナリーに対応する一方、５番目及び６番目の字は、それぞれバイセクティング（ｂｉｓｅｃｔｉｎｇ）ＧｌｃＮＡｃ及びフコース基を表す。図３は、コア構造からの可能な枝分れ、またアンテナリーについてのそれぞれの字の対応位置を示す。
【００２７】
[00057]分岐が複合型である場合、最初の４つの分岐は奇数で表される一方、高マンノース分岐は文字で表される。ＧｌｃＮＡｃ、ガラクトース又はノイラミン酸残基として終止する複合分岐は、それぞれ数字３、５又は７で表される。ハイブリッド及び高マンノースＮ結合型グリカンのマンノース残基は、文字Ａ〜Ｆで表され、それぞれの文字は、偶数、即ち、Ａ＝２、Ｂ＝４、Ｃ＝６などとして指定される。それぞれの分岐について、文字値は、その分岐に結合したマンノース残基の数の２倍に相当し、即ち、Ａ＝２は、１個のマンノース残基が結合していることを意味し、Ｂ＝４は、２個のマンノース残基が結合していることを意味するなどである。５番目及び６番目の字は、それぞれ、バイセクティングＧｌｃＮＡｃ及びフコース残基が存在する場合、３の値を有する。分岐が存在しない場合、その対応するディジットは１である。構造に結合することができ、複合分岐と高マンノース分岐の組合せが可能であるマンノース残基の数を限定するさらなる法則が定義される。これらの定義から、ＧｌｙｃｏＤｉｇｉｔコードは、５１００グリカンの構造を記述するのに使用することができる。
【００２８】
[00058]グリコシルトランスフェラーゼは、グリカン構造に１回に１個の単糖を順次付加する酵素である。６種のＧｌｃＮＡｃトランスフェラーゼ（ＧｌｃＮＡｃＴＩ〜ＶＩ）は、異なる連結で３個のコアマンノースにＧｌｃＮＡｃを付加することができる。図２に示すように、α１−３連結コアマンノース上で、ＧｌｃＮＡｃＴＩ及びＩＶはそれぞれβ１−２及びβ１−４連結で残基を付加する。同様に、α１−６マンノース上で、ＧｌｃＮＡｃＴＩＩ、Ｖ及びＶＩは、β１−２、β１−６及びβ１−４連結残基を結合する。さらに、１つのバイセクティングＧｌｃＮＡｃは、β１−４連結を介して中央のコアマンノースに結合することができる（ＣａｍｐｂｅｌｌＣ、ＳｔａｎｌｅｙＰ（１９８４）「ＡｄｏｍｉｎａｎｔｍｕｔａｔｉｏｎｔｏｒｉｃｉｎｒｅｓｉｓｔａｎｃｅｉｎＣｈｉｎｅｓｅｈａｍｓｔｅｒｏｖａｒｙｃｅｌｌｓｉｎｄｕｃｅｓＵＤＰ−ＧｌｃＮＡｃ：ｇｌｙｃｏｐｅｐｔｉｄｅｂｅｔａ−４−Ｎ−ａｃｅｔｙｌｇｌｕｃｏｓａｍｉｎｙｌｔｒａｎｓｆｅｒａｓｅＩＩＩａｃｔｉｖｉｔｙ」、ＪＢｉｏｌＣｈｅｍ２５９：１３３７０〜１３３７８；ＳｂｕｒｌａｔｉＡＲ、ＵｍａｎａＰ、ＰｒａｔｉＥＧ、ＢａｉｌｅｙＪＥ（１９９８）「ＳｙｎｔｈｅｓｉｓｏｆｂｉｓｅｃｔｅｄｇｌｙｃｏｆｏｒｍｓｏｆｒｅｃｏｍｂｉｎａｎｔＩＦＮ−ｂｅｔａｂｙｏｖｅｒ−ｅｘｐｒｅｓｓｉｏｎｏｆｂｅｔａ−１，４−Ｎ−ａｃｅｔｙｌｇｌｕｃｏｓａｍｉｎｙｌｔｒａｎｓｆｅｒａｓｅＩＩＩｉｎＣｈｉｎｅｓｅｈａｍｓｔｅｒｏｖａｒｙｃｅｌｌｓ」、ＢｉｏｔｅｃｈｎｏｌＰｒｏｇ１４：１８９〜１９２（「Ｓｂｕｒｌａｔｉら」）；ＵｍａｎａＰ、Ｊｅａｎ−ＭａｉｒｅｔＪ、ＭｏｕｄｒｙＲ、ＡｍｓｔｕｔｚＨ、ＢａｉｌｅｙＪＥ（１９９９）「ＥｎｇｉｎｅｅｒｅｄｇｌｙｃｏｆｏｒｍｓｏｆａｎａｎｔｉｎｅｕｒｏｂｌａｓｔｏｍａＩｇＧ１ｗｉｔｈｏｐｔｉｍｉｚｅｄａｎｔｉｂｏｄｙ−ｄｅｐｅｎｄｅｎｔｃｅｌｌｕｌａｒｃｙｔｏｔｏｘｉｃａｃｔｉｖｉｔｙ」、ＮａｔＢｉｏｔｅｃｈｎｏｌ１７：１７６〜１８０（「Ｕｍａｎａら」））。最後に、フコース残基は、タンパク質上でアスパラギンアミノ酸に接続するコアＧｌｃＮＡｃにα１−６連結で結合することができる（Ｖａｒｋｉら）。
【００２９】
[00059]これらの７つの可能な連結部位に基づくと、図５ａ〜５ｃに示される本発明の第２の実施形態では、ＧｌｙｃｏＤｉｇｉｔコードは、７つのディジット−文字対を使用することによってグリカン構造を表す。ＧｌｙｃｏＤｉｇｉｔコードの第２の実施形態におけるそれぞれのディジット−文字対は、図２に例示されたコア構造から接続される分岐に対応する。最初の６つのディジット−文字対は、上部及び下部のコアマンノース残基に連結された６つの可能な分岐に対応する。マンノース同士間のバイセクティングＧｌｃＮＡｃは、６番目のディジット−文字対で表され、最後の７番目の位置は、フコース分子に対応し、これはコア又は周辺部のＧｌｃＮＡｃ残基に結合することができる。それぞれの対のディジット部分は、その分岐に結合された単糖の数に相当する一方、文字は、付加される連結の型及び特定の糖分子についての追加の情報を含む表に対する指標として機能を果たす。
【００３０】
[00060]表１は、ＧｌｙｃｏＤｉｇｉｔコードの第２の実施形態において、それぞれのディジット−文字対がどの連結に対応するかを列挙するものである。高マンノース構造及びハイブリッド構造は、最初の４つのディジット−文字対を使用して表すことによって、図２に示したようなコア構造中の２つのマンノース残基のそれぞれに結合した、α１−２、α１−３、及びα１−６連結マンノース鎖に対応することができる。複合分岐と高マンノース分岐を区別するために、マンノース残基の数は、数字の代わりに文字で表される。したがって、１つのＧｌｃＮＡｃ分子を含む分岐は、「１ａ」で表される一方、１つのマンノース残基を含む分岐は、「Ａａ」で表される。より後出の文字は、分岐中のマンノースのより高い数字、即ち、Ｂ＝２、Ｃ＝３、Ｄ＝４などに対応する。特定の分岐連結にグリカンがまったく結合していない場合、これは、「０ｘ」と表される。文字「ｕ」は、未知の連結で結合している単糖を表すために確保されている。バイセクティングＧｌｃＮＡｃを表す６番目のディジット−文字対について、結合した分子が存在するかしないかによって、２つの可能な値、即ち、「０ｘ」又は「１ａ」だけが存在する。最後のディジット−文字対は、コア構造に結合したフコース残基、又は分岐ＧｌｃＮＡｃ分子に結合した任意の周辺部フコースの数をカウントするのに使用される。構造に付加することができるグリカンの型についてのさらなる詳細は、以下に説明する。
【００３１】
【表１】

【００３２】
[00061]ＧｌｃＮＡｃ、ガラクトース及びポリラクトサミン鎖
[00062]ＧｌｃＮＡｃ残基がコア構造に付加された後、いくつかの他の単糖はそれに順次結合することができる。ガラクトース（Ｇａｌ）残基は、β１−４連結を介してＧｌｃＮＡｃに結合され、次いでこの分岐は、表２に列挙されるように「２ａ」と表される。このＧａｌβ１−４ＧｌｃＮＡｃ構造はラクトサミン単位と呼ばれ、追加のラクトサミン単位は、β１−３連結を介して最初の構造に結合することによって、ポリラクトサミン鎖を形成することができる。ＧｌｙｃｏＤｉｇｉｔコードの第２の実施形態では、最大４つのラクトサミン単位が１つの分岐中に存在することが可能である。最初のＧｌｃＮＡｃ及びガラクトース部分は個々に付加することができるが、さらなる付加は、これらは１つのラクトサミン単位として一緒に付加されなければならないという点において制限される。この事実は表２に反映されており、ラクトサミン単位のみを含む分岐についてのディジットの値は、偶数に割り当てられている。したがって、２つのラクトサミン単位を含む分岐は、「４ａ」で表され、３つの単位は「６ａ」で表されるなどである。ガラクトースは、β１−３連結を介してＧｌｃＮＡｃ結合することによって、ネオラクトサミン単位を形成することもできる（Ｖａｒｋｉら）。ＧｌｙｃｏＤｉｇｉｔコードでは、ネオラクトサミン単位を繰り返すことは可能ではなく、最初の単位は、表２に列挙されるように「２ｂ」で表される。最外側のガラクトースは、それに結合したフコース又はシアル酸などの最終単糖を有することができる。
【００３３】
【表２】

【００３４】
[00063]末端残基
[00064]分岐中の最外側のガラクトース残基は、いくつかの末端単糖によってキャップすることができる。ＧｌｙｃｏＤｉｇｉｔコードの第２の実施形態において、ガラクトース単位の存在を意味するのに偶数が使用されているので、異なる末端の糖を表すのに奇数（３、５、７及び９）が使用される。表３にいくつかの異なる連結位置で最外側のガラクトースに付加することができる単糖を列挙する。
【００３５】
【表３】

【００３６】
[00065]シアル酸は、最外側のガラクトースに付加される最も一般的な型のグリカンであり、α２−３又はα２−６連結で結合されることが多い。シアル酸ファミリーは非常に様々であるが、Ｎ−アセチルノイラミン酸（ＮｅｕＮＡｃ）及びＮ−グリコリルノイラミン酸（ＮｅｕＧｃ）は、最も一般的に観察されるシアル酸である。マウスは、ほとんど専らＮｅｕＧｃを含む糖タンパク質を産生するが、ＣＨＯ細胞は、大部分のＮｅｕＮＡｃと少量のＮｅｕＧｃの混合物である（ＢａｋｅｒＫＮ、ＲｅｎｄａｌｌＭＨ、ＨｉｌｌｓＡＥ、ＨｏａｒｅＭ、ＦｒｅｅｄｍａｎＲＢ、ＪａｍｅｓＤＣ（２００１）「ＭｅｔａｂｏｌｉｃｃｏｎｔｒｏｌｏｆｒｅｃｏｍｂｉｎａｎｔｐｒｏｔｅｉｎＮ−ｇｌｙｃａｎｐｒｏｃｅｓｓｉｎｇｉｎＮＳ０ａｎｄＣＨＯｃｅｌｌｓ」、ＢｉｏｔｅｃｈｎｏｌＢｉｏｅｎｇ７３：１８８〜２０２）。ＮｅｕＧｃはヒトにはなく、これを含む糖タンパク質は、ヒトに対して実際に免疫原性である（ＩｒｉｅＡ、ＫｏｙａｍａＳ、ＫｏｚｕｔｓｕｍｉＹ、ＫａｗａｓａｋｉＴ、ＳｕｚｕｋｉＡ（１９９８）「ＴｈｅｍｏｌｅｃｕｌａｒｂａｓｉｓｆｏｒｔｈｅａｂｓｅｎｃｅｏｆＮ−ｇｌｙｃｏｌｙｌｎｅｕｒａｍｉｎｉｃａｃｉｄｉｎｈｕｍａｎｓ」、ＪＢｉｏｌＣｈｅｍ２７３：１５８６６〜１５８７１）。表３では、様々な連結でのＮｅｕＮＡｃ及びＮｅｕＧｃを表すのに、文字「ａ」〜「ｆ」が割り当てられている。α２−３シアル酸に結合するα２−８連結シアル酸は、ＧｌｙｃｏＤｉｇｉｔコードの第２の実施形態では現在表されていない。
【００３７】
[00066]最外側のガラクトースに結合することができる他の末端残基は、フコース（文字「ｇ」で表される）及び追加のα１−３連結ガラクトース（文字「ｈ」で表される）である。α１−２連結で末端ガラクトースに結合したフコース単位は、ルイスＹ及びルイスＢ抗原などのいくつかの血液型抗原において見出される（Ｖａｒｋｉら）。マウス細胞中のα１−３ガラクトシル−トランスフェラーゼ酵素は、追加の末端ガラクトース残基を、β１−４連結ガラクトースに結合する（ＢｕｔｌｅｒＭ（２００６）「Ｏｐｔｉｍｉｓａｔｉｏｎｏｆｔｈｅｃｅｌｌｕｌａｒｍｅｔａｂｏｌｉｓｍｏｆｇｌｙｃｏｓｙｌａｔｉｏｎｆｏｒｒｅｃｏｍｂｉｎａｎｔｐｒｏｔｅｉｎｓｐｒｏｄｕｃｅｄｂｙｍａｍｍａｌｉａｎｃｅｌｌｓｙｓｔｅｍｓ」、Ｃｙｔｏｔｅｃｈｎｏｌｏｇｙ５０：５７〜７６）。このＧａｌα１−３Ｇａｌβ１−４ＧｌｃＮＡｃ構造は、ヒトにおいて高度に免疫原性である（ＪｅｎｋｉｎｓＮ、ＰａｒｅｋｈＲＢ、ＪａｍｅｓＤＣ（１９９６）「Ｇｅｔｔｉｎｇｔｈｅｇｌｙｃｏｓｙｌａｔｉｏｎｒｉｇｈｔ：ｉｍｐｌｉｃａｔｉｏｎｓｆｏｒｔｈｅｂｉｏｔｅｃｈｎｏｌｏｇｙｉｎｄｕｓｔｒｙ」、ＮａｔＢｉｏｔｅｃｈｎｏｌ１４：９７５〜９８１）。
【００３８】
[00067]フコシル化
[00068]ＧｌｙｃｏＤｉｇｉｔコードの第２の実施形態における最後のディジット−文字対は、コアＧｌｃＮＡｃ上、及びコア構造に結合した分岐中の最外側のＧｌｃＮＡｃ残基上のフコシル化を表すのに使用される。フコースは、α１−６連結を介してコアＧｌｃＮＡｃ残基に結合されるが、周辺部のフコシル化は、α１−３又はα１−４連結を介して起こり得る（ＭａＢ、Ｓｉｍａｌａ−ＧｒａｎｔＪＬ、ＴａｙｌｏｒＤＥ（２００６）「Ｆｕｃｏｓｙｌａｔｉｏｎｉｎｐｒｏｋａｒｙｏｔｅｓａｎｄｅｕｋａｒｙｏｔｅｓ」、Ｇｌｙｃｏｂｉｏｌｏｇｙ１６：１５８Ｒ〜１８４Ｒ）。このディジット−文字対は、ＧｌｃＮＡｃに結合したフコース分子のみをカウントし、最外側のガラクトースに結合したフコースは含まず、これは末端残基を表す場合に網羅されることに注意することは重要である。最後のディジット−文字対のディジット部分は、構造中でＧｌｃＮＡｃに結合したフコース分子の数をカウントする一方、文字は、どの分岐がフコシル化され、どの連結を介しているかを表すのに使用される。コードを可能な限り簡潔に維持するために、可能なフコシル化部位のすべての組合せが、ＧｌｙｃｏＤｉｇｉｔコードの第２の実施形態において表されているわけではない。分岐中の最外側のＧｌｃＮＡｃ残基のみが、フコシル化されることが可能である。さらに、２つ以上の分岐がフコシル化される場合、すべてのフコース残基は、同じ型の連結を介して結合されなければならない。したがって、α１−３連結を介して外側の分岐上に結合した２つのフコース残基を含む構造を有することは可能であるが、α１−３連結を介して結合した一方のフコースと、α１−４連結を介した他方のフコースを有することは可能ではない。表４に、ＧｌｙｃｏＤｉｇｉｔコードの第２の実施形態によって表すことができる、フコシル化のすべての組合せを列挙する。
【００３９】
【表４−１】

【表４−２】

【００４０】
[00069]結果
[00070]ＧｌｙｃｏＤｉｇｉｔコードを用いたＮ結合型グリカンの表示
[00071]ＧｌｙｃｏＤｉｇｉｔコードは、複合型、高マンノース型及びハイブリッド型のＮ結合型グリカンを表すのに使用することができる。図４ａ〜４ｃは、異なる亜型の３つの異なるＮ結合型グリカン構造、及びＧｌｙｃｏＤｉｇｉｔコードの第１の実施形態を使用したその対応する表示を表し、図５ａ〜５ｃは、３つの異なるグリカン構造、及びＧｌｙｃｏＤｉｇｉｔコードの第２の実施形態でのその対応する表示を表す。図４ａ〜４ｃ及び５ａ〜５ｃのすべてにおいて、丸で囲まれた数字は分岐位置を表し、丸で囲まれていない数字は、それぞれの分岐の末端の単糖を定義し、下線を引かれた英数コードは、それぞれの構造についてのＧｌｙｃｏＤｉｇｉｔコード表示である。図４ａ〜４ｃにおいて陰影をつけた部分は、すべてのＮ結合型グリカンに共通のコア構造である。
【００４１】
[00072]図４ａは、コードに関して以下のディジットを有する複合型Ｎ結合型グリカンである。
[00073]１番目のディジット＝７：分岐はＮｅｕＮＡｃ（Ｎ−アセチルノイラミン酸）で終止する。
[00074]２番目のディジット＝３：分岐はＧｌｃＮＡｃ（Ｎ−アセチルグルコサミン）で終止する。
[00075]３番目のディジット＝５：分岐はガラクトースで終止する。
[00076]４番目のディジット＝１：分岐が存在しない。
[00077]５番目のディジット＝１：この分岐にバイセクティングＧｌｃＮＡｃは結合されていない。
[00078]６番目のディジット＝３：この構造にフコースが結合されている。
【００４２】
[00079]したがって、図４ａ中の構造についての最終のコードは（７３５１１３）である。それぞれの分岐において結合した単糖の詳細な連結情報は、表Ｉ中のディジットの値を調べることによって推定することができる。高マンノース型グリカン構造についてのコードを図４ｂに示す。それぞれのディジットの値は、それぞれの分岐に結合したマンノース残基の数に基づく。この形式により、以下に説明する、哺乳動物の分泌性糖タンパク質の場合のように、構造中に最大９つのマンノース残基を結合することが可能になることに注意することが重要である。図４ｂ中の構造は、この最大の許容できる量のマンノースを含む。ハイブリッドグリカン構造及びその対応するコードを図４ｃに示す。方法に記載されるように、テトラアンテナリーＮ結合型グリカン中の分岐１と２、及び分岐３と４は、それぞれ同じ型、即ち、両方ともマンノース、又は両方とも複合型でなければならない。例えば、マンノース残基を含む分岐１と、ＧｌｃＮＡｃ残基を含む分岐２を有することは可能ではない。
【００４３】
[00080]本明細書に記載される法則は、すべての種についてのＮ結合型グリカン構造を網羅することは意図されていない。いくつかの脊椎動物の構造は、５つの分岐を有し、３番目の分岐は、上部のコアマンノースに結合されていることが観察された（Ｖａｒｋｉら）。ＣＨＯ細胞では、同様の分岐は、グリコシル化経路の中間段階としてのみ存在することが観察された（ＢｕｔｌｅｒＭ．２００６．「Ｏｐｔｉｍｉｓａｔｉｏｎｏｆｔｈｅｃｅｌｌｕｌａｒｍｅｔａｂｏｌｉｓｍｏｆｇｌｙｃｏｓｙｌａｔｉｏｎｆｏｒｒｅｃｏｍｂｉｎａｎｔｐｒｏｔｅｉｎｓｐｒｏｄｕｃｅｄｂｙｍａｍｍａｌｉａｎｃｅｌｌｓｙｓｔｅｍｓ」、Ｃｙｔｏｔｅｃｈｎｏｌｏｇｙ、５０：５７〜７６）。さらに、可能な連結に対するいくつかの他の変形が他の種において観察された（ＳｃｈａｃｈｔｅｒＨ、ＢｒｏｃｋｈａｕｓｅｎＩ、ＨｕｌｌＥ．１９８９．「Ｈｉｇｈ−ｐｅｒｆｏｒｍａｎｃｅｌｉｑｕｉｄｃｈｒｏｍａｔｏｇｒａｐｈｙａｓｓａｙｓｆｏｒＮ−ａｃｅｔｙｌｇｌｕｃｏｓａｍｉｎｙｌｔｒａｎｓｆｅｒａｓｅｓｉｎｖｏｌｖｅｄｉｎＮ− ａｎｄＯ−ｇｌｙｃａｎｓｙｎｔｈｅｓｉｓ」、ＭｅｔｈｏｄｓＥｎｚｙｍｏｌ．、１７９：３５１〜３９７）。それにもかかわらず、ＧｌｙｃｏＤｉｇｉｔコードは、組換えタンパク質の製造において一般に使用される、ほとんどの哺乳動物種に十分に適用可能である。
【００４４】
[00081]ＧｌｙｃｏＤｉｇｉｔコードの第１の実施形態は、すべての可能なグリカン構造を作成するための単純な手段を提供する。分岐１〜４について、分岐構造を記述するのに使用することができる１０の可能な英数字（１、３、５、７、Ａ、Ｂ、Ｃ、Ｄ、Ｅ及びＦ）がある一方、５番目及び６番目の分岐について２つの可能な数字がある（１、３）。したがって、１０×１０×１０×１０×２×２＝４０，０００の異なる構造を、ＧｌｙｃｏＤｉｇｉｔコードの６つのディジット−文字対の実施形態で作成し、表示することができる。しかし、これらの構造のすべてが有効であるわけではない。無効な構造は、以下に説明される法則によって選別して除くことができ、したがって、ＧｌｙｃｏＤｉｇｉｔコードの６字の英数の実施形態で理論的に有効なグリカン構造とみなすことができる、４８６０種のＮ結合型グリカン構造を得る。もちろん、この法則をさらに洗練させて、適切な哺乳動物細胞株に関係するグリカン集団を生じさせることが可能である。
【００４５】
[00082]表５は、ＧｌｙｃｏＤｉｇｉｔコードの第１の（６字の英数の）実施形態におけるそれぞれのディジットについての定義を要約し、完全な分岐構造及びアノマー連結情報も示す。空のセルは、そのディジットの位置について値が可能でないことを示す。
【００４６】
【表４】

【００４７】
[00083]３つの追加の法則が定義されることによって、ＧｌｙｃｏＤｉｇｉｔコードの６字の英数の実施形態により、ＣＨＯ細胞由来の分泌性タンパク質のＮ結合型グリカン構造が記述される。
【００４８】
[00084]法則１：分泌性哺乳動物細胞中の高マンノース及びハイブリッド亜型について、コア構造に結合されるマンノース残基の最大可能数は６であり、構造中のマンノース残基の総数を９に等しくする（トリマンノシルコア中の３つの残基をカウントして）（Ｖａｒｋｉら）。
【００４９】
[00085]法則２：ＧｌｙｃｏＤｉｇｉｔコードの６字の英数の実施形態では、１つの分岐中で、最大でも６のマンノースのみが可能になる。
【００５０】
[00086]法則３：ハイブリッド構造について、分岐１と２、及び分岐３と４は、それぞれ同じ型、即ち、両方ともマンノース、又は両方とも複合型でなければならない。
【００５１】
[00087]図５ａ中の複合型グリカン構造は、α１−３連結マンノースに接続された分岐上に結合したルイスＹ型エピトープを有するトリアンテナリー構造である。７つのディジット−文字対の実施形態では、この構造についてのＧｌｙｃｏＤｉｇｉｔコードは［０ｘ３ｇ１ａ３ａ０ｘ０ｘ２ｃ］である。図５ｂ中のＭａｎ_９ＧｌｃＮＡｃ_２構造は、高マンノース構造であり、これは、小胞体及びゴルジ体における、すべてのさらなるグリコシル化反応についての開始点である。マンノース残基は、数字の代わりに文字で表されるので、この構造に対応するコードは、［Ｂａ０ｘＢａＢａ０ｘ０ｘ０ｘ］である。２つの高マンノース分岐及び２つの複合分岐を有するハイブリッド構造を図５ｃに示す。分岐ＧｌｃＮＡｃに結合されたフコース残基を有する１番目の複合分岐中に、シアリルルイスＸ構造が存在する一方、ジラクトサミン鎖は、２番目の分岐中に示されている。図に示すように、この構造は、ＧｌｙｃｏＤｉｇｉｔコードによって、［３ａ４ａＡａＢａ０ｘ１ａ２ａ］と表される。
【００５２】
[00088]図６ａ〜６ｆは、図５ａ中に表された複合型構造についての、対応するＧｌｙｃｏＤｉｇｉｔコード（７つのディジット−文字の実施形態）の段階的な表示を例示する。それぞれのディジット−文字対は、以下のようにコード化することができる。
[00089]１番目のディジット−文字対から開始して、この場合、対応する分岐は空であり、したがって表示は「０ｘ」である。
[00090]α１−３コアマンノースに結合した２番目の分岐を見ると、これは３つの残基を有し、末端のフコースで終わる。その表示は、表３に列挙されたように「３ｇ」である。
[00091]３番目のディジット−文字の位置における分岐は、１つのＧｌｃＮＡｃ残基を有し、「１ａ」と表される。
[00092]４番目の分岐は、α２−３連結シアル酸で終わる３つの残基を有する。この分岐についてのコードは「３ａ」である。
[00093]５番目と６番目の分岐は空であり、したがって両方とも「０ｘ」で表される。
[00094]最後のディジット−文字の位置についての値は「２ｃ」であるが、これは、コアフコースに加えて、α１−３連結で２番目の分岐中のＧｌｃＮＡｃに結合したフコース残基も存在するためである（表４を参照されたい）。その分岐中のガラクトースに結合したフコースは、２番目の分岐についてのコードにおいて表されており、ここではカウントされない。
【００５３】
[00095]したがって、全体の構造についてのコードは、［０ｘ３ｇ１ａ３ａ０ｘ０ｘ２ｃ］となる。
【００５４】
[00096]ＧｌｙｃｏＤｉｇｉｔコードは、すべての種に見出されるすべての可能なグリカン構造の包括的な適用範囲を提供することを目的としていないことに注意すべきである。代わりにＧｌｙｃｏＤｉｇｉｔコードは、ＣＨＯ細胞などの哺乳動物細胞株中の分泌性糖タンパク質に見出される構造に主に注目しているが、依然として拡張可能なままである。この理由のために、７つのディジット−文字対が選択されることによって、結合したフコース分子を記述する能力とともに、ＧｌｃＮＡｃ残基について、コア構造上の６つの連結部位が表される。現在、ＧｌｙｃｏＤｉｇｉｔコードは、中にマンノース、ＧｌｃＮＡｃ、ガラクトース、フコース及びシアル酸残基を有する構造を表すことができる。これは、ＮｅｕＮＡｃとＮｅｕＧｃを区別することができ、末端のガラクトース及びフコースを表すことができる。ＣＨＯ細胞中で自然に発現されないいくつかの構造が、操作されたＣＨＯ細胞株中で作製された。これらには、バイセクティングＧｌｃＮＡｃ（Ｓｂｕｒｌａｔｉら；Ｕｍａｎａら）、繰り返しラクトサミン鎖（ＳａｓａｋｉＨ、ＢｏｔｈｎｅｒＢ、ＤｅｌｌＡ、ＦｕｋｕｄａＭ（１９８７）「ＣａｒｂｏｈｙｄｒａｔｅｓｔｒｕｃｔｕｒｅｏｆｅｒｙｔｈｒｏｐｏｉｅｔｉｎｅｘｐｒｅｓｓｅｄｉｎＣｈｉｎｅｓｅｈａｍｓｔｅｒｏｖａｒｙｃｅｌｌｓｂｙａｈｕｍａｎｅｒｙｔｈｒｏｐｏｉｅｔｉｎｃＤＮＡ」ＪＢｉｏｌＣｈｅｍ２６２：１２０５９〜１２０７６）、及びルイス血液型構造（ＴｈｏｍａｓＬＪ、ＰａｎｎｅｅｒｓｅｌｖａｍＫ、ＢｅａｔｔｉｅＤＴ、ＰｉｃａｒｄＭＤ、ＸｕＢ、ＲｉｔｔｅｒｓｈａｕｓＣＷ、ＭａｒｓｈＪｒＨＣ、ＨａｍｍｏｎｄＲＡ、ＱｉａｎＪ、ＳｔｅｖｅｎｓｏｎＴ、ＺｏｐｆＤ、ＢａｙｅｒＲＪ（２００４）「ＰｒｏｄｕｃｔｉｏｎｏｆａｃｏｍｐｌｅｍｅｎｔｉｎｈｉｂｉｔｏｒｐｏｓｓｅｓｓｉｎｇｓｉａｌｙｌＬｅｗｉｓＸｍｏｉｅｔｉｅｓｂｙｉｎｖｉｔｒｏｇｌｙｃｏｓｙｌａｔｉｏｎｔｅｃｈｎｏｌｏｇｙ」、Ｇｌｙｃｏｂｉｏｌｏｇｙ１４：８８３〜８９３；ＢａｒｒａｂｅｓＳ、Ｐａｇｅｓ−ＰｏｎｓＬ、ＲａｄｃｌｉｆｆｅＣＭ、ＴａｂａｒｅｓＧ、ＦｏｒｔＥ、ＲｏｙｌｅＬ、ＨａｒｖｅｙＤＪ、ＭｏｅｎｎｅｒＭ、ＤｗｅｋＲＡ、ＲｕｄｄＰＭ、ＤｅＬｌｏｒｅｎｓＲ、ＰｅｒａｃａｕｌａＲ（２００７）「Ｇｌｙｃｏｓｙｌａｔｉｏｎｏｆｓｅｒｕｍｒｉｂｏｎｕｃｌｅａｓｅ１ｉｎｄｉｃａｔｅｓａｍａｊｏｒｅｎｄｏｔｈｅｌｉａｌｏｒｉｇｉｎａｎｄｒｅｖｅａｌｓａｎｉｎｃｒｅａｓｅｉｎｃｏｒｅｆｕｃｏｓｙｌａｔｉｏｎｉｎｐａｎｃｒｅａｔｉｃｃａｎｃｅｒ」、Ｇｌｙｃｏｂｉｏｌｏｇｙ１７：３８８〜４００）が含まれる。
【００５５】
[00097]第２の実施形態に関して、他の場合を網羅するために追加の分岐が必要な場合、より多くのディジット−文字対をコードに加えることによってこれらを表すことができる。さらに、追加の連結情報を表すための指標に基づく文字は、さらなる連結及び残基の型の選択肢の容易な付加を可能にする。逆に、７つ未満の分岐が存在し、又は連結情報が必要でない場合、コードは単純化することができる。ＧｌｙｃｏＤｉｇｉｔコードにおいて、コードは数字成分を保持し、これは、いくつかのコンピュータ用途の基盤として機能を果たすことができるという事実が主に強調される。
【００５６】
[00098]ＧｌｙｃｏＤｉｇｉｔコードの用途
[00099]グリカン構造の比較
[000100]ＢＬＡＳＴ（ＡｌｔｓｃｈｕｌＳＦ、ＧｉｓｈＷ、ＭｉｌｌｅｒＷ、ＭｙｅｒｓＥＷ、ＬｉｐｍａｎＤＪ（１９９０）「Ｂａｓｉｃｌｏｃａｌａｌｉｇｎｍｅｎｔｓｅａｒｃｈｔｏｏｌ」、ＪＭｏｌＢｉｏｌ２１５：４０３〜４１０）（「Ａｌｔｓｃｈｕｌら」）の開発は、生物学者が問ってきた基本的な疑問、即ち、ヌクレオチドとタンパク質の異なる配列の間の類似性をどのように測定するかを解決した。しかし、そのようなアルゴリズムは、そのツリー状構造のためにグリカンの比較に直接適用可能ではなかった。最近、グリカンを比較するためのいくつかの技法（ＡｏｋｉＫＦ、ＹａｍａｇｕｃｈｉＡ、ＵｅｄａＮ、ＡｋｕｔｓｕＴ、ＭａｍｉｔｓｕｋａＨ、ＧｏｔｏＳ、ＫａｎｅｈｉｓａＭ（２００４）「ＫＣａＭ（ＫＥＧＧＣａｒｂｏｈｙｄｒａｔｅＭａｔｃｈｅｒ）：ａｓｏｆｔｗａｒｅｔｏｏｌｆｏｒａｎａｌｙｚｉｎｇｔｈｅｓｔｒｕｃｔｕｒｅｓｏｆｃａｒｂｏｈｙｄｒａｔｅｓｕｇａｒｃｈａｉｎｓ」、ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ３２：Ｗ２６７〜２７２（「Ａｏｋｉら」）；ＡｏｋｉＫＦ、ＭａｍｉｔｓｕｋａＨ、ＡｋｕｔｓｕＴ、ＫａｎｅｈｉｓａＭ（２００５）「Ａｓｃｏｒｅｍａｔｒｉｘｔｏｒｅｖｅａｌｔｈｅｈｉｄｄｅｎｌｉｎｋｓｉｎｇｌｙｃａｎｓ」、Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ２１：１４５７〜１４６３）が開発されたが、この研究領域は依然としてその黎明期にある。ＧｌｙｃｏＤｉｇｉｔコードの６つ及び７つのディジット−文字対の実施形態の両方において、本発明者らは、差分演算子を定義し、これにより、異なるグリカン構造の容易な比較が可能になる。
【００５７】
[000101]図７は、複合及びハイブリッドＮ結合型グリカン構造、並びにＧｌｙｃｏＤｉｇｉｔコードの６字の英数の実施形態についてのその対応するＧｌｙｃｏＤｉｇｉｔコードを表す。その構造の間に２つの差異があり、第１の構造は、分岐６に結合したフコース残基を欠いている一方、第２の構造は、分岐３に結合したガラクトース残基を有していない。この構造の間の差異は、（００２００ −２）として得られる。得られたコードは有効なグリカン構造ではないが、２つの入力構造の間の差異についての情報を提供する。ゼロ値は、両方の構造上の分岐が正確に同じであることを示す一方、ゼロでない値は、分岐が異なることを意味する。偶数は、比較されている両方の分岐が同じ型、即ち、両方とも複合、又は両方とも高マンノースであること意味する。奇数は、複合分岐が高マンノース分岐と比較されていることを意味する。上記例からの結果は、３番目及び６番目の分岐において、２つの構造の間に差異があることを立証する。
【００５８】
[000102]参照表（表６）を定義することによって、差分演算子からの結果を使用して、構造同士間の特定の残基及び連結の差異を見出す。比較されているそれぞれ分岐について、２つの入力構造からのより大きいディジットが、すべての可能な得られる差異に対して指標が付けられる。複合型構造のみを考慮すると、例えば、値７を有する分岐（ＮｅｕＮＡｃ）は、値７（ＮｅｕＮＡｃ）、５（Ｇａｌ）、３（ＧｌｃＮＡｃ）、及び１に対してのみ比較することができ、得られる差異は、０、±２、±４、及び±６となり得るだけであることを意味する（表６中の差異のカラムを参照されたい）。ゼロ値は変化のないことを意味し、参照表中に記録されない。これらの可能な差異のそれぞれについて、表は、第１の構造から第２の構造を得るために変更されなければならない連結を列挙する。正の差異については、連結は除かれなければならず、負の値については、連結は付加される。表６は、１つの分岐同士間の複合Ｎ結合型グリカンの比較についての参照表である。図７中で得られた結果のコードを使用して、２つの構造の間の正確な差異を見出すことができる。３番目の分岐についてのそれぞれの構造におけるディジットを考慮すると、２つのディジットの大きい方は５であり、その差異値は２であることが分かる。参照表中の対応する強調されたセルは、β１→４連結を介して結合したＧｌｃＮＡｃ残基が、第２の構造において除かれていることを示す。同様に、６番目の分岐については、フコース残基がα１→６連結を介して付加されていることを示すことができる。
【００５９】
【表５】

【００６０】
[000103]参照表６は、構造同士間の個々の分岐の間の差異に必要な反応ステップの数についての情報も含む。それぞれの分岐についての反応ステップに必要な数は、２つの分岐間の差異の絶対値を２で除することによって得ることができる。上記例については、第１の構造を第２の構造に変換するために、２つの反応ステップ、即ち、ＧｌｃＮＡｃ残基の除去、及びフコースの付加が起こらなければならない。
【００６１】
[000104]完全な参照表は、両方の入力が高マンノース型である場合の分岐を比較するときに起こる変化についての情報も含む。例えば、ディジットＢ（４の値）及びＤ（８の値）を有する、高マンノース構造の２つの分岐を比較することにおいて、差異は４であり、第１の構造に２つのマンノース残基を付加することとして記述することができる。ハイブリッドグリカン構造における複合分岐と高マンノース分岐の間の比較は、より複雑である。高マンノース構造を複合構造に変換するために、任意の他の単糖を結合することができる前に、すべてのマンノース残基が除かれなければならない。ディジットＣ及び７で表される分岐を比較することは、合計６つの反応ステップで、３つのマンノース残基が除かれなければならず、ＧｌｃＮＡｃ、ガラクトース及びＮｅｕＮＡｃが、付加されなければならなかったことを意味する。
【００６２】
[000105]図８は、複合及びハイブリッドＮ結合型グリカン構造、並びに７つの文字−ディジット対の実施形態についてのその対応するＧｌｙｃｏＤｉｇｉｔコードを表す。これらの構造の間に３つの差異があり、第１の差異は、コアＧｌｃＮＡｃに結合したフコース残基の欠落であり、第２の差異は下部の分岐中のガラクトース残基の欠落であり、最後に、４番目の分岐は、２つの構造において異なる型である。図８に示すように、これらの構造の間の差異は、［０１０５００ −１］として得られる。差分演算子は、コード中のディジットの値を比較するだけであり、文字の値を無視する。したがって、得られるコードは、２つの構造の間の差異についての情報を提供する。ゼロ値は、両方の構造上の分岐が正確に同じであることを示し、ゼロでない値は、分岐が異なることを意味する。高マンノース分岐が、複合分岐に対して比較されるとき、特別な場合が生じる。この状況では、分岐同士間の差異は、その分岐についての２つのディジットの値の合計として定義される。上記例からの結果は、２番目、４番目、及び７番目の分岐位置において、２つの構造の間に差異があることを立証する。
【００６３】
[000106]差分演算子からの結果のコードを使用することによって、７つのディジット−文字対の実施形態について、１つの構造を別の構造に変換するのに必要な反応ステップの数を計算することができる。差異コード中のディジットの絶対値を加算することにより、第１の構造を第２の構造に変換するのに必要な反応の数が明らかになる。差異コードから、ステップの数を７（０＋１＋０＋５＋０＋０＋１）であると計算することができる。２つの複合分岐が比較されている場合、その分岐についての差異のディジットが正である場合、これは、変換の一部としてグリカンが付加されなければならないことを意味する一方、負の差異はグリカンが除かれなければならないことを意味する。ハイブリッドグリカン構造における複合分岐と高マンノース分岐の間の比較は、より複雑である。高マンノース分岐を複合分岐に変換するためには、任意の他の単糖を結合することができる前に、すべてのマンノース残基が最初に除かれなければならない。２つの構造においてそれぞれディジットＢ及び３で表される４番目の分岐を比較することは、合計５つの反応ステップについて、２つのマンノース残基が除かれなければならず、ＧｌｃＮＡｃ、ガラクトース及びＮｅｕＮＡｃが付加されなければならないことを意味する。表１〜３は、それぞれのディジットについてどの単糖が付加され、どの連結においてであるかを見出すのに使用することができる。この情報は、１つの構造から別の構造に変換する場合に、どの連結が除かれるかを見出すために逆に使用することができる。
【００６４】
[000107]２つのＮ結合型グリカン構造の間の距離測定
[000108]式（１）は、ＧｌｙｃｏＤｉｇｉｔコードの６字の英数の実施形態について、反応距離に関して２つの有効なグリカン構造を比較するためのアルゴリズムを表す。
【数１】

【００６５】
[000109]このアルゴリズムを使用して、２つの構造の間の類似スコアは単純に計算することができ、以下に説明するように、１つの構造を別の構造に変換するのに必要な反応ステップの数の判定を可能にする。このスコアはただ単純な近似であり、いずれの明らかな生物学的な有意性も有さないことに注意すべきである。
【００６６】
[000110]図９は、２つのグリカン、及び１つの構造から別の構造に変換するのに必要な反応ステップを示す。これらの構造は、コード（７１１１１１）及び（１１１７１１）で表され、類似性スコアは８４．２％である。
【００６７】
[000111]最初の４つの分岐について、６つのマンノース残基を有する分岐を、末端のＮｅｕＮＡｃ残基を有する分岐に変換するのに必要な反応の最大数は、９反応である。したがって、可能な反応の最大数は、（９×４）と、分岐５のバイセクティングＧｌｃＮＡｃ及び分岐６のフコースのためのそれぞれ１つの反応、即ち、３８の可能な反応である。そのときスコアは、以下のように定義することができる。
【数２】

【００６８】
[000112]例として、図７中の最初と最後の２つの構造を使用すると、２つの構造の間の反応ステップに関する差異は２である。したがって、２つの構造の間の類似は、以下のように計算することができる。
【数３】

【００６９】
[000113]図９の最初の構造を最後の構造に変換するのに、６つの反応ステップが必要である。したがって、図９の最初と最後の構造の間の類似は、式（１）を使用して８４．２％と計算することができる。しかし、これらの構造は単に中間体であり、最後の構造は常に有効である。図９中の最初の構造と最後の変換された構造は互いに異性体であり、生物学的に区別不能な場合があり、実際は８４．２％の類似性スコアで表されないことに注意されたい。より生物学的に関連したスコアリングシステムを確立するためにさらなる研究が必要である。以下に説明するように、現行のアルゴリズムを実行し、直観的な結果を提供するために、ウェブに基づくグラフィカルインターフェースが開発された。
【００７０】
[000114]グリコシル化ネットワークの構築
[000115]グリコシル化反応ネットワークを、グリカン構造を表すノード、及び可能な酵素反応を示す端部を有するグラフとして考案することができる。１つのグリカン構造は、複数の反応に対する基質として作用することができ、いくつかの反応の最終生成物となることもでき、したがって高度に分岐したネットワークを作り出す。グリカンネットワークの別の特徴的な機能は、任意の中間構造を最終生成物とみなし、天然の系において見られる多種多様の構造に導く方法である。そのようなネットワークの可視化は、グリコシル化経路の理解を改善し、インシリコ実験のための基盤して機能を果たすことができる。
【００７１】
[000116]記憶及び処理を容易にするために、対称隣接行列を作成することによって反応対を記憶した。５１００×５１００行列を作成し、それぞれの（ｉ，ｊ）値に、グリカンｉがグリカンｊと反応するかどうかを記録した。ゼロ値は、これらの２つのグリカンの間に反応がないことを意味する一方、１の値は、反応リンクがあることを意味する。第１の実施形態に関連して上述した差分演算子を、隣接行列にデータを入れる１対の関数を作成するのに使用した。これらの関数はＭＡＴＬＡＢで実行したとともに、その対応する擬似コード版を図１０中に示す。関数ｉｓｒｘｎは、入力として２つのグリカン構造をとり、一方の構造を他方の構造に変換するのに必要な唯一の反応がある場合、１を返す。グリカン構造の全リストがｒｘｎ＿行列関数に通され、これは、隣接行列を作成し、２つのグリカンの間で反応があるごとに１をこれに代入する。
【００７２】
[000117]グリコシル化ネットワークを可視化するために、グリカンを基本のコア構造から配置し、構造が完全にシアル化されるまで糖残基を付加した。グリカンを、コア構造からそれぞれのグリカンを分離した反応ステップの数に基づく群に分類した。複合型グリカンの場合について、ＧｌｙｃｏＤｉｇｉｔコードの第１の実施形態では、コア構造は、１１１１１１として表される一方、終点は、コード７７７７３３で表される、完全にシアル化された構造である。可視化アルゴリズムでは、それぞれの群中の個々のグリカン構造が描かれ、次いで反応リンクを有するこれらの構造間に線が引かれる。
【００７３】
[000118]グリカン構造の２つのデータセットを作成することによって、可視化アルゴリズムを試験した。第１のセットは、１９３７２の反応対を用いてＧｌｙｃｏＤｉｇｉｔによって生成された、完全な５１００の理論的グリカンであった。６４の構造及び１６０の反応のみを含むはるかに小さいデータセットも作成し、これは、最初の４つの分岐のうちの２つのみが存在する複合型グリカンのみを含んでいた。両方の場合において、得られたネットワークは、高度に分岐されたツリー構造を示し、これは最初に分岐し、次いで集束した。ネットワークの開始時では、糖を結合するための多くの可能な部位があり、これは分岐する性質に導くが、これらが埋まるにつれて、可能な選択数が減少し、ネットワークは、最終の数個の構造に集束する。第１のネットワークは、１５レベルの深さのツリー構造を示す一方、より小さいセットは、９の深さを有していた。両方の場合について、それぞれレベルにおけるグリカン及び反応の数を表７に要約する。図１１ａ及び１１ｂは、第２のデータセットについてのネットワーク分布を示す。
【００７４】
【表６】

【００７５】
[000119]グリカン構造への単糖単位の付加及び除去に関与する酵素のリストはＫＥＧＧから得た（ＫａｎｅｈｉｓａＭ．、ＧｏｔｏＳ．、ＨａｔｔｏｒｉＭ．、Ａｏｋｉ−ＫｉｎｏｓｈｉｔａＫ．Ｆ．、ＩｔｏｈＭ．、ＫａｗａｓｈｉｍａＳ．、ＫａｔａｙａｍａＴ．、ＡｒａｋｉＭ．、及びＨｉｒａｋａｗａＭ．「Ｆｒｏｍｇｅｎｏｍｉｃｓｔｏｃｈｅｍｉｃａｌｇｅｎｏｍｉｃｓ：ｎｅｗｄｅｖｅｌｏｐｍｅｎｔｓｉｎＫＥＧＧ」、ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．、３４：Ｄ３５４〜３５７、２００６）。ＧｌｙｃｏＤｉｇｉｔコードの第１の実施形態から、すべての３つの亜型の５１００の理論的グリカンを得、グリカン構造の対について、１９３７２の反応対を作成し、これは酵素反応と一緒にリンクさせた。
【００７６】
[000120]ＧｌｙｃｏＤｉｇｉｔコードの第２の実施形態の数字指標を使用して、図１２ａ〜１２ｃに示すように、それぞれグリカン構造及び反応ステップに対応するノード及び端部を有するグラフとして表すことができる、Ｎ結合型グリコシル化ネットワークを構築した。
【００７７】
[000121]ＧｌｙｃｏＤｉｇｉｔコードの第２の実施形態を使用して、本発明者らは、［０ｘ０ｘ０ｘ０ｘ０ｘ０ｘ０ｘ］として表されるコア構造から開始して、ＣＨＯ細胞中で一般に分泌されるすべての可能な複合型グリカン構造を列挙した。この列挙は、ＧｌｙｃｏＤｉｇｉｔコード中のそれぞれのディジットを１だけ増加させることによって単純に実施し、これは、糖残基、例えばＧｌｃＮＡｃ、ガラクトース、フコース及びシアル酸などは、関連したグリコシルトランスフェラーゼによる酵素処理によってコア構造に順次結合されることを示す。このプロセスは、グリカンが、コード［３ａ３ａ３ａ３ａ０ｘ１ａ１ａ］で表される、コアのフコシル化を伴った、テトラアンテナリーの完全にシアル化された構造になるまで継続し、こうして１０２４の複合型グリカン、及びそれぞれ２つの引き続くグリカンを連結する４０９６の反応ステップを作成した。
【００７８】
[000122]構築したネットワークを可視化するために、得られたグラフを階層的な様式に整えた。最初に、結合した糖の数に基づいて、すべてのグリカンを異なる階層的な層に分類した。第１の層として、コア構造［０ｘ０ｘ０ｘ０ｘ０ｘ０ｘ０ｘ］から開始し、その後、完全にシアル化されたグリカン構造［３ａ３ａ３ａ３ａ０ｘ１ａ１ａ］を含む最後の層まで、コア構造のそれぞれに１つの糖を付加したグリカンからなる第２の層などとした。すべてのグリカンをその対応する層中に配置したら、グリカンの対を連結する関連した反応の端部を、ネットワークのグラフ内で可視化する。図１２ａ〜１２ｃは得られるネットワークを例示し、これは高度に分岐した構造であり、この中で個々のグリカン構造は、ネットワーク中でノードとして表される一方、端部は２つのグリカンの間の酵素反応ステップを表す。現行のネットワークは、ＣＨＯ細胞中のグリコシル化経路の近似であるが、これは、酵素的な必要条件及び制限（ＨｏｓｓｌｅｒＰ、ＧｏｈＬＴ、ＬｅｅＭＭ、ＨｕＷＳ（２００６）「ＧｌｙｃｏＶｉｓ：ｖｉｓｕａｌｉｚｉｎｇｇｌｙｃａｎｄｉｓｔｒｉｂｕｔｉｏｎｉｎｔｈｅｐｒｏｔｅｉｎＮ−ｇｌｙｃｏｓｙｌａｔｉｏｎｐａｔｈｗａｙｉｎｍａｍｍａｌｉａｎｃｅｌｌｓ」、ＢｉｏｔｅｃｈｎｏｌＢｉｏｅｎｇ９５：９４６〜９６０（ＨｏｓｓｌｅｒらＩ）が、ネットワーク構築中に完全に考慮されなかったためであることに注意すべきである。
【００７９】
[000123]多くの生物学的な経路は複雑であることが多く、その構造を可視化することは、これを研究することにおいて最も有用なステップの１つである。本明細書に記載されるネットワークは、グリカン構造を連結するための可能な経路を識別し、又は以前に知られているものより短い経路を見出すために使用することができる。現行のモデルでは、１つの構造から別の構造を得るのに、多くの場合、いくつかの可能な経路が存在するが、これらの経路は、常に生物学的に妥当であるとは限らない場合がある。どの種がモデルになっているかに応じて、グリカンが実際に反応して他のグリカンを形成することができる追加の法則を組み込むことによって、ネットワークをより現実的にすることができる。アルゴリズムのモジュール性により、利用者が反応対の独自のモデルを定義し、これを可視化することが可能になる。
【００８０】
[000124]代謝フラックス分析は、視覚的インターフェースの存在から大いに利益を得る一用途である。追加の情報をデータモデルに加えることによって、経路のインシリコリエンジニアリングを可能にすることができる。可視化システムにより、この種類の分析用のモデルを構築するための良好な基盤が提供される。これは、対話型ユーザインターフェースを用いて実行することによって、実験データを組み込み、ウェブブラウザベースのサービスを提供することができる。
【００８１】
[000125]考察
[000126]グライコームインフォマティクスの研究は、他の「オミクス」領域で行われてきた進展に、徐々に追いつきつつある。本明細書で説明したように、本発明によるＧｌｙｃｏＤｉｇｉｔコードは、ほとんどの哺乳動物細胞中に一般に見出されるＮ結合型グリカンの、予め定義された枝分れ構造に基づく。グリカンのための他の標準的なテキスト表示と比較して、ＧｌｙｃｏＤｉｇｉｔコードは、個々の単糖単位を記述する以前の方法の代わりに分岐に注目しているので、はるかに短く、より直観的である。例えば、図２中に様々な形式で例示されたグリカン構造は、その構造を表すために、ＧｌｙｃｏＤｉｇｉｔコードの７つのディジットの実施形態によって、［０ｘ２ａ１ａ３ａ０ｘ０ｘ１ａ］として単純にコード化される。より短い表示は、他のより長く、テキストベースの基準と異なって、手作業で入力するのが容易であり、誤植又は書式設定エラーをしにくい。
【００８２】
[000127]ＧｌｙｃｏＤｉｇｉｔコードは、すべての可能なグリカン構造の包括的な適用範囲を提供することはできないかもしれないが、これは順応性があり、利用者の必要条件によってカスタマイズすることができる。例えば、構造中に許容される分岐の数は、ディジット−文字対の数を調節することによって増減させることができる一方、より多くの選択を文字指標に加えることによって様々な連結情報を表すことができる。ＧｌｙｃｏＤｉｇｉｔコードは相互運用可能でもあり、これを、実験室の糖情報管理システム中に検索可能な形式で組み込み、それによって生物医学的及び生物工学的用途のための有用な資源を提供することを可能にする（ＨａｓｈｉｍｏｔｏＫ、ＧｏｔｏＳ、ＫａｗａｎｏＳ、Ａｏｋｉ−ＫｉｎｏｓｈｉｔａＫＦ、ＵｅｄａＮ、ＨａｍａｊｉｍａＭ、ＫａｗａｓａｋｉＴ、ＫａｎｅｈｉｓａＭ（２００６）「ＫＥＧＧａｓａｇｌｙｃｏｍｅｉｎｆｏｒｍａｔｉｃｓｒｅｓｏｕｒｃｅ」、Ｇｌｙｃｏｂｉｏｌｏｇｙ１６：６３Ｒ〜７０Ｒ；ＬｕｔｔｅｋｅＴ、Ｂｏｈｎｅ−ＬａｎｇＡ、ＬｏｓｓＡ、ＧｏｅｔｚＴ、ＦｒａｎｋＭ、ｖｏｎｄｅｒＬｉｅｔｈＣＷ（２００６）「ＧＬＹＣＯＳＣＩＥＮＣＥＳ．ｄｅ：ａｎＩｎｔｅｒｎｅｔｐｏｒｔａｌｔｏｓｕｐｐｏｒｔｇｌｙｃｏｍｉｃｓａｎｄｇｌｙｃｏｂｉｏｌｏｇｙｒｅｓｅａｒｃｈ」、Ｇｌｙｃｏｂｉｏｌｏｇｙ１６：７１Ｒ〜８１Ｒ；ＲａｍａｎＲ、ＶｅｎｋａｔａｒａｍａｎＭ、ＲａｍａｋｒｉｓｈｎａｎＳ、ＬａｎｇＷ、ＲａｇｕｒａｍＳ、ＳａｓｉｓｅｋｈａｒａｎＲ（２００６）「Ａｄｖａｎｃｉｎｇｇｌｙｃｏｍｉｃｓ：ｉｍｐｌｅｍｅｎｔａｔｉｏｎｓｔｒａｔｅｇｉｅｓａｔｔｈｅｃｏｎｓｏｒｔｉｕｍｆｏｒｆｕｎｃｔｉｏｎａｌｇｌｙｃｏｍｉｃｓ」、Ｇｌｙｃｏｂｉｏｌｏｇｙ１６：８２Ｒ〜９０Ｒ）。したがって、関連したグリカン構造は、容易に記憶、アクセス、検索し、その絵で表した形式に迅速に変換することができる。
【００８３】
[000128]グリコシル化の多様性を制御するためのグリコシル化経路についての研究は、ＧｌｙｃｏＤｉｇｉｔコードから利益を得ることができる別の領域である。グリカン構造のテキストベースの表示の代わりに、簡素化された数字表示は、そのような複雑なネットワークを研究するためのコンピュータ支援分析手段の開発をさらに進めることができる（ＨｏｓｓｌｅｒらＩ）。本明細書に記載したＧｌｙｃｏＤｉｇｉｔコードの形式は、グリカン相互作用のネットワークを構築及び可視化することに容易に適用することができる。この適用性は、テキストベースの表示によって容易に提供することはできない。さらに、図８ａ〜８ｃに例示したように、反応ステップに関してグリカン同士の間の差異を記述し、可能なグリカン構造の網羅的なリストを有することは、グリコシル化経路の数学的モデルを開発するための基盤を提供することになる（ＨｏｓｓｌｅｒＰ、ＭｕｌｕｋｕｔｌａＢＣ、ＨｕＷＳ（２００７）「ＳｙｓｔｅｍｓａｎａｌｙｓｉｓｏｆＮ−ｇｌｙｃａｎｐｒｏｃｅｓｓｉｎｇｉｎｍａｍｍａｌｉａｎｃｅｌｌｓ」、ＰＬｏＳＯＮＥ２（８）：ｅ７１３；ＫｒａｍｂｅｃｋＦＪ、ＢｅｔｅｎｂａｕｇｈＭＪ（２００５）「ＡｍａｔｈｅｍａｔｉｃａｌｍｏｄｅｌｏｆＮ−ｌｉｎｋｅｄｇｌｙｃｏｓｙｌａｔｉｏｎ」、ＢｉｏｔｅｃｈｎｏｌＢｉｏｅｎｇ９２：７１１〜７２８；ＵｍａｎａＰ、ＢａｉｌｅｙＪＥ（１９９７）「ＡｍａｔｈｅｍａｔｉｃａｌｍｏｄｅｌｏｆＮ−ｌｉｎｋｅｄｇｌｙｃｏｆｏｒｍｂｉｏｓｙｎｔｈｅｓｉｓ」、ＢｉｏｔｅｃｈｎｏｌＢｉｏｅｎｇ５５：８９０〜９０８）。
【００８４】
[000129]ＧｌｙｃｏＤｉｇｉｔコードの脈絡において、グリカン構造の間の類似性の生物学的に意味のある尺度を定義するために、さらなる研究が必要である。タンパク質構造と同様に、グリカン構造の類似性は、同様に機能の類似性を意味することが予期される（Ａｌｔｓｃｈｕｌら；Ａｏｋｉら；ＢｅｒｔｏｚｚｉＣＲ、ＫｉｅｓｓｌｉｎｇＬＬ（２００１）「Ｃａｒｂｏｈｙｄｒａｔｅｓａｎｄｇｌｙｃｏｂｉｏｌｏｇｙｒｅｖｉｅｗ：ｃｈｅｍｉｃａｌｇｌｙｃｏｂｉｏｌｏｇｙ」、Ｓｃｉｅｎｃｅ２９１：２３５７〜２３６４）。本発明によるＧｌｙｃｏＤｉｇｉｔコードは、より多様な範囲のＮ結合型グリカン構造の表示を可能にするために拡張可能でもある。
【００８５】
[000130]上記教示を踏まえると、当業者によって理解されるように、本発明の上述した実施形態の改変及び変形が可能である。したがって、添付の特許請求の範囲及びその均等物の範囲内で、本発明を、具体的に記載した以外の方法で実践することができることが理解されるべきである。

【特許請求の範囲】
【請求項１】
固定長の英数コードを含む、オリゴ糖の少なくとも一部を表すためのシステムであって、前記コードは、前記オリゴ糖に結合した残基の数及び位置を表すシステム。
【請求項２】
検索可能な形式で前記コードを組み込んでいる情報管理システムをさらに含む、請求項１に記載のシステム。
【請求項３】
前記オリゴ糖がＮ結合型グリカン構造である、請求項１に記載のシステム。
【請求項４】
前記Ｎ結合型グリカン構造が、複合型、高マンノース型及びハイブリッド型のうちの１つである、請求項３に記載のシステム。
【請求項５】
前記残基が、マンノース、Ｎ−アセチルグルコサミン、ガラクトース、フコース及びシアル酸残基からなる群から選択される、請求項１に記載のシステム。
【請求項６】
前記コードの数字部分が、Ｎ結合型グリカンのコア構造の分岐に結合した単糖の数を表す、請求項１に記載のシステム。
【請求項７】
英字部分が、Ｎ結合型グリカンのコア構造の分岐に結合した、連結の型及び特定の糖分子を表す、請求項１に記載のシステム。
【請求項８】
前記コードが、Ｎ結合型グリカンのコア構造上の６つの連結部位をそれぞれ表す６つの英数を含む、請求項１に記載のシステム
【請求項９】
前記分岐が複合型であり、高マンノース分岐が文字で表される場合、前記Ｎ結合型グリカンのコア構造の最初の４つの分岐は奇数で表される、請求項８に記載のシステム。
【請求項１０】
ＧｌｃＮＡｃ、ガラクトース又はノイラミン酸残基として終止する複合分岐が、それぞれ数字３、５又は７で表され、
ハイブリッドＮ結合型グリカン及び高マンノースＮ結合型グリカンのマンノース残基が文字Ａ〜Ｆで表され、それぞれの文字Ａ、Ｂ、Ｃ、Ｄ、Ｅ、及びＦが、それぞれ偶数２、４、６、８、１０、及び１２と指定されており、
それぞれ分岐について、前記文字値が、その分岐に結合したマンノース残基の数の２倍に対応し、
それぞれバイセクティングＧｌｃＮＡｃ及びフコース残基が存在する場合、５番目及び６番目の字が、３の値を有するディジットであり、
分岐が存在しない場合、その対応する数は１である、
請求項９に記載のシステム。
【請求項１１】
前記コードが７つの英数対を含む、請求項１に記載のシステム。
【請求項１２】
１番目〜５番目の英数対はそれぞれ、Ｎ結合型グリカンのコア構造上の５つの連結部位を表し、６番目の英数対はマンノース同士間のバイセクティングＧｌｃＮＡｃを表し、７番目の位置は、コア又は周辺部のＧｌｃＮＡｃ残基に結合することができるフコース分子に対応する、請求項１１に記載のシステム。
【請求項１３】
それぞれの英数対のディジット部分は、前記英数対で表される分岐に結合した単糖の数に対応し、
それぞれの英数対の文字部分は、付加される連結の型及び特定の糖分子についての追加の情報を含む表に対する指標として機能を果たす、請求項１２に記載のシステム。
【請求項１４】
前記７番目の英数対が、オリゴヌクレオチドに結合したＮ−アセチルグルコサミン残基上のフコシル化を表す、請求項１１に記載のシステム。
【請求項１５】
前記オリゴ糖がＮ−グリカン構造であり、哺乳動物細胞培養物に由来する分泌性糖タンパク質である、請求項１に記載のシステム。
【請求項１６】
グリカン構造同士間を定性的に区別するために定義された差分演算子をさらに含む、請求項１に記載のシステム。
【請求項１７】
オリゴ糖の少なくとも一部の構造を表すための方法であって、
（ａ）基本オリゴ糖構造を選択するステップと、
（ｂ）ステップ（ａ）で選択された基本構造上のいくつかの可能な置換ポイントを識別し、位置をそれぞれのポイントに割り当てるステップと、
（ｃ）ステップ（ｂ）からの置換ポイントに２字コードを割り当てるステップであり、「字」は任意のユニークな識別子を意味し、前記２字コードは、１番目の字及び２番目の字を有する、前記割り当てるステップと、
（ｄ）前記１番目の字及び前記２番目の字が一緒に、ステップ（ｂ）で識別された特定の置換ポイント上の残基を一意的に識別するように、前記２字コードの前記１番目の字に対して１つ又は複数のユニークな識別子、及び前記２字の前記２番目の字に対して１つ又は複数のユニークな識別子を割り当てるステップと、
（ｅ）ステップ（ｂ）で識別されたそれぞれの置換ポイントが、その置換ポイントについての可能な残基を識別する１組の２字コードを有するように、それぞれの置換ポイントについてステップ（ｄ）を繰り返すステップと、
（ｆ）ステップ（ａ）で選択された基本オリゴ糖構造、及び場合によりその基本構造上の１つ又は複数の残基を含むオリゴ糖構造の構造を再検討するするステップと
（ｇ）前記２字コードを、ステップ（ｆ）のオリゴ糖構造上の残基に割り当てることによって、ステップ（ｄ）及び（ｅ）で得られた２字コードを一致させ、これらをステップ（ｂ）で割り当てた位置に記録するステップと
を含む方法。
【請求項１８】
ステップ（ａ）の前記基本オリゴ糖構造がＮ結合型グリカン構造である、請求項１７に記載の方法。
【請求項１９】
前記Ｎ結合型グリカン構造が、複合型、高マンノース型及びハイブリッド型のうちの１つである、請求項１８に記載の方法。
【請求項２０】
ステップ（ｄ）における前記１番目及び２番目の字によって一意的に識別される前記残基が、マンノース、Ｎ−アセチルグルコサミン、ガラクトース、フコース及びシアル酸残基からなる群から選択される、請求項１７に記載の方法。
【請求項２１】
ステップ（ｃ）の前記１番目の字が数字である、請求項１８に記載の方法。
【請求項２２】
前記数字が、Ｎ結合型グリカンのコア構造の置換ポイントに結合した単糖の数を表す、請求項２１に記載の方法。
【請求項２３】
ステップ（ｃ）の前記２番目の字が文字である、請求項２１に記載の方法。
【請求項２４】
前記文字が、Ｎ結合型グリカンのコア構造の置換ポイントに結合した、連結の型及び特定の糖分子を表す、請求項２３に記載の方法。
【請求項２５】
ステップ（ｂ）において６つの置換ポイントが選択される、請求項１９に記載の方法。
【請求項２６】
前記分岐が複合型である場合、前記Ｎ結合型グリカンのコア構造の最初の４つの置換ポイントは奇数で表され、高マンノース分岐は文字で表される、請求項２５に記載の方法。
【請求項２７】
ステップ（ｂ）において７つの置換ポイントが選択される、請求項１９に記載の方法。
【請求項２８】
１番目〜５番目の置換ポイントの英数対は、Ｎ結合型グリカンのコア構造上の５つの連結部位を表し、６番目の置換ポイントはマンノース同士間のバイセクティングＧｌｃＮＡｃを表し、７番目の置換ポイントは、コア又は周辺部のＧｌｃＮＡｃ残基に結合することができるフコース分子に対応する、請求項２７に記載のシステム。
【請求項２９】
ステップ（ｃ）の前記１番目の字が数字である、請求項２８に記載の方法。
【請求項３０】
ステップ（ｃ）の前記２番目の字が文字である、請求項２９に記載の方法。
【請求項３１】
前記１番目の字の数字が、前記２字コードで表される置換ポイントの分岐で結合した単糖の数に対応し、
前記２番目の字の文字が、付加される連結の型及び特定の糖分子についての追加の情報を含む表に対する指標として機能を果たす、請求項３０に記載の方法。
【請求項３２】
前記オリゴ糖がＮ−グリカン構造であり、哺乳動物細胞培養物に由来する分泌性糖タンパク質である、請求項１８に記載の方法。

【図１ａ】

【図１ｂ】

【図１ｃ】

【図１ｄ】

【図２】

【図４ａ】

【図４ｂ】

【図４ｃ】

【図５ａ】

【図５ｂ】

【図５ｃ】

【図６ａ】

【図６ｂ】

【図６ｃ】

【図６ｄ】

【図６ｅ】

【図６ｆ】

【図１０】

【図１１ａ】

【図１１ｂ】

【図１２ａ】

【図１２ｂ−１２ｃ】

【図３】

【図７】

【図８】

【図９】

【図１３】

【公表番号】特表２０１０−５３００２１（Ｐ２０１０−５３００２１Ａ）
【公表日】平成２２年９月２日（２０１０．９．２）
【国際特許分類】

化学；冶金 (1,075,549)
- 有機高分子化合物；その製造または化学的加工；それに基づく組成物 (224,083)
  - 多糖類，その誘導体 (2,435)
    - グループ１／００から３５／００に分類されない多糖類の製造；その... (1,266)
- 有機化学 (230,229)
  - 糖類；その誘導体；ヌクレオシド；ヌクレオチド；核酸 (3,852)
    - 水素原子並びに炭素，水素および酸素原子のみからなる糖類基のみを... (415)
      - オリゴ糖類，すなわち．グリコシド結合により相互に結合する糖類基... (145)

【出願番号】特願２０１０−５１２１２８（Ｐ２０１０−５１２１２８）
【出願日】平成２０年６月１３日（２００８．６．１３）
【国際出願番号】ＰＣＴ／ＳＧ２００８／０００２１２
【国際公開番号】ＷＯ２００８／１５３５０４
【国際公開日】平成２０年１２月１８日（２００８．１２．１８）
【出願人】（５０３２３１８８２）エージェンシー　フォー　サイエンス，テクノロジー　アンド　リサーチ (179)
【Ｆターム（参考）】

[ Back to top ]

Ｎ結合型グリカン構造を表すためのシステム及び方法

メニュー

スポンサーリンク

次の公報 »

« 前の公報

Ｎ結合型グリカン構造を表すためのシステム及び方法

メニュー

スポンサー リンク

次の公報 »

« 前の公報

スポンサーリンク