説明

海馬に基づく擬似神経システムを備えたモバイル頭脳ベースのデバイス

【課題】擬似神経システムによって制御し、統制する物理モバイルデバイスNOMADを有する頭脳ベースのデバイス(BBD)を提供する。
【解決手段】この擬似神経システムは、海馬の複雑な解剖学的構造及び生理機能と、皮質を含むその周囲の神経領域とに基づいている。BBDは、非常に多くの物体からの空間信号を時間内に統合して、未知の世界の探検を手助けするための柔軟なナビゲーション解決法を提供する。NOMADは実世界環境内をナビゲートするので、擬似神経システムの海馬は、時間的尺度でNOMADのセンサから受信されるマルチモード入力情報を組織し、この組織をナビゲーションに必要な空間的エピソード記憶の発達のために使用する。

【発明の詳細な説明】
【技術分野】
【0001】
(優先権主張)
米国特許仮出願番号60/588,107、発明名称「海馬に基づいた擬似神経システムを有するモバイル頭脳ベースのデバイス」、発明者Gerald M. Edelmanら、出願日2004年7月15日(代理人管理番号NSRF-01001US0)、及び、米国特許出願番号11/___,___、発明名称「海馬に基づいた擬似神経システムを有するモバイル頭脳ベースのデバイス」、発明者Gerald M. Edelmanら、出願日2005年7月12日(代理人管理番号NSRF-01001US1)。
【0002】
(著作権通告)
本特許明細書の開示部分は、著作権保護を受ける資料を含む。著作権者は、それが特許商標庁のファイル又は記録において発行される限りは、特許明細書又は特許開示の何れによる複製転載に関して異議はないが、それ以外については、如何なるものであれ全著作権を所有する。
【0003】
本発明は、頭脳ベースのデバイスに関し、より詳細には、実世界環境においてナビゲートすることができる頭脳ベースのデバイスに関する。
【背景技術】
【0004】
知能システムは、自立的に行動し、仕事を知的な方法で自動化し、人間の知識を拡張することを意図して開発されてきた。これらのシステムは、次に示す、基本的に既知技術の3つの異なる個別分野にそれぞれ基づいて設計及びモデル化されている。
(1)人工知能(AI)
(2)人工神経ネットワーク(ANN)、そして
(3)頭脳ベースのデバイス(BBD)
AI及びANNに基づく知能システムは、ロボット工学にまで及ぶ範囲でチェスをプレイするようなタスクを実行するようプログラムされた、ディジタルコンピュータを含む。AIアルゴリズムは、論理ベースであり、複雑多岐なソフトウェア命令と共に実装された複雑なアルゴリズムを実行するようプログラムされている。ANNは、生物学的なニューロンの簡略され過ぎた抽象であり、神経システム構造(例えば、神経構造)が考慮されておらず、所望の結果を得るために、監視信号又は教師信号をしばしば要求する。一方で、BBDは異なる原則に基づいており、知的システムの発展に対して異なる取り組み方法がとられている。
【0005】
BBDは、根本的な神経生物学的原則に基づいており、生物に見られる知覚及び学習の頭脳ベースに習ってモデル化されている。BBDは、行動と形状記憶とを制御する詳細な神経構造及び神経ダイナミクスを伴った、擬似頭脳又は擬似神経システムを組み入れている。また、BBDは、形態又は表現型と呼ばれる物理的な具体例を有しており、これにより環境内の活動的な検知及び自立的な動作が可能となる。生物に類似するBBDは、その環境から受信する未分類信号を類型に編成する。重要な環境上の事象が発生したとき、評価システムと呼ばれる擬似神経領域を有するBBSは、デバイスの行動を採用する。
【発明の開示】
【発明が解決しようとする課題】
【0006】
論理ベースの知的システム及びBBDが作動する原理の相違は重要である。これら原理が強力であればあるほど、論理ベースマシンは、新規な状況に効果的に対処することができず、大きなデータセットを同時に処理することができない。これらは、典型的には、予期できず、かつ、非常に多くの要素及び偶発性からなるものであるので、その性質上、新規な状況は、あらかじめプログラムしておくことができない。さらに、広範なパラメータ及び変化する前後関係を伴う状況は、プログラミングにおいて実質的な困難性をもたらす。そして、多くのアルゴリズムはスケーリング特性が乏しく、それは、入力変数の増大に伴って、指数関数的に増大する実行時間を要求されることを意味する。
【0007】
それゆえ、自立的なロボットシステム等の知的システムにおける挑戦課題は、未知の環境探索における成功である。実世界における探索は、ナビゲーションと解決すべき空間記憶タスクとを要求する。しかしながら、このタスクにおいて成功するために要求される記憶は、生物においてのみ見出される機能を要求し、それらは「エピソード」記憶の特質と信じられている。つまり、(1)マルチモードな検知情報を干渉性パターンの中に一緒に置く能力、(2)時間上で情報を一緒に置き、時間的な結果を想起する能力、(3)指示された行動を目指すために記憶を使う能力、である。頭脳の中央側頭葉に位置し、臨床的かつ生理学的によく研究されている海馬は、人間及び動物にける記憶及びナビゲーションに対して非常に重要であることが知られている。したがって、海馬は、先行の生物学ベースのナビゲーションシステムに影響を与え、いくつかはコンピュータ上の海馬モデルであり、他のいくつかはロボットに応用された海馬モデルであったが、その何れにおいても制約があった。
【0008】
先行のコンピュータ上の海馬モデルは仮想入力を伴う計算機上のシミュレーションとして実行されるものであった。これらのコンピュータ上の海馬モデルは、仮想を作り出し、その入力に対する適切な反応を取得するために「先天的な(a priori)」情報を使用する。例えば、これらコンピュータモデルの海馬上の「場所」細胞(つまり、動物が環境内の特定の場所にいるときに活性化するニューロン)は、例えば、デカルト空間における2D(二次元)ポイントなどのモデラーによって具体的に処理された検知入力の組み合わせに応答する。これらの仮定に対する理由の一部は、コンピュータ上の海馬モデルが実環境に置かれていない、それゆえ、これらの偏向(bias)を必要としているところに起因していた。
【0009】
コンピュータ上の海馬モデルのいくつかは、海馬と頭脳の他の領域(例えば、新皮質)との間の相互作用を調査した。しかしながら、これらモデルのいくつかの解剖学的構造は単純過ぎて、海馬皮質の相互作用を意味のある方法で正確には反映していなかった。かかるモデルの1つは、皮質入力としての概念であり、環境地図上の動物の動作に影響を与える活動の移動衝突によって経路統合が解決される想定を形成する、視覚的及び経路統合処理によって海馬の組成を統合する。もし、動物が実世界環境にあるならば、これは、実現可能でない。他のモデルは、海馬内の適切な結合を完全に伴った海馬の洗練されたモデルを構成している。このモデルはかなり詳細であるが、これに対する入力は、海馬に集中する、生成されたマルチモード検知入力に耐えることができないトークン又はシンボルである。このモデルは、記憶想起として読み出される抽象的な出力パターンを生成する。しかしながら、例えば、海馬反応が実際の適応性ある行動をもたらす齧歯類動物のものを伴ったこの反応を解決することは難しい。
【0010】
また、モバイルロボット上で海馬モデルも例示されている間、これら多くのものもまた、例えば、海馬「場所」細胞の反応か、又は、海馬へ入力されるマップの反応を駆動する「先天的な」情報といった仮定を形成する。ナビゲーションタスクのモバイルロボットを制御する神経シミュレーションを有する僅かなロボットモデルは、自律的な探検によってマッピング及び海馬反応を学習する。かかるモデルの1つは、神経生物学に非常に大雑把に関連付けられ、学習のための逆伝搬法(back propagation)として知られているものに類する学習アルゴリズムを使用していた。これは、これは、人工知能SLAMシステムと、環境のマップのような表現を生成するために海馬において表現されたアトラクタダイナミクス概念との混成である、RatSLAMと呼ばれる齧歯類動物の海馬によって影響を受けた、同時局在化及びマッピングアルゴリズムに進展した。さらに、他は、項目指示システムに視覚入力を統合したロボットモデルを構築し、ここで、「場所」細胞は、探検中にモデルの海馬層に発達し、生物学ベースの報酬システムは、「場所」細胞と目標指向行動との間の学習を駆動した。しかしながら、このモデルのいくつかの機能は、生物学に対して忠実ではない。(1)まず、ロボットモデルが新しい場所を発見したことを決定したとき、「場所」細胞は発達する海馬層に加えられる。齧歯類動物などの実物においては、海馬細胞はその皮質又は何れかの入力組み合わせに依存する複数の場所に反応できる。この柔軟性により、分化した位置決めシステムに対立するものとしての海馬多目的記憶マップを実現できる。また、海馬細胞は、必要な基盤として加えられない。(2)第2に、ロボットモデルはフィードフォワードであり、海馬の機能である内因性及び外因性の循環を考慮していなかった。さらに他のシステムにおいては、海馬神経構造及び生物学ベースの目標システムが造られており、モバイルロボット上で試験されている。しかしながら、「場所」細胞は、制御環境のグリッドを応答が一様に覆うよう設計されているという意味において人工的である。報酬学習は、これら場所間の認識マップを作成するために使用される。さらに、海馬において多くの詳細が見出だされ、その周辺領域はモデルに包含されたが、情報はモデルを通って純粋なフィードフォワード形式の中を流れ、嗅内皮質を通って帰還せず、従って新皮質上を通る。
【0011】
10年以上前、SLAM(同時局在化及びマッピング)と通常呼ばれる、ロボットの位置を局在化している間にマップを同時に生成するための統計上のフレームワークが発達した。それ以来、ロボットマッピングの分野は、確率論的技術によって支配された。ナビゲーション問題に対する再帰的解決と、乗り物の動き及びランドマーク監視の静的モデルに基づいた乗り物及びランドマークに対する一致推定(consistent estimate)を計算する手段との両方を直接的に提供するので、最もポピュラーなものは、推定理論又はカルマンフィルタベースのアプローチである。これらロボットのアプローチは、典型的には、レーザー距離計、ソナー又はレーダーによるランドマークまでの距離を測定してランドマークのマップを生成し、同時に、ロボットの位置を推定する。これらの技術は、特定のオフィス環境におけるロボット、郊外環境におけるロボット、そして無人の空中機体のロボットに対するマップ生成では非常にうまくいった。しかしながら、これらの技術は、物体又は状況認識の問題、又は、適切な行動をとる問題、つまりナビゲーションの問題には対処していなかった。
【課題を解決するための手段】
【0012】
本発明は、地形のどの側面を越えることができるか、そしてどの側面を迂回すべきかを学習することによって、変化する地形に適応することができる頭脳ベースのデバイス(BBD)である。BBDは、先行のロボットシステムのマップ作成を超える、環境側面における決定を行う。これらの決定は、本発明にかかるBBDが作り出す局所物体特徴の知覚分類を要求するので、それによって、BBDは進路を計画することができるようになる。
【0013】
本発明にかかるBBDは、神経領域、具体的には、海馬、頭頂皮質、下側頭皮質、及び視床の項目指示システムを有する擬似神経システムを含んでいる。海馬とこれらの領域(図3Aを参照)との間の双方向結合は、海馬(図3Bを参照)内の複雑な結合と同様に、時間とともに多様な情報を循環するシステムからなり、時間的な前後関係を伴った連合記憶の形成を可能にしている。また、BBDは、擬似神経システム制御下の実世界環境において移動可能な可動性ベースを有しており、併せて、BBDが物体を認識し、評価結果を有する行動を選択することができる多重センサ入力を伴っている。
【0014】
これらは、複雑な地形においてナビゲートする本発明のBBDのために、レーザー又はレーダーベースの擬似局在化及びマッピング(SLAM)からの信号を、BBD物体認識システム及び空間内の行動マップに結合させることができる。
【発明を実施するための最良の形態】
【0015】
(詳細説明)
本発明の側面は、同じ参照は同様の要素を示す添付図の図面のおいて、限定としてではなく、例示として説明されている。本開示における「ある」、「一つの」、そして「多様な」実施形態への参照は、必ずしも同一の実施形態に必要なものではなく、かかる参照は少なくとも一つを意味する。以下の記述において、本発明の記述を通して与えられるよう、多くの具体的詳細が記載されている。しかしながら、当業者であれば、これらの具体的な詳細なしでも本発明が実施可能であることは明らかである。他の事例において、既知の特徴については、本発明を不明確にしないために、詳細には記載していない。
【0016】
図1に、自身の環境内を探検し、その環境を経験しながら適応性のある行動を発達させることができるモバイル神経組織モバイル適応デバイス(NOMAD)10の一例として示された、物理的に例示されたデバイスを含む、本発明の頭脳ベースのデバイス(BBD)の描写図を示す。この頭脳ベースのデバイスBBDは、また、その実世界環境においてNOMAD10を導くための、擬似的な神経システム12(図3A〜3Bを参照)も含んでいる。一実施形態において、この擬似的な神経システム12は、さらに記述するように、NOMAD10から離れたコンピュータワークステーション(図10を参照)のクラスタ上を実行できる。この環境において、NOMAD10及びコンピュータワークステーションは、無線通信を介して互いに通信し、それゆえ、NOMAD10は、係留されることなく探検が可能となっている。
【0017】
物理的なデバイス例において、図1に示したNOMAD10は、モバイルベース14と視覚のためのCCDカメラ16とを備えている。また、NOMAD10は、自己移動の合図のための走行距離計18と、エフェクタ20と、障害物回避のためにNOMAD10を包囲する7つの赤外線(IR)検知器22と、移動時に包囲環境内の隠されたプラットフォーム(図2A〜2Bを参照)を検知するために下方正面にある1つのIR検知器24とを有している。NOMAD10の上部には、NOMAD10が移動する環境上に配置された2つのカメラ(後述)によって検知可能な、環境内のNOMADの位置を追跡するためのLED26がある。
【0018】
擬似神経システム12は、実際の解剖学及び生理学の組織に基づいてNOMAD10の行動を誘導し、生きている生物体の環境との相互作用を重要視するものである。よって、この行動は、以下の設計原則に基づいている:(1)NOMAD10は、行動タスクに従事すべきである;(2)NOMADの行動は、頭脳のアーキテクチャ及びダイナミクスを反映した設計を有する擬似神経システムによって制御されるべきである;(3)NOMAD10は、実世界に置かれるべきである;そして、(4)NOMAD10行動と擬似神経システム12の活動とは、実験データとの比較が可能であるべきである。これらの特性によって、BBDシミュレーションは、脊椎動物の頭脳アーキテクチャ及びダイナミクスに影響を与える神経要素のネットワークと、実時間でのネットワーク実行を計算する性能と、例えばNOMAD10のような物理デバイスの工学技術とを要求して、以下に述べる全てのネットワークを包含する。
【0019】
図2Aに、NOMAD10が移動する包囲環境28の配置を概略的に示す。包囲環境28は、例えば、黒い壁30と黒い床32とで囲まれた16’×14’の広さである。様々な色で色付けされた工作用紙34のセットが、黒壁30の各々に掛けられている。図示したように、各々のセット34は複数片の工作用紙を有しており、所定のセット34における各々の断片は同じ幅を有しているが、他のセット34の断片とは異なる幅になっている。
【0020】
また、図2Aには、反射的な黒い工作用紙でできた直径24″の隠されたプラットフォーム36が示されている。隠されたプラットフォーム36は、「隠されたプラットフォーム課題」又は後述する試行に対して包囲環境28の右上四半部の中心に配置されている。NOMAD10は、自身がプラットフォーム36の上に位置するときに下方正面のIR検知器24を使用することによって、この隠されたプラットフォーム36を検知することができる。
【0021】
図2Bに、包囲環境28内のNOMAD10を示すスナップ写真を示す。また、NOMAD10は、BBDの空間及びエピソード記憶を判断するために使用される、隠されたプラットフォーム課題を遂行している様子が示されている。詳細は後述するが、隠されたプラットフォーム課題は、「テスト」試行と「精査」試行との組の2つのフェーズを含んでいる。テスト試行においては、NOMAD10は、床32上のいくつかある位置の何れか1つから移動し始め、隠されたプラットフォーム36に遭遇するか、或は、1000秒後若しくは5000サイクル後といった時間切れとなるまで、いくつかの試行を開始する。試行後、精査試行はBBDの記憶パフォーマンスを評価するために使用される。精査試行においては、隠されたプラットフォーム36は包囲28から取り除かれて、NOMAD10はこの包囲内を5000サイクル移動することができる。
【0022】
図3Aは、擬似神経システム12の局部的かつ機能的な神経構造の概略図であり、海馬及びその周辺領域の複雑な組織と生理機能とを含んでいる。この擬似神経システム12は、多くの物体からの空間信号を遅れることなく統合し、環境28といった未知の環境の探検における手助けのための柔軟なナビゲーション解法を提供する。ナビゲーション課題の間の神経領域からの同時のサンプリングにより、海馬のアーキテクチャは、より完全には後述するが、空間及びエピソード記憶の発達のために重要な、異なる時間スケール上のマルチモード情報を構成するための手段を提供する。
【0023】
図3Aに示したように、擬似神経システム12は、哺乳動物の神経システムの組織及び生理機能に習ってモデル化されているが、理解できるように、遥かに少ないニューロン及び非常に簡素なアーキテクチャで構成されている。擬似神経システム12は、人間の頭脳に類似の皮質及び皮質下に従ってラベル付けされた、いくつかの神経領域を有する。このようにして、図3Aには、V1カラーV2/4カラーITV1幅V2/4幅PrHDATNBF海馬R+R−,そして、HDGとしてラベル付けされた神経領域がそれぞれ示されている。V1カラーV2/4カラー等の各々の神経領域は、種類の異なる神経ユニットを含んでおり、その各々は、ニューロンの局所的個体群を表わしている。図3Aに示された各々の楕円は、各々が多くの神経ユニットを有する、異なった神経領域を意味する。哺乳類の神経システムにおける対応する領域から、モデル化された又は擬似的な神経領域を区別するために、擬似領域には、例えばITなどのように、下線を施すこととする。
【0024】
また、図3Aの神経構造は、多様な投射(図の矢印参照)を介した神経シミュレーション12の図式的な結合を示す。投射は、神経ユニット間の複数のシナプシス結合を含む。シナプシス結合により、シナプシス前ニューロンユニットからシナプシス後ニューロンユニットへ信号が送られる。投射は、神経領域内又は神経領域間の何れかの投射である。さらに、投射Pは、図3Aにおける凡例によって示された通りの属性を有しており、それらは、(1)「電圧独立」、(2)「電圧依存」、(3)「可塑性」、(4)「抑制性」、(5)「評価依存」であるが、詳細は後述する。
【0025】
擬似神経システム12への入力は、CCDカメラ16、ホイール走行測定器18、そして、環境28内の壁30と隠されたプラットフォーム36とを検知するためのIRセンサ22、24から得られるものである。擬似神経システム12の神経領域は、視覚皮質(V1V2/4)、下側頭皮質(IT)、頭頂皮質(Pr)、知能指示細胞(HD)、前方視床核(ATN)、自己中心的な項目(heading)のためのモータ領域(HDG)、評価システム()、そして、正報酬領域及び負報酬領域(R+R−)に類似している。海馬は、3つの主要なセンサ入力ストリーム(ITPrATN)、モータシステム(HDG)、評価システム()に結合される。明瞭のために、各神経領域内の内在的な結合は図3Aから割愛する。
【0026】
図3Bに、海馬領域内の詳細結合を示す。モデル化された海馬は、嗅内皮質(ECINECOUT)と、歯状脳回(DG)と,CA3部分野と、CA1部分野とに類似する領域を含む。これらの領域は、フィードバック抑制(例えば、CA3CA3FBCA3)、フィードフォワード抑制(例えば、DGCA3EFCA3)、及び、規則的な抑制(例えば、BF海馬)を生じさせる介在ニューロンを含む。
【0027】
擬似神経システム12のさらに詳細な説明が、以下の表1及び表2に与えられている。しかしながら、全体的に、以下に詳述するテスト試行及び精査試行において使用される擬似神経システム12のバージョンには、全部で50の神経領域と、該50の神経領域内にある90,000の神経ユニットと、略140万のシナプシス結合とが存在する。
【0028】
図3Aに示した擬似神経システム12は、次の5つのシステムからなる:(1)視覚システム38、(2)知能指示システム40、(3)海馬構造42、(4)評価システム44、そして、(5)活動選択システム46である。
【0029】
(図3A.視覚システム38)
視覚システム38は、第1後頭側頭又は下側皮質経路及び背面皮質経路に習ってモデル化されている。視覚システム(V1_カラーV2/4_カラーIT)における、図3Aに示された下側皮質経路は、連続する領域の神経ユニットを含み、下側頭皮質(IT)において、視覚野全体を覆って地形を有さない受容野までの、累進的に大きな受容野を有する。図3Aに示した背面皮質経路(V1_幅V2/4_幅Pr)は、物体のサイズ及び位置に応答する神経ユニットを含む。
【0030】
CCD16からの視覚イメージは、色及び縁についてフィルタされ、そのフィルタ出力は、領域V1-色及び領域V1-幅における神経活動に直接影響を及ぼす。例えば、CCDカメラは、NOMAD10上のRF送信機を介して、320x240ピクセルRGBビデオイメージを、神経シミュレーションを実行しているコンピュータワークステーション(以下に記載)の1つに取り付けられたフレームグラッバーに送信する。このイメージは、80x60ピクセルイメージを生成するよう空間的に平均される。サイズの異なるガボールフィルター(8x8,16x16,32x32,そして、64x64)を変化する幅の垂直エッジを検出するために利用することができる。ガボール関数の出力は、対応するV1幅サブ領域(V1-幅8V1-幅16V1-幅32,そして、V1-幅64)(図3Aに不図示)の神経ユニット上に直接マップされる。カラーフィルタ(例えば、緑のネガの周囲を伴った赤いポジのセンター、緑のポジの周囲を伴った赤いネガのセンター、ネガの赤緑を伴ったポジの青、ポジの赤緑を伴ったネガの青など)をイメージに適用することができる。カラーフィルタの出力は、V1カラーサブ領域である、V1−赤、V1−緑、V1−青、そして、V1−黄(図3Aに不図示)の神経ユニット上に直接マップされる。V1神経ユニットは、網膜対応的にV2/V4における神経ユニットに投射する。
【0031】
(図3A.項目指示システム40)
領域HDにおけるニューロンは、しばしば「項目指示(head direction)」細胞と呼ばれる。NOMAD10のホイール20から取得される情報は、NOMAD10の現在の項目(heading)を確立するために使用される。この情報は、項目指示神経領域(HD)への入力となる。360HD神経ユニット(表1を参照)の各々は、コサインチューニング曲線を有しており、□ラジアンの調整幅を伴った好適な項目に最大限に応答する。
【数1】

ここで、HDi

の好適な指示を伴った項目指示細胞であり、iは0から359までの範囲であり、curr_headingは、走行距離計情報から計算されるNOMADの項目である。
【0032】
項目指示細胞は、前方視床核(表2及び図3AのHDATNを参照)と、項目(表2及び図3AのHDHDGを参照 − 注:この経路は、図3Aでは不図示)に基づくモータ領域とに類似する領域に地形的に投射する。NOMAD10に対する新しい項目は、神経領域HDGにおける活動に基づいて選択される(図3Aを参照 − さらに詳細は、下記の「活動選択」を参照)。
【0033】
(海馬構造 − 神経領域海馬42)
擬似的な海馬構造のアーキテクチャは、齧歯類動物の神経構造に基づいている。海馬への入力ストリームは、擬似神経システムにおける関連する皮質領域からのものであり、嗅内皮質2(表2及び図3A−3BのATNECINITECINPrECINを参照)を介して海馬に到達する。ミシン目の経路は、主に、嗅内皮質から歯状脳回への投射のみならず、CA3及びCA1サブフィールドへも投射している(表2及び図3BのECINDGECINCA3ECINCA1を参照)。保守的な繊維(表2及び図3BのDGCA3を参照)、シェーファー副側(表2及び図3BのCA3CA1を参照)、そして、海馬から皮質へ戻る発散投射(表2及び図3A−3BのCA1ECOUTATNITPrを参照)もまた、擬似神経システム12に現れている。海馬構造において見られる優勢な再帰結合は、また、擬似神経システム12にも含まれる(表2及び図3BのECINECOUTDGDGCA3CA3を参照)。本来、海馬内の全ての結合(つまり、ECINECOUTDGCA3CA1)は、評価独立及び可塑的である(以下の「シナプシス可塑性」の節を参照)。
【0034】
海馬における、内在的及び外在的な、フィードバック及びフィードフォワード抑制結合の特有なパターンは、海馬処理における重要な役割を担っている。従って、擬似神経システム12は、フィードバック抑制結合(表2及び図3BのECECFBECDGDGFBDGCA3CA3FBCA3CA1CA1FBCA1を参照)と、フィードフォワード抑制結合(表2及び図3BのDGCA3FFCA3CA3CA1FFCA1を参照)とを含んでいる。これらの結合は、分離された入力及びネットワーク安定性に有益である。
【0035】
(前脳基底部及びシータリズム(表2))
擬似前脳基底部(BF)は、神経シミュレーションに対する外因性のシータリズムを与える。この擬似的な前脳基底部領域の機能は、海馬への入力をゲート制御し、活動レベルを安定に保つことである。このBF領域は、13シミュレーションサイクルを越える周期的な活動を有している:
【数2】

ここで、theta={0.01, 0.165, 0.33, 0.495, 0.66, 0.825, 1.00, 0.825, 0.66, 0.495, 0.33, 0.165, 0.01}である。BFは、全ての海馬領域に抑制結合を投射する(表2のBFECINECOUTDGCA3CA1を参照)。適応的である抑制のレベルは、特定の範囲内の海馬領域における活動を維持する。
【数3】

ここで、rは、領域を意味し(つまり、ECINECOUTDGCA3CA1)、sfr(t)は、時間tのスケール素因であり、sr(t)は、時間tの領域rにおける活動的な神経ユニットの割合であり、tgtrは領域rにおける活動ユニットの所望の割合であり(ECIN=10%,ECOUT=10%,DG=20%,CA3=5%,CA1=10%)、そして、BFr(t)は、海馬領域r結合へのBFに対するシナプシス前ニューロンユニット活動である。
【0036】
(図3A.評価システム及び時間的相違学習44)
擬似評価システム44における活動は、NOMAD10によって経験された顕著な知覚事象の発生を伝達し、この活動は、図示した経路における結合強度の調整に寄与する。最初、評価システムは、隠されたプラットフォーム36を検知するIR検知器24によって活性化され(表2及び図3Aの+を参照)、評価依存結合(CA1、及び、CA1HDG)の増強の原因となり、或は、障害物回避IR検知器22によって(表2及び図3Aの-を参照)、評価依存結合の減退の原因となる。学習後は、上記及び詳細には以下に記載するテスト試行に準じて、領域CA1が領域活動に影響を及ぼすこととなる。増強又は減退の規模は、時間的差異(TD)学習規則の神経実装に基づく:
【数4】

ここで、

は、時間tにおける評価システムの平均活動であり、τは1シータサイクル又は13シミュレーションサイクルであり、R+は、正報酬であって下方正面のIR検知器24が引き金になる場合には1に等しく、NOMAD10は隠されたプラットフォーム36上にあることを意味し、Rは罰則であってNOMADベース周囲の7つのIR検知器22のうちの1つが引き金になる場合には1に等しく、NOMDA10は、壁30に近過ぎることを意味する。時間的差異(TD)規則の基本的なアイデアは、学習が、時間的に連続する報酬の予測間の差異に基づいていることである。換言すれば、学習の目標は、次の時間インターバル(τ)における次の予測に、より厳密に一致する現行入力パターンに対する学習者の現在の予測を構成することなのである。もし予測評価が増加するとTDはポジティブであり、擬似神経システム12において影響されたシナプシス結合は増強され、もし、予測評価が減少するとTDはネガティブであり、影響されたシナプシス結合は減退する。いくつかの経験の後は、NOMAD10がプラットフォーム36に向かうに従って評価は増大すべきであり、NOMAD10が障害物に近づくに従って評価は減少すべきであり、このようにして、壁30及び他の障害物から遠ざかる移動を増進する。さらに、この時間的な差異が個々のシナプシス結合にどのように適用されるかについての詳細は、「シナプシス可塑性」の記載において与える。
【0037】
(図3A.動作選択及びナビゲーション行動46)
NOMAD10は、3シータサイクル(39シミュレーションサイクル)前方へ移動し、そして以下に述べるように新しい項目(heading)を選択する。もし、NOMAD10が障害物を検知すると、その方向で24インチ後退し、そして、その障害物を検知したIRセンサ22から引き返す。もし、NOMAD10が隠されたプラットフォーム36を検知すると、全てシステム12の制御のもと、反時計回りに60度回転して3秒間待機し、時計回りに60度回転して3秒間待機し、さらに60度時計回りに回転して3秒間待機し、最終的には反時計回りに回転して元の項目に戻る。シミュレーションは、この時点で終了し、擬似神経システム12の現在の状態はハードディスクに保存される。他の状況では、3シータサイクル後、NOMAD10は擬似神経システム12のモータ領域(HDG)の活動に基づいた新しい項目を選択する。全てシステム12の制御のもと、NOMAD10は、その元の項目から、最初反時計回りに60度回転して3秒間待機し、時計回りに60度回転して3秒間待機し、さらに60度時計回りに回転して3秒間待機し、最終的には反時計周りに回転して元の項目に戻る。HDGの平均活動は、待機時間中計算される。次の等式に基づいて、新しい項目選択に対する確率分布を生成するためのソフトマックスアルゴリズム(softmax algorithm)を使用することができる:
【数5】

ここで、newhdgは、NOMAD10に対して可能性のある新しい項目であり、

は、可能性のある新しい項目でのHDGの平均活動であり、hdgは現行の項目であり、は3つの位置を有している(現行項目、現行項目より60度過少、現行項目より60度過大)。擬似神経システム12が新しい項目を選択した後、NOMAD10は新しい項目に向かい、項目選択処理を再び活性化させる前に、さらに3シータサイクル分前進する。
【0038】
(神経ユニット/ダイナミクス − 一般)
神経領域V1カラーV1幅等の中の神経ユニットは、平均発生(発火)率モデルによってシミュレートされる。各ユニットの状態は平均発生率変数(s)によって決定される。各ユニットの平均発生率変数は、概ね200ミリ秒の期間中の略100ニューロンからなるグループの平均活動又は発生率変数に一致する。
【0039】
V1カラーV1幅等の神経領域の中、及び間、の両方の神経ユニット間のシナプシス結合は、電圧独立又は電圧依存の何れかに、そして、可塑性又は非可塑性の何れかに設定される。電圧独立結合は、ニューロンのシナプシス後状態に関わらず、シナプシス後ニューロンへのシナプシス入力を与える。電圧依存結合は、活性化すべきシナプシス後減極を要求する受容体形式(例えば、NMDAレセプタ)の寄与を意味する。
【0040】
換言すると、シナプシス前ニューロンは、シナプシス前ニューロンへのシナプスを通る軸索に沿って信号を送信する。シナプシス後ニューロンは、この信号を受信し、他のシナプシス前ニューロンから受信している他の信号と統合する。
【0041】
電圧独立結合は、もし、シナプシス前ニューロンが高い割合で発生したような場合には、このシナプスを介して結合されているシナプシス後ニューロンが高い割合で発生することになるであろう。
【0042】
電圧依存結合は異なる。シナプシス前入力信号を受信したとき、もし、シナプシス後ニューロンが既にある割合で発生しているならば、電圧依存結合は、シナプシス後ニューロンをさらに発生(発火)させる。シナプシス後ニューロンは活性、つまり発生(発火)しているので、このニューロンは、入力信号を受信した時ある閾値レベルにある。それゆえ、このシナプシス前結合は、シナプシス後ニューロンを調節してさらに多く発生させる。電圧依存結合は、そのシナプシス前ニューロンがいかに活性化されていても、もし後者が閾値を超えていなければ、シナプシス後ニューロンに何ら影響を与えない。このように、シナプシス後ニューロンは、電圧依存シナプシス結合によって応答又は調整される所定の活性閾値を有している必要がある。
【0043】
(神経ユニット)
各神経ユニットの平均発生(発火)割合(s)は、0(休止状態)から1(最大発生)までの連続した範囲をとる。神経ユニットの状態は、その現行の状況と電圧独立及び電圧依存入力からの寄与との関数として更新される。ユニットjからユニットiへの電圧独立入力は:
【数6】

ここで、Sj(t)はユニットjの活性度であり、cijはユニットjからユニットiへの結合強さである。
【0044】
ユニットi上の電圧独立シナプシス後影響POSTiVIは、ユニットi上の全ての入力を合計することによって計算される:
【数7】

ここで、Mは解剖学的に異なる定義の結合タイプの数であり(表2を参照)、Nlはユニットiへ投射するタイプMの結合数であり、φはシナプシス入力の持続性である。
【0045】
ユニットjからユニットiへの電圧依存入力は、
【数8】

ここで、σiνdepはシナプシス後活動に対する閾値であり、これより低い電圧依存結合は何らの効果も有さない(表1を参照)。
【0046】
ユニットi上の電圧依存シナプシス後影響POSTiVDは、次式で与えられる。
【数9】

【0047】
新しい活動si(t+1)は、神経ユニットi上のシナプシス後影響の合計に基づいて選択される:
【数10】

【0048】
神経ユニットに対する新しい活動は、新しく選択されたフェーズでの活動レベルであり、次の活動関数に依存する:
【数11】

ここで、ωは1つのサイクルから次のサイクルへのユニット活動の持続性を決定し、giはスケーリング要素であり、σifireはユニット固有の発生(発火)閾値である。
【0049】
神経ユニットに対する固有のパラメータ値は、表1で与えられる。つまり、表1は、神経ユニットの属性を規定するパラメータの具体的な値を示す。































(表1)

【0050】
表1に示したように、領域V1HDR+R−及びBFは入力領域であり、その活動度は、カメライメージ、走行距離計、及びIRセンサにそれぞれ基づいている。領域V1及びV2/V4は色に関する4つのサブ領域(赤、緑、青、及び、黄)と、NOMAD10がナビゲートする包囲環境28のサンプルに一致する幅を変更するための4つのサブ領域とを有している。表1は、各領域又はサブ領域(Size)における神経ユニットの数を示している。各領域内の神経ユニットは、特定の発生閾値(σ−fire)と、それを超えると電圧依存結合が効果(σ−νdep)、持続パラメータ(ω)、スケーリング要素(g)を有することができるような閾値とを有することができる。
【0051】
神経ユニットに対するシナプシス結合が、表2に与えられる。つまり、表2は、擬似神経システムの解剖学上の投射及び結合タイプの具体的属性を示す。






(表2)

【0052】
表2に示したように、シナプシス前ニューロンユニットは、所定の確率(p)と所定の投射形状(Arbor)とを伴ってシナプシス後ニューロンユニットに結合する。この樹枝状部形状は、高さ及び幅(h×w)を伴った矩形“[]”であり、内径及び外径(r1,r2)によって拘束される形状を伴ったドーナツ形状“Θ”であり、或は、シナプシス前ニューロンユニット及びシナプシス後ニューロンユニットの何れの対も結合された所定の確率を有している無地形の“non−topo”である。初期の結合強さであるcij(0)は、最小及び最大値(min,max)によって与えられた範囲内で無作為に設定される。cij(0)に対する負の値は、抑制結合を示している。“intra”と印された結合は視覚的サブ領域内のものを意味し、“inter”と印された結合は視覚的サブ領域間のものを意味する。#と印された投射は、評価依存である。すでに述べたように、結合タイプは、電圧独立(VI)又は電圧依存(VD)である。□は、結合の持続性を意味する。η,k1,k2の非ゼロ値は、可塑性結合を意味する。
【0053】
(シナプシス可塑性 − 評価独立可塑性)
シナプシス強さは、シナプシス前及び後ニューロンユニットの位相及び活動度に依存するシナプシス規則に従った調節に対する主体である。可塑性シナプシス結合は、評価独立(図3B及び表2のECINDGCA3CA1DGCA3CA3CA1CA1ECOUTを参照)又は評価依存(CA1CA1HDG)の何れかである。これら規則は共に、修正BCM学習規則に基づいており、ここでは、シナプシス変化(Δcij)はシナプシス後及び前ニューロンユニット活動の関数であり、図3Bの挿入図に図式的に示したように閾値(θ)をスライドさせている。発生位相との強い相関を伴う神経ユニット間のシナプシスは増強され、弱い相関位相を伴った神経ユニット間のシナプシスは減退される;変化量は、シナプシス前及び後活動によって同様に決定される。
【0054】
このように、cijにおける評価独立のシナプシス変化は次式で与えられる:
【数12】

ここで、si(t)及びsj(t)は、それぞれシナプシス前及び後ユニットの活動度であり、ηは固定された学習割合である。関数BCMは、区分的な線形関数として実施され、入力としてシナプシス後活動を取得しており、これは、スライドする閾値、θ、2つの傾斜(k1,k2)及びサチレーションパラメータρ(ρ=6で一定)によって規定される:
【数13】

【0055】
閾値は、シナプシス後活動に基づいて調整される:
【数14】

【0056】
評価独立可塑性は、無限の増大を防止するために、重み正規化する趣旨である:
【数15】

ここで、cijは特定の結合であり、Kは神経ユニットj上の総結合数である。
【0057】
(シナプシス可塑性 − 評価依存可塑性)
評価依存可塑性についての規則は、シナプシス変化が、シナプシス前活動、シナプシス後活動、そして、評価システムからの時間的相違TDによって支配されているという点で、評価独立規則とは異なる(上記「評価システム及び時間的相違学習を参照」)。評価依存シナプシス可塑性のシナプシス変化は次式で与えられる:
【数16】

ここで、TD(t)は、時間tにおける時間的相違評価である。
【0058】
(隠されたプラットフォーム課題)
隠されたプラットフォーム課題は、BBDの空間的及びエピソード記憶を評価し、テスト試行フェーズ及び精査試行フェーズの両方を含む。NOMAD10は、包囲環境28の床32上の4つの開始位置の各々からテスト試行を開始し(図2A−2Bを参照)、隠されたプラットフォーム36に遭遇するか、あるいはタイムアウト(1000秒後又は5000サイクル後)するまで、囲い込みを探検する。テストブロックは、4つの開始位置の各々からの4つのこのような試行の組として定義される。4つのテストブロック(計16試行)は、テスト中にBBDによって遂行され、その結果が図4−5に関連して以下に示されている。テストが完了すると、BBDは精査試行を経験し、そこでは隠されたプラットフォーム36が取り除かれ、BBDの記憶性能が評価され、その内容は図6に関連して以下に説明される。
【0059】
隠されたプラットフォーム課題のテスト及び精査は、9つの僅かに異なるBBD「主題」について繰り返される。各々の「主題」には、同じ物理デバイス、つまりNOMAD10が含まれるが、各々は変更された擬似神経システム12を備えている。「主題」間のこの変化は、個々の神経ユニット間結合の微視的詳細と、これらユニット間の初期結合強さとの両方における、無作為な初期化の結果である。しかしながら、その結合がシナプシス経路、樹枝状部パターン、初期結合強さの範囲に抑制される限りは、残りの神経ユニット間の全体的な結合は、異なる「主題」間と同様である(詳細は、図3A−3B及び表2を参照)。
【0060】
図4に、16のそれぞれの隠されたプラットフォームテスト試行中のNOMAD10の代表的な軌跡を示す。NOMAD10の位置は、包囲28上の頭上カメラ(不図示)によって記録される。図4における各ボックスは、試行(T1〜T16)中のNOMAD10の軌跡と、NOMAD10が隠されたプラットフォーム36を発見するまでに要したシミュレーションサイクルの数とを示す。NOMAD10は各形状において示される小さな黒い四角印からその軌跡を開始し、隠されたプラットフォーム36を発見するために移動している。隠されたプラットフォーム36は、もしNOMAD10が5000シミュレーションサイクル内にプラットフォームを発見できた場合には図中において緑の丸印で示され、もし試行期間中に隠されたプラットフォーム36を発見できなかった場合には、赤の丸印として示される。試行の中間地点までには、つまり試行T8の終了後は、NOMAD10は、その開始点から隠されたプラットフォーム36に向かって、本質的に直線的な軌跡を描くことができている。
【0061】
BBDのそのような各シミュレーションサイクルの間、擬似的な神経システム12への知覚入力は処理され、全ての神経ユニットの状態が計算され、全ての可塑的結合の結合強さが決定されて、モータ出力が生成される。これらの試行において、各々のシミュレーションサイクルの遂行は、実時間で略200ミリ秒要求される。各シミュレーションサイクル、NOMAD10の位置、その項目、及び全ての神経ユニットの状態は、記録され、ハードディスクに保存される。
【0062】
[処理結果]9つの「主題」が、隠されたプラットフォーム課題上で実行された。
【0063】
全般的に、「主題」のグループは、テストが進むに従い、隠されたプラットフォーム36を発見する時間によって測定されたように、隠されたプラットフォーム課題を学習し、改善を示した。図5に、隠されたプラットフォーム課題中に試験された9つの「課題」の平均脱出時間のグラフとしてこの改善を示す。図5に示したように、各「主題」は、各々のブロック内での4つの試行を伴って、4つの試行ブロックを実行する。誤差バーは標準偏差を意味する。脱出時間は、ブロック1(p<0.01)及びブロック2(p<0.05)よりもブロック3及びブロック4の方が短縮されている点が重要である。P−評価は、既知のウィルコクソン標識ランク検定から導かれている。
【0064】
[精査試行]精査試行の間、隠されたプラットフォーム36は取り除かれ、「主題」は、環境28を5000シミュレーションサイクル又は略17分間探検し、「主題」は隠されたプラットフォーム36が存在していた領域を探索するのにかなりの割合の時間を使う。7つの「主題」は、精査試行において試験され、これらの「主題」は、隠されたプラットフォーム36を含む包囲36の象限において、概ねその半分の時間(□=0.50,□2=0.23)を使用している。
【0065】
図6A−6Bに、隠されたプラットフォーム36が取り除かれた精査試行中の「主題」の軌跡を示す。赤の丸印は、テスト試行中の隠されたプラットフォーム36の位置を示す。図6Aは、平均的性能を持つ「主題」が、上記テスト試行中に隠されたプラットフォーム36の使用された象限において、その46%の時間を使用したことを示している。図6Bは、精査試行中により良い性能を示した「主題」が、隠されたプラットフォームの象限において85%の時間を使用したことを示す。
【0066】
[神経反応]擬似神経システム12の海馬領域における神経ユニットの多くは、海馬「場所」細胞と呼ばれる典型反応を有するものであり、ここにおける神経ユニットは、NOMAD10が環境28の特定領域にある間、独占的に活性化している。これは、図7A−7Dにおいて示されており、ここでは、海馬の擬似神経ユニットCA1に記録された4つの代表的な「場所」細胞が示されている。各矩形はNOMAD10が探検する包囲28を示しており、各ピクセルは包囲28における1フィート四方を表わしている。ピクセルの色は所定のCA1神経ユニットの活動度を表わしており、休止(白)から最大発生率(黒)までの正規化が行われている。これらの形状に対する赤の丸印は、隠されたプラットフォーム36の位置を表わしている。
【0067】
神経ユニットの反応は、場所にのみ特有なものではなく、前後関係にも特有なものである。これは、エピソード記憶にとって重要な要求であり、時間と共に入力統合を促進するアーキテクチャを備えたシステムにおいてのみ発生しうるものである。神経ユニットの多くは、NOMADの軌跡に依存する、包囲28における特定の場所に反応する。これらのユニットは「行程依存細胞」と呼ばれる。ユニットは、隠されたプラットフォーム36の近くで反応する(例えば、3フィート内)全ての擬似海馬領域における細胞を探索することによる、遡及コーディング(つまり、この点に関して、現在の活動は、その先行する経験に基づいている)で発見される。全てのテスト及精査試行において、NOMAD10はこの位置を訪れている。しかしながら、図8A−8Fに示したように、これら細胞の大多数は、試行のサブセット上でのみ反応し、同時に、ユニットのより小さな部分は、軌跡に関わらず、試行の大部分上で反応する。
【0068】
より具体的には、図8A−8Fは、海馬モデルにおける行程依存細胞と行程独立細胞とを示す図表である。活発な(平均活動度>0.1)、そして、隠されたプラットフォーム36の3フィート内の中心に置かれた「場所」フィールドを有する神経ユニットが解析に使用されている。行程独立細胞は、5又はそれより多い試行において活発であり、適度な行程依存細胞は3〜4試行において活発であり、高度な行程依存細胞は1〜2試行のみにおいて活発であった。図8A−8Fに、各海馬サブ領域(ECINECOUTDGCA3CA1)及び海馬全体(図8F)における、行程独立細胞と行程依存細胞との割合を示す。
【0069】
多くの場合において、NOMAD10は、所定の開始位置から隠されたプラットフォーム36までの典型的な軌跡を示している。高度な行程依存細胞の略10%は、より小さな軌跡を伴って、隠されたプラットフォーム36の位置の近くで活性化している(つまり、試行9及び13、試行10及び14、試行11及び15、試行12及び16)。
【0070】
図9A−9Hに、神経領域CA1における代表的な「行程依存」「場所」細胞を例示する。この細胞は、NOMAD10が図の上部の壁30から開始している、試行9及び13上の隠されたプラットフォーム36(図中の開口円)の近くで最も活発である。活動は、この細胞に対する全てのテスト試行上の最大発生率に対して正規化される。ここで、白は非活性を意味し、黒は最大活性を意味する。
【0071】
図10は、本発明の多様な実施形態によるコンピュータシステムの例示的説明である。この図表は、論理的に分離したコンポーネントを表わしているが、この記述は単に説明のために過ぎない。当業者にとっては、この図において表現されたコンポーネントは別々のソフトウェア、ファームウェア、及び/又は、ハードウェアコンポーネントの中に任意に結合又は分離できることは明らかである。さらに、当業者にとっては、かかるコンポーネントは、如何様に結合又は分離されようとも、同じコンピューティングデバイス上で実行可能であり、あるいは、1又は複数のネットワークあるいは他の適当な通信手段によって接続された、異なるコンピューティングデバイス間で分配できることも明らかである。
【0072】
多くの実施形態において、図10に例示したコンポーネントは、1又は複数のプログラミング言語(例えば、C,C++,JavaTM,及び他の適当な言語)で実装可能である。コンポーネントは、メッセージパッシングインタフェース(MPI)、あるいは、これに限定されるものではないが、共有メモリ、分散オブジェクト、シンプルオブジェクトアクセスネットワーク(SOAP)を含む、他の適当な通信手段を使用して通信することができる。MPIは、コンピューティングデバイス(又はノード)間で情報を通信するのための産業標準プロトコルである。一実施形態においては、本システムは、ベーオウルフ(Beowulf)クラスタのような(但し、これに限定されない)、マルチプロセッサコンピュータアーキテクチャを用いることができる。ベーオウルフクラスタは、典型的には、イーサネット(登録商標)又は他のいくつかのネットワークを介して接続された商品ハードウェアコンポーネント(例えば、Linuxオペレーティングシステムを実行するパーソナルコンピュータ)で構成される。本開示は、如何なる特定形式の並列コンピューティングアーキテクチャにも限定されない。他の多くのこのようなアーキテクチャも使用可能であって、完全に本開示の範囲内及び趣旨内にある。
【0073】
図10を参照すると、マスターコンポーネント1302は、クライアント1304から受信するコマンドに従って、他のコンポーネントの活動と協働することができる。一実施形態においては、クライアント1304はスタンドアロンプロセスであるか、または、スクリプト又は他のシナリオ及び/又はマスターから受信するクライアント情報(例えば、神経活動、センサ読み取り及びカメラ入力)に応答してプログラム的にマスターを制御するプロセスである。クライアントコマンドはマスター1302を指示して頭脳ベースのデバイスBBDの試験を開始又は停止することができ、その実験状態をデータストア1312に保存し、データストア1312から実験状態を読み出して、実験を実施するための実行時間/回数を設定し、神経シミュレータ1310のパラメータを設定することができる。
【0074】
他の実施形態において、クライアント1304は、マスター1302から情報を受信するユーザインタフェースであり、これによりユーザはシステムを相互作用的に制御することができる。非限定的な例示方法によって、ユーザインタフェースとしては、次の1又は複数を含むことができる:1)グラフィカルユーザインタフェース(GUI)(例えば、ハイパーテキストマークアップ言語で表現されたもの);2)音及び/又はボイスコマンドに応答する能力;3)遠隔制御デバイス(例えば、セルラーホン、PDA、又は、他の適当な遠隔制御)からの入力に応答する能力;4)ジェスチャに応答する能力(例えば、顔の表情等);5)同一又は他のコンピューティングデバイス上のプロセスからの入力に応答する能力;6)コンピュータマウス及び/又はキーボードからの入力に応答する能力。本開示は、如何なる特定のGUIに限定されるものではない。当業者であれば、他の多くのユーザインタフェースが使用可能であって、本開示の範囲内及び趣旨内にあることは明らかである。
【0075】
各神経領域に対する神経ユニットは、神経シミュレータ1310にそれぞれ割り当てられている。各々の神経シミュレータ1310は、割り当てられている神経ユニットの活動度計算を担っている。所定の神経領域の神経ユニットは、1又は複数の神経シミュレータ1310の全域に分布させることができる。多様な実施形態において、1つのベーオウルフノード当たり1つの神経シミュレータ1310を備えることができる。性能を最適化するために神経ユニットは神経シミュレータ間で分布させることができるので、神経シミュレータ上のシナプシス結合の平均数は略同じになる。他の実施形態においては、神経シミュレータ1つ当たりの神経ユニットの平均数を略同一にするよう、神経ユニットを分布させることができる。神経シミュレータは、定期的に、又は継続的に、自らの神経ユニット活動の計算結果を、他の神経シミュレータ及びマスターと交換することができる。この情報は、他の神経シミュレータ上の神経ユニットが最新のシナプシス前入力を持つように要求される。マスターは、神経シミュレータ1310から受信した神経活動に基づいて、NOMAD10にアクチュエータコマンドを与える。
【0076】
マスターは、イメージグラッバー1306から定期的にイメージデータを受信し、これを神経シミュレータ1310とクライアント1304とに分配する。一実施形態において、このイメージは、RGBビデオイメージを送信するNOMAD10に取り付けられたCCDカメラ16から、RF送信機を介して、ImageNation社のPXC200フレームグラッバー1306に送信される。そして、このイメージは、ピクセルイメージを生成するために空間的に平均化される。ガボールフィルターを使用して垂直及び水平方向の縁を検知することができる(既に簡潔に述べた通りである)。ガボール関数の出力は、対応するV1幅神経領域の神経ユニット上に直接マップされる。また、カラーフィルタの出力がV1カラーの神経ユニット上に直接マップされている場合には、カラーフィルタもイメージに適用される。
【0077】
また、マスター1302もNOMAD10のコンポーネント1308からセンサデータを定期的に取得して、神経シミュレータ1310に分配している。一実施形態において、NOMAD10に搭載されたマイクロコントローラ(PIC17C756A)は、そのセンサからの入力及び状態をサンプルし、NOMAD10ベースとマスター1302との間のRS−232通信を制御する。センサ情報には、既に述べたビデオ情報に加えて、グリッパー(gripper)状態、カメラ位置、赤外線検知器、針電極偏差(whisker deflection)、ホイール速度及び方向、走行距離カウントを含む。
【0078】
図11に、本発明の多様な実施形態に従った、神経シミュレータ初期化のフローチャートを例示する。この図は、例示目的のために特定順序で機能段階を記載しているが、この処理は、何れの特定順序又は段階配置にも制限されることはない。当業者であれば、この図に記載された多様な段階は、省略、再配置が可能であり、並列に処理することも、多様な方法で組み合わせ及び/又は適応させることもできることが理解できるであろう。段階1402においては、クライアント1304からのコマンドに基づいて、保存された試行をデータストア1312から検索すべきか否か、あるいは、新しい試行を開始すべきかを判断する。もし、この試行がデータストアから検索されると、段階1410において実行される。多様な実施形態において、試行状態は、拡張マークアップ言語(XML)文書、平文ファイル、あるいは、バイナリファイルとして格納することができる。他方、段階1404において、神経ユニットが表1で与えられたパラメータに従って生成される。次に、段階1406において、シナプシス結合が、表2のパラメータに従って神経ユニット間で生成される。最後に、段階1408において、各神経ユニットが神経シミュレータに割り当てられる。
【0079】
図12に、本発明の多様な実施形態に従った、マスターコンポーネントのフローチャートを例示する。この図は、例示目的のために特定順序で機能段階を記載しているが、この処理は、何れの特定順序又は段階配置にも制限されることはない。当業者であれば、この図に記載された多様な段階は、省略、再配置が可能であり、並列に処理することも、多様な方法で組み合わせ及び/又は適応させることもできることが理解できるであろう。
【0080】
段階1502において、マスター1302は、イメージグラッバー及びNOMAD10から取得したイメージとセンサデータとを、神経シミュレータ及びクライアントにブロードキャストする。段階1504において、マスターは、受信しうるあらゆるコマンドを神経シミュレータにブロードキャストする。段階1506において、クライアント1304がマスター1302に指示して実験を休止させたか否かが判断される。もし、そうならば、マスターは実験を休止する(データストアへの実験状態の保存も含まれる)。他方では、段階1508において、更新された情報がクライアントに提供されて、GUIを更新するように働く。段階1510において、神経シミュレータ1310からの神経ユニット活動は、全てのコンピュータの間で共有される(例えば、MPIを介して)。神経活動は、クライアント情報の一部として、そのクライアントに何れかの形式で提供される。最後に、シミュレーションにおいて何れかの残存サイクルが存在するか否かが判断される。もし、残存サイクルがなければ、試行は終了する。残存サイクルがあれば、マスター1302は段階1502に復帰する。
【0081】
図13に、本発明の多様な実施形態に従った神経シミュレータのフローチャートを例示する。この図は、例示目的のために特定順序で機能段階を記載しているが、この処理は、何れの特定順序又は段階配置にも制限されることはない。当業者であれば、この図に記載された多様な段階は、省略、再配置が可能であり、並列に処理することも、多様な方法で組み合わせ及び/又は適応させることもできることが理解できるであろう。
【0082】
段階1602において、神経シミュレータ1310は、マスター1302によってブロードキャストされたイメージとセンサデータとを受信する。段階1604において、マスター1302によってブロードキャストされたクライアントコマンドが受信される。段階1606において、クライアント1304がマスター1302に試行を中止するように指示したか否かが判断される。もし、そうならば、神経シミュレータ1310は、その遂行を完了する。他方では、段階1608において、神経シミュレータに割り当てられた神経ユニットの評価が計算される。段階1610において、可塑性結合の強さが計算される。局所的な神経ユニット活動は、段階1612において他の神経シミュレータ及びマスターと共有される。加えて、他の神経シミュレータからの神経活動が取得されて、局所的な評価をリフレッシュするために使用される。最後に、段階1614において、試行中に残存するサイクルがあるか否かが判断される。もし、残存サイクルがなければ、試行は終了する。残存サイクルがあれば、神経シミュレータ1310は段階1602に復帰する。
【0083】
コンピュータ技術における当業者にとっては明らかなように、本開示の教示に従ってプログラムされた、従来の汎用又は特定のディジタルコンピュータ若しくはマイクロプロセッサを使用して、多様な実施形態を実施することができる。ソフトウェア技術における当業者にとっては明らかなように、適切なソフトウェアコーディングは、本開示の教示に基づいて、技術を持ったプログラマによって容易に準備可能である。また、当業者にとってすぐに明らかなように、本発明は、集積回路の準備によって、或いは、従来のコンポーネント回路の適切なネットワークの相互接続によって、実施することもできる。
【0084】
多様な実施形態には、ここで与えられた何れの機能をも実行するために、汎用又は特定のコンピューティングプロセッサ/デバイスをプログラム制御するよう使用され、その上(中)に命令を有する記憶媒体(メディア)であるコンピュータプログラム製品が含まれる。記憶媒体には、これに限定されるものではないが、次の1又は複数のものが含まれる。つまり、フロッピディスク、光ディスク、DVD、CD−ROM、マイクロデバイス、磁気光ディスク、ROM、RAM、EPROM、EEPROM、DRAM、VRAM、フラッシュメモリデバイス、磁気又は光カード、ナノシステム(分子的なメモリICを含む)を含むあらゆる形式の物理メディア、そして、あらゆる形式の命令及び/又はデータを蓄積するために適切なメディア又はデバイスである。多様な実施形態には、1又は複数のパブリック又はプライベートネットワーク上で送信され得るコンピュータプログラム製品が含まれ、ここで、この送信には、本明細書において与えられたあらゆる機能を実行するコンピューティングデバイスをプログラム制御するために使用される命令が含まれる。
【0085】
1又は複数のコンピュータ読み取り可能媒体(メディア)に蓄積されて、本開示は、汎用/特定のコンピュータ又はマイクロプロセッサの両方のハードウェアを制御するためのソフトウェアと、人間のユーザ若しくは本発明の結果を使用する他の機械と相互に作用し合うことをコンピュータ又はマイクロプロセッサに可能とするためのソフトウェアと、を含む。かかるソフトウェアには、これに限定されるものではないが、デバイスドライバ、オペレーティングシステム、実行環境/コンテナ、そしてアプリケーションが含まれる。
【0086】
(まとめ)
本発明のBBDは、環境28内の行動中の海馬ユニット活動を観察することによって、空間記憶の獲得及び想起を実演するものであって、エピソード記憶の前提条件となる神経反応に依存した前後関係を有することが示されている。
【0087】
上述したBBD方法論は、エピソード的及び空間的な記憶を調査するために有益である。先行する計算機上の海馬モデルとは異なり、BBDは、環境28において用いられ、環境的な入力についての一切の推定がなされず、空間記憶の課題を解決するためにNOMAD10の行動動作についての仮定もなされない。さらに、空間記憶を構築するために、海馬の抽象概念を有する先行するロボットシステムとは異なり、BBDは、システム神経科学レベルでの詳細な神経構造(表1及び表2を参照)と結合した神経ダイナミクスを備えている。
【0088】
ここに記述したBBDモデルは、海馬内の神経領域と同様に、海馬と皮質との間の巨視的及び微視的な解剖学的構造が考慮されている。BBDは、海馬における神経反応から目的を持った行動へのマッピングを進展させる(図4〜図6を参照)。また、仮定又は指示なしに、齧歯類動物のものと共通性のある「場所」細胞を発達させる(図7及び9を参照)。これらの反応は、時間と共に、NOMAD10の自律的な探検と3つの入力ストリーム(視覚的なもの又はIT,視覚的な場所又はPr,自己移動又はATN)とに基づいて生じる。
【0089】
皮質から海馬への複数のループ(図3A)と海馬固有内のループ(図3B)とは、時間と共に入力を統合し、皮質に依存する空間的記憶を構築するために重要である(図8〜9を参照)。これら前後関係依存の反応は、マルチモードな記憶の連続の獲得及び想起にとって重要であり、エピソード記憶の特質なのである。
【図面の簡単な説明】
【0090】
【図1】物理的なモバイル頭脳ベースのデバイスの外観図である。
【図2A】本発明にかかるBBDが移動する包囲環境の概略図である。
【図2B】図2Aにおいて図示された包囲環境内のBBDのスナップ写真である。
【図3A】神経擬似結合を示す本発明にかかるBBDの擬似神経システムの領域的及び機能的神経構造の図式的な高水準図表である。
【図3B】図3Aの海馬領域内の詳細結合を示す図である。図内挿入図は、BCM学習規則に基づくシナプシス変化規則を示している。
【図4】隠されたプラットフォームテスト試行の間の本発明にかかるBBDの代表的な軌跡を図式的に示す。
【図5】隠されたプラットフォーム課題の間に試験された本発明にかかるBBDのいくつかの実施形態の平均脱出時間を示す図表である。
【図6A】精査試行中の本発明にかかるBBDの各々の実施形態の図式的な軌跡を示す図である。
【図6B】精査試行中の本発明にかかるBBDの各々の実施形態の図式的な軌跡を示す図である。
【図7A】擬似神経領域CA1において記録された内部表現「場所」細胞である。
【図7B】擬似神経領域CA1において記録された内部表現「場所」細胞である。
【図7C】擬似神経領域CA1において記録された内部表現「場所」細胞である。
【図7D】擬似神経領域CA1において記録された内部表現「場所」細胞である。
【図8A】海馬モデルにおける行程依存及び行程独立細胞を表わすチャートである。
【図8B】海馬モデルにおける行程依存及び行程独立細胞を表わすチャートである。
【図8C】海馬モデルにおける行程依存及び行程独立細胞を表わすチャートである。
【図8D】海馬モデルにおける行程依存及び行程独立細胞を表わすチャートである。
【図8E】海馬モデルにおける行程依存及び行程独立細胞を表わすチャートである。
【図8F】海馬モデルにおける行程依存及び行程独立細胞を表わすチャートである。
【図9A】各々の試行中の神経領域CA1における代表的な行程依存「場所」細胞を例示する図である。
【図9B】各々の試行中の神経領域CA1における代表的な行程依存「場所」細胞を例示する図である。
【図9C】各々の試行中の神経領域CA1における代表的な行程依存「場所」細胞を例示する図である。
【図9D】各々の試行中の神経領域CA1における代表的な行程依存「場所」細胞を例示する図である。
【図9E】各々の試行中の神経領域CA1における代表的な行程依存「場所」細胞を例示する図である。
【図9F】各々の試行中の神経領域CA1における代表的な行程依存「場所」細胞を例示する図である。
【図9G】各々の試行中の神経領域CA1における代表的な行程依存「場所」細胞を例示する図である。
【図9H】各々の試行中の神経領域CA1における代表的な行程依存「場所」細胞を例示する図である。
【図10】本発明の多様な実施形態に従ったシステムの例示的説明図である。
【図11】神経シミュレータ初期化のフローチャートの例示である。
【図12】本発明の多様な実施形態に従ったマスターコンポーネントのフローチャートの例示である。
【図13】本発明の多様な実施形態に従った神経シミュレータのフローチャートである。

【特許請求の範囲】
【請求項1】
a)実世界環境におけるマルチモード情報を検知するセンサを有するモバイル適応デバイスと、
b)前記センサによって検知されたマルチモード情報を受信及び処理し、応答して、情報を出力して前記環境内の前記モバイル適応デバイスの動作を制御する擬似神経システムと、
を備え、
c)前記擬似神経システムは、センサ入力ストリームと、出力モータストリームとを含み、かつ、前記擬似神経システムの前記センサ入力システムと前記出力モータストリームとに結合された海馬に類似する神経領域を含む
ことを特徴とする、実世界環境においてナビゲートするモバイル頭脳ベースのデバイス。
【請求項2】
請求項1に記載したモバイル頭脳ベースのデバイスにおいて、前記センサ入力ストリームは、皮質に類似する神経領域を含むことを特徴とするデバイス。
【請求項3】
請求項2に記載したモバイル頭脳ベースのデバイスにおいて、海馬に類似する前記神経領域と皮質に類似する前記神経領域とは、多重ループを通って結合されて、時間と共にマルチモード情報を統合し、空間メモリを形成することを特徴とするデバイス。
【請求項4】
請求項1に記載したモバイル頭脳ベースのデバイスにおいて、前記センサ入力ストリームは、下側頭皮質(IT)に類似する神経領域と、頭頂皮質(Pr)に類似する神経領域と、前方視床核(ATN)システムに類似する神経領域とからなることを特徴とするデバイス。
【請求項5】
請求項4に記載したモバイル頭脳ベースのデバイスにおいて、前記モバイル適応デバイスはイメージ検知手段を構成することを特徴とするデバイス。
【請求項6】
請求項5に記載したモバイル頭脳ベースのデバイスにおいて、下側頭皮質(IT)に類似する前記神経領域はイメージの色情報を処理することを特徴とするデバイス。
【請求項7】
請求項5に記載したモバイル頭脳ベースのデバイスにおいて、前記頭頂皮質(Pr)に類似する神経領域はイメージの幅情報を処理することを特徴とするデバイス。
【請求項8】
請求項5に記載したモバイル頭脳ベースのデバイスにおいて、前記モバイル適応デバイスは項目情報検知手段を構成することを特徴とするデバイス。
【請求項9】
請求項8に記載したモバイル頭脳ベースのデバイスにおいて、前記前方視床核(ATN)に類似する神経領域は項目情報を処理するものであることを特徴とするデバイス。
【請求項10】
請求項4に記載したモバイル頭脳ベースのデバイスにおいて、前記海馬に類似する神経領域は、下側頭皮質(IT)に類似する神経領域と、頭頂皮質(Pr)に類似する神経領域と、前方視床核(ATN)に類似する神経領域とに、投射(P)を介してそれぞれ結合されることを特徴とするデバイス。
【請求項11】
請求項1に記載したモバイル頭脳ベースのデバイスにおいて、前記擬似神経システムは、評価システム(S)に類似する神経領域を更に含み、前記海馬に類似する神経領域に結合されることを特徴とするデバイス。
【請求項12】
請求項11に記載したモバイル頭脳ベースのデバイスにおいて、前記モバイル適応デバイスは、前記モバイル適応デバイスが移動する実世界環境内の障害を検知する手段を含むことを特徴とするデバイス。
【請求項13】
請求項12に記載したモバイル頭脳ベースのデバイスにおいて、前記評価システム(S)は、検知されている障害物が探していたものか、又は、検知されている障害物が回避すべきものであるかについての制御された情報を前記海馬に類似する神経領域に提供する正報酬(R+)システムと負報酬(R−)システムとを含むことを特徴とするデバイス。
【請求項14】
請求項1に記載したモバイル頭脳ベースのデバイスにおいて、前記擬似神経システムは、自己中心的な項目(MHDG)に対するモータ領域に類似する神経領域を更に含むことを特徴とするデバイス。
【請求項15】
請求項14に記載したモバイル頭脳ベースのデバイスにおいて、前記海馬に類似する神経領域は、自己中心的な項目に対するモータ領域に類似する前記神経領域に制御情報を出力して前記モバイル適応デバイスの動作を制御するものであることを特徴とするデバイス。
【請求項16】
請求項1に記載したモバイル頭脳ベースのデバイスにおいて、前記海馬に類似する神経領域は、内嗅皮質(EC)に類似する神経領域と、歯状脳回(DG)に類似する神経領域と、部分野(CA3)及び部分野(CA1)に類似する神経領域とからなることを特徴とするデバイス。
【請求項17】
請求項16に記載したモバイル頭脳ベースのデバイスにおいて、前記海馬に類似する神経領域内に、内嗅皮質(EC)、歯状脳回(DG)、及び部分野(CA3)及び(CA1)を互いに結合するための投射(P)が存在することを特徴とするデバイス。
【請求項18】
請求項1に記載したモバイル頭脳ベースのデバイスにおいて、前記擬似神経システムは、前脳基底部に類似する神経領域を更に含み、海馬に類似する神経領域内へ入力をゲート制御することを特徴とするデバイス。

【図1】
image rotate

【図2A】
image rotate

【図2B】
image rotate

【図3A】
image rotate

【図3B】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6A】
image rotate

【図6B】
image rotate

【図7A】
image rotate

【図7B】
image rotate

【図7C】
image rotate

【図7D】
image rotate

【図8A】
image rotate

【図8B】
image rotate

【図8C】
image rotate

【図8D】
image rotate

【図8E】
image rotate

【図8F】
image rotate

【図9A】
image rotate

【図9B】
image rotate

【図9C】
image rotate

【図9D】
image rotate

【図9E】
image rotate

【図9F】
image rotate

【図9G】
image rotate

【図9H】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate


【公表番号】特表2008−507745(P2008−507745A)
【公表日】平成20年3月13日(2008.3.13)
【国際特許分類】
【出願番号】特願2007−521599(P2007−521599)
【出願日】平成17年7月13日(2005.7.13)
【国際出願番号】PCT/US2005/024814
【国際公開番号】WO2006/019791
【国際公開日】平成18年2月23日(2006.2.23)
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.Linux
【出願人】(506347311)ニューロサイエンシーズ リサーチ ファンデーション インコーポレイテッド (7)