データ処理装置、データ処理方法、およびプログラム

【課題】ロボット等に、実時間性が要求されるタスクを行わせる。
【解決手段】時系列パターンを表現する時系列パターンモデルを有する複数のノードで構成される入力ネットワークnet₁と出力ネットワークnet₂とのノードどうしが結合されている入出力関係モデルM₁₁における入力ネットワークnet₁を、入力データに基づいて、自己組織的に更新するとともに、出力ネットワークnet_out2を、出力データに基づいて、自己組織的に更新し、入力ネットワークnet₁のフレーム単位の入力データに対する勝者ノードと、出力ネットワークnet₂の、フレーム単位の入力データの時刻から一定の時間だけ遅れたフレーム単位の出力データに対する勝者ノードとの結合重みを強めるように更新する。本発明は、例えば、ロボットなどに適用できる。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、データ処理装置、データ処理方法、およびプログラムに関し、特に、例えば、ロボット等が、実時間性が要求されるタスクを行うことができるようにするデータ処理装置、データ処理方法、およびプログラムに関する。
【背景技術】
【０００２】
例えば、自律的にタスクを行うロボットの実現には、順モデルまたは逆モデルを利用することができる。
【０００３】
図１は、順モデルと逆モデルの概念を示している。
【０００４】
ある時系列データ（時系列のデータ）としての入力データに対して、他の時系列データとしての出力データを出力する制御対象が与えられ、制御対象に関する詳細な情報はわからないが（制御対象の内部がわからないが）、制御対象に与えられる入力データと、その入力データに対して制御対象から得られる出力データは観測することができることとする。
【０００５】
ここで、制御対象に与えられる入力データと、その入力データに対して制御対象から得られる出力データとは、観測することができれば、どのような物理量でも良い。また、制御対象は、入力データを与えることができ、かつ、その入力データに対して出力データを得ることができるものであれば、どのような対象（もの）でも良い。
【０００６】
従って、例えば、ボールや、楽器、自動車、ガスヒータその他の種々のものが、制御対象となり得る。即ち、例えば、ボールについては、入力データとしての力を加える（与える）ことで、その入力データに対して変化する出力データとしてのボールの位置や速度が得られる。また、例えば、自動車については、入力データとしてのハンドルや、アクセル、ブレーキなどの操作をする（与える）ことで、その入力データに対して変化する出力データとしての自動車の位置や速度を得ることができる。さらに、例えば、ガスヒータについては、入力データとしての火力を調整する操作をすることで、その入力データに対して変化する出力データとしての部屋の温度を得ることができる。
【０００７】
以上のように、制御対象に入力データを与え、それに対して出力データが得られる場合に、その制御対象をモデル化したもの（モデル）が順モデルである。
【０００８】
順モデルは、入力データを入力すると（入力データが与えられると）、その入力データに対して、制御対象から得られる出力データの推定値を出力する。従って、順モデルによれば、制御対象に対して、実際の入力データを与えなくても、その入力データに対して、制御対象から得られる出力データを推定することができる。
【０００９】
一方、制御対象から得られる出力データの目標値を決定し、その目標値となる出力データを得るために、制御対象に与えるべき入力データを推定することができるモデルが逆モデルである。順モデルは、入力データから出力データへの写像とみなすことができるが、その逆写像が逆モデルである。
【００１０】
ここで、逆モデルによって求められる、目標値となる出力データを得るために、制御対象に与えるべき入力データを、以下、適宜、制御データともいう。
【００１１】
以上のような順モデルや逆モデルは、上述したように、ロボット（の構成）に利用することができる。
【００１２】
即ち、いま、ロボットが、マイク（マイクロフォン）やカメラを備え、音声（音）データや画像データを入力することができ、かつ、スピーカやアクチュエータ（モータ）を備え、音声（音声データ）を出力し、また、モータデータ（モータ信号）にしたがってモータが駆動することにより、アームを動かすことができることとする。
【００１３】
かかるロボットにおいて、ある音声データや画像データなどの入力データに応じて、出力データとしての音声データを出力させ、また、所望のアームの動作をさせる出力データとしてのモータデータを出力させる場合、従来においては、音声認識装置や画像認識装置を用いて、ロボットに入力される音声データや画像データを認識した認識結果に応じて、どのような音声データを出力するべきか、あるいは、どのようなモータデータを出力するべきかを、あらかじめプログラミング（デザイン）しておくことが行われる。
【００１４】
これに対して、順モデルを利用すれば、図２に示すように、ある音声データや画像データに応じて、所望の音声データや、所望のアーム動作をさせるモータデータを出力するロボットを制御対象として想定し、その制御対象として想定したロボット（以下、適宜、想定ロボットと呼ぶ）の順モデルとして、実際のロボットを構成することが可能となる。即ち、想定ロボットに対する入力データと出力データの関係を、実際のロボットに学習させることができれば、想定ロボットの順モデルとしてのロボットを構成することができる。
【００１５】
具体的には、想定ロボットに入力する音声データや画像データなどの入力データと、想定ロボットが各入力データに対応して出力すべき音声データやモータデータなどの出力データとのセットをあらかじめ用意し、実際のロボットに与える。実際のロボットにおいて、外部から与えられた入力データと出力データのセット（以下、適宜、教示データという）だけを用いて、入力データに対応する出力データを推定する（出力する）想定ロボットの順モデルを求めることができれば、実際に入力される音声データや画像データなどの入力データに応じて、所望の音声データやモータデータなどの出力データを出力することが可能となる。
【００１６】
また、逆モデルを利用すれば、図３に示すように、ロボットのアームを制御対象として、その制御対象であるアームを制御するアーム制御器を構成することが可能となる。
【００１７】
即ち、いま、ロボットのアームが、入力データとしてのモータデータに応じて駆動するモータによって動き、その結果、アームの先端の位置が変化するとする。さらに、ロボットの重心を原点とし、ロボットの前方（正面）方向をx軸と、（ロボットから見て）右方向をｙ軸と、上方向をｚ軸と、それぞれする３次元座標系に基づき、その３次元座標系の(x,y,z)座標でアームの先端の位置を表すこととする。この場合、モータデータに応じてモータが駆動し、さらにアームの先端の位置が変化することで、アームの先端がある軌跡を描く。ここで、アームの先端が描く軌跡（先端位置軌跡）の座標のシーケンスを、先端位置軌跡データという。
【００１８】
アームが所望の先端位置軌跡を描くようにするには、つまり、出力データとしての所望の先端位置軌跡データを出力するようにするには、アームがそのような先端位置軌跡を描くようにモータを駆動するモータデータを、入力データとしてモータに与える必要がある。
【００１９】
いま、入力データとしてのモータデータと、そのモータデータがモータに与えられたときの出力データとしての先端位置軌跡データとのセットである教示データだけを用いて、出力データとしての、ある先端位置軌跡データを目標値として得ることができる入力データ（制御データ）としてのモータデータを推定するアームの逆モデルを求めることができれば、その逆モデルは、目標値である先端位置軌跡データに対して、対応するモータデータを決定するアーム制御器に利用することができる。
【００２０】
このようなアームの逆モデルとしてのアーム制御器によれば、ロボットに対して、入力データとしての先端位置軌跡データを入力すると、ロボットは、アーム制御器を用いることで、対応するモータデータ（制御データ）を決定することができる。そして、ロボットが、このモータデータにしたがってモータを駆動すれば、ロボットのアームは、入力データとしての先端位置軌跡データに対応した軌跡を描くように移動する。
【００２１】
以上のように、入力データと出力データとのセット（教示データ）だけを用いて、順モデルや逆モデルを求めることができれば、その順モデルや逆モデルを用いて、各入力データに応じた出力データを出力するロボットを、容易に構成することが可能となる。
【００２２】
以上のような順モデルや逆モデルを求める方法としては、線形システムを用いたモデル化がある。
【００２３】
線形システムを用いたモデル化では、例えば、図４に示すように、時刻tにおける、制御対象への入力データをu(t)とするとともに、出力データをy(t)として、出力データy(t)と入力データu(t)との関係、つまり制御対象を、例えば、式（１）および式（２）で与えられる線形システムとして近似する。
【００２４】
【数１】

【００２５】
【数２】

【００２６】
ここで、x(t)は、時刻tにおける線形システムの状態変数と呼ばれ、A, B, C は係数である。また、ここでは、説明を簡単にするために、入力データu(t)および出力データy(t)を１次元ベクトル（スカラ）とするとともに、状態変数x(t)をn次元ベクトルとすると（ここでは、nは２以上の整数値）、A,B,Cは、それぞれn×n行列、n×1行列、1×n行列で与えられる定数の行列となる。
【００２７】
線形システムを用いたモデル化では、観測することができる入力データu(t)と、その入力データu(t)が制御対象に与えられたときに観測される出力データy(t)との関係が、式（１）および式（２）を満たすように、行例A,B,Cを決定することで、制御対象の順モデルが得られる。
【００２８】
しかしながら、線形システムを用いたモデル化は、複雑な制御対象、即ち、例えば、非線形な特性を持つ制御対象をモデル化するには十分ではない。
【００２９】
即ち、現実の制御対象は複雑であり、非線形な特性を有することが少なくないが、かかる制御対象を、単純な線形システムとして近似してモデル化すると、順モデルが入力データに対して推定する出力データや、逆モデルが出力データに対して推定する入力データ（制御データ）の推定誤差が大になり、高精度の推定を行うことが困難となる。
【００３０】
そこで、非線形な特性を持つ制御対象に対する順モデルや逆モデルを得る方法としては、例えば、ニューラルネットワークを用いて、教示データ、即ち、制御対象に与えられる入力データと、その入力データが与えられたときに制御対象から観測される出力データとのセットを学習する方法がある。ここで、ニューラルネットワークとは、生体の神経細胞（ニューロン）を模擬した人工素子を相互接続して構成されるネットワークであり、外部から与えられる教示データの関係、つまり、入力データと出力データとの関係を学習することができる。
【００３１】
しかしながら、ニューラルネットワークによって、制御対象を適切にモデル化するには、制御対象の複雑性に応じて、ニューラルネットワークの規模を大にする必要がある。ニューラルネットワークの規模が大になると、学習に要する時間が飛躍的に増大し、また、安定した学習も難しくなる。このことは、入力データや出力データの次元数が大である場合も同様である。
【００３２】
一方、入力データと出力データとのセット（教示データ）だけを用いて、順モデルや逆モデルを求める場合には、教示データを用いて学習を行い、教示データが、幾つかのパターンのうちのいずれに該当するかを認識する必要がある。即ち、教示データとしての入力データや出力データのパターンを学習して認識する必要がある。
【００３３】
パターンを学習して認識を行う技術は、一般にパターン認識（pattern recognition）と呼ばれ、パターン認識における学習は、教師あり学習（supervised learning）と、教師なし学習（unsupervised learning）とに分けることができる。
【００３４】
教師あり学習とは、各パターンの学習データがどのクラスに属するかの情報（これを正解ラベルと呼ぶ）を与えて、各パターンごとに、そのパターンに属する学習データを学習する方法であり、ニューラルネットワークや、HMM（Hidden Markov Model）などを用いた学習方法が数多く提案されている。
【００３５】
ここで、図５は、教師あり学習の一例を示している。
【００３６】
教師あり学習では、学習に利用する学習データが、想定したカテゴリ（クラス）（例えば、各音素のカテゴリや、各音韻のカテゴリ、各単語のカテゴリなど）ごとに用意される。例えば、"A"，"B"，"C"という発声の音声データを学習する場合、"A"，"B"，"C"それぞれの多数の音声データが用意されることになる。
【００３７】
一方、学習に利用するモデル（各カテゴリの学習データを学習させるモデル）も、想定したカテゴリごとに用意される。ここで、モデルは、パラメータによって定義される。例えば、音声データの学習には、モデルとして、ＨＭＭなどが用いられるが、HMMは、ある状態から他の状態（元の状態を含む）に遷移する状態遷移確率や、HMMから出力される観測値の確率密度を表す出力確率密度関数などによって定義される。
【００３８】
教師あり学習では、各カテゴリ（クラス）のモデルの学習が、そのカテゴリの学習データのみを用いて行われる。即ち、図５では、カテゴリ"A"のモデルの学習は、カテゴリ"A"の学習データのみを用いて行われ、カテゴリ"B"のモデルの学習は、カテゴリ"B"の学習データのみを用いて行われる。同様に、カテゴリ"C"のモデルの学習も、カテゴリ"C"の学習データのみを用いて行われる。
【００３９】
教師あり学習においては、このように、各カテゴリの学習データを用いて、そのカテゴリのモデルの学習を行う必要があるため、カテゴリごとに、そのカテゴリの学習データを用意し、各カテゴリのモデルの学習に対して、そのカテゴリの学習データを与えて、カテゴリごとのモデルを得る。その結果、教師あり学習によれば、正解ラベルに基づき、クラスごとのテンプレート（正解ラベルが表すクラス（カテゴリ）のモデル）を得ることができる。
【００４０】
そして、認識時には、ある認識対象のデータに対し、その認識対象のデータに最も適合(match)するテンプレート（尤度が最も高いテンプレート）が求められ、そのテンプレートの正解ラベルが、認識結果として出力される。
【００４１】
一方、教師なし学習は、各パターンの学習データに正解ラベルが与えられない状況で行われる学習であり、例えば、ニューラルネットなどを用いた学習方法があるが、正解ラベルが与えられないという点で、教師あり学習とは大きく異なる。
【００４２】
ところで、パターン認識は、そのパターン認識によって認識しようとする認識対象のデータ（信号）が観測される信号空間の量子化と見ることができる。特に、認識対象のデータがベクトルである場合のパターン認識は、ベクトル量子化（vector quantization）と呼ばれることがある。
【００４３】
ベクトル量子化の学習（コードブックの生成）では、認識対象のデータが観測される信号空間上に、クラスに対応する代表的なベクトル（これをセントロイドベクトルと呼ぶ）が配置される。
【００４４】
ベクトル量子化の教師なし学習として代表的な手法の一つに、K-平均法（K-means clustering method）がある。K-平均法は、初期状態として、セントロイドベクトルを適当に配置し、学習データとしてのベクトルを、最も距離の近いセントロイドベクトルに割り当て、各セントロイドベクトルに割り当てられた学習データの平均ベクトルによってセントロイドベクトルを更新することを繰り返す学習手法である。なお、セントロイドベクトルの集まりは、コードブックと呼ばれる。
【００４５】
ここで、多数の学習データを蓄積し、そのすべてを用いて学習を行う方法は、バッチ学習（batch learning）と呼ばれ、K-平均法は、バッチ学習に分類される。バッチ学習に対して、学習データを観測するたびに、その学習データを用いて学習を行い、パラメータ（セントロイドベクトルのコンポーネントや、HMMを定義する出力確率密度関数など）を少しずつ更新する学習は、オンライン学習（on-line learning）と呼ばれる。
【００４６】
オンライン学習としては、コホネン(T.Kohonen)の提案したSOM（self-organization map）による学習が知られている。SOMによる学習では、SOMの入力層と出力層の結合重みが、オンライン学習により少しずつ更新（修正）されていく。
【００４７】
即ち、SOMにおいて、出力層は、複数のノードを有し、出力層の各ノードには、重みベクトルが与えられる。この重みベクトルをセントロイドベクトルとした場合、ベクトル量子化における学習を行うことができる。
【００４８】
具体的には、SOMの出力層のノードにおいて、重みベクトルと、学習データとしてのベクトルとの距離が最も近いノードが、その学習データとしてのベクトルに最も適合する勝者ノードに決定され、その勝者ノードの重みベクトルが、学習データとしてのベクトルに近づくように更新される。さらに、勝者ノードの近傍のノードの重みベクトルも、学習データに少しだけ近づくように更新される。その結果、学習が進むにつれ、重みベクトルが類似したノードどうしは近くなるように、類似しないノードは遠くなるように、出力層の上に配置されていく。従って、出力層には、あたかも学習データに含まれるパターンに応じた地図が構成されていくことになる。このように、学習が進むにつれて、類似するノード（重みベクトルが類似するノード）どうしが近い位置に集まり、学習データに含まれるパターンに応じた地図が構成されていく学習は、自己組織的または自己組織化（self-organization）と呼ばれる。
【００４９】
ここで、K-平均法では、学習データに最も距離の近いベクトルのみが更新されることから、その更新方法はWTA(winner-take-all)と呼ばれる。一方、SOMによる学習では、学習データに最も距離の近いノード（勝者ノード）の重みベクトルだけでなく、勝者ノードの近傍のノードの重みベクトルも更新されるから、その更新方法はSMA(soft-max adaptation)と呼ばれる。WTAで学習を行うと学習結果が局所解に陥りやすいのに対して、SMAで学習を行うと、局所解に陥る問題を改善することができることが知られている。
【００５０】
なお、SOMに関しては、例えば、非特許文献１に記載されている。
【００５１】
【非特許文献１】T.コホネン、「自己組織化マップ」、シュプリンガー・フェアラーク東京
【発明の開示】
【発明が解決しようとする課題】
【００５２】
ところで、ロボットの実世界での振る舞い（行動）をより自然にするため、ロボット自身が自分の行動を通して認知行動の構造を獲得するための枠組みの研究が行われている。この枠組みは、「認知行動アーキテクチャ」と呼ばれる。ここで、認知行動とは、例えば、ロボット等が、外部の状態（ロボット自身の状態も含む）を認知（認識）し、その認知結果に応じて行動をとることを意味する。
【００５３】
これまでの多くのロボット行動制御の方法論が、事前に作りこみ（ロボットの設計者等によるプログラミング）を行って行動を発現させていたのに対して、「認知行動アーキテクチャ」は、できる限り作りこみを排除し、自己探索、教示、ものまねなどに基づいて認知行動を獲得させる方法論である。このような「認知行動アーキテクチャ」で行動を獲得したロボットは、与えられた環境に適応し、頑健に振る舞える可能性がある。
【００５４】
「認知行動アーキテクチャ」は、例えば、外部の状態を検知するセンサが出力するセンサデータに対して、ロボットを駆動するモータに供給されるモータデータとして、適切なモータデータを計算する問題に抽象化することができる。ここでいう「適切」には、知的であるといった深い意味が込められている。
【００５５】
一般に、センサが出力するセンサデータと、モータに供給されるモータデータとは、いずれも連続的な時系列データである。また、現在とるべき行動は、現在の外部の状態のみならず、過去の外部の状態や、過去にとった認知行動等を必要に応じて考慮して決定する必要がある。即ち、現在とるべき認知行動の決定にあたっては、コンテキストを扱う必要性がある。さらに、実世界での認知行動を行うロボットでは、センサデータやモータデータとして、次元数の大きなデータを扱う必要がある。また、かかるロボットで扱うセンサデータやモータデータの振る舞いは複雑であり、線形システムでモデル化することは困難である。そして、「認知行動アーキテクチャ」を実世界に適用するには、上述のようなセンサデータやモータデータを効率良く取り扱う方法が必要となる。
【００５６】
そこで、センサデータやモータデータのような時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される時系列パターン記憶ネットワークによって、多次元のベクトルの時系列であるセンサデータやモータデータなどの時系列データを自己組織的に学習し、さらに、入力データとしての時系列データを学習した時系列パターン記憶ネットワークと、出力データとしての時系列データを学習した時系列パターン記憶ネットワークとのノードどうしを結合し、入力データに基づき、外部の状態を認知し、その認知結果に応じてロボットがとるべき行動に対応する出力データを生成する方法について、本件出願人は、先に提案している（例えば、特願2004-353382号）。
【００５７】
先に提案した方法によれば、多次元のベクトルの時系列のような、入力データと出力データとの対応関係（例えば、五十音の音声データと、その音声データをまねた（聞きまねした）音声データとの対応関係）や、センサデータとモータデータとの対応関係のようなクロスモーダルな対応関係（例えば、人が視覚（ビジョン）によって獲得する情報と、その情報に対してとる行動（行う運動）との対応関係）を学習することができる。
【００５８】
しかしながら、先に提案した方法では、時系列データの自己組織的な構造生成と、時系列データどうしの間の静的な対応関係の学習とを行うが、その方法を適用することができるタスクとしては、実時間性が要求されないタスクに制限されることがあった。
【００５９】
即ち、例えば、動いている物体に対し、その物体を追いかけるような働きかけをするタスクには、現に動いている物体の状態の認知と、その認知結果に応じて物体を追いかけるという行動とを、実時間で連続的に行うことが要求されるが、先に提案した方法では、かかるタスクの学習が困難なことがあった。
【００６０】
本発明は、このような状況に鑑みてなされたものであり、例えば、ロボット等が、実時間性が要求されるタスクを行うことができるようにするものである。
【課題を解決するための手段】
【００６１】
本発明の一側面のデータ処理装置は、時系列データである入力データと、他の時系列のデータである出力データとの関係の学習を行うデータ処理装置であり、前記入力データから所定の時間単位の入力データを抽出するとともに、前記出力データから前記所定の時間単位の出力データを抽出する入出力データ抽出手段と、前記入力データとしての時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される入力時系列パターン記憶ネットワークと、前記出力データとしての時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される出力時系列パターン記憶ネットワークとを有し、前記入力時系列パターン記憶ネットワークのノードと、前記出力時系列パターン記憶ネットワークのノードとが結合されている入出力関係モデルにおける前記入力時系列パターン記憶ネットワークのノードの中から、前記所定の時間単位の入力データに最も適合するノードである入力勝者ノードを決定し、前記入力勝者ノードに基づいて、前記入力時系列パターン記憶ネットワークを、自己組織的に更新する認識学習処理手段と、前記出力時系列パターン記憶ネットワークのノードの中から、前記所定の時間単位の出力データに最も適合するノードである出力勝者ノードを決定し、前記出力勝者ノードに基づいて、前記出力時系列パターン記憶ネットワークを、自己組織的に更新する生成学習処理手段と、前記入力時系列パターン記憶ネットワークの前記所定の時間単位の入力データに対する前記入力勝者ノードと、前記出力時系列パターン記憶ネットワークの、前記所定の時間単位の入力データの時刻から一定の時間だけ遅れた前記所定の時間単位の出力データに対する前記出力勝者ノードとの結合の度合いを表す結合重みを強めるように更新する結合重み更新手段とを備える。
【００６２】
本発明の一側面のデータ処理方法、またはプログラムは、時系列データである入力データと、他の時系列のデータである出力データとの関係の学習を行うデータ処理装置のデータ処理方法、または時系列データである入力データと、他の時系列のデータである出力データとの関係の学習を行うデータ処理を、コンピュータに実行させるプログラムであり、前記入力データから所定の時間単位の入力データを抽出するとともに、前記出力データから前記所定の時間単位の出力データを抽出し、前記入力データとしての時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される入力時系列パターン記憶ネットワークと、前記出力データとしての時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される出力時系列パターン記憶ネットワークとを有し、前記入力時系列パターン記憶ネットワークのノードと、前記出力時系列パターン記憶ネットワークのノードとが結合されている入出力関係モデルにおける前記入力時系列パターン記憶ネットワークのノードの中から、前記所定の時間単位の入力データに最も適合するノードである入力勝者ノードを決定し、前記入力勝者ノードに基づいて、前記入力時系列パターン記憶ネットワークを、自己組織的に更新し、前記出力時系列パターン記憶ネットワークのノードの中から、前記所定の時間単位の出力データに最も適合するノードである出力勝者ノードを決定し、前記出力勝者ノードに基づいて、前記出力時系列パターン記憶ネットワークを、自己組織的に更新し、前記入力時系列パターン記憶ネットワークの前記所定の時間単位の入力データに対する前記入力勝者ノードと、前記出力時系列パターン記憶ネットワークの、前記所定の時間単位の入力データの時刻から一定の時間だけ遅れた前記所定の時間単位の出力データに対する前記出力勝者ノードとの結合の度合いを表す結合重みを強めるように更新するステップを含む。
【００６３】
本発明の一側面では、入出力関係モデルにおいて、前記入力データとしての時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される入力時系列パターン記憶ネットワークと、前記出力データとしての時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される出力時系列パターン記憶ネットワークとのノードどうしが結合されている。かかる入出力関係モデルにおける前記入力時系列パターン記憶ネットワークのノードの中から、前記所定の時間単位の入力データに最も適合するノードである入力勝者ノードが決定され、前記入力勝者ノードに基づいて、前記入力時系列パターン記憶ネットワークが、自己組織的に更新される。また、前記出力時系列パターン記憶ネットワークのノードの中から、前記所定の時間単位の出力データに最も適合するノードである出力勝者ノードが決定され、前記出力勝者ノードに基づいて、前記出力時系列パターン記憶ネットワークが、自己組織的に更新される。そして、前記入力時系列パターン記憶ネットワークの前記所定の時間単位の入力データに対する前記入力勝者ノードと、前記出力時系列パターン記憶ネットワークの、前記所定の時間単位の入力データの時刻から一定の時間だけ遅れた前記所定の時間単位の出力データに対する前記出力勝者ノードとの結合の度合いを表す結合重みが強めるように更新される。
【発明の効果】
【００６４】
本発明の一側面によれば、例えば、ロボット等が、実時間性が要求されるタスクを行うことができるようになる。
【発明を実施するための最良の形態】
【００６５】
以下に本発明の実施の形態を説明するが、本発明の構成要件と、明細書又は図面に記載の実施の形態との対応関係を例示すると、次のようになる。この記載は、本発明をサポートする実施の形態が、明細書又は図面に記載されていることを確認するためのものである。従って、明細書又は図面中には記載されているが、本発明の構成要件に対応する実施の形態として、ここには記載されていない実施の形態があったとしても、そのことは、その実施の形態が、その構成要件に対応するものではないことを意味するものではない。逆に、実施の形態が構成要件に対応するものとしてここに記載されていたとしても、そのことは、その実施の形態が、その構成要件以外の構成要件には対応しないものであることを意味するものでもない。
【００６６】
本発明の一側面のデータ処理装置は、
時系列データである入力データと、他の時系列のデータである出力データとの関係の学習を行うデータ処理装置であり、
前記入力データから所定の時間単位の入力データを抽出するとともに、前記出力データから前記所定の時間単位の出力データを抽出する入出力データ抽出手段（例えば、図２５のデータ抽出部３１２）と、
前記入力データとしての時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される入力時系列パターン記憶ネットワーク（例えば、図２６の時系列パターン記憶ネットワークnet₁）と、
前記出力データとしての時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される出力時系列パターン記憶ネットワーク（例えば、図２６の時系列パターン記憶ネットワークnet₂）と
を有し、
前記入力時系列パターン記憶ネットワークのノードと、前記出力時系列パターン記憶ネットワークのノードとが結合されている
入出力関係モデル（例えば、図２６の入出力関係モデルM₁₁）における前記入力時系列パターン記憶ネットワークのノードの中から、前記所定の時間単位の入力データに最も適合するノードである入力勝者ノードを決定し、前記入力勝者ノードに基づいて、前記入力時系列パターン記憶ネットワークを、自己組織的に更新する認識学習処理手段（例えば、図２５の認識学習処理部３２１）と、
前記出力時系列パターン記憶ネットワークのノードの中から、前記所定の時間単位の出力データに最も適合するノードである出力勝者ノードを決定し、前記出力勝者ノードに基づいて、前記出力時系列パターン記憶ネットワークを、自己組織的に更新する生成学習処理手段（例えば、図２５の生成学習処理部３２２）と、
前記入力時系列パターン記憶ネットワークの前記所定の時間単位の入力データに対する前記入力勝者ノードと、前記出力時系列パターン記憶ネットワークの、前記所定の時間単位の入力データの時刻から一定の時間だけ遅れた前記所定の時間単位の出力データに対する前記出力勝者ノードとの結合の度合いを表す結合重みを強めるように更新する結合重み更新手段（例えば、図２５の結合重み更新部３３３）と
を備える。
【００６７】
一側面のデータ処理装置には、
前記入力データから前記所定の時間単位の入力データを抽出する入力データ抽出手段（例えば、図２５のデータ抽出部３１５）と、
前記入出力関係モデルにおける前記入力時系列パターン記憶ネットワークのノードの中から、前記入力データ抽出手段が抽出した前記所定の時間単位の入力データに最も適合するノードである入力勝者ノードを決定する入力勝者ノード決定手段（例えば、図２５の勝者ノード決定部３４２）と、
前記出力時系列パターン記憶ネットワークのノードの中から、前記入力勝者ノード手段が決定した前記入力勝者ノードとの結合が最強のノードを、前記他の時系列データを生成する生成ノードとして決定する生成ノード決定手段（例えば、図２５の生成ノード決定部３５１）と、
前記生成ノードが有する前記時系列パターンモデルに基づいて、前記他の時系列データを生成する生成手段（例えば、図２５の時系列生成部３６１）と
をさらに設けることができる。
【００６８】
本発明の一側面のデータ処理方法、またはプログラムは、
時系列データである入力データと、他の時系列のデータである出力データとの関係の学習を行うデータ処理装置のデータ処理方法、または時系列データである入力データと、他の時系列のデータである出力データとの関係の学習を行うデータ処理を、コンピュータに実行させるプログラムであり、
前記入力データから所定の時間単位の入力データを抽出するとともに、前記出力データから前記所定の時間単位の出力データを抽出し（例えば、図２９のステップＳ３０１）、
前記入力データとしての時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される入力時系列パターン記憶ネットワーク（例えば、図２６の時系列パターン記憶ネットワークnet₁）と、
前記出力データとしての時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される出力時系列パターン記憶ネットワーク（例えば、図２６の時系列パターン記憶ネットワークnet₂）と
を有し、
前記入力時系列パターン記憶ネットワークのノードと、前記出力時系列パターン記憶ネットワークのノードとが結合されている
入出力関係モデル（例えば、図２６の入出力関係モデルM₁₁）における前記入力時系列パターン記憶ネットワークのノードの中から、前記所定の時間単位の入力データに最も適合するノードである入力勝者ノードを決定し、前記入力勝者ノードに基づいて、前記入力時系列パターン記憶ネットワークを、自己組織的に更新し（例えば、図２９のステップＳ３０２₁）、
前記出力時系列パターン記憶ネットワークのノードの中から、前記所定の時間単位の出力データに最も適合するノードである出力勝者ノードを決定し、前記出力勝者ノードに基づいて、前記出力時系列パターン記憶ネットワークを、自己組織的に更新し（例えば、図２９のステップＳ３０２₂）、
前記入力時系列パターン記憶ネットワークの前記所定の時間単位の入力データに対する前記入力勝者ノードと、前記出力時系列パターン記憶ネットワークの、前記所定の時間単位の入力データの時刻から一定の時間だけ遅れた前記所定の時間単位の出力データに対する前記出力勝者ノードとの結合の度合いを表す結合重みを強めるように更新する（例えば、図２９のステップＳ３０４）
ステップを含む。
【００６９】
以下、図面を参照して、本発明の実施の形態について説明するが、その前段階の準備として、時系列パターン記憶ネットワークについて説明する。
【００７０】
図６は、時系列パターン記憶ネットワークの例を模式的に示している。
【００７１】
時系列パターン記憶ネットワークは、時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成されるネットワークで、そのネットワーク全体で、ノードの数だけの（クラス分けを行う）時系列パターンを記憶する。
【００７２】
図６においては、時系列パターン記憶ネットワークは、ノードN₁乃至N₆の６つのノードから構成されている。
【００７３】
時系列パターン記憶ネットワークを構成する各ノードN_i（図６では、ｉ＝１，２，・・・，６）は、時系列パターンを表現する時系列パターンモデルを有する。また、ノードN_iは、他のノードN_j（図６では、ｊ＝１，２，・・・，６）と結合関係を持つことができる。この結合関係をリンクと呼ぶ。図６では、例えば、ノードN₁は、ノードN₂，N₃と直接の結合関係を有している。また、例えば、ノードN₃は、ノードN₁，N₂，N₅，N₆と直接の結合関係を有しており、従って、ノードN₅とN₆は、ノードN₃を介して、ノードN₁と間接的な結合関係を有している。なお、２つのノードN_iとN_jとの結合関係としては、その２つのノードN_iとN_jとの最短の結合関係を考えるものとする。
【００７４】
時系列パターン記憶ネットワークの学習（時系列パターン記憶ネットワークに時系列パターンを記憶させる学習）は、時系列データを、学習用の学習データとして行われるが、この学習データは、カテゴリの種類や、カテゴリの数が未知のもので、この点、時系列パターン記憶ネットワークの学習は、前述の図５で説明した教師あり学習と大きく異なる。また、時系列パターン記憶ネットワークの学習に用いられる学習データには、正解ラベルは付与されていない。このため、時系列パターン記憶ネットワークの学習には、前述の図５で説明した教師あり学習を適用することはできない。
【００７５】
このように、時系列パターン記憶ネットワークの学習には、教師あり学習を適用することができず、また、学習データは、そのカテゴリの種類も、カテゴリの数も未知である。そこで、時系列パターン記憶ネットワークの学習は、その全体（のノード）によって、学習データの特徴（時系列パターン）を適切に表現することができるように、自己組織的に行われる。
【００７６】
なお、時系列パターン記憶ネットワークの学習は、教師なし学習である。また、時系列パターン記憶ネットワークの学習は、ある１つのノードが、必ずしもある１つのカテゴリに対応するように行われるとは限らない。即ち、時系列パターン記憶ネットワークにおいては、１つのノードが１つのカテゴリに対応するように学習が行われる場合もあるし、複数のノードが１つのカテゴリに対応するように学習が行われる場合もある。さらに、１つのノードが複数のカテゴリに対応するように学習が行われる場合もある。従って、仮に、学習データが、明確にカテゴリ分けすることができないものであっても、時系列パターン記憶ネットワークによる学習は行うことができる。
【００７７】
次に、図７は、時系列パターン記憶ネットワークのノードN_iの構成例を模式的に示している。
【００７８】
ノードN_iは、時系列パターンを表現する時系列パターンモデル２１と、その時系列パターンモデル２１の学習に用いる学習データを記憶する学習データ記憶部２２とから構成される。
【００７９】
ここで、図７では、時系列パターンモデル２１として、状態確率遷移モデルの１つであるHMM（連続HMM）が採用されている。また、図７では、HMMは、自己ループと次状態（右隣の状態）への状態遷移だけを有するleft-to-right型の３状態S₁，S₂，S₃を有するものとなっている。図７の時系列パターンモデル２１における○印は状態を表し、矢印は状態遷移を表している。なお、時系列パターンモデル２１としてのHMMは、left-to-right型や、３状態のもの等に限定されない。
【００８０】
時系列パターンモデル２１が、図７に示したようなHMMである場合、その時系列パターンモデル２１としてのHMMは、状態遷移確率と出力確率密度関数（HMMが離散HMMである場合には、スカラ量である離散的なシンボルが出力される確率）とで定義される。
【００８１】
状態遷移確率は、HMMにおいて、状態が遷移する確率で、図７の時系列パターンモデル２１における矢印で示した状態遷移それぞれに対して与えられる。出力確率密度関数は、状態遷移時に、HMMから観測される値の確率密度を表す。出力確率密度関数としては、例えば、混合正規分布などが採用される。これらのHMMのパラメータ（状態遷移確率と出力確率密度関数）は、例えば、Baum-Welch 法によって学習（推定）することができる。
【００８２】
ノードN_iでは、学習データ記憶部２２に記憶された学習データの統計的な特性、即ち、学習データ記憶部２２に記憶された学習データの時系列パターンが、時系列パターンモデル２１において学習され、これにより、時系列パターンモデル２１と、学習データ記憶部２２に記憶された学習データとが、対応関係を持つことになる。
【００８３】
なお、時系列パターン記憶ネットワークの学習、ひいては、ノードN_iの時系列パターンモデル２１の学習は、時系列パターン記憶ネットワークに対して、時系列データが与えられるごとに学習を行うオンライン学習によって行われる。従って、時系列パターン記憶ネットワークのパラメータ、つまり、ノードN_iの時系列パターンモデル２１のパラメータ（時系列パターンモデル２１がHMMである場合には、上述したように、状態遷移確率と出力確率密度関数）は、時系列パターン記憶ネットワークに対して、時系列データが与えられるたびに、少しずつ更新される。
【００８４】
即ち、後述するように、時系列パターン記憶ネットワークの学習が進むにつれ、学習データ記憶部２２に記憶される学習データは、時系列パターン記憶ネットワークに与えられた時系列データによって更新され、これにより、少しずつ変化する。そして、その少しずつ変化する学習データによって、時系列パターンモデル２１の学習が行われることにより、その時系列パターンモデル２１のパラメータも、少しずつ変化していく。
【００８５】
次に、図８は、時系列パターン記憶ネットワークの他の例を模式的に示している。
【００８６】
図８では、時系列パターン記憶ネットワークは、９個のノードN₁乃至N₉で構成されており、この９個のノードN₁乃至N₉は、２次元的に配置されている。即ち、図８では、９個のノードN₁乃至N₉は、２次元平面上に、横×縦が３×３となるように配置されている。
【００８７】
さらに、図８では、２次元的に配置された９個のノードN₁乃至N₉の、横方向に隣接するノードどうしと、縦方向に隣接するノードどうしに対して、リンク（結合関係）が与えられている。なお、このようなリンクを与えることによって、時系列パターン記憶ネットワークを構成するノードには、空間的に、２次元的に配置される配置構造が与えられているということもできる。
【００８８】
時系列パターン記憶ネットワークでは、リンクによって与えられる空間的なノードの配置構造に基づき、その空間上でのある２つのノードどうしの距離を定義することができ、この２つのノードどうしの距離は、その２つのノードそれぞれが有する時系列パターンモデル２１が表現する時系列パターンのパターン間距離（時系列パターンどうしの類似性）として用いることができる。
【００８９】
なお、２つのノードどうしの距離によって表される時系列パターンのパターン間距離は、２つのノードの結合関係（リンク）に基づくパターン間距離ということができる。
【００９０】
２つのノードどうしの距離としては、例えば、その２つのノードどうしを結ぶ最短のパスを構成するリンクの数を採用することができる。この場合、あるノードに注目すると、その注目ノードとの直接のリンクを有するノード（図８では、注目ノードの横方向や縦方向に隣接するノード）は、注目ノードとの距離が最も近く、注目ノードとの直接のリンクを有するノードから先のリンクを辿っていくことで到達することができるノードは、到達するのに辿るリンクの数が多いほど、注目ノードとの距離が遠くなっていく。
【００９１】
なお、ノードに与えるリンクは、図６や図８に示したものに限定されるものではない。また、図６や図８に示したリンクは、ノードに対して、２次元的な配置構造を与えるが、リンクは、その他、１次元的な配置構造や３次元的な配置構造等を与えるリンクであっても良い。さらに、ノードには、必ずしもリンクを与える必要はない。
【００９２】
即ち、図９は、時系列パターン記憶ネットワークのさらに他の例を模式的に示している。
【００９３】
図９では、時系列パターン記憶ネットワークは、図６における場合と同様に、６個のノードN₁乃至N₆で構成されているが、これらの６個のノードN₁乃至N₆は、いずれもリンクを有していない。従って、図９の時系列パターン記憶ネットワークを構成するノードN₁乃至N₆は、リンクによって与えられる空間的な配置構造を有していない。なお、空間的な配置構造を有していないということは、空間的な制約がない配置構造が与えられているということもできる。
【００９４】
ここで、ある２つのノードにリンクがない場合には、空間上でのその２つのノードどうしの距離を定義することはできないから、その２つのノードそれぞれが（有する時系列パターンモデル２１が）表現する時系列パターンのパターン間距離として、結合関係（リンク）に基づくパターン間距離は用いることができない。そこで、この場合には、例えば、ノードが、ある時系列データ（の観測値）に適合する度合いに基づく順位（以下、適宜、適合順位という）に対応する値を、パターン間距離として用いることができる。
【００９５】
即ち、ある時系列データが与えられた場合には、その時系列データに対して、ノードが表現する時系列パターンとの類似性を、そのノードが適合する度合いとして求めることができる。いま、時系列パターン記憶ネットワークを構成するノードのうち、ある時系列データに最も適合するノードである勝者ノードについては、勝者ノードと、時系列パターン記憶ネットワークのあるノードとのそれぞれが表現する時系列パターンのパターン間距離として、そのノードが時系列データに適合する順位（適合順位）に対応する値を採用することができる。
【００９６】
具体的には、時系列パターン記憶ネットワークを構成するノードのうち、勝者ノードとなっているノードの適合順位は第１位であり、このノード（勝者ノード）と勝者ノードとの（それぞれが表現する時系列パターンの）パターン間距離は、例えば、その適合順位から１を減算した０とすることができる。
【００９７】
また、時系列パターン記憶ネットワークを構成するノードのうち、適合順位が第２位のノードと勝者ノードとのパターン間距離は、例えば、その適合順位から１を減算した１とすることができる。以下、同様に、ノードの適合順位から１を減算して得られる値を、そのノードと、勝者ノード（となっているノード）とのパターン間距離とすることができる。
【００９８】
なお、ノードがある時系列データに適合する度合いに基づく順位（適合順位）に対応する値によって表されるパターン間距離は、ノードが時系列データに適合する度合いに基づくパターン間距離ということができる。
【００９９】
次に、図１０は、時系列パターン記憶ネットワークを用いて、各種の処理を行うデータ処理装置の構成例を示している。
【０１００】
信号入力部１には、後述する学習処理や認識処理の対象となるデータ（以下、処理対象データという）が入力される。ここで、処理対象データは、例えば、音や画像、LED(Light Emitting Diode)の明るさ、モータの回転角度や回転角速度などの観測値（外部から観測することができる値（信号））である。また、処理対象データは、例えば、図１０のデータ処理装置が適用されるシステムの入力を受け付ける入力デバイス（センサ）が出力するデータであっても良いし、何らかの出力を行う出力デバイスに対して与えられるデータであっても良い。
【０１０１】
即ち、図１０のデータ処理装置が、例えば、２足歩行ロボットその他のロボットに適用され、その２足歩行ロボットが、外部の状況に応じて、何らかの処理を行う場合には、信号入力部１は、外部の状況をセンシングするセンサで構成することができる。具体的には、信号入力部１は、例えば、マイク（マイクロフォン）やカメラなどで構成することができる。
【０１０２】
信号入力部１がマイクで構成される場合には、そのマイクに対して、外部で発生する音声（人間の音声の他、動物の鳴き声、物音、その他のあらゆる音を含む）が、２足歩行ロボット（データ処理装置が適用されているシステム）に対する入力データとして入力され、対応する音声データが、特徴抽出部２に供給される。また、信号入力部１がカメラで構成される場合には、そのカメラに対して、外部からの光が、２足歩行ロボットに対する入力データとして入力され、対応する画像データが、特徴抽出部２に供給される。
【０１０３】
また、２足歩行ロボットが、例えば、手や足に相当する部分を、アクチュエータとしてのモータによって動かすことができる場合には、信号入力部１は、そのモータの回転角度や回転速度を計測する計測装置（回転角度や回転速度をセンシングするセンサ）で構成することができる。なお、２足歩行ロボットの手や足に相当する部分を動かすモータは、そのモータを回転駆動させる電気信号としての駆動信号を与える他、手や足に相当する部分に外部から力を加えて動かすことによっても回転するが、計測装置では、そのいずれの回転によって生じた回転角度や回転速度であっても計測することができる。
【０１０４】
信号入力部１が計測装置で構成される場合には、その計測装置に対して、モータの回転角度や回転速度を表す信号が、２足歩行ロボットからの出力データとして入力されて計測され、その計測結果が、特徴抽出部２に供給される。
【０１０５】
なお、信号入力部１に入力される処理対象データは、時間的な変化が一定の定常的なデータ（定常信号）であっても良いし、時間的な変化が一定でない非定常なデータ（非定常信号）であっても良い。
【０１０６】
また、以下では、信号入力部１に対しては、例えば、時系列データの１つである音声が入力されるものとする。さらに、信号入力部１から特徴抽出部２に対しては、いわゆる音声区間の音声データだけが供給されるものとする。なお、音声区間の検出方法は、特に限定されるものではない。また、信号入力部１から特徴抽出部２に対して供給される音声データは、必ずしも、音声区間の長さである必要はなく、適切な長さに区切られていればよい。即ち、信号入力部１から特徴抽出部２に対して供給される音声データは、例えば、音素や音韻の単位であっても良いし、単語や文、ある句読点から次の句読点までであっても良い。
【０１０７】
ここで、信号入力部１から特徴抽出部２に対して供給される処理対象データは、音声データに限定されるものではなく、その区間も、特に限定されるものではない。即ち、信号入力部１から特徴抽出部２に対しては、最も良い方法で適当な長さに区切られた処理対象データが供給されれば良い。なお、信号入力部１から特徴抽出部２に対して供給される処理対象データ（の区間）は、一定であっても良いし、一定でなくても良い。
【０１０８】
特徴抽出部２は、信号入力部１からの処理対象データとしての時系列データである音声データから特徴量を抽出し、その結果得られる時系列データである時系列の特徴量を、認識部３と学習部４に供給する。即ち、特徴抽出部２は、信号入力部１からの音声データに対して一定時間間隔で周波数分析などの処理を施し、例えば、メルケプストラム係数（MFCC（Mel Frequency Cepstrum Coefficient））などの特徴量を抽出して、そのメルケプストラム係数の時系列データを、認識部３と学習部４に供給する。なお、特徴抽出部２から認識部３と学習部４に供給される時系列データも、外部から観測することができる観測値である。
【０１０９】
認識部３は、記憶部５に記憶された時系列パターン記憶ネットワークに基づき、特徴抽出部２から供給される時系列データを認識し、その認識結果を出力する。
【０１１０】
ここで、学習部４は、記憶部５に記憶された時系列パターン記憶ネットワークを、特徴抽出部２から供給される時系列データ（の観測値）に基づいて、自己組織的に更新する。即ち、学習部４は、特徴抽出部２から供給される時系列データに基づいて、記憶部５に記憶された時系列パターン記憶ネットワークのパラメータを更新する。なお、このパラメータの更新のことを学習と呼ぶ場合がある。
【０１１１】
学習部４では、正解ラベルの付与されていない時系列データを繰り返し与えると、その与えられた時系列データの中の特徴的なパターン（時系列パターン）を自己組織的に獲得していく教師なし学習が実行される。その結果、記憶部５の時系列パターン記憶ネットワークには、代表的な時系列パターンが効率的に記憶される。即ち、特徴抽出部２が認識部３と学習部４に供給する時系列データは、幾つかのパターン（時系列パターン）に分類することができ、学習部４では、時系列パターン記憶ネットワークに、時系列データの代表的な時系列パターンを記憶させるための学習が行われる。
【０１１２】
記憶部５は、時系列パターン記憶ネットワークを記憶しており、この時系列パターン記憶ネットワーク（のパラメータ）は、学習部４によって適宜更新される。
【０１１３】
生成部６には、制御データが供給される。生成部６に供給される制御データは、記憶部５の時系列パターン記憶ネットワークが記憶している時系列パターンのうちのいずれかを表すもの（後述するノードラベル）で、生成部６は、記憶部５の時系列パターン記憶ネットワークに基づき、そこに供給される制御データが表す時系列パターンの時系列データを生成して出力する。
【０１１４】
次に、図１１は、図１０の学習部４の構成例を示している。
【０１１５】
学習部４は、時系列データ記憶部３１と学習処理部３２とから構成される。
【０１１６】
時系列データ記憶部３１には、特徴抽出部２から、（１区間の）新たな時系列データとしての特徴量の系列が供給される。時系列データ記憶部３１は、特徴抽出部２からの新たな時系列データを、一時的に（学習処理部３２による新たな時系列データを用いた処理が終了するまで）記憶する。
【０１１７】
学習処理部３２は、記憶部５に記憶された時系列パターン記憶ネットワークを、時系列データ記憶部３１に記憶された新たな時系列データ（の観測値）に基づいて、自己組織的に更新する。
【０１１８】
次に、図１２は、図１１の学習処理部３２の構成例を示している。
【０１１９】
スコア計算部４１は、記憶部５に記憶された時系列パターン記憶ネットワークを構成する各ノードについて、そのノードが、時系列データ記憶部３１に記憶された時系列データ（の観測値）に適合する度合いをスコアとして求め、勝者ノード決定部４２に供給する。即ち、ノードが有する時系列パターンモデル２１が、例えば、図７に示したようにHMMである場合には、スコア計算部４１は、ノードが有する時系列パターンモデル２１としてのHMMから、時系列データ記憶部３１に記憶された時系列データが観測される尤度を求め、そのノードのスコアとして、勝者ノード決定部４２に供給する。
【０１２０】
勝者ノード決定部４２は、記憶部５に記憶された時系列パターン記憶ネットワークにおいて、時系列データ記憶部３１に記憶された時系列データに最も適合するノードを求め、そのノードを、勝者ノードに決定する。
【０１２１】
即ち、勝者ノード決定部４２は、記憶部５に記憶された時系列パターン記憶ネットワークを構成するノードのうちの、スコア計算部４１からのスコアが最も高いノードを勝者ノードとして決定する。そして、勝者ノード決定部４２は、勝者ノードを表す情報を、重み決定部４３に供給する。
【０１２２】
ここで、時系列パターン記憶ネットワークを構成するノードには、各ノードを識別するためのラベルであるノードラベルを付しておくことができる。そして、勝者ノードを表す情報、その他のノード表す情報としては、ノードラベルを採用することができる。なお、ノードラベルは、ノード自体を識別するラベルであり、正解が何であるかを表す正解ラベルとは、何ら関係がない。
【０１２３】
重み決定部４３は、勝者ノード決定部４２から供給されるノードラベルが表す勝者ノードに基づき、記憶部５に記憶された時系列パターン記憶ネットワークを構成する各ノードについて、後述する更新重みを決定し、学習データ更新部４４に供給する。
【０１２４】
即ち、重み決定部４３は、記憶部５に記憶された時系列パターン記憶ネットワークを構成する各ノード（勝者ノードを含む）の更新重みを、そのノードと、勝者ノードとのパターン間距離に基づいて決定し、学習データ更新部４４に供給する。
【０１２５】
ここで、ノードが有する時系列パターンモデル２１（図７）は、時系列データ記憶部３１（図１１）に記憶された新たな時系列データを用いて更新されるが、ノードの更新重みとは、そのノードが有する時系列パターンモデル２１の更新によって、その時系列パターンモデル２１が受ける新たな時系列データの影響の度合いを表す。従って、ノードの更新重みが０であれば、そのノードが有する時系列パターンモデル２１は、新たな時系列データの影響を受けない（更新されない）。
【０１２６】
なお、重み決定部４３において、記憶部５に記憶された時系列パターン記憶ネットワークを構成する各ノードの更新重みを決定する際のパターン間距離としては、時系列パターン記憶ネットワークのノードが、図６や図８に示したように、リンクを有する場合には、そのノードと勝者ノードとの結合関係に基づくパターン間距離を採用し、また、時系列パターン記憶ネットワークのノードが、図９に示したように、リンクを有しない場合には、そのノードが、時系列データ記憶部３１（図１１）に記憶された新たな時系列データに適合する度合いに基づくパターン間距離を採用することができる。
【０１２７】
即ち、重み決定部４３は、記憶部５に記憶された時系列パターン記憶ネットワークを参照し、時系列パターン記憶ネットワークのノードそれぞれと、勝者ノード決定部４２からのノードラベルが表す勝者ノードとの結合関係に基づくパターン間距離を求め、そのパターン間距離に基づいて、時系列パターン記憶ネットワークのノードそれぞれの更新重みを決定する。
【０１２８】
あるいは、重み決定部４３は、記憶部５に記憶された時系列パターン記憶ネットワークを参照し、時系列パターン記憶ネットワークのノードそれぞれについて、ノードが、時系列データ記憶部３１に記憶された新たな時系列データに適合する度合いとして、例えば、スコア計算部４１が求めるのと同様のスコアを求める。さらに、重み決定部４３は、時系列パターン記憶ネットワークのノードそれぞれについて、ノードのスコアに基づく順位（適合順位）に対応する値を、新たな時系列データに適合する度合いに基づくパターン間距離として求め、そのパターン間距離に基づいて、時系列パターン記憶ネットワークのノードそれぞれの更新重みを決定する。
【０１２９】
なお、ノードのスコアは、重み決定部４３で求めても良いが、スコア計算部４１から重み決定部４３に供給するようにしても良い。
【０１３０】
学習データ更新部４４は、記憶部５に記憶された時系列パターン記憶ネットワークの各ノードが有する学習データ記憶部２２（図７）に記憶された学習データを更新する。
【０１３１】
即ち、学習データ更新部４４は、ノードが有する学習データ記憶部２２に既に記憶されている学習データと、時系列データ記憶部３１に記憶された時系列データとを、重み決定部４３からの、対応するノードの更新重みにしたがって混合し、その混合結果を、新たな学習データとして、学習データ記憶部２２に記憶させることで、その学習データ記憶部２２の記憶内容を更新する。
【０１３２】
学習データ更新部４４は、以上のように、学習データ記憶部２２（図７）に記憶された学習データを、更新重みにしたがって更新すると、その更新が終了した旨の終了通知を、モデル学習部４５に供給する。
【０１３３】
モデル学習部４５は、学習データ更新部４４から終了通知を受けると、その学習データ更新部４４による更新後の学習データ記憶部２２（図７）に記憶された学習データを用いて、時系列パターンに記憶ネットワークの各ノードが有する時系列パターンモデル２１の学習を行うことにより、その時系列パターンモデル２１を更新する。
【０１３４】
従って、モデル学習部４５による、ノードが有する時系列パターンモデル２１の更新は、そのノードが有する学習データ記憶部２２（図７）に記憶されていた学習データ（の一部）と、時系列データ記憶部３１に記憶された新たな時系列データとに基づいて行われる。なお、学習データ記憶部２２の記憶内容は、更新重みにしたがって更新されるから、モデル学習部４５による、時系列パターンモデル２１の更新は、更新重みに基づいて行われるということもできる。
【０１３５】
次に、図１３は、図１２の重み決定部４３において更新重みを決定する決定方法を示している。
【０１３６】
重み決定部４３は、例えば、図１３に示すような、勝者ノードとのパターン間距離dの増加に対して更新重みαが減少する関係を表す曲線（以下、距離／重み曲線という）にしたがって、ノードに対する更新重み（ノードの更新重み）αを決定する。距離／重み曲線によれば、勝者ノードとのパターン間距離dが近いノードほど、大きな更新重みαが決定され、パターン間距離dが遠いノードほど、小さな更新重みαが決定される。
【０１３７】
図１３の距離／重み曲線において、横軸（左から右方向）は、更新重みαを示しており、縦軸（上から下方向）は、パターン間距離dを示している。
【０１３８】
図１３では、パターン間距離dとして、例えば、ノードとの結合関係に基づくパターン間距離、即ち、勝者ノードからの距離が採用されており、縦軸に沿って、時系列パターン記憶ネットワークを構成する６つのノードN₁乃至N₆が、各ノードN_iと勝者ノードとの距離に対応する位置（縦軸の位置）に記載されている。
【０１３９】
図１３では、時系列パターン記憶ネットワークを構成する６つのノードN₁乃至N₆が、その順で、勝者ノードとの距離が近くなっている。時系列パターン記憶ネットワークを構成する６つのノードN₁乃至N₆のうち、勝者ノードとの距離が最も近いノード、即ち、勝者ノードとの距離が０のノードであるノードN₁は、勝者ノード（となっているノード）である。
【０１４０】
ここで、時系列パターン記憶ネットワークが、例えば、図８に示したような２次元的な配置構造を有し、勝者ノードが、例えば、ノードN₆であった場合には、勝者ノードN₆とノードN₆との距離は最も（１番）近い０であり、ノードN₆と勝者ノードN₆とのパターン間距離dも０となる。また、勝者ノードN₆と、ノードN₃，N₅、またはN₉それぞれとの距離は２番目に近い１であり、ノードN₃，N₅、またはN₉それぞれと勝者ノードN₆とのパターン間距離dも１となる。さらに、勝者ノードN₆と、ノードN₂，N₄、またはN₈それぞれとの距離は３番目に近い２であり、ノードN₂，N₄、またはN₈それぞれと勝者ノードN₆とのパターン間距離dも２となる。また、勝者ノードN₆と、ノードN₁またはN₇それぞれとの距離は最も遠い（４番目に近い）３であり、ノードN₁またはN₇それぞれと勝者ノードN₆とのパターン間距離dも３となる。
【０１４１】
一方、ノードがリンクを有しない、例えば、図９に示した時系列パターン記憶ネットワークについては、ノードが新たな時系列データに適合する度合いに基づくパターン間距離、即ち、ノードが新たな時系列データに適合する度合いに基づく順位（適合順位）に対応する値が、そのノードと勝者ノードとのパターン間距離dとして求められる。即ち、この場合、スコアが最も高い（一番目に高い）ノード（勝者ノード）と勝者ノードとのパターン間距離dは０とされ、スコアが２番目に高いノードと勝者ノードとのパターン間距離dは１とされる。以下、同様に、スコアがk番目に高いノードと勝者ノードとのパターン間距離dはk-1とされる。
【０１４２】
次に、更新重みαとパターン間距離dとの関係を表す、例えば、図１３に示したような距離／重み曲線は、例えば、式（３）によって与えられる。
【０１４３】
【数３】

【０１４４】
ここで、式（３）において、定数Gは、勝者ノードの更新重みを表す定数であり、γは、減衰係数で、０＜γ＜１の範囲の定数である。また、変数Δは、時系列パターン記憶ネットワークを更新する更新方法として、前述したSMAを採用した場合の、勝者ノードの近傍のノード（勝者ノードとのパターン間距離dが近いノード）の更新重みαを調整するための変数である。
【０１４５】
上述したように、勝者ノードとなっているノードのパターン間距離dとして、０が与えられ、以下、他のノードのパターン間距離dとして、勝者ノードとの距離、または適合順位にしたがって、１，２，・・・が与えられる場合、式（３）において、例えば、G=8，γ=0.5，Δ=1であれば、勝者ノードとなっているノードの更新重みαとして、８(=G)が求められる。以下、勝者ノードとの距離、または適合順位が大になるにしたがって、ノードの更新重みαとしては、４，２，１，・・・と小さくなる値が求められる。
【０１４６】
ここで、式（３）における減衰係数Δが大きな値である場合には、パターン間距離dの変化に対する更新重みαの変化は緩やかになり、逆に、減衰係数Δが０に近い値である場合には、パターン間距離dの変化に対する更新重みαの変化は急峻になる。
【０１４７】
従って、減衰係数Δを、例えば、上述した１から少しずつ０に近づけていくように調整すると、パターン間距離dの変化に対する更新重みαの変化は急峻になっていき、更新重みαは、パターン間距離dが大きくなるにしたがって、より小さい値となる。そして、減衰係数Δが０に近くなると、勝者ノード（となっているノード）以外のノードの更新重みαは、ほとんど０となり、この場合、時系列パターン記憶ネットワークを更新する更新方法として、前述したWTAを採用した場合と（ほぼ）等価となる。
【０１４８】
このように、減衰係数Δを調整することによって、時系列パターン記憶ネットワークを更新する更新方法としてSMAを採用した場合の、勝者ノードの近傍のノードの更新重みαを調整することができる。
【０１４９】
減衰係数△は、例えば、時系列パターン記憶ネットワークの更新（学習）の開始時は大きな値にし、時間の経過とともに、即ち、更新の回数が増加するにしたがって小さな値にくなるようにすることができる。この場合、時系列パターン記憶ネットワークの更新の開始時は、パターン間距離dの変化に対する更新重みαの変化が緩やかな距離／重み曲線にしたがって、時系列パターン記憶ネットワークの各ノードの更新重みαが決定され、更新（学習）が進む（進行する）につれ、パターン間距離dの変化に対する更新重みαの変化が急峻になっていく距離／重み曲線にしたがって、時系列パターン記憶ネットワークの各ノードの更新重みαが決定される。
【０１５０】
即ち、この場合、勝者ノード（が有する時系列パターンモデル２１）の更新は、学習（更新）の進行にかかわらず、時系列データ記憶部３１（図１２）に記憶された新たな時系列データの影響を強く受けるように行われる。一方、勝者ノード以外のノード（が有する時系列パターンモデル２１）の更新は、学習の開始時は、比較的広い範囲のノード（勝者ノードとのパターン間距離dが小のノードから、ある程度大のノードまで）に亘って、新たな時系列データの影響を受けるように行われる。そして、学習が進行するにつれ、勝者ノード以外のノードの更新は、徐々に狭い範囲のノードについてのみ、新たな時系列データの影響を受けるように行われる。
【０１５１】
図１２の重み決定部４３は、以上のようにして、時系列パターン記憶ネットワークの各ノードの更新重みαを決定し、学習データ更新部４４では、各ノードが有する学習データ記憶部２２に記憶される学習データが、そのノードの更新重みαに基づいて更新される。
【０１５２】
次に、図１４を参照して、ノードが有する学習データ記憶部２２に記憶される学習データを更新する更新方法について説明する。
【０１５３】
いま、あるノードN_iが有する学習データ記憶部２２には、学習データが既に記憶されており、ノードN_iの時系列パターンモデル２１は、学習データ記憶部２２に既に記憶されている学習データを用いて学習が行われたものであるとする。
【０１５４】
学習データ更新部４４は、上述したように、ノードN_iが有する学習データ記憶部２２に既に記憶されている学習データ（以下、適宜、旧学習データという）と、時系列データ記憶部３１（図１２）に記憶された新たな時系列データとを、重み決定部４３からのノードN_iの更新重みαにしたがって混合し、その混合結果を、新たな学習データとして、学習データ記憶部２２に記憶させることで、その学習データ記憶部２２の記憶内容を、新たな学習データに更新する。
【０１５５】
即ち、学習データ更新部４４は、旧学習データに対して、新たな時系列データを追加することで、旧学習データと新たな時系列データとを混合した新たな学習データとするが、旧学習データに対する新たな時系列データの追加（旧学習データと新たな時系列データとの混合）は、ノードN_iの更新重みαに対応する比にしたがって行われる。
【０１５６】
ここで、ノードN_iの時系列パターンモデル２１（図７）の更新は、新たな学習データを用いた学習によって行われるため、新たな時系列データと旧学習データとを混合する比率を変えることによって、更新により時系列パターンモデル２１が受ける新たな時系列データの影響の度合い（強さ）を変えることができる。
【０１５７】
ノードN_iにおいて、新たな時系列データと旧学習データとを混合する比率としては、ノードN_iの更新重みαに対応した値が採用され、例えば、更新重みαが大であるほど、新たな時系列データの比率が大となる（旧学習データの比率が小となる）ような値とされる。
【０１５８】
具体的には、ノードN_iの学習データ記憶部２２には、一定の数の時系列データ（学習データ）が記憶されるものとし、その一定の数をHとする。この場合、ノードN_iの時系列パターンモデル２１の学習は、常に、H個の学習データ（時系列データ）を用いて行われる。
【０１５９】
学習データ記憶部２２に、常に、一定の数Hの学習データが記憶される場合、新たな時系列データと旧学習データとの混合によって得られる新たな学習データの個数は、H個である必要があり、そのような、新たな時系列データと旧学習データとの混合を、ノードN_iの更新重みαに対応した比率で行う方法としては、新たな時系列データと旧学習データとを、比率α:H-αで混合する方法がある。
【０１６０】
新たな時系列データと旧学習データとを、比率α:H-αで混合する具体的な方法としては、図１４に示すように、H個の旧学習データのうちのH-α個の旧学習データに対して、α個の新たな時系列データを追加することにより、H個の新たな学習データを得る方法がある。
【０１６１】
この場合、学習データ記憶部２２に記憶される時系列データの数Hが、例えば、１００であり、ノードN_iの更新重みαが、例えば、８であれば、学習データ記憶部２２の記憶内容は、１００個の旧学習データのうちの９２個の旧学習データに対して、８個の新たな時系列データを追加することによって得られる１００個の新たな学習データに更新される。
【０１６２】
H個の旧学習データのうちのH-α個の旧学習データに対する、α個の新たな時系列データの追加は、α個の新たな時系列データが得られるのを待って行う方法があるが、この方法では、１個の新たな時系列データが得られるごとに、学習データ記憶部２２の記憶内容を更新することができない。
【０１６３】
そこで、学習データ記憶部２２の記憶内容の更新は、１個の新たな時系列データが得られるごとに、その新たな時系列データをα個だけ、H-α個の旧学習データに追加することにより行うことができる。即ち、１個の新たな時系列データをコピーしてα個の新たな時系列データとし、そのα個の新たな時系列データを、H個の旧学習データから古い順にα個を除外して残ったH-α個の旧学習データに追加することにより、学習データ記憶部２２の記憶内容の更新を行う。これにより、１個の新たな時系列データが得られるごとに、学習データ記憶部２２の記憶内容を更新することができる。
【０１６４】
以上のように、学習データ記憶部２２の記憶内容の更新を行うことにより、学習データ記憶部２２には、常に、新しい順のＨ個の時系列データだけが、学習データとして保持されることになり、その学習データに占める新たな時系列データの割合（比率）は、更新重みαによって調整されることになる。
【０１６５】
次に、図１５のフローチャートを参照して、図１０のデータ処理装置で行われる、時系列パターン記憶ネットワークを学習する学習処理について説明する。
【０１６６】
まず最初に、ステップＳ１において、学習部４（図１１）の学習処理部３２は、記憶部５に記憶された時系列パターン記憶ネットワークのパラメータ、即ち、時系列パターン記憶ネットワークの各ノードが有する時系列パターンモデル２１（図７）としての、例えばHMMのパラメータを初期化する初期化処理を行う。この初期化処理により、HMMのパラメータ（状態遷移確率と出力確率密度関数）として、適切な初期値が与えられる。なお、初期化処理において、HMMのパラメータにおいて、どのように初期値を与えるかは、特に限定されるものではない。
【０１６７】
その後、ステップＳ２において、１個の処理対象データ、即ち、例えば、１の音声区間の音声データが、信号入力部１に入力されると、信号入力部１は、その処理対象データを、特徴抽出部２に供給する。特徴抽出部２は、処理対象データから特徴量を抽出し、その特徴量の時系列データ（１個の新たな時系列データ）を、学習部４に供給する。
【０１６８】
学習部４（図１１）は、特徴抽出部２からの新たな時系列データを、時系列データ記憶部３１に一時記憶させ、以下、ステップＳ３乃至Ｓ７において、記憶部５に記憶された時系列パターン記憶ネットワークを、時系列データ記憶部３１に記憶された新たな時系列データ（の観測値）に基づいて、自己組織的に更新（学習）する。
【０１６９】
即ち、学習部４の学習処理部３２（図１２）では、ステップＳ３において、スコア計算部４１が、時系列データ記憶部３１に記憶された新たな時系列データを読み出し、記憶部５に記憶された時系列パターン記憶ネットワークを構成する各ノードについて、そのノードが、新たな時系列データに適合する度合いを表すスコアを求める。
【０１７０】
具体的には、ノードが有する時系列パターンモデル２１（図７）が、例えばHMMである場合には、そのHMMから、新たな時系列データが観測される対数尤度が、スコアとして求められる。ここで、対数尤度の計算方法としては、例えば、ビタビアルゴリズム(Viterbi algorithm)を採用することができる。
【０１７１】
スコア計算部４１は、時系列パターン記憶ネットワークが有するすべてのノードについて、新たな時系列データに対するスコアを計算すると、その各ノードについてのスコアを、勝者ノード決定部４２に供給する。
【０１７２】
勝者ノード決定部４２は、ステップＳ４において、時系列パターン記憶ネットワークを構成するノードのうちの、スコア計算部４１からのスコアが最も高いノードを求め、そのノードを勝者ノードに決定する。そして、勝者ノード決定部４２は、勝者ノードを表す情報としてのノードラベルを、重み決定部４３に供給する。
【０１７３】
重み決定部４３は、ステップＳ５において、勝者ノード決定部４２からのノードラベルが表す勝者ノードを、いわば基準として、時系列パターン記憶ネットワークを構成する各ノードの更新重みを決定する。
【０１７４】
即ち、重み決定部４３は、図１３で説明したように、時系列パターン記憶ネットワークの更新（学習）が進むにつれ、パターン間距離dの変化に対する更新重みαの変化が急峻になっていく、式（３）で表される距離／重み曲線にしたがって、時系列パターン記憶ネットワークの各ノードの更新重みαを決定し、学習データ更新部４４に供給する。
【０１７５】
学習データ更新部４４は、ステップＳ６において、時系列パターン記憶ネットワークの各ノードが有する学習データ記憶部２２（図７）に記憶された学習データを、重み決定部４３からの、対応するノードの更新重みにしたがって更新する。即ち、学習データ更新部４４は、図１４で説明したように、時系列データ記憶部３１に記憶されている新たな時系列データと、ノードの学習データ記憶部２２に記憶されている旧学習データとを、そのノードの更新重みαに対応した比率α:H-αで混合することにより、H個の新たな学習データを得て、そのH個の新たな学習データによって、学習データ記憶部２２の記憶内容を更新する。
【０１７６】
学習データ更新部４４は、時系列パターン記憶ネットワークのノードすべての学習データ記憶部２２（図７）の記憶内容を更新すると、その更新が終了した旨の終了通知を、モデル学習部４５に供給する。
【０１７７】
モデル学習部４５は、学習データ更新部４４から終了通知を受けると、ステップＳ７において、時系列パターン記憶ネットワークのパラメータを更新する。
【０１７８】
即ち、モデル学習部４５は、時系列パターン記憶ネットワークの各ノードについて、学習データ更新部４４による更新後の学習データ記憶部２２に記憶された新たな学習データを用いて、時系列パターンモデル２１の学習を行うことにより、その時系列パターンモデル２１を更新する。
【０１７９】
具体的には、ノードが有する時系列パターンモデル２１が、例えばHMMである場合には、そのノードが有する学習データ記憶部２２に記憶された新たな学習データを用いて、HMMの学習が行われる。この学習では、例えば、HMMの現在の状態遷移確率と出力確率密度関数を初期値とし、新たな学習データを用いて、Baum-Welch法により、新たな状態遷移確率と出力確率密度関数がそれぞれ求められる。そして、その新たな状態遷移確率と出力確率密度関数によって、HMMの状態遷移確率と出力確率密度関数がそれぞれ更新される。
【０１８０】
その後は、ステップＳ７からステップＳ２に戻り、次の処理対象データが、信号入力部１に入力されるのを待って、以下、同様の処理が繰り返される。
【０１８１】
図１５の学習処理によれば、１個の新たな時系列データが得られると、その新たな時系列データに対して、時系列パターン記憶ネットワークを構成するノードの中から、勝者ノードが決定される（ステップＳ４）。さらに、その勝者ノードを基準として、時系列パターン記憶ネットワークを構成する各ノードの更新重みが決定される（ステップＳ５）。そして、更新重みに基づいて、時系列パターン記憶ネットワークを構成する各ノードが有する時系列パターンモデル２１（図７）のパラメータが更新される。
【０１８２】
即ち、図１５の学習処理では、１個の新たな時系列データに対して、時系列パターン記憶ネットワークを構成するノードのパラメータの更新が１回行われ、以下、同様に、新たな時系列データが得られるたびに、ノードのパラメータの更新が繰り返されることにより、自己組織的に学習が行われる。
【０１８３】
そして、学習が十分に行われることにより、時系列パターン記憶ネットワークの各ノードが有する時系列パターンモデル２１は、ある時系列パターンを学習（獲得）する。時系列パターン記憶ネットワーク全体において学習される時系列パターンの数（種類）は、時系列パターン記憶ネットワークが有するノードの数と一致するので、時系列パターン記憶ネットワークが有するノードの数が、例えば１００である場合は、１００種類の時系列パターンが学習されることになる。この時系列パターンに基づき、認識部３（図１０）では、時系列データ（処理対象データ）を認識する認識処理を行うことが可能となり、生成部６（図１０）では、時系列データを生成する生成処理を行うことが可能となる。
【０１８４】
次に、図１６は、図１０の認識部３の構成例を示している。
【０１８５】
認識部３には、図１０で説明したように、特徴抽出部２から、（１個の）時系列データが供給され、この時系列データは、スコア計算部５１に供給される。
【０１８６】
スコア計算部５１は、学習処理部３２（図１２）のスコア計算部４１と同様に、記憶部５に記憶された時系列パターン記憶ネットワークを構成する各ノードについて、そのノードが、特徴抽出部２からの時系列データ（の観測値）に適合する度合いを表すスコアを求め、勝者ノード決定部５２に供給する。
【０１８７】
勝者ノード決定部５２は、学習処理部３２（図１２）の勝者ノード決定部４２と同様に、記憶部５に記憶された時系列パターン記憶ネットワークにおいて、特徴抽出部２からの時系列データに最も適合するノードを求め、そのノードを、勝者ノードとして決定する。
【０１８８】
即ち、勝者ノード決定部５２は、記憶部５に記憶された時系列パターン記憶ネットワークを構成するノードのうちの、スコア計算部５１からのスコアが最も高いノードを勝者ノードとして決定する。そして、勝者ノード決定部５２は、勝者ノードを表す情報としてのノードラベルを、出力部５３に供給する。
【０１８９】
出力部５３は、勝者ノード決定部５２からの勝者ノードを表すノードラベルを、特徴抽出部２からの特徴量の時系列データ、ひいては、その特徴量に対応する、信号入力部１に入力された処理対象データの認識結果として出力する。
【０１９０】
なお、認識部３のスコア計算部５１と、学習処理部３２（図１２）のスコア計算部４１とは、いずれか一方のスコア計算部で兼用することが可能である。認識部３の勝者ノード決定部５２と、学習処理部３２（図１２）の勝者ノード決定部４２についても、同様である。
【０１９１】
次に、図１７のフローチャートを参照して、図１０のデータ処理装置で行われる、時系列データを認識する認識処理について説明する。
【０１９２】
ステップＳ２１において、１個の処理対象データ、即ち、例えば、１の音声区間の音声データ（時系列データ）が、信号入力部１に入力されると、信号入力部１は、その処理対象データを、特徴抽出部２に供給する。特徴抽出部２は、処理対象データである時系列データから特徴量を抽出し、その特徴量の時系列データを、認識部３に供給する。
【０１９３】
認識部３（図１６）では、ステップＳ２２において、スコア計算部５１が、記憶部５に記憶された時系列パターン記憶ネットワークを構成する各ノードが、特徴抽出部２からの時系列データに適合する度合いを表すスコアを求め、勝者ノード決定部５２に供給する。
【０１９４】
勝者ノード決定部５２は、ステップＳ２３において、時系列パターン記憶ネットワークを構成するノードのうちの、スコア計算部５１からのスコアが最も高いノードを求め、そのノードを勝者ノードとして決定する。そして、勝者ノード決定部５２は、勝者ノードを表す情報としてのノードラベルを、出力部５３に供給する。
【０１９５】
出力部５３は、勝者ノード決定部５２からのノードラベルを、特徴抽出部２からの時系列データ（信号入力部１に入力された処理対象データ）の認識結果として出力し、処理を終了する。
【０１９６】
なお、出力部５３が出力するノードラベル（勝者ノードのノードラベル）は、例えば、制御データとして、生成部６に供給することができる。
【０１９７】
以上のような、時系列パターン記憶ネットワークを用いた認識処理によれば、その時系列パターン記憶ネットワークのノードの数に応じた細かさの認識結果を得ることができる。
【０１９８】
即ち、例えば、いま、時系列パターン記憶ネットワークの学習が、３つのカテゴリ"A"，"B"，"C"の発声それぞれにより得られた音声データを用いて行われたとする。
【０１９９】
時系列パターン記憶ネットワークの学習に用いられた３つのカテゴリ"A"，"B"，"C"の音声データが、多数の話者の発話を含む場合には、例えば、カテゴリ"A"の音声データであっても、発話速度や、イントネーション、話者の年齢、性別などの違いによって、様々なバリエーションの音声データが存在する。
【０２００】
教師あり学習であれば、カテゴリ"A"，"B"，"C"の音声データを用いた学習は、カテゴリ"A"の音声データだけ、カテゴリ"B"の音声データだけ、カテゴリ"C"の音声データだけをそれぞれ用いて行われる。従って、各カテゴリの学習結果には、発話速度等の違いによるバリエーションは、生じ得ない。
【０２０１】
一方、時系列パターン記憶ネットワークの学習では、カテゴリ"A"，"B"，"C"の音声データが、それらを区別（分類）することなく用いられる。そして、時系列パターン記憶ネットワークでは、上述したように、その時系列パターン記憶ネットワークが有するノードの数だけの時系列パターンが学習される。
【０２０２】
従って、時系列パターン記憶ネットワークでは、例えば、それが有するノードの数が３より大であれば、１つのカテゴリ"A"の音声データであっても、そのカテゴリ"A"の音声データの中の、ある１つのバリエーション（の時系列パターン）が、ある１つのノードで学習され、他の１つのバリエーションが、他の１つのノードで学習されることがある。
【０２０３】
そして、このように、複数のノードにおいて、カテゴリ"A"の音声データの様々なバリエーションが学習された場合、認識処理では、例えば、カテゴリ"A"の音声データが処理対象データとして入力されると、カテゴリ"A"の音声データが学習された複数のノードの中から、処理対象データに最も適合するノードが、勝者ノードとして決定され、その勝者ノードのノードラベルが、認識結果として出力される。
【０２０４】
即ち、時系列パターン記憶ネットワークを用いた認識処理では、処理対象データが、カテゴリ"A"，"B"，"C"のうちのいずれのカテゴリの音声データであるかが決定されるのではなく、時系列パターン記憶ネットワークが学習によって獲得した、そのノードの数だけの時系列パターンのうちのいずれに最も適合するか（類似するか）かが決定される。
【０２０５】
つまり、時系列パターン記憶ネットワークの学習では、時系列パターン記憶ネットワークが有するノードの数に応じた細かさで時系列パターンが獲得され、時系列パターン記憶ネットワークを用いた認識では、時系列パターン記憶ネットワークが有するノードの数に応じた細かさで、時系列データが分類（クラス分け）される。
【０２０６】
なお、（十分な）学習が行われた時系列パターン記憶ネットワークの各ノードに対し、そのノードが獲得した時系列パターンに応じて、適切に、カテゴリ"A"，"B"，"C"の正解ラベルを付与すれば、時系列パターン記憶ネットワークを用いた認識処理において、時系列データ（処理対象データ）が、カテゴリ"A"，"B"，"C"のうちのいずれのカテゴリの音声データであるかの認識結果を得ることができる。
【０２０７】
次に、図１８は、図１０の生成部６の構成例を示している。
【０２０８】
生成部６には、図１０で説明したように、制御データが供給される。生成部６に供給される制御データは、記憶部５の時系列パターン記憶ネットワークが記憶している時系列パターン、ひいては、時系列パターン記憶ネットワークを構成するノードのうちのいずれかを表すもので、例えば、ノードラベルである。
【０２０９】
生成部６に供給された制御データは、生成ノード決定部６１に供給される。生成ノード決定部６１は、記憶部５に記憶された時系列パターン記憶ネットワークにおいて、そこに供給される制御データが表すノードを、時系列データを生成するのに用いるノード（以下、適宜、生成ノードという）に決定し、その決定結果を、時系列生成部６２に供給する。
【０２１０】
即ち、生成ノード決定部６１は、そこに供給される制御データとしてのノードラベルが表すノードを、生成ノードに決定し、その決定結果を、時系列生成部６２に供給する。
【０２１１】
時系列生成部６２は、生成ノード決定部６１からの決定結果にしたがい、生成ノードが有する時系列パターンモデル２１（図７）に基づいて、時系列データを生成し、出力部６３に供給する。
【０２１２】
ここで、時系列パターンモデル２１が、例えば、HMMである場合には、時系列生成部６２は、生成ノードが有する時系列パターンモデル２１としてのHMMにおいて時系列データが観測される尤度を表す出力確率を最大にする時系列データを生成する。なお、HMMを用いた時系列データの生成については、例えば、動的特徴量を利用することで滑らかに変化する時系列データを生成する方法があり、時系列生成部６２では、その方法によって、時系列データを生成することができる。このような時系列データの生成方法は、例えば、K. Tokuda, T. Yoshimura, T. Masuko, T. Kobayashi, T. Kitamura, "SPEECH PARAMETER GENERATION ALGORITHMS FOR HMM-BASED SPEECH SYNTHESIS", Proc. of ICASSP 2000, vol.3, pp.1315-1318, June 2000に記載されている。
【０２１３】
なお、HMMを用いて時系列データを生成する方法としては、その他、例えば、HMMのパラメータを用いた確率的試行に基づく時系列データの生成を繰り返し行い、その平均をとることで、HMMから時系列データを生成する方法なども提案されており、その詳細については、例えば、稲邑哲也、谷江博昭、中村仁彦、「連続分布型隠れマルコフモデルを用いた時系列データのキーフレーム抽出とその復元」、日本機械学会ロボティクス・メカトロニクス講演会2003講演論文集、2P1-3F-C6，2003に記載されている。
【０２１４】
出力部６３は、時系列生成部６２からの時系列データを、処理対象データに相当する時系列データに変換して出力する。即ち、時系列生成部６２において生成される時系列データは、ノードが有する時系列パターンモデル２１の学習に用いられた特徴量の時系列データであり、出力部６３は、その特徴量の時系列データを、処理対象データ（に相当するデータ）に変換して出力する。
【０２１５】
具体的には、例えば、処理対象データが音声データであり、特徴抽出部２が、音声データからメルケプストラム係数を特徴量として抽出することとすると、メルケプストラムの時系列データが、時系列パターンモデル２１によって学習されるので、時系列生成部６２が生成ノードの時系列パターンモデル２１（図７）に基づいて生成する時系列データは、メルケプストラムの時系列データとなる。出力部６３は、時系列生成部６２において生成されるメルケプストラム（の時系列データ）を、処理対象データに相当する時系列データである音声データに変換する。
【０２１６】
なお、メルケプストラムの時系列データを音声データ（時領域の音声）に変換する方法としては、例えば、MLSAフィルタ（メル対数スペクトル近似フィルタ）と呼ばれる合成フィルタによって、メルケプストラムの時系列データをフィルタリングする方法がある。MLSAフィルタの詳細については、例えば、今井聖、住田一男、古市千恵子、「音声合成のためのメル対数スペクトル近似(MLSA)フィルタ」、電子情報通信学会論文誌（Ａ）、J66-A, 2, pp.122-129, 1983や、徳田恵一、小林隆夫、斉藤博徳、深田俊明、今井聖、「メルケプストラムをパラメータとする音声のスペクトル推定」、電子情報通信学会論文誌（Ａ）、J74-A, 8, pp.1240-1248, 1991に記載されている。
【０２１７】
次に、図１９のフローチャートを参照して、図１０のデータ処理装置で行われる、時系列データ（処理対象データ）を生成する生成処理について説明する。
【０２１８】
ステップＳ３１では、制御データが、生成部６（図１８）に入力される。この制御データは、生成ノード決定部６１に供給される。生成ノード決定部６１は、記憶部５に記憶された時系列パターン記憶ネットワークを構成するノードのうちの、制御データとしてのノードラベルが表すノードを、生成ノードに決定し、その決定結果を、時系列生成部６２に供給する。
【０２１９】
時系列生成部６２は、ステップＳ３３において、生成ノード決定部６１からの決定結果にしたがい、記憶部５に記憶された時系列パターン記憶ネットワークを構成するノードのうちの生成ノードが有する時系列パターンモデル２１（のパラメータ）に基づいて、時系列データを生成し、出力部６３に供給する。出力部６３は、ステップＳ３４において、時系列生成部６２からの時系列データを、処理対象データに相当する時系列データに変換して出力する。
【０２２０】
以上のような、時系列パターン記憶ネットワークを用いた生成処理によれば、その時系列パターン記憶ネットワークのノードの数に応じた（時系列パターンの）時系列データを生成することができる。
【０２２１】
以上のように、時系列パターンモデル２１を有する複数のノードから構成される時系列パターン記憶ネットワークを、時系列データに基づいて、自己組織的に更新するようにしたので、長さが一定の時系列データは勿論、長さが一定でない時系列データの教師なし学習、つまり、時系列データの、いわば自律的な学習を、容易に（実用的に）行うことができる。
【０２２２】
即ち、時系列パターン記憶ネットワークの各ノードは、時系列パターンモデル２１を有するから、時系列パターン記憶ネットワークの学習において、ノードの更新、つまり、そのノードが有する時系列パターンモデル２１の更新は、他のノードの更新に影響しない。従って、時系列パターン記憶ネットワークを構成するノードが１つ増えても、時系列パターン記憶ネットワークの学習に要する計算量は、単純には、１のノードの更新に要する計算量だけ増えるだけであり、時系列パターン記憶ネットワークの規模、つまり、時系列パターン記憶ネットワークを構成するノードの数を大にしても、時系列パターン記憶ネットワークの学習に要する計算量が飛躍的に増加することはない。従って、大規模な時系列パターン記憶ネットワークであっても、容易に、自己組織的に学習することができる。
【０２２３】
さらに、かかる時系列パターン記憶ネットワークの学習によれば、各ノードに、時系列データの統計的な特性を表す時系列パターンが記憶されるので、その時系列パターンを用いて、時系列データの認識や生成を、容易に行うことができる。
【０２２４】
なお、学習処理、認識処理、生成処理は、例えば、音声データ、画像データ、モータを駆動する信号（モータデータ）、その他の任意の時系列データを対象として行うことができる。具体的には、例えば、図１０のデータ処理装置を自律型のロボットなどの自律システムに適用し、そのロボットの視覚や、聴覚、触覚に相当するセンサが出力する信号や、ロボットの手や足に相当する部分を駆動するモータを制御する信号、合成音を生成する装置や目に相当するLEDに対して与える信号等を、学習処理、認識処理、生成処理の対象とする時系列データとして採用することができる。
【０２２５】
また、本実施の形態では、ノードが有する時系列パターンモデル２１（図７）として、状態遷移確率モデルの１つであるHMMを採用することとしたが、時系列パターンモデル２１としては、他の状態遷移確率モデルを採用することが可能である。
【０２２６】
時系列パターンモデル２１として採用することができる他の状態遷移確率モデルとしては、例えば、ベイジアンネットワークがある。
【０２２７】
ベイジアンネットワークでは、変数間の依存関係をグラフ構造で表し、各ノードに条件付き確率を割り当てることでモデル化が行われるが、特に、時間軸に沿った状態遷移モデルを構築することで、時系列データをモデル化することが可能となる。
【０２２８】
なお、ベイジアンネットワークのグラフ構造の決定は、例えば、学習データの尤度とグラフ構造の複雑さとを考慮したモデルを選択することにより行われ、条件付き確率の推定には、例えば、最尤推定法やEM(Expectation Maximaization)アルゴリズムなどが利用される。ここで、ベイジアンネットワークの詳細については、例えば、本村陽一、「不確実性モデリングのための情報表現：ベイジアンネット」、２００１年、ベイジアンネットチュートリアルなどに記載されている。
【０２２９】
さらに、時系列パターンモデル２１（図７）としては、上述のように、HMMやベイジアンネットワークなどのような状態遷移確率モデルを採用することができる他、関数を近似するモデル（以下、適宜、関数近似モデルという）を採用することもできる。
【０２３０】
関数近似モデルは、時系列パターンを、関数f()を用い、例えば、微分方程式{x(t)}'=f(x(t))や、差分方程式x(t+1)=f(x(t))などで表現するモデルで、関数f()が、時系列パターンを特徴づける。なお、tは時間（時刻）（サンプル点）を表し、x(t)は、時刻tの時系列データのサンプル値、または時刻（０から）tまでに観測された時系列データを表す。また、{x(t)}'は、時系列データx(t)の時間tに関する１次微分を表す。
【０２３１】
学習データ（時系列データ）から、ある時系列パターンを表す（に対応する）関数f()を求めることを、関数近似と呼ぶと、関数近似の方法としては、例えば、多項式などを用いて関数 f() を表現し、その多項式の係数を、学習データから決定する方法や、ニューラルネットワークによって関数 f() を表現し、そのニューラルネットワークのパラメータを、学習データから決定する方法などがある。
【０２３２】
多項式で表現された関数f()の関数近似において、その多項式の係数の決定（推定）は、例えば、最急降下法などによって行うことができる。また、ニューラルネットワークによって表現された関数f()の関数近似において、そのニューラルネットワークのパラメータの決定は、例えば、バックプロパゲーション法によって行うことができる。ここで、バックプロパゲーション法では、ニューラルネットワークに入力と出力のデータを与え、その入力と出力のデータの関係を満たすように、ニューラルネットワークのパラメータの学習が行われる。
【０２３３】
例えば、時系列パターンモデル２１として、関数f()を用いた差分方程式x(t+1)=f(x(t))で時系列パターンを表現する関数近似モデルを採用する場合、入力層x(t)と出力層x(t+1)をつなぐ重み（中間層）が、ニューラルネットワークのパラメータであり、このパラメータが、学習データ（時系列データ）を用いて学習される。ニューラルネットワークのパラメータの学習は、初期値を適当に与えて、バックプロパゲーション法により行われる。なお、ニューラルネットワークとしては、例えば、リカレントニューラルネットワークを採用することができる。
【０２３４】
関数f()がニューラルネットワークによって表現される時系列パターンモデル２１を有するノードで構成される時系列パターン記憶ネットワークの学習等でも、上述のHMMを時系列パターンモデル２１として採用した場合と同様に、勝者ノードを決定する必要があり、勝者ノードの決定のためには、時系列パターン記憶ネットワークの各ノードの、新たな時系列データに対するスコアを計算する必要がある。
【０２３５】
このスコアとしては、例えば、新たな時系列データの観測値（実際の値）と、関数f()がニューラルネットワークによって表現される時系列パターンモデル２１から求められる、新たな時系列データの理論値との誤差（例えば、差の二乗和など）を採用することができる。この場合、スコアの値が最も小さいノードが、新たな時系列データに最も適合するノードである勝者ノードとして決定される。
【０２３６】
勝者ノードの決定後は、各ノードの更新重みを決定し、以下、上述のHMMを時系列パターンモデル２１として採用した場合と同様の手順で、各ノード（が有するニューラルネットワーク）のパラメータを更新することができる。
【０２３７】
なお、スコアが、例えば、尤度である場合は、スコアが大きいほど、良いスコアとなり、スコアが、例えば、誤差や距離である場合には、スコアが小さいほど、良いスコアとなる。
【０２３８】
次に、以上のような時系列パターン記憶ネットワークを適用した順モデルや逆モデルについて説明する。
【０２３９】
図２０は、時系列パターン記憶ネットワークが適用された順モデルまたは逆モデルとしての入出力関係モデルの構成例を模式的に示している。
【０２４０】
図２０において、入出力関係モデルは、２つの時系列パターン記憶ネットワークnet_inおよびnet_outを有している。さらに、入出力関係モデルは、時系列パターン記憶ネットワークnet_inの各ノードN_i（i＝１，２，・・・，ノードの総数）と、時系列パターン記憶ネットワークnet_outの各ノードN'_j（j＝１，２，・・・，ノードの総数）とが結合されている結合モデルである。
【０２４１】
ここで、図２０において、時系列パターン記憶ネットワークnet_inのノードN_iと、時系列パターン記憶ネットワークnet_outのノードN'_jとの間の矢印が、そのノードN_iとN'_jとの結合を表している。
【０２４２】
なお、時系列パターン記憶ネットワークnet_inおよびnet_outは、同一の数のノードと同一のリンク（リンクがない場合を含む）を有するものであっても良いし、異なる数のノードまたは異なるリンクを有する者であっても良い。また、時系列パターン記憶ネットワークnet_inのノードN_iが有する時系列パターンモデル２１（図７）と、時系列パターン記憶ネットワークnet_outのノードが有する時系列パターンモデル２１も、同一の時系列パターンモデルであっても良いし、異なる時系列パターンモデルであっても良い。
【０２４３】
次に、図２１は、入出力関係モデルを用いて、各種の処理を行うデータ処理装置の構成例を示している。
【０２４４】
図２１のデータ処理装置では、図２０の入出力関係モデルによって制御対象を順モデルまたは逆モデルにモデル化し、さらに、その順モデルまたは逆モデルとしての入出力関係モデルを用いて、制御対象から得られる出力データや、制御対象に与えるべき制御データ（入力データ）を推定する。
【０２４５】
即ち、図２１において、データ処理装置は、記憶部２１１、学習部２１２、および認識生成部２１３から構成されている。
【０２４６】
記憶部２１１は、例えば、図２０に示した入出力関係モデルなどを記憶する。
【０２４７】
学習部２１２には、モデル化しようとする制御対象に与えられる入力データ（の観測値）と、その入力データに対して制御対象から得られる出力データ（の観測値）とのセットである教示データが供給されるようになっている。ここで、教示データは、ある区間の時系列データ（ある時間に亘る時系列データ）である入力データと、その区間の時系列データに対して制御対象から得られる区間の他の時系列データである出力データとのセットである。
【０２４８】
学習部２１２は、そこに供給される教示データを用い、制御対象の順モデルまたは逆モデルとしての入出力関係モデルの学習を行う。
【０２４９】
即ち、学習部２１２は、学習処理部２２１と結合重み更新部２２２から構成される。
【０２５０】
学習処理部２２１は、図１２に示した学習処理部３２と同様に構成され、学習部２１２に供給される教示データのうちの入力データに基づいて、記憶部２１１に記憶された入出力関係モデル（図２０）における時系列パターン記憶ネットワークnet_inを、図１０のデータ処理装置における場合と同様に、自己組織的に更新する。また、学習処理部２２１は、学習部２１２に供給される教示データのうちの出力データ（教示データにおいて、入力データとセットになっている出力データ）に基づいて、記憶部２１１に記憶された入出力関係モデル（図２０）における時系列パターン記憶ネットワークnet_outを、図１０のデータ処理装置における場合と同様に、自己組織的に更新する。
【０２５１】
さらに、学習処理部２２１は、時系列パターン記憶ネットワークnet_inを更新するときに勝者ノードとなった、その時系列パターン記憶ネットワークnet_inのノードN_iのノードラベル（以下、適宜、入力ラベルという）と、時系列パターン記憶ネットワークnet_outを更新するときに勝者ノードとなった、その時系列パターン記憶ネットワークnet_outのノードN'_jのノードラベル（以下、適宜、出力ラベルという）とをセットにしたラベルセットを、結合重み更新部２２２に供給する。
【０２５２】
結合重み更新部２２２は、学習処理部２２１から供給されるラベルセットに基づき、記憶部２１１に記憶された入出力関係モデル（図２０）における時系列パターン記憶ネットワークnet_outのノードN_iと、時系列パターン記憶ネットワークnet_outのノードN'_jとの結合関係を更新する。
【０２５３】
ここで、学習処理部２２１から結合重み更新部２２２に供給されるラベルセットは、入力ラベルと出力ラベルとのセットであり、入力ラベルは、教示データのうちの入力データに基づいて時系列パターン記憶ネットワークnet_inを更新するときに勝者ノードとなった、その時系列パターン記憶ネットワークnet_inのノードN_iのノードラベルであるから、時系列パターン記憶ネットワークnet_inにおいて、入力データに最も適合するノードN_iのノードラベルである。
【０２５４】
同様に、出力ラベルは、教示データのうちの出力データに基づいて時系列パターン記憶ネットワークnet_outを更新するときに勝者ノードとなった、その時系列パターン記憶ネットワークnet_outのノードN'_jのノードラベルであるから、時系列パターン記憶ネットワークnet_outにおいて、出力データに最も適合するノードN'_jのノードラベルである。
【０２５５】
結合重み更新部２２２では、時系列パターン記憶ネットワークnet_inのノードのうちの、教示データにおける入力データに最も適合するノードである勝者ノードN_iと、時系列パターン記憶ネットワークnet_outの各ノードとの結合関係が更新されるとともに、時系列パターン記憶ネットワークnet_outのノードのうちの、教示データにおける出力データに最も適合するノードである勝者ノードN'_jと、時系列パターン記憶ネットワークnet_inの各ノードとの結合関係が更新される。
【０２５６】
ここで、入出力関係モデルにおける時系列パターン記憶ネットワークnet_inのノードと、時系列パターン記憶ネットワークnet_outのノードとの間の結合関係は、その結合の度合いが強いほど、大きな値となる結合重みによって表されるようになっており、ノードどうしの結合関係の更新とは、結合重みの更新を意味する。結合重み更新部２２２によるノードどうしの結合関係の更新の方法についての詳細は、後述する。
【０２５７】
認識生成部２１３には、制御対象から得られる出力データを推定するための入力データ、または制御対象から得られる出力データをある目標値とするのに制御対象に与えるべき入力データ（制御データ）を推定するための出力データが供給される。
【０２５８】
そして、認識生成部２１３は、入力データが供給された場合は、記憶部２１１に記憶された入出力関係モデルにおける時系列パターン記憶ネットワークnet_inにおいて、その入力データに最も適合する勝者ノードN_iを決定し、その勝者ノードN_iとの結合重みが最も強い、時系列パターン記憶ネットワークnet_outのノードを、その入力データに対する出力データの推定値としての時系列データを生成する生成ノードN'_jに決定する。さらに、認識生成部２１３は、生成ノードN'_jが有する時系列パターンモデル２１（図７）に基づいて、出力データ（の推定値）を生成して出力する。
【０２５９】
また、認識生成部２１３は、出力データが供給された場合は、記憶部２１１に記憶された入出力関係モデルにおける時系列パターン記憶ネットワークnet_outにおいて、その出力データに最も適合する勝者ノードN'_jを決定し、その勝者ノードN'_jとの結合重みが最も強い、時系列パターン記憶ネットワークnet_inのノードを、その出力データが得られるときに制御対象に与えられる制御データ（入力データ）の推定値としての時系列データを生成する生成ノードN_iに決定する。さらに、認識生成部２１３は、生成ノードN_iが有する時系列パターンモデル２１（図７）に基づいて、制御データ（の推定値）を生成して出力する。
【０２６０】
即ち、認識生成部２１３は、スコア計算部２３１、勝者ノード決定部２３２、生成ノード決定部２３３、および時系列生成部２３４から構成される。
【０２６１】
なお、スコア計算部２３１、勝者ノード決定部２３２、生成ノード決定部２３３、および時系列生成部２３４は、認識生成部２１３に供給されたデータが、入力データであるのか、または出力データであるのかを認識することができるようになっているものとする。即ち、例えば、認識生成部２１３に対しては、そこに供給されるデータとは別に、あるいは、そこに供給されるデータとともに、そのデータが、入力データまたは出力データのうちのいずれであるのかを表す情報が供給されるようになっており、これにより、スコア計算部２３１、勝者ノード決定部２３２、生成ノード決定部２３３、および時系列生成部２３４は、認識生成部２１３に供給されたデータが、入力データであるのか、または出力データであるのかを認識する。
【０２６２】
スコア計算部２３１は、認識生成部２１３に供給されたデータに対して、記憶部２１１に記憶された入出力関係モデルを構成する時系列パターン記憶ネットワークnet_inの各ノードN_i、または時系列パターン記憶ネットワークnet_outの各ノードN'_jが適合する度合いであるスコアを、図１６の認識部３のスコア計算部５１における場合と同様にして計算し、勝者ノード決定部２３２に供給する。
【０２６３】
即ち、スコア計算部２３１は、認識生成部２１３に供給されたデータが入力データである場合、その入力データに対して、記憶部２１１に記憶された入出力関係モデルを構成する時系列パターン記憶ネットワークnet_inの各ノードN_iのスコアを計算し、勝者ノード決定部２３２に供給する。また、スコア計算部２３１は、認識生成部２１３に供給されたデータが出力データである場合、その出力データに対して、記憶部２１１に記憶された入出力関係モデルを構成する時系列パターン記憶ネットワークnet_outの各ノードN'_jのスコアを計算し、勝者ノード決定部２３２に供給する。
【０２６４】
勝者ノード決定部２３２は、図１６の認識部３の勝者ノード決定部５２における場合と同様に、スコア計算部２３１から供給されるスコアが最も高いノードを勝者ノードに決定し、その勝者ノードを表すノードラベルを、生成ノード決定部２３３に供給する。
【０２６５】
従って、認識生成部２１３に供給されたデータが入力データである場合、勝者ノード決定部２３２では、記憶部２１１に記憶された入出力関係モデルを構成する時系列パターン記憶ネットワークnet_inのノードの中で、スコア計算部２３１から供給される、入力データに対するスコアが最も高いノードが、勝者ノードN_iに決定され、その勝者ノードN_iを表す入力ラベルが、生成ノード決定部２３３に供給される。また、認識生成部２１３に供給されたデータが出力データである場合、勝者ノード決定部２３２では、記憶部２１１に記憶された入出力関係モデルを構成する時系列パターン記憶ネットワークnet_outのノードの中で、スコア計算部２３１から供給される、出力データに対するスコアが最も高いノードが、勝者ノードN'_jに決定され、その勝者ノードN'_jを表す出力ラベルが、生成ノード決定部２３３に供給される。
【０２６６】
なお、ここでは、最も高い（大きい）スコアが最も良いスコアであるとする。
【０２６７】
生成ノード決定部２３３は、勝者ノード決定部２３２から入力ラベルが供給された場合、即ち、認識生成部２１３に供給されたデータが入力データである場合、記憶部２１１に記憶された入出力関係モデルを構成する時系列パターン記憶ネットワークnet_outのノードの中で、勝者ノード決定部２３２からの入力ラベルが表すノードN_iとの結合重みが最も強い（最強の）ノードN'_jを生成ノードとして決定し、その生成ノードN'_jを表す出力ラベルを、時系列生成部２３４に供給する。また、生成ノード決定部２３３は、勝者ノード決定部２３２から出力ラベルが供給された場合、即ち、認識生成部２１３に供給されたデータが出力データである場合、記憶部２１１に記憶された入出力関係モデルを構成する時系列パターン記憶ネットワークnet_inのノードの中で、勝者ノード決定部２３２からの出力ラベルが表すノードN'_jとの結合重みが最も強い（最強の）ノードN_iを生成ノードとして決定し、その生成ノードN_iを表す入力ラベルを、時系列生成部２３４に供給する。
【０２６８】
時系列生成部２３４は、生成ノード決定部２３３から出力ラベルが供給された場合、即ち、認識生成部２１３に供給されたデータが入力データである場合、記憶部２１１に記憶された入出力関係モデルを構成する時系列パターン記憶ネットワークnet_outのノードのうちの、生成ノード決定部２３３からの出力ラベルが表すノードN'_jが有する時系列パターンモデル２１（図７）に基づいて、認識生成部２１３に供給された入力データに対する出力データの推定値としての時系列データを、例えば、図１８の生成部６の時系列生成部６２における場合と同様にして生成する。
【０２６９】
また、時系列生成部２３４は、生成ノード決定部２３３から入力ラベルが供給された場合、即ち、認識生成部２１３に供給されたデータが出力データである場合、記憶部２１１に記憶された入出力関係モデルを構成する時系列パターン記憶ネットワークnet_inのノードのうちの、生成ノード決定部２３３からの入力ラベルが表すノードN_iが有する時系列パターンモデル２１に基づいて、認識生成部２１３に供給された出力データに対する制御データ（入力データ）の推定値としての時系列データを、例えば、図１８の生成部６の時系列生成部６２における場合と同様にして生成する。
【０２７０】
次に、図２２のフローチャートを参照して、図２１のデータ処理装置で行われる、入出力関係モデルによる制御対象のモデル化、即ち、入出力関係モデルの学習について説明する。
【０２７１】
ステップＳ１０１において、入力データと出力データとのセットである教示データが、図２１のデータ処理装置に入力されると、その教示データは、学習部２１２の学習処理部２２１に供給される。
【０２７２】
学習処理部２２１は、ステップＳ１０２において、教示データのうちの入力データに基づいて、記憶部２１１に記憶された入出力関係モデル（図２０）における時系列パターン記憶ネットワークnet_inを、自己組織的に更新し、ステップＳ１０３に進む。ステップＳ１０３では、学習処理部２２１は、教示データのうちの出力データに基づいて、記憶部２１１に記憶された入出力関係モデルにおける時系列パターン記憶ネットワークnet_outを、自己組織的に更新する。
【０２７３】
そして、学習処理部２２１は、時系列パターン記憶ネットワークnet_inを更新するときに勝者ノードとなった、その時系列パターン記憶ネットワークnet_inのノードN_iの入力ラベルと、時系列パターン記憶ネットワークnet_outを更新するときに勝者ノードとなった、その時系列パターン記憶ネットワークnet_outのノードN'_jの出力ラベルとのセットであるラベルセットを、結合重み更新部２２２に供給する。
【０２７４】
結合重み更新部２２２は、ステップＳ１０４において、学習処理部２２１から供給されるラベルセットに基づき、記憶部２１１に記憶された入出力関係モデル（図２０）における時系列パターン記憶ネットワークnet_inの各ノードと、時系列パターン記憶ネットワークnet_outの各ノードとの結合重みを更新して、ステップＳ１０１に戻り、次の教示データが入力されるのを待って、以下、同様の処理が繰り返される。
【０２７５】
多数の教示データが入力され、ステップＳ１０１乃至Ｓ１０４の処理が繰り返されることにより、記憶部２１１に記憶された入出力関係モデルは、制御対象に対応する順モデルとなっていくとともに、逆モデルにもなっていく。
【０２７６】
なお、ステップＳ１０２とＳ１０３の処理は、並列して行うこともできるし、図２２の場合と逆順で行うこともできる。
【０２７７】
次に、図２３を参照して、結合重み更新部２２２（図２１）が、図２２のステップＳ１０４で行う結合重み（ノードどうしの結合関係）の更新について説明する。
【０２７８】
なお、以下、適宜、入出力関係モデルにおいて、入力データが与えられる時系列パターン記憶ネットワーク、つまり、入力データを用いて学習が行われ、入力データの時系列パターンを表現する時系列パターンモデル２１を有する複数のノードから構成される時系列パターン記憶ネットワーク（例えば、時系列パターン記憶ネットワークnet_in）を、入力ネットワークといい、出力データが与えられる時系列パターン記憶ネットワーク、つまり、出力データを用いて学習が行われ、出力データの時系列パターンを表現する時系列パターンモデル２１を有する複数のノードから構成される時系列パターン記憶ネットワーク（例えば、時系列パターン記憶ネットワークnet_out）を、出力ネットワークという。
【０２７９】
さらに、以下、適宜、入力ネットワークのノードを入力ノードといい、出力ネットワークのノードを出力ノードという。
【０２８０】
また、以下では、入出力関係モデルを、入力データを与えて出力データを推定する順モデルとして用いる場合についての説明をし、入出力関係モデルを、出力データ（目標値）を与えて入力データ（制御データ）を推定する逆モデルとして用いる場合についての説明は適宜省略する。
【０２８１】
図２３は、入出力関係モデルを示している。
【０２８２】
図２３左側では、入出力関係モデルは、１つの入力ネットワークnet_inと、１つの出力ネットワークnet_outとを有し、入力ネットワークnet_inの各入力ノードと、出力ネットワークnet_outの各出力ノードとが結合している。なお、図２３では、入力ネットワークnet_in、および出力ネットワークnet_outのいずれも、８つのノードで構成されている。
【０２８３】
図２３左側では、入力ネットワークnet_inの各入力ノードは、出力ネットワークnet_outのすべての出力ノードと結合しており（従って、出力ネットワークnet_outの各出力ノードも、入力ネットワークnet_inのすべての入力ノードと結合している）、入力ネットワークnet_inの入力ノードと、出力ネットワークnet_outの出力ノードとのすべての組み合わせについて、結合重みwが存在する。
【０２８４】
いま、ノードどうしが結合している２つの時系列パターン記憶ネットワークに注目し、そのうちの一方の時系列パターン記憶ネットワークのノードを各行に対応させるとともに、他方の時系列パターン記憶ネットワークのノードを各列に対応させ、第i行第j列の要素に、一方の時系列パターン記憶ネットワークのi番目のノードと、他方の時系列パターン記憶ネットワークのj番目のノードとの結合重みwを配置した行列を、結合重み行列MTXということとすると、結合重み更新部２２２（図２１）は、この結合重み行列MTXの各要素である結合重みwを更新する。
【０２８５】
図２３右側は、図２３左側の入出力関係モデルについての結合重み行列MTXを示している。
【０２８６】
図２３右側の結合重み行列MTXでは、入力ノードを各行に対応させるとともに、出力ノードを各列に対応させ、第i行第j列の要素に、i番目の入力ノードと、j番目の出力ノードとの結合重みwが配置されている。結合重み更新部２２２（図２１）は、この結合重み行列MTXの各要素である結合重みwを更新する。
【０２８７】
即ち、結合重み更新部２２２は、例えば、最初に電源がオンにされたときに、結合重み行列MTXにおけるすべての結合重みwを、例えば、初期値としての0に初期化する。そして、結合重み更新部２２２は、図２１のデータ処理装置に対して、教示データ、つまり、入力データと出力データとのセットが入力され、これにより、入力ネットワークnet_inにおける勝者ノードを表す入力ラベルと、出力ネットワークnet_outにおける勝者ノードを表す出力ラベルとのラベルセットが、学習処理部２２１から与えられるたびに、それらの勝者ノードどうしの結合を、いわば中心として、結合重みを更新する。
【０２８８】
具体的には、結合重み更新部２２２は、例えば、式（４）にしたがって、結合重み行列MTXの結合重みwを更新する。
【０２８９】
【数４】

【０２９０】
ここで、βは、結合重みwを更新する程度の表す学習率であり、0から1の範囲で与えられる。学習率βを小さくするほど、結合重みwは、あまり変化しなくなり、学習率βが0である場合には、結合重みwは変化しない。一方、学習率βを大きくするほど、結合重みwも、大きく変化し、学習率βが1である場合には、結合重みwは、更新の基準値△wに更新される。
【０２９１】
また、基準値△wは、例えば、式（５）で与えられる。
【０２９２】
【数５】

【０２９３】
ここで、dは、式（３）における場合と同様に、勝者ノードとのパターン間距離を表し、勝者ノードとなっているノードについては、d=0である。従って、勝者ノード（となっているノード）については、基準値△wは1となり、勝者ノードからのパターン間距離dが大のノードほど、基準値△wは0に近づく。
【０２９４】
いま、学習処理部２２１（図２１）から結合重み更新部２２２に供給される入力ラベルが表す入力ノード、即ち、入力ネットワークnet_inにおける勝者ノードを、入力ノードN_iと表すとともに、学習処理部２２１（図２１）から結合重み更新部２２２に供給される出力ラベルが表す出力ノード、即ち、出力ネットワークnet_outにおける勝者ノードを、出力ノードN'_jと表すと、結合重み更新部２２２（図２１）は、式（４）（および式（５））にしたがい、以下のように、結合重み行列MTXの結合重みwを更新する。
【０２９５】
即ち、結合重み更新部２２２は、出力ネットワークnet_outの各出力ノードについて、出力ネットワークnet_outにおける勝者ノードである出力ノードN'_jとのパターン間距離dを用い、式（５）にしたがって、基準値△wを求め、さらに、その基準値△wを用い、式（４）にしたがって、入力ネットワークnet_inの勝者ノードであるi番目の入力ノードN_iとの結合重みwを更新する。
【０２９６】
これにより、入力ネットワークnet_inの勝者ノードである入力ノードN_iに対応する、結合重み行列MTXの第i行の（各列の）結合重みwが更新される。
【０２９７】
また、結合重み更新部２２２は、入力ネットワークnet_inの各入力ノードについて、入力ネットワークnet_inにおける勝者ノードである入力ノードN_iとのパターン間距離dを用い、式（５）にしたがって、基準値△wを求め、さらに、その基準値△wを用い、式（４）にしたがって、出力ネットワークnet_outの勝者ノードであるj番目の出力ノードN'_jとの結合重みwを更新する。
【０２９８】
これにより、出力ネットワークnet_outの勝者ノードである出力ノードN'_jに対応する、結合重み行列MTXの第j列の（各行の）結合重みwが更新される。
【０２９９】
従って、入力ネットワークnet_inの勝者ノードN_iと、出力ネットワークnet_outの勝者ノードN'_jとの結合重みが、結合の度合いを最も強めるように更新される。
【０３００】
なお、入力ネットワークnet_inの勝者ノードである入力ノードN_iと、出力ネットワークnet_outの勝者ノードである出力ノードN'_jとの結合重みwの更新は、出力ネットワークnet_outの各出力ノードについての、勝者ノードである入力ノードN_iとの結合重みwの更新時か、または、入力ネットワークnet_inの各入力ノードについての、勝者ノードである出力ノードN'_jとの結合重みwの更新時のいずれか一方においてのみ行われる。
【０３０１】
以上のような結合重みw（結合重み行列MTX）の更新は、教示データとしての入力データと出力データとのセットが、図２１のデータ処理装置に対して入力されるたびに行われる。
【０３０２】
さらに、入出力関係モデルが有する入力ネットワークnet_inの入力データに基づく学習、および出力ネットワークnet_outの出力データに基づく学習も、教示データとしての入力データと出力データとのセットが、図２１のデータ処理装置に対して入力されるたびに行われる。
【０３０３】
そして、入力ネットワークnet_in、および出力ネットワークnet_outの学習が進むと、入力ノードが有する時系列パターンモデル２１が、ある特定の時系列パターンを表現し、また、出力ノードが有する時系列パターンモデル２１も、他の特定の時系列パターンを表現するようになる。
【０３０４】
その結果、ある特定の時系列パターンの入力データと、他の特定の時系列パターンの出力データとの間に、何らかの関係性がある場合、そのような入力データと出力データとのセット（教示データ）が与えられると、入力ネットワークnet_inにおいてある特定の時系列パターンを表現する時系列パターンモデル２１を有する入力ノードが勝者ノードとなるとともに、出力ネットワークnet_outにおいて他の特定の時系列パターンを表現する時系列パターンモデル２１を有する出力ノードが勝者ノードとなる。
【０３０５】
さらに、上述したように、入力ネットワークnet_inの勝者ノードを、いわば中心として、入力ネットワークnet_inの各入力ノードと、出力ネットワークnet_outの勝者ノードとの結合重みが更新されるとともに、出力ネットワークnet_outの勝者ノードを中心として、出力ネットワークnet_outの各出力ノードと、入力ネットワークnet_inの勝者ノードとの結合重みが更新される。
【０３０６】
即ち、入力ネットワークnet_inの各入力ノードと、出力ネットワークnet_outの勝者ノードとの結合重みは、入力ネットワークnet_inの勝者ノードとのパターン間距離dが近い入力ノードほど強くなる（強化する）ように更新される。また、出力ネットワークnet_outの各出力ノードと、入力ネットワークnet_inの勝者ノードとの結合重みは、出力ネットワークnet_outの勝者ノードとのパターン間距離dが近い出力ノードほど強くなるように更新される。
【０３０７】
逆に言えば、入力ネットワークnet_inの各入力ノードと、出力ネットワークnet_outの勝者ノードとの結合重みは、入力ネットワークnet_inの勝者ノードとのパターン間距離dが遠い入力ノードほど弱くなる（弱化する）ように更新される。また、出力ネットワークnet_outの各出力ノードと、入力ネットワークnet_inの勝者ノードとの結合重みも、出力ネットワークnet_outの勝者ノードとのパターン間距離dが遠い出力ノードほど弱くなるように更新される。
【０３０８】
多数の教示データが与えられ、入力ネットワークnet_in、および出力ネットワークnet_outの学習が進み、さらに、結合重みの更新が進むと、その結合重みによって、入力データ（の時系列パターン）と出力データ（の時系列パターン）とを関係付ける順モデルまたは逆モデルとしての入出力関係モデルを獲得することができる。
【０３０９】
そして、順モデルとしての入出力関係モデルによれば、ある入力データが与えられた場合に、入力ネットワークnet_inにおいて、その入力データに最も適合する勝者ノードを決定することができ、その勝者ノードとの結合重みが最強の出力ネットワークnet_outの出力ノードを決定することができる。さらに、その出力ノード（が有する時系列パターンモデル２１）に基づき、時系列データを生成することで、与えられた入力データに対する出力データを推定することができる。
【０３１０】
また、逆モデルとしての入出力関係モデルによれば、ある出力データ（目標値）が与えられた場合に、出力ネットワークnet_outにおいて、その出力データに最も適合する勝者ノードを決定することができ、その勝者ノードとの結合重みが最強の入力ネットワークnet_inの入力ノードを決定することができる。さらに、その入力ノード（が有する時系列パターンモデル２１）に基づき、時系列データを生成することで、与えられた出力データに対する制御データ（入力データ）を推定することができる。
【０３１１】
なお、結合重み行列MTXは、入出力関係モデルの一部として、記憶部２１１（図２１）に記憶される。
【０３１２】
次に、図２４のフローチャートを参照して、順モデルまたは逆モデルとしての入出力関係モデルを用いて、入力データに対する出力データや、出力データに対する制御データ（入力データ）を推定する処理について説明する。
【０３１３】
まず、図２１のデータ処理装置において、入力データに対する出力データを推定する場合、ステップＳ１１１において、その入力データが、図２１のデータ処理装置に入力される。
【０３１４】
データ処理装置に入力された入力データは、認識生成部２１３のスコア計算部２３１に供給される。
【０３１５】
スコア計算部２３１は、ステップＳ１１２において、そこに供給された入力データに対して、記憶部２１１に記憶された入出力関係モデルを構成する時系列パターン記憶ネットワークnet_inの各ノードN_iのスコアを計算し、勝者ノード決定部２３２に供給する。
【０３１６】
勝者ノード決定部２３２は、ステップＳ１１３において、記憶部２１１に記憶された入出力関係モデルを構成する時系列パターン記憶ネットワークnet_inのノードの中で、スコア計算部２３１からのスコアが最も高いノードを、勝者ノードN_iに決定し、その勝者ノードN_iを表す入力ラベルを、生成ノード決定部２３３に供給する。
【０３１７】
生成ノード決定部２３３は、ステップＳ１１４において、記憶部２１１に記憶された入出力関係モデルを構成する時系列パターン記憶ネットワークnet_outのノードの中で、勝者ノード決定部２３２からの入力ラベルが表すノードN_iとの結合重みが最も強いノードN'_jを生成ノードに決定し、その生成ノードN'_jを表す出力ラベルを、時系列生成部２３４に供給する。
【０３１８】
時系列生成部２３４は、ステップＳ１１５において、記憶部２１１に記憶された入出力関係モデルを構成する時系列パターン記憶ネットワークnet_outのノードのうちの、生成ノード決定部２３３からの出力ラベルが表すノードN'_jが有する時系列パターンモデル２１（図７）に基づいて、認識生成部２１３に供給された入力データに対する出力データの推定値としての時系列データを生成して、ステップＳ１１６に進み、その時系列データを出力する。
【０３１９】
次に、図２１のデータ処理装置において、出力データに対する制御データ（入力データ）を推定する場合には、ステップＳ１１１において、その出力データが、図２１のデータ処理装置に入力される。
【０３２０】
データ処理装置に入力された出力データは、認識生成部２１３のスコア計算部２３１に供給される。
【０３２１】
スコア計算部２３１は、ステップＳ１１２において、そこに供給された出力データに対して、記憶部２１１に記憶された入出力関係モデルを構成する時系列パターン記憶ネットワークnet_outの各ノードN'_jのスコアを計算し、勝者ノード決定部２３２に供給する。
【０３２２】
勝者ノード決定部２３２は、ステップＳ１１３において、記憶部２１１に記憶された入出力関係モデルを構成する時系列パターン記憶ネットワークnet_outのノードの中で、スコア計算部２３１からのスコアが最も高いノードを、勝者ノードN'_jに決定し、その勝者ノードN'_jを表す出力ラベルを、生成ノード決定部２３３に供給する。
【０３２３】
生成ノード決定部２３３は、ステップＳ１１４において、記憶部２１１に記憶された入出力関係モデルを構成する時系列パターン記憶ネットワークnet_inのノードの中で、勝者ノード決定部２３２からの出力ラベルが表すノードN'_jとの結合重みが最も強いノードN_iを生成ノードに決定し、その生成ノードN_iを表す入力ラベルを、時系列生成部２３４に供給する。
【０３２４】
時系列生成部２３４は、ステップＳ１１５において、記憶部２１１に記憶された入出力関係モデルを構成する時系列パターン記憶ネットワークnet_inのノードのうちの、生成ノード決定部２３３からの入力ラベルが表すノードN_iが有する時系列パターンモデル２１に基づいて、認識生成部２１３に供給された出力データに対する制御データ（入力データ）の推定値としての時系列データを生成して、ステップＳ１１６に進み、その時系列データを出力する。
【０３２５】
以上のように、入力データと出力データとのセットを用いて、入出力関係モデルの学習を行い、制御対象を順モデルおよび逆モデルにモデル化して、制御対象を精度良く表現し、高精度に、出力データや制御データ（入力データ）を推定することが可能となる。
【０３２６】
次に、上述したように、図２１のデータ処理装置においては、制御対象に与えられる、ある区間の時系列データ（ある時間に亘る時系列データ）である入力データと、その区間の時系列データに対して制御対象から観測される区間の他の時系列データである出力データとのセットを、教示データとして、学習部２１２に供給し、学習部２１２において、教示データを用い、制御対象の順モデルまたは逆モデルとしての入出力関係モデルの学習を行う。
【０３２７】
従って、例えば、制御対象をロボットとして、そのロボットに与える入力データとして、ロボットに呼びかける音声をセンサとしてのマイクで検知したセンサデータ（音声データ）の時系列を採用するとともに、ロボットに呼びかける音声に対して、ロボットが手をふるようにアームを動かす行動をとるためにモータに与えられるモータデータの時系列を採用して、入出力関係モデルの学習を行うと、学習部２１２（図２１）では、入出力関係モデルの入力ネットワークnet_inの１以上のノード（が有する時系列パターンモデル２１）が、ロボットに呼びかける音声に対応するセンサデータとしての入力データの時系列パターンを表現するように、自己組織的な学習が行われるとともに、出力ネットワークnet_outの１以上のノード（が有する時系列パターンモデル２１）が、手をふる行動に対応するモータデータとしての出力データの時系列パターンを表現するように、自己組織的な学習が行われる。
【０３２８】
さらに、学習部２１２では、入出力関係モデルの入力ネットワークnet_inの各ノードと、出力ネットワークnet_outの勝者ノードとの結合重みが、入力ネットワークnet_inの勝者ノードとのパターン間距離dが近いノードほど強くなるように更新されるとともに、出力ネットワークnet_outの各出力ノードと、入力ネットワークnet_inの勝者ノードとの結合重みが、出力ネットワークnet_outの勝者ノードとのパターン間距離dが近い出力ノードほど強くなるように更新される。
【０３２９】
その結果、入力ネットワークnet_inのノードのうちの、ロボットに呼びかける音声に対応するセンサデータとしての入力データの時系列パターンを表現する（時系列パターンモデル２１を有する）１以上のノードと、出力ネットワークnet_outのノードのうちの、手をふる行動に対応するモータデータの時系列パターンを表現する（時系列パターンモデル２１を有する）１以上のノードとの結合重みは強くなる。
【０３３０】
その後、認識生成部２１３（図２１）に、ロボットに呼びかける音声に対応するセンサデータが、入力データとして与えられると、入出力関係モデルでは、その入力データに対して、入力ネットワークnet_inのノードのうちの、ロボットに呼びかける音声に対応するセンサデータの時系列パターンを表現する、ある１つのノードが勝者ノードとなる。そして、認識生成部２１３では、その勝者ノードとの結合重みが最も強い、出力ネットワークnet_outのノード、即ち、いまの場合、出力ネットワークnet_outのノードのうちの、手をふる行動に対応するモータデータの時系列パターンを表現する、あるノードが、生成ノードに決定され、その生成ノードを用いて、出力データ、即ち、いまの場合、手をふる行動に対応するモータデータが生成されて出力される。
【０３３１】
ここで、入出力関係モデルを利用したロボットの認知行動という場合の認知とは、入力データに対して、入出力関係モデルの入力ネットワークnet_inのノードの中から勝者ノードを決定することに相当し、行動とは、その勝者ノードに対して、出力ネットワークnet_outのノードの中から生成ノードを決定し、時系列データ（出力データ）を生成することに相当する。
【０３３２】
図２１のデータ処理装置によれば、例えば、ロボットに、呼びかけの音声を与え、その音声に対して、手をふるようなアームの動きを与えると、上述のような学習が行われ、その結果、ロボットが、呼びかけの音声に対して、手をふる認知行動を行うようになる。
【０３３３】
しかしながら、図２１のデータ処理装置では、認知と行動とが、比較的短時間で繰り返されることで完成する、実時間性が要求されるタスクを、ロボットに行わせることが困難であることがある。
【０３３４】
即ち、例えば、ロボットが、目の前にあるボールを左右に転がすタスクを行う場合、ボールの状態を把握（認識）する認知と、ボールの状態に応じて適切にアームを動かす行動とを、ある短い所定の時間単位で繰り返し行う必要がある。いま、この繰り返しの単位である所定の時間を、フレームと呼ぶこととすると、時間軸上のあるフレームにおける、ボールの状態をセンサで検知したセンサデータと、そのフレームにおいてとらなければならないアームの動きに対応するモータデータとのセットを、教示データとして、図２１のデータ処理装置に与え、その教示データのうちのセンサデータの時系列パターンを表現する入力ノード（入力ネットワークnet_inのノード）と、その教示データのうちのモータデータの時系列パターンを表現する出力ノード（出力ネットワークnet_outのノード）との結合重みを強くしても、ロボットは、目の前にあるボールを左右に転がすタスクを行うことができるようにはならない。
【０３３５】
なぜなら、あるフレームのセンサデータが与えられた時点で、そのフレームのモータデータによるアームの動きは、既に行われていなければならないからである。
【０３３６】
従って、ロボットが、目の前にあるボールを左右に転がすタスクを行うことができるようにするには、あるフレームを注目フレームとして注目すると、ボールの状態をセンサで検知したセンサデータのうちの、注目フレームのセンサデータの時系列パターンを表現する入力ノード（以下、適宜、センサデータに対応するノードともいう）と、ボールを左右に転がすアームの動きに対応するモータデータのうちの、注目フレームの時刻から一定の時間だけ遅れたフレームのモータデータの時系列パターンを表現する出力ノード（以下、適宜、モータデータに対応するノードともいう）との結合重みを強くするように、入出力関係モデルの学習を行う必要がある。
【０３３７】
なお、フレームのセンサデータの認知、即ち、フレームのセンサデータに対して勝者ノードを決定する処理の処理速度によっては、注目フレームのセンサデータが与えられてから、そのセンサデータに対するモータデータが生成される行動が行われるまでに、無視することができない遅延時間が生じることがある。注目フレームのセンサデータに対応するノードとの結合重みを強くする出力ノードを、注目フレームからどの程度の時間だけ遅れたフレームのモータデータに対応するノードとするかは、必要に応じて、かかる遅延時間をも考慮して決める必要がある。
【０３３８】
図２５は、実時間性が要求されるタスクを行うことが可能なロボットの構成例を示している。
【０３３９】
図２５において、ロボットは、データ処理装置３０１、センサ３０２、およびモータ駆動部３０３等から構成されている。
【０３４０】
データ処理装置３０１は、センサ３０２から供給される時系列のセンサデータと、モータ駆動部３０３から供給される時系列のモータデータとを用いて、入出力関係モデルの自己組織的な学習を行う。さらに、データ処理装置３０１は、センサ３０２から供給される時系列のセンサデータに対して、時系列のモータデータを生成し、モータ駆動部３０３に供給する。
【０３４１】
センサ３０２は、カメラやマイク等であり、外部の状態を検知して、その外部の状態を表す時系列のセンサデータを、データ処理装置３０１に供給する。
【０３４２】
モータ駆動部３０３は、データ処理装置３０１から供給されるモータデータに応じて、例えば、ロボットのアーム等を動かすための図示せぬモータを駆動する。また、モータ駆動部３０３は、例えば、ロボットのアーム等が、外部から力が加えられることによって動かされた場合に、その動きをするために、モータ駆動部３０３に与えられるべきモータデータと同一のモータデータを生成し、データ処理部３０１に供給する。
【０３４３】
図２５において、データ処理装置３０１は、記憶部３１１、データ抽出部３１２、学習処理部３１３、写像学習部３１４、データ抽出部３１５、認識部３１６、写像部３１７、および生成部３１８から構成されている。
【０３４４】
記憶部３１１は、入出力関係モデルを記憶している。
【０３４５】
ここで、図２６は、記憶部３１１が記憶している入出力関係モデルM₁₁を示している。
【０３４６】
入出力関係モデルM₁₁は、図２０や図２３に示した入出力関係モデルと同様に、入力データとしての時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される時系列パターン記憶ネットワークである入力ネットワークnet₁（入力時系列パターン記憶ネットワーク）と、出力データとしての時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される時系列パターン記憶ネットワークである出力ネットワークnet₂（出力時系列パターン記憶ネットワーク）とを有する。
【０３４７】
そして、入出力関係モデルM₁₁では、入力ネットワークnet₁の各ノードと、出力ネットワークのnet₂の各ノードとが、結合重みによって結合されている。
【０３４８】
図２５に戻り、データ抽出部３１２には、センサ３０２が各時刻において出力するセンサデータと、モータ駆動部３０２が同一時刻において出力するモータデータとが、教示データとして供給される。データ抽出部３１２は、教示データのうちのセンサデータを、認知行動時に入出力関係モデルM₁₁に与える入力データとして、その入力データの時系列から、フレーム単位の入力データを順次抽出し、学習処理部３１３に供給する。
【０３４９】
さらに、データ抽出部３１２は、教示データのうちのモータデータを、認知行動時に入出力関係モデルM₁₁から生成されるべき出力データとして、その出力データの時系列から、フレーム単位の出力データを順次抽出し、学習処理部３１３に供給する。
【０３５０】
学習処理部３１３は、認識学習処理部３２１と生成学習処理部３２２とから構成され、データ抽出部３１２から供給されるフレーム単位の入力データと出力データそれぞれを用いて、記憶部３１１に記憶された入出力関係モデルM₁₁（図２６）が有する入力ネットワークnet₁と出力ネットワークnet₂それぞれの自己組織的な学習を行う。
【０３５１】
即ち、認識学習処理部３２１は、図２１の学習処理部２２１と同様に、データ抽出部３１２から供給されるフレーム単位の入力データに基づいて、記憶部３１１に記憶された入出力関係モデルM₁₁（図２６）における入力ネットワークnet₁を、自己組織的に更新する。
【０３５２】
具体的には、認識学習処理部３２１は、入出力関係モデルM₁₁における入力ネットワークnet₁の各ノードについて、データ抽出部３１２からのフレームの入力データに対するスコアを求め、入力ネットワークnet₁のノードの中から、スコアの最も良いノードを、勝者ノード（入力勝者ノード）に決定する。さらに、認識学習処理部３２１は、データ抽出部３１２からのフレームの入力データに対する入力勝者ノードに基づいて、入力ネットワークnet₁を、自己組織的に更新する。
【０３５３】
また、認識学習処理部３２１は、フレーム単位の入力データに対して時系列に決定した入力勝者ノードを表すノードラベルである入力ラベルを、写像学習部３１４に、時系列に供給する。
【０３５４】
生成学習処理部３２２も、図２１の学習処理部２２１と同様に、データ抽出部３１２から供給されるフレーム単位の出力データに基づいて、記憶部３１１に記憶された入出力関係モデルM₁₁（図２６）における出力ネットワークnet₂を、自己組織的に更新する。
【０３５５】
具体的には、生成学習処理部３２２は、入出力関係モデルM₁₁における出力ネットワークnet₂の各ノードについて、データ抽出部３１２からのフレームの出力データに対するスコアを求め、出力ネットワークnet₂のノードの中から、スコアの最も良いノードを、勝者ノード（出力勝者ノード）に決定する。さらに、生成学習処理部３２２は、データ抽出部３１２からのフレームの出力データに対する出力勝者ノードに基づいて、出力ネットワークnet₂を、自己組織的に更新する。
【０３５６】
また、生成学習処理部３２２は、フレーム単位の出力データに対して時系列に決定した出力勝者ノードを表すノードラベルである出力ラベルを、写像学習部３１４に、時系列に供給する。
【０３５７】
写像学習部３１４は、データバッファ３３１、読み出し部３３２、および結合重み更新部３３３から構成され、記憶部３１１に記憶された入出力関係モデルM₁₁における入力ネットワークnet₁のフレーム単位の入力データに対する入力勝者ノードと、出力ネットワークnet₂の各ノードとの結合重みを更新するとともに、出力ネットワークnet₂の、フレーム単位の入力データの時刻から一定の時間だけ遅れたフレーム単位の出力データに対する出力勝者ノードと、入力ネットワークnet₁の各ノードとの結合重みを更新する。
【０３５８】
即ち、データバッファ３３１は、認識学習処理部３２１から供給される時系列の入力ラベルと、生成学習処理部３２２から供給される時系列の出力ラベルとを一時記憶する。
【０３５９】
読み出し部３３２は、入力データのフレームを、順次、注目フレームとして、データバッファ３３１に記憶された入力ラベルのうちの、注目フレームの入力データに対する入力勝者ノードを表す入力ラベルと、データバッファ３３１に記憶された出力ラベルのうちの、注目フレームの時刻から一定の時間だけ遅れたフレームの出力データに対する出力勝者ノードを表す出力ラベルとを読み出して対応付け、その対応付けた入力ラベルと出力ラベルとのセットであるラベルセットを、結合重み更新部３３３に供給する。
【０３６０】
結合重み更新部３３３は、図２１の結合重み更新部２２２と同様に、図２３で説明したようにして、読み出し部３３２から供給されるラベルセットに基づき記憶部３１１に記憶された入出力関係モデルM₁₁（図２６）における入力ネットワークnet₁のノードN_iと、出力ネットワークnet₂のノードN'_jとの結合関係を、ヘブ則等により更新する。
【０３６１】
即ち、結合重み更新部３３３は、入力ネットワークnet₁の各入力ノードと、ラベルセットの出力ラベルが表す出力ネットワークnet₂の出力勝者ノードとの結合重みを、ラベルセットの入力ラベルが表す入力ネットワークnet₁の入力勝者ノードを中心として更新するとともに、出力ネットワークnet₂の各出力ノードと、入力ネットワークnet₁の勝者ノードとの結合重みを、出力ネットワークnet₂の勝者ノードを中心として更新する。
【０３６２】
ここで、上述したように、入力勝者ノードは、注目フレームの入力データに対する勝者ノードであり、出力勝者ノードは、注目フレームから一定の時間だけ遅れたフレームの出力データに対する勝者ノードであるから、結合重み更新部３３３による結合重みの更新によれば、記憶部３１１に記憶された入出力関係モデルM₁₁において、注目フレームの入力データに対する入力ネットワークnet₁の入力勝者ノードと、注目フレームから一定の時間だけ遅れたフレームの出力データに対する出力ネットワークnet₂の出力勝者ノードとの結合重みが、より強くなるように更新される。
【０３６３】
その結果、入出力関係モデルM₁₁に、あるフレームFの入力データが与えられると、入出力関係モデルM₁₁では、入力ネットワークnet₁のノードのうちの、フレームFの入力データに対応するノードが入力勝者ノードとなる。さらに、入出力関係モデルM₁₁では、出力ネットワークnet₂のノードのうちの、フレームFから一定の時間だけ遅れたフレームの出力データに対応するノードが、入力勝者ノードとの結合重みが最も強いノードとして、生成ノードに決定され、これにより、その生成ノードに基づき、フレームFから一定の時間だけ遅れたフレームの出力データに相当する時系列データが生成される。
【０３６４】
データ抽出部３１５には、センサ３０２が各時刻において出力するセンサデータが供給される。データ抽出部３１５は、センサ３０２からのセンサデータを、入力データとして、その入力データの時系列から、フレーム単位の入力データを順次抽出し、認識部３１６に供給する。
【０３６５】
認識部３１６は、スコア計算部３４１と勝者ノード決定部３４２とから構成される。
【０３６６】
また、図２５において、写像部３１７は、生成ノード決定部３５１から構成される。さらに、生成部３１８は、時系列生成部３６１から構成される。
【０３６７】
スコア計算部３４１、勝者ノード決定部３４２、生成ノード決定部３５１、時系列生成部３６１は、それぞれ、図２１のスコア計算部２３１、勝者ノード決定部２３２、生成ノード決定部２３３、時系列生成部２３４と同様の処理を行う。
【０３６８】
なお、時系列生成部３６１が生成した出力データは、モータデータとして、モータ駆動部３０３に供給される。
【０３６９】
次に、図２７を参照して、図２５のデータ抽出部３１２の処理について説明する。
【０３７０】
図２５で説明したように、データ抽出部３１２には、センサ３０２が各時刻において出力するセンサデータと、モータ駆動部３０３が同一時刻において出力するモータデータとが供給される。
【０３７１】
いま、フレームの長さ（時間）をTと表すこととすると、データ抽出部３１２は、センサデータを入力データとして、その入力データの時系列を、図２７に示すように、時間T単位に区切った、フレーム単位の入力データを抽出し、学習処理部３１３に供給する。
【０３７２】
また、データ抽出部３１２は、モータデータを出力データとして、その出力データの時系列を、図２７に示すように、時間T単位に区切ったった、フレーム単位の出力データを抽出し、学習処理部３１３に供給する。
【０３７３】
ここで、以下、適宜、時刻tを先頭の時刻とし、時刻t+Tを終わりの時刻とする時間Tのフレームを、時刻tのフレームという。時刻tの入力データ（のサンプル値）から、時刻t+t'（の直前）の入力データまでを、I[t,t+t']と表すこととすると、時刻tのフレームの入力データは、I[t,t+T]と表すことができる。同様に、時刻tの出力データから、時刻t+t'の出力データまでを、O[t,t+t']と表すこととすると、時刻tのフレームの出力データは、O[t,t+T]と表すことができる。
【０３７４】
なお、図２５のデータ抽出部３１５も、データ抽出部３１２と同様に、センサ３０２から供給されるセンサデータを入力データとして、その入力データの時系列から、時間Tのフレーム単位の入力データを抽出し、認識部３１６に供給する。
【０３７５】
次に、図２８を参照して、図２５の読み出し部３３２の処理について説明する。
【０３７６】
読み出し部３３２は、上述したように、入力データのフレームを、順次、注目フレームとして、データバッファ３３１に記憶された入力ラベルのうちの、注目フレームの入力データに対する入力勝者ノードを表す入力ラベルと、データバッファ３３１に記憶された出力ラベルのうちの、注目フレームの時刻から一定の時間だけ遅れたフレームの出力データに対する出力勝者ノードを表す出力ラベルとを対応付ける。
【０３７７】
即ち、注目フレームの時刻から一定の時間だけ遅れたフレームの出力データとして、例えば、フレームと同一の時間Tを採用することとすると、読み出し部３３２は、時刻tのフレームの入力データ(I[t,t+T])に対する入力勝者ノードN_tを表す入力ラベルと、注目フレームの時刻tから時間Tだけ遅れた時刻t+Tのフレームの出力データ(O[t+T,t+2T])に対する出力勝者ノードN'_t+Tを表す出力ラベルとを対応付ける。
【０３７８】
次に、図２９のフローチャートを参照して、図２５のロボットが行う学習処理、即ち、入出力関係モデルM₁₁の学習処理について説明する。
【０３７９】
例えば、ロボットに、目の前にあるボールを左右に転がすタスクを学習させる場合、オペレータ（ロボットにタスクの学習をさせようとするユーザ）は、ロボットの前にボールをおき、ロボットのアームを持って、ボールを左右に転がすように、アームを動かす。
【０３８０】
この場合、センサ３０２において、左右に転がるボールの状態が検知され、その状態を表す時系列のセンサデータが、データ処理装置３０１のデータ抽出部３１２に供給される。
【０３８１】
また、モータ駆動部３０３では、オペレータが動かしているアームの動きに対応するモータデータが生成され、データ処理部３０１のデータ抽出部３１２に供給される。
【０３８２】
データ抽出部３１２は、ステップＳ３０１において、センサ３０２からのセンサデータを入力データとして、その入力データの時系列から、フレーム単位の入力データを抽出し、学習処理部３１３の認識学習処理部３２１に供給するとともに、モータ駆動部３０３からのモータデータを出力データとして、その出力データの時系列から、フレーム単位の出力データを抽出し、学習処理部３１３の生成学習処理部３２２に供給して、ステップＳ３０２に進む。
【０３８３】
ステップＳ３０２では、学習処理部３１３が、データ抽出部３１２からのフレーム単位の入力データと出力データを用いて、記憶部３１１に記憶された入出力関係モデルM₁₁（図２６）が有する入力ネットワークnet₁と出力ネットワークnet₂の自己組織的な学習を行う。
【０３８４】
即ち、ステップＳ３０２では、ステップＳ３０２₁とＳ３０２₂の処理が行われる。
【０３８５】
ステップＳ３０２₁では、認識学習処理部３２１が、記憶部３１１に記憶された入出力関係モデルM₁₁における入力ネットワークnet₁の各ノードについて、データ抽出部３１２からのフレーム単位の入力データに対するスコアを求め、入力ネットワークnet₁のノードの中から、スコアの最も良いノードを、入力勝者ノードに決定する。さらに、認識学習処理部３２１は、データ抽出部３１２からのフレーム単位の入力データに対する入力勝者ノードに基づいて、入力ネットワークnet₁を、自己組織的に更新し、入力勝者ノードを表す入力ラベルを、写像学習部３１４に供給する。
【０３８６】
ステップＳ３０２₂では、生成学習処理部３２２が、記憶部３１１に記憶された入出力関係モデルM₁₁における出力ネットワークnet₂の各ノードについて、データ抽出部３１２からのフレーム単位の出力データに対するスコアを求め、出力ネットワークnet₂のノードの中から、スコアの最も良いノードを、出力勝者ノードに決定する。さらに、生成学習処理部３２２は、データ抽出部３１２からのフレーム単位の出力データに対する出力勝者ノードに基づいて、出力ネットワークnet₂を、自己組織的に更新し、出力勝者ノードを表す出力ラベルを、写像学習部３１４に供給する。
【０３８７】
ステップＳ３０２の処理後は、ステップＳ３０３に進み、写像学習部３１４は、入力データのフレームのうちの、まだ注目フレームとしていないフレームを、注目フレームとして、学習処理部３１３からの、注目フレームの入力データに対する入力勝者ノードを表す入力ラベルと、学習処理部３１３からの、注目フレームから時間Tだけ遅れたフレームの出力データに対する出力勝者ノードを表す出力ラベルとを対応付ける。
【０３８８】
即ち、ステップＳ３０３では、写像学習部３１４のデータバッファ３３１において、学習処理部３１３からのフレーム単位の入力データに対する入力勝者ノードを表す入力ラベルと、フレーム単位の出力データに対する出力勝者ノードを表す出力ラベルとが一時記憶される。
【０３８９】
さらに、ステップＳ３０３では、写像学習部３１４の読み出し部３３２が、データバッファ３３１に記憶された入力ラベルのうちの、注目フレームの入力データに対する入力勝者ノードを表す入力ラベルと、データバッファ３３１に記憶された出力ラベルのうちの、注目フレームの時刻から時間Tだけ遅れたフレームの出力データに対する出力勝者ノードを表す出力ラベルとを読み出して対応付け、その対応付けた入力ラベルと出力ラベルとのセットであるラベルセットを、結合重み更新部３３３に供給する。
【０３９０】
そして、ステップＳ３０３からステップＳ３０４に進み、写像学習部３１４の結合重み更新部３３３が、読み出し部３３２から供給されるラベルセットに基づき、記憶部３１１に記憶された入出力関係モデルM₁₁（図２６）における入力ネットワークnet₁のノードと、出力ネットワークnet₂のノードとの結合関係を更新する。
【０３９１】
即ち、結合重み更新部３３３は、記憶部３１１に記憶された入出力関係モデルM₁₁における入力ネットワークnet₁の各入力ノードと、ラベルセットの出力ラベルが表す出力ネットワークnet₂の出力勝者ノードとの結合重みを、ラベルセットの入力ラベルが表す入力ネットワークnet₁の入力勝者ノードを中心として更新するとともに、出力ネットワークnet₂の各出力ノードと、入力ネットワークnet₁の勝者ノードとの結合重みを、出力ネットワークnet₂の勝者ノードを中心として更新する。
【０３９２】
なお、図２９の学習処理は、入力データの先頭のフレームから終わりのフレームまでを、順次、注目フレームとして、ステップＳ３０２乃至Ｓ３０４の処理を繰り返し行うようにしてもよいし、入力データの先頭のフレームから終わりのフレームまでを、順次、注目フレームとして、ステップＳ３０２の処理を繰り返し行い、その後、再び、入力データの先頭のフレームから終わりのフレームまでを、順次、注目フレームとして、ステップＳ３０３およびＳ３０４の処理を繰り返し行うようにしても良い。
【０３９３】
次に、図３０のフローチャートを参照して、図２５のロボットが行う認知行動の処理、即ち、入出力関係モデルM₁₁を用いた時系列データの生成処理（認識生成処理）について説明する。
【０３９４】
例えば、図２９で説明したように、ロボットに、目の前にあるボールを左右に転がすタスクを学習させた後、ロボットの前にボールをおくと（さらに、必要に応じて、ボールを転がすと）、センサ３０２において、ボールの状態が検知され、その状態を表す時系列のセンサデータが、データ処理装置３０１のデータ抽出部３１５に供給される。
【０３９５】
データ抽出部３１５は、ステップＳ３１１において、センサ３０２からのセンサデータを入力データとして、その入力データの時系列から、フレーム単位の入力データを抽出し、認識部３１６に供給して、ステップＳ３１２に進む。
【０３９６】
認識部３１６では、ステップＳ３１２において、スコア計算部３４１が、データ抽出部３１５からのフレーム単位の入力データを、順次、注目フレームの入力データとして、その注目フレームの入力データに対して、記憶部３１１に記憶された入出力関係モデルM₁₁を構成する入力ネットワークnet₁の各ノードのスコアを計算し、勝者ノード決定部３４２に供給する。
【０３９７】
さらに、ステップＳ３１２では、勝者ノード決定部３４２が、記憶部３１１に記憶された入出力関係モデルM₁₁を構成する入力ネットワークnet₁のノードの中で、スコア計算部３４１からのスコアが最も良いノードを、入力勝者ノードに決定し、その入力勝者ノードを表す入力ラベルを、写像部３１７に供給して、ステップＳ３１３に進む。
【０３９８】
ステップＳ３１３では、写像部３１７の生成ノード決定部３５１が、記憶部３１１に記憶された入出力関係モデルM₁₁を構成する出力ネットワークnet₂のノードの中で、勝者ノード決定部３４２からの入力ラベルが表すノード（入力勝者ノード）との結合重みが最も強いノードを生成ノードに決定し、その生成ノードを表す出力ラベルを、生成部３１８に供給して、ステップＳ３１４に進む。
【０３９９】
ステップＳ３１４では、生成部３１８の時系列生成部３６１が、記憶部３１１に記憶された入出力関係モデルM₁₁を構成する出力ネットワークnet₂のノードのうちの、生成ノード決定部３５１からの出力ラベルが表す生成ノードが有する時系列パターンモデル２１（図７）に基づいて、注目フレームの入力データに対する出力データ（の推定値）としての、例えば、フレームの長さの時系列データを生成して出力する。
【０４００】
この出力データとしての時系列データは、モータ駆動部３０３に供給され、モータ駆動部３０３が、時系列生成部３６１からの出力データをモータデータとして、モータを駆動することにより、ロボットのアームが動かされる。
【０４０１】
以下、データ抽出部３１５から認識部３１６に対して供給されるフレーム単位の入力データについて、ステップＳ３１２乃至Ｓ３１４の処理が行われる。
【０４０２】
以上のように、入力ネットワークnet₁のフレーム単位の入力データに対する入力勝者ノードと、出力ネットワークnet₂の各ノードとの結合重みを更新するとともに、出力ネットワークnet₂の、フレーム単位の入力データの時刻から一定の時間だけ遅れたフレーム単位の出力データに対する出力勝者ノードと、入力ネットワークnet₁の各ノードとの結合重みを更新するようにしたので、ロボットに、目の前にあるボールを左右に転がすタスクのような実時間性が要求されるタスクを学習させ、そのようなタスクを行わせることができる。
【０４０３】
なお、上述の場合には、注目フレームの時刻から一定の時間だけ遅れたフレームの出力データとして、注目フレームの時刻から、フレームと同一の時間Tだけ遅れたフレームの出力データを採用することとしたが、即ち、入力データの注目フレームと、その注目フレームに対応する出力データのフレームとの時間差（以下、適宜、入出力時間差という）として、時間Tを採用したが、入出力時間差は、時間Tに限られるものではなく、例えば、時間2Tや3T、0.5Tなどを採用することができる。
【０４０４】
また、入出力時間差としては、フレーム単位の入力データに対して勝者ノードを決定する処理に要する時間△を考慮した時間、即ち、例えば、時間T+△を採用することができる。
【０４０５】
図３１は、入出力時間差として、フレーム単位の入力データに対して勝者ノードを決定する処理に要する時間△を考慮した時間T+△を採用した場合の、入力データと出力データとを示している。
【０４０６】
この場合、注目フレームの入力データに対応する出力データは、注目フレームの時刻から時間T+△だけ遅れたフレームの出力データとなるので、結合重み更新部３３３（図２５）では、入力ネットワークnet₁のフレーム単位の入力データに対する入力勝者ノードと、出力ネットワークnet₂の各ノードとの結合重みが更新されるとともに、出力ネットワークnet₂の、フレーム単位の入力データの時刻から時間T+△だけ遅れたフレーム単位の出力データに対する出力勝者ノードと、入力ネットワークnet₁の各ノードとの結合重みが更新される。
【０４０７】
なお、この場合、時刻tのフレームの入力データI[t,t+T]に対応する時刻t+T+△のフレームの出力データは、O[t+T+△,t+2T+△]と表される。
【０４０８】
また、データ抽出部３１２（図２５）では、時間Tの長さのフレーム単位の入力データに対して、例えば、そのフレームから時間△だけ遅れた、時間Tの長さのフレーム単位の出力データを抽出する必要がある。
【０４０９】
ここで、結合重み更新部３３３（図２５）において、入力ネットワークnet₁のフレーム単位の入力データに対する入力勝者ノードと、出力ネットワークnet₂の各ノードとの結合重みを更新するとともに、出力ネットワークnet₂の、フレーム単位の入力データの時刻から入出力時間差だけ遅れたフレーム単位の出力データに対する出力勝者ノードと、入力ネットワークnet₁の各ノードとの結合重みを更新することは、フレーム単位の入力データと、そのフレーム単位の入力データの時刻から入出力時間差だけ遅れたフレーム単位の出力データとを対応付けるように、入出力関係モデルM₁₁の学習を行うことになる。
【０４１０】
そして、かかる学習が行われた入出力関係モデルM₁₁を用いた、入力データに対する出力データの生成では、フレーム単位の入力データに対して、そのフレーム単位の入力データの時刻から入出力時間差だけ遅れたフレーム単位の出力データ（の推定値）が生成されるから、この出力データの生成は、フレーム単位の入力データ（例えば、センサデータ）から、そのフレーム単位の入力データの時刻から入出力時間差だけ未来のフレーム単位の出力データ（に対応する行動）を予測している、ということができる。
【０４１１】
以上のように、図２５のロボットでは、フレーム単位の入力データと、そのフレーム単位の入力データの時刻から入出力時間差だけ遅れたフレーム単位の出力データとを対応付けるように、入出力関係モデルM₁₁の学習を行う。
【０４１２】
このため、ロボットの認知行動（出力データの生成）時において、入力データであるセンサデータとして、入出力関係モデルM₁₁の入力ネットワークnet₁のいずれかのノードが表現する時系列パターンに合致する時系列パターンのセンサデータ（以下、適宜、既知のセンサデータという）が入力される限りは、そのセンサデータに対して適切な出力データであるモータデータが生成され、その結果、ロボットは、学習したタスクを再現することができる。
【０４１３】
次に、図２５のロボットについて行った実験の実験結果について説明する。
【０４１４】
実験では、ロボットに学習させるタスクとして、ボールをロボットの目前で左右の手であるアームを使って転がすタスクを採用した。
【０４１５】
タスクの学習にあたっては、ロボットの左右の手であるアームのゲインを抜いて、人がロボットのアームを操作しながらボールを左右に転がす状況を再現した。そして、その状況下において、ロボットの左右のアームそれぞれの関節角度の情報を、出力データであるモータデータとして収集するとともに、ボールの位置の情報を、入力データであるセンサデータとして収集し、そのモータデータとセンサデータのセットを、教示データとして、タスクの学習に使った。
【０４１６】
なお、ボールの位置の情報としては、空間上に定めた３次元座標系におけるボールの座標(x,y,z)を表す３次元のベクトルを採用し、左右のアームの関節角度の情報としては、その関節角度を表す８次元のベクトルを採用した。また、センサデータおよびモータデータは、約70msごとにサンプリングした。
【０４１７】
フレームとしては、2100msを採用し、フレーム単位のセンサデータとしては、センサデータから、2100ms分のサンプル値を、オーバラップしながら、350msずらしで抽出した。フレーム単位のモータデータも同様である。
【０４１８】
なお、フレーム単位のセンサデータやモータデータは、人が、センサデータやモータデータから、ある意味がある区間のサンプル値を抽出して得ることが可能である。但し、そのような抽出を、ロボットに行わせることは困難であるため、実験では、上述したように、2100ms分のサンプル値を、350msずらしで抽出して、フレーム単位のセンサデータやモータデータとした。
【０４１９】
入出力関係モデルM₁₁を構成する時系列パターン記憶ネットワーク（入力ネットワークnet₁および出力ネットワークnet₂）としては、横×縦が１０×１０個のノードを有する時系列パターン記憶ネットワークを採用し、ノードには、図８に示したような２次元的に配置される配置構造となるリンクを与えた。
【０４２０】
また、ノードが有する時系列パターンモデル２１としては、HMMを採用し、HMMの出力確率密度関数としては、シングルガウシアン（１つのガウス分布）を採用した。
【０４２１】
なお、2100msのセンサデータの認知（勝者ノードを決定する処理）は、高々１サンプル分の時間程度で行うことができるため、入出力時間差には、フレーム単位のセンサデータに対して勝者ノードを決定する処理に要する時間△を考慮しなかった。
【０４２２】
学習後の認知行動の実験では、センサデータに混入するノイズによって、アームの動きが多少不安定になりやすくなるものの、ロボットの前で、ボールを転がし始めると、ロボットが、アームでボールを左右に転がす行動を行うことが確認された。従って、図２５のロボットが実時間性が要求されるタスクを学習し、そのタスクを行うことができることが検証された。
【０４２３】
次に、上述した一連の処理は、専用のハードウェアにより行うこともできるし、ソフトウェアにより行うこともできる。一連の処理をソフトウェアによって行う場合には、そのソフトウェアを構成するプログラムが、汎用のコンピュータやマイクロコンピュータ（コントローラ）等にインストールされる。
【０４２４】
そこで、図３２は、上述した一連の処理を実行するプログラムがインストールされるコンピュータの一実施の形態の構成例を示している。
【０４２５】
プログラムは、コンピュータに内蔵されている記録媒体としてのハードディスク１０１０５やROM１０１０３に予め記録しておくことができる。
【０４２６】
あるいはまた、プログラムは、フレキシブルディスク、CD-ROM(Compact Disc Read Only Memory)，MO(Magneto Optical)ディスク，DVD(Digital Versatile Disc)、磁気ディスク、半導体メモリなどのリムーバブル記録媒体１０１１１に、一時的あるいは永続的に格納（記録）しておくことができる。このようなリムーバブル記録媒体１０１１１は、いわゆるパッケージソフトウエアとして提供することができる。
【０４２７】
なお、プログラムは、上述したようなリムーバブル記録媒体１０１１１からコンピュータにインストールする他、ダウンロードサイトから、ディジタル衛星放送用の人工衛星を介して、コンピュータに無線で転送したり、LAN(Local Area Network)、インターネットといったネットワークを介して、コンピュータに有線で転送し、コンピュータでは、そのようにして転送されてくるプログラムを、通信部１０１０８で受信し、内蔵するハードディスク１０１０５にインストールすることができる。
【０４２８】
コンピュータは、CPU(Central Processing Unit)１０１０２を内蔵している。CPU１０１０２には、バス１０１０１を介して、入出力インタフェース１０１１０が接続されており、CPU１０１０２は、入出力インタフェース１０１１０を介して、ユーザによって、キーボードや、マウス、マイク等で構成される入力部１０１０７が操作等されることにより指令が入力されると、それにしたがって、ROM(Read Only Memory)１０１０３に格納されているプログラムを実行する。あるいは、また、CPU１０１０２は、ハードディスク１０１０５に格納されているプログラム、衛星若しくはネットワークから転送され、通信部１０１０８で受信されてハードディスク１０１０５にインストールされたプログラム、またはドライブ１０１０９に装着されたリムーバブル記録媒体１０１１１から読み出されてハードディスク１０１０５にインストールされたプログラムを、RAM(Random Access Memory)１０１０４にロードして実行する。これにより、CPU１０１０２は、上述したフローチャートにしたがった処理、あるいは上述したブロック図の構成により行われる処理を行う。そして、CPU１０１０２は、その処理結果を、必要に応じて、例えば、入出力インタフェース１０１１０を介して、LCD(Liquid Crystal Display)やスピーカ等で構成される出力部１０１０６から出力、あるいは、通信部１０１０８から送信、さらには、ハードディスク１０１０５に記録等させる。
【０４２９】
ここで、本明細書において、コンピュータに各種の処理を行わせるためのプログラムを記述する処理ステップは、必ずしもフローチャートとして記載された順序に沿って時系列に処理する必要はなく、並列的あるいは個別に実行される処理（例えば、並列処理あるいはオブジェクトによる処理）も含むものである。
【０４３０】
また、プログラムは、１のコンピュータにより処理されるものであっても良いし、複数のコンピュータによって分散処理されるものであっても良い。さらに、プログラムは、遠方のコンピュータに転送されて実行されるものであっても良い。
【０４３１】
なお、本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。
【０４３２】
また、本発明は、ロボットの他、例えば、テレビジョン受像機やHDレコーダなどのAV(Audio Visual)機器、コンピュータ、その他の装置における、ユーザインタフェース（ヒューマンインタフェース）に適用することが可能である。
【図面の簡単な説明】
【０４３３】
【図１】制御対象と、順モデルおよび逆モデルとを説明するための図である。
【図２】制御対象としての想定ロボットと、その想定ロボットの順モデルとを示す図である。
【図３】制御対象としてのロボットのアームと、そのアームの逆モデルを利用したアーム制御器とを示す図である。
【図４】線形システムを用いたモデル化を説明するための図である。
【図５】教師あり学習の一例を説明するための図である。
【図６】時系列パターン記憶ネットワークの第１の構成例を示す図である。
【図７】ノードの構成例を示す図である。
【図８】時系列パターン記憶ネットワークの第２の構成例を示す図である。
【図９】時系列パターン記憶ネットワークの第３の構成例を示す図である。
【図１０】時系列パターン記憶ネットワークを用いた処理を行うデータ処理装置の構成例を示すブロック図である。
【図１１】学習部４の構成例を示すブロック図である。
【図１２】学習処理部３２の構成例を示すブロック図である。
【図１３】更新重みを決定する決定方法を説明するための図である。
【図１４】学習データ記憶部２２に記憶させる学習データを更新する更新方法を説明するための図である。
【図１５】学習処理を説明するフローチャートである。
【図１６】認識部３の構成例を示すブロック図である。
【図１７】認識処理を説明するフローチャートである。
【図１８】生成部６の構成例を示すブロック図である。
【図１９】生成処理を説明するフローチャートである。
【図２０】入出力関係モデルの構成例を示す図である。
【図２１】入出力関係モデルを用いた処理を行うデータ処理装置の構成例を示すブロック図である。
【図２２】入出力関係モデルの学習を説明するフローチャートである。
【図２３】結合重み行列を示す図である。
【図２４】入出力関係モデルを用いて、出力データまたは制御データを推定する処理を説明するフローチャートである。
【図２５】本発明を適用したロボットの一実施の形態の構成例を示すブロック図である。
【図２６】入出力関係モデルM₁₁を示す図である。
【図２７】データ抽出部２１３の処理を説明するための図である。
【図２８】読み出し部３３２の処理を説明するための図である。
【図２９】入出力関係モデルM₁₁の学習を説明するためのフローチャートである。
【図３０】入出力関係モデルを用いて時系列データを生成する認識生成処理を説明するフローチャートである。
【図３１】入出力時間差として、勝者ノードを決定する処理に要する時間△を考慮した時間を採用した場合の、入力データと出力データとを示す図である。
【図３２】本発明を適用したコンピュータの一実施の形態の構成例を示すブロック図である。
【符号の説明】
【０４３４】
１信号入力部，２特徴抽出部，３認識部，４学習部，５記憶部，６生成部，２１時系列パターンモデル，２２学習データ記憶部，３１時系列データ記憶部，３２学習処理部，４１スコア計算部，４２勝者ノード決定部，４３重み決定部，４４学習データ更新部，４５モデル学習部，５１スコア計算部，５２勝者ノード決定部，５３出力部，６１生成ノード決定部，６２時系列決定部，６３出力部，２１１記憶部，２１２学習部，２１３認識生成部，２２１学習処理部，２２２結合重み更新部，２３１スコア計算部，２３２勝者ノード決定部，２３３生成ノード決定部，２３４時系列生成部，３０１データ処理装置，３０２センサ，３０３モータ駆動部，３１１記憶部，３１２データ抽出部，３１３学習処理部，３１４写像学習部，３１５データ抽出部，３１６認識部，３１７写像部，３１８生成部，３２１認識学習処理部，３２２生成学習処理部，３３１データバッファ，３３２読み出し部，３３３結合重み更新部，３４１スコア計算部，３４２勝者ノード決定部，３５１生成ノード決定部，３６１時系列生成部，１０１０１バス，１０１０２ CPU，１０１０３ ROM，１０１０４ RAM，１０１０５
ハードディスク，１０１０６出力部，１０１０７入力部，１０１０８通信部，１０１０９ドライブ，１０１１０入出力インタフェース，１０１１１リムーバブル記録媒体

【特許請求の範囲】
【請求項１】
時系列データである入力データと、他の時系列のデータである出力データとの関係の学習を行うデータ処理装置において、
前記入力データから所定の時間単位の入力データを抽出するとともに、前記出力データから前記所定の時間単位の出力データを抽出する入出力データ抽出手段と、
前記入力データとしての時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される入力時系列パターン記憶ネットワークと、
前記出力データとしての時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される出力時系列パターン記憶ネットワークと
を有し、
前記入力時系列パターン記憶ネットワークのノードと、前記出力時系列パターン記憶ネットワークのノードとが結合されている
入出力関係モデルにおける前記入力時系列パターン記憶ネットワークのノードの中から、前記所定の時間単位の入力データに最も適合するノードである入力勝者ノードを決定し、前記入力勝者ノードに基づいて、前記入力時系列パターン記憶ネットワークを、自己組織的に更新する認識学習処理手段と、
前記出力時系列パターン記憶ネットワークのノードの中から、前記所定の時間単位の出力データに最も適合するノードである出力勝者ノードを決定し、前記出力勝者ノードに基づいて、前記出力時系列パターン記憶ネットワークを、自己組織的に更新する生成学習処理手段と、
前記入力時系列パターン記憶ネットワークの前記所定の時間単位の入力データに対する前記入力勝者ノードと、前記出力時系列パターン記憶ネットワークの、前記所定の時間単位の入力データの時刻から一定の時間だけ遅れた前記所定の時間単位の出力データに対する前記出力勝者ノードとの結合の度合いを表す結合重みを強めるように更新する結合重み更新手段と
を備えるデータ処理装置。
【請求項２】
前記入力データは、外部の状態を検知するセンサを有するロボットに所定の行動をさせたときに、前記センサが出力する外部の状態を表す時系列のセンサデータであり、
前記出力データは、前記ロボットに前記所定の行動させるときに、前記ロボットを駆動するモータに供給される時系列のモータデータである
請求項１に記載のデータ処理装置。
【請求項３】
前記入力データから前記所定の時間単位の入力データを抽出する入力データ抽出手段と、
前記入出力関係モデルにおける前記入力時系列パターン記憶ネットワークのノードの中から、前記入力データ抽出手段が抽出した前記所定の時間単位の入力データに最も適合するノードである入力勝者ノードを決定する入力勝者ノード決定手段と、
前記出力時系列パターン記憶ネットワークのノードの中から、前記入力勝者ノード手段が決定した前記入力勝者ノードとの結合が最強のノードを、前記他の時系列データを生成する生成ノードとして決定する生成ノード決定手段と、
前記生成ノードが有する前記時系列パターンモデルに基づいて、前記他の時系列データを生成する生成手段と
をさらに備える請求項１に記載のデータ処理装置。
【請求項４】
時系列データである入力データと、他の時系列のデータである出力データとの関係の学習を行うデータ処理装置のデータ処理方法において、
前記入力データから所定の時間単位の入力データを抽出するとともに、前記出力データから前記所定の時間単位の出力データを抽出し、
前記入力データとしての時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される入力時系列パターン記憶ネットワークと、
前記出力データとしての時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される出力時系列パターン記憶ネットワークと
を有し、
前記入力時系列パターン記憶ネットワークのノードと、前記出力時系列パターン記憶ネットワークのノードとが結合されている
入出力関係モデルにおける前記入力時系列パターン記憶ネットワークのノードの中から、前記所定の時間単位の入力データに最も適合するノードである入力勝者ノードを決定し、前記入力勝者ノードに基づいて、前記入力時系列パターン記憶ネットワークを、自己組織的に更新し、
前記出力時系列パターン記憶ネットワークのノードの中から、前記所定の時間単位の出力データに最も適合するノードである出力勝者ノードを決定し、前記出力勝者ノードに基づいて、前記出力時系列パターン記憶ネットワークを、自己組織的に更新し、
前記入力時系列パターン記憶ネットワークの前記所定の時間単位の入力データに対する前記入力勝者ノードと、前記出力時系列パターン記憶ネットワークの、前記所定の時間単位の入力データの時刻から一定の時間だけ遅れた前記所定の時間単位の出力データに対する前記出力勝者ノードとの結合の度合いを表す結合重みを強めるように更新する
ステップを含むデータ処理方法。
【請求項５】
時系列データである入力データと、他の時系列のデータである出力データとの関係の学習を行うデータ処理を、コンピュータに実行させるプログラムにおいて、
前記入力データから所定の時間単位の入力データを抽出するとともに、前記出力データから前記所定の時間単位の出力データを抽出し、
前記入力データとしての時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される入力時系列パターン記憶ネットワークと、
前記出力データとしての時系列データのパターンである時系列パターンを表現する時系列パターンモデルを有する複数のノードから構成される出力時系列パターン記憶ネットワークと
を有し、
前記入力時系列パターン記憶ネットワークのノードと、前記出力時系列パターン記憶ネットワークのノードとが結合されている
入出力関係モデルにおける前記入力時系列パターン記憶ネットワークのノードの中から、前記所定の時間単位の入力データに最も適合するノードである入力勝者ノードを決定し、前記入力勝者ノードに基づいて、前記入力時系列パターン記憶ネットワークを、自己組織的に更新し、
前記出力時系列パターン記憶ネットワークのノードの中から、前記所定の時間単位の出力データに最も適合するノードである出力勝者ノードを決定し、前記出力勝者ノードに基づいて、前記出力時系列パターン記憶ネットワークを、自己組織的に更新し、
前記入力時系列パターン記憶ネットワークの前記所定の時間単位の入力データに対する前記入力勝者ノードと、前記出力時系列パターン記憶ネットワークの、前記所定の時間単位の入力データの時刻から一定の時間だけ遅れた前記所定の時間単位の出力データに対する前記出力勝者ノードとの結合の度合いを表す結合重みを強めるように更新する
ステップを含む前記データ処理を、コンピュータに実行させるプログラム。

【図１】