説明

並列演算装置および並列演算方法

【課題】複数の演算ユニット間の配線を簡易にすることを可能とする並列演算装置および並列演算方法を提供する。
【解決手段】並列演算装置が、予め定められた順序でデイジーチェーン制御バスを介してデイジーチェーンされている複数のユニットと、複数のユニットの内のいずれか1つが出力する出力値がユニット出力バスを介して入力され、該入力された出力値を複数のユニットのそれぞれにユニット入力バスを介して入力値として出力する増幅器と、を有する。このユニットは、ユニット出力バスを介して入力される増幅器からの入力値に基づいて、ユニット毎に予め定められた演算方法により演算し、また、トークンが前のユニットからデイジーチェーン制御バスを介して入力されたことに応じて、トークンを次のユニットにデイジーチェーン制御バスを介して出力すると共に、演算した結果を出力値として増幅器にユニット出力バスを介して出力する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、複数の演算ユニットを有する並列演算装置に関し、特に、複数の演算ユニット間の接続を簡易にすることを可能とする並列演算装置に関する。
【背景技術】
【0002】
並列演算の1つとして、ニューラルネットワークが知られている。このニューラルネットワークは、脳機能に見られるいくつかの特性を表現することを目指した数学モデルである。このニューラルネットワークによる処理は、入力されたデータの情報量を削減することが可能であるため、画像や統計など多次元量のデータでかつ線形分離不可能な問題に対して、比較的小さい計算量で良好な解を得られることが多い。そのためニューラルネットワークは、パターン認識やデータマイニングをはじめ、さまざまな分野において応用されている。
【0003】
ここで、大規模なニューラルネットワークを実現しようとすると、その計算量が膨大となるため、現実的な時間での処理が難しくなる。これを解決する方法として、(1)単体プロセッサ自体のコンピューティングパワーを上げる方法、(2)プロセッサを複数用いる並列コンピューティングの手法を用いる方法、(3)機能をLSI等によりハードウェアにより実装する方法、等が考えられる。上記(1)と(2)との方法は、プロセッサの能力を上げることで膨大な計算量に対処しようとするものであり、プログラムを変更することで様々なニューラルネットワークのアルゴリズムに対応することができる。
【0004】
ここで(1)の方法においては、従来、単体プロセッサのクロック周波数を高速化すること、いわゆるムーアの法則により、単体プロセッサ自体のコンピューティングパワーを上げてきていた。しかし、近年、クロック周波数の高速化は発熱量を増加させ、また、微細加工寸法が物理的限界に達しつつあることからムーアの法則が破綻しつつあり、単体プロセッサ自体のコンピューティングパワーを上げることが難しくなってきている。そのため、(1)の方法から(2)の方法へと、プロセッサのコンピューティングパワーを上げる方法の開発がシフトしてきており、コンピューティングパワーを上げるという高性能化と、発熱を抑えることの両立をより進めるために、より大きなキャッシュと複数の計算コアを持つことに焦点が当てられている。また、このプロセッサの開発は、低いクロック周波数で動作し、低電力化で動作するようにも、進められている。
【0005】
しかし、(2)の方法においては、膨大なプロセッサを効率的に動作させる方法、つまり並列度を上げることと、複数のプロセッサ間の膨大なデータ通信を可能とするネットワークの構成が難しいことが本質的な問題としてある。そのため、(2)の方法である、プロセッサを複数用いる並列コンピューティングの手法を用いる方法により、大規模なニューラルネットワークの並列演算効率を上げることは、難しい。
【0006】
一方、(3)の方法であるハードウェア化に関しては、ハードウェアで実現可能なニューラルネットワークのアルゴリズムに制限があるが、特定な用途に対しては(1)または(2)の方法に比べ、低周波数での場合でも、桁違いな演算速度の性能を発揮することが可能である。このような、並列演算をハードウェア化する技術として、特許文献1および特許文献2が知られている。
【特許文献1】特開平6−195454号公報
【特許文献2】特開平2006−39790号公報
【発明の開示】
【発明が解決しようとする課題】
【0007】
しかしながら、(3)の方法であるハードウェア化に関しての特許文献1および特許文献2の従来技術においては、配線の問題があり、配線のために回路規模が膨大となり、または、回路間の配線が出来ないという問題がある。例えば、多層型のニューラルネットワークにおいては、出力層のあるノードからの出力を、入力層の全てのノードの入力に入力することが必要となり、各層のノード数が増大すると、その配線量が急激に増大してしまう。
【0008】
また、例えば、実際の脳のニューラルネットワークの場合、ニューロンは3次元空間に配置され配線されているのに対し、LSIのようなハードウェアによる構成では構成要素の配置は2次元が基本であるため、配線の問題を本質的には解決できない。積層構造などで構成要素を3次元化しようとしても配線の問題は残るので、応用は限られた配線(近傍のみとの結合)で事足りるような用途に限定される。
【0009】
また、このような複数の演算ユニット間の配線の問題は、ニューラルネットワークに限られるものではなく、全ての演算ユニットの出力を、全ての演算ユニットに入力することが計算上必要な場合に、問題となる。例えば、ニューラルネットワーク以外にも、自己組織化マップ、重力多体問題、電荷を持った多体粒子のシミュレーション、などがある。
【0010】
本発明は、このような事情に鑑みてなされたもので、その目的の一つは、複数の演算ユニット間の配線を簡易にすることを可能とする並列演算装置および並列演算方法を提供することにある。
【課題を解決するための手段】
【0011】
この発明は上述した課題を解決するためになされたもので、並列演算装置が、予め定められた順序でデイジーチェーン制御バスを介してデイジーチェーンされている複数のユニットと、前記複数のユニットの内のいずれか1つが出力する出力値がユニット出力バスを介して入力され、該入力された出力値を前記複数のユニットのそれぞれにユニット入力バスを介して入力値として出力する中継部と、を有し、前記ユニットが、前記デイジーチェーン制御バスを介してデイジーチェーンされている順序が1つ前のユニットからのトークンを入力するトークン入力部と、前記トークン入力部にトークンが入力されたことに応じて、前記トークンを前記デイジーチェーンされている順序が1つ後のユニットへ前記デイジーチェーン制御バスを介して出力するトークン出力部と、前記ユニット出力バスを介して前記中継部からの入力値を入力するデータ入力部と、前記データ入力部に入力された入力値に基づいて、前記ユニット毎に予め定められた演算方法により演算するユニット演算部と、前記トークン入力部にトークンが入力されたことに応じて、前記ユニット演算部が演算した結果である演算結果を前記出力値として、前記中継部に前記ユニット出力バスを介して出力するデータ出力部と、を有することを特徴とする並列演算装置である。
【0012】
この発明によれば、並列演算装置の複数の演算ユニット間の接続を簡易にすることが出来るという効果を奏する。また、複数のユニットが並列に演算をするため、高速に演算することが出来るという効果を奏する。
【0013】
また、この発明は、前記ユニットが、前記演算結果が記憶されるユニット出力記憶部を有し、前記ユニット演算部が、前記演算結果を前記ユニット出力記憶部に記憶させ、前記データ出力部が、前記トークン入力部にトークンが入力されたことに応じて、前記演算結果を前記ユニット出力記憶部から読み出し、該読み出した演算結果を前記出力値として前記中継部に前記ユニット出力バスを介して出力する、ことを特徴とする並列演算装置である。
【0014】
この発明によれば、並列演算装置のユニットが、演算結果を記憶しておき、トークン入力部にトークンが入力されたことに応じて、適切なタイミングで、演算結果を出力することが出来るという効果を奏する。
【0015】
また、この発明は、前記並列演算装置が階層型ニューラルネットワークを演算する並列演算装置である場合には、前記ユニット演算部が、前記階層型ニューラルネットワークの階層のうち、出力する層を識別する層情報が記憶されている層情報記憶部と、前記ユニットの出力関数と前記層情報とが関連付けて予め記憶されている関数記憶部と、前記層情報で識別される前記出力層のユニットからの出力値に乗ずる予め定められた結合荷重と、前記層情報とが関連付けて記憶されている重み記憶部と、前記出力ユニットからの入力値と結合荷重とを乗じた積和計算一次値情報が記憶される積和計算一次値記憶部と、前記層情報記憶部から読み出した層情報に該当する結合荷重を前記重み記憶部から読み出し、該読み出した結合荷重と、前記データ入力部に入力された入力値とを乗算し、該乗算した値を前記積和計算一次値記憶部に記憶されている積和計算一次値情報に加算して記憶させる積和計算一次値算出部と、前記積和計算一次値記憶部から積和計算一次値情報を読み出し、前記層情報記憶部から読み出した層情報に該当する出力関数を前記関数記憶部から読み出し、該読み出した出力関数に前記読み出した積和計算一次値情報を代入することにより出力値を算出し、該算出した出力値を前記ユニット出力記憶部に記憶させるユニット出力算出部と、を有することを特徴とする並列演算装置である。
【0016】
この発明によれば、複数の演算ユニット間の接続を簡易にした並列演算装置により、階層型ニューラルネットワークの演算が出来るという効果を奏する。また、複数の演算ユニット間の接続が簡易であるために、階層型ニューラルネットにおいて、各層のノードであるユニットの数が多い場合においても、配線の問題が生じにくいという効果を奏する。
【0017】
また、この発明は、前記ユニット演算部が、前記出力層に属しているユニットのうち、いずれのユニットが出力ユニットとして出力しているかを示すユニット識別情報が記憶されているユニット識別情報記憶部、を有し、前記重み記憶部には、前記層情報と前記ユニット識別情報とで識別される前記出力層のユニットからの出力値に乗ずる予め定められた結合荷重と、前記層情報と前記ユニット識別情報とが、関連付けて記憶されており、前記積和計算一次値算出部が、前記ユニット識別情報記憶部から読み出したユニット識別情報と前記層情報記憶部から読み出した層情報とに該当する結合荷重を前記重み記憶部から読み出し、該読み出した結合荷重と、前記データ入力部に入力された入力値とを乗算し、該乗算した値を前記積和計算一次値記憶部に記憶されている積和計算一次値情報に加算して記憶させる、ことを特徴とする並列演算装置である。
【0018】
この発明によれば、各層の各ノードからの出力に応じて、結合荷重を乗算して、階層型ニューラルネットを演算することが出来るという効果を奏する。
【0019】
また、この発明は、前記ユニット演算部が、前記データ入力部に入力値が入力される毎に、前記ユニット識別情報記憶部に記憶されているユニット識別情報の値をインクリメントするカウンタと、前記層情報と前記層情報で識別される階層に属する階層型ニューラルネットワークのユニット数とが関連付けて予め記憶されているユニット数記憶部と、前記層情報記憶部から層情報を読み出し、該読み出した層情報に該当するユニット数を前記ユニット数記憶部から読み出し、前記ユニット識別情報記憶部からユニット識別情報を読み出し、該読み出したユニット識別情報の値と前記読み出したユニット数とを比較し、該比較した結果が一致した場合に、該読み出したユニット識別情報の値と前記読み出したユニット数とが一致したことを示す比較一致信号を出力するユニット数比較部と、を有し、前記ユニット出力算出部が、前記ユニット数比較部から比較一致信号を入力されたことに応じて、前記積和計算一次値算出部から積和計算一次値情報を読み出し、前記層情報記憶部から読み出した層情報に該当する出力関数を前記関数記憶部から読み出し、該読み出した出力関数に前記読み出した積和計算一次値情報を代入することにより出力値を算出し、該算出した出力値を前記ユニット出力記憶部に記憶させる、ことを特徴とする並列演算装置である。
【0020】
この発明によれば、各ユニットが、出力をする層の全てのノードであるユニットが、出力を完了したか否かを検出することが出来るという効果を奏する。
【0021】
また、この発明は、前記ユニット数比較部が、前記比較した結果が一致した場合に、前記ユニット識別情報記憶部に記憶されているユニット識別情報の値をリセットする、ことを特徴とする並列演算装置である。
【0022】
この発明によれば、各ユニットが、ある層の演算が終了した後に、次の層の演算をすることが出来るという効果を奏する。
【0023】
また、この発明は、前記ユニット演算部が、前記ユニット数比較部から比較一致信号を入力されたことに応じて、前記層情報記憶部に記憶されている層情報の値をインクリメントする層情報算出部、を有することを特徴とする並列演算装置である。
【0024】
この発明によれば、各ユニットが、ある層の演算が終了した後に、次の層の層情報を、ユニット自体が算出して求めることが出来るという効果を奏する。
【0025】
また、この発明は、前記ユニット演算部が、前記データ出力部が前記出力値を出力済みであるか否かを示すデータ出力フラグが記憶されているデータ出力フラグ記憶部を有し、前記データ出力部が、前記トークン入力部にトークンが入力されたことに応じて、前記データ出力フラグ記憶部のデータ出力フラグを出力済みとして設定し、前記トークン出力部が、前記データ入力部に入力値が入力されたことに応じて、前記データ出力フラグ記憶部からデータ出力フラグを読み出し、該読み出したデータ出力フラグが出力済みである場合には、前記トークンを出力する、ことを特徴とする並列演算装置である。
【0026】
この発明によれば、各ユニットが、階層型ニューラルネットワークの場合に合わせたタイミングで、トークンを出力することが出来るという効果を奏する。
【0027】
また、この発明は、前記トークン出力部が、前記トークンを出力すると共に、前記データ出力フラグ記憶部のデータ出力フラグを未出力として設定する、ことを特徴とする並列演算装置である。
【0028】
この発明によれば、各ユニットが、次の階層においても、階層型ニューラルネットワークの場合に合わせタイミングで、トークンを出力することが出来るという効果を奏する。
【0029】
また、この発明は、前記ユニット出力算出部が、前記積和計算一次値算出部から積和計算一次値情報を読み出した後、前記積和計算一次値算出部に記憶されている積和計算一次値情報の値を0にリセットする、ことを特徴とする並列演算装置である。
【0030】
この発明によれば、各ユニットが、ある層の演算が終了した後に、次の層の演算をすることが出来るという効果を奏する。
【0031】
また、この発明は、前記並列演算装置が自己組織化マップを演算する並列演算装置である場合には、前記複数のユニットのそれぞれが、ネットワーク座標により識別される座標で予め識別されており、前記ユニット演算部が、前記ユニットのネットワーク座標であるユニットネットワーク座標が予め記憶されているユニットネットワーク座標記憶部と、入力されたネットワーク座標である入力ネットワーク座標が記憶されている入力ネットワーク座標記憶部と、前記ユニットの結合重みベクトルが記憶されている重み記憶部と、ノルムを記憶するユニットノルム記憶部と、入力されたノルムを記憶する入力ノルム記憶部と、前記データ入力部に入力された入力値が入力データベクトルである場合には、該入力された入力データベクトルと、前記重み記憶部から読み出した結合重みベクトルとのノルムを算出し、該算出したノルムをユニットノルムとして前記ユニットノルム記憶部に記憶させるノルム算出部と、前記データ入力部に入力された入力値が、ネットワーク座標とノルムとの組みである場合には、該入力されたネットワーク座標を入力ネットワーク座標として前記入力ネットワーク座標記憶部に記憶させると共に、該入力されたノルムを入力ノルムとして前記入力ノルム記憶部に記憶させる入力ノルム部と、前記トークン入力部を介してトークンが入力されたことに応じて、前記ユニットノルム記憶部から読み出したユニットノルムと、前記入力ユニットノルム記憶部から読み出した入力ノルムとを比較するノルム比較部と、前記ノルム比較部の比較した結果が、前記読み出したユニットノルムが前記入力ノルムより小さい場合には、前記ユニットノルム記憶部から読み出したユニットノルムと前記ユニットネットワーク座標記憶部から読み出したユニットネットワーク座標とを組みとして前記データ出力部を介して出力し、前記読み出したユニットノルムが前記入力ノルム以上である場合には、前記入力ノルム記憶部から読み出した入力ノルムと前記入力ネットワーク座標記憶部から読み出した入力ネットワーク座標とを組みとして前記データ出力部を介して出力する選択出力部と、を有することを特徴とする並列演算装置である。
【0032】
この発明によれば、複数の演算ユニット間の接続を簡易にした並列演算装置により、自己組織化マップの演算が出来るという効果を奏する。また、複数の演算ユニット間の接続が簡易であるために、自己組織化マップにおいて、各層のユニットの数が多い場合においても、配線の問題が生じにくいという効果を奏する。
【0033】
また、この発明は、前記ユニット演算部が、前記データ入力部に入力された入力値が、ネットワーク座標と近傍判定を実行することを示す識別情報である近傍判定識別情報との組みである場合には、前記ユニットネットワーク座標記憶部から読み出したユニットネットワーク座標が、前記入力されたネットワーク座標である入力ネットワーク座標の近傍にあるか否かを判定する近傍判定部と、前記近傍判定部の判定した結果が近傍である場合には、前記重み記憶部に記憶されている結合重みベクトルを更新する重み更新部と、を有することを特徴とする並列演算装置である。
【0034】
この発明によれば、各ユニットが、結合重みベクトルを更新することにより、学習することが出来るという効果を奏する。
【0035】
また、この発明は、前記ユニット演算部が、入力された入力データベクトルが記憶される入力データ記憶部と、学習速度を決める係数である学習速度係数が予め記憶されている学習速度記憶部と、前記データ入力部に入力された入力値が入力データベクトルである場合には、該入力された入力データベクトルを前記入力データ記憶部に記憶させるデータ抽出部と、を有し、前記重み更新部が、前記入力データ記憶部から読み出した入力データベクトルと前記重み記憶部から読み出した結合重みベクトルとの差に、前記学習速度記憶部から読み出した学習速度係数を乗じた値を、前記重み記憶部に記憶されている結合重みベクトルに加算することにより、前記重み記憶部に記憶されている結合重みベクトルを更新する、ことを特徴とする並列演算装置である。
【0036】
この発明によれば、各ユニットが、結合重みベクトルを学習速度に応じて更新することにより、学習することが出来るという効果を奏する。
【0037】
また、この発明は、前記学習速度記憶部には、学習した回数を示す学習ステップ数と、前記学習速度係数とが予め関連付けて記憶されており、前記ユニット演算部が、前記ユニットに入力データベクトルが入力される毎に、前記ユニットに前記入力データベクトルが入力された回数であるステップ数をカウントアップするカウンタを有し、前記重み更新部が、前記カウンタから読み出したステップ数が、前記学習ステップ数に該当する学習速度係数を前記学習速度記憶部から読み出し、該読み出した学習速度係数に基づいて前記重み記憶部に記憶されている結合重みベクトルを更新する、ことを特徴とする並列演算装置である。
【0038】
この発明によれば、各ユニットが、学習ステップ数に応じた学習速度で、学習することが出来るという効果を奏する。
【0039】
また、この発明は、前記ユニット演算部が、前記ネットワーク座標の間の距離が近傍であるか否かを判定する基準である基準距離が予め記憶されている距離記憶部を有し、前記近傍判定部が、前記データ入力部に入力された入力値が、ネットワーク座標と近傍判定を実行することを示す識別情報である近傍判定識別情報との組みである場合には、前記距離記憶部から基準距離を読み出し、前記ユニットネットワーク座標記憶部から読み出したユニットネットワーク座標と前記入力されたネットワーク座標である入力ネットワーク座標との間の距離が、前記読み出した基準距離以下であるか否かを判定することにより、前記ユニットネットワーク座標が前記入力ネットワーク座標の近傍にあるか否かを判定する、ことを特徴とする並列演算装置である。
【0040】
この発明によれば、各ユニットが、基準距離に基づいて、勝者ユニットの近傍であるか否かを判定することが出来るという効果を奏する。
【0041】
また、この発明は、前記距離記憶部には、前記学習ステップ数と前記基準距離とが予め関連付けて記憶されており、前記近傍判定部が、前記カウンタから読み出したステップ数が、前記学習ステップ数に該当する基準距離を前記学習速度記憶部から読み出し、該読み出した基準距離に基づいて前記ユニットネットワーク座標が前記入力ネットワーク座標の近傍にあるか否かを判定する、ことを特徴とする並列演算装置である。
【0042】
この発明によれば、各ユニットが、学習ステップ数に応じた基準距離に基づいて、勝者ユニットの近傍であるか否かを判定することが出来るという効果を奏する。
【0043】
また、この発明は、前記トークン入力部にトークンが入力されたことに応じて、前記トークン出力部がトークンを出力することを特徴とする並列演算装置である。
【0044】
この発明によれば、各ユニットが、トークンを次のユニットに渡すことにより、勝者ユニットを順次決定することが出来るという効果を奏する。
【0045】
また、この発明は、前記ユニット演算部が、前記トークン出力部がトークンを出力済みであるか否かを示すトークン出力フラグが記憶されているトークン出力フラグ記憶部と、前記トークン入力部にトークンが入力されたことに応じて、前記トークン出力フラグ記憶部からトークン出力フラグを読み出し、該読み出したトークン出力フラグがトークンを未出力である場合に、前記入力されたトークンを前記ノルム比較部に出力すると共に、前記入力されたトークンを前記トークン出力部を介して出力するトークン出力フラグ判定部と、を有することを特徴とする並列演算装置である。
【0046】
この発明によれば、勝者ユニットを決定する時に、各ユニットが、1度のみ勝者ユニットを決めるトーナメントに参加し、トーナメントに複数回参加しないようにすることが出来るという効果を奏する。
【0047】
また、この発明は、前記トークン出力部が、前記ユニットノルム記憶部から読み出したユニットノルムと前記ユニットネットワーク座標記憶部から読み出したユニットネットワーク座標とを組みとして前記データ出力部を介して前記選択出力部が出力したことに応じて、または、前記入力ノルム記憶部から読み出した入力ノルムと前記入力ネットワーク座標記憶部から読み出した入力ネットワーク座標とを組みとして前記データ出力部を介して前記選択出力部が出力したことに応じて、前記トークンを出力する、ことを特徴とする並列演算装置である。
【0048】
この発明によれば、各ユニットが、自己組織化マップに適したタイミングで、トークンを出力することが出来るという効果を奏する。
【0049】
また、この発明は、前記トークン出力部が、前記トークンを出力した後に、前記トークン出力フラグ記憶部に記憶されているトークン出力フラグを出力済みに更新する、ことを特徴とする並列演算装置である。
【0050】
この発明によれば、各ユニットが、トークンまたは出力値を複数回出力することを防止することが出来るという効果を奏する。
【0051】
また、この発明は、前記予め定められた順序の1つ飛ばしの順序である第1の冗長順序で、前記複数のユニットのうちの半数のユニットが、第1の冗長デイジーチェーン制御バスによりデイジーチェーンされており、前記第1の冗長デイジーチェーン制御バスによりデイジーチェーンされているユニットが、前記トークン入力部にトークンが入力されたことに応じて、前記トークンを前記冗長順序で1つ後のユニットへ前記第1の冗長デイジーチェーン制御バスを介して出力する冗長トークン出力部と、前記トークン出力部と前記冗長トークン出力部とのうち、いずれを選択するかを示すトークン出力選択情報が記憶されているトークン選択情報記憶部と、前記トークン入力部にトークンが入力されたことに応じて、前記トークン選択情報記憶部から読み出したトークン出力選択情報に基づいて、前記トークン出力部と前記冗長トークン出力部とのうちいずれか一方を選択し、該選択したトークン出力部または冗長トークン出力部を介してトークンを出力するトークン出力部選択部と、を有することを特徴とする並列演算装置である。
【0052】
この発明によれば、冗長デイジーチェーン制御バスにより、デイジーチェーン制御バスの一部または一部のユニットに欠陥が生じた場合においても、並列演算装置が、問題なく動作することが出来るという効果を奏する。
【0053】
また、この発明は、前記ユニットが、前記冗長デイジーチェーン制御バスを介してデイジーチェーンされている冗長順序が1つ前のユニットからのトークンを入力する冗長トークン入力部を有し、前記トークン出力部が、前記トークン入力部または前記冗長トークン入力部にトークンが入力されたことに応じて、前記トークンを出力する、ことを特徴とする並列演算装置である。
【0054】
この発明によれば、冗長デイジーチェーン制御バスにより、デイジーチェーン制御バスの一部または一部のユニットに欠陥が生じた場合においても、各ユニットが、問題なく動作することが出来るという効果を奏する。
【0055】
また、この発明は、前記予め定められた順序の1つ飛ばしの順序で、前記第1の冗長デイジーチェーン制御バスによりデイジーチェーンされていない前記複数のうちの残りの半数のユニットが、第2の冗長デイジーチェーン制御バスによりデイジーチェーンされており、前記第2の冗長デイジーチェーン制御バスによりデイジーチェーンされているユニットが、前記第2の冗長デイジーチェーン制御バスを前記第1の冗長デイジーチェーン制御バスとして、前記冗長トークン出力部とトークン選択情報記憶部とトークン出力部選択部とを有している、ことを特徴する並列演算装置である。
【0056】
この発明によれば、冗長デイジーチェーン制御バスにより、デイジーチェーン制御バスの一部または一部のユニットに欠陥が生じた場合においても、各ユニットが、問題なく動作することが出来るという効果を奏する。
【0057】
また、この発明は、前記第2の冗長デイジーチェーン制御バスによりデイジーチェーンされているユニットが、前記第2の冗長デイジーチェーン制御バスを前記第1の冗長デイジーチェーン制御バスとして、前記冗長トークン入力部を有している、ことを特徴する並列演算装置である。
【0058】
この発明によれば、冗長デイジーチェーン制御バスにより、デイジーチェーン制御バスの一部または一部のユニットに欠陥が生じた場合においても、各ユニットが、問題なく動作することが出来るという効果を奏する。
【0059】
また、この発明は、予め定められた順序でデイジーチェーン制御バスを介してデイジーチェーンされている複数のユニットと、前記複数のユニットの内のいずれか1つが出力する出力値がユニット出力バスを介して入力され、該入力された出力値を前記複数のユニットのそれぞれにユニット入力バスを介して入力値として出力する中継部と、を有する並列演算装置のユニットにおいて用いられる並列演算方法であって、前記ユニットが、前記デイジーチェーン制御バスを介してデイジーチェーンされている順序が1つ前のユニットからのトークンを入力し、前記トークンが入力されたことに応じて、前記トークンを前記デイジーチェーンされている順序が1つ後のユニットへ前記デイジーチェーン制御バスを介して出力し、前記ユニット出力バスを介して前記中継部からの入力値を入力し、前記入力された入力値に基づいて、前記ユニット毎に予め定められた演算方法により演算し、前記トークンが入力されたことに応じて、前記演算した結果である演算結果を前記出力値として、前記中継部に前記ユニット出力バスを介して出力する、ことを特徴とする並列演算方法である。
【発明を実施するための最良の形態】
【0060】
<基本構成>
以下、図面を参照して、本発明の実施の形態について説明する。図1は、この発明の一実施形態による並列演算装置の構成を示す概略ブロック図である。ここでは、ユニットU1からU10の、ユニットの個数が10である場合について説明する。なお、このユニットの詳細については、後述する。
【0061】
複数のユニットU1からU10は、予め定められた順序であるデイジーチェーン順序で、デイジーチェーン制御バス1を介してデイジーチェーンされている。ここでは、このデイジーチェーン順序は、ユニットU1、ユニットU2、ユニットU3、・・・ユニットU10の順と、予め定められているものとして説明する。また、デイジーチェーン制御バス1は、デイジーチェーン順序で隣接するユニット同士を接続している。例えば、デイジーチェーン制御バス1は、ユニットU1とユニットU2、ユニットU2とユニットU3、・・・ユニットU10とユニットU1、を接続している。また、このデイジーチェーン制御バス1は、ユニットU1からU10をデイジーチェーン順序で循環的に接続している。そのため、ユニットU10とユニットU1とも、デイジーチェーン制御バス1を介して接続されている。
【0062】
ユニットU1からU10のそれぞれのユニットは、トークンをデイジーチェーン順序で、デイジーチェーン制御バス1を介してユニット間で送受信している。このトークンは、デイジーチェーンされたユニットU1からU10の、いずれかの1つのユニットが有しており、このトークンを有しているユニットが、出力ユニットとなることを示す信号である。ユニットは、トークンを有しているユニットのみが出力ユニットとなり、また、全てのユニットが入力ユニットとなる。
【0063】
この各ユニットは、ユニット出力バス2を介して入力される増幅器4からの入力値に基づいて、ユニット毎に予め定められた演算方法により演算する。また、各ユニットは、トークンがデイジーチェーン順序で前のユニットからデイジーチェーン制御バス1を介して入力されたことに応じて、トークンをデイジーチェーン順序で次のユニットにデイジーチェーン制御バス1を介して出力すると共に、演算した結果を出力値として増幅器4にユニット出力バス2を介して出力する。
【0064】
増幅器(中継器)4は、複数のユニットU1からU10の内のいずれか1つが出力する出力値がユニット出力バス2を介して入力され、入力された出力値を複数のユニットU1からU10のそれぞれに、ユニット入力バス3を介して入力値として出力する。また、増幅器4は、入力された出力値の信号を、電気的に増幅して、入力値として出力する。
【0065】
また、ユニット出力バス2の一端が、並列演算装置の出力端子P1に接続されている。また、増幅器4の入力端子に、並列演算装置の入力端子P2に接続されている。また、ユニットU1は、トリガ入力線5を介して、トリガ入力端子P3と、接続されている。また、出力端子P1、入力端子P2、トリガ入力端子P3は、並列演算装置の外部にある制御装置に接続されている。制御装置は、出力端子P1、入力端子P2、トリガ入力端子P3を介して、並列演算装置にデータを入力し、並列演算装置から演算結果を取得し、また、並列演算装置を制御する。
【0066】
次に、図2を用いて、各ユニットの構成について説明する。なお、ユニットU1からU10は同一の構成を有するため、ここでは、ユニットU2の構成のみについて説明する。ユニットU2は、トークン入力部12と、トークン出力部13と、データ入力部11と、データ出力部14と、ユニット演算部15と、ユニット出力記憶部16と、を有する。
【0067】
トークン入力部12は、デイジーチェーン制御バス1を介してデイジーチェーンされている順序が1つ前のユニットからのトークンを入力する。例えば、ユニットU2のトークン入力部12は、デイジーチェーン制御バス1を介してデイジーチェーンされている順序が1つ前のユニットであるユニットU1からのトークンを入力する。なお、ユニットU1のトークン入力部12は、ユニットU10からのトークンがトークンデイジーチェーン制御バス1を介して入力されるだけでなく、制御装置からのトークンがトリガ入力端子P3とトリガ入力線5とを介して入力される。
【0068】
トークン出力部13は、トークン入力部にトークンが入力されたことに応じて、トークンをデイジーチェーンされている順序が1つ後のユニットへデイジーチェーン制御バス1を介して出力する。例えば、ユニットU2のトークン出力部13は、デイジーチェーン制御バス1を介してデイジーチェーンされている順序が1つ後のユニットであるユニットU3へトークンを出力する。
【0069】
データ入力部11は、ユニット出力バス2を介して増幅器4からの入力値を入力する。ユニット出力記憶部16は、ユニット演算部15が演算した結果でる演算結果が記憶される。ユニット演算部15は、データ入力部11に入力された入力値に基づいて、ユニット毎に予め定められた演算方法により演算する。また、ユニット演算部15は、演算した結果である演算結果を、ユニット出力記憶部16に記憶させる。
【0070】
データ出力部14は、トークン入力部12にトークンが入力されたことに応じて、ユニット演算部15が演算した結果である演算結果を出力値として、増幅器4にユニット出力バス2を介して出力する。また、データ出力部14は、トークン入力部12にトークンが入力されたことに応じて、ユニット出力記憶部16から演算結果を読み出し、読み出した演算結果を出力値として、増幅器4にユニット出力バス2を介して出力する。
【0071】
なお、後述するように、並列演算装置が、トリガであるトークンをユニットU1にトリガ入力端子P3を介して入力し、ユニットU1から順にトークンがユニット間で順次渡されていくことにより、並列演算装置の各ユニットでの処理が実行される。この並列演算装置の動作については、次に説明する並列演算装置を階層型ニューラルネットワークに適応した場合を例にして説明する。
【0072】
<第1の実施形態>
<階層型ニューラルネットワークに適応した場合のユニットの構成>
次に、並列演算装置を、階層型ニューラルネットワークに適応した場合の構成について説明する。階層型ニューラルネットワークにおいても並列演算装置全体の構成は、図1の並列演算装置の構成と同一であり、ユニットの構成のみが異なる。従って、図3を用いて、階層型ニューラルネットワークに適応した場合のユニットの構成を説明する。
【0073】
ユニットは、データ入力部101と、トークン入力部102と、トークン出力部103と、データ出力部104とを有する。また、ユニットは、重み記憶部130と、層情報記憶部133と、ユニット数記憶部134と、積和計算一次値記憶部131と、関数記憶部132と、ユニット出力記憶部135と、データ出力フラグ記憶部136と、ユニット識別情報記憶部137とを有する。また、ユニットは、カウンタ114と、積和計算一次値算出部111と、層情報算出部113と、ユニット出力算出部112とを有する。
【0074】
ここで、図3のデータ入力部101、トークン入力部102、トークン出力部103、データ出力部104は、図2のデータ入力部11、トークン入力部12、トークン出力部13、データ出力部14に、それぞれ対応する。また、図3のユニット出力記憶部135が、図2のユニット出力記憶部16に対応する。これらの図2と図3とにおいて対応する構成について、共通の機能については、その説明を省略する。
【0075】
また、図3の重み記憶部130と、層情報記憶部133と、ユニット数記憶部134と、積和計算一次値記憶部131と、関数記憶部132と、データ出力フラグ記憶部136と、ユニット識別情報記憶部137と、カウンタ114と、積和計算一次値算出部111と、層情報算出部113と、ユニット出力算出部112とが、図2のユニット演算部15に対応する。
【0076】
層情報記憶部133には、階層型ニューラルネットワークの階層のうち、アクティブな層(出力層)を識別する層情報が記憶されている。ユニット識別情報記憶部137には、アクティブな層に属しているユニットのうち、いずれのユニットが出力しているかを示すユニット識別情報が記憶されている。関数記憶部132には、ユニットの出力関数と層情報とが関連付けて予め記憶されている。この出力関数とは、例えば、シグモイド関数、ステップ関数、区分線形関数などの、予め定められた関数である。
【0077】
重み記憶部130には、層情報で識別されるアクティブな層のユニットからの出力値に乗ずる予め定められた結合荷重と、層情報とが関連付けて記憶されている。また、重み記憶部130には、層情報とユニット識別情報とで識別される層のユニットからの出力値に乗ずる予め定められた結合荷重と、層情報とユニット識別情報とが、関連付けて記憶されている。
【0078】
ユニット数記憶部134には、層情報と層情報で識別される階層に属する階層型ニューラルネットワークのユニット数とが関連付けて予め記憶されている。積和計算一次値記憶部131には、前段ユニットに相当するユニットからの入力値と結合荷重とを乗じた積和計算一次値情報が記憶される。データ出力フラグ記憶部136には、データ出力部104が出力値を出力済みであるか否かを示すデータ出力フラグが記憶されている。カウンタ114は、データ入力部101に入力値が入力される毎に、ユニット識別情報記憶部137に記憶されているユニット識別情報の値をインクリメントする。
【0079】
ユニット数比較部115は、層情報記憶部133から層情報を読み出し、読み出した層情報に該当するユニット数をユニット数記憶部134から読み出し、ユニット識別情報記憶部137からユニット識別情報を読み出し、読み出したユニット識別情報の値と読み出したユニット数とを比較し、比較した結果が一致した場合に、読み出したユニット識別情報の値と読み出したユニット数とが一致したことを示す比較一致信号を出力する。また、ユニット数比較部115は、読み出したユニット識別情報の値と読み出したユニット数とを比較し、比較した結果が一致した場合に、ユニット識別情報記憶部137に記憶されているユニット識別情報の値をリセットする。
【0080】
積和計算一次値算出部111は、層情報記憶部133から読み出した層情報に該当する結合荷重を重み記憶部130から読み出し、読み出した結合荷重と、データ入力部101に入力された入力値とを乗算し、乗算した値を積和計算一次値記憶部131に記憶されている積和計算一次値情報に加算して記憶させる。
【0081】
また、積和計算一次値算出部111は、ユニット識別情報記憶部137から読み出したユニット識別情報と層情報記憶部133から読み出した層情報とに該当する結合荷重を重み記憶部130から読み出し、読み出した結合荷重と、データ入力部101に入力された入力値とを乗算し、乗算した値を積和計算一次値記憶部131に記憶されている積和計算一次値情報に加算して記憶させる。
【0082】
ユニット出力算出部112は、積和計算一次値記憶部131から積和計算一次値情報を読み出し、層情報記憶部133から読み出した層情報に該当する出力関数を関数記憶部132から読み出し、読み出した出力関数に読み出した積和計算一次値情報を代入することにより出力値を算出し、算出した出力値をユニット出力記憶部135に記憶させる。
【0083】
また、ユニット出力算出部112は、ユニット数比較部115から比較一致信号を入力されたことに応じて、積和計算一次値記憶部131から積和計算一次値情報を読み出し、層情報記憶部133から読み出した層情報に該当する出力関数を関数記憶部132から読み出し、読み出した出力関数に読み出した積和計算一次値情報を代入することにより出力値を算出し、算出した出力値をユニット出力記憶部135に記憶させる。
また、ユニット出力算出部112は、積和計算一次値記憶部131から積和計算一次値情報を読み出した後、積和計算一次値記憶部131に記憶されている積和計算一次値情報の値を0にリセットする。
【0084】
層情報算出部113は、ユニット数比較部115から比較一致信号を入力されたことに応じて、層情報記憶部133に記憶されている層情報の値をインクリメントする。データ出力部104は、トークン入力部102にトークンが入力されたことに応じて、データ出力フラグ記憶部136のデータ出力フラグを出力済みに設定する。
【0085】
トークン出力部103は、データ入力部101に入力値が入力されたことに応じて、データ出力フラグ記憶部136からデータ出力フラグを読み出し、該読み出したデータ出力フラグが出力済みに設定されている場合には、トークンを出力する(トークン出力手順)。また、トークン出力部103は、トークンを出力すると共に、データ出力フラグ記憶部136のデータ出力フラグを未出力に設定する。
【0086】
なお、トークン出力部103は、データ入力部101に入力値が入力されたことに応じて、データ出力フラグ記憶部136からデータ出力フラグを読み出し、読み出したデータ出力フラグが出力済みに設定されている場合には、トークンを出力するという上記トークン出力手順の代わりに、積和計算一次値算出部111にデータ入力部101からの入力値が入力されたことに応じて、データ出力フラグ記憶部136からデータ出力フラグを読み出し、該読み出したデータ出力フラグが出力済みに設定されている場合には、トークンを出力してもよい。
【0087】
<階層型ニューラルネットワークに適応した場合のユニットの動作>
次に、図4と図5とを用いて、図3の階層型ニューラルネットワークに適応した場合のユニットの動作について説明する。まず、図4を用いて、ユニットに入力値が入力された場合の動作について説明する。
【0088】
まず、データ入力部101に、増幅器4からユニット入力バス3を介して入力値が入力される(ステップS100)。次に、ステップS100で、データ入力部101に入力値が入力されたことに応じて、カウンタ114がユニット識別情報記憶部137に記憶されているユニット識別情報の値を、1つインクリメントする(ステップS101)。
【0089】
また、ステップS100で、データ入力部101に入力値が入力されたことに応じて、積和計算一次値算出部111が、ユニット識別情報記憶部137から読み出したユニット識別情報と層情報記憶部133から読み出した層情報とに該当する結合荷重を重み記憶部130から読み出し、読み出した結合荷重と、データ入力部101に入力された入力値とを乗算し、乗算した値を積和計算一次値記憶部131に記憶されている積和計算一次値情報に加算して記憶させる。
【0090】
次に、ユニット数比較部115が、層情報記憶部133から層情報を読み出し、読み出した層情報に該当するユニット数をユニット数記憶部134から読み出し、ユニット識別情報記憶部137からユニット識別情報を読み出し、読み出したユニット識別情報の値と読み出したユニット数とを比較し、比較した結果が一致した場合に、読み出したユニット識別情報の値と読み出したユニット数とが一致したことを示す比較一致信号を出力する(ステップS103)。また、このユニット数比較部115が、読み出したユニット識別情報の値と読み出したユニット数とを比較し、比較した結果が一致した場合に、ユニット識別情報記憶部137に記憶されているユニット識別情報の値をリセットする。
【0091】
次に、ステップS103にて比較した結果が一致した場合には、層情報算出部113が、ユニット数比較部115から比較一致信号を入力されたことに応じて、層情報記憶部133に記憶されている層情報の値をインクリメントする(ステップS104)。
【0092】
次に、ステップS103にて比較した結果が一致した場合には、ユニット出力算出部112は、ユニット数比較部115から比較一致信号を入力されたことに応じて、積和計算一次値記憶部131から積和計算一次値情報を読み出し、層情報記憶部133から読み出した層情報に該当する出力関数を関数記憶部132から読み出し、読み出した出力関数に読み出した積和計算一次値情報を代入することにより出力値を算出し、算出した出力値をユニット出力記憶部135に記憶させる(ステップS105)。次に、このユニット出力算出部112は、積和計算一次値記憶部131から積和計算一次値情報を読み出した後、積和計算一次値記憶部131に記憶されている積和計算一次値情報の値を0にリセットする。
【0093】
次に、または、ステップS103にて比較した結果が不一致であった場合には、トークン出力部103が、ステップS100にてデータ入力部101に入力値が入力されたことに応じて、データ出力フラグ記憶部136からデータ出力フラグを読み出し、該読み出したデータ出力フラグが出力済みであるか否かを検出し(ステップS106)、データ出力フラグが出力済みに設定されている場合には、トークンを出力する(ステップS107)。
【0094】
また、トークン出力部103は、ステップS107にてトークンを出力すると共に、データ出力フラグ記憶部136のデータ出力フラグを未出力に設定し(ステップS108)、処理を終了する。一方、ステップS106にてデータ出力フラグが未出力に設定されている場合には、トークン出力部103は、処理を終了する。
【0095】
次に、図5を用いて、ユニットにトークンが入力された場合の動作について説明する。まず、トークン入力部102に、デイジーチェーン制御バス1を介してデイジーチェーンされている順序が1つ前のユニットからのトークンが入力される(ステップS200)。
【0096】
次に、データ出力部104は、トークン入力部102にトークンが入力されたことに応じて、ユニット出力記憶部135から出力値(演算結果)を読み出し、読み出した出力値(演算結果)を出力値として、増幅器4にユニット出力バス2を介して出力する(ステップS201)。次に、データ出力部104は、トークン入力部102にトークンが入力されたことに応じて、データ出力フラグ記憶部136のデータ出力フラグを出力済みに設定して(ステップS202)、処理を終了する。
【0097】
<階層型ニューラルネットワークの全体の構成>
次に、本実施形態による階層型ニューラルネットワークの全体の構成について、説明する。
ここでは、図6に示すように、階層型ニューラルネットワークとして、入力層L1、隠れ層L2、出力層L3の3層がある場合について説明する。各層は、層情報により識別されており、また、階層の層情報は、階層の順に層情報が1つずつ大きくなるようにして、識別されている。例えば、入力層L1の層情報が1、隠れ層L2の層情報が2、出力層L3の層情報が3として識別されている。
【0098】
また、入力層L1には、P101、P102、P103の3個のノードがあり、隠れ層L2には、P201、P202、P203、P204、P205、P206、P207、P208、P209、P210の10個のノードがあり、出力層L3には、P301、P302、P303の3個のノードがある場合について説明する。入力層L1の各ノードの出力は、隠れ層L2の各ノードの入力に入力され、また、隠れ層L2の各ノードの出力は、出力層L3の各ノードの入力に入力されている。
【0099】
各層において、各ノードはユニット識別情報により識別されており、各ノードのユニット識別情報は、予め定められたノードの配置順に、ユニット識別情報が1つずつ大きくなるようにして設定されている。例えば、P101はユニット識別情報が1であり、P102はユニット識別情報が2であり、P103はユニット識別情報が3である。
【0100】
本実施の形態においては、それぞれのユニットが、隠れ層L2、出力層L3のノードとして機能する。なお、この例においては、ユニットU1からユニットU3は、隠れ層L2、出力層L3のノードとして機能し、ユニットU4からユニットU10は、隠れ層L2のノードとして機能する。ここで、制御装置が入力層L1として出力値を、増幅器4とユニット出力バス2とを介して、隠れ層L2としての各ユニットに、順次出力する。そのために、ここでは、各ユニットは、隠れ層L2と出力層L3として機能する。
例えば、ユニットU1は、隠れ層L2のノードP201と出力層L3のノードP301として機能する。また、ユニットU3は、隠れ層L2のノードP203と出力層L3のノードP303として機能する。また、ユニットU4は、隠れ層L2のノードP204として機能する。
【0101】
ここで、あるユニットに値が入力された際、入力層L1、隠れ層L2、出力層L3のいずれの層からの入力であるかは、各ユニットにおいて、ユニットが有する層情報記憶部133に記憶してある層情報により判定される。
【0102】
<階層型ニューラルネットワークの全体の動作>
次に、本実施形態による階層型ニューラルネットワークの、一例としての、全体の動作について説明する。ここでは、各ユニットが、出力層L3のノードとして機能し、トークンを入力されたいずれか1つのユニットが隠れ層L2のアクティブなノードとして機能する場合について説明する。この場合、各ユニットが出力層L3のノードとして機能し、アクティブな層が隠れ層L2であるため、各ユニットの層情報記憶部133には層情報の値として2が記憶されている。
【0103】
まず、ノードP201であるユニットU1が、トークンが制御装置から入力されることにより、ユニット出力記憶部135から出力値を読み出し、出力値を出力すると共に、データ出力フラグ記憶部136のデータ出力フラグを出力済みとして設定する(手順A100)。次に、ノードP201からの出力値が、ユニット出力バス2と増幅器4とユニット入力バス3とを介して、ユニットU1からU10の各ユニットのデータ入力部101に入力される。
【0104】
次に、ユニットU1からU10の各ユニットは、ユニットU1からの入力値に基づいて、積和計算一次値算出部111が、ユニット識別情報記憶部137から読み出したユニット識別情報と層情報記憶部133から読み出した層情報とに該当する結合荷重を重み記憶部130から読み出し、読み出した結合荷重と、データ入力部101に入力された入力値とを乗算し、乗算した値を積和計算一次値記憶部131に記憶されている積和計算一次値情報に加算して記憶させる(手順A101)。
ここで、各ユニットの積和計算一次値算出部111が、ユニット識別情報記憶部137から読み出したユニット識別情報と層情報記憶部133から読み出した層情報とに該当する結合荷重を重み記憶部130から読み出すことにより、各ユニットは、層情報に基づいて出力層L3のノードとして機能し、また、層情報に基づいて、アクティブなユニットの属する層が隠れ層L2であると識別し、更に、ユニット識別情報に基づいてアクティブとなる隠れ層L2での各ノードを識別し、この隠れ層L2のアクティブとなるノードに対応する結合荷重を、このアクティブとなった隠れ層L2のノードからの出力値に乗ずることが可能となる。
【0105】
ここで、ユニットU1のデータ出力フラグ記憶部136のデータ出力フラグは、出力済みとして設定されてあるため、ユニットU1のトークン出力部103は、データ入力部101に入力値が入力されたことに応じて、トークンを出力すると共に、データ出力フラグ記憶部136のデータ出力フラグを未出力として設定する(手順A102)。
【0106】
次に、ユニットU1から出力されたトークンは、デイジーチェーン制御バス1を介して、デイジーチェーンされている順序が1つ後のユニットであるユニットU2のトークン入力部12に入力される(手順A103)。
【0107】
ユニットU2はトークン入力部12にトークンが入力されたことに応じて、上記に説明した手順A100でノードP101であるユニットU1が、トークンが入力された場合と同様に、ユニット出力記憶部135から出力値を読み出し、出力値を出力すると共に、データ出力フラグ記憶部136のデータ出力フラグを出力済みとして設定する(手順A104)。
【0108】
以降、同様に、手順A101から手順A103を繰り返し、隠れ層L2のノードP210であるユニットU10が、出力値を出力すると共に、データ出力フラグ記憶部136のデータ出力フラグを出力済みとして設定する。
【0109】
次に、出力層L3のノードP301からP303に該当するユニットU1からU3の各ユニットは、手順A101と同様に、ユニットU10からの入力値に基づいて、各ユニットの積和計算一次値算出部111が、ユニット識別情報記憶部137から読み出したユニット識別情報と層情報記憶部133から読み出した層情報とに該当する結合荷重を重み記憶部130から読み出し、読み出した結合荷重と、データ入力部101に入力された入力値とを乗算し、乗算した値を積和計算一次値記憶部131に記憶されている積和計算一次値情報に加算して記憶させる(手順A105)。
【0110】
ここで、ユニットU10からの入力値が、各ユニットのデータ入力部101に入力されたことに応じて、各ユニットのカウンタ114は、ユニット識別情報記憶部137に記憶されているユニット識別情報の値をインクリメントし、ユニット識別情報の値は3となる(手順A106)。
なお、各ユニットのユニット数記憶部134には、層情報と層情報で識別される階層に属する階層型ニューラルネットワークのユニット数とが関連付けて予め記憶されている。例えば、図6の階層型ニューラルネットワークの場合には、入力層L1の層情報である値1と、階層型ニューラルネットワークのユニット数、つまり、入力層L1のノード数である3とが、関連付けて予め記憶されている。また、例えば、図6の階層型ニューラルネットワークの場合には、隠れ層L2の層情報である値2と、階層型ニューラルネットワークのユニット数、つまり、隠れ層L2のノード数である10とが、関連付けて予め記憶されている。
【0111】
次に、各ユニットのユニット数比較部115は、層情報記憶部133から層情報を読み出し、読み出した層情報に該当するユニット数をユニット数記憶部134から読み出し、ユニット識別情報記憶部137からユニット識別情報を読み出し、読み出したユニット識別情報の値と読み出したユニット数とを比較し、比較した結果が一致するために、読み出したユニット識別情報の値と読み出したユニット数とが一致したことを示す比較一致信号を出力すると共に、ユニット識別情報記憶部137に記憶されているユニット識別情報の値をリセットする(手順A107)。
【0112】
次に、各ユニットのユニット出力算出部112は、ユニット数比較部115から比較一致信号を入力されたことに応じて、積和計算一次値記憶部131から積和計算一次値情報を読み出し、層情報記憶部133から読み出した層情報に該当する出力関数を関数記憶部132から読み出し、読み出した出力関数に読み出した積和計算一次値情報を代入することにより出力値を算出し、算出した出力値をユニット出力記憶部135に記憶させる(手順A108)。
【0113】
ここで、各ユニットのユニット出力算出部112は、層情報記憶部133から読み出した層情報に該当する出力関数を関数記憶部132から読み出すため、出力層L3に該当するユニット毎の出力関数により、ユニットの出力値を算出することが可能となる。また、各ユニットのユニット出力記憶部135に出力層L3のノードとして算出した出力値が記憶されるため、各ユニットはトークンが入力された場合に、各ユニットは出力層L3のアクティブなノードとして、出力値を出力することが可能となる。
【0114】
また、各ユニットの層情報算出部113が、ユニット数比較部115から比較一致信号を入力されたことに応じて、層情報記憶部133に記憶されている層情報の値をインクリメントして、層情報の値を3とする。そのために、各ユニットは、以降、トークンが入力されたいずれか1つのユニットが、出力層L3のアクティブなノードとして出力値を出力する。
【0115】
なお、上記において、出力層L3でユニットU3からユニットU4にトークンが出力され、次に、トークンを入力されたユニットU4が出力層L3のノードとして出力値を出力するが、この例における階層型ニューラルネットワークにおいて、出力層L3のノードとしてユニットU4に相当するノードは無いため、ユニットU4は、出力層L3のノードとして出力値を出力しないことが望ましい。または、ユニットU4は、出力層L3のノードとしては、出力値の値を0として出力してもよい。または、各ユニットにおいて、出力層L3としてのユニットU4からの出力値に乗じる結合荷重を0として、重み記憶部130に予め記憶しておいてもよい。
【0116】
このようにユニットU4の出力値、または、ユニットU4からの出力値を受けた各ユニットの結合荷重を、予め階層型ニューラルネットワークの各層のノードの個数に合わせて設定しておくことにより、ユニットに対して、ある層でそのユニットに対応するノードが無い場合においても、本実施形態の並列演算装置は階層型ニューラルネットワークとして問題なく動作することが可能である。
【0117】
以上説明したように、本実施形態を階層型ニューラルネットワークに適応した場合には、一度に発火すうニューロンの個数を1つに限定したことにより、つまり、出力層において出力値を出力するノードを、トークンが入力された1つのユニットに限定することにより、ユニット間の配線が増大することを減じる効果を奏する。
また、1つの出力層のノードであるユニットからの出力値が、ユニット入力バス3を介して、1度に全ての入力層となるノードであるユニットに分配して入力されるため、分配に要する時間を減じる効果を奏する。また、複数のユニットが、並列にユニット内演算を演算するため、全体としての演算が高速になるという効果を奏する。
【0118】
例えば、階層型ニューラルネットワークを演算した場合、従来型のプロセッサを用いた場合には、その計算時間は概算として、計算時間=(シナプス数×1回の演算に要するステップ数÷クロック周波数)として算出されるのに対して、本実形態による並列演算装置を用いた場合には、計算時間=(ニューロン数×1ニューロンの発火周期)により算出される。ここで、シナプス数は、ニューロン数の2乗に比例するため、本実形態による並列演算装置を用いた階層型ニューラルネットワークの計算時間は、従来型のプロセッサを用いた場合に比較して、計算時間を大幅に減ずることが可能となる。
【0119】
また、各ユニットが、階層型ニューラルネットワークの層を変更し、かつ、入力側の層のノードと出力側の層のノードとして機能するため、少ないユニット数で多層のノードの演算を実行することが可能となる効果を奏する。
【0120】
なお、上記に説明した第1の実施形態においては、制御装置が入力層L1として出力値を順次出力し、そのために、各ユニットは隠れ層L2と出力層L3のノードとして機能するとして説明したが、各ユニットは、入力層L1のノードとして機能するようにしてもよい。例えば、制御装置が入力層L1のノードに対応する出力値を順次出力し、ユニットが入力層L1のノードとして、制御装置からの出力値をユニット出力記憶部135に順次記憶する。次に、トークンが入力されたユニットが、入力層L1のアクティブなユニットとして出力値を出力する。このようにして、各ユニットは、入力層L1と、隠れ層L2と、出力層L3とのユニットとして機能することも可能である。
【0121】
なお、上記の第1の実施形態においては、階層型ニューラルネットワークとして、入力層L1、隠れ層L2、出力層L3の3層がある場合について説明したが、本実施形態は、階層型ニューラルネットワークの階層は3層に限られるものではなく、任意の階層に適応可能である。
【0122】
<第2の実施形態>
<自己組織化マップに適応した場合のユニットの構成>
次に、本実施形態の並列演算装置を、自己組織化マップに適応した場合について説明する。自己組織化マップは、次のような処理を実行することにより、多変量からなるデータの統計的性質を学習し、 類似したデータが近接するように配列し、また、データの視覚化することを可能とするものである。
【0123】
各ユニットは、ユニットの結合重みベクトルを有している。まず、各ユニットに入力データベクトルが入力され、各ユニットは入力された入力データベクトルと結合重みベクトルの差であるノルムを算出する(手順A200)。次に、最もノルムの小さい出力ユニットを勝者ユニットとして選択する(手順A201)。次に、選択した勝者ユニットとその近傍のユニットが、より入力データベクトルに近づくように結合重みベクトルの値を予め定められた関数により変更して、学習を行う(手順A203)。この、手順A200から手順A203を繰り返す。
【0124】
本実施形態の並列演算装置を自己組織化マップに適応する場合、各ユニットに入力されるデータは、上記の手順A200と、手順A201と、手順A202とで異なるため、実施形態においては、ユニットに入力するデータに、上記の手順A200と、手順A201と、手順A202とを識別する識別情報を組とすることにより、識別する。
【0125】
図9(a)に示すように、ユニット入力バス3からの入力値は、ノルム部とデータ部とを有する。また、図9(b)に示すように、ノルム部の値が−2である場合、入力値のノルム部は「データ部の値が入力ベクトルである」ことを示す識別子であり、そのデータ部は入力ベクトルである。また、図9(c)に示すように、ノルム部の値が−1である場合、ノルム部は「近傍判定識別情報」であり、そのデータ部は、ネットワーク座標である。また、図9(d)に示すように、ノルム部の値が零または正の値である場合、ノルム部の値はノルムであり、また、データ部は、ネットワーク座標である。これらの詳細については、後述する。
【0126】
次に、図7と図8とを用いて、自己組織化マップに適応した場合の並列演算装置のユニットの構成について説明する。ここで、複数のユニットのそれぞれは、ネットワーク座標により識別される座標で予め識別されている。なお、各ユニットは、同一の構成を有しているので、1つのユニットのみについて説明する。
【0127】
この図7または図8のユニットの構成において、データ入力部201はデータ入力部11に対応し、データ出力部204はデータ出力部14に対応し、トークン入力部202はトークン入力部12に対応と、トークン出力部203はトークン出力部13に対応する。また、ユニットノルム記憶部236と、入力ノルム記憶部237と、ユニットネットワーク座標記憶部234と、入力ネットワーク座標記憶部233とは、ユニット出力記憶部16に対応する。また、他の構成は、ユニット演算部15に対応する。
【0128】
ユニットネットワーク座標記憶部234には、ユニットのネットワーク座標であるユニットネットワーク座標が予め記憶されている。入力ネットワーク座標記憶部233には、入力されたネットワーク座標である入力ネットワーク座標が記憶される。重み記憶部231には、ユニットの結合重みベクトルが予め記憶されている。入力データ記憶部230には、入力された入力データベクトルが記憶される。ユニットノルム記憶部236には、ユニットのノルムが記憶される。入力ノルム記憶部237には、入力されたノルムが記憶される。
【0129】
学習速度記憶部235には、学習速度を決める係数である学習速度係数が予め記憶されている。また、学習速度記憶部235には、学習した回数を示す学習ステップ数と、前記学習速度係数とが予め関連付けて記憶されている。距離記憶部232には、ネットワーク座標の間の距離が近傍であるか否かを判定する基準である基準距離が予め記憶されている。また、距離記憶部232には、学習ステップ数と基準距離とが予め関連付けて記憶されている。
【0130】
データ入力判定部222は、データ入力部201に入力された入力値が入力データベクトルであるか否かを判定し、入力データベクトルである場合には、データ抽出部210に入力値である入力データベクトルを出力し、入力データベクトルでない場合には、ネットワーク座標抽出部211とノルム抽出部212とに入力値を出力する。
このデータ入力判定部222は、入力値のノルムの値が、入力値が入力データベクトルであることを示す値である−2であるか否かを判定することにより、データ入力部201に入力された入力値が入力データベクトルであるか否かを判定する。
【0131】
データ抽出部210は、データ入力部201に入力された入力値が入力データベクトルである場合には、入力された入力データベクトルを入力データ記憶部230に記憶させる。また、データ抽出部210は、入力された入力データベクトルを、ノルム算出部214に出力する。また、データ抽出部210は、入力データベクトルが入力される毎に、カウンタ213がカウントアップ信号を出力する。
【0132】
カウンタ213は、ユニットに入力データベクトルが入力される毎に、ユニットに入力データベクトルが入力された回数であるステップ数をカウントアップする。また、カウンタ213は、データ抽出部210からカウントアップ信号を入力される毎に、ステップ数をカウントアップする。
【0133】
ノルム算出部214は、データ入力部201に入力された入力値が入力データベクトルである場合には、入力された入力データベクトルと、重み記憶部231から読み出した結合重みベクトルとのノルムを算出し、算出したノルムをユニットノルムとしてユニットノルム記憶部236に記憶させる。
【0134】
入力ノルム部250は、データ入力部201に入力された入力値が、ネットワーク座標とノルムとの組みである場合には、入力されたネットワーク座標を入力ネットワーク座標として入力ネットワーク座標記憶部233に記憶させると共に、入力されたノルムを入力ノルムとして入力ノルム記憶部237に記憶させる。この入力ノルム部250は、ネットワーク座標抽出部211と、ノルム抽出部212と、入力ノルム判定部218とから構成されている。
【0135】
ネットワーク座標抽出部211は、入力された入力値から、ネットワーク座標を抽出し、抽出したネットワーク座標を入力ネットワーク座標として入力ネットワーク座標記憶部233に記憶させる。ノルム抽出部212は、入力された入力値から、ノルムを抽出し、抽出したノルムを入力ノルム判定部218に出力する。
【0136】
入力ノルム判定部218は、ノルム抽出部212から入力されたノルムの値により、入力されたノルムが、ノルムであるのか、または、ネットワーク座標と近傍判定を実行することを示す識別情報である近傍判定識別情報であるのかを判定し、ノルムである場合には、入力されたノルムを入力ノルムとして入力ノルム記憶部237に記憶させる。逆に、入力されたノルムが近傍判定識別情報である場合には、入力ノルム判定部218は、近傍判定部215に、近傍判定識別情報を出力する。
例えば、この入力ノルム判定部218は、ノルム抽出部212から入力されたノルムの値が−1である場合には、入力されたノルムが近傍判定識別情報であるとして判定し、ノルム抽出部212から入力されたノルムの値が−1でない場合には、ノルムとして判定する。
【0137】
ノルム比較部217は、トークン入力部202を介してトークンが入力されたことに応じて、ユニットノルム記憶部236から読み出したユニットノルムと、入力ノルム記憶部237から読み出した入力ノルムとを比較する。
【0138】
選択出力部251は、ノルム比較部217の比較した結果が、読み出したユニットノルムが入力ノルムより小さい場合には、ユニットノルム記憶部236から読み出したユニットノルムとユニットネットワーク座標記憶部234から読み出したユニットネットワーク座標とを組みとして、データ出力部204を介して出力し、読み出したユニットノルムが入力ノルム以上である場合には、入力ノルム記憶部237から読み出した入力ノルムと入力ネットワーク座標記憶部233から読み出した入力ネットワーク座標とを組みとして、データ出力部204を介して出力する。この選択出力部251は、ネットワーク座標選択部219と、ノルム選択部220と、データ合成出力部221とから構成されている。
【0139】
ノルム選択部220は、ノルム比較部217の比較した結果が、読み出したユニットノルムが入力ノルムより小さい場合には、ユニットノルム記憶部236からユニットノルムを読み出し、読み出したユニットノルムをデータ合成出力部221に出力する。また、ネットワーク座標選択部219は、ノルム比較部217の比較した結果が、読み出したユニットノルムが入力ノルム以上である場合には入力ノルム記憶部237から入力ノルムを読み出し、読み出した入力ノルムをデータ合成出力部221に出力する。
【0140】
ネットワーク座標選択部219は、ノルム比較部217の比較した結果が、読み出したユニットノルムが入力ノルムより小さい場合には、ユニットネットワーク座標記憶部234からユニットネットワーク座標を読み出し、読み出したユニットネットワーク座標をデータ合成出力部221に出力する。また、ネットワーク座標選択部219は、ノルム比較部217の比較した結果が、読み出したユニットノルムが入力ノルム以上である場合には、入力ネットワーク座標記憶部233から入力ネットワーク座標を読み出し、読み出した入力ネットワーク座標をデータ合成出力部221に出力する。
【0141】
データ合成出力部221は、ノルム選択部220から入力されたユニットノルムまたは入力ノルムであるノルムと、ネットワーク座標選択部219から入力されたユニットネットワーク座標または入力ネットワーク座標であるネットワーク座標とを組みとして合成し、組として合成したノルムとネットワーク座標とを、データ出力部204を介して出力する。
【0142】
近傍判定部215は、データ入力部201に入力された入力値が、ネットワーク座標と近傍判定を実行することを示す識別情報である近傍判定識別情報との組みである場合には、ユニットネットワーク座標記憶部234から読み出したユニットネットワーク座標が、入力されたネットワーク座標である入力ネットワーク座標の近傍にあるか否かを判定する。
【0143】
また、近傍判定部215は、近傍判定識別情報が入力ノルム部250または入力ノルム判定部218から入力されたことに応じて、ユニットネットワーク座標記憶部234から読み出したユニットネットワーク座標が、入力されたネットワーク座標である入力ネットワーク座標の近傍にあるか否かを判定する。
【0144】
また、近傍判定部215は、データ入力部201に入力された入力値が、ネットワーク座標と近傍判定を実行することを示す識別情報である近傍判定識別情報との組みである場合には、距離記憶部232から基準距離を読み出し、ユニットネットワーク座標記憶部234から読み出したユニットネットワーク座標と入力されたネットワーク座標である入力ネットワーク座標との間の距離が、読み出した基準距離以下であるか否かを判定することにより、ユニットネットワーク座標が入力ネットワーク座標の近傍にあるか否かを判定する。
【0145】
また、近傍判定部215は、カウンタ213から読み出したステップ数に一致する学習ステップ数に関連付けられている基準距離を距離記憶部232から読み出し、該読み出した基準距離に基づいて前記ユニットネットワーク座標が前記入力ネットワーク座標の近傍にあるか否かを判定する。
【0146】
重み更新部216は、近傍判定部215の判定した結果が近傍である場合には、重み記憶部231に記憶されている結合重みベクトルの値を更新する。また、重み更新部216は、入力データ記憶部230から読み出した入力データベクトルと重み記憶部231から読み出した結合重みベクトルとの差を算出し、算出した差に、学習速度記憶部235から読み出した学習速度係数を乗じた値を、重み記憶部231に記憶されている結合重みベクトルに加算することにより、重み記憶部231に記憶されている結合重みベクトルの値を更新する。
【0147】
また、重み更新部216は、カウンタ213から読み出したステップ数と一致する学習ステップ数に関連付けられている学習速度係数を学習速度記憶部235から読み出し、読み出した学習速度係数に基づいて重み記憶部231に記憶されている結合重みベクトルの値を更新する。
【0148】
トークン出力フラグ記憶部238には、トークン出力部203がトークンを出力済みであるか否かを示すトークン出力フラグが記憶されている。トークン出力フラグ判定部223は、トークン入力部202にトークンが入力されたことに応じて、トークン出力フラグ記憶部238からトークン出力フラグを読み出し、読み出したトークン出力フラグがトークンを未出力である場合に、入力されたトークンをノルム比較部217に出力すると共に、入力されたトークンを、トークン出力部203を介して出力する。
【0149】
トークン出力部203は、トークン入力部202にトークンが入力されたことに応じて、トークンを出力する。また、トークン出力部203は、データ合成出力部221または選択出力部251が、ユニットノルム記憶部236から読み出したユニットノルムとユニットネットワーク座標記憶部234から読み出したユニットネットワーク座標とを組みとしてデータ出力部204を介して出力したことに応じて、または、入力ノルム記憶部237から読み出した入力ノルムと入力ネットワーク座標記憶部233から読み出した入力ネットワーク座標とを組みとしてデータ出力部204を介して出力したことに応じて、トークンを出力する。また、トークン出力部203は、トークンを出力した後に、トークン出力フラグ記憶部238に記憶されているトークン出力フラグを出力済みに更新する。
【0150】
<自己組織化マップに適応した場合のユニットの動作>
次に、図10と図11とを用いて、自己組織化マップに適応した場合の並列演算装置のユニットの動作について説明する。最初に、図10を用いて、ユニットのデータ入力部に入力値が入力された場合の動作について説明する。
【0151】
まず、データ入力部201に入力値であるデータが入力される(ステップS400)。次に、データ入力判定部222は、入力値のノルムの値が、入力値が入力データベクトルであることを示す値である−2であるか否かを判定することにより、データ入力部201に入力された入力値が入力データベクトルであるか否かを判定する(ステップS401)。
【0152】
次に、ステップS401の判定結果が、ノルムの値が−2であり、入力データベクトルである場合には、データ抽出部210が、入力された入力データベクトルを入力データ記憶部230に記憶させる(ステップS402)と共に、カウントアップ信号をカウンタ213に出力する。次に、カウンタ213は、データ抽出部210からカウントアップ信号を入力されたことに応じて、ステップ数をカウントアップする(ステップS403)。
【0153】
次に、ノルム算出部214は、データ抽出部210を介して入力された入力データベクトルと、重み記憶部231から読み出した結合重みベクトルとのノルムを算出し、算出したノルムをユニットノルムとしてユニットノルム記憶部236に記憶させ(ステップS404)、処理を終了する。
【0154】
一方、ステップS401の判定結果が、ノルムの値が−2ではなく、入力データベクトルではない場合には、ネットワーク座標抽出部211が、入力された入力値から、ネットワーク座標を抽出し、抽出したネットワーク座標を入力ネットワーク座標として入力ネットワーク座標記憶部233に記憶させる(ステップS405)と共に、ノルム抽出部212は、入力された入力値から、ノルムを抽出し、抽出したノルムを入力ノルム判定部218に出力する。
【0155】
次に、入力ノルム判定部218は、ノルム抽出部212から入力されたノルムの値が−1であるか否かを判定し(ステップS406)、判定結果が、ノルム抽出部212から入力されたノルムの値が−1でない場合には、ノルムとして判定し、入力されたノルムを入力ノルムとして入力ノルム記憶部237に記憶させ(ステップS407)、処理を終了する。
【0156】
一方、ステップS406の判定結果が、ノルム抽出部212から入力されたノルムの値が−1である場合には、入力ノルム判定部218は、入力されたノルムが近傍判定識別情報であるとして判定し、近傍判定部215に、近傍判定識別情報を出力する。次に、近傍判定部215は、近傍判定識別情報が入力ノルム判定部218から入力されたことに応じて、ユニットネットワーク座標記憶部234から読み出したユニットネットワーク座標が、入力されたネットワーク座標である入力ネットワーク座標の近傍にあるか否かを判定する(ステップS408)。
【0157】
ステップS408の判定結果が、近傍である場合には、重み更新部216が、重み記憶部231に記憶されている結合重みベクトルの値を更新して(ステップS409)、処理を終了する。一方、ステップS408の判定結果が、近傍でない場合には、処理を終了する。
【0158】
次に、図11を用いて、ユニットのトークン入力部にトークンが入力された場合の動作について説明する。まず、トークン入力部202に、トークンが入力される(ステップS500)。次に、トークン出力フラグ判定部223が、トークン入力部202にトークンが入力されたことに応じて、トークン出力フラグ記憶部238からトークン出力フラグを読み出し、読み出したトークン出力フラグがトークンを未出力であるか否かを判定し(ステップS501)、読み出したトークン出力フラグがトークンを未出力である場合には、入力されたトークンをノルム比較部217に出力すると共に、入力されたトークンを、トークン出力部203を介して出力する。
【0159】
次に、ノルム比較部217は、トークン入力部202を介してトークンが入力されたことに応じて、ユニットノルム記憶部236から読み出したユニットノルムと、入力ノルム記憶部237から読み出した入力ノルムとを比較する(ステップS502)。
【0160】
ノルム比較部217の比較した結果が、読み出したユニットノルムが入力ノルムより小さい場合には、ノルム選択部220が、ユニットノルム記憶部236からユニットノルムを読み出し、読み出したユニットノルムをデータ合成出力部221に出力する(ステップS503)と共に、ネットワーク座標選択部219が、ユニットネットワーク座標記憶部234からユニットネットワーク座標を読み出し、読み出したユニットネットワーク座標をデータ合成出力部221に出力する(ステップS504)。
【0161】
次に、データ合成出力部221が、ノルム選択部220から入力されたユニットノルムと、ネットワーク座標選択部219から入力されたユニットネットワーク座標とを組みとして合成し、組として合成したユニットノルムとユニットネットワーク座標とを、データ出力部204を介して出力する(ステップS505)。
【0162】
一方、ステップS502でノルム比較部217が比較した結果が、読み出したユニットノルムが入力ノルム以上である場合には、ノルム選択部220が、入力ノルム記憶部237から入力ノルムを読み出し、読み出した入力ノルムをデータ合成出力部221に出力する(ステップS508)と共に、ネットワーク座標選択部219が、入力ネットワーク座標記憶部233から入力ネットワーク座標を読み出し、読み出した入力ネットワーク座標をデータ合成出力部221に出力する(ステップS509)。
【0163】
次に、データ合成出力部221は、ノルム選択部220から入力された入力ノルムと、ネットワーク座標選択部219から入力された入力ネットワーク座標とを組みとして合成し、組として合成した入力ノルムと入力ネットワーク座標とを、データ出力部204を介して出力する(ステップS510)。
【0164】
次に、トークン出力部203が、ステップS505にて、データ合成出力部221が、ユニットノルム記憶部236から読み出したユニットノルムとユニットネットワーク座標記憶部234から読み出したユニットネットワーク座標とを組みとしてデータ出力部204を介して出力したことに応じて、または、ステップS510にて、入力ノルム記憶部237から読み出した入力ノルムと入力ネットワーク座標記憶部233から読み出した入力ネットワーク座標とを組みとしてデータ出力部204を介して出力したことに応じて、トークンを出力する(ステップS506)。
【0165】
次に、トークン出力部203は、トークンを出力した後に、トークン出力フラグ記憶部238に記憶されているトークン出力フラグを出力済みに更新し(ステップS507)、処理を終了する。
【0166】
<自己組織化マップに適応した場合の並列演算装置全体の動作>
次に、自己組織化マップに適応した場合の並列演算装置全体の動作について説明する。まず、制御装置は、入力ベクトルと、値を−2としたノルムとを組みとした入力値を、全てのユニットに、ユニット入力バス3を介して、入力する(手順A300)。
【0167】
次に、入力ベクトルを入力された各ユニットのノルム算出部214は、入力された入力ベクトルと、ユニットが有する結合重みベクトルとのノルムを算出し、算出したノルムを、ユニットノルム記憶部236に記憶させる(手順A301)。
【0168】
次に、制御装置は、ユニットU1に、トークンを入力する(手順A302)。次に、ユニットU1のノルム比較部217は、ユニットU1のトークン入力部202を介してトークンが入力されたことに応じて、ユニットノルム記憶部236から読み出したユニットノルムと、入力ノルム記憶部237から読み出した入力ノルムとを比較する(手順A303)。
【0169】
ここで、ユニットU1の入力ノルム記憶部237には、ユニットU1が手順A301で算出したノルムに比較して、十分に大きな値のノルムが予め記憶されているものとして説明する。
【0170】
ここでは、ユニットノルム記憶部236から読み出したユニットノルムの方が、入力ノルム記憶部237から読み出した入力ノルムより小さいため、ユニットU1の選択出力部251は、ユニットノルム記憶部236から読み出したユニットノルムとユニットネットワーク座標記憶部234から読み出したユニットネットワーク座標とを組みとして、データ出力部204を介して出力する(手順A304)。
【0171】
次に、ユニットU1のデータ出力部204が出力したノルムとネットワーク座標とが組として、ユニット出力バス2と増幅器4とユニット入力バス3とを介して、各ユニットのデータ入力部201に入力される(手順A305)。
【0172】
次に、各ユニットの入力ノルム部250は、データ入力部201に入力された入力値のノルムの値が−1でないため、入力されたネットワーク座標を入力ネットワーク座標として入力ネットワーク座標記憶部233に記憶させると共に、入力されたノルムを入力ノルムとして入力ノルム記憶部237に記憶させる(手順A306)。ここで、入力ネットワーク座標記憶部233に記憶されるネットワーク座標と、入力ノルム記憶部237に記憶されるノルムは、ユニットU1の、ネットワーク座標とノルムである。
【0173】
次に、ユニットU1のトークン出力部203は、ユニットU1のデータ合成出力部221または選択出力部251が、ユニットノルム記憶部236から読み出したユニットノルムとユニットネットワーク座標記憶部234から読み出したユニットネットワーク座標とを組みとしてデータ出力部204を介して出力したことに応じて、トークンを、デイジーチェーン制御バス1を介してユニットU2に出力する(手順A307)。
【0174】
次に、手順A303のユニットU1と同様に、ユニットU2のノルム比較部217は、ユニットU2のトークン入力部202を介してユニットU1からのトークンが入力されたことに応じて、ユニットノルム記憶部236から読み出したユニットノルムと、入力ノルム記憶部237から読み出した入力ノルムとを比較する(手順A308)。
【0175】
ここで、入力ノルム記憶部237に記憶される入力ノルムは、ユニットU1のノルムであり、また、ユニットノルム記憶部236から読み出したユニットノルムは、ユニットU2のノルムであるため、このユニットU2のノルム比較部217は、ユニットU2のノルムと、ユニットU1のノルムとを比較することになる。以降、ユニットU2のノルム比較部217の比較結果に基づいて、手順A304から手順A306の処理が、同様に実行される(手順A309)。
【0176】
従って、トークンがユニットU2に入力されることにより、ユニットU1とユニットU2とのノルムが比較され、ノルムが小さい方のユニットが勝者ユニットとして選択され、勝者ユニットのノルムとユニットネットワーク座標とが、全てのユニットの入力ノルム記憶部237と入力ネットワーク座標記憶部233とに記憶される(手順A310)。
【0177】
次に、手順A307と同様に、ユニットU2からユニットU3にトークンが送信されることにより、次に、ユニットU3が、手順A303から手順A307とを実行することにより、ユニットU1とユニットU2との勝者ユニットのノルムと、ユニットU3のノルムとが比較され、ユニットU1からユニットU3までのユニットの中からの勝者ユニットが選択される(手順A311)。
【0178】
以降、トークンがデイジーチェーン順序でユニットに渡されていく毎に、トークンが入力されたユニットの中での勝者ユニットが選択される(手順A312)。その後、デイジーチェーン順序で最後のユニットであるユニットU10にトークンが入力されると、ユニットU10のデータ出力部204が、ユニットU1からユニットU10の中の勝者ユニットのノルムとネットワーク座標とを出力する(手順A313)。
【0179】
制御装置は、ユニットU10のデータ出力部204が出力するノルムとネットワーク座標とを、勝者ユニットのノルムとネットワーク座標として受信する(手順A314)。これにより、制御装置は、入力ベクトルに対しての、勝者ユニットのノルムとネットワーク座標とを、受信することが出来る。
【0180】
次に、制御装置は、ユニットU10のデータ出力部204から受信したネットワーク座標と、値を−1としたノルムとを組みとした入力値を、全てのユニットに、ユニット入力バス3を介して、入力する(手順A315)。
【0181】
次に、ネットワーク座標と値を−1としたノルムとを組みとした入力値を入力された各ユニットは、各ユニットのネットワーク座標抽出部211が、入力された入力値から、ネットワーク座標を抽出し、抽出したネットワーク座標を入力ネットワーク座標として入力ネットワーク座標記憶部233に記憶させる(手順A316)と共に、各ユニットの入力ノルム判定部218が、ノルム抽出部212から入力されたノルムの値が−1であるため、入力されたノルムが近傍判定識別情報であるとして判定し、近傍判定部215に、近傍判定識別情報を出力する(手順A317)。
【0182】
次に、各ユニットの近傍判定部215が、近傍判定識別情報が入力ノルム部250または入力ノルム判定部218から入力されたことに応じて、ユニットネットワーク座標記憶部234から読み出したユニットネットワーク座標が、入力ネットワーク座標記憶部233から読み出した入力ネットワーク座標の近傍にあるか否かを判定する(手順A318)。
【0183】
次に、各ユニットの重み更新部216は、そのユニットの近傍判定部215の判定した結果が近傍である場合には、そのユニットの重み記憶部231に記憶されている結合重みベクトルの値を更新する(手順A319)。これにより、勝者ユニットのネットワーク座標の近傍であるユニットの結合重みベクトルが、更新され、学習が実行される。
【0184】
以上に説明した自己組織化マップに適応した場合の並列演算装置においては、ユニット入力バス3に全てのユニットが接続されているため、制御装置が入力ベクトルをユニット入力バス3に1度出力するだけで、全てのユニットに入力ベクトルを入力することができる。また、各ユニットが、入力された入力ベクトルに対して、並列にノルムを算出することができるため、ユニット全体で、短時間でノルムを算出することができる。
【0185】
また、ユニット入力バス3に全てのユニットが接続されているため、制御装置が勝者ユニットのネットワーク座標をユニット入力バス3に1度出力するだけで、全てのユニットに勝者ユニットのネットワーク座標を入力することができる。また、各ユニットが、入力された勝者ユニットのネットワーク座標の近傍にあるか否かを並列に判定し、学習するため、ユニット全体で、短時間で学習することができる。
【0186】
また、デイジーチェーン制御バス1を介してトークンをユニット間で渡していくことにより、デイジーチェーン順序で順に勝者ユニットを決定することができる。つまり、勝者ユニットの決定が、デイジーチェーン制御バス1という、簡易な配線で可能となる。
【0187】
<冗長性を持たせた並列演算装置>
次に、図12を用いて、デイジーチェーン制御バス1に冗長性をもたせた場合の並列演算装置の構成を説明する。
各ユニットは、予め定められた順序であるデイジーチェーン順序において、1つ飛ばしの順序である第1の冗長順序で、複数のユニットのうちの半数のユニットが、第1の冗長デイジーチェーン制御バス6によりデイジーチェーンされている。例えば、ユニットU1とユニットU3とユニットU5とユニットU7とユニットU9とが、第1の冗長デイジーチェーン制御バス6により、デイジーチェーンされている。
【0188】
また、予め定められた順序であるデイジーチェーン順序において、1つ飛ばしの順序で、上記の第1の冗長デイジーチェーン制御バス6によりデイジーチェーンされていない複数のうちの残りの半数のユニットが、第2の冗長デイジーチェーン制御バス7によりデイジーチェーンされている。例えば、ユニットU2とユニットU4とユニットU6とユニットU8とユニットU10とが、第2の冗長デイジーチェーン制御バス7により、デイジーチェーンされている。
【0189】
次に、図13を用いて、第1の冗長デイジーチェーン制御バス6によりデイジーチェーンされているユニットの構成について説明する。つまり、例えば、ユニットU1とユニットU3とユニットU5とユニットU7とユニットU9の構成について説明する。なお、冗長性について変更される構成のみについて説明するため、図2のユニットの構成において、変更される構成のみについて説明する。
【0190】
図13において、図13(a)と(c)とには、変更される前の図2で示されたユニットの構成が示してある。並列演算装置が冗長性を有するようにすることにより、図13(a)のユニットの構成が、図13(b)の構成に変更される。また、図13(c)のユニットの構成が、図13(d)のユニットの構成に変更される。
【0191】
図13(b)に示すようにユニットは、トークン出力部A13_1と、トークン出力部B13_2と、トークン出力部選択部17と、トークン選択情報記憶部18とを有する。ここで、トークン出力部A13_1は、図2のトークン出力部13に対応する。
【0192】
トークン出力部B13_2(冗長トークン出力部)は、トークン入力部12にトークンが入力されたことに応じて、トークンを冗長順序で1つ後のユニットへ第1の冗長デイジーチェーン制御バス6を介して出力する。トークン選択情報記憶部18には、トークン出力部A13_1とトークン出力部B13_2とのうち、いずれを選択するかを示すトークン出力選択情報が記憶されている。
【0193】
トークン出力部選択部17は、トークン入力部12にトークンが入力されたことに応じて、トークン選択情報記憶部18から読み出したトークン出力選択情報に基づいて、トークン出力部A13_1とトークン出力部B13_2とのうちいずれか一方を選択し、選択したトークン出力部A13_1またはトークン出力部B13_2を介してトークンを出力する。
【0194】
また、図13(d)に示すように、ユニットは、トークン入力部A12_1と、トークン入力部B12_2(冗長トークン入力部)とを有する。ここで、トークン入力部A12_1は、図2のトークン入力部12に対応する。
【0195】
トークン入力部B12_2は、第1の冗長デイジーチェーン制御バス6を介してデイジーチェーンされている冗長順序が1つ前のユニットからのトークンを入力する。
また、トークン出力部13は、トークン入力部A12_1またはトークン入力部B12_2にトークンが入力されたことに応じて、トークンを出力する。
【0196】
また、第1の冗長デイジーチェーン制御バス6によりデイジーチェーンされているユニットと同様に、第2の冗長デイジーチェーン制御バス7によりデイジーチェーンされているユニットも、第2の冗長デイジーチェーン制御バス7を第1の冗長デイジーチェーン制御バス6として、トークン入力部B12_2(冗長トークン出力部)とトークン選択情報記憶部18とトークン出力部選択部17とトークン入力部B12_2(冗長トークン入力部)を有している。
【0197】
なお、ここでは、トークン選択情報記憶部18には、トークン出力部A13_1とトークン出力部B13_2とのうち、いずれを選択するかを示すトークン出力選択情報が記憶されているもとして説明したが、このトークン出力選択情報は、例えば、デイジーチェーン順序で次のユニットに欠陥があるか否かを示す情報であってもよい。
【0198】
トークン出力選択情報が、デイジーチェーン順序で次のユニットに欠陥があるか否かを示す情報である場合、トークン出力部選択部17は、トークン選択情報記憶部18から読み出したトークン出力選択情報に基づいて、デイジーチェーン順序で次のユニットに欠陥がない場合には、トークン出力部A13_1を選択してトークンを出力し、逆に欠陥がある場合には、トークン出力部B13_2を選択してトークンを出力する。
【0199】
<欠陥チェックの方法>
次に、欠陥チェックの方法について説明する。ここでは、並列演算装置が、階層型ニューラルネットワークの場合について説明する。まず、ニューラルネットワークの並列演算装置が、結合係数がすべて同じで、中間層無しの入力層と出力層との2層である階層型ニューラルネットワークとして演算を実行し、制御装置が、演算結果の出力値を得る。制御装置は、出力値を判定し、正常な場合は処理を修了する。制御装置は、出力値を判定し、異常があることを検出した場合には、異常ユニットの前段ユニットのトークン選択情報記憶部18に対し、欠陥情報を書き込む。
【0200】
次に、制御装置の、正常な場合と異常な場合の、判定方法とその処理について、詳細に説明する。まず、制御装置は、全てのユニットから、すべて同じ出力を得る場合に、正常として判定する。次に、制御装置は、ユニットからの出力が途中で止まる、または、ユニットからの出力値が予想された値と異なる部分がある場合に、異常として判定する。この場合、制御装置は、異常として検出したユニットである異常ユニットの、デイジーチェーン順序で1つ前となる前段ユニットのトークン選択情報記憶部18に、欠陥情報を書き込み、もう一度欠陥チェックを実行し、判定結果が正常となるまで欠陥チェックを実行する。このとき、欠陥が原因で電気的に切り離す必要が生じる場合に備え、ユニットの入出力部にハイインピーダンススイッチを設け、回路を電気的に切り離す機構を備えても良い。
【0201】
以上のように、並列演算装置が、第1の冗長デイジーチェーン制御バス6と、第2の冗長デイジーチェーン制御バス7とにより冗長性を有するようにすることにより、デイジーチェーン制御バス1またはいずれかのユニットに欠陥が生じた場合においても、並列演算装置は問題なく動作することが可能となる。
【0202】
なお、ここでは、冗長配線が、デイジーチェーン順序において1つ飛ばしの第1の冗長デイジーチェーン制御バス6と第2の冗長デイジーチェーン制御バス7との場合について説明したが、更に、デイジーチェーン順序において2つ飛ばしの冗長デイジーチェーン制御バスなどを追加することも可能である。
【0203】
なお、上記実施形態の図2、図3、図7および図8で示した構成である記憶部のそれぞれは、ハードディスク装置や光磁気ディスク装置、フラッシュメモリ等の不揮発性のメモリや、CR−ROM等の読み出しのみが可能な記憶媒体、RAM(Random Access Memory)のような揮発性のメモリ、あるいはこれらの組み合わせにより構成されるものとする。
なお、図2のユニット算出部は、専用のハードウェアにより実現されるものであってもよく、また、メモリおよびマイクロプロセッサにより実現させるものであってもよい。
【0204】
以上、この発明の実施形態を、図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
【図面の簡単な説明】
【0205】
【図1】この発明の一実施形態による並列演算装置の構成を示すブロック図である。
【図2】この発明の一実施形態による並列演算装置のユニットの構成を示すブロック図である。
【図3】階層型ニューラルネットワークにおける図2のユニットの構成を示すブロック図である。
【図4】図3のユニットの動作を示す第1のフローチャート図である。
【図5】図3のユニットの動作を示す第2のフローチャート図である。
【図6】ニューラルネットワークを説明する説明図である。
【図7】自己組織化マップにおける図2のユニットの構成を示す第1のブロック図である。
【図8】自己組織化マップにおける図2のユニットの構成を示す第2のブロック図である。
【図9】自己組織化マップにおけるデータ構造を示す説明図である。
【図10】図7および図8のユニットの動作を示す第1のフローチャート図である。
【図11】図7および図8のユニットの動作を示す第2のフローチャート図である。
【図12】冗長回路を有した並列演算装置の構成を示すブロック図である。
【図13】図12のユニットの構成を示すブロック図である。
【符号の説明】
【0206】
1 デイジーチェーン制御バス
2 ユニット出力バス
3 ユニット入力バス
4 増幅器
5 トリガ入力線
6 第1の冗長デイジーチェーン制御バス
7 第2の冗長デイジーチェーン制御バス
11、101、201 データ入力部
12、102、202 トークン入力部
13、103、203 トークン出力部
14、104、204 データ出力部
16 ユニット出力記憶部
17 トークン出力部選択部
18 トークン選択情報記憶部
111 積和計算一次値算出部
112 ユニット出力算出部
113 層情報算出部
114 カウンタ
130、231 重み記憶部
131 積和計算一次値記憶部
132 関数記憶部
133 層情報記憶部
134 ユニット数記憶部
135 ユニット出力記憶部
136 データ出力フラグ記憶部
137 ユニット識別情報記憶部
210 データ抽出部
211 ネットワーク座標抽出部
212 ノルム抽出部
213 カウンタ
214 ノルム算出部
215 近傍判定部
216 重み更新部
217 ノルム比較部
218 入力ノルム判定部
219 ネットワーク座標選択部
220 ノルム選択部
221 データ合成出力部
222 データ入力判定部
223 トークン出力フラグ判定部
230 入力データ記憶部
232 距離記憶部
233 入力ネットワーク座標記憶部
234 ユニットネットワーク座標記憶部
235 学習速度記憶部
236 ユニットノルム記憶部
237 入力ノルム記憶部
238 トークン出力フラグ記憶部
250 入力ノルム部
251 選択出力部
L1 入力層
L2 隠れ層
L3 出力層
P1 出力端子
P2 入力端子
P3 トリガ入力端子
U1、U2、U3、U4、U5、U6、U7、U8、U9、U10 ユニット

【特許請求の範囲】
【請求項1】
並列演算装置が、
予め定められた順序でデイジーチェーン制御バスを介してデイジーチェーンされている複数のユニットと、
前記複数のユニットの内のいずれか1つが出力する出力値がユニット出力バスを介して入力され、該入力された出力値を前記複数のユニットのそれぞれにユニット入力バスを介して入力値として出力する中継部と、
を有し、
前記ユニットが、
前記デイジーチェーン制御バスを介してデイジーチェーンされている順序が1つ前のユニットからのトークンを入力するトークン入力部と、
前記トークン入力部にトークンが入力されたことに応じて、前記トークンを前記デイジーチェーンされている順序が1つ後のユニットへ前記デイジーチェーン制御バスを介して出力するトークン出力部と、
前記ユニット出力バスを介して前記中継部からの入力値を入力するデータ入力部と、
前記データ入力部に入力された入力値に基づいて、前記ユニット毎に予め定められた演算方法により演算するユニット演算部と、
前記トークン入力部にトークンが入力されたことに応じて、前記ユニット演算部が演算した結果である演算結果を前記出力値として、前記中継部に前記ユニット出力バスを介して出力するデータ出力部と、
を有することを特徴とする並列演算装置。
【請求項2】
前記ユニットが、前記演算結果が記憶されるユニット出力記憶部を有し、
前記ユニット演算部が、前記演算結果を前記ユニット出力記憶部に記憶させ、
前記データ出力部が、前記トークン入力部にトークンが入力されたことに応じて、前記演算結果を前記ユニット出力記憶部から読み出し、該読み出した演算結果を前記出力値として前記中継部に前記ユニット出力バスを介して出力する、
ことを特徴とする請求項1に記載の並列演算装置。
【請求項3】
前記並列演算装置が階層型ニューラルネットワークを演算する並列演算装置である場合には、
前記ユニット演算部が、
前記階層型ニューラルネットワークの階層のうち、出力する層を識別する層情報が記憶されている層情報記憶部と、
前記ユニットの出力関数と前記層情報とが関連付けて予め記憶されている関数記憶部と、
前記層情報で識別される前記出力層のユニットからの出力値に乗ずる予め定められた結合荷重と、前記層情報とが関連付けて記憶されている重み記憶部と、
前記出力ユニットからの入力値と結合荷重とを乗じた積和計算一次値情報が記憶される積和計算一次値記憶部と、
前記層情報記憶部から読み出した層情報に該当する結合荷重を前記重み記憶部から読み出し、該読み出した結合荷重と、前記データ入力部に入力された入力値とを乗算し、該乗算した値を前記積和計算一次値記憶部に記憶されている積和計算一次値情報に加算して記憶させる積和計算一次値算出部と、
前記積和計算一次値記憶部から積和計算一次値情報を読み出し、前記層情報記憶部から読み出した層情報に該当する出力関数を前記関数記憶部から読み出し、該読み出した出力関数に前記読み出した積和計算一次値情報を代入することにより出力値を算出し、該算出した出力値を前記ユニット出力記憶部に記憶させるユニット出力算出部と、
を有することを特徴とする請求項2に記載の並列演算装置。
【請求項4】
前記ユニット演算部が、前記出力層に属しているユニットのうち、いずれのユニットが出力ユニットとして出力しているかを示すユニット識別情報が記憶されているユニット識別情報記憶部、を有し、
前記重み記憶部には、前記層情報と前記ユニット識別情報とで識別される前記出力層のユニットからの出力値に乗ずる予め定められた結合荷重と、前記層情報と前記ユニット識別情報とが、関連付けて記憶されており、
前記積和計算一次値算出部が、前記ユニット識別情報記憶部から読み出したユニット識別情報と前記層情報記憶部から読み出した層情報とに該当する結合荷重を前記重み記憶部から読み出し、該読み出した結合荷重と、前記データ入力部に入力された入力値とを乗算し、該乗算した値を前記積和計算一次値記憶部に記憶されている積和計算一次値情報に加算して記憶させる、
ことを特徴とする請求項3に記載の並列演算装置。
【請求項5】
前記ユニット演算部が、
前記データ入力部に入力値が入力される毎に、前記ユニット識別情報記憶部に記憶されているユニット識別情報の値をインクリメントするカウンタと、
前記層情報と前記層情報で識別される階層に属する階層型ニューラルネットワークのユニット数とが関連付けて予め記憶されているユニット数記憶部と、
前記層情報記憶部から層情報を読み出し、該読み出した層情報に該当するユニット数を前記ユニット数記憶部から読み出し、前記ユニット識別情報記憶部からユニット識別情報を読み出し、該読み出したユニット識別情報の値と前記読み出したユニット数とを比較し、該比較した結果が一致した場合に、該読み出したユニット識別情報の値と前記読み出したユニット数とが一致したことを示す比較一致信号を出力するユニット数比較部と、
を有し、
前記ユニット出力算出部が、前記ユニット数比較部から比較一致信号を入力されたことに応じて、前記積和計算一次値算出部から積和計算一次値情報を読み出し、前記層情報記憶部から読み出した層情報に該当する出力関数を前記関数記憶部から読み出し、該読み出した出力関数に前記読み出した積和計算一次値情報を代入することにより出力値を算出し、該算出した出力値を前記ユニット出力記憶部に記憶させる、
ことを特徴とする請求項4に記載の並列演算装置。
【請求項6】
前記ユニット数比較部が、前記比較した結果が一致した場合に、前記ユニット識別情報記憶部に記憶されているユニット識別情報の値をリセットする、ことを特徴とする請求項5に記載の並列演算装置。
【請求項7】
前記ユニット演算部が、前記ユニット数比較部から比較一致信号を入力されたことに応じて、前記層情報記憶部に記憶されている層情報の値をインクリメントする層情報算出部、を有することを特徴とする請求項5または請求項6に記載の並列演算装置。
【請求項8】
前記ユニット演算部が、前記データ出力部が前記出力値を出力済みであるか否かを示すデータ出力フラグが記憶されているデータ出力フラグ記憶部を有し、
前記データ出力部が、前記トークン入力部にトークンが入力されたことに応じて、前記データ出力フラグ記憶部のデータ出力フラグを出力済みとして設定し、
前記トークン出力部が、前記データ入力部に入力値が入力されたことに応じて、前記データ出力フラグ記憶部からデータ出力フラグを読み出し、該読み出したデータ出力フラグが出力済みである場合には、前記トークンを出力する、
ことを特徴とする請求項3から請求項7に記載の並列演算装置。
【請求項9】
前記トークン出力部が、前記トークンを出力すると共に、前記データ出力フラグ記憶部のデータ出力フラグを未出力として設定する、ことを特徴とする請求項8に記載の並列演算装置。
【請求項10】
前記ユニット出力算出部が、前記積和計算一次値算出部から積和計算一次値情報を読み出した後、前記積和計算一次値算出部に記憶されている積和計算一次値情報の値を0にリセットする、ことを特徴とする請求項3から請求項9に記載の並列演算装置。
【請求項11】
前記並列演算装置が自己組織化マップを演算する並列演算装置である場合には、前記複数のユニットのそれぞれが、ネットワーク座標により識別される座標で予め識別されており、
前記ユニット演算部が、
前記ユニットのネットワーク座標であるユニットネットワーク座標が予め記憶されているユニットネットワーク座標記憶部と、
入力されたネットワーク座標である入力ネットワーク座標が記憶されている入力ネットワーク座標記憶部と、
前記ユニットの結合重みベクトルが記憶されている重み記憶部と、
ノルムを記憶するユニットノルム記憶部と、
入力されたノルムを記憶する入力ノルム記憶部と、
前記データ入力部に入力された入力値が入力データベクトルである場合には、該入力された入力データベクトルと、前記重み記憶部から読み出した結合重みベクトルとのノルムを算出し、該算出したノルムをユニットノルムとして前記ユニットノルム記憶部に記憶させるノルム算出部と、
前記データ入力部に入力された入力値が、ネットワーク座標とノルムとの組みである場合には、該入力されたネットワーク座標を入力ネットワーク座標として前記入力ネットワーク座標記憶部に記憶させると共に、該入力されたノルムを入力ノルムとして前記入力ノルム記憶部に記憶させる入力ノルム部と、
前記トークン入力部を介してトークンが入力されたことに応じて、前記ユニットノルム記憶部から読み出したユニットノルムと、前記入力ユニットノルム記憶部から読み出した入力ノルムとを比較するノルム比較部と、
前記ノルム比較部の比較した結果が、前記読み出したユニットノルムが前記入力ノルムより小さい場合には、前記ユニットノルム記憶部から読み出したユニットノルムと前記ユニットネットワーク座標記憶部から読み出したユニットネットワーク座標とを組みとして前記データ出力部を介して出力し、前記読み出したユニットノルムが前記入力ノルム以上である場合には、前記入力ノルム記憶部から読み出した入力ノルムと前記入力ネットワーク座標記憶部から読み出した入力ネットワーク座標とを組みとして前記データ出力部を介して出力する選択出力部と、
を有することを特徴とする請求項1または請求項2に記載の並列演算装置。
【請求項12】
前記ユニット演算部が、
前記データ入力部に入力された入力値が、ネットワーク座標と近傍判定を実行することを示す識別情報である近傍判定識別情報との組みである場合には、前記ユニットネットワーク座標記憶部から読み出したユニットネットワーク座標が、前記入力されたネットワーク座標である入力ネットワーク座標の近傍にあるか否かを判定する近傍判定部と、
前記近傍判定部の判定した結果が近傍である場合には、前記重み記憶部に記憶されている結合重みベクトルを更新する重み更新部と、
を有することを特徴とする請求項10または請求項11に記載の並列演算装置。
【請求項13】
前記ユニット演算部が、
入力された入力データベクトルが記憶される入力データ記憶部と、
学習速度を決める係数である学習速度係数が予め記憶されている学習速度記憶部と、
前記データ入力部に入力された入力値が入力データベクトルである場合には、該入力された入力データベクトルを前記入力データ記憶部に記憶させるデータ抽出部と、
を有し、
前記重み更新部が、前記入力データ記憶部から読み出した入力データベクトルと前記重み記憶部から読み出した結合重みベクトルとの差に、前記学習速度記憶部から読み出した学習速度係数を乗じた値を、前記重み記憶部に記憶されている結合重みベクトルに加算することにより、前記重み記憶部に記憶されている結合重みベクトルを更新する、
ことを特徴とする請求項12に記載の並列演算装置。
【請求項14】
前記学習速度記憶部には、学習した回数を示す学習ステップ数と、前記学習速度係数とが予め関連付けて記憶されており、
前記ユニット演算部が、前記ユニットに入力データベクトルが入力される毎に、前記ユニットに前記入力データベクトルが入力された回数であるステップ数をカウントアップするカウンタを有し、
前記重み更新部が、前記カウンタから読み出したステップ数が、前記学習ステップ数に該当する学習速度係数を前記学習速度記憶部から読み出し、該読み出した学習速度係数に基づいて前記重み記憶部に記憶されている結合重みベクトルを更新する、
ことを特徴とする請求項12または請求項13に記載の並列演算装置。
【請求項15】
前記ユニット演算部が、前記ネットワーク座標の間の距離が近傍であるか否かを判定する基準である基準距離が予め記憶されている距離記憶部を有し、
前記近傍判定部が、前記データ入力部に入力された入力値が、ネットワーク座標と近傍判定を実行することを示す識別情報である近傍判定識別情報との組みである場合には、前記距離記憶部から基準距離を読み出し、前記ユニットネットワーク座標記憶部から読み出したユニットネットワーク座標と前記入力されたネットワーク座標である入力ネットワーク座標との間の距離が、前記読み出した基準距離以下であるか否かを判定することにより、前記ユニットネットワーク座標が前記入力ネットワーク座標の近傍にあるか否かを判定する、
ことを特徴とする請求項12から請求項14に記載の並列演算装置。
【請求項16】
前記距離記憶部には、前記学習ステップ数と前記基準距離とが予め関連付けて記憶されており、
前記近傍判定部が、
前記カウンタから読み出したステップ数が、前記学習ステップ数に該当する基準距離を前記学習速度記憶部から読み出し、該読み出した基準距離に基づいて前記ユニットネットワーク座標が前記入力ネットワーク座標の近傍にあるか否かを判定する、
ことを特徴とする請求項15に記載の並列演算装置。
【請求項17】
前記トークン入力部にトークンが入力されたことに応じて、前記トークン出力部がトークンを出力することを特徴とする請求項11から請求項16に記載の並列演算装置。
【請求項18】
前記ユニット演算部が、
前記トークン出力部がトークンを出力済みであるか否かを示すトークン出力フラグが記憶されているトークン出力フラグ記憶部と、
前記トークン入力部にトークンが入力されたことに応じて、前記トークン出力フラグ記憶部からトークン出力フラグを読み出し、該読み出したトークン出力フラグがトークンを未出力である場合に、前記入力されたトークンを前記ノルム比較部に出力すると共に、前記入力されたトークンを前記トークン出力部を介して出力するトークン出力フラグ判定部と、
を有することを特徴とする請求項11から請求項17に記載の並列演算装置。
【請求項19】
前記トークン出力部が、
前記ユニットノルム記憶部から読み出したユニットノルムと前記ユニットネットワーク座標記憶部から読み出したユニットネットワーク座標とを組みとして前記データ出力部を介して前記選択出力部が出力したことに応じて、または、前記入力ノルム記憶部から読み出した入力ノルムと前記入力ネットワーク座標記憶部から読み出した入力ネットワーク座標とを組みとして前記データ出力部を介して前記選択出力部が出力したことに応じて、前記トークンを出力する、
ことを特徴とする請求項11から請求項18に記載の並列演算装置。
【請求項20】
前記トークン出力部が、
前記トークンを出力した後に、前記トークン出力フラグ記憶部に記憶されているトークン出力フラグを出力済みに更新する、
ことを特徴とする請求項11から請求項19に記載の並列演算装置。
【請求項21】
前記予め定められた順序の1つ飛ばしの順序である第1の冗長順序で、前記複数のユニットのうちの半数のユニットが、第1の冗長デイジーチェーン制御バスによりデイジーチェーンされており、
前記第1の冗長デイジーチェーン制御バスによりデイジーチェーンされているユニットが、
前記トークン入力部にトークンが入力されたことに応じて、前記トークンを前記冗長順序で1つ後のユニットへ前記第1の冗長デイジーチェーン制御バスを介して出力する冗長トークン出力部と、
前記トークン出力部と前記冗長トークン出力部とのうち、いずれを選択するかを示すトークン出力選択情報が記憶されているトークン選択情報記憶部と、
前記トークン入力部にトークンが入力されたことに応じて、前記トークン選択情報記憶部から読み出したトークン出力選択情報に基づいて、前記トークン出力部と前記冗長トークン出力部とのうちいずれか一方を選択し、該選択したトークン出力部または冗長トークン出力部を介してトークンを出力するトークン出力部選択部と、
を有することを特徴とする請求項1から請求項19に記載の並列演算装置。
【請求項22】
前記ユニットが、
前記冗長デイジーチェーン制御バスを介してデイジーチェーンされている冗長順序が1つ前のユニットからのトークンを入力する冗長トークン入力部を有し、
前記トークン出力部が、
前記トークン入力部または前記冗長トークン入力部にトークンが入力されたことに応じて、前記トークンを出力する、
ことを特徴とする請求項21に記載の並列演算装置。
【請求項23】
前記予め定められた順序の1つ飛ばしの順序で、前記第1の冗長デイジーチェーン制御バスによりデイジーチェーンされていない前記複数のうちの残りの半数のユニットが、第2の冗長デイジーチェーン制御バスによりデイジーチェーンされており、
前記第2の冗長デイジーチェーン制御バスによりデイジーチェーンされているユニットが、前記第2の冗長デイジーチェーン制御バスを前記第1の冗長デイジーチェーン制御バスとして、前記冗長トークン出力部とトークン選択情報記憶部とトークン出力部選択部とを有している、
ことを特徴する請求項21または請求項22に記載の並列演算装置。
【請求項24】
前記第2の冗長デイジーチェーン制御バスによりデイジーチェーンされているユニットが、前記第2の冗長デイジーチェーン制御バスを前記第1の冗長デイジーチェーン制御バスとして、前記冗長トークン入力部を有している、
ことを特徴する請求項21から請求項23に記載の並列演算装置。
【請求項25】
予め定められた順序でデイジーチェーン制御バスを介してデイジーチェーンされている複数のユニットと、前記複数のユニットの内のいずれか1つが出力する出力値がユニット出力バスを介して入力され、該入力された出力値を前記複数のユニットのそれぞれにユニット入力バスを介して入力値として出力する中継部と、を有する並列演算装置のユニットにおいて用いられる並列演算方法であって、
前記ユニットが、
前記デイジーチェーン制御バスを介してデイジーチェーンされている順序が1つ前のユニットからのトークンを入力し、
前記トークンが入力されたことに応じて、前記トークンを前記デイジーチェーンされている順序が1つ後のユニットへ前記デイジーチェーン制御バスを介して出力し、
前記ユニット出力バスを介して前記中継部からの入力値を入力し、
前記入力された入力値に基づいて、前記ユニット毎に予め定められた演算方法により演算し、
前記トークンが入力されたことに応じて、前記演算した結果である演算結果を前記出力値として、前記中継部に前記ユニット出力バスを介して出力する、
ことを特徴とする並列演算方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate


【公開番号】特開2008−299381(P2008−299381A)
【公開日】平成20年12月11日(2008.12.11)
【国際特許分類】
【出願番号】特願2007−141671(P2007−141671)
【出願日】平成19年5月29日(2007.5.29)
【出願人】(000002369)セイコーエプソン株式会社 (51,324)
【Fターム(参考)】