演算装置

【発明の詳細な説明】
【０００１】
【産業上の利用分野】本発明は、画像処理アルゴリズムを簡潔に表現可能な点集計型演算記述を効率よく実行する演算装置に関する。
【０００２】
【従来の技術】従来の画像処理装置は、膨大な画素数を持つ画像の各画素の処理方法を指定する形のプログラムで駆動されるため、プログラムは複雑で大量になりがちであり、プログラム作成の負担が大きかった。用意されたライブラリのプログラムだけを実行する画像処理装置も存在するが、その場合処理可能なプログラムの種類が限られるため、処理の柔軟性に問題があった。それに対し画像全体をオペランドとした点集計型演算と呼ばれる面型演算によるプログラム記述を用いれば、画像処理のプログラム作成の負担を大いに軽減可能であるが、従来そうした記述を効率よく実行できる画像処理装置は存在しなかった。
【０００３】
【発明が解決しようとする課題】本発明は画像処理のプログラム作成の負担を大いに軽減可能な、画像全体をオペランドとする点集計型演算記述を効率よく実行できる画像処理装置を構成するために必要な演算装置を与えることを目的としている。
【０００４】
【課題を解決するための手段】本発明の演算装置は、データａ０，ｂ０を格納するデータ格納手段Ａ，Ｂを有し、ａ０とｂ０からデータｃ０を求め演算結果として出力する演算装置であり、計Ｎｘ×Ｎｙ個のデータｃ０の横と縦のデータ数Ｎｘ，Ｎｙ、計Ｘａ×Ｙａ個のデータａ０の横と縦のデータ数Ｘａ，Ｙａ、計ＸＢ×ＹＢ個のデータｂ０の横と縦のデータ数ＸＢ，ＹＢ、ｃ０の先頭データの格納場所を示す横と縦の座標値Ｘｃ，Ｙｃ、そして命令コードｏ１，ｏ２とで構成される起動パケットＫと、ａ０と、ｂ０とを入力とし、ｊを０からＮｙまで１ずつインクリメントし、その各ｊに対しｉを０からＮｘまで１ずつインクリメントし、そしてその各ｉに対し集計演算部Ｅに（Ｘｃ＋ｉ）の値、（Ｙｃ＋ｊ）の値、及びｏ２で構成される起動データＨを出力するとともにｙを０からＹＢまで１ずつインクリメントし、その各ｙに対しｘを０からＸＢまで１ずつインクリメントし、その各ｘに対しＡに（Ｘａ×（ｙ＋ｊ×（Ｙａ−ＹＢ）／（Ｎｙ−１））＋ｘ＋ｉ×（Ｘａ−ＸＢ）／（Ｎｘ−１））の値を持つアドレスＡＤ１、Ｂに（ＸＢ×ｙ＋ｘ）の値を持つアドレスＡＤ２、点演算部Ｄにｏ１を出力する演算制御部Ｃと、ＡＬＵと乗算器とを持ち、ＡからＡＤ１で読み出したデータＡ１、ＢからＡＤ２で読み出したデータＢ１をｏ１に従って演算器を選択して演算し、その結果得られたデータＤ１を出力する点演算部Ｄと、ＣＰＵ、加算器そして最大値検出器とを持ち、ＤからＸＢ×ＹＢ個のＤ１を対象に、必要に応じＨ内の（Ｘｃ＋ｉ）の値、（Ｙｃ＋ｉ）の値を使用しながら、ｏ２に従って選択して処理し、ｃ０を構成する１データを生成する集計演算部Ｅとを有することを特徴としている。
【０００５】
【実施例】本発明による演算装置Ｚ（図１）をＷ個（Ｚ（１）〜Ｚ（Ｗ））使用して構成した実施例である画像処理装置Ｙ（図４）について詳細に説明する。
【０００６】Ｙは図４に示すように画像格納手段Ｍと、ホストプロセッサＰと、４本のデータ転送手段ＢＵ０，ＢＵ１，ＢＵ２，ＢＵ３と、本発明による演算装置Ｚ（図１）をＷ個（Ｚ（１）〜Ｚ（Ｗ））、それにディスプレイ装置Ｌ０、カメラ装置Ｌ１等からなる。Ｌ１からのデータはＭまたはＬ０に送られ、ＭはＰからのアドレスをもとにデータをＢＵ１，ＢＵ２経由でＺ（１）〜Ｚ（Ｗ）に供給し、またＺ（１）〜Ｚ（Ｗ）はＰからの起動データをＢＵ０経由で受取り、演算を行った後に演算結果をＢＵ３経由でＭ、Ｐ、あるいはＬ０に送るものとする。
【０００７】以下ではａ、ｂ、ｃの３枚の画像について、まずａのｃに対応する各画素ａｃを決め（図１１（ａ））、次にａｃの数だけのｂを、各ｂの中心画素位置が各ａｃの画素位置にくるようにａに重ね（図１１（ｂ））、その結果ａとｂで重なった画素同士でＯＰ１の演算を行い（図１１（ｃ））、その結果得られた値を各ｂごとにＯＰ２の演算によって集計し（図１１（ｄ））、それらの結果を各ａｃに対応する各ａｃの画素位置に代入する、という一連の処理（図１１）をｃ＝ａ｛ＯＰ１，ＯＰ２｝ｂと表現する点集計型演算記述Ｓを、Ｙを用いてどのように処理するかについて詳細に述べる。但しａをＸＡ×ＹＡ、ｂをＸＢ×ＹＢ、そしてｃをＸＣ×ＹＣ、の横と縦のデータ数を持つ画像とし、またａはＬ１を使用してあるいは以前の演算結果として既にＭに格納されており、ｂはＭに格納されているかまたはＰが生成するものとする。
【０００８】Ｐ（図５）ではまず
【０００９】
【数１】

【００１０】次に、ＯＰ１，ＯＰ２の演算を表すコードｏ１，ｏ２、Ｘａ（ｎ）、Ｙａ（ｎ）、ＸＢ、ＹＢ、Ｎｘ（ｎ）、Ｎｙ（ｎ）、Ｘｃ（ｎ）、そしてＹｃ（ｎ）を持つ起動パケットＫ（ｎ）をＢＵ０によって各Ｚ（ｎ）に送ると同時に、画像ａの画素位置（Ｓｘ（ｎ），Ｓｙ（ｎ））を起点とする横と縦がＸａ（ｎ），Ｙａ（ｎ）の領域内のＸａ（ｎ）×Ｙａ（ｎ）個のデータａ０（ｎ）をＭから読み出しＢＵ１で各Ｚ（ｎ）に転送し、またＭから読み出した画像ｂあるいはＰが各Ｚ（ｎ）ごとに生成した画像ｂ、の計ＸＢ×ＹＢ個のデータｂ０（ｎ）をＢＵ２で各Ｚ（ｎ）に転送する。
【００１１】各Ｚ（ｎ）では、ａ０（ｎ）をデータ格納手段Ａに、ｂ０（ｎ）をデータ格納手段Ｂにそれぞれ格納した後、Ｋ（ｎ）の内容に従い、記述Ｓの処理結果としての画像ｃの一部（Ｗ＝１の場合は全部）、即ち横と縦の座標値がＸｃ（ｎ），Ｙｃ（ｎ）の位置を起点とする横と縦がＮｘ（ｎ），Ｎｙ（ｎ）の計Ｎｘ（ｎ）×Ｎｙ（ｎ）個の演算結果データｃ０（ｎ）を生成するように、以下のように動作する。但し以下では簡単のため各Ｚ（ｎ）によるｃ０（ｎ）や、各Ｚ（ｎ）へのａ０（ｎ），ｂ０（ｎ）、Ｋ（ｎ）及びその内部のデータの記述は（ｎ）を省略し、単にｃ０，ａ０，ｂ０，Ｋ，Ｘａ，Ｙａ，ＸＢ，ＹＢ，Ｎｘ，Ｎｙ，Ｘｃ，Ｙｃと記すとする（図６）。
【００１２】演算制御部Ｃ（図１と図２）は、特許請求の範囲に記載のようにｊを０からＮｙまで１ずつインクリメントし、その各ｊに対しｉを０からＮｘまで１ずつインクリメントし、そしてその各ｉに対し集計演算部（図１と図３）Ｅに（Ｘｃ＋ｉ）の値、（Ｙｃ＋ｊ）の値、そしてｏ２で構成される起動データＨを出力するとともにｙを０からＹＢまで１ずつインクリメントし、その各ｙに対しｘを０からＸＢまで１ずつインクリメントし、その各ｘに対しＡに（Ｘａ×（ｙ＋ｊ×（Ｙａ−ＹＢ）／（Ｎｙ−１））＋（ｘ＋ｉ×（Ｘａ−ＸＢ）／（Ｎｘ−１））の値を持つアドレス、Ｂに（ＸＢ×ｙ＋ｘ）の値をもつアドレス、点演算部（図１と図３）Ｄにｏ１を出力する。
【００１３】Ｄはｏ１に従いＤ内のＡＬＵあるいは乗算器を選択し、ＣからのアドレスでＡ，Ｂから読み出したデータＡ１，Ｂ１に対し演算を行い、その結果Ｄ１をＥに送る。
【００１４】ＥはＨ内の（Ｘｃ＋ｉ）の値，（Ｙｃ＋ｊ）の値、それにＤから送られてきた計ＸＢ×ＹＢ個のＤ１ごとを対象に、Ｈ内の演算コードｏ２に従い加算器、最大値検出器、あるいは汎用ＣＰＵを選択し演算を行い演算結果Ｅ１を出力する。例えばｏ２により加算器が選択された場合はＸＢ×ＹＢ個のＤ１ごとの総和を、最大値検出器が選択された場合は計ＸＢ×ＹＢ個のＤ１ごとの最大値を、また汎用ＣＰＵが選択された場合はｏ２の指定するメモリ部の先頭アドレスから始まるプログラムで、Ｈ内の（Ｘｃ＋ｉ）の値，（Ｙｃ＋ｊ）の値、それにＤから送られてきた計ＸＢ×ＹＢ個のＤ１ごとを対象に処理した結果を、Ｅ１として出力する。なお汎用ＣＰＵを選択した場合は必要に応じ記憶部Ｇを使用しながら演算を進めることになる。
【００１５】Ｅ１は、例えばパケット作成部を設けＣあるいはＥからの（Ｘｃ＋ｉ）の値，（Ｙｃ＋ｊ）の値の情報をもらい、それらをもとにパケットＲを作成しＢＵ３に出力することで、Ｅ１をＬ０（ディスプレイ装置）、Ｍ、あるいはＰにｃ０の１データとして転送する。また各Ｚ（ｎ）がそれぞれｃ０のデータをＮｘ×Ｎｙ個出力すれば、記述Ｓの実行が完了したことになるので、そのことをＰに知らせるために、各Ｚ（ｎ）のＦがＲをＮｘ×Ｎｙ回出力した後に特殊の値を持ったＲを一つ作成しＢＵ３あるいはＢＵ０を用いてＰに転送するようにすればよい。
【００１６】ＸＡ＝ＹＡ＝２５６，ＸＢ＝ＹＢ＝５，ＸＣ＝ＹＣ＝１２０，Ｗ＝３２の場合の例を図７〜図１０に示す。図７は、Ｐで計算される１…３２の各ｎに対するＮｘ、Ｎｙ、Ｘａ、Ｙａ、Ｘｃ、Ｙｃ、Ｓｘ、Ｓｙの各値と、ｎ＝５の場合の諸値で構成されるＫ（５）を示している。また、図８はＳｘ（５）＝Ｓｙ（５）＝４２、Ｘｃ（５）＝Ｙｃ（５）＝１５であることから、Ｚ（５）に転送されるａ０は座標位置（４２，４２）を開始点とした横と縦が９（＝Ｘａ），９（＝Ｙａ）の計８１個のデータで構成され、Ｚ（５）に転送されるｂ０は横と縦が５（＝ＸＢ），５（＝ＹＢ）の計２５個のデータで構成され、またＺ（５）から演算結果としてＭ，ＬあるいはＰに返されるｃ０は座標位置（１５，１５）を開始点とした横と縦が３（＝Ｎｘ），３（＝Ｎｙ）の計９個のデータであることを示している。
【００１７】図９は、ａ０の中でｃ０と対応する画素を白点（○）に正方形（□）の囲みで表示し、また０から２（＝Ｎｘ−１）、０から２（＝Ｎｙ−１）の各ｉ，ｊの組み合わせにおいてｘ，ｙの変化で生成されるＣのＡ、Ｂへのアドレスに対応するＡ，Ｂでの画素位置を太線で、またそれらのアドレスによって読み出される各ａ０，ｂ０のデータＡ１，Ｂ１を、それぞれ黒点（●）と菱点（◇）で表現した。また各ｉ，ｊの組み合わせでのｘ，ｙの変化に先立ち、ＣからＥに出力されるＨの内容も合わせて表示した。
【００１８】図１０は、一つのｉ，ｊの組み合わせに対するＡ，Ｂへのこれらの各５（＝ＸＢ）×５（＝ＹＢ）回の読み出しで得られたデータＡ１（●），Ｂ１（◇）が、Ｄ上でｏ１の演算によって５×５個のデータＤ１（□）に変換され、それらがさらにＥ上でｏ２の演算によって一つのデータＥ１（■）に変換される様子を示している。このＥ１は後にＦやＢＵ３等によって、（Ｘｃ＋ｉ）の値と（Ｙｃ＋ｊ）の値が指定する場所あるいはＰへ転送される。
【００１９】
【発明の効果】点集計型演算は、例えば画像に対する膨張、収縮といった非線形変換や距離変換、スケルトン検出等の処理ではＯＰ１を乗算，ＯＰ２を最大値検出演算、画像の拡大処理ではｂ＝ａとしてＯＰ１をビットごとの排他的論理和、ＯＰ２をビットごとの論理積、そしてエッジ強調、ラプラスフィルタ等のフィルタリング処理や弛緩法に基づく最適化処理（Ｍ．Ｋａｓｓｅｔ．ａｌ．，Ｓｎａｋｅｓ：ＡｃｔｉｖｅＣｏｎｔｏｕｒＭｏｄｅｌｓ，ＩｎｔｅｒｎａｔｉｏｎａｌＪｏｕｒｎａｌｏｆＣｏｍｐｕｔｅｒＶｉｓｉｏｎ，３２１−３３１，１９８８参照）、画像復元（井宮他，多項式の性質を利用した画像記述法，電子通信情報学会技術報告ＰＲＵ−８６−９９）等の処理ではＯＰ１を乗算、ＯＰ２を加算とすることにより、従来では数十行から数ページにも及ぶそれらのプログラムを、数行あるいは数演算程度で表現できる。例えば距離画像を得るための点集計型演算記述は、ａを処理対象画像、ｄｔをａと同サイズで全画素値が０の画像、ｔ３を３×３の全画素値が１画像とすると、下記のように４行で表現できる。
【００２０】

なお、＊＜とは点演算に乗算、集計演算に最小値検出演算を行う点集計型演算子、またｄｔ＋＝ａとは、ｄｔとａの対応する画素同士の加算結果をｄｔの当該対応画素位置に代入する処理を意味する。
【００２１】このように点集計型演算によるプログラム記述は、画像処理のアルゴリズムを大変簡潔に表現できる。これら以外でも、例えば動的計画法に基づくパターンマッチングやＦＦＴ等のようなより高度な処理も、ＯＰ２を関数の形で記述した点集計型演算を用いれば、従来と比べ大変簡潔なプログラム記述が得られる。
【００２２】本発明の演算装置Ｚで構成される画像処理装置Ｙは、点集計型演算のような面型演算記述により大変簡潔に表現された画像処理プログラムをそのまま効率よく実行できる効果を持つ。Ｚは、点演算によく指定される乗算と算術論理演算のために両演算器を備えた点演算部Ｄと、集計演算によく指定される加算、最大値検出演算、そして関数の演算のためにそれらの演算を備えた集計演算部Ｅと、そしてＤ、Ｅの両演算部にオペランドと演算子とを同期して供給するために、画像間の対応点の計算とアドレスの生成、そして命令コードの供給を行う演算制御部Ｃとを組み合わせる構成をとることにより、点集計型演算を効率よく実行できる効果を持つ。そしてＺを２個以上使用して構成される画像処理装置Ｙを用いれば、例えばｃ＝ａ｛ＯＰ１，ＯＰ２｝ｂという点集計型演算記述の計算は、実施例に示したように計算をａのそれぞれの部分画像に対する点集計型演算に分解した上、各Ｚに演算を割り当て、それぞれが演算結果としてｃの部分画像を生成するように処理を進めることが可能となる。その場合Ｙを構成するＺの数を増やせば容易に処理速度の向上という効果が得られる。
【図面の簡単な説明】
【図１】本発明の画像演算装置の構成（点線内が本発明による新規部分）。
【図２】本発明の一部分である演算制御部。
【図３】本発明の一部分である点演算部と集計演算部。
【図４】本発明を用いた画像処理装置の例。
【図５】実施例の画像処理装置内にあるホストプロセッサの構成例。
【図６】実施例のホストプロセッサが発行する起動パケットの構成例。
【図７】実施例での処理の一部を説明した図。
【図８】実施例での処理の一部を説明した図。
【図９】実施例での処理の一部を説明した図。
【図１０】実施例での処理の一部を説明した図。
【図１１】点集計型演算における演算の手順を示した図。
【符号の説明】
なし

【特許請求の範囲】
【請求項１】データａ０，ｂ０を格納するデータ格納手段Ａ，Ｂを有し、ａ０とｂ０からデータｃ０を求め演算結果として出力する演算装置において、計Ｎｘ×Ｎｙ個のデータｃ０の横と縦のデータ数Ｎｘ，Ｎｙ、計Ｘａ×Ｙａ個のデータａ０の横と縦のデータ数Ｘａ，Ｙａ、計ＸＢ×ＹＢ個のデータｂ０の横と縦のデータ数ＸＢ，ＹＢ、ｃ０の先頭データの格納場所を示す横と縦の座標値Ｘｃ，Ｙｃ、そして命令コードｏ１，ｏ２とで構成される起動パケットＫと、ａ０と、ｂ０とを入力とし、ｊを０からＮｙまで１ずつインクリメントし、その各ｊに対しｉを０からＮｘまで１ずつインクリメントし、そしてその各ｉに対し集計演算部Ｅに（Ｘｃ＋ｉ）の値、（Ｙｃ＋ｊ）の値、及びｏ２で構成される起動データＨを出力するとともにｙを０からＹＢまで１ずつインクリメントし、その各ｙに対しｘを０からＸＢまで１ずつインクリメントし、その各ｘに対しＡに（Ｘａ×（ｙ＋ｊ×（Ｙａ−ＹＢ）／（Ｎｙ−１））＋ｘ＋ｉ×（Ｘａ−ＸＢ）／（Ｎｘ−１））の値を持つアドレスＡＤ１、Ｂに（ＸＢ×ｙ＋ｘ）の値を持つアドレスＡＤ２、点演算部Ｄにｏ１を出力する演算制御部Ｃと、ＡＬＵと乗算器とを持ち、ＡからＡＤ１で読み出したデータＡ１、ＢからＡＤ２で読み出したデータＢ１をｏ１に従って演算器を選択して演算し、その結果得られたデータＤ１を出力する点演算部Ｄと、ＣＰＵ、加算器そして最大値検出器とを持ち、ＤからＸＢ×ＹＢ個のＤ１を対象に、必要に応じＨ内の（Ｘｃ＋ｉ）の値、（Ｙｃ＋ｉ）の値を使用しながら、ｏ２に従って選択して処理し、ｃ０を構成する１データを生成する集計演算部Ｅとを有することを特徴とする演算装置。

【図１】