説明

箱状ワーク認識装置および方法

【課題】箱状ワークを対象とし、ワークが密着している場合や荷崩れの場合でもピッキングするワークの位置と姿勢を高い精度で認識することができる箱状ワーク認識装置および方法を提供する。
【解決手段】隣接して荷積みした複数の箱状ワーク1を上方から撮影して全体画像を取得する単眼カメラ11と、複数の箱状ワーク全体の3次元形状を計測する距離センサ12と、全体画像から箱状ワークのエッジ部分を検出し、エッジ部分を境界として3次元形状から各箱状ワークの位置と姿勢を認識し、ピッキングする箱状ワークの位置と姿勢を出力する物体認識処理装置16とを備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、箱状ワーク認識装置および方法に関する。
【背景技術】
【0002】
本出願において、「箱状ワーク」とは、ダンボール箱のように直方体であり、原則として同一物を隣接して荷積みするものをいう。このような、箱状ワークをピッキング対象(ワーク)とし、ワークの把持および搬送を行う場合、従来、ワークの認識を行わず、ピッキングするワークの位置をティーチングし、ロボットでピッキングを行っていた。しかし、この場合、ティーチング位置にワークを並べる必要があり、ずれや荷崩れが生じた場合に対応することができない問題点があった。
そこで、荷積み状態のワークの位置姿勢を認識し、ワークの把持および搬送を行う手段として、特許文献1〜4が既に提案されている。
【0003】
特許文献1は、レーザレーダやステレオカメラなどのセンサを用いて計測した3次元データの中から、登録された形状と似た形状を探索するものである。
【0004】
特許文献2及び特許文献3は、デパレタイズを対象とした認識手法であり、照明装置を取り付け、影を発生させて、エッジを抽出し輪郭を認識する。直方体を仮定しているため、エッジは角にて直交することを利用し、直線にフィッティングを行っている。ステレオカメラなどによる高さ情報を物品選択に利用することや、スリット光を投影して撮像しエッジを得る方法も併用されている。
特許文献4では、荷崩れを検出する方法であり、正しく積載された場合の画像を事前に撮影し、現在の画像との差分を比較して、荷崩れが発生しているかを判断する。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2008−309671号明細書、「物体認識方法および装置」
【特許文献2】特許第3516067号明細書、「デパレタイズ用画像作成方法および画像作成装置」
【特許文献3】特許第3849514号明細書、「物品位置認識装置」
【特許文献4】特開2007−179301号明細書、「物品の荷崩れ検出方法および装置」
【発明の概要】
【発明が解決しようとする課題】
【0006】
上述した特許文献1では、レーザを使用する場合、箱が密着している状態では、箱の隣接部分が平面として得られしまうため、箱の境界が三次元データに反映されず、登録した形状を探索することができない。ステレオカメラを使用する場合は箱に特徴的なテクスチャが必要であるため、無地の箱は認識が難しい。
【0007】
特許文献2及び特許文献3では、対象とする形を直方体のようなものに仮定しているため、箱が荷崩れしている場合のようにエッジが直交しない場合は認識できない。
特許文献4では、荷崩れを判断するのみであり、ピッキングなどは実施していない。また、あらかじめ正しく積載された状態の画像を事前に登録しておく必要があり、積載方法や対象となるワークが変わった場合に対応できない。さらに、バラ積みにも対応できない。
【0008】
本発明は上述した従来の問題点を解決するために創案されたものである。すなわち、本発明の目的は、箱状ワークを対象とし、ワークが密着している場合や荷崩れしている場合でもピッキングするワークの位置と姿勢を高い精度で認識することができる箱状ワーク認識装置および方法を提供することにある。
【課題を解決するための手段】
【0009】
本発明によれば、隣接して荷積みした複数の箱状ワークを上方から撮影して全体画像を取得する単眼カメラと、
前記複数の箱状ワーク全体の3次元形状を計測する距離センサと、
前記全体画像から箱状ワークのエッジ部分を検出し、前記エッジ部分を境界として前記3次元形状から各箱状ワークの位置と姿勢を認識し、ピッキングする箱状ワークの位置と姿勢を出力する物体認識処理装置とを備えた、ことを特徴とする箱状ワーク認識装置が提供される。
【0010】
また、本発明によれば、隣接して荷積みした複数の箱状ワークを上方から撮影して全体画像を取得し、
前記複数の箱状ワーク全体の3次元形状を計測し、
前記全体画像から箱状ワークのエッジ部分を検出し、
前記エッジ部分を境界として前記3次元形状から各箱状ワークの位置と姿勢を認識し、
ピッキングする箱状ワークの位置と姿勢を出力する、ことを特徴とする箱状ワーク認識方法が提供される。
【0011】
本発明の実施形態によれば、前記3次元形状の点群に箱状ワークの異なる面を表すように異なるラベル値を設定し、
前記ラベル値を同一の箱状ワークごとにグループ化し、
各グループ内の点群の情報から、ピッキングする箱状ワークの位置と姿勢を出力する。
【0012】
前記ラベル値は、単眼カメラで得られた画像中のエッジ部分を境界に異なるラベル値を割り当て、
隣接する点群間の距離が閾値以上の箇所を境として異なるラベル値を割り当て、
隣接する点群の法線ベクトル間の角度が閾値以上の部分を境として異なるラベル値を割り当てる。
【0013】
また、各ラベル値の点群から平均の法線ベクトルを求めて、各ラベル値の代表法線ベクトルとし、
各ラベル値の代表法線ベクトルと、隣接するラベル値の代表法線ベクトル間の角度が所定の範囲にあるラベル値をグループ化する。
【0014】
また、箱状ワークの上面面積を予め記憶し、前記各ラベル値に属する点群の占める面積と比較して、各グループから上面に相当するラベルを認識する。
【0015】
或いは、前記各ラベル値に属する点群の占める面積を算出し、これをヒストグラム化して最も投票数の多い面積から上面に相当するラベルを認識する。
【発明の効果】
【0016】
本発明の装置及び方法によれば、単眼カメラによる全体画像から箱状ワークのエッジ部分を検出し、このエッジ部分を境界として距離センサによる3次元形状から各箱状ワークの位置と姿勢を認識するので、箱状ワークが密着している場合や荷崩れの場合でもピッキングするワークの位置と姿勢を高い精度で認識することができる。
【0017】
従って、本発明の装置及び方法により以下の効果が得られる。
(1) ティーチングを必要としないため、単眼カメラの撮影範囲内及び距離センサの計測範囲内に箱状ワークが存在すれば、ワーク毎に位置がずれていてもピッキングができる。
(2) 単眼カメラの全体画像を併用し、エッジが抽出された部分(エッジ部分)に相当する3次元形状の点群データに、その部分が箱の境界であるという情報を与えるので、箱の境界部分を容易に認識できる。距離センサにレーザレーダなどを利用すれば、テクスチャがない場合でも認識できる。また、全体画像と3次元形状のデータ処理のみでピッキングするワークの位置と姿勢の認識を行うため、事前にワーク形状を登録する必要がない。
(3) エッジが直交しているという条件は使用しない。また、3次元データの法線ベクトルの角度を見て認識するため、荷崩れや荷積みのようにエッジが直交しない場合でも認識可能である。
(4) 本発明はワークをピッキングすることを想定している。荷崩れがあるかの判断ではなく、検出したラベルグループに含まれる点群の座標値や法線ベクトルから位置、姿勢を計算してピッキングすることができる。
【図面の簡単な説明】
【0018】
【図1】本発明の箱状ワーク認識装置を備えたピッキングシステムの全体構成図である。
【図2】図1のピッキングシステムの作動フロー図である。
【図3】図2における認識アルゴリズムのフロー図である。
【図4】荷積みした複数の箱状ワークのラベルとそのグループ化の説明図である。
【図5】ヒストグラムによる上面認識の説明図である。
【発明を実施するための形態】
【0019】
以下、本発明の好ましい実施例を図面を参照して説明する。なお、各図において共通する部分には同一の符号を付し、重複した説明を省略する。
【0020】
図1は、本発明の箱状ワーク認識装置を備えたピッキングシステムの全体構成図である。
この図において、1はワーク、2はロボット、3はロボットハンド、4はハンド制御部、5はロボット制御部、6は総括処理部、7はロボット制御装置であり、ロボット制御装置7はロボット制御部5と総括処理部6からなる。
【0021】
ワーク1は、ダンボール箱のような密閉された直方体である。このようなワークを本出願では、「箱状ワーク」又は単に「ワーク」と呼ぶ。
この図において、複数のワーク1は、計測用の台8の上に隣接して密に荷積みされている。計測用台8は、固定されている必要はなく、例えば計測時間が短いなど、後述する3次元形状の計測に支障が生じない限りで、コンベア装置等であってもよい。
【0022】
ロボット2は、例えば多関節3次元ロボットであり、ロボットハンド3を所定のワーキングエリア内で6自由度の位置及び姿勢を制御できるようになっている。なお、ロボット2は、多関節3次元ロボットに限定されず、その他のロボットであってもよい。
ロボットハンド3は、例えば真空による吸着パッド、開閉機構を有する把持装置、或いはこれらの複合装置であり、ピッキングする箱状ワーク1の上面を吸着又は把持して、1つずつ持ち上げ、別の位置まで保持するようになっている。
【0023】
ハンド制御部4は、総括処理部6から受信する把持指令9aに応じてロボットハンド3に制御信号を出力し、ロボットハンド3から位置信号を受信してこれを総括処理部6へ送信する。
なおハンド制御部4は必須ではなくこれを省略し、その機能を総括処理部6に含ませてもよい。
【0024】
ロボット制御部5は、総括処理部6から受信したピッキングする箱状ワークの位置と姿勢に基づき、ロボット2を制御し、ロボットハンド3によりピッキングする箱状ワーク1の上面を吸着又は把持して、1つずつ持ち上げ、別の位置まで保持して搬送する。
【0025】
総括処理部6は、本発明の箱状ワーク認識装置10から受信したピッキングする箱状ワークの位置と姿勢をロボット制御部5に送信する。
【0026】
図1において、本発明の箱状ワーク認識装置10は、単眼カメラ11、距離センサ12、センサ制御部14、及び物体認識処理装置16からなる。
【0027】
単眼カメラ11は、デジタルカメラ(CCDカメラ又はCMOSカメラ)であり、隣接して荷積みした複数の箱状ワーク1を上方から撮影して全体画像を取得する。
【0028】
距離センサ12は、前記複数の箱状ワーク1の全体の3次元形状を計測する。
この例において、距離センサ12は、レーザレーダであり、計測用台8の上方に位置し、複数の箱状ワーク1の3次元形状を上方から計測する。また、距離センサ12の高さ及び姿勢を制御する移動・回転機構13(例えば直動テーブルや回転テーブル)を備え、距離センサ12の姿勢を自由に変え、視野を調節できるようになっている。
例えば、対象が小さいときに近づいて計測し、対象が大きいときに遠ざかって計測して、視野を適正化するようになっている。
【0029】
なお、距離センサ12は、レーザレーダに限定されず、ワークまでの距離を検出できるように、一定の間隔を隔てたステレオカメラであってもよい。
【0030】
センサ制御部14は、物体認識処理装置16から姿勢制御信号9bを受信しこの信号を距離センサ12に出力して距離センサ12の高さ及び姿勢を制御し、かつ距離センサ12で計測した複数の箱状ワーク1の3次元形状(センサデータ9c)を受信し、物体認識処理装置16に送信する。
なおセンサ制御部14は必須ではなくこれを省略し、その機能を物体認識処理装置16に含ませてもよい。
【0031】
物体認識処理装置16は、単眼カメラ11による全体画像から箱状ワーク1のエッジ部分を検出し、このエッジ部分を境界として距離センサ12による3次元形状から各箱状ワーク1の位置と姿勢を認識し、ピッキングする箱状ワークの位置と姿勢をロボット制御装置7に出力する。
物体認識処理装置16は、この例ではPC(コンピュータ)である。なお、上述したロボット制御装置7(ロボット制御部5と総括処理部6)、及びセンサ制御部14を同一のPCで構成しても、それぞれ独立のPCで構成してもよい。
【0032】
図2は、図1のピッキングシステムの作動フロー図である。
この図において、このピッキングシステムは、S1〜S6の各ステップ(工程)からなる。
【0033】
ステップS1では、計測する対象(箱状ワーク1)が単眼カメラ11と距離センサ12の視野(計測範囲)に適切に入るように単眼カメラ11と距離センサ12の高さと姿勢を調整する。適切とはワーク1の全体が視野内に入り、かつ、十分な大きさで写っており、以後の認識処理に対応できる解像度をもつことである。姿勢の調整方法はフィードバックなどによる自動調整によるのが好ましいが、手動によってもよい。
【0034】
ステップS2では、距離センサ12により3次元形状を取得する。ここでの3次元形状は3次元座標を持つ各点が集合した点群を想定している。
【0035】
ステップS3では、単眼カメラ11により、隣接して荷積みした複数の箱状ワーク1を上方から撮影して全体画像を取得する。
なお、ステップS2とステップS3は、順序が逆でも、同時でもよい。
【0036】
ステップS4では、全体画像から箱状ワークのエッジ部分を検出し、このエッジ部分を境界として3次元形状から各箱状ワークの位置と姿勢を認識する。
ステップS5では、統括処理部に認識の結果から必要な情報を送る。必要な情報とは認識した物体の数や、各認識した物体の位置、姿勢情報などである。
【0037】
ステップS6では、統括処理部はピッキングするワークを、ロボット制御部とハンド制御部を通じてロボットとハンドを制御し、指定した座標の点でピッキングする。
【0038】
図3は、図2における認識アルゴリズムのフロー図である。
この図において、認識アルゴリズムは、T1〜T12の各ステップ(工程)からなる。
【0039】
ステップT1では、距離センサ12で取得した複数の箱状ワーク全体の3次元形状のノイズ除去を、例えばメディアンフィルタなどで行う。このステップは省略してもよい。
ステップT2では、3次元形状のマスキングを行い、ワーク外の位置にある点群や地面に相当する点群を除去する。このステップは必須ではなく、省略してもよい。
ステップT3では、単眼カメラ11による全体画像から箱状ワーク1のエッジ部分1aを検出する。この場合、無地の箱を想定するなら、検出されたエッジをそのまま利用してもよい。また、箱の面に模様などがあるならば直線のエッジを抽出する。
【0040】
ステップT4では、単眼カメラ11の位置、距離センサ12の位置を利用して全体画像中のエッジ部分1aに対応する3次元の点群を抽出する。
単眼カメラ11と距離センサ12の位置が既知であれば、画像上のある点(例えばエッジ部分1a)は、カメラ位置と画像上の点とを結ぶ直線と、3次元形状とが交差する点を抽出すればよい。
【0041】
図4は、荷積みした複数の箱状ワークのラベル(A)とグループ化(B)の説明図である。
図4(A)は、下段5個、上段4個、計9個の箱状ワーク1が、隣接して密に積層され、上段の1個の箱状ワーク1が荷崩れしている状態を示している。
この図において、黒丸(●)は、距離センサ12による3次元形状の計測点、白丸(○)は、距離センサ12による3次元形状の計測点であり、かつエッジ部分1aに対応する3次元の点群である。この図に示すように、エッジ部分1aに対応する3次元の点群は、エッジに隣接して1つ又は2つが存在する。
【0042】
ステップT5では、抽出されたエッジ部分1aに対応する3次元の点群にエッジに隣接することを意味するフラグを振る。例えば、距離センサ12による3次元形状の計測点の座標値(x、y、z)と共にフラグeを記憶する。フラグeは、例えば0(エッジ部分以外)と1(エッジ部分)である。
【0043】
ステップT6では、計測データ(3次元形状)の隣接する計測点との距離を利用してメッシュ(例えば3角メッシュ)を生成する。このメッシュ生成は、隣接する計測点との距離を利用することで、最適なメッシュをはることができる。これにより、3次元形状を3Dで把握することができる。
【0044】
図4(A)において、条件1,2,3は、ラベル値の設定(ラベリング)の条件を模式的に示している。
ステップT7では、以下の条件1〜3により、各点群にラベル値を設定する。
条件1:隣接する点にフラグが振られている場合は、異なるラベル値を割り当てる。
条件2:隣接する点の距離が閾値以上の点は異なるラベル値を割り当てる。
条件3:隣接する点の法線ベクトル間の角度の差が閾値以上の点は異なるラベル値を割り当てる。
【0045】
すなわち、順次各点をスキャンし、隣接する点との距離、法線ベクトル、フラグを確認し、隣接する点が条件1〜3のいずれかを満たせば、隣接する点と異なるラベル値を割り当て、そうでなければ同じラベル値を割り当てる。
ここで、ラベル値は、任意の数字または記号である。
【0046】
図4(B)は、ステップT7によるラベル値1〜7とそのグループ化を示している。
ステップT8では、極端にラベル値の大きいものや小さいものを除去する。すなわち、不必要なラベル値を除去する。なお、このステップは不可欠ではない。また、ラベル値の大きさ以外で判断してもよい。
この時点で、各ラベル値が箱(箱状ワーク)の面を表す。すなわち、図4(B)では、1〜7の7面が検出されている。
【0047】
ステップT9では、得られたラベル値に属する点群の法線ベクトルの平均を求め、各ラベル値に属する点群の代表の法線ベクトルとする。このステップでは、箱状ワークの面の向きを計算していることになる。
図4(B)における矢印は、代表の法線ベクトルを示している。
【0048】
ステップT10では、隣接するラベル値の代表法線ベクトル間の角度が90度程度であれば、同一のグループに含める。ただし、お互いの法線ベクトルが外側を向いていることが条件となる。
この時点で各グループが各ワーク(箱状ワーク)を表す。
図4(B)において、ラベル値5,6の法線ベクトル間の角度が90度なのでグループ化する。
ラベル値4,5の法線ベクトルは内側に向いているので、グループ化しない。
ラベル値6,7の法線ベクトルも内側に向いているので、グループ化しない。
【0049】
なおこの例のように、法線ベクトルの角度を利用せず、画像上の陰影による色の違いを利用してラベリングしてもよい。
【0050】
ステップT11では、箱状ワーク1の上面を認識する。
上面を認識する手段として、以下が挙げられるが、本発明はこれに限定されない。
(1)あらかじめ上面の面積を登録しておく。
各点群は3次元座標を持っている。従って、各ラベルのXY座標の最大値、最小値から各面の面積を算出することができる。これを事前に登録した面積と比較し、認識する。この手段は、主に姿勢がばらばらに積まれている状態に適する。
(2)ラベル内に含まれる点群の数をヒストグラム化し上面を認識する。
ひどい荷崩れが頻繁に起きなければ、多くの箱は上面が見えている。そこでワークが搬送されて最初の認識にて、各ラベルに含まれる点群の座標値から面積を算出し、図5のようにヒストグラム化し、もっとも数の多い面を上面とする。
【0051】
ステップT12では、得られたグループ内の点群からピッキングする箱状ワーク1の重心位置や姿勢など、その箱状ワーク1のピッキングに必要な情報(認識結果)を統括処理部6に出力する。
【0052】
上述した本発明の装置及び方法によれば、単眼カメラ11による全体画像から箱状ワーク1のエッジ部分1aを検出し、このエッジ部分1aを境界として距離センサ12による3次元形状から各箱状ワーク1の位置と姿勢を認識するので、箱状ワーク1が密着している場合や荷崩れの場合でもピッキングするワークの位置と姿勢を高い精度で認識することができる。
【0053】
従って、本発明の装置及び方法により以下の効果が得られる。
(1) ティーチングを必要としないため、単眼カメラ11の撮影範囲内及び距離センサ12の計測範囲内に箱状ワーク1が存在すれば、ワーク毎に位置がずれていてもピッキングができる。
(2) 単眼カメラ11の全体画像を併用し、エッジが抽出された部分(エッジ部分1a)に相当する3次元形状の点群データに、その部分が箱の境界であるという情報を与えるので、箱の境界部分を容易に認識できる。距離センサ12にレーザレーダなどを利用すれば、テクスチャがない場合でも認識できる。また、全体画像と3次元形状のデータ処理のみでピッキングするワークの位置と姿勢の認識を行うため、事前にワーク形状を登録する必要がない。
(3) エッジが直交しているという条件は使用しない。また、3次元データの法線ベクトルの角度を見て認識するため、荷崩れやばらばらに積まれている状態のようにエッジが直交しない場合でも認識可能である。
(4) 本発明はワークをピッキングすることを想定している。荷崩れがあるかの判断ではなく、検出したラベルグループに含まれる点群の座標値や法線ベクトルから位置、姿勢を計算してピッキングすることができる。
【0054】
なお、本発明は上述した実施の形態に限定されず、本発明の要旨を逸脱しない範囲で種々の変更を加え得ることは勿論である。
【符号の説明】
【0055】
1 ワーク(箱状ワーク)、1a エッジ部分、
2 ロボット、3 ロボットハンド、
4 ハンド制御部、5 ロボット制御部、
6 総括処理部、7 ロボット制御装置、
8 計測用台、
10 箱状ワーク認識装置、
12 距離センサ、13 移動・回転機構、
14 センサ制御部、16 物体認識処理装置

【特許請求の範囲】
【請求項1】
隣接して荷積みした複数の箱状ワークを上方から撮影して全体画像を取得する単眼カメラと、
前記複数の箱状ワーク全体の3次元形状を計測する距離センサと、
前記全体画像から箱状ワークのエッジ部分を検出し、前記エッジ部分を境界として前記3次元形状から各箱状ワークの位置と姿勢を認識し、ピッキングする箱状ワークの位置と姿勢を出力する物体認識処理装置とを備えた、ことを特徴とする箱状ワーク認識装置。
【請求項2】
隣接して荷積みした複数の箱状ワークを上方から撮影して全体画像を取得し、
前記複数の箱状ワーク全体の3次元形状を計測し、
前記全体画像から箱状ワークのエッジ部分を検出し、
前記エッジ部分を境界として前記3次元形状から各箱状ワークの位置と姿勢を認識し、
ピッキングする箱状ワークの位置と姿勢を出力する、ことを特徴とする箱状ワーク認識方法。
【請求項3】
前記3次元形状の点群に箱状ワークの異なる面を表すように異なるラベル値を設定し、
前記ラベル値を同一の箱状ワークごとにグループ化し、
各グループ内の点群の情報から、ピッキングする箱状ワークの位置と姿勢を出力する、ことを特徴とする請求項2に記載の箱状ワーク認識方法。
【請求項4】
前記ラベル値は、
単眼カメラで得られた画像中のエッジ部分を境界に異なるラベル値を割り当て、
隣接する点群間の距離が閾値以上の箇所を境として異なるラベル値を割り当て、
隣接する点群の法線ベクトル間の角度が閾値以上の部分を境として異なるラベル値を割り当てる、ことを特徴とする請求項3に記載の箱状ワーク認識方法。
【請求項5】
各ラベル値の点群から平均の法線ベクトルを求めて、各ラベル値の代表法線ベクトルとし、
各ラベル値の代表法線ベクトルと、隣接するラベル値の代表法線ベクトル間の角度が所定の範囲にあるラベル値をグループ化する、ことを特徴とする請求項3に記載の箱状ワーク認識方法。
【請求項6】
箱状ワークの上面面積を予め記憶し、前記各ラベル値に属する点群の占める面積と比較して、各グループから上面に相当するラベルを認識する、ことを特徴とする請求項5に記載の箱状ワーク認識方法。
【請求項7】
前記各ラベル値に属する点群の占める面積を算出し、これをヒストグラム化して最も投票数の多い面積から上面に相当するラベルを認識する、ことを特徴とする請求項5に記載の箱状ワーク認識方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate


【公開番号】特開2010−247959(P2010−247959A)
【公開日】平成22年11月4日(2010.11.4)
【国際特許分類】
【出願番号】特願2009−99573(P2009−99573)
【出願日】平成21年4月16日(2009.4.16)
【出願人】(000000099)株式会社IHI (5,014)
【Fターム(参考)】