説明

識別装置及び識別プログラム

【課題】検出処理を高速化する。
【解決手段】識別装置10は、入力データの特徴量を生成する特徴量生成部3と、特徴量が第1閾値と第2閾値とで挟まれた所定範囲内に存在するか否かを判定する判定部4と、検出対象と非検出対象との識別性能が高いほど重みが大きくなるように設定された重み設定部5とを備えた弱識別器2と、弱識別器2を複数備え、各弱識別器2における特徴量の判定結果と重みとの積算値の線形和に基づいて入力データが検出対象であるか否かを識別する強識別器1とを有する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像データに検出対象が含まれるか否かを識別する識別装置及び識別プログラムに関する。
【背景技術】
【0002】
画像からの物体検出において、デジタルカメラにおける顔検出や、自動車の運転支援における歩行者検出など、オンライン処理が必要とされる分野では、検出の正確さとともに識別処理の高速性も要求される。しかしながら、一般的に識別性能が高い識別装置ほど計算量が多い傾向があるため、この2つの要求を同時に満たすことは困難である。
【0003】
パターン認識を用いて画像から検出対象を高速に検出する方法に関して、識別性能の低い複数の弱識別器を組み合わせることにより識別性能の高い強識別器を構成する技術が提案されている。
【0004】
非特許文献1においては、複数の弱識別器を直列に並べることにより構成された強識別器が開示されている。この強識別器は、弱識別器毎にその出力と閾値との大小比較により顔と非顔とを識別し、いずれかの弱識別器で非顔と識別された領域の入力データについては、それより後段の弱識別器の処理を省略する。これにより、画像のほとんどの領域が非顔領域であるため、このようなカスケード構造の識別器を用いることで、検出処理を高速化することが可能になっている。また、特許文献1には、弱識別器の類似度の中で最も低い類似度を弱識別器の閾値に設定することによって、検出処理を高速化する構成が開示されている。
【先行技術文献】
【特許文献】
【0005】
【非特許文献1】Paul Viola and Michael Jones, “Rapid Object Detection using a Boosted Cascade of Simple Features,”Proc. of CVPR2001, vol.1, pp. 511-518, 2001.
【特許文献1】特開2010−77062号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
ところで、複数の弱識別器を組み合わせて強識別器により画像を識別する技術分野においては、検出処理の高速化が極めて重要である。従って、上記従来の構成よりも検出処理を高速化できる識別装置が望まれている。
【0007】
本発明は、検出処理を高速化できる識別装置及び識別プログラムを提供することを目的とする。
【課題を解決するための手段】
【0008】
本発明は、識別装置であって、入力データの特徴量を生成する特徴量生成部と、前記特徴量が第1閾値と第2閾値とで挟まれた所定範囲内に存在するか否かを判定する判定部と、検出対象と非検出対象との識別性能が高いほど重みが大きくなるように設定された重み設定部とを備えた弱識別器と、前記弱識別器を複数備え、前記各弱識別器における特徴量の判定結果と重みとの積算値の線形和に基づいて、前記入力データが検出対象であるか否かを識別する強識別器とを有する。
【0009】
上記の構成によれば、検出対象の特徴量の確率分布と非検出対象の特徴量の確率分布とを比較した場合、非検出対象の特徴量の両側確率が検出対象の特徴量の両側確率よりも大きいという関係が一般的である。従って、第1閾値と第2閾値とで挟まれた所定範囲を基準にして特徴量の存在の有無を判定すると、所定範囲内において検出対象の入力データが多く含まれる一方、所定範囲外、即ち、第1閾値未満の下側領域と第2閾値を超えた上側領域とにおいて非検出対象の入力データが多く含まれることになる。この結果、従来のように、一つの閾値で区切られた一方側の領域と他方側の領域とを用いて入力データが検出対象であるか否かを判定する場合よりも、識別を有効に行える領域を多く確保できることから、各弱識別器の識別性能をそれぞれ高めることができる。これにより、少ない数量の弱識別器で高い性能を持った強識別器を得ることができ、ひいては検出処理を高速化することができる。
【0010】
また、本発明における前記強識別器は、前記弱識別器の弱識別器集合部を複数段で直列配置し、前段の弱識別器集合部において検出対象であると識別した入力データだけを、後段の弱識別器集合部における検出対象の識別に用いてもよい。
【0011】
上記の構成によれば、識別性能が高められた弱識別器を各段の弱識別器集合部に備えているため、特に検出対象の識別を開始した初期において、検出対象でない非検出対象の入力データを多く排除することができるため、入力データが検出対象であるか否かの識別である識別処理を短時間で完了することができる。
【0012】
また、本発明における前記弱識別器における前記重み設定部は、前記検出対象である複数のポジティブ学習データと、非検出対象である複数のネガティブ学習データとを前記入力データとしたアダブースト(Adaboost)の学習アルゴリズムによって、前記重みが設定されていてもよい。
【0013】
上記の構成によれば、各弱識別器における重みを容易且つ短時間で設定することができる。
【0014】
また、本発明における前記弱識別器における前記判定部は、非検出対象の特徴量の下側確率が前記検出対象の特徴量の下側確率よりも大きくなる交点を前記第1閾値とし、前記非検出対象の特徴量の上側確率が前記検出対象の特徴量の上側確率よりも大きくなる交点を前記第2閾値としていてもよい。
【0015】
上記の構成によれば、第1閾値及び第2閾値を容易に設定することができる。
【0016】
また、本発明は、識別プログラムであって、入力データが入力される入力部、記憶部及び出力部を備えたコンピュータを、前記入力データの特徴量を生成する特徴量生成手段、前記特徴量が第1閾値と第2閾値とで挟まれた所定範囲内に存在するか否かを判定する判定手段、及び検出対象と非検出対象との識別性能が高いほど重みが大きくなるように設定される重み設定手段を備えた複数の弱識別手段、 前記各弱識別手段における前記特徴量の判定結果と重みとの積算値の線形和に基づいて、前記入力データが前記検出対象であるか否かを識別する強識別手段として機能させる。
【0017】
上記の構成によれば、コンピュータを備えた情報処理装置に対して識別プログラムをインストールするという簡単な作業により識別装置を構築することができる。
【発明の効果】
【0018】
本発明は、検出処理を高速化できる。
【図面の簡単な説明】
【0019】
【図1】識別装置における学習モード及び識別モードを示す説明図である。
【図2】矩形ペアの説明図であり、(A)は第1矩形が第2矩形に含まれた状態、(B)は第1矩形と第2矩形との一部同士が重複した状態、(C)は第1矩形と第2矩形とが完全に離反した状態である。
【図3】弱識別器として選択された矩形ペアの説明図である。
【図4】第1閾値及び第2閾値を示す説明図である。
【図5】超平面と弱識別器との関係示す説明図である。
【図6】カスケード構造のブロック図である。
【図7】ウインドウ内の画像と弱識別器との関係を示す説明図である。
【図8】顔画像領域の模式図である。
【図9】顔画像領域の模式図である。
【図10】学習モード処理ルーチンのフローチャートである。
【図11】弱識別器候補準備処理ルーチンのフローチャートである。
【図12】近傍探索処理ルーチンのフローチャートである。
【図13】強識別器構築処理ルーチンのフローチャートである。
【図14】強識別処理ルーチンのフローチャートである。
【図15】遊技媒体貸出装置(サンド)を併設したパチンコ機を示す正面図である。
【発明を実施するための形態】
【0020】
(識別装置10)
本発明の実施形態を図面に基づいて説明する。
本実施形態に係る識別装置10は、図1に示すように、複数の弱識別器2を学習データにより学習させて強識別器1を生成する学習モードと、強識別器1により入力データを識別する識別モードとに切り替え可能にされている。識別装置10は、強識別器1と、強識別器1を構成する複数の弱識別器2とを備えている。各弱識別器2は、入力データの特徴量を生成する特徴量生成部3と、特徴量が第1閾値と第2閾値とで挟まれた所定範囲内に存在するか否かを判定する判定部4と、検出対象と非検出対象との識別性能が高いほど重みが大きくなるように設定された重み設定部5とを備えている。そして、強識別器1は、各弱識別器2における特徴量の判定結果と重みとの積算値の線形和に基づいて、入力データが検出対象であるか否かを識別するようになっている。
【0021】
ここで、『学習データ』は、検出対象である複数のポジティブ学習データと、非検出対象である複数のネガティブ学習データとが予め準備されたサンプルデータである。例えば、検出対象が人物の顔であれば、人物の顔の画像データがポジティブ学習データとなり、人物の全身や腕、他の動物、建物等の人物の顔以外の画像データがネガティブ学習データとなる。
【0022】
(学習アルゴリズム)
『学習』は、ポジティブ学習データ及びネガティブ学習データを用いて弱識別器2に重みを付ける処理である。重み付けのための学習アルゴリズムとしては、特に限定されるものではないが、Adaboostアルゴリズムが例示される。Adaboostアルゴリズムの概要を説明すると、先ず、弱識別器候補(学習前の弱識別器2)が作成される。この後、学習データ(特徴量とクラス)への重みがサンプル数Nで初期化1/Nされることによって、全学習データが同一の重み付けに設定される。各学習データにおいて、学習データのクラスと弱識別器候補の出力クラスが一致しない学習データの重みが積算されることによって、各弱識別器候補の誤り率が求められる。誤り率が小さいほど信頼度が大きくなるように、学習データの重みが更新される。即ち、学習データの重みは、弱識別器候補が正しく識別できた学習データについては重みが小さくなるように更新される一方、弱識別器候補が間違って識別した学習データについては重みが大きくなるように更新される。この後、学習データの重みの和が1になるように正規化されることによって、1個の弱識別器候補が作成される。このような弱識別器候補の作成が繰り返して行われた後、全数や所定個数の弱識別器候補が弱識別器2として選択される。
【0023】
(特徴量)
『特徴量』は、画像データを数値化したものであり、他の特徴量と比較することより類似度を求めることができるものであれば、特に限定されない。例えば、Haar−like特徴の場合、検出対象か非検出対象かを判定するために、白矩形領域における平均輝度値と黒矩形領域における平均輝度値との差を用いた特徴量となる。この場合には、Integral Image の利用により高速演算が可能になる。
【0024】
(弱識別器2・弱識別器候補)
弱識別器2と弱識別器候補とは、学習前の弱識別器2が弱識別器候補である関係であり、重みの状態を除いて同一である。弱識別器2及び弱識別器候補は、Violaらが提案した構成と同様に、2矩形からなる特徴、3矩形からなる特徴、4矩形からなる特徴であってもよいし、画素高次元空間内での自由度を最大限に取りながら、且つ判定を高速化するため、2矩形領域の明度差のみを取り扱う構成であってもよい。
【0025】
例えば、所定画素数のウインドウを設定し、このウインドウの中に顔画像が入っているかどうかという課題が与えられた場合において、それぞれの画素の輝度値を独立変数とする高次元空間を考えたとき、Haar−like弱識別器で定義される半空間を区切る超平面集合は、全超平面集合のごく一部に過ぎないことがわかる。尚、超平面集合等についての説明は後述する。従って、高次元空間内の有限領域を占めていると予想されるポジティブ領域に対して、より効果的にネガティブ領域と区切る境界を設定するためのHaar−like弱識別器の制約は、探索空間が膨大にならない手法が別に用意できれば必要いことが予想される。
【0026】
Violaらは、2矩形からなる特徴、3矩形からなる特徴、4矩形からなる特徴を使用したが、上記予想からHaar−likeである必然性は不要であると認識される。従って、以下の条件のみが2矩形領域の組み合わせに課されたものでもよい。2つの矩形領域がそれぞれ、(1)検出ウインドウ内部に含まれること、(2)互いに完全に重ならないことの2条件を満たす全ての矩形の組み合わせを弱識別器候補とすることができる。考えられる矩形ペアの例を図2(A)〜(C)に示す。図2(A)は第1矩形31が第2矩形32に含まれた状態である。図2(B)は第1矩形31と第2矩形32との一部同士が重複した状態である。図2(C)は第1矩形31と第2矩形32とが完全に離反した状態である。
【0027】
上記の手法を使って正面顔画像をポジティブサンプルとして学習し、最も識別力が高い弱識別器として選択された矩形ペアの例を図3に示す。外側の矩形は両目と口を含むため相対的に暗く、内側の矩形は両目と口を含まないため相対的に明るくなる。両目も口も、ほとんどの光源環境で陰になる部分が発生するため、常に周囲より暗い。一方、矩形領域内のどこかしらが明るくなるため、完全に暗くなることもない。従って、2つの矩形の明度差は、或る値以上から或る値以下の範囲に収まることになり、2つの閾値で判定する事で精度を上げることができる。
【0028】
Viola−Jonesの方法では、24×24画素で識別器を構成すると弱識別器候補数は18万を越えるが、さらに制限を緩めた2矩形領域の組み合わせ方法では、弱識別器候補数はさらに増大する。例えば、24×24画素で39億個以上になる。そこで、計算時間の短縮のため発見的方法を適用してもよい。具体的には、弱識別器候補の矩形サイズや位置の変化量を1画素毎ではなく、例えば3画素毎にする。これにより24×24画素で36万個にまで弱識別器候補数が減ることになる。この大幅な省略によって識別力の高い矩形ペアが候補の中から漏れる可能性が出てくるが、近傍探索で、より識別力の高い矩形ペアを発見すればよい。
【0029】
最初に用意した弱識別器候補の中からブースティングアルゴリズムに従って最もよいものを選択した後、その候補の矩形幅、矩形位置などのパラメータをわずかに変更した弱識別器候補群を生成し、なんらかの局所探索手法(例えば山登り法)により、最もよいものを発見し、選び直すことで最適に近い性能の弱識別器候補を発見する。
【0030】
矩形の中の画素全体の輝度値平均を取るという操作のため、矩形の大きさがある程度大きければ、わずかに係数を変化させただけの矩形間の輝度値は大きく違わない事が期待できると共に、識別器性能も比較的滑らかに変化することが期待できるため、この近傍探索はうまく働くと予想される。
【0031】
局所探索の際に変更可能なパラメータは以下のものがある
1. 2つの閾値d1・d2
2. 白矩形X,Y座標
3. 白矩形横幅Xw、縦幅Yw
4. 黒矩形座標
5. 黒矩形横幅、縦幅
ここで、「白矩形」及び「黒矩形」は便宜的な呼称であり、例えば、基準座標が左にあるものを「白矩形」、右にあるものを「黒矩形」と呼ぶ(X座標が同一の場合は、上にあるものを「白矩形」、下にあるものを「黒矩形」と呼ぶ)。どちらの矩形の明度が高いかは呼称と無関係に実際のポジティブサンプルの分布で決定され、閾値d1・d2の値に反映される。
【0032】
(第1閾値、第2閾値)
『第1閾値、第2閾値』は、図4に示すように、2つの矩形領域のそれぞれの明度総和の差の分布である正規分布の一方側(下側領域)と他方側(上側領域)とに設けた閾値である。第1閾値は、非検出対象の特徴量の下側確率が検出対象の特徴量の下側確率よりも大きくなる交点であり、第2閾値は、前記非検出対象の特徴量の上側確率が前記検出対象の特徴量の上側確率よりも大きくなる交点であってもよい。この場合には、第1閾値及び第2閾値を容易に設定することができる。尚、弱識別器2の出力h(x)は、第1識別値θ1から第2閾値θ2の範囲に特徴量xが存在すれば、“1”となり、存在しなければ“0”となる。
【0033】
第1閾値及び第2閾値は、下記の方法により求められてもよい。尚、以後の説明では、弱識別器2を直列配置したカスケード構造を採用した場合の閾値の決定方法を説明するが、カスケード構造以外の構造においても、カスケード初段及びカスケード2段目以降の決定方法を調整前の初期値の決定方法として採用してもよい。カスケード構造の詳細については後述する。
【0034】
カスケード初段の場合、弱識別器のポジティブ入力画像のほとんど(3σ以内=99.73%)がポジティブ判定される位置(ベルカーブの両側)に閾値を設定する。平均と分散を求めた後、正規分布を仮定して設定する。具体的には、ポジティブ学習画像における矩形ペアの明度差分布の算術平均μ、分散σとするとき、第1閾値dp1及び第2閾値dp2は、下記の関係式で示される。
【0035】
p1 = μ− 3σ
p2 = μ+ 3σ
【0036】
また、カスケード2段目以降は、ネガティブ学習画像の明度差分布と、ポジティブ学習画像の明度差分布とをそれぞれ正規分布と仮定して、正規分布曲線同士の交点を、第1閾値dp1及び第2閾値dp2の初期値に設定する。ただし、その値がそのまま使われることはなく、その後、adaBoost学習ループ中で、山登り法によりadaBoostの重み付き損失が小さくなる閾値に変更する事で閾値を調整する。尚、ポジティブ学習画像における矩形ペアの明度差分布の算術平均μ、分散σとし、ネガティブ学習画像における矩形ペアの明度差分布の算術平均μ、分散σとすると、2つの正規分布曲線の交点は下式で求めることができる。
【0037】

とおいて、xについて展開すると下式のように二次方程式になるので、これを解く。
【0038】
第1閾値及び第2閾値は、カスケード構造の後段を含むすべての弱識別器2に適用されている。これにより、斜め顔識別を有効に行うことが可能になっている。この理由は、矩形検出ウインドウ内の画素を要素とする高次元ベクトル空間を考えた時、Vioraらの制約を持つ矩形弱識別器では顔画像領域を両側から挟みこむことで、効率的にネガティブ画像を排除できる超平面の組み合わせが尽きたのではないかと推測される。即ち、図5に示すように、許される超平面のペアがa領域であるとすると、制約を緩めることで、1閾値弱識別器より識別力がある2閾値弱識別器が後段でも見つかるようになったということではないかと推測される(図5のb領域)。
【0039】
具体的に説明すると、制約を緩めたイメージを図5の模式図で示した場合において、このイメージの検出ウインドウ内の全ての画素の輝度値を独立変数とする高次元空間を考える。このとき、傾き45°の倍数の境界面しか設定できないという制約があった場合は見つからなかったが、それ以外の角度も許すことで新たなb領域の2閾値弱識別器が見つかるというものである。尚、Lienhartらの論文では白矩形領域と黒矩形領域の明度差を求める際に各矩形領域の明度合計を面積比で補正するため、高次元空間での境界面の傾きは面積比で固定される(図中のa境界ペア)。一方、本実施形態においては、山登り法で白矩形領域と黒矩形領域の補正係数を変更しているため、図中のb境界ペアも2閾値弱識別器として採用されるようになっている。
【0040】
以上のように、識別装置10は、特徴量が第1閾値と第2閾値とで挟まれた所定範囲内に存在するか否かを判定する弱識別器2を備えている。検出対象の特徴量の確率分布と非検出対象の特徴量の確率分布とを比較した場合、非検出対象の特徴量の両側確率が検出対象の特徴量の両側確率よりも大きいという関係が一般的である。従って、第1閾値と第2閾値とで挟まれた所定範囲を基準にして特徴量の存在の有無を判定すると、所定範囲内において検出対象の入力データが多く含まれる一方、所定範囲外、即ち、第1閾値未満の下側領域と第2閾値を超えた上側領域とにおいて非検出対象の入力データが多く含まれることになる。この結果、従来のように、一つの閾値で区切られた一方側の領域と他方側の領域とを用いて入力データが検出対象であるか否かを判定する場合よりも、識別を有効に行える領域を多く確保できることから、各弱識別器2の識別性能をそれぞれ高めることができる。これにより、少ない数量の弱識別器2で高い性能を持った強識別器1を得ることができ、ひいては検出対象の検出処理を高速化することができる。
【0041】
(カスケード構造)
また、図6に示すように、識別装置10における強識別器1は、カスケード構造にされている。具体的には、強識別器1は、弱識別器2の1以上の弱識別器集合部21を複数段で直列配置し、前段の弱識別器集合部21において検出対象であると識別した入力データだけを、後段の弱識別器集合部21における検出対象の識別に用いる構成にされている。尚、識別装置1は、カスケード構造以外の構成にされていてもよい。
【0042】
これにより、強識別器1は、第1閾値及び第2閾値により識別性能が高められた弱識別器2を各段の弱識別器集合部21に備えているため、特に検出対象の識別を開始した初期(初段側)において、検出対象でない非検出対象の入力データを多く排除することができるため、入力データが検出対象であるか否かの識別を短時間で完了することができる。
【0043】
(高次元空間による2閾値を備えた弱識別器2の説明)
Haar−like弱識別器2の役割は、各画素を直行成分とする高次元のベクトル空間を超平面で仕切ることに等しい。
n画素で構成されるポジティブ画像
Pk=(Pk, Pk, Pk,・・・Pk
n画素で構成されるネガティブ画像
Nk=(Nk, Nk, Nk,・・・Nk
ポジティブ画像集合は、この高次元空間内で連結された有限領域を占めることが予想される。ポジティブ画像集合が有限な連結領域で囲まれるなら、Haar−like弱識別器2に2つの平行な超平面で挟み込むことができる。従って、Haar−like弱識別器2に2つの閾値を設定することが合理的である。Haar−like弱識別器2を複数組み合わせることで、ポジティブ画像連結領域を凸包で囲むことになる。
【0044】
尚、カスケード後段になると、ポジティブ画像連結領域を囲む凸包の内側に入り込んだネガティブ画像が多くなってくるため、2つの平行な超平面で囲むことは困難になってくる。そのため、弱識別器2の識別能力が或る程度以下に悪化したら、2つの閾値から1つの閾値へ切り替えてもよい。
【0045】
ここで、『2つの平行な超平面で挟み込むことができる』とは、例えば図7に示すように、横16画素×縦16画素=256画素のウインドウを設定し、このウインドウの中に顔画像が入っているかどうかという課題の場合において、このウインドウに顔が入っていれば右目のあたりになるX69、X70、X71の3画素で作られた□■□型のHaar−like弱識別器2の判定式は以下のようになる。
【0046】
(X69+X71)−2X70 > d (1)
ここで、256画素それぞれの輝度値を独立変数とする256次元空間を考える。
V=(X, X, ... X256
この空間Vを超平面で二つに分けたときの半空間の一般式は、下式のようになる。
【0047】
+A+…A256256 ≧ d (2)
(1)式は(2)式の特殊な形である。(A= A=…A68=0, A69=1, A70=−2, A71=1, A72=A73=... A256=0, d=d)
つまり、画素の輝度値を独立変数とする256次元空間Vを考えた場合、Haar−like弱識別器2はVを超平面で仕切る半空間として与えられることになる。
このときの超平面は下式で示される。
【0048】
+A+…A256256=d (3)
この超平面に平行な超平面は下式で示される。
+A+…A256256=d´ (d´≠d) (4)
2閾値を備えた弱識別器2は、例えば(1)式で与えられるHaar−like弱識別器2を下式のように拡張したものである。
【0049】
≧(X69+X71)−2X70 ≧d (5)
(5)式は互いに平行な二枚の超平面で区切られた内側の領域を示す。図8に部分空間(X69,X70,X71)における顔画像領域の模式図を示す。雲状に示した黒い領域が真の顔画像と想定される領域、ストライプで示した二枚の平面が(5)式で定義される弱識別器2が判定する顔画像領域の境界面になる。
【0050】
図8を256次元空間全体に拡張して考えると、X69、X70、X71以外の座標軸に対しては係数がゼロであるため、X69、X70、X71以外の各軸に平行な超平面が(5)式で定義される弱識別器2の境界面になる。アンサンブル識別器を構成する他の弱識別器2は、他の画素すなわち他の座標軸に係数を持つ不等式になるため、それらの座標軸で傾きを持つ超平面を定義することになる。
【0051】
n次元ユークリッド空間で考えた場合、上記条件だけでは有限領域であることは言えないが、実際には輝度値自体が有限(例えば0〜255)であるため、上記の輝度値空間も有限となり、その部分集合であるポジティブ画像集合が有限となる。
【0052】
ポジティブ画像集合が高次元空間内で連結された有限領域を占めることが予想されることが妥当な場合は、図9に示すように一連の2閾値を備えた弱識別器2により顔領域が囲まれることになる。一方、連結領域でない場合は、カテゴリ分けの工夫とブースティングとで2閾値を備えた弱識別器2により顔領域が囲まれることになる。
【0053】
(識別プログラム)
以上の説明においては、識別装置10がハードウエア的に構成された場合について説明したが、これに限定されるものではなく、コンピュータに識別プログラムをインストールして識別装置10としてもよい。
【0054】
識別プログラムは、学習データや検出データ等の入力データが入力される入力部、記憶部、出力部を備えたコンピュータを、入力データの特徴量を生成する特徴量生成手段、特徴量が第1閾値と第2閾値とで挟まれた所定範囲内に存在するか否かを判定する判定手段、及び検出対象と非検出対象との識別性能が高いほど重みが大きくなるように設定される重み設定手段を備えた複数の弱識別手段と、各弱識別手段における特徴量の判定結果と重みとの積算値の線形和に基づいて、入力データが検出対象であるか否かを識別する強識別手段として機能させるものである。また、識別プログラムは、弱識別手段をカスケード構造にする手段としてコンピュータを機能させるようになっていてもよい。
【0055】
尚、識別プログラムは、インターネット等の双方向にデータ通信可能な通信システムや、テレビ放送やラジオ放送等の一方向にデータ送信可能な送信システムを通じて送信することによって、目的とするコンピュータを含む情報処理装置にインストールされるようになっている。尚、識別プログラムは、コンパクトディスクやメモリスティック等の記録媒体に記録しておき、この記録媒体を用いて情報処理装置にインストールされてもよい。
【0056】
(識別装置10の動作)
上記の構成において、ソフトハウスや販売店から識別プログラムが情報処理装置に送信され、情報処理装置の記憶装置にダウンロードされる。そして、情報処理装置において識別プログラムがインストールされることによって、図1に示すように、未学習の識別装置10が構築される。即ち、弱識別器2(情報処理装置)は、入力データの特徴量を生成する特徴量生成手段と、特徴量が第1閾値と第2閾値とで挟まれた所定範囲内に存在するか否かを判定する判定手段と、検出対象と非検出対象との識別性能が高いほど重みが大きくなるように設定される重み設定手段とを備えた複数の弱識別手段と、各弱識別手段における特徴量の判定結果と重みとの積算値の線形和に基づいて、入力データが検出対象であるか否かを識別する強識別手段としてコンピュータを機能させるように構築される。さらに、弱識別器2(情報処理装置)は、弱識別手段をカスケード構造にする手段としてコンピュータを機能させるように構築される。
【0057】
(学習モード処理)
次に、識別装置10が図1の学習モードに設定される。具体的には、図10に示すように、学習モード処理ルーチンが実行される。本ルーチンが実行されると、弱識別器候補準備処理が実行される(S1)。これにより、図11に示すように、検出ウインドウ内の全ての2矩形領域からなる弱識別器候補が形成される(S21)。そして、全ての弱識別器候補の中から所定画素毎の第1弱識別器候補に絞り込まれ (S22)、個数を減少された第1弱識別器候補が図示しない記憶装置に割り当てられた第1記憶部に格納される(S23)。
【0058】
上記のようにして第1弱識別器候補が準備されると、図10に示すように、全ての第1弱識別器候補の重みDが初期化される(S2)。この後、一つの第1弱識別器候補が取り込まれる(S3)。そして、一つの学習データが取り込まれ(S4)、この学習データに対応したクラスd(1、−1)が設定される。例えば、学習データがポジティブ学習データであれば“1”のクラスdが設定され、ネガティブ学習データであれば“−1”のクラスdが設定される。そして、学習データと第1弱識別器候補とを用いた特徴量xが算出される(S6)。
【0059】
次に、クラスdに第1閾値θ1を乗算した値dθ1が、クラスdに特徴量xを乗算した値dxよりも小さいか否かが判定される(S7)。値dθ1が値dxよりも小さくない場合、即ち、dθ1<dxが成立しない場合には(S7:NO)、出力h(x)が“0”に設定された後(S9)、S12の処理が実行される。一方、小さい場合、即ち、dθ1<dxが成立する場合には(S7:YES)、続いて、クラスdに第2閾値θ2を乗算した値dθ2が、クラスdに特徴量xを乗算した値dxよりも大きいか否かが判定される(S8)。
【0060】
値dθ2が値dxよりも大きくない場合、即ち、dx<dθ2が成立しない場合には(S8:NO)、出力h(x)が“0”に設定された後(S9) 、S12の処理が実行される。一方、大きい場合、即ち、dx<dθ2が成立する場合には(S8:YES)、出力h(x)が“1”に設定される(S10)。そして、出力h(x)が“1”に設定された第1弱識別器候補に所定の重みが加算された後(S11)、S12の処理が実行される。
【0061】
上記のようにして出力h(x)の設定や重みの加算が行われると、続いて、全ての学習データの取り込みを完了したか否かが判定される(S12)。取り込みが完了していない場合には(S12:NO)、S4から再実行され、次の学習データに対する出力h(x)の設定や重みの加算が行われる。一方、全学習データの取り込みが完了した場合には(S12:YES)、全ての学習データの重みの和が1になるように正規化されることによって、1個の学習済みの第1弱識別器候補が作成及び格納される(S13)。この後、全ての第1弱識別器候補の学習が完了したか否かが判定される(S14)。完了していなければ(S14:NO)、S3から再実行され、次の未学習の第1弱識別器候補に対する学習が繰り返される。そして、全ての第1弱識別器候補の学習が完了したときに (S14:YES)、本ルーチンが終了される。
【0062】
(学習モード処理:近傍探索処理)
上記のようにして全ての第1弱識別器候補の学習が完了すると、図12の近傍探索処理ルーチンが実行される。先ず、学習済みの第1弱識別器候補が重み順に並び替えられる(S31)。大きな重みから順番に1個の第1弱識別器候補が選択される(S32)。選択された第1弱識別器候補の周辺に存在する全ての第2弱識別器候補が取得される。尚、第1弱識別器候補の周辺は、弱識別器パラメータの変更により行われる(S33)。
【0063】
この後、全ての第2弱識別器候補が学習データを用いて学習される。学習方法は、図10の学習モード処理と同じ方法が採用される(S34)。選択された第1弱識別器候補及び全ての第2弱識別器候補の中から最大重みの弱識別器候補が弱識別器2として登録される(S35)。全ての第1弱識別器候補の選択が完了したか否かが判定され(S36)、完了していなければ(S36:NO)、S32から再実行される。そして、完了したときに(S36:YES)、本ルーチンが終了される。尚、本実施形態においては、全ての第1弱識別器候補について近傍探索処理を実施しているが、強識別器1に備えられる弱識別器2の搭載数の範囲で、識別性能が高いと予想される第1弱識別器候補についてだけ近傍探索処理を実施してもよい。
【0064】
(強識別器構築処理)
上記のようにして、第1弱識別器候補及び第2弱識別器候補に基づいて弱識別器2が獲得されると、次に、強識別器構築処理が実行される。具体的には、図13に示すように、複数の弱識別器集合部21が所定の記憶領域に作成される(S41)。この後、学習済みの弱識別器2が重み順に並べ替えられる(S42)。大きな重み順から順番に所定個数単位で弱識別器2が抽出される(S43)。抽出された弱識別器2が未登録の弱識別器集合部21に登録される(S44)。
【0065】
全ての弱識別器集合部21への登録が完了したか否かが判定され(S45)、完了していなければ(S45:NO)、S43から再実行される。そして、全ての弱識別器集合部21への登録が完了したときに(S45:YES)、本ルーチンが終了される。これにより、図6に示すように、複数の弱識別器集合部21が直列接続されたカスケード構造の強識別器1が形成されることになる。尚、識別性能が高い弱識別器2をカスケード構造の前段側の弱識別器集合部21に配置することが、識別の初期に多くの非検出対象を排除できる点で好ましい。
【0066】
(強識別処理)
上記のようにして強識別器1が構築されると、図1の識別モードに設定される。具体的には、図14に示すように、強識別処理ルーチンが実行される。先ず、通路やドア、各種装置に設置された撮像装置から動画や静止画が検査データ(入力データ)として取り込まれ、この検査データが1段目の弱識別器集合部21に入力される(S51)。
【0067】
弱識別器集合部21においては、検査データと一つの弱識別器2とを用いた特徴量xが算出される。そして、第1閾値θ1<特徴量x<第2閾値θ2の条件を満足するか否かが判定される(S53)。条件を満足しない場合には(S54:NO)、出力h(x)=0とされる(S55)。一方、条件を満足する場合には(S54:YES)、出力h(x)=1とされる(S54)。この後、総出力値に出力h(x)が加算されることによって、総出力値が更新される(S56)。
【0068】
全ての弱識別器2の識別が完了したか否かが判定される(S57)。識別が完了していなければ(S57:NO)、S52から再実行される。一方、全ての識別が完了した場合には(S57:YES)、続いて、総出力値が所定値よりも大きな値であるか否かが判定される(S58)。総出力値が所定値よりも大きな値でない場合には(S58:NO)、検査データ(入力データ)が非検出対象のデータ、即ち、ネガティブデータであるとして、後段の弱識別器集合部21において識別処理が行われることなく廃棄され、次の検査データの有無が判定される(S62)。
【0069】
一方、総出力値が所定値よりも大きな値であれば(S58:YES)、検査データ(入力データ)が検出対象のデータ、即ち、ポジティブデータであるとして、後段の弱識別器集合部21において識別処理が行われることになる。具体的には、最終段の弱識別器集合部21であるか否かが判定される(S59)。最終段の弱識別器集合部21でなければ(S59:NO)、検査データが次段の弱識別器集合部21に入力される(S61)。そして、S52から再実行されることによって、この弱識別器集合部21において、検査データが検出対象であるか否かの識別が行われる。
【0070】
最終段の弱識別器集合部21である場合には(S59:YES)、検査データが検出対象として登録される(S60)。そして、次の検査データの有無が判定され(S62)、次の検査データが存在すれば(S62:YES)、S51から再実行される。一方、次の検査データが存在しなければ(S62:NO)、本ルーチンが終了される。
【0071】
(遊技媒体貸出装置)
識別装置10を備えた遊技媒体貸出装置について説明する。尚、以後の説明においては、遊技媒体貸出装置を用いて説明するが、これに限定されるものではなく、画像データから顔等の検出対象を識別する用途に用いられる全ての種類の装置に搭載することができる。例えば、識別装置10は、パチンコやパチスロ等の遊技機に搭載されていてもよいし、携帯型のデジタルカメラ、監視カメラ、ドアホン、インターホン等の撮像装置に搭載されていてもよい。搭載形態としては、搭載対象である装置の制御部とは別個に識別装置10を備えた構成であってもよいし、搭載対象である装置の制御部において、識別装置10の処理を実行させるように、プログラムやデータが組み込まれた構成にされていてもよい。
【0072】
遊技媒体貸出装置を具体的に説明すると、図15に示すように、遊技媒体貸出装置であるサンドM20は、パチンコ機M10に併設されている。各サンドM20は、隣接するパチンコ機M10に対応して設置されており、対応するパチンコ機M10との間で通信可能に接続されている。また各サンドM20は、ホール全体のサンドM20のシステム管理や売り上げ管理を行うホールコンピュータに対して通信可能に接続されている。尚、本実施の形態においては、ホールコンピュータに対して通信可能に接続されたサンドM20について説明するが、本発明はこれに限られるものではなく、ホールコンピュータと通信を行わないサンドであってもよい。
【0073】
各サンドM20の前面部21には、LED(light-emitting diode)部M31、カード挿入口M32、紙幣を挿入可能な紙幣挿入口M33、タッチパネルLCD(liquid crystal display)により構成された操作ユニットM34、カメラ部M35、非接触ICカードリーダライタM36、端数用払出口M40、計数用投入口M39等が設けられている。カード挿入口M32は、例えばホールのカード発行機によって発行された情報カードを受け付け可能な挿入口である。LED部M31は、フルカラーLEDによって構成されている。
【0074】
上記のカメラ部M35は、被写体(遊技者)を撮像するものであれば如何なる撮像方式のカメラが用いられていてもよい。この理由は、識別装置10の強識別器による識別処理が行われるため、背景が変化し易い環境下であっても、遊技者の有無を高精度に判定できるからである。
【0075】
カメラ部M35のカメラは、撮像信号を制御基板に送出する。制御基板は、識別装置10の機能を備えるようにプログラム及びデータが組み込まれることによって、撮像信号に基づいて強識別器による識別処理を行うようになっている。即ち、制御基板は、サンドM20の前方を撮影した撮像信号(画像データ)中に検出対象である顔画像が存在するか否かを判定する識別処理と、この識別処理の結果に基づいて遊技者が存在するか否かを判定する遊技者判定処理とを実行するようになっている。
【0076】
上記の構成において、サンドM20及びパチンコ機M10の動作について説明する。遊技者がパチンコ機M10の前方に着席すると、このパチンコ機M10の側面に配置されたサンドM20のカメラ部M35により遊技者が撮影される。そして、カメラ部M35の撮像信号を用いて識別処理及び遊技者判定処理が実行されることによって、遊技者の存在が検知される。遊技者の存在を条件としてサンドM20の動作処理が許可状態にされ、例えば、情報カード等の受け付けが可能にされる。
【0077】
遊技者は、情報カード又は所定金額の紙幣を、カード挿入口M32又は紙幣挿入口M33に投入することで、遊技に必要な遊技媒体としてのパチンコ球の貸し出しを受けることができる。また、遊技者は、非接触ICカードを、非接触ICカードリーダライタM36にかざすことで、遊技に必要なパチンコ球の貸し出しを受けることができる。
【0078】
サンドM20は、情報カード、紙幣及び非接触ICカードといった価値媒体の投入を受けると、投入された価値媒体の金額に応じた数のパチンコ球を払い出す旨のコマンドを併設するパチンコ機M10に送信することにより、パチンコ機M10からパチンコ球を払い出す。遊技者は、パチンコ機M10においてその上皿M12に払い出されたパチンコ球によってパチンコ遊技を行うことができる。
【0079】
また、パチンコ機M10においては、遊技の結果に応じて、上皿M12にパチンコ球を払い出す。遊技者は、所定の操作を行うことにより、上皿M12のパチンコ球を下皿M13に落とすと、当該パチンコ球は、下皿M13の下方に装着された案内皿M14に落下する。案内皿M14は、下皿M13から落下したパチンコ球を、サンドM20に設けられた計数用投入口M39へ案内する。計数用投入口M39に導入されたパチンコ球は、サンドM20の内部に設けられた計数部によって計数される。
【0080】
計数された結果は、カード挿入口M32に挿入されたカードに記録され、又は、ホールコンピュータに設けられた記憶部に記憶される。計数部において計数されたパチンコ球は、サンドM20の背面部に設けられた排出口から排出され、回収される。計数用投入口M39から投入されたパチンコ球の計数経路とは別に、サンドM20の背面側に端数用供給部が設けられており、外部から端数用のパチンコ球を受け入れるようになっている。この供給部により、端数用のパチンコ球は、常に一定量(例えば24球)が貯留された状態となっており、必要に応じて、端数用払出口M40から、案内皿M14(具体的には、案内皿M14の下方に設けられた専用の払出皿)へ払い出される。
【0081】
上記のようにして遊技が行われているときに、遊技者が離席した場合、カメラ部M35からの撮像信号を用いた識別処理及び遊技者判定処理により遊技者の不在が検知される。遊技者が存在する検知状態から不在の検知状態に変化すると、情報カード又は現金(金額データ)が残っているか否かが判断される。金額データが残っている場合には、警告音や警告音声が発生される。これにより、残高が残っているにも関わらず遊技者が離席した場合には、遊技者に注意を促すことができる。
【0082】
上述した詳細な説明では、本発明をより容易に理解できるように、特徴的部分を中心に説明した。本発明は、上述した詳細な説明に記載する実施形態に限定されず、その他の実施形態にも適用することができ、その適用範囲は多様である。また、本明細書において用いた用語及び語法は、本発明を的確に説明するために用いたものであり、本発明の解釈を制限するために用いたものではない。また、当業者であれば、本明細書に記載された発明の概念から、本発明の概念に含まれる他の構成、システム、方法等を推考することは容易であると思われる。従って、請求の範囲の記載は、本発明の技術的思想の範囲を逸脱しない範囲で均等な構成を含むものであるとみなされなければならない。また、要約書の目的は、特許庁及び一般的公共機関や、特許、法律用語又は専門用語に精通していない本技術分野に属する技術者等が本出願の技術的な内容及びその本質を簡易な調査で速やかに判定し得るようにするものである。従って、要約書は、請求の範囲の記載により評価されるべき発明の範囲を限定することを意図したものではない。また、本発明の目的及び本発明の特有の効果を十分に理解するために、すでに開示されている文献等を充分に参酌して解釈されることが望まれる。
【符号の説明】
【0083】
1 強識別器
2 弱識別器
3 特徴量生成部
4 判定部
5 重み設定部
10 識別装置
21 弱識別器集合部

【特許請求の範囲】
【請求項1】
入力データの特徴量を生成する特徴量生成部と、
前記特徴量が第1閾値と第2閾値とで挟まれた所定範囲内に存在するか否かを判定する判定部と、
検出対象と非検出対象との識別性能が高いほど重みが大きくなるように設定された重み設定部とを備えた弱識別器と、
前記弱識別器を複数備え、前記各弱識別器における特徴量の判定結果と重みとの積算値の線形和に基づいて、前記入力データが検出対象であるか否かを識別する強識別器とを有することを特徴とする識別装置。
【請求項2】
前記強識別器は、
前記弱識別器の集合体を複数段で直列配置し、前段の集合体において検出対象であると識別した入力データだけを、後段の集合体における検出対象の識別に用いることを特徴とする請求項1に記載の識別装置。
【請求項3】
前記弱識別器における前記重み設定部は、
前記検出対象である複数のポジティブ学習データと、非検出対象である複数のネガティブ学習データとを前記入力データとしたアダブースト(Adaboost)の学習アルゴリズムによって、前記重みが設定されていることを特徴とする請求項1又は2に記載の識別装置。
【請求項4】
前記弱識別器における前記判定部は、
非検出対象の特徴量の下側確率が前記検出対象の特徴量の下側確率よりも大きくなる交点を前記第1閾値とし、
前記非検出対象の特徴量の上側確率が前記検出対象の特徴量の上側確率よりも大きくなる交点を前記第2閾値としていることを特徴とする請求項1乃至3の何れか1項に記載の識別装置。
【請求項5】
入力データが入力される入力部、記憶部及び出力部を備えたコンピュータを、
前記入力データの特徴量を生成する特徴量生成手段、前記特徴量が第1閾値と第2閾値とで挟まれた所定範囲内に存在するか否かを判定する判定手段、及び検出対象と非検出対象との識別性能が高いほど重みが大きくなるように設定される重み設定手段を備えた複数の弱識別手段、
前記各弱識別手段における前記特徴量の判定結果と重みとの積算値の線形和に基づいて、前記入力データが前記検出対象であるか否かを識別する強識別手段
として機能させることを特徴とする識別プログラム。

【図1】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公開番号】特開2013−33331(P2013−33331A)
【公開日】平成25年2月14日(2013.2.14)
【国際特許分類】
【出願番号】特願2011−168300(P2011−168300)
【出願日】平成23年8月1日(2011.8.1)
【出願人】(598098526)株式会社ユニバーサルエンターテインメント (7,628)
【Fターム(参考)】