説明

パターン認識方法

【課題】情報の欠落を抑えてパターン認識の判別能力を向上でき、多値離散量や連続量のデータに対して適応可能なRT法によるパターン認識方法を提供する。
【解決手段】複数のサンプルデータから構成される単位空間内に、判別対象のデータが属するか否かを判別するパターン認識方法であって、サンプルデータ及び判別対象のデータを定義する複数の項目を、係数及び切片を有する一次式によって平均値m、感度β及び、標準SN比ηに圧縮し、これらの値を用いて判別対象のデータが単位空間内に属するか否かを判別する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、パターン認識方法に係り、MTシステム(Mahalanobis Taguchi System)における情報圧縮技術に関する。
【背景技術】
【0002】
ある個体から得られるさまざまな情報を処理し、その個体がどのような集団に属するかを認識する技術であるパターン認識において、パターン認識技術の一体系として、MTシステムが知られている。MTシステムではパターン認識を実施する目的に対し均質性を有する集団を単位空間と設定し,単位空間に属するデータに基づきマハラノビスの距離を定め、パターン認識の対象となるデータが単位空間に属するかどうかを判別する。
【0003】
MTシステムによるパターン認識方法において、マハラノビス距離を算出するためには、パターン毎に複数のサンプルを前もって準備する必要がある。パターンを認識する際に扱える情報量(項目数)は、サンプル数以下となるが、サンプル数を十分に準備できない場合がある。
このようにサンプル数が十分に準備できない場合には、情報の取捨選択や圧縮といった手法が多く用いられている。
【0004】
例えば、2つのパターン間における違いを最もよく表す部分の情報(特徴部分)のみを扱い、それ以外の情報を処理から省くことにより、マハラノビス距離算出時の計算量を減らす方法が提案されている(特許文献1)。
また、サンプル数を十分に準備できない場合の対応方法として、特に信号の出力値が数値で定義できない場合に対応するために、RT法が提案されている。RT法は、データを規定する項目が何個であっても,2個の変数、即ち標準SN比ηと比例定数βに情報圧縮してパターン認識を行う方法である。したがって、RT法では、複数の単位空間を定義することが可能であり、多重共線性の問題が発生せず、単位空間のメンバー数(データ数)が変数の数より少なくてもパターン認識が可能であるという利点がある。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開平9−161062号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、上記特許文献1では、情報の取捨選択が行なわれることで、パターン認識の判別能力が低下してしまうといった問題点がある。
また、RT法は、本来2値データに対して適用されるべく提案されたものであって、単位空間に属するデータの項目とその平均値とがゼロ点を通る比例関係にあると見なして情報圧縮を行なうものである。したがって、多値離散量や連続量に対して適用しようとすると、データの相関性を正確に把握することができずに必要なデータを相関性の低いものと誤判断して欠落させてしまう虞があり、結果としてパターン認識の判別能力が低下する虞がある。
【0007】
本発明は、この様な問題を解決するためになされたもので、その目的とするところは、
情報の欠落を抑えてパターン認識の判別能力を向上でき、多値離散量や連続量のデータに対して適応可能なRT法によるパターン認識方法を提供することにある。
【課題を解決するための手段】
【0008】
上記の目的を達成するために、請求項1のパターン認識方法は、複数のサンプルデータから構成される単位空間内に、判別対象のデータが属するか否かを判別するパターン認識方法であって、サンプルデータ及び判別対象のデータを定義する複数の項目を、係数及び切片を有する一次式によって項目の数より少ない変数に圧縮し、変数を用いて判別対象のデータが単位空間内に属するか否かを判別することを特徴とする。
【0009】
また、請求項2のパターン認識方法は、請求項1において、変数は平均値、感度及び標準SN比であるとともに、平均値、感度及び標準SN比に基づいてマハラノビス距離を演算し、マハラノビス距離を用いて判別対象のデータが単位空間内に属するか否かを判別することを特徴とする。
また、請求項3のパターン認識方法は、請求項1または2において、サンプルデータ及び判別対象のデータは、音声データであることを特徴とする。
【発明の効果】
【0010】
請求項1の発明によれば、サンプルデータや判別対象のデータを項目の数より少ない変数に圧縮することで、サンプルデータが2個以上であれば項目の数が多くとも、判別対象のデータが単位空間内に属するか否かを判別することが可能となる。
特に、本願発明では、係数及び切片を有する一次式により複数の項目を圧縮するので、データの項目とその平均値との関係がゼロ点を通るとは限らない連続量や多値離散量データであっても、相関性の高いデータであれば欠落させることなく採用することができ、パターン認識をより正確に行なうことができる。
【0011】
また、請求項2の発明によれば、項目を平均値、感度及び標準SN比に圧縮し、これらに基づいて1つの数量であるマハラノビス距離が演算されるので、単位空間内に属するか否かを定量的に容易に判別することが可能となる。
また、請求項3の発明によれば、音声データをパターン認識することで、音の大きさと音質との両方について判別対象のデータがサンプルデータにより構成される単位空間内に属するか否かを判別することが可能となる。
【図面の簡単な説明】
【0012】
【図1】本実施形態に係る音質評価方法を実行する機器構成を示すブロック図である。
【図2】音質評価方法の手順を示すフローチャートである。
【図3】単位空間の平均値とサンプルの散布図の一例である。
【発明を実施するための形態】
【0013】
以下、本発明の実施の形態を図面に基づき説明する。
本実施形態では、送風機の音質評価方法に本願発明のパターン認識方法を適用したものであり、音質といった感応評価を数値化して定量評価を行なうものである。
図1は、本実施形態の音質評価方法を実行する機器構成を示すブロック図である。
図1に示すように、本実施形態では、音質評価方法を実行する機器として、マイク1、1/3oct分析機2、計算機3、ディスプレイ4を備えている。
【0014】
マイク1は、評価対象としての送風機の作動音を入力する機能を有する。
1/3oct分析機2は、公知の機器であり、マイク1より入力した送風機の作動音について、1/3オクターブバンド分析を行ない、1/3オクターブ毎の音圧レベルをデータ化する機能を有する。
計算機3は、良品の送風機の作動音のデータを複数個記憶したデータベース10を備えており、演算部11において、マイク1から入力した評価対象の送風機の作動音からそのデータの特徴を抽出し、データベース10に記憶した良品のデータと比較して、作動音が良品の範囲内であるのか否かを判別する機能を有する。良品の送風機は、あらかじめ用意したサンプルの中から、例えば複数の人数で評価の上採用すればよい。そして、良品であると判断された送風機の作動音を、あらかじめマイクから入力し、演算部11で特徴となるデータを抽出し、データベース10に記憶しておく。
【0015】
ディスプレイ4は、計算機3により作動音を判別した評価対象の送風機について良品であるか否かの判定結果を表示する機能を有する。
図2は、送風機の音質評価方法の手順を示すフローチャートである。
始めに、ステップS10では、上記のようにマイク1により計測した送風機の作動音を、1/3oct分析器2に入力させる。そして、ステップS20に進む。
【0016】
ステップS20では、1/3oct分析器2において、マイクより入力した作動音について、1/3オクターブバンド分析を行ない、データ化して、計算機3に入力する。そして、ステップS30に進む。
ステップS30では、計算機3において、1/3oct分析器2から入力した送風機の作動音について、データベース10にあらかじめ記憶してある良品の特徴となるデータを基に、RT法により、平均値m、感度β、標準SN比ηの算出を行なう。なお、ステップS30からステップS50における具体的なRT法による演算方法については後述する。そして、ステップS40に進む。
【0017】
ステップS40では、ステップS30で演算した平均値m、感度β、標準SN比ηに基づいて、マハラノビス距離Dを算出する。そして、ステップS50に進む。
ステップS50では、ステップS40で算出したマハラノビス距離Dが閾値2σ以下であるか否かを判別する。閾値2σは、データベース10にあらかじめ記憶されている良品のデータについて夫々求めたマハラノビス距離Dの標準偏差σの2倍の値である。マハラノビス距離Dが閾値2σ以下である場合は、ステップS60に進む。なお、閾値に関しては、目的や入力条件等に応じて、標準偏差σの何倍に設定するかを適宜変更してもよい。
【0018】
ステップS60では、ステップS10で作動音を入力した評価対象の送風機が良品であると判定し、ディスプレイ4に出力する。そして、本ルーチンを終了する。
ステップS50でマハラノビス距離Dが閾値2σより大きいと判定した場合には、ステップS70に進む。
ステップS70では、ステップS10で作動音を入力した評価対象の送風機が不良品であると判定し、ディスプレイ4に出力する。そして、本ルーチンを終了する。
【0019】
次に、上記ステップS30〜S50で行なわれるRT法の具体的な演算方法について説明する。
本実施形態では、上記のように、あらかじめ良品のデータとしてn個のメンバーが得られており、単位空間を構成するメンバー(サンプルデータ)としてデータベース10に記憶されている。各メンバーについては、夫々k個の項目xnkが得られている。項目xnkは、具体的には、1/3オクターブ分析により得られた周波数帯域毎の音圧レベルである。
【0020】
まず、項目ごとの平均値mと,平均値の偏差平方和γを次式(1)〜(3)により求める。
【0021】
【数1】

【0022】
【数2】

【0023】
【数3】

【0024】
上記(1)〜(11)を、良品のデータである各メンバーに対して夫々演算する。これらのデータをまとめると次表1のようになる。
【0025】
【表1】

【0026】
【数4】

【0027】
【数5】

【0028】
【数6】

【0029】
単位空間の全てのメンバーについて、次式(15)によりYi1,Yi2,Yi3を求め、それぞれの平均値を算出する。
【0030】
【数7】

【0031】
(12)〜(14)式により求めたYi1,Yi2,Yi3を用いて分散共分散行列Vを求める。
【0032】
【数8】

【0033】
分散共分散行列Vの余因子行列Aを次式(23)により求める。
【0034】
【数9】

【0035】
単位空間のi番目のメンバーのマハラノビス距離Diを次式(24)、(25)により求める。
【0036】
【数10】

【0037】
次に、ステップS50において用いられる標準偏差σの演算方法について詳述する。
標準偏差σは、次式(26)で求めるように、式(25)により求めたDiの標準偏差である。
【0038】
【数11】

【0039】
【数12】

【0040】
そして、図2に示すフローチャートのように、新たに取得した評価対象としての送風機の作動音のデータが、単位空間に属するかどうか判別を行う。まず、単位空間メンバーと同様に(9)式、(10)式、(11)式で、評価対象の送風機について平均値m、感度β、標準SN比ηを求め(ステップS30に該当する)、(12)式、(13)式、(14)式でY=(Y1,Y2,Y3)を求める。そのYを(24)式に代入し,マハラノビス距離Dを求める(ステップS40に該当する)。
【0041】
そして、(26)式で得られている標準偏差の2倍値2σを閾値として、ステップS50のように良品か否かを判別するのである(ステップS50に該当する)。
以上のように、送風機の作動音を1/3oct分析したデータを、良品のメンバーにより構成される単位空間との差を示すマハラノビス距離Dという数値に置き換えることで、多くの項目を有する作動音を容易に良品であるか否かを判別することが可能となり、単純な音量だけでなく、音質という感応的評価を数値に置き換えて評価することができる。
【0042】
マハラノビス距離Dを演算する際に、本実施形態では、RT法といった公知の情報圧縮技術を応用して採用しており、周波数帯域毎の音圧レベルといった多数の項目を有する各メンバーの情報を感度βや標準SN比ηといった情報に集約するので、良品のメンバー数(サンプルデータ数)が項目の数より少なくとも良品であるか否かを容易に判別することができる。
【0043】
そして、本実施形態では、一次式をベースとして情報圧縮を行うことで、感度及び標準SN比だけではなく、平均値も加えてマハラノビス距離Dを演算することが可能となり、判定精度を向上させることができる。
従来のRT法では、パターン認識時において、サンプルと単位空間との間には、原点を必ず通るゼロ点比例式の関係が成り立っていると考え、この関係から大きく外れるサンプルについては、パターンが異なるものであると判定される。詳しくは、次式(27)に示すように、サンプルの値xと単位空間の平均値mとが、比例定数(感度)βを有する比例関係にあるものとしてパターン認識を行っている。
x=β・m・・・(27)
したがって、ゼロ点比例式の関係から大きく外れるサンプルについては、相関性のないものとして単位空間を構成するメンバーとしては採用されない。
【0044】
これに対し、本実施形態では、RT法において、一次式により情報圧縮を行っている。詳しくは、サンプルの値xと単位空間の平均値mとの関係が、次式(28)に示すように係数(感度)βと切片αを有する一次式の関係にあるものとして、情報圧縮を行っている。
x=α+β・m・・・(28)
なお、本実施形態のように音声データをパターン認識した場合には、音の大きさの差が切片α(平均値m)で表され、音質の差が感度βと標準SN比ηに表れ、特に音の高低が感度βに、離散音の有無がηに表れる。
【0045】
このように、一次式をベースとして情報圧縮を行なうと、パターン認識時において、従来のゼロ点比例式では相関性がないものとして判定されていたサンプルを、相関性のあるものとして採用することが可能となる。
例えば、図3の(A)及び(B)は、単位空間の平均値mとサンプルの散布図の一例を示している。下図3の(A)及び(B)は、いずれも略同じ比例定数βと標準SN比ηを有している。しかしながら、(A)及び(B)は、明らかに性質が異なっており、(B)ではサンプルの値xと単位空間の平均値mとの間に相関性が認められる。特に(B)においては、ゼロ点比例方式では(A)と同様に相関性が低いと認識したデータを欠落させてしまうが、一次式をベースとして情報圧縮を行う本実施形態では略全てのデータを相関性のある有用なデータとして採用することができる。
【0046】
このように、本実施形態では、一次式をベースとして情報圧縮を行うことで、パターン認識を行う際に、多値離散量や連続量を持つ対象に適用する場合においても,対象に応じてより適切な近似式を選択することができ、判別能力を大きく向上させることができる。
なお、本実施形態では、送風機の音質評価において、本発明を適用しているが、音が発生する他の部品やシステムの音質評価に適用することができる。また、本発明は、音声データだけではなく、各種データのパターン認識の際に広く適用することが可能である。
【符号の説明】
【0047】
1 計算機
2 演算部
3 データベース

【特許請求の範囲】
【請求項1】
複数のサンプルデータから構成される単位空間内に、判別対象のデータが属するか否かを判別するパターン認識方法であって、
前記サンプルデータ及び前記判別対象のデータを定義する複数の項目を、係数及び切片を有する一次式によって前記項目の数より少ない変数に圧縮し、前記変数を用いて前記判別対象のデータが前記単位空間内に属するか否かを判別することを特徴とするパターン認識方法。
【請求項2】
前記変数は平均値、感度及び標準SN比であるとともに、
前記平均値、感度及び標準SN比に基づいてマハラノビス距離を演算し、前記マハラノビス距離を用いて前記判別対象のデータが前記単位空間内に属するか否かを判別することを特徴とする請求項1に記載のパターン認識方法。
【請求項3】
前記サンプルデータ及び判別対象のデータは、音声データであることを特徴とする請求項1または2に記載のパターン認識方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate


【公開番号】特開2012−93423(P2012−93423A)
【公開日】平成24年5月17日(2012.5.17)
【国際特許分類】
【出願番号】特願2010−238520(P2010−238520)
【出願日】平成22年10月25日(2010.10.25)
【出願人】(000006286)三菱自動車工業株式会社 (2,892)
【Fターム(参考)】