説明

パターンマッチング方法および装置ならびにその特徴量正規化方法および装置

【課題】ベクトル量子化およびその復号を経てVQ歪みを含む特徴量を、その確率モデルと照合する際に好適なパターンマッチング方法および装置、ならびに前記特徴量に好適な正規化方法および装置を提供する。
【解決手段】平均値・分散計算部51は、VQ復号部21で復号された音響特徴量(特徴ベクトル)の平均値yおよび分散x1を計算する。平均値yの計算結果は加算部52において音響特徴量から減算される。分散x1は加算部53において、予めVQ歪み分散記憶部27に記憶されているVQ歪みの分散x2と加算され、VQ歪みを考慮した分散xが求められる。正規化部54では、この分散xを用いて音響特徴量が正規化され、MVN後の音響特徴量が算出される。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、パターンマッチング方法および装置ならびにその特徴量正規化方法および装置に係り、特に、入力信号から抽出された特徴量を一度ベクトル量子化し、これを復号して得られた特徴量を確率モデルと照合する際に好適なパターンマッチング方法および装置、ならびに前記特徴量の正規化に好適な特徴量正規化方法および装置に関する。
【背景技術】
【0002】
情報検索や音声、画像認識の分野で使用されるパターンマッチングでは、未知の入力パターンと既知の多数の標準パターンとの類似度が算出され、類似度が最も高い標準パターンがパターンマッチング結果とされる。このとき、比較対象の入力パターンおよび標準パターンは共に正規化され、外乱などの不確定要素が予め除去される。
【0003】
このパターンマッチングを適用した音声認識装置では、入力音声信号から抽出された時系列の音響特徴量を、母音や子音などの音素を単位として音響特徴量空間における確率密度分布が予め学習された音響モデルと照合することにより認識結果を得る。確率モデルである音響モデルは、音響特徴量の入力に対して、その音素らしさのスコア(音響尤度)を出力する。音声認識装置は文法と単語辞書の制約に従って音素らしさのスコア(音響尤度)を発声全体に渡って累積し、累積スコアが最も高い単語の並びを認識結果として出力する。
【0004】
ここで、音響特徴量は多次元ベクトルの時系列データであり、各次元において各音素に該当するデータの頻度分布を集計すると正規分布に近い形状、もしくは複数の正規分布の和に近い形状になる。こうした音響特徴量の分布を表現するために、音響モデルの確率密度分布は多次元正規分布もしくは複数の多次元正規分布によって表現される。
【0005】
しかしながら、実際の照合においては、マイク特性のばらつき、話者による違い、背景雑音などにより、入力音響特徴量の分布と音響モデルの確率密度分布との間にずれが生じ、これが認識率低下の原因となる。
【0006】
入力音響特徴量と音響モデルとのパターンマッチングにおいて、このようなずれを解消する手法として、ケプストラム平均値正規化(CMN: Cepstral Mean Normalization)という手法が広く利用されており、CMNをさらに発展させた手法として平均値・分散正規化(MVN: Mean and Variance Normalization)が提案されている。
【0007】
CMNとは、発声の各時刻の音響特徴量から、その発声全体の平均値を引き算して音響特徴量の平均をゼロにすることで、入力音響特徴量の分布と音響モデルの確率密度分布とを揃えてずれを低減する手法である。CMN前の各次元の音響特徴量をx(t)、CMN後の音響特徴量をx'(t)とすると、CMNの操作は次式(1)で表される。
【0008】
【数1】

【0009】
一方、MVNとは、発声の各時刻の音響特徴量を、その発声全体の平均値と分散とで正規化して基準系の正規分布N(平均0、分散1)に揃えることで、マイク特性などによる入力音響特徴量の分布と音響モデルの確率密度分布とのずれを低減する手法である。MVN前の各次元の音響特徴量をx(t)、MVN後の音響特徴量をx'(t)とすると、MVNの操作は次式(2)で表される。
【0010】
【数2】

【0011】
ただし、発声全体の平均値や分散を用いるCMNやMVNは、発声が終わるまで正規化後の音響特徴量が得られないために照合処理の開始が遅れ、発声終了から認識結果出力までの待ち時間を長くしてしまうというデメリットがある。
【0012】
この処理遅れを低減する手法として、発声全体の代わりに発声先頭からの一部分(数百ミリ秒)から平均値や分散を算出して正規化に用いる手法が提案されている。この手法は、認識処理遅れを低減する代わりに、平均値や分散の精度を落としている。以降、発声全体から平均値と分散を算出するMVNを「バッチMVN」、発声の一部分から平均値と分散を算出するMVNを「セグメンタルMVN」と表現することで両者を区別する。
【0013】
しかしながら、セグメンタルMVNを行う場合に、発声先頭の平均値と分散を計算する区間が無音であったり定常音であったりして量子化ベクトルが一種類になると、分散がゼロになり、正規化の際にゼロによる割り算が発生してしまう。
【0014】
このような技術課題を解決するために、特許文献1では、特徴量の量子化を仮定しない平均値・分散正規化(MVN)において算出した分散の値がゼロもしくはゼロに近い小さな値の場合には分散正規化を行わない技術が提案されている。
【特許文献1】特開2002−278586号公報
【発明の開示】
【発明が解決しようとする課題】
【0015】
従来の平均値・分散特徴量正規化手法(MVN)は、音響特徴量に量子化の影響がないことを前提に、マイク特性のばらつき、話者による違い、背景雑音などに起因する入力音響特徴量の分布と音響モデルの確率密度分布との間のずれを低減していた。
【0016】
しかしながら、認識対象の音響特徴量が通信により遠隔の音声認識部へ送信される分散型(クライアント・サーバ型)の音声認識システムでは、クライアントのマイクで検知された音声の特徴量がベクトル量子化によりデータ量を減ぜられた後にサーバへ送信される。サーバ側では、クライアントから受信した特徴量を復号して特徴量を再現し、この特徴量と確率モデルとのパターンマッチングに基づいて認識結果を得る。
【0017】
ベクトル量子化ではクライアントおよびサーバの双方が、多次元の特徴量を表現する有限のベクトル量子化(VQ)コードブックを備え、クライアントでは、入力された特徴ベクトル(特徴量)を最近傍のコードベクトルで代表し、そのインデックスをサーバに送信する。サーバも共通のベクトル量子化コードブックを有しているので、クライアントから送信されたインデックスに基づいてコードベクトルを特定し、このコードベクトルを音響特徴量とすることで前記特徴量が復号される。すなわち、入力音声信号の特徴ベクトルは、ベクトル量子化および復号を経て最近傍のコードベクトルに近似される。
【0018】
図7は、ヨーロッパの標準化組織ETSI (European Telecommunications Standards Institute)で標準化された分散型音声認識のためのベクトル量子化コードブックを示した図である。ETSIの標準方式ではケプストラム領域の特徴量MFCC(Mel-Frequency Cepstrum Coefficient)および対数パワーからなる全14次元の特徴量が、2次元ずつ7種類のVQコードブックで量子化される。MFCCの1次および2次の空間は、図7に示したように64個のコードベクトルによって表現される。
【0019】
このような構成では、認識対象の特徴量がベクトル量子化およびその復号を経るためにベクトル量子化歪み(VQ歪み)を含むのに対して、サーバに予め用意されている音響モデルの学習用音声データの特徴量は、ベクトル量子化およびその復号を経ていない場合にはVQ歪みを含まない。この場合、認識対象の音響特徴量の分散と音響モデルの分散とに差異が生じ、MVNによる認識率改善の効果が薄れてしまう。
【0020】
特許文献1のように、分散の値がゼロもしくはゼロに近い小さな値の場合に分散正規化を行わないようにしてしまうと、確率モデルは特徴量正規化込みであるのに対して、入力特徴量は特徴量正規化を含まないので、パターンマッチングにミスマッチが生じて音声認識の精度が低下してしまう。
【0021】
本発明の目的は、上記した従来技術の課題を解決し、ベクトル量子化およびその復号を経てVQ歪みを含む特徴量を、その確率モデルと照合する際に好適なパターンマッチング方法および装置、ならびに前記特徴量の正規化に好適な特徴量正規化方法および装置を提供することにある。
【課題を解決するための手段】
【0022】
ベクトル量子化が行われた音響特徴量に対するMVNについて考えると、ベクトル量子化前の入力音響特徴量の分散は、ベクトル量子化後の分散とベクトル量子化歪み(VQ歪み)の分散との和で表される。これを以下に数式で示す。
【0023】
入力音声のk番目のフレームの音響特徴量の第m次元の値をxm(k)、選択されたVQコードブックの第m次元の値をqm(k)、xm(k)とqm(k)との差分をΔxm(k)とすれば次式(3)が成立する。
【0024】
【数3】

【0025】
また、変数x(k)の発声全体の平均値および分散をそれぞれE(x),V(x)で表せば次式(4)が成立する。
【0026】
【数4】

【0027】
ここで、E(Δxm)=0と仮定すれば次式(5)が成立する。
【0028】
【数5】

【0029】
ここで、q(k)m −E(qm)とΔxm(k)とが無相関とすれば、次式(6)より次式(7)が成立する。
【0030】
【数6】

【0031】
【数7】

【0032】
即ち、VQ前の入力音響特徴量の分散は、VQ後の音響特徴量の分散と、VQ歪みの分散の和で表される。したがって、音声認識サーバに到来したVQ後の音響特徴量からVQ前の入力音響特徴量の分散を推定するには、予め計算しておいた各次元のVQ歪みの分散を加えれば良い。
【0033】
本発明の特徴量正規化装置およびパターンマッチング装置は、上記した知見に基づいてなされたものであり、以下のような手段を講じた点に特徴がある。
【0034】
(1)本発明の特徴量正規化装置は、前記復号された特徴量の平均値および分散を計算する手段と、前記復号された特徴量の分散にベクトル量子化歪みの分散を加算して補正後分散を算出する補正後分散算出手段と、前記平均値および補正後分散を利用して、前記復号された特徴量を正規化する正規化手段とを含むことを特徴とする。
【0035】
(2)本発明のパターンマッチング装置は、入力信号から抽出されてベクトル量子化された特徴量を復号する復号手段と、前記復号された特徴量を正規化する特徴量正規化手段と、前記正規化後の特徴量を確率モデルと照合してパターンマッチング結果を出力する認識処理手段とを含み、特徴量正規化手段が、復号された特徴量の平均値および分散を計算する手段と、復号された特徴量の分散にベクトル量子化歪みの分散を加算して補正後分散を算出する補正後分算出散手段と、平均値および補正後分散を利用して前記復号された特徴量を正規化する正規化手段とを含むことを特徴とする。
【発明の効果】
【0036】
本発明によれば、以下のような効果が達成される。
(1)本発明の特徴量正規化方法および装置によれば、入力信号の特徴量がベクトル量子化およびその復号を経てVQ歪みを含むときに、この特徴量がVQ歪みの分散を考慮して正規化されるので、この特徴量の分布と、ベクトル量子化およびその復号を経ていない特徴量に基づいて構築される確率モデルの確率密度分布とのずれを低減できるようになる。
(2)本発明の特徴量正規化方法および装置によれば、入力信号の特徴量がベクトル量子化およびその復号を経てVQ歪みを含むときに、この特徴量が、当該特徴量の分散とVQ歪みの分散との加算値として求められる補正後分散に基づいて正規化されるので、単一のコードベクトルが選択されて特徴量の分散がゼロになる場合でも、正規化時にゼロによる割り算を回避することができる。
(3)本発明のパターンマッチング方法および装置によれば、特徴量を正規化する正規化部において、ベクトル量子化およびその復号を経てVQ歪みを含む特徴量がVQ歪みの分散を考慮して正規化されるので、この特徴量の分布と、ベクトル量子化およびその復号を経ていない特徴量に基づいて構築される確率モデルの確率密度分布とのずれを低減できる。したがって、パターンマッチングの精度を向上させることができる。
(4)本発明のパターンマッチング方法および装置によれば、特徴量を正規化する正規化部において、ベクトル量子化およびその復号を経てVQ歪みを含む特徴量が、当該特徴量の分散とVQ歪みの分散との加算値として求められる補正後分散に基づいて正規化されるので、単一のコードベクトルが選択されて特徴量の分散がゼロになる場合でも、正規化時にゼロによる割り算を回避することができる。
【発明を実施するための最良の形態】
【0037】
以下、図面を参照して本発明の最良の実施の形態について詳細に説明する。図1は、本発明のパターンマッチング方法を適用した分散型音声認識装置の主要部の構成を示したブロック図であり、入力された音声信号の音響特徴量をベクトル量子化して送信する端末1と、ベクトル量子化データを端末1から受信、復号して音響特徴量を再現し、この音響特徴量と音響モデル(確率モデル)とのパターンマッチングにより得られた認識結果を端末1に返信する音声認識サーバ2と、この音声認識サーバ2で音声認識に利用する音響モデルを事前の処理で構築する学習装置3とを主要な構成としている。
【0038】
前記端末1において、音響特徴量抽出部12は、マイク11から入力された音声信号から音響特徴量を抽出して一時記憶する。音響特徴量とは、入力音声を一定時間間隔(例えば10ms:以下、フレームと表現する)毎に分析して得られる時系列の特徴ベクトルである。本実施形態では、フレームごとに多次元の特徴ベクトルが生成される。
【0039】
ベクトル量子化部13は、ベクトル量子化(VQ)コードブックを用いて前記特徴ベクトルを量子化(ベクトル量子化)する。さらに具体的に説明すれば、特徴ベクトルに対してVQコードブック上で最も距離の近いコードベクトルを選択して、そのインデックスを抽出する。抽出されたインデックスは音声認識サーバ2へ送信される。
【0040】
音声認識サーバ2において、ベクトル量子化(VQ)復号部21は、受信したインデックスを前記端末1のVQコードブックと同一のVQコードブックを用いて復号し、復号されたコードベクトルで前記特徴ベクトルを近似する。VQ歪み分散記憶部27には、音響特徴量に関して予め算出された量子化ベクトル時の分散(VQ歪み)が記憶されている。特徴量正規化部22は、後に詳述するように、VQ歪み分散記憶部27に予め記憶されているVQ歪みの分散と前記復号された音響特徴量の分散とに基づいて当該音響特徴量を正規化する。
【0041】
前記VQ歪み分散記憶部27に記憶されている分散は、例えば多数の音響特徴量をランダムに発生させ、これらをベクトル量子化部13でVQコードブックと照合して全特徴ベクトルについて最短距離の量子化ベクトルを求め、これらの特徴ベクトルと量子化ベクトルとの平均二乗距離として予め求めることができる。前記特徴ベクトルと量子化ベクトルとの平均二乗距離は特徴ベクトルの次元ごとに計算することができる。
【0042】
認識処理部23は、正規化された音響特徴量を順次に取り込み、単語辞書文法記憶部24に記憶された文法の拘束条件に従いながら音響モデル25と音響特徴量とを照合し、音響的な対数尤度に基づいて認識結果を出力する。認識結果送信部26は、前記音声認識結果を端末宛てに送信する。端末1では、この認識結果が認識結果受信部14で受信されて適宜に処理される。
【0043】
学習装置3において、学習用音声データベース32には大量の学習用音声データが格納されており、書き起こしテキスト記憶部31には、各音声データの書き起こしテキストが記憶されている。音響特徴量抽出部33は、前記学習用音声データベース32に格納されている音声データから音響特徴量を抽出する。この音響特徴量は正規化部34で正規化され、音響モデル学習部35において書き起こしテキストと対応付けられて音響モデル25として記憶される。
【0044】
図2は、前記特徴量正規化部22の主要部の構成を示したブロック図である。平均値・分散計算部51は、VQ復号部21で復号された音響特徴量(特徴ベクトル)の平均値yおよび分散x1を計算する。平均値yの計算結果は加算部52において音響特徴量から減算される。分散x1は加算部53において、予めVQ歪み分散記憶部27に記憶されているVQ歪みの分散x2と加算され、VQ歪みを考慮した分散xが求められる。正規化部54では、この分散xを用いて音響特徴量が正規化され、MVN後の音響特徴量が算出される。
【0045】
図3は、前記特徴量正規化部22の他の構成を示したブロック図であり、前記と同一の符号は同一または同等部分を表している。
【0046】
VQ歪み分散記憶部27には、VQ歪みの分散がコードベクトルまたはコードベクトルのクラス(集合)ごとに記憶されている。VQ歪み分散選択部55は、VQ復号部21から通知される復号中の音響特徴量のコードベクトルまたはコードベクトルのクラスに基づいて、VQ歪み分散記憶部27から対応するVQ歪みの分散を抽出し、さらに一発声の全フレームまたは所定のフレーム数ごとに、前記抽出されたVQ歪みの分散のフレーム平均値を求めて加算部53へ出力する。
【0047】
図4は、本発明のパターンマッチングを適用した分散型音声認識装置のさらに他の実施形態の構成を示したブロック図であり、前記と同一の符号は同一または同等部分を表している。
【0048】
上記した各実施形態では、音声認識サーバ2において加算されるVQ歪みの分散が予め統計的に求められて記憶装置27に記憶されて読み出されるものとして説明したが、本実施形態では、端末1にVQ歪み分散算出部15を設けた点に特徴がある。
【0049】
このVQ歪み分散算出部15は、各特徴ベクトルに関して、前記コードブック上で最短距離の量子化ベクトルが前記ベクトル量子化部13で求められると、各特徴ベクトルと各量子化ベクトルとの距離を算出してVQ歪みの分散を求める。この分散は音声認識サーバ2へ送信され、特徴量正規化部22において、対応するフレームの正規化に利用される。前記VQ歪み分散算出部15は、特徴ベクトルの次元ごとに全フレームの分散を求めても良いし、あるいは所定のフレーム数ごとに分散を求めても良い。
【0050】
なお、上記した実施形態では、本発明のパターンマッチング方法およびその正規化方法を音声認識装置に適用して説明したが、本発明はこれのみに限定されるものではなく、図5に示したように、カメラ16で撮影された画像を認識する画像認識装置にも同様に適用できる。
【0051】
この場合、端末1aでは前記音響特徴量抽出部12に代えて画像特徴量抽出部12aが設けられ、画像認識サーバ2aでは前記音響モデル記憶部25に代えてオブジェクトモデル記憶部25aが設けられる。このオブジェクトモデル記憶部25aには、学習用画像データベース32aに登録されている多数の画像から抽出された特徴量を正規化して得られたデータとオブジェクトモデル教師データ記憶部31aに記憶されている教師データとに基づいて学習されたオブジェクトモデル(確率モデル)が登録される。認識処理部23は、特徴量正規化部22で正規化されたデータを前記オブジェクトモデルと照合して認識結果を得る。
【0052】
さらに、本発明のパターンマッチング方法およびその正規化方法は、図6に示したように、嗜好データ入力部17から入力されたユーザの嗜好に基づいて当該ユーザの嗜好に適合したサービスや商品等のカテゴリを予測するレコメンド装置にも同様に適用できる。
【0053】
この場合、端末1bでは前記音響特徴量抽出部12に代えてユーザプロファイル特徴量抽出部12bが設けられ、数値化された嗜好データが嗜好データ入力部17から入力される。レコメンドサーバ2bでは、前記音響モデル記憶部25に代えてユーザプロファイルカテゴリモデル記憶部25bが設けられる。このユーザプロファイルカテゴリモデル記憶部25bには、学習用ユーザ嗜好データベース32bに登録されている多数の嗜好情報から抽出された特徴量を正規化して得られたデータとカテゴリ教師データ記憶部31bに記憶されている教師データとに基づいて学習されたされたユーザプロファイルカテゴリモデル(確率モデル)が登録される。認識処理部23は、特徴量正規化部22で正規化されたデータを前記ユーザプロファイルカテゴリモデルと照合してレコメンド結果を得る。
【0054】
このように、本発明のパターンマッチング方法およびその正規化方法は、未知の入力パターンと既知の多数の標準パターンとの類似度を算出し、類似度が最も高い標準パターンがパターンマッチング結果とされる全てのパターンマッチング方法およびその正規化方法に適用できる。
【図面の簡単な説明】
【0055】
【図1】本発明のパターンマッチング方法を適用した分散型音声認識装置の第1実施形態のブロック図である。
【図2】音響特徴量正規化部の構成を示したブロック図である。
【図3】音響特徴量正規化部の他の構成を示したブロック図である。
【図4】本発明のパターンマッチングを適用した分散型音声認識装置の他の実施形態のブロック図である。
【図5】本発明のパターンマッチングを適用した画像認識装置のブロック図である。
【図6】本発明のパターンマッチングを適用したレコメンド装置のブロック図である。
【図7】分散型音声認識のためのベクトル量子化コードブックの一例を示した図である。
【符号の説明】
【0056】
1…端末,2…音声認識サーバ,3…学習装置,11…マイク,12…音響特徴量抽出部,13…ベクトル量子化部,21…ベクトル量子化(VQ)復号部,22…音響特徴量正規化部,23…認識処理部,24…単語辞書文法記憶部,25…音響モデル記憶部,26…認識結果送信部,27…VQ歪み分散記憶部

【特許請求の範囲】
【請求項1】
入力信号から抽出され、一度ベクトル量子化された後に、復号された特徴量を正規化する特徴量正規化装置において、
前記復号された特徴量の平均値および分散を計算する手段と、
前記復号された特徴量の分散にベクトル量子化歪みの分散を加算して補正後分散を算出する補正後分散算出手段と、
前記平均値および補正後分散を利用して、前記復号された特徴量を正規化する正規化手段とを含むことを特徴とする特徴量正規化装置。
【請求項2】
別途に算出されたベクトル量子化歪みの分散を記憶する記憶手段を含み、
前記ベクトル量子化歪みの分散が前記記憶手段から読み出されることを特徴とする請求項1に記載の特徴量正規化装置。
【請求項3】
前記入力信号から抽出された特徴量は、VQコードブックとの照合結果に基づいてコードベクトルにベクトル量子化され、
前記記憶手段には、コードベクトルまたはコードベクトルのクラスごとに分散が記憶されており、
前記コードベクトルまたはそのクラスに対応した分散を前記記憶手段から選択する選択手段を具備し、
前記補正後分散算出手段は、前記復号された特徴量の分散に前記選択された分散のフレーム平均値を加算することを特徴とする請求項2に記載の特徴量正規化装置。
【請求項4】
入力信号から抽出され、一度ベクトル量子化された後に、復号された特徴量を正規化する特徴量正規化方法において、
前記復号された特徴量の平均値および分散を計算する手順と、
前記復号された特徴量の分散にベクトル量子化歪みの分散を加算して補正後分散を算出する手順と、
前記平均値および補正後分散を利用して、前記復号された特徴量を正規化する手順とを含むことを特徴とする特徴量正規化方法。
【請求項5】
入力信号から抽出され、一度ベクトル量子化された後に、復号された特徴量を確率モデルと照合してパターンマッチング結果を出力するパターンマッチング装置において、
入力信号から抽出された特徴量のベクトル量子化データを復号する復号手段と、
前記復号された特徴量を正規化する特徴量正規化手段と、
前記正規化後の特徴量を確率モデルと照合してパターンマッチング結果を出力する認識処理手段とを含み、
前記特徴量正規化手段が、
前記復号された特徴量の平均値および分散を計算する手段と、
前記復号された特徴量の分散にベクトル量子化歪みの分散を加算して補正後分散を算出する補正後分算出散手段と、
前記平均値および補正後分散を利用して、前記復号された特徴量を正規化する正規化手段とを含むことを特徴とするパターンマッチング装置。
【請求項6】
別途に算出されたベクトル量子化歪みの分散を記憶する記憶手段を含み、
前記ベクトル量子化歪みの分散が前記記憶手段から読み出されることを特徴とする請求項5に記載のパターンマッチング装置。
【請求項7】
前記入力信号から抽出された特徴量は、VQコードブックとの照合結果に基づいてコードベクトルにベクトル量子化され、
前記記憶手段には、コードベクトルまたはコードベクトルのクラスごとに分散が記憶されており、
前記コードベクトルまたはそのクラスに対応した分散を前記記憶手段から選択する選択手段を具備し、
前記補正後分散算出手段は、前記復号された特徴量の分散に前記選択された分散のフレーム平均値を加算することを特徴とする請求項6に記載のパターンマッチング装置。
【請求項8】
前記ベクトル量子化歪みの分散を受信する手段を含み、
前記補正後分散算出手段は、前記復号された特徴量の分散に前記受信した分散を加算することを特徴とする請求項5に記載のパターンマッチング装置。
【請求項9】
前記入力信号が音声信号であり、前記パターンマッチング結果が音声認識結果であることを特徴とする請求項5ないし8のいずれかに記載のパターンマッチング装置。
【請求項10】
前記入力信号が画像信号であり、前記パターンマッチング結果が画像認識結果であることを特徴とする請求項5ないし8のいずれかに記載のパターンマッチング装置。
【請求項11】
前記入力信号がユーザの嗜好情報であり、前記パターンマッチング結果がレコメンド結果であることを特徴とする請求項5ないし8のいずれかに記載のパターンマッチング装置。
【請求項12】
入力信号から抽出され、一度ベクトル量子化された後に、復号された特徴量を確率モデルと照合してパターンマッチング結果を出力するパターンマッチング方法において、
入力信号から抽出された特徴量のベクトル量子化データを復号して前記特徴量を復号する手順と、
前記復号された特徴量を正規化する手順と、
前記正規化後の特徴量を確率モデルと照合してパターンマッチング結果を出力する手順とを含み、
前記特徴量を正規化する手順が、
前記復号された特徴量の平均値および分散を計算する手順と、
前記復号された特徴量の分散にベクトル量子化歪みの分散を加算して補正後分散を算出する手順と、
前記平均値および補正後分散を利用して、前記復号された特徴量を正規化する手順とを含むことを特徴とするパターンマッチング方法。


【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2008−309945(P2008−309945A)
【公開日】平成20年12月25日(2008.12.25)
【国際特許分類】
【出願番号】特願2007−156455(P2007−156455)
【出願日】平成19年6月13日(2007.6.13)
【出願人】(000208891)KDDI株式会社 (2,700)
【Fターム(参考)】