説明

分布共有化音響モデル作成方法、装置、およびそのプログラム

【課題】分布共有化音響モデルを迅速に作成可能とする。
【解決手段】分布間距離テーブル作成手段11が複数の基底分布から重複無く選んだ2つの基底分布の全てのペアを生成するとともに、当該ペアを構成する2つの基底分布の分布間距離を求めて、それぞれの分布ペアとその分布間距離との対応を示す分布間距離テーブルを作成し、N−best作成手段13が分布間距離テーブルから分布間距離が短い分布ペアから順に上位Nペアを抽出してN−bestリストを作成し、分布統合手段17と分布間距離テーブル18がN−bestリストの最上位の分布ペアを統合して1つの新しい分布を生成し、分布間距離テーブルを再構成する。そして、再構成した分布間距離テーブルに基づきN−best更新手段20がN−bestリストを更新し、その結果、最小分布間距離がしきい値以下であれば分布統合処理を継続し、しきい値以上であれば処理を終了する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声認識の際に用いる音響モデルの作成時に分布の統合を迅速に行うための分布共有化音響モデル作成方法、装置、およびそのプログラムに関する。
【背景技術】
【0002】
音声認識の際に用いられる音響モデルは、隠れマルコフモデル(Hidden Markov Model:HMM)を用いて構成されることが多い。HMMは、1)モデルレベル、2)状態レベル、3)分布レベル、4)パラメータレベルの4階層を基本構成要素とする。音響モデルにHMMを用いる場合、各階層においてモデル構造を共有化することにより、音声尤度の計算の高速化やメモリの使用量の削減などを図ることができる。なお、ここでいう共有化とは、多数あるモデルパラメータの中から統計的に同じ性質をもつ複数のモデルパラメータを見つけ出し、これらを統合して一つのパラメータで代表させることを意味する。
【0003】
HMMの各状態は、複雑な特徴量分布を表現するために、一般に複数の多次元正規分布(基底分布)の混合分布を用いることから、分布レベルでは、図6に示すように、基底分布が異なる状態間で類似している場合(平均値ベクトル、共分散行列が類似している場合)において分布の共有化を行う。分布レベルの共有により、より少数の基底分布で特徴量空間全体を効率よく覆うことができる。
【0004】
従来の分布共有化方法の一例を図7のシーケンス図を用いて説明する。まず、分布間距離テーブルを作成する(S101)。ここでいう距離とは2つの分布の類似性を示す値であり、小さいほど類似性が高い。分布間距離テーブルは、複数の分布ペアとその分布間距離との対応を示す一覧表で、基底分布数がM個の場合、M個の基底分布から重複無く選んだ2つの分布の全てのペアと当該ペアを構成する2つの基底分布の分布間距離とを対応させることにより作成する。例えば、図8(a)に示すようなM×Mのマトリックスを作成し、黒く塗りつぶされている重複部分以外の{M×(M−1)/2}個の分布ペアにそれぞれに対応する分布間距離をマッピングすることにより作成される。次に、分布間距離テーブルの中から最小の分布間距離dを持つ分布ペア(X、Y)を探す(S102)。X、Yは分布毎に付される分布IDである。次に、最小の分布間距離dが、所望の最大分布間距離p未満であるか否かを判断し(S103)、p以上であればその時点での分布数mをもって分布共有化後の音響モデルとして処理を終了し、p未満であれば分布ペア(X、Y)を統合して新たな分布Xを生成する。なお、新たな分布XはIDは統合前後で同じXであるが、分布そのものは分布の統合により統合前とは異なるものである。そして、図8(b)に示すように、統合された分布Yに係る分布ペア(黒塗り部分)を削除するとともに、新たな分布Xと他の分布との分布ペア(斜線部分)を生成し(S104)、生成した分布ペアの分布間距離を再計算して分布間距離テーブルの斜線部分にマッピングする(S105)。その後、再びS102に戻り、以降最小分布間距離dがしきい値p以上になるまで処理を繰り返す。このような処理を行うことで、異なる状態間で分布を共有化することができる。
【非特許文献1】高橋敏、嵯峨山茂樹、「4階層共有構造の音響モデルによる音声認識」、電子情報通信学会論文誌、1999、vol.J82-D-2, No.3、p.315-323
【非特許文献2】鳥脇純一郎、「テレビジョン学会教科書シリーズ9 認識工学 −パターン認識とその応用−」、コロナ社、1993、p.84-95
【発明の開示】
【発明が解決しようとする課題】
【0005】
従来の分布共有方法では、分布の統合を行う度に最小の分布間距離を持つ分布ペアの探索を行う必要があるため、特に、分布数が多い場合には多大な計算量が必要となり、所望のサイズの分布共有化音響モデルを得るまでに非常に時間がかかっていた。これは、迅速に分布共有化音響モデルを作成し提供したい場合に大きな問題となっていた。
【0006】
本発明の目的は、このような問題点の解決により迅速に分布共有化音響モデルを作成することが可能な分布共有化音響モデル作成方法、装置の実現にある。
【課題を解決するための手段】
【0007】
本発明の分布共有化音響モデル作成方法は以下の手順により分布の共有化処理を行う。まず、分布間距離テーブル作成手段が、隠れマルコフモデル(HMM)を用いた音響モデル内の複数の基底分布から、重複無く選んだ2つの基底分布の全てのペアを生成するとともに、当該ペアを構成する2つの基底分布の分布間距離を求めて、それぞれの分布ペアとその分布間距離との対応を示す一覧表である分布間距離テーブルを作成し、これを分布間距離テーブル記憶手段に書き込む分布間距離テーブル作成ステップを実行する。次に、N−best作成手段が、分布間距離テーブル記憶手段に記憶されている分布間距離テーブルから分布間距離が短い分布ペアから順に上位Nペア(N>1)を抽出してN−bestリストを作成し、これをN−best記憶手段に書き込むN−best作成ステップを実行する。次に、続行判断手段がN−best記憶手段に記憶されているN−bestリストの中で最上位の分布ペアの分布間距離が所定の距離以上となったか否かを確認し、所定の距離以上となった場合に処理を終了する続行判断ステップを実行する。所定の距離より短い場合は、N−best縮退手段が、N−best記憶手段に記憶されているN−bestリストの上位の分布ペアから順次、当該分布ペアといずれかの分布が重複している下位の分布ペアを検索し検索された分布ペア及びそれより下位の分布ペアを削除することにより、N−bestリストを縮退させるN−best縮退ステップを実行する。次に、分布統合手段が、N−best記憶手段に記憶されているN−bestリストの最上位の分布ペアを構成する2つの分布を統合して1つの新しい分布を生成し、当該統合された2つの分布のいずれかを含んでいる分布ペアを分布間距離テーブル記憶手段に記憶されている分布間距離テーブルから削除するとともに、新たに生成した分布と他の全ての分布との分布ペアを生成して当該分布間距離テーブルに追加する分布統合ステップを実行する。次に、分布間距離テーブル更新手段が、分布統合ステップにて分布間距離テーブルに追加した分布ペアを構成する2つの分布の分布間距離をそれぞれ求めて、当該分布間距離テーブルに追加する分布間距離テーブル更新ステップを実行する。次に、N−best確認手段が、N−best記憶手段に記憶されているN−bestリストから最上位の分布ペアを削除するとともに、当該削除後のN−bestリストに分布ペアが残存しているか否かを確認するN−best確認ステップを実行する。分布ペアが残存していなかった場合には、N−best作成ステップ以降の処理を再度実行する。分布ペアが残存していた場合には、N−best更新手段が、分布間距離テーブル更新ステップで分布間距離テーブルに追加された分布ペアのうち分布間距離が最小の分布ペア(以下、「代表ペア」という)が当該N−bestリストにおいて何位に相当するかを確認し、最下位である場合にはN−bestリストの更新を行わず、最下位でない場合には当該代表ペアを当該N−bestリストの相当する順位に挿入することにより上記N−best記憶手段に記憶されているN−bestリストを更新するN−best更新ステップを実行した後、統合判断ステップ以降の処理を再度実行する。
【発明の効果】
【0008】
本発明の分布共有化音響モデル作成方法、装置、及びそのプログラムによれば、迅速に分布共有化音響モデルを作成することが可能となる。
【発明を実施するための最良の形態】
【0009】
〔第1実施形態〕
図1は本発明の分布共有化音響モデル作成方法のシーケンスの一例である。また、図2はその方法を実現する装置構成の一例であり、当該分布共有化音響モデル作成装置1は、分布間距離テーブル作成手段11、分布間距離テーブル記憶手段12、N−best作成手段13、N−best記憶手段14、続行判断手段15、N−best縮退手段16、分布統合手段17、分布間距離テーブル更新手段18、N−best確認手段19及びN−best更新手段20から構成される。
【0010】
以下、各図を用いてシーケンスを各手段の機能と合わせて具体的に説明する。なお、図1においては、図7に示す背景技術のシーケンスと処理が実質的に共通する部分には同じ符号を付している。
【0011】
まず、隠れマルコフモデル(HMM)を用いた音響モデル内の複数の基底分布が分布間距離テーブル作成手段11に入力され、これら複数の基底分布から重複無く選んだ2つの基底分布の全てのペアを生成するとともに、当該ペアを構成する2つの基底分布の分布間距離を求める。ここでいう距離とは2つの分布の類似性を示す値であり、小さいほど類似性が高い。そして、それぞれの分布ペアとその分布間距離との対応を示す一覧表である分布間距離テーブルを作成し、分布間距離テーブル記憶部12に書き込む(S101)。分布間距離テーブルは、入力する基底分布数がMの場合、例えば図8(a)に示すように{M×(M−1)/2}個の分布ペア(黒く塗りつぶされていない部分)のマトリックスを作って、そこに対応する分布間距離をマッピングすることにより作成することができる。
【0012】
次に、N−best作成手段13が、分布間距離テーブル記憶手段12に記憶されている分布間距離テーブルを参照し、複数の分布ペアの中で分布間距離の短いペアから順に上位Nペアを抽出してN−bestリストを生成し、N−best記憶手段14に書き込む(S1)。従来の方法は実質的にN=1の場合にあたるが、この場合、分布統合処理を行う度に最小分布間距離の分布ペアを探索することになるため、特に分布数が多い場合には探索回数が増加し、分布統合処理を遅くする大きな原因となっていた。そこで本発明では、最小分布間距離の探索時に最上位ペアだけでなく予め上位Nペア(N>1)を抽出しておくことにより探索回数を減少させて処理の高速化を図るものである。もっとも、必要以上にNの値を大きくしても、後に行うN−bestリストの縮退処理で結局縮退されてしまうため、Nの値は通常は多くても10前後で十分である。
【0013】
次に、続行判断手段15が、N−best記憶手段14に記憶されているN−bestリストの中で最上位のペアの分布間距離dが所定の距離p以上となったか否かを確認する(S103)。その結果、分布間距離dが所定の距離p以上となっている場合には、その時点での分布数をもって分布共有化後の音響モデルとして処理を終了する。最小分布間距離の分布ペアの統合を繰返しているうちに、徐々に最小分布間距離は大きくなる。分布間距離が小さいうちは分布を統合しても音声認識精度への影響は小さいが、分布間距離が大きくなると分布の統合による音声認識精度の劣化が顕著になる。そこで、分布を統合しても所望の音声認識精度を担保できる最大の分布間距離pを設定し、これを越えない範囲で分布統合を繰り返すことにより、音声認識精度と高速な処理を両立できる分布数に収束させることができる。一方、分布間距離dが所定の距離p未満の場合には、処理を続行する。
【0014】
次に、N−best縮退手段16が、N−best記憶手段14に記憶されているN−bestリストの上位の分布ペアから順次、当該分布ペアといずれかの分布が重複している下位の分布ペアを検索し、検索された分布ペア及びそれより下位の分布ペアを削除することにより、N−bestリストを縮退させる(S2)。具体的な縮退方法の一例を図3を参照しながら説明する。図3(a)はN−bestリストに7つの分布ペアが残存している場合である。カッコ内の2つの数値は、分布ペアを構成する各分布の分布IDである。まず、分布間距離が最小である1位のペアに着目し、このペアを構成する2つの分布ID(108、500)のいずれかを含む下位の分布ペアを検索する。すると、図3(b)に示すように5位の分布ペアが分布ID108を含んでいることから、5位の分布ペアを削除する。これは、縮退処理に続いて行われる分布統合処理において、1位の分布ペアは分布ID108に統合され、かつ統合後の新たな分布ID108は元の分布ID108と分布の内容が異なるため、新たな分布ID108に係る分布間距離は再計算されることとなり、従って分布ID108を含む下位の分布ペアをN−bestリストに残存させておく意味が無いためである。また、5位の分布ペアを削除するとともに、5位より下位のペア(この例では6、7位)についても削除する。これは、下位のペアを削除することで、処理シーケンス実行中に発生しうる不測の事態、例えば、最小の分布間距離の分布ペアを統合することができない等の事態の発生を防ぐことができるためである。次に、5〜7位の分布ペアを削除して、図3(c)に示すように4つの分布ペアが残存している状態で、2位の分布ペアについても先に実施した1位の場合と同様な縮退処理を行う。2位の分布ペアを構成する2つの分布ID(256、888)のいずれかを含む下位の分布ペアを検索すると、図3(d)に示すように4位の分布ペアが分布ID256を含んでいることから、4位の分布ペアを削除する。次に、3位の分布ペアを見ると下位の分布ペアが存在しないため、この時点でN−bestリストの縮退処理は完了となる。2位以下の分布ペアについても1位と同様な縮退処理を行うのは、2位以下の分布ペアも基本的には以降の統合処理において順次統合対象となることから、事前に縮退処理を行っておくことで分布統合処理の効率の向上を図るためである。
【0015】
次に、分布統合手段17が、N−best記憶手段14に記憶されているN−bestリストの最上位の分布ペアを構成する2つの分布を統合して1つの新たな分布を生成する。そして、統合された2つの分布のいずれかを含んでいる分布ペアを分布間距離テーブル記憶手段12に記憶されている分布間距離テーブルから削除するとともに、新たに生成した分布と他の全ての分布との分布ペアを生成して分布間距離テーブルに追加する(S104)。例えば、図4(a)に示すような分布間距離テーブルにおいて、最上位の分布ペアを構成する2つの分布IDが(108、500)の時にこれらのIDの分布を分布ID108に統合する場合であれば、図8(b)に示すように、統合された分布ID500に係る分布ペア(黒塗り部分)を削除するとともに、新たな分布ID108と他の分布との分布ペア(斜線部分)を生成する。そして、分布間距離テーブル更新手段18が、新たな分布ID108に係る各分布ペアの分布間距離を再計算して分布間距離テーブルの斜線部分にマッピングする(S105)。
【0016】
次に、N−best確認手段19が、N−best記憶手段14に記憶されているN−bestリストから最上位の分布ペアを削除するとともに、当該削除後のN−bestリストに分布ペアが残存しているか否かを確認する(S3)。N−bestリストに分布ペアが残存していなかった場合には、S1に戻り改めてN−bestリストを生成し、以降、最小分布間距離がしきい値以上になるまで図1のシーケンスに従い上記と同様な処理を行う。N−bestリストに分布ペアが残存していた場合には、N−best更新手段20が、当該残存している分布ペアと、S104及びS105の処理で分布間距離テーブルに追加された分布ペア(上記例では新たな分布ID108に係る斜線部分の分布ペア)のうち分布間距離が最小の分布ペア(代表ペア)が当該N−bestリストにおいて何位に相当するかを確認し、最下位である場合にはN−bestリストの更新を行わず、最下位でない場合には当該代表ペアを当該N−bestリストの相当する順位に挿入することにより上記N−best記憶手段14に記憶されているN−bestリストを更新する(S4)。そして、S103に戻り、以降、最小分布間距離がしきい値以上になるまで図1のシーケンスに従い上記と同様な処理を繰り返す。
【0017】
以上のような処理を行うことで、統合を行う度に最小の分布間距離を持つ分布ペアの探索を行う必要が無くなるため、迅速に分布共有化音響モデルを作成することが可能となる。
【0018】
〔第2実施形態〕
図5は本発明の分布共有化音響モデル作成方法のシーケンスの別の例である。
第1実施形態は、処理の続行判断を最小分布間距離がしきい値以上となったか否かにより行うものであるが、第2実施形態は、処理の続行判断を分布数がしきい値以下になったか否かにより行うものである。従って、図1と図5からわかるように、処理シーケンス上、続行判断を行うタイミングが異なる以外は、処理内容は共通である。また、図3に示す第2実施形態の分布共有化音響モデル作成装置2の構成は、続行判断手段15が続行判断手段25に置き替わっている以外は第1実施形態と同様である。従ってここでは、第1実施形態と異なる続行判断部分についてのみ説明する。
【0019】
S104にて分布間距離が最小の分布ペアを統合した後、続行判断手段25が、分布間距離テーブル記憶手段12に記憶されている分布間距離テーブルに残存している分布数mが所定の分布数q以下となったか否かを確認する(S5)。その結果、分布数mが所定の分布数q以下となっている場合には、その時点での分布数qをもって、分布共有化後の音響モデルとして処理を終了する。最小分布間距離の分布ペアの統合を繰返しているうちに、徐々に分布の数は減っていく。ある程度の分布の数があるうちは多少分布の数が減っても音声認識精度への影響は小さいが、分布の数が少なくなりすぎると音声認識精度の劣化が顕著になる。そこで、所望の音声認識精度を担保できる最低の分布数qを設定し、これ以下にならない範囲で分布統合を繰り返すことにより、音声認識精度と高速な処理を両立できる分布数qに収束させることができる。一方、分布数mが所定の分布数qより大きい場合には、S105以降の処理を続行する。
【0020】
以上のような処理を行うことで、第1実施形態と同様、統合を行う度に最小の分布間距離を持つ分布ペアの探索を行う必要が無くなるため、迅速に分布共有化音響モデルを作成することが可能となる。
【0021】
なお、第1実施形態、第2実施形態に示した処理の順序、及び各手段の機能分担は、あくまで一例であってこの限りではなく、本発明と技術的思想が共通する範囲で適宜変更が可能である。
【0022】
〔効果の検証〕
分布共有化前の音響モデルの分布数が30000(30音素×1000分布/音素)のときに、分布共有化により分布数を1/2にする所要時間を従来方法と本発明の方法とを比較検証した。その結果、従来方法では3時間程度要したのに対し、本発明の方法では10分程度で完了し顕著な作用効果を奏することが確認された。
【産業上の利用可能性】
【0023】
本発明は、HMMを用いた音響モデルを分布レベルの共有により迅速にかつ小さなデータ量で作成したい場合に有用である。
【図面の簡単な説明】
【0024】
【図1】本発明の第1実施形態のシーケンスの例を示す図。
【図2】本発明の装置ブロック構成例を示す図。
【図3】縮退処理手順の例を示す図。
【図4】分布間距離テーブルの構成及び更新方法の具体例を示す図。
【図5】本発明の第2実施形態のシーケンスの例を示す図。
【図6】分布共有のイメージを示す図。
【図7】従来の分布共有化音響モデル作成方法の例を示す図。
【図8】分布間距離テーブルの構成及び更新方法の一般例を示す図。

【特許請求の範囲】
【請求項1】
分布間距離テーブル作成手段が、隠れマルコフモデル(HMM)を用いた音響モデル内の複数の基底分布から、重複無く選んだ2つの基底分布の全てのペアを生成するとともに、当該ペアを構成する2つの基底分布の分布間距離を求めて、それぞれの分布ペアとその分布間距離との対応を示す一覧表である分布間距離テーブルを作成し、これを分布間距離テーブル記憶手段に書き込む分布間距離テーブル作成ステップと、
N−best作成手段が、上記分布間距離テーブル記憶手段に記憶されている分布間距離テーブルから、分布間距離の短い分布ペアから順に、上位Nペア(N>1)を抽出してN−bestリストを作成し、これをN−best記憶手段に書き込むN−best作成ステップと、
続行判断手段が、上記N−best記憶手段に記憶されているN−bestリストの中で、最上位の分布ペアの分布間距離が所定の距離以上となったか否かを確認し、所定の距離以上となった場合には処理を終了する続行判断ステップと、
N−best縮退手段が、上記N−best記憶手段に記憶されているN−bestリストの上位の分布ペアから順次、当該分布ペアといずれかの分布が重複している下位の分布ペアを検索し検索された分布ペア及びそれより下位の分布ペアを削除することにより、N−bestリストを縮退させるN−best縮退ステップと、
分布統合手段が、上記N−best記憶手段に記憶されているN−bestリストの最上位の分布ペアを構成する2つの分布を統合して1つの新しい分布を生成し、当該統合された2つの分布のいずれかを含んでいる分布ペアを、上記分布間距離テーブル記憶手段に記憶されている分布間距離テーブルから削除するとともに、新たに生成した分布と他の全ての分布との分布ペアを生成して当該分布間距離テーブルに追加する分布統合ステップと、
分布間距離テーブル更新手段が、上記分布統合ステップにおいて分布間距離テーブルに追加した分布ペアを構成する2つの分布の分布間距離をそれぞれ求めて、当該分布間距離テーブルに追加する分布間距離テーブル更新ステップと、
N−best確認手段が、上記N−best記憶手段に記憶されているN−bestリストから最上位の分布ペアを削除するとともに、当該削除後のN−bestリストに分布ペアが残存しているか否かを確認するN−best確認ステップと、
を実行し、
上記N−best確認ステップでN−bestリストに分布ペアが残存していなかった場合には、上記N−best作成ステップ以降の処理を再度実行し、
上記N−best確認ステップでN−bestリストに分布ペアが残存していた場合には、N−best更新手段が、上記分布間距離テーブル更新ステップで分布間距離テーブルに追加された分布ペアのうち分布間距離が最小の分布ペア(以下、「代表ペア」という)が当該N−bestリストにおいて何位に相当するかを確認し、最下位である場合にはN−bestリストの更新を行わず、最下位でない場合には当該代表ペアを当該N−bestリストの相当する順位に挿入することにより上記N−best記憶手段に記憶されているN−bestリストを更新するN−best更新ステップを実行した後、上記統合判断ステップ以降の処理を再度実行する
分布共有化音響モデル作成方法。
【請求項2】
分布間距離テーブル作成手段が、隠れマルコフモデル(HMM)を用いた音響モデル内の複数の基底分布から、重複無く選んだ2つの基底分布の全てのペアを生成するとともに、当該ペアを構成する2つの基底分布の分布間距離を求めて、それぞれの分布ペアとその分布間距離との対応を示す一覧表である分布間距離テーブルを作成し、これを分布間距離テーブル記憶手段に書き込む分布間距離テーブル作成ステップと、
N−best作成手段が、上記分布間距離テーブル記憶手段に記憶されている分布間距離テーブルから、分布間距離の短い分布ペアから順に、上位Nペア(N>1)を抽出してN−bestリストを作成し、これをN−best記憶手段に書き込むN−best作成ステップと、
N−best縮退手段が、上記N−best記憶手段に記憶されているN−bestリストの上位の分布ペアから順次、当該分布ペアといずれかの分布が重複している下位の分布ペアを検索し検索された分布ペア及びそれより下位の分布ペアを削除することにより、N−bestリストを縮退させるN−best縮退ステップと、
分布統合手段が、上記N−best記憶手段に記憶されているN−bestリストの最上位の分布ペアを構成する2つの分布を統合して1つの新しい分布を生成し、当該統合された2つの分布のいずれかを含んでいる分布ペアを、上記分布間距離テーブル記憶手段に記憶されている分布間距離テーブルから削除するとともに、新たに生成した分布と他の全ての分布との分布ペアを生成して当該分布間距離テーブルに追加する分布統合ステップと、
続行判断手段が、上記分布間距離テーブル記憶手段に記憶されている分布間距離テーブルに含まれる分布の個数が、所定の個数以下になったか否かを確認し、所定の個数以下になった場合には処理を終了する続行判断ステップと、
分布間距離テーブル更新手段が、上記分布統合ステップにおいて分布間距離テーブルに追加した分布ペアを構成する2つの分布の分布間距離をそれぞれ求めて、当該分布間距離テーブルに追加する分布間距離テーブル更新ステップと、
N−best確認手段が、上記N−best記憶手段に記憶されているN−bestリストから最上位の分布ペアを削除するとともに、当該削除後のN−bestリストに分布ペアが残存しているか否かを確認するN−best確認ステップと、
を実行し、
上記N−best確認ステップでN−bestリストに分布ペアが残存していなかった場合には、上記N−best作成ステップ以降の処理を再度実行し、
上記N−best確認ステップでN−bestリストに分布ペアが残存していた場合には、N−best更新手段が、上記分布間距離テーブル更新ステップで分布間距離テーブルに追加された分布ペアのうち分布間距離が最小の分布ペア(代表ペア)が当該N−bestリストにおいて何位に相当するかを確認し、最下位である場合にはN−bestリストの更新を行わず、最下位でない場合には当該代表ペアを当該N−bestリストの相当する順位に挿入することにより上記N−best記憶手段に記憶されているN−bestリストを更新するN−best更新ステップを実行した後、上記N−best縮退ステップ以降の処理を再度実行する
分布共有化音響モデル作成方法。
【請求項3】
分布間距離テーブルを記憶する分布間距離テーブル記憶手段と、
N−bestリストを記憶するN−best記憶手段と、
隠れマルコフモデル(HMM)を用いた音響モデル内の複数の基底分布から、重複無く選んだ2つの基底分布の全てのペアを生成するとともに、当該ペアを構成する2つの基底分布の分布間距離を求めて、それぞれの分布ペアとその分布間距離との対応を示す一覧表である分布間距離テーブルを作成し、これを上記分布間距離テーブル記憶手段に書き込む分布間距離テーブル作成手段と、
上記分布間距離テーブル記憶手段に記憶されている分布間距離テーブルから、分布間距離の短い分布ペアから順に、上位Nペア(N>1)を抽出してN−bestリストを作成し、これを上記N−best記憶手段に書き込むN−best作成手段と、
上記N−best記憶手段に記憶されているN−bestリストの中で、最上位の分布ペアの分布間距離が所定の距離以上となったか否かを確認する続行判断手段と、
上記N−best記憶手段に記憶されているN−bestリストの上位の分布ペアから順次、当該分布ペアといずれかの分布が重複している下位の分布ペアを検索し検索された分布ペア及びそれより下位の分布ペアを削除することにより、N−bestリストを縮退させるN−best縮退手段と、
上記N−best記憶手段に記憶されているN−bestリストの最上位の分布ペアを構成する2つの分布を統合して1つの新しい分布を生成し、当該統合された2つの分布のいずれかを含んでいる分布ペアを、上記分布間距離テーブル記憶手段に記憶されている分布間距離テーブルから削除するとともに、新たに生成した分布と他の全ての分布との分布ペアを生成して当該分布間距離テーブルに追加する分布統合手段と、
上記分布統合手段において分布間距離テーブルに追加した分布ペアを構成する2つの分布の分布間距離をそれぞれ求めて、当該分布間距離テーブルに追加する分布間距離テーブル更新手段と、
上記N−best記憶手段に記憶されているN−bestリストから最上位の分布ペアを削除するとともに、当該削除後のN−bestリストに分布ペアが残存しているか否かを確認するN−best確認手段と、
上記N−best確認手段での確認の結果、N−bestリストに分布ペアが残存していた場合に、上記分布間距離テーブル更新手段で分布間距離テーブルに追加された分布ペアのうち分布間距離が最小の分布ペア(代表ペア)が当該N−bestリストにおいて何位に相当するかを確認し、最下位である場合にはN−bestリストの更新を行わず、最下位でない場合には当該代表ペアを当該N−bestリストの相当する順位に挿入することにより上記N−best記憶手段に記憶されているN−bestリストを更新するN−best更新手段と、
を具備する分布共有化音響モデル作成装置。
【請求項4】
分布間距離テーブルを記憶する分布間距離テーブル記憶手段と、
N−bestリストを記憶するN−best記憶手段と、
隠れマルコフモデル(HMM)を用いた音響モデル内の複数の基底分布から、重複無く選んだ2つの基底分布の全てのペアを生成するとともに、当該ペアを構成する2つの基底分布の分布間距離を求めて、それぞれの分布ペアとその分布間距離との対応を示す一覧表である分布間距離テーブルを作成し、これを上記分布間距離テーブル記憶手段に書き込む分布間距離テーブル作成手段と、
上記分布間距離テーブル記憶手段に記憶されている分布間距離テーブルから、分布間距離の短い分布ペアから順に、上位Nペア(N>1)を抽出してN−bestリストを作成し、これを上記N−best記憶手段に書き込むN−best作成手段と、
上記N−best記憶手段に記憶されているN−bestリストの上位の分布ペアから順次、当該分布ペアといずれかの分布が重複している下位の分布ペアを検索し検索された分布ペア及びそれより下位の分布ペアを削除することにより、N−bestリストを縮退させるN−best縮退手段と、
上記N−best記憶手段に記憶されているN−bestリストの最上位の分布ペアを構成する2つの分布を統合して1つの新しい分布を生成し、当該統合された2つの分布のいずれかを含んでいる分布ペアを、上記分布間距離テーブル記憶手段に記憶されている分布間距離テーブルから削除するとともに、新たに生成した分布と他の全ての分布との分布ペアを生成して当該分布間距離テーブルに追加する分布統合手段と、
上記分布間距離テーブル記憶手段に記憶されている分布間距離テーブルに含まれる分布の個数が所定の個数以下になったか否かを確認する続行判断手段と、
上記分布統合手段において分布間距離テーブルに追加した分布ペアを構成する2つの分布の分布間距離をそれぞれ求めて、当該分布間距離テーブルに追加する分布間距離テーブル更新手段と、
上記N−best記憶手段に記憶されているN−bestリストから最上位の分布ペアを削除するとともに、当該削除後のN−bestリストに分布ペアが残存しているか否かを確認するN−best確認手段と、
上記N−best確認手段での確認の結果、N−bestリストに分布ペアが残存していた場合に、上記分布間距離テーブル更新手段で分布間距離テーブルに追加された分布ペアのうち分布間距離が最小の分布ペア(代表ペア)が当該N−bestリストにおいて何位に相当するかを確認し、最下位である場合にはN−bestリストの更新を行わず、最下位でない場合には当該代表ペアを当該N−bestリストの相当する順位に挿入することにより上記N−best記憶手段に記憶されているN−bestリストを更新するN−best更新手段と、
を具備する分布共有化音響モデル作成装置。
【請求項5】
請求項3又は4のいずれかに記載した装置としてコンピュータを機能させるためのプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate


【公開番号】特開2009−122432(P2009−122432A)
【公開日】平成21年6月4日(2009.6.4)
【国際特許分類】
【出願番号】特願2007−296643(P2007−296643)
【出願日】平成19年11月15日(2007.11.15)
【出願人】(000004226)日本電信電話株式会社 (13,992)
【Fターム(参考)】