子音区間検出装置および子音区間検出方法

【課題】比較的高いノイズレベルの環境下においても精度よく子音区間を検出する。
【解決手段】子音区間検出装置１１０は、入力信号を予め定められたフレーム単位で切り出し、フレーム化入力信号を生成するフレーム化部１２０と、フレーム化入力信号を、時間領域から周波数領域に変換して、スペクトルパターンを生成するスペクトル生成部１２２と、スペクトルパターンにおける、連接する予め定められた帯域幅毎の平均エネルギーである帯域別平均エネルギーを導出する平均導出部１２６と、導出された帯域別平均エネルギー同士を比較し、第１の周波数帯域の帯域別平均エネルギーが、第１の周波数帯域より低い周波数帯域である第２の周波数帯域の帯域別エネルギーより高いことを検出することによりフレーム化入力信号に子音が含まれるかどうかを判定する子音判定部１２８とを備える。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、入力信号の子音区間を検出する子音区間検出装置および子音区間検出方法に関する。
【背景技術】
【０００２】
人の声は、母音と子音、または有声音と無声音等に分類できる。そこで、母音、子音、有声音、および無声音等のそれぞれの特徴を利用して、音声の検出や識別をする技術が開発されている。
【０００３】
具体的に、有声音と無声音については、入力信号のフレームのゼロクロス数をカウント
するゼロクロス法に基づき、フレーム間のゼロクロス数を比較して有声音と無声音とを識
別する技術が提案されている（例えば、特許文献１）。
【先行技術文献】
【特許文献】
【０００４】
【特許文献１】特開２００７−２９２９４０号公報
【発明の概要】
【発明が解決しようとする課題】
【０００５】
ところで、入力信号に含まれる音声を検出する場合、母音は子音に比べてエネルギーが大きいため、ノイズレベルが高い環境下において、母音区間（母音が含まれる区間）の検出は比較的容易であったが、子音区間（子音が含まれる区間）の検出は、子音の特徴がノイズに埋もれてしまい誤検出が生じがちであった。
【０００６】
また、上述した特許文献１のようなゼロクロス法を子音区間の検出に用いたとしても、ノイズの振幅が偏ると、振幅が偏った影響でサンプリング点での音圧値に変化が生じ、オフセットが発生する。そのため、入力信号が０をクロスしないで振動する区間が生じて、子音区間を検出できない場合がある。
【０００７】
そこで本発明は、このような課題に鑑み、比較的高いノイズレベルの環境下においても精度よく子音区間を検出することが可能な、子音区間検出装置および子音区間検出方法を提供することを目的としている。
【課題を解決するための手段】
【０００８】
上記課題を解決するために、本発明の子音区間検出装置は、入力信号を予め定められたフレーム単位で切り出し、フレーム化入力信号を生成するフレーム化部と、フレーム化入力信号を、時間領域から周波数領域に変換して、スペクトルパターンを生成するスペクトル生成部と、スペクトルパターンにおける、連接する予め定められた帯域幅毎の平均エネルギーである帯域別平均エネルギーを導出する平均導出部と、導出された帯域別平均エネルギー同士を比較し、第１の周波数帯域の帯域別平均エネルギーが、第１の周波数帯域より低い周波数帯域である第２の周波数帯域の帯域別エネルギーより高いことを検出することにより、フレーム化入力信号に子音が含まれるかどうかを判定する子音判定部と、を備えることを特徴とする。
【０００９】
子音判定部は、第１の周波数帯域の帯域別平均エネルギーが、第１周波数より低く第１の周波数帯域に隣接する第２の周波数帯域の帯域別エネルギーより高い、第１の周波数帯域と第２の周波数帯域との組み合わせの数を計数し、計数した計数値が、予め定められた第１閾値以上であるかどうかを判定することにより、子音が含まれるかどうかを判定してもよい。
【００１０】
子音判定部は、第１の周波数帯域の帯域別平均エネルギーが、第１の周波数帯域より低く第１の周波数帯域に隣接する第２の周波数帯域の帯域別エネルギーより高い第１の周波数帯域と第２の周波数帯域との組み合わせの数を、その組み合わせが帯域を跨いで連続する場合に重み付けをして計数し、計数した計数値が、予め定められた第２閾値以上であるかどうかを判定することにより、子音が含まれるかどうかを判定してもよい。
【００１１】
子音判定部は、第１の周波数帯域の帯域別平均エネルギーが、第１の周波数帯域より低意周波数第１の周波数帯域に隣接する第２の周波数帯域の帯域別エネルギーより高い第１の周波数帯域と第２の周波数帯域との組み合わせを抽出し、抽出した組み合わせ同士を比較し、第１の組み合わせの帯域別平均エネルギーが、第１の組み合わせより高い周波数の帯域の第２の組み合わせの帯域別平均エネルギーの方が大きい組み合わせの数を計数し、計数した計数値が、予め定められた第３閾値以上であるかどうかにより、子音が含まれるかどうかを判定してもよい。
【００１２】
子音判定部は、第１の周波数帯域の帯域別平均エネルギーが、第１周波数より低く第１の周波数帯域に隣接する第２の周波数帯域の帯域別エネルギーより高い第１の周波数帯域と第２の周波数帯域との組み合わせの数を計数し、計数した計数値が、予め定められた第１閾値以上であるかどうかを判定することにより、子音が含まれるかどうかを判定する第１判定手段と、第１の周波数帯域の帯域別平均エネルギーが、第１の周波数帯域より低く第１の周波数帯域に隣接する第２の周波数帯域の帯域別エネルギーより高い第１の周波数帯域と第２の周波数帯域との組み合わせの数を、その組み合わせが帯域を跨いで連続する場合に重み付けをして計数し、計数した計数値が、予め定められた第２閾値以上であるかどうかを判定することにより、子音が含まれるかどうかを判定する第２判定手段とを含み、フレーム化入力信号のノイズレベルを導出するノイズレベル導出部と、導出されたノイズレベルが第４閾値未満の場合、第１判定手段を選択し、第４閾値以上の場合、第２判定手段を選択する判定選択部とをさらに備えてもよい。
【００１３】
子音判定部は、第１の周波数帯域の帯域別平均エネルギーが、第１の周波数帯域より低く第１の周波数帯域に隣接する第２の周波数帯域の帯域別エネルギーより高い第１の周波数帯域と第２の周波数帯域との組み合わせを抽出し、抽出した組み合わせ同士を比較し、第１の組み合わせの帯域別平均エネルギーが、第１の組み合わせより高い周波数の帯域の第２の組み合わせの帯域別平均エネルギーの方が大きい組み合わせの数を計数し、計数した計数値が、予め定められた第３閾値以上であるかどうかにより、子音が含まれるかどうかを判定する第３判定手段をさらに含み、判定選択部は、第２判定手段によって子音と判定されなかった場合に第３判定手段を選択してもよい。
【００１４】
上記課題を解決するために、本発明の子音区間検出方法は、入力信号を予め定められたフレーム単位で切り出し、フレーム化入力信号を生成し、フレーム化入力信号を、時間領域から周波数領域に変換して、スペクトルパターンを生成し、スペクトルパターンにおける、連接する予め定められた帯域幅毎の平均エネルギーである帯域別平均エネルギーを導出し、導出した帯域別平均エネルギー同士を比較し、第１の周波数帯域の帯域別平均エネルギーが、前記第１の周波数帯域より低い第２の周波数帯域の帯域別エネルギーより高いことを検出することにより、フレーム化入力信号に子音が含まれるかどうか判定することを特徴とする。
【発明の効果】
【００１５】
以上説明したように本発明では、比較的高いノイズレベルの環境下においても精度よく子音区間を検出することが可能となる。
【図面の簡単な説明】
【００１６】
【図１】子音区間を説明するための説明図である。
【図２】子音区間を説明するための説明図である。
【図３】入力信号に繁華街の交差点におけるノイズを重ねて収録した収録時間波形図である。
【図４】ゼロクロス法で検出できない子音区間を説明するための説明図である。
【図５】ゼロクロス法で検出できる子音区間を説明するための説明図である。
【図６】ノイズを含まない入力信号に対する音声区間の判定結果である。
【図７】ノイズを含む入力信号に対する音声区間の判定結果である。
【図８】子音区間検出装置の概略的な機能を示した機能ブロック図である。
【図９】入力信号の子音区間のスペクトルパターンを示すスペクトルパターン図の一例である。
【図１０】入力信号の子音区間のスペクトルパターンを示すスペクトルパターン図の一例である。
【図１１】入力信号の子音区間のスペクトルパターンを示すスペクトルパターン図の一例である。
【図１２】入力信号の時間波形図の一例である。
【図１３】スペクトルパターンの一例である。
【図１４】帯域別平均エネルギーを示す棒グラフの一例である。
【図１５】子音区間検出方法の処理の流れを示すフローチャートである。
【図１６】第１判定手段判定ステップを説明するためのフローチャートである。
【図１７】第２判定手段判定ステップを説明するためのフローチャートである。
【図１８】第３判定手段判定ステップを説明するためのフローチャートである。
【発明を実施するための形態】
【００１７】
以下に添付図面を参照しながら、本発明の好適な実施形態について詳細に説明する。かかる実施形態に示す寸法、材料、その他具体的な数値等は、発明の理解を容易とするための例示にすぎず、特に断る場合を除き、本発明を限定するものではない。なお、本明細書及び図面において、実質的に同一の機能、構成を有する要素については、同一の符号を付することにより重複説明を省略し、また本発明に直接関係のない要素は図示を省略する。
【００１８】
図１、２は、子音区間を説明するための説明図である。特に、図１（ａ）は音声が含まれる入力信号の時間波形図であり、図１（ｂ）は同じ入力信号の同時間におけるフォルマント表示図である。図１（ｂ）に示すように、母音区間はフォルマントが強く表れるため縞模様がはっきりしているが、子音区間は母音区間とは特性が異なるためフォルマント表示図を見ても子音区間を判断できない。
【００１９】
図２（ａ）に、図１（ａ）における子音区間を拡大した時間波形図を、図２（ｂ）に、その子音区間のスペクトルパターンをそれぞれ示す。子音は、母音に比べると周波数成分が高い周波数帯域にまで渡っており、ホワイトノイズに近い周波数成分の構成をしている。したがって、図２（ｂ）に示すように、そのスペクトルパターンは周波数帯域が高くなる程、エネルギーが高くなる傾向がある。
【００２０】
このように、子音区間には高周波成分が多く含まれるため、その時間波形図における振幅値は正の値と負の値の間を頻繁に推移する特徴がある。その点に注目して子音区間を判定する手段としてゼロクロス法が提案されている。
【００２１】
図３及び図４を用いてゼロクロス法を説明する。
図３は、繁華街の交差点におけるノイズを入力信号に重ねて収録した時間波形図であり、図４は、その子音区間を拡大した時間波形図である。図３、４は、図１（ａ）、図２（ａ）に示す時間波形図と同じ入力信号である。図３、４に示したような高いノイズ環境下において、ゼロクロス法は誤検出が非常に多くなる。その理由を、入力信号にノイズを含まない場合と、ノイズを含む場合の子音区間を比較して説明する。
【００２２】
図５は、入力信号にノイズを含まない場合と、ノイズを含む場合とを対比させた時間波形図である。特に、図５（ａ）は、ノイズを含まない場合を、図５（ｂ）は、ノイズを含む場合を示し、図５（ｃ）（ｄ）は、それぞれ図５（ａ）（ｂ）における子音区間を拡大して示す。ゼロクロス法はゼロ値（図５中「−∞」で表す）をクロスする回数の多さを計測し、高周波成分を主体とする子音区間を検出するものである。図５（ｃ）に示すように、ノイズを含まない入力信号の子音区間の時間波形図では、ゼロ値をクロスして正の値の領域と負の値の領域を頻繁に推移する。しかし、ノイズを含む音声信号は特に低周波数領域のノイズが増大すると、図５（ｄ）に示すようにサンプリング点での音圧にオフセットが発生し、ゼロ値をクロスしなくなる。このように、ゼロクロス法はノイズ環境下において、そもそもゼロ値をクロスしない子音区間を検出できない場合がある。
【００２３】
図６及び図７を用いて、音声区間判定の方法を説明する。
図６は、ノイズを含まない入力信号に対する音声区間の判定結果である。特に、図６（ａ）（ｂ）は従来の有声音分析による音声区間判定手段による判定結果を、図６（ｃ）（ｄ）は従来の有声音分析による音声区間判定手段にゼロクロス法による子音区間判定手段を付加した場合の判定結果を示す。図６において、（ａ）（ｃ）は時間波形図を、（ｂ）（ｄ）は音声区間の判定結果をそれぞれ示す。音声区間の判定結果は、音声区間と判定したときに１、それ以外を０とする。図６の枠線１００で示す部分について図６（ｂ）と図７（ｄ）を比較すると理解できるように、ゼロクロス法を用いることで、従来の有声音分析による音声区間判定手段によって検出できなかった枠線１００で示す部分を音声区間と判断できる。このように、ノイズを含まない入力信号においてはゼロクロス法での子音区間の検出が可能であることがわかる。
【００２４】
図７は、ノイズを含む入力信号に対する音声区間の判定結果である。図７（ａ）（ｂ）は従来の有声音分析による音声区間判定手段にゼロクロス法による子音区間判定手段を付加した場合の判定結果を示し、図７（ｃ）（ｄ）は従来の有声音分析による音声区間判定手段に本実施形態の子音区間検出装置による子音区間判定手段を付加した場合の判定結果である。図７において、（ａ）（ｃ）は時間波形図を、（ｂ）（ｄ）は音声区間の判定結果をそれぞれ示す。判定結果は、ゼロクロス法または本実施形態の子音区間検出装置により音声区間と判定した場合を２、従来の有声音分析による音声区間判定手段により音声区間と判定した場合を１、それ以外の場合を０とする。枠線１０２で示す部分について、図７（ｂ）と図７（ｄ）を比較すると、従来の有声音分析による音声区間判定手段にゼロクロス法を付加することによっても、音声区間と判断されなかった、枠線１０２で示す部分は、本実施形態の子音区間検出装置による子音区間判定手段を付加したことにより、音声区間と判断されることが理解できる。
【００２５】
そこで、以下の実施形態では、比較的高いノイズレベルの環境下においても精度よく子音区間を検出することが可能な子音区間検出装置について詳述し、その子音区間検出装置を用いた子音区間検出方法について説明する。
【００２６】
（子音区間検出装置１１０）
図８は、この発明の実施形態に従った子音区間検出装置１１０の概略的な構成を説明するための機能ブロック図である。子音区間検出装置１１０は、フレーム化部１２０と、スペクトル生成部１２２と、帯域分割部１２４と、平均導出部１２６と、子音判定部１２８と、ノイズレベル導出部１３０と、判定選択部１３２とを含んで構成される。
【００２７】
図８に示す収音装置２００は、音声を収音し、入力信号に変換してフレーム化部１２０に出力する。フレーム化部１２０は、収音装置２００から入力された入力信号を、予め定められた時間幅を有するフレーム単位（所定サンプル数長）で順次切り出し、フレーム単位の入力信号（以下、単に「フレーム化入力信号」と称す）を生成する。また、収音装置２００から入力される入力信号がアナログ信号である場合、フレーム化部１２０の前段にＡＤコンバーターを配置しデジタル信号に変換するとしてもよい。そして、フレーム化部１２０は、生成したフレーム化入力信号を順次、スペクトル生成部１２２に送信する。
【００２８】
スペクトル生成部１２２は、フレーム化部１２０から受信したフレーム化入力信号の周波数分析を行い、時間領域のフレーム化入力信号を周波数領域のフレーム化入力信号に変換して、スペクトルを集めたスペクトルパターンを生成する。スペクトルパターンは、所定の周波数帯域に渡って、周波数とその周波数におけるエネルギーとが対応付けられた、周波数毎のスペクトルを集めたものである。ここで用いられる周波数変換法は、特定の手段に限定しないが、音声のスペクトルを認識するために必要な周波数分解能が必要であるため、比較的分解能が高いＦＦＴ（Fast Fourier Transform）やＤＣＴ（Discrete Cosine Transform）等の直交変換法を用いるとよい。スペクトル生成部１２２により生成されたスペクトルパターンは、帯域分割部１２４とノイズレベル導出部１３０に出力される。
帯域分割部１２４は、スペクトル生成部１２２が生成したスペクトルパターンの各スペクトルを、予め定められた帯域幅毎に分割し、複数の分割周波数帯域を生成する。本実施形態において、帯域分割部１２４は、例えば、８００Ｈｚ〜３．５ｋＨｚの周波数範囲について、例えば、１００Ｈｚ〜３００Ｈｚ程度の帯域幅毎に分割する。
【００２９】
平均導出部１２６は、スペクトルパターンにおける、連接する帯域分割部１２４が分割した分割周波数帯域（バンド）毎の平均エネルギーである帯域別平均エネルギーを導出
する。
【００３０】
子音判定部１２８は、平均導出部１２６が導出した帯域別平均エネルギー同士を比較し、より高周波数帯域の帯域別平均エネルギー程、高いエネルギーとなっていると、そのフレーム化入力信号に子音が含まれると判定する。すなわち、子音判定部１２８は、平均導出部１２６が導出した帯域別平均エネルギー同士を比較し、第１の周波数帯域の帯域別平均エネルギーが、第１の周波数帯域より低い周波数帯域の第２の周波数帯域の帯域別平均エネルギーに比べて高いエネルギーとなっていることを検出することにより、そのフレーム化入力信号に子音が含まれるかどうかを判定する。
例えば、帯域分割部１２４により生成された分割周波数帯域を、低い周波数帯域から高い周波数帯域へと順に、帯域０，帯域１、帯域２、帯域３…帯域ｎ-２、帯域ｎ-１、帯域ｎ（ｎは自然数）とする。平均導出部１２６は、帯域分割部１２４により生成された、それぞれの分割周波数帯域の帯域別平均エネルギーを導出する。子音判定部１２８は、帯域０と帯域１との組み合わせでそれぞれの分割周波数帯域の帯域別平均エネルギーを比較する。同様に、子音判定部１２８は、帯域１と帯域２との組み合わせ、帯域２と帯域３との組み合わせ、…帯域ｎ-２と帯域ｎ-１との組み合わせ、帯域ｎ-１と帯域ｎとの組み合わせでそれぞれの分割周波数帯域の帯域別平均エネルギーを比較する。子音判定部１２８は、例えば、帯域ｎの帯域別平均エネルギーが帯域ｎ-１の帯域別平均エネルギーより高い場合、すなわち、隣接する分割周波数帯域において高い周波数の分割周波数帯域のほうが、高い平均エネルギーであった組み合わせを検出することにより、その区間のフレーム化入力信号は子音区間であるかどうかを判定する。
【００３１】
一般的に、子音はスペクトルパターンが右上がりになる傾向がある。そこで、本実施形態の子音区間検出装置１１０は、スペクトルパターンにおける帯域別平均エネルギーを導出し、その帯域別エネルギー同士を比較することで子音に特徴的な、スペクトルパターンにおける右上がりの傾向を検出する。そのため、子音区間検出装置１１０は、入力信号に子音が含まれる子音区間を精度よく検出することができる。
【００３２】
子音判定部１２８は、具体的に、隣接する分割周波数帯域間の帯域別平均エネルギー同士を比較し、、高い周波数の分割周波数帯域の方が隣接する低い周波数の分割周波数帯域より大きい組み合わせを計数し、計数した計数値が、予め定められた第１閾値以上であると、子音が含まれると判定する第１判定手段と、隣接する分割周波数帯域の帯域別平均エネルギー同士を比較し、高い周波数の分割周波数帯域の帯域別平均エネルギーの方が隣接する低い周波数の分割周波数帯域の帯域別平均エネルギーより大きい組み合わせを計数し、更に高い周波数の分割周波数帯域の帯域別平均エネルギーの方が隣接する低い周波数の分割周波数帯域の帯域別平均エネルギーより大きい組み合わせが帯域を跨いで連続する場合に重み付けをして計数し、計数した計数値が、予め定められた第２閾値以上であると、子音が含まれると判定する第２判定手段とを含み、それぞれノイズレベルに応じて使い分ける。
すなわち、第１判定手段は、第１の周波数帯域の帯域別平均エネルギーが、第１周波数より低く第１の周波数帯域に隣接する第２の周波数帯域の帯域別エネルギーより高い周波数帯域であることを判定した第１の周波数帯域と第２の周波数帯域との組み合わせの数を計数し、計数した計数値が、予め定められた第１閾値以上であるかどうかを判定することにより、子音が含まれるかどうかを判定する。
また、第２判定手段は、第１の周波数帯域の帯域別平均エネルギーが、第１の周波数帯域より低く第１の周波数帯域に隣接する第２の周波数帯域の帯域別エネルギーより高い第１の周波数帯域と第２の周波数帯域との組み合わせの数を、その組み合わせが帯域を跨いで連続する場合に重み付けをして計数し、計数した計数値が、予め定められた第２閾値以上であるかどうかを判定することにより、子音が含まれるかどうかを判定する。
【００３３】
図９〜１１は、それぞれ、入力信号の子音区間のスペクトルパターンを示すスペクトルパターン図の一例である。ノイズレベルが比較的小さい場合、図９に示すように、子音区間のスペクトルパターンは右上がりの傾向が顕著となる。子音判定部１２８は、第１判定手段を備える構成により、スペクトルパターンの隣接する分割周波数帯域間の帯域別平均エネルギーが、高い周波数の分割周波数帯域の帯域別平均エネルギーの方が隣接する低い周波数の分割周波数帯域の帯域別平均エネルギーより大きい組み合わせの数に基づいて、子音区間を精度よく検出することができる。
【００３４】
また、ノイズレベルが比較的大きい場合、図１０に示すように、子音区間のスペクトルパターンは単に隣接する分割周波数帯域のみの比較では全体的な右上がりの傾向がノイズに埋もれてしまう。子音判定部１２８は、第２判定手段を備える構成により、スペクトルパターンの隣接する分割周波数帯域間の帯域別平均エネルギーが、高い周波数の分割周波数帯域の方が隣接する低い周波数の分割周波数帯域より大きい組み合わせについて、特にそのような組み合わせが隣接する帯域間で連続する場合に、１より大きな乗数で重み付けをして計数する。重み付けをすることで、ノイズに埋もれた子音の右上がりの傾向を検出し易くなる。したがって、子音区間検出装置１１０は、ノイズレベルが比較的大きい場合であっても、計数された値に基づき、子音区間を精度よく検出することができる。
【００３５】
ここで、第１判定手段と第２判定手段とを適宜選択すべく、ノイズレベル導出部１３０は、フレーム化入力信号のノイズレベルを導出する。本実施形態において、導出部１３０は、スペクトル生成部１２２からの信号を基に、すべての周波数帯域のエネルギーを所定時間に渡って平均した平均値をノイズレベルとして導出する。また、ノイズレベル導出部130は、平均導出部１２６が導出した帯域別平均エネルギーに基づき、特定の帯域の帯域別平均エネルギーを所定時間に渡って時間方向に平均し、ノイズレベルを導出してもよい。

また、ノイズレベル導出部１３０は、フレーム化入力信号毎にノイズレベルを導出してもよい。判定選択部１３２は、導出されたノイズレベルが第４閾値未満の場合、第１判定手段を選択し、第４閾値以上の場合、第２判定手段を選択する。第４閾値は、例えば、−５０〜−４０ｄＢとする。
【００３６】
子音区間検出装置１１０は、ノイズレベルが第４閾値未満の場合、ノイズレベルが比較的低いときに精度よく子音区間を検出できる第１判定手段を選択し、ノイズレベルが第４閾値以上の場合、ノイズレベルが比較的高いときでも、精度よく子音区間を検出できる第２判定手段を選択する。そのため、子音区間検出装置１１０は、ノイズレベルに応じた適切な手段で、子音区間を検出することが可能となる。
【００３７】
また、子音判定部１２８は、隣接する帯域（分割周波数帯域）間の帯域別平均エネルギーが、高い周波数の帯域の方が隣接する低い周波数の帯域より大きい組み合わせを抽出し、抽出した組み合わせ同士を比較し、帯域別平均エネルギーが、高い周波数の帯域の方が大きい組み合わせを計数し、計数した計数値が、予め定められた第３閾値以上であると、子音が含まれると判定する第３判定手段をさらに含んでもよい。
【００３８】
ノイズレベルが比較的大きい場合、子音区間のスペクトルパターンは単に隣接する帯域のみの比較ではその右上がりの傾向がノイズに埋もれてしまう場合がある。その上、図１１に示すように、部分的に複数個所でエネルギーが落ち込む（谷となる）スペクトルパターンの場合、右上がりの傾向に連続性がなく、第２判定手段のように、連続性に重み付けをしても子音として判定できない。
【００３９】
そのため、判定選択部１３２は、第２判定手段によって子音と判定されなかった場合に第３判定手段を選択する。第３判定手段は、スペクトルパターンの隣接する帯域間の帯域別平均エネルギーが、高い周波数の帯域の方が隣接する低い周波数の帯域より大きい組み合わせを抽出し、抽出した組み合わせ同士においても高い周波数の帯域の方が大きい場合に、即ち、抽出した組み合わせ同士を比較した際により高い周波数の帯域の組み合わせがより低い周波数の帯域の組み合わせより帯域別平均エネルギーが大きい場合に、１より大きな乗数で重み付けをして計数し、計数した計数値が第３閾値以上であった場合に、子音が含まれると判定する。
言い換えると、第３判定手段は、第１の周波数帯域の帯域別平均エネルギーが、第１の周波数帯域より低く第１の周波数帯域に隣接する第２の周波数帯域の帯域別エネルギーより高い第１の周波数帯域と第２の周波数帯域との組み合わせを抽出し、抽出した組み合わせ同士を比較し、第１の組み合わせの帯域別平均エネルギーが、第１の組み合わせより高い周波数の帯域の第２の組み合わせの帯域別平均エネルギーの方が大きい組み合わせの数を計数し、計数した計数値が、予め定められた第３閾値以上であると、子音が含まれると判定する。
【００４０】
このように、帯域別平均エネルギーを広帯域に渡って比較することで、ノイズの影響が比較的大きくともスペクトルパターン全体から、右上がりの傾向を計数として数値化できる。そのため、子音区間検出装置１１０は、計数された値に基づいて、子音区間を精度よく検出可能となる。
【００４１】
すなわち、子音判定部１２８が第２判定手段をもってしても子音と判定しなかった場合、それでもまだ子音区間の検出漏れの可能性がある。そこで、第２判定手段で子音と判定されなかった場合、子音判定部１２８は、さらに、ノイズの影響を受けにくい第３判定手段を用いて子音の検出を試みる。かかる構成により、子音区間検出装置１１０は、より確実に子音区間を検出することが可能となる。
【００４２】
第２判定手段、第３判定手段について、図１２から図１３を用いて、さらに説明する。
図１２は、入力信号の時間波形図の一例であり、図１３は、図１２に示す子音区間２１０の入力信号のスペクトルパターンの一例であり、図１４は、図１３で示すスペクトルパターンの帯域別平均エネルギーを示す棒グラフの一例である。
【００４３】
図１２に示す入力信号の子音区間２１０について、スペクトルパターンを生成すると、図１３に示すように、そのままでは右肩上がりの傾向が検出しにくい。しかし、適切な帯域幅毎のエネルギーの平均値である帯域別平均エネルギーを例えば図１４のような、棒グラフに示すと、部分的に右肩上がりの傾向があることがわかる。第２判定手段では、このような部分的な右肩上がりの傾向の強さによって子音区間か否かを判定する。また、たとえ、第２判定手段で子音区間であると判定されなかったとしても、第３判定手段によって子音区間と判定されるので、いずれにせよ、子音区間の検出精度を高めることができる。
【００４４】
以上、上述したように、本実施形態の子音区間検出装置１１０によれば、比較的高いノイズレベルの環境下においても精度よく子音区間を検出することができる。
【００４５】
（子音区間検出方法）
次に、上述した子音区間検出装置１１０を用いて入力信号を分析し、子音区間か否かを判定する子音区間検出方法を説明する。
【００４６】
図１５は、子音区間検出装置１１０を用いた子音区間検出方法の処理の流れを示すフローチャートである。入力信号の入力がある場合（Ｓ３００におけるＹＥＳ）、フレーム化部１２０は、子音区間検出装置１１０が取得した入力信号を、所定のフレーム単位で順次切り出し、フレーム化入力信号を生成する（Ｓ３０２）。そして、スペクトル生成部１２２は、フレーム化部１２０から受信したフレーム化入力信号の周波数分析を行い、時間領域のフレーム化入力信号を周波数領域のフレーム化入力信号に変換してスペクトルパターンを生成する（Ｓ３０４）。
【００４７】
帯域分割部１２４は、スペクトルパターンの各スペクトルを複数の分割周波数帯域に分割して、各分割周波数帯域に対して０から昇順に番号を振る（Ｓ３０６）。平均導出部１２６は、スペクトルパターンにおける、連接する分割周波数帯域毎の帯域別平均エネルギーである帯域別平均エネルギーを導出する（Ｓ３０８）。ノイズレベル導出部１３０は、フレーム化入力信号のノイズレベルを導出する（Ｓ３１０）。子音判定部１２８は、ノイズレベル導出部１３０が導出したノイズレベルが第４閾値未満か否かを判定する（Ｓ３１２）。第４閾値未満の場合（Ｓ３１２におけるＹＥＳ）、子音判定部１２８は、第１判定手段によって子音区間の判定を行う（Ｓ３１４）。第４閾値以上の場合（Ｓ３１２におけるＮＯ）、子音判定部１２８は、第２判定手段によって子音区間の判定を行う（Ｓ３１６）。
【００４８】
第２判定手段判定ステップＳ３１６において、子音区間と判定されたか否かを判定し（Ｓ３１８）、子音区間と判定されなかった場合（Ｓ３１８におけるＮＯ）、子音判定部１２８は、第３判定手段によって子音区間の判定を行う（Ｓ３２０）。そして、子音判定部１２８は、子音区間の判定結果（いずれか１の判定手段において子音区間と判定されれば、判定結果は子音区間となる。）を外部装置に出力し（Ｓ３２２）、入力信号判定ステップＳ３００に戻る。
【００４９】
続いて、第１判定手段について図１６を用いて説明する。図１６は、第１判定手段判定ステップＳ３１４を説明するためのフローチャートである。第１判定手段判定ステップＳ３１４において、帯域には、周波数の低い帯域から順次、０から始まる整数の番号が振られている。
【００５０】
子音判定部１２８は、変数ｎ、ｃｏｕｎｔに０を代入して初期化を行い（Ｓ３５０）、番号ｎ＋１が振られている帯域の帯域別平均エネルギーが、番号ｎが振られている帯域の帯域別平均エネルギーより大きいか否かを判定する（Ｓ３５２）。大きい場合（Ｓ３５２におけるＹＥＳ）、すなわち、着目する帯域より高い周波数の帯域の帯域別平均エネルギーが高い場合、変数ｃｏｕｎｔに１を加える（Ｓ３５４）。番号ｎ＋１が振られている帯域の帯域別平均エネルギーが、番号ｎが振られている帯域の帯域別平均エネルギー以下の場合（Ｓ３５２におけるＮＯ）、変数ｃｏｕｎｔはそのままとする。
【００５１】
そして、子音判定部１２８は、番号ｎ＋２が振られている帯域があるか否かを判定する（Ｓ３５６）。番号ｎ＋２が振られている帯域がある場合（Ｓ３５６におけるＹＥＳ）、子音判定部１２８は、変数ｎに１を加え（Ｓ３５８）、エネルギー判定ステップＳ３５２に戻る。番号ｎ＋２が振られている帯域がない場合（Ｓ３５６におけるＮＯ）、すべての帯域の帯域別平均エネルギーの比較が終了していることとなるので、子音判定部１２８は、変数ｃｏｕｎｔが、予め定められた第１閾値以上であるか否かを判定する（Ｓ３６０）。第１閾値以上である場合（Ｓ３６０におけるＹＥＳ）、子音判定部１２８は、子音が含まれると判定する（Ｓ３６２）。また、第１閾値未満である場合（Ｓ３６０におけるＮＯ）、子音判定部１２８は、子音が含まれないと判定する（Ｓ３６４）。
以上のように第１判定手段では、隣接する帯域間の帯域別平均エネルギーが、高い周波数の帯域の方が隣接する低い周波数の帯域より大きい組み合わせを変数ｃｏｕｎｔとして計数し、変数ｃｏｕｎｔが、予め定められた第１閾値以上であると、子音が含まれると判定する。
なお、第１閾値は、例えば、４のような値とするが、第１閾値は周波数分解能によって最適な値は異なる。また、第１閾値は子音区間装置が用いられる場所のノイズの種類や、使用される言語によっても最適な値が異なるので、実測値等を考慮して設定することが好ましい。
【００５２】
続いて、第２判定手段について図１７を用いて説明する。図１７は、第２判定手段判定ステップＳ３１６を説明するためのフローチャートである。第２判定手段判定ステップＳ３１６においても、第１判定手段判定ステップＳ３１４と同様、帯域には、周波数の低い帯域から順次、０から始まる整数の番号が振られている。
【００５３】
子音判定部１２８は、変数ｎ、ｃｏｕｎｔに０を、ｐに１を代入して初期化を行い（Ｓ４００）、番号ｎ＋１が振られている帯域の帯域別平均エネルギーが、番号ｎが振られている帯域の帯域別平均エネルギーより大きいか否かを判定する（Ｓ４０２）。大きい場合（Ｓ４０２におけるＹＥＳ）、変数ｃｏｕｎｔに変数ｐを加える（Ｓ４０４）。そして、子音判定部１２８は、変数ｐに重み付けとして１を加える（Ｓ４０６）。番号ｎ＋１が振られている帯域の帯域別平均エネルギーが、番号ｎが振られている帯域の帯域別平均エネルギー以下の場合（Ｓ４０２におけるＮＯ）、変数ｃｏｕｎｔはそのままとし、変数ｐに１を代入して変数ｐをリセットする（Ｓ４０８）。
【００５４】
そして、子音判定部１２８は、番号ｎ＋２が振られている帯域があるか否かを判定する（Ｓ４１０）。番号ｎ＋２が振られている帯域がある場合（Ｓ４１０におけるＹＥＳ）、子音判定部１２８は、変数ｎに１を加え（Ｓ４１２）、エネルギー判定ステップＳ４０２に戻る。番号ｎ＋２が振られている帯域がない場合（Ｓ４１０におけるＮＯ）、すべての帯域の帯域別平均エネルギーの比較が終了していることとなるので、子音判定部１２８は、変数ｃｏｕｎｔが、予め定められた第２閾値以上であるか否かを判定する（Ｓ４１４）。第２閾値以上である場合（Ｓ４１４におけるＹＥＳ）、子音判定部１２８は、子音が含まれると判定する（Ｓ４１６）。また、第２閾値未満である場合（Ｓ４１４におけるＮＯ）、子音判定部１２８は、子音が含まれないと判定する（Ｓ４１８）。
【００５５】
隣接する帯域間で連続して、高い周波数の帯域の帯域別平均エネルギーの方が低い周波数の帯域の帯域別平均エネルギーより高いということは、子音区間の特徴である。上述したように、子音判定部１２８は、第２判定手段により、右肩上がりの帯域が隣接する帯域間で連続した場合に重み付けをして子音区間の判定を行う。このことにより、子音区間検出装置１１０はノイズの影響により判定の指標としている変数ｃｏｕｎｔの値が低くなり、子音区間でないと判定されてしまう帯域が増加する事態を回避できる。すなわち、子音区間検出装置１１０は、比較的高いノイズレベルの環境下において、子音区間の検出漏れを抑制することが可能となる。また、第４閾値よりもノイズレベルが低い場合、第２判定手段は実行されないため（図１５のステップＳ３１２Ｙｅｓ）、ノイズレベルが比較的低い環境下において、子音区間でない区間を子音区間と誤判定してしまう事態も回避できる。
【００５６】
続いて、第３判定手段について図１８を用いて説明する。図１８は、第３判定手段判定ステップＳ３２０を説明するためのフローチャートである。第３判定手段判定ステップＳ３２０においても、第１判定手段判定ステップＳ３１４と同様、帯域には、周波数の低い帯域から順次、０から始まる整数の番号が振られている。
【００５７】
子音判定部１２８は、変数ｎ、ｍ、ｋ、ｃｏｕｎｔに０を代入して初期化を行う（Ｓ４５０）。ここで追加した変数ｍは隣接する帯域が右肩上がりの際に新しく割り当てられた番号であり帯域組み合わせ番号：省略して「組み合わせ」と呼び、ｋは右肩上がりが継続していることを示す目印（指標）の一種である。次に番号ｎ＋１が振られている帯域の帯域別平均エネルギーが、番号ｎが振られている帯域の帯域別平均エネルギーより大きいか否かを判定する（Ｓ４５２）。大きい場合（Ｓ４５２におけるＹＥＳ）、組み合わせ（ｍ）に番号ｎ＋１が振られている帯域の帯域別平均エネルギーを代入し、帯域別平均エネルギーが連続して大きくなっていることを担保すべく変数ｋに１を設定する（Ｓ４５４）。番号ｎ＋１が振られている帯域の帯域別平均エネルギーが、番号ｎが振られている帯域の帯域別平均エネルギー以下の場合（Ｓ４５２におけるＮＯ）、変数ｋが１であるか否か判定され（Ｓ４５６）、変数ｋが１であれば連続して右肩上がりの帯域が存在した結果を残すため（Ｓ４５６におけるＹＥＳ）、変数ｍに１を加え、ｋに０を設定する（Ｓ４５８）。組み合わせ（ｍ）には最後に検出された帯域の平均エネルギーが格納される。変数ｋが１でない、即ち、０であれば（Ｓ４５６におけるＮＯ）、変数ｍはそのままとし、帯域判定ステップＳ４６０に移行する。
【００５８】
そして、子音判定部１２８は、番号ｎ＋２が振られている帯域があるか否かを判定する（Ｓ４６０）。番号ｎ＋２が振られている帯域がある場合（Ｓ４６０におけるＹＥＳ）、子音判定部１２８は、変数ｎに１を加え（Ｓ４６２）、エネルギー判定ステップＳ４５２に戻る。番号ｎ＋２が振られている帯域がない場合（Ｓ４６０におけるＮＯ）、すべての帯域の帯域別平均エネルギーの比較が終了していることとなるので、変数ｍに０を代入してリセットし（Ｓ４６４）、組み合わせ（ｍ＋１）の帯域別平均エネルギーが、組み合わせ（ｍ）の帯域別平均エネルギーより大きいか否かを判定する（Ｓ４６６）。大きい場合（Ｓ４６６におけるＹＥＳ）、すなわち、着目する帯域組み合わせ番号として認定された帯域より高い周波数の帯域の帯域別平均エネルギーが高い場合、変数ｃｏｕｎｔに１を加える（Ｓ４６８）。組み合わせ（ｍ＋１）の帯域別平均エネルギーが、組み合わせ（ｍ）の帯域別平均エネルギー以下の場合（Ｓ４６６におけるＮＯ）、変数ｃｏｕｎｔはそのままとする。
【００５９】
そして、子音判定部１２８は、組み合わせ（ｍ＋２）があるか否かを判定する（Ｓ４７０）。組み合わせ（ｍ＋２）がある場合（Ｓ４７０におけるＹＥＳ）、子音判定部１２８は、変数ｍに１を加え（Ｓ４７２）、エネルギー判定ステップＳ４６６に戻る。組み合わせ（ｍ＋２）がない場合（Ｓ４７０におけるＮＯ）、すべての組み合わせの帯域別平均エネルギーの比較が終了していることとなるので、子音判定部１２８は、変数ｃｏｕｎｔが、予め定められた第３閾値以上であるか否かを判定する（Ｓ４７４）。第３閾値以上である場合（Ｓ４７４におけるＹＥＳ）、子音判定部１２８は、子音が含まれると判定する（Ｓ４７６）。また、第３閾値未満である場合（Ｓ４７４におけるＮＯ）、子音判定部１２８は、子音が含まれないと判定する（Ｓ４７８）。
なお、上述したフローチャートでは、説明を簡単にするために、２つの分割周波数帯域のペアで帯域別エネルギーを比較して、右肩上がりを検出して、子音検出を行ったが、例えば、第３判定手段では、連接する分割周波数帯域が３つ以上に渡って、右肩上がり、すなわち高い周波数の分割周波数帯域ほど高い帯域別エネルギーを持つ場合にのみ、他の３つ以上の分割周波数帯域に渡って右肩上がりである周波数区間と比較して、重み付けを行うかどうか決めてもよい。このような設定の最適値は、周波数分解能や、機器の使われる環境や言語の種類によっても変わるので、状況に応じて選択する。
また、第２閾値についても周囲のノイズ成分や言語の種類、更には重み付けの程度にも依存するため、状況に応じて選択する。また、第３閾値の値についても、周囲のノイズ成分や言語の種類、更には重み付けの程度に依存するため、状況に応じて選択する。
【００６０】
ノイズレベルが比較的高い環境下において、隣接する帯域間ではノイズの影響により子音の特徴は部分的に失われる場合がある。第３判定手段では、隣接する帯域間の帯域別平均エネルギーではなく、高い周波数の帯域の方が隣接する低い周波数の帯域より大きい組み合わせにおいて、組み合わせの中に存在する最も高い帯域の平均エネルギー同士を比較することで、周波数軸上における広い周波数帯域に渡る子音の特徴を数値化（モデル化）して、子音区間か否かを判定する。この場合には、さらにノイズレベルが比較的高い環境下においても、広い周波数帯域のエネルギー推移を加点して、子音区間の特徴を計数値に反映することが可能となる。なお、第３判定手段では、高い周波数の帯域の方が隣接する低い周波数の帯域より大きい組み合わせにおいて、組み合わせの中に存在する全ての帯域の平均エネルギーを更に平均した平均エネルギー同士を比較してもよい。
【００６１】
上述したように、第２判定手段では、連続性に重み付けをする際、同じ回数だけエネルギー平均値が増加した場合、断続的に増加した場合に対し連続的に増加した場合の方が変数ｐの値は大きくなる。かかる構成により、より子音区間のスペクトルパターンの特徴を捉えた子音区間の検出が可能となる。また、本実施形態において、変数ｐに加算する値は１としているが、１に限らず、１以上の値でもよいし、１以下の値でもよい。また、第２閾値の値については、変数ｐの設定値との関連により最適な値を設定する。
例えば、図１７に示した例では、変数ｃｏｕｎｔに対する重み付けが右肩上がりの帯域が連続する区間が長くなるにつれ、増大していくため、第２閾値は、少なくとも第１閾値よりは大きな値とし、ノイズを誤って子音と判定しないようにしたい場合は、より大きな値を設定する。第２閾値は、周囲ノイズの大きさによっても最適な値が異なる。また、第２閾値は、第４閾値の設定値によっても、最適な値が異なる。
【００６２】
さらに、上述した実施形態では、帯域別平均エネルギーを比較する帯域に制限を設けていないが、例えば、ノイズの影響を回避するために、使用状況に応じ比較する帯域の周波数の範囲を限定してもよい。具体的に、一般的にノイズによるエネルギー成分の高い、低い周波数帯域（約１ｋＨｚ以下）や、周波数解析（スペクトルパターン生成）処理における折り返し歪が含まれ易い、高い周波数帯域（約３．５ｋＨｚ以上）は排除してもよい。このように、比較する帯域の周波数の範囲を限定する構成により、子音区間検出装置１１０は、ノイズレベルが比較的高い環境下においても、子音区間の誤検出を抑制できる。
なお、上述した実施形態では平均導出部１２６は、スペクトルパターンにおける、連接する帯域分割部１２４が分割した分割周波数帯域（バンド）毎の平均エネルギーである帯域別平均エネルギーを導出したが、平均導出部１２６は、スペクトルパターンにおける、連接する帯域分割部１２４が分割した分割周波数帯域（バンド）毎の例えば帯域別最大エネルギーを導出してもよい。すなわち、平均導出部１２６は、スペクトルパターンにおける、連接する帯域分割部１２４が分割した分割周波数帯域（バンド）毎の帯域別エネルギーを導出すればよい。
【００６３】
以上説明した子音区間検出方法によっても、ノイズレベルに拘らず、入力信号の音声区間を検出することが可能となる。
【００６４】
以上、添付図面を参照しながら本発明の好適な実施形態について説明したが、本発明はかかる実施形態に限定されないことは言うまでもない。当業者であれば、特許請求の範囲に記載された範疇において、各種の変更例または修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。
【００６５】
なお、本明細書の子音区間検出方法における各工程は、必ずしもフローチャートとして記載された順序に沿って時系列に処理する必要はなく、並列的あるいはサブルーチンによる処理を含んでもよい。
【産業上の利用可能性】
【００６６】
本発明は、入力信号の子音区間を検出する子音区間検出装置および子音区間検出方法に利用することができる。
【符号の説明】
【００６７】
１１０ …子音区間検出装置
１２０ …フレーム化部
１２２ …スペクトル生成部
１２４ …帯域分割部
１２６ …平均導出部
１２８ …子音判定部
１３０ …ノイズレベル判定部
１３２ …判定選択部

【特許請求の範囲】
【請求項１】
入力信号を予め定められたフレーム単位で切り出し、フレーム化入力信号を生成するフレーム化部と、
前記フレーム化入力信号を、時間領域から周波数領域に変換してスペクトルパターンを生成するスペクトル生成部と、
前記スペクトルパターンにおける、連接する予め定められた帯域幅毎の平均エネルギーである帯域別平均エネルギーを導出する平均導出部と、
導出された前記帯域別平均エネルギー同士を比較し、第１の周波数帯域の帯域別平均エネルギーが、前記第１の周波数帯域より低い周波数帯域である第２の周波数帯域の帯域別エネルギーより高いことを検出することにより、前記フレーム化入力信号に子音が含まれるかどうかを判定する子音判定部と、
を備えることを特徴とする子音区間検出装置。
【請求項２】
前記第１の周波数帯域と、前記第２の周波数帯域は、隣接する帯域であって、
前記子音判定部は、前記第１の周波数帯域の帯域別平均エネルギーが、前記第２の周波数帯域の帯域別エネルギーより高いことを検出した前記第１の周波数帯域と、前記第２の周波数帯域との組み合わせを計数し、計数した計数値が、予め定められた第１閾値以上であるかどうかにより、子音が含まれるかどうかを判定することを特徴とする請求項１に記載の子音区間検出装置。
【請求項３】
前記第１の周波数帯域と、前記第２の周波数帯域は、隣接する帯域であって、
前記子音判定部は、前記第１の周波数帯域の帯域別平均エネルギーが、前記第２の周波数帯域の帯域別エネルギーより高いことを検出した前記第１の周波数帯域と前記第２の周波数帯域との組み合わせを、前記組み合わせが帯域を跨いで連続する場合に重み付けをして計数し、計数した計数値が、予め定められた第２閾値以上であるかどうかにより、子音が含まれるかどうかを判定することを特徴とする請求項１に記載の子音区間検出装置。
【請求項４】
前記第１の周波数帯域と、前記第２の周波数帯域は、隣接する帯域であって、
前記子音判定部は、前記第１の周波数帯域の帯域別平均エネルギーが、前記第２の周波数帯域の帯域別エネルギーより高いことを検出した前記第１の周波数帯域と、前記第２の周波数帯域との組み合わせを抽出し、抽出した前記組み合わせ同士を比較し、第１の組み合わせの帯域別平均エネルギーが、前記第１の組み合わせより低い周波数の帯域の第２の組み合わせの帯域別平均エネルギーより大きい組み合わせの数を計数し、計数した計数値が、予め定められた第３閾値以上であるかどうかにより、子音が含まれるかどうかを判定することを特徴とする請求項１に記載の子音区間検出装置。
【請求項５】
前記第１の周波数帯域と、前記第２の周波数帯域は、隣接する帯域であって、
前記子音判定部は、前記第１の周波数帯域の帯域別平均エネルギーが、前記第２の周波数帯域の帯域別エネルギーより高いことを検出した前記第１の周波数帯域と、前記第２の周波数帯域との組み合わせを計数し、計数した計数値が、予め定められた第１閾値以上であると、子音が含まれると判定する第１判定手段と、前記第１の周波数帯域の帯域別平均エネルギーが、前記第２の周波数帯域の帯域別エネルギーより高いことを検出した前記第１の周波数帯域と、前記第２の周波数帯域との組み合わせを、前記組み合わせが帯域を跨いで連続する場合に重み付けをして計数し、計数した計数値が、予め定められた第２閾値以上かどうかにより、子音が含まれるかどうかを判定する第２判定手段とを含み、
前記フレーム化入力信号のノイズレベルを導出するノイズレベル導出部と、
導出された前記ノイズレベルが第４閾値未満の場合、第１判定手段を選択し、前記第４閾値以上の場合、第２判定手段を選択する判定選択部と、
をさらに備えることを特徴とする請求項１に記載の子音区間検出装置。
【請求項６】
前記第１の周波数帯域と、前記第２の周波数帯域は、隣接する帯域であって、
前記子音判定部は、前記第１の周波数帯域の帯域別平均エネルギーが、前記第２の周波数帯域の帯域別エネルギーより高いことを検出した前記第１の周波数帯域と、前記第２の周波数帯域との組み合わせを抽出し、抽出した前記組み合わせ同士を比較し、前記組み合わせの帯域別平均エネルギーが、第１の組み合わせの帯域別平均エネルギーが、前記第１の組み合わせより低い周波数の帯域の第２の組み合わせの帯域別平均エネルギーより大きい組み合わせの数を計数し、計数した計数値が、予め定められた第３閾値以上であるかどうかにより、子音が含まれるかどうかを判定する第３判定手段をさらに含み、
前記判定選択部は、前記第２判定手段によって子音と判定されなかった場合に前記第３判定手段を選択することを特徴とする請求項５に記載の子音区間検出装置。
【請求項７】
入力信号を予め定められたフレーム単位で切り出し、フレーム化入力信号を生成し、
前記フレーム化入力信号を、時間領域から周波数領域に変換してスペクトルパターンを生成し、
前記スペクトルパターンにおける、連接する予め定められた帯域幅毎の平均エネルギーである帯域別平均エネルギーを導出し、
導出した前記帯域別平均エネルギー同士を比較し、第１の周波数帯域の帯域別平均エネルギーが、前記第１の周波数帯域より低い周波数帯域である第２の周波数帯域の帯域別エネルギーより高いことを検出することにより、前記フレーム化入力信号に子音が含まれるかどうかを判定することを特徴とする子音区間検出方法。

【図１】