説明

ノイズ除去装置およびノイズ除去方法

【課題】高ノイズ環境下においても、処理負荷を増大することなく音声区間判定およびノイズ除去の精度を向上する。
【解決手段】本発明のノイズ除去装置100は、所定区間のオーディオデータが、音声が含まれる音声区間であるか、音声が含まれない非音声区間であるかを判定する音声区間判定部118と、音声区間判定部の判定結果を保持するパラメータ保持部114と、音声区間判定部の判定結果が非音声区間であれば適応フィルタ130の適応処理を行いつつ、音声区間であれば適応フィルタを固定して、所定区間のオーディオデータのノイズ成分を除去するノイズ除去部120とを備え、音声区間判定部が、ノイズ除去部によってノイズ成分が除去されたオーディオデータの音声区間判定を再度実行し、その判定結果がパラメータ保持部に保持された判定結果と異なる場合、ノイズ除去部は、ノイズ成分の除去を再度実行する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、収音したオーディオデータからノイズ成分を除去することが可能なノイズ除去装置およびノイズ除去方法に関する。
【背景技術】
【0002】
マイクロホンに入力されたオーディオデータには、所望する音声の他に音響ノイズ(以下、単にノイズと略す。)も含まれるので、音声の音質が損なわれ、所望するオーディオデータの音質を得ることができなかった。
【0003】
そこで、適応フィルタ技術を用い、オーディオデータに混入したノイズ成分を除去して音声データを抽出する技術が開示されている(例えば、特許文献1)。ここで、適応フィルタは、オーディオデータに、主として音声が含まれている間(音声区間)、フィルタ係数の適応処理を停止することでノイズへの適応精度を高めている。このように、オーディオデータに、主として音声が含まれていることは、例えば、音声とノイズの短時間パワーの差分に基づいて判定することができる(例えば、特許文献2)。また、オーディオデータのスペクトラムに基づいて、主として音声が含まれるオーディオデータの始点と終点とを判定する技術も知られている(例えば、特許文献3)。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2004−198810号公報
【特許文献2】特開2000−322074号公報
【特許文献3】米国特許第5692104号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかし、ノイズ成分が高い高ノイズ環境下では、特許文献2や特許文献3に記載された音声区間判定技術を用いても、音声が含まれる音声区間と音声が含まれない非音声区間とを誤判定してしまう場合がある。また、特許文献1に記載された技術では、特に、ノイズ源とマイクロホンの間の伝達特性が時間経過に伴い変動する場合に、収音したオーディオデータのうちノイズ成分に絞って適応フィルタの適応処理を続ける必要がある。それにも拘わらず、高ノイズ環境下において音声区間と非音声区間とが誤判定されてしまうと、適応処理に必要な非音声区間を十分とれなかったり、適応フィルタが、音声が含まれるオーディオデータに適応してしまったりして、ノイズ除去を正しく行うことができなかった。
【0006】
本発明は、このような課題に鑑み、高ノイズ環境下においても、処理負荷を増大することなく音声区間判定およびノイズ除去の精度を向上することが可能なノイズ除去装置およびノイズ除去方法を提供することを目的としている。
【課題を解決するための手段】
【0007】
上記課題を解決するために、本発明のノイズ除去装置は、所定区間のオーディオデータが、音声が含まれる音声区間であるか、音声が含まれない非音声区間であるかを判定する音声区間判定部と、音声区間判定部の判定結果を保持するパラメータ保持部と、音声区間判定部の判定結果が非音声区間であれば適応フィルタの適応処理を行いつつ、音声区間であれば適応フィルタを固定して、所定区間のオーディオデータのノイズ成分を除去するノイズ除去部とを備え、音声区間判定部が、ノイズ除去部によってノイズ成分が除去されたオーディオデータの音声区間判定を再度実行し、その判定結果がパラメータ保持部に保持された判定結果と異なる場合、ノイズ除去部は、ノイズ成分の除去を再度実行することを特徴とする。
【0008】
ノイズ除去部は、ノイズ成分の除去を再度実行する場合、同一の所定区間のオーディオデータの1回目のノイズ成分の除去を実行する前の適応フィルタの状態を復元する。
【0009】
音声区間判定部およびノイズ除去部は、時刻の異なる所定区間のオーディオデータを複数並行して処理してもよい。
【0010】
上記課題を解決するために、本発明のノイズ除去方法は、所定区間のオーディオデータが、音声が含まれる音声区間であるか、音声が含まれない非音声区間であるかを判定し、その判定結果をパラメータ保持部に保持し、判定結果が非音声区間であれば適応フィルタの適応処理を行いつつ、音声区間であれば適応フィルタを固定して、所定区間のオーディオデータのノイズ成分を除去し、ノイズ成分が除去されたオーディオデータの音声区間判定を再度実行し、その判定結果がパラメータ保持部に保持された判定結果と異なる場合、ノイズ成分の除去を再度実行することを特徴とする。
【発明の効果】
【0011】
本発明のノイズ除去装置は、音声区間判定処理とノイズ除去処理との処理結果を相互に利用することで、高ノイズ環境下においても音声区間判定処理およびノイズ除去処理の精度を向上することが可能となる。また、このような処理の処理結果を相互利用する場合の一部の処理を、その必要性に応じて実行しないことで処理負荷の増大を回避することができる。
【図面の簡単な説明】
【0012】
【図1】ノイズ除去装置の概略的な構成を示した機能ブロック図である。
【図2】ノイズ除去部の概略的な構成を示した機能ブロック図である。
【図3】適応フィルタの構成例を示した説明図である。
【図4】ノイズ除去装置の全体的な処理を示したフローチャートである。
【図5】各処理の実行タイミングを示したタイミングチャートである。
【発明を実施するための形態】
【0013】
以下に添付図面を参照しながら、本発明の好適な実施形態について詳細に説明する。かかる実施形態に示す寸法、材料、その他具体的な数値などは、発明の理解を容易とするための例示にすぎず、特に断る場合を除き、本発明を限定するものではない。なお、本明細書及び図面において、実質的に同一の機能、構成を有する要素については、同一の符号を付することにより重複説明を省略し、また本発明に直接関係のない要素は図示を省略する。
【0014】
(第1の実施形態:ノイズ除去装置100)
図1は、ノイズ除去装置100の概略的な構成を示した機能ブロック図である。ノイズ除去装置100は、マイクロホン110(図1中では、マイクロホン110a、110bで示す。)と、データ保持部112(図1中では、データ保持部112a、112bで示す。)と、パラメータ保持部114と、セレクタ116と、音声区間判定部118と、ノイズ除去部120と、制御部122とを含んで構成される。図1中、実線はオーディオデータ等のデータの流れを、破線は制御信号やパラメータの流れを示している。
【0015】
マイクロホン110a、110bは、物理振動を電気信号に変換する機器であり、マイクロホン110a、110b周囲の音を集音してオーディオ信号に変換する。また、マイクロホン110a、110bは、位置を異にして設けられ、特に、マイクロホン110aは、主として音声の入力を目的とし、マイクロホン110bは、主としてノイズの入力を目的としている。本実施形態に適用可能なマイクロホン110a、110bは、任意の伝達媒体の振動を音信号に変換できれば足り、例えば、コンデンサマイク、ダイナミックマイク、リボンマイク、圧電マイク、カーボンマイク等も用いることができる。マイクロホン110a、110bで変換されたオーディオ信号は、さらにA/D変換(図示せず)を通じて1フレーム256サンプルのオーディオデータ(マイクロホン110aでは第1オーディオデータ、マイクロホン110bでは第2オーディオデータ)に変換され、セレクタ116に送信、および、データ保持部112aに保持される。
【0016】
データ保持部112a、112bは、フラッシュメモリ、HDD(Hard Disk Drive)等の記憶媒体で構成され、オーディオデータ等のデータを一時的に保持する。具体的に、データ保持部112aは、第1オーディオデータおよび第2オーディオデータを保持し、データ保持部112bは、ノイズ除去部120でノイズ成分が除去された第1オーディオデータを保持する。パラメータ保持部114は、フラッシュメモリ、HDD等の記憶媒体で構成され、音声区間判定部118の判定結果やノイズ除去部120における適応フィルタの各パラメータ(フィルタ係数、シフトレジスタ値等)を保持する。セレクタ116は、後述する制御部122の制御信号に応じて、音声区間判定部118に入力するデータを選択する。
【0017】
音声区間判定部118は、所定区間(1フレーム)分のオーディオデータが、音声が含まれる音声区間であるか、音声が含まれない非音声区間であるかを、例えば、音声成分とノイズ成分との短時間パワー(エネルギー)の差分に基づいて判定し(以下、単に「音声区間判定処理」という。)、その判定結果をノイズ除去部120に送信すると共に、パラメータ保持部114に保持する。また、音声区間判定部118は、オーディオデータのスペクトラムに基づいて、周波数特性から音声区間と非音声区間とを判定することもできる。このような音声区間の判定技術は、様々な既存の技術を採用できるので、ここでは、その詳細な説明を省略する。
【0018】
ノイズ除去部120は、適応フィルタを有し、第1オーディオデータに含まれるノイズ成分を第2オーディオデータに基づいて適応させ、第1オーディオデータと適応された第2オーディオデータとでノイズ成分を相殺し、第1オーディオデータからノイズ成分を除去して音声データを抽出する(以下、単に「ノイズ除去処理」という。)。また、ノイズ除去部120の適応フィルタは、音声区間判定部118の判定結果に基づき、判定結果が非音声区間であれば適応フィルタの適応処理を行いつつ、所定区間のオーディオデータのノイズ成分を除去し、音声区間であれば適応フィルタを固定して(停止して)、所定区間のオーディオデータのノイズ成分を除去する。こうして、適応フィルタが第1オーディオデータのノイズ成分にのみ適応することとなる。かかる処理の具体的な動作は後ほど詳述する。また、ノイズ除去部120は、所定区間(1フレーム)の処理毎に、適応フィルタの各パラメータをパラメータ保持部114に保持する。
【0019】
制御部122は、中央処理装置(CPU)、プログラム等が格納されたROM、ワークエリアとしてのRAM等を含む半導体集積回路により、音声区間判定部118およびノイズ除去部120を制御する。制御部122は、音声区間判定部118に、ノイズ除去部120の1回目のノイズ除去処理によってノイズ成分が除去されたオーディオデータの音声区間判定を再度実行させ(2回目の音声区間判定処理)、その2回目の音声区間判定処理の判定結果が、パラメータ保持部114に保持された1回目の判定結果と異なる場合、ノイズ除去部120に、ノイズ除去処理を再度実行させる。かかる処理の流れは後ほど詳述する。
【0020】
(ノイズ除去処理)
図2は、ノイズ除去部120の概略的な構成を示した機能ブロック図である。ノイズ除去部120は、適応フィルタ130と、減算器132とを含んで構成される。ここでは、理解を容易にするため、第1オーディオデータおよび第2オーディオデータのバッファとして機能するデータ保持部112aを省略して説明する。
【0021】
ノイズ除去装置100における2つのマイクロホン110a、110bの位置が異なるので、音声源140やノイズ源142から2つのマイクロホン110a、110bまでの音響伝達特性は、それぞれ異なることとなる。ここでは、2つのマイクロホン110a、110bにおける音声源140とノイズ源142からの音響伝達特性の違いを利用し、ノイズ源142からの音響伝達特性を推定、相殺することで、音声を抽出することを目的としている。
【0022】
具体的に、音声源140の音声をVo、ノイズ源142におけるノイズをNo、音声源140からマイクロホン110a、110bまでの音声の伝達関数をV1、V2、ノイズ源142からマイクロホン110a、110bまでの音声の伝達関数をN1、N2、適応フィルタ130の伝達関数をPとすると、出力データOutは、以下の数式1のようになる。
Out=V1・Vo+N1・No−P(V2・Vo+N2・No)
=(V1−P・V2)Vo+(N1−P・N2)No …(数式1)
ここで、ノイズ源142におけるノイズのマイクロホン110a、110bまでの伝達関数の違い(N1/N2)を未知のシステムとして、適応フィルタ(伝達関数P)で同定することを試みる。音声Voが0となる状態(音声区間判定部118による判定結果が非音声区間を示している場合)においてのみ、出力データOutが最小になるように適応フィルタ130が適応処理(学習処理)を行うと、伝達関数PはN1/N2に適応する。
【0023】
そうすると、数式1の第2項が0に近づき、適応後の出力データOut=(V1―N1/N2・V2)Voとなって、音声区間では音声のみが残り、非音声区間ではノイズ成分が抑制されることとなる。
【0024】
ノイズ除去部120では、マイクロホン110aを通じて入力された第1オーディオデータを適応フィルタ130の所望信号とし、マイクロホン110bを通じて入力された第2オーディオデータに適応フィルタ130を施し、減算器132が、所望信号から適応フィルタ130の出力である適応信号を減算して出力データを得る。このとき適応フィルタ130は、第2オーディオ信号を参照入力信号とし(図2中適応フィルタ130左の端子)、減算器132から出力された出力データを適応誤差とし(図2中適応フィルタ130の中央斜線で示す端子)、適応誤差(出力データ)が小さくなるように随時自体のフィルタ係数を適応的に調整する。かかる処理が上述した適応処理に相当する。
【0025】
図3は、適応フィルタ130の構成例を示した説明図である。ここでは、適応フィルタ130の適応処理における適応アルゴリズムとして、2乗平均誤差を最急降下法に基づいて最小にするLMS(Least Mean Square)アルゴリズムを採用しており、適応フィルタ130は、シフトレジスタ170と、乗算器172と、加算器174とを含んで構成される。
【0026】
図3において、所定のサンプリング時刻n(nは整数)における第2オーディオ信号に相当する参照入力信号X(n)は、所定のサンプリング周期で信号をシフトするシフトレジスタ170に入力され、X(n)〜X(n−N+1)の時間差信号列となる(Nはフィルタの段数であり、本実施形態では例えば256段設けられている。)。そして、N個の乗算器172によって、時間差信号列X(n)〜X(n−N+1)に各フィルタ係数W(n)〜WN−1(n)が乗算され、その乗算結果が加算器174によって加算される。従って、適応フィルタ130の出力信号Y(n)は、以下の、数式2に示すように、参照入力信号X(n)〜X(n−N+1)とフィルタ係数W(n)〜WN−1(n)を畳み込むことによって得ることができる。
【数1】

…(数式2)
【0027】
また、出力データに相当する適応誤差入力e(n)は、上述したように、数式3に従い、第1オーディオ信号に相当する所望信号d(n)から適応フィルタ130の出力である適応信号Y(n)を減算することによって得られる。
【数2】

…(数式3)
そして、フィルタ係数W(n)〜WN−1(n)は数式4に従って適応誤差入力e(n)が小さくなるように調整され、その調整結果によってフィルタ係数が更新される。かかる数式4のμは更新の速度と収束の精度を決定するステップサイズパラメータであり、参照入力信号の統計的性質から最適な値を選択することができる。一般には0.01〜0.001程度の値をとることが多い。
【数3】

…(数式4)
【0028】
ここでは、適応フィルタ130の適応アルゴリズムとしてLMSアルゴリズムを適用しているが、かかる場合に限らず、RLMS(Recursive LMS)、NLMS(Normalized LMS)アルゴリズム等、様々な既存のアルゴリズムを適用することができる。
【0029】
かかる適応フィルタ130により、フィルタ係数W(n)〜WN−1(n)が適宜更新され、未知のシステムである、ノイズ源142から2つのマイクロホン110a、110への音響特性の違い(N1/N2)が同定されるので、適応後の出力データに含まれるノイズ成分は最小限に抑えられ、第1オーディオデータから音声データのみを適切に抽出することが可能となる。
【0030】
また、ノイズ除去部120は、ノイズ除去処理が完了すると、パラメータであるフィルタ係数W(n)〜WN−1(n)とシフトレジスタ170の値を、処理対象となる次のフレームのフレーム番号に関連付けてパラメータ保持部114に保持する。これは、ノイズ除去部120が、事後的にノイズ除去処理を再度実行する際に、その前提として必要となるからである。
【0031】
(ノイズ除去装置100の処理(ノイズ除去方法))
図4は、ノイズ除去装置100の全体的な処理を示したフローチャートであり、図5は、各処理の実行タイミングを示したタイミングチャートである。ここでは、入力された複数のフレーム(図5中、入力された順にF1〜F6で示す。)を複数並行して処理する、所謂パイプライン処理が採用されている。したがって、例えば、フレームF1の2回目の音声区間判定処理とフレームF2の1回目の音声区間判定処理が並行して行われることとなる。また、説明の便宜のため、音声区間判定処理の判定結果は遅延なしでノイズ除去処理に反映されるとする。ここでは、理解を容易にするため、音声区間判定処理およびノイズ除去処理の最大繰り返し数を2回としているが、かかる場合に限らず、それ以上繰り返すこともできる。以下では、典型例として、音声区間判定が1回目と2回目で等しいフレームF1と、音声区間判定が1回目と2回目で異なるフレームF2とを挙げて説明する。
【0032】
マイクロホン110aから入力された第1オーディオデータのフレームF1は、データ保持部112aに保持されると共に、セレクタ116を通じて音声区間判定部118に取り込まれる(S200)。音声区間判定部118は、フレームF1に対して1回目の音声区間判定処理を行い(S202)、判定結果をパラメータ保持部114に保持すると共にノイズ除去部120に送信する(S204)。
【0033】
制御部122は、対象となるフレームの音声区間判定処理が2回目であり、かつ、音声区間判定部118の2回目の判定結果がパラメータ保持部114に保持された1回目の判定結果と等しいか否か判定する(S206)。ここでは、フレームF1の音声区間判定処理が1回目なので(S206におけるNO)、ノイズ除去部120は、パラメータ保持部114からフレームF1に関連付けられたパラメータを取得して(フレームF1の場合、初期パラメータとなる。)、ノイズ除去処理を行い(S208)、ノイズ成分が除去されたフレームF1を、データ保持部112bに随時保持させる(S210)。また、当該ノイズ除去処理が1回目であった場合、ノイズ除去部120は、ノイズ成分が除去されたフレームF1を、セレクタ116を通じて音声区間判定部118にも逐次送信する(S212)。
【0034】
このようなノイズ除去処理(S208)において、ノイズ除去部120は、音声区間判定部118の判定結果が音声区間であるか否か判定し(S214)、非音声区間であれば(S214におけるNO)、適応フィルタ130の適応処理を行いつつ(S216)、ノイズ成分を除去し、音声区間であれば(S214におけるYES)、適応フィルタ130の適応処理を固定(停止)して(S218)、ノイズ成分を除去する。ここでは、適応処理の有無が異なるだけで、ノイズ除去処理自体は音声区間であるか否かに拘わらずいずれでも行われる。
【0035】
ノイズ除去部120によるノイズ除去処理(S208)、データ保持部112への保持(S210)、音声区間判定部118への送信(S212)が一通り遂行されると、ノイズ除去部120は、ノイズ除去処理を再度実行する(2回目の)ために、ノイズ除去処理後のフィルタ係数W(n)〜WN−1(n)とシフトレジスタ170の値とを、ノイズ除去部120のパラメータとして、次に処理するフレームのフレーム番号(ここではF2)に関連付けてパラメータ保持部114に保持する(S220)。パラメータ保持部114に保持されるデータ長は、音声区間判定処理やノイズ除去処理の遅延フレーム数との繰り返し回数の積によって決定され、本実施形態では、2フレーム分保持される。
【0036】
続いて、フレームF1のノイズ除去処理(S208)が1回目であるか否か判定され(S222)、1回目であれば(S222におけるYES)、かかるフレームF1の1回目のノイズ除去処理(S208)と並行して、音声区間判定部118は、セレクタ116を通じて入力された、1回目のノイズ除去処理が施されたフレームF1を、再度、音声区間であるか否か判定(2回目の音声区間判定処理)する(S202)。2回目の音声区間判定処理では、1回目のノイズ除去処理によってノイズが抑制された状態のフレームF1を判定するので、音声の有無を正しく判定でき、信頼性が高くなる。
【0037】
2回目の音声区間判定処理(S202)において、判定結果が1回目と等しい場合には、判定ステップ(S206)において、対象となるフレームの音声区間判定処理が2回目であり、かつ、音声区間判定部118の2回目の判定結果がパラメータ保持部114に保持された1回目の判定結果と等しいと判定されるので、フレームF1の2回目のノイズ除去処理は実行されない。これは、以下の理由による。
【0038】
1回目と2回目の音声区間判定処理の判定結果が等しい場合、適応フィルタの適応処理が実行されるか否かが等しくなるので、2回目のノイズ除去処理を行ったとしても、ノイズ除去処理の処理結果は1回目と等しくなる。したがって、1回目と2回目の音声区間判定処理の判定結果が等しい場合、2回目のノイズ除去処理を行わずとも、1回目のノイズ除去処理の結果を用いることで2回目のノイズ除去処理を行ったことと等価となる。ここでは、2回目のノイズ除去処理によって効果を生じ得る、音声区間判定処理の判定結果が異なる場合にのみ2回目のノイズ除去処理を行い、等しいときには処理を省略することで、処理負荷の軽減を図ることができる。
【0039】
そして、フレームF1のノイズ除去処理(S208)が2回目であるか(S222におけるNO)、または、2回目のノイズ除去処理(S208)が省略された場合(S206におけるYES)、制御部122は、データ保持部112bに保持された出力データを外部に送信する(S224)。
【0040】
続いて、フレームF2に着目する。フレームF2では、1回目の音声区間判定処理の判定結果が音声区間であったにも拘わらず、2回目の音声区間判定処理の判定結果が非音声区間となったとする。すると、判定ステップ(S206)において、音声区間判定部118の2回目の判定結果がパラメータ保持部114に保持された1回目の判定結果と異なる(S206におけるNO)と判定されるので、図5の如く、フレームF2では、2回目のノイズ除去処理が遂行される(S208)。
【0041】
2回目のノイズ除去処理では、パラメータ保持部114に保持された、フレームF2のノイズ除去処理が遂行される前の状態、即ち、フィルタ係数W(n)〜WN−1(n)とシフトレジスタ170の値とが再度設定され(復元され)、データ保持部112aに保持されたフレームF2が読み出される。また、ここでは、パイプライン処理が採用されているので、フレームF2の2回目のノイズ除去処理と並行して、フレームF3の1回目のノイズ除去処理が遂行されている。
【0042】
しかし、フレームF3の1回目のノイズ除去処理は、フレームF2の1回目のノイズ除去処理の処理結果に基づくフィルタ係数W(n)〜WN−1(n)とシフトレジスタ170の値とによって為されているので、有効性に乏しい。そこで、フレームF2の2回目のノイズ除去処理では、図5の如く、フレームF2のノイズ除去処理に引き続きフレームF3のノイズ除去処理を行い、フレームF3の1回目のノイズ除去処理を再度やり直す。
【0043】
したがって、図5の如く、フレームF4の1回目のノイズ除去処理は、かかるフレームF2の2回目のノイズ除去処理の処理結果(正確にはフレームF2およびフレームF3のノイズ除去処理の処理結果)に基づくフィルタ係数W(n)〜WN−1(n)とシフトレジスタ170の値とが設定される。また、フレームF3の2回目の音声区間判定処理では、フレームF3の1回目のノイズ除去処理の結果を用いるべきなので、フレームF3の1回目のノイズ除去処理の取り込みを中断し、フレームF2の2回目のノイズ除去処理におけるフレームF3のノイズ除去処理の結果を取り込む。こうして、パイプライン処理が採用されている場合であっても、2回目のノイズ除去処理を正確に反映することが可能となる。
【0044】
このように、ノイズ除去装置100では、音声区間判定処理とノイズ除去処理との処理結果を相互に利用することで高ノイズ環境下においても音声区間判定処理の精度を向上することができ、ひいてはノイズ除去処理においても、正確なノイズ除去が遂行できるので、音質を損なうことなく、ノイズ除去の精度を向上することが可能となる。また、このような処理結果を相互利用する場合の一部の処理を、音声区間判定部118の判定結果が異なる場合にのみ実行することで、処理負荷の増大を回避することができる。
【0045】
また、本実施形態では、ノイズ除去処理を最大で2回行う例を挙げて説明したが、音声区間判定処理とノイズ除去処理との繰り返し回数は、多ければ多いほど精度が向上する。ここでは、許容される処理負荷に応じて繰り返し回数を増やすことでより精度を高めることができる。また、2回目以降のノイズ除去処理は音声区間判定部118の判定結果に基づいてその実行の有無が決定されるので、繰り返し回数を増やしたとしても、処理負荷の増加は最小限に抑えられる。
【0046】
ただし、繰り返し回数が増えた場合、図5における2回目のノイズ除去処理に相当する3回目、4回目のノイズ除去処理においては、その繰り返し回数に比例したフレーム数を一度に連続して処理しなければならない。
【0047】
また、音声区間判定処理とノイズ除去処理とを複数回繰り返す場合において、その繰り返し数を制限せず、音声区間判定部118の判定結果が1回目と2回目とで異なる回数と、全体の回数との比率が所定の割合以下に収まると、繰り返し処理を終了するとしてもよい。
【0048】
以上、添付図面を参照しながら本発明の好適な実施形態について説明したが、本発明はかかる実施形態に限定されないことは言うまでもない。当業者であれば、特許請求の範囲に記載された範疇において、各種の変更例または修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。
【0049】
例えば、上述した実施形態においては、各構成要素をハード的に実現するかソフト的に実現するかを限定していない。これは、ノイズ除去装置100をデジタルフィルタや加減算器またはアナログフィルタやオペアンプ等の具体的なハードウェアで構成することも、コンピュータを用い、上記ノイズ除去装置100として機能するプログラムによってソフトウェアで実現することも可能だからである。後者の場合、ノイズ除去装置100と共に、その各構成要素をコンピュータに機能させるプログラムおよびそれを記録した記録媒体も提供される。
【産業上の利用可能性】
【0050】
本発明は、収音したオーディオデータからノイズ成分を除去することが可能なノイズ除去装置およびノイズ除去方法に利用することができる。
【符号の説明】
【0051】
100 …ノイズ除去装置
114 …パラメータ保持部
118 …音声区間判定部
120 …ノイズ除去部
130 …適応フィルタ

【特許請求の範囲】
【請求項1】
所定区間のオーディオデータが、音声が含まれる音声区間であるか、音声が含まれない非音声区間であるかを判定する音声区間判定部と、
前記音声区間判定部の判定結果を保持するパラメータ保持部と、
前記音声区間判定部の判定結果が非音声区間であれば適応フィルタの適応処理を行いつつ、音声区間であれば適応フィルタを固定して、前記所定区間のオーディオデータのノイズ成分を除去するノイズ除去部と、
を備え、
前記音声区間判定部が、前記ノイズ除去部によってノイズ成分が除去されたオーディオデータの音声区間判定を再度実行し、その判定結果が前記パラメータ保持部に保持された判定結果と異なる場合、前記ノイズ除去部は、ノイズ成分の除去を再度実行することを特徴とするノイズ除去装置。
【請求項2】
前記ノイズ除去部は、ノイズ成分の除去を再度実行する場合、同一の所定区間のオーディオデータの1回目のノイズ成分の除去を実行する前の適応フィルタの状態を復元することを特徴とする請求項1に記載のノイズ除去装置。
【請求項3】
前記音声区間判定部および前記ノイズ除去部は、時刻の異なる前記所定区間のオーディオデータを複数並行して処理することを特徴とする請求項1または2に記載のノイズ除去装置。
【請求項4】
所定区間のオーディオデータが、音声が含まれる音声区間であるか、音声が含まれない非音声区間であるかを判定し、その判定結果をパラメータ保持部に保持し、
前記判定結果が非音声区間であれば適応フィルタの適応処理を行いつつ、音声区間であれば適応フィルタを固定して、前記所定区間のオーディオデータのノイズ成分を除去し、
前記ノイズ成分が除去されたオーディオデータの音声区間判定を再度実行し、その判定結果が前記パラメータ保持部に保持された判定結果と異なる場合、ノイズ成分の除去を再度実行することを特徴とするノイズ除去方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate


【公開番号】特開2012−163788(P2012−163788A)
【公開日】平成24年8月30日(2012.8.30)
【国際特許分類】
【出願番号】特願2011−24403(P2011−24403)
【出願日】平成23年2月7日(2011.2.7)
【出願人】(308036402)株式会社JVCケンウッド (1,152)
【Fターム(参考)】