説明

クリップノイズ検出装置、クリップノイズ検出方法、プログラム

【課題】収録音源を自動解析して正確にクリップノイズ発生時刻を検出することができるクリップノイズ検出装置を提供する。
【解決手段】信号を入力とし、当該入力信号をN個(Nは2以上の整数)のフィルタからなるフィルタバンクを通過させて、N個のサブバンド信号を出力するフィルタバンク処理部と、N個のサブバンド信号を入力とし、当該N個のサブバンド信号に直交検波を行って、N個の複素解析信号を出力する直交検波部と、N個の複素解析信号を入力とし、N個の複素解析信号から選択した任意の2個の複素解析信号の相関関係を求め、当該求められた相関関係から時刻ごとにクリップ強度値を計算し、当該計算されたクリップ強度値を出力するクリップ強度計算部と、クリップ強度値を入力とし、当該クリップ強度値が予め定めた閾値を超過する場合に、当該超過が発生した時刻をクリップノイズ発生時刻として出力する判定部とを備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は録音済み信号からクリップノイズ発生時刻を検出するクリップノイズ検出装置、クリップノイズ検出方法、プログラムに関する。
【背景技術】
【0002】
音声や音楽を録音する際、入力音圧レベルが過大となり、信号許容レベルをオーバーしてしまった場合、収録音源の波形に独特のひずみが生じてしまう。このひずみは、クリップノイズと呼ばれている。
【0003】
一般に、クリップノイズの発生を防ぐためには、あらかじめ録音対象の音のダイナミックレンジを測定したり、試しに音声を収録して収録可能な最大音量レベルを超えないかチェックした後、音声を収録する方法がある。その上で、録音中はピークメータ等で録音音量を監視し、万が一最大音量レベルを超えるような場合は、再度録音しなおすなど、基本的には人間の監視により、最大音量を超えることでクリップノイズが発生しないようにしている。これに対して、信号の振幅最大値を監視し、この振幅最大値を特徴量としてヘッドルームの調整を自動的に行うクリップノイズ防止技術が開発されている(非特許文献1参照)。
【0004】
収録音源にクリップノイズが発生していないかチェックする場合、従来は収録音源を再生し、人間が聴いて確認する方法が一般的であった。
【先行技術文献】
【非特許文献】
【0005】
【非特許文献1】三浦晋、中島弘史、牧野昭二、山田武志、中臺一博、「クリッピングした音響信号の修復」、日本音響学会講演論文集、平成23年3月11日、p.941―944
【発明の概要】
【発明が解決しようとする課題】
【0006】
人手によりクリップノイズの発生を監視する場合、素人は当然としてプロのミキサー等の音声技術者であっても不注意による監視漏れや、表示機器自体の精度によるレベルオーバがしばしば発生することがある。また、人の聴感上は聞き取れない程度のクリップノイズであっても、スペクトル的には大きな歪みが発生している場合がある。録音された音を用いて様々なディジタル的な分析処理や統計処理を行う際に、聴感上は聞き取れない程度のクリップノイズによる波形歪みが、予期せぬエラー原因となることが問題であった。これに対して、ディジタル収録の場合には、従来から最大レンジ近傍の値をとるサンプルを機械的に監視する技術が存在するが、量子化巾の最大レンジ近傍の値を取るサンプルの有無を調べるだけでは、機器のセッティング等の問題から、最大レンジ以外の箇所でクリップノイズが発生した場合には、その検出が不可能であるという問題があった。そこで本発明では、収録音源を自動解析して正確にクリップノイズ発生時刻を検出することができるクリップノイズ検出装置を提供する。
【課題を解決するための手段】
【0007】
本発明のクリップノイズ検出装置は、フィルタバンク処理部と、直交検波部と、クリップ強度計算部と、判定部とを備える。フィルタバンク処理部は、信号を入力とし、当該入力信号をN個(Nは2以上の整数)のフィルタからなるフィルタバンクを通過させて、N個のサブバンド信号を出力する。直交検波部は、N個のサブバンド信号を入力とし、当該N個のサブバンド信号に直交検波を行って、N個の複素解析信号を出力する。クリップ強度計算部は、N個の複素解析信号を入力とし、N個の複素解析信号から選択した任意の2個の複素解析信号の相関関係を求め、当該求められた相関関係から時刻ごとにクリップ強度値を計算し、当該計算されたクリップ強度値を出力する。判定部は、クリップ強度値を入力とし、当該クリップ強度値が予め定めた閾値を超過する場合に、当該超過が発生した時刻をクリップノイズ発生時刻として出力する。
【発明の効果】
【0008】
本発明のクリップノイズ検出装置によれば、収録音源を自動解析して正確にクリップノイズ発生時刻を検出することができる。
【図面の簡単な説明】
【0009】
【図1】実施例1に係るクリップノイズ検出装置の構成を示すブロック図。
【図2】実施例1に係るフィルタバンク処理部の構成を示すブロック図。
【図3】実施例1に係る直交検波部の構成を示すブロック図。
【図4】実施例1に係るクリップ強度計算部の構成を示すブロック図。
【図5】実施例1に係るクリップノイズ検出装置の動作を示すフローチャート。
【図6】フィルタバンク処理部のフィルタバンクの通過特性について説明する図。
【図7】クリップノイズ発生時刻検出例を示す図。
【発明を実施するための形態】
【0010】
以下、本発明の実施の形態について、詳細に説明する。なお、同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。
【実施例1】
【0011】
まず、図1、図5を参照して、実施例1のクリップノイズ検出装置10の概略を説明する。図1は本実施例に係るクリップノイズ検出装置10の構成を示すブロック図である。図5は本実施例に係るクリップノイズ検出装置10の動作を示すフローチャートである。本実施例のクリップノイズ検出装置10は、フィルタバンク処理部11と、直交検波部12と、クリップ強度計算部13と、判定部14と、閾値記憶部15とを備える。フィルタバンク処理部11は、信号を入力とし、当該入力信号をN個(Nは2以上の整数)のフィルタからなるフィルタバンクを通過させて、N個のサブバンド信号を出力する(S11)。直交検波部12は、N個のサブバンド信号を入力とし、当該N個のサブバンド信号に直交検波を行って、N個の複素解析信号を出力する(S12)。クリップ強度計算部13は、N個の複素解析信号を入力とし、N個の複素解析信号から選択した任意の2個の複素解析信号の相関関係を求め、当該求められた相関関係から時刻ごとにクリップ強度値を計算し、当該計算されたクリップ強度値を出力する(S13)。判定部14は、クリップ強度値を入力とし、当該クリップ強度値が予め定めた閾値を超過する場合に、当該超過が発生した時刻をクリップノイズ発生時刻として出力する(S14)。このとき、判定部14が用いる閾値は、閾値記憶部15にあらかじめ記憶されているものとする。判定部14が用いる閾値は以下のように求めることができる。
【0012】
1)教師無し判別閾値
データから一意にクリップの有無を判別するため、事前学習を行わずに予め閾値を決定しておき、クリップ強度値が教師無し判別閾値を超えた場合、その時刻をクリップノイズ発生時刻とする。
【0013】
2)教師有り判別閾値
クリップノイズが存在していることが予め分かっている信号データが学習に用いることができる程度に存在している場合、クリップしている部分とクリップしていない部分のクリップ強度値を例えばSVM(Support Vector Machine)のような機械学習法によってあらかじめ学習しておき、実際の信号のクリップ強度値をSVMに入力して判別する。
【0014】
1)、2)の何れの方法を取るべきかについては、あらかじめ相当量のクリップノイズパタンのデータが存在していれば2)の方法とし、相当量のクリップノイズパタンのデータがなく、音源にどのようにクリップノイズが発生するか不明な場合は、1)の方法とすることが考えられる。ただしクリップノイズパタンのデータが存在しても、ばらつきが大きい場合は、1)の方法とするのが望ましい。
【0015】
次に、図2、図6を参照して、フィルタバンク処理部11の構成および動作について詳細に説明する。図2は本実施例に係るフィルタバンク処理部11の構成を示すブロック図である。図6はフィルタバンク処理部11のフィルタバンクの通過特性について説明する図である。図2に示すように、フィルタバンク処理部11はN個のフィルタ群(フィルタバンク)により構成される。フィルタバンクは1個のローパスフィルタ、(N−2)個のバンドパスフィルタ、1個のハイパスフィルタよりなる。入力信号は、各フィルタに同時に入力される。各フィルタについては、出力信号の相関性を求めることもあり、直線位相特性となるFIRフィルタを用いるのがもっとも簡単であるが、位相特性を考慮してIIRフィルタで構成しても良い。次に、各フィルタのカットオフ周波数について説明する。フィルタの周波数特性について、図6の(a)(b)のように2種類の構成法がある。
【0016】
(a)通過帯域をオーバラップさせる
この場合、図6(a)に示すとおり各フィルタのカットオフ周波数は隣接するフィルタの通過帯域の中心周波数となる。つまりi番目のフィルタの低域のカットオフ周波数をFl、高域のカットオフ周波数をFh、中心周波数をFcとすると
【0017】
【数1】

となる。
【0018】
(b)通過帯域をオーバラップさせない
この場合、図6(b)に示すとおり各フィルタの低域のカットオフ周波数は低域側で隣接するフィルタの高域のカットオフ周波数と同じになる。また、各フィルタの高域のカットオフ周波数は高域側で隣接するフィルタの低域のカットオフ周波数と同じになる。つまり
【0019】
【数2】

となる。
【0020】
(a)(b)の何れが適するかは、入力信号の種別や、目的によって変わる。入力信号が音声であり、人が聞いて気になるクリップ音を検出したいのが目的であれば、(a)の形としてフィルタの中心周波数を周波数帯域の等分割点とするのではなく、聴覚的なメル周波数軸上での等分割点とするのが望ましい。入力信号が音楽で、ディジタル処理上問題となるクリップノイズを検出したい場合は、(b)の形として中心周波数は直線周波数軸上での等分割点とすることができる。
【0021】
次に、図3、図5を参照して、直交検波部12の構成および動作について詳細に説明する。図3は本実施例に係る直交検波部12の構成を示すブロック図である。図3に示すように、直交検波部12は直交検波手段12−aと、ローパス手段12−bとを備える。直交検波とは、信号の時間的な処理により解析信号を求める方法の一つである。一般的には以下の式で表現される。
【0022】
【数3】

【0023】
ここでx(t)は入力信号、ωは周波数移動量である。B(t)に対しローパスフィルタにより入力信号の帯域巾の半分より上の帯域をカットすることで、複素解析信号が得られる。当該複素解析信号の振幅が瞬時振幅の推定値となる。直交検波手段12−aは、tを時刻として、N個のサブバンド信号を入力とし、任意のi(i=1,2,3,…,N)について、i番目のサブバンド信号x(t)と対応するi番目のフィルタの中心周波数をFcとした場合に、B(t)=x(t)exp(−jFct)を計算して、当該B(t)を出力する(SS12a)。ローパス手段12−bは、任意のiについて、前記B(t)を入力とし、当該B(t)に、ローパスフィルタリングを施し、複素解析信号A(t)を出力する(SS12b)。
【0024】
次に、図4、図5を参照して、クリップ強度計算部13の構成および動作について詳細に説明する。図4は本実施例に係るクリップ強度計算部13の構成を示すブロック図である。図4に示すように、クリップ強度計算部13は、相関値計算手段13−aと、強度値計算手段13−bとを備える。相関値計算手段13−aは、N個の複素解析信号(A(t)、A(t)、…、A(t))を入力とし、任意のk(k=1,2,3,…,N−1)に対して、
【0025】
【数4】

【0026】
を計算して、当該R(t)を相関値として出力する(SS13a)。強度値計算手段13−bは、(k=1,2,3,…,N−1)について、前記相関値R(t)を入力とし、kを予め定めた係数として、
【0027】
【数5】

【0028】
を計算して、当該C(t)をクリップ強度値として出力する(SS13b)。ここで、kは、入力信号の種別によって適切に設定すべきであるが、5からN−5までの値とするのが望ましい。前述したように、判定部14は、クリップ強度値を入力とし、当該クリップ強度値が予め定めた閾値を超過する場合に、当該超過が発生した時刻をクリップノイズ発生時刻として出力する(S14)。
【0029】
図7を用いて、本実施例のクリップノイズ検出装置10にて実際に検出されたクリップノイズについて説明する。図7はクリップノイズ発生時刻検出例を示す図である。図7(a)は、入力信号の例である。図7(b)は、(a)の入力信号にフィルタバンク処理(S11)を施したサブバンド信号の一つを例示している。図7(c)は、(b)のサブバンド信号について、直交検波(SS12a)後に、ローパスフィルタリングを施して(SS12b)得られた複素解析信号の瞬時振幅を例示している。図7(d)は、(c)の複素解析信号の相関値を計算し(SS13a)、当該相関値の平均値から求めたクリップ強度値(SS13b)を例示している。図7(d)の太実線で示すように、予め閾値(教師なし、教師ありのいずれか)を設定しておき、当該閾値を超えるクリップ強度値を示す時刻をクリップノイズ発生時刻として検出することができる。図7(a)のクリップ箇所と、図7(d)のクリップ推定位置とがほぼ一致していることから、本実施例のクリップノイズ検出装置10は、正確にクリップノイズ発生時刻を検出可能であることが分かる。
【0030】
このように、本実施例のクリップノイズ検出装置10は、入力信号を複数の帯域に分割し、帯域毎の検波信号の全体または一部の相関性を見ることで、クリップノイズ特有の全帯域に渡って雑音が重畳される現象を捕捉することが可能となる。通常の音楽信号や音声信号は、帯域の一部に信号が存在しており、全帯域に渡って信号が存在することはない。一方、単純な雑音(ホワイトノイズ)の場合は、全帯域に信号が存在するが、各帯域の信号特性はランダムであり、相関性はない。従って、帯域分割した信号の相関性を計算し、相関性が高いものを検出することで、正確にクリップノイズ発生時刻を検出することができる。また、帯域分割処理及び、帯域分割後の信号の瞬時振幅の推定を全て時間軸上でのフィルタ処理等で実行することで、時間分解能を高くすることができる。そのため、非常に瞬時的なクリップの場合でも検出が可能となる。
【0031】
また、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。
【0032】
また、上述の構成をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。
【0033】
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。
【0034】
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
【0035】
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
【0036】
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

【特許請求の範囲】
【請求項1】
クリップノイズ発生時刻を検出するクリップノイズ検出装置であって、
信号を入力とし、当該入力信号をN個(Nは2以上の整数)のフィルタからなるフィルタバンクを通過させて、N個のサブバンド信号を出力するフィルタバンク処理部と、
前記N個のサブバンド信号を入力とし、当該N個のサブバンド信号に直交検波を行って、N個の複素解析信号を出力する直交検波部と、
前記N個の複素解析信号を入力とし、前記N個の複素解析信号から選択した任意の2個の複素解析信号の相関関係を求め、当該求められた相関関係から時刻ごとにクリップ強度値を計算し、当該計算されたクリップ強度値を出力するクリップ強度計算部と、
前記クリップ強度値を入力とし、当該クリップ強度値が予め定めた閾値を超過する場合に、当該超過が発生した時刻をクリップノイズ発生時刻として出力する判定部と
を備えることを特徴とするクリップノイズ検出装置。
【請求項2】
請求項1に記載のクリップノイズ検出装置であって、
前記直交検波部が、
tを時刻として、前記N個のサブバンド信号を入力とし、任意のi(i=1,2,3,…,N)について、i番目のサブバンド信号x(t)と対応するi番目のフィルタの中心周波数をFcとした場合に、B(t)=x(t)exp(−jFct)を計算して、当該B(t)を出力する直交検波手段と、
任意のiについて、前記B(t)を入力とし、当該B(t)に、ローパスフィルタリングを施し、複素解析信号A(t)を出力するローパス手段と
を備えることを特徴とするクリップノイズ検出装置。
【請求項3】
請求項1または2に記載のクリップノイズ検出装置であって、
前記クリップ強度計算部は、
前記N個の複素解析信号(A(t)、A(t)、…、A(t))を入力とし、任意のk(k=1,2,3,…,N−1)に対して、
【数6】

を計算して、当該R(t)を相関値として出力する相関値計算手段と、
(k=1,2,3,…,N−1)について、前記相関値R(t)を入力とし、kを予め定めた係数として、
【数7】

を計算して、当該C(t)をクリップ強度値として出力する強度値計算手段と、
を備えることを特徴とするクリップノイズ検出装置。
【請求項4】
請求項1から3の何れかに記載のクリップノイズ検出装置であって、
前記閾値を教師あり学習により予め学習しておくことを特徴とするクリップノイズ検出装置。
【請求項5】
クリップノイズ発生時刻を検出するクリップノイズ検出方法であって、
信号を入力とし、当該入力信号をN個(Nは2以上の整数)のフィルタからなるフィルタバンクを通過させて、N個のサブバンド信号を出力するフィルタバンク処理ステップと、
前記N個のサブバンド信号を入力とし、当該N個のサブバンド信号に直交検波を行って、N個の複素解析信号を出力する直交検波ステップと、
前記N個の複素解析信号を入力とし、前記N個の複素解析信号から選択した任意の2個の複素解析信号の相関関係を求め、当該求められた相関関係から時刻ごとにクリップ強度値を計算し、当該計算されたクリップ強度値を出力するクリップ強度計算ステップと、
前記クリップ強度値を入力とし、当該クリップ強度値が予め定めた閾値を超過する場合に、当該超過が発生した時刻をクリップノイズ発生時刻として出力する判定ステップと
を備えることを特徴とするクリップノイズ検出方法。
【請求項6】
請求項5に記載のクリップノイズ検出方法であって、
前記直交検波ステップが、
tを時刻として、前記N個のサブバンド信号を入力とし、任意のi(i=1,2,3,…,N)について、i番目のサブバンド信号x(t)と対応するi番目のフィルタの中心周波数をFcとした場合に、B(t)=x(t)exp(−jFct)を計算して、当該B(t)を出力する直交検波サブステップと、
任意のiについて、前記B(t)を入力とし、当該B(t)に、ローパスフィルタリングを施し、複素解析信号A(t)を出力するローパスサブステップと
を備えることを特徴とするクリップノイズ検出方法。
【請求項7】
請求項5または6に記載のクリップノイズ検出方法であって、
前記クリップ強度計算ステップは、
前記N個の複素解析信号(A(t)、A(t)、…、A(t))を入力とし、任意のk(k=1,2,3,…,N−1)に対して、
【数8】

を計算して、当該R(t)を相関値として出力する相関値計算サブステップと、
(k=1,2,3,…,N−1)について、前記相関値R(t)を入力とし、kを予め定めた係数として、
【数9】

を計算して、当該C(t)をクリップ強度値として出力する強度値計算サブステップと、
を備えることを特徴とするクリップノイズ検出方法。
【請求項8】
コンピュータを請求項1から4のいずれかに記載のクリップノイズ検出装置として機能させるためのプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2012−230160(P2012−230160A)
【公開日】平成24年11月22日(2012.11.22)
【国際特許分類】
【出願番号】特願2011−96918(P2011−96918)
【出願日】平成23年4月25日(2011.4.25)
【出願人】(000004226)日本電信電話株式会社 (13,992)