説明

信号処理装置及び方法、並びにプログラム

【課題】より一段と原音に忠実な音声を記録したり再生できる。
【解決手段】FFT回路113は、入力音声信号のうち、ピーク信号レベルが第1の閾値を超えている区間を処理対象信号として、処理対象信号に対して周波数変換処理を施すことで、複数の帯域毎のパワーレベルを取得し、振幅圧縮回路119は、取得された複数の帯域毎のパワーレベルの中に第2の閾値を超えるパワーレベルが存在する場合、処理対象信号のピーク信号レベルが第1の閾値以下になる圧縮率で、処理対象信号の信号レベルを圧縮する振幅圧縮処理を実行し、それ以外の場合、振幅圧縮処理の実行を禁止する。本発明は、例えば、音声記録装置や音声再生装置に適用できる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、信号処理装置及び方法、並びにプログラムに関し、特に、より一段と原音に忠実な音声を記録したり再生できるようになった信号処理装置及び方法、並びにプログラムに関する。
【背景技術】
【0002】
従来、マイクから入力された環境音を記録する音声記録装置が存在する。音声記録装置に入力される環境音の振幅範囲は、およそ20乃至130dBSPLになる。このような振幅情報(環境音の音声信号)を音声記録装置がそのまま記録する場合、この振幅範囲に対応可能なダイナミックレンジを持つ回路を搭載する必要がある。しかしながら、そのような回路のコストは膨大になる。このため、通常は、AGC(Auto Gain Control)回路を用いて、入力音声信号の振幅を制限する手法(以下、振幅制限手法と称する)が採用されている。また、入力音声信号の波形が回路のダイナミックレンジに達することで歪んだ場合、その歪んだ部分(以下、クリップ部分と称する)の波形を補間する手法(以下、波形補間手法と称する)が存在する(例えば、特許文献1および2を参照)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開昭60−202576号公報
【特許文献2】特開昭53−30257号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
従来の振幅制限手法について説明する。従来の振幅制限手法が適用されるAGC回路(以下、単に、従来のAGC回路と称する)は、フィードバック形式(以下、FB形式と称する)とフィードフォワード形式(以下、FF形式と称する)の回路に大別される。
【0005】
[従来のFB形式のAGC回路の一例]
【0006】
図1は、従来のFB形式のAGC回路の一例を示している。図1の例の従来のFB形式のAGC回路10は、アンプ11および検波回路12から構成される。アンプ11は、入力音声信号を所定のゲインで増幅して出力する。アンプ11により増幅された音声信号は検波回路12にフィードバックされる。検波回路12は、増幅後の音声信号の振幅を検出し(検波し)、その検出結果に基づいて、アンプ11のゲインを変更する。
【0007】
[従来のFF形式のAGC回路の一例]
【0008】
図2は、従来のFF形式のAGC回路の一例を示している。図2の例の従来のFF形式のAGC回路20は、遅延回路21、検波回路22、およびアンプ23から構成される。遅延回路21は、入力音声信号を所定時間だけ遅延して、アンプ23に供給する。検波回路22は、入力音声信号の振幅を検出し(検波し)、その検出結果に基づいて、アンプ23のゲインを変更する。アンプ23は、遅延回路21から遅延されて出力された音声信号を、検波回路22により変更されたゲインで増幅して出力する。
【0009】
従来のFB形式とFF形式のいずれのAGC回路も、入力音声信号の振幅値が閾値を超えた場合に、アンプ11または23のゲインを下げて出力音声信号の振幅値を抑えることができる。但し、従来のFB形式のAGC回路10では、入力音声信号の振幅値が閾値を超えた後、しばらくの間、変更前のゲインで増幅されてしまう。従って、入力音声信号の振幅値が閾値を超えてからゲインが変更されるまでの間、出力音声信号の振幅値が閾値を超えてしまう。これに対して、従来のFF形式のAGC回路20では、入力音声信号の振幅値が閾値を超えた直後から、変更後のゲインで増幅される。従って、入力音声信号の振幅値が閾値を超えている間、出力音声信号の振幅値は閾値内に制限される。従って、従来のFF形式のAGC回路20は、従来のFB形式のAGC回路10に比べて波形応答性が向上する。
【0010】
[従来のFB形式とFF形式のそれぞれのAGC回路の波形応答性の一例]
【0011】
図3は、従来のFB形式とFF形式のそれぞれのAGC回路の波形応答性の一例を示している。
【0012】
図3のAは、入力音声信号のエンベロープの一例を示している。図3のBは、従来のFB形式のAGC回路10の出力音声信号のエンベロープの一例を示している。図3のCは、従来のFF形式のAGC回路20の出力音声信号のエンベロープの一例を示している。
【0013】
図3のAの例では、時刻TAから時刻TBの間で、入力音声信号の振幅値が閾値thを超えている。この間、入力音声信号の波形は、ダイナミックレンジdに達している。
【0014】
図3のBに示されるように、従来のFB形式のAGC回路10では、入力音声信号の振幅値が閾値thを超える時刻TAに対して、出力音声信号の振幅値が閾値th内に抑えられる時刻TCが遅れてしまう。これにより、時刻TAから時刻TCまでの間で、出力音声信号の振幅値が閾値thを超え、出力音声信号の波形がダイナミックレンジdに達することになる。
【0015】
これに対して、図3のCに示されるように、従来のFF形式のAGC回路20では、時刻TA'から時刻TB'までの間において、出力音声信号の振幅値は閾値th内に抑えられている。このように、従来のFF形式のAGC回路20では、従来のFB形式のAGC回路10に比べて、波形応答性が向上していることがわかる。なお、図3のCの例の時刻TA',TB'のそれぞれは、図3のAの例の時刻TA,TBのそれぞれから、遅延回路21に設定された所定の遅延時間だけ経過した後の時刻である。
【0016】
しかしながら、従来のFB形式とFF形式のいずれのAGC回路を採用した場合にも、入力音声信号の振幅値が閾値thを超えた後に再度閾値thを下回った直後の音声信号が出力されると、不自然な音となってしまうことがあった。
【0017】
図3のAの例では、入力音声信号の振幅値が閾値thを下回るタイミングは、時刻TBとなっている。図3のBに示されるように、従来のFB形式のAGC回路10では、出力音声信号の振幅値は、時刻TBにおいて大幅に低下し、その後徐々に上昇していく。図3のCに示されるように、従来のFF形式のAGC回路20では、出力音声信号の振幅値は、時刻TB'において大幅に低下し、その後徐々に上昇していく。このような現象、即ち、振幅値が大幅に低下した後徐々に上昇していく現象は、アタックリカバリと称されている。アタックリカバリは、入力音声信号の振幅値が閾値thを跨いで変化してから、それに応じてアンプのゲインが変更されるまでの応答時間(以下、アタックリカバリの時間と称する)が長いために生じる。アタックリカバリの時間を長くしているのは、アタックリカバリの時間が短いと他の弊害が生じるからである。
【0018】
[アタックリカバリの時間に対する出力音声信号の波形の一例]
【0019】
図4は、アタックリカバリの時間に対する出力音声信号の波形の一例を説明するための図である。
【0020】
図4のAは、入力音声信号のエンベロープを示している。図4のBは、アタックリカバリの時間が長い場合の出力音声信号のエンベロープを示している。図4のCは、アタックリカバリの時間が短い場合の出力音声信号のエンベロープを示している。
【0021】
アタックリカバリの時間が短い場合、AGC回路は、入力音声信号の振幅値が閾値thを跨ぐとすぐにアンプのゲインを変更する。このため、図4のBに示されるように、出力音声信号の振幅は均一化されてしまい、その結果、入力音声信号のエンベロープ情報は欠落する。このような出力音声信号に対応する音声は、本来あるべき音量の変化がない音声となっているため、視聴者にとっては聴感上違和感を覚えることがある。このことが、アタックリカバリの時間が短い場合の弊害である。
【0022】
一方、アタックリカバリの時間が長い場合、入力音声信号の振幅値が閾値thを跨いでもアンプのゲインはすぐには変更されない。このため、図4のCに示されるように、入力音声信号のエンベロープ情報が残るため、出力音声信号の形状を入力音声信号の形状に近づけることが可能となる。但し、アタックリカバリの時間を長くしすぎると、入力音声信号の振幅値が閾値thより小さくなっても、出力音声信号の振幅値が小さいままとなる。その結果、出力音声信号に対応する音声の音量は絞られたままとなる。
【0023】
このようなことから、アタックリカバリの時間は、回路毎に最適な時間が追求されて設定される。このことが、従来のAGC回路の設計を複雑にしている原因のひとつである。
【0024】
また、従来のAGC回路では、入力音声信号の振幅値を検出する(検波する)必要がある。振幅値の検波はレベル検波とも称される。従来のレベル検波手法としては、単純に入力音声信号の振幅値を検波する手法(以下、ピーク検波手法と称する)と、入力音声信号の実効値を時間方向で積分して検波する手法(以下、積分検波手法と称する)とがよく知られている。ピーク検波手法が適用された場合、従来のAGC回路は、振幅値が閾値を一瞬超えた入力音声信号に対しても反応してしまい、入力音声信号の振幅を圧縮してしまう。このため、例えば入力音声信号にノイズ成分が多く含まれていると出力音声信号の振幅が過剰に抑えられてしまうという現象が発生する。一方、積分検波手法が適用された場合、この現象は生じないが、従来のAGC回路は、振幅値が一瞬閾値を超えた入力音声信号に対して、振幅を圧縮し難くなる。このため、例えば高周波の入力音声信号に対しては、従来のAGC回路は、その振幅値が閾値を超えても、その振幅を圧縮しないことがあった。これにより、出力音声信号の波形が回路のダイナミックレンジに達して波形が歪む恐れがあった。このように、従来のAGC回路では、レベル検波手法に改善の余地があった。
【0025】
さらに、従来のAGC回路は、回路設計が容易なFB形式のアナログ回路で多く実現される。そのため、従来のAGC回路では、回路面積は比較的大きくなり、コストが上昇していた。
【0026】
以上、従来のAGC回路を用いた振幅制限手法について説明した。次に、従来の波形補間手法として、特許文献1および2の手法について説明する。
【0027】
特許文献1および2の手法では、A/D(analog to digital)コンバータによるA/D変換後の音声信号にクリップ部分が含まれている場合、次のような波形補間が行われる。即ち、特許文献1の手法では、A/D変換後の音声信号のうち、クリップ部分の前後の波形から、新たな波形を生成して、クリップ部分の波形と置き換える、といった波形補間が行われる。さらに、特許文献2の手法では、A/D変換後の音声信号のうち、クリップ部分の波形を、既知の正弦波や三角波の波形に置き換える、といった波形補間が行われる。
【0028】
しかしながら、特許文献1および2の手法では、いずれも、回路のダイナミックレンジを、A/Dコンバータのダイナミックレンジより広くするように設計する必要があった。このため、特許文献1および2の手法では、回路規模が増大し、コストが増加していた。さらに、特許文献2の手法では、置き換わる波形(正弦波や三角波の波形)が本来の波形と全く関連性のない可能性が高い。このため、置き換わる波形と元の波形とが不自然につながり、出力音声信号の歪みが増大していた。この結果、出力音声信号に対応する音声を聴いた者にとっては、聴感上違和感を覚えることがあった。
【0029】
以上まとめると、次のようになる。即ち、従来の振幅制限手法では、入力音声信号の振幅を制限する際に入力音声信号のエンベロープ情報が十分に残っていないことがあった。従来の波形補間手法では、入力音声信号の波形のうちクリップ部分の波形を置き換えることができるが、置き換わる波形がかならずしも適切でなく、また、振幅値を制限することができなかった。その結果、波形補間が行われた後の音声は、原音とは違う音声になってしまう可能性が高かった。
【0030】
本発明は、このような状況に鑑みてなされたものであり、より一段と原音に忠実な音声を記録したり再生できるようにするものである。
【課題を解決するための手段】
【0031】
本発明の一側面の信号処理装置は、入力音声信号のうち、ピーク信号レベルが第1の閾値を超えている区間を処理対象信号として、前記処理対象信号に対して周波数変換処理を施すことで、複数の帯域毎のパワーレベルを取得する周波数変換処理手段と、前記周波数変換処理手段により取得された複数の帯域毎のパワーレベルの中に第2の閾値を超えるパワーレベルが存在する場合、前記処理対象信号のピーク信号レベルが前記第1の閾値以下になる圧縮率で、前記処理対象信号の信号レベルを圧縮する振幅圧縮処理を実行し、それ以外の場合、前記振幅圧縮処理の実行を禁止する振幅圧縮手段とを備える。
【0032】
前記入力音声信号の中から、回路のダイナミックレンジにより波形が歪んだクリップ部分を検出するクリップ検出手段と、前記振幅圧縮手段により前記振幅圧縮処理が施された処理対象信号のうち、前記クリップ検出手段により前記クリップ部分が検出された音声信号の波形を補間して、ピーク信号レベルが前記第1の閾値となる波形にする波形補間手段とをさらに備えることができる。
【0033】
前記入力音声信号について、信号レベルがバイアスを跨いだ点の位置を、ゼロクロスとして検出するゼロクロス検出手段をさらに備え、前記クリップ手段の処理単位、および前記処理対象信号の単位は、前記ゼロクロス検出手段により検出された2つの前記ゼロクロスの間の信号であるようにできる。
【0034】
前記振幅圧縮手段は、前記処理対象信号の中に前記クリップ検出手段により検出された前記クリップ部分が含まれている場合、前記クリップ部分の時間長に応じた前記圧縮率で、前記処理対象信号に対して前記振幅圧縮処理を施すことができる。
【0035】
前記振幅圧縮手段は、前記処理対象信号の中に前記クリップ検出手段により検出された前記クリップ部分が含まれていない場合、前記ピーク信号レベルが前記第1の閾値となる前記圧縮率で、前記処理対象信号に対して振幅圧縮処理を施すことができる。
【0036】
前記第2の閾値は、前記複数の帯域毎に独立した値をそれぞれ有するようにできる。
【0037】
前記周波数変換処理手段により取得される前記複数の帯域毎のパワーレベルに対して、人間の聴感特性に合わせたフィルタをかけるフィルタ手段をさらに備え、前記振幅圧縮手段は、前記フィルタ手段により前記フィルタがかけられた前記複数の帯域毎のパワーレベルを用いて、前記振幅圧縮処理の実行とその禁止を切り分けることができる。
【0038】
本発明の一側面の信号処理方法およびプログラムは、本発明の一側面の信号処理装置に対応する方法およびプログラムである。
【0039】
本発明の一側面においては、入力音声信号のうち、ピーク信号レベルが第1の閾値を超えている区間を処理対象信号として、前記処理対象信号に対して周波数変換処理を施すことで、複数の帯域毎のパワーレベルが取得され、取得された複数の帯域毎のパワーレベルの中に第2の閾値を超えるパワーレベルが存在する場合、前記処理対象信号のピーク信号レベルが前記第1の閾値以下になる圧縮率で、前記処理対象信号の信号レベルを圧縮する振幅圧縮処理が実行され、それ以外の場合、前記振幅圧縮処理の実行が禁止される。
【発明の効果】
【0040】
本発明によれば、より一段と原音に忠実な音声を記録したり再生できる。
【図面の簡単な説明】
【0041】
【図1】従来のFB形式のAGC回路の一例を示す図である。
【図2】従来のFF形式のAGC回路の一例を示す図である。
【図3】図1および図2のAGC回路を説明するための図である。
【図4】図1および図2のAGC回路を説明するための図である。
【図5】本発明を適用した音声記録装置の構成例を示す図である。
【図6】図5の波形処理回路を説明するための図である。
【図7】図5の波形処理回路を説明するための図である。
【図8】図5の波形処理回路を説明するための図である。
【図9】図5の波形処理回路を説明するための図である。
【図10】図5の波形処理回路を説明するための図である。
【図11】図5の波形処理回路を説明するための図である。
【図12】図5の波形処理回路を説明するための図である。
【図13】図5の波形処理回路を説明するための図である。
【図14】図5の波形処理回路を説明するための図である。
【図15】図5の波形処理回路を説明するための図である。
【図16】図5の波形処理回路を説明するための図である。
【図17】図5の波形処理回路を説明するための図である。
【図18】図5の波形処理回路を説明するための図である。
【図19】図5の波形処理回路を説明するための図である。
【図20】図5の波形処理回路を説明するための図である。
【図21】本発明を適用した音声再生装置の構成例を示す図である。
【図22】本発明を適用した音声記録装置の構成例を示す図である。
【図23】図22の波形処理回路を説明するための図である。
【図24】図22の波形処理回路を説明するための図である。
【図25】本発明を適用したコンピュータのハードウェアの構成例を示す図である。
【発明を実施するための形態】
【0042】
以下、図面を参照して、本発明を適用した信号処理装置の実施形態として、3つの実施の形態(以下、それぞれ第1乃至第3実施形態と称する)について説明する。よって、説明は以下の順序で行う。
1.第1実施形態(音声記録装置に適用される例)
2.第2実施形態(音声再生装置に適用される例)
3.第3実施形態(音声記録装置に適用される例)
【0043】
<1.第1実施形態>
【0044】
[第1実施形態としての音声記録装置の構成例]
【0045】
図5は、本発明を適用した信号処理装置の第1実施形態としての音声記録装置の構成例を示すブロック図である。
【0046】
図5の例の音声記録装置31は、例えば、ビデオカメラの音声記録部分として構成される。音声記録装置31は、マイクロフォン41を介して外部の音を音声信号として入力し、所定の処理を施す。音声記録装置31は、その結果得られる音声信号を、音声記録装置31に装着されている記録媒体、例えば、記録媒体47に記録する。
【0047】
音声記録装置31には、マイクロフォン41、A/Dコンバータ42、波形処理回路43、DSP(Digital Signal Processor)44、エンコーダ45、および記録回路46が設けられている。
【0048】
マイクロフォン41は、外部の音を、アナログの音声信号に変換して、A/Dコンバータ42に供給する。A/Dコンバータ42は、アナログの音声信号に対してA/D変換を施した上で、波形処理回路43に供給する。波形処理回路43は、デジタルの音声信号を、振幅圧縮処理などの波形処理を施した上で、DSP44に供給する。DSP44は、波形処理回路43からの音声信号を、所定の信号処理を施した上で、エンコーダ45に供給する。エンコーダ45は、DSP44からの音声信号を、変調処理を施した上で、記録回路46に供給する。記録回路46は、変調後の音声信号を、例えば、記録媒体47に記録する。
【0049】
音声記録装置31の波形処理回路43は、後述するように、元の波形を極力残しながら、DSP44やエンコーダ45の能力に合わせて振幅を制限できる。このため、音声記録装置31は、内部の回路の能力の範囲内で、原音により忠実な音を記録できるようになっている。
【0050】
[基本振幅制限手法の説明]
【0051】
ここで、本発明の理解を容易にし、且つ、背景を明らかにするため、本発明が適用される振幅制限手法のうち基本となる手法(以下、基本振幅制限手法と称する)の概略について、図6および図7を参照して説明する。
【0052】
なお、動作主体は、図5の波形処理回路43であるとする。即ち、図5の波形処理回路43には、基本振幅制限手法が適用されているとする。また、波形処理回路43は、図5に示されるように、デジタルの音声信号を取り扱う。但し、波形処理回路43は、アナログの音声信号も取り扱うことも当然に可能である。この場合、例えば、波形処理回路43には、マイクロフォン41からのアナログの音声信号がA/Dコンバータ42を介さずに供給される。さらに、例えば、アナログの音声信号を処理したり記録する機能を有する回路が、波形処理回路43の後段の回路として採用される。
【0053】
図6は、基本振幅制限手法が適用された波形処理回路43の処理を説明するための図である。
【0054】
図6のAは、入力音声信号の一例を示している。図6のBは、図6のAの例の入力音声信号に対して振幅圧縮処理を施すことで得られる音声信号の一例を示している。図6のCは、図6のBの例の音声信号に対して波形補間処理を施すことで得られる音声信号、即ち、出力音声信号の一例を示す図である。
【0055】
図6のA乃至Cにおいて、ダイナミックレンジdrは、A/Dコンバータ42のダイナミックレンジを意味する。即ち、ダイナミックレンジdrを超えるアナログの音声信号がA/Dコンバータ42に入力されると、その超えた部分に対応するデジタルの音声信号の部分が、クリップ部分となる。なお、このダイナミックレンジdrと、後述する波形処理回路43以降のダイナミックレンジとは独立したものとして取り扱う。
【0056】
波形処理回路43は、前処理として、入力音声信号のゼロクロスを検出し、そのゼロクロスで入力音声信号を区分する。なお、ゼロクロスとは、入力音声信号の信号レベルが基準レベル(以下、バイアスと称する)を跨ぐこと、または、入力音声信号の波形のうち、信号レベルがバイアスを跨ぐ点の位置をいう。この前処理について、図6のAを参照してさらに詳しく説明する。
【0057】
波形処理回路43は、例えば、図6のA中左から右に向かって入力音声信号F11の信号レベルを順次取得していき、信号レベルがバイアスbiを跨いだか否かを判定する。波形処理回路43は、入力音声信号F11の波形のうち、バイアスbiを跨いだと判定したときの点の位置をゼロクロスとして検出する。例えば、図6のAの例では、点z11乃至z14のそれぞれがゼロクロスとして検出されることになる。波形処理回路43は、入力音声信号F11をゼロクロスで区分する。なお、以下、区分された複数の音声信号のそれぞれを、区分信号と称する。図6のAの例では、入力音声信号F11がゼロクロスz11乃至z14でそれぞれ区分され、区分された複数の音声信号f11乃至f13のそれぞれが、区分信号となる。
【0058】
このような前処理を終了すると、波形処理回路43は、複数の区分信号毎に、例えば次のような処理を実行する。波形処理回路43は、区分信号を構成する各点の信号レベルを検出し(ピーク検波を行い)、区分信号内のピーク信号レベルが第1の閾値を超えているか否かを判定する。
【0059】
なお、ピーク信号レベルとしては、区分信号が1周期続いた場合の振幅値を採用してもよいが、本実施の形態では、説明の簡略上、バイアスからの信号レベルの絶対値が採用されるとする。よって、第1の閾値も、バイアスからの信号レベルの絶対値により表現されるとする。また、ダイナミックレンジも、バイアスにより2等分された信号レベルの絶対値により適宜表現されるとする。
【0060】
また、第1の閾値と記述しているのは、後述する第2の閾値と区別するためである。第1の閾値としては、例えば、後段の信号処理回路、例えば、DSP44やエンコーダ45の都合で決まる任意の値を採用することができる。具体的には、例えば、第1の閾値として、後段の信号処理回路のダイナミックレンジに対応する値を採用することができる。
【0061】
波形処理回路43は、区分信号のうち、連続してダイナミックレンジdrの信号レベルに達している部分があるか否かを判定する。これにより、波形処理回路43は、区分信号の波形にクリップ部分が含まれているか否かを判定する。
【0062】
波形処理回路43は、これらのピーク信号レベルについての判定とクリップ部分についての判定の結果に基づいて、区分信号に対する処理を決定する。この処理としては、振幅圧縮処理,波形補間処理がある。なお、振幅圧縮処理とは、所定の条件を満たす区分信号を処理対象として、処理対象の信号レベルを圧縮する処理をいう。
【0063】
振幅圧縮処理と波形補間処理について図6のA乃至図6のCを参照して説明する。
【0064】
波形処理回路43は、複数の区分信号のうち、ピーク信号レベルが第1の閾値を超え、かつ、クリップ部分が含まれている区分信号を処理対象として、ピーク信号レベルが第1の閾値よりも小さくなるように、振幅圧縮処理を施す。
【0065】
例えば、図6のAの例では、区分信号f11,f12の各ピーク信号レベルは第1の閾値th1を超えていない。このため、図6のBに示されるように、区分信号f11,f12は処理対象とならず、振幅圧縮処理は施されない。これに対して、区分信号f13のピーク信号レベルは第1の閾値th1を超えており、区分信号f13内にはクリップ部分61が含まれている。このため、区分信号f13は処理対象となる。よって、図6のBに示されるように、区分信号f13に対しては、区分信号f13のピーク信号レベルが第1の閾値th1より小さくなるように振幅圧縮処理が施される。その結果、区分信号f13bが得られている。
【0066】
このようにして、図6のAの例の入力音声信号F11に対して振幅圧縮処理が施されると、図6のBの例の音声信号F12が得られる。波形処理回路43は、この音声信号F12に対して、波形補間処理を施す。具体的には、振幅圧縮処理後の区分信号f13bが処理対象となり、図6のCに示されるように、その処理対象のクリップ部分61に対して、第1の閾値th1を振幅値とする波形であって、点62Cを通る波形62を継ぎ足す、といった波形補間処理が施されている。その結果、区分信号f13cが得られている。なお、波形補間処理の手法は、図20を参照して後述するように、図6の例に特に限定されない。また、区分信号f11,f12は、図6のCに示されるように、処理対象とならず、波形補間処理は施されない。
【0067】
このようにして、図6のBの例の音声信号F12に対して波形補間処理が施されると、図6のCの例の音声信号F13が得られ、この音声信号が出力信号として波形処理回路43から出力される。
【0068】
[基本振幅制限手法が適用された波形処理回路の波形応答性の一例]
【0069】
図7は、基本振幅制限手法が適用された波形処理回路43の波形応答性の一例を示す図である。
【0070】
図7のAは、入力音声信号のエンベロープの一例を示す図である。図7のBは、出力音声信号のエンベロープの一例を示す図である。
【0071】
図7のAの例では、時刻TAから時刻TBまでの間において、入力音声信号の振幅が第1の閾値th1を超えている。入力音声信号の波形は、ダイナミックレンジdrに達している。このため、時刻TAから時刻TBまでの間には、ピーク信号レベルが第1の閾値th1を超えている区分信号が幾つか存在し、それらの区分信号のうちの幾つかには、クリップ部分が含まれている。ピーク信号レベルが第1の閾値th1を超えており、かつ、クリップ部分が含まれている区分信号に対しては、ピーク信号レベルが第1の閾値th1になるように振幅圧縮処理と波形補間処理が施される。ピーク信号レベルが第1の閾値th1を超えており、かつ、クリップ部分が含まれていない区分信号に対しては、ピーク信号レベルが第1の閾値th1になるように振幅圧縮処理が施される。ピーク信号レベルが第1の閾値th1を超えていない場合、振幅圧縮処理が施されない。以上から、図7のBに示されるように、時刻TA'から時刻TB'までの間では、出力音声信号の振幅は第1の閾値th1に制限される。
【0072】
また、図7のAの例では、時刻TB以後において、入力音声信号の振幅値は第1の閾値th1を超えていない。このため、時刻TB以後において、区分信号のそれぞれのピーク信号レベルは第1の閾値th1を超えていない。これにより、区分信号のそれぞれに対しては、振幅圧縮処理が施されない。この結果、図7のBに示されるように、時刻TB'以後において、出力音声信号の波形は、入力音声信号の波形のままとなる。即ち、アタックリカバリは発生しない。このように、基本振幅制限手法では、アタックリカバリが発生しないので、当然ながら、アタックリカバリに起因する異音を防止できる。即ち、出力音声信号の音は、より自然な音になっている。
【0073】
基本振幅制限手法では、区分信号のピーク信号レベルが第1の閾値を超えている場合、区分信号に対して振幅圧縮処理を施す。これにより、出力音声信号の振幅が第1の閾値以下に抑えられる。この例では、第1の閾値としては、波形処理回路43以降の信号処理回路のダイナミックレンジに対応する値が採用されている。よって、第1の閾値を超える部分は、波形処理回路43以降の信号処理回路によって歪みが生じる場合がある。しかしながら、基本振幅制限手法では、出力音声信号の振幅が第1の閾値以下に抑えられるので、信号に歪みが生じることを防ぐことができる。
【0074】
また、基本振幅制限手法では、第1の閾値th1として、例えば、後段の回路のダイナミックレンジを採用することができる。これにより、後段の回路のダイナミックレンジを広げなくて済む。この結果、特許文献1および2の手法に比べて、回路規模を削減することが可能となる。
【0075】
しかしながら、第1の閾値を超える部分を含む音声信号であっても、その音声信号に対応する音声を聴いた者にとっては、聴感上違和感を覚えないこともある。なぜならば、人間の聴覚は音の周波数によって敏感であったり鈍感であったりするからである。即ち、第1の閾値を超える部分であっても、その部分の周波数によっては聴感上違和感を覚えにくくなるからである。従って、ピーク信号レベルが第1の閾値を超える区分信号であっても、聴感上違和感がないと判断される区分信号に対しては、振幅圧縮処理を施す必要はないことになる。振幅圧縮処理を施さないことで、例えば、エンベロープ情報が残り易くなるため、音質を改善することが可能になる。
【0076】
そこで、ピーク信号レベルが第1の閾値を超える区分信号のうち、聴感上違和感があると判断される区分信号に対してだけ、振幅圧縮処理を施すという手法を、本発明人はさらに発明した。なお、以下、かかる手法を、2段階閾値振幅制限手法と称する。
【0077】
以下、2段階閾値振幅制限手法について、図8乃至図11を参照して説明する。なお、動作主体は、図5の波形処理回路43であるとする。即ち、図5の波形処理回路43には、2段階閾値振幅制限手法が適用されているとする。
【0078】
2段階閾値振幅制限手法が適用される波形処理回路43は、ピーク信号レベルが第1の閾値を超える区分信号を処理対象として、処理対象に対して周波数変換処理を施すことで、処理対象についての複数の帯域毎のパワーレベルを取得する。
【0079】
[周波数変換処理の説明]
【0080】
図8は、周波数変換処理を説明するための図である。
【0081】
図8のAは、入力音声信号の一例を示す図である。図8のBは、区分信号の複数の帯域毎のパワーレベルの一例を示す図である。
【0082】
図8のAの例では、入力音声信号Fがゼロクロスzのそれぞれで区分されることで、複数の区分信号fが得られている。これらの区分信号fのうち、例えば、図中点線枠内の区分信号fが処理対象となり、処理対象に対して周波数変換処理が施された結果が図8のBに示されている。
【0083】
図8のBの例では、6個の帯域「0Hz〜60Hz」,「60Hz〜200Hz」,「200Hz〜600Hz」,「600Hz〜2kHz」,「2kHz〜6kHz」,「6kHz〜」毎に、パワーレベルg1,g2,g3,g4,g5,g6が取得されている。図8の例の帯域毎のパワーレベルは、例えば、区分信号fに対して周波数変換処理が施されることで得られる周波数成分のうち、その帯域内の周波数成分全てを積算した値として求められる。
【0084】
なお、本実施の形態では区分信号fはデジタルの音声信号であるので、区分信号fに対する周波数変換処理として、例えば、FFT(Fast Fourier Transform,高速フーリエ変換)処理が採用されている。そこで、以下、周波数変換処理をFFT処理と適宜表現するが、この表現は、周波数変換処理がFFT処理に限定されることを意味するものではない。
【0085】
波形処理回路43は、処理対象の区分信号fについての複数の帯域毎のパワーレベルに対してフィルタリング処理を施す。
【0086】
[フィルタリング処理の説明]
【0087】
図9は、フィルタリング処理の例を説明するための図である。
【0088】
図9のAは、帯域毎のパワーレベルの一例を示す図であって、図8のAと同一図である。図9のBは、図9のAの例の帯域毎のパワーレベルに対してフィルタリング処理を施した結果の一例を示す図である。
【0089】
図9のAの例の帯域毎のパワーレベルg1乃至g6に対して、フィルタリング処理が施されることで、図9のBの例の帯域毎のパワーレベルgb1乃至gb6が得られる。
【0090】
この例では、帯域毎のパワーレベルのうち、帯域「0Hz〜60Hz」のパワーレベルg1からパワーレベルgb1の減少度合と、帯域「60Hz〜200Hz」のパワーレベルg2からパワーレベルgb2の減少度合とが大きくなっている。
【0091】
このフィルタリング処理では、人間の聴感特性に合わせたフィルタが用いられる。例えば、IEC(International Electrotechnical Commission)61672-1のIHF(Institute of High Fedelity Inc.standard)Aカーブのフィルタが用いられている。このフィルタにおいては、人間の聴感特性に合わせて、200Hz以下と10kHz以上の周波数特性が小さくなっている。このため、図9の例では、帯域「0Hz〜60Hz」と帯域「60Hz〜200Hz」におけるパワーレベルが大きく減少しているのである。
【0092】
波形処理回路43は、フィルタリング処理後の帯域毎のパワーレベルを検出する(検波する)。波形処理回路43は、フィルタリング処理後の複数の帯域毎のパワーレベルと、帯域毎の第2の閾値とをそれぞれ比較する。そして、波形処理回路43は、第2の閾値を超えているパワーレベルがあるか否かを判定することで、聴感上問題があるか否かを判断する。波形処理回路43は、この判断結果に基づいて、振幅圧縮処理を行う。フィルタリング処理後の帯域毎のパワーレベルについての比較処理から振幅圧縮処理までの一連の処理を、以下、聴感判断圧縮処理と総称する。
【0093】
[聴感判断圧縮処理の説明]
【0094】
図10および図11は、聴感判断圧縮処理を説明するための図である。なお、図10および図11の例の帯域毎のパワーレベルは、図9のBの例の帯域毎のパワーレベルと同一のものである。
【0095】
図10および図11の例では、第2の閾値th2は、帯域「0Hz〜60Hz」乃至「6kHz〜」毎の値aa乃至ffのそれぞれにより構成されている。第2の閾値th2の帯域毎の値aa乃至ffのそれぞれが、例えば、帯域「0Hz〜60Hz」乃至「6kHz〜」のそれぞれにおいて聴感上違和感を覚え始めると想定されるパワーレベルに設定されている。
【0096】
図10の例では、帯域毎のパワーレベルgb1乃至gb6のそれぞれは、第2の閾値th2の帯域毎の値aa乃至ffをそれぞれ超えていない。このような場合、即ち、帯域毎のパワーレベルgb1乃至gb6のいずれもが第2の閾値th2の帯域毎の値を超えていない場合、聴感上問題がないと判断して、区分信号に対して振幅圧縮処理が施されない。
【0097】
一方、図11の例では、帯域毎のパワーレベルgb2が、第2の閾値th2の帯域毎の値bbを超えている。それ以外の帯域毎のパワーレベルgb1,gb3乃至gb6のぞれぞれは、第2の閾値th2の帯域毎の値aa, cc乃至ffをそれぞれ超えていない。このような場合、即ち、帯域毎のパワーレベルgb1乃至gb6のうち、第2の閾値th2の帯域毎の値を超えているものがある場合、聴感上問題があると判断して、区分信号に対して、ピーク信号レベルが第1の閾値th1以下になるように振幅圧縮処理が施される。
【0098】
なお、波形処理回路43では、帯域毎のパワーレベルgb1乃至gb6のうち、第2の閾値th2の帯域毎の値を超えているパワーレベルの個数が任意の所定数より小さい場合、区分信号に対して振幅圧縮処理を施さないようにすることもできる。
【0099】
また、本実施の形態では、波形処理回路43は、第2の閾値の帯域毎の値を、内部のテーブルに保持するとする。
【0100】
[第2の閾値の帯域毎の値が保持されるテーブルの一例]
【0101】
図12は、第2の閾値の帯域毎の値が保持されるテーブルの一例を示す図である。図11に示されるように、テーブルにおいて、帯域「0Hz〜60Hz」乃至「6kHz〜」のそれぞれに対して、第2の閾値th2の帯域毎の値aa乃至ffのそれぞれが対応付けられている。但し、第2の閾値の帯域毎の値の保持手法は、特に限定されない。
【0102】
波形処理回路43は、フィルタリング処理後の帯域毎のパワーレベルについての判定に加えて、さらに、基本振幅制限手法におけるクリップ部分についての判定も行う。波形処理回路43は、これらの判定の結果に基づいて、区分信号に対する処理を決定する。
【0103】
[2段階閾値振幅制限手法が適用された波形処理回路43の処理結果の一例]
【0104】
図13は、2段階閾値振幅制限手法が適用された波形処理回路43の処理結果の一例を説明するための図である。
【0105】
図13のAは、入力音声信号の一部の例を示す図である。図13のBは、出力音声信号の一部の例を示す図である。
【0106】
図13のAの例では、入力音声信号F21について、ゼロクロスz21乃至z27が検出されている。入力音声信号F21は、ゼロクロスz21乃至z27で区分され、その結果、区分信号f21乃至f26が得られている。
【0107】
区分信号f21, f22, f26内のピーク信号レベルは第1の閾値th1内に収まっている。なお、区分信号内のピーク信号レベルが第1の閾値th1内に収まっている状態を、以下、図中の記述に従って「閾値th1内」と適宜記述する。区分信号f23, f24, f25内のピーク信号レベルは、第1の閾値th1を超過している。なお、区分信号内のピーク信号レベルが第1の閾値th1を超過している状態を、以下、図中の記述に従って「閾値th1超過」と適宜記述する。
【0108】
区分信号f23およびf25の帯域毎のパワーレベルの中には、第2の閾値th2を超過しているものがある。なお、「閾値th1超過」において、区分信号の帯域毎のパワーレベルの中に、第2の閾値th2を超えているものがある状態を、以下、図中の記述に従って「閾値th2超過」と適宜記述する。区分信号f24の帯域毎のパワーレベルは、全て第2の閾値th2以下に収まっている。なお、「閾値th1超過」において、区分信号の帯域毎のパワーレベルの全てが第2の閾値th2以下に収まっている状態を、以下、図中の記述に従って「閾値th2内」と適宜記述する。区分信号f23は、クリップ部分を含んでいない。なお、「閾値th1超過」において、区分信号がクリップ部分を含んでいない状態を、以下、図中の記述に従って「クリップ無」と適宜記述する。区分信号f25は、クリップ部分81を含んでいる。なお、「閾値th1超過」において、区分信号がクリップ部分を含んでいる状態は、以下、図中の記述に従って「クリップ有」と適宜記述する。
【0109】
以上の区分信号f21乃至f26に対しては、次のような処理結果が得られる。
【0110】
即ち、区分信号f21, f22, f26の状態は「閾値th1内」なので、区分信号f21, f22, f26は、振幅圧縮処理も波形補間処理も施されずに、そのまま区分信号f41, f42, f46とされる。
【0111】
区分信号f23の状態は、「閾値th1超過」かつ「閾値th2超過」かつ「クリップ無」となっている。従って、区分信号f23に対しては、区分信号f23内のピーク信号レベルが第1の閾値th1に一致するように振幅圧縮処理が施され、その結果得られる信号が区分信号f43となっている。区分信号f24の状態は、「閾値th1超過」かつ「閾値th2内」なので、区分信号f24は、振幅圧縮処理も波形補間処理も施されず、そのまま区分信号f44となっている。即ち、ピーク信号レベルが第1の閾値th1を超えた音声信号が、区分信号f44となっている。区分信号f25の状態は、「閾値th1超過」かつ「閾値th2超過」かつ「クリップ有」なので、区分信号f25に対しては、区分信号f25内のピーク信号レベルが第1の閾値th1より小さくなるように振幅圧縮処理が施される。振幅圧縮処理後の区分信号f25に対しては波形補間処理が施される。具体的には例えば、区分信号f25のクリップ部分81に対して、第1の閾値th1を振幅値とする点82Cを通る波形82を継ぎ足す、といった波形補間処理が施される。このようにして、区分信号f25に対して振幅圧縮処理と波形補間処理が施された結果得られる信号、即ち、ピーク信号レベルが第1の閾値th1になった信号が、区分信号f45となっている。
【0112】
このように、2段階閾値振幅制限手法では、「閾値th2内」の区分信号、即ち、聴感上問題ないと判断された区分信号に対しては、振幅圧縮処理や波形補間処理を施さないようにすることができる。これにより、元の波形を極力残すことができ、原音により忠実な音が得られる。また、「閾値th1超過」の区分信号であっても、聴感上問題がないと判断される「閾値th2内」の区分信号に対しては、振幅圧縮処理を施さないようにすることができる。これにより、エンベロープ情報が残り易くなるため、音質が改善できる。
【0113】
また、2段階閾値振幅制限手法では、基本振幅制限手法と同様に、第1の閾値th1として、例えば、後段の回路のダイナミックレンジを採用することができる。これにより、後段の回路のダイナミックレンジを広げなくて済む。この結果、特許文献1および2の手法に比べて、回路規模を削減することが可能となる。
【0114】
2段階閾値振幅制限手法では、フィルタリング処理後の帯域毎のパワーレベルを検波する手法が採用されている。このため、ノイズ成分が多い信号が入力された場合でも、聴感上違和感がなければ(聞こえにくいければ)、入力音声信号がそのまま出力音声信号として出力される。このため、出力音声信号の振幅を抑え過ぎるというピーク検波手法で生じる現象を抑制することができる。
【0115】
以上に説明した2段階閾値振幅制限手法が適用された波形処理回路43の詳細な構成例について説明する。
【0116】
[2段階閾値振幅制限手法が適用された波形処理回路の詳細な構成例]
【0117】
図14は、波形処理回路43の詳細な構成例を示すブロック図である。
【0118】
なお、図14の例の波形処理回路43では、デジタルの音声信号が入力される。
【0119】
波形処理回路43には、メモリ101、データ読み書き回路102、ゼロクロス検出回路103、および判定回路104が設けられている。判定回路104には、ピーク検波回路111、スイッチ112、FFT回路113、フィルタ114、周波数領域検波回路115、およびスイッチ116が設けられている。判定回路104には、さらに、クリップ検出回路117、クリップ長検出回路118、振幅圧縮回路119、スイッチ120、波形補間データ生成回路121、および閾値保持回路122が設けられている。
【0120】
なお、波形処理回路43の各構成要素の機能の説明等は、次の波形処理回路43の処理の説明の中であわせて説明する。
【0121】
[波形処理回路の処理例]
【0122】
次に、図15および図16のフローチャートを参照して、波形処理回路43の処理(以下、波形処理と称する)の一例について説明する。
【0123】
なお、閾値保持回路122は、上述した第1の閾値th1と第2の閾値th2とを保持している。以下の説明では、ピーク検波回路111,振幅圧縮回路119,波形補間データ生成回路121は、閾値保持回路122から第1の閾値th1を予め読み出して自身内部に保持しているとする。周波数領域検波回路115は、閾値保持回路122から第2の閾値th2を予め読み出して自身内部に保持しているとする。
【0124】
メモリ101は、A/Dコンバータ42からのデジタルの音声信号を順次蓄積していく。ステップS11において、データ読み書き回路102は、メモリ101に音声信号が蓄積されたか否かを判定する。
【0125】
例えば、メモリ101に音声信号が所定量蓄積されない限り、処理はステップS11に戻される。即ち、メモリ101に音声信号が所定量蓄積されるまでの間、ステップS11の判定処理が繰り返される。
【0126】
その後、メモリ101に音声信号が所定量蓄積されると、ステップS11においてYESであると判定されて、処理はステップS12に進む。ステップS12において、データ読み書き回路102は、メモリ101から所定量の音声信号を読み出し、入力音声信号としてゼロクロス検出回路103に供給する。ステップS13において、ゼロクロス検出回路103は、入力音声信号を構成するデータ点のうち、信号レベルがバイアスを跨いだ前後の点の間の位置をゼロクロスとして検出し、その位置情報をゼロクロス情報として保持する。ステップS14において、データ読み書き回路102は、ゼロクロスが発生したか否かを判定する。
【0127】
ゼロクロス情報として保持しているゼロクロスの数が0である限り、ステップS14においてNOであると判定されて、処理はステップS11に戻される。
【0128】
これに対して、ゼロクロス情報として保持しているゼロクロスの数が1以上である場合、ステップS14においてYESであると判定されて、処理はステップS15に進む。ステップS15において、データ読み書き回路102は、メモリ101に蓄積されている入力音声信号を、ゼロクロス情報として保持している1以上のゼロクロスで区分する。即ち、区分された複数の信号のそれぞれが、上述した区分信号となる。ステップS16において、データ読み書き回路102は、複数の区分信号のうち所定の1つをメモリ101から読み出し、判定回路104のピーク検波回路111およびスイッチ112に供給する。ステップS17において、ピーク検波回路111は、区分信号内のピーク信号レベルが第1の閾値th1を超えているか否かを判定する。
【0129】
区分信号内のピーク信号レベルが第1の閾値th1を超えていない場合、ステップS17においてNOであると判定されて、処理はステップS18に進み、ピーク検波回路111は、スイッチ112を端子112Aに切換える。これにより、(「閾値th1内」の)区分信号が、振幅圧縮されずにそのままデータ読み書き回路102に出力される。その後、処理はステップS36に進む。なお、ステップS36以降の処理については後述する。
【0130】
これに対して、区分信号内のピーク信号レベルが第1の閾値th1を超えている場合、ステップS17においてYESであると判定されて、処理はステップS19に進み、ピーク検波回路111は、スイッチ112を端子112Bに切換える。これにより、区分信号が次のFFT回路113およびスイッチ116に供給される。
【0131】
ステップS20において、FFT回路113は、区分信号に対してFFT処理を施すことで、区分信号についての複数の帯域毎のパワーレベルを取得し、フィルタ114に供給する。ステップS21において、フィルタ114は、複数の帯域毎のパワーレベルを、フィルタリング処理を施した上で、周波数領域検波回路115に供給する。ステップS22において、周波数領域検波回路115は、複数の帯域毎のパワーレベルのうち、第2の閾値の帯域毎の値を超えているものがあるか否かを判定する。
【0132】
帯域毎のパワーレベルのうち、第2の閾値の帯域毎の値を超えているものがない場合、ステップS22においてNOであると判定されて、処理はステップS23に進み、周波数領域検波回路115は、スイッチ116を端子116Aに切換える。これにより、(「閾値th1超過」かつ「閾値th2内」の)区分信号が、振幅圧縮されずにそのままデータ読み書き回路102に出力される。すなわち、第1の閾値th1を超えた区分信号が、データ読み書き回路102に出力される。その後、処理はステップS36に進む。なお、ステップS36以降の処理については後述する。
【0133】
これに対して、複数の帯域毎のパワーレベルのうち、第2の閾値の帯域毎の値を超えているものがある場合、ステップS22においてYESであると判定されて、処理はステップS24に進む。ステップS24において、周波数領域検波回路115は、スイッチ116を端子116Bに切換える。これにより、区分信号が、次のクリップ検出回路117および振幅圧縮回路119に供給される。ステップS25において、クリップ検出回路117は、区分信号の波形のクリップ部分を検出する。例えば、波形処理回路43が4bitの回路で構成される場合、クリップ検出回路117は、区分信号のうち「1111」または「0000」の連続部分を、クリップ部分として検出する。なお、波形処理回路43は、任意のビット数の回路で構成できる。
【0134】
ステップS26において、クリップ長検出回路118は、クリップ部分の時間長(以下、クリップ長と称する)を求める。但し、クリップ長検出回路118は、クリップ部分が検出されていない区分信号に対しては、クリップ長を0とする。ステップS27において、クリップ長検出回路118は、区分信号のクリップ長は0であるか否かを判定する。
【0135】
区分信号のクリップ長が0でない場合、ステップS27においてNOであると判定されて、処理はステップS28に進み、クリップ長検出回路118は、区分信号の(0でない)クリップ長を振幅圧縮回路119に通知する。その後、処理は、ステップS29に進む。
【0136】
これに対して、区分信号のクリップ長が0である場合、ステップS27においてYESであると判定されて、処理はステップS33に進む。ステップS33以降の処理については後述する。
【0137】
ステップS29において、振幅圧縮回路119は、区分信号を、(0でない)クリップ長に応じた圧縮率で振幅圧縮処理を施した上で、スイッチ120に供給する。
【0138】
[クリップ長に応じた圧縮率で振幅圧縮処理を施す理由]
【0139】
このクリップ長に応じた圧縮率で振幅圧縮処理を行う理由について図17および図18を参照して説明する。
【0140】
図17は、クリップ長が短い場合に小さい圧縮率で振幅圧縮処理を行う理由を説明するための図である。
【0141】
図17のAは、(振幅圧縮処理前の)区分信号の一例を示す図である。図17のBは、振幅圧縮処理後の区分信号の一例を示す図である。図17のCおよびDは、波形補間処理後の区分信号の一例を示す図である。
【0142】
図17のAの例では、クリップ部分cpが含まれた区分信号fを処理対象とする。この処理対象の区分信号fは、ゼロクロスzaとゼロクロスzbで区分されている。
【0143】
図17のAに示されるように、区分信号fのうちクリップ部分cpの長さが、区分信号f全体の長さの10%以下等といった短い場合を想定する。この場合、クリップ部分cpにより失われた波形kpの部分の面積(波形kpとクリップ部分cpで囲まれる面積)は狭いと想定される。図17のBには、この区分信号fに対して小さい圧縮率で振幅圧縮処理が施された結果得られる区分信号fbが示されている。図17のCには、区分信号fbのクリップ部分cpに対して波形補間処理が施された結果得られる区分信号fcが示されている。この波形補間処理では、振幅圧縮処理後の区分信号fbのクリップ部分cpに対して、第1の閾値th1を振幅値とする点hpを通る波形xpを継ぎ足す波形補間処理が施される。なお、この点hpは、以下、波形補間点hpと適宜称する。波形xpは、以下、補間波形xpと適宜称する。この振幅圧縮処理により、区分信号fのうち、クリップ部分cp以外の部分(以下、非クリップ部分と称する)mpは変形するが、その変形は最小限となる。この結果、音質の劣化を最小限に抑えることができる。一方、図17のDには、(振幅圧縮処理前の)同一の区分信号fに対して大きい圧縮率で振幅圧縮処理が施され、同様の波形補間処理が施された結果得られる区分信号fc'が示されている。この区分信号fc'の補間波形xpは、上下に間延びした形状になっている。このため、区分信号fc'における補間波形xpと非クリップ部分mpとの繋ぎ目が不自然になり、信号に歪みが生じる恐れがある。
【0144】
図18は、クリップ長が長い場合に大きい圧縮率で振幅圧縮処理を行う理由を説明するための図である。
【0145】
図18のAは、(振幅圧縮処理前の)区分信号の一例を示す図である。図18のBは、振幅圧縮処理後の区分信号の一例を示す図である。図18のCおよびDは、波形補間処理後の区分信号の一例を示す図である。
【0146】
図18のAに示されるように、区分信号fのうちクリップ部分cpの長さが、区分信号f全体の長さの80%以上を占めるといった長い場合を想定する。この場合、クリップ部分cpにより失われた波形kpの部分の面積は広いと想定される。なお、この想定は、クリップ部分cpの長さが短い場合と逆である。図18のBには、この区分信号fに対して大きい圧縮率で振幅圧縮処理が施された結果得られる区分信号fbが示されている。図18のCには、区分信号fbのクリップ部分cpに対して波形補間処理が施された結果得られる区分信号fcが示されている。この波形補間処理では、振幅圧縮処理後の区分信号fbに対して、第1の閾値th1を振幅値とする点hpを通る波形xpを継ぎ足す波形補間処理が施される。この振幅圧縮処理により、クリップ部分cpの長さが短い場合に比べて、波形xpの補間量が増えている。一方、図18のDには、(振幅圧縮処理前の)同一の区分信号fに対して、小さい圧縮率で振幅圧縮処理が施され、同様の波形補間処理が施されることで得られる区分信号fc'が示されている。この区分信号fc'における補間波形xpと非クリップ部分mpとの繋ぎ目が不自然になり、信号に歪みが生じる恐れがある。
【0147】
このように、クリップ長に応じた圧縮率で振幅圧縮処理を行うのは、補間波形との繋ぎ目を滑らかすることで、信号に歪みを生じさせないようにするためである。
【0148】
なお、クリップ長に応じた圧縮率で行う振幅圧縮処理とは、基本的に次のような処理である。
【0149】
[クリップ長に応じた圧縮率で行う振幅圧縮処理の例の説明]
【0150】
図19は、クリップ長に応じた圧縮率で行う振幅圧縮処理を説明するための図である。
【0151】
図19のA,C,Eは、(振幅圧縮処理前の)区分信号を示す図である。図19のB,D,Fは、振幅圧縮処理後の区分信号を示す図である。
【0152】
図19のAに示されるように、区分信号fのクリップ部分cpの長さが短い場合、その区分信号fに対しては小さい圧縮率で振幅圧縮処理が施され、その結果、図19のBの例の区分信号fbが得られる。この区分信号fbの信号レベルは少しだけ圧縮されている。図19のCに示されるように、区分信号fのクリップ部分cpの長さが中程度の場合、その区分信号fに対しては中程度の圧縮率で振幅圧縮処理が施され、その結果、図19のCの例の区分信号fbが得られる。この区分信号fbの信号レベルは中程度に圧縮されている。図19のEに示されるように、区分信号fのクリップ部分cpの長さが長い場合、その区分信号fに対しては大きい圧縮率で振幅圧縮処理が施され、その結果、図19のFの例の区分信号fbが得られる。この区分信号fbの信号レベルは大幅に圧縮されている。
【0153】
このクリップ長に応じた圧縮率で行う振幅圧縮処理の一例として、圧縮率をクリップ長に比例させる振幅圧縮処理を説明する。この例では、振幅圧縮処理の圧縮率は、圧縮量と称され、その値はattと記述される。圧縮量attは、例えば、次式(1)で示される。
【0154】
att=th1×ct/cmax (単位:dB) ・・・(1)
【0155】
なお、式(1)において、th1は、第1の閾値(単位:dB)を示している。ctは、区分信号のクリップ長の値(単位:秒)を示している。cmaxは、クリップ長の想定される最大値(以下、最大クリップ長と称する)(単位:秒)を示している。式(1)は、クリップ長を秒単位で扱っているので、アナログの音声信号についても、勿論適用可能である。
【0156】
デジタルの音声信号についての圧縮量attの計算例について説明する。デジタルの音声信号についてのクリップ長は、サンプル数で記述される。例えば、時間長で記述される最大クリップ長は1秒とし、サンプリング周波数は48kHzとする。この場合、(サンプル数で記述される)最大クリップ長は、48000個となる。また、階調で記述される第1の閾値th1は256とすると、(dB単位で記述される)第1の閾値th1は、−48.2dB(=20log(1/256))となる。この場合、圧縮量attは、次式(2)で示される。
【0157】
−48.2×n/48000(単位:dB) ・・・(2)
【0158】
なお、式(2)で、nは、区分信号fのクリップ長(サンプル数で記述)を示している。
【0159】
この式(2)の圧縮量attを用いて区分信号に対して振幅圧縮処理を施すことで、区分信号のクリップ長が短い場合、区分信号内の振幅を少しだけ圧縮することができる。区分信号のクリップ長が長い場合、区分信号内の振幅を大幅に圧縮することができる。
【0160】
なお、クリップ長が最大クリップ長を越えた場合、例えば、区分信号全体がクリップ部分と判断して、最大クリップ長の圧縮量で圧縮する手法を採用することができる。この手法を採用した場合、最大クリップ長の圧縮量は−48.2dB(=−48.2×48000/48000)となる。また、他の手法として、クリップ長が最大クリップ長を越えた場合の処理を例外処理とし、その例外処理で、区分信号全体の波形を他の波形に置き換える手法を採用することも可能である。また、クリップ長に応じた圧縮率を求める他の手法として、例えば、次のような手法を採用することもできる。即ち、クリップ長に対して圧縮率を対応付けるテーブル値を予め保持しておき、それを参照することで、区分信号のクリップ長に対する圧縮率を求める手法を採用することができる。
【0161】
図16に戻り、ステップS30において、クリップ長検出回路118は、スイッチ120を端子120Bに切換える。これにより、振幅圧縮回路119からの振幅圧縮処理後の区分信号が、波形補間データ生成回路121に供給される。ステップS31において、波形補間データ生成回路121は、区分信号のクリップ部分に対して、第1の閾値th1を振幅値とする点を通る波形を継ぎ足す、といった波形補間処理を施す。
【0162】
[波形補間処理の一例]
【0163】
図20を参照して、波形補間処理の詳細例について説明する。
【0164】
図20のAは、(振幅圧縮処理前の)区分信号の一例を示す図である。図20のBは、振幅圧縮処理後の区分信号の一例を示す図である。図20のCは、波形補間処理後の区分信号の一例を示す図である。
【0165】
図20のAの例では、区分信号fの波形がダイナミックレンジdrに達して直線になっている部分がクリップ部分cpとして検出されている。このため、区分信号fに対しては振幅圧縮処理が施され、その結果、図20のBの例の区分信号fbが得られている。区分信号fbのクリップ部分cpに対しては、始点spと終点epがそれぞれ検出される。区分信号fbに対しては、波形補間処理が施され、その結果、図20のCの例の区分信号fcが得られる。この波形補間処理は、例えば、次のような処理である。始点spと終点epを結ぶ直線の中点が、クリップ部分cpの中心として求められる。クリップ部分cpの中心のサンプリング位置(図中横方向の位置)と、第1の閾値th1の振幅値(図中縦方向の位置)に基づいて、波形補間点hpが決定される。例えば、クリップ部分cpの中心と同一のサンプリング位置の点のうち、第1の閾値th1を振幅値とする点が波形補間点hpに決定される。始点sp、終点ep、および波形補間点hpを繋ぐ補間波形xpが作成され、クリップ部分cpに対して継ぎ足される。
【0166】
なお、区分信号fに複数のクリップ部分cpが存在する場合、それらを全て把握しておき、複数のクリップ部分cpのそれぞれに対して波形補間処理が繰り返し行われる。
【0167】
以上に説明した波形補間処理の詳細例における始点sp、終点ep、および波形補間点hpの3点を繋ぐ補間手法として、本実施の形態では、例えば、スプライン補間手法が採用される。なお、このスプライン補間手法については後述する。但し、補間手法は、特に限定されない。例えば、ラグランジェ関数を用いる補間手法や、各点を通る円弧を求める補間手法、各点を単純に直線で繋げる補間手法などを採用することもできる。また、補間波形を図示せぬメモリに予め保持しておき、クリップ長や圧縮率に応じて補間波形を変形し、変形後の補間波形をクリップ部分に継ぎ足す補間手法などを採用することもできる。
【0168】
図16に戻り、ステップS32において、波形補間データ生成回路121は、波形補間処理後の区分信号をデータ読み書き回路102に出力する。これにより、(「閾値th1超過」かつ「閾値th2超過」かつ「クリップ有」の)区分信号に対して振幅圧縮処理と波形補間処理が施された結果得られる区分信号が、データ読み書き回路102に出力される。すなわち、ピーク信号レベルが第1の閾値th1となった区分信号が、データ読み書き回路102に出力される。その後、処理はステップS36に進む。ステップS36以降の処理については後述する。
【0169】
ところで、前述したステップS27でYESであると判定された場合、即ち、区分信号のクリップ長が0である場合、処理はステップS33に進む。ステップS33において、クリップ長検出回路118は、区分信号の(0の)クリップ長を振幅圧縮回路119に通知する。ステップS34で、振幅圧縮回路119は、区分信号のピーク信号レベルが第1の閾値th1に一致するように、区分信号に対して振幅圧縮処理を施す。即ち、例えば、振幅圧縮回路119は、次式(3)の圧縮量attで区分信号に対して振幅圧縮処理を施す。
【0170】
att=dmax/th1 (単位:dB) ・・・(3)
【0171】
なお、式(3)において、dmax(単位:dB)は、区分信号のピーク信号レベルを示している。th1は、第1の閾値th1を示している(単位:dB)。
【0172】
ステップ35において、クリップ長検出回路118は、スイッチ120を端子120Aに切換える。これにより、(「閾値th1超過」かつ「閾値th2超過」かつ「クリップ無」の)区分信号に対して振幅圧縮処理が施された結果得られる区分信号が、データ読み書き回路102に出力される。すなわち、ピーク信号レベルが第1の閾値th1となった区分信号が、データ読み書き回路102に出力される。
【0173】
ステップS36において、データ読み書き回路102は、判定回路104からの区分信号を、メモリ101に書き込む。ステップS37において、データ読み書き回路102は、判定回路104からの区分信号が最後の区分信号か否かを判定する。
【0174】
判定回路104からの区分信号が最後の区分信号でない場合、ステップS37においてNOであると判定されて、処理はステップS16に戻される。
【0175】
これに対して、判定回路104からの区分信号が最後の区分信号である場合、ステップS37においてYESであると判定されて、処理はステップS38に進み、データ読み書き回路102は、ゼロクロス情報をリセットする。ステップS39において、データ読み書き回路102は、処理を終了するか否かを判定する。
【0176】
例えばユーザ操作などに基づく処理終了の指示が波形処理回路43に供給されない限り、ステップS39でNOであると判定されて、処理は図15のステップS11に戻される。
【0177】
これに対して、例えばユーザ操作などに基づく処理終了の指示が波形処理回路43に供給された場合、ステップS39でYESであると判定されて、波形処理は終了される。
【0178】
なお、この例の波形処理回路43は、FF形式のデジタル回路で構成されていると把握できる。すなわち、波形処理回路43は、従来のAGC回路(FB形式のアナログ回路)に比べて回路面積を小さくできる。コストを抑えることができる。また、波形処理回路43では、アタックリカバリの設定を考える必要がない。従って、回路の設計が容易になる。
【0179】
次に、前述した始点sp、終点ep、および波形補間点hpの3点を繋ぐ補間手法としてのスプライン補間手法について説明する。
【0180】
スプライン補間手法とは、離散したデータ点をしなやかな弾性体でできた帯(スプライン)でなめらかに接続する補間手法をいう。スプラインは、その両端や途中の数点を支持することで、各点を通って弾性体の性質に従う曲線を描く。スプラインは、数学的には、各データ点を通るk次の多項式であって、k-1(kは1以上の整数値)次の微分係数が線型となる多項式として付与される。この多項式としては、3次の多項式が多く用いられる。そこで、以下、3次の多項式を用いた3次のスプライン補間手法について説明する。
【0181】
なお、以下、説明にはx,y座標系を用いる。また、以下、N個の(Nは2以上の整数値)データ点のうち、x座標値の小さい順でj(jは0以上の整数値)番目のデータ点についてのx座標値を、以下、xjと記述する。スプラインのx軸方向の区間全体を、以下、スプライン区間と称する。スプライン区間は各データ点で区分される。3次のスプライン補間手法では、区分された複数の区間のそれぞれに対して、3次の多項式が付与される。各区間の多項式は区分補間式と称される。このうち、j番目とj+1番目のデータ点で区分される区間についての区分補間式sj(x)は、次式(4)で示される。
【0182】
【数1】

・・・(4)
【0183】
なお、式(4)において、aj,bj,cj,djは、未知係数を示している。
【0184】
区分補間式はN個存在し、N個の区分補間式のそれぞれに対して4個の未知係数が存在する。このため、合計で4N個の未知係数が存在する。4N個の未知係数全てを求めるためには、未知係数の間の関係を示す方程式が4N個必要になる。そこで、幾つかの条件を課すとする。最初の条件は、スプラインはN個のデータ点全てを通るという条件である。この条件から、各区間の両端での座標値が決まるため、2N個の方程式を得ることができる。次の条件は、各区間の境界点での1次導関数は連続という条件である。この条件から、境界点は、N-1個存在するため、N-1個の方程式を得ることができる。次の条件は、各区間の境界点での2次導関数は連続という条件である。この条件から、同様にN-1個の方程式を得ることができる。
【0185】
従って、条件は4N-2個の方程式で表現される。しかしながら、未知係数を求めるのに必要な方程式は4N個なので、まだ方程式は2個不足している。この方程式の不足を補うためには、様々な条件が考えられる。通常の場合、スプライン区間の両端(x=x0, xN-1)における2次導関数の値が0という条件が用いられる。即ち、s0”(x0)=sN-1”(xN-1)=0という条件が用いられる。この条件を満たすスプラインは、自然スプラインと称される。本実施の形態では、自然スプラインが採用される。但し、スプラインの種類は特に限定されない。例えば、スプライン区間の両端における1次導関数の値として0以外の値が指定されるスプラインを採用することも可能である。
【0186】
次に、自然スプラインの条件を満たす連立方程式を求める。x=xjにおける区分補間式sj(x)の2次導関数の値をujとする。即ち、ujは次式(5)で示される。
【0187】
【数2】

・・・(5)
【0188】
uj=sj-1"(xj)=sj"(xj)とすると、上述した2次導関数の条件は満足されることになる。区分補間式sj(x)の2次導関数の計算から次式(6)および(7)が導かれる。
【0189】
【数3】

・・・(6)
【数4】

・・・(7)
【0190】
さらに、区分補間式sj(x)の2次導関数にx=xjを代入すると、次式(8)が導かれる。
【0191】
【数5】

・・・(8)
【0192】
この式(8)からajを計算すると、次式(9)が導かれる。
【0193】
【数6】

・・・(9)
【0194】
次に、全てのデータ点上を通過するという最初の条件について考える。まずは、各区間の左端のデータ点を通過することから、次式(10)が導かれる。
【0195】
【数7】

・・・(10)
【0196】
次に、各区間の右端のデータ点を通過することから、次式(11)が導かれる。
【0197】
【数8】

・・・(11)
【0198】
式(4),(6),(7)を用いると、次式(12)が導かれる。
【0199】
【数9】

・・・(12)
【0200】
これにより、未知係数aj,bj,cj,djを用いてxj,yj,ujを記述することができた。xjとyjは既知の値であることから、ujが求まれば補間に必要な未知係数が全て求まることになる。ujを求めるには、まだ使用していない1次導関数が区間の境界点で等しいという条件を利用すればよい。即ち、次式(13)を利用する。
【0201】
【数10】

・・・(13)
【0202】
式(13)と式(4)から次式(14)が導かれる。
【0203】
【数11】

・・・(14)
【0204】
次に、式(14)におけるaj,bj,cj,djをxj,yj,ujで記述することで、ujの連立方程式にする。これにより、最終的に次式(15)が導かれる。
【0205】
【数12】

・・・(15)
【0206】
式(15)における方程式の数は、N-1個となっている。ujの個数はN+1個だが,u0=uN=0なので,未知のujはN-1個となる。式(15)を解くことにより、全てのujが決定できる。全てのujが決定されれば、未知係数aj,bj,cj,djが計算できる。u0=uN=0を代入した連立1次方程式は、次式(16)で記述される。但し、hjとvjは、次の式(17)および式(18)で記述される。
【0207】
【数13】

・・・(16)
【数14】

・・・(17)
【数15】

・・・(18)
【0208】
このようにして、4N個の未知係数全てが求まり、スプライン補間が可能になる。なお、一般に、n-1次の多項式を用いたn-1次のスプライン補間手法の場合はn個のデータ点が必要になる。データ点が足りない場合は、スプライン区間としてのクリップ部分の始点より前のデータ点またはクリップ部分の終点より後のデータ点を、スプライン補間のためのデータ点として用いればよい。これにより、データ点の不足を解消できる。
【0209】
<第2実施形態>
【0210】
次に、第2実施形態について説明する。
【0211】
[第2実施形態としての音声再生装置の構成例]
【0212】
図21は、本発明を適用した信号処理装置の第2実施形態としての音声再生装置の構成例を示すブロック図である。
【0213】
図21の例の音声再生装置141は、例えば、ビデオカメラの音声再生部分として構成される。音声再生装置141に装着されている記録媒体、例えば、記録媒体151から音声信号を読み出して再生して所定処理を施す。音声再生装置141は、その結果得られる音声信号を音としてスピーカ156を介して外部に出力する。
【0214】
図21の例の音声再生装置141は、図13の例の音声記録装置31における波形処理回路43と同一の波形処理回路を使用している。そこで、以下、波形処理回路43の符号を用いて説明する。音声再生装置141には、波形処理回路43、再生回路152、デコーダ153、D/Aコンバータ154、アンプ回路155、およびスピーカ156が設けられている。
【0215】
再生回路152は、例えば、記録媒体151から音声信号を読み出して再生し、デコーダ153に供給する。デコーダ153は、音声信号を、復調処理を施した上で、波形処理回路43に供給する。波形処理回路43は、デジタルの音声信号を、振幅圧縮処理などの波形処理を施した上で、D/Aコンバータ154に供給する。D/Aコンバータ154は、デジタルの音声信号を、D/A変換を施した上で、アンプ回路155に供給する。アンプ回路155は、アナログの音声信号を、電力増幅処理を施して電気信号としてスピーカ156に供給する。スピーカ156は、電気信号を音として外部に出力する。
【0216】
音声再生装置141の波形処理回路43は、元の波形を極力残しながら、D/Aコンバータ154およびアンプ回路155の能力に合わせて振幅を制限できる。このため、音声再生装置141は、内部の回路の能力の範囲内で、原音により忠実な音を再生できる。
【0217】
なお、第1の閾値としては、例えば、後段の信号処理回路、例えば、D/Aコンバータ154やアンプ回路155の都合で任意の値を採用できる。具体的には、例えば、第1の閾値として、後段の信号処理回路のダイナミックレンジに対応する値を採用できる。また、波形処理回路43は、振幅圧縮処理などの処理を高速に実行し、内部のメモリ101などに音声信号を蓄積してD/Aコンバータ154に供給することができる。これにより、スピーカ156から出力される音が途切れるという現象を防ぐことができる。
【0218】
<第3実施形態>
【0219】
次に、第3実施形態について説明する。
【0220】
[第3実施形態としての音声記録装置の構成例]
【0221】
図22は、本発明を適用した信号処理装置の第3実施形態としての音声記録装置の構成例を示すブロック図である。
【0222】
図22の例の音声記録装置201では、図13の例の音声記録装置31の波形処理回路43に代えて、図22の例の波形処理回路211が設けられている。図22の例の波形処理回路211では、図13の例の音声記録装置31の判定回路104に代えて、判定回路221が設けられている。図22の例の判定回路221では、図13の例のスイッチ112、スイッチ116、振幅圧縮回路119、およびスイッチ120が削除されている。また、スイッチ231、振幅圧縮回路232、スイッチ233、スイッチ234、および振幅圧縮回路235が新たに追加されている。
【0223】
[波形処理回路の処理例]
【0224】
次に、図23および図24のフローチャートを参照して、波形処理回路211の処理例について説明する。なお、波形処理回路211の処理は、以下、波形処理と称する。
【0225】
図23の例のステップS91乃至S95の処理は、図15の例のステップS11乃至S15の処理と同一である。従って、その説明を省略する。なお、以降において、同一の処理の説明は適宜省略する。ステップS96において、データ読み書き回路102は、所定の区分信号をメモリ101から読み出し、判定回路221のクリップ検出回路117およびスイッチ231に供給する。図23の例のステップS97およびS98の処理は、図16の例のステップS25よびS26の処理と同一である。ステップS99において、クリップ長検出回路118は、区分信号のクリップ長は0であるか否かを判定する。
【0226】
区分信号のクリップ長が0でない場合、ステップS99でNOであると判定されて、処理はステップS100に進み、クリップ長検出回路118は、区分信号の(0でない)クリップ長を振幅圧縮回路232に通知する。その後、処理は、ステップS102に進む。
【0227】
これに対して、区分信号のクリップ長が0である場合、ステップS99においてYESであると判定されて、処理はステップS105に進む。図23の例のステップS102乃至S104の処理は、図16の例のステップS29乃至S31の処理と同一である。ステップS105において、クリップ長検出回路118は、スイッチ233を端子233Bに切換える。図23の例のステップS106の処理は、図15の例のステップS17の処理と同一である。ステップS107において、ピーク検波回路111は、スイッチ233を端子233Bに切換える。その後、処理はステップS116に進む。
【0228】
ところで、ステップ106においてYESと判定された場合、即ち、区分信号内のピーク信号レベルが第1の閾値th1を超えている場合、処理はステップS108に進み、ピーク検波回路111は、スイッチ233を端子233Aに切換える。図23の例のステップS109乃至S111の処理は、図15および図16の例のステップS20乃至S22の処理と同一である。ステップS112において、周波数領域検波回路115は、スイッチ234を端子234Aに切換える。その後、処理はステップS116に進む。
【0229】
また、ステップ111においてYESと判定された場合、即ち、周波数領域信号の帯域毎のパワーレベルのうち、第2の閾値th2の帯域毎の値を超えているものがある場合、処理はステップS113に進む。ステップS113において、周波数領域検波回路115は、スイッチ234を端子234Bに切換える。ステップS114において、振幅圧縮回路235は、区分信号のピーク信号レベルが第1の閾値th1に一致するように、区分信号に対して振幅圧縮を施す。ステップS115において、振幅圧縮回路235は、振幅圧縮処理後の区分信号を、データ読み書き回路102に出力する。その後、処理はステップS116に進む。図23の例のステップS116乃至S119の処理は、図16の例のステップS36乃至S39の処理と同一である。
【0230】
このように、図22の例の波形処理回路211では、処理の手順は異なるものの、図14の例の波形処理回路43と同様の波形処理を行うことができる。
【0231】
[本発明のプログラムへの適用]
【0232】
上述した一連の処理は、ハードウェアにより実行することもできるし、ソフトウエアにより実行することもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、プログラム記録媒体からインストールされる。このプログラムは、例えば、専用のハードウェアに組み込まれているコンピュータにインストールされる。または、このプログラムは、各種のプログラムをインストールすることで各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどにインストールされる。
【0233】
図25は、上述した一連の処理をプログラムにより実行するコンピュータのハードウェアの構成例を示すブロック図である。
【0234】
コンピュータにおいて、CPU401,ROM(Read Only Memory)402,RAM(Random Access Memory)403は、バス404により相互に接続されている。バス404には、さらに、入出力インタフェース405が接続されている。入出力インタフェース405には、キーボード、マウス、マイクロフォンなどよりなる入力部406、ディスプレイ、スピーカなどよりなる出力部407、ハードディスクや不揮発性のメモリなどよりなる記憶部408が接続されている。さらに、入出力インタフェース405には、ネットワークインタフェースなどよりなる通信部409、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブルメディア411を駆動するドライブ410が接続されている。
【0235】
以上のように構成されるコンピュータでは、CPU401が、例えば、記憶部408に記憶されているプログラムを、入出力インタフェース405及びバス404を介して、RAM403にロードして実行することにより、上述した一連の処理が行われる。コンピュータ(CPU401)が実行するプログラムは、例えば、磁気ディスク(フレキシブルディスクを含む)であるリムーバブルメディア411に記録して提供される。プログラムは、パッケージメディアであるリムーバブルメディア411に記録して提供される。なお、パッケージメディアとしては、光ディスク(CD−ROM(Compact Disc−Read Only Memory),DVD(Digital Versatile Disc)等)、光磁気ディスク、もしくは半導体メモリなどが用いられる。あるいは、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供される。そして、プログラムは、リムーバブルメディア411をドライブ410に装着することにより、入出力インタフェース405を介して、記憶部408にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部409で受信し、記憶部408にインストールすることができる。その他、プログラムは、ROM402や記憶部408に、あらかじめインストールしておくことができる。
【0236】
なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
【0237】
また、本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。
【符号の説明】
【0238】
31 音声記録装置, 43 波形処理回路, 101 メモリ, 102 データ読み書き回路, 103 ゼロクロス検出回路, 104 判定回路, 111 ピーク検波回路, 113 FFT回路, 114 フィルタ, 115 周波数領域検波回路, 117 クリップ検出回路, 118 クリップ長検出回路, 119 振幅圧縮回路, 121 波形補間データ生成回路, 122 閾値保持回路, 401 CPU, 402 ROM, 403 RAM, 404 バス, 405 入出力インタフェース, 406 入力部, 407 出力部, 408 記憶部, 409 通信部, 410 ドライブ, 411 リムーバブルメディア

【特許請求の範囲】
【請求項1】
入力音声信号のうち、ピーク信号レベルが第1の閾値を超えている区間を処理対象信号として、前記処理対象信号に対して周波数変換処理を施すことで、複数の帯域毎のパワーレベルを取得する周波数変換処理手段と、
前記周波数変換処理手段により取得された複数の帯域毎のパワーレベルの中に第2の閾値を超えるパワーレベルが存在する場合、前記処理対象信号のピーク信号レベルが前記第1の閾値以下になる圧縮率で、前記処理対象信号の信号レベルを圧縮する振幅圧縮処理を実行し、それ以外の場合、前記振幅圧縮処理の実行を禁止する振幅圧縮手段と
を備える信号処理装置。
【請求項2】
前記入力音声信号の中から、回路のダイナミックレンジにより波形が歪んだクリップ部分を検出するクリップ検出手段と、
前記振幅圧縮手段により前記振幅圧縮処理が施された処理対象信号のうち、前記クリップ検出手段により前記クリップ部分が検出された音声信号の波形を補間して、ピーク信号レベルが前記第1の閾値となる波形にする波形補間手段と
をさらに備える請求項1に記載の信号処理装置。
【請求項3】
前記入力音声信号について、信号レベルがバイアスを跨いだ点の位置を、ゼロクロスとして検出するゼロクロス検出手段をさらに備え、
前記クリップ検出手段の処理単位、および前記処理対象信号の単位は、前記ゼロクロス検出手段により検出された2つの前記ゼロクロスの間の信号である
請求項2に記載の信号処理装置。
【請求項4】
前記振幅圧縮手段は、前記処理対象信号の中に前記クリップ検出手段により検出された前記クリップ部分が含まれている場合、前記クリップ部分の時間長に応じた前記圧縮率で、前記処理対象信号に対して前記振幅圧縮処理を施す
請求項2に記載の信号処理装置。
【請求項5】
前記振幅圧縮手段は、前記処理対象信号の中に前記クリップ検出手段により検出された前記クリップ部分が含まれていない場合、前記ピーク信号レベルが前記第1の閾値となる前記圧縮率で、前記処理対象信号に対して振幅圧縮処理を施す
請求項2に記載の信号処理装置。
【請求項6】
前記第2の閾値は、前記複数の帯域毎に独立した値をそれぞれ有する
請求項1に記載の信号処理装置。
【請求項7】
前記周波数変換処理手段により取得される前記複数の帯域毎のパワーレベルに対して、人間の聴感特性に合わせたフィルタをかけるフィルタ手段をさらに備え、
前記振幅圧縮手段は、前記フィルタ手段により前記フィルタがかけられた前記複数の帯域毎のパワーレベルを用いて、前記振幅圧縮処理の実行とその禁止を切り分ける
請求項1に記載の信号処理装置。
【請求項8】
信号処理装置が、
入力音声信号のうち、ピーク信号レベルが第1の閾値を超えている区間を処理対象信号として、前記処理対象信号に対して周波数変換処理を施すことで、複数の帯域毎のパワーレベルを取得し、
取得された複数の帯域毎のパワーレベルの中に第2の閾値を超えるパワーレベルが存在する場合、前記処理対象信号のピーク信号レベルが前記第1の閾値以下になる圧縮率で、前記処理対象信号の信号レベルを圧縮する振幅圧縮処理を実行し、それ以外の場合、前記振幅圧縮処理の実行を禁止する
ステップを含む信号処理方法。
【請求項9】
コンピュータに、
入力音声信号のうち、ピーク信号レベルが第1の閾値を超えている区間を処理対象信号として、前記処理対象信号に対して周波数変換処理を施すことで、複数の帯域毎のパワーレベルを取得し、
取得された複数の帯域毎のパワーレベルの中に第2の閾値を超えるパワーレベルが存在する場合、前記処理対象信号のピーク信号レベルが前記第1の閾値以下になる圧縮率で、前記処理対象信号の信号レベルを圧縮する振幅圧縮処理を実行し、それ以外の場合、前記振幅圧縮処理の実行を禁止する
ステップを含む制御処理を実行させるプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22】
image rotate

【図23】
image rotate

【図24】
image rotate

【図25】
image rotate


【公開番号】特開2010−244602(P2010−244602A)
【公開日】平成22年10月28日(2010.10.28)
【国際特許分類】
【出願番号】特願2009−90585(P2009−90585)
【出願日】平成21年4月3日(2009.4.3)
【出願人】(000002185)ソニー株式会社 (34,172)
【Fターム(参考)】