FMステレオ無線レシーバのオーディオ信号のパラメトリックステレオを用いた改善
本発明は、FMステレオ無線レシーバのステレオオーディオ信号を改善する装置に関する。この装置はパラメトリックステレオ(PS)パラメータ推定ステージを有する。パラメトリックステレオパラメータ推定ステージは、ステレオオーディオ信号に基づき、周波数により変化し、又は変化せずに、1つ以上のパラメトリックステレオパラメータを決定するように構成されている。好ましくは、PSパラメータは時間と周波数により変わる。さらに、この装置はアップミックスステージを有する。アップミックスステージは、第1のオーディオ信号と1つ以上のパラメトリックステレオパラメータとに基づいて、改善したステレオ信号を発生するように構成されている。第1のオーディオ信号は、例えば、ダウンミックスステージのダウンミックスオペレーションにより、ステレオオーディオ信号から求められる。PSパラメータ推定ステージはPSエンコーダの一部であってもよい。アップミックスステージはPSデコーダの一部であってもよい。
【発明の詳細な説明】
【技術分野】
【0001】
本文書はオーディオ信号処理に関し、特にFMステレオ無線レシーバのオーディオ信号を改善する装置と、それに対応する方法とに関する。
【背景技術】
【0002】
アナログFM(周波数変調)ステレオ無線システムでは、オーディオ信号の左チャンネル(L)と右チャンネル(R)は、ミッド・サイド(M/S)表示して、すなわちミッドチャンネル(M)とサイドチャンネル(S)として送られる。ミッドチャンネルMはLとRの和信号であり、例えばM=(L+R)/2である。サイドチャンネルSはLとRの差信号であり、例えばS=(L−R)/2である。送信時、サイドチャンネルSは38kHz抑圧搬送波に変調され、ベースバンドミッド信号Mに加えられ、後方互換のステレオ多重信号となる。この多重信号を用いて、FM送信器のHF(高周波)搬送波を変調する。FM送信器は、一般的には87.5ないし108MHzの範囲で動作している。
【0003】
受信品質が低下する(すなわち無線チャンネルの信号対雑音比が低下する)と、SチャンネルはMチャンネルより悪化する(suffer)。多くのFMレシーバの実施形態では、受信条件が悪く、雑音が多くなり過ぎると、Sチャンネルはミュートされる。すなわち、HF無線信号が悪くなると、レシーバはステレオからモノラルに戻る。
【0004】
パラメトリックステレオ(PS)符号化は、非常に低ビットレートのオーディオ符号化の分野の一方法である。PSにより、2チャンネルステレオオーディオ信号を、付加的PSサイド情報、すなわちPSパラメータを組み合わせたモノラルダウンミックス信号として符号化できる。モノラルダウンミックス信号はステレオ信号の量チャンネルの組み合わせとして得られる。PSパラメータによりPSデコーダはモノラルダウンミックス信号とPSサイド情報からステレオ信号を再構成できる。一般的には、PSパラメータは時間と周波数により変わり、PSデコーダにおけるPS処理は一般的にQMFバンクを組み込んだハイブリッドフィルタバンクドメインで実行される。非特許文献1は、MPEG−4のPS符号化システム例を記載している。この文献のパラメトリックステレオに関する説明をここに参照援用する。パラメトリックステレオは、例えばMPEG−4オーディオで支持されている。パラメトリックステレオは、非特許文献2で説明されている。この文献をここに参照援用する。パラメトリックステレオは、MPEGサラウンド標準でも用いられている(非特許文献3を参照)。また、この文献はここに参照援用する。パラメトリックステレオシステムの別の例が非特許文献4と非特許文献5に記載されている。この2文献では、「バイノーラル・キュー符号化」という用語が使われているが、これはパラメトリック符号化の一例である。
【0005】
ミッド信号の信号品質が十分良くても、サイド信号Sにはノイズが多いことがあり、(例えば、L=M+SとR=M−Sで求められる)出力信号の左右チャンネルでミックスすると、全体的なオーディオ品質が大幅に低下することがある。サイド信号Sの品質が悪いから中間であれば、2つのオプションがある:レシーバは、サイド信号Sに関連するノイズを受け入れ、リアルステレオを出力するか、サイド信号Sをドロップして、モノラルに戻るかどちらかである。
【先行技術文献】
【非特許文献】
【0006】
【非特許文献1】「Low Complexity Parametric Stereo Coding in MPEG-4」, Heiko Purnhagen, Proc. Digital Audio Effects Workshop (DAFx), pp. 163-168, Naples, IT, Oct. 2004
【非特許文献2】MPEG−4標準化文書ISO/IEC 14496-3:2005 (MPEG-4 Audio, 3rd edition)、セクション8.6.4、アネックス8.A及び8C
【非特許文献3】文献ISO/IEC 23003-1:2007, MPEG Surround
【非特許文献4】「Binaural Cue Coding - Part I: Psychoacoustic Fundamentals and Design Principles」、Frank Baumgarte and Christof Faller, IEEE Transactions on Speech and Audio Processing, vol 11, no 6, pages 509-519, November 2003
【非特許文献5】「Binaural Cue Coding - Part II: Schemes and Applications」Christof Faller and Frank Baumgarte, IEEE Transactions on Speech and Audio Processing, vol 11, no 6, pages 520-531, November 2003
【発明の概要】
【課題を解決するための手段】
【0007】
本発明の第1の態様は、FMステレオ無線レシーバのオーディオ信号を改善する装置に関する。この装置はステレオオーディオ信号を発生する。改善するオーディオ信号は、L/R表示のオーディオ信号、すなわちL/Rオーディオ信号であっても、別の実施形態では、M/S表示のオーディオ信号、すなわちM/Oオーディオ信号であってもよい。従来のFM無線レシーバはL/R出力を用いているので、一般的に、改善するオーディオ信号はL/R表示のオーディオ信号である。
【0008】
本発明の一実施形態として、本装置は、ミッド信号とサイド信号を有するFM無線信号を受信するように構成されたFMステレオ無線レシーバ用である。
【0009】
この装置はパラメトリックステレオ(PS)パラメータ推定ステージを有する。パラメトリックステレオパラメータ推定ステージは、L/R又はM/Sオーディオ信号に基づき、周波数により変化する、又は変化しない態様で、1つ以上のPSパラメータを決定するように構成されている。1つ以上のパラメータは、チャンネル間強度差(IID、またはCLD(Channel Level Difference)とも呼ばれる)を示すパラメータ、及び/又はチャンネル間相互相関(ICC)を示すパラメータを含み得る。好ましくは、PSパラメータは時間と周波数により変わる。
【0010】
さらに、この装置はアップミックスステージを有する。アップミックスステージは、第1のオーディオ信号と1つ以上のPSパラメータとに基づいて、ステレオ信号を発生するように構成されている。
【0011】
第1のオーディオ信号は、例えば、ダウンミックスステージのダウンミックスオペレーションにより、L/R又はM/Sオーディオ信号から求められる。第1のオーディオ信号は、L/R表示の場合、次の式によるダウンミックス演算により、オーディオ信号から得られる:DM=(L+R)/a、DMは第1のオーディオ信号に対応する。例えば、パラメータaは2としてもよい。DM=(L+R)/aの場合、第1のオーディオ信号は基本的に受信ミッド信号Mに対応する。さらに進んだ適応的ダウンミックス方式では、2つのチャンネルを式DM=L/a1+R/a2により結合する2つのパラメータa1、a2は、異なってもよいし、及び/又はPSパラメータ及び/又はその他の信号特性に依存してもよい。
【0012】
FMステレオ無線レシーバの出力がM/S表示の場合、第1のオーディオ信号は、出力されるM/Sオーディオ信号のM信号に対応してもよい。
【0013】
PSパラメータ推定ステージはPSエンコーダの一部であってもよい。アップミックスステージはPSデコーダの一部であってもよい。
【0014】
本装置は次のアイデアに基づく。すなわち、受信したミッド信号とサイド信号を単に合成するだけでは、受信したサイド信号は、ステレオ信号を再構成するほどにはよくないかも知れないが、それにも係わらず、この場合でも、サイド信号やR/L信号中のサイド信号成分はPSパラメータ推定ステージ3においてステレオパラメータ分析に使うには十分良いことがある。PSパラメータをステレオ信号の再構成に使っても良い。
【0015】
このように、本装置により、サイド信号に中くらいの、または大きなノイズがある状態で、ステレオ受信を改善できる。留意点として、本明細書では、「ノイズ」という用語を、(放送される実際のオーディオ信号に初めからあるノイズ状の信号成分ではなく、)無線送信チャンネルの制約により生じるノイズを指すものとする。
【0016】
受信したノイズの多いサイド信号を用いてステレオオーディオ信号を生成するのではなく、レシーバにより発生された改善されたサイド信号を用いる。改善されたサイド信号は、PS符号化の方法の助けを借りて発生してもよい。これらは、例えば、第1のオーディオ信号を入力として動作する無相関化器による改善したサイド信号の成分の発生を含む。受信状態及び/又は受信ステレオ信号の分析に関するデータを用いて、改善したサイド信号の発生と、オーディオ出力信号の発生とを適応的に制御することができる。
【0017】
他の実施形態では、前記第1のオーディオ信号に基づき無相関化信号を発生するように構成された無相関化器をさらに有する。アップミックスステージは、第1のオーディオ信号と、1つ以上のPSパラメータと、無相関化信号、又は少なくともその無相関化信号の周波数帯域に基づいてステレオ信号を発生できる。
【0018】
受信サイド信号のノイズが少なくて受信状態が良い場合、無相関化信号を用いる替わりに、アップミックスステージは、受信サイド信号をアップミックスに用いても良い。それゆえ、一実施形態では、アップミックスには、受信サイド信号又は無相関化信号を選択的に用いる。より好ましくは、選択は周波数により変化する、例えば、アップミックスステージは、低い周波数には受信サイド信号を用い、高い周波数には無相関化信号を擬似サイド信号として使ってもよい。周波数が高ければたかいほど、ノイズの密度が高いからである。これは、無線チャンネルに(ホワイト)ノイズがのる場合のFM復調の典型的な特性である。これは本明細書で後で説明する。
【0019】
第1の信号がミッド信号に対応する場合、受信サイド信号又はその少なくとも1つの周波数成分をアップミックスに用いても良い。ダウンミックス方式が(第1のオーディオ信号を発生する(L+R)/aと)異なる場合、受信サイド信号を用いる替わりに、アップミックスに残差信号を用いても良い。かかる残差信号は、ダウンミックスとPSパラメータによりオリジナルチャンネルを表すことに伴うエラーを示し、PSエンコーディング方式で用いられることが多い。受信サイド信号を使用した場合の上記の説明は、残差信号の場合にもあてはまる。
【0020】
アップミックスのための受信サイド信号と無相関化信号の間の選択は、信号に依存しても、すなわち換言すると信号に適応的であってもよい。
【0021】
さらに他の一実施形態によれば、選択は、信号強度などの無線受信インジケータにより示される受信状態に、及び/又は受信サイド信号の品質を示すインジケータに依存してもよい。受信状態が良い(すなわち強度が高い)とき、受信サイド信号を(場合によって、最高周波数ではない)アップミックスに用いることが好ましい。一方、受信状態が中間である(すなわち、強度が低い)場合、アップミックスに無相関化信号を用いることができる。
【0022】
サイド信号のノイズレベルが高く、受信状態が非常に悪い場合、FMレシーバがモノラル出力モードに切り替わり、オーディオ信号のノイズを低減する。FMレシーバの出力がL/Rステレオオーディオ信号の場合、出力される両チャンネルはモノラル再生の同じ信号を有する。FMレシーバの出力がM/Sステレオ信号の場合、出力されるSチャンネルはミュートされる。モノラル出力モードでは、FMレシーバのオーディオ信号中のステレオ情報は失われる。そのため、PSパラメータ推定ステージは、アップミックスステージでリアルステレオ信号を生成するのに適したPSパラメータを決定できない。非常に悪い受信状態でFMレシーバがモノラル出力モードに切り替わらない場合でも、FMレシーバの出力されるオーディオ信号は意味のあるPSパラメータを推定するには悪すぎるであろう。
【0023】
本装置は、FMレシーバがステレオ無線信号のモノラル出力を選択したか検出するように構成でき、及び/又はこのように悪い(意味のあるPSパラメータを推定するには悪すぎる)受信状態を検知するように構成できる。モノラル出力を検出する場合、又はかかる悪い受信状態を検出する場合、アップミックスステージは擬似ステレオ信号を発生できる。アップミックスステージは、上記の推定パラメータではなく、ブラインドアップミックス用の1つ以上のアップミックスパラメータを使用する。このモードは擬似ステレオオペレーションまたはブラインドアップミックスオペレーションと呼ぶ。
【0024】
この場合、ブラインドアップミックスオペレーションは、悪い受信状態を検出し又はモノラル出力を検出し、ブラインドアップミックスオペレーションを開始すると、FMレシーバの出力信号の空間的音響情報(があっても)をアップミックスパラメータの決定には用いず、アップミックのためには考慮しない(FMレシーバの出力にモノラル出力があれば、空間的音響情報はなく、まったく考慮できない)。アップミックスステージの出力信号中のサイド信号を再構成するためにPSパラメータを決定する上記のPSオペレーションモードと対照的に、ブラインドアップミックスオペレーションでは、本装置は、アップミックスステージの出力信号のサイド信号を再構成することを目的としていない。
【0025】
しかし、ブラインドアップミックスは、アップミックスパラメータがFMレシーバの出力信号から必ず独立であるという点で、装置が「ブラインド」であることを意味するのではない。例えば、FMレシーバの出力信号を、音楽かスピーチか、モニタして、それに応じて適切なアップミックスパラメータを選択してもよい。
【0026】
ブラインドアップミックスの一実施形態は、プリセットアップミックスパラメータの使用である。プリセットアップミックスパラメータは、デフォルトの又は記憶されたアップミックスパラメータであってもよい。
【0027】
それにも係わらず、使用されるアップミックスパラメータは、例えばスピーチ用のアップミックスパラメータと音楽用のアップミックスパラメータなど、信号依存であってもよい。この場合、本装置は、さらに、オーディオ信号が主にスピーチか音楽か検出するスピーチディテクタ(例えば、スピーチ/音楽弁別器)を有する。例えば、純粋な音楽の場合、アップミックスパラメータの選択は、ダウンミックス信号とその無相関化バージョンをミックスするように行う。一方、純粋なスピーチの場合、アップミックスパラメータの選択は、ダウンミックス信号の無相関化バージョンを使わず、ダウンミックス信号のみを使って、「モノラルの」左右信号にアップミックスする。オーディオ信号がスピーチと音楽のミックスの場合、純粋なスピーチ用のアップミックスパラメータと純粋な音楽用のアップミックスパラメータとの間のブラインドアップミックスパラメータをもちいてもよい。間のすべての状態のアップミックスパラメータを補間して用いても良い。
【0028】
擬似ステレオを求めるためのさらに進んだブラインドアップミックス方式も想定できる。例えば、モノラル信号のさらに進んだ分析を行い、これを「人工的に発生した」又は「合成した」PSパラメータを求める基礎として用いることができる。
【0029】
実際的にノイズのみのサイド信号の場合、本装置は、好ましくは、上記のように擬似ステレオモードに切り替わる。上述の通り、ここで「ノイズ」との用語は、無線の受信状態が悪いこと(すなわち、無線チャンネルの信号対雑音比が低いこと)により生じるノイズをいい、FM放送トランスミッタに送られた元の信号に含まれるノイズではない。
【0030】
しかし、再度信号にほとんどノイズが無い場合、すなわちFM無線送信により生じるノイズがほとんどない場合、本装置は、好ましくは、パラメトリックステレオモードではなく、ノーマルステレオモードに切り替わる。ノーマルステレオモードでは、装置の信号改善機能は基本的に非アクティブ化(deactivated)されている。非アクティブ化されている場合、装置に入力された左右オーディオ信号は、装置の出力に基本的に素通りする。
【0031】
あるいは、非アクティブ化の場合、(無相関化信号ではなく)受信サイド信号のみをアップミックスステージで第1のオーディオ信号とミックスする。アップミックスステージでアップミックスパラメータを適切に選択するとき、アップミックスステージの出力信号はFMトランスミッタの出力信号に対応する。例えば、次式による第1のオーディオ信号DMと受信サイド信号S0のミキシングをするとき
【数1】
いくつかの場合、より好ましくは、通常ステレオモード又はパラメトリックステレオモードの選択は、周波数によって変わる。すなわち、周波数帯域が異なると選択も異なる。周波数が高くなると受信サイド信号の信号対ノイズ比が特徴的に悪くなるので、これは有用である。上述の通り、これはFM復調の一般的な特性である。
【0032】
本装置の別の実施形態は従属項に記載した。
【0033】
本発明の第2の態様は、FMステレオ無線レシーバの左/右オーディオ信号又はミッド/サイドオーディオ信号に基づきステレオ信号を発生する装置に関する。この装置は、前記FMステレオレシーバが前記ステレオ無線信号のモノラル出力を選択したことを検知し、又は無線受信状態が悪いことを検知するように構成されている。本装置はステレオアップミックスステージを有する。このアップミックスステージは、装置が、FMステレオレシーバがステレオ無線信号のモノラル出力を選択したことを検知すると、又は受信状態が悪いことを検知すると、第1のオーディオ信号と1つ以上のブラインドアップミックス用アップミックスパラメータに基づいて、ステレオ信号を発生するように構成されている。前記第1のオーディオ信号は、前記左/右オーディオ信号又はミッド/サイドオーディオ信号から求められる。
【0034】
ブラインドアップミックス用アップミックスパラメータは、デフォルトパラメータや記憶されたパラメータなどのプリセットパラメータでもよい。
【0035】
本装置により、受信状態が非常に悪く、サイド信号のノイズレベルが高い場合、ノイズレベルの低い擬似ステレオ信号を発生できる。かかる受信状態では、FMレシーバは、モノラルモードに切り替わり、オーディオ信号のノイズを低減し、またはL/R又はM/Sオーディオ信号は意味のあるPSパラメータを推定するには悪すぎる。これが検出され、擬似ステレオ信号の発生のためブラインドアップミックス用のアップミックスパラメータを使用する。これは、本発明の第1の態様に関連してすでに説明した。
【0036】
本発明の第1の態様に関連して説明したように、本装置は、FMステレオレシーバがステレオ無線信号のモノラル出力を選択したか検出する検出ステージを有しても良い。
【0037】
一実施形態によれば、本装置は、さらに、FMトランスミッタの出力におけるオーディオ信号が主にスピーチか否かを示すスピーチ検出器などのオーディオタイプ検出器を有する。この場合、前記1つ以上のアップミックスパラメータは、前記スピーチディテクタの表示に依存する。例えば、本発明の第1の態様に関連して詳しく説明したように、本装置は、スピーチの場合はアップミックスパラメータを用い、音楽の場合は他のアップミックスパラメータを用いる。
【0038】
本発明の第2の態様による装置は、さらに、本発明の第1の態様による装置の特徴を含んでもよいし、その逆でもよい。
【0039】
本発明の第3の態様は、ミッド信号とサイド信号を含むFM無線信号を受信するように構成されたFMステレオ無線レシーバに関する。FMステレオ無線レシーバは、本発明の第1と第2の態様によるオーディオ信号を改善する装置を含む。
【0040】
本発明の第4の態様は、セルラー電話などのモバイル通信デバイスに関する。このモバイル通信デバイスは、FM無線信号を受信するように構成されたFMステレオレシーバを有する。さらに、このモバイル通信デバイスは、本発明の第1と第2の態様によるオーディオ信号を改善する装置を含む。
【0041】
本発明の第5の態様は、FMステレオ無線レシーバの左/右オーディオ信号又はミッド/サイドオーディオ信号を改善する方法に関する。第5の態様による方法の特徴は、第1の態様による装置の特徴に対応する。前記左右オーディオ信号又はミッド/サイドオーディオ信号に基づき、周波数により変わる又は周波数により変わらない態様で、1つ以上のPSパラメータを決定する。ステレオ信号は、アップミックスオペレーションにより、前記第1のオーディオ信号と前記1つ以上のPSパラメータとに基づき発生される。
【0042】
本発明の第1の態様の説明は、本発明の第5の態様にも当てはまる。
【0043】
本発明の第6の態様は、FMステレオ無線レシーバの左/右オーディオ信号又はミッド/サイドオーディオ信号に基づきステレオ信号を発生する方法に関する。第6の態様による方法の特徴は、第2の態様による装置の特徴に対応する。前記FMステレオレシーバが前記ステレオ無線信号のモノラル出力を選択したこと又は無線受信状態が悪いことを検知する。FMステレオレシーバがステレオ無線信号のモノラル出力を選択したこと又は無線受信状態が悪いことを検知した場合、ステレオ信号は、第1のオーディオ信号と、プリセットアップミックスパラメータなどの1つ以上のブラインドアップミックス用のアップミックスパラメータに基づき発生される。
【0044】
本発明の第2の態様の説明は、本発明の第6の態様にも当てはまる。
【図面の簡単な説明】
【0045】
添付した図面を参照して実施例により本発明を説明する。
【図1】FMステレオ無線レシーバのステレオ出力を改善する実施形態を示す図である。
【図2】パラメトリックステレオのコンセプトに基づくオーディオ処理装置の一実施形態を示す図である。
【図3】PSエンコーダとPSデコーダを有するPSベース・オーディオ処理装置の他の一実施形態を示す図である。
【図4】図3のオーディオ処理装置の拡張バージョンを示す図である。
【図5】図4のPSエンコーダとPSデコーダの一実施形態を示す図である。
【図6】アップミックスに用いる信号Sの構造を示す図である。
【図7】図3のオーディオ処理装置の、ノイズリダクションアルゴリズムが追加された拡張バージョンを示す図である。
【図8】オーディオ処理装置の、PSパラメータ推定のためのノイズリダクションを有する別の一実施形態を示す図である。
【図9】FMレシーバのモノラルのみの出力の場合に擬似ステレオ生成をする、オーディオ処理装置の他の一実施形態を示す。
【図10】FMレシーバの出力におけるステレオ再生のショートドロップアウトの発生を示す図である。
【図11】エラー補償をする高機能PSパラメータ推定ステージを示す図である。
【図12】HE−AACv2エンコーダに基づくオーディオ処理装置の別の一実施形態を示す図である。
【発明を実施するための形態】
【0046】
図1は、FMステレオ無線レシーバ1のステレオ出力を改善する単純化した実施形態を示す図である。背景技術欄で説明したように、FM無線では、ステレオ信号は意図的にミッド信号とサイド信号により送信される。(少なくとも受信状態が十分良く、サイド信号情報がミュートされていないとき、)FMレシーバ1では、サイド信号を用いて、FMレシーバ1から出力される左チャンネルLと右チャンネルRの間のステレオ差信号を生成する。左右チャンネルL、Rはデジタル信号でもアナログ信号でもよい。FMレシーバのオーディオ信号L、Rを改善するため、オーディオ処理装置2を用い、その出力にステレオオーディオ信号L′とR′を発生する。オーディオ処理装置2は、パラメトリックステレオを用いて受信したFM無線信号のノイズリダクションを行うことができるシステムに対応する。装置2におけるオーディオ処理は、好ましくはデジタル領域で行われる。FMレシーバ1とオーディオ処理装置2の間がアナログインタフェースの場合、装置2におけるデジタルオーディオ処理の前に、アナログ・ツー・デジタル・コンバータを用いる。FMレシーバ1とオーディオ処理装置2は、同じ半導体チップ上に集積されていてもよく、2つの半導体チップの一部であってもよい。FMレシーバ1とオーディオ処理装置2は、セルラー電話、パーソナルデジタルアシスタント(PDA)、またはスマートホンなどの無線通信デバイスの一部であってもよい。この場合、FMレシーバ1は、FM無線レシーバ機能を有するベースバンドチップの一部であってもよい。
【0047】
FMレシーバ1の出力と装置2の入力で左右表示を用いる代わりに、FMレシーバ1と装置2の間のインタフェースにおいてミッド/サイド表示を用いる(図1のM、Sはミッド/サイド表示を示し、L、Rは左右表示を示す)。FMレシーバ1と装置2の間のインタフェースにおいてこのようにミッド/サイド表示を用いることにより、手間がはぶける。FMレシーバはミッド/サイド信号を受信しており、オーディオ処理装置2はダウンミキシングせずにミッド/サイド信号を直接処理できるからである。FMレシーバ1がオーディオ処理装置2と強く結びついていれば、特にFMレシーバ1とオーディオ処理装置2が同じ半導体チップ上に集積されていれば、ミッド/サイド表示は有利である。
【0048】
任意的に、オーディオ処理装置2におけるオーディオ処理を合わせるために、無線受信状態を示す信号強度信号6を用いてもよい。これは本明細書で後で説明する。
【0049】
FM無線レシーバ1とオーディオ処理装置2の組み合わせは、ノイズリダクションシステムを集積したFM無線レシーバに対応する。
【0050】
図2は、パラメトリックステレオのコンセプトに基づくオーディオ処理装置2の一実施形態を示す図である。装置2はPSパラメータ推定ステージ3を有する。パラメータ推定ステージ3は、(左/右表示でもミッド/サイド表示でもよい)改善する入力オーディオ信号に基づき、PSパラメータ5を決定するように構成されている。PSパラメータ5は、なかんずく、チャンネル間強度差(IID、またはCLD(Channel Level Difference)とも呼ばれる)を示すパラメータ、及び/又はチャンネル間相互相関(ICC)を示すパラメータを含み得る。好ましくは、PSパラメータ5は時間と周波数により変わる。パラメータ推定ステージ3は、その入力がM/S表示の場合、それにもかかわらずにL/Rチャンネルに関するPSパラメータ5を決定してもよい。
【0051】
オーディオ信号DMは入力信号から求める。入力オーディオ信号がミッド/サイド表示を用いている場合、オーディオ信号DMはミッド信号に直接対応する。入力オーディオ信号が左/右表示の場合、オーディオ信号はそのオーディオ信号をダウンミックスして発生する。好ましくは、ダウンミックス後の信号DMはミッド信号Mに対応し、次の式で表せる:
【数2】
すなわち、ダウンミックス信号DMはL信号とR信号の平均に対応する。「a」の値が異なる場合、L信号とR信号の平均は増幅又は減衰される。
【0052】
装置はさらに、アップミックスステージ4を有する。これはステレオミキシングモジュールすなわちステレオアップミキサとも呼ばれる。アップミックスステージ4は、オーディオ信号DMとPSパラメータ5に基づき、ステレオ信号L′、R′を発生するように構成されている。好ましくは、アップミックスステージ4は、DM信号を用いるだけでなく、サイド信号やある種の擬似サイド信号(図示せず)を用いる。これは、図4と図5のより拡張した実施形態を参照して、本明細書で後で説明する。
【0053】
装置2は次のアイデアに基づく。すなわち、受信したミッド信号とサイド信号を単に合成するだけでは、ステレオ信号を再構成するには受信したサイド信号のノイズが多すぎるかも知れないが、それにも係わらず、この場合でも、サイド信号やR/L信号中のサイド信号成分はPSパラメータ推定ステージ3においてステレオパラメータ分析に使うには十分良いことがある。その結果得られるPSパラメータ5を用いて、FMレシーバ1の出力におけるオーディオ信号と比較して、ノイズレベルが低いステレオ信号L′、R′を発生する。
【0054】
このように、受信状態が悪いFM無線信号は、パラメトリックステレオのコンセプトを用いて「クリーンアップ」できる。FM無線信号の歪みとノイズの大部分は、サイドチャンネルにあり、PSダウンミックスで使用しないこともできる。それにもかかわらず、受信状態が悪い場合でも、サイドチャンネルの品質はPSパラメータを取り出すには十分であることが多い。
【0055】
以下の図面では、オーディオ処理装置2への入力信号は左/右ステレオ信号である。オーディオ処理装置2は、その中のいくつかのモジュールに小さい修正をすると、ミッド/サイド表示の入力信号も処理できる。それゆえ、ここで説明するコンセプトはミッド/サイド表示の入力信号に関しても用いることができる。
【0056】
図3は、PSベースの、PSエンコーダ7とPSデコーダ8を使用するオーディオ処理装置2の一実施形態を示す。この例では、パラメータ推定ステージ3はPSエンコーダ7の一部であり、アップミックスステージ4はPSデコーダ8の一部である。「PSエンコーダ」と「PSデコーダ」との用語は、装置2のオーディオ処理ブロックの機能を記述する名称として用いる。留意点として、オーディオ処理はすべて同じFMレシーバデバイスにおいて発生する。これらのPSエンコーディングプロセス及びPSデコーディングプロセスは強く結合していて、「PSエンコーディング」と「PSデコーディング」との用語は、オーディオ処理機能の遺産を記述するときのみに用いる。
【0057】
PSエンコーダ7は、ステレオオーディオ入力信号L、Rに基づき、オーディオ信号DMとPSパラメータ5を発生する。任意的に、PSエンコーダ7はさらに信号強度信号6を用いる。オーディオ信号DMはモノラルダウンミックスであり、好ましくは受信ミッド信号に対応する。L/RチャンネルがDM信号を構成すると仮定すると、受信サイドチャンネルの情報はDM信号には完全に排除されていることがある。よって、この場合、モノラルダウンミックスDMにはミッド情報のみが含まれる。よって、DM信号ではサイドチャンネルからのノイズが排除される。しかし、エンコーダ7は一般的にL=M+SとR=M−Sを入力(その結果、DM=(L+R)/2=M)とするので、サイドチャンネルはエンコーダ7のステレオパラメータ分析の一部である。
【0058】
実験結果が示すところによると、中間レベルのノイズを含む受信サイド信号は、ステレオ自体の再構成には十分良くはないが、PSエンコーダ7のステレオパラメータ分析にとっては十分良いことがある。
【0059】
モノラル信号DMとPSパラメータ5をPSデコーダ8で用いて、ステレオ信号L′、R′を再構成する。
【0060】
図4は、図3のオーディオ処理装置2の拡張バージョンを示す図である。ここで、モノラルダウンミックス信号DMとPSパラメータに加え、受信サイド信号S0はPSデコーダ8に送られる。このアプローチはPS符号化の「残差符号化」法と同様であり、このアプローチにより、受信状態が完全ではないが良い場合に、受信サイド信号S0の少なくとも一部(例えば、ある周波数帯域)の使用ができる。受信サイド信号S0は、モノラルダウンミックス信号がミッド信号に対応する場合に、使われることが好ましい。しかし、モノラルダウンミックス信号がミッド信号に対応しない場合、より一般的な残差信号を受信サイド信号S0の代わりに使うことができる。かかる残差信号は、ダウンミックスとPSパラメータによりオリジナルチャンネルを表すことに伴うエラーを示し、PSエンコーディング方式で用いられることが多い。以下、受信サイド信号S0を使用した場合の説明は、残差信号の場合にもあてはまる。
【0061】
PSエンコーダ/デコーダにおける残差信号の使用は、MPEGサラウンド標準(ISO/IEC 23003-1:2007, MPEG Surround参照)と論文「MPEG Surround - The ISO/MPEG Standard for Efficient and Compatible Multi-Channel Audio Coding」J. Herre et al., Audio Engineering Convention Paper 7084, 122nd Convention, May 5-8, 2007)などに記載されている。
【0062】
図5は、図4のPSエンコーダ7とPSデコーダ8の一実施形態を示す図である。PSエンコーダモジュール7は、ダウンミックスジェネレータ9とPSパラメータ推定ステージ3とを有する。例えば、ダウンミックスジェネレータ9は、好ましくはミッド信号Mに対応するモノラルダウンミックスDM(例えば、DM=M=(L+R)/a)を生成し、任意的に、受信サイド信号S0=(L−R)/aに対応する第2の信号も発生する。
【0063】
PSパラメータ推定ステージ3は、PSパラメータ5として、L入力とR入力の間の相関とレベル差とを推定できる。任意的に、パラメータ推定ステージは、FMレシーバにおける信号パワーである信号強度6を受け取る。この情報は、PSパラメータ5の信号強度6が低い場合に、信頼性に関する決定に使用できる。信頼性が低い場合、出力信号L′、R′がモノラル出力信号又は擬似ステレオ出力信号となるように、PSパラメータ5を設定できる。モノラル出力信号の場合、出力信号L′は出力信号R′と等しい。擬似ステレオ出力信号の場合、デフォルトのPSパラメータを用いて擬似又はデフォルトのステレオ出力信号L′、R′を発生してもよい。
【0064】
PSデコーダモジュール8は、ステレオミキシングマトリックス4aと無相関器10とを有する。無相関器は、モノラルダウンミックスDMを受け取り、擬似サイド信号として用いる無相関化信号S′を発生する。無相関器10は、引用文献「Low Complexity Parametric Stereo Coding in MPEG-4」のセクション4で説明されているように、適当なオールパスフィルタにより、実現され得る。ステレオミキシングマトリックス4aは、本実施形態では2×2アップミックスマトリックスである。
【0065】
推定パラメータ5に応じて、マトリックス4aはDM信号を受信サイド信号S0又は無相関化信号S′とミックスして、ステレオ出力信号L′とR′を生成する。信号S0と信号S′の間の選択は、受信状態を示す信号強度6などの無線受信インジケータに依存する。受信サイド信号の品質を示す品質インジケータを替わりに、または追加的に用いてもよい。かかる品質インジケータの一例は、受信サイド信号の推定ノイズ(パワー)であってもよい。サイド信号が大きなノイズを含む場合、無相関化信号S′を用いてステレオ出力信号L′とR′を生成してもよい。一方、ノイズが小さい場合、サイド信号S0を用いることができる。受信サイド信号のノイズを推定する様々な実施形態は、本明細書で後で説明する。
【0066】
一例として、受信状態が良い(すなわち、信号強度が高い)場合、アップミキシングに信号S0を用いる。一方、状態が悪い場合、アップミキシングは無相関化信号S′に基づき行う。好ましくは、ステレオミキシングモジュール4が受信サイド信号S0又はS′のどちらを使うかは、周波数に応じて決まる。例えば、周波数が低い場合、受信サイド信号S0を用い、周波数が高い場合、無相関化信号S′を用いる。これは図6を参照してより詳しく説明する。
【0067】
信号S0と信号S′の間の周波数によって変わる又は変わらない選択は、(例えば、信号強度6により制御される、アップミックスステージ6のセレクタ手段により)アップミックスステージ4で行われる。あるいは、信号S0と信号S′との間の周波数により変わる又は変わらない選択は、(例えば、信号強度6に応じて)パラメータ推定ステージ3で行われる。次に、パラメータ推定ステージ3は、アップミックスパラメータをアップミックスステージ6に送る。アップミックスステージ6は、選択された信号(S0又はS′)をアップミックスに用いさせる。例えば、S′を選択する場合、信号S0に関するアップミックスパラメータはゼロに設定され、S′に関するパラメータはゼロに設定されない。あるいは、選択信号(図示せず)をアップミックスステージ6に送ってもよい。
【0068】
アップミックス演算は次の行列方程式により行われることが好ましい:
【数3】
ここで、重みファクタα、β、γ、δは信号DMとSの重みを決定する。モノラルダウンミックスDMは好ましくは受信ミッド信号に対応する。式中の信号Sは、無相関化信号S′又は受信サイド信号S0のいずれかに対応する。アップミックスマトリックス要素、すなわち重みファクタα、β、γ、δは、例えば、引用論文「Low Complexity Parametric Stereo Coding in MPEG-4」(セクション2.2を参照)に記載されているように、または引用したMPEG-4標準文書ISO/IEC 14496-3:2005(セクション8.6.4.6.2参照)に記載されているように、またはMPEGサラウンド仕様書ISO/IEC23003−1(セクション6.5.3.2参照)に記載されているように求められる。上記文献のこれらのセクション(及びこれらのセクションで参照されているセクション)は、ここに参照援用する。
【0069】
好ましくは、S′とS0との間の選択は周波数に依存する。これはアップミックスに用いる信号Sの構造例を示す図6に示した。図6に示したように、周波数が低い場合、受信サイド信号S0がアップミックスに使われ、周波数が高い場合、無相関化信号S′がアップミックスに使われる。
【0070】
受信サイド信号S0がS0=(L−R)/2に対応し、L′=M+S0、R′=M−M0である場合、モノラルダウンミックスDMは好ましくは(L+R)/2に対応すべきである。これにより完全な再構成になり、すなわちL′=LかつR′=R。
【0071】
受信サイド信号S0を用いるPSアップミキサを用いる替わりに、残差信号を用いる汎用PSアップミキサを用いても良い。求まる信号L′、R′はPSパラメータと残差信号とモノラルダウンミックスとの関数である。
【0072】
図7はノイズリダクションを用いる実施形態を示す。図5に示したのと同様に、図7でも信号S0は任意的である。信号S0がある場合には、一般的なノイズリダクションアルゴリズムを用いて、DM信号とS0信号のノイズリダクションを行うことができる。あるいは、設定が異なる2つのノイズリダクションモジュールを用いて、1つを信号DMのノイズリダクションに用い、もう1つを信号S0のノイズリダクションに用いてもよい。別の可能性として、一方の信号(例えば、信号DM又は信号S0)だけにノイズリダクションをしてもよい。図7において、ノイズリダクションステージ11が信号DMのノイズリダクションを行い、ノイズリダクション後の信号DM′をPSデコーダ8とその中のアップミックスステージ4に送る。ノイズリダクションステージ11は信号S0のノイズリダクションを行い、ノイズリダクション後の信号S0′をPSデコーダ8に送る。
【0073】
図8は、装置2の別の実施形態を示す図である。ここで、ノイズリダクション方法12がステレオ入力信号に適用され、その結果ノイズリダクションされた信号R′、L′がPSエンコーダ8のPSパラメータ推定ステージ3により分析される。ダウンミックス信号DMはノイズリダクションステージ12を含まない経路を通るので、ノイズリダクションは非常に強い(aggressive)ものでもよく、PSパラメータの取得に対して最適化されたものであってもよい。
【0074】
モノラルダウンミックス号DMは、L、Rチャンネルに同じ重みファクタ(例えば、重みファクタ1又は重みファクタ1/2を用いて)を加えて発生してもよい。信号DMは受信ミッド信号に対応する。重みファクタ1/2を用いるとき、信号DMの振幅は、重みファクタ1を用いるときの信号DMの振幅の半分である。
【0075】
任意的に、信号L/R又は信号DMに(、及びもし使っていればS0にも)何らかのノイズリダクションを適用してもよい。例えば、信号DMにノイズリダクションをかけてもよい(図8の任意的ノイズリダクションステージ11を参照)。好ましくは、このノイズリダクションステージは、強い(aggressive)ノイズリダクションステージ12より弱い(gentler)ものである。ノイズリダクションステージ11は、ダウンミックスステージ9の上流に(例えば、装置2の入力に又はダウンミックスステージ9の直前に)配置してもよい。
【0076】
ある受信状態では、FMレシーバ1はモノラル信号のみを提供し、送られてきたサイド信号はミュートされる。これは、典型的には、受信状態が非常に悪く、サイド信号にノイズが多い時に起こる。FMステレオレシーバ1がステレオ無線信号のモノラル再生に切り換えられると、アップミックスステージは、好ましくはプリセットアップミックスパラメータなどのブラインドアップミックス(blind upmix)のアップミックスパラメータを用い、擬似ステレオ信号を発生する。すなわち、アップミックスステージは、ブラインドアップミックスのアップミックスパラメータを用いてステレオ信号を発生する。
【0077】
受信状態が極めて悪い場合に、モノラル再生に切り換えるFMステレオレシーバ1の実施形態もある。信頼できるPSパラメータ5を推定するには受信状態が悪すぎる場合、アップミックスステージは、好ましくは、ブラインドアップミックスのアップミックスパラメータを用い、それに基づいて擬似ステレオ信号を発生する。
【0078】
図9は、FMレシーバ1のモノラルのみの出力の場合に、擬似ステレオ発生をする実施形態を示す。ここで、モノラル/ステレオディテクタ13を用いて、装置2への入力信号がモノラルか、すなわちLチャンネルとRチャンネルの信号が同じか検出する。FMレシーバ1のモノラル再生の場合、モノラル/ステレオディテクタ13は、例えばアップミックスパラメータを固定したPSデコーダを用いて、ステレオにアップミックスすることを示す。言い換えると:この場合、アップミックスステージ4は、PSパラメータ推定ステージ3(図9には図示せず)からのPSパラメータを用いず、固定のアップミックスパラメータ(図9には図示せず)を用いる。
【0079】
任意的に、スピーチディテクタ14を付加して、受信信号が主にスピーチか音楽か示してもよい。かかるスピーチディテクタ14により、信号に応じたブラインドアップミックスができる。例えば、かかるスピーチディテクタ14により、信号に応じたアップミックスパラメータができる。好ましくは、1つ以上のアップミックスパラメータをスピーチに対して用い、これとは異なる1つ以上のアップミックスパラメータを音楽に対して用いることもできる。かかるスピーチディテクタ14は、ボイスアクティビティディテクタ(VAD)により実現できる。厳密に言うと、図9のアップミックスステージ4は、無相関器10と、2×2アップミックスマトリックス4aと、モノラル/ステレオディテクタ13及びスピーチディテクタ14の出力を実際のステレオアップミックスへの入力として用いる何らかのPSパラメータに変換する手段とを有する。
【0080】
図10は、FMレシーバ1により供給されるオーディオ信号が、受信状態が時間的に変化して悪くなったために、ステレオとモノラルとの間で切り替わる(toggle)時の一般的な問題を示す。モノラル/ステレオの切替(toggling)のときにステレオサウンドイメージを維持するため、エラー隠蔽方法を用いても良い。隠蔽を適用する時間を図10に「C」で示した。PS符号化の隠蔽に対するアプローチは、FMレシーバ1のオーディオ出力がモノラルになり新しいPSパラメータを計算できない場合には、前に推定したPSパラメータに基づくアップミックスパラメータを使うものである。例えば、アップミックスステージ4は、FMレシーバ1のオーディオ出力がモノラルになったので新しいPSパラメータを計算できない場合には、前に推定したPSパラメータを使う。このように、FMステレオレシーバ1がモノラルオーディオ出力に切り替わったとき、ステレオアップミックスステージ4は、PSパラメータ推定ステージ3の前に推定したPSパラメータを用い続ける。ステレオ出力のドロップアウト時間が十分短く、FM無線信号のステレオサウンドイメージがドロップアウト期間と同様に維持される場合、ドロップアウトは装置2のオーディオ出力では聞こえないか、かすかに聞こえるだけである。他のアプローチでは、前に推定したパラメータのアップミックスパラメータを補間及び/又は外挿してもよい。前に推定したPSパラメータに基づくアップミックスパラメータの決定に関して、本明細書における教示を考慮して、送信エラー(例えば、破損データや消失データ)の効果を緩和するためにオーディオデコーダで用いられるエラー隠蔽メカニズムとして知られているその他の方法を用いることもできる。
【0081】
FMレシーバ1が短時間の間、ノイズが多いステレオ信号を出し、その信号に基づいて信頼できるPSパラメータを推定するには悪すぎる場合、前に推定したPSパラメータに基づくアップミックスパラメータを用いる同じアプローチを適用してもよい。
【0082】
以下、エラー補正を行う高度PSパラメータ推定ステージ3′を、図11を参照して説明する。ノイズが多いサイド成分を含むステレオ信号に基づいてPSパラメータを推定する場合、CLDパラメータ(Channel Level Differences)とICCパラメータ(Inter-channel Cross-Correlation)を決定するために、PSパラメータを決定する従来の式を使うと、PSパラメータの計算にはエラーが生じる。
【0083】
サイド信号中のノイズがミッド信号とは独立であると仮定すると:
− ノイズの無いステレオ信号に基づき推定されたICC値と比較して、ICC値は0に近くなる、及び
− デシベル単位のCLD値は、ノイズの無いステレオ信号に基づき推定したCLD値と比較して、0dBに近くなる。
【0084】
装置2は、好ましくは、PSパラメータ中のエラーを補償するため、(悪い)無線送信により生じた受信サイド信号のノイズのパワーに特徴的なノイズパラメータを決定するように構成されたノイズ推定ステージを有する。ノイズパラメータは、PSパラメータを推定するときに考慮される。これは図11に示したように実施できる。
【0085】
図11では、信号強度データ6は少なくとも部分的にエラーを補償するために用いることができる。信号強度6は、FM無線レシーバで利用できることが多い。信号強度6は、PSエンコーダ7のパラメータ分析ステージ3に入力される。サイド信号ノイズパワー推定ステージ15において、信号強度値6はサイド信号ノイズパワー推定N2に変換される。N2=E(n2)、ここでE()は期待値演算子である。信号強度6の替わりとして、又は信号強度6に加えて、オーディオ信号L、Rは、後で説明するように、信号ノイズパワーの推定に用いることができる。
【0086】
ノイズがある実際のステレオ入力信号値lw/ noiseとrw/ noiseは、図11に示した内部PSパラメータ推定ステージ3′に入力されるが、ノイズの無い値lw/o noiseとrw/o noiseにより表すことができる。
【0087】
【数4】
留意点として、ここでは受信サイド信号をs+nとモデル化する。ここで「s」は下の(歪みのない)サイド信号であり、「n」は無線送信チャンネルにより生じるノイズ(歪み信号)である。さらに、さらに仮定として、信号mは無線送信チャンネルのノイズにより歪んでいない。
【0088】
このように、対応する入力パワーLw/ noise2、Rw/ noise2と、相互相関Lw/ noiseRw/ noiseは次式で書ける:
【数5】
N2はサイド信号ノイズパワー推定であり、N2=E(n2)、ここでE()は期待値演算子である。
【0089】
上記の式を再構成して、ノイズが無い、対応する補償パワーと相互相関を決定できる:
【数6】
補償パワーと相互相関に基づくエラー補償したPSパラメータの取得は、次の式で行える:
【数7】
かかるパラメータ取得により、PSパラメータの計算における推定N2を補償できる。
【0090】
図11では、サイド信号ノイズパワー推定ステージ15は、信号強度6及び/又はオーディオ入力信号(LとR)に基づきノイズパワー推定N2を求めるように構成されている。ノイズパワー推定N2は、周波数及び時間の両方に応じて変わり得る。
【0091】
サイド信号ノイズパワーN2を決定するのにいろいろな方法を用いることができる。例えば、
− ミッド信号のパワー最小値(スピーチ中のポーズ)を検出したとき、サイド信号のパワーはノイズのみである(すなわち、この状況ではサイド信号のパワーはN2と一致する)と仮定できる。
− N2推定は信号強度データ6の関数により画定できる。関数(又はルックアップテーブル)は実験的(物理的)測定により設計できる。
− N2推定は信号強度データ6及び/又はオーディオ入力信号(LとR)の関数により画定できる。その関数はヒューリスティックルールにより設計できる。
− N2推定は、ミッド信号とサイド信号の信号タイプコヒーレンスの研究に基づく。元のミッド信号とサイド信号は、例えば、同様の音調対ノイズ比又は波高因子又はその他のパワーエンベロープ特性を有すると仮定できる。これらの特性のずれを用いて、高レベルのN2を示すことができる。
【0092】
以下、オーディオ処理装置2の別の好ましい実施形態を説明する。
【0093】
好ましくは、装置2は、図9と図10に示すように、受信サイド信号が現実的にはノイズだけの場合、擬似ステレオ(ブラインドアップミックス)オペレーションにスムースに切り換えるように、構成されている。これにより、FMレシーバ1がモノラルオペレーションに切り換えられた場合に、又は装置2の入力におけるステレオ信号のサイド信号部分にノイズが多く、信頼できるPSパラメータを推定できない場合に、装置2の出力に擬似ステレオ信号を出力できる。
【0094】
サイド信号にほとんどノイズが無い場合、装置2は、パラメトリックステレオオペレーションではなく、通常のステレオオペレーションにスムースに切り替わる。通常のステレオオペレーションでは、装置2の信号改善機能は基本的に非アクティブ化されている。非アクティブ化されている場合、装置に入力されたオーディオ信号は、装置2の出力に基本的に素通りする。
【0095】
あるいは、通常のステレオオペレーションは、図4と図6に示した受信サイド信号S0を用いて実現できる。通常ステレオオペレーションの場合、アップミックスステージ4でミックスするために、受信サイド信号S0を用いる。アップミックスステージ4でアップミックスパラメータを適切に選択するとき、アップミックスステージ4の出力信号L′、R′はFMトランスミッタ1の出力信号L、Rに対応する:例えば、次式により、モノラルダウンミックスDMと受信信号S0とをミックスするとき、
【数8】
より好ましくは、通常ステレオモード又はパラメトリックステレオモードの選択は、周波数によって変わる。すなわち、周波数帯域が異なると選択も異なる。周波数が高くなると受信サイド信号の信号対ノイズ比が悪くなるので、これは有用である。
【0096】
装置2から出力できる最も良いステレオ信号を常に供給するために、異なるオペレーションモード間のスムースな切替を、その時の受信状態に動的に適合させる。信号対ノイズ比が高い場合、通常FMステレオオペレーション(PS処理に基づくノイズリダクションをしないもの)が好ましく、信号対ノイズ比が低い場合、ステレオ信号はPS処理により大幅に改善される。
【0097】
好ましくは、PSエンコーダ7のモノラルダウンミックスDMの発生は、モノラルダウンミックスDMにサイド信号からのノイズができるだけ漏れないように行わねばならない。これには、非常に低ビットレートの符号化システムで通常は利用される(MPEG−4用のMPEG−4PSエンコーダなどの)PSエンコーダで一般的に使われるものとは異なるダウンミックス方法が必要になる。これは、単純にミッド信号に一致する固定(非適応的)ダウンミックスDM=M=(L+R)/2と同じくらい簡単である。さらに、PSデコーダ8におけるアップミックスは、PSエンコーダ7で用いられる実際のダウンミックス方法に一般的には適用される。
【0098】
留意点として、図面ではPSエンコーダ7とPSデコーダ8を別々のモジュールとして示したが、効率的な実施のコンテクストでは、PSエンコーダ7とPSデコーダ8をできるだけ合体する方がもちろん有利である。
【0099】
ここに説明したコンセプトは、ISO/IEC 14496-3 (MPEG-4 Audio)標準で定義されたHE−AACv2(High-Efficiency Advanced Audio Coding version 2)エンコーダ、MPEGサラウンダに基づくエンコーダ、MPEG USAC(Unified Speech and Audio coder)に基づくエンコーダ、及びMPEG標準によりカバーされてないエンコーダなど、PS法を用いた任意のエンコーダに関して実施できる。
【0100】
以下、例として、HE−AACv2エンコーダを仮定するが、それにもかかわらず、このコンセプトはPS法を用いる任意のオーディオエンコーダに関して用いることができる。
【0101】
HE−AACはロッシー(lossy)なオーディオ圧縮方式である。HE−AACv1(HE-AAC version 1)は、スペクトルバンドレプリケーション(SBR)を用いて圧縮効率を高くしている。HE−AACv2は、さらに、パラメトリックステレオを含み、非常に低いビットレートにおけるステレオ信号の圧縮効率を高めている。HE−AACv2エンコーダは、本来的に、非常に低いビットレートで動作できるようにPSエンコーダを含む。かかるHE−AACv2エンコーダのPSエンコーダは、オーディオ処理装置2のPSエンコーダ7として用いることができる。特に、HE−AACv2エンコーダのPSエンコーダ中のPSパラメータ推定ステージは、オーディオ処理装置2のPSパラメータ推定ステージ3として用いることができる。また、HE−AACv2エンコーダのPSエンコーダ中のダウンミックスステージを、装置2のダウンミックスステージ9として用いることができる。
【0102】
よって、本明細書で説明したコンセプトは、効率的にHE−AACv2エンコーダと組み合わせて、FMステレオ無線レシーバの改善を実現することができる。かかる改善したFMステレオ無線レシーバは、HE−AACv2録音機能を有する。HE−AACv2エンコーダが、録音目的で記憶できるHE−AACv2ビットストリームを出力するからである。これは図12に示した。この実施形態では、装置2は、HE−AACv2エンコーダ16とPSデコーダ8とを有する。HE−AACv2エンコーダは、前掲の図面を参照して説明した、モノラルダウンミックスDMとPSパラメータ5を発生するのに用いるPSエンコーダ7を提供する。
【0103】
任意的に、PSエンコーダ7は、FM無線ノイズリダクションの目的に合わせて修正して、DM=(L+R)/aによるダウンミックス方式などの固定ダウンミックス方式をサポートするようにできる。
【0104】
上記の通り、モノラルダウンミックス信号DMとPSパラメータ8をPSデコーダ8に送り、ステレオ信号L′、R′を発生する。モノラルダウンミックスDMは、モノラルダウンミックスDMの知覚符号化(perceptual encoding)のためにHE−AACv1に送られる。得られた知覚符号化したオーディオ信号とPS情報は、HE−AACv2ビットストリーム18に多重化される。録音のため、HE−AACv2ビットストリーム18は、フラッシュメモリやハードディスクなどのメモリに記憶できる。
【0105】
HE−AACv1エンコーダ17は、SBRエンコーダとAACエンコーダ(図示せず)を有する。SBRエンコーダは、一般的には、QMF(quadrature mirror interbank)領域の信号処理を行い、そのためQMFサンプルを必要とする。対照的に、AACエンコーダは、一般的に、(一般的にはファクタ2でダウンサンプリングされた)時間領域のサンプルを必要とする。
【0106】
HE−AACv2エンコーダ中のPSエンコーダ7は、一般的には、すでにQMF領域のダウンミックス信号DMを供給する。
【0107】
PSエンコーダ7はHE−AACv1エンコーダにQMF領域信号DMを送信しているので、SBR分析のためのHE−AACv1エンコーダのQMF分析変換はもう使われないこのように、ダウンミックス信号DMをQMFサンプルとして提供することにより、通常はHE−AACv1エンコーダの一部であるQMF分析を回避できる。これにより、計算負荷と複雑性が減少する。
【0108】
AACエンコーダの時間領域サンプルは、例えば、時間領域で単純な計算DM=(L+R)/2を行い、時間領域信号DMをダウンサンプリングすることにより、装置2の入力から求められる。このアプローチは、おそらく最もコストがかからないアプローチだろう。あるいは、装置2は、QMF領域DMサンプルのハーフレートQMF合成を行っても良い。
【0109】
留意点として、PSエンコーダとPSデコーダは、両方が同じモジュールで実施されていれば、部分的に合体できる。
【技術分野】
【0001】
本文書はオーディオ信号処理に関し、特にFMステレオ無線レシーバのオーディオ信号を改善する装置と、それに対応する方法とに関する。
【背景技術】
【0002】
アナログFM(周波数変調)ステレオ無線システムでは、オーディオ信号の左チャンネル(L)と右チャンネル(R)は、ミッド・サイド(M/S)表示して、すなわちミッドチャンネル(M)とサイドチャンネル(S)として送られる。ミッドチャンネルMはLとRの和信号であり、例えばM=(L+R)/2である。サイドチャンネルSはLとRの差信号であり、例えばS=(L−R)/2である。送信時、サイドチャンネルSは38kHz抑圧搬送波に変調され、ベースバンドミッド信号Mに加えられ、後方互換のステレオ多重信号となる。この多重信号を用いて、FM送信器のHF(高周波)搬送波を変調する。FM送信器は、一般的には87.5ないし108MHzの範囲で動作している。
【0003】
受信品質が低下する(すなわち無線チャンネルの信号対雑音比が低下する)と、SチャンネルはMチャンネルより悪化する(suffer)。多くのFMレシーバの実施形態では、受信条件が悪く、雑音が多くなり過ぎると、Sチャンネルはミュートされる。すなわち、HF無線信号が悪くなると、レシーバはステレオからモノラルに戻る。
【0004】
パラメトリックステレオ(PS)符号化は、非常に低ビットレートのオーディオ符号化の分野の一方法である。PSにより、2チャンネルステレオオーディオ信号を、付加的PSサイド情報、すなわちPSパラメータを組み合わせたモノラルダウンミックス信号として符号化できる。モノラルダウンミックス信号はステレオ信号の量チャンネルの組み合わせとして得られる。PSパラメータによりPSデコーダはモノラルダウンミックス信号とPSサイド情報からステレオ信号を再構成できる。一般的には、PSパラメータは時間と周波数により変わり、PSデコーダにおけるPS処理は一般的にQMFバンクを組み込んだハイブリッドフィルタバンクドメインで実行される。非特許文献1は、MPEG−4のPS符号化システム例を記載している。この文献のパラメトリックステレオに関する説明をここに参照援用する。パラメトリックステレオは、例えばMPEG−4オーディオで支持されている。パラメトリックステレオは、非特許文献2で説明されている。この文献をここに参照援用する。パラメトリックステレオは、MPEGサラウンド標準でも用いられている(非特許文献3を参照)。また、この文献はここに参照援用する。パラメトリックステレオシステムの別の例が非特許文献4と非特許文献5に記載されている。この2文献では、「バイノーラル・キュー符号化」という用語が使われているが、これはパラメトリック符号化の一例である。
【0005】
ミッド信号の信号品質が十分良くても、サイド信号Sにはノイズが多いことがあり、(例えば、L=M+SとR=M−Sで求められる)出力信号の左右チャンネルでミックスすると、全体的なオーディオ品質が大幅に低下することがある。サイド信号Sの品質が悪いから中間であれば、2つのオプションがある:レシーバは、サイド信号Sに関連するノイズを受け入れ、リアルステレオを出力するか、サイド信号Sをドロップして、モノラルに戻るかどちらかである。
【先行技術文献】
【非特許文献】
【0006】
【非特許文献1】「Low Complexity Parametric Stereo Coding in MPEG-4」, Heiko Purnhagen, Proc. Digital Audio Effects Workshop (DAFx), pp. 163-168, Naples, IT, Oct. 2004
【非特許文献2】MPEG−4標準化文書ISO/IEC 14496-3:2005 (MPEG-4 Audio, 3rd edition)、セクション8.6.4、アネックス8.A及び8C
【非特許文献3】文献ISO/IEC 23003-1:2007, MPEG Surround
【非特許文献4】「Binaural Cue Coding - Part I: Psychoacoustic Fundamentals and Design Principles」、Frank Baumgarte and Christof Faller, IEEE Transactions on Speech and Audio Processing, vol 11, no 6, pages 509-519, November 2003
【非特許文献5】「Binaural Cue Coding - Part II: Schemes and Applications」Christof Faller and Frank Baumgarte, IEEE Transactions on Speech and Audio Processing, vol 11, no 6, pages 520-531, November 2003
【発明の概要】
【課題を解決するための手段】
【0007】
本発明の第1の態様は、FMステレオ無線レシーバのオーディオ信号を改善する装置に関する。この装置はステレオオーディオ信号を発生する。改善するオーディオ信号は、L/R表示のオーディオ信号、すなわちL/Rオーディオ信号であっても、別の実施形態では、M/S表示のオーディオ信号、すなわちM/Oオーディオ信号であってもよい。従来のFM無線レシーバはL/R出力を用いているので、一般的に、改善するオーディオ信号はL/R表示のオーディオ信号である。
【0008】
本発明の一実施形態として、本装置は、ミッド信号とサイド信号を有するFM無線信号を受信するように構成されたFMステレオ無線レシーバ用である。
【0009】
この装置はパラメトリックステレオ(PS)パラメータ推定ステージを有する。パラメトリックステレオパラメータ推定ステージは、L/R又はM/Sオーディオ信号に基づき、周波数により変化する、又は変化しない態様で、1つ以上のPSパラメータを決定するように構成されている。1つ以上のパラメータは、チャンネル間強度差(IID、またはCLD(Channel Level Difference)とも呼ばれる)を示すパラメータ、及び/又はチャンネル間相互相関(ICC)を示すパラメータを含み得る。好ましくは、PSパラメータは時間と周波数により変わる。
【0010】
さらに、この装置はアップミックスステージを有する。アップミックスステージは、第1のオーディオ信号と1つ以上のPSパラメータとに基づいて、ステレオ信号を発生するように構成されている。
【0011】
第1のオーディオ信号は、例えば、ダウンミックスステージのダウンミックスオペレーションにより、L/R又はM/Sオーディオ信号から求められる。第1のオーディオ信号は、L/R表示の場合、次の式によるダウンミックス演算により、オーディオ信号から得られる:DM=(L+R)/a、DMは第1のオーディオ信号に対応する。例えば、パラメータaは2としてもよい。DM=(L+R)/aの場合、第1のオーディオ信号は基本的に受信ミッド信号Mに対応する。さらに進んだ適応的ダウンミックス方式では、2つのチャンネルを式DM=L/a1+R/a2により結合する2つのパラメータa1、a2は、異なってもよいし、及び/又はPSパラメータ及び/又はその他の信号特性に依存してもよい。
【0012】
FMステレオ無線レシーバの出力がM/S表示の場合、第1のオーディオ信号は、出力されるM/Sオーディオ信号のM信号に対応してもよい。
【0013】
PSパラメータ推定ステージはPSエンコーダの一部であってもよい。アップミックスステージはPSデコーダの一部であってもよい。
【0014】
本装置は次のアイデアに基づく。すなわち、受信したミッド信号とサイド信号を単に合成するだけでは、受信したサイド信号は、ステレオ信号を再構成するほどにはよくないかも知れないが、それにも係わらず、この場合でも、サイド信号やR/L信号中のサイド信号成分はPSパラメータ推定ステージ3においてステレオパラメータ分析に使うには十分良いことがある。PSパラメータをステレオ信号の再構成に使っても良い。
【0015】
このように、本装置により、サイド信号に中くらいの、または大きなノイズがある状態で、ステレオ受信を改善できる。留意点として、本明細書では、「ノイズ」という用語を、(放送される実際のオーディオ信号に初めからあるノイズ状の信号成分ではなく、)無線送信チャンネルの制約により生じるノイズを指すものとする。
【0016】
受信したノイズの多いサイド信号を用いてステレオオーディオ信号を生成するのではなく、レシーバにより発生された改善されたサイド信号を用いる。改善されたサイド信号は、PS符号化の方法の助けを借りて発生してもよい。これらは、例えば、第1のオーディオ信号を入力として動作する無相関化器による改善したサイド信号の成分の発生を含む。受信状態及び/又は受信ステレオ信号の分析に関するデータを用いて、改善したサイド信号の発生と、オーディオ出力信号の発生とを適応的に制御することができる。
【0017】
他の実施形態では、前記第1のオーディオ信号に基づき無相関化信号を発生するように構成された無相関化器をさらに有する。アップミックスステージは、第1のオーディオ信号と、1つ以上のPSパラメータと、無相関化信号、又は少なくともその無相関化信号の周波数帯域に基づいてステレオ信号を発生できる。
【0018】
受信サイド信号のノイズが少なくて受信状態が良い場合、無相関化信号を用いる替わりに、アップミックスステージは、受信サイド信号をアップミックスに用いても良い。それゆえ、一実施形態では、アップミックスには、受信サイド信号又は無相関化信号を選択的に用いる。より好ましくは、選択は周波数により変化する、例えば、アップミックスステージは、低い周波数には受信サイド信号を用い、高い周波数には無相関化信号を擬似サイド信号として使ってもよい。周波数が高ければたかいほど、ノイズの密度が高いからである。これは、無線チャンネルに(ホワイト)ノイズがのる場合のFM復調の典型的な特性である。これは本明細書で後で説明する。
【0019】
第1の信号がミッド信号に対応する場合、受信サイド信号又はその少なくとも1つの周波数成分をアップミックスに用いても良い。ダウンミックス方式が(第1のオーディオ信号を発生する(L+R)/aと)異なる場合、受信サイド信号を用いる替わりに、アップミックスに残差信号を用いても良い。かかる残差信号は、ダウンミックスとPSパラメータによりオリジナルチャンネルを表すことに伴うエラーを示し、PSエンコーディング方式で用いられることが多い。受信サイド信号を使用した場合の上記の説明は、残差信号の場合にもあてはまる。
【0020】
アップミックスのための受信サイド信号と無相関化信号の間の選択は、信号に依存しても、すなわち換言すると信号に適応的であってもよい。
【0021】
さらに他の一実施形態によれば、選択は、信号強度などの無線受信インジケータにより示される受信状態に、及び/又は受信サイド信号の品質を示すインジケータに依存してもよい。受信状態が良い(すなわち強度が高い)とき、受信サイド信号を(場合によって、最高周波数ではない)アップミックスに用いることが好ましい。一方、受信状態が中間である(すなわち、強度が低い)場合、アップミックスに無相関化信号を用いることができる。
【0022】
サイド信号のノイズレベルが高く、受信状態が非常に悪い場合、FMレシーバがモノラル出力モードに切り替わり、オーディオ信号のノイズを低減する。FMレシーバの出力がL/Rステレオオーディオ信号の場合、出力される両チャンネルはモノラル再生の同じ信号を有する。FMレシーバの出力がM/Sステレオ信号の場合、出力されるSチャンネルはミュートされる。モノラル出力モードでは、FMレシーバのオーディオ信号中のステレオ情報は失われる。そのため、PSパラメータ推定ステージは、アップミックスステージでリアルステレオ信号を生成するのに適したPSパラメータを決定できない。非常に悪い受信状態でFMレシーバがモノラル出力モードに切り替わらない場合でも、FMレシーバの出力されるオーディオ信号は意味のあるPSパラメータを推定するには悪すぎるであろう。
【0023】
本装置は、FMレシーバがステレオ無線信号のモノラル出力を選択したか検出するように構成でき、及び/又はこのように悪い(意味のあるPSパラメータを推定するには悪すぎる)受信状態を検知するように構成できる。モノラル出力を検出する場合、又はかかる悪い受信状態を検出する場合、アップミックスステージは擬似ステレオ信号を発生できる。アップミックスステージは、上記の推定パラメータではなく、ブラインドアップミックス用の1つ以上のアップミックスパラメータを使用する。このモードは擬似ステレオオペレーションまたはブラインドアップミックスオペレーションと呼ぶ。
【0024】
この場合、ブラインドアップミックスオペレーションは、悪い受信状態を検出し又はモノラル出力を検出し、ブラインドアップミックスオペレーションを開始すると、FMレシーバの出力信号の空間的音響情報(があっても)をアップミックスパラメータの決定には用いず、アップミックのためには考慮しない(FMレシーバの出力にモノラル出力があれば、空間的音響情報はなく、まったく考慮できない)。アップミックスステージの出力信号中のサイド信号を再構成するためにPSパラメータを決定する上記のPSオペレーションモードと対照的に、ブラインドアップミックスオペレーションでは、本装置は、アップミックスステージの出力信号のサイド信号を再構成することを目的としていない。
【0025】
しかし、ブラインドアップミックスは、アップミックスパラメータがFMレシーバの出力信号から必ず独立であるという点で、装置が「ブラインド」であることを意味するのではない。例えば、FMレシーバの出力信号を、音楽かスピーチか、モニタして、それに応じて適切なアップミックスパラメータを選択してもよい。
【0026】
ブラインドアップミックスの一実施形態は、プリセットアップミックスパラメータの使用である。プリセットアップミックスパラメータは、デフォルトの又は記憶されたアップミックスパラメータであってもよい。
【0027】
それにも係わらず、使用されるアップミックスパラメータは、例えばスピーチ用のアップミックスパラメータと音楽用のアップミックスパラメータなど、信号依存であってもよい。この場合、本装置は、さらに、オーディオ信号が主にスピーチか音楽か検出するスピーチディテクタ(例えば、スピーチ/音楽弁別器)を有する。例えば、純粋な音楽の場合、アップミックスパラメータの選択は、ダウンミックス信号とその無相関化バージョンをミックスするように行う。一方、純粋なスピーチの場合、アップミックスパラメータの選択は、ダウンミックス信号の無相関化バージョンを使わず、ダウンミックス信号のみを使って、「モノラルの」左右信号にアップミックスする。オーディオ信号がスピーチと音楽のミックスの場合、純粋なスピーチ用のアップミックスパラメータと純粋な音楽用のアップミックスパラメータとの間のブラインドアップミックスパラメータをもちいてもよい。間のすべての状態のアップミックスパラメータを補間して用いても良い。
【0028】
擬似ステレオを求めるためのさらに進んだブラインドアップミックス方式も想定できる。例えば、モノラル信号のさらに進んだ分析を行い、これを「人工的に発生した」又は「合成した」PSパラメータを求める基礎として用いることができる。
【0029】
実際的にノイズのみのサイド信号の場合、本装置は、好ましくは、上記のように擬似ステレオモードに切り替わる。上述の通り、ここで「ノイズ」との用語は、無線の受信状態が悪いこと(すなわち、無線チャンネルの信号対雑音比が低いこと)により生じるノイズをいい、FM放送トランスミッタに送られた元の信号に含まれるノイズではない。
【0030】
しかし、再度信号にほとんどノイズが無い場合、すなわちFM無線送信により生じるノイズがほとんどない場合、本装置は、好ましくは、パラメトリックステレオモードではなく、ノーマルステレオモードに切り替わる。ノーマルステレオモードでは、装置の信号改善機能は基本的に非アクティブ化(deactivated)されている。非アクティブ化されている場合、装置に入力された左右オーディオ信号は、装置の出力に基本的に素通りする。
【0031】
あるいは、非アクティブ化の場合、(無相関化信号ではなく)受信サイド信号のみをアップミックスステージで第1のオーディオ信号とミックスする。アップミックスステージでアップミックスパラメータを適切に選択するとき、アップミックスステージの出力信号はFMトランスミッタの出力信号に対応する。例えば、次式による第1のオーディオ信号DMと受信サイド信号S0のミキシングをするとき
【数1】
いくつかの場合、より好ましくは、通常ステレオモード又はパラメトリックステレオモードの選択は、周波数によって変わる。すなわち、周波数帯域が異なると選択も異なる。周波数が高くなると受信サイド信号の信号対ノイズ比が特徴的に悪くなるので、これは有用である。上述の通り、これはFM復調の一般的な特性である。
【0032】
本装置の別の実施形態は従属項に記載した。
【0033】
本発明の第2の態様は、FMステレオ無線レシーバの左/右オーディオ信号又はミッド/サイドオーディオ信号に基づきステレオ信号を発生する装置に関する。この装置は、前記FMステレオレシーバが前記ステレオ無線信号のモノラル出力を選択したことを検知し、又は無線受信状態が悪いことを検知するように構成されている。本装置はステレオアップミックスステージを有する。このアップミックスステージは、装置が、FMステレオレシーバがステレオ無線信号のモノラル出力を選択したことを検知すると、又は受信状態が悪いことを検知すると、第1のオーディオ信号と1つ以上のブラインドアップミックス用アップミックスパラメータに基づいて、ステレオ信号を発生するように構成されている。前記第1のオーディオ信号は、前記左/右オーディオ信号又はミッド/サイドオーディオ信号から求められる。
【0034】
ブラインドアップミックス用アップミックスパラメータは、デフォルトパラメータや記憶されたパラメータなどのプリセットパラメータでもよい。
【0035】
本装置により、受信状態が非常に悪く、サイド信号のノイズレベルが高い場合、ノイズレベルの低い擬似ステレオ信号を発生できる。かかる受信状態では、FMレシーバは、モノラルモードに切り替わり、オーディオ信号のノイズを低減し、またはL/R又はM/Sオーディオ信号は意味のあるPSパラメータを推定するには悪すぎる。これが検出され、擬似ステレオ信号の発生のためブラインドアップミックス用のアップミックスパラメータを使用する。これは、本発明の第1の態様に関連してすでに説明した。
【0036】
本発明の第1の態様に関連して説明したように、本装置は、FMステレオレシーバがステレオ無線信号のモノラル出力を選択したか検出する検出ステージを有しても良い。
【0037】
一実施形態によれば、本装置は、さらに、FMトランスミッタの出力におけるオーディオ信号が主にスピーチか否かを示すスピーチ検出器などのオーディオタイプ検出器を有する。この場合、前記1つ以上のアップミックスパラメータは、前記スピーチディテクタの表示に依存する。例えば、本発明の第1の態様に関連して詳しく説明したように、本装置は、スピーチの場合はアップミックスパラメータを用い、音楽の場合は他のアップミックスパラメータを用いる。
【0038】
本発明の第2の態様による装置は、さらに、本発明の第1の態様による装置の特徴を含んでもよいし、その逆でもよい。
【0039】
本発明の第3の態様は、ミッド信号とサイド信号を含むFM無線信号を受信するように構成されたFMステレオ無線レシーバに関する。FMステレオ無線レシーバは、本発明の第1と第2の態様によるオーディオ信号を改善する装置を含む。
【0040】
本発明の第4の態様は、セルラー電話などのモバイル通信デバイスに関する。このモバイル通信デバイスは、FM無線信号を受信するように構成されたFMステレオレシーバを有する。さらに、このモバイル通信デバイスは、本発明の第1と第2の態様によるオーディオ信号を改善する装置を含む。
【0041】
本発明の第5の態様は、FMステレオ無線レシーバの左/右オーディオ信号又はミッド/サイドオーディオ信号を改善する方法に関する。第5の態様による方法の特徴は、第1の態様による装置の特徴に対応する。前記左右オーディオ信号又はミッド/サイドオーディオ信号に基づき、周波数により変わる又は周波数により変わらない態様で、1つ以上のPSパラメータを決定する。ステレオ信号は、アップミックスオペレーションにより、前記第1のオーディオ信号と前記1つ以上のPSパラメータとに基づき発生される。
【0042】
本発明の第1の態様の説明は、本発明の第5の態様にも当てはまる。
【0043】
本発明の第6の態様は、FMステレオ無線レシーバの左/右オーディオ信号又はミッド/サイドオーディオ信号に基づきステレオ信号を発生する方法に関する。第6の態様による方法の特徴は、第2の態様による装置の特徴に対応する。前記FMステレオレシーバが前記ステレオ無線信号のモノラル出力を選択したこと又は無線受信状態が悪いことを検知する。FMステレオレシーバがステレオ無線信号のモノラル出力を選択したこと又は無線受信状態が悪いことを検知した場合、ステレオ信号は、第1のオーディオ信号と、プリセットアップミックスパラメータなどの1つ以上のブラインドアップミックス用のアップミックスパラメータに基づき発生される。
【0044】
本発明の第2の態様の説明は、本発明の第6の態様にも当てはまる。
【図面の簡単な説明】
【0045】
添付した図面を参照して実施例により本発明を説明する。
【図1】FMステレオ無線レシーバのステレオ出力を改善する実施形態を示す図である。
【図2】パラメトリックステレオのコンセプトに基づくオーディオ処理装置の一実施形態を示す図である。
【図3】PSエンコーダとPSデコーダを有するPSベース・オーディオ処理装置の他の一実施形態を示す図である。
【図4】図3のオーディオ処理装置の拡張バージョンを示す図である。
【図5】図4のPSエンコーダとPSデコーダの一実施形態を示す図である。
【図6】アップミックスに用いる信号Sの構造を示す図である。
【図7】図3のオーディオ処理装置の、ノイズリダクションアルゴリズムが追加された拡張バージョンを示す図である。
【図8】オーディオ処理装置の、PSパラメータ推定のためのノイズリダクションを有する別の一実施形態を示す図である。
【図9】FMレシーバのモノラルのみの出力の場合に擬似ステレオ生成をする、オーディオ処理装置の他の一実施形態を示す。
【図10】FMレシーバの出力におけるステレオ再生のショートドロップアウトの発生を示す図である。
【図11】エラー補償をする高機能PSパラメータ推定ステージを示す図である。
【図12】HE−AACv2エンコーダに基づくオーディオ処理装置の別の一実施形態を示す図である。
【発明を実施するための形態】
【0046】
図1は、FMステレオ無線レシーバ1のステレオ出力を改善する単純化した実施形態を示す図である。背景技術欄で説明したように、FM無線では、ステレオ信号は意図的にミッド信号とサイド信号により送信される。(少なくとも受信状態が十分良く、サイド信号情報がミュートされていないとき、)FMレシーバ1では、サイド信号を用いて、FMレシーバ1から出力される左チャンネルLと右チャンネルRの間のステレオ差信号を生成する。左右チャンネルL、Rはデジタル信号でもアナログ信号でもよい。FMレシーバのオーディオ信号L、Rを改善するため、オーディオ処理装置2を用い、その出力にステレオオーディオ信号L′とR′を発生する。オーディオ処理装置2は、パラメトリックステレオを用いて受信したFM無線信号のノイズリダクションを行うことができるシステムに対応する。装置2におけるオーディオ処理は、好ましくはデジタル領域で行われる。FMレシーバ1とオーディオ処理装置2の間がアナログインタフェースの場合、装置2におけるデジタルオーディオ処理の前に、アナログ・ツー・デジタル・コンバータを用いる。FMレシーバ1とオーディオ処理装置2は、同じ半導体チップ上に集積されていてもよく、2つの半導体チップの一部であってもよい。FMレシーバ1とオーディオ処理装置2は、セルラー電話、パーソナルデジタルアシスタント(PDA)、またはスマートホンなどの無線通信デバイスの一部であってもよい。この場合、FMレシーバ1は、FM無線レシーバ機能を有するベースバンドチップの一部であってもよい。
【0047】
FMレシーバ1の出力と装置2の入力で左右表示を用いる代わりに、FMレシーバ1と装置2の間のインタフェースにおいてミッド/サイド表示を用いる(図1のM、Sはミッド/サイド表示を示し、L、Rは左右表示を示す)。FMレシーバ1と装置2の間のインタフェースにおいてこのようにミッド/サイド表示を用いることにより、手間がはぶける。FMレシーバはミッド/サイド信号を受信しており、オーディオ処理装置2はダウンミキシングせずにミッド/サイド信号を直接処理できるからである。FMレシーバ1がオーディオ処理装置2と強く結びついていれば、特にFMレシーバ1とオーディオ処理装置2が同じ半導体チップ上に集積されていれば、ミッド/サイド表示は有利である。
【0048】
任意的に、オーディオ処理装置2におけるオーディオ処理を合わせるために、無線受信状態を示す信号強度信号6を用いてもよい。これは本明細書で後で説明する。
【0049】
FM無線レシーバ1とオーディオ処理装置2の組み合わせは、ノイズリダクションシステムを集積したFM無線レシーバに対応する。
【0050】
図2は、パラメトリックステレオのコンセプトに基づくオーディオ処理装置2の一実施形態を示す図である。装置2はPSパラメータ推定ステージ3を有する。パラメータ推定ステージ3は、(左/右表示でもミッド/サイド表示でもよい)改善する入力オーディオ信号に基づき、PSパラメータ5を決定するように構成されている。PSパラメータ5は、なかんずく、チャンネル間強度差(IID、またはCLD(Channel Level Difference)とも呼ばれる)を示すパラメータ、及び/又はチャンネル間相互相関(ICC)を示すパラメータを含み得る。好ましくは、PSパラメータ5は時間と周波数により変わる。パラメータ推定ステージ3は、その入力がM/S表示の場合、それにもかかわらずにL/Rチャンネルに関するPSパラメータ5を決定してもよい。
【0051】
オーディオ信号DMは入力信号から求める。入力オーディオ信号がミッド/サイド表示を用いている場合、オーディオ信号DMはミッド信号に直接対応する。入力オーディオ信号が左/右表示の場合、オーディオ信号はそのオーディオ信号をダウンミックスして発生する。好ましくは、ダウンミックス後の信号DMはミッド信号Mに対応し、次の式で表せる:
【数2】
すなわち、ダウンミックス信号DMはL信号とR信号の平均に対応する。「a」の値が異なる場合、L信号とR信号の平均は増幅又は減衰される。
【0052】
装置はさらに、アップミックスステージ4を有する。これはステレオミキシングモジュールすなわちステレオアップミキサとも呼ばれる。アップミックスステージ4は、オーディオ信号DMとPSパラメータ5に基づき、ステレオ信号L′、R′を発生するように構成されている。好ましくは、アップミックスステージ4は、DM信号を用いるだけでなく、サイド信号やある種の擬似サイド信号(図示せず)を用いる。これは、図4と図5のより拡張した実施形態を参照して、本明細書で後で説明する。
【0053】
装置2は次のアイデアに基づく。すなわち、受信したミッド信号とサイド信号を単に合成するだけでは、ステレオ信号を再構成するには受信したサイド信号のノイズが多すぎるかも知れないが、それにも係わらず、この場合でも、サイド信号やR/L信号中のサイド信号成分はPSパラメータ推定ステージ3においてステレオパラメータ分析に使うには十分良いことがある。その結果得られるPSパラメータ5を用いて、FMレシーバ1の出力におけるオーディオ信号と比較して、ノイズレベルが低いステレオ信号L′、R′を発生する。
【0054】
このように、受信状態が悪いFM無線信号は、パラメトリックステレオのコンセプトを用いて「クリーンアップ」できる。FM無線信号の歪みとノイズの大部分は、サイドチャンネルにあり、PSダウンミックスで使用しないこともできる。それにもかかわらず、受信状態が悪い場合でも、サイドチャンネルの品質はPSパラメータを取り出すには十分であることが多い。
【0055】
以下の図面では、オーディオ処理装置2への入力信号は左/右ステレオ信号である。オーディオ処理装置2は、その中のいくつかのモジュールに小さい修正をすると、ミッド/サイド表示の入力信号も処理できる。それゆえ、ここで説明するコンセプトはミッド/サイド表示の入力信号に関しても用いることができる。
【0056】
図3は、PSベースの、PSエンコーダ7とPSデコーダ8を使用するオーディオ処理装置2の一実施形態を示す。この例では、パラメータ推定ステージ3はPSエンコーダ7の一部であり、アップミックスステージ4はPSデコーダ8の一部である。「PSエンコーダ」と「PSデコーダ」との用語は、装置2のオーディオ処理ブロックの機能を記述する名称として用いる。留意点として、オーディオ処理はすべて同じFMレシーバデバイスにおいて発生する。これらのPSエンコーディングプロセス及びPSデコーディングプロセスは強く結合していて、「PSエンコーディング」と「PSデコーディング」との用語は、オーディオ処理機能の遺産を記述するときのみに用いる。
【0057】
PSエンコーダ7は、ステレオオーディオ入力信号L、Rに基づき、オーディオ信号DMとPSパラメータ5を発生する。任意的に、PSエンコーダ7はさらに信号強度信号6を用いる。オーディオ信号DMはモノラルダウンミックスであり、好ましくは受信ミッド信号に対応する。L/RチャンネルがDM信号を構成すると仮定すると、受信サイドチャンネルの情報はDM信号には完全に排除されていることがある。よって、この場合、モノラルダウンミックスDMにはミッド情報のみが含まれる。よって、DM信号ではサイドチャンネルからのノイズが排除される。しかし、エンコーダ7は一般的にL=M+SとR=M−Sを入力(その結果、DM=(L+R)/2=M)とするので、サイドチャンネルはエンコーダ7のステレオパラメータ分析の一部である。
【0058】
実験結果が示すところによると、中間レベルのノイズを含む受信サイド信号は、ステレオ自体の再構成には十分良くはないが、PSエンコーダ7のステレオパラメータ分析にとっては十分良いことがある。
【0059】
モノラル信号DMとPSパラメータ5をPSデコーダ8で用いて、ステレオ信号L′、R′を再構成する。
【0060】
図4は、図3のオーディオ処理装置2の拡張バージョンを示す図である。ここで、モノラルダウンミックス信号DMとPSパラメータに加え、受信サイド信号S0はPSデコーダ8に送られる。このアプローチはPS符号化の「残差符号化」法と同様であり、このアプローチにより、受信状態が完全ではないが良い場合に、受信サイド信号S0の少なくとも一部(例えば、ある周波数帯域)の使用ができる。受信サイド信号S0は、モノラルダウンミックス信号がミッド信号に対応する場合に、使われることが好ましい。しかし、モノラルダウンミックス信号がミッド信号に対応しない場合、より一般的な残差信号を受信サイド信号S0の代わりに使うことができる。かかる残差信号は、ダウンミックスとPSパラメータによりオリジナルチャンネルを表すことに伴うエラーを示し、PSエンコーディング方式で用いられることが多い。以下、受信サイド信号S0を使用した場合の説明は、残差信号の場合にもあてはまる。
【0061】
PSエンコーダ/デコーダにおける残差信号の使用は、MPEGサラウンド標準(ISO/IEC 23003-1:2007, MPEG Surround参照)と論文「MPEG Surround - The ISO/MPEG Standard for Efficient and Compatible Multi-Channel Audio Coding」J. Herre et al., Audio Engineering Convention Paper 7084, 122nd Convention, May 5-8, 2007)などに記載されている。
【0062】
図5は、図4のPSエンコーダ7とPSデコーダ8の一実施形態を示す図である。PSエンコーダモジュール7は、ダウンミックスジェネレータ9とPSパラメータ推定ステージ3とを有する。例えば、ダウンミックスジェネレータ9は、好ましくはミッド信号Mに対応するモノラルダウンミックスDM(例えば、DM=M=(L+R)/a)を生成し、任意的に、受信サイド信号S0=(L−R)/aに対応する第2の信号も発生する。
【0063】
PSパラメータ推定ステージ3は、PSパラメータ5として、L入力とR入力の間の相関とレベル差とを推定できる。任意的に、パラメータ推定ステージは、FMレシーバにおける信号パワーである信号強度6を受け取る。この情報は、PSパラメータ5の信号強度6が低い場合に、信頼性に関する決定に使用できる。信頼性が低い場合、出力信号L′、R′がモノラル出力信号又は擬似ステレオ出力信号となるように、PSパラメータ5を設定できる。モノラル出力信号の場合、出力信号L′は出力信号R′と等しい。擬似ステレオ出力信号の場合、デフォルトのPSパラメータを用いて擬似又はデフォルトのステレオ出力信号L′、R′を発生してもよい。
【0064】
PSデコーダモジュール8は、ステレオミキシングマトリックス4aと無相関器10とを有する。無相関器は、モノラルダウンミックスDMを受け取り、擬似サイド信号として用いる無相関化信号S′を発生する。無相関器10は、引用文献「Low Complexity Parametric Stereo Coding in MPEG-4」のセクション4で説明されているように、適当なオールパスフィルタにより、実現され得る。ステレオミキシングマトリックス4aは、本実施形態では2×2アップミックスマトリックスである。
【0065】
推定パラメータ5に応じて、マトリックス4aはDM信号を受信サイド信号S0又は無相関化信号S′とミックスして、ステレオ出力信号L′とR′を生成する。信号S0と信号S′の間の選択は、受信状態を示す信号強度6などの無線受信インジケータに依存する。受信サイド信号の品質を示す品質インジケータを替わりに、または追加的に用いてもよい。かかる品質インジケータの一例は、受信サイド信号の推定ノイズ(パワー)であってもよい。サイド信号が大きなノイズを含む場合、無相関化信号S′を用いてステレオ出力信号L′とR′を生成してもよい。一方、ノイズが小さい場合、サイド信号S0を用いることができる。受信サイド信号のノイズを推定する様々な実施形態は、本明細書で後で説明する。
【0066】
一例として、受信状態が良い(すなわち、信号強度が高い)場合、アップミキシングに信号S0を用いる。一方、状態が悪い場合、アップミキシングは無相関化信号S′に基づき行う。好ましくは、ステレオミキシングモジュール4が受信サイド信号S0又はS′のどちらを使うかは、周波数に応じて決まる。例えば、周波数が低い場合、受信サイド信号S0を用い、周波数が高い場合、無相関化信号S′を用いる。これは図6を参照してより詳しく説明する。
【0067】
信号S0と信号S′の間の周波数によって変わる又は変わらない選択は、(例えば、信号強度6により制御される、アップミックスステージ6のセレクタ手段により)アップミックスステージ4で行われる。あるいは、信号S0と信号S′との間の周波数により変わる又は変わらない選択は、(例えば、信号強度6に応じて)パラメータ推定ステージ3で行われる。次に、パラメータ推定ステージ3は、アップミックスパラメータをアップミックスステージ6に送る。アップミックスステージ6は、選択された信号(S0又はS′)をアップミックスに用いさせる。例えば、S′を選択する場合、信号S0に関するアップミックスパラメータはゼロに設定され、S′に関するパラメータはゼロに設定されない。あるいは、選択信号(図示せず)をアップミックスステージ6に送ってもよい。
【0068】
アップミックス演算は次の行列方程式により行われることが好ましい:
【数3】
ここで、重みファクタα、β、γ、δは信号DMとSの重みを決定する。モノラルダウンミックスDMは好ましくは受信ミッド信号に対応する。式中の信号Sは、無相関化信号S′又は受信サイド信号S0のいずれかに対応する。アップミックスマトリックス要素、すなわち重みファクタα、β、γ、δは、例えば、引用論文「Low Complexity Parametric Stereo Coding in MPEG-4」(セクション2.2を参照)に記載されているように、または引用したMPEG-4標準文書ISO/IEC 14496-3:2005(セクション8.6.4.6.2参照)に記載されているように、またはMPEGサラウンド仕様書ISO/IEC23003−1(セクション6.5.3.2参照)に記載されているように求められる。上記文献のこれらのセクション(及びこれらのセクションで参照されているセクション)は、ここに参照援用する。
【0069】
好ましくは、S′とS0との間の選択は周波数に依存する。これはアップミックスに用いる信号Sの構造例を示す図6に示した。図6に示したように、周波数が低い場合、受信サイド信号S0がアップミックスに使われ、周波数が高い場合、無相関化信号S′がアップミックスに使われる。
【0070】
受信サイド信号S0がS0=(L−R)/2に対応し、L′=M+S0、R′=M−M0である場合、モノラルダウンミックスDMは好ましくは(L+R)/2に対応すべきである。これにより完全な再構成になり、すなわちL′=LかつR′=R。
【0071】
受信サイド信号S0を用いるPSアップミキサを用いる替わりに、残差信号を用いる汎用PSアップミキサを用いても良い。求まる信号L′、R′はPSパラメータと残差信号とモノラルダウンミックスとの関数である。
【0072】
図7はノイズリダクションを用いる実施形態を示す。図5に示したのと同様に、図7でも信号S0は任意的である。信号S0がある場合には、一般的なノイズリダクションアルゴリズムを用いて、DM信号とS0信号のノイズリダクションを行うことができる。あるいは、設定が異なる2つのノイズリダクションモジュールを用いて、1つを信号DMのノイズリダクションに用い、もう1つを信号S0のノイズリダクションに用いてもよい。別の可能性として、一方の信号(例えば、信号DM又は信号S0)だけにノイズリダクションをしてもよい。図7において、ノイズリダクションステージ11が信号DMのノイズリダクションを行い、ノイズリダクション後の信号DM′をPSデコーダ8とその中のアップミックスステージ4に送る。ノイズリダクションステージ11は信号S0のノイズリダクションを行い、ノイズリダクション後の信号S0′をPSデコーダ8に送る。
【0073】
図8は、装置2の別の実施形態を示す図である。ここで、ノイズリダクション方法12がステレオ入力信号に適用され、その結果ノイズリダクションされた信号R′、L′がPSエンコーダ8のPSパラメータ推定ステージ3により分析される。ダウンミックス信号DMはノイズリダクションステージ12を含まない経路を通るので、ノイズリダクションは非常に強い(aggressive)ものでもよく、PSパラメータの取得に対して最適化されたものであってもよい。
【0074】
モノラルダウンミックス号DMは、L、Rチャンネルに同じ重みファクタ(例えば、重みファクタ1又は重みファクタ1/2を用いて)を加えて発生してもよい。信号DMは受信ミッド信号に対応する。重みファクタ1/2を用いるとき、信号DMの振幅は、重みファクタ1を用いるときの信号DMの振幅の半分である。
【0075】
任意的に、信号L/R又は信号DMに(、及びもし使っていればS0にも)何らかのノイズリダクションを適用してもよい。例えば、信号DMにノイズリダクションをかけてもよい(図8の任意的ノイズリダクションステージ11を参照)。好ましくは、このノイズリダクションステージは、強い(aggressive)ノイズリダクションステージ12より弱い(gentler)ものである。ノイズリダクションステージ11は、ダウンミックスステージ9の上流に(例えば、装置2の入力に又はダウンミックスステージ9の直前に)配置してもよい。
【0076】
ある受信状態では、FMレシーバ1はモノラル信号のみを提供し、送られてきたサイド信号はミュートされる。これは、典型的には、受信状態が非常に悪く、サイド信号にノイズが多い時に起こる。FMステレオレシーバ1がステレオ無線信号のモノラル再生に切り換えられると、アップミックスステージは、好ましくはプリセットアップミックスパラメータなどのブラインドアップミックス(blind upmix)のアップミックスパラメータを用い、擬似ステレオ信号を発生する。すなわち、アップミックスステージは、ブラインドアップミックスのアップミックスパラメータを用いてステレオ信号を発生する。
【0077】
受信状態が極めて悪い場合に、モノラル再生に切り換えるFMステレオレシーバ1の実施形態もある。信頼できるPSパラメータ5を推定するには受信状態が悪すぎる場合、アップミックスステージは、好ましくは、ブラインドアップミックスのアップミックスパラメータを用い、それに基づいて擬似ステレオ信号を発生する。
【0078】
図9は、FMレシーバ1のモノラルのみの出力の場合に、擬似ステレオ発生をする実施形態を示す。ここで、モノラル/ステレオディテクタ13を用いて、装置2への入力信号がモノラルか、すなわちLチャンネルとRチャンネルの信号が同じか検出する。FMレシーバ1のモノラル再生の場合、モノラル/ステレオディテクタ13は、例えばアップミックスパラメータを固定したPSデコーダを用いて、ステレオにアップミックスすることを示す。言い換えると:この場合、アップミックスステージ4は、PSパラメータ推定ステージ3(図9には図示せず)からのPSパラメータを用いず、固定のアップミックスパラメータ(図9には図示せず)を用いる。
【0079】
任意的に、スピーチディテクタ14を付加して、受信信号が主にスピーチか音楽か示してもよい。かかるスピーチディテクタ14により、信号に応じたブラインドアップミックスができる。例えば、かかるスピーチディテクタ14により、信号に応じたアップミックスパラメータができる。好ましくは、1つ以上のアップミックスパラメータをスピーチに対して用い、これとは異なる1つ以上のアップミックスパラメータを音楽に対して用いることもできる。かかるスピーチディテクタ14は、ボイスアクティビティディテクタ(VAD)により実現できる。厳密に言うと、図9のアップミックスステージ4は、無相関器10と、2×2アップミックスマトリックス4aと、モノラル/ステレオディテクタ13及びスピーチディテクタ14の出力を実際のステレオアップミックスへの入力として用いる何らかのPSパラメータに変換する手段とを有する。
【0080】
図10は、FMレシーバ1により供給されるオーディオ信号が、受信状態が時間的に変化して悪くなったために、ステレオとモノラルとの間で切り替わる(toggle)時の一般的な問題を示す。モノラル/ステレオの切替(toggling)のときにステレオサウンドイメージを維持するため、エラー隠蔽方法を用いても良い。隠蔽を適用する時間を図10に「C」で示した。PS符号化の隠蔽に対するアプローチは、FMレシーバ1のオーディオ出力がモノラルになり新しいPSパラメータを計算できない場合には、前に推定したPSパラメータに基づくアップミックスパラメータを使うものである。例えば、アップミックスステージ4は、FMレシーバ1のオーディオ出力がモノラルになったので新しいPSパラメータを計算できない場合には、前に推定したPSパラメータを使う。このように、FMステレオレシーバ1がモノラルオーディオ出力に切り替わったとき、ステレオアップミックスステージ4は、PSパラメータ推定ステージ3の前に推定したPSパラメータを用い続ける。ステレオ出力のドロップアウト時間が十分短く、FM無線信号のステレオサウンドイメージがドロップアウト期間と同様に維持される場合、ドロップアウトは装置2のオーディオ出力では聞こえないか、かすかに聞こえるだけである。他のアプローチでは、前に推定したパラメータのアップミックスパラメータを補間及び/又は外挿してもよい。前に推定したPSパラメータに基づくアップミックスパラメータの決定に関して、本明細書における教示を考慮して、送信エラー(例えば、破損データや消失データ)の効果を緩和するためにオーディオデコーダで用いられるエラー隠蔽メカニズムとして知られているその他の方法を用いることもできる。
【0081】
FMレシーバ1が短時間の間、ノイズが多いステレオ信号を出し、その信号に基づいて信頼できるPSパラメータを推定するには悪すぎる場合、前に推定したPSパラメータに基づくアップミックスパラメータを用いる同じアプローチを適用してもよい。
【0082】
以下、エラー補正を行う高度PSパラメータ推定ステージ3′を、図11を参照して説明する。ノイズが多いサイド成分を含むステレオ信号に基づいてPSパラメータを推定する場合、CLDパラメータ(Channel Level Differences)とICCパラメータ(Inter-channel Cross-Correlation)を決定するために、PSパラメータを決定する従来の式を使うと、PSパラメータの計算にはエラーが生じる。
【0083】
サイド信号中のノイズがミッド信号とは独立であると仮定すると:
− ノイズの無いステレオ信号に基づき推定されたICC値と比較して、ICC値は0に近くなる、及び
− デシベル単位のCLD値は、ノイズの無いステレオ信号に基づき推定したCLD値と比較して、0dBに近くなる。
【0084】
装置2は、好ましくは、PSパラメータ中のエラーを補償するため、(悪い)無線送信により生じた受信サイド信号のノイズのパワーに特徴的なノイズパラメータを決定するように構成されたノイズ推定ステージを有する。ノイズパラメータは、PSパラメータを推定するときに考慮される。これは図11に示したように実施できる。
【0085】
図11では、信号強度データ6は少なくとも部分的にエラーを補償するために用いることができる。信号強度6は、FM無線レシーバで利用できることが多い。信号強度6は、PSエンコーダ7のパラメータ分析ステージ3に入力される。サイド信号ノイズパワー推定ステージ15において、信号強度値6はサイド信号ノイズパワー推定N2に変換される。N2=E(n2)、ここでE()は期待値演算子である。信号強度6の替わりとして、又は信号強度6に加えて、オーディオ信号L、Rは、後で説明するように、信号ノイズパワーの推定に用いることができる。
【0086】
ノイズがある実際のステレオ入力信号値lw/ noiseとrw/ noiseは、図11に示した内部PSパラメータ推定ステージ3′に入力されるが、ノイズの無い値lw/o noiseとrw/o noiseにより表すことができる。
【0087】
【数4】
留意点として、ここでは受信サイド信号をs+nとモデル化する。ここで「s」は下の(歪みのない)サイド信号であり、「n」は無線送信チャンネルにより生じるノイズ(歪み信号)である。さらに、さらに仮定として、信号mは無線送信チャンネルのノイズにより歪んでいない。
【0088】
このように、対応する入力パワーLw/ noise2、Rw/ noise2と、相互相関Lw/ noiseRw/ noiseは次式で書ける:
【数5】
N2はサイド信号ノイズパワー推定であり、N2=E(n2)、ここでE()は期待値演算子である。
【0089】
上記の式を再構成して、ノイズが無い、対応する補償パワーと相互相関を決定できる:
【数6】
補償パワーと相互相関に基づくエラー補償したPSパラメータの取得は、次の式で行える:
【数7】
かかるパラメータ取得により、PSパラメータの計算における推定N2を補償できる。
【0090】
図11では、サイド信号ノイズパワー推定ステージ15は、信号強度6及び/又はオーディオ入力信号(LとR)に基づきノイズパワー推定N2を求めるように構成されている。ノイズパワー推定N2は、周波数及び時間の両方に応じて変わり得る。
【0091】
サイド信号ノイズパワーN2を決定するのにいろいろな方法を用いることができる。例えば、
− ミッド信号のパワー最小値(スピーチ中のポーズ)を検出したとき、サイド信号のパワーはノイズのみである(すなわち、この状況ではサイド信号のパワーはN2と一致する)と仮定できる。
− N2推定は信号強度データ6の関数により画定できる。関数(又はルックアップテーブル)は実験的(物理的)測定により設計できる。
− N2推定は信号強度データ6及び/又はオーディオ入力信号(LとR)の関数により画定できる。その関数はヒューリスティックルールにより設計できる。
− N2推定は、ミッド信号とサイド信号の信号タイプコヒーレンスの研究に基づく。元のミッド信号とサイド信号は、例えば、同様の音調対ノイズ比又は波高因子又はその他のパワーエンベロープ特性を有すると仮定できる。これらの特性のずれを用いて、高レベルのN2を示すことができる。
【0092】
以下、オーディオ処理装置2の別の好ましい実施形態を説明する。
【0093】
好ましくは、装置2は、図9と図10に示すように、受信サイド信号が現実的にはノイズだけの場合、擬似ステレオ(ブラインドアップミックス)オペレーションにスムースに切り換えるように、構成されている。これにより、FMレシーバ1がモノラルオペレーションに切り換えられた場合に、又は装置2の入力におけるステレオ信号のサイド信号部分にノイズが多く、信頼できるPSパラメータを推定できない場合に、装置2の出力に擬似ステレオ信号を出力できる。
【0094】
サイド信号にほとんどノイズが無い場合、装置2は、パラメトリックステレオオペレーションではなく、通常のステレオオペレーションにスムースに切り替わる。通常のステレオオペレーションでは、装置2の信号改善機能は基本的に非アクティブ化されている。非アクティブ化されている場合、装置に入力されたオーディオ信号は、装置2の出力に基本的に素通りする。
【0095】
あるいは、通常のステレオオペレーションは、図4と図6に示した受信サイド信号S0を用いて実現できる。通常ステレオオペレーションの場合、アップミックスステージ4でミックスするために、受信サイド信号S0を用いる。アップミックスステージ4でアップミックスパラメータを適切に選択するとき、アップミックスステージ4の出力信号L′、R′はFMトランスミッタ1の出力信号L、Rに対応する:例えば、次式により、モノラルダウンミックスDMと受信信号S0とをミックスするとき、
【数8】
より好ましくは、通常ステレオモード又はパラメトリックステレオモードの選択は、周波数によって変わる。すなわち、周波数帯域が異なると選択も異なる。周波数が高くなると受信サイド信号の信号対ノイズ比が悪くなるので、これは有用である。
【0096】
装置2から出力できる最も良いステレオ信号を常に供給するために、異なるオペレーションモード間のスムースな切替を、その時の受信状態に動的に適合させる。信号対ノイズ比が高い場合、通常FMステレオオペレーション(PS処理に基づくノイズリダクションをしないもの)が好ましく、信号対ノイズ比が低い場合、ステレオ信号はPS処理により大幅に改善される。
【0097】
好ましくは、PSエンコーダ7のモノラルダウンミックスDMの発生は、モノラルダウンミックスDMにサイド信号からのノイズができるだけ漏れないように行わねばならない。これには、非常に低ビットレートの符号化システムで通常は利用される(MPEG−4用のMPEG−4PSエンコーダなどの)PSエンコーダで一般的に使われるものとは異なるダウンミックス方法が必要になる。これは、単純にミッド信号に一致する固定(非適応的)ダウンミックスDM=M=(L+R)/2と同じくらい簡単である。さらに、PSデコーダ8におけるアップミックスは、PSエンコーダ7で用いられる実際のダウンミックス方法に一般的には適用される。
【0098】
留意点として、図面ではPSエンコーダ7とPSデコーダ8を別々のモジュールとして示したが、効率的な実施のコンテクストでは、PSエンコーダ7とPSデコーダ8をできるだけ合体する方がもちろん有利である。
【0099】
ここに説明したコンセプトは、ISO/IEC 14496-3 (MPEG-4 Audio)標準で定義されたHE−AACv2(High-Efficiency Advanced Audio Coding version 2)エンコーダ、MPEGサラウンダに基づくエンコーダ、MPEG USAC(Unified Speech and Audio coder)に基づくエンコーダ、及びMPEG標準によりカバーされてないエンコーダなど、PS法を用いた任意のエンコーダに関して実施できる。
【0100】
以下、例として、HE−AACv2エンコーダを仮定するが、それにもかかわらず、このコンセプトはPS法を用いる任意のオーディオエンコーダに関して用いることができる。
【0101】
HE−AACはロッシー(lossy)なオーディオ圧縮方式である。HE−AACv1(HE-AAC version 1)は、スペクトルバンドレプリケーション(SBR)を用いて圧縮効率を高くしている。HE−AACv2は、さらに、パラメトリックステレオを含み、非常に低いビットレートにおけるステレオ信号の圧縮効率を高めている。HE−AACv2エンコーダは、本来的に、非常に低いビットレートで動作できるようにPSエンコーダを含む。かかるHE−AACv2エンコーダのPSエンコーダは、オーディオ処理装置2のPSエンコーダ7として用いることができる。特に、HE−AACv2エンコーダのPSエンコーダ中のPSパラメータ推定ステージは、オーディオ処理装置2のPSパラメータ推定ステージ3として用いることができる。また、HE−AACv2エンコーダのPSエンコーダ中のダウンミックスステージを、装置2のダウンミックスステージ9として用いることができる。
【0102】
よって、本明細書で説明したコンセプトは、効率的にHE−AACv2エンコーダと組み合わせて、FMステレオ無線レシーバの改善を実現することができる。かかる改善したFMステレオ無線レシーバは、HE−AACv2録音機能を有する。HE−AACv2エンコーダが、録音目的で記憶できるHE−AACv2ビットストリームを出力するからである。これは図12に示した。この実施形態では、装置2は、HE−AACv2エンコーダ16とPSデコーダ8とを有する。HE−AACv2エンコーダは、前掲の図面を参照して説明した、モノラルダウンミックスDMとPSパラメータ5を発生するのに用いるPSエンコーダ7を提供する。
【0103】
任意的に、PSエンコーダ7は、FM無線ノイズリダクションの目的に合わせて修正して、DM=(L+R)/aによるダウンミックス方式などの固定ダウンミックス方式をサポートするようにできる。
【0104】
上記の通り、モノラルダウンミックス信号DMとPSパラメータ8をPSデコーダ8に送り、ステレオ信号L′、R′を発生する。モノラルダウンミックスDMは、モノラルダウンミックスDMの知覚符号化(perceptual encoding)のためにHE−AACv1に送られる。得られた知覚符号化したオーディオ信号とPS情報は、HE−AACv2ビットストリーム18に多重化される。録音のため、HE−AACv2ビットストリーム18は、フラッシュメモリやハードディスクなどのメモリに記憶できる。
【0105】
HE−AACv1エンコーダ17は、SBRエンコーダとAACエンコーダ(図示せず)を有する。SBRエンコーダは、一般的には、QMF(quadrature mirror interbank)領域の信号処理を行い、そのためQMFサンプルを必要とする。対照的に、AACエンコーダは、一般的に、(一般的にはファクタ2でダウンサンプリングされた)時間領域のサンプルを必要とする。
【0106】
HE−AACv2エンコーダ中のPSエンコーダ7は、一般的には、すでにQMF領域のダウンミックス信号DMを供給する。
【0107】
PSエンコーダ7はHE−AACv1エンコーダにQMF領域信号DMを送信しているので、SBR分析のためのHE−AACv1エンコーダのQMF分析変換はもう使われないこのように、ダウンミックス信号DMをQMFサンプルとして提供することにより、通常はHE−AACv1エンコーダの一部であるQMF分析を回避できる。これにより、計算負荷と複雑性が減少する。
【0108】
AACエンコーダの時間領域サンプルは、例えば、時間領域で単純な計算DM=(L+R)/2を行い、時間領域信号DMをダウンサンプリングすることにより、装置2の入力から求められる。このアプローチは、おそらく最もコストがかからないアプローチだろう。あるいは、装置2は、QMF領域DMサンプルのハーフレートQMF合成を行っても良い。
【0109】
留意点として、PSエンコーダとPSデコーダは、両方が同じモジュールで実施されていれば、部分的に合体できる。
【特許請求の範囲】
【請求項1】
ミッド信号とサイド信号を含むFM無線信号を受信するように構成されたFMステレオ無線レシーバの左/右オーディオ信号又はミッド/サイドオーディオ信号を改善する装置であって、
前記左/右オーディオ信号又はミッド/サイドオーディオ信号に基づき、1つ以上のパラメトリックステレオパラメータを周波数により変化する又は周波数により変化しないで決定するように構成されたパラメトリックステレオパラメータ推定ステージと、
前記左/右オーディオ信号又は前記ミッド/サイドオーディオ信号から求めた第1のオーディオ信号と前記1つ以上のパラメトリックステレオパラメータとに基づいてステレオ信号を発生するように構成されたアップミックスステージと、を有する装置。
【請求項2】
前記第1のオーディオ信号に基づき無相関化信号を発生するように構成された無相関化器をさらに有し、
前記アップミックスステージは、
−前記第1のオーディオ信号と、
−前記1つ以上のパラメトリックステレオパラメータと、
−前記無相関化信号又はその少なくとも1つの周波数帯域と、
に基づいて前記ステレオ信号を発生するように構成された、
請求項1に記載の装置。
【請求項3】
前記システムは、さらに、
前記左/右オーディオ信号又はミッド/サイドオーディオ信号に基づき前記第1のオーディオ信号を発生するように構成されたダウンミックスステージを有する、
請求項1ないし2いずれか一項に記載の装置。
【請求項4】
前記ダウンミックスステージは、次式により前記第1のオーディオ信号を発生するように構成され、
(L+R)/a
ここでLとRは前記左/右オーディオ信号の左チャンネルと右チャンネルとを示し、aは実数である、
請求項3に記載の装置。
【請求項5】
前記第1の信号は受信ミッド信号に対応する、
請求項1ないし4いずれか一項に記載の装置。
【請求項6】
前記アップミックスステージは、
−前記第1のオーディオ信号と、
−前記1つ以上のパラメトリックステレオパラメータと、
−受信サイド信号又は残差信号である第2のオーディオ信号又はその少なくとも1つの周波数帯域と、
に基づいて前記ステレオ信号を発生するように構成された、
請求項1に記載の装置。
【請求項7】
前記ダウンミックスステージはさらに、前記左/右オーディオ信号に基づいて前記第2のオーディオ信号を求めるように構成された
請求項6に記載の装置。
【請求項8】
さらに、前記第1のオーディオ信号を受信して無相関化信号を出力する無相関化器を有し、
前記アップミックスステージは、
−前記第2のオーディオ信号、または
−前記無相関化信号、
に選択的に基づいて前記ステレオ信号を発生し、
前記選択は周波数により変化しない又は変化する、
請求項6に記載の装置。
【請求項9】
前記選択は周波数により変化する、
請求項8に記載の装置。
【請求項10】
前記アップミックスステージは、
−第1の周波数範囲の第2のオーディオ信号と、
−第2の周波数範囲の前記無相関化信号と、
を使う、
前記第1の周波数範囲の周波数は、前記第2の周波数範囲の周波数より低い、
請求項9に記載の装置。
【請求項11】
前記選択は、
前記無線受信状態を表示する無線受信インジケータ、及び/又は
前記受信サイド信号の品質を示す品質インジケータに依存する、
請求項8に記載の装置。
【請求項12】
前記1つ以上のパラメトリックステレオパラメータは、チャンネルレベル差を示すパラメータ及び/又はチャンネル間相互相関を示すパラメータを含む、
請求項1ないし11いずれか一項に記載の装置。
【請求項13】
前記第1のオーディオ信号のノイズリダクションを行うノイズリダクションステージを有し、ノイズリダクションをした前記第1のオーディオ信号は、ノイズリダクションをした前記第1のオーディオ信号と前記1つ以上のパラメトリックステレオパラメータを発生する前記アップミックスステージに送る、
請求項1ないし12いずれか一項に記載の装置。
【請求項14】
前記装置は、さらに、前記左/右オーディオ信号又はミッド/サイドオーディオ信号のノイズリダクションを行うノイズリダクションステージを有し、
ノイズリダクションをした前記左/右オーディオ信号又はミッド/サイドオーディオ信号は、前記1つ以上のパラメトリックステレオパラメータを発生するパラメトリックステレオパラメータ推定ステージに送られる、
請求項1ないし12いずれか一項に記載の装置。
【請求項15】
前記第1のオーディオ信号は、前記ノイズリダクションステージの上流の前記左/右オーディオ信号又はミッド/サイドオーディオ信号から求める、
請求項14に記載の装置。
【請求項16】
前記装置は、さらに、前記受信サイド信号のノイズパワーのノイズパラメータ特性を決定するように構成されたノイズ推定ステージを有し、
前記パラメトリックステレオパラメータ推定ステージは、前記左/右オーディオ信号又はミッド/サイドオーディオ信号と前記ノイズパラメータとに基づき、1つ以上のパラメトリックステレオパラメータを、周波数により変化する又は周波数により変化しないで決定するように構成された、
請求項1ないし15いずれか一項に記載の装置。
【請求項17】
前記装置は、前記FMステレオレシーバが前記ステレオ無線信号のモノラル出力を選択することを検知し、又は無線受信状態が悪いことを検知するように構成され、
前記FMステレオレシーバが前記ステレオ無線信号のモノラル出力を選択すること、又は受信状態が悪いことに前記装置が検知した場合、前記アップミックスステージは1つ以上のブラインドアップミックス用アップミックスパラメータを用いる、
請求項1ないし16いずれか一項に記載の装置。
【請求項18】
前記1つ以上のブラインドアップミックス用アップミックスパラメータは、1つ以上のプリセットアップミックスパラメータである、
請求項17に記載の装置。
【請求項19】
前記装置は、さらに、前記左/右オーディオ信号又はミッド/サイドオーディオ信号が主にスピーチであるか示すスピーチディテクタを有し、
前記1つ以上のブラインドアップミックス用アップミックスパラメータは、前記スピーチディテクタの表示に基づく、
請求項17に記載の装置。
【請求項20】
前記装置は、前記FMステレオレシーバが前記ステレオ無線信号のモノラル出力を選択することを検知し、又は無線受信状態が悪いことを検知するように構成され、
前記FMステレオレシーバがモノラル出力に切り替わり、又は無線受信状態が悪いとき、前記ステレオアップミックスステージは、前記パラメトリックステレオパラメータ推定ステージからの前に推定された1つ以上のパラメトリックステレオパラメータに基づく1つ以上のアップミックスパラメータを用いる、
請求項1ないし16いずれか一項に記載の装置。
【請求項21】
前記FMステレオレシーバがモノラル出力に切り替わり、又は無線受信状態が悪いとき、前記ステレオアップミックスステージは、前記パラメトリックステレオパラメータ推定ステージからの前に推定された1つ以上のパラメトリックステレオパラメータをアップミックスパラメータとして使い続ける、
請求項20に記載の装置。
【請求項22】
前記装置は無線受信状態が良いことに気がつくように構成され、
前記装置は、無線受信状態が良いことを検知すると、パラメトリックステレオモードではなくノーマルステレオモードを選択する、
請求項1ないし16いずれか一項に記載の装置。
【請求項23】
前記装置は、周波数に応じて、ノーマルステレオモードで又はパラメトリックステレオモードで選択的に動作可能である、
請求項1ないし22いずれか一項に記載の装置。
【請求項24】
前記装置は、
前記パラメトリックステレオパラメータ推定ステージを有するパラメトリックステレオエンコーダと、
前記アップミックスステージを有するパラメトリックステレオデコーダとを有する、
請求項1ないし23いずれか一項に記載の装置。
【請求項25】
前記装置はパラメトリックステレオをサポートするオーディオエンコーダを有し、前記オーディオエンコーダはパラメトリックステレオエンコーダを有し、前記パラメトリックステレオパラメータ推定ステージは前記パラメトリックステレオエンコーダの一部である、
請求項1ないし23いずれか一項に記載の装置。
【請求項26】
前記オーディオエンコーダはHE−AACv2オーディオエンコーダである、
請求項25に記載の装置。
【請求項27】
前記オーディオエンコーダはオーディオビットストリームを出力する、
請求項25に記載の装置。
【請求項28】
前記HE−AACv2エンコーダはHE−AACv2ビットストリームを出力する、
請求項26に記載の装置。
【請求項29】
前記HE−AACv2エンコーダは前記パラメトリックステレオエンコーダの下流にHE−AACv1エンコーダを有し、
前記第1のオーディオ信号は、QMF領域の信号であり、前記HE−AACv1エンコーダに送られ、
前記HE−AACv1エンコーダは前記第1のオーディオ信号のQMF分析を行わない、
請求項26に記載の装置。
【請求項30】
FMステレオ無線レシーバの左/右オーディオ信号又はミッド/サイドオーディオ信号に基づきステレオ信号を発生する装置であって、
前記FMステレオ無線レシーバはミッド信号とサイド信号を含むFM無線信号を受信するように構成され、
前記装置は、前記FMステレオレシーバが前記ステレオ無線信号のモノラル出力を選択することを検知し、又は無線受信状態が悪いことを検知するように構成され、
ステレオアップミックスステージを有し、前記FMステレオレシーバが前記ステレオ無線信号のモノラル出力を選択したこと又は受信状態が悪いことを検知した場合、前記アップミックスステージは第1のオーディオ信号と1つ以上のブラインドアップミックス用のアップミックスパラメータとに基づき、前記ステレオ信号を発生するように構成され、前記第1のオーディオ信号は前記左右オーディオ信号から又はミッド/サイドオーディオ信号から求められる、装置。
【請求項31】
前記装置は検出ステージを有し、前記検出ステージは前記FMステレオレシーバが前記ステレオ無線信号のモノラル出力を選択したことを検出するように構成された、
請求項30に記載の装置。
【請求項32】
前記装置は、さらに、スピーチディテクタを有し、前記スピーチディテクタは前記左/右オーディオ信号又はミッド/サイドオーディオ信号が主にスピーチであるか示し、
前記1つ以上のアップミックスパラメータは、前記スピーチディテクタの表示に基づく、
請求項30に記載の装置。
【請求項33】
ミッド信号とサイド信号を有するFM無線信号を受信するように構成され、請求項1ないし29いずれか一項に記載の装置を有するFMステレオ無線レシーバ。
【請求項34】
ミッド信号とサイド信号を有するFM無線信号を受信するように構成されたFMステレオレシーバと、
請求項1ないし29いずれか一項に記載の装置とを有する無線通信デバイス。
【請求項35】
ミッド信号とサイド信号を含むFM無線信号を受信するように構成されたFMステレオ無線レシーバの左/右信号又はミッド/サイドオーディオ信号を改善する方法であって、
前記左右オーディオ信号又はミッド/サイドオーディオ信号に基づき、周波数により変わる又は周波数により変わらない1つ以上のパラメトリックステレオパラメータを決定する段階と、
前記左/右オーディオ信号又は前記ミッド/サイドオーディオ信号から求めた第1のオーディオ信号と前記1つ以上のパラメトリックステレオパラメータとに基づいてステレオ信号を発生する段階と、を有する方法。
【請求項36】
前記方法は、さらに、
前記第1のオーディオ信号に基づき無相関化信号を発生する段階を有し、前記ステレオ信号は前記第1のオーディオ信号と、前記無相関化信号と、前記1つ以上のパラメトリックステレオパラメータとに基づいて前記アップミックスオペレーションにより発生される、
請求項35に記載の方法。
【請求項37】
前記方法は、さらに、
ダウンミックスオペレーションにより前記左右オーディオ信号又は前記ミッド/サイドオーディオ信号に基づいて前記第1のオーディオ信号を発生する、
請求項35に記載の方法。
【請求項38】
ミッド信号とサイド信号を含むFM無線信号を受信するように構成されたFMステレオ無線レシーバの左/右オーディオ信号又はミッド/サイドオーディオ信号に基づきステレオ信号を発生する方法であって、
前記FMステレオレシーバが前記ステレオ無線信号のモノラル出力を選択したこと又は無線受信状態が悪いことを検知する段階と、
前記FMステレオレシーバが前記ステレオ無線信号のモノラル出力を選択した又は受信状態が悪い場合、第1のオーディオ信号と1つ以上のブラインドアップミックス用のアップミックスパラメータとに基づき、前記ステレオ信号を発生する段階と、を有し、前記第1のオーディオ信号は前記左右オーディオ信号から又はミッド/サイドオーディオ信号から求められる、方法。
【請求項1】
ミッド信号とサイド信号を含むFM無線信号を受信するように構成されたFMステレオ無線レシーバの左/右オーディオ信号又はミッド/サイドオーディオ信号を改善する装置であって、
前記左/右オーディオ信号又はミッド/サイドオーディオ信号に基づき、1つ以上のパラメトリックステレオパラメータを周波数により変化する又は周波数により変化しないで決定するように構成されたパラメトリックステレオパラメータ推定ステージと、
前記左/右オーディオ信号又は前記ミッド/サイドオーディオ信号から求めた第1のオーディオ信号と前記1つ以上のパラメトリックステレオパラメータとに基づいてステレオ信号を発生するように構成されたアップミックスステージと、を有する装置。
【請求項2】
前記第1のオーディオ信号に基づき無相関化信号を発生するように構成された無相関化器をさらに有し、
前記アップミックスステージは、
−前記第1のオーディオ信号と、
−前記1つ以上のパラメトリックステレオパラメータと、
−前記無相関化信号又はその少なくとも1つの周波数帯域と、
に基づいて前記ステレオ信号を発生するように構成された、
請求項1に記載の装置。
【請求項3】
前記システムは、さらに、
前記左/右オーディオ信号又はミッド/サイドオーディオ信号に基づき前記第1のオーディオ信号を発生するように構成されたダウンミックスステージを有する、
請求項1ないし2いずれか一項に記載の装置。
【請求項4】
前記ダウンミックスステージは、次式により前記第1のオーディオ信号を発生するように構成され、
(L+R)/a
ここでLとRは前記左/右オーディオ信号の左チャンネルと右チャンネルとを示し、aは実数である、
請求項3に記載の装置。
【請求項5】
前記第1の信号は受信ミッド信号に対応する、
請求項1ないし4いずれか一項に記載の装置。
【請求項6】
前記アップミックスステージは、
−前記第1のオーディオ信号と、
−前記1つ以上のパラメトリックステレオパラメータと、
−受信サイド信号又は残差信号である第2のオーディオ信号又はその少なくとも1つの周波数帯域と、
に基づいて前記ステレオ信号を発生するように構成された、
請求項1に記載の装置。
【請求項7】
前記ダウンミックスステージはさらに、前記左/右オーディオ信号に基づいて前記第2のオーディオ信号を求めるように構成された
請求項6に記載の装置。
【請求項8】
さらに、前記第1のオーディオ信号を受信して無相関化信号を出力する無相関化器を有し、
前記アップミックスステージは、
−前記第2のオーディオ信号、または
−前記無相関化信号、
に選択的に基づいて前記ステレオ信号を発生し、
前記選択は周波数により変化しない又は変化する、
請求項6に記載の装置。
【請求項9】
前記選択は周波数により変化する、
請求項8に記載の装置。
【請求項10】
前記アップミックスステージは、
−第1の周波数範囲の第2のオーディオ信号と、
−第2の周波数範囲の前記無相関化信号と、
を使う、
前記第1の周波数範囲の周波数は、前記第2の周波数範囲の周波数より低い、
請求項9に記載の装置。
【請求項11】
前記選択は、
前記無線受信状態を表示する無線受信インジケータ、及び/又は
前記受信サイド信号の品質を示す品質インジケータに依存する、
請求項8に記載の装置。
【請求項12】
前記1つ以上のパラメトリックステレオパラメータは、チャンネルレベル差を示すパラメータ及び/又はチャンネル間相互相関を示すパラメータを含む、
請求項1ないし11いずれか一項に記載の装置。
【請求項13】
前記第1のオーディオ信号のノイズリダクションを行うノイズリダクションステージを有し、ノイズリダクションをした前記第1のオーディオ信号は、ノイズリダクションをした前記第1のオーディオ信号と前記1つ以上のパラメトリックステレオパラメータを発生する前記アップミックスステージに送る、
請求項1ないし12いずれか一項に記載の装置。
【請求項14】
前記装置は、さらに、前記左/右オーディオ信号又はミッド/サイドオーディオ信号のノイズリダクションを行うノイズリダクションステージを有し、
ノイズリダクションをした前記左/右オーディオ信号又はミッド/サイドオーディオ信号は、前記1つ以上のパラメトリックステレオパラメータを発生するパラメトリックステレオパラメータ推定ステージに送られる、
請求項1ないし12いずれか一項に記載の装置。
【請求項15】
前記第1のオーディオ信号は、前記ノイズリダクションステージの上流の前記左/右オーディオ信号又はミッド/サイドオーディオ信号から求める、
請求項14に記載の装置。
【請求項16】
前記装置は、さらに、前記受信サイド信号のノイズパワーのノイズパラメータ特性を決定するように構成されたノイズ推定ステージを有し、
前記パラメトリックステレオパラメータ推定ステージは、前記左/右オーディオ信号又はミッド/サイドオーディオ信号と前記ノイズパラメータとに基づき、1つ以上のパラメトリックステレオパラメータを、周波数により変化する又は周波数により変化しないで決定するように構成された、
請求項1ないし15いずれか一項に記載の装置。
【請求項17】
前記装置は、前記FMステレオレシーバが前記ステレオ無線信号のモノラル出力を選択することを検知し、又は無線受信状態が悪いことを検知するように構成され、
前記FMステレオレシーバが前記ステレオ無線信号のモノラル出力を選択すること、又は受信状態が悪いことに前記装置が検知した場合、前記アップミックスステージは1つ以上のブラインドアップミックス用アップミックスパラメータを用いる、
請求項1ないし16いずれか一項に記載の装置。
【請求項18】
前記1つ以上のブラインドアップミックス用アップミックスパラメータは、1つ以上のプリセットアップミックスパラメータである、
請求項17に記載の装置。
【請求項19】
前記装置は、さらに、前記左/右オーディオ信号又はミッド/サイドオーディオ信号が主にスピーチであるか示すスピーチディテクタを有し、
前記1つ以上のブラインドアップミックス用アップミックスパラメータは、前記スピーチディテクタの表示に基づく、
請求項17に記載の装置。
【請求項20】
前記装置は、前記FMステレオレシーバが前記ステレオ無線信号のモノラル出力を選択することを検知し、又は無線受信状態が悪いことを検知するように構成され、
前記FMステレオレシーバがモノラル出力に切り替わり、又は無線受信状態が悪いとき、前記ステレオアップミックスステージは、前記パラメトリックステレオパラメータ推定ステージからの前に推定された1つ以上のパラメトリックステレオパラメータに基づく1つ以上のアップミックスパラメータを用いる、
請求項1ないし16いずれか一項に記載の装置。
【請求項21】
前記FMステレオレシーバがモノラル出力に切り替わり、又は無線受信状態が悪いとき、前記ステレオアップミックスステージは、前記パラメトリックステレオパラメータ推定ステージからの前に推定された1つ以上のパラメトリックステレオパラメータをアップミックスパラメータとして使い続ける、
請求項20に記載の装置。
【請求項22】
前記装置は無線受信状態が良いことに気がつくように構成され、
前記装置は、無線受信状態が良いことを検知すると、パラメトリックステレオモードではなくノーマルステレオモードを選択する、
請求項1ないし16いずれか一項に記載の装置。
【請求項23】
前記装置は、周波数に応じて、ノーマルステレオモードで又はパラメトリックステレオモードで選択的に動作可能である、
請求項1ないし22いずれか一項に記載の装置。
【請求項24】
前記装置は、
前記パラメトリックステレオパラメータ推定ステージを有するパラメトリックステレオエンコーダと、
前記アップミックスステージを有するパラメトリックステレオデコーダとを有する、
請求項1ないし23いずれか一項に記載の装置。
【請求項25】
前記装置はパラメトリックステレオをサポートするオーディオエンコーダを有し、前記オーディオエンコーダはパラメトリックステレオエンコーダを有し、前記パラメトリックステレオパラメータ推定ステージは前記パラメトリックステレオエンコーダの一部である、
請求項1ないし23いずれか一項に記載の装置。
【請求項26】
前記オーディオエンコーダはHE−AACv2オーディオエンコーダである、
請求項25に記載の装置。
【請求項27】
前記オーディオエンコーダはオーディオビットストリームを出力する、
請求項25に記載の装置。
【請求項28】
前記HE−AACv2エンコーダはHE−AACv2ビットストリームを出力する、
請求項26に記載の装置。
【請求項29】
前記HE−AACv2エンコーダは前記パラメトリックステレオエンコーダの下流にHE−AACv1エンコーダを有し、
前記第1のオーディオ信号は、QMF領域の信号であり、前記HE−AACv1エンコーダに送られ、
前記HE−AACv1エンコーダは前記第1のオーディオ信号のQMF分析を行わない、
請求項26に記載の装置。
【請求項30】
FMステレオ無線レシーバの左/右オーディオ信号又はミッド/サイドオーディオ信号に基づきステレオ信号を発生する装置であって、
前記FMステレオ無線レシーバはミッド信号とサイド信号を含むFM無線信号を受信するように構成され、
前記装置は、前記FMステレオレシーバが前記ステレオ無線信号のモノラル出力を選択することを検知し、又は無線受信状態が悪いことを検知するように構成され、
ステレオアップミックスステージを有し、前記FMステレオレシーバが前記ステレオ無線信号のモノラル出力を選択したこと又は受信状態が悪いことを検知した場合、前記アップミックスステージは第1のオーディオ信号と1つ以上のブラインドアップミックス用のアップミックスパラメータとに基づき、前記ステレオ信号を発生するように構成され、前記第1のオーディオ信号は前記左右オーディオ信号から又はミッド/サイドオーディオ信号から求められる、装置。
【請求項31】
前記装置は検出ステージを有し、前記検出ステージは前記FMステレオレシーバが前記ステレオ無線信号のモノラル出力を選択したことを検出するように構成された、
請求項30に記載の装置。
【請求項32】
前記装置は、さらに、スピーチディテクタを有し、前記スピーチディテクタは前記左/右オーディオ信号又はミッド/サイドオーディオ信号が主にスピーチであるか示し、
前記1つ以上のアップミックスパラメータは、前記スピーチディテクタの表示に基づく、
請求項30に記載の装置。
【請求項33】
ミッド信号とサイド信号を有するFM無線信号を受信するように構成され、請求項1ないし29いずれか一項に記載の装置を有するFMステレオ無線レシーバ。
【請求項34】
ミッド信号とサイド信号を有するFM無線信号を受信するように構成されたFMステレオレシーバと、
請求項1ないし29いずれか一項に記載の装置とを有する無線通信デバイス。
【請求項35】
ミッド信号とサイド信号を含むFM無線信号を受信するように構成されたFMステレオ無線レシーバの左/右信号又はミッド/サイドオーディオ信号を改善する方法であって、
前記左右オーディオ信号又はミッド/サイドオーディオ信号に基づき、周波数により変わる又は周波数により変わらない1つ以上のパラメトリックステレオパラメータを決定する段階と、
前記左/右オーディオ信号又は前記ミッド/サイドオーディオ信号から求めた第1のオーディオ信号と前記1つ以上のパラメトリックステレオパラメータとに基づいてステレオ信号を発生する段階と、を有する方法。
【請求項36】
前記方法は、さらに、
前記第1のオーディオ信号に基づき無相関化信号を発生する段階を有し、前記ステレオ信号は前記第1のオーディオ信号と、前記無相関化信号と、前記1つ以上のパラメトリックステレオパラメータとに基づいて前記アップミックスオペレーションにより発生される、
請求項35に記載の方法。
【請求項37】
前記方法は、さらに、
ダウンミックスオペレーションにより前記左右オーディオ信号又は前記ミッド/サイドオーディオ信号に基づいて前記第1のオーディオ信号を発生する、
請求項35に記載の方法。
【請求項38】
ミッド信号とサイド信号を含むFM無線信号を受信するように構成されたFMステレオ無線レシーバの左/右オーディオ信号又はミッド/サイドオーディオ信号に基づきステレオ信号を発生する方法であって、
前記FMステレオレシーバが前記ステレオ無線信号のモノラル出力を選択したこと又は無線受信状態が悪いことを検知する段階と、
前記FMステレオレシーバが前記ステレオ無線信号のモノラル出力を選択した又は受信状態が悪い場合、第1のオーディオ信号と1つ以上のブラインドアップミックス用のアップミックスパラメータとに基づき、前記ステレオ信号を発生する段階と、を有し、前記第1のオーディオ信号は前記左右オーディオ信号から又はミッド/サイドオーディオ信号から求められる、方法。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【公表番号】特表2013−504908(P2013−504908A)
【公表日】平成25年2月7日(2013.2.7)
【国際特許分類】
【出願番号】特願2012−528263(P2012−528263)
【出願日】平成22年9月7日(2010.9.7)
【国際出願番号】PCT/EP2010/005481
【国際公開番号】WO2011/029570
【国際公開日】平成23年3月17日(2011.3.17)
【出願人】(511105997)ドルビー インターナショナル アーベー (16)
【Fターム(参考)】
【公表日】平成25年2月7日(2013.2.7)
【国際特許分類】
【出願日】平成22年9月7日(2010.9.7)
【国際出願番号】PCT/EP2010/005481
【国際公開番号】WO2011/029570
【国際公開日】平成23年3月17日(2011.3.17)
【出願人】(511105997)ドルビー インターナショナル アーベー (16)
【Fターム(参考)】
[ Back to top ]