説明

音声信号送信装置、音声信号受信装置及びその方法

【課題】多チャネルの音声信号を圧縮する前に、基準音声信号を基準として基準音声信号以外の音声信号の容量を減少させて、圧縮効率を高めることができ、時間も減らすことができる。また、無損失圧縮を基準に1%乃至3%の圧縮効率を得ることができる音声信号送信装置及びその方法を提供する。
【解決手段】複数のマイクからの音声信号をそれぞれ抽出する抽出部、多チャネルの音声信号のパワーをそれぞれ算出し、多チャネルの音声信号のうちいずれか一つの音声信号を基準音声信号に設定するパワー算出部、基準音声信号に基づいて、基準音声信号以外の音声信号の同期を調節する同期調節部、同期が調節された基準音声信号以外の音声信号から基準音声信号をそれぞれ相殺させて、抽出信号をそれぞれ生成する信号生成部、基準音声信号とそれぞれの抽出信号を圧縮する信号圧縮部、圧縮された基準音声信号とそれぞれの抽出信号とを送信する送信部、を含む。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声信号を圧縮して送信し、受信した音声信号を復元する音声信号送信装置、音声信号受信装置及びその方法に関するものである。
【背景技術】
【0002】
一般に音声信号送信装置は、音声信号が音源によって励振された共鳴系の出力と見なされることに着眼して、音声信号を音源及び共鳴系の特性を示す複数のパラメータに分解して伝送し、音声信号受信装置は、これらパラメータによって元の音声信号を合成する。
【0003】
音声信号送信装置及び音声信号受信装置は、フレーム単位で音声信号をエンコーディング及びデコーディングするコーデックを含み、このようなコーデックのうち、例えば、G.729コーデックは、フレーム部からフレームの入力を受けて、10ms単位で音声信号のエンコーディング及びデコーディングを行う。
【0004】
ここで、フレーム部は、外部から8kHzで連続的に伝送される各サンプルを10ms単位に分割し、このように分割された一つのフレームの80個のサンプルをG.729コーデックに入力信号として提供する。
【0005】
このようなG.729コーデックは、DSP(Digital Signal Processor)を用いて実現されることもできる。
【0006】
この場合、DSPのメモリ構造は、処理するチャネル数に対応する実行コードを生成して格納するコード部と、プログラム活用空間として、広域変数、各チャネルバッファスタックなどを格納するデータ部と、からなる。
【0007】
このようなコーデックでは、DSPの処理能力によって、実現可能なチャネルの数が決定され、DSPで処理できるチャネルの数が増加する場合には、チャネル数に対応する実行コードを生成しなければならないので、必要なメモリの量も増加することになる。
【0008】
また、多チャネルの音声信号圧縮の際に損失圧縮データが必要とされる場合や、性能を最大化するために無損失データが必要とされる場合、マイクロホンの数だけ伝送しようとする音声データの信号の量が大きくなる。
【0009】
さらに、多チャネルマイクロホンを通じて音声信号を収集するとき、マイクロホン間の位置や特性によって音声信号の同期が取れず、音声信号間のパワーが相違するため、圧縮が容易ではなく、圧縮効率が低いという問題がある。
【発明の概要】
【発明が解決しようとする課題】
【0010】
一側面は、複数のマイクロホン間の相関関係を用いて、多チャネル音声信号のパワー及び同期を調節した後、圧縮して送信する音声信号送信装置及びその方法を提供する。
【0011】
他の側面は、受信した音声信号を、パワー係数及び同期係数を用いて復元する音声信号受信装置及びその方法を提供する。
【課題を解決するための手段】
【0012】
一側面に係る音声信号送信装置は、複数のマイクロホンから収集された音源信号から音声信号をそれぞれ抽出する抽出部と;多チャネルの音声信号のパワーをそれぞれ算出し、多チャネルの音声信号のうちいずれか一つの音声信号を基準音声信号に設定するパワー算出部と;基準音声信号に基づいて、基準音声信号以外の音声信号の同期を調節する同期調節部と;同期が調節された基準音声信号以外の音声信号から基準音声信号をそれぞれ相殺させて、抽出信号をそれぞれ生成する信号生成部と;基準音声信号とそれぞれの抽出信号を圧縮する信号圧縮部と;圧縮された基準音声信号とそれぞれの抽出信号とを送信する送信部と;を含む。信号圧縮部は、圧縮した基準音声信号とそれぞれの抽出信号を、暗号化してもよい。
【0013】
パワー算出部は、多チャネルの音声信号のうち、パワーが最も大きい音声信号を基準音声信号に設定する。パワー算出部は、基準音声信号以外の音声信号のパワーのそれぞれと、基準音声信号のパワーとの割合に基づいて、基準音声信号以外の音声信号にそれぞれ対応するパワー係数を算出する。
【0014】
信号生成部は、基準音声信号以外の音声信号に対応するパワー係数を基準音声信号にそれぞれ反映して、基準音声信号以外の音声信号に対応する相殺信号をそれぞれ生成し、基準音声信号以外の音声信号からそれぞれ対応する相殺信号を相殺させて、抽出信号をそれぞれ生成する。
【0015】
信号生成部は、基準音声信号以外の音声信号のパワーから基準音声信号のパワーをそれぞれ差し引いて相殺させる。信号圧縮部は、それぞれの抽出信号別に基準音声信号を収集したマイクロホンの情報、自身の抽出信号、マイクロホン情報、パワー係数及び同期係数をそれぞれ圧縮する。
【0016】
同期調節部は、基準音声信号が収集されたマイクロホンと基準音声信号以外の音声信号が収集されたマイクロホンとの距離にそれぞれ基づいて、基準音声信号以外の音声信号の同期係数をそれぞれ算出し、それぞれ算出された同期係数に基づいて、基準音声信号以外の音声信号の同期をそれぞれ調節する。同期調節部は、複数のマイクロホン間の相関関係を用いて、基準音声信号以外の音声信号の同期をそれぞれ調節する。
【0017】
他の側面に係る音声信号受信装置は、多チャネルの信号を受信する受信部と;受信した多チャネルの信号を基準音声信号と少なくとも一つの抽出信号に復号化する復号化部と;復号化された少なくとも一つの抽出信号のパワーを復元して、音声信号に復元するパワー復元部と;パワーが復元された少なくとも一つの音声信号の同期を復元する同期復元部と;基準音声信号と、パワー及び同期が復元された少なくとも一つの音声信号をマルチプレクシングするマルチプレクシング部と;マルチプレクシングされた音声信号を出力する出力部と;を含む。
【0018】
受信部は、受信した信号から基準音声信号と少なくとも一つの抽出信号を復号化部に伝達し、少なくとも一つの抽出信号の情報をパワー復元部及び同期復元部に伝達する。
【0019】
復号化部は、受信した多チャネルの信号のヘッダをパーシング(parsing)して、基準音声信号と抽出信号とを区分する。
【0020】
少なくとも一つの抽出信号の情報は、基準音声信号が収集されたマイクロホンの情報、自身のマイクロホン情報、パワー係数及び同期係数を含む。
【0021】
パワー復元部は、パワー係数を用いて、抽出信号のパワーを復元して、音声信号に復元する。同期復元部は、パワーが復元された音声信号の同期を、同期係数を用いて復元する。
【0022】
また他の側面に係る音声信号送信方法は、複数のマイクロホンから音源信号を収集し、収集された音源信号から音声信号をそれぞれ抽出し、多チャネルの音声信号のパワーをそれぞれ算出し、多チャネルの音声信号のうちいずれか一つの音声信号を基準音声信号に設定し、基準音声信号に基づいて基準音声信号以外の音声信号の同期を調節し、同期が調節された基準音声信号以外の音声信号から基準音声信号をそれぞれ相殺させて、抽出信号をそれぞれ生成し、基準音声信号とそれぞれの抽出信号を圧縮し、圧縮された基準音声信号とそれぞれの抽出信号を送信する。送信前に、圧縮された基準音声信号とそれぞれの抽出信号を暗号化してもよい。
【0023】
基準音声信号に設定するのは、多チャネルの音声信号のうち、パワーが最も大きい音声信号を基準音声信号に設定することを含む。
【0024】
抽出信号をそれぞれ生成するのは、基準音声信号以外の音声信号のパワーのそれぞれと、基準音声信号のパワーとの割合に基づいて、基準音声信号以外の音声信号にそれぞれ対応するパワー係数を算出し、基準音声信号以外の音声信号に対応するパワー係数を基準音声信号にそれぞれ反映して、基準音声信号以外の音声信号に対応する相殺信号をそれぞれ生成し、基準音声信号以外の音声信号からそれぞれ対応する相殺信号を相殺させて、抽出信号をそれぞれ生成することを含む。
【0025】
基準音声信号とそれぞれの抽出信号を圧縮するのは、それぞれの抽出信号別に基準音声信号が収集されたマイクロホンの情報、自身の抽出信号、自身のマイクロホン情報、自身のパワー係数及び自身の同期係数をそれぞれ圧縮することを含む。
【0026】
基準音声信号以外の音声信号の同期を調節するのは、基準音声信号が収集されたマイクロホンと、基準音声信号以外の音声信号が収集されたマイクロホンとの距離にそれぞれ基づいて、基準音声信号以外の音声信号の同期係数をそれぞれ算出し、それぞれ算出された同期係数に基づいて、基準音声信号以外の音声信号の同期をそれぞれ調節することを含む。
【0027】
また他の側面に係る音声信号受信方法は、多チャネルの信号を受信し、受信した多チャネルの信号を復号化して、基準音声信号、少なくとも一つの抽出信号及び少なくとも一つの抽出信号の情報を生成し、少なくとも一つの抽出信号の情報に基づいて、少なくとも一つの抽出信号のパワー及び同期を復元する。
【0028】
また他の側面に係る音声信号受信方法は、基準音声信号とパワー及び同期が復元された少なくとも一つの音声信号とをマルチプレクシングし、マルチプレクシングされた音声信号を出力することをさらに含む。
【0029】
少なくとも一つの抽出信号の情報は、基準音声信号が収集されたマイクロホンの情報、自身のマイクロホン情報、パワー係数及び同期係数を含む。
【0030】
パワーを復元するのは、パワー係数を用いて、抽出信号のパワーを復元することを含む。同期を復元するのは、同期係数を用いて、パワーが復元された音声信号の同期を復元することを含む。パワー係数は、基準音声信号のパワーと少なくとも一つの音声信号のパワーとの割合である。
【発明の効果】
【0031】
一側面によれば、多チャネルの音声信号を圧縮する前に、基準音声信号を基準として基準音声信号以外の音声信号の容量を減少させて、圧縮効率を高めることができ、時間も減らすことができる。
【0032】
また、無損失圧縮を基準に1%乃至3%の圧縮効率を得ることができる。
【図面の簡単な説明】
【0033】
【図1】一実施例に係る音声信号送信装置及び音声信号受信装置の構成図である。
【図2】一実施例に係る音声信号送信装置の詳細構成図である。
【図3】一実施例に係る音声信号受信装置の詳細構成図である。
【図4】一実施例に係る音声信号送信方法のフローチャートである。
【図5】一実施例に係る音声信号送信の前の抽出信号生成の例示図である。
【図6】一実施例に係る音声信号受信方法のフローチャートである。
【図7】一実施例に係る音声信号受信の後の音声信号復元の例示図である。
【発明を実施するための形態】
【0034】
以下では、添付の図面を参照して、本発明について詳細に説明する。
【0035】
図1は、一実施例に係る音声信号送信装置及び音声信号受信装置の構成図で、図2は、一実施例に係る音声信号送信装置の詳細構成図で、図3は、一実施例に係る音声信号受信装置の詳細構成図である。
【0036】
音声信号送信装置100と音声信号受信装置200は、互いに異なる端末機内に位置可能であり、互いに異なる端末機内で、ネットワークを介して、モニタリング及び音声認識などのための音声信号を送受信する。
【0037】
例えば、多チャネルマイクを有したロボット(端末)で音声信号の入力を受けて、多チャネル音声信号を処理するための遠隔地のベースステーション(Base Station)と遠隔クライアント(Remote Client)に送る。
【0038】
この時、音声信号送信装置100は、音声信号送受信の際の円滑な音声信号の送受信のために、音声信号を圧縮して伝送し、音声信号受信装置200は、圧縮された音声信号を受信して、圧縮された音声信号を復元する。
【0039】
すなわち、音声信号送信装置100は、音源を収集し、収集された音源から音声信号を抽出した後、抽出された音声信号を圧縮及び必要に応じて暗号化して音声信号受信装置200に伝送する。
【0040】
そして、音声信号受信装置200は、圧縮及び必要に応じて暗号化された音声信号を受信すると、受信した音声信号の復号化及び復元を行い、復号化及び復元された音声信号を外部に出力する。
【0041】
図1に示すように、音声信号送信装置100は、収集部110、抽出部120、圧縮部130及び送信部140を含む。収集部110は、互いに一定間隔を置いて設けられた複数のマイクロホン111〜114を含む。ここで、複数のマイクロホン111〜114は、音波または超音波を受けて、その振動による電気信号を発生する装置であって、ここでの電気信号は音源信号である。
【0042】
複数のマイクロホン間の一定間隔は予め格納されており、複数のマイクロホン間の位置情報が予め格納されていることも可能である。このような複数のマイクロホン111〜114は、周辺の音源を収集し、収集された音源の信号を抽出部120に伝送する。抽出部120は、複数のマイクロホン111〜114を介して伝達された多チャネルの音源信号から音声信号を抽出する。圧縮部130は、多チャネルの音声信号のうちいずれか一つのチャネルの音声信号を基準音声信号に設定し、基準音声信号と残りの音声信号(すなわち多チャネルの音声信号のうちの基準音声信号以外の音声信号)との相関関係に基づいて、残りの音声信号の容量を減少させ、基準音声信号と容量が減少された残りの音声信号の圧縮及び必要に応じて暗号化を行う。
【0043】
送信部140は、圧縮及び必要に応じて暗号化された基準音声信号と、変化された残りの音声信号を、音声信号受信装置200に送信する。
【0044】
図2を参照して、圧縮部130をより具体的に説明する。圧縮部130は、パワー算出部131、同期調節部132、信号生成部133及び信号圧縮部134を含む。パワー算出部131は、多チャネルの音声信号のパワーをそれぞれ算出し、多チャネルの音声信号のうちいずれか一つのチャネルの音声信号を基準音声信号に設定し、基準音声信号のパワーと残りの音声信号のパワーとの間の割合に基づいて、パワー係数をそれぞれ算出する。ここで、基準音声信号は、例えば、多チャネルの音声信号のうち、パワーが最も大きい音声信号である。
【0045】
例えば、第1マイクロホンから収集された第1音声信号、第2マイクロホンから収集された第2音声信号、第3マイクロホンから収集された第3音声信号、第4マイクロホンから収集された第4音声信号が存在する場合、第1音声信号、第2音声信号、第3音声信号、第4音声信号のパワーを算出し、このうちパワーが最も大きい音声信号を基準音声信号に設定する。
【0046】
さらに、基準音声信号は、基準マイクロホンを予め設定し、該基準マイクロホンから収集された音声信号を基準音声信号に設定することも可能で、パワーが最も小さい音声信号を基準音声信号に設定することも可能である。
【0047】
ここで、パワー算出は、例えば、平均二乗パワー(Mean Square Power)を用いて算出する。この時、第1音声信号が基準音声信号だと仮定すると、第1音声信号に対する第1パワー係数は1になり、第2音声信号に対する第2パワー係数は、基準音声信号のパワーと第2音声信号のパワーとの割合になり、第3音声信号に対する第3パワー係数は、基準音声信号のパワーと第3音声信号のパワーとの割合になり、第4音声信号に対する第4パワー係数は、基準音声信号のパワーと第4音声信号のパワーとの割合になる。
【0048】
パワー算出部131は、マイクロホンの音声信号、基準音声信号及び残りの音声信号のパワー係数を伝達する。
【0049】
同期調節部132は、基準音声信号に基づいて残りの音声信号の同期を調節する(すなわち、基準音声信号と、基準音声信号以外の音声信号とを同期させる)。同期調節部132は、各音声信号の間の相関関係(correlation)を用いて同期を合せる。
【0050】
さらに、それぞれ音声信号間の差を用いて最小差値を算出し、これを用いて同期係数を算出してもよく、マイクロホン間の距離に基づいて同期係数を算出してもよい。
【0051】
同期調節部132は、基準音声信号が収集されたマイクロホンを基準として同期テーブルを作り、該同期テーブルに基づいて残りの音声信号の同期を調節する。
【0052】
信号生成部133は、基準音声信号に各パワー係数を適用して、相殺信号をそれぞれ生成する。すなわち、相殺信号は、残りの音声信号にそれぞれ対応するパワー係数を用いて、基準音声信号を変化させたものである。
【0053】
例えば、第2音声信号から基準音声信号を相殺させようとするとき、基準音声信号と第2音声信号のパワーが異なると、第2パワー係数を用いて基準音声信号のパワーを調節することによって、基準音声信号のパワーが第2音声信号のパワーに対応するようにする。このような過程によって基準音声信号のパワーが調節された相殺信号を、第2音声信号から差し引いて抽出信号を獲得する。
【0054】
すなわち、信号生成部133は、残りの音声信号から各相殺信号を差し引いて、新しい信号を生成する。ここで、新しい信号は、残りの音声信号から相殺信号を差し引いた後抽出された信号であって、すなわち、抽出信号という。
【0055】
信号圧縮部134は、それぞれのチャネル別に基準音声信号とそれぞれの抽出信号を圧縮及び必要に応じて暗号化する。この時、それぞれのチャネル別に自身の抽出信号と情報を伝送し、この時、情報には基準音声信号が収集された基準マイクロホンの情報、自身のマイクロホン情報、自身のパワー係数、自身の同期係数などがあり、各情報を集めて、一つのパケットで伝達する。
【0056】
図1に示すように、音声信号受信装置200は、受信部210、復元部220、マルチプレクシング部230、出力部240及び複数のスピーカー250(251、252)を含む。受信部210は、音声信号送信装置100から伝送された多チャネルの基準音声信号、少なくとも一つの抽出信号及び抽出信号の情報を受信し、受信した基準音声信号と少なくとも一つの抽出信号を復号化部221に伝送し、受信した抽出信号の情報をパワー復元部222及び同期復元部223に伝送する。
【0057】
復元部220は、圧縮された多チャネルの基準音声信号と少なくとも一つの抽出信号の圧縮を解凍し、圧縮が解凍された一つの抽出信号のパワー及び同期を復元して、少なくとも一つの音声信号を生成する。
【0058】
マルチプレクシング部230は、多重チャネルの音声信号を、一つのチャネルを介して同時に伝達する。すなわち、マルチプレクシング部230は、基準音声信号と、少なくとも一つの音声信号のマルチプレクシングを行う。出力部240は、マルチプレクシングされた音声信号が出力されるようにする。このような出力部240は、デジタルの音声信号をアナログの音声信号に変換させ、変換されたアナログの音声信号を増幅することも可能である。
【0059】
スピーカー250(251、252)は、電気信号を振動板の振動に変え、空気に疎密波を発生させて、音波を放射する装置であって、ここで、電気信号は復元された音声信号である。
【0060】
図3を参照して、復元部220をより具体的に説明する。復元部220は、復号化部221、パワー復元部222、同期復元部223を含む。復号化部221は、受信部210から伝達された多チャネルの基準音声信号と少なくとも一つの抽出信号の圧縮を解凍する。
【0061】
パワー復元部222は、受信部210から伝達された抽出信号の情報のうち、パワー係数を用いて、少なくとも一つの抽出信号のパワーを復元して、音声信号に復元する。この時、基準音声信号にパワー係数を適用して、追加信号を生成させて、少なくとも一つの音声信号に追加信号を合算して、音声信号に復元する。
【0062】
同期復元部223は、受信部210から伝達された抽出信号の情報のうち、同期係数を用いて、少なくとも一つの音声信号の同期を復元する。この時、少なくとも一つの音声信号は、最初シフトされた同期係数だけ移動する。
【0063】
図4は、一実施例に係る音声送信方法のフローチャートであって、図5を参照して説明する。まず、音声信号送信装置は、互いに一定間隔を置いて設けられた複数のマイクロホン111〜114を通じて周辺の音源信号を収集する(201)。次に、音声信号送信装置は、多チャネルの音源信号から音声信号をそれぞれ抽出し(202)、多チャネルの音声信号のパワーをそれぞれ算出し(203)、多チャネルの音声信号のうちいずれか一つのチャネルの音声信号を基準音声信号に設定する(204)。次に、音源信号送信装置は、基準音声信号のパワーと残りの音声信号のパワーとの間の割合に基づいて、パワー係数をそれぞれ算出する。
【0064】
例えば、p1が基準音声信号のパワー係数であれば、それぞれのパワー係数p2、p3、p4は、次の通りである。
【0065】
第2音声信号のパワー係数p2=第2音声信号のパワー/基準音声信号のパワー
第3音声信号のパワー係数p3=第3音声信号のパワー/基準音声信号のパワー
第4音声信号のパワー係数p4=第4音声信号のパワー/基準音声信号のパワー
ここで、各音声信号のパワーは、平均二乗パワー(Mean Square Power)を用いて算出した値で、各音声信号のパワーは整数で表現する。
【0066】
次に、音声信号送信装置は、各音声信号の間の相関関係を用いて同期を合せる。このとき、基準音声信号を基準として、残りの音声信号の同期を調節する(205)。ここで、同期とは、マイクロホンの距離によるディレイ時間を合せるためのものである。
【0067】
この同期係数は、最小差値や相関関係を用いて求め、求められた同期係数によって周期的同期(Cyclic Sync)を合せる。この時、同期係数によって調節された音声信号のうち、同期調節によって除去された最初の音声信号は最後の信号に連結する。
【0068】
実際に測定値を求めてみると、線形マイクロホンにおいて正面での信号は同期0であり、側面のマイクロホンや円形マイクロホンの同期は、解像度によって異なるが、正面のマイクロホンの同期よりも小さい係数を有する。
【0069】
マイクロホンが4つである状態で、第1音声信号が基準音声信号である場合、残りの音声信号の同期調節された信号は、次の通りである。
【0070】
同期調節された第2音声信号=第2音声信号+s2(cyclic)
同期調節された第3音声信号=第3音声信号+s3(cyclic)
同期調節された第4音声信号=第4音声信号+s4(cyclic)
ここで、s2、s3、s4は、基準音声信号である第1音声信号に基づいて調節された同期係数である。次に、音声信号送信装置は、基準音声信号に各パワー係数を適用して、相殺信号をそれぞれ生成する。すなわち、相殺信号は、残りの音声信号にそれぞれ対応するパワー係数に基づいて、基準音声信号を変化させたものである。
【0071】
次に、音声信号送信装置は、残りの音声信号から各相殺信号を差し引いて、新しい抽出信号をそれぞれ生成する(206)。ここで、新しい抽出信号は、残りの音声信号から相殺信号を差し引いた後抽出された信号である。
【0072】
例えば、マイクロホンが4つである状態で、第1音声信号が基準音声信号である場合、残りの音声信号に対応する抽出信号を生成する過程は、次の通りである。
【0073】
第2抽出信号=同期調節された第2音声信号−(第2パワー係数*基準音声信号)
第3抽出信号=同期調節された第3音声信号−(第3パワー係数*基準音声信号)
第4抽出信号=同期調節された第4音声信号−(第4パワー係数*基準音声信号)
次に、音声信号送信装置は、それぞれのチャネル別に基準音声信号とそれぞれの抽出信号を圧縮する(207)。音声信号送信装置は、圧縮する前に、圧縮と同時に、または圧縮後に、基準音声信号とそれぞれの抽出信号をさらに暗号化してもよい。この時、基準音声信号、それぞれの抽出信号、各抽出信号の情報を共に圧縮する。ここで、抽出信号の情報は、自身のマイクロホン番号、基準音声データが収集されたマイクロホン番号、パワー係数、同期係数を含み、これを一つのパケットで伝送する。
【0074】
また、基準音声信号と自身のマイクロホン番号と自身のパワー係数、同期係数を共に伝送する。
【0075】
次に、音声信号送信装置は、圧縮された基準音声信号と各抽出信号を、音声信号受信装置200に送信する(208)。ここで、抽出信号の生成を、図5を参照して、より具体的に説明する。
【0076】
第1チャネル(CH1)のマイクロホンを通じて第1音声信号を収集し、また、第2チャネル(CH2)のマイクロホンを通じて第2音声信号を収集する。
【0077】
ここで、第1チャネル(CH1)のマイクロホンを通じて収集された第1音声信号は、図5の(a)に示されたようであり、第2チャネル(CH2)のマイクロホンを通じて収集された第2音声信号は、図5の(b)に示されたようである。
【0078】
次に、第1音声信号のパワーと第2音声信号のパワーを算出する。ここで、各音声信号のパワーは、平均二乗パワー(Mean Square Power)を用いて算出する値であって、整数で表現する。この時、第1音声信号のパワーは、次の通りである。
【0079】
【数1】

第2音声信号のパワーは、次の通りである。
【0080】
【数2】

第1音声信号のパワーは7であり、第2音声信号のパワーは5で、第1音声信号のパワーより第2音声信号のパワーが小さいので、第1音声信号を基準音声信号に設定し、第2チャネル(CH2)のマイクロホンを通じて収集された第2音声信号を抽出信号に変化させる。
【0081】
まず、図5の(c)に示されたように、基準音声信号を基準に第2音声信号の同期を調節する。すなわち、基準音声信号と第2音声信号の波形が最大限一致するようにするために、第2音声信号を1/4周期だけ左側にシフトする。
【0082】
次に、パワー係数を算出する。このとき、パワー係数は、基準音声信号のパワーと第2音声信号のパワーとの割合で、5/7である。次に、図5(a)に示された第1チャネル(CH1)信号である基準音声信号の各値に5/7を適用して、相殺信号を生成する。ここで、相殺信号は整数で表現可能である。図5(d)に示されたように、相殺信号は、0、7、0、−7、0、7、0、−7、0の値を有する。
【0083】
即ち、基準音声信号と第2音声信号との間のパワーが異なると、基準音声信号のパワーが第2音声信号のパワーに対応するように、基準音声信号にパワー係数を適用して、基準音声信号の各値を調節する。この時、パワー係数によって各値が調節された基準音声信号は、相殺信号になる。
【0084】
次に、図5の(e)に示されたように、同期調節された第2音声信号から相殺信号を差し引いて、抽出信号を生成する。この時、抽出信号は、1(=1−0)、0(=7−7)、−1(=−1−0)、1(=−6−(−7))、2(=2−0)、−2(=5−7)、1(=−1−0)、0(=−7−(−7))、−8(=−8−0)の値を有する。
【0085】
図6は、一実施例に係る音声信号受信方法のフローチャートであって、図7を参照して説明する。音声信号受信装置は、音声信号送信装置100から伝送された多チャネルの基準音声信号、少なくとも一つの抽出信号及び抽出信号の情報を受信し(301)、受信した多チャネルの基準音声信号と少なくとも一つの抽出信号の圧縮を解凍し、圧縮が解凍された基準音声信号と少なくとも一つの抽出信号を復号化する(302)。この時、多チャネルの基準音声信号と、少なくとも一つの抽出信号、抽出信号の情報が生成される。
【0086】
さらに、音声信号受信装置は、受信した信号のヘッダをパーシングして、基準音声信号と抽出信号を判別する。そして、基準音声信号は、圧縮を解凍した後マルチプレクシング部にそのまま送って処理する。
【0087】
次に、音声信号受信装置は、抽出信号の情報のうちパワー係数を用いて、少なくとも一つの抽出信号のパワーを復元することで(303)、少なくとも一つの音声信号に生成し、抽出信号の情報のうち同期係数を用いて、パワーが復元された少なくとも一つの音声信号の同期を復元することで(304)、最初音声信号に復元されるようにする。この時、少なくとも一つの音声信号は、音声信号送信装置100で最初シフトされた同期係数だけ移動する。
【0088】
例えば、4つのマイクロホンを通じて音源を収集した場合、第1音声信号が基準信号であれば、第2、3、4音声信号に対応した抽出信号のパワー復元信号と同期復元信号は、次の通りである。
【0089】
第2パワー復元信号=第2抽出信号+第2パワー係数*基準マイク信号
第3パワー復元信号=第3抽出信号+第3パワー係数*基準マイク信号
第4パワー復元信号=第4抽出信号+第4パワー係数*基準マイク信号
第2同期復元信号=第2パワー復元信号−s2(cyclic)
第3同期復元信号=第3パワー復元信号−s3(cyclic)
第4同期復元信号=第4パワー復元信号−s4(cyclic)
ここで、s2、s3、s4は、基準音声信号である第1音声信号に基づいて調節された同期係数である。
【0090】
次に、音声信号受信装置は、多重チャネルの基準音声信号と、少なくとも一つの音声信号のマルチプレクシングを行い(305)、マルチプレクシングされた音声信号が少なくても一つのスピーカーを通じて出力されるようにする(306)。
【0091】
少なくとも一つの抽出信号を復元する構成を、図7を参照して具体的に説明する。
【0092】
図7の(a)に示されたように、抽出信号を受信すると、図7の(b)に示されたように、基準音声信号に抽出信号の情報のうちパワー係数を適用させて、追加信号を生成し、生成された追加信号を抽出信号に合算する。次に、図7の(c)に示されたように、同期係数を用いて音声信号をシフトさせて、同期を復元する。
【0093】
このように、多チャネルの音声信号を圧縮する前に、基準音声信号を基準に残りの音声信号の容量を減少させて、圧縮効率を高めることができ、時間も減らすことができ、復元が容易である。
【符号の説明】
【0094】
100 音声信号送信装置
110 収集部
120 抽出部
130 圧縮部
140 送信部
200 音声信号受信装置
210 受信部
220 復元部
230 マルチプレクシング部
240 出力部
250 スピーカー

【特許請求の範囲】
【請求項1】
複数のマイクロホンから収集された音源信号から音声信号をそれぞれ抽出する抽出部と、
多チャネルの音声信号のパワーをそれぞれ算出し、前記多チャネルの音声信号のうちいずれか一つの音声信号を基準音声信号に設定するパワー算出部と、
前記基準音声信号に基づいて、前記基準音声信号以外の音声信号の同期を調節する同期調節部と、
前記同期が調節された前記基準音声信号以外の音声信号から前記基準音声信号をそれぞれ相殺させて、抽出信号をそれぞれ生成する信号生成部と、
前記基準音声信号とそれぞれの抽出信号を圧縮する信号圧縮部と、
前記圧縮された基準音声信号とそれぞれの抽出信号とを送信する送信部と、を含む、音声信号送信装置。
【請求項2】
前記パワー算出部は、
前記多チャネルの音声信号のうち、パワーが最も大きい音声信号を基準音声信号に設定する、請求項1に記載の音声信号送信装置。
【請求項3】
前記パワー算出部は、
前記基準音声信号以外の音声信号のパワーのそれぞれと、前記基準音声信号のパワーとの割合に基づいて、前記基準音声信号以外の音声信号にそれぞれ対応するパワー係数を算出する、請求項1に記載の音声信号送信装置。
【請求項4】
前記信号生成部は、
前記基準音声信号以外の音声信号に対応するパワー係数を前記基準音声信号にそれぞれ反映して、前記基準音声信号以外の音声信号に対応する相殺信号をそれぞれ生成し、前記基準音声信号以外の音声信号から前記それぞれ対応する相殺信号をそれぞれ相殺させて、抽出信号をそれぞれ生成する、請求項3に記載の音声信号送信装置。
【請求項5】
前記信号生成部は、
前記基準音声信号以外の音声信号のパワーから前記基準音声信号のパワーをそれぞれ差し引いて相殺させる、請求項1に記載の音声信号送信装置。
【請求項6】
前記信号圧縮部は、
それぞれの抽出信号別に前記基準音声信号を収集したマイクロホンの情報、自身の抽出信号、マイクロホン情報、パワー係数及び同期係数をそれぞれ圧縮する、請求項1に記載の音声信号送信装置。
【請求項7】
前記同期調節部は、
前記基準音声信号が収集されたマイクロホンと前記基準音声信号以外の音声信号が収集されたマイクロホンとの距離にそれぞれ基づいて、前記基準音声信号以外の音声信号の同期係数をそれぞれ算出し、それぞれ算出された同期係数に基づいて、前記基準音声信号以外の音声信号の同期をそれぞれ調節する、請求項1に記載の音声信号送信装置。
【請求項8】
前記同期調節部は、
前記複数のマイクロホン間の相関関係を用いて、前記基準音声信号以外の音声信号の同期をそれぞれ調節する、請求項1に記載の音声信号送信装置。
【請求項9】
多チャネルの信号を受信する受信部と、
前記受信した多チャネルの信号を基準音声信号と少なくとも一つの抽出信号に復号化する復号化部と、
前記復号化された少なくとも一つの抽出信号のパワーを復元して、音声信号に復元するパワー復元部と、
前記パワーが復元された少なくとも一つの音声信号の同期を復元する同期復元部と、
前記基準音声信号と、前記パワー及び同期が復元された少なくとも一つの音声信号をマルチプレクシングするマルチプレクシング部と、
前記マルチプレクシングされた音声信号を出力する出力部と、を含む、音声信号受信装置。
【請求項10】
前記受信部は、
前記受信した信号から基準音声信号と少なくとも一つの抽出信号を復号化部に伝達し、前記少なくとも一つの抽出信号の情報を前記パワー復元部及び同期復元部に伝達する、請求項9に記載の音声信号受信装置。
【請求項11】
前記復号化部は、
前記受信した多チャネルの信号のヘッダをパーシングして、基準音声信号と抽出信号を区分する、請求項10に記載の音声信号受信装置。
【請求項12】
前記少なくとも一つの抽出信号の情報は、
前記基準音声信号が収集されたマイクロホンの情報、自身のマイクロホン情報、パワー係数及び同期係数を含む、請求項10に記載の音声信号受信装置。
【請求項13】
前記パワー復元部は、
前記パワー係数を用いて、前記抽出信号のパワーを復元して、音声信号に復元する、請求項12に記載の音声信号受信装置。
【請求項14】
前記同期復元部は、
前記パワーが復元された音声信号の同期を、前記同期係数を用いて復元する、請求項13に記載の音声信号受信装置。
【請求項15】
複数のマイクロホンから音源信号を収集し、
前記収集された音源信号から音声信号をそれぞれ抽出し、
多チャネルの音声信号のパワーをそれぞれ算出し、
前記多チャネルの音声信号のうちいずれか一つの音声信号を基準音声信号に設定し、
前記基準音声信号に基づいて基準音声信号以外の音声信号の同期を調節し、
前記同期が調節された基準音声信号以外の音声信号から前記基準音声信号をそれぞれ相殺させて、抽出信号をそれぞれ生成し、
前記基準音声信号とそれぞれの抽出信号を圧縮し、
前記圧縮された基準音声信号とそれぞれの抽出信号を送信する、音声信号送信方法。
【請求項16】
前記基準音声信号に設定するのは、
前記多チャネルの音声信号のうち、パワーが最も大きい音声信号を基準音声信号に設定することを含む、請求項15に記載の音声信号送信方法。
【請求項17】
前記抽出信号をそれぞれ生成するのは、
前記基準音声信号以外の音声信号のパワーのそれぞれと、前記基準音声信号のパワーとの割合に基づいて、前記基準音声信号以外の音声信号にそれぞれ対応するパワー係数を算出し、
前記基準音声信号以外の音声信号に対応するパワー係数を、前記基準音声信号にそれぞれ反映して、前記基準音声信号以外の音声信号に対応する相殺信号をそれぞれ生成し、
前記基準音声信号以外の音声信号から前記それぞれ対応する相殺信号をそれぞれ相殺させて、抽出信号をそれぞれ生成することを含む、請求項15に記載の音声信号送信方法。
【請求項18】
前記基準音声信号とそれぞれの抽出信号を圧縮するのは、
それぞれの抽出信号別に前記基準音声信号が収集されたマイクロホンの情報、自身の抽出信号、前記自身のマイクロホン情報、前記自身のパワー係数及び前記自身の同期係数をそれぞれ圧縮することを含む、請求項15に記載の音声信号送信方法。
【請求項19】
前記基準音声信号以外の音声信号の同期を調節するのは、
前記基準音声信号が収集されたマイクロホンと、前記基準音声信号以外の音声信号が収集されたマイクロホンとの距離にそれぞれ基づいて、前記基準音声信号以外の音声信号の同期係数をそれぞれ算出し、
それぞれ算出された同期係数に基づいて、前記基準音声信号以外の音声信号の同期をそれぞれ調節することを含む、請求項18に記載の音声信号送信方法。
【請求項20】
多チャネルの信号を受信し、
前記受信した多チャネルの信号を復号化して、基準音声信号、少なくとも一つの抽出信号及び少なくとも一つの抽出信号の情報を生成し、
前記少なくとも一つの抽出信号の情報に基づいて、前記少なくとも一つの抽出信号のパワー及び同期を復元する、音声信号受信方法。
【請求項21】
前記基準音声信号と、前記パワー及び同期が復元された少なくとも一つの音声信号をマルチプレクシングし、
前記マルチプレクシングされた音声信号を出力することをさらに含む、請求項20に記載の音声信号受信方法。
【請求項22】
前記少なくとも一つの抽出信号の情報は、
前記基準音声信号が収集されたマイクロホンの情報、自身のマイクロホン情報、パワー係数及び同期係数を含む、請求項20に記載の音声信号受信方法。
【請求項23】
前記パワーを復元するのは、
前記パワー係数を用いて、前記抽出信号のパワーを復元することを含む、請求項22に記載の音声信号受信方法。
【請求項24】
前記同期を復元するのは、
前記同期係数を用いて、前記パワーが復元された音声信号の同期を復元することを含む、請求項23に記載の音声信号受信方法。
【請求項25】
前記パワー係数は、
前記基準音声信号のパワーと前記少なくとも一つの音声信号のパワーとの割合である、請求項23に記載の音声信号受信方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2013−114264(P2013−114264A)
【公開日】平成25年6月10日(2013.6.10)
【国際特許分類】
【出願番号】特願2012−254133(P2012−254133)
【出願日】平成24年11月20日(2012.11.20)
【出願人】(390019839)三星電子株式会社 (8,520)
【氏名又は名称原語表記】Samsung Electronics Co.,Ltd.
【住所又は居所原語表記】129,Samsung−ro,Yeongtong−gu,Suwon−si,Gyeonggi−do,Republic of Korea