説明

音声復号装置及び音声復号方法

【課題】
復号を行った音声信号に対応する音質を維持しつつ、復号のための演算負荷を適正化する。
【解決手段】
検出部120が、音声信号のビットレートBTRを検出し、検出結果を選択制御部213へ送る。選択制御部213は、ノイズ選択情報NSIを参照して、検出されたビットレートBTRに予め関連付けられた個別のノイズ発生部212j(j=1〜3)を選択し、当該選択されたノイズ信号発生部212jに対して、ノイズ信号を発生すべき旨の選択制御信号NGCを送る。そして、選択されたノイズ発生部212j が、ノイズ信号を発生させる。引き続き、ビットレートBTRに対応して選択されたノイズ信号を反映した加算用ノイズ信号NCPと、ハーモニック合成部から送られた信号とが、加算部153において加算され、当該加算結果に基づく復号音声信号が外部に出力される。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声復号装置、音声復号方法、音声復号プログラム、及び、当該音声復号プログラムが記録された記録媒体に関する。
【背景技術】
【0002】
近年、音声符号化は、デジタル放送、音声通信、インターネット通信、オーディオのデータベース等の様々な分野で利用され、注目されている。そして、音声信号は、人間の心理聴覚特性に基づいた信号圧縮を行うことにより、低ビットレートで高音質の符号化が可能となっている。
【0003】
こうした符号化された音声信号を復号する音声復号装置では、音声信号を復号する際に、白色ガウス雑音を発生させ、当該白色ガウス雑音を利用する技術が提案されている(特許文献1の段落[0020]〜[0022]、図5参照:以下、「従来例」という)。
【0004】
この従来例に記載の技術では、MPEG−4(Moving Picture Experts Group-4)(非特許文献1参照)で定義されているスペクトル帯域複製(SBR:Spectral Band Replication)符号化方式で符号化された信号の復号において、どの周波数帯域にトーン音(正弦波)を付加するかを表すトーン情報と、どの周波数にどのエネルギの白色雑音を付加するかを表すノイズ情報とを利用する。そして、トーン情報とノイズ情報とに基づいて、トーン音と白色雑音とを発生させて、トーン・ノイズ信号を生成し、当該トーン・ノイズ信号を使用して、高域成分の信号を生成するようになっている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2004−53895号公報
【非特許文献】
【0006】
【非特許文献1】Fernando C. N. Pereira, and Touradj Ebrahimi, The MPEG-4 Book, Prentice Hall PTR, 2002
【発明の概要】
【発明が解決しようとする課題】
【0007】
上述した従来例の技術では、信号を復号するに際して、白色雑音を発生させている。しかしながら、復号装置において白色雑音を発生させるには、演算負荷の高い処理が必要となり、組み込み系のプロセッサではその影響を無視することはできない。
【0008】
ところで、白色雑音の付加は、MPEG−4に準拠する全ての音声信号の復号結果に対応する音質を向上させることが可能である。ここで、本発明者が研究の結果から得られた知見によれば、音声信号のビットレートが低くなるほど、音声信号に付加されるノイズ信号の乱雑度が低くなっても、当該ノイズ信号を使用して復号した音声信号に対応する音質と、白色雑音を使用して復号した音声信号に対応する音質との間に違いが生じない傾向にある。また、発生するノイズ信号の乱雑度が低くなるほど、ノイズ音発生のための演算負荷が低くなる。
【0009】
このため、符号化された音声信号を復号する際に、復号される音声信号に対応する音質の低下を抑制しつつ、演算負荷の適正化を図ることができる技術が望まれている。かかる要請に応えることが、本発明が解決すべき課題の一つとして挙げられる。
【0010】
本発明は、上記の事情を鑑みてなされたものであり、復号を行った音声信号に対応する音質を維持しつつ、復号のための演算負荷を適正化することができる新たな音声復号装置及び音声復号方法を提供することを目的とする。
【課題を解決するための手段】
【0011】
請求項1に記載の発明は、符号化された音声信号の復号を行う音声復号装置であって、前記音声信号に基づいて、有声音信号を生成する有声音生成部と;互いに乱雑度が異なる複数のノイズ信号のうちから選択されたノイズ信号を、前記有声音信号に加算するノイズ合成部と;前記ノイズ合成部におけるノイズ信号選択を制御する制御部と;を備えることを特徴とする音声復号装置である。
【0012】
請求項6に記載の発明は、ノイズ信号選択を制御する制御部を備え、符号化された音声信号の復号を行う音声復号装置において使用される音声復号方法であって、前記音声信号に基づいて、有声音信号を生成する有声音生成工程と;前記制御部による制御に従って、互いに乱雑度が異なる複数のノイズ信号のうちから選択されたノイズ信号を、前記有声音信号に加算するノイズ合成工程と;を備えることを特徴とする音声復号方法である。
【0013】
請求項7に記載の発明は、請求項6に記載の音声復号方法を演算手段に実行させる、ことを特徴とする音声復号プログラムである。
【0014】
請求項8に記載の発明は、請求項7に記載の音声復号プログラムが、演算手段により読み取り可能に記録されている、ことを特徴とする記録媒体である。
【図面の簡単な説明】
【0015】
【図1】本発明の一実施形態に係る音声復号装置の構成を概略的に示すブロック図である。
【図2】図1の有声音合成部の構成を示すブロック図である。
【図3】図2のノイズ生成部の構成を示すブロック図である。
【図4】図3のノイズ選択情報の内容を説明するための図である。
【図5】図3の選択制御部によるノイズ選択制御処理を説明するためのフローチャートである。
【図6】図5の選択指定に従ったノイズ選択処理を説明するためのフローチャートである。
【図7】図5のビットレートに基づいたノイズ選択処理を説明するためのフローチャートである。
【発明を実施するための形態】
【0016】
以下、本発明の一実施形態を、図1〜図7を参照して説明する。なお、以下の説明及び図面においては、同一又は同等の要素には同一の符号を付し、重複する説明を省略する。
【0017】
本実施形態においては、MPEG−4オーディオ(Part 3)で採用されている線形予測符号化(LPC:Linear predictive coding)をベースにしたHVXC(Harmonic Vector eXcitation Coding)で符号化された音声信号を復号する装置を例示して説明する。ここで、HVXCとは、入力信号が有声音の場合は、LPC残差を求めてハーモニック符号化を行い、入力信号が無声音の場合は、予め用意されたノイズ源の確率的コードブックを用いて符号励起線形予測(CELP:Code Excited Linear Prediction)符号化を行う方式である。
【0018】
[構成]
図1には、一実施形態に係る音声復号装置100の概略的な構成がブロック図にて示されている。この音声復号装置100は、ビットストリーム信号BSTを、入力端子191を介して受信し、音声信号の復号処理を施して、出力端子192から復号音声信号VSDを出力する装置である。
【0019】
音声復号装置100を備える装置としては、DRM(Digital Radio Mondiale)方式のラジオ受信機が挙げられる。ここで、DRM方式は、ETSI(European Telecommunications Standards Institute)「ES201 980」等で規定されている規格である。なお、音声復号装置100においては、後述する検出部120及びノイズ生成部152以外の要素は、上述した非特許文献1の記載と同様の処理を行うようになっている。
【0020】
図1に示されるように、音声復号装置100は、ビットストリーム分離部110と、検出部120と、LSP反転ベクトル量子化(VQ)部130と、LSP補間部135とを備えている。また、音声復号装置100は、スペクトル包絡成分反転ベクトル量子化(VQ)部140と、有声音合成部150と、無声音合成部160と、LPC合成フィルタ部170とを備えている。さらに、音声復号装置100は、操作入力部180を備えている。
【0021】
上記のビットストリーム分離部110は、入力端子191に入力したビットストリーム信号BSTを受ける。そして、ビットストリーム分離部110は、ビットストリーム信号BSTを、信号LSP、判定信号V/UV、信号EVL、ピッチ信号PTC及び無声音信号UVDに分離する。
【0022】
ここで、信号LSPは、LPC合成フィルタ部170のフィルタ係数として使用される線形予測係数を、量子化に適した線スペクトル対(LSP:Line Spectral Pair)パラメータに変換し、ベクトル量子化した(インデックス)信号である。この信号LSPは、LSP反転VQ部130へ送られる。また、判定信号V/UVは、入力信号が有声音であるか、無声音であるかを判定する際に利用される信号である。この判定信号V/UVは、有声音合成部150及び無声音合成部160へ送られる。
【0023】
また、信号EVLは、各ハーモニクスの振幅及びその集合であるスペクトル包絡線を、ベクトル量子化した(インデックス)信号である。この信号EVLは、スペクトル包絡成分反転VQ部140へ送られる。また、ピッチ信号PTCは、ハーモニクス構造を有するスペクトルの基本周波数であり、スペクトル包絡成分反転VQ部140及び有声音合成部150へ送られる。さらに、無声音信号UVDは、シェープパラメータとゲインパラメータと含む(インデックス)信号であり、無声音合成部160へ送られる。
【0024】
上記の検出部120は、入力端子191に入力したビットストリーム信号BSTを受ける。そして、検出部120は、音声信号のビットレートBTRを検出する。こうして検出されたビットレートBTRは、有声音合成部150へ送られる。
【0025】
上記のLSP反転VQ部130は、ビットストリーム分離部110から送られた信号LSPを受ける。そして、LSP反転VQ部130は、信号LSPに含まれるインデックスの反転ベクトル量子化を行い、LSPパラメータを再生する。こうして再生されたLSPパラメータは、信号PRMとして、LSP補間部135へ送られる。
【0026】
上記のLSP補間部135は、LSP反転VQ部130から送られた信号PRMを受ける。そして、LSP補間部135は、LSPパラメータ間の補間を施し、LSP−LPCパラメータ変換を行い、LPC合成フィルタ部170において使用されるフィルタ係数Kを決定する。こうして決定されたフィルタ係数Kは、LPC合成フィルタ部170へ送られる。
【0027】
上記のスペクトル包絡成分反転VQ部140は、ビットストリーム分離部110から送られた信号EVLを受ける。そして、スペクトル包絡成分反転VQ部140は、信号EVLに含まれるインデックスの反転ベクトル量子化を行い、スペクトル包絡線を再生し、ハーモニクスのスペクトルの振幅AMを算出する。こうして算出された振幅AMは、有声音合成部150へ送られる。
【0028】
上記の有声音合成部150は、ビットストリーム分離部110から送られた判定信号V/UV及びピッチ信号PTCを受けるとともに、スペクトル包絡成分反転VQ部140から送られた振幅AMを受ける。また、有声音合成部150は、検出部120から送られたビットレートBTR及び操作入力部180から送られた操作入力データIPDを受ける。そして、有声音合成部150は、これらの信号に基づいて、LPC合成フィルタ部170へ送る有声音成分信号VCPを生成する。有声音合成部150の構成については、後述する。
【0029】
上記の無声音合成部160は、ビットストリーム分離部110から送られた無声音信号UVDを受ける。そして、無声音合成部160は、不図示の確率的コードブックの中から、シェープパラメータに適切な値を読み出し、当該値に対して、ゲインパラメータにより指定された増幅を行う。引き続き、無声音合成部160は、有声音と無声音とのつなぎ部分を滑らかにするための窓かけ処理を行い、無声音成分信号UCPを再生する。こうして再生された無声音成分信号UCPは、LPC合成フィルタ部170へ送られる。
【0030】
上記のLPC合成フィルタ部170は、有声音合成部150から送られた有声音成分信号VCPを受けるとともに、無声音合成部160から送られた無声音成分信号UCPを受ける。また、LPC合成フィルタ部170は、LSP補間部135から送られたフィルタ係数Kを受ける。そして、LPC合成フィルタ部170は、有声音成分信号VCPに対して、有声音用のフィルタ係数Kを用いてLPC合成処理を行い、有声音成分の時間波形信号を生成する。
【0031】
また、LPC合成フィルタ部170は、無声音成分信号UCPに対して、無声音用のフィルタ係数Kを用いてLPC合成処理を行い、無声音成分の時間波形信号を生成する。引き続き、LPC合成フィルタ部170は、音質を整えるために、有声音信号に対してポストフィルタ処理を施すとともに、無声音信号に対してポストフィルタ処理を施し、ポストフィルタ処理を施した双方の信号を加算する。こうして加算された信号は、復号音声信号VSDとして、出力端子192を介して、外部へ出力される。
【0032】
上記の操作入力部180は、音声復号装置100の本体部に設けられたキー部、及び/又はキー部を備えるリモート入力装置等により構成される。この操作入力部180を利用者が操作することにより、後述する選択されるべきノイズ信号を指定したノイズ選択指定入力が行われる。こうした入力内容は、操作入力データIPDとして、有声音合成部150へ向けて送られる。
【0033】
次に、上記の有声音合成部150の構成について説明する。有声音合成部150は、図2に示されるように、有声音生成部としてのハーモニック合成部151と、ノイズ生成部152と、加算部153とを備えている。
【0034】
上記のハーモニック合成部151は、ビットストリーム分離部110から送られた判定信号V/UV及びピッチ信号PTCを受けるとともに、スペクトル包絡成分反転VQ部140から送られたスペクトルの振幅AMを受ける。そして、ハーモニック合成部151は、判定信号V/UVに基づいて入力信号が有声音であると判定される場合に、ピッチ信号PTCが対応するハーモニクス構造を有するスペクトルの基本周波数、及び、スペクトルの振幅AMに合わせた正弦波を発生する。こうして発生した正弦波は、信号HCPとして、加算部153へ送られる。
【0035】
上記のノイズ生成部152は、ビットストリーム分離部110から送られた判定信号V/UV及びピッチ信号PTCを受けるとともに、スペクトル包絡成分反転VQ部140から送られた振幅AMを受ける。また、ノイズ生成部152は、検出部120から送られたビットレートBTR及び操作入力部180から送られた操作入力データIPDを受ける。そして、ノイズ生成部152は、操作入力データIPDの内容を参照しつつ、加算用ノイズ信号NCPを生成し、加算部153へ送る。ノイズ生成部152の構成については、後述する。
【0036】
上記の加算部153は、ハーモニック合成部151から送られた信号HCP、及び、ノイズ生成部152から送られた加算用ノイズ信号NCPを受ける。そして、加算部153は、信号HCP及び加算用ノイズ信号NCPを加算して、有声音成分信号VCPを生成する。こうして生成された有声音成分信号VCPは、LPC合成フィルタ部170へ送られる。
【0037】
次に、上記のノイズ生成部152の構成について説明する。ノイズ生成部152は、図3に示されるように、ノイズ合成部の一部としてのノイズ振幅出力部211と、ノイズ合成部の一部としてのノイズ発生部212と、制御部としての選択制御部213とを備えている。また、ノイズ生成部152は、ノイズ合成部の一部としてのFFT(Fast Fourier Transform)部214と、ノイズ合成部の一部としての乗算部215と、ノイズ合成部の一部としてのIFFT(Inverse Fast Fourier Transform)部216とを備えている。
【0038】
上記のノイズ振幅出力部211は、ビットストリーム分離部110から送られた判定信号V/UV及びピッチ信号PTCを受けるとともに、スペクトル包絡成分反転VQ部140から送られたスペクトルの振幅AMを受ける。そして、ノイズ振幅出力部211は、判定信号V/UVに基づいて入力信号が有声音であると判定される場合に、ピッチ信号PTC及び振幅AMに基づき、信号HCPに重畳されるべきノイズ信号の振幅値(ノイズ振幅値)を算出する。こうして算出されたノイズ振幅値は、乗算部215へ送られる。
【0039】
上記のノイズ発生部212は、選択制御部213から送られる選択制御信号NGCによる指定に従って、時間領域のノイズ信号を発生し、当該ノイズ信号をFFT部214へ送る。かかる機能を有するノイズ発生部212は、本実施形態では、3個の第1〜第3ノイズ発生部2121〜2123を備えている。上記の第1〜第3ノイズ発生部212j(j=1〜3)のそれぞれは、選択制御部213から送られる個別選択制御信号NGCjによる指定に従って、互いに乱雑度が異なるノイズ信号を発生する。
【0040】
ここで、本実施形態では、第1ノイズ発生部2121は、ホワイトノイズ信号を発生するようになっている。また、第2ノイズ発生部2122は、ホワイトノイズ信号よりも乱雑度が低い、例えば、メルセンヌ・ツイスタ法を用いたノイズ信号(以下、「第2ノイズ信号」とも記す)を発生するようになっている。さらに、第3ノイズ発生部2123は、第2ノイズ発生部2122が発生するノイズ信号よりも乱雑度が低いノイズ信号(以下、「第3ノイズ信号」とも記す)を発生するようになっている。そして、これらのノイズ信号を発生する際の演算負荷は、高い方から順に、第1ノイズ発生部2121、第2ノイズ発生部2122、第3ノイズ発生部2123となっている。
【0041】
上記の選択制御部213は、ビットストリーム分離部110から送られた判定信号V/UV及び検出部120から送られたビットレートBTRを受けるとともに、操作入力部180から送られた操作入力データIPDを受ける。また、選択制御部213は、後述する内容のノイズ選択情報NSIを記憶している。そして、選択制御部213は、ノイズ選択情報NSI及びビットレートBTR、並びに、操作入力データIPDに基づいて、ノイズ信号を生成する第1〜第3ノイズ発生部212j(j=1〜3)の選択制御を行う。選択制御部213による第1〜第3ノイズ発生部212jの選択制御処理については、後述する。
【0042】
上記のFFT部214は、ノイズ発生部212から送られた時間領域のノイズ信号を受ける。そして、FFT部214は、時間領域のノイズ信号に対して高速フーリエ変換処理を行い、ノイズ信号を生成する。こうして生成されたノイズ信号は、乗算部215へ送られる。
【0043】
上記の乗算部215は、ノイズ振幅出力部211から送られたノイズ振幅値、及び、FFT部214から送られたノイズ信号を受ける。そして、乗算部215は、当該ノイズ信号とノイズ振幅値とを乗算し、乗算結果をIFFT部216へ送る。
【0044】
上記のIFFT部216は、乗算部215から送られた乗算結果を受ける。そして、IFFT部216は、当該乗算結果に対して、逆高速フーリエ変換処理を行い、時間領域の加算用ノイズ信号NCPを生成する。こうして生成された加算用ノイズ信号NCPは、加算部153へ送られる。
【0045】
次に、上述した選択制御部213に記憶されたノイズ選択情報NSIについて説明する。このノイズ選択情報NSIは、図4に示されるように、相対的に高いビットレートほど乱雑度が相対的に高いノイズ信号を発生させることになるように、音声信号のビットレート範囲と、第1〜第3ノイズ発生部212j(j=1〜3)とが関連付けられて登録された情報である。
【0046】
[動作]
以上のようにして構成された音声復号装置100の動作について、選択制御部213による第1〜第3ノイズ発生部の選択処理に主に着目して説明する。
【0047】
入力端子191に入力したビットストリーム信号BSTを受けると、ビットストリーム分離部110は、ビットストリーム信号BSTを、信号LSP、判定信号V/UV、信号EVL、ピッチ信号PTC及び無声音信号UVDに分離する。そして、ビットストリーム分離部110は、信号LSPを、LSP反転VQ部130へ送り、判定信号V/UVを、有声音合成部150及び無声音合成部160へ送る。また、ビットストリーム分離部110は、信号EVLを、スペクトル包絡成分反転VQ部140へ送り、ピッチ信号PTCを、スペクトル包絡成分反転VQ部140及び有声音合成部150へ送る。さらに、ビットストリーム分離部110は、無声音信号UVDを、無声音合成部160へ送る(図1参照)。
【0048】
また、ビットストリーム信号BSTを検出部120が受けると、検出部120は、音声信号のビットレートBTRを検出して、有声音合成部150へ送る(図1参照)。
【0049】
信号LSPを受けたLSP反転VQ部130は、当該信号の反転ベクトル量子化を行い、LSPパラメータを再生して、LSP補間部135へ送る。そして、LSP補間部135が、LSPパラメータ間の補間、LSP−LPCパラメータ変換を行い、LPC合成フィルタ部170において使用されるフィルタ係数Kを決定する(図1参照)。
【0050】
無声音信号UVDを受けた無声音合成部160は、無声音信号UVDに含まれるシェープパラメータ及びゲインパラメータに基づいて、無声音成分信号UCPを再生する。そして、無声音合成部160は、再生された無声音成分信号UCPをLPC合成フィルタ部170へ送る。
【0051】
信号EVLを受けたスペクトル包絡成分反転VQ部140は、当該信号の反転ベクトル量子化を行い、スペクトル包絡線を再生して、スペクトルの振幅AMを算出する。そして、スペクトル包絡成分反転VQ部140は、算出された振幅AMを有声音合成部150へ送る(図1参照)。
【0052】
判定信号V/UV、ピッチ信号PTC、振幅AM、及び、ビットレートBTRを受けた有声音合成部150では、ハーモニック合成部151が、ピッチ信号PTC、及び、スペクトルの振幅AMに合わせた正弦波を発生し、信号HCPとして、加算部153へ送る(図2参照)。
【0053】
また、有声音合成部150では、ノイズ生成部152が、信号HCPに加算する加算用ノイズ信号NCPを生成する。かかる加算用ノイズ信号NCPの生成に際して、ノイズ生成部152では、ノイズ振幅出力部211が、ピッチ信号PTC及び振幅AMに基づいて、ノイズ振幅値を算出する(図3参照)。
【0054】
また、ノイズ生成部152では、選択制御部213が、以下のようにして、第1〜第3ノイズ発生部212j(j=1〜3)のうちから1個のノイズ発生部を選択するノイズ選択制御を実行する。
【0055】
<ノイズ選択制御処理>
かかるノイズ発生部の選択に際して、図5に示されるように、まず、ステップS11において、選択制御部213が、判定信号V/UVに基づいて、入力信号が、有声音であるか否かを判定する。この判定の結果が否定的であった場合(ステップS11:N)には、ステップS11の処理が繰り返される。一方、ステップS11における判定の結果が肯定的であった場合(ステップS11:Y)には、処理はステップS12へ進む。
【0056】
ステップS12では、選択制御部213が、操作入力データIPDの内容により、第1〜第3ノイズ発生部212j(j=1〜3)のうちから1個のノイズ発生部を指定したノイズ選択指定が行われているか否かを判定する。この判定の結果が肯定的であった場合(ステップS12:Y)には、処理はステップS13へ進む。このステップS13では、利用者の選択指定に従ったノイズ信号選択処理が実行される。そして、処理はステップS11へ戻る。ステップS13における処理の詳細については、後述する。
【0057】
一方、ステップS12における判定の結果が否定的であった場合(ステップS12:N)には、処理はステップS14へ進む。このステップS14では、ビットレートに基づいたノイズ信号選択処理が実行される。そして、処理はステップS11へ戻る。ステップS14における処理の詳細については、後述する。
【0058】
次に、上記のステップS13における選択指定に従ったノイズ信号選択処理について説明する。かかるノイズ信号選択処理に際しては、図6に示されるように、まず、ステップS21において、選択制御部213が、選択指定の内容が相対的に乱雑度の高いノイズ信号を発生させる第1ノイズ発生部2121を指定したものであるか否かを判定する。この判定の結果が肯定的であった場合(ステップS21:Y)には、処理はステップS22へ進む。ステップS22では、選択制御部213が、第1ノイズ発生部2121に対してノイズ信号を発生すべき旨の個別選択制御信号NGC1を送る。この結果、第1ノイズ発生部2121が、ホワイトノイズ信号を発生して、FFT部214へ送る。そして、処理は、上述した図5におけるステップS11へ戻る。
【0059】
一方、ステップS21における判定の結果が否定的であった場合(ステップS21:N)には、ステップS23へ進む。そして、ステップS23では、選択制御部213が、選択指定の内容が第2ノイズ発生部2122を指定したものであるか否かを判定する。この判定の結果が肯定的であった場合(ステップS23:Y)には、処理はステップS24へ進む。ステップS24では、選択制御部213が、第2ノイズ発生部2122に対してノイズ信号を発生すべき旨の個別選択制御信号NGC2を送る。この結果、第2ノイズ発生部2122が、第2ノイズ信号を発生して、FFT部214へ送る。そして、処理は、上述した図5におけるステップS11へ戻る。
【0060】
一方、ステップS23における判定の結果が否定的であった場合(ステップS23:N)には、処理はステップS25へ進む。ステップS25では、選択制御部213が、第3ノイズ発生部2123に対してノイズ信号を発生すべき旨の個別選択制御信号NGC3を送る。この結果、第3ノイズ発生部2123が、第3ノイズ信号を発生して、FFT部214へ送る。そして、処理は、上述した図5におけるステップS11へ戻る。
【0061】
次に、上記のステップS14におけるビットレートに基づいたノイズ信号選択処理について説明する。かかるノイズ信号選択処理に際しては、図7に示されるように、まず、ステップS31において、選択制御部213が、検出されたビットレートBTRが、値BRAよりも大きいか否かを判定する。なお、本実施形態では、BRA>4kbps(kilobit per second)となっている。
【0062】
このステップS31における判定の結果が肯定的であった場合(ステップS31:Y)には、処理はステップS32へ進む。ステップS32では、上述したステップS22と同様に、選択制御部213が、第1ノイズ発生部2121に対してノイズ信号を発生すべき旨の個別選択制御信号NGC1を送る。この結果、第1ノイズ発生部2121が、ホワイトノイズ信号を発生して、FFT部214へ送る。そして、処理は、上述した図5におけるステップS11へ戻る。
【0063】
一方、ステップS31における判定の結果が否定的であった場合(ステップS31:N)には、ステップS33へ進む。そして、ステップS33では、選択制御部213が、検出されたビットレートBTRが、値BRB(<値BRA)よりも大きいか否かを判定する。なお、本実施形態では、2kbps<BRB<4kbpsとなっている。
【0064】
このステップS33における判定の結果が肯定的であった場合(ステップS33:Y)には、処理はステップS34へ進む。ステップS34では、上述したステップS24と同様に、選択制御部213が、第2ノイズ発生部2122に対してノイズ信号を発生すべき旨の個別選択制御信号NGC2を送る。この結果、第2ノイズ発生部2122が、第2ノイズ信号を発生して、FFT部214へ送る。そして、処理は、上述した図5におけるステップS11へ戻る。
【0065】
一方、ステップS33における判定の結果が否定的であった場合(ステップS33:N)には、処理はステップS35へ進む。ステップS35では、上述したステップS25と同様に、選択制御部213が、第3ノイズ発生部2123に対してノイズ信号を発生すべき旨の個別選択制御信号NGC3を送る。この結果、第3ノイズ発生部2123が、第3ノイズ信号を発生して、FFT部214へ送る。そして、処理は、上述した図5におけるステップS11へ戻る。
【0066】
以上のようにしてステップS11〜S14の処理を実行することにより、ノイズ発生部212で発生された時間領域のノイズ信号が、FFT部214へ送られる。当該ノイズ信号を受けたFFT部214は、ノイズ信号に対して高速フーリエ変換処理を行い、ノイズ信号を生成する。そして、FFT部214は、生成されたノイズ信号を乗算部215へ送る(図3参照)。
【0067】
引き続き、乗算部215が、ノイズ振幅出力部211が算出したノイズ振幅値と、FFT部214から送られたノイズ信号とを乗算し、乗算結果をIFFT部216へ送る。そして、IFFT部216は、当該乗算結果に対して、逆高速フーリエ変換処理を行い、時間領域の加算用ノイズ信号NCPを生成する。そして、IFFT部216は、生成された加算用ノイズ信号NCPを加算部153へ送る(図3参照)。
【0068】
次いで、加算部153が、ハーモニック合成部151から送られた信号HCPと、ノイズ生成部152(より詳しくは、IFFT部216)から送られた加算用ノイズ信号NCPとを加算する。そして、加算部153は、加算結果である有声音成分信号VCPを、LPC合成フィルタ部170へ送る(図2参照)。
【0069】
こうして有声音成分信号VCPがLPC合成フィルタ部170へ送られると、LPC合成フィルタ部170が、有声音成分信号VCPに対して、有声音用のフィルタ係数Kを用いてLPC合成処理を行い、有声音成分の時間波形信号を生成する。また、LPC合成フィルタ部170は、無声音成分信号UCPに対して、無声音用のフィルタ係数Kを用いてLPC合成処理を行い、無声音成分の時間波形信号を生成する。引き続き、LPC合成フィルタ部170は、有声音信号及び無声音信号に対してポストフィルタ処理を施し、双方の信号を加算する。そして、LPC合成フィルタ部170は、加算結果である復号音声信号VSDを、出力端子192を介して、外部へ出力する。
【0070】
以上説明したように、本実施形態では、ビットストリーム信号BSTが、信号LSP、判定信号V/UV、信号EVL、ピッチ信号PTC及び無声音信号UVDに分離されると、分離された信号のうち、信号EVL及びピッチ信号PTCは、スペクトル包絡成分反転VQ部140へ送られる。そして、スペクトル包絡成分反転VQ部140は、スペクトルの振幅AMを算出して、振幅AMを有声音合成部150へ送る。また、分離された信号のうち、判定信号V/UV及びピッチ信号PTCが、有声音合成部150へ送られるとともに、ビットストリーム信号BSTのビットレートBTRが、有声音合成部150へ送られる。
【0071】
そして、有声音合成部150におけるノイズ生成部152では、選択制御部213が、検出されたビットレートBTRに予め関連付けられたノイズ発生部212j(j=1〜3)を選択し、当該選択されたノイズ発生部212jに対して、ノイズ信号を発生すべき旨の選択制御信号NGCを送る。この結果、選択されたノイズ発生部212j が、ビットレートBTRに予め関連付けられたノイズ信号を発生させる。そして、ビットレートBTRに対応して選択されたノイズ信号を反映した加算用ノイズ信号NCPと、ハーモニック合成部151から送られた信号HCPとが、加算部153において加算され、当該加算結果に基づく復号音声信号VSDが出力される。
【0072】
このため、本実施形態によれば、符号化された音声信号を復号する際に、復号される音声信号に対応する音質の低下を抑制しつつ、演算負荷の適正化を実現することができる。
【0073】
また、本実施形態では、選択されるべきノイズ信号を指定したノイズ選択指定入力が、利用者により行われた場合には、当該ノイズ選択指定入力において指定されたノイズ信号を、優先的に選択させる。
【0074】
このため、本実施形態によれば、符号化された音声信号を復号するに際して、消費電力を抑制する等の理由から、復号された音声信号に対応する音質が劣化することになったとしてもプロセッサの演算負荷を軽減させる、又は、ロングライフバッテリを搭載している等の理由から、プロセッサに演算負荷の高い処理を実行させてでも高音質の音声を再生させる等を、利用者が決定することができる。
【0075】
したがって、本実施形態によれば、復号を行った音声信号に対応する音質を維持しつつ、復号のための演算負荷を適正化し、利用者の利便性を向上させることができる。
【0076】
[実施形態の変形]
本発明は、上記の実施形態に限定されるものではなく、様々な変形が可能である。
【0077】
例えば、上記の実施形態では、HVXCで符号化された音声信号を復号する装置に本発明を適用した。これに対して、HVXC以外の符号化アルゴリズムで符号化された信号であっても、ノイズ信号を発生させて符号化された信号を復号する装置に、本発明を適用することができる。
【0078】
また、上記の実施形態では、互いに乱雑度が異なる複数のノイズ信号を選択するに際して、音声信号のビットレートに基づきつつ、選択されるべきノイズ信号を指定したノイズ選択指定入力が、利用者により行われた場合には、当該ノイズ選択指定入力において指定されたノイズ信号を、優先的に選択させるようにした。これに対して、互いに乱雑度が異なる複数のノイズ信号を選択するに際して、音声信号のビットレートのみに基づくようにしてもよい。この場合には、操作入力部を省略することができる。
【0079】
さらに、互いに乱雑度が異なる複数のノイズ信号を選択するに際して、利用者による選択指定入力の内容のみに基づくようにしてもよい。この場合には、検出部を省略することができる。
【0080】
また、上記の実施形態では、3個の個別のノイズ発生部を備えることとしたが、個別のノイズ発生部の数は、2個、又は、4個以上であってもよいことは勿論である。
【0081】
また、上記の実施形態では、DRM方式のラジオ受信機に本発明を適用したが、携帯電話機、インターネット電話機、インターネット通信を行う音声通信装置等に本発明を適用してもよい。
【0082】
なお、上記の実施形態における音声復号装置100を、中央処理装置(CPU:Central Processing Unit)、DSP(Digital Signal Processor)等を備えた演算手段を備えるコンピュータシステムとして構成し、予め用意されたプログラムを当該コンピュータシステムで実行することにより、上記の実施形態における処理の一部又は全部を実行するようにしてもよい。このプログラムはハードディスク、CD−ROM、DVD等のコンピュータで読み取り可能な記録媒体に記録され、当該コンピュータによって記録媒体から読み出されて実行される。また、このプログラムは、CD−ROM、DVD等の可搬型記録媒体に記録された形態で取得されるようにしてもよいし、インターネットなどのネットワークを介した配信の形態で取得されるようにしてもよい。
【符号の説明】
【0083】
100 … 音声復号装置
120 … 検出部
151 … ハーモニック合成部(有声音生成部)
180 … 操作入力部
211 … ノイズ振幅出力部(ノイズ合成部の一部)
212 … ノイズ発生部(ノイズ合成部の一部)
213 … 選択制御部(制御部)
214 … FFT部(ノイズ合成部の一部)
215 … 乗算部(ノイズ合成部の一部)
216 … IFFT部(ノイズ合成部の一部)

【特許請求の範囲】
【請求項1】
符号化された音声信号の復号を行う音声復号装置であって、
前記音声信号に基づいて、有声音信号を生成する有声音生成部と;
互いに乱雑度が異なる複数のノイズ信号のうちから選択されたノイズ信号を、前記有声音信号に加算するノイズ合成部と;
前記ノイズ合成部におけるノイズ信号選択を制御する制御部と;
を備えることを特徴とする音声復号装置。
【請求項2】
前記音声信号のビットレートを検出する検出部を更に備え、
前記制御部は、前記検出されたビットレートに予め関連付けられたノイズ信号を、前記ノイズ合成部に選択させる、
ことを特徴とする請求項1に記載の音声復号装置。
【請求項3】
前記複数のノイズ信号は、乱雑度が相対的に高いノイズ信号ほど相対的に高いビットレートに関連付けられている、ことを特徴とする請求項2に記載の音声復号装置。
【請求項4】
操作入力が行われる操作入力部を更に備え、
前記操作入力部に、選択されるべきノイズ信号を指定したノイズ選択指定入力が行われた場合に、前記制御部は、前記ノイズ選択指定入力において指定されたノイズ信号を、前記ノイズ合成部に優先的に選択させる、
ことを特徴とする請求項2又は3に記載の音声復号装置。
【請求項5】
操作入力が行われる操作入力部を更に備え、
前記操作入力部に、選択されるべきノイズ信号を指定したノイズ選択指定入力が行われた場合に、前記制御部は、前記ノイズ選択指定入力に従った選択制御を、前記ノイズ合成部に対して行う、
ことを特徴とする請求項1に記載の音声復号装置。
【請求項6】
ノイズ信号選択を制御する制御部を備え、符号化された音声信号の復号を行う音声復号装置において使用される音声復号方法であって、
前記音声信号に基づいて、有声音信号を生成する有声音生成工程と;
前記制御部による制御に従って、互いに乱雑度が異なる複数のノイズ信号のうちから選択されたノイズ信号を、前記有声音信号に加算するノイズ合成工程と;
を備えることを特徴とする音声復号方法。
【請求項7】
請求項6に記載の音声復号方法を演算手段に実行させる、ことを特徴とする音声復号プログラム。
【請求項8】
請求項7に記載の音声復号プログラムが、演算手段により読み取り可能に記録されている、ことを特徴とする記録媒体。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2013−76796(P2013−76796A)
【公開日】平成25年4月25日(2013.4.25)
【国際特許分類】
【出願番号】特願2011−215868(P2011−215868)
【出願日】平成23年9月30日(2011.9.30)
【出願人】(000005016)パイオニア株式会社 (3,620)
【Fターム(参考)】