説明

音声データ処理装置及び音声データ処理方法

【課題】デジタルオーディオ再生装置において、最も多用されるサンプリング周波数以外のサンプリング周波数の音声データについても、S/Nを劣化させることなく再生を行うことができるようにする。
【解決手段】所定の周波数を有する第1の発振手段3と、入力音声データについて、第1発振手段の周波数に基づき所定の処理を行う処理手段1と、処理された音声データを所定形式のデータに変換して伝送する伝送手段12とを備えた音声データ処理装置において、第1発振手段とは異なる周波数を有する第2の発振手段5と、入力手段により入力した音声データのサンプリング周波数が、第1発振手段に基づく周波数であった場合、伝送手段の出力を第1発振手段に基づく周波数とし、入力手段により入力した音声データのサンプリング周波数が、第2発振手段に基づく周波数であった場合、伝送手段の出力を第2発振手段に基づく周波数とする出力手段12とを設ける。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声データについて所定の処理を行う音声データ処理装置及び音声データ処理方法に関する。
【背景技術】
【0002】
従来、デジタルオーディオ再生装置において、デコーダやデジタルオーディオインタフェースを含むシステムLSIの原クロックが音楽コンテンツのサンプリング周波数の整数倍でない場合に信号対雑音比(以下、「S/N」という。)が悪くなり、音質が劣化する傾向があることが知られている。そこで、S/Nを向上させるために、システムクロックとしてオーディオ専用のクロックを出力する水晶発振回路を設け、このクロックを最も多用されるサンプリング周波数の音声データの処理に用いることによって、その音声データについての音質を向上させるようにしている。
【0003】
図4はこのような従来のデジタルオーディオ再生装置における主要部分の構成を示すブロック図である。この装置は、同図に示すように、入力される音楽コンテンツの音声データをデコードして所定形式のデータに変換するシステムLSI10、システムLSI10に供給する音楽コンテンツのファイルを記憶する記憶部20、システムLSI10に対して原クロックを供給する水晶発振回路30、システムLSI10からの音声データを増幅するデジタルアンプ40、並びにオーディオ専用のクロックをシステムLSI1及びデジタルアンプ40に供給するオーディオ専用水晶発振回路50を備える。
【0004】
システムLSI10は記憶部20から読み出される音声データを復号するデコーダ101、デコーダ101によって復号された音声データを、所定の形式の音声データに変換するデジタルオーディオインタフェース102、水晶発振回路30からのクロックに基づき、システムLSI10の動作用のクロックを生成するPLLブロック103を備える。デジタルオーディオインタフェース102は、デジタルアンプ40と同様に、オーディオ専用水晶発振回路50からのクロックにより動作する。
【0005】
図5は図4の装置の動作を示すフローチャートである。ユーザが装置に対し、サンプリング周波数が44.1kHzの音声データのコンテンツを指定して再生指示を与えると、装置は、指定されたコンテンツの音声データについて、デコーダ101により復号を行う処理を開始する(ステップ51)。復号された音声データはデジタルオーディオインタフェース102により所定形式の音声データに変換され、デジタルアンプ40により増幅される。増幅された音声データは、ローパスフィルタによりD/A変換され、スピーカから音声として出力される。
【0006】
なお、これに関連した技術として、複数のサンプリング周波数の音声データの処理に対応した各クロックを生成する技術が、たとえば特許文献1により開示されている。同文献においては、具体例として、サンプリング周波数fsが48kHz及び44.1kHzの音声データに対応する周波数fa(=384fs)を、ビデオデータ用の基準クロックである周波数fpのピクセルクロックに基づき、位相同期回路(以下、「PLL」という。)により生成する例が示されている。
【0007】
また、MP3やWMA形式のファイルによるコンテンツを再生する際の信号処理に使用するクロックの周波数を、各ファイル形式に応じたものとすることにより、消費電力の低減を図った技術が、たとえば、特許文献2により開示されている。同文献の技術においては、入力信号におけるフレームヘッダの内容に基づいてメインデータの処理に使用するクロック周波数を決定するようにしている。
【0008】
【特許文献1】特開2005−065093号公報
【特許文献2】特開2006−147134号公報
【発明の開示】
【発明が解決しようとする課題】
【0009】
しかしながら、上述図4のデジタルオーディオ再生装置によれば、オーディオ専用水晶発振回路50のクロックを、最も多用されるサンプリング周波数である44.1kHzの音声データの処理に用いている。したがって、音質重視の製品においては、それ以外の32kHzや48kHzのサンプリング周波数の音声データに関しては、処理に際してS/Nが劣化するため、これらの音声データについても再生できるようにして製品化するのは困難である。
【0010】
また、最も多用されるサンプリング周波数の再生品質を重視した構成とする方法として、原クロックの周波数を、最も多用されるサンプリング周波数である44.1kHzの整数倍とし、これを用いて最も多用されるサンプリング周波数の音声データについての処理を行う方法もある。しかしこの場合も、それ以外の周波数のコンテンツについては、同様の理由で、再生できるように製品化するのは困難である。
【0011】
本発明の目的は、このような従来技術の問題点に鑑み、デジタルオーディオ再生装置において、最も多用されるサンプリング周波数以外のサンプリング周波数の音声データについても、S/Nを劣化させることなく再生を行うことができるようにすることにある。
【課題を解決するための手段】
【0012】
この目的を達成するため、第1の発明に係る音声データ処理装置は、音声データを入力する入力手段と、所定の周波数を有する第1の発振手段と、前記入力手段により入力した音声データについて、前記第1の発振手段の周波数に基づき所定の処理を行う処理手段と、前記処理手段により処理された音声データを所定形式のデータに変換して伝送する伝送手段と、前記第1の発振手段とは異なる周波数を有する第2の発振手段と、前記入力手段により入力した音声データのサンプリング周波数が、前記第1の発振手段に基づく周波数であった場合、前記伝送手段の出力を前記第1の発振手段に基づく周波数とし、前記入力手段により入力した音声データのサンプリング周波数が、前記第2の発振手段に基づく周波数であった場合、前記伝送手段の出力を前記第2の発振手段に基づく周波数とする出力手段とを有することを特徴とする。
【0013】
ここで、音声データ処理装置としては、たとえば、デジタルオーディオ再生装置において、入力音声データについての所定形式の音声データへの変換や、デジタル増幅を行うものが該当する。音声データとしては、たとえば、サンプリング周波数が38kHzや、48kHz、44.1kHzで、ファイル形式がMP3や、WMA、又はWAVである音声データが該当する。処理手段としては、たとえば音声データ処理用のシステムLSIが該当する。発振手段としては、たとえば水晶発振回路が該当する。伝送手段及び出力手段としては、たとえば、デジタルオーディオインタフェースが該当する。「周波数に基づき」あるいは「基づく周波数」には、その周波数そのものに基づく場合、及びその周波数に基づいてPLL回路等により生成される周波数に基づく場合が含まれる。第1の発振手段の周波数は、それらに基づいて処理される音声データのサンプリング周波数の整数倍であることが好ましい。また、第2の発振手段の周波数は、その周波数そのものに基づいて音声データの処理が行われるものであることが好ましい。
【0014】
この構成において、入力される音声データは、第1の発振手段の周波数に基づいて所定の処理が行われ、さらに所定形式に変換されて出力される。その際、出力される音声データの周波数は、入力された音声データのサンプリング周波数が第1の発振手段に基づく周波数である場合には第1の発振手段に基づく周波数とされ、第2の発振手段に基づく周波数である場合には第2の発振手段に基づく周波数とされる。
【0015】
第2の発明に係る音声データ処理装置は、第1発明において、前記出力手段により出力した音声データを増幅する増幅手段をさらに有し、前記出力手段に用いる第1または第2の発振手段に基づく周波数を、前記増幅手段に供給することを特徴とする。
【0016】
第3の発明に係る音声データ処理装置は、第1又は第2発明において、前記第2の発振手段は、前記処理装置から独立して設けられていることを特徴とする。
【0017】
第4の発明に係る音声データ処理方法は、入力手段が、音声データを入力する入力工程と、第1の発振手段が、所定の周波数で発振する第1の発振工程と、処理手段が、前記入力手段により入力した音声データについて、前記第1の発振手段の周波数に基づき所定の処理を行う処理工程と、伝送手段が、前記処理手段により処理された音声データを所定形式のデータに変換して伝送する伝送工程と、第2の発振手段が、前記第1の発振手段とは異なる周波数で発振する第2の発振工程と、出力手段が、前記入力手段により入力した音声データのサンプリング周波数が、前記第1の発振手段に基づく周波数であった場合、前記伝送手段の出力を前記第1の発振手段に基づく周波数とし、前記入力手段により入力した音声データのサンプリング周波数が、前記第2の発振手段に基づく周波数であった場合、前記伝送手段の出力を前記第2の発振手段に基づく周波数とする出力工程とを具備することを特徴とする。
【発明の効果】
【0018】
本発明によれば、入力される音声データについて、第1の発振手段の周波数に基づく所定の処理を行い、さらに所定形式に変換して出力する際に、出力される音声データの周波数を、入力される音声データのサンプリング周波数が第1の発振手段に基づく周波数である場合には第1の発振手段に基づく周波数とし、第2の発振手段に基づく周波数である場合には第2の発振手段に基づく周波数とするようにしたため、第2の発振手段に基づく周波数を最も多用されるサンプリング周波数とすることにより、最も多用されるサンプリング周波数の音声データの伝送や増幅に対して、その周波数専用の発振器を用いることができる。したがって、最も多用されるサンプリング周波数の音声データについて、S/Nを劣化させることなく高音質な処理を行うことができる。さらに、それ以外のサンプリング周波数の音声データに対しても第1の発振手段によって対応が可能となるため、高音質化と複数サンプリング周波数対応との双方を実現することができる。
【発明を実施するための最良の形態】
【0019】
図1は、本発明の一実施形態に係るデジタルオーディオ再生装置における主要部の構成を示すブロック図である。この装置は同図に示すように、入力される音楽コンテンツの音声データをデコードして所定形式のデータに変換するシステムLSI1、システムLSI1に供給する音楽コンテンツの音声データを記憶する記憶部2、システムLSI1に対して原クロックを供給する水晶発振回路3、システムLSI1からの音声データを増幅するデジタルアンプ4、オーディオ専用のマスタクロックをシステムLSI1及びデジタルアンプ4に供給するオーディオ専用水晶発振回路5、並びにオーディオ専用水晶発振回路5及びデジタルアンプ4間に設けられたスイッチSW2を備える。
【0020】
記憶部2にはMP3、WMA、及びWAV形式の音楽コンテンツのファイルが記憶されている。これらの各形式のファイルとしては、サンプリング周波数が32[kHz]、44.1[kHz]、又は48[kHz]のものが存在し得る。44.1[kHz]は最も多用されるサンプリング周波数であり、そのサンプリング周波数のファイルは最良のS/Nで処理する必要がある。サンプリング周波数が32[kHz]及び48[kHz]のファイルについても、良好なS/Nで処理する必要がある。
【0021】
システムLSI1は記憶部2から読み出されるコンテンツファイルの音声データを復号するデーコーダ11、デコーダ11によって復号された音声データを、所定形式の音声データに変換するデジタルオーディオインタフェース12、水晶発振回路3が出力する原クロックに基づき、システムLSI1の動作用のクロックやデジタルオーディオインタフェース12及びデジタルアンプ4に供給するマスタクロックを生成するPLLブロック13、PLLブロック13及びデジタルオーディオインタフェース12間に設けられたスイッチSW1、並びに装置各部の制御を行うCPU14を備える。スイッチSW1の出力側及びスイッチSW2の出力側は、相互に接続されている。
【0022】
図2は図1の装置の動作を示すフローチャートである。記憶部2に記憶されている音楽コンテンツのうちの1つについての再生指示がなされると、CPU14はまず、ステップ21において、再生指示がなされた音楽コンテンツのサンプリング周波数fsが44.1[kHz]であるかどうかを判定する。この判定は、再生指示がなされた音楽コンテンツのファイルのヘッダにメタデータとして記録されているサンプリングレートをデコーダ11から取得し、これに基づいて行うことができる。
【0023】
サンプリング周波数fsが44.1[kHz]であると判定した場合には、ステップ22においてスイッチSW1をオフ状態とし、ステップ23においてスイッチSW2をオン状態とする。さらにステップ24において、再生指示がなされた音楽コンテンツのファイルについてのデコーダ11によるデコードを開始し、図2の処理を終了する。この場合、この後、オーディオ専用水晶発振回路5からの11.2896[MHz](=256fs)のクロックをマスタクロックとして、デジタルオーディオインタフェース12及びデジタルアンプ4における処理が行われることになる。
【0024】
一方、ステップ21において、再生指示がなされた音楽コンテンツのサンプリング周波数が44.1[kHz]ではないと判定した場合には、ステップ25において、その音楽コンテンツのサンプリング周波数が32[kHz]又は48[kHz]であるかどうかを判定する。32[kHz]又は48[kHz]であると判定した場合にはステップ26においてスイッチSW1をオン状態とし、ステップ27においてスイッチSW2をオフ状態とする。そしてステップ28において、再生指示がなされた音楽コンテンツのファイルについてのデコーダ11による復号を開始し、図2の処理を終了する。
【0025】
この場合、この後、再生指示がなされた音楽コンテンツのサンプリング周波数が32[kHz]である場合には、CPU14はPLLブロック13に対し、8.192[MHz](=256×32[kHz])のクロックの供給を開始するように指示する。これに応じ、PLLブロック13は水晶発振回路3が出力する12[MHz]の原クロックに基づき、8.192[MHz]のクロックの供給を開始する。これをマスタクロックとして、デジタルオーディオインタフェース12及びデジタルアンプ4はデコーダ11により復号された音声データについての処理を開始する。
【0026】
再生指示がなされた音楽コンテンツのサンプリング周波数が48[kHz]である場合には、CPU14はPLLブロック13に対し、12.288[MHz](=256×48[kHz])のクロックの供給を開始するように指示する。これに応じ、PLLブロック13は水晶発振回路3が出力する12[MHz]の原クロックに基づき、12.288[MHz]のクロックの供給を開始する。これをマスタクロックとして、デジタルオーディオインタフェース12及びデジタルアンプ4はデコーダ11により復号された音声データについての処理を開始する。
【0027】
音声データの処理に際しては、デコーダ11からの音声データをデジタルオーディオインタフェース12が所定形式の音声データに変換し、変換された音声データをデジタルアンプ4が増幅する。増幅された音声データはローパスフィルタによってD/A変換され、スピーカから音声として出力される。
【0028】
本実施形態によれば、水晶発振回路3が出力する原クロックに基づき、サンプリング周波数が32[kHz]及び48[kHz]の音声データに対応するマスタクロックを生成するとともに、オーディオ専用水晶発振回路5が出力するクロックをサンプリング周波数が44.1[kHz]の音声データに対応するマスタクロックとして用いるようにしたため、最も多用される44.1[kHz]のサンプリング周波数の音声データについてはS/Nを劣化させることなく処理を行い、それ以外の32[kHz]及び48[kHz]のサンプリング周波数の音声データについても、極力S/Nを劣化させることなく処理を行うことができる。
【0029】
また、水晶発振回路3が出力する原クロックの周波数を、32[kHz]及び48[kHz]の公倍数、すなわち375倍及び250倍の周波数(=12[MHz])としたため、これに基づいて生成されるマスタクロックによるデジタルオーディオインタフェース12及びデジタルアンプ4における音声データについての処理を、前記公倍数としない場合に比べ、S/Nを劣化させることなく行うことができる。
【0030】
図3は本発明の別の実施形態に係るデジタルオーディオ再生装置における主要部の構成を示すブロック図である。同図における図1中の符号と同一の符号は、図1の場合と同様の要素を示す。図3中の31は装置に設けられた操作キーであり、CPU14に対して再生指示を行うコンテンツのサンプリング周波数を、32[kHz]、44.1[kHz]又は48[kHz]のうちから選択してCPU14に指示するためのものである。操作キー32としては、たとえば、タクトキーを用いることができる。
【0031】
すなわち、図1の態様においては、CPU14は、図2中のステップ21及び25におけるサンプリング周波数についての判定を、デコーダ11から取得した音楽コンテンツのサンプリング周波数に基づいて行うようにしているが、この代わりに本実施形態では、操作キー31の操作により指示されたサンプリング周波数に基づいて行うようにしている。他の点については図1の態様の場合と同様である。したがってユーザは、コンテンツの再生を指示する際に、そのサンプリング周波数を操作キー31により併せて指示することによって、図1の態様の場合と同様に、そのサンプリング周波数に対応したマスタクロックにより再生が行われるようにすることができる。
【0032】
本実施形態によれば、デジタルオーディオ再生装置が音楽コンテンツのサンプリング周波数を検知することができない場合でも、ユーザによるサンプリング周波数の指示に基づいて、音楽コンテンツのサンプリング周波数に対応したシステムクロックに基づく音声データの処理を行うことができる。
【0033】
なお、本発明は上述の実施形態に限定されることなく、適宜変形して実施することができる。たとえば、上述においては、PLLブロック13が生成するシステムクロックは、32[kHz]及び48[kHz]のサンプリング周波数に対応したものであるが、これに代えて又はこれに加えて、他のサンプリング周波数に対応したシステムクロックを生成するものであってもよい。
【0034】
また、上述においては、システムLSI1の外部においてオーディオ専用のシステムクロックを出力する水晶発振回路として、44.1[kHz]のサンプリング周波数に対応したシステムクロックを出力する水晶発振回路5を設けているが、これに代えて又はこれに加えて、他のサンプリング周波数に対応したシステムクロックを出力するものを設けるようにしてもよい。この場合、他のサンプリング周波数としては、たとえば、その整数倍が原クロックの周波数とはならず、かつ44.1[kHz]以外のサンプリング周波数が該当する。これにより、このようなサンプリング周波数のコンテンツについても、高音質で再生を行うことができる。
【図面の簡単な説明】
【0035】
【図1】本発明の一実施形態に係るデジタルオーディオ再生装置における主要部の構成を示すブロック図である。
【図2】図1の装置の動作を示すフローチャートである。
【図3】本発明の別の実施形態に係るデジタルオーディオ再生装置における主要部の構成を示すブロック図である。
【図4】従来のデジタルオーディオ再生装置における主要部分の構成を示すブロック図である。
【図5】図4の装置の動作を示すフローチャートである。
【符号の説明】
【0036】
1,10:システムLSI、2,20:記憶部、3,30:水晶発振回路、4,40:デジタルアンプ、5,50:オーディオ専用水晶発振回路、11,101:デコーダ、12,102:デジタルオーディオインタフェース、13,103:PLLブロック、14:CPU、31:操作キー。

【特許請求の範囲】
【請求項1】
音声データを入力する入力手段と、
所定の周波数を有する第1の発振手段と、
前記入力手段により入力した音声データについて、前記第1の発振手段の周波数に基づき所定の処理を行う処理手段と、
前記処理手段により処理された音声データを所定形式のデータに変換して伝送する伝送手段と、
前記第1の発振手段とは異なる周波数を有する第2の発振手段と、
前記入力手段により入力した音声データのサンプリング周波数が、前記第1の発振手段に基づく周波数であった場合、前記伝送手段の出力を前記第1の発振手段に基づく周波数とし、前記入力手段により入力した音声データのサンプリング周波数が、前記第2の発振手段に基づく周波数であった場合、前記伝送手段の出力を前記第2の発振手段に基づく周波数とする出力手段と、
を有することを特徴とする、音声データ処理装置。
【請求項2】
前記出力手段により出力した音声データを増幅する増幅手段をさらに有し、
前記出力手段に用いる第1または第2の発振手段に基づく周波数を、
前記増幅手段に供給することを特徴とする、
請求項1に記載の音声データ処理装置。
【請求項3】
前記第2の発振手段は、
前記処理装置から独立して設けられていることを特徴とする、
請求項1又は2に記載の音声データ処理装置。
【請求項4】
入力手段が、音声データを入力する入力工程と、
第1の発振手段が、所定の周波数で発振する第1の発振工程と、
処理手段が、前記入力手段により入力した音声データについて、前記第1の発振手段の周波数に基づき所定の処理を行う処理工程と、
伝送手段が、前記処理手段により処理された音声データを所定形式のデータに変換して伝送する伝送工程と、
第2の発振手段が、前記第1の発振手段とは異なる周波数で発振する第2の発振工程と、
出力手段が、前記入力手段により入力した音声データのサンプリング周波数が、前記第1の発振手段に基づく周波数であった場合、前記伝送手段の出力を前記第1の発振手段に基づく周波数とし、前記入力手段により入力した音声データのサンプリング周波数が、前記第2の発振手段に基づく周波数であった場合、前記伝送手段の出力を前記第2の発振手段に基づく周波数とする出力工程と
を具備することを特徴とする音声データ処理方法。

【図1】
image rotate

【図2】
image rotate

【図5】
image rotate

【図3】
image rotate

【図4】
image rotate