説明

音源加工装置、方法、及びプログラム

【課題】 音質劣化が少ない音楽を聞かせるようにした音源加工装置、方法、プログラム、及び情報記録媒体を提供することにある。
【解決手段】 携帯端末のコーデック(CODEC: COder-DECoder)特性に応じて音質劣化が少なくなる様に音源に加工を加え、加工した複数の音源ファイルを予め作成して蓄積しておき、再生要求時にはさらに個々の楽曲により最適なパラメータを用いて音質改善加工をする。すなわちコーデック種別に応じた最適な音源ファイルを選択する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、本発明は、携帯端末を介して聞かせる音楽を音源ファイルとして蓄積しておき、該音源ファイルを再生して、携帯端末に供給し、音楽を、携帯端末を介して聞かせる音源加工装置、方法、プログラム、及び情報記録媒体に関する。
【背景技術】
【0002】
以下の特許文献1には、電話交換機に、リングバックトーン或いはビジートーンを音声として記憶させておき、発信側電話機に対して、記憶されている前記音声で応答する電話交換システムが開示されている。
【0003】
以下の特許文献2には、リングバックトーン或いはビジートーンを検出したとき、検出結果を音声にて出力する電話機が開示されている。
【0004】
以下の特許文献3には、交換機に、予め加入者が発呼者に対して送出する画像/音声メッセージを登録し、加入者に対する着呼時に、呼出前又は呼出中に、画像/音声メッセージを発呼者に送出することが開示されている。
【0005】
以下の特許文献4には、リングバックトーンの代りに、商業情報を音声/文字/画像の形式で送出する技術が開示されている。
【0006】
しかし、特許文献1乃至4のいずれにも、コーデックを有する携帯端末を介して音楽を聞かせることには、注意が向いていない。
【0007】
従来の音源加工装置を備えたシステムは、現状の音源加工装置と、ゲートウェイスイッチ(Gateway Switch: GS)と、モバイルスイッチングセンター(Mobile Switching Center: MSC)と、基地局と、携帯端末としての携帯電話とを有する。
【0008】
携帯電話は、具体的には、GSM (Global System for Mobile Communication)Terminalであり、RPE-LTP (Regular Pulse Excited-Long Term Prediction)と名づけられた音声コーデックを有している。ゲートウェイスイッチとモバイルスイッチングセンターとは交換網を構成する。
【0009】
現状の音源加工装置は、128kbit/secのWAV(WAVEとも呼ばれるWindows(登録商標)標準の音声ファイルの形式)形式の音源ファイルを蓄積している音源ファイル蓄積装置と、音源再生装置(発信メロディー装置)とを有する。
【0010】
音源ファイルは、音源再生装置によって、64kbit/secのμ Law PCM(Pulse Code Modulation)信号またはA Law PCM信号として送出される。ゲートウェイスイッチ及びモバイルスイッチングセンターは64kbit/secで音源ファイルをそのまま伝送するので、ゲートウェイスイッチ及びモバイルスイッチングセンターでは音源ファイルの音質の劣化は無い。
【0011】
前記基地局において、携帯電話の音声コーデックと同じ音声コーデック(RPE-LTPコーディック)で、無線区間信号に変換される。音楽を聞くだけの場合、前記基地局の音声コーデックは、PCM信号をGSM符号信号に変換し、前記携帯電話の音声コーデックは、GSM符号信号をPCM信号に変換する。前記携帯電話は、PCM信号をアナログ信号に変換し、スピーカから携帯電話の所持者などに音楽を聞かせる。前記携帯電話は、しゃべる時は、聞く時と変換の方向が逆になる。この場合、前記携帯電話は、マイクロホンからの音声をPCM信号に変換し、前記携帯電話の音声コーデックは、PCM信号をGSM符号信号に変換し、前記基地局の音声コーデックは、GSM符号信号をPCM信号に変換する。
【0012】
前記基地局と前記携帯電話との間の帯域は狭い為、人間の音声に特化した符号化を行っている。そのため、音楽のいくつかのフレームが音声ではなくノイズと見なされ、音楽の代わりにノイズフレームが伝送されるので音質が劣化してしまう。
【0013】
すなわち、現状の音源再生では、前記基地局と前記携帯電話との間の伝送帯域が狭く音声に特化したコーデックを使用しているため、音楽の音質が保てないという課題がある。
【0014】
以下、現状の音源再生の課題について、より詳細に説明する。
【0015】
音楽の再生要求時には、準備してあった音源ファイルを携帯電話網(ゲートウェイスイッチとモバイルスイッチングセンターと基地局とを含む)に音声モード(64Kbit/s PCM)で接続して聞かせていた。携帯電話、特に狭帯域の携帯電話では、無線区間のコーデック特性に起因する音質劣化が発生し、音質の良い音楽を提供できないという問題があった。
【0016】
前記携帯電話で使用している音声コーデックは、狭帯域でも人間の音声のみを送信させる事を目的に設計されており、人間の音声に特化した符号化方式を採用している。一方、音楽は、白色ノイズのような部分を含むものと考えられる。そのため、音楽は人間の音声ではないため、波形が抑圧され音質が劣化してしまう。
【0017】
ここで、音質劣化の発生原因は以下のとおりである。コーデック種別によって劣化の原因と状態は異なっているので、GSMでの劣化原因を以下に示す。
【0018】
GSMでは、VAD(Voice Activity Detection)によって音声でないと判断された場合、該当フレームをSID(Silent Description) フレームで転送する。これは、元来、例えば、「もしもし」という音声の後に存在する無音区間に、SIDフレームによるノイズを流し、周囲の音、例えば車の音が、入るのを防止するためである。音楽がVADによって音声でないと判断された場合、該当フレームをSIDフレームで転送するので、SIDフレームによる、大きな音のノイズが聞こえてしまう。Full rate, Half rate, Enhanced full rate の3種類のコーデックは符号化方式は異なっているが、VADの論理は同じである。
【0019】
さらに、前記VADの動作が音質劣化の主原因であることに着目して、この動作を変える事によって劣化を防止しようとする試みもなされている。
【0020】
【特許文献1】特開平3−123269号公報
【特許文献2】特開平3−191645号公報
【特許文献3】特開平9−162978号公報
【特許文献4】特表2003−505937号公報
【発明の開示】
【発明が解決しようとする課題】
【0021】
しかし、上記した試みにおいても、全ての音源について同じアルゴリズム、同じパラメータで音質改善加工を実施しているため、音源の種別によって音質改善効果が大きい楽曲と改善効果が小さい楽曲とが存在していた。
【0022】
そこで、本発明の目的は、使用しているコーデックの音声とノイズの判定論理を解析して、ノイズと判定されない様に元の音源に加工を加え、さらに個々の楽曲により最適なパラメータを用いて音質改善加工をすることにより、音質劣化が少ない音楽を聞かせるようにした音源加工装置、方法、プログラム、及び情報記録媒体を提供することにある。
【課題を解決するための手段】
【0023】
上記課題を解決するために、本件発明は、以下の特徴を有する課題を解決するための手段を採用している。
【0024】
本発明の第1の態様に係る音源加工装置は、複数種類のコーデック特性に応じて音質劣化が少なくなるように音楽の元音源に加工を施し、その加工された加工音源ファイルを、携帯端末に供給し、当該携帯端末を介して音楽を聞かせるサービスを行なう。前記音源加工装置は、再生要求を表す起動信号を受けた時に、前記起動信号に含まれる発信者情報により前記携帯端末のコーデック種別を判定し、判定されたコーデック種別に応じて所定のノイズ判定アルゴリズムにより加工音源ファイルを作成し、作成された加工音源ファイルを選択的に再生して、前記携帯端末に供給する音源再生装置と、前記作成された加工音源ファイルを、予め蓄積しておく音源ファイル蓄積装置を備え、前記ノイズ判定アルゴリズムによって、フレームごとに音声度(pvad)係数及びノイズ判定閾値が計算され、前記音声度(pvad)係数が前記ノイズ判定閾値及び所定のパラメータの積より大きいフレームのみノイズのない音声フレームと判定され、
前記所定のパラメータは前記元音源ファイルと音質加工後の符号化ファイルを復号化したファイルとの差分を全フレームで累積した値が最小となるような値に設定される可変パラメータであることを特徴とする。
【0025】
本発明の第2の態様に係る音源加工方法は、複数種類のコーデック特性に応じて音質劣化が少なくなるように音楽の元音源に加工を施した加工音源ファイルを携帯端末に供給するサービスを行なう。前記音源加工方法は、音楽再生要求を表す起動信号を受けた時に、前記起動信号に含まれる発信者情報により前記携帯端末のコーデック種別を判定するステップと、判定されたコーデック種別に応じて所定のノイズ判定アルゴリズムにより前記加工音源ファイルを作成するステップと、前記ノイズ判定アルゴリズムを用いてフレームごとに音声度(pvad)係数及びノイズ判定閾値を計算し、前記音声度(pvad)係数が前記ノイズ判定閾値及び所定のパラメータの積より大きいフレームのみノイズのない音声フレームと判定するステップと、前記作成された加工音源ファイルを、予め蓄積するステップと、前記作成された加工音源ファイルを選択的に再生して、前記携帯端末に供給するステップを有し、前記所定のパラメータは前記元音源ファイルと音質加工後の符号化ファイルを復号化したファイルとの差分を全フレームで累積した値が最小となるような値に設定される可変パラメータであることを特徴とする。
【発明の効果】
【0026】
パラメータxの値を使って音質改善加工を行うことにより、携帯電話から音楽種別によらずに音質劣化の少ない音楽を聞くことが出来る。
【0027】
以上説明したように、本発明によれば、元の音源に応じた最適なパラメータを使って音源加工を加える事により、楽曲の如何を問わず、さまざまな種類の音楽について音質劣化が少ない音楽を聞かせる機能を提供することができる。
【発明を実施するための最良の形態】
【0028】
次に、本発明の一実施の形態について図面を参照して詳細に説明する。
【0029】
以下に述べるように、本発明は、携帯端末で音楽を聞くサービスにおいて、携帯端末のコーデック(CODEC: COder-DECoder)特性に応じて音質劣化が少なくなる様に音源に加工を加え、加工した複数の音源ファイルを予め作成して蓄積しておき、再生要求時にはコーデック種別に応じた最適な音源ファイルを選択して聞かせる事により、最善の音質の音楽を聞かせることが出来ることを特徴としている。
【0030】
本発明による音源加工装置では、音源再生装置は、起動信号に含まれる発信網種別IAM(Initial Address Message)により携帯端末のコーデック種別を判定し、コーデック種別に応じて加工した最善の音源を選択する。
【0031】
このようにして、本発明では、コーデック対応に音質劣化が少ない専用の音源ファイルを選択して聞かしているので、携帯端末のコーデックで音質劣化が少ない曲を聞かせることができる。
【0032】
ここで、本発明の核心部分を説明しておく。本発明では、狭帯域の携帯網を使っても音質劣化が少なくなる様に音源ファイルを加工する。この加工技術が本発明の核心である。
【0033】
音質劣化の状態は各携帯網が使用しているコーデック種別毎の符号化アルゴリズムに依存している。そのため、コーデック毎に音源ファイルの加工方式を変えなければならない。発信者の携帯網を判断して、その携帯網で使用しているコーデック向けに加工した音源ファイルを選択して接続することにより、音楽の音質劣化を防ぐことが出来る。
【0034】
主な携帯網とコーデック種別と伝送帯域は下記の表1に示す通りである。
【0035】
【表1】

【0036】
ここで、PHSはPersonal Handyphone System、ADPCMはAdaptive Differential Pulse Code Modulation、PDCはPersonal Digital. Cellular、VSELPはVector Sum Excited Linear Prediction、PSI-CELPはPitch Synchronous Innovation-Code Excited Linear Prediction、RPE-LTPはRegular Pulse Excited-Long Term Prediction、EFRはEnhanced Full Rate、A-CELPはAlgebraic-Code Excited Linear Prediction、CdmaはCode division multiple access、EVRCはEnhanced Variable Rate Codecである。
【0037】
以下、GSM網(Global System for Mobile communication)の加入者が「発信メロディーサービス」により音楽を聞く場合を例にとって説明する。なお、「発信メロディーサービス」とは、AがBに電話をかけて呼び出し中、Aが、リングバックトーンの代わりにBが指定した音楽を聞くサービス(Ring Back Melodyサービス)である。
【0038】
GSM網にはFull rate, Half rate, EFR(Enhanced Full Rate)の3種類のコーデックがある。事業者によって使用しているコーデックが異なっているので、それぞれ異なった対応(音源加工方式)を行う事によって対応する。複数個のコーデックを使用している事業者も存在する。
【0039】
図1に本発明の一実施の形態による音源加工方法を実施する音源加工装置20を備えたシステムを示す。
【0040】
本実施の形態による音源加工装置20は、128kbit/secのWAV形式の元音源(オリジナル音源)ファイル201と、その元音源ファイル201を加工した加工音源ファイル(GSM向け)202と、元音源ファイルを加工した加工音源ファイル(cdma向け)203とを蓄積している音源ファイル蓄積装置200と、音源再生装置(発信メロディー装置)300とを有する。
【0041】
各コーデック種別に応じた加工音源ファイル202および203は、本発明で作成した音質改善アルゴリズムによって元音源ファイル(基本音源ファイル)から加工して作成する。作成された加工音源ファイルを、音源データベースとしての音源ファイル蓄積装置200中に蓄積しておく。この加工するのに必要なアルゴリズムとパラメータを音楽の種別に応じて可変することによって音質劣化の少ない音楽を聞かせる機能を提供することが今回の発明の核心部分である。
【0042】
すなわち、音源再生装置(発信メロディー装置)300は、音楽の再生要求を表す起動信号IAM (Initial Address Message)を受けた時、起動信号の中の発信者情報によって発信者が使用しているコーデック識別を決定し、該当コーデック向けに加工された音源ファイル(加工音源ファイル202および203の内の一つ)を選択して接続する。この際、加工された音源ファイルは、音源再生装置300によって、64kbit/secのμ Law PCM(Pulse Code Modulation)信号またはA Law PCM信号として送出される。
【0043】
ここで、図1を参照すると、本発明の一実施例としての、発メロサービスにおける音楽を聞く場合が示されている。図1において、音源加工装置(発メロ装置)20は音楽の再生要求があった時、起動信号(IAM)の中の発信者情報によって発信者が使用しているコーデック識別を決定し、該当コーデック向けに加工された音源ファイルを選択して接続する。
【0044】
各コーデック種別に応じた音源ファイルは、音質改善アルゴリズムによって基本音源から加工して作成する。作成された加工音源を音源データベースの中に蓄積しておく。この加工するアルゴリズムとパラメータを音楽によって可変にする事が今回の発明である。
【0045】
次に、音源加工装置20の音質改善時の接続の動作を説明する。
【0046】
図1において、起動信号IAMによって音楽再生要求があった場合、音源加工装置20は、起動信号IAMに含まれる発信者情報から発信端末105のコーデック種別を判断して、該当コーデック向けに加工された音源(加工音源ファイル202および203の内の一つ)の音楽を聞かせる。該当コーデック向けの音源が存在しない時は元音源(元音源ファイル201)の音楽を聞かせる。
【0047】
その後、音源加工装置20は元音源ファイル201の元音源を元にして再生用の加工された音源ファイル202および203を作成する。この際、携帯電話のコーデック対応に対応が必要であるが、携帯電話105(GSM Terminal)の音声コーデック106向けの加工アルゴリズムの概要は以下の通りである。
【0048】
ここで、元音源ファイル201の元音源を元にして作成された、再生用の加工音源ファイル(GSM向け)202について説明する。元音源において、20msec単位の音声フレームのうち、ノイズと判定されたフレームとその直後の2フレーム(合計、3フレーム)は、強制的に0に置き換えられる(無音にする。クリッピング。)。
【0049】
この加工を実現する加工処理手順について図2を参照して説明する。
【0050】
(1)音楽を表現している基本音源を入力する(図2のステップS101)
(2)音楽の小音量部分(小振幅部分)は音質劣化が激しくなるので、小振幅部分の伸張(Gain Control)を行い、入力された基本音源をコーデックの符号化単位である20msec毎(160標本)のフレームに分ける。コーデック106におけるノイズと音声との識別(VAD:Voice Activity Detection)は、各フレーム毎に音声度(pvad)係数とノイズ閾値(thvad)を計算し、音声度(pvad)係数>ノイズ閾値(thvad) の時、音声フレームと判定している。すなわち、音源ファイル自体を加工する事により音質劣化を防ぐ。
【0051】
ここで、(音声度<ノイズ閾値)であるフレームは、ノイズフレームと判定される。よって、現在フレームがノイズフレームと認識されない様にするためには、音声度(pvad)がノイズ閾値(thvad)より大きくなければならない。音声度が常にノイズ閾値より大きくなるためには、GSMシミュレータによってノイズ閾値が音声度より大きくなる部分を探してその部分にてノイズ閾値を強制的に最小化させることにより音声度がノイズ閾値より大きくなるように動作を遂行する。この際、ノイズ閾値を最小化させるためにはVADでのノイズ閾値の更新において、該当入力フレームでの入力信号のエネルギーを強制的に0にしなければならないが、これは信号を強制的に0にすることで実現可能である。この処理をClipping処理という。
【0052】
音源を加工しない場合にノイズと見なされるフレームに対しては、該当フレーム(ノイズフレーム)とその直後の2フレームの合計3フレームを強制的に0に置き換える(無音にする)。3つの連続フレームを0に置き換えることにより、ノイズ判定の閾値を下げることが出来る。3つの連続フレームを0に置き換えた音源ファイルを、GSM用加工音源ファイル202として音源ファイル蓄積装置200に出力する。このようにしてまず任意の選択されたパラメータを用いて音質改善加工を実施する(図2のステップS102)。
【0053】
本発明は以下に述べるステップS103以降の処理に特徴がある。従来、全ての音源について無線方式毎に定められたパラメータで音源加工を実施していたが、本発明では、音楽によって音源加工のパラメータを適応的に変えることによって上記した課題を解決している。以下、その音源加工方法の具体的な内容について説明する。
【0054】
すなわち、ノイズとして判定する数が多すぎると、3つの連続するフレームを0に置き換える処理が多くなりすぎ、音楽が途切れてしまう。逆に少なすぎるとノイズフレームが混ざってしまう。このことに着目してこれらの調整を楽曲毎に行うことができれば音質改善効果が生じると考えた。
【0055】
ここで、元音源ファイルをA、GSMで符号化した符号化ファイルをB、Bを復号した音源ファイルをCとし、音源ファイルCを元音源として入力し(ステップS101)、次に上記したように任意の選択されたパラメータを用いて音質改善加工を実施する(ステップS102)。
【0056】
音質改善加工した音源ファイルをDとすると、この音源ファイルDをGSMで符号化して符号化ファイルEを得、この符号化ファイルEを復号して音源ファイルFを得る(ステップS103)。
【0057】
この音源ファイルFをコーデックの符号化単位である20msecごと(160標本)のフレームに区切る(ステップS104)。
【0058】
AとFとの差分が極小になる様に、AからDへの音質改善加工のパラメータxを、後述するアルゴリズムを用いて選択する(ステップS105〜S108)。
【0059】
この選択されたパラメータxを用いた以下の判定論理にしたがって音質改善加工を行う(ステップS109)。これにより、携帯電話から音楽種別によらずに音質劣化の少ない音楽を聞くことができる。
【0060】
以下、パラメータxを用いた判定論理について説明する。従来では全ての音楽について、同じ判定論理(音声度係数p>ノイズ判定閾値q)を用い、p>qの場合に音声(ノイズでない)と判定していた。すなわちコーデックにおけるノイズと音声との識別(VAD: Voice Activity Detection)は、各フレーム毎に音声度係数とノイズ判定閾値を計算し、音声度係数>ノイズ判定閾値 の時、音声フレームと判定していた。尚、この場合、音源を加工しない場合にノイズと見なされるフレームに対しては、該当フレームとその直後の2フレームの合計3フレームを強制的に0に置き換える(無音にする)。3つの連続フレームを0に置き換えることにより、ノイズ判定の閾値を下げることができる。
【0061】
これに対し、本発明では別の判定論理(p>xq:xはパラメータ)を用いてp>xqの場合に音声と判定しているところに特徴がある。このパラメータxを楽曲ごとに可変し、最適な設定にすることにより、音質改善効果を高める。
【0062】
次に、前記パラメータxの抽出アルゴリズム(抽出方法)について詳細に説明する。
【0063】
(1)元音源ファイルAと音質加工後のGSM符号化して復号したファイルFの差が小さくなる様にパラメータxを選択する。元音源をA(t)、パラメータxを使って音質改善加工した音源を符号化し復号したファイルをF(t,x)とする。尚、tは時間を示す。
【0064】
(2)A(t)とF(t,x)の周波数帯域での分布の差が小さいと、AとFを聞いた感覚の差分が小さい。音質劣化が少ないとは、AとFを聞いた感覚が小さいということである。AとFの周波数帯域での分布の差が小さくなる様にパラメータxを選定する。
【0065】
(3)以下の数1〜数4に示すように、
【数1】

【数2】

【数3】

【数4】

【0066】
A(t)とF(t,x)をフレーム単位で周波数空間に展開する。n番目フレームの周波数空間での分布をそれぞれG(f,n),H(f,n,x)とする。αとβは第nフレームの始めと終わりの時刻、fは周波数を表す。
【0067】
フレーム毎に、以下の数5
【数5】

にしたがってA(t)とF(t,x)の周波数空間上でのエネルギーの差分を求め、周波数空間で積分する。ここで、第nフレームのエネルギー差分をS(n,x)とする。
【0068】
これを楽曲の全フレームで累積する。パラメータxの時の累積値をT(x)とするし、この累積値T(x)を以下の数6で求める。
【0069】
【数6】

【0070】
次に、パラメータxを変化させ、累積値T(x)をそれぞれ計算する。
【0071】
この累積値T(x)が最小(min{T(x)})になるパラメータxを選定する。
【0072】
このパラメータxを使って、音質改善のための音源加工を行う。
【0073】
cdma網の場合、パラメータは異なるが、最適パラメータを求める方法はGSMと同じである。
【0074】
このようにして、本発明においては、音楽の種別によって最適化されたパラメータを使って音質改善加工がなされているので、楽曲によらず音質劣化の少ない曲を聞くことができる。
【0075】
次に、実端末を使った音質改善の評価結果について説明する。
【0076】
各音源の加工前と加工後の音楽を実際の携帯電話網を通してGSM端末から再生した音楽を聞き比べて評価した。ある音楽については、改善後音源ではノイズが混ざることがほとんど無くなり、音質が改善されていることが評価出来た。しかし、別の音楽では改善前と改善後であまり音質に違いがみられなかった。本発明により、従来あまり音質改善効果がみられなった音楽(静かな曲に顕著)についても、音質改善がみられる様になった。
【0077】
次に本発明の他の実施の形態について説明する。
【0078】
cdmaについての音質改善加工のアルゴリズムは、
(1)元音源を周波数空間に展開し、
(2)主周波数を抽出し、
(3)その周波数を元に櫛型フィルターで音源を加工するというものである。
【0079】
音質改善の加工アルゴリズムはGSM向けと異なっているが、パラメータの最適化の方法はGSMと同様である。櫛型フィルターの減衰率xを調整して、元音源と音質改善加工後にcdmaで符号化復号した後の音源ファイルとの間の差分が最小になるようにxを選定する。
【0080】
また、発明対象としては、上記音源加工方法における各ステップをコンピュータに実行させるプログラムも含み、このプログラムはプログラムそのものであってもよいし、このプログラムがコンピュータで読み取り可能な記録媒体に格納されているものであってもよい。
【0081】
本発明では、この記録媒体として、マイクロコンピュータで処理が行なわれるために必要なメモリ、例えばROMのようなものそのものがプログラムメディアであってもよいし、また、図示していない外部記憶装置としてプログラム読み取り装置が設けられ、そこに記録媒体を挿入することで読み取り可能なプログラムメディアであってもよい。いずれの場合においても、格納されているプログラムはマイクロコンピュータがアクセスして実行させる構成であってもよいし、あるいはいずれの場合もプログラムを読み出し、読み出されたプログラムは、マイクロコンピュータのプログラム記憶エリアにロードされて、そのプログラムが実行される方式であってもよい。このロード用のプログラムは予め本体装置に格納されているものとする。
【0082】
ここで、上記プログラムメディアは、本体と分離可能に構成される記録媒体であり、磁気テープやカセットテープ等のテープ系、FD(フレキシブルディスク)やHD(ハードディスク)等の磁気ディスクやCD−ROM/MO/MD/DVD等の光ディスク系、ICカード(メモリカードを含む)/光カード等のカード系、あるいはマスクROM、EPROM、EEPROM、フラッシュROM等による半導体メモリを含めた固定的にプログラムを担持する媒体であってもよい。
【0083】
また、本発明においては、インターネットを含む通信ネットワークと接続可能なシステム構成であることから、通信ネットワークからプログラムをダウンロードするように流動的にプログラムを担持する媒体であってもよい。なお、このように通信ネットワークからプログラムをダウンロードする場合には、そのダウンロード用プログラムは予め装置本体に格納しておくか、あるいは別の記録媒体からインストールされるものであってもよい。
【0084】
さらに、本発明では、プログラム自体として、マイクロコンピュータで実行される処理そのものであってもよいし、あるいはインターネットを含む通信ネットワークとアクセスすることで取り込める、あるいは取り込めたものであってもよいし、こちらから送り出すものであってもよい。
【産業上の利用可能性】
【0085】
本発明は、携帯電話で音楽を聞くサービス全般に広く利用出来る。
【0086】
特に、発信メロディーサービスにおいては、エンドユーザー、音源供給事業者の双方から音質の改善要求が出されている。エンドユーザーからは、「良い音質の音楽を聞きたい」との音質改善要求である。コンテンツ供給事業者からは、「供給した音楽を良い音質で聞かせたい。その結果として、提供コンテンツの売り上げを伸ばしたい。音質が悪ければ提供コンテンツの売り上げを伸ばすことが出来ない。」との要望がある。本発明は、これらの要求や要望に応えることができる。
【0087】
本発明によれば、ネットワーク機器の制御・監視を行うネットワーク管理システムや、ネットワーク管理システムをコンピュータに実現するためのプログラムといった用途に適用できる。また、コンピュータ上で動作する各種プログラムにネットワーク機器の制御・監視を行うネットワーク管理機能を提供するといった用途にも適用可能である。
【図面の簡単な説明】
【0088】
【図1】本発明の一実施例による音源加工装置を備えたシステムを説明するための図である。
【図2】図1のシステムにおいて用いられる、GSM用の音源ファイルの加工アルゴリズムの概要を示したフローチャートである。
【符号の説明】
【0089】
20 音源加工装置
102 ゲートウェイスイッチ(GS)
103 モバイルスイッチングセンター(MSC)
104 基地局
105 携帯電話
106 音声コーデック
107 音声コーデック
200 音源ファイル蓄積装置
201 元音源ファイル
202 加工音源ファイル(GSM向け)
203 加工音源ファイル(cdma向け)
300 音源再生装置

【特許請求の範囲】
【請求項1】
複数種類のコーデック特性に応じて音質劣化が少なくなるように音楽の元音源に加工を施し、その加工された加工音源ファイルを、携帯端末に供給し、当該携帯端末を介して音楽を聞かせるサービスを行なう音源加工装置において、
再生要求を表す起動信号を受けた時に、前記起動信号に含まれる発信者情報により前記携帯端末のコーデック種別を判定し、判定されたコーデック種別に応じて所定のノイズ判定アルゴリズムにより加工音源ファイルを作成し、作成された加工音源ファイルを選択的に再生して、前記携帯端末に供給する音源再生装置と、
前記作成された加工音源ファイルを、予め蓄積しておく音源ファイル蓄積装置を備え、
前記ノイズ判定アルゴリズムによって、フレームごとに音声度(pvad)係数及びノイズ判定閾値が計算され、前記音声度(pvad)係数が前記ノイズ判定閾値及び所定のパラメータの積より大きいフレームのみノイズのない音声フレームと判定され、
前記所定のパラメータは前記元音源ファイルと音質加工後の符号化ファイルを復号化したファイルとの差分を全フレームで累積した値が最小となるような値に設定される可変パラメータである
ことを特徴とする音源加工装置。
【請求項2】
前記複数種類の加工音源ファイルのうちのいずれかは、前記元音源における音声フレームのうち、元音源を加工しない場合にノイズとみなされる一つのフレームから始まる、連続する複数フレームを前記可変パラメータの値に応じて無音にする判定の数を調整した上で前記フレームに加工処理を行って作成された加工音源ファイルであることを特徴とする請求項1記載の音源加工装置。
【請求項3】
前記複数種類の加工音源ファイルのうちのいずれかは、前記元音源における音声フレームのうち、元音源を加工しない場合にノイズとみなされる一つのフレームから始まる、連続する3フレームを前記可変パラメータの値に応じて無音にする判定の数を調整した上で前記フレームに加工処理を行って作成された加工音源ファイルであることを特徴とする請求項2記載の音源加工装置。
【請求項4】
前記加工音源ファイルは、前記元音源における音声フレームのうち、元音源を加工しない場合にノイズとみなされる一つのフレームを少なくとも無音にする加工を加えて作成された加工音源ファイルであることを特徴とする請求項1記載の音源加工装置。
【請求項5】
複数種類のコーデック特性に応じて音質劣化が少なくなるように音楽の元音源に加工を施した加工音源ファイルを、携帯端末に供給するサービスを行なう音源加工方法において、
音楽再生要求を表す起動信号を受けた時に、前記起動信号に含まれる発信者情報により前記携帯端末のコーデック種別を判定するステップと、
判定されたコーデック種別に応じて所定のノイズ判定アルゴリズムにより前記加工音源ファイルを作成するステップと、
前記ノイズ判定アルゴリズムを用いてフレームごとに音声度(pvad)係数及びノイズ判定閾値を計算し、前記音声度(pvad)係数が前記ノイズ判定閾値及び所定のパラメータの積より大きいフレームのみノイズのない音声フレームと判定するステップと、
前記作成された加工音源ファイルを、予め蓄積するステップと、
前記作成された加工音源ファイルを選択的に再生して、前記携帯端末に供給するステップを有し、
前記所定のパラメータは前記元音源ファイルと音質加工後の符号化ファイルを復号化したファイルとの差分を全フレームで累積した値が最小となるような値に設定される可変パラメータである
ことを特徴とする音源加工方法。
【請求項6】
前記複数種類の加工音源ファイルのうちのいずれかは、前記元音源における音声フレームのうち、元音源を加工しない場合にノイズとみなされる一つのフレームから始まる、連続する複数フレームを前記可変パラメータの値に応じて無音にする判定の数を調整した上で前記フレームに加工処理を行って作成された加工音源ファイルであることを特徴とする請求項5記載の音源加工方法。
【請求項7】
前記複数種類の加工音源ファイルのうちのいずれかは、前記元音源における音声フレームのうち、元音源を加工しない場合にノイズとみなされる一つのフレームから始まる、連続する3フレームを前記可変パラメータの値に応じて無音にする判定の数を調整した上で前記フレームに加工処理を行って作成された加工音源ファイルであることを特徴とする請求項6記載の音源加工方法。
【請求項8】
前記加工音源ファイルは、前記元音源における音声フレームのうち、元音源を加工しない場合にノイズとみなされる一つのフレームを少なくとも無音にする加工を加えて作成された加工音源ファイルであることを特徴とする請求項5記載の音源加工方法。
【請求項9】
コンピュータに、複数種類のコーデック特性に応じて音質劣化が少なくなるように音楽の元音源に加工を施させるプログラムであって、
音楽再生要求を表す起動信号を受けた時に、前記起動信号に含まれる発信者情報により前記携帯端末のコーデック種別を判定するステップと、
判定されたコーデック種別に応じて所定のノイズ判定アルゴリズムにより前記加工音源ファイルを作成するステップと、
前記ノイズ判定アルゴリズムを用いてフレームごとに音声度(pvad)係数及びノイズ判定閾値を計算し、前記音声度(pvad)係数が前記ノイズ判定閾値及び所定のパラメータの積より大きいフレームのみノイズのない音声フレームと判定するステップと、
前記作成された加工音源ファイルを、予め蓄積するステップと、
前記作成された加工音源ファイルを選択的に再生して、前記携帯端末に供給するステップを実行させ、
前記所定のパラメータは前記元音源ファイルと音質加工後の符号化ファイルを復号化したファイルとの差分を全フレームで累積した値が最小となるような値に設定される可変パラメータである
ことを特徴とするプログラム。
【請求項10】
請求項9に記載のプログラムを記録したことを特徴とするコンピュータ読取可能な情報記録媒体(コンパクトディスク、フレキシブルディスク、ハードディスク、光磁気ディスク、ディジタルビデオディスク、磁気テープ、または、半導体メモリを含む。)。

【図1】
image rotate

【図2】
image rotate


【公開番号】特開2008−225027(P2008−225027A)
【公開日】平成20年9月25日(2008.9.25)
【国際特許分類】
【出願番号】特願2007−62911(P2007−62911)
【出願日】平成19年3月13日(2007.3.13)
【出願人】(000004237)日本電気株式会社 (19,353)
【Fターム(参考)】