説明

音源供給装置及び音源供給方法

【課題】音楽がノイズと判定されない様に元の音源に加工を加える事により、音質劣化が少ない音楽を聞かせるようにした音源供給装置の提供。
【解決手段】携帯端末(105)を介して音楽を聞かせるサービスを行なう音源供給装置(20)において、複数種類のコーデック特性に応じて音質劣化が少なくなるように前記音楽の元音源に加工を加えて作成した複数種類の加工音源ファイル(202及び203)を、予め蓄積しておく音源ファイル蓄積装置(200)と、再生要求を表す起動信号を受けた時に、前記起動信号から携帯端末(105)のコーデック(106)種別を判定し、複数種類の加工音源ファイル(202及び203)の中から、前記判定したコーデック種別に応じた一つの加工音源ファイルを選択的に再生して、携帯端末(105)に供給し、前記音楽を携帯端末を介して聞かせる音源再生装置(300)とを備えた音源供給装置(20)。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、携帯端末を介して聞かせる音楽を音源ファイルとして蓄積しておき、該音源ファイルを再生して、携帯端末に供給し、音楽を携帯端末を介して聞かせる音源供給装置及び音源供給方法に関する。
【背景技術】
【0002】
特許文献1には、電話交換機に、リングバックトーン或いはビジートーンを音声として記憶させておき、発信側電話機に対して、記憶されている前記音声で応答する電話交換システムが開示されている。
【0003】
特許文献2には、リングバックトーン或いはビジートーンを検出したとき、検出結果を音声にて出力する電話機が開示されている。
【0004】
特許文献3には、交換機に、予め加入者が発呼者に対して送出する画像/音声メッセージを登録し、加入者に対する着呼時に、呼出前又は呼出中に、画像/音声メッセージを発呼者に送出することが開示されている。
【0005】
特許文献4には、リングバックトーンの代りに、商業情報を音声/文字/画像の形式で送出する技術が開示されている。
【0006】
しかし、特許文献1乃至4のいずれにも、コーデックを有する携帯端末を介して音楽を聞かせることには、注意が向いていない。
【0007】
図7には、現状の音源供給装置10を備えたシステムが示されている。図7に図示されたシステムは、現状の音源供給装置10と、ゲートウェイスイッチ(Gateway Switch: GS)102と、モバイルスイッチングセンター(Mobile Switching Center: MSC)103と、基地局104と、携帯端末としての携帯電話105とを有する。携帯電話105は、具体的には、GSM (Global System for Mobile Communication)Terminalであり、RPE-LTP (Regular Pulse Excited-Long Term Prediction)と名づけられた音声コーデック106を有している。ゲートウェイスイッチ102とモバイルスイッチングセンター103とは交換網を構成する。
【0008】
現状の音源供給装置10は、128kbit/secのWAV(WAVEとも呼ばれるWindows(登録商標)標準の音声ファイルの形式)形式の音源ファイルを蓄積している音源ファイル蓄積装置100と、音源再生装置(発信メロディー装置)101とを有する。
【0009】
音源ファイルは、音源再生装置101によって、64kbit/secのμ Law PCM(Pulse Code Modulation)信号またはA Law PCM信号として送出される。ゲートウェイスイッチ102及びモバイルスイッチングセンター103は64kbit/secで音源ファイルをそのまま伝送するので、ゲートウェイスイッチ102及びモバイルスイッチングセンター103では音源ファイルの音質の劣化は無い。
【0010】
基地局104において、携帯電話105の音声コーデック106と同じ音声コーデック(RPE-LTPコーディック)107で、無線区間信号に変換される。音楽を聞くだけの場合、基地局104の音声コーデック107は、PCM信号をGSM符号信号に変換し、携帯電話105の音声コーデック106は、GSM符号信号をPCM信号に変換する。携帯電話105は、PCM信号をアナログ信号に変換し、スピーカから携帯電話の所持者などに音楽を聞かせる。携帯電話105は、しゃべる時は、聞く時と変換の方向が逆になる。この場合、携帯電話105は、マイクロホンからの音声をPCM信号に変換し、携帯電話105の音声コーデック106は、PCM信号をGSM符号信号に変換し、基地局104の音声コーデック107は、GSM符号信号をPCM信号に変換する。
【0011】
基地局104と携帯電話105との間の帯域は狭い為、人間の音声に特化した符号化を行っている。そのため、音楽のいくつかのフレームが音声ではなくノイズと見なされ、音楽の代わりにノイズフレームが伝送されるので音質が劣化してしまう。
【0012】
すなわち、現状の音源再生では、基地局104と携帯電話105との間の伝送帯域が狭く音声に特化したコーデック106を使用しているため、音楽の音質が保てないという課題がある。
【0013】
この現状の音源再生の課題について、より詳細に説明する。
【0014】
音楽の再生要求時には、準備してあった音源ファイル100を携帯電話網(ゲートウェイスイッチ102とモバイルスイッチングセンター103と基地局104とを含む)に音声モード(64Kbit/s PCM)で接続して聞かせていた。携帯電話105、特に狭帯域の携帯電話では、無線区間のコーデック特性に起因する音質劣化が発生し、音質の良い音楽を提供できないという問題があった。
【0015】
携帯電話105で使用している音声コーデック106は、狭帯域でも人間の音声のみを送信させる事を目的に設計されており、人間の音声に特化した符号化方式を採用している。一方、音楽は、白色ノイズのような部分を含むものと考えられる。そのため、音楽は人間の音声ではないため、波形が抑圧され音質が劣化してしまう。
【0016】
【特許文献1】特開平3−123269号公報
【特許文献2】特開平3−191645号公報
【特許文献3】特開平9−162978号公報
【特許文献4】特表2003−505937号公報
【発明の開示】
【発明が解決しようとする課題】
【0017】
音質劣化の発生原因は以下の通りである。コーデック種別によって劣化の原因と状態は異なっているので、GSMでの劣化原因を以下に示す。
【0018】
GSMでは、VAD(Voice Activity Detection)によって音声でないと判断された場合、該当フレームをSID(Silent Description) フレームで転送する。これは、元来、例えば、「もしもし」という音声の後に存在する無音区間に、SIDフレームによるノイズを流し、周囲の音、例えば車の音が、入るのを防止するためである。音楽がVADによって音声でないと判断された場合、該当フレームをSIDフレームで転送するので、SIDフレームによる、大きな音のノイズが聞こえてしまう。Full rate, Half rate, Enhanced full rate の3種類のコーデックは符号化方式は異なっているが、VADの論理は同じである。
【0019】
本発明は、VADの動作が音質劣化の主原因であるので、この動作を変える事によって劣化を防止しようとするものである。
【0020】
すなわち、本発明の目的は、使用しているコーデックの音声とノイズの判定論理を解析して、ノイズと判定されない様に元の音源に加工を加える事により、音質劣化が少ない音楽を聞かせるようにした音源供給装置及び音源供給方法を提供することにある。
【課題を解決するための手段】
【0021】
本発明による音源供給装置及び本発明による音源供給方法は、以下のとおりである。
【0022】
(1) 携帯端末を介して音楽を聞かせるサービスを行なう音源供給装置において、
複数種類のコーデック特性に応じて音質劣化が少なくなるように前記音楽の元音源に加工を加えて作成した複数種類の加工音源ファイルを、予め蓄積しておく音源ファイル蓄積装置と、
再生要求を表す起動信号を受けた時に、前記起動信号から前記携帯端末のコーデック種別を判定し、前記複数種類の加工音源ファイルの中から、前記判定したコーデック種別に応じた一つの加工音源ファイルを選択的に再生して、前記携帯端末に供給し、前記音楽を前記携帯端末を介して聞かせる音源再生装置とを備えたことを特徴とする音源供給装置。
【0023】
(2) 上記(1)に記載の音源供給装置において、
前記音源再生装置は、再生要求を表す起動信号を受けた時に、前記起動信号に含まれる発信者情報により、前記携帯端末のコーデックの種別を判定するものであることを特徴とする音源供給装置。
【0024】
(3) 上記(1)に記載の音源供給装置において、
前記複数種類の加工音源ファイルのうちのいずれかは、前記元音源における音声フレームのうち、元音源を加工しない場合にノイズとみなされる一つのフレームを少なくとも無音にする加工を加えて作成された加工音源ファイルであることを特徴とする音源供給装置。
【0025】
(4) 上記(3)に記載の音源供給装置において、
前記複数種類の加工音源ファイルのうちのいずれかは、前記元音源における音声フレームのうち、元音源を加工しない場合にノイズとみなされる一つのフレームから始まる、連続する複数フレームを、無音にする加工を加えて作成された加工音源ファイルであることを特徴とする音源供給装置。
【0026】
(5) 上記(4)に記載の音源供給装置において、
前記複数種類の加工音源ファイルのうちのいずれかは、前記元音源における音声フレームのうち、元音源を加工しない場合にノイズとみなされる一つのフレームから始まる、連続する3フレームを、無音にする加工を加えて作成された加工音源ファイルであることを特徴とする音源供給装置。
【0027】
(6) 携帯端末を介して音楽を聞かせるサービスを行なう音源供給方法において、
複数種類のコーデック特性に応じて音質劣化が少なくなるように前記音楽の元音源に加工を加えて作成した複数種類の加工音源ファイルを、予め蓄積しておくステップと、
再生要求を表す起動信号を受けた時に、前記起動信号から前記携帯端末のコーデック種別を判定する種別判定ステップと、
前記複数種類の加工音源ファイルの中から、前記判定したコーデック種別に応じた一つの加工音源ファイルを選択的に再生して、前記携帯端末に供給し、前記音楽を前記携帯端末を介して聞かせるステップとを備えたことを特徴とする音源供給方法。
【0028】
(7) 上記(6)に記載の音源供給方法において、
前記種別判定ステップは、再生要求を表す起動信号を受けた時に、前記起動信号に含まれる発信者情報により、前記携帯端末のコーデックの種別を判定するステップであることを特徴とする音源供給方法。
【0029】
(8) 上記(6)に記載の音源供給方法において、
前記複数種類の加工音源ファイルのうちのいずれかは、前記元音源における音声フレームのうち、元音源を加工しない場合にノイズとみなされる一つのフレームを少なくとも無音にする加工を加えて作成された加工音源ファイルであることを特徴とする音源供給方法。
【0030】
(9) 上記(8)に記載の音源供給方法において、
前記複数種類の加工音源ファイルのうちのいずれかは、前記元音源における音声フレームのうち、元音源を加工しない場合にノイズとみなされる一つのフレームから始まる、連続する複数フレームを、無音にする加工を加えて作成された加工音源ファイルであることを特徴とする音源供給方法。
【0031】
(10) 上記(9)に記載の音源供給方法において、
前記複数種類の加工音源ファイルのうちのいずれかは、前記元音源における音声フレームのうち、元音源を加工しない場合にノイズとみなされる一つのフレームから始まる、連続する3フレームを、無音にする加工を加えて作成された加工音源ファイルであることを特徴とする音源供給方法。
【0032】
(11) 携帯端末を介して音楽を聞かせるサービスを行なう音源供給装置において、
前記携帯端末のコーデック特性に応じて音質劣化が少なくなるように前記音楽の元音源に加工を加えて作成した加工音源ファイルを、予め蓄積しておく音源ファイル蓄積装置と、
再生要求を表す起動信号を受けた時に、前記加工音源ファイルを再生して、前記携帯端末に供給し、前記音楽を前記携帯端末を介して聞かせる音源再生装置とを備え、
前記加工音源ファイルは、前記元音源における音声フレームのうち、元音源を加工しない場合にノイズとみなされる一つのフレームを少なくとも無音にする加工を加えて作成された加工音源ファイルであることを特徴とする音源供給装置。
【0033】
(12) 上記(11)に記載の音源供給装置において、
前記加工音源ファイルは、前記元音源における音声フレームのうち、元音源を加工しない場合にノイズとみなされる一つのフレームから始まる、連続する複数フレームを、無音にする加工を加えて作成された加工音源ファイルであることを特徴とする音源供給装置。
【0034】
(13) 上記(12)に記載の音源供給装置において、
前記加工音源ファイルは、前記元音源における音声フレームのうち、元音源を加工しない場合にノイズとみなされる一つのフレームから始まる、連続する3フレームを、無音にする加工を加えて作成された加工音源ファイルであることを特徴とする音源供給装置。
【0035】
(14) 携帯端末を介して音楽を聞かせるサービスを行なう音源供給方法において、
前記携帯端末のコーデック特性に応じて音質劣化が少なくなるように前記音楽の元音源に加工を加えて作成した加工音源ファイルを、予め蓄積しておくステップと、
再生要求を表す起動信号を受けた時に、前記加工音源ファイルを再生して、前記携帯端末に供給し、前記音楽を前記携帯端末を介して聞かせるステップとを備え、
前記加工音源ファイルは、前記元音源における音声フレームのうち、元音源を加工しない場合にノイズとみなされる一つのフレームを少なくとも無音にする加工を加えて作成された加工音源ファイルであることを特徴とする音源供給方法。
【0036】
(15) 上記(14)に記載の音源供給方法において、
前記加工音源ファイルは、前記元音源における音声フレームのうち、元音源を加工しない場合にノイズとみなされる一つのフレームを少なくとも無音にする加工を加えて作成された加工音源ファイルであることを特徴とする音源供給方法。
【0037】
(16) 上記(15)に記載の音源供給方法において、
前記加工音源ファイルは、前記元音源における音声フレームのうち、元音源を加工しない場合にノイズとみなされる一つのフレームから始まる、連続する複数フレームを、無音にする加工を加えて作成された加工音源ファイルであることを特徴とする音源供給方法。
【0038】
(17) 上記(16)に記載の音源供給方法において、
前記加工音源ファイルは、前記元音源における音声フレームのうち、元音源を加工しない場合にノイズとみなされる一つのフレームから始まる、連続する3フレームを、無音にする加工を加えて作成された加工音源ファイルであることを特徴とする音源供給方法。
【発明の効果】
【0039】
本発明によれば、音楽を供給する携帯端末のコーデックに対応して加工された音源ファイルを接続しているので、音質劣化の少ない曲を聞かせることができる。
【発明を実施するための最良の形態】
【0040】
以下に述べるように、本発明は、携帯端末で音楽を聞くサービスにおいて、携帯端末のコーデック(CODEC: COder-DECoder)特性に応じて音質劣化が少なくなる様に音源に加工を加える。加工した複数の音源ファイルを予め作成して蓄積しておき、再生要求時にはコーデック種別に応じた最適な音源ファイルを選択して聞かせる事により、最善の音質の音楽を聞かせることが出来ることを特徴としている。
【0041】
本発明による音源供給装置では、音源再生装置は、起動信号に含まれる発信網種別IAM(Initial Address Message)により携帯端末のコーデック種別を判定し、コーデック種別に応じて加工した最善の音源を選択する。
【0042】
このようにして、本願発明では、コーデック対応に音質劣化が少ない専用の音源ファイルを選択して聞かしているので、携帯端末のコーデックで音質劣化が少ない曲を聞かせることができる。
【0043】
ここで、本発明の核心部分を説明しておく。本発明では、狭帯域の携帯網を使っても音質劣化が少なくなる様に音源ファイルを加工する。この加工技術が本発明の核心である。
【0044】
音質劣化の状態は各携帯網が使用しているコーデック種別毎の符号化アルゴリズムに依存している。そのため、コーデック毎に音源ファイルの加工方式を変えなければならない。発信者の携帯網を判断して、その携帯網で使用しているコーデック向けに加工した音源ファイルを選択して接続することにより、音楽の音質劣化を防ぐことが出来る。
【0045】
主な携帯網とコーデック種別と伝送帯域は下記の表1に示す通りである。
【0046】
【表1】

【0047】
ここで、PHSはPersonal Handyphone System、ADPCMはAdaptive Differential Pulse Code Modulation、PDCはPersonal Digital. Cellular、VSELPはVector Sum Excited Linear Prediction、PSI-CELPはPitch Synchronous Innovation-Code Excited Linear Prediction、RPE-LTPはRegular Pulse Excited-Long Term Prediction、EFRはEnhanced Full Rate、A-CELPはAlgebraic-Code Excited Linear Prediction、CdmaはCode division multiple access、EVRCはEnhanced Variable Rate Codecである。
【0048】
以下に述べる本発明の実施例では、GSM網の加入者が「発信メロディーサービス」により音楽を聞く場合について説明する。なお、「発信メロディーサービス」とは、AがBに電話をかけて呼び出し中、Aが、リングバックトーンの代わりにBが指定した音楽を聞くサービス(Ring Back Melodyサービス)である。
【0049】
GSM網にはFull rate, Half rate, EFR(Enhanced Full Rate)の3種類のコーデックがある。事業者によって使用しているコーデックが異なっているので、それぞれ異なった対応(音源加工方式)を行う事によって対応する。複数個のコーデックを使用している事業者も存在する。
【0050】
図1を参照すると、本発明の一実施例による音源供給方法を実施する音源供給装置20を備えたシステムが示されている。図1に図示されたシステムは、音源供給装置20を除けば、図7に図示されたシステムと同様の参照番号にて示された同様の部分を含んでいる。
【0051】
本発明の一実施例による音源供給装置20は、128kbit/secのWAV形式の元音源ファイル201と、その元音源ファイル201を加工した加工音源ファイル(GSM向け)202と、元音源ファイルを加工した加工音源ファイル(cdma向け)203とを蓄積している音源ファイル蓄積装置200と、音源再生装置(発信メロディー装置)300とを有する。
【0052】
各コーデック種別に応じた加工音源ファイル202および203は、本発明で作成したアルゴリズムによって元音源ファイル(基本音源ファイル)から加工して作成する。作成された加工音源ファイルを、音源データベースとしての音源ファイル蓄積装置200中に蓄積しておく。この加工する部分が今回の発明の核心部分である。
【0053】
図1には、発信メロディーサービスにおける音楽を聞く場合が示されている。すなわち、音源再生装置(発信メロディー装置)300は、音楽の再生要求を表す起動信号IAM (Initial Address Message)を受けた時、起動信号の中の発信者情報によって発信者が使用しているコーデック識別を決定し、該当コーデック向けに加工された音源ファイル(加工音源ファイル202および203の内の一つ)を選択して接続する。この際、加工された音源ファイルは、音源再生装置300によって、64kbit/secのμ Law PCM(Pulse Code Modulation)信号またはA Law PCM信号として送出される。
【0054】
次に、図1の音源供給装置20の音質改善時の接続の動作を説明する。
【0055】
図1において、起動信号IAMによって音楽再生要求があった場合、音源供給装置20は、起動信号IAMに含まれる発信者情報から発信端末105のコーデック種別を判断して、該当コーデック向けに加工された音源(加工音源ファイル202および203の内の一つ)の音楽を聞かせる。該当コーデック向けの音源が存在しない時は元音源(元音源ファイル201)の音楽を聞かせる。
【0056】
元音源ファイル201の元音源を元にして再生用の加工された音源ファイル202および203を作成する。この際、携帯電話のコーデック対応に対応が必要であるが、携帯電話105(GSM Terminal)の音声コーデック106向けの加工アルゴリズムの概要は以下の通りである。
【0057】
ここで、図2を参照して、元音源ファイル201の元音源(図2の(A)参照)を元にして作成された、再生用の加工音源ファイル(GSM向け)202(図2の(B)参照)について説明しておく。図2の(A)における元音源において、20msec単位の音声フレームのうち、ノイズと判定されたフレームとその直後の2フレーム(合計、3フレーム)を、図2の(B)に示すように、強制的に0に置き換える(無音にする。クリッピング。)。
【0058】
この加工を実現する加工アルゴリズムを、図3を参照して説明する。
【0059】
1)音楽を表現している基本音源を入力し(図3のステップS0)、音楽の小音量部分(小振幅部分)は音質劣化が激しくなるので、小振幅部分の伸張(Gain Control)を行う(図3のステップS1)。
【0060】
小音量のままであると劣化が激しくなる理由は以下の通りである。
【0061】
Gain control アルゴリズムは信号のEnergyを増幅することにより、以下の4)項で述べるクリッピング(clipping) 処理が動作するclippingの回数を減らす目的を持っている。図4を参照すると、音声度(pvad)の絶対値がノイズ閾値(thvad)に近い場合、最小値から始まったノイズ判定度が徐々に増加してノイズと見なされる値に至るまでの時間は非常に短い。話者認識(VAD)アルゴリズムによると、ノイズ閾値(thvad)が音声度(pvad)より大きくなるとノイズと判定されるが、図4の(1)のように、音声度(pvad)の絶対値が小さいとノイズ閾値(thvad)がすぐに音声度(pvad)に達するのでノイズフレームの強制切断を頻繁にしなければならない。図4の(2)の様に、音声の絶対値が大きいと、一旦強制切断を行った後、ノイズ閾値(thvad)がノイズと見なされる値に達するまでの時間が長くなり、強制切断の回数が減少する。
【0062】
2)入力された基本音源をコーデック(図1の106)の符号化単位である20msec毎(160標本)のフレームに分ける(図3のステップS2)。
【0063】
3)コーデック106におけるノイズと音声との識別(VAD:Voice Activity Detection)は、各フレーム毎に音声度(pvad)係数とノイズ閾値(thvad)を計算し(図3のステップS3)、音声度(pvad)係数>ノイズ閾値(thvad) の時、音声フレームと判定している(図3のステップS4)。
【0064】
4)ノイズ判定の論理を変更すると音楽の音質を改善することが出来るが、背景雑音を除去できなくなり、通常の通話の音質を劣化させてしまう。音楽伝送の為だけにコーデック106の仕様を変更することは出来ないので、本発明では、音源ファイル自体を加工する事により音質劣化を防ぐ。
【0065】
(音声度<ノイズ閾値)であるフレームは、ノイズフレームと判定される。よって、現在フレームがノイズフレームと認識されない様にするためには、音声度(pvad)がノイズ閾値(thvad)より大きくなければならない。音声度が常にノイズ閾値より大きくなるためには、GSMシミュレータによってノイズ閾値が音声度より大きくなる部分を探してその部分にてノイズ閾値を強制的に最小化させることにより音声度がノイズ閾値より大きくなるように動作を遂行する。この際、ノイズ閾値を最小化させるためにはVADでのノイズ閾値の更新において、該当入力フレームでの入力信号のエネルギーを強制的に0にしなければならないが、これは信号を強制的に0にすることで実現可能である。この処理をClipping処理という。
【0066】
5)音源を加工しない場合にノイズと見なされるフレームに対しては、該当フレーム(ノイズフレーム)とその直後の2フレームの合計3フレームを強制的に0に置き換える(無音にする)。3つの連続フレームを0に置き換えることにより、ノイズ判定の閾値を下げることが出来る(図3のステップS5)。3つの連続フレームを0に置き換えた音源ファイルを、GSM用加工音源ファイル(図1の202)として音源ファイル蓄積装置(図1の200)に出力する(図3のステップS6)。
【0067】
ここで、該当フレーム(ノイズフレーム)とその直後の2フレームを強制的に0に置き換える(無音にする)ことにより、判定の閾値を下げることができる理由について、説明する。
【0068】
GSMで使っているコーデック(図1の106)内部のアルゴリズムによると、ノイズ閾値は該当フレームのエネルギーに依存する要素が大きくなっている。そのため、入力信号を0(エネルギー=0)とすることによりノイズ閾値を下げることが出来る。
【0069】
この際、信号を0に置き換える(無音にする)ことで、閾値を下げるのに、有効なフレーム数について説明する。
【0070】
GSMで使っているノイズ閾値を求めるアルゴリズムによると、1フレーム無音、2フレーム無音では、ノイズ閾値が最小値まで下がらない。連続する3フレーム以上を無音にする事により、ノイズ閾値を最小値にすることが出来る。4フレーム以上無音にすると、再生した時に「プツッ」という瞬断の音が聞こえてしまう。2フレーム無音でも、4フレーム無音でも音質は改善されますが、3フレーム無音の場合に最良の改善度合いとなる。連続して無音にするフレーム数をN(=正の整数)であるとすると、Nが3以外の正整数の場合でも、音質は改善されるが、Nが3の場合が最良の改善効果となる。
【0071】
6)ノイズ閾値(thvad)を下げる事により、入力信号が音声と見なされる様になり、音質劣化が少なくなる。
【0072】
図5と図6に改善前(図7の100中の音源ファイル)と改善後(図1の202)の音源ファイルの音声度(pvad)とノイズ閾値(thvad)の変動の様子を示す。図5(改善前)はノイズ閾値(thvad)が高いため多くのフレームがノイズと判定されている。図6(改善後)は入力信号を強制切断することによりノイズ閾値を下げているため、ノイズと判定されるフレーム数が大幅に減少している。
【0073】
7)一度、ノイズ閾値を下げたとしてもその後の入力によりノイズ閾値が徐々に上昇する。上記1)項で述べた小振幅部分の伸張(Gain Control)を行う事により、ノイズ閾値がノイズとみなされる値までに達する時間を長くすることが出来る。その結果、強制的に切断されるフレームの数を少なくすることが出来る。
【0074】
このようにして、本発明においては、コーデック106に対応して加工された音源ファイル202を選択して接続しているので、音質劣化の少ない曲を聞くことができる。
【0075】
次に、音質改善の評価結果を説明する。
【0076】
1)シミュレータによる評価
音質改善の評価のため、20種類の音源を準備した。その評価結果を、下記の表2に示す。
【0077】
【表2】

【0078】
ここに示すノイズフレーム数は、改善前と改善後の音源に対してGSMのシミュレータを使って計測した。
【0079】
音楽によってノイズフレームの数及び本発明の音質改善によるノイズフレームの減少の割合は異なっている。歌が主体の音楽、バイオリン単独の音楽では、改善前のノイズフレームの数が少ない。特に、14番の音源は最初からノイズフレームと判定されるフレームが無く、改善前の音楽=改善後の音楽である。ピアノ曲、オーケストラ曲、ダイナミックが大きく急速に変化する音楽の場合は、ノイズフレームの数が多くなる。この様な曲に対して、本発明の音質改善が非常に有効である。
【0080】
2)実端末を使った主観評価(MOS)
各音源の加工前と加工後の音楽を実際の携帯電話網を通してGSM端末から再生した音楽を聞き比べて評価した。改善前音源では曲の1フレーズが終了した部分に「ブー」というノイズが混ざっていたが、改善後音源ではノイズが混ざることがほとんど無くなり、音質が改善されていることが評価出来た。
【0081】
音楽によって本発明の音質改善の効果の程度は異なっている。歌唱曲、弦楽曲では、改善前でもノイズが聞こえる数が少ない。ピアノ曲や強弱の変動が大きい曲の場合、ノイズに聞こえる部分が大幅に減少していた。
【産業上の利用可能性】
【0082】
本発明は、携帯電話で音楽を聞くサービス全般に広く利用出来る。
【0083】
特に、発信メロディーサービスにおいては、エンドユーザー、音源供給事業者の双方から音質の改善要求が出されている。エンドユーザーからは、「良い音質の音楽を聞きたい」との音質改善要求である。コンテンツ供給事業者からは、「供給した音楽を良い音質で聞かせたい。その結果として、提供コンテンツの売り上げを伸ばしたい。音質が悪ければ提供コンテンツの売り上げを伸ばすことが出来ない。」との要望がある。本発明は、これらの要求やようぼぷに要望に応えることができる。
【図面の簡単な説明】
【0084】
【図1】本発明の一実施例による音源供給装置を備えたシステムを説明するための図である。
【図2】図1のシステムにおいて用いられる、元音源ファイル及び加工音源ファイル(GSM向け)を説明するための図である。
【図3】図1のシステムにおいて用いられる、GSM用の音源ファイルの加工アルゴリズムの概要を示したフローチャートである。
【図4】図3のGSM用の音源ファイルの加工アルゴリズムの一部を説明するための図である。
【図5】図7のシステムにおいて用いられる音源ファイルの音声度(pvad)とノイズ閾値(thvad)の変動の様子を示す図である。
【図6】図1のシステムにおいて用いられる音源ファイルの音声度(pvad)とノイズ閾値(thvad)の変動の様子を示す図である。
【図7】現状の音源供給装置を備えたシステムを説明するための図である。
【符号の説明】
【0085】
10 音源供給装置
100 音源ファイル蓄積装置
101 音源再生装置
102 ゲートウェイスイッチ(GS)
103 モバイルスイッチングセンター(MSC)
104 基地局
105 携帯電話
106 音声コーデック
107 音声コーデック
20 音源供給装置
200 音源ファイル蓄積装置
201 元音源ファイル
202 加工音源ファイル(GSM向け)
203 加工音源ファイル(cdma向け)
300 音源再生装置

【特許請求の範囲】
【請求項1】
携帯端末を介して音楽を聞かせるサービスを行なう音源供給装置において、
複数種類のコーデック特性に応じて音質劣化が少なくなるように前記音楽の元音源に加工を加えて作成した複数種類の加工音源ファイルを、予め蓄積しておく音源ファイル蓄積装置と、
再生要求を表す起動信号を受けた時に、前記起動信号から前記携帯端末のコーデック種別を判定し、前記複数種類の加工音源ファイルの中から、前記判定したコーデック種別に応じた一つの加工音源ファイルを選択的に再生して、前記携帯端末に供給し、前記音楽を前記携帯端末を介して聞かせる音源再生装置とを備えたことを特徴とする音源供給装置。
【請求項2】
請求項1に記載の音源供給装置において、
前記音源再生装置は、再生要求を表す起動信号を受けた時に、前記起動信号に含まれる発信者情報により、前記携帯端末のコーデックの種別を判定するものであることを特徴とする音源供給装置。
【請求項3】
請求項1に記載の音源供給装置において、
前記複数種類の加工音源ファイルのうちのいずれかは、前記元音源における音声フレームのうち、元音源を加工しない場合にノイズとみなされる一つのフレームを少なくとも無音にする加工を加えて作成された加工音源ファイルであることを特徴とする音源供給装置。
【請求項4】
請求項3に記載の音源供給装置において、
前記複数種類の加工音源ファイルのうちのいずれかは、前記元音源における音声フレームのうち、元音源を加工しない場合にノイズとみなされる一つのフレームから始まる、連続する複数フレームを、無音にする加工を加えて作成された加工音源ファイルであることを特徴とする音源供給装置。
【請求項5】
請求項4に記載の音源供給装置において、
前記複数種類の加工音源ファイルのうちのいずれかは、前記元音源における音声フレームのうち、元音源を加工しない場合にノイズとみなされる一つのフレームから始まる、連続する3フレームを、無音にする加工を加えて作成された加工音源ファイルであることを特徴とする音源供給装置。
【請求項6】
携帯端末を介して音楽を聞かせるサービスを行なう音源供給方法において、
複数種類のコーデック特性に応じて音質劣化が少なくなるように前記音楽の元音源に加工を加えて作成した複数種類の加工音源ファイルを、予め蓄積しておくステップと、
再生要求を表す起動信号を受けた時に、前記起動信号から前記携帯端末のコーデック種別を判定する種別判定ステップと、
前記複数種類の加工音源ファイルの中から、前記判定したコーデック種別に応じた一つの加工音源ファイルを選択的に再生して、前記携帯端末に供給し、前記音楽を前記携帯端末を介して聞かせるステップとを備えたことを特徴とする音源供給方法。
【請求項7】
請求項6に記載の音源供給方法において、
前記種別判定ステップは、再生要求を表す起動信号を受けた時に、前記起動信号に含まれる発信者情報により、前記携帯端末のコーデックの種別を判定するステップであることを特徴とする音源供給方法。
【請求項8】
請求項6に記載の音源供給方法において、
前記複数種類の加工音源ファイルのうちのいずれかは、前記元音源における音声フレームのうち、元音源を加工しない場合にノイズとみなされる一つのフレームを少なくとも無音にする加工を加えて作成された加工音源ファイルであることを特徴とする音源供給方法。
【請求項9】
請求項8に記載の音源供給方法において、
前記複数種類の加工音源ファイルのうちのいずれかは、前記元音源における音声フレームのうち、元音源を加工しない場合にノイズとみなされる一つのフレームから始まる、連続する複数フレームを、無音にする加工を加えて作成された加工音源ファイルであることを特徴とする音源供給方法。
【請求項10】
請求項9に記載の音源供給方法において、
前記複数種類の加工音源ファイルのうちのいずれかは、前記元音源における音声フレームのうち、元音源を加工しない場合にノイズとみなされる一つのフレームから始まる、連続する3フレームを、無音にする加工を加えて作成された加工音源ファイルであることを特徴とする音源供給方法。
【請求項11】
携帯端末を介して音楽を聞かせるサービスを行なう音源供給装置において、
前記携帯端末のコーデック特性に応じて音質劣化が少なくなるように前記音楽の元音源に加工を加えて作成した加工音源ファイルを、予め蓄積しておく音源ファイル蓄積装置と、
再生要求を表す起動信号を受けた時に、前記加工音源ファイルを再生して、前記携帯端末に供給し、前記音楽を前記携帯端末を介して聞かせる音源再生装置とを備え、
前記加工音源ファイルは、前記元音源における音声フレームのうち、元音源を加工しない場合にノイズとみなされる一つのフレームを少なくとも無音にする加工を加えて作成された加工音源ファイルであることを特徴とする音源供給装置。
【請求項12】
請求項11に記載の音源供給装置において、
前記加工音源ファイルは、前記元音源における音声フレームのうち、元音源を加工しない場合にノイズとみなされる一つのフレームから始まる、連続する複数フレームを、無音にする加工を加えて作成された加工音源ファイルであることを特徴とする音源供給装置。
【請求項13】
請求項12に記載の音源供給装置において、
前記加工音源ファイルは、前記元音源における音声フレームのうち、元音源を加工しない場合にノイズとみなされる一つのフレームから始まる、連続する3フレームを、無音にする加工を加えて作成された加工音源ファイルであることを特徴とする音源供給装置。
【請求項14】
携帯端末を介して音楽を聞かせるサービスを行なう音源供給方法において、
前記携帯端末のコーデック特性に応じて音質劣化が少なくなるように前記音楽の元音源に加工を加えて作成した加工音源ファイルを、予め蓄積しておくステップと、
再生要求を表す起動信号を受けた時に、前記加工音源ファイルを再生して、前記携帯端末に供給し、前記音楽を前記携帯端末を介して聞かせるステップとを備え、
前記加工音源ファイルは、前記元音源における音声フレームのうち、元音源を加工しない場合にノイズとみなされる一つのフレームを少なくとも無音にする加工を加えて作成された加工音源ファイルであることを特徴とする音源供給方法。
【請求項15】
請求項14に記載の音源供給方法において、
前記加工音源ファイルは、前記元音源における音声フレームのうち、元音源を加工しない場合にノイズとみなされる一つのフレームを少なくとも無音にする加工を加えて作成された加工音源ファイルであることを特徴とする音源供給方法。
【請求項16】
請求項15に記載の音源供給方法において、
前記加工音源ファイルは、前記元音源における音声フレームのうち、元音源を加工しない場合にノイズとみなされる一つのフレームから始まる、連続する複数フレームを、無音にする加工を加えて作成された加工音源ファイルであることを特徴とする音源供給方法。
【請求項17】
請求項16に記載の音源供給方法において、
前記加工音源ファイルは、前記元音源における音声フレームのうち、元音源を加工しない場合にノイズとみなされる一つのフレームから始まる、連続する3フレームを、無音にする加工を加えて作成された加工音源ファイルであることを特徴とする音源供給方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2006−242979(P2006−242979A)
【公開日】平成18年9月14日(2006.9.14)
【国際特許分類】
【出願番号】特願2005−54290(P2005−54290)
【出願日】平成17年2月28日(2005.2.28)
【出願人】(000004237)日本電気株式会社 (19,353)
【出願人】(505074148)
【Fターム(参考)】