説明

同期再生装置、同期再生方法および同期再生プログラム

【課題】複数の音声データについてテンポ変化による違和感の少ない同期再生を可能にする同期再生装置、同期再生方法および同期再生プログラムを提供する。
【解決手段】周期性を有する2つの音声データを同期させて再生する同期再生装置100であって、テンポ変化に対して感じる違和感を定量化した情報を参照し、2つの音声データを再生するときの同期テンポを算出するテンポ算出部109と、2つの音声データを算出された同期テンポで再生する再生部106とを備える。これにより、テンポ変化による違和感を定量化することができ、2つの音声データについて違和感の少ない同期再生を可能にする。テンポ変化に対して感じる違和感を定量化した情報としては、たとえばユーザ固有の情報を用いることができる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、同期再生装置、同期再生方法および同期再生プログラムに関する。
【背景技術】
【0002】
従来、音楽を自動的にリミックスする技術が知られている。たとえば、特許文献1は、リミックス対象となる前後2楽曲において、後ろの楽曲のBPM(Beat Per Minute)情報を前の楽曲のBPM情報と一致させることで非熟練ユーザが楽曲をリミックスできる再生装置を提案している。
【0003】
特許文献2は、楽曲のテンポを推定するために楽曲信号周波数成分の帯域通過フィルタリングによって得られた拍子候補に対して振動器をマッチングさせ、テンポを自動抽出する技術を提案している。また、特許文献2には、場合によっては振動器の振動数を2の累乗することで検出テンポ精度を上げて行うリミックスが提案されている。また、楽曲自動リミックスを備えた再生装置として、特許文献3記載の装置などが挙げられる。特許文献3には音響的特徴に基づいて楽曲リミックスを行う際に楽曲間エフェクトを挿入する再生装置が記載されている。
【0004】
また、非特許文献4、5記載の技術は聴取者の違和感を軽減させるために、最適テンポ調整係数と呼ばれる係数を用いて楽曲における信号伸縮量を軽減させ、テンポ変化を制御させている。非特許文献4、5では以下の式によって信号の伸縮度合を定量化している。
【数1】

【0005】
ここで、fopt(x,y)は楽曲x、yのテンポを一致させるために用いられる係数であり、以下のように定義できる。
【数2】

【0006】
式(2)における「調整対象となるテンポ」には、調整対象となる楽曲固有のテンポのみならず、調整対象となる楽曲のリミックスのために選ばれたテンポも含まれる。たとえば、楽曲xのテンポを楽曲yのテンポに一致させるための係数をf_optx(x,y)と表し、楽曲yのテンポを楽曲xのテンポに一致させるための係数をf_opty(x,y)と表すことができる。その場合に、楽曲xの固有のテンポをT_x、楽曲yの固有のテンポをT_yとすれば、一例として楽曲yの固有のテンポを楽曲xの固有のテンポに一致させるための係数f_opty(x,y)は、式(2)’で表すことができる。
【数3】

【0007】
また、非特許文献6には、楽曲のテンポを徐々に調整できる技術が記載されている。
【先行技術文献】
【特許文献】
【0008】
【特許文献1】特開2001−243692号公報
【特許文献2】特表2004−527786号公報
【特許文献3】特開2006−337914号公報
【非特許文献】
【0009】
【非特許文献1】石先広海、帆足啓一郎、滝嶋康弘、「音質劣化を考慮した音楽自動リミックス手法」、研究報告 エンタテインメントコンピューティング(EC)、2008年3月、Vol.2008、No.26
【非特許文献2】石先広海、帆足啓一郎、滝嶋康弘、「自動DJミックス再生における信号伸縮率を用いた楽曲順序決定方法」、情報処理学会 第71回全国大会、講演論文集第二分冊、pp.41-42.
【非特許文献3】Roucos, S. and Wilgus, A. M., ”High quality time-scale modification for speech”, IEEE Int. Conf. Acoust., Speech, Signal Processing, Tampa, FL, March 1985, pp.493-496
【発明の概要】
【発明が解決しようとする課題】
【0010】
しかしながら、特許文献1〜3記載の技術では、自動リミックスの際にテンポ変化がどの程度違和感を与えるのかを定量化しておらず、実際にテンポを変化させた際に聴取者が違和感を覚えるのかを推し量ることができない。また、非特許文献4、5では式(1)で、原曲のテンポからどの程度テンポを変化させたかという指標に基づいてテンポ変化を定量化しているが、式(1)では聴取者のテンポ変化に対する違和感を考慮することが困難である。なお、テンポ変化の許容範囲や、テンポを遅くする場合と速くする場合とで聴取者による違和感の感じ方が異なることが実験により判明している。非特許文献6は、楽曲のテンポを徐々に調整するための一般的技術にすぎない。
【0011】
本発明は、このような事情に鑑みてなされたものであり、複数の音声データについて違和感の少ない同期再生を可能にする同期再生装置、同期再生方法および同期再生プログラムを提供することを目的とする。
【課題を解決するための手段】
【0012】
(1)上記の目的を達成するため、本発明の同期再生装置は、周期性を有する2つの音声データを同期させて再生する同期再生装置であって、テンポ変化に対して感じる違和感を定量化した情報を参照し、前記2つの音声データを再生するときの同期テンポを算出するテンポ算出部と、前記2つの音声データを前記算出された同期テンポで再生する再生部と、を備えることを特徴としている。これにより、2つの音声データについてテンポ変化による違和感の少ない同期再生を可能にする。
【0013】
(2)また、本発明の同期再生装置は、前記テンポ算出部が、前記2つの音声データのうち、一方の音声データの再生テンポを速くしたときにテンポ変化量が与える違和感の程度と、他方の音声データの再生テンポを遅くしたときにテンポ変化量が与える違和感の程度とを一致させるように同期テンポを算出することを特徴としている。これにより、与える違和感を最小にして2つの音声データを同期して再生することができる。
【0014】
(3)また、本発明の同期再生装置は、音声データの再生テンポを速くしたときにユーザが違和感を覚える第1のテンポ変化量および音声データの再生テンポを遅くしたときに前記ユーザが違和感を覚える第2のテンポ変化量の少なくともいずれか一方を、前記テンポ変化に対して感じる違和感を定量化した情報として取得する情報管理部を更に備えることを特徴としている。これにより、ユーザの感覚をユーザ固有の情報として取り入れて同期再生のテンポに反映させることができる。
【0015】
(4)また、本発明の同期再生装置は、前記情報管理部が、音声データを再生するテンポの変化開始時刻から前記ユーザからの入力時刻までの音声データの再生のテンポ変化量を計測することで、前記第1のテンポ変化量または第2のテンポ変化量を取得することを特徴としている。これにより、あらかじめテンポ変化量に対するユーザの違和感を定量的に評価することができる。その結果、音声データについて違和感の少ない同期再生を可能にできる。
【0016】
(5)また、本発明の同期再生装置は、前記情報管理部が、前記第1のテンポ変化量または前記第2のテンポ変化量からテンポを速くする際にテンポに乗ずる係数の重みづけまたはテンポを遅くする際にテンポに乗ずる係数の重みづけを算出することを特徴としている。これにより、テンポ変化による違和感の定量的な評価を音声データの同期再生時に反映させて、違和感の少ない同期再生を可能にできる。
【0017】
(6)また、本発明の同期再生装置は、前記テンポ算出部が、前記2つの音声データのうち、一方の音声データの固有のテンポをT_x、他方の音声データの固有のテンポをT_yとし、前記第1のテンポ変化量および前記第2のテンポ変化量から決まる所定の関係を有する重みづけ係数をa、bとしたとき、以下の数式により同期テンポT_aimを算出することを特徴としている。
【数4】


これにより、2つの曲のいずれの同期再生に対しても違和感の少ない同期テンポを算出することができる。
【0018】
(7)また、本発明の同期再生装置は、周期性を有する複数の音声データを同期させて再生する同期再生装置であって、あらかじめ設定されたパラメータに基づいて前記複数の音声データを同期再生し、前記同期再生を聴取するユーザによるフィードバック情報の入力を受け付けて、前記フィードバック情報に基づいて前記同期再生のテンポを調整することを特徴としている。このように同期再生のパラメータをフィードバックすることで、最適なテンポを得ることができる。
【0019】
(8)また、本発明の同期再生装置は、周期性を有する複数の音声データを同期させて再生する同期再生装置であって、連続して再生される2つの音声データのうち、一方の音声データの再生テンポを速くしたときにテンポ変化量が与える違和感の程度と、他方の音声データの再生テンポを遅くしたときにテンポ変化量が与える違和感の程度とを合計した総和を算出する総和算出部と、前記総和が最小となるように音声データの順序を決定する順序決定部とを備えることを特徴としている。これにより、同期再生時にテンポ変化による違和感を少なくするように音声データの順序を決定することができる。
【0020】
(9)また、本発明の同期再生装置は、上記の同期再生装置であって、連続して再生される2つの音声データのうち、一方の音声データの再生テンポを速くしたときにテンポ変化量が与える違和感の程度と、他方の音声データの再生テンポを遅くしたときにテンポ変化量が与える違和感の程度とを合計した総和を算出する総和算出部と、前記総和が最小となるように音声データの順序を決定する順序決定部とを更に備え、前記決定された再生順序で、与える違和感が少ないテンポで同期させて複数の音声データを連続で再生することを特徴としている。これにより、同期再生時の違和感の少ない順序で、音声データを違和感の少ない同期テンポでリミックス再生することができる。
【0021】
(10)また、本発明の同期再生方法は、2つの音声データを同期させて再生する同期再生方法であって、テンポ変化に対して感じる違和感を定量化した情報を参照し、前記2つの音声データを再生するときの同期テンポを算出するステップと、前記2つの音声データを前記算出された同期テンポで再生するステップと、を含むことを特徴としている。これにより、2つの音声データについてテンポ変化による違和感の少ない同期再生を可能にする。
【0022】
(11)また、本発明の同期再生方法は、周期性を有する複数の音声データを同期させて再生する同期再生方法であって、連続して再生される2つの音声データのうち、一方の音声データの再生テンポを速くしたときにテンポ変化量が与える違和感の程度と、他方の音声データの再生テンポを遅くしたときにテンポ変化量が与える違和感の程度とを合計した総和を算出するステップと、前記総和が最小となるように音声データの順序を決定するステップとを含むことを特徴としている。これにより、同期再生時に違和感を少なくするように音声データの順序を決定することができる。
【0023】
(12)また、本発明の同期再生方法は、上記の同期再生方法であって、連続して再生される2つの音声データのうち、一方の音声データの再生テンポを速くしたときにテンポ変化量が与える違和感の程度と、他方の音声データの再生テンポを遅くしたときにテンポ変化量が与える違和感の程度とを合計した総和を算出するステップと、前記総和が最小となるように音声データの順序を決定するステップとを更に含み、前記決定された再生順序で、与える違和感が少ないテンポで同期させて複数の音声データを連続で再生することを特徴としている。これにより、同期再生時の違和感の少ない順序で、音声データを違和感の少ない同期テンポでリミックス再生することができる。
【0024】
(13)また、本発明の同期再生プログラムは、2つの音声データを同期させて再生する同期再生プログラムであって、テンポ変化に対して感じる違和感を定量化した情報を参照し、前記2つの音声データを再生するときの同期テンポを算出する処理と、前記2つの音声データを前記算出された同期テンポで再生する処理と、を実行させることを特徴としている。これにより、2つの音声データについてテンポ変化による違和感の少ない同期再生を可能にする。
【0025】
(14)また、本発明の同期再生プログラムは、周期性を有する複数の音声データを同期させて再生する同期再生プログラムであって、連続して再生される2つの音声データのうち、一方の音声データの再生テンポを速くしたときにテンポ変化量が与える違和感の程度と、他方の音声データの再生テンポを遅くしたときにテンポ変化量が与える違和感の程度とを合計した総和を算出する処理と、前記総和が最小となるように音声データの順序を決定する処理とをコンピュータに実行させることを特徴としている。これにより、同期再生時に違和感を少なくするように音声データの順序を決定することができる。
【0026】
(15)また、本発明の同期再生プログラムは、上記の同期再生プログラムであって、連続して再生される2つの音声データのうち、一方の音声データの再生テンポを速くしたときにテンポ変化量が与える違和感の程度と、他方の音声データの再生テンポを遅くしたときにテンポ変化量が与える違和感の程度とを合計した総和を算出する処理と、前記総和が最小となるように音声データの順序を決定する処理とを更にコンピュータに実行させ、前記決定された再生順序で、与える違和感が少ないテンポで同期させて複数の音声データを連続で再生することを特徴としている。これにより、同期再生時の違和感の少ない順序で、音声データを違和感の少ない同期テンポでリミックス再生することができる。
【発明の効果】
【0027】
本発明によれば、複数の音声データについて違和感の少ない同期再生を可能にする。
【図面の簡単な説明】
【0028】
【図1】第1の実施形態に係る同期再生装置の構成を示すブロック図である。
【図2】第1の実施形態に係る同期再生装置の動作を示すフローチャートである。
【図3】サンプル楽曲のテンポ変化の設定画面を示す図である。
【図4A】サンプル楽曲のテンポ変化の一例を示すグラフである。
【図4B】サンプル楽曲のテンポ変化の一例を示すグラフである。
【図5】第2の実施形態に係る同期再生装置の構成を示すブロック図である。
【図6】第3の実施形態に係る同期再生装置の構成を示すブロック図である。
【図7】第3の実施形態に係る同期再生装置の動作を示すフローチャートである。
【図8】第3の実施形態に係る同期再生装置の動作を示すフローチャートである。
【発明を実施するための形態】
【0029】
本発明は、同期再生時のテンポ変化とテンポ変化が与える違和感との相関を定量化し、信号伸縮量を決定することで、個人の特性に対応してユーザの違和感を軽減させた自動リミックスを可能にしている。たとえばユーザ入力から得られたパラメータを用い、違和感の定量化式に基づいて楽曲の速度を制御している。
【0030】
以下に、本発明の実施の形態について、図面を参照しながら説明する。説明の理解を容易にするため、各図面において同一の構成要素に対しては同一の参照番号を付し、重複する説明は省略する。なお、本発明は、周期性を有する音声データの同期再生に対して適用可能であるが、以下の例では、周期性を有する音声データの一例として楽曲データを対象として説明する。
【0031】
[第1の実施形態]
(同期再生装置の構成)
図1は、同期再生装置100の構成を示すブロック図である。同期再生装置100は、周期性を有する2つの楽曲データ(音声データ)を同期させて再生する。図1に示すように、同期再生装置100は、入力部101、サンプル取得部102、音声データベース103、テンポ調整部104、設定部105、再生部106、情報管理部107、音声データ取得部108およびテンポ算出部109を備えている。
【0032】
入力部101は、ユーザから、サンプル音源の再生や楽曲データの同期再生の指示を受け付ける。また、サンプル音源のテンポ変化に対して、ユーザから違和感を覚えた時刻に入力を受け付ける。この入力時刻をt_inputとすると、違和感限界テンポ調整係数Fは以下の式(3)により表現できる。
【数5】

【0033】
なお、テンポを変化させる時間単位をt_adj、テンポ調整係数の変化量をΔfと表している。オリジナルのテンポから徐々にテンポが速くなるもしくは遅くなる時刻を、テンポ変化開始時刻としてt_adと表している。また、celingは少数切り上げを表している。
【0034】
このような違和感限界テンポ調整係数Fを利用し、たとえば、Fを超えるテンポ調整が必要な場合には楽曲再生時にリミックスを適用しないこととしてもよいし、第三の音源を挿入することとしてもよい。
【0035】
また、入力部101は、楽曲再生をしながらのキーの押下により、楽曲のテンポ調整に関してGUIを介した設定も受け付ける。この設定に関しては、後述する。入力部101は、順序決定を行うために楽曲群を指定する入力を受け付ける。
【0036】
サンプル取得部102は、音声データベースからユーザに提示するための楽曲データを取得する。あらかじめサンプルとして準備された楽曲や音源を、違和感を定量化する際に再生する楽曲データとして利用できる。
【0037】
音声データベース103は、サンプル用の楽曲データおよびテンポ調整を適用するための楽曲データを格納する。いずれの楽曲データも固有のテンポを有している。音声データベース103は、楽曲ファイル、タイトル、アーティスト情報、識別IDなどの情報も格納する。楽曲データベース103に格納されるファイルを、ネットワーク経由で取得することも可能である。
【0038】
設定部105は、ユーザからの入力に応じて楽曲データのテンポ調整の設定を調整する。テンポ変化開始時刻t_adはオリジナルのテンポから徐々にテンポが速くなるもしくは遅くなる時刻であり、任意に設定できる。たとえば、テンポ変化開始時刻をサンプルの音声データの再生開始から10秒と設定できる。また、テンポ変化開始時刻からのテンポ変化率も任意に設定できる。たとえば、3秒毎にテンポ調整係数fを±0.05ずつ変動させることで階段状に速度を上昇もしくは下降させることもできる。サンプルの楽曲データとしては、基本的にテンポを速くするものと、テンポを遅くするものの2つを別々に生成する。ただし、一方だけを作成するか、両者それぞれを複数作成することとしてもよい。
【0039】
テンポ調整部104は、サンプル曲の再生時に、サンプル取得部102によって得られたサンプルの楽曲データのテンポ調整を行い、再生テンポを速くする音源とテンポを遅くする音源とを生成する。たとえば、サンプルの楽曲データが有する固有のテンポに対して、一定の割合で再生テンポを速くする(または遅くする)ことができる。たとえば、テンポ調整処理におけるパラメータとして、テンポ変化開始時刻t_ad=10(sec)、t_adj=3(sec)、Δf=0.05と設定してテンポを調整できる。なお、このようなパラメータは必ずしも事前に固定されている必要はなく、GUIなどを介してユーザにより随時変更可能としてもよい。
【0040】
また、テンポ調整部104は、同期再生時(リミックス時)には、テンポ算出部109によって得られた、楽曲データごとのテンポ調整係数を用いて、再生する楽曲のテンポを調整する。その場合、同期テンポT_aimが式(2)における「調整目標となるテンポ」である。「調整対象となるテンポ」としては、楽曲データに固有のテンポやリミックスに最適なものとしてあらかじめ選ばれたテンポが挙げられる。
【0041】
再生部106は、サンプルの楽曲データおよび同期再生用の楽曲データを調整されたテンポで再生する。同期再生時には、2つの楽曲データを算出された同期テンポで再生する。たとえば、テンポ調整された楽曲のビート位置を同期させ、クロスフェードさせてリミックス再生(同期再生)を行う。
【0042】
情報管理部107は、ユーザ入力モジュールによって得られた違和感限界テンポ調整係数Fから、以下に示す式(5)を用いて式(4)の係数を決定する。ただし、fopt(x,y)の詳細については後述する。
【数6】


【数7】

【0043】
情報管理部107は、ユーザの入力を入力部101が受け付けることにより、楽曲データの再生テンポを速くしてユーザが違和感を覚えるまでの第1のテンポ変化量と楽曲データの再生テンポを遅くしてユーザが違和感を覚えるまでの第2のテンポ変化量とを、テンポ変化に対して感じる違和感を定量化した情報として取得する。この情報は、ユーザ固有の情報でもある。すなわち、情報管理部107は、音声データを再生するテンポの変化開始時刻からユーザからの入力時刻までの音声データの再生のテンポ変化量を計測することで、第1のテンポ変化量および第2のテンポ変化量を取得する。
【0044】
そして、情報管理部107は、違和感時刻と違和感限界テンポ調整係数等のデータを対応付けて記憶する。たとえば、テンポを遅くした場合の違和感時刻、テンポを速くした場合の違和感時刻を、それぞれの時刻における違和感限界テンポ調整係数F_slow、F_fastとともに記憶する。そして、違和感限界テンポ調整係数Fに基づいて、違和感を定量化し、再生時のテンポ変化の最適化を行う。
【0045】
このように、F_slow、F_fastを用いて上記の式(4)に示すテンポ変化量Vの重み付けa、bを変更することできる。これにより、ユーザ個人の違和感を考慮したテンポ変化量を決定できる。すなわち、実際に再生された音声データに対して、ユーザが違和感を覚えた時刻に入力を受け付けることで、フィードバック情報を得てテンポ調整のパラメータを更新できる。このように、情報管理部107は、第1のテンポ変化量および第2のテンポ変化量からテンポを速くする際にテンポに乗ずる係数の重みづけおよびテンポを遅くする際にテンポに乗ずる係数の重みづけを算出する。
【0046】
なお、情報管理部107は、あらかじめ複数の聴取者から集められた違和感限界テンポ調整係数F_slow、F_fastまたは重みづけ係数a、bを取得し、得られた重みづけ係数a、bを管理してもよい。また、ユーザから入力があるまでは、あらかじめ同期再生装置100に設定された重みづけ係数a、bを管理することとしてもよい。
【0047】
音声データ取得部108は、テンポ調整を適用するための楽曲データを音声データベース103から取得する。すなわち、音声データ取得部108は、リミックス対象となる楽曲ファイルおよびそのテンポ情報を取得する。楽曲ファイルにあらかじめテンポ情報が付与されていない場合、テンポ情報の付与処理ツールによりテンポ情報を付与させることもできる。
【0048】
たとえば、同期再生の対象となる2楽曲のタイトル、識別IDを入力した際に、入力に対応する楽曲を音声データベース103から抽出するようにしてもよい。なお、入力情報は、タイトル、識別IDに限らず、楽曲データを特定できる情報であればよい。また、入力する楽曲の数は2楽曲に限られない。
【0049】
テンポ算出部109は、テンポ変化に対して感じる違和感を定量化した情報を参照し、ユーザの違和感が少ないテンポを、2つの音声データを再生するときの同期テンポとして算出する。たとえばテンポ算出部109は、2つの音声データのうち、一方の音声データの再生テンポを速くしたときにテンポ変化量が与える違和感の程度と、他方の音声データの再生テンポを遅くしたときにテンポ変化量が与える違和感の程度とを一致させるように同期テンポを算出する。以下にその例を説明する。
【0050】
(同期テンポの算出)
まず、変数a、bに基づいて最適化された式(4)に基づいて、テンポ調整係数fopt(x,y)を計算する。たとえば、式(4)において、fopt(x,y)>1の場合と,fopt(x,y)<1の場合のV値が一致するようにテンポ合致数値T_aimを設定するとした場合、T_aimは2次方程式の解となり、式(6)のように表せる。なお、T_x、T_yはミックス対象となる楽曲x、yのテンポ(すなわちBPM)を表し、T_x<T_yの関係を満たしているものとする。
【数8】

【0051】
このようにして得られたテンポ合致数値T_aimで楽曲を同期再生することで、違和感の度合が最も少なくなるようなテンポ変化を提供できる。T_aimを用いれば、楽曲x、yのテンポ調整係数は式(7)により表せる。
【数9】

【0052】
式(6)、(7)を用いて、再生する楽曲のテンポを調整し、その楽曲を同期再生することで、楽曲テンポの変化に対するユーザの違和感を軽減できる。なお、既にa、bが取得されている場合には、a、bの算出を省きテンポ調整係数を計算すればよい。
【0053】
また、上記の式(7)は、事前に最適なテンポを選ばない場合のものであるが、事前に最適なテンポT_optx、T_optyを選んでもよい。その場合には、テンポ調整係数は式(7)’により表せる。たとえば、楽曲に固有の最適なテンポはT_optx=2×T_y(C=−2,−1,0,1,2)を満たす数値のうち、T_xに最も近いもの、またはT_opty=2c0×T_x(C0=−2,−1,0,1,2)を満たす数値のうち、T_xに最も近いものとして決定することができる。なお、テンポ調整係数として式(7)と式(7)’によるf_optx、f_optyの組合せのうちのいずれかを用いてもよい。
【数10】

【0054】
なお、上記の例では、2つの音声データの再生テンポを変化させることを前提としているが、一方の楽曲のテンポのみを変えてもよい。その場合には、式(4)によって求められた違和感の程度が小さい方の楽曲のテンポを変え、他方の楽曲のテンポは変えない。
【0055】
(同期再生装置100の動作)
図2は、同期再生装置100の動作を示すフローチャートである。図2に示すように、まず、同期再生装置100は、サンプルの楽曲データを取得する(ステップS1)。次に、サンプルの楽曲データを設定に従ってテンポ調整し、テンポを変化させながら楽曲を再生する(ステップS2)。そして、違和感を覚えたときにユーザによりなされる入力を受け付ける(ステップS3)。ステップS2、S3については、テンポを速くする再生とテンポを遅くする再生をそれぞれ行うことが好ましい。
【0056】
次に、テンポ調整を最適化するために、得られたユーザの入力時刻からテンポ調整係数fopt(x,y)に対する重みづけa、bを算出する(ステップS4)。そして、同期再生のための楽曲データを取得する(ステップS5)。取得された楽曲データに対して算出された重みづけa、bによりテンポ調整係数fopt(x,y)を算出し(ステップS6)、テンポを調整して楽曲データを再生する(ステップS7)。このようにして、2つの楽曲データについて個々のユーザに応じて違和感の少ない同期再生を行うことができる。
【0057】
(テンポ変化のパラメータ設定)
次に、サンプル楽曲を再生する際に行われるテンポ変化のパラメータ設定を説明する。図3は、サンプル楽曲のテンポ変化の設定画面を示す図である。図3に示すように、たとえば、テンポ変化開始時刻t_ad=10、t_adj=3、Δf=+0.05として、テンポを速めた音源を利用するとき、ユーザが楽曲開始から20秒時点で違和感を覚えて入力をした場合には、式(3)により、F=1.20として保持される。なお、Fが得られていない場合、事前に多くのユーザから違和感を覚えたテンポ変化時間を取得し、あらかじめ平均的な値を算出し、Fとして設定してもよい。
【0058】
(サンプル楽曲のテンポ変化)
次に、サンプル楽曲のテンポ変化について説明する。図4Aおよび図4Bは、サンプル楽曲のテンポ変化の一例を示すグラフである。図4Aおよび図4Bに示すように、サンプル楽曲に固有のテンポをBPMとすると、これに対して一定の変化率でテンポを変化させることができる。図4Aに示す例では、固有のテンポから楽曲再生のテンポを速くしている。また、図4Bに示す例では、固有のテンポから楽曲再生のテンポを遅くしている。ユーザ入力時刻t_inputとテンポ変化開始時刻t_adとの差が、ユーザが違和感を覚えるまでのテンポ変化に対応しており、図4Aおよび図4Bに示す例では、テンポが遅くなる場合の方が速くなる場合より違和感を覚えやすい傾向があることが分かる。
【0059】
[第2の実施形態]
(同期再生装置の構成)
上記の実施形態では、サンプルの楽曲データを再生してテンポ変化に対して感じる違和感を定量化した情報を得ているが、必ずしもサンプルの楽曲データを再生する必要はない。図5は、サンプルの楽曲データを用いない同期再生装置の構成を示すブロック図である。図5に示すように、同期再生装置200は、入力部101、音声データベース103、テンポ調整部104、再生部106、情報管理部107、音声データ取得部108およびテンポ算出部109を備えている。各部の機能は同期再生装置100と同様である。このような構成により、中間値等のあらかじめ設定した値を用いてリミックス音源を生成し、実際に再生された音源に対して違和感を覚えた場合に時刻等の入力を行うことで、サンプル音源の再生を省略できる。なお、あらかじめ多くのユーザから違和感を覚えた時刻やパラメータの入力を受け付け、その平均値を初期設定値として利用してもよい。
【0060】
[第3の実施形態]
(同期再生装置の構成)
上記の実施形態では、同期再生時の違和感の低減にテンポ変化に対して感じる違和感を定量化した情報を利用しているが、楽曲の再生順序についてもテンポ変化に対して感じる違和感を定量化した情報を利用し、違和感を低減することができる。すなわち、テンポ調整係数fopt(x,y)を利用して、音質劣化の最も少ない組合せを計算し、再生楽曲の順序(プレイリスト)を決定できる。
【0061】
図6は、同期再生装置の構成を示すブロック図である。図6に示すように、同期再生装置300は、入力部101、サンプル取得部102、音声データベース103、テンポ調整部104、設定部105、再生部106、情報管理部107、音声データ取得部108、テンポ算出部109、総和算出部301、順序決定部302を備えている。入力部101、サンプル取得部102、音声データベース103、テンポ調整部104、設定部105、再生部106、情報管理部107、音声データ取得部108、テンポ算出部109の各部の機能は、同期再生装置100と同様である。
【0062】
総和算出部301は、連続して再生される2つの音声データのうち、一方の音声データの再生テンポを速くしたときにテンポ変化量が与える違和感の程度と、他方の音声データの再生テンポを遅くしたときにテンポ変化量が与える違和感の程度とを合計した総和を算出する。
【0063】
順序決定部302は、総和が最小となるように音声データの順序を決定する。すなわち、順序決定部302は、対象となる楽曲群のうち2つの楽曲を同期再生させる場合に違和感が少なくなるように楽曲順序を決定する。なお、順序情報をプレイリストとして、外部出力し、記憶することも可能である。
【0064】
(同期再生装置の動作)
次に、順序決定プロセスの一例を説明する。図7および図8は、同期再生装置300の動作を示すフローチャートである。まず、以下の式で表される順序決定対象となる楽曲群Lから2曲を選択する(ステップT1)。
【数11】

【0065】
順序決定対象となる楽曲群が式(8)で表せるとき、楽曲Axと楽曲Ayのテンポ調整係数をそれぞれ、foptx(x,y)、fopty(x,y)として式(7)を用いることで計算することができる。foptx(x,y)、fopty(x,y)に対して、ν(x,y)、ν(x,y)を以下の式で定義する。
【数12】


【数13】


【数14】

【0066】
楽曲Ayと楽曲Axとをテンポ調整する場合のテンポ調整係数foptx(x,y)、fopty(x,y)を算出する(ステップT2)。次に、1<foptx(x,y)であるか否かを判定する(ステップT3)。1<foptx(x,y)でない場合には、foptx(x,y)<1か否かを判定する(ステップT4)。foptx(x,y)<1でない場合には、foptx(x,y)=1と判定し、ν(x,y)を0とし(ステップT5)、ステップT8へ進む。一方、ステップT4において、foptx(x,y)<1であると判定された場合には、ν(x,y)をb・abs(1−1/foptx(x,y))とし(ステップT6)、ステップT8へ進む。また、ステップT3において、1<foptx(x,y)であると判定された場合には、ν(x,y)をa・abs(1−foptx(x,y))とし(ステップT7)、ステップT8へ進む。
【0067】
次に、1<fopty(x,y)であるか否かを判定する(ステップT8)。1<fopty(x,y)でない場合には、fopty(x,y)<1か否かを判定する(ステップT9)。fopty(x,y)<1でない場合には、fopty(x,y)=1と判定し、ν(x,y)を0とし(ステップT10)、ステップT13へ進む。一方、ステップT9において、fopty(x,y)<1であると判定された場合には、ν(x,y)をb・abs(1−1/fopty(x,y))とし(ステップT11)、ステップT13へ進む。また、ステップT8において、1<fopty(x,y)であると判定された場合には、ν(x,y)をa・abs(1−fopty(x,y))とし(ステップT12)、ステップT13へ進む。
【0068】
次に、得られたν(x,y)およびν(x,y)からその和であるV(x,y)を算出する(ステップT13)。そして、順序決定対象となる楽曲群のすべての2曲の組み合わせについて上記の計算を終えたか否かを判定し(ステップT14)、終えていない場合には、ステップT1に戻る。一方、すべての組み合わせについて計算を終えた場合にはステップT13に進む。
【0069】
次に、楽曲群Lから作成可能なプレイリスト群P、および各プレイリストpを算出する(ステップT15)。式(12)はプレイリスト群P、式(13)は各プレイリストpを示している。
【数15】


【数16】

【0070】
そして、一つのプレイリストpを抽出し(ステップT16)、Vs(i)を曲順に総和して式(14)のScore(p)を算出する(ステップT17)。Vs(i)は、V(m,mi+1)とV(mi+1,m)(i=1,2,・・・,n−1)のうち値の小さいものを表している。
【数17】

【0071】
次に全てのプレイリストについてScore(p)の算出が終わったか否かを判定し(ステップT18)、算出が終わっていない場合にはステップT14に戻る。算出が終わった場合にはあ、総和Score(p)が最小となるプレイリストpを決定する(ステップT19)。このようにして、テンポ調整度スコアScore(p)が最小となるようなプレイリストpを求める。これにより、テンポ変化による違和感を少なくするプレイリストpを作成できる。そして、決定されたプレイリストpzの曲順で楽曲データを再生し(ステップT20)、終了する。
【0072】
このようにして、楽曲群Lに対してビートを合わせたリミックスを行い、ユーザ違和感をより軽減することが可能なプレイリストを自動で作成できる。なお、既にa、bが取得されている場合には、a、bを算出するプロセスを省略できる。このようにして、前後楽曲の両方をテンポ調整する場合、音質劣化が最小となるプレイリストを自動で生成することができる。
【0073】
また、複数楽曲をリミックスする際に、第1の実施形態に記載の方法を用いることで、実際にテンポ・ビート位置を合わせたリミックスにおいて、複数楽曲全体での違和感を個人に特化して軽減することができる。
【0074】
なお、本実施形態でも、必ずしもサンプル楽曲を用意する必要はなく、たとえば、同期再生装置200のように、最初は中間値を用いてリミックスを生成し、実際に再生された音源に対して違和感を覚えた時刻の入力等を行い、サンプル音源生成を省略できる。また、あらかじめ多くのユーザから違和感を覚えた時刻やパラメータの入力を受け付け、平均値を初期設定値として利用してもよい。また、同期再生の際には、必ずしも第1または第2の実施形態により同期再生させる必要はなく、本実施形態の方法で楽曲の順序を決定し、公知の方法で同期再生してもよい。
【符号の説明】
【0075】
100、200、300 同期再生装置
101 入力部
102 サンプル取得部
103 音声データベース
104 テンポ調整部
105 設定部
106 再生部
107 情報管理部
108 音声データ取得部
109 テンポ算出部
301 総和算出部
302 順序決定部


【特許請求の範囲】
【請求項1】
周期性を有する2つの音声データを同期させて再生する同期再生装置であって、
テンポ変化に対して感じる違和感を定量化した情報を参照し、前記2つの音声データを再生するときの同期テンポを算出するテンポ算出部と、
前記2つの音声データを前記算出された同期テンポで再生する再生部と、を備えることを特徴とする同期再生装置。
【請求項2】
前記テンポ算出部は、前記2つの音声データのうち、一方の音声データの再生テンポを速くしたときにテンポ変化量が与える違和感の程度と、他方の音声データの再生テンポを遅くしたときにテンポ変化量が与える違和感の程度とを一致させるように同期テンポを算出することを特徴とする請求項1記載の同期再生装置。
【請求項3】
音声データの再生テンポを速くしたときにユーザが違和感を覚える第1のテンポ変化量および音声データの再生テンポを遅くしたときに前記ユーザが違和感を覚える第2のテンポ変化量の少なくともいずれか一方を、前記テンポ変化に対して感じる違和感を定量化した情報として取得する情報管理部を更に備えることを特徴とする請求項1または請求項2記載の同期再生装置。
【請求項4】
前記情報管理部は、音声データを再生するテンポの変化開始時刻から前記ユーザからの入力時刻までの音声データの再生のテンポ変化量を計測することで、前記第1のテンポ変化量または第2のテンポ変化量を取得することを特徴とする請求項3記載の同期再生装置。
【請求項5】
前記情報管理部は、前記第1のテンポ変化量または前記第2のテンポ変化量からテンポを速くする際にテンポに乗ずる係数の重みづけまたはテンポを遅くする際にテンポに乗ずる係数の重みづけを算出することを特徴とする請求項4記載の同期再生装置。
【請求項6】
前記テンポ算出部は、前記2つの音声データのうち、一方の音声データの固有のテンポをT_x、他方の音声データの固有のテンポをT_yとし、前記第1のテンポ変化量および前記第2のテンポ変化量から決まる所定の関係を有する重みづけ係数をa、bとしたとき、以下の数式により同期テンポT_aimを算出することを特徴とする請求項3から請求項5のいずれかに記載の同期再生装置。
【数1】

【請求項7】
周期性を有する複数の音声データを同期させて再生する同期再生装置であって、
あらかじめ設定されたパラメータに基づいて前記複数の音声データを同期再生し、前記同期再生を聴取するユーザによるフィードバック情報の入力を受け付けて、前記フィードバック情報に基づいて前記同期再生のテンポを調整することを特徴とする同期再生装置。
【請求項8】
周期性を有する複数の音声データを同期させて再生する同期再生装置であって、
連続して再生される2つの音声データのうち、一方の音声データの再生テンポを速くしたときにテンポ変化量が与える違和感の程度と、他方の音声データの再生テンポを遅くしたときにテンポ変化量が与える違和感の程度とを合計した総和を算出する総和算出部と、
前記総和が最小となるように音声データの順序を決定する順序決定部とを備えることを特徴とする同期再生装置。
【請求項9】
請求項1から請求項7のいずれかに記載の同期再生装置であって、
連続して再生される2つの音声データのうち、一方の音声データの再生テンポを速くしたときにテンポ変化量が与える違和感の程度と、他方の音声データの再生テンポを遅くしたときにテンポ変化量が与える違和感の程度とを合計した総和を算出する総和算出部と、
前記総和が最小となるように音声データの順序を決定する順序決定部とを更に備え、
前記決定された再生順序で、与える違和感が少ないテンポで同期させて複数の音声データを連続で再生することを特徴とする同期再生装置。
【請求項10】
2つの音声データを同期させて再生する同期再生方法であって、
テンポ変化に対して感じる違和感を定量化した情報を参照し、前記2つの音声データを再生するときの同期テンポを算出するステップと、
前記2つの音声データを前記算出された同期テンポで再生するステップと、を含むことを特徴とする同期再生方法。
【請求項11】
周期性を有する複数の音声データを同期させて再生する同期再生方法であって、
連続して再生される2つの音声データのうち、一方の音声データの再生テンポを速くしたときにテンポ変化量が与える違和感の程度と、他方の音声データの再生テンポを遅くしたときにテンポ変化量が与える違和感の程度とを合計した総和を算出するステップと、
前記総和が最小となるように音声データの順序を決定するステップとを含むことを特徴とする同期再生方法。
【請求項12】
請求項10記載の同期再生方法であって、
連続して再生される2つの音声データのうち、一方の音声データの再生テンポを速くしたときにテンポ変化量が与える違和感の程度と、他方の音声データの再生テンポを遅くしたときにテンポ変化量が与える違和感の程度とを合計した総和を算出するステップと、
前記総和が最小となるように音声データの順序を決定するステップとを更に含み、
前記決定された再生順序で、与える違和感が少ないテンポで同期させて複数の音声データを連続で再生することを特徴とする同期再生方法。
【請求項13】
2つの音声データを同期させて再生する同期再生プログラムであって、
テンポ変化に対して感じる違和感を定量化した情報を参照し、前記2つの音声データを再生するときの同期テンポを算出する処理と、
前記2つの音声データを前記算出された同期テンポで再生する処理と、を実行させることを特徴とする同期再生プログラム。
【請求項14】
周期性を有する複数の音声データを同期させて再生する同期再生プログラムであって、
連続して再生される2つの音声データのうち、一方の音声データの再生テンポを速くしたときにテンポ変化量が与える違和感の程度と、他方の音声データの再生テンポを遅くしたときにテンポ変化量が与える違和感の程度とを合計した総和を算出する処理と、
前記総和が最小となるように音声データの順序を決定する処理とをコンピュータに実行させることを特徴とする同期再生プログラム。
【請求項15】
請求項13記載の同期再生プログラムであって、
連続して再生される2つの音声データのうち、一方の音声データの再生テンポを速くしたときにテンポ変化量が与える違和感の程度と、他方の音声データの再生テンポを遅くしたときにテンポ変化量が与える違和感の程度とを合計した総和を算出する処理と、
前記総和が最小となるように音声データの順序を決定する処理とを更にコンピュータに実行させ、
前記決定された再生順序で、与える違和感が少ないテンポで同期させて複数の音声データを連続で再生することを特徴とする同期再生プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4A】
image rotate

【図4B】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate


【公開番号】特開2011−8136(P2011−8136A)
【公開日】平成23年1月13日(2011.1.13)
【国際特許分類】
【出願番号】特願2009−153269(P2009−153269)
【出願日】平成21年6月29日(2009.6.29)
【出願人】(000208891)KDDI株式会社 (2,700)
【Fターム(参考)】