同期再生装置、楽曲自動リミックスシステム、同期再生方法および同期再生プログラム
【課題】周期性を有する音声情報または周期性を有する映像情報のいずれかである2つの視聴覚情報を再生時に滑らかに同期させる。
【解決手段】2つの視聴覚情報を再生時に同期させる同期再生方法であって、乗算部において、一方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMMに対して単調増加数列を形成する複数の数値を乗算するステップS4と、選択部において、前記乗算により得られた数値群から、他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOに最も近い数値boptを選択するステップS5と、除算部において、前記他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOを、前記boptで除算して得られる最適調整係数foptを出力するステップS6と、を少なくとも含む。
【解決手段】2つの視聴覚情報を再生時に同期させる同期再生方法であって、乗算部において、一方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMMに対して単調増加数列を形成する複数の数値を乗算するステップS4と、選択部において、前記乗算により得られた数値群から、他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOに最も近い数値boptを選択するステップS5と、除算部において、前記他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOを、前記boptで除算して得られる最適調整係数foptを出力するステップS6と、を少なくとも含む。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、周期性を有する音声情報または周期性を有する映像情報のいずれかである2つの視聴覚情報を再生時に同期させる技術に関する。
【背景技術】
【0002】
従来から、音楽を自動的にリミックスする技術が知られている。例えば、特開2001−243692号公報(特許文献1)に開示されている技術は、リミックス対象となる前後2楽曲において、後ろの楽曲のBPM(Beats Per Minute)情報を、前の楽曲のBPM情報と一致させる。これにより、ユーザが、仮に楽曲のリミックスに熟練していなくても、容易にリミックスを行なうことができる。また、例えば、特表2004−527786号公報(特許文献2)に開示されている技術は、楽曲のテンポを推定するために楽曲信号周波数成分の帯域通過フィルタリングによって得られた拍子候補に対し、振動器をマッチングさせることでテンポを自動抽出する。また、振動器の振動数を2の累乗することによって、検出テンポ精度を上げ、リミックスを行なっている。また、特開2006−337914号公報(特許文献3)に開示されている技術は、楽曲自動リミックス機能を備えた再生装置に関するものである。この再生装置では、音響的特徴に基づいて楽曲リミックスを行なう際に、楽曲間エフェクトを挿入する。
【特許文献1】特開2001−243692号公報
【特許文献2】特開2004−527786号公報
【特許文献3】特開2006−337914号公報
【非特許文献1】Alonso M., David B. and Richard G., “Tempo and Beat Estimation of Musical Signals”, Proc. ISMIR 2004, pp. 158−163
【発明の開示】
【発明が解決しようとする課題】
【0003】
しかしながら、特許文献1では、BPMを一致させるリミックスを行なっているが、リミックス対象となる楽曲同士のBPMが大きく異なる場合、BPMを一致させるための楽曲信号伸縮操作が音質を大きく劣化させてしまうという問題がある。また、特許文献2では、楽曲のテンポ情報推定後のリミックス時におけるBPM調整は、特許文献1と同様の手法を用いる必要があるため、同じような問題を有している。また、特許文献3においては、時系列上におけるテンポ、ビート情報を考慮して楽曲をリミックスしていないため、DJが操作しているような心地の良いリミックスは得られない。さらに、従来の技術では、リミックス楽曲数が増えるに従って、ユーザの操作負担が増加してしまうという問題がある。
【0004】
例えば、楽曲A、BのBPMをそれぞれBPMA、BPMBとし、楽曲テンポを調整する係数をfとすると、従来の方法では、以下のような操作を行なっていた。すなわち、
BPMA=f×BPMB・・・(1)、または、
f×BPMA=BPMB・・・(2)、
となるような操作を行なうことによって、リミックス前後の楽曲のテンポを調整していた。しかしながら、式(1)、(2)では、テンポが大きく異なる楽曲をリミックスする場合は、音楽信号を伸縮する度合いが大きくなるため、音質が劣化してしまう。
【0005】
本発明は、このような事情に鑑みてなされたものであり、周期性を有する音声情報または周期性を有する映像情報のいずれかである2つの視聴覚情報を再生時に滑らかに同期させることができる同期再生装置、楽曲自動リミックスシステム、同期再生方法および同期再生プログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
(1)上記の目的を達成するために、本発明は、以下のような手段を講じた。すなわち、本発明の同期再生装置は、周期性を有する音声情報または周期性を有する映像情報のいずれかである2つの視聴覚情報を再生時に同期させる同期再生装置であって、一方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMMに対して単調増加数列を形成する複数の数値を乗算する乗算部と、前記乗算により得られた数値群から、他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOに最も近い数値boptを選択する選択部と、前記他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOを、前記boptで除算して得られる最適調整係数foptを出力する除算部と、前記一方の視聴覚情報に対して少なくとも前記最適調整係数foptを乗じて再生し、それと同時に前記他方の視聴覚情報を再生する再生部と、を備えることを特徴としている。
【0007】
このように、乗算により得られた数値群から、他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOに最も近い数値boptを選択し、前記他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOを、前記boptで除算して得られる最適調整係数foptを出力し、前記一方の視聴覚情報に対して少なくとも前記最適調整係数foptを乗じて再生し、それと同時に前記他方の視聴覚情報を再生するので、両方の視聴覚情報のアクセント位置を合わせて再生することができる。これにより、BPMが大きく異なる視聴覚情報同士をリミックスする際の音声または画質の劣化を軽減することが可能となる。また、視聴者に対して、リミックスされた視聴覚情報を違和感なく提供することが可能となる。さらに、両方の視聴覚情報のアクセントの位置が自動的に合わせられるため、熟練していないユーザであっても、容易に視聴覚情報のリミックスを行なうことが可能となる。なお、視聴覚情報とは、音声情報および映像情報の両方の概念を含む。従って、本発明では、周期性を有するものであれば、2つの音声情報、2つの映像情報、および1つの音声情報と1つの映像情報を、再生時に同期させることが可能である。
【0008】
(2)また、本発明の同期再生装置は、周期性を有する音声情報または周期性を有する映像情報のいずれかである2つの視聴覚情報を再生時に同期させる同期再生装置であって、一方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMMに対して単調増加数列を形成する複数の数値を乗算する乗算部と、前記乗算により得られた数値群から、他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOに最も近い数値boptを選択する選択部と、前記他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOと、前記boptとの相加平均BPMaimを算出する相加平均算出部と、前記相加平均BPMaimを前記boptで除算して得られる最適調整係数foptMを出力すると共に、前記相加平均BPMaimを前記他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOで除算して得られる最適調整係数foptOを出力する除算部と、前記一方の視聴覚情報に対して少なくとも前記最適調整係数foptMを乗じて再生し、それと同時に前記他方の視聴覚情報に対して少なくとも前記最適調整係数foptOを乗じて再生する再生部と、を備えることを特徴としている。
【0009】
このように、乗算により得られた数値群から、他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOに最も近い数値boptを選択し、前記他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOと、前記boptとの相加平均BPMaimを算出し、前記相加平均BPMaimを前記boptで除算して得られる最適調整係数foptMを出力し、前記相加平均BPMaimを前記他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOで除算して得られる最適調整係数foptOを出力し、前記一方の視聴覚情報に対して少なくとも前記最適調整係数foptMを乗じて再生するので、両方の視聴覚情報のアクセント位置を合わせて再生することができる。これにより、BPMが大きく異なる視聴覚情報同士をリミックスする際の音声または画質の劣化を軽減することが可能となる。また、2つの視聴覚情報の双方を調整するので、一方のみを調整する場合よりも音質または画質の劣化を軽減させることが可能となる。また、視聴者に対して、リミックスされた視聴覚情報を違和感なく提供することが可能となる。さらに、両方の視聴覚情報のアクセントの位置が自動的に合わせられるため、熟練していないユーザであっても、容易に視聴覚情報のリミックスを行なうことが可能となる。
【0010】
(3)また、本発明の同期再生装置において、前記再生部は、前記視聴覚情報に対して乗ずる調整係数を、時間経過に応じて1から最適調整係数まで変化させることを特徴としている。
【0011】
このように、視聴覚情報に対して乗ずる調整係数を、時間経過に応じて1から最適調整係数まで変化させるので、単に最適調整係数を用いた場合よりも、2つの視聴覚情報のアクセント位置の調整を行なう際に、視聴者に対して与える違和感を軽減させることが可能となる。
【0012】
(4)また、本発明の同期再生装置において、前記再生部は、前記最適調整係数が乗じられた視聴覚情報のアクセントの周期に合致した周期のアクセントを有する第三の視聴覚情報を、前記各視聴覚情報と同時に再生することを特徴としている。
【0013】
このように、最適調整係数が乗じられた視聴覚情報のアクセントの周期に合致した周期のアクセントを有する第三の視聴覚情報を、前記各視聴覚情報と同時に再生するので、アクセントの位置を強調することができる。これにより、2つの視聴覚情報のアクセント位置の調整を行なう際に、視聴者に対して与える違和感を軽減させることが可能となる。
【0014】
(5)また、本発明の同期再生装置において、前記再生部は、前記一方の視聴覚情報の再生が終了する前に前記他方の視聴覚情報の再生を開始することを特徴としている。
【0015】
このように、一方の視聴覚情報の再生が終了する前に前記他方の視聴覚情報の再生を開始するので、2つの視聴覚情報のアクセント位置の調整を滑らかに行なうことが可能となる。
【0016】
(6)また、本発明の同期再生装置は、2つの楽曲情報間の処理を行なう同期再生装置であって、予め選択されたエフェクト音Iおよびエフェクト音IIについて、前記エフェクト音Iの単位時間当たりの周期的なアクセント数BPM1に対して単調増加数列を形成する複数の数値を乗算して数値群Iを算出すると共に、前記エフェクト音IIの単位時間当たりの周期的なアクセント数BPM2に対して単調増加数列を形成する複数の数値を乗算して数値群IIを算出する乗算部と、前記数値群Iから、前記一方の楽曲情報の単位時間当たりの周期的なアクセント数BPM3に最も近い数値bopt1を選択すると共に、前記数値群IIから、前記他方の楽曲情報の単位時間当たりの周期的なアクセント数BPM4に最も近い数値bopt2を選択する選択部と、前記一方の楽曲情報の単位時間当たりの周期的なアクセント数BPM3を、前記bopt1で除算して得られる最適調整係数fopt1を出力すると共に、前記他方の楽曲情報の単位時間当たりの周期的なアクセント数BPM4を、前記bopt2で除算して得られる最適調整係数fopt2を出力する除算部と、前記一方の楽曲情報を再生すると共に、前記エフェクト音Iに対して前記最適調整係数fopt1を乗じて再生し、前記エフェクト音IIに対して前記最適調整係数fopt2を乗じて再生すると共に、前記他方の楽曲情報を再生する再生部と、を備えることを特徴としている。
【0017】
このように、エフェクト音IおよびIIによってテンポ調整を行なうことができるため、楽曲信号の伸縮操作が不要となる。その結果、楽曲の音質劣化が軽減される。その結果、楽曲が移り変わる部分における違和感を軽減することが可能となる。
【0018】
(7)また、本発明の同期再生装置において、一方の楽曲情報の楽曲特徴量との特徴類似度が最も近い楽曲特徴量を持つエフェクト音Iと、他方の楽曲情報の楽曲特徴量との特徴類似度が最も近い楽曲特徴量を持つエフェクト音IIとを選択するエフェクト音選択部を更に備えることを特徴としている。
【0019】
このように、楽曲情報の楽曲特徴量との特徴類似度が最も近い楽曲特徴量を持つエフェクト音を選択するので、楽曲とエフェクト音とのリミックスを行なう際の音質劣化や違和感を軽減することが可能となる。
【0020】
(8)また、本発明の楽曲自動リミックスシステムは、複数の楽曲データを格納する楽曲データベースと、ユーザの操作を契機としていずれか2つの楽曲データを選択する楽曲選択部と、請求項1から請求項5のいずれかに記載の同期再生装置と、前記同期再生装置により再生される楽曲データを音声として出力する出力部と、を備えることを特徴としている。
【0021】
このように、乗算により得られた数値群から、他方の楽曲データの単位時間当たりの周期的なアクセント数BPMOに最も近い数値boptを選択し、前記他方の楽曲データの単位時間当たりの周期的なアクセント数BPMOを、前記boptで除算して得られる最適調整係数foptを出力し、前記一方の楽曲データに対して少なくとも前記最適調整係数foptを乗じて再生し、それと同時に前記他方の楽曲データを再生するので、両方の楽曲データのアクセント位置を合わせて再生することができる。これにより、BPMが大きく異なる楽曲データ同士をリミックスする際の音声劣化を軽減することが可能となる。また、視聴者に対して、リミックスされた楽曲データを違和感なく提供することが可能となる。さらに、両方の楽曲データのアクセントの位置が自動的に合わせられるため、熟練していないユーザであっても、容易に楽曲データのリミックスを行なうことが可能となる。
【0022】
(9)また、本発明の同期再生方法は、周期性を有する音声情報または周期性を有する映像情報のいずれかである2つの視聴覚情報を再生時に同期させる同期再生方法であって、乗算部において、一方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMMに対して単調増加数列を形成する複数の数値を乗算するステップと、選択部において、前記乗算により得られた数値群から、他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOに最も近い数値boptを選択するステップと、除算部において、前記他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOを、前記boptで除算して得られる最適調整係数foptを出力するステップと、再生部において、前記一方の視聴覚情報に対して少なくとも前記最適調整係数foptを乗じて再生し、それと同時に前記他方の視聴覚情報を再生するステップと、を少なくとも含むことを特徴としている。
【0023】
このように、乗算により得られた数値群から、他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOに最も近い数値boptを選択し、前記他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOを、前記boptで除算して得られる最適調整係数foptを出力し、前記一方の視聴覚情報に対して少なくとも前記最適調整係数foptを乗じて再生し、それと同時に前記他方の視聴覚情報を再生するので、両方の視聴覚情報のアクセント位置を合わせて再生することができる。これにより、BPMが大きく異なる視聴覚情報同士をリミックスする際の音声または画質の劣化を軽減することが可能となる。また、視聴者に対して、リミックスされた視聴覚情報を違和感なく提供することが可能となる。さらに、両方の視聴覚情報のアクセントの位置が自動的に合わせられるため、熟練していないユーザであっても、容易に視聴覚情報のリミックスを行なうことが可能となる。
【0024】
(10)また、本発明の同期再生方法は、周期性を有する音声情報または周期性を有する映像情報のいずれかである2つの視聴覚情報を再生時に同期させる同期再生方法であって、乗算部において、一方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMMに対して単調増加数列を形成する複数の数値を乗算するステップと、選択部において、前記乗算により得られた数値群から、他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOに最も近い数値boptを選択するステップと、相加平均算出部において、前記他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOと、前記boptとの相加平均BPMaimを算出するステップと、除算部において、前記相加平均BPMaimを前記boptで除算して得られる最適調整係数foptMを出力すると共に、前記相加平均BPMaimを前記他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOで除算して得られる最適調整係数foptOを出力するステップと、再生部において、前記一方の視聴覚情報に対して少なくとも前記最適調整係数foptMを乗じて再生し、それと同時に前記他方の視聴覚情報に対して少なくとも前記最適調整係数foptOを乗じて再生するステップと、を少なくとも含むことを特徴としている。
【0025】
このように、乗算により得られた数値群から、他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOに最も近い数値boptを選択し、前記他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOと、前記boptとの相加平均BPMaimを算出し、前記相加平均BPMaimを前記boptで除算して得られる最適調整係数foptMを出力し、前記相加平均BPMaimを前記他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOで除算して得られる最適調整係数foptOを出力し、前記一方の視聴覚情報に対して少なくとも前記最適調整係数foptMを乗じて再生するので、両方の視聴覚情報のアクセント位置を合わせて再生することができる。これにより、BPMが大きく異なる視聴覚情報同士をリミックスする際の音声または画質の劣化を軽減することが可能となる。また、2つの視聴覚情報の双方を調整するので、一方のみを調整する場合よりも音質または画質の劣化を軽減させることが可能となる。また、視聴者に対して、リミックスされた視聴覚情報を違和感なく提供することが可能となる。さらに、両方の視聴覚情報のアクセントの位置が自動的に合わせられるため、熟練していないユーザであっても、容易に視聴覚情報のリミックスを行なうことが可能となる。
【0026】
(11)また、本発明の同期再生プログラムは、コンピュータにロードされることによって、周期性を有する音声情報または周期性を有する映像情報のいずれかである2つの視聴覚情報を再生時に同期させる同期再生プログラムであって、一方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMMに対して単調増加数列を形成する複数の数値を乗算する処理と、前記乗算で得られる数値群から、他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOに最も近い数値boptを選択する処理と、前記他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOを、前記boptで除算して最適調整係数foptを出力する処理と、前記一方の視聴覚情報に対して少なくとも前記最適調整係数foptを乗じて再生し、それと同時に前記他方の視聴覚情報を再生する処理と、を少なくとも含むことを特徴としている。
【0027】
このように、乗算により得られた数値群から、他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOに最も近い数値boptを選択し、前記他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOを、前記boptで除算して得られる最適調整係数foptを出力し、前記一方の視聴覚情報に対して少なくとも前記最適調整係数foptを乗じて再生し、それと同時に前記他方の視聴覚情報を再生するので、両方の視聴覚情報のアクセント位置を合わせて再生することができる。これにより、BPMが大きく異なる視聴覚情報同士をリミックスする際の音声または画質の劣化を軽減することが可能となる。また、視聴者に対して、リミックスされた視聴覚情報を違和感なく提供することが可能となる。さらに、両方の視聴覚情報のアクセントの位置が自動的に合わせられるため、熟練していないユーザであっても、容易に視聴覚情報のリミックスを行なうことが可能となる。なお、視聴覚情報とは、音声情報および映像情報の両方の概念を含む。従って、本発明では、周期性を有するものであれば、2つの音声情報、2つの映像情報、および1つの音声情報と1つの映像情報を、再生時に同期させることが可能である。
【0028】
(12)また、本発明の同期再生プログラムは、コンピュータにロードされることによって、周期性を有する音声情報または周期性を有する映像情報のいずれかである2つの視聴覚情報を再生時に同期させる同期再生プログラムであって、一方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMMに対して単調増加数列を形成する複数の数値を乗算する処理と、前記乗算で得られる数値群から、他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOに最も近い数値boptを選択する処理と、前記他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOと、前記boptとの相加平均BPMaimを算出する処理と、前記相加平均BPMaimを前記boptで除算して得られる最適調整係数foptMを出力すると共に、前記相加平均BPMaimを前記他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOで除算して得られた最適調整係数foptOを出力する処理と、前記一方の視聴覚情報に対して少なくとも前記最適調整係数foptMを乗じて再生し、それと同時に前記他方の視聴覚情報に対して少なくとも前記最適調整係数foptOを乗じて再生する処理と、を少なくとも含むことを特徴としている。
【0029】
このように、乗算により得られた数値群から、他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOに最も近い数値boptを選択し、前記他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOと、前記boptとの相加平均BPMaimを算出し、前記相加平均BPMaimを前記boptで除算して得られる最適調整係数foptMを出力し、前記相加平均BPMaimを前記他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOで除算して得られる最適調整係数foptOを出力し、前記一方の視聴覚情報に対して少なくとも前記最適調整係数foptMを乗じて再生するので、両方の視聴覚情報のアクセント位置を合わせて再生することができる。これにより、BPMが大きく異なる視聴覚情報同士をリミックスする際の音声または画質の劣化を軽減することが可能となる。また、2つの視聴覚情報の双方を調整するので、一方のみを調整する場合よりも音質または画質の劣化を軽減させることが可能となる。また、視聴者に対して、リミックスされた視聴覚情報を違和感なく提供することが可能となる。さらに、両方の視聴覚情報のアクセントの位置が自動的に合わせられるため、熟練していないユーザであっても、容易に視聴覚情報のリミックスを行なうことが可能となる。
【発明の効果】
【0030】
本発明によれば、乗算により得られた数値群から、他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOに最も近い数値boptを選択し、前記他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOを、前記boptで除算して得られる最適調整係数foptを出力し、前記一方の視聴覚情報に対して少なくとも前記最適調整係数foptを乗じて再生し、それと同時に前記他方の視聴覚情報を再生するので、両方の視聴覚情報のアクセント位置を合わせて再生することができる。これにより、BPMが大きく異なる視聴覚情報同士をリミックスする際の音声または画質の劣化を軽減することが可能となる。また、視聴者に対して、リミックスされた視聴覚情報を違和感なく提供することが可能となる。さらに、両方の視聴覚情報のアクセントの位置が自動的に合わせられるため、熟練していないユーザであっても、容易に視聴覚情報のリミックスを行なうことが可能となる。
【発明を実施するための最良の形態】
【0031】
(第1の実施形態)
次に、本発明に係る実施形態について、図面を参照しながら説明する。図1は、本発明の第1の実施形態に係る同期再生装置の概略構成を示すブロック図である。この同期再生装置1は、周期性を有する2つの音声情報、周期性を有する2つの映像情報、または周期性を有する1つの音声情報と周期性を有する1つの映像情報を、再生時に同期させる。本明細書では、周期性を有する音声情報および周期性を有する映像情報を、「視聴覚情報」と呼称する。すなわち、本明細書において、視聴覚情報といった場合は、周期性を有する音声情報または周期性を有する映像情報のいずれかを指すものとしている。また、BPM(Beats Per Minute)とは、1分間あたりのアクセント数(ビート数)を意味する。アクセント(ビート)とは、音声情報の場合は、周期的な音声の強弱のことをいう。また、映像情報の場合は、周期的な繰返し映像のことであり、例えば、ボールがバウンドしている映像中、地面に着いた瞬間のボールの映像のことをいう。アクセント位置(ビート位置)とは、時間軸上でのアクセント(ビート)の位置、すなわち、アクセントが現れる時刻のことをいう。
【0032】
同期再生装置1において、乗算部2は、第1の視聴覚情報の単位時間当たりの周期的なアクセント数BPMMに対して、単調増加数列を形成する複数の数値を乗算する。この「単調増加数列を形成する複数の数値」は、例えば、cを整数として、2cで求められる数値を使用することができる。この場合、「c=−2,−1,0,1,2」とすると、2cは、「2c=0.25,0.5,1,2,4」と求めることができる。乗算部2は、第1の視聴覚情報の単位時間当たりの周期的なアクセント数BPMMに対して、このように2cで求められる数値を乗算する。なお、ここでは、「単調増加数列を形成する複数の数値」の例として、2cを用いて説明したが、本発明は、これに限定されるわけではない。
【0033】
選択部3は、乗算部2における乗算により得られた数値群から、第2の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOに最も近い数値boptを選択する。例えば、乗算部2における乗算により得られた数値群を、{b1,b2,b3,b4,b5}としたときに、これらの中から第2の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOに最も近い数値boptを選択する。この場合、選択部3が選択した数値boptは、直接除算部4に入力される。
【0034】
除算部4は、第2の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOを、boptで除算して得られる最適調整係数foptを出力する。再生部5は、第1の視聴覚情報に対して、少なくとも最適調整係数foptを乗じて再生し、それと同時に第2の視聴覚情報を再生する。なお、相加平均算出部6については後述する。
【0035】
図2は、第1の実施形態に係る同期再生装置の動作を示すフローチャートである。ここでは、視聴覚情報として、周期性のある音声情報、例えば、楽曲を例にとって説明する。この同期再生装置は、楽曲のBPMを合わせるのではなく、楽曲のビート位置に着目し、2つの楽曲の調整係数fが最小となるような最適調整係数foptを求め、このfoptに基づいて楽曲テンポを調整する。これによって、楽曲の音質劣化を軽減させたリミックスを行なうことが可能になる。具体的には、例えば、BPM120の楽曲とBPM60の楽曲とを結合する場合、BPM60の楽曲をBPM120となるようにテンポ調整すると、音質劣化が著しくなる。本発明では、ビート位置に着目し、BPM60の裏拍子を考慮することによって、テンポ調整をすることなくリミックスを可能とする。なお、ここでは、両方の視聴覚情報のアクセント位置を合わせて再生することを、「テンポ調整」と呼称する。
【0036】
図2において、楽曲Mと楽曲Oとを選定する(ステップS1)。ここで、テンポ調整を行なう楽曲をMとし、テンポ調整を行なわない楽曲をOとする。次に、BPM情報は既知であるかどうかを判断し(ステップS2)、既知でない場合は、テンポ解析を行なう(ステップS3)。ここでテンポ解析を行なって得られた楽曲MのBPMを、BPMMとし、楽曲OのBPMをBPMOとする。一方、ステップS2において、BPMが既知である場合は、ステップS4に遷移する。
【0037】
次に、BPMMに対して、2cを乗算する。ここで、「c=−2,−1,0,1,2」とし、数値群G={b1、b2,b3,b4,b5}を得る(ステップS4)。次に、数値群GからBPMOに最も近い値であるboptを算出する(ステップS5)。すなわち、
bopt=2Copt×BPMMである。
【0038】
次に、最適テンポ調整係数(最適調整係数)foptを計算する(ステップS6)。すなわち、
fopt=BPMO/boptである。
【0039】
なお、ステップS3におけるテンポ解析では、例えば、非特許文献1に記載されているテンポ推定手法を用いて、楽曲M、楽曲OのBPMを計算することができる。また、既存のテンポ推定手法を利用せずに、予め用意されている楽曲メタデータを用いることも可能である。
【0040】
(第2の実施形態)
上記のように最適テンポ調整係数(最適調整係数)を算出する際に、第1および第2の視聴覚情報の両方を調整することも可能である。この場合、図1における選択部3が選択した数値boptは、直接除算部4には入力されずに、相加平均算出部6に入力される。相加平均算出部6は、第2の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOと、選択部3により選択されたboptとの相加平均BPMaimを算出する。除算部4は、相加平均BPMaimをboptで除算して得られる最適調整係数foptMを出力すると共に、相加平均BPMaimを第2の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOで除算して得られる最適調整係数foptOを出力する。再生部5は、第1の視聴覚情報に対して少なくとも最適調整係数foptMを乗じて再生し、それと同時に第2の視聴覚情報に対して少なくとも最適調整係数foptOを乗じて再生する。
【0041】
第2の実施形態に係る同期再生装置の動作についても、図2に示すフローチャートで説明することができる。図2において、まず、楽曲Mと楽曲Oとを選定する(ステップS1)。ここで、楽曲Mの最適テンポ調整係数をfoptMとし、楽曲Oの最適テンポ調整係数をfoptOとする。そして、再生部5におけるテンポをBPMaimとする。BPM情報は既知であるかどうかを判断し(ステップS2)、既知でない場合は、テンポ解析を行なう(ステップS3)。ここでテンポ解析を行なって得られた楽曲MのBPMを、BPMMとし、楽曲OのBPMをBPMOとする。一方、ステップS2において、BPMが既知である場合は、ステップS4に遷移する。
【0042】
次に、BPMMに対して、2cを乗算する。ここで、「c=−2,−1,0,1,2」とし、数値群G={b1、b2,b3,b4,b5}を得る(ステップS4)。次に、数値群GからBPMOに最も近い値であるboptを算出する(ステップS5)。すなわち、
bopt=2Copt×BPMMである。
【0043】
次に、boptとBPMOとの相加平均から再生部5におけるテンポBPMaimを求め、楽曲Mの最適テンポ調整係数foptMと、楽曲Oの最適テンポ調整係数とをfoptO求める(ステップS6)。すなわち、
BPMaim=(bopt+BPMO)/2、
foptM=BPMaim/bopt、
foptO=BPMaim/BPMOにより求められる。
【0044】
このように求められたfoptMと、foptOに従って、楽曲Mと楽曲Oとのテンポ調整を行なうことによって、一方のみをテンポ調整する場合に比べて、音質劣化を軽減させることが可能となる。
【0045】
なお、第1および第2の実施形態で示した同期再生装置は、楽曲のリミックスだけではなく、周期性を有する情報について適用することが可能である。周期性を有する複数の情報を同期させて、再生をすることができる。この場合、上記のBPM情報を、周期情報に置き換えて、最適周期調整係数として計算すればよい。特許文献2では、本実施形態と同様に、テンポ候補から2の累乗を乗算して得た候補を加えてテンポ推定を行なっているが、本実施形態のように、リミックスの対象とする楽曲同士のBPM調整を行なうための指標として用いられてはいない。また、特許文献2では、対話型の音楽再生装置を提案しているが、全自動でのリミックスではない。これに対し、本実施形態では、楽曲のBPM情報から裏拍子を自動的に認識するため、最も音質劣化の少ないリミックスを提供することが可能である。
【0046】
(第3の実施形態)
第3の実施形態では、最適テンポ調整係数(最適調整係数)を利用した楽曲リミックスについて説明する。最適テンポ調整係数と、楽曲のビート位置情報を利用することによって、楽曲のビート感を合わせた楽曲リミックスを実現する。なお、以下の説明では、テンポ調整をする楽曲をM、テンポ調整をしない楽曲をOとして、両楽曲のBPM情報をBPMM、BPMO、ビート位置情報をLM={lM1,lM3,lM3,・・・}、LO={lO1,lO2,lO3,・・・}とする。
【0047】
図3は、第3の実施形態に係る楽曲リミックスの手順を示すフローチャートであり、図4は、2つの楽曲をリミックスする際の重畳区間を示す図である。また、図5は、ボリュームコントロールの様子を示す図である。まず、リミックス後の楽曲同士の重畳区間TMを定義する(ステップT1)。次に、最適テンポ調整係数foptを計算し、テンポ変調区間T(T=fopt×TM)を計算する(ステップT2)。次に、楽曲Mの信号から、テンポ変調区間Tを抽出し、これをEM(t)とする(ステップT3)。
【0048】
次に、楽曲MのEM(t)に対して、テンポ調整(fopt×BPMM)を行なう(ステップT4)。テンポ調整された楽曲MのEM(t)をEMm(t)とする(ステップT5)。また、楽曲Oの信号から、重畳区間TMを抽出し、これをEOm(t)とする(ステップT5)。これにより、ビート位置の調整が行なわれる。次に、EMm(t)、EOm(t)における開始ビート位置SMm、SOmを、LM、LOから求める(ステップT6)。次に、ボリュームコントロールを行なって(ステップT7)、SMm、SOmを時系列上で合わせて、楽曲Mと楽曲Oとを結合させる(ステップT8)。
【0049】
ここで、ステップT7において、楽曲を結合する際に、クロスフェード等のボリュームコントロールを適用することにより、滑らかな楽曲のリミックスを行なうことが可能である。ボリュームコントロールは、図5に示すボリュームコントロール関数のように、重畳区間において、信号の振幅を徐々に減少させるような信号を乗算することによって、適用することができる。また、信号の振幅を徐々に増加させるような信号を乗算するようにしても良い。
【0050】
(第4の実施形態)
本実施形態では、テンポ調整の際に、2つの楽曲が重なる部分における違和感を軽減するために、第3の音源を挿入する。なお、第3の音源は、ドラム音のように、リズムのみの音であっても良いし、楽曲であっても良い。本実施形態では、前の楽曲が完全に終了する前に次の楽曲が開始する場合、すなわち、2つの楽曲が重なり合う場合について説明する。前の楽曲が完全に終了してから次の楽曲が開始する場合に第3の音源を再生する例については、後述する。図6は、第4の実施形態において第3の音源を挿入する手順を示すフローチャートであり、図7は、ビート位置に第3の音源を挿入した信号の様子を示す図である。また、図8は、第3の音源および楽曲に対するボリュームコントロールの様子を示す図である。図6において、まず、リミックス後の楽曲同士の重畳区間TMを定義する(ステップR1)。次に、最適テンポ調整係数foptを計算し、テンポ変調区間T(T=fopt×TM)を計算する(ステップR2)。次に、楽曲Mの信号から、テンポ変調区間Tを抽出し、これをEM(t)とする(ステップR3)。
【0051】
次に、楽曲MのEM(t)に対して、テンポ調整(fopt×BPMM)を行なう(ステップR4)。テンポ調整された楽曲MのEM(t)をEMm(t)とする(ステップR5)。また、楽曲Oの信号から、重畳区間TMを抽出し、これをEOm(t)とする(ステップR5)。次に、ビート位置の調整を行なう。すなわち、EMm(t)、EOm(t)における開始ビート位置SMm、SOmを、LM、LOから求める(ステップR6)。次に、重畳区間内において、楽曲Mおよび楽曲Oのビート位置情報lAを取得し(ステップR7)、lAの位置に第3の音源を挿入する(ステップR8)。図7は、ビート位置であるlA1,lA2,lA3,・・・に第3の音源(ドラム音)を挿入した様子を示している。次に、図8に示すように、ボリュームコントロールを行なう(ステップR9)。具体的には、重畳区間内で、楽曲Mのボリュームを次第に減少させると共に、ドラム音源のボリュームを次第に上げていく。また、同時に楽曲Oのボリュームも次第に上げていく。重畳区間の中央あたりで、ドラム音源のボリュームを次第に下げていく。これにより、楽曲Mと楽曲Oとを結合させる(ステップR10)。第4の実施形態によれば、楽曲のリミックスを行なう際の違和感を軽減することが可能となる。
【0052】
(第5の実施形態)
本実施形態では、上記の第3の実施形態のステップT4において、テンポ調整係数に基づいてテンポ調整を行なう際に、徐々にテンポを調整する。図9は、第5の実施形態において、徐々にテンポを調整していく手順を示すフローチャートであり、図10は、テンポを徐々に調整していく区間を示す図である。図9において、まず、リミックス後の楽曲同士の重畳区間TMと、テンポを徐々に調整していく区間TM1とを定義する(ステップP1)。次に、最適テンポ調整係数foptを計算し、テンポ変調区間T(T=fopt×TM)を計算する(ステップP2)。次に、楽曲Mの信号から、テンポ変調区間Tおよびテンポを徐々に調整していく区間TM1を抽出し、これらをそれぞれEM(t)、EM1(t)とする(ステップP3)。
【0053】
次に、楽曲MのEM(t)に対して、テンポ調整(fopt×BPMM)を行ない、テンポ調整された楽曲MのEM(t)をEMm(t)とする(ステップP4)。次に、EM1(t)に対して、BPMMからfopt×BPMMまで調整するために、徐々にテンポ調整係数fを変化させる。具体的には、テンポ調整係数fを、1からfoptまで変化させ、(fopt×BPMM)を順次、計算することによって、滑らかにテンポ調整を行ない、EMm1(t)とする(ステップP5)。
【0054】
具体的には、図10に示すように、TM1の区間で、テンポ調整係数を1からfoptまで変化させてテンポ調整を行なう。例えば、fopt=0.80(sec)、TM1=0.80(sec)とすると、テンポ調整係数fを、{1,0.95,0.90,0.85,0.80}と変化させる。そして、
0〜2秒の区間では、f=1.00、
2〜4秒の区間では、f=0.95、
4〜6秒の区間では、f=0.90、
6〜8秒の区間では、f=0.85、
8〜10秒の区間では、f=0.80、という調整を行なう。
【0055】
次に、重畳区間におけるEMm(t)、EOm(t)を抽出し(ステップP6)、開始ビート位置SMm、SOmを、LM、LOから求める(ステップP7)。次に、SMm、SOmを時系列上で合わせて、楽曲Mと楽曲Oとを結合させる(ステップP8)。
【0056】
このように、テンポ調整係数fを、1からfoptまで変化させるので、最適テンポ調整係数によって求められたテンポに対して滑らかにテンポ調整を行なうことが可能となる。特に、最適テンポ調整係数のみを用いた場合と比較して、テンポ調整による違和感が軽減される。
【0057】
(第6の実施形態)
本実施形態では、テンポ調整の際に、2つの楽曲が移り変わる部分における違和感を軽減するために、本実施形態は、第4の実施形態のように、第3の音源を挿入する。本実施形態においても、第3の音源は、ドラム音のように、リズムのみの音であっても良いし、楽曲であっても良い。本実施形態では、前の楽曲が完全に終了してから次の楽曲が開始する場合に第3の音源を再生する例について説明する。なお、本実施形態では、楽曲の特徴を表わす「楽曲特徴量」を、例えば、「楽曲ベクトル」を用いて説明する。また、楽曲の特徴の類似度合いを表わす「特徴類似度」、例えば、「コサイン距離」を用いて説明する。
【0058】
図11は、第6の実施形態に係る同期再生装置の概略構成を示すブロック図である。同期再生装置60において、エフェクト音選択部61は、一方の楽曲情報(楽曲A)の楽曲ベクトルとのコサイン距離が最も近い楽曲ベクトルを持つエフェクト音Iと、他方の楽曲情報(楽曲B)の楽曲ベクトルとのコサイン距離が最も近い楽曲ベクトルを持つエフェクト音IIとを選択する。乗算部62は、エフェクト音Iの単位時間当たりの周期的なアクセント数BPM1に対して単調増加数列を形成する複数の数値を乗算して数値群Iを算出する。また、エフェクト音IIの単位時間当たりの周期的なアクセント数BPM2に対して単調増加数列を形成する複数の数値を乗算して数値群IIを算出する。
【0059】
選択部63は、数値群Iから、一方の楽曲情報(楽曲A)の単位時間当たりの周期的なアクセント数BPM3に最も近い数値bopt1を選択する。また、数値群IIから、他方の楽曲情報(楽曲B)の単位時間当たりの周期的なアクセント数BPM4に最も近い数値bopt2を選択する。除算部64は、一方の楽曲情報(楽曲A)の単位時間当たりの周期的なアクセント数BPM3を、上記のbopt1で除算して得られる最適調整係数fopt1を出力する。また、他方の楽曲情報(楽曲B)の単位時間当たりの周期的なアクセント数BPM4を、上記bopt2で除算して得られる最適調整係数fopt2を出力する。
【0060】
再生部65は、一方の楽曲情報(楽曲A)を再生し、その楽曲Aの終了前の一定期間内に、その楽曲Aと同時にエフェクト音Iに対して最適調整係数fopt1を乗じて、エフェクト音Iを再生する。ここでは、クロスフェード方式を用いて両者を重ねて再生する。これにより、楽曲AのBPM3にエフェクト音IのBPM1を合わせることができる。次に、再生部65は、楽曲Aが終了し、エフェクト音Iの再生中に、エフェクト音IのBPM1と、エフェクト音IIのBPM2とが合うようにエフェクト音同士を調整しながら、エフェクト音IIの再生を開始する。そのとき、エフェクト音Iの再生を止めても良いし、クロスフェード方式を採って両者を再生しても良い。次に、再生部65は、エフェクト音IIに対して最適調整係数fopt2を乗じて再生すると共に、他方の楽曲情報(楽曲B)を再生する。ここでも、クロスフェード方式を用いて両者を重ねて再生する。これにより、エフェクト音IIのBPM2を楽曲BのBPM4に合わせることができる。次に、第6の実施形態に係る同期再生装置の楽曲間処理の動作について説明する。
【0061】
図12は、第6の実施形態に係る楽曲間処理の様子を示す図である。第6の実施形態では、まず、(1)前後の楽曲の特徴量を取得する。すなわち、再生中の楽曲(楽曲A)と次に再生される楽曲(楽曲B)のBPM、ビート位置、楽曲ベクトルを取得する。楽曲ベクトルとは、音楽データのMFCCからツリーベクトル量子化手法(TreeQ)を用いて得たヒストグラムを指すものである。また、ここでは、BPM、ビート位置は既知とする。次に、(2)エフェクトの選択を行なう。BPM、ビート位置、ベクトルが既知のエフェクト音を用意する。そして、楽曲Bのベクトルとのコサイン距離が最も近い楽曲ベクトルを持つエフェクト(エフェクトII)を選択する。次に、楽曲AのベクトルおよびエフェクトIIのベクトルとのコサイン距離の平均が一番大きいエフェクト(エフェクトI)を選択する。
【0062】
次に、(3)エフェクトのテンポ変更を行なう。すなわち、エフェクト再生部分で、テンポが楽曲AのBPMから楽曲BのBPMへ徐々に推移するようエフェクトI、IIのテンポを変動させるのである。最後に、(4)ビート位置合わせを行なう。音源が重なる部分のビート位置が揃うように、後ろの音源を挿入するタイミングを調整する。図12は、このような楽曲間処理の様子を示す。図12に示すように、楽曲AからエフェクトI、エフェクトIIと再生され、楽曲Bの順につなげて連続再生を行なう。楽曲Aの最後の部分と、エフェクトIの最初の部分と、エフェクトIIの最後の部分と楽曲Bの最初の部分は、クロスフェードとされる。
【0063】
なお、本実施形態では、エフェクト音のみに最適調整係数を乗算する例を示したが、本発明は、これに限定されるわけではない。上記の各実施形態のように、楽曲Aおよび楽曲Bに最適調整係数を乗算する手法を採ることも可能である。
【0064】
第6の実施形態によれば、エフェクトIおよびIIによってテンポ調整を行なうことができるため、楽曲信号の伸縮操作が不要となる。その結果、楽曲の音質劣化が軽減される。
【0065】
(第7の実施形態)
本実施形態では、上記の同期再生装置を備えた楽曲自動リミックスシステムについて説明する。図13は、第7の実施形態に係る楽曲自動リミックスシステムの概略構成を示すブロック図である。この楽曲自動リミックスシステム110は、同期再生装置1と、楽曲を選択する楽曲選択部111と、音楽データとしての複数の楽曲を格納する楽曲データベース(DB)112と、から構成される。
【0066】
楽曲選択部111は、ユーザの操作を受け付けて、リミックスする楽曲を選択する。例えば、楽曲データベース112に格納されている楽曲またはそのリストをユーザに提示する。ユーザは、楽曲選択部111に対して、いずれかの楽曲を選択する操作を行なう。また、ユーザが直接楽曲を選択するのではなく、楽曲の雰囲気、例えば、明るい楽曲、静かな楽曲等の楽曲の属性情報を入力することもできる。この場合は、入力された属性情報と、楽曲データベース112に格納されている楽曲メタ情報等とを比較して、リミックスを行なう楽曲を選出することができる。
【0067】
楽曲データベース112には、本システムで利用される楽曲および楽曲に関する情報が格納されている。例えば、楽曲データ、楽曲テンポ情報、楽曲ビート位置情報、さらに楽曲に付されたメタ情報などが格納されている。同期再生装置1は、上記各実施形態で説明した手法で、楽曲選択部111で選択された楽曲のリミックスを行なう。同期再生装置1において、最終的に結合されたリミックス用音楽信号は、スピーカ113で可聴音として出力される。また、データファイルとして、出力することも可能である。
【0068】
なお、楽曲自動リミックスシステム110において、楽曲テンポ情報、楽曲ビート位置情報については、既知であるものとする。
【0069】
(第8の実施形態)
本実施形態では、楽曲テンポ情報、楽曲ビート位置情報が未知である場合の形態を説明する。図14は、第8の実施形態に係る楽曲自動リミックスシステムの概略構成を示すブロック図である。この楽曲自動リミックスシステム120は、第7の実施形態と同様に、同期再生装置1と、楽曲選択部111と、楽曲データベース112とを備えている。更に、楽曲取得・解析部121を備えている。この楽曲取得・解析部121は、楽曲データベース112に格納されている楽曲を取得し、解析して、解析結果を楽曲情報データベース122に格納する。楽曲取得・解析部121は、例えば、非特許文献1に開示されている技術を利用して、楽曲テンポ情報、楽曲ビート位置情報等を解析する。また、楽曲データベース112に格納されている楽曲データ、楽曲情報データ等も取得し、解析のために利用することができる。
【0070】
楽曲情報データベース122は、楽曲取得・解析部121において解析された、楽曲に関する情報が格納される。例えば、楽曲テンポ情報、楽曲ビート位置情報等のデータが格納される。また、楽曲データベース112内の情報や、楽曲データを格納することも可能である。
【0071】
本実施形態によれば、楽曲テンポ情報、楽曲ビート位置情報が未知である場合であっても、楽曲データベース112に格納されている情報に基づいて、これらを得ることができる。
【図面の簡単な説明】
【0072】
【図1】第1の実施形態に係る同期再生装置の概略構成を示すブロック図である。
【図2】第1および第2の実施形態に係る同期再生装置の動作を示すフローチャートである。
【図3】第3の実施形態に係る楽曲リミックスの手順を示すフローチャートである。
【図4】2つの楽曲をリミックスする際の重畳区間を示す図である。
【図5】ボリュームコントロールの様子を示す図である。
【図6】第4の実施形態において第3の音源を挿入する手順を示すフローチャートである。
【図7】ビート位置に第3の音源を挿入した信号の様子を示す図である。
【図8】第3の音源および楽曲に対するボリュームコントロールの様子を示す図である。
【図9】第5の実施形態において、徐々にテンポを調整していく手順を示すフローチャートである。
【図10】テンポを徐々に調整していく区間を示す図である。
【図11】第6の実施形態に係る同期再生装置の概略構成を示すブロック図である。
【図12】第6の実施形態に係る楽曲間処理の様子を示す図である。
【図13】第7の実施形態に係る楽曲自動リミックスシステムの概略構成を示すブロック図である。
【図14】第8の実施形態に係る楽曲自動リミックスシステムの概略構成を示すブロック図である。
【符号の説明】
【0073】
1 同期再生装置
2 乗算部
3 選択部
4 除算部
5 再生部
6 相加平均算出部
110 楽曲自動リミックスシステム
111 楽曲選択部
112 楽曲データベース
113 スピーカ
120 楽曲自動リミックスシステム
121 楽曲取得・解析部
122 楽曲情報データベース
【技術分野】
【0001】
本発明は、周期性を有する音声情報または周期性を有する映像情報のいずれかである2つの視聴覚情報を再生時に同期させる技術に関する。
【背景技術】
【0002】
従来から、音楽を自動的にリミックスする技術が知られている。例えば、特開2001−243692号公報(特許文献1)に開示されている技術は、リミックス対象となる前後2楽曲において、後ろの楽曲のBPM(Beats Per Minute)情報を、前の楽曲のBPM情報と一致させる。これにより、ユーザが、仮に楽曲のリミックスに熟練していなくても、容易にリミックスを行なうことができる。また、例えば、特表2004−527786号公報(特許文献2)に開示されている技術は、楽曲のテンポを推定するために楽曲信号周波数成分の帯域通過フィルタリングによって得られた拍子候補に対し、振動器をマッチングさせることでテンポを自動抽出する。また、振動器の振動数を2の累乗することによって、検出テンポ精度を上げ、リミックスを行なっている。また、特開2006−337914号公報(特許文献3)に開示されている技術は、楽曲自動リミックス機能を備えた再生装置に関するものである。この再生装置では、音響的特徴に基づいて楽曲リミックスを行なう際に、楽曲間エフェクトを挿入する。
【特許文献1】特開2001−243692号公報
【特許文献2】特開2004−527786号公報
【特許文献3】特開2006−337914号公報
【非特許文献1】Alonso M., David B. and Richard G., “Tempo and Beat Estimation of Musical Signals”, Proc. ISMIR 2004, pp. 158−163
【発明の開示】
【発明が解決しようとする課題】
【0003】
しかしながら、特許文献1では、BPMを一致させるリミックスを行なっているが、リミックス対象となる楽曲同士のBPMが大きく異なる場合、BPMを一致させるための楽曲信号伸縮操作が音質を大きく劣化させてしまうという問題がある。また、特許文献2では、楽曲のテンポ情報推定後のリミックス時におけるBPM調整は、特許文献1と同様の手法を用いる必要があるため、同じような問題を有している。また、特許文献3においては、時系列上におけるテンポ、ビート情報を考慮して楽曲をリミックスしていないため、DJが操作しているような心地の良いリミックスは得られない。さらに、従来の技術では、リミックス楽曲数が増えるに従って、ユーザの操作負担が増加してしまうという問題がある。
【0004】
例えば、楽曲A、BのBPMをそれぞれBPMA、BPMBとし、楽曲テンポを調整する係数をfとすると、従来の方法では、以下のような操作を行なっていた。すなわち、
BPMA=f×BPMB・・・(1)、または、
f×BPMA=BPMB・・・(2)、
となるような操作を行なうことによって、リミックス前後の楽曲のテンポを調整していた。しかしながら、式(1)、(2)では、テンポが大きく異なる楽曲をリミックスする場合は、音楽信号を伸縮する度合いが大きくなるため、音質が劣化してしまう。
【0005】
本発明は、このような事情に鑑みてなされたものであり、周期性を有する音声情報または周期性を有する映像情報のいずれかである2つの視聴覚情報を再生時に滑らかに同期させることができる同期再生装置、楽曲自動リミックスシステム、同期再生方法および同期再生プログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
(1)上記の目的を達成するために、本発明は、以下のような手段を講じた。すなわち、本発明の同期再生装置は、周期性を有する音声情報または周期性を有する映像情報のいずれかである2つの視聴覚情報を再生時に同期させる同期再生装置であって、一方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMMに対して単調増加数列を形成する複数の数値を乗算する乗算部と、前記乗算により得られた数値群から、他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOに最も近い数値boptを選択する選択部と、前記他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOを、前記boptで除算して得られる最適調整係数foptを出力する除算部と、前記一方の視聴覚情報に対して少なくとも前記最適調整係数foptを乗じて再生し、それと同時に前記他方の視聴覚情報を再生する再生部と、を備えることを特徴としている。
【0007】
このように、乗算により得られた数値群から、他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOに最も近い数値boptを選択し、前記他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOを、前記boptで除算して得られる最適調整係数foptを出力し、前記一方の視聴覚情報に対して少なくとも前記最適調整係数foptを乗じて再生し、それと同時に前記他方の視聴覚情報を再生するので、両方の視聴覚情報のアクセント位置を合わせて再生することができる。これにより、BPMが大きく異なる視聴覚情報同士をリミックスする際の音声または画質の劣化を軽減することが可能となる。また、視聴者に対して、リミックスされた視聴覚情報を違和感なく提供することが可能となる。さらに、両方の視聴覚情報のアクセントの位置が自動的に合わせられるため、熟練していないユーザであっても、容易に視聴覚情報のリミックスを行なうことが可能となる。なお、視聴覚情報とは、音声情報および映像情報の両方の概念を含む。従って、本発明では、周期性を有するものであれば、2つの音声情報、2つの映像情報、および1つの音声情報と1つの映像情報を、再生時に同期させることが可能である。
【0008】
(2)また、本発明の同期再生装置は、周期性を有する音声情報または周期性を有する映像情報のいずれかである2つの視聴覚情報を再生時に同期させる同期再生装置であって、一方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMMに対して単調増加数列を形成する複数の数値を乗算する乗算部と、前記乗算により得られた数値群から、他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOに最も近い数値boptを選択する選択部と、前記他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOと、前記boptとの相加平均BPMaimを算出する相加平均算出部と、前記相加平均BPMaimを前記boptで除算して得られる最適調整係数foptMを出力すると共に、前記相加平均BPMaimを前記他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOで除算して得られる最適調整係数foptOを出力する除算部と、前記一方の視聴覚情報に対して少なくとも前記最適調整係数foptMを乗じて再生し、それと同時に前記他方の視聴覚情報に対して少なくとも前記最適調整係数foptOを乗じて再生する再生部と、を備えることを特徴としている。
【0009】
このように、乗算により得られた数値群から、他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOに最も近い数値boptを選択し、前記他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOと、前記boptとの相加平均BPMaimを算出し、前記相加平均BPMaimを前記boptで除算して得られる最適調整係数foptMを出力し、前記相加平均BPMaimを前記他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOで除算して得られる最適調整係数foptOを出力し、前記一方の視聴覚情報に対して少なくとも前記最適調整係数foptMを乗じて再生するので、両方の視聴覚情報のアクセント位置を合わせて再生することができる。これにより、BPMが大きく異なる視聴覚情報同士をリミックスする際の音声または画質の劣化を軽減することが可能となる。また、2つの視聴覚情報の双方を調整するので、一方のみを調整する場合よりも音質または画質の劣化を軽減させることが可能となる。また、視聴者に対して、リミックスされた視聴覚情報を違和感なく提供することが可能となる。さらに、両方の視聴覚情報のアクセントの位置が自動的に合わせられるため、熟練していないユーザであっても、容易に視聴覚情報のリミックスを行なうことが可能となる。
【0010】
(3)また、本発明の同期再生装置において、前記再生部は、前記視聴覚情報に対して乗ずる調整係数を、時間経過に応じて1から最適調整係数まで変化させることを特徴としている。
【0011】
このように、視聴覚情報に対して乗ずる調整係数を、時間経過に応じて1から最適調整係数まで変化させるので、単に最適調整係数を用いた場合よりも、2つの視聴覚情報のアクセント位置の調整を行なう際に、視聴者に対して与える違和感を軽減させることが可能となる。
【0012】
(4)また、本発明の同期再生装置において、前記再生部は、前記最適調整係数が乗じられた視聴覚情報のアクセントの周期に合致した周期のアクセントを有する第三の視聴覚情報を、前記各視聴覚情報と同時に再生することを特徴としている。
【0013】
このように、最適調整係数が乗じられた視聴覚情報のアクセントの周期に合致した周期のアクセントを有する第三の視聴覚情報を、前記各視聴覚情報と同時に再生するので、アクセントの位置を強調することができる。これにより、2つの視聴覚情報のアクセント位置の調整を行なう際に、視聴者に対して与える違和感を軽減させることが可能となる。
【0014】
(5)また、本発明の同期再生装置において、前記再生部は、前記一方の視聴覚情報の再生が終了する前に前記他方の視聴覚情報の再生を開始することを特徴としている。
【0015】
このように、一方の視聴覚情報の再生が終了する前に前記他方の視聴覚情報の再生を開始するので、2つの視聴覚情報のアクセント位置の調整を滑らかに行なうことが可能となる。
【0016】
(6)また、本発明の同期再生装置は、2つの楽曲情報間の処理を行なう同期再生装置であって、予め選択されたエフェクト音Iおよびエフェクト音IIについて、前記エフェクト音Iの単位時間当たりの周期的なアクセント数BPM1に対して単調増加数列を形成する複数の数値を乗算して数値群Iを算出すると共に、前記エフェクト音IIの単位時間当たりの周期的なアクセント数BPM2に対して単調増加数列を形成する複数の数値を乗算して数値群IIを算出する乗算部と、前記数値群Iから、前記一方の楽曲情報の単位時間当たりの周期的なアクセント数BPM3に最も近い数値bopt1を選択すると共に、前記数値群IIから、前記他方の楽曲情報の単位時間当たりの周期的なアクセント数BPM4に最も近い数値bopt2を選択する選択部と、前記一方の楽曲情報の単位時間当たりの周期的なアクセント数BPM3を、前記bopt1で除算して得られる最適調整係数fopt1を出力すると共に、前記他方の楽曲情報の単位時間当たりの周期的なアクセント数BPM4を、前記bopt2で除算して得られる最適調整係数fopt2を出力する除算部と、前記一方の楽曲情報を再生すると共に、前記エフェクト音Iに対して前記最適調整係数fopt1を乗じて再生し、前記エフェクト音IIに対して前記最適調整係数fopt2を乗じて再生すると共に、前記他方の楽曲情報を再生する再生部と、を備えることを特徴としている。
【0017】
このように、エフェクト音IおよびIIによってテンポ調整を行なうことができるため、楽曲信号の伸縮操作が不要となる。その結果、楽曲の音質劣化が軽減される。その結果、楽曲が移り変わる部分における違和感を軽減することが可能となる。
【0018】
(7)また、本発明の同期再生装置において、一方の楽曲情報の楽曲特徴量との特徴類似度が最も近い楽曲特徴量を持つエフェクト音Iと、他方の楽曲情報の楽曲特徴量との特徴類似度が最も近い楽曲特徴量を持つエフェクト音IIとを選択するエフェクト音選択部を更に備えることを特徴としている。
【0019】
このように、楽曲情報の楽曲特徴量との特徴類似度が最も近い楽曲特徴量を持つエフェクト音を選択するので、楽曲とエフェクト音とのリミックスを行なう際の音質劣化や違和感を軽減することが可能となる。
【0020】
(8)また、本発明の楽曲自動リミックスシステムは、複数の楽曲データを格納する楽曲データベースと、ユーザの操作を契機としていずれか2つの楽曲データを選択する楽曲選択部と、請求項1から請求項5のいずれかに記載の同期再生装置と、前記同期再生装置により再生される楽曲データを音声として出力する出力部と、を備えることを特徴としている。
【0021】
このように、乗算により得られた数値群から、他方の楽曲データの単位時間当たりの周期的なアクセント数BPMOに最も近い数値boptを選択し、前記他方の楽曲データの単位時間当たりの周期的なアクセント数BPMOを、前記boptで除算して得られる最適調整係数foptを出力し、前記一方の楽曲データに対して少なくとも前記最適調整係数foptを乗じて再生し、それと同時に前記他方の楽曲データを再生するので、両方の楽曲データのアクセント位置を合わせて再生することができる。これにより、BPMが大きく異なる楽曲データ同士をリミックスする際の音声劣化を軽減することが可能となる。また、視聴者に対して、リミックスされた楽曲データを違和感なく提供することが可能となる。さらに、両方の楽曲データのアクセントの位置が自動的に合わせられるため、熟練していないユーザであっても、容易に楽曲データのリミックスを行なうことが可能となる。
【0022】
(9)また、本発明の同期再生方法は、周期性を有する音声情報または周期性を有する映像情報のいずれかである2つの視聴覚情報を再生時に同期させる同期再生方法であって、乗算部において、一方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMMに対して単調増加数列を形成する複数の数値を乗算するステップと、選択部において、前記乗算により得られた数値群から、他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOに最も近い数値boptを選択するステップと、除算部において、前記他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOを、前記boptで除算して得られる最適調整係数foptを出力するステップと、再生部において、前記一方の視聴覚情報に対して少なくとも前記最適調整係数foptを乗じて再生し、それと同時に前記他方の視聴覚情報を再生するステップと、を少なくとも含むことを特徴としている。
【0023】
このように、乗算により得られた数値群から、他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOに最も近い数値boptを選択し、前記他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOを、前記boptで除算して得られる最適調整係数foptを出力し、前記一方の視聴覚情報に対して少なくとも前記最適調整係数foptを乗じて再生し、それと同時に前記他方の視聴覚情報を再生するので、両方の視聴覚情報のアクセント位置を合わせて再生することができる。これにより、BPMが大きく異なる視聴覚情報同士をリミックスする際の音声または画質の劣化を軽減することが可能となる。また、視聴者に対して、リミックスされた視聴覚情報を違和感なく提供することが可能となる。さらに、両方の視聴覚情報のアクセントの位置が自動的に合わせられるため、熟練していないユーザであっても、容易に視聴覚情報のリミックスを行なうことが可能となる。
【0024】
(10)また、本発明の同期再生方法は、周期性を有する音声情報または周期性を有する映像情報のいずれかである2つの視聴覚情報を再生時に同期させる同期再生方法であって、乗算部において、一方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMMに対して単調増加数列を形成する複数の数値を乗算するステップと、選択部において、前記乗算により得られた数値群から、他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOに最も近い数値boptを選択するステップと、相加平均算出部において、前記他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOと、前記boptとの相加平均BPMaimを算出するステップと、除算部において、前記相加平均BPMaimを前記boptで除算して得られる最適調整係数foptMを出力すると共に、前記相加平均BPMaimを前記他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOで除算して得られる最適調整係数foptOを出力するステップと、再生部において、前記一方の視聴覚情報に対して少なくとも前記最適調整係数foptMを乗じて再生し、それと同時に前記他方の視聴覚情報に対して少なくとも前記最適調整係数foptOを乗じて再生するステップと、を少なくとも含むことを特徴としている。
【0025】
このように、乗算により得られた数値群から、他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOに最も近い数値boptを選択し、前記他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOと、前記boptとの相加平均BPMaimを算出し、前記相加平均BPMaimを前記boptで除算して得られる最適調整係数foptMを出力し、前記相加平均BPMaimを前記他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOで除算して得られる最適調整係数foptOを出力し、前記一方の視聴覚情報に対して少なくとも前記最適調整係数foptMを乗じて再生するので、両方の視聴覚情報のアクセント位置を合わせて再生することができる。これにより、BPMが大きく異なる視聴覚情報同士をリミックスする際の音声または画質の劣化を軽減することが可能となる。また、2つの視聴覚情報の双方を調整するので、一方のみを調整する場合よりも音質または画質の劣化を軽減させることが可能となる。また、視聴者に対して、リミックスされた視聴覚情報を違和感なく提供することが可能となる。さらに、両方の視聴覚情報のアクセントの位置が自動的に合わせられるため、熟練していないユーザであっても、容易に視聴覚情報のリミックスを行なうことが可能となる。
【0026】
(11)また、本発明の同期再生プログラムは、コンピュータにロードされることによって、周期性を有する音声情報または周期性を有する映像情報のいずれかである2つの視聴覚情報を再生時に同期させる同期再生プログラムであって、一方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMMに対して単調増加数列を形成する複数の数値を乗算する処理と、前記乗算で得られる数値群から、他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOに最も近い数値boptを選択する処理と、前記他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOを、前記boptで除算して最適調整係数foptを出力する処理と、前記一方の視聴覚情報に対して少なくとも前記最適調整係数foptを乗じて再生し、それと同時に前記他方の視聴覚情報を再生する処理と、を少なくとも含むことを特徴としている。
【0027】
このように、乗算により得られた数値群から、他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOに最も近い数値boptを選択し、前記他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOを、前記boptで除算して得られる最適調整係数foptを出力し、前記一方の視聴覚情報に対して少なくとも前記最適調整係数foptを乗じて再生し、それと同時に前記他方の視聴覚情報を再生するので、両方の視聴覚情報のアクセント位置を合わせて再生することができる。これにより、BPMが大きく異なる視聴覚情報同士をリミックスする際の音声または画質の劣化を軽減することが可能となる。また、視聴者に対して、リミックスされた視聴覚情報を違和感なく提供することが可能となる。さらに、両方の視聴覚情報のアクセントの位置が自動的に合わせられるため、熟練していないユーザであっても、容易に視聴覚情報のリミックスを行なうことが可能となる。なお、視聴覚情報とは、音声情報および映像情報の両方の概念を含む。従って、本発明では、周期性を有するものであれば、2つの音声情報、2つの映像情報、および1つの音声情報と1つの映像情報を、再生時に同期させることが可能である。
【0028】
(12)また、本発明の同期再生プログラムは、コンピュータにロードされることによって、周期性を有する音声情報または周期性を有する映像情報のいずれかである2つの視聴覚情報を再生時に同期させる同期再生プログラムであって、一方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMMに対して単調増加数列を形成する複数の数値を乗算する処理と、前記乗算で得られる数値群から、他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOに最も近い数値boptを選択する処理と、前記他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOと、前記boptとの相加平均BPMaimを算出する処理と、前記相加平均BPMaimを前記boptで除算して得られる最適調整係数foptMを出力すると共に、前記相加平均BPMaimを前記他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOで除算して得られた最適調整係数foptOを出力する処理と、前記一方の視聴覚情報に対して少なくとも前記最適調整係数foptMを乗じて再生し、それと同時に前記他方の視聴覚情報に対して少なくとも前記最適調整係数foptOを乗じて再生する処理と、を少なくとも含むことを特徴としている。
【0029】
このように、乗算により得られた数値群から、他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOに最も近い数値boptを選択し、前記他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOと、前記boptとの相加平均BPMaimを算出し、前記相加平均BPMaimを前記boptで除算して得られる最適調整係数foptMを出力し、前記相加平均BPMaimを前記他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOで除算して得られる最適調整係数foptOを出力し、前記一方の視聴覚情報に対して少なくとも前記最適調整係数foptMを乗じて再生するので、両方の視聴覚情報のアクセント位置を合わせて再生することができる。これにより、BPMが大きく異なる視聴覚情報同士をリミックスする際の音声または画質の劣化を軽減することが可能となる。また、2つの視聴覚情報の双方を調整するので、一方のみを調整する場合よりも音質または画質の劣化を軽減させることが可能となる。また、視聴者に対して、リミックスされた視聴覚情報を違和感なく提供することが可能となる。さらに、両方の視聴覚情報のアクセントの位置が自動的に合わせられるため、熟練していないユーザであっても、容易に視聴覚情報のリミックスを行なうことが可能となる。
【発明の効果】
【0030】
本発明によれば、乗算により得られた数値群から、他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOに最も近い数値boptを選択し、前記他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOを、前記boptで除算して得られる最適調整係数foptを出力し、前記一方の視聴覚情報に対して少なくとも前記最適調整係数foptを乗じて再生し、それと同時に前記他方の視聴覚情報を再生するので、両方の視聴覚情報のアクセント位置を合わせて再生することができる。これにより、BPMが大きく異なる視聴覚情報同士をリミックスする際の音声または画質の劣化を軽減することが可能となる。また、視聴者に対して、リミックスされた視聴覚情報を違和感なく提供することが可能となる。さらに、両方の視聴覚情報のアクセントの位置が自動的に合わせられるため、熟練していないユーザであっても、容易に視聴覚情報のリミックスを行なうことが可能となる。
【発明を実施するための最良の形態】
【0031】
(第1の実施形態)
次に、本発明に係る実施形態について、図面を参照しながら説明する。図1は、本発明の第1の実施形態に係る同期再生装置の概略構成を示すブロック図である。この同期再生装置1は、周期性を有する2つの音声情報、周期性を有する2つの映像情報、または周期性を有する1つの音声情報と周期性を有する1つの映像情報を、再生時に同期させる。本明細書では、周期性を有する音声情報および周期性を有する映像情報を、「視聴覚情報」と呼称する。すなわち、本明細書において、視聴覚情報といった場合は、周期性を有する音声情報または周期性を有する映像情報のいずれかを指すものとしている。また、BPM(Beats Per Minute)とは、1分間あたりのアクセント数(ビート数)を意味する。アクセント(ビート)とは、音声情報の場合は、周期的な音声の強弱のことをいう。また、映像情報の場合は、周期的な繰返し映像のことであり、例えば、ボールがバウンドしている映像中、地面に着いた瞬間のボールの映像のことをいう。アクセント位置(ビート位置)とは、時間軸上でのアクセント(ビート)の位置、すなわち、アクセントが現れる時刻のことをいう。
【0032】
同期再生装置1において、乗算部2は、第1の視聴覚情報の単位時間当たりの周期的なアクセント数BPMMに対して、単調増加数列を形成する複数の数値を乗算する。この「単調増加数列を形成する複数の数値」は、例えば、cを整数として、2cで求められる数値を使用することができる。この場合、「c=−2,−1,0,1,2」とすると、2cは、「2c=0.25,0.5,1,2,4」と求めることができる。乗算部2は、第1の視聴覚情報の単位時間当たりの周期的なアクセント数BPMMに対して、このように2cで求められる数値を乗算する。なお、ここでは、「単調増加数列を形成する複数の数値」の例として、2cを用いて説明したが、本発明は、これに限定されるわけではない。
【0033】
選択部3は、乗算部2における乗算により得られた数値群から、第2の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOに最も近い数値boptを選択する。例えば、乗算部2における乗算により得られた数値群を、{b1,b2,b3,b4,b5}としたときに、これらの中から第2の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOに最も近い数値boptを選択する。この場合、選択部3が選択した数値boptは、直接除算部4に入力される。
【0034】
除算部4は、第2の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOを、boptで除算して得られる最適調整係数foptを出力する。再生部5は、第1の視聴覚情報に対して、少なくとも最適調整係数foptを乗じて再生し、それと同時に第2の視聴覚情報を再生する。なお、相加平均算出部6については後述する。
【0035】
図2は、第1の実施形態に係る同期再生装置の動作を示すフローチャートである。ここでは、視聴覚情報として、周期性のある音声情報、例えば、楽曲を例にとって説明する。この同期再生装置は、楽曲のBPMを合わせるのではなく、楽曲のビート位置に着目し、2つの楽曲の調整係数fが最小となるような最適調整係数foptを求め、このfoptに基づいて楽曲テンポを調整する。これによって、楽曲の音質劣化を軽減させたリミックスを行なうことが可能になる。具体的には、例えば、BPM120の楽曲とBPM60の楽曲とを結合する場合、BPM60の楽曲をBPM120となるようにテンポ調整すると、音質劣化が著しくなる。本発明では、ビート位置に着目し、BPM60の裏拍子を考慮することによって、テンポ調整をすることなくリミックスを可能とする。なお、ここでは、両方の視聴覚情報のアクセント位置を合わせて再生することを、「テンポ調整」と呼称する。
【0036】
図2において、楽曲Mと楽曲Oとを選定する(ステップS1)。ここで、テンポ調整を行なう楽曲をMとし、テンポ調整を行なわない楽曲をOとする。次に、BPM情報は既知であるかどうかを判断し(ステップS2)、既知でない場合は、テンポ解析を行なう(ステップS3)。ここでテンポ解析を行なって得られた楽曲MのBPMを、BPMMとし、楽曲OのBPMをBPMOとする。一方、ステップS2において、BPMが既知である場合は、ステップS4に遷移する。
【0037】
次に、BPMMに対して、2cを乗算する。ここで、「c=−2,−1,0,1,2」とし、数値群G={b1、b2,b3,b4,b5}を得る(ステップS4)。次に、数値群GからBPMOに最も近い値であるboptを算出する(ステップS5)。すなわち、
bopt=2Copt×BPMMである。
【0038】
次に、最適テンポ調整係数(最適調整係数)foptを計算する(ステップS6)。すなわち、
fopt=BPMO/boptである。
【0039】
なお、ステップS3におけるテンポ解析では、例えば、非特許文献1に記載されているテンポ推定手法を用いて、楽曲M、楽曲OのBPMを計算することができる。また、既存のテンポ推定手法を利用せずに、予め用意されている楽曲メタデータを用いることも可能である。
【0040】
(第2の実施形態)
上記のように最適テンポ調整係数(最適調整係数)を算出する際に、第1および第2の視聴覚情報の両方を調整することも可能である。この場合、図1における選択部3が選択した数値boptは、直接除算部4には入力されずに、相加平均算出部6に入力される。相加平均算出部6は、第2の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOと、選択部3により選択されたboptとの相加平均BPMaimを算出する。除算部4は、相加平均BPMaimをboptで除算して得られる最適調整係数foptMを出力すると共に、相加平均BPMaimを第2の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOで除算して得られる最適調整係数foptOを出力する。再生部5は、第1の視聴覚情報に対して少なくとも最適調整係数foptMを乗じて再生し、それと同時に第2の視聴覚情報に対して少なくとも最適調整係数foptOを乗じて再生する。
【0041】
第2の実施形態に係る同期再生装置の動作についても、図2に示すフローチャートで説明することができる。図2において、まず、楽曲Mと楽曲Oとを選定する(ステップS1)。ここで、楽曲Mの最適テンポ調整係数をfoptMとし、楽曲Oの最適テンポ調整係数をfoptOとする。そして、再生部5におけるテンポをBPMaimとする。BPM情報は既知であるかどうかを判断し(ステップS2)、既知でない場合は、テンポ解析を行なう(ステップS3)。ここでテンポ解析を行なって得られた楽曲MのBPMを、BPMMとし、楽曲OのBPMをBPMOとする。一方、ステップS2において、BPMが既知である場合は、ステップS4に遷移する。
【0042】
次に、BPMMに対して、2cを乗算する。ここで、「c=−2,−1,0,1,2」とし、数値群G={b1、b2,b3,b4,b5}を得る(ステップS4)。次に、数値群GからBPMOに最も近い値であるboptを算出する(ステップS5)。すなわち、
bopt=2Copt×BPMMである。
【0043】
次に、boptとBPMOとの相加平均から再生部5におけるテンポBPMaimを求め、楽曲Mの最適テンポ調整係数foptMと、楽曲Oの最適テンポ調整係数とをfoptO求める(ステップS6)。すなわち、
BPMaim=(bopt+BPMO)/2、
foptM=BPMaim/bopt、
foptO=BPMaim/BPMOにより求められる。
【0044】
このように求められたfoptMと、foptOに従って、楽曲Mと楽曲Oとのテンポ調整を行なうことによって、一方のみをテンポ調整する場合に比べて、音質劣化を軽減させることが可能となる。
【0045】
なお、第1および第2の実施形態で示した同期再生装置は、楽曲のリミックスだけではなく、周期性を有する情報について適用することが可能である。周期性を有する複数の情報を同期させて、再生をすることができる。この場合、上記のBPM情報を、周期情報に置き換えて、最適周期調整係数として計算すればよい。特許文献2では、本実施形態と同様に、テンポ候補から2の累乗を乗算して得た候補を加えてテンポ推定を行なっているが、本実施形態のように、リミックスの対象とする楽曲同士のBPM調整を行なうための指標として用いられてはいない。また、特許文献2では、対話型の音楽再生装置を提案しているが、全自動でのリミックスではない。これに対し、本実施形態では、楽曲のBPM情報から裏拍子を自動的に認識するため、最も音質劣化の少ないリミックスを提供することが可能である。
【0046】
(第3の実施形態)
第3の実施形態では、最適テンポ調整係数(最適調整係数)を利用した楽曲リミックスについて説明する。最適テンポ調整係数と、楽曲のビート位置情報を利用することによって、楽曲のビート感を合わせた楽曲リミックスを実現する。なお、以下の説明では、テンポ調整をする楽曲をM、テンポ調整をしない楽曲をOとして、両楽曲のBPM情報をBPMM、BPMO、ビート位置情報をLM={lM1,lM3,lM3,・・・}、LO={lO1,lO2,lO3,・・・}とする。
【0047】
図3は、第3の実施形態に係る楽曲リミックスの手順を示すフローチャートであり、図4は、2つの楽曲をリミックスする際の重畳区間を示す図である。また、図5は、ボリュームコントロールの様子を示す図である。まず、リミックス後の楽曲同士の重畳区間TMを定義する(ステップT1)。次に、最適テンポ調整係数foptを計算し、テンポ変調区間T(T=fopt×TM)を計算する(ステップT2)。次に、楽曲Mの信号から、テンポ変調区間Tを抽出し、これをEM(t)とする(ステップT3)。
【0048】
次に、楽曲MのEM(t)に対して、テンポ調整(fopt×BPMM)を行なう(ステップT4)。テンポ調整された楽曲MのEM(t)をEMm(t)とする(ステップT5)。また、楽曲Oの信号から、重畳区間TMを抽出し、これをEOm(t)とする(ステップT5)。これにより、ビート位置の調整が行なわれる。次に、EMm(t)、EOm(t)における開始ビート位置SMm、SOmを、LM、LOから求める(ステップT6)。次に、ボリュームコントロールを行なって(ステップT7)、SMm、SOmを時系列上で合わせて、楽曲Mと楽曲Oとを結合させる(ステップT8)。
【0049】
ここで、ステップT7において、楽曲を結合する際に、クロスフェード等のボリュームコントロールを適用することにより、滑らかな楽曲のリミックスを行なうことが可能である。ボリュームコントロールは、図5に示すボリュームコントロール関数のように、重畳区間において、信号の振幅を徐々に減少させるような信号を乗算することによって、適用することができる。また、信号の振幅を徐々に増加させるような信号を乗算するようにしても良い。
【0050】
(第4の実施形態)
本実施形態では、テンポ調整の際に、2つの楽曲が重なる部分における違和感を軽減するために、第3の音源を挿入する。なお、第3の音源は、ドラム音のように、リズムのみの音であっても良いし、楽曲であっても良い。本実施形態では、前の楽曲が完全に終了する前に次の楽曲が開始する場合、すなわち、2つの楽曲が重なり合う場合について説明する。前の楽曲が完全に終了してから次の楽曲が開始する場合に第3の音源を再生する例については、後述する。図6は、第4の実施形態において第3の音源を挿入する手順を示すフローチャートであり、図7は、ビート位置に第3の音源を挿入した信号の様子を示す図である。また、図8は、第3の音源および楽曲に対するボリュームコントロールの様子を示す図である。図6において、まず、リミックス後の楽曲同士の重畳区間TMを定義する(ステップR1)。次に、最適テンポ調整係数foptを計算し、テンポ変調区間T(T=fopt×TM)を計算する(ステップR2)。次に、楽曲Mの信号から、テンポ変調区間Tを抽出し、これをEM(t)とする(ステップR3)。
【0051】
次に、楽曲MのEM(t)に対して、テンポ調整(fopt×BPMM)を行なう(ステップR4)。テンポ調整された楽曲MのEM(t)をEMm(t)とする(ステップR5)。また、楽曲Oの信号から、重畳区間TMを抽出し、これをEOm(t)とする(ステップR5)。次に、ビート位置の調整を行なう。すなわち、EMm(t)、EOm(t)における開始ビート位置SMm、SOmを、LM、LOから求める(ステップR6)。次に、重畳区間内において、楽曲Mおよび楽曲Oのビート位置情報lAを取得し(ステップR7)、lAの位置に第3の音源を挿入する(ステップR8)。図7は、ビート位置であるlA1,lA2,lA3,・・・に第3の音源(ドラム音)を挿入した様子を示している。次に、図8に示すように、ボリュームコントロールを行なう(ステップR9)。具体的には、重畳区間内で、楽曲Mのボリュームを次第に減少させると共に、ドラム音源のボリュームを次第に上げていく。また、同時に楽曲Oのボリュームも次第に上げていく。重畳区間の中央あたりで、ドラム音源のボリュームを次第に下げていく。これにより、楽曲Mと楽曲Oとを結合させる(ステップR10)。第4の実施形態によれば、楽曲のリミックスを行なう際の違和感を軽減することが可能となる。
【0052】
(第5の実施形態)
本実施形態では、上記の第3の実施形態のステップT4において、テンポ調整係数に基づいてテンポ調整を行なう際に、徐々にテンポを調整する。図9は、第5の実施形態において、徐々にテンポを調整していく手順を示すフローチャートであり、図10は、テンポを徐々に調整していく区間を示す図である。図9において、まず、リミックス後の楽曲同士の重畳区間TMと、テンポを徐々に調整していく区間TM1とを定義する(ステップP1)。次に、最適テンポ調整係数foptを計算し、テンポ変調区間T(T=fopt×TM)を計算する(ステップP2)。次に、楽曲Mの信号から、テンポ変調区間Tおよびテンポを徐々に調整していく区間TM1を抽出し、これらをそれぞれEM(t)、EM1(t)とする(ステップP3)。
【0053】
次に、楽曲MのEM(t)に対して、テンポ調整(fopt×BPMM)を行ない、テンポ調整された楽曲MのEM(t)をEMm(t)とする(ステップP4)。次に、EM1(t)に対して、BPMMからfopt×BPMMまで調整するために、徐々にテンポ調整係数fを変化させる。具体的には、テンポ調整係数fを、1からfoptまで変化させ、(fopt×BPMM)を順次、計算することによって、滑らかにテンポ調整を行ない、EMm1(t)とする(ステップP5)。
【0054】
具体的には、図10に示すように、TM1の区間で、テンポ調整係数を1からfoptまで変化させてテンポ調整を行なう。例えば、fopt=0.80(sec)、TM1=0.80(sec)とすると、テンポ調整係数fを、{1,0.95,0.90,0.85,0.80}と変化させる。そして、
0〜2秒の区間では、f=1.00、
2〜4秒の区間では、f=0.95、
4〜6秒の区間では、f=0.90、
6〜8秒の区間では、f=0.85、
8〜10秒の区間では、f=0.80、という調整を行なう。
【0055】
次に、重畳区間におけるEMm(t)、EOm(t)を抽出し(ステップP6)、開始ビート位置SMm、SOmを、LM、LOから求める(ステップP7)。次に、SMm、SOmを時系列上で合わせて、楽曲Mと楽曲Oとを結合させる(ステップP8)。
【0056】
このように、テンポ調整係数fを、1からfoptまで変化させるので、最適テンポ調整係数によって求められたテンポに対して滑らかにテンポ調整を行なうことが可能となる。特に、最適テンポ調整係数のみを用いた場合と比較して、テンポ調整による違和感が軽減される。
【0057】
(第6の実施形態)
本実施形態では、テンポ調整の際に、2つの楽曲が移り変わる部分における違和感を軽減するために、本実施形態は、第4の実施形態のように、第3の音源を挿入する。本実施形態においても、第3の音源は、ドラム音のように、リズムのみの音であっても良いし、楽曲であっても良い。本実施形態では、前の楽曲が完全に終了してから次の楽曲が開始する場合に第3の音源を再生する例について説明する。なお、本実施形態では、楽曲の特徴を表わす「楽曲特徴量」を、例えば、「楽曲ベクトル」を用いて説明する。また、楽曲の特徴の類似度合いを表わす「特徴類似度」、例えば、「コサイン距離」を用いて説明する。
【0058】
図11は、第6の実施形態に係る同期再生装置の概略構成を示すブロック図である。同期再生装置60において、エフェクト音選択部61は、一方の楽曲情報(楽曲A)の楽曲ベクトルとのコサイン距離が最も近い楽曲ベクトルを持つエフェクト音Iと、他方の楽曲情報(楽曲B)の楽曲ベクトルとのコサイン距離が最も近い楽曲ベクトルを持つエフェクト音IIとを選択する。乗算部62は、エフェクト音Iの単位時間当たりの周期的なアクセント数BPM1に対して単調増加数列を形成する複数の数値を乗算して数値群Iを算出する。また、エフェクト音IIの単位時間当たりの周期的なアクセント数BPM2に対して単調増加数列を形成する複数の数値を乗算して数値群IIを算出する。
【0059】
選択部63は、数値群Iから、一方の楽曲情報(楽曲A)の単位時間当たりの周期的なアクセント数BPM3に最も近い数値bopt1を選択する。また、数値群IIから、他方の楽曲情報(楽曲B)の単位時間当たりの周期的なアクセント数BPM4に最も近い数値bopt2を選択する。除算部64は、一方の楽曲情報(楽曲A)の単位時間当たりの周期的なアクセント数BPM3を、上記のbopt1で除算して得られる最適調整係数fopt1を出力する。また、他方の楽曲情報(楽曲B)の単位時間当たりの周期的なアクセント数BPM4を、上記bopt2で除算して得られる最適調整係数fopt2を出力する。
【0060】
再生部65は、一方の楽曲情報(楽曲A)を再生し、その楽曲Aの終了前の一定期間内に、その楽曲Aと同時にエフェクト音Iに対して最適調整係数fopt1を乗じて、エフェクト音Iを再生する。ここでは、クロスフェード方式を用いて両者を重ねて再生する。これにより、楽曲AのBPM3にエフェクト音IのBPM1を合わせることができる。次に、再生部65は、楽曲Aが終了し、エフェクト音Iの再生中に、エフェクト音IのBPM1と、エフェクト音IIのBPM2とが合うようにエフェクト音同士を調整しながら、エフェクト音IIの再生を開始する。そのとき、エフェクト音Iの再生を止めても良いし、クロスフェード方式を採って両者を再生しても良い。次に、再生部65は、エフェクト音IIに対して最適調整係数fopt2を乗じて再生すると共に、他方の楽曲情報(楽曲B)を再生する。ここでも、クロスフェード方式を用いて両者を重ねて再生する。これにより、エフェクト音IIのBPM2を楽曲BのBPM4に合わせることができる。次に、第6の実施形態に係る同期再生装置の楽曲間処理の動作について説明する。
【0061】
図12は、第6の実施形態に係る楽曲間処理の様子を示す図である。第6の実施形態では、まず、(1)前後の楽曲の特徴量を取得する。すなわち、再生中の楽曲(楽曲A)と次に再生される楽曲(楽曲B)のBPM、ビート位置、楽曲ベクトルを取得する。楽曲ベクトルとは、音楽データのMFCCからツリーベクトル量子化手法(TreeQ)を用いて得たヒストグラムを指すものである。また、ここでは、BPM、ビート位置は既知とする。次に、(2)エフェクトの選択を行なう。BPM、ビート位置、ベクトルが既知のエフェクト音を用意する。そして、楽曲Bのベクトルとのコサイン距離が最も近い楽曲ベクトルを持つエフェクト(エフェクトII)を選択する。次に、楽曲AのベクトルおよびエフェクトIIのベクトルとのコサイン距離の平均が一番大きいエフェクト(エフェクトI)を選択する。
【0062】
次に、(3)エフェクトのテンポ変更を行なう。すなわち、エフェクト再生部分で、テンポが楽曲AのBPMから楽曲BのBPMへ徐々に推移するようエフェクトI、IIのテンポを変動させるのである。最後に、(4)ビート位置合わせを行なう。音源が重なる部分のビート位置が揃うように、後ろの音源を挿入するタイミングを調整する。図12は、このような楽曲間処理の様子を示す。図12に示すように、楽曲AからエフェクトI、エフェクトIIと再生され、楽曲Bの順につなげて連続再生を行なう。楽曲Aの最後の部分と、エフェクトIの最初の部分と、エフェクトIIの最後の部分と楽曲Bの最初の部分は、クロスフェードとされる。
【0063】
なお、本実施形態では、エフェクト音のみに最適調整係数を乗算する例を示したが、本発明は、これに限定されるわけではない。上記の各実施形態のように、楽曲Aおよび楽曲Bに最適調整係数を乗算する手法を採ることも可能である。
【0064】
第6の実施形態によれば、エフェクトIおよびIIによってテンポ調整を行なうことができるため、楽曲信号の伸縮操作が不要となる。その結果、楽曲の音質劣化が軽減される。
【0065】
(第7の実施形態)
本実施形態では、上記の同期再生装置を備えた楽曲自動リミックスシステムについて説明する。図13は、第7の実施形態に係る楽曲自動リミックスシステムの概略構成を示すブロック図である。この楽曲自動リミックスシステム110は、同期再生装置1と、楽曲を選択する楽曲選択部111と、音楽データとしての複数の楽曲を格納する楽曲データベース(DB)112と、から構成される。
【0066】
楽曲選択部111は、ユーザの操作を受け付けて、リミックスする楽曲を選択する。例えば、楽曲データベース112に格納されている楽曲またはそのリストをユーザに提示する。ユーザは、楽曲選択部111に対して、いずれかの楽曲を選択する操作を行なう。また、ユーザが直接楽曲を選択するのではなく、楽曲の雰囲気、例えば、明るい楽曲、静かな楽曲等の楽曲の属性情報を入力することもできる。この場合は、入力された属性情報と、楽曲データベース112に格納されている楽曲メタ情報等とを比較して、リミックスを行なう楽曲を選出することができる。
【0067】
楽曲データベース112には、本システムで利用される楽曲および楽曲に関する情報が格納されている。例えば、楽曲データ、楽曲テンポ情報、楽曲ビート位置情報、さらに楽曲に付されたメタ情報などが格納されている。同期再生装置1は、上記各実施形態で説明した手法で、楽曲選択部111で選択された楽曲のリミックスを行なう。同期再生装置1において、最終的に結合されたリミックス用音楽信号は、スピーカ113で可聴音として出力される。また、データファイルとして、出力することも可能である。
【0068】
なお、楽曲自動リミックスシステム110において、楽曲テンポ情報、楽曲ビート位置情報については、既知であるものとする。
【0069】
(第8の実施形態)
本実施形態では、楽曲テンポ情報、楽曲ビート位置情報が未知である場合の形態を説明する。図14は、第8の実施形態に係る楽曲自動リミックスシステムの概略構成を示すブロック図である。この楽曲自動リミックスシステム120は、第7の実施形態と同様に、同期再生装置1と、楽曲選択部111と、楽曲データベース112とを備えている。更に、楽曲取得・解析部121を備えている。この楽曲取得・解析部121は、楽曲データベース112に格納されている楽曲を取得し、解析して、解析結果を楽曲情報データベース122に格納する。楽曲取得・解析部121は、例えば、非特許文献1に開示されている技術を利用して、楽曲テンポ情報、楽曲ビート位置情報等を解析する。また、楽曲データベース112に格納されている楽曲データ、楽曲情報データ等も取得し、解析のために利用することができる。
【0070】
楽曲情報データベース122は、楽曲取得・解析部121において解析された、楽曲に関する情報が格納される。例えば、楽曲テンポ情報、楽曲ビート位置情報等のデータが格納される。また、楽曲データベース112内の情報や、楽曲データを格納することも可能である。
【0071】
本実施形態によれば、楽曲テンポ情報、楽曲ビート位置情報が未知である場合であっても、楽曲データベース112に格納されている情報に基づいて、これらを得ることができる。
【図面の簡単な説明】
【0072】
【図1】第1の実施形態に係る同期再生装置の概略構成を示すブロック図である。
【図2】第1および第2の実施形態に係る同期再生装置の動作を示すフローチャートである。
【図3】第3の実施形態に係る楽曲リミックスの手順を示すフローチャートである。
【図4】2つの楽曲をリミックスする際の重畳区間を示す図である。
【図5】ボリュームコントロールの様子を示す図である。
【図6】第4の実施形態において第3の音源を挿入する手順を示すフローチャートである。
【図7】ビート位置に第3の音源を挿入した信号の様子を示す図である。
【図8】第3の音源および楽曲に対するボリュームコントロールの様子を示す図である。
【図9】第5の実施形態において、徐々にテンポを調整していく手順を示すフローチャートである。
【図10】テンポを徐々に調整していく区間を示す図である。
【図11】第6の実施形態に係る同期再生装置の概略構成を示すブロック図である。
【図12】第6の実施形態に係る楽曲間処理の様子を示す図である。
【図13】第7の実施形態に係る楽曲自動リミックスシステムの概略構成を示すブロック図である。
【図14】第8の実施形態に係る楽曲自動リミックスシステムの概略構成を示すブロック図である。
【符号の説明】
【0073】
1 同期再生装置
2 乗算部
3 選択部
4 除算部
5 再生部
6 相加平均算出部
110 楽曲自動リミックスシステム
111 楽曲選択部
112 楽曲データベース
113 スピーカ
120 楽曲自動リミックスシステム
121 楽曲取得・解析部
122 楽曲情報データベース
【特許請求の範囲】
【請求項1】
周期性を有する音声情報または周期性を有する映像情報のいずれかである2つの視聴覚情報を再生時に同期させる同期再生装置であって、
一方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMMに対して単調増加数列を形成する複数の数値を乗算する乗算部と、
前記乗算により得られた数値群から、他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOに最も近い数値boptを選択する選択部と、
前記他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOを、前記boptで除算して得られる最適調整係数foptを出力する除算部と、
前記一方の視聴覚情報に対して少なくとも前記最適調整係数foptを乗じて再生し、それと同時に前記他方の視聴覚情報を再生する再生部と、を備えることを特徴とする同期再生装置。
【請求項2】
周期性を有する音声情報または周期性を有する映像情報のいずれかである2つの視聴覚情報を再生時に同期させる同期再生装置であって、
一方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMMに対して単調増加数列を形成する複数の数値を乗算する乗算部と、
前記乗算により得られた数値群から、他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOに最も近い数値boptを選択する選択部と、
前記他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOと、前記boptとの相加平均BPMaimを算出する相加平均算出部と、
前記相加平均BPMaimを前記boptで除算して得られる最適調整係数foptMを出力すると共に、前記相加平均BPMaimを前記他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOで除算して得られる最適調整係数foptOを出力する除算部と、
前記一方の視聴覚情報に対して少なくとも前記最適調整係数foptMを乗じて再生し、それと同時に前記他方の視聴覚情報に対して少なくとも前記最適調整係数foptOを乗じて再生する再生部と、を備えることを特徴とする同期再生装置。
【請求項3】
前記再生部は、前記視聴覚情報に対して乗ずる調整係数を、時間経過に応じて1から最適調整係数まで変化させることを特徴とする請求項1または請求項2記載の同期再生装置。
【請求項4】
前記再生部は、前記最適調整係数が乗じられた視聴覚情報のアクセントの周期に合致した周期のアクセントを有する第三の視聴覚情報を、前記各視聴覚情報と同時に再生することを特徴とする請求項1または請求項2記載の同期再生装置。
【請求項5】
前記再生部は、前記一方の視聴覚情報の再生が終了する前に前記他方の視聴覚情報の再生を開始することを特徴とする請求項1から請求項4のいずれかに記載の同期再生装置。
【請求項6】
2つの楽曲情報間の処理を行なう同期再生装置であって、
予め選択されたエフェクト音Iおよびエフェクト音IIについて、前記エフェクト音Iの単位時間当たりの周期的なアクセント数BPM1に対して単調増加数列を形成する複数の数値を乗算して数値群Iを算出すると共に、前記エフェクト音IIの単位時間当たりの周期的なアクセント数BPM2に対して単調増加数列を形成する複数の数値を乗算して数値群IIを算出する乗算部と、
前記数値群Iから、前記一方の楽曲情報の単位時間当たりの周期的なアクセント数BPM3に最も近い数値bopt1を選択すると共に、前記数値群IIから、前記他方の楽曲情報の単位時間当たりの周期的なアクセント数BPM4に最も近い数値bopt2を選択する選択部と、
前記一方の楽曲情報の単位時間当たりの周期的なアクセント数BPM3を、前記bopt1で除算して得られる最適調整係数fopt1を出力すると共に、前記他方の楽曲情報の単位時間当たりの周期的なアクセント数BPM4を、前記bopt2で除算して得られる最適調整係数fopt2を出力する除算部と、
前記一方の楽曲情報を再生すると共に、前記エフェクト音Iに対して前記最適調整係数fopt1を乗じて再生し、前記エフェクト音IIに対して前記最適調整係数fopt2を乗じて再生すると共に、前記他方の楽曲情報を再生する再生部と、を備えることを特徴とする同期再生装置。
【請求項7】
一方の楽曲情報の楽曲特徴量との特徴類似度が最も近い楽曲特徴量を持つエフェクト音Iと、他方の楽曲情報の楽曲特徴量との特徴類似度が最も近い楽曲特徴量を持つエフェクト音IIとを選択するエフェクト音選択部を更に備えることを特徴とする請求項6記載の同期再生装置。
【請求項8】
複数の楽曲データを格納する楽曲データベースと、
ユーザの操作を契機としていずれか2つの楽曲データを選択する楽曲選択部と、
請求項1から請求項5のいずれかに記載の同期再生装置と、
前記同期再生装置により再生される楽曲データを音声として出力する出力部と、を備えることを特徴とする楽曲自動リミックスシステム。
【請求項9】
周期性を有する音声情報または周期性を有する映像情報のいずれかである2つの視聴覚情報を再生時に同期させる同期再生方法であって、
乗算部において、一方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMMに対して単調増加数列を形成する複数の数値を乗算するステップと、
選択部において、前記乗算により得られた数値群から、他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOに最も近い数値boptを選択するステップと、
除算部において、前記他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOを、前記boptで除算して得られる最適調整係数foptを出力するステップと、
再生部において、前記一方の視聴覚情報に対して少なくとも前記最適調整係数foptを乗じて再生し、それと同時に前記他方の視聴覚情報を再生するステップと、を少なくとも含むことを特徴とする同期再生方法。
【請求項10】
周期性を有する音声情報または周期性を有する映像情報のいずれかである2つの視聴覚情報を再生時に同期させる同期再生方法であって、
乗算部において、一方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMMに対して単調増加数列を形成する複数の数値を乗算するステップと、
選択部において、前記乗算により得られた数値群から、他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOに最も近い数値boptを選択するステップと、
相加平均算出部において、前記他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOと、前記boptとの相加平均BPMaimを算出するステップと、
除算部において、前記相加平均BPMaimを前記boptで除算して得られる最適調整係数foptMを出力すると共に、前記相加平均BPMaimを前記他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOで除算して得られる最適調整係数foptOを出力するステップと、
再生部において、前記一方の視聴覚情報に対して少なくとも前記最適調整係数foptMを乗じて再生し、それと同時に前記他方の視聴覚情報に対して少なくとも前記最適調整係数foptOを乗じて再生するステップと、を少なくとも含むことを特徴とする同期再生方法。
【請求項11】
コンピュータにロードされることによって、周期性を有する音声情報または周期性を有する映像情報のいずれかである2つの視聴覚情報を再生時に同期させる同期再生プログラムであって、
一方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMMに対して単調増加数列を形成する複数の数値を乗算する処理と、
前記乗算で得られる数値群から、他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOに最も近い数値boptを選択する処理と、
前記他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOを、前記boptで除算して最適調整係数foptを出力する処理と、
前記一方の視聴覚情報に対して少なくとも前記最適調整係数foptを乗じて再生し、それと同時に前記他方の視聴覚情報を再生する処理と、を少なくとも含むことを特徴とする同期再生プログラム。
【請求項12】
コンピュータにロードされることによって、周期性を有する音声情報または周期性を有する映像情報のいずれかである2つの視聴覚情報を再生時に同期させる同期再生プログラムであって、
一方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMMに対して単調増加数列を形成する複数の数値を乗算する処理と、
前記乗算で得られる数値群から、他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOに最も近い数値boptを選択する処理と、
前記他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOと、前記boptとの相加平均BPMaimを算出する処理と、
前記相加平均BPMaimを前記boptで除算して得られる最適調整係数foptMを出力すると共に、前記相加平均BPMaimを前記他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOで除算して得られた最適調整係数foptOを出力する処理と、
前記一方の視聴覚情報に対して少なくとも前記最適調整係数foptMを乗じて再生し、それと同時に前記他方の視聴覚情報に対して少なくとも前記最適調整係数foptOを乗じて再生する処理と、を少なくとも含むことを特徴とする同期再生プログラム。
【請求項1】
周期性を有する音声情報または周期性を有する映像情報のいずれかである2つの視聴覚情報を再生時に同期させる同期再生装置であって、
一方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMMに対して単調増加数列を形成する複数の数値を乗算する乗算部と、
前記乗算により得られた数値群から、他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOに最も近い数値boptを選択する選択部と、
前記他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOを、前記boptで除算して得られる最適調整係数foptを出力する除算部と、
前記一方の視聴覚情報に対して少なくとも前記最適調整係数foptを乗じて再生し、それと同時に前記他方の視聴覚情報を再生する再生部と、を備えることを特徴とする同期再生装置。
【請求項2】
周期性を有する音声情報または周期性を有する映像情報のいずれかである2つの視聴覚情報を再生時に同期させる同期再生装置であって、
一方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMMに対して単調増加数列を形成する複数の数値を乗算する乗算部と、
前記乗算により得られた数値群から、他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOに最も近い数値boptを選択する選択部と、
前記他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOと、前記boptとの相加平均BPMaimを算出する相加平均算出部と、
前記相加平均BPMaimを前記boptで除算して得られる最適調整係数foptMを出力すると共に、前記相加平均BPMaimを前記他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOで除算して得られる最適調整係数foptOを出力する除算部と、
前記一方の視聴覚情報に対して少なくとも前記最適調整係数foptMを乗じて再生し、それと同時に前記他方の視聴覚情報に対して少なくとも前記最適調整係数foptOを乗じて再生する再生部と、を備えることを特徴とする同期再生装置。
【請求項3】
前記再生部は、前記視聴覚情報に対して乗ずる調整係数を、時間経過に応じて1から最適調整係数まで変化させることを特徴とする請求項1または請求項2記載の同期再生装置。
【請求項4】
前記再生部は、前記最適調整係数が乗じられた視聴覚情報のアクセントの周期に合致した周期のアクセントを有する第三の視聴覚情報を、前記各視聴覚情報と同時に再生することを特徴とする請求項1または請求項2記載の同期再生装置。
【請求項5】
前記再生部は、前記一方の視聴覚情報の再生が終了する前に前記他方の視聴覚情報の再生を開始することを特徴とする請求項1から請求項4のいずれかに記載の同期再生装置。
【請求項6】
2つの楽曲情報間の処理を行なう同期再生装置であって、
予め選択されたエフェクト音Iおよびエフェクト音IIについて、前記エフェクト音Iの単位時間当たりの周期的なアクセント数BPM1に対して単調増加数列を形成する複数の数値を乗算して数値群Iを算出すると共に、前記エフェクト音IIの単位時間当たりの周期的なアクセント数BPM2に対して単調増加数列を形成する複数の数値を乗算して数値群IIを算出する乗算部と、
前記数値群Iから、前記一方の楽曲情報の単位時間当たりの周期的なアクセント数BPM3に最も近い数値bopt1を選択すると共に、前記数値群IIから、前記他方の楽曲情報の単位時間当たりの周期的なアクセント数BPM4に最も近い数値bopt2を選択する選択部と、
前記一方の楽曲情報の単位時間当たりの周期的なアクセント数BPM3を、前記bopt1で除算して得られる最適調整係数fopt1を出力すると共に、前記他方の楽曲情報の単位時間当たりの周期的なアクセント数BPM4を、前記bopt2で除算して得られる最適調整係数fopt2を出力する除算部と、
前記一方の楽曲情報を再生すると共に、前記エフェクト音Iに対して前記最適調整係数fopt1を乗じて再生し、前記エフェクト音IIに対して前記最適調整係数fopt2を乗じて再生すると共に、前記他方の楽曲情報を再生する再生部と、を備えることを特徴とする同期再生装置。
【請求項7】
一方の楽曲情報の楽曲特徴量との特徴類似度が最も近い楽曲特徴量を持つエフェクト音Iと、他方の楽曲情報の楽曲特徴量との特徴類似度が最も近い楽曲特徴量を持つエフェクト音IIとを選択するエフェクト音選択部を更に備えることを特徴とする請求項6記載の同期再生装置。
【請求項8】
複数の楽曲データを格納する楽曲データベースと、
ユーザの操作を契機としていずれか2つの楽曲データを選択する楽曲選択部と、
請求項1から請求項5のいずれかに記載の同期再生装置と、
前記同期再生装置により再生される楽曲データを音声として出力する出力部と、を備えることを特徴とする楽曲自動リミックスシステム。
【請求項9】
周期性を有する音声情報または周期性を有する映像情報のいずれかである2つの視聴覚情報を再生時に同期させる同期再生方法であって、
乗算部において、一方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMMに対して単調増加数列を形成する複数の数値を乗算するステップと、
選択部において、前記乗算により得られた数値群から、他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOに最も近い数値boptを選択するステップと、
除算部において、前記他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOを、前記boptで除算して得られる最適調整係数foptを出力するステップと、
再生部において、前記一方の視聴覚情報に対して少なくとも前記最適調整係数foptを乗じて再生し、それと同時に前記他方の視聴覚情報を再生するステップと、を少なくとも含むことを特徴とする同期再生方法。
【請求項10】
周期性を有する音声情報または周期性を有する映像情報のいずれかである2つの視聴覚情報を再生時に同期させる同期再生方法であって、
乗算部において、一方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMMに対して単調増加数列を形成する複数の数値を乗算するステップと、
選択部において、前記乗算により得られた数値群から、他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOに最も近い数値boptを選択するステップと、
相加平均算出部において、前記他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOと、前記boptとの相加平均BPMaimを算出するステップと、
除算部において、前記相加平均BPMaimを前記boptで除算して得られる最適調整係数foptMを出力すると共に、前記相加平均BPMaimを前記他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOで除算して得られる最適調整係数foptOを出力するステップと、
再生部において、前記一方の視聴覚情報に対して少なくとも前記最適調整係数foptMを乗じて再生し、それと同時に前記他方の視聴覚情報に対して少なくとも前記最適調整係数foptOを乗じて再生するステップと、を少なくとも含むことを特徴とする同期再生方法。
【請求項11】
コンピュータにロードされることによって、周期性を有する音声情報または周期性を有する映像情報のいずれかである2つの視聴覚情報を再生時に同期させる同期再生プログラムであって、
一方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMMに対して単調増加数列を形成する複数の数値を乗算する処理と、
前記乗算で得られる数値群から、他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOに最も近い数値boptを選択する処理と、
前記他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOを、前記boptで除算して最適調整係数foptを出力する処理と、
前記一方の視聴覚情報に対して少なくとも前記最適調整係数foptを乗じて再生し、それと同時に前記他方の視聴覚情報を再生する処理と、を少なくとも含むことを特徴とする同期再生プログラム。
【請求項12】
コンピュータにロードされることによって、周期性を有する音声情報または周期性を有する映像情報のいずれかである2つの視聴覚情報を再生時に同期させる同期再生プログラムであって、
一方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMMに対して単調増加数列を形成する複数の数値を乗算する処理と、
前記乗算で得られる数値群から、他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOに最も近い数値boptを選択する処理と、
前記他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOと、前記boptとの相加平均BPMaimを算出する処理と、
前記相加平均BPMaimを前記boptで除算して得られる最適調整係数foptMを出力すると共に、前記相加平均BPMaimを前記他方の視聴覚情報の単位時間当たりの周期的なアクセント数BPMOで除算して得られた最適調整係数foptOを出力する処理と、
前記一方の視聴覚情報に対して少なくとも前記最適調整係数foptMを乗じて再生し、それと同時に前記他方の視聴覚情報に対して少なくとも前記最適調整係数foptOを乗じて再生する処理と、を少なくとも含むことを特徴とする同期再生プログラム。
【図1】
【図2】
【図3】
【図6】
【図7】
【図8】
【図9】
【図11】
【図12】
【図13】
【図14】
【図4】
【図5】
【図10】
【図2】
【図3】
【図6】
【図7】
【図8】
【図9】
【図11】
【図12】
【図13】
【図14】
【図4】
【図5】
【図10】
【公開番号】特開2009−204907(P2009−204907A)
【公開日】平成21年9月10日(2009.9.10)
【国際特許分類】
【出願番号】特願2008−47335(P2008−47335)
【出願日】平成20年2月28日(2008.2.28)
【出願人】(000208891)KDDI株式会社 (2,700)
【Fターム(参考)】
【公開日】平成21年9月10日(2009.9.10)
【国際特許分類】
【出願日】平成20年2月28日(2008.2.28)
【出願人】(000208891)KDDI株式会社 (2,700)
【Fターム(参考)】
[ Back to top ]