説明

楽曲のグルーピング構造の自動分析方法および装置、ならびにプログラムおよびこのプログラムを記録した記録媒体

【課題】階層的なグルーピングを行えるようにする。
【解決手段】メロディを構成する個々の音の特性を示す楽曲データが入力される楽曲データ入力ステップS1と、入力された楽曲データに示される連続した個々の音の特性が変化する箇所を検出しメロディの局所的境界とする局所的境界検出ステップS2と、検出された局所的境界に基づいてメロディを分割することによりメロディの階層的なグルーピング構造を分析するグルーピング構造分析ステップS3と、分析結果を出力する分析結果出力ステップS4とを備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、楽曲のグルーピング構造の自動分析方法および装置に関し、より詳しくは、連続したメロディをフレーズやモチーフなどに階層的に分割するグルーピング構造分析を自動的に行う方法および装置に関する。
【背景技術】
【0002】
人間が音楽を聴くとき、初めて聞くような旋律でも心地よく感じたり、音が外れているように聞こえるのはなぜだろうか、このような問いに対する研究は古くから行われてきた。その中で、楽曲を音符列という符号化された情報である視点から構造的に分析し、音楽認識を客観的に捉えようという理論がある。Generative Theory of Tonal Music(GTTM)は、そのような理論の中の一つであり、様々な理由により計算機上での自動化が有望視されている。GTTMによる楽曲の分析が自動化されれば、これまでの音楽検索エンジンとは違ったアプローチによる楽曲検索エンジンの作成や、自動伴奏システム、作曲支援などへの応用が期待できる。
【0003】
GTTMは、グルーピング構造分析、拍節構造分析、タイムスパン簡約、プロロンゲーション簡約という4つのサブ理論から構成される。このうち、グルーピング構造分析は、連続したメロディをフレーズやモチーフなどに階層的に分割するものであり、長いメロディを歌うときにどこで息継ぎすべきかを見つけるような分析である。
GTTMにはさらに、グルーピング構成ルール(Grouping Well-Formedness Rules:GWFR)と、グルーピング選好ルール(Grouping Preference Rules:GPR)という2種類のグルーピングに関するルールがある。GWFRは、グルーピング構造が成立するために必要な条件の制約であり、GPRは、GWFRが成り立つグルーピング構造が複数存在する場合に、どれが好ましいかを示すルールである(例えば、非特許文献1を参照)。
【0004】
GPRはさらに、GPR1(alternative form)、GPR2(proximity)、GPR3(change)、GPR4(intensification)、GPR5(symmetry)、GPR6(parallelism)、GPR7(time-span and prolongational stability)という7つのルールから構成される。GPR1〜3は、局所的な境界を求めるためのルールであり、GPR4〜7は、高次の境界を求め階層的なグルーピングを行うためのルールに2分できる。さらに、GPR2は、(a)(slur/rest)および(b)(attack-point)の2通りに分かれ、GPR3は、(a)(register)、(b)(dynamics)、(c)(articulation)および(d)(length)の4通りに分かれる。
【0005】
上述したGTTMは、元々計算機上への実装を目指した理論ではない。このため、計算機上での自動化には多くの問題があり、この問題を解決すべく様々な技術が提案されている。その一例として、非特許文献2に記載された技術では、GPR2〜3の適用対象を絞り込むために、次のような前処理を行っている。
・隣接音を接続するボイスリーディングを導入する。具体的には、上下2半音以内の隣接音に対してボイスリーディングが成立しているとし、そのような隣接音をすべて時間順に接続する。
・主旋律を捉えるために、第一声部(最も高い音)に限り、ボイスリーディングの成立不成立にかかわらず、隣接音を接続する。
【0006】
また、非特許文献3に記載された技術では、GPR2〜3の適用対象を絞り込むために、さらに次のような隣接音を判定するヒューリスティクスを導入している。
・着目している音から12半音以内の後続音を隣接音接続する。
・着目している音から4拍以内の後続音を隣接音接続する。
・後続音が半音的に変化している場合には、隣接音接続しない。
・着目している音と後続音との間に一定比率以上オンセット時間に差がある場合には、隣接音接続しない。
・着目している音と後続音との間で音高差/時間差が一定値以上である場合には、隣接音接続しない。
【0007】
なお、出願人は、本明細書に記載した先行技術文献情報で特定される先行技術文献以外には、本発明に関連する先行技術文献を出願時までに発見するには至らなかった。
【非特許文献1】平田,青柳,音楽理論GTTMに基づく多声音楽の表現手法と基本演算,(社)情報処理学会論文誌,vol.43,No.2(2002)
【非特許文献2】井田,平田,東条,GTTMに基づくグルーピング構造及び拍節構造の自動分析の試み,(社)情報処理学会音楽情報科学研究会,2001−MUS−42,pp.49−54(2001)
【非特許文献3】東洋,平田,東条,佐藤,グルーピング規則適用を改良したGTTMの実装,(社)情報処理学会音楽情報科学研究会,2002−MUS−47,pp.121−126(2002)
【発明の開示】
【発明が解決しようとする課題】
【0008】
上述した従来の技術は、グルーピング選好ルールGPR2〜3に関するものであるが、ルールの適用順序が決まっていないので、ルール間の競合がしばしば起こる。このため、従来の技術を用いて楽曲のグルーピング構造分析を行っても、楽曲の認識率が低いという問題があった。
また、従来の技術はメロディの局所的な境界を求めることに主眼を置いていたため、階層的なグルーピング構造を得ることができないという問題があった。
【0009】
本発明は、このような課題を解決するためになされたものであり、その目的は、ルール間の競合が起こらないようにすることにある。
また、他の目的は、階層的なグルーピングを適切に行えるようにすることにある。
【課題を解決するための手段】
【0010】
このような目的を達成するために、本発明に係る楽曲のグルーピング構造の自動分析方法は、メロディを構成する個々の音の特性を示す楽曲データが入力される楽曲データ入力ステップと、楽曲データに示される連続した個々の音の特性が変化する箇所を検出しメロディの局所的境界とする局所的境界検出ステップと、局所的境界に基づいてメロディを分割することによりメロディの階層的なグルーピング構造を検出するグルーピング構造検出ステップとを備えることを特徴とする。
【0011】
ここで、局所的境界検出ステップおよびグルーピング構造検出ステップが、複数の評価指標と、それぞれの評価指標に対する重み付けを調節するパラメータとに基づいて、音の特性の変化の度合いを局所的境界の深さとして数値化するようにしてもよい。
また、局所的境界検出ステップが、変化の度合いを規格化し、規格化された変化の度合いが閾値よりも大きい箇所を局所的境界とするようにしてもよい。
【0012】
また、グルーピング構造検出ステップが、メロディの全体またはメロディを局所的境界に基づいて分割することにより得られた連続する複数の音のグループに含まれる局所的境界の深さを比較して、最も深い局所的境界を1段下の階層のグループ境界に決定する第1のステップと、第1のステップの処理を下の階層のグループにおいて再帰的に実行する第2のステップとを備えるようにしてもよい。
【0013】
また、グルーピング構造検出ステップが、局所的境界のそれぞれにおける音の特性の変化とその前後の音の特性の変化との差が閾値よりも大きい場合に、その局所的境界の深さを増大させるようにしてもよい。
また、グルーピング構造検出ステップが、メロディの全体またはメロディを局所的境界に基づいて分割することにより得られた連続する複数の音のグループに対して、その時間的中心を平均とし、分散σをパラメータとする正規分布に基づいて、メロディの全体またはグループに含まれる局所的境界の深さにを増大または減少させるようにしてもよい。
【0014】
また、本発明に係る楽曲のグルーピング構造の自動分析装置は、メロディを構成する個々の音の特性を示す楽曲データが入力される楽曲データ入力手段と、楽曲データに示される連続した個々の音の特性が変化する箇所を検出しメロディの局所的境界とする局所的境界検出手段と、局所的境界に基づいてメロディを分割することによりメロディの階層的なグルーピング構造を検出するグルーピング構造検出手段とを備えることを特徴とする。
【0015】
ここで、局所的境界検出手段およびグルーピング構造検出手段は、複数の評価指標と、それぞれの評価指標に対する重み付けを調節するパラメータとに基づいて、音の特性の変化の度合いを局所的境界の深さとして数値化するようにしてもよい。
また、局所的境界検出手段が、変化の度合いを規格化し、規格化された変化の度合いが閾値よりも大きい箇所を局所的境界とするものであってもよい。
【0016】
また、グルーピング構造検出手段は、メロディの全体またはメロディを局所的境界に基づいて分割することにより得られた連続する複数の音のグループに含まれる局所的境界の深さを比較して、最も深い局所的境界を1段下の階層のグループ境界に決定する第1の手段と、第1の手段の処理を下の階層のグループにおいて再帰的に実行する第2の手段とを備えるものであってもよい。
【0017】
また、グルーピング構造検出手段は、局所的境界のそれぞれにおける音の特性の変化とその前後の音の特性の変化との差が閾値よりも大きい場合に、その局所的境界の深さを増大させるものであってもよい。
また、グルーピング構造検出手段は、メロディの全体またはメロディを局所的境界に基づいて分割することにより得られた連続する複数の音のグループに対して、その時間的中心を平均とし、分散σをパラメータとする正規分布に基づいて、メロディの全体またはグループに含まれる局所的境界の深さにを増大または減少させるものであってもよい。
【0018】
また、本発明に係る楽曲のグルーピング構造の自動分析プログラムは、メロディを構成する個々の音の特性を示す楽曲データが入力される楽曲データ入力ステップと、楽曲データに示される連続した個々の音の特性が変化する箇所を検出しメロディの局所的境界とする局所的境界検出ステップと、局所的境界に基づいてメロディを分割することによりメロディの階層的なグルーピング構造を検出するグルーピング構造検出ステップとをコンピュータに実行させることを特徴とする。
【0019】
ここで、局所的境界検出ステップおよびグルーピング構造検出ステップが、複数の評価指標と、それぞれの評価指標に対する重み付けを調節するパラメータとに基づいて、音の特性の変化の度合いを局所的境界の深さとして数値化するようにしてもよい。
また、局所的境界検出ステップが、変化の度合いを規格化し、規格化された変化の度合いが閾値よりも大きい箇所を局所的境界とするようにしてもよい。
【0020】
また、グルーピング構造検出ステップが、メロディの全体またはメロディを局所的境界に基づいて分割することにより得られた連続する複数の音のグループに含まれる局所的境界の深さを比較して、最も深い局所的境界を1段下の階層のグループ境界に決定する第1のステップと、第1のステップの処理を下の階層のグループにおいて再帰的に実行する第2のステップとを備えるようにしてもよい。
【0021】
また、グルーピング構造検出ステップが、局所的境界のそれぞれにおける音の特性の変化とその前後の音の特性の変化との差が閾値よりも大きい場合に、その局所的境界の深さを増大させるようにしてもよい。
また、グルーピング構造検出ステップが、メロディの全体またはメロディを局所的境界に基づいて分割することにより得られた連続する複数の音のグループに対して、その時間的中心を平均とし、分散σをパラメータとする正規分布に基づいて、メロディの全体またはグループに含まれる局所的境界の深さにを増大または減少させるようにしてもよい。
【0022】
また、本発明に係る記録媒体は、上述した楽曲のグルーピング構造の自動分析プログラムを記録した機械読み取り可能な記録媒体である。
【発明の効果】
【0023】
本発明では、まずメロディの局所的境界を検出し、検出された局所的境界に基づいてメロディの階層的なグルーピング構造を検出することにより、階層的なグルーピングを適切に行うことができる。
また、複数の評価指標(例えば、グルーピング選好ルール)と、それぞれの評価指標に対する重み付けを調節するパラメータとに基づいて、音の特性変化の度合いを意味する局所的境界の深さを数値化することにより、評価指標間の競合を防止し、楽曲の認識率を向上させることができる。
【発明を実施するための最良の形態】
【0024】
以下、本発明の一実施の形態について、図面を参照して詳細に説明する。
図1は、本発明の一実施の形態に係る楽曲のグルーピング構造の自動分析方法の概要を示す図である。この図に示すように、本実施の形態は、メロディを構成する個々の音の特性を示す楽曲データが入力される楽曲データ入力ステップS1と、入力された楽曲データに示される連続した個々の音の特性が変化する箇所を検出しメロディの局所的境界とする局所的境界検出ステップS2と、検出された局所的境界に基づいてメロディを分割することによりメロディの階層的なグルーピング構造を分析するグルーピング構造分析ステップS3と、分析結果を出力する分析結果出力ステップS4とから構成される。
【0025】
1.楽曲データ
楽曲データは、メロディを構成する個々の音の特性、例えば音の高さ、長さ、強さ、間隔などのデータからなる。楽曲データとしては、例えばMusicXML形式のデータを用いることができる。MusicXMLは、XML(extensible mark-up language)に基づく楽譜表記の方法で、アトリビュートエレメントとノートエレメントとからなる。アトリビュートエレメントには、調記号、拍子記号および音部記号が記述され、ノートエレメントには、音高、音価およびノーテーションエレメントが記述される。ノーテーションエレメントには、タイ、スラー、フェルマータ、アルペジオ、強弱記号、装飾音、アーティキュレーションなどが記述される。
【0026】
2 グルーピング選好ルールの適用
以下、グルーピング選好ルール(評価指標)GPR1、GPR2a、GPR2b、GPR3a、GPR3b、GPR3c、GPR3d、GPR4、GPR5およびGPR6の適用について説明する。なお、タイムスパン簡約やプロロンゲーション簡約の結果が必要となるGPR7については、本実施の形態では適用しない。
各ルールにより生じるグループの境界の深さは、DiGPRj=(1,2a,2b,3a,3b,3c,3d,4,5,6)(0≦DiGPRj≦1)で表される。
【0027】
本実施の形態では、次の15個の調節可能なパラメータを導入する。
・SGPRj(j=(2a、2b、3a、3b、3c、3d、4、5、6)):各ルールの強さを表すパラメータ。値が大きいほど、ルールの影響が強くなる。式(17)、(18)で使用。
・σ:GPR5で用いられる。平均をグループの時間的中心とする正規分布の分散の値。値が大きくなるほど、正規分布の裾野が広がる。式(8)で使用。
【0028】
・Wr:GPR6で用いられる。リズム方向のずれと音高方向のずれのどちらを重視するかを決めるパラメータ。値が大きいほど、音高の方を重視する。式(14),(15),(16)で使用。
・Ws:GPR6で用いられる。並列な区間の始まりと終わりのどちらを重視するかを決めるパラメータ。値が大きいほど、終わりの方を重視する。式(14),(15),(16)で使用。
・Wl:GPR6で用いられる。並列な区間の長さをどれくらい重視するかを決めるパラメータ。値が大きいほど、長い並列区間を重視する。式(14),(15),(16)で使用。
【0029】
・TGPR4:GPR4で用いられる。GPR2,3の効果を抑制するかどうかを決める閾値。値が大きいほど、GPR4が成立しにくくなる。式(7)で使用。
・Tlow-level:低いグルーピングレベルで境界とするかどうかを決める閾値。値が大きいほど、境界と認識されにくくなる。式(18)で使用。
【0030】
2.1 GPR2,3および4の適用
GPR2,3および4は、連続する4音(n1,n2,n3,n4)に関するルールである。i番目の遷移(i音目とi+1音目の間)で各ルールにより生じる境界の深さは、境界になり得る(DiGPRj=1)か、そうでない(DiGPRj=0)かで表される。
【0031】
GPR2a(slur/rest)では、n2の終わりからn3の始まりまでの時間間隔が、n1の終わりからn2の始まりまでの時間間隔、および、n3の終わりからn4の始まりまでの時間間隔よりも長い場合に、グループの境界と認識される。GPR2aは、次式のように定式化できる。
【0032】
【数1】

【0033】
ただし、
resti:消音時刻から次の発音時刻までの間隔(図2参照)
【0034】
GPR2b(attack-point)では、n2の始まりからn3の始まりまでの時間間隔が、n1の始まりからn2の始まりまでの時間間隔、および、n3の始まりからn4の始まりまでの時間間隔よりも長い場合に、グループの境界と認識される。GPR2bは、次式のように定式化できる。
【0035】
【数2】

【0036】
ただし、
ioii:発音時刻間隔(inter onset intervals)(図2参照)
【0037】
GPR3a(register)では、n2とn3との音高差が、n1とn2との音高差およびn3とn4との音高差よりも大きい場合に、グループの境界と認識される。GPR3aは、次式のように定式化できる。
【0038】
【数3】

【0039】
ただし、
regii:音程(図2参照)
【0040】
GPR3b(dynamics)では、n2とn3の強弱記号に差があり、n1とn2およびn3とn4の強弱記号に差がない場合に、グループの境界と認識される。GPR3bは、次式のように定式化できる。
【0041】
【数4】

【0042】
ただし、
dynai:音量(ダイナミクス)の差(図2参照)
【0043】
GPR3c(articulation)では、新しいアーティキュレーション(演奏により、連続した個々の音を一つのまとまりに聴かせるため、各音の始まりと終わりのタイミングを変化させること)がそこから開始したり、そこで終了したりする場合に、グループの境界と認識される。GPR3cは、次式のように定式化できる。
【0044】
【数5】

【0045】
ただし、
artii:アーティキュレーションの変化(図2参照)
【0046】
GPR3d(length)では、n2とn3が異なった音長をもち、n1とn2およびn3とn4が同じ音長の場合に、グループの境界と認識される。GPR3dは、次式のように定式化できる。
【0047】
【数6】

【0048】
ただし、
leni:音価の差(図2参照)
【0049】
GPR4(intensification)では、GPR2,3で示される効果が比較的明白な場合に、グループの境界と認識される。GPR4は、次式のように定式化できる。ここで、明白性評価変数Pirest,Piioi,Piregistは、それぞれGPR2a,GPR2b,GPR3aが明白に成立するほど大きな値を示す。TGPR4は(0≦TGPR4≦1)は、GPR2,3の効果が明白であるかどうかを決める閾値であり、この閾値によりGPR2,3の効果を抑制するかどうかを決めることができる。
【0050】
【数7】

【0051】
2.2 GPR5(symmetry)の適用
GPR5では、分割された2つのグループの長さが等しくなるようにグルーピングすることを優先する。このようなグルーピングを実現するために、分割された2つのグループの長さが等しいほど高い値を示す関数DiGPR5を定義する。
このような関数は様々考えられるが、本実施の形態では、平均をグループの時間的中心、分散をσとする正規分布を用いる。正規分布は、パラメータを調節することにより裾野の広さを自由に変えられるという特長がある。分散σは、調節可能なパラメータで、0に近いほど正規分布の裾野が狭まり、分割前のグループの中心付近でのDiGPR5の値が大きくなる。したがって、より中心に近いほどグループの境界になりやすくなる。逆にσが大きくなった場合には、中心付近以外の位置でもグループの境界になりやすくなる。
【0052】
本実施の形態では、GPR5を次式のように定式化する。この式の計算は、後述する局所的境界を検出した後、階層的なグルーピング構造を検出する際に、式(19)において行われる。
【0053】
【数8】

【0054】
ただし、
start:グループの始まりの遷移
end :グループの終わりの遷移
図3に、式(8)により求められる境界の深さDiGPR5を示す。
【0055】
2.3 GPR6(parallelism)の適用
GPR6では、並列性がある部分については並列性のあるグルーピングを優先する。メロディ中のある2つの部分が同一または類似している場合に、その2つの部分には「並列性がある」という。
【0056】
ここでは、調整可能な3つのパラメータWr,Ws,Wlを導入する(0≦Wr,Ws,Wl≦1)。Wrは、リズム方向のずれと音高方向のずれのどちらを重視するかを決めるパラメータ、Wsは、並列な区間の始まりと終わりのどちらを重視するかを決めるパラメータ、Wlは、並列な区間の長さをどれくらい重視するかを決めるパラメータである。
並列な部分の長さrを、1拍の長さの整数倍とする、したがって、並列な区間の始まりと終わりは、拍の境目になる。
並列の度合いDiGPR6の算出には、qi,mij,xqir,yqiqjr,zqiqjrを用いる。
iは、i番目の遷移が楽曲の頭から数えて何拍目であるか(拍数)を表す。
【0057】
【数9】

【0058】
ただし、
div:4分音符の音価
ioii:発音時刻間隔
【0059】
ijは、遷移iと遷移jが並列な区間の開始や終わりになり得るかどうかを表す。遷移iが並列な区間の開始となるためには、遷移i−1に拍線がある。すなわち、qi≠qi-1が成立する必要がある。一方、遷移iが並列な区間の終わりとなるためには、遷移i+1に拍線がある。すなわち、qi≠qi+1が成立する必要がある。mijは、iおよびjが並列な区間の開始となり得る場合にはb(=begin)、並列な区間の終わりとなり得る場合にはe(=end)、並列な区間の開始と終了の両方になり得る場合にはt(=terminal)、開始にも終了にもなり得ない場合はs(=else)とする。
【0060】
【数10】

【0061】
qirは、qi拍目からqi+r拍目までの間に、何個の音があるかを表す。
qiqjrは、qi拍目からqi+r拍目までの区間とqj拍目からqj+r拍目までの区間とを比較して、発音のタイミングが一致している音が何音あるかを表す。
qiqjrは、qi拍目からqi+r拍目までの区間とqj拍目からqj+r拍目までの区間で発音のタイミングが一致している音を比較して、前の音からの音高変化(音程)が一致する音の数を表す。
【0062】
【数11】

【0063】
並列な部分の長さがrのとき、遷移iと遷移jのGPR6による境界の深さは、GijrstartおよびGijrendで表される。図4に示すように、Gijrstartは、qi拍目からqi+r拍目までの区間とqj拍目からqj+r拍目までの区間が並列な場合に高い値になり、Gijrendは、qi−r拍目からqi拍目までの区間とqj−r拍目からqj拍目までの区間が並列な場合に高い値になる。
【0064】
【数12】

【0065】
並列な度合いDiGPR6は、次式で表される。
【0066】
【数13】

【0067】
ただし、
Ws′=1-Ws,Wr′=1-Wr,Wl′=1-Wl
【0068】
2.4 GPR1(alternative form)の適用
GPR1では、非常に小さいグループ、特に単音からなるグループヘの分割は避ける。このため、遷移iの境界の深さが前後の遷移i−1および遷移i+1の境界の深さより深い場合に、GPR1によるグループの境界と認識される。ここで比較される境界の深さは、GPR2a,GPR2b,GPR3a,GPR3b,GPR3c,GPR3dおよびGPR6による境界の深さの総和である。この際、各ルールによる境界の深さに対し、それぞれのルールの強さを表すパラメータSGPRjを掛けて重み付けしている。このパラメータSGPRjを変えて各ルールの影響を調整することにより、ルール間で競合が起こっても、この競合を解消することが可能になる。
【0069】
GPR1による境界の深さは、境界になり得る(DiGPR1=1)かそうでない(DiGPR1=0)かで表される。
GPR1は、次式のように定式化できる。
この式において、Biは、遷移iの境界の深さを、連続したメロディ中における境界の深さの最大値により規格化した値である。したがって、Biは0から1の実数であり、その値が大きいほど境界が深いことになる。
【0070】
【数14】

【0071】
3 局所的境界の検出
局所的な境界の検出には、DiGPR1,DiGPR2a,DiGPR2b,DiGPR3a,DiGPR3b,DiGPR3c,DiGPR3dおよびDiGPR6を用いる。GPR1による境界であり(DiGPR1=1)、かつ、規格化された境界の深さBiが閾値Tlow-levelより大きい場合に、遷移iを局所的なグループ境界候補(局所的境界)とする。この局所的境界の検出は、次式のように定式化できる。ここでは、遷移iが局所的境界であることをDilow-level=1、そうでないことをDilow-level=0で表す。Biは式(17)と同じである。
【0072】
【数15】

【0073】
4 階層的なグルーピング構造の検出
階層的なグルーピング構造は、以上のボトムアップ処理により求められた局所的境界を用いて、トップダウンに獲得する。具体的にいえば、ある階層のグループの内部に局所的境界が含まれている場合に、そのすべの局所的境界の深さを比較して、最も深い境界を1段下の階層のグループ境界に決定する。このグループ境界により分割された2つのグループについても同様にして、さらに1段下の階層(当初の階層から見て2段下の階層)のグループ境界を決定する。このような処理をグループの内部に局所的境界が存在しなくなるまで繰り返すことにより、階層的なグルーピング構造を検出できる。
このような処理は、次式の計算を再帰的に実行することにより実現できる。
【0074】
【数16】

【0075】
ただし、
j=(2a,2b,3a,3b,3c,3d,4,5,6)
iは、グループに含まれるすべての局所的境界の位置
なお、式(19)では、argmaxの引数(D * Sigma D * S)の値を最大にするようなiを計算する。例えば、最も上位の階層において、iを1から楽曲の終わりの位置を表す位置まで動かしたときに、D * Sigma D * Sの値が最大になるようなiがargmaxの値になる。
また、この式においても、各ルールによる境界の深さDGPRjをパラメータSGPRjで重み付けすることにより、ルール間で競合を解消することが可能になる。
【0076】
5 楽曲のグルーピング構造の自動分析装置
次に、楽曲のグルーピング構造の自動分析方法を実現する装置について説明する。図5は、この装置の一構成例を示すブロック図である。
【0077】
この装置は、楽曲データMusicXMLから各種の基本変数(resti,ioii,regii,leni,dynai,artii)を算出する基本変数算出部1と、楽曲データMusicXMLおよび算出された各種の基本変数を記憶する楽曲データ記憶部2と、各種のパラメータ(SGPRj,σ,Wr,Ws,Wl,TGPR4,Tlow-level)を設定するパラメータ設定部3と、式(1)〜式(6)を計算することによりGPR2a,GPR2b,GPR3a,GPR3b,GPR3cおよびGPR3dを評価するGPR2,3評価部4と、明白性評価変数Pirest,Piioi,Piregistを算出する明白性評価変数算出部5と、式(7)を計算することによりGPR4を評価するGPR4評価部6と、式(8)を計算することによりGPR5を評価するGPR5評価部7と、式(9)を計算することにより拍数qiを算出する拍数算出部8と、式(10)〜式(16)を計算することによりGPR6を評価するGPR6評価部9と、境界の深さBiを規格化する規格化部10と、式(17)を計算することによりGPR1を評価するGPR1評価部11と、式(18)を計算することによりグループ境界の候補となる局所的境界を検出する局所的境界検出部12と、式(19)を再帰的に計算することにより階層的なグルーピング構造を検出する高次境界検出部13と、分析結果をGroupingXMLとして出力する分析結果出力部14とから構成される。
【0078】
図6は、図5に示した装置の動作の流れを示すフローチャートである。
楽曲データMusicXMLが入力されると(ステップS11)、楽曲データMusicXMLを楽曲データ記憶部2に記憶する。また、基本変数算出部1において、楽曲データMusicXMLから各種の基本変数(resti,ioii,regii,leni,dynai,artii)を算出し(ステップS12)、算出結果を楽曲データ記憶部2に記憶する(ステップS13)。
【0079】
パラメータ設定部3から各種のパラメータ(SGPRj,σ,Wr,Ws,Wl,TGPR4,Tlow-level)が設定されると(ステップS14,YES)、グループ境界の候補となる局所的境界を検出するために必要な、DiGPRj(j=1,2a,2b,3a,3b,3c,3d,6)を求める。より具体的に説明する。
GPR2,3評価部4において、楽曲データ記憶部2から各種の基本変数を読み出し、式(1)〜式(6)を計算することによりDiGPRj(j=2a,2b,3a,3b,3c,3d)を求め、規格化部10へ出力する。
【0080】
また、拍数算出部8において、楽曲データ記憶部2から4分音符の音価divおよび発音時間間隔ioiiを読み出し、式(9)を計算することにより拍数qiを算出して、GPR6評価部9へ出力する。そして、GPR6評価部9において、楽曲データ記憶部2から4分音符の音価div、発音時間間隔ioiiおよび音程regiiを読み出し、さらに拍数qiおよびパラメータWr,Ws,Wlを用いて式(10)〜式(16)を計算することにより並列の度合いDiGPR6を求め、規格化部10へ出力する。なお、並列の度合いDiGPR6の計算は、遷移iの前または後r拍目までの区間と、遷移j(j>i)の前または後r拍目までの区間の両方について、rを変化させながら行う。
【0081】
また、規格化部10において、DiGPRjおよびSGPRj(j=2a,2b,3a,3b,3c,3d,6)を用いて遷移iの境界の深さを規格化してBiを求め、GPR1評価部11および局所的境界検出部12へ出力する。そして、GPR1評価部11において、式(17)を計算してDiGPR1を求め、局所的境界検出部12へ出力する。
このようにしてDiGPR1およびBiを得た局所的境界検出部12において、パラメータTlow-levelを用いて式(18)を計算し、局所的境界を検出する(ステップS15)。また、遷移iが局所的境界となるか否かを示すDilow-levelを高次境界検出部13へ出力する。
【0082】
高次境界検出部13にDilow-levelが入力されると、階層的なグルーピング構造の分析を開始する。まず、最も上位の階層を2つのグループに分割する高次境界を検出する処理を行う。
この処理を行うために、まず、楽曲の最初から最後までの間で、局所的境界となる遷移iのそれぞれについて、DiGPRj(j=2a,2b,3a,3b,3c,3d,4,5,6)を求める。DiGPRj(j=2a,2b,3a,3b,3c,3d,6)については、GPR2,3評価部4、拍数算出部8およびGPR6評価部9において、上述した処理と同様の処理を局所的境界となる遷移iのそれぞれについて実行すればよい。以下、DiGPR4およびDiGPR5について、具体的に説明する。
【0083】
明白性評価変数算出部5において、局所的境界となる遷移iおよびその前後の遷移i−1,i+1の基本変数resti-1,resti,resti+1と、ioii-1,ioii,ioii+1と、regii-1,regii,regii+1を、楽曲データ記憶部2から読み出す。そして、読み出された各種の基本変数を用いて明白性評価変数Pirest,Piioi,Piregistを算出し、GPR4評価部6へ出力する。さらに、GPR4評価部6において、明白性評価変数Pirest,Piioi,PiregistおよびパラメータTGPR4を用いて、式(7)を計算することによりDiGPR4を求め、高次境界検出部13へ出力する。
【0084】
また、GPR5評価部7において、楽曲データ記憶部2から全遷移iの発音時刻間隔ioiiを読み出す。そして、楽曲の始まりの遷移i=1をstart、楽曲の終わりの遷移をendとし、読み出された発音時刻間隔ioiiおよび設定された分散σを用いて、局所的境界となる遷移iのそれぞれについて式(8)を計算することによりDiGPR5を求め、高次境界検出部13へ出力する。
【0085】
このようにしてDiGPRj(j=2a,2b,3a,3b,3c,3d,4,5,6)を得ると、高次境界検出部13において、局所的境界となる遷移iのそれぞれについて式(19)を計算する。その結果、iが最大となったi(ハット)の遷移i(「i0」とおく)を、最も上位の階層を2つのグループに分割する高次境界、すなわち1段下の階層のグループ境界に決定する。
【0086】
次に、この1段下の階層をさらに2つのグループに分割する高次境界を検出する処理を行う。ここでは、楽曲の最初からグループ境界の遷移i0までの第1のグループと、グループ境界の遷移i0から楽曲の最後までの第2のグループに対し、上述した処理と同様の処理を行う。まず、第1のグループに含まれる局所的境界となる遷移iのそれぞれについて、DiGPRj(j=2a,2b,3a,3b,3c,3d,4,5,6)を求め、高次境界検出部13において式(19)を計算し、iが最大となったi(ハット)の遷移iをさらに1段下の階層(最も上位の階層から見て2段下の階層)のグループ境界に決定する。第2のグループについても同様である。
このような処理をグループの内部に局所的境界が存在しなくなるまで繰り返すことにより、階層的なグルーピング構造を検出することができる(ステップS16)。
【0087】
階層的なグルーピング構造の分析が終了したら、分析結果出力部14から分析結果をGroupingXMLとして出力する(ステップS17)。
この後、パラメータ設定部3からパラメータの設定が変更されたときには(ステップS18,YES)、局所的境界の検出処理(ステップS15)、階層的なグルーピング構造の分析処理(ステップS16)および分析結果の出力処理(ステップS17)という一連の処理を繰り返し行う。
【0088】
上述した楽曲のグルーピング構造の自動分析装置は、コンピュータにより実現することができる。このコンピュータ20は、図7に示すように、演算処理部21と記憶部22a,22bとインターフェース部(I/F部)23a,23b,23cとがバス24により接続された構成となっている。I/F部23a、23bは、それぞれコンピュータ20の外部装置である操作卓25、表示装置26とインタフェースをとる。
コンピュータ20の動作を制御するプログラムは、光磁気ディスク、半導体メモリその他の記録媒体27に記録された状態で提供される。この記録媒体27がI/F部23cに接続されると、演算処理部21は記録媒体27に書き込まれたプログラムを読み出し、記憶部22aに格納する。その後、操作卓25からの指示に基づき、演算処理部21が記憶部22aに格納されたプログラムを実行し、図5に示した各部1〜14を実現する。
【0089】
具体的には、次のように動作する。
楽曲データMusicXMLが記録された記録媒体がI/F部23cに接続されると、演算処理部21は記録媒体から楽曲データMusicXMLを読み出し、記憶部22bに記録する(ステップS11)。
その後、演算処理部21は、記憶部22bから楽曲データMusicXMLを読み出し、楽曲データMusicXMLから各種の基本変数(resti,ioii,regii,leni,dynai,artii)を算出し(ステップS12)、算出結果を記憶部22bに記録する(ステップS13)。
【0090】
操作卓25から各種のパラメータ(SGPRj,σ,Wr,Ws,Wl,TGPR4,Tlow-level)が設定されると(ステップS14,YES)、演算処理部21は、パラメータを記憶部22bに記録する。
その後、演算処理部21は、記憶部22bから必要な基本変数を読み出し、式(1)〜式(6)を計算することによりDiGPRj(j=2a,2b,3a,3b,3c,3d)を求め、記憶部22bに記録する。また、記憶部22bから必要な基本変数およびパラメータを読み出し、式(9)〜式(16)を計算することにより並列の度合いDiGPR6を求め、記憶部22bに記録する。
【0091】
次いで、演算処理部21は、記憶部22bから全遷移iについてDiGPR2aを順次読み出し、SGPR2aを掛けた結果(DiGPR2a×SGPR2a)を記憶部22bに記録する。この処理をDiGPR2b,DiGPR3a,DiGPR3b,DiGPR3c,DiGPR3d,DiGPR6のぞれぞれについて繰り返し行う。これにより、記憶部22bには、全遷移iについてのDiGPRj×SGPRj(j=2a,2b,3a,3b,3c,3d,6)が記録される。
続いて、記憶部22bから遷移iごとにDiGPRj×SGPRj(j=2a,2b,3a,3b,3c,3d,6)を読み出し、総和を求める。これらの総和を比較して最大値を求め、この最大値で遷移iごとの総和を割って規格化することによりBiを求め、記憶部22bに記憶する。
続いて、記憶部22bから連続する3つの遷移i−1,i,i+1のBi-1,Bi,Bi+1を読み出し、これらを比較する。その結果、Biが最大の場合にはDiGPR1=1,それ以外の場合にはDiGPR1=0とする。この処理を全遷移iについて繰り返し行う。
このようにして式(17)を計算することによりDiGPR1を求め、記憶部22bに記録する。
【0092】
次いで、演算処理部21は、記憶部22bからDiGPR1およびTlow-levelを読み出し、式(18)を計算することによりDilow-levelを求め、記憶部22bに記録する。この結果、Dilow-level=1となる遷移iが、グループ境界の候補となる局所的境界として検出される(ステップS15)。
【0093】
次いで、演算処理部21は、記憶部22bから必要な基本変数およびパラメータを読み出し、式(7)および式(8)を計算することにより、局所的境界となる遷移iについてDiGPR4およびDiGPR5を求め、記憶部22bに記録する。
続いて、記憶部22bからDiGPR4を順次読み出し、SGPR4を掛けた結果(DiGPR4×SGPR4)を記憶部22bに記録する。この処理をDiGPR5についても行う。これにより、ステップS15において求められたDiGPRj×SGPRj(j=2a,2b,3a,3b,3c,3d,6)と合わせて、記憶部22bには、局所的境界となる遷移iについてのDiGPRj×SGPRj(j=2a,2b,3a,3b,3c,3d,4,5,6)が記録されることになる。
【0094】
演算処理部21は、記憶部22bから局所的境界となる遷移iごとにDiGPRj×SGPRj(j=2a,2b,3a,3b,3c,3d,4,5,6)を読み出し、式(19)を計算する。すなわち、局所的境界となる遷移i(Dilow-level=1)ごとにDiGPRj×SGPRj(j=2a,2b,3a,3b,3c,3d,4,5,6)の総和を求め、これらの総和が最大となる遷移iを求める。この遷移i(「i0」とおく)を、最も上位の階層を2つのグループに分割する高次境界、すなわち1段下の階層のグループ境界に決定し、記憶部22bに記録する。
【0095】
続いて、楽曲の最初からグループ境界の遷移i0までの第1のグループと、グループ境界の遷移i0から楽曲の最後までの第2のグループに対し、上述した式(7)および式(8)の計算から式(19)の計算までを行い、各グループにおいて、さらに1段下の階層(最も上位の階層から見て2段下の階層)のグループ境界に決定し、記憶部22bに記録する。
このような処理をグループの内部に局所的境界が存在しなくなるまで繰り返し、階層的なグルーピング構造を検出する(ステップS16)。
階層的なグルーピング構造の分析が終了したら、演算処理部21は、分析結果を表示装置26に表示する(ステップS17)。
【0096】
ここでは、コンピュータ20の動作を制御するプログラムが、記録媒体27に記録された状態で提供される例を示したが、インターネットなどのディジタル通信網を介して提供されてもよい。
【0097】
6 分析結果の表示
実際に、楽曲のグルーピング構造の自動分析装置を実現するプログラムを作成した。ただし、このプログラムでは、15個のパラメータのうち、GPR3bおよびGPR3cに関連するSGPR3bおよびSGPR3cを除く13個のパラメータを調節可能にした。このプログラムによって実現された装置を用いて、既存の楽曲を分析した結果を図8および図9に示す。
【0098】
図8(a)に示す楽曲は、分析対象であるブラームス作曲「子守歌」の一節であり、音符が27個含まれている(Note1〜Note27)。
図8(b)に示すウィンドウには、分析結果が表示されいている。このウィンドウの左半分がグルーピング階層の結果表示であり、右半分が13個のパラメータを調節する13個のスライダである。グルーピング階層の結果表示において、一番左のカラムにはNote1〜Note27と記されている。次に、左から順番に5階層分のグルーピングの結果が表示されている(一番左が最下層、一番右が最上層)。グルーピングの結果表示において、「--|--」の箇所がグループ境界である。
【0099】
図9(a)に示す楽曲は、分析対象であるモーツァルト作曲「トルコ行進曲」の一節であり、音符が38個含まれている(Note1〜Note38)。
図9(b)に示すウィンドウの説明は、図8(b)に示すウィンドウと同様である。
【0100】
7 実験結果
上述したプログラムによって実現された装置のグルーピングの性能の評価を、再現率(reca11)と適合率(precision)とを組み合わせたF値で評価する。F値は、再現率と適合率が高いほど、すなわち、グルーピングの性能が高いほど高くなる。
F値=2×(P×R)/(P+R) (20)
ただし、
R:再現率(装置が出力したグルーピングと同じグループが、正解データに含まれている割合)
P:適合率(正解データのグルーピングと同じグループが、装置の出力に含まれている割合)
【0101】
F値の計算は、グループが所属する階層に関係なく行う。このため、局所的境界が正しく求まっていない位置では、すべての階層で誤ったグルーピングとなり、F値が大きく落ちる結果となる。
グルーピング構造は、パラメータの調整によって変化する、そこでまず、パラメータ調節前(ベースライン)の性能を求める。パラメータの初期値は、SGPRj(j=(2a,2b,3a,3d,4,5,6))=0.5、σ=0.05、Wr=0.5、Ws=0.5、Wl=0.5、TGPR4=0.5、Tlow-level=0.5である。次に、手作業でパラメータを調節した。パラメータは、局所的境界に関するパラメータから先に調節し、その後に高次の境界に関するパラメータを調節した。1曲につき10分間でパラメータの調整を行ったところ、図10に示すように、ベースラインの性能よりF値が0.3以上向上した。
【産業上の利用可能性】
【0102】
本発明は、例えば、作曲・編曲ソフトに利用できる。与えられた楽曲をモチーフとして新たな曲の作曲や編曲を行う際に、まず与えられた楽曲のグルーピング構造を分析する。作曲の場合には、分析結果からそのまま楽曲を適当な大きさのグループに分割する。各グループがモチーフに対応しているので、これらのグループを自由に組み合わせて、新しい曲を作曲することができる。また、編曲の場合には、グループ単位で編曲を行うことにより、より小さくて扱いやすい粒度で編曲すること可能になる。
【0103】
また、ある楽曲をビデオやWebページのBGMとして付ける場合に、グループの境界部分に到達した時点にタイミングを合わせて、ビデオのシーンチェンジやWebページの自動ジャンプを実行させる処理も可能になる。
また、楽曲の構造を自動判定することができるので、曲を再生するときに、繰り返し部分を1回だけ聴いて飛ばし聴きする、特定のグルーピングのパターンの部分にジャンプするなど、ユーザが能動的に聴く箇所を選ぶという新しい聴き方が可能になる。
【図面の簡単な説明】
【0104】
【図1】本発明の一実施の形態に係る楽曲のグルーピング構造の自動分析方法の概要を示す図である。
【図2】楽曲データから算出される基本変数の一例を示す図である。
【図3】GPR5による境界の深さを示す図である。
【図4】GPR6による境界の深さを示す図である。
【図5】楽曲のグルーピング構造の自動分析装置の一構成例を示すブロック図である。
【図6】楽曲のグルーピング構造の自動分析装置の動作の流れを示すフローチャートである。
【図7】楽曲のグルーピング構造の自動分析装置を実現するコンピュータの一構成例を示すブロック図である。
【図8】楽曲のグルーピング構造の自動分析装置を用いて既存の楽曲を分析した結果の一例を示す図である。
【図9】楽曲のグルーピング構造の自動分析装置を用いて既存の楽曲を分析した結果の他のを示す図である。
【図10】パラメータ調節前と後のF値の変化を示す図である。
【符号の説明】
【0105】
1…基本変数算出部1、2…楽曲データ記憶部、3…パラメータ設定部、4…GPR2,3評価部、5…明白性評価変数算出部、6…GPR4評価部、7…GPR5評価部、8…拍数算出部、9…GPR6評価部、10…規格化部、11…GPR1評価部、12…局所的境界検出部、13…高次境界検出部、14…分析結果出力部、21…演算処理部、22a,22b…記憶部、23a〜23c…インターフェース部、24…バス、25…操作卓、26…表示装置、27…記録媒体。


【特許請求の範囲】
【請求項1】
メロディを構成する個々の音の特性を示す楽曲データが入力される楽曲データ入力ステップと、
前記楽曲データに示される連続した個々の音の特性が変化する箇所を検出し前記メロディの局所的境界とする局所的境界検出ステップと、
前記局所的境界に基づいて前記メロディを分割することにより前記メロディの階層的なグルーピング構造を検出するグルーピング構造検出ステップと
を備えることを特徴とする楽曲のグルーピング構造の自動分析方法。
【請求項2】
請求項1に記載の楽曲のグルーピング構造の自動分析方法において、
前記局所的境界検出ステップおよび前記グルーピング構造検出ステップは、複数の評価指標と、それぞれの評価指標に対する重み付けを調節するパラメータとに基づいて、前記音の特性の変化の度合いを局所的境界の深さとして数値化することを特徴とする楽曲のグルーピング構造の自動分析方法。
【請求項3】
請求項2に記載の楽曲のグルーピング構造の自動分析方法において、
前記局所的境界検出ステップは、前記変化の度合いを規格化し、規格化された前記変化の度合いが閾値よりも大きい箇所を前記局所的境界とすることを特徴とする楽曲のグルーピング構造の自動分析方法。
【請求項4】
請求項2または3に記載の楽曲のグルーピング構造の自動分析方法において、
前記グルーピング構造検出ステップは、
前記メロディの全体または前記メロディを前記局所的境界に基づいて分割することにより得られた連続する複数の音のグループに含まれる局所的境界の深さを比較して、最も深い局所的境界を1段下の階層のグループ境界に決定する第1のステップと、
前記第1のステップの処理を下の階層のグループにおいて再帰的に実行する第2のステップと
を備えることを特徴とする楽曲のグルーピング構造の自動分析方法。
【請求項5】
請求項2〜4のいずれか1項に記載の楽曲のグルーピング構造の自動分析方法において、
前記グルーピング構造検出ステップは、前記局所的境界のそれぞれにおける音の特性の変化とその前後の音の特性の変化との差が閾値よりも大きい場合に、その局所的境界の深さを増大させることを特徴とする楽曲のグルーピング構造の自動分析方法。
【請求項6】
請求項2〜5のいずれか1項に記載の楽曲のグルーピング構造の自動分析方法において、
前記グルーピング構造検出ステップは、前記メロディの全体または前記メロディを前記局所的境界に基づいて分割することにより得られた連続する複数の音のグループに対して、その時間的中心を平均とし、分散σをパラメータとする正規分布に基づいて、前記メロディの全体または前記グループに含まれる局所的境界の深さにを増大または減少させることを特徴とする楽曲のグルーピング構造の自動分析方法。
【請求項7】
メロディを構成する個々の音の特性を示す楽曲データが入力される楽曲データ入力手段と、
前記楽曲データに示される連続した個々の音の特性が変化する箇所を検出し前記メロディの局所的境界とする局所的境界検出手段と、
前記局所的境界に基づいて前記メロディを分割することにより前記メロディの階層的なグルーピング構造を検出するグルーピング構造検出手段と
を備えることを特徴とする楽曲のグルーピング構造の自動分析装置。
【請求項8】
請求項7に記載の楽曲のグルーピング構造の自動分析装置において、
前記局所的境界検出手段および前記グルーピング構造検出手段は、複数の評価指標と、それぞれの評価指標に対する重み付けを調節するパラメータとに基づいて、前記音の特性の変化の度合いを局所的境界の深さとして数値化することを特徴とする楽曲のグルーピング構造の自動分析装置。
【請求項9】
請求項8に記載の楽曲のグルーピング構造の自動分析装置において、
前記局所的境界検出手段は、前記変化の度合いを規格化し、規格化された前記変化の度合いが閾値よりも大きい箇所を前記局所的境界とすることを特徴とする楽曲のグルーピング構造の自動分析装置。
【請求項10】
請求項8または9に記載の楽曲のグルーピング構造の自動分析装置において、
前記グルーピング構造検出手段は、
前記メロディの全体または前記メロディを前記局所的境界に基づいて分割することにより得られた連続する複数の音のグループに含まれる局所的境界の深さを比較して、最も深い局所的境界を1段下の階層のグループ境界に決定する第1の手段と、
前記第1の手段による処理を下の階層のグループにおいて再帰的に実行する第2の手段と
を備えることを特徴とする楽曲のグルーピング構造の自動分析装置。
【請求項11】
請求項8〜10のいずれか1項に記載の楽曲のグルーピング構造の自動分析装置において、
前記グルーピング構造検出手段は、前記局所的境界のそれぞれにおける音の特性の変化とその前後の音の特性の変化との差が閾値よりも大きい場合に、その局所的境界の深さを増大させることを特徴とする楽曲のグルーピング構造の自動分析装置。
【請求項12】
請求項8〜11のいずれか1項に記載の楽曲のグルーピング構造の自動分析装置において、
前記グルーピング構造検出手段は、前記メロディの全体または前記メロディを前記局所的境界に基づいて分割することにより得られた連続する複数の音のグループに対して、その時間的中心を平均とし、分散σをパラメータとする正規分布に基づいて、前記メロディの全体または前記グループに含まれる局所的境界の深さにを増大または減少させることを特徴とする楽曲のグルーピング構造の自動分析装置。
【請求項13】
メロディを構成する個々の音の特性を示す楽曲データが入力される楽曲データ入力ステップと、
前記楽曲データに示される連続した個々の音の特性が変化する箇所を検出し前記メロディの局所的境界とする局所的境界検出ステップと、
前記局所的境界に基づいて前記メロディを分割することにより前記メロディの階層的なグルーピング構造を検出するグルーピング構造検出ステップと
をコンピュータに実行させることを特徴とする楽曲のグルーピング構造の自動分析プログラム。
【請求項14】
請求項13に記載の楽曲のグルーピング構造の自動分析プログラムにおいて、
前記局所的境界検出ステップおよび前記グルーピング構造検出ステップは、複数の評価指標と、それぞれの評価指標に対する重み付けを調節するパラメータとに基づいて、前記音の特性の変化の度合いを局所的境界の深さとして数値化することを特徴とする楽曲のグルーピング構造の自動分析プログラム。
【請求項15】
請求項14に記載の楽曲のグルーピング構造の自動分析プログラムにおいて、
前記局所的境界検出ステップは、前記変化の度合いを規格化し、規格化された前記変化の度合いが閾値よりも大きい箇所を前記局所的境界とすることを特徴とする楽曲のグルーピング構造の自動分析プログラム。
【請求項16】
請求項14または15に記載の楽曲のグルーピング構造の自動分析プログラムにおいて、
前記グルーピング構造検出ステップは、
前記メロディの全体または前記メロディを前記局所的境界に基づいて分割することにより得られた連続する複数の音のグループに含まれる局所的境界の深さを比較して、最も深い局所的境界を1段下の階層のグループ境界に決定する第1のステップと、
前記第1のステップの処理を下の階層のグループにおいて再帰的に実行する第2のステップと
を備えることを特徴とする楽曲のグルーピング構造の自動分析プログラム。
【請求項17】
請求項14〜16のいずれか1項に記載の楽曲のグルーピング構造の自動分析プログラムにおいて、
前記グルーピング構造検出ステップは、前記局所的境界のそれぞれにおける音の特性の変化とその前後の音の特性の変化との差が閾値よりも大きい場合に、その局所的境界の深さを増大させることを特徴とする楽曲のグルーピング構造の自動分析プログラム。
【請求項18】
請求項14〜17のいずれか1項に記載の楽曲のグルーピング構造の自動分析プログラムにおいて、
前記グルーピング構造検出ステップは、前記メロディの全体または前記メロディを前記局所的境界に基づいて分割することにより得られた連続する複数の音のグループに対して、その時間的中心を平均とし、分散σをパラメータとする正規分布に基づいて、前記メロディの全体または前記グループに含まれる局所的境界の深さにを増大または減少させることを特徴とする楽曲のグルーピング構造の自動分析プログラム。
【請求項19】
請求項13〜18のいずれか1項に記載の楽曲のグルーピング構造の自動分析プログラムを記録した機械読み取り可能な記録媒体。


【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate


【公開番号】特開2006−47725(P2006−47725A)
【公開日】平成18年2月16日(2006.2.16)
【国際特許分類】
【出願番号】特願2004−229057(P2004−229057)
【出願日】平成16年8月5日(2004.8.5)
【新規性喪失の例外の表示】特許法第30条第1項適用申請有り 2004年5月7日 社団法人情報処理学会発行の「情報処理学会研究報告 情処研報Vol.2004 No.41」に発表
【出願人】(000004226)日本電信電話株式会社 (13,992)
【Fターム(参考)】