説明

ピッチ変換装置

【課題】声音を伴う楽曲の放音において、いわゆるフォルマントシフトの発生を抑えつつピッチを変換する。
【解決手段】記憶部13には、声音の音波形を表すガイドボーカルデータ132及びコーラスデータ133と、楽曲の音波形を表す楽曲データ131とが記憶されている。制御部11がこれらの波形データに基づいてスピーカ15に放音させるときに、ピッチシフト操作子12が操作されてピッチ変換処理を施すことが指示されると、第1ピッチ変換部143は、その操作内容に応じて、ガイドボーカルデータ132及びコーラスデータ133が表す音波形から音素波形を切り出して、ピッチ変換比に応じた周期で繰り返し出力する。一方、楽曲を表す楽曲データ131については、第2ピッチ変換部144は、音波形をピッチシフト操作子12の操作内容に応じた比率で、時間軸上で伸縮させてピッチを変換する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、波形データのピッチを変換する技術に関する。
【背景技術】
【0002】
例えばカラオケ装置には、歌唱者自身が歌いやすいキー(調)で歌唱することを可能にするために演奏音のキーをシフトさせる、いわゆるキーコントロールと呼ばれる機能を有するものが多い。特許文献1には、波形データのバッファへの書込速度と読出速度とを異ならせることにより、波形データのピッチを変換する技術が開示されている。特許文献2には、クロスフェード方式によるピッチ変換処理が開示されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特許第3451900号公報
【特許文献2】特開2004−157482号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
ところで、ガイドボーカルやコーラスなどの声音を表す波形データに特許文献1,2に開示されたようなピッチ変換処理を施すと、声道特性が変化する、いわゆるフォルマントシフトが発生し、声質が変化したように歌唱者には聴こえてしまい、歌唱者に違和感を与えることがある。
本発明は上述した課題に鑑みてなされたものであり、その目的は、声音を伴う楽曲の放音において、いわゆるフォルマントシフトの発生を抑えつつピッチを変換することである。
【課題を解決するための手段】
【0005】
上述した目的を達成するために、本発明に係るピッチ変換装置は、声の音波形を表す第1波形データと、楽曲の音波形を表す第2波形データとを取得する取得手段と、操作子と、前記取得手段が取得した第1波形データが示す音波形から音素を表す音素波形を切り出して、前記操作子に対する操作の内容に応じた周期で繰り返し出力する第1方式に従って、前記第1波形データのピッチを変換する第1ピッチ変換手段と、前記第1方式とは異なる第2方式に従って、前記取得手段が取得した第2波形データのピッチを前記操作の内容に応じて変換する第2ピッチ変換手段と、前記第1ピッチ変換手段によりピッチが変換された第1波形データと、前記第2ピッチ変換手段によりピッチが変換された第2波形データとを合成して放音手段に出力する出力手段とを備えることを特徴とする。
【0006】
好ましい態様において、前記取得手段が取得したデータが前記第1波形データ又は前記第2波形データのいずれであるかを判定する判定手段を備え、前記第1ピッチ変換手段は、前記判定手段により前記第1波形データであると判定された波形データのピッチを変換し、前記第2ピッチ変換手段は、前記判定手段により前記第2波形データであると判定された波形データのピッチを変換する。
【0007】
別の好ましい態様において、前記第2ピッチ変換手段は、前記第2波形データが表す音波形を前記操作の内容に応じた比率で時間軸上で伸縮する前記第2方式に従って、前記第2波形データのピッチを変換する。
【発明の効果】
【0008】
本発明によれば、声音を伴う楽曲の放音において、いわゆるフォルマントシフトの発生を抑えつつピッチを変換することができる。
【図面の簡単な説明】
【0009】
【図1】第1実施形態に係る音処理装置の構成を示すブロック図
【図2】信号処理部の構成を示すブロック図
【図3】第2実施形態に係る音処理装置の構成を示すブロック図
【発明を実施するための形態】
【0010】
以下、図面を参照しつつ本発明の実施形態について説明する。
[第1実施形態]
まず、本発明の第1実施形態について説明する。
図1は、この実施形態の音処理装置1のハードウェア構成を示すブロック図である。
音処理装置1は、ここではカラオケ装置である。図1に示すように、音処理装置1は、本発明のピッチ変換装置の一例であり、制御部11と、ピッチシフト操作子12と、記憶部13と、信号処理部14とを備える。図1に示すスピーカ15は、信号処理部14の図示せぬ接続端子に対して着脱可能な放音手段である。
【0011】
制御部11は、CPU(Central Processing Unit)やROM(Read Only Memory)、RAM(Random Access Memory)を備える。CPUは、RAMをワークエリアとして用いてROMや記憶部13に記憶されたプログラムを実行して、音処理装置1の各部を制御する。ピッチシフト操作子12は、軸を中心として回転するダイヤル型の操作子であり、どの程度ピッチを変更するかを歌唱者が指定するために操作されるものである。ピッチシフト操作子12は、歌唱者によって操作されると、その操作の内容に応じた操作信号を制御部11に出力する。記憶部13は、例えばハードディスク装置を備えた記憶手段であり、制御部11が動作するためのプログラムや、カラオケ伴奏に関する各種のデータを記憶する。信号処理部14は、例えばDSP(Digital Signal Processor)であり、制御部11の制御に応じて、各種の信号処理を行うものである。
音処理装置1は、上記以外にも、例えばリモコンや装置本体の操作子を含む操作部や、カラオケ演奏に関するイメージ画像や歌詞テロップを含む各種の情報を表示するための表示部、通信回線を介して接続された外部装置から楽曲データを取得するための通信部など、カラオケ装置が通常有している構成を備えるものである。
【0012】
次に、記憶部13の構成についてより詳細に説明する。
記憶部13は、楽曲データ131A、131B、・・・と、ガイドボーカルデータ132A、132B、・・・と、コーラスデータ133A、133B、・・・とを記憶する。これらのうち符号の末尾のアルファベットが同じデータどうしは、同一の楽曲に対応するデータである。
なお、楽曲データ131A、131B、・・・の各々を特に区別する必要のないときは、これらを「楽曲データ131」と総称する。ガイドボーカルデータ132A、132B、・・・の各々を特に区別する必要のないときは、これらを「ガイドボーカルデータ132」と総称する。コーラスデータ133A、133B、・・・の各々を特に区別する必要のないときは、これらを「コーラスデータ133」と総称する。
【0013】
楽曲データ131は、本発明の第2波形データの一例に相当し、楽曲のメロディの音波形を表す波形データである。楽曲データ131が表す楽曲には、特に断りのない限り声音(つまり、声を意味する音)は含まれていないものとする。以下の説明において、単に「楽曲」という場合は、楽曲データ131が表す楽曲である。
ガイドボーカルデータ132は、本発明の第1波形データの一例に相当し、楽曲に合わせて放音され得るガイドボーカルの音波形を表す波形データである。ガイドボーカルは、見本となる歌唱を表し、声に相当する音である。
コーラスデータ133は、本発明の第1波形データの一例に相当し、楽曲に合わせて放音され得るバックコーラスの音波形を表す波形データである。バックコーラスは、主旋律(ここでは、歌唱者の歌唱音)に付け加えられる合唱であり、ガイドボーカルと同様、声に相当する音である。
このように、カラオケ伴奏に関する波形データとして、声音に相当するバックコーラス及びガイドボーカルを表す波形データと、声音を含まない楽曲を表す波形データという、2種類に大別される波形データが記憶部13には記憶されている。
【0014】
また、楽曲データ131には、識別子「ID1」が割り当てられており、ガイドボーカルデータ132には、識別子「ID2」が割り当てられており、コーラスデータ133には、識別子「ID3」があらかじめ割り当てられている。制御部11は、波形データの種類ごとに異なる識別子を参照することにより、記憶部13から読み出した波形データが、楽曲データ131か、ガイドボーカルデータ132か、又はコーラスデータ133のいずれであるかを一意に特定することができる。
なお、この識別子は、例えば記憶部13における記憶領域を識別するアドレス情報であってもよく、各波形データの種類を一意に特定できるものであればよい。さらに言うと、各波形データが、声に相当する音波形を表すものであるかを識別できればよく、例えばガイドボーカルデータ132及びコーラスデータ133に割り当てられる識別子が互いに同一であってもよい。また、この識別子は、例えば、音処理装置1が通信部を介してダウンロードする楽曲(つまり、波形データ)にもあらかじめ割り当てられている。
【0015】
続いて、信号処理部14の構成についてより詳細に説明する。
信号処理部14は、デコーダ141,142と、第1ピッチ変換部143と、第2ピッチ変換部144と、ミキサ145と、D(Digital)/A(Analog)変換部146とを備える。
デコーダ141,142は、制御部11によって出力される波形データを取得する取得手段の一例に相当し、取得した波形データをデコードして出力するものである。より具体的には、デコーダ141は、制御部11から取得したガイドボーカルデータ132、又はコーラスデータ133をデコードして、音波形を表すサンプルデータ(つまり、デコード後の波形データ)を時系列的に生成する。デコーダ141は、生成したサンプルデータ列を順次第1ピッチ変換部143に出力する。デコーダ142は、制御部11から取得した楽曲データ131をデコードして、音波形を示すサンプルデータ列を生成する。デコーダ142は、生成したサンプルデータ列を順次第2ピッチ変換部144に出力する。このように、声の音波形を表すサンプルデータと、それ以外の音波形を表すサンプルデータとは、それぞれ異なるピッチ変換部に供給されるようになっている。その理由については後述する。
【0016】
第1ピッチ変換部143は、本発明の第1方式の一例である音素再合成方式に従って、サンプルデータに対してピッチ変換処理を施すものである。
第2ピッチ変換部144は、本発明の第2方式の一例である時間伸縮方式に従って、サンプルデータに対してピッチ変換処理を施すものである。
第1ピッチ変換部143と第2ピッチ変換部144とは、同時に放音される声音及び楽曲の音波形を表すそれぞれの波形データに対し、並行してピッチ変換処理を施すものである。
このように、声音の音波形を表すサンプルデータに対しては音素再合成方式に従ってピッチ変換処理が施され、それ以外の音波形を表すサンプルデータに対しては時間伸縮方式に従ってピッチ変換処理が施される。
【0017】
ミキサ145は、本発明の出力手段の一例に相当し、第1ピッチ変換部143によってピッチが変換されたサンプルデータと、第2ピッチ変換部144によってピッチが変換されたサンプルデータとを合成して出力するものである。
なお、ピッチ変換された楽曲データ131、ガイドボーカルデータ132及びコーラスデータ133が同期してミキサ145によってミキシングされるように、図示せぬバッファが、第1ピッチ変換部143とミキサ145との間、第2ピッチ変換部144とミキサ145との間にそれぞれ設けられる。このバッファにサンプルデータが一時的に蓄えられることによって、楽曲、バックコーラス及びガイドボーカルの放音タイミングが同期するように、制御部11により同期制御が行われる。
【0018】
D/A変換部146は、ミキサ145からサンプルデータが供給されると、これをアナログ形式の音信号に変換して出力する。D/A変換部146が出力する音信号は、スピーカ15に供給される。
なお、D/A変換部146とスピーカ15との間には、実際にはプリアンプやパワーアンプが設けられるが、ここではその説明を省略する。
【0019】
次に、第1ピッチ変換部143並びに第2ピッチ変換部144の構成、及びそれらによるピッチ変換に関する処理の内容について説明する。図2は、第1ピッチ変換部143及び第2ピッチ変換部144の構成をそれぞれより詳細に表した図である。
図2に示すように、第1ピッチ変換部143は、波形切り出し部1431と、再合成部1432とを備える。
波形切り出し部1431は、デコーダ141からサンプルデータ列を取得し、音素波形のサンプルデータ列を切り出して再合成部1432に出力するものである。音素波形は、音素を表す音波形であるが、例えば音素波形を表すサンプルデータのパターンが波形切り出し部1431にあらかじめ記憶されている。音素波形の切り出しにあっては、波形切り出し部1431は、例えばサンプルデータ列が表す音波形のピッチを検出し、その2ピッチ周期分の長さのハニングウィンドウをサンプルデータ列に乗じる処理を行う。時間的に連続している音素波形が所定の長さずつ切り出されるから、このハニングウィンドウを用いたウィンドウ処理は、その切り出し部分における信号の不連続性を緩和するために行われるものである。
【0020】
再合成部1432は、波形切り出し部1431により切り出された音素波形のサンプルデータ列を所定の周期(つまり、ピッチ周期)で繰り返し出力する。再合成部1432は、元の音波形のピッチに対し、制御部11により指示されたピッチ変換比(つまり、変換前の音波形のピッチに対する変換後の音波形のピッチの比)の逆数を乗じたピッチ周期でサンプルデータ列を出力する。これにより、第1ピッチ変換部143によりピッチ変換が施された波形データ(つまり、サンプルデータ列)が得られる。このピッチ周期は、変換後のピッチが高いほど短い周期となり、反対に、変換後のピッチが低いほど長い周期となる。
【0021】
第2ピッチ変換部144は、メモリ1441と、第1乗算器1442と、第2乗算器1443と、加算器1444とを備える。
メモリ1441は、例えばリングバッファであり、デコーダ142から処理対象であるサンプルデータ列が供給されると、そのサンプルデータ列が順次書き込まれる。そして、このサンプルデータ列の書き込みと並行し、既に記憶されたサンプルデータの読み出しが制御部11の制御の下で行われる。ここで、サンプルデータの読み出しは、その書込速度に対し、所望のピッチ変換比を乗じた読出速度で行われる。具体的には、変換後のピッチが高いほどこの読出速度は大きくなり、反対に、変換後のピッチが低いほど読出速度は小さくなる。このように、ピッチ変換後の音波形が、ピッチ変換比に従って時間軸方向に圧縮又は伸張した音波形となるように、サンプルデータがメモリ1441から読み出される。
【0022】
また、第2ピッチ変換部144においては、或るサンプルデータの読み出しと並行して、サンプルデータの読み出しがそれとは別に行われる。後者の読み出しにあっては、前者の読出しに対して、半周期相当ずれたタイミングで行われる。このようにして相互に半周期ずれたタイミングで不連続点が現れる音波形の各サンプルデータがメモリ1441から並行して読み出され、一方の読み出しによるサンプルデータは第1乗算器1442に供給され、他方の読み出しによるサンプルデータは第2乗算器1443に供給される。第1乗算器1442及び第2乗算器1443は、各サンプルデータに乗算係数を乗じて、乗算結果を加算器1444に出力する。
【0023】
加算器1444は、第1乗算器1442及び第2乗算器1443から供給される乗算結果を加算し、最終的なサンプルデータを出力する。なお、この際、不連続点の近傍のサンプルデータに対しては0が乗算されるように、第1乗算器1442及び第2乗算器1443の各乗算係数を連続的且つ滑らかに変化させる制御が行われる。
このように第2ピッチ変換部144は、いわゆるクロスフェード方式に従ってピッチ変換処理を施すものである。
音処理装置1の構成の説明は以上である。
【0024】
続いて、音処理装置1の動作について図1を参照しつつ説明する。
以下の動作に説明においては、音処理装置1が、楽曲データ131、ガイドボーカルデータ132及びコーラスデータ133に基づいて放音する場合について説明する。
制御部11は、或る楽曲を伴奏することを指示する操作が図示せぬ操作部に対して行われると、その操作の内容に応じて楽曲データ131、コーラスデータ133及びガイドボーカルデータ132をそれぞれ読み出す。このとき、制御部11は、各波形データとともに、それらに対応付けられた識別子を読み出すことで、読み出した波形データがどの種類のものであるかを一意に識別し得る。また、制御部11は、各波形データに基づく放音を並行して行わせるために、時分割処理によって各波形データを信号処理部14に出力する。このとき、制御部11は、楽曲データ131をデコーダ141に出力し、ガイドボーカルデータ132及びコーラスデータ133をデコーダ142に出力する。そして、制御部11は、まずはデフォルトのピッチでそれらに基づく放音をさせるように、第1ピッチ変換部143を音素再合成方式に従ってピッチ変換処理を施すよう制御し、第2ピッチ変換部144を時間伸縮方式に従ってピッチ変換処理を施すよう制御する。
【0025】
そして、制御部11は、ピッチシフト操作子12が歌唱者によって操作されて、波形データのピッチを変更する(つまり、ピッチ変換比を異ならせる)ことが指示されると、その操作の内容に応じたピッチ変換処理を施すよう第1ピッチ変換部143、及び第2ピッチ変換部144のそれぞれを制御する。具体的には、ピッチシフト操作子12に対する操作がピッチを上げることを指示するものであった場合には、制御部11は、再合成部1432が音素波形のサンプルデータ列を出力する周期を短くするよう第1ピッチ変換部143を制御するとともに、メモリ1441からのサンプルデータの読出速度が時間軸方向に圧縮されるものとなるように、第2ピッチ変換部144を制御する。反対に、ピッチシフト操作子12に対する操作がピッチを下げることを指示するものであった場合には、制御部11は、再合成部1432が音素波形のサンプルデータ列を出力する周期を長くするよう第1ピッチ変換部143を制御するとともに、メモリ1441からのサンプルデータの読出速度が時間軸方向に伸張されるものとなるように、第2ピッチ変換部144を制御する。
このピッチ変換処理において、制御部11は、第1ピッチ変換部143及び第2ピッチ変換部144におけるピッチ変換比が同じとなるように制御する。
【0026】
制御部11にあっては、或る楽曲についてカラオケ伴奏する期間中においては、ピッチ変換に係る上記制御を繰り返し行う。なお、バックコーラスやガイドボーカルを伴わないカラオケ伴奏にあっては、制御部11はその波形データについてのピッチ変換処理を省略する。
【0027】
次に、バックコーラスやガイドボーカルのように、声音の音波形を表す波形データと、楽曲のように声音でない音波形を表す波形データとで、ピッチ変換の方式を異ならせている理由について説明する。
上記時間伸縮方式に従う第2ピッチ変換部144は、サンプルデータ列を時間軸方向に伸縮してピッチ変換を行うものであるから、音波形のフォルマント周波数がピッチと同じ比率で増減されてしまう。よって、ピッチ変換処理によって音波形によって表される声質まで変更されることとなる。これにより、例えば男性の声を表すガイドボーカルやコーラスがあった場合に、これをピッチを上げる方向にピッチ変換したとすると、あたかも女性の声のように聞こえてしまうことがある。この声道特性の変化が、いわゆるフォルマントシフトである。声音を伴う楽曲の伴奏においてフォルマントシフトが発生すると、歌唱者やその他の聴取者に違和感を与え、音の不具合であると認識させてしまう虞がある。
【0028】
一方、音素再合成方式に従う第1ピッチ変換部143は、切り出した音素波形のサンプルデータの出力の周期を変化させるものであり、音波形のフォルマントを変化させることがない。これにより、デコードされた波形データであるサンプルデータ列にあっては、フォルマントシフトの発生を抑えつつピッチのみが変更される。一方、声を表すものでない波形データについては、声道特性について考慮する必要がないので、時間伸縮方式を採用して差し支えない。また、時間伸縮方式によれば、高速フーリエ変換(FFT;Fast Fourier Transform)などを用いる周波数変換方式などと比べて、音質劣化を抑えることができる。また、上述したようなクロスフェード方式を採用することで、第2ピッチ変換部144は処理負荷を抑えつつピッチ変換処理を施すことができる。
【0029】
以上説明した第1実施形態によれば、音処理装置1は、声音の音波形を表す波形データに対し、フォルマントシフトの発生を抑えられるように、音素再合成方式に従ってピッチ変換する。一方、音処理装置1は、楽曲の音波形を表す波形データに対し、音質劣化を抑え、処理負荷を軽減することが可能な時間伸縮方式に従ってピッチ変換する。このように、音処理装置1は、それぞれの音の種類に適したピッチ変換処理をその種類ごとに独立して施すから、声音を伴う楽曲の放音におけるピッチ変換処理において、フォルマントシフトの発生を抑えることができる。
【0030】
[第2実施形態]
次に、本発明の第2実施形態について説明する。
この実施形態の音処理装置の全体的なハードウェア構成は、上述した第1実施形態と同じである。上述した第1実施形態では、記憶部13において、あらかじめ声の音波形を表す波形データと、それ以外の波形データとが識別子に対応付けて管理され、その識別子によって各波形データがどの種類であるかを制御部11が判別可能であった。これに対し、例えば音処理装置が外部装置から波形データを取得した場合など、各波形データの種類を識別子の参照によって特定できない場合も考えられる。この第2実施形態の音処理装置は、波形データを解析して、その波形データが表す音波形が声音に相当するものであるか否かを判定する機能を有する点で、第1実施形態の構成と異なる。
なお、以下の説明において、この実施形態の音処理装置が備える構成のうち、第1実施形態の音処理装置1が備える構成と共通するものは同一の符号を付して表し、それらの構成の説明を省略する。
【0031】
図3は、この実施形態の音処理装置1aの構成を示すブロック図である。
記憶部13は、第1実施形態と同じで、楽曲データ131、ガイドボーカルデータ132、及びコーラスデータ133を記憶する。各波形データは上述した第1実施形態と同じものであるが、各波形データの種類を識別する識別子は対応付けられていないものとする。
また、図3に示すように、信号処理部14aは、デコーダ147と、判定部148と、第1ピッチ変換部143と、第2ピッチ変換部144と、ミキサ145と、D/A変換部146とを備える。第1ピッチ変換部143、第2ピッチ変換部144、ミキサ145、及びD/A変換部146の構成は第1実施形態と同じであるから、その説明を省略する。
【0032】
デコーダ147は、制御部11によって出力される波形データを取得する取得手段の一例に相当し、取得した波形データをデコードして出力するものである。つまり、デコーダ147は、上述した第1実施形態のデコーダ141,142と同等の機能を有する。ただし、デコーダ147は、制御部11から取得した楽曲データ131、ガイドボーカルデータ132、又はコーラスデータ133をデコードして、音波形を示すサンプルデータ列を判定部148に出力する。
【0033】
判定部148は、本発明の判定手段の一例であり、デコーダ147から取得したサンプルデータ列を解析して、そのサンプルデータ列が表す音波形が声音の音波形である否かを判定する。判定部148は、声音に相当すると判定したサンプルデータを第1ピッチ変換部143に出力し、それ以外のサンプルデータを第2ピッチ変換部144に出力する。
【0034】
具体的には、判定部148は、例えば波形データに対して高速フーリエ変換を施すことによって周波数解析を行う。判定部148は、音圧レベルの周波数分布を解析し、声音の成分が含まれる周波数帯(以下、「声音帯域」という。)の音圧レベルに基づいて、音波形が声音に相当するものか否かを判定する。この声音帯域は、例えば100Hz〜400Hzであるが、あらかじめ決められた周波数帯域であればよい。判定部148は、声音帯域の音圧レベルが、それ以外の可聴域(例えば、20Hz〜20kHz)の音圧レベルの平均を基準として閾値以上であるか否かを判断する。そして、判定部148は、閾値以上であると判定したサンプルデータ列については第1ピッチ変換部143に出力する。一方、判定部148は、閾値未満であると判定したサンプルデータ列については第2ピッチ変換部144に出力する。
第1ピッチ変換部143及び第2ピッチ変換部144が実行する処理など、この実施形態で説明しなかった処理は、上述した第1実施形態と同じである。
【0035】
なお、判定部148における声音であるか否かの判定は、上記以外にも種々の公知の構成を適用可能である。例えば、声音の音波形を表す波形パターンを記憶部13に記憶しておき、判定部148は波形パターンとの一致度が閾値以上であると判定したサンプルデータ列については声音であると判定してもよい。
【0036】
以上説明した第2実施形態によれば、音処理装置1aは、声音であるか否かを特定するための識別子を波形データに対応付けて記憶していなくても、上述の第1実施形態と同等のピッチ変換処理を行うことが可能である。この構成により、例えば音処理装置1aが外部装置からどのような種の波形データを取得した場合であっても、その波形データに適したピッチ変換処理を施すことができる。
【0037】
[変形例]
本発明は、上述した実施形態と異なる形態で実施することが可能である。また、以下に示す変形例は、各々を適宜に組み合わせてもよい。
(変形例1)
上述した各実施形態では、本発明の信号処理装置をカラオケ装置である音処理装置1に適用した場合について説明した。これ以外にも、本発明の信号処理装置は、汎用のコンピュータ装置や電子楽器など、音に関する処理を行う種々の装置に適用可能である。
この場合において、声音の音波形を表す波形データが上述した各実施形態の種類のものでなくてもよい。
【0038】
(変形例2)
上述した各実施形態では、第2ピッチ変換部144は、時間伸縮方式に従ってピッチ変換処理を施していたが、これ以外の方式に従ってピッチ変換処理を施してもよい。例えば、第2ピッチ変換部144が周波数変換方式に従ってピッチ変換処理を施してもよく、フォルマントシフトの有無に関係しない種々の方式を採用することができる。
また、第2ピッチ変換部144がピッチ変換処理を施す波形データは、声に相当する成分を全く含まない音波形を表すものに限定されない。要するに、第1ピッチ変換部143が所定の声の音波形の波形データをピッチ変換し、第2ピッチ変換部144がそれ以外の波形データをピッチ変換する構成であればよい。
【0039】
(変形例3)
上述した第2実施形態において、第1ピッチ変換部143の波形切り出し部1431に相当する機能を判定部148が実現してもよい。この場合、第1ピッチ変換部143は、再合成部1432に相当する機能のみを実現する。
要するに、判定部148はデコーダ147から供給されるサンプルデータ列について音素波形の切り出しを試み、切り出した音素波形を表すサンプルデータ列を第1ピッチ変換部143に出力し、音素波形を表すものとして切り出せなかったサンプルデータ列を第2ピッチ変換部144に出力する。このように、判定部148は、音素波形の切り出しの可否に基づいて、声の音波形を表すサンプルデータ列(波形データ)であるか否かを判定してもよい。
【0040】
(変形例4)
上述した各実施形態において、信号処理部14,14aは、3系統の波形データに基づいてピッチ変換処理を施していたが、例えば2系統又は4系統以上であってもよい。
【0041】
(変形例5)
上述した各実施形態における音処理装置1の制御部11や信号処理部14,14aによって実行されるプログラムは、磁気記録媒体(磁気テープ、磁気ディスクなど)、光記録媒体(光ディスクなど)、光磁気記録媒体、半導体メモリなどの、コンピュータが読取可能な記録媒体に記録した状態で提供し得る。また、インターネットのようなネットワーク経由で音処理装置1にダウンロードさせることも可能である。
【符号の説明】
【0042】
1…音処理装置、11…制御部、12…ピッチシフト操作子、13…記憶部、131…楽曲データ、132…コーラスデータ、133…ガイドボーカルデータ、14,14a…信号処理部、141,142,147…デコーダ、143…第1ピッチ変換部、1431…波形切り出し部、1432…再合成部、144…第2ピッチ変換部、1441…メモリ、1442…第1乗算器、1443…第2乗算器、1444…加算器、145…ミキサ、146…D/A変換器、148…判定部。

【特許請求の範囲】
【請求項1】
声の音波形を表す第1波形データと、楽曲の音波形を表す第2波形データとを取得する取得手段と、
操作子と、
前記取得手段が取得した第1波形データが示す音波形から音素を表す音素波形を切り出して、前記操作子に対する操作の内容に応じた周期で繰り返し出力する第1方式に従って、前記第1波形データのピッチを変換する第1ピッチ変換手段と、
前記第1方式とは異なる第2方式に従って、前記取得手段が取得した第2波形データのピッチを前記操作の内容に応じて変換する第2ピッチ変換手段と、
前記第1ピッチ変換手段によりピッチが変換された第1波形データと、前記第2ピッチ変換手段によりピッチが変換された第2波形データとを合成して放音手段に出力する出力手段と
を備えることを特徴とするピッチ変換装置。
【請求項2】
前記取得手段が取得したデータが前記第1波形データ又は前記第2波形データのいずれであるかを判定する判定手段を備え、
前記第1ピッチ変換手段は、前記判定手段により前記第1波形データであると判定された波形データのピッチを変換し、
前記第2ピッチ変換手段は、前記判定手段により前記第2波形データであると判定された波形データのピッチを変換する
ことを特徴とする請求項1に記載のピッチ変換装置。
【請求項3】
前記第2ピッチ変換手段は、
前記第2波形データが表す音波形を前記操作の内容に応じた比率で時間軸上で伸縮する前記第2方式に従って、前記第2波形データのピッチを変換する
ことを特徴とする請求項1又は2に記載のピッチ変換装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate


【公開番号】特開2011−215228(P2011−215228A)
【公開日】平成23年10月27日(2011.10.27)
【国際特許分類】
【出願番号】特願2010−81205(P2010−81205)
【出願日】平成22年3月31日(2010.3.31)
【出願人】(000004075)ヤマハ株式会社 (5,930)
【Fターム(参考)】