説明

オーディオデータ再生装置および携帯端末装置

【課題】 ユーザの歌唱した音声をオリジナルの楽曲の伴奏と組み合わせることが可能なオーディオ再生装置を提供する。
【解決手段】 プレイヤー22は、オリジナルの歌唱音付きのオーディオデータ21をデータディスク5から読み取り、オーディオデコーダ23へ出力する。歌唱音付きのオーディオデータ21は、オーディオデコーダ23でデコード後に歌唱音キャンセルモジュール24にて歌唱音をキャンセルする処理が行われ、ミキサー25へと出力される。一方、マイクロフォン10で収音されたアナログ音声信号はデジタル音声データへと変換され、エフェクタ26を介してミキサー25へと出力される。ミキサー25は、歌唱音キャンセル後のオーディオデータとデジタル音声データとをミックスし、D/A変換後にスピーカ8から発音させると共に、上記ミックスしたデータのエンコードを行い、ユーザの歌唱音付きのオーディオデータを生成する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、オーディオデータを再生可能なオーディオデータ再生装置および携帯端末装置に関する。
【背景技術】
【0002】
従来、楽曲データを再生可能な携帯電話機等の楽曲再生装置においては、歌唱音のないMIDI(Musical Instruments Digital Interface)形式の楽曲データを用いたカラオケ機能を有するものが開発されている。
【0003】
ユーザがカラオケ機能を利用する際は、携帯電話機でMIDI形式の楽曲データを用いて伴奏音を再生し、携帯電話機に付属のマイクロフォンに向かい歌唱する。このとき、歌唱した音声信号が上記伴奏音の再生信号と携帯電話機内でミックスされ、携帯電話機のスピーカから伴奏音と共にユーザの歌唱音が再生される。
【0004】
一方、通信回線の大容量化に伴い、オリジナルの歌唱音付きの楽曲をCD(Compact Disc)のクオリティに匹敵するオーディオデータとして携帯電話機に配信するサービスが開始されている。
なお、本出願に関する従来技術の参考文献として、特許文献1および特許文献2が知られている。
【特許文献1】特開2001−197168号公報
【特許文献2】特開平05−199600号公報
【発明の開示】
【発明が解決しようとする課題】
【0005】
しかし、上記従来の携帯電話機においては、カラオケ機能でMIDI形式の楽曲データを用いるため、再生される伴奏音はオリジナルの楽曲のものとは異なり、その伴奏音とユーザの歌唱した音声とをミックスして再生したとしても、オリジナルの楽曲と比較してリアル感に欠けるものとなる。
【0006】
また、カラオケ機能を利用する際には、携帯電話機内に予め歌唱音付きのオリジナルの楽曲をネットワーク上のサーバから通信回線を介してダウンロードし保持していたとしても、新たにMIDI形式の楽曲データを取得する必要があった。
本発明は上記事情を考慮してなされたもので、その目的は、ユーザの歌唱した音声をオリジナルの楽曲の伴奏と組み合わせることが可能なオーディオ再生装置を提供することにある。
【課題を解決するための手段】
【0007】
本発明は上記の課題を解決するためになされたもので、請求項1に記載の発明は、オーディオデータから歌唱音を除去する歌唱音除去手段と、音声を収音し音声データとして出力する音声収音手段と、少なくとも前記歌唱音除去後のオーディオデータを再生する再生手段と、前記歌唱音を除去後のオーディオデータと前記音声データに基づいて新たなオーディオデータを生成するオーディオデータ生成手段とを具備することを特徴とするオーディオデータ再生装置である。
【0008】
また、請求項2に記載の発明は、請求項1に記載の発明において、前記オーディオデータ生成手段で生成した新たなオーディオデータと、画像データまたはテキストデータとを合わせて1つのファイルにするオーディオデータ加工手段をさらに具備することを特徴とする。
【0009】
また、請求項3に記載の発明は、オーディオデータから歌唱音を除去する歌唱音除去手段と、音声を収音し音声データとして出力する音声収音手段と、少なくとも前記歌唱音除去後のオーディオデータを再生する再生手段と、前記歌唱音を除去後のオーディオデータと前記音声データを別のオーディオデータとして保存する楽曲ファイルを生成する楽曲ファイル生成手段とを具備することを特徴とするオーディオデータ再生装置である。
【0010】
また、請求項4に記載の発明は、請求項1から請求項3のいずれか1項に記載の発明において、前記音声データの特徴を変更する音声データ変更手段をさらに具備することを特徴とする。
【0011】
また、請求項5に記載の発明は、請求項1から請求項4のいずれか1項に記載の発明において、前記歌唱音除去手段は、前記オーディオデータの特定の期間のみに対して歌唱音を除去することを特徴とする。
【0012】
また、請求項6に記載の発明は、請求項1から請求項5に記載のオーディオデータ再生装置を具備することを特徴とする携帯端末装置である。
【0013】
また、請求項7に記載の発明は、請求項6に記載の発明において、電話機能をさらに具備し、前記オーディオデータ生成手段で生成したオーディオデータを着信時の再生に割り付けることを特徴とする。
【発明の効果】
【0014】
本発明のオーディオ再生装置によれば、歌唱音をキャンセルすることにより生成したオリジナルの楽曲の伴奏音と、ユーザの歌唱音とをミックスして再生することが可能であるため、ユーザはオリジナルの楽曲の伴奏でカラオケを楽しむことができる。
【0015】
また、オリジナルの楽曲の伴奏音とユーザの歌唱音とをミックスした音声信号から新たな歌唱音付きの楽曲を作成することで、ユーザの作成した楽曲を共有サーバに送付し、共有サーバ上のデータをWebサイト上に公開して歌唱データのコンテストを行う等のサービス展開が可能となる。
【0016】
さらにまた、一つの歌唱音付きのオーディオデータを、そのまま再生して音楽鑑賞に用いることも歌唱音をキャンセルしてカラオケに用いることもできる。さらにまた、オーディオデータから歌唱音をキャンセルする期間を指定することで、歌唱音キャンセル処理による伴奏部分の音質の劣化を防止することができる。
【発明を実施するための最良の形態】
【0017】
以下、図面を参照して本発明の第一の実施形態について説明する。図1は、本発明の第一の実施形態に係る携帯電話機(オーディオデータ再生装置)の構成を示す構成図である。図1において、CPU1は携帯電話機内の各部を制御するCPU(Central Processing Unit)である。
【0018】
ROM2は、CPU1が実行するプログラム等を保持するROM(Read Only Memory)である。RAM3は、CPU1が使用するメモリ領域を提供するRAM(Random Access Memory)である。
【0019】
インタフェース4は、シリアル通信またはパラレル通信によりデータディスク5と接続するためのインタフェースである。データディスク5は、一ないし複数の歌唱音付きのオーディオデータを格納するディスクであり、CPU1はインタフェース4を介してデータディスク5内のオーディオデータを読み取る。
【0020】
DSP6は、データディスク5に記憶されたオーディオデータ(MP3形式やAAC形式等で圧縮されている)に対してリアルタイムでデコード処理を行うDSP(Digital Signal Processor)である。また、DSP6は、ユーザの歌唱音が追加されたオーディオデータに対してエンコード処理を行うものである。
【0021】
D/A部7は、DSP6でデコードされたオーディオデータをアナログ音声信号に変換するDAC(Digital-to-Analog Converter)である。スピーカ8(再生手段)は、D/A部7で変換されたアナログ音声信号を発音するスピーカである。
【0022】
音声処理部9は、マイクロフォン10(音声収音手段)から出力される音声信号をデジタル音声データに変換し、さらに圧縮して通信部6へ出力する。また、通信部6から出力される圧縮されたデジタル音声データを伸長し、アナログ信号に変換してイヤスピーカ11へ出力する。なお、ユーザの歌唱音声を収音する際には、通話用のマイクロフォン10を用いてもよいし、これに代えて、専用のマイクロフォンを設けてもよい。
【0023】
通信部12は、アンテナ13を介して受信した高周波信号を復調し、復調によって得られた音声データについては音声処理部9へ出力し、文字データ、記号データ等についてはバスライン14を介してCPU1へ出力するものである。
【0024】
また、通信部12は、CPU1から供給される文字データ等および音声処理部9から出力される音声データによって高周波の搬送波を変調しアンテナ13から発信するものである。バスライン14は、携帯電話機内の各部を相互に接続するバスラインである。入力部15は、ユーザの指示を入力する操作キー等を有する入力部である。
【0025】
次に、上述した第一の実施形態の動作を、図2および図3を参照して説明する。図2は、図1の携帯電話機で実行される機能を示す機能構成図であり、図3は図1の携帯電話機でユーザの歌唱付きオーディオデータを生成する手順を示すフローチャートである。
【0026】
ユーザが入力部15を使用して歌唱曲を選択する指示を行うと(ステップS101)、CPU1の一機能として実現されるプレイヤー22は、データディスク5から該当するオリジナルの歌唱付きオーディオデータ21を読み出す(ステップS102)。
【0027】
続いて、ユーザが入力部15を使用して選択した歌唱曲の再生指示を行うと(ステップS103)、プレイヤー22は歌唱音付きのオーディオデータの再生処理を開始するために、DSP6の一機能であるオーディオデコーダ23へオーディオデータを出力する(ステップS104)。
【0028】
オーディオデコーダ23は、入力したオーディオデータをリニアなオーディオデータフォーマットにリアルタイムでデコードし(ステップS105)、歌唱音キャンセルモジュール24(歌唱音キャンセル手段)へと出力する。
【0029】
歌唱音キャンセルモジュール24は、デコード後のオーディオデータから歌唱音を検出し、検出した歌唱音をキャンセルする処理を行い歌唱音なしのオーディオデータを生成する(ステップS106)。歌唱音キャンセルモジュール24は、例えば、図4に示す回路により実現される。
【0030】
図4においては、オーディオデータのL信号とR信号の入力に対して、反転回路41によりL信号からR信号を引くことでセンター成分を削除し、これに一次のIIR(Infinite Impulse Response)フィルタ二段(LPF(Low Pass Filter)42とHPF(High Pass Filter)43)によるBPF(Band Pass Filter)特性を加えて、音声帯域の非センター成分を抽出する。
【0031】
一方、オーディオデータのL信号及びR信号に対して、並列に二系統のIIR(LPF44aとHPF45a、LPF44bとHPF45b)を加えて非音声帯域の成分を抽出する。上記抽出した音声帯域の非センター成分に、L信号及びR信号のそれぞれから抽出した非音声帯域の成分をステレオで加えることにより、歌唱音がキャンセルされたL信号及びR信号が出力される。
【0032】
ここで、オリジナルの歌唱付きオーディオデータ21にあらかじめ歌唱音をキャンセルする期間(例えば、歌唱曲の開始からの時間)を指定するデータを加え、歌唱音キャンセルモジュール24は、指定された期間内のオーディオデータに対してのみ歌唱音キャンセルの処理を行うようにすることも可能である。
【0033】
歌唱音をキャンセルする方法に関しては、例えば図4に示したとおり、左右のステレオ音声信号からセンターに定位する成分を除去したり、中域の成分を除去するなどの方法が知られている。従って、この歌唱音キャンセルの過程で行う帯域制限等の処理により歌唱音だけでなく演奏音の音質にも影響を与えるが、上述のように歌唱音をキャンセルする区間を指定することにより、演奏音のみの部分に関しては音質を維持することができる。
【0034】
図2に戻って、歌唱音キャンセルモジュール24での処理が終了すると、歌唱音がキャンセルされたオーディオデータは、DSP6の一機能であるミキサー25へと出力される。
【0035】
一方、ユーザがマイクロフォン10に向かって歌唱を行うと(ステップS107)、マイクロフォン10の出力信号が音声処理部9でデジタル音声データに変換され、エフェクタ26へと出力される。
【0036】
エフェクタ26(音声データ変更手段)は、音声処理部9から入力したデジタル音声データの基本ピッチ(音高)、レベル、周波数特性、テンポ、発音、時間等の要素を変換し、ミキサー25へと出力する。このように、ユーザの歌唱した音声に対して編集を加えることで、例えば、オリジナルの楽曲の歌手に似た声に変換することが可能となる。また、エコーやコーラス等の効果を付与することも可能である。
【0037】
ミキサー25は、オーディオデコーダ23から入力する歌唱音なしのオーディオデータとエフェクタ26から入力するデジタル音声データとをミックスし(ステップS108)、D/A部7およびデータバッファ27へと出力する。なお、データバッファ27とは、オーディオデータを一時的に蓄積するメモリ領域であり、RAM3内に確保される。
【0038】
D/A部7は、ミキサー25より入力したミックス後のオーディオデータをアナログ音声信号に変換し、スピーカ8へ出力して再生を行う(ステップS109)。一方、データバッファ27は、ミックス後のオーディオデータを一時的に蓄積する(ステップS110)。
【0039】
続いて、DSP6の一機能であるオーディオエンコーダ28(オーディオデータ生成手段)は、データバッファ27に蓄積されたオーディオデータを取り出し、所定の圧縮オーディオフォーマットにエンコードする(ステップS111)。エンコード処理が終了すると、オリジナルの楽曲の伴奏にユーザの歌唱音がミックスされたオーディオデータが生成される(ステップS112)。
【0040】
このように、第一の実施形態に係る携帯電話機を用いることで、ユーザは、歌唱音付きのオーディオデータから歌唱音がキャンセルされた曲に合わせて歌唱することで、オリジナルの楽曲の伴奏に合わせてカラオケを楽しむことができる。
【0041】
また、歌唱音をキャンセルしたオリジナルの楽曲とユーザの歌唱音とをミックスしたオーディオデータを作成することで、様々な利用形態が可能となる。例えば、当該オーディオデータを共有サーバに送付し、共有サーバ上のデータをWebサイト上に公開し、歌唱データのコンテストを行うサービス展開が可能となる。
【0042】
さらにまた、ユーザの歌唱音付きのオーディオデータを生成後に、画像データやテキストデータを付加してファイル化し(オーディオデータ加工手段)、知人にメール添付するという利用形態も可能となる。この際、付加する画像データやテキストデータは、オリジナルの歌唱音付きのオーディオデータに含まれているものをそのまま使用してもよいし、携帯電話機内に予め保存されている画像データやテキストデータからユーザが選択してもよい。さらにまた、ユーザの歌唱音付きのオーディオデータを携帯電話機の着信メロディに割り付けることも可能となる。
【0043】
続いて、本発明の第二の実施形態について、図1および図5を参照して説明する。なお、第二の実施形態においても、携帯電話機(オーディオデータ再生装置)の構成は図1と同様であり、重複した説明は省略する。
【0044】
図2および図3を用いて前述した第一の実施形態は、歌唱音をキャンセルしたオリジナルの楽曲とユーザの歌唱音とをミックスして新しい一つのオーディオデータを生成する方法であるが、第二の実施形態では、歌唱音をキャンセルしたオリジナルの楽曲を演奏トラック、ユーザの歌唱音をボーカルトラックとして二つのトラックを個別のオーディオデータとしたまま一つの楽曲ファイルにする方法に関して説明する。
【0045】
図5は、第二の実施形態において、図1の携帯電話機で実行される機能を示す機能構成図である。図5において、第一の実施形態と同様の処理を行うものに関しては、同じ番号を付与し、重複した説明は省略する。
【0046】
図5において、第一の実施形態と同様に歌唱音付きオーディオデータはプレイヤー22によりオーディオデコーダ23へ出力される。オーディオデコーダ23でデコーダされたオーディオデータは、歌唱音キャンセルモジュール24により歌唱音がキャンセルされた後、エフェクタ26から出力されるデジタル音声データと共にDSP6の一機能である入出力切り替えブロック30へと入力される。
【0047】
入出力切り替えブロック30は、携帯電話機で行う処理に応じてその入力および出力を切り替えるものである。例えば、カラオケ用に再生だけを行うときには、入出力切り替えブロック30は歌唱音キャンセルモジュール24およびエフェクタ26の双方からデータを入力し、D/A部7のみに出力する処理を行う。
【0048】
また、再生と同時に楽曲ファイルの作成を行うときには、入出力切り替えブロック30は歌唱音キャンセルモジュール24から入力したオーディオデータとエフェクタ26から入力したデジタル音声データをD/A部7に出力し、さらに、オーディオデータとデジタル音声データを個別にデータバッファ27に出力する。そして、データバッファ27では、それぞれのデータを個別に記憶する。
【0049】
楽曲ファイルの作成を行う際には、オーディオエンコーダ28は、データバッファ27に蓄積されたオーディオデータとデジタル音声データを取り出し、所定の圧縮オーディオフォーマットでエンコードを行う。
【0050】
エンコードされたオーディオデータ(歌唱音キャンセル済み)とデジタル音声データは、CPU1の一機能である楽曲ファイルメーカ32(楽曲ファイル生成手段)へ入力され、一つの楽曲ファイル(ユーザの歌唱付きオーディオデータ33)が生成される。
【0051】
第二の実施形態においては、歌唱音をキャンセルしたオリジナルの楽曲とユーザの歌唱音とが別々のオーディオデータとして保存されるため、例えば、生成された楽曲ファイルを再生する際に、オリジナルの楽曲の音量を落としてユーザの歌唱音だけを再生するといった利用形態が可能となる。また、ユーザの歌唱音を単独でオーディオデータとして保存することで、歌唱音のみを入れ替えることも可能となる。
【0052】
以上、本発明の実施形態を詳述してきたが、具体的な構成は本実施形態に限られるものではなく、本発明の要旨を逸脱しない範囲の設計変更等も含まれる。例えば、本実施形態で述べたオーディオデータは特定の形式で圧縮されている必要はなく、圧縮されていないオーディオデータに対しても本発明を適用できる。
【産業上の利用可能性】
【0053】
本発明は、カラオケ機能を有し、オーディオデータを再生可能なオーディオデータ再生装置および携帯端末装置に用いて好適である。
【図面の簡単な説明】
【0054】
【図1】本発明の第一および第二の実施形態に係る携帯電話機の構成を示す構成図である。
【図2】第一の実施形態において、図1の携帯電話機で実行される機能を示す機能構成図である。
【図3】図1の携帯電話機でユーザの歌唱付きオーディオデータを生成する手順を示すフローチャートである。
【図4】図2の歌唱音キャンセルモジュール24の構成の一例を示す回路図である。
【図5】第二の実施形態において、図1の携帯電話機で実行される機能を示す機能構成図である。
【符号の説明】
【0055】
1…CPU、2…ROM、3…RAM、4…インタフェース、5…データディスク、6…DSP、7…D/A部、8…スピーカ(再生手段)、9…音声処理部、10…マイクロフォン(音声収音手段)、11…イヤスピーカ、14…バスライン、15…入力部、24…歌唱音キャンセルモジュール(歌唱音除去手段)、25…ミキサー、26…エフェクタ(音声データ変更手段)、28…オーディオエンコーダ(オーディオデータ生成手段)、30…入出力切り替えブロック、32…楽曲ファイルメーカ(楽曲ファイル生成手段)

【特許請求の範囲】
【請求項1】
オーディオデータから歌唱音を除去する歌唱音除去手段と、
音声を収音し音声データとして出力する音声収音手段と、
少なくとも前記歌唱音除去後のオーディオデータを再生する再生手段と、
前記歌唱音を除去後のオーディオデータと前記音声データに基づいて新たなオーディオデータを生成するオーディオデータ生成手段と
を具備することを特徴とするオーディオデータ再生装置。
【請求項2】
前記オーディオデータ生成手段で生成した新たなオーディオデータと、画像データまたはテキストデータとを合わせて1つのファイルにするオーディオデータ加工手段をさらに具備することを特徴とする請求項1に記載のオーディオデータ再生装置。
【請求項3】
オーディオデータから歌唱音を除去する歌唱音除去手段と、
音声を収音し音声データとして出力する音声収音手段と、
少なくとも前記歌唱音除去後のオーディオデータを再生する再生手段と、
前記歌唱音を除去後のオーディオデータと前記音声データを別のオーディオデータとして保存する楽曲ファイルを生成する楽曲ファイル生成手段と
を具備することを特徴とするオーディオデータ再生装置。
【請求項4】
前記音声データの特徴を変更する音声データ変更手段をさらに具備することを特徴とする請求項1から請求項3のいずれか1項に記載のオーディオデータ再生装置。
【請求項5】
前記歌唱音除去手段は、前記オーディオデータの特定の期間のみに対して歌唱音を除去することを特徴とする請求項1から請求項4のいずれか1項に記載のオーディオデータ再生装置。
【請求項6】
請求項1から請求項5に記載のオーディオデータ再生装置を具備することを特徴とする携帯端末装置。
【請求項7】
電話機能をさらに具備し、
前記オーディオデータ生成手段で生成したオーディオデータを着信時の再生に割り付けることを特徴とする請求項6に記載の携帯端末装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate


【公開番号】特開2007−102103(P2007−102103A)
【公開日】平成19年4月19日(2007.4.19)
【国際特許分類】
【出願番号】特願2005−295190(P2005−295190)
【出願日】平成17年10月7日(2005.10.7)
【出願人】(000004075)ヤマハ株式会社 (5,930)
【Fターム(参考)】