説明

音声再生装置、音声再生方法、プログラム

【課題】より短い区間で、良好に繰り返し再生する。
【解決手段】音声再生装置は、音声データ再生中の任意の時点(中心時刻CT)を選択する入力操作を受け付ける入力操作部5と、入力操作により選択された中心時刻CTを含む探索範囲SRRの音声データを記憶するリピートバッファ41と、探索範囲SRRの音声データを用いて、探索範囲SRRの中から音声データが示す信号SGの振幅がゼロになり且つ立ち上がりになるゼロクロス点ZCP1、ZCP2を2つ検出するゼロクロス点検出部45と、2つのゼロクロス点ZCP1、ZCP2の間の音声データを繰り返し再生するリピート処理部49とを備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、所定の区間の音声データを繰り返し再生する音声再生装置及び音声再生方法、及び所定の区間の音声データを繰り返し再生するためのコンピュータプログラムに関する。
【背景技術】
【0002】
従来から、ユーザにより任意に設定された区間の演奏データを繰り返し再生する機能を有する演奏データ再生機器が、例えば特許文献1により、知られている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2005−266392号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかし、特許文献1では、繰り返し再生する演奏データは小節単位でしか設定及び変更できない。
【0005】
本発明は、上記課題に鑑みて成されたものであり、その目的は、より短い区間で、良好に繰り返し再生することができる音声再生装置、音声再生方法、コンピュータプログラムを提供することである。
【課題を解決するための手段】
【0006】
上記目的を達成するため、本発明の一実施形態は、音声データ再生中の任意の時点(CT)を選択する入力操作を受け付ける入力操作部(5)と、入力操作により選択された時点(CT)を含む探索範囲(SRR)の音声データを記憶する記憶部(41)と、探索範囲(SRR)の音声データを用いて、探索範囲(SRR)の中から音声データが示す信号(SG)が立ち上がっている途中において振幅がゼロになるゼロクロス点(ZCP1、ZCP2)を2つ、または、前記音声データが示す信号が立ち下がっている途中において振幅がゼロになるゼロクロス点を2つ検出するゼロクロス点検出部(45)と、検出した2つのゼロクロス点(ZCP1、ZCP2)の間の音声データを繰り返し再生するリピート処理部(49)とを備える音声再生装置である。
【0007】
本発明の他の実施形態は、音声データ再生中の任意の時点(CT)を選択する入力操作を受け付け、入力操作により選択された時点(CT)を含む探索範囲(SRR)の音声データを記憶し、探索範囲(SRR)の音声データを用いて、探索範囲(SRR)の中から音声データが示す信号(SG)が立ち上がっている途中において振幅がゼロになるゼロクロス点(ZCP1、ZCP2)を2つ、または、音声データが示す信号(SG)が立ち下がっている途中において振幅がゼロになるゼロクロス点を2つ検出し、検出した2つのゼロクロス点(ZCP1、ZCP2)の間の音声データを繰り返し再生する音声再生方法である。
【0008】
本発明の他の実施形態は、コンピュータに、音声データ再生中の任意の時点(CT)を選択する入力操作を受け付ける手順と、入力操作により選択された時点(CT)を含む探索範囲(SRR)の音声データをコンピュータが備える記憶部(41)に記憶させる手順と、記憶部(41)に記憶された探索範囲(SRR)の音声データを用いて、探索範囲(SRR)の中から音声データが示す信号(SG)が立ち上がっている途中において振幅がゼロになるゼロクロス点(ZCP1、ZCP2)を2つ、または、音声データが示す信号(SG)が立ち下がっている途中において振幅がゼロになるゼロクロス点を2つ検出する手順と、検出した2つのゼロクロス点(ZCP1、ZCP2)の間の音声データを繰り返し再生する手順とを実行させるためのプログラムである。
【発明の効果】
【0009】
本発明の実施形態に係わる音声再生装置、音声再生方法及びコンピュータプログラムによれば、より短い区間で、良好に繰り返し再生することができる。
【図面の簡単な説明】
【0010】
【図1】図1は、1又は2以上の実施形態に係わる音声再生装置の概略構成を示すブロック図である。
【図2】図2は、図1の入力操作部5の具体的な構成を示すブロック図である。
【図3】図3は、図1のCPU6により実現される具体的な演算処理を示すブロック図である。
【図4】図4は、図1の音声再生装置を用いたデータ処理の流れを示すデータフロー図である。
【図5】図5は、図4のデータ処理のうち、通常再生モードにおける再生バッファ34のデータ処理の詳細を示すデータフロー図である。
【図6】図6(a)〜図6(e)は、図4のデータ処理のうち、繰り返し再生モードにおける一時バッファ40及びリピートバッファ41のデータ処理の詳細を示すデータフロー図である。
【図7】図7は、一時バッファ40内の音声データにおいて、リピートバッファ41へ抽出する探索範囲SRRの変化の様子を説明するための模式図であり、図7(a)は位置調整ボタン23が押し下げ操作された場合を示し、図7(b)は位置調整ボタン22が押し下げ操作された場合を示し、図7(c)は更に周期調整ボタン25が押し下げ操作された場合を示し、図7(d)は更に周期調整ボタン24が押し下げ操作された場合を示す。
【図8】図8(a)〜図8(d)は、リピートバッファ41へ抽出する探索範囲SRRが、一時バッファ40の範囲を超えた場合の処理手順を説明するための模式図である。
【図9】図9は、第2の実施の形態に係わる音声再生装置を用いたデータ処理の流れを示すデータフロー図である。
【発明を実施するための形態】
【0011】
以下図面を参照して、本発明の実施の形態を説明する。図面の記載において同一部分には同一符号を付して説明を省略する。
【0012】
(第1の実施の形態)
1又は2以上の実施形態に係わる音声再生装置は、デジタル形式の音楽ファイル(音声データ)を再生する機能を有する装置である。そして、音声再生装置は、ユーザーの入力操作により選択された時点を含む探索範囲の中から、音声データが示す信号の振幅がゼロになるゼロクロス点を2つ検出し、2つのゼロクロス点の間の音声データを繰り返し再生する機能を更に備える。音声再生装置は、これらの機能に特化した専用の機器として構成する場合に限らず、パーソナルコンピュータなどの汎用の情報処理装置に音声データの再生(デコーダ)機能を付加することによっても実現可能である。なお、検出する2つのゼロクロス点は、信号が立ち上がっている途中のゼロクロス点同士の組み合わせ、又は、信号が立ち下がっている途中のゼロクロス点同士の組み合わせのいずれかであればよい。
【0013】
先ず、図1を参照して、1又は2以上の実施形態に係わる音声再生装置のハードウェア構成を説明する。音声再生装置は、中央処理装置(CPU)6、ランダムアクセスメモリ(RAM)3、読み出し専用メモリ(ROM)2、外部記憶装置1、入力操作部5、及び出力部7を備え、これらのハードウェアはバス4を介して互いに接続されている。
【0014】
CPU6は、コンピュータプログラムに従って、音声データを再生するための様々な演算処理を実行する。ROM2には、CPU6により実行される演算処理を規定したコンピュータプログラムが記憶されている。RAM3には、CPU6が演算処理を行う際に利用する様々なデータを一時的に記憶するための各種バッファとして機能する。RAM3により実現される各種バッファの詳細は図4を参照して後述する。
【0015】
外部記憶装置1は、CD、DVD、ブルーレイディスク(BD)等の光ディスク、ハードディスク等の磁気ディスク、光磁気ディスク(MO)、メモリカードやUSBメモリ等のフラッシュメモリ等の記録媒体を用いた補助記憶手段の一例である。外部記憶装置1には、主に、再生対象となる音声データが記憶されている。なお、CPU6により実行される演算処理を規定したコンピュータプログラムは、ROM2の代わりに、外部記憶装置1に記憶されていてもよい。
【0016】
図2を参照して図1の入力操作部5の具体的な構成例を説明する。図1の入力操作部5は、ユーザーによる入力操作を受け付けるユーザインターフェースであって、音声再生装置は、入力操作部5を介してユーザーから各種コマンドを受け取る。入力操作部5は、具体的に、繰り返し再生の開始及び終了を指示するためのリピート切替ボタン21と、繰り返し再生する音声データの位置の変更を指示するための位置調整ボタン22、23と、繰り返し再生する音声データの周期の変更を指示するための周期調整ボタン24、25とを備える。これらのボタン21〜25がユーザーにより、例えば押し下げ操作されることにより、各ボタン21〜25に対応するコマンド信号がCPU6へ図1のバス4を介して送信される。
【0017】
リピート切替ボタン21が押し下げ操作される度に、繰り返し再生の開始及び終了が交互に実行される。繰り返し再生の開始を実行する場合、これと同時に、リピート切替ボタン21が押し下げ操作されたタイミングが、音声データ再生中の任意の時点として選択される。つまり、リピート切替ボタン21は、音声データ再生中の任意の時点を選択する入力操作を受け付けることができる。リピート切替ボタン21は、ポーズボタンに相当する。
【0018】
位置調整ボタン22、23は、繰り返し位置を調整するために操作されるボタンであって、例えば32分音符に相当する程度の時間単位で、繰り返し位置を前後方向に移動させることができる。周期調整ボタン24、25は、繰り返し周期を調整するために操作されるボタンである。音声データにより再生される音源によっては繰り返し周期を長く、あるいは短くした方が良い音質が得られることがあるため、例えば50〜200msecの範囲で繰り返し周期を選択できるようにしてもよい。なお、位置調整ボタン22、23及び周期調整ボタン24、25の詳細については、図7を参照して後述する。
【0019】
図3を参照して、図1のCPU6により実現される具体的な演算処理を説明する。第1の実施の形態において、CPU6は、ROM2或いは外部記憶装置1に記憶されたコンピュータプログラムを実行することにより、デコーダ44、ゼロクロス点検出部45、クロスフェード部48、及びリピート処理部49として機能する。
【0020】
リピート切替ボタン21が、音声データ再生中の任意の時点を選択する入力操作を受け付けると、CPU6は、入力操作により選択された時点を含む探索範囲の音声データをバッファとしてのRAM3に一時的に記憶させる。この際、デコーダ44は、圧縮された状態で外部記憶装置1に記憶されている音声データを非圧縮の状態に戻す、つまりデコード(復号)する。RAM3には、復号された音声データが記憶される。ゼロクロス点検出部45は、RAM3に記憶された探索範囲の音声データを用いて、探索範囲の中から音声データが示す信号の振幅がゼロになるゼロクロス点を2つ検出する。なお、検出する2つのゼロクロス点は、信号が立ち上がっている途中のゼロクロス点同士の組み合わせ、又は、信号が立ち下がっている途中のゼロクロス点同士の組み合わせのいずれかある。
クロスフェード部48は、2つのゼロクロス点をそれぞれ始点とする所定のクロスフェード領域の音声データをクロスフェードさせる。そして、リピート処理部49は、2つのゼロクロス点の間の音声データを繰り返し再生するためのリピート処理を行う。リピート処理された音声データは、図1の出力部7を介して出力される。リピート処理部49は、クロスフェードされた音声データを繰り返し再生してもよいし、クロスフェードされていない音声データを繰り返し再生しても構わない。なお、図3の包絡線検出部46及び安定区間検出部47については、第2の実施の形態において説明する。
【0021】
図4を参照して、図1の音声再生装置を用いたデータ処理の流れを説明する。再生対象となる音声データPFとしては、外部記憶装置1に保存されている再生音源であって、非圧縮のリニアPCM(LPCM)や圧縮されたMP3やWMA形式の再生ファイルを用いることができる。音声データPFは、外部記憶装置1から読み出され、デコーダ44により復号された後、RAM3の一部分であるデコードバッファ32に一時的に記憶される。具体的に、音声データPFは、デコーダ44によってリニアPCM形式に変換され、フレームと呼ばれる数10msec単位の容量からなるデコードバッファ32に展開される。
【0022】
音声再生装置を用いたデータ処理は、繰り返し再生を行う「繰り返し再生モード」と、繰り返し再生を行わない「通常再生モード」とによって異なる。「繰り返し再生モード」と「通常再生モード」は、リピート切替ボタン21が押し下げ操作される度に、切り替わる。
【0023】
先ず「通常再生モード」におけるデータ処理の流れを説明する。図4に示すスイッチ33、35は再生バッファ34側の端子に接続され、図4に示すデコードバッファ32に展開された音声データPFは、数秒程度の容量からなる再生バッファ34にコピーされ、この再生バッファ34から出力バッファ36にコピーされる。その後、音声データPFは、D/Aコンバータ37によってデジタルデータからアナログ信号へ変換され、増幅器38を介してスピーカ39から出力される。なお、D/Aコンバータ37、増幅器38及びスピーカ39は、図1の出力部7の具体的な構成の一例である。
【0024】
図5を参照して、図4のデータ処理のうち、通常再生モードにおける再生バッファ34のデータ処理の詳細を説明する。デコーダ44によりリニアPCM形式のデータに変換された音声データは、デコードバッファ32に展開される。デコードバッファ32に展開されたPCMデータ(音声データ)は、再生バッファ34の書き込みポインタWPの位置を始点として書き込まれる。その後、書き込みポインタWPを、書き込まれた音声データの分だけ移動させる。つまり、デコードバッファ32の容量W32分だけ移動させる。以上の処理を繰り返し行うことで、音声データが再生バッファ34に連続して書き込まれる。
【0025】
一方、再生バッファ34には読み出しポインタRPが設定されている。再生バッファ34に記憶されている音声データのうち、読み出しポインタRPを始点とする出力バッファ36の容量R36分の音声データが、再生バッファ34から出力バッファ36へ読み出される。その後、読み出しポインタRPを、読み出された音声データの分だけ移動する。つまり、出力バッファ36の容量R36分だけ移動させる。以上の処理を繰り返し行うことで、音声データが出力バッファ36に連続して読み出される。
【0026】
また、書き込みポインタWP及び読み出しポインタRPが再生バッファ34の一端(図5の右端)を越える時は、書き込みポインタWP及び読み出しポインタRPを再生バッファ34の他端(図5の左端)に戻し、再生バッファ34の他端から残りの音声データの読み出し及び書き込みを継続する。このような「リングバッファ動作」を行うことにより、デコードバッファ32と出力バッファ36の容量(バッファに記憶可能な音声データの再生時間)が一致しない場合であっても、読み出し及び書き込みのタイミングを適宜調整することによって音声データを途切れること無く再生することが可能となる。
【0027】
次に、図4に戻り、「繰り返し再生モード」におけるデータ処理の流れを説明する。図4に示すスイッチ33、35は一時バッファ40及びリピートバッファ41側の端子に接続され、図4に示すデコードバッファ32に展開された音声データPFは、数秒程度の容量からなる一時バッファ40にコピーされ、この一時バッファ40内の一部(探索範囲)の音声データがリピートバッファ41にコピーされ、更に、リピートバッファ41内の一部(2つのゼロクロス点の間)の音声データが出力バッファ36へコピーされる。その後の流れは、「通常再生モード」と同じであるので説明を省略する。
【0028】
図6(a)〜図6(e)を参照して、図4のデータ処理のうち、繰り返し再生モードにおける一時バッファ40及びリピートバッファ41のデータ処理の詳細を説明する。リピート切替ボタン21が操作されると、通常再生モードから繰り返し再生モードへ切り替わる。すると、図6(a)に示すように、デコーダ31は、リピート切替ボタン21が操作された時刻(これを「中心時刻CT」という)を中心として、中心時刻CTの前後数秒程度の範囲の音声データを復号して、デコードバッファ32を介して一時バッファ40に保存する。図6(a)の例では、一時バッファ40の全体に、デコードバッファ32の容量の6倍の音声データを記憶させている。
【0029】
なお、中心時刻CTを中心として前後数秒間程度の範囲の音声データを復号することにより、図7を参照して後述するように、繰り返し位置を調整する際に、その都度毎回、再デコードすることを回避することができる。また、中心時刻CTの前後何秒間を復号するかは、デコーダ44の能力と操作感とのトレードオフで決定すべきものであり、デコーダ44の能力が高ければ復号区間を数秒以上に増やすことも可能である。
【0030】
次に、図6(b)に示すように、一時バッファ40から実際に繰り返す部分の音声データをリピートバッファ41へ抽出する。抽出される部分は、位置調整ボタン22、23により設定された位置と周期調整ボタン24、25により設定された繰り返し周期によって決定される。例えば、繰り返し位置の設定値が0であり、繰り返し周期の設定値が100msecであるとすると、中心時刻CTの前後100msecの範囲(探索範囲SRR)の音声データを、リピートバッファ41へ抽出する。これにより、探索範囲SRRの音声データは、記憶部としてのリピートバッファ41に記憶される。なお、探索範囲SRRの音声データを抽出する際にバンドパスフィルタBPFを通すようにしてもよい。これにより、不要な音声帯域を除去することができ、繰り返し再生される音の音質を向上させることができる。
【0031】
次に、図6(c)に示すように、図3のゼロクロス点検出部45は、リピートバッファ41に記憶された探索範囲SRRの音声データを用いて、探索範囲SRRの中から音声データが示す信号SGの振幅がゼロになるゼロクロス点ZCP1、ZCP2を2つ検出する。例えば、ゼロクロス点検出部45は、探索範囲SRRの中心(中心時刻CT)を境にして探索範囲SRRを2分割した前半部分F41および後半部分S41の中から、ゼロクロス点ZCP1、ZCP2を1つずつ検出する。なお、図6(c)においては、信号が立ち上がっている途中のゼロクロス点を2つ検出したものとする。
【0032】
次に、図6(d)及び図6(e)に示すように、図3のクロスフェード部48は、2つのゼロクロス点ZCP1、ZCP2をそれぞれ始点とする所定のクロスフェード領域CFR1、CFR2の音声データをクロスフェードさせる。例えば、クロスフェード部48は、前半部分F41のゼロクロス点ZCP1を始点するクロスフェード領域CFR1において、音声データをフェードインさせ、後半部分S41のゼロクロス点ZCP2を始点するクロスフェード領域CFR2において、音声データをフェードアウトさせる。そして、クロスフェード領域CFR1の音声データに対して、クロスフェード領域CFR2の音声データを上書きすることにより、クロスフェードを行う。これにより、前半部分F41のゼロクロス点ZCP1と後半部分S41のゼロクロス点ZCP2とがスムーズに繋がるようになり、リピートバッファ41に記憶された探索範囲SRRの音声データから、繰り返しに最も適当な部分を検出することができる。
【0033】
最後に、図6(e)に示すように、図3のリピート処理部49は、2つのゼロクロス点ZCP1、ZCP2の間(繰り返し信号範囲RPL)の音声データを繰り返し再生する。具体的には、繰り返し信号範囲RPLをリングバッファとみなして、繰り返し信号範囲RPLの音声データを繰り返し出力バッファ36に書き込む。すなわち、繰り返し信号範囲RPLに読み出しポインタを設定し、出力バッファ36からの出力要求に応じて読み出しポインタから音声データを読み出し、その後、読み出しポインタを出力バッファ36の容量分だけ移動する。読み出しポインタが後半部分S41のゼロクロス点ZCP2を越えそうになったら前半部分F41のゼロクロス点ZCP1に戻り残りの音声データを出力バッファ36に書き込む。
【0034】
図7(a)〜図7(d)を参照して、一時バッファ40内において、リピートバッファ41へ抽出する探索範囲SRRを調整する方法を説明する。初期設定として、探索範囲SRRの中心が中心時刻CTに一致しているものとする。図7(a)は、初期設定の状態から、位置調整ボタン23が押し下げ操作された場合を示す。この場合、探索範囲SRRは、中心時刻CTから右側(早送り側)へ移動する。図7(b)は、初期設定の状態から、位置調整ボタン22が押し下げ操作された場合を示す。この場合、探索範囲SRRは、中心時刻CTから左側(巻戻り側)へ移動する。なお、位置調整ボタン22、23の操作時に、探索範囲SRRの位置は変化するが、探索範囲SRRの幅は一定である。
【0035】
このような位置調整ボタン22、23の操作により、探索範囲SRRの位置を簡単に調整することができる。なお、位置調整ボタン22、23の各々を押したときの探索範囲SRRの移動単位を50〜100msec程度に設定することで、32分音符一つ分の移動に対応することができる。また、この移動単位もユーザが選択できるようにすることも可能である。
【0036】
図7(c)は、図7(b)の状態から、更に周期調整ボタン25が押し下げ操作された場合を示す。この場合、探索範囲SRRは、その中心位置が一定のまま、その幅が広がる。図7(d)は、図7(c)の状態から、更に周期調整ボタン24が押し下げ操作された場合を示す。この場合、探索範囲SRRは、その中心位置が一定のまま、その幅が狭まる。このような周期調整ボタン24、25の操作により、音源のテンポにあわせた繰り返し周期を選択することが可能となる。
【0037】
図8(a)〜図8(d)を参照して、図7に示した探索範囲SRRの調整により、リピートバッファ41へ抽出する探索範囲SRRが、一時バッファ40の範囲を超えた場合の処理手順を説明する。図8(a)は、帯状に連続する音声データSNDのイメージを示す。リピート切替ボタン21が操作されて、繰り返し再生モードが開始されると、先ず、図8(b)に示すように、リピート切替ボタン21が操作された時刻(中心時刻CT1)を中心とする前後数秒間の範囲の音声データが一時バッファ40にコピーされ、中心時刻CT1を中心とする前後100msec程度の探索範囲の音声データがリピートバッファ41に抽出される。この状態から位置調整ボタン22が続けて操作されて、探索範囲SRR1が一時バッファ40の一端(左端)に達した場合、図8(c)に示すように、デコーダ44は、一時バッファ40の左端の時刻に中心時刻CT2を設定し直して、中心時刻CT2の前後数秒間を再度、復号して一時バッファ40にコピーする。
【0038】
一方、位置調整ボタン23が続けて操作されて、探索範囲SRR1が一時バッファ40の他端(右端)に達した場合、図8(d)に示すように、デコーダ44は、一時バッファ40の右端の時刻に中心時刻CT3を設定し直して、中心時刻CT3の前後数秒間を再度、復号して一時バッファ40にコピーする。
【0039】
以上説明したように、第1の実施の形態によれば、以下の作用効果が得られる。
【0040】
音声再生装置は、ユーザーの入力操作により選択された時点を含む探索範囲SRRの中から、音声データが示す信号の振幅がゼロになるゼロクロス点を2つ検出し、2つのゼロクロス点の間の音声データを繰り返し再生する。これにより、より短い区間で、良好に繰り返し再生することができる。また、繰り返し再生する区間を一小節よりも短い単位、例えば数10msec単位で設定することができる。よって、速い演奏における音符を逐一追跡することができる。また、図7及び図8に示したように、単純なインターフェースで前後の音符へ移動することができるので、一音毎の音符の追跡が可能となる。
【0041】
例えば、4分音符=120のとき1小節は2sec、32分音符は62.5msecに相当する。したがって、32分音符で演奏された楽音を32分音符単位で繰り返し再生することができるので、32分音符を逐一追跡することができる。
【0042】
また、クロスフェード部48が、2つのゼロクロス点ZCP1、ZCP2をそれぞれ始点とする所定のクロスフェード領域CFR1、CFR2の音声データをクロスフェードさせ、リピート処理部49が、クロスフェードされた2つのゼロクロス点の間の音声データを繰り返し再生する。これにより、2つのゼロクロス点ZCP1、ZCP2の間がスムーズに繋がるようになり、リピートバッファ41に記憶された探索範囲SRRの音声データから、繰り返しに最も適当な部分を検出することができる。
【0043】
リピートバッファ41は、入力操作により選択された時点(中心時刻CT)を中心とした探索範囲SRRの音声データを記憶し、ゼロクロス点検出部45は、探索範囲SRRの中心を境にして探索範囲を2分割した前半部分F41および後半部分S41の中から、ゼロクロス点CFR1、CFR2を1つずつ検出する。これにより、入力操作により選択された時点(中心時刻CT)は、2つのゼロクロス点ZCP1、ZCP2の選び方に関わらず、2つのゼロクロス点ZCP1、ZCP2の間に必ず位置するようになる。よって、ユーザが任意に選択した時点を含む音声データを繰り返し再生することができる。
【0044】
(第2の実施の形態)
図3に示すように、第2の実施の形態に係わる音声再生装置は、CPU6により実現される機能として、デコーダ44、ゼロクロス点検出部45、クロスフェード部48、及びリピート処理部49に加えて、包絡線検出部46及び安定区間検出部47を更に備える。
【0045】
図9(a)及び図9(b)に示すように、包絡線検出部46は、探索範囲SRRの音声データが示す信号SGの包絡線THLを検出する。ここで、「包絡線THL」とは、振幅が周期的に振動する信号SGの極大値群又はその近傍に接する曲線、或いは極小値群又はその近傍に接するような曲線である。図9(b)では、信号SGの極大値群又はその近傍に接する曲線を包絡線THLの一例として示している。
【0046】
安定区間検出部47は、探索範囲SRRの中から、包絡線THLの傾きが閾値以下となる安定区間SFLを検出する。具体的に、リピートバッファ信号SGの包絡線THLを数msec程度の時定数で求め、包絡線THLの傾きが連続して小さくなる範囲を安定区間SFLとして選択する。そして、ゼロクロス点検出部45は、図6を参照して説明したデータ処理方法と同様にして、図6における探索範囲SRRの代わりに安定区間SFLの中から、2つのゼロクロス点ZCP1、ZCP2を検出する。これにより、安定区間SFL内から繰り返し信号範囲RPLが選択されるので、アタックのように急激に振幅が変化する部分を繰り返し信号範囲RPLから除外し、繰り返し再生される音が不快なノイズのような音となることを抑制できる。
【0047】
なお、第2の実施の形態に係わる音声再生装置のハードウェア構成及び入力操作部5の詳細構成は、図1及び図2に示した構成と同じであるため、詳細な説明を省略する。
【0048】
以上説明したように、包絡線検出部46が、探索範囲SRRの音声データが示す信号SGの包絡線THLを検出し、安定区間検出部47が、探索範囲SRRの中から、包絡線THLの傾きが閾値以下となる安定区間SFLを検出する。そして、ゼロクロス点検出部45は、安定区間SFLの中から、2つのゼロクロス点ZCP1、ZCP2を検出する。これにより、繰り返し再生される音が不快なノイズのような音となることを抑制できる。
【0049】
いくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、これら実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。
【符号の説明】
【0050】
5…入力操作部
41…リピートバッファ(記憶部)
45…ゼロクロス点検出部
46…包絡線検出部
47…安定区間検出部
48…クロスフェード部
49…リピート処理部
CFR1、CFR2…クロスフェード領域
CT…中心時刻(音声データ再生中の任意の時点)
F41…前半部分
PF…音声データ
S41…後半部分
SFL…安定区間
SG…信号(音声データが示す信号)
SRR…探索範囲
THL…包絡線
ZCP1、ZCP2…ゼロクロス点

【特許請求の範囲】
【請求項1】
音声データ再生中の任意の時点を選択する入力操作を受け付ける入力操作部と、
前記入力操作により選択された前記時点を含む探索範囲の音声データを記憶する記憶部と、
前記探索範囲の音声データを用いて、前記探索範囲の中から前記音声データが示す信号が立ち上がっている途中において振幅がゼロになるゼロクロス点を2つ、または、前記音声データが示す信号が立ち下がっている途中において振幅がゼロになるゼロクロス点を2つ検出するゼロクロス点検出部と、
検出した2つのゼロクロス点の間の音声データを繰り返し再生するリピート処理部と
を備える音声再生装置。
【請求項2】
請求項1に記載された音声再生装置であって、
前記探索範囲の音声データが示す信号の包絡線を検出する包絡線検出部と、
前記探索範囲の中から、前記包絡線の傾きが閾値以下となる安定区間を検出する安定区間検出部とを更に備え、
前記ゼロクロス点検出部は、前記安定区間の中から、前記2つのゼロクロス点を検出する
ことを特徴とする音声再生装置。
【請求項3】
請求項1又は2に記載された音声再生装置であって、
前記2つのゼロクロス点をそれぞれ始点とする所定のクロスフェード領域の音声データをクロスフェードさせるクロスフェード部を更に備え、
前記リピート処理部は、クロスフェードされた前記2つのゼロクロス点の間の音声データを繰り返し再生する
ことを特徴とする音声再生装置。
【請求項4】
請求項1〜3のいずれか一項に記載の音声再生装置であって、
前記記憶部は、前記入力操作により選択された前記時点を中心とした前記探索範囲の音声データを記憶し、
前記ゼロクロス点検出部は、前記探索範囲の中心を境にして前記探索範囲を2分割した前半部分および後半部分の中から、前記ゼロクロス点を1つずつ検出する
ことを特徴とする音声再生装置。
【請求項5】
音声データ再生中の任意の時点を選択する入力操作を受け付け、
前記入力操作により選択された前記時点を含む探索範囲の音声データを記憶し、
前記探索範囲の音声データを用いて、前記探索範囲の中から前記音声データが示す信号が立ち上がっている途中において振幅がゼロになるゼロクロス点を2つ、または、前記音声データが示す信号が立ち下がっている途中において振幅がゼロになるゼロクロス点を2つ検出し、
検出した2つのゼロクロス点の間の音声データを繰り返し再生する
ことを特徴とする音声再生方法。
【請求項6】
コンピュータに、
音声データ再生中の任意の時点を選択する入力操作を受け付ける手順と、
前記入力操作により選択された前記時点を含む探索範囲の音声データを前記コンピュータが備える記憶部に記憶させる手順と、
前記記憶部に記憶された前記探索範囲の音声データを用いて、前記探索範囲の中から前記音声データが示す信号が立ち上がっている途中において振幅がゼロになるゼロクロス点を2つ、または、前記音声データが示す信号が立ち下がっている途中において振幅がゼロになるゼロクロス点を2つ検出する手順と、
検出した2つのゼロクロス点の間の音声データを繰り返し再生する手順と
を実行させるためのプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公開番号】特開2013−50596(P2013−50596A)
【公開日】平成25年3月14日(2013.3.14)
【国際特許分類】
【出願番号】特願2011−188745(P2011−188745)
【出願日】平成23年8月31日(2011.8.31)
【出願人】(308036402)株式会社JVCケンウッド (1,152)
【Fターム(参考)】