説明

音声信号記録再生装置

【課題】AM/FMチューナ内臓のラジオ受信機等において、ニュース番組や語学番組を無音部でファイルに自動分割して記憶媒体に記憶する。
【解決手段】音声信号レベル比較部12で入力音声信号レベルを所定レベルと比較して無音部を検出する。制御部16は、無音部が一定時間継続し、かつ、その直前の音声部が一定時間継続して存在する場合に、当該無音部でファイルに分割して記憶媒体22に記憶する。ファイルの先頭に強制的に無音データあるいはインデックスデータを付加し、かつ、ファイルの先頭をフェードイン処理してもよい。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は音声信号記録再生装置、特に入力音声信号の無音部を検出して分割する装置に関する。
【背景技術】
【0002】
従来より、入力音声信号の無音部を検出して複数のファイルに分割し、記憶媒体に記憶する技術が知られている。例えば、下記に示す特許文献1には、音声信号のレベルを予め決めたレベルと比較することで音声信号の無音部を判別し、無音部で音声信号を複数の通話ファイルに分割してデータ記録部に記録することが開示されている。
【0003】
また、特許文献2には、音声データの始端や終端を自動的に検出し、フェードイン処理またはフェードアウト処理を施す技術が開示されている。
【0004】
【特許文献1】特開2001−285461号公報
【特許文献2】特開2001−228887号公報
【発明の開示】
【発明が解決しようとする課題】
【0005】
しかしながら、単に入力音声信号の無音部を検出し、検出した無音部で複数のファイルに分割する構成では、例えばニュース番組において、本来であれば一連のニュース記事としてまとまりがあるにもかかわらず、その途中で無音部が存在するために分割記録してしまう等の問題があった。無音部か否かは、無音状態が一定時間継続するか否かに基づき判定できるが、例え一定時間継続する無音部であってもコンテクストから異なるファイルに分割すべきでない場合も存在し得るものであり、このような場合に分割してしまうとファイル再生中に途中で音声で途切れる、あるいはファイル選択時にセンテンスの途中から開示される等の問題が生じ、ユーザが別途、ファイルを編集ないし加工する必要が生じてしまう。
【0006】
さらに、各ファイルを再生する際にその先頭をフェードイン処理して再生する場合、音楽データを記録するファイルであれば問題ないが、ニュース記事等においてはフェードイン処理により先頭の音声が聞き取りにくくなる問題が生じる。
【0007】
本発明の目的は、入力音声信号を自動的に複数のファイルに分割して再生時におけるユーザの便宜、すなわちランダムアクセスを可能とし、また、フェードイン処理が行われても音声信号が途切れることなく再生できる装置を提供することにある。
【課題を解決するための手段】
【0008】
本発明は、入力音声信号の無音部を検出する無音検出手段と、前記無音部が第1の一定時間以上継続しているか否かを判定する第1判定手段と、前記無音部が第1の一定時間以上継続していると判定された場合に、前記無音部の直前の音声部が第2の一定時間以上継続しているか否かを判定する第2判定手段と、前記音声部が第2の一定時間以上継続していると判定された場合に、前記入力音声信号を前記無音部でファイルに分割して記憶媒体に記憶する分割手段と、ユーザ操作可能な操作手段と、前記操作手段からの操作信号に応じ、前記記憶媒体に記憶された入力音声信号を前記ファイル単位で再生する再生手段とを有する。
【0009】
本発明では、単に無音部を検出してファイルに分割するのではなく、無音部が一定時間以上継続して存在するか、及び、無音部の直前の音声部が一定時間以上継続して存在するか、に応じて入力音声信号をファイルに分割して記憶媒体に記憶する。すなわち、無音部が一定時間以上継続し、かつ、その直前の音声部が一定時間以上継続して存在する場合にファイルに分割することで、簡易な構成でセンテンス途中でのファイル分割を抑制できる。
【0010】
本発明において、分割された各ファイルの先頭に所定時間継続する無音データあるいは音声インデックスデータを付加することで、ファイル再生時のフェードイン処理を行っても本来の音声データへの影響を抑制できる。
【発明の効果】
【0011】
本発明によれば、入力音声信号を自動的に複数のファイルに分割して再生時におけるユーザの便宜、すなわちランダムアクセスを可能とできる。また、フェードイン処理が行われても音声信号が途切れることなく再生することができる。
【発明を実施するための最良の形態】
【0012】
以下、図面に基づき本発明の実施形態について、ラジオ受信機を例にとり説明する。
【0013】
図1に、本実施形態に係る音声信号記録再生装置の構成ブロック図を示す。本実施形態においては、音声信号記録再生装置は、AM/FMチューナを内蔵するラジオ受信機として機能する。
【0014】
AM/FMチューナ10は、AMあるいはFMラジオ放送を受信し、受信した音声信号を音声信号レベル比較部12および音声処理部14に出力する。
【0015】
音声信号レベル比較部12は、AM/FMチューナ10からの入力音声信号を所定のレベルと比較し、比較結果を制御部16に出力する。本実施形態において、音声信号レベル比較部12にて入力音声信号のレベルが所定のレベル以上である場合に音声部、所定のレベルより小さい場合に無音部と判定する。音声信号レベル比較部12は、入力音声信号のレベルが所定のレベルより小さい場合にのみその旨の信号あるいはフラグを制御部16に出力してもよい。入力音声信号レベルが所定のレベル以上である場合に特定の信号あるいはフラグを出力してもよい。
【0016】
音声処理部14は、入力音声信号をデジタル信号に変換し、さらにWAVやMP3などの音声データフォーマットで圧縮して制御部16に出力する。また、音声処理部14は、制御部16から供給される音声信号、具体的には後述する記憶媒体22から読み出された音声信号を伸長して音声出力部24に出力し音声信号として再生する。
【0017】
制御部16は、音声信号レベル比較部12からの比較結果と音声処理部14からの圧縮デジタル音声データとを入力し、音声信号レベル比較部12における比較結果に応じて圧縮音声データを記録再生制御部20を介して記憶媒体22に記憶する。制御部16は、入力音声信号の無音部を検出し、この無音部が一定時間T0以上継続しているか否かを判定する。無音部が一定時間T0以上継続している場合に、ファイル単位に分割し得る有意の無音部が存在すると判定し、入力音声信号をファイルに分割して記憶媒体22に記憶する。但し、制御部16は、たとえ無音部が一定時間T0以上継続している場合であっても、当該無音部の直前に存在する音声部の継続時間が一定時間T1以上継続していない場合にはファイル分割処理を実行しない。したがって、この場合には当該無音部、直前の音声部、直後の音声部を含めて一つのファイルとしてまとまって記憶される。すなわち、制御部16は、無音部が一定時間以上継続して存在するか否かの判定、及び無音部の直前に一定時間以上継続して存在する音声部が存在するか否かの判定の2つの判定を実行し、これら2つの判定結果に応じてファイル分割の可否を決定する。
【0018】
記憶媒体22は、USBメモリやフラッシュメモリ等の公知の半導体メモリで構成され、制御部16にて複数のファイルに分割された入力音声信号をファイル単位で記憶する。記憶フォーマットも公知であり、例えばファイル管理部とデータ記憶部とを有し、ファイル管理部に分割された各ファイルの識別データIDやファイル属性等が記憶され、データ記憶部にファイル毎に分割された入力音声データが記憶される。
【0019】
操作部18は、ユーザ操作可能な操作部であり、タッチスイッチや操作ボタン、操作レバー等、任意の形態を含む。ユーザは、操作部18を操作することにより、所望のファイルの再生指示を入力する。制御部16は操作部18からの操作信号に応じ、記憶媒体22から該当ファイルを読み出して音声処理部14に供給する。音声処理部14は、該当ファイルを伸長して音声出力部24に出力する。ハードディスクやフラッシュメモリを内蔵し、ネットワークあるいはCDなどの可搬媒体から入力した音声データを記憶し、ユーザの操作に応じて音楽データを再生出力するオーディオプレイヤが知られている。これらのオーディオプレイヤにおいては、ユーザは再生ボタンを操作することにより音楽データを再生でき、早送りボタンあるいは後戻しボタンを操作することにより次の曲あるいは直前の曲の頭出しを行うことができる。本実施形態においては、AM/FMラジオにおけるニュース番組や語学番組がその無音部で自動的に分割されて複数のファイルとして記憶媒体22に記憶される。例えば、ニュース番組の場合、アナウンサは複数の記事を読み上げる際、各記事の間に所定の間をおいて読み上げる。したがって、本実施形態において、ニュース番組の各記事ごとにファイルに自動分割されて記憶媒体22に記憶されることとなり、ユーザはオーディオプレイヤにおける早送りボタンや後戻りボタンの操作により、任意の曲の頭出しを行うのと同様の操作により、順次、所望のニュース記事を再生することが可能となる。
【0020】
図2に、本実施形態における入力音声信号のファイル分割の概念構成が示されている。図2(a)に示すように、入力音声信号が音声部(有音部)と無音部から構成されるものとする。音声部100に続き無音部102が存在し、無音部102が一定時間T0以上継続して存在する場合には、図2(b)に示すように、この無音部102で音声部100が一つのファイルとして分割され記憶媒体22に記憶される。すなわち、音声部100と、無音部102のうち一定時間T0分の無音データとが一つのファイル1に分割されて記憶される。ファイル1の終端に存在する無音部102の一部を除去して記憶媒体22に記憶してもよい。無音部102に続き、音声部104及び無音部106が存在する場合、同様に無音部106が一定時間T0以上継続する場合に音声部104が別のファイルとして分割され記憶媒体22に記憶される。図2(b)において、音声部100を含むファイルをファイル1、音声部104を含むファイルをファイル2として示している。各ファイルの識別データIDとして機能するインデックスナンバーは、音声部を新たに検出するたびにカウンタをインクリメントして得られる。
【0021】
無音部106に続き、音声部108及び無音部110が存在し、無音部110も一定時間T0以上継続しているが、無音部110の直前の音声部108が一定時間T1以上継続していない場合には、無音部110は有意の無音部ではないと判定し、ファイル分割は行わない。無音部110に続き音声部112及び無音部114が存在し、無音部114が一定時間T0以上継続し、かつ、無音部114直前のトータルの音声部(この場合には音声部108と音声部112とを合わせた区間)が一定時間T1以上である場合にファイルを分割してファイル3とする。無音部110にてファイルを分割すると、音声部108を含むファイルが形成されるが、ニュース記事において音声部108が短すぎ、意味のあるフレーズあるいはセンテンスとして成立しないおそれがあるが、このように音声部の継続時間、あるいは分割されるファイルの最小単位を確保することで、意味のあるファイルに分割することが可能である。音声部の最小継続時間T1はユーザが操作部18から入力して制御部16のメモリに記憶させる他、予め制御部16のメモリにデフォルト値として記憶していてもよい。最小継続時間T1は例えば30秒である。無音部の有意を判定するための一定時間T0は例えば2秒に設定される。
【0022】
図3に、本実施形態におけるファイル分割の処理フローチャートを示す。まず、入力音声信号レベルが所定レベル以上であるか否かを判定する(S101)。所定レベルは、音声信号記録再生装置のメモリに予めデフォルト値として記憶してもよく、あるいはユーザが操作部18を介して設定可能としてもよい。FM放送のニュース番組等においては、音声のニュース記事の背景にBGMが存在する場合もある。所定レベルが低く設定されている場合、BGMの存在によりニュース記事を複数のファイルに分割できないおそれがあるが、このような場合にはユーザがBGMのレベルに応じた所定レベルを設定することで、BGMの存在にかかわらず無音部を検出してニュース記事をファイルに分割することができる。ラジオ局毎、あるいはラジオ番組毎の所定レベルを制御部16のメモリに記憶しておき、記憶媒体22に記憶すべきラジオ局あるいはラジオ番組に対応する所定レベルをメモリから読み出して設定してもよい。
【0023】
音声信号レベルが所定レベルより小さいとして無音部が検出された場合、検出した無音部が一定時間T0以上継続して存在するか否かを判定する(S102)。無音部が一定時間T0以上継続しない場合には、ファイル分割するのに適当でないとして分割処理を行わない。一方、無音部が一定時間T0以上継続する場合には、さらに、この無音部の直前の音声部(分割されていないトータルの音声部)が一定時間T1以上継続しているか否かを判定する(S103)。この判定は、例えば音声部の始端と同時にタイマをスタートさせ、S101にて音声信号レベルが所定レベルより小さいと検出された時点でタイマをストップさせて得られる時間をT1と大小比較すればよい。無音部が一定時間T0以上継続していても、その直前の音声部が一定時間T1以上継続していない場合には、ファイル分割を行わない。直前の音声部が一定時間T1以上継続している場合のみ、S101で検出された無音部でファイル分割する(S104)。S104の処理は、分割されるべきファイルの最小時間あるいは最小データ長を確保する処理ということもできる。ファイル分割時には、ファイルカウンタのカウンタ値を1だけインクリメントし(S105)、記憶媒体22のファイル管理部に登録する。
【0024】
以上のようにして、入力音声信号が複数のファイルに自動分割されて記憶媒体22に記憶される。例えばニュース番組において、10個のニュース記事が読み上げられた場合、合計10個のファイルが分割して記憶される。各ファイルにはインデックスナンバが付加されており、ユーザは操作部18を操作することで、任意のファイルをランダムに再生出力することができる。
【0025】
なお、音声信号記録再生装置が音楽データを再生する機能を有し、従来技術のようにそれぞれの曲の先頭部をフェードイン処理して再生する機能を有する場合、ニュース記事ファイルの先頭部がフェードイン処理により途切れてしまい音声が聞き取りにくい事態が生じ得る。
【0026】
そこで、図4に示すように、制御部16は、入力音声信号を無音部で複数のファイルに自動分割するとともに、分割された各ファイルの先頭に所定時間継続する無音データを強制的に付加して記憶媒体22に記憶してもよい。図4(b)において、図2と同様に入力音声信号が複数のファイル1,2,3に分割され、その後、ファイル1に無音データ200が付加され、ファイル2に無音データ202が付加され、ファイル3に無音データ204が付加される。各ファイル1〜3の先頭に強制的に所定時間継続する無音データを付加することで、図5に示すように、各ファイルの先頭を出力0%から出力100%まで順次出力を増大させるフェードイン処理を実行しても、各ファイルの先頭に強制的に付加された無音データ部分においてフェードイン処理が完了する結果、本来の音声部ではフェードイン処理されず、出力100パーセントの状態から再生出力される。したがって、フェードイン処理されていても、本来の音声が途切れることなく再生される。無音データ200、202、204の継続時間あるいはデータ長は、フェードイン処理に要する時間と略同一に設定される。
【0027】
図4においては、自動分割された各ファイル1、2、3の先頭に無音データ200、202、204を付加しているが、無音データではなく他のデータ(ダミーデータを含む)を付加してフェードイン処理による音切れを抑制することも可能である。
【0028】
例えば、図6に示すように、自動分割した各ファイルの先頭に音声のインデックスデータを付加してもよい。この音声インデックスデータは、図3のS105の処理で設定された各ファイルの識別データIDを音声データとして付加したものである。図6(b)においては、「インデックス1」なる音声データが付加されている。音声インデックスデータが付加されたファイルを再生すると、「インデックス1」なる音声に続き本来の音声データが再生される。音声インデックス部ではフェードイン処理が施される結果、「インデックス1」の部分がフェードインで再生され、本来の音声部がそれに引き続いて音声出力される。以上の処理により、ファイルの先頭がフェードイン処理される装置構成においても、先頭音声が聞き取りにくくなる事態を確実に解消できる。
【0029】
本実施形態において、記憶媒体22としてUSBフラッシュオーディオプレ−ヤを用いることもできる。この場合、図1において制御部16とUSBフラッシュオーディオプレーヤはUSB端子を介して接続される。USBフラッシュオーディオプレーヤは各種の製品が市販されているが、早送り再生/巻き戻し再生機能がなく、前曲/次曲への送り/戻しボタンしかない場合が多い。このようなUSBフラッシュオーディオプレーヤであっても、本実施形態ではラジオ番組のコンテンツを自動的にファイルに分割してUSBフラッシュオーディオプレーヤにダウンロードできるので、擬似的な早送り/巻き戻し再生できる利点がある。
【図面の簡単な説明】
【0030】
【図1】実施形態に係る音声信号記録再生装置の構成ブロック図である。
【図2】実施形態における入力音声信号のファイル分割説明図である。
【図3】実施形態のファイル分割処理フローチャートである。
【図4】他の実施形態におけるファイル分割説明図である。
【図5】無音部分におけるフェードイン処理説明図である。
【図6】音声インデックス部分におけるフェードイン説明図である。
【符号の説明】
【0031】
10 AM/FMチューナ、12 音声信号レベル比較部、14 音声処理部、16 制御部、18 操作部、20 記録再生制御部、22 記憶媒体、24 音声出力部。

【特許請求の範囲】
【請求項1】
入力音声信号の無音部を検出する無音検出手段と、
前記無音部が第1の一定時間以上継続しているか否かを判定する第1判定手段と、
前記無音部が第1の一定時間以上継続していると判定された場合に、前記無音部の直前の音声部が第2の一定時間以上継続しているか否かを判定する第2判定手段と、
前記音声部が第2の一定時間以上継続していると判定された場合に、前記入力音声信号を前記無音部でファイルに分割して記憶媒体に記憶する分割手段と、
ユーザ操作可能な操作手段と、
前記操作手段からの操作信号に応じ、前記記憶媒体に記憶された入力音声信号を前記ファイル単位で再生する再生手段と、
を有することを特徴とする音声信号記録再生装置。
【請求項2】
請求項1記載の装置において、
前記分割手段は、前記ファイルの先頭に所定時間継続する無音データを付加して前記記憶媒体に記憶することを特徴とする音声信号記録再生装置。
【請求項3】
請求項1記載の装置において、
前記分割手段は、前記ファイルの先頭に所定時間継続する音声インデックスデータを付加して前記記憶媒体に記憶することを特徴とする音声信号記録再生装置。
【請求項4】
請求項2、3のいずれかに記載の装置において、
前記所定時間は、前記再生手段で前記ファイルを再生する際のフェードイン時間と略同一時間に設定されることを特徴とする音声信号記録再生装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2006−308993(P2006−308993A)
【公開日】平成18年11月9日(2006.11.9)
【国際特許分類】
【出願番号】特願2005−133383(P2005−133383)
【出願日】平成17年4月28日(2005.4.28)
【出願人】(000003676)ティアック株式会社 (339)
【Fターム(参考)】