録音装置
【課題】楽曲開始の検出精度を向上させることができる録音装置を提供する。
【解決手段】音声信号から所定帯域を抽出するフィルタ部(バンドパスフィルタ部10)と、前記フィルタ部から出力される前記所定帯域の音声信号に対応する前記所定帯域の音声パワーの平均値を算出するパワー算出部(パワー算出部10)と、前記パワー算出部によって算出された前記所定帯域の音声パワーの平均値に基づいて、楽曲の開始を検出する楽曲開始検出部(楽曲開始終了検出部12)とを備え、前記フィルタ部を通過していない音声信号を記録媒体(ICメモリ5)に録音する録音部(記録再生部4)とを備える録音装置。
【解決手段】音声信号から所定帯域を抽出するフィルタ部(バンドパスフィルタ部10)と、前記フィルタ部から出力される前記所定帯域の音声信号に対応する前記所定帯域の音声パワーの平均値を算出するパワー算出部(パワー算出部10)と、前記パワー算出部によって算出された前記所定帯域の音声パワーの平均値に基づいて、楽曲の開始を検出する楽曲開始検出部(楽曲開始終了検出部12)とを備え、前記フィルタ部を通過していない音声信号を記録媒体(ICメモリ5)に録音する録音部(記録再生部4)とを備える録音装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声信号を録音する録音装置に関する。
【背景技術】
【0002】
ICレコーダ等の録音装置は、例えば、インタビューや会話等の録音、会議等の録音、講義等の録音、楽曲や楽器伴奏のない声楽等の録音に利用される。なお、本明細書において、「楽曲」とは、楽器の演奏があるものを意味する。
【0003】
従来の録音装置には、マイクロホン等によって得られた音声信号を解析し、音声信号のレベルが予め設定された閾値以上になったときに自動的に録音を開始し、音声信号のレベルが予め設定された閾値を下回ると録音が自動的に停止する自動録音機能を搭載したものがある。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2006−277855号公報(段落0025)
【特許文献2】特開平10−116099号公報(要約、段落0041)
【発明の概要】
【発明が解決しようとする課題】
【0005】
上記の自動録音機能を搭載した従来の録音装置は、音声信号全体のレベルのみで自動録音の開始タイミングを判断しているため、ノイズ(例えば屋外における風の音など)によって誤って自動録音を開始してしまうおそれがあり、楽曲の自動録音に不向きであった。
【0006】
なお、特許文献1では、放送の音声信号から音楽部分を抽出して録音する録音装置が開示されている。そして、特許文献1では、音楽の開始位置を抽出する方法として、音量レベルが所定レベル以下の状態が一定時間継続している箇所を音楽の開始位置として抽出する方法のみが例示されている。このような音楽の開始位置抽出方法は、例えば、屋外において風の音が発生している状況下で実演されている楽曲を自動録音することができないという問題を有している。
【0007】
また、特許文献2では、音声入力感度に応じてデジタル信号処理部内のバンドパスフィルタのフィルタ特性を可変し、当該デジタル信号処理部に入力する音声信号の周波数帯域を制限する音声起動録音装置が開示されている。特許文献2で開示されている音声起動録音装置は、デジタル信号処理部によってデジタル信号に圧縮した音声データを半導体メモリ部に記録するので、音声入力感度に応じて帯域制限された音声データを記録することになり、楽曲を自動録音する場合に楽曲本来の音を記録することができないという問題を有している。
【0008】
本発明は、上記の状況に鑑み、楽曲開始の検出精度を向上させることができる録音装置を提供することを目的とする。
【課題を解決するための手段】
【0009】
上記目的を達成するために本発明に係る録音装置は、音声信号から所定帯域を抽出するフィルタ部と、前記フィルタ部から出力される前記所定帯域の音声信号に対応する前記所定帯域の音声パワーの平均値を算出するパワー算出部と、前記パワー算出部によって算出された前記所定帯域の音声パワーの平均値に基づいて、楽曲の開始を検出する楽曲開始検出部と、前記フィルタ部を通過していない音声信号を記録媒体に録音する録音部とを備える構成(第1の構成)とする。
【0010】
また、上記第1の構成の録音装置において、前記所定帯域が変更可能である構成(第2の構成)としてもよい。
【0011】
また、上記第1の構成または第2の構成の録音装置において、前記楽曲開始検出部が楽曲の開始を検出したときに、前記録音部が自動的に録音を開始又は再開する構成(第3の構成)にしてもよい。
【0012】
また、上記第1の構成または第2の構成の録音装置において、前記録音部が、前記楽曲開始検出部によって検出された楽曲の開始の位置を示す楽曲開始インデックスを、前記記録媒体に録音する音声信号に関連付けて前記記録媒体に記録する構成(第4の構成)にしてもよい。
【0013】
また、上記第1〜第4のいずれかの構成の録音装置において、前記楽曲開始検出部が、前記パワー算出部によって算出された前記所定帯域の音声パワーの平均値が閾値以上になったときに、楽曲が開始されたと判定するようにしてもよい。
【0014】
また、上記第1〜第4のいずれかの構成の録音装置において、前記楽曲開始検出部が、前記パワー算出部によって算出された前記所定帯域の音声パワーの平均値が所定時間の間閾値以上であれば、その所定時間の開始時点を楽曲の開始位置とするようにしてもよい。
【発明の効果】
【0015】
本発明に係る録音装置によると、音声信号から所定帯域を抽出するフィルタ部と、前記フィルタ部から出力される前記所定帯域の音声信号に対応する前記所定帯域の音声パワーの平均値を算出するパワー算出部と、前記パワー算出部によって算出された前記所定帯域の音声パワーの平均値に基づいて、楽曲の開始を検出する楽曲開始検出部とを備えるので、前記所定帯域をノイズが小さく、楽曲の出力が大きい周波数帯域に設定することで、ノイズによって楽曲開始が誤検出されなくなり、楽曲開始の検出精度を向上させることができる。
【0016】
また、本発明に係る録音装置によると、前記フィルタ部を通過していない音声信号を記録媒体に録音する録音部を備えるので、楽曲本来の音を録音することができるという利点を有している。
【図面の簡単な説明】
【0017】
【図1】本発明の第1,3,4実施形態に係る録音装置の構成を示すブロック図である。
【図2】楽曲の自動録音モードに設定されている場合の本発明の第1実施形態に係る録音装置の録音動作を示すフローチャートである。
【図3】音声波形及び音声パワーの平均値のタイムチャートである。
【図4】本発明の第2実施形態に係る録音装置の構成を示すブロック図である。
【図5】楽曲の自動録音モードに設定されている場合の本発明の第2実施形態に係る録音装置の録音動作を示すフローチャートである。
【図6】音声波形及び音声パワーの平均値のタイムチャートである。
【図7】楽曲検出モードに設定されている場合の本発明の第3実施形態に係る録音装置の録音動作を示すフローチャートである。
【図8】音声波形及び音声パワーの平均値のタイムチャートである。
【図9】楽曲検出モードに設定されている場合の本発明の第4実施形態に係る録音装置の録音動作を示すフローチャートである。
【図10】音声波形及び音声パワーの平均値のタイムチャートである。
【図11】本発明に係る録音装置が備えるCPUの一変形例を示す図である。
【図12】本発明に係る録音装置が備えるCPUの他の変形例を示す図である。
【発明を実施するための形態】
【0018】
本発明の実施形態について図面を参照して以下に説明する。
【0019】
<第1実施形態>
本発明の第1実施形態に係る録音装置の構成を図1に示す。図1に示す本発明の第1実施形態に係る録音装置は、ICレコーダであって、マイクロホン1と、増幅部2と、A/D変換部3と、記録再生部4と、ICメモリ5と、D/A変換部6と、増幅部7と、スピーカ8と、CPU9と、操作部13と、表示部14とを備えている。
【0020】
CPU9は、録音装置内全体の駆動動作を制御している。また、CPU9は、バンドパスフィルタ部10と、パワー算出部11と、楽曲開始終了検出部12とを有している。
【0021】
マイクロホン1は、集音した音声を電気信号である音声信号に変換する。増幅部2は、マイクロホン1から出力される音声信号を増幅する。A/D変換部3は、増幅部2から出力されるアナログ信号をデジタル信号に変換する。A/D変換部3から出力されるデジタル音声信号は、記録再生部4とCPU9とに供給される。
【0022】
記録再生部4は、CPU9からの指示に従って、記録処理(録音処理)や再生処理を実行する。記録再生部4は、記録処理実行時において、A/D変換部3から出力されるデジタル音声信号に対して圧縮符号化処理を施し、その結果得られる圧縮符号化信号をICメモリ5に記録する。また、記録再生部4は、再生処理実行時において、ICメモリ5から読み出した圧縮符号化信号を伸長して復号し、その結果得られるデジタル音声信号をD/A変換部6に出力する。
【0023】
D/A変換部6は、記録再生部4から出力されるデジタル信号をアナログ信号に変換する。増幅部7は、D/A変換部6から出力されるアナログ音声信号を増幅する。スピーカ8は、増幅部7から出力される増幅されたアナログ音声信号に基づいて音声を再生出力する。
【0024】
操作部13は、ユーザの操作内容に応じた操作信号をCPU9に出力する。CUP9は、操作部13から出力される操作信号に基づいて、録音動作、再生動作等の各種動作に関する制御や各種設定を行う。
【0025】
表示部14は、CPU9からの指示に従って、動作状態や各種設定の状態などを表示する。
【0026】
次に、楽曲の自動録音モードに設定されている場合の図1に示す本発明の第1実施形態に係る録音装置の録音動作について、図1及び図2を参照して説明する。図2は、楽曲の自動録音モードに設定されている場合の図1に示す本発明の第1実施形態に係る録音装置の録音動作を示すフローチャートである。
【0027】
まず始めに、CPU9は、操作部13から出力される操作信号を確認して、操作部13の録音キーが押圧されたか否かを判定し(ステップS10)、録音キーが押圧されたと判定すると(ステップS10のYES)、ステップS20に移行する。
【0028】
ステップS20において、CPU9は楽曲の開始を検出する。具体的には、バンドパスフィルタ部10が、A/D変換部3から出力されるデジタル音声信号から所定帯域を抽出し、パワー算出部11が、バンドパスフィルタ部10から出力される所定帯域のデジタル音声信号に対応する所定帯域の音声パワーの平均値を算出し、楽曲開始終了検出部12が、パワー算出部11によって算出された所定帯域の音声パワーの平均値が予め設定された閾値以上であるか否かを判定し、所定帯域の音声パワーの平均値が閾値以上であれば楽曲が開始されたと判定する。
【0029】
所定帯域の音声パワーの平均値が閾値以上であれば(ステップS20のYES)、楽曲開始終了検出部12は、記録再生部4に対して録音開始又は録音再開の指示を出し、その後ステップS60に移行する。
【0030】
一方、所定帯域の音声パワーの平均値が閾値以上でなければ(ステップS20のNO)、CPU9は、操作部13から出力される操作信号を確認して、操作部13の停止キーが押圧されたか否かを判定し(ステップS40)、停止キーが押圧されていないと判定すると(ステップS40のNO)、ステップS20に戻り、停止キーが押圧されたと判定すると(ステップS40のYES)、録音待機状態を解除し(ステップS50)、その後ステップS10に戻る。
【0031】
ステップS60において、CPU9は楽曲の終了を検出する。具体的には、バンドパスフィルタ部10が、A/D変換部3から出力されるデジタル音声信号から所定帯域を抽出し、パワー算出部11が、バンドパスフィルタ部10から出力される所定帯域のデジタル音声信号に対応する所定帯域の音声パワーの平均値を算出し、楽曲開始終了検出部12が、パワー算出部11によって算出された所定帯域の音声パワーの平均値が所定時間の間予め設定された閾値以下であるか否かを判定し、所定帯域の音声パワーの平均値が所定時間の間閾値以下であればその所定時間の開始時点で楽曲が終了したと判定する。なお、ステップS20での閾値とステップS60での閾値とは同じであっても異なっていてもよいが、本実施形態では同一としている。
【0032】
所定帯域の音声パワーの平均値が所定時間の間閾値以下であれば(ステップS60のYES)、楽曲開始終了検出部12は、記録再生部4に対して録音保留(録音の一時停止)の指示を出し(ステップS70)、その後ステップS20に戻る。
【0033】
一方、所定帯域の音声パワーの平均値が所定時間の間閾値以下でなければ(ステップS60のNO)、CPU9は、操作部13から出力される操作信号を確認して、操作部13の停止キーが押圧されたか否かを判定し(ステップS80)、停止キーが押圧されていないと判定すると(ステップS80のNO)、ステップS60に戻り、停止キーが押圧されたと判定すると(ステップS80のYES)、録音を停止し(ステップS90)、その後ステップS10に戻る。
【0034】
上記のような録音動作により楽曲開始の検出精度を向上させることができることを、図3を参照して説明する。なお、図3中のTはステップS60での所定時間を示している。ノイズが小さく、楽曲の出力が大きい周波数帯域をバンドパスフィルタ部10が上記の所定帯域として抽出するように、バンドパスフィルタ部10の特性を設定する。かかる設定により、図3に示すように、バンドパスフィルタ部10から出力される所定帯域のデジタル音声信号に対応する所定帯域の音声波形ではノイズ部分の振幅が小さくなる。その結果、最初の二つのノイズ部分において、楽曲開始が誤検出されなくなり、楽曲開始の検出精度を向上させることができる。したがって、楽曲の自動録音モードにおいて、ノイズによって誤って録音が開始又は再開され、ICメモリ5の容量を無駄に消費することを低減することができ、ICメモリ5の使用効率を向上させることができる。
【0035】
<第2実施形態>
本発明の第1実施形態に係る録音装置よりも楽曲開始の検出精度が高い本発明の第2実施形態に係る録音装置について説明する。本発明の第2実施形態に係る録音装置の構成を図4に示す。なお、図4において図1と同一の部分には同一の符号を付し詳細な説明を省略する。
【0036】
図4に示す本発明の第2実施形態に係る録音装置は、図1に示す本発明の第1実施形態に係る録音装置にFIFO(First-In/First-Out)メモリ15を追加した構成である。FIFOメモリ15は、後述するステップS25での所定時間分の音声信号を記憶することができるリングバッファであって、A/D変換部3と記録再生部4との間に設けられる。A/D変換部3から出力されるデジタル音声信号は、FIFOメモリ15とCPU9とに供給される。
【0037】
また、図4に示す本発明の第2実施形態に係る録音装置と図1に示す本発明の第1実施形態に係る録音装置とでは、楽曲開始終了検出部12での楽曲開始の検出手法が異なっている。
【0038】
図5は、楽曲の自動録音モードに設定されている場合の図4に示す本発明の第2実施形態に係る録音装置の録音動作を示すフローチャートである。なお、図5において図2と同一のステップには同一の符号を付し詳細な説明を省略する。
【0039】
図5のフローチャートは、図2のフローチャートにおいてステップS20をステップS25に置換したものである。
【0040】
ステップS25において、CPU9は楽曲の開始を検出する。具体的には、バンドパスフィルタ部10が、A/D変換部3から出力されるデジタル音声信号から所定帯域を抽出し、パワー算出部11が、バンドパスフィルタ部10から出力される所定帯域のデジタル音声信号に対応する所定帯域の音声パワーの平均値を算出し、楽曲開始終了検出部12が、パワー算出部11によって算出された所定帯域の音声パワーの平均値が所定時間の間予め設定された閾値以上であるか否かを判定し、所定帯域の音声パワーの平均値が所定時間の間閾値以上であればその所定時間の開始時点で楽曲が開始されたと判定する。なお、ステップS25での閾値とステップS60での閾値とは同じであっても異なっていてもよいが、本実施形態では同一としている。また、ステップS25での所定時間とステップS60での所定時間とは同じであっても異なっていてもよいが、本実施形態ではステップS25での所定時間をステップS60での所定時間よりも長くしている。
【0041】
上記のような録音動作により楽曲開始の検出精度を第1実施形態よりも向上させることができることを、図6を参照して説明する。なお、図6中のT1はステップS25での所定時間を示しており、図6中のT2はステップS60での所定時間を示している。ノイズが小さく、楽曲の出力が大きい周波数帯域をバンドパスフィルタ部10が上記の所定帯域として抽出するように、バンドパスフィルタ部10の特性を設定する。かかる設定により、図6に示すように、バンドパスフィルタ部10から出力される所定帯域のデジタル音声信号に対応する所定帯域の音声波形ではノイズ部分の振幅が小さくなる。さらに、所定帯域の音声パワーの平均値が所定時間T1の間閾値以上である場合のみ、楽曲開始を検出する。その結果、最初の二つのノイズ部分のみならず三つ目のノイズ部分においても、楽曲開始が誤検出されなくなり、楽曲開始の検出精度を第1実施形態よりも向上させることができる。
【0042】
<第3実施形態>
本発明の第3実施形態に係る録音装置について説明する。本発明の第3実施形態に係る録音装置のブロック図は、本発明の第1実施形態に係る録音装置のブロック図と同一であり、図1に示すようになる。ただし、本発明の第3実施形態に係る録音装置と本発明の第1実施形態に係る録音装置とでは、記録再生部4及びCPU9の動作が互いに異なる。
【0043】
楽曲検出モードに設定されている場合の図1に示す本発明の第3実施形態に係る録音装置の録音動作について、図1及び図7を参照して説明する。図7は、楽曲検出モードに設定されている場合の図1に示す本発明の第3実施形態に係る録音装置の録音動作を示すフローチャートである。
【0044】
まず始めに、CPU9は、操作部13から出力される操作信号を確認して、操作部13の録音キーが押圧されたか否かを判定し(ステップS110)、録音キーが押圧されたと判定すると(ステップS110のYES)、ステップS120に移行する。
【0045】
ステップS120において、CPU9は、記録再生部4に対して録音開始の指示を出し、その後ステップS130に移行する。
【0046】
ステップS130において、CPU9は楽曲の開始を検出する。具体的には、バンドパスフィルタ部10が、A/D変換部3から出力されるデジタル音声信号から所定帯域を抽出し、パワー算出部11が、バンドパスフィルタ部10から出力される所定帯域のデジタル音声信号に対応する所定帯域の音声パワーの平均値を算出し、楽曲開始終了検出部12が、パワー算出部11によって算出された所定帯域の音声パワーの平均値が予め設定された閾値以上であるか否かを判定し、所定帯域の音声パワーの平均値が閾値以上であれば楽曲が開始されたと判定する。
【0047】
所定帯域の音声パワーの平均値が閾値以上であれば(ステップS130のYES)、楽曲開始終了検出部12は、楽曲の開始位置を示す楽曲開始インデックスを作成し(ステップS140)、その後ステップS160に移行する。楽曲開始インデックスは、例えば楽曲開始時の録音時間を構成要素に含むことで、楽曲の開始位置を示すことが可能となる。
【0048】
一方、所定帯域の音声パワーの平均値が閾値以上でなければ(ステップS130のNO)、CPU9は、操作部13から出力される操作信号を確認して、操作部13の停止キーが押圧されたか否かを判定し(ステップS150)、停止キーが押圧されていないと判定すると(ステップS150のNO)、ステップS130に戻り、停止キーが押圧されたと判定すると(ステップS150のYES)、後述するステップS190に移行する。
【0049】
ステップS160において、CPU9は楽曲の終了を検出する。具体的には、バンドパスフィルタ部10が、A/D変換部3から出力されるデジタル音声信号から所定帯域を抽出し、パワー算出部11が、バンドパスフィルタ部10から出力される所定帯域のデジタル音声信号に対応する所定帯域の音声パワーの平均値を算出し、楽曲開始終了検出部12が、パワー算出部11によって算出された所定帯域の音声パワーの平均値が所定時間の間予め設定された閾値以下であるか否かを判定し、所定帯域の音声パワーの平均値が所定時間の間閾値以下であれば楽曲が終了したと判定する。なお、ステップS130での閾値とステップS160での閾値とは同じであっても異なっていてもよいが、本実施形態では同一としている。
【0050】
所定帯域の音声パワーの平均値が所定時間の間閾値以下であれば(ステップS160のYES)、楽曲開始終了検出部12は、その所定時間の開始時点を楽曲の終了位置とし、その楽曲の終了位置を示す楽曲終了インデックスを作成し(ステップS170)、その後ステップS130に戻る。楽曲終了インデックスは、例えば楽曲終了時の録音時間を構成要素に含むことで、楽曲の終了位置を示すことが可能となる。
【0051】
一方、所定帯域の音声パワーの平均値が所定時間の間閾値以下でなければ(ステップS160のNO)、CPU9は、操作部13から出力される操作信号を確認して、操作部13の停止キーが押圧されたか否かを判定し(ステップS180)、停止キーが押圧されていないと判定すると(ステップS180のNO)、ステップS160に戻り、停止キーが押圧されたと判定すると(ステップS180のYES)、ステップS190に移行する。
【0052】
ステップS190において、CPU9は、録音を停止し、作成した楽曲開始インデックス及び楽曲終了インデックスを記録再生部4に送り、録音された音声信号に関連付けて楽曲開始インデックス及び楽曲終了インデックスを記録再生部4がICメモリ5に書き込むように、記録再生部4を制御し、その後ステップS110に戻る。
【0053】
上記のような録音動作により楽曲開始の検出精度を向上させることができることを、図8を参照して説明する。なお、図8中のTはステップS160での所定時間を示している。ノイズが小さく、楽曲の出力が大きい周波数帯域をバンドパスフィルタ部10が上記の所定帯域として抽出するように、バンドパスフィルタ部10の特性を設定する。かかる設定により、図8に示すように、バンドパスフィルタ部10から出力される所定帯域のデジタル音声信号に対応する所定帯域の音声波形ではノイズ部分の振幅が小さくなる。その結果、最初の二つのノイズ部分において、楽曲開始が誤検出されなくなり、楽曲開始の検出精度を向上させることができる。また、楽曲検出モードにおいて録音が行われると、録音された音声信号に関連付けて楽曲開始インデックス及び楽曲終了インデックスが自動的に記録されるので、再生時の楽曲頭出しやデータ編集時の編集作業が容易になる。
【0054】
<第4実施形態>
本発明の第3実施形態に係る録音装置よりも楽曲開始の検出精度が高い本発明の第4実施形態に係る録音装置について説明する。本発明の第4実施形態に係る録音装置のブロック図は、本発明の第3実施形態に係る録音装置のブロック図と同一であり、図1に示すようになる。ただし、本発明の第4実施形態に係る録音装置と本発明の第3実施形態に係る録音装置とでは、楽曲開始終了検出部12での楽曲開始の検出手法が異なっている。
【0055】
図9は、楽曲検出モードに設定されている場合の図1に示す本発明の第4実施形態に係る録音装置の録音動作を示すフローチャートである。なお、図9において図7と同一のステップには同一の符号を付し詳細な説明を省略する。
【0056】
図9のフローチャートは、図7のフローチャートにおいてステップS130をステップS135に置換したものである。
【0057】
ステップS135において、CPU9は楽曲の開始を検出する。具体的には、バンドパスフィルタ部10が、A/D変換部3から出力されるデジタル音声信号から所定帯域を抽出し、パワー算出部11が、バンドパスフィルタ部10から出力される所定帯域のデジタル音声信号に対応する所定帯域の音声パワーの平均値を算出し、楽曲開始終了検出部12が、パワー算出部11によって算出された所定帯域の音声パワーの平均値が所定時間の間予め設定された閾値以上であるか否かを判定し、所定帯域の音声パワーの平均値が所定時間の間閾値以上であれば、その所定時間の開始時点を楽曲の開始位置とする。そして、ステップS140において、楽曲開始終了検出部12は、その楽曲の開始位置を示す楽曲開始インデックスを作成する。なお、ステップS135での閾値とステップS160での閾値とは同じであっても異なっていてもよいが、本実施形態では同一としている。また、ステップS135での所定時間とステップS160での所定時間とは同じであっても異なっていてもよいが、本実施形態ではステップS135での所定時間をステップS160での所定時間よりも長くしている。
【0058】
上記のような録音動作により楽曲開始の検出精度を第3実施形態よりも向上させることができることを、図10を参照して説明する。なお、図10中のT1はステップS135での所定時間を示しており、図10中のT2はステップS160での所定時間を示している。ノイズが小さく、楽曲の出力が大きい周波数帯域をバンドパスフィルタ部10が上記の所定帯域として抽出するように、バンドパスフィルタ部10の特性を設定する。かかる設定により、図10に示すように、バンドパスフィルタ部10から出力される所定帯域のデジタル音声信号に対応する所定帯域の音声波形ではノイズ部分の振幅が小さくなる。さらに、所定帯域の音声パワーの平均値が所定時間T1の間閾値以上である場合のみ、楽曲開始を検出する。その結果、最初の二つのノイズ部分のみならず三つ目のノイズ部分においても、楽曲開始が誤検出されなくなり、楽曲開始の検出精度を第3実施形態よりも向上させることができる。
【0059】
<その他>
以上、本発明に係る実施形態について説明したが、本発明の範囲はこれに限定されるものではなく、発明の主旨を逸脱しない範囲で種々の変更を加えて実行することができる。変更のいくつかの例を以下に示す。
【0060】
本発明の第1〜第4実施形態の録音装置は、マイクロホン1を内蔵する構成であったが、これに代えてあるいはこれに加えて、外部マイクロホン等との接続が可能な外部音声入力端子を備える構成にしてもよい。
【0061】
また、本発明の第1〜第4実施形態の録音装置は、スピーカ8を内蔵する構成であったが、これに代えてあるいはこれに加えて、外部スピーカ等との接続が可能な外部音声出力端子を備える構成にしてもよい。
【0062】
また、本発明の第1〜第4実施形態の録音装置は、ICメモリ5を内蔵する構成であったが、これに代えてあるいはこれに加えて、外部メモリ(例えばSDカード)が着脱自在に装着されるメモリ装着部を備える構成にしてもよい。また、ICメモリ以外の記録媒体(例えば光ディスク)に音声信号が録音される形態であってもよい。
【0063】
楽曲において演奏されている楽器の種類によって楽曲の出力が大きい周波数帯域は異なるので、バンドパスフィルタ部10の特性が一つに固定されていた場合、様々な楽曲に適切に対応できないおそれがある。そこで、図11に示すCPUの構成例のように、バンドパスフィルタ部10を通過帯域が可変する可変バンドパスフィルタ16とし、操作部13によって設定される楽曲の種類の設定に応じてCPU9が可変バンドパスフィルタ16の通過帯域を変更するようにするようにしてもよい。あるいは、図12に示すCPUの構成例のように、バンドパスフィルタ部10を複数の通過帯域がそれぞれ異なる複数のバンドパスフィルタ17−1〜17−nとバンドパスフィルタ17−1〜17−nを択一的に選択するスイッチ18とで構成し、操作部13によって設定される楽曲の種類の設定に応じてCPU9がスイッチ18の選択先を変更するようにするようにしてもよい。操作部13によって設定される楽曲の種類としては、例えば、「トランペット演奏のある楽曲」、「ドラム演奏のある楽曲」、「ギター演奏のある楽曲」、「ピアノ演奏のある楽曲」などが考えられる。
【符号の説明】
【0064】
1 マイクロホン
2 増幅部
3 A/D変換部
4 記録再生部(録音部の一例)
5 ICメモリ(記録媒体の一例)
6 D/A変換部
7 増幅部
8 スピーカ
9 CPU
10 バンドパスフィルタ部(フィルタ部の一例)
11 パワー算出部
12 楽曲開始終了検出部(楽曲開始検出部の一例)
13 操作部
14 表示部
15 FIFOメモリ
16 可変バンドパスフィルタ
17−1〜17−n バンドパスフィルタ
18 スイッチ
【技術分野】
【0001】
本発明は、音声信号を録音する録音装置に関する。
【背景技術】
【0002】
ICレコーダ等の録音装置は、例えば、インタビューや会話等の録音、会議等の録音、講義等の録音、楽曲や楽器伴奏のない声楽等の録音に利用される。なお、本明細書において、「楽曲」とは、楽器の演奏があるものを意味する。
【0003】
従来の録音装置には、マイクロホン等によって得られた音声信号を解析し、音声信号のレベルが予め設定された閾値以上になったときに自動的に録音を開始し、音声信号のレベルが予め設定された閾値を下回ると録音が自動的に停止する自動録音機能を搭載したものがある。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2006−277855号公報(段落0025)
【特許文献2】特開平10−116099号公報(要約、段落0041)
【発明の概要】
【発明が解決しようとする課題】
【0005】
上記の自動録音機能を搭載した従来の録音装置は、音声信号全体のレベルのみで自動録音の開始タイミングを判断しているため、ノイズ(例えば屋外における風の音など)によって誤って自動録音を開始してしまうおそれがあり、楽曲の自動録音に不向きであった。
【0006】
なお、特許文献1では、放送の音声信号から音楽部分を抽出して録音する録音装置が開示されている。そして、特許文献1では、音楽の開始位置を抽出する方法として、音量レベルが所定レベル以下の状態が一定時間継続している箇所を音楽の開始位置として抽出する方法のみが例示されている。このような音楽の開始位置抽出方法は、例えば、屋外において風の音が発生している状況下で実演されている楽曲を自動録音することができないという問題を有している。
【0007】
また、特許文献2では、音声入力感度に応じてデジタル信号処理部内のバンドパスフィルタのフィルタ特性を可変し、当該デジタル信号処理部に入力する音声信号の周波数帯域を制限する音声起動録音装置が開示されている。特許文献2で開示されている音声起動録音装置は、デジタル信号処理部によってデジタル信号に圧縮した音声データを半導体メモリ部に記録するので、音声入力感度に応じて帯域制限された音声データを記録することになり、楽曲を自動録音する場合に楽曲本来の音を記録することができないという問題を有している。
【0008】
本発明は、上記の状況に鑑み、楽曲開始の検出精度を向上させることができる録音装置を提供することを目的とする。
【課題を解決するための手段】
【0009】
上記目的を達成するために本発明に係る録音装置は、音声信号から所定帯域を抽出するフィルタ部と、前記フィルタ部から出力される前記所定帯域の音声信号に対応する前記所定帯域の音声パワーの平均値を算出するパワー算出部と、前記パワー算出部によって算出された前記所定帯域の音声パワーの平均値に基づいて、楽曲の開始を検出する楽曲開始検出部と、前記フィルタ部を通過していない音声信号を記録媒体に録音する録音部とを備える構成(第1の構成)とする。
【0010】
また、上記第1の構成の録音装置において、前記所定帯域が変更可能である構成(第2の構成)としてもよい。
【0011】
また、上記第1の構成または第2の構成の録音装置において、前記楽曲開始検出部が楽曲の開始を検出したときに、前記録音部が自動的に録音を開始又は再開する構成(第3の構成)にしてもよい。
【0012】
また、上記第1の構成または第2の構成の録音装置において、前記録音部が、前記楽曲開始検出部によって検出された楽曲の開始の位置を示す楽曲開始インデックスを、前記記録媒体に録音する音声信号に関連付けて前記記録媒体に記録する構成(第4の構成)にしてもよい。
【0013】
また、上記第1〜第4のいずれかの構成の録音装置において、前記楽曲開始検出部が、前記パワー算出部によって算出された前記所定帯域の音声パワーの平均値が閾値以上になったときに、楽曲が開始されたと判定するようにしてもよい。
【0014】
また、上記第1〜第4のいずれかの構成の録音装置において、前記楽曲開始検出部が、前記パワー算出部によって算出された前記所定帯域の音声パワーの平均値が所定時間の間閾値以上であれば、その所定時間の開始時点を楽曲の開始位置とするようにしてもよい。
【発明の効果】
【0015】
本発明に係る録音装置によると、音声信号から所定帯域を抽出するフィルタ部と、前記フィルタ部から出力される前記所定帯域の音声信号に対応する前記所定帯域の音声パワーの平均値を算出するパワー算出部と、前記パワー算出部によって算出された前記所定帯域の音声パワーの平均値に基づいて、楽曲の開始を検出する楽曲開始検出部とを備えるので、前記所定帯域をノイズが小さく、楽曲の出力が大きい周波数帯域に設定することで、ノイズによって楽曲開始が誤検出されなくなり、楽曲開始の検出精度を向上させることができる。
【0016】
また、本発明に係る録音装置によると、前記フィルタ部を通過していない音声信号を記録媒体に録音する録音部を備えるので、楽曲本来の音を録音することができるという利点を有している。
【図面の簡単な説明】
【0017】
【図1】本発明の第1,3,4実施形態に係る録音装置の構成を示すブロック図である。
【図2】楽曲の自動録音モードに設定されている場合の本発明の第1実施形態に係る録音装置の録音動作を示すフローチャートである。
【図3】音声波形及び音声パワーの平均値のタイムチャートである。
【図4】本発明の第2実施形態に係る録音装置の構成を示すブロック図である。
【図5】楽曲の自動録音モードに設定されている場合の本発明の第2実施形態に係る録音装置の録音動作を示すフローチャートである。
【図6】音声波形及び音声パワーの平均値のタイムチャートである。
【図7】楽曲検出モードに設定されている場合の本発明の第3実施形態に係る録音装置の録音動作を示すフローチャートである。
【図8】音声波形及び音声パワーの平均値のタイムチャートである。
【図9】楽曲検出モードに設定されている場合の本発明の第4実施形態に係る録音装置の録音動作を示すフローチャートである。
【図10】音声波形及び音声パワーの平均値のタイムチャートである。
【図11】本発明に係る録音装置が備えるCPUの一変形例を示す図である。
【図12】本発明に係る録音装置が備えるCPUの他の変形例を示す図である。
【発明を実施するための形態】
【0018】
本発明の実施形態について図面を参照して以下に説明する。
【0019】
<第1実施形態>
本発明の第1実施形態に係る録音装置の構成を図1に示す。図1に示す本発明の第1実施形態に係る録音装置は、ICレコーダであって、マイクロホン1と、増幅部2と、A/D変換部3と、記録再生部4と、ICメモリ5と、D/A変換部6と、増幅部7と、スピーカ8と、CPU9と、操作部13と、表示部14とを備えている。
【0020】
CPU9は、録音装置内全体の駆動動作を制御している。また、CPU9は、バンドパスフィルタ部10と、パワー算出部11と、楽曲開始終了検出部12とを有している。
【0021】
マイクロホン1は、集音した音声を電気信号である音声信号に変換する。増幅部2は、マイクロホン1から出力される音声信号を増幅する。A/D変換部3は、増幅部2から出力されるアナログ信号をデジタル信号に変換する。A/D変換部3から出力されるデジタル音声信号は、記録再生部4とCPU9とに供給される。
【0022】
記録再生部4は、CPU9からの指示に従って、記録処理(録音処理)や再生処理を実行する。記録再生部4は、記録処理実行時において、A/D変換部3から出力されるデジタル音声信号に対して圧縮符号化処理を施し、その結果得られる圧縮符号化信号をICメモリ5に記録する。また、記録再生部4は、再生処理実行時において、ICメモリ5から読み出した圧縮符号化信号を伸長して復号し、その結果得られるデジタル音声信号をD/A変換部6に出力する。
【0023】
D/A変換部6は、記録再生部4から出力されるデジタル信号をアナログ信号に変換する。増幅部7は、D/A変換部6から出力されるアナログ音声信号を増幅する。スピーカ8は、増幅部7から出力される増幅されたアナログ音声信号に基づいて音声を再生出力する。
【0024】
操作部13は、ユーザの操作内容に応じた操作信号をCPU9に出力する。CUP9は、操作部13から出力される操作信号に基づいて、録音動作、再生動作等の各種動作に関する制御や各種設定を行う。
【0025】
表示部14は、CPU9からの指示に従って、動作状態や各種設定の状態などを表示する。
【0026】
次に、楽曲の自動録音モードに設定されている場合の図1に示す本発明の第1実施形態に係る録音装置の録音動作について、図1及び図2を参照して説明する。図2は、楽曲の自動録音モードに設定されている場合の図1に示す本発明の第1実施形態に係る録音装置の録音動作を示すフローチャートである。
【0027】
まず始めに、CPU9は、操作部13から出力される操作信号を確認して、操作部13の録音キーが押圧されたか否かを判定し(ステップS10)、録音キーが押圧されたと判定すると(ステップS10のYES)、ステップS20に移行する。
【0028】
ステップS20において、CPU9は楽曲の開始を検出する。具体的には、バンドパスフィルタ部10が、A/D変換部3から出力されるデジタル音声信号から所定帯域を抽出し、パワー算出部11が、バンドパスフィルタ部10から出力される所定帯域のデジタル音声信号に対応する所定帯域の音声パワーの平均値を算出し、楽曲開始終了検出部12が、パワー算出部11によって算出された所定帯域の音声パワーの平均値が予め設定された閾値以上であるか否かを判定し、所定帯域の音声パワーの平均値が閾値以上であれば楽曲が開始されたと判定する。
【0029】
所定帯域の音声パワーの平均値が閾値以上であれば(ステップS20のYES)、楽曲開始終了検出部12は、記録再生部4に対して録音開始又は録音再開の指示を出し、その後ステップS60に移行する。
【0030】
一方、所定帯域の音声パワーの平均値が閾値以上でなければ(ステップS20のNO)、CPU9は、操作部13から出力される操作信号を確認して、操作部13の停止キーが押圧されたか否かを判定し(ステップS40)、停止キーが押圧されていないと判定すると(ステップS40のNO)、ステップS20に戻り、停止キーが押圧されたと判定すると(ステップS40のYES)、録音待機状態を解除し(ステップS50)、その後ステップS10に戻る。
【0031】
ステップS60において、CPU9は楽曲の終了を検出する。具体的には、バンドパスフィルタ部10が、A/D変換部3から出力されるデジタル音声信号から所定帯域を抽出し、パワー算出部11が、バンドパスフィルタ部10から出力される所定帯域のデジタル音声信号に対応する所定帯域の音声パワーの平均値を算出し、楽曲開始終了検出部12が、パワー算出部11によって算出された所定帯域の音声パワーの平均値が所定時間の間予め設定された閾値以下であるか否かを判定し、所定帯域の音声パワーの平均値が所定時間の間閾値以下であればその所定時間の開始時点で楽曲が終了したと判定する。なお、ステップS20での閾値とステップS60での閾値とは同じであっても異なっていてもよいが、本実施形態では同一としている。
【0032】
所定帯域の音声パワーの平均値が所定時間の間閾値以下であれば(ステップS60のYES)、楽曲開始終了検出部12は、記録再生部4に対して録音保留(録音の一時停止)の指示を出し(ステップS70)、その後ステップS20に戻る。
【0033】
一方、所定帯域の音声パワーの平均値が所定時間の間閾値以下でなければ(ステップS60のNO)、CPU9は、操作部13から出力される操作信号を確認して、操作部13の停止キーが押圧されたか否かを判定し(ステップS80)、停止キーが押圧されていないと判定すると(ステップS80のNO)、ステップS60に戻り、停止キーが押圧されたと判定すると(ステップS80のYES)、録音を停止し(ステップS90)、その後ステップS10に戻る。
【0034】
上記のような録音動作により楽曲開始の検出精度を向上させることができることを、図3を参照して説明する。なお、図3中のTはステップS60での所定時間を示している。ノイズが小さく、楽曲の出力が大きい周波数帯域をバンドパスフィルタ部10が上記の所定帯域として抽出するように、バンドパスフィルタ部10の特性を設定する。かかる設定により、図3に示すように、バンドパスフィルタ部10から出力される所定帯域のデジタル音声信号に対応する所定帯域の音声波形ではノイズ部分の振幅が小さくなる。その結果、最初の二つのノイズ部分において、楽曲開始が誤検出されなくなり、楽曲開始の検出精度を向上させることができる。したがって、楽曲の自動録音モードにおいて、ノイズによって誤って録音が開始又は再開され、ICメモリ5の容量を無駄に消費することを低減することができ、ICメモリ5の使用効率を向上させることができる。
【0035】
<第2実施形態>
本発明の第1実施形態に係る録音装置よりも楽曲開始の検出精度が高い本発明の第2実施形態に係る録音装置について説明する。本発明の第2実施形態に係る録音装置の構成を図4に示す。なお、図4において図1と同一の部分には同一の符号を付し詳細な説明を省略する。
【0036】
図4に示す本発明の第2実施形態に係る録音装置は、図1に示す本発明の第1実施形態に係る録音装置にFIFO(First-In/First-Out)メモリ15を追加した構成である。FIFOメモリ15は、後述するステップS25での所定時間分の音声信号を記憶することができるリングバッファであって、A/D変換部3と記録再生部4との間に設けられる。A/D変換部3から出力されるデジタル音声信号は、FIFOメモリ15とCPU9とに供給される。
【0037】
また、図4に示す本発明の第2実施形態に係る録音装置と図1に示す本発明の第1実施形態に係る録音装置とでは、楽曲開始終了検出部12での楽曲開始の検出手法が異なっている。
【0038】
図5は、楽曲の自動録音モードに設定されている場合の図4に示す本発明の第2実施形態に係る録音装置の録音動作を示すフローチャートである。なお、図5において図2と同一のステップには同一の符号を付し詳細な説明を省略する。
【0039】
図5のフローチャートは、図2のフローチャートにおいてステップS20をステップS25に置換したものである。
【0040】
ステップS25において、CPU9は楽曲の開始を検出する。具体的には、バンドパスフィルタ部10が、A/D変換部3から出力されるデジタル音声信号から所定帯域を抽出し、パワー算出部11が、バンドパスフィルタ部10から出力される所定帯域のデジタル音声信号に対応する所定帯域の音声パワーの平均値を算出し、楽曲開始終了検出部12が、パワー算出部11によって算出された所定帯域の音声パワーの平均値が所定時間の間予め設定された閾値以上であるか否かを判定し、所定帯域の音声パワーの平均値が所定時間の間閾値以上であればその所定時間の開始時点で楽曲が開始されたと判定する。なお、ステップS25での閾値とステップS60での閾値とは同じであっても異なっていてもよいが、本実施形態では同一としている。また、ステップS25での所定時間とステップS60での所定時間とは同じであっても異なっていてもよいが、本実施形態ではステップS25での所定時間をステップS60での所定時間よりも長くしている。
【0041】
上記のような録音動作により楽曲開始の検出精度を第1実施形態よりも向上させることができることを、図6を参照して説明する。なお、図6中のT1はステップS25での所定時間を示しており、図6中のT2はステップS60での所定時間を示している。ノイズが小さく、楽曲の出力が大きい周波数帯域をバンドパスフィルタ部10が上記の所定帯域として抽出するように、バンドパスフィルタ部10の特性を設定する。かかる設定により、図6に示すように、バンドパスフィルタ部10から出力される所定帯域のデジタル音声信号に対応する所定帯域の音声波形ではノイズ部分の振幅が小さくなる。さらに、所定帯域の音声パワーの平均値が所定時間T1の間閾値以上である場合のみ、楽曲開始を検出する。その結果、最初の二つのノイズ部分のみならず三つ目のノイズ部分においても、楽曲開始が誤検出されなくなり、楽曲開始の検出精度を第1実施形態よりも向上させることができる。
【0042】
<第3実施形態>
本発明の第3実施形態に係る録音装置について説明する。本発明の第3実施形態に係る録音装置のブロック図は、本発明の第1実施形態に係る録音装置のブロック図と同一であり、図1に示すようになる。ただし、本発明の第3実施形態に係る録音装置と本発明の第1実施形態に係る録音装置とでは、記録再生部4及びCPU9の動作が互いに異なる。
【0043】
楽曲検出モードに設定されている場合の図1に示す本発明の第3実施形態に係る録音装置の録音動作について、図1及び図7を参照して説明する。図7は、楽曲検出モードに設定されている場合の図1に示す本発明の第3実施形態に係る録音装置の録音動作を示すフローチャートである。
【0044】
まず始めに、CPU9は、操作部13から出力される操作信号を確認して、操作部13の録音キーが押圧されたか否かを判定し(ステップS110)、録音キーが押圧されたと判定すると(ステップS110のYES)、ステップS120に移行する。
【0045】
ステップS120において、CPU9は、記録再生部4に対して録音開始の指示を出し、その後ステップS130に移行する。
【0046】
ステップS130において、CPU9は楽曲の開始を検出する。具体的には、バンドパスフィルタ部10が、A/D変換部3から出力されるデジタル音声信号から所定帯域を抽出し、パワー算出部11が、バンドパスフィルタ部10から出力される所定帯域のデジタル音声信号に対応する所定帯域の音声パワーの平均値を算出し、楽曲開始終了検出部12が、パワー算出部11によって算出された所定帯域の音声パワーの平均値が予め設定された閾値以上であるか否かを判定し、所定帯域の音声パワーの平均値が閾値以上であれば楽曲が開始されたと判定する。
【0047】
所定帯域の音声パワーの平均値が閾値以上であれば(ステップS130のYES)、楽曲開始終了検出部12は、楽曲の開始位置を示す楽曲開始インデックスを作成し(ステップS140)、その後ステップS160に移行する。楽曲開始インデックスは、例えば楽曲開始時の録音時間を構成要素に含むことで、楽曲の開始位置を示すことが可能となる。
【0048】
一方、所定帯域の音声パワーの平均値が閾値以上でなければ(ステップS130のNO)、CPU9は、操作部13から出力される操作信号を確認して、操作部13の停止キーが押圧されたか否かを判定し(ステップS150)、停止キーが押圧されていないと判定すると(ステップS150のNO)、ステップS130に戻り、停止キーが押圧されたと判定すると(ステップS150のYES)、後述するステップS190に移行する。
【0049】
ステップS160において、CPU9は楽曲の終了を検出する。具体的には、バンドパスフィルタ部10が、A/D変換部3から出力されるデジタル音声信号から所定帯域を抽出し、パワー算出部11が、バンドパスフィルタ部10から出力される所定帯域のデジタル音声信号に対応する所定帯域の音声パワーの平均値を算出し、楽曲開始終了検出部12が、パワー算出部11によって算出された所定帯域の音声パワーの平均値が所定時間の間予め設定された閾値以下であるか否かを判定し、所定帯域の音声パワーの平均値が所定時間の間閾値以下であれば楽曲が終了したと判定する。なお、ステップS130での閾値とステップS160での閾値とは同じであっても異なっていてもよいが、本実施形態では同一としている。
【0050】
所定帯域の音声パワーの平均値が所定時間の間閾値以下であれば(ステップS160のYES)、楽曲開始終了検出部12は、その所定時間の開始時点を楽曲の終了位置とし、その楽曲の終了位置を示す楽曲終了インデックスを作成し(ステップS170)、その後ステップS130に戻る。楽曲終了インデックスは、例えば楽曲終了時の録音時間を構成要素に含むことで、楽曲の終了位置を示すことが可能となる。
【0051】
一方、所定帯域の音声パワーの平均値が所定時間の間閾値以下でなければ(ステップS160のNO)、CPU9は、操作部13から出力される操作信号を確認して、操作部13の停止キーが押圧されたか否かを判定し(ステップS180)、停止キーが押圧されていないと判定すると(ステップS180のNO)、ステップS160に戻り、停止キーが押圧されたと判定すると(ステップS180のYES)、ステップS190に移行する。
【0052】
ステップS190において、CPU9は、録音を停止し、作成した楽曲開始インデックス及び楽曲終了インデックスを記録再生部4に送り、録音された音声信号に関連付けて楽曲開始インデックス及び楽曲終了インデックスを記録再生部4がICメモリ5に書き込むように、記録再生部4を制御し、その後ステップS110に戻る。
【0053】
上記のような録音動作により楽曲開始の検出精度を向上させることができることを、図8を参照して説明する。なお、図8中のTはステップS160での所定時間を示している。ノイズが小さく、楽曲の出力が大きい周波数帯域をバンドパスフィルタ部10が上記の所定帯域として抽出するように、バンドパスフィルタ部10の特性を設定する。かかる設定により、図8に示すように、バンドパスフィルタ部10から出力される所定帯域のデジタル音声信号に対応する所定帯域の音声波形ではノイズ部分の振幅が小さくなる。その結果、最初の二つのノイズ部分において、楽曲開始が誤検出されなくなり、楽曲開始の検出精度を向上させることができる。また、楽曲検出モードにおいて録音が行われると、録音された音声信号に関連付けて楽曲開始インデックス及び楽曲終了インデックスが自動的に記録されるので、再生時の楽曲頭出しやデータ編集時の編集作業が容易になる。
【0054】
<第4実施形態>
本発明の第3実施形態に係る録音装置よりも楽曲開始の検出精度が高い本発明の第4実施形態に係る録音装置について説明する。本発明の第4実施形態に係る録音装置のブロック図は、本発明の第3実施形態に係る録音装置のブロック図と同一であり、図1に示すようになる。ただし、本発明の第4実施形態に係る録音装置と本発明の第3実施形態に係る録音装置とでは、楽曲開始終了検出部12での楽曲開始の検出手法が異なっている。
【0055】
図9は、楽曲検出モードに設定されている場合の図1に示す本発明の第4実施形態に係る録音装置の録音動作を示すフローチャートである。なお、図9において図7と同一のステップには同一の符号を付し詳細な説明を省略する。
【0056】
図9のフローチャートは、図7のフローチャートにおいてステップS130をステップS135に置換したものである。
【0057】
ステップS135において、CPU9は楽曲の開始を検出する。具体的には、バンドパスフィルタ部10が、A/D変換部3から出力されるデジタル音声信号から所定帯域を抽出し、パワー算出部11が、バンドパスフィルタ部10から出力される所定帯域のデジタル音声信号に対応する所定帯域の音声パワーの平均値を算出し、楽曲開始終了検出部12が、パワー算出部11によって算出された所定帯域の音声パワーの平均値が所定時間の間予め設定された閾値以上であるか否かを判定し、所定帯域の音声パワーの平均値が所定時間の間閾値以上であれば、その所定時間の開始時点を楽曲の開始位置とする。そして、ステップS140において、楽曲開始終了検出部12は、その楽曲の開始位置を示す楽曲開始インデックスを作成する。なお、ステップS135での閾値とステップS160での閾値とは同じであっても異なっていてもよいが、本実施形態では同一としている。また、ステップS135での所定時間とステップS160での所定時間とは同じであっても異なっていてもよいが、本実施形態ではステップS135での所定時間をステップS160での所定時間よりも長くしている。
【0058】
上記のような録音動作により楽曲開始の検出精度を第3実施形態よりも向上させることができることを、図10を参照して説明する。なお、図10中のT1はステップS135での所定時間を示しており、図10中のT2はステップS160での所定時間を示している。ノイズが小さく、楽曲の出力が大きい周波数帯域をバンドパスフィルタ部10が上記の所定帯域として抽出するように、バンドパスフィルタ部10の特性を設定する。かかる設定により、図10に示すように、バンドパスフィルタ部10から出力される所定帯域のデジタル音声信号に対応する所定帯域の音声波形ではノイズ部分の振幅が小さくなる。さらに、所定帯域の音声パワーの平均値が所定時間T1の間閾値以上である場合のみ、楽曲開始を検出する。その結果、最初の二つのノイズ部分のみならず三つ目のノイズ部分においても、楽曲開始が誤検出されなくなり、楽曲開始の検出精度を第3実施形態よりも向上させることができる。
【0059】
<その他>
以上、本発明に係る実施形態について説明したが、本発明の範囲はこれに限定されるものではなく、発明の主旨を逸脱しない範囲で種々の変更を加えて実行することができる。変更のいくつかの例を以下に示す。
【0060】
本発明の第1〜第4実施形態の録音装置は、マイクロホン1を内蔵する構成であったが、これに代えてあるいはこれに加えて、外部マイクロホン等との接続が可能な外部音声入力端子を備える構成にしてもよい。
【0061】
また、本発明の第1〜第4実施形態の録音装置は、スピーカ8を内蔵する構成であったが、これに代えてあるいはこれに加えて、外部スピーカ等との接続が可能な外部音声出力端子を備える構成にしてもよい。
【0062】
また、本発明の第1〜第4実施形態の録音装置は、ICメモリ5を内蔵する構成であったが、これに代えてあるいはこれに加えて、外部メモリ(例えばSDカード)が着脱自在に装着されるメモリ装着部を備える構成にしてもよい。また、ICメモリ以外の記録媒体(例えば光ディスク)に音声信号が録音される形態であってもよい。
【0063】
楽曲において演奏されている楽器の種類によって楽曲の出力が大きい周波数帯域は異なるので、バンドパスフィルタ部10の特性が一つに固定されていた場合、様々な楽曲に適切に対応できないおそれがある。そこで、図11に示すCPUの構成例のように、バンドパスフィルタ部10を通過帯域が可変する可変バンドパスフィルタ16とし、操作部13によって設定される楽曲の種類の設定に応じてCPU9が可変バンドパスフィルタ16の通過帯域を変更するようにするようにしてもよい。あるいは、図12に示すCPUの構成例のように、バンドパスフィルタ部10を複数の通過帯域がそれぞれ異なる複数のバンドパスフィルタ17−1〜17−nとバンドパスフィルタ17−1〜17−nを択一的に選択するスイッチ18とで構成し、操作部13によって設定される楽曲の種類の設定に応じてCPU9がスイッチ18の選択先を変更するようにするようにしてもよい。操作部13によって設定される楽曲の種類としては、例えば、「トランペット演奏のある楽曲」、「ドラム演奏のある楽曲」、「ギター演奏のある楽曲」、「ピアノ演奏のある楽曲」などが考えられる。
【符号の説明】
【0064】
1 マイクロホン
2 増幅部
3 A/D変換部
4 記録再生部(録音部の一例)
5 ICメモリ(記録媒体の一例)
6 D/A変換部
7 増幅部
8 スピーカ
9 CPU
10 バンドパスフィルタ部(フィルタ部の一例)
11 パワー算出部
12 楽曲開始終了検出部(楽曲開始検出部の一例)
13 操作部
14 表示部
15 FIFOメモリ
16 可変バンドパスフィルタ
17−1〜17−n バンドパスフィルタ
18 スイッチ
【特許請求の範囲】
【請求項1】
音声信号から所定帯域を抽出するフィルタ部と、
前記フィルタ部から出力される前記所定帯域の音声信号に対応する前記所定帯域の音声パワーの平均値を算出するパワー算出部と、
前記パワー算出部によって算出された前記所定帯域の音声パワーの平均値に基づいて、楽曲の開始を検出する楽曲開始検出部と、
前記フィルタ部を通過していない音声信号を記録媒体に録音する録音部とを備えることを特徴とする録音装置。
【請求項2】
前記所定帯域が変更可能である請求項1に記載の録音装置。
【請求項3】
前記楽曲開始検出部が楽曲の開始を検出したときに、前記録音部が自動的に録音を開始又は再開する請求項1または請求項2に記載の録音装置。
【請求項4】
前記録音部が、
前記楽曲開始検出部によって検出された楽曲の開始の位置を示す楽曲開始インデックスを、前記記録媒体に録音する音声信号に関連付けて前記記録媒体に記録する請求項1または請求項2に記載の録音装置。
【請求項5】
前記楽曲開始検出部が、前記パワー算出部によって算出された前記所定帯域の音声パワーの平均値が閾値以上になったときに、楽曲が開始されたと判定する請求項1〜4のいずれか1項に記載の録音装置。
【請求項6】
前記楽曲開始検出部が、前記パワー算出部によって算出された前記所定帯域の音声パワーの平均値が所定時間の間閾値以上であれば、その所定時間の開始時点を楽曲の開始位置とする請求項1〜4のいずれか1項に記載の録音装置。
【請求項1】
音声信号から所定帯域を抽出するフィルタ部と、
前記フィルタ部から出力される前記所定帯域の音声信号に対応する前記所定帯域の音声パワーの平均値を算出するパワー算出部と、
前記パワー算出部によって算出された前記所定帯域の音声パワーの平均値に基づいて、楽曲の開始を検出する楽曲開始検出部と、
前記フィルタ部を通過していない音声信号を記録媒体に録音する録音部とを備えることを特徴とする録音装置。
【請求項2】
前記所定帯域が変更可能である請求項1に記載の録音装置。
【請求項3】
前記楽曲開始検出部が楽曲の開始を検出したときに、前記録音部が自動的に録音を開始又は再開する請求項1または請求項2に記載の録音装置。
【請求項4】
前記録音部が、
前記楽曲開始検出部によって検出された楽曲の開始の位置を示す楽曲開始インデックスを、前記記録媒体に録音する音声信号に関連付けて前記記録媒体に記録する請求項1または請求項2に記載の録音装置。
【請求項5】
前記楽曲開始検出部が、前記パワー算出部によって算出された前記所定帯域の音声パワーの平均値が閾値以上になったときに、楽曲が開始されたと判定する請求項1〜4のいずれか1項に記載の録音装置。
【請求項6】
前記楽曲開始検出部が、前記パワー算出部によって算出された前記所定帯域の音声パワーの平均値が所定時間の間閾値以上であれば、その所定時間の開始時点を楽曲の開始位置とする請求項1〜4のいずれか1項に記載の録音装置。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【公開番号】特開2011−150060(P2011−150060A)
【公開日】平成23年8月4日(2011.8.4)
【国際特許分類】
【出願番号】特願2010−9892(P2010−9892)
【出願日】平成22年1月20日(2010.1.20)
【出願人】(000001889)三洋電機株式会社 (18,308)
【Fターム(参考)】
【公開日】平成23年8月4日(2011.8.4)
【国際特許分類】
【出願日】平成22年1月20日(2010.1.20)
【出願人】(000001889)三洋電機株式会社 (18,308)
【Fターム(参考)】
[ Back to top ]