記録装置、再生装置及びプログラム
【課題】録画データの再生時に、雑音除去を行なっていない元の音データの再生や、雑音除去を行う角度の変更が可能な記録装置及び再生装置を提供する。
【解決手段】本発明の記録装置及び再生装置は、複数のマイクロフォンを備え、操作者が設定した映像上の座標から三次元空間上の角度を算出する機能と、各マイクロフォンの設置位置と各マイクロファンから取り込んだ音データを用いて、雑音除去を行う機能とを有する。録画時は、各マイクロフォンの設置位置や、撮影者が設定した映像上の座標などが記録できる録画ファイルフォーマットに従い録画データを記録する。再生時には、録画データと共に記録された座標、或いはユーザが指定した映像上の座標に基づいて、雑音除去を行なう。
【解決手段】本発明の記録装置及び再生装置は、複数のマイクロフォンを備え、操作者が設定した映像上の座標から三次元空間上の角度を算出する機能と、各マイクロフォンの設置位置と各マイクロファンから取り込んだ音データを用いて、雑音除去を行う機能とを有する。録画時は、各マイクロフォンの設置位置や、撮影者が設定した映像上の座標などが記録できる録画ファイルフォーマットに従い録画データを記録する。再生時には、録画データと共に記録された座標、或いはユーザが指定した映像上の座標に基づいて、雑音除去を行なう。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、記録媒体に記録されている音声データを再生する再生装置、音声データを記録媒体に記録する記録装置、及びそれらのプログラムに関する。
【背景技術】
【0002】
今日、録画機能付き機器が多数製品化されており、画面光学ズームや明るさ調整など、録画時の多数の機能が盛り込まれている。録画の際には音声の録音も可能であり、目的とする被写体からの音の明瞭度を向上する機能が望まれている。
【0003】
特許文献1には、複数のマイクロフォンで取得した音データから、個々の音源の方向を推定し、個々の音源を分離抽出する手法が記載されている。この手法を用いれば、目的とする音源以外の音を抑圧することで、特定の角度からの音の明瞭度を向上する(以降、雑音除去とする)ことが可能である。
【0004】
また、特許文献2には、ズーム画像を撮影する際に、撮影方向以外からの音を排除して、撮影方向の狭い範囲の音に絞って集音し、周波数成分の低域成分と高域成分を強調する事で、音源の間近で聞いたときの音質を再現する手法が提案されている。
【0005】
【特許文献1】特開2002−84590号公報
【特許文献2】特開2004−328052号公報
【発明の開示】
【発明が解決しようとする課題】
【0006】
特許文献1及び2に開示されている手法では録音時に、音の明瞭度が向上した音データを録音するのみである。そのため、録画データの再生時に、雑音除去を行なっていない元の音の再生や、撮影方向以外からの音等、任意の方向からの音の明瞭度を向上することなどができず、視聴者の嗜好に合った音を再生することができない。
【0007】
この発明は、上記実情に鑑みてなされたものであり、再生時に視聴者の嗜好に合った音の再生を可能とすることを目的とする。
【課題を解決するための手段】
【0008】
本発明の第1の観点に係る再生装置は、
複数のマイクロフォンの位置関係を示す位置関係データと、前記複数のマイクロフォンで取得した音データとが記録された記録媒体から、前記音データを再生する再生装置であって、
録音時に前記マイクロフォンにより集音された音のうちの、抽出する音の到来方向を示す抽出方向データを入力する入力手段と、
前記記録媒体に記録されている前記位置関係データと前記入力手段により入力された前記抽出方向データとに基づいて、前記記録媒体に記録されている前記音データのうちから、前記入力手段により入力された前記抽出方向データにより特定される方向から前記マイクロフォンに到来した音を抽出する抽出手段と、
前記抽出手段で抽出された前記音データを再生する再生手段と、
を備えることを特徴とする。
【0009】
好ましくは、
前記記録媒体には、前記位置関係データと前記音データとに加えて映像データが記録されており、
前記映像データを再生する映像再生手段をさらに備え、
前記入力手段は、前記映像再生手段で再生された映像上で、抽出する音の到来方向を示す場所を示すデータを入力する、
ことを特徴とする。
【0010】
さらに好ましくは、
前記記録媒体には、時間データと音を抽出する方向を示すデータとが対応付けられてさらに記録されており、
再生開始から経過時間を計測する計時手段をさらに備え、
前記入力手段は、前記記録媒体に記録されている方向を指定するデータを前記抽出方向データとして入力し、
前記抽出手段は、前記計測手段を用いて計測した再生開始からの経過時間が、記録されている時間データが指示する時間に達した時点で、前記時間データに対応付けて保存されていた前記音を抽出する方向を示すデータから音を抽出する方向を求め、求めた方向から前記マイクロフォンに到来した音を抽出する、
ことを特徴とする。
【0011】
上記目的を達成するため、本発明の第2の観点に係る記録装置は、
複数のマイクロフォンと、
前記複数のマイクロフォンの位置関係を示す位置関係データを記憶する位置関係データ記憶手段と、
前記位置関係データ記憶手段に記憶されている前記位置関係データと、前記複数のマイクロフォンで取得した音データと、を記録媒体に記録する記録手段と、
を備えることを特徴とする。
【0012】
好ましくは、
前記位置関係データに基づいて、前記複数のマイクロフォンで取得した複数の音データのうちから、特定の方向からの音の音データを抽出する抽出手段を有し、
前記記録手段は、前記抽出手段により抽出された前記音データを前記記録媒体に記録する、
ことを特徴とする。
【0013】
さらに好ましくは、
前記特定の方向を入力する入力手段を備えることを特徴とする。
【0014】
さらに好ましくは、
前記記録手段による音データの記録開始からの経過時間を計測する計時手段と、
音を抽出する方向を示す抽出方向データを入力する入力手段と、をさらに有し、
前記記録手段は、前記音データと共に、前記入力手段により入力された前記抽出方向データと、前記抽出方向データが入力されたタイミングで前記計時手段が計時している経過時間と、を前記記録媒体に記録する、
ことを特徴とする。
【0015】
さらに好ましくは、
撮像手段と、前記撮像手段により撮像された映像データが定義する映像を表示する表示手段とをさらに有し、
前記記録手段は前記音データに加えて前記映像データを前記記録媒体に記録し、
前記入力手段は、前記表示手段に表示された映像上の場所を指定する手段とし、指定された映像上の場所に対応する方向を示すデータを、音を抽出する方向を示す抽出方向データとする、
ことを特徴とする。
【0016】
本発明の第3の観点に係るプログラムは、
複数のマイクロフォンの位置関係を示す位置関係データと、前記複数のマイクロフォンで取得した音データとが記録された記録媒体から、前記音データを再生するコンピュータを、
録音時に前記マイクロフォンにより集音された音のうちの、抽出する音の到来方向を示す抽出方向データを入力する入力手段、
前記記録媒体に記録されている前記位置関係データと前記入力手段により入力された前記抽出方向データとに基づいて、前記記録媒体に記録されている前記音データのうちから、前記入力手段により入力された前記抽出方向データにより特定される方向から前記マイクロフォンに到来した音を抽出する抽出手段、
前記抽出手段で抽出された前記音データを再生する再生手段、
として機能させることを特徴とする。
【0017】
本発明の第4の観点に係るプログラムは、
複数のマイクロフォンに接続されたコンピュータを、
前記複数のマイクロフォンの位置関係を示す位置関係データを記憶する位置関係データ記憶手段、
前記位置関係データ記憶手段に記憶されている前記位置関係データと、前記複数のマイクロフォンで取得した音データと、を記録媒体に記録する記録手段、
として機能させることを特徴とする。
【発明の効果】
【0018】
本発明によれば、音データの再生時に、特定された方向からの音を再生する事ができ、視聴者の嗜好に合った再生を可能とする機能を提供できる。
【発明を実施するための最良の形態】
【0019】
(実施形態1)
本発明の実施形態1に係る記録再生装置を、図1ないし図5を用いて説明する。
実施形態1の記録再生装置101は、録音時に雑音除去を行う機能を備える。
まず、記録再生装置101の物理的な構成について説明する。記録再生装置101は、図1に示すように、撮影部102、マイクロフォン103〜106、キー入力部107、コーデック部108、制御部109、記録部110、表示部111、スピーカ112を備える。
【0020】
撮影部102はCCD(Charge Coupled Device)カメラ、CMOS(Complimentary MOS)センサ等から構成され、映像を撮影し、映像を電気信号に変換する。
【0021】
マイクロフォン103〜106は、音を集音し、集音した音をアナログ信号に変換する。
【0022】
キー入力部107は、電源スイッチ、録音及び録画ボタン等を備え、マイクロフォン103〜106及びカメラの起動や録音及び録画の開始・終了等の操作入力を受け付け、操作情報を制御部109に送る。
【0023】
コーデック部108は、撮影部102から取り込んだ映像やマイクロフォン103〜106から取り込んだ音を圧縮及び再生するために復号する。コーデック部108は、映像用のコーデック部と、音用のコーデック部とに分けても良い。
【0024】
制御部109は、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)等から構成され、システム全体の動作を制御する。
【0025】
記録部110は、ROM、フラッシュメモリ、HDD(Hard Disk Drive)等から構成され、撮影部102から取り込んだ映像、マイクロフォン103〜106から取り込んだ音、及びマイク位置情報等を格納する。
【0026】
表示部111は、LCD(Liquid Crystal Display)又は有機ELディスプレイ(organic Electro-Luminescence display)、及びドライバ等から構成され、撮影部で撮影した映像を表示する。
【0027】
表示部111は映像描画が可能なタッチパネルディスプレイから構成されてもよく、キー入力部107の替わりに、ユーザ操作入力を受け付けるようにしてもよい。
【0028】
スピーカ112は、増幅器、マイクロスピーカ等から構成され、制御部109から送られるアナログ音信号に基づいて音を出力する。
【0029】
上記構成において、マイクロフォン103〜106と撮影部102とは、明瞭度向上のため、撮影部102の光軸をX軸とし、X軸に互いに垂直なY軸とZ軸とを定義した場合に、X軸上、Y軸上、Z軸上でそれぞれ位置の異なるマイクロフォンが存在するように、配置されている。即ち、図2に例示するように、撮影部102を原点として、三次元空間上でX、Y,Z軸方向に、互いに異なる位置に配置されている。例えば、図2に示す例では、撮影部102の設置面の異なる位置に、マイクロフォン103、104、106が配置され、裏面にマイクロフォン105が配置されている。
【0030】
次に、図1に示す物理的構成を有する記録再生装置101により実現される機能構成を、図3を用いて説明する。
図示するように、記録再生装置101は、入力部302と、音処理部307と、雑音除去用データ記録部308と、録画データ記録部309と、映像処理部310と、を機能的に備える。
【0031】
入力部302は、図1のキー入力部107及び制御部109の一機能として実現され、撮影者による操作入力を受け付ける。入力部302は、例えば、明瞭度を向上させる音源の方向(音抽出角度範囲)を特定するための情報を入力する。音抽出角度範囲を特定する手法は任意であるが、例えば、撮影部102で撮影された映像を表示部111に表示させ、表示部111の画面上の位置の座標(雑音除去用座標)情報を受け付け、座標方向変換を行って抽出対象の方向と特定してもよい。
【0032】
音処理部307は、図1に示すコーデック部108及び制御部109の一機能として実現され、マイクロフォン103〜106から取り込んだ音データを受け取る。音処理部307は、受け取った音データ及びマイクロフォン103〜106の位置関係に基づいて、音源の向き(図2で説明したX、Y、Z座標における原点から音源へのベクトルと各軸のなす角度)を算出し、算出した角度が、例えば、入力部302により予め設定されている音抽出角度範囲から外れる場合には、減衰させることにより雑音除去を行う。さらに、音処理部307は、雑音除去後の音データを、マイク位置及び雑音除去用座標と共に、録画データ記録部309に書き込む。
【0033】
音処理部307が実施する雑音除去の手法自体は任意であるが、例えば、以下に示す手法を利用できる。まず、図4に示すように、4つのマイクロフォンのうちの任意の2つの組み合わせ(図4では、任意の2つのマイクロフォンを410と420で示す)に入射する音の相関を求めて、同一音が一方のマイクロフォンに入射してから他方のマイクロフォンに入射するまでの時間差TimeLagを求める。
マイクロフォン410と420との距離をd、音速をCとすると、マイクロフォン410と420と音源とを含む平面上で、マイクロフォン410と420とを結ぶ線に垂直な方向と音源の向きとが成す角度angleは、(1)式で表される。
angle = arcsin(C・TimeLag /d) … (1)
音処理部307は、式(1)から角度angleを求め、求めたangleを、図2に示すX,Y,Z座標上の各マイクロフォンの位置に基づいて、X、Y,Z座標系上の向きに補正する。
音処理部307は、他のマイクロフォンの組み合わせに関しても、同様に解析することにより、音源のX,Y,Z座標系上の原点からの向き(角度)を求める。
次に、音処理部307は、求めた音源の方向(到来方向)が、音の明瞭度を高める範囲である音抽出範囲に入っているか否かを判別し、入っていなければ、その音を減衰させる。
【0034】
雑音除去用データ記録部308は、記録部110に確保され、撮影部102とマイクロフォン103〜106の位置関係を示す情報や、入力部302により設定された上記音抽出角度範囲を定義するデータを予め記録する。また、音処理部307で求められた音源の方向を示すデータを格納する。
【0035】
録画データ記録部309は、記録部110に確保され、雑音除去後の音データ記録部309aと映像データ記録部309bとを備える。
雑音除去後の音データ記録部309aは、音処理部307による雑音処理が完了した音データを格納する。
映像データ記録部309bは、撮影部102により撮影された映像データを格納する。
【0036】
再生時には、音処理部307は、録画データ記録部309の雑音除去後の音データ記憶部309aに格納されている雑音除去済の音データが読み出し、スピーカ112から出力する。
【0037】
映像処理部310は、図1に示すコーデック部108と、制御部109と、表示部111と、から実現され、映像データ記録部309bに記録されている映像データを再生する。
【0038】
次に、上述した物理的及び機能的構成を有する記録再生装置101の動作を説明する。
【0039】
まず、記録再生装置101の録画時の動作を説明する。なお、映像を記録する動作は基本的に従来と同一であり、以下、理解を容易にするため、本実施形態に特有な雑音除去処理と雑音除去済音データを記録する処理を中心に説明する。
【0040】
撮影者がキー入力部107を操作する等して、録画開始指示をすると、制御部109は、図5のフローチャートに示す処理を開始し、まず、撮影部102で撮影した映像データを録画データ記録部309の映像データ記録部309bに記録する処理を開始する(ステップS501)。この映像データの記録は、録画終了が指示されるまで継続される。
【0041】
音処理部307は、雑音除去用データ記録部308に記録されているマイク位置情報、雑音除去用座標を読み出し、録画データのヘッダ領域に書き込む(ステップS502)。その後、音処理部307は、音データ及びマイク位置に基づいて音源の方向(角度)を算出する(ステップS503)。
続いて、音処理部307は、音抽出角度範囲外から到来する雑音を除去することにより、雑音除去を行う(ステップS504)。音処理部307は、雑音除去後の音データを録画データ記録部309の雑音除去後の音データ記録部309aに書き込む(ステップS505)。次に、音処理部307は、録画の終了が指示されたか否かを判別し(ステップS506)、録画が終了していなければ(ステップS506;No)、ステップS503に戻り、上述の動作を繰り返す。一方、ステップS506で、録画終了が指示されたと判別された場合(ステップS506;Yes)、今回の録画処理を終了する。
【0042】
以上の処理により、入力部302で設定された音抽出角度範囲にある音源から記録再生装置101に到来する音の明瞭度が向上した音データを、映像データと共に記録媒体に録音する事が可能になる。
【0043】
一方、再生時には、この記録再生装置101は、録画データ記録部309に記録されている映像データと音データとを再生する。再生される音データは、既に、雑音除去処理済なので、明瞭な音が再生される。
【0044】
なお、以上の説明では、ユーザが入力部302を介して音抽出角度範囲を指定したが、音抽出角度範囲の設定手法は任意である。例えば、撮影部102が撮影した画像の中央を基準として所定範囲、フォーカスポイント(ピントが合っているポイント)、顔認識機能等によって顔であると認識されたエリア等を音抽出範囲として自動的に設定する構成としてもよい。
【0045】
(実施形態2)
上記実施形態1においては、録音時に雑音除去処理を行ったが、再生時に雑音除去を行うことも可能である。
以下、再生時に雑音除去を行う記録再生装置を実施形態2として、図6ないし図10を用いて説明する。なお、本実施形態では、理解を容易にするため、記録再生装置を、録画機能を有する記録装置601と再生機能を有する再生装置701に分けて説明する。
実施形態1と同様に、図1に示す物理構成により、図6及び図7に示す機能構成が実現される。
【0046】
図6に示すように、記録装置601は、音処理部607と、雑音除去用データ記録部608と、録画データ記録部609と、を機能的に備える。
【0047】
音処理部607は、コーデック部108及び制御部109の一機能として実現され、マイクロフォン103〜106から取り込まれた音データを受け取る。雑音除去を行なうことなく受け取った音データをそのまま、或いは圧縮して音データを作成し、録画データ記録部609に書き込む。また、雑音除去を行うためのパラメータであるマイク位置や、撮影時の画像サイズ及び画角を、音データと共に、録画データ記録部609に書き込む。
【0048】
雑音除去用データ記録部608は、記録部110に確保され、撮影部102とマイクロフォン103〜106の位置関係を示す情報を予め記録する。さらに、撮影部102によって計測された画像サイズ及び画角を格納する。
【0049】
録画データ記録部609は、記録部110に確保され、マイクロフォン103〜106で取り込んだ音をそのまま、或いは、圧縮した音データを格納する。その際、各マイクロフォンで取り込んだ音はそれぞれ個別に格納する。例えば、マイクロフォン103で取り込まれた音を音データ1、マイクロフォン104の音を音データ2、マイクロフォン105の音を音データ3、マイクロフォン106の音を音データ4として記録する。また、音処理部607によって書き込まれた、マイク位置、撮影時の画像サイズ及び画角を格納する。
さらに、撮影部102により撮影された映像データを格納する。
【0050】
音処理部607により録画データ記録部609に書き込まれる録画データのファイルフォーマットを図8に示す。録画データファイルは、ヘッダ領域に、機種、マイク個数、マイクロフォンの位置、撮影時の画像サイズ、及び画角等の情報を格納する。
【0051】
機種情報は、録画した記録装置以外の再生装置で再生する際に再生装置が録画データのファイルフォーマットに対応しているか否かの判断に利用することができる。また、機種情報によりマイクロフォンの個数及び位置情報を得ることもできる。
【0052】
マイクロフォンの個数情報は、位置情報を格納するマイクロフォンの個数を示す。図8では“4”と設定されているので、マイクロフォン1からマイクロフォン4までの合計四つのマイク位置を記録する。
【0053】
マイクロフォンの位置情報は、例えば、図2に示すマクロフォン103〜106の三次元空間上の位置を記録することができる。図8では、マイクロフォン103の位置は、マイクロフォン1の位置情報のX軸座標、Y軸座標、Z軸座標の順に記録される。同様に、マイクロフォン2の位置情報からマイクロフォン4の位置情報が記録される。また、図17のように、カメラに対するマイクロフォンの位置を変更することが可能な場合、筐体の姿勢によりカメラ1702とマイクロフォン1703〜1706の位置関係は変化する。
【0054】
さらに、撮影する映像の画像サイズ(図8では、x軸:852ドット、y軸:480ドット)及び撮影時の画角(図8では、水平方向画角:26度、垂直方法画角:16度)の情報を記録する領域がある。
【0055】
以上の、マイク個数、マイクロフォンの位置、画像サイズ及び撮影時の画角の情報に加え、後に説明する音源の三次元空間上の角度を、雑音除去に用いるパラメータ(雑音除去用パラメータ)とする。また、ヘッダ領域の後ろに、本体領域として、映像データや音データを記録する領域がある。なお、本体領域の映像データや音データ内に、各々のデータに対するヘッダ領域が存在する場合には、その領域に雑音除去用パラメータを記録しても良い。
【0056】
次に、上述した物理的及び機能的構成を有する記録装置601の動作を説明する。
撮影者がキー入力部107を操作する等して、録画開始指示をすると、制御部109は撮影部102で撮影した映像及びマイクロフォン103〜106によって取り込んだ音データを録画データ記録部609に記録する処理を開始する。まず、音処理部607は、雑音除去用データ記録部608に記録されているマイク位置情報、撮影時の画像サイズ及び画角を読み出し、録画データのヘッダ領域に書き込む。その後、音処理部607及び撮影部102より、音データ及び映像データが録画データ記録部609に書き込まれる。この映像データ及び音データの記録は、録画終了が指示されるまで継続され、録画終了が指示されると記録装置601が行う録画処理が終了する。
【0057】
次に、再生時に雑音除去を行なう再生装置701の詳細を示す。図7に示すように、再生装置701は、入力部702と、音処理部707と、雑音除去用データ記録部708と、録画データ記録部609と、映像処理部710と、を機能的に備える。
【0058】
入力部702は、キー入力部107、制御部109及び表示部111の一機能として実現され、再生時に視聴者が設定する、明瞭度を向上させる映像上の座標、すなわち雑音除去用座標を受け付け、雑音除去用データ記録部708に書き込む。例えば、撮影部102で撮影された映像を表示部111に表示させ、表示された映像上で任意の位置をユーザが指定する。
【0059】
音処理部707は、コーデック部108及び制御部109の一機能として実現され、画像サイズ、撮影時の画角、及び雑音除去用データ記録部708に格納された雑音除去用座標に基づいて明瞭度を向上させたい音源の三次元空間の角度を算出し、録画データ記録部609に記録された音データに対して雑音除去を行う。音処理部707は、雑音除去後の音データを、スピーカ112を介して出力する。
【0060】
雑音除去用データ記録部708は、記録部110に確保され、再生時に視聴者によって指定された、雑音除去用座標の情報を格納する。
【0061】
映像処理部710は、図1に示すコーデック部108と、制御部109と、表示部111と、から実現され、録画データ記録部609に記録されている映像データを再生する。
【0062】
次に、本実施形態に特有な処理をおこなう再生装置701の動作を説明する。
【0063】
視聴者がキー入力部107を操作する等して、録画データ再生開始を指示すると、制御部109は、図9のフローチャートに示す処理を開始する。音処理部707は録画データ記録部609に記録されている雑音除去用パラメータを読み出す(ステップS901)。ここで、雑音除去用パラメータの1つである音源の三次元空間上の角度はまだ算出されていないので、初期値を“NULL”とする。次に、視聴者の操作によって雑音除去用座標が設定されているかどうかの判定を行なう(ステップS902)。例えば、タッチパネル上に再生されている映像に対して、視聴者が音の明瞭度を向上したい場所をタッチすると、入力部702はその場所を雑音除去用座標として設定する。雑音除去用座標が設定されている場合(ステップS902;Yes)、音処理部707は、雑音除去用座標、撮影時の画像サイズ及び画角から、三次元空間上の角度を算出する(ステップS903)。
【0064】
例えば、以下に示す方法により、音源の三次元空間の角度が求められる。
図10に、撮影時の三次元空間と、表示部の映像との関係を示す。撮影する実際の三次元空間上をカメラの中心を原点としてX軸、Y軸、Z軸で表し、XY平面上に音源1001がある。また、撮影した映像を、表示部の映像領域1002(例えば、タッチパネルの映像領域)とし、図の垂直方向がy軸、水平方向がx軸とする。三次元空間上の音源1001は、表示部の映像領域1002上の音源1003として映し出されており、x軸方向に対して映像の中央から100ドットだけ離れている。表示部の映像領域1002を見ている視聴者が音源1003に対して明瞭度を向上したい場合には、タッチパネル上の音源1003の場所をタッチすることで、雑音除去用座標にx軸方向の値100が設定される。
【0065】
図10において、撮影時は判明している撮影した映像の最大座標(画像サイズのx軸の値)をW、視聴者操作により指定された雑音除去用座標のx軸の値を100ドット、撮影時に判明している撮影時の画角をangle_max、明瞭度を向上したい三次元空間上の角度をangleとすると、式(2)が成り立つ。
W / 2 : 100 = tan(angle_max) : tan(angle) … 式(2)
式(2)を変形すると、明瞭度を向上したい三次元空間上の角度angleは、式(3)で表わされる。
angle = arctan ( tan(angle_max) * 200 / W ) … 式(3)
撮影時の画角(angle_max)及び画像サイズ(W)の値は録画データのヘッダ領域に格納されているので、その値を参照することによって、angleを求めることができる。
【0066】
三次元空間上の角度を算出(ステップS903)した後、音処理部707は雑音除去用パラメータを変更する(ステップS904)。さらに、音処理部707は、録画データ記録部609の全音データを読み出し(ステップS905)、音の明瞭度を向上する雑音除去を行なう(ステップS906)。上記式(3)で算出した明瞭度を向上したい三次元空間上の角度angleを、前述の式(1)のangleに代入する事で、二つのマイクから取り込んだ音データの時間差TimeLagを得る事ができる。このTimeLagだけの時間差が生じた二つの音データに対して、一方のみ、或いは、TimeLagだけずらして加算した音データを生成することにより、音の明瞭度を向上する雑音除去が可能となる。
【0067】
音処理部707は、雑音除去を施した一つの音データを生成する。音処理部707及び映像処理部710は音データ及び録画された映像データを再生する(ステップS907)。再生が終了しない場合(S908;No)は、ステップS902を再度行なう。ここで、視聴者が明瞭度を向上したい場所を、一旦タッチする事で、雑音除去用座標は設定されているので、二回目以降も、ステップS903以降の処理を行うことになる。なお、視聴者が設定した座標に変更がない場合には、ステップS903及びステップS904の処理は割愛し、ステップS905から行っても良い。
【0068】
また、ステップS902にて、雑音除去用座標の設定が一回も無い場合には、音処理部707は、録画データ記録部609の任意の音データを読み出し(例えば音データ1)(ステップS909)、その音データを再生する(ステップS907)。再生停止等の操作入力により、又は全部分を再生し終わると(ステップS908;Yes)、再生処理を終了する。
【0069】
なお、動画再生中の画面には、雑音除去用座標をクリアする指示に対応した項目があり、視聴者により上記項目が選択された場合には、音処理部707は、雑音除去用座標をクリアし、雑音除去用座標は未設定となり、音源の三次元上の角度は初期値“NULL”に戻る。雑音除去を行いながら動画再生中に、視聴者が、上記雑音除去用座標をクリアする指示に対応した項目を選択した場合、雑音除去用座標がクリアされるので、ステップS902の後は、ステップS909を実行する。
【0070】
また、視聴者が別の明瞭度を向上したい座標を設定することも可能であり、映像上の座標から、三次元空間上の角度を算出し直し(ステップS903)、雑音除去用パラメータの変更を行う(ステップS904)ことにより、別の角度の明瞭度が向上した音データを得る事ができる。さらには、再生中に、明瞭度を向上したい映像上の座標を指定するたびに、指定した時間と、雑音除去用パラメータを雑音除去用データ記録部708に保存しても良い。その後、動画再生を一旦終了し、再度、最初から、或いは、途中から動画再生を行なう際、事前に保存しておいた雑音除去用パラメータを用いて雑音除去を行なっても良い。
【0071】
以上の処理により、録画後の再生時に、視聴者が明瞭度を向上したい音の角度を指定する事ができ、視聴者の嗜好に合った再生機能を提供できる。
【0072】
(実施形態3)
上記実施形態2においては、再生時に明瞭度を向上させたい音の位置情報を設定したが、録画時に明瞭度を向上させたい音の位置情報を設定することも可能である。実施形態3では、撮影者が設定した、映像上の座標及び時間を録画時に記録し、その設定に基づいて再生時に雑音除去を行う。実施形態3を、図11ないし図15を用いて説明する。なお、実施形態2と同様に、記録再生装置を、録画機能を有する記録装置1101と再生機能を有する再生装置1201に分けて説明する。
実施形態1と同様に、図1に示す物理構成により、図11及び図12に示す機能構成が実現される。
【0073】
記録装置1101は、音処理部1107と、雑音除去用データ記録部1108と、録画データ記録部1109と、入力部1110と、を機能的に備える。
【0074】
音処理部1107は、コーデック部108及び制御部109の一機能として実現され、マイクロフォン103〜106から取り込まれた音データを受け取る。雑音除去を行なうことなく受け取った音データをそのまま、或いは圧縮して音データを作成し、録画データ記録部1109に書き込む。また、録画開始後に雑音除去用パラメータであるマイク位置、撮影時の画像サイズ及び画角を雑音除去用データ記録部1108から録画データ記録部1109に書き込む。さらに、録画時に入力部1102において雑音除去用座標が設定された場合に、その設定時からの経過時間を計測し、経過時間(雑音除去設定時間)及び雑音除去用座標を録画データ記録部1109に書き込む。
【0075】
雑音除去用データ記録部1108は、記録部110に確保され、撮影部102によって計測された、マイク位置、撮影時の画像サイズ及び画角を格納する。また入力部1110に入力された雑音除去用座標を格納する。
【0076】
録画データ記録部1109は、記録部110に確保され、マイクロフォン103〜106で取り込んだ音をそのまま、或いは、圧縮した音データを格納する。その際、実施形態2と同様に、各マイクロフォンで取り込んだ音はそれぞれ個別に格納する。また、マイク位置、撮影時の画像サイズ及び画角、雑音除去用座標、及び雑音除去設定時間を格納する。さらに撮影部102により撮影された映像データを格納する。
【0077】
入力部1110は、キー入力部107、制御部109及び表示部111の一機能として実現され、録画時に撮影者が設定した、雑音除去用座標を受け付け、雑音除去用データ記録部1108に書き込む。例えば、撮影部102で撮影されている映像を表示部111に表示させ、表示された映像上で任意の位置をユーザが指定する。
【0078】
ここで、音処理部1107により録画データ記録1109に書き込まれる録画データのファイルフォーマットを図13に示す。実施形態2のファイルフォーマットの内容に加え、雑音除去座標及び雑音除去設定時間の情報を含む“録画時の雑音除去設定”の項目が付加される。この設定に従い、再生装置1201は、録画データ記録部1109に格納された音データに対し雑音除去を行う。撮影者が設定した映像上の座標をx軸及びy軸とする。雑音除去を行なわない場合は“なし”と設定する。以上の、マイク個数、マイクロフォンの位置、画像サイズ及び撮影時の画角、雑音除去用座標、雑音除去設定時間、及び音源の三次元空間上の角度などの情報を、雑音除去用パラメータとする。
【0079】
次に、上述した物理的及び機能的構成を有する記録装置1101の動作を説明する。
【0080】
撮影者がキー入力部107を操作する等して録画開始指示をすると、制御部109は、図14のフローチャートに示す処理を開始し、撮影部102で撮影した映像データ及びマイクロフォン103〜106で取り込んだ音データを録画データ記録部1109に記録する処理を開始する(ステップS1401)。音処理部1107は録画データのヘッダ領域にマイク数及びマイク位置などを書き込む(ステップS1402)。その後、音処理部1107は、撮影者の操作により雑音除去用座標が変更されているか判断する(ステップS1403)。なお、録画撮影開始時の初期値としては、雑音除去処理を行わない設定とする。雑音除去用座標が変更されている場合には(ステップS1403;Yes)、音処理部1107は録画データのヘッダ領域に雑音除去用座標及び雑音除去設定時間を記録する(ステップS1404)。
【0081】
明瞭度を向上したい映像上の座標が変更されていない場合(ステップS1403;No)、或いは、ヘッダ領域への書き込み(ステップS1404)終了後は、映像データ及び全てのマイクロフォンから得られた音データは録画データの本体領域に書き込まれる(ステップS1405)。その際、マイクロフォンから得られた複数の音データは、一つの連続した音データとして記録し、四つのマイクロフォンの場合は、四つの異なる音データとして記録しても良い。或いは、各々のマイクロフォンから得られた複数の音データを、32ミリ秒などの処理単位時間毎に、順次一つの連続した音データとして記録しても良い。録画停止等の操作入力により録画が終了すると(ステップS1406;Yes)、録画処理を終了し、録画が終了しない場合(ステップS1406;No)は、ステップS1403を再度行う。
【0082】
次に、録画時に設定された雑音除去設定に従って、再生処理を行う再生装置1201について説明する。図12に示すように、再生装置1201は、音処理部1207と、録画データ記録部1109と、映像処理部1210と、を機能的に備える。
【0083】
音処理部1207は、コーデック部108及び制御部109の一機能として実現され、録画データ記録部1109に記録された音データに対し、ヘッダに書き込まれたマイク位置、撮影時の画像サイズや画角、雑音除去用座標、及び雑音除去設定時間に基づいて、雑音除去を行う。音処理部1207は、雑音除去後の音データを、スピーカ112から出力する。
【0084】
映像処理部1210は、図1に示すコーデック部108と、制御部109と、表示部111と、から実現され、録画データ記録部1109に記録されている映像データを再生する。
【0085】
以下に上述した物理的及び機能的構成を有する再生装置1201の動作を説明する。
視聴者がキー入力部107を操作する等して、録画データ再生開始を指示すると、制御部109は、図15のフローチャートに示す処理を開始する。音処理部1207は、録画データ内の雑音除去用パラメータを読み出し(ステップS1501)、再生時間が録画時の雑音除去設定時間(図13の雑音除去設定1では、5秒)に達しているかどうか判断する(ステップS1502)。再生時間が雑音除去設定時間に達していない場合には(ステップS1502;No)、何れか一つの音データを読み出し(ステップS1510)、その音データの再生を行なう(ステップS1508)。ステップS1510では、音データ1を読み出している。
【0086】
再生時間が雑音除去設定時間に達している場合には(ステップS1502;Yes)、音処理部1207は、雑音除去が設定されているか判断する(ステップS1503)。雑音除去が設定されている場合は(ステップS1503;Yes)、映像上の座標(図13の雑音除去設定1では、x軸:200ドット、y軸:100ドット)から、三次元空間上の角度を算出し(ステップS1504)、雑音除去用パラメータを変更する(ステップS1505)。その後、録画データ内の音データを読み出し(ステップS1506)、音処理部1207は、雑音除去用パラメータを用いて音の明瞭度を向上する雑音除去を行なう(ステップS1508)。雑音除去後は一つの音データが生成されるので、その音データの再生を行なう(ステップS1507)。その後、再生時間の更新を行い(ステップS1509)、再生が終了しない場合(ステップS1511;No)は、ステップS1502の再生時間が雑音除去設定時間に達しているかどうかの判断が、継続して行なわれる。ここで、再生時間が、最初の、録画時の雑音除去設定に記録されている時間である5秒を経過した後は、雑音除去設定時間は、次の録画時の雑音除去設定に記録されている時間である10秒とする。
【0087】
雑音除去が設定されていない場合は(ステップS1503;No)、ステップS1510以降の処理を行う。再生停止等の操作入力により、又は全部分を再生し終わると(ステップS1511;Yes)、再生処理を終了する。
【0088】
以上の処理により、録画時に雑音除去を行なう角度などを記録し、再生時に利用することができ、撮影者の意図が反映された再生が可能な再生機能を提供できる。
【0089】
また、実施形態3に係る記録再生装置では、図13のファイルフォーマット“録画時の雑音除去設定”の映像上の座標(雑音除去用座標)の替わりに、映像上の座標から算出した三次元空間上の角度としても良い。
【0090】
上述した実施形態2及び実施形態3に係る再生装置では、録画データを再生する際、再生装置が雑音除去処理などに未対応の場合には、雑音除去に用いる情報は読み飛ばされ、映像データ及び音データ1のみが読み出され、再生可能となる。
【0091】
(実施形態4)
実施形態4では、実施形態1ないし3とは異なり、音データや雑音除去用パラメータを、汎用的な動画ファイルフォーマットで記録された映像データとは別の領域に記録する。汎用的な動画ファイルフォーマットとは、携帯電話機の録画フォーマットの一つである3GPP2(Third Generation Partnership Project 2)、パソコンで再生可能な動画フォーマットの一つであるAVI(Audio Video Interleave)、近年ビデオカメラに採用されつつあるAVCHD(Advanced Video Codec High Definition)などがあげられる。実施形態1と同様に、図1に示す物理構成により、図16に示す機能構成が実現される。
【0092】
記録装置1601は、音処理部1607と、雑音除去用データ記録部1608と、録画データ記録部1609と、を機能的に備える。
【0093】
音処理部1607は、コーデック部108及び制御部109の一機能として実現され、マイクロフォン103〜106から取り込まれた音データを受け取る。受け取ったデータを、適宜雑音除去用データ記録部1608又は録画データ記録部1609に書き込む。例えば、音データ1と音データ2や実施形態2で説明したマイク位置などの雑音除去用パラメータは、雑音除去用データ記録部1608に記録し、録画データ記録部1609には、音データ3と音データ4のみを記録する。また、雑音除去用パラメータに基づいて音データの雑音除去を行う。
【0094】
雑音除去用データ記録部1608は、記録部110に確保され、マイク位置、撮影時の画像サイズや画角、及びマイクロフォン103〜106で取り込んだ音をそのまま、或いは、圧縮した音データを格納する。
【0095】
録画データ記録部1609は、記録部110に確保され、マイクロフォン103〜106で取り込んだ音をそのまま、或いは、圧縮した音データを格納する。また、撮影部102より撮影された映像データを格納する。
【0096】
雑音除去用データ記録部1608内のデータは、録画データ記録部1609内の録画データに隣接して配置して一つの電子ファイルとして保存しても良いし、別の電子ファイルとしても良い。
【0097】
なお、図16で説明したデータ配置の録画データを、上述した汎用的な動画ファイルフォーマットのみ対応している再生装置で再生する場合は、汎用的な動画ファイルフォーマットで記録される、録画データ記録部1609内の録画データのみが読み出され、再生可能である。また、記録装置内の撮影したデータを、汎用的な動画ファイルフォーマットのみ対応している再生装置にコピーする場合、録画データ記録部1609内の録画データファイルのみを選択し、コピーすれば良いので、コピーする際のデータ容量を削減することも可能となる。
【0098】
以上の機能により、撮影した動画データを、通常の再生機器で再生することが可能な再生の互換性を持ち、利用価値が高い記録装置を提供できる。
【0099】
また、上述した実施形態1ないし実施形態4に係る記録再生装置では、図17に示す記録再生装置1701のように、カメラに対するマイクロフォンの位置を変更することが可能な場合もある。したがって、本発明の記録再生装置は、筐体の姿勢検出手段を備え、筐体の各姿勢に対したマイクロフォン1703〜1706の座標テーブルを、例えば雑音除去用データ記録部に予め格納するようにしてもよい。その場合、姿勢検出手段が録画時及び再生時の筐体の姿勢を検出すると、その姿勢に対応したマイクロフォンの位置座標がテーブルを参照して求られ、音処理部によってヘッダ領域のマイクロフォン位置情報に書き込まれる。
【0100】
また、上述した実施形態2ないし実施形態4に係る記録再生装置では、上記の雑音除去用パラメータに加えて、雑音除去を行なうためのサンプリング周波数や、雑音除去用座標から算出した角度に対する補正値、各マイクの録音性能などを記録しても良い。さらに、再生時のマシンパワー抑制や性能向上のために、録画時に検出した音源方向などを記録しても良い。
【0101】
また、上述の実施形態2ないし実施形態4に係る記録再生装置では、撮影中に映像のズームが行なわれる場合があり、撮影時の画角が変更になる。そこで、図8や図13に示したファイルフォーマット中の撮影時の画角は、図13のファイルフォーマット中の録画時の雑音除去設定の如く、映像ズームの操作が行われるたびに、録画経過時間と共に記録するようにしても良い。再生時には、再生経過時間が、映像ズームを行なった時間に達するたびに、撮影時の画角を変更して、雑音除去用パラメータを変更する。この処理により、映像のズームを行ないながら撮影した動画データを再生する場合でも、撮影者の意図、或いは、視聴者の嗜好に合った再生機能を提供できる。
【0102】
また、上述の実施形態2ないし実施形態3に係る記録再生装置では、各マイクロフォンで取り込んだ音をそれぞれ個別に格納するのみではなく、DolbyDigital(AC−3)の如く、複数の音データの圧縮、符号化を行い、一つの電子ファイルとして格納しても良い。その場合には、図9のステップS905や、図15のステップS1506では、全音データを読み出すとあるが、上記、符号化後の一つの電子ファイルを読み出し、復号することで、符号化前の全ての音データを入手する。また、図9のステップS909や、図15のステップS1510では、音データ1を読み出すとあるが、符号データを用いる場合には、符号化後の一つの電子ファイルを復号することで、符号化前の全ての音データを入手し、その内の一つの音データを入手する。このように、音データを格納する際に圧縮した符号化データを用いることにより、録画データのファイルサイズを小さくすることが可能となる。
【図面の簡単な説明】
【0103】
【図1】本発明の実施形態1に係る記録再生装置の物理的構成の一例を示すブロック図である。
【図2】本発明の実施形態1に係るマイクロフォンの設置場所の一例を表す図である。
【図3】本発明の実施形態1に係る記録再生装置の機能を表す図である。
【図4】本発明の実施形態1に係る、マイクロフォンと音源の角度との関係図である。
【図5】本発明の実施形態1に係る、録画時の処理の流れを示すフローチャート図である。
【図6】本発明の実施形態2に係る記録装置の機能を表す図である。
【図7】本発明の実施形態2に係る再生装置の機能を表す図である。
【図8】本発明の実施形態2に係る、録画データのファイルフォーマットを示す図である。
【図9】本発明の実施形態2に係る、再生時の処理の流れを示すフローチャート図である。
【図10】本発明の実施形態2に係る、撮影時の三次元空間と、表示部の映像との関係を示す図である。
【図11】本発明の実施形態3に係る記録装置の機能を表す図である。
【図12】本発明の実施形態3に係る再生装置の機能を表す図である。
【図13】本発明の実施形態3に係る、録画データのファイルフォーマットを示す図である。
【図14】本発明の実施形態3に係る、録画時の処理の流れを示すフローチャート図である。
【図15】本発明の実施形態3に係る、再生時の処理の流れを示すフローチャート図である。
【図16】本発明の実施形態4に係る記録装置の機能を表す図である。
【図17】本発明の実施形態1ないし実施形態4に係るマイクロフォンの設置場所の他の例を表す図である。
【符号の説明】
【0104】
101,1701…記録再生装置、601,1101,1601…記録装置、701,1201…再生装置、102…撮影部、103,104,105,106,410,420,1703,1704,1705,1706…マイクロフォン、107…キー入力部、108…コーデック部、109…制御部、110…記録部、111…表示部、112…スピーカ、1702…カメラ、302,702,1110…入力部、307,607,707,1107,1207,1607…音処理部、308,608,708,1108,1608…雑音除去用データ記録部、309,609,1109,1609…録画データ記録部、309a…雑音除去後の音データ記録部、309b…映像データ記録部、310,710,1210…映像処理部、400,1001…音源、412,422…音データ、1002…表示部の映像領域、1003…表示部の映像領域上の音源
【技術分野】
【0001】
本発明は、記録媒体に記録されている音声データを再生する再生装置、音声データを記録媒体に記録する記録装置、及びそれらのプログラムに関する。
【背景技術】
【0002】
今日、録画機能付き機器が多数製品化されており、画面光学ズームや明るさ調整など、録画時の多数の機能が盛り込まれている。録画の際には音声の録音も可能であり、目的とする被写体からの音の明瞭度を向上する機能が望まれている。
【0003】
特許文献1には、複数のマイクロフォンで取得した音データから、個々の音源の方向を推定し、個々の音源を分離抽出する手法が記載されている。この手法を用いれば、目的とする音源以外の音を抑圧することで、特定の角度からの音の明瞭度を向上する(以降、雑音除去とする)ことが可能である。
【0004】
また、特許文献2には、ズーム画像を撮影する際に、撮影方向以外からの音を排除して、撮影方向の狭い範囲の音に絞って集音し、周波数成分の低域成分と高域成分を強調する事で、音源の間近で聞いたときの音質を再現する手法が提案されている。
【0005】
【特許文献1】特開2002−84590号公報
【特許文献2】特開2004−328052号公報
【発明の開示】
【発明が解決しようとする課題】
【0006】
特許文献1及び2に開示されている手法では録音時に、音の明瞭度が向上した音データを録音するのみである。そのため、録画データの再生時に、雑音除去を行なっていない元の音の再生や、撮影方向以外からの音等、任意の方向からの音の明瞭度を向上することなどができず、視聴者の嗜好に合った音を再生することができない。
【0007】
この発明は、上記実情に鑑みてなされたものであり、再生時に視聴者の嗜好に合った音の再生を可能とすることを目的とする。
【課題を解決するための手段】
【0008】
本発明の第1の観点に係る再生装置は、
複数のマイクロフォンの位置関係を示す位置関係データと、前記複数のマイクロフォンで取得した音データとが記録された記録媒体から、前記音データを再生する再生装置であって、
録音時に前記マイクロフォンにより集音された音のうちの、抽出する音の到来方向を示す抽出方向データを入力する入力手段と、
前記記録媒体に記録されている前記位置関係データと前記入力手段により入力された前記抽出方向データとに基づいて、前記記録媒体に記録されている前記音データのうちから、前記入力手段により入力された前記抽出方向データにより特定される方向から前記マイクロフォンに到来した音を抽出する抽出手段と、
前記抽出手段で抽出された前記音データを再生する再生手段と、
を備えることを特徴とする。
【0009】
好ましくは、
前記記録媒体には、前記位置関係データと前記音データとに加えて映像データが記録されており、
前記映像データを再生する映像再生手段をさらに備え、
前記入力手段は、前記映像再生手段で再生された映像上で、抽出する音の到来方向を示す場所を示すデータを入力する、
ことを特徴とする。
【0010】
さらに好ましくは、
前記記録媒体には、時間データと音を抽出する方向を示すデータとが対応付けられてさらに記録されており、
再生開始から経過時間を計測する計時手段をさらに備え、
前記入力手段は、前記記録媒体に記録されている方向を指定するデータを前記抽出方向データとして入力し、
前記抽出手段は、前記計測手段を用いて計測した再生開始からの経過時間が、記録されている時間データが指示する時間に達した時点で、前記時間データに対応付けて保存されていた前記音を抽出する方向を示すデータから音を抽出する方向を求め、求めた方向から前記マイクロフォンに到来した音を抽出する、
ことを特徴とする。
【0011】
上記目的を達成するため、本発明の第2の観点に係る記録装置は、
複数のマイクロフォンと、
前記複数のマイクロフォンの位置関係を示す位置関係データを記憶する位置関係データ記憶手段と、
前記位置関係データ記憶手段に記憶されている前記位置関係データと、前記複数のマイクロフォンで取得した音データと、を記録媒体に記録する記録手段と、
を備えることを特徴とする。
【0012】
好ましくは、
前記位置関係データに基づいて、前記複数のマイクロフォンで取得した複数の音データのうちから、特定の方向からの音の音データを抽出する抽出手段を有し、
前記記録手段は、前記抽出手段により抽出された前記音データを前記記録媒体に記録する、
ことを特徴とする。
【0013】
さらに好ましくは、
前記特定の方向を入力する入力手段を備えることを特徴とする。
【0014】
さらに好ましくは、
前記記録手段による音データの記録開始からの経過時間を計測する計時手段と、
音を抽出する方向を示す抽出方向データを入力する入力手段と、をさらに有し、
前記記録手段は、前記音データと共に、前記入力手段により入力された前記抽出方向データと、前記抽出方向データが入力されたタイミングで前記計時手段が計時している経過時間と、を前記記録媒体に記録する、
ことを特徴とする。
【0015】
さらに好ましくは、
撮像手段と、前記撮像手段により撮像された映像データが定義する映像を表示する表示手段とをさらに有し、
前記記録手段は前記音データに加えて前記映像データを前記記録媒体に記録し、
前記入力手段は、前記表示手段に表示された映像上の場所を指定する手段とし、指定された映像上の場所に対応する方向を示すデータを、音を抽出する方向を示す抽出方向データとする、
ことを特徴とする。
【0016】
本発明の第3の観点に係るプログラムは、
複数のマイクロフォンの位置関係を示す位置関係データと、前記複数のマイクロフォンで取得した音データとが記録された記録媒体から、前記音データを再生するコンピュータを、
録音時に前記マイクロフォンにより集音された音のうちの、抽出する音の到来方向を示す抽出方向データを入力する入力手段、
前記記録媒体に記録されている前記位置関係データと前記入力手段により入力された前記抽出方向データとに基づいて、前記記録媒体に記録されている前記音データのうちから、前記入力手段により入力された前記抽出方向データにより特定される方向から前記マイクロフォンに到来した音を抽出する抽出手段、
前記抽出手段で抽出された前記音データを再生する再生手段、
として機能させることを特徴とする。
【0017】
本発明の第4の観点に係るプログラムは、
複数のマイクロフォンに接続されたコンピュータを、
前記複数のマイクロフォンの位置関係を示す位置関係データを記憶する位置関係データ記憶手段、
前記位置関係データ記憶手段に記憶されている前記位置関係データと、前記複数のマイクロフォンで取得した音データと、を記録媒体に記録する記録手段、
として機能させることを特徴とする。
【発明の効果】
【0018】
本発明によれば、音データの再生時に、特定された方向からの音を再生する事ができ、視聴者の嗜好に合った再生を可能とする機能を提供できる。
【発明を実施するための最良の形態】
【0019】
(実施形態1)
本発明の実施形態1に係る記録再生装置を、図1ないし図5を用いて説明する。
実施形態1の記録再生装置101は、録音時に雑音除去を行う機能を備える。
まず、記録再生装置101の物理的な構成について説明する。記録再生装置101は、図1に示すように、撮影部102、マイクロフォン103〜106、キー入力部107、コーデック部108、制御部109、記録部110、表示部111、スピーカ112を備える。
【0020】
撮影部102はCCD(Charge Coupled Device)カメラ、CMOS(Complimentary MOS)センサ等から構成され、映像を撮影し、映像を電気信号に変換する。
【0021】
マイクロフォン103〜106は、音を集音し、集音した音をアナログ信号に変換する。
【0022】
キー入力部107は、電源スイッチ、録音及び録画ボタン等を備え、マイクロフォン103〜106及びカメラの起動や録音及び録画の開始・終了等の操作入力を受け付け、操作情報を制御部109に送る。
【0023】
コーデック部108は、撮影部102から取り込んだ映像やマイクロフォン103〜106から取り込んだ音を圧縮及び再生するために復号する。コーデック部108は、映像用のコーデック部と、音用のコーデック部とに分けても良い。
【0024】
制御部109は、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)等から構成され、システム全体の動作を制御する。
【0025】
記録部110は、ROM、フラッシュメモリ、HDD(Hard Disk Drive)等から構成され、撮影部102から取り込んだ映像、マイクロフォン103〜106から取り込んだ音、及びマイク位置情報等を格納する。
【0026】
表示部111は、LCD(Liquid Crystal Display)又は有機ELディスプレイ(organic Electro-Luminescence display)、及びドライバ等から構成され、撮影部で撮影した映像を表示する。
【0027】
表示部111は映像描画が可能なタッチパネルディスプレイから構成されてもよく、キー入力部107の替わりに、ユーザ操作入力を受け付けるようにしてもよい。
【0028】
スピーカ112は、増幅器、マイクロスピーカ等から構成され、制御部109から送られるアナログ音信号に基づいて音を出力する。
【0029】
上記構成において、マイクロフォン103〜106と撮影部102とは、明瞭度向上のため、撮影部102の光軸をX軸とし、X軸に互いに垂直なY軸とZ軸とを定義した場合に、X軸上、Y軸上、Z軸上でそれぞれ位置の異なるマイクロフォンが存在するように、配置されている。即ち、図2に例示するように、撮影部102を原点として、三次元空間上でX、Y,Z軸方向に、互いに異なる位置に配置されている。例えば、図2に示す例では、撮影部102の設置面の異なる位置に、マイクロフォン103、104、106が配置され、裏面にマイクロフォン105が配置されている。
【0030】
次に、図1に示す物理的構成を有する記録再生装置101により実現される機能構成を、図3を用いて説明する。
図示するように、記録再生装置101は、入力部302と、音処理部307と、雑音除去用データ記録部308と、録画データ記録部309と、映像処理部310と、を機能的に備える。
【0031】
入力部302は、図1のキー入力部107及び制御部109の一機能として実現され、撮影者による操作入力を受け付ける。入力部302は、例えば、明瞭度を向上させる音源の方向(音抽出角度範囲)を特定するための情報を入力する。音抽出角度範囲を特定する手法は任意であるが、例えば、撮影部102で撮影された映像を表示部111に表示させ、表示部111の画面上の位置の座標(雑音除去用座標)情報を受け付け、座標方向変換を行って抽出対象の方向と特定してもよい。
【0032】
音処理部307は、図1に示すコーデック部108及び制御部109の一機能として実現され、マイクロフォン103〜106から取り込んだ音データを受け取る。音処理部307は、受け取った音データ及びマイクロフォン103〜106の位置関係に基づいて、音源の向き(図2で説明したX、Y、Z座標における原点から音源へのベクトルと各軸のなす角度)を算出し、算出した角度が、例えば、入力部302により予め設定されている音抽出角度範囲から外れる場合には、減衰させることにより雑音除去を行う。さらに、音処理部307は、雑音除去後の音データを、マイク位置及び雑音除去用座標と共に、録画データ記録部309に書き込む。
【0033】
音処理部307が実施する雑音除去の手法自体は任意であるが、例えば、以下に示す手法を利用できる。まず、図4に示すように、4つのマイクロフォンのうちの任意の2つの組み合わせ(図4では、任意の2つのマイクロフォンを410と420で示す)に入射する音の相関を求めて、同一音が一方のマイクロフォンに入射してから他方のマイクロフォンに入射するまでの時間差TimeLagを求める。
マイクロフォン410と420との距離をd、音速をCとすると、マイクロフォン410と420と音源とを含む平面上で、マイクロフォン410と420とを結ぶ線に垂直な方向と音源の向きとが成す角度angleは、(1)式で表される。
angle = arcsin(C・TimeLag /d) … (1)
音処理部307は、式(1)から角度angleを求め、求めたangleを、図2に示すX,Y,Z座標上の各マイクロフォンの位置に基づいて、X、Y,Z座標系上の向きに補正する。
音処理部307は、他のマイクロフォンの組み合わせに関しても、同様に解析することにより、音源のX,Y,Z座標系上の原点からの向き(角度)を求める。
次に、音処理部307は、求めた音源の方向(到来方向)が、音の明瞭度を高める範囲である音抽出範囲に入っているか否かを判別し、入っていなければ、その音を減衰させる。
【0034】
雑音除去用データ記録部308は、記録部110に確保され、撮影部102とマイクロフォン103〜106の位置関係を示す情報や、入力部302により設定された上記音抽出角度範囲を定義するデータを予め記録する。また、音処理部307で求められた音源の方向を示すデータを格納する。
【0035】
録画データ記録部309は、記録部110に確保され、雑音除去後の音データ記録部309aと映像データ記録部309bとを備える。
雑音除去後の音データ記録部309aは、音処理部307による雑音処理が完了した音データを格納する。
映像データ記録部309bは、撮影部102により撮影された映像データを格納する。
【0036】
再生時には、音処理部307は、録画データ記録部309の雑音除去後の音データ記憶部309aに格納されている雑音除去済の音データが読み出し、スピーカ112から出力する。
【0037】
映像処理部310は、図1に示すコーデック部108と、制御部109と、表示部111と、から実現され、映像データ記録部309bに記録されている映像データを再生する。
【0038】
次に、上述した物理的及び機能的構成を有する記録再生装置101の動作を説明する。
【0039】
まず、記録再生装置101の録画時の動作を説明する。なお、映像を記録する動作は基本的に従来と同一であり、以下、理解を容易にするため、本実施形態に特有な雑音除去処理と雑音除去済音データを記録する処理を中心に説明する。
【0040】
撮影者がキー入力部107を操作する等して、録画開始指示をすると、制御部109は、図5のフローチャートに示す処理を開始し、まず、撮影部102で撮影した映像データを録画データ記録部309の映像データ記録部309bに記録する処理を開始する(ステップS501)。この映像データの記録は、録画終了が指示されるまで継続される。
【0041】
音処理部307は、雑音除去用データ記録部308に記録されているマイク位置情報、雑音除去用座標を読み出し、録画データのヘッダ領域に書き込む(ステップS502)。その後、音処理部307は、音データ及びマイク位置に基づいて音源の方向(角度)を算出する(ステップS503)。
続いて、音処理部307は、音抽出角度範囲外から到来する雑音を除去することにより、雑音除去を行う(ステップS504)。音処理部307は、雑音除去後の音データを録画データ記録部309の雑音除去後の音データ記録部309aに書き込む(ステップS505)。次に、音処理部307は、録画の終了が指示されたか否かを判別し(ステップS506)、録画が終了していなければ(ステップS506;No)、ステップS503に戻り、上述の動作を繰り返す。一方、ステップS506で、録画終了が指示されたと判別された場合(ステップS506;Yes)、今回の録画処理を終了する。
【0042】
以上の処理により、入力部302で設定された音抽出角度範囲にある音源から記録再生装置101に到来する音の明瞭度が向上した音データを、映像データと共に記録媒体に録音する事が可能になる。
【0043】
一方、再生時には、この記録再生装置101は、録画データ記録部309に記録されている映像データと音データとを再生する。再生される音データは、既に、雑音除去処理済なので、明瞭な音が再生される。
【0044】
なお、以上の説明では、ユーザが入力部302を介して音抽出角度範囲を指定したが、音抽出角度範囲の設定手法は任意である。例えば、撮影部102が撮影した画像の中央を基準として所定範囲、フォーカスポイント(ピントが合っているポイント)、顔認識機能等によって顔であると認識されたエリア等を音抽出範囲として自動的に設定する構成としてもよい。
【0045】
(実施形態2)
上記実施形態1においては、録音時に雑音除去処理を行ったが、再生時に雑音除去を行うことも可能である。
以下、再生時に雑音除去を行う記録再生装置を実施形態2として、図6ないし図10を用いて説明する。なお、本実施形態では、理解を容易にするため、記録再生装置を、録画機能を有する記録装置601と再生機能を有する再生装置701に分けて説明する。
実施形態1と同様に、図1に示す物理構成により、図6及び図7に示す機能構成が実現される。
【0046】
図6に示すように、記録装置601は、音処理部607と、雑音除去用データ記録部608と、録画データ記録部609と、を機能的に備える。
【0047】
音処理部607は、コーデック部108及び制御部109の一機能として実現され、マイクロフォン103〜106から取り込まれた音データを受け取る。雑音除去を行なうことなく受け取った音データをそのまま、或いは圧縮して音データを作成し、録画データ記録部609に書き込む。また、雑音除去を行うためのパラメータであるマイク位置や、撮影時の画像サイズ及び画角を、音データと共に、録画データ記録部609に書き込む。
【0048】
雑音除去用データ記録部608は、記録部110に確保され、撮影部102とマイクロフォン103〜106の位置関係を示す情報を予め記録する。さらに、撮影部102によって計測された画像サイズ及び画角を格納する。
【0049】
録画データ記録部609は、記録部110に確保され、マイクロフォン103〜106で取り込んだ音をそのまま、或いは、圧縮した音データを格納する。その際、各マイクロフォンで取り込んだ音はそれぞれ個別に格納する。例えば、マイクロフォン103で取り込まれた音を音データ1、マイクロフォン104の音を音データ2、マイクロフォン105の音を音データ3、マイクロフォン106の音を音データ4として記録する。また、音処理部607によって書き込まれた、マイク位置、撮影時の画像サイズ及び画角を格納する。
さらに、撮影部102により撮影された映像データを格納する。
【0050】
音処理部607により録画データ記録部609に書き込まれる録画データのファイルフォーマットを図8に示す。録画データファイルは、ヘッダ領域に、機種、マイク個数、マイクロフォンの位置、撮影時の画像サイズ、及び画角等の情報を格納する。
【0051】
機種情報は、録画した記録装置以外の再生装置で再生する際に再生装置が録画データのファイルフォーマットに対応しているか否かの判断に利用することができる。また、機種情報によりマイクロフォンの個数及び位置情報を得ることもできる。
【0052】
マイクロフォンの個数情報は、位置情報を格納するマイクロフォンの個数を示す。図8では“4”と設定されているので、マイクロフォン1からマイクロフォン4までの合計四つのマイク位置を記録する。
【0053】
マイクロフォンの位置情報は、例えば、図2に示すマクロフォン103〜106の三次元空間上の位置を記録することができる。図8では、マイクロフォン103の位置は、マイクロフォン1の位置情報のX軸座標、Y軸座標、Z軸座標の順に記録される。同様に、マイクロフォン2の位置情報からマイクロフォン4の位置情報が記録される。また、図17のように、カメラに対するマイクロフォンの位置を変更することが可能な場合、筐体の姿勢によりカメラ1702とマイクロフォン1703〜1706の位置関係は変化する。
【0054】
さらに、撮影する映像の画像サイズ(図8では、x軸:852ドット、y軸:480ドット)及び撮影時の画角(図8では、水平方向画角:26度、垂直方法画角:16度)の情報を記録する領域がある。
【0055】
以上の、マイク個数、マイクロフォンの位置、画像サイズ及び撮影時の画角の情報に加え、後に説明する音源の三次元空間上の角度を、雑音除去に用いるパラメータ(雑音除去用パラメータ)とする。また、ヘッダ領域の後ろに、本体領域として、映像データや音データを記録する領域がある。なお、本体領域の映像データや音データ内に、各々のデータに対するヘッダ領域が存在する場合には、その領域に雑音除去用パラメータを記録しても良い。
【0056】
次に、上述した物理的及び機能的構成を有する記録装置601の動作を説明する。
撮影者がキー入力部107を操作する等して、録画開始指示をすると、制御部109は撮影部102で撮影した映像及びマイクロフォン103〜106によって取り込んだ音データを録画データ記録部609に記録する処理を開始する。まず、音処理部607は、雑音除去用データ記録部608に記録されているマイク位置情報、撮影時の画像サイズ及び画角を読み出し、録画データのヘッダ領域に書き込む。その後、音処理部607及び撮影部102より、音データ及び映像データが録画データ記録部609に書き込まれる。この映像データ及び音データの記録は、録画終了が指示されるまで継続され、録画終了が指示されると記録装置601が行う録画処理が終了する。
【0057】
次に、再生時に雑音除去を行なう再生装置701の詳細を示す。図7に示すように、再生装置701は、入力部702と、音処理部707と、雑音除去用データ記録部708と、録画データ記録部609と、映像処理部710と、を機能的に備える。
【0058】
入力部702は、キー入力部107、制御部109及び表示部111の一機能として実現され、再生時に視聴者が設定する、明瞭度を向上させる映像上の座標、すなわち雑音除去用座標を受け付け、雑音除去用データ記録部708に書き込む。例えば、撮影部102で撮影された映像を表示部111に表示させ、表示された映像上で任意の位置をユーザが指定する。
【0059】
音処理部707は、コーデック部108及び制御部109の一機能として実現され、画像サイズ、撮影時の画角、及び雑音除去用データ記録部708に格納された雑音除去用座標に基づいて明瞭度を向上させたい音源の三次元空間の角度を算出し、録画データ記録部609に記録された音データに対して雑音除去を行う。音処理部707は、雑音除去後の音データを、スピーカ112を介して出力する。
【0060】
雑音除去用データ記録部708は、記録部110に確保され、再生時に視聴者によって指定された、雑音除去用座標の情報を格納する。
【0061】
映像処理部710は、図1に示すコーデック部108と、制御部109と、表示部111と、から実現され、録画データ記録部609に記録されている映像データを再生する。
【0062】
次に、本実施形態に特有な処理をおこなう再生装置701の動作を説明する。
【0063】
視聴者がキー入力部107を操作する等して、録画データ再生開始を指示すると、制御部109は、図9のフローチャートに示す処理を開始する。音処理部707は録画データ記録部609に記録されている雑音除去用パラメータを読み出す(ステップS901)。ここで、雑音除去用パラメータの1つである音源の三次元空間上の角度はまだ算出されていないので、初期値を“NULL”とする。次に、視聴者の操作によって雑音除去用座標が設定されているかどうかの判定を行なう(ステップS902)。例えば、タッチパネル上に再生されている映像に対して、視聴者が音の明瞭度を向上したい場所をタッチすると、入力部702はその場所を雑音除去用座標として設定する。雑音除去用座標が設定されている場合(ステップS902;Yes)、音処理部707は、雑音除去用座標、撮影時の画像サイズ及び画角から、三次元空間上の角度を算出する(ステップS903)。
【0064】
例えば、以下に示す方法により、音源の三次元空間の角度が求められる。
図10に、撮影時の三次元空間と、表示部の映像との関係を示す。撮影する実際の三次元空間上をカメラの中心を原点としてX軸、Y軸、Z軸で表し、XY平面上に音源1001がある。また、撮影した映像を、表示部の映像領域1002(例えば、タッチパネルの映像領域)とし、図の垂直方向がy軸、水平方向がx軸とする。三次元空間上の音源1001は、表示部の映像領域1002上の音源1003として映し出されており、x軸方向に対して映像の中央から100ドットだけ離れている。表示部の映像領域1002を見ている視聴者が音源1003に対して明瞭度を向上したい場合には、タッチパネル上の音源1003の場所をタッチすることで、雑音除去用座標にx軸方向の値100が設定される。
【0065】
図10において、撮影時は判明している撮影した映像の最大座標(画像サイズのx軸の値)をW、視聴者操作により指定された雑音除去用座標のx軸の値を100ドット、撮影時に判明している撮影時の画角をangle_max、明瞭度を向上したい三次元空間上の角度をangleとすると、式(2)が成り立つ。
W / 2 : 100 = tan(angle_max) : tan(angle) … 式(2)
式(2)を変形すると、明瞭度を向上したい三次元空間上の角度angleは、式(3)で表わされる。
angle = arctan ( tan(angle_max) * 200 / W ) … 式(3)
撮影時の画角(angle_max)及び画像サイズ(W)の値は録画データのヘッダ領域に格納されているので、その値を参照することによって、angleを求めることができる。
【0066】
三次元空間上の角度を算出(ステップS903)した後、音処理部707は雑音除去用パラメータを変更する(ステップS904)。さらに、音処理部707は、録画データ記録部609の全音データを読み出し(ステップS905)、音の明瞭度を向上する雑音除去を行なう(ステップS906)。上記式(3)で算出した明瞭度を向上したい三次元空間上の角度angleを、前述の式(1)のangleに代入する事で、二つのマイクから取り込んだ音データの時間差TimeLagを得る事ができる。このTimeLagだけの時間差が生じた二つの音データに対して、一方のみ、或いは、TimeLagだけずらして加算した音データを生成することにより、音の明瞭度を向上する雑音除去が可能となる。
【0067】
音処理部707は、雑音除去を施した一つの音データを生成する。音処理部707及び映像処理部710は音データ及び録画された映像データを再生する(ステップS907)。再生が終了しない場合(S908;No)は、ステップS902を再度行なう。ここで、視聴者が明瞭度を向上したい場所を、一旦タッチする事で、雑音除去用座標は設定されているので、二回目以降も、ステップS903以降の処理を行うことになる。なお、視聴者が設定した座標に変更がない場合には、ステップS903及びステップS904の処理は割愛し、ステップS905から行っても良い。
【0068】
また、ステップS902にて、雑音除去用座標の設定が一回も無い場合には、音処理部707は、録画データ記録部609の任意の音データを読み出し(例えば音データ1)(ステップS909)、その音データを再生する(ステップS907)。再生停止等の操作入力により、又は全部分を再生し終わると(ステップS908;Yes)、再生処理を終了する。
【0069】
なお、動画再生中の画面には、雑音除去用座標をクリアする指示に対応した項目があり、視聴者により上記項目が選択された場合には、音処理部707は、雑音除去用座標をクリアし、雑音除去用座標は未設定となり、音源の三次元上の角度は初期値“NULL”に戻る。雑音除去を行いながら動画再生中に、視聴者が、上記雑音除去用座標をクリアする指示に対応した項目を選択した場合、雑音除去用座標がクリアされるので、ステップS902の後は、ステップS909を実行する。
【0070】
また、視聴者が別の明瞭度を向上したい座標を設定することも可能であり、映像上の座標から、三次元空間上の角度を算出し直し(ステップS903)、雑音除去用パラメータの変更を行う(ステップS904)ことにより、別の角度の明瞭度が向上した音データを得る事ができる。さらには、再生中に、明瞭度を向上したい映像上の座標を指定するたびに、指定した時間と、雑音除去用パラメータを雑音除去用データ記録部708に保存しても良い。その後、動画再生を一旦終了し、再度、最初から、或いは、途中から動画再生を行なう際、事前に保存しておいた雑音除去用パラメータを用いて雑音除去を行なっても良い。
【0071】
以上の処理により、録画後の再生時に、視聴者が明瞭度を向上したい音の角度を指定する事ができ、視聴者の嗜好に合った再生機能を提供できる。
【0072】
(実施形態3)
上記実施形態2においては、再生時に明瞭度を向上させたい音の位置情報を設定したが、録画時に明瞭度を向上させたい音の位置情報を設定することも可能である。実施形態3では、撮影者が設定した、映像上の座標及び時間を録画時に記録し、その設定に基づいて再生時に雑音除去を行う。実施形態3を、図11ないし図15を用いて説明する。なお、実施形態2と同様に、記録再生装置を、録画機能を有する記録装置1101と再生機能を有する再生装置1201に分けて説明する。
実施形態1と同様に、図1に示す物理構成により、図11及び図12に示す機能構成が実現される。
【0073】
記録装置1101は、音処理部1107と、雑音除去用データ記録部1108と、録画データ記録部1109と、入力部1110と、を機能的に備える。
【0074】
音処理部1107は、コーデック部108及び制御部109の一機能として実現され、マイクロフォン103〜106から取り込まれた音データを受け取る。雑音除去を行なうことなく受け取った音データをそのまま、或いは圧縮して音データを作成し、録画データ記録部1109に書き込む。また、録画開始後に雑音除去用パラメータであるマイク位置、撮影時の画像サイズ及び画角を雑音除去用データ記録部1108から録画データ記録部1109に書き込む。さらに、録画時に入力部1102において雑音除去用座標が設定された場合に、その設定時からの経過時間を計測し、経過時間(雑音除去設定時間)及び雑音除去用座標を録画データ記録部1109に書き込む。
【0075】
雑音除去用データ記録部1108は、記録部110に確保され、撮影部102によって計測された、マイク位置、撮影時の画像サイズ及び画角を格納する。また入力部1110に入力された雑音除去用座標を格納する。
【0076】
録画データ記録部1109は、記録部110に確保され、マイクロフォン103〜106で取り込んだ音をそのまま、或いは、圧縮した音データを格納する。その際、実施形態2と同様に、各マイクロフォンで取り込んだ音はそれぞれ個別に格納する。また、マイク位置、撮影時の画像サイズ及び画角、雑音除去用座標、及び雑音除去設定時間を格納する。さらに撮影部102により撮影された映像データを格納する。
【0077】
入力部1110は、キー入力部107、制御部109及び表示部111の一機能として実現され、録画時に撮影者が設定した、雑音除去用座標を受け付け、雑音除去用データ記録部1108に書き込む。例えば、撮影部102で撮影されている映像を表示部111に表示させ、表示された映像上で任意の位置をユーザが指定する。
【0078】
ここで、音処理部1107により録画データ記録1109に書き込まれる録画データのファイルフォーマットを図13に示す。実施形態2のファイルフォーマットの内容に加え、雑音除去座標及び雑音除去設定時間の情報を含む“録画時の雑音除去設定”の項目が付加される。この設定に従い、再生装置1201は、録画データ記録部1109に格納された音データに対し雑音除去を行う。撮影者が設定した映像上の座標をx軸及びy軸とする。雑音除去を行なわない場合は“なし”と設定する。以上の、マイク個数、マイクロフォンの位置、画像サイズ及び撮影時の画角、雑音除去用座標、雑音除去設定時間、及び音源の三次元空間上の角度などの情報を、雑音除去用パラメータとする。
【0079】
次に、上述した物理的及び機能的構成を有する記録装置1101の動作を説明する。
【0080】
撮影者がキー入力部107を操作する等して録画開始指示をすると、制御部109は、図14のフローチャートに示す処理を開始し、撮影部102で撮影した映像データ及びマイクロフォン103〜106で取り込んだ音データを録画データ記録部1109に記録する処理を開始する(ステップS1401)。音処理部1107は録画データのヘッダ領域にマイク数及びマイク位置などを書き込む(ステップS1402)。その後、音処理部1107は、撮影者の操作により雑音除去用座標が変更されているか判断する(ステップS1403)。なお、録画撮影開始時の初期値としては、雑音除去処理を行わない設定とする。雑音除去用座標が変更されている場合には(ステップS1403;Yes)、音処理部1107は録画データのヘッダ領域に雑音除去用座標及び雑音除去設定時間を記録する(ステップS1404)。
【0081】
明瞭度を向上したい映像上の座標が変更されていない場合(ステップS1403;No)、或いは、ヘッダ領域への書き込み(ステップS1404)終了後は、映像データ及び全てのマイクロフォンから得られた音データは録画データの本体領域に書き込まれる(ステップS1405)。その際、マイクロフォンから得られた複数の音データは、一つの連続した音データとして記録し、四つのマイクロフォンの場合は、四つの異なる音データとして記録しても良い。或いは、各々のマイクロフォンから得られた複数の音データを、32ミリ秒などの処理単位時間毎に、順次一つの連続した音データとして記録しても良い。録画停止等の操作入力により録画が終了すると(ステップS1406;Yes)、録画処理を終了し、録画が終了しない場合(ステップS1406;No)は、ステップS1403を再度行う。
【0082】
次に、録画時に設定された雑音除去設定に従って、再生処理を行う再生装置1201について説明する。図12に示すように、再生装置1201は、音処理部1207と、録画データ記録部1109と、映像処理部1210と、を機能的に備える。
【0083】
音処理部1207は、コーデック部108及び制御部109の一機能として実現され、録画データ記録部1109に記録された音データに対し、ヘッダに書き込まれたマイク位置、撮影時の画像サイズや画角、雑音除去用座標、及び雑音除去設定時間に基づいて、雑音除去を行う。音処理部1207は、雑音除去後の音データを、スピーカ112から出力する。
【0084】
映像処理部1210は、図1に示すコーデック部108と、制御部109と、表示部111と、から実現され、録画データ記録部1109に記録されている映像データを再生する。
【0085】
以下に上述した物理的及び機能的構成を有する再生装置1201の動作を説明する。
視聴者がキー入力部107を操作する等して、録画データ再生開始を指示すると、制御部109は、図15のフローチャートに示す処理を開始する。音処理部1207は、録画データ内の雑音除去用パラメータを読み出し(ステップS1501)、再生時間が録画時の雑音除去設定時間(図13の雑音除去設定1では、5秒)に達しているかどうか判断する(ステップS1502)。再生時間が雑音除去設定時間に達していない場合には(ステップS1502;No)、何れか一つの音データを読み出し(ステップS1510)、その音データの再生を行なう(ステップS1508)。ステップS1510では、音データ1を読み出している。
【0086】
再生時間が雑音除去設定時間に達している場合には(ステップS1502;Yes)、音処理部1207は、雑音除去が設定されているか判断する(ステップS1503)。雑音除去が設定されている場合は(ステップS1503;Yes)、映像上の座標(図13の雑音除去設定1では、x軸:200ドット、y軸:100ドット)から、三次元空間上の角度を算出し(ステップS1504)、雑音除去用パラメータを変更する(ステップS1505)。その後、録画データ内の音データを読み出し(ステップS1506)、音処理部1207は、雑音除去用パラメータを用いて音の明瞭度を向上する雑音除去を行なう(ステップS1508)。雑音除去後は一つの音データが生成されるので、その音データの再生を行なう(ステップS1507)。その後、再生時間の更新を行い(ステップS1509)、再生が終了しない場合(ステップS1511;No)は、ステップS1502の再生時間が雑音除去設定時間に達しているかどうかの判断が、継続して行なわれる。ここで、再生時間が、最初の、録画時の雑音除去設定に記録されている時間である5秒を経過した後は、雑音除去設定時間は、次の録画時の雑音除去設定に記録されている時間である10秒とする。
【0087】
雑音除去が設定されていない場合は(ステップS1503;No)、ステップS1510以降の処理を行う。再生停止等の操作入力により、又は全部分を再生し終わると(ステップS1511;Yes)、再生処理を終了する。
【0088】
以上の処理により、録画時に雑音除去を行なう角度などを記録し、再生時に利用することができ、撮影者の意図が反映された再生が可能な再生機能を提供できる。
【0089】
また、実施形態3に係る記録再生装置では、図13のファイルフォーマット“録画時の雑音除去設定”の映像上の座標(雑音除去用座標)の替わりに、映像上の座標から算出した三次元空間上の角度としても良い。
【0090】
上述した実施形態2及び実施形態3に係る再生装置では、録画データを再生する際、再生装置が雑音除去処理などに未対応の場合には、雑音除去に用いる情報は読み飛ばされ、映像データ及び音データ1のみが読み出され、再生可能となる。
【0091】
(実施形態4)
実施形態4では、実施形態1ないし3とは異なり、音データや雑音除去用パラメータを、汎用的な動画ファイルフォーマットで記録された映像データとは別の領域に記録する。汎用的な動画ファイルフォーマットとは、携帯電話機の録画フォーマットの一つである3GPP2(Third Generation Partnership Project 2)、パソコンで再生可能な動画フォーマットの一つであるAVI(Audio Video Interleave)、近年ビデオカメラに採用されつつあるAVCHD(Advanced Video Codec High Definition)などがあげられる。実施形態1と同様に、図1に示す物理構成により、図16に示す機能構成が実現される。
【0092】
記録装置1601は、音処理部1607と、雑音除去用データ記録部1608と、録画データ記録部1609と、を機能的に備える。
【0093】
音処理部1607は、コーデック部108及び制御部109の一機能として実現され、マイクロフォン103〜106から取り込まれた音データを受け取る。受け取ったデータを、適宜雑音除去用データ記録部1608又は録画データ記録部1609に書き込む。例えば、音データ1と音データ2や実施形態2で説明したマイク位置などの雑音除去用パラメータは、雑音除去用データ記録部1608に記録し、録画データ記録部1609には、音データ3と音データ4のみを記録する。また、雑音除去用パラメータに基づいて音データの雑音除去を行う。
【0094】
雑音除去用データ記録部1608は、記録部110に確保され、マイク位置、撮影時の画像サイズや画角、及びマイクロフォン103〜106で取り込んだ音をそのまま、或いは、圧縮した音データを格納する。
【0095】
録画データ記録部1609は、記録部110に確保され、マイクロフォン103〜106で取り込んだ音をそのまま、或いは、圧縮した音データを格納する。また、撮影部102より撮影された映像データを格納する。
【0096】
雑音除去用データ記録部1608内のデータは、録画データ記録部1609内の録画データに隣接して配置して一つの電子ファイルとして保存しても良いし、別の電子ファイルとしても良い。
【0097】
なお、図16で説明したデータ配置の録画データを、上述した汎用的な動画ファイルフォーマットのみ対応している再生装置で再生する場合は、汎用的な動画ファイルフォーマットで記録される、録画データ記録部1609内の録画データのみが読み出され、再生可能である。また、記録装置内の撮影したデータを、汎用的な動画ファイルフォーマットのみ対応している再生装置にコピーする場合、録画データ記録部1609内の録画データファイルのみを選択し、コピーすれば良いので、コピーする際のデータ容量を削減することも可能となる。
【0098】
以上の機能により、撮影した動画データを、通常の再生機器で再生することが可能な再生の互換性を持ち、利用価値が高い記録装置を提供できる。
【0099】
また、上述した実施形態1ないし実施形態4に係る記録再生装置では、図17に示す記録再生装置1701のように、カメラに対するマイクロフォンの位置を変更することが可能な場合もある。したがって、本発明の記録再生装置は、筐体の姿勢検出手段を備え、筐体の各姿勢に対したマイクロフォン1703〜1706の座標テーブルを、例えば雑音除去用データ記録部に予め格納するようにしてもよい。その場合、姿勢検出手段が録画時及び再生時の筐体の姿勢を検出すると、その姿勢に対応したマイクロフォンの位置座標がテーブルを参照して求られ、音処理部によってヘッダ領域のマイクロフォン位置情報に書き込まれる。
【0100】
また、上述した実施形態2ないし実施形態4に係る記録再生装置では、上記の雑音除去用パラメータに加えて、雑音除去を行なうためのサンプリング周波数や、雑音除去用座標から算出した角度に対する補正値、各マイクの録音性能などを記録しても良い。さらに、再生時のマシンパワー抑制や性能向上のために、録画時に検出した音源方向などを記録しても良い。
【0101】
また、上述の実施形態2ないし実施形態4に係る記録再生装置では、撮影中に映像のズームが行なわれる場合があり、撮影時の画角が変更になる。そこで、図8や図13に示したファイルフォーマット中の撮影時の画角は、図13のファイルフォーマット中の録画時の雑音除去設定の如く、映像ズームの操作が行われるたびに、録画経過時間と共に記録するようにしても良い。再生時には、再生経過時間が、映像ズームを行なった時間に達するたびに、撮影時の画角を変更して、雑音除去用パラメータを変更する。この処理により、映像のズームを行ないながら撮影した動画データを再生する場合でも、撮影者の意図、或いは、視聴者の嗜好に合った再生機能を提供できる。
【0102】
また、上述の実施形態2ないし実施形態3に係る記録再生装置では、各マイクロフォンで取り込んだ音をそれぞれ個別に格納するのみではなく、DolbyDigital(AC−3)の如く、複数の音データの圧縮、符号化を行い、一つの電子ファイルとして格納しても良い。その場合には、図9のステップS905や、図15のステップS1506では、全音データを読み出すとあるが、上記、符号化後の一つの電子ファイルを読み出し、復号することで、符号化前の全ての音データを入手する。また、図9のステップS909や、図15のステップS1510では、音データ1を読み出すとあるが、符号データを用いる場合には、符号化後の一つの電子ファイルを復号することで、符号化前の全ての音データを入手し、その内の一つの音データを入手する。このように、音データを格納する際に圧縮した符号化データを用いることにより、録画データのファイルサイズを小さくすることが可能となる。
【図面の簡単な説明】
【0103】
【図1】本発明の実施形態1に係る記録再生装置の物理的構成の一例を示すブロック図である。
【図2】本発明の実施形態1に係るマイクロフォンの設置場所の一例を表す図である。
【図3】本発明の実施形態1に係る記録再生装置の機能を表す図である。
【図4】本発明の実施形態1に係る、マイクロフォンと音源の角度との関係図である。
【図5】本発明の実施形態1に係る、録画時の処理の流れを示すフローチャート図である。
【図6】本発明の実施形態2に係る記録装置の機能を表す図である。
【図7】本発明の実施形態2に係る再生装置の機能を表す図である。
【図8】本発明の実施形態2に係る、録画データのファイルフォーマットを示す図である。
【図9】本発明の実施形態2に係る、再生時の処理の流れを示すフローチャート図である。
【図10】本発明の実施形態2に係る、撮影時の三次元空間と、表示部の映像との関係を示す図である。
【図11】本発明の実施形態3に係る記録装置の機能を表す図である。
【図12】本発明の実施形態3に係る再生装置の機能を表す図である。
【図13】本発明の実施形態3に係る、録画データのファイルフォーマットを示す図である。
【図14】本発明の実施形態3に係る、録画時の処理の流れを示すフローチャート図である。
【図15】本発明の実施形態3に係る、再生時の処理の流れを示すフローチャート図である。
【図16】本発明の実施形態4に係る記録装置の機能を表す図である。
【図17】本発明の実施形態1ないし実施形態4に係るマイクロフォンの設置場所の他の例を表す図である。
【符号の説明】
【0104】
101,1701…記録再生装置、601,1101,1601…記録装置、701,1201…再生装置、102…撮影部、103,104,105,106,410,420,1703,1704,1705,1706…マイクロフォン、107…キー入力部、108…コーデック部、109…制御部、110…記録部、111…表示部、112…スピーカ、1702…カメラ、302,702,1110…入力部、307,607,707,1107,1207,1607…音処理部、308,608,708,1108,1608…雑音除去用データ記録部、309,609,1109,1609…録画データ記録部、309a…雑音除去後の音データ記録部、309b…映像データ記録部、310,710,1210…映像処理部、400,1001…音源、412,422…音データ、1002…表示部の映像領域、1003…表示部の映像領域上の音源
【特許請求の範囲】
【請求項1】
複数のマイクロフォンの位置関係を示す位置関係データと、前記複数のマイクロフォンで取得した音データとが記録された記録媒体から、前記音データを再生する再生装置であって、
録音時に前記マイクロフォンにより集音された音のうちの、抽出する音の到来方向を示す抽出方向データを入力する入力手段と、
前記記録媒体に記録されている前記位置関係データと前記入力手段により入力された前記抽出方向データとに基づいて、前記記録媒体に記録されている前記音データのうちから、前記入力手段により入力された前記抽出方向データにより特定される方向から前記マイクロフォンに到来した音を抽出する抽出手段と、
前記抽出手段で抽出された前記音データを再生する再生手段と、
を備えることを特徴とする再生装置。
【請求項2】
請求項1に記載の再生装置において、
前記記録媒体には、前記位置関係データと前記音データとに加えて映像データが記録されており、
前記映像データを再生する映像再生手段をさらに備え、
前記入力手段は、前記映像再生手段で再生された映像上で、抽出する音の到来方向を示す場所を示すデータを入力する、
ことを特徴とする再生装置。
【請求項3】
請求項1又は2に記載の再生装置において、
前記記録媒体には、時間データと音を抽出する方向を示すデータとが対応付けられてさらに記録されており、
再生開始から経過時間を計測する計時手段をさらに備え、
前記入力手段は、前記記録媒体に記録されている方向を指定するデータを前記抽出方向データとして入力し、
前記抽出手段は、前記計測手段を用いて計測した再生開始からの経過時間が、記録されている時間データが指示する時間に達した時点で、前記時間データに対応付けて保存されていた前記音を抽出する方向を示すデータから音を抽出する方向を求め、求めた方向から前記マイクロフォンに到来した音を抽出する、
ことを特徴とする再生装置。
【請求項4】
複数のマイクロフォンと、
前記複数のマイクロフォンの位置関係を示す位置関係データを記憶する位置関係データ記憶手段と、
前記位置関係データ記憶手段に記憶されている前記位置関係データと、前記複数のマイクロフォンで取得した音データと、を記録媒体に記録する記録手段と、
を備えることを特徴とする記録装置。
【請求項5】
請求項4記載の記録装置において、
前記位置関係データに基づいて、前記複数のマイクロフォンで取得した複数の音データのうちから、特定の方向からの音の音データを抽出する抽出手段を有し、
前記記録手段は、前記抽出手段により抽出された前記音データを前記記録媒体に記録する、
ことを特徴とする記録装置。
【請求項6】
請求項5記載の記録装置において、
前記特定の方向を入力する入力手段を備えることを特徴とする記録装置。
【請求項7】
請求項4記載の記録装置において、
前記記録手段による音データの記録開始からの経過時間を計測する計時手段と、
音を抽出する方向を示す抽出方向データを入力する入力手段と、をさらに有し、
前記記録手段は、前記音データと共に、前記入力手段により入力された前記抽出方向データと、前記抽出方向データが入力されたタイミングで前記計時手段が計時している経過時間と、を前記記録媒体に記録する、
ことを特徴とする記録装置。
【請求項8】
請求項6記載の記録装置において、
撮像手段と、前記撮像手段により撮像された映像データが定義する映像を表示する表示手段とをさらに有し、
前記記録手段は前記音データに加えて前記映像データを前記記録媒体に記録し、
前記入力手段は、前記表示手段に表示された映像上の場所を指定する手段とし、指定された映像上の場所に対応する方向を示すデータを、音を抽出する方向を示す抽出方向データとする、
ことを特徴とする記録装置。
【請求項9】
複数のマイクロフォンの位置関係を示す位置関係データと、前記複数のマイクロフォンで取得した音データとが記録された記録媒体から、前記音データを再生するコンピュータを、
録音時に前記マイクロフォンにより集音された音のうちの、抽出する音の到来方向を示す抽出方向データを入力する入力手段、
前記記録媒体に記録されている前記位置関係データと前記入力手段により入力された前記抽出方向データとに基づいて、前記記録媒体に記録されている前記音データのうちから、前記入力手段により入力された前記抽出方向データにより特定される方向から前記マイクロフォンに到来した音を抽出する抽出手段、
前記抽出手段で抽出された前記音データを再生する再生手段、
として機能させることを特徴とするプログラム。
【請求項10】
複数のマイクロフォンに接続されたコンピュータを、
前記複数のマイクロフォンの位置関係を示す位置関係データを記憶する位置関係データ記憶手段、
前記位置関係データ記憶手段に記憶されている前記位置関係データと、前記複数のマイクロフォンで取得した音データと、を記録媒体に記録する記録手段、
として機能させることを特徴とするプログラム。
【請求項1】
複数のマイクロフォンの位置関係を示す位置関係データと、前記複数のマイクロフォンで取得した音データとが記録された記録媒体から、前記音データを再生する再生装置であって、
録音時に前記マイクロフォンにより集音された音のうちの、抽出する音の到来方向を示す抽出方向データを入力する入力手段と、
前記記録媒体に記録されている前記位置関係データと前記入力手段により入力された前記抽出方向データとに基づいて、前記記録媒体に記録されている前記音データのうちから、前記入力手段により入力された前記抽出方向データにより特定される方向から前記マイクロフォンに到来した音を抽出する抽出手段と、
前記抽出手段で抽出された前記音データを再生する再生手段と、
を備えることを特徴とする再生装置。
【請求項2】
請求項1に記載の再生装置において、
前記記録媒体には、前記位置関係データと前記音データとに加えて映像データが記録されており、
前記映像データを再生する映像再生手段をさらに備え、
前記入力手段は、前記映像再生手段で再生された映像上で、抽出する音の到来方向を示す場所を示すデータを入力する、
ことを特徴とする再生装置。
【請求項3】
請求項1又は2に記載の再生装置において、
前記記録媒体には、時間データと音を抽出する方向を示すデータとが対応付けられてさらに記録されており、
再生開始から経過時間を計測する計時手段をさらに備え、
前記入力手段は、前記記録媒体に記録されている方向を指定するデータを前記抽出方向データとして入力し、
前記抽出手段は、前記計測手段を用いて計測した再生開始からの経過時間が、記録されている時間データが指示する時間に達した時点で、前記時間データに対応付けて保存されていた前記音を抽出する方向を示すデータから音を抽出する方向を求め、求めた方向から前記マイクロフォンに到来した音を抽出する、
ことを特徴とする再生装置。
【請求項4】
複数のマイクロフォンと、
前記複数のマイクロフォンの位置関係を示す位置関係データを記憶する位置関係データ記憶手段と、
前記位置関係データ記憶手段に記憶されている前記位置関係データと、前記複数のマイクロフォンで取得した音データと、を記録媒体に記録する記録手段と、
を備えることを特徴とする記録装置。
【請求項5】
請求項4記載の記録装置において、
前記位置関係データに基づいて、前記複数のマイクロフォンで取得した複数の音データのうちから、特定の方向からの音の音データを抽出する抽出手段を有し、
前記記録手段は、前記抽出手段により抽出された前記音データを前記記録媒体に記録する、
ことを特徴とする記録装置。
【請求項6】
請求項5記載の記録装置において、
前記特定の方向を入力する入力手段を備えることを特徴とする記録装置。
【請求項7】
請求項4記載の記録装置において、
前記記録手段による音データの記録開始からの経過時間を計測する計時手段と、
音を抽出する方向を示す抽出方向データを入力する入力手段と、をさらに有し、
前記記録手段は、前記音データと共に、前記入力手段により入力された前記抽出方向データと、前記抽出方向データが入力されたタイミングで前記計時手段が計時している経過時間と、を前記記録媒体に記録する、
ことを特徴とする記録装置。
【請求項8】
請求項6記載の記録装置において、
撮像手段と、前記撮像手段により撮像された映像データが定義する映像を表示する表示手段とをさらに有し、
前記記録手段は前記音データに加えて前記映像データを前記記録媒体に記録し、
前記入力手段は、前記表示手段に表示された映像上の場所を指定する手段とし、指定された映像上の場所に対応する方向を示すデータを、音を抽出する方向を示す抽出方向データとする、
ことを特徴とする記録装置。
【請求項9】
複数のマイクロフォンの位置関係を示す位置関係データと、前記複数のマイクロフォンで取得した音データとが記録された記録媒体から、前記音データを再生するコンピュータを、
録音時に前記マイクロフォンにより集音された音のうちの、抽出する音の到来方向を示す抽出方向データを入力する入力手段、
前記記録媒体に記録されている前記位置関係データと前記入力手段により入力された前記抽出方向データとに基づいて、前記記録媒体に記録されている前記音データのうちから、前記入力手段により入力された前記抽出方向データにより特定される方向から前記マイクロフォンに到来した音を抽出する抽出手段、
前記抽出手段で抽出された前記音データを再生する再生手段、
として機能させることを特徴とするプログラム。
【請求項10】
複数のマイクロフォンに接続されたコンピュータを、
前記複数のマイクロフォンの位置関係を示す位置関係データを記憶する位置関係データ記憶手段、
前記位置関係データ記憶手段に記憶されている前記位置関係データと、前記複数のマイクロフォンで取得した音データと、を記録媒体に記録する記録手段、
として機能させることを特徴とするプログラム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【公開番号】特開2010−145524(P2010−145524A)
【公開日】平成22年7月1日(2010.7.1)
【国際特許分類】
【出願番号】特願2008−319967(P2008−319967)
【出願日】平成20年12月16日(2008.12.16)
【出願人】(504149100)株式会社カシオ日立モバイルコミュニケーションズ (893)
【Fターム(参考)】
【公開日】平成22年7月1日(2010.7.1)
【国際特許分類】
【出願日】平成20年12月16日(2008.12.16)
【出願人】(504149100)株式会社カシオ日立モバイルコミュニケーションズ (893)
【Fターム(参考)】
[ Back to top ]