説明

映像音声編集装置、制御方法、及びプログラム

【課題】カメラとマイクが別体である場合にも映像と音声のリップシンクずれを補正することができる映像音声編集装置、制御方法、及びプログラムを提供する。
【解決手段】番組編集器210は、コントローラ212、映像音声合成器215、及び記録媒体216を備える。コントローラ512は、被写体150からマイク121までの距離D及び音速Cに基づいて、被写体150からマイク121までの音声到達時間Tを算出し、音声到達時間Tに基づいて音声タイムコードを補正する。コントローラ212は、音声タイムコードの補正量分だけ映像を遅延させて再生する。この遅延させて再生された映像信号と無補正の音声信号とを映像音声合成器215で合成し、記録媒体216へ完成番組として記録する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、映像音声編集装置、制御方法、及びプログラムに関し、特に、映像と音声の再生時間を制御する映像音声編集装置、制御方法、及びプログラムに関する。
【背景技術】
【0002】
従来より、カメラにより撮影した映像とマイクにより収録した音声とを編集時に合成することにより、番組製作が行われている。この際、光と音は伝播速度に差があるため、撮影された映像と同じタイミングで収録された音声にはリップシンクずれが生じる。特に、近年発達している超望遠レンズによる撮影において、リップシンクずれは顕著な問題となる。カメラが撮影する被写体そのものにマイクを取り付ければリップシンクずれは生じないが、大部分の取材現場においてはマイクを被写体自体へ取り付けることができず、マイクは被写体から離れた場所に設置される。
【0003】
このようなリップシンクずれを補正するために、編集者は、映像と音声との合成編集作業において、目と耳と勘に頼って手動で映像と音声との相対遅延時間を調整している。しかし、特に小規模な取材班においては、番組編集作業の省力化が要望されており、映像と音声との相対遅延時間の調整作業の自動化が求められている。
【0004】
そこで、編集装置又は収録装置のハード構成により、リップシンクずれを補正する技術が提案されている。例えば、ズーム位置が望遠側のときは映像データと音声データを同期再生し、ズーム位置が広角側のときは映像データに対し音声データを遅延させて再生するテレビ会議システムが提案されている(例えば、特許文献1参照)。
【0005】
また、レンズのフォーカシングに同期して、マイクの指向性を被写体方向へ集中させるビデオカメラが提案されている(例えば、特許文献2参照)。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開平6−276427
【特許文献2】特開平5−308553
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、上記特許文献1に記載されているテレビ会議システムは、ズーム位置に応じて音声及び映像の相対的再生時間を変更するが、被写体から発せられた音声がマイクに到達するまでの距離によって生じるリップシンクずれを補正することはできない。
【0008】
また、上記特許文献2に記載されているビデオカメラは、レンズのフォーカシングに同期して、マイクの指向性を被写体方向へ集中させるが、指向性を変更しても音声がマイクに到達するまでの距離によって生じるリップシンクずれを補正することはできない。
【0009】
従って、上記従来の技術はいずれも、カメラとマイクが別体である場合、厳密にリップシンクずれを補正することはできない。
【0010】
本発明の目的は、カメラとマイクが別体である場合にも映像と音声のリップシンクずれを補正することができる映像音声編集装置、制御方法、及びプログラムを提供することにある。
【課題を解決するための手段】
【0011】
上述の目的を達成するために、請求項1記載の映像音声編集装置は、映像収録手段により撮影された被写体の映像信号及び音声収録手段により収録された前記被写体からの音声信号を前記映像信号及び前記音声信号にそれぞれ関連付けられた時間管理データに基づいて合成する映像音声編集装置において、前記映像収録手段の位置座標、前記音声収録手段の位置座標、並びに前記映像収録手段の撮影方向及びフォーカス情報に基づいて前記被写体から前記音声収録手段までの音声到達時間を算出する算出手段と、前記算出された音声到達時間に基づいて前記音声信号に関連付けられた時間管理データを補正する補正手段と、前記補正された時間管理データに基づいて前記映像信号及び前記音声信号を合成する合成手段とを備えることを特徴とする。
【0012】
上述の目的を達成するために、請求項5記載の制御方法は、映像収録手段により撮影された被写体の映像信号及び音声収録手段により収録された前記被写体からの音声信号を前記映像信号及び前記音声信号にそれぞれ関連付けられた時間管理データに基づいて合成する映像音声編集装置の制御方法において、前記映像収録手段の位置座標、前記音声収録手段の位置座標、並びに前記映像収録手段の撮影方向及びフォーカス情報に基づいて前記被写体から前記音声収録手段までの音声到達時間を算出する算出ステップと、前記算出された音声到達時間に基づいて前記音声信号に関連付けられた時間管理データを補正する補正ステップと、前記補正された時間管理データに基づいて前記映像信号及び前記音声信号を合成する合成ステップとを備えることを特徴とする。
【0013】
上述の目的を達成するために、請求項6記載のプログラムは、映像収録手段により撮影された被写体の映像信号及び音声収録手段により収録された前記被写体からの音声信号を前記映像信号及び前記音声信号にそれぞれ関連付けられた時間管理データに基づいて合成する映像音声編集装置を制御する制御方法をコンピュータに実行させるプログラムにおいて、前記制御方法は、前記映像収録手段の位置座標、前記音声収録手段の位置座標、並びに前記映像収録手段の撮影方向及びフォーカス情報に基づいて前記被写体から前記音声収録手段までの音声到達時間を算出する算出ステップと、前記算出された音声到達時間に基づいて前記音声信号に関連付けられた時間管理データを補正する補正ステップと、前記補正された時間管理データに基づいて前記映像信号及び前記音声信号を合成する合成ステップとを備えることを特徴とする。
【発明の効果】
【0014】
本発明によれば、カメラとマイクが別体である場合にも映像と音声のリップシンクずれを適切に補正することができる。
【図面の簡単な説明】
【0015】
【図1】本発明の第1の実施の形態に係る映像音声編集システムの記録部の構成を示すブロック図である。
【図2】本発明の第1の実施の形態に係る映像音声編集システムの再生編集部の構成を示すブロック図である。
【図3】図2の番組編集器210で実行される番組編集処理を説明する図である。
【図4】図2の番組編集器210で実行される番組編集処理を説明する図である。
【図5】図2の番組編集器210で実行される番組編集処理のフローチャートである。
【図6】図5のステップS307の処理を説明するタイムチャートである。
【図7】本発明の第2の実施の形態に係る映像音声編集システムの記録部の構成を示すブロック図である。
【図8】本発明の第2の実施の形態に係る映像音声編集システムの再生編集部の構成を示すブロック図である。
【図9】図8の番組編集器510で実行される番組編集処理のフローチャートである。
【発明を実施するための形態】
【0016】
以下、本発明の実施の形態を図面を参照しながら詳述する。
【0017】
[第1の実施の形態]
図1は、本発明の第1の実施の形態に係る映像音声編集システムの記録部の構成を示すブロック図である。
【0018】
図1において、映像音声編集システムの記録部は、番組編集用データ記録器100、映像収録器110、及び音声収録器120を備える。
【0019】
番組編集用データ記録器100は、音声収録器配置位置入力部101、映像収録器配置位置入力部102、メモリ103、及び番組編集用データ記録媒体104を備える。
【0020】
映像収録器110は、撮影方向出力部111、フォーカス情報出力部112、タイムコード出力部113、カメラ114、AD変換器115、映像圧縮回路116、メモリ117、及び映像記録媒体118を備える。
【0021】
音声収録器120は、マイク121、AD変換器122、音声圧縮回路123、メモリ124、及び音声記録媒体125を備える。
【0022】
音声収録器配置位置入力部101、及び映像収録器配置位置入力部102は、番組編集用データ記録器100に接続されたキーボード等で構成される。
【0023】
撮影方向出力部111は、磁気コンパス等で構成され、映像収録器110のカメラ114の撮影方向を出力する。フォーカス情報出力部112は、映像収録器110のカメラ114が備えるレンズ119(図3)のフォーカス合焦距離を示すフォーカス情報を出力する。タイムコード出力部113は、映像収録器110と音声収録器120間で同期させる時間管理データを出力する。ここでは、タイムコード出力部113は、時間管理データとしてタイムコードを出力する。
【0024】
以下に、図1の映像音声編集システムの記録部の動作を説明する。
【0025】
映像収録器110では、カメラ114から入力される映像信号をAD変換器115でデジタル化し、映像圧縮回路116で圧縮し、タイムコード出力部113から出力されるタイムコードと関連付けてメモリ117へ一旦保存する。そして、メモリ117に保存された映像信号を映像記録媒体118へ映像ソースとして記録する。
【0026】
同時に、音声収録器120では、マイク121から入力される音声信号をAD変換器122でデジタル化し、音声圧縮回路123で圧縮し、タイムコード出力部113から出力されるタイムコードと関連付けてメモリ124へ一旦保存する。そして、メモリ124に保存された音声信号を音声記録媒体125へ音声ソースとして記録する。
【0027】
並行して、番組編集用データ記録器100は、音声収録器配置位置入力部101から音声収録器120の配置位置の座標を示すマイク位置座標を取込む。また、番組編集用データ記録器100は、映像収録器配置位置入力部102から映像収録器110の配置位置の座標を示すカメラ位置座標を取込む。これらの座標は、例えばユーザが番組編集用データ記録器100の操作部を操作することに応じて入力されてもよい。また、映像収録器110や音声収録器120にGPSなどの位置検出器を備え、座標の情報を映像収録器110や音声収録器120から受信するようにしてもよい。
【0028】
さらに、番組編集用データ記録器100は、撮影方向出力部111からカメラ114の撮影方向を取込む。また、番組編集用データ記録器100は、映像収録器110のフォーカス情報出力部112からカメラ114が備えるレンズ119(図3)のフォーカス情報を取込む。
【0029】
番組編集用データ記録器100は、マイク位置座標、カメラ位置座標、撮影方向、及びフォーカス情報を、タイムコード出力部113から出力されるタイムコードと関連付けてメモリ103へ一旦保存する。そして、メモリ103に保存されたマイク位置座標、カメラ位置座標、撮影方向、及びフォーカス情報を番組編集用データ記録媒体104へ番組編集用データとして記録する。
【0030】
図2は、本発明の第1の実施の形態に係る映像音声編集システムの再生編集部の構成を示すブロック図である。
【0031】
図2において、再生編集部としての番組編集器210は、映像再生器220、音声再生器230、番組編集用データ再生器211、コントローラ212、映像音声合成器215、及び記録媒体216を備える。
【0032】
映像再生器220は、映像記録媒体再生器221、映像復号器222、メモリ223、及びDA変換回路224を備える。
【0033】
音声再生器230は、音声記録媒体再生器231、音声復号器232、メモリ233、及びDA変換回路234を備える。
【0034】
以下に、図2の映像音声編集システムの再生編集部の動作を説明する。
【0035】
映像記録媒体再生器221は、映像記録媒体118に記録された圧縮映像信号を再生する。映像記録媒体再生器221から再生される圧縮映像信号は、映像復号器222により復号され、一旦、メモリ223へ保存される。コントローラ212は、映像と音声の相対遅延量を制御しながらメモリ223から映像信号を読み出す。メモリ223から順次読み出された映像信号は、DA変換回路224でアナログへ変換され、映像音声合成器215へ入力される。
【0036】
音声記録媒体再生器231は、音声記録媒体125に記録された圧縮音声信号を再生する。音声記録媒体再生器231から再生される圧縮音声信号は、音声復号器232により復号され、一旦、メモリ233へ保存される。メモリ233から順次読み出された音声信号は、DA変換回路234でアナログへ変換され、映像音声合成器215へ入力される。
【0037】
映像音声合成器215は、映像信号と音声信号とを合成し、記録媒体216へ完成番組として記録する。
【0038】
番組編集用データ再生器211は、番組編集用データ記録媒体104に記録された番組編集用データを読み出す。ここでコントローラ212は、番組編集用データ再生器211から読み出される番組編集用データに基づいて、メモリ223からの映像信号の読み出しを制御することにより映像と音声の相対遅延量を制御する。この処理を図3〜5を用いて詳細に説明する。
【0039】
図3及び図4は、図2の番組編集器210で実行される番組編集処理を説明する図である。
【0040】
図3及び図4において、カメラ114は、レンズ119を備える。カメラ114及びマイク121は、それぞれ別の位置から被写体150の映像及び音声を収録している。ここで、被写体150の位置座標を(X,Y)、カメラ114の位置座標を(xc,yc)、カメラ114が備えるレンズ119のフォーカス合焦距離をr、カメラ114の撮影方向をθ、マイク121の位置座標を(xm,ym)とする。図4の例では、ycとymは等しい値である。
【0041】
図5は、図2の番組編集器210で実行される番組編集処理のフローチャートである。
【0042】
図5において、まず、コントローラ212は、番組編集用データ再生器211から読み出される番組編集用データに含まれるマイク位置座標、カメラ位置座標、撮影方向、及びフォーカス情報の各パラメータを取り込む(ステップS301)。そして、コントローラ212は、各パラメータの変化を周期的に検査し、各パラメータのいずれかに変化があったか否かを判別する(ステップS302)。
【0043】
ステップS302の判別の結果、各パラメータのいずれにも変化がないときは、ステップS307に進む。
【0044】
一方、ステップS302の判別の結果、各パラメータのいずれかに変化があったときは、ステップS303に進む。ステップS303では、コントローラ212は、カメラ114の位置座標(xc,yc)、カメラ114が備えるレンズ119のフォーカス合焦距離r及びカメラ114の撮影方向θに基づいて、図3の被写体150の位置座標(X,Y)を算出する。具体的には、以下の数1に従って被写体150の位置座標(X,Y)を算出する。
【0045】
[数1]
(X,Y)=(xc+rcosθ,yc+rsinθ)
次に、コントローラ212は、以下の数2に従い、被写体位置座標(X,Y)及びマイク座標位置(xm,ym)に基づいて、図4の被写体150からマイク121までの距離Dを算出する(ステップS304)。
【0046】
[数2]
D=√((xm)−(X))+((ym)−(Y)
次に、コントローラ212は、以下の数3に従い、被写体150からマイク121までの距離D及び音速Cに基づいて、被写体150からマイク121までの音声到達時間Tを算出する(ステップS305)。
【0047】
[数3]
T=D/C
次に、コントローラ212は、以下の数4に従い、音声到達時間Tに基づいて音声ソースに関連付けられたタイムコード(音声タイムコード)を補正する(ステップS306)。
【0048】
[数4]
補正後音声タイムコード=補正前音声タイムコード−T
ここでコントローラ212は、ステップS306で補正された音声タイムコードに基づいてメモリ223からの映像信号の読み出しを制御することにより、映像と音声の相対遅延量を制御する。つまり、本実施の形態では、コントローラ212は、音声タイムコードの補正量分だけ映像を遅延させて再生する(ステップS307)。この遅延させて再生された映像信号と無補正の音声信号とを映像音声合成器215で合成し、記録媒体216へ完成番組として記録する(ステップS308)。
【0049】
次に、コントローラ212は、すべての音声信号及び映像信号を合成したか否かを判別する(ステップS309)。この判別の結果、すべての音声信号及び映像信号を合成したときは、本処理を終了する。一方、この判別の結果、すべての音声信号及び映像信号を合成していないときは、ステップS301に戻る。
【0050】
図6は、図5のステップS307の処理を説明するタイムチャートである。
【0051】
図6において、コントローラ212は、映像を遅延させて再生することにより、映像と音声の相対遅延量を制御する。ここでは、被写体150からマイク121までの距離Dが68mの例を示す。この場合、被写体150からマイク121までの音声到達時間Tは0.2秒であるので、映像ソースを0.2秒遅延させて再生する。なお、映像と音声との合成後の完成番組のタイムコード(完成番組タイムコード)として映像ソースに関連付けられたタイムコード(映像タイムコード)を流用しているので、完成番組の実時間管理を破壊することなく保存することができる。
【0052】
本実施の形態によれば、被写体からマイクまでの音声到達時間を算出し、音声到達時間に基づいて音声ソースに関連付けられたタイムコードを補正するので、カメラとマイクが別体である場合にも映像と音声のリップシンクずれを補正することができる。
【0053】
また、映像を遅延させて再生するので、収録時にリアルタイムでリップシンクずれが補正された番組を制作することができる。
【0054】
[第2の実施の形態]
第1の実施の形態では、映像を遅延させて再生することにより映像と音声の相対遅延量を制御したが、第2の実施の形態では、音声を前倒しして再生することにより映像と音声の相対遅延量を制御する。また、第2の実施の形態では、カメラが備えるレンズのズーム情報に応じて音量を調整する。
【0055】
図7は、本発明の第2の実施の形態に係る映像音声編集システムの記録部の構成を示すブロック図である。
【0056】
図7において、映像音声編集システムの記録部は、番組編集用データ記録器400、映像収録器410、及び音声収録器420を備える。
【0057】
番組編集用データ記録器400は、音声収録器配置位置入力部401、映像収録器配置位置入力部402、メモリ403、及び番組編集用データ記録媒体404を備える。
【0058】
映像収録器410は、撮影方向出力部411、フォーカス情報出力部412、タイムコード出力部413、カメラ414、AD変換器415、映像圧縮回路416、メモリ417、及び映像記録媒体418を備える。
【0059】
音声収録器420は、マイク421、AD変換器422、音声圧縮回路423、メモリ424、及び音声記録媒体425を備える。
【0060】
音声収録器配置位置入力部401、及び映像収録器配置位置入力部402は、番組編集用データ記録器400に接続されたキーボード等で構成される。
【0061】
撮影方向出力部411は、磁気コンパス等で構成され、映像収録器410のカメラ414の撮影方向を出力する。フォーカス情報出力部412は、映像収録器410のカメラ414が備えるレンズのフォーカス合焦距離を示すフォーカス情報及びズーム量を示すズーム情報を出力する。タイムコード出力部413は、映像収録器410と音声収録器420間で同期させる時間管理データを出力する。ここでは、タイムコード出力部413は、時間管理データとしてタイムコードを出力する。
【0062】
以下に、図7の映像音声編集システムの記録部の動作を説明する。
【0063】
映像収録器410では、カメラ414から入力される映像信号をAD変換器415でデジタル化し、映像圧縮回路416で圧縮し、タイムコード出力部413から出力されるタイムコードと関連付けてメモリ417へ一旦保存する。そして、メモリ417に保存された映像信号を映像記録媒体418へ映像ソースとして記録する。
【0064】
同時に、音声収録器420では、マイク421から入力される音声信号をAD変換器422でデジタル化し、音声圧縮回路423で圧縮し、タイムコード出力部413から出力されるタイムコードと関連付けてメモリ424へ一旦保存する。そして、メモリ424に保存された音声信号を音声記録媒体425へ音声ソースとして記録する。
【0065】
平行して、番組編集用データ記録器400は、音声収録器配置位置入力部401から音声収録器420の配置位置の座標を示すマイク位置座標を取込む。また、番組編集用データ記録器400は、映像収録器配置位置入力部402から映像収録器410の配置位置の座標を示すカメラ位置座標を取込む。
【0066】
さらに、番組編集用データ記録器400は、撮影方向出力部411からカメラ414の撮影方向を取込む。また、番組編集用データ記録器400は、映像収録器410のフォーカス情報出力部412からカメラ414が備えるレンズのフォーカス情報及びズーム情報を取込む。
【0067】
番組編集用データ記録器400は、マイク位置座標、カメラ位置座標、撮影方向、及びフォーカス情報を、タイムコード出力部413から出力されるタイムコードと関連付けてメモリ403へ一旦保存する。そして、メモリ403に保存されたマイク位置座標、カメラ位置座標、撮影方向、及びフォーカス情報を番組編集用データ記録媒体404へ番組編集用データとして記録する。
【0068】
図8は、本発明の第2の実施の形態に係る映像音声編集システムの再生編集部の構成を示すブロック図である。
【0069】
図8において、再生編集部としての番組編集器510は、映像再生器520、音声再生器530、番組編集用データ再生器511、コントローラ512、映像音声合成器515、及び記録媒体516を備える。
【0070】
映像再生器520は、映像記録媒体再生器521、映像復号器522、メモリ523、及びDA変換回路524を備える。
【0071】
音声再生器530は、音声記録媒体再生器531、音声復号器532、メモリ533、DA変換回路534、及び音量調整回路535を備える。
【0072】
以下に、図8の映像音声編集システムの再生編集部の動作を説明する。
【0073】
映像記録媒体再生器521は、映像記録媒体418に記録された圧縮映像信号を再生する。映像記録媒体再生器521から再生される圧縮映像信号は、映像復号器522により復号され、一旦、メモリ523へ保存される。メモリ523から順次読み出された映像信号は、DA変換回路524でアナログへ変換され、映像音声合成器515へ入力される。
【0074】
音声記録媒体再生器531は、音声記録媒体425に記録された圧縮音声信号を再生する。音声記録媒体再生器531から再生される圧縮音声信号は、音声復号器532により復号され、一旦、メモリ533へ保存される。コントローラ512は、映像と音声の相対遅延量を制御しながらメモリ533から音声信号を読み出す。メモリ533から順次読み出された音声信号は、DA変換回路534でアナログへ変換される。アナログへ変換された音声信号は、音量調整回路535で音量を制御され、映像音声合成器515へ入力される。
【0075】
映像音声合成器515は、映像信号と音声信号とを合成し、記録媒体216へ完成番組として記録する。
【0076】
番組編集用データ再生器511は、番組編集用データ記録媒体404に記録された番組編集用データを読み出す。ここでコントローラ512は、番組編集用データ再生器511から読み出される番組編集用データに基づいて、メモリ533からの音声信号の読み出しを制御することにより映像と音声の相対遅延量を制御する。また、コントローラ512は、音量調整回路535を制御することにより音量を制御する。この処理を図9を用いて詳細に説明する。
【0077】
図9は、図8の番組編集器510で実行される番組編集処理のフローチャートである。
【0078】
図9において、被写体の位置座標を(X,Y)、カメラ414の位置座標を(xc,yc)、カメラ414が備えるレンズのフォーカス合焦距離をr、カメラ414の撮影方向をθ、マイク421の位置座標を(xm,ym)とする。
【0079】
まず、コントローラ512は、番組編集用データ再生器511から読み出される番組編集用データに含まれるマイク位置座標、カメラ位置座標、撮影方向、フォーカス情報、及びズーム情報の各パラメータを取り込む(ステップS601)。そして、コントローラ512は、各パラメータの変化を周期的に検査し、各パラメータのいずれかに変化があったか否かを判別する(ステップS602)。
【0080】
ステップS602の判別の結果、各パラメータのいずれにも変化がないときは、ステップS307に進む。
【0081】
一方、ステップS602の判別の結果、各パラメータのいずれかに変化があったときは、ステップS603に進む。ステップS603では、コントローラ512は、以下の数5に従い、カメラ114の位置座標(xc,yc)、カメラ114が備えるレンズのフォーカス合焦距離r及びカメラ114の撮影方向θに基づいて、被写体の位置座標(X,Y)を算出する。
【0082】
[数5]
(X,Y)=(xc+rcosθ,yc+rsinθ)
次に、コントローラ512は、以下の数6に従い、被写体位置座標(X,Y)及びマイク座標位置(xm,ym)に基づいて、被写体からマイク421までの距離Dを算出する(ステップS604)。
【0083】
[数6]
D=√((xm)−(X))+((ym)−(Y)
次に、コントローラ512は、以下の数7に従い、被写体からマイク421までの距離D及び音速Cに基づいて、被写体からマイク421までの音声到達時間Tを算出する(ステップS605)。
【0084】
[数7]
T=D/C
次に、コントローラ512は、以下の数8に従い、音声到達時間Tに基づいて音声ソースに関連付けられたタイムコード(音声タイムコード)を補正する(ステップS606)。
【0085】
[数8]
補正後音声タイムコード=補正前音声タイムコード−T
ここでコントローラ512は、ステップS606で補正された音声タイムコードに基づいてメモリ533からの音声信号の読み出しを制御することにより、映像と音声の相対遅延量を制御する。つまり、本実施の形態では、コントローラ512は、音声タイムコードの補正量分だけ音声を前倒しして再生する(ステップS607)。さらに、コントローラ212は、カメラ414が備えるレンズのズーム情報に応じて音量を制御する(ステップS608)。具体的には、望遠側のときは音量を大きくし、広角側のときは音量を小さくするように制御する事で、完成番組の音声臨場感を増す。
【0086】
この前倒しして再生された音声信号と無補正の映像信号とを映像音声合成器515で合成し、記録媒体516へ完成番組として記録する(ステップS609)。
【0087】
次に、コントローラ512は、すべての音声信号及び映像信号を合成したか否かを判別する(ステップS610)。この判別の結果、すべての音声信号及び映像信号を合成したときは、本処理を終了する。一方、この判別の結果、すべての音声信号及び映像信号を合成していないときは、ステップS601に戻る。
【0088】
本実施の形態によれば、被写体からマイクまでの音声到達時間を算出し、音声到達時間に基づいて音声ソースに関連付けられたタイムコードを補正するので、カメラとマイクが別体である場合にも映像と音声のリップシンクずれを補正することができる。
【0089】
また、音声を前倒しして再生するので、映像ソースの再生タイミングを加工することなく、リップシンクずれを補正することができる。
【0090】
また、カメラ414が備えるレンズのズーム情報に基づいて音量を調整するので、より臨場感のある番組を制作することができる。
【0091】
また、本発明の目的は、以下の処理を実行することによって達成される。即ち、上述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)が記憶媒体に格納されたプログラムコードを読み出す処理である。
【0092】
この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施の形態の機能を実現することになり、そのプログラムコード及び該プログラムコードを記憶した記憶媒体は本発明を構成することになる。
【0093】
また、プログラムコードを供給するための記憶媒体としては、次のものを用いることができる。例えば、フロッピー(登録商標)ディスク、ハードディスク、光磁気ディスク、CD−ROM、CD−R、CD−RW、DVD−ROM、DVD−RAM、DVD−RW、DVD+RW、磁気テープ、不揮発性のメモリカード、ROM等である。または、プログラムコードをネットワークを介してダウンロードしてもよい。
【0094】
また、コンピュータが読み出したプログラムコードを実行することにより、上記実施の形態の機能が実現される場合も本発明に含まれる。加えて、そのプログラムコードの指示に基づき、コンピュータ上で稼動しているOS(オペレーティングシステム)等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれる。
【0095】
更に、前述した実施形態の機能が以下の処理によって実現される場合も本発明に含まれる。即ち、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれる。その後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPU等が実際の処理の一部または全部を行う場合である。
【符号の説明】
【0096】
210 番組編集器
211 番組編集用データ再生器
212 コントローラ
215 映像音声合成器
216 記録媒体
220 映像再生器
230 音声再生器

【特許請求の範囲】
【請求項1】
映像収録手段により撮影された被写体の映像信号及び音声収録手段により収録された前記被写体からの音声信号を前記映像信号及び前記音声信号にそれぞれ関連付けられた時間管理データに基づいて合成する映像音声編集装置において、
前記映像収録手段の位置座標、前記音声収録手段の位置座標、並びに前記映像収録手段の撮影方向及びフォーカス情報に基づいて前記被写体から前記音声収録手段までの音声到達時間を算出する算出手段と、
前記算出された音声到達時間に基づいて前記音声信号に関連付けられた時間管理データを補正する補正手段と、
前記補正された時間管理データに基づいて前記映像信号及び前記音声信号を合成する合成手段とを備えることを特徴とする映像音声編集装置。
【請求項2】
前記合成手段は、前記補正された時間管理データに基づいて前記映像信号を遅延させて再生した上で前記音声信号と合成することを特徴とする請求項1記載の映像音声編集装置。
【請求項3】
前記合成手段は、前記補正された時間管理データに基づいて前記音声信号を前倒しして再生した上で前記映像信号と合成することを特徴とする請求項1記載の映像音声編集装置。
【請求項4】
前記映像収録手段のズーム情報に基づいて前記音声信号の音量を調整する調整手段を備えることを特徴とする請求項1乃至3のいずれか1項に記載の映像音声編集装置。
【請求項5】
映像収録手段により撮影された被写体の映像信号及び音声収録手段により収録された前記被写体からの音声信号を前記映像信号及び前記音声信号にそれぞれ関連付けられた時間管理データに基づいて合成する映像音声編集装置の制御方法において、
前記映像収録手段の位置座標、前記音声収録手段の位置座標、並びに前記映像収録手段の撮影方向及びフォーカス情報に基づいて前記被写体から前記音声収録手段までの音声到達時間を算出する算出ステップと、
前記算出された音声到達時間に基づいて前記音声信号に関連付けられた時間管理データを補正する補正ステップと、
前記補正された時間管理データに基づいて前記映像信号及び前記音声信号を合成する合成ステップとを備えることを特徴とする制御方法。
【請求項6】
映像収録手段により撮影された被写体の映像信号及び音声収録手段により収録された前記被写体からの音声信号を前記映像信号及び前記音声信号にそれぞれ関連付けられた時間管理データに基づいて合成する映像音声編集装置を制御する制御方法をコンピュータに実行させるプログラムにおいて、前記制御方法は、
前記映像収録手段の位置座標、前記音声収録手段の位置座標、並びに前記映像収録手段の撮影方向及びフォーカス情報に基づいて前記被写体から前記音声収録手段までの音声到達時間を算出する算出ステップと、
前記算出された音声到達時間に基づいて前記音声信号に関連付けられた時間管理データを補正する補正ステップと、
前記補正された時間管理データに基づいて前記映像信号及び前記音声信号を合成する合成ステップとを備えることを特徴とするプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公開番号】特開2010−258568(P2010−258568A)
【公開日】平成22年11月11日(2010.11.11)
【国際特許分類】
【出願番号】特願2009−103884(P2009−103884)
【出願日】平成21年4月22日(2009.4.22)
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】