説明

映像音声信号処理装置と映像音声信号処理方法

【課題】音声信号が重畳されている非同期の映像信号を、基準信号に同期した映像信号として出力する際に、自由度の高い音声信号の処理を行うことができるようにする。
【解決手段】音声信号が重畳されている映像信号DSaをメモリ16に書き込む。メモリ16に書き込まれた映像信号は基準信号に同期して読み出す。映像信号から分離した音声信号DAa(DAb)または入力された音声信号DAcをメモリ26に書き込む。メモリ26に書き込まれた音声信号は基準信号に同期して読み出す。マルチプレクサ33は、メモリ16から読み出した映像信号DSb(DSc)に重畳されている音声信号に換えて、メモリ26から読み出した音声信号DAe(DAf)を重畳される。音声信号を映像信号と別個に記憶することで、別個に記憶した音声信号を用いて自由度の高い音声信号の処理を行える。

【発明の詳細な説明】
【技術分野】
【0001】
この発明は、映像音声信号処理装置と映像音声信号処理方法に関する。詳しくは、音声信号が重畳されている非同期の映像信号を、基準信号に同期した映像信号として出力する際に、音声信号を記憶するメモリを設けて、自由度の高い音声信号の処理を行うことができるようにするものである。
【背景技術】
【0002】
従来、映像音声信号装置例えばフレームシンクロナイザでは、映像信号の同期を別の映像信号の同期に変換する際に生じる映像信号の欠落や繰り返しが生じた場合でも、映像信号に重畳される補助信号の連続性を保持させることが行われている。
【0003】
例えば、特許文献1の発明では、映像/補助データ分離部が映像データと補助データを分離する。映像データ記憶部は、分離された映像データを記憶する。また、補助データ記憶部は、分離された補助データを記憶する。ここで、映像データの読み出しが入力順序通りに行われない場合、補助データの読み出しは、入力順序通りに行われるように読み出し順序を制御することで、補助データが欠落したり繰り返されることなく連続的に出力させることが行われている。
【0004】
また、フレームシンクロナイザでは、映像信号や補助信号だけでなく音声信号の切り替えも行われる。図12は、従来のフレームシンクロナイザ60の構成を示している。
【0005】
フレームシンクロナイザ60では、音声信号が重畳された非同期の映像信号が所定のフォーマット例えばSDIフォーマットのストリームとして供給される。ストリームDSinは、シリアル/パラレル変換部(S/P)61でパラレル信号に変換されて映像信号入力処理部62に供給される。
【0006】
映像信号入力処理部62は、シリアル/パラレル変換部61から供給された映像信号の処理、例えば明るさの調整や映像の挿入等を行い、処理後の映像信号DShをメモリコントローラ65に供給する。
【0007】
メモリコントローラ65は、供給された非同期の映像信号DShをメモリ66に書き込み、メモリ66に書き込まれた映像信号の読み出しを基準信号に同期して行うことで、入力された映像信号DShとは独立した同期位相の映像信号DSjをデマルチプレクサ67に供給する。また、メモリコントローラ65は、メモリ66に書き込まれている映像信号の読み出し開始位置を変更してリポジション処理を行い、例えば映像の下部領域を画面上の上部領域に表示できるように映像の表示位置を垂直方向に移動させる。
【0008】
デマルチプレクサ67は、音声信号が重畳されている映像信号DSjを、映像信号DVjと音声信号DAjに分離して、映像信号DVjを映像信号出力処理部71に供給し、音声信号DAjを音声信号出力処理部72に供給する。
【0009】
映像信号出力処理部71は、メモリコントローラ65によってリポジション処理が行われたときブランキング期間の付け替えを行う。すなわち、メモリ66に書き込まれている映像信号の読み出し開始位置を変更して映像の表示位置を垂直方向に移動させるものとすると、ブランキング期間も移動してしまう。このため、映像信号出力処理部71は、ブランキング期間の付け替えを行うことで、垂直方向に移動された映像を表示できるようにする。また、映像信号出力処理部71は、リポジション処理によって生じた不要な表示、例えば映像の上部領域の表示や付け替え前のブランキング期間に対応する表示をマスキングする。映像信号出力処理部71は、信号処理後の映像信号DVkをマルチプレクサ73に供給する。
【0010】
音声信号出力処理部72は、映像信号の補助データ領域に記録されている音声信号の順序がリポジション処理によって変更されてしまうとき、順序が変更された音声信号が出力されることがないよう音声を無音声化する。なお、音声信号出力処理部72は、音声のフェード処理等も行う。音声信号出力処理部72は、信号処理後の音声信号DAkをマルチプレクサ73に供給する。
【0011】
マルチプレクサ73は、映像信号出力処理部71から供給された映像信号DVkの補助データ領域に、音声信号出力処理部72から供給された音声信号DAkを挿入してパラレル/シリアル変換部(P/S)74に供給する。
【0012】
パラレル/シリアル変換部74は、マルチプレクサ73から供給された映像信号をシリアル信号に変換して、SDIフォーマットのストリームDSout’として出力する。
【0013】
ローカルCPU81は、メインCPU(図示せず)から供給された制御信号CTmに応じて制御信号CTbを生成する。ローカルCPU81は、生成した制御信号CTbをメモリコントローラ65や映像信号出力処理部71、音声信号出力処理部72等に供給して、フレームシンクロナイザ60の動作が制御信号CTmによって指示された動作となるように各部を制御する。
【0014】
【特許文献1】特開2004−221841号公報
【発明の開示】
【発明が解決しようとする課題】
【0015】
ところで、図12に示すようなフレームシンクロナイザ60では、メモリ66から読み出された映像信号DSbに対して映像信号の出力処理、およびメモリ66から読み出された映像信号DSbに重畳されている音声信号に対して音声信号の出力処理が行われている。このため、簡単な構成で自由度の高い音声信号出力処理を行うことができない。例えばリポジション処理が行われると音声信号の順序が変更されてしまうために音声の無音化が行われる。したがって、リポジション処理を行ったとき、音声を出力させることができない。また、音声のフェードアウトやフェードインの処理は可能であるが、音声切り替え例えば音声のクロスフェード等を行うことができない。
【0016】
そこで、この発明では、音声信号が重畳されている非同期の映像信号を、基準信号に同期させて出力する際に、自由度の高い音声信号の処理を行えるようにした映像音声処理装置と映像音声処理方法を提供するものである。
【課題を解決するための手段】
【0017】
この発明の第1の側面は、音声信号が重畳されている映像信号を記憶する第1のメモリと、前記第1のメモリに書き込まれた映像信号を基準信号に同期させて読み出す第1のメモリコントローラと、前記映像信号に重畳されている音声信号を分離するデマルチプレクサと、前記分離された音声信号または入力された音声信号を記憶する第2のメモリと、前記第2のメモリに書き込まれた音声信号を前記基準信号に同期させて読み出す第2のメモリコントローラと、前記第1のメモリから読み出された映像信号に重畳されている音声信号に換えて、前記第2のメモリから読み出された音声信号を重畳させるマルチプレクサとを有する映像音声信号処理にある。
【0018】
また、この発明の第2の側面は、音声信号が重畳されている映像信号を第1のメモリに記憶するステップと、前記第1のメモリに書き込まれた映像信号を基準信号に同期させて読み出すステップと、前記映像信号に重畳されている音声信号を分離するステップと、前記分離された音声信号または入力された音声信号を第2のメモリに記憶するステップと、前記第2のメモリに書き込まれた音声信号を前記基準信号に同期させて読み出すステップと、前記第1のメモリから読み出された映像信号に重畳されている音声信号に換えて、前記第2のメモリから読み出された音声信号を重畳させるステップと
を有する映像音声信号処理方法にある。
【0019】
この発明では、音声信号が例えばブランキング期間に重畳されている入力映像信号が、第1のメモリコントローラによって第1のメモリに書き込まれる。また、第1のメモリに書き込まれた映像信号は、基準信号に同期して第1のメモリコントローラによって読み出される。
【0020】
また、映像信号に重畳されている音声信号がデマルチプレクサによって分離されて、この分離された音声信号または入力された音声信号が、第2のメモリコントローラによって第2のメモリに書き込まれる。さらに、第2のメモリに書き込まれた音声信号は、基準信号に同期して第2のメモリコントローラによって読み出される。
【0021】
音声信号出力処理部では、例えば第1のメモリから読み出された映像信号に重畳されている音声信号の1映像フレーム当たりのサンプル数のシーケンスが判別されて、この判別結果に基づき第2のメモリから読み出された音声信号のサンプル数が、第1のメモリから読み出された映像信号に重畳されている音声信号の1映像フレーム当たりのサンプル数と等しくなるように調整される。また、音声信号の1映像フレーム当たりのサンプル数の調整では、第2のメモリに書き込まれた音声信号の1映像フレーム当たりのサンプル数を示す情報が用いられる。
【0022】
マルチプレクサでは、第1のメモリから読み出された映像信号に重畳されている音声信号に換えて、音声信号出力処理部で処理された音声信号を重畳する処理が行われる。
【0023】
また、音声信号出力処理部では、第2のメモリから読み出された音声信号とデマルチプレクサで分離された音声信号の何れか一方の音声信号から他方の音声信号に切り替えてマルチプレクサに供給する処理が行われる。
【0024】
また、第1のメモリから読み出された映像信号に対して信号処理を行う映像信号出力処理部が設けられて、第1のメモリコントローラによって、第1のメモリに書き込まれている映像信号の読み出し開始位置を変更させることで映像の表示位置を移動させるリポジション処理が行われたとき、映像信号出力処理部は、第1のメモリから読み出された映像信号に対してブランキング期間の付け替えが行われる。また、第1のメモリに書き込まれる映像信号から音声信号を分離して第2のメモリに書き込み、この第2のメモリに書き込まれた音声信号を読み出して、リポジション処理後の映像信号に重畳される。
【発明の効果】
【0025】
この発明によれば、音声信号が重畳されている映像信号が第1のメモリに記憶されて、この第1のメモリに書き込まれた映像信号が基準信号に同期して読み出される。また、映像信号に重畳されている音声信号が分離されて、この分離された音声信号または入力された音声信号が第2のメモリに記憶される。この第2のメモリに書き込まれた音声信号は、基準信号に同期して読み出されて、第1のメモリから読み出された映像信号に重畳されている音声信号に換えて重畳される。このように、音声信号を映像信号と別個に記憶することで、音声信号が重畳されている非同期の映像信号を、基準信号に同期した映像信号として出力する際に、自由度の高い音声信号の処理を行うことができるようになる。
【発明を実施するための最良の形態】
【0026】
以下、図を参照しながら、この発明の実施の一形態について説明する。図1は、映像信号と音声信号の処理を行う映像音声信号処理装置10の構成を示している。なお、映像音声信号処理装置10は、フレームシンクロナイザの機能、すなわち音声信号が重畳されている非同期の映像信号を基準信号に同期した映像信号として出力する機能だけでなく、音声信号の切り替え等の編集機能も備えたものである。
【0027】
映像音声信号処理装置10では、音声信号が重畳されている非同期の映像信号が所定のフォーマット例えばSDIフォーマットのストリームとして複数系統供給される。ストリームDSin-1は、シリアル/パラレル変換部(S/P)11-1でパラレル信号に変換されて映像信号入力処理部12-1に供給される。同様に、ストリームDSin-2〜DSin-mは、シリアル/パラレル変換部(S/P)11-2〜11-mでパラレル信号に変換されて映像信号入力処理部12-2〜12-mに供給される。
【0028】
映像信号入力処理部12-1は、シリアル/パラレル変換部11-1から供給された映像信号の処理、例えば明るさの調整や映像の挿入等を行い、処理後の映像信号をセレクタ13に供給する。同様に、映像信号入力処理部12-2〜12-mは、入力された映像信号の処理を行い、処理後の映像信号をセレクタ13に供給する。
【0029】
セレクタ13は、映像信号入力処理部12-1〜12-mから供給された複数系統の映像信号から所望の映像信号を選択して、選択した映像信号DSaを第1のメモリコントローラ15とデマルチプレクサ17に供給する。
【0030】
メモリコントローラ15は、供給された非同期の映像信号DSaを第1のメモリ16に書き込み、メモリ16に書き込まれた映像信号の読み出しを基準信号に同期して行うことで、入力された映像信号DSaとは独立した同期位相の映像信号DSbを映像信号出力処理部31に供給する。また、メモリコントローラ15は、メモリ16に書き込まれている映像信号の読み出し開始位置を変更してリポジション処理を行う。例えば読み出し開始位置を変更して、映像の下部領域を画面上の上部領域に表示できるように映像の表示位置を垂直方向に移動させる。あるいは読み出し開始位置を変更して、映像を水平方向や斜め方向に移動させる。なお、以下の説明では、映像の下部領域を画面上の上部領域に表示できるように映像の表示位置を垂直方向に移動させるものとする。
【0031】
デマルチプレクサ17は、音声信号が重畳されている映像信号DSaから音声信号DAaを分離して、または音声信号が重畳されている映像信号DSbから音声信号DAbを分離して、分離した音声信号DAa,DAbをセレクタ24と音声信号出力処理部32に供給する。
【0032】
セレクタ23には、デジタルインターフェイスレシーバ(以下「DIR」という)21-1〜21-nが接続されている。DIR-1は、外部から供給された音声ストリームDAin-1を音声信号に復元してセレクタ23に供給する。同様に、DIR-2〜DIR-nは、外部から供給された音声ストリームDAin-2〜DAin-nを音声信号に復元してセレクタ23に供給する。セレクタ23は、DIR-1〜DIR-nから供給された複数系統の音声信号から所望の音声信号を選択して、選択した音声信号DAcをセレクタ24に供給する。
【0033】
セレクタ24は、音声信号が重畳されている映像信号DSa(DSb)から分離した音声信号DAa(DAb)、またはセレクタ23から供給された音声信号DAcを選択してメモリコントローラ25に供給する。
【0034】
第2のメモリコントローラ25は、セレクタ24から供給された音声信号DAdを第2のメモリ26に書き込む。また、メモリコントローラ25は、メモリ26に書き込まれた音声信号の読み出しを基準信号に同期して行うことで、基準信号に同期した音声信号DAeを音声信号出力処理部32に供給する。なお、メモリ26は音声信号を記憶するものであるから、映像信号を記憶するメモリ16よりも記憶容量は少なくてよい。例えば映像信号DSaの総走査線が1125本で1ライン当たりの総画素数が2200画素であり、10ビットの輝度信号と色差信号からなるとき、1映像フレーム当たりのデータ量は6.1Mbyte(≒10bit×2×1125ライン×2200画素)となる。ここで、音声信号DAdが16チャンネルであり1映像フレーム当たりのサンプル数が1602サンプル、サンプルデータが32ビットであるとき、1映像フレーム当たりのデータ量は0.1Mbyte(≒32bit×16チャンネル×1602サンプル)となる。したがって、メモリ26は、メモリ16に比べて記憶容量は少なくてよい。
【0035】
映像信号出力処理部31は、メモリコントローラ15によってリポジション処理が行われたときブランキング期間の付け替えを行う。すなわち、メモリ16に書き込まれている映像信号の読み出し開始位置を変更して映像の表示位置を垂直方向に移動させるものとすると、ブランキング期間も移動してしまう。このため、映像信号出力処理部31は、ブランキング期間の付け替えを行うことで、垂直方向に移動された映像を表示できるようにする。また、映像信号出力処理部31は、リポジション処理によって生じた不要な表示、例えば映像の上部領域の表示や付け替え前のブランキング期間に対応する表示をマスキングする。映像信号出力処理部31は、信号処理後の映像信号DScをマルチプレクサ33に供給する。
【0036】
音声信号出力処理部32は、映像信号DScの補助データ領域に記録されている音声信号の順序がリポジション処理によって変更されてしまうとき、メモリコントローラ25によってメモリ26から読み出されている音声信号DAeを音声信号DAfとして、マルチプレクサ33とデジタルインターフェイストランスミッタ(以下「DIT」という)35に供給する。また、音声信号出力処理部32は、音声のフェード処理や、メモリコントローラ25によってメモリ26から読み出された音声信号DAeとデマルチプレクサで分離された音声信号DAbの何れか一方の音声信号を、他方の音声信号に切り替える音声切り替え処理を行い、処理後の音声信号を音声信号DAfとして、マルチプレクサ33とDIT35に供給する。さらに、音声信号出力処理部32は、映像信号DSbに重畳されている音声信号DAbにおける1映像フレーム当たりのサンプル数のシーケンスを判別して、メモリコントローラ25によってメモリ26から読み出された音声信号DAeのサンプル数を、判別したシーケンスに対応させて調整する処理を行う。
【0037】
マルチプレクサ33は、映像信号出力処理部31から供給された映像信号DScの補助データ領域に、音声信号出力処理部32から供給された音声信号DAfを重畳してパラレル/シリアル変換部(P/S)34に供給する。
【0038】
パラレル/シリアル変換部34は、マルチプレクサ33から供給された映像信号DSdをシリアル信号に変換して、SDIフォーマットのストリームDSoutとして出力する。
【0039】
DIT35は、音声信号出力処理部32から供給された音声信号DAfのパケット化等を行い、所定のフォーマットの音声ストリームDAoutとして出力する。
【0040】
ローカルCPU41は、メインCPU(図示せず)から供給された制御信号CTmに応じて制御信号CTaを生成する。ローカルCPU41は、生成した制御信号CTaをメモリコントローラ15,25や映像信号出力処理部31、音声信号出力処理部32等に供給して、映像音声信号処理装置10の動作が制御信号CTmによって指示された動作となるように各部を制御する。
【0041】
このように、映像音声信号処理装置10は、映像信号DSaを記憶するメモリ16と音声信号を記憶するメモリ26を有し、メモリ26に書き込まれている音声信号を用いることで、音声信号が重畳されている映像信号DSaの処理を行う際に自由度の高い音声信号の処理を行うことができるようにする。
【0042】
次に、映像音声信号処理装置10の具体的動作、例えばリポジション処理を行う場合について説明する。図2は、例えば映像信号DSaに基づく映像をリポジション処理するときの信号経路を示している。なお、図2では、映像信号と音声信号の経路において映像音声出力に用いられる経路を実線、映像音声出力に用いられない経路を破線で示している。
【0043】
ローカルCPU41は、セレクタ13を制御して映像信号入力処理部12-1から供給された映像信号を選択させる。また、ローカルCPU41は、メモリコントローラ15,25を制御して、メモリ16に対する映像信号の書き込みと読み出し、およびメモリ26に対する音声信号の書き込みと読み出しを行わせる。
【0044】
メモリコントローラ15は、音声信号が重畳されている映像信号DSaをメモリ16に書き込み、このメモリ16に書き込まれた映像信号の読み出し位置を変更して、基準信号に同期して映像信号を読み出すことでリポジション処理を行う。
【0045】
図3は、リポジション処理を行うときの動作を説明するための図である。例えばメモリコントローラ15は、図3の(A)に示すように、映像信号をアドレス「0x0000」の位置から映像信号DSaを順次書き込む。なお、1フレーム(フィールド)の映像信号の書き込み終了位置は、アドレス「0xFFFF」とする。
【0046】
リポジション処理を行うとき、メモリコントローラ15は、映像信号の読み出し開始位置を変更する。例えばアドレス「0x8000」を映像信号の読み出し開始位置として、メモリ16から順次映像信号の読み出しを行い、アドレス「0xFFFF」の映像信号の次にアドレス「0x0000」の位置から映像信号を順次読み出す。このように、映像信号の読み出し開始位置を変更すると、メモリ16から読み出された映像は図3の(B)に示すものとなる。
【0047】
ここで、リポジション処理を行うものとすると、図3の(B)に示すように、ブランキング期間BKinが移動した状態となる。また、ブランキング期間BKinに重畳されている音声信号DAaは、順序が変更されてしまう。したがって、映像信号出力処理部31は、ブランキング期間の付け替え処理を行い、図3の(C)に示すように、メモリ16から読み出された映像信号DSbに対して新たにブランキング期間BKoutを設定する。さらに、映像信号出力処理部31は、不必要な映像部分をマスキングする。例えば、付け替え前のブランキング期間BKinや映像の上部を、図3の(D)に示すようにマスキング領域(クロスハッチングで示す領域)として、このマスキング領域を所定の色で塗りつぶす等のマスキング処理を行う。このように、ブランキング期間の付け替え処理やマスキング処理が行われた映像信号DScをマルチプレクサ33に供給する。
【0048】
また、リポジション処理を行うと、音声信号は上述のように順序が変更されてしまう。このため、ローカルCPU41は、セレクタ24とメモリコントローラ25を制御して、デマルチプレクサ17によって映像信号DSaから分離した音声信号DAaを、図3の(E)に示すようにメモリ26に書き込むことで、映像信号DSaに重畳されている音声信号すなわち順序が変更される前の音声信号のミラーリングを行う。
【0049】
メモリコントローラ25は、メモリ26に書き込まれた音声信号DAaを基準信号に同期して図3の(F)に示すように時間順に読み出して、音声信号DAeとして音声信号出力処理部32に供給する。音声信号出力処理部32は、メモリ26から読み出された音声信号DAeを音声信号DAfとしてマルチプレクサ33に供給する。
【0050】
マルチプレクサ33は、映像信号出力処理部31から供給された映像信号DScのブランキング期間に音声信号である音声信号DAfを重畳させる。このような処理を行うものとすると、マルチプレクサ33からパラレル/シリアル変換部34を介して出力されるストリームDSoutは、図3の(G)に示すように、映像がリポジション処理されており、音声信号は正しい時間順で重畳された映像信号を示すものとなる。
【0051】
したがって、映像のリポジション処理が行われたか否かにかかわらず、正しく音声出力を行うことができるようになる。
【0052】
次に、映像音声信号処理装置10の他の具体的動作、例えば音声信号の切り替え処理を行う場合について説明する。図4は、例えば映像信号DSaに重畳されている音声信号を、音声ストリームDAin-1から復元した音声信号に切り替えるときの信号経路を示している。なお、図4では、映像信号と音声信号の経路において映像音声出力に用いられる経路を実線、映像音声出力に用いられない経路を破線で示している。
【0053】
ローカルCPU41は、セレクタ13,23を制御して、映像信号入力処理部12-1で処理された映像信号とDIR21-1で得られた音声信号を選択させる。また、ローカルCPU41は、セレクタ24を制御して音声信号DAcを選択させる。さらに、ローカルCPU41は、メモリコントローラ15,25を制御して、メモリ16に対する映像信号の書き込みと読み出し、およびメモリ26に対する音声信号の書き込みと読み出しを行わせる。
【0054】
メモリコントローラ15は、音声信号が重畳されている映像信号DSaをメモリ16に書き込み、このメモリ16に書き込まれた映像信号を、基準信号に同期して順次読み出して、映像信号DSbとしてデマルチプレクサ17と映像信号出力処理部31に供給する。
【0055】
映像信号出力処理部31は、メモリコントローラ25から供給された映像信号DSbを映像信号DScとしてマルチプレクサ33に供給する。
【0056】
デマルチプレクサ17は、映像信号DSbから音声信号DAbを分離して音声信号出力処理部32に供給する。
【0057】
メモリコントローラ25は、セレクタ24から供給された音声信号DAdをメモリ26に書き込む。またメモリコントローラ25は、メモリ26に書き込まれた音声信号を書き込まれた順に読み出して、音声信号DAeとして音声信号出力処理部32に供給する。
【0058】
音声信号出力処理部32は、デマルチプレクサ17から供給された音声信号DAbとメモリコントローラ25から供給された音声信号DAeを用いて、音声信号の切り替え処理を行う。
【0059】
図5は、音声信号出力処理部32で行う音声信号の切り替え処理として、クロスフェード処理を行う場合を示している。音声信号出力処理部32は、デマルチプレクサ17から供給された音声信号DAbの信号レベル(実線で示す)を、時間の経過と共に減衰させて「0」レベルとする。また、音声信号出力処理部32は、メモリコントローラ25から供給された音声信号DAeの信号レベル(破線で示す)を、時間の経過と共に「0」レベルが増加させる。このようにして、音声信号出力処理部32は、音声信号DAbを時間の経過と共に徐々に音声信号DAeに置き換えてクロスフェード処理を行う。音声信号出力処理部32は、クロスフェード処理後の音声信号DAfをマルチプレクサ33に供給する。
【0060】
マルチプレクサ33は、映像信号出力処理部31から供給された映像信号DScに、音声信号出力処理部32から供給された音声信号DAfを重畳させる。すなわち、マルチプレクサ33は、映像信号DSbに重畳されている音声信号DAbを音声信号DAfに置き換える。このような処理を行うものとすると、マルチプレクサ33からパラレル/シリアル変換部34を介して出力されるストリームDSoutは、クロスフェード処理が行われた音声信号が重畳された映像信号を示すものとなる。
【0061】
ところで、映像信号に重畳された音声信号は、1映像フレームおけるサンプル数が異なる場合がある。例えば、音声信号のサンプリング周波数が48.0kHz、映像信号のフレーム周波数が(30/1.001)フレーム/秒である場合、1映像フレーム当たりの音声信号のサンプル数が整数とならないことから、連続する5フレームの期間でサンプル数が8008サンプルとなるように各フレームのサンプル数が設定されている。
【0062】
図6は、フレームと音声信号のサンプル数を示している。連続する5フレーム期間において、奇数オーディオフレームは1602サンプル、偶数オーディオフレームは1601サンプル、5フレームと次の5フレームのつなぎ目では1602サンプルのフレームが連続するようになされている。このため、例えばクロスフェード処理で用いた音声信号DAeのサンプル数が1601サンプル/フレームに固定されていた場合、あるいは音声信号DAeのサンプル数が1602サンプル/フレームに固定されていた場合、映像と音声の位相差が生じて映像と音のタイミングが合わない現象、いわゆるリップシンクのずれという問題が生じてしまう。
【0063】
そこで、音声信号出力処理部32は、1映像フレーム当たりのサンプル数を調整してから映像信号に重畳させることでリップシンクの問題の発生を防止する。
【0064】
音声信号出力処理部32は、デマルチプレクサ17から供給された音声信号DAbに基づきフレームシーケンスを判別して、判別結果に基づき音声信号の1映像フレーム当たりのサンプル数を調整する。例えば図6に示すように、連続する5フレームで音声信号を8008サンプルとする場合、サンプル数が「1602」であるフレームの連続が5フレーム期間毎に生じる。したがって、音声信号出力処理部32は、音声信号DAbに基づきフレーム毎に音声信号のサンプル数をカウントして、サンプル数が「1602」であるフレームが連続したタイミングを基準として、5フレームのカウントを繰り返すものとすれば、カウント値は5フレームシーケンスの何れのフレームであるかを示すものとなり、カウント値によって出力するフレームが5フレームシーケンスの何れのフレームに相当するか判別できる。
【0065】
また、音声ストリームDAin-1のフォーマットが例えばAESフォーマットである場合、AESフォーマットでは、サンプリング周波数を示す情報が設けられている。AESフォーマットの1フレームは2つのサブフレームで構成されており、サブフレームは図7に示す構成とされている。
【0066】
サブフレームは、プリアンブル、AUX/オーディオ、オーディオデータ、オーディオサンプルバリディティビットV、ユーザービットU、オーディオチャンネルステータスビットC、サブフレームパリティビットPを有する。
【0067】
プリアンブルは、4ビットのデータであり、サブフレームとフレームとの同期およびチャンネルステータスブロック識別を規定するものである。AUX/オーディオの領域は、4ビットの領域であり、補助データ部である。オーディオデータは、20ビットのデータ領域である。ここで、オーディオデータを20ビットとした場合、AUX/オーディオの領域は補助データ部として使用できる。オーディオデータを24ビットとした場合、AUX/オーディオの領域はオーディオデータの領域として使用する。なお、オーディオデータを20ビット未満とした場合、使用しないLSB側の下位ビットは「0」に設定される。
【0068】
オーディオサンプルバリディティビットVは、オーディオデータの有効性を示す1ビットのデータである。なお、オーディオデータが有効データの場合は「0」、無効データの場合は「1」に設定される。ユーザービットUは、ユーザーにより定義された1ビットのデータである。オーディオチャンネルステータスビットCは、データブロックを形成する1ビットのデータであり、各種パラメータについての送信情報を伝送する。サブフレームパリティビットPは、プリアンブルを除く全てのデータに対する偶数パリティを示す1ビットのデータである。
【0069】
ここで、各チャンネルについて、連続する192フレームに含まれたオーディオチャンネルステータスビットCにより1ブロックが形成される。このブロックの開始位置は、プリアンブルにより指定されており、オーディオチャンネルステータスビットCのブロックでサンプリング周波数等の情報が示されている。このため、映像音声信号処理装置10は、このサンプリング周波数の情報に基づき入力された音声信号の例えば1映像フレーム当たりのサンプル数を判別できる。
【0070】
したがって、音声信号出力処理部32は、出力するフレームが5フレームシーケンスの何れのフレームに相当するかの判別結果と、メモリ26に書き込まれている音声信号の1フレーム当たりのサンプル数に基づき、音声信号DAeのサンプルデータの削除や繰り返しを行うことで、映像信号DScに対応したサンプル数の音声信号とすることができる。このため、音声信号出力処理部32からマルチプレクサに供給される音声信号DAfは、1映像フレーム当たりのサンプル数が映像信号DScに重畳されている音声信号と等しくなる。すなわち、クロスフェード処理や音声切り替え等を行い、映像信号に重畳されている音声信号を変更したとき、リップシンクのずれという問題が生じてしまうことを防止できる。
【0071】
なお、出力するフレームが5フレームシーケンスの何れのフレームに相当するかの判別は、上述のようにサンプル数が「1602」であるフレームの連続するタイミングを基準として5フレームのカウント動作を行う場合に限られるものではなく、他の方法を用いるものとしてもよい。
【0072】
図8は、映像信号に重畳されたパケットの構成を示している。図8の(A)は、音声信号のパケットであり、補助データフラグADFは補助データパケットの開始を示すフラグである。データ識別ワードDIDは補助データの種類を示している。データブロック番号DBNは、データを分割して送る場合など、同一のDIDを持つ一連のパケットの順序番号である。データカウントDCは、ユーザーデータのワード数を示している。ユーザーデータワードUDWは、補助データ例えばAESフォーマットの音声信号等を示すものである。チェックサムワードCSは、データ識別ワードDIDからUDWの最後のワードまでのデータに対するチェックサムである。
【0073】
また、映像信号に重畳されたパケットでは、音声信号だけでなく音声信号に関する制御信号のパケットも設けられる。図8の(B)はオーディオコントロールパケットであり、ユーザーデータワードUDWには、オーディオフレームナンバーAF、サンプリング周波数RATE等の情報を設けることができるようになされている。
【0074】
オーディオフレームナンバーAFは、1映像フレーム当たりのサンプル数が整数個にならない場合に、映像フレームの中に重畳されるサンプル数を識別可能とするための情報である。例えば、上述のように連続する5フレームの期間におけるサンプル数を8008サンプルとする場合、1映像フレーム当たりのサンプル数が整数個にならない。したがって、オーディオフレームナンバーAFによって、5フレームシーケンスにおける何番目のフレームであるかを示すものとする。このため、オーディオフレームナンバーAFから、1フレームのサンプル数を判別することができるようになる。
【0075】
なお、サンプリング周波数RATEは音声信号のサンプリング周波数を示す情報、アクティブチャンネルACTは、どのチャンネルが有効であるかを示す情報、ディレイDELは、映像に対する音声の相対的な遅延量を示すデータである。
【0076】
このように、オーディオフレームナンバーAFによって、5フレームシーケンスの何番目のフレームであるか判別できるので、音声信号出力処理部32は、オーディオフレームナンバーAFの情報を用いて、音声信号のサンプル数の調整を行うこともできる。
【0077】
図9は、音声信号出力処理部32の動作を説明するための図である。図9の(A)は、映像信号DSbに重畳されている音声信号の1映像フレーム当たりのサンプル数を示している。図9の(B)は、メモリコントローラ25によってメモリ26から読み出されて音声信号出力処理部32に供給される音声信号DAeの1映像フレーム当たりのサンプル数を示している。図9の(C)は、音声信号出力処理部32から出力されて、マルチプレクサに供給される音声信号DAfの1映像フレーム当たりのサンプル数を示している。さらに、図9の(D)は、マルチプレクサ33から出力される映像信号DSdに重畳されている音声信号の1映像フレーム当たりのサンプル数を示している。
【0078】
ここで、例えば時点tc1で、映像信号に重畳されていた音声信号をメモリ26に書き込まれた音声信号に切り替える場合、音声信号出力処理部32は、マルチプレクサ33に出力する音声信号DAfの1映像フレーム当たりのサンプル数が、マルチプレクサ33に供給される映像信号DSdの1映像フレーム当たりのサンプル数と等しくなるように、サンプル数を調整する。例えば音声信号出力処理部32は、時点tc1で開始する映像信号DSdの1映像フレーム当たりのサンプル数が「1602」であり、音声信号DAeの1映像フレーム当たりのサンプル数が「1600」であるとき、音声信号出力処理部32は、音声信号DAeのサンプリングデータを繰り返すことで2サンプル増加させて、1映像フレーム当たりのサンプル数を「1602」とした音声信号DAfをマルチプレクサ33に供給する。また、次のフレームでは映像信号DSdの1映像フレーム当たりのサンプル数が「1601」であることから、音声信号出力処理部32は、音声信号DAeのサンプルを繰り返すことで1サンプル増加させて、1映像フレーム当たりのサンプル数を「1601」とした音声信号DAfをマルチプレクサ33に供給する。
【0079】
このような処理を行うものとすれば、音声信号の切り替えを行っても、音声信号の1映像フレーム当たりのサンプル数は切り替え前と等しくなるので、リップシンクのずれの問題を生じることがない。
【0080】
また、メモリ26に書き込まれる音声信号が、上述の5フレームシーケンスの音声信号のように1映像フレーム当たりのサンプルが変化する場合、メモリコントローラ25は、メモリ26に音声信号を書き込む際に、1映像フレーム当たりのサンプルを示す情報を書き込むものとする。このようにすれば、メモリ26に書き込まれる音声信号の1映像フレーム当たりのサンプルが変化しても、音声信号出力処理部32は、音声信号DAeの1映像フレーム当たりのサンプル数に応じて、音声信号のサンプリングデータの繰り返しや削除を行うことで、映像信号DScに重畳されている音声信号と1映像フレーム当たりのサンプル数を等しくした音声信号DAfをマルチプレクサ33に供給できる。
【0081】
図10は、音声信号をメモリ26に書き込む際に、1映像フレーム当たりのサンプルを識別可能として音声信号を書き込む場合を例示している。
【0082】
メモリコントローラ25は、セレクタ24で選択された音声信号を図10に示すようにアドレスの最初から順次書き込む。ここで、音声信号の1サンプルは上述のように32ビットのフォーマットのデータとされているものとする。また、SDIフォーマットの信号では1本の信号あたり音声信号が2CHペアで4グループすなわち16CHの音声信号を重畳することが可能とされている。したがって、アドレス幅は、4つのグループ毎に音声信号を記憶するためのアドレスg0,g1、2CHペア毎に音声信号を記憶するためのアドレスc0,c1、例えば1602サンプルの音声信号を記憶するために必要とされるアドレスw0〜w10を設定する。このようにアドレス幅「g1,g0,c1,c0,w10〜w0」を設定すると、グループ毎および2CHペア毎に音声信号を記憶することができる。また、アドレス幅「w10〜W0」は、2048サンプルを示すことができるので、アドレス幅「w10〜W0」を全て使い切ることがない。したがって、図10に示すようにアドレス幅「w10〜W0」におけるアドレス「11111111100」〜「11111111111」の範囲を、サンプル数を記憶するための領域とする。例えばアドレス「11111111100」に予め設定した固有のデータが記憶されている場合、1映像フレーム当たりのサンプル数は1600とする。また、1映像フレーム当たりのサンプル数が1601のときは、固有のデータをアドレス「11111111101」に記憶する。また、1映像フレーム当たりのサンプル数が1602のときは、固有のデータをアドレス「11111111110」に記憶する。このようにすれば、予め設定した固有のデータが何れのアドレスに記憶されていたかに応じて、1映像フレーム当たりのサンプル数を判別することができる。また、図示せずも予め設定された例えばアドレス「11111111111」に、1映像フレーム当たりのサンプル数を書き込むものとしてもよい。
【0083】
このように、音声信号出力処理部32は、メモリ26に書き込まれているサンプル数の情報を利用することで、メモリ26に書き込まれる音声信号の1映像フレーム当たりのサンプル数が一定でなくとも、リップシンクのずれの問題を防止することができる。
【0084】
図11は、メモリ26に記憶されたサンプル数の情報を利用したときの動作を示している。図11の(A)は、映像信号DSbに重畳されている音声信号の1映像フレーム当たりのサンプル数を示している。図11の(B)は、メモリコントローラ25によってメモリ26から読み出されて音声信号出力処理部32に供給される音声信号DAeの1映像フレーム当たりのサンプル数を示している。図11の(C)は、音声信号出力処理部32から出力されて、マルチプレクサに供給される音声信号DAfの1映像フレーム当たりのサンプル数を示している。さらに、図11の(D)は、マルチプレクサ33から出力される映像信号DSdに重畳されている音声信号の1映像フレーム当たりのサンプル数を示している。
【0085】
ここで、例えば時点tc2で、映像信号に重畳されていた音声信号をメモリ26に記憶された音声信号に切り替える場合、音声信号出力処理部32は、マルチプレクサ33に出力する音声信号DAfの1映像フレーム当たりのサンプル数が、マルチプレクサ33に供給される映像信号DSdに重畳されている音声信号の1映像フレーム当たりのサンプル数と等しくなるように、サンプル数を調整する。例えば音声信号出力処理部32は、時点tc2で開始する映像信号DSdの1映像フレーム当たりのサンプル数が「1602」であり、音声信号DAeの1映像フレーム当たりのサンプル数が「1601」であるとき、音声信号出力処理部32は、音声信号DAeのサンプリングデータを繰り返すことで1サンプル増加させて、1映像フレーム当たりのサンプル数を「1602」とした音声信号DAfをマルチプレクサ33に供給する。また、次のフレームでは映像信号DSdの1映像フレーム当たりのサンプル数が「1601」であり、音声信号DAeの1映像フレーム当たりのサンプル数が「1602」であるとき、音声信号出力処理部32は、音声信号DAeのサンプリングデータを1サンプル減少させて、1映像フレーム当たりのサンプル数を「1601」とした音声信号DAfをマルチプレクサ33に供給する。
【0086】
このような処理を行うものとすれば、音声信号の切り替えを行っても、映像信号に重畳されている音声信号の1映像フレーム当たりのサンプル数は切り替え前と等しくなるので、リップシンクのずれの問題を防止できる。
【0087】
なお、上述の実施の形態では、SDIフォーマットのストリームやAESフォーマットのストリームが入力される場合を例示したが、音声信号が重畳された映像信号のフォーマットや音声信号のフォーマットは、上述のフォーマットの信号に限られるものではない。また、音声信号出力処理部32は、1映像フレーム当たりのサンプル数を調整するものとしたが、映像信号がインタレース信号であるときは、フィールド期間毎にサンプル数の調整を行うものとしてもよい。
【0088】
このように、映像信号DSaを記憶するメモリ16と音声信号を記憶するメモリ26を別個に設けて、メモリ26に書き込まれている音声信号を用いることで、音声信号が重畳されている映像信号DSaの処理を行う際に自由度の高い音声信号の処理を行うことができる。また、メモリ26は、音声信号を記憶するものであることから記憶容量が少なくてよい。また、メモリ26には、音声信号を自然な形で記憶することが可能であるので、サンプル数の調整やミキシング等を行う音声信号出力処理部を容易な構成にできる。
【0089】
また、上述の説明で示した処理はハードウェアだけでなくソフトウェア、あるいは両者の複合構成によって実行することが可能である。ソフトウェアによる処理を実行する場合は、処理を行うためのプログラムを、専用のハードウェアに組み込まれたコンピュータ内のメモリにインストールして実行させるか、あるいは、各種処理が実行可能な汎用コンピュータにプログラムをインストールして実行させることが可能である。
【0090】
プログラムは、記録媒体としてのハードディスクやROM(Read Only Memory)に予め記録しておくことができる。また、プログラムは磁気ディスクや光ディスク、半導体メモリなどのリムーバブル記録媒体に、一時的あるいは永続的に格納(記録)しておくことができる。さらに、プログラムは、上述したようなリムーバブル記録媒体からコンピュータにインストールする他、ダウンロードサイトから無線あるいは有線のネットワークを介して取得するものとしてもよい。
【0091】
以上、特定の実施の形態を参照しながら、本発明について詳解してきた。しかしながら、本発明の要旨を逸脱しない範囲で当業者が該実施例の修正や代用を成し得ることは自明である。すなわち、例示という形態で本発明を開示してきたのであり、限定的に解釈されるべきではない。本発明の要旨を判断するためには、特許請求の範囲を参酌すべきである。
【産業上の利用可能性】
【0092】
この発明の映像音声信号処理装置では、音声信号が重畳されている映像信号が第1のメモリに記憶されて、この第1のメモリに書き込まれた映像信号が基準信号に同期して読み出される。また、映像信号に重畳されている音声信号が分離されて、この分離された音声信号または入力された音声信号が第2のメモリに記憶される。この第2のメモリに書き込まれた音声信号は、基準信号に同期して読み出されて、第1のメモリから読み出された映像信号に重畳されている音声信号に換えて重畳される。したがって、フレームシンクロナイザーや編集装置として好適である。
【図面の簡単な説明】
【0093】
【図1】映像音声信号処理装置の構成を示す図である。
【図2】リポジション処理を行うときの信号経路を示す図である。
【図3】リポジション処理を行うときの動作を説明するための図である。
【図4】音声信号の切り替え処理を行うときの信号経路を示す図である。
【図5】クロスフェード処理を説明するための図である。
【図6】フレームと音声信号のサンプル数を示す図である。
【図7】サブフレームの構成を示す図である。
【図8】パケットの構成を示す図である。
【図9】音声信号出力処理部の動作を説明するための図である。
【図10】音声信号の書き込み動作を説明するための図である。
【図11】メモリに記憶されたサンプル数の情報を利用したときの動作を説明するための図である。
【図12】従来のフレームシンクロナイザの構成を示す図である。
【符号の説明】
【0094】
10・・・映像音声信号処理装置、11-1〜11-m,61・・・シリアル/パラレル変換部(S/P)、12-1〜12-m,62・・・映像信号入力処理部、13,23,24・・・セレクタ、15,25,65・・・メモリコントローラ、16,26,66・・・メモリ、17,67・・・デマルチプレクサ、31,71・・・映像信号出力処理部、32,72・・・音声信号出力処理部、33,73・・・マルチプレクサ、34、74・・・パラレル/シリアル変換部(P/S)、41,81・・・ローカルCPU、60・・・フレームシンクロナイザ

【特許請求の範囲】
【請求項1】
音声信号が重畳されている映像信号を記憶する第1のメモリと、
前記第1のメモリに書き込まれた映像信号を基準信号に同期させて読み出す第1のメモリコントローラと、
前記映像信号に重畳されている音声信号を分離するデマルチプレクサと、
前記分離された音声信号または入力された音声信号を記憶する第2のメモリと、
前記第2のメモリに書き込まれた音声信号を前記基準信号に同期させて読み出す第2のメモリコントローラと、
前記第1のメモリから読み出された映像信号に重畳されている音声信号に換えて、前記第2のメモリから読み出された音声信号を重畳させるマルチプレクサと
を有する映像音声信号処理装置。
【請求項2】
前記第1のメモリから読み出された映像信号に重畳されている音声信号の1映像フレーム当たりのサンプル数に合わせて、前記第2のメモリから読み出された音声信号のサンプル数を調整して前記マルチプレクサに供給する音声信号出力処理部を設けた
請求項1記載の映像音声信号処理装置。
【請求項3】
前記音声信号出力処理部は、前記第1のメモリから読み出された映像信号に重畳されている音声信号の1映像フレーム当たりのサンプル数のシーケンスを判別して、前記第2のメモリから読み出された音声信号のサンプル数を前記判別したシーケンスに対応させて調整する
請求項2記載の映像音声信号処理装置。
【請求項4】
前記第2のメモリコントローラは、音声信号の1映像フレーム当たりのサンプル数を示す情報を前記第2のメモリに書き込むものとし、
前記音声信号出力処理部は、前記第2のメモリから読み出した前記サンプル数を示す情報を用いて前記音声信号のサンプル数を前記判別したシーケンスに対応させて調整する
請求項3記載の映像音声信号処理装置。
【請求項5】
前記音声信号出力処理部は、前記マルチプレクサに供給する音声信号を、前記第2のメモリから読み出された音声信号と前記デマルチプレクサで分離された音声信号の何れか一方の音声信号から他方の音声信号に切り替える処理を行う
請求項2記載の映像音声信号処理装置。
【請求項6】
前記第1のメモリから読み出された映像信号に対して信号処理を行う映像信号出力処理部を備え、
前記第1のメモリコントローラは、前記第1のメモリに書き込まれている映像信号の読み出し開始位置を変更することで映像の表示位置を移動させるものとし、
前記映像信号出力処理部は、前記第1のメモリから読み出された映像信号に対してブランキング期間の付け替えを行って前記マルチプレクサに供給し、
前記第2のメモリは、前記第1のメモリに書き込まれる映像信号から分離した音声信号を記憶する
請求項1記載の映像音声信号処理装置。
【請求項7】
前記音声信号は、前記映像信号のブランキング期間に重畳されている
請求項1記載の映像音声信号処理装置。
【請求項8】
音声信号が重畳されている映像信号を第1のメモリに記憶するステップと、
前記第1のメモリに書き込まれた映像信号を基準信号に同期させて読み出すステップと、
前記映像信号に重畳されている音声信号を分離するステップと、
前記分離された音声信号または入力された音声信号を第2のメモリに記憶するステップと、
前記第2のメモリに書き込まれた音声信号を前記基準信号に同期させて読み出すステップと、
前記第1のメモリから読み出された映像信号に重畳されている音声信号に換えて、前記第2のメモリから読み出された音声信号を重畳させるステップと
を有する映像音声信号処理方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate


【公開番号】特開2010−34760(P2010−34760A)
【公開日】平成22年2月12日(2010.2.12)
【国際特許分類】
【出願番号】特願2008−193428(P2008−193428)
【出願日】平成20年7月28日(2008.7.28)
【出願人】(000002185)ソニー株式会社 (34,172)
【Fターム(参考)】