説明

バンドエッジにおけるビデオ信号内へのオーディオ信号の組み込み

【課題】本発明は分離されたキャリアによるオーディオ信号伝送と対照的に、ビデオ信号内にデジタル化されたオーディオ信号の組み込みに関する。
【解決手段】オーディオサンプルがビデオ信号に追加されたシステムであるが、ビデオ情報に割り当てられたタイムフレーム内であるためにビデオデータに取って代わっているシステム。2個のオーディオサンプルが各ビデオラインの最初と最後により好ましく配置される。該ビデオラインがビデオイメージを形成するために「積み重ね」られる時、該オーディオはイメージの両サイドに、それぞれイメージ幅の約6パーセントのノイズ状の垂直な縞を形成する。本発明は該ビデオイメージを引き伸ばし該縞を隠す。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は分離されたキャリアによるオーディオ信号伝送と対照的に、ビデオ信号内にデジタル化されたオーディオ信号の組み込みに関する。
【背景技術】
【0002】
ビデオ信号は通常2キャリア、ビデオ信号用とオーディオ信号用を使用する。総合的な複雑さはおそらくビデオ信号内へオーディオ信号を組み込むことにより低減される。
このように組み込むにはビデオ信号に使用される情報の総量が、割り当てられたバンド幅を十分には占めていないことが必要とされる。典型的に割り当てられたバンド幅は6MHzである。或る1つのビデオ標準のもとでは30フレームのビデオ情報が1秒ごとに伝送される。各フレームには525本の走査線情報が含まれる。通常この標準のもとではバンド幅の中に追加情報を挿入するのに有効な領域は存在しない。
【0003】
[発明の要旨]
本発明の1つの形式において、オーディオ信号がサンプリングされる。2つのサンプルが関連したビデオ信号の各走査線の中に挿入される。1つは該走査線の最初に、他方は最後に挿入される。各サンプルはその走査線内に含まれるビデオ信号の約6%に取って代わる。
全走査線におけるこの置き換え6%の累積的な効果はビデオ映像の左右両サイドにおいて2つの狭い垂直バンドのノイズのような映像を生成することである。本発明によりこのバンドが取り除かれる。
【0004】
[詳細な説明]
AFD圧縮
図1は毎秒30フレームで走査するビデオ信号と、加えてそれに随伴するオーディオトラックを表している。本発明は示されるようにフレーム数を減少させる。
この減少を実現するアプローチの1つは、全ての4フレームの3つが除去あるいはドロップされ、そして4つの各セットの内残った単一のフレームが伝送される、交互フィールドドロップ(AFD)法と呼ばれる。このアプローチはフレーム数を毎秒30から7.5へ減少させる。ドロップしたフレームに対応したオーディオ信号については、該ドロップしたフレームに対応するオーディオトラックの前面に示すように、自分自身はドロップされない。このフレームレートの低減はビデオ信号が必要とするバンド幅を減少させる。
【0005】
サンプリングされたオーディオ
オーディオは図示するようにサンプリグレート15.734KHzでサンプリングされる。このサンプリングレートは他の図で示される水平同期パルスの周波数と同一である。水平同期パルスそれぞれはビデオの走査線1本と関連しているため、水平同期パルスの周波数で映像をサンプリングすることによりオーディオサンプルの積分倍数が、後に更に詳細説明するようにビデオ走査線それぞれに挿入出来るようになる。サンプリグされたオーディオが図3で示すように、先ず図2で引き合いに出し説明したビデオ信号に挿入される。図2で先行技術の通常のビデオ信号を示す。この信号の関連のある2つの部分は前方ポーチと後方ポーチである。本発明により図3で示すように、各前方ポーチに先だってオーディオサンプルのある部分を置き、各後方ポーチの直後に他のサンプルを置く。
【0006】
オーディオサンプルが各走査線のビデオ信号の1部分に取って代わる、あるいは上書きされる。すなわち信号受信機が全ての走査線を「スタックアップ(積み上げ)」した時、走査線全ての左側部分及び右側部分が集合して狭い垂直のノイズのようなイメージの2つのバンドを生成する。イメージがノイズのようであるというのはオーディオ情報からビデオ画素生成しているからである。
あとで説明するように本発明はこの問題をこれら2つの垂直バンドをカバーするために、残ったイメージ部分を「ストレッチング(引き延ばす)」事によって解決する。
図1と図3のオーディオサンプルは2進数の形を取る。これら2進数はM−ASK(M−振幅シフトキー)として知られる技術によってビデオ信号に挿入される。図4でM−ASKを説明している。
【0007】
M−ASK
単一ビット記号
図4Aは1つの4記号数を表すM−ASKを示す。各記号は1ビットから成る。各ビットは高々可能な2つの値しか取れないため、各ビットを表すのに電圧として2つのレベルで十分である。(実際には電圧レベルというより電圧範囲が使われる。)
このようにして図4Aで示すように「0」とラベルの付いた電圧範囲に降下したらどんな信号でもゼロと見なされ、そして「1」とラベルの付いた範囲に入ったらどんな信号でも1と見なされる。
この波形は符号化された数1001を表示している。
【0008】
2ビット記号
図4Bはもう1つ別の4記号数を表すM−ASKを示す。しかし各記号は2ビットから成る。2ビット数は4つの可能な値が取れるため、各記号を表すのに4つの電圧レベルが必要である。この4つの電圧レベルが図示されている。
この波形は数01100011の符号を示しており、4つの記号に分割されそれぞれ2ビットで表示している。
【0009】
3ビット記号
図4Cはもう1つ別の4記号数を表すM−ASKを示す。しかし各記号は3ビットから成る。3ビット数は8つの可能な値が取れるため、各記号を表すのに8つの電圧レベルが必要である。この8つの電圧レベルが図示されている。
この波形は数001010000111の符号を示しており、4つの記号に分割されそれぞれ3ビットで表示している。
【0010】
一般の場合
一般的な場合においてはKビットから成る記号は2のK乗に等しい電圧レベル数を必要とする。図4A、図4Bおよび図4Cは一般の場合と一致している。図4Aにおいて各記号は1ビット(K=1)である。各記号に割り当てられたビットの当該数は2(2=2)である。
図4Bにおいて各記号は2ビット(K=2)である。各記号に割り当てられたビットの当該数は4(2=4)である。など。
【0011】
サンプルの挿入
図3は非常に近似的な仕方でオーディオサンプルの挿入を示している。図5はより詳細にその挿入を示している。オーディオサンプルはビデオ情報の最初と最後に挿入された図5で示される2つのバンドに入れられている。この2つのバンドについては更に詳細に定量的説明を行う。
【0012】
定量的議論
これまで議論されていないが、オーバーヘッドビットがいくつか例えばエラー訂正のため各オーディオサンプルに付加されている。各サンプルにおける全ビット数(オーディオ情報プラスオーバーヘッド)は18である。この18ビットのグループを「パケット」と名付ける。
【0013】
走査線毎に4パケット
これまでに述べたように1つのオーディオサンプルは各ビデオ走査線に関し導き出される。これまで議論したようにAFD圧縮の許で4ビデオフレームは全て単一のフレームに低減される。しかしながらオーディオ情報の総量は影響を受けない。このようにしてオーディオサンプルの4フレーム分の分量は単一のビデオフレームに挿入されなければならない。
【0014】
非常に一般的な仕方で言い換えると、オーディオサンプリングレートは水平同期パルスの周波数に等しいため、オーディオサンプルの数は単一フレームで生成される走査線数(両方の場合にも525本)に等しい。しかしビデオフレーム数が75%低減(全ての4つが1つに低減)されているため、4フレームに関するオーディオが単一フレームに詰め込まれる必要がある。このようにして各走査線は、当該同期周波数によるサンプリングで生成された単一サンプルの代わりに、4つのオーディオサンプルを伝送しなければならない。
(この言い換えは、例えばあるオーディオ情報が捨てられ他の情報がそのオーディオ信号に付加されたため、一般的原理を単に例示しているだけに見えるかもしれない。)
【0015】
4パケットは24記号へASK変調された72ビットから成る
4個の18ビットパケットは各ビデオ走査線と関連していて、走査線当たりオーディオは72ビット(4×18=72)である。M−ASK符号化が採用され(図4Cのように)8レベルが使用され、記号長がそれぞれ3ビットとなる。72ビットが24記号(72/3=24)に低減される。
このようにして4個の18ビットパケットが、それぞれ3ビットの24記号として符号化される。この24記号が図5においてバンド1が12記号を含みバンド2がその他の12記号を含むとして示されている。
【0016】
タイミング
図5において各バンドは12記号を含んでおり、しかも各バンドの長さは16マイクロ秒である。各記号は1.33マイクロ秒の長さTを占めている(16/12=1.33)。この2つのバンドは、全32マイクロ秒として、ビデオ情報の左と右に16マイクロ秒を占める。ビデオ情報は該走査線の残り222マイクロ秒を占める。
【0017】
これらの時間間隔があるとすればこの2つのバンド(つまりオーディオ情報)は全走査線の約12.6パーセントを占める(32/(222+32)=0.126)。通常これらバンドは集団的に左側に一つ右側にもう1つと2つの垂直なノイズのような縞を発生させる。本発明はオーディオで引き起こされたノイズのような縞を取り去りそしてビデオ情報を上に記した12.6%だけ引き延ばすことによってこれを収容改善する。
この引き延ばしはマトリックス計算を含む(ビデオイメージは画素のマトリックスである)。そのような計算は先行技術で知られている。
【0018】
トレーニング・シーケンス
図5は基準レベルを示す。単位はIREで図の左に示している。これらレベルをあらかじめ設定することはたやすいことではない。例えばレベル0と20IREと定義された範囲が前もってそれぞれ0及び80ミリボルト(mV)と設定されたと仮定しよう。送信機がこの範囲にはいるように試みに50mVの信号を送ったとしても、受信機は色々なファクターにより例えば38mVの信号として受け取るかもしれない。受信機は意図した信号を受信しなかった。
この問題を解決するために送信機はトレーニングシーケンスを周期的に送信することにより図5で示すようなレベルを定義する。図6はそのようなトレーニングシーケンスの一つである。
【0019】
トレーニングシーケンスは一連の9信号であり、全体として3ビット記号に必要とされる8間隔を定義する。トレーニング信号それぞれは図に示すように24.44マイクロ秒の持続期間である。
トレーニングシーケンスは伝送チャネルがその他の点でアイドル状態、例えば垂直ブランキング間隔(VBI)の時に周期的な時間で送信される。VBIの間、電子銃が切られ、それでトレーニングシーケンスが送られている最中でもトレーニングシーケンスはビデオイメージには効果を持たない。
トレーニングシーケンスは図6に示すように同じ高さのステップを持つ階段である。しかしながら一般的には同一のステップ高は必要としない。すなわちレベル80IREは必ずしも20IREの4倍の電圧であることを必要としない。
【0020】
このレベル設定の一つのアプローチを図7のフローチャートで示す。送信機は特定レベルに対応するアナログ信号を送信し、そして実際において受信機に受信されたものについて問い合わせる。受信機はその信号を計測し、そして該信号長を示す2進数を送信する。(一般にアナログ信号に影響を与える減衰はその2進数には影響しない)送信機がその2進数を受信したとき送信機はその信号減衰を決定できる。この処理は全てのレベルについて繰り返される。
【0021】
信号それぞれの減衰に基づいて送信機は適宜そのレベルを設定する。例えば6番目のレベルは殆ど減衰せず7番のレベルが大幅に減衰していることが発見されたとしたら、望ましいことではないが通常、6番と7番のレベルは互いに接近させるだろう。送信機はより明確に分離するためにこれらレベルを再定義しようとする。
【0022】
エンコーダ
図8はオーディオサンプルをビデオ信号に挿入するのに適したエンコーダのブロック図である。ビデオ同期検出器30が水平同期パルスを検出する。位相同期ループ(PLL)33が同期パルスと同位相の3個のクロック信号を生成する。
図で示すように2つのクロック信号は13.5MHzおよび27MHzで動き、オーディオロジックブロック34とAFDビデオエンコーダ35で示される処理システムのクロックとして使用される。もう1つのクロックは15.734KHzであり水平同期パルスの周波数と同一である。
【0023】
後者のクロックはシグマデルタコーデック36のトリガーに使用され、シフトレジスタ39と一緒に、バス37上で水平同期パルスと同一の周波数で14ビットサンプルのシーケンスを生成する。(16ビットはサンプリングで発生させられるがそれぞれの2つの最下位ビットは落とされる。)バス37上に生成された各14ビットワードは図1で示したサンプルの1つ例えばサンプルS1に該当する。
【0024】
これら14ビットワードは図8のラッチ45の中に保持されそこで付加的なオーバーヘッドのビット、例えばエラー訂正ビットを付け加えることが出来る。4つのオーバーヘッドビットの付与によって、セクション「定量的議論」において議論した18ビットワードに相当するバス48上の18ビットワードとなる。
【0025】
マルチプレクサ51は各18ビットワードを6個の3ビットワードのシーケンスに分割する。各3ビットワードがこれまで議論した該記号に相当する。各3ビットワードは8レベルASK54によって(図4Cに示されたパターンに適合させるために)適切なレベルに変換される。
【0026】
クロック信号57に基づいて記号は12記号グループへグループ化され、そして図5で(部分的に)示された信号を生成するために、該ASK54から取り出されマルチプレクサ60でビデオ信号に多重化される。この信号はビデオDAC63によって通常のアナログ信号へ再変換される。
VBIトレーニングシーケンサは図6で示したトレーニングシーケンスを発生する。このトレーニングシーケンスはマルチプレクサ60と66によりビデオ信号へ挿入される。
【0027】
デコーダ
図9はデコーダを例示している。この全体的な機能は(1)ビデオ情報を抽出すること、(2)ビデオイメージを12.6パーセントだけ引き延ばすことで垂直な縞のノイズを除去すること、及び(3)オーディオ情報を回復させることである。
【0028】
ブロック70は入ってくるアナログビデオ信号をデジタル化する。デジタル化された信号は、ビデオ情報を抽出するビデオデコーダ73へ送られ、そして図3で示されたようなオーディオサンプルでビデオデータを上書きすることで作られた垂直な縞をカバーするために、12.6パーセントだけビデオイメージを引き延ばす伸張器76へ運ばれる。コンポーネント73及び76はそれ自身先行技術である。
ブロック79は水平同期パルスを検出し、そして位相同期ループ(PLL)を使用し、ブロック82で示す処理回路によって13.5MHzで動作するクロック信号を発生する。
【0029】
デジタルシグナルプロセッサ(DSP)はブロック88においてバス85上のビデオ信号からオーディオ情報を抽出する。一方,そうしている間にブロック92はビデオルミナンス信号のピークレベルを計算し、そしてブロック95はピークのビデオレベルと(図6で示した)受信したトレーニングレベルに基づいて、(図5で示した)9個のレベルを計算処理する。
ブロック97はオーディオ情報から3ビット記号を引き出し、そしてブロック100はこれらを6個の記号グループへ組み入れる。これらグループがこれまで議論した18ビットパケットに相当する。
【0030】
(オプションになる)エラー訂正はブロック103で実行される。(図8のバス37のデータに相当する)オーディオ情報の14ビットは図9のバス109に生成される。並列14ビットグループはシフトレジスタ112によって直列ビットストリームへ変換され、そして示すようにオーディオを再生するデジタル/アナログ(D/A)変換器115へ送られる。そのオーディオは該D/A変換器への入力クロックによって(示されてない)ビデオと同期が取られる。
【0031】
重要な考察
1.通常の「ビデオ信号」は実際には分離されたキャリアで搬送される2個の分離信号から成る。例えばチャネル5は77.25MHzのビデオキャリアと81.75MHzのオーディオキャリアを含む。(E.C.ジョルダン編「無線、電子、コンピュータ及び通信技術者のための参考データ」インディアナ、インディアナポリス、ハワードK.サムズ会社;1985年、第7版、セクション35を参照)
どちらのキャリアもそれ自身でそれぞれの情報を他方のキャリア無しで搬送できる。すなわちもしオーディオキャリアが妨害された場合テレビ受信機は、それにもかかわらず依然ビデオイメージを表示する。逆に言えばもしビデオ信号が妨げられたとしても、受信機は依然オーディオを再生する。
対照的に本発明においては単一のキャリアがオーディオとビデオの両者を含んでいる。
【0032】
2.図5における信号にはいくつのタイプの情報が含まれている。或るタイプはビデオ情報でありビデオラインに含まれる。別のタイプはオーディオ情報でありバンド1及び2に含まれる。3番目のタイプは「コントロール信号」といえるものであり、例えばカラーバーストあるいは水平同期パルスである。
該情報とコントロール信号の間の一つの大きな相違はその情報信号(つまりビデオとオーディオ情報)には、映像あるいは音声を再生するため復号化される情報があることである。コントロール信号にはそのような情報はないが、主として該情報信号を視聴者に理解できる形に「フォーマット」するために作用している。
【0033】
3.ビデオフレーム数の低減が議論された。低減することは本発明の実現に際して厳密には必要ない。該低減はビデオ信号に必要とされるバンド幅を減少させる。いくつかの場合低減は必要ではないであろう。
【0034】
4.本発明はビデオ会議に際し特に有用である。AFD圧縮はビデオ会議への利用に適している。
【0035】
5.図6に示したトレーニング信号の持続時間は24.44マイクロ秒である。この持続時間は受信機が各トレーニング信号の有意平均を得るのに十分な時間を提供する。(実際トレーニング信号は示されたような完璧に直角を成す波形になることはない。それどころかノイズが乗るだろう。)
【0036】
6.1つの安全措置としてオーディオはスクランブルをかけることが出来る。或る単純なスクランブル処理の一つは各グループ内の6個の3ビットワードの順序を図8のマルチプレクサ51と関連させて再編成することである。例えば6個の各グループ内の最初の順序が1、2、3、4、5、6であったとする。この順序は3、2、1、6、5、4へ再編成できる。図9で示すデコーダはスクランブルの順序を知っておりそれに従ってスクランブルを解く。
この順序は動的に変更できる。たとえば該6個のラインの編成が可能な6の階乗あるいは720の可能なシーケンスが存在する。事前に決めた時間にエンコーダが新しいシーケンスを選択できる。デコーダはそれに従うかあるいはその新しいシーケンスについて知らされる。
【0037】
オーディオは暗号化することもできる。例えばエンコーダは暗号化された3ビットワードを生成するために照会用の或るワードかキーで各3ビットワードとEX−OR演算することが出来る。デコーダが暗号化された該3ビットワードについて同一のキーでEX−OR演算すると元の3ビットワードが得られる。
【0038】
7.本発明は、他の情報に加えて、オーディオ情報・・・ビデオ情報・・・オーディオ情報・・・図5ではオーディオ情報を表すバンド1・・・ビデオ情報を表すビデオライン、及びオーディオ情報を表すバンド2という繰り返しシーケンスから成る単一の信号を含む。
【図面の簡単な説明】
【0039】
【図1】ビデオ信号のフレーム数の低減及びオーディオ信号のデジタル化を表す図である。
【図2】先行技術によるビデオ信号を示す図である。
【図3】サンプリングされたオーディオ信号をビデオ信号に挿入した図である。
【図4A】M−ASK符号化の概念を示す図である。
【図4B】M−ASK符号化の概念を示す図である。
【図4C】M−ASK符号化の概念を示す図である。
【図5】図3に示したサンプリングされたオーディオ信号の挿入をより詳しく例示した図である。
【図6】図5の左に示したIREレベルを規定するために伝送されるトレーニングシーケンスを表す図である。
【図7】本発明の1部分で使用される論理を示すフローチャートである。
【図8】サンプリングされたオーディオ信号をビデオ信号に挿入するために使用されるエンコーダのブロック図である。
【図9】ビデオ信号からオーディオ情報を抽出するために使用されるデコーダのブロック図である。
【符号の説明】
【0040】
10…
30…ビデオ同期検出器
33…位相同期ループ
34…オーディオロジック
35…AFDビデオエンコーダ
36…シグマデルタコーデック
39…シフトレジスタ
51、60、66…マルチプレクサ
54…8レベルASK
63…ビデオDAC
68…VBIトレーニングシーケンサ
73…AFDビデオエンコーダ
76…ビデオ画素伸張器
97…8レベルASK検出器
100…データ結合器
103…(必要な場合)エラー訂正
112…シフトレジスタ
115…デジタル/アナログ変換器

【特許請求の範囲】
【請求項1】
ビデオ情報を含む信号を送信する方法において、該方法が:
該ビデオ情報を包含する周期的な信号を送信するステップ;及び
該周期的信号のビデオ情報の一部分の中へオーディオ情報を挿入するステップから成ることを特徴とするビデオ情報を含む信号を送信する方法。
【請求項2】
請求項1に記載の方法において
該オーディオ情報の挿入により導入されたノイズを打ち消すステップを含むことを特徴とするビデオ情報を含む信号を送信する方法。
【請求項3】
請求項1に記載の方法において
該周期的な信号が前方ポーチと後方ポーチを含むこと;及び
該オーディオ情報を挿入するステップが該前方ポーチと該後方ポーチへオーディオ情報を挿入することを含むことを特徴とするビデオ情報を含む信号を送信する方法。
【請求項4】
請求項1に記載の方法において
該オーディオ情報を挿入するステップが、該周期的な信号の各周期において残存ビデオ信号に先行する部分と後行する部分にオーディオを挿入することを含むことを特徴とするビデオ情報を含む信号を送信する方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4A】
image rotate

【図4B】
image rotate

【図4C】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公開番号】特開2008−35566(P2008−35566A)
【公開日】平成20年2月14日(2008.2.14)
【国際特許分類】
【出願番号】特願2007−271227(P2007−271227)
【出願日】平成19年10月18日(2007.10.18)
【分割の表示】特願平8−338820の分割
【原出願日】平成8年12月19日(1996.12.19)
【出願人】(390035493)エイ・ティ・アンド・ティ・コーポレーション (130)
【氏名又は名称原語表記】AT&T CORP.
【Fターム(参考)】