説明

状態機械に基づく逆テレシネアルゴリズム

本明細書には、ビデオにおいて、どのセグメントがテレシネを起源とし、どのセグメントがNTSC規格に準拠するかを判定するビデオ処理技術が開示される。テレシネ起源のビデオセグメント内の、3:2プルダウンのカレントプルダウンフェーズが推定され、テレシネ処理を反転するために用いられる。

【発明の詳細な説明】
【技術分野】
【0001】
本システムは、テレシネによって生成されたビデオと、従来技法により生成されたブロードキャストビデオとを区別する手順を組み込む。この判定に従い、この判定処理から導かれたデータは、テレシネされたフィルム画像の再構築を容易にする。
【0002】
(35U.S.C.119条の下の優先権主張)
本特許出願は、本願の譲受人に譲渡され、参照することによって本願に明確に組み込まれた、2005年10月24日出願の「状態機械に基づく逆テレシネアルゴリズム」と題された米国特許仮出願60/730,145に対する優先権を主張する。
【背景技術】
【0003】
1990年代、テレビジョン技術は、ビデオを表示し送信するためにアナログ方法を用いることからディジタル方法を用いることへと変わった。かつて、現存するソリッドステート技術が、ビデオを処理する新たな方法をサポートするであろうことが認められると、ディジタルビデオの有益性が急速に認識された。ディジタルビデオは、異なる数のライン、及びインタレース方式又はプログレッシブ方式の何れかのラインパターンを有する様々なタイプの受信機に適合するように処理することができる。ケーブルテレビ業界は、帯域幅と分解能幅とのトレードオフを実質的に即座に変え、以前は1つのアナログビデオチャネルしか搬送できなかった帯域幅で、12のビデオチャネル、又は7つから8つの優れた画質のディジタルビデオチャネルを送信することができるようになる機会を歓迎した。ディジタル画像は、もはや送信の際にマルチパスによる二重映像に影響されないだろう。
【0004】
この新たな技術は、映画のような画像とワイドスクリーン形式を有するハイビジョンテレビ(HDTV)の可能性を提供した。現在の縦横比4:3と違って、HDTVの縦横比は映画スクリーンと同様に16:9である。HDTVは、DVD及び多くの映画館で使用されているディジルサウンドシステムと同じ、ドルビーディジタルサラウンドサウンドを含むことができる。ブロードキャスト局は、高解像度のHDTV番組を送信するか、多数の低解像度の番組を送るか、同じ帯域幅でどちらも選択することができるだろう。ディジタルテレビジョンは、双方向のビデオ及びデータサービスも提供できるだろう。
【0005】
ディジタルテレビジョンを牽引する基礎をなす技術は2つある。第1の技術は、一般に、ビデオをサポートするチャネルで利用できる高い信号対雑音比を利用する送信フォーマットを用いる。第2の技術は、1つの画像、又は画像のシーケンスに存在する、不必要な時間的及び空間的重複を除去するよう処理する信号を用いる。空間的重複は、変動性のあまりない、比較的大きなエリアとして画像内に現れる。時間的重複は、後や先の画像に再び現れる、画像中の構造のことを言う。信号処理動作は、全て同時に形成されたフレームやフィールドにおいて最も良く実行され、異なる時間にスキャンされた画素の合成画像はそうでない。テレシネによってシネマ画像から形成されたNTSC準拠フィールドは、理想的な圧縮が達成されるために集められた不規則な時間基準を有する。しかし、テレシネで形成されたビデオは、基礎をなす異なる時間基準を有する真のNTSCビデオと混ざりうる。効果的なビデオ圧縮は、重複を排除するというビデオの特性を使用した結果である。従って、インタレースされた真のNTSCビデオから、テレシネされたビデオを自動的に区別し、テレシネされたビデオが検出されたら、テレシネ処理を反転処理し、テレシネされたビデオのソースであるシネマ画像を復元する技術が必要とされる。
【発明の開示】
【発明の概要】
【0006】
この局面の一局面は、ビデオフレームから複数の評価指標を判定することと、判定した評価指標を用いてこのビデオフレームを逆テレシネすることとを備えるビデオフレーム処理方法を備える。
もう1つの局面は、上述したビデオフレームから複数の評価指標を判定するように構成されたコンピュータ計算モジュールと、判定した評価指標を用いてこのビデオフレームの逆テレシネを提供するように構成されたフェーズ検出器とを備えるビデオフレーム処理装置を備える。
【0007】
さらにもう1つの局面は、上述したビデオフレームから複数の評価指標を判定する手段と、判定した評価指標を用いてこのビデオフレームを逆テレシネする手段とを備えるビデオフレーム処理装置を備える。
【0008】
さらにもう1つの局面は、実行されると、機械に、上述したビデオフレームから複数の評価指標を判定させ、判定した評価指標を用いてこのビデオフレームを逆テレシネさせる命令を備えるディジタル化ビデオフレームを処理する機械読取可能媒体を備える。
【0009】
さらにもう1つの局面は、複数のビデオフレームから複数の評価指標を判定し、判定した評価指標を用いてこのビデオフレームを逆テレシネするように構成されたビデオ圧縮プロセッサを備える。
【詳細な説明】
【0010】
以下の詳細な説明は、本発明のある具体的な局面を示す。しかし本発明は、請求項によって定義され包含されるように、多数の異なる方法で具現化されることが可能である。本説明では、同一部位が、全体を通じて同一符号を用いて示される図面が参照される。
【0011】
図1は、複数の端末への圧縮されたビデオのディジタル送信をサポートする送信システム5の機能ブロック図である。送信システム5は、ディジタルケーブルフィード又はディジタル化されたアナログ高信号/比率ソースでありうるディジタルビデオソース1を含む。ビデオ1は送信設備2で圧縮され、ネットワーク9を通して端末3へ送信するためのキャリアに変調されうる。
【0012】
ビデオ圧縮は、このソースの特性が知られており、理想的に適合する処理の形式を選択するために使用されるとき、最良の結果を出す。たとえば、ブロードキャストされていないビデオはいくつかの方法で始まることができる。従来どおりビデオカメラやブロードキャストスタジオ等で生成されたブロードキャストビデオは、米国ではNTSC規格に従う。この規格によれば、各フレームは2つのフィールドで作られている。一方のフィールドは奇数ラインから成り、他方は偶数ラインから成る。これは、「インタレース方式」フォーマットと称されうる。フレームは毎秒約30フレーム生成されるが、フィールドは1/60秒毎のテレビカメラ画像の記録である。一方、フィルムは毎秒24フレームのショットで、各フレームは完全な画像から成る。これは、「プログレッシブ方式」フォーマットと称されうる。NTSCの装置で送信するためには、「プログレッシブ方式」ビデオはテレシネ処理を経由して「インタレース方式」ビデオフォーマットに変換される。一局面において、以下で詳しく説明するように、このシステムはビデオがテレシネされている場合に有利に判定し、元のプログレッシブフレームを再生するための適当な変換を実行する。
【0013】
図4は、インタレースされたビデオに変換されたプログレッシブフレームをテレシネした結果を示す。F、F、F及びFは、テレシナへの入力であるプログレッシブ画像である。各フレームの下の番号「1」及び「2」は、奇数又は偶数フィールドを示している。フレームレート内での差分を考慮して、いくつかのフィールドが繰り返されていることが注目される。図4はプルダウンフェーズP、P、P、P及びPも示す。フェーズPは、同一の第1のフィールドを有するNTSC互換フレームの最初の2つに付される。続く4つのフレームは、フェーズP、P、P及びPに対応する。P、Pと付されたフレームは同一の第2のフィールドを有することに注目されたい。フィルムフレームFは3回スキャンされるので、2つの同一の連続して出力されたNTSC互換の第1のフィールドが形成される。フィルムフレームFから導かれた全てのNTSCフィールドは、同じフィルム画像から取り出され、従って同じ瞬間に取り出される。フィルムから導かれた他のNTSCフレームは、1/24秒離れた隣接するフィールドを有しうる。
【0014】
図2は、信号前処理ユニット15を示すブロック図である。一局面において、信号前処理ユニット15は、図1に示したディジタル送信設備内に存在することができる。図2では、信号前処理ユニット15は、ネットワーク9経由で送信するデータの前処理のために用いられる。ソースビデオユニット19で復元されたビデオフレームは、フェーズ検出器21に渡される。フェーズ検出器21は、テレシネを起源とするビデオと、標準的なブロードキャスト形式を起源とするビデオとを区別する。もしビデオがテレシネされていると判定されれば(YES判定パスがフェーズ検出器21を出て)、テレシネされたビデオは逆テレシナ23によって元のフォーマットに戻される。重複フレームが識別されて排除され、同じビデオフレームから導かれたフィールドは完成した画像に再び織り込まれる。再構築されたフィルム画像のシーケンスは、1/24秒の規則的な間隔で鮮明に記録されているので、圧縮ユニット27で実行される動作推定処理は、不規則な時間基準を有するテレシネされたデータよりもむしろ逆テレシネされた画像を用いてより正確となる。逆テレシネ動作を実行するために必要な付加的データは図2に示されていない。
【0015】
従来のNTSCビデオが認識された場合(フェーズ検出器21からのNOパス)、それは圧縮のためにデインタレーサ17に送られ、1/60秒の間隔で記録されるビデオフィールドとなる。異なるタイプのビデオがあらゆる時間に受信されうるので、フェーズ検出器21はソース19からストリームするビデオフレームを連続的に分析する。典型例として、NTSC規格に準拠するビデオはコマーシャルとしてテレシネのビデオ出力に挿入される。フェーズ検出器21でなされる判定は正確でなくてはならない。テレシネされたかのように、従来通り得られたNTSCを処理することは、ビデオ信号内の情報の重大な損失を招きかねない。
【0016】
信号前処理ユニット15は、一緒にコード化された画像グループの構成を適応して変化させるために画像グループ(GOP)パーティショナ26をも組み込んでいる。これは、入力において、4つのタイプのコード化フレーム(I、P、B又は「スキップフレーム」)を、複数のビデオフレームに割り当てるように設計され、その結果、受信端末3での画像品質を保持しながら、時間的冗長の大半を除去する。画像グループパーティショナ26及び圧縮モジュール27による処理は、ノイズ除去のための2次元フィルターを提供するプリプロセッサ25によって補助される。
【0017】
一局面において、フェーズ検出器21はビデオフレームの受信後、ある判定をする。この判定は、(i)テレシネ出力からの現在のビデオ及び3:2プルダウンフェーズが、図4の定義12に示した5つのフェーズP、P、P、P及びPのうちの1つであるかどうか、及び(ii)このビデオは従来のNTSCとして生成されたかどうか、を含む。この判定はフェーズPとして示される。
【0018】
これらの判定は、図2に示したフェーズ検出器21の出力として現れる。フェーズ検出器21からの「YES」と付されたパスは逆テレシナ23を作動させる。これは、同じ画像から形成されたフィールドを区別し合成できるように、正しいプルダウンフェーズを提供していることを示す。フェーズ検出器21からの「NO」と付されたパスは同様に、明確なNTSCフレームを最適処理のためにフィールドに分けるためのデインタレーサブロックを作動させる。
【0019】
図3Aは、ビデオストリームを逆テレシネする処理50を説明するフローチャートである。一局面において、処理50は、図2に示した信号前処理ユニット15によって実行される。ステップ51で始まり、信号前処理ユニット15は、受信したビデオに基づき複数の評価指標を判定する。この局面において、評価指標判定ユニット51の中で、同一のフレーム又は隣接したフレームから得られたフィールド間の差分の合計である4つの評価指標が形成される。50に示される処理機能は、信号前処理ユニット15に含まれうる図3Bに示したデバイス70内で再現される。システム構造70は、評価指標判定モジュール71及び逆テレシナ72を備える。4つの評価指標は51内で、6つの仮定されたフェーズのそれぞれについて、受信したデータから得られる4つの評価指標と、これら評価指標のもっともらしい値との間のユークリッド距離の大きさにアセンブルされる。このユークリッド合計はブランチ情報と呼ばれる。受信した各フレームには、このような6つの数がある。各仮定されたフェーズは、可能なプルダウンフェーズの場合に、各受信したフレームとともに変化する後続フェーズを有する。遷移可能なパスは図7に示され、67と付されている。このようなパスは6つある。判定処理は仮定されたフェーズの各パスについて、ユークリッド距離の合計と同等な6つの大きさを持つ。変化した状態に応じてこの手順を踏むために、この合計におけるユークリッド距離は古くなると減少する。ユークリッド距離の合計が最小であるフェーズトラックは、作動していると見なされる。このトラックのカレントフェーズは、「適用可能フェーズ」と呼ばれる。選択されたフェーズに基づいて逆テレシネすることは、このフェーズがPでない限り、ブロック52に示すように作用する。もしPが選択された場合は、カレントフレームがデインタレースされる。
【0020】
つまり、適応可能フェーズは、カレントプルダウンフェーズとして利用されるか、又は有効なNTSCフォーマットを有すると推定されているフレームのデインタレースを命令するインディケータとして利用されるかの何れかである。
【0021】
図2に示したビデオインプット19から受け取った全てのフレームには、4つの各評価指標について新しい数値データが計算される。これらは以下のように定義される。
【数1】

【0022】
SADという用語は、「絶対差分総和」(summed absolute differences)の略語である。評価指標を生成するために特徴付けられるフィールドが図5に図示されている。下付きの数字はフィールド番号を表し、文字は先行(=P)又はカレント(=C)の何れかを示す。図5内の括弧は、フィールド間の差を計算するペアのフィールドを表す。SADFSは、図5の記載の中でFSと付された括弧で括られた、Cと付されたカレントフレームのフィールド1と、Pと付された先行フレームのフィールド1との間の差分を表す。SADSSは、SSと付された括弧で括られた、Cと付されたカレントフレームのフィールド2と、Pと付された先行フレームのフィールド2との間の差分を表す。SADCOは、COと付された括弧で括られた、Cと付されたカレントフレームのフィールド2と、Cと付されたカレントフレームのフィールド1との間の差分を表す。SADPOは、POと付された括弧で括られた、カレントフレームのフィールド1と、先行フレームのフィールド2との間の差分を表す。
【0023】
各SADの値を求める計算負荷を以下に説明する。従来のNTSCには、約480のアクティブな横線がある。4:3の縦横比を用いて、横方向と同じ解像度を得るためには、480×4/3=640に等しい縦線、又は自由度が必要である。640×480ピクセルのビデオフォーマットは、高品位テレビ企画委員会(the Advanced Television Standards Committee)によって受け入れられているフォーマットのうちの1つである。従って、フレームの継続時間である1/30秒毎に、640×480=307,200の新たなピクセルが生成される。新たなデータは、毎秒9.2×10ピクセルの割合で生成され、これは、このシステムを実行しているハードウェア又はソフトウェアが約10Mバイト又はそれ以上のレートでデータを処理することを示唆している。これは、このシステムにおける高速部分の一つである。これは、ハードウェア、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード又はこれらの組み合わせによって実現することができる。SAD計算機は、ハードウェア、ファームウェア、ミドルウェアのように別のデバイスの構成要素に組み込まれる独立型の構成要素となったり、又はプロセッサ上で実行されるマイクロコードやソフトウェアで実現されたり、又はこれらの組み合わせとなることができる。ソフトウェア、ファームウェア、ミドルウェア又はマイクロコードで実現される場合、計算を実行するプログラムコード又はコードセグメントは、たとえば記憶媒体のような機械読取可能媒体に記憶されうる。コードセグメントは、手順、関数、サブプログラム、プログラム、ルーチン、サブルーチン、モジュール、ソフトウェアパッケージ、クラス、又は、命令、データ構成又はプログラム文のあらゆる組み合わせを表すことができる。コードセグメントは、情報、データ、引数、パラメータ又はメモリコンテンツを渡すこと及び/又は受け取ることによって、別のコードセグメントやハードウェア回路と結合することができる。
【0024】
図6のフローチャート30は、図5に示した関係を明示し、式1乃至4を図示するものである。これは、各々SADFS、SADCO、SADSS及びSADPOの最も新しい数値を保持するストレージロケーション41、42、43及び44を示す。これらは、先行する第1のフィールドデータの輝度値31、カレントの第1のフィールドデータの輝度値32、カレントの第2のフィールドデータの輝度値33、及び先行の第2のフィールドデータの輝度値34を処理する4つの絶対差分総和計算機によってそれぞれ生成される。評価指標を定義する総和において、「value(i,j)」という用語は、位置i,jにおける輝度値であるとされる。また、この総和は、全てのアクティブピクセルに亘って行われ、アクティブピクセルのうち意味のあるサブセットに亘る総和も除外されない。
【0025】
図8のフローチャート80は、テレシネされたビデオを検出し、それを元のスキャンされたフィルム画像に復元するために反転するための処理を図解する、詳細なフローチャートである。ステップ83に従って、4つの評価指標の低エンベロープ値が見出される。SAD評価指標の低エンベロープは、SADが入らない最も高い下限であり、動的に判定される数である。ステップ85に従って、以下の式5乃至10で定義されるブランチ情報量が、先行して判定された評価指標、低エンベロープ値、及び実験的に判定された定数Aを考慮して判定される。連続するフェーズ値は整合が取れていないかもしれないので、この明白な不安定性を低減するために、量△がステップ87において判定される。フェーズシーケンスの判定が、図7に示された課題のモデルと整合する場合に、フェーズは整合すると見なされる。このステップの後、我々は、カレントの数値△を用いて判定変数を計算するステップ89へと移行する。判定変数計算機89は、それにつながる80各ブロックで生成された全ての情報を用いて、判定変数を求める。ステップ30、83、85、87及び89は、図3に示した評価指標判定51を詳述したものである。これらの変数から、適応可能フェーズが、フェーズセレクタ90によって発見される。判定ステップ91は図示したように、テレシネされたビデオを反転することか、示されるようにデインタレースすることかの何れかに、この適応可能フェーズを用いる。これは、図2に示したフェーズ検出器21の動作の、より明確な記述である。一局面において、図8の処理は、図2に示したフェーズ検出器21によって実行される。ステップ30から始めて、検出器21は、図5と関連して上述した処理によって複数の評価指標を判定し、ステップ83、85、87、89,90及び91を経て続く。
【0026】
フローチャート80は、カレントフェーズを推定する処理を図解している。このフローチャートはステップ83において、ブランチ情報を計算するため、判定された評価指標と低エンベロープ値とを用いることを説明している。このブランチ情報は、上述したユークリッド距離であると認識されうる。このブランチ情報を生成するために用いられる典型的な式は、以下の式5乃至10である。このブランチ情報数は、図9のブロック109で計算される。
【0027】
処理されたビデオデータは、たとえばプロセッサ25に接続された、ディスクタイプ記憶媒体(例えば、磁気又は光学)、又はチップ構成記憶媒体(例えば、ROM、RAM)を含むことができる記憶媒体に記憶されることができる。いくつかの局面において、逆テレシナ23及びデインタレーサ17はそれぞれ、この記憶媒体の一部又は全部を含むことができる。ブランチ情報量は以下の式によって求められる。
【数2】

【0028】
このブランチ情報の詳細は、図10のブランチ情報計算機109に示される。計算機109に図示されるように、ブランチ情報の生成には、SADFS及びSADSSの低エンベロープ値L、SADPOの低エンベロープ値L、SADCOの低エンベロープ値Lを用いる。これらの低エンベロープ値は、H及びHを生成するために、単独又は予め定められた定数Aとともに、ブランチ情報計算機において、距離オフセットとして用いられる。これらの値は、以下に記述する低エンベロープトラッカーで、最新で保持される。Hオフセットは以下のように定められる。
【数3】

【0029】
、L及びLの値のトラッキング処理は、図11A、11B及び11Cで表されている。たとえば、図11Aの上部に示したL100のトラッキングアルゴリズムを考慮されたい。評価指標SADPOは、Lのカレント値と閾値Tとの和と、比較器105で比較される。もしSADPOがそれを上回れば、ブロック115に示すように、Lのカレント値は変化しない。上回らなければ、ブロック113に示すように、Lの新たな値はSADPOとLとの一次結合となる。ブロック115の別の局面では、Lの新たな数値はL+Tである。
【0030】
図11B及び11Cに示された量L及びLも同様に計算される。同じ機能を有する図11A、11B及び11Cの処理ブロックは、同じ番号を付されているが、異なる変数のセットに関する演算を示すためにプライム記号(‘又は“)が付されている。たとえば、SADPOとLの一次結合が形成される場合、その演算はブロック113’に示される。Lの場合と同様に、115’の別の局面はLをL+Tによって置き換えることができる。
【0031】
しかしLの場合、図11Cに示したアルゴリズムは、低エンベロープ値Lが数値SADFSとSADSSのどちらにも適応するため、これらの数値にXをそれぞれラベルし、SADFSとSADSSとを交互に処理する。ブロック108に示したSADFSのカレント値がブロック103でXの位置に読み込まれ、続いてブロック107に示したSADSSのカレント値がブロック102でXの位置に読み込まれると、SADFSとSADSSの値が入れ替わる。Lの場合と同様に、115”の別の局面はLをL+Tに置き換えるだろう。カレントの低エンベロープ値をテストすることに用いられる量A及び閾値は、実験によって予め定められている。
【0032】
図9は、図8のステップ89を実行する典型的な処理を図示するフローチャートである。図9は一般に判定変数を更新する処理を示す。ここで、6つの判定変数(6つの起こりうる判定に対応する)が、評価指標から導かれる新たな情報を用いて更新される。判定変数は以下のように求められる。
【数4】

【0033】
量αは1(unity)より小さく、判定変数の以前の数値への依存性を限定する。αを用いることは、各ユークリッド距離の効果を、それらのデータエージとして減少することに等しい。フローチャート62において、更新された判定変数は、ライン101、102、103、104、105及び106で利用できるように左に挙げられている。1つのフェーズ遷移パスの各判定変数は、ブロック100のうちの1つにおいて、1より小さい数αが掛けられる。その後、減少された元の判定変数の値は、この減少された判定変数があるフェーズ遷移パスで、次のフェーズによってインデクスされたブランチ情報変数のカレント値に加えられる。これはブロック110で起こる。変数Dはブロック193で量△によってオフセットされる。△はブロック112で計算される。以下で説明するように、この量は、このシステムによって判定されるフェーズシーケンス内の不整合を減少するように選択される。判定変数の最小値はブロック20で求められる。
【0034】
つまり、各判定に特有の新たな情報は、カレントの判定変数の値を得るために、αが掛けられている、適切な判定変数の以前の値に加えられる。新たな判定は、新たな評価指標が得られると、なされることができる。従って、この技術は、あらゆるフレームのフィールド1及び2を受け取ると、新たな判定をすることができる。これらの判定変数は、先に述べたユークリッド距離の総和である。
【0035】
適用可能フェーズは、最小の判定変数の下付き文字を有するものになるように選択される。この判定変数に基づく判定は、図8のブロック90で明確になされる。ある判定は判定空間の中で可能となる。ブロック91で説明しているように、これらの判定は以下である。(i)適用可能フェーズがPにない。ビデオを逆テレシネする。(逆テレシネ処理を導く適用可能フェーズの利用は図示されず。)(ii)適用可能フェーズがPである。ビデオをデインタレースする。
【0036】
各フェーズは、判定変数のカレント値に依存する状態と、6つのブランチ情報量との間の遷移を有する、有限状態機械の可能な状態と見なされうる。この遷移が以下のパターンに従う場合、
【数5】

【0037】
機械は正確に動作する。コヒーレントな判定ストリングでは、本質的に変数である評価指標がビデオから得られるために、たまにエラーがありうる。この技術は、図7と矛盾するフェーズシーケンスを検出する。この動作は、図12で概説される。アルゴリズム400は、ブロック405で現在のフェーズ判定の下付き文字(=x)を記憶し、ブロック406で先行のフェーズ判定の下付き文字(=y)を記憶する。ブロック410で、x=y=5がテストされる。ブロック411で、以下の式がテストされる。
【数6】

【0038】
もし何れかのテストが肯定的結果であれば、ブロック420で、この判定は矛盾していないと宣言される。もし何れのテストも肯定的結果を示さなければ、図9のブロック193で示したように、オフセットは図13において計算され、Pと関連する判定変数であるDへ加えられる。
【0039】
の修正も、フェーズシーケンスの不整合に対する訂正動作を提供する、処理200の一部として図13に現れる。フローチャート200のブロック210における整合性テストが失敗したと仮定する。ブロック210から導かれる「No」ブランチに沿って進行すると、次のブロック214でのテストは、i<5である全てのiに対してD>Dであるか、あるいはi<5であるとき少なくとも1つの変数DがDより大きいか、というテストである。もし第1の場合が有効であれば、初期値がδであるパラメータδは、ブロック216で3δに変えられる。もし第2の場合が有効であれば、ブロック217でδは4δに変えられる。ブロック112Bにおいて、△の値は、以下の式を満たす△に更新される。
【数7】

【0040】
再度ブロック210に戻り、判定ストリングが矛盾しないと判断されたと仮定する。パラメータδは、ブロック215において、以下の式によって定義されるδに変えられる。
【数8】

【0041】
ブロック112Aで、δの新たな値が△に挿入され、△との関係を以下のように更新する。
【数9】

【0042】
その後、更新された値△は、ブロック193で、判定変数Dに加えられる。
【0043】
図14は、かつてプルダウンフェーズが判定されると、逆テレシネ処理が、システム301においてどのように進むかを示す。この情報を用いて、フィールド305及び305’は同じビデオフィールドを表すものとして特定される。2つのフィールドは平均化され、フレーム320を再構築するために、フィールド306と結合される。再構築されたフレームが320’である。同様の処理がフレーム322を再構築するであろう。フレーム321及び323から得られたフィールドは重複しない。これらのフレームは、第1及び第2のフィールドを一緒に組み上げることで再構築される。
【0044】
上述した局面において、新たなフレームが受信される度、4つの新たな評価指標数値が求められ、新たに計算された判定変数を用いて、6つのセットの仮定がテストされる。他の処理構造は、判定変数を計算するように適応することができる。ビタビデコーダは、パス評価指標を形成するために、パスを作り上げるブランチの評価指標を加える。ここで定められる判定変数は、各々が新たな情報変数の"leaky"な総和であることと同様のルールによって形成される。(leakyな総和では、判定変数の先行値は、新たな情報データが加えられる前に、1(unity)より小さい数を掛けられる。)ビタビデコーダ構造は、この手順の動作をサポートするように修正されることができる。
【0045】
現在の局面は、新たなフレームが1/30秒毎に現れる従来のビデオ処理の用語を用いて記載されているが、この処理は、時間を遡って記録され処理されるフレームを適用されうることが注目される。判定空間は同じままであるが、インプットフレームのシーケンスの時間反転を反映する軽微な変更がある。たとえば、時間反転モードのコヒーレントなテレシネ判定ストリング(以下に示す)

もまた、時間反転されるであろう。
【0046】
第1の局面においてこの変形例を用いることによって、正しい判定を行う際に、2つの試み(一方は時間どおりに進行すること、他方は時間に逆進行すること)からなる判定処理を行うことが可能となろう。この2つの試みは独立していないが、各試みが異なる順序で評価指標を処理するという点で異なっている。
【0047】
このアイディアは、処理のために未来のビデオフレームを記憶するために保持されるバッファと組み合わせて適用されるだろう。もしビデオセグメントが、順方向の処理において許容できない矛盾する結果を与えるとわかった場合、この手順は、バッファから未来のフレームを引き出し、逆方向にフレームを処理することによって、難しいビデオの引き伸ばしを克服しようと試みるであろう。
【0048】
本願に記載されているビデオ処理は、PAL方式のビデオにも適用することができる。
【0049】
この局面は、フローチャート、フロー図、構造図又はブロック図として説明される処理として説明されうることが注目される。フローチャートは、連続した処理としてこの動作を説明するが、動作の大半は、並行して、又は同時に実行することができる。更に、動作の順序は、並べ替えられうる。処理は、動作が完全に遂行されると終了する。処理は、方法、関数、手順、サブルーチン、サブプログラム等に相当しうる。処理が関数に相当する場合、処理の終了は、関数が、呼び出し関数又はメイン関数に戻ることに相当する。
【0050】
本明細書に開示されたデバイスの、1つ又は複数の要素が、このデバイスの動作に影響を与えることなく再構成されうることが、当業者には明白であるはずである。同様に、本明細書に開示されたデバイスの、1つ又は複数の要素が、このデバイスの動作に影響を与えることなく組み合わせられうる。当業者は、情報及び信号が、あらゆる種類の異なる技術を用いて示されうることを理解するであろう。当業者は更に、本明細書に開示された実施例に関連して記載された、実例となる様々な論理ブロック、モジュール、及びアルゴリズムステップが、電子工学的ハードウェア、ファームウェア、コンピュータソフトウェア、ミドルウェア、マイクロコード、又はこれらの組み合わせとして実現されうることをよく理解するであろう。ハードウェアとソフトウェアの相互置換性を明確に説明するために、様々な実例となる構成要素、ブロック、モジュール、回路、及びステップが、それらの機能観点から一般的に説明された。このような機能が、ハードウェアとして実現されるかソフトウェアとして実現されるかは、システム全体に課された設計制約及び特定のアプリケーションによる。当業者は、各特定のアプリケーションのために上述した機能を様々な方法で実装することができるが、このような実現の判定は、開示された方法の範囲から逸脱させるものとして解釈されてはならない。
【0051】
本明細書で開示された例に関連して記述された方法やアルゴリズムのステップは、ハードウェアによって直接的に、プロセッサによって実行されるソフトウェアモジュールによって、または、これらの組み合わせによって具現化される。ソフトウェアモジュールは、RAMメモリ、フラッシュメモリ、ROMメモリ、EPROMメモリ、EEPROMメモリ、レジスタ、ハードディスク、リムーバブルディスク、CD−ROM、あるいは当該技術分野で知られているその他の型式の記憶媒体に収納されうる。 典型的な記憶媒体は、プロセッサがそこから情報を読み取り、またそこに情報を書き込むことができるようにプロセッサに結合される。または、記憶媒体はプロセッサに統合されうる。このプロセッサと記憶媒体は、特定用途向け集積回路(ASIC)内に存在することができる。ASICは、無線モデム内に存在することもできる。あるいはこのプロセッサと記憶媒体は、無線モデム内のディスクリート部品として存在することができる。
【0052】
更に、本明細書で開示された例に関連して記述された様々な例示的論理ブロック、コンポーネント、モジュール、および回路は、汎用プロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)あるいはその他のプログラマブル論理デバイス、ディスクリートゲートあるいはトランジスタロジック、ディスクリートハードウェア部品、又は上述された機能を実現するために設計された上記何れかの組み合わせを用いて実現又は実行されうる。汎用プロセッサとしてマイクロプロセッサを用いることが可能であるが、代わりに、従来技術によるプロセッサ、コントローラ、マイクロコントローラ、あるいは状態機器を用いることも可能である。プロセッサは、たとえばDSPとマイクロプロセッサとの組み合わせ、複数のマイクロプロセッサ、DSPコアに接続された1または複数のマイクロプロセッサ、またはこのような任意の構成である計算デバイスの組み合わせとして実現することも可能である。
【0053】
開示された例における上記記載は、当業者をして、開示した方法および装置の活用または利用を可能とするために提供される。これらの例への様々な変形例もまた、当業者に対しては明らかであって、本明細書で定義された原理は、開示した発明および装置の主旨または範囲から逸脱することなくその他の例および追加例にも適用されうる。
【0054】
本局面の記述は、例示することが意図されており、特許請求の範囲を限定することは意図されない。
【図面の簡単な説明】
【0055】
【図1】図1は、ビデオ送信システムを示すブロック図である。
【図2】図2は、図1の構成要素のより詳細な局面を示すブロック図である。
【図3A】図3Aは、テレシネされたビデオを反転する処理を示すフローチャートである。
【図3B】図3Bは、逆テレシネのためのシステムの構成を示すブロックである。
【図4】図4は、フェーズ図である。
【図5】図5は、複数の評価指標を生成するために用いられるフレームの各々を識別する。
【図6】図6は、図5の評価指標がどのようにして生成されるかを示すフローチャートである。
【図7】図7は、適用可能フェーズの遷移を示すトレリスである。
【図8】図8は、推定されたフェーズに達するための評価指標の処理を示すフローチャートである。
【図9】図9は、決定変数を生成するためのシステムを示すデータフロー図である。
【図10】図10は、ブランチ情報の数値を求めるために用いられる変数を示すブロック図である。
【図11A】図11Aは、低エンベロープ値がどのようにして計算されるかを示すフローチャートである。
【図11B】図11Bは、低エンベロープ値がどのようにして計算されるかを示すフローチャートである。
【図11C】図11Cは、低エンベロープ値がどのようにして計算されるかを示すフローチャートである。
【図12】図12は、整合性検出器の動作を示すフローチャートである。
【図13】図13は、フェーズ判定における不整合を補正するために用いられる決定変数に対するオフセットを計算する処理を示すフローチャートである。
【図14】図14は、プルダウンフェーズが推定された後の、逆テレシネの動作を示す。

【特許請求の範囲】
【請求項1】
複数のビデオフレームを処理する方法であって、
前記ビデオフレームから複数の評価指標を判定することと、
前記判定した評価指標を用いて前記ビデオフレームを逆テレシネすることと
を備える方法。
【請求項2】
逆テレシネすることは、プルダウンフェーズを推定することを備える請求項1に記載の方法。
【請求項3】
判定することは、
前記複数のビデオフレームの中で、時間において第2のフレームに後続する第1のフレームの第1のフィールドと、前記複数のビデオフレームの中で第2のフレームの第1のフィールドとの間の何れかの差分を示す第1の評価指標を判定することと、
第1のフレームの第2のフィールドと、第2のフレームの第2のフィールドとの間の何れかの差分を示す第2の評価指標を判定することと、
前記第1のフレームの第1のフィールドと、前記第2のフレームの第2のフィールドとの間の何れかの差分を示す第3の評価指標を判定することと、
前記第1のフレームの第1のフィールドと、前記第1のフレームの第2のフィールドとの間の何れかの差分を示す第4の評価指標を判定することとを備え、
前記第1、第2、第3、及び第4の評価指標のうち少なくとも1つがプルダウンフェーズを示す請求項1に記載の方法。
【請求項4】
前記4つの評価指標のうち少なくとも1つは、前記ビデオフレームのうちの少なくとも1つがテレシネされておらず、ブロードキャスト規格に準拠することを示す請求項3に記載の方法。
【請求項5】
前記第1の評価指標は、前記第1のフレームの第1のフィールドと前記第2のフレームの第1のフィールドとの間の絶対差分総和(SADFS)を備え、前記第2の評価指標は、前記第1のフレームの第2のフィールドと前記第2のフレームの第2のフィールドとの間の絶対差分総和(SADSS)を備え、前記第3の評価指標は、前記第1のフレームの第1のフィールドと、前記第2のフレームの第2のフィールドとの間の絶対差分総和(SADPO)を備え、前記第4の評価指標は、前記第1のフレームの第1のフィールドと、前記第1のフレームの第2のフィールドとの間の絶対差分総和(SADCO)を備えている請求項3に記載の方法。
【請求項6】
SADFSとSADSSとの低エンベロープレベルと、SADPOとSADCOとの低エンベロープレベルとを計算することを更に備える請求項5に記載の方法。
【請求項7】
判定することは、前記4つの評価指標からブランチ情報を計算することを更に備える請求項3に記載の方法。
【請求項8】
判定することは、
前記複数のビデオフレームにおいて、各ビデオフレームの複数の評価指標を判定することと、
前記評価指標からブランチ情報を判定することと、
前記ブランチ情報から判定変数を決定することとを備え、前記ビデオフレームを逆テレシネすることは、各ビデオフレームの適用可能フェーズを識別することを更に備える請求項1に記載の方法。
【請求項9】
前記適用可能フェーズは、前記複数のビデオフレームのうち少なくとも1つのビデオフレームがテレシネされているか、またはブロードキャスト規格に準拠するかを示す請求項8に記載の方法。
【請求項10】
逆テレシネすることは、逆テレシネするために、前記適用可能フェーズをプルダウンフェーズとして用いることを備える請求項9に記載の方法。
【請求項11】
前記適用可能フェーズの不整合を検出することを更に備える請求項10に記載の方法。
【請求項12】
前記検出された不整合を、前記オフセットを少なくとも1つの判定変数に調節することによって減少することを更に備える請求項11に記載の方法。
【請求項13】
ビタビ相等のデコーダで前記判定変数を決定することを更に備える請求項8に記載の方法。
【請求項14】
前記ビデオフレーム内の少なくとも重複したフィールドを平均することを更に備える請求項1に記載の方法。
【請求項15】
状態機械を経由してプルダウンフェーズを判定することを更に備える請求項8に記載の方法。
【請求項16】
複数のビデオフレームを処理する装置であって、
前記ビデオフレームから複数の評価指標を判定するように構成された計算モジュールと、
前記判定した評価指標を用いて前記ビデオフレームを逆テレシネするように構成されたフェーズ検出器とを備える装置。
【請求項17】
前記フェーズ検出器は、プルダウンフェーズを推定するように更に構成された請求項16に記載の装置。
【請求項18】
前記計算モジュールは、
前記複数のビデオフレームの中で、時間において第2のフレームに後続する第1のフレームの第1のフィールドと、前記複数のビデオフレームの中で第2のフレームの第1のフィールドとの間の何れかの差分を示す第1の評価指標を判定し、
第1のフレームの第2のフィールドと、第2のフレームの第2のフィールドとの間の何れかの差分を示す第2の評価指標を判定し、
前記第1のフレームの第1のフィールドと、前記第2のフレームの第2のフィールドとの間の何れかの差分を示す第3の評価指標を判定し、
前記第1のフレームの第1のフィールドと、前記第1のフレームの第2のフィールドとの間の何れかの差分を示す第4の評価指標を判定するように構成され、
前記フェーズ検出器は、プルダウンフェーズを示すために前記第1、第2、第3、及び第4の評価指標のうち少なくとも1つを用いる請求項16に記載の装置。
【請求項19】
前記フェーズ検出器は、前記ビデオフレームのうち少なくとも1つがテレシネされておらず、ブロードキャスト規格に準拠することを示すために、前記計算モジュールによって判定された4つの評価指標のうち少なくとも1つを用いる請求項18に記載の装置。
【請求項20】
前記計算モジュールは、
前記複数のビデオフレームにおいて、各ビデオフレームの複数の評価指標を判定し、
前記評価指標からブランチ情報を判定し、
前記ブランチ情報から判定変数を決定するように構成された請求項16に記載の装置。
【請求項21】
フェーズ検出器は、前記判定変数に基づいて、各ビデオフレームの適用可能フェーズを識別するように構成された請求項20に記載の装置。
【請求項22】
前記フェーズ検出器は、前記適用可能フェーズに基づき、ビデオフレームがテレシネされているか、ブロードキャスト規格に準拠するかを示すように構成された請求項21に記載の装置。
【請求項23】
前記フェーズ検出器は、前記適用可能フェーズをプルダウンフェーズとして識別することによって、前記ビデオフレームを逆テレシネするように構成された請求項22に記載の装置。
【請求項24】
前記計算モジュールは、プルダウンフェーズを判定する状態機械を更に備える請求項20に記載の装置。
【請求項25】
複数のビデオフレームを処理する装置であって、
前記ビデオフレームから複数の評価指標を判定する手段と、
前記判定した評価指標を用いて前記ビデオフレームを逆テレシネする手段とを備える装置。
【請求項26】
前記逆テレシネする手段は、プルダウンフェーズに基づいて前記ビデオフレームを逆テレシネする請求項25に記載の装置。
【請求項27】
前記逆テレシネする手段は、前記ビデオフレームのうち少なくとも1つがテレシネされておらず、ブロードキャスト規格に準拠することを示すために、4つの評価指標のうち少なくとも1つを用いる請求項25に記載の装置。
【請求項28】
前記評価指標を判定する手段は、
前記複数のビデオフレームにおいて、各ビデオフレームの前記複数の評価指標を判定する手段と、
前記評価指標からブランチ情報を判定する手段と、
前記ブランチ情報から判定変数を決定する手段とを備え、
前記ビデオフレームを逆テレシネする手段は、前記判定変数に基づいて各ビデオフレームの適用可能フェーズを識別する手段を備える請求項25に記載の装置。
【請求項29】
前記適用可能フェーズを識別する手段は、前記ビデオフレームがテレシネされているか、ブロードキャスト規格に準拠するかを示す手段を含む請求項28に記載の方法。
【請求項30】
前記逆テレシネする手段は、逆テレシネするために、前記適用可能フェーズをプルダウンフェーズとして識別する請求項29に記載の方法。
【請求項31】
前記適用可能フェーズを識別することは、前記適用可能フェーズの値における不整合を検出する手段を含む請求項30に記載の装置。
【請求項32】
プルダウンフェーズを判定する手段は、状態機械を備える請求項28に記載の装置。
【請求項33】
複数のビデオフレームを処理する命令を備える機械読取可能媒体であって、前記命令は、実行されると機械に、
前記複数のビデオフレームから複数の評価指標を判定させ、
前記判定した評価指標を用いて前記ビデオフレームを逆テレシネさせる機械読取可能媒体。
【請求項34】
前記命令は、前記機械に更に、
前記複数のビデオフレームにおいて、各ビデオフレームの複数の評価指標を判定させ、
前記評価指標からブランチ情報を判定させ、
前記ブランチ情報から判定変数を決定させ、
前記機械にビデオフレームを逆テレシネさせる命令は、前記機械に更に、前記判定変数に基づいて、ビデオフレームに適用可能フェーズを識別させる請求項33に記載の機械読取可能媒体。
【請求項35】
前記機械に適用可能フェーズを識別させる命令は、前記機械に更に、前記ビデオフレームが逆テレシネされているか、ブロードキャスト規格に準拠するかを示させる請求項34に記載の機械読取可能媒体。
【請求項36】
前記命令は、前記機械に更に、前記複数のビデオフレームの1つを逆テレシネするためのプルダウンフェーズを判定させる請求項35に記載の機械読取可能媒体。
【請求項37】
前記命令は、前記機械に更に、状態機械として動作することによってプルダウンフェーズを判定させる請求項34に記載の機械読取可能媒体。
【請求項38】
複数のビデオフレームから複数の評価指標を判定し、
前記判定した評価指標を用いて前記ビデオフレームを逆テレシネするように構成されたビデオコード化プロセッサ。
【請求項39】
前記プロセッサは、プルダウンフェーズを判定することによって逆テレシネする請求項38に記載のビデオコード化プロセッサ。
【請求項40】
前記ビデオフレーム内の少なくとも重複したフィールドは、逆テレシネ出力を形成するために、前記プロセッサによって平均される請求項38に記載のビデオコード化プロセッサ。

【図1】
image rotate

【図2】
image rotate

【図3A】
image rotate

【図3B】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11A】
image rotate

【図11B】
image rotate

【図11C】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate


【公表番号】特表2009−513090(P2009−513090A)
【公表日】平成21年3月26日(2009.3.26)
【国際特許分類】
【出願番号】特願2008−538149(P2008−538149)
【出願日】平成18年10月24日(2006.10.24)
【国際出願番号】PCT/US2006/060196
【国際公開番号】WO2007/065041
【国際公開日】平成19年6月7日(2007.6.7)
【出願人】(595020643)クゥアルコム・インコーポレイテッド (7,166)
【氏名又は名称原語表記】QUALCOMM INCORPORATED
【Fターム(参考)】