説明

ハイパーリンクによってリンクされた注釈データ受信システム、放送システム及び注釈データを含む放送情報を利用する方法

【課題】ハイパーリンクによってテレビ放送にリンクされた情報を受信するシステムおよび方法を提供する。
【解決手段】放送内容は解析され、フレーム内の1つ以上の領域が識別される。情報が関連付けられたフレームを識別するためのタイミング情報を用いて、さらなる情報を領域と関連付けることが可能であり、符号化された様態で送信することが可能である。システムは、ビデオソースおよび符号器を含む。上記符号器は、上記ビデオソースと連絡するトランスポートストリームと、注釈ソースと、上記注釈ソースと連絡する符号化注釈データパケットを生成するデータパケットストリーム生成器と、符号器と、上記符号器および上記データパケットストリーム生成器と連絡するマルチプレクサシステムとを含む。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、放送テレビ、より具体的にはテレビ放送におけるハイパーリンクの分野に関する。
【背景技術】
【0002】
テレビ信号を介する情報の放送は従来技術において周知である。テレビ放送は一方向性であり、視聴者がテレビディスプレイ上に現れる素材と双方向通信する機会を提供しない。表示された素材に視聴者が遠隔制御を用いて応答することは公知であるが、通常、利用可能な放送のリスト項目から視聴するための番組を選択することに制限される。特に、情報が画面の1つ以上の領域と関連付けられるハイパーリンクテレビ番組を生成することは困難であることが判明した。本発明は、このニーズに応える。
【0003】
本出願は、「Interactive Hyperlinked Video System」と称される米国仮出願シリアルナンバー第60/185,668号(2000年2月29日出願)、「A Method and Apparatus for Hyperlinking in a Television Broadcast」と称されるシリアルナンバー第60/229,241号(2000年8月30日出願)、および「A Method and Apparatus for Hyperlinking in a Television Broadcast」と称されるシリアルナンバー第60/233,340号(2000年9月18日出願)の利益を主張する。これらの仮出願の各々は、参考のため、その全体を本明細書中で援用する。本出願は、「A METHOD AND APPRATUS FOR HYPERLINKING IN A TELEVISION BROADCAST」と称する米国実用特許出願シリアルナンバー第09/694,079号(2000年10月出願)および米国シリアルナンバー第09/715,944号(2000年11月17日出願)に対する優先権を主張する。これらの出願は、本出願の譲渡権を保有する同エンティティに譲渡可能である。
【発明の概要】
【0004】
本発明は、双方向式で視聴者に提供される情報を用いてテレビ放送素材を強化する方法およびシステムを提供する。
【0005】
1局面において、本発明はハイパーリンク注釈データシステム(hyperlinked annotation data system)に関する。このシステムは、同調器、同調器と通信する復調器、復調器と通信するビデオデコーダ、復調器と通信する表示デバイス、注釈データを格納するメモリ、ならびに復調器およびメモリと通信する中央処理ユニットを含む。中央処理ユニットによって実行されると、メモリは表示デバイス上で注釈データの表示を制御するコンピュータプログラムを格納する。1実施形態において、システムは視聴者双方向通信デバイスをさらに含む。コンピュータプログラムは、双方向通信デバイスを活性化する視聴者に応答して、表示デバイス上で注釈データを表示する。1実施形態において、システムは、マスク情報を格納する第2のメモリをさらに含む。マスク情報は、コンピュータプログラムによって用いられ、表示デバイス上の領域を識別する。1実施形態において、マスク情報はマスクタイムスタンプを含む。1実施形態において、マスクタイムスタンプはコンピュータプログラムによって用いられ、ビデオフレームと時間的に関連してマスク情報を表示する。
【0006】
1実施形態において、システムは、オブジェクト情報を格納する第3のメモリを含む。オブジェクト情報はコンピュータプログラムによって用いられ、ビデオフレーム内のオブジェクトを表示デバイス上に表示する。1実施形態において、オブジェクト情報はオブジェクトタイムスタンプ(object time stamp)を含む。1実施形態において、オブジェクトタイムスタンプは、有効タイムスタンプ(expiration time stamp)を含む。この有効タイムスタンプは、コンピュータプログラムによって用いられ、特定の時間の後、オブジェクト情報を削除する。1実施形態において、オブジェクト情報は、ビデオフレームにおけるオブジェクトのオブジェクト数を有するオブジェクトマッピングテーブルおよび対応する第1の識別子、ならびに第1の識別子によって参照されるオブジェクトプロパティテーブル(object properties table)、注釈データの第1のセットを有するオブジェクトプロパティテーブルを含む。1実施形態において、注釈データの第1のセットは、注釈データフィールド、および注釈データの第2のセットを識別する第2の識別子を含む。1実施形態において、注釈データフィールドは、タイトルデータフィールドであり、第2の識別子はオブジェクトのタイトルを含むストリングを識別する。1実施形態において、注釈データフィールドはメニューフィールドであり、第2の識別子は表示識別子のセットを含むセレクタ(selector)およびアクション識別子(action identifier)の対応するセットを参照する。1実施形態において、第1および第2の識別子は、システムによって重複されることはない。1実施形態において、第2の識別子は可変値である。
【0007】
別の局面において、本発明は、ハイパーリンク注釈データを含む放送情報を用いる方法を特徴とする。この方法は、放送情報を受信、復号、格納および操作するように適合された受信器を用いるステップを含む。この受信器は、中央処理ユニットおよび少なくとも1つのメモリデバイスを有し、受信情報のストリームを受信し、放送情報を復号してマスク情報を回復する。各マスクは、これと関連付けられたマスクタイムスタンプを有し、第1のデータ列におけるマスク情報を少なくとも1つのメモリデバイスに格納し、マスクタイムスタンプを表示されたビデオフレームのタイムスタンプと比較し、マスクタイムスタンプと、表示されたビデオのタイムスタンプとの間の関係に基づいてマスクを表示する。
【0008】
1実施形態において、この方法は、放送情報を復号してオブジェクト情報を回復することをさらに含む。各オブジェクトは、このオブジェクトと関連付けられたオブジェクトタイムスタンプを有し、第2のデータ列におけるオブジェクト情報を少なくとも1つのメモリデバイスに格納する。1実施形態において、復号は、第1のデータ列上で動作を実行する第1のアクティブスレッドによって実行される。比較は、第1のデータ列上で動作を実行する第二のアクティブスレッドによって実行される。1実施形態において、マスクタイムスタンプと、表示されたビデオフレームのタイムスタンプとを比較するステップは、最も早期のマスクタイムスタンプを最も最近表示されたビデオフレームのタイムスタンプと比較することで開始される。1実施形態において、第1のスレッドは、マスクデータの動作(behavior)を調整することができ、第2のスレッドは、オブジェクトデータの動作を調節することができる。
【0009】
1実施形態において、方法は、まだ表示されていないフレームにマスクタイムスタンプが対応する場合には、以下のステップをさらに含む:(a)関連するマスクを画像バッファへと復号するステップ、(b)復号されたマスクが即座に表示されるべきかどうかを確認するためにマスクタイムスタンプを点検するステップ、(c)復号されたマスクが即座に表示されるべき場合、復号されたマスクを表示し、復号されたマスクが後で表示されるべき場合、最後まで計算される時間の間、復号されたマスクが表示されるべき時間に休止し、始動すると即座に復号マスクを表示するステップ。
【0010】
さらに別の局面において、本発明は、ハイパーリンク注釈データを含む情報を放送する方法に関する。この方法は、マスク情報と関連するマスクタイムスタンプを有するマスク情報を符号化するステップ、およびマスクタイムスタンプに基づいて、ビデオ信号と一時的に関係して表示するために、ビデオ信号と関連して符号化されたマスク情報を伝送するステップを含む。1実施形態において、この方法は、オブジェクト情報と関連付けられたオブジェクトタイムスタンプを有するオブジェクト情報を符号化するステップ、およびオブジェクトタイムスタンプに基づいてビデオ信号一時的に関連して表示するために、ビデオスタンプビデオ信号と関連して、符号化されたオブジェクト情報を伝送するステップとをさらに含む。
【0011】
本発明の上述のオブジェクトおよび他のオブジェクト、局面、特徴、ならびに利点は、以下の説明および請求項からより明らかになる。
【図面の簡単な説明】
【0012】
【図1A】図1Aは、本発明のシステムにより生成されたビデオの連続フレームを示す。
【図1B】図1Bは、本発明のシステムにより生成されたビデオの連続フレームを示す。
【図1C】図1Cは、本発明のシステムにより生成されたビデオの連続フレームを示す。
【図1D】図1Dは、本発明のシステムにより生成されたビデオの連続フレームを示す。
【図2】図2は、本発明による、ハイパーリンクビデオシステムの実施形態のブロック図である。
【図2A】図2Aは、図2に示されるシステムの実施形態におけるデータフローのブロック図である。
【図2B】図2Bは、マスクパケットセットの図である。
【図2C】図2Cは、最初に符号化されたデータパケットストリームの図である。
【図2D】図2Dは、最後に符号化されたデータパケットストリームの図である。
【図3】図3は、図1に示されるマルチプレクサシステムの実施形態のブロック図である。
【図4】図4は、図2に示されるデジタル受信器の実施形態のブロック図である。
【図5】図5は、注釈データを格納する図2のシステムにより用いられるデータ構造の実施形態の図である。
【図5A】図5Aは、オブジェクトプロパティテーブルデータ構造およびプログラムマッピングテーブルデータ構造のブロック図である。
【図6】図6は、図2に示されるシステムの実施形態のデータフローの状態図である。
【図7】図7は、本発明の実施形態の図6に示される状態機械内の状態間および状態内での相互作用を示す。
【図8A】図8Aは、本発明による双方向通信コンテンツアイコンの実施形態の種々の例示的例を模式的に示す。
【図8B】図8Bは、本発明による双方向通信コンテンツアイコンの実施形態の種々の例示的例を模式的に示す。
【図8C】図8Cは、本発明による双方向通信コンテンツアイコンの実施形態の種々の例示的例を模式的に示す。
【図8D】図8Dは、本発明による双方向通信コンテンツアイコンの実施形態の種々の例示的例を模式的に示す。
【図8E】図8Eは、本発明による双方向通信コンテンツアイコンの実施形態の種々の例示的例を模式的に示す。
【図8F】図8Fは、本発明による双方向通信コンテンツアイコンの実施形態の種々の例示的例を模式的に示す。
【図8G】図8Gは、本発明による双方向通信コンテンツアイコンの実施形態の種々の例示的例を模式的に示す。
【図9A】図9Aは、本発明の原理による、ビデオ画像の圧縮方法の例示的実施形態を示す。
【図9B】図9Bは、本発明の原理による、ビデオ画像の圧縮方法の例示的実施形態を示す。
【図9C】図9Cは、本発明の原理による、ビデオ画像の圧縮方法の例示的実施形態を示す。
【図9D】図9Dは、本発明の原理による、ビデオ画像の圧縮方法の例示的実施形態を示す。
【図10A】図10Aは、本発明による、数学的形態学の用語で、2次元画像を説明するために用いられる、フレームの例示的領域および例示的マスクを示す。
【図10B】図10Bは、本発明の原理による、2次元数学的形態学的解析の例示的合成画像、および単一の合成ピクセルを示す。
【図11A】図11Aは、本発明による、時間を寸法として用いる数学的形態学の用語で2次元画像を説明するために用いられる例示的フレームのシーケンスおよび例示的マスクを示す。
【図11B】図11Bは、本発明の原理による、時間を寸法として用いる3次元数学的形態学解析の例示的合成フレームおよび単一の合成ピクセルを示す。
【図11C】図11Cは、本発明の1実施形態による、例示的プロセスを示すフローチャートであり、このプロセスによって3次元フラッドフィル(floodfill)が完成される。
【図12】図12は、本発明の原理による、領域の輪郭を生成する数学的形態学解析の例示的応用を示す図である。
【図13】図13は、本発明による、運動の表示である連続フレームにわたるヒストグラムの展開を示す図である。
【発明を実施するための形態】
【0013】
簡単な概観において、本発明は、注釈情報が放送ビデオのフレームに表示され、視聴者のコマンドに基づいて表示されるオブジェクトと関連付けられる方法を提供する。例えば、図1を参照して、商店、価格および入手可能な商品の情報の形式での注釈情報は、テレビ放送において俳優によって着用される特定のシャツ2と関連付けられ得る(図1A)。これを達成するために、シャツ2は、最初にオーサリングシステム(authoring system)と呼ばれるシステムの1部を動作する設計者によってシステムに識別される。設計者は、所与のフレーム内のシャツ2を例えば、シャツの色合いによって(図1B)識別し(3)、システムは、シャツ2の位置のトラックを前および次のフレームに保持する。この設計者は、さらに、シャツ2と関連する注釈データ5になるテキストを生成する。従って、この例において、注釈データはシャツ2が購買され得る商店の名称、シャツ2の価格および入手可能な色を含み得る。システムは、その後、例えば、フレーム内で異なった色で輪郭を描くことによって(4)、シャツ2がこれと関連する注釈データを有することを示す(図1C)。
【0014】
システムの伝送部分によって視聴者にショーが放送されるとき、ビデオだけでなく、シャツ2の輪郭を描くマスクおよびシャツ2に伴う注釈データも放送される。視聴者の位置にあるシステムの受信器部分は、このデータを受信し、関連する注釈データを有するオブジェクトの輪郭を描くマスクと一緒にビデオフレームを表示する。この例において、ビデオフレームにおけるシャツ2の輪郭が描かれる。放送されるビデオの視聴者が注釈データを見ることを所望する場合、この視聴者は、ただ、標準遠隔制御ハンドセット上のボタンを制御し、注釈データの表示が所望されることをシステムの受信器部分に通知する。システムは、その後、オブジェクトと一緒に注釈データ5を画面上に表示する(図1D)。このようにして、通知されたオブジェクトは、追加的情報へのハイパーリンクとして機能する。
【0015】
図2を参照して、本発明により構成されたハイパーリンクビデオ放送システムは、伝送部分10、通信チャンネル部分12および受容部分14を含む。伝送部分10は、ビデオソース20、オーサリングツール24、データベース格納システム28および送信器32を含む。種々の実施形態におけるビデオソース20は、ビデオカメラ、ビデオディスク、テープまたはカセット、ビデオフィード(video feed)または当業者に公知の任意の他のソースである。注釈ソースであるオーサリングツール24は、ビデオソース20からビデオデータを受信し、後述されるように、これをビデオ設計者が見て操作するように表示する。注釈データは、例えば、ビデオ画像を用いて表示されるべきテキストであり、オブジェクトデータベース28に格納され、システムの通信チャネル部分12を介して伝送するために送信器32に送信される。
【0016】
送信器32は、ビデオ符号器36、データパケットストリーム生成器40およびマルチプレクサ(mux)44を含み、通信チャンネル12を介して伝送するためにビデオ符号器36およびデータパケットストリーム生成器40からの信号を組み合わせる。ビデオ符号器36は、当業者に公知のように輸送ストリームを生成するための、MPEGまたはMPEG2符号器等の任意の符号器であり得る。データパケットストリーム生成器40は、後述のように、さらなるデータを符号化する。このデータは、視聴者に伝送されるときビデオデータに伴うべきデータである。データパケットストリーム生成器40は、符号化されたデータパケットを生成する。mux44は、アーギュメント輸送ストリームを生成する。
【0017】
通信チャンネル部分12は、ケーブル、地上放送インフラストラクチャ、マイクロ波リンクまたは衛星リンク等の伝送媒体だけでなく、受容部分14によって受信されるまで、ビデオデータを保持する任意の中間格納も含む。このような中間放送格納は、当業者に公知のビデオディスク、テープまたはカセット、メモリあるいは他の記憶デバイスを含み得る。通信チャンネル部分は、複数のサービスオペーレータによって供給されるヘッドエンド送信器50も含む。
受容部分14は、テレビディスプレイ58上に表示するための信号を復号するデジタルセットトップボックス等のデジタル受信器54を含む。デジタル受信器ハードウェア54は、当業者に公知の任意のデジタル受信器ハードウェア54である。
【0018】
動作中、および図2Aも参照して、設計者はビデオソース20からオーサリングツール24へビデオデータ22をロードする。ビデオデータ22は、さらに、例えば、MPEG標準を用いて符号化するために、ビデオソース20からビデオ符号器36へ送信される。オーサリングツール24を用いて、設計者は、ビデオ画像の部分を選択して、画面注釈(screen annotation)と関係付ける。例えば、設計者は、ビデオ画像において俳優によって着用されるシャツ2を選択し得、シャツ2の製造業、販売価格および地域の販売店を示す注釈データを割り当てる。逆に、注釈データは、オブジェクトについてのさらなるテキスト情報を含み得る。例えば、ドキュメンタリー番組における注釈データは、画面上の個人についての伝記ふうの情報を有し得る。後述されるように、マスク画像である画像におけるシャツ2の形状およびシャツ2の位置と一緒に、注釈データ5はデータ構造25、25‘としてデータベース28に格納される。
【0019】
設計者が一度、所与のプログラムをオーサリングすると、オーサリングツールは、オブジェクトは現れ、データ構造は注釈付きプログラムにおいて利用される範囲を決定する。この情報は、本発明のシステムによって用いられ、オブジェクトが視聴者に提供される前に、視聴者のオブジェクトとの双方向通信を可能にするデータが伝送されることを保証する。この情報は、本発明のシステムによっても用いられ、データがプログラムによってもはや必要とされず、後述されるメモリ128から消去され得るのはいつかを決定する。
【0020】
上述のように、この注釈データは、さらに、符号化されたデータパケットストリーム27に変換するためにデータパケットストリーム生成器40に送信される。ビデオ符号器36からの輸送ストリーム29におけるタイムスタンプデータは、さらに、データパケットストリーム生成器40への入力信号でもあり、マスクおよび注釈データを画像データと同期化するために用いられる。データパケットストリーム生成器40は、プログラムの手順を経て(step through)、ビデオの各フレームのタイミング情報を対応するマスクと関連付けることによって同期化を達成する。タイミング情報は、ビデオおよびマスク情報の同期化を可能にする任意の種類の情報であり得る。例えば、タイミング情報は、MPEG符号器、ビデオのSMPTE時間コード標準によって提供されるような時間コード情報、フレームまたはフレームの連続番号、世界の時間等の一意的識別子のようなフレームナンバリング情報によって生成されるようなタイムスタンプ情報であり得る。本発明のこの図示において、タイムスタンプ情報は、例示的実施形態として用いられる。
【0021】
ビデオ符号器36からの符号化されたビデオデータは、マルチプレクサ44におけるデータパケット生成器40からの符号化されたデータパケットストリーム27と組合され、その結果生じるアーギュメント輸送システム46は、マルチプレクサシステム48への入力である。この例示的実施形態において、マルチプレクサシステム48は、さらなる輸送ストリーム29’およびアーギュメント輸送ストリーム(argumented transport stream)46’’を受信することが可能である。輸送ストリーム29’およびアーギュメント輸送ストリーム46’’は、デジタル符号化されたビデオ、音声、および当業者に公知の他の方法によって生成されたデータストリームを含む。マルチプレクサシステム48からの出力は格納および/または放送用の通信チャンネル12に送信される。放送信号は、デジタル受信器54によって送信され、この受信器によって受信される。デジタル受信器54は、多重化された信号の符号化されたビデオ部分を表示用のテレビ58に送信する。デジタル受信器54は、さらに、ハンドヘルド遠隔制御ユニットを用いて視聴者からのコマンドを受取り、ビデオ画像に伴う任意の注釈を表示する。1実施形態において、デジタル受信器54は、さらに、代替的ネットワーク接続56と直接的に通信する(図2)。
【0022】
代替的実施形態において、オブジェクトデータベース28からの情報は、インターネット等のネットワーク31を通じてか、またはデータベース30に直接的にアクセスするために図2における第2のデータベース30に転送される。本実施形態において、ヘッドエンド50は、視聴者によってそのようにリクエストされると、第2のデータベース30に格納された注釈オブジェクトデータにアクセスする。この構成は、視聴者が後で見るための番組を記録し、記録媒体が注釈データを記録し得ないときか、またはデータが番組中に帯域内で伝送され得ないとき等の場合に有用である。従って、記録された画像がデジタル受信器54を通じて再生され、視聴者が注釈データをリクエストするとき、デジタル受信器54は、ネットワーク31を通じてデータを入手するようにヘッドエンド50に命令し得る。さらに、ヘッドエンド50は、デジタル受信器54の制御のもとで、ネットワーク31上のデータベース33か、またはヘッドエンドデータベース52にデータを書き込むことができる。ヘッドエンド50によって書き込まれたこのようなデータは、どのオブジェクトが見られているかを示すマーケティングデータであり得るか、またはネットワーク上で表示された品目を注文するために、視聴者によって必要とされる注文情報であり得る。第3の実施形態は、1部の情報は元の放送に含まれ、1部は視聴者によるリクエストに応答して取出される、先行する実施形態の属性を組合せる。
【0023】
符号化されたデータパケットストリーム27に関するさらなる詳細において、および図2B、図2Cおよび図2Dを参照して、データパケットストリーム生成器40は、ビデオフレームに対応するマスクデータおよび注釈データの大きさに相違はあるが、一定のデータレートストリームを生成するように設計される。データパケットストリーム生成器40は、これを、3つのステッププロセスによって達成する。第1のデータパケットストリーム生成器40は、マルチプレクサ44に入力され得るパケットレートの許容範囲を決定する。次に、データパケットストリーム生成器40は、符号化されるプログラムにおける最大のマスクによって満たされるパケットの数を決定する。これは、各マスクパケットセット39におけるパケットの数を決定する。すなわち、各マスクの輸送のために割当てられるパケットの数である。図2B、図2Cおよび図2Dに示される例において、各マスクパケットセット39に8個のパケットが存在する。この数を用いて、データパケットストリーム生成器40は、符号化されたデータパケットストリーム27’の初期バージョンを生成し、パケットの定数を各マスクに割当てる。特定のマスクを保持するために必要とされるパケットの数が定数よりも少ない場合、データパケットストリーム生成器40は、ヌルパケットの最初に符号化されたデータパケットストリーム27’をバッファする。ヌルパケットの数は、マスクデータが書き込まれた後に残っているパケットの数に依存する。図2Cにおいて、フレーム1000のマスクデータ42は、4つのパケットを満たし、これによって5つのパケットがヌルパケットによって満たされるべき4つのパケットが残る。同様に、データ42’、42’’、42’’’は、マスク999、マスク998、およびマスク997に関して、3つ、5つおよび2つのパケットをそれぞれ必要とする。これで、ヌルパケットによって満たされるべきそれぞれ5つ、3つ、および6つのパケットが残る。
【0024】
最後に、データパケットストリーム生成器40は、オブジェクトデータを付加することによって、最終的に符号化されたデータパケットストリーム27’’を生成する。データパケットストリーム生成器40は、オーサリングツール24によって提供される情報から、所与のオブジェクトがプログラム内に有する第1の情報(occurrence)を決定することによってこれを行なう。このオブジェクトに対応するデータは、その後、そのオブジェクトの第1の例の前の特定のポイントで開始する最初に符号化されたデータパケットストリーム27’に挿入される。データパケットストリーム生成器40は、最初に符号化されたデータパケットストリーム27’の手順を逆に経て、必要に応じて、ヌルパケットをオブジェクトデータと置き換える。例えば、図2Dにおいて、オブジェクト98は、フレーム1001に現れることが決定される。これは、オブジェクト98と関連するすべてのデータがフレーム1001の前に到着しなければならないことを意味する。オブジェクト98のデータ43は、5つのパケットO98A、O98B、O98C、O98DおよびO98Eを満たし、マスクデータ1000およびマスクデータ999に割当てられたパケットのセットに付加される。オブジェクト97のデータ43’は、2つのパケットO97AおよびO97Bを満たし、マスクデータ998に割当てられたパケットのセットに付加される。
【0025】
1実施形態における輸送ストリームからデータを抽出するプロセスを容易にするために、マルチプレクサ44は、MPEG2標準において基本ストリームを識別するために用いられるように、マスクデータおよびオブジェクトデータを異なったパケット識別子(PID)と関連付ける。この方法で、デジタル受信器54は、マスクおよびオブジェクトデータを主にそれらのPIDに基づく異なった計算スレッドに送られ得る。これによって、パケットのコンテンツの初期分析を実行する必要を除去する。マスクおよびオブジェクトデータの再組立てにおいて、デジタル受信器54は適切な数のパケットをストリームから抽出できる。なぜなら、この情報は符号化プロセスの部分としてデータパケットストリーム生成器40によって提供されるからである。例えば、図2Dを参照して、データパケットストリーム生成器40は、マスク1000は4つのパケット42を満たし、オブジェクト98のデータ43が5つのパケットを満たすことを指定する。このデータは、パケットのヘッダ38、38’、38’’、38’’’部分に含まれ、この部分は、各マスクパケットセットの第1のパケットの第1の16バイトを占める。
【0026】
図2Dにおいてマスクヘッダ38の拡大された図に示されるように、ヘッダパケットは、マスク情報を搬送するパケットの数に関する情報を含み、特定のマスクと関連する情報、タイムスタンプ情報、可視性ワード情報(visibility word information)および一意的識別子(UID)を符号化する。UIDおよびオブジェクトマッピングテーブルは、図5に関してより詳細に後述される。同様に、各オブジェクトの第1のパケットは、16バイトヘッダ45、45’で始まる。これはデジタル受信器54がオブジェクトパケット43、43’においてデータを抽出、格納および操作することを可能にする情報を含む。さらに、図2Dにおいてオブジェクトデータヘッダ45の拡大された図に示されるように、オブジェクトデータヘッダ情報は、特定のオブジェクト、オブジェクトのデータタイプ、オブジェクトのUID、およびオブジェクトデータがプログラムにおいて用いられる最後の例のようなタイムスタンプのような情報を搬送するパケットの数を含む。タイムスタンプのシステムおよびシステムの使用によって用いられるデータ構造のタイプは、図5、図6および図7に関してより詳細に後述される。
【0027】
図3を参照して、マルチプレクサシステム8’は、図2Aに示されるマルチプレクサシステムの強化されたバージョンである。マルチプレクサシステム48’は、複数の輸送29’およびアーギュメント輸送ストリーム46、46’’を電波媒体に渡す単一信号を生成するための入力として用いることができる。例示的マルチプレクサシステム44’は、3つの輸送ストリームマルチプレクサ60、60’、60’’、3つの変調器68、68’、68’’、3つのアップコンバータ72、72’、72’’およびミキサ78を含む。マルチプレクサシステム44’は、輸送ストリームの複数セットをミキサ78への入力へ変換する3つの重複サブシステム(duplicate subsiystem)を含む。各サブシステムは、輸送ストリームのセット(TS1対TSN)、(TS1’対TSN’)、(TS1’’対TSN)を(北米デジタルケーブルシステムの場合の直交振幅変調(QAM)または地上放送の場合の8VSB等の)デジタル変調器68、68’、68’’への入力信号として用いられるべき単一の輸送ストリーム(TS、TS’、TS’’)に組合せるためのマルチプレクサ60、60’、60’’を含む。1実施形態において、輸送ストリームの各々、例えば、TS1対TSNは、テレビ番組を表す。変調器68、68’、68’’の出力信号は、アップコンバータ72、72’、72’’への中間周波数入力信号であり、このアップコンバータは、変調器68、68’、68’’の出力信号を放送のための適切なチャンネル周波数に変換する。これらの変換されたチャンネル周波数は、周波数ミキサ78への入力周波数であり、この周波数ミキサ78は、組合された信号を電波媒体上に配置する。
【0028】
図4を参照して、デジタル受信器54は、関心の対象である放送チャンネルを入力放送ストリームから選択するための同調器を含み、チャンネル用のビデオおよび注釈データを含む中間周波数(IF)信号を生成する。IF信号は、変調器104への入力信号であり、IF信号を復調し、情報を輸送ストリーム(TS)に抽出する。輸送ストリームは、MPEG復号器等のビデオ復号器108への入力信号である。ビデオ復号器108は、フレームバッファ112において受信されたビデオフレームをバッファする。復号器108からの復号されたビデオ114および音声116の出力信号は、テレビディスプレイ58への入力信号である。 注釈データは、ビデオ復号器108により分離され、処理のためCPU124に伝送される。データはメモリ128に格納される。メモリは、注釈データおよび視聴者からの命令を処理するためのコンピュータプログラムも格納する。デジタル受信器54は、視聴者からの命令を受信し、注釈素材を表示し、注釈データは、1部またはすべてのフレームバッファ112をオーバーレイするコンピュータグラフィック画像としてレンダリングされる。復号器108は、その後、対応するビデオ信号114をテレビディスプレイ58に伝送する。
【0029】
ケーブルまたは光ファイバ等、信号を2方向性で搬送し得る媒体によって搬送される放送に関しては、デジタル受信器54から放送システムのヘッドエンド50に接続され得る。従来のテレビ放送またはテレビ衛星通信等の1方向性媒体により搬送される放送の代替的実施形態において、電波媒体を用いることなく、デジタル受信器54から、放送局または別のエンティティと通信する代替的ネットワーク接続56への接続がなされ得る。電波媒体の一部ではない放送局または別のエンティティと通信するための通信チャンネルは、電話、インターネットまたは類似のコンピュータ接続等であり得る。2方向性電波媒体が利用可能であっても、このような非電波(non−broadcast)通信チャンネルが用いられ得ることが理解されるべきである。このような通信接続は、視聴者の位置から放送局または広告主等別のエンティティに送信されるメッセージを搬送する。このような通信接続は、集合的にバックチャンネル(backchannels)と呼ばれる。
【0030】
バックチャンネル通信は、放送局または広告主にとって価値があり得る情報の収集、および視聴者に放送局、広告主またはその他との双方向通信を可能にすることを含む種々の目的のために用いられ得る。
【0031】
1実施形態において、デジタル受信器54は、遠隔制御デバイスを介して視聴者と注釈情報との双方向通信に関するレポートを生成する。バックチャンネルを介して放送局に伝送されるこのレポートは、エラーレポートまたはアクションレポート等の遠隔操作に関するレポートを含み得る。このエラーレポートは、「不法」または未定義のアクションを実行する試み等、視聴者に利用可能な選択の範囲を超えた不適切な遠隔操作の使用に関する情報であり、アクションレポートは、視聴者によって行なわれるアクションを含み、タグが付けられて素材のタイムスタンプを示し、このタイムスタンプは、その後、テレビディスプレイ上で表示される。広告主によって供給された素材が利用可能であるとき、視聴者がそのような素材を取得するアクション、および、例えば、視聴者が取得の試みを取消すポイントを認識することといった、視聴者がその素材を取得することを終了するアクション等の、視聴者のアクションに関するレポートを含む。ある実施形態において、バックチャンネルは、蓄積転送チャンネルであり得る。
【0032】
認識および伝送され得る情報は、例えば、単位量、大きさ、色、視聴者のクレジット情報および/または個人識別番号(PIN)ならびに出荷情報を含む、放送において広告が出された品目(例えば、シャツ)の注文を行なうこと等、視聴者が関与することを所望する取引に関する情報をさらに含む。認識および伝送され得る情報は、例えば、サービスの識別、そのサービスの時間および配達の場所、支払い情報等を含む、ペイパービュー方式の放送を見せてほしいというリクエスト等、サービスに対するリクエストに関する情報をさらに含む。認識および伝送され得る情報は、さらに、国営ラジオ放送(National Public Radio)によって提供されるような、政治情報、公共放送情報、および米国特許商標庁の特許および商標データベースのようなデータリポジトリへのアクセスのリクエスト等の非営利的情報に関する情報を含む。
【0033】
バックチャンネルはさらに、潜在的購買者が在庫切れの品目を選択する場合、および代替的選択を行なう可能性、または視聴者が補充されるまで品目を待つ気があるかどうか、およびどれくらい待つ気があるのかに関して一連の通信が続くような双方向通信にも用いられ得る。双方向通信の他の例示的実施例は、現在の価格、特定の商品またはサービスの入手可能性(2000年ワールドシリーズの第3試合等の、スタジアムでの特定のスポーツイベントで利用可能な座席の位置等)、および購買の確認の表示である。
【0034】
視聴者が注釈システムとの双方向通信を開始すると、受信器54はフラグをセットし得る。このフラグは、視聴者が双方向通信を継続する間中、視聴者との双方向通信を行なうことを必要とするデータを保存する。これは、ビデオディスプレイ上に表示され得る番組素材に関係なく、および双方向通信がなされていない場合にデータが視聴者によって廃棄される時に関係なく行われる。1実施形態において、受信器54は、視聴者に情報を提供するデータ構造において現れる各データ(単数または複数)構造の「使用中ビット」をセットする。「使用中ビット」は、受信器54がデータ(単数または複数)構造を廃棄するのを防ぐ。視聴者が双方向通信を終了すると、「使用中ビット」はゼロにリセットされ、データ構造(単数または複数)は、その有効利用期限が切れると廃棄され得る。図5には示されないが、本システムのデータ構造にも、各データ構造の有効タイムスタンプが存在する。プログラムの時間が有効タイムスタンプを一度越えると、システムはこのタイムスタンプによってそのデータ構造を廃棄する。この廃棄プロセスは、ゴミ収集器532によって制御される。
【0035】
注釈システムと双方向通信する経過において、視聴者はカタログを生成し、変更し得る。カタログは、視聴者が購買することを決定し得る品目、および視聴者が取得することを所望する情報の記述を含み得る。視聴者は、1つ以上の放送からカタログに含めるための選択を行ない得る。視聴者は、カタログのコンテンツを変更し得、カタログに品目を付加するとすぐに、または後から商取引を開始し得る。
【0036】
カタログは、視聴者が見ていた番組についての入力情報を含み得る。最高レベルで、遠隔操作等のデバイスを用いることによって、視聴者はシステムと双方向通信し、関心のある品目、かつ量、価格、型、大きさ、色等、関心のある注文の詳細、および早急な発注またはカタログにおける関心のある品目のリストに選択した品目を単に付加すること等の注文の状況を識別する。
【0037】
さらなる詳細なレベルで、視聴者は、番組への入力を選択し得、「保存済」または「発注済」等の入力の状況を含むカタログリストへの個別入力をリビューし得る。入力「保存済」は、品目がリスト上に入力されたが発注されていないことを意味する(すなわち、品目に関するデータはロックされている)。「発注済」は、その名称が示すように、リスト上の品目に関する実際の注文がバックチャンネルを介して行なわれたことを示す。視聴者は、依然として詳細な下位レベルでリストに呼び掛け得、(例えば、製造元、型、説明、価格、発注量、色等)の品目の細目を見る。品目が商品でないが、例えば、あるシーンに登場する俳優に関する伝記的な情報等、視聴者の関心の対象となる情報である場合、下位レベルでの照会によりその情報が表示される。1実施形態において、カタログにわたるナビゲーションは遠隔操作によって実行される。
【0038】
視聴者は、上述のような取引を行なう際に用いるための口座を開設し得る。1実施形態において、視聴者は、自分の名前、配達先、およびクレジットカード番号、またはデビットカード番号等の金融情報等の情報を入力し得る。これは、視聴者が、友人宅またはホテルの部屋の受信器といった、システムにより操作する任意の受信器から発注することを可能にする。別の実施形態において、視聴者は、例えば、放送局によるサービスの供給と関連付けられた契約口座番号等の契約口座番号およびパスワード等の識別子を用い得る。このような状態では、放送局は、視聴者の自宅の住所および他の配達に関する情報ならびに視聴者との取引口座(open financial account)を既に有している。このような例において、視聴者は、パスワードを使用することによって、自分が所望する発注および確認を行なうだけである。さらに別の実施形態において、視聴者は個人用カタログ(personalized catalog)を設け得る。このような状態の例のように、家族構成員には個人用カタログが与えられ得、支出限度まで、および家族の中の経済的責任を負う個人と予め取り決められたルールによって商品およびサービスを注文し得る。
【0039】
視聴者および放送システムの位置に依存して、バックチャンネルを介して伝達された情報のフォーマットは、(米国で用いられるような)QPSK変調、(欧州で用いられるような)DVB変調、または他のフォーマットのうちの1つであり得る。伝送におけるセキュリティの必要性に依存して、バックチャンネルを介して伝送されるメッセージは、任意の暗号法を用いて全体または部分的に暗号化され得る。バックチャンネルを介して通信される情報は、(例えば、一意の識別子またはデジタルサイン等)送り手の認証に関する情報、(例えば、エラー訂正法またはCRCのようなシステム等)通信の統合、取引の否認防止(non−repudiation)に関する情報、サービスの拒否の予防に関するシステムおよび方法、および通信のプライバシー、認証、および法的拘束力のある通信の性質に関する他の類似の情報を含み得る。
【0040】
通信されている情報の種類に依存して、例えば、視聴者の放送素材に対する応答およびペイパービュー素材へのリクエストに関する情報は、放送局に向けられ得る。例えば、シャツの注文等の情報は、広告主に向けられ得る。例えば、第3者によって制御されるデータベースへアクセスするリクエスト等の情報は、第3者に向けられ得る。図5は、注釈データ情報を格納するために本発明において用いられるデータ構造を示す。データ構造は、ビデオフレームにおいて識別されたオブジェクトの位置および/または形状に関する情報および視聴者が識別されたオブジェクトと双方向通信することを可能にする情報を格納する。
【0041】
特に、図5はビデオのフレーム200を示す。このフレームは、第1のオブジェクトとしてシャツ205の画像、第2のオブジェクトとして帽子206の画像、および第3のオブジェクトとして半ズボン205を含む。これらのオブジェクトの形状および/または位置を表すために、オーサリングツール24はマスク210を生成する。このマスクは、2次元ピクセルアレイであり、各ピクセルは、ピクセルの色または強度値に関係なく、関連する整数値を有する。マスクは、オブジェクト(または表示の領域)を輪郭表示または強調表示することに、オブジェクト(または領域)が表示されるための視覚上の効果を変更および強化すること、オブジェクトとの固定的関係でグラフィックを配置すること、またはオブジェクトとの固定的関係で数を配置することで種々の方法を包括して位置情報を表す。この例示的実施形態において、システムは各フレームまたはビデオ画像に対して単一のマスク210を生成する。共通の構成要素および共通のカメラ遠近法(camera perspective)を共有するビデオ画像の収集がショットとして定義される。例示的マスク210において、4つの識別領域が存在する。すなわち、整数0によって識別される背景領域212、整数1によって識別されるシャツ領域213、整数2によって識別される帽子領域214、および整数3によって識別される半ズボン領域215である。当業者は、画像の輪郭の数学的記述等の、表示しているオブジェクトの代替的形態が同様に良好に用いられることを認識する。マスク210は、一意的識別子(UID)216、タイムスタンプ218、および認知の単語(visibility word)219をそのオブジェクトと関連付ける。UID216は、特定のマスクと関連付けられたオブジェクトマッピングテーブル217を参照する。この同期化プロセスは、図6に関して、より詳細に後述される。認知の単語219は、システムによって用いられ、特定のビデオフレームにおいて認知できる、特定のショットにおけるこれらのオブジェクトを識別する。図5には示されないが、システムの他のすべてのデータ構造も、上述のように使用中ビットを含む。
【0042】
図5に示されるデータ構造の例示的セットは、視聴者が以下のものを含む識別されたオブジェクトとの双方向通信を可能にする。すなわち、オブジェクトマッピングテーブル217、オブジェクトプロパティテーブル220、220’、1次ダイアログテーブル230、ダイアログテーブル250、250’、250’’、セレクタ290、290’、290’’、アクション識別子257、257’、257’’、書式シート240、およびストリング235、235’、235’’、235’’’、256、256’、256’’、259、259’、259’’、259’’’、259’’’’、292、292’、292’’、292’’’である。
【0043】
オブジェクトマッピングテーブル217は、マスク210における識別された領域212、213、214、215の各々の領域数、および関心の対象となる各領域の対応するUID216を含む。例えば、オブジェクトマッピングテーブル217において、シャツ領域213は整数値「1」として格納され、UID01234を関連付ける。UID01234は、オプジェクトプロパティテーブル220を示す。オブジェクトマッピングテーブル217においても、帽子領域214は整数値2として格納され、UID10324を関連付ける。UID10324は、オブジェクトプロパティテーブル220’を示す。オブジェクトマッピングテーブルは、整数1で始まる。なぜなら、背景のデフォルト値が0だからである。
【0044】
通常、オブジェクトプロパティテーブルは、特定のオブジェクトに関する情報についての参照を格納し、視聴者のそのオブジェクトとの双方向通信を容易にする。例えば、オブジェクトプロパティテーブル220は、UID5678を有するタイトルフィールド221、UID910112を有する価格フィールド222、およびUID13141516を有する1次ダイアログフィールド223を含む。第2のオブジェクトプロパティテーブル220’は、UID232323を有するタイトルフィールド221’、1次ダイアログフィールド223と同じUID13141516を有する1次ダイアログフィールド223’、およびUID910113を有する価格フィールド222’を含む。タイトルフィールド221のUIDおよびオブジェクトプロパティテーブル220の価格フィールド222は、それぞれストリング235、235’を示す。これらのストリングは、「クルーポロシャツ」という名称のシャツおよびその価格「$14.95」についての情報を含む。オブジェクトプロパティテーブル220’のタイトルフィールド221’は、ストリング235’’を示す。このストリングは、「スポーツキャップ」という名称の帽子についての情報を含む。オブジェクトプロパティテーブル220’の価格フィールドは、ストリング235’’’を示す。当業者は、オーサリングされたビデオの所与のセクションに関して、オーサリングツール24によって識別されたオブジェクトに対応して、多数のオブジェクトプロパティテーブルが存在することを容易に認識する。
【0045】
オブジェクトプロパティテーブル220の1次ダイアログフィールド223のUIDは、1次ダイアログテーブル230を示す。ダイアログテーブル230は、さらに、第2のオブジェクトプロパティテーブル220’の1次ダイアログフィールド223’のUIDによって参照される。当業者は、第2のオブジェクトプロパティテーブル220’がビデオフレーム200を含むプログラム内で識別される別のオブジェクトに対応することを容易に認識する。通常、ダイアログテーブル230は、視聴者と双方向通信するシステムによって用いられるテキストボックスおよびグラフィックボックスを構造化する。ダイアログテーブル230は、モデル表示制御器プログラミングパラダイム(model−view−controller programming paradigm)でのデータモデルとして機能する。視聴者によって見られる表示は、UID13579を有する書式シートテーブル240によって表され、制御器コンポーネントは、デジタル受信器54上のソフトウェアによって供給される。例示的1次ダイアログテーブル230は、視聴者との双方向通信を開始するために用いられる。ダイアログテーブルのさらなる実施例は、特定の品目に関して入手可能な色250または大きさ250’、視聴者が購買したい品目の数を示すためのボックス、購買250’’を確認するためのボックス、および視聴者の購買について視聴者に礼を述べるボックスを含む。当業者は、このリストが網羅的ではないこと、および可能なダイアログテーブルの範囲が広範囲にわたることを認識する。
【0046】
視聴者の画面上に表示される特定のダイアログテーブルの外観と感触は、書式シートによって制御される。書式シートは、モデル表示制御器プログラミングパラダイム、すなわち当業者に公知のソフトウェア開発パラダイムにおいて表示パラメータを制御する。ダイアログテーブル230の書式シートフィールド232は、書式シートテーブル240を示すUID13579を含む。書式シートテーブル240は、フォントフィールド241、形状フィールド242、およびグラフィックフィールド243を含む。動作中、これらのフィールドの各々は、適切なデータ構造リソースを示すUIDを有する。フォントフィールド241は、フォントオブジェクトを指し、形状フィールド242は、異なった書式シートを有し、グラフィックフィールド243は画像オブジェクトを指し、これらは後述される。異なった書式シートを有することによって、本システムは、情報の提示を特定のプログラムに合わせることが容易にできる。例えば、人口統計学的に異なった分類の視聴者に対象を絞った2つの番組で1着のシャツの広告をすることを所望する小売業者は、製品情報を1度入力するだけでよい。これらの番組により支援される視聴者の双方向通信は、異なった書式シートが用いられるが、同じデータを参照する。
【0047】
本実施形態の複数のデータ構造の名称とUIDの対構成は、システムとの適合性の利点を提供する。特に、固定フィールドではなく、名称とUIDの対を用いることによって、データタイプおよびプロトコルは、旧式のデジタル受信器ソフトウェアに影響を与えることなく拡張され得、同じ注釈のテレビ番組を複合的に用いることを可能にする。
【0048】
本発明のシステムの柔軟性は、UIDが包括的に一意に定まるというシステムの要求によって強化される。例示的実施形態において、UIDは、ビットの第1のセットが特定のデータベースライセンスを表し、ビットの第2のセットが特定のデータ構造の構成要素を表す数として定義される。当業者は、これが特定の実施形態であり、UIDが包括的に一意に定まることを保証するための複数の方法が存在することを認識する。
【0049】
UIDの包括的な一意性は、例えば、同じケーブルシステム上で放送する2つの放送網において、それらの放送の番組において識別される品目が区別され得ることが確実であり得るということである。これはさらに、ヘッドエンド受信器50が特定のオブジェクトに関してネットワーク31を介して、データベース30、33からデータを取出すことができることを意味する。なぜなら、オブジェクトはシステムのすべてのコンポーネントにわたって一意に定まる識別子を有するからである。UIDの包括的な性質は、異なったオブジェクトが区別できることをシステムが保証し得ることを意味し、さらに、本発明のシステムのユーザは、品目を区別しないという動作がより効率的である場合、品目を区別しないことを選択し得ることを意味する。例えば、複数の番組で同じシャツを販売する販売業者は、適切なオブジェクトデータを1度だけ入力するだけでよく、さらに、その販売業者はUIDおよび参照されたデータを供給業者とともに用い得る。これにより、さらなるデータの入力オーバーヘッドを取除く。
【0050】
本システムの本実施形態において、UIDの定義された4つのクラスが存在する。すなわち、空UID、リソースUID、非リソースUID、および拡張UIDである。空UIDは、UIDが任意のリソースを指さないことを示すシステムによって用いられ得る。リソースUIDは、9つの別個のタイプのリソースを識別し得る。すなわち、オブジェクトマッピングテーブル、オブジェクトプロパティテーブル、ダイアログテーブル、セレクタ、書式シート、画像、フォント、ストリングおよびベクトルである。セレクタデータ構造およびベクトルリソースは後述される。画像リソース参照グラフィックはシステムによって用いられる。非リソースUIDは、4つの種類の値を含む。すなわち、色値、アクション識別子、整数値およびシンボルである。視聴者によって行なわれるアクションの中で、アクション識別子は、「保存/ブックマーク」、「取消し」、「次の品目」、「前の品目」、「発注」および「終了」を含む。シンボルは、一対の名称UID名称を表し得る。システムは、スタック内で名称をルックアップし、関連するUIDを表す。非リソースUIDは、リテラル値を含む。拡張UIDは、システムがUIDの大きさを増加させるようにするメカニズムを提供する。拡張UIDは、現在のUIDがより長いUIDの接頭語であることをシステムに示す。
【0051】
システムが視聴者からの入力を必要とすると、このシステムはセレクタ290のデータ構造を用いる。セレクタ290のデータ構造は、一対のUIDのテーブルであり、ここで第1のカラムは視聴者に表示されるべき品目のUIDを含み、第2のカラムは各品目と関連付けられたアクションのUIDを含む。デジタル受信器54におけるソフトウェアがセレクタ290のデータ構造に遭遇すると、このソフトウェアは第1のカラムにおいて視聴者の画面上にすべての品目をレンダリングする。通常、選択は視聴者によって行なわれる。これらの品目は、ストリング、画像または非リソースUIDの任意の組合せであり得る。画面上では、視聴者が品目をスクロールアップおよびスクロールダウンすることができる。視聴者が品目の1つを選択した場合、デジタル受信器54におけるソフトウェアはその品目と関連するアクションを実行する。これらのアクションは、ダイアログボックスをレンダリングし、非リソースアクション識別子を実行するか、または別のセレクタ290’のデータ構造をレンダリングすることを含む。セレクタはメニュー1のフィールド253、253’、253’’、253’’’により参照される。
【0052】
動作中、視聴者がオブジェクトを選択し、一連のデータ構造にわたってナビゲートすると、システムは、視聴者に情報を表示するために用いられる各連続データ構造をメモリ128におけるスタック上に配置する。例えば、図5に示されるデータ構造により支援される以下の視聴者双方向通信を考察されたい。最初に、視聴者は、オブジェクトマッピングテーブル217を介してオブジェクトプロパテイテーブル220’にシステムを配置し、オブジェクトプロパティテーブル220’をスタック上に配置させて帽子214を選択する。以下の議論において、視聴者によって参照される各データ構造がスタック上に配置されることが暗に示される。
【0053】
次に、システムは、1次ダイアログテーブルを表示する。このダイアログテーブルは、帽子のタイトル235’’および価格235’’’を含み、ここで、視聴者に提供される情報の様式は書式シート240によって制御される。さらに、視聴者への初期の表示は、セレクタ290に含まれる情報に基づいてレンダリングされる一連の選択を含む。セレクタ290に基づいて、システムは、視聴者にストリング「終了」256、「購買」256’および「保存」256’’によって表される選択を提供し、これらの各々はそれぞれ、UID9999、8888および7777によって表される。アクション識別子の終了257’および保存257は、UID1012および1020それぞれによってシステムに照会される。
【0054】
視聴者が「購買」ストリング256’を選択すると、システムはダイアログテーブル250、UID1011を用い、色のオプションを視聴者に表示する。特に、セレクタ290’は、システムを配向し、視聴者にストリング「赤」292、「青」292’、「緑」292’’および「黄」292’’’、UID1111、2222、3333、4444をそれぞれ表示する。ダイアログテーブル250のタイトルは、システムによって種々のシンボル1 266を通じて配置される。オブジェクトプロパティテーブル220’がスタック上に配置されると、シンボル1 266はUID2001と関連付けられる。従って、システムがシンボル1 266’に遭遇すると、このシステムは、シンボル1 266を配置するまで、スタックにわたってトレースアップし、次に、システムを配向してUID2001を介してストリング「色選択」259を表示する。
【0055】
視聴者が「青」2222ストリング292’を選択すると、システムはUID5555と関連付けられたアクション識別子を実行し、シンボル2、UID2002を通じて配置されたストリング「大きさ選択」259と標識化されたダイアログテーブルを表示する。UID2004によって配置されたセレクタ290’’に基づいて、ワンサイズのみ入手可能であるので、システムはストリング「大」259’’、UID1122をレンダリングする。視聴者が別の色を選択した場合、帽子は大きさでのみ入手可能であるので、この視聴者は同じダイアログテーブル、UID5555に向けられる。視聴者がストリング「大」259’’を選択した後、システムは視聴者にダイアログテーブル250’’、UID6666を提供し、購買を確認する。ダイアログテーブル250’’がセレクタ290’’、UID2003を用い、視聴者にストリング「はい」UID1113および「いいえ」UID1114をそれぞれ提供する。視聴者が「はい」ストリング259’’を選択した後、アクション識別子の発注257’’、UID1013によって向けられ、システムは取引を伝送する。確認依頼に応答して、視聴者が「いいえ」ストリング259’’’を選択した場合、システムはアクション識別子の終了257’を実行することによって、特定の視聴者双方向通信を終了する。終了動作の一部として、システムは、スタックからオブジェクトプロパティテーブル220’を取り除き、次に続くすべてのデータ構造は、視聴者によるシステムとの特定の双方向通信に基づいてスタック上に配置される。同様に、システムによる購買リクエストの実行の後、システムは、データ構造をスタックから取り除く。
【0056】
アクションが1つ以上の工程を必要とする場合、システムは、UIDの順序化UIDのセットであるベクトルリソースを用いる。例えば、視聴者が、自分が見つけた品目の参照を保存することを所望する場合、システムは、2つの動作を実行する必要がある。第1に、システムは、非リソース保存UIDによって示された実際の保存動作を実行しなければならず、第2に、システムは、視聴者に、品目が保存されたことを示すダイアログボックスを提供しなければならない。従って、保存することができるベクトルUIDは、非リソース保存UIDおよびダイアログテーブルUIDを含み、ダイアログテーブルUIDは、適切なテキストを参照するダイアログテーブルを示す。
【0057】
本発明のシステムの特定の利点は、データ構造が操作上効率的および柔軟であるように設計されていることである。例えば、データ構造の分散型の性質は、最小量のデータのみが伝送される必要があることを意味する。例えば、オブジェクトプロパティテーブル220、220’等の複数のデータ構造の構成要素は、例えば、ダイアログテーブル230等の同じデータ構造の構成要素を示し得、このデータ構造の構成要素は、1度伝送されるだけでよい。スタック動作は、データ構造の分散型の性質に呼応する機能を表し、例えば、帽子214はそれ自体のセレクタ290を有しないが、帽子が表示されたときは、セレクタ290は、依然として帽子214のために用いられ得る。データ構造の分散型の性質も、データの個別の要素が他のデータ構造に格納された情報を分散することなく、独立して変更され得るという利点も有する。
【0058】
柔軟性を提供する本発明のシステムの別の局面は、可変データタイプとしてのシンボルをさらに用いることである。スタック上の参照によって供給される値を有することに加えて、シンボルは、初期のオーサリングプロセスの後の特定の時間に供給され得るリソースを参照し得る。例えば、シンボルは、DTV放送基盤12を方向づけ得、放送時間において価格を供給する。これは、例えば、販売業者が特定の伝送ケーブルシステムに依存してオブジェクトに異なった値段をつけることを可能にする。
【0059】
本発明の分散型データ構造によって提供される柔軟性のさらなる局面は、これが複数の視聴者の相互通信の実例をサポートする点である。例えば、対話表およびその連結の順序付けにおける広い変化は、視聴者の相互通信の構造が適応性があり、作成者によって容易に制御されることを意味する。
【0060】
このシステムによってサポートされる視聴者の経験が種々にわたっているという別の例は、複数のビデオストリーム間を切替える能力である。この特徴は、複数のプログラムストリーム(各プログラムストリームはビデオ情報、音声情報およびデータ情報から成り得る)から成るMPEG2のトランスポートストリームの構造を用いる。MPEG2のトランスポートストリーム内で特定の周波数で1回伝達すると、同時に複数のデジタルテレビプログラムが得られ得る。当業者であれば、PMTと呼ばれるプログラムマッピング表をストリーム内の各プログラムに関連付けることによってこれが達成されることを理解する。PMTは、特定のプログラムに対応するストリーム内のパケットのパケット識別子(PID)を識別する。これらのパケットは、各プログラムのビデオパケット、音声パケットおよびデータパケットを含む。
【0061】
図5Aを参照すると、オブジェクトの特性表220’’が示されている。オブジェクトの特性表220’’は、対応するリンクタイプのエントリをUIDフィールド内に有するリンクタイプフィールド270、および対応するPID228を有するstream_num field227を含む。ビデオストリームの切替をイネーブルにするには、オーサリングツール24は特定のプログラムストリームのPMT229のPIDに対応するPID228を選択する。オブジェクトの特性表220’’に対応するオブジェクトが選択されると、デジタル受信機54はリンクタイプフィールド270のビデオリンクエントリ271を用いて、オブジェクトがビデオリンクオブジェクトであるか否かを判定する。次いで、デジタル受信機54は、現在のPMTのPIDをPMT229のPID228と交換する。続いて、デジタル受信機54は、PMT229を用いて新しいプログラムに対応するデータを抽出する。特に、PMT229によって参照されるプログラムは、PID17によって識別されるビデオストリーム260、PID18およびPID19によって識別される2つの音声ストリーム261、262、およびPID20によって識別されるプライベートデータストリーム263を含む。このように、視聴者は、これらのストリームに関連付けられたオブジェクトを選択することによって、異なるプログラムストリーム間で切替ることが可能である。
【0062】
図6は、図2に示すシステムの一実施形態のデータフローおよびフロー制御のフロー図500である。図6は、視聴者がシステムのハードウェアおよびソフトウェアと相互通信する場合に行われる一連の工程を示す。図6において、マスク用のデータのストリーム502はマスク復号器504において復号される。復号されたマスク情報506は、マスク508、508’、508’’などのバッファまたはキュー内に置かれる。マスク情報506と同時に、イベントのストリーム510(割り込みと考えられ得る)は、イベント512、512’、512’’などのイベントキュー内に置かれ、イベント512は1対1の対応でマスク508に対応する。マスク514と呼ばれるスレッドはマスク508上で動作する。マスク514のスレッドは、マスクヘッダを探し出し、1つ以上のバッファを組み立て、そしてキュー内のマスク情報を処理して、マスクオーバーレイを生成する。
【0063】
マスク情報を表示するには、解凍器528と呼ばれるスレッドは、例えば、(640×480)のピクセルの解像度を用いて、ビデオ画面530上で表示するのに適切なサイズ(例えば、(320×240)のピクセルの解像度)で維持されるマスクを復号して拡大する。解凍器528のスレッドは、マスク情報にエンコードされたタイムスタンプを調べ、そして現在のビデオフレームのタイムスタンプとこれを比較することによって、マスクオーバーレイの表示とビデオとの同期を取る。マスクオーバーレイフレームがビデオフレームの前にある場合、解凍器のスレッドはビデオタイムスタンプとマスクタイムスタンプとの間の差を表す計算された時間量の間スリープする。この機構により、マスクがビデオオブジェクトにオーバーレイするように現れるように、マスクはビデオとちょうど同期が取られている状態が保たれる。
【0064】
注釈データの第2のストリーム516は、オブジェクト518と呼ばれる第2のソフトウェアに提供される。オブジェクトデータストリーム516は、オブジェクト518のスレッドによって分析および復号される。オブジェクト518のスレッドは、各オブジェクトを復号し、これをオブジェクトの階層内に組み込む。オブジェクト518のスレッドの出力は、形状およびサイズなどの変化する特徴を有するオブジェクト519のストリームである。
【0065】
モデル520と呼ばれるスレッドは、マスク508およびオブジェクト519を組み合わせて、システムのモデルを形成する。マスク情報は、マスクオーバーレイ内に表される各オブジェクトの一意的なIDを含む。一意的なIDはモデル内に格納されるオブジェクトに対応する。モデル520のスレッドは、これらの一意的なIDを用いて、対応する情報の同期を取るかまたは照合する。
【0066】
モデル520のスレッドは、スタック、ハッシュ表およびキューなどのハウスキーピング構造を含み、これらはすべて、ソフトウェア技術の分野の当業者に周知である。例えば、スタックを用いて、再構成され得る状態の一時的な表示を、メモリまたは呼び出され得るメモリ位置内に保持し得る。ハッシュ表を用いて、特定の種類のデータまたはデータへのポインターを格納し得る。キューを用いて、連続するビット、バイトまたはデータなどを格納し得る。モデル520はビュー526と呼ばれるスレッドと相互通信し、このスレッドは、テレビ画面などの画面530上に表示される情報を制御する。ビュー526のスレッドはモデル520のスレッドに含まれる情報を用いる。モデル520のスレッドは、相互通信コンテンツを有するまたは有さない特定の画像を表示するために必要な情報の追跡を保持する。ビュー526のスレッドはさらに、マスク514のスレッドとも相互通信して、適切な情報が正しい時間に表示画面530に利用可能にされることを保証する。
【0067】
ソフト522と呼ばれるスレッドは、状態524と呼ばれる状態機械の機能を制御する。状態524の詳細を図7を参照してより完全に説明する。状態524はスレッドビュー526と相互通信する。
【0068】
ごみコレクタ532は、古くなったデータおよび他の情報(例えば、すでに経過した時間に対応する、最後に用いたタイムスタンプを有するデータ)を集めて処分するように設けられる。ごみコレクタ532はシステムのメモリを定期的に一掃して、このような不必要なデータおよび情報を排除し、そして新しいデータおよび情報を格納するメモリ空間を回復し得る。このようなごみコレクタソフトウェアはソフトウェア技術分野において公知である。
【0069】
図7は、状態機械の状態524内の状態間の相互通信を示す。状態機械の状態524は、作動されると、状態機械の状態524をリフレッシュされたスタートアップ状態にし、メモリコンテンツおよびスタックポインタなどのすべての調整可能な値をデフォルト値(必要な場合、ROM、SDRAM、磁気記憶装置、CD−ROMまたはメモリのプロテクト領域内に格納され得る)に設定するリセット602を含む。システムがリセットされた後、矢印620が示すように、その状態機械の状態524の状態を相互通信コンテンツアイコン604と呼ばれる状態に移行する。図7を参照されたい。
【0070】
相互通信コンテンツアイコン604は、ロゴに類似した視覚画像が、テレビディスプレイ58の規定された領域内に現れる状態である。視覚画像は「アイコン」と呼ばれる。したがって、アクティブな視覚画像の名が、相互通信コンテンツアイコンである。アイコンは、外観を変更したりまたは視覚効果を変更または強化することができる。相互通信情報が利用可能である場合、視覚効果を用いて、例えば、色を変更し、透明度を変更し、光度を変更し、明滅または点滅させ、または移動するように見せることによって、アイコンが表示される。
【0071】
システムの視聴者は、手持ち式デバイス上のキーを押すことによって情報があることを示す表示に応答し得る。例えば、一実施形態において、右矢印または左矢印(コンピュータキーボード上の矢印または手持ち式TVのリモートデバイスの音量ボタンに類似する矢印)を押すと、状態機械の状態524の状態が相互通信コンテンツアイコン604からマスクの強調表示(MH)606に変更する。相互通信コンテンツアイコン604からMH606への状態の移行は矢印622によって示される。
【0072】
状態MH606において、画像の1つ以上の領域が視聴者に表示されることが可能な素材に対応する場合、例えば、ビデオディスプレイ上に現れる領域の輪郭を描く外周ラインを有させることによって(図1D参照)、またはその領域またはその領域の一部分の外観を変更することによって、1つのこのような領域を強調表示する。一実施形態において、ある男性が着るシャツが強調表示されるオブジェクトである場合、キーを押すことに応答してシャツの輪郭が視覚的にくっきりと現れるか、キーを押すことに応答してシャツの外観が変化する。キーを繰り返し押したり、または他の矢印キーを押すと、テーブル上にあるワインボトルなどの別のオブジェクトが同様の方法で強調表示される。通常、強調表示されることが可能なオブジェクトは、キーを連続的に押すことによって連続的に強調表示される。
【0073】
視聴者が所定の時間期間(例えば、10秒間)どんな行為も行わない場合、状態機械の状態524の状態は、矢印624が示す相互通信コンテンツアイコン604に戻される。あるいは、視聴者が横方向を指す矢印以外のボタン(例えば、リモートコントロール上のナビゲーション矢印の中心に現れることが多い「選択」ボタン)を作動させると、状態は状態MH606から情報ボックス608と呼ばれる状態に進む。情報ボックス608は、情報がポップアップボックス(すなわち、情報ボックス)内に現れる状態である。MH606から情報ボックス608への状態の移行は矢印626によって示される。現れる情報は、情報の広告主または宣伝主によって指定され、そして例えば、強調表示されるオブジェクトのブランド名、モデル、価格、地方のベンダーおよび仕様を含み得る。一実施例として、メンズのシャツの場合、情報は、シャツのブランド名、価格、利用可能なサイズの範囲、利用可能な色の例、1つ以上のベンダーに関する情報、特別販売の提供に関する情報、および注文を行う際に連絡するための電話番号または電子メールアドレスに関する情報などを含み得る。このシステムで起こり得る1つの潜在的な問題は、2つの連続したショットにおいて、同じオブジェクト(すなわち、同じOPTを有する領域)は、現れるが、マスクフレームおよびOMT内で異なる指数を有し得ることである。例えば、2人の人があるビデオ放送のうちで異なる部分を編集して、各自が編集するビデオの部分にビデオ放送が現れる場合、同じオブジェクトに異なる指数を割り当てる場合がある。一つのオブジェクトが異なるショット内で異なる指数によって指定され得る可能性は、ショットが変わった後に、システムが領域上に強調表示を示し続ける(これは、理想的である)場合、問題を提示する。この潜在的な問題を打開するには、システムはオブジェクトのオーバーレイをレンダリングする前に「リバースルックアップ」アルゴリズムを用いる。オブジェクトが視聴者によってまず強調表示されると、このショットのOMTが参照され、強調表示されたオブジェクトのOPTのUIDがメモリ内に格納され、そして強調表示が表示される。各連続したフレームの強調表示をレンダリングする前に、マスクフレームをまずチェックして現在のOMTを探す。次いで、ルックアップが実行され、現在のオブジェクトのOPT UIDを用いてOMTが検索される。OPT UIDが見つかった場合、OMT内のOPT UIDに関連付けられたマスクフレームに対応する参照を有するマスクフレーム内のエリアが強調表示される。このリバースルックアップは、時間切れになるまで、または新しいオブジェクトが選択されるまで続く。
【0074】
視聴者が行い得る多くの応答が可能であり、これらの応答は、通常、矢印628によって示されるように、相互通信コンテンツアイコン604の状態に複数のパスを介して戻り得る。応答は、例えば、視聴者が、記載されたアイテムの購入を行ったり、さらなる情報に関して問い合わせたり、またはこのような購入を撤回することなどによって、視聴者が提供される情報に興味を有することを含み得る。
【0075】
システムが相互通信コンテンツアイコン604の状態にある間、視聴者は、バーストボタンを押して、バースト610と呼ばれる状態が作動され、相互通信コンテンツアイコン604からバースト610に移行する(630)。バースト610の状態において、ビデオディスプレイは、視聴者に提示され得る関連付けられた情報を現在有するオブジェクトすべてを連続して自動的に強調表示する。任意の1つのオブジェクトの強調表示期間は短く、0.03〜5秒のオーダーであり、これにより、視聴者が短い時間内にどのオブジェクトが提示される関連付けられた情報を有し得るかを評価し得る。好適な強調表示期間は0.1〜0.5秒の範囲内である。バースト610の状態はラジオ受信機を走査する走査状態に類似している。ラジオ受信機内で、適切な信号の強度で受信され得る信号は短い時間で連続してチューニングされる。
【0076】
バースト610の状態は、関連付けられた情報を有する種々のオブジェクトが強調表示された後に、相互通信コンテンツアイコン604の状態に自動的に戻る(632)。システムが相互通信コンテンツアイコン604の状態に返った後、上述したように、視聴者は、関連付けられた情報を有する対象のオブジェクトを自由に作動させる。
【0077】
別の実施形態において、バースト610の状態は通信内に埋め込まれた命令によって呼び出され得る。さらに別の実施形態において、バースト610の状態は、定期的に呼び出されて視聴者にアクティブであり得る領域を通知し得、または1セットの可視性ビットを有する領域を含む新しいショットが開始する場合に、バースト610の状態が呼び出され得る。
【0078】
相互通信コンテンツアイコンを用いて、視覚の手がかりを視聴者に提供し得る。一実施形態において、画像の1つ以上の領域と共に視聴者に表示される素材がある場合のみ、相互通信コンテンツアイコンは現れる。
【0079】
一実施形態において、相互通信コンテンツアイコンは、バースト610の状態が呼び出された場合にアクティブである。相互通信コンテンツアイコンは、例えば、強化された視覚効果(これは、外見上は各可視領域が仮定する強化された視覚効果に類似している)で相互通信コンテンツアイコン自体を表示することによって、バースト610の状態が開始しているという信号の形態を取り得る。異なる実施形態において、強化された視覚効果は、色の変化、光度の変化、アイコン自体の変化、あるいはディスプレイ領域の点滅または明滅などであり得る。
【0080】
一実施形態において、領域が増えると相互通信コンテンツアイコンが増やされ、このアイコンを、コンパス上の点のように、またはデジタル受信機のリモートコントロールのキーのように形成し得る。増やされた領域は、同時または連続して、強化された視覚効果を用いて表示される。種々の実施形態の例示の実施例を、図8Aから図8Gまで模式的に示す。図8Aは非アクティブな相互通信コンテンツアイコンを示す。図8Bは、視覚的に強化されたアクティブな相互通信コンテンツアイコンを示す。図8Cは、バースト状態に入る相互通信コンテンツアイコンを示し、バースト状態において、北(N)、東(E)、南(S)および西(W)のコンパス位置を指す4つの矢じりが追加される。例えば、増やされた領域は、手持ち式デバイス上のボタンの形状を思い出させる形態で提示され得る。一実施形態において、北(N)および南(S)の矢じりはビデオの手持ち式リモート上でチャンネルを変更するボタンに対応し得、東(E)および西(W)の矢じりはビデオの手持ち式リモート上で音量を変更するボタンに対応し得、これにより、これらのボタンを押すとバースト状態応答が呼び出されることを視聴者は思い出す。
【0081】
図8Dは、アクティブなバースト状態の相互通信コンテンツアイコンを示し、相互通信コンテンツアイコン自体および北(N)のコンパス位置を指す矢じりが強化された視聴効果と共に表示されている。図8Eは、アクティブなバースト状態の相互通信コンテンツアイコンを示し、相互通信コンテンツアイコン自体および東(E)のコンパス位置を指す矢じりが強化された視聴効果と共に表示されている。図8Fは、アクティブなバースト状態の相互通信コンテンツアイコンを示し、相互通信コンテンツアイコン自体および南(S)のコンパス位置を指す矢じりが強化された視聴効果と共に表示されている。図8Gは、アクティブなバースト状態の相互通信コンテンツアイコンを示し、相互通信コンテンツアイコン自体および西(W)のコンパス位置を指す矢じりが強化された視聴効果と共に表示されている。
【0082】
上述したように、テレビ番組および利用可能にされ得る任意の注釈情報を含む、ビデオディスプレイ58上に現れる情報は、ヘッドエンド50からデジタル受信機54に伝達される。ビデオ画像は通常多くの情報を含む。現代の高解像度のテレビのフォーマットにおいて、一つのビデオフレームは1000本より多いラインを含み得る。各ラインは1000ピクセルより多いピクセルを含み得る。所定のフォーマットで、24ビットの整数が、各ピクセルを表示するのに必要である。このような大量の情報を伝達することは相当な負担である。伝達しなければならないデータ量を減らし得る圧縮方法は、テレビ通信技術において有用な役割を果たす。データファイルの圧縮は通常、コンピュータ技術の分野において周知である。しかし、画像圧縮の分野で特に用いられる新しい形態のファイル圧縮を本発明において用いる。
【0083】
1つの従来の圧縮プロセスは「ランレングス符号化」と呼ばれる。このプロセスにおいて、ビデオラインに連続して現れる各ピクセルまたは同一のピクセルのグループは順番になったペアとして符号化される。このペアは、同一のピクセルがいくつレンダリングされるかを示す第1の数、およびこのような同一のピクセルそれぞれの外観を規定する第2の数を含む。同一のピクセルのランが長い場合、このようなコード化プロセスは伝達される必要があるビットの総数を減らし得る。しかし、病理学の例において、例えば、各ピクセルがその前およびその後のピクセルとは異なり、コード化体系は実際には、ピクセルのシーケンス自体を表すために必要なビット数より多いビットを必要とし得る。
【0084】
一実施形態において、ランレングス符号化を改良したものは、「セクションランレングス符号化」と呼ばれ、これは、2つ以上の連続したラインが、同じ外観または色について同じランレングスのシーケンスを有するものとしてカテゴリー化され得る場合に得られる。2つ以上のラインはビデオ画像のセクションとして処理される。このようなセクションの一実施例は、背景をモノクロにして見られる人物である。トランスミッタは、セクション内のすべてのラインに有効である色のシーケンスを一つ提供し、次いで、それぞれ連続した色を有するラインごとのピクセル数を符号化することによって、このセクションを符号化する。この方法により、色ごとに長ったらしいビットパターンを必要とする冗長な色情報を繰り返し伝達することが防がれる。
【0085】
図9Aは、背景710をモノクロ(例えば、青色の背景)にして示される人物705の画像700を示す。図9Aは、ビデオ画像の圧縮方法のいくつかの実施形態を示す。図9Aにおいて、人物は皮膚の色を有し、これは領域720内に見られる。人物は紫色のシャツ730および緑色のパンツ740を着用している。符号器および復号器がルックアップテーブルを用いて、コード化された数を全(例えば、24ビット)表示値に変換する場合、異なる色または外見が小さい値を有する数として符号化され得る。一実施形態として、背景色を、マスクを目的として、無効な視覚効果または透過的な視覚効果として規定し得、これにより、画像の元の視覚外観が改変することなく表示されることが可能になる。
【0086】
「セクションランレングス符号化」のこの実施形態において、符号器は各行752、754、762、764を走査し、そして各ランの色の値および長さを記録する。ランの数およびビデオフレームの第1の行752の色のシーケンスは、続く行754の色のシーケンスと合致しない場合、第1の行752はレングス1のセクションであるように符号化され、続く行754は次の続く行と比較される。2つ以上の行が同じ色のシーケンスを含む場合、セクションは同じ色のシーケンスを有する複数の行として符号化され、セクションの第1の行の色およびランレングスを表す一連の順序付けられたペアが続く。図9Bに示す3つの行を有する一実施例に関して、第1の行は色およびランレングスのペアの値(n)を含む。残りの2つの行はランレングスのみとして符号化され、セクションの第1の行内で用いられる色は復号器によって用いられて、セクションの後の行を表示するための情報を再生する。一実施形態において、セクションをビデオラインまたは行の全範囲より小さく規定し得る。
【0087】
図9Aを参照して説明する一実施例として、例示の行752および754は、ビデオ走査ラインに対応し、背景710、人物の皮膚720のセグメント、およびさらなる背景710を含む。例示の行752および754は両方、青色のピクセルのラン、皮膚の色のピクセルおよびさらに青色のピクセルを含む。したがって、行752および754、ならびに人物の皮膚の色の頭または首の部分を交差する他の隣接する行は、以下のように符号化される。すなわち、数は、ライン752、754に類似する行が正確には何本セクション(これは、青色の背景の、色−皮膚、色−青色の背景色パターンによって規定されている)内にあるかを示し;第1の行の符号化は、青色の背景色および関連付けられたピクセル計数を示す値、皮膚の色720および関連付けられたピクセル計数を示す値、および青色の背景色および別の関連付けられたピクセル計数を示す値を含む。セクション内の残りの行は、青色の背景色のピクセル計数を表す数として、皮膚の色720にレンダリングされるピクセル計数を表す数として、そして残りの青色の背景色のピクセルを表す数として符号化される。
【0088】
別の実施形態において、符号化される必要がある情報を減らすプロセスは、「Xランレングス符号化」と呼ばれ、これは識別されたオブジェクト内の情報のみを符号化することを含む。この実施形態において、符号化されるピクセルは、規定されたオブジェクト内、またはオブジェクトの輪郭内に現れるピクセルだけである。トランスミッタ内の符号器は順序付けトリプル(ordered triple)としてピクセルを表す。順序付けトリプルは、ラインの開始などの既知のピクセルに対してランの開始位置を規定する、値、ランレングスおよびオフセットを含む。受信機において、復号器は、順序付けトリプルを読み出して、符号化された情報によってピクセルをレンダリングすることによって、符号化された情報を回復する。
【0089】
図9Aを再度参照すると、例示のライン752および754はそれぞれ、順序付けトリプルの数としてXランレングス符号化プロセスで表される。順序付けトリプルの数は、皮膚の色720を示す数、いくつのピクセルが皮膚の色720にレンダリングされるべきかを示す数、および皮膚の色720にレンダリングされたピクセルが位置付けられるべき画像700の一端部712からの距離を示す数である。例示的な一実施例を図9Cに示す。
【0090】
さらに別の実施形態において、セクションランレングス符号化プロセスおよびXランレングス符号化プロセスの特徴を組み合わせた「Xセクションランレングス符号化」と呼ばれるプロセスを用いる。Xセクションランレングス符号化プロセスはコード化パラメータとして色値およびランレングスを用いるが、背景の符号化を無視する。この符号化体系の各エントリは、Xランレングス符号化と同様、順序付けトリプルの色値、ランレングス値およびオフセット値である。
【0091】
例示のライン762および764は、以下に示され得る連続したラインのセクションの一部である。すなわち、例示のライン762、764は順に、青色の背景710bのセグメント、紫色のシャツ730の腕部分、青色の背景710、紫色のシャツ730の主部、青色の背景710、紫色のシャツ730の他方の腕部分、および青色の背景の最後のセグメントである。例示のライン762、764および同じ色のパターンを有する他の隣接したラインは以下のように符号化される。すなわち、セクション内のライン数を規定する整数;第1のラインは色、ランレングスおよびオフセットを示す3つのトリプルの数として符号化され;そしてセクション内の残りのラインはランレングスおよびオフセットを示す3つの順序付けダブル(ordered double)として符号化される。色値はセットのトリプルの数から復号され、そして以後、セクションの残りのラインに用いられる。順序付けダブルまたは順序付けトリプルによって規定されないピクセルは、背景色にレンダリングされる。例示の一実施例を、3つの行を用いて図9Dに示す。
【0092】
さらなる実施形態は、「スーパーランレングス符号化」と呼ばれるプロセスに関する。この実施形態において、ビデオ画像は、CPUによってセクションを含み得る複数の領域に分解される。CPUは上述の圧縮プロセスを種々の領域に適用して、セクションごとに最も効率的な圧縮プロセスの符号化を決定する。次いで、CPUは、各セクションが符号化されるプロセスを示すプリペンディッド(prepended)整数または記号を加えて、最も効率的なプロセスの合成としてセクションごとに画像を符号化する。このスーパーランレングス符号化の例示的な一実施例は、画像700の所定のラインのランレングス符号化、画像700の他のライン(例えば、752、754)のXランレングス符号化、画像700のさらに他のライン(例えば、762、764)のXセクションランレングス符号化などの組み合わせを用いた画像700の符号化である。
【0093】
符号化体系の他の実施形態を用いてもよい。用いられ得る一実施形態は、前のラインからこの1本のラインのピクセルのオフセットを計算すること、例えば、続きのライン(例えば、図9Aに示す人物の首の近位にあるラインなど)に少数のピクセルだけ移行して、背景を表すピクセルを有する移行されたラインのいずれかの端部で任意の規定されていないピクセルを満たすことに関する。このアプローチを、ランレングスおよび行位置情報の両方に適用し得る。この実施形態は、7個以下のピクセルのオフセットを、符号付きの4ビットの値として表して、このように符号化されるラインを規定するために伝達される必要がある情報量を大きく節約し得る利点を提供する。オブジェクトの多くの画像は、ラインからラインへの比較的少なめのオフセットを含み、そしてこのような符号化により、伝達されるデータが著しく減少し得る。
【0094】
別の実施形態は、輪郭の一端部において開始する順序付けペア(ordered pair)として、輪郭の境界内にあるラン値を符号化することを含む。このような符号化体系の他の実施形態は、データ圧縮技術の分野の当業者に明らかである。
【0095】
本発明の目的を実行するために、画像コンテンツを効率的に表すことに加えて、画像コンテンツの分析を実行する能力が有用である。選択した人物、オブジェクトおよび特徴に注釈が割り当てられ得るように、複数のピクセルを含むテレビ画像を分析して、人物、オブジェクトおよび特徴の有無を決定し得る。人物、オブジェクトおよび特徴の動きも分析され得る。1つ以上の人物、オブジェクトおよび/または特徴に対する画像またはフレーム内のピクセルの割り当ては、このような分析が実行される前に実行される。
【0096】
分析は、画像を操作して、ぎざぎざまたはでこぼこの端部を有する画像ではなく、滑らかな画像、すなわち、見る人にとって好ましい画像を生成する際に有用である。分析をさらに用いて、ピクセルの規定された厚さを有する輪郭によって回りに線が描かれた画像領域を規定し得る。さらに、数学的関係を用いて領域を規定する能力により、領域が可視性または不可視性であるかを示す可視性ビットを用いて、そして、領域内のすべてのピクセルを特定の色または視覚効果にレンダリングすることを可能にする技術を用いて、このような領域を視覚的に改変することが可能になる。画像は、所定の内容を規定する領域に対して調べられる。例えば、図9Aにおいて、シャツ領域730、頭領域720およびパンツ領域740が識別されている。
【0097】
一実施形態において、画像またはフレーム内のピクセルはある領域に属していると分類される。分類は、コンピュータのモニターなどの、デジタル表示デバイス上にデジタルの形態で提示されている画像と相互通信し得る閲覧者の観察に基づき得る。一実施形態において、作成者/注釈者は、マウス、または他のコンピュータポインティングデバイス、タッチ画面またはライトペンなどの入力デバイスを用いて画像領域に印付けし得る。別の実施形態において、ソフトウェアと共に、デジタルコンピュータまたはデジタル信号プロセッサなどの演算デバイスによって、領域を規定し得る。いずれかの実施例において、例えば、複数の領域が相互に接している場合、ある領域に属するものとして分類することが困難であるピクセルがあり得る。
【0098】
一実施形態において、分類することが困難であるピクセル、またはその分類があいまいであるピクセルを、いくつかの工程を含むプロセスによって分類し得る。まず、ピクセルの分類を排除または中止する。分類解除したピクセルを、分類解除したピクセルの近位にある複数のピクセル(すなわち、近隣ピクセル)をカバーするように延びる分類形状の起点として用いる。このようにカバーされたピクセルを、その分類に関して調べ、そしてあいまいなピクセルを、近隣ピクセルの中で最も大きい表示を有するクラスに割り当てる。一実施形態において、近隣ピクセルはあいまいなピクセルの、次に近い近隣ピクセルを含む。一実施形態において、表示している関係の場合に、規則を適用して割り当てを行う。一実施形態において、規則は、最も重く表されたクラスに属する画像の左上の角にある最も近い隣接ピクセルのクラスなど、ピクセルに対する特定の位置にピクセルのクラスを割り当てるものであり得る。
【0099】
別の実施形態において、分類することが困難であるピクセル、またはその分類があいまいであるピクセルを、数学的形態学の原理の新しい実現を特徴とするプロセスによって分類し得る。数学的形態学は、数学的観点から画像のピクセルを表し、そして、例えば、デジタルコンピュータまたはデジタル信号プロセッサおよび適切なソフトウェアを用いた、プロパティのアルゴリズム演算および画像の変換を可能にする。数学的形態学の原理を用いて、種々の画像処理アプリケーションを作成し得る。本明細書において、原理のいくつかの非常に簡単な説明を提示する。具体的には、拡張および浸食として公知の方法を記載し、説明する。通常、拡張および浸食を用いて、領域の形状、サイズおよびいくつかの特徴を変更し得る。さらに、数学的形態学の原理を画像処理に適用するいくつかの例示的な例を説明する。
【0100】
拡張および侵食はピクセルのセット上で動作する基本的な数学的動作である。2次元空間の画像の観点からの一例示的な説明として、領域Rの点および2次元形態学的マスクMのセットを考えられたい。バイナリの数学的形態学の観点から提示する例示の説明を、図10Aおよび図10Bに関して与える。図10Aにおいて、形態学的マスクMは、例えば、符号「+」の形状の5ピクセルアレイの形状を有する。異なる形状の形態学的マスクを、得ようと思う効果に依存して選択し得る。領域Rは任意の形状であり得るが、例示を目的として、領域Rを図10Aに図示する不規則な形状にする。
【0101】
形態学的マスクMは図10A内の画像にわたって移動する。この動作の結果は、アレイ内に記録され、図10Bに示すフレームとして視覚的に表され得る。例示の形態学的マスクに関して、符号「+」の垂直線および水平線の交点にあるピクセルを、「テスト」ピクセル、すなわち、適用される動作の結果によって、「点灯される」(例えば、1に設定される)または「消灯される」(例えば、0に設定される)ピクセルとして選択する。
【0102】
バイナリ侵食に関して、セット理論の観点から表される数学的規則は、形態学的マスクMの1つ以上のピクセルと領域Rとの交点が、アレイ内に格納されるピクセルの状態、または図10Aのテストピクセルの位置に対応する図10Bの位置にプロットされるピクセルの状態を規定するものであり得る。この規則は、形態学的マスクを一度に1ピクセル移動させると、すべての指定のピクセル、すなわち、形態学的マスクMのピクセルが領域Rのピクセルと交差する場合、テストピクセルは点灯され、そして図10Bの対応するピクセルは点灯されたままの状態であることを意味する。マスクの走査を、例えば、画像の各行にわたって左から右、一番上の行から開始して下まで移動させて行い得る。数学的形態学の技術分野における当業者によって理解されるように、画像全体(または、少なくとも対象の領域)をカバーする他の走査経路を用い得る。この動作により、領域が滑らかになることが多く、形態学的マスクのサイズおよび形状に依存して、領域の等高線に沿った突起状の投影が取り除かれることが多い。さらに、形態学的マスクのサイズおよび形状に依存して、画像のサイズを縮小し得る。
【0103】
バイナリ拡張は、セット理論の観点から表される数学的規則を有し得る。この数学的規則は、形態学的マスクMと領域Rとの結合が、図10Aのテストピクセルの位置に対応する図10Bの位置にプロットされるピクセルの状態を規定する。形態学的マスクMの所与の位置に関して、RのピクセルおよびMのピクセルを調べて、M内の点灯された任意のピクセルがR内の点灯されたピクセルに対応する場合、テストピクセルが点灯される。この規則はさらに、上述したように、画像にわたって形態学的マスクを、例えば、画像の各行にわたって左から右、そしてここでも、一番上の行から下の行まで走査することによって適用する。この動作は、領域を拡大し、そして小さい穴を埋める傾向を有する場合がある。拡張および侵食の動作は可換的ではなく、これは通常、侵食に次ぐ拡張を適用することを拡張に次ぐ侵食を適用することと比べると、異なる結果が得られることを意味する。
【0104】
ちょうど説明したように、侵食および拡張の動作、ならびにこれらの基本的動作に基づいた他の動作を、2次元画像に見られるような空間内に規定されたピクセルのセットに適用し得る。図11Aおよび図11Bに示す画像の時間シーケンスのピクセルのセットに対しても、同じ動作を等しく適用し得る。図11Aにおいて、時間は第3の次元として見られ得、各画像またはフレームを規定する2次元に対して直交する。図11Aは、N−1、NおよびN+1として示される、3つの画像またはフレームを示し、フレームN−1が最初に表示され、フレームNが次に現れ、そして最後にフレームN+1が現れる。各フレームは、x軸およびy軸を有するものと考えられ得る。例示的な一実施例において、各フレームは、480の水平行×640のピクセル(または480×640の列)を含む。行を上から下に番号付け、そして列を左端から右に進むように番号付けることが普通である。右上の角は行0、列0、すなわち(0、0)である。x軸は、フレームの左側に沿って下へと移動するとx値が増加する行を規定し、y軸は、フレームの上端に沿って右へと移動するとy値が増加する行ごとの列番号を規定する。次いで、時間軸(これに沿って時間が増加する)を、図11Aにおいて左から右へと水平に進むものとして見られる。
【0105】
2次元空間における侵食および拡張の動作は、画像またはフレームの平面内で方向付けられた、5ピクセルの符号「+」などの形態学的マスクを用いた。続く説明に示すように、1次元の符号「+」は時間軸に沿ってあり、他方は空間軸に沿ってあることを認識するならば、2次元の5ピクセルの符号「+」を形態学的マスクとして用いる時間次元における動作が理解され得る。他の実施形態において、時間軸に沿ってのみ1次元の形態学的マスクを用い得、または2つの非共線空間方向において次元を有し、そして時間軸に沿って1つの次元を有する、3次元の形態学的マスクを用い得る。
【0106】
2次元の5ピクセルの符号「+」の形態学的マスクの「テスト」ピクセルを、図11AのフレームNの行r、列c、すなわち位置(r、c)に配置する。符号「+」の垂直線のピクセルは、フレームNの行r−1(行rの上の行)の列c、そしてフレームNの行r+1(行rの下の行)の列cにある。「テスト」ピクセルの「左」のピクセルは、図11AのフレームN−1(フレームNの前のフレーム)の行r、列cにあり、「テスト」ピクセルの「右」のピクセルは、図11AのフレームN+1(フレームNの次のフレーム)の行r、列cにある。したがって、この形態学的マスクを用いた動作は、フレームNに対応するフレームの行r、列cにおいて視覚的に記録された結果を有し、この結果は、対応する位置にあるアレイ内に記録され得る。しかし、この実施例において、演算は、フレームN内にある3つのピクセル、フレームN−1内にある1つのピクセル、およびフレームN+1内にある1つのピクセルに依存する。図11Aは、時間的に連続した画像を表す3つの画像またはフレーム上における5ピクセルの「+」のマスクの使用を模式的に示し、図11Bは、フレームNに対応するフレーム内での演算の結果を示す。
【0107】
この発明のシステムにおいて、侵食および拡張の新しい形態を適用する。この形態において、一度に1つの領域(領域は「1」とラベル付けされ、非領域は「0」とラベル付けされる)上で作用させて、処理する領域が複数ある場合に、このプロセスを複数回繰り返すのではなく、すべての領域を1回で侵食および拡張する。侵食の場合、入力画像がR領域を含む(この領域のピクセルはそれぞれ、1、2、...rとラベル付けされる)場合には、例えば、形態学的マスク内のセットピクセル下にあるすべてのピクセルが3とラベル付けされる場合に限り、テストピクセルは「3」とラベル付けされる。そうでない場合、テストピクセルに0すなわち「分類無し」が割り当てられる。拡張の場合、入力画像がR領域を含む(この領域のピクセルはそれぞれ、1、2、...rとラベル付けされる)場合には、例えば、ピクセルの中で最も大きい番号を有する領域がラベル3を有するピクセルである場合に限り、テストピクセルは「3」とラベル付けされる。そうでない場合、テストピクセルに0すなわち「分類無し」が割り当てられる。
【0108】
2次元フラッドフィル(floodfill)は、2次元表面の特徴を規定の特徴に変更する当該技術分野において周知の技術である。例えば、2次元フラッドフィルを用いて、画像の結合された領域の視覚効果を変更して、例えば、領域のすべてのピクセルを赤色に変更するなどの、規定された方法で変更し得る。3次元フラッドフィルを用いて、ボリュームのすべての素子を規定の特徴に変更し得る。例えば、ボリュームを用いて、シリアル番号が異なるか、または第3の次元としての時間の表示が異なる一連の連続した2次元画像内に現れる領域を表し得る。
【0109】
効率的な新しいアルゴリズムが開発されており、ボリュームの一部である領域を含む画像から開始する関連のある3次元ボリュームにフラッドフィルを実行する。概略すると、本方法は、ボリューム内の2次元表面において素子を選択することを可能にし、この選択した素子を含む領域上に2次元フラッドフィルを実行する。本方法は、第3の次元に沿った方向を選択し、連続的な表面がボリューム内に素子を含むか否かを判定し、そして素子を含む場合には、このような素子を含む領域の2次元フラッドフィルを実行する。本方法は、さらなる素子が見つからなくなるまで繰返し、そしてはじめにフラッドフィルが実行された領域に戻り、そして処理を繰り返しながら、反対の方向で第3の次元に沿って移動する。
【0110】
3次元フラッドフィル演算子を用いたアルゴリズムの画像処理技術が開発されており、作成者は不正確に分類された点グループ内の点を選択する。選択した点を、上述したように、分類方法を用いて再度分類し得る。次いで、選択した点と接触したピクセルのグループ全体を、選択した点の分類に再度分類する。前のフレームおよび次のフレーム内の再度分類したピクセルに隣接するピクセルも再度分類し得る。
【0111】
一実施形態において、再度分類される3次元ボリュームは、像平面を表す2次元、および時間を表す3次元を含む。この実施形態において、図11AのフレームN内のすべてのピクセル(r、c)に関して、これらのピクセルは、フレームN内の2次元フラッドフィル動作に起因して、色Aから色Bに変化している。図11AのフレームN+1内のピクセル(r、c)が現在、色Aを割り当てられている場合、図11AのフレームN+1内のピクセル(r、c)で開始する2次元フラッドフィルが実行され、これにより、フレームN+1内の色Aを割り当てられたすべての接触ピクセルが変化する。図11Aを再度参照すると、フレームNにおけるこのような処理を開始して、時間次元において後退して、フレームN−1に進むことが等しく可能である。一実施形態において、3次元フラッドフィル処理が、フラッドフィル動作の結果、ピクセルが変更を必要とするラベルを有さないフレームにおいて終了する。一実施形態において、時間的にある方向に進む3次元フラッドフィルが終了した後、最初のフレームNで開始し、そしてプロセスが再度終了するまで、時間的に反対の方向に進めることによって、プロセスは続く。
【0112】
図11Cは、本発明の一実施形態による、3次元フラッドフィルが達成される例示的なプロセスを示す流れ図1150である。プロセスは、「開始」とラベル付けされたサークル1152から開始する。工程1154によって示すように、オーサリングツールの演算子などのプロセスを行うエンティティ、あるいは、画像を分析してオブジェクトに対応する1つ以上の領域を画像内から探し出すコンピュータは、3次元フラッドフィルプロセスで満たされるボリュームの境界線を描く複数の連続した2次元セクションを選択する。一実施形態において、3次元ボリュームは第3の次元に対して直交して配置されている2次元のセクションを含み、各2次元セクションは、第1の座標および第2の座標によって識別される位置を含む。例えば、一実施形態において、2次元セクションは画像フレームであり得、第3の次元は、時間、すなわち連続的なフレームを識別するフレーム番号を表し得る。一実施形態において、第1の座標および第2の座標は、ディスプレイ上の画像フレーム内のピクセルの位置を規定する行位置および列位置を表し得る。
【0113】
工程1156において、プロセス演算子は、2次元セクションのうちの少なくとも1つのセクション内で複数の領域を規定し、各領域は少なくとも1つの位置を含む。これ以後のプロセスにおいて、プロセスは、ソフトウェアで符号化され得るような一連の命令を実行し得るコンピュータなどの機械を用いて実行される。コンピュータは、例えば、機械読み出し可能メモリ内で後に用いる定義に対応する情報を記録し得る。例えば、画像内において、演算子は、背景、およびシャツ2などの対象のオブジェクトを規定し得る。
【0114】
工程1158において、コンピュータは2次元セクションのうちの1つのセクション内で第1の領域を選択し、この領域はボリューム内に含まれており、このボリュームは選択された記号で満たされている。一実施形態において、記号は、色、強調表示または光度の変化などの、ディスプレイ上にレンダリングされた場合の視覚効果であり得るか、あるいは英数字の文字またはディスプレイ上でレンダリングされ得る記号などであり得る。
【0115】
工程1160において、ディスプレイを実行するコンピュータは、第1の領域を選択された記号で満たす。2次元の領域を記号で満たすには、ディスプレイ画面の規定された領域を規定された色にするなど、多くの異なる周知のグラフィックルーチンがある。任意のこのような周知の2次元グラフィックルーチンを実現して、2次元のフィリング(filling)工程を実行し得る。
【0116】
工程1162において、コンピュータは、第3の次元に沿って第1の方向で連続的な2次元セクションに移動する。一実施形態において、プロセス演算子は、第1の画像が選択される直前または直後に画像を移動させ、これにより、時間、すなわち画像シーケンスの方向が規定される。
【0117】
工程1164において、前の2次元セクションの2次元セクション内の満たされた位置に対応する連続的な2次元セクション内の位置がボリュームに属するか否かを判定する。プロセス演算子は、工程1156において達成された2次元領域の定義に記録された情報を探索する。
【0118】
工程1166において、コンピュータは工程1164で実行された判定結果に基づいて選択を行う。判定する工程1164の結果が肯定である場合、工程1168に示すように、コンピュータは、連続的な2次元セクション内に位置を含む領域を選択された記号で満たす。工程1170に示すように、コンピュータは、連続的な2次元セクション内の新しく満たされた領域から開始して、判定する工程が否定的な結果を出すまで、移動する工程1162、判定する工程1164、および満たす工程1168(すなわち、直前に挙げた工程)を繰り返す。
【0119】
上述の任意の判定する工程1164の結果が否定的であると、コンピュータは、工程1158で識別された第1の領域(これは、すでに満たされている)に戻って、第1の方向とは反対の方向で第3の次元に沿って移動し、上述したように、判定する工程の結果が否定的になるまで、移動する工程(例えば、工程1162に類似するが、反対の方向に進む工程)、判定する工程(例えば、工程1164などの工程)および満たす工程(例えば、工程1168などの工程)を繰り返す。このシーケンスは工程1172において、概略する形態で示されている。工程1174において、プロセスは、判定する工程の結果が否定的になると終了する。
【0120】
別の用途は、領域の輪郭を生成することを含む。これにより、例えば、領域のエンティティ内を強調表示したり、または領域の輪郭に関連付けられた視覚効果、または2つの効果の所定の組み合わせを変更することによって、領域を強調表示することが可能になる。一実施形態において、ラベル付けされた領域から輪郭を構築する方法を、図12A〜図12Bに示すように実現する。入力画像1218内に輪郭1215を有するように輪郭が描かれた領域1210を図12Aに示す。奇数のピクセルを有する正方形の形態学的マスク1220は、そのサイズが所望の輪郭の厚さに比例し、そして領域1210上を通過する。入力領域1210内のあらゆる位置において、形態学的マスク内に入るピクセルは、それらがすべて同じであるか否かがチェックされる。同じである場合、図12Bの出力画像1230内のテストピクセルに「0」が割り当てられる。ピクセルが形態学的マスク内の他のいずれのピクセルとも同じではない場合、形態学的マスクの中央ピクセル下に入るラベルが出力画像1230内のテストピクセルに割り当てられる。形態学的マスク1220が領域1210上を通過すると、結果得られる輪郭1215’が出力画像1230に生成される。他の実施形態において、偶数のピクセルを有する正方形の形態学的マスク、正方形以外の形状を有する形態学的マスク、および奇数のピクセルを有する正方形の形態学的マスクを用いて、出力画像1230内のテストピクセル1222に対応するピクセルのように、形態学的マスク内の特定のピクセルを選択し得る。
【0121】
当業者が、数学的形態学の原理を用いる際に、別の形態学的マスクおよび別の規則を用いて、上述の用途の実施例を解釈し得、そしてこのような原理に基づいた他の多くの同様の用途を理解することが理解される。
【0122】
一連の関連した画像において、または公園のベンチに座っている人物を示す画像のシーケンスなど、上述した1ショットにおいて、1つ以上の選択されたオブジェクトが複数のフレームにおいて続き得る。他の状況、例えば、公園のベンチに座っている人物が知覚した視野に場面が変わる場合など、画像が突然変わる状況において、第1の場面またはショットで識別されたいくつかまたはすべての領域は、第2の場面またはショットにはない場合がある。本発明のシステムおよび方法は、場面が変わった(例えば、新しいショットが開始する)こと、および第1の場面にある1つ以上の領域が第2の場面にないことの両方を判定し得る。
【0123】
一実施形態において、システムおよび方法は、ある画像から次の画像に変わったピクセルのヒストグラムを計算し、そして次のインスタンス(すなわち、時間展開)によるヒストグラムの傾斜を所定の傾斜値と比較することによって、場面またはショットが変わったことを判定する。図13は、連続的なフレームにわたって(すなわち、経時的)ヒストグラムの展開の3つの例示的な実施例を示す。1番上の曲線1310は、0からの傾斜の変異が小さく、これは適度な速度の動きを表す。真中の曲線1320は、傾斜の変異がやや大きく、これは突然の動きを表す。1番下の曲線1330は、傾斜の変異が大きく、これはフレームFにおけるショットの変化または場面の変化を表す。ヒストグラム評価プロットの傾斜が、1番下の曲線1330のように、所定の値を越えた場合、システムはショットの変化が生じたと判定する。
【0124】
このシステムの好適な実施形態をデジタル放送テレビの観点から説明してきた。このシステムの別の実施形態を同様に、レガシーのアナログ放送のテレビシステムに組み込むことも可能であることが理解されるべきである。用語「メタデータ」は、本明細書において用いる際、マスク、オブジェクト、注釈情報、データ構造、タイムスタンプまたは他のタイミング情報、および元の改変されていないテレビ放送信号と共に用いられるさらなる情報およびデータをほぼすべて含むことが理解される。アナログの実施形態において、字幕システムによって実行されるように、「垂直帰線消去期間」(VBI)内にメタデータを挿入すること、および第2の通信チャンネル(例えば、サブキャリア信号;電磁放送スペクトル内の別のチャンネル周波数;またはインターネットなどのコンピュータネットワークへの接続(但し、これに限定されない))を介してメタデータを送信することの1つ以上によって、メタデータをアナログ放送信号に関連付け得る。この実施形態において、ビデオソース、モジュレータ、チューナーおよび受信機は、アナログ信号をサポートし、メタデータはデジタルであり得る。本明細書に記載するように、アナログ受信機は、VBIからのメタデータを蓄積し得、メモリ内にメタデータを配置し得、そしてこれを処理し得る。
【0125】
本発明を特定の好適な実施形態を参照しながら、特に図示および説明してきたが、当業者であれば、上掲の特許請求の範囲に規定される本発明の意図および範囲から逸脱せずに、本明細書における形態および詳細を種々に変更し得ることを理解するべきである。

【特許請求の範囲】
【請求項1】
ハイパーリンクによってリンクされた注釈データ受信システムであって、
複数のマスクデータパケット及び複数のオブジェクトデータパケットとともに符号化された放送信号を受信する受信機において、
各前記マスクデータパケットは、ビデオプログラムの特定のビデオフレームに対応し、前記特定のビデオフレーム内のビデオオブジェクトと関連付けられたグラフィックデータを含み、
前記マスクデータパケットは、前記複数のオブジェクトデータパケットの一つに含まれたオブジェクトマッピングテーブルへの識別子を含み、
前記オブジェクトマッピングテーブルは、ビデオフレーム内の複数のビデオオブジェクトの各々に関連付けられたエントリを含み、
オブジェクトマッピングテーブル内の各エントリは、前記複数のオブジェクトデータパケットの一つ又は複数内に含まれた情報データ構造を参照し、
前記情報データ構造は、対応するビデオオブジェクトに関する情報を含む、前記受信機と、
前記放送信号から前記マスクデータパケット及び前記オブジェクトデータパケットを抽出するビデオ復号器と、
表示装置と、
抽出された前記マスクデータパケット及びオブジェクトデータパケットを格納するメモリと、
前記メモリと通信する中央処理ユニットとを有し、
前記メモリは、
前記複数のビデオオブジェクトの各々が前記特定のビデオフレーム内で見えるのかを判断し、
前記特定のビデオフレーム内で見えると判断された各ビデオオブジェクトに、対応するグラフィックイメージを重ね、
重ねられたグラフィックイメージの一つと関連付けられたユーザの選択を受信し、
前記ユーザの選択へ応答し、前記特定のビデオフレームに対応する前記マスクデータパケットから前記オブジェクトマッピングテーブルの識別子を読み出し、
前記読み出された識別子に基づいて、オブジェクトマッピングテーブルを読み出し、
前記ユーザの選択に関連付けられたビデオオブジェクトに関するエントリを前記オブジェクトマッピングテーブル内で検索し、
前記検索されたエントリ内で参照された情報データ構造を識別し、
前記情報データ構造内の情報を読み出し、
前記表示装置内に前記読み出された情報を表示する、コンピュータプログラムを格納することを特徴とするシステム。
【請求項2】
各前記マスクデータパケットは、前記表示装置上の領域を定める請求項1に記載のシステム。
【請求項3】
各前記マスクデータパケットは、マスクタイムスタンプを有する請求項2に記載のシステム。
【請求項4】
前記マスクタイムスタンプは、前記コンピュータプログラムがグラフィックイメージを対応するビデオフレームと同期して表示するために使われる、請求項3に記載のシステム。
【請求項5】
各前記オブジェクトデータパケットは、オブジェクトタイムスタンプを有する請求項1に記載のシステム。
【請求項6】
前記オブジェクトタイムスタンプは、前記コンピュータプログラムが所定の時間経過後対応するオブジェクトデータパケットを消すために使う期間満了タイムスタンプを含む請求項5に記載のシステム。
【請求項7】
特定の情報データ構造は、注釈データ領域と注釈データセットを参照する第2識別子とを有する請求項1に記載のシステム。
【請求項8】
前記注釈データ領域はタイトルデータ領域であり、前記第2識別子は特定のビデオオブジェクトのタイトルを含むストリングを参照する請求項7に記載のシステム。
【請求項9】
前記注釈データ領域はメニュー領域であり、前記第2識別子は表示識別子セットとそれに対応するアクション識別子セットを含むセレクタを参照する請求項7に記載のシステム。
【請求項10】
前記ハイパーリンクによってリンクされた注釈データ受信システムにおいて各識別子は、一義的である請求項7に記載のシステム。
【請求項11】
前記第2識別子は、変数である請求項7に記載のシステム。
【請求項12】
前記複数のビデオオブジェクトの各々が前記特定のビデオフレーム内で見えるのかの判断は、前記マスクデータパケットとともに含まれた可視性マークに基づく請求項1に記載のシステム。
【請求項13】
前記放送信号は、デジタル信号である請求項1に記載のシステム。
【請求項14】
前記放送信号は、アナログ信号である請求項1に記載のシステム。
【請求項15】
ハイパーリンクによってリンクされた注釈データを含む放送情報を利用する方法であって、
放送情報を受信し、復号し、格納し、操作するように適応された受信機を使う段階において、前記受信機は中央処ユニットと少なくとも1つのメモリ装置を有する前記受信機を使う段階と、
前記受信機によって、複数のマスクデータパケット及び複数のオブジェクトデータパケットとともに符号化された放送信号を受信する段階において、
各前記マスクデータパケットは、ビデオプログラムの特定のビデオフレームに対応し、前記特定のビデオフレーム内のビデオオブジェクトと関連付けられたグラフィックデータを含み、
前記マスクデータパケットは、前記複数のオブジェクトデータパケットの一つに含まれたオブジェクトマッピングテーブルへの識別子を含み、
前記オブジェクトマッピングテーブルは、ビデオフレーム内の複数のビデオオブジェクトの各々に関連付けられたエントリを含み、
オブジェクトマッピングテーブル内の各エントリは、前記複数のオブジェクトデータパケットの一つ又は複数内に含まれた情報データ構造を参照し、
前記情報データ構造は、対応するビデオオブジェクトに関する情報を含む、前記受信する段階と、
前記受信機によって、前記放送信号から前記マスクデータパケット及び前記オブジェクトデータパケットを復号する段階と、
前記復号されたマスクデータパケット及びオブジェクトデータパケットを前記少なくとも1つのメモリ装置に格納する段階と、
前記複数のビデオオブジェクトの各々が前記特定のビデオフレーム内で見えるのかを判断する段階と、
前記特定のビデオフレーム内で見えると判断された各ビデオオブジェクトに、対応するグラフィックイメージを重ねる段階と、
重ねられたグラフィックイメージの一つと関連付けられたユーザの選択を受信する段階と、
前記ユーザの選択へ応答し、前記特定のビデオフレームに対応する前記マスクデータパケットから前記オブジェクトマッピングテーブルの識別子を読み出す段階と、
前記読み出された識別子に基づいて、オブジェクトマッピングテーブルを読み出す段階と、
前記ユーザの選択に関連付けられたビデオオブジェクトに関するエントリを前記オブジェクトマッピングテーブル内で検索する段階と、
前記検索されたエントリ内で参照された情報データ構造を識別する段階と、
前記情報データ構造内の情報を読み出す段階と、
前記表示装置内に前記読み出された情報を表示する段階とを有する方法。
【請求項16】
前記復号する段階は、第1データキュー上のオペレーションを実行する第1アクティブスレッドによって実行され、前記比較する段階は、前記第1データキュー上のオペレーションを実行する第2アクティブスレッドによって実行される請求項15に記載の方法。
【請求項17】
前記第1アクティブスレッドは、マスクデータの作用を変更することが可能であり、前記第2アクティブスレッドは、オブジェクトデータの作用を変更することが可能である請求項16に記載の方法。
【請求項18】
各マスクは、マスクタイムスタンプを含み、
前記方法は、
前記マスクタイムスタンプを表示されるビデオフレームのタイムスタンプと比較する段階と、
表示されるビデオフレームのタイムスタンプと前記マスクタイムスタンプとの関係に基づいて、前記マスクを表示する段階とを有し、
前記比較する段階は、最も早いマスクタイムスタンプと最新に表示されたビデオフレームのタイムスタンプとの比較することによって比較を開始する請求項16に記載の方法。
【請求項19】
前記マスクタイムスタンプがまだ表示されていないフレームに該当する場合、前記方法は、さらに、
前記関連付けられたグラフィックイメージを符号化し、イメージバッファへ格納する段階と、
前記符号化されたグラフィックイメージがすぐ表示できるのかを判断するために前記マスクタイムスタンプをチェックする段階と、
前記符号化されたグラフィックイメージがすぐ表示できる場合は、前記符号化されたグラフィックイメージを表示する段階と、
前記符号化されたグラフィックイメージが後で表示できる場合は、前記符号化されたグラフィックイメージが表示できるまでの時間の間にスリープし、表示できる時間になるとすぐ前記符号化されたグラフィックイメージを表示する段階とを有する請求項18に記載の方法。
【請求項20】
ハイパーリンクによってリンクされた注釈データ放送システムであって、
複数のビデオフレームを含むビデオプログラムを提供するビデオソースと、
前記ビデオソースと通信するビデオ符号器であって、前記ビデオ符号器は複数のマスクデータパケット及び複数のオブジェクトデータパケットを符号化し放送信号を生成し、
各前記マスクデータパケットは、ビデオプログラムの特定のビデオフレームに対応し、前記特定のビデオフレーム内のビデオオブジェクトと関連付けられたグラフィックデータを含み、
前記マスクデータパケットは、前記複数のオブジェクトデータパケットの一つに含まれたオブジェクトマッピングテーブルへの識別子を含み、
前記オブジェクトマッピングテーブルは、ビデオフレーム内の複数のビデオオブジェクトの各々に関連付けられたエントリを含み、
オブジェクトマッピングテーブル内の各エントリは、前記複数のオブジェクトデータパケットの一つ又は複数内に含まれた情報データ構造を参照し、
前記情報データ構造は、対応するビデオオブジェクトに関する情報を含む、前記ビデオ符号器と、
前記放送信号から前記マスクデータパケット及び前記オブジェクトデータパケットを抽出するビデオ復号器と、
前記放送信号を受信機へ伝送する手段とを備え、
前記受信機は、
前記複数のビデオオブジェクトの各々が前記特定のビデオフレーム内で見えるのかを判断し、
前記特定のビデオフレーム内で見えると判断された各ビデオオブジェクトに、対応するグラフィックイメージを重ね、
重ねられたグラフィックイメージの一つと関連付けられたユーザの選択を受信し、
前記ユーザの選択へ応答し、前記特定のビデオフレームに対応する前記マスクデータパケットから前記オブジェクトマッピングテーブルの識別子を読み出し、
前記読み出された識別子に基づいて、オブジェクトマッピングテーブルを読み出し、
前記ユーザの選択に関連付けられたビデオオブジェクトに関するエントリを前記オブジェクトマッピングテーブル内で検索し、
前記検索されたエントリ内で参照された情報データ構造を識別し、
前記情報データ構造内の情報を読み出し、
前記表示装置内に前記読み出された情報を表示するように構成される、放送システム。

【図1A】
image rotate

【図1B】
image rotate

【図1C】
image rotate

【図1D】
image rotate

【図2】
image rotate

【図2A】
image rotate

【図2B】
image rotate

【図2C】
image rotate

【図2D】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図5A】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8A】
image rotate

【図8B】
image rotate

【図8C】
image rotate

【図8D】
image rotate

【図8E】
image rotate

【図8F】
image rotate

【図8G】
image rotate

【図9A】
image rotate

【図9B】
image rotate

【図9C】
image rotate

【図9D】
image rotate

【図10A】
image rotate

【図10B】
image rotate

【図11A】
image rotate

【図11B】
image rotate

【図11C】
image rotate

【図12A】
image rotate

【図12B】
image rotate

【図13】
image rotate


【公開番号】特開2012−70400(P2012−70400A)
【公開日】平成24年4月5日(2012.4.5)
【国際特許分類】
【出願番号】特願2011−235951(P2011−235951)
【出願日】平成23年10月27日(2011.10.27)
【分割の表示】特願2001−563521(P2001−563521)の分割
【原出願日】平成13年2月28日(2001.2.28)
【出願人】(500279472)ウォッチポイント メディア, インコーポレイテッド (1)
【Fターム(参考)】