ビデオテレフォニーに関する関心領域処理
【課題】ビデオテレフォニーに関する関心領域処理
【解決手段】
本開示は、ビデオテレフォニー(VT)用途に関する関心領域(ROI)処理技術に関するものである。前記開示された技術により、受信者デバイスは、送信者デバイスによって送信された映像情報、すなわちファーエンド映像情報、に関するROI情報を定義する。前記受信者デバイスは、前記ROI情報を前記送信者デバイスに送信する。前記受信者デバイスによって送信された前記ROI情報を用いて、前記送信者デバイスは、映像シーン内のROIに優先的符号化を適用する。この方法により、前記受信者デバイスは、前記送信者デバイスによるファーエンド映像情報のROI符号化を遠隔制御することができる。
【解決手段】
本開示は、ビデオテレフォニー(VT)用途に関する関心領域(ROI)処理技術に関するものである。前記開示された技術により、受信者デバイスは、送信者デバイスによって送信された映像情報、すなわちファーエンド映像情報、に関するROI情報を定義する。前記受信者デバイスは、前記ROI情報を前記送信者デバイスに送信する。前記受信者デバイスによって送信された前記ROI情報を用いて、前記送信者デバイスは、映像シーン内のROIに優先的符号化を適用する。この方法により、前記受信者デバイスは、前記送信者デバイスによるファーエンド映像情報のROI符号化を遠隔制御することができる。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、米国仮特許出願番号60/660,200(出願日:2005年3月9日)、及び"REGION-OF-INTEREST EXTRACTION FOR VIDEO TELEPHONY"(ビデオテレフォニーに関する関心領域抽出)という題名を有する係属中の米国特許出願番号11/182,432(出願日:2005年7月15日)の利益を主張するものである。
【0002】
本開示は、デジタル映像の符号化及び復号に関するものである。本発明は、より具体的には、ビデオテレフォニー(VT)用途に関する関心領域(ROI)の処理技術に関するものである。
【背景技術】
【0003】
デジタル映像シーケンスを符号化するための幾つかの異なる映像符号化基準が確立されている。例えば、ムービング・ピクチャー・エキスパーツ・グループ(MPEG)は、MPEG−1、MPEG−2及びMPEG−4を含む幾つかの基準を策定している。その他の例は、国際電気通信連合(ITU)H.263基準、新規のITU H.264基準を含む。これらの映像符号化基準は、一般的は、データを圧縮して符号化することによって映像シーケンスの向上された送信効率をサポートする。
【0004】
ビデオテレフォニー(VT)は、テレビ会議等の用途をサポートするためにユーザーが映像及び音声情報を共有することを可能にする。典型的ビデオテレフォニー基準は、セッション開始プロトコル(SIP)、ITU H.323基準、及びITU H.324基準によって定義されるビデオテレフォニー基準を含む。VTシステムにおいては、ユーザーは、映像情報を送受信する、映像情報を受信するだけである、又は映像情報を送信するだけである。受信者は、一般的には、送信者から送信された形の受信映像情報を観る。
【0005】
映像情報の選択された部分の優先的符号化が提案されている。例えば、送信者は、受信者に送信するためにより高い品質で符号化すべき関心領域(ROI)を指定することができる。送信者は、遠隔の受信者に対してROIを強調するのを望むことができる。ROIの典型例は人間の顔であるが、送信者は、映像シーン内のその他のオブジェクトに注意を集中するのを望むことができる。ROIを優先的に符号化することにより、受信者は、非ROI領域よりも鮮明にROIを観ることができる。
【発明の開示】
【課題を解決するための手段】
【0006】
本開示は、ビデオテレフォニー(VT)に関する関心領域(ROI)処理技術に関するものである。開示された技術により、ローカル受信者デバイスは、遠隔送信者デバイスによって符号化及び送信された映像、すなわちファーエンド映像、に関するROI情報を定義する。前記ローカル受信者デバイスは、前記ROI情報を前記遠隔送信者デバイスに送信する。前記送信者デバイスは、前記受信者デバイスによって送信された前記ROI情報を用いて、映像シーン内のROIに対して優先的符号化、例えばより高質な符号化又はエラー保護、を適用する。この方法により、受信者デバイスは、送信者デバイスによって符号化されたファーエンド映像のROI符号化を遠隔で制御することができる。
【0007】
受信者は、ファーエンド映像を受信することに加えて、映像、すなわちニアエンド映像を送信するために装備することもできる。従って、VT通信に参加するデバイスは、映像情報の送信者及び受信者の両方として対称的に行動することができる。各デバイスは、受信者として行動し、送信者としての遠隔デバイスによって符号化された映像に関するファーエンドROI情報を定義することができる。さらに、各デバイスは、送信者として行動し、受信者としての他方のデバイスに送信される映像情報に関するニアエンドROI情報を定義することができる。送信者デバイス又は受信者デバイスは、ROI映像符号化の遠隔制御をサポートするために他のデバイスによって提供されるROI情報を処理することができるという意味で「ROI認識」と呼ぶことができる。
【0008】
ファーエンドROI情報は、受信者が受信された映像シーン内のオブジェクト又は領域をより鮮明に観るために送信者デバイスによる遠隔ROI符号化を制御することを可能にする。ニアエンドROI情報は、送信者が送信された映像シーン内のオブジェクト又は領域を強調するためにローカルROI符号化を制御することを可能にする。従って、送信者によるROIの優先的符号化は、受信者又は送信者によって生成されたROI情報に基づくことができる。さらに、受信者デバイスは、エラー隠蔽技術、デブロッキング技術又はデリンギング技術、等のより高質の後処理を適用することによって、ROI情報に基づいてROIを優先的に復号することができる。
【0009】
本開示は、ROI処理を容易にするために、ROIの選択、ROIマッピング、ROI抽出、ROIシグナリング、ROI追跡、及び送信者デバイスによるROI符号化の遠隔制御を可能にするための受信者デバイスのアクセス認証に関する技術をさらに企図している。ROIの選択は、予め定義されたROIパターン、口頭又はテキストによるROI記述(description)、又はユーザーによるROI描写に依存することができる。ROIマッピングは、選択されたROIパターンをROIマップに変換することを含み、前記ROIマップは、映像符号器によって用いるのに適したマクロブロック(MB)マップの形態をとることができる。
【0010】
ROIシグナリングは、受信者デバイスから送信者デバイスへのROI情報のインバンド又はアウトオブバウンドシグナリングを含むことができる。ROI追跡は、ROIの動きに応じたROIマップの動的調整を含む。アクセス認証は、ROIの遠隔制御を目的として、及びローカルユーザーと遠隔ユーザーとの間における又は複数の遠隔ユーザー間におけるROI制御の対立の解決策として、アクセス権及びアクセスレベルを受信者デバイスに与えることを含むことができる。
【0011】
ROI抽出は、ユーザーによる関心領域(ROI)の記述を処理して前記記述に基づいて前記ROIを指定する情報を生成することを含む。ニアエンド映像は、前記ROIを指定する前記情報に基づいて符号化することで前記ニアエンド映像の非ROIエリアに対する前記ROIの画質を向上させることができる。前記ユーザーによる記述は、テキスト、図形、又は音声に基づくことができる。抽出モジュールは、前記ROI情報を前記ユーザーによる記述から生成するための適切な処理を適用する。前記抽出モジュールは、映像通信デバイスとともにローカルで常駐すること、又はROI抽出用に構成された個別の中間サーバー内に常駐することができる。
【0012】
一実施形態においては、本開示は、ローカルデバイスによって符号化されて遠隔デバイスによって受信されたニアエンド映像内における関心領域(ROI)を指定する情報を前記遠隔デバイスから受信することと、前記ROIに基づいて前記ニアエンド映像を符号化して前記映像の非ROIエリアに対する前記ROIの画質を向上させること、とを具備する方法を提供する。
【0013】
他の実施形態においては、本開示は、遠隔映像通信デバイスに送信されたニアエンド映像内における関心領域(ROI)を指定する情報を前記遠隔映像通信デバイスから受信する関心領域(ROI)エンジンと、前記ニアエンド映像を符号化して前記映像の非ROIエリアに対する前記ROIの画質を向上させる映像符号器と、を具備する映像符号化デバイスを提供する。
【0014】
追加の実施形態においては、本開示は、遠隔デバイスによって送信されてローカルデバイスによって受信されたファーエンド映像内における関心領域(ROI)を指定する情報を生成することと、前記ROIに基づいて前記ファーエンド映像を符号化して前記映像の非ROIエリアに対する前記ROIの画質を向上させる際に使用するために前記情報を前記遠隔デバイスに送信すること、とを具備する方法を提供する。
【0015】
さらなる実施形態においては、本開示は、遠隔デバイスから受信されたファーエンド映像内における関心領域(ROI)を指定する情報を生成する関心領域(ROI)エンジンと、前記ファーエンド映像を前記ROIに基づいて符号化して前記ファーエンド映像の非ROIエリアに対する前記ROIの画質を向上させる際に前記遠隔デバイスによって用いるために前記ROIを指定する情報を前記符号化されたニアエンド映像とともに送信する映像符号器と、を具備する映像符号化デバイスを提供する。
【0016】
他の実施形態においては、本開示は、ローカルデバイスによって生成されたニアエンド映像内における関心領域(ROI)の記述をユーザーから受信することと、前記記述に基づいて前記ROIを指定する情報を生成することと、前記ROIを指定する前記情報に基づいて前記ニアエンド映像を符号化して前記ニアエンド映像の非ROIエリアに対する前記ROIの画質を向上させること、とを具備する方法を提供する。
【0017】
追加の実施形態においては、本開示は、映像符号化デバイスであって、前記デバイスによって符号化されたニアエンド映像内における関心領域(ROI)の記述を受信し、前記記述に基づいて前記ROIを指定する情報を生成する関心領域(ROI)エンジンと、前記ニアエンド映像を符号化して前記映像の非ROIエリアに対する前記ROIの画質を向上させる映像符号器と、を具備する映像符号化デバイス、を提供する。
【0018】
さらなる実施形態においては、本開示は、ニアエンド映像を符号化する第1の映像通信デバイスと、前記第1の映像通信デバイスから前記ニアエンド映像を受信する第2の映像通信デバイスであって、前記第1の映像通信デバイスによって生成された前記ニアエンド映像内における関心領域(ROI)に関するユーザーの記述を生成する第2の映像通信デバイスと、前記第1及び第2の映像通信デバイスと構造的に別個であり、前記記述に基づいて前記ROIを指定する情報を生成する中間サーバーと、を具備し、前記第1の映像通信デバイスは、前記ROIを指定する前記情報に基づいて前記ニアエンド映像を符号化して前記ニアエンド映像の非ROIエリアに対する前記ROIの画質を向上させる、映像符号化システムを提供する。
【0019】
本明細書において説明される技術は、ハードウェア内、ソフトウェア内、ファームウェア内、又はその組合せ内において実装することができる。ソフトウェア内に実装された場合は、前記技術は、実行されたときに本明細書において説明される方法のうちの1つ以上を実行する命令を含むプログラムコードを具備するコンピュータ読み取り可能媒体によって一部を実現させることができる。
【0020】
1つ以上の実施形態の詳細が、添付図面及び以下の説明において示されている。該説明及び図面から、及び請求項からその他の特長、目的、及び利点が明確になるであろう。
【発明を実施するための最良の形態】
【0021】
図1は、ROI認識映像符号器−復号器(CODEC)を組み入れた映像符号化及び復号システム10を示すブロック図である。図1に示されるように、システム10は、第1の映像通信デバイス12と、第2の映像通信デバイス14と、を含む。通信デバイス12、14は、送信チャネル16によって接続される。送信チャネル16は、有線又は無線の媒体であることができる。システム10は、ビデオテレフォニーに関する映像通信デバイス12、14の間における双方向映像送信をサポートする。デバイス12、14は、実質的に対称的に動作することができる。しかしながら、幾つかの実施形態においては、一方又は両方の映像通信デバイス12、14は、ROI認識映像ストリーミングをサポートするために1方向通信のみに関して構成することができる。
【0022】
双方向性の用途に関しては、相互符号化、復号、多重化(MUX)及び逆多重化(DEMUX)コンポーネントをチャネル16の反対側の端部に備えることができる。図1の例においては、映像通信デバイス12は、MUX/DEMUXコンポーネント18と、ROI認識映像CODEC20と、音声CODEC22と、を含む。同様に、映像通信デバイス14は、MUX/DEMUXコンポーネント26と、ROI認識映像CODEC28と、音声CODEC30と、を含む。各CODEC20、28は、他の映像通信デバイス12、14から遠隔で、又は自己の映像通信デバイスからローカルで提供されるROI情報を処理することができるという意味で「ROI認識」である。
【0023】
映像通信デバイス12、14は、映像ストリーミング、ビデオテレフォニー、又は両方のために備えられた無線移動端末又は有線端末として実装することができる。この目的のために、映像通信デバイス12、14は、無線通信をサポートするための適切な送信機、受信機、モデム、及び処理用電子装置をさらに含むことができる。無線移動端末の例は、無線通信能力及び映像符号化及び/又は復号能力を備えた移動無線電話、モバイルパーソナルデジタルアシスタント(PDA)、モバイルコンピュータ、又はその他のモバイルデバイスを含む。有線端末の例は、デスクトップコンピュータ、ビデオ電話、ネットワーク機器、セットトップボックス、双方向型テレビ、等、を含む。どちらの映像通信デバイス12、14も、映像情報を送信するように、映像情報を受信するように、又は映像情報を送受信するように構成することができる。
ビデオテレフォニー用途に関しては、一般的には、デバイス12が映像送信能力及び映像受信能力の両方をサポートするのが望ましい。しかしながら、ストリーミング映像用途も企図されている。ビデオテレフォニー、特に無線通信によるモバイルビデオテレフォニーにおいては、帯域幅が重要な懸念事項である。従って、追加の符号化ビットをROIに選択的に割り当てること、又はその他の優先的符号化ステップは、全体的な符号化効率を維持しながら映像の一部分の画質を向上させることができる。優先的符号化に関しては、追加のビットをROIに割り当てることができ、その一方で減らされた数のビットを非ROI領域、例えば映像シーン内の背景、に割り当てることができる。
【0024】
一般的には、システム10は、ビデオテレフォニー(VT)用途に関する関心領域(ROI)を処理するための技術を採用する。しかしながら、前記技術は、上述されるように、映像ストリーミング用途に対しても応用可能である。例示することを目的として、各映像通信デバイス12、14は、映像情報の送信者及び受信者の両方として動作し、それによってVTセッションへの完全な参加者として動作することができると仮定される。映像通信デバイス12から映像通信デバイス14に送信される映像情報に関しては、映像通信デバイス12が送信者デバイスであり、映像通信デバイス14が受信者デバイスである。逆に、映像通信デバイス14から映像通信デバイス12に送信される映像情報に関しては、映像通信デバイス12が受信者デバイスであり、映像通信デバイス14が送信者デバイスである。ローカル映像通信デバイス12、14によって符号化及び送信される映像情報について論じるときには、前記映像情報は、「ニアエンド」映像と呼ばれる。遠隔映像通信デバイス12、14によって符号化される及び遠隔映像通信デバイス12、14から受信される映像情報について論じるときには、前記映像情報は、「ファーエンド」映像と呼ばれる。
【0025】
開示される技術により、映像通信デバイス12又は14は、受信者デバイスとして動作時には、送信者デバイスから受信されるファーエンド映像情報に関するROI情報を定義する。繰り返しになるが、送信者デバイスから受信される映像情報は、通信チャネルの遠端部に位置する他方の(送信者)デバイスから受信されるという意味で「ファーエンド」映像情報と呼ばれる。同様に、送信者デバイスから受信される映像情報に関して定義されたROI情報は、「ファーエンド」ROI情報と呼ばれる。ファーエンドROIは、一般的には、ファーエンド映像の受信者にとっても最も関心のあるファーエンド映像内の領域を指す。受信者デバイスは、ファーエンド映像情報を復号し、復号されたファーエンド映像を表示デバイスを介してユーザーに提示する。ユーザーは、ファーエンド映像によって提示された映像シーン内のROIを選択する。
【0026】
受信者デバイスは、ユーザーによって選択されたROIに基づいてファーエンドROI情報を生成し、該ファーエンドROI情報を送信者デバイスに送信する。ファーエンドROI情報は、ROI内に常駐するROIマクロブロック(MB)に基づいてROIを定義するROIマクロブロック(MB)マップの形態をとることができる。ROI MBマップは、ROIに含まれているMB(1)及びROIから除外されているMB(0)を簡単に識別するために、ROI内のMBに1のフラグを付け、ROI外のMBに0のフラグを付けることができる。MBは、フレームの一部を形成する映像ブロックである。MBの大きさは、16×16画素であることができる。しかしながら、その他のMBの大きさも可能である。従って、MBは、限定することなしに、MPEG−1、MPEG−2及びMPEG−4、ITU H.263、ITU H.264、又はその他の基準、等の特定の映像符号化基準内において定義されるマクロブロックを含むあらゆる映像ブロックを指すことができる。
【0027】
送信者デバイスは、受信者デバイスによって送信されたファーエンドROI情報を用いることによって、映像シーン内の対応するROIに対して優先的符号化を適用する。特に、ROIに対して追加の符号化ビットを割り当てて減らされた数のビットを非ROI領域に割り当て、それによってROIの画質を向上させることができる。この方法により、受信者デバイスは、送信者デバイスによるファーエンド映像情報のROI符号化を遠隔制御することができる。優先的符号化は、例えばROIエリア内における優先的ビット割当て又は優先的量子化によって、映像シーンの非ROIエリアに対してよりも高い品質の符号化をROIエリアに対して適用する。優先的に符号化されたROIは、受信者デバイスのユーザーがオブジェクト又は領域をより鮮明に観るのを可能にする。例えば、受信者デバイスのユーザーは、顔又はその他の何らかのオブジェクトを映像シーンの背景領域よりも鮮明に観るのを希望することができる。
【0028】
映像通信デバイス12又は14は、送信者デバイスとして動作時には、送信者デバイスによって送信される映像情報に関するROI情報を定義することもできる。繰り返しになるが、送信者デバイスにおいて生成される映像情報は、通信チャネルの近端部において生成されるという意味で「ニアエンド」映像と呼ばれる。送信者デバイスによって生成されたROI情報は、「ニアエンド」ROI情報と呼ばれる。ニアエンドROIは、一般的には、送信者が受信者に対して強調することを希望するニアエンド映像の領域を指す。従って、ROIは、受信者デバイスユーザーの場合はファーエンドROI情報として、送信者デバイスユーザーの場合はニアエンドROI情報として指定することができる。送信者デバイスは、表示デバイスを通じてユーザーにニアエンド映像を提示する。送信者デバイスと関連するユーザーは、ニアエンド映像によって提示された映像シーン内のROIを選択する。送信者デバイスは、ニアエンド映像内のROIが例えば非ROIエリアよりも高い品質の符号化を用いて優先的に符号化されるようにするために、ユーザーによって選択されたROIを用いてニアエンド映像を符号化する。
【0029】
送信者デバイスにおいてローカルユーザーによって選択されたニアエンドROIは、送信者デバイスのユーザーが映像シーン内の領域又はオブジェクトを強調し、それによって前記領域又はオブジェクトに受信者デバイスユーザーの注意を向けさせることを可能にする。顕著なことに、送信者デバイスユーザーによって選択されたニアエンドROIは、受信者デバイスに送信する必要がない。その代わりに、送信者デバイスは、ニアエンド映像が受信者デバイスに送信される前に、選択されたニアエンドROI情報を用いてニアエンド映像をローカルで符号化する。しかしながら、幾つかの実施形態においては、送信者デバイスは、優先的復号技術、例えばエラー隠蔽等のより高い品質のエラー補正又はデブロッキング及びデリンギングフィルタ等の後処理、の適用を可能にするためにROI情報を受信者デバイスに送信することができる。
【0030】
ROI情報が送信者デバイス及び受信者デバイスの両方によって提供される場合は、送信者デバイスは、ニアエンド映像を符号化するために、受信者デバイスからの受信されたファーエンドROI情報又はローカルで生成されたニアエンドROI情報を適用する。送信者デバイス及び受信者デバイスによって提供されたニアエンドROIの選択とファーエンドROIの選択との間においてROIの対立が生じることがある。該対立は、本開示の別の箇所において説明されるように、解決、例えば、ローカルユーザーによる能動的解決又は指定されたアクセス権及びアクセスレベルに従った解決、等を要求する。いずれの場合においても、送信者デバイスは、送信者デバイスによってローカルで又は受信者デバイスによって遠隔で提供されたニアエンドROI情報に基づいて優先的にROIを符号化する。
【0031】
本開示は、ROI処理を容易にするために、ROI選択、ROIマッピング、ROIシグナリング、ROI追跡、及び送信者デバイスによるROI符号化の遠隔制御を許可するための受信者デバイスのアクセス認証に関する技術をさらに企図している。説明されるように、受信者デバイス又は送信者デバイスによって適用される異なるROI選択技術は、予め定義されたROIパターンの選択、口頭又はテキストによるROIの記述、又はユーザーによるROI描画を含むことができる。受信者デバイスにおいては、ROIマッピングは、選択されたファーエンド又はニアエンドROIパターンをROIマップに変換することを含むことができ、前記ROIマップは、マクロブロック(MB)マップの形態をとることができる。ROIシグナリングは、受信者デバイスから送信者デバイスへのファーエンドROI情報のインバンド又はアウトオブバンドのシグナリングを含むことができる。ROI追跡は、ROIの動きに応じて、受信者デバイスによって生成されたファーエンドROIマップ、又は送信者自体によって生成されたローカルニアエンドROIの動的調整を含む。アクセス認証は、遠隔のファーエンドROI制御を目的として、及び受信者デバイスと送信者デバイスとの間におけるROIの制御の対立の解決策として、アクセス権及びアクセスレベルを受信者デバイスに与えることを含むことができる。
【0032】
システム10は、セッション開始プロトコル(SIP)、ITU H.323基準、ITU H.324基準、又はその他の基準に従ったビデオテレフォニーをサポートすることができる。各映像CODEC20、28は、MPEG−2、MPEG−4、ITU H.263、又はITU H.264、等の映像圧縮基準に従って符号化された映像データを生成する。図1においてさらに示されるように、映像CODEC20、28は、各々の音声CODEC22、30と統合することができ、データストリームの音声部分と映像部分を取り扱うための該当するMUX/DEMUXコンポーネント18、26を含む。MUX−DEMUX装置18、26は、ITU H.223マルチプレクサプロトコル、又はその他のプロトコル、例えばユーザーデータグラムプロトコル(UDP)、に準拠することができる。
【0033】
図2は、無線通信デバイス38と関連するディスプレイ36上に提示された映像シーン34内におけるROI32の定義を示す図である。図2の例においては、ROI32は、映像シーン34において提示された人の顔39を含む長方形の領域であるが、該ROIは、改良された又は向上された符号化が希望される画像又はオブジェクトを含むことが可能である。VT用途においては、映像シーン34において提示される人は、典型的には、受信者デバイスとして動作している無線通信デバイス38のユーザーとのテレビ会議の当事者である遠隔送信者デバイスのユーザーになる。ROI32は、遠隔送信者デバイスから送信された映像シーン内におけるROIを定義するという点でファーエンドROIを構成する。本開示により、ファーエンドROI32は、ROI内における映像シーンのエリアの優先的符号化を指定するために送信者デバイスに送信される。この方法により、受信者デバイス38のローカルユーザーは、ファーエンドROI32の画質を遠隔で制御することができる。後述されるように、ファーエンドROI32の大きさ、形状及び位置は、固定又は調整可能であり、様々な方法で定義、記述又は調整することができる。
【0034】
ROI32は、受信者デバイスユーザーが映像シーン34内の人の顔39、等の個々のオブジェクトをより鮮明に観ることを可能にする。ROI32内の顔39は、映像シーン34の背景領域、等の非ROIエリアよりも高い画質で符号化される。この方法により、ユーザーは、顔の表情、唇の動き、目の動き、等をより鮮明に観ることができる。しかしながら、ROI32は、代替として、顔以外のオブジェクトを指定するために用いることができる。概して、VT用途におけるROIは非常に主観的であることが可能であり、ユーザーごとに異なる可能性がある。希望されるROIも、VTがどのように用いられるかに依存する。幾つかの事例においては、VTは、テレビ会議とは対照的に、オブジェクトを観るため及び評価するために用いることができる。
【0035】
例えば、夫は、ギフトショップ又は空港で購入したい贈り物を見せるためにVT用途を用いることができる。夫は、タイムリーな形で及び対話形式で自分の妻からセカンドオピニオンを得るのを希望することができる。このようにすることで、夫は、飛行機がまさに出発しようとしているときに直ちに決定をすることができる。この場合は、ROIは、夫が検討中である贈り物を網羅する領域である。妻(又は夫)がROIを選択するのを可能にすることによって、特定のROIに関してより良い符号化又はより良い品質のサービスを達成させ、それによって妻が贈り物をより鮮明に観ることを可能にすることができる。
【0036】
他の例として、2人以上の技師が、黒板上での様々な方程式又は線図のプレゼンテーション及び解説が関わるVT呼を行うことができる。この場合は、遠隔ユーザーは、例えば方程式の詳細をより鮮明に見るために黒板の一部分をより高い画質で観るのを望むことができる。その目的のため、遠隔ユーザーは、方程式を包含するROIを選択する。さらに、技師が黒板に追記するのに応じて、遠隔ユーザーは、黒板に新たに追記された主題を追跡するためにROIを移動させるのを望むことができる。遠隔ユーザーがROIを指定できることは、技術的な討論における情報交換を大幅に向上させることができる。
【0037】
本明細書において説明されるROI技術は、ROIの映像の品質を向上させるだけでなく、2人のユーザー間における映像での対話も向上させることができる。一般的には、従来のVT用途は、単に2つの1方向の映像送信を結合させるだけであり、対話は声で行われる。従来のVT用途においては、典型的には、映像側での対話は存在しない。受信者デバイスがTV呼中に送信者デバイスから受信される映像コンテンツに対する少なくとも制限された制御を有するのを可能にすることは、増大した映像対話を可能にする。
【0038】
この方法により、VT用途は、受信者デバイスユーザーがROIを選択し、例えばより多くの符号化ビットの割当て、より強力なエラー保護、例えばMB内リフレッシュメント、によってROIの優先的な処理、例えばより高質の符号化、を行うために送信者デバイスにROI情報を送り返すことができるように設計することが可能である。実際上は、ファーエンドROIを指定することによって、受信者デバイスユーザーは、送信者デバイス符号器を遠隔制御することができる。さらに、このファーエンドROI情報は、より良い後処理、例えばエラー隠蔽、デブロッキング又はデリンギングのためにファーエンド映像を受信するデバイス内のROI認識映像復号器によって用いることができる。符号化された映像の受信者による映像符号器の遠隔制御は、遠隔カメラのパン、チルト、ズーム又は焦点を単に制御するのとは異なる。対照的に、遠隔ROI処理のおかげで、ユーザーは、特定の1つの領域又は複数の領域に適用される符号化の質に影響を与えることができる。しかしながら、幾つかの実施形態においては、遠隔カメラ制御は、遠隔映像符号器制御と組み合わせて提供することができる。
【0039】
図3は、ROI認識CODECを組み入れた映像通信デバイス12を示したブロック図である。図3は、図1の映像通信デバイス12を描いているが、映像通信デバイス14は、同様に構築することができる。繰り返しになるが、映像通信デバイス12又は14は、受信者デバイス、送信者デバイス、及び好ましいことに受信者デバイスと送信者デバイスの両方として機能することができる。図3に示されるように、映像通信デバイス12は、ROI認識CODEC20と、映像キャプチャデバイス40と、ユーザーインタフェース42と、を含む。図13ではチャネル16が示されているが、例示を容易にするためにMUX−DEMUX及び音声コンポーネントは省略されている。映像キャプチャデバイス40は、映像通信デバイス12と統合した又は動作可能な形で結合されたビデオカメラであることができる。例えば、幾つかの実施形態においては、映像キャプチャデバイス40は、携帯電話と統合していわゆるビデオカメラフォンを構成することができる。この方法により、映像キャプチャデバイス40は、モバイルTV用途をサポートすることができる。
【0040】
ユーザーインタフェース42は、映像通信デバイス12と統合または動作可能な形で結合させることができる表示デバイス、例えば、液晶ディスプレイ(LCD)、プラズマ画面、プロジェクタディスプレイ、又はその他の表示装置、を含むことができる。表示デバイスは、映像通信デバイス12のユーザーに映像画像を提示する。映像画像は、映像キャプチャデバイス40によってローカルで得られたニアエンド映像、及び送信者デバイスから遠隔送信されたファーエンド映像を含む。さらに、ユーザーインタフェース42は、映像通信デバイス12のユーザーによる情報入力のためのハードキー、ソフトキー、様々なポインティング装置、スタイラス、等を含む様々なユーザー入力媒体のうちのいずれかを含むことができる。幾つかの実施形態においては、表示デバイス及びユーザーインタフェース42のユーザー入力媒体は、携帯電話と一体化することができる。映像通信デバイス12のユーザーは、ファーエンド映像、及びオプションとしてのニアエンド映像を観るためにユーザーインタフェース42に依存する。さらに、ユーザーは、ファーエンドROI、及びオプションとしてのニアエンドROIの定義又は選択に関する情報を入力するためにユーザーインタフェース42に依存する。
【0041】
図3においてさらに示されるように、ROI認識CODEC20は、ROIエンジン44と、ROI認識映像符号器46と、ROI認識映像復号器48と、を含む。ROI認識映像符号器46は、遠隔の受信者デバイスに送信するために映像キャプチャデバイス40から得られたニアエンド映像(「ニアエンド映像」)を符号化する。繰り返しになるが、「ニアエンド」という表現は、映像通信デバイス14等の遠隔映像通信デバイスから受信された「ファーエンド」映像とは対照的に、映像通信デバイス12内においてローカルで生成される映像を指定する。図3の例において、ROI認識映像符号器46は、ニアエンドROIを優先的に符号化するために遠隔受信機(「遠隔ニアエンドROI」)から得られたニアエンドROI情報を使用する。遠隔受信機は、遠隔映像通信デバイス14と関連するユーザーである。
【0042】
遠隔ユーザーの観点からは、遠隔ニアエンドROIは、遠隔ニアエンドROIは、遠隔デバイス14によって送信されるときには遠隔ファーエンドROIであり、受信されるときにはデバイス12のローカルユーザーの観点からは遠隔ニアエンドROIと呼ばれる。すなわち、送信者又は受信者としてのデバイス12、14の観点は、映像及びROIがニアエンド映像又はファーエンド映像のいずれに適用可能であるとみなされるかを決定する。繰り返しになるが、遠隔デバイス14における映像符号化を遠隔制御するローカルデバイス12のユーザーは、ファーエンドROIを指定する。しかしながら、遠隔デバイス14のユーザーは、ファーエンドROIを受信するが、ローカルデバイス14によって符号化されているニアエンド映像に関係するため遠隔ニアエンドROIとみなされる。一般的には、本開示において用いられるラベルの目的上、観点が重要である。
【0043】
オプションとして、ROI認識映像符号器46は、映像通信デバイス14のローカルユーザーから得られたニアエンドROI情報(「ローカルニアエンドROI」)を用いることができる。ローカルニアエンドROIは、符号化されたニアエンド映像の送信者によって生成されるため送信者駆動ROIと呼ばれることもある。ローカルニアエンドROI情報は、ローカル符号器46によって用いられ、典型的には、遠隔デバイス14内の映像復号器が送信者デバイス12のユーザーによって指定されたニアエンドROIに対して優先的復号を適用するように設計されていないかぎり、他方の映像通信デバイス14に送信されない。遠隔ニアエンドROIは、符号化されたニアエンド映像の遠隔受信者によって生成されるため、受信者駆動ROIと呼ぶこともできる。遠隔ニアエンドROIは、映像通信デバイス12によって生成された映像の受信者がROI認識符号器46によるROI符号化を制御することを許可し、ローカルニアエンドROIは、映像通信デバイス12によって生成された映像の送信者がROI認識符号器46によるROI符号化を制御することを許可する。幾つかの場合においては、後述されるように、遠隔及びローカルROIの定義が対立して対立の解決が要求されることがある。
【0044】
ローカル及び遠隔ニアエンドROI情報は、ニアエンドROIマクロブロック(MB)マップ(「ニアエンドROI MBマップ」)としてROI認識符号器46に提供することができる。ニアエンドROI MBマップは、受信者ニアエンドROI又は送信者ニアエンドROIのどちらかに常駐する特定のMBを識別する。ROI認識符号器46は、例えば遠隔映像通信デバイス14において遠隔ユーザーによって観られたときのROIの画質を向上させるために、ニアエンド映像内のROIをより高い品質の符号化、より強力なエラー保護、又はその両方によって優先的に処理する。ROIに関するより良いエラー保護は、無線テレフォニー用途においては特に望ましい。結果的に得られる符号化されたニアエンド映像(「符号化されたニアエンド映像」)は、遠隔デバイス14に送信される。
【0045】
説明されるように、ROI認識映像符号器46は、遠隔映像通信デバイス14から受信されたファーエンド映像に関して映像通信デバイス12のローカルユーザーによって生成されているファーエンドROI情報(「ファーエンドROI」)も送信する。ファーエンドROIは、遠隔映像通信デバイス14によって符号化された映像に関する受信者駆動ROIとして機能する。実際上、映像通信デバイス12によって送信されたファーエンドROI情報は、ROI認識復号器48によって受信された遠隔ニアエンドROIがROI認識映像符号器46を制御するために映像通信デバイス12によって用いられるのとまったく同じように、遠隔映像通信デバイス14によって生成されたファーエンド映像の符号器の少なくとも部分的な制御を許可する。この方法により、各映像通信デバイス12、14は、他方のデバイスによって生成されたファーエンド映像におけるROI符号化に影響を与えることができる。
【0046】
映像通信デバイス12によって送信されたファーエンドROI情報は、インバンド又はアウトオブバンドシグナリング情報として送信することができる。インバンドシグナリングの場合は、ファーエンドROI情報は、遠隔映像通信デバイス14に送信される符号化されたニアエンド映像ビットストリーム内に埋め込むことができる。例えば、MPEG4ビットストリームフォーマットにおいては、ビットストリームを記述する情報を埋め込むために用いることができる“ユーザー_データ”と呼ばれるフィールドが存在する。“ユーザー_データ”フィールド、又はその他のビットストリームフォーマットにおける同様のフィールドは、ビットストリームコンプライアンスに違反せずにファーエンドROI情報を埋め込むために用いることができる。代替として、ROI情報は、暗号法等のいわゆるデータ隠蔽技術によって映像ビットストリーム内に埋め込むことができる。
【0047】
ROI認識映像復号器48は、ユーザー_データフィールド又は遠隔デバイスから着信したファーエンド映像内のその他の場所においてROI情報を求めるように構成される。アウトオブバンドシグナリングの場合は、ITU H.245又はSIP、等のシグナリングプロトコルを用いてファーエンドROI情報を伝達することができる。いずれの場合においても、ファーエンドROI情報は、ROI MBマップ又はファーエンドROIの位置及び/又は大きさを定義する物理的座標の形態をとることができる。復号器48がファーエンド映像ビットストリームをいったん受信した時点で、復号器48は、遠隔送信者デバイスと同意されたフォーマットに基づいてROI情報を検索し、遠隔ニアエンドROIを映像符号器56に提供する前にニアエンドROI制御に関するアクセス許可を得るためにROI情報をアクセス認証モジュール58に渡す。
【0048】
ファーエンド映像内においてROIを優先的に符号化するために遠隔映像符号器を制御することに加えて、ファーエンドROI情報は、ファーエンド映像のROI内におけるMBを優先的に復号するためにローカル映像復号器に適用することができる。例えば、図3においてさらに示されるように、遠隔符号器に送信するためにROIマッパー54によって生成される同じファーエンドROI MBを、ROI認識映像復号器48に提供することが可能である。ROI認識映像復号器48は、遠隔映像通信デバイス14から受信されたファーエンド映像内のMBを優先的に復号するためにROI MBマップを使用する。例えば、ROI認識映像復号器48は、非ROI MBに対するよりも優れた後処理をROI MBに対して適用することができる。追加で、又は代替で、ROI認識映像復号器48は、非ROI MBに対するよりも強固なエラー隠蔽技術をROI MBに対して適用することができる。この方法により、ROI認識映像復号器48は、ローカルユーザーによって生成されたファーエンドROI情報に依存して、向上された画質を得るために着信ファーエンド映像のROI部分を優先的に復号する。
【0049】
ROI認識映像復号器48は、遠隔映像通信デバイス、例えば図1の映像通信デバイス14からの着信ファーエンド映像を受信する。ROI認識映像復号器48は、ファーエンド映像を復号し、復号された映像を表示デバイス上においてローカルユーザーに提示するためにユーザーインタフェース42に提供する。さらに、上述されるように、ROI認識映像復号器48は、遠隔ニアエンドROI情報(「遠隔ニアエンドROI」)を遠隔映像通信デバイス14から受信する。ROI認識映像復号器48によって受信されるニアエンドROI情報は、映像通信デバイス12によって送信された映像内においてROIを指定するために遠隔映像通信デバイス14のユーザーによって生成される。上述されるように、ROI認識映像復号器48によって受信された遠隔ニアエンドROI情報は、映像通信デバイス12によって生成されたニアエンド映像内のROIを優先的に符号化するようにROI認識映像符号器46を遠隔制御するために用いられる。遠隔ニアエンドROIは、上述されるように、インバンド又はアウトオブバンドシグナリング技術によって送信される。
【0050】
図3をさらに参照し、ROI認識映像符号器46及びROI認識映像復号器48は、ROIエンジン44と相互に作用する。ROIエンジン44は、映像キャプチャデバイス40からのニアエンド映像ビットストリームの符号化及び送信のためにローカル及び遠隔ニアエンドROI情報を処理する。さらに、ROIエンジン44は、符号化及び遠隔映像通信デバイス14への送信のためにユーザーインタフェース42を介して提供されたファーエンドROI情報を処理する。ROIエンジン44は、ROIコントローラ52と、ROIマッパー54と、ROI追跡モジュール56と、認証モジュール58と、を含む。幾つかの実施形態においては、ROI追跡モジュール56及び認証モジュール58は、オプションであることができる。
【0051】
ROI認識映像符号器46、ROI認識映像復号器48、ROIコントローラ52、ROIマッパー54、ROI追跡モジュール56及び認証モジュール58は、個別の機能モジュールとして又は各モジュールに属する機能を包含するモノリシックモジュールとして、様々な方法で形成することができる。いずれの場合においても、ROIエンジン44、映像符号器46及び映像復号器48を含むROI認識CODEC20の様々なコンポーネントは、ハードウェア、ソフトウェア、ファームウェア、又はその組合せ内において実現させることができる。例えば、該コンポーネントは、1つ以上のマイクロプロセッサ又はデジタル信号プロセッサ(DSP)、1つ以上の特定用途向け集積回路(ASIC)、1つ以上のフィールドプログラマブルゲートアレイ(FPGA)、又はその他の同等の集積回路又は個別論理回路において実行するソフトウェアプロセスとして動作することができる。ソフトウェア内に実装する場合は、これらの技術は、部分的には、プロセッサ又はDSPにおいて実行された時に上述される方法のうちの1つ以上を実施する命令を含むプログラムコードを具備するコンピュータ読み取り可能媒体によって実現させることができる。
【0052】
動作上は、映像通信デバイス12のユーザーは、ユーザーインタフェース42と関連づけられた表示デバイス上で観るために、映像キャプチャデバイス40によって生成されたニアエンド映像又はROI認識映像復号器48によって復号されたファーエンド映像のいずれかを選択する。幾つかの実施形態においては、ピクチャインピクチャ(PIP)機能は、ユーザーがニアエンド映像とファーエンド映像を同時に観ることを許可することができる。ROIの定義を目的としてニアエンド映像又はファーエンド映像を観るために、ユーザーは、ユーザーインタフェース42を操作してROI定義モードを呼び出すことができる。デフォルト時は、映像通信デバイス12は、ROIを考慮せずに映像の符号化及び復号を処理することができる。ユーザーは、ROI定義モードに入ることによって、映像通信デバイス12のROI認識符号化及び復号の側面を起動させる。代替として、ROI認識符号化及び復号は、デフォルトモードであることができる。
【0053】
ファーエンド映像が提示された時点で、ユーザーは、以下においてさらに詳細に説明される様々な技術のうちのいずれかを用いてファーエンド映像内のROIを指示する。ファーエンドROIは、映像シーン内において、ユーザーにとって関心がありより高い画質が希望される領域又はオブジェクトを強調する。ユーザーインタフェース42は、ユーザーによる入力に基づいてファーエンドROI指示を生成する。ROI情報は、映像通信デバイス14への送信のためのファーエンドROI情報を生成するためにROIエンジン44によってさらに処理することができる。
【0054】
ユーザーは、代替として、ROIの定義に関して映像キャプチャデバイス40から得られたニアエンド映像を選択することができる。ニアエンド映像が提示された時点で、ユーザーは、オプションとして、ファーエンド映像におけるROI指示に関して用いられるのとの同様の又は同一の技術を用いてニアエンド映像内のROIを指示することができる。ニアエンドROI又はファーエンドROIは、最初はVT呼開始時に又はVT呼の進行中のいずれかの時点において指定することができる。幾つかの実施形態においては、最初のROIは、ローカルユーザー又は遠隔ユーザーによって更新すること、又はROI追跡モジュール56によって自動的に更新することができる。ROIが自動的に更新される場合は、ユーザーがROI情報を入力し続ける必要がない。代わりに、ROIは、ユーザーがROIを変更又は中止するまでユーザーによる最初の入力に基づいて維持される。
【0055】
ユーザーインタフェース42は、ユーザーによって提供された指示に基づいてローカルニアエンドROI指示を生成する。ニアエンドROI指示は、ファーエンドROI指示と同様に、ROIエンジン44によってさらに処理することができる。ニアエンドROI指示は、映像シーン内において、ユーザーが遠隔ユーザーに対して強調することを希望する領域又はオブジェクトを例えば向上された画質によって強調する。ローカルユーザーは、ユーザーインタフェース42を介して予め定義されたROIパターンを選択するか又はROIパターンを描くことによってニアエンドROI又はファーエンドROIを選択することができる。ROIパターンを描くことは、スタイラスを用いて自由に描くこと、又はデフォルト時のROIパターンの大きさ又は位置を変えることを含むことができる。
【0056】
図3の例においては、ユーザーインタフェース42は、提供された場合は、ローカルニアエンドROI指示及びファーエンドROI指示の両方を、ROIエンジン44内のROIコントローラ52に提供する。さらに、ROIコントローラ52は、認証モジュール58を介して遠隔ニアエンドROIをROI認識映像復号器48から受信する。特に、ROI認識映像復号器48は、遠隔ニアエンドROI情報の存在を、受信されたファーエンド映像ストリーム内において、又はアウトオブバンドシグナリングを介して検出し、遠隔ニアエンドROI情報を認証モジュール58に提供する。ローカルニアエンドROI及び遠隔ROIの指示は、各々のニアエンド映像又はファーエンド映像の映像フレーム内の座標に基づいて表すことができる。ROIの座標は、映像フレーム内のx−y座標であることができる。しかしながら、x−y座標は、説明されるように、符号器46又は復号器48によって使用するためのROI MBマップを生成するために処理される。
【0057】
ROIコントローラ54は、ローカルニアエンドROI、遠隔ニアエンドROI及びファーエンドROIを処理し、これらのROIをROIマッパー54に適用する。ROIマッパー54は、各々のROI座標をマクロブロック(MB)マップに変換する。より具体的には、ROIマッパー54は、ローカルユーザーによって指示されたファーエンドROIに対応するファーエンド映像内のMBを指定するファーエンドMBマップを生成する。さらに、ROIマッパー54は、ローカルニアエンドROI、遠隔ニアエンドROI、又は両方の組合せのいずれかに対応するニアエンド映像内のMBを指定するニアエンドROI MBマップを生成する。
【0058】
予め定義されたROIパターンに関しては、ROIマッピングは直接的である。各予め定義されたROIパターンは、同じく予め定義された指定のMBマッピングを有することができる。しかしながら、描かれた、位置又は大きさが変更されたROIパターンに関しては、ROIマッパー54は、ユーザーによって指定されたROIパターンの座標に最も一致するMB境界を選択する。例えば、指定されたROIがMB内を横切る場合は、ROIマッパー54は、該当するMBの外縁又は内縁のいずれかにROI境界を設定する。換言すると、ROIマッパー54は、ROI内に完全に入っているMBのみをROI MBマップに含めるように又はROI内に一部分が入っているMBも含めるように構成することができる。いずれの場合においても、ROIは、指定されたROIに最も近似する一組の全MBを含む。繰り返しになるが、映像符号器46又は映像復号器48は、MBレベルで動作し、一般的には、MBマップへのROIの変換を要求する。個々のMBをROI内に含めるか又はROIから除外するか指定することによって、ROI MBマップは、不規則な、すなわち長方形でない形状を有するROIの定義を可能にする。
【0059】
ROI認識映像符号器46は、ファーエンドROI MBマップを符号化されたニアエンド映像内において又はアウトオブバンドシグナリングによって遠隔映像通信デバイス14に送信する。ニアエンドROIMBマップは、遠隔映像通信デバイス14には送信されない。代わりに、ニアエンドROI MBマップは、ニアエンド映像内の指定されたMBを遠隔映像通信デバイス14に送信する前により高い品質の符号化又はより強力なエラー保護によって優先的に符号化するためにROI認識映像符号器46によって用いられる。従って、ROI認識映像符号器46は、ファーエンドROI情報に加えて、優先的に符号化されたROIを有する符号化されたニアエンド映像を遠隔映像通信デバイス14に送信する。
【0060】
ROI追跡モジュール56は、ニアエンド映像のROI領域の変化を追跡する。このVTアプリケーションが例えばモバイル映像通信デバイス内に常駐する場合は、ユーザーは、随時移動することができ、その結果前回に指定されたROIに対するユーザーの位置が変化する。さらに、ユーザーの位置が安定しているときでも、ROI内のその他のオブジェクトは、ROI領域から出ることができる。例えば、湖上のボートは、波の動きに応じて上下左右に動く可能性がある。移動が生じたときにユーザーがROIを再定義する必要がないようにするために、ROI追跡モジュール56は、ROI領域内のオブジェクトを自動的に追跡するために提供することができる。
【0061】
図3の例においては、ROI追跡モジュール56は、ROI認識映像符号器46によって生成された符号化されたニアエンド映像から動き情報を受け取る。動き情報は、符号化されたニアエンド映像内のMBに関する動きベクトルの形態をとることができ、ROIマッパー54によるROI MBマップの定義の閉ループ制御を可能にする。動き情報に基づき、ROI追跡モジュール56は、ニアエンドROI MBマップの増分的位置調整を生成し、該調整をROIマッパー54に提供する。位置調整は、MBがROIに含められるか又はROIから除外されるかの状態の変化の形であることができる。
【0062】
ROI MBマップ内におけるMBの状態は、動き情報がROIの実質的な移動を示す場合は変化させることができる。典型的には、MBに関する状態変化は、ROIの外境界において生じる。位置調整に応じて、ROIマッパー54は、ニアエンドROI MBマップによって指定されたROIをシフトさせ、ROI位置が符号化されたニアエンド映像内での動きにフレームごとに適応するようにする。ROI追跡モジュール56及びROIマッパー54は、互いに協力し、映像シーン内において動きが検出されるのに応じて自動的にROIの位置を調整する。この方法により、ROIエンジン44は、ROI内において移動中のオブジェクトを追跡するようにROIを調整する。
【0063】
認証モジュール58は、個々のユーザーの権利及び複数のユーザー間における権利の優先度を含む遠隔ユーザーのROI権利を解決するために機能する。ROI認識映像復号器48が遠隔ニアエンドROIを遠隔映像通信デバイス14から受信すると、ROI認識映像復号器48は、遠隔ニアエンドROIをROIエンジン44に提供する。しかしながら、幾つかの事例においては、遠隔ユーザーによって指定された遠隔ニアエンドROIは、ローカルユーザーによって指定されたローカルニアエンドROIと対立する可能性がある。例えば、ローカルユーザー及び遠隔ユーザーは、映像シーン内において重なるROI又は完全に異なるROIを指定することができる。この場合は、ROIの対立を解決するために認証モジュール58を提供することができる。
【0064】
認証モジュール58は、幾つかの実施形態においては、いずれのニアエンドROI情報(ローカル又は遠隔)を所定の時点において使用すべきであるかを調整するためのいわゆる「マスター−スレーブ」メカニズムを適用することができる。特に、送信者が受信者駆動ROI情報を受信する前には、送信者はニアエンドROIマスターであり、自己のニアエンドROIの制御を有する。換言すると、遠隔ニアエンドROIが映像通信デバイス12において受信される前には、ローカルユーザーがニアエンドROIの制御を有する。このため、遠隔ユーザーはニアエンドROI「スレーブ」であり、マスター、すなわちローカルユーザーがニアエンドROIを制御するためのアクセス権を与えないかぎりニアエンドROIの制御を有さない。
【0065】
ローカルユーザーが遠隔ユーザーにアクセス権を与えた時点で、ローカルユーザーはもはや自己のニアエンドROIを制御しない。代わりに、映像通信デバイス14と関連する遠隔ユーザーは、映像通信デバイス12によって生成されたニアエンド映像に関するニアエンドROIの制御を得て、ニアエンドROIのマスターになる。遠隔ユーザーは、ローカルユーザーがアクセス特権を明示で取り消すか又は遠隔ユーザーによるアクセスをその他の方法で拒否するまで、又は遠隔ユーザーがROIの選択を中止するまで制御を保持することができ、前記取り消すか拒否した場合は、マスターROI制御は、ローカルユーザーに戻ることができる。
【0066】
ROI認識映像復号器48が、存在する場合に、符号化されたファーエンド映像を受信した時点で、ROI認識映像復号器48は、送信者と合意されたフォーマットに基づいて映像ビットストリームから遠隔ニアエンドROI情報を検索する。繰り返しになるが、ニアエンドROI情報は、符号化されたファーエンド映像内に埋め込むこと又はアウトオブバンドシグナリングによって送信することができる。いずれの場合も、ROI認識映像復号器48は、ROIコントローラ52及びROIマッパー54を介して、遠隔ニアエンドROIがROI認識映像符号器46に送信される前にアクセス許可を得るために遠隔ニアエンドROIを認証モジュール58に渡す。認証モジュール58は、符号化プロセスがローカルユーザーによる認証のないユーザーによって制御できないように特定のユーザーにアクセス権を限定する。
【0067】
認証モジュール58は、1人以上の遠隔ユーザー間においてアクセス権及びアクセスレベルを与える及び管理するように構成することができる。例えば、ローカルユーザーは、選択された遠隔ユーザーにアクセス権を与えることができる。従って、ローカルユーザーは、いくつかの遠隔ユーザーがニアエンドROIを制御するのを許可し、その他の遠隔ユーザーがニアエンドROIを制御するのを禁止することができる。さらに、ローカルユーザーは、相対的なアクセスレベル、又は優先権を遠隔ユーザーに割り当てることができる。この方法により、ローカルユーザーは、複数の遠隔ユーザーがROI制御を同時に要求した場合にニアエンドROIを制御する上で幾つかの遠隔ユーザーがその他の遠隔ユーザーに対する優先権を有することができるように、遠隔ユーザー間でのアクセスレベル階層を指定することができる。例えば、複数の遠隔ユーザーは、複数の当事者によるテレビ会議中にROI制御を同時に要求することができる。このような場合は、ROI制御は、典型的には、1人のユーザー、すなわちローカルユーザーに対して、又はローカルユーザーによって制御が与えられている場合は遠隔ユーザーのうちの選択された1人の遠隔ユーザーに対して排他的に与えられる。
【0068】
幾つかの実施形態においては、認証モジュール58は、ローカル映像通信デバイス12がROI認識映像処理を可能にする能力を有するかどうかを決定するための資源モニタリングを行う責任を有することも可能である。ローカルデバイスが所定の時点において遠隔ROI制御をサポートする上で又は特定の型のROI要求に応える上で十分な処理資源を有していない場合は、認証モジュール58は、遠隔ROI制御アクセス権を取り消すか又はROI要求を拒否する。一例として、通信チャネルによって課された帯域幅に関する制限、又はローカルな処理負荷は、遠隔ROI制御が拒否されることになる可能性がある。他の例として、該制限は、予めコンフィギュレーションされたROIパターンの使用を許可することができるが、描かれた又は記述されたROIパターンの使用は許可できない場合がある。認証モジュール58は、遠隔デバイスに送信するために発信される符号化されたニアエンド映像内に状態メッセージを埋め込むことによってROI決定を遠隔デバイスに通知することができる。
【0069】
さらに、個々の遠隔ユーザーには、遠隔ユーザーがニアエンドROIを制御することができる度合いを制御するための異なるアクセスレベルを与えることができる。例えば、遠隔ユーザーは、ローカルユーザーの承認を得ることを条件として一組の予め定義されたROIパターンを選択すること、特定のROI位置又は大きさ、又はROIを指定することに制限することができる。このため、認証モジュール58は、遠隔ユーザーによるニアエンドROIの制御を自動的に解決すること又はローカルユーザーとの対話によってニアエンドROI制御の能動的な承認について交渉することができる。例えば、遠隔ユーザーがニアエンドROIを制御するためのアクセスを要求したときには、認証モジュール58は、遠隔ユーザーによるROI制御の承認を要求するための問い合わせをユーザーインタフェース42を介してローカルユーザーに行うことができる。
【0070】
認証モジュール58は、様々な方法のうちのいずれかの方法で遠隔ユーザーに関するアクセスレベルを追跡することができる。上述されるように、ローカルユーザーは、遠隔ユーザーからのニアエンドROI制御要求を能動的に承認すること、及び遠隔ユーザーに与えられたアクセスレベルを能動的に制御することができる。代替として、ローカルユーザーは、アクセス権又はアクセスレベルを含む遠隔ユーザー関連情報を格納するアドレスブックを映像通信デバイス12のメモリ内に維持することができる。アドレスブックは、遠隔ユーザー及び関連するアクセスレベルのリストを有するデータベースの形態をとることができる。遠隔ユーザーがニアエンドROI制御を要求時には、認証モジュール58は、該当するアクセス権情報をアドレスブックから検索し、ローカルユーザー、遠隔ユーザー、及び可能なことに数人の遠隔ユーザーとの間におけるROI制御を解決するための認証プロセスを自動的に適用する。遠隔ユーザーがアドレスブックに記載されていない場合は、ローカルユーザーは、遠隔ユーザーを適用可能なアクセス権とともにアドレスブックに追加するのを選択することができる。
【0071】
幾つかの場合においては、ローカルユーザーは、アドレスブック内の特定の遠隔ユーザーに関して指定されたデフォルトアクセスレベルをオーバーライドすることができる。例えば、認証モジュール58は、ローカルユーザーがVT呼の進行中に異なる遠隔ユーザー間でのROI制御優先順位を能動的に再設定すること又はローカルユーザーとして排他的にニアエンドROIの制御を再取得するために介入することを許可することができる。アドレスブックを維持する際又はROI制御要求を能動的に管理する際におけるローカルユーザーと認証モジュール58との間における対話は、図3においてはアクセス制御情報によって表されている。
【0072】
遠隔ユーザーに関する自動化された又は能動的なニアエンドROI制御承認が行われた時点で、認証モジュール58は、ROIマッパー54による処理及びマッピングのために遠隔ニアエンドROIをROIコントローラ52に渡す。代替として、ROIコントローラ52は、遠隔ニアエンドROIが提供されないか又はローカルユーザーが遠隔ユーザーを排除してニアエンドROIを制御することを選択している場合には、ローカルユーザーによってユーザーインタフェース42を介して提供されたローカルニアエンドROIを処理する。
【0073】
認証モジュール58は、ローカルユーザーと遠隔ユーザーとの間におけるROIの対立を解決するために機能する。デフォルト時には、認証モジュール58は、ローカルユーザーがニアエンドROI制御を有するマスター−スレーブ概念を適用する。最高レベルのアクセス権が遠隔ユーザーに与えられた時点で、遠隔ユーザーは、映像通信デバイス12のROI認識映像符号器46からニアエンドROI選択に関する全制御を得る。その他の場合は、ローカルユーザーは、遠隔ユーザーによって行われたあらゆるニアエンドROI選択をオーバーライドするニアエンドROI制御を有する。
【0074】
遠隔ユーザーに対してアクセス権を与えることができる場合でも、遠隔ユーザーのアクセス権は通常はローカルユーザーのアクセス権よりも低いレベルであるため、ニアエンドROI制御においてはローカルユーザーが優先される。従って、ローカルユーザーがニアエンドROIを指定することを選択した場合は、遠隔ユーザーによって行われたいずれのニアエンドROI選択も無視されることになる。他方、ローカルユーザーがニアエンドROIを指定しない場合は、遠隔ユーザーに割り当てられたアクセス権のレベルが有効であり、遠隔ユーザーは、ニアエンドROIを制御することができる。しかしながら、上述されるように、ローカルユーザーは、デフォルトのマスターとスレーブの関係をオーバーライドして最高レベルのアクセス権をローカルユーザーに与えることを依然として選択することができる。
【0075】
図4は、ROI認識CODECを有し、ROI抽出モジュール60をさらに組み入れた他の映像通信デバイス12’を示したブロック図である。図4の映像通信デバイス12’は、図3の映像通信デバイス12とほぼ同一である。しかしながら、映像通信デバイス12’は、ユーザーからの入力に基づいてローカルニアエンドROI及びファーエンドROIを形成するためのROI抽出モジュール60をさらに含む。予めコンフィギュレーションされたROIパターンの選択を単純に処理するか又はユーザーがデフォルトのROIを描くこと、又は位置又は大きさを変更することを許可することに加えて、ROI抽出モジュール60は、ローカルユーザーが口頭又はテキストによるROIの記述によってROIを指定することを許可する。特に、ROI抽出モジュール60は、ローカルユーザーによって提供されたROI記述に基づいてローカルニアエンドROI又はファーエンドROIを生成する。
【0076】
ROI記述例は、「顔」、「動いているオブジェクト」、「唇」、「人間」、「背景」、等の言葉をテキスト又は口頭で入力することを含む。これらのオブジェクトの優先的符号化が非常に望ましいことがある。例えば、唇又は顔の優先的符号化は、顔の表情、口の動き、等をより良く表すことができる。テキストによる入力は、ユーザーインタフェース42によって提示されたメニューから入力又は選択することができる。口頭による入力は、映像通信デバイス12’と関連するマイクに話すことによって提供することができる。各場合において、ローカルユーザーは、ROIを選択または描く代わりにROIを「記述」する。ROI抽出モジュール60は、該当するニアエンド又はファーエンド映像シーン内における一組の座標に記述を変換する。口頭によるROIの記述が用いられる場合は、ユーザーインタフェース42又はROI抽出モジュール60は、従来の音声認識能力を組み入れることができる。特に、ROI抽出モジュール60は、1つ以上の認識された言葉に基づいてROIを指定する情報を生成することができる。
【0077】
ROI抽出モジュール60は、希望されるROIを検出するように構成された従来の予符号化処理アルゴリズムの適用によって自動的にROI座標を選択する。特に、ROI抽出モジュール60は、映像ROI処理における当業者に知られている従来の技術に従って顔の検出、特徴の抽出、オブジェクトの分割、又は追跡に関するアルゴリズムを適用することができる。例えば、ROI抽出モジュール60は、映像入力データの画素のルーメン値又は彩度値に基づくROIの識別に依存する従来の技術を適用することができる。
【0078】
従来の顔検出方式は、典型的には、顔の画素と顔以外の画素を識別するための指標として皮膚の色を用いることを含む。従来の顔検出方式の例は、C.−W.リン、Y.−J.チャン及びY.−C.チェン著の"A low-complexity face-assisted coding scheme for low bit-rate video telephony"(低ビットレートビデオテレフォニーに関する低複雑さの顔に基づく方式)、IEICE Trans. Inf. & Syst., vol. E86-D, no. 1, Jan. 2003, pp. 101-108において、及びD.チャイ及びK.N.ナン著の"Face segmentation using skin-color map in videophone applications"(ビデオフォン用途における皮膚の色マップを用いた顔の分割)、IEEE Trans. On Circuits and Systems for Video Technology, vol. 9, no. 4, Jun. 1999, pp. 551-564において説明されている。
【0079】
ローカルユーザーが「顔」に基づいてROIを記述時には、ROI抽出モジュール60は、ニアエンド映像又はファーエンド映像を適宜解析して自動的に顔を識別し、ROIとしての識別された顔と関連する座標を指定する。次に、ROI抽出モジュール60は、ROIマッパー54による処理及びマッピングのためにROIコントローラ52に座標を渡す。顕著なことに、ROI抽出モジュール60は、ローカルニアエンドROI記述又はファーエンドROI記述を適宜処理し、該記述を該当する抽出アルゴリズムにマッピングし、該当する予め符号化されたニアエンド映像又は復号されたファーエンド映像を自動的に解析して該当するROIを自動的に抽出する。
【0080】
ROI抽出モジュール60は、自動的なROI検出をサポートするため、ニアエンド映像を映像キャプチャデバイス40から、ファーエンド映像をROI認識映像復号器48から受信する。ROI検出モジュール60は、ユーザーインタフェース42からのローカルニアエンドROI記述又はファーエンドROI記述、及び自動化検出アルゴリズムを用いて、ROIコントローラ52に適用するためのローカルニアエンドROI及びファーエンドROIを適宜生成する。各場合において、ROI抽出モジュール60は、ローカルニアエンドROI記述又はファーエンドROI記述を、該当する記述に最も適合する座標に変換する。この場合は、ユーザーがROIを描く必要がない。さらに、ユーザーは、一組の予め定義されたROIパターンに制限されない。代わりに、ROIコントローラ52は、ニアエンド映像内においてROI記述に合致する該当領域を能動的に検出する。
【0081】
ROIマッパー54は、映像フレーム内の該当するマクロブロック(MB)にROI座標をマッピングし、ニアエンド又はファーエンドROI MBマップを生成する。実際上は、ROIマッパー54は、ROIコントローラ52からのROI座標を、映像符号器46が理解できるフォーマットに変換する。特に、映像符号器46は、MBレベルで、すなわち各MBごとに、符号化を処理するように装備される。その目的のため、ROIマッパー54は、ニアエンド又はファーエンド映像に関するROI MBマップを生成する。ROI MBマップは、指定されたROI内にあるMBを識別し、このため映像符号器46はこれらのMBに対して優先的符号化を適用することができる。
【0082】
ROI記述を処理することに加えて、ROI抽出モジュール60は、ローカルユーザーによって一組の予め定義されたパターンから選択されたROIパターン、又はローカルユーザーによって描かれた、又は位置又は大きさが変更されたROIパターンを処理するために装備される。従って、映像通信デバイス12’は、図3の映像通信デバイス12に関する説明と実質的に同じようにROI情報を生成するが、ローカルユーザーによってテキストで又は口頭で入力されたROI記述を処理するためにROI抽出モジュール60をさらに組み入れることができる。ROI抽出モジュール60は、ローカルユーザーによって使いやすい点で望ましい。しかしながら、幾つかの映像通信デバイスは、ROI抽出モジュール60をサポートする上で不十分な処理力を有している場合がある。従って、ROI抽出モジュール60は、本開示による映像通信デバイスの望ましいがオプションのコンポーネントであることを表す。
【0083】
幾つかの実施形態においては、ROI抽出モジュール60は、ローカルユーザーによってだけでなく遠隔ユーザーによっても生成されるROI記述を処理することができる。この方法により、抽出機能は、幾つかのデバイスにおいてはローカルではなく遠隔で実施することが可能である。例えば、特定の映像通信デバイス14は、デバイス14のユーザーによって提供されたROI記述に関するROI抽出をサポートする上で不十分なローカル資源又は能力を有している場合がある。しかしながら、他の映像通信デバイス12は、ROI抽出に関してより良い装備をすることができる。この場合は、ローカルROI抽出をオフロードするか又は遠隔映像通信デバイスに分散できるようにすることが企図されている。
【0084】
遠隔抽出をサポートするため、ROIの記述は、様々な方法で遠隔デバイスに提供することができる。例えば、遠隔デバイスに送信される音声ストリーム内に口頭による記述を含めることができる。テキストによるROIの記述は、予め定義されたROIパターン又は描かれたROIパターンと同様に、例えば該情報を符号化された映像ストリーム内に埋め込むことによって遠隔デバイスに送信することができる。従って、1つのデバイスから他のデバイスに送信されるROI情報は、予め処理されたROI MBマップの形態、又は、遠隔符号器に適用前に遠隔デバイスにおいて処理することを要求する指示又は記述を含むROIのその他の指示又は記述の形態をとることができる。
【0085】
図5は、中間抽出サーバー61を介した分散型ROI抽出を示すブロック図である。図5に示されるように、映像通信デバイス12、14は、ROIを抽出できるように十分な情報を中間抽出サーバー61に提供することができる。例えば、各デバイス12、14は、各々のローカルニアエンドROI記述、ファーエンドROI記述、符号化された又は生のニアエンド映像、及び符号化されたファーエンド映像を提供することができる。ニアエンドデバイスから符号化されたファーエンド映像を提供することの代替として、ROI抽出サーバー61は、ファーエンドデバイスから直接ファーエンド映像を受信することができる。抽出サーバー61は、この情報を用いて、ファーエンドROI及びローカルニアエンドROIのうちの1つ又は両方を生成し、各々のデバイス12、14に提供する。抽出サーバー61は、通信ネットワーク内のあらゆる場所に配置されたサーバーであることができ、有線媒体、無線媒体、又は両方の組合せによってデバイス12、14に結合させることができる。抽出サーバー61は、映像通信デバイス12、14から遠隔に配置すること又はデバイス12、14のうちの1つと並置することができる。しかしながら、多くの場合は、抽出サーバー61は、遠隔サーバーであることができる。一般的には、抽出サーバー61は、映像通信デバイス12、14とは構造的に異なる。
【0086】
抽出サーバー61は、抽出モジュール60とほとんど同じように機能するが、遠隔の分散された形で動作することができ、このためROI抽出はデバイス12、14内においてローカルで行う必要がない。この方法により、より大きい処理力を有することができる異なるデバイスにROI抽出処理コストを分散させることができる。ROI抽出モジュール60と同様に、抽出サーバー61は、ユーザーによる口頭、テキスト又は図形での記述、等の異なる型のROI記述を処理することができる。その目的のため、ROI抽出サーバー61は、これらの記述を処理するために音声認識能力、等の適切な能力を組み入れることができる。さらに、ROI抽出サーバー61は、映像の解析とROIの抽出を可能にする映像復号能力、及び映像を再符号化するための及び希望される場合はROI情報を埋め込むための符号化能力を備えることができる。
【0087】
図6は、複数のビデオテレフォニーセッションに関する分散型ROI抽出を示すブロック図である。図6の例においては、ROI抽出サーバー61は、複数の映像通信デバイス12A乃至14A、12B乃至14B、12C乃至14D、乃至12N乃至14Nの間におけるVTセッションに関するROI抽出を処理するために動作する。この方法により、ROI抽出サーバー61は、所定の通信ネットワークにおいて実施中の様々なVTセッションをサポートするために複数のROI抽出タスクを並行して実施する。
【0088】
図7A乃至7Dは、ローカル又は遠隔ユーザーによる選択のための予め定義されたROIパターンを示す図である。図7A乃至7DのROIパターンは、例示することが目的であり、制限するものであるとはみなすべきでない。図7Aは、無線通信デバイス38と関連づけられたディスプレイ36において提示された映像シーン34内のROI62を示す。ROI62は、映像シーン34内の実質的な中心に置かれた基本的な長方形である。長方形ROI62の長辺は、映像シーン34内において縦方向に延びている。多くの場合においては、ROI62は、人間の顔、すなわちVT呼に参加している遠隔ユーザーの顔をキャプチャする上で有効である。
【0089】
図7Bは、映像シーン34内において横方向に延びる長辺を有する長方形の形をした他のROI64を示す。ROI64は、映像シーン34内の実質的な中心に置かれており、車両、ボート、製品、プレゼンテーション、等のオブジェクトをキャプチャする上で有効になる。
【0090】
図7Cは、VT呼に参加している遠隔ユーザーの顔及び肩をキャプチャするように設計された形状を有する他のROI66を示す。代替として、ROI66は、例えば1方向の映像ストリーミング用途において、ニュース放送を行っている特派員、集会の司会者、又は会議の講演者の顔と肩をキャプチャすることができる。いずれの場合においても、予め定義されたROI66は、人間のVT参加者又はプレゼンターに焦点を合わせ、その人の肉体的特徴に関する優先的符号化を達成させる。
【0091】
図7Dは、映像シーン34内において並置されている二重の組のROI68、70を示す。図5Dの例においては、ROI68、70は、並んで座っているか又は立っている2人の人の顔をキャプチャする上で有効である。この方法により、顔の表情及び動きに関するより高い画質をサポートするために2人の参加者の顔を優先的に符号化することができる。
【0092】
図7A乃至7Dに描かれた予め定義されたROIパターンは、例示することを目的とするものである。代替の位置又は形状を有するその他の予め定義されたROIパターンを提供することができる。例えば、幾つかのROIパターンは、これらのパターンをMB境界にマッピングできることを条件として丸い又は不規則な形状を有することができる。
【0093】
幾つかの実施形態においては、ユーザーは、選択されたROIパターンの大きさ又は位置を変更するのを許可されることができる。大きさ及び位置を変更するために従来のカーソル及びコーナードラッグ手法を用いることができる。さらに、ROIの大きさの縮尺の再設定を、コーナードラッグによって又は縮尺率を明示で指定することによって達成させることができる。当然のことであるが、ROIが大きくなるのに従い、帯域幅上の制限に起因して優先的符号化度が低下される。従って、幾つかの場合においては、映像通信デバイス12内において最大のROIの大きさを強制することができる。
【0094】
図8は、送信者デバイスにおけるニアエンド映像内での優先的ROI符号化を制御するために受信者デバイスにおいてファーエンドROI情報を生成することを示す流れ図である。図8において描かれたプロセスは、図4の映像通信デバイス12’の図3の映像通信デバイス12内に実装することができる。動作上は、映像通信デバイス12内のROI認識映像復号器48は、映像通信デバイス14、等の遠隔送信者デバイスからのファーエンド映像を復号する(72)(図1)。ファーエンド映像を復号した時点で、受信者デバイス12のユーザーインタフェース42は、ローカルユーザーによって観るためにファーエンド映像を表示する(74)。
【0095】
ローカルユーザーがROIの選択を要求しない場合は(76)、何の行動もとられず、ファーエンド映像の次のフレームが復号される(72)。しかしながら、ROIの選択が要求された場合は(76)、ユーザーインタフェース42は、ローカルユーザーからのファーエンドROI情報を受け入れる(78)。ROIコントローラ52及びROIマッパー54は、協力し合ってファーエンドROI MBマップを生成する(80)。ROI認識符号器46は、符号化されたニアエンド映像内にファーエンドROIMBマップを埋め込み、それによってファーエンド映像を符号化する遠隔送信者デバイス14にファーエンドROIマップを送信する(82)。ファーエンドROI MBマップは、遠隔映像通信デバイス14と関連づけられた符号器が映像通信デバイス12に送信されるファーエンド映像の該当するROI内のMBに優先的符号化を適用するように指定する。
【0096】
図9は、送信者デバイスにおけるニアエンド映像内での優先的ROI符号化のために受信者デバイスからのニアエンドROI情報を処理することを、ROI追跡と組み合わせて示した流れ図である。図9の例においては、ユーザーインタフェース42は、映像キャプチャデバイス40によって生成されたニアエンド映像ストリームを受信し、ニアエンド映像をローカルデバイスに提示する(84)。ローカルユーザー及び遠隔ユーザーのいずれもがニアエンドROIの選択を要求しない場合は(86)、各映像フレーム内の全MBは通常どおりに、すなわちROI内のMBの優先的符号化を行わずに、符号化される。符号化されたニアエンド映像は、遠隔受信者デバイス14に送信される(89)。
【0097】
しかしながら、ニアエンドROIの選択がローカルユーザー又は遠隔ユーザーによって要求された場合は(86)、ROIコントローラ52及びROIマッパー54は、該当するニアエンドROI情報を処理してニアエンドROI MBマップを生成する(90)。ニアエンドROIがローカルユーザー及び遠隔ユーザーの両方によって指定された場合は、認証モジュール58は、対立を解決してROIのうちの1つを優先させるために介入することができる。ニアエンドROI MBマップが受信された時点で(90)、ROI認識映像符号器46は、より高い品質の符号化、より強力なエラー保護又はその両方を適用することによってROI内のMBを優先的に符号化する(92)。
【0098】
追跡モジュール56は、ROI認識映像符号器46によって生成された動き情報をモニタリングすることによってニアエンド映像内のROIの位置を追跡する(94)。ROIのシフトが検出されない場合は(96)は、ニアエンド映像内のROI MBを符号化するために既存のROIマップが適用され、符号化されたニアエンド映像が遠隔受信者デバイスに送信される(102)。ROIのシフトが検出された場合は(96)、映像追跡モジュール56は、ニアエンド映像を符号化する前に動き情報に基づいてROI MBマップを調整する(98)。
【0099】
図10は、送信者デバイスにおけるニアエンド映像内での優先的ROI符号化に関する受信者デバイスからのROI情報の処理を、ユーザー認証と組み合わせて示した流れ図である。図10は、遠隔ユーザーがニアエンドROIを制御するのを許可する際における図3又は図4の認証モジュール58の動作を示し、説明を簡単にするために、ローカルニアエンドROIが指定されていないと仮定する。図10に示されるように、映像通信デバイス12内の映像キャプチャデバイス40によって生成されたニアエンド映像ストリームに関して、認証モジュール58は、遠隔ニアエンドROIが映像通信デバイス14の遠隔ユーザーによって要求されているかどうか(106)を決定する。
【0100】
遠隔ニアエンドROIが要求されておらず(106)、さらにローカルニアエンドROIが指定されない場合は、ニアエンド映像内の全MBが通常どおりに符号化される(110)。しかしながら、遠隔ニアエンドROIが要求された場合は(106)、認証モジュール58は、ニアエンドROIを要求した遠隔ユーザーが認証されるかどうかを次に決定する(108)。特に、認証モジュール58は、映像通信デバイス12内においてローカルで格納されているアドレスブックを参照することによって遠隔ユーザーのアクセス権を自動的に決定することができる。代替として、認証モジュール58は、遠隔ユーザーによるニアエンドROI制御に関するアクセス権の承認又は拒否を得るためにユーザーインタフェース42を介して能動的にローカルユーザーに問い合わせることができる。
【0101】
遠隔ユーザーが認証されない場合は(108)、ニアエンド映像内の全MBが通常どおりに符号化される(110)。しかしながら、遠隔ユーザーが認証される場合は(108)、遠隔ユーザーにニアエンドROI制御が与えられる。この場合は、ROIコントローラ52及びROIマッパー54は、遠隔ユーザーからのニアエンドROI情報を処理し、ニアエンドMBマップを生成する(112)。ROI認識符号器46は、ニアエンドMBマップを用いて、ニアエンドMBマップによって識別されたMBを優先的に符号化する(114)。次に、映像通信デバイス12は、符号化されたニアエンド映像を遠隔映像通信デバイス14に送信する(116)。
【0102】
図11は、予め定義されたROIパターンの選択を示す流れ図である。ROI認識映像復号器48が遠隔映像通信デバイス14から受信されたファーエンド映像をいったん復号した時点で(118)、ファーエンド映像がユーザーインタフェース42を介してローカルユーザーに表示される(120)。ローカルユーザーがROIの選択を要求した場合は(122)、ユーザーインタフェース42は、図7A乃至7Dにおいて示されるROIパターン等の予め定義されたROIパターンのメニューを表示する(124)。代替として、ユーザーは、ROIの記述を提供すること、又はROIパターンを描くこと、位置又は大きさを変更することができる。しかしながら、図11の例においては、動作は、予め定義されたROIパターンの提示に焦点を合わせる。予め定義されたROIパターンがローカルユーザーによって選択された時点で(126)、ROIコントローラ52及びROIマッパー54は、選択されたパターンに基づいてROIMBマップを定義する(128)。ROI認識映像符号器46は、符号化されたニアエンド映像内にROI MBマップを埋め込み、ファーエンド映像内のROIの優先的符号化の際に用いるためにROI MBマップを遠隔映像通信デバイス14に送信する(130)。
【0103】
図12は、ROIテンプレート132の拡大及び縮小による表示された映像シーン34内におけるROIパターンの定義を示す図である。図12は、図2に実質的に対応するが、ユーザーによって大きさを変更することができるROIテンプレート132の提示を示す。図12の例においては、ROIテンプレート132は、ROIテンプレートの角のうちの1つをコーナードラッグして該ROIテンプレートを拡大及び縮小させることによって大きさを変更することができる。コーナードラッグしてROIテンプレート132を拡大させることの結果は、拡大されたROIテンプレート134によって表される。コーナードラッグの結果、ROIテンプレート132の大きさが大きくなるか又は小さくなるが、相対的な長さと幅の比の縮尺は維持する。しかしながら、幾つかの実施形態においては、ユーザーが長さと幅の比の縮尺を変更する一方でROIテンプレートの大きさを大きくするか又は小さくするためにROIテンプレート132の側部をドラッグすることを許可することも可能である。ドラッグは、タッチ画面、又は映像通信デバイス12のユーザーインタフェース42と関連づけられた他のポインティング装置と組み合わせてスタイラスを用いて達成させることができる。その他のポインティング装置は、ジョイスティック、タッチパッド、スクロールホイール、トラックボール、等を含むことができる。
【0104】
図13は、ROIテンプレート132をドラッグすることによる表示された映像シーン内でのROIパターンの定義を示した図である。特に、図13は、ROIテンプレート132を映像シーン34内の他の位置135にドラッグすることによるROIテンプレート132の位置変更を示す。ドラッグは、スタイラスとタッチ画面又はユーザーインタフェース42と関連づけられた他のポインティング装置によって達成させることができる。
【0105】
図14は、タッチ画面上でスタイラス138を用いてROIパターン136を描くことによる表示された映像シーン内でのROIパターンの定義を示した図である。図14の例においては、ROIパターン136は、自由な描画によって生成される。ROIコントローラ52及びROIマッパー54は、互いに協力し、描かれたROIパターンと関連する座標を、ROIパターン136内にほぼ入っている映像シーン34内のMBを識別するMBマップに変換する。図12、13、及び14に示されるROIパターンの定義は、ニアエンド映像又はファーエンド映像内のROIに関して適用することができる。
【0106】
図15は、動的に追跡される指定されたROIオブジェクトを有するドロップダウンメニュー140を用いることによる表示された映像シーン内でのROIパターンの定義を示した図である。図15において示されるように、ユーザーインタフェース42は、「顔」、「唇」、「背景」、及び「動き」、等のROIの記述を提示するドロップダウンメニュー140を提示する。ローカルユーザーは、ドロップダウンメニュー内のエントリのうちの1つを希望されるROIの記述として選択する。前記選択に応じて、ROI抽出モジュール60(図4)は、ニアエンド映像又はファーエンド映像を適宜解析して記述に対応するROIパターンを検出する。ドロップダウンメニュー140の代替として、ユーザーは、ユーザーインタフェース42を介してテキストを入力すること、又は口頭でマイク内にテキストを言うことができる。各場合において、皮膚の色調の検出、オブジェクトの分割、等の従来の特徴検出アルゴリズムを用いて、選択されたROIが該当するROIパターンとマッチングされる。ROIパターンが選択された時点で、ROIコントローラ52及びROIマッパー54は、該当するROI MBマップを生成する。図15のプロセスは、各ROIの記述を対象となる特定の映像シーン内のROIパターンと動的にマッチングしなければならないという意味で「動的」であると呼ばれる。
【0107】
図16は、図7A乃至7Dに示されるように、予め定義されたROIパターンにマッピングされた指定されたROIオブジェクトを有するドロップダウンメニュー142を用いることによる表示された映像シーン内でのROIパターンの定義を示した図である。図16に示されるように、ユーザーインタフェース42は、「単一の顔」、「二重の顔」、「頭/肩」、及び「オブジェクト」、等のROI記述を提示するドロップダウンメニュー142を提示する。ローカルユーザーは、ドロップダウンメニュー内のエントリのうちの1つを希望されるROIパターンとして選択する。前記選択に応じて、ROIコントローラ52は、選択されたROIパターンを、例えば図7A乃至7Dにおいて描かれているような対応する予め定義されたROIパターンとマッチングさせる。従って、図15に示されるROIの記述とは異なり、静的ROIパターンは、映像解析を要求しない。代わりに、ROIコントローラ52及びROIマッパー54は、ドロップダウンメニュー142内の選択項目に対応する予めコンフィギュレーションされたROI MBマップを生成する。繰り返しになるが、ドロップダウンメニュー142の代替として、ユーザーは、ユーザーインタフェース42を介してテキストを入力すること、又は口頭でマイク内にテキストを言うことができる。図15のプロセスは、各ROIパターンが予め定義されたROIパターン及びMBマップに対応するという意味で「静的」であると呼ばれる。
【0108】
図17は、ROI記述インタフェースを用いることによる表示された映像シーン内でのROIパターンの定義を示した流れ図である。図17に示されるプロセスは、図15のドロップダウンメニュー、又はその他の入力媒体とともに用いることができる。図17に示されるように、ROI認識映像復号器48は、遠隔送信者デバイス14から受信されたファーエンド映像を復号する(144)。次に、ユーザーインタフェース42は、ファーエンド映像をローカルユーザーに表示する(146)。ローカルユーザーがファーエンド映像に関するROIの選択を要求しない場合は(148)、遠隔映像通信デバイス14にはROI情報が送信されない。しかしながら、ROIの選択が要求された場合は(148)、ユーザーインタフェース42は、図17のドロップダウンメニュー140、等のROI記述インタフェースを提示する(150)。
【0109】
ローカルユーザーROI記述を受信した時点で(152)、ROIコントローラ52及びROIマッパー54は、前記記述に基づいてROIパターンを選択し(154)、選択されたROIパターンに基づいてROI MBマップを定義する(156)。繰り返しになるが、選択されたROIパターンは、従来の検出技術を用いてファーエンド映像を解析し、ROI記述をファーエンド映像内の特定のMBにマッチングさせることによって決定することができる。ファーエンドROI MBマップが生成された時点で、ROI認識映像符号器12は、ファーエンドROI MBマップを符号化されたニアエンド映像内に埋め込み、ファーエンドROIの優先的符号化のために遠隔映像通信デバイス14に送信する。
【0110】
図18は、送信者デバイスと受信者デバイス12、14との間におけるROIの対立の解決を示した流れ図である。特に、図18は、ローカルユーザーによって指定されたニアエンドROIと遠隔ユーザーによって指定されたニアエンドROIの対立を解決する上での認証モジュール58(図3又は図4)の動作を示す。送信者デバイスにおいてニアエンド映像が生成された時点で(160)、認証モジュール58は、ニアエンドROIがローカルユーザー又は遠隔ユーザーによって要求されているかどうかを決定する(162)。要求されていない場合は、ROIの優先的符号化が行われずに通常どおりに全MBが符号化され(164)、その結果得られた符号化された映像が受信者映像通信デバイス14に送信される(166)。
【0111】
ニアエンドROIが要求される場合は(162)、認証モジュール58は、ローカルユーザーによって指定されたニアエンドROIと遠隔ユーザーによって指定されたROIとの間において対立が存在するかどうかを決定する(168)。遠隔ニアエンドROIが指定されない場合、又はローカルニアエンドROIと遠隔ニアエンドROIが対立しない場合は、認証は、選択されたニアエンドROIを処理のためにROIコントローラ52に渡すことができる。
【0112】
ローカルニアエンドROIが存在せず、遠隔ニアエンドROIが選択されている場合は、認証モジュール58は、遠隔ニアエンドROIを適用するのを許可することができる。代替として、幾つかの実施形態においては、認証モジュール58は、ローカルユーザーとの対話によって又はアドレスブックに記録されているアクセスレベルによって遠隔ユーザーに与えられた明示のアクセスが存在する場合のみに遠隔ニアエンドROIを適用するのを許可することができる。ROIの対立が存在しない場合は、ROIマッパー54は、適用可能なニアエンドROIに基づいてニアエンドMBマップを生成してROI認識映像符号器46に適用する。ROI認識映像符号器46は、ニアエンド映像のROI内のMBを優先的に符号化する(172)。
【0113】
ローカルニアエンドROIと遠隔ニアエンドROIとの間において対立が存在する場合は(168)、認証モジュール58は、例えば映像通信デバイス12内にローカルで格納されているアドレスブックにおいてアクセスレベルが既に割り当てられているかどうかを決定する(174)。アクセスレベルが割り当てられている場合は(174)、認証モジュール58は、アクセスレベルに従ってROIの対立を解決する(176)。例えば、遠隔ユーザーに関する格納されたアクセスレベルは、ローカルユーザーに関するROI制御を遠隔ユーザーに与えるべきであることを示すことができる。アクセスレベルが割り当てられていない場合は(174)、認証モジュール58は、遠隔ROI制御の承認をローカルユーザーに求める(178)。特に、認証モジュール58は、遠隔ユーザーによるニアエンドROI制御の承認を要求するためにユーザーインタフェース42を介して問い合わせを提示することができる。
【0114】
ローカルユーザーによって承認が与えられた場合は、認証モジュール58は、遠隔ニアエンドROIを処理のためにROIコントローラ52に渡す。承認が与えられない場合は、ROIコントローラ52は、ローカルニアエンドROIを処理する。いずれの場合においても、ROI認識映像符号器46は、選択されたROIを用いて、ニアエンド映像においてROI内にあるMBを優先的に符号化し、符号化されたニアエンド映像を遠隔受信者デバイス14に送信する(166)。幾つかの場合においては、認証モジュール58は、ローカルユーザーと遠隔ユーザーとの間だけでなく、可能なことに幾つかの遠隔ユーザーとの間におけるROIの対立を解決することができる。ローカルユーザーは、ニアエンドROIを制御するためのアクセス権を遠隔ユーザーの1人に能動的に与えるか、又は様々な遠隔ユーザーのROI制御権の優先順位を設定する相対的アクセスレベルを割り当てることができる。典型的には、ROIを制御するためのアクセス権は、1人のユーザー、例えばローカルユーザー又は遠隔ユーザーのうちの1人に対して排他的に与えられる。
【0115】
図19は、ファーエンド映像内のROIマクロブロックの優先的復号を示す流れ図である。図19に示されるように、ファーエンド映像を遠隔送信者デバイス14から受信した時点で(180)、ローカル受信者デバイス12内のROI認識映像復号器48は、ファーエンドROIがローカルユーザーによって指定されているかどうかを決定する(182)。指定されていない場合は、ROI認識映像復号器48は、ファーエンド映像内の全MBを通常どおりに符号化する(184)。しかしながら、ファーエンドROI情報がローカルユーザーによって指定された場合は、ROI認識映像復号器48は、受信されたファーエンド映像内のROI MBを優先的に復号する(186)。ROI MBは、非ROIMBに対して適用される内挿方程式及びエラー隠蔽技術よりも高い品質の内挿方程式又はより強固なエラー隠蔽技術を適用することによって優先的に復号することができる。優先的復号は、より高い品質のデブロッキング又はデリンギングフィルタ等の優先的な後処理を含むことができる。
【0116】
本明細書において説明される技術は、ハードウェア内、ソフトウェア内、ファームウェア内、又はその組合せ内において実装することができる。ソフトウェア内に実装される場合は、前記技術は、実行されたときに上述される方法のうちの1つ以上を実行する命令を含むプログラムコードを具備するコンピュータ読み取り可能媒体によって一部を実現することができる。この場合は、コンピュータ読み取り可能媒体は、同期ダイナミックランダムアクセスメモリ(SDRAM)等のランダムアクセスメモリ(RAM)、読み取り専用メモリ(ROM)、非揮発性ランダムアクセスメモリ(NVRAM)、電気的に消去可能なプログラマブル読み取り専用メモリ(EEPROM)、FLASHメモリ、磁気式又は光学式データ記憶媒体、等を具備することができる。
【0117】
プログラムコードは、1つ以上のプロセッサ、例えば1つ以上のデジタル信号プロセッサ(DSP)、汎用マイクロプロセッサ、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、又はその他の同等の集積回路又は個別論理回路、等であることができる。幾つかの実施形態においては、本明細書において説明される機能は、符号化及び復号のために構成される専用ソフトウェアモジュール又はハードウェア装置内において提供すること、又は結合された映像符号器−復号器(CODEC)内に組み入れることができる。
【0118】
様々な実施形態が説明されている。これらの及びその他の実施形態は、上記の請求項の適用範囲内である。
【図面の簡単な説明】
【0119】
【図1】ROI認識映像符号器−復号器(CODEC)を組み入れた映像符号化及び復号システムを示したブロック図である。
【図2】無線通信デバイスと関連するディスプレイ上において提示された映像シーン内におけるROIの定義を示した図である。
【図3】ROI認識CODECを組み入れた通信デバイスを示すブロック図である。
【図4】ROI認識CODECを有し、ROI抽出モジュールをさらに組み入れた他の通信デバイスを示すブロック図である。
【図5】中間抽出サーバーを介しての分散型ROI抽出を示すブロック図である。
【図6】複数のビデオテレフォニーセッションに関する分散型ROI抽出を示すブロック図である。
【図7A】ユーザーによる選択のための予め定義されたROIパターンを示した図である。
【図7B】ユーザーによる選択のための予め定義されたROIパターンを示した図である。
【図7C】ユーザーによる選択のための予め定義されたROIパターンを示した図である。
【図7D】ユーザーによる選択のための予め定義されたROIパターンを示した図である。
【図8】遠隔送信者デバイスにおけるニアエンド映像の優先的ROI符号化を制御するための受信者デバイスにおけるROI情報の生成を示した流れ図である。
【図9】送信者デバイスにおけるニアエンド映像の優先的ROI符号化に関する受信者デバイスからのROI情報の処理を、ROI追跡と組み合わせて示した流れ図である。
【図10】送信者デバイスにおけるニアエンド映像の優先的ROI符号化に関する受信者デバイスからのROI情報の処理を、ユーザー認証と組み合わせて示した流れ図である。
【図11】予め定義されたROIパターンの選択を示した流れ図である。
【図12】ROIテンプレートの拡大及び縮小による表示された映像シーン内におけるROIパターンの定義を示した図である。
【図13】ROIテンプレートのドラッグによる表示された映像シーン内におけるROIパターンの定義を示した図である。
【図14】タッチ画面上においてスタイラスを用いてROIエリアを描くことによる表示された映像シーン内におけるROIパターンの定義を示した図である。
【図15】動的に抽出及び追跡される指定のROIオブジェクトを有するドロップダウンメニューを用いることによる表示された映像シーン内におけるROIパターンの定義を示した図である。
【図16】図7A乃至7Dに示されるように、予め定義されたROIパターンにマッピングされた指定のROIオブジェクトを有するドロップダウンメニューを用いることによる表示された映像シーン内におけるROIパターンの定義を示した図である。
【図17】ROI記述インタフェースを用いることによる表示された映像シーン内におけるROIパターンの定義を示した流れ図である。
【図18】送信者デバイスと受信者デバイスとの間におけるROIの対立の解決を示した流れ図である。
【図19】ファーエンド映像内におけるROIマクロブロックの優先的復号を示した流れ図である。
【技術分野】
【0001】
本発明は、米国仮特許出願番号60/660,200(出願日:2005年3月9日)、及び"REGION-OF-INTEREST EXTRACTION FOR VIDEO TELEPHONY"(ビデオテレフォニーに関する関心領域抽出)という題名を有する係属中の米国特許出願番号11/182,432(出願日:2005年7月15日)の利益を主張するものである。
【0002】
本開示は、デジタル映像の符号化及び復号に関するものである。本発明は、より具体的には、ビデオテレフォニー(VT)用途に関する関心領域(ROI)の処理技術に関するものである。
【背景技術】
【0003】
デジタル映像シーケンスを符号化するための幾つかの異なる映像符号化基準が確立されている。例えば、ムービング・ピクチャー・エキスパーツ・グループ(MPEG)は、MPEG−1、MPEG−2及びMPEG−4を含む幾つかの基準を策定している。その他の例は、国際電気通信連合(ITU)H.263基準、新規のITU H.264基準を含む。これらの映像符号化基準は、一般的は、データを圧縮して符号化することによって映像シーケンスの向上された送信効率をサポートする。
【0004】
ビデオテレフォニー(VT)は、テレビ会議等の用途をサポートするためにユーザーが映像及び音声情報を共有することを可能にする。典型的ビデオテレフォニー基準は、セッション開始プロトコル(SIP)、ITU H.323基準、及びITU H.324基準によって定義されるビデオテレフォニー基準を含む。VTシステムにおいては、ユーザーは、映像情報を送受信する、映像情報を受信するだけである、又は映像情報を送信するだけである。受信者は、一般的には、送信者から送信された形の受信映像情報を観る。
【0005】
映像情報の選択された部分の優先的符号化が提案されている。例えば、送信者は、受信者に送信するためにより高い品質で符号化すべき関心領域(ROI)を指定することができる。送信者は、遠隔の受信者に対してROIを強調するのを望むことができる。ROIの典型例は人間の顔であるが、送信者は、映像シーン内のその他のオブジェクトに注意を集中するのを望むことができる。ROIを優先的に符号化することにより、受信者は、非ROI領域よりも鮮明にROIを観ることができる。
【発明の開示】
【課題を解決するための手段】
【0006】
本開示は、ビデオテレフォニー(VT)に関する関心領域(ROI)処理技術に関するものである。開示された技術により、ローカル受信者デバイスは、遠隔送信者デバイスによって符号化及び送信された映像、すなわちファーエンド映像、に関するROI情報を定義する。前記ローカル受信者デバイスは、前記ROI情報を前記遠隔送信者デバイスに送信する。前記送信者デバイスは、前記受信者デバイスによって送信された前記ROI情報を用いて、映像シーン内のROIに対して優先的符号化、例えばより高質な符号化又はエラー保護、を適用する。この方法により、受信者デバイスは、送信者デバイスによって符号化されたファーエンド映像のROI符号化を遠隔で制御することができる。
【0007】
受信者は、ファーエンド映像を受信することに加えて、映像、すなわちニアエンド映像を送信するために装備することもできる。従って、VT通信に参加するデバイスは、映像情報の送信者及び受信者の両方として対称的に行動することができる。各デバイスは、受信者として行動し、送信者としての遠隔デバイスによって符号化された映像に関するファーエンドROI情報を定義することができる。さらに、各デバイスは、送信者として行動し、受信者としての他方のデバイスに送信される映像情報に関するニアエンドROI情報を定義することができる。送信者デバイス又は受信者デバイスは、ROI映像符号化の遠隔制御をサポートするために他のデバイスによって提供されるROI情報を処理することができるという意味で「ROI認識」と呼ぶことができる。
【0008】
ファーエンドROI情報は、受信者が受信された映像シーン内のオブジェクト又は領域をより鮮明に観るために送信者デバイスによる遠隔ROI符号化を制御することを可能にする。ニアエンドROI情報は、送信者が送信された映像シーン内のオブジェクト又は領域を強調するためにローカルROI符号化を制御することを可能にする。従って、送信者によるROIの優先的符号化は、受信者又は送信者によって生成されたROI情報に基づくことができる。さらに、受信者デバイスは、エラー隠蔽技術、デブロッキング技術又はデリンギング技術、等のより高質の後処理を適用することによって、ROI情報に基づいてROIを優先的に復号することができる。
【0009】
本開示は、ROI処理を容易にするために、ROIの選択、ROIマッピング、ROI抽出、ROIシグナリング、ROI追跡、及び送信者デバイスによるROI符号化の遠隔制御を可能にするための受信者デバイスのアクセス認証に関する技術をさらに企図している。ROIの選択は、予め定義されたROIパターン、口頭又はテキストによるROI記述(description)、又はユーザーによるROI描写に依存することができる。ROIマッピングは、選択されたROIパターンをROIマップに変換することを含み、前記ROIマップは、映像符号器によって用いるのに適したマクロブロック(MB)マップの形態をとることができる。
【0010】
ROIシグナリングは、受信者デバイスから送信者デバイスへのROI情報のインバンド又はアウトオブバウンドシグナリングを含むことができる。ROI追跡は、ROIの動きに応じたROIマップの動的調整を含む。アクセス認証は、ROIの遠隔制御を目的として、及びローカルユーザーと遠隔ユーザーとの間における又は複数の遠隔ユーザー間におけるROI制御の対立の解決策として、アクセス権及びアクセスレベルを受信者デバイスに与えることを含むことができる。
【0011】
ROI抽出は、ユーザーによる関心領域(ROI)の記述を処理して前記記述に基づいて前記ROIを指定する情報を生成することを含む。ニアエンド映像は、前記ROIを指定する前記情報に基づいて符号化することで前記ニアエンド映像の非ROIエリアに対する前記ROIの画質を向上させることができる。前記ユーザーによる記述は、テキスト、図形、又は音声に基づくことができる。抽出モジュールは、前記ROI情報を前記ユーザーによる記述から生成するための適切な処理を適用する。前記抽出モジュールは、映像通信デバイスとともにローカルで常駐すること、又はROI抽出用に構成された個別の中間サーバー内に常駐することができる。
【0012】
一実施形態においては、本開示は、ローカルデバイスによって符号化されて遠隔デバイスによって受信されたニアエンド映像内における関心領域(ROI)を指定する情報を前記遠隔デバイスから受信することと、前記ROIに基づいて前記ニアエンド映像を符号化して前記映像の非ROIエリアに対する前記ROIの画質を向上させること、とを具備する方法を提供する。
【0013】
他の実施形態においては、本開示は、遠隔映像通信デバイスに送信されたニアエンド映像内における関心領域(ROI)を指定する情報を前記遠隔映像通信デバイスから受信する関心領域(ROI)エンジンと、前記ニアエンド映像を符号化して前記映像の非ROIエリアに対する前記ROIの画質を向上させる映像符号器と、を具備する映像符号化デバイスを提供する。
【0014】
追加の実施形態においては、本開示は、遠隔デバイスによって送信されてローカルデバイスによって受信されたファーエンド映像内における関心領域(ROI)を指定する情報を生成することと、前記ROIに基づいて前記ファーエンド映像を符号化して前記映像の非ROIエリアに対する前記ROIの画質を向上させる際に使用するために前記情報を前記遠隔デバイスに送信すること、とを具備する方法を提供する。
【0015】
さらなる実施形態においては、本開示は、遠隔デバイスから受信されたファーエンド映像内における関心領域(ROI)を指定する情報を生成する関心領域(ROI)エンジンと、前記ファーエンド映像を前記ROIに基づいて符号化して前記ファーエンド映像の非ROIエリアに対する前記ROIの画質を向上させる際に前記遠隔デバイスによって用いるために前記ROIを指定する情報を前記符号化されたニアエンド映像とともに送信する映像符号器と、を具備する映像符号化デバイスを提供する。
【0016】
他の実施形態においては、本開示は、ローカルデバイスによって生成されたニアエンド映像内における関心領域(ROI)の記述をユーザーから受信することと、前記記述に基づいて前記ROIを指定する情報を生成することと、前記ROIを指定する前記情報に基づいて前記ニアエンド映像を符号化して前記ニアエンド映像の非ROIエリアに対する前記ROIの画質を向上させること、とを具備する方法を提供する。
【0017】
追加の実施形態においては、本開示は、映像符号化デバイスであって、前記デバイスによって符号化されたニアエンド映像内における関心領域(ROI)の記述を受信し、前記記述に基づいて前記ROIを指定する情報を生成する関心領域(ROI)エンジンと、前記ニアエンド映像を符号化して前記映像の非ROIエリアに対する前記ROIの画質を向上させる映像符号器と、を具備する映像符号化デバイス、を提供する。
【0018】
さらなる実施形態においては、本開示は、ニアエンド映像を符号化する第1の映像通信デバイスと、前記第1の映像通信デバイスから前記ニアエンド映像を受信する第2の映像通信デバイスであって、前記第1の映像通信デバイスによって生成された前記ニアエンド映像内における関心領域(ROI)に関するユーザーの記述を生成する第2の映像通信デバイスと、前記第1及び第2の映像通信デバイスと構造的に別個であり、前記記述に基づいて前記ROIを指定する情報を生成する中間サーバーと、を具備し、前記第1の映像通信デバイスは、前記ROIを指定する前記情報に基づいて前記ニアエンド映像を符号化して前記ニアエンド映像の非ROIエリアに対する前記ROIの画質を向上させる、映像符号化システムを提供する。
【0019】
本明細書において説明される技術は、ハードウェア内、ソフトウェア内、ファームウェア内、又はその組合せ内において実装することができる。ソフトウェア内に実装された場合は、前記技術は、実行されたときに本明細書において説明される方法のうちの1つ以上を実行する命令を含むプログラムコードを具備するコンピュータ読み取り可能媒体によって一部を実現させることができる。
【0020】
1つ以上の実施形態の詳細が、添付図面及び以下の説明において示されている。該説明及び図面から、及び請求項からその他の特長、目的、及び利点が明確になるであろう。
【発明を実施するための最良の形態】
【0021】
図1は、ROI認識映像符号器−復号器(CODEC)を組み入れた映像符号化及び復号システム10を示すブロック図である。図1に示されるように、システム10は、第1の映像通信デバイス12と、第2の映像通信デバイス14と、を含む。通信デバイス12、14は、送信チャネル16によって接続される。送信チャネル16は、有線又は無線の媒体であることができる。システム10は、ビデオテレフォニーに関する映像通信デバイス12、14の間における双方向映像送信をサポートする。デバイス12、14は、実質的に対称的に動作することができる。しかしながら、幾つかの実施形態においては、一方又は両方の映像通信デバイス12、14は、ROI認識映像ストリーミングをサポートするために1方向通信のみに関して構成することができる。
【0022】
双方向性の用途に関しては、相互符号化、復号、多重化(MUX)及び逆多重化(DEMUX)コンポーネントをチャネル16の反対側の端部に備えることができる。図1の例においては、映像通信デバイス12は、MUX/DEMUXコンポーネント18と、ROI認識映像CODEC20と、音声CODEC22と、を含む。同様に、映像通信デバイス14は、MUX/DEMUXコンポーネント26と、ROI認識映像CODEC28と、音声CODEC30と、を含む。各CODEC20、28は、他の映像通信デバイス12、14から遠隔で、又は自己の映像通信デバイスからローカルで提供されるROI情報を処理することができるという意味で「ROI認識」である。
【0023】
映像通信デバイス12、14は、映像ストリーミング、ビデオテレフォニー、又は両方のために備えられた無線移動端末又は有線端末として実装することができる。この目的のために、映像通信デバイス12、14は、無線通信をサポートするための適切な送信機、受信機、モデム、及び処理用電子装置をさらに含むことができる。無線移動端末の例は、無線通信能力及び映像符号化及び/又は復号能力を備えた移動無線電話、モバイルパーソナルデジタルアシスタント(PDA)、モバイルコンピュータ、又はその他のモバイルデバイスを含む。有線端末の例は、デスクトップコンピュータ、ビデオ電話、ネットワーク機器、セットトップボックス、双方向型テレビ、等、を含む。どちらの映像通信デバイス12、14も、映像情報を送信するように、映像情報を受信するように、又は映像情報を送受信するように構成することができる。
ビデオテレフォニー用途に関しては、一般的には、デバイス12が映像送信能力及び映像受信能力の両方をサポートするのが望ましい。しかしながら、ストリーミング映像用途も企図されている。ビデオテレフォニー、特に無線通信によるモバイルビデオテレフォニーにおいては、帯域幅が重要な懸念事項である。従って、追加の符号化ビットをROIに選択的に割り当てること、又はその他の優先的符号化ステップは、全体的な符号化効率を維持しながら映像の一部分の画質を向上させることができる。優先的符号化に関しては、追加のビットをROIに割り当てることができ、その一方で減らされた数のビットを非ROI領域、例えば映像シーン内の背景、に割り当てることができる。
【0024】
一般的には、システム10は、ビデオテレフォニー(VT)用途に関する関心領域(ROI)を処理するための技術を採用する。しかしながら、前記技術は、上述されるように、映像ストリーミング用途に対しても応用可能である。例示することを目的として、各映像通信デバイス12、14は、映像情報の送信者及び受信者の両方として動作し、それによってVTセッションへの完全な参加者として動作することができると仮定される。映像通信デバイス12から映像通信デバイス14に送信される映像情報に関しては、映像通信デバイス12が送信者デバイスであり、映像通信デバイス14が受信者デバイスである。逆に、映像通信デバイス14から映像通信デバイス12に送信される映像情報に関しては、映像通信デバイス12が受信者デバイスであり、映像通信デバイス14が送信者デバイスである。ローカル映像通信デバイス12、14によって符号化及び送信される映像情報について論じるときには、前記映像情報は、「ニアエンド」映像と呼ばれる。遠隔映像通信デバイス12、14によって符号化される及び遠隔映像通信デバイス12、14から受信される映像情報について論じるときには、前記映像情報は、「ファーエンド」映像と呼ばれる。
【0025】
開示される技術により、映像通信デバイス12又は14は、受信者デバイスとして動作時には、送信者デバイスから受信されるファーエンド映像情報に関するROI情報を定義する。繰り返しになるが、送信者デバイスから受信される映像情報は、通信チャネルの遠端部に位置する他方の(送信者)デバイスから受信されるという意味で「ファーエンド」映像情報と呼ばれる。同様に、送信者デバイスから受信される映像情報に関して定義されたROI情報は、「ファーエンド」ROI情報と呼ばれる。ファーエンドROIは、一般的には、ファーエンド映像の受信者にとっても最も関心のあるファーエンド映像内の領域を指す。受信者デバイスは、ファーエンド映像情報を復号し、復号されたファーエンド映像を表示デバイスを介してユーザーに提示する。ユーザーは、ファーエンド映像によって提示された映像シーン内のROIを選択する。
【0026】
受信者デバイスは、ユーザーによって選択されたROIに基づいてファーエンドROI情報を生成し、該ファーエンドROI情報を送信者デバイスに送信する。ファーエンドROI情報は、ROI内に常駐するROIマクロブロック(MB)に基づいてROIを定義するROIマクロブロック(MB)マップの形態をとることができる。ROI MBマップは、ROIに含まれているMB(1)及びROIから除外されているMB(0)を簡単に識別するために、ROI内のMBに1のフラグを付け、ROI外のMBに0のフラグを付けることができる。MBは、フレームの一部を形成する映像ブロックである。MBの大きさは、16×16画素であることができる。しかしながら、その他のMBの大きさも可能である。従って、MBは、限定することなしに、MPEG−1、MPEG−2及びMPEG−4、ITU H.263、ITU H.264、又はその他の基準、等の特定の映像符号化基準内において定義されるマクロブロックを含むあらゆる映像ブロックを指すことができる。
【0027】
送信者デバイスは、受信者デバイスによって送信されたファーエンドROI情報を用いることによって、映像シーン内の対応するROIに対して優先的符号化を適用する。特に、ROIに対して追加の符号化ビットを割り当てて減らされた数のビットを非ROI領域に割り当て、それによってROIの画質を向上させることができる。この方法により、受信者デバイスは、送信者デバイスによるファーエンド映像情報のROI符号化を遠隔制御することができる。優先的符号化は、例えばROIエリア内における優先的ビット割当て又は優先的量子化によって、映像シーンの非ROIエリアに対してよりも高い品質の符号化をROIエリアに対して適用する。優先的に符号化されたROIは、受信者デバイスのユーザーがオブジェクト又は領域をより鮮明に観るのを可能にする。例えば、受信者デバイスのユーザーは、顔又はその他の何らかのオブジェクトを映像シーンの背景領域よりも鮮明に観るのを希望することができる。
【0028】
映像通信デバイス12又は14は、送信者デバイスとして動作時には、送信者デバイスによって送信される映像情報に関するROI情報を定義することもできる。繰り返しになるが、送信者デバイスにおいて生成される映像情報は、通信チャネルの近端部において生成されるという意味で「ニアエンド」映像と呼ばれる。送信者デバイスによって生成されたROI情報は、「ニアエンド」ROI情報と呼ばれる。ニアエンドROIは、一般的には、送信者が受信者に対して強調することを希望するニアエンド映像の領域を指す。従って、ROIは、受信者デバイスユーザーの場合はファーエンドROI情報として、送信者デバイスユーザーの場合はニアエンドROI情報として指定することができる。送信者デバイスは、表示デバイスを通じてユーザーにニアエンド映像を提示する。送信者デバイスと関連するユーザーは、ニアエンド映像によって提示された映像シーン内のROIを選択する。送信者デバイスは、ニアエンド映像内のROIが例えば非ROIエリアよりも高い品質の符号化を用いて優先的に符号化されるようにするために、ユーザーによって選択されたROIを用いてニアエンド映像を符号化する。
【0029】
送信者デバイスにおいてローカルユーザーによって選択されたニアエンドROIは、送信者デバイスのユーザーが映像シーン内の領域又はオブジェクトを強調し、それによって前記領域又はオブジェクトに受信者デバイスユーザーの注意を向けさせることを可能にする。顕著なことに、送信者デバイスユーザーによって選択されたニアエンドROIは、受信者デバイスに送信する必要がない。その代わりに、送信者デバイスは、ニアエンド映像が受信者デバイスに送信される前に、選択されたニアエンドROI情報を用いてニアエンド映像をローカルで符号化する。しかしながら、幾つかの実施形態においては、送信者デバイスは、優先的復号技術、例えばエラー隠蔽等のより高い品質のエラー補正又はデブロッキング及びデリンギングフィルタ等の後処理、の適用を可能にするためにROI情報を受信者デバイスに送信することができる。
【0030】
ROI情報が送信者デバイス及び受信者デバイスの両方によって提供される場合は、送信者デバイスは、ニアエンド映像を符号化するために、受信者デバイスからの受信されたファーエンドROI情報又はローカルで生成されたニアエンドROI情報を適用する。送信者デバイス及び受信者デバイスによって提供されたニアエンドROIの選択とファーエンドROIの選択との間においてROIの対立が生じることがある。該対立は、本開示の別の箇所において説明されるように、解決、例えば、ローカルユーザーによる能動的解決又は指定されたアクセス権及びアクセスレベルに従った解決、等を要求する。いずれの場合においても、送信者デバイスは、送信者デバイスによってローカルで又は受信者デバイスによって遠隔で提供されたニアエンドROI情報に基づいて優先的にROIを符号化する。
【0031】
本開示は、ROI処理を容易にするために、ROI選択、ROIマッピング、ROIシグナリング、ROI追跡、及び送信者デバイスによるROI符号化の遠隔制御を許可するための受信者デバイスのアクセス認証に関する技術をさらに企図している。説明されるように、受信者デバイス又は送信者デバイスによって適用される異なるROI選択技術は、予め定義されたROIパターンの選択、口頭又はテキストによるROIの記述、又はユーザーによるROI描画を含むことができる。受信者デバイスにおいては、ROIマッピングは、選択されたファーエンド又はニアエンドROIパターンをROIマップに変換することを含むことができ、前記ROIマップは、マクロブロック(MB)マップの形態をとることができる。ROIシグナリングは、受信者デバイスから送信者デバイスへのファーエンドROI情報のインバンド又はアウトオブバンドのシグナリングを含むことができる。ROI追跡は、ROIの動きに応じて、受信者デバイスによって生成されたファーエンドROIマップ、又は送信者自体によって生成されたローカルニアエンドROIの動的調整を含む。アクセス認証は、遠隔のファーエンドROI制御を目的として、及び受信者デバイスと送信者デバイスとの間におけるROIの制御の対立の解決策として、アクセス権及びアクセスレベルを受信者デバイスに与えることを含むことができる。
【0032】
システム10は、セッション開始プロトコル(SIP)、ITU H.323基準、ITU H.324基準、又はその他の基準に従ったビデオテレフォニーをサポートすることができる。各映像CODEC20、28は、MPEG−2、MPEG−4、ITU H.263、又はITU H.264、等の映像圧縮基準に従って符号化された映像データを生成する。図1においてさらに示されるように、映像CODEC20、28は、各々の音声CODEC22、30と統合することができ、データストリームの音声部分と映像部分を取り扱うための該当するMUX/DEMUXコンポーネント18、26を含む。MUX−DEMUX装置18、26は、ITU H.223マルチプレクサプロトコル、又はその他のプロトコル、例えばユーザーデータグラムプロトコル(UDP)、に準拠することができる。
【0033】
図2は、無線通信デバイス38と関連するディスプレイ36上に提示された映像シーン34内におけるROI32の定義を示す図である。図2の例においては、ROI32は、映像シーン34において提示された人の顔39を含む長方形の領域であるが、該ROIは、改良された又は向上された符号化が希望される画像又はオブジェクトを含むことが可能である。VT用途においては、映像シーン34において提示される人は、典型的には、受信者デバイスとして動作している無線通信デバイス38のユーザーとのテレビ会議の当事者である遠隔送信者デバイスのユーザーになる。ROI32は、遠隔送信者デバイスから送信された映像シーン内におけるROIを定義するという点でファーエンドROIを構成する。本開示により、ファーエンドROI32は、ROI内における映像シーンのエリアの優先的符号化を指定するために送信者デバイスに送信される。この方法により、受信者デバイス38のローカルユーザーは、ファーエンドROI32の画質を遠隔で制御することができる。後述されるように、ファーエンドROI32の大きさ、形状及び位置は、固定又は調整可能であり、様々な方法で定義、記述又は調整することができる。
【0034】
ROI32は、受信者デバイスユーザーが映像シーン34内の人の顔39、等の個々のオブジェクトをより鮮明に観ることを可能にする。ROI32内の顔39は、映像シーン34の背景領域、等の非ROIエリアよりも高い画質で符号化される。この方法により、ユーザーは、顔の表情、唇の動き、目の動き、等をより鮮明に観ることができる。しかしながら、ROI32は、代替として、顔以外のオブジェクトを指定するために用いることができる。概して、VT用途におけるROIは非常に主観的であることが可能であり、ユーザーごとに異なる可能性がある。希望されるROIも、VTがどのように用いられるかに依存する。幾つかの事例においては、VTは、テレビ会議とは対照的に、オブジェクトを観るため及び評価するために用いることができる。
【0035】
例えば、夫は、ギフトショップ又は空港で購入したい贈り物を見せるためにVT用途を用いることができる。夫は、タイムリーな形で及び対話形式で自分の妻からセカンドオピニオンを得るのを希望することができる。このようにすることで、夫は、飛行機がまさに出発しようとしているときに直ちに決定をすることができる。この場合は、ROIは、夫が検討中である贈り物を網羅する領域である。妻(又は夫)がROIを選択するのを可能にすることによって、特定のROIに関してより良い符号化又はより良い品質のサービスを達成させ、それによって妻が贈り物をより鮮明に観ることを可能にすることができる。
【0036】
他の例として、2人以上の技師が、黒板上での様々な方程式又は線図のプレゼンテーション及び解説が関わるVT呼を行うことができる。この場合は、遠隔ユーザーは、例えば方程式の詳細をより鮮明に見るために黒板の一部分をより高い画質で観るのを望むことができる。その目的のため、遠隔ユーザーは、方程式を包含するROIを選択する。さらに、技師が黒板に追記するのに応じて、遠隔ユーザーは、黒板に新たに追記された主題を追跡するためにROIを移動させるのを望むことができる。遠隔ユーザーがROIを指定できることは、技術的な討論における情報交換を大幅に向上させることができる。
【0037】
本明細書において説明されるROI技術は、ROIの映像の品質を向上させるだけでなく、2人のユーザー間における映像での対話も向上させることができる。一般的には、従来のVT用途は、単に2つの1方向の映像送信を結合させるだけであり、対話は声で行われる。従来のVT用途においては、典型的には、映像側での対話は存在しない。受信者デバイスがTV呼中に送信者デバイスから受信される映像コンテンツに対する少なくとも制限された制御を有するのを可能にすることは、増大した映像対話を可能にする。
【0038】
この方法により、VT用途は、受信者デバイスユーザーがROIを選択し、例えばより多くの符号化ビットの割当て、より強力なエラー保護、例えばMB内リフレッシュメント、によってROIの優先的な処理、例えばより高質の符号化、を行うために送信者デバイスにROI情報を送り返すことができるように設計することが可能である。実際上は、ファーエンドROIを指定することによって、受信者デバイスユーザーは、送信者デバイス符号器を遠隔制御することができる。さらに、このファーエンドROI情報は、より良い後処理、例えばエラー隠蔽、デブロッキング又はデリンギングのためにファーエンド映像を受信するデバイス内のROI認識映像復号器によって用いることができる。符号化された映像の受信者による映像符号器の遠隔制御は、遠隔カメラのパン、チルト、ズーム又は焦点を単に制御するのとは異なる。対照的に、遠隔ROI処理のおかげで、ユーザーは、特定の1つの領域又は複数の領域に適用される符号化の質に影響を与えることができる。しかしながら、幾つかの実施形態においては、遠隔カメラ制御は、遠隔映像符号器制御と組み合わせて提供することができる。
【0039】
図3は、ROI認識CODECを組み入れた映像通信デバイス12を示したブロック図である。図3は、図1の映像通信デバイス12を描いているが、映像通信デバイス14は、同様に構築することができる。繰り返しになるが、映像通信デバイス12又は14は、受信者デバイス、送信者デバイス、及び好ましいことに受信者デバイスと送信者デバイスの両方として機能することができる。図3に示されるように、映像通信デバイス12は、ROI認識CODEC20と、映像キャプチャデバイス40と、ユーザーインタフェース42と、を含む。図13ではチャネル16が示されているが、例示を容易にするためにMUX−DEMUX及び音声コンポーネントは省略されている。映像キャプチャデバイス40は、映像通信デバイス12と統合した又は動作可能な形で結合されたビデオカメラであることができる。例えば、幾つかの実施形態においては、映像キャプチャデバイス40は、携帯電話と統合していわゆるビデオカメラフォンを構成することができる。この方法により、映像キャプチャデバイス40は、モバイルTV用途をサポートすることができる。
【0040】
ユーザーインタフェース42は、映像通信デバイス12と統合または動作可能な形で結合させることができる表示デバイス、例えば、液晶ディスプレイ(LCD)、プラズマ画面、プロジェクタディスプレイ、又はその他の表示装置、を含むことができる。表示デバイスは、映像通信デバイス12のユーザーに映像画像を提示する。映像画像は、映像キャプチャデバイス40によってローカルで得られたニアエンド映像、及び送信者デバイスから遠隔送信されたファーエンド映像を含む。さらに、ユーザーインタフェース42は、映像通信デバイス12のユーザーによる情報入力のためのハードキー、ソフトキー、様々なポインティング装置、スタイラス、等を含む様々なユーザー入力媒体のうちのいずれかを含むことができる。幾つかの実施形態においては、表示デバイス及びユーザーインタフェース42のユーザー入力媒体は、携帯電話と一体化することができる。映像通信デバイス12のユーザーは、ファーエンド映像、及びオプションとしてのニアエンド映像を観るためにユーザーインタフェース42に依存する。さらに、ユーザーは、ファーエンドROI、及びオプションとしてのニアエンドROIの定義又は選択に関する情報を入力するためにユーザーインタフェース42に依存する。
【0041】
図3においてさらに示されるように、ROI認識CODEC20は、ROIエンジン44と、ROI認識映像符号器46と、ROI認識映像復号器48と、を含む。ROI認識映像符号器46は、遠隔の受信者デバイスに送信するために映像キャプチャデバイス40から得られたニアエンド映像(「ニアエンド映像」)を符号化する。繰り返しになるが、「ニアエンド」という表現は、映像通信デバイス14等の遠隔映像通信デバイスから受信された「ファーエンド」映像とは対照的に、映像通信デバイス12内においてローカルで生成される映像を指定する。図3の例において、ROI認識映像符号器46は、ニアエンドROIを優先的に符号化するために遠隔受信機(「遠隔ニアエンドROI」)から得られたニアエンドROI情報を使用する。遠隔受信機は、遠隔映像通信デバイス14と関連するユーザーである。
【0042】
遠隔ユーザーの観点からは、遠隔ニアエンドROIは、遠隔ニアエンドROIは、遠隔デバイス14によって送信されるときには遠隔ファーエンドROIであり、受信されるときにはデバイス12のローカルユーザーの観点からは遠隔ニアエンドROIと呼ばれる。すなわち、送信者又は受信者としてのデバイス12、14の観点は、映像及びROIがニアエンド映像又はファーエンド映像のいずれに適用可能であるとみなされるかを決定する。繰り返しになるが、遠隔デバイス14における映像符号化を遠隔制御するローカルデバイス12のユーザーは、ファーエンドROIを指定する。しかしながら、遠隔デバイス14のユーザーは、ファーエンドROIを受信するが、ローカルデバイス14によって符号化されているニアエンド映像に関係するため遠隔ニアエンドROIとみなされる。一般的には、本開示において用いられるラベルの目的上、観点が重要である。
【0043】
オプションとして、ROI認識映像符号器46は、映像通信デバイス14のローカルユーザーから得られたニアエンドROI情報(「ローカルニアエンドROI」)を用いることができる。ローカルニアエンドROIは、符号化されたニアエンド映像の送信者によって生成されるため送信者駆動ROIと呼ばれることもある。ローカルニアエンドROI情報は、ローカル符号器46によって用いられ、典型的には、遠隔デバイス14内の映像復号器が送信者デバイス12のユーザーによって指定されたニアエンドROIに対して優先的復号を適用するように設計されていないかぎり、他方の映像通信デバイス14に送信されない。遠隔ニアエンドROIは、符号化されたニアエンド映像の遠隔受信者によって生成されるため、受信者駆動ROIと呼ぶこともできる。遠隔ニアエンドROIは、映像通信デバイス12によって生成された映像の受信者がROI認識符号器46によるROI符号化を制御することを許可し、ローカルニアエンドROIは、映像通信デバイス12によって生成された映像の送信者がROI認識符号器46によるROI符号化を制御することを許可する。幾つかの場合においては、後述されるように、遠隔及びローカルROIの定義が対立して対立の解決が要求されることがある。
【0044】
ローカル及び遠隔ニアエンドROI情報は、ニアエンドROIマクロブロック(MB)マップ(「ニアエンドROI MBマップ」)としてROI認識符号器46に提供することができる。ニアエンドROI MBマップは、受信者ニアエンドROI又は送信者ニアエンドROIのどちらかに常駐する特定のMBを識別する。ROI認識符号器46は、例えば遠隔映像通信デバイス14において遠隔ユーザーによって観られたときのROIの画質を向上させるために、ニアエンド映像内のROIをより高い品質の符号化、より強力なエラー保護、又はその両方によって優先的に処理する。ROIに関するより良いエラー保護は、無線テレフォニー用途においては特に望ましい。結果的に得られる符号化されたニアエンド映像(「符号化されたニアエンド映像」)は、遠隔デバイス14に送信される。
【0045】
説明されるように、ROI認識映像符号器46は、遠隔映像通信デバイス14から受信されたファーエンド映像に関して映像通信デバイス12のローカルユーザーによって生成されているファーエンドROI情報(「ファーエンドROI」)も送信する。ファーエンドROIは、遠隔映像通信デバイス14によって符号化された映像に関する受信者駆動ROIとして機能する。実際上、映像通信デバイス12によって送信されたファーエンドROI情報は、ROI認識復号器48によって受信された遠隔ニアエンドROIがROI認識映像符号器46を制御するために映像通信デバイス12によって用いられるのとまったく同じように、遠隔映像通信デバイス14によって生成されたファーエンド映像の符号器の少なくとも部分的な制御を許可する。この方法により、各映像通信デバイス12、14は、他方のデバイスによって生成されたファーエンド映像におけるROI符号化に影響を与えることができる。
【0046】
映像通信デバイス12によって送信されたファーエンドROI情報は、インバンド又はアウトオブバンドシグナリング情報として送信することができる。インバンドシグナリングの場合は、ファーエンドROI情報は、遠隔映像通信デバイス14に送信される符号化されたニアエンド映像ビットストリーム内に埋め込むことができる。例えば、MPEG4ビットストリームフォーマットにおいては、ビットストリームを記述する情報を埋め込むために用いることができる“ユーザー_データ”と呼ばれるフィールドが存在する。“ユーザー_データ”フィールド、又はその他のビットストリームフォーマットにおける同様のフィールドは、ビットストリームコンプライアンスに違反せずにファーエンドROI情報を埋め込むために用いることができる。代替として、ROI情報は、暗号法等のいわゆるデータ隠蔽技術によって映像ビットストリーム内に埋め込むことができる。
【0047】
ROI認識映像復号器48は、ユーザー_データフィールド又は遠隔デバイスから着信したファーエンド映像内のその他の場所においてROI情報を求めるように構成される。アウトオブバンドシグナリングの場合は、ITU H.245又はSIP、等のシグナリングプロトコルを用いてファーエンドROI情報を伝達することができる。いずれの場合においても、ファーエンドROI情報は、ROI MBマップ又はファーエンドROIの位置及び/又は大きさを定義する物理的座標の形態をとることができる。復号器48がファーエンド映像ビットストリームをいったん受信した時点で、復号器48は、遠隔送信者デバイスと同意されたフォーマットに基づいてROI情報を検索し、遠隔ニアエンドROIを映像符号器56に提供する前にニアエンドROI制御に関するアクセス許可を得るためにROI情報をアクセス認証モジュール58に渡す。
【0048】
ファーエンド映像内においてROIを優先的に符号化するために遠隔映像符号器を制御することに加えて、ファーエンドROI情報は、ファーエンド映像のROI内におけるMBを優先的に復号するためにローカル映像復号器に適用することができる。例えば、図3においてさらに示されるように、遠隔符号器に送信するためにROIマッパー54によって生成される同じファーエンドROI MBを、ROI認識映像復号器48に提供することが可能である。ROI認識映像復号器48は、遠隔映像通信デバイス14から受信されたファーエンド映像内のMBを優先的に復号するためにROI MBマップを使用する。例えば、ROI認識映像復号器48は、非ROI MBに対するよりも優れた後処理をROI MBに対して適用することができる。追加で、又は代替で、ROI認識映像復号器48は、非ROI MBに対するよりも強固なエラー隠蔽技術をROI MBに対して適用することができる。この方法により、ROI認識映像復号器48は、ローカルユーザーによって生成されたファーエンドROI情報に依存して、向上された画質を得るために着信ファーエンド映像のROI部分を優先的に復号する。
【0049】
ROI認識映像復号器48は、遠隔映像通信デバイス、例えば図1の映像通信デバイス14からの着信ファーエンド映像を受信する。ROI認識映像復号器48は、ファーエンド映像を復号し、復号された映像を表示デバイス上においてローカルユーザーに提示するためにユーザーインタフェース42に提供する。さらに、上述されるように、ROI認識映像復号器48は、遠隔ニアエンドROI情報(「遠隔ニアエンドROI」)を遠隔映像通信デバイス14から受信する。ROI認識映像復号器48によって受信されるニアエンドROI情報は、映像通信デバイス12によって送信された映像内においてROIを指定するために遠隔映像通信デバイス14のユーザーによって生成される。上述されるように、ROI認識映像復号器48によって受信された遠隔ニアエンドROI情報は、映像通信デバイス12によって生成されたニアエンド映像内のROIを優先的に符号化するようにROI認識映像符号器46を遠隔制御するために用いられる。遠隔ニアエンドROIは、上述されるように、インバンド又はアウトオブバンドシグナリング技術によって送信される。
【0050】
図3をさらに参照し、ROI認識映像符号器46及びROI認識映像復号器48は、ROIエンジン44と相互に作用する。ROIエンジン44は、映像キャプチャデバイス40からのニアエンド映像ビットストリームの符号化及び送信のためにローカル及び遠隔ニアエンドROI情報を処理する。さらに、ROIエンジン44は、符号化及び遠隔映像通信デバイス14への送信のためにユーザーインタフェース42を介して提供されたファーエンドROI情報を処理する。ROIエンジン44は、ROIコントローラ52と、ROIマッパー54と、ROI追跡モジュール56と、認証モジュール58と、を含む。幾つかの実施形態においては、ROI追跡モジュール56及び認証モジュール58は、オプションであることができる。
【0051】
ROI認識映像符号器46、ROI認識映像復号器48、ROIコントローラ52、ROIマッパー54、ROI追跡モジュール56及び認証モジュール58は、個別の機能モジュールとして又は各モジュールに属する機能を包含するモノリシックモジュールとして、様々な方法で形成することができる。いずれの場合においても、ROIエンジン44、映像符号器46及び映像復号器48を含むROI認識CODEC20の様々なコンポーネントは、ハードウェア、ソフトウェア、ファームウェア、又はその組合せ内において実現させることができる。例えば、該コンポーネントは、1つ以上のマイクロプロセッサ又はデジタル信号プロセッサ(DSP)、1つ以上の特定用途向け集積回路(ASIC)、1つ以上のフィールドプログラマブルゲートアレイ(FPGA)、又はその他の同等の集積回路又は個別論理回路において実行するソフトウェアプロセスとして動作することができる。ソフトウェア内に実装する場合は、これらの技術は、部分的には、プロセッサ又はDSPにおいて実行された時に上述される方法のうちの1つ以上を実施する命令を含むプログラムコードを具備するコンピュータ読み取り可能媒体によって実現させることができる。
【0052】
動作上は、映像通信デバイス12のユーザーは、ユーザーインタフェース42と関連づけられた表示デバイス上で観るために、映像キャプチャデバイス40によって生成されたニアエンド映像又はROI認識映像復号器48によって復号されたファーエンド映像のいずれかを選択する。幾つかの実施形態においては、ピクチャインピクチャ(PIP)機能は、ユーザーがニアエンド映像とファーエンド映像を同時に観ることを許可することができる。ROIの定義を目的としてニアエンド映像又はファーエンド映像を観るために、ユーザーは、ユーザーインタフェース42を操作してROI定義モードを呼び出すことができる。デフォルト時は、映像通信デバイス12は、ROIを考慮せずに映像の符号化及び復号を処理することができる。ユーザーは、ROI定義モードに入ることによって、映像通信デバイス12のROI認識符号化及び復号の側面を起動させる。代替として、ROI認識符号化及び復号は、デフォルトモードであることができる。
【0053】
ファーエンド映像が提示された時点で、ユーザーは、以下においてさらに詳細に説明される様々な技術のうちのいずれかを用いてファーエンド映像内のROIを指示する。ファーエンドROIは、映像シーン内において、ユーザーにとって関心がありより高い画質が希望される領域又はオブジェクトを強調する。ユーザーインタフェース42は、ユーザーによる入力に基づいてファーエンドROI指示を生成する。ROI情報は、映像通信デバイス14への送信のためのファーエンドROI情報を生成するためにROIエンジン44によってさらに処理することができる。
【0054】
ユーザーは、代替として、ROIの定義に関して映像キャプチャデバイス40から得られたニアエンド映像を選択することができる。ニアエンド映像が提示された時点で、ユーザーは、オプションとして、ファーエンド映像におけるROI指示に関して用いられるのとの同様の又は同一の技術を用いてニアエンド映像内のROIを指示することができる。ニアエンドROI又はファーエンドROIは、最初はVT呼開始時に又はVT呼の進行中のいずれかの時点において指定することができる。幾つかの実施形態においては、最初のROIは、ローカルユーザー又は遠隔ユーザーによって更新すること、又はROI追跡モジュール56によって自動的に更新することができる。ROIが自動的に更新される場合は、ユーザーがROI情報を入力し続ける必要がない。代わりに、ROIは、ユーザーがROIを変更又は中止するまでユーザーによる最初の入力に基づいて維持される。
【0055】
ユーザーインタフェース42は、ユーザーによって提供された指示に基づいてローカルニアエンドROI指示を生成する。ニアエンドROI指示は、ファーエンドROI指示と同様に、ROIエンジン44によってさらに処理することができる。ニアエンドROI指示は、映像シーン内において、ユーザーが遠隔ユーザーに対して強調することを希望する領域又はオブジェクトを例えば向上された画質によって強調する。ローカルユーザーは、ユーザーインタフェース42を介して予め定義されたROIパターンを選択するか又はROIパターンを描くことによってニアエンドROI又はファーエンドROIを選択することができる。ROIパターンを描くことは、スタイラスを用いて自由に描くこと、又はデフォルト時のROIパターンの大きさ又は位置を変えることを含むことができる。
【0056】
図3の例においては、ユーザーインタフェース42は、提供された場合は、ローカルニアエンドROI指示及びファーエンドROI指示の両方を、ROIエンジン44内のROIコントローラ52に提供する。さらに、ROIコントローラ52は、認証モジュール58を介して遠隔ニアエンドROIをROI認識映像復号器48から受信する。特に、ROI認識映像復号器48は、遠隔ニアエンドROI情報の存在を、受信されたファーエンド映像ストリーム内において、又はアウトオブバンドシグナリングを介して検出し、遠隔ニアエンドROI情報を認証モジュール58に提供する。ローカルニアエンドROI及び遠隔ROIの指示は、各々のニアエンド映像又はファーエンド映像の映像フレーム内の座標に基づいて表すことができる。ROIの座標は、映像フレーム内のx−y座標であることができる。しかしながら、x−y座標は、説明されるように、符号器46又は復号器48によって使用するためのROI MBマップを生成するために処理される。
【0057】
ROIコントローラ54は、ローカルニアエンドROI、遠隔ニアエンドROI及びファーエンドROIを処理し、これらのROIをROIマッパー54に適用する。ROIマッパー54は、各々のROI座標をマクロブロック(MB)マップに変換する。より具体的には、ROIマッパー54は、ローカルユーザーによって指示されたファーエンドROIに対応するファーエンド映像内のMBを指定するファーエンドMBマップを生成する。さらに、ROIマッパー54は、ローカルニアエンドROI、遠隔ニアエンドROI、又は両方の組合せのいずれかに対応するニアエンド映像内のMBを指定するニアエンドROI MBマップを生成する。
【0058】
予め定義されたROIパターンに関しては、ROIマッピングは直接的である。各予め定義されたROIパターンは、同じく予め定義された指定のMBマッピングを有することができる。しかしながら、描かれた、位置又は大きさが変更されたROIパターンに関しては、ROIマッパー54は、ユーザーによって指定されたROIパターンの座標に最も一致するMB境界を選択する。例えば、指定されたROIがMB内を横切る場合は、ROIマッパー54は、該当するMBの外縁又は内縁のいずれかにROI境界を設定する。換言すると、ROIマッパー54は、ROI内に完全に入っているMBのみをROI MBマップに含めるように又はROI内に一部分が入っているMBも含めるように構成することができる。いずれの場合においても、ROIは、指定されたROIに最も近似する一組の全MBを含む。繰り返しになるが、映像符号器46又は映像復号器48は、MBレベルで動作し、一般的には、MBマップへのROIの変換を要求する。個々のMBをROI内に含めるか又はROIから除外するか指定することによって、ROI MBマップは、不規則な、すなわち長方形でない形状を有するROIの定義を可能にする。
【0059】
ROI認識映像符号器46は、ファーエンドROI MBマップを符号化されたニアエンド映像内において又はアウトオブバンドシグナリングによって遠隔映像通信デバイス14に送信する。ニアエンドROIMBマップは、遠隔映像通信デバイス14には送信されない。代わりに、ニアエンドROI MBマップは、ニアエンド映像内の指定されたMBを遠隔映像通信デバイス14に送信する前により高い品質の符号化又はより強力なエラー保護によって優先的に符号化するためにROI認識映像符号器46によって用いられる。従って、ROI認識映像符号器46は、ファーエンドROI情報に加えて、優先的に符号化されたROIを有する符号化されたニアエンド映像を遠隔映像通信デバイス14に送信する。
【0060】
ROI追跡モジュール56は、ニアエンド映像のROI領域の変化を追跡する。このVTアプリケーションが例えばモバイル映像通信デバイス内に常駐する場合は、ユーザーは、随時移動することができ、その結果前回に指定されたROIに対するユーザーの位置が変化する。さらに、ユーザーの位置が安定しているときでも、ROI内のその他のオブジェクトは、ROI領域から出ることができる。例えば、湖上のボートは、波の動きに応じて上下左右に動く可能性がある。移動が生じたときにユーザーがROIを再定義する必要がないようにするために、ROI追跡モジュール56は、ROI領域内のオブジェクトを自動的に追跡するために提供することができる。
【0061】
図3の例においては、ROI追跡モジュール56は、ROI認識映像符号器46によって生成された符号化されたニアエンド映像から動き情報を受け取る。動き情報は、符号化されたニアエンド映像内のMBに関する動きベクトルの形態をとることができ、ROIマッパー54によるROI MBマップの定義の閉ループ制御を可能にする。動き情報に基づき、ROI追跡モジュール56は、ニアエンドROI MBマップの増分的位置調整を生成し、該調整をROIマッパー54に提供する。位置調整は、MBがROIに含められるか又はROIから除外されるかの状態の変化の形であることができる。
【0062】
ROI MBマップ内におけるMBの状態は、動き情報がROIの実質的な移動を示す場合は変化させることができる。典型的には、MBに関する状態変化は、ROIの外境界において生じる。位置調整に応じて、ROIマッパー54は、ニアエンドROI MBマップによって指定されたROIをシフトさせ、ROI位置が符号化されたニアエンド映像内での動きにフレームごとに適応するようにする。ROI追跡モジュール56及びROIマッパー54は、互いに協力し、映像シーン内において動きが検出されるのに応じて自動的にROIの位置を調整する。この方法により、ROIエンジン44は、ROI内において移動中のオブジェクトを追跡するようにROIを調整する。
【0063】
認証モジュール58は、個々のユーザーの権利及び複数のユーザー間における権利の優先度を含む遠隔ユーザーのROI権利を解決するために機能する。ROI認識映像復号器48が遠隔ニアエンドROIを遠隔映像通信デバイス14から受信すると、ROI認識映像復号器48は、遠隔ニアエンドROIをROIエンジン44に提供する。しかしながら、幾つかの事例においては、遠隔ユーザーによって指定された遠隔ニアエンドROIは、ローカルユーザーによって指定されたローカルニアエンドROIと対立する可能性がある。例えば、ローカルユーザー及び遠隔ユーザーは、映像シーン内において重なるROI又は完全に異なるROIを指定することができる。この場合は、ROIの対立を解決するために認証モジュール58を提供することができる。
【0064】
認証モジュール58は、幾つかの実施形態においては、いずれのニアエンドROI情報(ローカル又は遠隔)を所定の時点において使用すべきであるかを調整するためのいわゆる「マスター−スレーブ」メカニズムを適用することができる。特に、送信者が受信者駆動ROI情報を受信する前には、送信者はニアエンドROIマスターであり、自己のニアエンドROIの制御を有する。換言すると、遠隔ニアエンドROIが映像通信デバイス12において受信される前には、ローカルユーザーがニアエンドROIの制御を有する。このため、遠隔ユーザーはニアエンドROI「スレーブ」であり、マスター、すなわちローカルユーザーがニアエンドROIを制御するためのアクセス権を与えないかぎりニアエンドROIの制御を有さない。
【0065】
ローカルユーザーが遠隔ユーザーにアクセス権を与えた時点で、ローカルユーザーはもはや自己のニアエンドROIを制御しない。代わりに、映像通信デバイス14と関連する遠隔ユーザーは、映像通信デバイス12によって生成されたニアエンド映像に関するニアエンドROIの制御を得て、ニアエンドROIのマスターになる。遠隔ユーザーは、ローカルユーザーがアクセス特権を明示で取り消すか又は遠隔ユーザーによるアクセスをその他の方法で拒否するまで、又は遠隔ユーザーがROIの選択を中止するまで制御を保持することができ、前記取り消すか拒否した場合は、マスターROI制御は、ローカルユーザーに戻ることができる。
【0066】
ROI認識映像復号器48が、存在する場合に、符号化されたファーエンド映像を受信した時点で、ROI認識映像復号器48は、送信者と合意されたフォーマットに基づいて映像ビットストリームから遠隔ニアエンドROI情報を検索する。繰り返しになるが、ニアエンドROI情報は、符号化されたファーエンド映像内に埋め込むこと又はアウトオブバンドシグナリングによって送信することができる。いずれの場合も、ROI認識映像復号器48は、ROIコントローラ52及びROIマッパー54を介して、遠隔ニアエンドROIがROI認識映像符号器46に送信される前にアクセス許可を得るために遠隔ニアエンドROIを認証モジュール58に渡す。認証モジュール58は、符号化プロセスがローカルユーザーによる認証のないユーザーによって制御できないように特定のユーザーにアクセス権を限定する。
【0067】
認証モジュール58は、1人以上の遠隔ユーザー間においてアクセス権及びアクセスレベルを与える及び管理するように構成することができる。例えば、ローカルユーザーは、選択された遠隔ユーザーにアクセス権を与えることができる。従って、ローカルユーザーは、いくつかの遠隔ユーザーがニアエンドROIを制御するのを許可し、その他の遠隔ユーザーがニアエンドROIを制御するのを禁止することができる。さらに、ローカルユーザーは、相対的なアクセスレベル、又は優先権を遠隔ユーザーに割り当てることができる。この方法により、ローカルユーザーは、複数の遠隔ユーザーがROI制御を同時に要求した場合にニアエンドROIを制御する上で幾つかの遠隔ユーザーがその他の遠隔ユーザーに対する優先権を有することができるように、遠隔ユーザー間でのアクセスレベル階層を指定することができる。例えば、複数の遠隔ユーザーは、複数の当事者によるテレビ会議中にROI制御を同時に要求することができる。このような場合は、ROI制御は、典型的には、1人のユーザー、すなわちローカルユーザーに対して、又はローカルユーザーによって制御が与えられている場合は遠隔ユーザーのうちの選択された1人の遠隔ユーザーに対して排他的に与えられる。
【0068】
幾つかの実施形態においては、認証モジュール58は、ローカル映像通信デバイス12がROI認識映像処理を可能にする能力を有するかどうかを決定するための資源モニタリングを行う責任を有することも可能である。ローカルデバイスが所定の時点において遠隔ROI制御をサポートする上で又は特定の型のROI要求に応える上で十分な処理資源を有していない場合は、認証モジュール58は、遠隔ROI制御アクセス権を取り消すか又はROI要求を拒否する。一例として、通信チャネルによって課された帯域幅に関する制限、又はローカルな処理負荷は、遠隔ROI制御が拒否されることになる可能性がある。他の例として、該制限は、予めコンフィギュレーションされたROIパターンの使用を許可することができるが、描かれた又は記述されたROIパターンの使用は許可できない場合がある。認証モジュール58は、遠隔デバイスに送信するために発信される符号化されたニアエンド映像内に状態メッセージを埋め込むことによってROI決定を遠隔デバイスに通知することができる。
【0069】
さらに、個々の遠隔ユーザーには、遠隔ユーザーがニアエンドROIを制御することができる度合いを制御するための異なるアクセスレベルを与えることができる。例えば、遠隔ユーザーは、ローカルユーザーの承認を得ることを条件として一組の予め定義されたROIパターンを選択すること、特定のROI位置又は大きさ、又はROIを指定することに制限することができる。このため、認証モジュール58は、遠隔ユーザーによるニアエンドROIの制御を自動的に解決すること又はローカルユーザーとの対話によってニアエンドROI制御の能動的な承認について交渉することができる。例えば、遠隔ユーザーがニアエンドROIを制御するためのアクセスを要求したときには、認証モジュール58は、遠隔ユーザーによるROI制御の承認を要求するための問い合わせをユーザーインタフェース42を介してローカルユーザーに行うことができる。
【0070】
認証モジュール58は、様々な方法のうちのいずれかの方法で遠隔ユーザーに関するアクセスレベルを追跡することができる。上述されるように、ローカルユーザーは、遠隔ユーザーからのニアエンドROI制御要求を能動的に承認すること、及び遠隔ユーザーに与えられたアクセスレベルを能動的に制御することができる。代替として、ローカルユーザーは、アクセス権又はアクセスレベルを含む遠隔ユーザー関連情報を格納するアドレスブックを映像通信デバイス12のメモリ内に維持することができる。アドレスブックは、遠隔ユーザー及び関連するアクセスレベルのリストを有するデータベースの形態をとることができる。遠隔ユーザーがニアエンドROI制御を要求時には、認証モジュール58は、該当するアクセス権情報をアドレスブックから検索し、ローカルユーザー、遠隔ユーザー、及び可能なことに数人の遠隔ユーザーとの間におけるROI制御を解決するための認証プロセスを自動的に適用する。遠隔ユーザーがアドレスブックに記載されていない場合は、ローカルユーザーは、遠隔ユーザーを適用可能なアクセス権とともにアドレスブックに追加するのを選択することができる。
【0071】
幾つかの場合においては、ローカルユーザーは、アドレスブック内の特定の遠隔ユーザーに関して指定されたデフォルトアクセスレベルをオーバーライドすることができる。例えば、認証モジュール58は、ローカルユーザーがVT呼の進行中に異なる遠隔ユーザー間でのROI制御優先順位を能動的に再設定すること又はローカルユーザーとして排他的にニアエンドROIの制御を再取得するために介入することを許可することができる。アドレスブックを維持する際又はROI制御要求を能動的に管理する際におけるローカルユーザーと認証モジュール58との間における対話は、図3においてはアクセス制御情報によって表されている。
【0072】
遠隔ユーザーに関する自動化された又は能動的なニアエンドROI制御承認が行われた時点で、認証モジュール58は、ROIマッパー54による処理及びマッピングのために遠隔ニアエンドROIをROIコントローラ52に渡す。代替として、ROIコントローラ52は、遠隔ニアエンドROIが提供されないか又はローカルユーザーが遠隔ユーザーを排除してニアエンドROIを制御することを選択している場合には、ローカルユーザーによってユーザーインタフェース42を介して提供されたローカルニアエンドROIを処理する。
【0073】
認証モジュール58は、ローカルユーザーと遠隔ユーザーとの間におけるROIの対立を解決するために機能する。デフォルト時には、認証モジュール58は、ローカルユーザーがニアエンドROI制御を有するマスター−スレーブ概念を適用する。最高レベルのアクセス権が遠隔ユーザーに与えられた時点で、遠隔ユーザーは、映像通信デバイス12のROI認識映像符号器46からニアエンドROI選択に関する全制御を得る。その他の場合は、ローカルユーザーは、遠隔ユーザーによって行われたあらゆるニアエンドROI選択をオーバーライドするニアエンドROI制御を有する。
【0074】
遠隔ユーザーに対してアクセス権を与えることができる場合でも、遠隔ユーザーのアクセス権は通常はローカルユーザーのアクセス権よりも低いレベルであるため、ニアエンドROI制御においてはローカルユーザーが優先される。従って、ローカルユーザーがニアエンドROIを指定することを選択した場合は、遠隔ユーザーによって行われたいずれのニアエンドROI選択も無視されることになる。他方、ローカルユーザーがニアエンドROIを指定しない場合は、遠隔ユーザーに割り当てられたアクセス権のレベルが有効であり、遠隔ユーザーは、ニアエンドROIを制御することができる。しかしながら、上述されるように、ローカルユーザーは、デフォルトのマスターとスレーブの関係をオーバーライドして最高レベルのアクセス権をローカルユーザーに与えることを依然として選択することができる。
【0075】
図4は、ROI認識CODECを有し、ROI抽出モジュール60をさらに組み入れた他の映像通信デバイス12’を示したブロック図である。図4の映像通信デバイス12’は、図3の映像通信デバイス12とほぼ同一である。しかしながら、映像通信デバイス12’は、ユーザーからの入力に基づいてローカルニアエンドROI及びファーエンドROIを形成するためのROI抽出モジュール60をさらに含む。予めコンフィギュレーションされたROIパターンの選択を単純に処理するか又はユーザーがデフォルトのROIを描くこと、又は位置又は大きさを変更することを許可することに加えて、ROI抽出モジュール60は、ローカルユーザーが口頭又はテキストによるROIの記述によってROIを指定することを許可する。特に、ROI抽出モジュール60は、ローカルユーザーによって提供されたROI記述に基づいてローカルニアエンドROI又はファーエンドROIを生成する。
【0076】
ROI記述例は、「顔」、「動いているオブジェクト」、「唇」、「人間」、「背景」、等の言葉をテキスト又は口頭で入力することを含む。これらのオブジェクトの優先的符号化が非常に望ましいことがある。例えば、唇又は顔の優先的符号化は、顔の表情、口の動き、等をより良く表すことができる。テキストによる入力は、ユーザーインタフェース42によって提示されたメニューから入力又は選択することができる。口頭による入力は、映像通信デバイス12’と関連するマイクに話すことによって提供することができる。各場合において、ローカルユーザーは、ROIを選択または描く代わりにROIを「記述」する。ROI抽出モジュール60は、該当するニアエンド又はファーエンド映像シーン内における一組の座標に記述を変換する。口頭によるROIの記述が用いられる場合は、ユーザーインタフェース42又はROI抽出モジュール60は、従来の音声認識能力を組み入れることができる。特に、ROI抽出モジュール60は、1つ以上の認識された言葉に基づいてROIを指定する情報を生成することができる。
【0077】
ROI抽出モジュール60は、希望されるROIを検出するように構成された従来の予符号化処理アルゴリズムの適用によって自動的にROI座標を選択する。特に、ROI抽出モジュール60は、映像ROI処理における当業者に知られている従来の技術に従って顔の検出、特徴の抽出、オブジェクトの分割、又は追跡に関するアルゴリズムを適用することができる。例えば、ROI抽出モジュール60は、映像入力データの画素のルーメン値又は彩度値に基づくROIの識別に依存する従来の技術を適用することができる。
【0078】
従来の顔検出方式は、典型的には、顔の画素と顔以外の画素を識別するための指標として皮膚の色を用いることを含む。従来の顔検出方式の例は、C.−W.リン、Y.−J.チャン及びY.−C.チェン著の"A low-complexity face-assisted coding scheme for low bit-rate video telephony"(低ビットレートビデオテレフォニーに関する低複雑さの顔に基づく方式)、IEICE Trans. Inf. & Syst., vol. E86-D, no. 1, Jan. 2003, pp. 101-108において、及びD.チャイ及びK.N.ナン著の"Face segmentation using skin-color map in videophone applications"(ビデオフォン用途における皮膚の色マップを用いた顔の分割)、IEEE Trans. On Circuits and Systems for Video Technology, vol. 9, no. 4, Jun. 1999, pp. 551-564において説明されている。
【0079】
ローカルユーザーが「顔」に基づいてROIを記述時には、ROI抽出モジュール60は、ニアエンド映像又はファーエンド映像を適宜解析して自動的に顔を識別し、ROIとしての識別された顔と関連する座標を指定する。次に、ROI抽出モジュール60は、ROIマッパー54による処理及びマッピングのためにROIコントローラ52に座標を渡す。顕著なことに、ROI抽出モジュール60は、ローカルニアエンドROI記述又はファーエンドROI記述を適宜処理し、該記述を該当する抽出アルゴリズムにマッピングし、該当する予め符号化されたニアエンド映像又は復号されたファーエンド映像を自動的に解析して該当するROIを自動的に抽出する。
【0080】
ROI抽出モジュール60は、自動的なROI検出をサポートするため、ニアエンド映像を映像キャプチャデバイス40から、ファーエンド映像をROI認識映像復号器48から受信する。ROI検出モジュール60は、ユーザーインタフェース42からのローカルニアエンドROI記述又はファーエンドROI記述、及び自動化検出アルゴリズムを用いて、ROIコントローラ52に適用するためのローカルニアエンドROI及びファーエンドROIを適宜生成する。各場合において、ROI抽出モジュール60は、ローカルニアエンドROI記述又はファーエンドROI記述を、該当する記述に最も適合する座標に変換する。この場合は、ユーザーがROIを描く必要がない。さらに、ユーザーは、一組の予め定義されたROIパターンに制限されない。代わりに、ROIコントローラ52は、ニアエンド映像内においてROI記述に合致する該当領域を能動的に検出する。
【0081】
ROIマッパー54は、映像フレーム内の該当するマクロブロック(MB)にROI座標をマッピングし、ニアエンド又はファーエンドROI MBマップを生成する。実際上は、ROIマッパー54は、ROIコントローラ52からのROI座標を、映像符号器46が理解できるフォーマットに変換する。特に、映像符号器46は、MBレベルで、すなわち各MBごとに、符号化を処理するように装備される。その目的のため、ROIマッパー54は、ニアエンド又はファーエンド映像に関するROI MBマップを生成する。ROI MBマップは、指定されたROI内にあるMBを識別し、このため映像符号器46はこれらのMBに対して優先的符号化を適用することができる。
【0082】
ROI記述を処理することに加えて、ROI抽出モジュール60は、ローカルユーザーによって一組の予め定義されたパターンから選択されたROIパターン、又はローカルユーザーによって描かれた、又は位置又は大きさが変更されたROIパターンを処理するために装備される。従って、映像通信デバイス12’は、図3の映像通信デバイス12に関する説明と実質的に同じようにROI情報を生成するが、ローカルユーザーによってテキストで又は口頭で入力されたROI記述を処理するためにROI抽出モジュール60をさらに組み入れることができる。ROI抽出モジュール60は、ローカルユーザーによって使いやすい点で望ましい。しかしながら、幾つかの映像通信デバイスは、ROI抽出モジュール60をサポートする上で不十分な処理力を有している場合がある。従って、ROI抽出モジュール60は、本開示による映像通信デバイスの望ましいがオプションのコンポーネントであることを表す。
【0083】
幾つかの実施形態においては、ROI抽出モジュール60は、ローカルユーザーによってだけでなく遠隔ユーザーによっても生成されるROI記述を処理することができる。この方法により、抽出機能は、幾つかのデバイスにおいてはローカルではなく遠隔で実施することが可能である。例えば、特定の映像通信デバイス14は、デバイス14のユーザーによって提供されたROI記述に関するROI抽出をサポートする上で不十分なローカル資源又は能力を有している場合がある。しかしながら、他の映像通信デバイス12は、ROI抽出に関してより良い装備をすることができる。この場合は、ローカルROI抽出をオフロードするか又は遠隔映像通信デバイスに分散できるようにすることが企図されている。
【0084】
遠隔抽出をサポートするため、ROIの記述は、様々な方法で遠隔デバイスに提供することができる。例えば、遠隔デバイスに送信される音声ストリーム内に口頭による記述を含めることができる。テキストによるROIの記述は、予め定義されたROIパターン又は描かれたROIパターンと同様に、例えば該情報を符号化された映像ストリーム内に埋め込むことによって遠隔デバイスに送信することができる。従って、1つのデバイスから他のデバイスに送信されるROI情報は、予め処理されたROI MBマップの形態、又は、遠隔符号器に適用前に遠隔デバイスにおいて処理することを要求する指示又は記述を含むROIのその他の指示又は記述の形態をとることができる。
【0085】
図5は、中間抽出サーバー61を介した分散型ROI抽出を示すブロック図である。図5に示されるように、映像通信デバイス12、14は、ROIを抽出できるように十分な情報を中間抽出サーバー61に提供することができる。例えば、各デバイス12、14は、各々のローカルニアエンドROI記述、ファーエンドROI記述、符号化された又は生のニアエンド映像、及び符号化されたファーエンド映像を提供することができる。ニアエンドデバイスから符号化されたファーエンド映像を提供することの代替として、ROI抽出サーバー61は、ファーエンドデバイスから直接ファーエンド映像を受信することができる。抽出サーバー61は、この情報を用いて、ファーエンドROI及びローカルニアエンドROIのうちの1つ又は両方を生成し、各々のデバイス12、14に提供する。抽出サーバー61は、通信ネットワーク内のあらゆる場所に配置されたサーバーであることができ、有線媒体、無線媒体、又は両方の組合せによってデバイス12、14に結合させることができる。抽出サーバー61は、映像通信デバイス12、14から遠隔に配置すること又はデバイス12、14のうちの1つと並置することができる。しかしながら、多くの場合は、抽出サーバー61は、遠隔サーバーであることができる。一般的には、抽出サーバー61は、映像通信デバイス12、14とは構造的に異なる。
【0086】
抽出サーバー61は、抽出モジュール60とほとんど同じように機能するが、遠隔の分散された形で動作することができ、このためROI抽出はデバイス12、14内においてローカルで行う必要がない。この方法により、より大きい処理力を有することができる異なるデバイスにROI抽出処理コストを分散させることができる。ROI抽出モジュール60と同様に、抽出サーバー61は、ユーザーによる口頭、テキスト又は図形での記述、等の異なる型のROI記述を処理することができる。その目的のため、ROI抽出サーバー61は、これらの記述を処理するために音声認識能力、等の適切な能力を組み入れることができる。さらに、ROI抽出サーバー61は、映像の解析とROIの抽出を可能にする映像復号能力、及び映像を再符号化するための及び希望される場合はROI情報を埋め込むための符号化能力を備えることができる。
【0087】
図6は、複数のビデオテレフォニーセッションに関する分散型ROI抽出を示すブロック図である。図6の例においては、ROI抽出サーバー61は、複数の映像通信デバイス12A乃至14A、12B乃至14B、12C乃至14D、乃至12N乃至14Nの間におけるVTセッションに関するROI抽出を処理するために動作する。この方法により、ROI抽出サーバー61は、所定の通信ネットワークにおいて実施中の様々なVTセッションをサポートするために複数のROI抽出タスクを並行して実施する。
【0088】
図7A乃至7Dは、ローカル又は遠隔ユーザーによる選択のための予め定義されたROIパターンを示す図である。図7A乃至7DのROIパターンは、例示することが目的であり、制限するものであるとはみなすべきでない。図7Aは、無線通信デバイス38と関連づけられたディスプレイ36において提示された映像シーン34内のROI62を示す。ROI62は、映像シーン34内の実質的な中心に置かれた基本的な長方形である。長方形ROI62の長辺は、映像シーン34内において縦方向に延びている。多くの場合においては、ROI62は、人間の顔、すなわちVT呼に参加している遠隔ユーザーの顔をキャプチャする上で有効である。
【0089】
図7Bは、映像シーン34内において横方向に延びる長辺を有する長方形の形をした他のROI64を示す。ROI64は、映像シーン34内の実質的な中心に置かれており、車両、ボート、製品、プレゼンテーション、等のオブジェクトをキャプチャする上で有効になる。
【0090】
図7Cは、VT呼に参加している遠隔ユーザーの顔及び肩をキャプチャするように設計された形状を有する他のROI66を示す。代替として、ROI66は、例えば1方向の映像ストリーミング用途において、ニュース放送を行っている特派員、集会の司会者、又は会議の講演者の顔と肩をキャプチャすることができる。いずれの場合においても、予め定義されたROI66は、人間のVT参加者又はプレゼンターに焦点を合わせ、その人の肉体的特徴に関する優先的符号化を達成させる。
【0091】
図7Dは、映像シーン34内において並置されている二重の組のROI68、70を示す。図5Dの例においては、ROI68、70は、並んで座っているか又は立っている2人の人の顔をキャプチャする上で有効である。この方法により、顔の表情及び動きに関するより高い画質をサポートするために2人の参加者の顔を優先的に符号化することができる。
【0092】
図7A乃至7Dに描かれた予め定義されたROIパターンは、例示することを目的とするものである。代替の位置又は形状を有するその他の予め定義されたROIパターンを提供することができる。例えば、幾つかのROIパターンは、これらのパターンをMB境界にマッピングできることを条件として丸い又は不規則な形状を有することができる。
【0093】
幾つかの実施形態においては、ユーザーは、選択されたROIパターンの大きさ又は位置を変更するのを許可されることができる。大きさ及び位置を変更するために従来のカーソル及びコーナードラッグ手法を用いることができる。さらに、ROIの大きさの縮尺の再設定を、コーナードラッグによって又は縮尺率を明示で指定することによって達成させることができる。当然のことであるが、ROIが大きくなるのに従い、帯域幅上の制限に起因して優先的符号化度が低下される。従って、幾つかの場合においては、映像通信デバイス12内において最大のROIの大きさを強制することができる。
【0094】
図8は、送信者デバイスにおけるニアエンド映像内での優先的ROI符号化を制御するために受信者デバイスにおいてファーエンドROI情報を生成することを示す流れ図である。図8において描かれたプロセスは、図4の映像通信デバイス12’の図3の映像通信デバイス12内に実装することができる。動作上は、映像通信デバイス12内のROI認識映像復号器48は、映像通信デバイス14、等の遠隔送信者デバイスからのファーエンド映像を復号する(72)(図1)。ファーエンド映像を復号した時点で、受信者デバイス12のユーザーインタフェース42は、ローカルユーザーによって観るためにファーエンド映像を表示する(74)。
【0095】
ローカルユーザーがROIの選択を要求しない場合は(76)、何の行動もとられず、ファーエンド映像の次のフレームが復号される(72)。しかしながら、ROIの選択が要求された場合は(76)、ユーザーインタフェース42は、ローカルユーザーからのファーエンドROI情報を受け入れる(78)。ROIコントローラ52及びROIマッパー54は、協力し合ってファーエンドROI MBマップを生成する(80)。ROI認識符号器46は、符号化されたニアエンド映像内にファーエンドROIMBマップを埋め込み、それによってファーエンド映像を符号化する遠隔送信者デバイス14にファーエンドROIマップを送信する(82)。ファーエンドROI MBマップは、遠隔映像通信デバイス14と関連づけられた符号器が映像通信デバイス12に送信されるファーエンド映像の該当するROI内のMBに優先的符号化を適用するように指定する。
【0096】
図9は、送信者デバイスにおけるニアエンド映像内での優先的ROI符号化のために受信者デバイスからのニアエンドROI情報を処理することを、ROI追跡と組み合わせて示した流れ図である。図9の例においては、ユーザーインタフェース42は、映像キャプチャデバイス40によって生成されたニアエンド映像ストリームを受信し、ニアエンド映像をローカルデバイスに提示する(84)。ローカルユーザー及び遠隔ユーザーのいずれもがニアエンドROIの選択を要求しない場合は(86)、各映像フレーム内の全MBは通常どおりに、すなわちROI内のMBの優先的符号化を行わずに、符号化される。符号化されたニアエンド映像は、遠隔受信者デバイス14に送信される(89)。
【0097】
しかしながら、ニアエンドROIの選択がローカルユーザー又は遠隔ユーザーによって要求された場合は(86)、ROIコントローラ52及びROIマッパー54は、該当するニアエンドROI情報を処理してニアエンドROI MBマップを生成する(90)。ニアエンドROIがローカルユーザー及び遠隔ユーザーの両方によって指定された場合は、認証モジュール58は、対立を解決してROIのうちの1つを優先させるために介入することができる。ニアエンドROI MBマップが受信された時点で(90)、ROI認識映像符号器46は、より高い品質の符号化、より強力なエラー保護又はその両方を適用することによってROI内のMBを優先的に符号化する(92)。
【0098】
追跡モジュール56は、ROI認識映像符号器46によって生成された動き情報をモニタリングすることによってニアエンド映像内のROIの位置を追跡する(94)。ROIのシフトが検出されない場合は(96)は、ニアエンド映像内のROI MBを符号化するために既存のROIマップが適用され、符号化されたニアエンド映像が遠隔受信者デバイスに送信される(102)。ROIのシフトが検出された場合は(96)、映像追跡モジュール56は、ニアエンド映像を符号化する前に動き情報に基づいてROI MBマップを調整する(98)。
【0099】
図10は、送信者デバイスにおけるニアエンド映像内での優先的ROI符号化に関する受信者デバイスからのROI情報の処理を、ユーザー認証と組み合わせて示した流れ図である。図10は、遠隔ユーザーがニアエンドROIを制御するのを許可する際における図3又は図4の認証モジュール58の動作を示し、説明を簡単にするために、ローカルニアエンドROIが指定されていないと仮定する。図10に示されるように、映像通信デバイス12内の映像キャプチャデバイス40によって生成されたニアエンド映像ストリームに関して、認証モジュール58は、遠隔ニアエンドROIが映像通信デバイス14の遠隔ユーザーによって要求されているかどうか(106)を決定する。
【0100】
遠隔ニアエンドROIが要求されておらず(106)、さらにローカルニアエンドROIが指定されない場合は、ニアエンド映像内の全MBが通常どおりに符号化される(110)。しかしながら、遠隔ニアエンドROIが要求された場合は(106)、認証モジュール58は、ニアエンドROIを要求した遠隔ユーザーが認証されるかどうかを次に決定する(108)。特に、認証モジュール58は、映像通信デバイス12内においてローカルで格納されているアドレスブックを参照することによって遠隔ユーザーのアクセス権を自動的に決定することができる。代替として、認証モジュール58は、遠隔ユーザーによるニアエンドROI制御に関するアクセス権の承認又は拒否を得るためにユーザーインタフェース42を介して能動的にローカルユーザーに問い合わせることができる。
【0101】
遠隔ユーザーが認証されない場合は(108)、ニアエンド映像内の全MBが通常どおりに符号化される(110)。しかしながら、遠隔ユーザーが認証される場合は(108)、遠隔ユーザーにニアエンドROI制御が与えられる。この場合は、ROIコントローラ52及びROIマッパー54は、遠隔ユーザーからのニアエンドROI情報を処理し、ニアエンドMBマップを生成する(112)。ROI認識符号器46は、ニアエンドMBマップを用いて、ニアエンドMBマップによって識別されたMBを優先的に符号化する(114)。次に、映像通信デバイス12は、符号化されたニアエンド映像を遠隔映像通信デバイス14に送信する(116)。
【0102】
図11は、予め定義されたROIパターンの選択を示す流れ図である。ROI認識映像復号器48が遠隔映像通信デバイス14から受信されたファーエンド映像をいったん復号した時点で(118)、ファーエンド映像がユーザーインタフェース42を介してローカルユーザーに表示される(120)。ローカルユーザーがROIの選択を要求した場合は(122)、ユーザーインタフェース42は、図7A乃至7Dにおいて示されるROIパターン等の予め定義されたROIパターンのメニューを表示する(124)。代替として、ユーザーは、ROIの記述を提供すること、又はROIパターンを描くこと、位置又は大きさを変更することができる。しかしながら、図11の例においては、動作は、予め定義されたROIパターンの提示に焦点を合わせる。予め定義されたROIパターンがローカルユーザーによって選択された時点で(126)、ROIコントローラ52及びROIマッパー54は、選択されたパターンに基づいてROIMBマップを定義する(128)。ROI認識映像符号器46は、符号化されたニアエンド映像内にROI MBマップを埋め込み、ファーエンド映像内のROIの優先的符号化の際に用いるためにROI MBマップを遠隔映像通信デバイス14に送信する(130)。
【0103】
図12は、ROIテンプレート132の拡大及び縮小による表示された映像シーン34内におけるROIパターンの定義を示す図である。図12は、図2に実質的に対応するが、ユーザーによって大きさを変更することができるROIテンプレート132の提示を示す。図12の例においては、ROIテンプレート132は、ROIテンプレートの角のうちの1つをコーナードラッグして該ROIテンプレートを拡大及び縮小させることによって大きさを変更することができる。コーナードラッグしてROIテンプレート132を拡大させることの結果は、拡大されたROIテンプレート134によって表される。コーナードラッグの結果、ROIテンプレート132の大きさが大きくなるか又は小さくなるが、相対的な長さと幅の比の縮尺は維持する。しかしながら、幾つかの実施形態においては、ユーザーが長さと幅の比の縮尺を変更する一方でROIテンプレートの大きさを大きくするか又は小さくするためにROIテンプレート132の側部をドラッグすることを許可することも可能である。ドラッグは、タッチ画面、又は映像通信デバイス12のユーザーインタフェース42と関連づけられた他のポインティング装置と組み合わせてスタイラスを用いて達成させることができる。その他のポインティング装置は、ジョイスティック、タッチパッド、スクロールホイール、トラックボール、等を含むことができる。
【0104】
図13は、ROIテンプレート132をドラッグすることによる表示された映像シーン内でのROIパターンの定義を示した図である。特に、図13は、ROIテンプレート132を映像シーン34内の他の位置135にドラッグすることによるROIテンプレート132の位置変更を示す。ドラッグは、スタイラスとタッチ画面又はユーザーインタフェース42と関連づけられた他のポインティング装置によって達成させることができる。
【0105】
図14は、タッチ画面上でスタイラス138を用いてROIパターン136を描くことによる表示された映像シーン内でのROIパターンの定義を示した図である。図14の例においては、ROIパターン136は、自由な描画によって生成される。ROIコントローラ52及びROIマッパー54は、互いに協力し、描かれたROIパターンと関連する座標を、ROIパターン136内にほぼ入っている映像シーン34内のMBを識別するMBマップに変換する。図12、13、及び14に示されるROIパターンの定義は、ニアエンド映像又はファーエンド映像内のROIに関して適用することができる。
【0106】
図15は、動的に追跡される指定されたROIオブジェクトを有するドロップダウンメニュー140を用いることによる表示された映像シーン内でのROIパターンの定義を示した図である。図15において示されるように、ユーザーインタフェース42は、「顔」、「唇」、「背景」、及び「動き」、等のROIの記述を提示するドロップダウンメニュー140を提示する。ローカルユーザーは、ドロップダウンメニュー内のエントリのうちの1つを希望されるROIの記述として選択する。前記選択に応じて、ROI抽出モジュール60(図4)は、ニアエンド映像又はファーエンド映像を適宜解析して記述に対応するROIパターンを検出する。ドロップダウンメニュー140の代替として、ユーザーは、ユーザーインタフェース42を介してテキストを入力すること、又は口頭でマイク内にテキストを言うことができる。各場合において、皮膚の色調の検出、オブジェクトの分割、等の従来の特徴検出アルゴリズムを用いて、選択されたROIが該当するROIパターンとマッチングされる。ROIパターンが選択された時点で、ROIコントローラ52及びROIマッパー54は、該当するROI MBマップを生成する。図15のプロセスは、各ROIの記述を対象となる特定の映像シーン内のROIパターンと動的にマッチングしなければならないという意味で「動的」であると呼ばれる。
【0107】
図16は、図7A乃至7Dに示されるように、予め定義されたROIパターンにマッピングされた指定されたROIオブジェクトを有するドロップダウンメニュー142を用いることによる表示された映像シーン内でのROIパターンの定義を示した図である。図16に示されるように、ユーザーインタフェース42は、「単一の顔」、「二重の顔」、「頭/肩」、及び「オブジェクト」、等のROI記述を提示するドロップダウンメニュー142を提示する。ローカルユーザーは、ドロップダウンメニュー内のエントリのうちの1つを希望されるROIパターンとして選択する。前記選択に応じて、ROIコントローラ52は、選択されたROIパターンを、例えば図7A乃至7Dにおいて描かれているような対応する予め定義されたROIパターンとマッチングさせる。従って、図15に示されるROIの記述とは異なり、静的ROIパターンは、映像解析を要求しない。代わりに、ROIコントローラ52及びROIマッパー54は、ドロップダウンメニュー142内の選択項目に対応する予めコンフィギュレーションされたROI MBマップを生成する。繰り返しになるが、ドロップダウンメニュー142の代替として、ユーザーは、ユーザーインタフェース42を介してテキストを入力すること、又は口頭でマイク内にテキストを言うことができる。図15のプロセスは、各ROIパターンが予め定義されたROIパターン及びMBマップに対応するという意味で「静的」であると呼ばれる。
【0108】
図17は、ROI記述インタフェースを用いることによる表示された映像シーン内でのROIパターンの定義を示した流れ図である。図17に示されるプロセスは、図15のドロップダウンメニュー、又はその他の入力媒体とともに用いることができる。図17に示されるように、ROI認識映像復号器48は、遠隔送信者デバイス14から受信されたファーエンド映像を復号する(144)。次に、ユーザーインタフェース42は、ファーエンド映像をローカルユーザーに表示する(146)。ローカルユーザーがファーエンド映像に関するROIの選択を要求しない場合は(148)、遠隔映像通信デバイス14にはROI情報が送信されない。しかしながら、ROIの選択が要求された場合は(148)、ユーザーインタフェース42は、図17のドロップダウンメニュー140、等のROI記述インタフェースを提示する(150)。
【0109】
ローカルユーザーROI記述を受信した時点で(152)、ROIコントローラ52及びROIマッパー54は、前記記述に基づいてROIパターンを選択し(154)、選択されたROIパターンに基づいてROI MBマップを定義する(156)。繰り返しになるが、選択されたROIパターンは、従来の検出技術を用いてファーエンド映像を解析し、ROI記述をファーエンド映像内の特定のMBにマッチングさせることによって決定することができる。ファーエンドROI MBマップが生成された時点で、ROI認識映像符号器12は、ファーエンドROI MBマップを符号化されたニアエンド映像内に埋め込み、ファーエンドROIの優先的符号化のために遠隔映像通信デバイス14に送信する。
【0110】
図18は、送信者デバイスと受信者デバイス12、14との間におけるROIの対立の解決を示した流れ図である。特に、図18は、ローカルユーザーによって指定されたニアエンドROIと遠隔ユーザーによって指定されたニアエンドROIの対立を解決する上での認証モジュール58(図3又は図4)の動作を示す。送信者デバイスにおいてニアエンド映像が生成された時点で(160)、認証モジュール58は、ニアエンドROIがローカルユーザー又は遠隔ユーザーによって要求されているかどうかを決定する(162)。要求されていない場合は、ROIの優先的符号化が行われずに通常どおりに全MBが符号化され(164)、その結果得られた符号化された映像が受信者映像通信デバイス14に送信される(166)。
【0111】
ニアエンドROIが要求される場合は(162)、認証モジュール58は、ローカルユーザーによって指定されたニアエンドROIと遠隔ユーザーによって指定されたROIとの間において対立が存在するかどうかを決定する(168)。遠隔ニアエンドROIが指定されない場合、又はローカルニアエンドROIと遠隔ニアエンドROIが対立しない場合は、認証は、選択されたニアエンドROIを処理のためにROIコントローラ52に渡すことができる。
【0112】
ローカルニアエンドROIが存在せず、遠隔ニアエンドROIが選択されている場合は、認証モジュール58は、遠隔ニアエンドROIを適用するのを許可することができる。代替として、幾つかの実施形態においては、認証モジュール58は、ローカルユーザーとの対話によって又はアドレスブックに記録されているアクセスレベルによって遠隔ユーザーに与えられた明示のアクセスが存在する場合のみに遠隔ニアエンドROIを適用するのを許可することができる。ROIの対立が存在しない場合は、ROIマッパー54は、適用可能なニアエンドROIに基づいてニアエンドMBマップを生成してROI認識映像符号器46に適用する。ROI認識映像符号器46は、ニアエンド映像のROI内のMBを優先的に符号化する(172)。
【0113】
ローカルニアエンドROIと遠隔ニアエンドROIとの間において対立が存在する場合は(168)、認証モジュール58は、例えば映像通信デバイス12内にローカルで格納されているアドレスブックにおいてアクセスレベルが既に割り当てられているかどうかを決定する(174)。アクセスレベルが割り当てられている場合は(174)、認証モジュール58は、アクセスレベルに従ってROIの対立を解決する(176)。例えば、遠隔ユーザーに関する格納されたアクセスレベルは、ローカルユーザーに関するROI制御を遠隔ユーザーに与えるべきであることを示すことができる。アクセスレベルが割り当てられていない場合は(174)、認証モジュール58は、遠隔ROI制御の承認をローカルユーザーに求める(178)。特に、認証モジュール58は、遠隔ユーザーによるニアエンドROI制御の承認を要求するためにユーザーインタフェース42を介して問い合わせを提示することができる。
【0114】
ローカルユーザーによって承認が与えられた場合は、認証モジュール58は、遠隔ニアエンドROIを処理のためにROIコントローラ52に渡す。承認が与えられない場合は、ROIコントローラ52は、ローカルニアエンドROIを処理する。いずれの場合においても、ROI認識映像符号器46は、選択されたROIを用いて、ニアエンド映像においてROI内にあるMBを優先的に符号化し、符号化されたニアエンド映像を遠隔受信者デバイス14に送信する(166)。幾つかの場合においては、認証モジュール58は、ローカルユーザーと遠隔ユーザーとの間だけでなく、可能なことに幾つかの遠隔ユーザーとの間におけるROIの対立を解決することができる。ローカルユーザーは、ニアエンドROIを制御するためのアクセス権を遠隔ユーザーの1人に能動的に与えるか、又は様々な遠隔ユーザーのROI制御権の優先順位を設定する相対的アクセスレベルを割り当てることができる。典型的には、ROIを制御するためのアクセス権は、1人のユーザー、例えばローカルユーザー又は遠隔ユーザーのうちの1人に対して排他的に与えられる。
【0115】
図19は、ファーエンド映像内のROIマクロブロックの優先的復号を示す流れ図である。図19に示されるように、ファーエンド映像を遠隔送信者デバイス14から受信した時点で(180)、ローカル受信者デバイス12内のROI認識映像復号器48は、ファーエンドROIがローカルユーザーによって指定されているかどうかを決定する(182)。指定されていない場合は、ROI認識映像復号器48は、ファーエンド映像内の全MBを通常どおりに符号化する(184)。しかしながら、ファーエンドROI情報がローカルユーザーによって指定された場合は、ROI認識映像復号器48は、受信されたファーエンド映像内のROI MBを優先的に復号する(186)。ROI MBは、非ROIMBに対して適用される内挿方程式及びエラー隠蔽技術よりも高い品質の内挿方程式又はより強固なエラー隠蔽技術を適用することによって優先的に復号することができる。優先的復号は、より高い品質のデブロッキング又はデリンギングフィルタ等の優先的な後処理を含むことができる。
【0116】
本明細書において説明される技術は、ハードウェア内、ソフトウェア内、ファームウェア内、又はその組合せ内において実装することができる。ソフトウェア内に実装される場合は、前記技術は、実行されたときに上述される方法のうちの1つ以上を実行する命令を含むプログラムコードを具備するコンピュータ読み取り可能媒体によって一部を実現することができる。この場合は、コンピュータ読み取り可能媒体は、同期ダイナミックランダムアクセスメモリ(SDRAM)等のランダムアクセスメモリ(RAM)、読み取り専用メモリ(ROM)、非揮発性ランダムアクセスメモリ(NVRAM)、電気的に消去可能なプログラマブル読み取り専用メモリ(EEPROM)、FLASHメモリ、磁気式又は光学式データ記憶媒体、等を具備することができる。
【0117】
プログラムコードは、1つ以上のプロセッサ、例えば1つ以上のデジタル信号プロセッサ(DSP)、汎用マイクロプロセッサ、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、又はその他の同等の集積回路又は個別論理回路、等であることができる。幾つかの実施形態においては、本明細書において説明される機能は、符号化及び復号のために構成される専用ソフトウェアモジュール又はハードウェア装置内において提供すること、又は結合された映像符号器−復号器(CODEC)内に組み入れることができる。
【0118】
様々な実施形態が説明されている。これらの及びその他の実施形態は、上記の請求項の適用範囲内である。
【図面の簡単な説明】
【0119】
【図1】ROI認識映像符号器−復号器(CODEC)を組み入れた映像符号化及び復号システムを示したブロック図である。
【図2】無線通信デバイスと関連するディスプレイ上において提示された映像シーン内におけるROIの定義を示した図である。
【図3】ROI認識CODECを組み入れた通信デバイスを示すブロック図である。
【図4】ROI認識CODECを有し、ROI抽出モジュールをさらに組み入れた他の通信デバイスを示すブロック図である。
【図5】中間抽出サーバーを介しての分散型ROI抽出を示すブロック図である。
【図6】複数のビデオテレフォニーセッションに関する分散型ROI抽出を示すブロック図である。
【図7A】ユーザーによる選択のための予め定義されたROIパターンを示した図である。
【図7B】ユーザーによる選択のための予め定義されたROIパターンを示した図である。
【図7C】ユーザーによる選択のための予め定義されたROIパターンを示した図である。
【図7D】ユーザーによる選択のための予め定義されたROIパターンを示した図である。
【図8】遠隔送信者デバイスにおけるニアエンド映像の優先的ROI符号化を制御するための受信者デバイスにおけるROI情報の生成を示した流れ図である。
【図9】送信者デバイスにおけるニアエンド映像の優先的ROI符号化に関する受信者デバイスからのROI情報の処理を、ROI追跡と組み合わせて示した流れ図である。
【図10】送信者デバイスにおけるニアエンド映像の優先的ROI符号化に関する受信者デバイスからのROI情報の処理を、ユーザー認証と組み合わせて示した流れ図である。
【図11】予め定義されたROIパターンの選択を示した流れ図である。
【図12】ROIテンプレートの拡大及び縮小による表示された映像シーン内におけるROIパターンの定義を示した図である。
【図13】ROIテンプレートのドラッグによる表示された映像シーン内におけるROIパターンの定義を示した図である。
【図14】タッチ画面上においてスタイラスを用いてROIエリアを描くことによる表示された映像シーン内におけるROIパターンの定義を示した図である。
【図15】動的に抽出及び追跡される指定のROIオブジェクトを有するドロップダウンメニューを用いることによる表示された映像シーン内におけるROIパターンの定義を示した図である。
【図16】図7A乃至7Dに示されるように、予め定義されたROIパターンにマッピングされた指定のROIオブジェクトを有するドロップダウンメニューを用いることによる表示された映像シーン内におけるROIパターンの定義を示した図である。
【図17】ROI記述インタフェースを用いることによる表示された映像シーン内におけるROIパターンの定義を示した流れ図である。
【図18】送信者デバイスと受信者デバイスとの間におけるROIの対立の解決を示した流れ図である。
【図19】ファーエンド映像内におけるROIマクロブロックの優先的復号を示した流れ図である。
【特許請求の範囲】
【請求項1】
ローカルデバイスによって符号化されて遠隔デバイスによって受信されたニアエンド映像内において関心領域(ROI)を指定する情報を前記遠隔デバイスから受信することと、
前記ROIに基づいて前記ニアエンド映像を符号化して前記映像の非ROIエリアに対する前記ROIの画質を向上させること、とを具備する、方法。
【請求項2】
前記符号化されたニアエンド映像を前記遠隔デバイスに送信することと、前記遠隔デバイスによって符号化されたファーエンド映像を前記ローカルデバイスにおいて受信すること、とをさらに具備する請求項1に記載の方法。
【請求項3】
前記ROIを指定する前記情報を前記遠隔デバイスから受信された符号化されたファーエンド映像とともに受信することをさらに具備し、前記ROIを指定する前記情報は、前記符号化されたファーエンド映像内に埋め込まれる請求項1に記載の方法。
【請求項4】
前記ROIを指定する前記情報をアウトオブバンドシグナリングによって前記遠隔デバイスから受信することをさらに具備する請求項1に記載の方法。
【請求項5】
前記遠隔デバイスによって符号化されたファーエンド映像を前記ローカルデバイスにおいて受信することと、
前記符号化されたファーエンド映像内においてROIを指定する情報を生成することと、
前記ROI情報を前記符号化されたニアエンド映像とともに前記遠隔デバイスに送信すること、とをさらに具備する請求項1に記載の方法。
【請求項6】
前記遠隔デバイスによって符号化されたファーエンド映像を前記ローカルデバイスにおいて受信することと、
前記遠隔デバイスから受信された前記符号化されたファーエンド映像を復号して前記ファーエンド映像の非ROIエリアに対する前記ファーエンド映像内の前記ROIの画質を向上させること、とをさらに具備する請求項1に記載の方法。
【請求項7】
前記符号化されたファーエンド映像を復号することは、前記ファーエンド映像の非ROIエリアに対してよりも高い品質の後処理又はエラー隠蔽技術を前記ファーエンド映像内の前記ROIに対して適用することを含む請求項6に記載の方法。
【請求項8】
前記ROIを指定する前記情報に基づいて前記ROI内にあるマクロブロック(MB)を識別するマクロブロック(MB)マップを生成することをさらに具備する請求項1に記載の方法。
【請求項9】
前記ニアエンド映像を符号化することは、前記ニアエンド映像の非ROIエリアに対してよりも高い品質の符号化又はエラー保護技術を前記ROIに対して適用することを含む請求項1に記載の方法。
【請求項10】
前記ROIに基づいて前記ニアエンド映像を符号化する前に前記遠隔デバイスと関連する遠隔ユーザーを認証することをさらに具備する請求項1に記載の方法。
【請求項11】
認証することは、前記遠隔ユーザーが前記ROIに基づいて前記ニアエンド映像の符号化を制御する権限を付与されているかどうかを決定することを含む請求項10に記載の方法。
【請求項12】
認証することは、前記遠隔ユーザーが前記ROIに基づいて前記ニアエンド映像の符号化を制御する権限の付与を前記ローカルデバイスと関連するローカルユーザーに求めることを含む請求項10に記載の方法。
【請求項13】
遠隔デバイスから情報を受信することは、前記ニアエンド映像内において複数のROIを指定する複数の遠隔デバイスから情報を受信することを含み、前記方法は、前記各々のROIに基づいて前記ニアエンド映像の符号化を制御するために前記遠隔デバイスと関連する遠隔ユーザーのうちの1人を選択するために前記遠隔ユーザーを認証することをさらに具備する請求項1に記載の方法。
【請求項14】
前記符号化されたニアエンド映像と関連する動き情報をモニタリングすることと、
前記動き情報に基づいて前記ROIを調整することと、
前記調整されたROIに基づいて前記ニアエンド映像を符号化すること、とをさらに具備する請求項1に記載の方法。
【請求項15】
前記ROIを指定する前記情報に基づいて前記ROI内にあるマクロブロック(MB)を識別するマクロブロック(MB)マップを生成することをさらに具備し、前記ROIを調整することは、前記動き情報に基づいてMBが前記ROI内に含められているか又は前記ROIから除外されているとしてMBの状態を修正することを含む請求項14に記載の方法。
【請求項16】
ROIを指定する前記情報は、テキスト又は口頭による情報を含み、前記方法は、前記テキスト又は口頭による情報に基づいて前記ROIを定義することをさらに具備する請求項1に記載の方法。
【請求項17】
前記ROIを定義することは、前記ローカルデバイス及び前記遠隔デバイスのうちの少なくとも1つと通信する中間サーバーにおいて前記ROIを定義することを含む請求項16に記載の方法。
【請求項18】
遠隔映像通信デバイスに送信されたニアエンド映像内において関心領域(ROI)を指定する情報を前記遠隔デバイスから受信する関心領域(ROI)エンジンと、
前記ニアエンド映像を符号化して前記映像の非ROIエリアに対する前記ROIの画質を向上させる映像符号器と、を具備する、映像符号化デバイス。
【請求項19】
前記映像符号器は、前記符号化されたニアエンド映像を前記遠隔デバイスに送信し、前記デバイスは、前記遠隔デバイスによって符号化されたファーエンド映像を受信する映像復号器をさらに具備する請求項18に記載のデバイス。
【請求項20】
前記映像復号器は、前記ROIを指定する前記情報を前記遠隔デバイスから受信された符号化されたファーエンド映像とともに受信し、前記ROIを指定する前記情報は、前記遠隔デバイスから受信される前記符号化されたファーエンド映像内に埋め込まれる請求項19に記載のデバイス。
【請求項21】
前記遠隔デバイスによって符号化されたファーエンド映像を受信する映像復号器をさらに具備し、前記映像復号器は、前記ROIを指定する前記情報をアウトオブバンドシグナリングによって前記遠隔デバイスから受信する請求項18に記載のデバイス。
【請求項22】
前記ROIエンジンは、前記符号化されたファーエンド映像内においてROIを指定する情報を生成し、前記映像符号器は、前記ROI情報を前記符号化されたニアエンド映像とともに前記遠隔デバイスに送信する請求項21に記載のデバイス。
【請求項23】
前記遠隔デバイスから受信された前記符号化されたファーエンド映像を復号して前記ファーエンド映像の非ROIエリアに対する前記ファーエンド映像内の前記ROIの前記画質を向上させることをさらに具備する請求項18に記載のデバイス。
【請求項24】
前記映像復号器は、前記ファーエンド映像の非ROIエリアに対してよりも高い品質の後処理又はエラー隠蔽技術を前記ファーエンド映像内の前記ROIに対して適用する請求項23に記載のデバイス。
【請求項25】
前記ROIを指定する前記情報に基づいて前記ROI内にあるマクロブロック(MB)を識別するマクロブロック(MB)マップを生成するROIマッパーモジュールと、前記ROIマッパーモジュールに適用するために前記ROIを指定する前記情報を処理するROIコントローラと、をさらに具備する請求項18に記載のデバイス。
【請求項26】
前記映像符号器は、前記ニアエンド映像の非ROIエリアに対してよりも高い品質の符号化又はエラー保護技術を前記ニアエンド映像内の前記ROIに対して適用する請求項18に記載のデバイス。
【請求項27】
前記ROIに基づいて前記ニアエンド映像が符号化される前に前記遠隔デバイスと関連する遠隔ユーザーを認証する認証モジュールをさらに具備し、前記認証モジュールは、前記遠隔ユーザーが前記ROIに基づいて前記ニアエンド映像の符号化を制御する権限を付与されているかどうかを決定する請求項18に記載のデバイス。
【請求項28】
前記認証モジュールは、前記遠隔ユーザーが前記ROIに基づいて前記ニアエンド映像の符号化を制御する権限の付与を前記デバイスと関連するローカルユーザーに求める請求項27に記載のデバイス。
【請求項29】
遠隔デバイスから受信された前記情報は、前記ニアエンド映像内において複数のROIを指定する複数の遠隔デバイスからの情報を含み、前記システムは、前記各々のROIに基づいて前記ニアエンド映像の符号化を制御するために前記遠隔デバイスと関連する遠隔ユーザーのうちの1人を選択するために前記遠隔ユーザーを認証する認証モジュールをさらに具備する請求項18に記載のデバイス。
【請求項30】
前記ニアエンド映像と関連する動き情報をモニタリングし、前記動き情報に基づいて前記ROIを調整する追跡モジュールをさらに具備し、前記符号器は、前記調整されたROIに基づいて前記ニアエンド映像を符号化する請求項18に記載のデバイス。
【請求項31】
前記ROIを指定する前記情報に基づいて前記ROI内にあるマクロブロック(MB)を識別するマクロブロック(MB)マップを生成するROIマッパーモジュールをさらに具備し、前記追跡モジュールによる前記ROIの調整は、前記動き情報に基づいてMBが前記ROIに含められているか又は前記ROIから除外されているとしてMBの状態を修正することを含む請求項30に記載のデバイス。
【請求項32】
ROIを指定する前記情報は、テキスト又は口頭による情報を含み、前記システムは、前記テキスト又は口頭による情報に基づいて前記ROIを定義する抽出モジュールをさらに具備する請求項18に記載のデバイス。
【請求項33】
ROIを指定する前記情報は、テキスト又は口頭による情報を含み、前記システムは、前記映像通信デバイス及び前記遠隔映像通信デバイスから遠隔に配置されて前記テキスト又は口頭による情報に基づいて前記ROIを定義する中間抽出サーバーをさらに具備する請求項18に記載のデバイス。
【請求項34】
ローカルデバイスによって符号化されて遠隔デバイスによって受信されたニアエンド映像内において関心領域(ROI)を指定する情報を前記遠隔デバイスから受信すること、及び前記ニアエンド映像を符号化して前記映像の非ROIエリアに対する前記ROIの画質を向上させることをプロセッサに行わせる命令を具備するコンピュータ読み取り可能媒体。
【請求項35】
前記命令は、前記符号化されたニアエンド映像を前記遠隔デバイスに送信すること、及び前記遠隔デバイスによって符号化されたファーエンド映像を前記ローカルデバイスにおいて受信することを前記プロセッサに行わせる請求項34に記載のコンピュータ読み取り可能媒体。
【請求項36】
前記命令は、前記ROIを指定する前記情報を前記遠隔デバイスから受信された符号化されたファーエンド映像とともに受信することを前記プロセッサに行わせ、前記ROIを指定する前記情報は、前記符号化されたファーエンド映像内に埋め込まれる請求項34に記載のコンピュータ読み取り可能媒体。
【請求項37】
前記命令は、前記ROIを指定する前記情報をアウトオブバンドシグナリングによって前記遠隔デバイスから受信することを前記プロセッサに行わせる請求項34に記載のコンピュータ読み取り可能媒体。
【請求項38】
前記命令は、前記遠隔デバイスから受信された符号化されたファーエンド映像内においてROIを指定する情報を生成すること、及び前記ROI情報を前記符号化されたニアエンド映像とともに前記遠隔デバイスに送信することを前記プロセッサに行わせる請求項34に記載のコンピュータ読み取り可能媒体
【請求項39】
前記命令は、前記遠隔デバイスから受信された前記符号化されたファーエンド映像を復号して前記ファーエンド映像の非ROIエリアに対する前記ファーエンド映像内の前記ROIの画質を向上させることを前記プロセッサに行わせる請求項34に記載のコンピュータ読み取り可能媒体。
【請求項40】
前記命令は、前記符号化されたファーエンド映像の非ROIエリアに対してよりも高い品質の後処理又はエラー隠蔽技術を前記ファーエンド映像内の前記ROIに対して適用することによって前記ファーエンド映像を復号することを前記プロセッサに行わせる請求項39に記載のコンピュータ読み取り可能媒体。
【請求項41】
前記ROIを指定する前記情報は、前記ROI内にあるマクロブロック(MB)を識別するマクロブロック(MB)マップを含む請求項34に記載のコンピュータ読み取り可能媒体。
【請求項42】
前記命令は、前記ニアエンド映像の非ROIエリアに対してよりも高い品質の符号化又はエラー隠蔽技術を前記ニアエンド映像内の前記ROIに対して適用することによって前記ニアエンド映像を符号化することを前記プロセッサに行わせる請求項34に記載のコンピュータ読み取り可能媒体。
【請求項43】
前記命令は、前記ROIに基づいて前記ニアエンド映像を符号化する前に前記遠隔ユーザーが前記ROIに基づいて前記ニアエンド映像の符号化を制御する権限を付与されているかどうかを決定することを前記プロセッサに行わせ、前記命令は、前記遠隔ユーザーが前記ROIに基づいて前記ニアエンド映像の符号化を制御する権限の付与を前記ローカルデバイスと関連するローカルユーザーに求めることを前記プロセッサに行わせる請求項34に記載のコンピュータ読み取り可能媒体。
【請求項44】
前記情報は、前記ニアエンド映像内において複数のROIを指定する複数の遠隔デバイスから受信され、前記命令は、前記各々のROIに基づいて前記ニアエンド映像の符号化を制御するために前記遠隔デバイスと関連する遠隔ユーザーのうちの1人を選択するために前記遠隔ユーザーを認証することを前記プロセッサに行わせる請求項34に記載のコンピュータ読み取り可能媒体。
【請求項45】
前記命令は、前記符号化されたニアエンド映像と関連する動き情報をモニタリングすること、前記動き情報に基づいて前記ROIを調整すること、及び前記調整されたROIに基づいて前記ニアエンド映像を符号化することを前記プロセッサに行わせる請求項34に記載のコンピュータ読み取り可能媒体。
【請求項46】
前記ROIを指定する前記情報は、前記ROI内にあるマクロブロック(MB)を識別するマクロブロック(MB)マップを含み、前記命令は、前記動き情報に基づいてMBが前記ROI内に含められているか又は前記ROIから除外されているとしてMBの状態を修正することを含む前記ROIの調整を前記プロセッサに行わせる、請求項45に記載のコンピュータ読み取り可能媒体。
【請求項47】
遠隔デバイスによって送信されてローカルデバイスによって受信されるファーエンド映像内において関心領域(ROI)を指定する情報を生成することと、
前記ROIに基づいて前記ファーエンド映像を符号化して前記映像の非ROIエリアに対する前記ROIの画質を向上させる際に用いるために前記情報を前記遠隔デバイスに送信すること、とを具備する、方法。
【請求項48】
前記ROIを指定する前記情報は、前記ローカルデバイスによって符号化されて前記遠隔デバイスに送信されるニアエンド映像内に埋め込まれる請求項47に記載の方法。
【請求項49】
前記ROIを指定する前記情報は、アウトオブバンドシグナリングによって前記遠隔デバイスから受信される請求項47に記載の方法。
【請求項50】
前記ROIを指定する前記情報は、前記ROI内にあるマクロブロック(MB)を識別するマクロブロック(MB)マップを含む請求項47に記載の方法。
【請求項51】
遠隔デバイスから受信されたファーエンド映像内において関心領域(ROI)を指定する情報を生成する関心領域(ROI)エンジンと、
前記ROIに基づいて前記ファーエンド映像を符号化して前記ファーエンド映像の非ROIエリアに対する前記ROIの画質を向上させる際に前記遠隔デバイスによって用いるためにニアエンド映像を符号化して前記ROIを指定する情報を前記符号化されたニアエンド映像とともに送信する映像符号器と、を具備する、映像符号化デバイス。
【請求項52】
前記ROIを指定する前記情報は、前記遠隔デバイスに送信される前記ニアエンド映像内に埋め込まれる請求項51に記載のデバイス。
【請求項53】
前記ROIを指定する前記情報は、アウトオブバンドシグナリングによって前記遠隔デバイスに送信される請求項51に記載のデバイス。
【請求項54】
前記ROIを指定する前記情報は、前記ROI内にあるマクロブロック(MB)を識別するマクロブロック(MB)マップを含む請求項51に記載のデバイス。
【請求項1】
ローカルデバイスによって符号化されて遠隔デバイスによって受信されたニアエンド映像内において関心領域(ROI)を指定する情報を前記遠隔デバイスから受信することと、
前記ROIに基づいて前記ニアエンド映像を符号化して前記映像の非ROIエリアに対する前記ROIの画質を向上させること、とを具備する、方法。
【請求項2】
前記符号化されたニアエンド映像を前記遠隔デバイスに送信することと、前記遠隔デバイスによって符号化されたファーエンド映像を前記ローカルデバイスにおいて受信すること、とをさらに具備する請求項1に記載の方法。
【請求項3】
前記ROIを指定する前記情報を前記遠隔デバイスから受信された符号化されたファーエンド映像とともに受信することをさらに具備し、前記ROIを指定する前記情報は、前記符号化されたファーエンド映像内に埋め込まれる請求項1に記載の方法。
【請求項4】
前記ROIを指定する前記情報をアウトオブバンドシグナリングによって前記遠隔デバイスから受信することをさらに具備する請求項1に記載の方法。
【請求項5】
前記遠隔デバイスによって符号化されたファーエンド映像を前記ローカルデバイスにおいて受信することと、
前記符号化されたファーエンド映像内においてROIを指定する情報を生成することと、
前記ROI情報を前記符号化されたニアエンド映像とともに前記遠隔デバイスに送信すること、とをさらに具備する請求項1に記載の方法。
【請求項6】
前記遠隔デバイスによって符号化されたファーエンド映像を前記ローカルデバイスにおいて受信することと、
前記遠隔デバイスから受信された前記符号化されたファーエンド映像を復号して前記ファーエンド映像の非ROIエリアに対する前記ファーエンド映像内の前記ROIの画質を向上させること、とをさらに具備する請求項1に記載の方法。
【請求項7】
前記符号化されたファーエンド映像を復号することは、前記ファーエンド映像の非ROIエリアに対してよりも高い品質の後処理又はエラー隠蔽技術を前記ファーエンド映像内の前記ROIに対して適用することを含む請求項6に記載の方法。
【請求項8】
前記ROIを指定する前記情報に基づいて前記ROI内にあるマクロブロック(MB)を識別するマクロブロック(MB)マップを生成することをさらに具備する請求項1に記載の方法。
【請求項9】
前記ニアエンド映像を符号化することは、前記ニアエンド映像の非ROIエリアに対してよりも高い品質の符号化又はエラー保護技術を前記ROIに対して適用することを含む請求項1に記載の方法。
【請求項10】
前記ROIに基づいて前記ニアエンド映像を符号化する前に前記遠隔デバイスと関連する遠隔ユーザーを認証することをさらに具備する請求項1に記載の方法。
【請求項11】
認証することは、前記遠隔ユーザーが前記ROIに基づいて前記ニアエンド映像の符号化を制御する権限を付与されているかどうかを決定することを含む請求項10に記載の方法。
【請求項12】
認証することは、前記遠隔ユーザーが前記ROIに基づいて前記ニアエンド映像の符号化を制御する権限の付与を前記ローカルデバイスと関連するローカルユーザーに求めることを含む請求項10に記載の方法。
【請求項13】
遠隔デバイスから情報を受信することは、前記ニアエンド映像内において複数のROIを指定する複数の遠隔デバイスから情報を受信することを含み、前記方法は、前記各々のROIに基づいて前記ニアエンド映像の符号化を制御するために前記遠隔デバイスと関連する遠隔ユーザーのうちの1人を選択するために前記遠隔ユーザーを認証することをさらに具備する請求項1に記載の方法。
【請求項14】
前記符号化されたニアエンド映像と関連する動き情報をモニタリングすることと、
前記動き情報に基づいて前記ROIを調整することと、
前記調整されたROIに基づいて前記ニアエンド映像を符号化すること、とをさらに具備する請求項1に記載の方法。
【請求項15】
前記ROIを指定する前記情報に基づいて前記ROI内にあるマクロブロック(MB)を識別するマクロブロック(MB)マップを生成することをさらに具備し、前記ROIを調整することは、前記動き情報に基づいてMBが前記ROI内に含められているか又は前記ROIから除外されているとしてMBの状態を修正することを含む請求項14に記載の方法。
【請求項16】
ROIを指定する前記情報は、テキスト又は口頭による情報を含み、前記方法は、前記テキスト又は口頭による情報に基づいて前記ROIを定義することをさらに具備する請求項1に記載の方法。
【請求項17】
前記ROIを定義することは、前記ローカルデバイス及び前記遠隔デバイスのうちの少なくとも1つと通信する中間サーバーにおいて前記ROIを定義することを含む請求項16に記載の方法。
【請求項18】
遠隔映像通信デバイスに送信されたニアエンド映像内において関心領域(ROI)を指定する情報を前記遠隔デバイスから受信する関心領域(ROI)エンジンと、
前記ニアエンド映像を符号化して前記映像の非ROIエリアに対する前記ROIの画質を向上させる映像符号器と、を具備する、映像符号化デバイス。
【請求項19】
前記映像符号器は、前記符号化されたニアエンド映像を前記遠隔デバイスに送信し、前記デバイスは、前記遠隔デバイスによって符号化されたファーエンド映像を受信する映像復号器をさらに具備する請求項18に記載のデバイス。
【請求項20】
前記映像復号器は、前記ROIを指定する前記情報を前記遠隔デバイスから受信された符号化されたファーエンド映像とともに受信し、前記ROIを指定する前記情報は、前記遠隔デバイスから受信される前記符号化されたファーエンド映像内に埋め込まれる請求項19に記載のデバイス。
【請求項21】
前記遠隔デバイスによって符号化されたファーエンド映像を受信する映像復号器をさらに具備し、前記映像復号器は、前記ROIを指定する前記情報をアウトオブバンドシグナリングによって前記遠隔デバイスから受信する請求項18に記載のデバイス。
【請求項22】
前記ROIエンジンは、前記符号化されたファーエンド映像内においてROIを指定する情報を生成し、前記映像符号器は、前記ROI情報を前記符号化されたニアエンド映像とともに前記遠隔デバイスに送信する請求項21に記載のデバイス。
【請求項23】
前記遠隔デバイスから受信された前記符号化されたファーエンド映像を復号して前記ファーエンド映像の非ROIエリアに対する前記ファーエンド映像内の前記ROIの前記画質を向上させることをさらに具備する請求項18に記載のデバイス。
【請求項24】
前記映像復号器は、前記ファーエンド映像の非ROIエリアに対してよりも高い品質の後処理又はエラー隠蔽技術を前記ファーエンド映像内の前記ROIに対して適用する請求項23に記載のデバイス。
【請求項25】
前記ROIを指定する前記情報に基づいて前記ROI内にあるマクロブロック(MB)を識別するマクロブロック(MB)マップを生成するROIマッパーモジュールと、前記ROIマッパーモジュールに適用するために前記ROIを指定する前記情報を処理するROIコントローラと、をさらに具備する請求項18に記載のデバイス。
【請求項26】
前記映像符号器は、前記ニアエンド映像の非ROIエリアに対してよりも高い品質の符号化又はエラー保護技術を前記ニアエンド映像内の前記ROIに対して適用する請求項18に記載のデバイス。
【請求項27】
前記ROIに基づいて前記ニアエンド映像が符号化される前に前記遠隔デバイスと関連する遠隔ユーザーを認証する認証モジュールをさらに具備し、前記認証モジュールは、前記遠隔ユーザーが前記ROIに基づいて前記ニアエンド映像の符号化を制御する権限を付与されているかどうかを決定する請求項18に記載のデバイス。
【請求項28】
前記認証モジュールは、前記遠隔ユーザーが前記ROIに基づいて前記ニアエンド映像の符号化を制御する権限の付与を前記デバイスと関連するローカルユーザーに求める請求項27に記載のデバイス。
【請求項29】
遠隔デバイスから受信された前記情報は、前記ニアエンド映像内において複数のROIを指定する複数の遠隔デバイスからの情報を含み、前記システムは、前記各々のROIに基づいて前記ニアエンド映像の符号化を制御するために前記遠隔デバイスと関連する遠隔ユーザーのうちの1人を選択するために前記遠隔ユーザーを認証する認証モジュールをさらに具備する請求項18に記載のデバイス。
【請求項30】
前記ニアエンド映像と関連する動き情報をモニタリングし、前記動き情報に基づいて前記ROIを調整する追跡モジュールをさらに具備し、前記符号器は、前記調整されたROIに基づいて前記ニアエンド映像を符号化する請求項18に記載のデバイス。
【請求項31】
前記ROIを指定する前記情報に基づいて前記ROI内にあるマクロブロック(MB)を識別するマクロブロック(MB)マップを生成するROIマッパーモジュールをさらに具備し、前記追跡モジュールによる前記ROIの調整は、前記動き情報に基づいてMBが前記ROIに含められているか又は前記ROIから除外されているとしてMBの状態を修正することを含む請求項30に記載のデバイス。
【請求項32】
ROIを指定する前記情報は、テキスト又は口頭による情報を含み、前記システムは、前記テキスト又は口頭による情報に基づいて前記ROIを定義する抽出モジュールをさらに具備する請求項18に記載のデバイス。
【請求項33】
ROIを指定する前記情報は、テキスト又は口頭による情報を含み、前記システムは、前記映像通信デバイス及び前記遠隔映像通信デバイスから遠隔に配置されて前記テキスト又は口頭による情報に基づいて前記ROIを定義する中間抽出サーバーをさらに具備する請求項18に記載のデバイス。
【請求項34】
ローカルデバイスによって符号化されて遠隔デバイスによって受信されたニアエンド映像内において関心領域(ROI)を指定する情報を前記遠隔デバイスから受信すること、及び前記ニアエンド映像を符号化して前記映像の非ROIエリアに対する前記ROIの画質を向上させることをプロセッサに行わせる命令を具備するコンピュータ読み取り可能媒体。
【請求項35】
前記命令は、前記符号化されたニアエンド映像を前記遠隔デバイスに送信すること、及び前記遠隔デバイスによって符号化されたファーエンド映像を前記ローカルデバイスにおいて受信することを前記プロセッサに行わせる請求項34に記載のコンピュータ読み取り可能媒体。
【請求項36】
前記命令は、前記ROIを指定する前記情報を前記遠隔デバイスから受信された符号化されたファーエンド映像とともに受信することを前記プロセッサに行わせ、前記ROIを指定する前記情報は、前記符号化されたファーエンド映像内に埋め込まれる請求項34に記載のコンピュータ読み取り可能媒体。
【請求項37】
前記命令は、前記ROIを指定する前記情報をアウトオブバンドシグナリングによって前記遠隔デバイスから受信することを前記プロセッサに行わせる請求項34に記載のコンピュータ読み取り可能媒体。
【請求項38】
前記命令は、前記遠隔デバイスから受信された符号化されたファーエンド映像内においてROIを指定する情報を生成すること、及び前記ROI情報を前記符号化されたニアエンド映像とともに前記遠隔デバイスに送信することを前記プロセッサに行わせる請求項34に記載のコンピュータ読み取り可能媒体
【請求項39】
前記命令は、前記遠隔デバイスから受信された前記符号化されたファーエンド映像を復号して前記ファーエンド映像の非ROIエリアに対する前記ファーエンド映像内の前記ROIの画質を向上させることを前記プロセッサに行わせる請求項34に記載のコンピュータ読み取り可能媒体。
【請求項40】
前記命令は、前記符号化されたファーエンド映像の非ROIエリアに対してよりも高い品質の後処理又はエラー隠蔽技術を前記ファーエンド映像内の前記ROIに対して適用することによって前記ファーエンド映像を復号することを前記プロセッサに行わせる請求項39に記載のコンピュータ読み取り可能媒体。
【請求項41】
前記ROIを指定する前記情報は、前記ROI内にあるマクロブロック(MB)を識別するマクロブロック(MB)マップを含む請求項34に記載のコンピュータ読み取り可能媒体。
【請求項42】
前記命令は、前記ニアエンド映像の非ROIエリアに対してよりも高い品質の符号化又はエラー隠蔽技術を前記ニアエンド映像内の前記ROIに対して適用することによって前記ニアエンド映像を符号化することを前記プロセッサに行わせる請求項34に記載のコンピュータ読み取り可能媒体。
【請求項43】
前記命令は、前記ROIに基づいて前記ニアエンド映像を符号化する前に前記遠隔ユーザーが前記ROIに基づいて前記ニアエンド映像の符号化を制御する権限を付与されているかどうかを決定することを前記プロセッサに行わせ、前記命令は、前記遠隔ユーザーが前記ROIに基づいて前記ニアエンド映像の符号化を制御する権限の付与を前記ローカルデバイスと関連するローカルユーザーに求めることを前記プロセッサに行わせる請求項34に記載のコンピュータ読み取り可能媒体。
【請求項44】
前記情報は、前記ニアエンド映像内において複数のROIを指定する複数の遠隔デバイスから受信され、前記命令は、前記各々のROIに基づいて前記ニアエンド映像の符号化を制御するために前記遠隔デバイスと関連する遠隔ユーザーのうちの1人を選択するために前記遠隔ユーザーを認証することを前記プロセッサに行わせる請求項34に記載のコンピュータ読み取り可能媒体。
【請求項45】
前記命令は、前記符号化されたニアエンド映像と関連する動き情報をモニタリングすること、前記動き情報に基づいて前記ROIを調整すること、及び前記調整されたROIに基づいて前記ニアエンド映像を符号化することを前記プロセッサに行わせる請求項34に記載のコンピュータ読み取り可能媒体。
【請求項46】
前記ROIを指定する前記情報は、前記ROI内にあるマクロブロック(MB)を識別するマクロブロック(MB)マップを含み、前記命令は、前記動き情報に基づいてMBが前記ROI内に含められているか又は前記ROIから除外されているとしてMBの状態を修正することを含む前記ROIの調整を前記プロセッサに行わせる、請求項45に記載のコンピュータ読み取り可能媒体。
【請求項47】
遠隔デバイスによって送信されてローカルデバイスによって受信されるファーエンド映像内において関心領域(ROI)を指定する情報を生成することと、
前記ROIに基づいて前記ファーエンド映像を符号化して前記映像の非ROIエリアに対する前記ROIの画質を向上させる際に用いるために前記情報を前記遠隔デバイスに送信すること、とを具備する、方法。
【請求項48】
前記ROIを指定する前記情報は、前記ローカルデバイスによって符号化されて前記遠隔デバイスに送信されるニアエンド映像内に埋め込まれる請求項47に記載の方法。
【請求項49】
前記ROIを指定する前記情報は、アウトオブバンドシグナリングによって前記遠隔デバイスから受信される請求項47に記載の方法。
【請求項50】
前記ROIを指定する前記情報は、前記ROI内にあるマクロブロック(MB)を識別するマクロブロック(MB)マップを含む請求項47に記載の方法。
【請求項51】
遠隔デバイスから受信されたファーエンド映像内において関心領域(ROI)を指定する情報を生成する関心領域(ROI)エンジンと、
前記ROIに基づいて前記ファーエンド映像を符号化して前記ファーエンド映像の非ROIエリアに対する前記ROIの画質を向上させる際に前記遠隔デバイスによって用いるためにニアエンド映像を符号化して前記ROIを指定する情報を前記符号化されたニアエンド映像とともに送信する映像符号器と、を具備する、映像符号化デバイス。
【請求項52】
前記ROIを指定する前記情報は、前記遠隔デバイスに送信される前記ニアエンド映像内に埋め込まれる請求項51に記載のデバイス。
【請求項53】
前記ROIを指定する前記情報は、アウトオブバンドシグナリングによって前記遠隔デバイスに送信される請求項51に記載のデバイス。
【請求項54】
前記ROIを指定する前記情報は、前記ROI内にあるマクロブロック(MB)を識別するマクロブロック(MB)マップを含む請求項51に記載のデバイス。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7A】
【図7B】
【図7C】
【図7D】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7A】
【図7B】
【図7C】
【図7D】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【公表番号】特表2008−533838(P2008−533838A)
【公表日】平成20年8月21日(2008.8.21)
【国際特許分類】
【出願番号】特願2008−500929(P2008−500929)
【出願日】平成18年3月8日(2006.3.8)
【国際出願番号】PCT/US2006/008458
【国際公開番号】WO2006/115591
【国際公開日】平成18年11月2日(2006.11.2)
【出願人】(595020643)クゥアルコム・インコーポレイテッド (7,166)
【氏名又は名称原語表記】QUALCOMM INCORPORATED
【Fターム(参考)】
【公表日】平成20年8月21日(2008.8.21)
【国際特許分類】
【出願日】平成18年3月8日(2006.3.8)
【国際出願番号】PCT/US2006/008458
【国際公開番号】WO2006/115591
【国際公開日】平成18年11月2日(2006.11.2)
【出願人】(595020643)クゥアルコム・インコーポレイテッド (7,166)
【氏名又は名称原語表記】QUALCOMM INCORPORATED
【Fターム(参考)】
[ Back to top ]