説明

常駐表示式ビデオ会議においてビデオストリームを切替える方法およびシステム

【課題】メディアリレー会議(MRC)システムにおいて、複数のメディアリレーエンドポイント(MRE)のうちの1つでイントラフレームが必要になった際に、MRCセッションに関連するリソースへの影響を低減し、ユーザがより良く感じる新規の方法およびシステムを提供する。
【解決手段】メディアリレー会議(MRC)システムは、メディアリレー多地点接続装置(MRM)と、効率的な方法でイントラフレームの必要性を処理するメディアリレーエンドポイント(MRE)とを含み、ある実施形態において、提示側MREから受信するビデオストリーム用のイントラフレームを要求側MREが要求する場合、MRMは、残りのMREに通常のストリームを並行して送信する一方で、一時的ビデオストリームを要求側MREに送信するよう提示側MREに要求することにより、この要求に対応する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、映像通信に関し、より詳しくは、多地点間ビデオ会議の分野に関する。
【背景技術】
【0002】
様々なビデオ会議機器の進展と共に、インターネットプロトコル(IP)ネットワーク上のトラフィックが急増するにつれ、より多くの人々がビデオ会議を通信ツールとして利用している。3人以上の参加者がいる多地点会議では、多地点接続装置(MCU)が必要とされる。MCUは、通常、ネットワークのノードまたはエンドポイントから幾つかのチャンネルを受信するターミナルに配置される、会議接続エンティティである。MCUは、ある一定の基準に従って、音声信号および映像信号を処理し、接続チャンネルのセットに配布する。このようなMCUの例としては、ポリコムが販売するMGC-100、RMXョ2000が挙げられる(RMX2000はポリコムの登録商標である)。ターミナル(エンドポイントとも呼ばれる)は、ネットワーク上のエンティティであり、他のターミナルまたはMCUとのリアルタイムかつ双方向の音声および/または映像音声通信を可能とする。エンドポイントおよびMCUのさらに詳細な定義は、国際電気通信連合(ITU)による標準規格、例えばH.320、H.324およびH.323等に記載されており、ITUのウェブサイトから閲覧可能である:www.itu.int。
【0003】
MCUは、複数の音声およびビデオデコーダ、エンコーダおよびブリッジを含む。また、MCUは、不特定数の参加者(エンドポイント)間で音声およびビデオ通信を行うために、大量の処理能力を活用する。通信は、様々な通信プロトコルおよび圧縮規格に基づき、また複数の異なるエンドポイントにて受信される。MCUは、複数の入力音声または入力ビデオストリームから、出力ストリームが送信される少なくとも1人の会議出席者(エンドポイント)のプロパティと互換性のある、(それぞれ)少なくとも1つの音声またはビデオ出力ストリームを構成する必要がある。複数のエンドポイントから受信した圧縮音声ストリームは、デコードされ、どの音声ストリームを選択して単一の会議音声ストリームにミキシングするのかを決定するために分析される場合がある。本開示に関しては、用語「デコード」および「復元」を区別なく用いる。
【0004】
1つの会議が1つ以上のビデオ出力ストリームを有している場合があり、各出力ストリームはレイアウトと関連付けられている。レイアウトは、ストリームを受信する1人以上の会議出席者のディスプレー上での会議の見え方を定義する。レイアウトは1つ以上のセグメントに分割される場合があり、各セグメントは、一人の会議出席者(エンドポイント)が送信するビデオ入力ストリームと関連付けられる。各出力ストリームは、幾つかの入力ストリームから構成されるため、常駐表示式ビデオ (continous presence: 画面分割による常駐表示)(CP)会議が可能となる。CP会議において、リモートターミナルにおけるユーザは、他の複数の会議参加者を同時に観ることができる。各参加者はレイアウトのセグメントに表示され、各セグメントは同一のサイズであっても異なるサイズであってもよい。レイアウトのセグメントに表示され、それに関連付けられる参加者は、同一セッションに参加している会議出席者間でそれぞれ異なるように選択可能である。
【0005】
MCUは、各入力ビデオストリームをフルフレームの復元映像にデコードし、各会議に関連付けられた複数の復元ビデオストリームを管理し、各出力ビューストリームが会議出席者またはあるレイアウトに関連付けられた、複数の出力ストリームの構成および/または管理する必要があり得る。出力ストリームは、MCUのビデオ出力ポートで生成される。ビデオ出力ポートは、レイアウトビルダーおよびエンコーダから成る。レイアウトビルダーは、選択された複数の会議選択者からの様々な復元ビデオフレームを収集して最終的なサイズに調整し、レイアウト上の該当セグメントに配置する。その後、構成したビデオフレームの映像をエンコーダでエンコードし、適切なエンドポイントに送信する。従って、複数のビデオ会議の処理および管理には、大規模かつ高価なコンピュータリソースが必要であり、その理由からMCUは概して高価かつ非常に複雑な製品となっている。MCUは、例えば特許文献1、2、3または4等幾つかの特許および特許出願に開示されており、その内容は参照により本明細書に組み込まれる。これらの特許では、CP会議のビデオ出力ストリームの生成に利用される、MCUのビデオユニットの操作が開示されている。
【0006】
ビデオ会議を利用する傾向の高まりにより、CP映像イメージを構成した複数の会議セッションを実施可能な、安価なMCUへの需要が高まっている。
【0007】
従来のMCUよりも少ないリソースで、圧縮ビデオストリームからCP映像イメージを構成する既存の技術がある。幾つかの技術では、QCIF(Quarter Common Intermediate Format)で符号化された複数の画像から1つのCIF画像を構成する、画像処理装置の使用が開示されている。これらの技術において、画像がH.261規格で圧縮されている場合には、複数の符号化された画像のデコードは不要である。QCIFは、ビデオ会議のフォーマットであり、ビデオフレームが各ライン176画素X144ラインを含むよう指定している。これはCIF(Common Intermediate Format)の解像度の4分の1である。QCIFのサポートは、国際電気通信連合(ITU)の幾つかのビデオ会議の規格で必要とされている。
【0008】
QCIFのサイズおよびレイアウトの制約を払拭する他の技術としては、サブエンコード方式の利用がある。サブエンコード方式の1例が米国特許第7,139,015号に開示されており、参照によりあらゆる目的においてその全文が本明細書に組み込まれる。
【0009】
他のビデオ会議システムは、メディアリレー会議(MRC)(Media Relay Conferencing)を使用する。MRCにおいて、メディアリレーMCU(MRM)は、参加している各メディアリレーエンドポイント(MRE)から1つ以上のストリームを受信し、これらのストリームは、本明細書において、リレー用RTP圧縮ビデオストリームまたはリレー用ストリームと呼ばれる。該MRMは、参加しているエンドポイントの各々に対して、会議中に他のエンドポイントから受信した一群のビデオストリームを中継(リレー)するが、これらを本明細書において、中継RTP圧縮ビデオストリームまたは中継ストリームと呼ぶ。受信エンドポイントは、それぞれ複数のストリームを利用して、レイアウトに基づいたCPビデオ画像を生成する。CPビデオ画像は、MREのユーザに対して表示される。MREは、セッション中の会議出席者のターミナルであってもよく、MRMから中継されたメディアを受信し、MRMからの指示に従って圧縮メディアを送信する能力を有する。MRMについては、特許文献5に更に詳細に記載されており、参照によりあらゆる目的においてその全文が本明細書に組み込まれる。本開示に関しては、用語「エンドポイント」および「MRE」を区別なく用いる。
【0010】
幾つかのMRCシステムでは、送信MREがそのビデオ画像を2つ以上のストリームで送信し、各ストリームは異なる品質レベルに関連する。このようなシステムでは、複数のストリームを使用して、レイアウト上に異なる大きさのウィンドーを表示したり、各受信エンドポイントによって様々な解像度を使用できる。さらに、パケットロスに対応するために、複数のストリームを使用できる。それらの質は、フレームレート、解像度および/または信号雑音比(SNR)等の点で異なってもよい。
【0011】
ビデオストリーミングは、増々普及しつつある。また、次々と増えるビデオストリーミングソースならびにビデオ会議システムが、複数のストリームを並行して配信するが、各ストリームは圧縮ビデオの質によって異なる。その質は、時間ドメイン(例えば、1秒あたりのフレーム数)、空間ドメイン(例えば、高解像度(HD)またはCIF)等のドメイン数および/または質(例えば、鮮明度)で表現される。ビデオストリーミングおよび複数品質のストリームに使用される動画圧縮規格には、H.264 AVC、H.264 annex G、MPEG-4等が含まれる。H.264等の圧縮規格に関するさらなる情報は、ITUのウェブサイトwww.itu.intまたはwww.mpeg.orgから入手できる。
【0012】
会議セッション中、受信MREは、しばし、複数の送信MREの1つからのイントラフレームを必要とする。パケットの損失、受信MREにて表示されるレイアウトの変更、ビデオ会議セッション途中での出席者の参加等の理由により、イントラフレームが要求され得る。場合よっては、複数の受信MREの1つのみがイントラフレームを要求する一方で、同質レベルのストリームを取得している他のセッション参加MREは要求しないことがある。イントラフレームは、ビデオシーケンスの他のフレームに関してではなく、同一フレームのみに含まれる情報に関して圧縮されたビデオフレームである。一方、インターフレームは、同一フレーム内に含まれる情報と、ビデオシーケンスのうち1つ以上の他のフレーム(参照フレーム)とに関して圧縮されたビデオフレームである。インターフレームには、予測フレーム(Pフレーム)および/または双方向予測フレーム(Bフレーム)が含まれる。ビデオ会議では、通常、Bフレームはその待機時間を理由に使用されない。以下の記述において、用語「Pフレーム」が、インターフレームを表す用語として使用される。
【0013】
ビデオストリーミングでは、損失パケット、ビデオ再生中の映像の飛び、または異なる質のストリーム間での切替えを伴うことがある。これらの性能をサポートするため、動画圧縮規格は、ストリームに沿って周期的に配置される特殊な種類のフレームを規定している。第1の特殊フレームには、切替Pフレーム(SP)がある。SPフレームはPフレームと類似する(類似のマクロブロックモードの使用および動き補償予測を使用)。しかし、SPフレームは、異なる参照フレームを使用して予測された場合においても、同一のフレームを再構築できる。第2の特殊フレームは、二次SPフレーム(SSP)と呼ばれる。SSPフレームは、特殊なエンコードを使用する。どの参照フレーム、マクロブロックまたは運動ベクトルを使用してSSPフレームをエンコードしたかに関わらず、デコードによって常に同じ画像が再構築される。第3の特殊フレームは、切替イントラフレーム(SI)である。SIフレームは、同一のSPフレームを再構築するイントラフレームと見なされる。本開示において、用語「エンコード」および「圧縮」を区別なく用いる。
【0014】
SP、SSPおよびSIフレーム、ならびにストリーム間の切替えまたはパケットロスの回復にそれらフレームを使用することは、ビデオストリーミングの分野において周知であり、従ってさらなる説明は省略する。これらのフレームおよびフレームの使用についてさらに知りたい者には、H.264 AVC規格および Michael Walterの卒業論文である“Advanced Bitstream Switching for Wireless Video Streaming”(2004年11月26日)を勧める。他の文献としては、Marta Karczewics他により、IEEE Vol. 13,No.7(2003年7月)で発表された“The SP- and SI-Frames Design for H.264/AVC,”がある。
【0015】
要求側MREから受信した、関連MREをターゲットとするイントラ要求に応じて、MRMはその要求を関連MREに中継する。それに応じて、関連MREはMRMにイントラフレームを送信し、MRMは、関連MREから現在ビデオストリームを受信している各MREに対してイントラフレームを中継する。これらの関連MREには、イントラフレームを必要とせず、またそれを要求していないものが含まれる。イントラフレームの符号化効率は、インターフレームの符号化効率よりも低いため、同じ質を得るためには、より広い帯域幅が必要である。また、イントラフレームのエンコード/デコードには、インターフレームよりも時間を要し、さらなる処理能力が要求される。従って、イントラフレームをすべてのMREに送信すると、通信リンク上に不要な負荷がかかり、受信MREならびに送信MREの処理負荷も増加する。従って、帯域幅の制約を維持するためには、イントラフレームを低品質でエンコードする必要がある。あるいは、遷移期間中にフレームレートを一時的に低減することも考えられる。従ってその期間中、会議主席者は、概してイントラフレームによる質の低下を感じることとなる。
【先行技術文献】
【特許文献】
【0016】
【特許文献1】米国特許第6,300,973号
【特許文献2】米国特許第6,496,216号
【特許文献3】米国特許第5,600,646号
【特許文献4】米国特許第5,838,664号
【特許文献5】米国公開特許第2010/0194847号
【発明の概要】
【0017】
複数のMREのうちの1つでイントラフレームが必要になった際に、MRCセッションに関連するリソースへの影響を低減し、ユーザがより良く感じる新規の方法およびシステムが開示される。
【0018】
様々な実施形態によると、MRE(要求側MRE)が、他のMRE(提示側MRE)から受信したビデオストリーム用にイントラフレームを要求する場合、MRMは、他のMREに中継される通常のストリームを送信するのと並行して、要求側MREに中継される一時的なストリームを送信するよう、提示側MREに要求することで対応することができる。
【図面の簡単な説明】
【0019】
本明細書に組み込まれ、その一部を構成する添付の図面は、本発明のいくつかの装置および方法の実施を図示しており、詳細な説明と共に、本発明の利点および原理を説明する役割を果たしている。
【0020】
【図1】一実施形態に係る、様々な新規の電子会議システムを備えるマルチメディア会議システムを示すブロック図である。
【0021】
【図2】一実施形態に係る、メディアリレーMCU(MRM)の関連要素を示すブロック図である。
【0022】
【図3】一実施形態に係る、セッション圧縮音声RTPプロセッサの関連要素を示す簡略ブロック図である。
【0023】
【図4】一実施形態に係る、セッション圧縮ビデオRTPプロセッサの関連要素を示す簡略ブロック図である。
【0024】
【図5】一実施形態に係る、メディアリレーエンドポイント(MRE)の関連要素を示す簡略ブロック図である。
【0025】
【図6】一実施形態に係る、MREビデオモジュール(MREVM)の一部分の関連要素を示す簡略ブロック図である。
【0026】
【図7】一実施形態に係る、MRE音声モジュール(MREAM)の一部分の関連要素を示すブロック図である。
【0027】
【図8A】一実施形態に係る、会議設定方法の関連動作を示すフローチャートである。
【0028】
【図8B】一実施形態に係る、シグナル化およびMRMのコントロールモジュールによる切替技術の関連動作を示すフローチャートである。
【0029】
【図9A】一実施形態に係る、MRE制御モジュールの会議設定技術の関連動作を示すフローチャートである。
【図9B】一実施形態に係る、MRE制御モジュールの会議設定技術の関連動作を示すフローチャートである。
【0030】
【図10A】1つのMREで生成され、MRMを介して他の2つのMREに送信されるビデオストリームの特殊フレームを使用する、一実施形態に係る遷移期間を示すタイムチャートである。
【図10B】1つのMREで生成され、MRMを介して他の2つのMREに送信されるビデオストリームの特殊フレームを使用する、一実施形態に係る遷移期間を示すタイムチャートである。
【0031】
【図11A】1つのEPで生成され、MRMを介して他の2つのMREに送信されるビデオストリームの特別フレームを使用する、一実施形態に係る遷移期間を示すタイムチャートである。
【図11B】1つのEPで生成され、MRMを介して他の2つのMREに送信されるビデオストリームの特別フレームを使用する、一実施形態に係る遷移期間を示すタイムチャートである。
【発明を実施するための形態】
【0032】
上述したMRC(Media Relay Conferencing)の不備は、本開示の発明概念の範囲をいかなる形においても制限するものではない。これら不備は、例示することのみを目的として示すものである。
【0033】
以下の記載においては、説明を目的として、本発明の完全な理解のために多くの具体的な詳細を述べる。しかし、本発明をこれらの具体的な詳細無しで実施しうることは、当業者にとって自明であろう。他の例として、ブロック図に示した構造および装置は、本発明の不明瞭さを排除する役割を果たす。下付きまたは添え字のない数字が示されている場合は、その示されている数字に対応するすべての下付きまたは添え字のインスタンスを示しているものと解釈される。さらに、本開示で使用する言い回しは、主に読み易さおよび解説を目的として選択されており、本発明の主題を正確に記述するまたは制限する目的では選択されていない。かかる本発明の主題を特定するには、特許請求の範囲を参照すること。本明細書における「一実施形態」または「1つの実施形態」といった言い回しは、実施形態との関連で記載された特定の特徴、構造または性質が、本発明の少なくとも1つの実施形態に含まれることを意味しており、「一実施形態」または「1つの実施形態」といった言い回しが本明細書の随所に見られるが、これは必ずしも同じ実施形態を意味しているわけではない。
【0034】
以下の記載の一部では、ソフトウェアまたはファームウェアに関する用語を用いて記述しているが、あらゆるソフトウェア、ファームウェアおよびハードウェアの組み合わせを含む、所望のソフトウェア、ファームウェアまたはハードウェアにおいても、本明細書に記載された特徴および機能を実施形態にて実行可能である。以下の記載では、用語「ユニット」「要素」「モジュール」および「論理モジュール」を区別なく用いる。ユニットまたはモジュールと称するものは、スタンドアロン型のユニットもしくは特殊または統合モジュールでありうる。ユニットまたはモジュールは、取り外し可能であり、または他の類似ユニットまたはモジュールと容易に交換可能なモジュラーまたはモジュールの側面を有するものでありうる。各ユニットまたはモジュールは、ソフトウェア、ハードウェアおよび/またはファームウェアのいずれか1つ、またはそれらの任意の組み合わせであって、最終的には、そのユニットまたはモジュールの機能を実行するためにプログラムされた1つ以上のプロセッサとなるものであり得る。さらに、同一または異なる種類の複数のモジュールを、1つのプロセッサで実行してもよい。論理モジュールのソフトウェアは、読み書き可能なハードディスク、CDROM、フラッシュメモリ、ROM、他のメモリまたは記憶装置等のコンピュータ可読媒体上に取り込むことができる。あるタスクを実行するために、必要に応じてソフトウェアプログラムを適切なプロセッサに搭載してもよい。本開示において、用語「タスク」「方法」「プロセス」を区別なく用いる。
【0035】
図1は、本開示の一実施形態に係る、新規のマルチメディア会議システム100を示す。システム100は、ネットワーク110、1つ以上のメディアリレーMCU(MRM)120および複数のメディアリレーエンドポイント(MRE)130を含む。ネットワーク110は、あらゆる所望のネットワークでよく、例えば、パケット交換ネットワーク、回路交換ネットワーク、IPネットワークまたはそれらのいかなる組み合わせであってもよい。ネットワーク上のマルチメディア通信は、H.320、H.323およびSIP等の通信プロトコルをベースとしてよく、また音声圧縮規格G.711およびG.719ならびに/またはビデオストリーミングおよび複数品質のストリームに対して使用されるH.264AVC、H.264 annexG、MPEG-4のような動画圧縮規格等のメディア圧縮規格を使用してもよい。
【0036】
エンドポイントとの接続を確立した後、MRM120は、圧縮音声を送信するようエンドポイントに指示する。MRM120は、各音声ストリームの音声エネルギーを決定し、それにより、1つ以上のエンドポイントに中継する1つ以上の音声ストリームを選択する。音声ストリームは、1つ以上のエンドポイントにてデコードおよびミキシングされ、エンドポイントのスピーカに送られる。
【0037】
同様の方法で、MRM120は、ビデオ画像を表示するレイアウトのセグメントに一致するサイズの圧縮ビデオ画像を送信するよう、エンドポイントに指示する。サイズは、例えば、各方向(高さおよび幅)における画素数で定義される。さらに、MRM120は、エンドポイントの1つを現時点での話者エンドポイントに指定し、現時点での話者エンドポイントに対し、関連レイアウトの話者用セグメントに合致する大きな画像サイズで、そのビデオ画像を送信するように要求する。ある実施形態において、2つ以上の異なるサイズで圧縮ビデオ画像を送信するようにエンドポイントを構成でき、各ビデオ画像のサイズは、異なるセグメントのサイズ(画素数)と一致させることができる。このような実施形態において、前回の話者エンドポイントは、その圧縮ビデオ画像を以下の2つのサイズで送信する:(1)通常の会議出席者のセグメントレイアウトに表示される通常サイズ;および(2)現時点での話者に割り当てられたレイアウトセグメントに表示される話者用のサイズ(大きな画像)。
【0038】
他の実施形態において、MRCのセッション中、エンドポイントは、そのビデオ画像を複数のストリームでMRM120に送信する。各ストリームは、圧縮ビデオ画像を様々な質で転送する。その質は、空間解像度(画像サイズ)、フレームレート、ビットレート、鮮明度等の点で異なっている。さらに、MRM120は、他の1つ以上のエンドポイントにどのストリームを中継するかを決定する。
【0039】
会議セッションの現時点での話者は、例えば、その音声エネルギーが最も高い会議出席者とすることができる。別の実施形態では、話者は、所定の期間中に最も活発に発言した会議出席者とすることができる。最も活発に発言した会議出席者は、例えば期間中のある割合において、例えば、60パーセント以上の期間において音声エネルギーが最も高い会議出席者と定義される。
【0040】
各MRE130は、リアルタイムかつ双方向の音声および/または映像通信を他のMRE130またはMRM120に提供する。MREは、MRMから中継された圧縮メディアを受信し、MRMからの指示に従って、リレー用圧縮音声およびビデオデータチャンクをMRMに送信する能力を備えたセッション中の会議出席者のターミナルでもよい。圧縮メディアは、リアルタイムプロトコル(RPT)のデータチャンクとして送信される。RTPに関する情報は、インターネット技術特別調査委員会(IETF)のウェブサイトwww.ietf.orgから入手できる。各MRE130は、適切かつ要求されたビットレート(単数または複数)および要求された圧縮規格に基づき、リレー用RTP圧縮音声データチャンクを送信する。同様に、各MRE130は、適切かつ要求されたサイズ(単数または複数)、ビットレートまたはフレームレート、および要求された圧縮規格に基づいて、リレー用RTP圧縮ビデオデータチャンクを送信する。一実施形態においては、各MRE130は、リレー用RTP圧縮音声データチャンクのヘッダフィールドまたは拡張ヘッダに音声エネルギーの指示情報を埋め込むことによって、その音声エネルギーの指示情報を送信するよう適用される。用語「データチャンク」および「パケット」を本明細書において区別なく用いる。
【0041】
MRCセッションの開始時、MRM120は、参加者数、レイアウト数、各レイアウトに表示する会議出席者数および会議出席者の異なる画像サイズ等の会議要件を処理する。表示される会議出席者とは、少なくとも1人の他の会議出席者、つまり受信側の会議出席者のCPビデオ画像に表示される会議出席者である。会議出席者の1人に対して表示される会議出席者は、他の会議出席者に対しては受信側の会議出席者にもなりうる。MRM120は、セッションの要件に基づき、セッション中にエンドポイントが送受信する各ストリームとの接続を確立するために、各エンドポイントと取り決めを行う。
【0042】
受信した圧縮音声またはビデオパケットの送信元を識別するため、各MRE130は、メディアデータのリレー用RTP圧縮チャンクのRTPヘッダに保持された識別子(ID)と関連付けられる。一実施形態において、IDは、MRE130によって無作為に選択され、その独自性が認証された後に、MRM120によって確認される。別の実施形態において、IDは、MRM120によって割り当てられ、関連するMRE130に伝達される。MRE130は、各リレー用圧縮メディアデータチャンクのRTPヘッダにおける同期元(SSRC)フィールドにIDを書き込む。別の実施形態において、IDは、RTPヘッダの寄与元(CSRS)フィールドに書き込まれる。代替の実施形態において、IDは、各リレー用RTP圧縮メディアデータチャンクの拡張ヘッダに書き込まれる。MRM120は、受信したリレー用RTP圧縮音声および/またはビデオパケットの送信元を、IDによって識別する。圧縮音声またはビデオストリームは、各々のIDと関連付けられる。ある実施形態において、同一のMRE130からのリレー用RTP圧縮音声データチャンクおよびリレー用RTP圧縮ビデオデータチャンクは、同一のIDを有する。代替の実施形態においては、同一のMRE130からのリレー用RTP圧縮音声データチャンクおよびリレー用RTP圧縮ビデオデータチャンクは、異なるIDを有する。ある実施形態において、MRE130が、そのビデオ画像を複数の異なる質のストリームでMRM120に送信した場合、各ストリームには異なるIDが割り当てられる。ある実施形態において、表示されるレイアウトの各セグメントは、IDと関連付けられ、MRM120は、例えば、音声エネルギー等の様々なパラメータに従って、セッション中に、各MRE130にセグメントのIDを配信する責を負う。別の実施形態において、各受信MRE130は、そのレイアウトの各セグメントのセグメントIDを決定し、それらのセグメントIDを関連情報と共にMRM120に送信する。各セグメントIDの情報には、解像度、フレームレート等、セグメントに必要なビデオパラメータが含まれる。本明細書において、用語「RTPヘッダ」は、一般的なRTPヘッダならびにRTPヘッダに追加される拡張子を含むものとする。
【0043】
ある実施形態においてIDは数字であり、他の実施形態において、IDは、MRE130または特定のストリームを一意的に識別できる他の値である。他の実施形態において、ID番号の代わりにIPアドレスおよびIPポートを使用してもよく、IPポートでは、リレー用RTP圧縮音声および/またはビデオデータチャンクをMRM120が受信する。
【0044】
一実施形態では、各会議出席者(MRE130)の受信音声エネルギーに従って、MRM120が、セッションの一定期間中、どの会議出席者をCP画像に表示するかを決定する。例えば、最も音声エネルギーの高いMRE130が選択および表示され、所定期間中その音声が流れる。さらに、MRM120は、表示された会議出席者のうち、誰をレイアウトの話者セグメントに表示するのかを決定する。代替の実施形態において、各MRE130は、どの会議出席者を表示レイアウトに表示するか、またどの会議出席者(MRE130)を話者セグメントに表示するかを決定する。このような実施形態において、MRE130のユーザは、米国特許公報第20030174202号に開示されたクリックビューオプションを使用することができ、その特許公報の内容は、参照することにより本明細書に組み込まれる。また、MRM120は、受信した適切なストリームを適切なMRE130に送信する。
【0045】
セッションのプロパティに基づき、各エンドポイントは、自身のCPビデオ画像を構築する。エンドポイントは、そのレイアウトに従って、受信した圧縮ビデオのペイロードパケットを2つ以上の圧縮ビデオセグメントメモリ(CVSM)に整理(organize)し、各CVSMは、レイアウトのセグメントと関連付けられる。各CVSMは、セグメントに表示される圧縮ビデオ画像ストリームのID番号と関連付けられる。受信した圧縮ビデオを保持するパケットのRTPヘッダ内に埋め込まれたID番号に基づいて、受信した圧縮ビデオデータが適切なCVSMに保存される。CVSMとID番号との関係は、セッション中に生じる活動によって動的に変化する。例えば、エンドポイントの会議への参加または退席、話者の変更等のセッション中の変更を受けたMRM120からの指示により、関係が変化する。エンドポイントは、エンドポイントIDとレイアウトのセグメントとを関連付ける相互割出表を有する。該表は、セッションの動態を反映して、セッション中に更新される。例えば、パケットのシーケンス番号またはRTPヘッダに埋め込まれたフレームのタイムスタンプに基づいて、CVSMが整理される。
【0046】
一実施形態において、エンドポイントは、RTPヘッダのフィールドまたはRTPパケットの拡張ヘッダに音声エネルギーの指示情報を埋め込むことで、それを送信するよう適用される。このような実施形態において、MRM120は、音声データを送信するRTPのヘッダを解析して、各エンドポイントの音声エネルギーを決定し、話者である会議出席者および/または表示される会議出席者を適宜選択する。代替の実施形態において、MRM120は、信号接続または制御接続で音声エネルギーの指示情報を送信するよう、エンドポイントに指示してもよいし、あるいはMRM120が受信した音声ストリームをデコードし、そのエネルギーを決定してもよい。
【0047】
音声圧縮が(例えば)圧縮規格G.7221.CまたはG.719に適合している他の実施形態において、音声ヘッダに音声エネルギーの指示情報を追加するよう、エンドポイントの音声コーデックが構成される。このような実施形態において、MRM120は、音声ペイロードのヘッダを検索し、音声エネルギーのフィールドを入手するよう適用される。他の実施形態では、専用の帯域外ステータスおよび制御接続を介して、音声エネルギーの指示情報をエンドポイントからMRM120へ送信する。
【0048】
また、エンドポイントは、各CVSMから入手し、保存した圧縮ビデオをデコードするよう適用される。デコードしたビデオは、セグメントフレームメモリ(FM)モジュールに保存される。セグメントFMは、関連セグメントでCPに表示される、デコードしたビデオデータを保存する。ある実施形態では、デコーダと関連セグメントFMとの間に計数回路を追加し、受信画像を関連セグメントのサイズに調整するために使用する。さらに、他の実施形態では、関連するCVSMのセグメントと関連付けられたセクション内のCP画像のFMに、デコードしたビデオが保存される。
【0049】
一実施形態において、CVSMは、セッションの間、特定のIDと関連付けられる。このような実施形態では、MRM120は、CVSM(レイアウトのセグメント)を表すIDを、関連セグメントに表示される圧縮ビデオデータと動的に関連付ける。このような実施形態において、レイアウトの変更をエンドポイントに通知する必要はない。MRM120は、セグメントの関連IDを、会議出席者から送信され、関連セグメントに表示される関連圧縮ビデオデータに関連付けることによって、変更を管理する。ある実施形態では、レイアウトのセグメントを表すIDを送信元IDに追加する、あるいは送信元IDをセグメントIDに変更する。
【0050】
MRM120は、受信MRE130の1つ(要求側MRE130と呼ぶ )が、提示側MRE130の1つからのイントラフレームを必要としていることを決定する。この決定は、要求側MRE130から受信したイントラ要求に基づいて行うことができる。例えば、パケットロスまたは要求側MRE130の会議出席者が要求側MRE130のレイアウトに提示側MRE130のビデオ画像を追加する旨の希望に応じて、この要求が送信される。場合によって、MRM120は、提示(表示)された会議出席者からのイントラフレームを要求側MRE130に送信する必要があると判断する。例えば、要求側MRE130が開催中のMRCセッションに途中参加した場合、MRE130は、提示(表示)されている各会議出席者からイントラフレームを取得する必要がある。従来のビデオ会議システムでは、このような場合において、イントラフレームの要否に関わらず、ビデオストリームを受信する全てのエンドポイントにイントラフレームが送信されることになる。開示された技術では、イントラフレームを必要としないMRE130へのイントラフレームの送信が回避される。
【0051】
一実施形態において、MRM120は、要求側MRE130が提示側MRE130からのイントラフレームを必要としていると判断すると、さらに、要求側MRE130のデコーダがデコーダによって復元された1つ以上の参照フレームを有しているかどうかを、該当の提示側MRE130から前回受信したビデオフレームを処理している間に確認する。当技術分野で周知のように、H.264、MPEG-4および類似のエンコーダおよびデコーダは、例えば、最大16フレームの複数の参照フレームを集約して使用できる。エンコーダは、現時点でのビデオ画像を処理しながら、これら参照フレームのうち、どれを使用して現時点のビデオ画像をエンコードするかを決定する。さらに、エンコーダは、どの参照フレームを現時点での圧縮ビデオフレームのエンコードに使用したかを特定する指示情報を、現在圧縮しているビデオ画像のヘッダに追加する。この指示情報は、受信した現時点での圧縮ビデオ画像のデコード処理とエンコード処理とを同期化するために、受信MREのデコーダによって使用される。
【0052】
MRCビデオセッションの開始時、MRM120は、エンコード/デコード処理で使用する複数の参照フレームを保存するよう、参加MRE130に指示する。その数は、最後の2フレーム、4フレーム、8フレーム等であってよい。開催中のセッションの間、MRM120は、要求側MRE130のデコーダが、提示側MRE130からのどの参照フレームを有しているのかを知る必要がある。一実施形態において、要求側MRE130は、最後に保存した参照フレームに対応するフレーム番号と共に、イントラ交換の要求信号を送信する。
【0053】
他の実施形態において、MRM120は、各MRE130から送信された幾つかの最後のフレームのフレーム番号を、表または他の便宜なデータ構造に保存する。MRM120は、該表、要求側MRE130からイントラフレームの要求を受信するタイミング、およびMRM120が提示側MRE130からフレームを受信するイベントと、要求側MRE130がこのフレームを受信およびデコードしていないという理由によりイントラの要求を受領するイベントとの間の予測待ち時間に基いて、どの参照フレームが要求側MRE130に存在するかを推定する。
【0054】
要求側MRE130のデコーダが先の参照フレーム(このフレームは存在する先の参照フレームと呼ばれる)を有しているとMRM120が判断した場合、MRM120は、存在する先の参照フレームに基づいて次のビデオフレームをインターフレームとして圧縮し、先に保存した参照フレームを削除するよう、提示側エンドポイントの関連ストリームのエンコーダに指示する。このような場合、全ての受信MRE130は、古い先のフレームに基づいて圧縮されたインターフレームを取得し、全ての受信MRE130は、その時点から提示側MREと再度同期化される。
【0055】
要求側MRE130のデコーダが提示側MRE130からのイントラフレームを必要としているとMRM120が判断した場合、MRM120は、全ての受信MRE130にイントラフレームを送信することなく、要求側MRE130を含む、全ての受信MRE130のデコーダの参照フレームの同期化処理を開始する。提示側MRE130が1つ以上のストリームを送信する場合、「提示側MRE130の通常のストリーム」を表す用語は、要求側MRE130と同じ品質レベルで受信する他のMRE130に送信されるストリームを指す。
【0056】
ある実施形態において、複数の連続フレームが同期化処理に関与する。複数のフレームに跨がって処理を拡げる理由の1つには、提示側MRE130のコンピューティングリソース、ならびに提示側MRE130とMRM120との間およびMRM120と要求側MRE130との間のネットワークリソースの消費急増の回避が挙げられる。ある時点において、例えば、提示側MRE130がフレーム番号M?1を送信すると、MRM120は、通常のストリームと並行して、追加ストリーム、一時的なストリームを送信するよう、提示側MRE130に指示する。一時的なストリームは、カメラから受信したビデオ画像ではなく、通常ストリームの参照フレームメモリをエンコードすることで作成される。一時的ストリームのエンコードされた第1フレームは、イントラフレームである。前記イントラフレームは、通常のストリームと同じ空間解像度を有するが、例えば、低品質、低鮮明度、低いフレームレート等で圧縮される。
【0057】
MRM120からの指示を提示側MRE130が受信すると、例えば、提示側MRE130のカメラからのフレームMが、インターフレームとして1つ以上の品質レベルで圧縮されてMRM120に送信される。また、フレームMと関係する通常ストリームの参照フレームを低品質のイントラフレーム(TIm)に圧縮することによって一時的ストリームが開始されて、一時的ストリームがMRM120に送信され、続いて、MRM120は、その一時的ストリームを要求側MRE130に中継する。
【0058】
要求側MRE130はTImをデコードし、デコードした低品質の画像は、CP画像に配置され、会議出席者に対して提示(表示)される。並行して、デコーダは、提示側MRE130の通常ストリームのフレームMへの参照に関連する参照フレームを作成する。
【0059】
提示側MRE130のエンコーダは、M+1、M+2等のフレームNまでに関する通常ストリームの参照メモリをインターフレームとしてエンコードすることによって、一時的ストリームのエンコードを継続する。フレームの数は、ゼロから所定のフレーム数、例えば10フレームまでの範囲内でありうる。これらのフレームは、各インターフレームの圧縮の質が先のものよりも高いので、品質向上フレームと呼ばれる。ビデオカメラから受信したフレームNは、SPフレームとして圧縮される。SPフレームは、Pフレームとして、通常ストリームで他の受信エンドポイントに送信される。このフレームはSPnと呼ばれてもよい。SPnフレームをエンコードする間に作成された、提示側MRE130のエンコーダにおける参照フレームは、SSPnとして圧縮される。SSPnフレームは、一時的ストリームの最終フレームとして、要求側MRE130に送信される。
【0060】
要求側MRE130は、受信したSSPnをデコードすることにより、フレームNと関連する参照フレームを作成する。デコードした画像は、CPビデオ画像に配置され、フレームNとして提示(表示)される。この時点において、SSPnをデコードすることによって作成された参照フレームは、他の受信MRE130で作成された同じ品質レベルの参照フレームメモリならびに提示側MRE130の通常ストリームの参照メモリと同一である。次のフレームN+1等は、一旦エンコードされてから、要求側MRE130および同じ品質レベルを有する他方の受信MRE130に対して、通常ストリームとして送信される。
【0061】
別の実施形態において、上述した例のように、通常ストリームのエンコーダの参照フレームからではなく、カメラから受信したビデオ画像から、一時的ストリームを作成する。このような実施形態において、SPおよびSSPフレームは、カメラから受信した同一のビデオ画像から作成される。ある時点において、例えば、提示側MRE130がフレーム番号M-1を送信する時点において、MRM120は、通常ストリームと並行して、追加ストリーム、一時的ストリームを送信するよう、提示側MRE130に指示する。一時的ストリームは、通常ストリームのエンコード同様に、ビデオカメラから受信したビデオフレームをエンコードすることにより作成される。一時的ストリームのエンコードされた第1フレームは、フレームM(TIm)のイントラフレームである。前記イントラフレームは、通常ストリームと同じ空間解像度を有するが、低品質、低鮮明度、低いフレームレート等で圧縮される。
【0062】
要求側MRE130はTImをデコードし、低品質でデコードされた画像は、CP画像に配置され、会議出席者に対して提示(表示)される。並行して、デコーダは、提示側MRE130からのフレームMと関連する参照フレームを作成する。提示側MRE130のエンコーダは、ビデオカメラから受信する次のビデオフレームをインターフレームとしてエンコードすることにより一時的ストリームのエンコードを継続する。これらのインターフレームは、フレームM+1、M+2等からフレームNまでに関わっている。フレームの数は、ゼロから所定のフレーム数、例えば10フレームまでの範囲内でありうる。これらのフレームは、各インターフレームの圧縮の質が先のものよりも高いので、品質向上フレームと呼んで良い。
【0063】
通常ストリームのフレームNは、他のインターフレームとは異なる形で圧縮される。フレームNはSPフレームとして圧縮される。この時点において、要求側MRE130は、少なくとも1つの他の受信MRE130と同様の質を有する。しかし、要求側MRE130の参照フレームメモリは、他の受信MRE130と類似しなくてもよい。
【0064】
従って、MRM120は、要求側MRE130の参照フレームを、同品質のストリームを有する他の受信MRE130と同期化する。要求側MRE130の参照メモリを他の受信MRE130と同期化するために、MRM120は、一時的ストリームのフレームNをSSPnフレームとしてエンコードするよう、提示側MRE130のエンコーダに指示し、SSPnフレームは、一時的ストリームの最終フレームとして、要求側MRE130に送信される。
【0065】
要求側MRE130は、受信したSSPnをデコードすることにより、フレームNと関連する参照フレームを作成する。デコードした画像は、CPビデオ画像に配置され、フレームNとして提示(表示)される。この時点において、SSPnをデコードすることによって作成した参照フレームメモリーは、他の受信MRE130で作成された同じ品質レベルの参照フレームメモリならびに提示側MRE130の通常ストリームの参照メモリと同一である。次のフレームN+1等は、一旦エンコードされて、要求側MRE130および同一の品質レベルを有する他の受信MRE130に対して、通常ストリームとして送信される。
【0066】
先にエンコードした複数の参照フレームが使用される別の実施形態において、例えば、提示側MRE130がフレーム番号M-1を送信する際、先の参照フレームを一群の要求パラメータと共に要求側MRE130に送信し、次いで先の参照フレームに基づいて次のフレームをエンコードするために、可逆圧縮が使用される。MRM120は、1つ以上の通常ストリームと並行して、追加ストリーム、一時的ストリームを送信するよう、提示側MRE130に指示する。前記一時的ストリームは、通常ストリームのフレームM-1をエンコードする間に作成された、参照フレームを可逆圧縮することによって作成される。フレームM-1の可逆圧縮参照フレーム(LLCRF)は、MRM120を介して、帯域外でIP接続を通じ、提示側MRE130から要求側MRE130へ送信される。また、一時的ストリームは、「画像パラメータセット」「シーケンスパラメータセット」等の要求パラメータのセットも同時に送ることができる。要求パラメータのセットに関する情報は、H.264等の圧縮規格から入手できる。
【0067】
別の実施形態において、提示側MRE130は、直接要求側MRE130に向けて一時的ストリームを送信する。LLCRFおよび要求パラメータのセットは、少数のパケットで送信でき、1つ以上のフレームインターバルが必要となり得る。可逆圧縮方式は、例えば、ZIP、レンペル_ジフ=ウェルチ(LZW)、可逆JPEG2000等、いずれの可逆方式であってもよい。
【0068】
さらに別の実施形態において、他のMRE130が、中継RTP圧縮ビデオデータチャンクのストリームを第2解像度で提示側MRE130から受信する一方で、要求側MRE130が、中継RTP圧縮ビデオデータチャンクのストリームを第1解像度で提示側MRE130から既に受信していてもよい。第2解像度のストリームを通常ストリームと呼ぶ。ある時点において、要求側MRE130に、受信するストリームの解像度を第1から第2に変更する必要が生じる場合がある。このような実施形態において、提示側MRE130は、一時的エンコーダを割り当てる。前記一時的エンコーダには、第1解像度の切替参照フレームが読み込まれる。次いで、読み込まれた切替参照フレームの解像度が、第1解像度から第2解像度へ変更される。並行して、提示側MRE130の切替参照フレームと同等である、要求側MRE130の参照フレームの解像度が、提示側MRE130と同様の方法で、第1解像度から第2解像度へ変更される。従って、この時点において、提示側MRE130の一時的エンコーダと、要求側MRE130のデコーダは、同じ参照フレームを有する。
【0069】
提示側MRE130のビデオカメラから受信した1つ以上の次のビデオ画像は、一時的エンコーダによって第2解像度で圧縮され、他の受信エンドポイントに送信される通常ストリームと並行して、要求側MRE130に送信される。1つ以上のビデオフレームの後に、通常のエンコーダが、ビデオカメラから受信した次のビデオ画像をSPフレームとして圧縮し、通常ストリームで1つ以上の受信MRE130に向けて送信する一方、一時的エンコーダは、同じビデオ画像をSSPフレームとして圧縮し、要求側MRE130に向けて送信する。SPおよびSSPフレームの送信後、提示側MRE130は一時的エンコーダを解放し、要求側MRE130は、1つ以上の他の受信MRE130と同様に、通常ストリームを受信する。さらに別の実施形態において、SPおよびSSPフレームは、切替参照フレームを用いて作成および送信される。
【0070】
要求側MRE130は、可逆アルゴリズムを用いて、取得したLLCRFおよび要求パラメータのセットを復元する。次いで、要求側MRE130のデコーダには、復元した参照フレームおよび要求パラメータのセットが読み込まれる。従って、デコーダは、参照フレームM-1と同じ参照フレームを有し、他の受信MRE130の要求パラメータセットと同一のセットを有する。提示側MRE130のエンコーダは、参照フレームM-1に基づいて次のカメラフレームをエンコードし、結果生じたインターフレームを、要求側MRE130を含む受信MRE130に送信する。さらに、要求側MRE130のエンコーダは、先の参照フレーム全てを削除してもよい。
【0071】
別の実施形態において、上記で開示した技術を組み合わせて使用してもよい。このような実施形態においては、通常ストリームと同じ解像度ではあるが低品質のイントラフレームから開始され、少数の品質改良フレームに続く一時的ストリームが使用される。一般的ビデオ会議セッションでは、連続フレーム間での変化は僅かであるため、少数の品質向上フレームの後、一時的ストリームのエンコーダの入力部における非圧縮フレームは、先のフレームをエンコードした後に作成される参照フレームと酷似している。このような実施形態において、提示側MRE130は、通常ストリームと一時的ストリームの参照フレーム間の差異を、可逆圧縮技術を用いて圧縮し、圧縮した差異を要求側MRE130に送信する。要求側MRE130は、差異を復元し、デコーダの参照フレームを適宜修正する。
【0072】
可逆圧縮技術を用いて両ストリームのエンコーダで同一フレームを圧縮することにより、両ストリームのエンコーダおよびデコーダにおいて同一の参照フレームが生成され、その結果、次のフレームが通常のエンコーダで圧縮され、通常ストリームが要求側MRE130ならびに他の受信MRE130に送信される。
【0073】
一実施形態において、上述したように、MRM120は、提示側MRE130に指示することによって、一時的ストリームに関連する活動を制御する。他の実施形態において、MRM120は、提示側MRE130とMRM120との間に一時的ストリームを送るチャンネルを割り当てることによって、単に処理を開始する。これ以降、MRE130は、低品質のイントラフレームから始まり、SSPnで終了する全プロセスを自動的に実行し、その後一時的ストリームの余分なチャンネルを閉鎖するように構成される。これに代わる実施形態において、MRM120はプロセスを開始するが、提示側MRE130および要求側MRE130が、一時的ストリームに沿って、あるプロセスから他のプロセスへの移行時期を取り決める。
【0074】
ある実施形態において、一時的ストリームを作成するために割り当てられたエンコーダは、通常ストリームのエンコーダとは異なるエンコーダであってもよい。異なるエンコーダは、通常ストリームのエンコーダの参照メモリにアクセスできる。また、異なるエンコーダは、遷移期間中に通常のエンコーダを先導し、エンコーダのアクション間の変化する指示により、特別なエンコードの実行時期を指示する。他の実施形態においては、単一のエンコーダが、両ストリームを作成するように構成される。
【0075】
MRE130は、選択された会議出席者から受信した中継RTP圧縮ビデオストリームのビデオ画像のデータチャンクをデコードし、各画像を適切なレイアウトのセグメント内に表示する。MRE130は、受信した中継RTP圧縮音声ストリームの音声データチャンクをデコードし、デコードされた様々な音声ストリームのミキシングを行い、ミキシングした音声をMRE130のスピーカに転送する。逆方向からいえば、MRE130は、MRM120からの指示に従って、リレー用RTP圧縮音声およびビデオデータチャンクを送信する。
【0076】
MRE130の上述した機能に加えて、2つ以上の受信MRE130に中継するために圧縮ビデオの通常ストリームをMRM120に送信する、提示側MRE130は、新規の方法にて、要求側MRE130に関係するイントラフレームの要求に応答する。エンコーダおよびデコーダが複数の先の参照フレームを保存し、これらを使用する一実施形態において、2つ以上の関連MRE130に中継するために、イントラフレームをエンコードし、それを次のフレームとして通常のストリームでMRM120に送信する代わりに、提示側MRE130は、全ての関連MRE130にインターフレームを提供することによって応答する。提供されたインターフレームは、その圧縮ビデオのストリームに関与する全てのMRE130に存在する、同一参照フレーム(IRF)に基づいてエンコードされる。エンコードされたインターフレームは、関係MRE130に向けて送信され、エンコーダは、先に保存した全ての参照フレームを解放する。要求側MRE130および他の受信MRE130のデコーダは、先に保存したIRFのコピーに基づいて、提供されたエンコード済のインターフレームをデコードする。
【0077】
エンコーダおよびデコーダが、現在のフレームをエンコード/デコードするために先の複数の参照フレームを使用する、MRE130の一実施形態において、提示側MRE130のエンコーダは、要求側MRE130のデコーダに先の参照フレームが存在する旨の通知を受ける。エンコーダは、他の受信MRE130にも存在する参照フレームと同一であるこの参照フレームをIRFとして使用する。提示側MRE130のカメラから受信した次のビデオ画像は、IRFに基づいてインターフレームとして圧縮され、提示側MRE130のエンコーダにある、先の参照フレームの残りが解放される。
【0078】
ある実施形態において、提示側MRE130は、圧縮ビデオの新規かつ一時的なストリームを送信するために、通常のストリームと並行して、MRM120との一時的な接続を確立する。一時的ストリームは、MRM120によって要求側MRE130に中継される。一時的ストリームは、通常ストリームに帰属する今後のインターフレームを受信およびデコードするために、要求側MREのデコーダの準備に使用され、今後のインターフレームは、他の受信MRE130に対しても送信される。一時的ストリームおよび通常ストリームは、同一の解像度を有する。ただし、一時的ストリームを低品質のイントラフレームから開始し、その質をあるインターフレームから次のインターフレームへと改善することも可能である。
【0079】
一時的ストリームから通常のストリームへと切替えるために、提示側MRE130は、カメラから受信した次のビデオ画像を通常ストリームのSPフレームとしてエンコードし、それに対応する一時的ストリームのフレームをSSPフレームとしてエンコードする。SPフレームおよびSSPフレームをデコードした結果として、他の受信MRE130ならびに要求側MRE130のデコーダのそれぞれにIRFが生成される。通常のエンコーダの参照フレームもまた、IRFと同一である。従って、カメラから受信した次のビデオ画像をIRFに基づいてエンコードでき、要求側MRE130を含む全ての関連MRE130に対して通常のストリームでそれを送信できる。一実施形態において、一時的ストリームのフレームは、通常ストリームの参照フレームをエンコードすることにより作成される。さらに別の実施形態において、両ストリームは、提示側MREのビデオカメラから受信したビデオ画像をエンコードすることにより作成される。
【0080】
さらに開示したシステムの別の実施形態では、1つ以上の通常のストリームと並行して、一時的ストリームを送信するための一時的接続を確立することによって、イントラフレームの必要性に対応する。一時的ストリームは、通常ストリームの少し前のフレームをエンコードする間に作成された、参照フレームの可逆圧縮によって作成される。一時的接続は、例えば、MRM120を介する提示側MRE130から要求側MRE130へのIP接続上の、開放された帯域外の接続となりうる。可逆圧縮参照フレーム(LLCRF)は、少数のパケットで送信でき、1つ以上のフレームインターバルが必要となり得る。可逆圧縮方式は、例えば、ZIP、レンペル_ジフ_ウェルチ(LZW)、可逆JPEG2000等であってよい。提示側MRE130は、LLCRFを送信すると共に、H.264圧縮規格に開示された「画像パラメータセット」または「シーケンスパラメータセット」等をデコードするために必要なパラメータを送信する。
【0081】
一実施形態では、上記で開示した方法を組み合わせて使用する。このような実施形態において、提示側MRE130は、通常のストリームと同じ解像度だが相対的に質が悪いイントラフレームによって一時的ストリームを開始し、少数の品質向上フレームで一時的ストリームを継続する。少数の品質向上フレームの後、一時的ストリームのエンコーダにある参照フレームは、通常のストリームのエンコーダにある参照フレームに類似する。この時点において、2つのエンコーダの参照フレーム間の差異が算出され、可逆圧縮方式にて圧縮される。圧縮された前記の差異は要求側MRE130に送信される。要求側MRE130にて、可逆圧縮された差異が可逆的に復元され、要求側MRE130のデコーダにある参照フレームに追加されることにより、要求側MRE130のデコーダならびに他の受信MRE130のデコーダにおいてIRFが作成される。この時点で一時的ストリームが終了され、通常ストリームが、要求側MRE130に向けても送信される。
【0082】
別の実施形態では、上記で開示した方法を組み合わせて使用する。このような実施形態において、提示側MRE130は、通常ストリームと同じ解像度だが低い品質のイントラフレームによって一時的ストリームを開始し、少数の品質向上フレームで一時的ストリームを継続する。少数の品質向上フレームの後、一時的ストリームのエンコーダの入力部において提示側MRE130のカメラから受信した次の非圧縮フレームは、先のフレームをエンコードした後に作成された参照フレームに類似する。このような実施形態において、通常のストリームのエンコーダおよび一時的ストリームのエンコーダは、次のフレームと参照フレームとの差異を可逆圧縮方式にて圧縮する。
【0083】
提示側MRE130において、両ストリームのエンコーダで、可逆圧縮方式を用いて同一フレームを圧縮することにより、両ストリームのエンコーダおよびデコーダにおいて同一の参照フレームが生成される。その結果、提示側MRE130の通常のエンコーダで次のフレームが圧縮され、単一ストリーム、つまり通常のストリームがMRM120に向けて送信され、MRM120は、要求側MRE130ならびに他の受信MRE130にそれを配信する。通常ストリームおよび一時的ストリームの可逆圧縮は、エンコーダおよびデコーダの両方で量子化モジュールをバイパスすることによって実施される。MRE130のさらなる詳細な情報は、図11とあわせて以下に開示される。
【0084】
別の実施形態において、新規のMRM120は、要求側MRE130による提示側MRE130からのイントラフレームの要求に対応するプロセスを開始するように構成され、残りの活動は、提示側MRE130および要求側MRE130によって管理される。
【0085】
マルチキャストを使用するさらに別の実施形態において、MRM120は、一時的ストリームが使用されている限り、新規のマルチキャストアドレスを問い合わせ、次いで、通常のストリームに関連付けられたマルチキャストアドレスを問い合わせるよう、要求側MRE130に指示する。同時に、MRM120は、通常ストリームに関連付けられたマルチキャストアドレスに通常ストリームを送信するのと並行して、一時的ストリームの生成を開始し、新規のマルチキャストアドレスにそれを送信するよう、提示側MRE130に指示する。MRM120の詳細な情報は、図2、3、4、8Aおよび8Bとあわせて以下に開示される。
【0086】
図2は、一実施形態に係る、MRM120の関連要素を示すブロック図である。MRM120は、例えば、ネットワークインターフェースモジュール(NI)220と、1つ以上のセッション圧縮音声RTPプロセッサ(SCARP)230と、信号処理および制御モジュール(SCM)240と、1つ以上のセッション圧縮ビデオRTPプロセッサ(SCVRP)250とを含み得る。これに代わる実施形態において、MRM120は、セッション毎に1つ以上のSCM240を含んでもよい。
【0087】
ネットワークインターフェースモジュール(NI)220は、ネットワーク110を介して、MRE130等の複数のビデオ会議機器と通信する。ネットワークインターフェース220は、H.323およびSIP等の1つ以上の通信規格に基づいて、通信を解析する。さらに、ネットワークインターフェースモジュール220(NI)は、受信した通信の物理層、データリンク層、ネットワーク層およびトランスポート層(UDP/TCP層)を処理する。NI220は、MRM120およびMRE130または他のノード(図示せず)との間で、制御情報およびデータ情報を受送信する。
【0088】
NI220は、MRE130とMRM120との間で通信された様々な信号およびストリームを多重送信/分離送信する。圧縮音声のRTPチャンクは、NI220を介して、MRE130およびSCARP230との間でやりとりされる。各SCARP230は、ある特定のセッションと関連付けられる。NI220は、MRE130のパケットソースおよび/または宛先IPポート、ならびにIPアドレスおよび/またはIDから、MRE130がどのセッションに参加しているかを判断する。その結果、NI220は、特定のMRE130から受信した圧縮音声のRTPチャンクを、どのSCARP230が受信すべきかを決定できる。逆方向からいえば、SCARP230から受信した圧縮音声のRTPチャンクは、NI220によってIPパケットに変換され、適切なMRE130または他のノードに向けて転送される。
【0089】
ビデオデータのRTP圧縮チャンクは、NI220を介して、MRE130とSCVRP250との間でやりとりされる。各SCVRP250は、ビデオ会議セッションと関連付けられる。NI220は、MRE130のパケットソースおよび/または宛先IPポート、ならびにIPアドレスおよび/または転送元IDから、MRE130がどのセッションに参加しているかを判断する。その結果NI220は、特定のMRE130から受信した圧縮パケットを、どのSCVRP250が受信すべきかを決定できる。逆方向からいえば、SCVRP250から受信した圧縮ビデオのRTPチャンクは、NI220によってIPパケットに変換され、適切なMRE130または他のノードに向けて転送される。
【0090】
また、NI220は、SCM240とMRE130との間で信号処理データおよび制御データの転送および受信を行う。さらに、NI220は、提示側MRE130から要求側MRE130へ送られるイントラフレームの必要性に対応するプロセスの信号処理と制御も扱う。
【0091】
MRM120が対処する各会議セッションにおいて、SCARP230をセッションの音声を処理するために割り当てる。SCARP230は、NI220を介して、音声データのリレー用RTP圧縮チャンク(ヘッダおよびペイロード)をセッション参加中のMRE130から受信する。SCARP230は、複数のMREシーケンシャルメモリを管理し、MREシーケンシャルメモリの各々が、セッションに参加中の各MRE130に対して割り当てられる。SCARP230は、MRE130から受信したリレー用RTP圧縮音声チャンクのRTPヘッダを解析し、そのチャンクを適切なMREのシーケンシャルメモリに保存する。また、SCARP230は、リレー用RTPヘッダに埋め込まれたシーケンス番号またはタイムスタンプに従って、リレー用RTP圧縮音声チャンクをMREのシーケンシャルメモリに適切に保存するための順番を決定する。
【0092】
SCARP230は、各MRE130の音声エネルギーに関する情報を収集する。一実施形態において、音声エネルギーは、受信した各リレー用RTP圧縮音声チャンクのリレー用RTPヘッダ内の適切なフィールドを解析することにより取得される。さらに別の実施形態において、音声エネルギーは、受信したリレー用RTP圧縮音声チャンクの音声エネルギーレベルをサンプリングすることによって取得される。
【0093】
SCARP230は、周期的に、通常は数十ミリ秒毎に、音声を流すためにMRE130に転送される、一群の音声チャンクのリレー用RTP圧縮ストリームを選択する。この選択は、受信ストリームに関連付けられた音声エネルギーの比較に基づいている。選択されるリレー用RTP圧縮ストリームの数は、MRE130の音声ミキシング性能によって決まる。また、SCARP230は、どのMRE130を主要スピーカ(例えば、最も大きなレイアウトセグメント内に表示されるもの)にするかを選択し、その結果、信号処理情報および制御情報をSCM240に転送する。主要スピーカは、ある期間に亘って、音声として流すストリームの選択(heard-streams-selection)インターバルのうち一定のパーセンテージにおいて音声エネルギーが最も高いスピーカーとしてよい。
【0094】
さらに別の代替実施形態において、SCARP230は、MRE130の音声エネルギーに関する情報をSCM240に転送する。SCM240は、MRE130の主要スピーカと、音声として流す(ミキシングされる)音声データのRTP圧縮ストリーム群とを選択し、適切なSCARP230およびSCVRP250に対して信号処理データおよび制御データを送信する。ある実施形態において、選択された会議出席者群および/または主要スピーカに関する情報も、MRE130に転送される。SCM240から送信された信号処理データおよび制御データに従って、SCARP230は、選択群のリレー用RTP圧縮音声チャンクを編成し、それらを中継圧縮音声データチャンクとして、NI220を介して適切なMRE130に中継する。SCARP230に関するさらなる情報は、図3とあわせて以下に開示する。
【0095】
MRM120が処理する各ビデオ会議セッションに対してひとつのSCVRP250が割り当てられる。SCVRP250は、NI220を介して、セッションに参加中のMRE130から、リレー用RTP圧縮ビデオチャンクのストリーム(ヘッダおよびペイロード)を受信する。SCVRP250は、複数のMREシーケンシャルメモリを管理し、MREシーケンシャルメモリの各々がセッションに参加している各MRE130に割り当てられる。SCVRP250は、受信したリレー用RTP圧縮ビデオチャンクを解析し、そのフレーム番号またはタイムスタンプに従って、適切なMREシーケンシャルメモリにそれを保存する。時折、セッションで使用されるフレームレートによっては、SCVRP250が、SCM240から受信する信号および制御情報に従って、1つ以上のMREシーケンシャルメモリから成る一群にアクセスし、NI220を介して、選択したMRE130群のデータを適切なMRE130に向けて中継する。
【0096】
遷移期間中、SCVRP250は、通常の動作に加えて、追加のシーケンシャルメモリを割り当てる。追加されたシーケンシャルメモリは、提示側MRE130から受信する一時的ストリームを保存するために使用され、提示側MREから受信する1つ以上の通常のストリームと並行して、要求側MRE130に向けられる。さらに、この一時的メモリは、同様の品質レベルを有する1つ以上の通常のストリームの代わりに、要求側MRE130に向けて排出される。SCVRP250に関するさらなる情報は、図4とあわせて以下に開示する。
【0097】
SCM240は、セッションの運営を制御する。SCM240は、(前もって予定されているか、または突然行われる)会議セッションを開始し、エンドポイントとの接続を設定し、会議プロパティを決定し、エンドポイントが適宜メディアを転送および受信するよう設定する。さらに、SCM240は、リソースの割り当て、IDの割り当て、複数の参照フレームを使用するようエンドポイントのエンコーダに対する指示等を行う。時に応じて、SCMは、音声エネルギーおよびビデオソースに基づいて新たな話者を選択し、これらの音声エネルギーおよびビデオソースは、話者である会議出席者の指標と共に、各エンドポイントに送信される。この新たな選択は、SCARP230およびSCVRP250に適宜転送される。SCM240は、レイアウトの変更に応じた適切なビデオパラメータを送信するよう、エンドポイントに指示する。
【0098】
SCM240は、ビデオデータのどのRTP圧縮ストリームをどのMRE130に中継するか、また、どのレイアウトセグメントにビデオ画像を表示するかを決定する。SCVRP250は、SCM240から受信した指示に基づいて、適切なストリームをMRE130に中継し、どのレイアウトセグメントに各ビデオ画像を表示するかをMRE130に指示する。一実施形態において、SCVRP250は、自身が送信する中継RTP圧縮ビデオデータチャンクのRTPヘッダー内のIDを変更することにより、会議出席者の提示(表示)に変更が生じたことをMRE130に通知する。ヘッダー内で変更されたIDは、CP画像のどのセグメントに、中継RTP圧縮ビデオデータチャンクを表示すべきかを、受信MRE130に対して指定する指標として使用される。これに代わる実施形態において、SCM240は、NI220を介し、信号処理データおよび制御データによって、MRE130に対してこれらの変更を通知する。さらに別の実施形態において、SCVRP250は、自身が送信する中継RTP圧縮ビデオデータチャンクのRTPヘッダー内に所定のフィールドを設定することによって、MRE130に対して変更を通知する。RTPヘッダの所定フィールドは、MRE130がどのセグメントに中継RTP圧縮ビデオデータチャンクを表示すべきかを指示するために使用される。
【0099】
上記の活動に加え、SCM240は、遷移および切替期間を管理する。SCM240は、複数の受信MRE130のうち、1つのMRE130からのイントラ要求に応じる。SCM240は、例えば、イントラの要求がレイアウトの変更に起因するものであるのか、または新たな参加者が会議に参加したことに起因するものであるのか、その要求の理由を判断する。SCM240は、提示側MRE130からのユニークなストリームを搬送するための一時的接続を管理する。MRM120の幾つかの実施形態では、イントラ要求に対して次のように対応する。すなわち、SCMは単に遷移期間を開始し、提示側MRE130および要求側MRE130が、一時的な低品質フレームの数と、通常ストリームへ切替えて戻す時期とを管理する。MRM120に関するさらなる情報は、図3、図4、図8および図11とあわせて以下に開示する。
【0100】
図3は、様々な実施形態における技術および要素を実施する、SCARP230の関連要素を示す簡略ブロック図である。SCARP230は、RTP音声入力バッファ310と、音声RTPヘッダパーサおよびオーガナイザ320と、複数のMREシーケンシャル音声メモリ330と、内部バスまたは共有メモリでありうるバス340と、複数のRTP圧縮音声ストリームビルダ350と、音声エネルギープロセッサ360とを含む。SCARP230は、例えば、内部バスまたは共有メモリでありうる制御バス365を介して、SCM240によって制御される。SCARP230の入力部および出力部は、圧縮音声データチャンクの受信および転送を行う圧縮RTP音声データインターフェース(CRADI)305を介して、NI220に接続される。CRADI305は、内部バスまたは共有メモリでありうる。
【0101】
各SCARP230は、MRM120が処理する会議セッションの音声処理を担当する。SCARP230のRTP音声入力バッファ310は、CRADI305から、リレー用RTP圧縮音声データチャンクを取得する。リレー用RTP圧縮音声データチャンクは、セッションに参加するMRE130から受信される。一実施形態において、RTP音声入力バッファ310は、リレー用RTPヘッダ内のID番号を使用して、どのリレー用RTP圧縮音声データチャンクをCRADI305から取得するのかを決定する。これに代わる実施形態において、RTP音声入力バッファ310は、受信した関連パケットの送信元および/または宛先IPアドレスならびにポート番号に基づいて、NI220からリレー用RTP圧縮音声データチャンクを入手する。
【0102】
音声RTPヘッダパーサおよびオーガナイザ320は、RTP音声入力バッファ310からリレー用RTP圧縮音声データチャンクを抽出し、そのリレー用RTP圧縮音声データチャンクのヘッダを解析し、ID、チャンクのシーケンス番号および/またはタイムスタンプならびに存在する場合は音声エネルギー等の関連情報を入手する。ある実施形態においては、音声エネルギー情報を入手するために、音声ヘッダが解析される。音声RTPヘッダパーサおよびオーガナイザ320は、例えばIDに基づいて、解析したリレー用RTP圧縮音声データチャンクを適切なMREシーケンシャル音声メモリ330に転送し、音声エネルギーを音声エネルギープロセッサ360に転送する。
【0103】
各MREシーケンシャル音声メモリ330は、MRE130(図1)のそれぞれと関連付けられる。関連MREから受信したリレー用RTP圧縮音声データチャンクは、それらのシーケンス番号および/またはタイムスタンプに基づいて、MREシーケンシャル音声メモリ330に保存される。各MREシーケンシャル音声メモリ330には、全てのMREシーケンシャル音声メモリ330を1つ以上のRTP圧縮音声ストリームビルダ350と接続するバス340を介して、アクセス可能である。
【0104】
各RTP圧縮音声ストリームビルダ350は、1つ以上のMRE130に対して割り当てられる。RTP圧縮音声ストリームビルダ350は、MREマルチプレクサおよびシーセンサ352と、MRE RTP音声出力バッファ354とを具備し得る。RTP圧縮音声ストリームビルダ350は、1つ以上のMREシーケンシャル音声メモリ330にアクセスすることによって、圧縮音声リレー用データチャンクの1つ以上の送信元から成るグループを選択する。このグループの選択は、例えば、音声エネルギープロセッサ360から受信した制御信号、そのエネルギーとは無関係にユーザが指定する特定の送信元、または宛先MRE130の音声ミキシング性能等、様々なパラメータに基づいて行うことができる。通常、選択された送信元グループには、宛先MRE130から受信した音声ストリームは含まれない。これに代わる実施形態において、RTP圧縮音声ストリームビルダ350は、どのMRE130を選択すべきかに関して、宛先MRE130から制御信号を受信する。さらに、時に応じて、RTP圧縮音声ストリームビルダ350は、会議中のリアルタイムの変更に従って、入力の選択を変更できる。
【0105】
MREマルチプレクサ・シーセンサ352は、バス340から入力された1つ以上のリレー用RTP圧縮音声データチャンクのストリームを選択する。選択されたリレー用RTP圧縮音声データチャンクのストリームは、1つの中継RTP圧縮音声データチャンクのストリームに多重化され、MRE RTP音声出力FIFO354に送信され、またそこからCRADI305およびNI220を介して、適切なMRE130に向けて転送される。
【0106】
RTP圧縮音声ストリームビルダ350の代替実施形態(図示せず)には、一群のセレクタが含まれる。各セレクタは、バス340に接続され、MREシーケンシャル音声メモリ330のうち1つの出力を選択する。セレクタの他方のポートは、FIFOを介してCRADI305に接続される。このような実施形態において、選択された音声ストリームは、複数の中継RTP圧縮音声データチャンクのストリームとして、MRE130に向けて送信される。
【0107】
別の実施形態において、RTP圧縮音声ストリームビルダ350は、会議セッションに参加している会議出席者のグループに対して使用され、ここで全ての関連MRE130は、中継RTP圧縮音声データチャンクの同一ストリームを受信する。
【0108】
音声エネルギープロセッサ360は、各リレー用RTP圧縮音声データチャンクに関連する音声エネルギーを受信し、この情報に基づいて、音声エネルギープロセッサ360は、次の周期において、どのMRE130を選択してその音声をミキシングするかを決定し、その選択を適切なRTP圧縮音声ストリームビルダ350のMREマルチプレクサ・シーセンサ352に転送する。さらに、音声エネルギープロセッサ360は、上述したように、どのエンドポイントを主要な話者として提示(表示)するかを決定する。新しい積極的な話者を指定するこの情報は、制御バス365を介してSCM240に送られる。
【0109】
図4は、様々な実施形態の技術および要素を実施するSCVRP250の関連要素を示す簡略ブロック図である。SCVRP250は、RTPビデオ入力バッファ410と、ビデオRTPヘッダパーサおよびオーガナイザ420と、1つ以上のMREシーケンシャルビデオメモリ430と、例えば内部バスまたは共有メモリでありうるバス440と、、1つ以上のRTP圧縮ビデオストリームビルダ450とを備える。SCVRP250は、例えば内部バスまたは共有メモリであり得る制御バス465を介して、SCM240による制御を受ける。圧縮された出入力ビデオデータチャンクは、例えば内部バスまたは共有メモリであり得る圧縮RTPビデオデータインターフェース(CRVDI)405を介して、SCVRP250とNI220との間で通信される。
【0110】
各SCVRP250は、会議セッションのビデオを管理する。RTPビデオ入力バッファ410は、セッションに参加しているMRE130から受信したリレー用RTP圧縮ビデオデータチャンクを、CRVDI405を介して、NI220から取得する。一実施形態において、RTPビデオ入力バッファ410は、例えばRTPヘッダに埋め込まれたID番号によって、どのリレー用RTP圧縮ビデオデータチャンクを処理するかを決定する。これに代わる実施形態において、RTPビデオ入力バッファ410は、関連パケットと関連付けられた送信元および/または宛先IPアドレスならびにポート番号に基づいて、NI220からビデオチャンクを受信する。
【0111】
ビデオRTPヘッダパーサおよびオーガナイザ420は、RTPビデオ入力バッファ410からリレー用RTP圧縮ビデオデータチャンクを抽出し、そのリレー用RTP圧縮ビデオデータチャンクのヘッダを解析して、各ビデオチャンクと関連付けられたID、シーケンス番号および/もしくはタイムスタンプならびに/または第1マクロブロックアドレス(MBA)を有するフレーム番号等の関連情報を入手する。ビデオRTPヘッダパーサおよびオーガナイザ420は、入手した情報に基づき、関連するリレー用RTP圧縮ビデオデータチャンクを、適切なMREシーケンシャルビデオメモリ430に保存する。
【0112】
各MREシーケンシャルビデオメモリ430は、セッションに参加しているMRE130から受信したストリームと関連付けられる。MRE130から受信した各ストリームでは、様々な品質レベルおよび/または解像度の圧縮ビデオが運ばれる。MREシーケンシャルビデオメモリ430の各出力部は、バス440に連結されており、バス440は、全てのMREシーケンシャルビデオメモリ430を1つ以上のRTP圧縮ビデオストリームビルダ450に接続する。
【0113】
遷移期間中、SCM240は、提示側MRE130から送信される一時的ストリーム用に、一時的MREシーケンシャルビデオメモリ430を追加で割り当てる。さらに、ビデオRTPヘッダパーサおよびオーガナイザ420、RTPビデオ入力バッファ410およびNI220は、一時的ストリームを一時的MREシーケンシャルビデオメモリ430に送るため、一時的ストリームのIDを通知される。
【0114】
MRE130に中継する適切なリレー用圧縮ビデオデータストリームのグループを選択するために、各RTP圧縮ビデオストリームビルダ450が1つ以上の受信MRE130に割り当てられる。RTP圧縮ビデオストリームビルダ450は、MREマルチプレクサ・シーセンサ452と、MRE RTPビデオ出力バッファ454とを具備し得る。各RTP圧縮ビデオストリームビルダ450は、1つ以上のリレー用RTP圧縮ビデオデータチャンクの送信元(MRE130)からなるグループと、1つ以上のMREシーケンシャルビデオメモリ430から成るグループとを選択する。この選択は、制御バス465を介してSCM240から受信した制御信号に基づき、セッション中の変更を受けて変更される。代替実施形態において、RTP圧縮ビデオストリームビルダ450は、SCM240および制御バス465を介して、割り当てられたMRE130自身から、割り当てられたMRE130がどのMRE130の視聴を希望するかに関する制御信号を受信する。
【0115】
MREビデオマルチプレクサ・シーセンサ452は、入力されたリレー用RTP圧縮ビデオデータチャンクのうちの選択されたストリームをバス440から入手し、一群のストリームを中継RTP圧縮音声ビデオチャンクの1つのストリームに多重化して、MRE RTPビデオ出力FIFO454に保存し、またそこからCRVDI405およびNI220を介して、割り当てられた受信MRE130に向けて転送する。ある会議セッションでは、1つのRTP圧縮ビデオストリームビルダ450を、セッション内の全てのMRE130に対して使用するため、全てのMRE130は、中継RTP圧縮ビデオデータチャンクの同一ストリームを受信することになる。
【0116】
RTP圧縮ビデオストリームビルダ450の代替実施形態(図示せず)は、一群のセレクタを備える。各セレクタは、バス440に接続され、MREシーケンシャルビデオメモリ430のうち1つの出力を選択する。セレクタの他方のポートは、FIFOを介してCRVDI405に接続される。このような実施形態において、選択されたビデオストリームは、複数の中継RTP圧縮ビデオデータチャンクのストリームとして、MREに向けて送信される。
【0117】
さらに別の実施形態において、例示的なMREシーケンシャルビデオメモリ430は、受信したリレー用RTP圧縮ビデオデータチャンクをシーケンス番号に従って整理しなくてもよい。その代わり、受信したリレー用RTP圧縮ビデオデータチャンクは、受信した順番で整理される。
【0118】
ID番号がレイアウトの各セグメントに割り当てられている一実施形態において、MRE RTPビデオ出力FIFOモジュール454は、処理した各圧縮ビデオデータチャンクに適切なセグメントIDを追加するよう適用される。このような実施形態において、セグメントIDと送信元であるMRE130の関連IDとの関連性は、バス465を介して受信した制御信号によって保持される。セグメントIDは、チャンクと関連付けられた送信元IDと置き換えてもよいし、RTPヘッダの他のフィールド内にそれを保存しても良い。
【0119】
遷移期間中、SCM240は、提示側MRE130から送信されるストリームに対して割り当てられたMREシーケンシャルビデオメモリ430の代わりに、一時的ストリームに割り当てられた一時的MREシーケンシャルビデオメモリ430から圧縮ビデオデータチャンクを入手するよう、要求側MRE130に割り当てられたRTP圧縮ビデオストリームビルダ450に指示する。残りの受信MREに割り当てられたRTP圧縮ビデオストリームビルダ450は、提示側MREからのストリームに対して割り当てられたMREシーケンシャルビデオメモリ430の排出を継続する。
【0120】
図5は、MRE130の一実施形態の関連要素を示す簡略ブロック図である。MRE130は、MREネットワークインターフェースモジュール(MRENI)520と、MRE音声モジュール(MREAM)530と、MRE制御モジュール(MRECM)540と、MREビデオモジュール(MREVM)550とを含む。
【0121】
MRE130は、MRENI520を介してMRM120と、またはネットワーク110を介して他のMRE130と通信する。MRENI520は、H.323、SIP等の1つ以上の通信規格またはH.264、MPEG等の圧縮規格に基づいて、通信を処理する。さらに、ネットワークMRENI520は、MRE130とやりとりする通信の物理層、データリンク層、ネットワーク層およびトランスポート層(UDP/TCP層)を実行する。
【0122】
MRENI520は、信号および制御ならびにMRE130とMRM120との間のメディアストリームを多重送信/分離送信する。音声およびビデオのRTP圧縮データチャンク(ヘッダおよびペイロード)は、MRENI520を介して、MRM120、MREAM530、MREVM550間でそれぞれ互いに転送される。また、MRENI520は、MRECM540とMRM120との間で、信号処理および制御を転送および受信する。
【0123】
MREAM530は、MRENI520を介して、MRM120から複数の中継RTP圧縮音声データチャンクから成るグループ(ヘッダおよびペイロード)を受信し、中継RTP圧縮音声データチャンクのRTPヘッダを解析し、送信元ID、タイムスタンプおよびシーケンス番号等のパラメータを特定する。また、MREAM530は、受信した中継RTP圧縮音声データチャンクを、そのID、タイムスタンプおよび/またはシーケンス番号で編成し、次いで音声データチャンクをデコード、ミキシングおよび増幅する。MREAM530は、ミキシングした音声を1つ以上のMRE130のスピーカに転送する。
【0124】
逆方向からいえば、MREAM530は、MRE130のマイクから音声信号を収集し、その信号をアナログからデジタルへ変換し、音声エネルギーを算出し、適切な圧縮規格に従って、音声をRTP圧縮音声データチャンクにエンコード/圧縮する。使用される圧縮規格には、G.711、G.719またはG.722.1Cが含まれる。
【0125】
MREAM530は、算出した音声エネルギー、MRM120によってMRE130のストリームに割り当てられたID、タイムスタンプおよびシーケンス番号を、圧縮音声データチャンクのRTPヘッダ内の適切なフィールドに埋め込む。別の実施形態において、MREAM530は、MRECM540を介して、音声信号エネルギーの指示情報を送信する。MREAM530に関するさらなる情報は、図7と共に以下に開示する。
【0126】
MREVM550は、MRENI520を介して、MRM120から中継RTP圧縮ビデオデータチャンクのグループ(ヘッダおよびペイロード)を受信し、受信した中継RTP圧縮ビデオデータチャンクのRTPヘッダを解析し、送信元ID、セグメントID、タイムスタンプおよびシーケンス番号等のパラメータを特定する。遷移期間中、一時的ストリームにID番号が割り当てられる。MREVM550は、タイムスタンプおよび/またはシーケンス番号に従って、受信した中継RTP圧縮ビデオデータチャンクを編成し、中継RTP圧縮ビデオデータチャンクをデコードし、ID番号に基づいて、それらを適切なセグメントFM(フレームメモリ)になるよう整理する。レイアウトの各セグメントに対してセグメントFMがあり、各セグメントおよび/または送信元IDは、レイアウトの一定のセグメントFMに関連付けられる。これに代わる実施形態において、送信元および/または宛先IPアドレスならびにポート番号は、レイアウトのセグメントと関連付けられる。MRE130が使用するフレームレートによって、MREVM550は、異なるセグメントFMを結合して結合FM(CPFM)を生成し、MRE130の1つ以上のディスプレー上に映し出されるよう、完成したCPFMを送信する。
【0127】
代替実施形態において、MREVM550は、受信した中継RTP圧縮ビデオデータチャンクをそのタイムスタンプおよび/またはシーケンス番号によって編成し、ビデオデータチャンクをデコードし、レイアウト全体をカバーする1つのCPFM内にそれらを整理する。別の実施形態において、MREVM550は、また、会議の主要な話者の変更、提示(表示)される会議出席者数の変更、会議出席者の一部入れ替え等に関する情報をMRECM540から受信する。
【0128】
ある実施形態において、受信した中継RTP圧縮ビデオデータチャンクをデコードするMREVM550のデコーダは、遷移期間中のデコード処理を行うように構成される。一実施形態において、デコーダは、先の複数の参照フレームを保存および使用する。このような実施形態において、デコーダは、最後に保存した先の参照フレームの指標と共に、イントラ交換要求を送信する。他の実施形態において、デコーダは、SPおよびSSPフレーム等のユニークなフレーム(一意に区別できる特有なフレーム)を処理する。さらに他の実施形態において、デコーダは、可逆圧縮フレームをデコードし、続くインターフレーム等の参照フレームとしてそれを読み込むように適用される。
【0129】
逆方向からいえば、MREVM550は、MRE130のカメラからビデオ画像を収集し、ビデオ画像を1つ以上の要求されたサイズ/質に調節し、適切な圧縮規格に従って、ビデオ画像をRTP圧縮ビデオデータチャンクにエンコード/圧縮する。圧縮規格には、H.264、MPEG4等が含まれる。要求されるサイズおよび圧縮規格に関する情報は、MRECM540を介して、MRM120から受信する。MREVM550は、RTPヘッダ内の適切なフィールドに、送信元ID、タイムスタンプ、シーケンス番号、フレーム番号等の様々なパラメータを埋め込む。リレー用RTP圧縮ビデオデータチャンクは、フレームレートに従って、MRENI520を介してMRM120に転送される。
【0130】
ある実施形態において、リレー用RTP圧縮ビデオデータチャンクをエンコード/圧縮するMREVM550のエンコーダは、遷移期間中にエンコード処理を実施するように構成される。一実施形態において、受信MRE130のデコーダは、複数の先の参照フレームを保存および使用する。このような実施形態において、エンコーダは、要求デコーダが有する最後に保存した先の参照フレームの指標と共に、イントラ交換要求を、要求デコーダから受信する。するとエンコーダは、指示された最後に保存した参照フレームに基づいて、カメラからの次のビデオ画像をインターフレームとして圧縮することによって、これに対応する。他の実施形態において、エンコーダはSPおよびSSPフレームをエンコードする。さらに他の実施形態において、エンコーダは、可逆圧縮方式に基づき、その参照フレームを可逆圧縮フレームにエンコードし、それは、次のインターフレーム用等のために、要求側MRE130のデコーダにて参照フレームとして読み込まれる。
【0131】
MRE制御モジュール(MRECM)540は、MRE130の動作を制御する。MRECM540は、MRM120との接続を確立し、MRE130においてレイアウト上に提示(表示)される会議出席者数、画像サイズ、圧縮規格、主要な話者、ID情報等のパラメータを通信する。ID情報には、MRE130から送信される様々な音声またはビデオデータチャンクのID、遷移期間に関する通信等の情報が含まれうる。遷移期間に関する情報には、遷移期間の開始と終了の指標、一時的ストリームのID、遷移期間に関する信号処理および制御等が含まれる。
【0132】
MRECM540は、セッション内の選択された会議出席者の数、要求レイアウト、要求されたFMの数等に従って、音声リソースおよびビデオリソースを割り当てる。MRECM540は、MRE130の1つ以上のディスプレイに表示されるべきレイアウトの構築方法をMREVM550に指示する。また、MRECM540は、ミキシングされるべき会議出席者の数等に関して、MREAM530を更新する。ある実施形態において、帯域外の接続がMRE130とMRM120との間に確立され、これにより、MRE130およびMRM120は、セッション中、動的に通信可能となる。
【0133】
MRE130の幾つかの実施形態において、MRECM540およびMREVM550は、表示されたCP画像に情報を追加するように適用される。この情報は、現在の話者および/または各セグメント内に現在表示されている会議出席者の氏名を示す。このような実施形態において、MRECM540は、MRM120から情報を受信するよう適用される。この情報は、MREVM550に転送され、文字および画像生成プログラムを含み、ステータス情報がエンドポイントで表示されるように変換される。逆方向からいえば、MREVM500およびMRECM540は、エンドポイントからのメニューを表示するように適用され、メニューは、MRM120の制御に使用される。
【0134】
遷移期間中、MRECM540は、一時的ストリームを処理するために、ビデオおよびネットワークリソースをそれぞれMREVM550およびMRENI520に割り当てるよう適用される。ある実施形態において、提示側MRE130および要求側MRE130のMRECM540は、遷移期間に対応するプロセスを管理するよう構成される。MRM120は、遷移期間を開始するが、開始後は、要求側MRE130および/または提示側MRE130のMRECM540が、遷移期間の継続および終了を管理する。MRE130に関するさらなる詳細は、図6、7、9および9Bと共に、下記に開示する。
【0135】
図6は、一実施形態に係る、MREVM550の一部分の関連要素を示す簡略ブロック図である。MREVM550は、次の2つの主要部を有する:(1)受信した中継RTP圧縮ビデオデータチャンクの一群を処理する、入力部と;(2)MRE130のカメラが捉えたビデオデータを処理する出力部。一実施形態に係る入力部は、例えば、RTPビデオ入力バッファ610と、ビデオRTPヘッダパーサおよびオーガナイザ620と、1つ以上の圧縮ビデオセグメントメモリ(CVSM)630(レイアウトの各セグメントに対して1つ)と、1つ以上のMREビデオデコーダ640(レイアウトの各セグメントに対して1つ)と、1つ以上のセグメントFM650(レイアウトの各セグメントに対して1つ)と、MRE CP画像ビルダ660と、MRE CPフレームメモリモジュール670と、背景FM655等のモジュールを具備し得る。出力部は、例えば、1つ以上の計数装置およびFM680と、1つ以上のエンコーダ685と、一時的エンコーダ687と、MREビデオRTPプロセッサ(MREVRTP)690とを具備し得る。エンコーダ685およびデコーダ640は、H.264AVC、H.264annexG、MPEG-4等の圧縮規格を使用可能である。
【0136】
各CVSM630は、そのセグメントに表示予定のビデオストリームのIDと関連付けられる。一実施形態において、CVSMのIDとの関連性は、セッション中に変化する。一方、他の実施形態において、CVSMのIDとの関連性は、セッション全体にわたって固定される。
【0137】
MREVM550の入力部にあるRTPビデオ入力バッファ610は、MRENI520から中継RTP圧縮ビデオデータチャンクを入手する。ビデオRTPヘッダパーサおよびオーガナイザ620は、入力バッファ610にアクセスし、RTPヘッダを解析して、受信した中継RTP圧縮ビデオデータの様々なパラメータを特定する。パラメータには、シーケンス番号、フレーム番号、送信元および/またはセグメントID、タイムスタンプ等が含まれるが、これらに限定されない。また、RTPヘッダパーサおよびオーガナイザ620は、例えば、送信元IDと表示レイアウトのセグメントとを関連付ける割出表を有する。セグメントIDが受信したデータチャンクと関連付けられていない一実施形態において、各CVSM630は、例えば、表示レイアウトのあるセグメントに関連付けられる。従って、RTPヘッダパーサおよびオーガナイザ620は、例えば送信元IDに従って、中継RTP圧縮ビデオデータチャンクの適切なストリームをCVSM630に転送する。また、RTPヘッダパーサおよびオーガナイザ620は、シーケンス番号、タイムスタンプまたはフレーム番号および受信したデータチャンクの第1MBのアドレスに応じて、CVSM630内のRTP圧縮ビデオデータチャンクを整理することができる。
【0138】
各CVSM630の出力を、MREビデオデコーダ640に関連付け、各MREビデオデコーダ640の出力を、セグメントFM650に関連付けることができる。従って、MREビデオデコーダ640は、適切なCVSM630にアクセスし、RTP圧縮ビデオデータチャンクをデコードし、デコードしたビデオを適切なセグメントFM650に保存する。これに代わる実施形態では、デコーダ640とセグメントFM650の間に計数装置が追加される。MRE CP画像ビルダ660は、様々なセグメントFM650の内容をMRE CPフレームメモリモジュール670に転送して、CP画像を構築する。CP画像のフレーム全体を、MRE CPフレームメモリモジュール670から転送して、MREの表示ユニット上に表示される。場合に応じて、背景色、異なるセグメント間の境界線およびその色、パターンならびに会議出席者名等の様々なパラメータに基づき背景FM655が読み込まれる。背景FM655は、セッション開始時に作成されるが、セッション中のいずれの時期にも変更されうる。MRE130の一実施形態において、背景は、MRECM540によって作成される。MRECP画像ビルダ660は、CP画像を構築する一方で、セグメントFM650からデータが収集されるのと同じように背景FM655からデータを収集する。
【0139】
遷移期間中、要求側MRE130のMREVM550の入力部は、通常と異なる動作を行う。遷移期間中、RTPビデオ入力バッファ610は、関連する提示側MRE130から受信した一時的ストリームに関連する、MRENI520からの中継RTP圧縮ビデオデータチャンクを入手するようにも構成できる。ビデオRTPヘッダパーサおよびオーガナイザ620は、一時的ストリームの中継RTP圧縮ビデオデータチャンクを取得し、提示側MRE130に割り当てたセグメントに関連するCVSM630内でそれらを整理し、要求側MRE130のディスプレー上のCP画像に表示するよう構成される。
【0140】
一実施形態において、提示側MRE130に割り当てられたセグメントと関連するMREビデオデコーダ640は、保存されている複数の先の参照フレームを使用するように構成される。このような実施形態において、デコーダは、先に保存した参照フレームのシーケンス番号と共に、イントラ交換要求を送信するよう構成される。それに応じて、提示側MRE130の関連エンコーダは、指定された先に保存されたフレームに基づいて圧縮されたインターフレームを送信する。このインターフレームは、通常のストリームで送信される。
【0141】
SPフレームが通常のストリームで使用され、SSPフレームが一時的ストリームで使用される、別の実施形態において、関連ストリーム640のデコーダは、受信MRE130または要求側MRE130のそれぞれに対してSPおよび/またはSSPフレームを処理するよう構成される。
【0142】
可逆圧縮アルゴリズムを使用して、提示側MRE130のエンコーダから一時的ストリームで参照フレームが転送される、さらに別の実施形態において、関連デコーダ640は、参照フレームをエンコードするために使用される可逆圧縮アルゴリズムをデコードし、該当参照フレームに基づいてエンコードされる、通常ストリームの次のフレームをデコードできるように、それを参照フレームに読み込む能力を有するものであり得る。
【0143】
遷移期間の管理は、提示側MRE130のエンコーダと共に、関連デコーダ640によって行われる。一方、他の実施形態においては、SCM240が管理を行う。他の実施形態において、デコーダ/エンコーダの遷移期間中の活動は、遷移期間の開始時にSCM240によって開始され、その後はデコーダ640および提示側MRE130のエンコーダが自律的に継続する。
【0144】
MREVM550の出力部は、MRE130のカメラからのビデオ画像を受信し、1つ以上の計数装置およびFM680に画像を保存する。各計数装置およびFM680は、例えば、異なるサイズ(解像度)にビデオ画像を調整し、保存する。各計数装置およびFM680の出力は、ビデオエンコーダ685に関連付けられ、ビデオエンコーダ685は様々なレートおよび/または質でデータをエンコードできるため、その結果圧縮ビデオデータチャンクが生成される。次いで、ビデオエンコーダ685は、MREVRTP690にビデオデータチャンクを転送し、そこで発信元ID、タイムスタンプ、シーケンス番号または他のパラメータをRTP圧縮ビデオデータチャンクのヘッダに埋め込む。次に、MREVRTP690は、リレー用RTP圧縮ビデオデータチャンクをMRENI520に対して出力する。
【0145】
遷移期間中、提示側MRE130のMREVM550の出力部は、通常の動作と異なる動作を行う。遷移期間中、要求側MRE130に合うサイズに画像を調整する計数装置と関連する、ビデオエンコーダ685の一実施形態は、先に使用し保存されている複数の参照フレームを使用するように構成される。このような実施形態において、エンコーダが、保存されている先の参照フレームのシーケンス番号と共に、イントラ交換要求を要求側MRE130から受信する場合、エンコーダは、その先に使用した参照フレームに基づいて、関連する計数装置およびFM680から次に受信するカメラフレームをインターフレームとしてエンコードすることによって、これに応じる。先のフレームに基づいて圧縮されたインターフレームは、MREVRTP690を介して、通常のストリームで送信される。インターフレーム送信後、エンコーダは、他の保存されている先の参照フレーム全てを消去する。
【0146】
SPフレームが通常のストリームで使用され、SSPフレームが一時的ストリームで使用される、別の実施形態において、一時的ストリームを作成するために、一時的エンコーダ687が割り当てられる。また、MREVRTP690は、一時的ストリームの圧縮チャンクを処理するように適用される。一時的エンコーダ687は、通常ストリームのエンコーダ685に割り当てられた関連計数装置およびFM680から、同一の調整されたフレームを取得する。一時的ストリームの第1圧縮フレームは、イントラフレームとして、通常のストリームと同一サイズだがそれより低品質でエンコードされる。一時的ストリームの質は、インターフレーム毎に徐々に改善される。幾つかのインターフレーム後(例えば、3から15フレーム)、一時的エンコーダ687はSSPフレームを転送し、その一方、通常のエンコーダ685は、SPフレームを転送する。次のカメラフレームは、通常のフレームとして、関連するビデオエンコーダ685によってエンコードされ、他の全ての受信MRE130と同様に、通常のストリームで要求側MRE130に向けて送信される。
【0147】
可逆圧縮アルゴリズムを用いて、提示側MRE130のエンコーダ685から一時的ストリームで参照フレームが転送される、代替実施形態において、一時的エンコーダ687は、通常のストリームのエンコーダ685から、参照フレームを取得できる。取得した参照フレームは、可逆圧縮アルゴリズムを用いて、一時的エンコーダ687によって圧縮される。可逆圧縮フレームは、MREVRTP690を介して、一時的ストリームまたは帯域外のIP接続で、要求側MRE130に向けて送信される。帯域外接続が使用される一実施形態において、可逆圧縮参照フレームは、一時的エンコーダ687からMRENI520へ直接転送される。可逆アルゴリズムは、ZIP、レンペル_ジフ_ウェルチ(LZW)、可逆JPEG2000等でありうる。
【0148】
図7は、MREAM530の一実施形態の関連要素を示す簡略ブロック図である。MREAM530は、以下の2つの部分を有する:(i)MREAM530が受信した一群の入力中継RTP圧縮音声データチャンクを処理するMREAM入力部と;(ii)例えば、MRE130からMRM120へ向けて出力される音声データを処理する、MREAM出力部。MREAM入力部は、RTP音声入力バッファ710と、音声RTPヘッダパーサおよびオーガナイザ720と、1つ以上のMREシーケンシャル音声メモリ(MRESAM)730と、1つ以上のMRE音声デコーダ740と、音声ミキサ750等のモジュールを備える。MREAM出力部は、例えば、エンコーダ760と、MRE音声RTPプロセッサ770とを備える。2つの受信MRE130が異なる音声圧縮規格を使用する、ある実施形態の場合、出力部は、エンコーダ760およびMRE音声RTPプロセッサ770の2つ以上のセットを備え、各セットは、例えば、他のセットと異なる圧縮規格に基づいて圧縮された音声ストリームに関連付けられる。
【0149】
RTP音声入力バッファ710は、MRENI520を介して、MRM120から中継RTP圧縮音声データチャンクの一群を取得する。音声RTPヘッダパーサおよびオーガナイザ720は、入力バッファ710にアクセスし、RTPヘッダを解析して、シーケンス番号、送信元ID、タイムスタンプ等のパラメータを特定する。各MRESAM730は、例えば、セッションに参加しており、その音声が流れるように選択された、特定の送信元MRE130と関連付けてもよい。RTPヘッダパーサおよびオーガナイザ720は、例えば、データチャンクIDに従って、中継RTP圧縮音声データチャンクの適切なストリームをMRESAM730に転送する。これに代わる実施形態において、RTPヘッダパーサおよびオーガナイザ720は、例えば、送信元IPアドレスおよびポートに従って、中継RTP圧縮音声データチャンクの適切なストリームをMRESAM730に転送する。また、RTPヘッダパーサおよびオーガナイザ720は、各MRESAM730内のRTP圧縮音声データチャンクを、データチャンクのシーケンス番号またはタイムスタンプに基づいて整理する。各MRESAM730の出力は、MRESAM730にアクセスしてRTP圧縮音声データチャンクをデコードするMRE音声デコーダ740に関連付けられる。デコーダが使用する圧縮規格は、G719、G.7221.C等であるが、これらに限定されない。音声ミキサ750は、全てのMRE音声デコーダ740からの出力を受信し、それらのミキシングを行い、ミキシングした音声をMRE130のスピーカに出力する。
【0150】
MREAM530の出力部は、MRE130のマイクからの音声を受信する。エンコーダ760は、受信した入力音声を収集し、そのエネルギーを判定し、入力音声を圧縮音声データチャンクにエンコードする。圧縮は、G.719、G.7221.C等の圧縮規格に基づいて行われる。次に、圧縮された音声データチャンクは、MRE音声RTPプロセッサ770に転送される。音声エネルギーの指示情報もまた、MRE音声RTPプロセッサ770に転送され、MRE音声RTPプロセッサ770は、RTP音声データチャンクのヘッダに様々なパラメータを埋め込む。パラメータには、シーケンス番号、送信元ID、タイムスタンプ、音声エネルギーの指示情報等が含まれる。次に、MRE音声RTPプロセッサ770は、リレー用RTP圧縮音声データチャンクをMRENI520に対して出力し、そこからMRM120に出力する。代替実施形態において、音声エネルギーの指示情報は、圧縮音声データチャンクのヘッダ内に保存される。さらに別の実施形態において、音声エネルギーは、MRECM540およびMRENI520を介して、信号処理および制御接続によりMRM120に向けて転送される。
【0151】
図8Aは、SCM240の一実施形態が実施する、会議設定方法800の関連プロセスを示すフローチャートである。方法800は、MRM制御モジュール会議のセットアップ処理により、動作810で開始される。動作815では、会議出席者(MRE130)の数、ビットレート、音声および動画圧縮規格ならびにビデオのエンコード/デコードに使用される先の参照フレーム数、CPレイアウト等の会議パラメータが収集される。続いて、方法800は、動作820において、NI220のリソース、関連SCARP230、関連SCVRP250、帯域幅等の様々な会議リソースを割り当てる。次いで、動作830と840との間のループが、会議に参加している各MRE130に対して実行される。動作832では、MRE130からの1つ以上の予想される出力画像サイズ(質)および関連IDが定義される。一実施形態において、方法800は、MRE130からのIPアドレスおよび各ストリームのポートをIDとして使用する。動作836では、SCARP230およびSCVRP250等のMRM120の内部モジュールとMRE130とが関連付けられる。
【0152】
動作836において、MRE130は、MRM120のSCARP230内にあるMREシーケンシャル音声メモリ330の1つと、RTP圧縮音声ストリームビルダ350の1つと、MRMのSCVRP250内にあるMREシーケンシャルビデオメモリ430の1つと、RTP圧縮ビデオストリームビルダ450の1つ等とリンクされる。次に、関連MRE130と関連付けられた、リソースの様々な接続パラメータ(外部および内部)が、動作838で設定される。外部接続パラメータには、MRE130のID、リモートIPアドレスおよびポートならびにローカルIDアドレスおよびポートが含まれる。内部接続パラメータには、SCARTP230およびSCVRP250内のモジュールの内部接続等、MRM120自身のモジュールの内部接続が含まれる。
【0153】
次に、動作840にて、さらに処理すべきMRE130の有無が判定される。処理すべきMRE130がある場合、方法800は、動作830に戻り、次のMRE130のセットアップを管理する。処理すべきMRE130が無い場合、方法800は動作845に進み、会議における各MRE130の初期CPレイアウトの定義を行う。方法800は動作850に進み、会議内の各MRE130に対して、別のループを開始する。動作851において、方法800は、MREが送信を要する1つ以上の画像サイズと、MRE130が送信を要する1つ以上の圧縮音声ストリームと、MRE130が各ストリームの音声およびビデオRTPヘッダへの追加を要する1つ以上のID等を、関連MRE130に読み込む。動作852にて、MRE130に割り当てられたCPレイアウトのパラメータを算出し、MREVM550に読み込む。パラメータには、レイアウトのセグメント数と、各セグメントに関連付けられたIDまたはIPアドレスおよびポートと、提示(表示)されるMRE130と、現在の話者等が含まれる。他の実施形態において、各MRE130は、自身のディスプレーユニットに表示される自身のレイアウトを定義し、それらのパラメータをMRM120に通知する。
【0154】
また、動作852において、MRE130のMREVM550は、セグメントフレームメモリ650およびCPフレームメモリ670のパラメータを定義するよう指示される。例えば、音声RTPヘッダパーサおよびオーガナイザモジュール720ならびに音声ミキサ750等、MREAM530の内部モジュールは、類似の方法で設定される。この動作によって、MRE130の様々なモジュールを関連ストリームIDと接続するマップが作成される。
【0155】
続いて、方法800は、SCARP230およびSCVRP250等、MRM120の内部モジュールの関連パラメータを設定する。動作854において、SCVRP250の内部モジュールの様々なパラメータおよび接続が設定される。パラメータおよび接続には、MREシーケンシャルビデオメモリ430とMRE130のIDおよび/またはIPアドレスならびにポートとの関連付けと、そのMRE130のビデオを選択するための関連MREビデオマルチプレクサ・シーケンサ452の設定とが含まれる。動作856において、SCARP230の内部モジュールの様々なパラメータおよび接続が設定される。パラメータおよび接続には、MREシーケンシャル音声メモリとMRE130のIDおよび/またはIPアドレスならびにポートとの関連付けと、そのMRE130の音声を選択するための関連MREマルチプレクサ・シーケンサ352の設定とが含まれる。
【0156】
動作858において、MRM120は、関連MRE130にイントラフレームを要求し、動作860に進む。動作860では、さらに設定が必要なMRE130の有無が決定される。設定が必要なMRE130がある場合、方法800は動作850に戻る。設定が必要なMRE130が無い場合、方法800は終了する。方法800に類似した方法が、主要な話者が変更される度に、または新たな会議出席者あるいは退席者が発生した場合等に実行されうる。
【0157】
図8Bは、一実施形態に係るMRM120のSCM240が実施する、遷移タスク8000の関連動作を示すフローチャートである。提示側MRE130からのイントラフレームを要求側MRE130が必要とする一方で、同じビデオ画像を通常のストリームで受信する他の受信MREが、イントラフレームを必要としない場合、タスク8000は動作8010にて開始される。このような事例は、要求側MRE130が継続中のセッションに参加を希望する新規の参加者である場合、または要求側MRE130が使用するレイアウトに変更が生じるが、他の受信MRE130には生じない場合、または要求側MRE130に転送されたストリームの1つ以上のパケットが紛失した場合等に、起こりうる。
【0158】
8010での開始後、SCM240は、ブロック820にて、提示側MRE130からの関連ストリームと(適切なサイズで)関連付けられた、先に使用した参照フレームを要求側MRE130が有するか否かを確認する。この確認は、イントラ要求交換指示情報と関連する、要求側MRE130からの信号伝達によって行われる。代替的に、SCM240は、提示側MRE130から各MRE130に対して、通常のストリームで最近送信された、少数フレーム(例えば、最後からの16フレーム)のシーケンス番号を保存する履歴表を管理する。要求のタイミングおよび履歴表に基づき、SCM240は、動作8020において、要求側MRE130のデコーダに先の参照フレームが存在するか否かを推測する。SCM240が、要求側MRE130のレイアウトを変更する場合、SCM240は、先の参照フレームが新規のレイアウト等に合致するか否かを結論付ける。
【0159】
動作8020において、先に使用した参照フレームが要求側MRE130のデコーダに存在する場合、SCM240は、動作8026において、提示側MRE130の関連ストリームのエンコーダに対して、既存の先の参照フレームに基づいて次のフレームをインターフレームとしてエンコードし、そのインターフレームを要求側MRE130ならびに残りの受信MRE130にも通常のストリームで送信するよう、指示する。さらに、エンコーダは、これ以外の先の参照フレーム全てをリセットするよう指示を受ける。並行して、SCM240は、関連ストリームの履歴表をリセットする。そして、方法8000が終了する。他の実施形態において、要求側MRE130から受信したイントラ交換要求は、提示側MRE130の関連ストリームのエンコーダに中継され、該エンコーダは、先に使用された参照フレームに基づいて次のフレームをインターフレームとしてエンコードすることによって、これに応じるよう構成される。
【0160】
動作8020において、先に使用した参照フレームが、要求側MRE130のデコーダに存在しない場合、SCM240は、動作8022において、一時的ストリーム用の通信チャンネルならびに追加リソースを、SCVRP250および提示側MRE130のMREVM550の出力部に割り当てるとともに、一時的ストリームを処理するために、要求側MRE130のMREVM550の入力部を調整する。SCVRP250に割り当てられたリソースは、追加のMREシーケンシャルビデオメモリ430と、追加のRTP圧縮ビデオストリームビルダ450とを備える。提示側MRE130のMREVM550に割り当てられたリソースは、一時的エンコーダ687を備える。
【0161】
リソースおよび帯域幅の割り当て後、提示側MRE130は、動作8022において、定義されたシーケンスに従って、通常ストリームと並行して、同一サイズ(解像度)の一時的ストリームの生成を開始するよう指示される。一時的ストリームの定義されたシーケンスは、同一の解像度だが低品質のイントラから開始され、続けて少数の品質が向上したインターフレームが来て、通常ストリームおよび一時的ストリームの両ストリームで同様の質に達するまで継続する。シーケンスの終了時において、提示側MRE130の各エンコーダは、前記ユニークなフレームをエンコードし、これを送信する。通常のストリームのエンコーダ685は、SPフレームをエンコードし、これを他の受信MREに向けて通常のストリームで送信する一方、一時的エンコーダ687は、SSPフレームをエンコードし、これを一時的ストリームで送信する。
【0162】
一時的ストリームの送信開始を提示側MRE130に指示した後、タスク8000は、動作8024において、提示側MRE130からの前記ユニークなフレーム(SPおよびSSP)を受信待機する。動作8030において前記ユニークなフレームを受信すると、SPおよびSSPフレームは、動作8032において、他の受信MRE130および要求側MRE130にそれぞれ中継される。次いで、一時的ストリームが終了され、MRM120、提示側MRE130および要求側MREに割り当てられたリソースは、動作8032にて解放され、タスク8000が終了する。
【0163】
図9Aは、MRECM540の一実施形態が実施する、MRE会議セットアップ方法900の関連動作を示すフローチャートである。方法900は、動作910にて開始される。動作912において、MRM120との接続が確立され、MRECM540は、セットアップ指示を受信する。セットアップ指示は、このMRE130から送信されるメディアストリームに関連付けられることになる1つ以上のIDと、MRE130が伝送しなければならない画像のサイズと、MRE130上で音声を流し、提示(表示)される会議出席者数と、レイアウト情報とを含む。次いで、方法900は、動作914において、適宜リソースを割り当て、このリソースには、MRENI520、MREVM550、MREAM530、帯域幅等におけるリソースが含まれる。
【0164】
次に、方法900は動作920に進み、ここで、MREVM550の様々な内部モジュールが設定される。これらの設定には、動作912で受信したIDに基いて、ビデオRTPヘッダパーサおよびオーガナイザ620に指示することと、どのCVSM630にどの中継圧縮ビデオRTPデータチャンクを保存するかを確立することと、セッションのレイアウトに従って、各セグメントFM650およびMRE CP FMモジュール670のパラメータを設定することと、セグメントFM650からどのようにCPを構築するかをCPビルダ660に指示することと、背景FM655を更新することと、正確なサイズを送信するために計数装置およびFM680を設定することと、RTPヘッダにIDを追加するようMREVRTP690に指示すること等が含まれる。動作920において、CPビルダ660は、CPG画像の構築方法を指示される。この指示によって、CPフレームの各列の第1および最終MBのMBA(マクロブロックアドレス)と、CP画像の各セグメントの第1MBAおよび前記セグメントの最終MBA等とが定義付けられる。
【0165】
MRECM540およびMREVM550が、表示されるCP画像に情報を追加するよう適用される、MRE130のある実施形態において、動作920は、この情報を伝達するよう適用される。この情報は、現在の話者、各セグメント内に現在表示されている会議出席者の氏名等を示す。このような実施形態において、CPビルダ660は、この情報をビデオデータに変換し、エンドポイントにて表示されるCP画像にこれを追加するよう適用される。
【0166】
次に、動作922において、MREAM530の様々な内部モジュールが設定される。設定には、圧縮規格に従って音声エンコーダ760を設定することと、RTPヘッダにIDおよび音声エネルギーの指示情報を追加するようMRE音声RTPに指示することと、どのMRESAM730にどのIDを保存すべきかを音声RTPパーサ720に指示することと、MRE音声デコーダ740を設定すること等が含まれる。動作922の後、この方法は終了し、関連MRE130は、イントラフレームを送信する準備ができている。方法900に類似した方法は、主要な話者が変更される度に、または新たな会議出席者あるいは退席者が発生した場合等に実行されうる。
【0167】
図9Bは、MRE130のMRECM540が実施する、遷移タスク9000の関連動作を示すフローチャートである。図示の方法9000は、提示側MRE130が処理する動作および要求側MRE130が処理する動作を含む。提示側MRE130からのイントラフレームを要求側MRE130が必要とする一方で、同一品質/サイズのビデオ画像を通常ストリームで受信する他の受信MRE130がイントラフレームを必要としない場合に、タスク9000は動作9010にて開始される。このような事例は、要求側MREが継続中の会議に参加を希望する新規の参加者である場合、要求側MRE130がレイアウトの変更を必要とする一方で、他の受信MRE130がこれを必要としない場合、または要求側MRE130が、ある品質/サイズのストリームから別の品質/サイズのストリームへの切替えを希望する場合等に生じる。さらに、要求側MREに伝送されたストリーム内の1つ以上のパケットが紛失した場合に、要求側MRE130はイントラフレームを必要とするが他の受信MRE130は必要としない。
【0168】
タスク9000の開始9010は、MRE130から受信した圧縮ストリームのデコードを割り当てられた、要求側MREのデコーダ640(図6)によって行われる。提示側MRE130からの先の複数のインターフレームを受信およびデコードした後、デコーダがイントラフレームを必要とする場合に、タスク9000が開始される。このようなイントラフレームの要求は、例えば、パケットロス等に起因する。代替的に、提示側MRE130から送信された、あるストリーム、つまり通常のストリームのイントラフレームを、要求側MRE130に送信する必要があると判断された場合に、MRM120のSCM240によってタスクが開始されてもよい。
【0169】
エンコーダ/デコーダが複数の先の参照フレームを保存し、イントラ要求の代わりにイントラ交換要求を使用するように構成された実施形態において、方法9000が実施される。イントラ交換要求は、先の参照フレームに基づくインターフレームの要求である。この要求は、要求側MRE130から、保存された先の参照フレームの1つを示す提示側MRE130へ送信される。このような実施形態において、タスク9000は、動作9010にて、要求側MREのデコーダ640によって開始され、デコーダ640は、9012において、デコーダが所有するどの先の参照フレームが、提示側MRE130から次に受信するエンコードされたフレームをデコードするために使われ得るかを決定する。この決定は、参照フレームのタイムスタンプに基づいて行われる。次いで、動作9110にて、イントラ交換要求は、選択された先の参照フレームのシーケンス番号またはタイムスタンプと共に、要求側MRE130のデコーダから、MRECM540を介して、MRM120のSCM240に送信される。
【0170】
次いで、MRM120のSCM240は、動作9110において、先の参照フレームのシーケンス番号またはタイムスタンプと共に、イントラ交換要求を提示側MRE130のMRECM540に転送する。動作9110において、SCM240から提示側MRE130のMRECM540でイントラ交換要求を取得するとすぐに、イントラ交換要求は、動作9130において、要求側MRE130に送信される関連ストリーム(質/サイズ)に割り当てられた、提示側MRE130のビデオエンコーダ685に転送される。動作9130において、ビデオエンコーダ685は、先の参照フレームに基づいて、関連する計数装置680を介してカメラから受信した次の調整済みフレームをインターフレームとして圧縮し、それを次のインターフレームとして、要求側MRE130を含む全ての受信MRE130に通常のストリームで送信するよう指示される。さらに、エンコーダ685は、他の先の参照フレーム全てを解放するよう指示され、方法9000が終了する。MRM120のSCM240が、提示側MRE130から受信したリレー用フレームのシーケンス番号を変更する一方で、それらを中継フレームとして受信MRE130に送信する実施形態において、SCM240は、要求側MREから受信するシーケンス番号を、すでに提示側MRE130からMRM120へと送信された適切なシーケンス番号に変換する。
【0171】
動作9012において、先の参照フレームが使用できないと判断されると、タスク9000は、引き続いて動作9210に移り、MRM120のSCM240と通信する。SCM240との通信において、提示側MRE130のMRECM540は通常のストリームと並行して一時的ストリーム用に新規の接続を開くよう指示され、IDが一時ストリームに割り当てられ、一時的ストリームのエンコードされた画像のサイズ(解像度)は通常のストリームと同一であると定義され、一時的ストリームの品質向上フレームの数が定義される等のことが実施される。
【0172】
一時的ストリームが、提示側表示MRE130から送信された新規ストリームである場合、図9Aおよび8Aに関する記載で上述したように、要求側MRE130のMRECM540は、ブロック9210において、新規の中継ストリームの1つ以上のIDと、ビデオ画像のサイズ(解像度)、CPレイアウト内における関連セグメントの位置等、このストリームに関するビデオパラメータとを、SCM240から取得する。一時的ストリームが、提示側MRE130から送信された新規ストリームではない場合、要求側MRE130のMRECM540は、提示側MRE130から受信するストリームの次のフレームが一時的ストリームに属することを通知されるのみである。
【0173】
動作9210において、SCM240、提示側MRE130のMRECM540および要求側MRE130から遷移時期に関する関連情報を取得した後、方法9000は、動作9230において、必要なリソースの割り当てを開始し、両MRE130にて遷移期間の処理を行う。リソースは、MRENI520の通信および帯域幅に関するリソース、MRENI520とMREVM550との間の内部通信リソースおよびMRENI520とMRM120内のNI220との間の外部通信リソースである。さらなる割当リソースとして、MREVM550のビデオリソース等が考えられる。
【0174】
動作9240において、割り当てられたリソースは、一時的ストリームを処理するために整理される。提示側MRE130のMREVM550において、一時的エンコーダ687の入力は、通常ストリームのエンコーダと関連付けられる。一実施形態において、この関連付けは、例えば、関連する計数装置680から同一スケールのビデオ画像を入手することと、通常のインターフレームならびにSPおよびSSPフレーム用の量子化パラメータの適切なセットを入手することを目的とする。他の実施形態において、この関連付けは、通常ストリームのエンコーダの参照フレームを入手することと、一時的エンコーダ687によってエンコードされる入力ビデオ画像として、それを使用することを目的とする。さらに、提示側MRE130の一時的エンコーダ687の出力は、適切なID番号ならびにタイムスタンプとの関連付けを目的として、MREVRTP690と関連付けられる。
【0175】
SPフレームが通常ストリームで使用され、SSPフレームが一時的ストリームで使用される一実施形態において、要求側MRE130のビデオデコーダ640は、低品質の圧縮イントラフレームを受信し、次いで少数の品質向上インターフレームと、さらにSSPフレームを受信することになる。この順序は、圧縮規格に適合している。SSPフレームに続くフレームは、通常ストリームからのインターフレームである。
【0176】
さらに、一時的ストリームが、MRM120を介して提示側MRE130から送信される新規ストリームである場合、要求側MRE130のMRECM540は、動作9240において、新規ストリームを処理するように整理され、RTPビデオ入力バッファ610およびビデオRTPパーサ620は、新規ストリームのIDを通知されたうえCVSM630に関連付けられる。MREビデオエンコーダ640は、そのCVSM等に関連付けられる。
【0177】
通常エンコーダの参照フレームが(可逆圧縮で)圧縮され、一時的ストリームで伝送されるさらに別の実施形態では、上述した幾つかの実施形態の関連動作に加えて、要求側MRE130のMREビデオデコーダ640は、動作9240において、通常圧縮から、参照フレームの圧縮に使用される特有の圧縮(可逆圧縮)への圧縮規格の変更時期、またはその逆の変更時期の通知を受ける。
【0178】
動作9240において、提示側MRE130および要求側MRE130のMREVM550を整理した後、遷移期間は、提示側MRE130および要求側MRE130のMREVM550ならびにMRM120のSCVRP250によって、自律的にさらに実行される。よって、方法9000は終了する。
【0179】
図10Aおよび10Bは、MRE1(提示側MRE130)で生成され、MRM120を介してMRE2および3(それぞれ受信および要求側MRE130)へ転送された、ビデオストリームのユニークなフレームを使用する、一実施形態における遷移期間を示すタイムチャートである。図10Aおよび10Bは、例示を目的でとするものであり、縮尺通りに描かれてはいない。
【0180】
図10Aは2つのセクションを有し、上部のセクションでは通常ストリームを例示し、下部のセクションでは提示側MRE130、すなわちMRE1に関する一時的ストリームを例示する。この2つのセクションは、5つの列と両セクションで共用される時間軸とで示される。一列目には、計数装置およびFM680で調整された後にMRE1のビデオカメラから受信した、調整済のカメラビデオ画像(CF1からCFn+1)のストリームを示す。二列目には、MRE1の通常エンコーダの出力部における、エンコード済ビデオフレーム(IF1からEFn+1)のストリームを示す。このエンコード済フレームのストリームは、MRCセッションを管理するMRM120に対して、通常ストリームとして伝送される。三列目には、カメラから受信した調整済の関連ビデオフレームをエンコードした結果、MRE1のエンコーダに保存される、参照フレーム(RFm-1からRFn)のストリームを示す。三列目は、上部セクションの最後の列である。
【0181】
図10Aの下部セクションは、一時的ストリームを例示し、MRE1の一時的エンコーダの出力部におけるエンコード済のビデオフレーム(TlmからTm+2およびSSTn)のストリームを示す4列目から開始される。このエンコード済フレームのストリームは、一時的ストリームとしてMRM120に向けて伝送される。最後の列は、MRE1の一時的エンコーダ687に保存される、参照フレーム(RTmからRTm+2およびRTFn)のストリームを示す。
【0182】
本例示において、一時的ストリームは、3列目と4列目の間の矢印で示すように、通常エンコーダ685の参照フレームをエンコードすることによって作成される。第1フレーム(TIm)は、イントラフレームとして、同一のサイズ(解像度)であるが低品質でエンコードされる。次の2つのフレームは、品質向上インターフレームである。各フレームでは、その質が改善され、通常ストリームのエンコーダに保存される参照フレームと、一時的エンコーダ687に保存される関連参照フレームとの差異が低減する。他の実施形態において、品質向上インターフレームの数は2つではなく、例えば、1から15フレームの間の任意の数であってよい。一時的ストリームの最終フレームであるSSTnは、参照フレームRTFnが通常エンコーダの参照フレームRFnと同一の値を有する方法で圧縮される或るユニークなフレームであり、参照フレームRTFnを参照フレームRFnと同期化する。一実施形態において、一時的エンコーダの入力部におけるRFnと、一時的エンコーダ687に保存された参照フレームRTm+2との差異は、SSTnフレームを作成するために可逆圧縮方式で圧縮される。従って、RTFnの各ピクセルの値は、RFnの対応するピクセルの値と同一である。
【0183】
MRE1からの通常ストリームは、調整後にMRE1のカメラからビデオフレームCF1を受信した時点で、T1にて開始される。通常ストリームのエンコーダは、それをイントラフレーム、IF1として圧縮する。次の調整済カメラフレームは、インターフレームとしてエンコードされる。圧縮規格は、H.264AVC、H.264annexG、MPEG-4等でありうる。
【0184】
T2において、MRE3は、通常ストリームの受信MREへの参加を要求する。従って、T2では、MRE1からのイントラフレームを要求するMRE3から、イントラ要求が送信される。通常ストリームの受信MRE130全てにイントラフレームを送信することでこの要求に応じる代わりに、MRE1、つまり提示側MRE130は、図10Aの下部セクションに図示した一時的ストリームを開始する。
【0185】
イントラ要求に従うカメラからの第1フレーム、すなわちCFmは、先のフレームRFm-1を圧縮する間に生成された参照フレームに基づいて圧縮される。図10Aの実施形態において、CFmを通常ストリーム上のインターフレームEFmとして圧縮することにより作成された参照フレームRFmは、一時的ストリームのイントラフレームTImとして圧縮される。イントラフレームTImは、第1フレームとして、一時的ストリームでMRE3に向けて送信される。一時的ストリームの圧縮は、通常ストリームのエンコーダで使用される同一の圧縮規格を使用して行われるが、イントラフレームの質は、通常ストリームの質よりも低い。ビットレート、鮮明度等に関して質が異なりうる。
【0186】
通常ストリームのエンコーダの次の幾つかの参照フレーム、RFm+1、RFm+2は、一時的フレームによって品質向上インターフレームとしてエンコードされ、次に続くインターフレームTm+1およびTm+2を作成する。品質向上イントラフレームの数は、例えば、1から15の間の任意の数であってよい。品質向上フレームの数は、一時的ストリームを確立する間に定義される。
【0187】
T3において、2つのストリームの質が類似していると推定されると、次に続く調整済カメラフレームCFnは、インターフレームEFnとして圧縮される。CFnを圧縮する間に作成された参照フレームRFnは、一時的エンコーダ687によって可逆圧縮方式にて圧縮され、前記ユニークなフレームSSTnを生成する。可逆圧縮は、例えば、RFnと、一時的ストリームの参照フレームRTm+2との値の差異に対して実行される。これは、ビデオ会議の場合、2つの連続するフレーム間の差異が通常のビデオ画像と比較して小さいという事実を活用している。可逆圧縮方式の例として、ZIP、レンペル_ジフ_ウェルチ(LZW)、可逆JPEG2000等が挙げられる。従って、一時的エンコーダ687で生成された参照フレーム687、つまりRTFnは、RFnと同一の値を有し、参照フレームRTFnと参照フレームRFnを同期化する。さらに、MRE3のデコーダで前記ユニークなフレームをデコードすることによって、RFnおよびRTFnと同一の値を有する参照フレームが生成される。その結果、図10Bに示すように、この時点で一時的ストリームが終了し、通常ストリームは、MRM120によって要求側MRE3に切替えられる。
【0188】
要求側MRE3では、可逆エンコードの逆演算として、エンコードされた差異のデコードが行われる。その結果は、RTm+2に類似する先のデコーダ参照フレームの値に加算される。デコードされた差異を加算した結果は、参照フレームRTFnとしてMRE3のデコーダ内に保存され、MRE3で表示される。T4において、一時的ストリームが終了する。
【0189】
図10BにおいてMRM120の他の側面を捉えると、T1にて、提示側MRE1の通常ストリームの第1フレーム、つまりイントラフレームIF1が、複数のインターフレームよりも先にMRE2に向けて送信される。通常ストリームは、MRE2と並行して、複数の受信MRE130(図示せず)に中継される。T2において、MRE3は通常ストリームを受信するよう問い合わせ、イントラフレームを要求する。MRM120は、これに応じ、要求側MRE3に向けて、一時的ストリームのフレーム送信を開始する。第1フレームはイントラフレームTImであり、少数の品質向上インターフレームTm+1およびTm+2がこれに続く。次に、T3において、一時的ストリームの最終フレームとして、前記ユニークなフレームSSTnが送信される。T4では、インターフレームFn+1、Fn+2および通常ストリームからの追従フレームも、MRE3に向けて送信される。
【0190】
図11Aおよび11Bは、ひとつのストリームから他方のストリームへ移動するためにSPおよびSSPフレームを使用する、別の実施形態における遷移期間を図示するタイムチャートである。2つのストリームは、同一のサイズ(解像度)を有する同一のビデオカメラから生成される。ビデオストリームは、MRE1、すなわち提示側MRE130によって生成され、MRM120を介して、MRE2および3(それぞれ受信および要求側MRE130)に伝送される。図11Aおよび11Bは、例示を目的でとするものであり、縮尺通りに描かれてはいない。
【0191】
図10Aと同様に、図11Aも2つのセクションを有する。上部のセクションは通常ストリームを例示し、下部のセクションはMRE1からの一時的ストリームを例示する。2つのセクションは、5つの列と両セクションで共用される時間軸とで図示される。一列目には、計数装置およびFM680で調整後にMRE1のビデオカメラから受信した、調整済のカメラビデオ画像(CF1からCFn+1)のストリームを示す。二列目には、MRE1の通常エンコーダの出力部における、エンコード済ビデオフレーム(IF1からFn+1、SPnを含む)のストリームを示す。このエンコード済フレームのストリームは、通常ストリームとして、MRCセッションを管理するMRM120に伝送される。三列目には、カメラから受信した、調整済の関連ビデオ画像をエンコードした結果、MRE1の通常エンコーダ685に保存される、参照フレーム(RFm-1からRFm+2およびRSPn)のストリームを示す。三列目は、上部セクションの最終列である。
【0192】
図11Aの下部セクションは、MRE1の一時的エンコーダ687の出力部におけるエンコード済ビデオフレーム(TImからTm+2およびSSPn)のストリームを示す、4列目から開始される一時的ストリームを示す。このエンコード済フレームのストリームは、一時的ストリームとしてMRM120に向けて伝送される。最後の列には、MRE1の一時的エンコーダ687に保存される、参照フレーム(RTmからRTm+2およびRSSPn)のストリームを示す。
【0193】
本例示において、一時的ストリームは、圧縮フレームTImからSSPnの最上部に矢印で示したように、通常エンコーダ685と関連付けられた計数装置およびFM680の出力部において、同一の調整済ビデオフレームをエンコードすることによって作成される。従って、2つのエンコーダ、通常エンコーダ685および一時的エンコーダ687は、同じ入力フレームをエンコードする。第1フレーム(TIm)は、同一のサイズ(解像度)だが低品質でイントラフレームとしてエンコードされる。次の2つのフレームは、品質向上インターフレームである。各フレームは、その質を改善し、一時的エンコーダ687の入力部における調整済フレームと、一時的エンコーダ687に保存された関連参照フレームとの差異を低減する。他の実施形態において、品質向上インターフレームの数は、2つ以外であってもよく、例えば、1から15の任意の数でありうる。一時的ストリームの最終フレームは、通常のSSPフレームとして圧縮されてSSPnフレームとして生成される、調整済のカメラフレームCFnである。調整済の同一カメラフレームCFnは、通常のエンコーダ685によって、通常のSPフレームとして調整される。SPおよびSSPをエンコードした結果、通常ストリームの参照フレームRSPnおよび一時的ストリームの参照フレームRSSPnは、同一の値を有し、参照フレームRSPnと参照フレームRSSPnは同期化される。通常ストリームおよび一時的ストリームのデコーダの参照フレームが同一の値を有するので、一時的ストリームが終了し、MRM120は、通常ストリームの追従フレームを要求側MRE3に中継する。
【0194】
MRE1からの通常ストリームは、調整後にMRE1のカメラからの調整済ビデオフレームCF1を受信した時点で、T1にて開始される。通常ストリームのエンコーダ685は、これをイントラフレームIF1として圧縮する。次に続く調整済カメラフレームは、インターフレームとしてエンコードされる。圧縮規格は、SPおよびSSPフレームを処理可能である、H.264AVC、H.264付録G等の何れの規格でもよい。
【0195】
T2において、MRE3は、通常ストリームの受信MRE130への参加を問い合わせる。従って、T2では、MRE1からのイントラフレームを要求するイントラ要求がMRE3から送信される。一実施形態において、通常ストリームの受信MRE130全てにイントラフレームを送信することでこの要求に応じる代わりに、MRE1、すなわち提示側MRE130が図11Aの下部セクションに図示するように、一時的ストリームを開始する。
【0196】
イントラ要求に追従する、調整後のカメラからの第1フレームCFmは、先のフレームRFm-1を圧縮している間に生成された参照フレームに基づいて圧縮される。図11Aの実施形態において、調整済の同一カメラフレームCFmは、一時的ストリームのイントラフレームTImとして圧縮される。イントラフレームTImは、第1フレームとして、一時的ストリームでMRE3に向けて送信される。一時的ストリームの圧縮は、通常ストリームのエンコーダ685で使用されるものと同一の圧縮規格を使用して行われるが、イントラフレームの質は、通常ストリームの質より低くてもよい。ビットレート、鮮明度等に関して質が異なりうる。
【0197】
追従する少数の調整済カメラフレームCFm+1、CFm+2は、一時的エンコーダ687によって品質向上インターフレームとしてエンコードされ、次に続くインターフレームTm+1およびTm+2を作成する。品質向上インターフレームは、例えば、1から15の間の任意の数でありうる。
【0198】
T3において、2つのストリームの質が類似していると推定されると、続く調整済カメラフレームCFnは、通常エンコーダによって、通常のSPフレームSPnとして圧縮され、通常のストリームで送信される。同じ調整済カメラフレームCFnは、一時的エンコーダ687によって、通常のSSPフレームSSPnとして圧縮され、最終フレームとして一時的ストリームで送信される。従って、一時的エンコーダで生成される参照フレームRSSPnは、通常エンコーダの参照フレームRSPnと同一の値を有する。さらに、MRE2のデコーダでSPnフレームをデコードすることにより、RSPnと同一の値を有する参照フレームが生成される。MRE3のデコーダでSSPnをデコードすることにより、RSSPnと同一の値を有する参照フレームが生成される。RSSPnおよびRSPnが同一の値を有するので、エンコーダ/デコーダは同一の参照フレームを備える。その結果、この時点において、一時的ストリームはT4にて終了し、図11Bに図示するように、通常ストリームもまた、MRM120によって要求側MRE3に切替えられる。
【0199】
図11Bにおいて、MRM120の出力側を見ると、T1において、提示側MRE1の通常ストリームの第1フレーム、つまりイントラフレームIF1は、MRE2に向けて送信され、その後に複数のインターフレームが続く。通常ストリームは、MRE2と並行して、複数の受信MRE130(図示せず)に中継される。T2において、MRE3は、通常ストリームを受信するよう問い合わせ、イントラフレームを要求する。これに応じて、MRM120は、要求側MRE3に向けた一時的ストリームのフレーム中継を開始する。第1フレームはイントラフレームTImであり、少数の品質向上インターフレームTm+1およびTm+2がこれに続く。続いて、T3において、前記ユニークなフレームSSPnが一時的ストリームの最終フレームとして送信される。T4では、インターフレームFn+1、Fn+2および通常フレームからの追従フレームもまた、MRE3に向けて中継される。
【0200】
以上の説明は、例示に過ぎず、それに限定するものではない。例えば、上述した実施形態は、各々と組み合わせて使用してもよい。当業者であれば、以上の説明を再検討することで、多数の他の実施形態が明らかであろう。従って、本発明の範囲は、添付の特許請求の範囲、およびそれが権利化されるところの等効物の全範囲を参照して決定されるべきである。添付の特許請求の範囲において、用語「?を含む」および「?において」はそれぞれ、用語「?を備える」および「?において」の平易な英語の同意語として使用される。

【特許請求の範囲】
【請求項1】
第1メディアリレーエンドポイントからの第1圧縮ビデオストリームを、第2メディアリレーエンドポイントに向けて転送されるように送信するステップと、
第2圧縮ビデオストリームを、第3メディアリレーエンドポイントに向けて転送されるように、前記第1メディアリレーエンドポイントによって作成するステップと
を備え、前記作成するステップは、
前記第1メディアリレーエンドポイントの第1エンコーダにおける第1参照フレームを、前記第1メディアリレーエンドポイントの第2エンコーダにおける第2参照フレームと同期化するステップと、
前記第1参照フレームによって前記第1エンコーダでエンコードされた第1圧縮ビデオフレームを前記第1圧縮ビデオストリームで送信するステップと、
前記第2参照フレームによって前記第2エンコーダでエンコードされた第2圧縮ビデオフレームを前記第2圧縮ビデオストリームで送信するステップ
からなる、方法。
【請求項2】
前記第3メディアリレーエンドポイントに向けて送信されるイントラフレームの要求を受信するステップをさらに備え、
前記第2圧縮ビデオストリームを、第3メディアリレーエンドポイントに向けて転送されるように、前記第1メディアリレーエンドポイントによって作成する前記ステップは、イントラフレームの要求に応じて実行される、請求項1に記載の方法。
【請求項3】
前記第1メディアリレーエンドポイントの第1エンコーダにおける第1参照フレームを、前記第1メディアリレーエンドポイントの第2エンコーダにおける第2参照フレームと同期化する前記ステップは、
前記第1ビデオストリームにおけるビデオフレームの第1シーケンスを前記第1エンコーダでエンコードすることによって、前記第1エンコーダにおいて参照フレームの第1シーケンスを作成するステップと、
前記第2ビデオストリームにおけるビデオフレームの第2シーケンスを前記第2エンコーダでエンコードすることによって、前記第2エンコーダにおいて参照フレームの第2シーケンスを作成することであって、前記ビデオフレームの第2シーケンスは、前記参照フレームの第1シーケンスに基づいてエンコードされるステップと、を含み、
前記参照フレームの第2シーケンスは、前記参照フレームの第1シーケンスと引き続きさらに同期化され、
前記参照フレームの第2シーケンスの最終参照フレームは、前記参照フレームの第1シーケンスの最終参照フレームと同期化される、請求項1に記載の方法。
【請求項4】
前記ビデオフレームの第2シーケンスは、
前記第1ビデオストリームのビデオフレームよりも低品質のイントラフレームと、
品質が向上する連続的なインターフレームとを含む、請求項3に記載の方法。
【請求項5】
前記ビデオフレームの第2シーケンスの最終ビデオフレームは、或るユニークな圧縮フレームである、請求項3に記載の方法。
【請求項6】
前記参照フレームの第1シーケンスの現在のフレームと、前記参照フレームの第2シーケンスの直前の参照フレームとの差異は、可逆的に圧縮されて、前記ビデオストリームの第2シーケンスの最終フレームを作成する、請求項3に記載の方法。
【請求項7】
前記差異は、ZIPを使用して可逆圧縮される、請求項6に記載の方法。
【請求項8】
前記ビデオフレームの第1シーケンスは、インターフレームのシーケンスである、請求項3に記載の方法。
【請求項9】
前記第1圧縮ビデオストリームおよび前記第2圧縮ビデオストリームは、H.264に適合している、請求項1に記載の方法。
【請求項10】
前記第2ビデオストリームを終了するステップと、
前記第2メディアリレーエンドポイントおよび前記第3メディアリレーエンドポイントに向けて転送されるように、前記第1ビデオストリームを送信するステップと、
をさらに備える、請求項1に記載の方法。
【請求項11】
前記第1ビデオストリームは、複数のメディアリレーエンドポイントに向けて中継するために送信される、請求項1に記載の方法。
【請求項12】
前記第1メディアリレーエンドポイントの第1エンコーダにおける第1参照フレームを、前記第1メディアリレーエンドポイントの第2エンコーダにおける第2参照フレームと同期化する前記ステップは、
前記第1圧縮ビデオストリームをエンコードする一方で、前記第1エンコーダにおいて、参照フレームの第1シーケンスを作成することと、
前記第2圧縮ビデオストリームをエンコードする一方で、前記第2エンコーダにおいて、参照フレームの第2シーケンスを作成することと、を含み、
前記第1圧縮ビデオストリームおよび前記第2圧縮ビデオストリームは、調整されたビデオ画像の同一シーケンスからエンコードされる、請求項1に記載の方法。
【請求項13】
前記第2圧縮ビデオストリームは、
前記第1圧縮ビデオストリームのビデオフレームよりも低品質のイントラフレームと、
品質が向上しているインターフレームのシーケンスと、を備える請求項12に記載の方法。
【請求項14】
前記第1圧縮ビデオストリームは、インターフレームのストリームを備える、請求項13に記載の方法。
【請求項15】
前記調整されたビデオ画像の同一シーケンスにおける現在のビデオフレームは、前記第1エンコーダによって切替予測(SP)フレームとしてエンコードされ、また前記第2エンコーダによって二次切替予測(SSP)フレームとしてエンコードされる、請求項12に記載の方法。
【請求項16】
前記SSPフレームを送信後に前記第2圧縮ビデオストリームを終了するステップをさらに備え、前記第2圧縮ビデオストリームはSSPフレームである、請求項15に記載の方法。
【請求項17】
第1メディアリレーエンドポイントと複数のメディアリレーエンドポイントとの間の多地点ビデオ会議中に、前記第1メディアリレーエンドポイントにおいて、常駐表示式レイアウトを提供するメディアリレーマルチポイント制御ユニットであって、前記常駐表示式レイアウトは複数のセグメントを備え、各セグメントは前記複数のメディアリレーエンドポイントのうち選択されたメディアリレーエンドポイントからのビデオを表示するようになっており、前記メディアリレーマルチポイント制御ユニットは、
前記複数のメディアリレーエンドポイントからリレー用圧縮ビデオデータチャンクを受信し、中継圧縮ビデオデータチャンクを前記第1メディアリレーエンドポイントに送信する、ネットワークインターフェースと、
前記複数のメディアリレーエンドポイントから2つ以上のメディアリレーエンドポイントを選択する信号処理および制御モジュールと、
圧縮ビデオプロセッサであって、
前記受信したリレー用圧縮ビデオデータチャンクを解析し、
前記選択された2つ以上のメディアリレーエンドポイントからの前記解析したリレー用圧縮ビデオデータチャンクを、中継圧縮ビデオデータチャンクの2つ以上のストリームのグループに整理し、
前記中継圧縮ビデオデータチャンクの2つ以上のストリームのグループを、前記ネットワークインターフェースを介して、前記第1メディアリレーエンドポイントに向けて送信する、前記圧縮ビデオプロセッサと
を備え、
前記圧縮ビデオプロセッサは、前記選択された2つ以上のメディアリレーエンドポイントのうち或る提示側メディアリレーエンドポイントからのイントラフレームを或る要求側メディアエンドポイントが要求している旨の指示を、前記信号処理および制御モジュールから受信することに応答して、
リレー用圧縮ビデオデータチャンクの通常ストリームの取得と並行して、リレー用圧縮ビデオデータチャンクの一時的ストリームを取得し、その際両ストリームともに前記提示側メディアリレーエンドポイントから取得し、
前記一時的ストリームの前記取得したリレー用圧縮ビデオデータチャンクを解析し、
前記解析したリレー用圧縮ビデオデータチャンクを、中継圧縮ビデオデータチャンクの一時的ストリームに整理し、
前記中継圧縮ビデオデータチャンクの一時的ストリームを、前記ネットワークインターフェースを介して、前記要求側メディアリレーエンドポイントに向けて転送する、
ことを特徴とするメディアリレーマルチポイント制御ユニット。
【請求項18】
前記圧縮ビデオプロセッサは、前記提示側メディアリレーエンドポイントから取得した通常の中継圧縮ビデオデータチャンクを、前記要求側メディアリレーエンドポイントに向けて中継することによって前記一時的ストリームが終了する旨の指示を、前記信号処理および制御モジュールから受信するとそれに応答するように、さらに構成される、請求項17に記載のメディアリレーマルチポイント制御ユニット。
【請求項19】
第1エンコーダと一時的エンコーダとを備えたビデオプロセッサを備えるメディアリレーエンドポイントであって、
前記ビデオプロセッサが、
前記第1エンコーダによって圧縮された第1ビデオストリームを、第2メディアリレーエンドポイントに中継するために送信し、
第3メディアリレーエンドポイントがイントラフレームを必要としている旨の指示を受信した場合に、前記一時的エンコーダによって圧縮された一時的ビデオストリームを、前記第3メディアリレーエンドポイントに向けて中継するために送信し、
前記第1エンコーダの第1参照フレームと前記一時的エンコーダの第2参照フレームを同期化し、
前記一時的ビデオストリームを終了する
よう構成されていることを特徴とするメディアリレーエンドポイント。
【請求項20】
前記指示は、前記第3メディアリレーエンドポイントから受信したイントラ要求である、請求項19に記載のメディアリレーエンドポイント。
【請求項21】
前記ビデオプロセッサは、前記第1エンコーダによって切替予測(SP)フレームを作成し、前記一時的エンコーダによって二次切替予測(SSP)フレームを作成することによって同期化を行う、請求項19に記載のメディアリレーエンドポイント。
【請求項22】
メディアリレーエンドポイント(MRE)用ビデオプロセッサを備えたメディアリレーエンドポイントであって、
前記MRE用ビデオプロセッサは、
選択された複数のMREのグループから発せられる中継圧縮ビデオデータチャンクのストリームのグループを受信し、
前記受信した中継圧縮ビデオデータチャンクを複数のグループに整理し、該複数のグループの各々は、前記選択された複数のMREのグループ内の1つのMREに対応しており、
整理および受信した中継圧縮ビデオデータチャンクの前記各グループをデコードし、
前記デコード済の前記整理および受信した中継圧縮ビデオデータチャンクから、常駐表示式レイアウトを構築するものであり、かつ、
前記MRE用ビデオプロセッサは、
第1MREから送信された中継圧縮ビデオデータチャンクの一時的ストリームを取得し、
前記レイアウトにおいて、前記一時的ストリームからのビデオを整理、デコードおよび構築し、
前記第1MREから受信した通常ビデオストリームをデコードするために割り当てられたデコーダにおいて、参照フレームを同期化し、
前記レイアウトにおいて、前記通常ストリームからのビデオを整理、デコードおよび構築するよう構成されている、
ことを特徴とするメディアリレーエンドポイント。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8A】
image rotate

【図8B】
image rotate

【図9A】
image rotate

【図9B】
image rotate

【図10A】
image rotate

【図10B】
image rotate

【図11A】
image rotate

【図11B】
image rotate


【公開番号】特開2013−42492(P2013−42492A)
【公開日】平成25年2月28日(2013.2.28)
【国際特許分類】
【外国語出願】
【出願番号】特願2012−175478(P2012−175478)
【出願日】平成24年8月7日(2012.8.7)
【出願人】(509270096)ポリコム,インク. (18)
【Fターム(参考)】