テレビ会議システム
【課題】離れたサイトにいる参加者の間でのテレビ会議システムであって、離れたサイトにいる参加者の全員の姿を投影し、1つの仮想的な会議室を提供する。
【解決手段】テレビ会議システムにおける映像画面は投影、オーバーヘッド投影または直視型投影の大画面10であり、画像壁を形成する1つまたは複数の表示システムを備え、前記画面10によって形成された画像壁に再現された空間内で、全ての離れた参加者を同時に表示し、各サイトごとに、音声100A、Hi、Mjを空間的に分布して離れた各参加者が発した音声を、対象となるサイトで画面に投影された参加者の画像に対応させる装置を備える。
【解決手段】テレビ会議システムにおける映像画面は投影、オーバーヘッド投影または直視型投影の大画面10であり、画像壁を形成する1つまたは複数の表示システムを備え、前記画面10によって形成された画像壁に再現された空間内で、全ての離れた参加者を同時に表示し、各サイトごとに、音声100A、Hi、Mjを空間的に分布して離れた各参加者が発した音声を、対象となるサイトで画面に投影された参加者の画像に対応させる装置を備える。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、遠隔の一般に離れたサイトにいる参加者の間におけるテレビ会議または遠隔会議システムに関するものである。
【0002】
本発明は、マルチポイントシステム、すなわち数カ所のサイトにいる参加者間の視聴覚リンクを生成するためのシステムに適用される。本発明はさらに、二地点間システム、すなわち視聴覚リンクを介して2つのサイトのみを接続するシステムに関するものである。本発明はさらに、会議ゲートウェイを介して接続されるテレビ電話にも適用される。
【背景技術】
【0003】
所定のサイトのためのテレビ会議システムの機器は、以降、部屋またはスタジオと称する施設内に配置される。大抵の場合には、参加者は表示画面に面した会議用テーブルのまわりに着席している。
【0004】
現在、市販のテレビ会議サービス及びシステムは、チャネルバンクの品質(音声及び画像の再生)によって、または、本質的に、使用する特定のネットワーク上で通過帯域に対する制限があるためにビットレートが存在しないという事実によって、制限された視聴覚品質のマルチポイントリンクを提案している。
【0005】
実際に、上記会議システムは、二地点間方式であれ、マルチポイント方式であれ、複数の構成に従ってデジタルネットワークに、主としてISDNネットワーク上で、接続されている。
【0006】
従って、NUMERISネットワーク上のこのようなサービスのために提供されるビットレートは、最低の会議サービス用の128キロビット/秒から最高の会議サービス用の384キロビット/秒まで変化する。
使用する端末は概してITU規格、例えば全てのH320規格に従う。
【0007】
ある種のシステムでは、一度に1つの離れた部屋しか見ることができない。これでは同時に全員を見ることができないのでユーザーにとって不都合である。手動または自動切換えで画面に表示される部屋を選択する。一般に、この部屋は最も強い音声信号を伝送する(音声切換え)。これは、音声の検出、すなわち最も活発な音声がある部屋に従って画像を切換える会議ゲートウェイの場合に当てはまる。
【0008】
規格H320またはH323のような規格、または他のITU規格に従う他のシステムは、中央装置を用いて、規格H231及びH243で規定された全てのマルチ会議ユニット(MCU)からの画像を受ける。この中央装置は、伝送された画像の数と同じ数、MCUへの伝送用の通過帯域を分割することによって画像を再生する。
【0009】
これは、暗号化によって40〜50の圧縮比でオンラインビットレートを実質的に圧縮することによって行われる。その結果、鮮明度の損失(definition loss)は各部屋(5部屋までのマルチポイントリンクで)から伝送された画像の約4分の3に等しくなる。
【0010】
画像のデジタル圧縮は、H261暗号化を用いるH320型、またはH263暗号化を用いるH323型、動画用JPEG(ISO規格)、MPEG1型、またはMPEG2型にすることができる。
【0011】
上記形式のどれでも、送信された画像はコンピュータファイルの形にすることができる。
いずれにせよ、受信した画像は損なわれており、マルチ会議の効果は再現されない。
これ以上の情報に関しては、特許文献D1 WO 94 16517に記載の最新の従来技術を参照されたい。
【特許文献1】WO 94 16517
【0012】
音声伝送では、暗号化システムが用いられるか、または、帯域幅の点からも暗号化自体の品質の点からも音声信号の最初の品質を考慮しないG722またはG711型のビットレート圧縮が用いられる。
【発明の開示】
【発明が解決しようとする課題】
【0013】
本発明のテレビ会議システムの目的は、現在市販されているシステムの限界を超えて、遠隔サイト間での最大数の参加者とのテレビ会議を提供することにある。
【課題を解決するための手段】
【0014】
本発明のテレビ会議システムは、身振りの感じや様式が明確に認識され、且つ映し出した状態に応じて、離れた参加者の音声を空間的に分布させることによって視覚イメージと音声イメージとを対応させて、離れたサイトにいる参加者の姿を(1に近い縮尺比で)画面上に提供するものである。
【0015】
本発明が提供するシステムは、離れたサイトにいる参加者をマルチポイント構成であっても連続的に表示する。さらに、本発明のシステムは、以下で説明するように、撮影すべき画像に近い(例えば、画面ウインドウに収容される)n個(但し、nは2以上の自然数)のテレビカメラの使用によってアイコンタクトの欠点を最小限に抑える。さらにハイファイ音声再生を可能にする。
【0016】
特に、本発明は請求項1に記載のテレビ会議、システムを提案する。
【0017】
離れた参加者の画像は1に近い縮尺比でスタジオの画面上にあり、この縮尺比は画面と参加者の着席しているテーブルとの間の距離に依存する。従って、例えば、各部屋に約4人がいる遠隔の4つの部屋を表示するのに標準的な寸法の画面は約5×2mである。
【0018】
本発明のテレビ会議システムは1つまたは複数のカメラ(CA1)、(CA2)及び音ピックアップ装置(マイクまたは音響アンテナ)を備える。ピックアップされた音データは、伝送された映像信号を生成したのがカメラ(CA1)かカメラ(CA2)かによって、一方または他方のカメラに対応させられる。
【0019】
特に、この対応によって「主観的な重なり」が実現され、音源は、対応する画像の近く(この画像の軸に沿って)にある。
【0020】
本発明の別の特徴によれば、音ピックアップ及び再生装置は,
−信号捕捉及びデジタル化ユニット;
−信号再生及びデジタル/アナログ変換ユニット;
−上記サイトの参加者の前に配置されたn個(但しnは2以上の自然数)のマイク;
−画面の長さに沿って分配され且つ画面のサイズに比例するp個(但しpは2以上の自然数)のスピーカ;
−1つまたは複数のマイクと、上記マイクから生成された信号と、上記信号を再生するための遠隔サイトのスピーカとの間を対応させるユニット;
−ビットレートの圧縮を特徴とする適応型インターフェイス;
−エコー制御装置
を備える。
【0021】
音声は、音声イメージと視覚イメージとが対応するように空間的に分布される。
【0022】
この配置は遠隔会議の効果を強力に高めるだけでなく、2つの離れた部屋の間で平行して複数の会話を行うことができ、会話のモニタリングは、まさしく通常の会議と同様に、参加者が話を聞きたい相手に焦点を合わせることができるシステムの機能によって簡単になっている。
【0023】
マイク、上記マイクから生成された信号及び上記信号を再生するための遠隔地のスピーカの間の通信を確立する装置は、所望の構成をプログラムすることによって動作する。このようなプログラミングは、1つまたは複数の所定の構成を記憶することも含むものである。
【0024】
別の特徴によれば、画像ピックアップ装置は各サイトにつきq個(但しqは自然数)のカメラを備え、この数は2以上であるのが好ましい。カメラは、上記サイトの参加者の前に位置し、画面上の遠隔の様々な参加者を表示する個々のエリアまたはこれらの近くに配置される。実際に、カメラは画面の下側、上部またはまわりに配置されることができる。
【0025】
各部屋は、従って、異なる角度で参加者を撮影する複数のカメラを備える。1つのサイトに伝送された画像は、このサイトの投影された画像の近くに位置するカメラによってピックアップされた画像である。これによってアイコンタクト効果を減らし、視点を区別し、上記サイト及び構成全体での各参加者の状態に従って彼/彼女の位置を再構成することができる。
【0026】
複数の画像が画面の幅にわたって並列している二地点間構成では、各画像は施設の一部の光景を提供する。これによって、画面上で誰が誰を見ているかを知ることが容易になり、従って、会議の動きについて行くことが容易になる。
【0027】
実際に、カメラは画面10に投影された画像の下方(または下側)に配置される。
【0028】
(一方が他方のそばに)連結された2つの画像を有する構成の場合、カメラは再編成され、画面中央から離れた所で、画像の幅の約3分の1、すなわち画面の全幅の6分の1に対応する所に配置される。このような再編成によって2つのカメラによって撮影された2つの画像の辺が重なり合うという問題が最小限になる。
【0029】
上記のサイトは二地点間またはマルチポイント構成で高ビットレートネットワークを介して接続されるか、または中央MCUユニット(テレビ会議ゲートウェイ)を介して接続される。
【発明を実施するための最良の形態】
【0030】
以下、添付図面を参照して本発明をさらに詳細に説明するが、本発明が下記実施例に限定されるものではない。
【0031】
遠隔会議効果を得る方法を説明するために、図1は現実の会議と同様の会議の図を示している。
【0032】
円形の仮想テーブルのまわりに12人が着席していると仮定する。一人の参加者は隣りの4人のグループをウインドウ越しに見ることができ、またこの面を展開することによって平坦なまたはほとんど平坦な画面上でこれら4人を見ることができると仮定できる。従って、彼は2つの異なるスタジオにいる4人グループの他の8人を2つの画面上、実際には平坦な形状で見る。常識的には、仮想テーブルは円形ではなく、長手方向に置かれ、両側に参加者のグループが着席する。従って、Eの人は左手にAの人を、右手にFの人を見ることになり、全ての人の間には連続的な隣接関係が存在する。
【0033】
図2は参入構成を再現するためにわずかにカーブした画面を示している。
【0034】
この環境では特に、互いに向き合って互いを見ている参加者の間で視線を近づけることによって参加者間で交わされる視線を再現することができる。例えば、AがEを見ることができ、視角の主観的な接近によって他の人々はAがFを見ているのを見る。
【0035】
図3の略図は本発明の遠隔会議システムの概念図を示している。
【0036】
当然、音声/空間の分布及び全ての参加者の全体をシミュレートする画像壁を得ることができる限り、参加者の状態(着席または起立、テーブルのまわりか否か)、カメラの位置及びスピーカの位置に関しては他の別の方法も可能である。
【0037】
サイトAは高ビットレートネットワークを介して他のサイトB〜Kに接続されている。これらのサイトのための異なる接続方法は、後続する図10〜図13に詳細に示されている。例えば、ISDN(サービス総合デジタル網)は複数のSOアクセスポイントをグループ化することによって使用できる。情報ハイウェイ、インターネットまたはHDSLアクセス装置も使用できる。このようなネットワークは、ビットレート圧縮システムを利用して最初の品質を保持する限り、7kHzを超える通過帯域のアナログ音声信号と互換できないものではない。これによってデジタルコンパクトディスク(CD)の提供する音質に相当する高い音質が提供される。
【0038】
伝送網は非同期転送モード(ATM)ネットワークまたは他のデジタルまたはアナログ型の高ビットレートネットワークによって使用される。全ての画像は異なるサイトへ高スループットで伝送されることができ、暗号化中に圧縮比を増加する必要がない。
【0039】
例えば、暗号化された画像はNumerisネットワークの384Kビット/秒から使用するネットワークの型によって2Mビット/秒で伝送される。
【0040】
テレビ会議は、制御及び処理ユニット100A〜100Kによって制御されるか、または遠隔制御され、これら制御及び処理ユニットは、参加者間の確立した通信、音声イメージ及び視覚イメージに応じるようにネットワークRを介して会話する。換言すれば、制御及び処理ユニットは、伝送された信号の構成の記述(構成が予め規定されていない場合)、または全てのサイトに対して予め規定された複数の構成から選択された構成モードの記述を伝送する。これらは全てのスタジオ機器を所望の構成に従って管理することができる。可能な会議の構成の中で、二地点間リンクまたは3、4、5またはそれ以上のサイトの間のマルチポイントリンクは可能である。
【0041】
実際には、上記構成はサイトP1(A)の参加者と、この参加者の会話を取り込む音ピックアップ装置(S)M1(マイクまたは音響アンテナ)と、彼/彼女を撮影するカメラCA1との間のリンクの記述を含み、サイトB上の画像IP1(A)がスピーカH1に対応してマイクM1によって送り出された音声を再現する。
【0042】
この目的のために、サイトAはn個のマイク、p個のスピーカ及びq個のカメラを備える。但し、n及びpは2以上の自然数であり、qは自然数である。所定のサイトでは、スピーカの数は画面の(この画面の幅または表面に沿った)サイズに比例する。
【0043】
テーブルのまわりに着席した参加者に関して、大きな画面10は、所定のサイトの会議テーブルの前に配置され、(各サイトの)画面画像はこの画面に投影されて、遠隔の参加者は上記サイトの参加者と同じレベルにおり、仮想テーブルを形成している。
【0044】
参加者P1(A)が参加者P1(B)に話しかけるとき、サイトAのカメラCA1の画像は他のサイトB〜Kに向けられる。さらに、サイトBのカメラCA1の画像はサイトA、C〜Kに伝送される。他のサイトでどの参加者も話しをしていない場合は、全ての参加者の画像が伝送されるが、これらのサイトでのカメラの撮影は中立である。
【0045】
カメラ画像は上記サイトに存在する制御ユニット100A〜100Kによって制御されるか、またはモニタリングサイトから遠隔操作される。
【0046】
行われる音のピックアップと、画像をピックアップしなければならないカメラとの間のサーボ制御は、当業者に周知な制御プログラムを介して保証される。このプログラムは、制御及び処理ユニット100A〜100Kによって実行され、画面に投影されたときに、関係している参加者が実際に互いを見ているという印象を与える画像が得られる。
【0047】
実際に、この効果は2つのカメラのみを使用して再現することができる。
【0048】
ネットワークによって伝送された画像は各サイトで受け取られ、映像ユニット300によって処理されて、画面上に並列及び/または重なって投影される。しかし、受けられた全ての画像は各サイトの画面10上に投影され、上記画面は画像壁を形成する。
【0049】
二地点間方式に特有の場合では、各画面に投影された画像は単一の部屋に対応する。この構成によって画像の品質を高めることができる。この目的のために、カメラによって得られた各画像の両方の画像を伝送することを提案する。各カメラは施設の一部の画像をピックアップする。実際には、一方のカメラが情景の半分を撮影し、他方のカメラが残りの半分を撮影する。
【0050】
画像の並置は、制御及び処理ユニット100A及び100Bによって制御され、これらの制御及び処理ユニットは、映像ユニット300を制御し、2つのカメラによって送信された信号を基に単一の画像を画面上に投影する。画像結合は本質的に従来の型の画像処理である。
【0051】
図4はシステムの一部である処理及び制御ユニットをより詳細に示している。またその一方で、これは1つのスタジオにつき2つのカメラが存在する別の実施例である。
【0052】
映像ユニット300に関して:
第1のカメラCA1は映像エンコーダ303に接続され、映像デコーディングユニット304は第1のプロジェクタPR1に接続される。デコーディングユニットは1つまたは複数のデコーダを備え、各デコーダは、サイトで生成された映像信号をデコードする。一組のデコーダにも適用できるので、以下、デコーダ304を挙げて説明する。
エンコーダ303及びデコーダ304は、ネットワークR上の映像信号を適応型処理して伝送する適応型インターフェース301に接続される。例えば、上記適応型インターフェース301はATMネットワーク上の伝送ではインターフェースAAL1(適応型レイヤ)である。
【0053】
この上記適応型インターフェース301は物理的サポートインターフェース400に接続される。
【0054】
例えば、制御及び処理ユニット100Aは、ローカルネットワークRLを介して、制御信号CD1、DC1、IV1をそれぞれエンコーダ、デコーダ及び適応型インターフェース301にテレビ会議の構成に従って送信する。
【0055】
同様に、第2のカメラCA2はエンコーダ305に接続され、このエンコーダ305はネットワーク上の、映像信号を適応型処理して伝送する適応型インターフェース302に接続される。デコーダ306は第2のプロジェクタPR2及び適応型インターフェース302に接続される。適応型インターフェース302は物理的サポートインターフェース400に接続される。
【0056】
制御及び処理ユニット100Aは制御信号CD2、DC2及びIV2をそれぞれエンコーダ、デコーダ及び適応型インターフェースに上記構成に従って送信する。
【0057】
映像エンコーダは本発明の範囲から逸脱しない方法に従って複数のデコーダに機能的に接続されることができる。
【0058】
あるサイトでは第3のカメラをエンコーダのうちの1つ303または305に接続して優先すべき特定の参加者の画像を伝送してもよい。このカメラの画像はカメラに接続されたエンコーダによって暗号化され、全ての他のサイトに伝送される。この場合、他の全てのサイトは、このようなサイトのデコーダユニット304または306内に追加のデコーダを備え、このカメラによって送信された映像信号を処理して、このような画像に関連したショットを上記サイトの画面10上に投影しなければならない。
【0059】
プロジェクタは、ビデオプロジェクタまたは液晶オーバーヘッドプロジェクタである。映像はプラズマ画面を用いた直視型にしてもよい。
【0060】
音声ユニット200に関して:
n個のマイクは信号をデジタル化する信号捕捉及びデジタル化ユニット201に接続される。この信号捕捉及びデジタル化ユニット201の出力は、エコーを制御するために減衰ユニット207の入力に印加される。減衰ユニットの出力は、ユニット100Aによって制御されて音声信号をビットレート圧縮するエンコーディング及びマトリクス化ユニット202の入力に印加される。エンコーディング及びマトリクス化ユニット202はさらに、複数のマイク信号のマトリクス化を実行し、音声伝送用のネットワーク上で利用可能なチャネルの数に合わせる。この目的のために、上記エンコーディング及びマトリクス化ユニット202は、構成制御信号CAを受ける。エンコーディング及びマトリクス化ユニット202はネットワークR上の適応型インターフェース204(ATMネットワークではインターフェースAAL5)に接続される。この適応型インターフェースは、物理的サポートインターフェース400に接続される。
【0061】
適応型インターフェース204は、ネットワーク上で暗号化された音声信号を生成することができ、他のサイトで生成された暗号化された音声信号を受けることができる。受けた信号は、適応型インターフェース204によって処理され、デコーディング及び音声信号デマトリクス化するデコーディング及びデマトリクス化ユニット203に印加される。
【0062】
デコーディング及びデマトリクス化ユニット203によって送信された信号は、音声信号再生及びデジタル/アナログ変換ユニット205を介して、所望のスピーカに印加される。この信号再生及びデジタル/アナログ変換ユニット205は、受けた必要な信号を適切なスピーカに送信するように構成されている。
【0063】
上記構成が、制御及び処理ユニット100Aのメモリ110にプログラムされて記憶される場合、制御及び処理ユニット100Aは、デコーダの出力S1がマイクM1によってまたはサイトBのM1を含む一連のマイクによって取り込まれた信号を送信することを示す情報及びこの出力が従ってスピーカHnまたはスピーカH1を含む一連のスピーカに送信され、話をした参加者のクローズアップした光景を生成しなければならないことを示す情報をメモリテーブルに内蔵する。
【0064】
捕捉システム(マイク及び信号再生及びデジタル/アナログ変換ユニット205)は音声信号通過帯域を考慮に入れて、7kHz(品質の点からシステムの下限)の周波数帯で動作するよう選択される。暗号化システムもこの最初の品質を考慮に入れて選択され、ビットレート圧縮アルゴリズムは標準的なMPEG1またはMPEG2で記述されるように選択される。捕捉システムはさらに良好な信号対雑音比を提供するように選択される。
【0065】
二地点間構成における2つの部屋の場合、可能な構成は6個の音声チャネル、すなわち各マイクにつき1個の音声チャネルを備える。3つの部屋の場合、各サイトに2×3の音声チャネルが存在する。サイトAでは、3個のチャネルがAとBとの間に音声リンクを提供し、他の3個のチャネルがAとCとの間に音声リンクを提供する(BとCとの間も同様)。
【0066】
画像及び音声は最低のタイムシフト(約100ミリ秒)で伝送され、ビデオ画像の品質及びサイズと組合されることで、聴覚障害のある人が離れた通信相手の唇を読むことができる。
【0067】
さらに、音声機器はエコー制御回路206を備え、この回路206は可変減衰ユニット207を介してマイク信号に、本質的に標準的な方法に従って利得可変器として動作する。上記回路は、信号捕捉及びデジタル化ユニット201の出力と信号再生及びデジタル/アナログ変換ユニット205の入力との間に接続される。
【0068】
図5の概略図は上記の可能な構成を示している。これは3つのサイトA、B及びCの間の映像構成である。
【0069】
上記の図はこのような構成が伝送網を無視して各サイトの間に提供する直接リンクを強調することによって単純化したものである。
【0070】
この構成を3つのサイト:A、B及びCから説明する。
サイトA及びBはそれぞれ、同じサイトで異なる角度で撮影する2個のカメラCA1及びCA2を備える。
この構成によれば、二地点間リンクにはエンコーダ及びデコーダが設けられている。
【0071】
カメラCA1はサイトAのエンコーダ303に接続される。このエンコーダはデコーダ304に接続され、このデコーダはプロジェクタに接続され、このフロジェクタは画面画像E1(A)(サイトAのカメラCA1から生成された画像)を提供する。
【0072】
サイトBのエンコーダ303はサイトBのカメラCA1に接続される。デコーダによって供給される信号はサイトAのデコーダ304によって解読され、画面画像E1(B)(サイトBのカメラCA1から生成された画像)を供給する。
【0073】
Cスタジオには、CA1で表された単一のカメラが設けられている。このカメラは2つのエンコーダ304(A2)及び304(B2)に接続される。エンコーダ304(A2)
は画面画像E1(C)と組み合わされたサイトAのデコーダ306に接続され、エンコーダ304(B2)は画面画像E1(C)と組み合わされたサイトBのデコーダ306に接続される。
【0074】
逆に、サイトCのデコーダ306はサイトAのカメラCA2の信号のエンコーダ305に接続され、他方はサイトBのカメラCA2の信号のエンコーダ305に接続され、それぞれサイトAの画面画像、すなわちE2(A)及びサイトBの画面画像、すなわちE2(B)をサイトC上に表示する。
【0075】
音声処理ユニットはさらにこの構成に従って二倍にされ、各サイトの音声ユニット202、203、205を接続する。
【0076】
図6はサイトAとサイトBとの間の二地点間リンクを示している。この場合、各カメラCA1、CA2は上記サイトの一部の光景を捕捉する。
6個の音声信号(6個のマイク)の伝送の場合には、2個のエンコーダ−デコーダが各サイトにつき3個のチャネルに使用される。
【0077】
図7〜図9はサイトA、B及びCに投影された画面画像をそれぞれ示している。サイトA(図7)では、画面画像E(4、3、2、1)は個々の端末から生成された光景を提供し、画面画像E(C、B)はサイトC及びBの重ねられた光景を提供する。
図8はサイトBでの表示構成を示し、図9はサイトCでの表示構成を示している。
【0078】
図10〜図13は上記サイト間の可能なリンクの例を示している。
図10はATMネットワークまたは専用回線を介して接続される4つのスタジオを示している。
図11は集中MCUユニット(テレビ会議ゲートウェイ)を介して提供された接続を示している。
【0079】
図12はネットワークラインとMCU装置とを混合したもの、すなわちスタジオ1、2及び3の音声信号を抑制するための装置を含む市販のテレビ会議ゲートウェイを示している。上記信号を抑制するのは、このようなハードウェアを介する直接リンク及び接続を備えるサイトは直接ネットワークリンク及びMCU接続から生成された信号の重なり(及びタイムシフト)によって悪影響を受けるからである。
図13は異なる型のネットワーク、例えばNumeris、ATM及び専用回線を介する接続を示している。
【図面の簡単な説明】
【0080】
【図1】本発明が解決するテレビ会議の問題を概念的に示す図である。
【図2】本発明が解決するテレビ会議の問題を概念的に示す図である。
【図3】本発明を示す概略図である。
【図4】スタジオの機器の実施例を示す図である。
【図5】3つのスタジオの間の会議リンクの場合の独特な実施例を示す図である。
【図6】2つのスタジオの間のリンクの場合の独特な実施例を示す図である。
【図7】大きい画面上に画像壁を形成する、異なる「画面画像」の例を示す図である。
【図8】大きい画面上に画像壁を形成する、異なる「画面画像」の例を示す図である。
【図9】大きい画面上に画像壁を形成する、異なる「画面画像」の例を示す図である。
【図10】異なるネットワーク構成における本発明のスタジオ機器または映像音声端末間の異なる接続方式を示す図である。
【図11】異なるネットワーク構成における本発明のスタジオ機器または映像音声端末間の異なる接続方式を示す図である。
【図12】異なるネットワーク構成における本発明のスタジオ機器または映像音声端末間の異なる接続方式を示す図である。
【図13】異なるネットワーク構成における本発明のスタジオ機器または映像音声端末間の異なる接続方式を示す図である。
【技術分野】
【0001】
本発明は、遠隔の一般に離れたサイトにいる参加者の間におけるテレビ会議または遠隔会議システムに関するものである。
【0002】
本発明は、マルチポイントシステム、すなわち数カ所のサイトにいる参加者間の視聴覚リンクを生成するためのシステムに適用される。本発明はさらに、二地点間システム、すなわち視聴覚リンクを介して2つのサイトのみを接続するシステムに関するものである。本発明はさらに、会議ゲートウェイを介して接続されるテレビ電話にも適用される。
【背景技術】
【0003】
所定のサイトのためのテレビ会議システムの機器は、以降、部屋またはスタジオと称する施設内に配置される。大抵の場合には、参加者は表示画面に面した会議用テーブルのまわりに着席している。
【0004】
現在、市販のテレビ会議サービス及びシステムは、チャネルバンクの品質(音声及び画像の再生)によって、または、本質的に、使用する特定のネットワーク上で通過帯域に対する制限があるためにビットレートが存在しないという事実によって、制限された視聴覚品質のマルチポイントリンクを提案している。
【0005】
実際に、上記会議システムは、二地点間方式であれ、マルチポイント方式であれ、複数の構成に従ってデジタルネットワークに、主としてISDNネットワーク上で、接続されている。
【0006】
従って、NUMERISネットワーク上のこのようなサービスのために提供されるビットレートは、最低の会議サービス用の128キロビット/秒から最高の会議サービス用の384キロビット/秒まで変化する。
使用する端末は概してITU規格、例えば全てのH320規格に従う。
【0007】
ある種のシステムでは、一度に1つの離れた部屋しか見ることができない。これでは同時に全員を見ることができないのでユーザーにとって不都合である。手動または自動切換えで画面に表示される部屋を選択する。一般に、この部屋は最も強い音声信号を伝送する(音声切換え)。これは、音声の検出、すなわち最も活発な音声がある部屋に従って画像を切換える会議ゲートウェイの場合に当てはまる。
【0008】
規格H320またはH323のような規格、または他のITU規格に従う他のシステムは、中央装置を用いて、規格H231及びH243で規定された全てのマルチ会議ユニット(MCU)からの画像を受ける。この中央装置は、伝送された画像の数と同じ数、MCUへの伝送用の通過帯域を分割することによって画像を再生する。
【0009】
これは、暗号化によって40〜50の圧縮比でオンラインビットレートを実質的に圧縮することによって行われる。その結果、鮮明度の損失(definition loss)は各部屋(5部屋までのマルチポイントリンクで)から伝送された画像の約4分の3に等しくなる。
【0010】
画像のデジタル圧縮は、H261暗号化を用いるH320型、またはH263暗号化を用いるH323型、動画用JPEG(ISO規格)、MPEG1型、またはMPEG2型にすることができる。
【0011】
上記形式のどれでも、送信された画像はコンピュータファイルの形にすることができる。
いずれにせよ、受信した画像は損なわれており、マルチ会議の効果は再現されない。
これ以上の情報に関しては、特許文献D1 WO 94 16517に記載の最新の従来技術を参照されたい。
【特許文献1】WO 94 16517
【0012】
音声伝送では、暗号化システムが用いられるか、または、帯域幅の点からも暗号化自体の品質の点からも音声信号の最初の品質を考慮しないG722またはG711型のビットレート圧縮が用いられる。
【発明の開示】
【発明が解決しようとする課題】
【0013】
本発明のテレビ会議システムの目的は、現在市販されているシステムの限界を超えて、遠隔サイト間での最大数の参加者とのテレビ会議を提供することにある。
【課題を解決するための手段】
【0014】
本発明のテレビ会議システムは、身振りの感じや様式が明確に認識され、且つ映し出した状態に応じて、離れた参加者の音声を空間的に分布させることによって視覚イメージと音声イメージとを対応させて、離れたサイトにいる参加者の姿を(1に近い縮尺比で)画面上に提供するものである。
【0015】
本発明が提供するシステムは、離れたサイトにいる参加者をマルチポイント構成であっても連続的に表示する。さらに、本発明のシステムは、以下で説明するように、撮影すべき画像に近い(例えば、画面ウインドウに収容される)n個(但し、nは2以上の自然数)のテレビカメラの使用によってアイコンタクトの欠点を最小限に抑える。さらにハイファイ音声再生を可能にする。
【0016】
特に、本発明は請求項1に記載のテレビ会議、システムを提案する。
【0017】
離れた参加者の画像は1に近い縮尺比でスタジオの画面上にあり、この縮尺比は画面と参加者の着席しているテーブルとの間の距離に依存する。従って、例えば、各部屋に約4人がいる遠隔の4つの部屋を表示するのに標準的な寸法の画面は約5×2mである。
【0018】
本発明のテレビ会議システムは1つまたは複数のカメラ(CA1)、(CA2)及び音ピックアップ装置(マイクまたは音響アンテナ)を備える。ピックアップされた音データは、伝送された映像信号を生成したのがカメラ(CA1)かカメラ(CA2)かによって、一方または他方のカメラに対応させられる。
【0019】
特に、この対応によって「主観的な重なり」が実現され、音源は、対応する画像の近く(この画像の軸に沿って)にある。
【0020】
本発明の別の特徴によれば、音ピックアップ及び再生装置は,
−信号捕捉及びデジタル化ユニット;
−信号再生及びデジタル/アナログ変換ユニット;
−上記サイトの参加者の前に配置されたn個(但しnは2以上の自然数)のマイク;
−画面の長さに沿って分配され且つ画面のサイズに比例するp個(但しpは2以上の自然数)のスピーカ;
−1つまたは複数のマイクと、上記マイクから生成された信号と、上記信号を再生するための遠隔サイトのスピーカとの間を対応させるユニット;
−ビットレートの圧縮を特徴とする適応型インターフェイス;
−エコー制御装置
を備える。
【0021】
音声は、音声イメージと視覚イメージとが対応するように空間的に分布される。
【0022】
この配置は遠隔会議の効果を強力に高めるだけでなく、2つの離れた部屋の間で平行して複数の会話を行うことができ、会話のモニタリングは、まさしく通常の会議と同様に、参加者が話を聞きたい相手に焦点を合わせることができるシステムの機能によって簡単になっている。
【0023】
マイク、上記マイクから生成された信号及び上記信号を再生するための遠隔地のスピーカの間の通信を確立する装置は、所望の構成をプログラムすることによって動作する。このようなプログラミングは、1つまたは複数の所定の構成を記憶することも含むものである。
【0024】
別の特徴によれば、画像ピックアップ装置は各サイトにつきq個(但しqは自然数)のカメラを備え、この数は2以上であるのが好ましい。カメラは、上記サイトの参加者の前に位置し、画面上の遠隔の様々な参加者を表示する個々のエリアまたはこれらの近くに配置される。実際に、カメラは画面の下側、上部またはまわりに配置されることができる。
【0025】
各部屋は、従って、異なる角度で参加者を撮影する複数のカメラを備える。1つのサイトに伝送された画像は、このサイトの投影された画像の近くに位置するカメラによってピックアップされた画像である。これによってアイコンタクト効果を減らし、視点を区別し、上記サイト及び構成全体での各参加者の状態に従って彼/彼女の位置を再構成することができる。
【0026】
複数の画像が画面の幅にわたって並列している二地点間構成では、各画像は施設の一部の光景を提供する。これによって、画面上で誰が誰を見ているかを知ることが容易になり、従って、会議の動きについて行くことが容易になる。
【0027】
実際に、カメラは画面10に投影された画像の下方(または下側)に配置される。
【0028】
(一方が他方のそばに)連結された2つの画像を有する構成の場合、カメラは再編成され、画面中央から離れた所で、画像の幅の約3分の1、すなわち画面の全幅の6分の1に対応する所に配置される。このような再編成によって2つのカメラによって撮影された2つの画像の辺が重なり合うという問題が最小限になる。
【0029】
上記のサイトは二地点間またはマルチポイント構成で高ビットレートネットワークを介して接続されるか、または中央MCUユニット(テレビ会議ゲートウェイ)を介して接続される。
【発明を実施するための最良の形態】
【0030】
以下、添付図面を参照して本発明をさらに詳細に説明するが、本発明が下記実施例に限定されるものではない。
【0031】
遠隔会議効果を得る方法を説明するために、図1は現実の会議と同様の会議の図を示している。
【0032】
円形の仮想テーブルのまわりに12人が着席していると仮定する。一人の参加者は隣りの4人のグループをウインドウ越しに見ることができ、またこの面を展開することによって平坦なまたはほとんど平坦な画面上でこれら4人を見ることができると仮定できる。従って、彼は2つの異なるスタジオにいる4人グループの他の8人を2つの画面上、実際には平坦な形状で見る。常識的には、仮想テーブルは円形ではなく、長手方向に置かれ、両側に参加者のグループが着席する。従って、Eの人は左手にAの人を、右手にFの人を見ることになり、全ての人の間には連続的な隣接関係が存在する。
【0033】
図2は参入構成を再現するためにわずかにカーブした画面を示している。
【0034】
この環境では特に、互いに向き合って互いを見ている参加者の間で視線を近づけることによって参加者間で交わされる視線を再現することができる。例えば、AがEを見ることができ、視角の主観的な接近によって他の人々はAがFを見ているのを見る。
【0035】
図3の略図は本発明の遠隔会議システムの概念図を示している。
【0036】
当然、音声/空間の分布及び全ての参加者の全体をシミュレートする画像壁を得ることができる限り、参加者の状態(着席または起立、テーブルのまわりか否か)、カメラの位置及びスピーカの位置に関しては他の別の方法も可能である。
【0037】
サイトAは高ビットレートネットワークを介して他のサイトB〜Kに接続されている。これらのサイトのための異なる接続方法は、後続する図10〜図13に詳細に示されている。例えば、ISDN(サービス総合デジタル網)は複数のSOアクセスポイントをグループ化することによって使用できる。情報ハイウェイ、インターネットまたはHDSLアクセス装置も使用できる。このようなネットワークは、ビットレート圧縮システムを利用して最初の品質を保持する限り、7kHzを超える通過帯域のアナログ音声信号と互換できないものではない。これによってデジタルコンパクトディスク(CD)の提供する音質に相当する高い音質が提供される。
【0038】
伝送網は非同期転送モード(ATM)ネットワークまたは他のデジタルまたはアナログ型の高ビットレートネットワークによって使用される。全ての画像は異なるサイトへ高スループットで伝送されることができ、暗号化中に圧縮比を増加する必要がない。
【0039】
例えば、暗号化された画像はNumerisネットワークの384Kビット/秒から使用するネットワークの型によって2Mビット/秒で伝送される。
【0040】
テレビ会議は、制御及び処理ユニット100A〜100Kによって制御されるか、または遠隔制御され、これら制御及び処理ユニットは、参加者間の確立した通信、音声イメージ及び視覚イメージに応じるようにネットワークRを介して会話する。換言すれば、制御及び処理ユニットは、伝送された信号の構成の記述(構成が予め規定されていない場合)、または全てのサイトに対して予め規定された複数の構成から選択された構成モードの記述を伝送する。これらは全てのスタジオ機器を所望の構成に従って管理することができる。可能な会議の構成の中で、二地点間リンクまたは3、4、5またはそれ以上のサイトの間のマルチポイントリンクは可能である。
【0041】
実際には、上記構成はサイトP1(A)の参加者と、この参加者の会話を取り込む音ピックアップ装置(S)M1(マイクまたは音響アンテナ)と、彼/彼女を撮影するカメラCA1との間のリンクの記述を含み、サイトB上の画像IP1(A)がスピーカH1に対応してマイクM1によって送り出された音声を再現する。
【0042】
この目的のために、サイトAはn個のマイク、p個のスピーカ及びq個のカメラを備える。但し、n及びpは2以上の自然数であり、qは自然数である。所定のサイトでは、スピーカの数は画面の(この画面の幅または表面に沿った)サイズに比例する。
【0043】
テーブルのまわりに着席した参加者に関して、大きな画面10は、所定のサイトの会議テーブルの前に配置され、(各サイトの)画面画像はこの画面に投影されて、遠隔の参加者は上記サイトの参加者と同じレベルにおり、仮想テーブルを形成している。
【0044】
参加者P1(A)が参加者P1(B)に話しかけるとき、サイトAのカメラCA1の画像は他のサイトB〜Kに向けられる。さらに、サイトBのカメラCA1の画像はサイトA、C〜Kに伝送される。他のサイトでどの参加者も話しをしていない場合は、全ての参加者の画像が伝送されるが、これらのサイトでのカメラの撮影は中立である。
【0045】
カメラ画像は上記サイトに存在する制御ユニット100A〜100Kによって制御されるか、またはモニタリングサイトから遠隔操作される。
【0046】
行われる音のピックアップと、画像をピックアップしなければならないカメラとの間のサーボ制御は、当業者に周知な制御プログラムを介して保証される。このプログラムは、制御及び処理ユニット100A〜100Kによって実行され、画面に投影されたときに、関係している参加者が実際に互いを見ているという印象を与える画像が得られる。
【0047】
実際に、この効果は2つのカメラのみを使用して再現することができる。
【0048】
ネットワークによって伝送された画像は各サイトで受け取られ、映像ユニット300によって処理されて、画面上に並列及び/または重なって投影される。しかし、受けられた全ての画像は各サイトの画面10上に投影され、上記画面は画像壁を形成する。
【0049】
二地点間方式に特有の場合では、各画面に投影された画像は単一の部屋に対応する。この構成によって画像の品質を高めることができる。この目的のために、カメラによって得られた各画像の両方の画像を伝送することを提案する。各カメラは施設の一部の画像をピックアップする。実際には、一方のカメラが情景の半分を撮影し、他方のカメラが残りの半分を撮影する。
【0050】
画像の並置は、制御及び処理ユニット100A及び100Bによって制御され、これらの制御及び処理ユニットは、映像ユニット300を制御し、2つのカメラによって送信された信号を基に単一の画像を画面上に投影する。画像結合は本質的に従来の型の画像処理である。
【0051】
図4はシステムの一部である処理及び制御ユニットをより詳細に示している。またその一方で、これは1つのスタジオにつき2つのカメラが存在する別の実施例である。
【0052】
映像ユニット300に関して:
第1のカメラCA1は映像エンコーダ303に接続され、映像デコーディングユニット304は第1のプロジェクタPR1に接続される。デコーディングユニットは1つまたは複数のデコーダを備え、各デコーダは、サイトで生成された映像信号をデコードする。一組のデコーダにも適用できるので、以下、デコーダ304を挙げて説明する。
エンコーダ303及びデコーダ304は、ネットワークR上の映像信号を適応型処理して伝送する適応型インターフェース301に接続される。例えば、上記適応型インターフェース301はATMネットワーク上の伝送ではインターフェースAAL1(適応型レイヤ)である。
【0053】
この上記適応型インターフェース301は物理的サポートインターフェース400に接続される。
【0054】
例えば、制御及び処理ユニット100Aは、ローカルネットワークRLを介して、制御信号CD1、DC1、IV1をそれぞれエンコーダ、デコーダ及び適応型インターフェース301にテレビ会議の構成に従って送信する。
【0055】
同様に、第2のカメラCA2はエンコーダ305に接続され、このエンコーダ305はネットワーク上の、映像信号を適応型処理して伝送する適応型インターフェース302に接続される。デコーダ306は第2のプロジェクタPR2及び適応型インターフェース302に接続される。適応型インターフェース302は物理的サポートインターフェース400に接続される。
【0056】
制御及び処理ユニット100Aは制御信号CD2、DC2及びIV2をそれぞれエンコーダ、デコーダ及び適応型インターフェースに上記構成に従って送信する。
【0057】
映像エンコーダは本発明の範囲から逸脱しない方法に従って複数のデコーダに機能的に接続されることができる。
【0058】
あるサイトでは第3のカメラをエンコーダのうちの1つ303または305に接続して優先すべき特定の参加者の画像を伝送してもよい。このカメラの画像はカメラに接続されたエンコーダによって暗号化され、全ての他のサイトに伝送される。この場合、他の全てのサイトは、このようなサイトのデコーダユニット304または306内に追加のデコーダを備え、このカメラによって送信された映像信号を処理して、このような画像に関連したショットを上記サイトの画面10上に投影しなければならない。
【0059】
プロジェクタは、ビデオプロジェクタまたは液晶オーバーヘッドプロジェクタである。映像はプラズマ画面を用いた直視型にしてもよい。
【0060】
音声ユニット200に関して:
n個のマイクは信号をデジタル化する信号捕捉及びデジタル化ユニット201に接続される。この信号捕捉及びデジタル化ユニット201の出力は、エコーを制御するために減衰ユニット207の入力に印加される。減衰ユニットの出力は、ユニット100Aによって制御されて音声信号をビットレート圧縮するエンコーディング及びマトリクス化ユニット202の入力に印加される。エンコーディング及びマトリクス化ユニット202はさらに、複数のマイク信号のマトリクス化を実行し、音声伝送用のネットワーク上で利用可能なチャネルの数に合わせる。この目的のために、上記エンコーディング及びマトリクス化ユニット202は、構成制御信号CAを受ける。エンコーディング及びマトリクス化ユニット202はネットワークR上の適応型インターフェース204(ATMネットワークではインターフェースAAL5)に接続される。この適応型インターフェースは、物理的サポートインターフェース400に接続される。
【0061】
適応型インターフェース204は、ネットワーク上で暗号化された音声信号を生成することができ、他のサイトで生成された暗号化された音声信号を受けることができる。受けた信号は、適応型インターフェース204によって処理され、デコーディング及び音声信号デマトリクス化するデコーディング及びデマトリクス化ユニット203に印加される。
【0062】
デコーディング及びデマトリクス化ユニット203によって送信された信号は、音声信号再生及びデジタル/アナログ変換ユニット205を介して、所望のスピーカに印加される。この信号再生及びデジタル/アナログ変換ユニット205は、受けた必要な信号を適切なスピーカに送信するように構成されている。
【0063】
上記構成が、制御及び処理ユニット100Aのメモリ110にプログラムされて記憶される場合、制御及び処理ユニット100Aは、デコーダの出力S1がマイクM1によってまたはサイトBのM1を含む一連のマイクによって取り込まれた信号を送信することを示す情報及びこの出力が従ってスピーカHnまたはスピーカH1を含む一連のスピーカに送信され、話をした参加者のクローズアップした光景を生成しなければならないことを示す情報をメモリテーブルに内蔵する。
【0064】
捕捉システム(マイク及び信号再生及びデジタル/アナログ変換ユニット205)は音声信号通過帯域を考慮に入れて、7kHz(品質の点からシステムの下限)の周波数帯で動作するよう選択される。暗号化システムもこの最初の品質を考慮に入れて選択され、ビットレート圧縮アルゴリズムは標準的なMPEG1またはMPEG2で記述されるように選択される。捕捉システムはさらに良好な信号対雑音比を提供するように選択される。
【0065】
二地点間構成における2つの部屋の場合、可能な構成は6個の音声チャネル、すなわち各マイクにつき1個の音声チャネルを備える。3つの部屋の場合、各サイトに2×3の音声チャネルが存在する。サイトAでは、3個のチャネルがAとBとの間に音声リンクを提供し、他の3個のチャネルがAとCとの間に音声リンクを提供する(BとCとの間も同様)。
【0066】
画像及び音声は最低のタイムシフト(約100ミリ秒)で伝送され、ビデオ画像の品質及びサイズと組合されることで、聴覚障害のある人が離れた通信相手の唇を読むことができる。
【0067】
さらに、音声機器はエコー制御回路206を備え、この回路206は可変減衰ユニット207を介してマイク信号に、本質的に標準的な方法に従って利得可変器として動作する。上記回路は、信号捕捉及びデジタル化ユニット201の出力と信号再生及びデジタル/アナログ変換ユニット205の入力との間に接続される。
【0068】
図5の概略図は上記の可能な構成を示している。これは3つのサイトA、B及びCの間の映像構成である。
【0069】
上記の図はこのような構成が伝送網を無視して各サイトの間に提供する直接リンクを強調することによって単純化したものである。
【0070】
この構成を3つのサイト:A、B及びCから説明する。
サイトA及びBはそれぞれ、同じサイトで異なる角度で撮影する2個のカメラCA1及びCA2を備える。
この構成によれば、二地点間リンクにはエンコーダ及びデコーダが設けられている。
【0071】
カメラCA1はサイトAのエンコーダ303に接続される。このエンコーダはデコーダ304に接続され、このデコーダはプロジェクタに接続され、このフロジェクタは画面画像E1(A)(サイトAのカメラCA1から生成された画像)を提供する。
【0072】
サイトBのエンコーダ303はサイトBのカメラCA1に接続される。デコーダによって供給される信号はサイトAのデコーダ304によって解読され、画面画像E1(B)(サイトBのカメラCA1から生成された画像)を供給する。
【0073】
Cスタジオには、CA1で表された単一のカメラが設けられている。このカメラは2つのエンコーダ304(A2)及び304(B2)に接続される。エンコーダ304(A2)
は画面画像E1(C)と組み合わされたサイトAのデコーダ306に接続され、エンコーダ304(B2)は画面画像E1(C)と組み合わされたサイトBのデコーダ306に接続される。
【0074】
逆に、サイトCのデコーダ306はサイトAのカメラCA2の信号のエンコーダ305に接続され、他方はサイトBのカメラCA2の信号のエンコーダ305に接続され、それぞれサイトAの画面画像、すなわちE2(A)及びサイトBの画面画像、すなわちE2(B)をサイトC上に表示する。
【0075】
音声処理ユニットはさらにこの構成に従って二倍にされ、各サイトの音声ユニット202、203、205を接続する。
【0076】
図6はサイトAとサイトBとの間の二地点間リンクを示している。この場合、各カメラCA1、CA2は上記サイトの一部の光景を捕捉する。
6個の音声信号(6個のマイク)の伝送の場合には、2個のエンコーダ−デコーダが各サイトにつき3個のチャネルに使用される。
【0077】
図7〜図9はサイトA、B及びCに投影された画面画像をそれぞれ示している。サイトA(図7)では、画面画像E(4、3、2、1)は個々の端末から生成された光景を提供し、画面画像E(C、B)はサイトC及びBの重ねられた光景を提供する。
図8はサイトBでの表示構成を示し、図9はサイトCでの表示構成を示している。
【0078】
図10〜図13は上記サイト間の可能なリンクの例を示している。
図10はATMネットワークまたは専用回線を介して接続される4つのスタジオを示している。
図11は集中MCUユニット(テレビ会議ゲートウェイ)を介して提供された接続を示している。
【0079】
図12はネットワークラインとMCU装置とを混合したもの、すなわちスタジオ1、2及び3の音声信号を抑制するための装置を含む市販のテレビ会議ゲートウェイを示している。上記信号を抑制するのは、このようなハードウェアを介する直接リンク及び接続を備えるサイトは直接ネットワークリンク及びMCU接続から生成された信号の重なり(及びタイムシフト)によって悪影響を受けるからである。
図13は異なる型のネットワーク、例えばNumeris、ATM及び専用回線を介する接続を示している。
【図面の簡単な説明】
【0080】
【図1】本発明が解決するテレビ会議の問題を概念的に示す図である。
【図2】本発明が解決するテレビ会議の問題を概念的に示す図である。
【図3】本発明を示す概略図である。
【図4】スタジオの機器の実施例を示す図である。
【図5】3つのスタジオの間の会議リンクの場合の独特な実施例を示す図である。
【図6】2つのスタジオの間のリンクの場合の独特な実施例を示す図である。
【図7】大きい画面上に画像壁を形成する、異なる「画面画像」の例を示す図である。
【図8】大きい画面上に画像壁を形成する、異なる「画面画像」の例を示す図である。
【図9】大きい画面上に画像壁を形成する、異なる「画面画像」の例を示す図である。
【図10】異なるネットワーク構成における本発明のスタジオ機器または映像音声端末間の異なる接続方式を示す図である。
【図11】異なるネットワーク構成における本発明のスタジオ機器または映像音声端末間の異なる接続方式を示す図である。
【図12】異なるネットワーク構成における本発明のスタジオ機器または映像音声端末間の異なる接続方式を示す図である。
【図13】異なるネットワーク構成における本発明のスタジオ機器または映像音声端末間の異なる接続方式を示す図である。
【特許請求の範囲】
【請求項1】
N>2であるN個のサイトにいる参加者の間のテレビ会議システムであって、各サイトが、映像画面、カメラ及び画面再生装置並びに音ピックアップ及び音再生装置を備えており、
−前記映像画面が、1つまたは複数の表示システムによって形成される、ビデオプロジェクタ、オーバーヘッドプロジェクタまたは直視型の大画面であり、前記画面によって形成された画像壁上に再現された空間内に、離れた所にいる全ての参加者を同時に表示する画像壁を形成しており、
−前記音ピックアップ及び音再生装置が、各サイトごとに、離れている各参加者が発した音声と、当該サイトの前記映像画面に投影された参加者の画像とが対応しているように、音声を空間的に分布させる装置を備えており、
−所定のサイトが、他のサイトから送信された映像信号及び音声信号を受け、確立された前記対応に従ってそれらを再生し、他のサイト及び発言者が同時に表示及び聴取され、他の参加者のじゃまをせずに両者間で同時に発言を交わすことができるように、
−前記音ピックアップ及び音再生装置が、
・信号捕捉及びデジタル化ユニットと、
・信号再生及びデジタル/アナログ変換ユニットと、
・前記サイトの参加者の前に配置されたn個(但しnは2以上の自然数)のマイクと、
・画面の長さに沿って分配され且つ画面のサイズに比例するp個(但しpは2以上の自然数)のスピーカと、
・ビットレート圧縮装置を備える適応型ネットワークインターフェイスと、
・エコー制御装置と
を備えており、
−前記マイクと前記マイクで得られた信号と当該信号を再生するためのスピーカとを対応させる制御及び処理ユニットが、所望の対応関係を確立する1つまたは複数の構成を記憶する記憶装置を備えることを特徴とするテレビ会議システム。
【請求項2】
画像壁を形成する前記大画面の寸法が、参加者が1に近い縮尺比で表示される状態で全てのサイトの画像を表示できるように選択されることを特徴とする請求項1に記載のテレビ会議システム。
【請求項3】
前記カメラは、第1のカメラ及び第2のカメラを具備しており、伝送された映像信号が前記第1のカメラ及び前記第2のカメラのどちらで生成されたかにより、ピックアップされた音声が、前記第1のカメラ及び前記第2のカメラの一方または他方と組合されることを特徴とする請求項1に記載のテレビ会議システム。
【請求項4】
前記音ピックアップ装置が、複数のマイクと、音声信号捕捉及びデジタル化ユニットと、前記音声信号のためのエンコーディング及びマトリクス化ユニットを備えることを特徴とする請求項1に記載のテレビ会議システム。
【請求項5】
前記音再生装置が、音声信号用のデコーディング及びデマトリクス化ユニットと、音声信号を再生するための音声信号再生及びデジタル/アナログ変換ユニットと、複数のスピーカとを備えることを特徴とする請求項1に記載のテレビ会議システム。
【請求項6】
前記カメラは、各サイトごとに、前記サイトの参加者の前に配置されたq個(但しqは自然数)のカメラを備え、各カメラが画面の別の部分に表示された異なる遠隔の参加者のグループを撮影することを特徴とする請求項1〜5のいずれか一項に記載のテレビ会議システム。
【請求項7】
1サイト当たりのカメラの数qが2以上であり、画像の遠近効果を再現することを特徴とする、テレビ会議がN個のサイトの間で行われる請求項1〜6のいずれか一項に記載のテレビ会議システム。
【請求項8】
一方のカメラが第1のグループの参加者を含む局所的なサイトの一部の画像を撮影し、他方のカメラが第2のグループの参加者を含む局所的なサイトの一部の光景を撮影し、2つの画像を重ねて全ての参加者の表示を可能にすることを特徴とする、テレビ会議が2つの別のサイトの間でのみ行われる請求項1〜6のいずれか一項に記載のテレビ会議システム。
【請求項9】
前記カメラが、投影された画像の下側に配置されることを特徴とする、複数のカメラが撮影に用いられる請求項1〜8のいずれか一項に記載のテレビ会議システム。
【請求項10】
1に近い縮尺比で画像を再生する複数の陰極線または液晶ビデオ機器あるいはオーバーヘッドプロジェクタをさらに備えることを特徴とする請求項1〜9のいずれか一項に記載のテレビ会議システム。
【請求項11】
全ての画像を前記大画面に表示できるように、遠隔のサイトから受けた画像を並列するかまたは重ねることができる画像処理装置を各サイトごとに備えることを特徴とする請求項1〜10のいずれか一項に記載のテレビ会議システム。
【請求項12】
前記サイトが、異なっていてもよい高ビットレート伝送網を介して直接接続されるか、またはテレビ会議ゲートウェイを介してまたはネットワーク及びテレビ会議ゲートウェイを介して間接的に接続されることを特徴とする請求項1〜11のいずれか一項に記載のテレビ会議システム。
【請求項13】
処理手段が
−PC型の制御及び処理ユニットと、
−前記制御及び処理ユニットによって制御される映像用のエンコーダ−デコーダ及び音声用のエンコーダ−デコーダと、
−前記ネットワーク用の適応型インターフェースと
を備えることを特徴とする請求項1〜12のいずれか一項に記載のテレビ会議システム。
【請求項14】
前記ネットワークがATM(非同期転送モード)型伝送網であり、視聴覚信号用の伝送インターフェースがAAL1型インターフェースであり、処理ユニット間のテレビ会議の制御信号用の伝送インターフェースがAAL5型インターフェースであることを特徴とする請求項13に記載のテレビ会議システム。
【請求項1】
N>2であるN個のサイトにいる参加者の間のテレビ会議システムであって、各サイトが、映像画面、カメラ及び画面再生装置並びに音ピックアップ及び音再生装置を備えており、
−前記映像画面が、1つまたは複数の表示システムによって形成される、ビデオプロジェクタ、オーバーヘッドプロジェクタまたは直視型の大画面であり、前記画面によって形成された画像壁上に再現された空間内に、離れた所にいる全ての参加者を同時に表示する画像壁を形成しており、
−前記音ピックアップ及び音再生装置が、各サイトごとに、離れている各参加者が発した音声と、当該サイトの前記映像画面に投影された参加者の画像とが対応しているように、音声を空間的に分布させる装置を備えており、
−所定のサイトが、他のサイトから送信された映像信号及び音声信号を受け、確立された前記対応に従ってそれらを再生し、他のサイト及び発言者が同時に表示及び聴取され、他の参加者のじゃまをせずに両者間で同時に発言を交わすことができるように、
−前記音ピックアップ及び音再生装置が、
・信号捕捉及びデジタル化ユニットと、
・信号再生及びデジタル/アナログ変換ユニットと、
・前記サイトの参加者の前に配置されたn個(但しnは2以上の自然数)のマイクと、
・画面の長さに沿って分配され且つ画面のサイズに比例するp個(但しpは2以上の自然数)のスピーカと、
・ビットレート圧縮装置を備える適応型ネットワークインターフェイスと、
・エコー制御装置と
を備えており、
−前記マイクと前記マイクで得られた信号と当該信号を再生するためのスピーカとを対応させる制御及び処理ユニットが、所望の対応関係を確立する1つまたは複数の構成を記憶する記憶装置を備えることを特徴とするテレビ会議システム。
【請求項2】
画像壁を形成する前記大画面の寸法が、参加者が1に近い縮尺比で表示される状態で全てのサイトの画像を表示できるように選択されることを特徴とする請求項1に記載のテレビ会議システム。
【請求項3】
前記カメラは、第1のカメラ及び第2のカメラを具備しており、伝送された映像信号が前記第1のカメラ及び前記第2のカメラのどちらで生成されたかにより、ピックアップされた音声が、前記第1のカメラ及び前記第2のカメラの一方または他方と組合されることを特徴とする請求項1に記載のテレビ会議システム。
【請求項4】
前記音ピックアップ装置が、複数のマイクと、音声信号捕捉及びデジタル化ユニットと、前記音声信号のためのエンコーディング及びマトリクス化ユニットを備えることを特徴とする請求項1に記載のテレビ会議システム。
【請求項5】
前記音再生装置が、音声信号用のデコーディング及びデマトリクス化ユニットと、音声信号を再生するための音声信号再生及びデジタル/アナログ変換ユニットと、複数のスピーカとを備えることを特徴とする請求項1に記載のテレビ会議システム。
【請求項6】
前記カメラは、各サイトごとに、前記サイトの参加者の前に配置されたq個(但しqは自然数)のカメラを備え、各カメラが画面の別の部分に表示された異なる遠隔の参加者のグループを撮影することを特徴とする請求項1〜5のいずれか一項に記載のテレビ会議システム。
【請求項7】
1サイト当たりのカメラの数qが2以上であり、画像の遠近効果を再現することを特徴とする、テレビ会議がN個のサイトの間で行われる請求項1〜6のいずれか一項に記載のテレビ会議システム。
【請求項8】
一方のカメラが第1のグループの参加者を含む局所的なサイトの一部の画像を撮影し、他方のカメラが第2のグループの参加者を含む局所的なサイトの一部の光景を撮影し、2つの画像を重ねて全ての参加者の表示を可能にすることを特徴とする、テレビ会議が2つの別のサイトの間でのみ行われる請求項1〜6のいずれか一項に記載のテレビ会議システム。
【請求項9】
前記カメラが、投影された画像の下側に配置されることを特徴とする、複数のカメラが撮影に用いられる請求項1〜8のいずれか一項に記載のテレビ会議システム。
【請求項10】
1に近い縮尺比で画像を再生する複数の陰極線または液晶ビデオ機器あるいはオーバーヘッドプロジェクタをさらに備えることを特徴とする請求項1〜9のいずれか一項に記載のテレビ会議システム。
【請求項11】
全ての画像を前記大画面に表示できるように、遠隔のサイトから受けた画像を並列するかまたは重ねることができる画像処理装置を各サイトごとに備えることを特徴とする請求項1〜10のいずれか一項に記載のテレビ会議システム。
【請求項12】
前記サイトが、異なっていてもよい高ビットレート伝送網を介して直接接続されるか、またはテレビ会議ゲートウェイを介してまたはネットワーク及びテレビ会議ゲートウェイを介して間接的に接続されることを特徴とする請求項1〜11のいずれか一項に記載のテレビ会議システム。
【請求項13】
処理手段が
−PC型の制御及び処理ユニットと、
−前記制御及び処理ユニットによって制御される映像用のエンコーダ−デコーダ及び音声用のエンコーダ−デコーダと、
−前記ネットワーク用の適応型インターフェースと
を備えることを特徴とする請求項1〜12のいずれか一項に記載のテレビ会議システム。
【請求項14】
前記ネットワークがATM(非同期転送モード)型伝送網であり、視聴覚信号用の伝送インターフェースがAAL1型インターフェースであり、処理ユニット間のテレビ会議の制御信号用の伝送インターフェースがAAL5型インターフェースであることを特徴とする請求項13に記載のテレビ会議システム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【公開番号】特開2009−81861(P2009−81861A)
【公開日】平成21年4月16日(2009.4.16)
【国際特許分類】
【出願番号】特願2008−262268(P2008−262268)
【出願日】平成20年10月8日(2008.10.8)
【分割の表示】特願平10−541238の分割
【原出願日】平成10年3月26日(1998.3.26)
【出願人】(591034154)フランス テレコム (290)
【Fターム(参考)】
【公開日】平成21年4月16日(2009.4.16)
【国際特許分類】
【出願日】平成20年10月8日(2008.10.8)
【分割の表示】特願平10−541238の分割
【原出願日】平成10年3月26日(1998.3.26)
【出願人】(591034154)フランス テレコム (290)
【Fターム(参考)】
[ Back to top ]