説明

会議システム、画像表示装置、及び画像音声処理方法

【課題】利便性の向上が図れる会議システムを提供する。
【解決手段】会議システム1は、各端末装置2が扱う各画像を合成した合成画像を画像表示装置3に表示させる。端末装置2は、合成画像における、当該端末装置2が扱う画像と他の端末装置2が扱う画像との表示状態の入力を受け付ける入力受付手段と、マイクロフォンにて集音された音声に関する音声情報、表示状態に関する表示情報、及び当該端末装置2が扱う画像に関する画像情報を画像表示装置3に送信する送信制御手段とを備える。画像表示装置3は、音声情報、表示情報、及び画像情報を受信する受信手段と、表示情報に基づいて、合成画像を生成し、当該合成画像を表示手段に表示させる第1制御手段と、表示情報に基づいて、各マイクロフォンにて集音された各音声の合成音声を生成し、当該合成音声をスピーカーに出力させる第2制御手段とを備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、会議システム、画像表示装置、及び画像音声処理方法に関する。
【背景技術】
【0002】
従来、会議を行う際に利用される会議システムとして、会議の各参加者の利用に供される各端末の各表示画面をスクリーン上に同時に表示(分割表示)する構成が知られている(例えば、特許文献1参照)。
特許文献1に記載の会議システムは、会議の各参加者の利用に供される複数のコンピューター(端末)と、会議の司会者の利用に供される司会者コンピューター(サーバー)と、プロジェクターとがネットワークにより接続された構成を有する。
サーバーは、ネットワークを介して各端末が扱う各画像データ(各端末の各表示画面に関する画像データ)を受信した後、当該各画像データに基づく各画像を合成した合成画像(分割表示画面)を生成し、当該合成画像に関する合成画像データをプロジェクターに送信する。
そして、プロジェクターは、ネットワークを介して合成画像データを受信し、当該合成画像データに基づく合成画像をスクリーン上に表示する。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2010−193521号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
ところで、会議の場では、スクリーン上の合成画像を参照しながら、主に説明を行う参加者(合成画像に含まれる自身が作成した資料(自身が利用する端末装置が扱う画像)に基づいて説明を行う参加者(以下、主発言者))が存在するものである。
しかしながら、特許文献1に記載の会議システムでは、各参加者の資料(各端末装置が扱う各画像)がスクリーン上に分割表示されるため、他の参加者は、主発言者がスクリーン上に表示された各画像のうち、どの画像に基づいて説明を行っているか判断し難い。
また、主発言者が説明を行っている際に、他の参加者の一部が会話等をしていた場合には、主発言者の声が聞き取り難いものとなる。
以上のことから、特許文献1に記載の会議システムでは、利便性の向上が図り難い、という問題がある。
【0005】
本発明の目的は、利便性の向上が図れる会議システム、画像表示装置、及び画像音声処理方法を提供することにある。
【課題を解決するための手段】
【0006】
本発明の会議システムは、複数の端末装置と、前記複数の端末装置と通信可能に接続された画像表示装置とを備え、前記複数の端末装置が扱う各画像を合成した合成画像を前記画像表示装置に表示させる会議システムであって、前記端末装置は、周囲の音を集音する音声収集手段と、前記合成画像における、当該端末装置が扱う画像と、他の前記端末装置が扱う画像との表示状態の入力を受け付ける入力受付手段と、前記音声収集手段にて集音された音声に関する音声情報、前記表示状態に関する表示情報、及び当該端末装置が扱う画像に関する画像情報を前記画像表示装置に送信する送信制御手段とを備え、前記画像表示装置は、画像を表示する表示手段と、前記音声情報、前記表示情報、及び前記画像情報を受信する受信手段と、前記表示情報に基づいて、前記複数の端末装置からの各前記画像情報に基づく各画像を合成して前記合成画像を生成し、生成した前記合成画像を前記表示手段に表示させる第1制御手段と、音声を出力する音声出力手段と、前記表示情報に基づいて、前記複数の端末装置からの各前記音声情報に基づく各音声を合成して合成音声を生成し、生成した前記合成音声を前記音声出力手段に出力させる第2制御手段とを備えることを特徴とする。
【0007】
本発明では、会議システムは、上述したように構成された複数の端末装置及び画像表示装置を備える。このため、以下に示すように、各端末装置が扱う各画像を画像表示装置に表示させるとともに、各端末装置のマイクロフォン等の各音声収集手段にて集音された各音声を画像表示装置に出力させることができる。
例えば、参加者の一人が自身の利用する端末装置の入力手段により、自身が利用する端末装置が扱う画像と、他の端末装置が扱う画像との表示状態を入力すると、当該端末装置の入力受付手段が当該表示状態の入力を受け付ける(入力受付ステップ)。
ここで、表示状態とは、例えば、合成画像(分割表示画面)において、各端末装置が扱う各画像の表示位置や、表示サイズ等を意味するものである。
そして、複数の端末装置の各送信制御手段は、端末装置毎に設けられたマイクロフォン等の各音声収集手段から出力された音声情報、及び自身の端末装置が扱う画像に関する画像情報の他、表示状態に関する表示情報(表示状態を受け付けた端末装置のみが送信)を画像表示装置に送信する(送信ステップ)。
【0008】
一方、画像表示装置において、受信手段は、各端末装置から送信された音声情報、表示情報、及び画像情報を受信する(受信ステップ)。
また、第1制御手段は、表示情報(各画像の表示位置や表示サイズ等)に基づいて、各端末装置からの各画像情報に基づく各画像を合成し、合成画像を表示手段に表示させる(第1制御ステップ)。
さらに、第2制御手段は、表示情報に基づいて、各端末装置からの各音声情報に基づく各音声を合成し、合成音声をスピーカー等の音声出力手段に出力させる(第2制御ステップ)。
例えば、第1,第2制御手段は、表示情報が「複数の端末装置が扱う各画像のうち第1,第2端末装置が扱う2つの画像を左右に分割表示し、主発言者の利用に供される第1端末装置が扱う画像の表示位置及び表示サイズを「左側」及び「大」とし、他の参加者の利用に供される第2端末装置が扱う画像の表示位置及び表示サイズを「右側」及び「小」とする」旨の情報であった場合には、以下に示すように、合成画像及び合成音声を生成する。
【0009】
すなわち、第1制御手段は、上記表示情報に基づいて、第1端末装置から送信された画像情報に基づく画像(主発言者の資料等)を左側に大きく、第2端末装置から送信された画像(他の参加者の資料等)を右側に小さくした合成画像を生成する。
また、第2制御手段は、表示情報に基づいて、第1端末装置から送信された音声情報に基づく音声(主発言者の声)の出力レベルを増加させ、第2端末装置から送信された音声情報に基づく音声(他の参加者の声)の出力レベルを低下させ、当該調整された各音声を合成して合成音声を生成する。
【0010】
以上のことから、端末装置を利用して表示状態を適宜、入力することで、主発言者の資料(主発言者の利用に供される端末装置が扱う画像)を合成画像(分割表示画面)中の任意の表示位置や、任意の表示サイズ等に設定できる。このため、他の参加者に主発言者がどの画像に基づいて説明を行っているかを容易に判断させることができる。
また、各参加者の声を各マイクロフォン等にて集音し、上述したように主発言者の声を他の参加者の声に対して強調した合成音声を生成及び出力できるので、主発言者が説明を行っている際に、他の参加者の一部が会話等をしていた場合であっても、主発言者の声(スピーカー等を介した音声)を聞き取りやすいものとすることができる。
したがって、利便性の向上が図れる。
また、合成画像及び合成音声の生成を画像表示装置自身が実行するため、従来のようなサーバーを必要とせず、会議システムの構成を簡素化できる。
【0011】
本発明の会議システムは、複数の端末装置と、画像表示装置と、前記複数の端末装置及び前記画像表示装置と通信可能に接続された情報処理装置とを備え、前記複数の端末装置が扱う各画像を合成した合成画像を前記画像表示装置に表示させる会議システムであって、前記端末装置は、周囲の音を集音する音声収集手段と、前記合成画像における、当該前記端末装置が扱う画像と、他の前記端末装置が扱う画像との表示状態の入力を受け付ける入力受付手段と、前記音声収集手段にて集音された音声に関する音声情報、前記表示状態に関する表示情報、及び当該端末装置が扱う画像に関する画像情報を前記情報処理装置に送信する送信制御手段とを備え、前記情報処理装置は、前記表示情報に基づいて、前記複数の端末装置からの各前記画像情報に基づく各画像を合成して前記合成画像を生成する第1制御手段と、前記表示情報に基づいて、前記複数の端末装置からの各前記音声情報に基づく各音声を合成して合成音声を生成する第2制御手段と、前記通信路を介して、前記合成画像に関する合成画像情報、及び前記合成音声に関する合成音声情報を前記画像表示装置に送信する第3制御手段とを備え、前記画像表示装置は、前記情報処理装置からの前記合成画像情報に基づく前記合成画像を表示する表示手段と、前記情報処理装置からの前記合成音声情報に基づく前記合成音声を出力する音声出力手段とを備えることを特徴とする。
【0012】
本発明では、会議システムは、上述したように構成された複数の端末装置、画像表示装置、及び情報処理装置を備える。
言い換えれば、本発明の会議システムは、情報処理装置を備えない上述した会議システムにおいて、画像表示装置の機能の一部(合成画像及び合成音声を生成する機能)を省略し、情報処理装置に当該機能の一部を設けている。
したがって、情報処理装置を備えない上述した会議システムと同様の効果を享受できる。
また、合成画像及び合成音声の生成を画像表示装置ではなく、情報処理装置で実行するため、画像表示装置に合成画像及び合成音声を生成する機能を別途、設ける必要がなく、汎用の画像表示装置を利用した会議システムを構築できる。
【0013】
本発明の会議システムでは、前記表示状態は、前記複数の端末装置が扱う各画像の表示サイズを含むものであり、前記第2制御手段は、前記各画像の表示サイズに基づいて、前記各画像に対応した前記各音声の出力レベルを調整し、前記合成音声を生成することが好ましい。
本発明では、表示状態が上述した表示サイズを含むものであるので、当該表示サイズに基づいて第1,第2制御手段が合成画像及び合成音声を生成すれば、主発言者の資料(主発言者の利用に供される端末装置が扱う画像)や声を他の参加者の資料や声に対して強調できる。
したがって、主発言者の資料や声を視聴し易いものとなり、利便性の向上が図れる。
【0014】
本発明の画像表示装置は、複数の端末装置と通信可能に接続され、前記複数の端末装置が扱う各画像が合成された合成画像を表示する画像表示装置であって、当該画像表示装置は、画像を表示する表示手段と、前記複数の端末装置のそれぞれにおいて集音された音声に関する音声情報、前記合成画像における、前記複数の端末装置のそれぞれが扱う画像の表示状態に関する表示情報、及び前記複数の端末装置のそれぞれが扱う画像情報を受信する受信手段と、前記表示情報に基づいて、前記複数の端末装置からの各前記画像情報に基づく各画像を合成して前記合成画像を生成し、生成した前記合成画像を前記表示手段に表示させる第1制御手段と、音声を出力する音声出力手段と、前記表示情報に基づいて、前記複数の端末装置からの各前記音声情報に基づく各音声を合成して合成音声を生成し、生成した前記合成音声を前記音声出力手段に出力させる第2制御手段とを備えることを特徴とする。
本発明の画像表示装置は、上述した会議システムに利用されるものであるので、上述した会議システムと同様の作用及び効果を享受できる。
【0015】
本発明の画像音声処理方法は、複数の端末装置と、前記複数の端末装置と通信可能に接続された画像表示装置とを備え、前記複数の端末装置が扱う各画像を合成した合成画像を前記画像表示装置に表示させる会議システムを利用した画像音声処理方法であって、前記端末装置が、前記合成画像における、当該端末装置が扱う画像と、他の前記端末装置が扱う画像との表示状態の入力を受け付ける入力受付ステップと、前記端末装置が、音声収集手段にて集音された音声に関する音声情報、前記表示状態に関する表示情報、及び当該端末装置が扱う画像に関する画像情報を前記画像表示装置に送信する送信制御ステップと、前記画像表示装置が、前記音声情報、前記表示情報、及び前記画像情報を受信する受信ステップと、前記画像表示装置が、前記表示情報に基づいて、前記複数の端末装置からの各前記画像情報に基づく各画像を合成して前記合成画像を生成し、生成した前記合成画像を表示する第1制御ステップと、前記画像表示装置が、前記表示情報に基づいて、前記複数の端末装置からの各前記音声情報に基づく各音声を合成して合成音声を生成し、生成した前記合成音声を出力する第2制御ステップと、を含むことを特徴とする。
本発明の画像音声処理方法は、上述した会議システムを利用した方法であるので、上述した会議システムと同様の作用及び効果を享受できる。
【0016】
本発明の画像音声処理方法は、複数の端末装置と通信可能に接続され、前記複数の端末装置が扱う各画像が合成された合成画像を表示する画像表示装置の画像音声処理方法であって、前記複数の端末装置のそれぞれにおいて集音された音声に関する音声情報、前記合成画像における、前記複数の端末装置のそれぞれが扱う画像の表示状態に関する表示情報、及び前記複数の端末装置のそれぞれが扱う画像情報を受信する受信ステップと、前記表示情報に基づいて、前記複数の端末装置からの各前記画像情報に基づく各画像を合成して前記合成画像を生成し、生成した前記合成画像を表示する第1制御ステップと、前記表示情報に基づいて、前記複数の端末装置からの各前記音声情報に基づく各音声を合成して合成音声を生成し、生成した前記合成音声を出力する第2制御ステップと、を含むことを特徴とする。
本発明の画像音声処理方法は、上述した画像表示装置にて実施される方法であるので、上述した画像表示装置と同様の作用及び効果を享受できる。
【図面の簡単な説明】
【0017】
【図1】第1実施形態における会議システムを示すブロック図。
【図2】第1実施形態における端末装置の構成を示すブロック図。
【図3】第1実施形態におけるプロジェクターの構成を示すブロック図。
【図4】第1実施形態における音声処理手段の構成を示すブロック図。
【図5】第1実施形態における画像音声処理方法を説明するフローチャート。
【図6】第1実施形態における設定ウィンドウの一例を示す図。
【図7】第2実施形態における会議システムを示すブロック図。
【図8】第2実施形態におけるプロジェクターの構成を示すブロック図。
【図9】第2実施形態におけるサーバー装置の構成を示すブロック図。
【図10】第2実施形態における画像音声処理方法を説明するフローチャート。
【発明を実施するための形態】
【0018】
[第1実施形態]
以下、本発明の第1実施形態を図面に基づいて説明する。
〔会議システムの構成〕
図1は、会議システム1を示すブロック図である。
会議システム1は、会議を行う際に利用されるシステムであり、会議の各参加者の利用に供される各端末の各表示画面をスクリーン上に同時に表示(分割表示)する。
この会議システム1は、複数の端末装置2と画像表示装置としてのプロジェクター3とが所定の通信路を介して接続された構成を有する。
【0019】
なお、本実施形態では、説明の便宜上、図1に示すように、端末装置2を4つ(第1〜第4端末装置2A〜2D)としているが、その数は、4つに限らず、その他の数としても構わない。
また、本実施形態では、図1に示すように、前記通信路として、ローカルエリアネットワークLAN(以下、ネットワークLAN)を採用しているが、これに限らず、使用環境や求められる通信速度等に応じて、その他の通信路を採用しても構わない。また、会議システム1において採用される通信方法は、有線通信であってもよく、無線通信であってもよい。
【0020】
〔端末装置の構成〕
図2は、端末装置2の構成を示すブロック図である。
端末装置2は、会議の各参加者(本実施形態では4名)の利用に供されるパーソナルコンピューターで構成されている。
なお、本実施形態における各端末装置2A〜2Dは、同一の構成を有する。
この端末装置2は、図2に示すように、ハードディスク等のメモリー22、及び当該メモリー22に記憶されたプログラムを実行するCPU(Central Processing Unit)21の他、ネットワークインターフェース(ネットワークI/F)23と、入力手段24と、画像処理手段25と、VRAM(Video Random Access Memory)26と、ディスプレイ27と、音声収集手段としてのマイクロフォン28と、音声処理手段29等を備える。
【0021】
ネットワークインターフェース23は、ネットワークLANに接続するためのインターフェースである。
入力手段24は、マウスやキーボード等で構成され、参加者による操作に応じた操作信号を出力する。
画像処理手段25は、例えばGPU(Graphics Processing Unit)等で構成され、CPU21による制御の下、VRAM26をバッファとして使用して、ディスプレイ27に表示すべき画像を表示する。
マイクロフォン28は、端末装置2の周囲の音(特に、端末装置2を利用する参加者の声)を集音し、音声信号を出力する。
音声処理手段29は、マイクロフォン28から出力されたアナログの音声信号をデジタルの音声データ(音声情報)に変換する。
【0022】
CPU21は、メモリー22に記憶されたプログラムを実行することで、図2に示すように、入力受付手段211、GUI(Graphical User Interface)制御手段212、及び送信制御手段としての通信制御手段213等として機能する。
入力受付手段211は、入力手段24からの操作信号に基づいて、参加者による入力手段24への操作を認識する。
GUI制御手段212は、画像処理手段25の動作を制御し、ディスプレイ27に後述する設定ウィンドウWを表示させる。
通信制御手段213は、ネットワークLANを介したプロジェクター3との接続を確立するとともに、ネットワークLANを介してプロジェクター3との間で情報を送受信する。
例えば、通信制御手段213は、上述した音声データ、入力受付手段211にて認識した情報(以下、表示データ(表示情報))、及び端末装置2が扱う画像データ(ディスプレイ27に表示されている画像(設定ウィンドウWを除く)に関する画像データ(VRAM26に記憶された画像データ))等をプロジェクター3に送信する。
【0023】
〔プロジェクターの構成〕
図3は、プロジェクター3の構成を示すブロック図である。
プロジェクター3は、画像を投射してスクリーン上に投影画像を表示する。
このプロジェクター3は、図3に示すように、ROM(Read Only Memory)やRAM(Random Access Memory)等を含んで構成されるメモリー32、及び当該メモリー32に記憶されたプログラムを実行するCPU31の他、ネットワークインターフェース(ネットワークI/F)33と、画像処理手段34と、VRAM35と、表示手段としての画像投射手段36と、音声処理手段37と、音声出力手段としてのスピーカー38等を備える。
【0024】
ネットワークインターフェース33は、ネットワークLANに接続するためのインターフェースである。
画像処理手段34は、例えばGPU等で構成され、CPU31による制御の下、VRAM35をバッファとして使用して、画像投射手段36に画像を投射させる。
画像投射手段36は、種々の一般的なプロジェクターで使用される光学系で構成され、光源装置と、光源装置から出射された光束を変調する液晶パネル等の光変調装置と、光変調装置にて変調された光束(画像)を投射する投射レンズ等で構成されている。
【0025】
図4は、音声処理手段37の構成を示すブロック図である。
音声処理手段37は、CPU31による制御の下、各端末装置2から送信された各音声データに基づいて、各端末装置2の各マイクロフォン28にて収集された各参加者の声を合成し、当該合成した合成音声を、スピーカー38を介して出力させる。
この音声処理手段37は、図4に示すように、複数の音声増幅部371と、音声合成部372等を備える。
なお、本実施形態では、会議システム1に用いられる端末装置2の数を4つとしたため、音声増幅部371も4つ(第1〜第4音声増幅部371A〜371D)としているが、その数は、4つに限らず、端末装置2に応じた数だけ設ければよい。
【0026】
音声増幅部371は、アンプ等を備えて構成され、各端末装置2のうち、対象となる端末装置2から送信された音声データをアナログの音声信号に変換し、CPU31の制御の下、変換した音声信号の信号レベル(音声の出力レベル)を調整する(種々の増幅度で増幅する)。
なお、第1〜第4音声増幅部371A〜371Dは、第1〜第4端末装置2A〜2Dにそれぞれ対応する。
音声合成部372は、各音声増幅部371にて増幅度が調整された各音声信号を合成して合成音声信号を生成し、当該合成音声信号に基づく合成音声を、スピーカー38を介して出力させる。
【0027】
CPU31は、メモリー32に記憶されたプログラムを実行することで、図3に示すように、受信手段としての通信制御手段311、第1制御手段312、及び第2制御手段313等として機能する。
通信制御手段213は、ネットワークLANを介した各端末装置2との接続を確立するとともに、ネットワークLANを介して各端末装置2との間で情報を送受信する。
【0028】
第1制御手段312は、端末装置2から送信された表示データに基づいて、画像処理手段34の動作を制御し、各端末装置2からの各画像データに基づく各画像を合成し、当該合成画像をスクリーン上に表示させる。
第2制御手段313は、端末装置2から送信された表示データに基づいて、音声処理手段37の動作を制御し、各端末装置2からの各音声データに基づく各音声を合成し、当該合成音声をスピーカー38から出力させる。
【0029】
〔会議システムの動作〕
次に、上述した会議システム1の動作(画像音声処理方法)について説明する。
図5は、画像音声処理方法を説明するフローチャートである。
なお、以下では、説明の便宜上、端末装置2とプロジェクター3とのネットワークLANを介した接続が既に確立されているものとする。
また、以下では、説明の便宜上、ネットワークLANを介してプロジェクター3と接続が確立されている各端末装置2を第1,第2端末装置2A,2Bとし、第3,第4端末装置2C,2Dについては接続が確立されていないものとする。
すなわち、会議システム1を利用した会議への参加者は、第1端末装置2Aを利用する第1参加者と、第2端末装置2Bを利用する第2参加者の2名とする。
【0030】
図6は、設定ウィンドウWの一例を示す図である。
例えば、第1参加者が第1端末装置2Aの入力手段24により「設定ウィンドウWを表示させる」旨の入力操作を実施すると、入力受付手段211は、当該入力操作を認識する(ステップS101)。
ステップS101の後、GUI制御手段212は、画像処理手段25の動作を制御し、ディスプレイ27に図6に示す設定ウィンドウWを表示させる(ステップS102)。
【0031】
設定ウィンドウWは、図6に示すように、第1〜第3ウィンドウW1〜W3を備える。
第1ウィンドウW1は、会議システム1を利用する全参加者に対して、当該参加者を認識させる領域である。
なお、当該参加者については、各端末装置2とプロジェクター3とのネットワークLANを介した接続が確立された際に、接続確立済みの各端末装置2(本実施形態では第1,第2端末装置2A,2B)に関する情報がプロジェクター3から当該各端末装置2に送信される。そして、各端末装置2(各CPU21)は、当該送信された情報(接続確立済みの各端末装置2に関する情報)により、当該端末装置2に対して予め設定された各参加者を認識し、第1ウィンドウW1に当該各参加者に関する参加者画像を表示する。例えば、本実施形態では、第1端末装置2Aは、プロジェクター3から送信された情報に基づき、第2端末装置2Bとプロジェクター3との接続が確立済みであることを把握するとともに、第2端末装置2Bに対して設定された参加者を認識する。
本実施形態では、上述したように、各参加者が第1,第2参加者の2名であるため、第1ウィンドウW1には、第1参加者に応じた第1参加者画像FP1、及び第2参加者に応じた第2参加者画像FP2が表示される。
【0032】
第2ウィンドウW2は、プロジェクター3に表示させる合成画像において、各端末装置2が扱う画像の表示数を選択させる領域である。
具体的に、第2ウィンドウW2には、図6に示すように、第1〜第3選択画像FC1〜FC3が表示されている。
第1選択画像FC1は、接続確立済みの各端末装置2のうち、いずれかの端末装置2が扱う画像のみを全画面で表示させる旨(表示数が1)を選択させる画像である。
第2選択画像FC2は、接続確立済みの各端末装置2のうち、2つの端末装置2が扱う各画像を左右に2画面で表示させる旨(表示数が2)を選択させる画像である。
第3選択画像FC3は、接続確立済みの各端末装置2のうち、4つの端末装置2が扱う各画像を上下左右に4画面で表示させる旨(表示数が4)を選択させる画像である。
【0033】
第3ウィンドウW3は、プロジェクター3に表示させる合成画像において、接続確立済みの各端末装置2が扱う各画像の表示位置及び表示サイズを選択させる領域である。
例えば、第1参加者による入力手段24への操作(マウス操作)により、第2選択画像FC2が選択された場合には、図6に示すように、第3ウィンドウW3には、プロジェクター3が表示する2画面に相当する2つの領域Ar1,Ar2が表示される。
なお、具体的な図示は省略したが、第1選択画像FC1が選択された場合には、第3ウィンドウW3には、プロジェクター3が表示する1画面に相当する1つの領域のみが表示される。また、第3選択画像FC3が選択された場合には、第3ウィンドウW3には、プロジェクター3が表示する4画面に相当する4つの領域が表示される。
【0034】
そして、第1参加者は、接続確立済みの各端末装置2が扱う各画像の表示位置を選択する際には、入力手段24を操作し、第1ウィンドウW1に表示された各参加者画像のうちいずれかの参加者画像を第3ウィンドウW3に表示された各領域のうちいずれかの領域にドラッグアンドドロップする。
例えば、図6(A)に示す例では、第3ウィンドウW3における左側の領域Ar1に第1参加者画像FP1がドラッグアンドドロップされ、右側の領域Ar2に第2参加者画像FP2がドラッグアンドドロップされた状態を示している。
このように表示位置を選択することで、第1端末装置2Aが扱う画像(以下の説明では、「第1の画像」とも称する)を左側に表示し、第2端末装置2Bが扱う画像(以下の説明では、「第2の画像」とも称する)を右側に表示する旨を指示することとなる。
【0035】
また、第1参加者は、接続確立済みの各端末装置2が扱う各画像の表示サイズを選択する際には、入力手段24を操作し、第3ウィンドウW3に表示された各領域のうちいずれかの領域の端縁にカーソル(図示略)を合わせ、当該領域の大きさを変えるようにドラッグアンドドロップする。
例えば、図6(B)に示す例では、上記操作により第3ウィンドウW3における左側の領域Ar1が大きくされ、当該操作に伴い右側の領域Ar2が小さくなった状態を示している。
このように表示サイズを選択することで、第1端末装置2Aが扱う画像(第1参加者(主発言者)の資料等)を大きく表示し、第2端末装置2Bが扱う画像(他の参加者の資料等)を小さく表示する旨を指示することとなる。
【0036】
ステップS102の後、第1参加者により上述したように入力手段24が操作された場合には、入力受付手段211は、プロジェクター3に表示させる合成画像において、接続確立済みの各端末装置2が扱う各画像の表示状態(表示数、表示位置、表示サイズ)の入力を受け付ける(ステップS103:入力受付ステップ)。
そして、入力受付手段211は、表示状態(表示数、表示位置、表示サイズ)に関する表示データをメモリー22に記憶させる。
例えば、図6(B)に示す表示状態が入力された場合には、入力受付手段211は、表示数を「2」とし、第1端末装置2Aが扱う画像の表示位置を「左側」とし、第2端末装置2Bが扱う画像の表示位置を「右側」とし、第1,第2端末装置2A,2Bが扱う各画像の表示サイズ(比率)を「A:B」とする旨の表示データをメモリー22に記憶させる。
本実施形態では、「A」はプロジェクター3に表示させる合成画像における第1の画像の比率を、「B」は第2の画像の比率を表すものとする。この比率は、第1,第2の画像の幅、高さ、または対角線の長さの比率や、面積の比率等を採用することができる。また、表示サイズに関する表示データは、第1,第2の画像の表示サイズを表す情報であれば、比率以外の情報であってもよい。例えば、表示サイズに関する表示データは、第1,第2の画像の幅、高さ、対角線の長さや、面積等を表す情報であってもよく、これらの差を表す情報であってもよい。
【0037】
ステップS103の後、第1参加者が第1端末装置2Aの入力手段24により「入力した表示状態で合成画像をプロジェクター3に表示させる」旨の入力操作を実施すると、入力受付手段211は、当該入力操作を認識する。
そして、通信制御手段213は、メモリー22に記憶された表示データを、ネットワークLANを介してプロジェクター3に送信する(ステップS104:送信制御ステップ)。
また、CPU21は、画像処理手段25の動作を制御し、設定ウィンドウWの表示を止め、通常の画像をディスプレイ27に表示させる。
【0038】
ステップS104の後、プロジェクター3の通信制御手段311は、ネットワークLANを介して、第1端末装置2Aから表示データを受信する(ステップS105:受信ステップ)。
そして、CPU31は、受信した表示データをメモリー32に記憶させる。
ステップS105の後、通信制御手段311は、ネットワークLANを介して、第1,第2端末装置2A,2Bに対して、画像データ及び音声データの送信要求を行う(ステップS106)。
【0039】
ステップS106の後、第1,第2端末装置2A,2Bの各通信制御手段213は、プロジェクター3からデータ送信要求を受信(ステップS107,S108)すると、ネットワークLANを介してプロジェクター3に対して画像データ及び音声データを送信する(ステップS109,S110:送信制御ステップ)。
ここで、画像データは、第1,第2端末装置2A,2Bにおいて、現時点で各ディスプレイ27に表示されている画像(表示画面)に関する画像データであり、具体的には、現時点で各VRAM26に記憶されている画像データである。
また、音声データは、第1,第2端末装置2A,2Bにおいて、現時点で第1,第2参加者の声が各マイクロフォン28にて集音され、各マイクロフォン28からの音声信号が各音声処理手段29にて変換された音声データである。
【0040】
ステップS109,S110の後、プロジェクター3の通信制御手段311は、ネットワークLANを介して、第1,第2端末装置2A,2Bから画像データ及び音声データを受信する(ステップS111:受信ステップ)。
そして、CPU31は、端末装置2を識別する識別情報(IPアドレス等)にて送信元(端末装置2)を特定し、受信した画像データ及び音声データを当該送信元の端末装置2に関連付けてメモリー22に記憶させる。
なお、以下では、メモリー22に記憶された画像データ及び音声データのうち、送信元が第1端末装置2Aであるデータを第1画像データ及び第1音声データと記載し、送信元が第2端末装置2Bであるデータを第2画像データ及び第2音声データと記載する。
【0041】
ステップS111の後、第1制御手段312は、メモリー22に記憶された表示データに基づいて、画像処理手段34の動作を制御し、合成画像を生成させ(ステップS112)、当該合成画像をスクリーン上に表示させる(ステップS113:第1制御ステップ)。
例えば、ステップS103において図6(B)に示す表示状態が入力された場合には、第1制御手段312は、表示データに基づいて、以下に示すような合成画像を生成及び表示させる。
すなわち、第1制御手段312は、表示データ(表示数、表示位置)に基づいて、第1画像データに基づく画像(第1の画像)の表示位置を「左側」、第2画像データに基づく画像(第2の画像)の表示位置を「右側」とする。
また、第1制御手段312は、第1,第2の画像の表示サイズを表示データに基づく比率とした合成画像(第1の画像(主発言者(第1参加者)の資料等)が第2の画像(他の参加者(第2参加者)よりも大きい合成画像)を生成させ(当該合成画像に関する合成画像データをVRAM35上に生成させ)、スクリーン上に当該合成画像を表示させる。
【0042】
また、ステップS111の後(図5では説明の便宜上、ステップS112,S113の後の処理としている)、第2制御手段313は、メモリー22に記憶された表示データに基づいて、音声処理手段37の動作を制御し、合成音声を生成させ(ステップS114)、当該合成音声をスピーカー38から出力させる(ステップS115:第2制御ステップ)。
例えば、ステップS103において図6(B)に示す表示状態が入力された場合には、第2制御手段313は、表示データに基づいて、以下に示すような合成音声を生成させる。
すなわち、第2制御手段313は、表示データ(各画像の表示サイズの比率)に基づいて、第1音声増幅部371Aに第1音声データを処理させ、当該第1音声データを変換した後の音声信号を増幅させる。本実施形態では、第1,第2の画像が合成画像に含まれており、第1の画像の方が第2の画像よりも大きい。このため、第2制御手段313は、第1音声増幅部371Aにデフォルト値よりも大きい増幅度で音声信号を増幅させる。
また、第2制御手段313は、表示データ(各画像の表示サイズの比率)に基づいて、第2音声増幅部371Bに第2音声データを処理させ、当該第2音声データを変換した後の音声信号を増幅させる。本実施形態では、第1,第2の画像が合成画像に含まれており、第2の画像の方が第1の画像よりも小さい。このため、第2制御手段313は、第2音声増幅部371Bにデフォルト値よりも小さい増幅度で音声信号を増幅させる。換言すると、第2制御手段313は、合成画像において第1の画像が他の画像よりも大きく表示されるほど、第1の画像に対応する音声を他の画像に対応する音声よりも大きくする。
【0043】
そして、音声合成部372は、第1,第2音声増幅部371A,371Bにて増幅された各音声信号を合成して合成音声信号を生成し、当該合成音声信号に基づく合成音声を、スピーカー38を介して出力させる。
すなわち、ステップS103において図6(B)に示す表示状態が入力された場合には、第2制御手段313は、主発言者(第1参加者)の声を他の参加者(第2参加者)の声に対して強調した合成音声を生成及び出力させる。
以降、ステップS109〜S115が順次、繰り返し実行され、現時点での第1,第2端末装置2A,2Bの各表示画面が合成画像としてスクリーンに表示され、現時点での第1,第2端末装置2A,2Bの各マイクロフォン28に集音された各参加者の声が合成音声としてスピーカー38から出力されることとなる。
【0044】
上述した第1実施形態によれば、以下の効果がある。
本実施形態では、会議システム1は、複数の端末装置2及びプロジェクター3を備えるので、端末装置2を利用して表示状態を適宜、入力することで、主発言者の資料(主発言者の利用に供される端末装置2が扱う画像)を合成画像(分割表示画面)中の任意の表示位置や、任意の表示サイズ等に設定できる。このため、他の参加者に主発言者がどの画像に基づいて説明を行っているかを容易に判断させることができる。
また、各参加者の声を各マイクロフォン28にて集音し、主発言者の声を他の参加者の声に対して強調した合成音声を生成及び出力できるので、主発言者が説明を行っている際に、他の参加者の一部が会話等をしていた場合であっても、主発言者の声を聞き取りやすいものとすることができる。
したがって、利便性の向上が図れる。
また、合成画像及び合成音声の生成をプロジェクター3自身が実行するため、従来のようなサーバーを必要とせず、会議システム1の構成を簡素化できる。
【0045】
さらに、表示状態が上述した表示サイズを含むものであるので、当該表示サイズに基づいて第1,第2制御手段312,313が合成画像及び合成音声を生成すれば、主発言者の資料(主発言者の利用に供される端末装置2が扱う画像)や声を他の参加者の資料や声に対して強調できる。
したがって、主発言者の資料や声を視聴し易いものとなり、利便性の向上が図れる。
【0046】
[第2実施形態]
次に、本発明の第2実施形態を図面に基づいて説明する。
以下の説明では、前記第1実施形態と同様の構成及び同一部材には同一の符号を付して、その詳細な説明は省略または簡略化する。
図7は、第2実施形態における会議システム1を示すブロック図である。
図8は、第2実施形態におけるプロジェクター3の構成を示すブロック図である。
図9は、第2実施形態におけるサーバー装置4の構成を示すブロック図である。
本実施形態では、前記第1実施形態に対して、図7ないし図9に示すように、会議システム1の構成として端末装置2及びプロジェクター3の他、サーバー装置4を追加した点、及びプロジェクター3におけるCPU31の一部の機能を省略し、当該一部の機能をサーバー装置4のCPU41に追加した点が異なるのみである。
【0047】
サーバー装置4は、端末装置2と同様のパーソナルコンピューターで構成されており、図9に示すように、CPU41、メモリー42、ネットワークインターフェース(ネットワークI/F)43、入力手段44、画像処理手段45、VRAM46、ディスプレイ47、及び音声処理手段48を備える。
CPU41は、メモリー42に記憶されたプログラムを実行することで、図9に示すように、第3制御手段としての通信制御手段411、前記第1実施形態で説明したプロジェクター3(CPU31)における第1,第2制御手段312,313と同様の第1,第2制御手段412,413等として機能する。
音声処理手段48は、前記第1実施形態で説明したプロジェクター3の音声処理手段37と同様の構成を有するものである。
【0048】
次に、第2実施形態における画像音声処理方法について説明する。
図10は、第2実施形態における画像音声処理方法を説明するフローチャートである。
なお、以下では、説明の便宜上、端末装置2とサーバー装置4とのネットワークLANを介した接続、及びプロジェクター3とサーバー装置4とのネットワークLANを介した接続が既に確立されているものとする。
また、以下では、前記第1実施形態と同様に、ネットワークLANを介してサーバー装置4と接続が確立されている各端末装置2を第1,第2端末装置2A,2Bとする。
【0049】
本実施形態の画像音声処理方法では、上述したようにプロジェクター3(CPU31)の一部の機能をサーバー装置4(CPU41)に持たせたことに伴い、前記第1実施形態で説明したプロジェクター3(CPU31)が実行していた処理の一部をサーバー装置4(CPU41)が実行することとなる。
すなわち、サーバー装置4(CPU41)は、図10に示すように、前記第1実施形態でプロジェクター3(CPU31)が実行していたステップS105,S106,S111,S112,S114を実行することとなる。
【0050】
なお、本実施形態において、ステップS112では、第1制御手段412による制御の下、画像処理手段45が合成画像データを生成する。また、ステップS114では、第2制御手段413による制御の下、音声処理手段48が合成音声信号を生成し、当該合成音声信号(アナログ)をデジタルデータ(合成音声データ)に変換する。
また、各端末装置2は、ステップS104,S107〜S110を実行する際の送受信の相手がサーバー装置4となる。
【0051】
そして、サーバー装置4の通信制御手段411は、ステップS112,S114において生成された合成画像データ及び合成音声データを、ネットワークLANを介して、プロジェクター3に送信する(ステップS201)。
一方、プロジェクター3の通信制御手段311は、ネットワークLANを介して、サーバー装置4からの合成画像データ及び合成音声データを受信する(ステップS202)。
そして、CPU31は、当該合成画像データをVRAM35上に記憶させ、当該合成画像データに基づく合成画像をスクリーン上に表示させる(ステップS203)とともに、当該合成音声データを音声処理手段37Aにてアナログの合成音声信号に変換させ、当該合成音声信号に基づく合成音声をスピーカー38から出力させる(ステップS204)。
【0052】
上述した第2実施形態によれば、前記第1実施形態と同様の効果の他、以下の効果がある。
本実施形態では、合成画像及び合成音声の生成をプロジェクター3ではなく、サーバー装置4で実行するため、プロジェクター3に合成画像及び合成音声を生成する機能を別途、設ける必要がなく、汎用のプロジェクター3を利用した会議システム1を構築できる。
【0053】
なお、本発明は前述の実施形態に限定されるものではなく、本発明の目的を達成できる範囲での変形、改良等は本発明に含まれるものである。
前記各実施形態では、ステップS101〜S104を第1端末装置2Aが実行していたが、第1参加者以外の参加者が他の端末装置2の入力手段24を操作すれば、他の端末装置2がステップS101〜S104を実行するものである。
前記各実施形態では、表示サイズを大きくする画像に対応する音声を他の画像に対応する音声に対して強調させていたが、これに限らず、所定の表示位置に位置付ける画像に対応する音声を他の画像に対応する音声に対して強調させるように構成しても構わない。
【0054】
前記第2実施形態では、ステップS101〜S103を実行する機能(入力受付手段211及びGUI制御手段212)を端末装置2に持たせていたが、これに限らず、サーバー装置4に当該機能を持たせても構わない。
前記各実施形態では、本発明に係る画像表示装置としてプロジェクター3を採用していたが、これに限らず、液晶ディスプレイ、プラズマテレビ、有機EL(Electro Luminescence)等を採用しても構わない。
【0055】
前記各実施形態では、第1音声増幅部371Aの増幅度をデフォルト値よりも大きく、第2音声増幅部371Bの増幅度をデフォルト値よりも小さくしているが、一方の増幅度はデフォルト値のままで、他方の増幅度を大きくする(または、小さくする)ことで音量に差をつけてもよい。
前記各実施形態では、音量の調整をプロジェクター3またはサーバー装置4で実施していたが、これに限らず、音量の調整までを各端末装置2で行い、音量が調整済みの音声をプロジェクター3やサーバー装置4が合成する構成を採用しても構わない。
【産業上の利用可能性】
【0056】
本発明は、プロジェクター等の画像表示装置を用いて会議を行う会議システムに利用できる。
【符号の説明】
【0057】
1・・・会議システム、2・・・端末装置、3・・・プロジェクター、4・・・サーバー装置、28・・・マイクロフォン(音声収集手段)、36・・・画像投射手段(表示手段)、38・・・スピーカー(音声出力手段)、211・・・入力受付手段、213・・・通信制御手段(送信制御手段)、312,412・・・第1制御手段、313,413・・・第2制御手段、411・・・通信制御手段(第3制御手段)、LAN・・・ネットワーク(通信路)、S103・・・入力受付ステップ、S104,S109,S110・・・送信制御ステップ、S105,S111・・・受信ステップ、S113・・・第1制御ステップ、S115・・・第2制御ステップ。

【特許請求の範囲】
【請求項1】
複数の端末装置と、前記複数の端末装置と通信可能に接続された画像表示装置とを備え、前記複数の端末装置が扱う各画像を合成した合成画像を前記画像表示装置に表示させる会議システムであって、
前記端末装置は、
周囲の音を集音する音声収集手段と、
前記合成画像における、当該端末装置が扱う画像と、他の前記端末装置が扱う画像との表示状態の入力を受け付ける入力受付手段と、
前記音声収集手段にて集音された音声に関する音声情報、前記表示状態に関する表示情報、及び当該端末装置が扱う画像に関する画像情報を前記画像表示装置に送信する送信制御手段とを備え、
前記画像表示装置は、
画像を表示する表示手段と、
前記音声情報、前記表示情報、及び前記画像情報を受信する受信手段と、
前記表示情報に基づいて、前記複数の端末装置からの各前記画像情報に基づく各画像を合成して前記合成画像を生成し、生成した前記合成画像を前記表示手段に表示させる第1制御手段と、
音声を出力する音声出力手段と、
前記表示情報に基づいて、前記複数の端末装置からの各前記音声情報に基づく各音声を合成して合成音声を生成し、生成した前記合成音声を前記音声出力手段に出力させる第2制御手段とを備える
ことを特徴とする会議システム。
【請求項2】
複数の端末装置と、画像表示装置と、前記複数の端末装置及び前記画像表示装置と通信可能に接続された情報処理装置とを備え、前記複数の端末装置が扱う各画像を合成した合成画像を前記画像表示装置に表示させる会議システムであって、
前記端末装置は、
周囲の音を集音する音声収集手段と、
前記合成画像における、当該前記端末装置が扱う画像と、他の前記端末装置が扱う画像との表示状態の入力を受け付ける入力受付手段と、
前記音声収集手段にて集音された音声に関する音声情報、前記表示状態に関する表示情報、及び当該端末装置が扱う画像に関する画像情報を前記情報処理装置に送信する送信制御手段とを備え、
前記情報処理装置は、
前記表示情報に基づいて、前記複数の端末装置からの各前記画像情報に基づく各画像を合成して前記合成画像を生成する第1制御手段と、
前記表示情報に基づいて、前記複数の端末装置からの各前記音声情報に基づく各音声を合成して合成音声を生成する第2制御手段と、
前記通信路を介して、前記合成画像に関する合成画像情報、及び前記合成音声に関する合成音声情報を前記画像表示装置に送信する第3制御手段とを備え、
前記画像表示装置は、
前記情報処理装置からの前記合成画像情報に基づく前記合成画像を表示する表示手段と、
前記情報処理装置からの前記合成音声情報に基づく前記合成音声を出力する音声出力手段とを備える
ことを特徴とする会議システム。
【請求項3】
請求項1または請求項2に記載の会議システムにおいて、
前記表示状態は、
前記複数の端末装置が扱う各画像の表示サイズを含むものであり、
前記第2制御手段は、
前記各画像の表示サイズに基づいて、前記各画像に対応した前記各音声の出力レベルを調整し、前記合成音声を生成する
ことを特徴とする会議システム。
【請求項4】
複数の端末装置と通信可能に接続され、前記複数の端末装置が扱う各画像が合成された合成画像を表示する画像表示装置であって、
当該画像表示装置は、
画像を表示する表示手段と、
前記複数の端末装置のそれぞれにおいて集音された音声に関する音声情報、前記合成画像における、前記複数の端末装置のそれぞれが扱う画像の表示状態に関する表示情報、及び前記複数の端末装置のそれぞれが扱う画像情報を受信する受信手段と、
前記表示情報に基づいて、前記複数の端末装置からの各前記画像情報に基づく各画像を合成して前記合成画像を生成し、生成した前記合成画像を前記表示手段に表示させる第1制御手段と、
音声を出力する音声出力手段と、
前記表示情報に基づいて、前記複数の端末装置からの各前記音声情報に基づく各音声を合成して合成音声を生成し、生成した前記合成音声を前記音声出力手段に出力させる第2制御手段とを備える
ことを特徴とする画像表示装置。
【請求項5】
複数の端末装置と、前記複数の端末装置と通信可能に接続された画像表示装置とを備え、前記複数の端末装置が扱う各画像を合成した合成画像を前記画像表示装置に表示させる会議システムを利用した画像音声処理方法であって、
前記端末装置が、前記合成画像における、当該端末装置が扱う画像と、他の前記端末装置が扱う画像との表示状態の入力を受け付ける入力受付ステップと、
前記端末装置が、音声収集手段にて集音された音声に関する音声情報、前記表示状態に関する表示情報、及び当該端末装置が扱う画像に関する画像情報を前記画像表示装置に送信する送信制御ステップと、
前記画像表示装置が、前記音声情報、前記表示情報、及び前記画像情報を受信する受信ステップと、
前記画像表示装置が、前記表示情報に基づいて、前記複数の端末装置からの各前記画像情報に基づく各画像を合成して前記合成画像を生成し、生成した前記合成画像を表示する第1制御ステップと、
前記画像表示装置が、前記表示情報に基づいて、前記複数の端末装置からの各前記音声情報に基づく各音声を合成して合成音声を生成し、生成した前記合成音声を出力する第2制御ステップと、
を含むことを特徴とする画像音声処理方法。
【請求項6】
複数の端末装置と通信可能に接続され、前記複数の端末装置が扱う各画像が合成された合成画像を表示する画像表示装置の画像音声処理方法であって、
前記複数の端末装置のそれぞれにおいて集音された音声に関する音声情報、前記合成画像における、前記複数の端末装置のそれぞれが扱う画像の表示状態に関する表示情報、及び前記複数の端末装置のそれぞれが扱う画像情報を受信する受信ステップと、
前記表示情報に基づいて、前記複数の端末装置からの各前記画像情報に基づく各画像を合成して前記合成画像を生成し、生成した前記合成画像を表示する第1制御ステップと、
前記表示情報に基づいて、前記複数の端末装置からの各前記音声情報に基づく各音声を合成して合成音声を生成し、生成した前記合成音声を出力する第2制御ステップと、
を含むことを特徴とする画像音声処理方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate


【公開番号】特開2013−8210(P2013−8210A)
【公開日】平成25年1月10日(2013.1.10)
【国際特許分類】
【出願番号】特願2011−140627(P2011−140627)
【出願日】平成23年6月24日(2011.6.24)
【出願人】(000002369)セイコーエプソン株式会社 (51,324)