説明

テレビ会議装置、制御方法、およびプログラム

【課題】テレビ会議装置において、画像を、適切に表示する。
【解決手段】顔検出部103は、例えば、複数のテレビ会議装置の複数の撮像手段が出力する画像である撮像画像から、顔が投影された領域である顔領域を検出し、切り取り部104は、顔領域を含む画像を、撮像画像から切り取る。また、表示用画像生成部105は、複数の撮像手段が出力する撮像画像から切り取られた、顔領域を含む画像により構成される1の画像を生成し、表示制御部106は、1の画像を、表示部107に表示させる。本発明は、例えば、テレビ会議装置に適用することができる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、テレビ会議装置、制御方法、およびプログラムに関し、特に、例えば、テレビ会議装置において、画像を、適切に表示することができるようにしたテレビ会議装置、制御方法、およびプログラムに関する。
【背景技術】
【0002】
例えば、2以上のテレビ会議装置を通信回線を介して接続し、各テレビ会議装置間でテレビ会議を行うテレビ会議システムでは、各テレビ会議装置において、カメラにより、会議室などの様子が撮像され、その撮像により得られた撮像画像を、相互に送受信することで、テレビ会議が行われる。
【0003】
ところで、テレビ会議システムが、3以上の、例えば、5つのテレビ会議装置で構成される場合、テレビ会議システムを構成する1つのテレビ会議装置において、他の4つのテレビ会議装置のうちの所定の1つのテレビ会議装置で撮像されて送信されてくる撮像画像しか表示しないと、1つのテレビ会議装置では、残りの3つのテレビ会議装置が設置された会議室などの様子を知ることができない。
【0004】
そこで、例えば、1つのテレビ会議装置では、他の4つのテレビ会議装置それぞれで撮像されて送信されてくる撮像画像すべてを、1の画面に表示することができるように、他の4つのテレビ会議装置からの撮像画像それぞれが、所定の縮小率により縮小画像に縮小され、その縮小画像すべてにより構成される1の画像が、画像を表示するモニタの表示画面に表示される。
【0005】
図1は、他の4つのテレビ会議装置それぞれで撮像されて送信されてくる撮像画像を示す図である。
【0006】
1つのテレビ会議装置では、他の4つのテレビ会議装置それぞれからの図1の撮像画像が、図2に示すように、1の画像で表示される。
【0007】
即ち、図2は、4つの撮像画像それぞれを、所定の縮小率により縮小することで得られた縮小画像により構成される1の画像が表示された表示画面を示している。
【0008】
いま、説明を簡単にするために、表示画面と撮像画像のサイズが同一であるとすると、1の撮像画像は、例えば、縦と横のそれぞれが1/2に縮小されて表示される。
【0009】
なお、特許文献1には、スレーブMCUに接続された複数のテレビ会議端末からスレーブMCUに送信されてくる画像である地点画像を、各地点画像を合成することにより得られるスレーブ画像の各領域の大きさに合せた大きさで合成することによりスレーブ画像を生成するスレーブMCUが開示されている(特に、特許文献1の[0016]、[0031]および[0040]段落を参照)。
【0010】
【特許文献1】特開2000−253374号公報
【発明の開示】
【発明が解決しようとする課題】
【0011】
上述のように、1つのテレビ会議装置において、他の4つのテレビ会議装置で撮像されて送信されてくる撮像画像を所定の縮小率により縮小し、その結果得られる縮小画像を表示画面に表示するのでは、撮像画像の縮小により画質(例えば、解像度)が劣化し、また、撮像画像に映っている人物の表情などが判断しにくくなってしまう。
【0012】
テレビ会議システムが3以上のテレビ会議装置で構成される場合の他、テレビ会議システムが2つのテレビ会議装置で構成される場合でも、例えば、一方のテレビ会議装置に複数のカメラが設けられ、その複数のカメラが出力する複数の撮像画像が、他方のテレビ会議装置に送信されるときも、上述した画質の劣化等が生じる。
【0013】
本発明は、このような状況に鑑みてなされたものであり、テレビ会議装置において、画像を、適切に表示することができるようにするものである。
【課題を解決するための手段】
【0014】
本発明の一側面のテレビ会議装置、またはプログラムは、画像を通信回線を介して送受信することにより行われるテレビ会議に使用されるテレビ会議装置、または画像を通信回線を介して送受信することにより行われるテレビ会議に使用されるテレビ会議装置として、コンピュータに機能させるプログラムであり、撮像を行う複数の撮像手段が出力する前記画像である撮像画像から、顔が投影された領域である顔領域を検出する検出手段と、前記検出手段により検出された前記顔領域を含む画像を、前記撮像画像から切り取る切り取り手段と、前記複数の撮像手段が出力する撮像画像から切り取られた、前記顔領域を含む画像により構成される1の画像を生成する生成手段と、前記生成手段により生成された前記1の画像を、画像を表示する表示手段に表示させる表示制御手段とを備えるテレビ会議装置、またはテレビ会議装置として、コンピュータに機能させるプログラムである。
【0015】
前記切り取り手段では、前記表示手段に表示される前記1の画像のサイズが所定のサイズになるように、前記1の画像を構成する、前記顔領域を含む画像を、前記複数の撮像手段が出力する撮像画像から切り取ることができる。
【0016】
前記切り取り手段では、前記検出手段により検出された前記顔領域の所定の位置と、前記顔領域を含む画像の所定の位置とが一致するように、前記顔領域を含む画像を、前記複数の撮像手段が出力する撮像画像から切り取ることができる。
【0017】
前記検出手段において、1の前記撮像画像から、複数の前記顔領域が検出された場合、前記切り取り手段では、前記検出手段により検出された複数の前記顔領域のうちの、1の顔領域を含む画像を、前記撮像画像から切り取ることができる。
【0018】
前記検出手段において、1の前記撮像画像から、複数の前記顔領域が検出された場合、前記切り取り手段では、前記検出手段により検出された複数の前記顔領域それぞれを含む複数の画像を、前記撮像画像から切り取ることができる。
【0019】
前記検出手段において、1の前記撮像画像から、複数の前記顔領域が検出された場合、前記切り取り手段では、前記検出手段により検出された複数の前記顔領域すべてを含む画像を、前記撮像画像から切り取ることができる。
【0020】
本発明の一側面の制御方法は、画像を通信回線を介して送受信することにより行われるテレビ会議に使用されるテレビ会議装置を制御する制御方法において、撮像を行う複数の撮像手段が出力する前記画像である撮像画像から、顔が投影された領域である顔領域を検出し、前記顔領域を含む画像を、前記撮像画像から切り取り、前記複数の撮像手段が出力する撮像画像から切り取られた、前記顔領域を含む画像により構成される1の画像を生成し、前記1の画像を、画像を表示する表示手段に表示させるステップを含む。
【0021】
本発明の一側面においては、撮像を行う複数の撮像手段が出力する前記画像である撮像画像から、顔が投影された領域である顔領域が検出され、その顔領域を含む画像が、前記撮像画像から切り取られる。そして、前記複数の撮像手段が出力する撮像画像から切り取られた、前記顔領域を含む画像により構成される1の画像が生成され、その1の画像が、画像を表示する表示手段に表示される。
【発明の効果】
【0022】
本発明の一側面によれば、テレビ会議装置において、画像を、適切に表示することができる。
【発明を実施するための最良の形態】
【0023】
以下に本発明の実施の形態を説明するが、本発明の構成要件と、明細書又は図面に記載の実施の形態との対応関係を例示すると、次のようになる。この記載は、本発明をサポートする実施の形態が、明細書又は図面に記載されていることを確認するためのものである。従って、明細書又は図面中には記載されているが、本発明の構成要件に対応する実施の形態として、ここには記載されていない実施の形態があったとしても、そのことは、その実施の形態が、その構成要件に対応するものではないことを意味するものではない。逆に、実施の形態が構成要件に対応するものとしてここに記載されていたとしても、そのことは、その実施の形態が、その構成要件以外の構成要件には対応しないものであることを意味するものでもない。
【0024】
本発明の一側面のテレビ会議装置、またはプログラムは、
画像を通信回線(例えば、図3の通信回線32)を介して送受信することにより行われるテレビ会議に使用されるテレビ会議装置(例えば、図3のテレビ会議装置31aや、31b、31c、31d、31e)、または画像を通信回線を介して送受信することにより行われるテレビ会議に使用されるテレビ会議装置として、コンピュータを機能させるプログラムであり、
撮像を行う複数の撮像手段(例えば、図6の撮像部108)が出力する前記画像である撮像画像から、顔が投影された領域である顔領域を検出する検出手段(例えば、図6の顔検出部103)と、
前記検出手段により検出された前記顔領域を含む画像を、前記撮像画像から切り取る切り取り手段(例えば、図6の切り取り部104)と、
前記複数の撮像手段が出力する撮像画像から切り取られた、前記顔領域を含む画像により構成される1の画像を生成する生成手段(例えば、図6の表示用画像生成部105)と、
前記生成手段により生成された前記1の画像を、画像を表示する表示手段(例えば、図6の表示部107)に表示させる表示制御手段(例えば、図6の表示制御部106)と
を備えるテレビ会議装置、またはテレビ会議装置として、コンピュータを機能させるプログラムである。
【0025】
本発明の一側面の制御方法は、
画像を通信回線(例えば、図3の通信回線32)を介して送受信することにより行われるテレビ会議に使用されるテレビ会議装置(例えば、図3のテレビ会議装置31aや、31b、31c、31d、31e)を制御する制御方法において、
撮像を行う複数の撮像手段(例えば、図6の撮像部108)が出力する前記画像である撮像画像から、顔が投影された領域である顔領域を検出し(例えば、図7のステップS32)、
前記顔領域を含む画像を、前記撮像画像から切り取り(例えば、図7のステップS33)、
前記複数の撮像手段が出力する撮像画像から切り取られた、前記顔領域を含む画像により構成される1の画像を生成し(例えば、図7のステップS34)、
前記1の画像を、画像を表示する表示手段に表示させる(例えば、図7のステップS35)
ステップを含む。
【0026】
次に、図面を参照して、本発明の実施の形態を説明する。
【0027】
図3は、本発明を適用したテレビ会議システムの一実施の形態の構成例を示すブロック図である。
【0028】
図3のテレビ会議システムは、インターネット網やLAN(local area network)などの通信回線32を介して接続された5つのテレビ会議装置31a乃至31eにより構成される。
【0029】
テレビ会議装置31a乃至31eは、画像および音声を通信回線32を介して送受信することにより行われるテレビ会議に使用される。
【0030】
テレビ会議装置31aは、そのテレビ会議装置31a自体が設置された会議室などで行われる会議の様子を撮像し、その撮像により得られた撮像画像を、他の4つのテレビ会議装置31b乃至31eに送信する。また、テレビ会議装置31aは、他の4つのテレビ会議装置31b乃至31eで撮像されて送信されてくる撮像画像を受信し、表示させる。
【0031】
他の4つのテレビ会議装置31b乃至31eも、それぞれ、テレビ会議装置31aと同様の処理を行う。
【0032】
次に、図4および図5を参照して、図3のテレビ会議装置31eが行う処理の概略を説明する。
【0033】
図4は、図1のテレビ会議システムを構成するテレビ会議装置31eに対して、他の4つのテレビ会議装置31a乃至31dで撮像されて送信された撮像画像51a乃至51dそれぞれを示す図である。
【0034】
撮像画像51aは、テレビ会議装置31aで撮像された画像であり、そこには、2つの顔が投影されている。撮像画像51bは、テレビ会議装置31bで撮像された画像であり、そこには、3つの顔が投影されている。
【0035】
また、撮像画像51cは、テレビ会議装置31cで撮像された画像であり、そこには、1つの顔が投影されている。撮像画像51dは、テレビ会議装置31dで撮像された画像であり、そこには、1つの顔が投影されている。
【0036】
テレビ会議装置31eは、他のテレビ会議装置31a乃至31dそれぞれからの撮像画像51a乃至51dから、顔が投影された領域である顔領域を検出する。
【0037】
即ち、テレビ会議装置31aからの撮像画像51aには、上述したように、2つの顔が投影されており、従って、テレビ会議装置31eでは、撮像画像51aから、そこに投影されている2つの顔それぞれの顔領域61aおよび62aが検出される。
【0038】
テレビ会議装置31eは、撮像画像から複数の顔領域が検出された場合、その複数の顔領域の中から、例えば、肌色の領域を最も多く含む1つの顔領域を選択する。
【0039】
図4では、撮像画像51aの顔領域62aは、撮像画像51aの顔領域61aよりも肌色の領域を多く含んでいる。従って、テレビ会議装置31eでは、撮像画像51aの顔領域61aと62aのうちの、顔領域61aよりも肌色の領域を多く含む顔領域62aが選択される。
【0040】
さらに、テレビ会議装置31eでは、顔領域62aの所定の位置としての、例えば、重心位置72aが算出され、その重心位置72aと、顔領域62aを含むトリミング画像91aの所定の位置としての、例えば、重心位置とが一致するように、顔領域62aを含む、所定のサイズのトリミング画像91aが、撮像画像51aから切り取られる。
【0041】
なお、トリミング画像91aの所定のサイズについては、後述する。
【0042】
また、画像(領域)の重心位置とは、その画像を構成する画素のx座標、またはy座標の平均値それぞれを、x座標、またはy座標とする位置である。
【0043】
次に、テレビ会議装置31bからの撮像画像51bには、上述したように、3つの顔が投影されており、従って、テレビ会議装置31eでは、撮像画像51bから、そこに投影されている3つの顔それぞれの顔領域61b,62b,63bが検出される。
【0044】
テレビ会議装置31eは、撮像画像から複数の顔領域が検出された場合、その複数の顔領域の中から、上述したように、肌色の領域を最も多く含む1つの顔領域を選択する。
【0045】
図4では、撮像画像51bの顔領域62bは、撮像画像51bの顔領域61b乃至63bの中で、肌色の領域を最も多く含んでいる。従って、テレビ会議装置31eでは、撮像画像51bの顔領域61b乃至63bのうちの、肌色の領域を最も多く含む顔領域62bが選択される。
【0046】
さらに、テレビ会議装置31eでは、顔領域62bの重心位置72bが算出され、その重心位置72bと、顔領域62bを含むトリミング画像91bの重心位置とが一致するように、顔領域62bを含む、所定のサイズのトリミング画像91bが、撮像画像51bから切り取られる。
【0047】
次に、テレビ会議装置31cからの撮像画像51cには、上述したように、1つの顔が投影されており、従って、テレビ会議装置31eでは、撮像画像51cから、そこに投影されている1つの顔の顔領域61cが検出される。
【0048】
さらに、テレビ会議装置31eでは、顔領域61cの重心位置71cが算出され、その重心位置71cと、顔領域61cを含むトリミング画像91cの重心位置とが一致するように、顔領域61cを含む、所定のサイズのトリミング画像91cが、撮像画像51cから切り取られる。
【0049】
次に、テレビ会議装置31dからの撮像画像51dには、上述したように、1つの顔が投影されており、従って、テレビ会議装置31eでは、撮像画像51dから、そこに投影されている1つの顔の顔領域61dが検出される。
【0050】
さらに、テレビ会議装置31eでは、顔領域61dの重心位置71dが算出され、その重心位置71dと、顔領域61dを含むトリミング画像91dの重心位置とが一致するように、顔領域61dを含む、所定のサイズのトリミング画像91dが、撮像画像51dから切り取られる。
【0051】
テレビ会議装置31eは、以上のようにして、他の4つのテレビ会議装置31a乃至31dからの撮像画像51a乃至51dそれぞれから、顔領域を含むトリミング画像91a乃至91dを切り取った後、そのトリミング画像91a乃至91dにより構成される1の表示用画像を生成し、表示させる。
【0052】
図5は、顔領域を含むトリミング画像91a乃至91dにより構成される1の表示用画像が表示された表示画面を示している。
【0053】
図5では、表示画面の表示領域が、縦と横のそれぞれに2等分され、同一のサイズの4つの分割領域に分割されている。
【0054】
そして、左上の分割領域には、顔領域62aを含むトリミング画像91aが、右上の分割領域には、顔領域62bを含むトリミング画像91bが、左下の分割領域には、顔領域61cを含むトリミング画像91cが、右下の分割領域には、顔領域61dを含むトリミング画像91dが、それぞれ表示されている。
【0055】
なお、テレビ会議装置31eが、1の撮像画像から切り取るトリミング画像のサイズ(上述の所定のサイズ)は、1の分割領域のサイズに等しい。
【0056】
図6は、図3のテレビ会議装置31eの構成例を示すブロック図である。
【0057】
ここで、他の4つのテレビ会議装置31a乃至31dも、テレビ会議装置31eと同様に構成され、同様の処理を行うので、以下では、他の4つのテレビ会議装置31a乃至31dについての説明は、省略する。
【0058】
テレビ会議装置31eは、受信部101、受信制御部102、顔検出部103、切り取り部104、表示用画像生成部105、表示制御部106、表示部107、撮像部108、送信制御部109、および送信部110により構成される。
【0059】
受信部101は、受信制御部102の制御に従い、他の4つのテレビ会議装置31a,31b,31c,31dから送信されてくる撮像画像それぞれを受信し、受信制御部102に供給する。
【0060】
受信制御部102は、受信部101を制御する。また、受信制御部102は、受信部101から供給された撮像画像を、顔検出部103および切り取り部104に供給する。
【0061】
顔検出部103は、受信制御部102から供給された撮像画像から、顔領域を検出する。また、顔検出部103は、顔領域を検出することで得られる、撮像画像内の、顔領域の位置(領域)を表す位置情報を、切り取り部104に供給する。なお、顔検出部103は、複数の顔領域を検出した場合、複数の顔領域のうちの、例えば、肌色の領域を最も多く含む1の顔領域を選択し、その顔領域の位置情報を、切り取り部104に供給する。
【0062】
切り取り部104は、顔検出部103により検出された顔領域を含むトリミング画像を、受信制御部102から供給された撮像画像から切り取る。
【0063】
即ち、例えば、切り取り部104は、顔検出部103から供給された顔領域の位置情報に基づいて、顔検出部103により検出された顔領域(顔検出部103が、複数の顔領域を検出した場合、複数の顔領域のうちの、肌色の領域を最も多く含む1の顔領域)の重心位置を算出し、その重心位置と、顔領域を含むトリミング画像の重心位置とが一致するように、1の分割領域と等しいサイズ(以下、分割サイズという)のトリミング画像を、受信制御部102から供給された撮像画像から切り取る。
【0064】
切り取り部104は、他の4つのテレビ会議装置31a,31b,31c,31dからの撮像画像それぞれからトリミング画像を1つずつ切り取り、4つのトリミング画像を得ると、その4つのトリミング画像を、表示用画像生成部105に供給する。
【0065】
表示用画像生成部105は、切り取り部104から供給された顔領域を含む4つのトリミング画像により構成される1の表示用画像を生成し、表示制御部106に供給する。
【0066】
表示制御部106は、表示用画像生成部105から供給された1の表示用画像を、表示部107に供給し、表示させる。
【0067】
表示部107は、例えば、LCD(liquid crystal display)などのモニタであり、表示制御部106の制御に従い、表示制御部106から供給された1の表示用画像を表示画面に表示する。
【0068】
撮像部108は、例えば、撮像を行い、撮像画像を出力するビデオカメラで構成され、テレビ会議装置31eが設置された会議室などで行われる会議の様子を撮像し、その結果得られる撮像画像を、送信制御部109に供給する。
【0069】
送信制御部109は、撮像部108から供給された撮像画像を、送信部110に供給し、他の4つのテレビ会議装置31a,31b,31c,31dに送信させる。
【0070】
送信部110は、送信制御部109の制御に従い、送信制御部109から供給された撮像画像を、通信回線32(図3)を介して、他の4つのテレビ会議装置31a,31b,31c,31dに送信する。
【0071】
次に、図7のフローチャートを参照して、他の4つのテレビ会議装置31a,31b,31c,31dから送信されてくる撮像画像それぞれから、4つのトリミング画像を切り取り、その4つのトリミング画像により構成される1の表示用画像を表示させる第1の切り取り表示処理を説明する。
【0072】
ステップS31において、受信部101は、受信制御部102の制御に従い、他の4つのテレビ会議装置31a,31b,31c,31dから送信されてくる撮像画像それぞれを受信し、受信制御部102に供給する。また、受信制御部102は、受信部101から供給された撮像画像を、顔検出部103および切り取り部104に供給する。
【0073】
その後、処理は、ステップS31からステップS32に進み、顔検出部103は、受信制御部102から供給された撮像画像から、顔領域を検出する。また、ステップS32において、顔検出部103は、顔領域を検出することで得られる、その顔領域の位置情報を、切り取り部104に供給する。なお、顔検出部103は、複数の顔領域を検出した場合、複数の顔領域のうちの、肌色の領域を最も多く含む1の顔領域を選択し、その顔領域の位置情報を、切り取り部104に供給する。
【0074】
ステップS32の処理の終了後、処理は、ステップS33に進み、切り取り部104は、顔検出部103により検出された顔領域を含むトリミング画像を、受信制御部102から供給された撮像画像から切り取る。
【0075】
即ち、ステップS33において、切り取り部104は、顔検出部103から供給された顔領域の位置情報に基づいて、顔検出部103により検出された顔領域の重心位置を算出し、その重心位置と、顔領域を含むトリミング画像の重心位置とが一致するように、分割サイズのトリミング画像を、受信制御部102から供給された撮像画像から切り取る。
【0076】
ステップS33において、切り取り部104は、他の4つのテレビ会議装置31a乃至31dからの撮像画像それぞれから、トリミング画像を1つずつ切り取り、4つのトリミング画像を得ると、その4つのトリミング画像を、表示用画像生成部105に供給する。
【0077】
ステップS33の処理の終了後、処理は、ステップS34に進み、表示用画像生成部105は、切り取り部104から供給された顔領域を含む4つのトリミング画像により構成される1の表示用画像を生成し、表示制御部106に供給して、処理は、ステップS35に進み、表示制御部106は、表示用画像生成部105から供給された1の表示用画像を、表示部107に供給し、表示部107の表示画面に表示させる。
【0078】
その後、処理は終了される。
【0079】
以上のように、第1の切り取り表示処理では、他の4つのテレビ会議装置31a乃至31dから送信された撮像画像それぞれから、顔領域を含む、分割サイズのトリミング画像を切り取り、そのトリミング画像により構成される1の表示用画像を表示する。
【0080】
従って、第1の切り取り表示処理によれば、他の4つのテレビ会議装置31a乃至31dから送信された撮像画像それぞれが、その一部であるトリミング画像としてではあるが、縮小することなく表示されるので、縮小による画質の劣化を防止することができるとともに、撮像画像に映っている人物の表情などが判断しにくくなってしまうことを防止することができる。
【0081】
即ち、第1の切り取り表示処理によれば、例えば、テレビ会議に出席する出席者の表情などを認識することができるように、適切なサイズで、出席者が映っている画像を表示させることができる。
【0082】
次に、第1の切り取り表示処理では、1つの撮像画像から複数の顔領域が検出された場合、その複数の顔領域から1の顔領域を選択し、その1の顔領域の重心位置と、トリミング画像の重心位置とが一致するように、トリミング画像を撮像画像から切り取ることとしたが、複数の顔領域が検出された場合には、その他、例えば、できる限り多くの顔領域を含むように、トリミング画像を、撮像画像から切り取るようにすることができる。
【0083】
図8を参照して、1つの撮像画像から複数の顔領域が検出された場合、できる限り多くの顔領域を含むように、トリミング画像を撮像画像から切り取り、そのトリミング画像により構成される1の表示用画像を表示させる第2の切り取り表示処理について説明する。
【0084】
図8は、図4と同一の、テレビ会議装置31a乃至31dからテレビ会議装置31eに送信されてくる撮像画像51a乃至51dそれぞれを示している。
【0085】
なお、図中、図4の場合と対応する部分については、同一の符号を付してある。
【0086】
第2の切り取り表示処理でも、第1の切り取り表示処理と同様に、撮像画像51aから2つの顔領域61aと62aが検出され、撮像画像51bから3つの顔領域61b乃至63bが検出される。さらに、撮像画像51cから1つの顔領域61cが検出され、撮像画像51dから1つの顔領域61dが検出される。
【0087】
そして、第2の切り取り表示処理では、撮像画像から複数の顔領域が検出された場合、その複数の顔領域のうちの、肌色の領域を最も多く含む1つの顔領域を含む画像がトリミング画像として切り取られるのではなく、できるだけ多くの顔領域を含む分割サイズの画像がトリミング画像として切り取られる。
【0088】
即ち、2つの顔領域61aと62aが検出された撮像画像51aについては、切り取り部104は、顔領域61aの重心位置71a、および顔領域62aの重心位置72aを算出する。また、切り取り部104は、その重心位置71aと72aとを結ぶ線分を2等分する位置を、2つの顔領域61aと62aのすべてを含む分割サイズの領域となりそうな候補領域の重心位置281aとして算出する。
【0089】
切り取り部104は、重心位置281aを重心位置とする分割サイズの候補領域を検出し、その候補領域に、重心位置281aを求めるのに用いた重心位置71aと72aそれぞれに対応する顔領域61aと62aのすべてが含まれるか、即ち、2つの顔領域61aと62aのすべてを含む分割サイズのトリミング画像が存在するか否かを判定する。
【0090】
重心位置281aを重心位置とする分割サイズの候補領域に、顔領域61aと62aのすべてが含まれると判定された場合、切り取り部104は、その候補領域内の画像を、2つの顔領域61aと62aのすべてを含む分割サイズのトリミング画像として、撮像画像51aから切り取る。
【0091】
一方、重心位置281aを重心位置とする分割サイズの候補領域に、顔領域61aと62aのすべてが含まれないと判定された場合、切り取り部104は、例えば、図4の場合と同様に、複数の顔領域のうちの、肌色の領域を最も多く含む1の顔領域の重心位置と、分割サイズのトリミング画像の重心位置とが一致するように、トリミング画像を撮像画像から切り取る。
【0092】
図8においては、重心位置281aを重心位置とする分割サイズの候補領域に、顔領域61aと62aのすべてが含まれないため、切り取り部104は、図4の場合と同様に、撮像画像51aの顔領域61aと62aのうちの、顔領域61aよりも肌色の領域を多く含む顔領域62aの重心位置72aと、顔領域62aを含むトリミング画像との重心位置とが一致するように、分割サイズのトリミング画像91aを撮像画像51aから切り取る。
【0093】
次に、3つの顔領域61b,62b,63bが検出された撮像画像51bについては、切り取り部104は、顔領域61bの重心位置71b、顔領域62bの重心位置72b、および顔領域63bの重心位置73bを算出する。また、切り取り部104は、重心位置71bと72bとを結ぶ線分、重心位置72bと73bとを結ぶ線分、および重心位置73bと71bとを結ぶ線分により構成される三角形の重心の位置を、3つの顔領域61b乃至63bすべてを含む分割サイズの領域となりそうな候補領域の重心位置281bとして算出する。
【0094】
切り取り部104は、重心位置281bを重心位置とする分割サイズの候補領域を検出し、その候補領域に、重心位置281bを求めるのに用いた重心位置71b,72b,73bそれぞれに対応する顔領域61b,62b,63bのすべてが含まれるか、即ち、3つの顔領域61b,62b,63bのすべてを含む分割サイズのトリミング画像が存在するか否かを判定する。
【0095】
重心位置281bを重心位置とする分割サイズの候補領域に、顔領域61b,62b,63bのすべてが含まれると判定された場合、切り取り部104は、その候補領域内の画像を、3つの顔領域61b,62b,63bのすべてを含む分割サイズのトリミング画像として、撮像画像51bから切り取る。
【0096】
一方、重心位置281bを重心位置とする分割サイズの候補領域に、顔領域61b,62b,63bのすべてが含まれないと判定された場合、切り取り部104は、重心位置71bと72bとを結ぶ線分を2等分する位置を、顔領域61bと62bのすべてを含む分割サイズの領域となりそうな候補領域の重心位置282bとして算出する。
【0097】
また、切り取り部104は、重心位置72bと73bとを結ぶ線分を2等分する位置を、顔領域62bと63bのすべてを含む分割サイズの領域となりそうな候補領域の重心位置283bとして算出する。
【0098】
さらに、切り取り部104は、重心位置73bと71bとを結ぶ線分を2等分する位置を、顔領域63bと61bのすべてを含む分割サイズの領域となりそうな候補領域の重心位置284bとして算出する。
【0099】
切り取り部104は、重心位置282b乃至284bのうちの、例えば、重心位置282bに注目し、その重心位置282bを重心位置とする分割サイズの候補領域を検出して、その候補領域に、重心位置282bを求めるのに用いた重心位置71bと72bのそれぞれに対応する顔領域61bと62bのすべてが含まれるか否か、即ち、2つの顔領域61bと62bのすべてを含む分割サイズのトリミング画像が存在するか否かを判定する。
【0100】
重心位置282bを重心位置とする分割サイズの候補領域に、顔領域61bと62bのすべてが含まれると判定された場合、切り取り部104は、その候補領域内の画像を、2つの顔領域61bと62bのすべてを含む分割サイズのトリミング画像として、撮像画像51bから切り取る。
【0101】
一方、重心位置282bを重心位置とする分割サイズの候補領域に、顔領域61bと62bのすべてが含まれないと判定された場合、切り取り部104は、例えば、重心位置282b乃至284bのうちの、まだ注目していない、例えば、重心位置283bに注目する。
【0102】
切り取り部104は、重心位置283bを重心位置とする分割サイズの候補領域を検出し、その候補領域に、重心位置283bを求めるのに用いた重心位置72bと73bのそれぞれに対応する顔領域62bと63bのすべてが含まれるか、即ち、2つの顔領域62bと63bのすべてを含む分割サイズのトリミング画像が存在するか否かを判定する。
【0103】
重心位置283bを重心位置とする分割サイズの候補領域に、顔領域62bと63bのすべてが含まれると判定された場合、切り取り部104は、その候補領域内の画像を、2つの顔領域62bと63bのすべてを含む分割サイズのトリミング画像として、撮像画像51bから切り取る。
【0104】
一方、重心位置283bを重心位置とする分割サイズの候補領域に、顔領域62bと63bのすべてが含まれないと判定された場合、切り取り部104は、例えば、重心位置282b乃至284bのうちの、まだ注目していない重心位置284bに注目する。
【0105】
切り取り部104は、重心位置284bを重心位置とする分割サイズの候補領域を検出し、その候補領域に、重心位置284bを求めるのに用いた重心位置73bと71bのそれぞれに対応する顔領域63bと61bのすべてが含まれるか、即ち、2つの顔領域63bと61bのすべてを含む分割サイズのトリミング画像が存在するか否かを判定する。
【0106】
重心位置284bを重心位置とする分割サイズの候補領域に、顔領域63bと61bのすべてが含まれると判定された場合、切り取り部104は、その候補領域内の画像を、2つの顔領域63bと61bのすべてを含む分割サイズのトリミング画像として、撮像画像51bから切り取る。
【0107】
一方、重心位置284bを重心位置とする分割サイズの候補領域に、顔領域63bと61bのすべてが含まれないと判定された場合、切り取り部104は、例えば、図4の場合と同様に、撮像画像51bの顔領域61b乃至63bのうちの、肌色の領域を最も多く含む顔領域62bの重心位置72bと、分割サイズのトリミング画像の重心位置とが一致するように、撮像画像51bからトリミング画像を切り取る。
【0108】
図8では、重心位置283bを重心位置とする分割サイズの候補領域に、重心位置283bを求めるのに用いた重心位置72bと73bのそれぞれに対応する顔領域62bと63bのすべてが含まれるようになっており、従って、撮像画像51bからは、その候補領域内の画像291bが、顔領域62bと63bのすべてを含む分割サイズのトリミング画像291bとして、切り取り部104により切り取られる。
【0109】
次に、1の顔領域61cが検出された撮像画像51cと、1の顔領域61dが検出された撮像画像51dについては、図4の場合と同様に、トリミング画像が切り取られる。
【0110】
即ち、切り取り部104は、顔領域61cの重心位置71cを重心位置とする、分割サイズのトリミング画像91cを、撮像画像51cから切り取る。また、切り取り部104は、顔領域61dの重心位置71dを重心位置とする、分割サイズのトリミング画像91dを、撮像画像51dから切り取る。
【0111】
切り取り部104は、撮像画像51a乃至51dからそれぞれ切り取った、トリミング画像91a,291b,91c,91dを、表示用画像生成部105に供給する。
【0112】
表示用画像生成部105は、切り取り部104から供給された、トリミング画像91a,291b,91c,91dにより構成される1の表示用画像を生成し、表示制御部106に供給する。
【0113】
表示制御部106は、表示用画像生成部105から供給された1の表示用画像を、表示部107に供給し、表示させる。
【0114】
図9は、第2の切り取り表示処理において生成された、トリミング画像91a,291b,91c,91dにより構成される1の表示用画像が表示された、表示部107の表示画面を示している。
【0115】
図9では、図5の場合と同様に、表示画面の表示領域が、横と縦のそれぞれに2等分され、同一のサイズの4つの分割領域に分割されている。
【0116】
そして、左上の分割領域には、顔領域62aを含むトリミング画像91aが、右上の分割領域には、顔領域62bと63bを含むトリミング画像291bが、左下の分割領域には、顔領域61cを含むトリミング画像91cが、右下の分割領域には、顔領域61dを含むトリミング画像91dが、それぞれ表示されている。
【0117】
以上のように、第2の切り取り表示処理では、第1の切り取り表示処理と同様に、他の4つのテレビ会議装置31a乃至31dから送信された撮像画像それぞれから、顔領域を含む、分割サイズのトリミング画像を切り取り、そのトリミング画像により構成される1の表示用画像を表示するので、画質の劣化を防止することができるとともに、撮像画像に映っている人物の表情などが判断しにくくなってしまうことを防止することができる。
【0118】
また、第2の切り取り表示処理では、なるべく多くの顔領域を含むように、顔領域を含むトリミング画像を切り取るので、撮像画像に複数の出席者が映っている場合に、より多くの出席者が映っている表示用画像を表示することができる。
【0119】
次に、撮像画像から複数の顔領域が検出された場合には、なるべく多くの顔領域を含むように、顔領域を含むトリミング画像を切り取るのではなく、例えば、撮像画像から検出された複数の顔領域をそれぞれ含む複数の画像を、トリミング画像として、撮像画像から切り取るようにすることができる。
【0120】
即ち、1つの撮像画像から、複数であるN個の顔領域が検出された場合には、そのN個の顔領域をそれぞれ含む、分割サイズの1/NのサイズのN個のトリミング画像を、撮像画像から切り取るようにすることができる。
【0121】
但し、この場合、撮像画像から検出された顔領域の個数Nが多いときには、撮像画像から切り取られるトリミング画像のサイズ(分割サイズの1/N)が小さくなり過ぎることがある。
【0122】
そこで、例えば、テレビ会議装置31eでは、複数の顔領域が検出された1つの撮像画像から切り取るトリミング画像の最大の数をいくつにするかは、例えば、ユーザが、テレビ会議装置31eを操作するのに用いるリモートコントローラなどを操作することで設定することができるようになっている。
【0123】
ここで、ユーザによる操作により、1つの撮像画像から切り取るトリミング画像の最大の数は2に設定されているものとする。
【0124】
次に、図10を参照して、1つの撮像画像から複数の顔領域が検出された場合に、その複数の顔領域の中から2つの顔領域を選択し、その2つの顔領域をそれぞれ含む2つのトリミング画像を切り取り、そのトリミング画像により構成される1の表示用画像を表示させる第3の切り取り表示処理について説明する。
【0125】
図10は、図4と同一の、テレビ会議装置31a乃至31dからテレビ会議装置31eに送信されてくる撮像画像51a乃至51dそれぞれを示している。
【0126】
なお、図中、図4の場合と対応する部分については、同一の符号を付してある。
【0127】
第3の切り取り表示処理でも、第1の切り取り表示処理と同様に、撮像画像51aから2つの顔領域61aと62aが検出され、撮像画像51bから3つの顔領域61b乃至63bが検出される。さらに、撮像画像51cから1つの顔領域61cが検出され、撮像画像51dから1つの顔領域61dが検出される。
【0128】
そして、第3の切り取り表示処理では、1つの撮像画像から複数の顔領域が検出された場合には、その複数の顔領域のうちの2つの顔領域が選択され、2つの顔領域をそれぞれ含む、分割サイズの1/2のサイズの2つの画像がトリミング画像として、撮像画像から切り取られる。
【0129】
即ち、第3の切り取り表示処理では、撮像画像から1または2の顔領域が検出された場合、その1または2の顔領域が選択され、3以上の顔領域が検出された場合、その3以上の顔領域のうちの、例えば、撮像画像内の最も左側に投影された顔領域と、最も右側に投影された顔領域の、2つの顔領域が選択される。
【0130】
従って、2つの顔領域61aと62aが検出された撮像画像51aについては、切り取り部104は、その2つの顔領域61aと62aを選択する。
【0131】
さらに、切り取り部104は、顔領域61aの重心位置71a、および顔領域62aの重心位置72aを算出する。
【0132】
そして、切り取り部104は、重心位置71aと、顔領域61aを含むトリミング画像391aの重心位置とが一致するように、分割サイズの1/2のサイズ(以下、ハーフ分割サイズという)のトリミング画像391aを、撮像画像51aから切り取る。さらに、切り取り部104は、重心位置72aと、顔領域62aを含むトリミング画像392aの重心位置とが一致するように、ハーフ分割サイズのトリミング画像392aを、撮像画像51aから切り取る。
【0133】
次に、第3の切り取り表示処理では、3つの顔領域61b,62b,63bが検出された撮像画像51bについては、切り取り部104は、その3つの顔領域61b,62b,63bのうちの、最も左側に投影された顔領域61bおよび最も右側に投影された顔領域63bの2つを選択する。
【0134】
さらに、切り取り部104は、顔領域61bの重心位置71b、および顔領域63bの重心位置73bを算出する。
【0135】
そして、切り取り部104は、重心位置71bと、顔領域61bを含むトリミング画像391bの重心位置とが一致するように、ハーフ分割サイズのトリミング画像391bを、撮像画像51bから切り取る。さらに、切り取り部104は、重心位置73bと、顔領域63bを含むトリミング画像393bの重心位置とが一致するように、ハーフ分割サイズのトリミング画像393bを、撮像画像51bから切り取る。
【0136】
次に、1つの顔領域61cが検出された撮像画像51cと、1つの顔領域61dが検出された撮像画像51dについては、図4の場合と同様に、トリミング画像が切り取られる。
【0137】
即ち、切り取り部104は、顔領域61cの重心位置71cを重心位置とする、分割サイズのトリミング画像91cを、撮像画像51cから切り取る。また、切り取り部104は、顔領域61dの重心位置71dを重心位置とする、分割サイズのトリミング画像91dを、撮像画像51dから切り取る。
【0138】
切り取り部104は、撮像画像51a乃至51dからそれぞれ切り取った、トリミング画像391a,392a,391b,393b,91c,91dを、表示用画像生成部105に供給する。
【0139】
表示用画像生成部105は、切り取り部104から供給された、トリミング画像391a,392a,391b,393b,91c,91dにより構成される1の表示用画像を生成し、表示制御部106に供給する。
【0140】
表示制御部106は、表示用画像生成部105から供給された1の表示用画像を、表示部107に供給し、表示させる。
【0141】
図11は、第3の切り取り表示処理において生成された、トリミング画像391a,392a,391b,393b,91c,91dにより構成される1の表示用画像が表示された、表示部107の表示画面を示している。
【0142】
図11では、図5の場合と同様に、表示画面の表示領域が、横と縦のそれぞれに2等分され、同一のサイズの4つの分割領域に分割されている。
【0143】
そして、左上の分割領域には、顔領域61aを含むハーフ分割サイズのトリミング画像391aと、顔領域62aを含むハーフ分割サイズのトリミング画像392aとが水平方向に並ぶ形で、右上の分割領域には、顔領域61bを含むハーフ分割サイズのトリミング画像391bと、顔領域63bを含むハーフ分割サイズのトリミング画像393bとが水平方向に並ぶ形で、左下の分割領域には、顔領域61cを含む分割サイズのトリミング画像91cが、右下の分割領域には、顔領域61dを含む分割サイズのトリミング画像91dが、それぞれ表示されている。
【0144】
以上のように、第3の切り取り表示処理では、他の4つのテレビ会議装置31a乃至31dから送信された撮像画像それぞれから、顔領域を含む、分割サイズまたはハーフ分割サイズのトリミング画像を切り取り、そのトリミング画像により構成される1の表示用画像を表示するので、画質の劣化を防止することができるとともに、撮像画像に映っている人物の表情などが判断しにくくなってしまうことを防止することができる。
【0145】
また、第3の切り取り表示処理では、1つの撮像画像から複数の顔領域が検出された場合、その複数の顔領域それぞれを含む複数のトリミング画像を切り取るので、撮像画像に複数の出席者が映っている場合に、複数の出席者それぞれが映っている表示用画像を表示することができる。
【0146】
さらに、第3の切り取り表示処理では、1つの撮像画像から複数の顔領域が検出された場合に、その複数の顔領域のうちの、例えば2つの顔領域を選択し、その2つの顔領域それぞれを含む2つのトリミング画像を切り取るときには、複数の顔領域それぞれを含む複数のトリミング画像を切り取るときと比較して、撮像画像から切り取られるトリミング画像を少なくすることができるため、トリミング画像のサイズが小さくなり過ぎる、つまり、複数の顔領域の中から選択された顔領域に投影された顔の表情などが見にくくなることを防止することができる。
【0147】
次に、1つの撮像画像から複数の顔領域が検出された場合には、例えば、その複数の顔領域すべてを含む画像を、トリミング画像として、撮像画像から切り取るようにすることができる。
【0148】
図12を参照して、1つの撮像画像から複数の顔領域が検出された場合に、その複数の顔領域すべてを含むトリミング画像を撮像画像から切り取り、そのトリミング画像により構成される1の表示用画像を表示させる第4の切り取り表示処理について説明する。
【0149】
図12は、図4と同一の、テレビ会議装置31a乃至31dからテレビ会議装置31eに送信されてくる撮像画像51a乃至51dそれぞれを示している。
【0150】
なお、図中、図4の場合と対応する部分については、同一の符号を付してある。
【0151】
第4の切り取り表示処理でも、第1の切り取り表示処理と同様に、撮像画像51aから2つの顔領域61aと62aが検出され、撮像画像51bから3つの顔領域61b乃至63bが検出される。さらに、撮像画像51cから1つの顔領域61cが検出され、撮像画像51dから1つの顔領域61dが検出される。
【0152】
そして、第4の切り取り表示処理では、1つの撮像画像から複数の顔領域が検出された場合には、その複数の顔領域すべてを含む、例えば、なるべく小さい矩形の領域内の画像がトリミング画像として切り取られる。
【0153】
即ち、2つの顔領域61aと62aが検出された撮像画像51aについては、切り取り部104は、2つの顔領域61aと62aのすべてを含む領域を検出し、その領域内の画像を、2つの顔領域61aと62aのすべてを含むトリミング画像591aとして、撮像画像51aから切り取る。
【0154】
なお、1つの撮像画像から、複数の顔領域が検出された場合において、その複数の顔領域すべてを含む、なるべく小さい矩形の領域が、分割サイズ以下のサイズの領域であるときには、切り取り部104は、その複数の顔領域すべてを含む分割サイズの領域を、トリミング画像として、撮像画像から切り取る。
【0155】
また、切り取り部104は、1つの撮像画像から検出された複数の顔領域すべてを含む、なるべく小さい矩形の領域が、分割サイズを超えるサイズの領域となるときには、その分割サイズを超えるサイズの領域を、トリミング画像として、撮像画像から切り取る。
【0156】
図12では、2つの顔領域61aと62aを含む領域のサイズは、分割サイズよりも大のサイズになっており、従って、切り取り部104は、分割サイズよりも大のサイズのトリミング画像591aを、撮像画像51aから切り取る。
【0157】
次に、3つの顔領域61b乃至63bが検出された撮像画像51bについては、切り取り部104は、3つの顔領域61b乃至63bのすべてを含む領域を検出し、その領域内の画像を、3つの顔領域61b乃至63bのすべてを含むトリミング画像591bとして、撮像画像51bから切り取る。
【0158】
図12では、3つの顔領域61b乃至63bのすべてを含む領域のサイズは、分割サイズよりも大のサイズになっており、従って、切り取り部104は、分割サイズよりも大のサイズのトリミング画像591bを、撮像画像51bから切り取る。
【0159】
次に、1つの顔領域61cが検出された撮像画像51cと、1つの顔領域61dが検出された撮像画像51dについては、図4の場合と同様に、トリミング画像が切り取られる。
【0160】
即ち、切り取り部104は、顔領域61cの重心位置71cを重心位置とする、分割サイズのトリミング画像91cを、撮像画像51cから切り取る。また、切り取り部104は、顔領域61dの重心位置71dを重心位置とする、分割サイズのトリミング画像91dを、撮像画像51dから切り取る。
【0161】
切り取り部104は、撮像画像51a乃至51dからそれぞれ切り取った、トリミング画像591a,591b,91c,91dを、表示用画像生成部105に供給する。
【0162】
表示用画像生成部105は、切り取り部104から供給されたトリミング画像のサイズが、分割サイズであるか、または分割サイズよりも大のサイズであるかを判定する。そして、切り取り部104から供給されたトリミング画像のサイズが、分割サイズよりも大のサイズである場合、表示用画像生成部105は、分割サイズよりも大のサイズのトリミング画像を、分割サイズのトリミング画像に縮小する。
【0163】
従って、表示用画像生成部105は、分割サイズよりも大のサイズであるトリミング画像591aと591bについては、分割サイズのトリミング画像591aと591bに縮小する。
【0164】
表示用画像生成部105は、縮小後の、分割サイズのトリミング画像591aと591b、および、切り取り部104から供給された、分割サイズのトリミング画像91cと91dにより構成される1の表示用画像を生成し、表示制御部106に供給する。
【0165】
表示制御部106は、表示用画像生成部105から供給された1の表示用画像を、表示部107に供給し、表示させる。
【0166】
図13は、第4の切り取り表示処理において生成された、分割サイズのトリミング画像591a,591b,91c,91dにより構成される1の表示用画像が表示された、表示部107の表示画面を示している。
【0167】
図13では、図5の場合と同様に、表示画面の表示領域が、横と縦のそれぞれに2等分され、同一のサイズの4つの分割領域に分割されている。
【0168】
そして、左上の分割領域には、顔領域61aと62aを含む縮小後のトリミング画像591aが、右上の分割領域には、顔領域61b乃至63bを含む縮小後のトリミング画像591bが、左下の分割領域には、顔領域61cを含むトリミング画像91cが、右下の分割領域には、顔領域61dを含むトリミング画像91dが、それぞれ表示されている。
【0169】
以上のように、第4の切り取り表示処理では、他の4つのテレビ会議装置31a乃至31dから送信された撮像画像から、複数の顔領域が検出された場合に、その複数の顔領域すべてを含む、なるべく小さい領域が分割サイズ以下のサイズの領域であるときには、複数の顔領域すべてを含む分割サイズの領域内の画像を、分割サイズのトリミング画像として撮像画像から切り取り、分割サイズのトリミング画像により構成される1の表示用画像を表示するので、画質の劣化を防止することができるとともに、撮像画像に映っている人物の表情などが判断しにくくなってしまうことを防止することができる。
【0170】
また、第4の切り取り表示処理では、他の4つのテレビ会議装置31a乃至31dから送信された撮像画像から、複数の顔領域が検出された場合に、その複数の顔領域すべてを含む、なるべく小さい領域が分割サイズより大のサイズの領域であるときには、その領域内の画像を、トリミング画像として撮像画像から切り取り、分割サイズのトリミング画像に縮小して、分割サイズのトリミング画像により構成される1の表示用画像を表示する。
【0171】
従って、第4の切り取り表示処理によれば、撮像画像全体を、分割サイズの撮像画像に縮小するときと比較して、縮小による画質の劣化を低減することができるとともに、撮像画像に映っている人物の表情などが判断しにくくなってしまうことを低減することができる。
【0172】
さらに、第4の切り取り表示処理では、1つの撮像画像から検出される複数の顔領域すべてを含むトリミング画像を切り取ることとしたので、撮像画像に複数の出席者が映っている場合に、その複数の出席者全員が映っている表示用画像を表示することができる。
【0173】
上述した第1乃至4の切り取り表示処理(図7、図8、図10、または図12)は、専用のハードウェアにより実行させることもできるし、ソフトウエアにより実行させることもできる。第1乃至4の切り取り表示処理をソフトウエアにより実行させる場合には、そのソフトウエアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどに、プログラム記録媒体からインストールされる。
【0174】
図14は、プログラムを実行することにより上述した第1乃至4の切り取り表示処理を行うコンピュータの構成例を示すブロック図である。
【0175】
CPU(Central Processing Unit)901は、ROM(Read Only Memory)902、または記憶部908に記憶されているプログラムに従って各種の処理を実行する。RAM(Random Access Memory)903には、CPU901が実行するプログラムやデータなどが適宜記憶される。これらのCPU901、ROM902、およびRAM903は、バス904により相互に接続されている。
【0176】
CPU901にはまた、バス904を介して入出力インタフェース905が接続されている。入出力インタフェース905には、キーボード、マウス、マイクロホンなどよりなる入力部906、ディスプレイ、スピーカなどよりなる出力部907が接続されている。CPU901は、入力部906から入力される指令に対応して各種の処理を実行する。そして、CPU901は、処理の結果を出力部907に出力する。
【0177】
入出力インタフェース905に接続されている記憶部908は、例えばハードディスクからなり、CPU901が実行するプログラムや各種のデータを記憶する。通信部909は、インターネットやローカルエリアネットワークなどのネットワークを介して外部の装置と通信する。
【0178】
入出力インタフェース905に接続されているドライブ910は、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブルメディア911が装着されたとき、それらを駆動し、そこに記録されているプログラムやデータなどを取得する。取得されたプログラムやデータは、必要に応じて記憶部908に転送され、記憶される。
【0179】
コンピュータにインストールされ、コンピュータによって実行可能な状態とされるプログラムを格納するプログラム記録媒体は、図14に示すように、磁気ディスク(フレキシブルディスクを含む)、光ディスク(CD-ROM(Compact Disc-Read Only Memory),DVD(Digital Versatile Disc)を含む)、光磁気ディスク、もしくは半導体メモリなどよりなるパッケージメディアであるリムーバブルメディア911、または、プログラムが一時的もしくは永続的に格納されるROM902や、記憶部908を構成するハードディスクなどにより構成される。プログラム記録媒体へのプログラムの格納は、必要に応じてルータ、モデムなどのインタフェースである通信部909を介して、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の通信媒体を利用して行われる。
【0180】
入出力インタフェース905に接続されている撮像部912は、撮像を行い、その結果得られる画像を、入出力インタフェース905を介して、通信部909に供給し、他のコンピュータに送信させる。
【0181】
なお、本明細書において、プログラム記録媒体に格納されるプログラムを記述するステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。
【0182】
また、本明細書において、システムとは、複数の装置により構成される装置全体を表すものである。
【0183】
なお、本実施の形態においては、顔領域を含むトリミング画像により構成される1の表示用画像を、そのまま表示させることとしたが、例えば、同一の撮像画像から切り取られた顔領域を含むトリミング画像を、同一の撮像画像から切り取られたことが認識することができる形で、表示させることができる。
【0184】
即ち、例えば、テレビ会議において、そのテレビ会議に出席している出席者のうちの、同一のテレビ会議装置を使用してテレビ会議を行っている出席者(同一の会議室に居る出席者)のグループを認識することができるように、同一の撮像画像から切り取られた顔領域を含むトリミング画像に、同一色の枠を重畳(合成)して表示させることができる。
【0185】
さらに、上述の実施の形態では言及しなかったが、撮像画像からの顔領域の検出は、撮像画像の各フレームを対象に行っても良いし、一部のフレームだけを対象に行っても良い。
【0186】
顔領域の検出の対象とする一部のフレームとしては、例えば、一定のフレーム数ごとのフレームを採用することができる。さらに、例えば、撮像画像の各フレームから動きベクトルを検出し、その動きベクトルに基づいて、フレームに動きがあるかどうかを判定して、動きのあるフレームのみを、顔領域の検出の対象とする一部のフレームとして採用することができる。
【0187】
一定のフレーム数ごとのフレームのみを、顔領域の検出の対象とする場合には、顔領域の検出の対象としないフレームについては、そのフレームの間近の、顔領域の検出済みのフレームと同一の位置に顔領域が存在するとみなして、トリミング画像の切り取りを行うことができる。
【0188】
また、動きのあるフレームのみを、顔領域の検出の対象とする場合にも、顔領域の検出の対象としないフレーム、つまり、動きのないフレームについては、そのフレームの間近の、顔領域の検出済みのフレームと同一の位置に顔領域が存在するとみなして、トリミング画像の切り取りを行うことができる。
【0189】
撮像画像からの顔領域の検出を、一部のフレームだけを対象に行う場合には、撮像画像の各フレームを対象に行う場合と比較して、処理量を軽減させることができる。
【0190】
また、第3の切り取り表示処理においては、撮像画像から3以上の複数の顔領域が検出された場合、その複数の顔領域のうちの、例えば、撮像画像内の最も左側に投影された顔領域と、最も右側に投影された顔領域の、2つの顔領域を選択することとしたが、複数の顔領域のうちの2つの顔領域を選択する方法は、これに限定されるものではない。
【0191】
即ち、複数の顔領域のうちの2つの顔領域を選択する方法としては、例えば、複数の顔領域のうちの、撮像画像の中央の位置に近い2つの顔領域を選択することもできるし、さらに、複数の顔領域のうちの、肌色の領域の多い2つの顔領域を選択することもできる。また、テレビ会議装置の操作に用いるリモートコントローラなどを用いて、ユーザが、複数の顔領域のうちの2つの顔領域を選択するようにしてもよい。
【0192】
また、本実施の形態において、例えば、テレビ会議装置31eが行う第1乃至第4の切り取り表示処理では、他の4つのテレビ会議装置31a乃至31dそれぞれで撮像されてテレビ会議装置31eに送信されてくる撮像画像を対象として、第1乃至第4の切り取り表示処理を行うこととしたが、例えば、テレビ会議装置31eにより撮像された撮像画像をも対象として、第1乃至第4の切り取り表示処理を行うことができる。
【0193】
さらに、本実施の形態においては、例えば、テレビ会議装置31eが、他の4つのテレビ会議装置31a乃至31dそれぞれで撮像されてテレビ会議装置31eに送信されてくる撮像画像を対象として、第1乃至第4の切り取り表示処理を行うこととしたが、例えば、2つのテレビ会議装置31eとテレビ会議装置31aにより構成されるテレビ会議システムにおいて、テレビ会議装置31aに複数のカメラが設けられている場合には、その複数のカメラが出力する複数の撮像画像を対象として、第1乃至第4の切り取り表示処理を行うことができる。
【0194】
また、第1の切り取り表示処理では、例えば、撮像画像から、分割サイズのトリミング画像を切り取って表示させることとしたが、顔領域を含むトリミング画像内の、その顔領域のサイズが常に一定のサイズとなるように、顔領域を含むトリミング画像を撮像画像から切り取ることで、表示される顔領域のサイズを常に同じサイズで表示させることができる。
【0195】
即ち、例えば、撮像画像から検出された顔領域のサイズに応じて、顔領域を含むトリミング画像内の顔領域のサイズが一定のサイズとなるように、顔領域を含むトリミング画像を撮像画像から切り取り、そのトリミング画像のサイズが、分割サイズである場合には、そのまま表示させる。また、撮像画像から切り取られたトリミング画像のサイズが、分割サイズでない場合には、撮像画像から切り取られたトリミング画像を、分割サイズになるように、所定の縮小率により縮小、または所定の拡大率により拡大することで得られる縮小または拡大後のトリミング画像を表示させる。
【0196】
これにより、撮像画像から検出された顔領域のサイズの大小に関わらず、トリミング画像内の顔領域のサイズを常に同じサイズで表示させることができる。
【0197】
また、本実施の形態では、表示部107の表示画面の表示領域を、2×2個の4個の分割領域に分割したが、表示領域を分割する分割数は、その他、例えば、3×2個の6個や、3×3個の9個などとすることができる。表示領域をどのように分割するかは、例えば、ユーザが、リモートコントローラを操作することにより設定することができる。
【0198】
ここで、第1乃至第4の切り取り表示処理の対象とする撮像画像の数が、表示領域の分割数よりも大である場合には、その、分割数よりも多い数の撮像画像のうちの、分割数に等しい数の撮像画像が選択され、その分割数に等しい数の撮像画像から切り取られたトリミング画像が、表示用画像を構成する画像として用いられる。分割数よりも多い数の撮像画像の中から選択する、分割数に等しい数の撮像画像は、例えば、ユーザが、リモートコントローラを操作することにより選択することができる。
【0199】
さらに、本実施の形態においては、撮像画像から顔領域を検出し、その顔領域を含むトリミング画像を表示することとしたが、その他、例えば、撮像画像の動きベクトルなどに基づいて、撮像画像内の動きのある領域である動き領域を検出して、その動き領域を含むトリミング画像を表示するようにしてもよい。
【0200】
なお、本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。
【図面の簡単な説明】
【0201】
【図1】4つのテレビ会議装置で撮像されて送信されてくる撮像画像を示す図である。
【図2】4つの撮像画像それぞれを縮小した縮小画像により構成される1の画像が表示された表示画面を示す図である。
【図3】本発明を適用したテレビ会議システムの一実施の形態の構成例を示すブロック図である。
【図4】4つのテレビ会議装置31a乃至31dで撮像されて送信された撮像画像51a乃至51dを示す図である。
【図5】顔領域を含むトリミング画像91a乃至91dにより構成される1の表示用画像が表示された表示画面を示す図である。
【図6】テレビ会議装置31eの構成例を示すブロック図である。
【図7】第1の切り取り表示処理を説明するフローチャートである。
【図8】第2の切り取り表示処理を説明する図である。
【図9】第2の切り取り表示処理において生成されたトリミング画像により構成される1の表示用画像が表示された表示画面を示す図である。
【図10】第3の切り取り表示処理を説明する図である。
【図11】第3の切り取り表示処理において生成されたトリミング画像により構成される1の表示用画像が表示された表示画面を示す図である。
【図12】第4の切り取り表示処理を説明する図である。
【図13】第4の切り取り表示処理において生成されたトリミング画像により構成される1の表示用画像が表示された表示画面を示す図である。
【図14】コンピュータのハードウェアの構成例を示すブロック図である。
【符号の説明】
【0202】
31a乃至31e テレビ会議装置, 101 受信部, 102 受信制御部, 103 顔検出部, 104 切り取り部, 105 表示用画像生成部, 106 表示制御部, 107 表示部

【特許請求の範囲】
【請求項1】
画像を通信回線を介して送受信することにより行われるテレビ会議に使用されるテレビ会議装置において、
撮像を行う複数の撮像手段が出力する前記画像である撮像画像から、顔が投影された領域である顔領域を検出する検出手段と、
前記検出手段により検出された前記顔領域を含む画像を、前記撮像画像から切り取る切り取り手段と、
前記複数の撮像手段が出力する撮像画像から切り取られた、前記顔領域を含む画像により構成される1の画像を生成する生成手段と、
前記生成手段により生成された前記1の画像を、画像を表示する表示手段に表示させる表示制御手段と
を備えるテレビ会議装置。
【請求項2】
前記切り取り手段は、前記表示手段に表示される前記1の画像のサイズが所定のサイズになるように、前記1の画像を構成する、前記顔領域を含む画像を、前記複数の撮像手段が出力する撮像画像から切り取る
請求項1に記載のテレビ会議装置。
【請求項3】
前記切り取り手段は、前記検出手段により検出された前記顔領域の所定の位置と、前記顔領域を含む画像の所定の位置とが一致するように、前記顔領域を含む画像を、前記複数の撮像手段が出力する撮像画像から切り取る
請求項1に記載のテレビ会議装置。
【請求項4】
前記検出手段において、1の前記撮像画像から、複数の前記顔領域が検出された場合、前記切り取り手段は、前記検出手段により検出された複数の前記顔領域のうちの、1の顔領域を含む画像を、前記撮像画像から切り取る
請求項1に記載のテレビ会議装置。
【請求項5】
前記検出手段において、1の前記撮像画像から、複数の前記顔領域が検出された場合、前記切り取り手段は、前記検出手段により検出された複数の前記顔領域それぞれを含む複数の画像を、前記撮像画像から切り取る
請求項1に記載のテレビ会議装置。
【請求項6】
前記検出手段において、1の前記撮像画像から、複数の前記顔領域が検出された場合、前記切り取り手段は、前記検出手段により検出された複数の前記顔領域すべてを含む画像を、前記撮像画像から切り取る
請求項1に記載のテレビ会議装置。
【請求項7】
画像を通信回線を介して送受信することにより行われるテレビ会議に使用されるテレビ会議装置を制御する制御方法において、
撮像を行う複数の撮像手段が出力する前記画像である撮像画像から、顔が投影された領域である顔領域を検出し、
前記顔領域を含む画像を、前記撮像画像から切り取り、
前記複数の撮像手段が出力する撮像画像から切り取られた、前記顔領域を含む画像により構成される1の画像を生成し、
前記1の画像を、画像を表示する表示手段に表示させる
ステップを含む制御方法。
【請求項8】
画像を通信回線を介して送受信することにより行われるテレビ会議に使用されるテレビ会議装置として、コンピュータを機能させるプログラムにおいて、
撮像を行う複数の撮像手段が出力する前記画像である撮像画像から、顔が投影された領域である顔領域を検出する検出手段と、
前記検出手段により検出された前記顔領域を含む画像を、前記撮像画像から切り取る切り取り手段と、
前記複数の撮像手段が出力する撮像画像から切り取られた、前記顔領域を含む画像により構成される1の画像を生成する生成手段と、
前記生成手段により生成された前記1の画像を、画像を表示する表示手段に表示させる表示制御手段と
して、コンピュータを機能させるプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate


【公開番号】特開2008−236679(P2008−236679A)
【公開日】平成20年10月2日(2008.10.2)
【国際特許分類】
【出願番号】特願2007−77280(P2007−77280)
【出願日】平成19年3月23日(2007.3.23)
【出願人】(000002185)ソニー株式会社 (34,172)
【Fターム(参考)】