説明

制御装置、制御システムと制御方法

【課題】 集音の品質を向上させる。
【解決手段】
左右へのパン動作可能なイメージ取得手段と、集音範囲を変更可能な集音手段と、を制御する制御装置であって、前記イメージ取得手段の位置と前記イメージ取得手段により取得されるイメージに映りこむ被写体の位置との間の距離と、前記イメージ取得手段のパンの方向と、前記イメージ取得手段の位置と前記集音手段の位置との間の距離と、前記イメージ取得手段の位置を基準とした前記集音手段の位置の方向と、を用いて前記集音手段の集音範囲を変更する集音範囲変更手段を備える、ことを特徴とする。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、集音装置を制御する技術に関するものである。
【背景技術】
【0002】
従来より、マイク内蔵型ビデオカメラ等によりマイクの指向特性とカメラの振れ角、ズーム角を連動させるテレビ会議装置の技術が存在する(特許文献1)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開平10−155107号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかし、上記技術では、カメラとマイクが一体化されているものであるため、テレビ会議等において集音品質を高めるためにマイクを会議卓の中央等に設置すると、撮影できる被写体(参加者)が限られてしまう。
【0005】
本発明の目的は、集音の品質を向上させる技術を提供することにある。
【課題を解決するための手段】
【0006】
上記課題を解決すべく、本発明に係る制御装置は、左右へのパン動作可能なイメージ取得手段と、集音範囲を変更可能な集音手段と、を制御する制御装置であって、前記イメージ取得手段の位置と前記イメージ取得手段により取得されるイメージに映りこむ被写体の位置との間の距離と、前記イメージ取得手段のパンの方向と、前記イメージ取得手段の位置と前記集音手段の位置との間の距離と、前記イメージ取得手段の位置を基準とした前記集音手段の位置の方向と、を用いて前記集音手段の集音範囲を変更する集音範囲変更手段を備える、ことを特徴とする。
【0007】
また、本発明に係る制御システムは、左右へのパン動作手段を備える撮像装置と、集音範囲の変更手段を備える集音装置と、前記撮像装置および前記集音装置を制御する制御装置と、を備え、前記制御装置は、前記撮像装置の位置と前記撮像装置により取得される映像に映りこむ被写体の位置との間の距離と、前記撮像装置のパンの方向と、前記撮像装置の位置と前記集音装置の位置との間の距離と、前記撮像装置の位置を基準とした前記集音装置の位置の方向と、を用いて前記集音装置の集音範囲を変更するよう指示する集音範囲変更指示手段を備える、ことを特徴とする。
【0008】
また、本発明に係る撮像装置は、左右へのパン動作を行うパン動作手段と、撮影している画角を変更する動作を行う画角変更動作手段と、パン方向を特定するパン方向情報を取得するパン方向情報取得手段と、被写体までの距離を特定する距離情報を取得する距離情報取得手段と、撮影している画角を特定する画角情報を取得する画角情報取得手段と、前記パン方向情報と、前記距離情報と、前記画角情報と、を出力する出力手段と、を備え、前記出力手段は、前記パン動作手段および前記画角変更動作手段のいずれの動作も終了して所定の時間経過した場合に、前記出力を行う、ことを特徴とする。
【0009】
また、本発明に係る制御方法は、左右へのパン動作可能なイメージ取得手段と、集音範囲を変更可能な集音手段と、を制御する制御装置の制御方法であって、前記制御装置は、前記イメージ取得手段の位置と前記イメージ取得手段により取得されるイメージに映りこむ被写体の位置との間の距離と、前記イメージ取得手段のパンの方向と、前記イメージ取得手段の位置と前記集音手段の位置との間の距離と、前記イメージ取得手段の位置を基準とした前記集音手段の位置の方向と、を用いて前記集音手段の集音範囲を変更する集音範囲変更ステップを実施する、ことを特徴とする。
【発明の効果】
【0010】
本発明によると、カメラとマイクを独立して配置可能としつつ集音の品質を向上させることができる。
【図面の簡単な説明】
【0011】
【図1】本発明の実施形態に係るテレビ会議システムの構成例を示す図である。
【図2】テレビ会議システムの機能構成例を示す図である。
【図3】テレビ会議システムのハードウェア構成を示す図である。
【図4】マイクアレイ装置の構成を示す図である。
【図5】テレビ会議システムの配置例を示す図である。
【図6】マイクアレイ位置テーブルの構成例を示す図である。
【図7】マイクアレイ出力レベルテーブルの構成例を示す図である。
【図8】マイクアレイ設定処理のシーケンス図である。
【図9】マイクアレイ位置設定の初期化処理の画面例を説明する説明図である。
【図10】マイクアレイ設定算出の仕組みを説明する説明図である。
【図11】出力レベル調整テーブルの構成例を示す図である。
【図12】マイクアレイ出力レベル調整の仕組みを説明する説明図である。
【発明を実施するための形態】
【0012】
以下に、本発明に係る第一の実施形態を適用したマイクロホン制御装置を含むテレビ会議システム1について、図面を参照して説明する。
【0013】
図1は、本発明の実施形態におけるテレビ会議システム1を示す図である。本発明におけるテレビ会議システム1は、サーバー80と、ネットワーク70を介してサーバー80に接続可能な会議端末A20、会議端末B21、会議端末C22と、を含む。基本的には、会議端末A20は会議室A10に配置され、会議端末B21は会議室B11に配置され、会議端末C22は会議室C12に配置されることを想定している。
【0014】
会議端末A20には、会議端末A20と通信可能なカメラA30、マイクアレイA40、ディスプレイA50、スピーカーA60が接続される。会議端末A20は、マイクロホン制御装置として動作しうる。
【0015】
カメラA30は、映像情報をデジタルデータとして取得して会議端末A20に送信し、会議端末A20から撮影範囲の指示を受け付けて、撮影を行ういわゆるイメージ取得装置、例えばビデオカメラ等である。
【0016】
マイクアレイA40は、周囲の音を集音してデジタルデータとして取得して会議端末A20に送信し、会議端末A20から集音方向および集音感度等の指示を受け付けて、集音を行ういわゆるマイクロホンである。マイクアレイA40は、後述するが、マイクアレイA40の設置位置から放射状に全周にわたる集音範囲を持つように、所定の範囲を集音するマイクを複数配列した装置であり、マイク毎にゲイン調節が可能である。
【0017】
ディスプレイA50は、接続される会議端末A20から送信される表示情報を表示出力する。当該表示情報には、会議端末A20がカメラA30を介して取得した映像情報または他の会議端末B21または会議端末C22からネットワーク70を介して受信した映像情報等が含まれる。また、その他、ディスプレイA50は、会議端末A20から送信される設定値等の設定画面を表示することも可能である。
【0018】
スピーカーA60は、接続される会議端末A20から送信される音声情報を出力する。当該音声情報には、会議端末A20がマイクアレイA40を介して取得した音声情報または他の会議端末B21または会議端末C22からネットワーク70を介して受信した音声情報等が含まれる。また、その他、スピーカーA60は、会議端末A20から送信されるガイダンス等の音声を出力することも可能である。
【0019】
会議端末B21には、会議端末B21と通信可能なカメラB31、マイクアレイB41、ディスプレイB51、スピーカーB61が接続される。会議端末B21は、マイクロホン制御装置として動作しうる。
【0020】
カメラB31は、映像情報をデジタルデータとして取得して会議端末B21に送信し、会議端末B21から撮影範囲の指示を受け付けて、撮影を行ういわゆるイメージ取得装置、例えばビデオカメラ等である。
【0021】
マイクアレイB41は、周囲の音を集音してデジタルデータとして取得して会議端末B21に送信し、会議端末B21から集音方向および集音感度等の指示を受け付けて、集音を行ういわゆるマイクロホンである。マイクアレイB41は、後述するが、マイクアレイB41の設置位置から放射状に全周にわたる集音範囲を持つように、所定の範囲を集音するマイクを複数配列した装置であり、マイク毎にゲイン調節が可能である。
【0022】
ディスプレイB51は、接続される会議端末B21から送信される表示情報を表示出力する。当該表示情報には、会議端末B21がカメラB31を介して取得した映像情報または他の会議端末A20または会議端末C22からネットワーク70を介して受信した映像情報等が含まれる。また、その他、ディスプレイB51は、会議端末B21から送信される設定値等の設定画面を表示することも可能である。
【0023】
スピーカーB61は、接続される会議端末B21から送信される音声情報を出力する。当該音声情報には、会議端末B21がマイクアレイB41を介して取得した音声情報または他の会議端末A20または会議端末C22からネットワーク70を介して受信した音声情報等が含まれる。また、その他、スピーカーB61は、会議端末B21から送信されるガイダンス等の音声を出力することも可能である。
【0024】
会議端末C22には、会議端末C22と通信可能なカメラC32、マイクアレイC42、ディスプレイC52、スピーカーC62が接続される。会議端末C22は、マイクロホン制御装置として動作しうる。
【0025】
カメラC32は、映像情報をデジタルデータとして取得して会議端末C22に送信し、会議端末C22から撮影範囲の指示を受け付けて、撮影を行ういわゆるイメージ取得装置、例えばビデオカメラ等である。
【0026】
マイクアレイC42は、周囲の音を集音してデジタルデータとして取得して会議端末C22に送信し、会議端末C22から集音方向および集音感度等の指示を受け付けて、集音を行ういわゆるマイクロホンである。マイクアレイC42は、後述するが、マイクアレイC42の設置位置から放射状に全周にわたる集音範囲を持つように、所定の範囲を集音するマイクを複数配列した装置であり、マイク毎にゲイン調節が可能である。
【0027】
ディスプレイC52は、接続される会議端末C22から送信される表示情報を表示出力する。当該表示情報には、会議端末C22がカメラC32を介して取得した映像情報または他の会議端末A20または会議端末B21からネットワーク70を介して受信した映像情報等が含まれる。また、その他、ディスプレイC52は、会議端末C22から送信される設定値等の設定画面を表示することも可能である。
【0028】
スピーカーC62は、接続される会議端末C22から送信される音声情報を出力する。当該音声情報には、会議端末C22がマイクアレイC42を介して取得した音声情報または他の会議端末A20または会議端末B21からネットワーク70を介して受信した音声情報等が含まれる。また、その他、スピーカーC62は、会議端末C22から送信されるガイダンス等の音声を出力することも可能である。
【0029】
ネットワーク70は、本実施形態においては、いわゆるインターネット等のTCP/IP等に準拠した広域ネットワークを想定しているが、これに限られず、LAN(Local Area Network)やWAN(Wide Area Network)等のネットワークであってもよい。
【0030】
サーバー80は、ネットワーク70を介して、会議端末A20、会議端末B21、会議端末C22間のテレビ会議サービスを実現する。具体的には、例えば、サーバー80は、会議に参加する対象の会議端末間で仮想会議室を構成・管理し、参加する対象の会議端末間の通信を仲介する。なお、本実施形態においては、サーバー80は、会議端末の映像データおよび音声データを取得して他の会議端末に配信するものではなく、会議端末間の映像データと音声データの通信経路を構築するに留まる。しかし、これに限らず、会議端末間の映像データおよび音声データを集中的に取得して会議に参加する他の会議端末に配信するものであってもよい。
【0031】
図2は、テレビ会議システム1の会議室A10に配置されるカメラA30、会議端末A20、マイクアレイA40についての機能構成例を示す図である。なお、会議室B11、会議室C12についてのカメラB31、会議端末B21、マイクアレイB41、カメラC32、会議端末C22およびマイクアレイC42についても、基本的に同様の機能構成を備えるものとする。また、ディスプレイA50、スピーカーA60、ディスプレイB51、スピーカーB61、ディスプレイC52、スピーカーC62については、図示していないが、通常の機能構成を備えるものとする。
【0032】
図2に示すように、カメラA30は、パン/ズーム制御部310と、カメラ情報通知部320と、カメラ操作有効/無効制御部330と、を備える。パン/ズーム制御部310は、カメラA30が撮影する画角および撮影する方向、すなわち映像に映りこむ範囲を制御する。パン/ズーム制御部310は、具体的には、左右への振れ角の変更指示を受け付けると、指示に従って後述する光学装置35の振れ角の変更を行う。また、画角の変更指示を受け付けると、指示に従って後述する光学装置35の画角の変更を行う。
【0033】
なお、パン/ズーム制御部310は、パンまたはズームの変更指示に従うことができない場合、例えば、振れ角の変更指示によると、光学装置35の物理的な可動範囲を超えるような場合、あるいは例えば、画角の変更指示によると、光学装置35の光学的あるいは画像処理上のズーム(光学ズームあるいはデジタルズーム等)の範囲を超えるような場合には、変更可能な範囲で指示に従うよう制御する。
【0034】
カメラ情報通知部320は、所定のタイミングで振れ角(パン方向)、被写体までの距離、画角についての情報を取得して、接続されている会議端末A20に対して出力する。なお、本実施形態においては、カメラ情報通知部320は、パン/ズーム操作がなされた後、所定の時間(例えば3秒)パン/ズーム操作がなされない場合に、振れ角(パン方向)、被写体までの距離、画角についての情報を取得して、接続されている会議端末A20に対して出力するものとする。なお、本実施形態においては、振れ角(パン方向)は、台座の向き(正面)とカメラの光軸の向きの差から求められ、被写体までの距離は、所定の測距点において被写体にピントが合った状態の焦点距離から求まる距離であり、画角は、レンズ群の繰り出し量に応じて求められる画角である。
【0035】
カメラ操作有効/無効制御部330は、カメラA30に対する会議端末A20からの操作の受付の有効/無効を制御する。具体的には、カメラ操作有効/無効制御部330は、会議端末A20からカメラ操作ロック指示を受け付けると、パン/ズーム制御部310に対するパン/ズームの変更指示を受け付けないよう操作ロックを行う。また、カメラ操作有効/無効制御部330は、会議端末A20からカメラ操作ロック解除指示を受け付けると、パン/ズーム制御部310に対するパン/ズームの変更指示を受け付けるよう操作ロックの解除を行う。
【0036】
なお、カメラA30は、図示しないが、通常のカメラと同様に、画像取得を開始する指示を受け付けて画像を取得する画像取得制御部、画像取得を終了する指示を受け付けて画像取得を終了する画像取得終了制御部、取得した画像を会議端末A20等の外部装置またはカメラA30に取り付けられたメモリーカード等の記憶媒体に出力する画像出力制御部、被写体までの距離を特定する測距部、光学装置35の焦点位置(ピント)を調整するフォーカス制御部等の制御部を備える。また、カメラA30は、会議室A10のオペレーター(あるいは会議参加者)または会議相手のオペレーター(あるいは会議参加者)からパン、ズーム操作を受け付けて、パンおよびズームを行うことが可能である。
【0037】
会議端末A20は、カメラ状態検知部210と、マイクアレイ制御部220と、マイクアレイ位置データメモリ230と、カメラ操作有効/無効指示部240と、カメラ操作指示部250と、を備える。カメラ状態検知部210は、接続されたカメラA30の状態を検知する。具体的には、カメラ状態検知部210は、接続されたカメラA30から、振れ角(パン方向)、被写体までの距離、画角についての情報を取得する。さらに、カメラ状態検知部210は、カメラA30が撮影した画像内のマイクアレイA40が所定の画面内の位置に有る場合には、カメラA30の振れ角と被写体までの距離に応じて、マイクアレイA40の位置を特定する。
【0038】
マイクアレイ制御部220は、マイクアレイA40の位置と、カメラA30の被写体の位置と、画角と、に応じて、マイクアレイA40のマイクごとのゲイン調整を行う。具体的には、マイクアレイ制御部220は、マイクアレイA40の相対的な位置(カメラA30の正面方向からのパン角度と、カメラA30からマイクアレイA40までの直線距離)を記憶したマイクアレイ位置データメモリ230からマイク位置を取得する。
【0039】
そして、マイクアレイ制御部220は、カメラA30が映す被写体のカメラ位置から見た方向(振れ角に基づき特定)と、被写体までの距離と、画角と、マイク位置と、を用いて、マイク位置からみた被写体の方向を特定する。マイクアレイ制御部220は、マイク位置からみた被写体の方向に応じて、マイクアレイA40のマイクロホンごとに、予め定められたマイクゲイン調整値を含むマイクゲイン調整指示をマイクアレイA40に対して出力する。なお、本実施形態においては、カメラ画角が60°以上の場合はマイクアンプの出力レベルは調整されないようになっている。しかし、カメラ画角が60°未満になると、マイクロホンの出力レベルを増減させ、集音範囲の制御が行われる。
【0040】
マイクアレイ位置データメモリ230は、マイクアレイA40の位置を特定する情報を格納する。具体的には、マイクアレイ位置データメモリ230は、図6に示すマイクアレイ位置テーブル600と、図7に示すマイクアレイ出力レベルテーブル650とを備える。
【0041】
マイクアレイ位置テーブル600は、マイクアレイの位置を格納する。マイクアレイ位置テーブル600には、カメラAとマイクアレイA間の距離を特定する情報が格納されるカメラAとマイクアレイA間の距離601と、カメラの正面からみたマイクアレイのパン方向を特定する基準パン方向角度602と、が含まれる。例えば、基準パン方向角度602が「−5°」である場合は、カメラA30の正面からマイナス5°方向、つまり左方向に5°パンした方向にマイクアレイが存在する、ということを示す。
【0042】
マイクアレイ出力レベルテーブル650は、マイクアレイを構成するマイクごとの出力レベルを調整する情報を格納する。マイクアレイ出力レベルテーブル650は、カメラA30が撮影している画角であるカメラ画角651と、集音方向として選択されたマイクロホンの出力レベルとして設定する集音方向として選択されたマイクロホンの出力レベル652と、選択されたマイクロホンに隣接するマイクロホンの出力レベルとして設定する選択されたマイクロホンに隣接するマイクロホンの出力レベル653と、選択されたマイクロホンおよび隣接するマイクロホンを除くその他のマイクロホンの出力レベルとして設定するその他のマイクロホンの出力レベル654と、が含まれる。なお、マイクアレイ出力レベルテーブル650に格納された出力レベルは、マイクアレイA40が集音範囲の制御を実施していない状態(360°集音状態)の出力レベルを0dBとして、カメラ画角に対応する各マイクアンプの出力レベルを特定するものである。
【0043】
カメラ操作有効/無効指示部240は、カメラA30に対する会議端末A20からの操作を指示する。具体的には、カメラ操作有効/無効指示部240は、カメラA30に対してのカメラ操作ロック指示/カメラ操作ロック解除を指示する。
【0044】
カメラ操作指示部250は、カメラA30、またはネットワーク70を介して会議中の他のカメラB31またはカメラC32に対する会議端末A20からの操作を指示する。具体的には、カメラ操作指示部250は、同一の会議に参加している会議端末に接続されたカメラのうち指定されたカメラのパン/ズーム操作を受け付けると、当該操作対象のカメラに対してパン/ズームの変更指示を出力する。その際、他の会議端末に接続されたカメラが操作対象であれば、当該会議端末をあて先としてネットワーク70上に変更指示の情報が含まれる情報を送出する。
【0045】
また、カメラ操作指示部250は、ネットワーク70を介してカメラのパン/ズームの変更指示を受信すると、接続されているカメラA30に対して、当該変更指示に応じたパン/ズームの変更指示を出力する。このようにすることで、会議に参加中の各会議端末を介して、相手先会議室あるいは自会議室のカメラのパン/ズームを実施することができる。
【0046】
マイクアレイA40は、マイクゲイン制御部410と、マイクロホン420a〜マイクロホン420lと、マイクロホン420a〜420lのそれぞれに対応してマイクのゲインを調整するマイクアンプ430a〜430lと、マイクアンプ430a〜430lから得られたゲインを合成するミキサ440と、ミキサ440で得られた合成出力を音声情報に変換する音声符号化部450と、を備える。
【0047】
マイクゲイン制御部410は、マイクロホン420a〜420lの各マイクロホンについて、マイクアンプ430a〜430lのゲイン調整を行う。本実施形態においては、マイクゲイン制御部410は、会議端末A20からマイクロホン420a〜420lのゲイン調整指示を受けて、対応するマイクアンプ430a〜430lのゲインを調整する。
【0048】
音声符号化部450は、ミキサ440から出力された音声情報を所定のフレームレートでサンプリングし、音声データを出力する。当該処理は、通常の符号化処理である。
【0049】
図3は、カメラA30と、会議端末A20と、マイクアレイA40と、についてのハードウェア構成例を示す図である。なお、カメラB31、会議端末B21、マイクアレイB41、カメラC32、会議端末C22、マイクアレイC42についても、同様のハードウェア構成を備えるものとする。
【0050】
カメラA30は、本実施形態においては、いわゆる独立して動作を行うビデオカメラ装置である。しかし、これに限らず、PC(パーソナルコンピュータ)や、ワークステーション、各種携帯電話端末、PDA(Personal Digital Assistant)、スマートフォンなどに分類される計算機であってもよい。
【0051】
カメラA30は、バス131と、演算装置132と、主記憶装置133と、通信装置134と、光学装置135と、を備える。演算装置132は、例えばCPU(Central Processing Unit)などの演算装置である。
【0052】
主記憶装置133は、例えばRAM(Random Access Memory)などのメモリ装置である。
【0053】
通信装置134は、インターネットあるいはLAN等のネットワーク70に接続される装置および専用ケーブル等で接続される会議端末A20との通信を行う通信装置である。
【0054】
光学装置135は、例えばビデオカメラレンズ群およびそのフォーカス駆動部、CCDあるいはCMOS等によるイメージャおよび画像生成処理を行う画像処理部等を備えるいわゆる撮像装置である。
【0055】
演算装置132と、主記憶装置133と、通信装置134と、光学装置135とは、バス131により互いに接続される。
【0056】
上記したカメラA30のパン/ズーム制御部310は、光学装置135により実現される。また、カメラ情報通知部320およびカメラ操作有効/無効制御部330は、演算装置132に処理を行わせるプログラムによって実現される。このプログラムは、主記憶装置133または図示しないROM装置内に記憶され、実行にあたって主記憶装置133上にロードされ、演算装置132により実行される。
【0057】
会議端末A20は、本実施形態においては、独立して動作を行ういわゆる端末装置である。しかし、これに限らず、PC(パーソナルコンピュータ)や、ワークステーション、サーバー装置、各種携帯電話端末、PDA(Personal Digital Assistant)、スマートフォンなどに分類される計算機であってもよい。
【0058】
会議端末A20は、バス121と、演算装置122と、主記憶装置123と、通信装置124と、を備える。演算装置122は、例えばCPU(Central Processing Unit)などの演算装置である。
【0059】
主記憶装置123は、例えばRAM(Random Access Memory)などのメモリ装置である。
【0060】
通信装置124は、インターネットあるいはLAN等のネットワーク70に接続される装置および専用ケーブル等で接続される他の会議端末およびカメラA30、マイクアレイA40、ディスプレイA50、スピーカーA60等の接続される装置との通信を行う通信装置である。
【0061】
演算装置122と、主記憶装置123と、通信装置124とは、バス121により互いに接続される。
【0062】
上記した会議端末A20のカメラ状態検知部210、マイクアレイ制御部220およびカメラ操作有効/無効指示部240は、演算装置122に処理を行わせるプログラムによって実現される。このプログラムは、主記憶装置123または図示しないROM装置内に記憶され、実行にあたって主記憶装置123上にロードされ、演算装置122により実行される。
【0063】
また、会議端末A20のマイクアレイ位置データメモリ230は、主記憶装置123に格納されることで実現される。
【0064】
マイクアレイA40は、本実施形態においては、独立して動作を行うマイク装置である。マイクアレイA40は、バス141と、演算装置142と、主記憶装置143と、通信装置144と、集音装置145と、を備える。演算装置142は、例えばCPU(Central Processing Unit)などの演算装置である。
【0065】
主記憶装置143は、例えばRAM(Random Access Memory)などのメモリ装置である。
【0066】
通信装置144は、インターネットあるいはLAN等のネットワーク70に接続される装置および専用ケーブル等で接続される会議端末A20との通信を行う通信装置である。
【0067】
集音装置145は、例えば図4に示すような構造をしている。図4はマイクアレイ装置の構成を示す図である。マイクアレイA40は、環状に均等に配置された複数のマイクロホン420a〜420lにより構成される。一つのマイクロホン(図4ではマイクロホン420a)には、マイクアレイA40の集音方向の基準となる基準位置マーク460が外観上明確に認識可能に設けられている。
【0068】
マイクロホン420a〜420lは、夫々が集音範囲に指向性を持つ。本実施形態においては、夫々が左右各30度の放射状の範囲で集音可能なマイクロホン420a〜420lの12個が組み合わされてマイクアレイA40を構成する。そのため、マイクアレイA40は周囲360°(全方位)について集音範囲を備えるものであるといえる。
【0069】
マイクアレイA40は、全方位について集音範囲を有するものであるが、上記したように、複数のマイクロホン420a〜420lと、および各マイクロホンごとに調整を行うことができるマイクアンプ430a〜430lと、を含んで構成されるため、マイクロホンごとのゲインを調整することで、集音範囲を制御することができる。
【0070】
例えば、図4においては、発言者の方向(角度461)を基準位置マーク460を基準に特定し、当該方向に集音範囲を備えるマイクロホン420eのゲインを他のマイクロホンのゲインよりも高くすることで、より発言者の発言を集音し易く、周囲の雑音を抑えることができる。
【0071】
演算装置142と、主記憶装置143と、通信装置144と、集音装置145とは、バス141により互いに接続される。
【0072】
上記したマイクアレイA40のマイクロホン420a〜420l、マイクアンプ430a〜430lおよびミキサ440は、集音装置145により実現される。また、マイクアレイA40のマイクゲイン制御部410および音声符号化部450は、演算装置142に処理を行わせるプログラムによって実現される。このプログラムは、主記憶装置143または図示しないROM装置内に記憶され、実行にあたって主記憶装置143上にロードされ、演算装置142により実行される。
【0073】
以上が、本実施形態におけるテレビ会議システム1のハードウェア構成例である。しかし、これに限らず、その他のハードウェアを用いて構成されるものであってもよい。例えば、ネットワーク70を無線によるネットワークあるいは携帯電話網とし、会議端末とカメラ、マイクアレイ、ディスプレイ、スピーカーをBluetooth(登録商標)等の無線通信により接続可能とするものであってもよい。
【0074】
[動作の説明]次に、本実施形態におけるテレビ会議システム1の動作を説明する。図5は、本実施形態におけるテレビ会議システム1のカメラA30とマイクアレイA40についての配置例を示す図である。図5においては、マイクアレイA40を会議卓上(望ましくは、会議参加者の中心付近)、カメラA30を会議卓の片端に配置する。この時、マイクアレイA40は基準位置マーク460がカメラA30の正面に向けて設置されるものとする。
【0075】
ここで、カメラA30の正面方向を基準(0度)とし、右方向をプラス方向、左方向をマイナス方向として360度法により表すと、カメラA30からみたマイクアレイA40の設置方向501は、マイナス(−)5°、すなわちカメラA30の正面より若干左方向にマイクアレイA40が配置されているものとする。なお、マイクアレイA40の位置の基準は、基準位置マーク460の位置としている。また、カメラA30からマイクアレイA40までの距離500は、2mであるとする。
【0076】
当該情報は、後述する初期化処理において特定され、マイクアレイ位置データメモリ230のマイクアレイ位置テーブル600に格納される。
【0077】
ここで、初期化処理について説明する。まず、カメラA30によりマイクアレイA40を図9に示すようにズームアップして初期設定映像340として撮影し、焦点をマイクアレイA40の基準位置マーク460に合わせる。当該操作は、会議室A10を使用する会議参加者が適宜光学装置35を操作して実施する。
【0078】
その際、会議端末A20の図示しない制御部は、会議室A10のディスプレイA50に初期設定映像340を表示させる。制御部は、初期化処理においては映像の中心に照準の基準を示すスコープ350を重畳して表示させる。会議参加者は、スコープ350が基準位置マーク460と重なるようにカメラA30の向き(パン方向)を調整しピントを合わせる。
【0079】
カメラ情報通知部320は、被写体にピントが合った時の焦点距離に基づき、カメラA30とマイクアレイA40間の距離500および設置方向501を特定し、会議端末A20に対し通知する。
【0080】
以上が、初期化処理の流れである。初期化処理により、カメラA30からみたマイクアレイA40の位置を特定できる。
【0081】
次に、図8を用いて、会議室A10に関する会議中のマイクアレイ制御処理について説明する。マイクアレイ制御処理では、カメラが映す被写体周辺の音声を高品質に集音する。
【0082】
まず、カメラA30は、パン/ズーム操作を行う(ステップS001)。具体的には、カメラA30のカメラ操作有効/無効制御部330は、会議室A10の会議参加者による会議端末A20の操作、または会議に参加している他の会議端末B21または会議端末C22の操作に応じたカメラA30に対するパン/ズームの変更指示を受け付ける。そして、カメラ操作が有効である場合に、パン/ズーム制御部310は、受け付けた変更指示に応じたパン/ズーム操作を実現するよう光学装置35を制御する。なお、カメラ操作が無効であれば、カメラ操作有効/無効制御部330は、受け付けた変更指示を破棄し、応答しない。
【0083】
次に、カメラ情報通知部320は、規定の時間、カメラ操作がなされなかったか否かを判定する(ステップS002)。具体的には、カメラ情報通知部320は、直近に実施したステップS001のパン/ズーム操作の終了後、所定の時間(例えば、3秒)が経過したか否かを判定する。規定の時間内にカメラ操作がなされた場合、すなわち所定の時間が経っていない場合(ステップS002にて「No」の場合)には、カメラ情報通知部320は、ステップS002を再度実施する。
【0084】
規定の時間内にカメラ操作がなされなかった場合、すなわち所定の時間が経った場合(ステップS002にて「Yes」の場合)には、カメラ情報通知部320は、カメラのパン方向を特定して会議端末A20に通知し(ステップS003)、カメラと被写体との距離を特定して会議端末A20に通知し(ステップS004)、カメラが撮影している画角を特定して会議端末A20に通知する(ステップS005)。
【0085】
なお、上記したように、本実施形態においては、カメラ情報通知部320は、パン方向は、台座の向き(正面)とカメラの光軸の向きの差から特定し、被写体までの距離は、所定の測距点において被写体にピントが合った状態の焦点距離から求め、画角は、レンズ群の繰り出し量に応じて求める。
【0086】
会議端末A20のカメラ状態検知部210が、ステップS003〜S005による通知を受け付けると、カメラ操作有効/無効指示部240は、カメラ操作ロック指示をカメラA30に対して行う(ステップS006)。
【0087】
カメラA30のカメラ操作有効/無効制御部330は、ステップS006においてカメラ操作ロック指示を受け付けると、パン/ズームの操作を無効に設定する(ステップS007)。
【0088】
会議端末A20のマイクアレイ制御部220は、後述するマイクアレイ設定算出処理を実施する(ステップS008)。
【0089】
そして、マイクアレイ制御部220は、マイクアレイ設定算出処理により特定したマイクゲインの設定値を含むマイクゲイン設定指示をマイクアレイA40のマイクゲイン制御部410に対して行う(ステップS009)。
【0090】
マイクアレイA40のマイクゲイン制御部410は、マイクゲイン設定処理を実施する(ステップS010)。具体的には、マイクゲイン制御部410は、ステップS009において指示されたマイクゲイン設定指示に応じて、マイクアンプ430a〜430lのそれぞれに対してマイクゲインを設定する。
【0091】
カメラ操作有効/無効指示部240は、カメラ操作ロック解除指示をカメラA30に対して行う(ステップS011)。
【0092】
カメラA30のカメラ操作有効/無効制御部330は、ステップS011においてカメラ操作ロック解除指示を受け付けると、カメラ操作ロック解除処理を行う(ステップS012)。具体的には、カメラ操作有効/無効制御部330は、パン/ズームの操作を有効に受け付ける状態へ移行する。
【0093】
以上が、マイクアレイ制御処理の流れである。マイクアレイ制御処理によると、左右へのパン動作可能なイメージ取得手段の位置とイメージ取得手段により取得されるイメージに映りこむ被写体の位置との間の距離と、イメージ取得手段のパンの方向と、イメージ取得手段の位置と集音範囲を変更可能な集音手段の位置との間の距離と、イメージ取得手段の位置を基準とした集音手段の位置の方向と、を用いて集音手段の集音範囲を変更することができる。すなわち、カメラとマイクが独立して配置されている状態において、被写体の方向にマイク感度を高めることができるため、集音の品質を向上させることができるといえる。
【0094】
次に、図10を用いて、上記マイクアレイ制御処理のステップS008にて実施するマイクアレイ設定算出処理の処理およびその原理について説明する。本説明においては、図10に示すような配置で会議がなされている前提とする。すなわち、図5に示したカメラA30とマイクアレイA40の配置がなされている状態で、発言者に向けられたカメラA30の光軸方向(パン角度503)と、カメラA30からみたマイクアレイA40の方向(設置方向501)と、の差分を差分角α504とする。すなわち、カメラA30の正面からのパン角度503は、設置方向501と、差分角α504とを合成した角度とする。
【0095】
また、マイクアレイA40と被写体との距離を距離aとし、被写体とカメラA30との距離を距離b502とし、カメラA30とマイクアレイA40との距離をc500とする。また、カメラA30の撮影する画角505は、発言者が十分に視野に捕捉可能な画角であるとする。
【0096】
また、発言者からみたマイクアレイA40の方向と、カメラA30の方向と、の差分の角度を差分角γとし、マイクアレイA40からみた発言者の方向と、カメラA30の方向と、の差分の角度を差分角βとする。
【0097】
上記のように配置される場合において、距離a、距離b502、距離c500および差分角α504、差分角β、差分角γの間では、余弦定理90(下記式1、式2、式3)の関係が成立する。
【0098】

【0099】

【0100】

【0101】
すなわち、上記の関係が成立するといえる。そのため、マイクアレイ制御部220は、上記式1、式2、式3の式を解くことで、マイクアレイA40が集音する方向(すなわち、差分角β)を特定する。
【0102】
本実施形態においては、マイクアレイ制御部220は、ステップS003にてパン方向を、ステップS004にてカメラA30から被写体までの距離を、ステップS005にて画角の情報を受け取っており、初期化処理において格納したマイクアレイ位置テーブル600のカメラAとマイクアレイA間の距離601と、基準パン方向角度602とを読み出すことができる。マイクアレイ制御部220は、パン方向と基準パン方向角度602との差から差分角α504を特定し、カメラA30から被写体までの距離を距離b502として特定し、カメラAとマイクアレイA間の距離601を距離c500として特定し、余弦定理90の各式に代入することで、差分角βを算出する。
【0103】
そして、マイクアレイ制御部220は、差分角βの方向が含まれるマイクロホン420を集音方向のマイクロホンとして特定し、当該マイクロホンに隣接するマイクロホン420についても特定する。そして、ステップS005にて受け取った画角の情報と、マイクアレイ出力レベルテーブル650の情報と、を用いてマイクアンプ430の出力レベル(マイクゲイン設定値)を特定する。なお、集音方向のマイクロホンの感度(ゲイン)を他のいずれのマイクロホンの感度よりも高く設定し、集音方向のマイクロホンおよび集音方向のマイクロホンに隣接するマイクロホン以外のマイクロホンの感度(ゲイン)を他のいずれのマイクロホンの感度よりも低く設定することで、より発言者の発言内容を高品質に得ることができる。
【0104】
以上が、マイクアレイ設定算出処理の原理および処理内容である。
【0105】
以上、本発明に係る第一の実施形態を適用したマイクロホン制御装置を含むテレビ会議システム1について説明した。第一の実施形態を適用したマイクロホン制御装置である会議端末A20、B21、C22によると、カメラとマイクが独立して配置されている状態において、被写体の方向にマイク感度を高めることができるため、集音の品質を向上させることができるといえる。
【0106】
本発明は、上記第一の実施形態に制限されない。上記第一の実施形態は、本発明の技術的思想の範囲内で様々な変形が可能である。例えば、上記第一の実施形態においては、会議端末A20は、画角に応じて集音方向のマイクアンプの出力レベルを特定している。しかし、これに限られず、マイクアレイから発言者までの距離に応じて出力レベルを調整するようにしてもよい。例えば、図11に示す出力レベル調整テーブル700をマイクアレイ位置データメモリ230に格納しておき、マイクアレイ設定算出処理において算出した出力レベルを調整ようにしてもよい。これにより、より適切な出力レベルを設定することができるため、適切な音質を確保することができるといえる。
【0107】
具体的に説明すると、出力レベル調整テーブル700は、マイクアレイから発言者までの距離701に応じて、集音方向として選択されたマイクロホンの出力レベル702が対応付けて記憶されている。マイクアレイ制御部220は、マイクアレイA40から発言者までの距離、すなわち距離aを余弦定理90により算出すると、出力レベル調整テーブル700を用いて当該距離aに応じてマイクロホンの出力レベルを取得する。なお、マイクアレイ制御部220は、マイクアレイ出力レベルテーブル650と画角とを用いて特定した集音方向のマイクロホンの出力レベル以下の範囲内で、出力レベルを設定するものとする。そして、マイクアレイ制御部220は、取得した出力レベルでマイクゲイン設定指示を行う。
【0108】
すなわち、当該変形実施形態によると、マイクアレイA40の集音方向、集音範囲の制御だけでなく、発言者の背景雑音低減をも行うことができるといえる。
【0109】
例を挙げると、図12に示すように、マイクアレイA40の集音可能範囲520が会議参加者の着座位置に対して十分に広い範囲であるとする。この場合、第一の実施形態におけるマイクロホン制御装置での集音範囲制御実施後のマイクアレイA40の集音範囲は制御後の集音範囲521となる。この時、集音方向として選択されたマイクロホン420の出力レベルを、図11で示されるテーブルを用いて低減させることにより、マイクアレイA40の集音範囲は集音範囲522に減少する。つまり、発言者の背後に発生する雑音を低減することができる。
【0110】
ここまで説明した実施形態においては、マイクアレイA40を会議卓上に配置し、カメラA30を会議卓端に配置するものとしているが、マイクアレイA40の集音範囲内、カメラA30の撮影範囲内であって、かつカメラA30で撮影可能な位置に会議参加者がいるのであれば、それぞれをどこに置いても構わない。また、本実施例において説明した会議端末A20内の各部の機能を、カメラA30またはマイクアレイA40に分散させて内蔵し、カメラA30とマイクアレイA40間で連携して処理を行うようにしても良い。さらに、本発明はテレビ会議システムだけではなく、ネットワーク監視カメラを用いた監視システムでも同様に適用することができる。
【0111】
また、上記した実施形態の変形は、単独で適用されてもよいし、部分的に組み合わされて適用されるようにしてもよい。
【0112】
以上、本発明について、実施形態を中心に説明した。なお、上記の実施形態では、インターネット等の通信はHTTPやFTP、SIP、POP、SMTP、TCP/IP等の既存のプロトコルによる通信を想定しているが、これに限らず、他のプロトコルによる通信であってもよい。
【符号の説明】
【0113】
1・・・テレビ会議システム、10・・・会議室A、11・・・会議室B、12・・・会議室C、20・・・会議端末A、21・・・会議端末B、22・・・会議端末C、30・・・カメラA、31・・・カメラB、32・・・カメラC、40・・・マイクアレイA、41・・・マイクアレイB、42・・・マイクアレイC、50・・・ディスプレイA、51・・・ディスプレイB、52・・・ディスプレイC、60・・・スピーカーA、61・・・スピーカーB、62・・・スピーカーC、70・・・ネットワーク、80・・・サーバー、90・・・余弦定理、340・・・初期設定映像、350・・・スコープ、420a-420l・・・マイクロホン、430a-430l・・・マイクアンプ、500・・・距離c、501・・・設置方向、502・・・距離b、503・・・パン角度、504・・・差分角α、505・・・画角、520・・・集音可能範囲、521・・・集音範囲、522・・・集音範囲、600・・・マイクアレイ位置テーブル、650・・・マイクアレイ出力レベルテーブル、700・・・出力レベル調整テーブル

【特許請求の範囲】
【請求項1】
左右へのパン動作可能なイメージ取得手段と、
集音範囲を変更可能な集音手段と、を制御する制御装置であって、
前記イメージ取得手段の位置と前記イメージ取得手段により取得されるイメージに映りこむ被写体の位置との間の距離と、前記イメージ取得手段のパンの方向と、前記イメージ取得手段の位置と前記集音手段の位置との間の距離と、前記イメージ取得手段の位置を基準とした前記集音手段の位置の方向と、を用いて前記集音手段の集音範囲を変更する集音範囲変更手段を備える、
ことを特徴とする制御装置。
【請求項2】
請求項1に記載の制御装置であって、
前記集音範囲変更手段は、
前記集音手段の位置からみた前記被写体の方向を特定して当該方向に集音範囲を変更する、
ことを特徴とする制御装置。
【請求項3】
請求項1または2に記載の制御装置であって、
前記集音範囲変更手段は、
前記集音手段の位置と前記被写体との間の距離を求め、当該距離に応じて前記集音手段のゲインを調整する、
ことを特徴とする制御装置。
【請求項4】
請求項1〜3のいずれか一項に記載の制御装置であって、
前記集音手段は、所定の集音範囲を有する複数のマイクロホンを備え、
前記集音範囲変更手段は、前記マイクロホンごとのゲインを調整することで集音範囲を変更する、
ことを特徴とする制御装置。
【請求項5】
請求項4に記載の制御装置であって、
前記集音範囲変更手段は、前記被写体の方向を集音するマイクロホンのゲインを、他の方向を集音するマイクロホンのゲインよりも高く設定する、
ことを特徴とする制御装置。
【請求項6】
請求項1〜5のいずれか一項に記載の制御装置であって、
前記集音範囲変更手段は、前記イメージ取得手段から画角を特定する情報を取得し、取得した画角に応じて前記集音範囲を変更する、
ことを特徴とする制御装置。
【請求項7】
請求項6に記載の制御装置であって、
前記集音範囲変更手段は、前記画角が狭いほど前記集音範囲の感度を高めて集音する、
ことを特徴とする制御装置。
【請求項8】
請求項1〜7のいずれか一項に記載の制御装置であって、
前記集音範囲変更手段は、前記イメージ取得手段の位置を基準とした前記集音手段の位置の方向に基づき、前記イメージ取得手段のパンの方向との差分を算出し、余弦定理を用いて被写体の方向を特定し、前記集音範囲を変更する、
ことを特徴とする制御装置。
【請求項9】
請求項1〜8のいずれか一項に記載の制御装置であって、
前記集音範囲変更手段は、前記イメージ取得手段のパン動作が所定の時間なされない場合に、前記集音範囲の変更を行う、
ことを特徴とする制御装置。
【請求項10】
請求項1〜9のいずれか一項に記載の制御装置であって、
前記集音範囲変更手段は、前記集音範囲の変更を行う間、前記イメージ取得手段のパン動作を無効にする、
ことを特徴とする制御装置。
【請求項11】
左右へのパン動作手段を備える撮像装置と、
集音範囲の変更手段を備える集音装置と、
前記撮像装置および前記集音装置を制御する制御装置と、を備え、
前記制御装置は、
前記撮像装置の位置と前記撮像装置により取得される映像に映りこむ被写体の位置との間の距離と、前記撮像装置のパンの方向と、前記撮像装置の位置と前記集音装置の位置との間の距離と、前記撮像装置の位置を基準とした前記集音装置の位置の方向と、を用いて前記集音装置の集音範囲を変更するよう指示する集音範囲変更指示手段を備える、
ことを特徴とする制御システム。
【請求項12】
左右へのパン動作を行うパン動作手段と、
撮影している画角を変更する動作を行う画角変更動作手段と、
パン方向を特定するパン方向情報を取得するパン方向情報取得手段と、
被写体までの距離を特定する距離情報を取得する距離情報取得手段と、
撮影している画角を特定する画角情報を取得する画角情報取得手段と、
前記パン方向情報と、前記距離情報と、前記画角情報と、を出力する出力手段と、を備え、
前記出力手段は、前記パン動作手段および前記画角変更動作手段のいずれの動作も終了して所定の時間経過した場合に、前記出力を行う、
ことを特徴とする撮像装置。
【請求項13】
左右へのパン動作可能なイメージ取得手段と、
集音範囲を変更可能な集音手段と、を制御する制御装置の制御方法であって、
前記制御装置は、
前記イメージ取得手段の位置と前記イメージ取得手段により取得されるイメージに映りこむ被写体の位置との間の距離と、前記イメージ取得手段のパンの方向と、前記イメージ取得手段の位置と前記集音手段の位置との間の距離と、前記イメージ取得手段の位置を基準とした前記集音手段の位置の方向と、を用いて前記集音手段の集音範囲を変更する集音範囲変更ステップを実施する、
ことを特徴とする制御方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate


【公開番号】特開2012−186551(P2012−186551A)
【公開日】平成24年9月27日(2012.9.27)
【国際特許分類】
【出願番号】特願2011−46686(P2011−46686)
【出願日】平成23年3月3日(2011.3.3)
【出願人】(000005108)株式会社日立製作所 (27,607)
【Fターム(参考)】