説明

カメラシステムおよびその制御方法

【課題】高操作性を確保しつつ、ミスコミュニケーションの発生を軽減することができないという問題を解決することが可能なカメラシステムを提供する。
【解決手段】画像処理部16は、カメラ11で撮像された撮像画像に対して、その撮像画像内の所定領域を加工する画像処理を行って、加工画像を生成する。表示部は、加工画像を表示する。操作部は、カメラの向きを示す操作コマンドを受け付ける。モータ制御部18は、操作コマンドに応じてカメラ11の向きを調整する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、カメラシステムおよびその制御方法に関し、特には、遠隔地に配置されたロボット装置を用いたカメラシステムおよびその制御方法に関する。
【背景技術】
【0002】
近年、伝染病によるパンデミック対策、CO2削減および経費節減などのために、移動が制限されることが多くなっていることに伴って、遠隔地にいる人とコミュニケーションを行う遠隔地コミュニケーションのニーズが高まっている。
【0003】
遠隔地コミュニケーションを行うための手段としては、電話装置のような音声でコミュニケーションを行う音声デバイスや、音声および画像でコミュニケーションを行うTV会議システムなどが利用されている。しかしながら、音声デバイスだけでは、表情や振る舞いなどのような、言語に依存しないノンバーバルコミュニケーションを行うことができないため、正確な意図が伝わらないミスコミュニケーションが多くなる。また、TV会議システムの場合、ある程度のノンバーバルコミュニケーションを行うことができるが、TV会議の参加者同士の視線が合わないことが多く、情報が誰に向かって発せられたのかが明確ではなく、参加者に違和感を与えることがある。
【0004】
これに対して、音声デバイスとロボットを用いることで、音声を使用したコミュニケーションとノンバーバルコミュニケーションとを両立することが可能なロボットシステムが提案されている。ロボットシステムは、ノンバーバルコミュニケーションの中でも重要とされる、視線の向きや頷きなどをロボットに再生させることで、TV会議システムを使用するコミュニケーションよりも正確なコミュニケーションを目指している。
【0005】
ロボットシステムでは、通常、ロボットとは別の場所にいる遠隔地利用者が、ロボットに備わったカメラで撮像された映像を見ながらロボットを操作する(特許文献1参照)。このようなロボットシステムにおいて、人型のロボットの頭部にカメラが設けられていれば、遠隔地利用者は、ロボットの頭部の向きを動かして、自身の注目箇所にカメラを向けることで、ロボットの視線を注目箇所に向けることができる。このため、注目箇所をロボットの視線(ロボットの頭部の向き)を通じて対話相手に把握させることができる。
【0006】
しかしながら、ロボットに備わったカメラで撮像した映像と、実際にロボットの場所にいる人間の目に映る映像とには、見え方に差異があり、その差異がロボットの操作に影響を与え、正確な意図がロボットを通じて対話相手に伝わらないことがある。
【0007】
例えば、通常、ロボットの操作性を高くするためにカメラの視野角は広くなっているので、カメラで撮像された映像は、人間の目にはぼやけて映ったり、または映らなかったりする端の方まで鮮明に見えてしまう。このため、遠隔地利用者がロボットの視線が向いていない箇所に注目してしまうことがある。この場合、対話相手は遠隔地利用者の注目箇所が分からないので、遠隔地利用者の意図を把握できず、ミスコミュニケーションが発生することがある。
【0008】
これに対して特許文献2には、遠隔地利用者がカメラの視野角を調整することができるロボット装置が記載されている。このロボット装置を用いて、カメラで撮像した映像と人間の目に映る映像とが一致するように視野角が調整されれば、遠隔地利用者がロボットの視線が向いていない箇所に注目することを軽減することができる。
【先行技術文献】
【特許文献】
【0009】
【特許文献1】特開2004−255552号公報
【特許文献2】特開2002−46088号公報
【発明の概要】
【発明が解決しようとする課題】
【0010】
しかしながら、特許文献2に記載のロボット装置を用いてカメラの視野角が調整されて狭くなると、遠隔地利用者は視野角外の状況を把握することが困難になるため、ロボットの操作性が低くなるという問題がある。このため、高操作性を確保しつつ、ミスコミュニケーションの発生を軽減することができない。
【0011】
本発明の目的は、上記の課題である、高操作性を確保しつつ、ミスコミュニケーションの発生を軽減することができないという問題を解決することが可能なカメラシステムおよびその制御方法を提供することである。
【課題を解決するための手段】
【0012】
本発明によるカメラシステムは、カメラと、前記カメラで撮像された撮像画像に対して、当該撮像画像内の所定領域を加工する画像処理を行った加工画像を生成する画像処理部と、前記加工画像を表示する表示部と、前記カメラの向きを示すコマンドを受け付ける操作部と、前記コマンドに応じて前記カメラの向きを調整する調整部と、を有する。
【0013】
本発明によるカメラシステムの制御方法は、カメラを備えたカメラシステムの制御方法であって、前記カメラで撮像された撮像画像に対して、当該撮像画像内の所定領域を加工する画像処理を行った加工画像を生成し、前記加工画像を表示し、前記カメラの向きを示すコマンドを受け付け、前記コマンドに応じて前記カメラの向きを調整する。
【発明の効果】
【0014】
本発明によれば、高操作性を確保しつつ、ミスコミュニケーションの発生を軽減することが可能になる。
【図面の簡単な説明】
【0015】
【図1】本発明の第1の実施形態のカメラシステムを示す図である。
【図2】ロボットの外形の一例を示す正面図である。
【図3】ロボットの機能的な構成の一例を示す図である。
【図4】ユーザ端末の機能的な構成の一例を示す図である。
【図5】カメラシステムの動作の一例を説明するためのフローチャートである。
【図6】元画像と加工画像とを比較するための図である。
【図7】カメラシステムの動作の他の例を説明するためのフローチャートである。
【図8】ロボットの機能的な構成の他の例を示す図である。
【発明を実施するための形態】
【0016】
以下、本発明の実施形態について図面を参照して説明する。なお、以下の説明では、同じ機能を有するものには同じ符号を付け、その説明を省略する場合がある。
【0017】
図1は、本発明の第1の実施形態のカメラシステムを示す図である。図1において、カメラシステムは、ロボット1と、ユーザ端末2とを有する。また、ロボット1およびユーザ端末2は、インターネットなどの通信網3を介して相互に通信可能に接続されている。
【0018】
ロボット1は、人型のロボット装置であり、図2で示すように、回転可能な頭部10を有し、カメラ11の向きがロボット1の視線の向きと一致するように、頭部10の目に当たる箇所にカメラ11が設けられている。なお、頭部10は、胴体部10’の上に設けられている。
【0019】
ユーザ端末2は、ロボット1を操作するための端末装置である。
【0020】
以下では、ロボット1は、会議室に配置され、ユーザ端末2は、会議室で行われる会議の遠隔参加者であるユーザ4の自宅に配置されているものとする。また、ユーザ4は、ユーザ端末2を用いてロボット1を操作して、会議の室内参加者である複数人(図1では3人)の対話相手5〜7とコミュニケーションを行うものとする。
【0021】
図3は、ロボット1の機能的な構成を示す図である。図3において、ロボット1は、頭部10と、カメラ11と、モータ12と、頭角度検出部13と、メモリ書き込み制御部14と、画像メモリ15と、画像処理部16と、情報送受信部17と、モータ制御部18とを有する。
【0022】
頭部10は、所定の軸を中心として回転可能な回転動作体である。所定の軸は、特に限定されない。本実施形態では、所定の軸は、頭部10から胴体部10’に向かう方向に延伸された軸であるとする。この場合、頭部10は左右に動作することになる。
【0023】
カメラ11は、周囲を撮像する撮像部である。なお、カメラ11としては、視野角の広い広角カメラが使用されているものとする。
【0024】
モータ12は、頭部10を回転させる駆動部である。モータ12が頭部10を回転させると、その回転に応じてカメラ11の向きが変化する。
【0025】
頭角度検出部13は、ロボット1の頭部10の回転角度を検出する。
【0026】
メモリ書き込み制御部14は、カメラ11で撮像された撮像画像に、頭角度検出部13で検出された回転角度を付加して画像メモリ15に記録する。
【0027】
画像処理部16は、画像メモリ15に記録された撮像画像に対して、その撮像画像内の所定領域を加工する画像処理を行って、撮像画像から加工画像を生成する。所定領域は、撮像画像の中央部を除いた左右の領域や、撮像画像の中央部を除いた左右および上下の領域などである。
【0028】
画像処理としては、例えば、所定領域の鮮明度を下げて所定領域内をぼやかす処理や、所定領域に半透明のマスクを合成する処理などが挙げられる。
【0029】
また、画像処理は、所定領域に対して画像認識処理を行い、所定領域内の予め定められた対象物(例えば、人間など)を特定し、その対象物を変化させる処理でもよい。対象物を変化させる処理としては、例えば、対象物を輪郭のみにする処理や、対象物をデフォルメまたは抽象化する処理などが挙げられる。また、対象物のデフォルメまたは抽象化する方法としては、対象物の輪郭の曲線部を直線で近似する方法などが挙げられる。
【0030】
さらに、画像処理は、所定領域内の対象物の位置を示す位置情報を作成し、所定領域内に位置情報のみを示すようにする処理などでもよい。また、画像処理は、上記の例を組み合わせたものでもよい。
【0031】
情報送受信部17は、画像処理部16にて生成された加工画像をユーザ端末2に送信する。また、情報送受信部17は、ユーザ端末2から、ロボットを操作するための操作コマンドを受信する。操作コマンドは、より具体的には、頭部10の回転角度、つまり、カメラ11の向きを示す。
【0032】
モータ制御部18は、情報送受信部17が受信した操作コマンドに応じて、頭部10を回転させてカメラ11の向き(ロボット1の視線)を調整する。より具体的には、モータ制御部18は、操作コマンドが示す回転角度だけ頭部10が回転するようにモータ12を駆動して、カメラ11の向きを調整する。したがって、モータ12およびモータ制御部18は、操作コマンドに応じてカメラ11の向きを調整する調整部を構成することになる。
【0033】
図4は、ユーザ端末2の機能的な構成を示す図である。図4において、ユーザ端末2は、情報送受信部21と、表示処理部22と、表示部23と、操作部24と、入力処理部25とを有する。
【0034】
情報送受信部21は、ロボット1から加工画像を受信する。
【0035】
表示処理部22は、情報送受信部21が受信した加工画像を表示部23に表示する。
【0036】
操作部24は、ユーザから操作コマンドを受け付ける。
【0037】
入力処理部25は、操作部24が受け付けた操作コマンドを、情報送受信部21を介してロボット1に送信する。
【0038】
次に動作を説明する。
【0039】
図5は、カメラ11で撮像された撮像画像を表示部23に表示する際のカメラシステムの動作の一例を説明するためのフローチャートである。
【0040】
先ず、ロボット1の頭部10に備わったカメラ11が周囲を撮像して撮像画像を取得し、その撮像画像をメモリ書込み制御部14に出力する(ステップS51)。
【0041】
メモリ書込み制御部14は、撮像画像を受け付けると、頭部10の回転角度を頭角度検出部13から取得して撮像画像に付加し、その回転角度が付加された撮像画像を画像メモリ15に書き込む(ステップS52)。
【0042】
画像処理部16は、画像メモリ15に撮像画像が書き込まれたことを検出し、画像メモリ15から撮像画像を取得する。画像処理部16は、その撮像画像に対して画像処理を行い、その画像処理を行った撮像画像である加工画像を情報送受信部17に出力する(ステップS53)。
【0043】
図6は、画像処理前の撮像画像である元画像と、画像処理後の撮像画像である加工画像との一例を示す図である。なお、画像処理としては、所定領域に半透明のマスクを付加する処理が用いられている。
【0044】
図6で示したように、元画像61では、横に並んだ対話相手5〜7が全て鮮明に映されているが、加工画像62では、対話相手5〜7のうち、中央にいる対話相手6は鮮明に映っているが、所定領域63内に映っている対話相手5および7は、ぼやけている。
【0045】
図5の説明に戻る。情報送受信部17は、加工画像を受け付けると、その加工画像を通信網3を介してユーザ端末2の情報送受信部21に送信する(ステップS54)。
【0046】
情報送受信部21は、加工画像を受信すると、その加工画像を表示処理部22に出力する。表示処理部22は、加工画像を受け付けると、その加工画像を表示部23に表示する(ステップS55)。
【0047】
図7は、ロボット1の操作に係るカメラシステムの動作の一例を説明するためのフローチャートである。
【0048】
先ず、入力処理部25は、操作部24に対して操作コマンドの入力操作があったか否かを確認する(ステップS71)。
【0049】
入力操作があった場合、入力処理部25は、その操作コマンドを情報送受信部21に出力する。情報送受信部21は、操作コマンドを受け付けると、その操作コマンドを通信網3を介してロボット1の情報送受信部17に送信する(ステップS72)。
【0050】
情報送受信部17は、操作コマンドを受信すると、その操作コマンドをモータ制御部18に出力する。モータ制御部18は、操作コマンドを受け付けると、その操作コマンドが示す回転角度だけ頭部10が回転するようにモータ12を駆動する(ステップS73)。このモータ12の駆動によって頭部10が回転し、カメラ11の向きが変化する(ステップS74)。
【0051】
以上説明したように本実施形態によれば、画像処理部16は、カメラ11で撮像された撮像画像に対して、その撮像画像内の所定領域を加工する画像処理を行って、加工画像を生成する。また、表示部23は、加工画像を表示する。操作部24は、カメラの向きを示す操作コマンドを受け付ける。モータ制御部18は、操作コマンドに応じてカメラ11の向きを調整する。
【0052】
したがって、撮像画像内の所定領域が加工された加工画像が表示されるので、ユーザ4が所定領域内に映っている人物の表情などを正確に把握することが困難になる。このため、ユーザ4は、所定領域に映っている人物の表情を見る場合には、操作コマンドを入力してカメラ11の向きを所定領域内に映っている人物に向ける必要がある。したがって、カメラ11がユーザ4の注目箇所に向くことになり、対話相手はユーザ4の注目箇所をカメラ11の向きから把握することが可能になる。このため、ミスコミュニケーションの発生を軽減することができる。
【0053】
また、光学的なフィルターなどを用いて、カメラ11の視野角を調整する場合とは異なり、ユーザ4は所定領域内の人間の存在の有無や大まかな動きなどを把握することができる。このため、所定領域が人間の周辺視野のような役割を果たし、所定領域内の変化に合わせてカメラ11を動かすことなどができるため、高操作性を確保することが可能になる。
【0054】
また本実施形態では、カメラ11がロボット1の頭部10に設けられているので、カメラ11の向きとロボットの視線とを合わせることができる。このため、対話相手は、容易かつ直感的にユーザ4が注目している箇所を把握することができる。
【0055】
次に本発明の第2の実施形態について説明する。
【0056】
図8は、本実施形態のロボット1の機能的な構成を示す図である。図8で示されたロボット1は、図1で示した構成に加えて、音声取得部81と、音声処理部82とをさらに有する。
【0057】
音声取得部81は、周囲の音声を音声データとして取得する。
【0058】
音声処理部82は、音声取得部81が取得した音声データに基づいて、音声データが示す音声の音源の方向である音源方向を特定する。
【0059】
例えば、音声取得部81は複数の位置のそれぞれに設けられた複数のマイクを有し、音声処理部82は、各マイクで取得された各音声データの時間差を算出し、その時間差に基づいて、音源方向を特定する。
【0060】
モータ制御部18は、音声処理部82で特定された音源方向に応じてモータ12を駆動させることで、頭部10を回転させて、カメラ11の向きを調整する。
【0061】
例えば、モータ制御部18は、音源方向と頭部10の回転角度との対応関係を示すテーブルを予め保持しておく。なお、音源方向と頭部10の回転角度との対応関係は、カメラ11の向きが音源方向を向くように決定されているものとする。
【0062】
そして、モータ制御部18は、テーブルを用いて、音源方向に対応する回転角度を求め、その回転角度だけ頭部10が回転するようにモータ12を駆動して、カメラ11を音源方向に向ける。
【0063】
以上説明したように本実施形態では、音源方向に応じてカメラ11の向きを調整されるので、カメラ11をユーザ4が注目することが多い発言者の顔などに向けることが可能になる。このため、ユーザ4が操作コマンドを入力しなくても、カメラ11の向きを調整することができるので、操作性を向上させることが可能になる。
【0064】
また、画像処理部16は、撮像画像に対して画像認識処理行い、撮像画像内の予め定められた検出対象物(例えば、人間の顔など)の位置を特定する。そして、モータ制御部18は、その検出対象物の位置に応じて、モータ12を駆動させることで頭部10を回転させて、カメラ11向きを調整してもよい。
【0065】
例えば、画像処理部16は、撮像画像の中心点からの検出対象物までの距離と方向とを検出対象物の位置として示すコマンドをモータ制御部18に出力する。モータ制御部18は、そのコマンドが示す距離および方向に基づいて、カメラ11が検出対象物を向くような回転角度を求め、その回転角度だけ頭部10が回転するようにモータ12を駆動して、カメラ11を検出対象物に向ける。
【0066】
この場合、検出対象物の位置に応じてカメラの向きが調整されるので、カメラ11をユーザ4が注目することが多い対話相手の顔などに向けることが可能になる。このため、ユーザ4が操作コマンドを入力しなくても、カメラ11の向きを調整することができるので、操作性を向上させることが可能になる。
【0067】
以上説明した各実施形態において、図示した構成は単なる一例であって、本発明はその構成に限定されるものではない。
【0068】
例えば、カメラ11は、広角カメラの代わりに、複数のカメラ装置で構成されてもよい。この場合、画像処理部16は、例えば、各カメラ装置で撮像された複数の撮像画像を合成して大きな画像を生成し、その大きな画像に対して画像処理を行って加工画像を生成する。
【0069】
また、画像メモリ15が過去の撮像画像をさらに記録し、画像処理部16は、画像メモリ15内の過去の撮像画像と現在の撮像画像を合成してもよい。このとき、撮像画像のみをリアルタイムに更新し、過去の撮像画像は一定にしておいたり、周期的に変更したりしてもよい。
【0070】
また、画像処理部16はユーザ端末2に備わっていてもよい。
【符号の説明】
【0071】
1 ロボット
2 ユーザ端末
3 通信網
10 頭部
10’ 胴体部
11 カメラ
12 モータ
13 頭角度検出部
14 メモリ書き込み制御部
15 画像メモリ
16 画像処理部
17、21 情報送受信部
18 モータ制御部
22 表示処理部
23 表示部
24 操作部
25 入力処理部
81 音声取得部
82 音声処理部

【特許請求の範囲】
【請求項1】
カメラと、
前記カメラで撮像された撮像画像に対して、当該撮像画像内の所定領域を加工する画像処理を行って、加工画像を生成する画像処理部と、
前記加工画像を表示する表示部と、
前記カメラの向きを示すコマンドを受け付ける操作部と、
前記コマンドに応じて前記カメラの向きを調整する調整部と、を有するカメラシステム。
【請求項2】
前記画像処理は、前記所定領域の鮮明度を下げる処理を含む、請求項1に記載のカメラシステム。
【請求項3】
前記画像処理は、前記所定領域に映されている予め定められた対象物を変化させる処理を含む、請求項1または2に記載のカメラシステム。
【請求項4】
前記画像処理は、前記所定領域にマスクを合成する処理を含む、請求項1ないし3のいいずれか1項に記載のカメラシステム。
【請求項5】
胴体部と、前記胴体部の上に設けられた回転可能な頭部と、を有するロボット装置をさらに有し、
前記カメラは、前記頭部に設けられ、
前記調整部は、前記頭部を回転させて前記カメラの向きを調整する、請求項1ないし4のいずれか1項に記載のカメラシステム。
【請求項6】
前記ロボット装置と通信可能な端末装置を更に有し、
前記ロボット装置は、前記調整部および前記画像処理部を有し、
前記端末装置は、前記操作部と前記表示部とを有する、請求項5に記載のカメラシステム。
【請求項7】
前記ロボット装置は、音声取得部と、音声処理部とをさらに有し、
前記音声取得部は、周囲の音声を音声データとして取得し、
前記音声処理部は、前記音声データに基づいて、前記音声の音源の方向を特定し、
前記調整部は、前記音源の方向に応じて、前記カメラの向きを調整する、請求項5または6に記載のカメラシステム。
【請求項8】
前記画像処理部は、前記撮像画像内の予め定められた検出対象物の位置を特定し、
前記調整部は、前記検出対象物の位置に応じて、前記カメラの向きを調整する、請求項1ないし7のいずれか1項に記載のカメラシステム。
【請求項9】
カメラを備えたカメラシステムの制御方法であって、
前記カメラで撮像された撮像画像に対して、当該撮像画像内の所定領域を加工する画像処理を行った加工画像を生成し、
前記加工画像を表示し、
前記カメラの向きを示すコマンドを受け付け、
前記コマンドに応じて前記カメラの向きを調整する、カメラシステムの制御方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate


【公開番号】特開2012−175136(P2012−175136A)
【公開日】平成24年9月10日(2012.9.10)
【国際特許分類】
【出願番号】特願2011−31945(P2011−31945)
【出願日】平成23年2月17日(2011.2.17)
【出願人】(000004237)日本電気株式会社 (19,353)
【Fターム(参考)】