説明

テレビ電話機

【課題】撮像画像をそのまま送信したくないときは撮像画像が送信されることを防止でき、かつ相手に不快感を与える可能性を少なくする。
【解決手段】テレビ電話機50は、マイク54と、撮像部52と、メモリ58と、通信部66と、ディスプレイ88と、スピーカ64と、制御部70とを含む。マイク54には、音声が入力される。撮像部52は、撮像対象を撮像する。メモリ58は、撮像データを撮像対象に対応付けて記憶する。通信部66は、音声データおよび撮像データを通信する。ディスプレイ88は映像を表示する。スピーカ64は音声を出力する。制御部70は、選択部702と、送信制御部704とを含む。選択部702は、メモリ58が記憶した撮像データの中から撮像データを選択する。送信制御部704は、音声データと選択部702が選択した撮像データとを送信するように通信部66を制御する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、テレビ電話機に関し、特に、双方向の通信を行い、かつ少なくとも一方から映像を送信できるテレビ電話機に関する。
【背景技術】
【0002】
特許文献1は、撮像部と、画像データ記憶部と、画像データ処理部と、画像データ符号化部と、システム制御部と、動き検出部とを備える撮像画像送信装置を開示する。撮像部は、撮像対象を撮像して撮像画像データを出力する。画像データ記憶部には、あらかじめ準備された画像データが記憶されている。画像データ処理部は、撮像画像データおよび準備された画像データを合成処理し、撮像画像データ、準備された画像データ、またはこれらの合成画像データからなる送信画像データを出力する。画像データ符号化部は、送信画像データを符号化して出力する。システム制御部は、合成処理を制御する。動き検出部は、撮像画像データから撮像対象または撮像部の第1の動きおよび第2の動きを検出する。システム制御部は、送信画像データが撮像画像データであるときに第1の動きが検出されると、合成処理を変更することによって送信画像データを準備された画像データまたは合成画像データに変更し、送信画像データが準備された画像データまたは合成画像データであるときに第2の動きが検出されると、合成処理を変更することによって送信画像データを撮像画像データに変更する。
【0003】
特許文献1に開示された発明によると、撮像画像をそのまま送信したくないときに、そのままの撮像画像に換えてあらかじめ準備した画像あるいは画像処理を施した撮像画像を簡単な操作で送信できる。
【0004】
特許文献2は、送信されてきた画像が当方の表示画面に表示された後、送信相手との通信の許否を切り換え可能な画像通信装置を開示する。
【0005】
特許文献2に開示された発明によると、使用者の意図に即した通信を行い、通信に関する利便性の向上を図ることができる。
【0006】
特許文献3は、計時部と、撮像部と、時間帯規定部と、判別部と、送信部とを有するテレビ電話装置を開示する。計時部は、現在時刻を計時する。撮像部は、画像を取り込む。時間帯規定部は、撮像部が取り込んだ画像の送信を許可する許可時間帯を規定する。判別部は、着呼の際、計時部が計時した現在時刻が示す着呼時刻が時間帯規定部の規定する許可時間帯に属するかどうかを判別する。送信部は、判別部の判別結果に基づき撮像部が取り込んだ画像を初期送信画面として選択的に送信する。
【0007】
特許文献3に開示された発明によると、時間帯によって画像の送信を許可したり禁止したりできる。
【0008】
特許文献4は、音声を取り込むマイクロホンと、画像を撮影するカメラと、送信部と、受信部と、スピーカと、画像表示部と、切替部と、状態表示部とを備えた通信装置を開示する。送信部は、マイクロホンおよびカメラで取り込んだ音声情報および画像情報を送信する。受信部は、送信されてきた音声情報および画像情報を受信する。スピーカは、受信した音声情報に基づく音声を出力する。画像表示部は、画像情報に基づく画像を画面に表示出力する。切替部は、カメラで撮影した自分側画像を相手側へ送信しない状態とカメラで撮影した自分側画像を相手側へ送信する状態とを切り替える。状態表示部は、切替状態がカメラで撮影した自分側画像を相手側へ送信しない状態またはカメラで撮影した自分側画像を相手側へ送信する状態のいずれの状態であるかを画面に表示する。
【0009】
特許文献4に開示された発明によると、操作者の意に反して不用意に相手側に画像が表示されてしまう事態を確実に防止できる。
【0010】
特許文献5は、通信部と、第1の画像表示部と、半透明鏡と、第2の画像表示部と、第1のカメラと、第2のカメラと、画像切り替えスイッチとを具備する画像通信装置を開示する。通信部は、相手側の通信端末と通信回線を介して画像信号を送受信する。第1の画像表示部は、通信端末で受信した相手側の動画または静止画の顔画像を表示する。半透明鏡は、第1の画像表示部が表示する相手側の顔画像を反射する。第2の画像表示部は、半透明鏡により反射した相手側の顔画像を表示する。第1のカメラは、半透明鏡を通して送信側の顔画像を入力する。第2のカメラは、送信画像を入力する。画像切り替えスイッチは、第1のカメラと第2のカメラとの画像を切り替える。
【0011】
特許文献5に開示された発明によると、ある許容範囲内において、被写体の顔の位置や向きに左右されずに視線を捉えた最適な顔画像を表示できる。
【0012】
特許文献6は、着信時において情報取得部により取得した相手先の端末情報が記憶部に登録されている内容と合致する場合のみ、自機からの映像の送信を許可するテレビ電話装置を開示する。
【0013】
特許文献6に開示された発明によると、間違い電話や迷惑電話その他受信者が想定していない相手からの発呼にたいして通信を接続してしまうことにより受信者の映像などが相手側に送信されることを防止できる。
【特許文献1】特開2002−118733号公報
【特許文献2】特開平9−224228号公報
【特許文献3】特開平7−30871号公報
【特許文献4】特開2004−215303号公報
【特許文献5】特開平6−303601号公報
【特許文献6】特開2006−211001号公報
【発明の開示】
【発明が解決しようとする課題】
【0014】
しかし、特許文献1に開示された発明では、撮像画像に換えてあらかじめ準備した画像あるいは画像処理を施した撮像画像を送信していることが相手に容易に知られてしまうため、相手に不快感を与える可能性があるという問題点がある。
【0015】
特許文献2〜4に開示された発明では、相手側が自分自身の映像を送信しているにも関わらずユーザは自分自身の映像を送信しないことにより、相手に不快感を与える可能性があるという問題点がある。
【0016】
特許文献5および6に開示された発明では、撮像画像をそのまま送信したくないときにも撮像画像を送信してしまうという問題点がある。
【0017】
本発明は上述の問題点を解決するためになされたものであって、その目的は、撮像画像をそのまま送信したくないときは撮像画像が送信されることを防止でき、かつ相手に不快感を与える可能性を少なくできるテレビ電話機を提供することにある。
【課題を解決するための手段】
【0018】
上記目的を達成するために、本発明のある局面に従うと、テレビ電話機は、音声入力手段と、撮像手段と、記憶手段と、通信手段と、表示手段と、音声出力手段と、制御手段とを含む。音声入力手段は、音声が入力されたことに応じて音声データを出力する。撮像手段は、撮像対象を撮像して撮像データを出力する。記憶手段は、撮像対象の部分別の変位の組み合わせに対応付けて複数の種類の撮像データを記憶する。通信手段は、音声データおよび撮像データを送信し、かつ撮像データとは異なる映像データおよび音声入力手段が出力した音声データとは異なる音声データを受信する。表示手段は、通信手段が受信した映像データが表わす映像を表示する。音声出力手段は、通信手段が受信した音声データが表わす音声を出力する。制御手段は、通信手段を制御する。制御手段は、配置抽出手段と、変位抽出手段と、読み出し手段と、送信制御手段とを含む。配置抽出手段は、記憶手段が記憶した撮像データを通信手段が送信している間に撮像された撮像データが表わす撮像対象の部分別の配置の情報を複数回抽出する。変位抽出手段は、複数の時期に撮像された複数の種類の撮像データから配置抽出手段が抽出した配置の情報に基づいて、撮像対象の部分別の変位の組み合わせを表わす情報を通信手段が撮像データを送信している間に複数回抽出する。読み出し手段は、変位の組み合わせを表わす情報を変位抽出手段が抽出すると、変位の組み合わせに対応する撮像データを記憶手段から読み出す。送信制御手段は、音声入力手段が出力した音声データを送信し、かつ読み出し手段が撮像データを読み出すたびに読み出し手段が読み出した撮像データを送信するように、通信手段を制御する。
【0019】
本発明の他の局面にしたがうと、テレビ電話機は、音声入力手段と、撮像手段と、記憶手段と、通信手段と、表示手段と、音声出力手段と、制御手段とを含む。音声入力手段は、音声が入力されたことに応じて音声データを出力する。撮像手段は、撮像対象を撮像して撮像データを出力する。記憶手段は、撮像データを撮像対象に対応付けて記憶する。通信手段は、音声データおよび撮像データを送信し、かつ撮像データとは異なる映像データおよび音声入力手段が出力した音声データとは異なる音声データを受信する。表示手段は、通信手段が受信した映像データが表わす映像を表示する。音声出力手段は、通信手段が受信した音声データが表わす音声を出力する。制御手段は、通信手段を制御する。制御手段は、選択手段と、送信制御手段とを含む。選択手段は、音声入力手段が出力した音声データおよび記憶手段が撮像データを記憶した後に撮像手段が撮像して出力した撮像データの少なくとも一方に基づいて、記憶手段が記憶した撮像データの中から音声を入力した撮像対象についての撮像データを選択する。送信制御手段は、音声入力手段が出力した音声データと選択手段が選択した撮像データとを送信するように、通信手段を制御する。
【0020】
また、上述した記憶手段は、撮像対象の複数の部分の位置関係に対応付けて複数の種類の撮像データを記憶するための手段を含むことが望ましい。併せて、選択手段は、関係抽出手段と、読み出し手段とを含むことが望ましい。関係抽出手段は、撮像対象の複数の部分の位置関係に対応する情報を撮像手段が出力した撮像データから抽出する。読み出し手段は、関係抽出手段が抽出した情報に対応する撮像データを記憶手段から読み出す。併せて、送信制御手段は、音声入力手段が出力した音声データと読み出し手段が読み出した撮像データとを送信するように、通信手段を制御するための手段を含むことが望ましい。
【0021】
もしくは、上述した記憶手段は、撮像対象の部分別の変位の組み合わせに対応付けて複数の種類の撮像データを記憶するための手段を含むことが望ましい。併せて、関係抽出手段は、配置抽出手段と、変位抽出手段とを含むことが望ましい。配置抽出手段は、撮像データが表わす撮像対象の部分別の配置の情報を抽出する。変位抽出手段は、複数の時期に撮像された複数の種類の撮像データから配置抽出手段が抽出した配置の情報に基づいて、撮像対象の部分別の変位の組み合わせを表わす情報を抽出する。併せて、読み出し手段は、変位の組み合わせに対応する撮像データを記憶手段から読み出すための手段を含むことが望ましい。
【0022】
もしくは、上述した配置抽出手段は、記憶手段が記憶した撮像データを通信手段が送信している間に撮像された撮像データが表わす配置の情報を複数回抽出するための手段を含むことが望ましい。併せて、変位抽出手段は、通信手段が撮像データを送信している間に変位の組み合わせを表わす情報を複数回抽出するための手段を含むことが望ましい。併せて、読み出し手段は、変位の組み合わせを表わす情報を変位抽出手段が抽出すると、変位の組み合わせに対応する撮像データを読み出すための手段を含むことが望ましい。併せて、送信制御手段は、読み出し手段が撮像データを読み出すたびに読み出し手段が読み出した撮像データを送信するように、通信手段を制御するための手段を含むことが望ましい。
【0023】
もしくは、上述した記憶手段は、撮像対象の複数の部分の位置関係に加え、撮像対象の音声の情報に対応付けて複数の種類の撮像データを記憶するための手段を含むことが望ましい。併せて、制御手段は、音声入力手段が出力した音声データから撮像対象に対応する音声の属性の情報を抽出するための手段をさらに含むことが望ましい。併せて、読み出し手段は、関係抽出手段が情報として抽出した位置関係に加え、音声の属性の情報に対応する撮像データを記憶手段から読み出すための手段を含むことが望ましい。
【0024】
または、上述した制御手段は、音声入力手段が出力した音声データおよび通信手段が受信した音声データから、音声の属性の情報を抽出するための属性抽出手段をさらに含むことが望ましい。併せて、送信制御手段は、音声入力手段が出力した音声データから抽出した音声の属性に対応する情報と通信手段が受信した音声データから抽出した音声の属性に対応する情報との組み合わせが要件を満たす場合、選択手段が選択した撮像データを送信するように通信手段を制御するための手段を含むことが望ましい。
【発明の効果】
【0025】
本発明に係るテレビ電話機は、撮像画像をそのまま送信したくないときは撮像画像が送信されることを防止でき、かつ相手に不快感を与える可能性を少なくできる。
【発明を実施するための最良の形態】
【0026】
以下、図面を参照しつつ、本発明の実施の形態について説明する。以下の説明では、同一の部品には同一の符号を付してある。それらの名称および機能も同一である。したがって、それらについての詳細な説明は繰返さない。
【0027】
図1は、本実施の形態に係るテレビ電話機50の構成を表わす図である。図2は、本実施の形態に係るテレビ電話機50の外観図である。図1および図2を参照して、本実施の形態に係るテレビ電話機50は、撮像部52と、マイク54と、エンコーダ56と、メモリ58と、デコーダ60と、表示部62と、スピーカ64と、通信部66と、操作部68と、制御部70とを含む。
【0028】
撮像部52は、撮像対象を撮像して映像データを出力する装置である。本実施の形態において、この映像データを「撮像データ」と称する。本実施の形態に場合、撮像部52はCCD(Charge-Coupled Devices)カメラを含む。本実施の形態に場合、撮像部52は図2に示すように設けられているので、CCDカメラの向きを変えなくてもユーザやその背景などの撮像対象を撮像することとなる。マイク54は、音声が入力されたことに応じてその音声を電気信号に変換し出力する装置である。この電気信号が音声データを表わす。ユーザは、マイク54を使用して音声データを入力できる。エンコーダ56は、撮像部52が撮像により得た電気信号を符号化する装置である。エンコーダ56がその電気信号を符号化することにより、その電気信号が表わす映像のデータ量は圧縮される。メモリ58は、制御部70が情報を処理したり演算をしたりする際、データを一時的に記憶する装置である。メモリ58は、制御部70が実行するプログラムを記憶する装置でもある。メモリ58は、過去に通信した電話機の電話番号の情報や、通話者を特定するための各種の情報や、通話者の間の親密度の情報や、撮像部52が撮像した像の代わりに通信部66が送信する映像データや、撮像部52が予め撮像した撮像データや、後述するファイルテーブルを記憶しておく装置でもある。なお、本実施の形態の場合、MPEG(Moving Picture Coding Experts Group)ファイルとして撮像データは記憶されている。また、撮像部52が撮像した像の代わりに通信部66が送信する映像は動画であっても静止画であってもよいが、本実施の形態の場合、この映像は静止画である。通話者を特定するための各種の情報は、周波数別の音声の大きさを表わすデータの組み合わせと、画像における目と口との特徴点の座標と、通話者を識別するデータとを対応付けたデータベースとしてメモリ58に記憶される。通話者の間の親密度の情報は、通話者を識別するデータと親密度の区分を表わすデータとを対応付けたデータベースとしてメモリ58に記憶される。デコーダ60は、符号を電気信号に復号する装置である。表示部62は、映像データが表わす映像を表示する装置である。スピーカ64は、音声データが表わす音声を出力する装置である。通信部66は、図示しないネットワークを介して、図示しない電話機と通信する装置である。操作部68は、ユーザの操作に応じて信号を生成する装置である。ユーザは、操作部68を操作することにより情報を入力することができる。
【0029】
表示部62は、ディスプレイ88と、配信LED(Light Emitting Diode)90と、フォーマルLED92と、停止LED94とを含む。
【0030】
配信LED90は、撮像部52が出力した撮像データをそのまま通信部66が送信している場合に点灯するLEDである。これにより、撮像部52が出力した撮像データがそのまま送信されていることをユーザは知る。フォーマルLED92は、撮像部52が予め撮像し、かつメモリ58に記憶された撮像データを通信部66が送信している場合に点灯するLEDである。これにより、撮像部52が予め撮像し、かつメモリ58に記憶された撮像データが送信されていることをユーザは知る。停止LED94は、撮像部52が撮像した像の代わりにメモリ58に予め記憶されている映像データを通信部66が送信している場合に点灯するLEDである。これにより、メモリ58に予め記憶されている映像データが送信されていることをユーザは知る。
【0031】
操作部68は、キー入力部96と、リモコン受信部98とを含む。
キー入力部96は、ユーザのキー操作に応じて信号を生成する装置である。リモコン受信部98は、図示しないリモートコントローラから赤外線信号を受信するとその信号に対応する電気信号を生成する装置である。そのリモートコントローラは、ユーザの操作に応じて赤外線信号をリモコン受信部98に送信する。
【0032】
制御部70は、選択部702と、送信制御部704と、属性抽出部706とを含む。
選択部702は、マイク54が出力した音声データおよびメモリ58が撮像データを記憶した後に撮像部52が撮像して出力した撮像データの少なくとも一方に基づいて、メモリ58が記憶した撮像データの中から音声を入力した者についての撮像データを選択する。送信制御部704は、マイク54が出力した音声データと選択部702が選択した撮像データとを送信するように、通信部66を制御する。属性抽出部706は、マイク54が出力した音声データおよび通信部66が受信した音声データから、音声の属性の情報を抽出する。本実施の形態においては、音声の属性の情報として上述した周波数別の音声の大きさを表わすデータが抽出される。
【0033】
選択部702は、関係抽出部710と、読み出し部712とを含む。
関係抽出部710は、ユーザその他の撮像対象の複数の部分の位置関係に対応する情報を抽出する。その情報は、撮像部52が出力した撮像データから抽出される。読み出し部712は、関係抽出部710が抽出した情報に対応する撮像データをメモリ58から読み出す。
【0034】
関係抽出部710は、配置抽出部720と、変位抽出部722とを含む。
配置抽出部720は、撮像データが表わす撮像対象の部分別の配置の情報を抽出する。変位抽出部722は、複数の時期に撮像された複数の種類の撮像データから配置抽出部720が抽出した配置の情報に基づいて、撮像対象の部分別の変位の組み合わせを表わす情報を抽出する。
【0035】
図3は、メモリ58が記憶するファイルテーブルの概念図である。図3を参照して、本実施の形態に係るファイルテーブルは、数値変化の範囲を表わすデータと、MPEGファイルの情報とを含む。
【0036】
数値変化の範囲を表わすデータは、眉・目・腕についての特徴点の座標を表わすデータと、周波数別の音声の大きさを表わすデータとを含む。特徴点の座標を表わすデータは、動作前の座標のデータと動作後の座標のデータとを含む。このデータは、MPEGファイルを選択する際に利用される。図3には、周波数別の音声の大きさを表わすデータは、音の大きさを表わす複数のデータにより成り立っているが、図3には最も音が大きい周波数のみが示されている。MPEGファイルの情報は、送信される像のファイル名を表わす。制御部70は、この情報を参照してMPEGファイルを読み出す。
【0037】
なお、本実施の形態の場合、数値変化の範囲を表わすデータは、Y座標あるいはX軸方向の距離を表わす。数値変化の範囲を表わすデータが、X座標やY軸方向の距離を表わしてもよいことは言うまでもない。本実施の形態の場合、ディスプレイ88に表示された像における左側から右側へ向かう方向をX軸方向とする。その像における上から下へ向かう方向をY軸方向とする。その像の左上を原点とする。どのデータがX座標を表わしどの座標がY座標を表わすかは予め定められている。本実施の形態の場合、「口の幅」のみがX軸方向の距離を表わす。それ以外のデータは、Y座標を表わす。
【0038】
また、図3に示す「動作名」欄は、MPEGファイルとしてメモリ58に記憶されたデータがどのような動きを表わす像かを説明するために設けられた欄であって、本実施の形態においてはファイルテーブルに含まれていない。
【0039】
図4〜図6を参照して、テレビ電話機50で実行されるプログラムは、通話中の映像通信に関し、以下のような制御を実行する。
【0040】
ステップS110にて、送信制御部704は、通信部66が受信した図示しない電話機からの信号に応じて、通信を確立するための処理を実施する。この通信は、その電話機との通信を確立するための処理である。なお、本実施の形態の場合、その電話機との通信を確立するためには予め図示しないプロバイダのサーバとの通信が確立されていることが必要である。なお、これらの通信を確立するための処理は周知であるので、ここではその詳細な説明は繰返さない。
【0041】
ステップS112にて、送信制御部704は、通信部66が受信した音声信号をスピーカ64に出力する。スピーカ64は、その信号に対応する音声を出力する。一方、マイク54は、ユーザが入力した音声に対応する音声信号を生成し、送信制御部704に出力する。送信制御部704は、マイク54が出力した音声信号を通信部66に送信させる。音声信号の通信の合間に、送信制御部704は、画像データを通信部66に送信させる。この画像データは、撮像部52が撮像した像の代わりに通信部66が送信する映像のデータであって通話開始の際に送信することと予め定められていたデータである。
【0042】
ステップS114にて、送信制御部704は、過去に通信した電話機の電話番号の情報を参照することにより、ステップS110にて接続が確立された電話機の電話番号が、これまでに通信したことがない電話機の電話番号か否かを判断する。ステップS110にて接続が確立された電話機の電話番号が過去に通信した電話機の電話番号の情報に含まれていない場合、ステップS110にて接続が確立された電話機の電話番号がこれまでに通信したことがない電話機の電話番号であると送信制御部704は判断する。これまでに通信したことがない電話機の電話番号と判断した場合(ステップS114にてYES)、処理はステップS132へと移される。もしそうでないと(ステップS114にてNO)、処理はS116へと移される。
【0043】
ステップS116にて、読み出し部712は、音声および映像のデータを通信部66に通信させるための制御の合間に、通信部66が受信した通話相手の音声データとマイク54が生成したユーザの音声データと撮像部52の撮像により得られたユーザの映像データとに基づいて、通話中の二人を認識する。本実施の形態の場合、通話相手の映像データを通信部66が受信しているならば、読み出し部712は、そのデータも加味して通話中の二人を認識する。通話相手の映像データを通信部66が受信していないならば、そのデータは加味されなくてよい。通話中の二人を認識するため、属性抽出部706は、音声データから音の大きさの情報を周波数別に抽出する。読み出し部712は、その情報をメモリ58に記憶されている情報と比較することで通話している者を特定する。映像データを加味する場合、配置抽出部720が画像データによって特定した目と口とを表わす特徴点の配置をメモリ58に記憶されている情報と読み出し部712が比較することで通話している者を特定する。本実施の形態において、読み出し部712は、映像データを加味する場合、音声に基づく認識を終了した後に映像に基づく認識を実施する。
【0044】
ステップS118にて、読み出し部712は、認識を開始してから5秒以上の時間が経過したか否かを判断する。5秒以上の時間が経過したと判断した場合(ステップS118にてYES)、処理はステップS122へと移される。処理が移される前に、音声に基づく認識を終了した時点で読み出し部712は認識を中断する。もしそうでないと(ステップS118にてNO)、処理はS116へと移される。
【0045】
ステップS120にて、読み出し部712は、自らが認識を終了したか否かを判断する。認識を終了したと判断した場合(ステップS120にてYES)、処理はステップS122へと移される。もしそうでないと(ステップS120にてNO)、処理はS118へと移される。
【0046】
ステップS122にて、読み出し部712は、ステップS116の認識処理と、メモリ58に記憶された親密度の情報とに基づいて、通話中の二人が親しい間柄か否かを判断する。読み出し部712は、メモリ58に記憶された親密度の情報のうち認識処理が終了した時点における認識結果に基づいて通話中の二人を特定した後、それらの二人に対応付けられたデータを参照することにより通話中の二人が親しい間柄か否かを判断する。通話中の二人が親しい間柄と判断した場合には(ステップS122にてYES)、処理はステップS124へと移される。もしそうでないと(ステップS122にてNO)、処理はステップS126へと移される。
【0047】
ステップS124にて、送信制御部704は、配信LED90を点灯させる。併せて、送信制御部704は、撮像部52の撮像により得られた信号を符号化させるように、エンコーダ56を制御する。信号が符号化されると、送信制御部704は、符号化により得られた映像データを送信するように通信部66を制御する。
【0048】
ステップS126にて、読み出し部712は、ステップS116の認識処理と、メモリ58に記憶された親密度の情報とに基づいて、通話中の二人がフォーマルな間柄か否かを判断する。読み出し部712は、メモリ58に記憶された親密度の情報のうち認識処理が終了した時点における認識結果に基づいて通話中の二人を特定した後、それらの二人に対応付けられたデータを参照することにより通話中の二人がフォーマルな間柄か否かを判断する。通話中の二人がフォーマルな間柄と判断した場合には(ステップS126にてYES)、処理はステップS128へと移される。もしそうでないと(ステップS126にてNO)、処理はステップS130へと移される。
【0049】
ステップS128にて、制御部70は、フォーマルLED92を点灯させる。併せて、制御部70は、撮像部52が予め撮像したことにより得られ、かつメモリ58に予め記憶された撮像データを、以下の手順に従って送信するための処理を実施する。
【0050】
第1の手順は、撮像部52の撮像により得られた映像データから、特徴点の座標を特定するという手順である。配置抽出部720は、その映像データにおける特徴点を抽出した後、その特徴点の座標を特定する。この座標は、上述した数値変化の範囲を表わすデータが表わす座標と同一の基準に基づいて定められる。
【0051】
第2の手順は、第1の手順において特定された特徴点の座標とメモリ58に記憶された特徴点の座標とを比較することにより、ユーザの体のうち動いた部分を変位抽出部722が識別する手順である。数値変化の範囲を表わすデータがX軸方向の距離を表わす特徴点については、その距離に変化があったか否かが識別される。本実施の形態の場合、比較される特徴点ごとに閾値が定められている。比較される特徴点ごとの座標の差や距離の変化がその閾値を越えている場合、ユーザの体のうちその特徴点に対応する部分に動きがあったと変位抽出部722は判断する。なお、比較される特徴点ごとの座標の差を「特徴点の移動量」と称する。
【0052】
第3の手順は、ファイルテーブルが表わすMPEGファイルのうち、第2の手順において識別されたユーザの体の動きに最も近い動きを表わすファイルを読み出し部712が選択する手順である。本実施の形態の場合、数値変化の範囲を表わすデータの「前」欄の値と「後」欄の値との差が特徴量の移動量に最も近い特徴点を読み出し部712はまず検索する。そのような特徴点を「近似点」と称する。ファイルテーブルが表わすすべての特徴点について近似点が検索されると、MPEGファイルのうち最も多くの近似点に対応付けられたファイルを読み出し部712は検索する。この処理により検索されたファイルが、第2の手順において識別されたユーザの体の動きに最も近い動きを表わすファイルである。ファイルの選択が終了すると、第1の手順において特定された特徴点の座標はメモリ58に記憶される。
【0053】
第4の手順は、第3の手順で選択されたファイルの映像を送信する手順である。このために、第3の手順で選択されたファイルをメモリ58から読み出し部712は読み出す。そのファイルが読み出されると、送信制御部704は、そのファイルに含まれたデータをデコードするようにデコーダ60を制御する。そのファイルに含まれたデータがデコードされると、デコードされたデータを信号として送信するように送信制御部704は通信部66を制御する。
【0054】
ステップS130にて、送信制御部704は、停止LED94を点灯させる。併せて、通信部66は、撮像部52が撮像した像の代わりに送信する画像のデータを送信制御部704の制御に従って送信する。
【0055】
ステップS132にて、送信制御部704は、通信部66が通信した信号に基づいて、通話が終了したか否かを判断する。通話が終了したと判断した場合には(ステップS132にてYES)、処理はステップS134へと移される。もしそうでないと(ステップS132にてNO)、処理はステップS136へと移される。
【0056】
ステップS134にて、通信部66は、送信制御部704の制御に従って信号の通信を停止する。また、送信制御部704は、配信LED90、フォーマルLED92、および停止LED94のうち点灯していたLEDを消灯させる。
【0057】
ステップS136にて、送信制御部704は、キー入力部96のライブボタンが押されたか否かを判断する。ライブボタンが押されたと判断した場合(ステップS136にてYES)、処理はステップS138へと移される。もしそうでないと(ステップS136にてNO)、処理はステップS140へと移される。
【0058】
ステップS138にて、送信制御部704は、配信LED90を点灯させる。併せて、送信制御部704は、撮像部52の撮像により得られた信号を符号化させるように、エンコーダ56を制御する。信号が符号化されると、送信制御部704は、符号化により得られた映像データを送信するように通信部66を制御する。
【0059】
ステップS140にて、送信制御部704は、再生ボタンが押されたか否かを判断する。再生ボタンはキー入力部96の一部である。再生ボタンが押されたと判断した場合(ステップS140にてYES)、処理はステップS142へと移される。もしそうでないと(ステップS140にてNO)、処理はステップS144へと移される。
【0060】
ステップS142にて、制御部70は、フォーマルLED92を点灯させる。併せて、制御部70は、撮像部52が予め撮像したことにより得られ、かつメモリ58に予め記憶された映像データを、ステップS128と同じ手順に従って送信するための処理を実施する。
【0061】
ステップS144にて、送信制御部704は、キー入力部96の停止ボタンが押されたか否かを判断する。停止ボタンが押されたと判断した場合(ステップS144にてYES)、処理はステップS146へと移される。もしそうでないと(ステップS144にてNO)、処理はステップS148へと移される。
【0062】
ステップS146にて、送信制御部704は、停止LED94を点灯させる。併せて、通信部66は、撮像部52が撮像した像の代わりに送信する画像のデータを送信制御部704の制御に従って送信する。
【0063】
ステップS148にて、送信制御部704は、キー入力部96の録画ボタンが押されたか否かを判断する。録画ボタンが押されたと判断した場合(ステップS148にてYES)、処理はステップS150へと移される。もしそうでないと(ステップS148にてNO)、処理はステップS122へと移される。
【0064】
ステップS150にて、送信制御部704は、配信LED90を点灯させる。併せて、制御部70は、撮像部52の撮像により得られた映像データをエンコーダ56に符号化させ、符号化によりデータ量が圧縮された映像データをメモリ58にMPEGファイルとして記憶させる。併せて、制御部70は、撮像部52の撮像により得られた映像データを、以下の手順に従って送信するための処理を実施する。
【0065】
第1の手順は、撮像部52の撮像により得られた映像データから、特徴点の座標を特定するという手順である。配置抽出部720は、その映像データにおける特徴点を抽出した後、その特徴点の座標を特定する。この座標は、上述した数値変化の範囲を表わすデータが表わす座標と同一の基準に基づいて定められる。
【0066】
第2の手順は、第1の手順において特定された特徴点の座標とメモリ58に記憶された特徴点の座標とを比較することにより、ユーザの体のうち動きがあった部分を変位抽出部722が検出する手順である。本実施の形態の場合、比較される特徴点ごとに閾値が定められている。比較される特徴点ごとの座標の差や距離の変化がその閾値を越えている場合、ユーザの体のうちその特徴点に対応する部分に動きがあったと変位抽出部722は判断する。
【0067】
第3の手順は、ファイルテーブルに情報を追加するための手順である。メモリ58に記憶させている途中の映像データのファイル名と、第2の手順において動きがあったことを検出した部分についての特徴点の座標とをファイルテーブルの一部として読み出し部712はメモリ58に記憶させる。
【0068】
第4の手順は、制御部70が、符号化によりデータ量が圧縮された映像データを送信するように、通信部66を制御する手順である。
【0069】
以上のような構造およびフローチャートに基づく、テレビ電話機50の動作について説明する。
【0070】
送信制御部704は、通信部66が受信した図示しない電話機からの信号に応じて、通信を確立するための処理を実施する(ステップS110)。通信が確立されると、通信部66は、音声信号の通信の合間に、通話開始の際に送信する映像を送信する(ステップS112)。図7は、この時点における相手方のテレビ電話機50の外観図である。この場合、通話の相手方も本実施の形態にかかるテレビ電話機50を使用していることとする。ただし、テレビ電話機50が通信する装置はその他の電話機であってもよい。
【0071】
映像が送信されると、ステップS110にて接続が確立された電話機の電話番号が、これまでに通信したことがない電話機の電話番号か否かを判断する(ステップS114)。この場合、これまでに通信したことがある電話機の電話番号であることとすると(ステップS114にてNO)、読み出し部712は通話中の二人を認識する(ステップS116)。認識が開始されると、読み出し部712は、自らが認識を終了したか否かを判断する(ステップS120)。認識が終了していなければ、読み出し部712は、認識を開始してから5秒以上の時間が経過したか否かを判断する(ステップS118)。5秒以上の時間が経過していなければ(ステップS118にてNO)、ステップS116の処理を経て、読み出し部712は、自らが認識を終了したか否かを再び判断する(ステップS120)。この場合、認識が終了したとすると(ステップS120にてYES)、読み出し部712は、通話中の二人が親しい間柄か否かを判断する(ステップS122)。この場合、通話中の二人が会社の上司と部下との関係すなわちフォーマルな関係にあるとすると(ステップS122にてNO)、読み出し部712は、通話中の二人がフォーマルな間柄か否かを判断する(ステップS126)。この場合、上述したように、通話中の二人はフォーマルな間柄なので(ステップS126にてYES)、制御部70は、撮像部52が予め撮像したことにより得られ、かつメモリ58に予め記憶された撮像データを通信部66に送信させる(ステップS128)。図8は、この時点における送信側のテレビ電話機50の外観を表わす図である。
【0072】
撮像データが送信されると、送信制御部704は、通信部66が通信した信号に基づいて、通話が終了したか否かを判断する(ステップS132)。この場合、通話がまだ終了していないとすると(ステップS132にてNO)、送信制御部704は、キー入力部96のライブボタンが押されたか否かを判断する(ステップS136)。この場合、ライブボタンが押されていないとすると(ステップS136にてNO)、送信制御部704は、再生ボタンが押されたか否かを判断する(ステップS140)。この場合、再生ボタンが押されていないとすると(ステップS140にてNO)、送信制御部704は、停止ボタンが押されたか否かを判断する(ステップS144)。この場合、再生ボタンが押されていないとすると(ステップS144にてNO)、送信制御部704は、キー入力部96の録画ボタンが押されたか否かを判断する(ステップS148)。この場合、録画ボタンが押されていないとすると(ステップS148にてNO)、ステップS122以降の処理が繰返される。
【0073】
その後、通話が終了したと送信制御部704が判断した場合(ステップS132にてYES)、通信部66は、送信制御部704の制御に従って信号の通信を停止する。また、送信制御部704は、配信LED90、フォーマルLED92、および停止LED94のうち点灯していたLEDを消灯させる(ステップS134)。これにより、通話は終了する。
【0074】
以上のようにして、本実施の形態に係るテレビ電話機50は、撮像部52が撮像した映像をフォーマルな間柄の相手に対してそのまま送信することをユーザが望まない場合、予め録画された映像の映像データを制御部70による認識結果に基づいて選択し、選択した映像データを送信する。これにより、予め録画された映像の映像データが送信されるので、撮像画像に換えてあらかじめ準備した映像を送信していることが通話相手に知られにくくなる。そのことが相手に知られにくくなるので、相手に不快感を与える可能性が少なくなる。その結果、撮像画像をそのまま送信したくないときは撮像画像が送信されることを防止でき、かつ相手に不快感を与える可能性を少なくできるテレビ電話機を提供することができる。
【0075】
また、通話中のユーザを撮像した撮像データから制御部70が認識した結果に基づいて、送信される撮像データは選択される。これにより、通話中のユーザに応じた撮像データが送信される可能性が高くなる。その結果、通話中のユーザに対応する映像データを送信することができるテレビ電話機を提供することができる。
【0076】
また、送信される撮像データは、通話中のユーザの動きに基づいて選択される。これにより、送信される撮像データにより通話相手が知覚する映像は会話の内容と概ね対応するものになる。これにより、撮像画像に換えてあらかじめ準備した映像を送信していることは分かりにくくなる。
【0077】
また、送信される撮像データの選択は、通話中に複数回繰返される。これにより、通話相手が知覚する映像と会話の内容とが対応する割合は高くなる。その割合が高くなると、実際に撮像されている映像とほぼ変わらない動きの映像であって送信側のユーザが望む映像を通話相手に送信することができる。
【0078】
また、送信される撮像データの選択は、映像だけでなく音声も考慮される。これにより、通話中のユーザを誤認識する可能性が減少する上に、ユーザの声の調子に応じて送信する撮像データを変えることができる。そのようなことができると、声の調子に合わせた姿を映す映像のデータを通話相手に送信できるので、通話相手が知覚する姿は現実の姿に近くなる。
【0079】
また、送信される撮像データの選択は、通話中の双方の音声に基づいて考慮される。これにより、予め撮像した撮像データを送信するか否かをテレビ電話機50が選択できる。そのような選択がなされると、誤って相手に見せたくない姿を送信する可能性が低下する。
【0080】
なお、本実施の形態の第1の変形例においては、通話中の双方の音声に基づいて送信される撮像データの選択は必ずしも実施されなくともよい。
【0081】
また、本実施の形態の第2の変形例においては、撮像されたユーザの姿のみに基づいて撮像データが選択されてもよいし、ユーザの声のみに基づいて撮像データが選択されてもよい。
【0082】
また、本実施の形態の第3の変形例においては、撮像データを選択するための処理は何回実施されてもよい。たとえば、それは1度だけ実施されてもよい。
【0083】
また、本実施の形態の第4の変形例においては、ユーザの動きではなくユーザの顔その他の形態に基づいて撮像データが選択されてもよい。
【0084】
また、本実施の形態の第5の変形例においては、撮像データを選択するための条件はユーザの姿や音声に限られない。たとえば、通話の日時やユーザの性別やユーザの年齢に基づいて撮像データが選択されてもよい。ユーザの性別やユーザの年齢は撮像データに基づいて認識される。この場合、通話の日時その他の条件とユーザの姿や音声とを考慮して撮像データが選択されてもよい。
【0085】
また、本実施の形態の第6の変形例においては、キー入力部96に対する操作に応じて実施される処理はいずれもリモコン受信部98が信号を受信したことに応じて実施されてもよい。
【0086】
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
【図面の簡単な説明】
【0087】
【図1】本発明の実施の形態に係るテレビ電話機の構成図である。
【図2】本発明の実施の形態に係るテレビ電話機の外観図である。
【図3】本発明の実施の形態に係るファイルテーブルの概念図である。
【図4】本発明の実施の形態に係る通話中の映像通信処理の制御の手順を示す第1のフローチャートである。
【図5】本発明の実施の形態に係る通話中の映像通信処理の制御の手順を示す第2のフローチャートである。
【図6】本発明の実施の形態に係る通話中の映像通信処理の制御の手順を示す第3のフローチャートである。
【図7】本発明の実施の形態に係る通話開始時の相手方のテレビ電話機の外観図である。
【図8】本発明の実施の形態に係るいったん記憶された撮像データを送信しながら通話している場合のテレビ電話機の外観図である。
【符号の説明】
【0088】
50 テレビ電話機、52 撮像部、54 マイク、56 エンコーダ、58 メモリ、60 デコーダ、62 表示部、64 スピーカ、66 通信部、68 操作部、70 制御部、88 ディスプレイ、90 配信LED、92 フォーマルLED、94 停止LED、96 キー入力部、98 リモコン受信部、702 選択部、704 送信制御部、706 属性抽出部、710 関係抽出部、712 読み出し部、720 配置抽出部、722 変位抽出部。

【特許請求の範囲】
【請求項1】
音声が入力されたことに応じて音声データを出力するための音声入力手段と、
撮像対象を撮像して撮像データを出力するための撮像手段と、
前記撮像対象の部分別の変位の組み合わせに対応付けて複数の種類の前記撮像データを記憶するための記憶手段と、
前記音声データおよび前記撮像データを送信し、かつ前記撮像データとは異なる映像データおよび前記音声入力手段が出力した前記音声データとは異なる音声データを受信するための通信手段と、
前記通信手段が受信した映像データが表わす映像を表示するための表示手段と、
前記通信手段が受信した音声データが表わす音声を出力するための音声出力手段と、
前記通信手段を制御するための制御手段とを含み、
前記制御手段は、
前記記憶手段が記憶した前記撮像データを前記通信手段が送信している間に撮像された前記撮像データが表わす前記撮像対象の部分別の配置の情報を複数回抽出するための配置抽出手段と、
複数の時期に撮像された複数の種類の前記撮像データから前記配置抽出手段が抽出した前記配置の情報に基づいて、前記撮像対象の部分別の変位の組み合わせを表わす情報を前記通信手段が前記撮像データを送信している間に複数回抽出するための変位抽出手段と、
前記変位の組み合わせを表わす情報を前記変位抽出手段が抽出すると、前記変位の組み合わせに対応する前記撮像データを前記記憶手段から読み出すための読み出し手段と、
前記音声入力手段が出力した音声データを送信し、かつ前記読み出し手段が前記撮像データを読み出すたびに前記読み出し手段が読み出した前記撮像データを送信するように、前記通信手段を制御するための送信制御手段とを含む、テレビ電話機。
【請求項2】
音声が入力されたことに応じて音声データを出力するための音声入力手段と、
撮像対象を撮像して撮像データを出力するための撮像手段と、
前記撮像データを前記撮像対象に対応付けて記憶するための記憶手段と、
前記音声データおよび前記撮像データを送信し、かつ前記撮像データとは異なる映像データおよび前記音声入力手段が出力した前記音声データとは異なる音声データを受信するための通信手段と、
前記通信手段が受信した映像データが表わす映像を表示するための表示手段と、
前記通信手段が受信した音声データが表わす音声を出力するための音声出力手段と、
前記通信手段を制御するための制御手段とを含み、
前記制御手段は、
前記音声入力手段が出力した音声データおよび前記記憶手段が前記撮像データを記憶した後に前記撮像手段が撮像して出力した前記撮像データの少なくとも一方に基づいて、前記記憶手段が記憶した前記撮像データの中から前記音声を入力した前記撮像対象についての前記撮像データを選択するための選択手段と、
前記音声入力手段が出力した音声データと前記選択手段が選択した前記撮像データとを送信するように、前記通信手段を制御するための送信制御手段とを含む、テレビ電話機。
【請求項3】
前記記憶手段は、前記撮像対象の複数の部分の位置関係に対応付けて複数の種類の前記撮像データを記憶するための手段を含み、
前記選択手段は、
前記撮像対象の複数の部分の位置関係に対応する情報を前記撮像手段が出力した前記撮像データから抽出するための関係抽出手段と、
前記関係抽出手段が抽出した情報に対応する前記撮像データを前記記憶手段から読み出すための読み出し手段とを含み、
前記送信制御手段は、前記音声入力手段が出力した音声データと前記読み出し手段が読み出した前記撮像データとを送信するように、前記通信手段を制御するための手段を含む、請求項2に記載のテレビ電話機。
【請求項4】
前記記憶手段は、前記撮像対象の部分別の変位の組み合わせに対応付けて前記複数の種類の撮像データを記憶するための手段を含み、
前記関係抽出手段は、
前記撮像データが表わす前記撮像対象の部分別の配置の情報を抽出するための配置抽出手段と、
複数の時期に撮像された複数の種類の前記撮像データから前記配置抽出手段が抽出した前記配置の情報に基づいて、前記撮像対象の部分別の変位の組み合わせを表わす情報を抽出するための変位抽出手段とを含み、
前記読み出し手段は、前記変位の組み合わせに対応する前記撮像データを前記記憶手段から読み出すための手段を含む、請求項3に記載のテレビ電話機。
【請求項5】
前記配置抽出手段は、前記記憶手段が記憶した前記撮像データを前記通信手段が送信している間に撮像された前記撮像データが表わす前記配置の情報を複数回抽出するための手段を含み、
前記変位抽出手段は、前記通信手段が前記撮像データを送信している間に前記変位の組み合わせを表わす情報を複数回抽出するための手段を含み、
前記読み出し手段は、前記変位の組み合わせを表わす情報を前記変位抽出手段が抽出すると、前記変位の組み合わせに対応する前記撮像データを読み出すための手段を含み、
前記送信制御手段は、前記読み出し手段が前記撮像データを読み出すたびに前記読み出し手段が読み出した前記撮像データを送信するように、前記通信手段を制御するための手段を含む、請求項4に記載のテレビ電話機。
【請求項6】
前記記憶手段は、前記撮像対象の複数の部分の位置関係に加え、前記撮像対象の音声の情報に対応付けて前記複数の種類の撮像データを記憶するための手段を含み、
前記制御手段は、前記音声入力手段が出力した音声データから前記撮像対象に対応する音声の属性の情報を抽出するための手段をさらに含み、
前記読み出し手段は、前記関係抽出手段が情報として抽出した位置関係に加え、前記音声の属性の情報に対応する前記撮像データを前記記憶手段から読み出すための手段を含む、請求項3に記載のテレビ電話機。
【請求項7】
前記制御手段は、前記音声入力手段が出力した音声データおよび前記通信手段が受信した音声データから、音声の属性の情報を抽出するための属性抽出手段をさらに含み、
前記送信制御手段は、前記音声入力手段が出力した音声データから抽出した前記音声の属性に対応する情報と前記通信手段が受信した音声データから抽出した前記音声の属性に対応する情報との組み合わせが要件を満たす場合、前記選択手段が選択した前記撮像データを送信するように前記通信手段を制御するための手段を含む、請求項2に記載のテレビ電話機。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate


【公開番号】特開2008−182466(P2008−182466A)
【公開日】平成20年8月7日(2008.8.7)
【国際特許分類】
【出願番号】特願2007−14080(P2007−14080)
【出願日】平成19年1月24日(2007.1.24)
【出願人】(000201113)船井電機株式会社 (7,855)
【Fターム(参考)】