説明

画像通信端末

【課題】 大掛かりな追従機構を用いることなく、利用者の位置にカメラ部側が追従し、利用者を良好な位置で撮影できる画像通信端末を提供する。
【解決手段】 カメラ部4で撮影された画像について、顔領域の位置及び大きさを抽出する顔抽出部7と、利用者に画像を表示する表示部3と、相手の情報処理装置に対し、画像についての双方向通信を行う通信部9と、カメラ部4で撮影された画像内において移動可能に設定される矩形の送信領域内の画像を、通信部9へ出力する送信データ処理部8とを備える。そして、カメラ部4で撮影された画像中において、送信領域と一体的に移動する有効領域が設定され、顔領域が有効領域を逸脱した場合に限り、顔領域の位置及び大きさに合わせて送信領域の位置を移動する。

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、画像通信端末に関し、より特定的には、利用者が自分又は近くにいる他人の姿をカメラ部で撮影し、この撮影した画像を相手に送信しながら対話を行うための画像通信端末に関する。
【0002】
【従来の技術】周知のように、相手に画像を送信しながら対話を行う画像通信端末としては、テレビ電話、テレビ会議システム、ビデオメール等、種々の形態のものがある。これらのいずれの形態であっても、利用者が自分又は近くにいる他人(以下、単に「利用者」という)の姿を相手に送信するためには、画像通信端末に内蔵又は外部接続されるカメラ部と被写体となる利用者とが、常に適切な位置関係になっていなければならない。
【0003】この適切な位置関係を維持するためには、カメラ部に光軸を移動させる機構やズーム機構等を設け、カメラ部を利用者の動きに追従させる方法が考えられる。しかし、この方法では、追従動作に必要なカメラ部及び関連機構が大掛かりになって、画像通信端末の小型化及び低コスト化を図れない。特に、携帯性が重要であるモバイル端末や携帯(テレビ)電話等の画像通信端末に、このような機構を設けるのは現実的ではない。
【0004】一方、画像通信端末から利用者へ、カメラ部に対する利用者の位置に関する情報を提供し、利用者が自らカメラ部に合わせるようにして、上記適切な位置関係を維持する方法も考えられる。
【0005】具体的には、第1の手法として、ピクチャインピクチャ方式又は画面分割方式により、画面の一部を自分(利用者自身)の姿を映すために利用することが従来より行われている。しかしながら、この手法では、自分の姿を映すために画面のかなりの部分が占有され、結果的に相手の姿が小さくなって見辛くなるという問題がある。また、第2の手法として、自分の画像と相手の画像とを切り替えながら表示することも従来より行われている。しかしながら、この手法では、画面が度々切り替えられてしまうので、利用者は切り替えが気になって会話に集中し難いという問題がある。加えて、上記第1及び第2のいずれの手法によっても、通常の会話(自分と相手とが膝を交えて行う会話)環境から、あまりにもかけ離れた環境であり、利用者は不自然な感じを禁じ得ない。
【0006】そこで、このような問題点に対応すべく、特開平8−251561号公報には、自分の姿を表示させず、かつ、カメラ部の追従機構を省略できる技術が開示されている。この公報の技術では、カメラ部で利用者自身を撮影し、利用者の位置を検出し、検出した位置が撮影範囲を逸脱したかどうかを判断する。そして、逸脱した場合のみ、次のいずれかの方法によってその旨を利用者へ通知する。
(1)相手の姿をほぼ画面いっぱいに表示しておき、逸脱した場合には相手の画像に変化を付けることで(例えば、相手の姿を変形させる等)、利用者へその旨を通知する。
(2)画面内に、相手の姿を表示する領域だけでなく文字表示領域を確保する。そして、逸脱した場合には文字表示領域に逸脱した旨のメッセージを表示することで、利用者へその旨を通知する。
【0007】
【発明が解決しようとする課題】しかしながら、上記(1)及び(2)のいずれの方法にしても、利用者の位置が撮影範囲を逸脱しなければ、利用者へは何の通知もされない。また、利用者が常識的な使用をしている場合には、そう頻繁に撮影範囲を逸脱するものではない。従って、利用者は、ほとんどの場合(つまり逸脱していない時)、撮影範囲に対する自分の位置を確認することができない。
【0008】さらに、上記(1)の方法では、逸脱した場合に、突然相手の姿が変化するので、利用者は驚いて会話を途切らせたりしてしまう。また、上記(2)の方法では、表示する文字(メッセージ)が潰れてしまわないようにするため、ある程度広い文字表示領域が必要となる。このため、文字表示領域に圧迫されて画像表示領域が小さくなり、相手の姿が小さく見辛くなり易い。加えて、上記(1)及び(2)のいずれの方法にしても、画面における利用者の大きさについては全く関知されておらず、カメラ部に対する利用者の遠近方向の適否が不明である。
【0009】それ故、本発明の目的は、大掛かりな追従機構を用いることなく、利用者の位置にカメラ部側が追従し、利用者を良好な位置で撮影できる画像通信端末を提供することである。また、本発明のさらなる目的は、相手を見易く表示した自然な会話を確保しつつ、利用者が自分の写り(撮影位置)を常に確認できる画像通信端末を提供することである。
【0010】
【課題を解決するための手段および発明の効果】第1の発明は、カメラ部で撮影された利用者の画像を相手に送信する画像通信端末であって、利用者からの入力を受け付ける入力部と、利用者を撮影するカメラ部と、カメラ部で撮影された画像から、利用者の顔の位置及び大きさ(顔領域)を抽出する顔抽出部と、利用者に画像を表示する表示部と、相手の情報処理装置に対し、少なくとも画像の通信を行う通信部と、カメラ部で撮影された画像の領域よりも小さく、かつ、当該画像の領域内で移動可能に設定される矩形の送信領域の画像を、通信部へ出力する送信データ処理部とを備え、カメラ部で撮影された画像の領域内に、送信領域と一体的に移動する有効領域が設定され、送信データ処理部は、抽出された顔領域が有効領域を逸脱した場合に、当該顔領域の位置に合わせて送信領域の設定位置を移動させることを特徴とする。
【0011】上記のように、第1の発明によれば、顔領域が有効領域を逸脱していないかを判定し、有効領域を逸脱している場合には、顔領域の位置に合わせて送信領域の位置を移動させる。これにより、顔領域の動きに送信領域が追従することとなり、利用者が写り具合を気にしなくても、おおよその位置にいるだけで、適切にフレーミングした自画像が相手へ送信されることになる。しかも、カメラ部の光軸移動部やズーム部のような大がかりな追従機構がいらず、画像通信端末の携帯性をそこなわない。また、顔領域が有効領域内にあれば、送信領域は移動しないので、相手側に送信される画像、特に利用者の背景画像が頻繁にぶれるようなことはなく、相手の酔いを防止できる。
【0012】第2の発明は、第1の発明に従属する発明であって、有効領域は、送信領域よりも小さく、かつ、送信領域内に設定されることを特徴とする。
【0013】上記のように、第2の発明によれば、顔領域は、送信領域を逸脱する前に必ず有効領域を逸脱するので、送信領域外に顔領域がはみ出して顔の一部が欠けるような事態を回避できる。
【0014】第3の発明は、第1の発明に従属する発明であって、送信データ処理部は、抽出された顔領域が有効領域を逸脱した場合、当該顔領域が送信領域の中心に位置するように、送信領域を移動させることを特徴とする。
【0015】第4の発明は、第1の発明に従属する発明であって、送信データ処理部は、抽出された顔領域が有効領域を逸脱した場合、当該顔領域が送信領域の中心より上方向に位置するように、送信領域を移動させることを特徴とする。
【0016】第5の発明は、第4の発明に従属する発明であって、送信データ処理部は、抽出された顔領域が有効領域を逸脱した場合、当該顔領域が送信領域の中心又は中心より上方向に位置するように、入力部から入力される送信モード情報に応じて切り替えて、送信領域を移動させることを特徴とする。
【0017】上記のように、第3の発明によれば、顔領域が送信領域の中心に位置するように移動させるので、顔アップの好ましいフレーミングを実現できる。また、第4の発明によれば、顔領域が送信領域の中心より上方向に位置するように移動させるので、バストアップの好ましいフレーミングを実現できる。さらに、第5の発明によれば、利用者の好みに応じて、上記顔アップ/バストアップのフレーミングを選択できる。
【0018】第6の発明は、第4の発明に従属する発明であって、表示部は、入力部から入力される情報に応じて、送信領域内の画像と顔領域とをモニタ表示し、利用者は、モニタ表示を参照して、入力部への入力により送信領域の位置を縦横方向に調節可能なことを特徴とする。
【0019】上記のように、第6の発明によれば、利用者は、送信領域内の画像と顔領域とをモニタし、送信領域の位置を適宜調節することによって、任意のフレーミングで自画像を相手に送信できる。
【0020】第7の発明は、カメラ部で撮影された利用者の画像を相手に送信する画像通信端末であって、利用者からの入力を受け付ける入力部と、利用者を撮影するカメラ部と、カメラ部で撮影された画像から、利用者の顔の位置及び大きさ(顔領域)を抽出する顔抽出部と、利用者に画像を表示する表示部と、相手の情報処理装置に対し、少なくとも画像の通信を行う通信部と、カメラ部で撮影された画像の領域よりも小さく、かつ、当該画像の領域内で移動可能に設定される矩形の送信領域の画像を、通信部へ出力する送信データ処理部とを備え、カメラ部で撮影された画像の領域内に、送信領域と一体的に移動する有効領域が設定され、送信データ処理部は、抽出された顔領域が有効領域を逸脱した場合に、当該顔領域の位置に合わせて送信領域の設定位置を移動させ、かつ、抽出された顔領域の画像輝度に基づいて、カメラ部で撮影された画像内にある顔の視認性が向上するように、送信領域の画像輝度を補正して通信部へ出力することを特徴とする。
【0021】第8の発明は、第7の発明に従属する発明であって、送信データ処理部は、送信領域の画像輝度に加え、色調も補正して通信部へ出力することを特徴とする。
【0022】第9の発明は、カメラ部で撮影された利用者の画像を相手に送信する画像通信端末であって、利用者からの入力を受け付ける入力部と、利用者を撮影するカメラ部と、カメラ部で撮影された画像から、利用者の顔の位置及び大きさ(顔領域)を抽出する顔抽出部と、利用者に画像を表示する表示部と、相手の情報処理装置に対し、少なくとも画像の通信を行う通信部と、カメラ部で撮影された画像の領域よりも小さく、かつ、当該画像の領域内で移動可能に設定される矩形の送信領域の画像を、通信部へ出力する送信データ処理部とを備え、カメラ部で撮影された画像の領域内に、送信領域と一体的に移動する有効領域が設定され、送信データ処理部は、抽出された顔領域が有効領域を逸脱した場合に、当該顔領域の位置に合わせて送信領域の設定位置を移動させ、かつ、抽出された顔領域の画像輝度に基づいて、カメラ部で撮影された画像内にある顔の視認性が向上するように、カメラ部の露出レベルの値を設定することを特徴とする。
【0023】上記のように、第7〜第9の発明によれば、逆光のような場合でも、利用者の顔が常に見えるような画像を相手側へ送信することが可能となる。これにより、屋外においても周りの照明環境を気にすることなく画像通信端末を用いて相手と対話することが可能となる。
【0024】第10の発明は、カメラ部で撮影された利用者の画像を相手に送信する画像通信端末であって、利用者を撮影するカメラ部と、カメラ部で撮影された画像から、利用者の顔の位置を抽出する顔抽出部と、利用者に相手から受信した画像を表示する表示部と、抽出された顔の位置に基づいて、カメラ部で撮影された画像中における利用者の顔の位置を、利用者に通知する通知制御部と、相手の情報処理装置に対し、少なくとも画像の通信を行う通信部とを備える。
【0025】上記のように、第10の発明によれば、利用者は、撮影画像中の自分の位置を通知されるので、自分の姿が画面を逸脱していない場合であっても、自分の位置を確認しながら安心して相手との会話を進めることができる。万一、利用者が画面から逸脱しても、相手の姿が突如変化するようなことはないので、利用者は、落ち着いて通知を参照しながら、正しい位置へ復帰し、会話を継続できる。しかも、カメラ部に利用者への追従機構を設ける必要はないので、画像通信端末を軽量化かつ低消費電力化させることができる。このため、携帯(テレビ)電話やモバイル端末等の携帯性が重視される機器にも、好適に用いることができる。
【0026】第11の発明は、第10の発明に従属する発明であって、顔抽出部は、利用者の顔の位置と共に顔の大きさも抽出し、通知制御部は、カメラ部で撮影された画像中における利用者の顔の位置及び大きさを、利用者に通知することを特徴とする。
【0027】上記のように、第11の発明によれば、顔領域の大きさも抽出して通知することにより、利用者は、顔領域の位置及び大きさの両方の情報を得ることができる。従って、利用者は、これらの情報を参照して、画面上の位置と遠近方向の位置とを、適正に保持することができる。また、利用者は、自画像を得なくとも、自分が画面のどの位置にどの位の大きさで写っているのかを確認できる。
【0028】第12の発明は、第10の発明に従属する発明であって、通知制御部は、抽出された顔の位置のみ又は位置と大きさとを示す目印を、表示部に表示させることを特徴とする。
【0029】上記のように、第12の発明によれば、利用者は、表示部に表示される相手の姿を見ながら、通常の会話と同じように集中して会話を行える。また、利用者は、簡潔な目印を参照して、自分の位置を確認できる。
【0030】第13の発明は、第12の発明に従属する発明であって、目印は、相手から受信した画像上に表示されることを特徴とする。
【0031】上記のように、第13の発明によれば、相手の姿の上に目印が現れるので、目印のためだけに広い画面の領域を確保する必要がなく、相手の姿をより大きくかつ見易く表示できる。しかも、利用者は、目印を見るために視線を変える必要がなく、長時間会話しても疲労が少ない。
【0032】第14の発明は、第12の発明に従属する発明であって、目印は、相手から受信した画像外に表示されることを特徴とする。
【0033】上記のように、第14の発明によれば、目印を相手の画像から外すことにより、相手の画像に目印が干渉せず、より鮮明に相手の姿を見ることができる。
【0034】第15の発明は、第12の発明に従属する発明であって、通知制御部は、抽出された顔の位置を、表示部とは別個に備える位置通知部を介して通知することを特徴とする。
【0035】上記のように、第15の発明によれば、位置通知部を表示部とは別個に備えることにより、表示部の画面全部を相手の姿の表示に割り当てることができるので、相手の姿をより広くかつ見易く表示できる。
【0036】第16の発明は、第10の発明に従属する発明であって、通知制御部によって行われる利用者への通知方法を、利用者からの指示に従って切り替え可能とすることを特徴とする。
【0037】上記のように、第16の発明によれば、利用者は、好みの通知方法を選択することができる。
【0038】第17の発明は、第1〜第16の発明に従属する発明であって、顔抽出部は、カメラ部で撮影された画像からエッジ部(人物の外郭や顔の輪郭等に相当する画素)を抽出して、当該エッジ部だけの画像(エッジ画像)を生成するエッジ抽出部と、予め定めた形状を、相似で大きさを異ならせた種々のサイズによって、中心点で同心状に複数設けたテンプレートを記憶するテンプレート記憶部と、テンプレートを構成する各サイズの形状毎に、エッジ画像上の座標位置と投票数とを対応付けてそれぞれ記憶する投票結果記憶部と、エッジ部の各画素位置にテンプレートの中心点を順次移動させ、移動させた当該画素位置毎に、各サイズの形状を形成する全画素の位置に対応する各座標位置について、投票結果記憶部に記憶されている投票数をそれぞれ増加又は減少させる投票部と、投票結果記憶部に記憶されている各投票数に基づいて、対象画像に含まれる顔の位置及び大きさを求める解析部とを備える。
【0039】上記のように、第17の発明によれば、処理負担が軽い投票処理(基本的には加算のみ)とその評価だけで、顔の位置を高速に検出できる。しかも、相似で同心状の複数の形状を備えたテンプレートを用いているから、顔を含むであろうエッジ部が、これらの形状のうち、いずれの大きさに近いかという実質的な近似を行っていることになり、顔の大きさも高速に抽出できる。このように、処理負担を大幅に軽減できるので、現状のパーソナルコンピュータレベルの処理能力でも、ほぼ実時間で顔を抽出できる。また、対象画像のうち、どの部分に顔領域があるかという点や、顔領域の個数などは、抽出前に不明であって差し支えなく、広い範囲の対象画像について、一様に顔を検出でき、極めて汎用性が高い。
【0040】第18の発明は、第17の発明に従属する発明であって、予め定めた形状は、円であることを特徴とする。
【0041】上記のように、第18の発明によれば、形状群は、円であるため、テンプレートの中心点から、形状の全ての画素までの距離が常に一定になり、投票結果の精度を高く保持できる。
【0042】第19の発明は、第1〜第16の発明に従属する発明であって、顔抽出部は、所定のテンプレート画像を入力し、当該画像のエッジ法線方向ベクトルを求め、当該エッジ法線方向ベクトルから評価ベクトルを生成し、当該評価ベクトルを直交変換するテンプレート画像処理部と、カメラ部で撮影された画像を入力し、当該画像のエッジ法線方向ベクトルを求め、当該エッジ法線方向ベクトルから評価ベクトルを生成し、当該評価ベクトルを直交変換する入力画像処理部と、テンプレート画像及び撮影された画像のそれぞれについて生成された直交変換後の各評価ベクトルについて、対応スペクトルデータを積和計算する積和部と、積和計算の結果を逆直交変換して類似値のマップを生成する逆直交変換部とを備え、評価ベクトルは、該当する画像のエッジ法線方向ベクトルを偶数倍角変換した成分を含み、類似値の算出式、直交変換及び逆直交変換は、いずれも線形性を有するものであることを特徴とする。
【0043】上記のように、第19の発明によれば、背景部分の輝度ばらつきにより、テンプレート画像のエッジ法線方向ベクトルと、カメラ部で撮影された画像(入力画像)のエッジ法線方向ベクトルとのなす角θの内積(cosθ)の正負が反転する場合でも、類似値に影響が無く、正当にマッチングを評価できる。
【0044】第20の発明は、第19の発明に従属する発明であって、顔抽出部は、評価ベクトルの表現において、エッジ法線方向ベクトルを極座標表現した場合の角度に基づいて計算した値を用いることを特徴とする。
【0045】第21の発明は、第1〜第16の発明に従属する発明であって、顔抽出部は、カメラ部で撮影された画像から顔として抽出された位置及び大きさが、真に顔であるか否かを判定する顔・非顔判定部をさらに備え、顔と判定した場合にのみ抽出結果を出力することを特徴とする。
【0046】第22の発明は、第17の発明に従属する発明であって、顔抽出部は、投票結果記憶部に記憶されている内容に基づいて、カメラ部で撮影された画像から顔として抽出された位置及び大きさが、真に顔であるか否かを判定する顔・非顔判定部をさらに備え、顔と判定した場合にのみ抽出結果を出力することを特徴とする。
【0047】第23の発明は、第19の発明に従属する発明であって、顔抽出部は、逆直交変換部で生成された類似値に基づいて、カメラ部で撮影された画像から顔として抽出された位置及び大きさが、真に顔であるか否かを判定する顔・非顔判定部をさらに備え、顔と判定した場合にのみ抽出結果を出力することを特徴とする。
【0048】上記のように、第21〜第23の発明によれば、実際の顔が顔領域の第1候補以外にある場合でも、安定した顔領域の抽出が可能になる。また、画像中に顔がない場合でも顔がないと判定することができるので、顔の位置を移動して表示する必要がない場合を自動的に検出することが可能になる。
【0049】第24の発明は、第21の発明に従属する発明であって、顔・非顔判定部は、カメラ部で撮影された画像から顔として抽出された領域から得られる画像特徴を用いて、サポートベクトル関数の判定結果に基づいて顔・非顔の判定を行うことを特徴とする。
【0050】第25の発明は、第24の発明に従属する発明であって、顔・非顔判定部は、カメラ部で撮影された画像から顔として抽出された領域から得られるエッジ法線方向ベクトルを画像特徴とすることを特徴とする。
【0051】第26の発明は、第24の発明に従属する発明であって、顔・非顔判定部は、カメラ部で撮影された画像から顔として抽出された領域から得られるエッジ法線のヒストグラムを画像特徴とすることを特徴とする。
【0052】
【発明の実施の形態】以下、図面を参照しながら、本発明の各実施形態を説明する。
(第1の実施形態)図1は、本発明の第1の実施形態に係る画像通信端末の構成を示すブロック図である。図1において、第1の実施形態に係る画像通信端末は、入力部2と、表示部3と、カメラ部4と、表示制御部5と、自画像メモリ6と、顔抽出部7と、送信データ処理部8と、通信部9と、受信データ処理部10と、相手画像メモリ11とを備える。まず、第1の実施形態に係る画像通信端末の各構成の概要を説明する。
【0053】図1に示すように、本実施形態の画像通信端末では、入力部2、表示部3及びカメラ部4が、利用者1に臨んでいる。入力部2は、キーボード(テンキー等を含む)やマウス等で構成され、利用者1が送信モード及びその他必要な情報を入力するために利用される。表示部3は、LCD等で構成され、画面上で相手の画像や表示制御部5の指示に従った目印等を、利用者1に向けて表示する。目印については後で詳述するが、利用者1が画面中における自分の顔の位置や大きさを確認できる指標である。カメラ部4は、レンズ等の光学系及びCCD等の電気系で構成され、利用者1を撮影するために用いられる。このカメラ部4で撮影された画像(以下、対象画像という)は、フレーム毎に自画像メモリ6に格納される。表示制御部5は、表示部3の画面表示(主として、受信した相手画像の表示)を制御する。また、表示制御部5は、入力部2から入力される情報に応じて、顔抽出部7で抽出された顔領域に基づいた目印を、表示部3の画面上に表示させる。
【0054】顔抽出部7は、自画像メモリ6に格納された対象画像に対して、存在する顔の位置及び大きさを調べ、これらの情報を顔領域として表示制御部5及び送信データ処理部8へ出力する。なお、この顔抽出部7については、本発明に適用可能な手法を後で詳細に説明する。送信データ処理部8は、顔抽出部7で抽出された顔領域の位置に合わせて送信領域を設定する。そして、送信データ処理部8は、入力部2から指示された送信モードに従って、自画像メモリ6に格納された対象画像の内、送信領域内の画像データを通信部9へ送出する。通信部9は、通信経路を介して、相手の情報処理装置(画像通信端末を含む)と、少なくとも画像データの通信を行う。ここでの通信モードは任意であり、例えば、内線電話のように基地局等を介さない子機間通信でもよいし、テレビ電話のような基地局等を介する同期型通信又は非同期型通信でもよい。受信データ処理部10は、通信部9を介して受信した相手の画像データを処理して、フレーム毎に相手画像メモリ11へ格納する。
【0055】なお、本実施形態では、通信部9が双方向通信を行う場合を一例に挙げて説明するが、利用者1から相手に画像データを単方向通信するビデオメール等にも本発明を適用することができる。この場合、相手の情報処理装置は、送信される画像データを受信して画面表示させる構成のみを持つものであってもよい。
【0056】次に、図2〜図6を用いて、送信データ処理部8が行う顔領域の位置に合わせた追従処理について説明する。まず、カメラ部4による撮影領域30と、通信部9から送信される画像の送信領域31との関係は、一般的に図3のようになる。送信領域31は、撮影領域30よりも小さな矩形領域である。カメラ部4は、送信領域31より広い撮影領域30で被写体(利用者1)を撮影するが、画像通信端末からは送信領域31内の画像だけが相手に送信される。図3の例では、撮影領域30は、x方向長さA、y方向長さBであり、送信領域31は、x方向長さL、y方向長さMである。また、L<A及びM<Bであり、各々の長さA、B、L、Mは、固定的である。図3の例では、送信領域31の左上点(x1,y1)を基準点としている。この基準点は、撮影領域30内を移動可能であり、基準点が定まることで、送信領域31の位置が一意に定まるようにしている。なお、送信領域31の左上点以外の点を基準としてもよい。
【0057】一方、本実施形態では、顔抽出部7で抽出された顔領域の位置及び大きさを、円形の目印Rで表現する。この目印Rの中心が顔領域の中心であり、目印Rの直径が顔領域の大きさに相当する。なお、目印Rは、円形以外の形状であっても構わない。
【0058】図3の状態では、目印Rで示される顔領域が送信領域31の右側へ逸脱している。従って、目印Rに基づいて図中矢印で示すように、送信領域31を右側へ移動させれば、好ましいフレーミングになる。そこで、本実施形態では、目印Rが内部に含まれるように送信領域31を移動させる。図4は、送信領域31を移動させた後の状態(左上点(x2,y2))を示している。ここで、本実施形態では、図4に示しているように、送信領域31の内側にさらに有効領域32を設定し、有効領域32と送信領域31とが一体的に移動するようにしている。そして、目印Rが送信領域31ではなく有効領域32を逸脱したかどうかをチェックし、逸脱した場合には、図3から図4のように送信領域31及び有効領域32を移動させることとした。
【0059】ここで、有効領域32を狭くすると、目印Rが有効領域32を逸脱する確率が上がり、相手の酔いを招来しやくすくなる。従って、図4に示しているように、有効領域32を広めにとって、送信領域31の移動を抑えることが望ましい。このようにしても、顔領域は見易い位置にある。
【0060】加えて、本実施形態では、送信領域31の移動直後の目印Rの位置を、送信モード(バストアップモード又はバストアップモード)によって切り替えられるようにしている。図4は、目印Rが送信領域31に対してx方向中心かつy方向中心よりやや上方に位置する、バストアップモードによる画像表示手法の例である。なお、顔アップモードとは、目印Rが送信領域31に対してx方向中心かつy方向中心に位置する画像表示手法である。さらには、本実施形態では、図5に示すように、これらのモードから目印Rを好みの方向にオフセットさせることを可能とする。これによれば、例えば、利用者1が自分と共に持参している物を一緒に相手に見せたいと考えるような場合等、種々の要求に対応できるようになる。
【0061】次に、図2を参照して、送信データ処理部8が行う追従処理の各プロセスを説明する。まず、利用者1が、入力部2から送信モード(バストアップモード/顔アップモード)を入力する(ステップS201)。次に、カメラ部4によって利用者1が撮影され、対象画像として自画像メモリ6に格納される(ステップS202)。この撮影の時には、利用者1は、広い撮影領域30内に顔が写る位置に居さえすれば十分である。次に、顔抽出部7が、対象画像内の顔領域(顔の位置及び大きさ)を抽出し、抽出した顔領域を送信データ処理部8へ出力する(ステップS203)。
【0062】顔領域が抽出されると、送信データ処理部8は、送信モードに従って顔領域に送信領域31を合わせる(ステップS204)。具体的には、図4に示すように、顔領域が送信領域31内に含まれるように送信領域31の左上点が決定される。次に、送信領域31内に、有効領域32が設定され(ステップS205)、図4の送信領域31内の画像が表示部3によって利用者1へモニタ表示される(ステップS206)。なお、このステップS206では、利用者1自身の画像表示を省略し、目印Rのみを表示してもよい。次に、利用者1が、入力部2を用いてモニタ表示されたフレーミングでよいか(送信領域31をロックするか)どうかを入力する(ステップS207)。利用者1が、送信領域31のオフセットを希望する場合には、入力部2は、移動情報の入力を受け付けて、送信領域31の位置を調節する(ステップS215)。その後、処理がステップS205へ戻り、再度利用者1の確認を仰ぐ。
【0063】上記ステップS207でフレーミングが完了すると、相手との画像通信が開始される(ステップS208)。なお、適当な割り込み処理部を設けて、通信途中でもステップS201〜S207の処理を行えるようにすることもできる。通信が開始されると、通信部9及び受信データ処理部10を介して、相手画像メモリ11に格納された相手の画像が、表示部3の画面上に表示される(ステップS209)。ここで再び、カメラ部4が利用者1を撮影し(ステップS210)、顔抽出部7が顔領域を抽出し(ステップS211)、送信データ処理部8が顔領域が有効領域32を逸脱したかどうかチェックする(ステップS212)。
【0064】ここで、図6に示すように逸脱していれば、送信データ処理部8は、上記ステップS204と同様に送信モードに従って送信領域31の左上点を移動させた後(ステップS213)、顔抽出部7において再び抽出された顔領域が有効領域32を逸脱したかどうか再チェックする(ステップS211,S212)。一方、逸脱していなければ、送信データ処理部8は、送信領域31を移動させることなく通信を継続させる。なお、利用者が自分の写り具合を確認しながら安心して通信したい場合には、例えばピクチャインピクチャ方式を用いて、相手の画像と共に自分の画像が画面内に表示されるようにしてもよい。そして、ステップS209〜S213の処理が、通信終了まで繰り返される(ステップS214)。
【0065】以上のように、本発明の第1の実施形態に係る画像通信端末によれば、大掛かりな追従機構を用いることなく、画像通信端末の携帯性を損なわずに、実質的に利用者の動きに追従した撮影及び画像通信を行うことができる。すなわち、利用者は、写り具合を気にしなくとも好ましいフレーミングで撮影され、自画像が相手に送信される。また、顔領域が有効領域内にあれば、送信領域は移動しないので、相手側に送信される画像、特に利用者側の背景画像が、頻繁にぶれるようなことがなくなり相手の酔いを防止できる。
【0066】ところで、周知のように、カメラ部4に用いるカメラによっては、自動露出補正の機能を有するものがある。自動露出補正とは、明るさが最適となるように自動的に画像の輝度を補正する機能であり、一般に画像全体又は数点の平均輝度に基づいて画像内の各画素の輝度を変更することで行われる。しかしながら、逆光等のように対象画像全体の平均輝度に比べ顔領域の平均輝度が低い場合には、利用者1の顔が真っ黒になってしまうという問題が残る。そこで、このような場合の対策として、送信データ処理部8では、顔抽出部7で抽出された顔領域に基づいて、カメラ部4が撮影した対象画像の明るさを顔の視認性が向上するように輝度を補正した後、通信部9へ送信するようにすればよい。
【0067】具体的には、送信データ処理部8が、顔領域内部の平均輝度の理想値(理想平均輝度a)を予め記憶している。そして、送信データ処理部8は、顔抽出部7で抽出された顔領域内部の平均輝度Iを求め、カメラ部4で撮影された対象画像の輝度Y1を新たな輝度Y2に変更するため、対象画像の各画素に対して、Y2=Y1×(a/I)を施す。これにより、顔領域内部が理想平均輝度aとなるように補正することができる。また、この理想平均輝度aを用いて、輝度だけでなく色相についても同様に変更することも考えられる。なお、これ以外に、送信データ処理部8が、顔領域内部が平均輝度Iである場合に顔領域が理想平均輝度aとなる、設定すべきカメラ部4の露出レベルを持っている場合もあり得る。この場合には、送信データ処理部8が、顔領域内部の平均輝度Iに対する露出レベルをカメラ部4へ通知することにより、顔領域の明るさが理想値になるように補正することが可能となる。
【0068】このようにすれば、逆光のような場合でも、利用者1の顔が常に見えるような画像を相手側へ送信することが可能となる。これにより、屋外においても周りの照明環境を気にすることなく画像通信端末を用いて相手と対話することが可能となる。
【0069】(第2の実施形態)上記第1の実施形態では、簡単な追従機構を用い、画像通信端末側が利用者の動きに自動的に合わせることによって、利用者をフレーム内に捉えた適切な画像を相手側に送信できる手法を説明した。次に、この第2の実施形態では、追従機構を用いることなく、利用者側が画像通信端末に合わせて動けるような表示を行うことにより、利用者をフレーム内に捉えた適切な画像を相手側に送信できる手法を説明する。
【0070】図7は、本発明の第2の実施形態に係る画像通信端末の構成を示すブロック図である。図7において、第2の実施形態に係る画像通信端末は、入力部22と、表示部3と、カメラ部4と、表示制御部25と、自画像メモリ6と、顔抽出部7と、送信データ処理部8と、通信部9と、受信データ処理部10と、相手画像メモリ11とを備える。まず、第2の実施形態に係る画像通信端末の各構成の概要を説明する。
【0071】図7に示すように、本実施形態の画像通信端末では、入力部22、表示部3及びカメラ部4が、利用者1に臨んでいる。入力部22は、キーボード(テンキー等を含む)やマウス等で構成され、利用者1が通知モード、送信モード及びその他必要な情報を入力するために利用される。本実施形態では、入力部22に点灯(又は点滅)が可能なテンキーが具備されている。表示部3は、LCD等で構成され、画面上で相手の画像や表示制御部25の指示に従った目印等を、利用者1に向けて表示する。目印については後で詳述するが、利用者1が画面中における自分の顔の位置や大きさを確認できる指標である。なお、入力部22及び表示部3によって、相手側への送信画像における利用者1の顔の位置及び大きさを、利用者1へ通知する通知部12が構成される。カメラ部4は、レンズ等の光学系及びCCD等の電気系で構成され、利用者1を撮影するために用いられる。このカメラ部4で撮影された画像(対象画像)は、フレーム毎に自画像メモリ6に格納される。表示制御部25は、表示部3の画面表示(主として、受信した相手画像の表示)を制御する。また、表示制御部25は、入力部22から入力される通知モードに応じ、顔抽出部7で抽出された顔領域に基づいて、目印を表示部3の画面上に表示させたり、入力部22のテンキーを点灯させたりする。
【0072】顔抽出部7は、自画像メモリ6に格納された対象画像に対して、存在する顔の位置及び大きさを調べ、これらの情報を顔領域として表示制御部25及び送信データ処理部8へ出力する。なお、この顔抽出部7については、本発明に適用可能な手法を後で詳細に説明する。送信データ処理部8は、入力部22から指示された送信モードに従って、自画像メモリ6に格納された対象画像を、そのまま又は後述する加工を施して通信部9へ送出する。通信部9は、通信経路を介して、相手の情報処理装置(画像通信端末を含む)と、少なくとも画像データの通信を行う。ここでの通信モードは任意であり、例えば、内線電話のように基地局等を介さない子機間通信でもよいし、テレビ電話のような基地局等を介する同期型通信又は非同期型通信でもよい。受信データ処理部10は、通信部9を介して受信した相手の画像データを処理して、フレーム毎に相手画像メモリ11へ格納する。
【0073】次に、図8〜図10を参照して、表示制御部25が表示部3の画面上に表示させる目印の一例を説明する。なお、これらの例は、適宜組み合わせて用いることができる。まず、図8(a)〜(d)は、利用者1の顔の位置(ここでは、顔抽出部7で抽出された顔領域の中心)だけを、表示部3の画面上に目印Rで表示させる例である。図中矩形で示した領域が表示部3の画面であり、ここに相手の画像が表示される。図8(a)〜(c)では、目印Rが相手の画像内に重畳させて表示される。図8(d)では、目印Rが相手の画像外に表示される。これらの目印Rの表示は、相手の画像のフレームに同期して更新してもよいし、非同期で更新してもよい。図8(a)は、目印Rとして十字線を用い、線の交点が利用者1の顔の位置を示すようにしたものである。図8(b)は、目印Rとして矢印を用い、双方の矢印で特定される点が利用者1の顔の位置を示すようにしたものである。図8(c)は、目印Rとして十字又は×印の図形を用い、図形の位置が顔の位置を示すようにしたものである。図8(d)は、目印Rとして相手の画像の枠外に表示される縦横ルーラを用い、縦ルーラ上に付された印と横ルーラ上に付された印とで特定される点が利用者1の顔の位置を示すようにしたものである。
【0074】次に、図9(a)〜(c)は、利用者1の顔の位置及び大きさ(顔抽出部7で抽出された顔領域全体)を、表示部3の画面上に目印Rで表示させる例である。図9(a)は、目印Rとして縦横2本ずつの平行線を用い、この平行線で囲まれた矩形領域が利用者1の顔の位置及び大きさを示すようにしたものである。図9(b)は、目印Rとして相手の画像の枠外に表示される縦横ルーラを用い、縦ルーラ上に付された幅付き印と横ルーラ上に付された幅付き印とで特定される領域が利用者1の顔の位置及び大きさを示すようにしたものである。図9(c)では、目印Rとして顔領域に近似する円(又は楕円)を用い、円領域が利用者1の顔の位置及び大きさを示すようにしたものである。
【0075】なお、これらの目印Rは、相手の画像に依存せずに表示させてもよいし、依存して表示させてもよい。前者としては、例えば、相手の画像にかかわらず所定の色(黒一色等)で目印Rを表示させることである。後者としては、例えば、表示させる目印Rが相手の画像上でわかり難くなる場合に、目印Rを表示させる画素の輝度を変化させたり、そのRGB値を変化(反転)させることである。いずれにしても、これらの目印Rは、相手の画像の邪魔にならぬように表示することが望ましい。
【0076】さらに、図10は、利用者1の顔のおおよその位置を、表示部3ではなく入力部22で表示させる例である。図10に示すように、目印Rとして点灯が可能なテンキーを用い、このテンキーのいずれかを点灯させることで顔の位置を利用者1へ通知することができる。図10では、「3」のキーを点灯させているので、顔の位置が画面の「右上」にあることを通知できる。同様に、「1」のキーなら画面の「左上」、「5」のキーなら画面の「真中」、「9」のキーなら画面の「右下」というように、概略の位置表示を行える。なお、このような概略位置の通知であっても、十分実用に値する。
【0077】なお、本実施形態では、入力部22から表示制御部25へ与えられる通知モードによって、図8〜図10のいずれの方法で顔の位置を通知させるかを切り替えることが可能なようにしている。さらに、これらの通知は、常時行ってもよいし、利用者1が入力部22で通知を指示した時のみ行ってもよい。また、概略位置の通知を行う方法としては、図10に示す入力部22のテンキーの点灯以外にも、音や光によることもできる。例えば、音の場合には、スピーカから発するインターバルや周波数を顔の位置に応じて変化させたり、光の場合には、点灯させる明るさや点滅のインターバルを顔の位置に応じて変化させること等が考えられる。
【0078】次に、図11を参照して、送信データ処理部8が通信部9を介して送信する利用者1の画像例について説明する。本実施形態では、相手側へ送信される画像が、入力部22から送信データ処理部8へ与えられる送信モードによって、選択できるようになっている。ここで、利用者1側(自分側)では、相手の画像の上に、図11(a)のような目印R(図9(a)〜(c)の組み合わせ)が表示されているものとする。このとき、送信データ処理部8は、送信モードによって、種々の形態で自画像を相手に送信することができる。例えば、送信モードが「通常」であれば、図11(b)のように、送信データ処理部8は、カメラ部4の取得画像をそのまま送信する。また、送信モードが「目印付き」であれば、図11(c)に示すように、送信データ処理部8は、顔抽出部7で抽出された顔領域を参照して、取得画像に目印Rを合成した自画像を作成し、相手に送信する。さらに、送信モードが「顔のみ」であれば、図11(d)に示すように、送信データ処理部8は、取得画像から顔抽出部7で抽出された顔領域のみを切り取った自画像を、相手に送信する。
【0079】送信モードに基づくこれらの画像処理は、周知技術によって簡単に実現することができるので、その詳しい説明は省略する。ここで、図11(c)のように「目印付き」で自画像を送信すれば、例えば自分がどこに居るのかわかり難い画像(暗闇の中に居る画像)を送信する場合であっても、相手に自分の位置を正確に把握させることが可能となる。また、図11(d)のように、「顔のみ」で自画像を送信すれば、背景が写らないので相手に見られたくない部分を隠すことができ、プライバシーを保護できる。なお、このように背景を隠しても、顔の表情等は相手に伝わるので、会話に支障はない。なお、上記説明した送信モードは、互いにユニークであれば、他の任意の区別法によることも可能である。
【0080】以上のように、本発明の第2の実施形態に係る画像通信端末によれば、抽出した顔領域に基づく目印を用いて、利用者の画面上の位置関係を簡潔かつ適切に表現することができる。従って、利用者は、自分の顔の位置が画面を逸脱した場合はもとより、自分の顔の位置が画面を逸脱していない場合であっても、自分の顔の位置を確認しながら、安心して相手との会話を進めることができる。また、上記第1の実施形態に比べ追従機構を省略しているので、画像通信端末の携帯性を良好にさせることができる。
【0081】(顔抽出部7の詳細な実施例)次に、上述した本発明の第1及び第2の実施形態に係る画像通信端末に適用できる顔抽出部7の具体的な実施例を、3通り説明する。なお、顔抽出部7には、以下に説明する3つの手法の他に、色情報に基づくもの、目や口等の顔の部分に着目するもの、テンプレートマッチングによるもの等、周知のさまざまな手法を適用させることが可能である。
【0082】<実施例1>図12は、実施例1の顔抽出部7の構成を示すブロック図である。図12において、顔抽出部7は、エッジ抽出部51と、テンプレート記憶部52と、投票結果記憶部53と、投票部54と、解析部55とを備える。
【0083】エッジ抽出部51は、カメラ部4が撮影した対象画像からエッジ部を抽出し、エッジ部だけの画像(以下、エッジ画像という)を生成する。ここで、エッジ部とは、人物の外郭や顔の輪郭等に相当する部分(画素)であって、対象画像内の高周波成分となる部分である。このエッジ抽出部51には、対象画像から高周波成分を取り出すSobelフィルタ等を用いるのが好ましい。
【0084】テンプレート記憶部52には、予め定めた形状を、相似で大きさを異ならせた種々のサイズによって、中心点で同心状に複数設けたテンプレートのデータが記憶されている。このテンプレートの形状には、円、楕円、正多角形、多角形等を用いることができるが、中心点から形状線(形状を形成する各画素)までの距離が常に一定である円を用いることが最も好ましい。これにより、後述する投票結果の精度を高くさせることができる。以下、この実施例1では、図13に示すように、中心点がPで半径が異なる同心円を複数設けたテンプレートを用いた場合を説明する。ここで、テンプレートを構成する複数の円t1〜tn(nは、任意の整数)は、図13に示すテンプレートのように、一定間隔で半径が変化する構成であってもよいし、不定間隔で半径が変化する構成であってもよい。また、テンプレートを構成する複数の円t1〜tnは、全ての線幅が1ドット(対象画像の1画素に相当)で構成されてもよいし、一部又は全部の線幅が2ドット以上(すなわち、円環形状)で構成されてもよい。なお、以下の説明では、円及び円環を総称して単に「円」という。
【0085】この複数の円t1〜tnは、まとめて1つのテンプレートとして扱われてテンプレート記憶部52に記憶されるが、実際の処理では、テンプレートを構成する各円t1〜tnは、独立して扱われることとなる。このため、各円t1〜tnを形成する画素データは、テンプレート記憶部52において、例えばテーブル形式でそれぞれ記憶される。
【0086】投票結果記憶部53には、後述する投票部54において行われる投票処理の結果を記憶する領域(以下、投票記憶領域という)が、テンプレート記憶部52に記憶されているテンプレートを構成する各サイズの形状毎に、設けられている。この例では、各サイズの形状が円t1〜tnであるので、投票結果記憶部53には、円t1〜tnに関してn個の投票記憶領域が設けられることとなる。なお、この投票記憶領域は、対象画像に対応する範囲を有する。
【0087】投票部54は、エッジ抽出部51で生成されたエッジ画像について、テンプレート記憶部52に記憶されているテンプレートを用いて、投票処理を行う。図14は、投票部54で行われる投票処理の手順を示すフローチャートである。図14を参照して、投票部54は、まず、投票結果記憶部53にアクセスして、各投票記憶領域内の座標を表す成分(投票値)を、全て零に初期化する(ステップS601)。次に、投票部54は、エッジ画像内のエッジ部の先頭画素位置に、テンプレートの中心点Pをセットする(ステップS602)。この先頭画素位置は、例えば、エッジ画像上を左上から右上又は左下へ順次走査して行き、最初に検出されたエッジ部の画素の位置とすればよい。
【0088】次に、投票部54は、テンプレートを構成する形状(この例では、円t1〜tn)を特定するカウンタiを、「1」に初期化する(ステップS603)。次に、投票部54は、カウンタi(=1)によって特定される円t1について、円t1を形成する全画素のエッジ画像上のxy座標をそれぞれ取得する(ステップS604)。そして、投票部54は、投票結果記憶部53に設けられた円t1に関する投票記憶領域において、取得した各xy座標を表す成分にそれぞれ「1」を加算して投票を行う(ステップS605)。この処理が終わると、投票部54は、カウンタiを1つインクリメントして、i=2とする(ステップS607)。次に、投票部54は、カウンタi(=2)によって特定される円t2について、円t2を形成する全画素のエッジ画像上のxy座標をそれぞれ取得する(ステップS604)。そして、投票部54は、投票結果記憶部53に設けられた円t2に関する投票記憶領域において、取得した各xy座標を表す成分にそれぞれ「1」を加算して投票を行う(ステップS605)。
【0089】以降同様にして、投票部54は、i=nになるまでカウンタiを1つずつインクリメントしながら(ステップS606,S607)、テンプレートを構成する全形状である円t3〜tnについて、上記ステップS604及びS605の投票処理を繰り返し行う。これにより、各円t1〜tnに関する投票記憶領域のそれぞれに、先頭画素位置における投票処理が行われることになる。そしてさらに、投票部54は、エッジ部の次の画素位置にテンプレートの中心点Pをセットして上記ステップS603〜S607の処理を繰り返し行うことを、エッジ画像内のエッジ部の全画素に対して、1回ずつ行う(ステップS608,S609)。すなわち、投票部54による投票処理は、テンプレートの中心点Pがエッジ部の全画素を這うように行われる。
【0090】例えば、図15に示すエッジ画像に上記投票処理を施すことによって、投票結果記憶部53に設けられたn個の投票記憶領域には、図16に示すような投票数が記憶される。なお、図16では、図面を見易くするため、エッジ部の一部の画素位置で投票処理が行われた場合を示している。図16において、実線円の部分が、上記ステップS605においてテンプレートの各サイズの形状(円t1〜tn)に基づいて投票された座標成分に相当し、座標数「1」となる。また、上述したように各投票数は累積加算されるので、図16の実線円が交差する部分(図中、●印で示す)は、交差する数が多いほど投票数が高いことを表している。
【0091】そのため、中心点を持つ円又は楕円に近似した顔の輪郭を表現するエッジ部に、上述した投票処理を施せば、その中心点付近に高い投票数が集中することとなる。従って、高い投票値が集中する部分を判断すれば、顔の中心を特定することが可能になる。また、このような高い投票値が集中する現象は、テンプレートの中でも、顔の輪郭を表現するエッジ部の最小幅と等しい又は非常に近い半径を持つ円形状を用いた場合に、より顕著に現れる。従って、この現象がどの円形状の投票記憶領域に顕著に現れているかを判断すれば、顔の大きさを特定することが可能になる。この点は、一般化ハフ変換と似ていると言える。しかし、本発明の顔抽出方法では、同心状に複数サイズの形状を持つテンプレートを使用することにより、エッジ部の中心点と共にその大きさも一度に特定できるという点で、一般化ハフ変換とは明確に異なる。
【0092】なお、上記ステップS601において、各投票記憶領域内の座標を表す成分を、全て予め定めた最大値に初期化し、上記ステップS605において、取得した各xy座標を表す成分からそれぞれ「1」を減算して投票を行ってもよい。この場合、低い投票値が集中する部分を判断すれば、顔の中心を特定することが可能であり、この集中現象がどの円形状の投票記憶領域に顕著に現れているかを判断すれば、顔の大きさを特定することが可能になる。また、上記ステップS605において、投票数を加算又は減算させる値は「1」以外であってもよく、値を自由に設定することができる。
【0093】次に、投票結果記憶部53に記憶された投票結果に基づいて、対象画像の顔領域を特定する手法を説明する。解析部55は、投票部54による投票処理が完了した後、投票結果記憶部53に記憶された投票結果に基づいて、そのクラスタを評価して、対象画像に含まれる顔の位置及び大きさを求める。図17は、解析部55で行われる解析処理の手順を示すフローチャートである。
【0094】図17を参照して、解析部55は、まず、テンプレートを構成する形状(この例では、円t1〜tn)を特定するカウンタjを、「1」にセットする(ステップS701)。次に、解析部55は、カウンタj(=1)によって特定される円t1について、投票結果記憶部53の円t1に関する投票記憶領域に記憶されている投票結果を参照して、投票数が予め定めたしきい値G(例えば、200等)を越える成分だけを抽出する(ステップS702)。このしきい値Gは、対象画像の精細度や所望する抽出精度に基づいて、任意に定めることができる。次に、解析部55は、抽出した成分だけを対象に、クラスタリングを行い(ステップS703)、クラスタ化された各領域の分散値及び共分散値をそれぞれ計算する(ステップS704)。このクラスタリングにおける類似度は、ユークリッド平方距離、標準化ユークリッド平方距離、マハラノビスの汎距離又はミンコフスキー距離のいずれを用いて判断されてもよい。また、クラスタの形成には、最短距離法(SLINK:single linkage clustering method)、最長距離法(CLINK:complete linkage clustering method)又は群平均法(UPGMA:unweighted pair-group method using arithmetic averages)のいずれを用いてもよい。
【0095】次に、解析部55は、クラスタ化された各領域の分散値及び共分散値を、予め定めたしきい値Hと比較する(ステップS705)。そして、このステップS705において各値がしきい値H未満の場合、解析部55は、その領域の中心点を顔の中心点とみなして、この時のカウンタj(=1)が指す円t1のサイズ(直径)を顔の短軸長とし(ステップS706)、この短軸長に一定値(経験的に定める)を加えた長さを顔の長軸長として決定する(ステップS707)。そして、解析部55は、この決定した中心点、短軸長及び長軸長を、解析結果として保持する(ステップS708)。一方、上記ステップS705において各値がしきい値H以上の場合、解析部55は、その領域の中心点が顔の中心点ではないと判断して、次の処理に移る。
【0096】この処理が終わると、解析部55は、カウンタjを1つインクリメントして、j=2とする(ステップS710)。次に、解析部55は、カウンタj(=2)によって特定される円t2について、投票結果記憶部53の円t2に関する投票記憶領域に記憶されている投票結果を参照して、投票数が予め定めたしきい値Gを越える成分だけを抽出する(ステップS702)。次に、解析部55は、抽出した成分だけを対象に、クラスタリングを行い(ステップS703)、クラスタ化された各領域の分散値及び共分散値をそれぞれ計算する(ステップS704)。次に、解析部55は、クラスタ化された各領域の分散値及び共分散値を、予め定めたしきい値Hと比較する(ステップS705)。そして、このステップS705において各値がしきい値H未満の場合、解析部55は、その領域の中心点を顔の中心点とみなして、この時のカウンタj(=2)が指す円t2のサイズを顔の短軸長とし(ステップS706)、この短軸長に一定値を加えた長さを顔の長軸長として決定する(ステップS707)。そして、解析部55は、この決定した中心点、短軸長及び長軸長を、解析結果として追加して保持する(ステップS708)。一方、上記ステップS705において各値がしきい値H以上の場合、解析部55は、その領域の中心点が顔の中心点ではないと判断して、次の処理に移る。
【0097】以降同様にして、解析部55は、j=nになるまでカウンタjを1つずつインクリメントしながら(ステップS709,S710)、投票結果記憶部53に記憶されている各円t3〜tnに関する投票記憶領域について、上記ステップS702〜S708の解析処理を繰り返し行う。これにより、各円t1〜tnに関する投票記憶領域における、顔領域抽出の解析結果を得ることができる。この解析結果は、表示制御部5,25及び送信データ処理部8へ出力される。
【0098】このように、実施例1の顔抽出部7では、負担が軽い投票処理(基本的には加算処理のみ)と投票数の評価だけで、顔の位置を高速に抽出できる。しかも、相似で同心状の複数サイズの形状を備えたテンプレートを用いているので、顔領域であろうエッジ部が、これらの形状のいずれのサイズに近いかという実質的な近似を行っていることになり、顔の大きさも高速に抽出できる。
【0099】<実施例2>次に、実施例2として、直交変換後の空間でパターンマッチングを行うことにより処理量の削減を図り、携帯電話等のような限られた処理量を要求される端末において有効となる手法を説明する。図18は、実施例2の顔抽出部7の構成を示すブロック図である。図18において、顔抽出部7は、テンプレート画像処理部80と、入力画像処理部90と、積算部101と、逆直交変換部(逆FFT)102と、マップ処理部103とを備える。この実施例2の手法は、テンプレート画像処理部80及び入力画像処理部90において、テンプレート画像及び入力画像(対象画像)にそれぞれ線形性を有する直交変換を施し、それらを積算した後に逆直交変換して、類似値Lを求めるものである。
【0100】ここで、実施例2では、直交変換としてFFT(高速離散フーリエ変換)を使用する場合を説明するが、この他にHartley変換や数論的変換等を用いることもできる。これら他の変換方法を使用する場合には、以下の説明中の「フーリエ変換」とある部分を、これらの変換方法に読み替えればよい。また、テンプレート画像処理部80及び入力画像処理部90のいずれにおいても、エッジ法線方向ベクトルの内積を利用し、エッジ法線方向ベクトルの方向が近いほど、高い相関が出るようにしている。しかも、この内積は、偶数倍角表現を用いて評価される。以下簡単のため、偶数倍角の例として2倍角の場合を説明するが、4倍角や6倍角等の他の偶数倍角においても、実施例2と同様の効果を奏することができる。
【0101】まず、テンプレート画像処理部80について説明する。図18において、テンプレート画像処理部80は、エッジ抽出部81と、評価ベクトル生成部82と、直交変換部(FFT)83と、圧縮部84と、記録部85とを備える。
【0102】エッジ抽出部81は、入力されるテンプレート画像に対して、x方向及びy方向のそれぞれについて微分処理(エッジ抽出)を施し、テンプレート画像のエッジ法線方向ベクトルを出力する。本実施例2では、x方向について、
【数1】


なるSobelフィルタを用い、y方向について、
【数2】


なるSobelフィルタを用いている。これらのフィルタ(1)及び(2)より、次式(3)で定義されるテンプレート画像のエッジ法線方向ベクトルが求められる。
【数3】


【0103】評価ベクトル生成部82は、エッジ抽出部81からテンプレート画像のエッジ法線方向ベクトルを入力し、次に述べる処理を行って、テンプレート画像の評価ベクトルを直交変換部83へ出力する。まず、評価ベクトル生成部82は、次式(4)を用いて、テンプレート画像のエッジ法線方向ベクトルを長さについて正規化する。
【数4】


これは、照明変動のような撮影条件が変化する場合、エッジの強度(長さ)は影響を受け易いが、エッジの角度は影響を受け難いことを考慮させるためである。そこで、本実施例2では、後述するように、入力画像処理部90において対象画像のエッジ法線方向ベクトルを長さ「1」に正規化している。これに合わせて、テンプレート画像処理部80においても、テンプレート画像のエッジ法線方向ベクトルを長さ「1」に正規化している。また、周知のように、三角関数については次式(5)の倍角公式が成立する。
【数5】


この倍角公式を用いて、エッジベクトルを次式(6)に基づいて正規化する。
【数6】


【0104】以下、この式(6)について説明する。まず、定数aは、微小エッジ除去用のしきい値であって、定数aより小さなベクトルをゼロベクトルにしているのは、ノイズ等を除去するためである。次に、xy各成分が、式(4)のxy各成分の倍角に係る余弦・正弦の従属関数になっている点について、説明する。ここで、テンプレートの評価ベクトルTと、対象画像の評価ベクトルIとのなす角をθとし、その内積、つまりcosθを類似尺度として用いると、次のような問題がある。例えば、テンプレート画像が、図19(a)に示すもので、対象画像が、同図(b)に示すものであるとする。ここで、図19(b)の背景部分の画像は、左半分が対象物よりも明るく、右半分が対象物よりも暗くなっている。画像のみで見れば、図19(a)のテンプレート画像の中心が、同図(b)の対象画像の中心に一致する時、対象物が完全に一致するので、このとき類似値は最大にならなければならない。そして、エッジ法線方向ベクトルは、対象物の画像から外側に向くものを正とすると、図19(b)の明るい背景部分でも暗い背景部分でも、対象物から見て同じ向き(外向き/内向き)でなければならない。しかしながら、このとき、図19(b)の背景部分の輝度が、対象物の左右でばらついていると、図19(b)に矢印で示しているように、向きが反対(明るい背景部分では対象物の外側向き、暗い背景部分では対象物の内側向き)になってしまう。このような場合、本来、最大の類似値となるべき場合において、必ずしも類似値が高い値にならず、誤認識を招き易い。
【0105】以上の点を図20を用いて、さらに詳しく説明する。テンプレート画像の評価ベクトルTと、対象画像の評価ベクトルIとのなす角θの内積cosθを類似値として用いる場合、上述したように、対象物の周囲にある背景画像の輝度ばらつきによって、対象画像の評価ベクトルの方向は、I方向又はその正反対のI’方向のいずれかになる可能性がある。このため、類似尺度である内積は、cosθとcosθ’との2通りがあり得ることになる。しかも、θ+θ’=πであり、cosθ=cos(π−θ’)=−cosθである。つまり、cosθを類似尺度として用いると、本来、類似値を増やすように作用しなければならない場合において、逆に類似値を減らすことになる場合がある。また、類似値を減らすように作用しなければならない場合において、逆に類似値を増やすことになる場合がある。
【0106】そこで、本実施例2では、θの倍角の余弦(cos2θ)を、類似値の式に使用している。こうすると、cosθ’=−cosθとなっていても、式(5)の倍角公式から、cos2θ’=cos2θとなる。つまり、類似値を増やすように作用しなければならない場合には、背景部分に影響されずに類似値は高くなる。従って、背景部分の画像に輝度ばらつきがあっても、正当に画像のマッチングを評価することができる。以上の点は、2倍角だけでなく、4倍角や6倍角などでも同様に成立する。これにより、偶数倍角評価により、背景の輝度条件にかかわらず、安定してパターンを抽出できる。なお、この表現の他にもここで、TxとTyの値の組み合わせからcosθ=Tx,sinθ=Tyと表現されるθの値(すなわち、エッジ法線方向ベクトルを極座標表現した場合の位相角)として、Tx,Tyの2つではなく1つの値で表現することも可能である。また、θを0〜360度でなく、例えば8ビット表現とし、マイナスの値を2の補数表現として2進数で表現した場合(すなわち、−128〜127とした場合)、−128に1を加算した場合は0となり、循環表現となる。このため、θに関する倍角計算及び類似値計算において、127を超えた場合に−128とする処理が自動的に行われる。
【0107】次に、類似値の計算について説明する。より具体的には、本実施例2では、次式(7)により、類似値Lを定義する。
【数7】


なお、評価ベクトルを(Vx,Vy),(Tx,Ty)ではなく、Vθ,Tθとした場合は次式(8)となる。
【数8】


なお、ここでは評価ベクトルの要素が1つの場合もベクトルと標記している。
【0108】ここで、式(7)及び式(8)は、加算及び積算のみからなるので、類似値Lは、対象画像及びテンプレート画像のそれぞれの評価ベクトルについて線形である。従って、式(7)及び式(8)をフーリエ変換すると、フーリエ変換の離散相関定理により、
【数9】


【数10】


となる。なお、式(9)及び式(10)において、“〜”はフーリエ変換値を、“*”は複素共役を表している。
【0109】また、式(9)又は式(10)を逆フーリエ変換すれば、式(7)又は式(8)の類似値Lが得られる。そして、式(9)及び式(10)より、次の2点が明らかとなる。
1.直交変換した後の変換値においては、テンプレート画像に係るフーリエ変換値と、対象画像に係るフーリエ変換値とを、単純に積和すればよい。
2.テンプレート画像に係るフーリエ変換値と、対象画像に係るフーリエ変換値とを、同時に求める必要はなく、テンプレート画像に係るフーリエ変換値を対象画像のフーリエ変換値に先行して求めておいても構わない。
【0110】そこで、本実施例2では、テンプレート画像処理部80に記録部85を設け、対象画像の入力に先立ち、圧縮部84の出力を記憶しておくことにしている。これにより、対象画像が入力画像処理部90に入力された後は、テンプレート画像処理部80は、何らテンプレート画像の処理を行う必要がない。従って、画像通信端末の処理能力を、入力画像処理部90及び積算部101より後段の処理に集中させることができ、一層処理を高速化できる。
【0111】次に、評価ベクトル生成部82よりも後段の構成を説明する。図18に示すように、テンプレート画像処理部80において、評価ベクトル生成部82から出力されるテンプレート画像の評価ベクトルは、直交変換部83によりフーリエ変換され、圧縮部84に出力される。圧縮部84は、フーリエ変換後の評価ベクトルを削減して、記録部85に格納する。図21に示すように、変換後の評価ベクトルは、xy両方向について高低さまざまな周波数成分を含んでいる。本発明者らの実験によれば、全ての周波数成分について処理を行わなくとも、低周波数成分(例えば、xy両方向について、低周波側半分ずつ等)について処理を行えば、十分な精度が得られることがわかっている。なお、図21において、斜線を付していない領域(−a≦x≦a,−b≦y≦b)が元の領域であり、斜線を付した領域(−a/2≦x≦a/2,−b/2≦y≦b/2)が削減後の領域である。すなわち、処理量は1/4となる。このようにすれば、処理対象を削減して、さらに高速な処理を実現できる。なお、圧縮部84及び記録部85は、データ量が小さい時や高速性が要求されない時は、省略することも可能である。
【0112】次に、入力画像処理部90について説明する。図18において、入力画像処理部90は、エッジ抽出部91と、評価ベクトル生成部92と、直交変換部(FFT)93と、圧縮部94とを備える。入力画像処理部90は、テンプレート画像処理部80と同等の処理を行う。すなわち、エッジ抽出部91は、式(1)及び式(2)を用いて対象画像のエッジ法線方向ベクトルを出力する。また、評価ベクトル生成部92は、エッジ抽出部91から対象画像のエッジ法線方向ベクトルを入力し、テンプレート画像処理部80の評価ベクトル生成部82と同等の処理を行い、評価ベクトルを生成する。評価ベクトル生成部92から出力される対象画像の評価ベクトルは、直交変換部93によりフーリエ変換され圧縮部94に出力される。圧縮部94は、フーリエ変換後の評価ベクトルを削減して、積算部101へ出力する。ここで、圧縮部94は、テンプレート画像処理部80の圧縮部84と同一の周波数帯に処理対象を削減する。
【0113】次に、積算部101以降を説明する。テンプレート画像処理部80及び入力画像処理部90の処理が完了すると、積算部101は、記録部85と圧縮部94とから、テンプレート画像及び対象画像の各評価ベクトルのフーリエ変換値を入力する。そこで、積算部101は、式(9)又は式(10)による積和演算を行い、結果(類似値Lのフーリエ変換値)を逆直交変換部102へ出力する。逆直交変換部102は、類似値Lのフーリエ変換値を逆フーリエ変換し、類似値LのマップL(x,y)をマップ処理部103へ出力する。マップ処理部103は、このマップL(x,y)から、値の高い点(ピーク)を抽出し、その位置と値とを出力する。なお、マップ処理部103以降は、必要に応じて自由に構成することができる。
【0114】さて、対象画像のサイズをA(=2γ)とし、テンプレート画像のサイズをBとすると、テンプレート画像を対象画像上で順次走査させ、各位置での相関値を求めるためには、積の回数=2ABの計算回数が必要になる。なお、ここでの計算回数は、計算コストが高い積の回数で評価する。一方、本実施例2は、直交変換部83,93による2回のFFT、積算部101の積和計算、及び逆直交変換部102による1回の逆FFTが必要で、積の回数=3{(2γ−4)A+4}+2Aの計算回数で済む。これらの計算回数を比較すると、例えば、A=256×256=216とし、B=60×60とした場合、本実施例2による積の計算回数は約1/100となり、非常に高速な処理が可能になり、処理量の削減につながる。
【0115】このように、実施例2の顔抽出部7では、少ない処理量で顔の位置を抽出できる。そのため、携帯型の画像通信端末のように限られた処理量が要求される場面においても、顔の位置及び大きさを抽出することが可能となる。また、倍角表現を行うことで携帯型の画像通信端末のように撮影場所や時間が限定されず、あらゆる撮影条件を想定しなければならない場面においても、安定して顔を抽出することが可能になる。
【0116】<実施例3>上記実施例1及び実施例2の顔抽出手法では、対象画像内に顔が存在しない場合でも、顔に近い部分を強引に顔領域として抽出してしまう。そこで、次に実施例3として、実施例1及び実施例2の顔抽出手法によって抽出された顔の位置及び大きさが、真に顔であるか否かをさらに判定する手法を説明する。
【0117】これを実現するためには、図12に示す実施例1の解析部55の後段、又は図18に示す実施例2のマップ処理部103の後段に、抽出された顔領域が真の顔であるか否かを判定する構成(顔・非顔判定部)を設ける。実施例1の解析部55の後段に顔・非顔判定部を設ける場合、最も簡単には、顔・非顔を判断するためのしきい値を予め定め、解析部55から出力される領域の投票値及び顔の大きさから求めた値が、このしきい値を越えれば当該領域が顔であると判断させる。ここで、投票値及び顔の大きさから求めた値とは、投票値を顔の大きさで割った値である。このような処理を行うのは、顔の大きさに比例する投票値を、顔の大きさで正規化させる理由による。また、実施例2のマップ処理部103の後段に顔・非顔判定部を設ける場合、最も簡単には、顔・非顔を判断するためのしきい値を予め定め、マップ処理部103から出力される領域の類似値が、このしきい値を越えれば当該領域が顔であると判断させる。なお、上記実施例1及び実施例2では、顔抽出部7から出力される顔領域が1つである場合を説明したが、複数の顔領域が出力される場合であっても、上述した本実施例3の顔・非顔判定を適用させることができる。
【0118】そして、顔・非顔判定部で顔でないと判断された顔領域は、顔抽出部7から表示制御部5及び送信データ処理部8へは、出力されない。なお、上記第1の実施形態における送信データ処理部8は、顔抽出部7から顔領域が出力されない場合、送信領域31の位置を移動させずに前時刻の送信領域31をそのまま用いる。また、一定時間顔領域が出力されない場合には、初期位置(例えば、撮影領域30の中央)に送信領域31を設定する。
【0119】一方、上述したしきい値による判断方法ではなく、サポートベクトル関数を用いて顔・非顔を判定する方法がある。以下に、サポートベクトル関数を用いた顔・非顔判定を概説する。なお、サポートベクトル自体は公知の技術であり、文献「Support Vector Machinesによる複数カテゴリの識別(電子情報通信学会信学技法PRMU98−36(1998−06))」に詳しく説明されている。
【0120】図22は、実施例3の顔抽出部7の構成の内、実施例1及び実施例2の構成に追加される構成部分を示すブロック図である。図22において、実施例3での追加構成は、画像サイズ正規化部111と、特徴ベクトル抽出部112と、顔・非顔判定部113と、顔・非顔学習辞書114とを備える。この図22の構成は、実施例1の解析部55の後段、又は実施例2のマップ処理部103の後段に追加される。
【0121】画像サイズ正規化部111は、解析部55又はマップ処理部103から出力される顔領域部分の画像を、対象画像から切り出す。そして、画像サイズ正規化部111は、切り出した画像(以下、顔領域候補画像という)について、各画素における画像特徴(例えば、エッジ強度、色の値、輝度値等)を求めた後、一定サイズに正規化を行う。ここでは、顔領域候補画像を10×10画素の大きさに拡大又は縮小(すなわち正規化)した例を説明する。特徴ベクトル抽出部112は、正規化された顔領域候補画像の輝度情報を特徴データの1つとして取得する。この例では、10×10画素の画像に正規化されているので、100次元の特徴ベクトルxi(0≦i<100)が取得されることとなる。
【0122】ここで、特徴ベクトル抽出部112は、エッジ法線方向ベクトルを特徴ベクトルとして抽出してもよい。具体的には、顔領域候補画像に対してX方向sobelフィルタとY方向sobelフィルタとをかけ、各画素におけるX方向の強度及びY方向の強度を基にして方向ベクトルを計算する。この計算では、値として角度と強さとが算出されるので、強度は無視して角度のみを取り出す。そして、256階調を基準として各方向の正規化を実施し、特徴ベクトルとして使用する。また、特徴ベクトル抽出部112は、顔領域候補画像内部の正規化された角度毎のヒストグラムを計算して、エッジ法線のヒストグラムを特徴ベクトルとして抽出してもよい。
【0123】そして、顔・非顔判定部113は、顔・非顔学習辞書114に予め用意されている特徴画像及びパラメータを用い、以下の計算式によって顔領域の顔・非顔判定を行う。
【数11】


ここで、K( )はカーネル関数を、αiは対応するLagrange係数を、yiは教師データを示し、学習辞書が顔の時に+1が、非顔の時に−1が適用される。なお、カーネル関数には、上記した式(12)以外にも多項式K(Si,Xi)=(Si・Xi+1)や、2層ニューラルネットワークK(Si,Xi)=tanh(Si・Xi−δ)を用いることが可能である。
【0124】顔・非顔判別の結果を図23に示す。顔・非顔判定部113では、上式(12)の結果が0より大きい時に顔領域候補画像が顔画像と判定され、0より小さい時に非顔画像と判定される。同様に他の顔領域候補画像に対しても顔・非顔判定が行われる。この図23の例では、画像121が顔画像と判定され、画像122〜124が非顔画像と判定されている。顔・非顔学習辞書114では、教師データとして顔画像及び非顔画像が用意され、識別に使用される同じ特徴データを用いて辞書の作成が行われる。
【0125】このように、実施例3の顔抽出部7では、実際の顔が顔領域の第1候補以外にある場合でも、安定した顔領域の抽出が可能になる。また、画像中に顔がない場合でも顔がないと判定することができるので、顔の位置を移動して表示する必要がない場合を自動的に検出することが可能になる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態に係る画像通信端末の構成を示すブロック図である。
【図2】送信データ処理部8が行う追従処理の手順を示すフローチャートである。
【図3】撮影領域30と送信領域31との関係を説明する図である。
【図4】撮影領域30と送信領域31との関係を説明する図である。
【図5】撮影領域30と送信領域31との関係を説明する図である。
【図6】撮影領域30と送信領域31との関係を説明する図である。
【図7】本発明の第2の実施形態に係る画像通信端末の構成を示すブロック図である。
【図8】表示部3の画面上に表示される目印の一例を示す図である。
【図9】表示部3の画面上に表示される目印の一例を示す図である。
【図10】入力部22のテンキーを用いて通知される目印の一例を示す図である。
【図11】相手側の情報処理装置の画面上に表示される利用者1側の画像の一例を示す図である。
【図12】実施例1の顔抽出部7の構成を示すブロック図である。
【図13】テンプレート記憶部52に記憶されているテンプレートの一例を示す図である。
【図14】投票部54で行われる投票処理の手順を示すフローチャートである。
【図15】エッジ抽出部51で抽出されるエッジ画像の一例を説明する図である。
【図16】投票処理によって投票結果記憶部53の投票記憶領域に記憶される投票数の概念を説明する図である。
【図17】解析部55で行われる解析処理の手順を示すフローチャートである。
【図18】実施例2の顔抽出部7の構成を示すブロック図である。
【図19】エッジ抽出部81及び91に入力されるテンプレート画像及び対象画像の一例を示す図である。
【図20】内積の正負反転を説明する図である。
【図21】評価ベクトルの圧縮処理を説明する図である。
【図22】実施例3の顔抽出部7の構成の一部を示すブロック図である。
【図23】顔・非顔判別部113で行われた顔・非顔判別結果の一例を示す図である。
【符号の説明】
1…利用者
2,22…入力部
3…表示部
4…カメラ部
5,25…表示制御部
6…自画像メモリ
7…顔抽出部
8…送信データ処理部
9…通信部
10…受信データ処理部
11…相手画像メモリ
12…通知部
30…撮影領域
31…送信領域
32…有効領域
51,81,91…エッジ抽出部
52…テンプレート記憶部
53…投票結果記憶部
54…投票部
55…解析部
82,92…評価ベクトル生成部
83,93…直交変換部(FFT)
84,94…圧縮部
85…記録部
101…積算部
102…逆直交変換部(逆FFT)
103…マップ処理部
111…画像サイズ正規化部
112…特徴ベクトル抽出部
113…顔・非顔判定部
114…顔・非顔学習辞書
121〜124…画像
R…目印
t1〜tn…円形状

【特許請求の範囲】
【請求項1】 カメラ部で撮影された利用者の画像を相手に送信する画像通信端末であって、利用者からの入力を受け付ける入力部と、利用者を撮影するカメラ部と、前記カメラ部で撮影された画像から、利用者の顔の位置及び大きさ(以下、顔領域という)を抽出する顔抽出部と、利用者に画像を表示する表示部と、相手の情報処理装置に対し、少なくとも画像の通信を行う通信部と、前記カメラ部で撮影された画像の領域よりも小さく、かつ、当該画像の領域内で移動可能に設定される矩形の送信領域の画像を、前記通信部へ出力する送信データ処理部とを備え、前記カメラ部で撮影された画像の領域内に、前記送信領域と一体的に移動する有効領域が設定され、前記送信データ処理部は、抽出された前記顔領域が前記有効領域を逸脱した場合に、当該顔領域の位置に合わせて前記送信領域の設定位置を移動させることを特徴とする、画像通信端末。
【請求項2】 前記有効領域は、前記送信領域よりも小さく、かつ、前記送信領域内に設定されることを特徴とする、請求項1に記載の画像通信端末。
【請求項3】 前記送信データ処理部は、抽出された前記顔領域が前記有効領域を逸脱した場合、当該顔領域が前記送信領域の中心に位置するように、前記送信領域を移動させることを特徴とする、請求項1に記載の画像通信端末。
【請求項4】 前記送信データ処理部は、抽出された前記顔領域が前記有効領域を逸脱した場合、当該顔領域が前記送信領域の中心より上方向に位置するように、前記送信領域を移動させることを特徴とする、請求項1に記載の画像通信端末。
【請求項5】 前記送信データ処理部は、抽出された前記顔領域が前記有効領域を逸脱した場合、当該顔領域が前記送信領域の中心又は中心より上方向に位置するように、前記入力部から入力される送信モード情報に応じて切り替えて、前記送信領域を移動させることを特徴とする、請求項4に記載の画像通信端末。
【請求項6】 前記表示部は、前記入力部から入力される情報に応じて、前記送信領域内の画像と前記顔領域とをモニタ表示し、利用者は、前記モニタ表示を参照して、前記入力部への入力により前記送信領域の位置を縦横方向に調節可能なことを特徴とする、請求項4に記載の画像通信端末。
【請求項7】 カメラ部で撮影された利用者の画像を相手に送信する画像通信端末であって、利用者からの入力を受け付ける入力部と、利用者を撮影するカメラ部と、前記カメラ部で撮影された画像から、利用者の顔の位置及び大きさ(以下、顔領域という)を抽出する顔抽出部と、利用者に画像を表示する表示部と、相手の情報処理装置に対し、少なくとも画像の通信を行う通信部と、前記カメラ部で撮影された画像の領域よりも小さく、かつ、当該画像の領域内で移動可能に設定される矩形の送信領域の画像を、前記通信部へ出力する送信データ処理部とを備え、前記カメラ部で撮影された画像の領域内に、前記送信領域と一体的に移動する有効領域が設定され、前記送信データ処理部は、抽出された前記顔領域が前記有効領域を逸脱した場合に、当該顔領域の位置に合わせて前記送信領域の設定位置を移動させ、かつ、抽出された前記顔領域の画像輝度に基づいて、前記カメラ部で撮影された画像内にある顔の視認性が向上するように、前記送信領域の画像輝度を補正して前記通信部へ出力することを特徴とする、画像通信端末。
【請求項8】 前記送信データ処理部は、前記送信領域の画像輝度に加え、色調も補正して前記通信部へ出力することを特徴とする、請求項7に記載の画像通信端末。
【請求項9】 カメラ部で撮影された利用者の画像を相手に送信する画像通信端末であって、利用者からの入力を受け付ける入力部と、利用者を撮影するカメラ部と、前記カメラ部で撮影された画像から、利用者の顔の位置及び大きさ(以下、顔領域という)を抽出する顔抽出部と、利用者に画像を表示する表示部と、相手の情報処理装置に対し、少なくとも画像の通信を行う通信部と、前記カメラ部で撮影された画像の領域よりも小さく、かつ、当該画像の領域内で移動可能に設定される矩形の送信領域の画像を、前記通信部へ出力する送信データ処理部とを備え、前記カメラ部で撮影された画像の領域内に、前記送信領域と一体的に移動する有効領域が設定され、前記送信データ処理部は、抽出された前記顔領域が前記有効領域を逸脱した場合に、当該顔領域の位置に合わせて前記送信領域の設定位置を移動させ、かつ、抽出された前記顔領域の画像輝度に基づいて、前記カメラ部で撮影された画像内にある顔の視認性が向上するように、前記カメラ部の露出レベルの値を設定することを特徴とする、画像通信端末。
【請求項10】 カメラ部で撮影された利用者の画像を相手に送信する画像通信端末であって、利用者を撮影するカメラ部と、前記カメラ部で撮影された画像から、利用者の顔の位置を抽出する顔抽出部と、利用者に相手から受信した画像を表示する表示部と、抽出された前記顔の位置に基づいて、前記カメラ部で撮影された画像中における利用者の顔の位置を、利用者に通知する通知制御部と、相手の情報処理装置に対し、少なくとも画像の通信を行う通信部とを備える、画像通信端末。
【請求項11】 前記顔抽出部は、利用者の前記顔の位置と共に顔の大きさも抽出し、前記通知制御部は、前記カメラ部で撮影された画像中における利用者の前記顔の位置及び大きさを、利用者に通知することを特徴とする、請求項10に記載の画像通信端末。
【請求項12】 前記通知制御部は、抽出された前記顔の位置のみ又は位置と大きさとを示す目印を、前記表示部に表示させることを特徴とする、請求項10に記載の画像通信端末。
【請求項13】 前記目印は、相手から受信した画像上に表示されることを特徴とする、請求項12に記載の画像通信端末。
【請求項14】 前記目印は、相手から受信した画像外に表示されることを特徴とする、請求項12に記載の画像通信端末。
【請求項15】 前記通知制御部は、抽出された前記顔の位置を、前記表示部とは別個に備える位置通知部を介して通知することを特徴とする、請求項12に記載の画像通信端末。
【請求項16】 前記通知制御部によって行われる利用者への通知方法を、利用者からの指示に従って切り替え可能とすることを特徴とする、請求項10に記載の画像通信端末。
【請求項17】 前記顔抽出部は、前記カメラ部で撮影された画像からエッジ部(人物の外郭や顔の輪郭等に相当する画素)を抽出して、当該エッジ部だけの画像(以下、エッジ画像という)を生成するエッジ抽出部と、予め定めた形状を、相似で大きさを異ならせた種々のサイズによって、中心点で同心状に複数設けたテンプレートを記憶するテンプレート記憶部と、前記テンプレートを構成する各サイズの形状毎に、前記エッジ画像上の座標位置と投票数とを対応付けてそれぞれ記憶する投票結果記憶部と、前記エッジ部の各画素位置に前記テンプレートの中心点を順次移動させ、移動させた当該画素位置毎に、前記各サイズの形状を形成する全画素の位置に対応する各座標位置について、前記投票結果記憶部に記憶されている前記投票数をそれぞれ増加又は減少させる投票部と、前記投票結果記憶部に記憶されている前記各投票数に基づいて、前記対象画像に含まれる顔の位置及び大きさを求める解析部とを備える、請求項1〜16のいずれかに記載の画像通信端末。
【請求項18】 前記予め定めた形状は、円であることを特徴とする、請求項17に記載の画像通信端末。
【請求項19】 前記顔抽出部は、所定のテンプレート画像を入力し、当該画像のエッジ法線方向ベクトルを求め、当該エッジ法線方向ベクトルから評価ベクトルを生成し、当該評価ベクトルを直交変換するテンプレート画像処理部と、前記カメラ部で撮影された画像を入力し、当該画像のエッジ法線方向ベクトルを求め、当該エッジ法線方向ベクトルから評価ベクトルを生成し、当該評価ベクトルを直交変換する入力画像処理部と、前記テンプレート画像及び前記撮影された画像のそれぞれについて生成された直交変換後の各評価ベクトルについて、対応スペクトルデータを積和計算する積和部と、前記積和計算の結果を逆直交変換して類似値のマップを生成する逆直交変換部とを備え、前記評価ベクトルは、該当する画像の前記エッジ法線方向ベクトルを偶数倍角変換した成分を含み、前記類似値の算出式、直交変換及び逆直交変換は、いずれも線形性を有するものであることを特徴とする、請求項1〜16のいずれかに記載の画像通信端末。
【請求項20】 前記顔抽出部は、前記評価ベクトルの表現において、前記エッジ法線方向ベクトルを極座標表現した場合の角度に基づいて計算した値を用いることを特徴とする、請求項19に記載の画像通信端末。
【請求項21】 前記顔抽出部は、前記カメラ部で撮影された画像から顔として抽出された位置及び大きさが、真に顔であるか否かを判定する顔・非顔判定部をさらに備え、顔と判定した場合にのみ抽出結果を出力することを特徴とする、請求項1〜16のいずれかに記載の画像通信端末。
【請求項22】 前記顔抽出部は、前記投票結果記憶部に記憶されている内容に基づいて、前記カメラ部で撮影された画像から顔として抽出された位置及び大きさが、真に顔であるか否かを判定する顔・非顔判定部をさらに備え、顔と判定した場合にのみ抽出結果を出力することを特徴とする、請求項17に記載の画像通信端末。
【請求項23】 前記顔抽出部は、前記逆直交変換部で生成された前記類似値に基づいて、前記カメラ部で撮影された画像から顔として抽出された位置及び大きさが、真に顔であるか否かを判定する顔・非顔判定部をさらに備え、顔と判定した場合にのみ抽出結果を出力することを特徴とする、請求項19に記載の画像通信端末。
【請求項24】 前記顔・非顔判定部は、前記カメラ部で撮影された画像から顔として抽出された領域から得られる画像特徴を用いて、サポートベクトル関数の判定結果に基づいて顔・非顔の判定を行うことを特徴とする、請求項21に記載の画像通信端末。
【請求項25】 前記顔・非顔判定部は、前記カメラ部で撮影された画像から顔として抽出された領域から得られるエッジ法線方向ベクトルを前記画像特徴とすることを特徴とする、請求項24に記載の画像通信端末。
【請求項26】 前記顔・非顔判定部は、前記カメラ部で撮影された画像から顔として抽出された領域から得られるエッジ法線のヒストグラムを前記画像特徴とすることを特徴とする、請求項24に記載の画像通信端末。

【図1】
image rotate


【図3】
image rotate


【図4】
image rotate


【図5】
image rotate


【図6】
image rotate


【図10】
image rotate


【図13】
image rotate


【図20】
image rotate


【図2】
image rotate


【図7】
image rotate


【図8】
image rotate


【図9】
image rotate


【図12】
image rotate


【図15】
image rotate


【図11】
image rotate


【図16】
image rotate


【図19】
image rotate


【図21】
image rotate


【図14】
image rotate


【図22】
image rotate


【図23】
image rotate


【図17】
image rotate


【図18】
image rotate


【公開番号】特開2002−51316(P2002−51316A)
【公開日】平成14年2月15日(2002.2.15)
【国際特許分類】
【出願番号】特願2001−152614(P2001−152614)
【出願日】平成13年5月22日(2001.5.22)
【出願人】(000005821)松下電器産業株式会社 (73,050)
【Fターム(参考)】