説明

撮像装置及びインターホン装置、インターホンシステム

【課題】製造コストの上昇を抑えつつ人物の顔を確実に追跡して撮像する。
【解決手段】子機Sにおいては、顔検出処理部5の顔検出処理実行中にバッファメモリ2に記憶される画像データに対して画像処理部3が調整処理を行っている。したがって、画像処理部3並びに顔検出処理部5を構成するハードウェアが高性能なものでなく且つ顔検出処理に比較的長い時間を要する場合であっても、人物の顔を確実に追跡して撮像することができるとともに、製造コストの上昇を抑えることができる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、撮像装置、及び撮像装置を具備するインターホン装置、当該インターホン装置を備えたインターホンシステムに関する。
【背景技術】
【0002】
従来の撮像装置として、インターホンシステムのインターホン装置(主に来訪者が使用するドアホン子器やロビーインターホンなど)に搭載されるものがある。例えば、特許文献1に記載されている従来装置は、ドアホン子器のカメラで撮像した画像のなかから来訪者の顔等の拡大表示すべき位置が手動で指定された後、位置検出手段により検出される来訪者の動きに追従して拡大表示する位置を変化させている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開平6-38214号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
ところで、近年の撮像装置では、画像処理技術の進歩により、人物の被写体画像から顔領域を認識するとともに認識された顔領域が画角のほぼ中央に位置するように自動的に拡大処理等が行われている。しかしながら、特許文献1記載の従来例のように移動する来訪者を追跡する処理(追跡処理)と、来訪者の位置(顔領域)を検出する処理(顔検出処理)とが双方とも実行される場合、撮像装置における画像処理の負担が大幅に増加し、来訪者の追跡が困難になる虞があった。なお、画像処理を実行するハードウェア(CPUや画像処理用ICなど)が高性能なものであれば、画像処理の負担増にも対応可能ではあるが、そのような高性能なハードウェアが採用されると撮像装置の製造コストが上昇してしまうという問題がある。
【0005】
本発明は、上記課題に鑑みて為されたものであり、製造コストの上昇を抑えつつ人物の顔を確実に追跡して撮像することを目的とする。
【課題を解決するための手段】
【0006】
本発明の撮像装置は、画像を撮像する撮像手段と、当該画像を記憶する記憶手段と、前記画像における人の顔の存在領域を検出する顔検出手段と、前記画像の一部の領域を拡大する拡大手段と、前記人が前記画像から外れないように前記撮像手段の撮像範囲又は前記拡大手段の拡大領域を調整する調整手段とを備え、前記顔検出手段の検出処理の実行中に前記記憶手段に記憶される前記画像に対して前記調整手段の調整処理が行われることを特徴とする。
【0007】
この撮像装置において、前記記憶手段は、一定の周期で画像を記憶することが好ましい。
【0008】
この撮像装置において、前記記憶手段は、人が前記撮像手段の撮像範囲内に居る可能性が高いときは前記撮像手段のフレーム周期よりも長い第1周期で画像を記憶し、その他のときは前記第1周期よりも短く且つ前記フレーム周期よりも長くない第2周期で画像を記憶することが好ましい。
【0009】
この撮像装置において、前記調整手段で調整された画像を含む複数種類の画像を親画面と子画面に振り分けた画像を生成する画像生成手段を備えることが好ましい。
【0010】
この撮像装置において、前記調整手段で調整された画像と前記調整手段で調整されていない画像とを選択して出力する出力手段を備え、前記調整手段は、当該出力手段に選択されるか否かに関わりなく、画像の調整を行うことが好ましい。
【0011】
本発明のインターホン装置は、何れかの撮像装置と、当該撮像装置で撮像される画像を伝送する伝送手段とを備えることを特徴とする。
【0012】
本発明のインターホンシステムは、前記インターホン装置と、前記インターホン装置から伝送される画像を表示する表示手段を具備するインターホン装置とを備えることを特徴とする。
【発明の効果】
【0013】
本発明の撮像装置及びインターホン装置、インターホンシステムは、製造コストの上昇を抑えつつ人物の顔を確実に追跡して撮像することができるという効果がある。
【図面の簡単な説明】
【0014】
【図1】本発明に係る撮像装置、インターホン装置、インターホンシステムの実施形態を示すブロック図である。
【図2】同上におけるインターホン子機の平面図である。
【図3】同上の動作説明用のタイムチャートである。
【発明を実施するための形態】
【0015】
以下、撮像装置を内蔵して住戸の外玄関や集合住宅の共用玄関(ロビー)などに設置されるカメラ付きのインターホン子機(ロビーに設置される場合はロビーインターホン)Sと、住戸内に設置されてインターホン子機(以下、「子機」と略す)Sとの間で通話を行うインターホン親機(以下、「親機」と略す)Mとで構成されるインターホンシステムに本発明を適用した実施形態について、図面を参照して詳細に説明する。但し、撮像装置を子機Sと別体に構成しても構わない。
【0016】
図1に示すように、インターホン装置に相当する親機Mと子機Sは信号線Lsで接続されている。本実施形態のインターホンシステムでは、子機Sと親機Mとの間で信号線Lsを介して相互に音声信号を伝送して通話するとともに、子機Sの撮像装置で撮像された画像(動画像)が信号線Lsを介して親機Mに伝送され、親機Mの表示部101で表示される。なお、図示は省略しているが、親機M並びに子機Sには、マイクロホンとスピーカ、マイクロホンで集音した音声を信号線Ls(あるいは、図示しない通話線)を介して伝送し、且つ相手側から伝送されてくる音声をスピーカから鳴動させる通話手段が設けられている。但し、このような通話手段については従来周知であるから図示並びに説明を省略する。
【0017】
親機Mは、表示部101、信号伝送部100、操作入力部103、親機制御部102などを備えている。表示部101は、LCDパネルのような表示デバイスと表示デバイスを駆動して動画像(映像)を表示させるドライバ回路等を具備する。信号伝送部100は、子機Sとの間で信号線Lsを介して音声信号、映像信号、制御信号を伝送(ディジタル伝送あるいは周波数分割多重伝送)するとともに、子機Sから伝送されてくる映像信号の復調及び復号化の処理を行っている。操作入力部103は、後述する応答釦などの操作入力を受け付けて当該操作入力に対応した操作信号を親機制御部100に出力する。親機制御部102は、マイクロコンピュータやメモリなどのハードウェアとソフトウェアとで構成され、親機M全体の制御を行っている。
【0018】
子機Sは、撮像部1、バッファメモリ2、画像処理部3、信号伝送部4、顔検出処理部5、画角調整部6、操作入力部7、制御部8などを備えている。信号伝送部4は、親機Mの信号伝送部101との間で信号線Lsを介して音声信号、映像信号、制御信号を伝送する。撮像手段たる撮像部1は、CCDイメージ・センサあるいはCMOSイメージ・センサからなる撮像素子10、撮像素子10の撮像面に光を集光するレンズ11などを具備している。なお、撮像素子10は、Yの輝度成分とU,Vの色差成分からなるディジタル・ビデオ信号(映像信号)を出力することができる。
【0019】
バッファメモリ2は、制御部8の指示に従って撮像部1から出力される映像信号(画像データ)を記憶(バッファリング)するものであって、フラッシュメモリなどの電気的に書換可能な不揮発性の半導体メモリで構成されている。但し、バッファメモリ2が画像データを記憶(バッファリング)するタイミングは、制御部8の指示によって決まる。
【0020】
画像処理部3は、バッファメモリ2から読み出す映像信号をディジタル変調(例えば、BPSKやQPSKなど)する変調処理のほか、拡大処理(いわゆるディジタル・ズーム)や追跡処理、調整処理などを行う。拡大処理とは、元の映像信号から、1画面(1フレーム)よりも小さい任意の領域(以下、「拡大領域」という。)を前記1画面分の大きさに拡大して表示するための映像信号を作成する処理である。また追跡処理とは、フレーム間差分によって抽出される移動体(来訪者)の画像上の位置を検出する処理である。但し、この種の拡大処理(ディジタル・ズーム)や追跡処理の具体的な処理内容については、従来周知であるから詳細な説明は省略する。さらに調整処理とは、後述する顔存在領域が画像(画角)から外れないように撮像部1の撮像範囲又は拡大処理における拡大領域を調整する処理である。なお、撮像部1の撮像範囲の調整は、後述するように画角調整部6による画角調整によって実現される。
【0021】
顔検出処理部5は、撮像部1の撮像画像における人の顔の存在領域(顔存在領域)を検出する処理(顔検出処理)を行っている。顔検出処理とは、例えば、予め撮像部1で撮像される画像から人の顔の特徴部分(目や鼻、口など)を抽出してテンプレートを作成しておき、実際に撮像された画像に対してテンプレートを走査し、テンプレートとのマッチング(相関)が高い領域を顔存在領域と判定する処理である。なお、顔検出処理部5で検出された顔存在領域の位置情報(画像上の位置座標)が画像処理部3に伝えられる。
【0022】
画角調整部6は、撮像部1を水平方向に回動させるパンニング、及び垂直方向に回動させるチルティングをそれぞれ行ってレンズ11の光軸の向き、すなわち、撮像部1の画角を調整するものである。なお、パンニング及びチルティングは、それぞれの回動機構をモータで駆動することによって実現される。また、画角調整部6による画角調整は、後述するように制御部8の指示によって行われる。
【0023】
信号伝送部4は、親機Mの信号伝送部101との間で信号線Lsを介して音声信号、映像信号、制御信号を伝送する。また信号伝送部4では、映像信号の符号化(圧縮)処理や符号化された映像信号をディジタル変調(例えば、BPSKやQPSKなど)する変調処理なども行っている。
【0024】
操作入力部7は、多数の押釦スイッチを有し、これらの押釦スイッチがオンされたときに各押釦スイッチに対応した操作入力を受け付けるとともに、受け付けた操作入力に対応する操作信号を制御部8に送出する。また、操作入力部7は、後述するように入力内容を表示するための表示器(例えば、7セグメントのLED表示器)も具備している。
【0025】
制御部8は、マイクロコンピュータやメモリなどのハードウェアと、後述する種々の制御を実行するためのソフトウェアとで構成されている。例えば、操作入力部7で親機Mを呼び出す操作入力が受け付けられると、制御部8は、信号伝送部4から信号線Lsを介して親機Mに呼出信号を送信する。そして、呼出信号を受信した親機Mのスピーカから呼出音が鳴動される。さらに、呼出音が鳴動されてから一定時間内に親機Mの応答釦が操作されると、親機Mと子機Sの間に信号線Lsを介した通話路が形成され、親機Mと子機Sとの間でインターホン通話が可能となる。すなわち、本実施形態では来訪者が通話に使用する子機Sが撮像装置及び当該撮像装置を備えるインターホン装置に相当し、応対者(住人)が通話に使用する親機M(インターホン装置)とともにインターホンシステムを構成している。
【0026】
図2は、ロビーインターホンとして構成された子機Sの外観図(正面図)を示している。子機Sのハウジング200は、正面から見て矩形の箱形に形成され、その内部に撮像部1、バッファメモリ2、画像処理部3、信号伝送部4、顔検出処理部5、画角調整部6、操作入力部7、制御部8の各部が収納されている。またハウジング200の前面中央には、操作入力部7の押釦スイッチを押操作するための操作部材(操作釦)201,202が配設されている。一方の操作釦201は、0〜1の数字や*(アスタリスク)を入力するための押釦スイッチと、入力した数字又はアスタリスクを消去するための押釦スイッチとにそれぞれ対応している。また、他方の操作釦202は、操作釦201を操作して入力した内容(親機Mが設置されている住戸の住戸番号)を確定し、子機Sから親機Mへ呼出信号を送信させるための押釦スイッチと対応している。なお、操作釦201を押操作して入力される内容(数字)は、ハウジング200前面において、操作釦201の上部に配設されている表示器(例えば、7セグメントのLED表示器)203に表示される。また、ハウジング200前面における表示器203の隣に撮像部1のレンズ11が配置されている。但し、レンズ11は曇りガラスからなるカバー204で隠されている。なお、レンズ11が配置される位置は、操作釦201を押操作する来訪者の顔が撮像可能な位置であればよい。
【0027】
次に、図3のタイムチャートを参照して、来訪者が子機Sを使用して訪問先の住戸の親機Mを呼び出すまでの動作を説明する。まず、来訪者が子機Sの前に立って操作釦201を押操作し、訪問先の住戸の住戸番号を入力する。操作入力部7は、操作釦201が押操作される毎に当該操作釦201で押操作された押釦スイッチと対応する操作信号を制御部8に出力する。制御部8は、最初の操作信号を操作入力部7から受け取った時点で人(来訪者)が撮像部1の撮像範囲内に居る可能性が高いと判断する。
【0028】
そして制御部8は、人が撮像範囲内に居る可能性が高いと判断した後、撮像部1を起動して撮像させるとともに、顔検出処理部5に顔検出処理の実行を指示する。さらに、制御部8は撮像部1のフレーム周期TFよりも長い周期TB(図示例ではTB=TF×5)でバッファメモリ2に画像データを記憶(バッファリング)させる。ここで、来訪者によって操作釦201が操作される前は、撮像部1、バッファメモリ2、画像処理部3、信号伝送部4、顔検出処理部5、画角調整部6が休止状態にあり、操作入力部7と制御部8のみが動作している。但し、制御部8はマイクロコンピュータの消費電力を抑えたスタンバイ状態にあり、操作入力部7から最初の操作信号を受け取った時点で通常の動作状態に復帰する。
【0029】
顔検出処理部5は、撮像部1で撮像された画像に対して顔検出処理を実行して来訪者の顔が映っている領域(顔存在領域)を検出し、検出した顔存在領域の位置情報を制御部8に渡す。制御部8は、顔検出処理部5から受け取った顔存在領域の位置情報に基づいて、画像処理部3における拡大処理の要否を判断する。例えば、来訪者が子機Sから離れた位置に居たため、画面に対する顔存在領域の占める割合が所定のしきい値以下であったとすれば、制御部8は拡大処理が必要と判断して画像処理部3に拡大処理の実行を指示する。一方、来訪者が子機Sに顔を近付けていたため、画面に対する顔存在領域の占める割合がしきい値を越えていたとすれば、制御部8は拡大処理が不要と判断して画像処理部3に拡大処理の実行を指示しない。
【0030】
さらに制御部8は、顔検出処理部5から顔存在領域の位置情報を受け取ると画像処理部3に追跡処理並びに調整処理を開始させる。この追跡処理は、操作釦201,202の操作開始時点から顔検出処理部5の顔検出処理が終了するまでの間(顔検出処理期間TX)にバッファメモリ2に記憶されている複数フレームの画像データから開始される。但し、一番最初に記憶されたフレームは追跡処理に使用されず、顔検出処理のみに使用される。さらに、顔検出処理期間TX中にバッファメモリ2に記憶されていた画像データの処理が済むと、画像処理部3は、引き続いてバッファメモリ2に記憶されている最新の画像データを用いて追跡処理を継続する。なお、顔検出処理期間TX中に記憶された画像データの処理が済んだ後、制御部8はバッファメモリ2のバッファリング周期TBを撮像部1のフレーム周期TFに一致させる。よって、バッファメモリ2には撮像部1から出力される全ての画像データが順番に記憶される。
【0031】
そして画像処理部3は、追跡処理によって検出される移動体(来訪者)の画像上の位置に基づき、顔存在領域が画像(画角)から外れないように撮像部1の撮像範囲又は拡大処理における拡大領域を調整する(調整処理)。さらに画像処理部3は、制御部8からの指示に従って拡大処理及び追跡処理、調整処理を実行し、処理後の画像(映像信号)あるいは何れの処理も実行しなかったときは元の画像(映像信号)を変調処理して信号伝送部3に出力する。したがって、親機Mの表示部101には、来訪者の顔が適切な大きさで映っている画像(映像)が表示されることになる。
【0032】
制御部8は、操作入力部7の操作釦202が押操作されると、それまでに操作入力部7から受け取った操作信号で示される数列を住戸番号として確定し、当該住戸番号が割り当てられている親機Mに対して信号伝送部3から制御信号(呼出信号)を伝送させる。さらに、制御部8は画像処理部3および信号伝送部4に指示して画像を伝送させる。
【0033】
一方、親機Mにおいては、自己に割り当てられている住戸番号に一致する制御信号(呼出信号)を信号伝送部100で受信すると、親機制御部102がスピーカから呼出音を鳴動させる。さらに、子機Sから伝送されてくる画像が信号伝送部100で受信され、親機Mの表示部101に当該画像が表示される。
【0034】
上述のように子機Sにおいては、顔検出処理部5の顔検出処理実行中にバッファメモリ2に記憶される画像データに対して画像処理部3が調整処理を行っている。したがって、画像処理部3並びに顔検出処理部5を構成するハードウェアが高性能なものでなく且つ顔検出処理に比較的長い時間を要する場合であっても、人物の顔を確実に追跡して撮像することができるとともに、製造コストの上昇を抑えることができる。
【0035】
ところで、顔検出処理部5が顔検出処理を行った画像には、子機Sの操作釦201,202を押操作している来訪者が映っている可能性が高い。なお、以下では説明を簡単にするため、上述のように顔検出処理が行われた短時間の画像を「イントロ画像」と呼ぶことにする。なお、イントロ画像はバッファメモリ2とは別のメモリ(図示せず)に記憶されている。
【0036】
従来のインターホンシステムでは、子機で呼出操作が行われた後に撮像されるリアルタイムの画像が親機のモニタに表示されていた。そのため、呼出操作を終了した来訪者が無意識又は故意に撮像部1の撮像範囲から外れてしまい、呼出音を聞いた住人(応対者)が観る時点で親機Mの表示部101に表示される画像に来訪者が映っていない場合があった。一方、本実施形態では、画像処理部3の追跡処理と調整処理により、ある程度までは移動する来訪者を撮像部1の撮像範囲内に収めることができる。
【0037】
ここで、呼出音が鳴動されてから応答釦が操作されるまでの応答待ちの期間(以下、「イントロ期間」と呼ぶ。)において、イントロ画像とリアルタイムの画像を親画面と子画面に振り分けて親機Mの表示部101に同時に表示させてもよい。すなわち、子機Sの画像処理部3が親子画面処理を実行し、メモリに記憶されているイントロ画像とリアルタイムの画像(調整処理後の画像)とを合成し、一方の画像を親画面とし、他方の画像を子画面として同一画面内に同時に表示する画像を作成する。そして、画像処理部3で作成された親子画面の画像が信号伝送部4から親機Mに伝送され、親機Mの表示部101に2種類の画像(イントロ画像I2とリアルタイムの画像I1)が親子画面として表示される。また、親機Mの操作入力部103で親子画面を切り換える操作入力が受け付けられると、親機制御部102が信号伝送部100から親子画面の切換を指示する制御信号を送信させる。そして、当該制御信号を受け取った子機Sの制御部8は、画像処理部3に対して親画面に表示する画像と子画面に表示する画像の切換(入れ替え)を指示する。その結果、親機Mの表示部103に表示される親子画面の画像の位置が切り換えられることになる。つまり、本実施形態では画像処理部3が画像生成手段に相当し、制御部8が出力手段に相当する。但し、親画面と子画面の合成並びに入れ替えを親機Mの親機制御部102で行うことも可能である。
【0038】
ここで、制御信号に応じて制御部8がイントロ画像のみを信号伝送部4から伝送させている間においても画像処理部3が追跡処理並びに調整処理を継続している。したがって、制御部8が信号伝送部4から伝送させる画像をイントロ画像からリアルタイム画像あるいはリアルタイム画像を含む親子画面の画像に切り換えた場合、直ちに調整処理がされたリアルタイム画像が伝送可能になる。
【符号の説明】
【0039】
M インターホン親機(インターホン装置)
S インターホン子機(撮像装置,インターホン装置)
1 撮像部(撮像手段)
2 バッファメモリ(記憶手段)
3 顔検出処理部(顔検出手段)
4 画像処理部(拡大手段,調整手段)

【特許請求の範囲】
【請求項1】
画像を撮像する撮像手段と、当該画像を記憶する記憶手段と、前記画像における人の顔の存在領域を検出する顔検出手段と、前記画像の一部の領域を拡大する拡大手段と、前記人が前記画像から外れないように前記撮像手段の撮像範囲又は前記拡大手段の拡大領域を調整する調整手段とを備え、前記顔検出手段の検出処理の実行中に前記記憶手段に記憶される前記画像に対して前記調整手段の調整処理が行われることを特徴とする撮像装置。
【請求項2】
前記記憶手段は、一定の周期で画像を記憶することを特徴とする請求項1記載の撮像装置。
【請求項3】
前記記憶手段は、人が前記撮像手段の撮像範囲内に居る可能性が高いときは前記撮像手段のフレーム周期よりも長い第1周期で画像を記憶し、その他のときは前記第1周期よりも短く且つ前記フレーム周期よりも長くない第2周期で画像を記憶することを特徴とする請求項2記載の撮像装置。
【請求項4】
前記調整手段で調整された画像を含む複数種類の画像を親画面と子画面に振り分けた画像を生成する画像生成手段を備えることを特徴とする請求項1〜3の何れか1項に記載の撮像装置。
【請求項5】
前記調整手段で調整された画像と前記調整手段で調整されていない画像とを選択して出力する出力手段を備え、前記調整手段は、当該出力手段に選択されるか否かに関わりなく、画像の調整を行うことを特徴とする請求項1〜4の何れか1項に記載の撮像装置。
【請求項6】
請求項1〜5の撮像装置と、当該撮像装置で撮像される画像を伝送する伝送手段とを備えることを特徴とするインターホン装置。
【請求項7】
請求項6のインターホン装置と、前記インターホン装置から伝送される画像を表示する表示手段を具備するインターホン装置とを備えることを特徴とするインターホンシステム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate


【公開番号】特開2012−134660(P2012−134660A)
【公開日】平成24年7月12日(2012.7.12)
【国際特許分類】
【出願番号】特願2010−283627(P2010−283627)
【出願日】平成22年12月20日(2010.12.20)
【出願人】(000005821)パナソニック株式会社 (73,050)
【Fターム(参考)】