説明

動画記録装置および動画再生装置

【課題】全体およびアップの高画質な動画を簡単に撮影、記録、そして再生することのできる技術を提供する。
【解決手段】撮像部10が動画記録用画素数よりも高い解像度で撮像する。画像処理部12は、撮像により得られた原画像を動画記録用画素数の全体画像に解像度変換する一方で、原画像の一部分から動画記録用画素数の部分画像を生成する。全体画像から構成される全体動画と部分画像から構成される部分動画とが、関連付けられて記録される。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、動画の記録および再生の技術に関する。
【背景技術】
【0002】
ハンディタイプのビデオカメラや設置型の監視カメラなど、動画の記録を行う動画記録装置はさまざまな用途に利用されている。動画記録装置で撮影された映像は、ビデオテープ、DVD、HD、メモリなどの記録メディアに記録され、動画再生装置によって再生される。また、動画再生機能を備えるタイプの動画記録装置もあり、この種の装置では、装置単体で動画の記録および再生を行ったり、外部の表示装置に対して映像信号を出力したりすることができる。
【0003】
動画記録装置の撮影対象となるのは、もっぱら人物、その中でも人の顔部分のケースが多い。そこで従来から、人物や顔の部分の画像品質を向上するための技術が種々検討されている。
【0004】
たとえば、特許文献1では、画像から顔や人物の領域を検出し、その領域を部分高画質符号化あるいは部分拡大符号化することにより、携帯端末の小さい画面上に来訪者の顔や不審人物を鮮明に表示できるようにする手法が提案されている。また、特許文献2では、いわゆるROI(Region of Interest)方式を使用して、画像中の人物の領域の圧縮率を低く抑えることで、その部分の画質を高く保つ一方、それ以外の背景部分の圧縮率を高く設定し、全体として圧縮率を高めて圧縮処理後の画像の全体容量を低減する手法が提案されている。また、特許文献3では、画像の顔領域についてはデータ圧縮処理を実行し、背景領域については代表圧縮データで置き換えることで、全体として画像の容量を小さくする手法が提案されている。
【0005】
このように、従来技術は、画質向上と容量削減という相反する課題の両立を目的とし、顔や人物部分の品質を維持する代わりに、それ以外の部分の品質を犠牲にするものであった。
【特許文献1】特開2003−219396号公報
【特許文献2】特開2001−145101号公報
【特許文献3】特開平6−6747号公報
【発明の開示】
【発明が解決しようとする課題】
【0006】
記録メディアの大容量化と通信速度の高速化により、今般、動画の記録容量に関する問題は解消されつつある。したがって今後は、背景を含めた全体の様子もきれいに収めながら、人や顔部分は今まで以上にきれいに撮影したいというような、画質に対する要求が高まるものと予想される。例えば、子供の運動会を撮影する場面では、自分の子供が他の子供達と競り合っている様子や運動会の風景などを撮影しつつ、同時に自分の子供の走りや顔の表情をアップで鮮明に記録する、といったニーズが想定される。
【0007】
しかしながら、従来の動画記録装置にあっては、全体の画像を撮影するためにズームアウトすると、相対的に人や顔部分が小さくなってしまい、その表情などを鮮明に記録することができない。逆に、アップの画像を撮影するためにズームインすると、周囲の風景が画角から切れてしまい、全体の様子を収めることができない。それゆえ、子供のかけっこを撮影しても、かけっこ全体の様子を収めようとして子供の生き生きとした表情を撮影できてなかったり、子供のアップばかりを追うあまり、子供が他の子供を追い抜くシーンを
逃してしまったりと、思うような撮影ができないことが多い。特に、動く被写体を撮影する場合には、ズームの切り換えや、顔をアップにしながら被写体の動きに追従することは困難である。
【0008】
本発明は上記実情に鑑みてなされたものであって、その目的とするところは、全体およびアップの高画質な動画を簡単に撮影、記録、そして再生することのできる技術を提供することにある。
【課題を解決するための手段】
【0009】
上記目的を達成するために本発明では、以下の手段または処理によって動画の撮影、記録または再生を行う。
【0010】
本発明の動画記録装置は、撮像手段と、全体画像生成手段と、部分画像生成手段と、記録手段とを備える。撮像手段は、動画記録用画素数よりも高い解像度で撮像する。ここでは撮像により得られた画像を「原画像」とよぶ。全体画像生成手段は、原画像を動画記録用画素数の画像に解像度変換する。全体画像生成手段によって生成される画像を「全体画像」とよぶ。他方、部分画像生成手段は、原画像の一部分から動画記録用画素数の画像を生成する。部分画像生成手段によって生成される画像を「部分画像」とよぶ。そして、記録手段は、全体画像から構成される全体動画と部分画像から構成される部分動画とを関連付けて記録する。
【0011】
この構成によれば、全体の様子を画角に収めて撮影を行うだけで、全体と部分(アップ)の2種類の動画が自動的に記録されるので、撮影者によるズーム操作などは不要となり、撮影および記録の簡単化が図られる。しかも、いずれの画像も高解像度の原画像から生成されるので、良好な画質が得られる。
【0012】
原画像のどこの領域から部分画像を生成するかは、固定的に設定してもよいし、動的に変えるようにしてもよい。
【0013】
たとえば建物や敷地の入口を監視するための動画記録装置(監視カメラ)のように、アップで撮影したい領域が予め特定できる場合には、原画像中の部分画像を生成する領域を固定的に設定すればよい。また、アップで撮影したい領域が複数存在する場合には、一定時間間隔でそれらの領域を切り換えるようにしてもよい。
【0014】
また、画像処理技術や画像認識技術を利用して、原画像の中からアップで撮影すべき被写体(人、顔、または、物体)を検出することによって、部分画像の領域を自動的に切り換えることもできる。
【0015】
詳しくは、部分画像生成手段が、原画像から人の顔を検出する顔検出手段を有しており、検出された顔を含むように部分画像を生成するとよい。この構成によれば、被写体となる人物を画角内に入れて撮影を行うだけで、その人の顔をアップで追いかける部分動画が自動的に記録される。
【0016】
ここで、部分画像生成手段が、顔情報が登録される顔情報登録手段と、検出された顔が顔情報登録手段に登録されている顔と一致するか否かを判定する顔認識手段と、を有しており、登録されている顔の場合はその顔を含む部分画像を生成することが好ましい。この構成によれば、非登録者の部分動画は生成されないので、画角内に大勢の人物が入っている場合でも所望の人物(登録者)の部分動画のみが記録されるという利点がある。
【0017】
部分画像生成手段は、動画記録用画素数の大きさの領域を原画像から抜き出したものを
部分画像とすることが好ましい。この場合、解像度変換が不要となるため、部分画像生成処理の単純化および高速化を図ることができるとともに、解像度変換による画質劣化を防ぐことができる。
【0018】
あるいは、部分画像生成手段が、顔の大きさに略比例した大きさの領域を原画像から抜き出した後、その抜き出された画像を動画記録用画素数の部分画像に解像度変換するようにしてもよい。この場合、部分画像に占める顔の大きさが略一定になる。つまり、顔を常に同じような大きさで撮影することができるという利点がある。
【0019】
部分画像生成手段が、部分画像中の顔の位置が略一定になるように上記領域を原画像から抜き出すとより好ましい。これにより、揺れのほとんど無い、見やすい部分動画を得ることができる。
【0020】
記録手段は、全体動画と部分動画とを時間的な対応付けをとりながら記録することが好ましい。これにより、記録された動画を再生する際に、全体動画と部分動画とを同期させながら表示することが容易になる。
【0021】
また、記録手段が、全体画像中の部分画像の位置を記録することも好ましい。これにより、記録された動画を再生する際に、全体画像と部分動画とを関連付ける種々の表示効果を容易に実現することができる。
【0022】
記録手段が、動画記録装置本体から取り外し可能な記録メディアを有することが好ましい。これにより記録した動画を他の機器に渡すのが容易になる。
【0023】
動画記録装置が、全体動画および部分動画を対応させながら表示するための映像信号を生成する画像合成手段を備えることも好ましい。さらに、動画記録装置が、映像信号を表示する表示手段を備えるとよい。ここで、画像合成手段や表示手段は動画記録装置本体と一体の構成でもよいし、別体の構成でもよい。
【0024】
本発明の動画再生装置は、上述した動画記録装置によって記録された全体動画および部分動画を、動画記録装置から読み込む読込手段と、全体動画および部分動画を対応させながら表示するための映像信号を生成する画像合成手段と、映像信号を表示する表示手段と、を備える。
【0025】
動画記録装置または動画再生装置が動画の再生・表示を行う際には、たとえば、画像合成手段が、部分動画の領域を表すマークを全体動画に合成するとよい。これにより、ユーザ(視聴者)は、どの領域がアップで表示されているかを容易に把握することができる。
【0026】
また、全体動画に関連付けられている部分動画が複数ある場合に、操作手段により、画面上に表示する部分動画をユーザに選択させることも好ましい。これにより、ユーザが望む部分がアップで表示されるようになる。選択画面の態様としては、たとえば、部分動画を並べて表示する態様、全体動画上に各部分動画の領域を表す複数のマークを合成表示する態様、全体動画の任意の位置を選択させ、その選択位置に最も近い部分画像を表示する態様など、種々のものが考えられる。
【0027】
なお、本発明は、上記構成の少なくとも一部を有する動画記録装置または動画再生装置として捉えることができる。また、本発明は、上記処理の少なくとも一部を含む動画記録方法もしくは動画記録再生方法、または、かかる方法を実現するためのプログラムとして捉えることもできる。上記構成および処理の各々は可能な限り互いに組み合わせて本発明を構成することができる。
【発明の効果】
【0028】
本発明によれば、全体の動画とアップの動画とを簡単に撮影、記録、そして再生することができる。
【発明を実施するための最良の形態】
【0029】
以下に図面を参照して、この発明の好適な実施の形態を例示的に詳しく説明する。
【0030】
<第1実施形態>
(動画記録装置の機能構成)
図1に、本発明の実施形態に係る動画記録装置の機能構成を示す。動画記録装置1は、いわゆるデジタルビデオカメラシステムであって、撮影した映像をデジタル形式の動画や静止画として記録する装置である。
【0031】
図1に示すように、本実施形態の動画記録装置1は、画像処理系として、撮像部10、フレームメモリ11、画像処理部12、顔処理部13、顔情報登録部14、全体画像記録部15、部分画像記録部16、画像合成部17、表示部18を備える。また、図示を省略するが、マイクや音声処理部などの音声処理系も備えている。
【0032】
撮像部10は、概略、光学系と撮像素子から構成される撮像手段である。撮像素子はCCDもしくはCMOSなどのイメージセンサであって、少なくとも数百万オーダーの有効画素数(たとえば、300万画素)をもつものが用いられる。撮像部10で撮影された画像(「原画像」とよぶ。)は、フレームメモリ11に一時的に記憶される。
【0033】
画像処理部12は、フレームメモリ11から原画像を読み込み、その原画像に対して種々の画像処理を施す機能である。画像処理としては、たとえば、解像度変換、トリミング、手ブレ補正、シャープネス、色調補正などがある。
【0034】
動画記録装置1の撮影モードには動画撮影モードと静止画撮影モードがあり、さらに静止画撮影モードには高精細モードと通常モードとがある。高精細モードでは原画像とほぼ同じ約2000×1500画素で、通常モードでは約1600×1200画素で静止画の記録が行われる。また動画撮影モードでは、640×480画素(VGAサイズ)の動画記録用画素数にて動画の記録が行われる。このように撮影モードによって記録用画素数が異なるため、画像処理部12は撮影モードに応じて原画像に適宜解像度変換やトリミングを施して記録用の画像を生成する。
【0035】
本実施形態では、動画撮影モードにおいて、約2000×1500画素数の原画像から、全体画像と部分画像の2種類のVGAサイズ(動画記録用画素数)の画像が生成される。全体画像生成手段は画像処理部12により構成される。また、部分画像生成手段は画像処理部12、顔処理部13および顔情報登録部14により構成される。
【0036】
ここで全体画像とは、原画像に写っている像のほぼ全体を含んでいる画像をいう。この全体画像は、原画像の有効領域全体をVGAサイズに解像度変換(ダウンコンバート)することによって生成される。なお、有効領域とは原画像から手ブレ補正用のマージンやアスペクト比調整用の余剰画素などを除いた部分をいい、実質的には原画像の全領域に相当する。
【0037】
一方、部分画像とは、原画像に写っている像の一部分のみを含んでいる画像をいう。この部分画像は、原画像の有効領域からVGAサイズの領域をトリミングする(抜き出す)ことによって生成される。本実施形態では、顔処理部13にて検出された顔の部分を含む
ようにトリミング範囲が決定される。
【0038】
全体画像と部分画像はともに同じ原画像から生成されるものであるが、全体画像は原画像のほぼ全領域から生成されるのに対し、部分画像は全体画像よりも小さい領域から生成される。したがって、部分画像は全体画像の一部分(顔の部分)をアップにしたような画像となる。
【0039】
顔処理部13は、原画像から人の顔を検出する顔検出処理を実行する機能(顔検出手段)と、検出された顔の認識を行う顔認識処理を実行する機能(顔認識手段)とを備える。顔検出処理では、顔処理部13は原画像の中から顔の特徴を有する領域を検出し、その顔を囲む矩形(「顔矩形」とよぶ。)の座標値を算出する。また、顔認識処理では、顔処理部13は顔矩形で囲まれた小画像から、眉、目、鼻、口、輪郭などの顔器官の特徴量(「顔情報」とよぶ。)を抽出し、顔情報登録部14に予め登録されている顔情報と比較して、検出された顔と登録されている顔とが一致するか否かを判定する。
【0040】
動画を記録する記録手段は、全体画像記録部15と部分画像記録部16とから構成される。全体画像記録部15は、画像処理部12から全体画像を順次受け取ると、動画エンコード処理を行って全体動画を生成する。また、部分画像記録部16は、画像処理部12から部分画像を順次受け取ると、動画エンコード処理を行って部分動画を生成する。そして、全体画像記録部15と部分画像記録部16は、同じ原映像から生成された全体動画と部分動画を互いに関連付けて記録メディアに記録する。
【0041】
記録メディアは、動画記録装置1の本体から取り外し可能である。取り外し可能な記録メディアとしては、たとえば、半導体メモリ、CD、DVD、ハードディスクなどが想定される。
【0042】
画像合成部17は、記録メディアから全体動画や部分動画を読み込み、デコード処理を行って映像信号を生成する機能である。この映像信号は、液晶ディスプレイなどで構成される表示部18に表示されたり、外部出力I/Fを介してプリンタ、表示装置、記録装置(DVDレコーダ、HDレコーダなど)などの外部機器に出力される。
【0043】
(動画記録装置の機器構成)
図2は動画記録装置の機器構成例を示している。
【0044】
構成例1では、表示部21を備えた動画再生機能付きデジタルビデオカメラ20単体で動画記録装置が構成されている。
【0045】
構成例2では、デジタルビデオカメラ22とテレビ受像機23から動画記録装置が構成されている。この構成では、動画記録装置の構成要素のうち表示部18の機能をテレビ受像機23が担い、それ以外の機能はデジタルビデオカメラ22に設けられている。デジタルビデオカメラ22で撮影・記録された全体動画と部分動画は、デジタルビデオカメラ22で映像信号出力され、テレビ受像機23に表示される。
【0046】
構成例3では、ビデオカメラ24と情報処理装置(パーソナルコンピュータなど)25とディスプレイ26から動画記録装置が構成されている。この構成では、ビデオカメラ24が撮像部10の機能を担い、ディスプレイ26が表示部18の機能を担い、それ以外の構成要素については情報処理装置25が担っている。情報処理装置25はビデオカメラ24から映像を取り込み、全体動画と部分動画を生成し記録する。記録された動画は情報処理装置25によって再生され、ディスプレイ26に表示される。
【0047】
構成例4では、デジタルビデオカメラ27とプレーヤ28とテレビ受像機29から動画記録装置が構成されている。この構成では、プレーヤ28が画像合成部17の機能を担い、テレビ受像機29が表示部18の機能を担い、それ以外の構成要素についてはデジタルビデオカメラ27が担っている。デジタルビデオカメラ22で生成された全体動画および部分動画は、半導体メモリ30やDVD31などの記録メディアに記録されている。プレーヤ(動画再生装置)28はその記録メディアから動画を読み込み、映像信号を生成する。映像信号はテレビ受像機29に表示される。取り外し可能な記録メディアに動画を記録したことで、動画を別体の機器に渡すのが容易となる。
【0048】
以上述べたように、動画記録装置は一体の構成(構成例1)でもよいし、複数の機器からなる別体の構成(構成例2〜4)でもよい。また、ここで挙げた例に限らず、適宜構成を変形したり組み合わせたりしてもよい。
【0049】
(動画記録処理)
次に、動画記録装置の動画記録処理について詳しく説明する。図3〜図6は、本発明の第1実施形態における動画記録処理の流れを示すフローチャートである。以下に述べる処理は、動画記録装置のコントローラ(CPU)がプログラムに従ってハードウェアの制御や演算処理を実行することにより実現されるものである。
【0050】
動画記録を開始すると、図3の処理が実行される。図3のフローチャートは、1つのフレーム(画像)を撮像・記録する処理である。動画記録中は、この処理がフレームレートに同期したタイミング(たとえば30回/秒)で繰り返し実行される。
【0051】
まず、撮像部10が撮像を行う(ステップS10)。撮像部10では、動画記録用画素数(VGAサイズ)よりも高い解像度(300万画素)で撮像が行われる。撮像により得られた原画像はフレームメモリ11に格納される。
【0052】
次に、顔処理部13が原画像から部分画像リストを作成する(ステップS11)。詳しくは、図4に示すように、顔処理部13がフレームメモリ11から原画像を読み込み(ステップS110)、原画像から顔を検出して顔矩形を算出する(ステップS111)。たとえば、図7のような原画像の場合には、2つの顔矩形40、41が得られる。
【0053】
顔矩形が得られたら、顔処理部13は顔矩形40で囲まれた顔画像から顔情報を抽出する(ステップS113)。そして、顔処理部13は、顔情報登録部14に登録されている顔情報を参照し、検出された顔が登録されている顔に一致するか否かを調べる(ステップS114)。一致する場合(ステップS115;YES)、顔処理部13はその顔の登録IDと顔矩形を部分画像リストに追加する(ステップS116)。一致する顔がない場合には(ステップS115;NO)、部分画像リストへの追加は行われない。顔矩形40についての処理が終了すると、他の顔矩形41についても同様の処理が実行される(ステップS112)。
【0054】
図8に部分画像リストの一例を示す。部分画像リストは、顔の登録IDと顔矩形の4点の座標値とが対応付けられた情報である。登録者の顔が検出されるたびに部分画像リストの項目(行)が追加される。本例では、顔矩形40に関する情報のみが追加されており、部分画像リストの項目数は1である。
【0055】
顔処理部13にて作成された部分画像リストは、画像処理部12に渡される。画像処理部12は、部分画像リストの項目数が0か0より多いかを調べる(ステップS12)。項目数が0の場合、つまり顔が検出されなかった場合は、全体画像のみが生成・記録される(ステップS14)。一方、項目数が0より多い場合、つまり登録者の顔が少なくとも1
つ検出された場合には、全体画像だけでなく、検出された顔の部分画像(アップ画像)も生成・記録される(ステップS13,S14)。
【0056】
図5は部分画像の生成・記録処理を示している。画像処理部12は、部分画像リストの各項目について以下の処理を実行する(ステップS130)。
【0057】
まず、画像処理部12はフレームメモリ11から原画像を読み込む(ステップS131)。次に、画像処理部12は部分画像リストから顔矩形の座標を取得し、部分画像として抜き出す領域の座標を算出する(ステップS132)。ここでは、顔矩形の中心と部分画像の領域の中心とが一致するように座標を決定する。これは、部分画像中の顔の位置を一定にするためである。たとえば図9の例では、部分画像は、顔矩形40の中心の周囲640×480画素の領域42となる。
【0058】
画像処理部12は、原画像から上記領域を抜き出し、図9に示すようなVGAサイズの部分画像を生成する(ステップS133)。生成された部分画像は、ステップS132で算出した座標および登録IDとともに部分画像記録部16に渡される。
【0059】
部分画像記録部16は、まず、登録IDの一致する部分動画(記録中のものに限る。)が存在するか否か調べる。存在すれば、部分画像記録部16は、受け取った部分画像をエンコードし、記録中の部分動画に追加していく。存在しない場合、部分画像記録部16は、その登録IDについての部分動画を新規に生成する。このように、本実施形態では登録者別(顔別)に部分動画の生成および記録が行われる(ステップS134)。
【0060】
図6は全体画像の生成・記録処理を示している。まず、画像処理部12はフレームメモリ11から原画像を読み込む(ステップS140)。次に、画像処理部12は原画像をVGAサイズの画像に解像度変換し、図9に示すような全体画像を生成する(ステップS141)。そして全体画像記録部15が、全体画像をエンコードし、全体動画の生成および記録を行う(ステップS142)。
【0061】
図10は、全体動画と部分動画のストリーム構造(データ構造)の一例を示している。ここでは、全体動画ストリーム50と、3つの部分動画ストリーム51とが関連付けて記録されている。
【0062】
全体動画ストリーム50の各フレームは、フレームデータ(全体画像)とポインタとタイムスタンプとから構成される。当該フレームに対応する部分画像が存在する場合には、ポインタに部分動画ストリーム51を特定するための情報(たとえば、ファイル名または記録されているトラックなど)が格納され、タイムスタンプに部分画像のフレームを特定するための情報(たとえば、時間またはフレーム番号など)が格納される。なお、1つのフレームに複数の部分画像が対応している場合は、各部分画像へのポインタとタイムスタンプが格納されることになる。これにより、全体動画と部分動画とのストリーム同士の関連づけと時間的な対応付けとがとられている。
【0063】
また、部分動画ストリーム51の各フレームは、フレームデータ(部分画像)と位置情報とから構成される。位置情報には、全体画像中の部分画像の位置(領域)を表す座標値が格納される。これにより、全体動画と部分動画の位置的な対応付けがとられている。
【0064】
(動画再生処理)
次に、全体動画と部分動画を対応させながら表示する処理について説明する。
【0065】
画像合成部17は、表示対象となる全体動画と部分動画を記録メディアから読み込み、
デコード処理を施した後、全体動画と部分動画のそれぞれを表示サイズに合わせて適宜解像度変換する。そして、画像合成部17は、全体動画と部分動画を合成して映像信号を生成し、その映像信号を表示部18に出力する。これにより、全体動画と部分動画とを同期させながら表示することができる。
【0066】
図11は、部分動画を画面全体に表示し、画面の左下に全体動画を縮小表示した表示例を示している。この表示態様は、顔の表情をメインに見たいときなどに好適である。
【0067】
図12は、全体動画を画面全体に表示し、画面の左上に部分動画を縮小表示した表示例を示している。この表示態様は、全体の様子をメインに見たいときなどに好適である。
【0068】
他の表示態様としては、たとえば、全体動画と部分動画とを画面上に同じ大きさで表示する態様、全体動画または部分動画のいずれか一方のみを表示する態様、全体動画に2つ以上の部分動画を合成表示する態様などがある。
【0069】
視聴者は、動画記録装置のボタンやリモコンなどの操作手段を操作することによって、表示態様の切り替えを行うことができる。表示中の全体動画に関連付けられている部分動画が複数ある場合には、操作手段を操作することによって、画面上に表示する部分動画を切り替えたり、複数の部分動画を同時に表示したりすることも可能である。
【0070】
また、図11、図12の表示例では、部分動画の領域を表すマーク(枠)60が全体動画に合成表示されている。このマーク60は、画像合成部17が部分動画ストリームに含まれる位置情報に基づいて生成したものである。このようなマーク表示により、視聴者はどの人の顔がアップで表示されているかを容易に把握することができる。
【0071】
以上述べた本実施形態の動画記録装置によれば、全体の様子を画角に収めて撮影を行うだけで全体と部分(アップ)の2種類の動画が自動的に記録されるので、撮影者によるズーム操作などは不要となり、撮影および記録の簡単化が図られる。しかも、いずれの画像も高解像度の原画像から生成されるので、良好な画質が得られる。
【0072】
また、本実施形態では、原画像の中からアップで撮影すべき顔が自動検出されるため、被写体となる人物を画角内に入れて撮影を行うだけで、その人の顔をアップで追いかける部分動画が自動的に記録される。しかも、非登録者の部分動画は生成されないので、画角内に大勢の人物が入っている場合でも所望の人物(登録者)の部分動画のみが記録されるという利点がある。
【0073】
また、本実施形態では、原画像からVGAサイズの領域をトリミングすることによって部分画像を生成している。よって、解像度変換が不要となり、部分画像生成処理の単純化および高速化を図ることができるとともに、解像度変換による画質劣化を防ぐことができる。
【0074】
また、従来の動画記録装置では、被写体の動きや手ブレの影響により、顔をアップにしながらその動きに追従することが困難であったが、本実施形態の動画記録装置では、部分画像中の顔の位置が略一定になるように部分画像のトリミングが行われるので、揺れのほとんど無い見やすい動画を得ることができる。
【0075】
<第2実施形態>
次に、本発明の第2実施形態について説明する。第1実施形態では、顔認識により登録者別に部分動画を記録していたが、本実施形態では、原画像中の顔のサイズが大きい順に部分動画を記録する。具体的には、部分画像リストの作成処理が異なる。
【0076】
図13は、第2実施形態における部分画像リストの作成処理を示している。なお、図13中、図4と同じ処理には同一のステップ番号を付してある。
【0077】
まず、顔処理部13は、第1実施形態と同様、フレームメモリ11から原画像を読み込み(ステップS110)、原画像から顔を検出して顔矩形を算出する(ステップS111)。
【0078】
顔矩形が得られたら、顔処理部13はサイズの大きい順に顔矩形をソートする(ステップS117)。ソート後に、上位2つ以外の顔矩形を削除したり、所定の閾値よりも小さい顔矩形を削除したりすることによって、大きい顔矩形のみを選出するようにしてもよい。
【0079】
そして、顔処理部13は、ソート後の顔矩形を部分画像リストに順番に追加していく(ステップS118、S119)。本実施形態では、登録IDの代わりに、ソート後の順番(1,2,・・・)が記録される。以降の処理は第1実施形態のものと同様である。
【0080】
本実施形態の処理によれば、サイズの大きい顔が自動的に部分動画の記録対象として選ばれる。撮影者は自分の撮りたい被写体が最も大きく写るように撮影を行うのが通例であるため、部分動画の記録対象と被写体とが一致する蓋然性が高い。すなわち、本実施形態では、顔情報の登録や顔認識処理を行わなくても、所望の被写体の部分動画を自動的に記録することができるようになる。
【0081】
また、図14に示すように、撮影中に顔Aと顔Bの大きさが入れ替わると、1番目の部分動画52では顔Aから顔Bへと、2番目の部分動画53では顔Bから顔Aへと被写体が入れ替わる。これを利用すれば、たとえば、かけっこの先頭争いの様子を臨場感あふれる映像として表示するなど、ユニークな表示効果を得ることができるという利点もある。
【0082】
<第3実施形態>
次に、本発明の第3実施形態について説明する。第1実施形態では、原画像からVGAサイズの部分画像をトリミングしていたが、本実施形態では、部分画像中の顔の大きさが略一定になるように部分画像を生成する。
【0083】
図15は、第3実施形態における部分画像の生成・記録処理を示している。なお、図15中、図5と同じ処理には同一のステップ番号を付してある。
【0084】
まず、画像処理部12はフレームメモリ11から原画像を読み込む(ステップS131)。次に、画像処理部12は部分画像リストから顔矩形の座標を取得し、顔画像として抜き出す領域の座標を算出する(ステップS135)。顔画像とは、顔(顔矩形)を包含し、かつ、顔(顔矩形)に略比例した大きさの画像である。本実施形態では、顔矩形の約1.5〜2倍となるように顔画像の領域を決定する。なお、顔画像のアスペクト比は動画記録用画素数(VGAサイズ)に合わせる。
【0085】
画像処理部12は、原画像から顔画像を抜き出した後(ステップS136)、その顔画像をVGAサイズの画像に解像度変換して部分画像を生成する(ステップS137)。以降の処理は第1実施形態のものと同様である。
【0086】
本実施形態の処理によれば、部分画像に占める顔の大きさが略一定になる。つまり、顔を常に同じような大きさで撮影することができるという利点がある。
【0087】
以上、第1〜第3実施形態により本発明の具体例を示したが、本発明の範囲は上記実施形態に限られるものではなく、その技術思想の範囲内で種々の変形が可能である。
【0088】
たとえば、上記実施形態ではハンディタイプのビデオカメラに本発明を適用した事例を示したが、本発明は監視カメラなど他の用途にも好ましく適用することができる。監視カメラのような設置型の動画記録装置の場合には、部分画像として抽出する領域を固定的にしてもよい。
【0089】
また、第1実施形態と第2実施形態の処理を組み合わせることによって、顔のサイズが大きく、かつ、その顔が登録されている場合にのみ部分動画を記録するようにしてもよい。あるいは、第2実施形態と第3実施形態を組み合わせてもよい。
【0090】
また、上記実施形態ではストリーム中に全体動画と部分動画を関連付ける情報を記録したが、DVDのマルチアングルトラックのような仕組みを利用して全体動画と部分動画の関連付けを行うことも好ましい。
【0091】
また、上記実施形態では、検出した顔と登録者の顔の比較を全フレームについて調べているが、たとえば60フレームに1回だけ比較を行うようにし、残りのフレームは顔矩形の移動をトラッキングするようにしてもよい。これにより処理の高速化を図ることができる。
【0092】
また、上記実施形態で述べた動画のストリーム構造や部分画像リストの構造は一例にすぎず、適宜変更可能である。撮像部10の有効画素数や動画記録用画素数についても適宜変更可能である。
【0093】
また、上記実施形態では顔部分を部分画像として抽出したが、たとえば、顔や顔矩形の大きさからその人の身長を推定することによって、全身もしくは上半身を部分画像として抽出するようにしてもよい。
【図面の簡単な説明】
【0094】
【図1】動画記録装置の機能構成を示すブロック図。
【図2】動画記録装置の機器構成例を示す図。
【図3】動画記録処理の流れを示すフローチャート。
【図4】部分画像リストの作成処理の流れを示すフローチャート。
【図5】部分画像の生成・記録処理の流れを示すフローチャート。
【図6】全体画像の生成・記録処理の流れを示すフローチャート。
【図7】原画像から検出された顔矩形を示す図。
【図8】部分画像リストの一例を示す図。
【図9】全体画像と部分画像の生成処理を説明するための図。
【図10】全体動画と部分動画のストリーム構造を示す図。
【図11】全体動画と部分動画の表示例を示す図。
【図12】全体動画と部分動画の表示例を示す図。
【図13】第2実施形態における部分画像リストの作成処理の流れを示すフローチャート。
【図14】第2実施形態で生成される部分動画について説明するための図。
【図15】第3実施形態における部分画像の生成・記録処理の流れを示すフローチャート。
【符号の説明】
【0095】
1 動画記録装置
10 撮像部
11 フレームメモリ
12 画像処理部
13 顔処理部
14 顔情報登録部
15 全体画像記録部
16 部分画像記録部
17 画像合成部
18 表示部
20,22,27 デジタルビデオカメラ
21 表示部
23,29 テレビ受像機
24 ビデオカメラ
25 情報処理装置
26 ディスプレイ
28 プレーヤ
30 半導体メモリ
31 DVD

【特許請求の範囲】
【請求項1】
動画記録用画素数よりも高い解像度で撮像する撮像手段と、
撮像により得られた原画像を動画記録用画素数の全体画像に解像度変換する全体画像生成手段と、
前記原画像の一部分から動画記録用画素数の部分画像を生成する部分画像生成手段と、
前記全体画像から構成される全体動画と前記部分画像から構成される部分動画とを関連付けて記録する記録手段と、
を備える動画記録装置。
【請求項2】
前記部分画像生成手段は、
前記原画像から人の顔を検出する顔検出手段を有し、
検出された顔を含むように前記部分画像を生成する
請求項1記載の動画記録装置。
【請求項3】
前記部分画像生成手段は、
顔情報が登録される顔情報登録手段と、
検出された顔が前記顔情報登録手段に登録されている顔と一致するか否かを判定する顔認識手段と、を有し、
登録されている顔の場合はその顔を含む部分画像を生成する
請求項2記載の動画記録装置。
【請求項4】
前記部分画像生成手段は、動画記録用画素数の大きさの領域を前記原画像から抜き出したものを部分画像とする
請求項2または3記載の動画記録装置。
【請求項5】
前記部分画像生成手段は、顔の大きさに略比例した大きさの領域を前記原画像から抜き出した後、その抜き出された画像を動画記録用画素数の部分画像に解像度変換する
請求項2または3記載の動画記録装置。
【請求項6】
前記部分画像生成手段は、部分画像中の顔の位置が略一定になるように前記領域を前記原画像から抜き出す
請求項4または5記載の動画記録装置。
【請求項7】
前記記録手段は、前記全体動画と前記部分動画とを時間的な対応付けをとりながら記録する
請求項1〜6のうちいずれか1項記載の動画記録装置。
【請求項8】
前記記録手段は、前記全体画像中の前記部分画像の位置を記録する
請求項1〜7のうちいずれか1項記載の動画記録装置。
【請求項9】
前記記録手段は、動画記録装置本体から取り外し可能な記録メディアを有する
請求項1〜8のうちいずれか1項記載の動画記録装置。
【請求項10】
前記全体動画および部分動画を対応させながら表示するための映像信号を生成する画像合成手段を備える
請求項1〜9のうちいずれか1項記載の動画記録装置。
【請求項11】
前記映像信号を表示する表示手段を備える
請求項10記載の動画記録装置。
【請求項12】
前記画像合成手段は、部分動画の領域を表すマークを全体動画に合成する
請求項10または11記載の動画記録装置。
【請求項13】
全体動画に関連付けられている部分動画が複数ある場合に画面上に表示する部分動画をユーザに選択させる操作手段を備える
請求項10〜12のうちいずれか1項記載の動画記録装置。
【請求項14】
請求項1〜13のうちいずれか1項記載の動画記録装置によって記録された全体動画および部分動画を、前記動画記録装置から読み込む読込手段と、
前記全体動画および部分動画を対応させながら表示するための映像信号を生成する画像合成手段と、
前記映像信号を表示する表示手段と、
を備える動画再生装置。
【請求項15】
動画記録装置が、
動画記録用画素数よりも高い解像度で撮像し、
撮像により得られた原画像を動画記録用画素数の全体画像に解像度変換し、
前記原画像の一部分から動画記録用画素数の部分画像を生成し、
前記全体画像から構成される全体動画と前記部分画像から構成される部分動画とを関連付けて記録する
動画記録方法。
【請求項16】
動画記録装置が、
動画記録用画素数よりも高い解像度で撮像し、
撮像により得られた原画像を動画記録用画素数の全体画像に解像度変換し、
前記原画像の一部分から動画記録用画素数の部分画像を生成し、
前記全体画像から構成される全体動画と前記部分画像から構成される部分動画とを関連付けて記録し、
記録された全体動画および部分動画を対応させながら表示するための映像信号を生成し、
前記映像信号を表示手段に表示する
動画記録再生方法。
【請求項17】
動画記録装置に、
動画記録用画素数よりも高い解像度で撮像する処理と、
撮像により得られた原画像を動画記録用画素数の全体画像に解像度変換する処理と、
前記原画像の一部分から動画記録用画素数の部分画像を生成する処理と、
前記全体画像から構成される全体動画と前記部分画像から構成される部分動画とを関連付けて記録する処理と、
を実行させるためのプログラム。
【請求項18】
動画記録装置に、
動画記録用画素数よりも高い解像度で撮像する処理と、
撮像により得られた原画像を動画記録用画素数の全体画像に解像度変換する処理と、
前記原画像の一部分から動画記録用画素数の部分画像を生成する処理と、
前記全体画像から構成される全体動画と前記部分画像から構成される部分動画とを関連付けて記録する処理と、
記録された全体動画および部分動画を対応させながら表示するための映像信号を生成する処理と、
前記映像信号を表示手段に表示する処理と、
を実行させるためのプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate


【公開番号】特開2006−109119(P2006−109119A)
【公開日】平成18年4月20日(2006.4.20)
【国際特許分類】
【出願番号】特願2004−293373(P2004−293373)
【出願日】平成16年10月6日(2004.10.6)
【出願人】(000002945)オムロン株式会社 (3,542)
【Fターム(参考)】