説明

記録装置及び記録方法

【課題】分割領域毎の顔検出処理では検出できなかった顔に対しても検出できるようにする。
【解決手段】入力された画像信号を複数に分割し、分割領域毎に第1の映像信号処理部と、第1の顔検出部と、符号化部とを備える記録装置に、前記入力された画像信号に係る画像を間引き処理する解像度変換部と、前記解像度変換部により間引かれた画像を映像信号に変換し、第2の映像信号を生成する第2の映像信号処理部と、前記第2の映像信号処理部により生成される第2の映像信号から顔を検出する第2の顔検出部とを設け、前記符号化手段は、前記第1の顔検出部から出力された情報と、前記第2の顔検出部から出力された情報とを選択的に用いて符号化処理を行うようにすることにより、分割領域の境界部を跨ぐ画像を保護して、分割された画像からでは検出できない情報(顔)を検出できるようにする。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は記録装置及び記録方法に関し、特に、静止画あるいは動画などの映像情報を媒体に記録するために用いて好適な技術に関する。
【背景技術】
【0002】
近年、記憶媒体にディスク媒体やハードディスク、メモリを用いてハイビジョン記録を行うビデオカメラが製品化され始めた。これらのビデオカメラは、小型で持ち運びも容易であり、かつ高画質の映像を記録できるため、今後ますます普及していくと思われる。
【0003】
このような機器では、ハイビジョン記録を行うため、記録時にはMPEG4 part-10:AVC(ISO/IEC 14496-10、別名H.264)のような圧縮符号化されたビデオストリームで記録媒体に映像を保存する。
【0004】
また、顔検出技術の進歩に伴って、顔検出を用いた高画質化処理を行うビデオカメラも登場してきた。顔検出で人物の顔領域を特定し、その領域の符号化劣化を抑えることで、注視領域である人物の顔を高画質化することができる。また、ハイビジョンを超えた更なる多画素化を実現するために、画面を複数に分割し、分割された領域毎に映像信号処理と符号化処理を行う構成が提案されている。
【0005】
以下、従来の顔検出を用いた顔の高画質化処理について説明する。
顔検出で人物の顔領域を特定し、その領域の符号化劣化を抑えることで、注視領域である人物の顔を高画質化している。例えば、撮像素子(図示せず)より入力された画像信号を複数の領域に分割する。ここでは簡単のため、図7(a)に示すように、入力画像701を縦に4分割して、図7(b)に示すように、領域A、領域B、領域C、領域Dとすることとする。
【0006】
図8は、顔検出を用いた従来の符号化処理の一例を示すフローチャートである。
ステップS801では、符号量制御を行い、量子化コードを算出する。
ステップS802では、顔検出を行って検出された領域を顔検出領域として取得する。
ステップS803では、ステップS802において取得した顔検出領域において、顔が検出されたか否かを判断する。
【0007】
ステップS803の判断の結果、顔が検出されていればステップS804へ分岐し、そうでなければステップS805へと分岐する。ステップS804では、算出した量子化コード設定から、所定の値である量子化コード補正量Nを差し引いた値に補正する処理を行う。その後、ステップS805に移行する。ステップS805では、量子化コード設定を用いて符号化を行う。
【0008】
このように、従来は、顔検出された領域に対して、量子化コードを小さくして細かく量子化するように量子化コードを補正することで、顔検出された領域の画質を高画質化している。したがって、分割領域毎における符号化部の顔検出を用いた顔の高画質化処理であり、従来の記録装置は、分割領域毎に符号化処理を行うものである(例えば、特許文献1参照)。
【先行技術文献】
【特許文献】
【0009】
【特許文献1】特開2003−348597号公報
【発明の概要】
【発明が解決しようとする課題】
【0010】
従来の顔検出処理においては、分割領域毎に顔検出を行うようにしているため、図9において、符号901で示した画像のように、顔の一部しか画面内にない場合は、人物の顔として特定することができない場合が発生する。
【0011】
例えば、図10に示す入力画像1000には、3名の人物の顔が存在するにもかかわらず、分割領域A〜D毎の顔検出処理では分割領域Bにある1名の人物1001の顔しか検出することができず、他の2名は検出できていないという問題があった。
本発明は前述の問題点に鑑み、分割領域毎の顔検出処理では検出できなかった顔に対しても検出できるようにすることを目的とする。
【課題を解決するための手段】
【0012】
本発明の記録装置は、入力された画像信号に係る画像を複数の領域に分離する分離手段と、前記分離手段により複数に分割された画像領域のそれぞれを映像信号に変換し、第1の映像信号を出力する複数の第1の映像信号処理手段と、前記複数の第1の映像信号処理手段からそれぞれ出力される各画像領域に係る第1の映像信号から顔を検出する複数の第1の顔検出手段と、前記複数の第1の顔検出手段により顔検出された情報を用いて映像信号を圧縮符号化し、符号化ストリームを生成する複数の符号化手段と、前記複数の符号化手段により生成される複数の符号化ストリームを記録する記録媒体とを備える記録装置であって、前記入力された画像信号に係る画像を間引き処理する解像度変換手段と、前記解像度変換手段により間引かれた画像を映像信号に変換し、第2の映像信号を生成する第2の映像信号処理手段と、前記第2の映像信号処理手段により生成される第2の映像信号から顔を検出する第2の顔検出手段とを備え、前記符号化手段は、前記複数の第1の顔検出手段から出力された情報と、前記第2の顔検出手段から出力された情報とを選択的に用いて符号化処理を行うことを特徴とする。
【発明の効果】
【0013】
本発明によれば、分割領域毎の顔検出結果の他に、画面全体を縮小した領域に対して顔検出を行い、その検出結果を符号化に使用するようにした。これにより、分割領域毎の顔検出処理では検出できなかった顔に対しても符号化時に高画質化を行うことが可能となり、使用者にとって好適なビデオカメラを提供することができる。
【図面の簡単な説明】
【0014】
【図1】本実施形態における記録装置の構成例を示すブロック図である。
【図2】本実施形態における顔検出結果伸長部による、第2の顔検出されたMB座標から第3の顔検出されたMB座標への伸長方法を示す図である。
【図3】本実施形態における符号化部の符号化処理における顔検出されたMBの決定手順の一例を説明するフローチャートである。
【図4】本実施形態における分割領域内で顔検出が行われた場合の、符号化処理における高画質化処理を適用するMBを示す図である。
【図5】本実施形態における分割領域の境界に顔があるが、分割領域内で顔検出ができなかった場合の、符号化処理における高画質化処理を適用するMBを示す図である。
【図6】本実施形態における画面内に3名の人物が存在し、うち2名の顔が分割領域の境界に跨っている場合の、顔高画質化処理の適用範囲を示す図である。
【図7】従来例を示し、撮像素子より入力された画像の分割方法を示す概念図である。
【図8】従来例を示し、顔検出を用いた符号化処理の一例を示すフローチャートである。
【図9】従来例を示し、顔が一部しか存在しない場合の分割領域を示す概念図である。
【図10】従来例を示し、人物が3名存在する場合の顔検出領域を示す概念図である。
【発明を実施するための形態】
【0015】
図1は、本発明の実施形態を示し、記録装置の構成例を示すブロック図である。
以下、図1を用いて、本発明における解像度変換処理、解像度変換された画像に対する映像信号処理、顔検出処理と、符号化処理について説明する。
【0016】
図1において、101は撮像素子であり、外部からの画像を取り込み、画像信号へと変換する。102は分離部であり、撮像素子101より入力された画像信号を複数の領域に分割する。ここでは簡単のため、図7(a)、(b)のように領域を縦に4分割(領域A、B、C、D)することとする。
【0017】
103は分割領域毎の映像プロセッサであり、第1の映像信号処理部104、第1の顔検出部105、符号化部106を備えている。本実施形態においては、分割領域毎に映像エンジン103A〜103D、第1の映像信号処理部104A〜104D、第1の顔検出部105A〜105D、符号化部106A〜106Dを備えている。
【0018】
104(104A〜104D)はそれぞれ映像信号処理部であり、分離部102により複数に分割された画像領域のそれぞれを映像信号に変換し、電気的な映像信号を出力する。105(105A〜105D)はそれぞれ顔検出部であり、第1の映像信号処理部104より出力された映像信号を入力し、その中に人物の顔が含まれているかを検出し、人物の顔と判定された第1のマクロブロック座標を符号化部へと通知する。
【0019】
106(106A〜106D)はそれぞれ符号化部であり、符号化単位ブロックであるマクロブロック(以後、MBと定義する)ごとに動き予測及び動き補償を行う。さらに、顔検出された情報を用いてMBの画像データを量子化し、エントロピー符号化して映像信号を圧縮符号化し、符号化ストリームを生成する。
【0020】
第1の映像信号処理部104より入力された映像信号、そして第1の顔検出部105より入力された、人物の顔と判定された第1のMBの座標を用いて、人物の顔と判定された第1のMBの符号化劣化を抑えるように量子化制御しながら、符号化を行う。顔検出を用いた高画質化処理について、詳細は後に説明する。107は記録媒体であり、符号化部106より出力される符号化ストリームを記録する。
【0021】
<解像度変換処理と縮小画像の顔検出処理>
撮像素子101から入力された画像信号を、分離部102の入力とは別に解像度変換部108へと入力する。解像度変換部108は、入力された画像を、縦、横それぞれ所定の縮小率で縮小させて、第2の映像信号処理部109へと出力する。ここでは、簡単のため縦1/2、横1/2の縮小率とする。具体的には、撮像素子101より入力された画像信号を間引き処理して解像度変換を行い、縦横の縮小を行う。
【0022】
第2の映像信号処理部109では、入力された縦1/2、横1/2に縮小された画像を電気的な映像信号に変換し出力する。第2の顔検出部110では、入力された映像信号に対して顔検出処理を行い、顔と検出された第2のMBの座標を顔検出結果伸長部111へと通知する。
【0023】
顔検出結果伸長部111では、第2の顔検出部110より通知された顔検出されたMBを、解像度変換部108の縮小率に応じて縮小前のMBに対応させるように、マクロブロック毎に伸長した第3のMB座標を複数算出する。そして、顔検出結果伸長部111は、算出した情報を符号化部106A〜106Dへとそれぞれ通知する。
【0024】
<縮小画像の顔検出結果の符号化処理への適用方法>
符号化部106は、第2の顔検出部110から顔検出された第2のMBの座標を受け取るが、受け取った座標は縮小された映像信号に対してのMB座標であるため、元の解像度へ伸長する必要がある。
【0025】
図2は、符号化部106における、第2の顔検出部110から顔検出された第2のMBの座標の伸長方法を示す図である。
図2において、201は第2の顔検出部110より出力された第2のMBの座標(A,B)〜(A+1,B+1)、202は顔検出結果伸長部111で伸長後の、第3のMBの座標を示している。本実施形態では縦1/2、横1/2の縮小率としている。このため、第2の顔検出部110より出力された第2のMBの座標に対して顔検出結果伸長部111で縦、横それぞれ2倍伸長して、そこに含まれるMBを第2の顔検出部110により顔検出された第3のMB座標を符号化部106A〜106Dに通知する。
【0026】
例えば、第2の顔検出部110より出力された第2のMBの座標(A,B)に対しては、以下のようになる。すなわち、(2A,2B)、(2A+1,2B)、(2A,2B+1)、(2A+1,2B+1)の4つのMBが、顔検出された第3のMBとして符号化に使用されることになる。
【0027】
<符号化処理における顔検出されたMBの決定方法>
図3は、符号化部106の符号化処理における顔高画質化処理を行うMBの決定方法の処理手順を示すフローチャートである。
以下、図3のフローチャートを参照しながら符号化処理における顔高画質化処理を行うMBの決定方法について説明する。
【0028】
ステップS301では、第1の顔検出部105より分割領域内の顔検出結果である第1のMB座標を受け取る。
ステップS302では、顔検出結果伸長部111より縮小画像の顔検出結果である第2のMB座標を伸長した、第3のMB座標を受け取る。
ステップS303では、第1の顔検出されたMB座標と第3の顔検出されたMB座標とが重なっているかどうかを判断する。
【0029】
ステップS303の判断の結果、重なっていればステップS304へ分岐し、そうでなければステップS305へと分岐する。
ステップS304では、第3の顔検出されたMB座標の伸長前の第2の顔検出された第2の顔検出されたマクロブロック(MB)の座標と同一座標から求めた第3のMBの座標を全て破棄し、第1の検出されたMB座標を顔高画質化処理の対象MBとして決定する。ステップS305では、当該MB座標を顔高画質化処理の対象MBとして決定する。このように、符号化部106は、第1の顔検出部105A〜105Dから出力された情報と、第2の顔検出部110から出力された情報とを選択的に用いて符号化処理を行う。
【0030】
図4及び図5は、前述した符号化処理における高画質化処理を適用するMBの一例を示す図である。図4は、分割領域内で顔検出が行われた場合であり、図5は、分割領域の境界に顔があるが、分割領域内で顔検出ができなかった場合である。
【0031】
図4の、分割領域内で顔検出が行われた場合における符号化部の顔高画質化処理について説明する。
図4において、401は、解像度変換後の縮小画像で顔検出された第2のMBである。402は、分割領域内で顔検出された第1のMBとその周辺MBである。403は、縮小画像で顔検出されたMBを伸長した第3のMBである。404は、符号化部で顔高画質化処理を行うMBと、その周辺MBである。
【0032】
図4のように、第1の顔検出されたMB座標402と第3の顔検出されたMB403の座標とが重なっている場合は、MB404のように、符号化部は第3の顔検出されたMB403の座標を破棄する。そして、第1の顔検出されたMB座標402に対して顔高画質化処理を行う。
【0033】
これは、第3の顔検出されたMB座標は、縮小画で検出されたMBを伸長しており、縮小前の顔検出結果である第1の顔検出されたMB座標402に対して精度が落ちてしまうため、精度の高い顔検出結果を採用するためである。
【0034】
次に、図5の、分割領域内で顔検出が行われなかった場合における符号化部の顔高画質化処理について説明する。
図5において、501は、解像度変換後の縮小画像で顔検出された第2のMBである。502は、分割領域内で顔検出された第1のMBとその周辺MBである。503は、縮小画像で顔検出されたMBを伸長した第3のMBである。504は、符号化部で顔高画質化処理を行うMBと、その周辺MBである。
【0035】
図5のように、第1の顔検出されたMB座標502と第3の顔検出されたMB座標503とが重なっていない場合は、504のように、符号化部は第3の顔検出されたMB座標503に対して顔高画質化処理を行う。
【0036】
図6は、画面内に3名の人物が存在し、うち2名の顔が分割領域の境界に跨っている場合の、顔高画質化処理の適用範囲を示す図である。
図6において、601は、分割領域毎に顔検出された結果である。
602は、縮小画像で顔検出された結果である。603は、符号化を行う各分割領域であり、符号化部は領域604〜608に対して、顔高画質化処理を行う。
【0037】
領域604は、分割領域毎に顔検出された第1のMB座標、領域605、606,607、608は縮小画像の顔検出結果を伸長した第3の顔検出されたMB座標である。図6(c)において、分割領域を跨ぐことなく、分割領域内に人物の顔がある場合は、第1の顔検出部105より出力された第1の顔検出されたMB領域を符号化処理の顔高画質化処理に用いる領域として決定している。また、分割領域を跨ぐ人物の顔は、第2の顔検出部110より出力され、符号化部106にて伸長した第3のMB領域を符号化処理の顔高画質化処理に用いる領域として決定している。
【0038】
このようにすることで、分割領域を跨ぐことなく、分割領域内に人物の顔がある場合は、顔検出の精度の高い第1の顔検出されたMB領域を顔検出領域として決定する。また、第1の顔検出部105では検出することのできない分割領域を跨ぐ人物の顔は、顔検出の精度の低い第3のMB領域を符号化処理に用いる顔検出された領域として決定している。
【0039】
このため、従来の顔検出の精度を保ちつつ、従来では検出できなかった顔を検出することができるため、分割領域を跨ぐ人物の顔を高画質化可能となり、ユーザーに対して好適な記録装置を提供する事ができる。
【0040】
(本発明に係る他の実施の形態)
前述した本発明の実施の形態における記録装置を構成する各手段は、コンピュータのRAMやROMなどに記憶されたプログラムが動作することによって実現できる。このプログラム及び前記プログラムを記録したコンピュータ読み取り可能な記録媒体は本発明に含まれる。
【0041】
また、本発明は、例えば、システム、装置、方法、プログラムもしくは記憶媒体等としての実施の形態も可能であり、具体的には、複数の機器から構成されるシステムに適用してもよいし、また、一つの機器からなる装置に適用してもよい。
【0042】
なお、本発明は、前述した記録方法における各工程を実行するソフトウェアのプログラムを、システムあるいは装置に直接、あるいは遠隔から供給する。実施の形態では図3に示すフローチャートに対応したプログラム供給する。そして、そのシステムあるいは装置のコンピュータが前記供給されたプログラムコードを読み出して実行することによっても達成される場合を含む。
【符号の説明】
【0043】
101 撮像素子、102 分離部、103A〜103D 映像プロセッサ、104A〜104D 第1の映像信号処理部、105A〜105D 第1の顔検出部、106A〜106D符号化部、107 記録媒体、108 解像度変換部、109 第2の映像信号処理部、110 第2の顔検出部、111 顔検出結果伸張部

【特許請求の範囲】
【請求項1】
入力された画像信号に係る画像を複数の領域に分離する分離手段と、
前記分離手段により複数に分割された画像領域のそれぞれを映像信号に変換し、第1の映像信号を出力する複数の第1の映像信号処理手段と、
前記複数の第1の映像信号処理手段からそれぞれ出力される各画像領域に係る第1の映像信号から顔を検出する複数の第1の顔検出手段と、
前記複数の第1の顔検出手段により顔検出された情報を用いて映像信号を圧縮符号化し、符号化ストリームを生成する複数の符号化手段と、
前記複数の符号化手段により生成される複数の符号化ストリームを記録する記録媒体とを備える記録装置であって、
前記入力された画像信号に係る画像を間引き処理する解像度変換手段と、
前記解像度変換手段により間引かれた画像を映像信号に変換し、第2の映像信号を生成する第2の映像信号処理手段と、
前記第2の映像信号処理手段により生成される第2の映像信号から顔を検出する第2の顔検出手段とを備え、
前記符号化手段は、前記複数の第1の顔検出手段から出力された情報と、前記第2の顔検出手段から出力された情報とを選択的に用いて符号化処理を行うことを特徴とする記録装置。
【請求項2】
前記第1の顔検出手段は、前記第1の映像信号で顔検出された符号化単位ブロックであるマクロブロックの座標を出力し、前記第2の顔検出手段は、前記第2の映像信号で顔検出された符号化単位ブロックであるマクロブロックの座標を出力することを特徴とする請求項1に記載の記録装置。
【請求項3】
前記第2の顔検出手段から通知された前記第2の顔検出されたマクロブロックの座標と、前記解像度変換手段における縦横の縮小率とを用いて、第2の顔検出されたマクロブロック毎に、第2の顔検出されたマクロブロックの座標を伸長した第3の顔検出されたマクロブロックの座標を複数算出し、前記符号化手段へと通知する顔検出結果伸長手段を備えることを特徴とする請求項1に記載の記録装置。
【請求項4】
前記符号化手段は、前記第1の顔検出されたマクロブロックの座標と、前記第3の顔検出されたマクロブロックの座標とが重なっている場合、前記第1の顔検出されたマクロブロックの座標と同一の前記第2の顔検出されたマクロブロックの座標を伸長して求めた第3の顔検出されたマクロブロックの座標を全て破棄し、前記第1の顔検出されたマクロブロックの座標を顔検出されたマクロブロックとして符号化処理を行うことを特徴とする請求項3に記載の記録装置。
【請求項5】
前記符号化手段は、前記第1の顔検出されたマクロブロックの座標と、前記第3の顔検出されたマクロブロックの座標とが重なっていない場合、当該マクロブロックの座標を顔検出されたマクロブロックとして符号化処理を行うことを特徴とする請求項3に記載の記録装置。
【請求項6】
入力された画像信号に係る画像を複数の領域に分離する分離工程と、
前記分離工程において複数に分割された画像領域のそれぞれを映像信号に変換し、第1の映像信号を出力する第1の映像信号処理工程と、
前記第1の映像信号処理工程からそれぞれ出力される各画像領域に係る第1の映像信号から顔を検出する第1の顔検出工程と、
前記第1の顔検出工程において顔検出された情報を用いて映像信号を圧縮符号化し、符号化ストリームを生成する符号化工程と、
前記符号化工程において生成される複数の符号化ストリームを記録媒体に記録する記録工程とを備える記録方法であって、
前記入力された画像信号に係る画像を間引き処理する解像度変換工程と、
前記解像度変換工程において間引かれた画像を映像信号に変換し、第2の映像信号を生成する第2の映像信号処理工程と、
前記第2の映像信号処理工程において生成される第2の映像信号から顔を検出する第2の顔検出工程とを備え、
前記符号化工程は、前記第1の顔検出工程から出力された情報と、前記第2の顔検出工程から出力された情報とを選択的に用いて符号化処理を行うことを特徴とする記録方法。
【請求項7】
入力された画像信号に係る画像を複数の領域に分離する分離工程と、
前記分離工程において複数に分割された画像領域のそれぞれを映像信号に変換し、第1の映像信号を出力する第1の映像信号処理工程と、
前記第1の映像信号処理工程からそれぞれ出力される各画像領域に係る第1の映像信号から顔を検出する第1の顔検出工程と、
前記第1の顔検出工程において顔検出された情報を用いて映像信号を圧縮符号化し、符号化ストリームを生成する符号化工程と、
前記符号化工程において生成される複数の符号化ストリームを記録媒体に記録する記録工程とをコンピュータに実行させるプログラムであって、
前記入力された画像信号に係る画像を間引き処理する解像度変換工程と、
前記解像度変換工程において間引かれた画像を映像信号に変換し、第2の映像信号を生成する第2の映像信号処理工程と、
前記第2の映像信号処理工程において生成される第2の映像信号から顔を検出する第2の顔検出工程とをコンピュータに実行させ、
前記符号化工程は、前記第1の顔検出工程から出力された情報と、前記第2の顔検出工程から出力された情報とを選択的に用いて符号化処理を行うようコンピュータを制御することを特徴とするプログラム。
【請求項8】
請求項7に記載のプログラムを記憶したことを特徴とするコンピュータ読み取り可能な記憶媒体。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate


【公開番号】特開2011−30030(P2011−30030A)
【公開日】平成23年2月10日(2011.2.10)
【国際特許分類】
【出願番号】特願2009−174788(P2009−174788)
【出願日】平成21年7月27日(2009.7.27)
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】