画像処理装置、画像処理方法、画像処理プログラム
【課題】マスク処理が必要な被写体がフレームインしてくる場合など、マスク対象かどうかの判定までに時間を要するような場合であってもマスク対象が映っている領域にマスクを掛けることができる画像処理装置を提供する。
【解決手段】マスク候補切出部222は、復号化された画像フレームのなかからマスク対象になり得る領域をマスク候補領域として切り出す。類似判定部234は、最新の前記マスク候補領域がマスク対象に類似している場合にはそのマスク候補をマスク対象として確定させる。マスク補充部260は、まず、前記類似判定部234による判定よってマスク対象に確定した領域の動きを時間的に後ろに追跡して移動軌跡を得る。続いてこの移動軌跡を時間的に前に外挿し、マスク対象が検出される前の動きを推定する。そして、この外挿で得られた領域に掛かる補充マスクを作成する。
【解決手段】マスク候補切出部222は、復号化された画像フレームのなかからマスク対象になり得る領域をマスク候補領域として切り出す。類似判定部234は、最新の前記マスク候補領域がマスク対象に類似している場合にはそのマスク候補をマスク対象として確定させる。マスク補充部260は、まず、前記類似判定部234による判定よってマスク対象に確定した領域の動きを時間的に後ろに追跡して移動軌跡を得る。続いてこの移動軌跡を時間的に前に外挿し、マスク対象が検出される前の動きを推定する。そして、この外挿で得られた領域に掛かる補充マスクを作成する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像処理装置、画像処理方法、及び画像処理プログラムに関する。本発明は、例えば、特定人物の顔などプライバシー保護に係るものが映っている画像領域に自動的にマスク処理を施すための画像処理装置等に関する。
【背景技術】
【0002】
近年、個人が撮影した動画像を各個人のパソコン端末や携帯端末からインターネットを介して簡単に公開できるようになってきた。しかし、動画像には、人物や、車両、撮像された地域を示す地名や住所など、個人を特定できる情報が含まれていることがある。そのような情報が含まれる動画像がそのまま公開されてしまうことは、プライバシー保護の観点から望ましくない。
【0003】
そこで、動画像中の特定人物やナンバープレートに対して自動的にモザイクを施す処理を行う方法が提案されている(例えば、特許文献1、特許文献2)。
特許文献1および特許文献2に開示される方法では、まず、モザイクを施す処理が必要になる人物の顔情報を参照情報として予め用意しておく。
そして、参照情報と画像中の顔とが一致した場合には、その顔部分にモザイクを施す処理を行う。
【0004】
この方法であれば、確かに特定人物の顔にモザイクを施す処理を行うことができるものの、画像中の顔が参照情報に一致する前の画像にはモザイクを施せないことになる。例えば、モザイクを施す処理の対象となる人物がゆっくりと画面内にスライドインしてきた場合、その顔が画面内に完全に収まってはじめてモザイクを施す処理が開始されるので、それまではスライドイン途中の顔が一部ではあるものの画面に曝されることとなってしまう。
【0005】
上記問題に対し、特許文献3(特開2010−233133号公報)では次の方法を提案している。特許文献3では、ビデオバッファを用意しておき、動画像を数フレーム遡れるように前記ビデオバッファに一時的に溜めておく。
そして、モザイクを施す対象、つまりマスク対象が検出された場合には、ビデオバッファ内にあるフレームを順番に遡ってマスク対象に関連する部分が無いかを改めて検索する。これにより、マスク対象が完全に画面内に入る前であってもマスク対象が部分的に映っている領域にマスクを掛ける、つまりモザイクを施すことができる。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2001−086407号公報
【特許文献2】特開2004−062560号公報
【特許文献3】特開2010−233133号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、ビデオバッファの容量にも限界がある。30フレーム/秒の動画像であるとして、長くても10秒分ぐらいを溜めておけるのが最大限である(特許文献3の段落0056)。従って、カメラを横にゆっくり振りながら撮影したり、あるいは、固定カメラの前を人がゆっくりと通り過ぎるような場合、マスク処理が必要な人物が画面内にスライドインしてくる時間がビデオバッファの容量よりも長くなるという事態が起こりえる。すると、ビデオバッファによる保持時間を超えてビデオバッファから吐き出されてしまったフレームについては、マスク処理が不十分なままで公開されてしまうことになる。
【0008】
なお、単純にビデオバッファの容量を大きくすることが考えられるが、どれほど容量を大きくしても動画像を一時的にバッファできる容量(時間)には限界がある。また、マスク対象を一旦検出したあとで、再び最初のフレームから検索し直してマスク対象に関連する部分をピックアップするという方法も考えられるが、時間と手間が掛かり過ぎる。
【0009】
そこで、本発明の目的は、マスク処理が必要な被写体がフレームインしてくる場合など、マスク対象かどうかの判定までに時間を要するような場合であっても、それまでの間にマスク対象が映っている領域に確実にマスクを掛けることができる画像処理装置、画像処理方法および画像処理プログラムを提供することにある。
【課題を解決するための手段】
【0010】
そこで、本発明は、
動画データからマスク処理すべき画像領域を検索してそれらにマスクを付加する画像処理装置(100)であって、
予め登録された切出参照リストに基づいて、前記動画データの画像フレームのなかからマスク対象になり得る領域をマスク候補領域として切り出すマスク候補切出部(222)と、
予め登録されたマスク対象参照リストに基づいて、最新の前記マスク候補領域を前記マスク対象参照リストと対比して両者の類似度を算出する類似度算出部(233)と、
前記算出された類似度を所定閾値と対比して、前記類似度が所定閾値以上である場合にはそのマスク候補領域をマスク対象として確定させる類似判定部(234)と、
前記類似判定部(234)による判定よってマスク対象に確定した領域の動きを時間的に後ろに追跡して得られる移動軌跡を時間的に前に外挿し、この外挿で得られた領域に掛かる補充マスクを作成するマスク補充部(260)と、
前記類似判定部(234)による判定によってマスク対象に確定した領域に加えて前記マスク補充部(260)で作成された前記補充マスクの領域に対してマスクを付加するマスク付与部(240)と、を備える
ことを特徴とする画像処理装置を提供する。
【0011】
上記画像処理装置(100)において、
前記マスク補充部(260)は、
前記類似判定部(234)による判定によってマスク対象に確定した領域の座標情報を順次取得する座標情報取得部(261)と、
前記座標情報取得部(261)にて取得された座標情報を保持する補外用データ保持部(262)と、
前記補外用データ保持部(262)に保持されたデータを時間的に前に外挿してマスク対象が検出される前の動きを推測する動き補外部(263)と、
前記動き補外部(263)による外挿によって得られた動きに掛かるように移動するマスクを作成する移動マスク作成部(264)と、を備える
ようにしても良い。
【0012】
また、上記画像処理装置において、
前記類似判定部(234)による判定よってマスク対象に確定した領域と、画像フレーム枠と、の距離が所定閾値以下であるか否かを判定する位置判定部(250)をさらに備え、
前記距離が所定閾値以下の場合に、前記位置判定部(250)は前記マスク補充部(260)を起動させる
ようにしても良い。
【0013】
また、上記画像処理装置において、
前記類似判定部(234)による判定よってマスク対象に確定した領域が画像フレームの中心方向に移動しているか否かを判定する位置判定部(250)をさらに備え、
前記マスク対象に確定した領域が画像フレームの中心方向に移動している場合に、前記位置判定部(250)は前記マスク補充部(260)を起動させる
ようにしても良い。
【0014】
さらに、本発明は、
動画データからマスク処理すべき画像領域を検索してそれらにマスクを付加する画像処理方法であって、
予め登録された切出参照リストに基づいて、前記動画データの画像フレームのなかからマスク対象になり得る領域をマスク候補領域として切り出すマスク候補切出工程(ST103、ST104)と、
予め登録されたマスク対象参照リストに基づいて、最新の前記マスク候補領域を前記マスク対象参照リストと対比して両者の類似度を算出する類似度算出工程(ST106)と、
前記算出された類似度を所定閾値と対比して、前記類似度が所定閾値以上である場合にはそのマスク候補領域をマスク対象として確定させる類似判定工程(ST107)と、
前記類似判定工程(ST107)による判定よってマスク対象に確定した領域の動きを時間的に後ろに追跡して得られる移動軌跡を時間的に前に外挿し(ST123)、この外挿で得られた領域に掛かる補充マスクを作成するマスク補充工程(ST124)と、
前記類似判定工程(ST107)による判定によってマスク対象に確定した領域に加えて前記マスク補充工程(ST124)で作成された前記補充マスクの領域に対してマスクを付加するマスク付与工程(ST125)と、を備える
ことを特徴とする画像処理方法を提供する。
【0015】
さらに、本発明は
動画データからマスク処理すべき画像領域を検索してそれらにマスクを付加する画像処理装置に組み込んだコンピュータを、
予め登録された切出参照リストに基づいて、前記動画データの画像フレームのなかからマスク対象になり得る領域をマスク候補領域として切り出すマスク候補切出部(222)と、
予め登録されたマスク対象参照リストに基づいて、最新の前記マスク候補領域を前記マスク対象参照リストと対比して両者の類似度を算出する類似度算出部(233)と、
前記算出された類似度を所定閾値と対比して、前記類似度が所定閾値以上である場合にはそのマスク候補領域をマスク対象として確定させる類似判定部(234)と、
前記類似判定部(234)による判定よってマスク対象に確定した領域の動きを時間的に後ろに追跡して得られる移動軌跡を時間的に前に外挿し、この外挿で得られた領域に掛かる補充マスクを作成するマスク補充部(260)と、
前記類似判定部(234)による判定によってマスク対象に確定した領域に加えて前記マスク補充部260で作成された前記補充マスクの領域に対してマスクを付加するマスク付与部(240)と、して機能させる
ことを特徴とする画像処理プログラムを提供する。
【図面の簡単な説明】
【0016】
【図1】本発明が想定する動画像データ記録再生システムの一例を示す図。
【図2】動画を撮影している様子を示す図。
【図3】撮影された動画の例を示す図。
【図4】第1実施形態において、マスク処理部の機能ブロック図。
【図5】第1実施形態において、閾値以上の類似度を有するマスク対象領域を検出した状態を模式的に示す図。
【図6】第1実施形態において、補外用データ保持部に保持する座標情報の例を示す図。
【図7】第1実施形態において、検出されたマスク対象領域の移動軌跡を示す図。
【図8】第1実施形態において、マスク対象の移動軌跡を時間的に前の方に外挿したグラフ例を示す図。
【図9】第1実施形態において、移動マスクの例を示す図。
【図10】第1実施形態において、動画撮影(ST10)からマスク付加されたデータの出力(ST60)までの動作手順を示すフローチャート。
【図11】第1実施形態において、マスク処理用メタファイルの作成工程を示すフローチャート。
【図12】第1実施形態において、マスク候補を切り出す様子を示す図。
【図13】第1実施形態において、移動マスクを作成する工程を示すフローチャート。
【図14】第1実施形態において、マスクを付加した動画の例を示す図。
【発明を実施するための形態】
【0017】
以下、図面を参照して本発明の実施の形態について説明する。
(第1実施形態)
図1は、本発明が想定する動画像データ記録再生システム900の一例である。
各個人はおのおの好きな被写体をビデオカメラ100で撮像する。例えば、戸外に出て街の様子を撮影したり、家族が公園で遊んでいる光景を撮影したりしてもよい。このようにして撮影された動画像データはビデオカメラ100に内蔵された動画メモリ120に蓄積されていく。
【0018】
撮影者は家に帰ると、ビデオカメラ100をパソコン910に接続し、撮影した動画像データをパソコン910経由でインターネット920上のサーバ930に送る。すると、このサーバ930に動画像データが保存され、第三者もインターネット920を利用して動画像を見られるようになる。
【0019】
しかし、このようにして撮影された動画像には公開しては不都合な画像も含まれていることがある。例えば、家族の顔や、意図せずに映り込んでしまった通行人の顔、個人を特定する情報、例えば、氏名、電話番号、車のナンバープレートなどが映り込んでいる可能性がある。
これらの個人情報に関連する画像をそのままインターネット上に公開してしまうとプライバシー保護の観点からみて問題が生じる恐れがある。従って、プラバシーに関わる画像部分にはマスク処理を施すことが必要になる。
【0020】
ここで、以下の説明に用いる動画の例として、図2のように特定人物CAの様子を撮影したとする。このとき撮影者Pは、ビデオカメラ100を右から左にゆっくりと向きを変えるように動かし、人物CAがフレームのなかにゆっくりとフレームインするように撮影するとする。すると、例えば、図3のように、フレームの左から人物CAが徐々にフレームインしてくる動画が撮影されるであろう。ここで、上述の従来技術によれば、フレームF40のように顔の80%程度がフレーム内に映っていれば、これをマスク対象であると判定することができる。従って、フレームF40以降のフレームF50やフレームF60には人物CAの顔にマスクを掛けられる。しかし、フレームF40に至るまでは、人物CAの顔が映っているにも関わらず、顔の一部しか映っていないのでマスク対象であるとまでは確定できず、このままではマスクが掛からず顔が公開されてしまうことになる。そこで、本実施形態では、マスク対象であると確定する前のフレームに対してもマスクを掛けるようにする。
【0021】
(第1実施形態の構成)
第1実施形態の構成を説明する。
図4は、マスク処理部200の機能ブロック図であり、あわせて、ビデオカメラ100の主要要素を示す。本実施形態ではマスク処理部200がビデオカメラ100に内蔵されている場合を想定しているが、パソコン910の一機能としてマスク処理部が設けられてもよい。ビデオカメラ100の撮像部110で撮像された動画データは、一旦動画メモリ120に蓄積される。ここで、ビデオカメラ100の撮像部110は、レンズユニットやCCD(光電変換素子)回路、所定のロジック回路で構成され、被写体を撮影した動画(映像)信号から動画データ(フレーム)を生成する。動画データには輝度データや色データが含まれる。動画メモリ120としては、例えば、フラッシュメモリが利用できる。
【0022】
マスク処理部200は、データ入力部210と、マスク候補取得部220と、マスク対象決定部230と、マスクフラグ付与部240と、位置判定部250と、マスク補充部260と、メタファイル作成部270と、マスク付加部280と、データ出力部290と、を備える。
【0023】
データ入力部210は、動画メモリ120に蓄積された動画データを読み込んで後段に出力する。データ入力部210は、復号化部211を有し、動画データを復号化した画像フレームを出力する。
【0024】
ここで、動画を視聴することを目的とせずにマスク処理だけを目的とする場合、すべての画像フレームが必要になるわけではない。従って、Iピクチャや、Pピクチャ、Bピクチャなどがあるなかで、処理の目的に応じたフレームだけがデータ入力部210から後段回路に提供されるようにしてもよい。例えば、マスク処理にはIピクチャとPピクチャとだけを使用するようにしてもよい。もちろん、すべてのフレームを使用してマスク処理を行ってもよい。
【0025】
マスク候補取得部220は、プラバシーマスクを必要とする可能性がある画像領域だけを切り出す。たとえば、特定人物であるAさんの顔にマスクを掛ける必要がある場合、肌色が所定面積以上である領域は人の顔の可能性があるので、このような領域をマスク候補として切り出す。
【0026】
マスク候補取得部220は、切出参照リスト格納部221と、マスク候補切出部222と、を備える。
【0027】
切出参照リスト格納部221は、マスク候補として切出し対象になる領域を検出するための切出参照リストを格納している。切出参照リストは、プリセットされていてもよく、マスク対象の特徴から自動的に生成されるようにしてもよく、あるいは、ユーザが設定入力してもよい。切出参照リストとしては、所定面積以上の肌色領域や、文字および数字のリストデータなどがあげられる。
【0028】
文字および数字のリストデータを切出参照リストとして持つ意味を補足しておく。
プライバシーに関するものとしては、顔の他にも、氏名、団体名(会社名や学校名)、住所表示、電話番号、車のナンバーなどがある。したがって、090−XXXX−XXXXといった電話番号にはプライバシーマスクを掛ける必要がある。そこで、画像フレーム中に"0"といった数字や後述するように何らかの文字が現れれば、それらをマスク対象の候補として切り出しておく必要がある。そして、最終的に、"090−"のように数字が並べばこの数字列にマスク処理を施すことになるし、単に"0"だけ、もしくは"0"のように見える模様であった場合にはマスク処理は必要ないことになる。
【0029】
もう一例あげると、最終的に"横浜"や"横浜市XXX区"、"横X学園XX学校"といったように文字が並べばこれらにマスク処理を施すことになるし、単に、"横"という字が一文字だけであれば、プライバシーに何ら関係がないので、マスク処理は必要ないことになる。
文字としては、外国語にも対応できるように、アルファベットや、ハングル、中国語の略字も切出参照リストに加えておくとよい。
【0030】
マスク候補切出部222は、データ入力部210から順次入力される画像フレームを検索し、切出参照リスト格納部221に格納された切出参照リストに合致するものがあるか否かを探す。そして、切出参照リストに合致するものが画像フレーム中に存在している場合、その領域部分を切り出してマスク候補領域として切り出し、後段回路に出力する。
このとき、切り出されたマスク候補領域は、もとのフレームに関連付けられる情報を保持するものとする。フレームに関連付けられる情報とは、例えば、切出し元のフレーム番号およびそのフレーム内での座標である。
【0031】
次に、マスク対象決定部230は、マスク候補取得部220で取得されたマスク候補の領域に対し、真にマスク対象であるか否かを検証する。
マスク対象決定部230は、特徴量算出部231と、マスク対象参照リスト格納部232と、類似度算出部233と、類似判定部234と、を備える。
【0032】
特徴量算出部231は、マスク候補切出部222で切り出された最新のマスク候補に対して特徴量を算出する。特徴量とは、対象画像の特徴を表わす各種指標値の組み合わせであり、対象画像の特徴点を表わす指標値や、特徴点同士の距離関係を表わす指標値、特徴部分の大きさを表わす指標値、対象画像の輪郭を表わす指標値、輝度を表わす指標値、色を表わす指標値、などからなる。
特徴量算出部231は、算出した特徴量を類似度算出部233に送る。
【0033】
マスク対象参照リスト格納部232は、マスク対象になる領域を検出するための参照情報を格納している。マスク対象参照リスト格納部232に格納されている参照情報としては、プライバシーマスクが必要な特定人物の顔(Aさんの顔、Bさんの顔・・・)、電話番号や車両番号であることを特定するための数字列、氏名・団体名(会社名や学校名)・住所表示であることを特定するための文字列、などが挙げられる。これらの参照情報がそれぞれの特徴量とセットになって格納されている。
【0034】
類似度算出部233は、特徴量算出部231で算出された特徴量をマスク対象参照リスト格納部232に格納された特徴量と比較し、類似度を算出する。類似度の算出にあたっては、マスク候補の指標値とマスク対象参照リストの指標値とで互いに対応するもの同士をつきあわせ、両者の類似度合いを総合的に評価して類似度を求める。なお、マスク候補が肌色領域であって人の顔である可能性がある場合に、これを電話番号の特徴量と対比して類似度を算出しても意味のないことなのであり、マスク候補が肌色領域である場合に突き合わされる参照情報は特定人物の顔である。
類似度の算出に当たって適切な参照情報を選ばせる方法は各種考えられるが、例えば、色や輝度で判断してもよく、あるいは、総ての参照情報と突き合わせた上で最も類似度が高くなるものを選んでもよい。
【0035】
類似判定部234は、類似度算出部233で算出された類似度を所定の閾値と比較する。そして、類似度が閾値を超えている場合、そのマスク候補領域がマスク対象領域であることが確定する。類似度が閾値を超えた場合には、その旨をマスクフラグ付与部240と位置判定部250とに通知する。
【0036】
マスクフラグ付与部240は、マスク対象領域にマスクフラグを設定する。マスク対象領域にマスクフラグを設定するにあっては、類似判定部234による判定によってマスク対象であることが確定したマスク対象の領域にマスクフラグを付与することはもちろんである。
図5に示すように、フレームF40、フレームF50、フレームF60等では類似度が閾値以上になる程度に顔が映っているので、マスクフラグ付与部240によってこれらの顔が映っている領域にはマスクフラグが付与される。ここで、マスク対象(被写体)がフレームインし始めてからマスク対象であると確定するまでの間の映像(フレームF10からフレーム30)にもマスクを掛ける必要があるところ、これは後述の位置判定部250およびマスク補充部260によって達成される。
【0037】
位置判定部250は、確定したマスク対象領域の位置と画像フレームのフレーム枠との位置関係を調べる。具体的には、マスク対象領域とフレーム枠との距離が所定閾値以下であるか否かを判定する。マスク対象領域とフレーム枠との距離が所定閾値以下である場合、位置判定部250は、マスク対象を検出できたフレーム(フレームF40)よりも前のフレーム(フレームF10からフレーム30)に対して補充的なマスクを作成させるため、マスク補充部260を起動させる。そして、マスク補充部260を起動させた後は、類似判定部234経由で取得するマスク対象領域の座標情報をマスク補充部260に出力する。
【0038】
ここで、マスク対象領域とフレーム枠との距離が所定閾値以下である場合、このマスク対象はフレームの端から徐々にフレームインしてきたものであると考えられる。例えば、図5を参照すると、フレームF40においてはマスク対象領域がフレーム枠に極めて近い。この場合、フレームF40の以前のフレーム(フレームF10からフレームF30)ではマスク対象(被写体)が十分にフレームに収まっていなかったためにマスク対象であると認識されていない恐れがある。
なお、マスク対象領域の位置という場合、マスク対象領域の中心座標Ccを用いてもよく、あるいは、マスク対象領域が四角形であれば四角形の四隅のいずれを用いてもよい。マスク対象領域の位置の取り方に合わせて所定閾値の値や判定方法を適切に調整すればよい。
【0039】
次に、マスク補充部260について説明する。
マスク補充部260は、マスク対象領域の移動軌跡に基づいて、マスク対象が検出される以前のフレームに掛けるマスクを作成する。
マスク補充部260は、座標情報取得部261と、補外用データ保持部262と、動き補外部263と、移動マスク作成部264と、を備える。
【0040】
座標情報取得部261は、類似判定部234および位置判定部250経由で取得するマスク対象領域の座標情報を抜き出し、補外用データ保持部262に格納させる。ここで、座標情報とは、マスク対象領域の座標値、マスク対象領域の大きさ(サイズ)、および、マスク対象領域が属するフレームのタイムスタンプ、であり、これらをセットにして補外用データ保持部に保持させる。補外用データ保持部262は、一時メモリであり、図6のように、マスク対象領域の座標値、サイズ、そのタイムおよびフレーム番号を合わせて保持する。
【0041】
動き補外部263は、補外用データ保持部262に保持された座標情報に基づいて、マスク対象が検出される前の動きを補外法によって推測する。
例えば、図6のように補外用データ保持部262に保持されたデータをグラフにプロットすると図7のようにフレームF40以降におけるマスク対象領域の移動軌跡が求められる。ここでは、分かり易くするため、x座標の変化のみを表わしているが、y座標および領域サイズについても時間の関数として同じようにプロットできる。そして、フレームF40よりも時間的に前のフレーム内でのマスク対象の移動軌跡を補外法で推測するため、図7のグラフを時間的に前に延長する。すると、図8のように、フレームF40よりも時間的に前のフレームにおけるマスク対象の推定軌跡が得られる。
【0042】
移動マスク作成部264は、動き補外部263において図8のように得られた推定軌跡に対し、この軌跡に沿って移動するマスク対象に掛かるように移動するマスクを作成する。例えば、図9のように、フレームF10からフレームF39までに対して左から徐々にフレーム内に入ってくるように移動するマスクを作成する。移動マスク作成部264は、このように作成した移動マスクの情報をマスクフラグ付与部240に出力する。移動マスクの情報とは、移動マスクの座標値、移動マスクの大きさ(サイズ)、および、移動マスクを付加するフレーム番号の情報である。
【0043】
メタファイル作成部270は、マスクを掛ける領域についての情報をマスクフラグ付与部240から取得する。マスクを掛ける領域とはマスク対象領域であり、マスクを掛ける領域についての情報とは、例えば、マスク対象領域の座標、サイズ、フレーム番号といった情報である。繰り返しになるが、マスク対象領域としては、類似判定部234による閾値判定でマスク対象であると確定した領域の他、移動マスク作成部264で作成された移動マスクが付加される領域も含まれることはもちろんである。メタファイル作成部270は、マスク対象領域にマスクを掛ける命令を含むメタファイルを作成する。メタファイル作成部270は、作成したマスク用メタファイルをマスク付加部280に出力する。
【0044】
マスク付加部280は、メタファイルのマスク処理命令に従って動画データにマスクを掛けていく。このとき、動画メモリ120に蓄積された総ての動画データに関するメタファイルが作成されるのを待ってからマスク付加部280でのマスク処理を開始してもよい。すなわち、メタファイル作成のための復号処理をしたあと、あらためての動画メモリ120から動画データを取り出して復号化する。このときはマスク候補取得部220やマスク対象決定部230を起動させる必要はなく、復号化された画像データをマスク付加部280にのみ送り、そこでメタファイルに従ったマスク付加を行う。
【0045】
あるいは、メタファイルの作成から所定の時間遅れをもたせてマスク付加部280でのマスク処理を進行させてもよい。例えば、マスク候補切出部222が処理中であるフレームのタイムスタンプに対し、数分分の遅れを持たせていれば前記フレームに対するマスク処理の要否は確定されている。
【0046】
マスク付加部280でマスク付加された動画データはデータ出力部290から出力される。そして、例えば、パソコンのハードディスクなどに一旦保存されたあと、インターネット上のサーバに送られることになる。
【0047】
(第1実施形態の動作)
続いて、第1実施形態の動作を説明する。
ユーザによる動画撮影(ST10)からマスク付加されたデータの出力(ST60)までの流れは、図10に示すように、撮影(ST10)、動画データの保存(ST20)、マスク処理の事前準備(ST30)、マスク処理用メタファイルの作成(ST40)、マスク付加(ST50)、データ出力(ST60)の順で進む。
【0048】
先に説明したように、図2のように動画を撮影し(ST10)、動画データは動画メモリ120に保存される(ST20)。次に、マスク処理の事前準備を行う(ST30)。マスク処理の事前準備(ST30)として、ユーザはマスク対象に関する情報をマスク対象参照リスト格納部232に格納しておく。本例でいえば、子供CAの顔の特徴量をマスク対象参照リスト格納部232に格納しておく。
子供CAの顔の特徴量をマスク対象参照リスト格納部232に格納するにあたっては、例えば、別途に撮影した子供CAの顔のデータをビデオカメラ100にセットしてもよい。あるいは今回撮影した動画のなかから子供CAの顔が映っている領域を指定して、これをマスク対象としてビデオカメラ100にセットしてもよい。ビデオカメラ100は、マスク対象としてセットされた領域から自動的に特徴量を算出してマスク対象参照リスト格納部232に格納する。
【0049】
これに合わせて切出参照リスト格納部221に切出参照リストを登録しておく必要がある。これについてはマスク対象参照リスト格納部232の情報からビデオカメラ100が自動的に切出参照リストを生成するようにしてもよい。あるいは、人物の顔がマスク対象に設定されたならば、自動的に所定面積以上の肌色領域が切出参照リストに加えられるようにしてもよい。
【0050】
このような事前準備(ST30)が終わったところで、マスク処理部200を起動してマスク処理用メタファイルの作成(ST40)を実行する。マスク処理用メタファイルの作成工程(ST40)を図11のフローチャートを参照して説明する。撮影された動画データは動画メモリ120に蓄積された後、データ入力部210からマスク処理部200に入力される(ST101)。データ入力部210の復号化部211において動画データが復号化され(ST102)、画像フレームが順次マスク候補切出部222に送られる。マスク候補切出部222は、画像フレーム中に切出参照リストに合致するマスク候補領域があるか否かを探索する。フレームF00の段階では、肌色の領域はないのであるからマスク候補となる領域はない(ST130でNO)。マスク候補の領域がなければ、次ぎの画像フレームに探索対象を移していく。
【0051】
フレームF00からフレームF10に移行するにつれて徐々に子供CAがフレームに入ってくる。子供CAの顔が所定面積を超えてフレームに入ってくれば、これは切出参照リストに合致することになる(ST103でYES)。
例えばフレームF10で肌色面積が所定値を超えたとする。すると、マスク候補切出部222は、所定面積以上の肌色領域R10をマスク候補として切り出す(ST104)(図12参照)。このとき、前述したように、切り出された領域(R10)のデータには、切出し元のフレームF10のフレーム番号およびこのフレームF10中での座標が付加されている。
【0052】
マスク候補領域(R10)が切り出されると、この領域(R10)に対して特徴量算出部231により特徴量が算出される(ST105)。算出された特徴量は類似度算出部233に送られ、そこでマスク対象参照リストとの比較に基づいた類似度が求められる(ST106)。
算出された類似度は類似判定部234において閾値と対比される。領域R10については、子供CAの顔の特徴量と類似する点はないので、類似度が閾値Thを超えることはない(ST107でNO)。この場合、領域R10はマスク対象として確定せず(ST107でNO)、次ぎの画像フレームの処理に進む。
【0053】
フレームF10からフレームF30に移るにつれて、子供が映っている領域が徐々に大きくなっていくので肌色領域はすべてマスク候補として切出しの対象となるが(ST103でYES)、まだ子供の顔が十分にフレーム内に映ってはいないので、類似判定(ST107)において類似度が閾値Thを超えることはない(ST107でNO)。
【0054】
フレームF30からさらに進んでフレームF40が処理対象のフレームになった時点を考える。フレームF40では領域R40において顔の80%程度がフレーム内に入っている状態である。領域R40は、所定面積以上の肌色領域であるのでマスク候補としてマスク候補切出部222によって切り出され(ST104)、さらに、子供CAの顔の80%程度が映っているので、マスク対象参照リストにある指標(子供の顔の特徴量)と複数点で相関が高く、類似度としては大きな値が算出される。従って、R40について求められた類似度S40は、閾値Th以上になる(ST107でYES)。
【0055】
このように類似度S40が閾値Th以上になった場合、類似判定部234は、閾値Th以上の類似度Sをもつ領域が出現したことをマスクフラグ付与部240に通知する。すると、類似度が閾値以上となった領域R40に対してマスクフラグ付与部240によってマスクフラグが付与される(ST108)。
【0056】
次に、このようにマスク対象が出現したところで、位置判定部250による位置判定(ST109)を実行する。すなわち、マスク対象である領域R40とフレーム枠との距離を所定閾値と対比する(ST110)。
【0057】
マスク対象(R40)とフレーム枠との距離が所定閾値を超えていれば(ST110でNO)、移動マスクを補充する必要はないと判断する。したがって、マスク対象として確定した領域R40に付されているマスクフラグに従って、マスク対象領域R40にマスクを掛けるメタファイルをメタファイル作成部270によって作成する(ST111)。
【0058】
一方、ST110において、マスク対象領域(R40)とフレーム枠との距離が所定閾値以下である場合(ST110でYES)、フレームインしてきた被写体に必要なマスクを掛けられていない可能性がある。そこでこの場合、マスク補充部260を起動させて、移動マスク作成を開始する(ST120)。
【0059】
移動マスクを作成する工程を図13のフローチャートを参照して説明する。
移動マスクを作成するために、座標情報取得部261によってマスク対象領域の座標情報を取得する(ST121)。
これは、マスク対象が確定した後のフレーム(フレームF40以降のフレーム)についても順次ST101からST107を実行していく際に、座標情報取得部261は、フレームF40以降のフレームに関して類似判定部234および位置判定部250経由でマスク対象となる領域の座標情報を取得する。これにより、フレームF40以降のマスク対象領域について、座標、サイズ、そのフレームのタイムスタンプといった座標情報が補外用データ保持部262に格納されていく(図6参照)。
そして、ST122において、必要量のデータが拾集されたか否かを判定する。これは、図8にて示したように補外法で時間的に前のフレームにおけるマスク対象の動きを推定するにあたって十分なデータ量があるか否かを動き補外部263において判定するものである。
【0060】
データ数が十分かどうかを判定する基準は適宜設定されればよい。
例えば、フレームF40以降の座標情報に対して回帰直線や、適当な次数の関数曲線や、適切なスプライン曲線などでフィッティングカーブを描く(図7参照)。マスク対象として最初に確定したフレーム(フレームF40)から数えて数十フレーム(フレームF40からフレームF60あたりまで)に対する残差が所定値以下になっていれば、補外法が適用できる程度にデータが集まったと判断してもよい。
なお、マスク対象として最初に確定したフレーム(フレームF40)に近いほど寄与度が大きくなる重みを付け、マスク対象として最初に確定したフレーム(フレームF40)の直後の数フレームにおける動きがより強く反映されるようにしてもよい。
【0061】
補外法を適用するのに十分なデータが集まったところで(ST122でYES)、マスク対象領域の移動軌跡を外挿し(ST123)、マスク対象が検出される前の動きを推定する(図8参照)。このように外挿で推定したマスク対象の移動に掛かるように移動マスク作成部264により移動マスクを作成する。これにより、図9に示したように、マスク対象が検出される前のフレーム(フレームF10からフレームF30・・)に掛かるマスクが作成される。
【0062】
作成された移動マスクの情報をマスクフラグ付与部240に出力し、マスクフラグ付与部240において移動マスクの領域にマスクフラグを付与する(ST125)。
【0063】
マスクフラグを付与されたマスク対象データがメタファイル作成部270に送られ、マスク処理を命令するメタファイルが作成される(ST111)。動画メモリ120に蓄積された動画データの全フレームを検証して(ST112でYES)、マスク処理用のメタファイルが完成する。
【0064】
このように作成されたメタファイルに従って動画データにマスク処理を施す(ST50)。すなわち、マスク付加部280は、復号化された動画フレームデータに対しメタファイルに指定された領域にマスクを掛けていく(ST50)。すると、図14に示すように、子供がフレームに映り始めたところからマスク処理が掛かり、子供のプライバシーを保護することができる。
【0065】
このような構成を備える第1実施形態によれば次の効果を奏することができる。
(1)本実施形態ではマスク補充部260を備えており、マスク対象が検出される前のフレームに対しても補外法によってマスク対象の動きを推定し、移動マスクを掛けることとしている。
これにより、マスク対象(被写体)がフレームインし始めてからマスク対象であると確定するまでの間の映像にもマスクを掛けることができ、プライバシーを確実に保護できる。
【0066】
(2)本実施形態では、移動マスクを補充するにあたって補外用データ保持部262に座標情報を保持するが、これらは画像情報ではなく単なる数値であるので補外用データ保持部262の容量は小さくてもよい。例えば、従来技術のようにマスク対象を検出した後で時間的に遡及して関連部分を辿れるように所定量の動画データをバッファに一時保存しておくという方法があるが、これでは非常に大きな容量のメモリが必要になる。そして、バッファから溢れてしまった画像データについては遡及的に検索することはできず、その部分はプライバシーマスク無しで公開されてしまう恐れもある。
この点、本実施形態では移動マスクの作成にあたって必要になるデータは座標情報だけであり、画像情報そのものは保持しておく必要はないのでメモリ容量は極小さくてもよい。また仮にマスク対象の移動軌跡を外挿するのにどれほど多量のフレームを追跡しなければならないとしても、座標情報を一時的に保持するだけでよいのでメモリ容量が問題になることはない。
したがって、必要であれば十分な量の座標情報を収集した後で、正確性の高い移動マスクを作成することができる。
【0067】
(3)位置判定部250を備え、新たに検出されたマスク対象の領域がフレーム枠に近いかどうかを位置判定部250によって判定することによって移動マスクの要否を判断する。単純に、新たにマスク対象が検出されるたびに補外法で移動マスクを補充していると必要のないマスクが入り乱れる恐れがあるが、この点、本実施形態ではマスク対象領域の出現位置に基づいて移動マスクの必要性を適切に判断することができる。これにより、必要な場合にだけ移動マスクを適切に付加することができる。
【0068】
(変形例1)
上記第1実施形態において、位置判定部250では新たに出現したマスク対象領域とフレーム枠との距離にだけ基づいて移動マスクの要否を判断していた。移動マスクが必要であるか否かを判断するにあたっては、別の判定要件を用いてもよい。
例えば、マスク対象領域がフレームの中心方向に移動しているかどうかを判定要件としもよい。あるいは上記の二つとも用い、両方を満たした場合にマスク補充部を起動させてもよい。さらには、上記二つの要件のうちいずれか一方でも満たせばマスク補充部を起動させてもよい。
【0069】
なお、本発明は上記実施形態および変形例に限られず、本発明の趣旨を逸脱しない範囲で適宜変更することが可能である。
上記実施形態においては、特定人物の顔にプライバシーマスクを掛ける場合を説明したが、逆に、特定人物にはマスクを掛けず、その他のたまたま映ってしまった一般の人の顔にプライバシーマスクを掛けるようにしてもよいことはもちろんである。この場合、被写体が、「人の顔ではあるが特定人物の顔ではない」ということを閾値判定で判断すればよいのであり、このような判定のためにマスク対象参照リストや類似判定部を改変することは当業者には明らかであろう。
【0070】
「肌色」というのは人種によって異なるのであるから、マスク対象の人種を考慮して解釈されるべきである。例えば、ビデオカメラが使用される国がアジア圏であれば、肌色とは例えばモンゴロイドの肌の色、すなわち、淡黄色を意味する。被写体がコーカソイドやニグロイドであれば当然ながら肌色は白色であったり黄褐色であったりする。
【0071】
上記実施形態では撮影が終了した後でマスク処理部を起動してマスク処理を行う例を説明したが、撮影しながら並行してマスク処理を実行してもよい。
【0072】
CPUやメモリを配置してコンピュータとして機能できるように構成し、このメモリに所定の制御プログラムをインターネット等の通信手段や、CD−ROM、メモリカード等の記録媒体を介してインストールし、このインストールされたプログラムでCPU等を動作させて、上記実施形態で説明した各機能部としての機能を実現してもよい。
【符号の説明】
【0073】
100…ビデオカメラ、110…ビデオカメラの撮像部、120…動画メモリ、200…マスク処理部、210…データ入力部、211…復号化部、220…マスク候補取得部、221…切出参照リスト格納部、222…マスク候補切出部、222…順次マスク候補切出部、222…マスク候補切出部、230…マスク対象決定部、231…特徴量算出部、232…マスク対象参照リスト格納部、233…類似度算出部、234…類似判定部、240…マスクフラグ付与部、250…位置判定部、260…マスク補充部、261…座標情報取得部、262…補外用データ保持部、263…動き補外部、264…移動マスク作成部、270…メタファイル作成部、280…マスク付加部、290…データ出力部、900…動画像データ記録再生システム、910…パソコン、920…インターネット、930…サーバ。
【技術分野】
【0001】
本発明は、画像処理装置、画像処理方法、及び画像処理プログラムに関する。本発明は、例えば、特定人物の顔などプライバシー保護に係るものが映っている画像領域に自動的にマスク処理を施すための画像処理装置等に関する。
【背景技術】
【0002】
近年、個人が撮影した動画像を各個人のパソコン端末や携帯端末からインターネットを介して簡単に公開できるようになってきた。しかし、動画像には、人物や、車両、撮像された地域を示す地名や住所など、個人を特定できる情報が含まれていることがある。そのような情報が含まれる動画像がそのまま公開されてしまうことは、プライバシー保護の観点から望ましくない。
【0003】
そこで、動画像中の特定人物やナンバープレートに対して自動的にモザイクを施す処理を行う方法が提案されている(例えば、特許文献1、特許文献2)。
特許文献1および特許文献2に開示される方法では、まず、モザイクを施す処理が必要になる人物の顔情報を参照情報として予め用意しておく。
そして、参照情報と画像中の顔とが一致した場合には、その顔部分にモザイクを施す処理を行う。
【0004】
この方法であれば、確かに特定人物の顔にモザイクを施す処理を行うことができるものの、画像中の顔が参照情報に一致する前の画像にはモザイクを施せないことになる。例えば、モザイクを施す処理の対象となる人物がゆっくりと画面内にスライドインしてきた場合、その顔が画面内に完全に収まってはじめてモザイクを施す処理が開始されるので、それまではスライドイン途中の顔が一部ではあるものの画面に曝されることとなってしまう。
【0005】
上記問題に対し、特許文献3(特開2010−233133号公報)では次の方法を提案している。特許文献3では、ビデオバッファを用意しておき、動画像を数フレーム遡れるように前記ビデオバッファに一時的に溜めておく。
そして、モザイクを施す対象、つまりマスク対象が検出された場合には、ビデオバッファ内にあるフレームを順番に遡ってマスク対象に関連する部分が無いかを改めて検索する。これにより、マスク対象が完全に画面内に入る前であってもマスク対象が部分的に映っている領域にマスクを掛ける、つまりモザイクを施すことができる。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2001−086407号公報
【特許文献2】特開2004−062560号公報
【特許文献3】特開2010−233133号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、ビデオバッファの容量にも限界がある。30フレーム/秒の動画像であるとして、長くても10秒分ぐらいを溜めておけるのが最大限である(特許文献3の段落0056)。従って、カメラを横にゆっくり振りながら撮影したり、あるいは、固定カメラの前を人がゆっくりと通り過ぎるような場合、マスク処理が必要な人物が画面内にスライドインしてくる時間がビデオバッファの容量よりも長くなるという事態が起こりえる。すると、ビデオバッファによる保持時間を超えてビデオバッファから吐き出されてしまったフレームについては、マスク処理が不十分なままで公開されてしまうことになる。
【0008】
なお、単純にビデオバッファの容量を大きくすることが考えられるが、どれほど容量を大きくしても動画像を一時的にバッファできる容量(時間)には限界がある。また、マスク対象を一旦検出したあとで、再び最初のフレームから検索し直してマスク対象に関連する部分をピックアップするという方法も考えられるが、時間と手間が掛かり過ぎる。
【0009】
そこで、本発明の目的は、マスク処理が必要な被写体がフレームインしてくる場合など、マスク対象かどうかの判定までに時間を要するような場合であっても、それまでの間にマスク対象が映っている領域に確実にマスクを掛けることができる画像処理装置、画像処理方法および画像処理プログラムを提供することにある。
【課題を解決するための手段】
【0010】
そこで、本発明は、
動画データからマスク処理すべき画像領域を検索してそれらにマスクを付加する画像処理装置(100)であって、
予め登録された切出参照リストに基づいて、前記動画データの画像フレームのなかからマスク対象になり得る領域をマスク候補領域として切り出すマスク候補切出部(222)と、
予め登録されたマスク対象参照リストに基づいて、最新の前記マスク候補領域を前記マスク対象参照リストと対比して両者の類似度を算出する類似度算出部(233)と、
前記算出された類似度を所定閾値と対比して、前記類似度が所定閾値以上である場合にはそのマスク候補領域をマスク対象として確定させる類似判定部(234)と、
前記類似判定部(234)による判定よってマスク対象に確定した領域の動きを時間的に後ろに追跡して得られる移動軌跡を時間的に前に外挿し、この外挿で得られた領域に掛かる補充マスクを作成するマスク補充部(260)と、
前記類似判定部(234)による判定によってマスク対象に確定した領域に加えて前記マスク補充部(260)で作成された前記補充マスクの領域に対してマスクを付加するマスク付与部(240)と、を備える
ことを特徴とする画像処理装置を提供する。
【0011】
上記画像処理装置(100)において、
前記マスク補充部(260)は、
前記類似判定部(234)による判定によってマスク対象に確定した領域の座標情報を順次取得する座標情報取得部(261)と、
前記座標情報取得部(261)にて取得された座標情報を保持する補外用データ保持部(262)と、
前記補外用データ保持部(262)に保持されたデータを時間的に前に外挿してマスク対象が検出される前の動きを推測する動き補外部(263)と、
前記動き補外部(263)による外挿によって得られた動きに掛かるように移動するマスクを作成する移動マスク作成部(264)と、を備える
ようにしても良い。
【0012】
また、上記画像処理装置において、
前記類似判定部(234)による判定よってマスク対象に確定した領域と、画像フレーム枠と、の距離が所定閾値以下であるか否かを判定する位置判定部(250)をさらに備え、
前記距離が所定閾値以下の場合に、前記位置判定部(250)は前記マスク補充部(260)を起動させる
ようにしても良い。
【0013】
また、上記画像処理装置において、
前記類似判定部(234)による判定よってマスク対象に確定した領域が画像フレームの中心方向に移動しているか否かを判定する位置判定部(250)をさらに備え、
前記マスク対象に確定した領域が画像フレームの中心方向に移動している場合に、前記位置判定部(250)は前記マスク補充部(260)を起動させる
ようにしても良い。
【0014】
さらに、本発明は、
動画データからマスク処理すべき画像領域を検索してそれらにマスクを付加する画像処理方法であって、
予め登録された切出参照リストに基づいて、前記動画データの画像フレームのなかからマスク対象になり得る領域をマスク候補領域として切り出すマスク候補切出工程(ST103、ST104)と、
予め登録されたマスク対象参照リストに基づいて、最新の前記マスク候補領域を前記マスク対象参照リストと対比して両者の類似度を算出する類似度算出工程(ST106)と、
前記算出された類似度を所定閾値と対比して、前記類似度が所定閾値以上である場合にはそのマスク候補領域をマスク対象として確定させる類似判定工程(ST107)と、
前記類似判定工程(ST107)による判定よってマスク対象に確定した領域の動きを時間的に後ろに追跡して得られる移動軌跡を時間的に前に外挿し(ST123)、この外挿で得られた領域に掛かる補充マスクを作成するマスク補充工程(ST124)と、
前記類似判定工程(ST107)による判定によってマスク対象に確定した領域に加えて前記マスク補充工程(ST124)で作成された前記補充マスクの領域に対してマスクを付加するマスク付与工程(ST125)と、を備える
ことを特徴とする画像処理方法を提供する。
【0015】
さらに、本発明は
動画データからマスク処理すべき画像領域を検索してそれらにマスクを付加する画像処理装置に組み込んだコンピュータを、
予め登録された切出参照リストに基づいて、前記動画データの画像フレームのなかからマスク対象になり得る領域をマスク候補領域として切り出すマスク候補切出部(222)と、
予め登録されたマスク対象参照リストに基づいて、最新の前記マスク候補領域を前記マスク対象参照リストと対比して両者の類似度を算出する類似度算出部(233)と、
前記算出された類似度を所定閾値と対比して、前記類似度が所定閾値以上である場合にはそのマスク候補領域をマスク対象として確定させる類似判定部(234)と、
前記類似判定部(234)による判定よってマスク対象に確定した領域の動きを時間的に後ろに追跡して得られる移動軌跡を時間的に前に外挿し、この外挿で得られた領域に掛かる補充マスクを作成するマスク補充部(260)と、
前記類似判定部(234)による判定によってマスク対象に確定した領域に加えて前記マスク補充部260で作成された前記補充マスクの領域に対してマスクを付加するマスク付与部(240)と、して機能させる
ことを特徴とする画像処理プログラムを提供する。
【図面の簡単な説明】
【0016】
【図1】本発明が想定する動画像データ記録再生システムの一例を示す図。
【図2】動画を撮影している様子を示す図。
【図3】撮影された動画の例を示す図。
【図4】第1実施形態において、マスク処理部の機能ブロック図。
【図5】第1実施形態において、閾値以上の類似度を有するマスク対象領域を検出した状態を模式的に示す図。
【図6】第1実施形態において、補外用データ保持部に保持する座標情報の例を示す図。
【図7】第1実施形態において、検出されたマスク対象領域の移動軌跡を示す図。
【図8】第1実施形態において、マスク対象の移動軌跡を時間的に前の方に外挿したグラフ例を示す図。
【図9】第1実施形態において、移動マスクの例を示す図。
【図10】第1実施形態において、動画撮影(ST10)からマスク付加されたデータの出力(ST60)までの動作手順を示すフローチャート。
【図11】第1実施形態において、マスク処理用メタファイルの作成工程を示すフローチャート。
【図12】第1実施形態において、マスク候補を切り出す様子を示す図。
【図13】第1実施形態において、移動マスクを作成する工程を示すフローチャート。
【図14】第1実施形態において、マスクを付加した動画の例を示す図。
【発明を実施するための形態】
【0017】
以下、図面を参照して本発明の実施の形態について説明する。
(第1実施形態)
図1は、本発明が想定する動画像データ記録再生システム900の一例である。
各個人はおのおの好きな被写体をビデオカメラ100で撮像する。例えば、戸外に出て街の様子を撮影したり、家族が公園で遊んでいる光景を撮影したりしてもよい。このようにして撮影された動画像データはビデオカメラ100に内蔵された動画メモリ120に蓄積されていく。
【0018】
撮影者は家に帰ると、ビデオカメラ100をパソコン910に接続し、撮影した動画像データをパソコン910経由でインターネット920上のサーバ930に送る。すると、このサーバ930に動画像データが保存され、第三者もインターネット920を利用して動画像を見られるようになる。
【0019】
しかし、このようにして撮影された動画像には公開しては不都合な画像も含まれていることがある。例えば、家族の顔や、意図せずに映り込んでしまった通行人の顔、個人を特定する情報、例えば、氏名、電話番号、車のナンバープレートなどが映り込んでいる可能性がある。
これらの個人情報に関連する画像をそのままインターネット上に公開してしまうとプライバシー保護の観点からみて問題が生じる恐れがある。従って、プラバシーに関わる画像部分にはマスク処理を施すことが必要になる。
【0020】
ここで、以下の説明に用いる動画の例として、図2のように特定人物CAの様子を撮影したとする。このとき撮影者Pは、ビデオカメラ100を右から左にゆっくりと向きを変えるように動かし、人物CAがフレームのなかにゆっくりとフレームインするように撮影するとする。すると、例えば、図3のように、フレームの左から人物CAが徐々にフレームインしてくる動画が撮影されるであろう。ここで、上述の従来技術によれば、フレームF40のように顔の80%程度がフレーム内に映っていれば、これをマスク対象であると判定することができる。従って、フレームF40以降のフレームF50やフレームF60には人物CAの顔にマスクを掛けられる。しかし、フレームF40に至るまでは、人物CAの顔が映っているにも関わらず、顔の一部しか映っていないのでマスク対象であるとまでは確定できず、このままではマスクが掛からず顔が公開されてしまうことになる。そこで、本実施形態では、マスク対象であると確定する前のフレームに対してもマスクを掛けるようにする。
【0021】
(第1実施形態の構成)
第1実施形態の構成を説明する。
図4は、マスク処理部200の機能ブロック図であり、あわせて、ビデオカメラ100の主要要素を示す。本実施形態ではマスク処理部200がビデオカメラ100に内蔵されている場合を想定しているが、パソコン910の一機能としてマスク処理部が設けられてもよい。ビデオカメラ100の撮像部110で撮像された動画データは、一旦動画メモリ120に蓄積される。ここで、ビデオカメラ100の撮像部110は、レンズユニットやCCD(光電変換素子)回路、所定のロジック回路で構成され、被写体を撮影した動画(映像)信号から動画データ(フレーム)を生成する。動画データには輝度データや色データが含まれる。動画メモリ120としては、例えば、フラッシュメモリが利用できる。
【0022】
マスク処理部200は、データ入力部210と、マスク候補取得部220と、マスク対象決定部230と、マスクフラグ付与部240と、位置判定部250と、マスク補充部260と、メタファイル作成部270と、マスク付加部280と、データ出力部290と、を備える。
【0023】
データ入力部210は、動画メモリ120に蓄積された動画データを読み込んで後段に出力する。データ入力部210は、復号化部211を有し、動画データを復号化した画像フレームを出力する。
【0024】
ここで、動画を視聴することを目的とせずにマスク処理だけを目的とする場合、すべての画像フレームが必要になるわけではない。従って、Iピクチャや、Pピクチャ、Bピクチャなどがあるなかで、処理の目的に応じたフレームだけがデータ入力部210から後段回路に提供されるようにしてもよい。例えば、マスク処理にはIピクチャとPピクチャとだけを使用するようにしてもよい。もちろん、すべてのフレームを使用してマスク処理を行ってもよい。
【0025】
マスク候補取得部220は、プラバシーマスクを必要とする可能性がある画像領域だけを切り出す。たとえば、特定人物であるAさんの顔にマスクを掛ける必要がある場合、肌色が所定面積以上である領域は人の顔の可能性があるので、このような領域をマスク候補として切り出す。
【0026】
マスク候補取得部220は、切出参照リスト格納部221と、マスク候補切出部222と、を備える。
【0027】
切出参照リスト格納部221は、マスク候補として切出し対象になる領域を検出するための切出参照リストを格納している。切出参照リストは、プリセットされていてもよく、マスク対象の特徴から自動的に生成されるようにしてもよく、あるいは、ユーザが設定入力してもよい。切出参照リストとしては、所定面積以上の肌色領域や、文字および数字のリストデータなどがあげられる。
【0028】
文字および数字のリストデータを切出参照リストとして持つ意味を補足しておく。
プライバシーに関するものとしては、顔の他にも、氏名、団体名(会社名や学校名)、住所表示、電話番号、車のナンバーなどがある。したがって、090−XXXX−XXXXといった電話番号にはプライバシーマスクを掛ける必要がある。そこで、画像フレーム中に"0"といった数字や後述するように何らかの文字が現れれば、それらをマスク対象の候補として切り出しておく必要がある。そして、最終的に、"090−"のように数字が並べばこの数字列にマスク処理を施すことになるし、単に"0"だけ、もしくは"0"のように見える模様であった場合にはマスク処理は必要ないことになる。
【0029】
もう一例あげると、最終的に"横浜"や"横浜市XXX区"、"横X学園XX学校"といったように文字が並べばこれらにマスク処理を施すことになるし、単に、"横"という字が一文字だけであれば、プライバシーに何ら関係がないので、マスク処理は必要ないことになる。
文字としては、外国語にも対応できるように、アルファベットや、ハングル、中国語の略字も切出参照リストに加えておくとよい。
【0030】
マスク候補切出部222は、データ入力部210から順次入力される画像フレームを検索し、切出参照リスト格納部221に格納された切出参照リストに合致するものがあるか否かを探す。そして、切出参照リストに合致するものが画像フレーム中に存在している場合、その領域部分を切り出してマスク候補領域として切り出し、後段回路に出力する。
このとき、切り出されたマスク候補領域は、もとのフレームに関連付けられる情報を保持するものとする。フレームに関連付けられる情報とは、例えば、切出し元のフレーム番号およびそのフレーム内での座標である。
【0031】
次に、マスク対象決定部230は、マスク候補取得部220で取得されたマスク候補の領域に対し、真にマスク対象であるか否かを検証する。
マスク対象決定部230は、特徴量算出部231と、マスク対象参照リスト格納部232と、類似度算出部233と、類似判定部234と、を備える。
【0032】
特徴量算出部231は、マスク候補切出部222で切り出された最新のマスク候補に対して特徴量を算出する。特徴量とは、対象画像の特徴を表わす各種指標値の組み合わせであり、対象画像の特徴点を表わす指標値や、特徴点同士の距離関係を表わす指標値、特徴部分の大きさを表わす指標値、対象画像の輪郭を表わす指標値、輝度を表わす指標値、色を表わす指標値、などからなる。
特徴量算出部231は、算出した特徴量を類似度算出部233に送る。
【0033】
マスク対象参照リスト格納部232は、マスク対象になる領域を検出するための参照情報を格納している。マスク対象参照リスト格納部232に格納されている参照情報としては、プライバシーマスクが必要な特定人物の顔(Aさんの顔、Bさんの顔・・・)、電話番号や車両番号であることを特定するための数字列、氏名・団体名(会社名や学校名)・住所表示であることを特定するための文字列、などが挙げられる。これらの参照情報がそれぞれの特徴量とセットになって格納されている。
【0034】
類似度算出部233は、特徴量算出部231で算出された特徴量をマスク対象参照リスト格納部232に格納された特徴量と比較し、類似度を算出する。類似度の算出にあたっては、マスク候補の指標値とマスク対象参照リストの指標値とで互いに対応するもの同士をつきあわせ、両者の類似度合いを総合的に評価して類似度を求める。なお、マスク候補が肌色領域であって人の顔である可能性がある場合に、これを電話番号の特徴量と対比して類似度を算出しても意味のないことなのであり、マスク候補が肌色領域である場合に突き合わされる参照情報は特定人物の顔である。
類似度の算出に当たって適切な参照情報を選ばせる方法は各種考えられるが、例えば、色や輝度で判断してもよく、あるいは、総ての参照情報と突き合わせた上で最も類似度が高くなるものを選んでもよい。
【0035】
類似判定部234は、類似度算出部233で算出された類似度を所定の閾値と比較する。そして、類似度が閾値を超えている場合、そのマスク候補領域がマスク対象領域であることが確定する。類似度が閾値を超えた場合には、その旨をマスクフラグ付与部240と位置判定部250とに通知する。
【0036】
マスクフラグ付与部240は、マスク対象領域にマスクフラグを設定する。マスク対象領域にマスクフラグを設定するにあっては、類似判定部234による判定によってマスク対象であることが確定したマスク対象の領域にマスクフラグを付与することはもちろんである。
図5に示すように、フレームF40、フレームF50、フレームF60等では類似度が閾値以上になる程度に顔が映っているので、マスクフラグ付与部240によってこれらの顔が映っている領域にはマスクフラグが付与される。ここで、マスク対象(被写体)がフレームインし始めてからマスク対象であると確定するまでの間の映像(フレームF10からフレーム30)にもマスクを掛ける必要があるところ、これは後述の位置判定部250およびマスク補充部260によって達成される。
【0037】
位置判定部250は、確定したマスク対象領域の位置と画像フレームのフレーム枠との位置関係を調べる。具体的には、マスク対象領域とフレーム枠との距離が所定閾値以下であるか否かを判定する。マスク対象領域とフレーム枠との距離が所定閾値以下である場合、位置判定部250は、マスク対象を検出できたフレーム(フレームF40)よりも前のフレーム(フレームF10からフレーム30)に対して補充的なマスクを作成させるため、マスク補充部260を起動させる。そして、マスク補充部260を起動させた後は、類似判定部234経由で取得するマスク対象領域の座標情報をマスク補充部260に出力する。
【0038】
ここで、マスク対象領域とフレーム枠との距離が所定閾値以下である場合、このマスク対象はフレームの端から徐々にフレームインしてきたものであると考えられる。例えば、図5を参照すると、フレームF40においてはマスク対象領域がフレーム枠に極めて近い。この場合、フレームF40の以前のフレーム(フレームF10からフレームF30)ではマスク対象(被写体)が十分にフレームに収まっていなかったためにマスク対象であると認識されていない恐れがある。
なお、マスク対象領域の位置という場合、マスク対象領域の中心座標Ccを用いてもよく、あるいは、マスク対象領域が四角形であれば四角形の四隅のいずれを用いてもよい。マスク対象領域の位置の取り方に合わせて所定閾値の値や判定方法を適切に調整すればよい。
【0039】
次に、マスク補充部260について説明する。
マスク補充部260は、マスク対象領域の移動軌跡に基づいて、マスク対象が検出される以前のフレームに掛けるマスクを作成する。
マスク補充部260は、座標情報取得部261と、補外用データ保持部262と、動き補外部263と、移動マスク作成部264と、を備える。
【0040】
座標情報取得部261は、類似判定部234および位置判定部250経由で取得するマスク対象領域の座標情報を抜き出し、補外用データ保持部262に格納させる。ここで、座標情報とは、マスク対象領域の座標値、マスク対象領域の大きさ(サイズ)、および、マスク対象領域が属するフレームのタイムスタンプ、であり、これらをセットにして補外用データ保持部に保持させる。補外用データ保持部262は、一時メモリであり、図6のように、マスク対象領域の座標値、サイズ、そのタイムおよびフレーム番号を合わせて保持する。
【0041】
動き補外部263は、補外用データ保持部262に保持された座標情報に基づいて、マスク対象が検出される前の動きを補外法によって推測する。
例えば、図6のように補外用データ保持部262に保持されたデータをグラフにプロットすると図7のようにフレームF40以降におけるマスク対象領域の移動軌跡が求められる。ここでは、分かり易くするため、x座標の変化のみを表わしているが、y座標および領域サイズについても時間の関数として同じようにプロットできる。そして、フレームF40よりも時間的に前のフレーム内でのマスク対象の移動軌跡を補外法で推測するため、図7のグラフを時間的に前に延長する。すると、図8のように、フレームF40よりも時間的に前のフレームにおけるマスク対象の推定軌跡が得られる。
【0042】
移動マスク作成部264は、動き補外部263において図8のように得られた推定軌跡に対し、この軌跡に沿って移動するマスク対象に掛かるように移動するマスクを作成する。例えば、図9のように、フレームF10からフレームF39までに対して左から徐々にフレーム内に入ってくるように移動するマスクを作成する。移動マスク作成部264は、このように作成した移動マスクの情報をマスクフラグ付与部240に出力する。移動マスクの情報とは、移動マスクの座標値、移動マスクの大きさ(サイズ)、および、移動マスクを付加するフレーム番号の情報である。
【0043】
メタファイル作成部270は、マスクを掛ける領域についての情報をマスクフラグ付与部240から取得する。マスクを掛ける領域とはマスク対象領域であり、マスクを掛ける領域についての情報とは、例えば、マスク対象領域の座標、サイズ、フレーム番号といった情報である。繰り返しになるが、マスク対象領域としては、類似判定部234による閾値判定でマスク対象であると確定した領域の他、移動マスク作成部264で作成された移動マスクが付加される領域も含まれることはもちろんである。メタファイル作成部270は、マスク対象領域にマスクを掛ける命令を含むメタファイルを作成する。メタファイル作成部270は、作成したマスク用メタファイルをマスク付加部280に出力する。
【0044】
マスク付加部280は、メタファイルのマスク処理命令に従って動画データにマスクを掛けていく。このとき、動画メモリ120に蓄積された総ての動画データに関するメタファイルが作成されるのを待ってからマスク付加部280でのマスク処理を開始してもよい。すなわち、メタファイル作成のための復号処理をしたあと、あらためての動画メモリ120から動画データを取り出して復号化する。このときはマスク候補取得部220やマスク対象決定部230を起動させる必要はなく、復号化された画像データをマスク付加部280にのみ送り、そこでメタファイルに従ったマスク付加を行う。
【0045】
あるいは、メタファイルの作成から所定の時間遅れをもたせてマスク付加部280でのマスク処理を進行させてもよい。例えば、マスク候補切出部222が処理中であるフレームのタイムスタンプに対し、数分分の遅れを持たせていれば前記フレームに対するマスク処理の要否は確定されている。
【0046】
マスク付加部280でマスク付加された動画データはデータ出力部290から出力される。そして、例えば、パソコンのハードディスクなどに一旦保存されたあと、インターネット上のサーバに送られることになる。
【0047】
(第1実施形態の動作)
続いて、第1実施形態の動作を説明する。
ユーザによる動画撮影(ST10)からマスク付加されたデータの出力(ST60)までの流れは、図10に示すように、撮影(ST10)、動画データの保存(ST20)、マスク処理の事前準備(ST30)、マスク処理用メタファイルの作成(ST40)、マスク付加(ST50)、データ出力(ST60)の順で進む。
【0048】
先に説明したように、図2のように動画を撮影し(ST10)、動画データは動画メモリ120に保存される(ST20)。次に、マスク処理の事前準備を行う(ST30)。マスク処理の事前準備(ST30)として、ユーザはマスク対象に関する情報をマスク対象参照リスト格納部232に格納しておく。本例でいえば、子供CAの顔の特徴量をマスク対象参照リスト格納部232に格納しておく。
子供CAの顔の特徴量をマスク対象参照リスト格納部232に格納するにあたっては、例えば、別途に撮影した子供CAの顔のデータをビデオカメラ100にセットしてもよい。あるいは今回撮影した動画のなかから子供CAの顔が映っている領域を指定して、これをマスク対象としてビデオカメラ100にセットしてもよい。ビデオカメラ100は、マスク対象としてセットされた領域から自動的に特徴量を算出してマスク対象参照リスト格納部232に格納する。
【0049】
これに合わせて切出参照リスト格納部221に切出参照リストを登録しておく必要がある。これについてはマスク対象参照リスト格納部232の情報からビデオカメラ100が自動的に切出参照リストを生成するようにしてもよい。あるいは、人物の顔がマスク対象に設定されたならば、自動的に所定面積以上の肌色領域が切出参照リストに加えられるようにしてもよい。
【0050】
このような事前準備(ST30)が終わったところで、マスク処理部200を起動してマスク処理用メタファイルの作成(ST40)を実行する。マスク処理用メタファイルの作成工程(ST40)を図11のフローチャートを参照して説明する。撮影された動画データは動画メモリ120に蓄積された後、データ入力部210からマスク処理部200に入力される(ST101)。データ入力部210の復号化部211において動画データが復号化され(ST102)、画像フレームが順次マスク候補切出部222に送られる。マスク候補切出部222は、画像フレーム中に切出参照リストに合致するマスク候補領域があるか否かを探索する。フレームF00の段階では、肌色の領域はないのであるからマスク候補となる領域はない(ST130でNO)。マスク候補の領域がなければ、次ぎの画像フレームに探索対象を移していく。
【0051】
フレームF00からフレームF10に移行するにつれて徐々に子供CAがフレームに入ってくる。子供CAの顔が所定面積を超えてフレームに入ってくれば、これは切出参照リストに合致することになる(ST103でYES)。
例えばフレームF10で肌色面積が所定値を超えたとする。すると、マスク候補切出部222は、所定面積以上の肌色領域R10をマスク候補として切り出す(ST104)(図12参照)。このとき、前述したように、切り出された領域(R10)のデータには、切出し元のフレームF10のフレーム番号およびこのフレームF10中での座標が付加されている。
【0052】
マスク候補領域(R10)が切り出されると、この領域(R10)に対して特徴量算出部231により特徴量が算出される(ST105)。算出された特徴量は類似度算出部233に送られ、そこでマスク対象参照リストとの比較に基づいた類似度が求められる(ST106)。
算出された類似度は類似判定部234において閾値と対比される。領域R10については、子供CAの顔の特徴量と類似する点はないので、類似度が閾値Thを超えることはない(ST107でNO)。この場合、領域R10はマスク対象として確定せず(ST107でNO)、次ぎの画像フレームの処理に進む。
【0053】
フレームF10からフレームF30に移るにつれて、子供が映っている領域が徐々に大きくなっていくので肌色領域はすべてマスク候補として切出しの対象となるが(ST103でYES)、まだ子供の顔が十分にフレーム内に映ってはいないので、類似判定(ST107)において類似度が閾値Thを超えることはない(ST107でNO)。
【0054】
フレームF30からさらに進んでフレームF40が処理対象のフレームになった時点を考える。フレームF40では領域R40において顔の80%程度がフレーム内に入っている状態である。領域R40は、所定面積以上の肌色領域であるのでマスク候補としてマスク候補切出部222によって切り出され(ST104)、さらに、子供CAの顔の80%程度が映っているので、マスク対象参照リストにある指標(子供の顔の特徴量)と複数点で相関が高く、類似度としては大きな値が算出される。従って、R40について求められた類似度S40は、閾値Th以上になる(ST107でYES)。
【0055】
このように類似度S40が閾値Th以上になった場合、類似判定部234は、閾値Th以上の類似度Sをもつ領域が出現したことをマスクフラグ付与部240に通知する。すると、類似度が閾値以上となった領域R40に対してマスクフラグ付与部240によってマスクフラグが付与される(ST108)。
【0056】
次に、このようにマスク対象が出現したところで、位置判定部250による位置判定(ST109)を実行する。すなわち、マスク対象である領域R40とフレーム枠との距離を所定閾値と対比する(ST110)。
【0057】
マスク対象(R40)とフレーム枠との距離が所定閾値を超えていれば(ST110でNO)、移動マスクを補充する必要はないと判断する。したがって、マスク対象として確定した領域R40に付されているマスクフラグに従って、マスク対象領域R40にマスクを掛けるメタファイルをメタファイル作成部270によって作成する(ST111)。
【0058】
一方、ST110において、マスク対象領域(R40)とフレーム枠との距離が所定閾値以下である場合(ST110でYES)、フレームインしてきた被写体に必要なマスクを掛けられていない可能性がある。そこでこの場合、マスク補充部260を起動させて、移動マスク作成を開始する(ST120)。
【0059】
移動マスクを作成する工程を図13のフローチャートを参照して説明する。
移動マスクを作成するために、座標情報取得部261によってマスク対象領域の座標情報を取得する(ST121)。
これは、マスク対象が確定した後のフレーム(フレームF40以降のフレーム)についても順次ST101からST107を実行していく際に、座標情報取得部261は、フレームF40以降のフレームに関して類似判定部234および位置判定部250経由でマスク対象となる領域の座標情報を取得する。これにより、フレームF40以降のマスク対象領域について、座標、サイズ、そのフレームのタイムスタンプといった座標情報が補外用データ保持部262に格納されていく(図6参照)。
そして、ST122において、必要量のデータが拾集されたか否かを判定する。これは、図8にて示したように補外法で時間的に前のフレームにおけるマスク対象の動きを推定するにあたって十分なデータ量があるか否かを動き補外部263において判定するものである。
【0060】
データ数が十分かどうかを判定する基準は適宜設定されればよい。
例えば、フレームF40以降の座標情報に対して回帰直線や、適当な次数の関数曲線や、適切なスプライン曲線などでフィッティングカーブを描く(図7参照)。マスク対象として最初に確定したフレーム(フレームF40)から数えて数十フレーム(フレームF40からフレームF60あたりまで)に対する残差が所定値以下になっていれば、補外法が適用できる程度にデータが集まったと判断してもよい。
なお、マスク対象として最初に確定したフレーム(フレームF40)に近いほど寄与度が大きくなる重みを付け、マスク対象として最初に確定したフレーム(フレームF40)の直後の数フレームにおける動きがより強く反映されるようにしてもよい。
【0061】
補外法を適用するのに十分なデータが集まったところで(ST122でYES)、マスク対象領域の移動軌跡を外挿し(ST123)、マスク対象が検出される前の動きを推定する(図8参照)。このように外挿で推定したマスク対象の移動に掛かるように移動マスク作成部264により移動マスクを作成する。これにより、図9に示したように、マスク対象が検出される前のフレーム(フレームF10からフレームF30・・)に掛かるマスクが作成される。
【0062】
作成された移動マスクの情報をマスクフラグ付与部240に出力し、マスクフラグ付与部240において移動マスクの領域にマスクフラグを付与する(ST125)。
【0063】
マスクフラグを付与されたマスク対象データがメタファイル作成部270に送られ、マスク処理を命令するメタファイルが作成される(ST111)。動画メモリ120に蓄積された動画データの全フレームを検証して(ST112でYES)、マスク処理用のメタファイルが完成する。
【0064】
このように作成されたメタファイルに従って動画データにマスク処理を施す(ST50)。すなわち、マスク付加部280は、復号化された動画フレームデータに対しメタファイルに指定された領域にマスクを掛けていく(ST50)。すると、図14に示すように、子供がフレームに映り始めたところからマスク処理が掛かり、子供のプライバシーを保護することができる。
【0065】
このような構成を備える第1実施形態によれば次の効果を奏することができる。
(1)本実施形態ではマスク補充部260を備えており、マスク対象が検出される前のフレームに対しても補外法によってマスク対象の動きを推定し、移動マスクを掛けることとしている。
これにより、マスク対象(被写体)がフレームインし始めてからマスク対象であると確定するまでの間の映像にもマスクを掛けることができ、プライバシーを確実に保護できる。
【0066】
(2)本実施形態では、移動マスクを補充するにあたって補外用データ保持部262に座標情報を保持するが、これらは画像情報ではなく単なる数値であるので補外用データ保持部262の容量は小さくてもよい。例えば、従来技術のようにマスク対象を検出した後で時間的に遡及して関連部分を辿れるように所定量の動画データをバッファに一時保存しておくという方法があるが、これでは非常に大きな容量のメモリが必要になる。そして、バッファから溢れてしまった画像データについては遡及的に検索することはできず、その部分はプライバシーマスク無しで公開されてしまう恐れもある。
この点、本実施形態では移動マスクの作成にあたって必要になるデータは座標情報だけであり、画像情報そのものは保持しておく必要はないのでメモリ容量は極小さくてもよい。また仮にマスク対象の移動軌跡を外挿するのにどれほど多量のフレームを追跡しなければならないとしても、座標情報を一時的に保持するだけでよいのでメモリ容量が問題になることはない。
したがって、必要であれば十分な量の座標情報を収集した後で、正確性の高い移動マスクを作成することができる。
【0067】
(3)位置判定部250を備え、新たに検出されたマスク対象の領域がフレーム枠に近いかどうかを位置判定部250によって判定することによって移動マスクの要否を判断する。単純に、新たにマスク対象が検出されるたびに補外法で移動マスクを補充していると必要のないマスクが入り乱れる恐れがあるが、この点、本実施形態ではマスク対象領域の出現位置に基づいて移動マスクの必要性を適切に判断することができる。これにより、必要な場合にだけ移動マスクを適切に付加することができる。
【0068】
(変形例1)
上記第1実施形態において、位置判定部250では新たに出現したマスク対象領域とフレーム枠との距離にだけ基づいて移動マスクの要否を判断していた。移動マスクが必要であるか否かを判断するにあたっては、別の判定要件を用いてもよい。
例えば、マスク対象領域がフレームの中心方向に移動しているかどうかを判定要件としもよい。あるいは上記の二つとも用い、両方を満たした場合にマスク補充部を起動させてもよい。さらには、上記二つの要件のうちいずれか一方でも満たせばマスク補充部を起動させてもよい。
【0069】
なお、本発明は上記実施形態および変形例に限られず、本発明の趣旨を逸脱しない範囲で適宜変更することが可能である。
上記実施形態においては、特定人物の顔にプライバシーマスクを掛ける場合を説明したが、逆に、特定人物にはマスクを掛けず、その他のたまたま映ってしまった一般の人の顔にプライバシーマスクを掛けるようにしてもよいことはもちろんである。この場合、被写体が、「人の顔ではあるが特定人物の顔ではない」ということを閾値判定で判断すればよいのであり、このような判定のためにマスク対象参照リストや類似判定部を改変することは当業者には明らかであろう。
【0070】
「肌色」というのは人種によって異なるのであるから、マスク対象の人種を考慮して解釈されるべきである。例えば、ビデオカメラが使用される国がアジア圏であれば、肌色とは例えばモンゴロイドの肌の色、すなわち、淡黄色を意味する。被写体がコーカソイドやニグロイドであれば当然ながら肌色は白色であったり黄褐色であったりする。
【0071】
上記実施形態では撮影が終了した後でマスク処理部を起動してマスク処理を行う例を説明したが、撮影しながら並行してマスク処理を実行してもよい。
【0072】
CPUやメモリを配置してコンピュータとして機能できるように構成し、このメモリに所定の制御プログラムをインターネット等の通信手段や、CD−ROM、メモリカード等の記録媒体を介してインストールし、このインストールされたプログラムでCPU等を動作させて、上記実施形態で説明した各機能部としての機能を実現してもよい。
【符号の説明】
【0073】
100…ビデオカメラ、110…ビデオカメラの撮像部、120…動画メモリ、200…マスク処理部、210…データ入力部、211…復号化部、220…マスク候補取得部、221…切出参照リスト格納部、222…マスク候補切出部、222…順次マスク候補切出部、222…マスク候補切出部、230…マスク対象決定部、231…特徴量算出部、232…マスク対象参照リスト格納部、233…類似度算出部、234…類似判定部、240…マスクフラグ付与部、250…位置判定部、260…マスク補充部、261…座標情報取得部、262…補外用データ保持部、263…動き補外部、264…移動マスク作成部、270…メタファイル作成部、280…マスク付加部、290…データ出力部、900…動画像データ記録再生システム、910…パソコン、920…インターネット、930…サーバ。
【特許請求の範囲】
【請求項1】
動画データからマスク処理すべき画像領域を検索してそれらにマスクを付加する画像処理装置であって、
予め登録された切出参照リストに基づいて、前記動画データの画像フレームのなかからマスク対象になり得る領域をマスク候補領域として切り出すマスク候補切出部と、
予め登録されたマスク対象参照リストに基づいて、最新の前記マスク候補領域を前記マスク対象参照リストと対比して両者の類似度を算出する類似度算出部と、
前記算出された類似度を所定閾値と対比して、前記類似度が所定閾値以上である場合にはそのマスク候補領域をマスク対象として確定させる類似判定部と、
前記類似判定部による判定よってマスク対象に確定した領域の動きを時間的に後ろに追跡して得られる移動軌跡を用いて前記マスク対象に確定した領域の時間的に前の移動軌跡を推測し、この推測した時間的に前の移動軌跡によって得られた領域に掛かる補充マスクを作成するマスク補充部と、
前記類似判定部による判定によってマスク対象に確定した領域に加えて前記マスク補充部で作成された前記補充マスクの領域に対してマスクを付加するマスク付与部と、を備える
ことを特徴とする画像処理装置。
【請求項2】
前記マスク補充部は、
前記類似判定部による判定によってマスク対象に確定した領域の座標情報を順次取得する座標情報取得部と、
前記座標情報取得部にて取得された座標情報を保持する補外用データ保持部と、
前記補外用データ保持部に保持されたデータを時間的に前に外挿してマスク対象が検出される前の動きを推測する動き補外部と、
前記動き補外部による外挿によって得られた動きに掛かるように移動するマスクを作成する移動マスク作成部と、を備える
ことを特徴とする請求項1に記載の画像処理装置。
【請求項3】
前記類似判定部による判定よってマスク対象に確定した領域と、画像フレーム枠と、の距離が所定閾値以下であるか否かを判定する位置判定部をさらに備え、
前記距離が所定閾値以下の場合に、前記位置判定部は前記マスク補充部を起動させる
ことを特徴とする請求項1または請求項2に記載の画像処理装置。
【請求項4】
前記類似判定部による判定よってマスク対象に確定した領域が画像フレームの中心方向に移動しているか否かを判定する位置判定部をさらに備え、
前記マスク対象に確定した領域が画像フレームの中心方向に移動している場合に、前記位置判定部は前記マスク補充部を起動させる
ことを特徴とする請求項1から請求項3のいずれか一項に記載の画像処理装置。
【請求項5】
動画データからマスク処理すべき画像領域を検索してそれらにマスクを付加する画像処理方法であって、
予め登録された切出参照リストに基づいて、前記動画データの画像フレームのなかからマスク対象になり得る領域をマスク候補領域として切り出すマスク候補切出工程と、
予め登録されたマスク対象参照リストに基づいて、最新の前記マスク候補領域を前記マスク対象参照リストと対比して両者の類似度を算出する類似度算出工程と、
前記算出された類似度を所定閾値と対比して、前記類似度が所定閾値以上である場合にはそのマスク候補領域をマスク対象として確定させる類似判定工程と、
前記類似判定工程による判定よってマスク対象に確定した領域の動きを時間的に後ろに追跡して得られる移動軌跡を用いて前記マスク対象に確定した領域の時間的に前の移動軌跡を推測し、この推測した時間的に前の移動軌跡によって得られた領域に掛かる補充マスクを作成するマスク補充工程と、
前記類似判定工程による判定によってマスク対象に確定した領域に加えて前記マスク補充工程で作成された前記補充マスクの領域に対してマスクを付加するマスク付与工程と、を備える
ことを特徴とする画像処理方法。
【請求項6】
動画データからマスク処理すべき画像領域を検索してそれらにマスクを付加する画像処理プログラムであって、
このコンピュータを、
予め登録された切出参照リストに基づいて、前記動画データの画像フレームのなかからマスク対象になり得る領域をマスク候補領域として切り出すマスク候補切出部と、
予め登録されたマスク対象参照リストに基づいて、最新の前記マスク候補領域を前記マスク対象参照リストと対比して両者の類似度を算出する類似度算出部と、
前記算出された類似度を所定閾値と対比して、前記類似度が所定閾値以上である場合にはそのマスク候補領域をマスク対象として確定させる類似判定部と、
前記類似判定部による判定よってマスク対象に確定した領域の動きを時間的に後ろに追跡して得られる移動軌跡を用いて前記マスク対象に確定した領域の時間的に前の移動軌跡を推測し、この推測した時間的に前の移動軌跡によって領域に掛かる補充マスクを作成するマスク補充部と、
前記類似判定部による判定によってマスク対象に確定した領域に加えて前記マスク補充部で作成された前記補充マスクの領域に対してマスクを付加するマスク付与部と、して機能させる
画像処理プログラム。
【請求項1】
動画データからマスク処理すべき画像領域を検索してそれらにマスクを付加する画像処理装置であって、
予め登録された切出参照リストに基づいて、前記動画データの画像フレームのなかからマスク対象になり得る領域をマスク候補領域として切り出すマスク候補切出部と、
予め登録されたマスク対象参照リストに基づいて、最新の前記マスク候補領域を前記マスク対象参照リストと対比して両者の類似度を算出する類似度算出部と、
前記算出された類似度を所定閾値と対比して、前記類似度が所定閾値以上である場合にはそのマスク候補領域をマスク対象として確定させる類似判定部と、
前記類似判定部による判定よってマスク対象に確定した領域の動きを時間的に後ろに追跡して得られる移動軌跡を用いて前記マスク対象に確定した領域の時間的に前の移動軌跡を推測し、この推測した時間的に前の移動軌跡によって得られた領域に掛かる補充マスクを作成するマスク補充部と、
前記類似判定部による判定によってマスク対象に確定した領域に加えて前記マスク補充部で作成された前記補充マスクの領域に対してマスクを付加するマスク付与部と、を備える
ことを特徴とする画像処理装置。
【請求項2】
前記マスク補充部は、
前記類似判定部による判定によってマスク対象に確定した領域の座標情報を順次取得する座標情報取得部と、
前記座標情報取得部にて取得された座標情報を保持する補外用データ保持部と、
前記補外用データ保持部に保持されたデータを時間的に前に外挿してマスク対象が検出される前の動きを推測する動き補外部と、
前記動き補外部による外挿によって得られた動きに掛かるように移動するマスクを作成する移動マスク作成部と、を備える
ことを特徴とする請求項1に記載の画像処理装置。
【請求項3】
前記類似判定部による判定よってマスク対象に確定した領域と、画像フレーム枠と、の距離が所定閾値以下であるか否かを判定する位置判定部をさらに備え、
前記距離が所定閾値以下の場合に、前記位置判定部は前記マスク補充部を起動させる
ことを特徴とする請求項1または請求項2に記載の画像処理装置。
【請求項4】
前記類似判定部による判定よってマスク対象に確定した領域が画像フレームの中心方向に移動しているか否かを判定する位置判定部をさらに備え、
前記マスク対象に確定した領域が画像フレームの中心方向に移動している場合に、前記位置判定部は前記マスク補充部を起動させる
ことを特徴とする請求項1から請求項3のいずれか一項に記載の画像処理装置。
【請求項5】
動画データからマスク処理すべき画像領域を検索してそれらにマスクを付加する画像処理方法であって、
予め登録された切出参照リストに基づいて、前記動画データの画像フレームのなかからマスク対象になり得る領域をマスク候補領域として切り出すマスク候補切出工程と、
予め登録されたマスク対象参照リストに基づいて、最新の前記マスク候補領域を前記マスク対象参照リストと対比して両者の類似度を算出する類似度算出工程と、
前記算出された類似度を所定閾値と対比して、前記類似度が所定閾値以上である場合にはそのマスク候補領域をマスク対象として確定させる類似判定工程と、
前記類似判定工程による判定よってマスク対象に確定した領域の動きを時間的に後ろに追跡して得られる移動軌跡を用いて前記マスク対象に確定した領域の時間的に前の移動軌跡を推測し、この推測した時間的に前の移動軌跡によって得られた領域に掛かる補充マスクを作成するマスク補充工程と、
前記類似判定工程による判定によってマスク対象に確定した領域に加えて前記マスク補充工程で作成された前記補充マスクの領域に対してマスクを付加するマスク付与工程と、を備える
ことを特徴とする画像処理方法。
【請求項6】
動画データからマスク処理すべき画像領域を検索してそれらにマスクを付加する画像処理プログラムであって、
このコンピュータを、
予め登録された切出参照リストに基づいて、前記動画データの画像フレームのなかからマスク対象になり得る領域をマスク候補領域として切り出すマスク候補切出部と、
予め登録されたマスク対象参照リストに基づいて、最新の前記マスク候補領域を前記マスク対象参照リストと対比して両者の類似度を算出する類似度算出部と、
前記算出された類似度を所定閾値と対比して、前記類似度が所定閾値以上である場合にはそのマスク候補領域をマスク対象として確定させる類似判定部と、
前記類似判定部による判定よってマスク対象に確定した領域の動きを時間的に後ろに追跡して得られる移動軌跡を用いて前記マスク対象に確定した領域の時間的に前の移動軌跡を推測し、この推測した時間的に前の移動軌跡によって領域に掛かる補充マスクを作成するマスク補充部と、
前記類似判定部による判定によってマスク対象に確定した領域に加えて前記マスク補充部で作成された前記補充マスクの領域に対してマスクを付加するマスク付与部と、して機能させる
画像処理プログラム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【公開番号】特開2013−98750(P2013−98750A)
【公開日】平成25年5月20日(2013.5.20)
【国際特許分類】
【出願番号】特願2011−239765(P2011−239765)
【出願日】平成23年10月31日(2011.10.31)
【出願人】(308036402)株式会社JVCケンウッド (1,152)
【Fターム(参考)】
【公開日】平成25年5月20日(2013.5.20)
【国際特許分類】
【出願日】平成23年10月31日(2011.10.31)
【出願人】(308036402)株式会社JVCケンウッド (1,152)
【Fターム(参考)】
[ Back to top ]