説明

画像処理装置および方法

【課題】より高精度に画像を置換できるようにする。
【解決手段】検出部は、画像から検出対象物を検出する。記憶部は、登録が指示された場合、検出部により検出された検出対象物の画像である置換前画像と、置換前画像と置換される画像である置換後画像とを対応付けた対応定義情報を記憶する。画像合成処理部は、置換が指示された場合、検出部により画像から検出対象物が検出されたとき、対応定義情報に基づいて、前記画像の置換前画像を置換後画像に置換する。

【発明の詳細な説明】
【技術分野】
【0001】
本技術は画像処理装置および方法に関し、特に、より高精度に画像を置換するようにした画像処理装置および方法に関する。
【背景技術】
【0002】
テレビジョン受像機やパーソナルコンピュータが高機能になるに従い、ユーザが様々なコンテンツやアプリケーションを利用することができるようになっている。
【0003】
例えば、動画像に表示された画像から顔画像を検出し、検出された顔画像にユーザの顔画像を合成して表示させる技術が提案されている(例えば特許文献1参照)。
【0004】
特許文献1の技術は、ユーザの怒り、悲しみ、笑い等の様々な表情についての表情パターンを保持し、検出された顔画像の表情パターンを特定することで、検出された顔画像をユーザの顔画像に差し替えた合成画像を生成する。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】2007−300562号公報
【発明の開示】
【発明が解決しようとする課題】
【0006】
しかしながら、特許文献1の技術は、動画像から顔を検出し、検出された顔画像の表情を特定するだけであり、顔の向きは考慮されていなかった。
【0007】
このような、特許文献1の技術では、動画像から検出された顔画像が略正面を向いていないと、検出された顔画像をユーザの顔画像に差し替えることができなかった。
【0008】
また、特許文献1の技術では、検出された顔画像の表情パターンと、保持されたユーザの顔画像の表情パターンとから差し替えるユーザの顔画像を特定しており、ユーザが、検出された顔画像と、ユーザの顔画像とを任意に対応付けることができなかった。
【0009】
従って、顔の表情に基づいて顔画像の差し替えが実行された場合、ユーザの所望する顔画像に差し替えられないおそれがあった。
【0010】
本技術は、このような状況に鑑みてなされたものであり、より高精度に画像を置換できるようにするものである。
【課題を解決するための手段】
【0011】
本技術の一側面の画像処理装置は、画像から検出対象物を検出する検出部と、登録が指示された場合、前記検出部により検出された前記検出対象物の画像である置換前画像と、前記置換前画像と置換される画像である置換後画像とを対応付けた対応定義情報を記憶する記憶部と、置換が指示された場合、前記検出部により前記画像から前記検出対象物が検出されたとき、前記対応定義情報に基づいて、前記画像の前記置換前画像を前記置換後画像に置換する画像合成処理部とを備える。
【0012】
前記置換前画像の特徴を検出する特徴検出部をさらに備え、前記記憶部は、前記置換前画像と前記特徴を対応付けた特徴対応表を記憶することができる。
【0013】
前記置換が指示された場合、前記特徴検出部により検出された前記特徴と、前記特徴対応表に含まれる前記特徴の類似度を算出する算出部と、前記算出により算出された前記類似度に基づいて、前記特徴検出部により検出された前記特徴に最も類似する前記特徴を有する前記置換前画像を前記特徴対応表から取得するとともに、取得された前記置換前画像に対応する前記置換後画像を前記対応定義情報から取得する取得部とをさらに備え、前記画像合成処理部は、前記取得部により取得された前記置換後画像を用いて、前記置換前画像を置換することができる。
【0014】
前記画像を保持する画像保持部と、前記画像に対応する音声を保持する音声保持部と、前記画像保持部に保持された前記画像と、前記音声保持部に保持された前記音声との出力タイミングを同期させるように制御する同期制御部とをさらに備えることができる。
【0015】
前記取得部は、編集が指示された場合、前記対応定義情報に含まれる前記置換前画像と置換後画像の組を取得するとともに、新たな置換後画像を取得し、前記記憶部は、前記取得部により前記新たな置換後画像が取得された場合、前記置換前画像と前記新たな置換後画像を対応付けて記憶することができる。
【0016】
前記検出対象物は、顔であるようにすることができる。
【0017】
本技術の一側面の画像処理方法は、画像から検出対象物を検出する検出ステップと、登録が指示された場合、前記検出ステップの処理により検出された前記検出対象物の画像である置換前画像と、前記置換前画像と置換される画像である置換後画像とを対応付けた対応定義情報を記憶する記憶ステップと、置換が指示された場合、前記検出ステップの処理により前記画像から前記検出対象物が検出されたとき、前記対応定義情報に基づいて、前記画像の前記置換前画像を前記置換後画像に置換する画像合成処理部とを含む。
【0018】
本技術の一側面においては、画像から検出対象物が検出され、登録が指示された場合、検出された検出対象物の画像である置換前画像と、置換前画像と置換される画像である置換後画像とを対応付けた対応定義情報が記憶され、置換が指示された場合、画像から検出対象物が検出されたとき、対応定義情報に基づいて、画像の置換前画像が置換後画像に置換される。
【発明の効果】
【0019】
本技術の側面によれば、より高精度に画像を置換することが可能になる。
【図面の簡単な説明】
【0020】
【図1】本技術の画像処理システムの一実施の形態の構成を示す図である。
【図2】画像処理装置の一実施の形態の構成を示すブロック図である。
【図3】CPUの機能的構成例を示すブロック図である。
【図4】リモートコントローラの概略を示す図である。
【図5】画像処理装置のモードの状態遷移を説明する図である。
【図6】登録処理を説明するフローチャートである。
【図7】表示部の出力の例を示す図である。
【図8】顔特徴対応表の例を示す図である。
【図9】表示部の出力の例を示す図である。
【図10】画像置換処理を説明するフローチャートである。
【図11】表示部の出力の例を示す図である。
【図12】編集処理を説明するフローチャートである。
【図13】表示部の出力の例を示す図である。
【図14】表示部の出力の例を示す図である。
【発明を実施するための最良の形態】
【0021】
以下、本技術を実施するための形態(以下、実施の形態という)について説明する。なお、説明は以下の順序で行う。
1.画像処理システムの構成
2.登録処理
3.画像置換処理
4.編集処理
5.その他
【0022】
[画像処理システムの構成]
【0023】
図1は、本技術が適用される画像処理システム1の一実施の形態の構成を示す図である。図1の画像処理システム1は、画像処理装置21、出力装置22、画像再生装置23、およびリモートコントローラ24から構成される。
【0024】
画像処理装置21は、例えば、STB(Set Top Box)の形式で構成され、画像再生装置23と出力装置22の間に挿入される。画像処理装置21は、メモリカードスロット41、カメラ42、スキャナ43、および赤外線受信部44を有している。図2を参照して、画像処理装置21の詳細について説明する。
【0025】
図2は、画像処理装置21の一実施の形態の構成を示すブロック図である。
【0026】
画像処理装置21は、メモリカードスロット41、カメラ42、スキャナ43、および赤外線受信部44に加え、CPU(Central Processing Unit)101、映像入力部102、映像フレームバッファメモリ103、映像出力部104、音声入力部105、音声フレームバッファメモリ106、音声出力部107、顔特徴登録DB(データベース)108、および記憶部109から構成される。
【0027】
メモリカードスロット41は、挿入されたメモリカード51に対して、各種の情報を読み書きする。
【0028】
カメラ42は、CCD(Charge Coupled Device)イメージセンサ、CMOS(Complementary Metal Oxide Semiconductor)イメージセンサ等の撮像素子により構成される。
【0029】
スキャナ43は、センサを用いて画像情報等を取り込む。赤外線受信部44は、リモートコントローラ24からの赤外線信号を受信する。
【0030】
CPU101は、プログラムに従って各種の動作を制御する。図3を参照して、CPU101の機能的な構成について説明する。
【0031】
図3は、CPU101の機能的な構成例を示すブロック図である。CPU101は、取得部121、顔検出部122、顔特徴検出部123、記憶部124、算出部125、判定部126、画像合成処理部127、同期制御部128、および編集部129の機能ブロックを有している。
【0032】
なお、CPU101の各ブロックは、必要に応じて相互に信号、データを授受することが可能とされている。
【0033】
取得部121は、各種の情報を取得する。顔検出部122は、画像から顔を検出する。顔特徴検出部123は、顔特徴を検出する。記憶部124は、各種の情報を記憶する。算出部125は、各種の算出処理を実行する。判定部126は、各種の判定処理を実行する。画像合成処理部127は、画像の合成処理を実行する。同期制御部128は、同期制御処理を実行する。編集部129は、各種の情報を編集する。
【0034】
図2に戻り、映像入力部102は、画像再生装置23から出力される画像の入力を受け付ける。画像保持部としての映像フレームバッファメモリ103は、RAM(Random Access Memory)等により構成され、映像入力部102を介して入力された画像を一時的に保持する。
【0035】
映像出力部104は、映像フレームバッファメモリ103に保持された画像を出力装置22に出力する。
【0036】
音声入力部105は、画像再生装置23から出力される音声の入力を受け付ける。音声保持部としての音声フレームバッファメモリ106は、RAM等により構成され、音声入力部105を介して入力された音声を一時的に保持する。
【0037】
なお、映像フレームバッファメモリ103と音声フレームバッファメモリ106は、1つのRAM等により構成することもできる。
【0038】
音声出力部107は、音声フレームバッファメモリ106に保持された音声を出力装置22に出力する。
【0039】
顔特徴登録DB108は、後述する顔特徴対応表、および対応定義情報を保持する。記憶部109は、ハードディスクや不揮発性メモリなどにより構成される。
【0040】
図1に戻り、例えば、テレビジョン受像機等により構成される出力装置22は、画像処理装置21から出力された映像を表示部61に出力するとともに、画像処理装置21から出力された音声を内蔵するスピーカ(図示せず)から出力する。
【0041】
画像再生装置23は、スロット81から挿入されたDVD(Digital Versatile Disc)、BD(Blu-ray Disc)(商標)等の光ディスクを読み込み、映像および音声を画像処理装置21に出力する。
【0042】
リモートコントローラ24は、ユーザにより操作され、赤外線受信部44を介して、画像処理装置21に各種の指示を出力する。図4を参照して、リモートコントローラ24の詳細について説明する。
【0043】
図4は、リモートコントローラ24の概略を示す図である。リモートコントローラ24は、鑑賞モードボタン141、登録モードボタン142、編集モードボタン143、方向ボタン144、決定ボタン145、および取消ボタン146を有している。
【0044】
鑑賞モードボタン141、登録モードボタン142、および編集モードボタン143のいずれかのモード変更ボタンが操作された場合、画像処理装置21のモードが変更される。図5を参照して、画像処理装置21の各モードについて説明する。
【0045】
図5は、画像処理装置21のモードの状態遷移を説明する図である。画像処理装置21は、鑑賞モード、登録モード、および編集モードの3つのモードを有している。画像処理装置21に対して電源供給が開始されると、画像処理装置21のモードは鑑賞モードに遷移する。
【0046】
鑑賞モードは、画像再生装置23から出力された映像および音声を出力装置22に出力させるモードである。
【0047】
また、鑑賞モードでは、画像再生装置23から出力された画像から顔を検出し、検出された顔の画像が既に登録された顔画像と同じか類似している場合、その検出された顔の画像を、既に登録された顔画像(例えば、ユーザの顔画像)に置き換えて、出力装置22に出力する。
【0048】
鑑賞モードの状態で、リモートコントローラ24の登録モードボタン142が操作された場合、画像処理装置21は、登録モードに遷移する。
【0049】
登録モードは、鑑賞モードにおいて顔画像を置換するために、置換前画像と置換後画像の組を顔特徴登録DB108に登録するモードである。
【0050】
置換前画像は、画像再生装置23により出力された画像から検出された顔の画像であり、置換後画像と置換される画像である。
【0051】
置換後画像は、カメラ42、スキャナ43、メモリカード51、および記憶部109のいずれかから取得される新たな顔画像(例えばユーザの顔画像)であり、置換前画像と置換される画像である。
【0052】
登録モードが終了された場合、および登録モードの状態で、リモートコントローラ24の鑑賞モードボタン141が操作された場合、画像処理装置21は、鑑賞モードに遷移する。
【0053】
鑑賞モードの状態で、リモートコントローラ24の編集モードボタン143が操作された場合、画像処理装置21のモードは、編集モードに遷移する。
【0054】
編集モードは、登録モードにおいて登録された置換前画像と置換後画像の組を編集するモードである。例えば、置換前画像と置換後画像の組合せを変更したり、置換前画像と置換後画像の組を削除する処理が実行される。
【0055】
編集モードが終了された場合、および編集モードの状態で、リモートコントローラ24の鑑賞モードボタン141が操作された場合、画像処理装置21のモードは、鑑賞モードに遷移する。
【0056】
なお、登録モードの状態で、リモートコントローラ24の編集モードボタン143が操作された場合、画像処理装置21のモードが、編集モードに遷移するようにすることもできる。
【0057】
同様に、編集モードの状態で、リモートコントローラ24の登録モードボタン142が操作された場合、画像処理装置21のモードが、登録モードに遷移するようにすることもできる。
【0058】
図4に戻り、方向ボタン144は、ユーザの操作によりカーソル等を上下左右に移動させるとき操作される。決定ボタン145は、カーソル等により選択されている項目、ボタンを選択するとき操作される。取消ボタン146は、ユーザによる操作をキャンセルするとき操作される。
【0059】
[登録処理]
【0060】
図6乃至図9を参照して、登録処理について説明する。図6は、登録処理を説明するフローチャートである。図7は、表示部61の出力の例を示す図である。図8は、顔特徴対応表の例を示す図である。
【0061】
図6の登録処理は、登録モードの処理である。登録処理は、例えば、鑑賞モードが実行され、画像再生装置23がブルーレイディスクから再生した動画像を画像処理装置21を介して出力装置22に供給し、表示させている場合に実行される。
【0062】
すなわち、ユーザは動画像を視聴しながら所定の画像が表示されたタイミングでリモートコントローラ24の登録モードボタン142を操作する。つまり、ユーザにより登録が指示されたときに登録処理が開始される。
【0063】
ステップS1において、映像フレームバッファメモリ103は、フレーム画像を取得する。フレーム画像は、例えば、ユーザにより画像再生装置23の一時停止が指示された場合の画像である。
【0064】
すなわち、ユーザにより一時停止が指示された場合、画像再生装置23から出力されたフレーム画像が、映像入力部102を介して、映像フレームバッファメモリ103に記憶される。
【0065】
また、フレーム画像は、ユーザによりリモートコントローラ24の登録モードボタン142が操作された時の画像とすることもできる。
【0066】
例えば、ステップS1の処理により、図7Aに示されるフレーム画像が取得される。図7Aのフレーム画像には、人201A,201B,201Cの3人が表示されている。
【0067】
ステップS2において、顔検出部122は、顔を検出する。すなわち、ステップS1の処理により取得されたフレーム画像から顔の領域が検出される。
【0068】
例えば、顔の検出のために、数十から数百種類の顔画像を合成した基準画像があらかじめ用意される。顔検出部122は、取得されたフレーム画像中に矩形領域を設定し、基準画像と矩形領域の画像を比較して画像の類似度を算出する。類似度が閾値より大きい画像が顔画像とされる。
【0069】
顔検出部122は、取得されたフレーム画像に対して、様々な矩形領域を設定し、類似度を適宜算出することにより、取得されたフレーム画像から顔の領域を検出する。なお、顔の検出方法は、この方法に限られず、顔が検出できればどのような方法を利用してもよい。
【0070】
ステップS3において、判定部126は、顔が検出できたかを判定する。すなわち、ステップS1の処理により取得されたフレーム画像に顔が存在するかが判定される。
【0071】
ステップS3において、顔が検出されていないと判定された場合、ステップS4において、映像出力部104は、出力装置22にエラーを出力する。例えば、エラーとして「顔が検出できませんでした」等のメッセージが出力装置22の表示部61に表示される。
【0072】
一方、ステップS3において、顔が検出されたと判定された場合、処理はステップS5に進む。例えば、ステップS1の処理により図7Aに示されるフレーム画像が取得された場合、ステップS2の処理により人201A,201B,201Cの顔がそれぞれ検出される。
【0073】
ステップS5において、映像出力部104は、置換前画像候補を出力する。すなわち、ステップS2の処理により検出された顔の領域が置換前画像候補として出力される。
【0074】
例えば、図7Bに示される人201A,201B,201Cの顔画像に対応する領域に、置換対象候補枠211A,211B,211Cが出力される。
【0075】
ステップS6において、取得部121は、置換前画像を取得する。すなわち、ステップS5の処理により出力された置換前画像候補から1つの置換前画像が取得される。
【0076】
例えば、ユーザのリモートコントローラ24の方向ボタン144の操作により、図7Bの選択枠212が置換対象候補枠211A,211B,211Cのいずれかに重畳されて表示される。
【0077】
そして、ユーザによりリモートコントローラ24の決定ボタン145が操作された時の置換対象候補枠211(図7Bの例では置換対象候補枠211A)内の画像が、置換前画像として取得される。
【0078】
ステップS7において、顔特徴検出部123は、ステップS6の処理により取得された置換前画像の顔特徴を検出する。顔特徴は、例えば、目の位置、目と目の間隔、口の面積等、顔のパーツに基づいて検出されるものであり、それらをまとめた顔特徴ベクトルで表わされる。
【0079】
ステップS8において、記憶部124は、置換前画像と顔特徴を対応付けた顔特徴対応表を記憶する。すなわち、ステップS6の処理により取得された置換前画像と、ステップS7の処理により検出された顔特徴とが対応付けられた顔特徴対応表が顔特徴登録DB108に記憶される。
【0080】
図8は、顔特徴対応表の例を示す図である。顔特徴対応表には、例えば図8に示されるように、顔特徴としての顔特徴ベクトルV1,V2,V3と、置換前画像のファイル名Face0001,Face0002,Face0003とがそれぞれ対応付けられて記憶される。
【0081】
また図8に示されるように、ID(Identification)を顔特徴ベクトルおよび置換前画像ファイル名に対応付けるようにすることもできる。
【0082】
IDは、例えば、DVD,BD等の映像コンテンツごとに固有に設定されたものや、アクション、スポーツ、ドラマ等のカテゴリ毎に設定されたものである。IDは、顔特徴ベクトルおよび置換前画像ファイル名の組に対して、複数設定することができる。
【0083】
図6に戻り、ステップS9において、映像出力部104は、出力装置22に置換後画像候補を出力する。置換後画像候補は、カメラ42、スキャナ43、メモリカード51、および記憶部109のいずれかから取得される。図9を参照して、置換後画像候補について説明する。
【0084】
図9は、表示部61の出力の例を示す図である。図9の例では、置換前画像としての人210Aの顔画像と、メモリカード51内に記憶された顔画像241P,241P’,241P’’,241Q,241R,241Sが表示されている。
【0085】
なお、顔画像241P’,241P’’は、顔画像241Pの横向き(顔画像241P’は左向き、顔画像241P’’は右向き)の顔画像を示している。
【0086】
図9の例では、ユーザによりプルダウンメニュー221が操作されることで、カメラ42、スキャナ43、メモリカード51、および記憶部109のうちのメモリカード51が選択されている。
【0087】
図6のステップS10において、取得部121は、置換後画像を取得する。例えば、ユーザの操作により、図9のメモリカード51の顔画像241P,241P’,241P’’,241Q,241R,241Sから所定の顔画像(例えば、顔画像241P)が置換後画像として選択され、取得される。
【0088】
ステップS11において、記憶部124は、置換前画像と置換後画像を対応付けた対応定義情報を記憶する。すなわち、ステップS6の処理により取得された置換前画像と、ステップS10の処理により取得された置換後画像とが対応付けられて、顔特徴登録DB108に登録される。
【0089】
ステップS4,S11の処理の後、図6の登録処理は終了する。
【0090】
このように、ユーザが顔画像を複数枚用意することで、簡単に置換前画像と置換後画像を対応付けて、予め用意しておくことができる。
【0091】
例えば、Aの顔をBの顔に置換する場合、Aの正面だけでなく、色々な角度からの顔に対応して、Bの色々な角度の顔画像を対応付けることができる。また、Aの様々な表情に対応して、Bの様々な表情の顔画像を対応付けることができる。
【0092】
これにより、登録される置換前画像と置換後画像の組の数が増加し、より精度の高い置換を実行することができる。
【0093】
[画像置換処理]
【0094】
次に、図10と図11を参照して、画像置換処理について説明する。図10は、画像置換処理を説明するフローチャートである。
【0095】
図10の画像置換処理は、鑑賞モードの処理である。画像置換処理は、例えば、登録モードが実行されている場合に、ユーザによりリモートコントローラ24の鑑賞モードボタン141が操作されたとき、すなわちユーザにより置換が指示されたときに開始される。
【0096】
ステップS21において、映像フレームバッファメモリ103は、フレーム画像を取得する。すなわち、画像再生装置23から出力された画像のうちの所定のフレーム画像が、映像入力部102を介して取得される。
【0097】
ステップS22において、音声フレームバッファメモリ106は、フレーム画像に対応する音声を取得する。すなわち、ステップS21の処理、および後述するステップS35の処理により取得されたフレーム画像に対応する音声が、音声入力部105を介して取得される。
【0098】
ステップS23において、顔検出部122は、顔を検出する。すなわち、ステップS21の処理、および後述するステップS35の処理により取得されたフレーム画像から顔の領域が検出される。顔の検出方法は、図6のステップS2の手法と同様である。
【0099】
ステップS24において、判定部126は、顔が検出できたかを判定する。すなわち、ステップS21の処理により取得されたフレーム画像に顔が存在するかが判定される。
【0100】
例えば、図7Aに示されるフレーム画像が取得された場合、人201A,201B,201Cの顔がそれぞれ検出される。
【0101】
ステップS24において、顔が検出されたと判定された場合、ステップS25において、顔特徴検出部123は、顔特徴を検出する。すなわち、ステップS23の処理により検出された顔画像から顔特徴が検出される。
【0102】
例えば、図7Aの例では、検出された人201A,201B,201Cの顔に対して、それぞれ顔特徴が検出される。
【0103】
ステップS26において、取得部121は、顔特徴登録DB108から顔特徴対応表を取得する。すなわち、図6のステップS8の処理で記憶された顔特徴対応表が取得される。
【0104】
ステップS27において、算出部125は、検出された顔特徴と置換前画像の顔特徴の類似度を算出する。すなわち、ステップS25の処理により検出された顔特徴と、ステップS26の処理により取得された顔特徴対応表の顔特徴との類似度が算出される。
【0105】
検出された人201A,201B,201Cの顔特徴としての顔特徴ベクトルをそれぞれVa,Vb,Vcとすると、例えば図8の顔特徴ベクトルV1,V2,V3に対する類似度は、|Va−V1|,|Va−V2|,|Va−V3|,|Vb−V1|,|Vb−V2|,|Vb−V3|,|Vc−V1|,|Vc−V2|,|Vc−V3|の式、すなわち、差の絶対値によりそれぞれ算出される。
【0106】
なお、画像再生装置23から出力される映像のIDが「0001」である場合、類似度として、同じIDの画像の特徴ベクトルとの差|Va−V1|,|Va−V2|,|Vb−V1|,|Vb−V2|,|Vc−V1|,|Vc−V2|だけを計算すればよく、異なるIDの画像の特徴ベクトルとの差|Va−V3|,|Vb−V3|,|Vc−V3|の計算を省略することができる。
【0107】
このように、IDを利用することで、より迅速に類似度を算出することができる。
【0108】
また、類似度の算出方法は、上述の方法に限られず、他の方法を用いることもできる。
【0109】
ステップS28において、取得部121は、類似度の値の最小値を取得する。例えば、最小値として|Va−V1|が取得されたとする。
【0110】
ステップS29において、判定部126は、ステップS28の処理により取得された類似度の値の最小値が所定の閾値以上であるかを判定する。すなわち、検出された顔の画像と、置換前画像とが類似しているかが判定される。
【0111】
ステップS29において、類似度の値の最小値が所定の閾値以上であると判定された場合、すなわち、検出された顔の画像と、置換前画像とが類似している場合、処理はステップS30に進む。
【0112】
ステップS30において、取得部121は、類似度が最小となった顔特徴に対応する置換後画像を取得する。すなわち、顔特徴に対応する置換前画像が顔特徴対応表から取得されるとともに、取得された置換前画像に対応する置換後画像が対応定義情報から取得される。
【0113】
例えば、ステップS28の処理により置換前画像として人201Aの顔画像が取得された場合、人201Aの顔画像に対応する置換後画像として顔画像241Pが取得される。
【0114】
ステップS31において、画像合成処理部127は、ステップS23の処理により検出された顔画像をステップS30の処理により取得された置換後画像に置換する。すなわち、人201Aの顔画像が顔画像241Pで置き換えられるように合成される。
【0115】
ステップS31の処理の後、ステップS24において顔が検出できなかったと判定された場合、およびステップS29において類似度の値の最小値が所定の閾値未満であると判定された場合、処理はステップS32に進む。
【0116】
ステップS32において、同期制御部128は、出力タイミングを設定する。すなわち、ステップS21の処理、および後述するステップS35の処理により取得されたフレーム画像と、ステップS22の処理により取得された音声の出力タイミングが同期される。
【0117】
ステップS33において、映像出力部104は、ステップS32の処理により設定された出力タイミングでフレーム画像を出力装置22に出力する。
【0118】
ステップS34において、音声出力部104は、ステップS32の処理により設定された出力タイミングで音声を出力装置22に出力する。
【0119】
すなわち、同期された出力タイミングでフレーム画像と音声が、出力装置22に出力される。例えば、ステップS31の処理により置換後画像が置き換えられた画像が表示部61に表示される。図11を参照して、置換後画像の表示について説明する。
【0120】
図11は、表示部61の出力の例を示す図である。図11の例では、図7Aの人201Aの顔の画像が、顔画像241Pに置き換えられている。このように、ユーザが置換前画像と置換後画像を対応付けることで、簡単に動画のコラージュを作成することができる。
【0121】
図10のステップS35において、映像フレームバッファメモリ103は、映像入力部102を介して、次のフレーム画像を取得する。ステップS35の処理の後、処理はステップS22に戻り、それ以降の処理が繰り返される。
【0122】
このように、画像再生装置23から出力される動画のコンテンツソースにメタデータ等が付加されていない場合でも、ユーザが簡単に動画のコラージュを視聴することができる。
【0123】
例えば、所定のコンテンツの任意の登場人物を、他の任意の人(例えば自分自身)に置き換えて、コンテンツを楽しむことができる。
【0124】
また、画像置換処理の時間が長くなる場合でも、入力された画像と音声を同期して出力するので、映像に対する音声のズレを補正(例えばリップシンク)することができる。従って、ユーザが置換された画像を違和感なく視聴することができる。
【0125】
[編集処理]
【0126】
次に、図12乃至図14を参照して、編集処理について説明する。図12は、編集処理を説明するフローチャートである。
【0127】
図12の編集処理は、編集モードの処理である。編集処理は、例えば、鑑賞モードが実行されている場合に、ユーザによりリモートコントローラ24の編集モードボタン143が操作されたとき、すなわちユーザにより編集が指示されたときに開始される。
【0128】
ステップS61において、取得部121は、対応定義情報を取得する。すなわち、図6のステップS11の処理により記憶された対応定義情報が、顔特徴登録DB108から読み出される。
【0129】
ステップS62において、映像出力部104は、表示装置22に対応定義情報を出力する。すなわち、ステップS61の処理により取得された対応定義情報が、表示装置22の表示部61に表示される。図13を参照して、表示部61に出力される対応定義情報の例を説明する。
【0130】
図13は、表示部61に出力される対応定義情報の例を示す図である。図13に示されるように、表示部61には、対応定義情報として置換前画像と置換後画像の組のリストが表示される。
【0131】
図13の例では、人201Aの顔画像と顔画像241Pの組、人201A’の顔画像と顔画像241P’の組、および人201Bの顔画像と顔画像241Rの組が表示されている。
【0132】
図12に戻り、ステップS63において、取得部121は、置換前画像と置換後画像の組を取得する。すなわち、ユーザの操作により選択された置換前画像と置換後画像の組が取得される。
【0133】
例えば、ユーザの操作により、図13のカーソル261および選択枠262が図中の上下に移動され、所定の置換前画像と置換後画像の組が選択される。
【0134】
表示部61の画面内にユーザが所望する置換前画像と置換後画像の組が無い場合、スクロール枠263が操作されることにより、他の置換前画像と置換後画像の組のリストが表示される。
【0135】
図12のステップS64において、判定部126は、置き換えが指示されたかを判定する。すなわち、ユーザの操作により図13の置き換えボタン264が選択されたかが判定される。
【0136】
ステップS64において、まだ置き換えが指示されていないと判定された場合、すなわち、まだ置き換えボタン264が選択されていない場合、ステップS65において、判定部126は、削除が指示されたかを判定する。すなわち、ユーザの操作により図13の削除ボタン265が選択されたかが判定される。
【0137】
ステップS64において、まだ削除が指示されていないと判定された場合、すなわち、まだ削除ボタン265が選択されていない場合、処理はステップS64に戻り、それ以降の処理が繰り返される。
【0138】
一方、ステップS65において、削除が指示されたと判定された場合、すなわち、削除ボタン265が選択された場合、処理はステップS66に進む。
【0139】
ステップS66において、編集部129は、選択された置換前画像と置換後画像の組を削除する。すなわち、対応定義情報(置換前画像と置換後画像の組のリスト)から、ステップS63の処理により取得された置換前画像と置換後画像の組が削除される。
【0140】
一方、ステップS64において、置き換えが指示されたと判定された場合、すなわち、置き換えボタン264が選択された場合、処理はステップS67に進む。
【0141】
ステップS67において、映像出力部102は、置換後画像候補を出力する。すなわち、出力装置22に置換後画像候補が出力される。図14を参照して、置換後画像候補について説明する。
【0142】
図14は、表示部61の出力の例を示す図である。図14の例では、置換前画像としての人210A’の顔画像と、置換後画像としての顔画像241P’の組が表示されている。
【0143】
また、プルダウンメニュー221により選択されたメモリカード51内に記憶された顔画像241P,241P’’,241Q,241Q’が表示されている。
【0144】
図12のステップS68において、取得部121は、新たな置換後画像を取得する。すなわち、図14の顔画像241P,241P’’,241Q,241Q’のうちからユーザが指定した任意の顔画像(例えば、顔画像241Q’)が取得される。
【0145】
ステップS69において、記憶部124は、置換前画像と新たな置換後画像を対応付けて記憶する。例えば、対応定義情報に記憶された人201A’の顔画像と顔画像241P’の組が、人201A’の顔画像と顔画像241Q’の組に更新される。
【0146】
ステップS66,S69の処理の後、ステップS70において、判定部126は、終了が指示されたかを判定する。ステップS70において、終了が指示されていないと判定された場合、処理はステップS62に戻り、それ以降の処理が繰り返される。
【0147】
一方、ステップS70において、終了が指示されたと判定された場合、図12の編集処理は終了する。
【0148】
このように、ユーザが登録された置換前画像と置換後画像の組を容易に編集(変更または削除)することができる。
【0149】
[その他]
【0150】
本明細書において、システムの用語は、複数の装置、手段などより構成される全体的な装置を意味するものとする。
【0151】
本技術の実施の形態は、上述した実施形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。また、本技術の実施の形態は、一部の機能を他の装置が有していても良い。
【0152】
なお、本実施の形態においては、画像から顔を検出し、顔画像を置換したが、置換する検出対象物は、顔に限らず、人や乗り物など画像から検出できるものであればよい。
【0153】
また、画像処理装置21、出力装置22、および画像再生装置23は、別々の装置ではなく一体化された1つの装置、または2つの装置(例えば、パーソナルコンピュータ)により構成することもできる。
【0154】
さらに、画像再生装置23により出力されるDVDやBDの動画の他、記憶部109等に記憶された動画や、インターネット等のネットワークを介して取得された動画(例えばストリーム再生される動画)に対しても適用することができる。
【0155】
なお、本技術は以下のような構成も取ることができる。
(1)画像から検出対象物を検出する検出部と、登録が指示された場合、前記検出部により検出された前記検出対象物の画像である前記置換前画像と、置換後画像とを対応付けた対応定義情報を記憶する記憶部と、置換が指示された場合、前記検出部により前記画像から前記検出対象物が検出されたとき、前記対応定義情報に基づいて、前記置換前画像を前記置換後画像に置換する画像合成処理部とを備える画像処理装置。
(2)前記置換前画像の特徴を検出する特徴検出部をさらに備え、前記記憶部は、前記置換前画像と前記特徴を対応付けた特徴対応表を記憶する前記(1)に記載の画像処理装置。
(3)前記置換が指示された場合、前記特徴検出部により検出された前記特徴と、前記特徴対応表に含まれる前記特徴の類似度を算出する算出部と、前記算出により算出された前記類似度に基づいて、前記特徴検出部により検出された前記特徴に最も類似する前記特徴を有する前記置換前画像を前記特徴対応表から取得するとともに、取得された前記置換前画像に対応する前記置換後画像を前記対応定義情報から取得する取得部とをさらに備え、前記画像合成処理部は、前記取得部により取得された前記置換後画像を用いて、前記置換前画像を置換する前記(2)に記載の画像処理装置。
(4)前記画像を保持する画像保持部と、前記画像に対応する音声を保持する音声保持部と、前記画像保持部に保持された前記画像と、前記音声保持部に保持された前記音声との出力タイミングを同期させるように制御する同期制御部とをさらに備える前記(1)から(3)のいずれかに記載の画像処理装置。
(5)前記取得部は、編集が指示された場合、前記対応定義情報に含まれる前記置換前画像と置換後画像の組を取得するとともに、新たな置換後画像を取得し、前記記憶部は、前記取得部により前記新たな置換後画像が取得された場合、前記置換前画像と前記新たな置換後画像を対応付けて記憶する前記(3)または(4)に記載の画像処理装置。
(6)前記検出対象物は、顔である前記(1)から(5)のいずれかに記載の画像処理装置。
(7)画像から検出対象物を検出する検出ステップと、登録が指示された場合、前記検出ステップの処理により検出された前記検出対象物の画像である前記置換前画像と、置換後画像とを対応付けた対応定義情報を記憶する記憶ステップと、置換が指示された場合、前記検出ステップの処理により前記画像から前記検出対象物が検出されたとき、前記対応定義情報に基づいて、前記置換前画像を前記置換後画像に置換する画像合成処理部とを含む画像処理方法。
【符号の説明】
【0156】
21 画像処理装置, 103 映像フレームバッファメモリ, 106 音声フレームバッファメモリ, 121 取得部, 122 顔検出部, 123 顔特徴検出部, 124 記憶部, 125 算出部, 127 画像合成処理部, 128 同期制御部

【特許請求の範囲】
【請求項1】
画像から検出対象物を検出する検出部と、
登録が指示された場合、前記検出部により検出された前記検出対象物の画像である置換前画像と、前記置換前画像と置換される画像である置換後画像とを対応付けた対応定義情報を記憶する記憶部と、
置換が指示された場合、前記検出部により前記画像から前記検出対象物が検出されたとき、前記対応定義情報に基づいて、前記画像の前記置換前画像を前記置換後画像に置換する画像合成処理部と
を備える画像処理装置。
【請求項2】
前記置換前画像の特徴を検出する特徴検出部をさらに備え、
前記記憶部は、前記置換前画像と前記特徴を対応付けた特徴対応表を記憶する
請求項1に記載の画像処理装置。
【請求項3】
前記置換が指示された場合、前記特徴検出部により検出された前記特徴と、前記特徴対応表に含まれる前記特徴の類似度を算出する算出部と、
前記算出により算出された前記類似度に基づいて、前記特徴検出部により検出された前記特徴に最も類似する前記特徴を有する前記置換前画像を前記特徴対応表から取得するとともに、取得された前記置換前画像に対応する前記置換後画像を前記対応定義情報から取得する取得部と
をさらに備え、
前記画像合成処理部は、前記取得部により取得された前記置換後画像を用いて、前記置換前画像を置換する
請求項2に記載の画像処理装置。
【請求項4】
前記画像を保持する画像保持部と、
前記画像に対応する音声を保持する音声保持部と、
前記画像保持部に保持された前記画像と、前記音声保持部に保持された前記音声との出力タイミングを同期させるように制御する同期制御部と
をさらに備える請求項3に記載の画像処理装置。
【請求項5】
前記取得部は、編集が指示された場合、前記対応定義情報に含まれる前記置換前画像と置換後画像の組を取得するとともに、新たな置換後画像を取得し、
前記記憶部は、前記取得部により前記新たな置換後画像が取得された場合、前記置換前画像と前記新たな置換後画像を対応付けて記憶する
請求項4に記載の画像処理装置。
【請求項6】
前記検出対象物は、顔である
請求項5に記載の画像処理装置。
【請求項7】
画像から検出対象物を検出する検出ステップと、
登録が指示された場合、前記検出ステップの処理により検出された前記検出対象物の画像である置換前画像と、前記置換前画像と置換される画像である置換後画像とを対応付けた対応定義情報を記憶する記憶ステップと、
置換が指示された場合、前記検出ステップの処理により前記画像から前記検出対象物が検出されたとき、前記対応定義情報に基づいて、前記画像の前記置換前画像を前記置換後画像に置換する画像合成処理部と
を含む画像処理方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate


【公開番号】特開2013−25525(P2013−25525A)
【公開日】平成25年2月4日(2013.2.4)
【国際特許分類】
【出願番号】特願2011−158957(P2011−158957)
【出願日】平成23年7月20日(2011.7.20)
【出願人】(000002185)ソニー株式会社 (34,172)
【Fターム(参考)】