説明

画像処理装置、画像処理方法、及びプログラム

【課題】音声が画像に対し遅れるシーンであっても、撮影動作のみで画像と音声のタイミングを一致させた音声付動画を得られるようにする。
【解決手段】撮影画像から対象とする特定の被写体の画像を検出するとともに、その対象の被写体から発生される音声を検出し、検出された対象の被写体の画像の変化を検出してその変化を基に、対象の被写体の画像と被写体から発生された音声との時間ずれを調整して画像及び音声を記録するようにして、撮影後に編集処理を行うことなく、画像と音声のタイミングを一致させた音声付動画を得ることができるようにする。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像処理装置、画像処理方法、及びプログラムに関し、詳しくは記録される画像と音声とのタイミングを調整する処理技術に関する。
【背景技術】
【0002】
例えば、花火等の音速と光速の差により音声が画像に対し遅れて記録されるシーンにおいて、画像と音声のタイミングを一致させた映画のような嗜好性のある動画像を得るには、ユーザーが撮影後に音合わせの編集処理を行って動画像を完成させる手法がある。従来の動画編集システムやインターフェースでは、音声を画像に同期させるには、例えば同期一覧表を予め手動で作成しておき、その後で同期一覧表を参照しながら画像出力と音声出力の同期をとるという手法がとられていた。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開平8−161499号公報
【特許文献2】特開平5−174147号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
前述の従来の編集方法では、画像と音声を同期させるための同期一覧表の設定には事前の人的作業を要するため、画像再生時に実時間で同期をとることはできない。すなわち、画像に同期する音声を、前もって同期一覧表に作成する段階で決定してしまうため、画像に応じた種々の音声を動的に選択して出力することができない。
【0005】
本発明は、このような事情に鑑みてなされたものであり、音声が画像に対し遅れて記録されるシーンにおいて、ユーザーが撮影後に編集処理を行うことなく、撮影動作のみで画像と音声のタイミングを一致させた音声付動画を得られるようにすることを目的とする。
【課題を解決するための手段】
【0006】
本発明に係る画像処理装置は、撮影画像から特定の被写体の画像を検出する画像検出手段と、前記画像検出手段により検出される前記被写体から発生される音声を検出する音声検出手段と、前記画像検出手段により検出された前記被写体の画像の変化を検出する画像変化検出手段とを有し、前記画像変化検出手段により検出された前記被写体の画像の変化に基づいて、前記被写体の画像と当該被写体から発生された音声との時間ずれを調整して前記画像及び前記音声を記録することを特徴とする。
本発明に係る画像処理方法は、撮影画像から特定の被写体の画像を検出する画像検出工程と、前記画像検出工程にて検出される前記被写体から発生される音声を検出する音声検出工程と、前記画像検出工程にて検出された前記被写体の画像の変化を検出する画像変化検出工程と、前記画像変化検出工程にて検出された前記被写体の画像の変化に基づいて、前記被写体の画像と当該被写体から発生された音声との時間ずれを調整して前記画像及び前記音声を記録する記録工程とを有することを特徴とする。
本発明に係るプログラムは、撮影画像から特定の被写体の画像を検出する画像検出ステップと、前記画像検出ステップにて検出される前記被写体から発生される音声を検出する音声検出ステップと、前記画像検出ステップにて検出された前記被写体の画像の変化を検出する画像変化検出ステップと、前記画像変化検出ステップにて検出された前記被写体の画像の変化に基づいて、前記被写体の画像と当該被写体から発生された音声との時間ずれを調整して前記画像及び前記音声を記録する記録ステップとをコンピュータに実行させることを特徴とする。
【発明の効果】
【0007】
本発明によれば、対象の被写体の画像の変化を基に、前記被写体の画像と当該被写体から発生された音声との時間ずれが調整され前記画像及び前記音声が記録される。これにより、音声が画像に対し遅れるシーンであっても、ユーザーが撮影後に編集処理を行うことなく、撮影動作のみで画像と音声のタイミングを一致させた音声付動画を得ることができる。
【図面の簡単な説明】
【0008】
【図1】本発明の実施形態における画像処理装置の構成例を示す図である。
【図2】本実施形態における撮影画像の一例を示す図である。
【図3】本実施形態における撮影画像の輝度レベルの一例を示す図である。
【図4】本実施形態における入力音声の一例を示す図である。
【図5】本実施形態における画像処理装置の処理動作の一例を示すフローチャートである。
【図6】本実施形態における画像処理装置の処理動作の他の例を示すフローチャートである。
【図7】本実施形態における画像処理装置を実現可能なコンピュータ機能を示すブロック図である。
【発明を実施するための形態】
【0009】
以下、本発明の実施形態を図面に基づいて説明する。
【0010】
図1は、本発明の一実施形態における画像処理装置の構成例を示すブロック図である。
本実施形態における画像処理装置は、モード検出部1、撮像部2、画像検出部3、画像変化検出部4、音声部5、音声検出部6、画像音声遅れ検出部7、及び音声補正部8を有する。
【0011】
モード検出部1は、設定されている機器の撮影モードを検出し、その撮影モードを基に撮影動作での被写体を何に限定しているか(注目する被写体として何を対象としているか)を検出する。また、モード検出部1は、検出結果に基づいて、対象の被写体を示す情報を含む被写体情報を画像検出部3及び音声検出部6に出力する。
【0012】
撮像部2は、撮影レンズ、撮像素子、制御IC等を含み、撮影画像の画像データを取得し出力する。
【0013】
画像検出部3は、撮像部2から得た画像データ(撮影画像)及びモード検出部1からの被写体情報に基づいて、被写体情報により示される対象とする特定の被写体の画像を撮影画像から検出する。すなわち、画像検出部3は、撮像部2からの撮影画像から撮影モードに応じた対象の被写体を特定して検出する。
【0014】
画像変化検出部4は、画像検出部3により検出された被写体の画像の変化を検出する。画像変化検出部4は、例えば、画像検出部3により検出された被写体の画像の大きさの変化、被写体の画像の明るさの変化、及び被写体の画像の移動の中の少なくとも1つを被写体の画像の変化として認識して検出する。そして、画像変化検出部4は、被写体の画像の変化を検出した時点で、画像変化タイミング信号を音声検出部6に出力し、検出画像(画像データ)を画像音声遅れ検出部7に出力する。
【0015】
音声部5は、マイク、スピーカー、音声処理IC等を含み、撮影動作において得られる音声の音声データを取得し出力する。
【0016】
音声検出部6は、音声部5から得た音声データ(音声)、画像変化検出部4からの情報、及びモード検出部1からの被写体情報に基づいて、被写体情報により示される対象とする特定の被写体から発生される音声を検出する。音声検出部6は、例えば音声の音圧レベルの変化及び周波数帯の少なくとも1つをパラメータとして、対象の被写体から発生される音声を検出する。例えば、音声検出部6は、モード検出部1からの被写体情報、すなわち撮影モードに応じて検出閾値を設定し、画像変化検出部4からの画像変化タイミング信号を同期信号にして、音声部5からの音声データから対象の被写体が発生する音声を検出する。そして、音声検出部6は、検出音声(音声データ)を画像音声遅れ検出部7に出力する。
【0017】
画像音声遅れ検出部7は、画像変化検出部4の検出結果及び音声検出部6の検出結果に基づいて、対象とする特定の被写体の画像とその被写体から発生される音声との時間ずれを検出する。例えば、画像音声遅れ検出部7は、画像変化検出部4からの検出画像及び音声検出部6からの検出音声から、被写体から発生される音声の被写体画像に対する遅れ量を検出し、音声補正部8に出力する。
【0018】
音声補正部8は、画像音声遅れ検出部7の検出結果に基づいて、対象とする特定の被写体の画像とその被写体から発生される音声との時間ずれを調整する。例えば、音声補正部8は、画像音声遅れ検出部7から得た被写体の画像に対する被写体の音声の遅れ量分、音声部5からの音声データを補正し、補正音声データを出力する。
【0019】
撮像部2から出力された画像データ(撮影画像)及び音声補正部8から出力された補正音声データ(補正された音声)は、図示しない記録部(記録媒体等)に記録される。ここで、補正音声データは、被写体の画像に対する被写体の音声の遅れ量分だけ補正された音声データであるので、対象とする特定の被写体の画像にその被写体から発生される音声を同期させて撮影画像及び音声が記録されることとなる。
【0020】
次に、本実施形態における画像処理装置での画像の検出動作、音声の検出動作、及び画像処理装置全体での処理動作について説明する。なお、以下では、撮影モードとして打ち上げ花火モードが設定されて、対象とする特定の被写体を打ち上げ花火とする場合を一例として説明するが、本発明はこれに限定されるものではない。すなわち、対象とする特定の被写体は打ち上げ花火のみに限られるものではない。本実施形態における画像処理装置は、飛行機等、対象の被写体が撮影を行っている場所から距離が離れた地点に存在し、画像に対して音声が遅れて到達するものを対象とし、対象の被写体に応じた各種撮影モードを備えるものとする。
【0021】
まず、対象とする特定の被写体の画像(本例では、打ち上げ花火画像)の検出動作について、図1〜図3を参照して説明する。
【0022】
図2(a)は、所定の時刻T1において、打ち上げられた花火を撮影した時に取得された画像を示す図である。図2(b)は、図2(a)に示した画像の拡大図であり、花火及びその周辺の部分を拡大して示している。なお、図2(b)において、縦軸は撮像範囲の垂直方向における位置を表す垂直位置Vを表し、横軸は撮像範囲の水平方向における位置を示す水平位置Hを表す。
【0023】
また、図3は、図2(b)に示した画像における輝度レベルを示す図である。なお、図3における縦軸は打ち上げ花火の輝度レベルYを表す。
【0024】
図2(a)及び図2(b)に示すように、打ち上げられた直後の花火400は、所定の時刻T1において取得されたフレームに画像として含まれる。図3に示すように、花火400の部分は、背景の部分の輝度Yxよりも輝度が高く、花火400の背景に対する輝度差はYaである。この後、花火400は、図2(a)において矢印に示すように上方に向かって移動し、時刻T1に続く時刻T2において取得される次のフレームでは、花火400の位置が移動する。
【0025】
画像検出部3は、各時刻で取得されたフレームにおいて、図3に示すような背景に対し輝度差Yaを有する被写体の画像(花火400)の領域を規定する被写体領域を取得する。具体的には、画像検出部3は、対象の被写体である花火400の水平方向における両端部の水平位置H1、H2に基づいて被写体の幅Haを特定するとともに、花火400の垂直方向における両端部の垂直位置V1、V5に基づいて被写体の高さVaを特定する。そして、画像検出部3は、特定された被写体の幅Ha及び高さVaで規定された領域を被写体領域として特定する。
【0026】
また、画像変化検出部4は、画像検出部3により特定された被写体領域に係る比較を行って被写体の画像の変化を検出する。例えば、画像変化検出部4は、背景に対する被写体の輝度差Yaが所定値Yx以上であるときに、対象の被写体、つまり開花した打ち上げ花火400であると特定するように構成されている。また、例えば、被写体の幅Haが所定値Hx以上であり、かつ高さVaが所定値Vx以上であることを、打ち上げ花火モード時において花火400を特定するための条件としてもよい。前記所定値Yxは、打ち上げ花火モード時の録画条件として、例えば予め測定した背景の輝度レベルにほぼ等しくなるように設定されている。また、前記所定値Hx、Vxは、予め測定した花火の画像に基づいて設定されている。なお、これらの設定値Hx、Vxはユーザーの所定の操作を介して変更することが可能なようにしても良い。
【0027】
次に、対象とする特定の被写体から発生される音声(本例では、打ち上げ花火音声)の検出動作について、図1及び図4を参照して説明する。
【0028】
図4は、打ち上げ花火の音声を含む音声データを表す図である。図4において、縦軸は音声レベル(音圧レベル)を表し、横軸は時間軸である。また、図4において、Txは、画像変化検出部4により開花した打ち上げ花火を検出した、つまり対象の被写体の画像の変化を検出したタイミングを示し、Dxは、打ち上げ花火の音声を認識する閾値レベルを示している。
【0029】
音声検出部6は、画像変化検出部4にて打ち上げ花火の開花が検出されたタイミングを画像変化タイミング信号により受信して、被写体から発生される音声、つまり打ち上げ花火の開花音の検出を開始する。検出開始後、音声検出部6は、入力音声が閾値Dx以上であるとき、入力音声が打ち上げ花火の開花音であると特定する。
【0030】
すなわち、音声検出部6は、時刻Tx以降において、閾値Dx以下であった入力音声の音声レベルが閾値Dx以上になったとき(時刻Ty)、打ち上げ花火の開花音が始まったと検出する。また、音声検出部6は、閾値Dx以上であった入力音声の音声レベルが閾値Dx以下となったとき(時刻Tz)、打ち上げ花火の開花音が終了したと検出する。
【0031】
また、音声検出部6は、FFT(高速フーリエ変換)により音声に係る周波数解析を行い、入力音声が特定の周波数帯であったときに打ち上げ花火の開花音であると特定するようにしてもよい。また、あわせて、入力音声の音声レベルの閾値と周波数帯は、撮影モードに応じて切り替えることが可能であり、その設定値はユーザーの所定の操作を介して変更することが可能なようにしても良い。
【0032】
次に、本実施形態における画像処理装置の処理動作について説明する。
図5は、本実施形態における画像処理装置の処理動作の一例を示すフローチャートである。
【0033】
まず、ステップS101にて、モード検出部1は動画撮影モードの検出を行う。モード検出部1により撮影モードが打ち上げ花火モードであることが検出されると、ステップS102にて、画像検出部3は、モード検出部1からの被写体情報を基に、検出の対象とする被写体が打ち上げ花火と夜空であることを検知する。そして、画像検出部3は、撮像部2から得た動画像にて対象とする特定の被写体の画像の検出を開始し、例えば撮像範囲(被写界)内で閾値以下の輝度の暗部、つまり夜空の検出をする。
【0034】
次に、ステップS103にて、画像変化検出部4は、画像検出部3での検出結果に基づいて、打ち上げ花火の開花を検出する。すなわち、このステップS103では、画像変化検出部4は、前述した打ち上げ花火画像の検出動作により、打ち上げ花火の開花を検出する。
【0035】
例えば、画像変化検出部4は、ステップS102において検出された暗部内で、閾値以上の輝度(明るさ)の変化があったとき、打ち上げ花火の開花と特定し(S103)、花火の開花タイミングとして記録する(S104)。なお、画像変化検出部4は、対象とする被写体の画像が所定の幅、高さ以上の大きさであったときに打ち上げ花火の開花と特定するようにしても良い。また、画像変化検出部4は、暗部内で閾値以上の輝度(明るさ)の変化があり、かつ対象とする被写体の画像が所定の幅、高さ以上の大きさであったときに打ち上げ花火の開花と特定するようにしても良い。
【0036】
ステップS105にて、音声検出部6は、ステップS104において記録された花火の開花タイミングをトリガにして、打ち上げ花火の開花音の検出を開始する。音声検出部6による打ち上げ花火の開花音の検出動作は、前述した打ち上げ花火音声の検出動作による。
【0037】
例えば、音声検出部6は、入力される音声の音圧レベルの変化が閾値以上であれば、その入力音声を打ち上げ花火の開花音として検出する。音声検出部6は、閾値Dx以下であった入力音声が閾値Dx以上になったときに打ち上げ花火の開花音が始まったと検出し、閾値Dx以上であった入力音声が閾値以下となったときに打ち上げ花火の開花音が終了したと検出する(S106)。その検出結果に基づいて、音声検出部6は、打ち上げ花火の音声のデータ開始タイミング及び打ち上げ花火の音声の音声データ区間を記録する(S107)。
【0038】
なお、音声検出部6は、入力される音声が所定の周波数帯である場合に、その入力音声を打ち上げ花火の開花音であると特定するようにしても良い。また、音声検出部6は、入力される音声の音圧レベルの変化が閾値以上であり、かつ入力される音声が所定の周波数帯である場合に、その入力音声を打ち上げ花火の開花音であると特定するようにしても良い。
【0039】
ステップS108にて、画像/音声遅れ検出部7は、打ち上げ花火の開花の画像に対する打ち上げ花火の開花の音声の遅延量を検出する。次に、ステップS109にて、音声補正部8は、ステップS108において検出された遅れ量と、ステップS107において記録された打ち上げ花火の音声の音声データ区間を基に、音声データを補正する。前述のようにして、打ち上げ花火の開花の画像に打ち上げ花火の開花の音声を同期させることにより、打ち上げ花火の開花の画像と音声のタイミングを一致させて、音声付動画として図示しない記録部(記録媒体等)に記録される。
【0040】
その後、画像処理装置は、撮影モードが切り替えられたら処理動作を終了し、撮影モードが切り替えられなかったら、ステップS103に戻って、引き続き前述したステップS103〜S109までの動作を行う(S110)。
【0041】
次に、本実施形態における画像処理装置の処理動作の他の例について説明する。以下に説明する処理動作は、打ち上げ花火が連続で打ち上げられた場合の処理動作である。
図6は、本実施形態における画像処理装置の処理動作の他の例を示すフローチャートである。
【0042】
ステップS201〜S203の動作は、図5に示した打ち上げ花火が単発で打ち上げられた場合のステップS101〜S103の動作と同様である。ステップS203に続いて、画像変化検出部4は、花火の開花タイミングを回数も含めて記録する(S204)。
【0043】
音声検出部6は、花火の開花タイミングが何回目であるかを確認し(S205)、一回目であれば花火の開花タイミングをトリガにして、打ち上げ花火の開花音の検出を開始する(S209)。一方、音声検出部6は、花火の開花タイミングが2回目以上であれば、一つ前の花火の開花音タイミング(花火の開花音に係る音声データの開始タイミングやデータ区間)が記録されているか否かを確認する(S206)。その結果、音声検出部6は、一つ前の花火の開花音タイミングが記録されていれば打ち上げ花火の開花音の検出を開始し(S209)、そうでなければ一つ前の花火の開花音タイミングの記録が確認されるまで待機する。
【0044】
また、画像処置装置は、ステップS204での花火の開花タイミング記録後、撮影モードが切り替えられなかったら(S207の花火モード)、ステップS203に戻って、引き続きステップS203からの花火の開花の検出動作を繰り返す。一方、撮影モードが切り替えられたら(S207のモード変更)、花火の開花の検出動作を終了して開花検出動作の終了を記録する(S208)。
【0045】
ステップS209〜S210の動作は、図5に示した打ち上げ花火が単発で打ち上げられた場合のステップS105〜S106の動作と同様である。ステップS210に続いて、音声検出部6は、打ち上げ花火の開花音のデータ開始タイミング及び打ち上げ花火の開花音の音声データ区間と、かつ何回目の開花音であるかを示す回数を記録する(S211)。
【0046】
そして、開花検出動作の終了の記録がなければ(S212のNo)、ステップS203に戻り、開花検出動作の終了の記録があれば(S212のYes)、開花音の検出動作を終了する(S213)。
【0047】
また、画像音声遅れ検出部7は、n回目の打ち上げ花火の開花の画像に対するn回目の打ち上げ花火の開花の音声の遅延量を検出する(S214)。音声補正部8は、ステップS214において検出された遅れ量と、ステップS211において記録された打ち上げ花火の音声の音声データ区間を基に、音声データを補正する(S215)。このようにして、打ち上げ花火の開花の画像に打ち上げ花火の開花の音声を同期させることにより、打ち上げ花火の開花の画像と音声のタイミングを一致させて、音声付動画として図示しない記録部(記録媒体等)に記録される。
【0048】
その後、画像処理装置は、撮影モードが切り替えられたら処理動作を終了し、撮影モードが切り替えられなかったら、ステップS203に戻って、引き続き前述したステップS203以降の動作を行う(S216)。
【0049】
以上のように、本実施形態における画像処理装置は、撮影により得られる画像データに対して音声データを合わせこむ際に、合わせ込むタイミングを画像処理にて判断する。前述したように本実施形態における画像処理装置は、画像変化検出部4にて検出した対象とする被写体の画像の変化タイミングに対し、音声検出部6にて検出した対象の被写体から発生された音声に補正をかける。これにより、対象の被写体の画像とその被写体から発生された音声との時間ずれが調整されて画像及び音声が記録される。したがって、音声が画像に対して遅れるシーンであっても、ユーザーが撮影後に手動で面倒な編集処理等を行うことなく、撮影動作のみで、画像と音声のタイミングを一致させた映画のような嗜好性のある音声付動画を得ることができる。なお、撮影モードが打ち上げ花火モードであることを前提として説明を行ったが、他の撮影モードにおいても同様な処理を行うことができる。例えば、対象とする特定の被写体が飛行機である飛行機モードを選択した場合は、撮像範囲内から輝度が高く、かつ、その輝度分布が一様な空の検出を行い、その中を直線的に横切る被写体を検出する。そして、検出した飛行機が画面内にいる間に音圧レベルが最大となるように音声データの遅延量を求めるようにすればよい。
【0050】
(本発明の他の実施形態)
前述した実施形態の機能を実現するべく各種のデバイスを動作させるように、該各種デバイスと接続された装置又はシステム内のコンピュータ(CPU又はMPU)に対し、前記実施形態の機能を実現するためのソフトウェアのプログラムを供給する。そして、そのシステム又は装置のコンピュータに格納されたプログラムに従って前記各種デバイスを動作させることによって実施したものも、本発明の範疇に含まれる。
また、この場合、前記ソフトウェアのプログラム自体が前述した実施形態の機能を実現することになり、そのプログラム自体は本発明を構成する。また、そのプログラムをコンピュータに供給するための手段、例えばかかるプログラムを格納した記録媒体は本発明を構成する。かかるプログラムを記憶する記録媒体としては、例えばフレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、磁気テープ、不揮発性のメモリカード、ROM等を用いることができる。
また、供給されたプログラムがコンピュータにて稼働しているオペレーティングシステム又は他のアプリケーションソフト等と共同して前述の実施形態の機能が実現される場合にもかかるプログラムは本発明の実施形態に含まれることは言うまでもない。
さらに、供給されたプログラムがコンピュータに係る機能拡張ボードや機能拡張ユニットに備わるメモリに格納された後、そのプログラムの指示に基づいてその機能拡張ボード等に備わるCPU等が実際の処理の一部又は全部を行う。その処理によって前述した実施形態の機能が実現される場合にも本発明に含まれることは言うまでもない。
【0051】
例えば、前述した実施形態に示した画像処理装置は、図7に示すようなコンピュータ機能700を有し、そのCPU701により前述した実施形態での動作が実施される。
コンピュータ機能700は、図7に示すように、CPU701と、ROM702と、RAM703とを備える。また、操作部(CONS)709のコントローラ(CONSC)705と、CRTやLCD等の表示部としてのディスプレイ(DISP)710のディスプレイコントローラ(DISPC)706とを備える。さらに、ハードディスク(HD)711、及びフレキシブルディスク等の記憶デバイス(STD)712のコントローラ(DCONT)707と、ネットワークインタフェースカード(NIC)708とを備える。それら機能部701、702、703、705、706、707、708は、システムバス704を介して互いに通信可能に接続された構成としている。
CPU701は、ROM702又はHD711に記憶されたソフトウェア、又はSTD712より供給されるソフトウェアを実行することで、システムバス704に接続された各構成部を総括的に制御する。すなわち、CPU701は、前述したような動作を行うための処理プログラムを、ROM702、HD711、又はSTD712から読み出して実行することで、前述した実施形態での動作を実現するための制御を行う。RAM703は、CPU701の主メモリ又はワークエリア等として機能する。
CONSC705は、CONS709からの指示入力を制御する。DISPC706は、DISP710の表示を制御する。DCONT707は、ブートプログラム、種々のアプリケーション、ユーザファイル、ネットワーク管理プログラム、及び前述した実施形態における前記処理プログラム等を記憶するHD711及びSTD712とのアクセスを制御する。NIC708はネットワーク713上の他の装置と双方向にデータをやりとりする。
【0052】
なお、前記実施形態は、何れも本発明を実施するにあたっての具体化のほんの一例を示したものに過ぎず、これらによって本発明の技術的範囲が限定的に解釈されてはならないものである。すなわち、本発明はその技術思想、又はその主要な特徴から逸脱することなく、様々な形で実施することができる。
【符号の説明】
【0053】
1 モード検出部
2 撮像部
3 画像検出部
4 画像変化検出部
5 音声部
6 音声検出部
7 画像音声遅れ検出部
8 音声補正部

【特許請求の範囲】
【請求項1】
撮影画像から特定の被写体の画像を検出する画像検出手段と、
前記画像検出手段により検出される前記被写体から発生される音声を検出する音声検出手段と、
前記画像検出手段により検出された前記被写体の画像の変化を検出する画像変化検出手段とを有し、
前記画像変化検出手段により検出された前記被写体の画像の変化に基づいて、前記被写体の画像と当該被写体から発生された音声との時間ずれを調整して前記画像及び前記音声を記録することを特徴とする画像処理装置。
【請求項2】
前記画像変化検出手段により検出された前記被写体の画像が変化したタイミングを基に、前記被写体の画像に当該被写体から発生された音声を同期させて記録することを特徴とする請求項1記載の画像処理装置。
【請求項3】
前記音声検出手段での検出結果及び前記画像変化検出手段での検出結果に基づいて、前記被写体の画像に対する当該被写体から発生された音声の遅れを検出する遅れ検出手段と、
前記遅れ検出手段により検出された遅れに応じて音声を補正する音声補正手段とを有することを特徴とする請求項1又は2記載の画像処理装置。
【請求項4】
前記音声検出手段は、音圧レベル及び周波数帯の少なくとも1つに基づいて、前記被写体から発生される音声を検出することを特徴とする請求項1〜3の何れか1項に記載の画像処理装置。
【請求項5】
前記音圧レベルの閾値及び前記周波数帯を撮影モードに応じて設定することを特徴とする請求項4記載の画像処理装置。
【請求項6】
前記画像検出手段は、撮影モードに応じて前記被写体を特定し検出することを特徴とする請求項1〜5の何れか1項に記載の画像処理装置。
【請求項7】
前記画像変化検出手段は、前記被写体の画像の大きさの変化、前記被写体の画像の明るさの変化、及び前記被写体の画像の移動の少なくとも1つを前記被写体の画像の変化として検出することを特徴とする請求項1〜6の何れか1項に記載の画像処理装置。
【請求項8】
撮影画像から特定の被写体の画像を検出する画像検出工程と、
前記画像検出工程にて検出される前記被写体から発生される音声を検出する音声検出工程と、
前記画像検出工程にて検出された前記被写体の画像の変化を検出する画像変化検出工程と、
前記画像変化検出工程にて検出された前記被写体の画像の変化に基づいて、前記被写体の画像と当該被写体から発生された音声との時間ずれを調整して前記画像及び前記音声を記録する記録工程とを有することを特徴とする画像処理方法。
【請求項9】
撮影画像から特定の被写体の画像を検出する画像検出ステップと、
前記画像検出ステップにて検出される前記被写体から発生される音声を検出する音声検出ステップと、
前記画像検出ステップにて検出された前記被写体の画像の変化を検出する画像変化検出ステップと、
前記画像変化検出ステップにて検出された前記被写体の画像の変化に基づいて、前記被写体の画像と当該被写体から発生された音声との時間ずれを調整して前記画像及び前記音声を記録する記録ステップとをコンピュータに実行させるためのプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2010−246026(P2010−246026A)
【公開日】平成22年10月28日(2010.10.28)
【国際特許分類】
【出願番号】特願2009−95122(P2009−95122)
【出願日】平成21年4月9日(2009.4.9)
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】