説明

再生装置及びその制御方法

【課題】 画像とともに楽曲を再生可能な再生装置及びその制御方法において、画像に応じた楽曲を、切り替わりが頻繁にならないように再生可能とする。
【解決手段】 記録媒体に記録され、検出された被写体の特徴を表す特徴値が所定時間ごとに対応付けられた画像データを、楽曲と共に再生する際に、所定数の特徴値の統計値に基づいて特徴値を選択し、選択された特徴値に関連付けられた楽曲を画像と共に再生する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像と音楽を同時に再生する再生装置及びその制御方法に関する。
【背景技術】
【0002】
現在のデジタルカメラやデジタルフォトフレーム等の中には、静止画像を連続再生(スライドショー再生)する際に、楽曲をBGMとして音楽再生するものがある。また、ビデオカメラ等においても、動画像を再生する際に、動画像の音声に、楽曲を混合してBGMとして再生するものもある。
【0003】
このような装置では、ユーザがあらかじめ選択した楽曲を再生するが、再生している動画像の雰囲気とユーザの選択した楽曲の雰囲気とが合わない場合もあった。そのような場合、ユーザが楽曲を選択し直す必要があり、操作が煩雑であった。
【0004】
一方で、画像の内容に応じた楽曲を再生する方法も提案されている。例えば、特許文献1の画像再生装置は、演奏音楽を自動的に選定する自動選択が選択されたときには、再生するフィルムのフォーマット(パノラマ撮影、通常撮影)、被写体距離等のフィルム情報に基づいて画像に合った曲を自動的に選定するものである。
また、特許文献2の画像表示装置は、被写体画像中の人物の顔表情や年代、性別に相応しい楽曲を選択するものである。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開平06−289863号公報
【特許文献2】特開2010−226484号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、上記従来例では、画像が切り替わるごとに楽曲も切り替わるため、特に画像が頻繁に切り替わる動画像を再生すると楽曲が細切れに再生され、視聴者が落ち着いて画像鑑賞できない。
【0007】
本発明はこのような従来技術の課題を解決し、画像とともに楽曲を再生可能な画像再生装置及びその制御方法において、画像に応じた楽曲を、切り替わりが頻繁にならないように再生可能とすることを目的とする。
【課題を解決するための手段】
【0008】
上述した課題を達成するため、本発明の再生装置は、記録媒体に記録され、所定時間毎に検出された被写体の特徴を表す特徴値に対応付けられた画像データを、楽曲と共に再生する再生装置であって、前記特徴値と関連づけられた楽曲を記憶するメモリと、前記画像データと共に再生する楽曲を、前記特徴値に従って自動的に選択する選択手段と、前記画像データを、前記選択手段が選択した楽曲と共に再生する再生手段とを有し、前記選択手段は、前記画像データの再生位置が含まれる前記所定時間に対応付けられた前記特徴値を含む、複数の前記所定時間に関連付けられた複数の特徴値の統計値を算出し、該統計値に従って1つの特徴値を選択し、該選択された特徴値に関連付けられた楽曲を選択することを特徴とする。
【発明の効果】
【0009】
本発明によれば、画像とともに楽曲を再生可能な再生装置及びその制御方法において、画像に応じた楽曲を、切り替わりが頻繁にならないように再生可能とすることができる。
【図面の簡単な説明】
【0010】
【図1】本発明の実施形態に係る再生装置の一例としての撮像装置の構成例を示すブロック図
【図2】動画ファイルの説明図
【図3】音楽ファイルの説明図
【図4】音楽選択処理のフローチャート
【図5】音楽選択処理の説明図
【図6】スコア計算処理のフローチャート
【図7】スコア計算処理の説明図
【図8】動画ファイルの別の実施形態の説明図
【図9】スコア計算処理の別のフローチャート
【発明を実施するための形態】
【0011】
<第1の実施形態>
以下、図面を参照して本発明の第1の実施形態を説明する。図1は、本実施形態に係る再生装置の一例としての撮像装置100の構成例を示すブロック図である。本実施形態では、画像の撮像及び記録を行うための構成を有する撮像装置に本発明を適用した例を説明するが、撮像および記録を行うための構成は本発明に必須ではない。本発明は、記録済みの画像を再生することが可能な任意の装置に対して適用可能である。このような装置の例としては、パーソナルコンピュータ、メディアプレーヤ、携帯電話機などが含まれる。
【0012】
(撮像装置の構成)
制御部101は、例えばCPU(MPU)、メモリ(DRAM、SRAM、ROM)等からなる。制御部101は各種処理(プログラム)を実行して撮像装置100の各ブロックを制御したり、各ブロック間でのデータ転送を制御したりして、以下に説明する撮像装置100の機能を実現する。制御部101は、CPUやメモリからなるマイクロコンピュータであってもよい。制御部101は、複数の処理(プログラム)を並行して実行することができる。これはCPUの処理時間を時分割して、実行する処理(プログラム)を切り替えることによる、見かけ上の並列処理であってもよいし、複数のCPUを用いて実際に並列処理してもよい。
【0013】
また、制御部101は、ユーザから操作を受け付ける操作部102からの操作信号に応じて、撮像装置100の各ブロックを制御する。操作部102は、例えば電源ボタン、メニュー表示ボタン、決定ボタン、その他カーソルキー、ポインティングデバイス、タッチパネル等からなり、ユーザによりこれらのキーやボタンが操作されると制御部101に操作信号を送信する。また、操作部102は、記録開始ボタン、ズーム調整ボタン、オートフォーカスボタン等の撮影に関連する各種操作を入力するスイッチ類を持つこともある。
【0014】
また、バス103は各種データ、制御信号、指示信号等を撮像装置100の各ブロックに送るための汎用バスである。
【0015】
まず、本実施形態における画像記録手段について説明する。撮像部110は着脱式であってよいレンズが生成する被写体の光学像を、絞りにより光量を制御して、CCDセンサやCMOSセンサ等の撮像素子により画像信号に変換し、アナログデジタル変換をして、画像処理部111に送る。
【0016】
画像処理部111は、画像の記録再生に必要な処理を実行する。画像処理部111はマイクロコンピュータによりソフトウェア的に処理を実行してもよい。従って、制御部101を構成するマイクロコンピュータが画像処理部111の少なくとも一部の機能を実行してもよい。画像処理部111の処理は、撮像部110から取得したデジタル画像信号を一時的に不図示のメモリに記憶し、ホワイトバランスや色、明るさなどを設定に基づいて調整する画質調整処理を含む。
【0017】
また、画像処理部111の処理は画質調整処理された複数のフレームの画像信号から動画データを生成する処理も含んでいる。この処理は、動画データの各フレームをフレーム内符号化する方式で圧縮された動画データを生成してもよい。また、動画データの複数フレーム間での差分や動き予測等を利用した方式で圧縮符号化された動画データを生成してもよい。例えば、MotionJPEG,MPEG、H.264(MPEG4−Part10:AVC)等の様々な公知の圧縮符号化方式を用いて動画データを生成しても良い。これら公知の圧縮符号化方式の詳細は、本発明の特徴とは関係ないので説明を省略する。画像処理部111で処理された動画データは制御部101によりメモリ104に送信される。
【0018】
音声入力部120は、例えば内蔵された無指向性のマイクまたは音声入力端子を介して接続された外部マイク等により、撮像装置100の周囲の音声を収音(集音)し、取得したアナログ音声信号をデジタル信号に変換して音声処理部121に送信する。
【0019】
音声処理部121は、音声の記録再生に必要な処理を実行する。音声処理部121はマイクロコンピュータによりソフトウェア的に処理を実行してもよい。従って、制御部101を構成するマイクロコンピュータが音声処理部121の少なくとも一部の機能を実行してもよい。音声処理部121の処理は、音声入力部120から送信されたデジタル音声信号を一時的に不図示のメモリに記憶し、レベルの適正化処理や雑音低減処理等の音声に関する処理を含む。また、音声処理部121は必要に応じて、音声信号を圧縮する処理を行う。音声処理部121で処理された音声データは制御部101によりメモリ104に送信される。
【0020】
また、表示制御部131は、表示部130に画像を表示するための表示制御を行う。表示制御部131はマイクロコンピュータによりソフトウェア的に処理を実行してもよい。従って、制御部101を構成するマイクロコンピュータが表示制御部131の少なくとも一部の機能を実行してもよい。表示制御部131は、画像処理部111に一時的に記憶されたデジタル画像信号を読み出して、表示部130に表示させる。表示部130は、例えば撮像装置100に搭載された液晶パネルや有機ELパネル等であっても良いし、撮像装置100とは別の外部表示装置(例えば、テレビ、モニタ、プロジェクタ)であってもよい。
【0021】
メモリ104は、画像処理部111、音声処理部121により得られた動画データ、音声データ等を一時的に記憶する。
制御部101は、例えばメモリ104より動画データ、音声データ等を読み出して記録再生部140に転送し、記録再生部140は転送された動画データと音声データを記録媒体141に対して一つの動画ファイルとして記録する。また、撮影時のカメラ設定や、検出データ等を示す各種データを制御部101が生成し、動画データ、音声データと共に記録再生部140により記録媒体141に記録させてもよい。ここで、記録媒体141は、撮像装置100に内蔵された記録媒体でもよいし、取り外し可能な記録媒体でもよい。例えば、記録媒体141はハードディスク、光ディスク、光磁気ディスク、CD−R、DVD−R、磁気テープ、不揮発性の半導体メモリ、フラッシュメモリ等のあらゆる方式の記録媒体を含む。
【0022】
また、記録再生部140は、制御部101の指示に従い、記録媒体141に記録されている動画ファイルを読み出し、動画データ及び音声データを再生する。記録再生部140における動画再生処理については後で詳細に説明する。
【0023】
(動画ファイルの構造)
図2を用いて記録媒体に記録される動画ファイルの構造について説明する。図2(a)は、動画ファイルの構造の例である。画像処理部111は、撮影時に所定時間毎(時刻T1、T2、・・・、TN、・・・)に画像から特徴を検出して、特徴値として制御部101に送信する。制御部101は、特徴値を動画データ、音声データと共に記録再生部140に転送する。記録再生部140は、特徴値を特徴値が検出された画像データに対応付けて記録媒体141に記録する。記録再生部140は例えば、図2(a)のように、特徴値を、特徴値を検出したフレーム(時刻)の動画データ、音声データに付加する形で一つの動画ファイルに記録してもよい。あるいは、動画ファイルとは別のファイルとして、特徴値をフレーム番号(または時刻等)と共に記録してもよい。
【0024】
特徴値を検出する所定時間の間隔は、ユーザが視認できる程度の時間、例えば1秒でもよいし、撮像装置100の処理負荷に余裕があれば、さらに短くてもよい。再生時に特徴値を間引いて読み出してもよい。
【0025】
特徴値としては、例えば顔認識情報が考えられる。図2(b)のようにフレーム中の主顔の人物を顔認識し、人物を特定する顔認識値を特徴値として記録する。顔認識は、公知の方法を用いることができ、顔認識方法は本発明の特徴とは関係ないので、その詳細についての説明を省略する。別の特徴値としては、例えば表情認識情報が考えられる。図2(c)のようにフレーム中での主顔の表情を認識し、その表情を特定する顔表情値を特徴値として記録する。表情認識は、公知の方法を用いることができ、表情認識方法は本発明の特徴とは関係ないので、その詳細についての説明を省略する。また、ここで言う主顔とは、例えば撮影された顔の面積が一番大きい顔でもよいし、ユーザが複数の顔から選択したものでもよい。
【0026】
(画像再生動作)
次に、本実施形態の画像再生動作について説明する。例えば、記録媒体141に記録されている動画ファイルについて、操作部102を通じてユーザから再生指示が入力されると、制御部101は指定された動画ファイルの動画データ、音声データを記録媒体141から読み出すように記録再生部140を制御する。
【0027】
記録再生部140は、読み出した動画データを画像処理部111へ、音声データを音声処理部121に転送する。画像処理部111は再生した動画データの1フレームの画像を順次、不図示のメモリに記憶する。そして、表示制御部131は不図示のメモリに記憶された1フレームの画像を順次読み出して、表示部130に表示させる。一方、音声処理部121は、再生した音声データからデジタル音声信号を復元し、音声出力部122(スピーカー、イヤホン端子、音声出力端子等)に出力する。
【0028】
また、制御部101は動画と音声の再生中に、動画ファイルとは別に記録媒体141に記録された音楽ファイルを再生する。例えば、図3(a)は、記録媒体141に記録されている音楽ファイルのディレクトリ構造とファイル名の例である。また、音楽ファイルは動画ファイルと異なる記録媒体に記録されていてもよい。例えば、動画ファイルは着脱可能なメモリカードに記録され、音楽ファイルは内蔵ROM等の不揮発性メモリーに記録されていてもよい。なお、記録再生部140は、動画ファイル及び音楽ファイルを任意の場所及び方法で取得可能である。例えば有線もしくは無線通信を利用して外部装置から取得してもよい。
【0029】
制御部101は、音楽ファイルから音楽データを読み出すように記録再生部140を制御する。記録再生部140は読み出した音楽データを音声処理部121に転送する。音声処理部121は、動画ファイルから再生した音声データに音楽ファイルから再生した音楽データを混合して音声出力部122に出力する。音声データと音楽データの混合比に関しては、制御部101が、例えばユーザがあらかじめ設定した値をSRAM等に保持しておき、その値を音声処理部121に送信してもよい。
【0030】
再生する音楽ファイルは、制御部101が動画ファイルから特徴値を読み出すよう記録再生部140を制御し、特徴値に予め関連付けられた音楽ファイルを制御部101が選択する。これにより、ユーザの手間を省きながら、画像にマッチした音楽ファイルを自動で選択することができる。ユーザが音楽ファイルを選択することも可能であるが、その場合には特徴値及びその変化とは無関係にユーザが選択した音楽ファイルを再生する。
【0031】
図3(b)は、特徴値と音楽ファイルとの関連付けの例を示す。ここでは、テーブルの形式で特徴値と音楽ファイルとの関連付けを保持する例を示している。制御部101は、このようなテーブルを予めSRAM等に保持しておき、読み出した特徴値を用いてテーブルを検索し、関連付けられた音楽ファイル名を抽出する。上述のように特徴値は特定の周期で検出したものであるから、動画の再生が進行すると場面の変化などに応じて変化し、特徴値の変化に応じて制御部101が選択する音楽ファイルも変更される。再生する音楽ファイルの変更の仕方については後述する。音楽ファイルが変更された場合、ユーザに違和感を与えないように音楽を出力する。制御部101は再生中の音楽の音量を徐々に下げながら(フェードアウト)、次に再生する音楽の徐々に音量を上げて(フェードイン)再生しながら音楽を切り替えるよう音声処理部121を制御してもよい。
【0032】
(音楽ファイルの変更方法)
図4は本実施形態において制御部101が行う音楽ファイルの選択(変更)動作を説明するフローチャートである。制御部101が音楽選択処理の各ステップを実行する。
【0033】
また、図5は音楽ファイルの選択(変更)動作の具体例を説明する図である。本実施形態において制御部101は、RAM等に特徴値を保持しておくためのバッファを持ち、このバッファはリングバッファとして構成されているものとする。以下では、リングバッファの各要素をFj(j=1,・・・,N)、リングバッファの最後尾を示すポインタをpとする。また、動画中の時刻(またはフレーム番号)をTi(i=1,・・・)として、現在の動画の再生位置をiで表記する。なお、Nは2以上の整数であるが、値が少ないと後述するスコアの値が特徴値の変化の影響を受けやすくなるため、ある程度の時間(例えば10秒に相当する値)以上に設定する。
【0034】
まず、S401で制御部101は、時刻T1からTNまでの特徴値を読み込むよう記録再生部140を制御して、読み込んだ特徴値をリングバッファFjに保持する。なお、特徴値が図2(a)に示したように動画ファイルに記録されている場合には、動画データ及び音声データとともに特徴値を読み込んでメモリ104に保存しておき、メモリ104から時刻T1からTNまでの特徴値を取得してもよい。次に、S402で制御部101は、動画の再生位置iを1に、リングバッファのポインタpをNに初期化する。
【0035】
S403で、制御部101はリングバッファの内容に基づいて特徴値毎の得点(スコア)を算出する。スコアを算出する計算手順に関しては後述するが、基本的にはリングバッファに格納された特徴値の出現回数に重み付けをして計算している。図5(a)は、時刻T1の時点でのリングバッファの内容とこのリングバッファの内容に対応した各特徴値fのスコアSの計算結果を図示したものである。
【0036】
S404で制御部101は、スコアが最大となった特徴値を探索し、その特徴値をRAM等に変数FTOPとして保持する。図5(a)の例では、特徴値fAのスコアSが15で最大であるため、制御部101はFTOP(F1)にfAを保持する。ここで、例えば、人物が一人もいなくなった場合や、スコアSが全て等しい場合などは、例外状態としてFTOPに0を格納してもよい。
【0037】
S405で制御部101は、スコアSが最大(他のスコアの何れよりも大きい)の特徴値があるか否かを、FTOPの値によって判断し、値が0でない場合はS406に進む。FTOP値が0の場合制御部101はS411に進み、音楽ファイルの変更を行わない。これは、例えば人物が一人もいなくなった場合や、スコアSが全て等しい場合は、同じ音楽ファイルを再生し続けるということを意味する。また、本フローチャートで不図示だが、FTOPの値が0の場合にはあらかじめユーザが選択した音楽ファイルに切り替えてもよい。
【0038】
S406で制御部101は、FTOPの値を、前回の処理時におけるFTOPの値を保持する変数FPREVの値と比較し、FTOPが前回と異なるかどうか判断し、値が異なる場合はS407に進む。FTOPの値が同じ間は制御部101はS411に進み、音楽ファイルの変更は行わない。
【0039】
S407で制御部101は、現在再生中の音楽の再生位置を保存する。これは、制御部101が例えばRAM等に音楽ファイル毎に再生位置を保持するテーブルを持つことで実現できる。これにより、同じ音楽ファイルが再度選択される場合に、前回の再生終了位置から再生を開始することができる。
【0040】
S408で制御部101は、FTOPの特徴値に対応する音楽ファイル名をテーブルから読み込む。例えばFTOPの特徴値がfAの場合制御部101は、図3(b)のテーブルに従えば”MUSIC01.WAV”を読み込む。
S409で制御部101は、音楽ファイルの再生位置を保持するテーブルから、次に再生する(切替先の)音楽ファイル名MUSIC01の再生位置を読み出す。
【0041】
S410で制御部101は、切替先の音楽ファイル名の再生位置から音楽データを読み込むよう記録再生部140を制御し、読み込まれた音楽データを再生のために音声処理部121に転送し再生を指示する。
【0042】
S411で制御部101は、FTOPの値を、前回の値を保持しておくための変数FPREVにコピーする。
S412で制御部101は、次の時刻Ti+1におけるスコアSを算出するために、リングバッファの時刻を示す変数iを1つインクリメントすると同時に、リングバッファのポインタpの値も1インクリメントする。例えば、iが1のときはiは2に変化する。ただし、ポインタpの値がNの場合はインクリメントによりリングバッファの先頭の1に戻す。
【0043】
次に、i=2のとき、S413で制御部101は、動画の再生が次の時刻T2になるまでの間、音楽選択処理と並行して時刻T1からの動画再生の処理を実行している。前述したように制御部101は動画ファイルから動画データ、音声データを読み込むよう記録再生部140を制御して、読み込んだ動画データ及び音声データをそれぞれ画像処理部111、音声処理部121に転送している。そして、制御部101は、現在再生中の画像に関する時刻Ti(またはフレーム番号)を監視し、転送した画像データの時刻Ti(またはフレーム番号)がT2になったかどうかを判断する。時刻がT2になった場合、制御部101はS414に進み、時刻T2+Nの特徴値をリングバッファのポインタが示すFpに読み込む。そして、制御部101は、操作部102から動画像の再生終了指示が入力されているか、動画像が最後まで再生された場合には音楽選択処理を終了する(S415,YES)。
【0044】
一方、再生終了指示が入力されておらず、動画像を最後まで再生してもいない場合(S415,NO)、制御部101はS403に戻り、T2からT2+Nの各特徴値に基づきスコアSを再計算する。制御部101は再計算したスコアSに基づいて次に再生する音楽を自動的に選択し、撮像装置100は時刻T2の動画データと音声データを、選択した音楽と共に再生する。このように、本実施形態においては、個々の特徴値ではなく、時刻Ti+1からTi+NのN個の特徴値の統計値に基づいて再生する音楽を自動的に選択する。そのため、被写体の一時的な変化(例えば主被写体が一時的に画面から出て戻ってきた場合など)に応じて、選択される音楽が短時間に変更されることを回避できる。なお、複数の動画ファイルを連続して再生する場合に、動画ファイルの切り替わり時にスコアSを初期化しなくてもよい。しかし、動画ファイルが切り替わる場合には、被写体が大きく変化する可能性があるので、一度音楽ファイルの再生を停止して、再度S401から処理を開始してもよい。
【0045】
次に時刻の進行に応じたスコアの更新について図5(a)〜(d)を参照して説明する。スコアの計算方法については後述する。図4のS404の説明に記載したとおり、図5(a)は時刻T1からTNまでのスコアの算出結果である。時刻T1からTNまでの間で特徴値fAのスコアが15であり、最大値となっている。図5(b)は時刻T2からTN+1までのスコアの例である。この例では時刻TN+1の特徴値はfCである。特徴値fAのスコアは13に減少しているが、依然として特徴値の最大値はfAである。図5(c)は時刻TN+2の特徴値としてfCを検出し、その結果、特徴値fAのスコアが10に減っていることを表している。時刻に対応する特徴値が変化しても、ただちにfAのスコアが最大値でなくなることはない。図5(d)は時刻TNからT2N−1までの特徴値の例であり、特徴値としてfAの出現が減ってfCが最大値になった状態を示している。以上のように画像を再生する時刻が変化する都度、スコアの算出を行い、順次更新して得られる特徴値に基づいて順次楽曲を選択する。
【0046】
次に音楽選択処理のS403で行うスコア計算処理の具体例を、図6に示すフローチャートと、図7とを参照して説明する。
【0047】
制御部101は、RAM等に特徴値毎のスコアを保持しておくためのバッファを持つ。以下では、このバッファに保持された特徴A,B,C,・・・に対応するスコアをSx(x=A,B,C,・・・)と表記する。
【0048】
S601で制御部101は、特徴値毎のスコアSxを0で初期化する。次に制御部101はS602からS607までを繰り返し実行して、リングバッファの各要素Fj(j=p+1(先頭),...,p)を処理する。S603で制御部101は、要素Fjが一つ前の要素F(j−1)と同じ値かどうか判断する。同じ値の場合は、S604に進み、制御部101はスコアに加算するウェイトwを1増やす。異なる場合は、S605に進み、制御部101はウェイトwを1に初期化する。S606で制御部101は、要素Fjの特徴値fxに対応するスコアSxにウェイトwを加算する。
【0049】
図7(a)は、リングバッファの内容の例と、リングバッファの各要素Fjが処理されたときのウェイトw、スコアSxの値を示したものである。この例では、リングバッファの要素数N=9であり、時刻T1におけるp=2であるとする。そのため、j=3,4,・・・,9,1,2の順番に繰り返し処理される。例えば、F3はfBであり、一つ前はfCなので、S605でw=1となり、特徴値fBに対応するスコアSBはw=1が加算されてSB=1となる。次のF4はfAであり、一つ前はfBなので、S604でw=1となる。スコアSAはw=1が加算されてSA=1となる。F5は引き続きfAであるため、S604でw=2となり、スコアSAはw=2が加算されてSA=3となる。このように、同じ特徴値が連続すればするほど、ウェイトを増加させることで、スコアが上がりやすくしている。これにより、例えば特徴値が顔認識値の場合、同一人物が連続して写っていればその人物に対応する特徴値が最大となりやすく、再生される音楽が変更されにくくなる。
【0050】
図7(b)は、図7(a)に示した例において、全てのFjの処理が終わった時点におけるスコアSxの算出結果である。特徴値fA,fB,fCが出現した回数はすべて3回だが、連続性が多いfAのスコアが最大となる。すなわち、切り替わりが早い特徴よりも連続して出現している特徴値のスコアを上げるものである。これにより、再生されている画像においてユーザが一番認識しやすい特徴に対応した音楽が、継続して再生されやすくなり、ユーザの違和感を減らすことができる。
【0051】
また、図6では不図示だが、直前の計算において最大値であったスコアに対応する特徴値、すなわちFPREVに対応する特徴値のスコアSxに所定の加点をしてもよい。これにより、各スコアの差が微小だった場合に、最大スコアの切り替わりが細かく発生することを防ぐことができる。
【0052】
さらに、図6では不図示だが、音楽ファイルを最後まで再生した場合、その音楽ファイルを関連付けている特徴値のスコアを減点してもよい。また、同一音楽ファイルの再生回数が増えるに従ってスコアを減点してもよい。これにより、同じ音楽ファイルが繰り返し再生されることを抑制することができる。
【0053】
また、あらかじめユーザが特徴値毎に優先順位を付けておき、それをスコアの算出に反映してもよい。例えば、優先順位に応じて加点を行うことが考えられる。
【0054】
なお本実施形態において、特徴値として人物や人物の表情を識別する顔情報(顔認識値または顔表情値)を用いた場合について説明してきたが、特徴値は顔情報に限らない。例えば、シーンが風景であればその色合い(例えばRGB成分の比率)などを特徴値として利用することも考えられる。また、公知のシーン判別機能を利用してシーン判別を行い、シーンに応じた特徴値を用いてもよい。
【0055】
また、本実施形態においてはあらかじめ特徴値が記録された画像ファイルを再生する場合を説明したが、再生装置が特徴値を求めてスコアを計算する構成を有していれば、あらかじめ特徴値を画像ファイルに記録しておかなくてもよい。
【0056】
以上説明したように、本実施形態によれば、主要被写体のような画像の特徴的な情報に応じた楽曲が選択されて再生される。また、所定の時間にわたる所定数の画像から検出される特徴量に基づいて楽曲を選択するので、画像が切り替わっても特徴量に大きな変化がない場合は再生される楽曲を変化させないようにでき、楽曲が細切れで再生されることが防止できる。これにより、楽曲を選択するのにかかる操作の煩雑さが低減するとともに、落ち着いて画像鑑賞することができる。
【0057】
<第2の実施形態>
図8、図9を用いて、本発明の第2の実施形態を説明する。本実施形態は、画像に複数の特徴値が存在する場合の処理に特徴を有する。ここでは、第1の実施形態と同様、画像の特徴値が人物の顔に関する情報であるものとし、顔ごとに特徴値を検出する。
【0058】
図8(a)に示すように、動画ファイルには画像データと関連づけて、検出した特徴値をすべて記録する。さらに、特徴値毎にウェイトを記録することもできる。
【0059】
図8(b)は、画像で複数の顔が検出された際の特徴値と対応するウェイトの例を示す。ここでは、特徴値として人物の顔認識値を用いている。特徴値に対応づけるウェイトは、顔枠(顔領域の外接四角形)の面積と画面内での位置に基づいて求めることができる。例えば、顔枠の面積が大きいほど、また、顔枠が画像の中心に近いほど、ウェイトが大きくなるようにする。つまり、大きい顔や中心に近い顔ほどスコアが高くなる。また、図8(c)は人物の表情を示す顔表情値を特徴値として用いた場合の例を示す。図8(b)と同様、顔枠の面積と画面内の位置との少なくとも一つに基づいてウェイトを求めることができる。
【0060】
撮像装置の構成は第1の実施形態と同様であってよいため、説明を省略する。記録再生部140は画像処理部111が検出した特徴値を画像データに関連づけて記録する。その際に、図8(a)に示すように一つの画像データに関連づけて複数種類の特徴値を記録しておく。制御部101が実行する音楽選択処理に用いる特徴値を保持しておくリングバッファFjは、時刻毎に複数種類の特徴値とウェイトを保持できるようにする。
【0061】
図9は、図4の音楽選択処理中のS403に相当する本実施形態のスコア計算処理を説明するフローチャートである。本実施形態における音楽選択処理は、S403に相当するステップを除き、第1の実施形態と同様であってよいため説明を省略する。
【0062】
S901で制御部101は各特徴値のスコアSxを0で初期化する。次に制御部101はS902からS906までを繰り返し実行する。まず、制御部101は各リングバッファの要素Fj毎にS903からS905までを繰り返し実行して、各特徴値fxを処理する。制御部101は、S904で、特徴値fxに対応するスコアSxを求めるためにFjの時点でのウェイトwjxを特徴値と加算する。制御部101はリングバッファの各要素Fj毎に、リングバッファのp+1、p+2、・・、N、・・pまでの1周分についての処理をする。その後、制御部101は種類毎の特徴値のスコアを実施形態1に記載されているようにリングバッファ1周分について求め、最大スコアの特徴値に基づいた音楽選択を行う。また、図9では不図示だが、前回の最大スコアを持つ特徴値、すなわちFPREVに対応するSxに対して次回の計算時に所定の加点をしてもよい。これにより、各スコアの差が微小だった場合に、スコアの切り替わりが細かく発生することを防ぐことができる。
【0063】
また、あらかじめユーザが複数の特徴値毎に優先順位を付けておき、その優先順位をスコアの計算に反映してもよい。例えば、優先順位毎に加点を行うことが考えられる。
【0064】
また、画像内で最大のウェイト値を持つ人物と他の人物のウェイト値の差が所定の閾値以上であれば、最大のウェイト値を有する人物に、さらにウェイト値をスコアに加点してもよい。
【0065】
第2の実施形態によれば、同じ画像に出現する複数種類の特徴値の各々に対してスコアを計算するため、第1の実施形態の効果に加え、特徴値が画像中で複数検出された場合でも、画像にふさわしい音楽を選択することができる。
【0066】
以上、本発明の実施形態に基づいて詳述してきたが、本発明はこれら特定の実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の様々な形態も本発明に含まれる。上述の実施形態の一部を適宜組み合わせてもよい。
【0067】
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。

【特許請求の範囲】
【請求項1】
記録媒体に記録され、所定時間毎に検出された被写体の特徴を表す特徴値に対応付けられた画像データを、楽曲と共に再生する再生装置であって、
前記特徴値と関連づけられた楽曲を記憶するメモリと、
前記画像データと共に再生する楽曲を、前記特徴値に従って自動的に選択する選択手段と、
前記画像データを、前記選択手段が選択した楽曲と共に再生する再生手段とを有し、
前記選択手段は、前記画像データの再生位置が含まれる前記所定時間に対応付けられた前記特徴値を含む、複数の前記所定時間に関連付けられた複数の特徴値の統計値を算出し、該統計値に従って1つの特徴値を選択し、該選択された特徴値に関連付けられた楽曲を選択することを特徴とする再生装置。
【請求項2】
前記選択手段は、前記画像データの再生位置が進行するに伴って、前記統計値を順次更新し、更新された統計値に基づいて順次楽曲を選択することを特徴とする請求項1に記載の再生装置。
【請求項3】
前記特徴値は、対応付けられた画像データで検出された人物又は人物の表情を表すことを特徴とする請求項1又は2に記載の再生装置。
【請求項4】
前記選択手段は、同じ特徴値の出現回数に基づいて前記統計値を算出することを特徴とする請求項1乃至3のいずれか1項に記載の再生装置。
【請求項5】
前記選択手段は、さらに、同じ特徴値の連続性に基づいて前記統計値を算出することを特徴とする請求項4に記載の再生装置。
【請求項6】
前記選択手段は出現回数が多いほど、また連続して出現するほど大きくなる値を前記統計値として前記特徴値ごとに算出し、該算出した値が最も大きい特徴値を選択することを特徴とする請求項5に記載の再生装置。
【請求項7】
前記選択手段は、前記所定時間に対応付けられた特徴値が複数ある場合、特徴値ごとに前記統計値を算出し、該算出した値が最も大きい特徴値を選択することを特徴とする請求項1乃至請求項6のいずれか1項に記載の再生装置。
【請求項8】
前記特徴値が前記画像データから検出された顔領域に対応付けられており、前記選択手段は、前記特徴値が対応付けられた顔領域の大きさ、該顔領域の位置、及び前記特徴値が表す人物の少なくとも一つに基づいて前記特徴値の出現回数に重み付けして前記統計値を算出することを特徴とする請求項1乃至6のいずれか1項に記載された再生装置。
【請求項9】
前記選択手段は、選択する楽曲が変化する場合には直前に再生していた楽曲の再生位置を記憶し、該直前に再生していた楽曲が再度選択された場合には、記憶した再生位置から再生を開始することを特徴とする請求項1乃至7のいずれか1項に記載された再生装置。
【請求項10】
記録媒体に記録され、所定時間毎に検出された被写体の特徴を表す特徴値に対応付けられた画像データを、楽曲と共に再生する再生装置の制御方法であって、
選択手段が、前記画像データと共に再生する楽曲を、前記再生装置が有するメモリに前記特徴値と関連づけて記憶された楽曲から前記特徴値に従って自動的に選択する選択ステップと、
再生手段が、前記画像データを、前記選択ステップで選択された楽曲と共に再生する再生ステップとを有し、
前記選択ステップにおいて前記選択手段は、前記画像データの再生位置が含まれる前記所定時間に対応付けられた前記特徴値を含む、複数の前記所定時間に関連付けられた複数の特徴値の統計値を算出し、該統計値に従って1つの特徴値を選択し、該選択された特徴値に関連付けられた楽曲を選択することを特徴とする再生装置の制御方法。
【請求項11】
コンピュータを、請求項1乃至9のいずれか1項に記載された画像再生装置の各手段として機能させるためのプログラム。

【図1】
image rotate

【図3】
image rotate

【図4】
image rotate

【図6】
image rotate

【図9】
image rotate

【図2】
image rotate

【図5】
image rotate

【図7】
image rotate

【図8】
image rotate


【公開番号】特開2013−115750(P2013−115750A)
【公開日】平成25年6月10日(2013.6.10)
【国際特許分類】
【出願番号】特願2011−262650(P2011−262650)
【出願日】平成23年11月30日(2011.11.30)
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】