説明

撮像装置、撮像方法、出力装置、出力方法、及びプログラム

【課題】画像を撮像したときに流れていた音楽を、画像とともに容易に得ることができる撮像装置又は出力装置を提供すること。
【解決手段】本発明の撮像装置は、撮像部と、撮像部の周囲の音声を録音する録音部と、録音部が録音した音声から予め定められた種類の音声を抽出する特徴音抽出部と、複数の種類の音声を格納する音声データベースから、特徴音抽出部が抽出した音声と同一の種類の音声を取得する音声取得部と、音声取得部が取得した音声と撮像部が撮像した画像とを同期して出力させるべく対応づけて格納するデータ格納部とを備える。特徴音抽出部は、撮像部が画像を撮像した時刻から予め設定された時間内に、録音部が録音した音声から予め定められた音声を抽出してよい。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、撮像装置、撮像方法、出力装置、及びプログラムに関する。特に本発明は、画像を撮像する撮像装置及び撮像方法、並びに画像を出力する出力装置及び出力方法、並びに当該撮像装置及び当該出力装置用のプログラムに関する。
【背景技術】
【0002】
従来、静止画だけでなく動画もメモリカードに記録することができるデジタルスチルカメラがある。このようなデジタルスチルカメラでは、静止画や動画の撮影記録時にマイクロホンで検出した音声を画像に対応させて記録できる(例えば、特許文献1参照。)。また、デジタルスチルカメラで撮影した静止画や動画を表示しながら、画像に対応させて記録された音声を再生することができる電子フォトスタンドが知られている。
【特許文献1】特開平7−154734号公報
【発明の開示】
【発明が解決しようとする課題】
【0003】
このようなカメラ及び電子フォトスタンドによって、例えば、撮影記録時に周囲で流れていた音楽とともに、撮影した画像を鑑賞することができる。しかし、このようなカメラでは、撮影記録時に流れていた音声しか記録できない。他にも、例えばインターネット、CD等からデジタルデータとして取得することのできる音楽データ等に比べて、マイクロホンから録音された音楽は低音質である場合が多い。このため、ユーザは再生される音楽に不満を持ってしまう場合がある。また、ユーザにとっては画像と音声の編集等の煩雑な作業をすることなく、撮影した画像と音楽とを簡単に鑑賞することができることが望ましい。また、音楽の他にも、波の音、鳥の鳴き声等、撮像時の環境音と同種の音声をより高い音質で画像とともに鑑賞することができることが望ましい。
【0004】
そこで本発明は、上記の課題を解決することができる撮像装置、撮像方法、出力装置、出力方法、及びプログラムを提供することを目的とする。この目的は特許請求の範囲における独立項に記載の特徴の組み合わせにより達成される。また従属項は本発明の更なる有利な具体例を規定する。
【課題を解決するための手段】
【0005】
本発明の第1の形態における撮像装置は、撮像部と、撮像部の周囲の音声を録音する録音部と、録音部が録音した音声から予め定められた種類の音声を抽出する特徴音抽出部と、複数の種類の音声を格納する音声データベースから、特徴音抽出部が抽出した音声と同一の種類の音声を取得する音声取得部と、音声取得部が取得した音声と撮像部が撮像した画像とを同期して出力させるべく対応づけて格納するデータ格納部とを備える。
【0006】
特徴音抽出部は、撮像部が画像を撮像した時刻から予め設定された時間内に、録音部が録音した音声から予め定められた種類の音声を抽出してよい。
【0007】
撮像部が有する受光素子により受光した光の画像を表示する表示部と、表示部が画像を表示している状態の動作モードである撮像モード、又は表示部が画像を表示していない状態の動作モードである非撮像モードに当該撮像装置を設定するモード設定部とをさらに備え、録音部は、モード設定部が撮像モードに設定している場合、及びモード設定部が非撮像モードに設定している場合の双方において、撮像部の周囲の音声を録音してよい。
【0008】
特徴音抽出部は、モード設定部が撮像モードに設定している時間を含み、モード設定部が撮像モードに設定している時間より長い、予め設定された時間内に、録音部が録音した音声から予め定められた種類の音声を抽出してよい。音声データベースは、複数の音楽を格納しており、特徴音抽出部は、録音部が録音した音声から音楽を抽出し、音声取得部は、音声データベースから、特徴音抽出部が抽出した音楽と同一の音楽を取得してよい。
【0009】
特徴音抽出部が抽出する環境音のそれぞれの種類を特定する条件を予め格納する条件格納部をさらに備え、音声データベースは、環境音の種類別に複数の環境音を格納しており、特徴音抽出部は、条件格納部が格納する条件に一致する環境音を、録音部が録音した音声から抽出し、音声取得部は、音声データベースから、特徴音抽出部が抽出した環境音と同一の種類の環境音を取得し、データ格納部は、音声取得部が取得した環境音と撮像部が撮像した画像とを同期して出力させるべく対応づけて格納してよい。
【0010】
音声データベースは、時代別に複数の音楽を格納しており、特徴音抽出部は、録音部が録音した音声から音楽を抽出し、音声取得部は、音声データベースから、特徴音抽出部が抽出した音楽と同じ時代の音楽を取得してよい。音声データベースは、ジャンル別に複数の音楽を格納しており、音声取得部は、音声データベースから、特徴音抽出部が抽出した音楽と同じジャンルの音楽を取得してよい。
【0011】
本発明の第2の形態における撮像方法は、画像を撮像部により撮像する撮像段階と、撮像部の周囲の音声を録音する録音段階と、録音段階において録音された音声から予め定められた種類の音声を抽出する特徴音抽出段階と、複数の種類の音声を格納する音声データベースから、特徴音抽出段階において抽出された音声と同一の種類の音声を取得する音声取得段階と、音声取得段階において取得された音声と撮像部が撮像した画像とを同期して出力させるべく対応づけて格納するデータ格納段階とを備える。
【0012】
本発明の第3の形態によると、画像を撮像する撮像装置用のプログラムであって、撮像装置を、画像を撮像する撮像部、撮像部の周囲の音声を録音する録音部、録音部が録音した音声から予め定められた種類の音声を抽出する特徴音抽出部、複数の種類の音声を格納する音声データベースから、特徴音抽出部が抽出した音声と同一の種類の音声を取得する音声取得部、音声取得部が取得した音声と撮像部が撮像した画像とを同期して出力させるべく対応づけて格納するデータ格納部として機能させる。
【0013】
本発明の第4の形態における出力装置は、撮像装置によって撮像された画像を格納する画像格納部と、撮像装置によって録音された音声を格納する音声格納部と、音声格納部が格納する音声から予め定められた種類の音声を抽出する特徴音抽出部と、複数の種類の音声を格納する音声データベースから、特徴音抽出部が抽出した音声と同一の種類の音声を取得する音声取得部と、音声取得部が取得した音声と画像格納部が格納する画像とを同期して出力する出力部とを備える。
【0014】
画像格納部は、画像に対応づけて当該画像の撮像時刻を格納しており、音声格納部は、音声に対応づけて当該音声の録音時刻を格納しており、特徴音抽出部は、画像が撮像された時刻から予め設定された許容時間内に録音された音声から予め定められた種類の音声を抽出してよい。
【0015】
画像格納部が格納する画像の出力要求を取得する出力要求取得部と、出力要求取得部が出力要求を取得した時刻と、画像格納部が格納する画像の撮像時刻との差がより大きい場合に、許容時間をより長く設定する許容時間設定部とをさらに備えてよい。
【0016】
本発明の第5の形態における出力方法は、撮像装置によって撮像された画像を格納する画像格納段階と、撮像装置によって録音された音声を格納する音声格納段階と、音声格納段階において格納される音声から予め定められた種類の音声を抽出する特徴音抽出段階と、複数の音楽を格納する音声データベースから、特徴音抽出段階において抽出された音声と同一の種類の音声を取得する音声取得段階と、音声取得段階において取得された音声と画像格納段階において格納される画像とを同期して出力する出力段階とを備える。
【0017】
本発明の第6の形態によると、画像を出力する出力装置用のプログラムであって、出力装置を、画像を撮像する撮像部、撮像部の周囲の音声を録音する録音部、録音部が録音した音声から予め定められた種類の音声を抽出する特徴音抽出部、複数の種類の音声を格納する音声データベースから、特徴音抽出部が抽出した音声と同一の種類の音声を取得する音声取得部、音声取得部が取得した音声と撮像部が撮像した画像とを同期して出力させるべく対応づけて格納するデータ格納部として機能させる。
【0018】
なお上記の発明の概要は、本発明の必要な特徴の全てを列挙したものではなく、これらの特徴群のサブコンビネーションもまた発明となりうる。
【発明の効果】
【0019】
本発明によれば、画像を撮像したときに流れていた種類の音声を、画像とともに容易に得ることができる撮像装置及び出力装置を提供することができる。
【発明を実施するための最良の形態】
【0020】
以下、発明の実施形態を通じて本発明を説明するが、以下の実施形態は特許請求の範囲に係る発明を限定するものではなく、また実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。
【0021】
図1は、本発明の一実施形態に係る音声提供システムの一例を示す。音声提供システムは、撮像装置100、出力装置140、説明音データベース170、音楽データベース172、及び環境音データベース174を有する。この例では、撮像装置100は、観光地において記念写真を撮像する。撮像装置100は、撮像装置100が撮像した画像及び撮像したときの撮像位置を、インターネット等の通信回線150を通じて出力装置140に送信する。音楽データベース172は、複数の音楽を格納している。また、環境音データベース174は、環境音の種類別に複数の環境音を格納している。なお、本実施形態における音楽データベース172及び環境音データベース174は、この発明における音声データベースの一例である。
【0022】
出力装置140は、撮像装置100から受け取った撮像位置に関する音声データ、例えば観光地の特色を説明する音声データを説明音データベース170から取得して、撮像装置100から受け取った画像とともに出力する。なお、撮像装置100は、撮像装置100の周囲の音声を録音しておき、出力装置140は、撮像装置100で録音された音声を受け取ってもよい。そして出力装置140は、当該音声の中から音楽を抽出して、抽出した音楽と同じ音楽を音楽データベース172から取得して、画像とともに出力してもよい。また、出力装置140は、当該音声の中から波の音、鳥の鳴き声等の環境音を抽出して、抽出した環境音と同じ種類の環境音を環境音データベース174から取得して、画像とともに出力してもよい。なお、出力装置140は、説明音データベース170から取得した音声データと、音楽データベース172から取得した音楽又は環境音データベース174から取得した環境音とを同時に出力してもよい。
【0023】
出力装置140は、例えば、HDTV、電子フォトスタンド、コンピュータ等の、画像及び音声を出力する装置であってよい。また、出力装置140は、音声を文字として出力してもよい。例えば、出力装置140は、液晶等の表示デバイスに画像を表示するときに、説明音データベース170から取得した音声及び/又は音楽データベース172から取得した音楽データに含まれる歌詞等を文字として表示デバイスに表示させてよい。なお、出力装置140は、画像を表示させる表示デバイスに文字を表示させてよく、画像を表示させる表示デバイスとは別の表示デバイスに文字を表示させてもよい。他にも、出力装置140は、プリンタ等の画像を印刷する印刷装置であってもよく、画像を印刷するとともに音声を文字として印刷してもよい。
【0024】
撮像装置100は、例えば、デジタルスチルカメラ、カメラ付携帯電話等であってよい。また、撮像装置100が画像及び音声データを記録媒体に記録して、出力装置140は当該記録媒体から画像及び音声データを受け取ってもよい。また、撮像装置100は、画像及び音声データを、通信回線150に接続されたサーバの、ユーザ180毎にそれぞれ設けられたディレクトリ、例えば撮像装置100と関連付けられたディレクトリに格納してもよい。そして出力装置140は、ユーザ180毎にサーバに格納された画像及び音声データを受け取ってもよい。
【0025】
以上説明した出力装置140によれば、撮像装置100で撮像した画像を、撮像した場所に関する音声とともにユーザ180に提供することができる。このため、ユーザ180は、観光地等の特色等を思い出しながら、楽しく画像を鑑賞することができる。また、撮像装置100で撮像したときに周囲で流れていた音楽、周囲の波の音等の環境音等を、ユーザ180に提供することができる。このため、ユーザ180は、観光地等を訪れたときに流行していた音楽を聴きながら、楽しく画像を鑑賞することができる。
【0026】
図2は、出力装置140のブロック構成の一例を示す。出力装置140は、画像格納部210、画像選択部278、撮像領域判断部282、撮像期間判断部284、撮像位置分布算出部286、撮像枚数算出部288、出力部224、及び音声取得部262を備える。
【0027】
画像格納部210は、撮像された画像と、当該画像が撮像された位置とを対応づけて格納する。例えば、撮像装置100は、画像を撮像したときの撮像装置100の位置における緯度及び経度情報をGPS衛星から受信する。そして、画像格納部210は、撮像装置100から受け取った画像を、撮像装置100が検出した緯度及び経度情報と対応づけて格納する。
【0028】
画像選択部278は、画像格納部210が格納する画像から、ユーザ180の指示入力に基づいて複数の画像を選択する。撮像領域判断部282は、画像格納部210が格納する複数の画像のそれぞれが撮像された複数の撮像位置を含む撮像領域を判断する。
【0029】
具体的には、撮像領域判断部282は、画像選択部278が選択した複数の画像のそれぞれが撮像された複数の位置を含む撮像領域を判断する。例えば、撮像領域判断部282は、画像格納部210が格納する複数の画像のそれぞれが撮像された複数の撮像位置を含む撮像領域の地理的な範囲、例えば緯度及び経度の範囲を判断してよい。
【0030】
撮像位置分布算出部286は、撮像領域判断部282が判断した撮像領域内における、画像格納部210が格納する複数の画像のそれぞれが撮像された複数の位置の分布を算出する。撮像枚数算出部288は、撮像領域判断部282が判断した撮像領域に含まれる複数の部分領域毎に、画像格納部210が格納する複数の画像のそれぞれが撮像された撮像枚数を算出する。
【0031】
音声取得部262は、撮像領域判断部282が判断した撮像領域の広さに応じて説明音データベース170が格納する音声を取得する。具体的には、音声取得部262は、撮像領域判断部282が判断した撮像領域がより狭い場合に、撮像領域判断部282が判断した撮像領域についてのより詳しい説明の音声を取得する。
【0032】
より具体的には、音声取得部262は、撮像位置分布算出部286が算出した分布の偏りが予め定められた偏りより大きい部分領域についての説明の音声を取得する。また、音声取得部262は、撮像枚数算出部288が算出した撮像枚数がより多い場合に、説明音データベース170が格納する部分領域についての詳しさが異なる複数の説明のうちのより詳しい説明の音声を取得する。
【0033】
出力部224は、画像格納部210が格納する複数の画像とともに、音声取得部262が取得した音声を出力する。具体的には、出力部224は、画像選択部278が選択した複数の画像とともに、音声取得部262が取得した音声を出力する。
【0034】
画像格納部210は、撮像された画像に対応づけて、当該画像が撮像された時刻をさらに格納する。撮像期間判断部284は、画像格納部210が格納する複数の画像のそれぞれが撮像された複数の時刻を含む撮像期間を判断する。具体的には、撮像期間判断部284は、画像選択部278が選択した複数の画像が撮像された複数の時刻を含む撮像期間を判断する。
【0035】
そして、音声取得部262は、撮像期間判断部284が判断した撮像期間の長さにさらに応じて説明音データベース170が格納する音声を取得する。具体的には、音声取得部262は、撮像期間判断部284が判断した撮像期間がより長い場合に、撮像領域判断部282が判断した撮像領域についてのより詳しい説明の音声を取得する。
【0036】
図3は、説明音データベース170が格納するデータの一例をテーブル形式で示す。説明音データベース170は、領域に対応づけて、領域の位置する範囲を示す位置範囲及び領域についての音声データを格納する。位置範囲は、例えば、領域が含まれる領域の起点となる緯度及び経度、並びに、終点となる緯度及び経度を含んでよい。なお、位置範囲には、領域の位置する複数の範囲を含んでよい。音声データは、例えば、各領域についての詳しさの異なる複数の音声データ、例えば概要説明、詳細説明の音声データを含んでよい。また、音声データには、各領域に関するニュース等を含んでもよい。
【0037】
例えば、日本についての概要説明データとは、日本全体の特色、人口、面積等を説明する音声データであってよい。また、日本についての詳細を説明する音声データとは、日本に含まれる各地域の特色、人口、面積等を説明する音声データであってよく、日本の歴史等を説明する音声データであってもよい。
【0038】
図4は、画像が撮像された位置の分布の一例を示す。図4の例では、画像格納部210は、長崎、広島、京都、静岡、東京、及び北海道で撮像した、それぞれ10枚、9枚、10枚、7枚、8枚、及び6枚の画像を格納している。撮像領域判断部282は、例えば、予め定めた緯度及び経度範囲毎の部分領域に区切り、画像が撮像された位置を含む部分領域を判断する。撮像枚数算出部288は、部分領域のそれぞれで撮像された画像の枚数を算出する。そして、撮像位置分布算出部286は、画像が撮像された位置が含まれる部分領域の分布を判断する。
【0039】
そして、音声取得部262は、撮像位置が広い範囲に分布しているか否かを判断する。例えば、音声取得部262は、長崎で撮像した画像が画像選択部278によって選択されたときには、撮像位置が狭い範囲に分布していると判断して、日本をより詳しく説明する音声データとして、例えば長崎を説明する音声データを説明音データベース170から取得する。また、長崎、広島、京都、静岡、東京、及び北海道で撮像した画像が画像選択部278によって選択された場合には、撮像位置がより広い範囲に分布していると判断して、撮像領域についての概要を説明する音声データとして、例えば日本を説明する音声データを説明音データベース170から取得する。
【0040】
なお、撮像枚数算出部288によって算出される枚数がより多い場合には、音声取得部262は、それぞれの撮像領域についてのより詳しい説明の音声データを説明音データベース170から取得し、枚数がより少ない場合は、それぞれの撮像領域についてのより概要を説明する音声データを説明音データベース170から取得してよい。
【0041】
また、音声取得部262は、選択された枚数に対する、特定の部分領域で撮像された画像の枚数の比率を計算して、当該比率が予め定めた比率よりも大きい場合に、当該特定の部分領域について説明する音声データを説明音データベース170から取得する。例えば、画像格納部210が、長崎、広島、京都、東京、及び北海道で撮像した、それぞれ6枚、7枚、30枚、4枚、3枚の合計50枚の画像を格納しており、半数以上の30枚が京都で撮像された画像である場合には、音声取得部262は、京都を説明する音声データを説明音データベース170から取得する。このため、出力装置140は、ユーザ180が特に多く撮像した場所について説明する音声をユーザ180に提供することができる。
【0042】
図5は、画像が撮像された時刻の分布の一例を示す。撮像期間判断部284は、画像が撮像された時間範囲を、部分領域毎に判断する。例えば、撮像期間判断部284は、長崎、広島、京都、静岡、東京、及び北海道のそれぞれを含む部分領域で撮像された時間範囲(t1〜t10、t11〜t19、t20〜t29、t30〜t36、t37〜t44、及びt45〜t50)を判断する。
【0043】
そして、音声取得部262は、撮像期間の長さを判断する。例えば、音声取得部262は、長崎で撮像した画像が画像選択部278によって選択されたときには、長崎で撮像された期間(t1〜t10)がより短いと判断して、長崎を説明する音声データを説明音データベース170から取得する。また、長崎、広島、京都、静岡、東京、及び北海道で撮像した画像が画像選択部278によって選択された場合には、撮像された期間(t1〜t50)がより長いと判断して、撮像領域についての詳しい説明の音声データとして、例えば日本の詳しい説明の音声データを説明音データベース170から取得する。
【0044】
そして、音声取得部262は、選択された画像が撮像された期間に対する、特定の部分領域で撮像された期間の比率を計算して、当該比率が予め定めた比率よりも大きい場合に、当該特定の部分領域について説明する音声データを説明音データベース170から取得する。例えば、画像格納部210が、長崎、広島、京都、東京、及び北海道で撮像した画像を格納している場合に、京都で撮像された期間(t64〜t93)が、選択された画像が撮像された期間の合計(t51〜t56、t57〜t63、t64〜t93、t94〜t97、t98〜t10の合計期間)の半分の期間以上である場合に、音声取得部262は京都について説明する音声データを説明音データベース170から取得する。このため、出力装置140は、ユーザ180が特に長く滞在して撮像した場所について説明する音声をユーザ180に提供することができる。
【0045】
図6は、撮像装置600のブロック構成の一例を示す。撮像装置600は、図1で説明した撮像装置100の他の例であって、特に撮像された画像とともに録音された音声から音楽、環境音等の特徴的な音声を抽出して格納する機能を有する。撮像装置600は、モード設定部692、撮像部602、表示部670、データ格納部698、録音部650、特徴音抽出部694、条件格納部660、及び音声取得部696を備える。
【0046】
撮像部602は、画像を撮像する。撮像部602は、具体的には、被写体からの光をCCD等の撮像デバイスで受光して、被写体を撮像する。なお、撮像部602は所定の時間間隔で連続的に被写体を撮像してもよい。そして、撮像部602は、連続的に撮像して得られる所定の個数の画像を保持してもよい。そして、撮像部602は、撮像部602が保持している画像のうち、撮像を指示された時刻に最も近いタイミングで撮像された画像を撮像画像としてもよい。
【0047】
表示部670は、撮像部602が有する受光素子により受光した光の画像を表示する。モード設定部692は、表示部670が画像を表示している状態の動作モードである撮像モード、又は表示部670が画像を表示していない状態の動作モードである非撮像モードに当該撮像装置600を設定する。
【0048】
録音部650は、撮像部602の周囲の音声を録音する。なお、録音部650は、モード設定部692が撮像モードに設定している場合、及びモード設定部692が非撮像モードに設定している場合の双方において、撮像部602の周囲の音声を録音する。
【0049】
特徴音抽出部694は、録音部650が録音した音声から予め定められた種類の音声を抽出する。例えば、特徴音抽出部694は、録音部650が録音した音声から音楽を抽出する。この場合、特徴音抽出部694は、音声の周波数スペクトルに基づいて基本周波数を抽出して、音階を決定する。そして、特徴音抽出部694は、決定した音階に基づいて、リズム、テンポ、調性等の音楽の特徴量を判断して、音符データを抽出する。また、特徴音抽出部694は、更に、音符データに基づいて音楽のコード進行を抽出してもよい。
【0050】
条件格納部660は、特徴音抽出部694が抽出する環境音のそれぞれの種類を特定する条件を予め格納する。具体的には、条件格納部660は、犬、鳥の鳴き声、虫の鳴き声、波の音等の環境音の種類毎に、それぞれの種類の環境音に特徴的な周波数スペクトルを格納する。そして、特徴音抽出部694は、条件格納部660が格納する条件に一致する環境音を、録音部650が録音した音声から抽出する。例えば、特徴音抽出部694は、条件格納部660が格納する周波数スペクトルに予め定められた一致度以上で一致する環境音を、録音部650が録音した音声から抽出する。なお、条件格納部660は、環境音の音声そのものを、環境音の種類毎に格納してよい。この場合、特徴音抽出部694は、条件格納部660が格納する環境音の音声と録音部650が録音した音声とを比較して、音声の特徴量(例えば、周波数スペクトル等)が最も一致度の高い環境音を抽出して、当該環境音の種類を決定してよい。
【0051】
なお、特徴音抽出部694は、撮像部602が画像を撮像した時刻から予め設定された時間内に、録音部650が録音した音声から予め定められた種類の音声を抽出する。例えば、特徴音抽出部694は、撮像部602が画像を撮像した時刻から予め設定された時間内に、録音部650が録音した音声から音楽又は環境音を抽出する。具体的には、特徴音抽出部694は、モード設定部692が撮像モードに設定している時間を含み、モード設定部692が撮像モードに設定している時間より長い予め設定された時間内に、録音部650が録音した音声から予め定められた種類の音声を抽出する。より具体的には、特徴音抽出部694は、モード設定部692が撮像モードに設定している時間を含み、モード設定部692が撮像モードに設定している時間より長い、予め設定された時間内に、録音部650が録音した音声から音楽又は環境音を抽出する。
【0052】
音楽データベース172は、時代別に複数の音楽を格納する。また、音楽データベース172は、ジャンル別に複数の音楽を格納する。具体的には、音楽データベース172は、音楽データに対応づけて、音楽のジャンル及び時代を格納する。また、音楽データベース172は、音楽データに対応づけて、音符データ、リズム、テンポ、調性、及びコード進行等の、音楽の特徴量を格納してよい。他にも、音楽データベース172は、音楽データに対応づけて、当該音楽に関連する人物、例えば作曲者、作詞者、編曲者、演奏者等を格納してもよい。また、音楽データベース172は、音楽データに対応づけて、当該音楽が発信される地域の位置を示す発信位置、発信される発信時刻、及び発信手段を格納してもよい。なお、発信手段とは、例えばラジオ、有線等であってよい。また、発信時刻とは、例えば放送局の番組データ等、音楽が放送されるべき時刻を示す情報であってよい。また、音楽データベース172は、音楽データに対応づけて、当該音楽が複数の地域においてヒットした程度を示す情報を、地域毎及び時代毎に格納してもよい。
【0053】
音声取得部696は、複数の種類の音声を格納する音声データベースから、特徴音抽出部694が抽出した音声と同一の種類の音声を取得する。具体的には、音声取得部696は、音楽データベース172から、特徴音抽出部694が抽出した音楽と同一の音楽を取得する。具体的には、音声取得部696は、特徴音抽出部694が抽出した音符データと一致する音符データを有する音楽を音楽データベース172から取得する。このとき、音声取得部696は、撮像部602が画像を撮像したタイミングにおいて撮像装置600の撮像位置及び撮像時刻を検出し、当該撮像位置を含む発信位置及び当該撮像時刻を含む発信時刻に対応づけて音楽データベース172に格納された音楽データの中から、特徴音抽出部694が抽出した音楽と同一の音楽を取得してよい。このとき、音声取得部696は、音楽データベース172に格納された音楽データのうち、撮像位置を含む地域及び撮像時刻を含む時代においてヒットした程度がより高い音楽を優先して検索し、取得してよい。また、音声取得部696は、音楽が発信されるべき発信手段を撮像位置に基づいて特定して、当該発信手段によって発信される音楽から順に検索してもよい。例えば、音声取得部696は、住宅街で録音された音楽を取得する場合には、ラジオ放送で放送されるべき音楽から順に検索し、遊園地等で録音された音楽を取得する場合には、有線放送によって放送されるべき音楽から順に検索してよい。
【0054】
また、音声取得部696は、複数の音楽を格納する音楽データベース172から、特徴音抽出部694が抽出した音楽と同一の種類の音楽を取得する。具体的には、音声取得部696は、音楽データベース172から、特徴音抽出部694が抽出した音楽と同じ時代の音楽を取得する。また、音声取得部696は、音楽データベース172から、特徴音抽出部694が抽出した音楽と同じジャンルの音楽を取得する。具体的には、音声取得部696は、特徴音抽出部694が抽出したリズム、テンポ、調性、及びコード進行等の特徴量に基づいて音楽のジャンル及び/又は時代を特定して、特定したジャンル及び/又は時代の音楽を音楽データベース172から取得する。他にも、音声取得部696は、特徴音抽出部694が抽出した特徴量に基づいて、当該特徴量の音楽を音楽データベース172を検索することによって、当該音楽に関連する人物を特定して、特定した人物に対応づけられた音楽を音楽データベース172から取得してもよい。なお、音声取得部696は、音楽データベース172に格納された音楽データのうち、撮像位置を含む地域及び撮像時刻を含む期間においてヒットした程度が最も高い音楽を取得してよい。
【0055】
また、音声取得部696は、環境音データベース174から、特徴音抽出部694が抽出した環境音と同一の種類の環境音を取得する。なお、条件格納部660が環境音そのものを格納している場合には、音声取得部696は、特徴音抽出部694が抽出した音声と同種の音声を条件格納部660から取得してもよい。
【0056】
データ格納部698は、音声取得部696が取得した音声と撮像部602が撮像した画像とを同期して出力させるべく対応づけて格納する。具体的には、データ格納部698は、音声取得部696が取得した音楽と撮像部602が撮像した画像とを同期して出力させるべく対応づけて格納する。他にも、データ格納部698は、音声取得部696が取得した環境音と撮像部602が撮像した画像とを同期して出力させるべく対応づけて格納する。以上説明した撮像装置600によれば、撮像装置600によって撮像したときに撮像装置600の周囲を流れていたBGMと同じ音楽を、画像とともにユーザ180に提供することができる。また、撮像装置600は、撮像時の周囲の環境音を画像とともにユーザ180に提供することができる。
【0057】
図7は、音楽データベース172が格納するデータの一例をテーブル形式示す。音楽データベース172は、音楽データに対応づけて、時代、音楽が属するジャンル、音楽が有するリズム、音楽が有するテンポ、音楽が有する調性、音楽が有するコード進行、音楽の楽譜を示す音符データ、音楽の原盤権を保有するレコード会社、音楽を制作したレーベル、音楽がヒットしたヒット度を格納する。なお、音楽データベース172が格納する時代とは、音楽が作成された時代、音楽が発表された時代、音楽が流行した時代等であってよい。なお、音楽データベース172は、本図において例示した属性の他に、音楽をプロデュースしたプロデューサ、音楽が含まれる音楽アルバム、音楽をダウンロードする場合に課金される課金情報等、音楽に関連する様々な属性を格納してよいことは言うまでもない。
【0058】
図8は、撮像装置600が録音する音声と時間範囲の一例を示す。撮像装置600は、動作モードとして、撮像モード、出力モード、及び待機モードを有する。撮像モードとは、撮像装置600が撮像及び/又は録音することのできる動作モードであってよい。また、出力モードは、例えば、撮像装置600が画像及び/又は音声を出力することのできる動作モードであってよい。なお、非撮像モードは、出力モード及び待機モードを含む。そして、撮像装置600は、撮像モードに設定されている期間(t1〜t3)、出力モードに設定されている期間(t3〜t4)、及び待機モードに設定されている期間(t0〜t1及びt4〜t5)における撮像装置600の周囲の音声を録音する。
【0059】
なお、撮像装置600は、起動された直後には撮像装置600は待機モードに設定される。撮像装置600は、動作モードが待機モード又は出力モードに設定されている場合に、ユーザ180によって撮像動作又は録音動作に関する操作がなされた場合に撮像モードに遷移する。撮像動作に関する操作は、例えば、画像を撮像する操作、シャッタスピード、焦点距離等の、撮像条件を調整する操作等を含む。また、録音動作に関する操作は、例えば、音声を録音する操作、録音感度の調整等の、録音条件を調整する操作等を含む。また、撮像装置600は、動作モードが待機モード又は撮像モードに設定されている場合に、ユーザ180によって撮像装置600の出力動作に関する操作がなされた場合に、出力モードに遷移する。出力動作に関する操作は、例えば、画像を出力する操作、出力する画像を選択する操作、出力速度の調節等の、出力条件を調整する操作等を含む。なお、撮像装置600は、撮像装置600が撮像モード又は出力モードに設定されている場合に、ユーザ180による撮像装置600の操作が所定の期間操作されなかったことを条件として、待機モードに遷移してよい。
【0060】
特徴音抽出部694は、撮像時刻t2から予め定めた時間だけ前又は後の時間範囲において、録音部650で録音された音声から音楽を抽出する。例えば、撮像装置600がユーザ180から時刻t2において撮像するよう指示された場合に、特徴音抽出部694は、撮像時刻t2を含む撮像モードに設定されていた期間(t1〜t3)を含む、待機モード又は出力モードに設定されていた期間、例えば期間(t0〜t5)において録音された音声から音楽を抽出する。
【0061】
なお、特徴音抽出部694は、撮像時刻t2を含む、期間(t0〜t5)において録音部650によって録音された音声のうち、撮像時刻t2の最も近い時刻で録音された音声から音楽を抽出してよい。また、特徴音抽出部694は、最も音量の大きい音量の音声の中から音楽を抽出してよい。
【0062】
図9は、音楽を取得する手順の一例を示す。特徴音抽出部694は、録音部650が録音した音声から撮像した時刻を含む期間の音声を抽出する(S912)。そして、特徴音抽出部694は、S912で抽出した期間の音声から、音楽の特徴量を抽出する(S914)。音楽の特徴量とは、例えば音符データ、リズム、テンポ、調性、コード進行等であってよい。
【0063】
そして、音声取得部696は、特徴音抽出部694が抽出した音符データと一致する音楽を音楽データベース172の中から検索する(S916)。そして、特徴音抽出部694は、抽出した音符データと一致する音楽が音楽データベース172に格納されているか否かを判断する(S918)。音声取得部696は、S918において、一致する音楽があると判断した場合には、音楽データベース172の中から一致する音楽を取得する(S920)。
【0064】
音声取得部696は、S918において一致する音楽がないと判断した場合には、特徴音抽出部694がS914で抽出した音楽の特徴量に基づいて、S912で抽出した音楽と同じジャンル及び/又は年代を特定する(S922)。例えば、音声取得部696は、音楽データベース172に格納された音楽の中で、最も類似する特徴量を持つ音楽を最も多く含むジャンル及び/又は時代を特定する。そして、音声取得部696は、S922で特定したジャンル及び/又は年代の音楽を、音楽データベース172に格納された音楽の中から取得する(S924)。また、音声取得部696は、S922において、ジャンル、年代の他にも、類似する特徴量を持つ最も多くの音楽に対応づけて音楽データベース172が格納しているレコード会社又はレーベルを特定してよい。そして、音声取得部696は、S924において、S922において特定したレコード会社又はレーベルの音楽を、音楽データベース172に格納された音楽の中から取得してよい。なお、S924において、音声取得部696は、同じ種類の音楽が複数存在する場合には、音楽データベース172が格納するヒット度が最も高い音楽を取得してよい。
【0065】
なお、音声取得部696は、S918で同一の音楽と判断された音楽が音楽データベース172から複数検索された場合は、検索された複数の音楽を音楽データベース172から取得してユーザ180に選択させてもよい。また、音声取得部696は、S924においても、音楽データベース172から取得した同じジャンル及び/又は年代の音楽を複数取得して、ユーザ180に選択させてもよい。他にも、音声取得部696は、検索された複数の音楽のうち音楽データベース172が格納するヒット度が最も高い音楽を取得してよい。また、音声取得部696は、複数の音楽が検索された場合には、検索された複数の音楽のうち最も多い数の音楽に対応づけて音楽データベース172が格納しているレコード会社又はレーベルの音楽を特定してよい。そして、音声取得部696は、特定したレコード会社又はレーベルの年代の音楽を、音楽データベース172に格納された音楽の中から取得してよい。なお、S920において音声取得部696は、S918で同一の音楽と判断された音楽と同じレコード会社又はレーベルの音楽を音楽データベース172から取得してもよい。また、音声取得部696は、レコード会社又はレーベルの他にも、S918で同一の音楽と判断された音楽と同じ属性に対応づけて音楽データベース172に格納されている音楽を、音楽データベース172から取得してもよい。
【0066】
以上、図7から図9にかけて、音声取得部696が音楽データベース172から音楽を取得する動作について説明したが、同様の動作によって、音声取得部696は環境音データベース174から環境音を取得することができる。また、音声取得部696は、音楽、環境音の他にも、画像に対応づけて記録すべき予め定められた様々な種類の音声を、音声データベースから取得してよいことは言うまでもない。
【0067】
図10は、出力装置1040のブロック構成の一例を示す。出力装置1040は、音声提供システムが有する出力装置140の他の一例であってよい。なお、撮像装置100は、撮像した画像及び撮像したときの周囲の音声の他に、周囲の音声を録音した時刻も出力装置1040に送信する。
【0068】
出力装置1040は、画像格納部1010、出力部1024、音声取得部1096、特徴音抽出部1094、条件格納部1060、音声格納部1020、許容時間設定部1043、出力時刻検出部1044、出力要求取得部1048を備える。
【0069】
画像格納部1010は、撮像装置100によって撮像された画像を格納する。また、画像格納部1010は、画像に対応づけて当該画像が撮像された撮像時刻を格納する。
【0070】
音声格納部1020は、撮像装置100によって録音された音声を格納する。音声格納部1020は、音声に対応づけて当該音声の録音時刻を格納する。具体的には、音声格納部1020は、撮像装置100の周囲の音声を格納する。なお、録音時刻とは、音声の録音を開始した時刻であってよく、録音を終了した時刻であってよい。
【0071】
特徴音抽出部1094は、音声格納部1020が格納する音声から予め定められた種類の音声を抽出する。具体的には、音声取得部1096は、複数の種類の音声を格納する音声データベースから、特徴音抽出部1094が抽出した音声と同一の種類の音声を取得する。例えば、特徴音抽出部1094は、音声格納部1020が格納する音声から音楽を抽出する。そして、音声取得部1096は、複数の音楽を格納する音楽データベース172から、特徴音抽出部1094が抽出した音楽と同一の種類の音楽を取得する。他にも、音声取得部1096は、環境音データベース174から、特徴音抽出部1094が抽出した環境音と同一の種類の環境音を取得する。なお、音声取得部1096が音楽又は環境音等の音声を取得する具体的な動作は、図9で説明した音声取得部696の動作と同一であるので、説明を省略する。
【0072】
出力要求取得部1048は、画像格納部1010が格納する画像の出力要求を取得する。許容時間設定部1043は、出力要求取得部1048が出力要求を取得した時刻と、画像格納部1010が格納する画像の撮像時刻との差がより大きい場合に、音声を抽出する期間である許容時間をより長く設定する。そして、特徴音抽出部1094は、画像が撮像された時刻から予め設定された許容時間内に録音された音声から音楽を抽出する。出力部1024は、音声取得部1096が取得した音声と画像格納部1010が格納する画像とを同期して出力する。具体的には、出力部1024は、音声取得部1096が取得した音楽又は環境音と、画像格納部1010が格納する画像とを同期して出力する。
【0073】
本実施形態の出力装置1040によれば、撮像した画像を、当該画像を撮像したときに流れていた音楽、例えば撮像当時に流行していた音楽とともにユーザ180に提供することができる。
【0074】
図11は、許容時間設定部1043が設定する許容時間の一例を示す。例えば、ユーザ180から、時刻t12で撮像された画像を出力する指示を時刻t13において受け付けた場合に、許容時間設定部1043は、出力を指示された時刻と出力される画像が撮像された時刻との差(t13−t12)に基づいて、特徴音抽出部1094に音楽を抽出する音声をさせる許容範囲Δt52を決定する。そして、特徴音抽出部1094は、音声格納部1020に格納されている音声のうち、時刻t12からΔt52だけ前又は後の時間範囲(時刻t12―Δt52〜時刻t12+Δt52)に録音された音声の中から音楽を抽出する。
【0075】
なお、特徴音抽出部1094は、時刻t12から許容範囲Δt52だけ前の時刻から時刻t12までの間に録音された音声の中から音声を抽出してもよいし、時刻t12から許容範囲Δt52だけ後の時刻までの間に録音された音声の中から音声を抽出してもよい。
【0076】
また、許容時間設定部1043は、画像格納部1010が格納する撮像画像が撮像された時刻と、出力する指示を受け付けた時刻との差が大きいほど、許容時間をより大きく設定する。図11の例では、許容時間設定部1043は、時刻t12よりも前の時刻t11に撮像された画像を出力するよう時刻t13において指示された場合には、許容範囲Δt52に比べて時間的により長い許容範囲Δt51を設定する。そして、特徴音抽出部1094は、時刻(t11−Δt51)から時刻(t11+Δt51)までの時間範囲内で録音された音声の中から音楽を抽出する。
【0077】
なお、許容時間設定部1043は、撮像された時刻と出力を指示された時刻との間の時間を予め定められた数で割って得られた期間を許容時間として設定してよい。この場合、特徴音抽出部1094は、例えば10日前に撮像した画像を出力するときには、撮像時刻の前後1日の間に録音された音声から音楽を抽出する。また、特徴音抽出部1094は、10年前に撮像した画像を出力するときには、撮像時刻の前後1年の間に録音された音声の中から音楽を抽出する。
【0078】
以上説明した出力装置1040によれば、例えば観光地を移動する車内で聴いたFM放送の音楽、観光地で立ち寄った店内を流れていた有線放送の音楽等、ユーザ180が訪れた場所で流れていた音楽を適切に判断して、その音楽をダウンロードしてきて画像とともに再生することができる。また、出力装置1040は、ユーザ180が訪れた場所の環境音と同種の環境音をダウンロードして画像とともに再生することができる。また、出力装置1040は、より過去に撮像された画像を出力するときには、撮像された時刻を含むより広い時間範囲で録音された音声の中から音楽、環境音を含む音声を選択するので、ユーザ180は撮像当時に最も流行していた音楽を思い出しながら楽しく画像を鑑賞することができる。
【0079】
図12は、出力装置140、撮像装置600、及び出力装置1040に係るコンピュータ1500のハードウェア構成の一例を示す。コンピュータ1500は、ホスト・コントローラ1582により相互に接続されるCPU1505、RAM1520、グラフィック・コントローラ1575、及び表示装置1580を有するCPU周辺部と、入出力コントローラ1584によりホスト・コントローラ1582に接続される通信インターフェイス1530、ハードディスクドライブ1540、及びCD−ROMドライブ1560を有する入出力部と、入出力コントローラ1584に接続されるROM1510、フレキシブルディスク・ドライブ1550、及び入出力チップ1570を有するレガシー入出力部とを備える。
【0080】
ホスト・コントローラ1582は、RAM1520と、高い転送レートでRAM1520をアクセスするCPU1505、及びグラフィック・コントローラ1575とを接続する。CPU1505は、ROM1510、及びRAM1520に格納されたプログラムに基づいて動作し、各部の制御を行う。グラフィック・コントローラ1575は、CPU1505等がRAM1520内に設けたフレーム・バッファ上に生成する画像データを取得し、表示装置1580上に表示させる。これに代えて、グラフィック・コントローラ1575は、CPU1505等が生成する画像データを格納するフレーム・バッファを、内部に含んでもよい。
【0081】
入出力コントローラ1584は、ホスト・コントローラ1582と、比較的高速な入出力装置であるハードディスクドライブ1540、通信インターフェイス1530、CD−ROMドライブ1560を接続する。ハードディスクドライブ1540は、コンピュータ1500内のCPU1505が使用するプログラム、及びデータを格納する。通信インターフェイス1530は、ネットワークを介して出力装置140、撮像装置600、又は出力装置1040と通信し、出力装置140、撮像装置600、又は出力装置1040にプログラム、及びデータを提供する。CD−ROMドライブ1560は、CD−ROM1595からプログラムまたはデータを読み取り、RAM1520を介してハードディスクドライブ1540、及び通信インターフェイス1530に提供する。
【0082】
また、入出力コントローラ1584には、ROM1510と、フレキシブルディスク・ドライブ1550、及び入出力チップ1570の比較的低速な入出力装置とが接続される。ROM1510は、コンピュータ1500が起動時に実行するブート・プログラムや、コンピュータ1500のハードウェアに依存するプログラム等を格納する。フレキシブルディスク・ドライブ1550は、フレキシブルディスク1590からプログラムまたはデータを読み取り、RAM1520を介してハードディスクドライブ1540、及び通信インターフェイス1530に提供する。入出力チップ1570は、フレキシブルディスク・ドライブ1550や、例えばパラレル・ポート、シリアル・ポート、キーボード・ポート、マウス・ポート等を介して各種の入出力装置を接続する。
【0083】
RAM1520を介して通信インターフェイス1530に提供されるプログラムは、フレキシブルディスク1590、CD−ROM1595、またはICカード等の記録媒体に格納されて利用者によって提供される。プログラムは、記録媒体から読み出され、RAM1520を介して通信インターフェイス1530に提供され、ネットワークを介して出力装置140、撮像装置600、又は出力装置1040に送信される。出力装置140、撮像装置600、又は出力装置1040に送信されたプログラムは、出力装置140、撮像装置600、又は出力装置1040においてインストールされて実行される。
【0084】
出力装置140にインストールされて実行されるプログラムは、出力装置140を図1から図5において説明した出力装置140として機能させる。また、撮像装置600にインストールされて実行されるプログラムは、撮像装置600を、図6から図9において説明した撮像装置600として機能させる。また、出力装置1040にインストールされて実行されるプログラムは、出力装置1040を、図10及び図11において説明した出力装置1040として機能させる。
【0085】
以上に示したプログラムは、外部の記憶媒体に格納されてもよい。記憶媒体としては、フレキシブルディスク1590、CD−ROM1595の他に、DVDやPD等の光学記録媒体、MD等の光磁気記録媒体、テープ媒体、ICカード等の半導体メモリ等を用いることができる。また、専用通信ネットワークやインターネットに接続されたサーバシステムに設けたハードディスクまたはRAM等の記憶装置を記録媒体として使用し、ネットワークを介してプログラムをコンピュータ1500に提供してもよい。
【0086】
以上、実施形態を用いて本発明を説明したが、本発明の技術的範囲は上記実施形態に記載の範囲には限定されない。上記実施形態に、多様な変更又は改良を加えることができる。そのような変更又は改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。
【図面の簡単な説明】
【0087】
【図1】音声提供システムの一例を示す図である。
【図2】出力装置140のブロック構成の一例を示す図である。
【図3】説明音データベース170が格納するデータの一例をテーブル形式で示す図である。
【図4】画像が撮像された位置の分布の一例を示す図である。
【図5】画像が撮像された時刻の分布の一例を示す図である。
【図6】撮像装置600のブロック構成の一例を示す図である。
【図7】音楽データベース172が格納するデータの一例をテーブル形式示す図である。
【図8】撮像装置600が録音する音声と時間範囲の一例を示す図である。
【図9】音楽を取得する手順の一例を示す図である。
【図10】出力装置1040のブロック構成の一例を示す図である。
【図11】許容時間の一例を示す図である。
【図12】コンピュータ1500のハードウェア構成の一例を示す図である。
【符号の説明】
【0088】
100 撮像装置
140 出力装置
150 通信回線
170 説明音データベース
172 音楽データベース
174 環境音データベース
180 ユーザ
210 画像格納部
224 出力部
262 音声取得部
278 画像選択部
282 撮像領域判断部
284 撮像期間判断部
286 撮像位置分布算出部
288 撮像枚数算出部
600 撮像装置
602 撮像部
650 録音部
660 条件格納部
670 表示部
692 モード設定部
694 特徴音抽出部
696 音声取得部
698 データ格納部
1010 画像格納部
1020 音声格納部
1024 出力部
1040 出力装置
1043 許容時間設定部
1048 出力要求取得部
1060 条件格納部
1094 特徴音抽出部
1096 音声取得部
1044 出力時刻検出部

【特許請求の範囲】
【請求項1】
撮像部と、
前記撮像部の周囲の音声を録音する録音部と、
前記録音部が録音した音声から予め定められた種類の音声を抽出する特徴音抽出部と、
複数の種類の音声を格納する音声データベースから、前記特徴音抽出部が抽出した音声と同一の種類の音声を取得する音声取得部と、
前記音声取得部が取得した音声と前記撮像部が撮像した画像とを同期して出力させるべく対応づけて格納するデータ格納部と
を備える撮像装置。
【請求項2】
前記特徴音抽出部は、前記撮像部が画像を撮像した時刻から予め設定された時間内に、前記録音部が録音した音声から予め定められた種類の音声を抽出する
請求項1に記載の撮像装置。
【請求項3】
前記撮像部が有する受光素子により受光した光の画像を表示する表示部と、
前記表示部が画像を表示している状態の動作モードである撮像モード、又は前記表示部が画像を表示していない状態の動作モードである非撮像モードに当該撮像装置を設定するモード設定部と
をさらに備え、
前記録音部は、前記モード設定部が前記撮像モードに設定している場合、及び前記モード設定部が前記非撮像モードに設定している場合の双方において、前記撮像部の周囲の音声を録音する
請求項2に記載の撮像装置。
【請求項4】
前記特徴音抽出部は、前記モード設定部が前記撮像モードに設定している時間を含み、前記モード設定部が前記撮像モードに設定している時間より長い、予め設定された時間内に、前記録音部が録音した音声から予め定められた種類の音声を抽出する
請求項3に記載の撮像装置。
【請求項5】
前記音声データベースは、複数の音楽を格納しており、
前記特徴音抽出部は、前記録音部が録音した音声から音楽を抽出し、
前記音声取得部は、前記音声データベースから、前記特徴音抽出部が抽出した音楽と同一の音楽を取得する
請求項1に記載の撮像装置。
【請求項6】
前記音声データベースは、時代別に複数の音楽を格納しており、
前記特徴音抽出部は、前記録音部が録音した音声から音楽を抽出し、
前記音声取得部は、前記音声データベースから、前記特徴音抽出部が抽出した音楽と同じ時代の音楽を取得する
請求項1に記載の撮像装置。
【請求項7】
前記音声データベースは、ジャンル別に複数の音楽を格納しており、
前記特徴音抽出部は、前記録音部が録音した音声から音楽を抽出し、
前記音声取得部は、前記音声データベースから、前記特徴音抽出部が抽出した音楽と同じジャンルの音楽を取得する
請求項1に記載の撮像装置。
【請求項8】
前記特徴音抽出部が抽出する環境音のそれぞれの種類を特定する条件を予め格納する条件格納部
をさらに備え、
前記音声データベースは、環境音の種類別に複数の環境音を格納しており、
前記特徴音抽出部は、前記条件格納部が格納する条件に一致する環境音を、前記録音部が録音した音声から抽出し、
前記音声取得部は、前記音声データベースから、前記特徴音抽出部が抽出した環境音と同一の種類の環境音を取得し、
前記データ格納部は、前記音声取得部が取得した環境音と前記撮像部が撮像した画像とを同期して出力させるべく対応づけて格納する
請求項1に記載の撮像装置。
【請求項9】
画像を撮像部により撮像する撮像段階と、
前記撮像部の周囲の音声を録音する録音段階と、
前記録音段階において録音された音声から予め定められた種類の音声を抽出する特徴音抽出段階と、
複数の種類の音声を格納する音声データベースから、前記特徴音抽出段階において抽出された音声と同一の種類の音声を取得する音声取得段階と、
前記音声取得段階において取得された音声と前記撮像部が撮像した画像とを同期して出力させるべく対応づけて格納するデータ格納段階と
を備える撮像方法。
【請求項10】
画像を撮像する撮像装置用のプログラムであって、前記撮像装置を、
画像を撮像する撮像部、
前記撮像部の周囲の音声を録音する録音部、
前記録音部が録音した音声から予め定められた種類の音声を抽出する特徴音抽出部、
複数の種類の音声を格納する音声データベースから、前記特徴音抽出部が抽出した音声と同一の種類の音声を取得する音声取得部、
前記音声取得部が取得した音声と前記撮像部が撮像した画像とを同期して出力させるべく対応づけて格納するデータ格納部
として機能させるプログラム。
【請求項11】
撮像装置によって撮像された画像を格納する画像格納部と、
前記撮像装置によって録音された音声を格納する音声格納部と、
前記音声格納部が格納する音声から予め定められた種類の音声を抽出する特徴音抽出部と、
複数の種類の音声を格納する音声データベースから、前記特徴音抽出部が抽出した音声と同一の種類の音声を取得する音声取得部と、
前記音声取得部が取得した音声と前記画像格納部が格納する画像とを同期して出力する出力部と
を備える出力装置。
【請求項12】
前記画像格納部は、画像に対応づけて当該画像の撮像時刻を格納しており、
前記音声格納部は、音声に対応づけて当該音声の録音時刻を格納しており、
前記特徴音抽出部は、画像が撮像された時刻から予め設定された許容時間内に録音された音声から予め定められた種類の音声を抽出する
請求項11に記載の出力装置。
【請求項13】
前記画像格納部が格納する画像の出力要求を取得する出力要求取得部と、
前記出力要求取得部が出力要求を取得した時刻と、前記画像格納部が格納する画像の撮像時刻との差がより大きい場合に、前記許容時間をより長く設定する許容時間設定部と
をさらに備える請求項12に記載の出力装置。
【請求項14】
撮像装置によって撮像された画像を格納する画像格納段階と、
前記撮像装置によって録音された音声を格納する音声格納段階と、
前記音声格納段階において格納される音声から予め定められた種類の音声を抽出する特徴音抽出段階と、
複数の種類の音声を格納する音声データベースから、前記特徴音抽出段階において抽出された音声と同一の種類の音声を取得する音声取得段階と、
前記音声取得段階において取得された音声と前記画像格納段階において格納される画像とを同期して出力する出力段階と
を備える出力方法。
【請求項15】
画像を出力する出力装置用のプログラムであって、前記出力装置を、
画像を撮像する撮像部、
前記撮像部の周囲の音声を録音する録音部、
前記録音部が録音した音声から予め定められた種類の音声を抽出する特徴音抽出部、
複数の種類の音声を格納する音声データベースから、前記特徴音抽出部が抽出した音声と同一の種類の音声を取得する音声取得部、
前記音声取得部が取得した音声と前記撮像部が撮像した画像とを同期して出力させるべく対応づけて格納するデータ格納部
として機能させるプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate


【公開番号】特開2006−304257(P2006−304257A)
【公開日】平成18年11月2日(2006.11.2)
【国際特許分類】
【出願番号】特願2005−361061(P2005−361061)
【出願日】平成17年12月14日(2005.12.14)
【出願人】(000005201)富士写真フイルム株式会社 (7,609)
【Fターム(参考)】