説明

情報処理装置及び方法、並びにプログラム

【課題】撮像の結果得られる被写体に係る撮像情報からより容易に音を生成する。
【解決手段】ディジタルカメラ1では、撮像情報取得部21Aは、被写体に係る撮像情報を取得し、音検出部21Bは、被写体に係る撮像情報が取りうる値と所定の音とを対応付けるドレミファマップに基づいて、撮像情報取得部21Aにより取得された被写体に係る撮像情報に対応する音を検出する。検出された音は対応する音声信号がスピーカ25から出力される。本発明は、例えば、ディジタルカメラに適用できる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は情報処理装置及び方法、並びにプログラムに関し、特に、例えば、撮像の結果得られる被写体に係る撮像情報からより容易に音を生成することができるようにする情報処理装置及び方法、並びにプログラムに関する。
【背景技術】
【0002】
現在普及している多くのディジタルスチルカメラやディジタルビデオカメラ(以下、適宜、カメラと称する)には、様々なセンサが搭載されており、また、記録した音を再生するための音源も用意されている。そのようなカメラにセンサ情報の入力に応じた音を出力させて、電子楽器として利用できるようにすることが提案されている。
【0003】
例えば、特許文献1乃至3の発明では、カメラによる撮像の結果得られた撮像画像に基づいて、所定の音が生成される。
【特許文献1】特開2000−276139号公報
【特許文献2】特開2005−316300号公報
【特許文献3】実登3098423号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
特許文献1乃至3の発明では、撮像画像に対して動き検出という高度な画像解析を行う必要があるので処理時間がかかっていた。そのため、例えば演奏者の動きがあってから音が出力されるまでに遅れが生じるので、演奏に違和感があった。
【0005】
本発明は、このような状況に鑑みてなされたものであり、例えば、撮像の結果得られる被写体に係る撮像情報からより容易に音を生成することができるようにするものである。
【課題を解決するための手段】
【0006】
本発明の一側面の情報処理装置は、撮像の結果得られる被写体に係る撮像情報に基づいて、所定の音を生成する情報処理装置において、前記撮像情報を取得する取得手段と、前記撮像情報が取りうる値と所定の音とを対応付ける対応情報に基づいて、前記取得手段により取得された前記撮像情報に対応する音を検出する検出手段とを備える。
【0007】
本発明の一側面の情報処理装置は、前記検出手段により検出された前記音を出力する出力手段をさらに備える。
【0008】
本発明の一側面の情報処理方法またはプログラムは、撮像の結果得られる被写体に係る撮像情報に基づいて、所定の音を生成する情報処理方法または情報処理をコンピュータに実行させるプログラムにおいて、前記撮像情報を取得する取得ステップと、前記撮像情報が取りうる値と所定の音とを対応付ける対応情報に基づいて、前記取得ステップの処理により取得された前記撮像情報に対応する音を検出する検出ステップとを含む情報処理方法または情報処理をコンピュータに実行させるプログラム。
【0009】
本発明の一側面においては、撮像の結果得られる被写体に係る撮像情報が取得され、前記被写体に係る撮像情報が取りうる値と所定の音とを対応付ける対応情報に基づいて、取得された前記被写体に係る撮像情報に対応する音が検出される。
【発明の効果】
【0010】
本発明の一側面によれば、例えば、撮像の結果得られる被写体に係る撮像情報からより容易に音を生成することができる。
【発明を実施するための最良の形態】
【0011】
以下に本発明の実施の形態を説明するが、本発明の構成要件と、明細書又は図面に記載の実施の形態との対応関係を例示すると、次のようになる。この記載は、本発明をサポートする実施の形態が、明細書又は図面に記載されていることを確認するためのものである。従って、明細書又は図面中には記載されているが、本発明の構成要件に対応する実施の形態として、ここには記載されていない実施の形態があったとしても、そのことは、その実施の形態が、その構成要件に対応するものではないことを意味するものではない。逆に、実施の形態が構成要件に対応するものとしてここに記載されていたとしても、そのことは、その実施の形態が、その構成要件以外の構成要件には対応しないものであることを意味するものでもない。
【0012】
本発明の一側面の情報処理装置は、
撮像の結果得られる被写体に係る撮像情報(例えば、ヒストグラムのピークの輝度値と画素数)に基づいて、所定の音を生成する情報処理装置(例えば、図3のディジタルカメラ1)において、
前記被写体に係る撮像情報を取得する取得手段(例えば、図3の撮像情報取得部21A)と、
前記被写体に係る撮像情報が取りうる値と所定の音とを対応付ける対応情報に基づいて、前記取得手段により取得された前記被写体に係る撮像情報に対応する音を検出する検出手段(例えば、図3の音検出部21B)と
を備える。
【0013】
本発明の一側面の情報処理装置は、
前記検出手段により検出された音を出力する出力手段(例えば、図3のスピーカ25)をさらに備える。
【0014】
本発明の一側面の情報処理方法またはプログラムは、
撮像の結果得られる被写体に係る撮像情報に基づいて、所定の音を生成する情報処理方法または情報処理をコンピュータに実行させるプログラムにおいて、
前記被写体に係る撮像情報を取得する取得ステップ(例えば、図5のステップS4)と、
前記被写体に係る撮像情報が取りうる値と所定の音とを対応付ける対応情報に基づいて、前記取得ステップの処理により取得された前記被写体に係る撮像情報に対応する音を検出する検出ステップ(例えば、図5のステップS5)と
を含む情報処理方法または情報処理をコンピュータに実行させるプログラム。
【0015】
以下、図面を参照して本発明を適用した実施の形態について説明する。
【0016】
図1は、本発明を適用したディジタルカメラ1の利用例を示している。ディジタルカメラ1は、図1に示すように、撮像するユーザの手の位置に応じた所定の音(例えば、「ド」,「レ」,「ミ」、・・・等の音階を構成する音)を出力することができる。
【0017】
例えば、世界最古の電子楽器とされているテルミンを用いる場合、演奏者は、そのテルミンを構成するアンテナに対して自身の手を遠ざけたり近づけたりすることで演奏を行う。すなわちディジタルカメラ1により、このテルミンと同様に、そのディジタルカメラ1を構成する撮像レンズ11に対してユーザの手を遠ざけたり近づけたりすることで演奏を行うことができる。
【0018】
詳細は後述するがディジタルカメラ1は、撮像するユーザの手の位置に応じて変化する、撮像の結果得られる被写体に係る撮像情報に応じて、所定の音(例えば、「ド」,「レ」,「ミ」、・・・等の音階を構成する音)を出力する。ここでは、被写体に係る撮像情報として、図2に示すような階級が明るさ(輝度値)、度数が画素数であるヒストグラムから得られるピークの値(輝度値と画素数)が用いられる。
【0019】
このヒストグラムは、例えば撮像の際に逆光の検出において利用されるため、このヒストグラムを生成する機能は、カメラに通常搭載されており、このヒストグラムの生成がカメラの制御周期でスムーズに動作することに関しては、非常に高い実績がある。ディジタルカメラ1では、このように生成されるヒストグラムからそのピークの値を求め、その値に応じて音に変換する処理(以下、音変換処理と称する)が行われる。
【0020】
このようにディジタルカメラ1における音変換処理では、画像に比べて情報量の少ないヒストグラムを処理するので、情報の処理量は少ない。したがって、音変換処理を迅速に行うことができるので、演奏者の動きがあってから音声が出力されるまでの遅れが少なくなり、スムーズな演奏が可能になる。
【0021】
また、このディジタルカメラ1を用いる演奏では、動きを検出する従来の方法のように例えば演奏者が上下に腕を振るといった演奏者の大きな動きが要求されておらず、例えば音階上の隣りの音を出力させるための演奏者の手の動きは10cm未満であり、一般的な楽器の演奏スタイルに近くなっている。図1の例では、ユーザの手から撮像レンズ11までの距離は、0cm(撮像レンズ11が手で覆われた状態に相当)から最大で30〜50cm程度であり、この範囲で手を動かすことで、1オクターブ程度の例えば9つの音を出力させることができる。
【0022】
また一般的なディジタルカメラは、図2に示すようなヒストグラムを生成する機能と、記録した音を再生するための音源を有しているので、一般的なディジタルカメラに後述する音変換処理を実行する機能を付加するだけで、ディジタルカメラで電子楽器を構成することができる。
【0023】
図3は、このようなディジタルカメラ1の構成例を示すブロック図である。
【0024】
ディジタルカメラ1は、撮像レンズ11、撮像素子12、アナログ信号処理部13、A/D(Analog/Digital)変換部14、ディジタル信号処理部15、I/O(input output)制御部16、メモリカード17、制御バス18、レンズ制御部19、操作入力部20、制御部21、画像RAM22、フラッシュメモリ23、音声信号生成処理部24、スピーカ25、映像信号生成処理部26、及びLCD(Liquid Crystal Display)パネル27から構成される。
【0025】
例えばCCD(Charge Coupled Device)等よりなる撮像素子12は、撮像レンズ11を介して入射する被写体からの光を受光して光電変換を行い、その光の受光量に応じた電気信号としてのアナログの画像信号をアナログ信号処理部13に供給する。
【0026】
アナログ信号処理部13は、撮像素子12から供給されるアナログの画像信号の増幅、ガンマ補正、ホワイトバランス調整などのアナログ信号処理を行い、その結果得られる画像信号をA/D変換部14に供給する。
【0027】
A/D変換部14は、アナログ信号処理部13からのアナログ信号の画像信号をA/D変換し、その結果得られるディジタル信号の画像データをディジタル信号処理部15に供給する。
【0028】
ディジタル信号処理部15は、制御バス18を介して行われる制御部21による制御に従って、A/D変換部14から供給される画像データに対してノイズ除去処理等のディジタル信号処理を施し、その結果得られる撮像画像(の画像データ)を、順次、制御バス18及び映像信号生成処理部26を介して、LCDパネル27に供給して表示させる(このような表示を、以下、スルー画表示と称する)。ディジタル信号処理部15は、ユーザによる例えば操作入力部20のシャッターボタンの操作に基づいて、上述したディジタル信号処理の結果得られる撮像画像(の画像データ)を、例えば、JPEG(Joint Photographic Experts Group)方式等で圧縮し、その結果得られる圧縮画像データを、制御バス18及びI/O制御部16を介して、メモリカード17に供給して記憶させる。
【0029】
ディジタル信号処理部15は、ディジタル信号処理の結果得られる撮像画像から上述したヒストグラムを生成し、制御バス18を介して制御部21に供給する。このヒストグラムは、音変換処理の他、制御部21で、逆光の検出に用いられる。また、ディジタル信号処理部15は、ディジタル信号処理の結果得られる撮像画像からコントラストを求め、制御バス18を介して制御部21に供給する。このコントラストは、制御部21で、フォーカスを合わせるためのレンズ制御部19の制御に用いられる。
【0030】
I/O制御部16は、ディジタル信号処理部15からの圧縮画像データを、メモリカード17に供給して記憶させる。また、I/O制御部16は、制御部21の制御に基づいて、例えばメモリカード17に記憶されている圧縮画像データを読み出し、制御バス18上に供給する。
【0031】
メモリカード17は、ディジタルカメラ1に着脱可能な状態で接続された、例えばMS(Memory Stick)(メモリースティック(商標))等の半導体メモリであり、I/O制御部16の制御に基づいて、圧縮画像データ等を記憶する。レンズ制御部19は、制御部21の制御に基づいて、撮像レンズ11の例えば図示せぬフォーカスレンズを駆動する制御を行う。
【0032】
操作入力部20は、例えば図示せぬボタン等で構成され、そのボタン等に対するユーザの操作に基づいて、その操作に対応するデータやコマンド等を入力し、制御部21に供給する。
【0033】
制御部21は、例えばCPU(Central Processing Unit)等から構成され、フラッシュメモリ23に記憶されているプログラムを読み出し、内蔵する図示せぬRAM(Random Access Memory)に展開して実行することにより、ディジタルカメラ1を構成する各部を制御する。制御部21は、例えば所定の制御周期でディジタル信号処理部15で生成されたヒストグラムを用いて逆光を検出する。
【0034】
また、制御部21は、ディジタル信号処理部15で生成されたヒストグラムを音に変換する音変換処理を行い、その結果得られる音情報を、制御バス18を介して音声信号生成処理部24に供給する。
【0035】
画像RAM22は、例えば、撮像画像(の画像データ)をメモリカード17に記憶させるときのディジタル信号処理部15による撮像画像の画像データの圧縮処理や、メモリカード17に記憶されている圧縮画像データに対応する画像をLCDパネル27に表示するときのディジタル信号処理部15による圧縮画像データの伸張処理において生じるデータ等を一時的に記憶する。
【0036】
フラッシュメモリ23は、制御部21が実行するプログラムや、後述するドレミファマップといった各種の設定情報、その他、ディジタルカメラ1の電源がオフにされたときも保持しておく必要があるデータ等を記憶する。
【0037】
音声信号生成処理部24は、内蔵音源であり、制御部21からの音情報に対応する周波数の正弦波の音信号を生成し、生成した音信号を、スピーカ25に供給する。スピーカ25は、音声信号生成処理部24から供給される音信号に対応する音を、外部に出力する。
【0038】
映像信号生成処理部26は、ディジタル信号処理部15からの撮像画像の画像データや、メモリカード17からの圧縮画像データ、制御部21からの表示データ等に基づいて画像信号を生成し、生成した画像信号を、LCDパネル27に供給する。LCDパネル27は、映像信号生成処理部26から供給される画像信号に対応する画像をその表示画面に表示する。
【0039】
次に、制御部21の音変換処理を実現する機能的構成例について説明する。
【0040】
制御部21は、撮像情報取得部21A及び音検出部21Bから構成される。
【0041】
撮像情報取得部21Aは、ディジタル信号処理部15からの生成されたヒストグラムのピークを決定し、決定したピークの階級と度数(すなわち輝度値と画素数)を、被写体に係る撮像情報として取得する。
【0042】
例えば図2に示すように、ある輝度値における画素数が、その左右の輝度値のいずれに対しても大きい山の頂点が(図中点線で囲まれた点)がピークに決定され、そのピークの輝度値と画素数が、そのときの被写体に係る撮像情報として取得される。
【0043】
なお、被写体に係る撮像情報を取得する処理(撮像取得処理と称する)の詳細は、後述する。
【0044】
撮像情報取得部21Aは、取得した被写体に係る撮像情報を、音検出部21Bに供給する。
【0045】
音検出部21Bは、撮像情報取得部21Aから供給された被写体に係る撮像情報に対応する音を検出する。
【0046】
具体的には、音検出部21Bは、フラッシュメモリ23に記憶された被写体に係る撮像情報が取りうる値(ピークの輝度値と画素数のセットが取りうる輝度値と画素数のセット)と音とを対応付ける対応情報としてのドレミファマップに基づいて、撮像情報取得部21Aから供給された被写体に係る撮像情報(ピークの輝度値と画素数のセット)に対応する音を検出し、その音情報を、制御バス18を介して音声信号生成処理部24に供給する。
【0047】
図4は、ドレミファマップの例を示している。このドレミファマップにおける縦軸と横軸は、図2のヒストグラムの縦軸と横軸と同様に、画素数と明るさ(輝度値)を示している。
【0048】
ドレミファマップ上の各領域(図中線で区切られた部分)には、所定の音が割り当てられている。この例の場合、ドレミファマップの左側(輝度値が比較的小さい側)において上から下(画素数が多い方から少ない方)に向かって順に、例えば「ド'」(「ド」の1オクターブ上の「ド」)、「ラ」、「ファ」、「ミ」、「レ」、無音が割り当てられ、右側(輝度値が比較的大きい側)において上から下(画素数が多い方から少ない方)に向かって順に、「ド'」、「シ」、「ソ」、「ミ」、「レ」、「ド」、無音が割り当てられている。
【0049】
例えば、撮像情報取得部21Aから供給された被写体に係る撮像情報が、図2のヒストグラムから得られた図2中点線で囲まれたピークの輝度値と画素数である場合、その輝度値と画素数の図4中点線で囲まれた点を含む領域に割り当てられた音「シ」が検出される。
【0050】
なお、図4の例では、ドレミファマップの各領域の輝度値方向及び画素数方向の幅は、演奏者の手が多少傾く等してピークの輝度値や画素数が変化しても、検出される音が急激に変化しないようにするもので、演奏者の意図しない手のブレ等に対するいわば不感帯として設けられている。
【0051】
また、このドレミファマップの複数の領域に同じ音(例えば、図4中の「レ」と「ミ」)が割り当てられてもよく、音の割り当てや割り当てる音の範囲は、例えば、使用するカメラ等に応じて任意に設定することができる。
【0052】
例えば、このドレミファマップに対する音の割り当てを、ユーザの手が撮像レンズ11を覆う面積(あるいはユーザの手と撮像レンズ11との間の距離)と音階上の音の高さとの関係が、ほぼ線形になるように行うことができる。このようにすることで、ユーザは、演奏の際に出力しようとする音をより直感的に予想することができる。
【0053】
次に、図5を参照して、音出力処理におけるディジタルカメラ1の動作について説明する。
【0054】
音出力処理は、ディジタルカメラ1の電源がオンされると開始される。
【0055】
なお、ディジタルカメラ1には、音出力処理を行うかどうかを設定することができるが、ここでは、音出力処理を行う設定がなされているものとする。また、ディジタルカメラ1には、スルー画表示を行うかどうかを設定することができるが、ここでは、スルー画表示を行う設定がなされているものとする。
【0056】
ステップS1において、制御部21は、ディジタルカメラ1の各部(デバイス)を初期化させる。そして、各部の初期化が終了すると、スルー画表示が開始され、撮像された撮像画像が順次LCDパネル27に表示される。この際、画像データが、A/D変換部14からディジタル信号処理部15に供給される。
【0057】
ステップS2において、ディジタル信号処理部15は、A/D変換部14から供給される画像データにディジタル信号処理を施し、その結果得られる撮像画像から上述したヒストグラムを生成し、制御バス18を介して制御部21に供給する。
【0058】
ステップS3において、制御部21は、ディジタル信号処理部15で生成されたヒストグラムから、そのヒストグラムを、例えば、図2に示すような棒グラフで表示するための表示データを生成する。
【0059】
ステップS4において、制御部21の撮像情報取得部21Aは、ディジタル信号処理部15で生成されたヒストグラムから、被写体に係る撮像情報を取得する撮像情報取得処理を行う。この撮像情報取得処理の詳細を、図6のフローチャートを参照して説明する。
【0060】
ステップS21において、撮像情報取得部21Aは、ディジタル信号処理部15で生成されたヒストグラムに対して、山の頂点を検出する。
【0061】
例えば、図7に示すような生成されたヒストグラムの場合、3つの点(図中点線で囲まれた3つの点m1乃至点m3)が山の頂点として検出される。
【0062】
ステップS22において、撮像情報取得部21Aは、検出した山の頂点が1つであるかを判定する。ステップS22において、検出した山の頂点が1つでないと判定された場合、ステップS23において、撮像情報取得部21Aは、最も画素数が大きい山の頂点に対して画素数が所定の範囲内にある山の頂点が存在するかを判定する。
【0063】
ステップS23において、最も画素数が大きい山の頂点に対して画素数が所定の範囲内にある山の頂点が(最も画素数が大きい山の頂点以外に)存在すると判定された場合、ステップS24において、撮像情報取得部21Aは、最も画素数が大きい山の頂点とこの画素数が所定の範囲内にある山の頂点について画素数または輝度値を平均したものを画素数または輝度値にする点をピークに決定する。そして、処理はステップS26に進む。
【0064】
例えば図7に示すような生成されたヒストグラムの場合、最も画素数が大きい山の頂点m1に対して画素数が所定の範囲d内に山の頂点m2が存在するので、最も画素数が大きい山の頂点m1とこの山の頂点m2について画素数または輝度値を平均したものを画素数または輝度値にする点Pがピークに決定される。
【0065】
ステップS22において、検出した山の頂点が1つであると判定されたか、あるいは、S23において、最も画素数が大きい山の頂点に対して画素数が所定の範囲内に山の頂点が(最も画素数が大きい山の頂点以外に)存在しないと判定された場合、ステップS25において、撮像情報取得部21Aは、その(1つの)山の頂点をピークに決定する。そして、処理はステップS26に進む。
【0066】
例えば図2に示すような生成されたヒストグラムの場合、このヒストグラムの山の頂点(図中点線で囲まれた点)が1つなので、この山の頂点がピークに決定される。
【0067】
ステップS26において、撮像情報取得部21Aは、ステップS24またはステップS25で決定したピークの画素数と輝度値を、被写体に係る撮像情報として取得する。そして、撮像情報取得処理は終了し、処理は図5のステップS5に戻る。
【0068】
ステップS5において、音検出部21Bは、フラッシュメモリ23に記憶されているドレミファマップに基づいて、撮像情報取得部21Aで取得された被写体に係る撮像情報としてのピークの輝度値と画素数を含むドレミファマップ上の領域に割り当てられた音を検出し、その音情報を、制御バス18を介して音声信号生成処理部24に供給する。
【0069】
例えば取得された被写体に係る撮像情報が、図2のヒストグラムから得られた図2中点線で囲まれたピークの輝度値と画素数である場合、その輝度値と画素数の図4中点線で囲まれた点を含む領域に割り当てられた音「シ」が検出される。
【0070】
なお、上述した音変換処理は、これらのステップS4及びS5から構成される。
【0071】
ステップS6において、制御部21は、ステップS5で検出した音を示す情報、例えば、その音が「ド」である場合、「ド」と表示するための表示データを生成する。そして、制御部21は、この生成した表示データと、ステップS3で生成したヒストグラムの表示データとをまとめて制御バス18を介して映像信号生成処理部26に供給する。映像信号生成処理部26は、例えば、制御部21からのこれらの表示データと、ディジタル信号処理部15からの対応する撮像画像の画像データとに基づいて画像信号を生成し、生成した画像信号を、LCDパネル27に供給して、撮像画像、そのヒストグラム、及びそのヒストグラムに対応する音を示す情報を、その表示画面に表示させる。
【0072】
ステップS7において、音声信号生成処理部24は、制御部21からの音情報に対応する(ステップS5で音検出部21Bにより検出された音の)周波数の正弦波を生成し、音声信号として、スピーカ25に供給する。なお、音声信号生成処理部24は、制御部21からの音情報の音が他の音に変わるまで、同じ周波数の正弦波を生成してスピーカ25に供給し続けるようになされている。
【0073】
なお、音声信号生成処理部24は、制御部21からの音情報が無音を示すものの場合は、例えば音声信号を生成しないようになされている。
【0074】
ステップS8において、スピーカ25は、音声信号生成処理部24から供給される音信号に対応する音を、外部に出力する。
【0075】
これにより、ヒストグラムが生成される周期(すなわち例えば撮像の周期)で、生成されたヒストグラムから取得された被写体に係る撮像情報に対応する音が検出され、検出された音が他の音に変わるまで、その音が途切れることなく出力される。
【0076】
このようにして音出力処理が行われる。なおこの音出力処理のうちステップS2乃至S8の処理は、例えば音出力処理の終了を指示する所定のコマンドが操作入力部20から入力され音出力処理を終了する処理が実行されるまで継続して行われる。
【0077】
なお、ここでは、音出力処理において、LCDパネル27の表示画面に撮像画像、ヒストグラム、及び音を示す情報を表示するようにしたが、その他、これらのうちの一部または全てを表示しないようにすることもできる。
【0078】
以上のように、被写体に係る撮像情報としてのピークの輝度値と画素数(のセット)を取得し、ピークの輝度値と画素数のセットが取りうる輝度値と画素数のセットと所定の音とを対応付けるドレミファマップに基づいて、取得されたピークの輝度値と画素数のセットに対応する音を検出するようにしたので、被写体に係る撮像情報からより容易に音を生成することができる。
【0079】
また、撮像情報取得処理を行うことで、例えば図8に示すような生成されたヒストグラムの場合、すなわち最も画素数が大きい山の頂点が複数あるような場合でも、1つのピークを決定することができ、例えば、このような2つの山の頂点のそれぞれの画素数が微小に変化し、最も画素数が大きい山がこの2つの山の頂点の間で頻繁に入れ替わるような場合でも、そのようなヒストグラムから決定されるピークの輝度値と画素数、すなわち被写体に係る撮像情報はあまり変化しないので、出力される音が頻繁に切り替わるようなことを防ぐことができる。
【0080】
ディジタルカメラ1は、カメラを楽器として使用するという点において非常に独創的であり、カメラを楽器として使用することで、カメラの新しい楽しみ方やライフスタイルを世の中に提案することができる。
【0081】
例えば、オーロラのような自ら光を放ちその光が時間的に変化するものを入力(撮像)することで、オーロラを視覚的に楽しむだけでなく、そのオーロラに固有のBGM(back ground music)を聴覚的に楽しむこともできる。
【0082】
また、上述した被写体に係る撮像情報から音を生成する機能とカメラの基本機能と組み合わせることで、映像や静止画等の撮像画像と、その撮像画像を撮像した現場で作曲した曲とを関連付けたコンテンツをその場で作成することや、その場で自在に編集すること等といった新たな楽しみを生み出すことも期待できる。このように、現在のカメラ市場にない新たな付加価値を提案することができる。
【0083】
あるいは、ディジタルカメラ1と同じものを所持している複数人でオーケストラを構成し、一緒に音を奏でるといった楽しみも期待できる。現在、カメラの普及率は年々増加傾向にあり、多くの人々がカメラを持っているので、このようなアプリケーションが普及すれば、カメラの演奏を通じた新たな人と人との間のコミュニケーションを期待することができる。
【0084】
上述した一連の処理は、ハードウエアにより実行することもできるし、ソフトウェアにより実行することもでき、一連の処理をソフトウェアにより実行する場合、特別なシステムを用いる必要はなく、カメラという世間的にも普及率が高い既存のシステムに、このソフトウェアを載せるだけで済む。現在普及しているカメラの多くには、ヒストグラムを生成する機能と音を出力する機能が搭載されているため、このソフトウェアの導入は非常に容易である。
【0085】
本実施の形態では、光の入力から音の出力を行うようにしたが、その他、これとは逆に、音の入力から光の出力を行うようにすることもできる。この場合、カメラには、音の入力を行うマイクロフォンが必要になるが、これもほとんどのカメラに搭載されているため、音の入力から光の出力を行うようにすることは容易である。
【0086】
また、本実施の形態では、被写体に係る撮像情報としてヒストグラムの情報(ヒストグラムのピークの輝度値と画素数)を用いたが、その他、被写体に係る撮像情報としては、ユーザの動きを認識するのに用いることが可能なもの、例えば焦点距離、ホワイトバランス、検波値等の情報を用いてもよい。
【0087】
例えば、被写体に係る撮像情報として焦点距離(そのもの)を用いる場合、撮像情報取得部21Aは、制御部21で検出された焦点距離を撮像情報として取得し、音検出部21Bは、図4のドレミファマップに対応する、図9に示すような制御部21で検出される焦点距離が取りうる焦点距離と所定の音とを対応付けるものに基づいて、検出された焦点距離に対応する音を検出する。
【0088】
なお焦点距離は、制御部21により、例えばディジタル信号処理部15からのコントラストが最大になったときのディジタルカメラ1から被写体までの(推定)距離として検出される。
【0089】
本実施の形態では、ドレミファマップのデータ(マッピングデータ)は、プログラムの内部に組み込まれ、プログラムの一部としてフラッシュメモリ23に記憶されているものとしたが、マッピングデータがプログラムの内部に組み込まれているものでなければならないという制約はなく、例えばこのマッピングデータをネットワークを介してダウンロードしたものに更新したり、メモリカード17に記憶されたものに更新したりして任意に変更することも可能である。また、カメラという特徴を活かすならば、例えば、手書きの絵等のドレミファマップをこのディジタルカメラ1で撮像し、撮像した撮像画像から認識されたドレミファマップに更新することも可能である。
【0090】
なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
【0091】
なお、本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。
【図面の簡単な説明】
【0092】
【図1】ディジタルカメラ1の利用例を示す図である。
【図2】ヒストグラムの例を示す図である。
【図3】ディジタルカメラ1の構成例を示すブロック図である。
【図4】ドレミファマップの例を示す図である。
【図5】音出力処理におけるディジタルカメラ1の動作を説明するフローチャートである。
【図6】撮像情報取得処理における撮像情報取得部21Aの動作を説明するフローチャートである。
【図7】ヒストグラムの他の例を示す図である。
【図8】ヒストグラムの他の例を示す図である。
【図9】ドレミファマップの他の例を示す図である。
【符号の説明】
【0093】
1 ディジタルカメラ, 11 撮像レンズ, 12 撮像素子, 13 アナログ信号処理部, 14 A/D変換部, 15 ディジタル信号処理部, 16 I/O制御部, 17 メモリカード, 18 制御バス, 19 レンズ制御部, 20 操作入力部, 21 制御部, 21A 撮像情報取得部, 21B 音検出部, 22 画像RAM, 23 フラッシュメモリ, 24 音声信号生成処理部, 25 スピーカ, 26 映像信号生成処理部, 27 LCDパネル

【特許請求の範囲】
【請求項1】
撮像の結果得られる被写体に係る撮像情報に基づいて、所定の音を生成する情報処理装置において、
前記被写体に係る撮像情報を取得する取得手段と、
前記被写体に係る撮像情報が取りうる値と所定の音とを対応付ける対応情報に基づいて、前記取得手段により取得された前記被写体に係る撮像情報に対応する音を検出する検出手段と
を備える情報処理装置。
【請求項2】
前記取得手段は、撮像の結果得られる、階級が輝度値、度数が画素数であるヒストグラムのピークの輝度値と画素数を前記被写体に係る撮像情報として取得し、
前記検出手段は、前記ヒストグラムのピークとなり得る輝度値及び画素数と、所定の音とを対応付ける前記対応情報に基づいて、前記取得手段により取得された前記ヒストグラムのピークの輝度値と画素値に対応する記音を検出する
請求項1に記載の情報処理装置。
【請求項3】
前記取得手段は、前記ヒストグラムの山の頂点が1つの場合、その山の頂点を前記ヒストグラムのピークに決定し、前記ヒストグラムの山の頂点が複数の場合、その複数の山の頂点の画素数または輝度値を平均したものを画素数または輝度値にする点を前記ヒストグラムのピークに決定する
請求項2に記載の情報処理装置。
【請求項4】
前記取得手段は、前記ヒストグラムの山の頂点が複数ある場合、その複数の山の頂点のうち最も画素数が大きい山の頂点と、前記最も画素数が大きい山の頂点に対して画素数が所定の範囲内にある山の頂点の画素数または輝度値を平均したものを画素数または輝度値とする点を前記ヒストグラムのピークに決定する
請求項3に記載の情報処理装置。
【請求項5】
前記取得手段は、撮像の結果得られる焦点距離を前記被写体に係る撮像情報として取得し、
前記検出手段は、前記焦点距離が取りうる値と所定の音とを対応付ける前記対応情報に基づいて、前記取得手段により取得された前記焦点距離に対応する音を検出する
請求項1に記載の情報処理装置。
【請求項6】
前記検出手段により検出された音を出力する出力手段をさらに備える
請求項1に記載の情報処理装置。
【請求項7】
前記撮像装置をさらに備える
請求項1に記載の情報処理装置。
【請求項8】
撮像の結果得られる被写体に係る撮像情報に基づいて、所定の音を生成する情報処理方法において、
前記被写体に係る撮像情報を取得する取得ステップと、
前記被写体に係る撮像情報が取りうる値と所定の音とを対応付ける対応情報に基づいて、前記取得ステップの処理により取得された前記被写体に係る撮像情報に対応する音を検出する検出ステップと
を含む情報処理方法。
【請求項9】
撮像の結果得られる被写体に係る撮像情報に基づいて、所定の音を生成する情報処理をコンピュータに実行させるプログラムにおいて、
前記被写体に係る撮像情報を取得する取得ステップと、
前記被写体に係る撮像情報が取りうる値と所定の音とを対応付ける対応情報に基づいて、前記取得ステップの処理により取得された前記被写体に係る撮像情報に対応する音を検出する検出ステップと
を含む情報処理をコンピュータに実行させるプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公開番号】特開2009−25763(P2009−25763A)
【公開日】平成21年2月5日(2009.2.5)
【国際特許分類】
【出願番号】特願2007−191652(P2007−191652)
【出願日】平成19年7月24日(2007.7.24)
【出願人】(000002185)ソニー株式会社 (34,172)
【Fターム(参考)】