説明

音声表示装置及びカメラ

【課題】本発明は、単調なペット写真に変化を持たせ、誰でも楽しめるペットの写真を簡単に撮影可能とした音声表示装置、若しくは携帯機器に適用する、音声表示方法と、音声表示プログラムを提供することである。
【解決手段】本発明の音声表示方法を適用した音声表示装置の一例となるカメラ10は、ユーザの発する音声を後方音声取得部16で取得して、対象物であるペットの発する音声を前方音声取得部15で取得する音声取得ステップと。これら前方音声取得部15及び後方音声取得部16で得られた音声に従って、信号処理及び制御部11が表示内容を決定する表示内容決定ステップ、そして、この表示内容決定ステップで決定された表示内容が、表示部23に表示される表示ステップを有している。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声表示装置の音声表示方法、及び音声表示プログラムに関し、より詳細には、犬などのペットの写真を楽しむためのカメラ、及びカメラ機能を有する携帯機器へ適用する技術に関するものである。
【背景技術】
【0002】
カメラ技術のデジタル化が進展し、画像がデジタルデータとして取り扱いやすくなったことから、撮影した画像を、電子メールに添付したり、ブログやSNSに貼付けたりして楽しむ用途が増えている。また、ペットなど、身近なものが撮影の対象になることが多いが、これは家族などには愛着があって、見るだけで楽しい写真になるが、家族以外には、それほど楽しさを感じるものではなかった。
【0003】
特に、犬やネコの場合、人間とは異なり、毛皮で服装の変化があるわけでもなく、背景が自宅近辺に限られたりしていて、変化が乏しい写真になりがちであった。また、ペットの表情などは、かぶっている毛皮のせいで、画像からだけではわかりにくく、これも変化が少なく、そのときの感情を明確に可視化するような工夫が必要であった。
【0004】
更に、例えば、下記特許文献1には、ペット側に、ペットの発する音声を音声データに変換し、前記音声データに基づいて前記ペットの感情を判別、翻訳し、翻訳データを電子メールデータとして作成する手段を設けた技術が開示されている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2005−31号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、上述した特許文献1には、飼い主との関係が不明瞭であり、飼い主がどのようにペットと接したかの記録にはならないものであった。
【0007】
したがって、本発明は上記実情に鑑みてなされたものであり、その目的は、単調なペット写真に変化を持たせ、誰でも楽しめるペットの写真を簡単に撮影可能とした音声表示装置の音声表示方法、及び携帯機器上で動作する音声表示プログラムを提供することである。
【課題を解決するための手段】
【0008】
すなわち本発明の音声表示装置での音声表示方法は、操作者が対象物であるペットに対して発する第1の音声と、上記対象物である上記ペットが発する第2の音声とを取得する音声取得ステップと、上記音声取得部で得られた上記第1の音声を分析することで第1の音声に含まれるキーワードを取得するキーワード取得ステップと、上記キーワード及び上記音声取得部で得られた上記第2の音声に基づいて、上記操作者と上記対象物との関係を示す言語を表現する文字である表示内容を決定する表示決定ステップと、上記表示決定部で決定された上記表示内容を表示する表示ステップとを有することを特徴とする。
【0009】
また本発明による、音声表示プログラムは、音声取得部と、撮像部と、信号処理部と、通信部と、表示部とを有する、音声表示装置上で動作するものであって、携帯機器の音声取得部により、操作者が対象物であるペットに対して発する第1の音声と、上記対象物である上記ペットが発する第2の音声とを取得する音声取得ステップと、上記音声取得部で得られた上記第1の音声を分析することで第1の音声に含まれるキーワードを取得するキーワード取得ステップと、上記第キーワード取得ステップによって取得したキーワード及び上記音声取得部で得られた上記第2の音声に基づいて、上記操作者と上記対象物との関係を示す言語を表現する文字である表示内容を決定する表示内容決定ステップと、上記表示内容決定ステップの結果に基づいて、上記表示内容を、携帯機器の表示部に表示する表示ステップと、を有することを特徴とする。
【発明の効果】
【0010】
本発明によれば、単調なペット写真に変化を持たせ、誰でも楽しめるペットの写真を簡単に撮影可能とした音声表示装置、カメラ機能をもつ携帯機器での音声表示方法、音声表示プログラムを提供することができる。
【0011】
また、カメラや携帯電話の内蔵カメラで撮影したペットの画像に、ペットの鳴き声などを反映させて変化を持たせ、家族以外にも、ペットと撮影者(操作者)の関係を分かりやすく示し、ペットと飼い主の愛情を画像化するカメラを提供することができる。
【図面の簡単な説明】
【0012】
【図1】本発明の音声表示方法を適用した音声表示装置での一実施形態に係るカメラの概略構成を示したブロック図である。
【図2】図1のように構成されたカメラ10の使用例とその効果によるイメージを示したものである。
【図3】本発明の一実施形態に於けるカメラ10の制御動作を説明するためのフローチャートである。
【図4】図3のフローチャートのステップS10に於けるサブルーチン「音声によってテキスト切換え」の詳細な動作を説明するためのフローチャートである。
【図5】図3のフローチャートのステップS11に於けるサブルーチン「キーワード・テキスト化」の詳細な動作を説明するためのフローチャートである。
【図6】図3のフローチャートのステップS13に於けるサブルーチン「音声によって表現切換え」の詳細な動作を説明するためのフローチャートである。
【図7】最終的なテキストを決定するための変換表である。
【発明を実施するための最良の形態】
【0013】
以下、図面を参照して、本発明の実施形態について説明する。
【0014】
図1は本発明の音声表示方法、プログラムを適用する音声表示装置の一実施形態に係るカメラの概略構成を示したブロック図である。
【0015】
図1に於いて、本発明の音声表示方法を適用した音声表示装置での一実施形態に係るカメラ10は、信号処理及び制御部11と、撮像部12と、大きさ判定部13と、距離判定部14と、前方音声収録部15と、後方音声収録部16と、音声処理部18と、記録部20と、操作判定部22と、表示部23と、時計部24と、通信部25と、を有して構成される。
【0016】
上記信号処理及び制御部11は、上記撮像部12から出力される撮影画像を画像処理すると共に、このカメラ10全体のシーケンスを制御する。更に、信号処理及び制御部11は、後述するテキスト化機能部18bより構成されたテキストを撮影画像に合成して表示するためのテキスト合成部11aを有している。
【0017】
上記撮像部12は、図示されない撮影用のレンズや撮像素子、並びにその駆動、読み出し回路等から構成されるもので、図示されない対象物である被写体を撮影して撮影画像を得るための撮影手段である。大きさ判定部13は、カメラの画面内に於ける被写体の割合、距離や撮影時の画角等から、被写体の大きさを判定する。距離判定部14は、対象物までの距離を、図示されないピント合わせ部の情報から取得する。
【0018】
すなわち、信号処理及び制御部11では、撮像部12からの撮影画像のみならず、距離判定部14による対象物までの距離情報や、大きさ判定部13によって上記画面内に被写体が占める割合を検出することができるようになっている。
【0019】
前方音声収録部15は、上記撮像部12で得られた画像に対応する方向である前方からの音声を収音するもので、マイク等により構成される。また、後方音声収録部16は、撮影者の声を収音するもので、マイク等により構成される。上記前方音声収録部15及び後方音声収録部16は、同一のマイクで構成し、声によって声の主を判別するようにしてもよい。
【0020】
音声処理部18は、これらのマイクから得られた音声を処理してテキスト化し、撮影画像と一緒に表示できるようにするためのものである。そのため、音声処理部18は、後述する記録部20内に記録された音声パターンと比較する機能を有した比較部18aと、後述する辞書記録部20bのデータやフォント情報を基にテキスト化を行うテキスト化機能部18bと、音の大きさや高低、その変化等を判定するための音量・音程判定部18cを有して構成される。
【0021】
記録部20は、撮影画像等を記録するための記録手段である。この記録部20は、撮影画像を記録する機能の他、音声パターンの情報を記録する音声パターン記録部20aと、音声からキーワードを判定するための辞書記録部20bと、辞書で得られたテキストを表示する際のフォント情報を記録するフォント記録部20cと、撮影画像を記録するための画像記録部20d等を有している。
【0022】
操作判定部22は、ユーザが撮影操作を行う際に操作するレリーズスイッチ等の操作の有無を判定するためのものである。この操作判定部22でカメラ10の操作が検出されると、信号処理及び制御部11によってこれらが制御されて、これらのブロックから取得された画像やテキスト等が、記録部20内に記録される。
【0023】
表示部23は、液晶等から構成される表示パネルを有するもので、上述した撮影画像を表示したり、撮影した結果が見られるようにしている。尚、この表示部23には、撮影前にも、撮像部12で得られた画像が表示されて、構図や撮影タイミングの確認等ができるようになっている。
【0024】
更に、時計部24は、撮影画像に撮影時刻が関連付けられるようにするためのものである。通信部25は、撮影画像に撮影位置が関連付けられて記憶されるようにするために設けられている。こうした画像並びに付随した情報は、通信部25によって外部に出力することができる。これは、無線では赤外通信や無線LAN等、有線でもUSB等を想定している。
【0025】
このような構成のカメラ10を使用することにより、従来のように代わり映えしないペットの写真に、テキストを入れて変化をつけて楽しむことができる。しかも、撮影時に於ける撮影者とペットの交流が文字として記録される。
【0026】
図2は、このようなカメラ10の使用例とその効果によるイメージを示したものである。
【0027】
図2に示されるように、操作者であるユーザ30が、対象物であるペット31の写真を撮る場合、当該ペット31に声をかけながら撮影することが多い。しかしながら、それほど多くの語彙の言葉が費やされるわけではなく、通常、「こっちを見て」とか、名前を呼ぶだけである。したがって、カメラ10は、そうした言葉に含まれるキーワードだけを検出することができればよい。
【0028】
この時、ペットは多くの場合黙っているが、そのときの感情に応じて、反応して声を出すこともある。この反応による声を利用して、テキストを画像に合成して表示、記録すれば、そのときのペットとの交流を画像に写し込むことができる。尚、この時のテキストは、単にペットの声のみならず、飼い主の声に応じて最適化するようにする。これによって、言葉を話さないペットの言葉を、人間の言葉に訳して(推測して)表示することが可能となる。
【0029】
次に、図3乃至図6のフローチャートを参照して、このようなペットと飼い主のコミュニケーションを写し込むことが可能なカメラ10の動作について説明する。
【0030】
尚、以下に説明するカメラ10の動作は、主に信号処理及び制御部11によって行われる。
【0031】
図3は、本発明の一実施形態に於けるカメラ10の制御動作を説明するためのフローチャートである。
【0032】
本シーケンスが開始されると、先ず、ステップS1に於いて、撮影モードか否かが判定される。ここで、撮影モードである場合はステップS2へ移行し、再生モードである場合は後述するステップS18へ移行する。
【0033】
ステップS2では、撮像部12からの画像の取込みが行われる。ここで得られた画像が、続くステップS3にて、適正なコントラスト、露出になるように画像処理等が行われる。ここでは、取り込み画像内の動きのある部分や同じ色の部分などをペット部分として判定するような処理も行われる。
【0034】
更に、ステップS4にて、表示に適切な処理が表示部23に表示される。そして、ステップS5にて、カメラ10の前方、後方の音声(ペット31、ユーザ30の音声)が取り込まれることによって、テキスト化される音声の判定が開始される。ステップS6では、上記ステップS5で取り込まれるべく前方、後方の音声が、所定時間無いか否かが判定される。その結果、所定時間音声が無い場合は、ステップS7に移行し、表示テキストがある場合はこれが消去される。一方、上記ステップS6にて音声があった場合は、ステップS7がスキップされる。
【0035】
そして、ステップS8に於いて、上記ステップS5で取り込まれた後方音声に、辞書記録部20bに記録されているのと同様のキーワードが入っているか否かが判定される。また、「○○ちゃん、○○ちゃん」のような繰り返しパターンかどうかなども判定される。このような判定がなされた場合はステップS11に移行し、そうでない場合はステップS9に移行する。
【0036】
上記ステップS8に於いて、撮影者が無言の場合もあり、キーワードにない言葉を発する場合もある。こうした場合にステップS9に移行して、前方音声の取り込み、すなわちペット31の音声の取り込みが行われる。尚、このサブルーチン「音声によってテキスト切換え」の詳細な動作については後述する。
【0037】
そして、続くステップS10にて、サブルーチン「音声によってテキスト切換え」が実行される。こうしたテキストが画面上に表示されることにより、画面に変化がつけられる。
【0038】
一方、上記ステップS8に於いて、後方音声にキーワードがあった場合は、ステップS11に移行して、サブルーチン「キーワード・テキスト化」が実行される。このサブルーチン「キーワード・テキスト化」の詳細な動作については後述する。
【0039】
そして、ステップS12では、前方からの音声(ペットの声)が取り込まれる。すると、続くステップS13に於いて、サブルーチン「音声によって表現切換え」が実行される。すなわち、上記ステップS5の音声で取り込まれたキーワードが利用されたテキストに対し、表現が切換えられたものが作成される。こうして作成されたテキストが画面上に表示されて、画面に変化がつけられる。尚、このサブルーチン「音声によって表現切換え」の詳細な動作については後述する。
【0040】
次に、ステップS14にて、上記ステップS10またはステップS13にて切換えられたテキストが表示される。そして、ステップS15に於いて、撮影操作が行われるか否かが操作判定部22によって判定される。その結果、撮影する場合はステップS16に移行して撮影処理が行われる。更に、ステップS17にて、先に得られたテキストと共に画像記録部20dへの記録が行われる。こうして、本シーケンスが終了する。
【0041】
尚、ステップS17にて記録する前に、確認用表示のステップを入れてもよい。
【0042】
また、ステップS14では、撮影しなくてもテキストを表示するようにしてもよい。
【0043】
一方、上記ステップS15に於いて、撮影が行われない場合は、上記ステップS1に移行する。
【0044】
上記ステップS1に於いて撮影モードでない場合は、ステップS18に移行して再生モードであるか否かが判定される。ここで、カメラ操作で再生モードが設定されると、ステップS19に移行して画像の再生が行われる。ここでは、画像をサムネイル表示したり、スライドショー切換えしたり、日付情報や、本発明の特徴たるテキスト情報によって、検索して見たい画像を鑑賞したりすることもできる。表示部23に表示される画像とテキストは、テキスト合成部11aにて合成される。
【0045】
外部機器にこの再生の結果を送信したい場合は、ステップS20にてその旨が判定される。ここで、送信する場合はステップS21に移行してその操作が行われ、表示画像の送信がなされる。こうして、本シーケンスが終了する。
【0046】
上記ステップS20にて送信されない場合は、上記ステップS18に移行する。
【0047】
また、上記ステップS18にて、再生モードでない場合は、上記ステップS1に移行する。
【0048】
図4は、図3のフローチャートのステップS10に於けるサブルーチン「音声によってテキスト切換え」の詳細な動作を説明するためのフローチャートである。このフローチャートは、ユーザの音声が無く、ペットの声のみでテキストを決定するためのものである。
【0049】
本サブルーチンに入ると、先ず、ステップS31にて音量・音程判定部18cで音量が判定され、次いでステップS32にて距離判定部14によって被写体の距離が判定される。これらによって、距離による音の減衰にかかわらず、ペット31が出した音声の大きさを判定することができる。
【0050】
ここで、声の大きさや周波数から動物の種類を、音声パターン記録部20aに記録された音声パターンと比較することによって判定してもよい。ペットは、多くの場合、犬か猫であるので、ここでは犬の場合を想定して説明する。
【0051】
ペットが出した声の大きさによって、ペットの興奮具合が分かり、ステップS33の音域判定によって、感情などが分かる。また、大きな犬では高い声で甘えても、小さな犬の低い声と同等の音の高さになる可能性がある。そのため、ステップS34では、画角や距離、画面内にペットが占める割合などから、対象となるペットが大型犬であるか小型犬であるかが判定される。尚、この結果で発音量を補正してもよい。
【0052】
つまり、大型犬は小さい声でも、小型犬の大きな声に相当する音量である場合がある。したがって、ステップS35に於いて、発音量が大きい場合はステップS36に移行して、音の高低が調べられる。すなわち、ステップS36にて低音であると判定された場合は、ステップS37に移行して、大型犬が「ワンワン」吠えていると判定される。
【0053】
また、低音でない場合はステップS43に移行し、小型犬であるか否かが判定される。その結果、小型犬であれば続くステップS44にて高音であるか否かが判定される。小型犬で更に高音で鳴く場合は、ステップS45に移行して、「キャンキャン」鳴いているとして、テキスト化機能部18bにてテキストが決定される。一方、小型犬でも低音でない場合は、ステップS43からステップS45へ移行して「キャンキャン」鳴いていると判定される。更に、低音でなくとも小型犬であれば、ステップS37で同様のテキストが対応される。
【0054】
また、ステップS35にて発音量が大きくないと判定された場合は、ステップS38に移行する。そして、このステップS38にて低音であるか否かが判定され、低音であればステップS40へ移行し、そうでない場合はステップS39にて小型犬であるか否かが判定される。
【0055】
ステップS40では、ペットが鳴いている音声がだんだん大きくなっているか否かが判定される。低音がだんだん大きくなる場合は威嚇していると考えられるので、ステップS41に移行して、「ウー」というテキストが対応されて決定される。一方、ステップS39からステップS40に移行して、小型犬で低音でなくてもだんだん大きくなる場合は、ステップS41に移行して、同様に「ウー」というテキストが対応される。
【0056】
また、低音でも小型犬でもない場合は、ステップS42に移行して、甘えた「きゅーん」というテキストが対応されて決定される。尚、小型犬でも、だんだん大きくならない声ならば、同様に甘えているものと判定される。
【0057】
このような声の種類で、犬の写真と一緒に表示するテキストを切換えるので、単に撮影した結果を楽しむのみならず、そのときの犬の声を反映させた楽しみ方ができる画像が得られる。
【0058】
このようにして、対応するテキストが選択されたならば、本サブルーチンを抜けて、図3のフローチャートのステップS14に移行する。
【0059】
図5は、図3のフローチャートのステップS11に於けるサブルーチン「キーワード・テキスト化」の詳細な動作を説明するためのフローチャートである。
【0060】
上述したように、ペットの写真を撮影するとき、且つ、ペットが写真に収まるような距離など、状況下では、ユーザはペットに声をかけながら撮影を行うことが多い。そのような状況下に於ける、ユーザとペットの交流を記録に残そうというのが、本発明の目的である。こうした状況下に於けるペットへの呼びかけの言葉というのは、限られたものであり、通常の辞書のような大がかりなデータベースを有したり、詳細な音声認識の機能を有したりする必要はない。
【0061】
したがって、ここでは、ユーザがペットに呼びかける代表的な言葉として、「こっち」、「おいで」の呼びかけや、「かわいいね」、「お利口ね」のような形容詞や、名詞に「ね」が付いたほめ言葉、更には「どうしたの」、といった疑問の言葉などで、かなりの範囲をカバーすることができる。
【0062】
図5のサブルーチンに入ると、先ず、ステップS51に於いて、キーワードが「こっち」、「おいで」等の単語の繰り返しであるか否かが判定される。ここで、キーワードがこれらの単語の繰り返しである場合はステップS54へ移行し、そうでない場合はステップS52に移行する。
【0063】
そして、ステップS52に於いては、キーワードが、上述した形容詞、名詞に「ね」、「よ」が付いた言葉であるか否かが判定される。ここで、該当する言葉であった場合はステップS55へ移行し、そうでない場合はステップS53へ移行する。更に、ステップS53では、キーワードが疑問である「どうした」という言葉であるか否かが判定される。その結果、キーワードが該当する言葉の場合はステップS56に移行し、そうでない場合は本サブルーチンを抜けて図3のフローチャートのステップS12へ移行する。
【0064】
キーワードが、上述したような呼びかけの言葉であった場合は、ステップS54、S55、S56に於いて、それぞれの言葉が選択されてテキスト化される。つまり、これらの場合、ユーザは、それぞれ「はい」、形容詞+「よ」、「えーと」というような返事を期待していると考えられるので、こうした言葉がテキスト化されるようになっている。
【0065】
このテキスト化された言葉は、例えば、図7の変換表に示されるように、カテゴリAとして「はい」、カテゴリBとして「形容詞、名詞+「よ」、そしてカテゴリCとして「えーと」が該当する。これらの言葉に対して、図6で決定されるペット側のアクションが加味されて、最終的なテキストとして決定される。
【0066】
図6は、図3のフローチャートのステップS13に於けるサブルーチン「音声によって表現切換え」の詳細な動作を説明するためのフローチャートである。
【0067】
ここでは、基本的に図4のフローチャートに於ける、「ワンワン」を不快表現とし、「キャンキャン」を興奮表現とし、「ウー」を怒り表現とし、「きゅーん」を満足表現に置き換えている。更に、無言の場合(犬は尻尾を振るだけ、猫はすり寄って来るだけという感情表現が多い)は、通常表現としている。
【0068】
また、本実施形態では、基本的に飼い主とペットが遊んでいる状態の関係を画像化(テキスト化)するものであるから、ここでは、寂しいという感情は排除して単純化している。
【0069】
尚、図6のフローチャートに於けるステップS61〜S66の処理動作は、上述した図4のフローチャートのステップS31〜S36の処理動作と同様であるので、対応するステップ番号を参照するものとしてここでの説明は省略する。
【0070】
ステップS66にて低音であると判定された場合は、ステップS67に移行して、不快表現であるとされる。大型犬が「ワンワン」吠えていると判定される。
【0071】
また、ステップS66にて低音でないとされた場合は、ステップS75に移行して小型犬であるか否かが判定される。その結果、小型犬であれば続くステップS76にて高音であるか否かが判定される。小型犬で更に高音で鳴く場合は、ステップS77に移行して、興奮状態である旨のテキストが決定される。一方、小型犬でも低音でない場合は、ステップS73からステップS77へ移行して興奮状態であるとされる。更に、低音でなくとも小型犬であれば、ステップS67で同様のテキストが対応される。
【0072】
また、ステップS65にて発音量が大きくないと判定された場合は、ステップS38に移行して、無言であるか否かが判定される。ここで、無言である場合は、ステップS69に移行して、上述したように、通常表現であるとされる。一方、無言ではないと判定された場合は、ステップS70に移行する。
【0073】
ステップS70では、音声が低音であるか否かが判定される。ここで、低音であればステップS72へ移行し、そうでない場合はステップS71に移行して小型犬であるか否かが判定される。
【0074】
ステップS72では、ペットが鳴いている音声がだんだん大きくなっているか否かが判定される。低音がだんだん大きくなる場合は威嚇していると考えられるので、ステップS73に移行して、怒り表現である旨のテキストが対応される。一方、ステップS71からステップS72に移行して、小型犬で低音でなくてもだんだん大きくなる場合は、ステップS73に移行して、同様に、怒り表現のテキストが対応される。
【0075】
また、低音でも小型犬でもない場合は、ステップS74に移行して、満足表現である旨のテキストが対応される。尚、小型犬でも、だんだん大きくならない声ならば、同様に満足表現であると判定される。
【0076】
このように、ステップS67、S68、S69、S73、S74でそれぞれの表現が決定されると、本サブルーチンを抜けて、図3のフローチャートのステップS14に移行する。
【0077】
そして、上述した図5のフローチャートのステップS54、S55、S56の言葉と、図6のフローチャートのステップS67、S68、S69、S73、S74の表現とを組み合わせて、図7の変換表に表示されるような最終的なテキストが決定される。
【0078】
例えば、キーワードの言葉が「はい」で、満足表現である場合は、「はーい」がテキスト化される。キーワードの言葉が、形容詞・名詞+「よ」で、怒り表現である場合は、「何?」がテキスト化される。また、キーワードの言葉が「えーと」で、通常表現である場合は、「えーと」がテキスト化される。
【0079】
このような変換表は、上述したステップで声によって決定されたペットの感情状態に基づいて加工される。
【0080】
例えば、図2に示されるように、ユーザ30がペット31に対して、形容詞、名詞+「ね」、「よ」の例にあるような言葉として、「お利口ね」と呼びかけたとする。この場合、ペット31が発音した「わんわん」は、大型犬、小型犬の何れであっても、発音量が大きくなく、しかもだんだん大きくはならないので、満足表現であるということになる。したがって、ペットの満足表現である、形容詞、名詞+「でしょ」が適用された「お利口でしょ」がテキスト化される。このテキスト化された文字が、画像と共にカメラ10の表示部23に表示されるようになっている。
【0081】
尚、このように、テキストを変更すると共に、テキストのフォントや色、大きさなどを決定してもよく、絵文字などを追加できるようにしてもよい。
【0082】
更に、本実施形態では、犬がペットの例として説明したが、その他の生物等に於いても、同様にしてテキスト化して表示するようにすればよい。
【0083】
以上説明したように、本実施形態によれば、飼い主とペットの交流がテキスト表示される写真撮影が楽しめるカメラを提供することが可能となる。
【0084】
また、上述した実施形態では、音声表示装置をカメラに適用した例について説明したが、これに限られるものではない。例えば、携帯電話機等、カメラ以外に適用してもよく、或いは、撮影部を持たない機器に利用して、単なる翻訳機器やコミュニケーションツールのように利用してもよい。
【0085】
更に、本発明は静止画だけに限られず動画に於いても適用可能である。
【0086】
以上、本発明の実施形態について説明したが、本発明は上述した実施形態以外にも、本発明の要旨を逸脱しない範囲で種々の変形実施が可能である。
【0087】
更に、上述した実施形態には種々の段階の発明が含まれており、開示される複数の構成要件の適当な組合せにより種々の発明が抽出され得る。例えば、実施形態に示される全構成要件から幾つかの構成要件が削除されても、発明が解決しようとする課題の欄で述べた課題が解決でき、発明の効果の欄で述べられている効果が得られる場合には、この構成要件が削除された構成も発明として抽出され得る。
【産業上の利用可能性】
【0088】
本発明によれば、単調なペット写真に変化を持たせ、誰でも楽しめるペットの写真を簡単に撮影可能とすることができる。
【符号の説明】
【0089】
10…カメラ、11…信号処理及び制御部、11a…テキスト合成部、12…撮像部、13…大きさ判定部、14…距離判定部、15…前方音声収録部、16…後方音声収録部、18…音声処理部、18a…被殻部、18b…テキスト化機能部、18c…音量・音程判定部、20…記録部、20a…音声パターン記録部、20b…辞書記録部、20c…フォント部、20d…画像記録部、22…操作判定部、23…表示部、24…時計部、25…通信部、30…ユーザ、31…ペット。

【特許請求の範囲】
【請求項1】
音声表示装置の音声取得部により、操作者が対象物であるペットに対して発する第1の音声と、上記対象物である上記ペットが発する第2の音声とを取得する、音声取得ステップと、
上記音声取得部で得られた上記第1の音声を分析することで第1の音声に含まれるキーワードを取得するキーワード取得ステップと、
上記キーワード取得ステップによって取得したキーワード、及び上記音声取得部で得られた上記第2の音声に基づいて、上記操作者と上記対象物との関係を示す言語を表現する文字である表示内容を決定する表示内容決定ステップと、
上記表示内容決定ステップの結果に基づいて、上記表示内容を、音声表示装置の表示部に表示する表示ステップと、
を有することを特徴とする音声表示装置の音声表示方法。
【請求項2】
上記対象物までの距離を判定する距離判定ステップと、
上記距離判定ステップの結果に従って上記対象物の声の大きさを判定する音量判定ステップと、を更に有しており、
上記表示内容決定ステップは、上記音量判定ステップでの判定結果に従って表示内容を決定することを特徴とする請求項1に記載の音声表示装置の音声表示方法。
【請求項3】
上記対象物の大きさを判定する、大きさ判定ステップを更に有し、
上記表示決定ステップは、上記大きさ判定ステップによって判定された大きさに従って表示内容を決定することを特徴とする請求項1に記載の音声表示装置の音声表示方法。
【請求項4】
上記第2の音声より上記対象物の興奮状態を判定する、状態判定ステップを更に有し、
上記表示決定ステップは、上記興奮状態と上記キーワードに基づいて上記表示内容を決定することを特徴とする請求項1に記載の音声表示装置の音声表示方法。
【請求項5】
上記音量判定ステップは、上記第2の音声の高低、大きさに基づいて上記興奮状態を判定することを特徴とする請求項4に記載の音声表示装置の音声表示方法。
【請求項6】
上記表示決定ステップは、上記対象物の画像と共に該対象物の状態に応じた文字を表示させることを特徴とする請求項1乃至5の何れか1項に記載の音声表示装置の音声表示方法。
【請求項7】
音声取得部と、撮像部と、信号処理部と、通信部と、表示部とを有する、音声表示装置上で動作する 音声表示プログラムにおいて、
上記音声表示装置の音声取得部により、操作者が対象物であるペットに対して発する第1の音声と、上記対象物である上記ペットが発する第2の音声とを取得する音声取得ステップと、
上記音声取得部で得られた上記第1の音声を分析することで第1の音声に含まれるキーワードを取得するキーワード取得ステップと、
上記第キーワード取得ステップによって取得したキーワード及び上記音声取得部で得られた上記第2の音声に基づいて、上記操作者と上記対象物との関係を示す言語を表現する文字である表示内容を決定する表示内容決定ステップと、
上記表示内容決定ステップの結果に基づいて、上記表示内容を、音声表示装置の表示部に表示する表示ステップと、
を有することを特徴とする。
【請求項8】
上記対象物までの距離を判定する距離判定ステップと、
上記距離に従って上記対象物の声の大きさを判定する音量判定ステップと、
を更に有しており、
上記表示決定ステップは、上記音量判定ステップでの判定結果に従って表示内容を決定することを特徴とする請求項7に記載の音声表示装置上で動作する音声表示プログラム。
【請求項9】
上記対象物の大きさを判定する、大きさ判定ステップを更に具備し、
上記表示決定ステップは、上記大きさ判定ステップによって判定された大きさに従って表示内容を決定することを特徴とする請求項7に記載の音声表示装置上で動作する音声表示プログラム。
【請求項10】
上記第2の音声より上記対象物の興奮状態を判定する、状態判定ステップを更に具備し、
上記表示決定ステップは、上記興奮状態と上記キーワードに基づいて上記表示内容を決定することを特徴とする請求項7に記載の音声表示装置上で動作する音声表示プログラム。
【請求項11】
上記音量判定ステップは、上記第2の音声の高低、大きさに基づいて上記興奮状態を判定することを特徴とする請求項10に記載の音声表示装置上で動作する音声表示プログラム。
【請求項12】
上記表示決定ステップは、上記対象物の画像と共に該対象物の状態に応じた文字を表示させることを特徴とする請求項7乃至11の何れか1項に記載の音声表示装置上で動作する音声表示プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2013−102544(P2013−102544A)
【公開日】平成25年5月23日(2013.5.23)
【国際特許分類】
【出願番号】特願2013−30525(P2013−30525)
【出願日】平成25年2月20日(2013.2.20)
【分割の表示】特願2009−1993(P2009−1993)の分割
【原出願日】平成21年1月7日(2009.1.7)
【出願人】(504371974)オリンパスイメージング株式会社 (2,647)
【Fターム(参考)】