説明

画像表示装置及び方法並びにプログラム

【課題】画像の鑑賞行為をインタラクティブでより豊かな行為にすること。
【解決手段】マイクロフォン18は、表示部17に表示された表示画像を鑑賞する鑑賞者が発した音声の音声信号を入力し、バッファ19に記憶させる。音声認識部20は、その音声信号に基づいて、鑑賞者が発した音声から1以上の単語を識別し、キーワードとして取得する。カウンタ21は、キーワードの出現回数を算出する。表示ドライバ16は、出現回数が閾値以上のキーワードを含む情報又はキーワードから導かれる情報を、表示画像とともに表示部17に表示させる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像表示の技術に関し、例えば、画像の鑑賞者に対してインタラクティブでより豊かな鑑賞行為を実現させる画像表示装置及び方法並びにプログラムに関する。
【背景技術】
【0002】
従来より、画像(写真含む)の表示装置として、パーソナルコンピュータやデジタルフォトフレーム等が存在し、その表示手法として、スライドショー表示が広く知られている(例えば、特許文献1参照)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2008−306403号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、このスライドショー表示は、選択した複数の画像を順次表示させる手法であり、鑑賞者は、設定を行った後は順次表示される画像を単に鑑賞するだけであった。従って、鑑賞者は、デジタルフォトフレームが一方的に表示する画像を単に鑑賞することしかできない。このため、鑑賞者の意図が随時反映されるような豊かな鑑賞を実現することができなかった。
【0005】
そこで、本発明は、上記課題に鑑みてなされたものであり、画像の鑑賞者に対して、インタラクティブでより豊かな鑑賞行為を実現させる画像表示装置及び方法並びにプログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明の第1の観点によると、表示部に表示された表示画像を観賞する鑑賞者が発した音声の音声信号を入力する音声入力部と、前記音声入力部に入力された前記音声信号に基づいて、前記鑑賞者が発した音声から1以上の単語を識別し、識別した前記1以上の単語をキーワードとして取得する取得部と、前記取得部により取得された前記キーワードを含む情報又は前記キーワードから導かれる情報を、前記表示画像とともに前記表示部に表示させる制御部と、を備える画像表示装置を提供する。
【0007】
本発明の第2の観点によると、前記取得部により取得された前記キーワードの出現回数を算出するカウント部をさらに備え、前記制御部は、前記カウント部により算出された前記出現回数が閾値を超えた前記キーワードを含む情報又は前記キーワードから導かれる情報を、前記表示画像とともに前記表示部に表示させる、画像表示装置を提供する。
【0008】
本発明の第3の観点によると、前記出現回数が閾値を超えた前記キーワードを含む情報又は前記キーワードから導かれる情報を、演出効果を伴う表示形態で、前記表示画像とともに前記表示部に表示させる、画像表示装置を提供する。
【0009】
本発明の第4の観点によると、前記取得部により取得された前記キーワード、及び、前記表示画像に関連する情報に基づいて、新たなキーワードを発生する発生部をさらに備え、前記制御部は、前記発生部により発生された前記新たなキーワードを、前記キーワードから導き出される情報として、前記表示画像とともに前記表示部に表示させる、画像表示装置を提供する。
【0010】
本発明の第5の観点によると、前記表示画像から人物の顔を検出する検出部をさらに備え、前記制御部は、前記検出部が前記顔の検出に成功した場合、前記表示画像において、検出された前記顔の口から、前記キーワードを含む情報又は前記キーワードから導かれる情報の文字列が配置された吹き出しを表示させ、前記検出部が前記顔の検出に失敗した場合、前記表示画像内の所定領域に、前記キーワードを含む情報又は前記キーワードから導かれる情報を表示させる、画像表示装置を提供する。
【0011】
本発明の第6の観点によると、表示部に表示された表示画像を観賞する鑑賞者が発した音声の音声信号を入力する音声入力制御ステップと、前記音声入力制御ステップの制御処理により入力された前記音声信号に基づいて、前記鑑賞者が発した音声から1以上の単語を識別し、識別した前記1以上の単語をキーワードとして取得する取得ステップと、前記取得ステップの処理により取得された前記キーワードを含む情報又は前記キーワードから導かれる情報を、前記表示画像とともに前記表示部に表示させる表示制御ステップと、を含む画像表示方法を提供する。
【0012】
本発明の第7の観点によると、画像表示装置を制御するコンピュータに、表示部に表示された表示画像を観賞する鑑賞者が発した音声の音声信号を入力する音声入力制御機能と、前記音声入力制御機能の制御処理により入力された前記音声信号に基づいて、前記鑑賞者が発した音声から1以上の単語を識別し、識別した前記1以上の単語をキーワードとして取得する取得機能と、前記取得機能の処理により取得された前記キーワードを含む情報又は前記キーワードから導かれる情報を、前記表示画像とともに前記表示部に表示させる表示制御機能と、を実現させるためのプログラムを提供する。
【発明の効果】
【0013】
本発明によれば、画像の鑑賞者にとって、インタラクティブでより豊かな鑑賞行為が実現可能となる。
【図面の簡単な説明】
【0014】
【図1】本発明の一実施形態に係る画像表示装置のハードウェアの構成を示すブロック図である。
【図2】図1の画像表示処理の流れの一例を示すフローチャートである。
【図3】図1の画像表示装置のデータベース用不揮発性メモリの記憶内容の一例を示す図である。
【図4】図1の画像表示装置により表示される画像の一例を示す図である。
【発明を実施するための形態】
【0015】
以下、本発明の実施形態を図面に基づいて説明する。
【0016】
図1は、本発明の一実施形態に係る画像表示装置1のハードウェアの構成を示す図である。画像表示装置1は、例えばデジタルフォトフレームやパーソナルコンピュータ等により構成することができる。
【0017】
画像表示装置1は、CPU(Central Processing Unit)11と、メモリ12と、データベース用不揮発性メモリ13と、ランダムキーワード発生部14と、バス15と、表示ドライバ16と、表示部17と、マイクロフォン18と、バッファ19と、音声認識部20と、カウンタ21と、通信部22と、ドライブ23と、を備える。
【0018】
CPU11は、メモリ12に含まれるROM(Read Only Memory)に記憶されているプログラムに従って各種の処理を実行する。又は、CPU11は、データベース用不揮発性メモリ13からメモリ12に含まれるRAM(Random Access Memory)にロードされたプログラムに従って各種の処理を実行する。RAMにはまた、CPU11が各種の処理を実行する上において必要なデータ等も適宜記憶される。
【0019】
本実施の形態では、CPU11は、表示ドライバ16を制御して、表示部17に画像(写真を含む)を表示させる。なお、以下、表示部17に表示される画像を、「表示画像」と呼ぶ。本実施の形態では、CPU11は、マイクロフォン18を駆動制御して、表示画像を鑑賞する鑑賞者が連続して発する音声(発話)の時系列信号を入力する。ここで、音声の時系列信号とは、所定期間内に発せられた音声のデジタル信号をいう。ただし、入力信号は、音声認識の処理対象となり得る信号であれば足り、本実施の形態の時系列信号に特に限定されず、その他例えば一定期間内のアナログの音声信号であってもよい。CPU11は、音声認識部20を制御して、入力された音声の時系列信号に対して所定の音声認識処理を実行することで、その音声の時系列信号から1以上の単語を識別し、識別した1以上の単語をキーワードとして取得する。なお、1つの単語がキーワードとして取得される場合もあるし、複数の単語からなる単語列がキーワードとして取得される場合もある。また、1つのキーワードのみが取得される場合もあるし、複数のキーワードが取得される場合もある。CPU11は、キーワードを含む情報又はそのキーワードから導かれる情報を、表示画像とともに表示部17に表示させる。
【0020】
なお、このような一連の処理を、以下、画像表示処理と称する。すなわち、本実施の形態では、画像表示処理を実現するプログラムがメモリ12やデータベース用不揮発性メモリ13に記憶されている。なお、画像表示処理のさらなる詳細については、図2を参照して後述する。
【0021】
このようにCPU11が画像表示処理を開始した後に、鑑賞者が表示画像を鑑賞しながら発話すると、その発話内容に含まれていた1以上の単語がキーワードとして取得される。そして、当該キーワードを含む情報又は当該キーワードから導かれる情報が表示画像に付加されて表示される。これにより、鑑賞者にとって、鑑賞という行為が、一方的な行為ではなくなり、インタラクティブでより豊かな行為となる。
【0022】
データベース用不揮発性メモリ13は、上述したプログラムの他、各種データを記憶する。例えば、画像データは、メタデータと対応付けられてデータベース用不揮発性メモリ13に記憶される。さらに、表示画像を鑑賞中の鑑賞者の発話内容に含まれていたキーワードのデータ、及び、そのキーワードの出現回数のデータも、当該表示画像の画像データと対応付けられてデータベース用不揮発性メモリ13に記憶される。なお、データベース用不揮発性メモリ13の記憶内容の具体例については、図3を参照して後述する。
【0023】
ランダムキーワード発生部14は、表示画像を鑑賞中の鑑賞者の発話内容に含まれていたキーワード、及び、当該表示画像のメタデータに基づいて、新たなキーワードを発生する。本実施の形態では、この新たなキーワードが、鑑賞者の発話内容に含まれていたキーワードから導かれる情報の一例として、表示部17に表示され得る。
【0024】
CPU11、メモリ12、データベース用不揮発性メモリ13、及びランダムキーワード発生部14は、バス15を介して相互に接続されている。このバス15にはまた、表示ドライバ16、音声認識部20、カウンタ21、通信部22、及びドライブ23も接続されている。
【0025】
表示ドライバ16は、所定の画像データをデータベース用不揮発性メモリ13から取得して、その画像データに基づいて表示画像を表示部17に表示させる。表示部17は、例えば液晶ディスプレイ等で構成される。
【0026】
マイクロフォン18は、鑑賞者が発する音声(発話)を入力し、音声信号として出力する。バッファ19は、マイクロフォン18から所定期間出力された音声信号を記憶する。すなわち、バッファ19は、音声の時系列信号を記憶する。音声認識部20は、バッファ19に記憶された音声の時系列信号に対して音声認識処理を実行することで、鑑賞者の発話内容に含まれる1以上の単語を識別し、その識別結果に基づいて、1以上のキーワードを取得する。なお、音声認識部20の音声認識のアルゴリズムは特に限定されない。
【0027】
カウンタ21は、音声認識部20の処理を監視し、キーワードの出現回数を算出する。カウンタ21はまた、キーワードの出現回数が閾値を超えたタイミングで、割り込み信号を発生し、CPU11に供給する。すると、CPU11は、表示ドライバ16を制御して、出現回数が閾値を超えたキーワード又はそのキーワードから導き出される情報を、表示画像とともに表示部17に表示させる。
【0028】
通信部22は、インターネットを含むネットワークを介して他の装置(図示せず)との間で行う通信を制御する。ドライブ23には、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリ等よりなるリムーバブルメディア24が適宜装着される。そして、それらから読み出されたプログラムが、必要に応じてデータベース用不揮発性メモリ13にインストールされる。また、リムーバブルメディア24は、データベース用不揮発性メモリ13の代わりに、表示対象の画像データ等の各種データも記憶することができる。
【0029】
図2は、図1の画像表示装置1による画像表示処理の流れの一例を示すフローチャートである。
【0030】
ステップS1において、CPU11は、所定の画像データをデータベース用不揮発性メモリ13から読み出し、表示ドライバ16を制御して、その画像データに基づいて表示画像を表示部17に表示させる。
【0031】
ステップS2において、CPU11は、マイクロフォン18を駆動制御して、鑑賞者が発する音声の時系列信号を入力し、バッファ19に記憶させる。
【0032】
ステップS3において、CPU11は、音声認識部20を制御して、バッファ19から音声の時系列信号を読み出し、その音声の時系列信号に対して音声認識処理を実行することで、キーワードを取得する。
【0033】
ステップS4において、CPU11は、カウンタ21を制御して、キーワードの出現回数をインクリメントする。
【0034】
ステップS5において、CPU11は、キーワード及び出現回数のデータを、表示画像の画像データと対応付けて、データベース用不揮発性メモリ13に記憶させる。
【0035】
なお、ステップS4及びS5の処理は、ステップS3の処理で複数のキーワードが取得された場合には複数のキーワードの各々に対して個別に実行される。
【0036】
ステップS6において、CPU11は、出現回数が閾値を超えたキーワードが存在するか否かを判定する。
【0037】
全てのキーワードの出現回数が閾値を下回る場合、上述した割り込み信号はカウンタ21から発生されないので、ステップS6においてNOであると判定されて、処理はステップS1に戻され、それ以降の処理が繰り返される。すなわち、ステップS1乃至S6のループ処理が繰り返されて、各ループ処理毎に、鑑賞者の発話内容(音声の時系列信号)から1以上のキーワードが取得され、その出現回数がインクリメントされていく。
【0038】
そして、所定のキーワードの出現回数が閾値を超えた段階で、カウンタ21から割り込み信号が発生されてCPU11に供給される。これにより、ステップS6においてYESであると判定され、処理はステップS7に進む。
【0039】
ステップS7において、CPU11は、出現回数が閾値を超えたキーワードのデータと、対応付けられたメタデータとを、ランダムキーワード発生部14に送る。これにより、ランダムキーワード発生部14は、送られてきたキーワードのデータ及びメタデータに基づいて、新たなキーワードを発生する。
【0040】
ステップS8において、CPU11は、表示画像の画像データから顔検出を試みる。ステップS9において、CPU11は、顔が検出されたか否かを判定する。
【0041】
ステップS8の処理で1以上の顔が検出された場合、ステップS9においてYESであると判定されて、処理はステップS10に進む。ステップS10において、CPU11は、検出された顔(複数の顔が検出された場合には所定の1つの顔)の口からの吹き出し位置を、キーワード表示窓の位置に設定する。
【0042】
これに対して、ステップS8の処理で1つの顔も検出されなかった場合、ステップS9においてNOであると判定されて、処理はステップS11に進む。ステップS11において、CPU11は、表示画像中の所定位置を、キーワード表示窓の位置に設定する。
【0043】
ステップS10又はS11の処理でキーワード表示窓の位置が設定されると、処理はステップS12に進む。ステップS12において、CPU11は、表示ドライバ16を制御して、キーワードを、キーワード表示窓に表示させる(後述する図4参照)。すなわち、表示部17に表示されている表示画像のうち、キーワード表示窓の位置として設定された領域に、キーワードが表示される。換言すると、キーワードが付加された表示画像が表示部17に表示される。
【0044】
なお、ステップS12の処理で、CPU11は、出現回数が閾値を超えたキーワード(ユーザの発話内容に含まれていたキーワード)を表示してもよいし、ランダムキーワード発生部14により発生された新たなキーワードを表示してもよいし、或いはまた、両方のキーワードを同時に表示してもよい。また、CPU11は、これらのキーワードのみならず、これらのキーワードを含む文章を新たに生成して表示しても構わない。また、キーワードの表示形態は、特に限定されない。幾つかの好適な表示形態の例については後述する。
【0045】
ステップS13において、CPU11は、画像の表示の終了が指示されたか否かを判定する。
【0046】
画像の表示の終了がまだ指示されていない場合、ステップS13においてNOであると判定されて、処理はステップS1に戻され、それ以降の処理が繰り返される。すなわち、画像の表示の終了が指示されるまでの間、上述したステップS1乃至S13のループ処理が繰り返される。
【0047】
その後、画像の表示の終了が指示されると、ステップS13においてYESであると判定されて、画像表示処理は終了する。
【0048】
以下、さらに、図3及び図4を参照しつつ、画像表示処理について具体的に説明する。
【0049】
図3は、データベース用不揮発性メモリ13の記憶内容の一例を示す図である。
【0050】
図3の例では、2つの画像データGDA,GDBがデータベース用不揮発性メモリ13に記憶されている。
【0051】
画像データGDAが表わす画像GAは、例えば図3に示すように、ピラミッドを背景とした記念撮影写真である。画像データGDAに対しては、「ピラミッド」という情報を含むメタデータMAが対応付けられてデータベース用不揮発性メモリ13に記憶されている。また、図3に示すようなキーワードのデータKA−1及び出現回数のデータCA−1の組乃至キーワードのデータKA−N及び出現回数のデータCA−Nの組が、画像データGDAと対応付けられてデータベース用不揮発性メモリ13に記憶されている。なお、Nは、1以上の整数値であって、図3の例では4以上の整数値となる。すなわち、図3は、過去において、画像GAが表示部17に表示されている間に例えば14以上の閾値が設定されて図2の画像表示処理が開始され、ステップS1乃至S6のループ処理が何回か繰り返された後の状態を示している。
【0052】
一方、画像GAとは別の画像(図示せず)の画像データGDBに対しては、メタデータMBが対応付けられてデータベース用不揮発性メモリ13に記憶されている。また、キーワードのデータKB−1及び出現回数のデータCB−1の組乃至キーワードのデータKB−M及び出現回数のデータCB−Mの組が、画像データGDBと対応付けられてデータベース用不揮発性メモリ13に記憶されている。なお、Mは、1以上の整数値であって、図3の例では4以上の整数値となる。すなわち、図3は、過去において、画像GAとは別の画像が表示部17に表示されている間に例えば13以上の閾値が設定されて図2の画像表示処理が開始され、ステップS1乃至S6のループ処理が何回か繰り返された後の状態を示している。
【0053】
例えば、データベース用不揮発性メモリ13の記憶内容が図3の状態で、ステップS1の処理が実行され、画像GAが表示部17に表示されたものとする。そして、複数の鑑賞者が、画像GAを鑑賞しながら、その旅の思い出等を会話するものとする。
【0054】
この場合、複数の鑑賞者のうちの1人が発話すると、その音声の時系列信号がステップS2の処理で入力され、バッファ19に記憶される。そして、次のステップS3の処理で、その時系列信号に対して音声認識処理が実行されて、1以上のキーワードが取得される。例えばここでは、「スフィンクス」、「暑かった」、及び「ギザ」というキーワードが取得されたものとする。そして、図3に示すように、データKA−1が「スフィンクス」を表わすデータとされ、データKA−2が「暑かった」を表わすデータとされ、データKA−3が「ギザ」を表わすデータとされているものとする。
【0055】
この場合、ステップS4の処理で、データKA−1が表わす「スフィンクス」の出現回数が「7回」から「8回」にインクリメントされる。データKA−2が表わす「暑かった」の出現回数が「14回」から「15回」にインクリメントされる。データKA−3が表わす「ギザ」の出現回数が「3回」から「4回」にインクリメントされる。
【0056】
図示はしないが、次のステップS5の処理で、「スフィンクス」のデータKA−1と、「8回」を示す出現回数のデータCA−1が、画像データGDAに対応付けられてデータベース用不揮発性メモリ13に記憶(上書き)される。「暑かった」のデータKA−2と、「15回」を示す出現回数のデータCA−2が、画像データGDAに対応付けられてデータベース用不揮発性メモリ13に記憶(上書き)される。「ギザ」のデータKA−3と、「4回」を示す出現回数のデータCA−3が、画像データGDAに対応付けられてデータベース用不揮発性メモリ13に記憶(上書き)される。
【0057】
なお、データベース用不揮発性メモリ13に記憶されているその他のデータは更新(上書き)されない。例えば、データKA−2が表わすキーワードと、画像データGDBに対応付けられたデータKB−1が表わすキーワードとは、「暑かった」で同一である。このような場合であっても、画像データGDBが表わす別の画像は表示画像ではないので、「暑かった」のデータKB−1及び「9回」のデータCB−1の組の記憶は更新されない。
【0058】
ここで、例えば閾値が15回である場合、上述の例では、出現回数が閾値を超えるキーワードは存在しない。従って、このような場合、カウンタ21からは割り込み信号が発生されないので、ステップS6の処理でNOであると判定されて、処理はステップS1に戻され、それ以降の処理が繰り返される。
【0059】
これに対して、例えば閾値が14回である場合、上述の例では、データKA−2が表わす「暑かった」の出現回数は「15回」に更新されたので、閾値を超えている。従って、このような場合、カウンタ21から割り込み信号が発声されてCPU11に供給されるので、ステップS6においてYESであると判定され、処理はステップS7に進む。
【0060】
ステップS7の処理で、出現回数が閾値を超えた「暑かった」のデータKA−2と、メタデータMAとが、ランダムキーワード発生部14に送られる。ランダムキーワード発生部14は、例えば、メタデータMAに含まれる「ピラミッド」は「世界遺産」というカテゴリに属することを認識する。そして、ランダムキーワード発生部14は、「暑かった」と「世界遺産」とを掛け合わせて、例えば「タージマハル」という新たなキーワードを発生する。
【0061】
ステップS8の処理で、画像データGDAに基づいて、画像GAに含まれる顔の検出が試みられる。図4に示すように、画像GAには2人の人物の顔が含まれているので、ステップS9の処理でYESであると判定されて、ステップS10の処理で、これらの2人の人物の顔のうちの所定の1つの顔、例えば図4中左側の顔の口からの吹き出し位置が、キーワード表示窓の位置に設定される。その結果、ステップS12の処理で、図4に示すように、例えば「タージマハル」というキーワードが、吹き出し位置に表示される。なお、上述したように、「タージマハル」というキーワードに替えて又はそれとともに、出現回数が閾値を超えた「暑かった」を、吹き出し位置に表示させることも可能である。
【0062】
以上説明したように、本実施の形態の画像表示装置1は、表示部17に表示された表示画像を鑑賞する鑑賞者が発した音声の時系列信号を入力する。画像表示装置1は、その時系列信号に基づいて、鑑賞者が発した音声の内容に含まれる単語又は単語列を、キーワードとして取得する。画像表示装置1は、そのキーワードを含む情報又はそのキーワードから導かれる情報を、表示画像とともに表示部17に表示させる。
【0063】
これにより、鑑賞者にとって、鑑賞という行為が、一方的な行為ではなくなり、インタラクティブなより豊かな行為となる。例えば上述の例では、鑑賞者は、図4の吹き出し位置に表示された「タージマハル」というキーワードを見ることで、「今度の旅行はタージマハルに行こう」といった内容を思い浮かべることができる。このようにして、鑑賞者にとっては、ただ単に画像を眺めているだけでは得られない鑑賞が実現される。
【0064】
なお、本発明は上述の実施の形態に限定されるものではなく、本発明の目的を達成できる範囲での変形、改良等は本発明に含まれるものである。
【0065】
例えば、キーワードの表示形態については特に限定されないが、表示形態を変化してキーワードを表示させることで、画像の鑑賞行為をインタラクティブでより豊かな行為にすることができる。
【0066】
例えば、出現回数に応じて演出効果を変化させて、キーワードを表示させることもできる。より具体的には例えば、図2のステップS1乃至S13のループ処理が繰り返されると、キーワードの出現回数は増加していく傾向になる。また、出現回数が閾値を超えたキーワードの個数も増加していく傾向になる。そこで、上述の例にあわせて閾値が14回であるとすると、出現回数が15回乃至19回のキーワードに対しては、CPU11は、出現回数が閾値を超えたキーワードをそのまま表示させる。例えば上述の例では、「暑かった」がそのまま表示される。出現回数が20回乃至29回のキーワードに対しては、CPU11は、出現回数が15回乃至19回の場合よりも派手な演出効果を伴って、出現回数が閾値を超えたキーワードを表示させる。派手な演出効果としては、例えば、文字のサイズを大きくする効果や、文字を装飾する効果等を採用することができる。例えば上述の例では、「暑かった」という文字列が大きく表示されたり、装飾文字で表示されたりする。さらに、出現回数が30回以上のキーワードに対しては、CPU11は、ランダムキーワード発生部14により発生された新たなキーワードを表示させる。例えば上述の例では、「タージマハル」が表示される。
【0067】
なお、演出効果自体は、特に限定されず、上述の例も併せて具体例を列挙すると例えば次のようになる。
(1)出現回数が多くなるほど文字サイズを大きくしていく演出効果。
(2)横からのスライドインやエクスパンド表示を行う演出効果。
(3)表示画像に含まれる人物(顔検出により検出された顔)の口からの吹き出しの画像を表示させ、その吹き出しにキーワードを表示させる演出効果。すなわち、その人物があたかもしゃべっているような演出効果。
(4)鑑賞者の発話内容に含まれるキーワードと、表示画像のメタデータに含まれるキーワードと関連付けて、新たなキーワードを創作し、その新たなキーワードを表示させる演出効果
【0068】
また、例えば上述の実施形態では、表示対象のキーワードの選択手法として、出現回数が閾値を超えたか否かに基づいて選択する手法が採用されていた。しかしながら、表示対象のキーワードの選択手法は、上述の実施形態に特に限定されず、任意の手法を採用し得る。
【0069】
ところで、上述したように、本発明に係る一連の処理は、ハードウェアにより実行させることもできるし、ソフトウェアにより実行させることもできる。
【0070】
一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、コンピュータ等にネットワークや記録媒体からインストールされる。コンピュータは、専用のハードウェアに組み込まれているコンピュータであってもよい。また、コンピュータは、各種のプログラムをインストールすることで、各種の機能を実行することが可能なコンピュータ、例えば汎用のパーソナルコンピュータであってもよい。
【0071】
このようなプログラムを含む記録媒体は、図示はしないが、ユーザにプログラムを提供するために装置本体とは別に配布されるリムーバブルメディアにより構成されるだけでなく、装置本体に予め組み込まれた状態でユーザに提供される記録媒体等で構成することもできる。リムーバブルメディアは、例えば、磁気ディスク(フロッピディスクを含む)、光ディスク、又は光磁気ディスク等により構成される。光ディスクは、例えば、CD−ROM(Compact Disk−Read Only Memory),DVD(Digital Versatile Disk)等により構成される。光磁気ディスクは、MD(Mini−Disk)等により構成される。また、装置本体に予め組み込まれた状態でユーザに提供される記録媒体は、例えば、プログラムが記録されている図1のメモリ12に含まれるROMや、図1のデータベース用不揮発性メモリ13や、図示せぬハードディスク等で構成される。
【0072】
なお、本明細書において、記録媒体に記録されるプログラムを記述するステップは、その順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的或いは個別に実行される処理をも含むものである。
【符号の説明】
【0073】
1・・・画像表示装置、11・・・CPU、12・・・メモリ、13・・・データベース用不揮発性メモリ、14・・・ランダムキーワード発生部、15・・・バス、16・・・表示ドライバ、17・・・表示部、18・・・マイクロフォン、19・・・バッファ、20・・・音声認識部、21・・・カウンタ、22・・・通信部、23・・・ドライブ、24・・・リムーバブルメディア

【特許請求の範囲】
【請求項1】
表示部に表示された表示画像を観賞する鑑賞者が発した音声の音声信号を入力する音声入力部と、
前記音声入力部に入力された前記音声信号に基づいて、前記鑑賞者が発した音声から1以上の単語を識別し、識別した前記1以上の単語をキーワードとして取得する取得部と、
前記取得部により取得された前記キーワードを含む情報又は前記キーワードから導かれる情報を、前記表示画像とともに前記表示部に表示させる制御部と、
を備える画像表示装置。
【請求項2】
前記取得部により取得された前記キーワードの出現回数を算出するカウント部をさらに備え、
前記制御部は、前記カウント部により算出された前記出現回数が閾値を超えた前記キーワードを含む情報又は前記キーワードから導かれる情報を、前記表示画像とともに前記表示部に表示させる、
請求項1に記載の画像表示装置。
【請求項3】
前記制御部は、前記出現回数が閾値を超えた前記キーワードを含む情報又は前記キーワードから導かれる情報を、演出効果を伴う表示形態で、前記表示画像とともに前記表示部に表示させる、
請求項2に記載の画像表示装置。
【請求項4】
前記取得部により取得された前記キーワード、及び、前記表示画像に関連する情報に基づいて、新たなキーワードを発生する発生部をさらに備え、
前記制御部は、前記発生部により発生された前記新たなキーワードを、前記キーワードから導き出される情報として、前記表示画像とともに前記表示部に表示させる、
請求項1乃至3の何れか1項に記載の画像表示装置。
【請求項5】
前記表示画像から人物の顔を検出する検出部をさらに備え、
前記制御部は、
前記検出部が前記顔の検出に成功した場合、前記表示画像において、検出された前記顔の口から、前記キーワードを含む情報又は前記キーワードから導かれる情報の文字列が配置された吹き出しを表示させ、
前記検出部が前記顔の検出に失敗した場合、前記表示画像内の所定領域に、前記キーワードを含む情報又は前記キーワードから導かれる情報を表示させる、
請求項1乃至4の何れか1項に記載の画像表示装置。
【請求項6】
表示部に表示された表示画像を観賞する鑑賞者が発した音声の音声信号を入力する音声入力制御ステップと、
前記音声入力制御ステップの制御処理により入力された前記音声信号に基づいて、前記鑑賞者が発した音声から1以上の単語を識別し、識別した前記1以上の単語をキーワードとして取得する取得ステップと、
前記取得ステップの処理により取得された前記キーワードを含む情報又は前記キーワードから導かれる情報を、前記表示画像とともに前記表示部に表示させる表示制御ステップと、
を含む画像表示方法。
【請求項7】
画像表示装置を制御するコンピュータに、
表示部に表示された表示画像を観賞する鑑賞者が発した音声の音声信号を入力する音声入力制御機能と、
前記音声入力制御機能の制御処理により入力された前記音声信号に基づいて、前記鑑賞者が発した音声から1以上の単語を識別し、識別した前記1以上の単語をキーワードとして取得する取得機能と、
前記取得機能の処理により取得された前記キーワードを含む情報又は前記キーワードから導かれる情報を、前記表示画像とともに前記表示部に表示させる表示制御機能と、
を実現させるためのプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate


【公開番号】特開2011−70267(P2011−70267A)
【公開日】平成23年4月7日(2011.4.7)
【国際特許分類】
【出願番号】特願2009−218784(P2009−218784)
【出願日】平成21年9月24日(2009.9.24)
【出願人】(000001443)カシオ計算機株式会社 (8,748)
【Fターム(参考)】