説明

音声出力制御装置、音声出力装置、音声出力制御方法、及び、プログラム

【課題】広告に対する注目を効果的に集めるとともに、注目を集めた効果を知ることができるようにする。
【解決手段】特定の方向に音声を出力する超指向性スピーカ40と、超指向性スピーカ40の音声出力方向を調整するスピーカ台座41と、に接続された制御装置10は、広告の表示面の前方をカメラ50により撮影させ、その撮影画像に写っている人物を対象者として検出し、スピーカ台座41によって、超指向性スピーカ40の音声出力方向を対象者に向くよう調整し、超指向性スピーカ40から音声を出力させ、音声を出力させた後にカメラ50により撮影を行い、この撮影画像に基づいて、対象者の顔の向きを判定する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、超指向性スピーカからの音声出力を制御する音声出力制御装置、音声出力装置、音声出力制御方法、及び、プログラムに関する。
【背景技術】
【0002】
従来、広告を表示する方法としては、ポスターを掲示する方法や、壁面にディスプレイ装置を設置して広告を表示する方法がある。また、広告効果を高めるため、横長のディスプレイ装置を90度回転させて縦長に設置し、この縦長のディスプレイ装置の画面に広告を表示する方法が提案されている(例えば、特許文献1参照)。
【特許文献1】特開2004−226494号公報
【発明の開示】
【発明が解決しようとする課題】
【0003】
ところで、広告効果を高めるためには、広告への注目を集めることが有効であるが、視覚的効果によって注目を集めることには限度があり、また、広告そのものに気付いていない人を広告に注目させることは非常に困難であった。このため、広告に対する注目を効果的に集めることが望まれていた。
また、広告効果を高めるための手法とともに、その手法による効果がどの程度であったかを正確に判定することも強く望まれていた。
本発明は、上述した事情に鑑みてなされたものであり、広告に対する注目を効果的に集めるとともに、注目を集めた効果を知ることができるようにすることを目的とする。
【課題を解決するための手段】
【0004】
上記課題を解決するため、本発明は、特定の方向に音声を出力する超指向性スピーカと、前記超指向性スピーカの音声出力方向を調整する音声方向調整機構と、に接続され、広告の表示面を視認可能な範囲を撮影する撮影手段と、前記撮影手段により撮影された撮影画像に写っている人物を対象者として検出する対象者検出手段と、前記音声方向調整機構によって、前記超指向性スピーカの音声出力方向を前記対象者検出手段により検出された対象者の方に向けさせて、前記超指向性スピーカから音声を出力させる音声出力制御手段と、前記音声出力制御の制御によって前記超指向性スピーカから音声を出力させた後に前記撮影手段により撮影された撮影画像に基づいて、前記対象者の顔の向きを判定する向き判定手段と、を備えることを特徴とする音声出力制御装置を提供する。
この構成によれば、広告の表示面を視認可能な範囲にいる人を対象者として、この対象者に向けて超指向性スピーカから音声を出力させ、音声を出力した後の対象者の顔の向きを判定するので、音声を出力することで広告への注目を喚起する一方で、音声出力後における対象者の広告への注目の状態を判定できる。また、超指向性スピーカを用いることで、僅かな人数にしか聞こえないように音声を出力することができ、広い範囲の人に聞こえるように音声を出力する場合に比べて、広告への注目を強く喚起できる。これにより、超指向性スピーカを用いた音声出力によって広告に対する注目を集めるとともに、この音声出力によって実際に広告への注目が喚起されたかどうかを知ることができる。
【0005】
上記構成において、前記向き判定手段によって前記対象者の顔が前記広告の表示面を向いていると判定されてから、前記対象者の顔が前記広告の表示面を向いていた時間を求める注目時間検出手段をさらに備えるものとしてもよい。
この場合、超指向性スピーカから音声を出力させた後に対象者が広告の表示面を向いてから、この対象者が広告の表示面に注目していた時間を求めるので、音声によって広告への注目を喚起するとともに、音声出力が対象者に与えた影響を詳細に知ることができる。
【0006】
また、上記構成において、前記音声出力制御部手段は、前記撮影手段により撮影された撮影画像に写っている人物のうち、その顔が前記広告の表示面を向いていない人物を対象者として検出するものとしてもよい。
この場合、広告の表示面を向いていない人を対象として、超指向性スピーカから音声を出力させて、その後に対象者が広告の表示面を向いたか否かを判定するので、広告に注目していない人に対して、ほぼその人のみを対象として超指向性スピーカによって音声による訴求を行い、広告への注目を喚起することができ、さらに、実際に広告に注目したか否かを判定できる。
【0007】
さらに、上記構成において、前記撮影手段は、前記広告の表示面として、広告画像を表示する表示装置の表示画面を視認可能な範囲を撮影するものであり、前記音声出力制御手段は、前記超指向性スピーカから、前記表示装置により表示中の広告画像に関連する音声を出力させるものとしてもよい。
この場合、広告画像が表示される表示装置の表示画面を視認可能な範囲にいる人に対し、超指向性スピーカを用いて、広告画像に関連する音声を出力させることにより、広告への注目をより強く喚起するとともに、広告の訴求力を高める一方で、この音声出力による広告効果への影響を知ることができる。
【0008】
また、本発明は、特定の方向に音声を出力する超指向性スピーカと、前記超指向性スピーカの音声出力方向を調整する音声方向調整機構と、広告の表示面を視認可能な範囲を撮影する撮影手段と、前記撮影手段により撮影された撮影画像に写っている人物を対象者として検出する対象者検出手段と、前記音声方向調整機構によって、前記超指向性スピーカの音声出力方向を前記対象者検出手段により検出された対象者の方に向けさせて、前記超指向性スピーカから音声を出力させる音声出力制御手段と、前記音声出力制御の制御によって前記超指向性スピーカから音声を出力させた後に前記撮影手段により撮影された撮影画像に基づいて、前記対象者の顔の向きを判定する向き判定手段と、を備えることを特徴とする音声出力装置を提供する。
この構成によれば、広告の表示面を視認可能な範囲にいる人を対象者として、この対象者に向けて超指向性スピーカから音声を出力し、音声を出力した後の対象者の顔の向きを判定するので、超指向性スピーカを用いた音声出力により、広告への注目を強く喚起する一方で、音声出力後に対象者が広告したかどうかを判定できる。これにより、超指向性スピーカを用いた音声出力によって広告に対する注目を集めるとともに、この音声出力によって実際に広告への注目が喚起されたかどうかを知ることができる。
【0009】
また、本発明は、特定の方向に音声を出力する超指向性スピーカと、前記超指向性スピーカの音声出力方向を調整する音声方向調整機構と、に接続された音声出力制御装置により、広告の表示面の前方を撮影し、撮影画像に写っている人物を対象者として検出し、前記音声方向調整機構によって、前記超指向性スピーカの音声出力方向を前記対象者検出手段により検出された対象者の方に向くよう調整させ、前記超指向性スピーカから音声を出力させ、前記超指向性スピーカから音声を出力させた後に撮影を行い、この撮影画像に基づいて、前記対象者の顔の向きを判定すること、を特徴とする音声出力制御方法を提供する。
この方法によれば、広告の表示面を視認可能な範囲にいる人を対象者として、この対象者に向けて超指向性スピーカから音声を出力し、音声を出力した後の対象者の顔の向きを判定するので、超指向性スピーカを用いた音声出力により、広告への注目を強く喚起する一方で、音声出力後に対象者が広告したかどうかを判定できる。これにより、超指向性スピーカを用いた音声出力によって広告に対する注目を集めるとともに、この音声出力によって実際に広告への注目が喚起されたかどうかを知ることができる。
【0010】
また、本発明は、特定の方向に音声を出力する超指向性スピーカと、前記超指向性スピーカの音声出力方向を調整する音声方向調整機構と、に接続されたコンピュータにより実行されるプログラムであって、前記コンピュータを、広告の表示面を視認可能な範囲を撮影する撮影手段と、前記撮影手段により撮影された撮影画像に写っている人物を対象者として検出する対象者検出手段と、前記音声方向調整機構によって、前記超指向性スピーカの音声出力方向を前記対象者検出手段により検出された対象者の方に向けさせて、前記超指向性スピーカから音声を出力させる音声出力制御手段と、前記音声出力制御の制御によって前記超指向性スピーカから音声を出力させた後に前記撮影手段により撮影された撮影画像に基づいて、前記対象者の顔の向きを判定する向き判定手段と、して機能させることを特徴とするプログラムを提供する。
このプログラムを実行するコンピュータによれば、広告の表示面を視認可能な範囲にいる人を対象者として、この対象者に向けて超指向性スピーカから音声を出力し、音声を出力した後の対象者の顔の向きを判定するので、超指向性スピーカを用いた音声出力により、広告への注目を強く喚起する一方で、音声出力後に対象者が広告したかどうかを判定できる。これにより、超指向性スピーカを用いた音声出力によって広告に対する注目を集めるとともに、この音声出力によって実際に広告への注目が喚起されたかどうかを知ることができる。
【発明の効果】
【0011】
本発明によれば、広告を視認可能な範囲にいる人に対し、超指向性スピーカを用いた音声出力によって広告への注目を強く喚起するとともに、この音声出力による広告効果への影響を知ることができる。
【発明を実施するための最良の形態】
【0012】
以下、図面を参照して本発明の実施形態を説明する。
図1は、本実施形態に係る音声出力システム1の機能的構成を示すブロック図である。
音声出力システム1は、制御装置10に、超指向性スピーカ40、カメラ50、及び、表示装置60を各々接続して構成される。
音声出力装置としての音声出力システム1は、表示装置60によって商品やサービス等の広告の画像を表示するとともに、この表示装置60に表示される広告を視認可能な範囲をカメラ50により撮影し、この範囲にいる人を、撮影画像に基づいて検出し、検出した人に向けて超指向性スピーカ40から音声を出力する。
【0013】
超指向性スピーカ40は、パラメトリックスピーカと呼ばれる高い指向性を有するスピーカであって、その音声出力方向に位置する人のみ、或いは、その人の近傍にいる人を含めた少数の人にのみ聞こえるように音声を出力する。具体的な例を挙げると、超音波トランスデューサを備え、この超音波トランスデューサによって超音波帯域の搬送波を可聴帯域の音声信号によって変調した変調波を出力する超音波スピーカを、超指向性スピーカ40として用いることができる。
超指向性スピーカ40は、スピーカ台座41により支持される。スピーカ台座41は、超指向性スピーカ40を設置する際の台座であり、超指向性スピーカ40の音声出力方向を調整する音声方向調整機構として機能する。本実施形態のスピーカ台座41は、一例として、1または複数の可動軸(図示略)と、これらの可動軸を中心として超指向性スピーカ40の向きを変えるモータ(図示略)とを備えている。後述するように、制御装置10の制御によってスピーカ台座41を動作させることで、超指向性スピーカ40の音声出力方向を任意の向きに変更することが可能である。
【0014】
カメラ50は、静止画像及び/又は動画像を撮影するカメラであって、制御装置10の制御に従って撮影を行い、撮影画像データを制御装置10に出力する。
カメラ50は、制御装置10に接続されるインタフェース部51と、撮影制御部52と、撮影部53と、を備える。
撮影部53は、CCDイメージセンサやCMOSイメージセンサ等の撮像素子(図示略)、撮影レンズ群(図示略)、ズームやフォーカス等の調整を行うためにレンズ群を駆動するレンズ駆動部(図示略)等を備え、撮影制御部52の制御に従って撮影を行う。撮影制御部52は、インタフェース部51を介して入力される制御信号に従って、撮影部53のレンズ駆動部を動作させて所定の撮影条件を実現させ、この条件下で撮影部53が備える撮像素子から出力されるデータを所定形式のデータに変換し、撮影画像データとして、インタフェース部51を介して出力する。インタフェース部51は、有線のケーブルまたは無線通信回線を介して制御装置10に接続され、制御装置10から入力される制御信号を受信して撮影制御部52に出力するとともに、撮影制御部52から入力される撮影画像データ等を制御装置10に出力する。
【0015】
表示装置60は、制御装置10の制御に従って広告の画像(静止画像及び動画像のどちらでもよい)を表示する。
表示装置60は、制御装置10に接続されるインタフェース部61と、インタフェース部61を介して入力された表示信号を取得する描画制御部62と、描画制御部62に接続された描画メモリ63と、描画制御部62の制御に従って表示パネル65を駆動する表示駆動回路64と、表示パネル65とを備えている。
描画制御部62は、インタフェース部61を介して制御装置10から入力された表示信号に基づいて、表示用の画像を描画メモリ63に描画する。そして、描画制御部62は、表示パネル65における描画タイミングに合わせて描画メモリ63から画像を読み出し、表示駆動回路64に出力する。表示駆動回路64は、描画制御部62から入力された画像に基づいて表示パネル65を駆動し、画像を表示させる。
【0016】
ここで、表示パネル65は、液晶表示パネル、プラズマ表示パネル、或いは有機ELパネル等のフラットディスプレイパネルにより構成される。表示パネル65が透過型の液晶表示パネルで構成される場合、表示装置60はバックライト装置(図示略)を備え、表示駆動回路64は、表示パネル65を駆動するとともにバックライト装置の点灯制御を行い、所定のタイミングで点灯させる。また、表示パネル65がプラズマ表示パネルや有機ELパネル等の自発光型のものである場合、バックライト装置は不要である。
【0017】
図2は、超指向性スピーカ40及びカメラ50の設置状態を示す斜視図である。また、図3はカメラ50の撮影範囲を示す平面図である。
図2に示すように、超指向性スピーカ40及びカメラ50は、表示装置60の上端部に取り付けられている。
超指向性スピーカ40は、その音声出力方向が主に表示パネル65の前方に向くよう取り付けられる。本実施形態では、スピーカ台座41は二つの直交する可動軸を有し、図中矢印MHで示す方向(水平方向)及び矢印MVで示す方向(垂直方向)に、超指向性スピーカ40の音声出力方向を変更する。スピーカ台座41の可動範囲は特に限定されないが、典型的な例としては、矢印MH及び矢印MVで示すように、超指向性スピーカ40の音声出力方向を、表示パネル65の正面方向を中心として左右及び上下に変更する態様が挙げられる。超指向性スピーカ40の音声出力方向は、表示パネル65から音声を聴かせる対象者までの距離に応じて矢印MV方向に変化し、対象者の左右方向の位置に応じて矢印MH方向に変化する。
【0018】
撮影手段としてのカメラ50は、図2及び図3に示すように、広告の表示面としての表示パネル65の正面を含む表示パネル65の前方を撮影するよう設置されている。カメラ50の撮影範囲は、図3に符号Gで示す領域であり、表示パネル65に表示される広告の画像を視認可能な範囲である。すなわち、カメラ50は、表示パネル65を視認できる位置にいる人を撮影できるように配置される。ここで、音声出力システム1がカメラ50を一台のみ使用する場合には、カメラ50に、焦点距離が35〜24mmの広角レンズや、21mm以下の超広角レンズ(焦点距離はいずれも35mmフィルム換算)、或いは魚眼レンズを用いて広範囲を撮影することが好ましく、カメラ50の設置位置は、図2及び図3に示すように、表示パネル65のほぼ中央が好ましい。音声出力システム1が複数のカメラ50を備え、これら複数のカメラ50の撮影画像を、制御装置10が重複の排除等の処理を行って利用する場合には、各々のカメラ50の撮影範囲は図3の領域Gの一部のみをカバーすればよい。この場合、カメラ50は通常の広角レンズを備えていれば十分に機能を果たすことができる。
【0019】
また、音声出力システム1が超指向性スピーカ40を一台のみ使用する場合には、スピーカ台座41による水平方向の可動範囲を広くして、例えば矢印MHで示す水平方向に180度以上とすることが考えられる。
なお、超指向性スピーカ40及びカメラ50の設置場所の高さ位置は、表示装置60の上端に限定されず、より高い位置であってもよい。カメラ50によって領域G全体を効率よく撮影し、この領域G内の特定の人に確実に超指向性スピーカ40の音声を聴かせるためには、超指向性スピーカ40及びカメラ50は高い場所に設置される方が、比較的好ましいといえる。
【0020】
音声出力システム1の各部を制御する制御装置10は、例えば、パーソナルコンピュータとして実現されるものであり、音声出力制御装置として機能する。制御装置10は、図1に示すように、音声出力部11、台座駆動部12、入力部13、表示部14、記録媒体読取部15、インタフェース部16、制御装置10の各部を制御する制御部20、及び、記憶部30を備えている。
【0021】
音声出力部11は、超指向性スピーカ40に接続され、制御部20の制御に従って、記憶部30に記憶された音声データに係る音声を出力するための音声信号を生成し、この音声信号を超指向性スピーカ40に出力する。
台座駆動部12は、制御部20の制御に従って、スピーカ台座41が備えるモータ(図示略)を駆動するための駆動信号や電源を供給する。この台座駆動部12がスピーカ台座41に出力する駆動信号や電源によって上記モータが所定角度だけ回動し、超指向性スピーカ40の音声出力方向が、制御部20が決定した方向となる。
【0022】
入力部13は、マウスやキーボード等の入力デバイスに接続され、これら入力デバイスの操作を検出して、この操作に対応する操作信号を制御部20に出力する。
表示部14は、制御部20の制御に従って、各種情報を表示するものであり、例えば液晶表示パネルを用いて構成される。
記録媒体読取部15は、CD、DVD、或いは次世代型DVD等の光ディスク型記録媒体、MO等の光磁気記録媒体、磁気記録媒体、半導体記憶素子を利用した記憶装置、磁気的記録媒体を利用した記録装置等から、プログラムやデータを読み取る装置である。記録媒体読取部15は、制御部20の制御に従って、表示パネル65に表示する画像に係るデータや、超指向性スピーカ40から出力する音声に係るデータ、制御部20が実行するプログラムや処理対象のデータ等を読み取って、制御部20に出力する。記録媒体読取部15により読み取られたデータやプログラムは、制御部20の制御に基づいて、記憶部30に記憶される。
【0023】
インタフェース部16は、カメラ50が備えるインタフェース部51、及び、表示装置60が備えるインタフェース部61に対し、有線または無線により接続される。インタフェース部16は、インタフェース部51、61との間において、制御信号や表示情報、撮影画像データ等の入出力を実行する。
【0024】
制御部20は、制御装置10の各部を中枢的に制御するものであり、CPU、CPUによって実行される基本制御プログラムや処理されるデータ等を不揮発的に記憶するROM、CPUによって実行されるプログラムや処理されるデータ等を一時的に記憶するRAM、及び、その他の周辺回路等を備えている。制御部20は、ROMに記憶された基本制御プログラムを読み出して実行することにより、制御装置10の各部を制御する。さらに、制御部20は、ROMや記憶部30に記憶されたプログラムを読み出して実行することで、制御装置10に接続された各部を制御することにより、制御装置10の各種機能を実現する。
すなわち、制御部20は、顔方向判定部21(対象者検出手段、向き判定手段)、属性判別部22、音声出力制御部23(音声出力制御手段)、及び、スピーカ台座制御部24の各機能部を有する。これらの機能部は、制御部20が有するCPUが所定のプログラムを実行することで、実現される。
【0025】
顔方向判定部21は、カメラ50から入力される撮影画像データを解析して、カメラ50の撮影画像に写っている人毎に、顔の向きを判定する処理を行う。顔方向判定部21は、少なくとも、各々の人の顔が表示パネル65を向いているか否かを判定する。
図3に示すように、カメラ50は領域Gにいる人を撮影可能なものであり、例えば領域Gに三人の人U1、U2、U3がいる場合には、カメラ50の撮影画像には三人の人U1〜U3の顔が写る。図3中、人U1の顔の向きを方向A1とし、人U2の顔の向きを方向A2とし、人U3の顔の向きを方向A3とする。図3の例では、人U1の顔の向き方向A1は表示パネル65に対して横向きであり、人U3の顔の向き方向A3は表示パネル65とは反対側の斜め方向である。これに対し、人U2の顔の向き方向A2は正面から表示パネル65側を向いている。
カメラ50は表示パネル65の表示面と同じ側から、表示パネル65の前方、すなわち表示パネル65を視認可能な範囲(領域G)を撮影するので、カメラ50の撮影画像において、表示パネル65を向いている人U2の顔は正面向きに写っている。
顔方向判定部21は、カメラ50の撮影画像における人の姿を検出し、各々の人の顔が正面向きの顔であるか否かを判定することで、顔の向きを判定する。なお、顔方向判定部21は、人の顔が表示パネル65を正面から見ているか否かを判定するだけでなく、表示パネル65に対して横方向や斜め方向、或いは表示パネル65の反対側を向いている人の顔について、その向きやおよその角度を判定できるものであってもよい。
【0026】
属性判別部22は、カメラ50から入力される撮影画像データを解析して、カメラ50の撮影画像に写っている人毎に、属性を判別する処理を行う。属性判別部22は、少なくとも、各々の人の顔が表示パネル65を向いているか否かを判定する。
属性判別部22は、カメラ50の撮影画像から人の姿の部分を検出し、その人の姿の部分について特徴を検出する。ここで検出される特徴は、画像中の頭髪の占める割合、頭髪及び皮膚の色調、身長及び身幅とその比、顔の特徴、服装の色調等である。続いて属性判別部22は、検出した画像の特徴に基づいて、その人の属性として、例えば性別や年代を判別する。
【0027】
音声出力制御部23は、カメラ50の撮影画像に写っている人のうち、顔方向判定部21により判定された人毎の顔の方向、及び、属性判別部22により判別された人毎の属性に基づいて、超指向性スピーカ40によって音声を聴かせる対象者を選択する。そして、音声出力制御部23は、対象者に適した音声を、記憶部30に記憶された音声選択用テーブル33に基づいて選択し、選択した音声のデータを広告音声データ32から読み出して、この音声を出力するための音声信号を、音声出力部11から超指向性スピーカ40へ出力させる。
スピーカ台座制御部24は、音声出力制御部23によって選択された対象者に超指向性スピーカ40の音声を聴かせるため、カメラ50の撮影画像における対象者の位置に基づいて、スピーカ台座41を駆動する方向及び駆動量を算出し、算出結果に基づいて台座駆動部12を制御し、スピーカ台座41を動作させる。
この音声出力制御部23及びスピーカ台座制御部24の動作により、カメラ50によって撮影された人のうち、特定の人(対象者)に対して超指向性スピーカ40から音声が出力される。
【0028】
記憶部30は、磁気的、光学的記録媒体或いは半導体記憶素子を用いた記憶装置を備え、各種のプログラムやデータ等を不揮発的に記憶する。また、記憶部30は、広告画像データ31、広告音声データ32、音声選択用テーブル33、及び対象者履歴情報34の各情報を記憶する。
広告画像データ31は、表示装置60によって表示される画像のデータであり、商品やサービス等の広告用の静止画像または動画像のデータである。広告画像データ31は、複数の画像のデータを含んでいる。
広告音声データ32は、超指向性スピーカ40から出力される音声のデータであり、広告画像データ31に含まれる各画像データの種類、及び、音声を聴かせる対象者の属性等に対応して、複数の音声データが広告音声データ32に含まれる。
【0029】
音声選択用テーブル33は、広告音声データ32の中から、超指向性スピーカ40が出力する音声を選択するためのテーブルであり、一つの音声データを決定するための条件等が設定されている。
対象者履歴情報34は、カメラ50の撮影画像から検出された人物の画像について、その人物の異同を人ごとに識別するための情報であり、属性判別部22が属性を判別する際に検出した撮影画像の特徴が登録されている。また、対象者履歴情報34には、各々の人物がカメラ50の撮影画像において複数回にわたって検出された場合に、最新の撮影画像の撮影時刻が登録され、さらに、最新の撮影画像において顔方向判定部21によって表示パネル65の正面を向いていると判定されたか否かを示す注目フラグが登録される。
【0030】
図4は、音声選択用テーブル33の構成例を模式的に示す図である。
この図4に示す例の音声選択用テーブル33によれば、表示装置60に表示される広告画像の種類と、対象者がカメラ50撮影画像において検出された回数と、対象者の属性と、をもとに音声データが決定される。
すなわち、音声選択用テーブル33には、表示装置60に表示される広告画像の種類、対象者がカメラ50撮影画像において検出された回数、対象者の属性(年代、性別)毎に、対応する音声データが設定されている。例えば、表示装置60に表示中の広告画像が広告画像Aであり、音声出力制御部23が検出した対象者がカメラ50の撮影画像から検出されたのが最初(1回目)であり、対象者の属性が20−30代の男性である場合、音声データとしては、音声データA1が設定されている。
従って、音声出力制御部23は、制御部20の制御によって表示装置60に表示させている広告画像の種類、属性判別部22によって対象者がカメラ50撮影画像から検出された回数、及び、属性判別部22が判別した対象者の属性(年代、性別)に基づいて、広告音声データ32に含まれる複数の音声データから、適切な音声データを選択できる。
さらに、図4の例では、音声選択用テーブル33において、検出回数が2回目以後の場合についても、属性毎に音声データが対応づけられている。従って、音声出力システム1は、各対象者の属性とともに、各対象者が撮影画像に写った回数が1回目であるか、2回目以後であるかに応じて、異なる音声を超指向性スピーカ40から出力できる。
【0031】
図5は、対象者履歴情報34の構成例を模式的に示す図である。
対象者履歴情報34は、カメラ50の撮影画像において人物画像として制御部20が検出した人物毎に情報が登録された一種のデータベースである。
対象者履歴情報34には、各人物に対して制御部20が自動的に付与したID、その人物について属性判別部22が判別した属性、属性判別部22が検出した人物画像の特徴(特徴量)、その人物に対して音声出力制御部23により出力された音声データ、注目フラグ、及び撮影時刻が、対応づけて登録されている。
ここで、一人の人物が複数回撮影画像において検出され、その都度、この人物に対して超指向性スピーカ40から音声が出力された場合には、音声データとしては最後に出力された音声データを示す情報が登録される。
また、注目フラグは、最新の撮影画像において顔方向判定部21により判定された顔の向きを示すフラグであり、表示パネル65の正面を向いていればONとなり、表示パネル65の正面でなければOFFとなる。
対象者履歴情報34の撮影時刻は、その人物が写った撮影画像のうち、その人物が表示パネル65の正面を向いてから最初に撮影された撮影画像の撮影時刻である。言い換えれば、注目フラグがOFFからONに設定されたときの撮影画像の撮影時刻である。
【0032】
対象者履歴情報34を利用すれば、対象者がカメラ50の撮影画像において検出された回数や、過去に撮影画像に写った時刻等を知ることができる。
すなわち、制御部20は、属性判別部22によってカメラ50の撮影画像から人の姿の部分の特徴を検出した後、検出した特徴に固有のIDを付して、対象者履歴情報34に登録する。そして、制御部20は、属性判別部22によってカメラ50の撮影画像から人の姿の部分の特徴を検出した後で、対象者履歴情報34に同様の特徴を有する人の画像の情報が登録されているか否かを判定する。この判定により、カメラ50の撮影画像から検出された人物画像が、以前にもカメラ50の撮影画像において検出された人であるかどうかを速やかに判定できる。
【0033】
対象者履歴情報34は、撮影時刻から所定時間(例えば30分、或いは1時間)経過する毎に、クリアされる。これは、同一の人物が表示装置60を見ることができる範囲(領域G)から立ち去り、その後に領域Gに戻った場合に、この人物を新たな対象者として処理するためである。表示パネル65に表示される広告が切り替わる可能性や、広告効果を判定する時間的スパンからみて、いったん撮影画像に写った人物を長期間にわたって対象者として対応し続けるよりも、所定時間が経過する毎に、新たに検出された対象者として対応した方が、良好な広告効果が期待でき、広告効果を正確に判定できるという利点がある。また、対象者履歴情報34のデータ量を抑えることができるという利点もある。
【0034】
図6は、音声出力システム1の動作を示すフローチャートである。
この図6に示す動作は、制御装置10の制御部20が、カメラ50の撮影画像を所定時間毎にサンプリングする毎に、行われる。この図6の動作の実行時、制御部20は、対象者検出手段、音声出力制御手段、注目時間検出手段として機能する。
制御部20は、まず、カメラ50の撮影画像を、インタフェース部16を介して取得する(ステップS11)。ここで取得される撮影画像は、静止画像データであってもよいし、動画像データから一つのフレームを切り出したものであってもよい。
制御部20は、顔方向判定部21及び属性判別部22による検出を行って、カメラ50の撮影画像中に人の姿の画像(人物画像)があるか否かを判別する(ステップS12)。ここで、撮影画像中に人物の画像がない場合(ステップS12;No)、制御部20は本処理を終了する。
【0035】
一方、撮影画像中に人物の画像があった場合、すなわち人が写っていた場合(ステップS12;Yes)、制御部20は、撮影画像において検出された全ての人物の画像から処理対象となる人物の画像を一つ選択し(ステップS13)、この画像が、対象者履歴情報34に登録されている人物の画像であるか否かを判定する(ステップS14)。この判定は、上述したように処理対象の人物の画像の特徴を検出し、検出した特徴と同じ特徴を有する画像が対象者履歴情報34に登録されているか否かを判定することで、行われる。
処理対象の人物の画像が、まだ対象者履歴情報34に登録されていなかった場合(ステップS14;No)、制御部20は、顔方向判定部21の機能によって処理対象の人物の画像から顔の向きを判定する(ステップS15)。
【0036】
ここで、処理対象の人物の画像から判定された顔の向きが、表示パネル65の正面向きであった場合(ステップS16;Yes)、制御部20は、音声出力などの処理を行わずにステップS23に移行する。つまり、本実施形態で、制御部20は、表示パネル65に表示される広告画像を既に見ている人には、超指向性スピーカ40による音声出力を行わない。これは、広告画像を見ていない人に超指向性スピーカ40の音声を聴かせることで、広告に注目させるためであり、広告への注目を集めることを最優先とする場合に特に有効である。
【0037】
また、処理対象の人物の画像から判定された顔の向きが、表示パネル65の正面を向いていない場合(ステップS16;No)、制御部20は、この人物を超指向性スピーカ40の音声出力の対象者として決定し(ステップS17)、この人物の画像に基づいて属性判別部22による属性判別を行い(ステップS18)、音声出力制御部23の機能により、音声選択用テーブル33に従って音声データを選択するとともに選択した音声データを広告音声データ32から取得する(ステップS19)。
続いて、制御部20は、超指向性スピーカ40の音声出力方向をステップS17で決定した対象者の方向に合わせるため、スピーカ台座制御部24の機能によって台座駆動部12を制御し、超指向性スピーカ40の向きを調整する(ステップS20)。そして、制御部20は、音声出力制御部23の機能によって超指向性スピーカ40から音声を出力させ(ステップS21)、この人物画像についてステップS18で検出した特徴を対象者履歴情報34に登録し(ステップS22)、ステップS23に移行する。
ステップS23では、カメラ50の撮影画像において検出された人物の画像の全てについて処理が完了したか否かを判別し、全ての人物の画像の処理が済んでいれば(ステップS23;Yes)、本処理を終了し、まだ処理されていない人物の画像がある場合は(ステップS23;No)、ステップS13に戻って、別の人物の画像を処理対象とする。
【0038】
ところで、ステップS13で選択された処理対象の人物の画像が、対象者履歴情報34に登録されていた対象者の画像であった場合(ステップS14;Yes)、制御部20は、この対象者について、注目時間検出処理を実行する(ステップS24)。
図7は、注目時間検出処理を詳細に示すフローチャートである。
この注目時間検出処理において、制御部20は、顔方向判定部21の機能によって、撮影画像に基づいて、検出された対象者の顔の向きを判定する(ステップS31)。
次に、制御部20は、この対象者について対象者履歴情報34に設定されている注目フラグがONかOFFかを判別する(ステップS32)。
【0039】
対象者履歴情報34の注目フラグがOFFであった場合(ステップS32;No)、制御部20は、顔方向判定部21が判定した顔の向きが表示パネル65を正面から見る向きか否かを判別する(ステップS33)。顔の向きが表示パネル65の正面であれば(ステップS33;Yes)、制御部20は、この対象者に対応する対象者履歴情報34の注目フラグをONに設定し(ステップS34)、ステップS11(図6)で取得した撮影画像の撮影時刻を、対象者履歴情報34の撮影時刻として登録し(ステップS35)、図6のステップS23に移行する。
また、顔の向きが表示パネル65の正面でなければ(ステップS33;No)、制御部20は、この対象者に対応する音声データを音声選択用テーブル33に基づいて選択するとともに、選択した音声データを広告音声データ32から取得する(ステップS36)。続いて、制御部20は、超指向性スピーカ40の音声出力方向を対象者の方向に合わせるため、スピーカ台座制御部24の機能によって台座駆動部12を制御し、超指向性スピーカ40の向きを調整する(ステップS37)。そして、制御部20は、音声出力制御部23の機能によって超指向性スピーカ40から音声を出力させ(ステップS38)、ステップS23に移行する。
【0040】
一方、対象者履歴情報34の注目フラグがONであった場合(ステップS32;Yes)、制御部20は、顔方向判定部21が判定した顔の向きが表示パネル65を正面から見る向きか否かを判別する(ステップS39)。ここで、顔の向きが表示パネル65の正面であれば(ステップS39;Yes)、制御部20は、そのまま図6のステップS23に移行する。
【0041】
ここで、顔の向きが表示パネル65の正面でなければ(ステップS39;No)、制御部20は、対象者の顔の向きが正面向きであった時間を算出する(ステップS40)。すなわち、ステップS32で判別した注目フラグがONであったことから、この対象者は、対象者履歴情報34の撮影時刻より後は、表示パネル65を正面から見ていたことになる。そして、ステップS39で顔が表示パネル65の正面を向いていないと判別されたので、この対象者は表示パネル65を正面から見るのをやめたことになる。このため、対象者履歴情報34の撮影時刻から、ステップS11で取得した撮影画像の撮影時刻までの間、この対象者は表示パネル65を正面から注目していたと見なすことができる。そこで、制御部20は、ステップS40において、対象者履歴情報34の撮影時刻から、ステップS11で取得した撮影画像の撮影時刻までの時間を算出し、この時間を、対象者が表示パネル65に注目していた時間として記憶部30に記憶する。
その後、制御部20は、この対象者に関する対象者履歴情報34の注目フラグをOFFに設定して(ステップS41)、図6のステップS23に移行する。
【0042】
この図7に示す注目時間算出処理では、一人の対象者が写った複数の撮影画像に基づいて、対象者の顔の向きが表示パネル65の正面以外から表示パネル65の正面に変化したときの撮影画像と、表示パネル65の正面から表示パネル65の正面以外に変化したときの撮影画像とを検出し、これら2つの撮影画像の撮影時刻をもとに、対象者が表示パネル65を正面から見ていた時間を算出する。
【0043】
以上説明したように、本発明を適用した実施形態に係る音声出力システム1によれば、広告を表示する表示パネル65を視認可能な範囲にいる人を対象者として、この対象者に向けて超指向性スピーカ40から音声を出力し、音声を出力した後の対象者の顔の向きを判定するので、音声を出力することで広告への注目を喚起する一方、音声出力後における対象者の広告への注目の状態を判定できる。
また、超指向性スピーカ40を用いることで、僅かな人数にしか聞こえないように音声を出力することができ、広い範囲の人に聞こえるように音声を出力する場合に比べて、広告への注目を強く喚起できる。これにより、超指向性スピーカ40を用いた音声出力によって広告に対する注目を集めるとともに、この音声出力によって実際に広告への注目が喚起されたかどうか、すなわち、超指向性スピーカ40による注目喚起の効果を正確に知ることができる。
【0044】
また、音声出力システム1は、制御部20によって、超指向性スピーカ40によって音声を出力した後に、対象者の顔が表示パネル65の正面向きであると判定してから、対象者の顔が広告の表示面を向いていた時間を求める。つまり、対象者が表示パネル65に注目していた時間を求めるので、超指向性スピーカ40の音声が対象者に与えた影響を詳細に知ることができる。制御部20は、超指向性スピーカ40によって音声を出力した後に対象者の顔が表示パネル65を正面から見る向きになった時点を起点とし、その後に対象者の顔の向きが表示パネル65を正面から見る向きでなくなった時点までの時間を求めるので、他の要因による影響を極力排して、超指向性スピーカ40の音声による直接の効果を知ることができる。
【0045】
さらに、音声出力システム1は、カメラ50の撮影画像に写っている人物のうち、その顔が表示パネル65を正面から見ていない人物を対象者として検出し、超指向性スピーカ40によって音声を出力する。つまり、既に表示パネル65を正面から見ている人を除いて、広告に注目していない人のみを対象として超指向性スピーカ40によって音声による訴求を行うので、効果的に広告への注目を喚起できる。さらに、超指向性スピーカ40によって音声を出力した後の顔の向きを判定することで、その対象者が実際に広告に注目したか否かを判定でき、超指向性スピーカ40による注目喚起の効果を正確に知ることができる。
さらにまた、音声出力システム1は、カメラ50によって、広告画像を表示する表示装置60の表示パネル65を視認可能な範囲を撮影し、超指向性スピーカ40から、表示装置60により表示中の広告画像に関連する音声を出力するので、広告画像に関連する音声を出力することによって広告への注目をより強く喚起し、広告の訴求力を高めることができる。
【0046】
また、音声出力システム1は、超指向性スピーカ40によって音声を出力した後に、その対象者の顔の向きが、表示パネル65を正面から見る向きでないと判定した場合には、その対象者に対して、さらに超指向性スピーカ40から音声を出力するので、広告に注目していない対象者に、より強く広告への注目を喚起できる。また、音声選択用テーブル33に従って、同じ対象者に対して2回目以後に超指向性スピーカ40から出力される音声として、1回目とは異なる音声が選択されるので、より強く広告への注目を喚起できる。
【0047】
なお、上述した実施形態は、あくまでも本発明の一態様を示すものであり、本発明の範囲内で任意に変形および応用が可能である。
例えば、上記実施形態においては、対象者の属性に応じて音声選択用テーブル33に基づいて音声データを選択する構成を例に挙げて説明したが、本発明はこれに限定されるものではなく、例えば、対象者の属性を予め設定しておき、この属性に該当する人物の画像があった場合に、この人物に対してのみ音声を出力することも可能である。この場合、カメラ50の撮影画像から検出された人物の画像が、予め対象者の属性として設定された属性であった場合のみ、超指向性スピーカ40による音声出力を行い、設定された属性以外の属性の人物に対しては、超指向性スピーカ40による音声を聴かせないことになるが、広告対象として想定されている属性から外れる人に注目を喚起する意味は薄く、広告対象の属性に該当する人に注目を喚起する方が高い広告効果が望めることから、効果的に広告への注目を集めることができる。
【0048】
また、例えば、上記の実施形態では、属性判別部22が属性として人物の性別や年代を判別する構成としたが、判別される属性は性別に限らず、日本人であるか外国人であるかを判別する構成とし、日本人の場合にはこの人物に対し日本語の音声が出力されるようにし、外国人の場合にはこの人物に対し外国語の音声が出力されるようにしてもよい。
また、上記実施形態では、例えば壁掛け設置される表示装置60に超指向性スピーカ40及びカメラ50が設置される構成を例に挙げて説明したが、本発明はこれに限定されるものではなく、表示装置60から離れた場所に超指向性スピーカ40及びカメラ50を設置することも勿論可能であり、超指向性スピーカ40とカメラ50とを互いに離れた場所に設置することも可能である。さらに、広告を表示する表示面としては、表示装置60の表示パネル65に限定されず、例えば紙または合成樹脂製のシートからなるポスターを掲示する掲示板も、広告を表示する表示面に相当するし、壁面に直接広告が描かれている場合に、この壁面自体を広告の表示面として扱うことも可能である。すなわち、この壁面を視認可能な範囲をカメラ50により撮影するとともに、この撮影画像に基づいて音声を聴かせる対象者を選択してから、対象者に向けて超指向性スピーカ40により音声を出力することが可能である。
【0049】
さらに、上記実施形における超指向性スピーカ40及びカメラ50の数についても任意であり、制御部20が実行するプログラムは記憶部30や記録媒体読取部15によって読み取り可能な記録媒体に記録するほか、通信回線(図示略)を介してダウンロードすることも可能であり、その他、音声出力システム1を構成する細部構成等についても、任意に変更可能であることは勿論である。
【図面の簡単な説明】
【0050】
【図1】音声出力システムの構成を示す機能ブロック図である。
【図2】超指向性スピーカ及びカメラの設置状態を示す斜視図である。
【図3】カメラの撮影範囲を示す平面図である。
【図4】音声選択用テーブルの構成例を模式的に示す図である。
【図5】対象者履歴情報の構成例を模式的に示す図である。
【図6】音声出力システムの動作を示すフローチャートである。
【図7】音声出力システムの動作を示すフローチャートである。
【符号の説明】
【0051】
1…音声出力システム(音声出力装置)、10…制御装置(音声出力制御装置)、11…音声出力部、12…台座駆動部、20…制御部(対象者検出手段、注目時間検出手段)、21…顔方向判定部(対象者検出手段)、22…属性判別部、23…音声出力制御部(音声出力制御手段)、24…スピーカ台座制御部、30…記憶部、31…広告画像データ、32…広告音声データ、32…音声選択用テーブル、33…音声選択用テーブル、34…対象者履歴情報、40…超指向性スピーカ、41…スピーカ台座(音声方向調整機構)、50…カメラ(撮影手段)、60…表示装置、65…表示パネル。

【特許請求の範囲】
【請求項1】
特定の方向に音声を出力する超指向性スピーカと、前記超指向性スピーカの音声出力方向を調整する音声方向調整機構と、に接続され、
広告の表示面を視認可能な範囲を撮影する撮影手段と、
前記撮影手段により撮影された撮影画像に写っている人物を対象者として検出する対象者検出手段と、
前記音声方向調整機構によって、前記超指向性スピーカの音声出力方向を前記対象者検出手段により検出された対象者の方に向けさせて、前記超指向性スピーカから音声を出力させる音声出力制御手段と、
前記音声出力制御の制御によって前記超指向性スピーカから音声を出力させた後に前記撮影手段により撮影された撮影画像に基づいて、前記対象者の顔の向きを判定する向き判定手段と、
を備えることを特徴とする音声出力制御装置。
【請求項2】
前記向き判定手段によって前記対象者の顔が前記広告の表示面を向いていると判定されてから、前記対象者の顔が前記広告の表示面を向いていた時間を求める注目時間検出手段をさらに備えること、
を特徴とする請求項1記載の音声出力制御装置。
【請求項3】
前記音声出力制御部手段は、前記撮影手段により撮影された撮影画像に写っている人物のうち、その顔が前記広告の表示面を向いていない人物を対象者として検出すること、
を特徴とする請求項1または2記載の音声出力制御装置。
【請求項4】
前記撮影手段は、前記広告の表示面として、広告画像を表示する表示装置の表示画面を視認可能な範囲を撮影するものであり、
前記音声出力制御手段は、前記超指向性スピーカから、前記表示装置により表示中の広告画像に関連する音声を出力させること、
を特徴とする請求項1から3のいずれかに記載の音声出力制御装置。
【請求項5】
特定の方向に音声を出力する超指向性スピーカと、
前記超指向性スピーカの音声出力方向を調整する音声方向調整機構と、
広告の表示面を視認可能な範囲を撮影する撮影手段と、
前記撮影手段により撮影された撮影画像に写っている人物を対象者として検出する対象者検出手段と、
前記音声方向調整機構によって、前記超指向性スピーカの音声出力方向を前記対象者検出手段により検出された対象者の方に向けさせて、前記超指向性スピーカから音声を出力させる音声出力制御手段と、
前記音声出力制御の制御によって前記超指向性スピーカから音声を出力させた後に前記撮影手段により撮影された撮影画像に基づいて、前記対象者の顔の向きを判定する向き判定手段と、
を備えることを特徴とする音声出力装置。
【請求項6】
特定の方向に音声を出力する超指向性スピーカと、前記超指向性スピーカの音声出力方向を調整する音声方向調整機構と、に接続された音声出力制御装置により、
広告の表示面の前方を撮影し、
撮影画像に写っている人物を対象者として検出し、
前記音声方向調整機構によって、前記超指向性スピーカの音声出力方向を前記対象者検出手段により検出された対象者の方に向くよう調整させ、前記超指向性スピーカから音声を出力させ、
前記超指向性スピーカから音声を出力させた後に撮影を行い、この撮影画像に基づいて、前記対象者の顔の向きを判定すること、
を特徴とする音声出力制御方法。
【請求項7】
特定の方向に音声を出力する超指向性スピーカと、前記超指向性スピーカの音声出力方向を調整する音声方向調整機構と、に接続されたコンピュータにより実行されるプログラムであって、
前記コンピュータを、
広告の表示面を視認可能な範囲を撮影する撮影手段と、
前記撮影手段により撮影された撮影画像に写っている人物を対象者として検出する対象者検出手段と、
前記音声方向調整機構によって、前記超指向性スピーカの音声出力方向を前記対象者検出手段により検出された対象者の方に向けさせて、前記超指向性スピーカから音声を出力させる音声出力制御手段と、
前記音声出力制御の制御によって前記超指向性スピーカから音声を出力させた後に前記撮影手段により撮影された撮影画像に基づいて、前記対象者の顔の向きを判定する向き判定手段と、
して機能させることを特徴とするプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2010−39094(P2010−39094A)
【公開日】平成22年2月18日(2010.2.18)
【国際特許分類】
【出願番号】特願2008−200460(P2008−200460)
【出願日】平成20年8月4日(2008.8.4)
【出願人】(000002369)セイコーエプソン株式会社 (51,324)
【Fターム(参考)】