説明

情報伝達装置

【課題】臨場感を得ることのできる情報伝達装置を提供する。
【解決手段】映写機15が動画像と音声を取得し、スクリーン11に動画像を表示する。当該動画像が表示されると同時に、対象物検出部13が当該動画像から対象物を検出し、音声制御部14が対象物検出部13の検出結果に基づいて、複数の音声出力部12の夫々を制御する。複数の音声出力部12は、スクリーン11の異なる位置に対応して配置されている。音声制御部14は、例えば、対象物の音声を当該対象物の位置に対応する音声出力部12からのみ出力するように制御される。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、動画像と音声を伝達する情報伝達装置に関する。
【背景技術】
【0002】
テレビジョン、コンピュータ端末、テレビ電話などの情報伝達装置では、臨場感を出すための技術が望まれている。
【0003】
従来、臨場感を出すために、視覚的には、動画像が表示される画面(スクリーン)を大きくしたり、聴覚的には、低音出力用スピーカーから大音量の音声を出力したり、ホームシアターシステムのように複数台のスピーカーを用いたりされている。
【0004】
また、このような臨場感を出すための従来技術は、例えば、特許文献1や特許文献2に開示されている。
【0005】
しかし、これらの装置は、スクリーンとスピーカーが空間的に離れた場所に存在するために、臨場感が低下するという問題がある。
【0006】
このような問題に鑑みた従来技術として特許文献3には、動画像表示面と実質上同一の面から音声発生が行われることを特徴とし、動画像表示面の部分(部分音声発生素子)ごとに音声の定位を制御することを特徴とする情報伝達システムが開示されている。
【0007】
しかし、特許文献3の技術では、予め部分音声発生素子ごとに音声信号を割り当てるため、音声信号が予め分けられていなければならず、モノラル音声信号や2chステレオ音声信号などの動画像を観賞する際に高い臨場感を得ることができない。
【特許文献1】特開平6−237458号公報
【特許文献2】特開2003−274314号公報
【特許文献3】特開2001−78282号公報
【発明の開示】
【発明が解決しようとする課題】
【0008】
本発明は上記実情に鑑みてなされたものであって、その目的とするところは、臨場感を得ることのできる情報伝達装置を提供することにある。
【課題を解決するための手段】
【0009】
上記目的を達成するために、本発明は以下の構成を採用する。
【0010】
本発明に係る情報伝達装置は、動画像が表示されるスクリーンと、前記スクリーン上の異なる位置に対応して配置された複数の音声出力部と、前記動画像から対象物を検出する対象物検出手段と、前記対象物検出手段の検出結果に基づいて、前記複数の音声出力部の夫々を制御する制御手段と、を備えることを特徴とする。
【0011】
本発明に係る情報伝達装置は、複数の制御可能な音声出力部がスクリーン上の異なる位置に対応して配置されており、夫々の音声出力部は対象物検出手段の検出結果に基づいて制御される。例えば、スクリーンの一部に或る対象物が写っている場合、当該対象物の位置に対応する音声出力部から音声が出力されるように制御すれば、視聴者は、対象物の方向から音声が聞こえてくるため、当該対象物が音声を発しているような感覚を得ることができる。更に、当該対象物が移動する場合、その動きに合わせて当該音声を出力する音声
出力部を切り換えることにより、視聴者は当該対象物が音声を発しているような感覚を得続けることができる。換言すれば、視聴者は、動画像に写っているものが本当にそこにあるかのような立体感を得ることができ、ひいては、あたかもスクリーンに写っている空間内に自分がいるかのような臨場感を得ることができる。
【0012】
また、本発明に係る情報伝達装置は、入力される音声から、前記対象物検出手段で検出された対象物の音声を抽出する音声抽出手段を更に備え、前記制御手段は、前記抽出手段で抽出された音声を前記対象物の表示位置に対応する音声出力部から出力することが好ましい。これにより、入力される音声に対象物が発している音声以外の音声が混ざっていたとしても(実際、映画やテレビ番組などの動画像では、対象物が発する音声以外の音声も混ざっていることが多い)、視聴者は、対象物が発している音声のみが当該対象物の方向から聞こえるような感覚を得ることができる。
【0013】
また、本発明に係る情報伝達装置は、前記動画像と音声が入力される入力部と、入力された動画像を前記スクリーンに表示する動画像表示部と、を更に備えることが好ましい。これにより、当該情報伝達装置の有用性が向上する。
【0014】
制御手段は、対象物の大きさに基づいて抽出手段で抽出された音声の音量を決定することが好ましい。現実には、遠くの対象物が発する音と近くの対象物が発する音とでは、その大きさに違いがあるのが普通である(例えば、遠くの対象物が発する音のほうが小さく聞こえるなど)。また、動画像は、遠くの対象物ほど小さく写る傾向にあるため、対象物の大きさに基づいて音量を決定することにより、より現実に近い状況を再現することができる。
【0015】
また、本発明に係る情報伝達装置は、スクリーンと独立の位置に配置される独立音声出力部を更に備え、制御手段は、抽出手段で抽出された音声以外の少なくとも一部の音声を独立音声出力部から出力することが好ましい。これにより、例えば、動画像中に映っていない人物の音声やBGMなどがスクリーン外から聞こえるようになり、音の立体感および臨場感が更に高まる。
【0016】
制御手段は、抽出手段で抽出された音声以外の少なくとも一部の音声をスクリーンの全ての位置に対応する音声出力部から出力することが好ましい。これにより、BGMやナレーションなどがスクリーン全体から聞こえるようになる。更に、付加機器を備えることなく対象物以外の音声を出力することができる。
【0017】
制御手段は、抽出手段で抽出された音声以外の少なくとも一部の音声をスクリーンの一部の領域に対応する音声出力部から出力することが好ましい。これにより、全ての音声出力部のうち、音声を出力する音声出力部の数を減らすことができるため、消費電力を低く抑えることができる。
【発明の効果】
【0018】
本発明に係る情報伝達装置では、音声出力部を対象物検出手段の結果に基づいて制御することにより、どのような動画像(音声を含む)に対しても臨場感を得ることができる。
【発明を実施するための最良の形態】
【0019】
以下に図面を参照して、この発明の好適な実施の形態を例示的に詳しく説明する。
【0020】
<装置構成>
図1は、本発明の実施形態に係る情報伝達装置の機能構成を示すブロック図である。この情報伝達装置は、動画像と音声を伝達する装置である。
【0021】
情報伝達装置は、スクリーン11、複数の音声出力部12、対象物検出部13、及び、音声制御部14を備える(図1参照)。
【0022】
スクリーン11は、映写幕やディスプレイ装置の映像面など、動画像を表示することができれば、どのような技術を適用してもよい。本実施形態におけるスクリーン11は映写幕である。本実施形態では、図1に示す市販の映写機15(プロジェクタ)が動画像及び音声を取得し、スクリーン11に当該動画像を表示する。なお、映写機15は、DVDプレーヤーなどを用いて市販のDVD(映画など)から動画像及び音声を取得してもよいし、ハードディスクなどに記憶されている動画像(音声を含む)を取得してもよい。
【0023】
音声出力部12は、コーンスピーカーやフラットパネルスピーカーなど、音声を出力することができれば、どのような技術を適用してもよい。本実施形態における音声出力部12はフラットパネルスピーカーである。フラットパネルスピーカーはコーンスピーカーに比べ音波の拡散・減衰が小さいため、ユーザは音声の聞こえてくる位置をより正確に認識することができる。すなわち、音声出力部12としてフラットパネルスピーカーを用いることにより、ユーザは、より高い臨場感を得ることができる。
【0024】
更に、複数の音声出力部12は、スクリーン11上の異なる位置に対応して配置されている。本実施形態における複数の音声出力部12は、図2に示すようにスクリーン11の裏面にm×nのマトリクス状に配置されている。なお、複数の音声出力部12は、図2のように配置しなくてもよい。音声出力部12が透明であれば、スクリーン11の前面に配置してもよい。マトリクス状でなく、放射状に配置してもよい。音声出力部12の数もいくつでもよい(例えば、100個でもよいし、2個でもよい。)。音声出力部12の配置及び数は、ユーザの目的に応じてどのように配置してもよい。
【0025】
対象物検出部13は、動画像から対象物を検出する機能である(本実施形態における対象物検出部13は、図1に示すように、映写機15から動画像を取得する)。対象物検出部13による対象物検出処理は、既存のどのような技術が適用されてもよい。対象物は、音を発するものや動きのあるものなど、どのようなものであってもよい。例えば、人物、乗り物(電車、自動車、飛行機など)などを対象物とすればよい。なお、動きがあるものは、表示位置自体に変化があるものであってもよいし、周囲の動き(背景など)に対して動きがあるものであってもよい。対象物検出部13の検出結果は、当該対象物の種類、大きさ、位置など、その対象物を表す量であればどのようなものでもよい(本実施形態では、検出結果として、対象物の大きさ及び位置(対象物の中心の位置座標)が出力される)。
【0026】
音声制御部14は、対象物検出部13の検出結果に基づいて夫々の音声出力部12を制御する機能である(本実施形態における音声制御部14は、図1に示すように、映写機15から音声を取得する)。なお、音声制御部14は、音声出力部12ごとに備えていてもよいし、1つの音声制御部14で全ての音声出力部12を制御してもよい。音声出力部12の制御方法の例については後で詳しく説明する。
【0027】
<情報伝達機能>
図3のフローチャートに沿って、情報伝達装置の機能及び処理の流れについて説明する。
【0028】
情報伝達機能が起動すると、映写機15が、動画像及びその音声を取得する(ステップS101)。本実施形態では、図4のように人物41のみが写っている動画像及びその音声(人物41の声のみの音声)が取得されたとする。
【0029】
次に、ステップS101で取得された動画像がスクリーン11に表示される(ステップS102)。
【0030】
ステップS102と同時に(動画像がスクリーン11に表示されると同時に)以下の工程が行われる。
【0031】
対象物検出部13が、ステップS101で取得された動画像から対象物を検出する(ステップS103)。本実施形態では、対象物として、人の顔を考える(すなわち、図4の例では、人物41の顔が検出される)。
【0032】
そして、音声制御部14が、対象物検出部13の検出結果に基づいて夫々の音声出力部12を制御する(ステップS104)。図4の例では、音声制御部14は、人物41の顔の位置に対応する音声出力部42からのみ音声を出力するように、夫々の音声出力部12(音声出力部42を含む)を制御する。これにより、人物41の方向からのみ音声が聞こえるようになる。なお、当該音声は、顔(対象物)の位置に対応する1つの音声出力部42から出力したものであってもよいし、当該位置を中心とする複数の音声出力部42から出力したものであってもよい(例えば、顔の大きさに応じて当該音声を出力させる音声出力部42の数を決定してもよい)。
【0033】
対象物が移動する場合であっても(例えば、人物41がスクリーン上の右から左へ動くような動画像であったとしても)、当該対象物の移動に伴って、その位置に対応する音声出力部42は順次切り替わるため、人物41の方向からのみ音声が聞こえるという状態を保つことができる(図4参照)。
【0034】
以上述べたように、本実施形態では、対象物の検出結果に応じて複数の音声出力部12を制御することにより、臨場感を得ることができる(図4の例では、実際に人物41がその場にいるかのような臨場感を得ることができる。)。
【0035】
<変形例1>
変形例1では、音声に対象物以外の音声(例えばBGMなど)が混在している場合について説明する。なお、上記説明と同様の機能及び処理については説明を省略する。
【0036】
<装置構成>
図5は、変形例1における情報伝達装置の機能構成を示すブロック図である。この情報伝達装置は、音声抽出部51を更に備えている。なお、図1と同様の機能については同じ符号を付けている。
【0037】
音声抽出部51は、対象物検出部13で検出された対象物の音声を抽出する機能である。変形例1では、音声抽出部51が、映写機15から取得した音声のうち、当該対象物の音声を抽出・区別し、音声制御部14へ出力する。なお、音声抽出部51における音声抽出処理は、既存のどのような技術が適用されてもよい。一例を挙げると、音声を周波数分析し、対象物の音声の周波数域のみを抽出する手法などがある。
【0038】
<情報伝達機能>
図6のフローチャートに沿って、変形例1の情報伝達装置の機能及び処理の流れについて説明する。
【0039】
ステップS201〜S203の処理は、夫々、図3のステップS101〜S103の処理と同様のため、説明を省略する。ただし、変形例1では、音声に対象物以外の音声が混
在している。
【0040】
ステップS203の次に、音声抽出部51が、ステップS201で取得された音声から対象物の音声を抽出する(ステップS204)。図4の例では、人物41の音声(声)が抽出される。
【0041】
そして、音声制御部14が、対象物検出部13の検出結果に基づいて夫々の音声出力部12を制御する(ステップS205)。図4の例では、ステップS204で抽出された音声が、人物41の顔の位置に対応する音声出力部42からのみ出力されるように制御される。これにより、音声に人物41以外の音声が混在していても、人物41の方向からのみ当該人物の音声が聞こえるようになる。
【0042】
以上述べたように、変形例1では、情報伝達装置が音声抽出部51を更に備え、取得した音声から対象物の音声を抽出する。それにより、音声に対象物以外の音声が混在していても、対象物の方向からのみ当該人物の音声が聞こえるようになり、臨場感を得ることができる。
【0043】
<変形例2>
変形例2では、対象物の大きさに応じて、音声の大きさを決定する。実際、近くの対象物が発する音は、遠くの対象物が発する音と比較して大きい。また、動画像は、遠くの対象物ほど小さく写る傾向にある。そのため、対象物の大きさに応じて音声の大きさを決定することにより、より現実に近い状況を再現することができる。
【0044】
例えば、図7に示すように人物71が近づいてくるような動画像では、人物71が近づくことによって徐々にその大きさ(サイズ)が大きく写るようになる。そこで、人物71の大きさが大きくなるにつれて、人物71の音声(人物71の位置に対応する音声出力部72から出力される音声)の音量を徐々に大きくする。それにより、視聴者は、人物71が本当に近づいてきているかのような立体感を得ることができる。なお、音量は、音量そのものを上げてもよいし、当該音声を出力する音声出力部72の数を増やすことにより音量を増やすことができる場合には、そのようにして音量を上げてもよい。
【0045】
<変形例3>
変形例3では、図8に示すように、変形例1の情報伝達装置が独立音声出力部81を更に備えている。
【0046】
独立音声出力部81は、音声出力部12同様、音声を出力することのできる装置であればどのようなものであってもよい。ただし、独立音声出力部81は、スクリーン11と独立の位置に配置されている。
【0047】
変形例3では、図9に示すように、変形例1における対象物以外の音声(音声抽出部51で(対象物の音声が)抽出された残りの音声)が独立音声出力部81から出力されるように制御される(図9の例では、対象物として人物91が検出されたとし、人物91の音声は人物91の位置に対応する音声出力部12から出力されるとする)。これにより、対象物(人物91)以外から発せられる音声(BGMなど)は、スクリーン11外から聞こえるようになり、音の立体感および臨場感が更に高まる。
【0048】
<変形例4>
変形例4では、図10に示すように、対象物以外の音声が全ての音声出力部12から出力されるように制御される(図10の例では、対象物として人物101が検出されたとし、人物101の音声は人物101の位置に対応する音声出力部12から出力されるとする
)。これにより、抽出手段で抽出された音声と残りの音声を合わせた音声(つまり、映写機15が取得した音声)が対象物の位置に対応する音声出力部12から出力され、対象物以外の音声が当該音声出力部12以外の音声出力部12から出力される。
【0049】
変形例4では、対象物以外の位置から対象物の音声を無くすことにより、対象物以外の音声はスクリーン11全体から聞こえ、対象物の音声は対象物の方向からのみ聞こえるようになる。これにより、視聴者は、臨場感を得ることができる。
【0050】
<変形例5>
変形例5では、対象物以外の音声がスクリーン11の一部の領域から出力されるように制御される。
【0051】
図11の例では、対象物の位置に対応しない音声出力部12(すなわち、図11の点線で囲まれる領域以外に対応する音声出力部12)から対象物以外の音声を出力する(図11の例では、対象物として人物111が検出されたとし、人物111の音声は人物111の位置に対応する音声出力部12から出力されるとする)。対象物の位置と区別して音声を出力することにより、視聴者は臨場感を得ることができる。
【0052】
図12の例では、スクリーン11の中心位置に対応する音声出力部12から対象物以外の音声を出力する(図12の例では、対象物として人物121が検出されたとし、人物121の音声は人物121の位置に対応する音声出力部12から出力されるとする)。対象物以外の音声を常にスクリーン11の中心位置から出力することにより、視聴者は、当該音声を対象物の音声と区別することができる(対象物がスクリーン11の中心位置に写るときがあったとしても、対象物以外の音声は常に中心位置から出力されているため区別することができる)。
【0053】
変形例5では、対象物以外の音声を一部の領域に限定して出力することにより、消費電力を低く抑えることができ、且つ、視聴者は臨場感を得ることができる。
【0054】
なお、変形例1〜5は、互いに組み合わせてもよい。その場合、対象物以外の音声は、複数に分けてもよい。例えば、対象物以外の音声の一部を音声出力部12から出力し、残りの音声を独立音声出力部81から出力してもよい(雨の音などは音声出力部12から出力し、BGMは独立音声出力部81から出力するなど)。また、対象物検出処理などの画像解析を用いて音声制御を行う手法であれば、上記手法に限らなくてもよい。
【0055】
なお、図3,6に示す処理の流れは、夫々、可能な限り処理の順序を入れ替えてもよい。例えば、映写機15で取得した後に対象物検出処理や音声制御などの処理をするのではなく、対象物検出部13と音声制御部14が、動画像と音声を夫々取得し、種々の処理をした後に映写機15に出力してもよい(音声は映写機15に出力せずに、直接、音声出力部12に出力してもよい)。これにより、対象物検出や音声制御などの処理負荷が大きくても(処理時間が長くても)、音声の出力と動画像の表示を同じタイミングにすることができる。
【0056】
なお、映写機15の持つ機能を情報伝達装置の構成要素に含めてもよい。図13は当該情報伝達装置の機能構成を示すブロック図である。当該情報伝達装置は、入力部131及び動画像表示部132を更に備える。
【0057】
入力部131は、動画像と音声が入力されるものであり、動画像表示部132は、入力された動画像をスクリーンに表示するものである(つまり、入力部131と動画像表示部132とを合わせたものは、映写機15の役割を果たす)。
【0058】
なお、本実施形態では、動画像について詳しく述べていないが、動画像は、(本実施形態で例示したような)DVDなどに記憶されている映画でなくてもよい。例えば、アンテナで受信したテレビ番組であってもよいし、ゲーム機などから得られるゲーム画面であってもよい。対象物が検出できる動画像であればどのようなものであってもよい。
【0059】
なお、本実施形態では、映写機15を用いて映写幕(スクリーン11)に動画像が表示される場合(映画館などの上映システムに適用した例)について説明したが、本発明の情報伝達装置は、スクリーン11にテレビジョン装置などの映像面を用い、動画像をアンテナやDVD再生装置などから当該テレビジョン装置が取得するような構成であってもよい。すなわち、本発明の情報伝達装置は、上映システムに限らず、テレビジョン装置やコンピュータ端末、テレビ電話などに適用することができる。
【図面の簡単な説明】
【0060】
【図1】図1は、情報伝達装置の機能構成を示すブロック図である。
【図2】図2は、音声出力部12の設置様態の一例を示す図である。
【図3】図3は、情報伝達装置の処理の流れを示すフローチャートである。
【図4】図4は、音声制御部14の制御方法の一例を示す図である。
【図5】図5は、変形例1における情報伝達装置の機能構成を示すブロック図である。
【図6】図6は、変形例1における情報伝達装置の処理の流れを示すフローチャートである。
【図7】図7は、音声制御部14の制御方法の一例を示す図である。
【図8】図8は、独立音声出力部81を備えた情報伝達装置の機能構成を示すブロック図である。
【図9】図9は、音声制御部14の制御方法の一例を示す図である。
【図10】図10は、音声制御部14の制御方法の一例を示す図である。
【図11】図11は、音声制御部14の制御方法の一例を示す図である。
【図12】図12は、音声制御部14の制御方法の一例を示す図である。
【図13】図13は、入力部131及び動画像表示部132を備えた情報伝達装置の機能構成を示すブロック図である。
【符号の説明】
【0061】
11 スクリーン
12,42,72 音声出力部
13 対象物検出部
14 音声制御部
15 映写機
41,71,91,101,111,121 人物
81 独立音声出力部
131 入力部
132 動画像表示部

【特許請求の範囲】
【請求項1】
動画像が表示されるスクリーンと、
前記スクリーン上の異なる位置に対応して配置された複数の音声出力部と、
前記動画像から対象物を検出する対象物検出手段と、
前記対象物検出手段の検出結果に基づいて、前記複数の音声出力部の夫々を制御する制御手段と、
を備えることを特徴とする情報伝達装置。
【請求項2】
入力される音声から、前記対象物検出手段で検出された対象物の音声を抽出する音声抽出手段を更に備え、
前記制御手段は、前記抽出手段で抽出された音声を前記対象物の表示位置に対応する音声出力部から出力する
ことを特徴とする請求項1に記載の情報伝達装置。
【請求項3】
前記動画像と音声が入力される入力部と、
入力された動画像を前記スクリーンに表示する動画像表示部と、
を更に備えることを特徴とする請求項1〜請求項2のいずれか1項に記載の情報伝達装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate


【公開番号】特開2009−17438(P2009−17438A)
【公開日】平成21年1月22日(2009.1.22)
【国際特許分類】
【出願番号】特願2007−179406(P2007−179406)
【出願日】平成19年7月9日(2007.7.9)
【出願人】(502087460)株式会社トヨタIT開発センター (232)
【出願人】(000003207)トヨタ自動車株式会社 (59,920)
【Fターム(参考)】