説明

映像表示装置及び音声出力制御方法

【課題】音声出力が可能な映像表示装置、及び映像表示装置が含む通信機器の音声出力制御方法を提供する。
【解決手段】実施形態において、映像表示装置は、ネットワークを通じて音声及び映像を受信する通信処理部と、映像信号を出力する映像処理部と、音声信号を出力する音声処理部と、前記音声処理部が出力する音声信号をアナログ信号に変換する変換部と、前記映像処理部が出力する映像信号が前記通信処理部を通じて入力される映像信号である場合、前記音声処理部が前記変換部に入力する音声信号に、映像信号に対応して与える時間差の調整を行う調整部と、を具備する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明の実施の形態は、音声出力が可能な映像表示装置、及び映像表示装置が含む通信機器の音声出力制御方法に関する。
【背景技術】
【0002】
デジタル方式のテレビジョン放送、及びそれを受信することのできるテレビジョン受信装置(TV装置)普及がめざましい。
【0003】
また、インターネット網の普及に伴い、TV装置においても、番組すなわちコンテンツを、インターネット網を経由して、取得(受信)できる。
【0004】
また、インターネット網においては、IP(Internet Protocol)を用いる音声通信すなわちIP電話の利用が可能である。なお、IP電話は、音声のみならず、映像、特に動画の送受信が可能である。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開平11−177954号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
TV装置、特にデジタル放送を受信することができるものにおいては、圧縮された動画データと圧縮された音声データを、異なるデコーダで再生(デコード)する。
【0007】
TV装置がデコードする動画データは、音声データのデコードに比較して長いデコード時間を必要とする。
【0008】
本発明の目的は、音声出力が可能な映像表示装置、及び映像表示装置が含む通信機器の音声出力制御方法を提供することである。
【課題を解決するための手段】
【0009】
実施形態によれば、映像表示装置は、通信処理部と、映像処理部と、音声処理部と、変換部と、調整部と、を具備する。通信処理部は、ネットワークを通じて音声及び映像を受信する。映像処理部は、映像信号を出力する。音声処理部は、音声信号を出力する。変換部は、前記音声処理部が出力する音声信号をアナログ信号に変換する。調整部は、前記映像処理部が出力する映像信号が前記通信処理部を通じて入力される映像信号である場合、前記音声処理部が前記変換部に入力する音声信号に、映像信号に対応して与える時間差の調整を行う。
【図面の簡単な説明】
【0010】
【図1】実施形態の一例を示す概略図。
【図2】実施形態の一例を示す概略図。
【図3】実施形態の一例を示す概略図。
【図4】実施形態の一例を示す概略図。
【図5】実施形態の一例を示す概略図。
【図6】実施形態の一例を示す概略図。
【発明を実施するための形態】
【0011】
以下、実施の形態について図面を参照して説明する。
【0012】
図1は、実施形態を適用する映像表示装置と同映像表示装置に組み込まれる通信装置の一例を示す。なお、以下に説明する要素や構成あるいは機能は、ハードウエアで実現するものであってもよいし、マイクロコンピュータ(処理装置、CPU)等、を用いてソフトウエアで実現するものであってもよい。
【0013】
図1が示す映像表示装置1は、例えばテレビジョン放送を受信して音声(オーディオ)及び映像(ビデオ)を再生するテレビジョン受信装置(以下TV装置と称する)を含む。
【0014】
TV装置(映像表示装置)1は、少なくともデジタル放送の番組すなわちコンテンツを受信し、再生できる。なお、TV装置1は、インターネット(ネットワーク)網100を通じて供給されるコンテンツの受信が可能である。また、TV装置1は、インターネット網100を通じて接続される任意の接続相手先との間で、IP(Internet Protocol)を用いる音声(オーディオを含む)及び動画(ビデオ)による通信が可能なIP電話の利用が可能である。
【0015】
TV装置1において、コンテンツ(番組)を受信するチューナ部11が受信したコンテンツは、分離(Demux)部12により、映像(ビデオ)データと音声(オーディオ)データとに分離される。
【0016】
分離部12が分離した映像(ビデオ)データは、映像(ビデオ)処理ブロック21の映像(ビデオ)デコーダ22によりデコードされ、デジタル映像(ビデオ)信号として出力される。
【0017】
映像デコーダ22がデコードした映像(ビデオ)データは、映像出力装置を表示可能に処理する映像(ビデオ)処理部23に入力され、後段のディスプレイ24が表示可能に、所定の解像度及び出力方式、例えばインターレース(i)/ノンインターレース(p)等に変換され、ディスプレイ24に供給される。なお、映像(ビデオ)処理部23の出力は、例えば外部モニタ装置あるいは投影装置(プロジェクタ装置)等が接続可能な、出力端25に出力されてもよい。
【0018】
分離部12が分離した音声データは、音声(オーディオ)処理ブロック31の音声(オーディオ)デコーダ32によりデコードされ、デジタル音声(オーディオ)信号として出力される。
【0019】
音声デコーダ32がデコードした音声(オーディオ)信号は、音声出力装置が再生可能に処理する音声(オーディオ)処理部33と、音声(オーディオ)処理部33の出力に、映像(ビデオ)処理部23が出力する映像信号との間の時間的な整合のために、所定時間の遅延を与える(音声(オーディオ)出力を遅延させる)遅延部34を通過し、アナログの音声(オーディオ)出力を得るD−Aコンバータ35に入力される。
【0020】
D−Aコンバータ35からのアナログの音声(オーディオ)出力は、例えばスピーカ36に入力される。なお、D−Aコンバータ35からの出力は、AV(Audio Visual)アンプ等が接続可能な出力端37に、さらに分岐されてもよい。
【0021】
また、遅延部34により所定時間の遅延が与えられた音声(オーディオ)信号は、IP電話制御部41にも分岐される。IP電話制御部41は、例えば音声入力部(マイクロフォン)42と音声再生部(イヤホンまたは低出力の音声再生向けスピーカ)43とを含む通信セット44の接続が可能で、音声入力部42からの入力をA−D変換するA−D変換部45と音声再生部への出力をD−A変換するD−A変換部46とを含む。なお、音声再生部への出力をD−A変換するD−A変換部46は、音声(オーディオ)処理ブロック31のD−Aコンバータ35と共用される。
【0022】
IP電話制御部41は、ユーザの顔の画像等を取得するカメラ47及びカメラ映像処理部48を伴うことができる。また、IP電話制御部41は、通信相手先から送信された画像を再生する画像処理部49を伴うことができる。
【0023】
画像処理部49は、例えばJPEG(Joint Photographic Experts Group)に代表される静止画や、例えばMPEG(Moving Picture Experts Group)−2,−4(H.264−AVC)に代表される動画を再生できる。なお、動画を再生する画像処理部49は、映像(ビデオ)処理ブロック21の映像(ビデオ)処理部23と共用される。
【0024】
TV装置(映像表示装置)1において、チューナ部11、分離部12、映像(ビデオ)処理ブロック21、音声(オーディオ)処理ブロック31及びIP電話制御部41のそれぞれは、主制御ブロック51により制御され、所定の動作を実行する。
【0025】
主制御ブロック(Main Processing Unit,MPU)51は、例えばCPU(Central Processing Unit,演算装置)あるいはマイクロコンピュータを含む。MPU51は、動作プログラムを保持したROM及びワークメモリとして機能するRAMを少なくとも含むメモリユニット52、インターネット網を通じたIP電話制御部41に対する外部からの着信あるいはIP電話制御部41からの外部への送信を管理する状態管理部53、ディスプレイ24に表示するGUI(Graphical User Interface,グラフィカルユーザインタフェース)の表示及びGUIからのユーザ入力を処理するGUI制御部54及びインターネット網100との間の接続、すなわちインターネット網からのさまざまな情報の取得及びインターネット網100へのユーザからのアクセス等を制御するネットワーク制御部55、等を少なくとも含む。
【0026】
MPU51にはまた、ユーザからの制御入力を受け付ける操作入力部3が接続される。
【0027】
操作入力部3は、例えばチューナ(入力)部11が選択するチャンネルを特定するためのチャンネルキー(ボタン)や電源のオン/オフに用いる電源スイッチあるいはリモートコントローラ5からの指示や制御入力を受け付ける受信部、等を少なくとも含む。また、文字や記号あるいは数字等の入力を可能とするキー操作入力部(キーボード)等、が接続されてもよい。
【0028】
なお、IP電話制御部41は、MPU51のファームウエア、あるいは予め用意されたプログラムに従い動作するIP電話プログラム、例えばSkype社が提供するインターネット電話である「Skype」等、に準じ、通信セット44のマイクフォン42により取得するユーザの音声をパケット化し、ネットワーク(インターネット網)を介して接続された通信相手先に送信できる。もちろん、カメラ47が用意されている場合、ユーザの映像をパケット化し、音声とともに送信できる。
【0029】
TV装置1により番組(コンテンツ)を視聴中に、インターネット網100を経由してIP通話の着信があった場合、図4に示す視聴中の番組の「映像表示」401中の任意の位置、図4の例は、右上の例、に、GUI制御部54の制御により「着信表示」411が表示される。
【0030】
「着信表示」411は、例えば着信があることを表示する「着信表示」412、送信元すなわち相手先を表示する「相手先表示」413、応答の方法を示す「応答表示<1>」414、「応答表示<2>」415、及び「応答表示<3>」416、等を含む。なお、「応答表示<1>」414は、映像付の着信応答を、「応答表示<2>」415は、音声のみの着信応答を、及び「応答表示<3>」は、応答せず、を、それぞれ示す。従って、視聴者は、例えばリモコン5によるカーソル移動あるいはフォーカスにより、いずれかの応答の方法を選択し、応答または応答せず、を選択できる。
【0031】
図2に、放送視聴中にIP通話の着信があり、ユーザが通話を選択する場合の表示画面の切り替えと、音声出力の制御の一例を説明する。
【0032】
放送視聴中[01]に、通話の着信[02]があると、図4により説明した「着信表示」412が、「映像表示」401中に、表示される[03]。
【0033】
ユーザが、図4により説明した「応答表示<1>」、すなわち映像付の着信応答を選択した場合[04−YES]、音声(オーディオ)処理ブロック31の音声(オーディオ)デコーダ32の出力に、一時的に音量を「0」とするミュートがかけられる[05]。このとき、IP通話の終了時に、音声(オーディオ)出力を、元の視聴時の環境に復帰するために用いる情報として、音響設定条件が一時的にメモリユニット52のRAMあるいはMPU(マイクロコンピュータ)51のファームウエアに、保存される[06]。
【0034】
次に、番組(コンテンツ)視聴時に、映像デコーダ22がデコードした映像(ビデオ)データを映像出力装置として表示可能に処理する映像(ビデオ)処理部23において生じる(音声(オーディオ)出力に対する)映像(ビデオ)出力の遅延(ディレイ)成分を除去するために、音響出力ディレイ処理が削除される[07]。なお、実際の制御としては、例えばMPU51の制御により、音声(オーディオ)処理部33の出力を遅延部34に入力せずに、切り替え(信号)線により、直接D−Aコンバータ35に入力すればよい。すなわち、音声(オーディオ)出力と映像(ビデオ)出力との間の時間差を、実質的に0または予め許容される所定時間、例えば200ms(ミリ秒)以内とする。もちろん、切り替え器(スイッチ)等を用意して、遅延部34を経由しないパス(経路)を用いることもできる。なお、IP通話は、音声(オーディオ)のみであってもよいことはいうまでもない。
【0035】
遅延部34によるディレイ処理の削除[07]により、デジタル放送受信を主に扱うTV装置1に広く採用されている『映像の表示に合わせて、音声の出力に調整(ディレイ)がかけられている』ことに起因して、IP通話に付属する映像と音声とが大きくずれることが防止される。
【0036】
すなわち、音声のみの通話(一般的な電話による通話)においては、一般に快適に通話ができる応答性能として、200ms(ミリ秒)程度の期間に相手側の音声が出力されることが望まれており、デジタル放送受信を主に扱うTV装置のディレイが有効である場合は、IP通話においては、応答性能が低下する、との指摘が改善できる。なお、デジタル放送受信を主に扱うTV装置のディレイは、例えば2秒程度であり、ディレイが有効である場合、IP通話の環境は大きく低下する(応答性能が低くなる)ことから、遅延部34によるディレイ処理を削除する効果は大きい。
【0037】
遅延部34によるディレイ処理の削除に続いて、表示画面が、図5に示す「通話画面」501に切り替えられる[08]。「通話画面」501は、例えばIP通話モードが起動していることを示す「モード表示」511、着信(通話待機)中であることを示す「着信中表示」512、「電話帳(相手先リスト)表示」513〜517、カメラの動作等を示す「動作表示」518、相手先と自身の顔の映像を表示する「映像表示」519、520等を含む。
【0038】
続いて、「通話画面」501の表示と同時、あるいは所定のタイミングで、通話用音響設定、例えば自身が送信する送信音声のレベル(マイクロフォン42の感度)、相手先音声の再生レベル(イヤホン43への出力強度)等の設定が実施される[09]。
【0039】
以下、ミュートが解除[10]され、通話準備か終了し、通話(送信と受信)が可能となる[11]。
【0040】
このように、TV装置1による番組視聴中に着信するIP通話の音声(オーディオ)出力について、TV装置1による番組視聴中に、遅延部34により通常用いられる音声へのディレイ(映像出力との間の時間的なずれを排除するための調整)をキャンセルし、IP通話中の映像と音声の時間的なずれを実質的になくすことで、快適な応答性能を得ることができる。
【0041】
図3は、図2に一例を示したIP通話による通話終了後、ユーザが放送視聴を選択する場合の制御例を示す。
【0042】
IP通話が終了した場合、例えば別の相手先との間でIP通話を開始する場合や、終了したIP通話の内容に従い、外出や資料探し等、TV装置1による番組の視聴を続けるとは限らないが、図3では、IP通話の終了後、再びTV装置1による番組の視聴を継続する場合を説明する。
【0043】
IP通話の終了後、番組(放送)の視聴の継続すなわち放送視聴への切り替えが指示される[101]と、音声(オーディオ)処理ブロック31の音声(オーディオ)デコーダ32の出力に、一時的に音量を「0」とするミュートがかけられる[102]。このとき、次のIP通話に備え、通話用音響設定、例えば自身が送信する送信音声のレベル(マイクロフォン42の感度)、相手先音声の再生レベル(イヤホン43への出力強度)等の保存が実施される[103]。
【0044】
続いて、または所定のタイミングで、映像(ビデオ)処理部23の出力が先に視聴中であった番組(コンテンツ)に変更され、ディスプレイ24に、図6に示すように、IP通話開始前に視聴していた番組(コンテンツ)の「映像」601が表示される[104]。
【0045】
次に、音声(オーディオ)処理部33の出力が遅延部34を経由するTVモードに切り替えられる。すなわち、音声(オーディオ)処理部33の出力に対し、遅延部34によるディレイ処理が追加される[105]。これにより、デジタル放送受信を主に扱うTV装置1において通常適用される『映像の表示に合わせた音声の出力の調整(ディレイ)』が復帰し、視聴する番組(コンテンツ)の映像を音声とがずれることが防止される。このとき、図2により説明した、音声(オーディオ)出力を、元の視聴時の環境に復帰するために用いる情報として、音響設定条件がメモリユニット52のRAMあるいはMPU(マイクロコンピュータ)51のファームウエアから読み出され、TV装置1による番組(コンテンツ)の視聴に適した音響設定が設定される[106]。なお、番組(コンテンツ)の内容に基づいて、新たに音響設定が設定されてもよい。例えば、IP通話開始前に視聴していた番組(コンテンツ)がスポーツ中継等であり、それに適した音場設定、例えば球場(ドーム)モード/スポーツモードが設定され、IP通話終了後に視聴する番組(コンテンツ)がニュース番組等、である場合は、音場設定が、スタジオ中継/ニュースモード、等に設定されてもよい。
【0046】
以下、ミュートが解除[107]され、TV装置1が受信する番組(コンテンツ)の視聴が可能となる[11]。
【0047】
以上説明した通り、本提案により、IP通話が可能なデジタルTV装置において、番組の視聴中にIP通話の着信がある場合、TV装置による番組視聴中に音声(オーディオ)出力について設定されている、遅延部による音声への遅延(ディレイ)をキャンセルし、IP通話中の映像と音声の時間的なずれを実質的になくすことで、TV装置を用いるIP通話についても、快適な応答性能を得ることができる。
【0048】
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
【符号の説明】
【0049】
1…テレビジョン受信装置(TV装置)、3…操作入力部、21…映像(ビデオ)処理ブロック、22…映像デコーダ、23(49)…映像(ビデオ)処理部、31…音声(オーディオ)処理ブロック、32…音声デコーダ、33…音声(オーディオ)処理部、34…遅延部、35(46)…D−Aコンバータ、41…IP電話制御部、42…音声入力部、43…音声再生部、47…カメラ、48…カメラ映像処理部、51…主制御ブロック、52…メモリユニット、53…GUI制御部、54…状態制御部、55…ネットワーク制御部。

【特許請求の範囲】
【請求項1】
ネットワークを通じて音声及び映像を受信する通信処理部と、
映像信号を出力する映像処理部と、
音声信号を出力する音声処理部と、
前記音声処理部が出力する音声信号をアナログ信号に変換する変換部と、
前記映像処理部が出力する映像信号が前記通信処理部を通じて入力される映像信号である場合、前記音声処理部が前記変換部に入力する音声信号に、映像信号に対応して与える時間差の調整を行う調整部と、
を、具備する映像表示装置。
【請求項2】
前記ネットワークを通じて入力される映像は、IP(Internet Protocol)に準拠する
請求項1記載の映像表示装置。
【請求項3】
前記調整部は、前記映像信号がネットワークを通じて入力される場合、前記時間差を0とする
請求項1または2記載の映像表示装置。
【請求項4】
前記調整部は、前記音声信号がネットワークを通じて入力される場合、前記時間差を0とする
請求項1または2記載の映像表示装置。
【請求項5】
ネットワークを通じて音声及び映像を受信し、
映像信号をデコードして出力し、
デコードして出力する音声信号と映像信号との間の時間差を調整する
音声出力制御方法。
【請求項6】
前記調整は、前記映像信号がネットワークを通じて入力される場合、前記時間差を0とする
請求項5記載の音声出力制御方法。
【請求項7】
前記調整は、前記音声信号がネットワークを通じて入力される場合、前記時間差を0とする
請求項5記載の音声出力制御方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2012−80276(P2012−80276A)
【公開日】平成24年4月19日(2012.4.19)
【国際特許分類】
【出願番号】特願2010−222894(P2010−222894)
【出願日】平成22年9月30日(2010.9.30)
【出願人】(000003078)株式会社東芝 (54,554)
【Fターム(参考)】