説明

画像出力装置及び画像出力方法

【課題】複数の音声データの定位情報を明示的に知ることができ、制御したい音声データの音量を正確に制御可能とすることを目的とする。
【解決手段】画像データに付随する複数の音声データの各音量情報に基づいて、音量情報を表す音声画像をそれぞれ生成する音声画像生成手段と、画像データに付随する複数の音声データの位置情報に応じて、音声画像生成手段で生成された画像データに付随する各音声データに係る音声画像と、画像データと、を合成し、合成画像を生成する画像合成手段と、画像合成手段で生成された合成画像を出力する画像出力手段と、を有することによって課題を解決する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像出力装置及び画像出力方法に関する。
【背景技術】
【0002】
従来、画像と共に再生される音声の音量を制御する方法として、ディスプレイ上に再生表示された画像上の任意の位置に音量レベルバーを表示し、音量情報を得ながらリモコン等で操作して音量を制御する方法が知られている。図7に従来例の一例を示す。図7は、従来例の一例を示す図である。図7中、左下部に音量レベルバーが示されている。音量レベルバー上に示される三角形の矩形が現在の音量レベルを示している。また、水平方向に音量レベルが表現されており、左へ行くほど音量が小さく、右へ行くほど音量が大きいことを示している。音量制御の指示形態としては、例えば図7中に不指示のリモコンが用いられる。音量を大きくしたい場合、リモコン上に配置されたプラスボタンを押すことで音量が大きくなる。この際、図7中に示さる三角形の矩形はより右へスライドする。このことにより操作者は、三角形の矩形の位置情報から音声の調整可能領域における現在の音量情報を得ながら音量を制御することが可能となる。
【0003】
音量制御の指示形態としては、その他、ディスプレイ上に再生表示された画像上にカーソルを重ねて表示し、このカーソルをマウス等の指示具を用いて操作する方法も知られている。この場合、図中の三角形の矩形までカーソルを移動させ、三角形をドラッグ操作することにより音量制御を行う。
【0004】
また、一つの画像データに対して左右2つの音声データを持つコンテンツを再生する再生装置において、左右の音声を別々に音量制御する方法が知られている。この様子を図8に示す。図8は、従来例の他の例を示す図である。図8では、上述の図7と同様、音量レベルバーが、ディスプレイ上に再生表示された画像上に示されている。この例では音量レベルバーは、画像下部に左右2つ配置されている。操作者は左右どちらかの音量レベルバーを選択し、選択したレベルバーを上述と同様に、リモコンやマウス等の指示具により操作することで、左右別々に音量の制御を行うことが可能となる。
【0005】
【特許文献1】特開2003−330442号公報
【発明の開示】
【発明が解決しようとする課題】
【0006】
しかしながら、従来の方法では、再生したいコンテンツが複数の音声データを持ち、かつ、複数の音声データの持つ定位情報が左右以外であった場合、複数の音声データから所望の音声データを選択し、音量を制御することができない問題があった。
【0007】
本発明はこのような問題点に鑑みなされたもので、複数の音声データの定位情報を明示的に知ることができ、制御したい音声データの音量を正確に制御可能とすることを目的とする。
【課題を解決するための手段】
【0008】
そこで、本発明は、画像データに付随する複数の音声データの各音量情報に基づいて、前記音量情報を表す音声画像をそれぞれ生成する音声画像生成手段と、前記画像データに付随する複数の音声データの位置情報に応じて、前記音声画像生成手段で生成された前記画像データに付随する各音声データに係る音声画像と、前記画像データと、を合成し、合成画像を生成する画像合成手段と、前記画像合成手段で生成された合成画像を出力する画像出力手段と、を有することを特徴とする。
【0009】
係る構成とすることにより、複数の音声データの定位情報を明示的に知ることができ、制御したい音声データの音量を正確に制御可能とすることができる。
【0010】
また、本発明は、画像出力方法としてもよい。
【発明の効果】
【0011】
本発明によれば、複数の音声データの定位情報を明示的に知ることができ、制御したい音声データの音量を正確に制御可能とすることができる。
【発明を実施するための最良の形態】
【0012】
以下、本発明の実施形態について図面に基づいて説明する。
【0013】
<実施形態1>
図1は、画像出力装置の構成の一例を示す図である。
映像音声入力部130は、例えば、画像データ及び前記画像データに付随する複数の音声データを受信する。なお、必ずしも画像データに付随する音声データは複数である必要はないが、以下に示す実施形態では、複数の場合を例に説明を行う。映像音声入力部130は、画像データ及び音声データを受信すると、画像データをタイル分割部131へ、音声データを音声定位情報検出部120へそれぞれ転送する。
【0014】
タイル分割部131は、画像データを任意の単位でタイル分割し、分割したタイルを画像合成部140に転送する。
一方、音声定位情報検出部120は、受信した音声データより、音声データの数及び検出された音声データそれぞれの画像上における定位情報を検出する。検出された音声データの数、音声データ毎の定位情報及び音声データは、音声定位情報検出部120より音声制御部110に転送される。なお、本実施形態では4つの音声データが検出されたものとして説明を行う。
【0015】
音声制御部110は、受信した4つの音声データ及びその位置情報を、音量データと関連付けて保持する。また、音声制御部110は、それぞれの音声データにIDタグを付加する。音声制御部110にて保持された音声データの一例を図2に示す。図2は、音声制御部110にて保持されている音声データの一例を示す図である。図2ではIDタグとして1を付加された音声データの位置情報が、X位置x1、Y位置y1、音量が8として保持されている様子が示されている。
【0016】
画像合成部140は、構成要素としてパケット化部141を具備する。上述のタイル分割部131から受信したタイル単位に分割された画像(タイル画像)は、そのままパケット化部141に入力される。パケット化部141ではパケット生成を行う。
【0017】
パケットの構成例を図3に示す。図3は、パケットの構成の一例を示す図である。パケット化部141は、タイル画像のパケット化を行う際に、タイル画像の画像全体(1フレーム)における位置情報を計算(カウント)し、この位置情報をパケットヘッダーのX位置250、Y位置260に設定する。また、パケット化部141は、パケットヘッダー部の画像データ長領域200に画像データ長を、パケットペイロード部の画像データ領域201に画像データを設定する。更に、パケット化部141は、パケット化対象のタイル画像の位置情報と一致する音声データの定位情報の有無を、音声制御部110に問い合わせる。
【0018】
音声制御部110は、パケット化部141からタイル画像の位置情報を入手し、保持している音声データの定位情報と比較を行う。音声制御部110は、対象タイル画像の位置情報と一致する音声データの定位情報があった場合、パケット化部141に対し、前記音声データのID情報、音量情報及び音声データを転送する。パケット化部141は、これらを受信し、パケットの所定の位置に設定する。より具体的に説明すると、パケット化部141は、図3のパケットヘッダー部の音声データ有無領域210に音声データ有りの情報を、音声データ長領域220に音声データ長を、それぞれ設定する。また、パケット化部141は、パケットペイロード部の音声データ領域221の音声データを、音量データ領域240に音量データを、それぞれ設定する。
【0019】
パケット化部141は、更に音声データの位置表示ON/OFFの情報を、音声制御部110から得る。ここでは音声データの位置表示が「OFF」であったものとして説明を続ける。なお、音声データの位置表示指が「ON」であった場合については後述する。
こうしてパケット化部141によって作成されたパケットの様子は、図3における(C)の状態となる。説明で触れなかったパケットヘッダー部の音声画像データ長領域230には0(ゼロ)が設定されている。
【0020】
また、ここではパケット化対象のタイル画像に対応する音声データがあった場合について説明したが、無かった場合にはパケットの様子は、図3における(B)の状態となる。このときヘッダー領域の音声データ有無領域210は無しの情報を、音声データ長領域には0(ゼロ)が設定される。
【0021】
作成されたパケットは、パケット化部141から画像合成部140内のパケット処理部142に転送される。パケット処理部142においては、パケットに対して様々な処理が行われる。以下ではその処理の一つについて説明する。
パケット処理部142における処理の一つは、パケットヘッダーの解析である。まずパケット処理部142は、パケットヘッダー部の画像データ長領域200を解析し、画像データ長を獲得し、ペイロード部の画像データ領域201より画像データを抽出する。更にパケット処理部142は、音声画像データ長領域230を解析し、解析の結果、音声画像データ長領域230に0(ゼロ)が設定されていた場合、前記抽出した画像データのみを、画像合成部140内の映像形成部143に転送する。
【0022】
映像形成部143は、順次画像データを受信し、1フレームの映像(画像)を形成する。形成された画像は、映像形成部143から映像音声出力部160へと転送される。映像音声出力部160は、転送されてきた画像(画像データ)を、例えば図不指示のディスプレイに転送(出力)する。その結果、前記画像データがディスプレイ上で再生される。
【0023】
一方、パケット処理部142では更にパケットヘッダーを解析し、パケットヘッダー部の音声データ有無領域210の設定が「有り」であった場合には、パケットから音声データを抽出する。より具体的に説明すると、パケット処理部142は、パケットヘッダー部の音声データ長領域220より音声データの長さを獲得し、次いでペイロード部の音声データ領域221より前記獲得した長さの音声データを抽出する。更にパケット処理部142は、パケットペイロード部の音量データ領域240から音量データを抽出する。抽出された音声データ及び音量データは、音声合成部150へ転送される。
【0024】
音声合成部150は、音声データ及び音量データを順次、受信し、1フレーム分を合成し、映像音声出力部160へ転送する。映像音声出力部160は、転送されてきた音声データを、例えば図不指示のディスプレイに転送(出力)する。その結果、前記音声データがディスプレイ付属のオーディオ装置により再生される。
【0025】
制御信号入力部100は、例えば図不指示のリモコンより、画像データ及び音声データに対する様々な制御信号を受信する。本実施形態では、音声データに対する制御信号を受信した場合について説明する。
制御信号入力部100は受信した制御信号を、制御信号解析部101に転送する。制御信号解析部101は、受信した制御信号を解析する。なお、制御信号解析部101において解析される情報は、例えば次に挙げる情報である。
(あ)音声データ位置の表示のON/OFF。
(い)音声データ指定情報。
(う)音量制御情報。
【0026】
制御信号解析部101が解析した情報が、(あ)音声データ位置の表示「ON」情報であった場合、この情報は制御信号解析部101より音声制御部110に転送される。音声制御部110は、保持している音声データのID及び前記IDに対応した音量情報を音声画像生成部111に転送すると共に、音声画像生成部111に対して音声画像を生成するよう指示を与える。
【0027】
音声画像生成部111は、上述の音声画像生成指示を受け、同時に受信した音量情報を反映させた音声画像(音声画像データ)を生成する。音声画像は、例えば図4に示す400である。ここで、図4は、音声画像データと、画像データと、が合成された合成画像(合成画像データ)の一例を示す図である。図4の例では音声画像は、黒塗りの四角形に、音量8が白抜きで示されている。音声画像生成部111は、このような画像を生成し、上述の音声データIDに対応付けて音声画像データ400を保持する。
【0028】
次に、音声データの位置表示情報が「ON」である場合のパケット化部141の処理を説明する。
パケット化部141が音声制御部110に問い合わせを行った際に、現在のパケット化対象のタイル画像の位置情報と一致する音声データの定位情報があった場合、パケット化部141は音声制御部110より音声データのID情報を入手する。パケット化部141は、この音声データのID情報と一致する音声画像データを、音声画像生成部111から受信する。パケット化部141は、受信した音声画像データを、図3に示すパケットの所定の位置に設定する。即ち、パケット化部141は、パケットヘッダー部の音声画像データ長領域230に音声画像データの長さを、パケットペイロード部の音声画像データ領域231に音声画像データを、それぞれ設定する。こうしてパケット化部141によって作成されたパケットの様子は、図3における(A)の状態となる。
【0029】
引き続き音声画像データ情報を持ったパケットを、パケット処理部142において受信した場合について説明する。
パケット処理部142は、パケットヘッダーの解析を行った結果、音声画像データ長領域230に0(ゼロ)以外の値が設定されていた場合、音声画像データの長さを取得し、パケットペイロード部の音声画像データ領域231より音声画像データを抽出する。この場合、パケット処理部142は、映像形成部143へは前記抽出した画像データに代わり、前記音声画像データを転送する。
【0030】
映像形成部143は既に説明した手順により、音声画像データを含む1フレームの映像を形成する。形成された画像の一例が上述した図4である。図4においては音声定位情報検出部120において検出された4つの音声データの定位情報が、画像として所定の位置に表示されている。例えば、図3におけるIDが1の音声データは、ディスプレイ450上に再生された画像460上の、X位置x1、Y位置y1に示されている。
こうして得られた画像により、操作者は変更したい音声データの位置を、再生された画像に関連付けて知ることができる。
【0031】
次に、図4における音声画像データ420にて示された音声データの音量を制御する方法について説明する。
例えば操作者は図不指示のリモコン上に配置された先送りボタン、若しくは後戻りボタンを操作することにより、表示された音声画像の選択を行う。例えば音量制御対象として選択されない音声画像が黒塗りの四角形にその音量が白文字で示されるのに対して、選択された音声画像は白抜きの四角形にその音量が黒文字で示されるものとする。図4における音声画像データ420が選択された場合の様子を図5に示す。図5は、音声画像データが選択された一例を示す図である。図5の様に音声画像データ421のみが白抜きの四角形に、音量2が黒文字で示されている。
【0032】
次に図4の状態から図5の状態を実現するまでの処理の一例を説明する。
操作者によって指示された音声データ選択情報は、制御信号入力部100にて受信される。この信号は制御信号解析部101にて解析され、上述の(い)音声データ指定情報として認識される。この情報は音声制御部110に転送され、保持している音声データの選択情報に反映される。この様子を図2の(B)に示す。図2(A)では全ての音声の選択情報が0(ゼロ)、即ち選択されていないことが示されている。これに対し、図2(B)では音声データIDが3のもののみ、選択情報が1となっている。音声制御部110では、例えば音声データ指定情報を受信する度に、上述の選択情報の「1」の位置を順次シフトすることにより、唯一の音声データが選択された状態を実現する。
【0033】
音声制御部110は、上述の様に音声画像生成部111に対して音声画像を生成する指示を与えるが、この際に、音声データ選択信号も同時に転送する。
音声画像生成部111は、受信した音声データに付随する選択信号を参照し、選択信号「1」が設定された音声データに対しては音声画像生成のアルゴリズムを変更する。ここでは選択されていない音声データの画像が黒塗りの四角形の中に対応する音量データが白文字で書くものとし、選択された音声データの画像は白抜きの四角形の中に対応する音量データを黒文字で書くものとする。
【0034】
更に制御信号入力部100に音量制御信号が入力された場合について説明する。
音量制御信号は、制御信号入力部100にて受信され、制御信号解析部101にて解析される。解析絵結果は上述の(う)音量制御情報として認識される。この情報は音声制御部110に転送され、保持している音声データの音量データに反映される。本実施形態では音声データとして保持されている選択情報が「1」である、即ち選択されている音声データの音量データのみ前記制御情報が反映されるものとする。この様子が図2(B)に示されている。
【0035】
音声制御部110に保持された音声データの音量データが、音声画像生成部111にて生成される音声画像データに反映される方法は上述のとおりである。
また、このようにして再生成された音声画像生成部111にて保持されている音声画像が、映像音声出力部160を通じてディスプレイに画像表示されるまでの方法も上述のとおりである。
以上説明した処理により、図4に示された画像情報が、操作者による指示により図5に示された画像に変更される。
【0036】
本実施形態においては音声画像データが、画像データに置き換わり表示される方法について述べたが、αブレンド等の処理により、音声画像データと、画像データと、を重ね合わせて表示してもよい。
また、本実施形態では音声画像が四角形と数字をもって表示する場合について述べたが、図6の様に音量を数字ではなくスライドバーをもって表示してもよい。図6は、音声画像データと、画像データと、が合成された合成画像(合成画像データ)の他の例を示す図である。また、音声画像も四角形に限るものではない。
また、本実施形態ではリモコンにより音声データを制御する方法について述べたが、図6の様にディスプレイ650上にカーソル640を示し、マウス等の指示具を用いて音声データを制御してもよい。
【0037】
<その他の実施形態>
また、本発明の目的は、以下のようにすることによって達成される。即ち、上述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体(又は記録媒体)を、システム或いは装置に供給する。そして、そのシステム或いは装置の中央演算処理手段(CPUやMPU)が記憶媒体に格納されたプログラムコードを読み出し実行する。この場合、記憶媒体から読み出されたプログラムコード自体が上述した実施形態の機能を実現することになり、そのプログラムコードを記録した記憶媒体は本発明を構成することになる。
【0038】
また、システム或いは装置の前記中央演算処理手段が読み出したプログラムコードを実行することにより、そのプログラムコードの指示に基づき、システム或いは装置上で稼働しているオペレーティングシステム(OS)等が実際の処理の一部又は全部を行う。その処理によって上述した実施形態の機能が実現される場合も含まれる。
【0039】
更に、記憶媒体から読み出されたプログラムコードが、前記システム或いは装置に挿入された機能拡張カードや、接続された機能拡張ユニットに備わるメモリに書込まれたとする。その後、そのプログラムコードの指示に基づき、その機能拡張カードや機能拡張ユニットに備わるCPU等が実際の処理の一部又は全部を行い、その処理によって上述した実施形態の機能が実現される場合も含まれる。
【0040】
本発明を前記記憶媒体に適用する場合、その記憶媒体には、先に説明したフローチャートに対応するプログラムコードが格納されることになる。
【0041】
以上、上述した各実施形態によれば、複数の音声データの定位情報を明示的に知ることができ、制御したい音声データの音量を正確に制御可能とすることができる。
【0042】
以上、本発明の好ましい実施形態について詳述したが、本発明は係る特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。
【図面の簡単な説明】
【0043】
【図1】画像出力装置の構成の一例を示す図である。
【図2】音声制御部110にて保持されている音声データの一例を示す図である。
【図3】パケットの構成の一例を示す図である。
【図4】音声画像データと、画像データと、が合成された合成画像(合成画像データ)の一例を示す図である。
【図5】音声画像データが選択された一例を示す図である。
【図6】音声画像データと、画像データと、が合成された合成画像(合成画像データ)の他の例を示す図である。
【図7】従来例の一例を示す図である。
【図8】従来例の他の例を示す図である。
【符号の説明】
【0044】
100 制御信号入力部
101 制御信号解析部
110 音声制御部
111 音声画像生成部
120 音声定位情報検出部
130 映像音声入力部
131 タイル分割部
140 画像合成部
141 パケット化部
142 パケット処理部
143 映像形成部
150 音声合成部
160 映像音声出力部

【特許請求の範囲】
【請求項1】
画像データに付随する複数の音声データの各音量情報に基づいて、前記音量情報を表す音声画像をそれぞれ生成する音声画像生成手段と、
前記画像データに付随する複数の音声データの位置情報に応じて、前記音声画像生成手段で生成された前記画像データに付随する各音声データに係る音声画像と、前記画像データと、を合成し、合成画像を生成する画像合成手段と、
前記画像合成手段で生成された合成画像を出力する画像出力手段と、
を有することを特徴とする画像出力装置。
【請求項2】
前記画像データをタイルに分割するタイル分割手段を更に有し、
前記画像合成手段は、前記タイル分割手段で分割された前記画像データに係るタイルからパケットを生成し、前記位置情報に応じて、前記パケットに前記音声画像生成手段で生成された各音声データに係る音声画像を設定し、前記合成画像を生成することを特徴とする請求項1に記載の画像出力装置。
【請求項3】
画像出力装置における画像出力方法であって、
画像データに付随する複数の音声データの各音量情報に基づいて、前記音量情報を表す音声画像をそれぞれ生成する音声画像生成ステップと、
前記画像データに付随する複数の音声データの位置情報に応じて、前記音声画像生成ステップで生成された前記画像データに付随する各音声データに係る音声画像と、前記画像データと、を合成し、合成画像を生成する画像合成ステップと、
前記画像合成ステップで生成された合成画像を出力する画像出力ステップと、
を有することを特徴とする画像出力方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate


【公開番号】特開2009−206986(P2009−206986A)
【公開日】平成21年9月10日(2009.9.10)
【国際特許分類】
【出願番号】特願2008−48536(P2008−48536)
【出願日】平成20年2月28日(2008.2.28)
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】