映像再生装置及びその制御方法、プログラム並びに記憶媒体
【課題】視点を切り替えた映像に複数の音声が存在する場合に、映像の視点を変更した結果に応じて、適した音声に容易に切り替える技術を実現する。
【解決手段】ネットワークを介して受信した映像データおよび音声データを再生する映像再生装置であって、複数の異なる視点位置から少なくとも1つの撮影エリアを撮影した任意視点映像データと、当該撮影エリアごとに割り当てられた音声データとを取得する任意視点映像取得手段と、ユーザによる前記撮影エリアの視点位置の変更指示を受け付ける操作手段と、前記操作手段により変更された視点位置から撮影された任意視点映像内に存在する撮影エリアの数を算出する算出手段と、前記算出手段による算出の結果、任意視点映像内に存在する複数の撮影エリアごとに割り当てられた音声データが複数存在する場合に、任意視点映像ごとに決定される優先順位に応じた音声データを選択する音声切替手段と、を有する。
【解決手段】ネットワークを介して受信した映像データおよび音声データを再生する映像再生装置であって、複数の異なる視点位置から少なくとも1つの撮影エリアを撮影した任意視点映像データと、当該撮影エリアごとに割り当てられた音声データとを取得する任意視点映像取得手段と、ユーザによる前記撮影エリアの視点位置の変更指示を受け付ける操作手段と、前記操作手段により変更された視点位置から撮影された任意視点映像内に存在する撮影エリアの数を算出する算出手段と、前記算出手段による算出の結果、任意視点映像内に存在する複数の撮影エリアごとに割り当てられた音声データが複数存在する場合に、任意視点映像ごとに決定される優先順位に応じた音声データを選択する音声切替手段と、を有する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、デジタル放送波などを受信再生する技術に関する。
【背景技術】
【0002】
現在、複数のカメラで異なる視点位置から被写体を撮影した多数の映像(以下、多視点映像)を用いて任意の視点位置の映像を補間・再構成することで、本来撮影されていない視点での映像を生成する任意視点映像生成技術の研究が行われている。
【0003】
また、その任意視点映像を実際に標準映像の放送番組などと連携してサービスすることも検討されており、特許文献1には標準映像の放送番組と任意視点映像とを切り替える技術が開示されている。特許文献1は、標準映像のカメラの位置などをメタデータとして送出することにより、ユーザが標準映像から任意視点映像に切り替えた際に、任意視点情報を生成し、その情報から任意視点映像を得るものである。
【0004】
また、特許文献2には複数のカメラと複数のマイクによって被写体を複数の方向から記録した多視点映像及び多聴点音声から、ユーザが所望の映像と音声を選択して視聴できるようにした技術が開示されている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2007−150747号公報
【特許文献2】特開2005−159592号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
上述した従来技術を用いることにより、ユーザが視点位置を自由に変更して、特定の競技や被写体の映像や音声を好きな画角から視聴することが可能になる。例えば、スポーツ中継を例に取ると、自分の好きな選手や競技を常に追跡して見ることができる。また、オリンピックのような1つの競技場で複数の競技が同時に進行するような場合でも、好きなタイミングで自由に競技エリアを切り替えて視聴することができる。
【0007】
しかし、ユーザが任意に指定した場所や方向での任意視点映像を視聴する場合、映像の視点の切り替えに応じて音声を切り替える際に、複数の音声データが存在すると、どの音声を選択したらよいかわからないという問題がある。
【0008】
本発明は、上記課題に鑑みてなされ、その目的は、視点を切り替えた映像に複数の音声が存在する場合に、映像の視点を変更した結果に応じて、適した音声に容易に切り替えることが可能な音声切替技術を実現することである。
【課題を解決するための手段】
【0009】
上記課題を解決し、目的を達成するために、本発明の映像再生装置は、ネットワークを介して受信した映像データおよび音声データを再生する映像再生装置であって、複数の異なる視点位置から少なくとも1つの撮影エリアを撮影した任意視点映像データと、当該撮影エリアごとに割り当てられた音声データとを取得する任意視点映像取得手段と、ユーザによる前記撮影エリアの視点位置の変更指示を受け付ける操作手段と、前記操作手段により変更された視点位置から撮影された任意視点映像内に存在する撮影エリアの数を算出する算出手段と、前記算出手段による算出の結果、任意視点映像内に存在する複数の撮影エリアごとに割り当てられた音声データが複数存在する場合に、任意視点映像ごとに決定される優先順位に応じた音声データを選択する音声切替手段と、を有する。
【発明の効果】
【0010】
本発明によれば、視聴している任意視点映像の内容に応じて音声の切替方法が変わるため、ユーザは容易に音声を切り替えることができる。また、視聴している映像とは無関係の音声に切り替ってしまうことを防ぐことができる。
【図面の簡単な説明】
【0011】
【図1】本発明に係る実施形態1のデジタル放送受信装置の構成を例示する図。
【図2】実施形態1におけるエリア情報の具体例を示す図。
【図3】実施形態1の音声切替処理を含む任意視点映像表示処理を示すフローチャート。
【図4】実施形態1の音声切替リスト作成処理を示すフローチャート。
【図5】実施形態1の画角領域の座標算出処理を説明する図。
【図6】実施形態1の音声切替処理の具体例として、ユーザが視聴している任意視点映像内に競技エリアが1つであった場合の音声が切り替わる様子を示す図。
【図7】実施形態1の音声切替処理の具体例として、ユーザが視聴している任意視点映像内に競技エリアが複数存在した場合の音声が切り替わる様子を示す図。
【図8】本発明に係る実施形態2のデジタル放送受信装置の構成を例示する図。
【図9】実施形態2の音声切替処理を含む任意視点映像表示処理を示すフローチャート。
【図10】実施形態2の音声切替処理を示すフローチャート。
【図11】本発明に係る実施形態3のデジタル放送受信装置の構成を例示する図。
【図12】実施形態3の音声切替処理を示すフローチャート。
【発明を実施するための形態】
【0012】
以下に、本発明を実施するための最良の形態について詳細に説明する。尚、以下に説明する実施の形態は、本発明を実現するための一例であり、本発明が適用される装置の構成や各種条件によって適宜修正又は変更されるべきものであり、本発明は以下の実施の形態に限定されるものではない。また、後述する各実施形態の一部を適宜組み合わせて構成しても良い。
【0013】
[実施形態1]以下に、本発明の映像再生装置を実現する実施形態1のデジタル放送受信装置について説明する。
【0014】
実施形態1では、標準映像の放送番組をデジタル放送波で受信すると共に、複数のカメラで被写体を異なる方向から撮影した任意視点映像データを受信する構成について説明する。なお、任意視点映像データの取得方法や取得経路は、本実施形態で説明する手法に限定されるものではなく、同様の情報が取得できれば他の方法や経路であってもよい。
【0015】
<デジタル放送受信装置の構成>図1を参照して、実施形態1のデジタル放送受信装置の構成について説明する。
【0016】
図1において、デジタル放送受信装置100は、放送局から放送された標準映像を受信し、表示するブロックと、任意視点映像データを受信し、任意視点映像を生成して表示するブロックと、視点の変更に沿って音声を切り替えるブロック、とを備える。
【0017】
ここで、標準映像を受信し表示するブロックについて説明する。
【0018】
デジタル放送受信装置100はデジタル放送局から放送された放送番組をチューナ部101で受信する。
【0019】
リモコン116とリモコンコード受信・解釈部115は、ユーザからの入力操作を解釈し、チャンネル選局指示の場合はチューナ部101に選局指示を送出する。
【0020】
チューナ部101は、設定された周波数情報に応じて、周波数のチューニングを行い、デジタル放送信号を受信し、その信号を復調部102に出力する。
【0021】
復調部102は入力されたデジタル放送信号に対し、復調、誤り訂正等の処理を行い、トランスポートストリーム(TS)を形成する。そして、そのTSはTS処理部103に入力される。
【0022】
TS処理部103は入力されたTSから、映像、音声、番組情報等を分離させる。分離された映像データの内、標準映像に関しては、標準映像処理部106へ出力して映像復号化処理を行い、映像出力部107に送出される。また、音声データは音声処理部104へ出力し復号化処理を行って音声出力部105に送出される。
【0023】
映像出力部107は、復号された映像データを表示部(不図示)に適した表示解像度、表示色数、リフレッシュレート、表示タイミングに変換して、不図示の表示部(モニタ等)へ出力する。
【0024】
音声出力部105は、音声データの出力レベル(音量)等を変更する機能を有し、スピーカ等へ音声データを出力する。
【0025】
次に、任意視点映像データを受信し、任意視点映像を生成して表示するブロックについて説明する。
【0026】
TS処理部103は、リモコン116及びリモコンコード受信・解釈部115からユーザの任意視点映像表示の指示を受け取ると、分離された映像データから、任意視点映像データを任意視点映像生成部108に送出する。
【0027】
任意視点映像生成部108は、視点制御部110から視点の位置や視野角といった視点情報を取得し、その視点情報と任意視点映像データから任意視点映像を生成する。そして、その映像を映像出力部107に送出する。
【0028】
視点制御部110は、リモコン116及びリモコンコード受信・解釈部115から標準映像から任意視点への変更指示や任意視点位置の変更指示を受け取ると、エリア情報取得部109から取得した座標空間を用いて変更先の視点情報を算出して任意視点映像生成部108に送出する。
【0029】
映像出力部107は、任意視点映像生成部108から送出された任意視点映像を不図示の表示部に表示するように出力する。
【0030】
次に、視点の変更に沿って音声を切り替えるブロックについて説明する。
【0031】
TS処理部103は、リモコン116及びリモコンコード受信・解釈部115からユーザの任意視点映像表示の指示を受け取ると、番組情報をエリア情報取得部109に送出する。
【0032】
視点制御部110は、リモコン116及びリモコンコード受信・解釈部115を通じて、任意視点映像の視点の位置を決定する指示を受け取ると、視点情報をエリア数算出部111へ送出する。
【0033】
エリア情報取得部109は、取得した番組情報から任意視点映像に映し出される範囲内におけるエリア情報を取得する。本実施形態では、エリア情報として、図2に示すような座標情報を取得するものとして説明する。図2は、競技場を真上から見た図(Z軸方向からXY平面を見た図)であり、原点(X座標、Y座標、Z座標=0、0、0)を中心に座標空間を示している。また、この例では3つの競技エリア(撮影エリア)の座標、及び各エリアの競技種目名と対応した音声ストリームを示す情報も含まれている。
【0034】
エリア数算出部111は、視点制御部110から視点情報を、エリア情報取得部109からエリア情報を受け取り、ユーザが視聴している任意視点映像内に映っている競技エリアの数を算出する。
【0035】
音声切替制御部112は、エリア数算出部111から受け取った競技エリアの数に応じて音声の切り替えを行う。競技エリアの数が1つの場合は、エリア情報取得部109からエリア情報を受け取り、そのエリアに対応する音声ストリームを受信するようにチューナ部101に指示する。一方、エリア数が複数の場合は、音声切替リスト作成部113へ音声切替リストの作成要求を送出する。そして、音声切替リスト表示制御部114は音声切替リスト作成部113が作成したリストをユーザが選択可能に表示画面に表示するように制御する。音声切替制御部112は、表示されたリストを用いてユーザによって選択された音声ストリームの情報をリモコンコード受信部から受け取り、チューナ部101にその音声ストリームを受信するように指示する。
【0036】
音声切替リスト作成部113は、エリア情報取得部109からエリア情報を受け取り、エリア数算出部111から視聴中の競技エリアの数とその競技種目名を取得し、競技エリアに対応する音声ストリームのリストを作成する。そして、音声切替リスト表示制御部114にリストの表示要求を送出する。加えて、ユーザからリストの並び方の優先順位設定をリモコン116及びリモコンコード受信・解釈部115を通じて受け付け、設定に応じたリストの並び替えを行う。
【0037】
<任意視点映像表示処理>次に、図3及び図4を参照して、実施形態1の任意視点映像表示処理及び音声切替処理について説明する。
【0038】
図3において、デジタル放送受信装置100は、まず、デジタル放送局から放送された標準映像と標準音声を不図示の表示部とスピーカ等に出力する(S101、S102)。
【0039】
次に、リモコン116及びリモコンコード受信・解釈部115を通じて、ユーザから任意視点映像への変更指示があるかどうか判定する(S103)。
【0040】
変更指示がある場合は、番組情報から任意視点映像のエリア情報を取得する(S104)。
【0041】
次に、任意視点映像データと任意視点の視点情報から任意視点映像を生成する(S105)。なお、本実施形態では、任意視点映像データは、図2の座標に基づき任意視点映像を生成するためのデータである。また、任意視点の視点情報も、図2の座標空間上で計算される。
【0042】
続いて、生成された任意視点映像を表示する(S106)。なお、ステップS105、S106では、デジタル放送受信装置で任意視点映像を生成しているが、他のサーバ等がユーザ等による視点情報を取得して生成した任意視点映像を、デジタル放送受信装置で受信し表示してもよい。すなわち、任意視点映像生成部108を外部に持っていてもよい。
【0043】
次に、ユーザによって任意視点の視点位置が決定されたか判定する(S107)。
【0044】
決定された場合、ユーザが観ている任意視点映像内の競技エリアの数を算出する(S108)。競技エリアの数は、視点の位置や視野角といった視点情報から算出される。詳細は後述する。
【0045】
次に、上記算出の結果、競技エリア数が1つまたは複数(エリア数>1)か判定する(S109)。
【0046】
上記判定の結果、競技エリア数が1つの場合は、そのエリアに対応した音声ストリームを示す情報を取得し(S110)、その音声に切り替えて出力する(S111)。
【0047】
一方、競技エリア数が複数存在する場合、音声切替リストを作成する(S112)。詳細については、図4で説明する。
【0048】
次に、音声切替リストを表示し(S113)、ユーザが音声を切り替えるか決定する(S114)。
【0049】
切り替える場合は音声切替リストの中から、ユーザに選択された音声に切り替えて、出力する(S115)。
【0050】
次に、ユーザによって任意視点映像を終了する操作が行われたか判定する(S116)。終了する場合はS101へ移行し、終了しない場合は、ユーザによって任意視点の視点位置が変更されたか判定する(S117)。
【0051】
視点が変更されていない場合は、S112に移行し、変更された場合は、S105へ移行する。
【0052】
続いて、図4を参照して、音声切替リスト作成部113で実行される音声切替リストの作成処理について説明する。
【0053】
図4において、音声切替リスト作成部113は、まず、視聴している任意視点映像内の競技エリアの数とその競技名を取得する(S201)。
【0054】
次に、ユーザによって設定された音声切替リストの並び方の優先順位によって、リストの作成方法を変更する(S202)。
【0055】
優先順位の設定が、現在の視点位置からの距離が短い競技エリアを優先してリストに並べる場合、視点位置と取得された競技名の各競技エリアまでの距離を算出する(S203)。
【0056】
そして、距離の短い順番に各競技エリアに対応する音声ストリーム名を並べた音声切替リストを作成する(S204)。
【0057】
一方、優先順位の設定が任意視点映像内に映っているエリア面積の割合が高い競技エリアを優先してリストに並べる場合、取得された競技名について競技エリア毎の全体の領域面積をそれぞれ算出する(S205)。
【0058】
また、視聴している任意視点映像内に映っている面積をエリアごとに算出し(S206)、その面積を競技エリア毎に算出された全体の領域面積でそれぞれ除算することによって割合を算出する(S207)。
【0059】
そして、割合が高い順番に各競技エリアに対応する音声ストリーム名を並べた音声切替リストを作成する(S208)。
【0060】
次に、エリア数算出部111で算出される競技エリアの数の算出方法について説明する。
【0061】
エリア数算出部111は、エリア情報取得部109から座標情報を取得する。その座標情報は、3次元座標空間(X軸、Y軸、Z軸)から構成される。また、視点制御部110からこの座標空間上で計算された視点の位置や視野角といった視点情報を取得する。そして、これらの情報から、ユーザが観ている任意視点映像の画角領域の座標を算出することができる。よって、その座標と競技エリアの座標とから、画角領域内に含まれる競技エリアを判別できるので、任意視点映像内に映っている競技エリアの数を求めることができる。
【0062】
図5を参照して、画角領域の座標を求める方法について説明する。図5(A)は、X軸とZ軸の座標空間における任意視点の位置と視野角とを例示している。X1とZ1はそれぞれX軸とZ軸における視点の位置を示す。また、θXは、XZ平面におけるZ軸から視野までの角度であり、φXは視野角を示す。XαとXβは、任意視点の画角領域のX座標である。それぞれ以下の式1,2によって座標を算出することができる。
Xα=X1+Z1×tanθX…(1)
Xβ=X1+Z1×tan(θX+φX)…(2)
同様に、図5(B)においても、Y軸とZ軸の座標空間において、画角領域のY座標であるYαとYβを以下の式3,4で算出することができる。
Yα=Y1+Z1×tanθY…(3)
Yβ=Y1+Z1×tan(θY+φY)…(4)
以上のように算出されたXα、Xβ、Yα、Yβの各座標値から、図5(C)に示すようにそれぞれの座標の交わる部分で囲まれる領域が、ユーザが視聴している任意視点映像の画角領域になる。
【0063】
図6及び図7は、実施形態1の音声切替処理の具体例として、ユーザが視聴している任意視点映像内に競技エリアが1つ又は複数存在した場合の音声が切り替わる様子を示している。図示のように、音声切替リストは、標準映像・任意視点映像と共に(重畳して)表示される。
【0064】
図6では、競技エリアが1つであるため、ユーザが中距離走を視聴していると判断できる。よって、自動で中距離走の音声ストリームに切り替わり、出力される。
【0065】
一方、図7では、任意視点映像内に競技エリアが3つ存在するので、音声切替リストを表示することで、ユーザに音声ストリームを選択させる。そして、選択された競技の音声に切り替わり、出力される。
【0066】
図7(A)は、音声切替リスト中の各競技名を任意視点の視点位置からの距離が近い順番に並べた例である。また、図7(B)は、競技エリアごとに算出された任意視点映像に映っているエリア面積の割合の高い順番に並べた例である。
【0067】
以上説明した一連の処理によって、エリアごとに音声ストリームが割り当てられている場合に、ユーザの視点位置の変更に応じて適切な音声に容易に切り替えることができる。
【0068】
なお、本発明は、実施形態1として説明したエリア情報の内容や取得方法、座標の計算方法に限定されるものではなく、また、音声切替リストの並び方の優先順位も視点からの距離やエリア面積に限定されるものではない。
【0069】
また、上述した実施形態では、一定の広さを持つ競技エリアと音声とが対応づけられた構成となっているが、競技エリアに代えて音声を収録した地点(撮影ポイント)等にしてもよい。この場合、図3のS112(図4の音声切替リストの作成処理)において、「エリア面積優先」のリストは作成されない。
【0070】
また、図3のS109において、視聴する映像の画角内に複数の競技エリア(音声収録地点)が存在する場合に、必ずしも音声切替リストを表示しなくてもよい。すなわち、リストを作成した際に最も優先順位が高いもの(距離優先だったら視点から近い音声、面積優先だったらエリアの広い音声)に自動的に切り替える構成としてもよい。
【0071】
[実施形態2]次に、実施形態2について説明する。なお、以下では、実施形態1と重複する説明は省略する。
【0072】
実施形態1では、任意視点の視点位置が決定してから音声を切り替えていたが、実施形態2では、視点を移動させている途中に音声を切り替えている。すなわち、実施形態2では、ユーザが任意視点の視点位置を移動させた場合に、一定の距離を移動するごとに任意視点映像内に映っている競技エリアの数を算出し、その競技エリア数に応じて音声を切り替える。
【0073】
<装置構成>図8を参照して、実施形態2のデジタル放送受信装置の構成について説明する。
【0074】
図8において、視点制御部210は、リモコン216及びリモコンコード受信・解釈部215を通じて、任意視点の位置の変更指示を受け取ると、エリア情報取得部209から取得した座標空間から変更先の視点情報を算出する。そして、その情報を任意視点映像生成部208に送出すると共に、視点移動距離算出部217へ変更前の視点情報と変更後の視点情報を送出する。また、視点移動距離算出部217から、視点の移動距離が所定の閾値を超えたことを通知された場合、音声を切り替るために視点情報をエリア数算出部111へ送出する。
【0075】
視点移動距離算出部217は、視点制御部210から送出された視点の変更前と変更後の視点情報を用いて、視点の位置座標から移動距離を算出し、更にその移動距離を累積する。そして、移動距離の累積値が所定の閾値を超えた場合、視点制御部210に通知する。
【0076】
<任意視点映像表示処理>次に、図9及び図10を参照して、実施形態2の任意視点映像表示処理及び音声切替処理について説明する。なお、図9のS301〜S306、S314は、図1のS101〜S106、S116と同様であるため、説明を省略する。
【0077】
図9において、S306で任意視点映像が表示された後、任意視点の視点位置がユーザによって移動されたか判定し(S307)、移動された場合は視点の移動距離を算出する(S308)。
【0078】
そして、移動距離が所定の閾値を超えた場合、音声切替処理を行う(S310)。一方、移動距離が所定の閾値を超えていない場合は、移動距離を累積する(S311)。
【0079】
次に、任意視点の移動が終了し、ユーザから視点位置を決定する指示を受け取った場合(S312)、S310と同様に音声の切替処理を行う(S313)。
【0080】
次に、図9のS310、S313の音声切替処理について説明する。なお、図10のS409以外の処理は、図3のS108〜S115と同様であるため、説明を省略する。
【0081】
図10において、S409では、音声を切り替えた後なので、S308で算出された視点の移動距離を”0”にリセットする。
【0082】
以上のような一連の処理によって、ユーザが任意視点の視点位置を移動している途中であっても、容易に音声を切り替えることができる。
【0083】
[実施形態3]次に、実施形態3について説明する。
【0084】
実施形態3は、デジタル放送波で複数の視点位置で撮影された多視点映像を受信して表示し、多視点映像に対応する音声ストリームの数に応じて音声を切り替えるものである。
【0085】
<装置構成>図11を参照して、実施形態3のデジタル放送受信装置の構成について説明する。
【0086】
図11において、デジタル放送受信装置300は、放送局から放送された標準映像と多視点映像を受信し、表示するブロックと、表示する多視点映像の変更に応じて音声を切り替えるブロック、とを備える。
【0087】
ここで、標準映像と多視点映像を受信し、表示するブロックについて説明する。
【0088】
デジタル放送受信装置300は、デジタル放送局から放送された放送番組をチューナ部301で受信する。
【0089】
リモコン313とリモコンコード受信・解釈部312は、ユーザからの入力操作を解釈し、チャンネル選局指示の場合はチューナ部301に選局指示を送出する。また、標準映像と多視点映像の切替指示も送出する。
【0090】
チューナ部301は、設定された周波数情報に応じて、周波数のチューニングを行い、デジタル放送信号を受信して、その信号を復調部302に出力する。
【0091】
復調部302は入力されたデジタル放送信号に対し、復調、誤り訂正等の処理を行い、トランスポートストリーム(TS)を形成し、TS処理部303に送出する。
【0092】
TS処理部303は入力したTSから、標準映像、多視点映像、音声、番組情報等を分離させる。
【0093】
分離された映像データのうち、標準映像と多視点映像に関しては、映像処理部305へ出力して映像復号化処理を行い、映像出力部307に送出される。また、音声データは音声処理部304へ出力し復号化処理を行って音声出力部306に送出される。
【0094】
映像出力部307は、復号された映像データを表示解像度、表示色数、リフレッシュレートに適した表示データ、タイミングに変換して、映像表示を行う。
【0095】
音声出力部306は、音声データの出力レベル(音量)等を変更する機能を有する。
【0096】
次に、表示する多視点映像の変更に応じて音声を切り替えるブロックについて説明する。
【0097】
リモコン313とリモコンコード受信・解釈部312は、複数の多視点映像から1つを選局するようにチューナ部301に指示を送出する。また、音声切替制御部309に音声の切替指示を送出する。
【0098】
音声情報取得部308は、番組情報から選局されている多視点映像に対応する音声情報を取得し、音声ストリームの数を抽出する。
【0099】
音声切替制御部309は、音声情報取得部308によって取得された音声ストリームの数に応じて音声の切り替えを行う。音声ストリームの数が1つの場合は、その音声ストリームを受信するようにチューナ部301に指示する。一方、音声ストリームの数が複数の場合は、音声切替リスト作成部310へ音声切替リストの作成要求を送出する。そして、音声切替リスト表示制御部311よりユーザによって選択された音声ストリームの情報を受け取り、チューナ部301にその音声ストリームを受信するように指示する。
【0100】
音声切替リスト作成部310は、音声情報取得部308から音声ストリームの数とその音声名を取得し、音声ストリームのリストを作成する。そして、音声切替リスト表示制御部311にリストの表示要求を送出する。
【0101】
音声切替リスト表示制御部311は、音声切替リスト作成部310によって生成された音声切替リストを表示画面に表示するように制御し、ユーザからの音声選択指示を待つ。リモコン313及びリモコンコード受信・解釈部312から、ユーザの音声選択指示を受け取ると、選択された音声ストリームの情報を音声切替制御部309に送出する。
【0102】
<多視点映像表示処理>次に、図12を参照して、実施形態3の多視点映像表示処理及び音声切替処理について説明する。
【0103】
図12において、デジタル放送受信装置300は、まず、デジタル放送局から放送された標準映像と標準音声を出力する(S501、S502)。
【0104】
次に、ユーザから多視点映像への変更指示があるか否かを判定する(S503)。
【0105】
変更指示がある場合は、多視点映像の1つの映像を選局する(S504)。
【0106】
続いて、選局された多視点映像を表示する(S505)。
【0107】
次に、選局された多視点映像に対応する音声ストリームの数を抽出する(S506)。
【0108】
次に抽出された音声ストリームの数が1つか、または複数(音声ストリーム数>1?)かを判定する(S507)。
【0109】
音声ストリームの数が1つの場合は、その音声に切り替え、出力する(S508)。
【0110】
一方、抽出された音声ストリームの数が複数の場合、音声切替リストを作成する(S509)。
【0111】
次に、音声切替リストを表示し(S510)、ユーザが音声を切り替えるか決定する(S511)。
【0112】
切り替える場合は音声切替リストの中から、ユーザに選択された音声に切り替えて、出力する(S512)。
【0113】
次に、ユーザによって標準映像に戻る操作が行われたか否かを判定し(S513)、戻る場合はS501へ移行する。
【0114】
戻らない場合は、ユーザによって多視点映像が変更されたか否かを判定する(S514)。変更されていない場合は、S513に移行する。多視点映像が変更された場合は、S505へ移行する。
【0115】
以上のような一連の処理によって、多視点映像の選局操作に応じて適切な音声に容易に切り替えることができる。
【0116】
なお、上述した各実施形態では、本発明をデジタル放送受信装置に適用した例を説明したがこれに限定されるものではない。すなわち、ネットワークを介して映像コンテンツを取得する映像再生装置において、1つの映像コンテンツに対して複数の音声データが存在する場合に本発明を適用することで、本発明と同様の効果が得られる。また、1つの競技エリアに1つの音声データが関連付けられた例を説明したが、1つの競技エリアに複数の音声データを関連付けてもよい。この場合、任意視点映像内に含まれる競技エリアが1つであっても、音声切替リストが作成されることになる。
【0117】
[他の実施形態]本発明は、以下の処理を実行することによっても実現される。即ち、上記実施形態の機能を実現するソフトウェア(プログラム)をネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(又はCPUやMPU等)がプログラムコードを読み出して実行する処理である。この場合、そのプログラム、及び該プログラムを記憶した記憶媒体は本発明を構成することになる。
【技術分野】
【0001】
本発明は、デジタル放送波などを受信再生する技術に関する。
【背景技術】
【0002】
現在、複数のカメラで異なる視点位置から被写体を撮影した多数の映像(以下、多視点映像)を用いて任意の視点位置の映像を補間・再構成することで、本来撮影されていない視点での映像を生成する任意視点映像生成技術の研究が行われている。
【0003】
また、その任意視点映像を実際に標準映像の放送番組などと連携してサービスすることも検討されており、特許文献1には標準映像の放送番組と任意視点映像とを切り替える技術が開示されている。特許文献1は、標準映像のカメラの位置などをメタデータとして送出することにより、ユーザが標準映像から任意視点映像に切り替えた際に、任意視点情報を生成し、その情報から任意視点映像を得るものである。
【0004】
また、特許文献2には複数のカメラと複数のマイクによって被写体を複数の方向から記録した多視点映像及び多聴点音声から、ユーザが所望の映像と音声を選択して視聴できるようにした技術が開示されている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2007−150747号公報
【特許文献2】特開2005−159592号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
上述した従来技術を用いることにより、ユーザが視点位置を自由に変更して、特定の競技や被写体の映像や音声を好きな画角から視聴することが可能になる。例えば、スポーツ中継を例に取ると、自分の好きな選手や競技を常に追跡して見ることができる。また、オリンピックのような1つの競技場で複数の競技が同時に進行するような場合でも、好きなタイミングで自由に競技エリアを切り替えて視聴することができる。
【0007】
しかし、ユーザが任意に指定した場所や方向での任意視点映像を視聴する場合、映像の視点の切り替えに応じて音声を切り替える際に、複数の音声データが存在すると、どの音声を選択したらよいかわからないという問題がある。
【0008】
本発明は、上記課題に鑑みてなされ、その目的は、視点を切り替えた映像に複数の音声が存在する場合に、映像の視点を変更した結果に応じて、適した音声に容易に切り替えることが可能な音声切替技術を実現することである。
【課題を解決するための手段】
【0009】
上記課題を解決し、目的を達成するために、本発明の映像再生装置は、ネットワークを介して受信した映像データおよび音声データを再生する映像再生装置であって、複数の異なる視点位置から少なくとも1つの撮影エリアを撮影した任意視点映像データと、当該撮影エリアごとに割り当てられた音声データとを取得する任意視点映像取得手段と、ユーザによる前記撮影エリアの視点位置の変更指示を受け付ける操作手段と、前記操作手段により変更された視点位置から撮影された任意視点映像内に存在する撮影エリアの数を算出する算出手段と、前記算出手段による算出の結果、任意視点映像内に存在する複数の撮影エリアごとに割り当てられた音声データが複数存在する場合に、任意視点映像ごとに決定される優先順位に応じた音声データを選択する音声切替手段と、を有する。
【発明の効果】
【0010】
本発明によれば、視聴している任意視点映像の内容に応じて音声の切替方法が変わるため、ユーザは容易に音声を切り替えることができる。また、視聴している映像とは無関係の音声に切り替ってしまうことを防ぐことができる。
【図面の簡単な説明】
【0011】
【図1】本発明に係る実施形態1のデジタル放送受信装置の構成を例示する図。
【図2】実施形態1におけるエリア情報の具体例を示す図。
【図3】実施形態1の音声切替処理を含む任意視点映像表示処理を示すフローチャート。
【図4】実施形態1の音声切替リスト作成処理を示すフローチャート。
【図5】実施形態1の画角領域の座標算出処理を説明する図。
【図6】実施形態1の音声切替処理の具体例として、ユーザが視聴している任意視点映像内に競技エリアが1つであった場合の音声が切り替わる様子を示す図。
【図7】実施形態1の音声切替処理の具体例として、ユーザが視聴している任意視点映像内に競技エリアが複数存在した場合の音声が切り替わる様子を示す図。
【図8】本発明に係る実施形態2のデジタル放送受信装置の構成を例示する図。
【図9】実施形態2の音声切替処理を含む任意視点映像表示処理を示すフローチャート。
【図10】実施形態2の音声切替処理を示すフローチャート。
【図11】本発明に係る実施形態3のデジタル放送受信装置の構成を例示する図。
【図12】実施形態3の音声切替処理を示すフローチャート。
【発明を実施するための形態】
【0012】
以下に、本発明を実施するための最良の形態について詳細に説明する。尚、以下に説明する実施の形態は、本発明を実現するための一例であり、本発明が適用される装置の構成や各種条件によって適宜修正又は変更されるべきものであり、本発明は以下の実施の形態に限定されるものではない。また、後述する各実施形態の一部を適宜組み合わせて構成しても良い。
【0013】
[実施形態1]以下に、本発明の映像再生装置を実現する実施形態1のデジタル放送受信装置について説明する。
【0014】
実施形態1では、標準映像の放送番組をデジタル放送波で受信すると共に、複数のカメラで被写体を異なる方向から撮影した任意視点映像データを受信する構成について説明する。なお、任意視点映像データの取得方法や取得経路は、本実施形態で説明する手法に限定されるものではなく、同様の情報が取得できれば他の方法や経路であってもよい。
【0015】
<デジタル放送受信装置の構成>図1を参照して、実施形態1のデジタル放送受信装置の構成について説明する。
【0016】
図1において、デジタル放送受信装置100は、放送局から放送された標準映像を受信し、表示するブロックと、任意視点映像データを受信し、任意視点映像を生成して表示するブロックと、視点の変更に沿って音声を切り替えるブロック、とを備える。
【0017】
ここで、標準映像を受信し表示するブロックについて説明する。
【0018】
デジタル放送受信装置100はデジタル放送局から放送された放送番組をチューナ部101で受信する。
【0019】
リモコン116とリモコンコード受信・解釈部115は、ユーザからの入力操作を解釈し、チャンネル選局指示の場合はチューナ部101に選局指示を送出する。
【0020】
チューナ部101は、設定された周波数情報に応じて、周波数のチューニングを行い、デジタル放送信号を受信し、その信号を復調部102に出力する。
【0021】
復調部102は入力されたデジタル放送信号に対し、復調、誤り訂正等の処理を行い、トランスポートストリーム(TS)を形成する。そして、そのTSはTS処理部103に入力される。
【0022】
TS処理部103は入力されたTSから、映像、音声、番組情報等を分離させる。分離された映像データの内、標準映像に関しては、標準映像処理部106へ出力して映像復号化処理を行い、映像出力部107に送出される。また、音声データは音声処理部104へ出力し復号化処理を行って音声出力部105に送出される。
【0023】
映像出力部107は、復号された映像データを表示部(不図示)に適した表示解像度、表示色数、リフレッシュレート、表示タイミングに変換して、不図示の表示部(モニタ等)へ出力する。
【0024】
音声出力部105は、音声データの出力レベル(音量)等を変更する機能を有し、スピーカ等へ音声データを出力する。
【0025】
次に、任意視点映像データを受信し、任意視点映像を生成して表示するブロックについて説明する。
【0026】
TS処理部103は、リモコン116及びリモコンコード受信・解釈部115からユーザの任意視点映像表示の指示を受け取ると、分離された映像データから、任意視点映像データを任意視点映像生成部108に送出する。
【0027】
任意視点映像生成部108は、視点制御部110から視点の位置や視野角といった視点情報を取得し、その視点情報と任意視点映像データから任意視点映像を生成する。そして、その映像を映像出力部107に送出する。
【0028】
視点制御部110は、リモコン116及びリモコンコード受信・解釈部115から標準映像から任意視点への変更指示や任意視点位置の変更指示を受け取ると、エリア情報取得部109から取得した座標空間を用いて変更先の視点情報を算出して任意視点映像生成部108に送出する。
【0029】
映像出力部107は、任意視点映像生成部108から送出された任意視点映像を不図示の表示部に表示するように出力する。
【0030】
次に、視点の変更に沿って音声を切り替えるブロックについて説明する。
【0031】
TS処理部103は、リモコン116及びリモコンコード受信・解釈部115からユーザの任意視点映像表示の指示を受け取ると、番組情報をエリア情報取得部109に送出する。
【0032】
視点制御部110は、リモコン116及びリモコンコード受信・解釈部115を通じて、任意視点映像の視点の位置を決定する指示を受け取ると、視点情報をエリア数算出部111へ送出する。
【0033】
エリア情報取得部109は、取得した番組情報から任意視点映像に映し出される範囲内におけるエリア情報を取得する。本実施形態では、エリア情報として、図2に示すような座標情報を取得するものとして説明する。図2は、競技場を真上から見た図(Z軸方向からXY平面を見た図)であり、原点(X座標、Y座標、Z座標=0、0、0)を中心に座標空間を示している。また、この例では3つの競技エリア(撮影エリア)の座標、及び各エリアの競技種目名と対応した音声ストリームを示す情報も含まれている。
【0034】
エリア数算出部111は、視点制御部110から視点情報を、エリア情報取得部109からエリア情報を受け取り、ユーザが視聴している任意視点映像内に映っている競技エリアの数を算出する。
【0035】
音声切替制御部112は、エリア数算出部111から受け取った競技エリアの数に応じて音声の切り替えを行う。競技エリアの数が1つの場合は、エリア情報取得部109からエリア情報を受け取り、そのエリアに対応する音声ストリームを受信するようにチューナ部101に指示する。一方、エリア数が複数の場合は、音声切替リスト作成部113へ音声切替リストの作成要求を送出する。そして、音声切替リスト表示制御部114は音声切替リスト作成部113が作成したリストをユーザが選択可能に表示画面に表示するように制御する。音声切替制御部112は、表示されたリストを用いてユーザによって選択された音声ストリームの情報をリモコンコード受信部から受け取り、チューナ部101にその音声ストリームを受信するように指示する。
【0036】
音声切替リスト作成部113は、エリア情報取得部109からエリア情報を受け取り、エリア数算出部111から視聴中の競技エリアの数とその競技種目名を取得し、競技エリアに対応する音声ストリームのリストを作成する。そして、音声切替リスト表示制御部114にリストの表示要求を送出する。加えて、ユーザからリストの並び方の優先順位設定をリモコン116及びリモコンコード受信・解釈部115を通じて受け付け、設定に応じたリストの並び替えを行う。
【0037】
<任意視点映像表示処理>次に、図3及び図4を参照して、実施形態1の任意視点映像表示処理及び音声切替処理について説明する。
【0038】
図3において、デジタル放送受信装置100は、まず、デジタル放送局から放送された標準映像と標準音声を不図示の表示部とスピーカ等に出力する(S101、S102)。
【0039】
次に、リモコン116及びリモコンコード受信・解釈部115を通じて、ユーザから任意視点映像への変更指示があるかどうか判定する(S103)。
【0040】
変更指示がある場合は、番組情報から任意視点映像のエリア情報を取得する(S104)。
【0041】
次に、任意視点映像データと任意視点の視点情報から任意視点映像を生成する(S105)。なお、本実施形態では、任意視点映像データは、図2の座標に基づき任意視点映像を生成するためのデータである。また、任意視点の視点情報も、図2の座標空間上で計算される。
【0042】
続いて、生成された任意視点映像を表示する(S106)。なお、ステップS105、S106では、デジタル放送受信装置で任意視点映像を生成しているが、他のサーバ等がユーザ等による視点情報を取得して生成した任意視点映像を、デジタル放送受信装置で受信し表示してもよい。すなわち、任意視点映像生成部108を外部に持っていてもよい。
【0043】
次に、ユーザによって任意視点の視点位置が決定されたか判定する(S107)。
【0044】
決定された場合、ユーザが観ている任意視点映像内の競技エリアの数を算出する(S108)。競技エリアの数は、視点の位置や視野角といった視点情報から算出される。詳細は後述する。
【0045】
次に、上記算出の結果、競技エリア数が1つまたは複数(エリア数>1)か判定する(S109)。
【0046】
上記判定の結果、競技エリア数が1つの場合は、そのエリアに対応した音声ストリームを示す情報を取得し(S110)、その音声に切り替えて出力する(S111)。
【0047】
一方、競技エリア数が複数存在する場合、音声切替リストを作成する(S112)。詳細については、図4で説明する。
【0048】
次に、音声切替リストを表示し(S113)、ユーザが音声を切り替えるか決定する(S114)。
【0049】
切り替える場合は音声切替リストの中から、ユーザに選択された音声に切り替えて、出力する(S115)。
【0050】
次に、ユーザによって任意視点映像を終了する操作が行われたか判定する(S116)。終了する場合はS101へ移行し、終了しない場合は、ユーザによって任意視点の視点位置が変更されたか判定する(S117)。
【0051】
視点が変更されていない場合は、S112に移行し、変更された場合は、S105へ移行する。
【0052】
続いて、図4を参照して、音声切替リスト作成部113で実行される音声切替リストの作成処理について説明する。
【0053】
図4において、音声切替リスト作成部113は、まず、視聴している任意視点映像内の競技エリアの数とその競技名を取得する(S201)。
【0054】
次に、ユーザによって設定された音声切替リストの並び方の優先順位によって、リストの作成方法を変更する(S202)。
【0055】
優先順位の設定が、現在の視点位置からの距離が短い競技エリアを優先してリストに並べる場合、視点位置と取得された競技名の各競技エリアまでの距離を算出する(S203)。
【0056】
そして、距離の短い順番に各競技エリアに対応する音声ストリーム名を並べた音声切替リストを作成する(S204)。
【0057】
一方、優先順位の設定が任意視点映像内に映っているエリア面積の割合が高い競技エリアを優先してリストに並べる場合、取得された競技名について競技エリア毎の全体の領域面積をそれぞれ算出する(S205)。
【0058】
また、視聴している任意視点映像内に映っている面積をエリアごとに算出し(S206)、その面積を競技エリア毎に算出された全体の領域面積でそれぞれ除算することによって割合を算出する(S207)。
【0059】
そして、割合が高い順番に各競技エリアに対応する音声ストリーム名を並べた音声切替リストを作成する(S208)。
【0060】
次に、エリア数算出部111で算出される競技エリアの数の算出方法について説明する。
【0061】
エリア数算出部111は、エリア情報取得部109から座標情報を取得する。その座標情報は、3次元座標空間(X軸、Y軸、Z軸)から構成される。また、視点制御部110からこの座標空間上で計算された視点の位置や視野角といった視点情報を取得する。そして、これらの情報から、ユーザが観ている任意視点映像の画角領域の座標を算出することができる。よって、その座標と競技エリアの座標とから、画角領域内に含まれる競技エリアを判別できるので、任意視点映像内に映っている競技エリアの数を求めることができる。
【0062】
図5を参照して、画角領域の座標を求める方法について説明する。図5(A)は、X軸とZ軸の座標空間における任意視点の位置と視野角とを例示している。X1とZ1はそれぞれX軸とZ軸における視点の位置を示す。また、θXは、XZ平面におけるZ軸から視野までの角度であり、φXは視野角を示す。XαとXβは、任意視点の画角領域のX座標である。それぞれ以下の式1,2によって座標を算出することができる。
Xα=X1+Z1×tanθX…(1)
Xβ=X1+Z1×tan(θX+φX)…(2)
同様に、図5(B)においても、Y軸とZ軸の座標空間において、画角領域のY座標であるYαとYβを以下の式3,4で算出することができる。
Yα=Y1+Z1×tanθY…(3)
Yβ=Y1+Z1×tan(θY+φY)…(4)
以上のように算出されたXα、Xβ、Yα、Yβの各座標値から、図5(C)に示すようにそれぞれの座標の交わる部分で囲まれる領域が、ユーザが視聴している任意視点映像の画角領域になる。
【0063】
図6及び図7は、実施形態1の音声切替処理の具体例として、ユーザが視聴している任意視点映像内に競技エリアが1つ又は複数存在した場合の音声が切り替わる様子を示している。図示のように、音声切替リストは、標準映像・任意視点映像と共に(重畳して)表示される。
【0064】
図6では、競技エリアが1つであるため、ユーザが中距離走を視聴していると判断できる。よって、自動で中距離走の音声ストリームに切り替わり、出力される。
【0065】
一方、図7では、任意視点映像内に競技エリアが3つ存在するので、音声切替リストを表示することで、ユーザに音声ストリームを選択させる。そして、選択された競技の音声に切り替わり、出力される。
【0066】
図7(A)は、音声切替リスト中の各競技名を任意視点の視点位置からの距離が近い順番に並べた例である。また、図7(B)は、競技エリアごとに算出された任意視点映像に映っているエリア面積の割合の高い順番に並べた例である。
【0067】
以上説明した一連の処理によって、エリアごとに音声ストリームが割り当てられている場合に、ユーザの視点位置の変更に応じて適切な音声に容易に切り替えることができる。
【0068】
なお、本発明は、実施形態1として説明したエリア情報の内容や取得方法、座標の計算方法に限定されるものではなく、また、音声切替リストの並び方の優先順位も視点からの距離やエリア面積に限定されるものではない。
【0069】
また、上述した実施形態では、一定の広さを持つ競技エリアと音声とが対応づけられた構成となっているが、競技エリアに代えて音声を収録した地点(撮影ポイント)等にしてもよい。この場合、図3のS112(図4の音声切替リストの作成処理)において、「エリア面積優先」のリストは作成されない。
【0070】
また、図3のS109において、視聴する映像の画角内に複数の競技エリア(音声収録地点)が存在する場合に、必ずしも音声切替リストを表示しなくてもよい。すなわち、リストを作成した際に最も優先順位が高いもの(距離優先だったら視点から近い音声、面積優先だったらエリアの広い音声)に自動的に切り替える構成としてもよい。
【0071】
[実施形態2]次に、実施形態2について説明する。なお、以下では、実施形態1と重複する説明は省略する。
【0072】
実施形態1では、任意視点の視点位置が決定してから音声を切り替えていたが、実施形態2では、視点を移動させている途中に音声を切り替えている。すなわち、実施形態2では、ユーザが任意視点の視点位置を移動させた場合に、一定の距離を移動するごとに任意視点映像内に映っている競技エリアの数を算出し、その競技エリア数に応じて音声を切り替える。
【0073】
<装置構成>図8を参照して、実施形態2のデジタル放送受信装置の構成について説明する。
【0074】
図8において、視点制御部210は、リモコン216及びリモコンコード受信・解釈部215を通じて、任意視点の位置の変更指示を受け取ると、エリア情報取得部209から取得した座標空間から変更先の視点情報を算出する。そして、その情報を任意視点映像生成部208に送出すると共に、視点移動距離算出部217へ変更前の視点情報と変更後の視点情報を送出する。また、視点移動距離算出部217から、視点の移動距離が所定の閾値を超えたことを通知された場合、音声を切り替るために視点情報をエリア数算出部111へ送出する。
【0075】
視点移動距離算出部217は、視点制御部210から送出された視点の変更前と変更後の視点情報を用いて、視点の位置座標から移動距離を算出し、更にその移動距離を累積する。そして、移動距離の累積値が所定の閾値を超えた場合、視点制御部210に通知する。
【0076】
<任意視点映像表示処理>次に、図9及び図10を参照して、実施形態2の任意視点映像表示処理及び音声切替処理について説明する。なお、図9のS301〜S306、S314は、図1のS101〜S106、S116と同様であるため、説明を省略する。
【0077】
図9において、S306で任意視点映像が表示された後、任意視点の視点位置がユーザによって移動されたか判定し(S307)、移動された場合は視点の移動距離を算出する(S308)。
【0078】
そして、移動距離が所定の閾値を超えた場合、音声切替処理を行う(S310)。一方、移動距離が所定の閾値を超えていない場合は、移動距離を累積する(S311)。
【0079】
次に、任意視点の移動が終了し、ユーザから視点位置を決定する指示を受け取った場合(S312)、S310と同様に音声の切替処理を行う(S313)。
【0080】
次に、図9のS310、S313の音声切替処理について説明する。なお、図10のS409以外の処理は、図3のS108〜S115と同様であるため、説明を省略する。
【0081】
図10において、S409では、音声を切り替えた後なので、S308で算出された視点の移動距離を”0”にリセットする。
【0082】
以上のような一連の処理によって、ユーザが任意視点の視点位置を移動している途中であっても、容易に音声を切り替えることができる。
【0083】
[実施形態3]次に、実施形態3について説明する。
【0084】
実施形態3は、デジタル放送波で複数の視点位置で撮影された多視点映像を受信して表示し、多視点映像に対応する音声ストリームの数に応じて音声を切り替えるものである。
【0085】
<装置構成>図11を参照して、実施形態3のデジタル放送受信装置の構成について説明する。
【0086】
図11において、デジタル放送受信装置300は、放送局から放送された標準映像と多視点映像を受信し、表示するブロックと、表示する多視点映像の変更に応じて音声を切り替えるブロック、とを備える。
【0087】
ここで、標準映像と多視点映像を受信し、表示するブロックについて説明する。
【0088】
デジタル放送受信装置300は、デジタル放送局から放送された放送番組をチューナ部301で受信する。
【0089】
リモコン313とリモコンコード受信・解釈部312は、ユーザからの入力操作を解釈し、チャンネル選局指示の場合はチューナ部301に選局指示を送出する。また、標準映像と多視点映像の切替指示も送出する。
【0090】
チューナ部301は、設定された周波数情報に応じて、周波数のチューニングを行い、デジタル放送信号を受信して、その信号を復調部302に出力する。
【0091】
復調部302は入力されたデジタル放送信号に対し、復調、誤り訂正等の処理を行い、トランスポートストリーム(TS)を形成し、TS処理部303に送出する。
【0092】
TS処理部303は入力したTSから、標準映像、多視点映像、音声、番組情報等を分離させる。
【0093】
分離された映像データのうち、標準映像と多視点映像に関しては、映像処理部305へ出力して映像復号化処理を行い、映像出力部307に送出される。また、音声データは音声処理部304へ出力し復号化処理を行って音声出力部306に送出される。
【0094】
映像出力部307は、復号された映像データを表示解像度、表示色数、リフレッシュレートに適した表示データ、タイミングに変換して、映像表示を行う。
【0095】
音声出力部306は、音声データの出力レベル(音量)等を変更する機能を有する。
【0096】
次に、表示する多視点映像の変更に応じて音声を切り替えるブロックについて説明する。
【0097】
リモコン313とリモコンコード受信・解釈部312は、複数の多視点映像から1つを選局するようにチューナ部301に指示を送出する。また、音声切替制御部309に音声の切替指示を送出する。
【0098】
音声情報取得部308は、番組情報から選局されている多視点映像に対応する音声情報を取得し、音声ストリームの数を抽出する。
【0099】
音声切替制御部309は、音声情報取得部308によって取得された音声ストリームの数に応じて音声の切り替えを行う。音声ストリームの数が1つの場合は、その音声ストリームを受信するようにチューナ部301に指示する。一方、音声ストリームの数が複数の場合は、音声切替リスト作成部310へ音声切替リストの作成要求を送出する。そして、音声切替リスト表示制御部311よりユーザによって選択された音声ストリームの情報を受け取り、チューナ部301にその音声ストリームを受信するように指示する。
【0100】
音声切替リスト作成部310は、音声情報取得部308から音声ストリームの数とその音声名を取得し、音声ストリームのリストを作成する。そして、音声切替リスト表示制御部311にリストの表示要求を送出する。
【0101】
音声切替リスト表示制御部311は、音声切替リスト作成部310によって生成された音声切替リストを表示画面に表示するように制御し、ユーザからの音声選択指示を待つ。リモコン313及びリモコンコード受信・解釈部312から、ユーザの音声選択指示を受け取ると、選択された音声ストリームの情報を音声切替制御部309に送出する。
【0102】
<多視点映像表示処理>次に、図12を参照して、実施形態3の多視点映像表示処理及び音声切替処理について説明する。
【0103】
図12において、デジタル放送受信装置300は、まず、デジタル放送局から放送された標準映像と標準音声を出力する(S501、S502)。
【0104】
次に、ユーザから多視点映像への変更指示があるか否かを判定する(S503)。
【0105】
変更指示がある場合は、多視点映像の1つの映像を選局する(S504)。
【0106】
続いて、選局された多視点映像を表示する(S505)。
【0107】
次に、選局された多視点映像に対応する音声ストリームの数を抽出する(S506)。
【0108】
次に抽出された音声ストリームの数が1つか、または複数(音声ストリーム数>1?)かを判定する(S507)。
【0109】
音声ストリームの数が1つの場合は、その音声に切り替え、出力する(S508)。
【0110】
一方、抽出された音声ストリームの数が複数の場合、音声切替リストを作成する(S509)。
【0111】
次に、音声切替リストを表示し(S510)、ユーザが音声を切り替えるか決定する(S511)。
【0112】
切り替える場合は音声切替リストの中から、ユーザに選択された音声に切り替えて、出力する(S512)。
【0113】
次に、ユーザによって標準映像に戻る操作が行われたか否かを判定し(S513)、戻る場合はS501へ移行する。
【0114】
戻らない場合は、ユーザによって多視点映像が変更されたか否かを判定する(S514)。変更されていない場合は、S513に移行する。多視点映像が変更された場合は、S505へ移行する。
【0115】
以上のような一連の処理によって、多視点映像の選局操作に応じて適切な音声に容易に切り替えることができる。
【0116】
なお、上述した各実施形態では、本発明をデジタル放送受信装置に適用した例を説明したがこれに限定されるものではない。すなわち、ネットワークを介して映像コンテンツを取得する映像再生装置において、1つの映像コンテンツに対して複数の音声データが存在する場合に本発明を適用することで、本発明と同様の効果が得られる。また、1つの競技エリアに1つの音声データが関連付けられた例を説明したが、1つの競技エリアに複数の音声データを関連付けてもよい。この場合、任意視点映像内に含まれる競技エリアが1つであっても、音声切替リストが作成されることになる。
【0117】
[他の実施形態]本発明は、以下の処理を実行することによっても実現される。即ち、上記実施形態の機能を実現するソフトウェア(プログラム)をネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(又はCPUやMPU等)がプログラムコードを読み出して実行する処理である。この場合、そのプログラム、及び該プログラムを記憶した記憶媒体は本発明を構成することになる。
【特許請求の範囲】
【請求項1】
ネットワークを介して受信した映像データおよび音声データを再生する映像再生装置であって、
異なる視点位置から少なくとも1つの撮影エリアを撮影した任意視点映像データと、当該撮影エリアごとに割り当てられた音声データとを取得する取得手段と、
ユーザによる前記撮影エリアの視点位置の変更指示を受け付ける操作手段と、
前記操作手段により変更された視点位置から撮影された任意視点映像内に存在する撮影エリアの数を算出する算出手段と、
前記算出手段による算出の結果、任意視点映像内に存在する複数の撮影エリアごとに割り当てられた音声データが複数存在する場合に、任意視点映像ごとに決定される優先順位に応じた音声データを選択する音声切替手段と、を有することを特徴とする映像再生装置。
【請求項2】
前記音声切替手段は、前記算出手段により算出された撮影エリアの数が1つの場合は、当該撮影エリアに割り当てられた音声データに自動で切り替えることを特徴とする請求項1に記載の映像再生装置。
【請求項3】
前記算出手段は、前記操作手段により変更された前記撮影エリアの視点位置における画角によって決まる映像内の撮影エリアの数を算出することを特徴とする請求項1に記載の映像再生装置。
【請求項4】
前記優先順位は、前記視点位置からの距離が近いまたは撮影エリアの面積が大きい順に決定されることを特徴とする請求項1に記載の映像再生装置。
【請求項5】
前記優先順位に応じて、撮影エリアごとの複数の音声データを並べた音声切替リストを選択可能に表示する表示手段を更に有することを特徴とする請求項4に記載の映像再生装置。
【請求項6】
前記操作手段を介してユーザにより指示された視点位置が移動しているか判定する判定手段を更に有し、
前記表示手段は、視点位置が所定の距離だけ移動するごとに前記算出手段により算出される任意視点映像内に存在する撮影エリアの数に応じて音声切替リストを作成し、表示することを特徴とする請求項1に記載の映像再生装置。
【請求項7】
前記任意視点映像から多視点映像に変更する変更手段を更に有し、
前記算出手段は、前記多視点映像に対応する音声データの数を算出し、
前記表示手段は、前記多視点映像に対応する音声データの数に応じて音声切替リストを作成し、表示することを特徴とする請求項1に記載の映像再生装置。
【請求項8】
ネットワークを介して受信した映像データおよび音声データを再生する映像再生装置であって、
異なる視点位置から少なくとも1つの撮影ポイントを撮影した任意視点映像データと、当該撮影ポイントごとに割り当てられた音声データとを取得する取得手段と、
ユーザによる前記撮影ポイントの視点位置の変更指示を受け付ける操作手段と、
前記操作手段により変更された視点位置から撮影された任意視点映像内に存在する撮影ポイントの数を算出する算出手段と、
前記算出手段による算出の結果、任意視点映像内に存在する複数の撮影ポイントごとに割り当てられた音声データが複数存在する場合に、任意視点映像ごとに決定される優先順位に応じた音声データを選択する音声切替手段と、を有することを特徴とする映像再生装置。
【請求項9】
前記音声切替手段は、前記算出手段により算出された撮影ポイントの数が1つの場合は、当該撮影ポイントに割り当てられた音声データに自動で切り替えることを特徴とする請求項8に記載の映像再生装置。
【請求項10】
前記算出手段は、前記操作手段により変更された前記撮影ポイントの視点位置における画角によって決まる映像内の撮影ポイントの数を算出することを特徴とする請求項8に記載の映像再生装置。
【請求項11】
前記優先順位は、前記視点位置からの距離が近い順に決定されることを特徴とする請求項8に記載の映像再生装置。
【請求項12】
前記優先順位に応じて、撮影ポイントごとの複数の音声データを並べた音声切替リストを選択可能に表示する表示手段を更に有することを特徴とする請求項11に記載の映像再生装置。
【請求項13】
前記操作手段を介してユーザにより指示された視点位置が移動しているか判定する判定手段を更に有し、
前記表示手段は、視点位置が所定の距離だけ移動するごとに前記算出手段により算出される任意視点映像内に存在する撮影ポイントの数に応じて音声切替リストを作成し、表示することを特徴とする請求項8に記載の映像再生装置。
【請求項14】
前記任意視点映像から多視点映像に変更する変更手段を更に有し、
前記算出手段は、前記多視点映像に対応する音声データの数を算出し、
前記表示手段は、前記多視点映像に対応する音声データの数に応じて音声切替リストを作成し、表示することを特徴とする請求項8に記載の映像再生装置。
【請求項15】
ネットワークを介して受信した映像データおよび音声データを再生する映像再生装置の制御方法であって、
異なる視点位置から少なくとも1つの撮影エリアを撮影した任意視点映像データと、当該撮影エリアごとに割り当てられた音声データとを取得する取得工程と、
ユーザによる前記撮影エリアの視点位置の変更指示を受け付ける操作工程と、
前記操作工程により変更された視点位置から撮影された任意視点映像内に存在する撮影エリアの数を算出する算出工程と、
前記算出工程による算出の結果、任意視点映像内に存在する複数の撮影エリアごとに割り当てられた音声データが複数存在する場合に、任意視点映像ごとに決定される優先順位に応じた音声データを選択する音声切替工程と、を有することを特徴とする映像再生装置の制御方法。
【請求項16】
ネットワークを介して受信した映像データおよび音声データを再生する映像再生装置の制御方法であって、
異なる視点位置から少なくとも1つの撮影ポイントを撮影した任意視点映像データと、当該撮影ポイントごとに割り当てられた音声データとを取得する取得工程と、
ユーザによる前記撮影ポイントの視点位置の変更指示を受け付ける操作工程と、
前記操作工程により変更された視点位置から撮影された任意視点映像内に存在する撮影ポイントの数を算出する算出工程と、
前記算出工程による算出の結果、任意視点映像内に存在する複数の撮影ポイントごとに割り当てられた音声データが複数存在する場合に、任意視点映像ごとに決定される優先順位に応じた音声データを選択する音声切替工程と、を有することを特徴とする映像再生装置の制御方法。
【請求項17】
コンピュータを、請求項1乃至14のいずれか1項に記載の映像再生装置の各手段として機能させるためのプログラム。
【請求項18】
コンピュータを、請求項1乃至14のいずれか1項に記載の映像再生装置の各手段として機能させるためのプログラムを記憶したコンピュータによる読み取りが可能な記憶媒体。
【請求項1】
ネットワークを介して受信した映像データおよび音声データを再生する映像再生装置であって、
異なる視点位置から少なくとも1つの撮影エリアを撮影した任意視点映像データと、当該撮影エリアごとに割り当てられた音声データとを取得する取得手段と、
ユーザによる前記撮影エリアの視点位置の変更指示を受け付ける操作手段と、
前記操作手段により変更された視点位置から撮影された任意視点映像内に存在する撮影エリアの数を算出する算出手段と、
前記算出手段による算出の結果、任意視点映像内に存在する複数の撮影エリアごとに割り当てられた音声データが複数存在する場合に、任意視点映像ごとに決定される優先順位に応じた音声データを選択する音声切替手段と、を有することを特徴とする映像再生装置。
【請求項2】
前記音声切替手段は、前記算出手段により算出された撮影エリアの数が1つの場合は、当該撮影エリアに割り当てられた音声データに自動で切り替えることを特徴とする請求項1に記載の映像再生装置。
【請求項3】
前記算出手段は、前記操作手段により変更された前記撮影エリアの視点位置における画角によって決まる映像内の撮影エリアの数を算出することを特徴とする請求項1に記載の映像再生装置。
【請求項4】
前記優先順位は、前記視点位置からの距離が近いまたは撮影エリアの面積が大きい順に決定されることを特徴とする請求項1に記載の映像再生装置。
【請求項5】
前記優先順位に応じて、撮影エリアごとの複数の音声データを並べた音声切替リストを選択可能に表示する表示手段を更に有することを特徴とする請求項4に記載の映像再生装置。
【請求項6】
前記操作手段を介してユーザにより指示された視点位置が移動しているか判定する判定手段を更に有し、
前記表示手段は、視点位置が所定の距離だけ移動するごとに前記算出手段により算出される任意視点映像内に存在する撮影エリアの数に応じて音声切替リストを作成し、表示することを特徴とする請求項1に記載の映像再生装置。
【請求項7】
前記任意視点映像から多視点映像に変更する変更手段を更に有し、
前記算出手段は、前記多視点映像に対応する音声データの数を算出し、
前記表示手段は、前記多視点映像に対応する音声データの数に応じて音声切替リストを作成し、表示することを特徴とする請求項1に記載の映像再生装置。
【請求項8】
ネットワークを介して受信した映像データおよび音声データを再生する映像再生装置であって、
異なる視点位置から少なくとも1つの撮影ポイントを撮影した任意視点映像データと、当該撮影ポイントごとに割り当てられた音声データとを取得する取得手段と、
ユーザによる前記撮影ポイントの視点位置の変更指示を受け付ける操作手段と、
前記操作手段により変更された視点位置から撮影された任意視点映像内に存在する撮影ポイントの数を算出する算出手段と、
前記算出手段による算出の結果、任意視点映像内に存在する複数の撮影ポイントごとに割り当てられた音声データが複数存在する場合に、任意視点映像ごとに決定される優先順位に応じた音声データを選択する音声切替手段と、を有することを特徴とする映像再生装置。
【請求項9】
前記音声切替手段は、前記算出手段により算出された撮影ポイントの数が1つの場合は、当該撮影ポイントに割り当てられた音声データに自動で切り替えることを特徴とする請求項8に記載の映像再生装置。
【請求項10】
前記算出手段は、前記操作手段により変更された前記撮影ポイントの視点位置における画角によって決まる映像内の撮影ポイントの数を算出することを特徴とする請求項8に記載の映像再生装置。
【請求項11】
前記優先順位は、前記視点位置からの距離が近い順に決定されることを特徴とする請求項8に記載の映像再生装置。
【請求項12】
前記優先順位に応じて、撮影ポイントごとの複数の音声データを並べた音声切替リストを選択可能に表示する表示手段を更に有することを特徴とする請求項11に記載の映像再生装置。
【請求項13】
前記操作手段を介してユーザにより指示された視点位置が移動しているか判定する判定手段を更に有し、
前記表示手段は、視点位置が所定の距離だけ移動するごとに前記算出手段により算出される任意視点映像内に存在する撮影ポイントの数に応じて音声切替リストを作成し、表示することを特徴とする請求項8に記載の映像再生装置。
【請求項14】
前記任意視点映像から多視点映像に変更する変更手段を更に有し、
前記算出手段は、前記多視点映像に対応する音声データの数を算出し、
前記表示手段は、前記多視点映像に対応する音声データの数に応じて音声切替リストを作成し、表示することを特徴とする請求項8に記載の映像再生装置。
【請求項15】
ネットワークを介して受信した映像データおよび音声データを再生する映像再生装置の制御方法であって、
異なる視点位置から少なくとも1つの撮影エリアを撮影した任意視点映像データと、当該撮影エリアごとに割り当てられた音声データとを取得する取得工程と、
ユーザによる前記撮影エリアの視点位置の変更指示を受け付ける操作工程と、
前記操作工程により変更された視点位置から撮影された任意視点映像内に存在する撮影エリアの数を算出する算出工程と、
前記算出工程による算出の結果、任意視点映像内に存在する複数の撮影エリアごとに割り当てられた音声データが複数存在する場合に、任意視点映像ごとに決定される優先順位に応じた音声データを選択する音声切替工程と、を有することを特徴とする映像再生装置の制御方法。
【請求項16】
ネットワークを介して受信した映像データおよび音声データを再生する映像再生装置の制御方法であって、
異なる視点位置から少なくとも1つの撮影ポイントを撮影した任意視点映像データと、当該撮影ポイントごとに割り当てられた音声データとを取得する取得工程と、
ユーザによる前記撮影ポイントの視点位置の変更指示を受け付ける操作工程と、
前記操作工程により変更された視点位置から撮影された任意視点映像内に存在する撮影ポイントの数を算出する算出工程と、
前記算出工程による算出の結果、任意視点映像内に存在する複数の撮影ポイントごとに割り当てられた音声データが複数存在する場合に、任意視点映像ごとに決定される優先順位に応じた音声データを選択する音声切替工程と、を有することを特徴とする映像再生装置の制御方法。
【請求項17】
コンピュータを、請求項1乃至14のいずれか1項に記載の映像再生装置の各手段として機能させるためのプログラム。
【請求項18】
コンピュータを、請求項1乃至14のいずれか1項に記載の映像再生装置の各手段として機能させるためのプログラムを記憶したコンピュータによる読み取りが可能な記憶媒体。
【図1】
【図3】
【図4】
【図8】
【図9】
【図10】
【図11】
【図12】
【図2】
【図5】
【図6】
【図7】
【図3】
【図4】
【図8】
【図9】
【図10】
【図11】
【図12】
【図2】
【図5】
【図6】
【図7】
【公開番号】特開2012−151688(P2012−151688A)
【公開日】平成24年8月9日(2012.8.9)
【国際特許分類】
【出願番号】特願2011−9196(P2011−9196)
【出願日】平成23年1月19日(2011.1.19)
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】
【公開日】平成24年8月9日(2012.8.9)
【国際特許分類】
【出願日】平成23年1月19日(2011.1.19)
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】
[ Back to top ]