説明

音声ミキシングのカスタマイズ方法およびその装置

【課題】 メイン音声とサブ音声のミキシングバランスを視聴者(ユーザ)の求めに応じて調整できるようにする。
【解決手段】 この音声ミキシングのカスタマイズ方法では、メイン音声ストリームとサブ音声ストリームをデコードし、デコードしたメイン音声とサブ音声をミキシングして出力する。この方法では、メイン音声ストリームとサブ音声ストリームの両方がデコードされているときに(S01Y)、メイン音声ストリームのデコードにより得られるメイン音声とサブ音声ストリームのデコードにより得られるサブ音声とのミキシング調整が可能であることを通知する(S06Y)。そして、デコードされたメイン音声とデコードされたサブ音声とのミキシングバランスを変える操作があったときは(S18YまたはS20Y)、この操作に従いミキシング係数を更新し、更新されたミキシング係数にしたがって設定されたミキシングバランスでもって、デコードされたメイン音声と前記デコードされたサブ音声を出力する。

【発明の詳細な説明】
【技術分野】
【0001】
この発明は、音声ミキシングのカスタマイズ方法およびその装置に関する。特に、HD_DVDビデオのようにメイン音声とサブ音声を個別に自由に含むことのできるデジタルAVコンテンツのメディアを再生する場合における、音声ミキシングのカスタマイズ方法およびその装置に関する。
【背景技術】
【0002】
メイン音声と背景音声をミキシングする装置の例として、特許文献1に開示された音声ミキシング装置がある。また、メインオーディオデータとサブオーディオデータを含む動画像ストリームを処理する装置の例として、特許文献2に開示された再生装置がある。
【特許文献1】特開平7-85586号公報。
【特許文献2】特2006-191239号公報。
【発明の開示】
【発明が解決しようとする課題】
【0003】
特許文献1では、メイン音声信号及び背景音声信号は、ミキシング回路において各調整器を介して加算器に供給されてミキシングされる。特許文献2は、オーディオデコーダ回路によりデコードされた第1のオーディオデータと第2のオーディオデータをミキシングして出力するミキサ回路を有している。
【0004】
特許文献1には音声のミキシング調整が開示され、特許文献2にはHD_DVDでメイン音声とサブ音声をミキシングして再生する装置が開示されている。しかしながら、音声ミキシング調整がコンテンツに依存する場合、音声ミキシング調整の可否をユーザが知ることができないという問題がある。
【0005】
たとえばHD_DVDビデオディスクに記録されたメイン音声とサブ音声を再生する場合、メイン音声とサブ音声のミキシングバランスを調整する情報の有無は、コンテンツの作り手次第である。メイン音声とサブ音声のミキシングバランスを調整する情報のないコンテンツの場合、個々の視聴者(ユーザ)にとって、個々の再生機器がデフォルトで再生するメイン音声とサブ音声のミキシングバランスが最適とは限らなかった。すなわち、コンテンツプロバイダが適正バランスであると想定していても、視聴者の聴感や好みは千差万別なので、人によってはメイン音声に対してサブ音声がうるさすぎると感じたり、逆にサブ音声が聞き取りにくいと感じたりすることは、ままある。
【0006】
この発明の課題の1つは、メイン音声とサブ音声のミキシングバランスを調整する情報のないコンテンツの場合でも視聴者(ユーザ)の求めに応じたミキシングバランスを実現できるようにすることである。
【課題を解決するための手段】
【0007】
この発明の一実施の形態に係る音声ミキシングのカスタマイズ方法では、たとえばMPEGプログラムストリームを構成するエレメンタリストリームに対応するメイン音声ストリームとサブ音声ストリームをデコードし、デコードしたメイン音声とサブ音声をミキシングして出力する。この方法では、前記メイン音声ストリームと前記サブ音声ストリームの両方がデコードされているときに、前記メイン音声ストリームのデコードにより得られるメイン音声と前記サブ音声ストリームのデコードにより得られるサブ音声とのミキシング調整が可能であることを(画像および/または音声で)通知する。そして、デコードされた前記メイン音声とデコードされた前記サブ音声とのミキシングバランスを変える操作(リモコン等を用いたユーザ操作)があったときは、この操作に従いミキシング係数を更新し、更新されたミキシング係数にしたがって設定された前記ミキシングバランスでもって、前記デコードされたメイン音声と前記デコードされたサブ音声を出力する。
【発明の効果】
【0008】
メイン音声とサブ音声のミキシングバランスを調整する情報のないコンテンツの場合でも視聴者(ユーザ)の求めに応じたミキシングバランスを実現できる。
【発明を実施するための最良の形態】
【0009】
以下、図面を参照してこの発明の種々な実施の形態を説明する。最初に、この実施の形態に関係する幾つかの用語について述べておく。
【0010】
Track(トラック)…タイトル(記録内容の1単位)の再生中に選択される再生オブジェクト内のエレメンタリストリームに対する論理的な存在で、映像用のVideo Track、音声用のAudio Track等がある。
Main Audio stream(メイン音声ストリーム)…Main Audio decoder(メイン音声デコード部)でデコードされるべきオーディオストリームで、Audio Trackに存在する。
Sub Audio stream(サブ音声ストリーム)…Sub Audio decoder(サブ音声デコード部)でデコードされるべきオーディオストリームで、Audio Trackに存在する。
Primary Audio Video(プライマリオーディオビデオ)…Main Video、Main Audio、Sub Video、Sub Audio、Subpicture(副映像)等の再生ストリームを提供するものをいう。
Primary Video Set(プライマリビデオセット)…Primary Audio Videoを格納するフォーマットであり、Primary Video Setのデータ構造はVideo Title Set Information(VTSI)、Time Map(TMAP)、Primary Enhanced Video Object(P−EVOB)等からなるAdvanced VTS(アドバンスドビデオタイトルセット)に準拠している。(Advanced VTSについては図6の説明参照。)
Secondary Video Set(セカンダリビデオセット)…Secondary Video Setは3種類の再生オブジェクト(Substitute Audio Video、Substitute Audio、Secondary Audio Video)を保持できるもので、ディスク、ネットワークサーバ、Persistent Storage(永続性のある記憶装置)、再生装置内のファイルキャッシュ等から供給される。Secondary Video SetはAdvanced VTSを簡略化したデータ構造をもち、Time Map(TMAP)、Secondary Enhanced Video Object(S−EVOB)等からなる。
【0011】
Enhanced Video Object(EVOB)…エレメンタリストリームのグループで構成されるMPEGプログラムストリームであり、Primary Enhanced Video Object(P−EVOB)とSecondary Enhanced Video Object(S−EVOB)が存在する。
【0012】
Audio Parameters(オーディオパラメータ)…システムパラメータの一部に含まれ、各再生機器の音声出力レベル(音量)のデフォルト設定に利用できるパラメータを含む。具体的には、Audio Parametersは、Volume of Main Audio for Output(出力されるメイン音声の音量)、Gain Value for Left Channel of Sub Audio mixing down into Output(出力にミックスされるサブ音声の左チャネルゲイン値)、Gain Value for Right Channel of Sub Audio mixing down into Output(出力にミックスされるサブ音声の右チャネルゲイン値)、Gain Value for Left Channel of Effect Audio mixing down into Output(出力にミックスされる効果音の左チャネルゲイン値)、Gain Value for Right Channel of Effect Audio mixing down into Output(出力にミックスされる効果音の右チャネルゲイン値)などを含む。このAudio Parametersに対応する情報は以下に述べるディスク1に格納可能となっている。
【0013】
図6は、Enhanced Video Object(EVOB)が記録されているディスクのデータ構造の一例を示す。図6(a)のディスク1は、図6(b)に示すように、その内周側からリードイン領域10とボリューム/ファイル構造情報領域11とデータ領域12とリードアウト領域13を持つ。ディスク1のボリュームスペースは、図6(c)に示すように、ボリューム/ファイル構造情報領域11とデータ領域12を含んで構成される。このデータ領域12は、HD_DVDビデオ領域14および、適宜その他の領域(HD_DVDビデオ以外の情報記録に使用できる領域)15を含んで構成される。HD_DVDビデオ領域14は、標準コンテント領域20およびアドバンスドコンテント領域21を含んでいる。標準コンテント領域20に記録される標準コンテント(Standard Content)は、ナビゲーションデータとディスク上のビデオオブジェクトで構成され、これは従来のDVDビデオ規格第1.1版を拡張したものである。
【0014】
アドバンスドコンテント領域21には、図6(d)に示すように、アドバンスドビデオタイトルセット(Advanced VTS)50およびアドバンスドコンテント(Advanced Content)60を記録できるようになっている。
【0015】
アドバンスドビデオタイトルセット50は、図6(e)に示すように、制御データ(ビデオタイトルセット情報VTSI)と、タイムマップ情報(VTS_TMAP)と、タイトル用の拡張ビデオオブジェクトセット(VTSTT_EVOBS)を含む。アドバンスドビデオタイトルセット50は、適宜、VTSIおよびVTS_TMAPのバックアップファイルを含むことができるように構成されている。なお、図示しないが、タイムマップ情報(VTS_TMAP)は1以上のタイムマップ(TMAP)のファイルを含むことができ、タイトル用の拡張ビデオオブジェクトセット(VTSTT_EVOBS)は1以上の拡張ビデオオブジェクト(EVOB)を含むことができるようになっている。
【0016】
後述するメイン音声およびサブ音声のストリームは、図6(e)(f)に示すように、メイン音声用のオーディオパック(図示せず)およびサブ音声用のオーディオパック(図示せず)を用いて、拡張ビデオオブジェクトセット(VTSTT_EVOBS)内に記録される。
【0017】
図1は、この発明の一実施の形態に係る再生装置の構成を説明するブロック図である。同図において、再生装置(HD_DVDプレーヤ)100は、ディスク1のコンテンツ(P−ESOB/S−ESOB)を再生し、所定の処理をして得た音声および映像をスピーカ200およびモニタTV400に出力するように構成されている。
【0018】
ディスクドライブ/データ入力部102は、ディスク1よりコンテンツ(P−ESOB/S−ESOB)を読み込み、コンテンツの種類に応じて、メイン音声デコード部103、サブ音声デコード部104、HD_DVD制御部105、メインビデオ部デコード106、サブビデオデコード部107に送信する。ここで、HD_DVD制御部105は、オーディオパラメータ等を含むシステムパラメータメモリ105aを内蔵している。
【0019】
音声ミキシング部108は、メイン音声デコード部103やサブ音声デコード部104から送られてきた音声データを合成(mixing down)する装置である。合成された音声データは音声出力部110を介して図示しないオーディオアンプに送られる。このアンプでスピーカ200を駆動することにより、合成された音声データに対応する音が出力される。
【0020】
GUI表示制御部(On-Screen Display control部)/音声合成部116は、HD_DVD制御部105やメイン/サブ音声ミキシング調整部111などからの要請に応じて、メッセージやグラフィカルユーザインターフェース(GUI)などのイメージデータを作成する機能を持つ。さらに、GUI表示制御部/音声合成部116は、作成するメッセージに対応する内容の音声を適宜合成する機能も持つ。なお、メイン/サブ音声ミキシング調整部111は、ユーザが変更したメイン音声/サブ音声のミキシング情報(個々の音声の音量情報を主とし、適宜、メイン音声に対するサブ音声の位相情報を含むこともできる)を記憶するミキシング係数メモリ111aを内蔵している。
【0021】
ビデオブレンド部109は、メインビデオ部デコード部106やサブビデオデコード部107から送られてきたビデオデータを合成する装置である。ビデオブレンド部109はさらに、メインビデオ部デコード部106およびサブビデオデコード部107から送られてきたビデオデータの合成データにGUI表示制御部/音声合成部116で作成されたイメージデータを合成する処理も行う。最終的に合成されたビデオデータは、ビデオ出力部112を通して、モニタ400に表示される。
【0022】
HD_DVD制御部105はHD_DVD再生を制御するものであり、データ入力部102から取り出したコンテンツのコンテンツ情報に応じた再生を行う。リモコン300は、再生や停止、早送り/早戻し、スキップなどのユーザ操作をプレーヤ100に対して指示する。なお、図1の構成ブロック105、111、116の機能は、マイクロコンピュータ(MPU)のファームウエアにより実現できる。
【0023】
図1のシステム構成における、メイン音声とサブ音声のミキシングバランスのカスタマイズ処理を、図2を参照して説明する。ユーザがなにもしないときは(S100Y)、図1の再生装置100はメモリ105a内のオーディオパラメータにより設定されるデフォルトのミキシングバランスで、メイン音声とサブ音声を再生する(S101)。視聴者(装置ユーザ)がこのデフォルトのミキシングバランスを好まないときは(S100N)、リモコン300に設けられたミキシング調整開始ボタン(図3の300b)を押すことにより、ミキシングバランスをユーザがカスタマイズする処理に入る。
【0024】
すなわち、図1の装置100は、メイン/サブ音声ミキシング調整部111を具備している。このメイン/サブ音声ミキシング調整部111は、ディスク1の再生開始後、メイン音声デコード部103とサブ音声デコード部104に音声ストリームが入力されメイン音声とサブ音声の両方がデコードされているか否かを判定する(S01)。メイン音声デコード部103とサブ音声デコード部104の両方で音声がデコードされていないと判定した場合(S01N)、ミキシング調整可能メッセージ(図3の401a)が表示中か否かを判定する(S02)。ミキシング調整可能メッセージが表示中であると判定した場合は(S02Y)、ミキシング調整可能メッセージを消去し(S03)、再生終了でなければ(S102N)S01の処理に戻る。ミキシング調整可能メッセージが表示中でないと判定した場合は(S02N)、ミキシング調整GUIが表示中か否かを判定する(S04)。ミキシング調整GUIが表示中であると判定した場合は(S04Y)、ミキシング調整GUIを消去し(S05)、再生終了でなければ(S102N)S01の処理に戻る。ミキシング調整GUIが表示中でないと判定した場合(S04N)、再生終了でなければ(S102N)、S01の処理に戻る。
【0025】
メイン音声デコード部103とサブ音声デコード部104の両方でメイン音声とサブ音声がデコードされていると判定した場合は(S01Y)、ミキシング調整GUIが表示中か否か(および/またはミキシング調整可能な旨を告げる音声案内を出力中であるか否か)を判定する(S06)。ミキシング調整GUIが表示中でない(および/または音声案内の出力中でない)と判定した場合は(S06N)、ミキシング調整可能メッセージが表示中か否か(および/または音声案内の出力中か否か)を判定する(S07)。ミキシング調整可能メッセージが表示中でない(および/または音声案内の出力中でない)と判断した場合は(S07N)、ミキシング調整可能メッセージを表示し(および/またはそのメッセージを音声案内し)(S08)、再生終了でなければ(S102N)、S01の処理に戻る。
【0026】
ミキシング調整可能メッセージが表示中である(および/または音声案内の出力中である)と判定した場合は(S07Y)、ユーザ操作によりミキシング調整開始が指定されたか否かを判定する(S09)。この「ミキシング調整開始指定」は、リモコン300のミキシング調整開始ボタン300b(図3)を押す(オンする)ことにより行うことができる。
【0027】
ミキシング調整開始が指定されたと判断した場合は(S09Y)、ミキシング調整GUI(図4または図5)を表示し(S10)、再生終了でなければ(S102N)、S01の処理に戻る。ミキシング調整開始が指定されていないと判断した場合(S09N)、再生終了でなければ(S102N)、S01の処理に戻る。
【0028】
ミキシング調整GUIが表示中(および/または音声案内出力中)であると判断した場合は(S06Y)、ユーザ操作(図4または図5のリモコンボタン300b*のオン)によりミキシング調整GUIの消去(および/または音声案内の停止)が指定されたか否かを判定する(S11)。ミキシング調整GUIの消去(および/または音声案内の停止)が指定されたと判定した場合は(S11Y)、ミキシング調整GUIを消去し(および/または音声案内を停止し)(S12)、再生終了でなければ(S102N)、S01の処理に戻る。
【0029】
ミキシング調整GUIの消去(および/または音声案内の停止)が指定されていないと判定した場合は(S11N)、ユーザ操作によりリモコン300の右ボタン(図4または図5のリモコンボタン300d)が押されたか否かを判定する(S18)。右ボタン300dが押されたと判定した場合は(S18Y)、メイン/サブ音声のミキシング係数をサブ側に1つ進め(S19)、S22に飛ぶ。右ボタン300dが押されていないと判定した場合(S18N)、ユーザ操作により左ボタン(図4または図5のリモコンボタン300c)が押されたか否かを判定する(S20)。左ボタン300cが押されたと判定した場合は(S20Y)、メイン/サブ音声のミキシング係数をメイン側に1つ進め(S21)、S22に飛ぶ。左ボタン300cが押されていないと判定した場合は(S20N)、再生終了でなければ(S102N)、S01の処理に戻る。
【0030】
S22では、ミキシング係数に従いミキシング調整GUIの表示を更新する(図4の例では、ミキシングバランスポイントを示すダイヤマークの表示位置を変える)。(および/またはS22において、メイン音声とサブ音声のミキシングバランスポイントが、メインよりに+Mステップ変わったとかサブよりに+Nステップ変わったといったように音声案内の内容を更新する)。その後、更新されたミキシング係数に従い音声ミキシング部108を制御し、メイン音声デコード部103からのメイン音声データとサブ音声デコード部104からのサブ音声データを合成し(S23)、再生終了でなければ(S102N)、S01の処理に戻る。
【0031】
なお、上記の一実施の形態では、S100の処理がない場合はメイン音声とサブ音声の両方がデコードされていると無条件にミキシング調整可能メッセージを表示し音声のミキシング調整ができるようになるが、S100のノー・イエスにより音声ミキシング調整処理のOn/Offを指定できるようにすることで、図3のミキシング調整可能メッセージ401aを表示しないようにすることもできる。
【0032】
図3は、この発明の一実施の形態に係る音声ミキシング処理における「ミキシング調整可能メッセージ」の表示例を説明する図である。ここでは、リモコン300のGUI画像300a(ミキシング調整開始ボタン300bを含む)と、メインビデオ画像の右上にOSD表示される「Main/Sub音声調整が可能です」というメッセージ401aが例示されている。ユーザは、メッセージ401a(および/またはそのメッセージに対応する音声案内)から、現在再生中のメイン音声とサブ音声のバランスを変更できることを知ることができる。バランスを変えたいと考えたユーザが、手元のリモコン300を操作して、GUI上のボタン300bに相当するリモコンボタンを押すと、図4のミキシングバランス調整画像401bが画面400bに表示され、あるいは図5の音声レベルバーグラフ401c、402cが画面400cに表示される。
【0033】
図4は、この発明の一実施の形態に係る音声ミキシング処理における「ミキシング調整可能GUI」の表示例を説明する図である。この例では、ユーザの手元にあるリモコン300のカーソル操作(左ボタン300bと右ボタン300d)により、相対的にメイン音声の音量を上げるかサブ音声の音量を上げるかのバランス調整を行うことができる。
【0034】
図5は、この発明の一実施の形態に係る音声ミキシング処理における「メイン/サブの個別調整」を行う表示例を説明する図である。この例では、カーソル300eでメイン音声を選び、カーソル300cと300dでメイン音声の音量を増減させる調整ができる。また、カーソル300fでサブ音声を選び、カーソル300cと300dでサブ音声の音量を増減させる調整ができる。このような方法でも、メイン音声とサブ音声との間のミキシングバランスを調整することができる。
【0035】
なお、ユーザが複数のミキシングバランス調整結果を設定した場合は、その結果えられる複数のミキシング係数を図1のミキシング係数メモリ111aに保存し、後に(図2のS100N以降の任意の処理時点において)ユーザが好みのミキシング係数を即座に選ぶ(たとえばリモコン300の図示しない番号キーでダイレクトに所望のミキシング係数を選ぶ)ように構成することもできる。
【0036】
<一実施の形態に係る装置構成のまとめ>
1.メイン音声デコード部103に音声ストリームが入力され、デコードしていることを検出する手段を持つ;
2.サブ音声デコード部104に音声ストリームが入力され、デコードしていることを検出する手段を持;
3.メイン/サブ音声ミキシング調整部111は、1と2の手段を用いて、メイン音声とサブ音声の両方の音声がデコードされていることを判定する手段を持つ;
4.メイン/サブ音声ミキシング調整部111は、メイン音声とサブ音声の両方の音声がデコードされていると判断した場合、メイン音声とサブ音声のミキシングが可能であることをメッセージ表示する手段を持つ;
5.メイン/サブ音声ミキシング調整部111は、4でメッセージが表示されている状態の時、メイン音声とサブ音声のミキシング調整の開始を選択する手段を持つ;
6.メイン/サブ音声ミキシング調整部111は、5でメイン音声とサブ音声のミキシング調整の開始が選択された後、メイン音声とサブ音声のミキシング調整を行う設定手段を持つ;
7.メイン/サブ音声ミキシング調整部111は、5で設定されたメイン音声とサブ音声のミキシング係数を記憶する手段を持つ;
8.メイン/サブ音声ミキシング調整部111は、6で記憶したメイン音声とサブ音声のミキシング係数をもとに、音声ミキシング部108を制御し、メイン音声とサブ音声のミキシングを調整する手段を持つ。
【0037】
<実施の形態と発明との対応例>
(1)メイン音声ストリームとサブ音声ストリームをデコードし、デコードしたメイン音声とサブ音声をミキシングして出力する音声ミキシングのカスタマイズ方法において、前記メイン音声ストリームと前記サブ音声ストリームの両方がデコードされているときに(S01Y)、前記メイン音声ストリームのデコードにより得られるメイン音声と前記サブ音声ストリームのデコードにより得られるサブ音声とのミキシング調整が可能であることを通知(画像および/または音声で)する(S06Y)。そして、デコードされた前記メイン音声とデコードされた前記サブ音声とのミキシングバランスを変える操作があったときは(S18YまたはS20Y)、この操作に従いミキシング係数を更新し、更新されたミキシング係数にしたがって設定された前記ミキシングバランスでもって、前記デコードされたメイン音声と前記デコードされたサブ音声を出力する。
【0038】
(2)前記通知はグラフィカルユーザインターフェース(図3〜図5)を介して行われ、このグラフィカルユーザインターフェースにおいて、前記メイン音声と前記サブ音声とのミキシング調整が可能である旨の通知画面表示(図3の401a)が行われ(S08)、あるいは前記メイン音声と前記サブ音声とのミキシングバランスに対応した変化をするミキシングバランス画面表示(図4の401b)が行われ(S10)、あるいは前記メイン音声の大きさに対応した変化をするメイン音声画面表示(図5の401c)と前記サブ音声の大きさに対応した変化をするサブ音声画面表示(図5の402c)が行われる(S10)。
【0039】
(3)メイン音声ストリームとサブ音声ストリームをデコードし、デコードしたメイン音声とサブ音声をミキシングして出力する音声ストリーム処理装置(図1)は、前記メイン音声ストリームをデコードするメイン音声デコード手段(103)と、前記サブ音声ストリームをデコードするサブ音声デコード手段(104)と、前記メイン音声デコード手段(103)でデコードされたメイン音声と前記サブ音声デコード手段(104)でデコードされたサブ音声とをミキシングする音声ミキシング手段(108)と、前記メイン音声デコード手段(103)および前記サブ音声デコード手段(104)の両方で前記メイン音声ストリームと前記サブ音声ストリームのデコードが行われていることを検知するデコード状態検知手段(111のファームウエア:S01)と、前記メイン音声デコード手段(103)および前記サブ音声デコード手段(104)の両方で前記メイン音声ストリームと前記サブ音声ストリームのデコードが行われていることが前記デコード状態検知手段(111)により検知されたら(S01Y)、前記メイン音声ストリームのデコードにより得られるメイン音声と前記サブ音声ストリームのデコードにより得られるサブ音声とのミキシング調整が可能であることを通知(画像および/または音声で)するミキシング調整可能通知手段(115のファームウエア:S06Y)と、前記メイン音声デコード手段(103)によりデコードされた前記メイン音声と前記サブ音声デコード手段(104)によりデコードされた前記サブ音声とのミキシングバランスを変える操作を行うメイン/サブ音声ミキシング調整手段(111のファームウエア:S18〜S21)とを備ている。この装置は、前記メイン/サブ音声ミキシング調整手段(111)により前記ミキシングバランスを変える操作があったときは(S18YまたはS20Y)、この操作に従いミキシング係数を更新し、更新されたミキシング係数にしたがって設定された前記ミキシングバランスでもって、前記デコードされたメイン音声と前記デコードされたサブ音声を前記音声ミキシング手段(108)から提供するように構成されている。
【0040】
(4)前記音声ストリーム処理装置(図1)は、前記通知を行うグラフィカルユーザインターフェース(図3〜図5)を提供する表示制御手段(116のファームウエア:S06〜S10)をさらに具備できる。この表示制御手段により制御されたビデオ出力により、前記メイン音声と前記サブ音声とのミキシング調整が可能である旨の通知画面表示(図3の401a)が行われ(S08)、あるいは前記メイン音声と前記サブ音声とのミキシングバランスに対応した変化をするミキシングバランス画面表示(図4の401b)が行われ(S10)、あるいは前記メイン音声の大きさに対応した変化をするメイン音声画面表示(図5の401c)と前記サブ音声の大きさに対応した変化をするサブ音声画面表示(図5の402c)が行われる(S10)。
【0041】
(5)前記メイン音声ストリームおよび前記サブ音声ストリームはMPEGプログラムストリームを構成するエレメンタリストリームに対応させることができる。前記音声ストリーム処理装置(図1)は、このエレメンタリストリームを用いてオーディオおよびビデオのコンテンツ(HD_DVDコンテンツ)が記録された光ディスクを再生するディスクドライブ(102)と、前記オーディオおよびビデオのコンテンツに含まれるビデオデータのストリームをデコードするビデオデコード手段(106、107)と、前記ビデオデコード手段(106、107)でデコードされたビデオデータと前記ミキシング調整可能通知手段(115)による通知内容に対応する画像データとをブレンドするビデオブレンド手段(109)と、前記ビデオブレンド手段(109)でブレンドされたビデオデータを画像表示装置(400)に出力するビデオ出力手段(112)とをさらに具備することができる。
【0042】
この発明の一実施の形態により、メイン音声とサブ音声のミキシングバランスを調整する情報がないコンテンツの場合でも、メイン音声とサブ音声のミキシングバランスを視聴者(ユーザ)毎にカスタマイズすることが出来るようになり、視聴者に適した音声再生が可能となる。
【0043】
なお、この発明は前述した実施の形態に限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で種々に変形することが可能である。また、各実施形態は可能な限り適宜組み合わせて実施してもよく、その場合組み合わせた効果が得られる。更に、上記実施形態には種々の段階の発明が含まれており、開示される複数の構成要件における適当な組み合わせにより種々の発明が抽出され得る。例えば、実施形態に示される全構成要件からいくつかの構成要件が削除されても、発明が解決しようとする課題の欄で述べた課題が解決でき、発明の効果の欄で述べられている効果が得られる場合には、この構成要件が削除された構成が発明として抽出され得る。
【図面の簡単な説明】
【0044】
【図1】この発明の一実施の形態に係る再生装置を説明する図。
【図2】この発明の一実施の形態に係る音声ミキシング処理手順を説明する図。
【図3】この発明の一実施の形態に係る音声ミキシング処理における「ミキシング調整可能メッセージ」の表示例を説明する図。
【図4】この発明の一実施の形態に係る音声ミキシング処理における「ミキシング調整可能GUI」の表示例を説明する図。
【図5】この発明の一実施の形態に係る音声ミキシング処理における「メイン/サブの個別調整」を行う表示例を説明する図。
【図6】図1の再生装置で再生されるディスクのデータ構造の一例を説明する図。
【符号の説明】
【0045】
1…情報記録媒体(HD_DVDビデオ等の光ディスク);102…ディスクドライブ/データ入力部;103…メイン音声デコード部;104…サブ音声デコード部;105…HD_DVD制御部(MPU);105a…システムパラメータメモリ;106…メインビデオデコード部;107…サブビデオデコード部;108…音声ミキシング部;109…ビデオブレンド部;110…音声出力部;111…メイン/サブ音声ミキシング調整部(MPU);111a…ミキシング係数メモリ;112…ビデオ出力部;116…GUI表示制御部(OSD部)/音声合成部;200…スピーカ;300…リモコン;400…画像表示装置(モニタTV)。

【特許請求の範囲】
【請求項1】
メイン音声ストリームとサブ音声ストリームをデコードし、デコードしたメイン音声とサブ音声をミキシングして出力する方法であって、前記メイン音声ストリームと前記サブ音声ストリームの両方がデコードされているときに、前記メイン音声ストリームのデコードにより得られるメイン音声と前記サブ音声ストリームのデコードにより得られるサブ音声とのミキシング調整が可能であることを通知し、デコードされた前記メイン音声とデコードされた前記サブ音声とのミキシングバランスを変える操作があったときは、この操作に従いミキシング係数を更新し、更新されたミキシング係数にしたがって設定された前記ミキシングバランスでもって前記デコードされたメイン音声と前記デコードされたサブ音声を出力する音声ミキシングのカスタマイズ方法。
【請求項2】
前記通知はグラフィカルユーザインターフェースを介して行われ、このグラフィカルユーザインターフェースにおいて、
前記メイン音声と前記サブ音声とのミキシング調整が可能である旨の通知画面表示が行われ、あるいは
前記メイン音声と前記サブ音声とのミキシングバランスに対応した変化をするミキシングバランス画面表示が行われ、あるいは
前記メイン音声の大きさに対応した変化をするメイン音声画面表示と前記サブ音声の大きさに対応した変化をするサブ音声画面表示が行われる請求項1に記載の方法。
【請求項3】
メイン音声ストリームとサブ音声ストリームをデコードし、デコードしたメイン音声とサブ音声をミキシングして出力する装置であって、
前記メイン音声ストリームをデコードするメイン音声デコード手段と、
前記サブ音声ストリームをデコードするサブ音声デコード手段と、
前記メイン音声デコード手段でデコードされたメイン音声と前記サブ音声デコード手段でデコードされたサブ音声とをミキシングする音声ミキシング手段と、
前記メイン音声デコード手段および前記サブ音声デコード手段の両方で前記メイン音声ストリームと前記サブ音声ストリームのデコードが行われていることを検知するデコード状態検知手段と、
前記メイン音声デコード手段および前記サブ音声デコード手段の両方で前記メイン音声ストリームと前記サブ音声ストリームのデコードが行われていることが前記デコード状態検知手段により検知されたら、前記メイン音声ストリームのデコードにより得られるメイン音声と前記サブ音声ストリームのデコードにより得られるサブ音声とのミキシング調整が可能であることを通知するミキシング調整可能通知手段と、
前記メイン音声デコード手段によりデコードされた前記メイン音声と前記サブ音声デコード手段によりデコードされた前記サブ音声とのミキシングバランスを変える操作を行うメイン/サブ音声ミキシング調整手段とを備え、
前記メイン/サブ音声ミキシング調整手段により前記ミキシングバランスを変える操作があったときは、この操作に従いミキシング係数を更新し、更新されたミキシング係数にしたがって設定された前記ミキシングバランスでもって、前記デコードされたメイン音声と前記デコードされたサブ音声を前記音声ミキシング手段から提供するように構成した音声ストリーム処理装置。
【請求項4】
前記通知を行うグラフィカルユーザインターフェースを提供する表示制御手段をさらに具備し、この表示制御手段により制御されたビデオ出力により、
前記メイン音声と前記サブ音声とのミキシング調整が可能である旨の通知画面表示が行われ、あるいは
前記メイン音声と前記サブ音声とのミキシングバランスに対応した変化をするミキシングバランス画面表示が行われ、あるいは
前記メイン音声の大きさに対応した変化をするメイン音声画面表示と前記サブ音声の大きさに対応した変化をするサブ音声画面表示が行われるように構成した請求項3に記載の装置。
【請求項5】
前記メイン音声ストリームおよび前記サブ音声ストリームはMPEGプログラムストリームを構成するエレメンタリストリームに対応し、このエレメンタリストリームを用いてオーディオおよびビデオのコンテンツが記録された光ディスクを再生するディスクドライブと、
前記オーディオおよびビデオのコンテンツに含まれるビデオデータのストリームをデコードするビデオデコード手段と、
前記ビデオデコード手段でデコードされたビデオデータと前記ミキシング調整可能通知手段による通知内容に対応する画像データとをブレンドするビデオブレンド手段と、
前記ビデオブレンド手段でブレンドされたビデオデータを画像表示装置に出力するビデオ出力手段とをさらに具備した請求項3または請求項4に記載の装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2009−15885(P2009−15885A)
【公開日】平成21年1月22日(2009.1.22)
【国際特許分類】
【出願番号】特願2007−173034(P2007−173034)
【出願日】平成19年6月29日(2007.6.29)
【出願人】(000003078)株式会社東芝 (54,554)
【Fターム(参考)】