字幕付き映像信号の遅延制御装置及び遅延制御プログラム
【課題】生字幕放送において映像と字幕を時間軸上で完全に同期させて再生することを可能とする。
【解決手段】字幕放送番組が入力された字幕データ抽出部61では、字幕信号を抽出する。映像信号は、映像固定遅延部62にて所定の固定遅延時間で遅延される。一方、字幕信号は、字幕可変遅延部65でその字幕信号に応じた可変遅延時間だけ遅延されて、字幕画面生成部64に送られる。画面合成部63では、映像固定遅延部62からの映像信号と、字幕画面生成部64からの字幕信号を合成して表示回路へ出力する。この結果、映像に同期した字幕の表示が可能となる。音声信号は音声可変遅延部67に入力され、映像信号の遅延時間と同じ時間だけ遅延されて、音声回路へ出力される。
【解決手段】字幕放送番組が入力された字幕データ抽出部61では、字幕信号を抽出する。映像信号は、映像固定遅延部62にて所定の固定遅延時間で遅延される。一方、字幕信号は、字幕可変遅延部65でその字幕信号に応じた可変遅延時間だけ遅延されて、字幕画面生成部64に送られる。画面合成部63では、映像固定遅延部62からの映像信号と、字幕画面生成部64からの字幕信号を合成して表示回路へ出力する。この結果、映像に同期した字幕の表示が可能となる。音声信号は音声可変遅延部67に入力され、映像信号の遅延時間と同じ時間だけ遅延されて、音声回路へ出力される。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、字幕放送などの字幕付き映像信号に基づいて、映像とその映像に対応する字幕とを時間的に同期させて再生する技術に関する。
【背景技術】
【0002】
ニュースなどの生のテレビ番組では、聴覚障害者向けサービスとして字幕を放送することが増えている。この「生」の字幕放送(「生字幕放送」、「リアルタイム字幕放送」などと呼ばれる。)では、時として映像に対して字幕が数秒〜数十秒遅れて放送され、視聴者が違和感を覚えることがある。
【0003】
アナログ放送では、映像信号の垂直帰線消去期間(VBI:Vertical Blanking Period)に字幕データを重畳している。通常の字幕付き録画番組では、予め字幕を制作しておき、映像と完全に合ったタイミングで字幕データをページ単位で送出することができる。一方、生字幕番組では、字幕の重畳が映像に対して遅れたタイミングで行われる。これは、放送局の字幕入力者が、放送される映像を見ながら字幕文をキー入力し、漢字変換、誤変換訂正などを行った後に初めて字幕を重畳するため、時間的に遅れが生じるからである(以下、この遅れを「字幕遅延」と呼ぶ。)。よって、字幕遅延が大きいと、視聴者は映像が切り替わってから数秒後に字幕を見ることになり、違和感を覚えることになる。
【0004】
このような字幕遅延を補償する手法が例えば特許文献1及び2に提案されている。
【0005】
【特許文献1】特開2004−215033号公報
【特許文献2】特開2004−207821号公報
【発明の開示】
【発明が解決しようとする課題】
【0006】
本発明は以上の点に鑑みてなされたものであり、生字幕放送において映像と字幕を時間軸上で完全に同期させて再生することを可能とする字幕付き映像信号の遅延制御装置及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0007】
本発明の1つの観点では、字幕付き映像信号の遅延制御装置は、字幕付き映像信号を受信する受信部と、前記字幕付き映像信号から、字幕信号を抽出する抽出部と、前記映像信号を所定の固定遅延時間で遅延させ、遅延映像信号を生成する映像遅延部と、前記字幕信号を、当該字幕信号に応じた可変遅延時間だけ遅延させ、遅延字幕信号を生成する字幕遅延部と、前記遅延映像信号及び前記遅延字幕信号を合成して、映像と字幕とが同期した字幕同期映像信号を生成する合成部と、を備えることを特徴とする。
【0008】
上記の遅延制御装置は、放送局から送信される字幕放送を受信する環境に配置され、例えばTV受信機やHDDレコーダなどに内蔵することができる。字幕放送番組の放送波に含まれる字幕付き映像信号は受信部により受信され、字幕信号が抽出される。映像信号は、所定の固定遅延時間で遅延される。一方、字幕信号は、その字幕信号に応じた可変遅延時間だけ遅延される。そして、遅延映像信号と遅延字幕信号を合成することにより、映像と字幕とが同期した字幕同期映像信号が生成される。
【0009】
上記の字幕付き映像信号の遅延制御装置の一態様では、前記字幕遅延部は、前記字幕付き映像信号中の映像信号に対する字幕信号の遅れ時間である字幕遅延時間に基づいて、前記可変遅延時間を決定する。生字幕放送では、字幕の入力作業などに要する時間分だけ、映像に対して字幕が遅れて送信される(字幕遅延時間)。ここで、映像と字幕との時間軸上の同期を確保する際には、字幕毎にその遅れ時間が異なる点が問題である。上記の遅延制御装置では、映像信号は一律に固定遅延時間だけ遅延し、字幕データはその字幕データ毎の字幕遅延時間に応じた可変遅延時間で遅延させるので、字幕データ毎に字幕遅延時間が異なる場合でも、映像と字幕とを確実に同期させて再生することが可能となる。
【0010】
好適な例では、前記字幕遅延部は、前記固定遅延時間から前記字幕遅延時間を減算することにより、前記可変遅延時間を算出する。これにより、単純な処理で可変遅延時間を算出することができる。
【0011】
上記の字幕付き映像信号の遅延制御装置の他の一態様では、前記字幕付き映像信号は、前記映像信号に対する前記字幕信号の入力開始タイミングを示す情報及び重畳タイミングを示す情報を含む遅延制御信号を有し、前記字幕遅延部は、前記遅延制御信号に基づいて、前記入力開始タイミングと前記重畳タイミングとの時間差を前記字幕遅延時間と決定する。これにより、字幕付き映像信号を作成する放送局側から与えられる遅延制御情報に基づいて、字幕遅延時間を正確に得ることができる。
【0012】
好適な例では、前記字幕信号の入力開始タイミングを示す情報は、透明字幕に対応する字幕信号中に含められる。透明字幕に対応する字幕信号を利用することにより、映像に影響を与えることなく、遅延制御信号を放送局側から遅延制御装置側へ伝送することが可能となる。
【0013】
上記の字幕付き映像信号の遅延制御装置の一態様では、前記固定遅延時間は、前記字幕付き映像信号に含まれる前記字幕信号の最大の字幕遅延時間よりも大きく設定される。これにより、字幕遅延時間の大小に拘わらず、確実に映像と字幕と時間軸上で同期させることが可能となる。
【0014】
上記の字幕付き映像信号の遅延制御装置の他の一態様では、前記受信部は、前記字幕付き映像信号に対応する音声信号を受信し、前記抽出部は、前記字幕信号の受信タイミングを検出し、前記字幕遅延部は、前記音声信号に基づいて字幕信号の入力開始タイミングを検出する検出部と、前記字幕信号の入力開始タイミング及び前記字幕信号の受信タイミングに基づいて前記字幕遅延時間を算出する字幕遅延時間算出部と、を備える。
【0015】
この態様では、遅延制御装置は、字幕付き映像信号に対応する音声信号を受信し、音声信号に基づいて字幕信号の入力開始タイミングを検出する。また、抽出部は字幕信号の受信タイミングを検出する。そして、字幕信号の入力開始タイミングと、字幕信号の受信タイミングとに基づいて字幕遅延時間が算出される。これによれば、放送局から送信される字幕付き映像信号中に、字幕遅延時間を算出するための遅延制御信号を含める必要がなくなり、受信側の遅延制御装置のみで字幕信号の遅延補償が可能となる。好適な例では、前記字幕遅延時間算出部は、前記字幕信号の入力開始タイミングと前記字幕信号の受信タイミングとの時間間隔を前記字幕遅延時間とする。
【0016】
上記の字幕付き映像信号の遅延制御装置の他の一態様では、前記字幕遅延部は、前記検出部が前記字幕信号の入力開始タイミングを検出できない場合には、所定のデフォルト字幕遅延時間を前記字幕遅延時間に設定する。これにより、例えば音声信号にノイズが多い場合や、メッセージ音声以外の信号が含まれる場合など、メッセージ音声の立上りを正確に検出できない場合であっても、ある程度の信頼性で遅延補償を行うことが可能となる。好適な例では、前記デフォルト字幕遅延時間は、前記字幕付き映像信号が構成する番組の開始からその時点までに算出された字幕遅延時間の平均値又は最頻値に相当する遅延時間、もしくは予め経験的に決定された平均的な字幕遅延時間とすることができる。
【0017】
上記の字幕付き映像信号の好適な実施例では、前記検出部は、前記音声信号を所定のスライスレベルでスライスしてスライス信号を生成する手段と、前記スライス信号に基づいて、前記音声信号の無音期間を検出する手段と、前記無音期間の終了時点を前記字幕信号の入力開始タイミングとして抽出する手段と、を備える。
【0018】
本発明の他の観点では、字幕付き映像/音声再生装置は、上記の字幕付き映像信号の遅延制御装置と、音声信号を受信し、前記固定遅延時間で遅延させて遅延音声信号を生成する音声遅延部と、前記字幕同期映像信号及び前記遅延音声信号を再生する再生部と、を備える。上記の字幕付き映像信号の遅延制御装置に加えて、音声信号を映像信号と同じ固定遅延時間で遅延させることにより、生字幕放送番組の字幕と映像及び音声とを同期再生することが可能な再生装置を提供することが可能となる。
【0019】
本発明の他の観点では、字幕付き映像信号の遅延制御プログラムは、コンピュータ端末により実行されることにより、前記コンピュータ端末を、字幕付き映像信号を受信する受信部と、前記字幕付き映像信号から、字幕信号を抽出する抽出部と、前記映像信号を所定の固定遅延時間で遅延させ、遅延映像信号を生成する映像遅延部と、前記字幕信号を、当該字幕信号に応じた可変遅延時間で遅延させ、遅延字幕信号を生成する字幕遅延部と、前記遅延映像信号及び前記遅延字幕信号を合成して、映像と字幕とが同期した字幕同期映像信号を生成する合成部として機能させる。
【0020】
上記のプログラムをコンピュータ上で実行することにより、本発明の字幕付き映像信号の遅延制御装置を実現することが可能となる。
【発明を実施するための最良の形態】
【0021】
以下、図面を参照して本発明の好適な実施形態について説明する。
【0022】
[第1実施形態]
(字幕放送システム)
図1に、本発明に係る字幕付き映像信号の遅延制御手法を適用した字幕放送システムの例を示す。図1では、放送局10がユーザ環境50に対して字幕テレビ放送を行っている。放送局10内では、字幕放送送出システム20が字幕付き映像信号を作成し、これを放送波40に乗せて送出する。ユーザ環境50では字幕遅延制御装置60が放送波40を受信し、字幕信号の遅延調整を行って、映像と字幕とが時間軸上で同期した字幕付き映像信号(「字幕同期映像信号」とも呼ぶ。)と、音声信号とを含む信号53を生成してTV受信機52へ供給する。TV受信機52は、字幕同期映像信号及び音声信号を再生する。これにより、ユーザは生字幕放送を、映像と字幕とが時間的に同期した状態で視聴することができる。
【0023】
(字幕遅延)
次に、生字幕放送において生じる字幕遅延について説明する。テレビ等の番組は、事前にVTRなどに収録したパッケージ番組と、ニュースなどの様に生放送の番組に大別される。これらの番組に字幕を付与する場合、パッケージ番組では、映像信号などと字幕信号を一緒にVTRなどに記録し放送する方法と、映像信号などをVTRなどに記録し、放送時に字幕信号を付加する方法があり、それらは共にパッケージ字幕放送番組である。また、ニュース番組など生放送の放送時に、リアルタイムで字幕を付加する生字幕(リアルタイム字幕)放送番組がある。
【0024】
生字幕放送番組の場合、TV映像の生放送中に、リアルタイムで字幕を生成し、TV映像に挿入して放送するため、字幕はTV映像の放送に対して時間的に遅れて表示されることになる。以下、生字幕放送における字幕送出の遅延について簡単に説明する。
【0025】
ニュースなどの生のテレビ番組で聴覚障害者向けサービスとして字幕を放送することが増えている。この生字幕放送では、時として映像に対して字幕が数秒〜数十秒遅れて放送されることがあり、この遅延が大きいと視聴者が違和感を覚えることがある。
【0026】
アナログ放送では、映像の垂直帰線消去期間(VBI)に字幕データを映像に合わせて重畳している。パッケージ字幕放送番組ではあらかじめ字幕を制作しておき、映像と完全に合ったタイミングで字幕データをページ単位で送出できるが、リアルタイム字幕番組では、図2に示すように字幕の重畳タイミングがリアルタイムでなく、若干遅れたタイミングで行われる。これは、放送局の字幕入力者が、放送される映像を見ながら字幕文をキー入力し、漢字変換、誤変換訂正などを行って字幕データを作成した後で、始めて字幕データを重畳するため、字幕データの送出が映像より遅れるのである。なお、図2において、字幕の入力開始タイミングと、対応する字幕データが重畳されるタイミングとのずれ、即ち、字幕遅延時間がΔTで示されている。映像カット毎に字幕の内容が異なり、それに応じて字幕データの作成に要する時間が異なるため、字幕遅延時間ΔTは映像カット毎に異なったものとなる(ΔT1〜ΔT3)。
【0027】
よって、例えばニュース番組の場合、アナウンサーがニュース記事を読んだときに、その内容を音声認識などにより取得して字幕を生成し、これをTV映像に付加するので、実際にはそのニュース項目に対応する映像及びアナウンサーの音声が終了し、次のニュース項目に移った頃に字幕が挿入されるということもある。
【0028】
なお、リアルタイム字幕の生成方法としては、アナウンサーの発声に基づいて音声認識を用いる音声認識方式や、放送音声を入力オペレータがキー入力することにより字幕を生成するキーボード方式などが知られている。
【0029】
このため、生字幕放送番組の字幕付き映像信号中では、映像(フレーム画像)の内容と字幕とが時間的に一致していない。即ち、ある映像に対応する字幕は、当該映像から時間的に数フレームから数百フレーム程度遅れたフレーム画像の信号中に含まれていることになる。
【0030】
このように、生字幕放送番組では、映像と字幕データとの間に字幕遅延が存在する。よって、受信機側で映像と字幕データを時間的に同期させて再生するためには、この字幕遅延を補償することが必要となる。即ち、字幕遅延時間ΔTの大きさを、受信機側に伝える必要がある。このため、本発明では、字幕付き映像信号中に、字幕遅延時間ΔTを得るために用いられる遅延制御信号を含める。図2に示すように、字幕遅延時間ΔTは、各映像において、字幕入力開始タイミングと、字幕重畳タイミングとの時間差である。従って、本発明では、字幕入力開始タイミングを示す制御フラグと、字幕重畳タイミングを示す制御フラグを含む遅延制御信号を、字幕付き映像信号中に設定する。
【0031】
まず、遅延制御信号の第1の設定例について説明する。第1の設定例は、図3に示すように、映像信号に対する通常字幕ページの前に新たに透明字幕ページを挿入する。そして、遅延制御情報として、透明字幕ページのページ管理情報には字幕入力開始タイミングを示す制御フラグを設定し、通常字幕ページのページ管理情報には字幕重畳タイミングを示す制御フラグを設定する。なお、透明字幕ページとは、表示文字の表示色と文字背景色を透明とすることにより、文字情報は送られるが、視聴者には見えないように意図されたページをいう。ここでは、各字幕ページのデータ先頭に配置されるページ管理情報の伝送が目的であるので、透明字幕ページにおける文字情報の内容は問わない。
【0032】
図4及び5に、第1の設定例による遅延制御情報の位置及び内容を示す。本例では、字幕付き映像信号は文字放送規格に従ったアナログTV映像信号であるものとする。アナログ字幕付き映像信号では、字幕データ及び字幕に関する情報はTV映像信号の垂直帰線期間(VBI)中に挿入される。本例では、特に制御信号は文字放送規格のうち、ページデータヘッダ(PACI)の「ページ提示デバイス(DB15)のうちのビット番号b5〜b8に設定されるものとする。
【0033】
図4に文字放送のページデータヘッダの構成を示す。文字放送データのうち、図4の最下段に示すデータグループ0〜3にはそれぞれヘッダ(H)21と、データグループデータ22と、CRCなどの情報23が含まれる。このうち、データグループ0中のデータグループデータ22は番組管理データに対応し、番組管理データは番組データヘッダ24及びデータユニット25を含む。一方、データグループ1及び2中のデータグループデータ22はページデータ中のページデータヘッダ26及びデータユニット27にそれぞれ対応する。
【0034】
ページデータ中のページデータヘッダ26は、データヘッダ識別31、データヘッダデータ長32及びデータヘッダデータ33を含む。データヘッダ識別31は情報分離符号DB8及びデータヘッダパラメータDB9を含む。一方、データヘッダデータ33は、図4の最上段に示すように、番組番号及びマガジン番号DB11〜ラスタ色及びヘッダラスタ色DB19の各種情報を含み、その中にページ提示デバイスDB15が含まれている。
【0035】
図5に、ページデータヘッダ26及びページ提示デバイスDB15の構成、並びに、制御フラグの例を示す。図示のように、ページ提示デバイスDB15はb1〜b8の8ビットを有し、b5〜b8の4ビットが本発明による遅延制御信号を設定するための制御ビットとして使用される。また、これらの制御ビットは、ページデータヘッダ中の番組形態DB14の制御ビット「b4」、「b3」がともに“1”(オン)である場合、つまり「“11”=字幕」である場合に有効となる。
【0036】
図5の最下段に制御ビットb5〜b8に設定される制御フラグの意味を示す。制御フラグ「0001」は字幕入力開始タイミングを示し、制御フラグ「0011」は字幕重畳タイミングを示す。なお、制御フラグ「0000」はリセットを意味し、上記以外の制御フラグは不使用に設定されている。
【0037】
受信機側では、字幕付き映像信号中に含まれるこれらの制御フラグを検出することにより、各映像(映像カット)毎の字幕遅延時間ΔTを算出することができる。具体的には、字幕入力開始タイミングを示す制御フラグ「0001」を検出してから、字幕重畳タイミングを示す制御フラグ「0011」を検出するまでの時間が、当該映像の字幕遅延時間ΔTとなる。
【0038】
次に、遅延制御情報の第2の設定例について説明する。上記の第1の設定例では、字幕入力開始タイミングを示す制御フラグをページ管理情報中の制御ビットに設定した。その代わりに、第2の設定例では、字幕入力開始タイミングを示す文字又は符号などを、透明字幕ページの字幕本文中に挿入する。透明字幕ページであるので、この文字又は符号などが表示されることはない。なお、字幕重畳タイミングを示す制御フラグは第1の設定例と同様に、通常字幕ページのページ管理情報中の制御ビットに設定する。
【0039】
第2の設定例の場合、受信機側では、透明字幕ページ中に挿入された、字幕入力開始タイミングを示す上記の文字又は符号を検出してから、通常字幕ページのページ管理情報中に設定された、字幕重畳タイミングを示す制御フラグを検出するまでの時間をカウントし、時間間隔を字幕遅延時間ΔTとする。
【0040】
(遅延制御)
次に、上記の字幕遅延時間ΔTを利用した遅延制御について説明する。字幕が映像より遅れて放送されるという問題を解決するには、放送側あるいは受信機側において映像の表示時間軸と字幕の表示時間軸をずらし、両者のタイミングを一致させればよい。このタイミング合わせのための処理は、基本的には放送局側及びユーザ環境(受信機側)のいずれにおいても実行することができる。放送局側のみで実施する場合、放送局内の字幕放送送出システムが映像信号を遅延させてそのタイミングを字幕に合わせ、放送すればよい。しかしながら、この手法は字幕を視聴する必要のない受信者にとっても生放送のメリットを減殺されることになり実現が困難である。そこで、本発明では、放送局側は遅延制御情報の送出のみ行い、ユーザ環境(受信機側)で遅延補償を行う方法を採用する。
【0041】
遅延制御により映像の表示時間軸と字幕の表示時間軸を合わせる場合、次の点が重要である。
1)遅延時間は字幕の内容や入力担当者の要約の仕方によってページごとに変動し一定ではないが、これに対して常に最適な遅延を与えることが要求されること。
2)遅延が必要な字幕番組(生字幕番組)と不必要な番組(パッケージ字幕番組)があるため、自動的にこれに対応できること。
【0042】
以下、これらの点を解決する方法の例を示す。図6は、字幕遅延の基本的な補償方法を示すブロック図である。字幕データ抽出部71は、入力された字幕付き映像信号Svcから字幕データを抽出し、字幕画面生成部74へ供給するとともに、字幕データ抽出後の映像信号を映像可変遅延部72へ供給する。字幕画面生成部74は字幕データを元に、字幕画面を生成する。一方、映像可変遅延部72は、入力された映像信号を字幕遅延時間ΔTに相当する時間だけ遅延させ、出力する。遅延時間信号Sdは、字幕遅延時間ΔTを示す信号である。画面合成部73は、映像可変遅延部72から与えられる映像信号と、字幕画面生成部74から与えられる字幕画面とを合成して表示回路へ供給する。また、音声信号Sacは、音声可変遅延部77により、遅延時間信号Sdに基づいて映像信号と同様に、字幕遅延時間ΔTに相当する時間だけ遅延させ、音声回路へ出力する。
【0043】
映像信号及び音声信号がアナログ信号である場合、可変遅延部はたとえばA/D変換、半導体メモリー、D/A変換の組み合わせにより実現可能である。字幕遅延時間ΔTは字幕ページごとに異なるが、遅延制御回路は、上述の遅延制御情報を検出することにより字幕ページ毎の字幕遅延時間ΔTを算出して遅延時間信号Sdを生成し、映像可変遅延部72及び音声可変遅延部77を制御する。こうして、映像信号及び音声信号は、字幕遅延時間ΔTに相当する時間だけ遅延させられ、字幕との時間軸上のタイミングが一致する。
【0044】
この方法は、受信機側で受信した字幕に合わせて必要な時間だけ映像信号と音声信号を遅らせるものであるが、字幕遅延時間ΔTが変化するたびに映像信号と音声信号の不連続が発生するという欠陥がある。
【0045】
図7は本発明の好適な実施形態に係る字幕遅延制御装置の構成を示す。この構成は図6に示した基本原理における欠陥を補った実現可能な方法である。なお、この字幕遅延制御装置は、コンピュータ上で動作する制御プログラムとして構成することが可能である。
【0046】
この字幕遅延制御装置では、映像信号と音声信号はあらかじめ字幕の最大遅延を見込んだ固定遅延(Dfix)が与えられ、これに対して字幕信号にはページ単位の可変遅延(Dvar)が与えられる。字幕信号に対する可変遅延時間は、Dvar=Dfix−ΔTで算出する。ΔTは各字幕ページ毎の字幕遅延時間である。この手法により、字幕ページ毎に字幕遅延時間が異なることに起因して映像及び音声の不連続が生じることが防止される。
【0047】
具体的には、図7において、字幕データ抽出部61は字幕付き映像信号Svcから字幕データを抽出して字幕可変遅延部65へ供給するとともに、字幕データ抽出後の映像信号を映像固定遅延部62へ供給する。映像固定遅延部62は、映像信号を予め決められた固定遅延時間Dfixだけ遅延し、画面合成部63へ供給する。
【0048】
一方、字幕可変遅延部65には、字幕遅延時間ΔTが与えられる。字幕可変遅延部65は、Dvar=Dfix−ΔTの式に基づいて、字幕ページ毎に可変遅延時間Dvarを算出し、その遅延時間Dvarだけ字幕データを遅延させて字幕画面生成部64へ出力する。字幕画面生成部64は、遅延された字幕データから字幕画面を生成し、画面合成部63へ供給する。画面合成部63は、固定遅延時間Dfixだけ遅延された映像信号と、可変遅延時間Dvarだけ遅延された字幕画面とを合成して表示回路へ出力する。なお、音声信号は、映像信号との同期を維持するため、音声可変遅延部67により映像信号と同様の固定遅延時間Dfixだけ遅延されて音声回路へ出力される。
【0049】
たとえば固定遅延時間Dfixを15秒に設定した字幕遅延制御装置で、字幕遅延時間ΔT=7秒遅れの生字幕ページを受信したとき、可変遅延時間Dvar=15−7=8(秒)にセットされる。従って、映像信号及び音声信号は15秒遅延されて再生されるのに対し、字幕は8秒遅れて再生される。これにより、字幕遅延時間ΔTが補償され、映像信号及び音声信号と字幕とが時間軸上で一致したタイミングで再生される。よって、この方法によれば番組の進行中、映像と音声の連続性は保たれ、字幕ページの遅延は認識されないので視聴上の違和感がない。但し、映像と音声の連続性を確保するためには、固定遅延時間Dfixを、放送局から送信される字幕付き映像信号における字幕遅延時間ΔTの最大値よりも大きく設定することが必要となる。
【0050】
字幕可変遅延部65が字幕データを遅延させる方法としては、例えば字幕データのデコード開始を字幕遅延時間ΔTだけ待たせる方法、デコードした字幕の画面へのスーパーインポーズを字幕遅延時間ΔTだけ待たせる方法、などがある。
【0051】
図7に示す字幕遅延制御装置60は、上記のように生字幕放送における字幕遅延を補償することに加えて、字幕遅延の無いパッケージ字幕番組を再生することも可能である。その場合には、字幕遅延時間ΔT=0であるから、全ての字幕ページで可変遅延時間Dvar=固定遅延時間Dfixとなる。即ち、字幕遅延制御装置60は、現在受信している字幕放送番組が生字幕放送番組である場合には、上述のように映像固定遅延部62、字幕可変遅延部65及び音声固定遅延部67による遅延を有効とする(以下、この状態を「遅延モード」と呼ぶ。)。一方、現在受信している字幕放送番組がパッケージ字幕放送番組である場合、映像固定遅延部62、字幕可変遅延部65及び音声固定遅延部67による遅延をゼロとする(以下、この状態を「非遅延モード」と呼ぶ。)。
【0052】
ただし、遅延モードと非遅延モードとの間の切り替えの際には、前述と同様に映像と音声の不連続が発生することには注意を要する。この対策としては、遅延モードへの切り替えを生字幕番組の入り口で行うか(「自動遅延モード」)、全番組を遅延モードで見る(「常時遅延モード」)か、などを視聴者が任意に選択できるように字幕遅延制御装置60を構成すればよい。好適な例としては、視聴者が任意に選択可能なモードとして、「常時遅延モード」、「自動遅延モード」および「遅延補償なし」を設け、ユーザに任意に設定させればよい。「常時遅延モード」では字幕なしの番組を含めて全番組を一定の時間だけ遅延して視聴することになる。この場合は字幕のタイミングだけが操作されるので映像・音声の不連続は一切起こらない。「自動遅延モード」では通常の字幕無し番組及びパッケージ字幕番組は遅延なしで視聴し、生字幕番組に入るときと出るときに自動的に映像・音声の不連続を許容した切り替えを行う。このときは受信者が文字放送の字幕の番組番号を選択したときに「入り」、字幕の番組番号から他の番組番号を選択したときに「出」に切り替えるのが適切な方法である。「遅延補償なし」ではこれらの動作をすべて停止して従来通りの受信形態をとる。即ち、字幕は映像に対して遅れて再生されることになる。
【0053】
遅延モードの自動切り替えは、上述した遅延制御情報を用いて行うことができる。すなわち、字幕遅延制御装置60は、透明字幕ページを受信したときに自動遅延モードへの「入り」の制御を行い。また、透明字幕ページの受信が一定のタイムアウト時間より長い間(例えば30秒)行われなかったときに、字幕遅延制御装置60は自動遅延モードからの「出」の制御を行う。これは通常の字幕番組で字幕送出の間隔が30秒以上になる例はほとんど無いことを利用している。
【0054】
なお、遅延モードへの「入り」の制御時には、固定遅延時間Dfixの期間にわたり映像及び音声が無くなるので、視聴者の不安を除くために、不連続対策として別途用意した字幕や音声でたとえば「字幕合わせの起動中です」というような告知を行うことが望ましい。また、同様に遅延モードからの「出」の瞬間には映像及び音声のスキップが生ずるので、「字幕合わせを終了中しました」などの告知を行うことが望ましい。
【0055】
(実施例)
図8に、上記の字幕遅延制御装置60の実施例を示す。本実施例による字幕遅延制御装置60aは、映像信号及び音声信号を遅延させるためにHDDレコーダを使用した例である。
【0056】
図8(a)は字幕遅延制御装置60aの構成を示す。放送局からの放送波から抽出されたRF信号Srfは、HDDレコーダ81及びアダプタ82へ入力される。HDDレコーダ81はRF信号Srf中の映像信号及び音声信号をそれぞれ固定遅延時間Dfixだけ遅延し、遅延した映像信号Vdをアダプタ82へ入力するとともに、遅延した音声信号AdをTV受信機52へ入力する。
【0057】
アダプタ82の構成を図8(b)に示す。アダプタ82内では、遅延制御フラグ抽出部92が映像信号中の字幕ページから図5に例示した制御フラグを抽出する。字幕遅延部93は、制御フラグに基づいて字幕遅延時間ΔTを算出し、それに基づいて可変遅延時間Dvarだけ字幕データを遅延させる。字幕デコード部94は、遅延された字幕データをデコードして字幕画面を生成する。字幕重畳部91は遅延された映像信号Vdに対して、遅延された字幕画面を重畳し、字幕付き映像信号VdcとしてTV受信機52へ供給する。TV受信機52は、入力された音声信号Ad及び字幕付き映像信号Vdcを再生する。なお、この構成では、TV受信機52には放送波の受信機能は不要であり、代わりに外部からの映像及び音声入力を再生可能な単なるモニタを使用してもよい。
【0058】
[第2実施形態]
上記の実施形態は、字幕付き映像信号がアナログTV映像信号である場合を示したが、字幕付き映像信号がデジタルTV映像信号である場合にも本発明を適用することができる。即ち、デジタル字幕放送番組についても、上述の固定遅延と可変遅延の組み合わせによる字幕遅延補償が実現可能である。
【0059】
デジタル字幕放送において、字幕入力開始タイミング及び字幕重畳タイミングを受信側に伝送し、受信側でその時間差として遅延時間を求める方法の例を2つ示す。
【0060】
第1の例は、アナログ放送の場合で説明したものと同じ制御フラグを新設する方法である。図9に、デジタルTV映像信号の場合の制御フラグの設定方法について説明する。ARIB標準規格では、字幕の伝送方法として、まずページ単位の字幕データを収容した字幕データユニットをデータグループとして構成し、これをデータバイトに収容したPES(Packetized Elementary Stream)としてTS(Transport Stream)に乗せて放送すると規定している。本発明の趣旨から、制御フラグは字幕ページ単位で伝送する必要があるが、1枚の字幕ページについて少なくとも1個のPESが生成されるので、制御フラグはPES内のどこかに収容するのが適当である。
【0061】
データグループからPESまでの階層構造と制御フラグの収容場所を図9に示す。図示のように、データグループ内には制御フラグの収容に適する場所が無いため、1つの方法では、PESヘッダ中の128バイトのプライベートデータ領域内に前述の4ビットの制御ビットを確保し、制御フラグを設定する。この領域は事業者が使用できるので最も好ましいと考えられる。但し、本発明による制御フラグの収容場所は、この例に限定されるものではない。
【0062】
具体的には、透明字幕ページのPESヘッダに字幕入力開始タイミングを示す制御フラグを収容し、通常字幕ページのPESヘッダには字幕重畳タイミングを示す制御フラグを収容して、ユーザ環境へ送信する。字幕遅延制御装置は、透明字幕ページ中の字幕入力開始タイミングを示す制御フラグを受信したら字幕遅延時間ΔTのカウントを開始し、次に通常字ページ中の字幕重畳タイミングを示す制御フラグを受信したらカウントを停止して字幕遅延時間ΔTを算出する。
【0063】
第2の例では、制御フラグを新設せず、字幕本文中に透明文字色を用いて字幕入力開始タイミングを示す文字又は記号などを記入する。透明字幕ページであるので、この文字又は符号などが表示されることはない。なお、字幕重畳タイミングを示す制御フラグは第1の例と同様に、通常字幕ページのPESヘッダ中の制御ビットに設定する。
【0064】
第2の設定例の場合、字幕遅延制御装置側では、透明字幕ページ中に挿入された、字幕入力開始タイミングを示す上記の文字又は符号を検出してから、通常字幕ページのPESヘッダ中に設定された、字幕重畳タイミングを示す制御フラグを検出するまでの時間をカウントし、字幕遅延時間ΔTとする。
【0065】
図10に、デジタル字幕放送の場合の字幕遅延制御装置の構成を示す。字幕遅延制御の手法は、上述のアナログ字幕放送の場合と基本的に同様である。なお、この字幕遅延制御装置は、コンピュータ上で動作する制御プログラムとして構成することが可能である。
【0066】
デジタル字幕放送のTSは映像信号、音声信号及び字幕PESを含んでおり、TS固定遅延部101及び字幕PES抽出部103へ供給される。TS固定遅延部101は、固定遅延Dfixを与え、遅延TSデータDtsdを映像/音声デコード部102へ供給する。映像/音声デコード部102は、映像データ及び音声データをそれぞれデコードし、固定遅延された音声データDadを音声回路へ供給するとともに、固定遅延された映像データDvdを画面合成部106へ供給する。
【0067】
字幕PES抽出部103はTSから字幕PESを抽出し、字幕データDcを字幕可変遅延部104へ供給する。字幕可変遅延部104は、上述のように制御フラグなどに基づいて得られた字幕遅延時間ΔTに基づいて可変遅延時間Dvarを算出し、その可変遅延時間だけ字幕データを遅延させて字幕データDcdとして字幕画面生成部105へ供給する。字幕画面生成部105は、字幕データDcdから字幕画面データDccを生成し、画面合成部106へ供給する。画面合成部106は、固定遅延時間Dfixだけ遅延された映像データDvdと、可変遅延時間Dvarだけ遅延された字幕画面とを合成し、表示回路へ供給する。こうして、音声、映像及び字幕が時間軸上で一致した状態で再生される。
【0068】
なお、TS固定遅延部101及び字幕可変遅延部104は、例えば半導体メモリを利用紙、それぞれFIFO(First in First Out)バッファとリングバッファを構成することにより実現することができる。また、映像、音声及び字幕のPESヘッダ拡張部のPTS(Presentation Time Stamp)を適切に設定することにより、字幕の可変遅延を実現することも可能である。
【0069】
[第3実施形態]
次に、本発明の第3実施形態について説明する。上記の第1及び第2実施形態では、放送局から送信される字幕付き映像信号に含まれる遅延制御情報に基づいて字幕遅延時間ΔTを算出している。即ち、放送局では、予め遅延制御情報を作成し、これを映像信号中に含めて送信する必要がある。これに対し、第3実施形態では、放送局は遅延制御情報を含まない通常の字幕付き映像信号を送信する。受信機側は、通常の字幕付き映像信号から自動的に字幕遅延時間ΔTを算出し、遅延補償を行う。
【0070】
(字幕遅延時間の自動算出)
以下、第3実施形態による字幕遅延時間ΔTの自動算出方法について説明する。図11は、字幕遅延時間の自動算出の原理を説明する図である。具体的に、図11は、放送中の映像の各シーン(場面)と、それらに対応するメッセージ音声と、字幕データの入力/受信タイミングとを示す。黒い太枠は各映像シーン201を示し、細い黒枠は映像に対応付けされたメッセージ音声202が1センテンスで時間的に連続している区間を示す。図示のように1つのメッセージ音声の開始時刻をta、終了時刻をtbとすると、字幕遅延時間ΔTは、ΔT=tb−taで得られる。なお、時間的に連続するメッセージ音声202の間を「段落」203と呼ぶ。また、白三角のマーク204は字幕データの入力開始タイミングを示し、黒三角のマーク205は字幕データの受信タイミング(=入力終了/送出タイミング)を示す。
【0071】
あるシーンの最初の字幕入力はメッセージ音声202の開始時刻taに開始され、メッセージ音声202の終了時刻tb(=段落の開始時刻)に終了する。なお、字幕の入力終了・送出が、メッセージ音声の終了を過ぎてから行われる場合もある。メッセージ音声が長い場合、数ページ分の字幕がまとめて入力される。図11のように、1つのシーン中に、段落203をはさんで複数のメッセージ音声202が存在することも多い。あるシーンが終了すると映像は次のシーンに移るが、通常はシーンの移行時にはメッセージ音声を理解しやすいように次のシーンのメッセージ音声までの時間間隔(段落)をやや長くとることが行われる(段落206を参照)。
【0072】
本実施形態では、このように段落の箇所でメッセージ音声が無音になった後、次のメッセージ音声の開始時刻ta(立ち上がり)を自動的に検出し、字幕の入力開始タイミングとする。また、その字幕データの入力が終了し、放送局から送出されて受信機に到着したときの時刻tbを字幕の終了タイミングとする。この両者の時間差から、字幕遅延時間ΔTはΔT=tb−taで算出される。例えばカウンタなどを用いて、字幕データの入力開始タイミングtaから、字幕データの受信タイミングtbまでの時間をカウントすることにより、字幕遅延時間ΔTを容易に得ることができる。
【0073】
なお、実際にはメッセージ音声が無音となった後、次のメッセージ音声の立上りで必ずしも字幕が挿入されるとは限らない。即ち、メッセージ音声が存在しても、それに対応する字幕が存在しない場合もある。この場合、あるメッセージ音声(n番目とする)の立上りが検出されてから、次のメッセージ音声(n+1番目とする)の立上りが検出されるまでの間に字幕データは放送局から送出されず、受信機側もそれを受信しないことになる。よって、受信機側は、次のメッセージ音声の立上りまでに字幕データを受信しなかった場合は、n番目のメッセージ音声の立上りタイミングtaを破棄し、n+1番目のメッセージ音声の立上りタイミングtaとそれに続く字幕データの受信タイミングtbから字幕遅延時間ΔTを算出すればよい。カウンタを用いる場合には、次のメッセージ音声の立上りまでに字幕データを受信しなかった場合、n番目のメッセージ音声の立上りタイミングtaに対応するカウント値をクリアすればよい。
【0074】
次に、メッセージ音声202の無音部分からメッセージ音声の立上りタイミングを自動検出する方法について、図12を参照して説明する。図12において、アナログ音声信号S1はメッセージ音声202の音声信号の波形を示している。なお、アナログ音声信号S1の波形は、その平均信号レベルを「0」として図示している。波形部分M1、M2はメッセージ音声に対応している。アナログ音声信号S1の振幅が大きいほどメッセージ音声の音量が大きく、波形が細かい(周波数が高い)ほどメッセージ音声の音は高い。
【0075】
いま、図示のように、メッセージ音声がM1の部分とM2の部分を有し、その間に段落に相当する無音期間Tdがあるとする。図示のように、通常、無音期間Td内にも多少のノイズが含まれている。よって、アナログ音声信号S1を、適切なスライスレベルLsでスライスし、スライス信号S2を生成する。スライスレベルLsは、アナログ音声信号S1の平均信号レベルに近く、かつ、ノイズレベルより高いレベルに予め決定される。スライス信号S2は、図示のように「0」と「1」の2値のパルス信号となる。このスライス信号S2には、メッセージ音声を構成する可聴周波数の周期に近い幅のパルスや、アナウンサーが呼吸を継ぐ短い無音期間、段落として挿入される比較的長い無音期間などを含んでいる。
【0076】
このスライス信号S2で、リトリガー(Re-Trigger)型ワンショットマルチバイブレータをトリガすることにより、スライス信号S2に含まれる周期の短いパルスを除去し、段落などの周期の長いパルスのみを残し、無音期間信号S3を生成する。無音期間信号S3は、ある時間幅以上の無音期間が「0」レベルとなり、それ以外の期間が「1」レベルとなる。なお、図12では、リトリガー型ワンショットマルチバイブレータのパルス幅が「τ」で示されており、このパルス幅τより短い幅のパルスが除去されている。
【0077】
次に、無音期間信号S3における「0」レベルから「1」レベルへの遷移点を別のモノマルチバイブレータにより抽出することにより、メッセージ立上り信号S4を得ることができる。メッセージ立上り信号S4に含まれるパルスPupの立上りは、メッセージ音声の立上り時刻taを示している。
【0078】
以上のようにして、メッセージ音声の開始時刻、即ち字幕データの入力開始タイミングtaが得られる。一方、受信機は、放送局から送出された字幕付き映像信号中の字幕データを受信した時刻を字幕データの受信タイミングtbとする。通常、字幕データは入力終了後直ちに放送局から送出され、受信機により受信されるので、字幕データの受信タイミングは、字幕データの入力終了タイミング及び送出タイミングと一致する。そして、受信機は、こうして得られた字幕データの入力開始タイミングta及び受信タイミングtbに基づいて、字幕遅延時間ΔTを算出する。
【0079】
本実施形態の方法では、放送局から送出される通常の字幕付き映像信号(即ち、第1及び第2実施形態に示す遅延制御情報を含まない字幕付き映像信号)に基づいて、受信機が自動的に字幕遅延時間ΔTを算出することができる。よって、放送局側で、遅延制御信号を字幕付き映像信号中に挿入するという特別な処理を要することなく、受信機側における字幕表示の遅延補償が可能となる。
【0080】
上記の字幕遅延時間の自動検出方法は、例えばニュース番組におけるアナウンサーのメッセージ音声のように、アナログ音声信号中の有音/無音の境界がはっきりしている場合に有効である。しかし、例えば背景音楽が流れている番組やノイズが多い環境などでは、背景音楽やノイズとメッセージ音声とが混在しており、無音期間の検出が困難な場合がある。そのような場合には、図12に示すメッセージ立上り信号S4を検出することができない状態で、受信機は字幕データを受信することになる。即ち、受信機は、字幕データの受信タイミングtbを得ることはできるが、字幕データの入力開始タイミングtaを得ることができない。この場合の対策としては、字幕遅延時間ΔTとして、当該番組の開始からその時点までに算出された各ページの字幕遅延時間ΔTの平均値又は最頻値に相当する遅延時間、もしくは予め経験的に決定された平均的な字幕遅延時間(以下、「デフォルト字幕遅延時間」とも呼ぶ。)を代わりに使用することができる。これにより、自動検出による無音期間の検出が困難な場合にも、ある程度自然なタイミングで字幕表示が可能となる。
【0081】
なお、このように字幕遅延時間を自動検出するか、デフォルト字幕遅延時間を使用するかは、ユーザの設定により選択可能としてもよいし、番組の種類毎に自動的に設定されるように機器を構成してもよい。
【0082】
図13に第3実施形態に係る字幕遅延制御装置の概略ブロック図を示す。字幕遅延制御装置60aは、図1に示すようにユーザ環境50内に設けられる。図示のように、字幕遅延制御装置60aは、映像固定遅延部121と、音声固定遅延部122と、画面合成部123と、字幕データ抽出部124と、音声立上り検出部125と、字幕遅延時間算出部126と、字幕可変遅延部127とを備える。
【0083】
字幕データ抽出部124は、字幕付き映像信号から字幕データを抽出して字幕可変遅延部127へ供給するとともに、字幕データの受信タイミング(tb)を字幕遅延時間算出部126へ供給する。また、字幕データ抽出後の映像信号を映像固定遅延部121へ供給する。映像固定遅延部121は、入力された映像信号を固定遅延時間Dfix遅延し、画面合成部123へ供給する。
【0084】
音声信号は音声固定遅延部122及び音声立上り検出部125へ入力される。音声固定遅延部122は、音声信号を固定遅延時間Dfix遅延させ、音声回路へ出力する。音声立上り検出部125は、上述のようにメッセージ音声の立上りを検出して字幕データの入力開始タイミングtaを取得し、字幕遅延時間算出部126へ供給する。字幕遅延時間算出部126は、字幕データ抽出部124から供給された字幕データの受信タイミングtb、及び、音声立上り検出部125から供給された入力開始タイミングtaに基づいて、字幕遅延時間ΔTを算出し、字幕可変遅延部127へ送る。
【0085】
字幕可変遅延部127は、字幕遅延時間ΔTと、予め決定されている固定遅延時間Dfixとに基づいて可変遅延時間Dvarを算出する。そして、字幕データ抽出部124から供給された字幕データを可変遅延時間Dvar遅延して画面合成部123へ供給する。画面合成部123は、可変遅延時間Dvar遅延された字幕データを、固定遅延時間Dfix遅延された映像信号に合成し、表示回路へ出力する。こうして、字幕の遅延補償が行われる。
【0086】
なお、デジタル放送の場合には、字幕データの受信タイミングは字幕PESのページデータ到着時刻から知ることもできる。また、デジタル放送の場合、映像固定遅延部121及び音声固定遅延部122は、映像・音声信号の代わりに、それらを伝送するMPEG2信号のPES又はTSを遅延してもよい。
【0087】
なお、字幕データを表示する上で重要な事項に、ある字幕の表示を開始するタイミングの他に、その表示を終了するタイミングがある。字幕の表示の終了方法としては2つある。第1の方法は、文字の無い画面を上書きする方法である。通常、各字幕は、次の字幕の到着したときに、その新しい字幕が表示される(即ち、字幕が更新される)。よって、次のページの字幕データが到着する前に古い字幕を意図的に消去したい場合には、文字無しの画面を上書き表示することにより古い字幕の表示を終了させることができる。第2の方法は、字幕表示を強制終了するための消去パケットを伝送する方法である。消去パケットとは、字幕表示を終了するための目的で送られる1ページ分のデータである。例えば民放の放送では、CMの開始前に字幕表示を強制終了する目的で消去パケットを使用することがある。
【0088】
本実施形態では、字幕表示の消去に第1の方法を使用する場合には、文字無し画面に対応するページの直前の通常ページにおいて検出された字幕データの入力開始タイミングtaから、当該文字無し画面に対応するページを受信した受信タイミングtbまでの時間を字幕遅延時間ΔTとすることにより、正しく文字画面の消去動作が実行される。
【0089】
一方、字幕表示の消去に第2の方法を使用する場合には、消去パケットを受信したときに字幕遅延時間ΔTを「0」に設定する。これにより、固定遅延時間と同じ遅延時間後、即ち、映像及び音声の表示終了時に字幕データも同時に消去されることとなるので、映像がCMなどに入る直前で正しく文字画面の消去動作が実行される。なお、消去パケットは文字データユニットを含まないパケットであるので、消去パケットであるか否かの判別は受信したパケット中の文字データユニットの有無により容易に行うことができる。
【0090】
(変形例)
上記の説明では、本実施形態による字幕遅延時間の自動検出手法を受信機側(ユーザ環境側)の装置に搭載する例を説明した。その代わりに、この自動検出手法を、放送局側の機器に搭載することも可能である。その場合には、放送局側で字幕遅延時間を自動検出し、それに基づいて第1及び第2実施形態のように遅延制御情報を生成して字幕付き映像信号中に挿入した上で送出することができる。
【図面の簡単な説明】
【0091】
【図1】本発明に係る字幕遅延制御装置を適用した環境の例を示す。
【図2】字幕の遅延を説明する図である。
【図3】遅延制御情報による字幕遅延時間の特定方法を概念的に示す図である。
【図4】字幕付き映像信号中における遅延制御情報の位置及び内容を示す。
【図5】字幕付き映像信号中における遅延制御情報の位置及び内容を示す。
【図6】字幕遅延の基本的な補償方法を示すブロック図である。
【図7】本発明の好適な実施形態に係る字幕遅延制御装置の構成を示す。
【図8】字幕遅延制御装置の実施例を示すブロック図である。
【図9】デジタルTV映像信号の場合の制御フラグの設定例を示す。
【図10】デジタル字幕放送に対応した字幕遅延制御装置の構成を示す。
【図11】第3実施形態による字幕遅延時間の自動算出の原理を説明する図である。
【図12】字幕データの入力開始タイミングの検出方法を説明する図である。
【図13】第3実施形態に係る字幕遅延制御装置の概略ブロック図を示す。
【符号の説明】
【0092】
10 放送局、
20 字幕放送送出システム、
40 放送波、
50 ユーザ環境、
52 TV受信機、
60、60a 字幕遅延制御装置
【技術分野】
【0001】
本発明は、字幕放送などの字幕付き映像信号に基づいて、映像とその映像に対応する字幕とを時間的に同期させて再生する技術に関する。
【背景技術】
【0002】
ニュースなどの生のテレビ番組では、聴覚障害者向けサービスとして字幕を放送することが増えている。この「生」の字幕放送(「生字幕放送」、「リアルタイム字幕放送」などと呼ばれる。)では、時として映像に対して字幕が数秒〜数十秒遅れて放送され、視聴者が違和感を覚えることがある。
【0003】
アナログ放送では、映像信号の垂直帰線消去期間(VBI:Vertical Blanking Period)に字幕データを重畳している。通常の字幕付き録画番組では、予め字幕を制作しておき、映像と完全に合ったタイミングで字幕データをページ単位で送出することができる。一方、生字幕番組では、字幕の重畳が映像に対して遅れたタイミングで行われる。これは、放送局の字幕入力者が、放送される映像を見ながら字幕文をキー入力し、漢字変換、誤変換訂正などを行った後に初めて字幕を重畳するため、時間的に遅れが生じるからである(以下、この遅れを「字幕遅延」と呼ぶ。)。よって、字幕遅延が大きいと、視聴者は映像が切り替わってから数秒後に字幕を見ることになり、違和感を覚えることになる。
【0004】
このような字幕遅延を補償する手法が例えば特許文献1及び2に提案されている。
【0005】
【特許文献1】特開2004−215033号公報
【特許文献2】特開2004−207821号公報
【発明の開示】
【発明が解決しようとする課題】
【0006】
本発明は以上の点に鑑みてなされたものであり、生字幕放送において映像と字幕を時間軸上で完全に同期させて再生することを可能とする字幕付き映像信号の遅延制御装置及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0007】
本発明の1つの観点では、字幕付き映像信号の遅延制御装置は、字幕付き映像信号を受信する受信部と、前記字幕付き映像信号から、字幕信号を抽出する抽出部と、前記映像信号を所定の固定遅延時間で遅延させ、遅延映像信号を生成する映像遅延部と、前記字幕信号を、当該字幕信号に応じた可変遅延時間だけ遅延させ、遅延字幕信号を生成する字幕遅延部と、前記遅延映像信号及び前記遅延字幕信号を合成して、映像と字幕とが同期した字幕同期映像信号を生成する合成部と、を備えることを特徴とする。
【0008】
上記の遅延制御装置は、放送局から送信される字幕放送を受信する環境に配置され、例えばTV受信機やHDDレコーダなどに内蔵することができる。字幕放送番組の放送波に含まれる字幕付き映像信号は受信部により受信され、字幕信号が抽出される。映像信号は、所定の固定遅延時間で遅延される。一方、字幕信号は、その字幕信号に応じた可変遅延時間だけ遅延される。そして、遅延映像信号と遅延字幕信号を合成することにより、映像と字幕とが同期した字幕同期映像信号が生成される。
【0009】
上記の字幕付き映像信号の遅延制御装置の一態様では、前記字幕遅延部は、前記字幕付き映像信号中の映像信号に対する字幕信号の遅れ時間である字幕遅延時間に基づいて、前記可変遅延時間を決定する。生字幕放送では、字幕の入力作業などに要する時間分だけ、映像に対して字幕が遅れて送信される(字幕遅延時間)。ここで、映像と字幕との時間軸上の同期を確保する際には、字幕毎にその遅れ時間が異なる点が問題である。上記の遅延制御装置では、映像信号は一律に固定遅延時間だけ遅延し、字幕データはその字幕データ毎の字幕遅延時間に応じた可変遅延時間で遅延させるので、字幕データ毎に字幕遅延時間が異なる場合でも、映像と字幕とを確実に同期させて再生することが可能となる。
【0010】
好適な例では、前記字幕遅延部は、前記固定遅延時間から前記字幕遅延時間を減算することにより、前記可変遅延時間を算出する。これにより、単純な処理で可変遅延時間を算出することができる。
【0011】
上記の字幕付き映像信号の遅延制御装置の他の一態様では、前記字幕付き映像信号は、前記映像信号に対する前記字幕信号の入力開始タイミングを示す情報及び重畳タイミングを示す情報を含む遅延制御信号を有し、前記字幕遅延部は、前記遅延制御信号に基づいて、前記入力開始タイミングと前記重畳タイミングとの時間差を前記字幕遅延時間と決定する。これにより、字幕付き映像信号を作成する放送局側から与えられる遅延制御情報に基づいて、字幕遅延時間を正確に得ることができる。
【0012】
好適な例では、前記字幕信号の入力開始タイミングを示す情報は、透明字幕に対応する字幕信号中に含められる。透明字幕に対応する字幕信号を利用することにより、映像に影響を与えることなく、遅延制御信号を放送局側から遅延制御装置側へ伝送することが可能となる。
【0013】
上記の字幕付き映像信号の遅延制御装置の一態様では、前記固定遅延時間は、前記字幕付き映像信号に含まれる前記字幕信号の最大の字幕遅延時間よりも大きく設定される。これにより、字幕遅延時間の大小に拘わらず、確実に映像と字幕と時間軸上で同期させることが可能となる。
【0014】
上記の字幕付き映像信号の遅延制御装置の他の一態様では、前記受信部は、前記字幕付き映像信号に対応する音声信号を受信し、前記抽出部は、前記字幕信号の受信タイミングを検出し、前記字幕遅延部は、前記音声信号に基づいて字幕信号の入力開始タイミングを検出する検出部と、前記字幕信号の入力開始タイミング及び前記字幕信号の受信タイミングに基づいて前記字幕遅延時間を算出する字幕遅延時間算出部と、を備える。
【0015】
この態様では、遅延制御装置は、字幕付き映像信号に対応する音声信号を受信し、音声信号に基づいて字幕信号の入力開始タイミングを検出する。また、抽出部は字幕信号の受信タイミングを検出する。そして、字幕信号の入力開始タイミングと、字幕信号の受信タイミングとに基づいて字幕遅延時間が算出される。これによれば、放送局から送信される字幕付き映像信号中に、字幕遅延時間を算出するための遅延制御信号を含める必要がなくなり、受信側の遅延制御装置のみで字幕信号の遅延補償が可能となる。好適な例では、前記字幕遅延時間算出部は、前記字幕信号の入力開始タイミングと前記字幕信号の受信タイミングとの時間間隔を前記字幕遅延時間とする。
【0016】
上記の字幕付き映像信号の遅延制御装置の他の一態様では、前記字幕遅延部は、前記検出部が前記字幕信号の入力開始タイミングを検出できない場合には、所定のデフォルト字幕遅延時間を前記字幕遅延時間に設定する。これにより、例えば音声信号にノイズが多い場合や、メッセージ音声以外の信号が含まれる場合など、メッセージ音声の立上りを正確に検出できない場合であっても、ある程度の信頼性で遅延補償を行うことが可能となる。好適な例では、前記デフォルト字幕遅延時間は、前記字幕付き映像信号が構成する番組の開始からその時点までに算出された字幕遅延時間の平均値又は最頻値に相当する遅延時間、もしくは予め経験的に決定された平均的な字幕遅延時間とすることができる。
【0017】
上記の字幕付き映像信号の好適な実施例では、前記検出部は、前記音声信号を所定のスライスレベルでスライスしてスライス信号を生成する手段と、前記スライス信号に基づいて、前記音声信号の無音期間を検出する手段と、前記無音期間の終了時点を前記字幕信号の入力開始タイミングとして抽出する手段と、を備える。
【0018】
本発明の他の観点では、字幕付き映像/音声再生装置は、上記の字幕付き映像信号の遅延制御装置と、音声信号を受信し、前記固定遅延時間で遅延させて遅延音声信号を生成する音声遅延部と、前記字幕同期映像信号及び前記遅延音声信号を再生する再生部と、を備える。上記の字幕付き映像信号の遅延制御装置に加えて、音声信号を映像信号と同じ固定遅延時間で遅延させることにより、生字幕放送番組の字幕と映像及び音声とを同期再生することが可能な再生装置を提供することが可能となる。
【0019】
本発明の他の観点では、字幕付き映像信号の遅延制御プログラムは、コンピュータ端末により実行されることにより、前記コンピュータ端末を、字幕付き映像信号を受信する受信部と、前記字幕付き映像信号から、字幕信号を抽出する抽出部と、前記映像信号を所定の固定遅延時間で遅延させ、遅延映像信号を生成する映像遅延部と、前記字幕信号を、当該字幕信号に応じた可変遅延時間で遅延させ、遅延字幕信号を生成する字幕遅延部と、前記遅延映像信号及び前記遅延字幕信号を合成して、映像と字幕とが同期した字幕同期映像信号を生成する合成部として機能させる。
【0020】
上記のプログラムをコンピュータ上で実行することにより、本発明の字幕付き映像信号の遅延制御装置を実現することが可能となる。
【発明を実施するための最良の形態】
【0021】
以下、図面を参照して本発明の好適な実施形態について説明する。
【0022】
[第1実施形態]
(字幕放送システム)
図1に、本発明に係る字幕付き映像信号の遅延制御手法を適用した字幕放送システムの例を示す。図1では、放送局10がユーザ環境50に対して字幕テレビ放送を行っている。放送局10内では、字幕放送送出システム20が字幕付き映像信号を作成し、これを放送波40に乗せて送出する。ユーザ環境50では字幕遅延制御装置60が放送波40を受信し、字幕信号の遅延調整を行って、映像と字幕とが時間軸上で同期した字幕付き映像信号(「字幕同期映像信号」とも呼ぶ。)と、音声信号とを含む信号53を生成してTV受信機52へ供給する。TV受信機52は、字幕同期映像信号及び音声信号を再生する。これにより、ユーザは生字幕放送を、映像と字幕とが時間的に同期した状態で視聴することができる。
【0023】
(字幕遅延)
次に、生字幕放送において生じる字幕遅延について説明する。テレビ等の番組は、事前にVTRなどに収録したパッケージ番組と、ニュースなどの様に生放送の番組に大別される。これらの番組に字幕を付与する場合、パッケージ番組では、映像信号などと字幕信号を一緒にVTRなどに記録し放送する方法と、映像信号などをVTRなどに記録し、放送時に字幕信号を付加する方法があり、それらは共にパッケージ字幕放送番組である。また、ニュース番組など生放送の放送時に、リアルタイムで字幕を付加する生字幕(リアルタイム字幕)放送番組がある。
【0024】
生字幕放送番組の場合、TV映像の生放送中に、リアルタイムで字幕を生成し、TV映像に挿入して放送するため、字幕はTV映像の放送に対して時間的に遅れて表示されることになる。以下、生字幕放送における字幕送出の遅延について簡単に説明する。
【0025】
ニュースなどの生のテレビ番組で聴覚障害者向けサービスとして字幕を放送することが増えている。この生字幕放送では、時として映像に対して字幕が数秒〜数十秒遅れて放送されることがあり、この遅延が大きいと視聴者が違和感を覚えることがある。
【0026】
アナログ放送では、映像の垂直帰線消去期間(VBI)に字幕データを映像に合わせて重畳している。パッケージ字幕放送番組ではあらかじめ字幕を制作しておき、映像と完全に合ったタイミングで字幕データをページ単位で送出できるが、リアルタイム字幕番組では、図2に示すように字幕の重畳タイミングがリアルタイムでなく、若干遅れたタイミングで行われる。これは、放送局の字幕入力者が、放送される映像を見ながら字幕文をキー入力し、漢字変換、誤変換訂正などを行って字幕データを作成した後で、始めて字幕データを重畳するため、字幕データの送出が映像より遅れるのである。なお、図2において、字幕の入力開始タイミングと、対応する字幕データが重畳されるタイミングとのずれ、即ち、字幕遅延時間がΔTで示されている。映像カット毎に字幕の内容が異なり、それに応じて字幕データの作成に要する時間が異なるため、字幕遅延時間ΔTは映像カット毎に異なったものとなる(ΔT1〜ΔT3)。
【0027】
よって、例えばニュース番組の場合、アナウンサーがニュース記事を読んだときに、その内容を音声認識などにより取得して字幕を生成し、これをTV映像に付加するので、実際にはそのニュース項目に対応する映像及びアナウンサーの音声が終了し、次のニュース項目に移った頃に字幕が挿入されるということもある。
【0028】
なお、リアルタイム字幕の生成方法としては、アナウンサーの発声に基づいて音声認識を用いる音声認識方式や、放送音声を入力オペレータがキー入力することにより字幕を生成するキーボード方式などが知られている。
【0029】
このため、生字幕放送番組の字幕付き映像信号中では、映像(フレーム画像)の内容と字幕とが時間的に一致していない。即ち、ある映像に対応する字幕は、当該映像から時間的に数フレームから数百フレーム程度遅れたフレーム画像の信号中に含まれていることになる。
【0030】
このように、生字幕放送番組では、映像と字幕データとの間に字幕遅延が存在する。よって、受信機側で映像と字幕データを時間的に同期させて再生するためには、この字幕遅延を補償することが必要となる。即ち、字幕遅延時間ΔTの大きさを、受信機側に伝える必要がある。このため、本発明では、字幕付き映像信号中に、字幕遅延時間ΔTを得るために用いられる遅延制御信号を含める。図2に示すように、字幕遅延時間ΔTは、各映像において、字幕入力開始タイミングと、字幕重畳タイミングとの時間差である。従って、本発明では、字幕入力開始タイミングを示す制御フラグと、字幕重畳タイミングを示す制御フラグを含む遅延制御信号を、字幕付き映像信号中に設定する。
【0031】
まず、遅延制御信号の第1の設定例について説明する。第1の設定例は、図3に示すように、映像信号に対する通常字幕ページの前に新たに透明字幕ページを挿入する。そして、遅延制御情報として、透明字幕ページのページ管理情報には字幕入力開始タイミングを示す制御フラグを設定し、通常字幕ページのページ管理情報には字幕重畳タイミングを示す制御フラグを設定する。なお、透明字幕ページとは、表示文字の表示色と文字背景色を透明とすることにより、文字情報は送られるが、視聴者には見えないように意図されたページをいう。ここでは、各字幕ページのデータ先頭に配置されるページ管理情報の伝送が目的であるので、透明字幕ページにおける文字情報の内容は問わない。
【0032】
図4及び5に、第1の設定例による遅延制御情報の位置及び内容を示す。本例では、字幕付き映像信号は文字放送規格に従ったアナログTV映像信号であるものとする。アナログ字幕付き映像信号では、字幕データ及び字幕に関する情報はTV映像信号の垂直帰線期間(VBI)中に挿入される。本例では、特に制御信号は文字放送規格のうち、ページデータヘッダ(PACI)の「ページ提示デバイス(DB15)のうちのビット番号b5〜b8に設定されるものとする。
【0033】
図4に文字放送のページデータヘッダの構成を示す。文字放送データのうち、図4の最下段に示すデータグループ0〜3にはそれぞれヘッダ(H)21と、データグループデータ22と、CRCなどの情報23が含まれる。このうち、データグループ0中のデータグループデータ22は番組管理データに対応し、番組管理データは番組データヘッダ24及びデータユニット25を含む。一方、データグループ1及び2中のデータグループデータ22はページデータ中のページデータヘッダ26及びデータユニット27にそれぞれ対応する。
【0034】
ページデータ中のページデータヘッダ26は、データヘッダ識別31、データヘッダデータ長32及びデータヘッダデータ33を含む。データヘッダ識別31は情報分離符号DB8及びデータヘッダパラメータDB9を含む。一方、データヘッダデータ33は、図4の最上段に示すように、番組番号及びマガジン番号DB11〜ラスタ色及びヘッダラスタ色DB19の各種情報を含み、その中にページ提示デバイスDB15が含まれている。
【0035】
図5に、ページデータヘッダ26及びページ提示デバイスDB15の構成、並びに、制御フラグの例を示す。図示のように、ページ提示デバイスDB15はb1〜b8の8ビットを有し、b5〜b8の4ビットが本発明による遅延制御信号を設定するための制御ビットとして使用される。また、これらの制御ビットは、ページデータヘッダ中の番組形態DB14の制御ビット「b4」、「b3」がともに“1”(オン)である場合、つまり「“11”=字幕」である場合に有効となる。
【0036】
図5の最下段に制御ビットb5〜b8に設定される制御フラグの意味を示す。制御フラグ「0001」は字幕入力開始タイミングを示し、制御フラグ「0011」は字幕重畳タイミングを示す。なお、制御フラグ「0000」はリセットを意味し、上記以外の制御フラグは不使用に設定されている。
【0037】
受信機側では、字幕付き映像信号中に含まれるこれらの制御フラグを検出することにより、各映像(映像カット)毎の字幕遅延時間ΔTを算出することができる。具体的には、字幕入力開始タイミングを示す制御フラグ「0001」を検出してから、字幕重畳タイミングを示す制御フラグ「0011」を検出するまでの時間が、当該映像の字幕遅延時間ΔTとなる。
【0038】
次に、遅延制御情報の第2の設定例について説明する。上記の第1の設定例では、字幕入力開始タイミングを示す制御フラグをページ管理情報中の制御ビットに設定した。その代わりに、第2の設定例では、字幕入力開始タイミングを示す文字又は符号などを、透明字幕ページの字幕本文中に挿入する。透明字幕ページであるので、この文字又は符号などが表示されることはない。なお、字幕重畳タイミングを示す制御フラグは第1の設定例と同様に、通常字幕ページのページ管理情報中の制御ビットに設定する。
【0039】
第2の設定例の場合、受信機側では、透明字幕ページ中に挿入された、字幕入力開始タイミングを示す上記の文字又は符号を検出してから、通常字幕ページのページ管理情報中に設定された、字幕重畳タイミングを示す制御フラグを検出するまでの時間をカウントし、時間間隔を字幕遅延時間ΔTとする。
【0040】
(遅延制御)
次に、上記の字幕遅延時間ΔTを利用した遅延制御について説明する。字幕が映像より遅れて放送されるという問題を解決するには、放送側あるいは受信機側において映像の表示時間軸と字幕の表示時間軸をずらし、両者のタイミングを一致させればよい。このタイミング合わせのための処理は、基本的には放送局側及びユーザ環境(受信機側)のいずれにおいても実行することができる。放送局側のみで実施する場合、放送局内の字幕放送送出システムが映像信号を遅延させてそのタイミングを字幕に合わせ、放送すればよい。しかしながら、この手法は字幕を視聴する必要のない受信者にとっても生放送のメリットを減殺されることになり実現が困難である。そこで、本発明では、放送局側は遅延制御情報の送出のみ行い、ユーザ環境(受信機側)で遅延補償を行う方法を採用する。
【0041】
遅延制御により映像の表示時間軸と字幕の表示時間軸を合わせる場合、次の点が重要である。
1)遅延時間は字幕の内容や入力担当者の要約の仕方によってページごとに変動し一定ではないが、これに対して常に最適な遅延を与えることが要求されること。
2)遅延が必要な字幕番組(生字幕番組)と不必要な番組(パッケージ字幕番組)があるため、自動的にこれに対応できること。
【0042】
以下、これらの点を解決する方法の例を示す。図6は、字幕遅延の基本的な補償方法を示すブロック図である。字幕データ抽出部71は、入力された字幕付き映像信号Svcから字幕データを抽出し、字幕画面生成部74へ供給するとともに、字幕データ抽出後の映像信号を映像可変遅延部72へ供給する。字幕画面生成部74は字幕データを元に、字幕画面を生成する。一方、映像可変遅延部72は、入力された映像信号を字幕遅延時間ΔTに相当する時間だけ遅延させ、出力する。遅延時間信号Sdは、字幕遅延時間ΔTを示す信号である。画面合成部73は、映像可変遅延部72から与えられる映像信号と、字幕画面生成部74から与えられる字幕画面とを合成して表示回路へ供給する。また、音声信号Sacは、音声可変遅延部77により、遅延時間信号Sdに基づいて映像信号と同様に、字幕遅延時間ΔTに相当する時間だけ遅延させ、音声回路へ出力する。
【0043】
映像信号及び音声信号がアナログ信号である場合、可変遅延部はたとえばA/D変換、半導体メモリー、D/A変換の組み合わせにより実現可能である。字幕遅延時間ΔTは字幕ページごとに異なるが、遅延制御回路は、上述の遅延制御情報を検出することにより字幕ページ毎の字幕遅延時間ΔTを算出して遅延時間信号Sdを生成し、映像可変遅延部72及び音声可変遅延部77を制御する。こうして、映像信号及び音声信号は、字幕遅延時間ΔTに相当する時間だけ遅延させられ、字幕との時間軸上のタイミングが一致する。
【0044】
この方法は、受信機側で受信した字幕に合わせて必要な時間だけ映像信号と音声信号を遅らせるものであるが、字幕遅延時間ΔTが変化するたびに映像信号と音声信号の不連続が発生するという欠陥がある。
【0045】
図7は本発明の好適な実施形態に係る字幕遅延制御装置の構成を示す。この構成は図6に示した基本原理における欠陥を補った実現可能な方法である。なお、この字幕遅延制御装置は、コンピュータ上で動作する制御プログラムとして構成することが可能である。
【0046】
この字幕遅延制御装置では、映像信号と音声信号はあらかじめ字幕の最大遅延を見込んだ固定遅延(Dfix)が与えられ、これに対して字幕信号にはページ単位の可変遅延(Dvar)が与えられる。字幕信号に対する可変遅延時間は、Dvar=Dfix−ΔTで算出する。ΔTは各字幕ページ毎の字幕遅延時間である。この手法により、字幕ページ毎に字幕遅延時間が異なることに起因して映像及び音声の不連続が生じることが防止される。
【0047】
具体的には、図7において、字幕データ抽出部61は字幕付き映像信号Svcから字幕データを抽出して字幕可変遅延部65へ供給するとともに、字幕データ抽出後の映像信号を映像固定遅延部62へ供給する。映像固定遅延部62は、映像信号を予め決められた固定遅延時間Dfixだけ遅延し、画面合成部63へ供給する。
【0048】
一方、字幕可変遅延部65には、字幕遅延時間ΔTが与えられる。字幕可変遅延部65は、Dvar=Dfix−ΔTの式に基づいて、字幕ページ毎に可変遅延時間Dvarを算出し、その遅延時間Dvarだけ字幕データを遅延させて字幕画面生成部64へ出力する。字幕画面生成部64は、遅延された字幕データから字幕画面を生成し、画面合成部63へ供給する。画面合成部63は、固定遅延時間Dfixだけ遅延された映像信号と、可変遅延時間Dvarだけ遅延された字幕画面とを合成して表示回路へ出力する。なお、音声信号は、映像信号との同期を維持するため、音声可変遅延部67により映像信号と同様の固定遅延時間Dfixだけ遅延されて音声回路へ出力される。
【0049】
たとえば固定遅延時間Dfixを15秒に設定した字幕遅延制御装置で、字幕遅延時間ΔT=7秒遅れの生字幕ページを受信したとき、可変遅延時間Dvar=15−7=8(秒)にセットされる。従って、映像信号及び音声信号は15秒遅延されて再生されるのに対し、字幕は8秒遅れて再生される。これにより、字幕遅延時間ΔTが補償され、映像信号及び音声信号と字幕とが時間軸上で一致したタイミングで再生される。よって、この方法によれば番組の進行中、映像と音声の連続性は保たれ、字幕ページの遅延は認識されないので視聴上の違和感がない。但し、映像と音声の連続性を確保するためには、固定遅延時間Dfixを、放送局から送信される字幕付き映像信号における字幕遅延時間ΔTの最大値よりも大きく設定することが必要となる。
【0050】
字幕可変遅延部65が字幕データを遅延させる方法としては、例えば字幕データのデコード開始を字幕遅延時間ΔTだけ待たせる方法、デコードした字幕の画面へのスーパーインポーズを字幕遅延時間ΔTだけ待たせる方法、などがある。
【0051】
図7に示す字幕遅延制御装置60は、上記のように生字幕放送における字幕遅延を補償することに加えて、字幕遅延の無いパッケージ字幕番組を再生することも可能である。その場合には、字幕遅延時間ΔT=0であるから、全ての字幕ページで可変遅延時間Dvar=固定遅延時間Dfixとなる。即ち、字幕遅延制御装置60は、現在受信している字幕放送番組が生字幕放送番組である場合には、上述のように映像固定遅延部62、字幕可変遅延部65及び音声固定遅延部67による遅延を有効とする(以下、この状態を「遅延モード」と呼ぶ。)。一方、現在受信している字幕放送番組がパッケージ字幕放送番組である場合、映像固定遅延部62、字幕可変遅延部65及び音声固定遅延部67による遅延をゼロとする(以下、この状態を「非遅延モード」と呼ぶ。)。
【0052】
ただし、遅延モードと非遅延モードとの間の切り替えの際には、前述と同様に映像と音声の不連続が発生することには注意を要する。この対策としては、遅延モードへの切り替えを生字幕番組の入り口で行うか(「自動遅延モード」)、全番組を遅延モードで見る(「常時遅延モード」)か、などを視聴者が任意に選択できるように字幕遅延制御装置60を構成すればよい。好適な例としては、視聴者が任意に選択可能なモードとして、「常時遅延モード」、「自動遅延モード」および「遅延補償なし」を設け、ユーザに任意に設定させればよい。「常時遅延モード」では字幕なしの番組を含めて全番組を一定の時間だけ遅延して視聴することになる。この場合は字幕のタイミングだけが操作されるので映像・音声の不連続は一切起こらない。「自動遅延モード」では通常の字幕無し番組及びパッケージ字幕番組は遅延なしで視聴し、生字幕番組に入るときと出るときに自動的に映像・音声の不連続を許容した切り替えを行う。このときは受信者が文字放送の字幕の番組番号を選択したときに「入り」、字幕の番組番号から他の番組番号を選択したときに「出」に切り替えるのが適切な方法である。「遅延補償なし」ではこれらの動作をすべて停止して従来通りの受信形態をとる。即ち、字幕は映像に対して遅れて再生されることになる。
【0053】
遅延モードの自動切り替えは、上述した遅延制御情報を用いて行うことができる。すなわち、字幕遅延制御装置60は、透明字幕ページを受信したときに自動遅延モードへの「入り」の制御を行い。また、透明字幕ページの受信が一定のタイムアウト時間より長い間(例えば30秒)行われなかったときに、字幕遅延制御装置60は自動遅延モードからの「出」の制御を行う。これは通常の字幕番組で字幕送出の間隔が30秒以上になる例はほとんど無いことを利用している。
【0054】
なお、遅延モードへの「入り」の制御時には、固定遅延時間Dfixの期間にわたり映像及び音声が無くなるので、視聴者の不安を除くために、不連続対策として別途用意した字幕や音声でたとえば「字幕合わせの起動中です」というような告知を行うことが望ましい。また、同様に遅延モードからの「出」の瞬間には映像及び音声のスキップが生ずるので、「字幕合わせを終了中しました」などの告知を行うことが望ましい。
【0055】
(実施例)
図8に、上記の字幕遅延制御装置60の実施例を示す。本実施例による字幕遅延制御装置60aは、映像信号及び音声信号を遅延させるためにHDDレコーダを使用した例である。
【0056】
図8(a)は字幕遅延制御装置60aの構成を示す。放送局からの放送波から抽出されたRF信号Srfは、HDDレコーダ81及びアダプタ82へ入力される。HDDレコーダ81はRF信号Srf中の映像信号及び音声信号をそれぞれ固定遅延時間Dfixだけ遅延し、遅延した映像信号Vdをアダプタ82へ入力するとともに、遅延した音声信号AdをTV受信機52へ入力する。
【0057】
アダプタ82の構成を図8(b)に示す。アダプタ82内では、遅延制御フラグ抽出部92が映像信号中の字幕ページから図5に例示した制御フラグを抽出する。字幕遅延部93は、制御フラグに基づいて字幕遅延時間ΔTを算出し、それに基づいて可変遅延時間Dvarだけ字幕データを遅延させる。字幕デコード部94は、遅延された字幕データをデコードして字幕画面を生成する。字幕重畳部91は遅延された映像信号Vdに対して、遅延された字幕画面を重畳し、字幕付き映像信号VdcとしてTV受信機52へ供給する。TV受信機52は、入力された音声信号Ad及び字幕付き映像信号Vdcを再生する。なお、この構成では、TV受信機52には放送波の受信機能は不要であり、代わりに外部からの映像及び音声入力を再生可能な単なるモニタを使用してもよい。
【0058】
[第2実施形態]
上記の実施形態は、字幕付き映像信号がアナログTV映像信号である場合を示したが、字幕付き映像信号がデジタルTV映像信号である場合にも本発明を適用することができる。即ち、デジタル字幕放送番組についても、上述の固定遅延と可変遅延の組み合わせによる字幕遅延補償が実現可能である。
【0059】
デジタル字幕放送において、字幕入力開始タイミング及び字幕重畳タイミングを受信側に伝送し、受信側でその時間差として遅延時間を求める方法の例を2つ示す。
【0060】
第1の例は、アナログ放送の場合で説明したものと同じ制御フラグを新設する方法である。図9に、デジタルTV映像信号の場合の制御フラグの設定方法について説明する。ARIB標準規格では、字幕の伝送方法として、まずページ単位の字幕データを収容した字幕データユニットをデータグループとして構成し、これをデータバイトに収容したPES(Packetized Elementary Stream)としてTS(Transport Stream)に乗せて放送すると規定している。本発明の趣旨から、制御フラグは字幕ページ単位で伝送する必要があるが、1枚の字幕ページについて少なくとも1個のPESが生成されるので、制御フラグはPES内のどこかに収容するのが適当である。
【0061】
データグループからPESまでの階層構造と制御フラグの収容場所を図9に示す。図示のように、データグループ内には制御フラグの収容に適する場所が無いため、1つの方法では、PESヘッダ中の128バイトのプライベートデータ領域内に前述の4ビットの制御ビットを確保し、制御フラグを設定する。この領域は事業者が使用できるので最も好ましいと考えられる。但し、本発明による制御フラグの収容場所は、この例に限定されるものではない。
【0062】
具体的には、透明字幕ページのPESヘッダに字幕入力開始タイミングを示す制御フラグを収容し、通常字幕ページのPESヘッダには字幕重畳タイミングを示す制御フラグを収容して、ユーザ環境へ送信する。字幕遅延制御装置は、透明字幕ページ中の字幕入力開始タイミングを示す制御フラグを受信したら字幕遅延時間ΔTのカウントを開始し、次に通常字ページ中の字幕重畳タイミングを示す制御フラグを受信したらカウントを停止して字幕遅延時間ΔTを算出する。
【0063】
第2の例では、制御フラグを新設せず、字幕本文中に透明文字色を用いて字幕入力開始タイミングを示す文字又は記号などを記入する。透明字幕ページであるので、この文字又は符号などが表示されることはない。なお、字幕重畳タイミングを示す制御フラグは第1の例と同様に、通常字幕ページのPESヘッダ中の制御ビットに設定する。
【0064】
第2の設定例の場合、字幕遅延制御装置側では、透明字幕ページ中に挿入された、字幕入力開始タイミングを示す上記の文字又は符号を検出してから、通常字幕ページのPESヘッダ中に設定された、字幕重畳タイミングを示す制御フラグを検出するまでの時間をカウントし、字幕遅延時間ΔTとする。
【0065】
図10に、デジタル字幕放送の場合の字幕遅延制御装置の構成を示す。字幕遅延制御の手法は、上述のアナログ字幕放送の場合と基本的に同様である。なお、この字幕遅延制御装置は、コンピュータ上で動作する制御プログラムとして構成することが可能である。
【0066】
デジタル字幕放送のTSは映像信号、音声信号及び字幕PESを含んでおり、TS固定遅延部101及び字幕PES抽出部103へ供給される。TS固定遅延部101は、固定遅延Dfixを与え、遅延TSデータDtsdを映像/音声デコード部102へ供給する。映像/音声デコード部102は、映像データ及び音声データをそれぞれデコードし、固定遅延された音声データDadを音声回路へ供給するとともに、固定遅延された映像データDvdを画面合成部106へ供給する。
【0067】
字幕PES抽出部103はTSから字幕PESを抽出し、字幕データDcを字幕可変遅延部104へ供給する。字幕可変遅延部104は、上述のように制御フラグなどに基づいて得られた字幕遅延時間ΔTに基づいて可変遅延時間Dvarを算出し、その可変遅延時間だけ字幕データを遅延させて字幕データDcdとして字幕画面生成部105へ供給する。字幕画面生成部105は、字幕データDcdから字幕画面データDccを生成し、画面合成部106へ供給する。画面合成部106は、固定遅延時間Dfixだけ遅延された映像データDvdと、可変遅延時間Dvarだけ遅延された字幕画面とを合成し、表示回路へ供給する。こうして、音声、映像及び字幕が時間軸上で一致した状態で再生される。
【0068】
なお、TS固定遅延部101及び字幕可変遅延部104は、例えば半導体メモリを利用紙、それぞれFIFO(First in First Out)バッファとリングバッファを構成することにより実現することができる。また、映像、音声及び字幕のPESヘッダ拡張部のPTS(Presentation Time Stamp)を適切に設定することにより、字幕の可変遅延を実現することも可能である。
【0069】
[第3実施形態]
次に、本発明の第3実施形態について説明する。上記の第1及び第2実施形態では、放送局から送信される字幕付き映像信号に含まれる遅延制御情報に基づいて字幕遅延時間ΔTを算出している。即ち、放送局では、予め遅延制御情報を作成し、これを映像信号中に含めて送信する必要がある。これに対し、第3実施形態では、放送局は遅延制御情報を含まない通常の字幕付き映像信号を送信する。受信機側は、通常の字幕付き映像信号から自動的に字幕遅延時間ΔTを算出し、遅延補償を行う。
【0070】
(字幕遅延時間の自動算出)
以下、第3実施形態による字幕遅延時間ΔTの自動算出方法について説明する。図11は、字幕遅延時間の自動算出の原理を説明する図である。具体的に、図11は、放送中の映像の各シーン(場面)と、それらに対応するメッセージ音声と、字幕データの入力/受信タイミングとを示す。黒い太枠は各映像シーン201を示し、細い黒枠は映像に対応付けされたメッセージ音声202が1センテンスで時間的に連続している区間を示す。図示のように1つのメッセージ音声の開始時刻をta、終了時刻をtbとすると、字幕遅延時間ΔTは、ΔT=tb−taで得られる。なお、時間的に連続するメッセージ音声202の間を「段落」203と呼ぶ。また、白三角のマーク204は字幕データの入力開始タイミングを示し、黒三角のマーク205は字幕データの受信タイミング(=入力終了/送出タイミング)を示す。
【0071】
あるシーンの最初の字幕入力はメッセージ音声202の開始時刻taに開始され、メッセージ音声202の終了時刻tb(=段落の開始時刻)に終了する。なお、字幕の入力終了・送出が、メッセージ音声の終了を過ぎてから行われる場合もある。メッセージ音声が長い場合、数ページ分の字幕がまとめて入力される。図11のように、1つのシーン中に、段落203をはさんで複数のメッセージ音声202が存在することも多い。あるシーンが終了すると映像は次のシーンに移るが、通常はシーンの移行時にはメッセージ音声を理解しやすいように次のシーンのメッセージ音声までの時間間隔(段落)をやや長くとることが行われる(段落206を参照)。
【0072】
本実施形態では、このように段落の箇所でメッセージ音声が無音になった後、次のメッセージ音声の開始時刻ta(立ち上がり)を自動的に検出し、字幕の入力開始タイミングとする。また、その字幕データの入力が終了し、放送局から送出されて受信機に到着したときの時刻tbを字幕の終了タイミングとする。この両者の時間差から、字幕遅延時間ΔTはΔT=tb−taで算出される。例えばカウンタなどを用いて、字幕データの入力開始タイミングtaから、字幕データの受信タイミングtbまでの時間をカウントすることにより、字幕遅延時間ΔTを容易に得ることができる。
【0073】
なお、実際にはメッセージ音声が無音となった後、次のメッセージ音声の立上りで必ずしも字幕が挿入されるとは限らない。即ち、メッセージ音声が存在しても、それに対応する字幕が存在しない場合もある。この場合、あるメッセージ音声(n番目とする)の立上りが検出されてから、次のメッセージ音声(n+1番目とする)の立上りが検出されるまでの間に字幕データは放送局から送出されず、受信機側もそれを受信しないことになる。よって、受信機側は、次のメッセージ音声の立上りまでに字幕データを受信しなかった場合は、n番目のメッセージ音声の立上りタイミングtaを破棄し、n+1番目のメッセージ音声の立上りタイミングtaとそれに続く字幕データの受信タイミングtbから字幕遅延時間ΔTを算出すればよい。カウンタを用いる場合には、次のメッセージ音声の立上りまでに字幕データを受信しなかった場合、n番目のメッセージ音声の立上りタイミングtaに対応するカウント値をクリアすればよい。
【0074】
次に、メッセージ音声202の無音部分からメッセージ音声の立上りタイミングを自動検出する方法について、図12を参照して説明する。図12において、アナログ音声信号S1はメッセージ音声202の音声信号の波形を示している。なお、アナログ音声信号S1の波形は、その平均信号レベルを「0」として図示している。波形部分M1、M2はメッセージ音声に対応している。アナログ音声信号S1の振幅が大きいほどメッセージ音声の音量が大きく、波形が細かい(周波数が高い)ほどメッセージ音声の音は高い。
【0075】
いま、図示のように、メッセージ音声がM1の部分とM2の部分を有し、その間に段落に相当する無音期間Tdがあるとする。図示のように、通常、無音期間Td内にも多少のノイズが含まれている。よって、アナログ音声信号S1を、適切なスライスレベルLsでスライスし、スライス信号S2を生成する。スライスレベルLsは、アナログ音声信号S1の平均信号レベルに近く、かつ、ノイズレベルより高いレベルに予め決定される。スライス信号S2は、図示のように「0」と「1」の2値のパルス信号となる。このスライス信号S2には、メッセージ音声を構成する可聴周波数の周期に近い幅のパルスや、アナウンサーが呼吸を継ぐ短い無音期間、段落として挿入される比較的長い無音期間などを含んでいる。
【0076】
このスライス信号S2で、リトリガー(Re-Trigger)型ワンショットマルチバイブレータをトリガすることにより、スライス信号S2に含まれる周期の短いパルスを除去し、段落などの周期の長いパルスのみを残し、無音期間信号S3を生成する。無音期間信号S3は、ある時間幅以上の無音期間が「0」レベルとなり、それ以外の期間が「1」レベルとなる。なお、図12では、リトリガー型ワンショットマルチバイブレータのパルス幅が「τ」で示されており、このパルス幅τより短い幅のパルスが除去されている。
【0077】
次に、無音期間信号S3における「0」レベルから「1」レベルへの遷移点を別のモノマルチバイブレータにより抽出することにより、メッセージ立上り信号S4を得ることができる。メッセージ立上り信号S4に含まれるパルスPupの立上りは、メッセージ音声の立上り時刻taを示している。
【0078】
以上のようにして、メッセージ音声の開始時刻、即ち字幕データの入力開始タイミングtaが得られる。一方、受信機は、放送局から送出された字幕付き映像信号中の字幕データを受信した時刻を字幕データの受信タイミングtbとする。通常、字幕データは入力終了後直ちに放送局から送出され、受信機により受信されるので、字幕データの受信タイミングは、字幕データの入力終了タイミング及び送出タイミングと一致する。そして、受信機は、こうして得られた字幕データの入力開始タイミングta及び受信タイミングtbに基づいて、字幕遅延時間ΔTを算出する。
【0079】
本実施形態の方法では、放送局から送出される通常の字幕付き映像信号(即ち、第1及び第2実施形態に示す遅延制御情報を含まない字幕付き映像信号)に基づいて、受信機が自動的に字幕遅延時間ΔTを算出することができる。よって、放送局側で、遅延制御信号を字幕付き映像信号中に挿入するという特別な処理を要することなく、受信機側における字幕表示の遅延補償が可能となる。
【0080】
上記の字幕遅延時間の自動検出方法は、例えばニュース番組におけるアナウンサーのメッセージ音声のように、アナログ音声信号中の有音/無音の境界がはっきりしている場合に有効である。しかし、例えば背景音楽が流れている番組やノイズが多い環境などでは、背景音楽やノイズとメッセージ音声とが混在しており、無音期間の検出が困難な場合がある。そのような場合には、図12に示すメッセージ立上り信号S4を検出することができない状態で、受信機は字幕データを受信することになる。即ち、受信機は、字幕データの受信タイミングtbを得ることはできるが、字幕データの入力開始タイミングtaを得ることができない。この場合の対策としては、字幕遅延時間ΔTとして、当該番組の開始からその時点までに算出された各ページの字幕遅延時間ΔTの平均値又は最頻値に相当する遅延時間、もしくは予め経験的に決定された平均的な字幕遅延時間(以下、「デフォルト字幕遅延時間」とも呼ぶ。)を代わりに使用することができる。これにより、自動検出による無音期間の検出が困難な場合にも、ある程度自然なタイミングで字幕表示が可能となる。
【0081】
なお、このように字幕遅延時間を自動検出するか、デフォルト字幕遅延時間を使用するかは、ユーザの設定により選択可能としてもよいし、番組の種類毎に自動的に設定されるように機器を構成してもよい。
【0082】
図13に第3実施形態に係る字幕遅延制御装置の概略ブロック図を示す。字幕遅延制御装置60aは、図1に示すようにユーザ環境50内に設けられる。図示のように、字幕遅延制御装置60aは、映像固定遅延部121と、音声固定遅延部122と、画面合成部123と、字幕データ抽出部124と、音声立上り検出部125と、字幕遅延時間算出部126と、字幕可変遅延部127とを備える。
【0083】
字幕データ抽出部124は、字幕付き映像信号から字幕データを抽出して字幕可変遅延部127へ供給するとともに、字幕データの受信タイミング(tb)を字幕遅延時間算出部126へ供給する。また、字幕データ抽出後の映像信号を映像固定遅延部121へ供給する。映像固定遅延部121は、入力された映像信号を固定遅延時間Dfix遅延し、画面合成部123へ供給する。
【0084】
音声信号は音声固定遅延部122及び音声立上り検出部125へ入力される。音声固定遅延部122は、音声信号を固定遅延時間Dfix遅延させ、音声回路へ出力する。音声立上り検出部125は、上述のようにメッセージ音声の立上りを検出して字幕データの入力開始タイミングtaを取得し、字幕遅延時間算出部126へ供給する。字幕遅延時間算出部126は、字幕データ抽出部124から供給された字幕データの受信タイミングtb、及び、音声立上り検出部125から供給された入力開始タイミングtaに基づいて、字幕遅延時間ΔTを算出し、字幕可変遅延部127へ送る。
【0085】
字幕可変遅延部127は、字幕遅延時間ΔTと、予め決定されている固定遅延時間Dfixとに基づいて可変遅延時間Dvarを算出する。そして、字幕データ抽出部124から供給された字幕データを可変遅延時間Dvar遅延して画面合成部123へ供給する。画面合成部123は、可変遅延時間Dvar遅延された字幕データを、固定遅延時間Dfix遅延された映像信号に合成し、表示回路へ出力する。こうして、字幕の遅延補償が行われる。
【0086】
なお、デジタル放送の場合には、字幕データの受信タイミングは字幕PESのページデータ到着時刻から知ることもできる。また、デジタル放送の場合、映像固定遅延部121及び音声固定遅延部122は、映像・音声信号の代わりに、それらを伝送するMPEG2信号のPES又はTSを遅延してもよい。
【0087】
なお、字幕データを表示する上で重要な事項に、ある字幕の表示を開始するタイミングの他に、その表示を終了するタイミングがある。字幕の表示の終了方法としては2つある。第1の方法は、文字の無い画面を上書きする方法である。通常、各字幕は、次の字幕の到着したときに、その新しい字幕が表示される(即ち、字幕が更新される)。よって、次のページの字幕データが到着する前に古い字幕を意図的に消去したい場合には、文字無しの画面を上書き表示することにより古い字幕の表示を終了させることができる。第2の方法は、字幕表示を強制終了するための消去パケットを伝送する方法である。消去パケットとは、字幕表示を終了するための目的で送られる1ページ分のデータである。例えば民放の放送では、CMの開始前に字幕表示を強制終了する目的で消去パケットを使用することがある。
【0088】
本実施形態では、字幕表示の消去に第1の方法を使用する場合には、文字無し画面に対応するページの直前の通常ページにおいて検出された字幕データの入力開始タイミングtaから、当該文字無し画面に対応するページを受信した受信タイミングtbまでの時間を字幕遅延時間ΔTとすることにより、正しく文字画面の消去動作が実行される。
【0089】
一方、字幕表示の消去に第2の方法を使用する場合には、消去パケットを受信したときに字幕遅延時間ΔTを「0」に設定する。これにより、固定遅延時間と同じ遅延時間後、即ち、映像及び音声の表示終了時に字幕データも同時に消去されることとなるので、映像がCMなどに入る直前で正しく文字画面の消去動作が実行される。なお、消去パケットは文字データユニットを含まないパケットであるので、消去パケットであるか否かの判別は受信したパケット中の文字データユニットの有無により容易に行うことができる。
【0090】
(変形例)
上記の説明では、本実施形態による字幕遅延時間の自動検出手法を受信機側(ユーザ環境側)の装置に搭載する例を説明した。その代わりに、この自動検出手法を、放送局側の機器に搭載することも可能である。その場合には、放送局側で字幕遅延時間を自動検出し、それに基づいて第1及び第2実施形態のように遅延制御情報を生成して字幕付き映像信号中に挿入した上で送出することができる。
【図面の簡単な説明】
【0091】
【図1】本発明に係る字幕遅延制御装置を適用した環境の例を示す。
【図2】字幕の遅延を説明する図である。
【図3】遅延制御情報による字幕遅延時間の特定方法を概念的に示す図である。
【図4】字幕付き映像信号中における遅延制御情報の位置及び内容を示す。
【図5】字幕付き映像信号中における遅延制御情報の位置及び内容を示す。
【図6】字幕遅延の基本的な補償方法を示すブロック図である。
【図7】本発明の好適な実施形態に係る字幕遅延制御装置の構成を示す。
【図8】字幕遅延制御装置の実施例を示すブロック図である。
【図9】デジタルTV映像信号の場合の制御フラグの設定例を示す。
【図10】デジタル字幕放送に対応した字幕遅延制御装置の構成を示す。
【図11】第3実施形態による字幕遅延時間の自動算出の原理を説明する図である。
【図12】字幕データの入力開始タイミングの検出方法を説明する図である。
【図13】第3実施形態に係る字幕遅延制御装置の概略ブロック図を示す。
【符号の説明】
【0092】
10 放送局、
20 字幕放送送出システム、
40 放送波、
50 ユーザ環境、
52 TV受信機、
60、60a 字幕遅延制御装置
【特許請求の範囲】
【請求項1】
字幕付き映像信号を受信する受信部と、
前記字幕付き映像信号から、字幕信号を抽出する抽出部と、
前記映像信号を所定の固定遅延時間で遅延させ、遅延映像信号を生成する映像遅延部と、
前記字幕信号を、当該字幕信号に応じた可変遅延時間だけ遅延させ、遅延字幕信号を生成する字幕遅延部と、
前記遅延映像信号及び前記遅延字幕信号を合成して、映像と字幕とが同期した字幕同期映像信号を生成する合成部と、を備えることを特徴とする字幕付き映像信号の遅延制御装置。
【請求項2】
前記字幕遅延部は、前記字幕付き映像信号中の映像信号に対する字幕信号の遅れ時間である字幕遅延時間に基づいて、前記可変遅延時間を決定することを特徴とする請求項1に記載の字幕付き映像信号の遅延制御装置。
【請求項3】
前記字幕遅延部は、前記固定遅延時間から前記字幕遅延時間を減算することにより、前記可変遅延時間を算出することを特徴とする請求項2に記載の字幕付き映像信号の遅延制御装置。
【請求項4】
前記字幕付き映像信号は、前記映像信号に対する前記字幕信号の入力開始タイミングを示す情報及び重畳タイミングを示す情報を含む遅延制御信号を有し、
前記字幕遅延部は、前記遅延制御信号に基づいて、前記入力開始タイミングと前記重畳タイミングとの時間差を前記字幕遅延時間と決定することを特徴とする請求項2又は3に記載の字幕付き映像信号の遅延制御装置。
【請求項5】
前記字幕信号の入力開始タイミングを示す情報は、透明字幕に対応する字幕信号中に含められることを特徴とする請求項4に記載の字幕付き映像信号の遅延制御装置。
【請求項6】
前記固定遅延時間は、前記字幕付き映像信号に含まれる前記字幕信号の最大の字幕遅延時間よりも大きく設定されることを特徴とする請求項2に記載の字幕付き映像信号の遅延制御装置。
【請求項7】
前記受信部は、前記字幕付き映像信号に対応する音声信号を受信し、
前記抽出部は、前記字幕信号の受信タイミングを検出し、
前記字幕遅延部は、前記音声信号に基づいて字幕信号の入力開始タイミングを検出する検出部と、前記字幕信号の入力開始タイミング及び前記字幕信号の受信タイミングに基づいて前記字幕遅延時間を算出する字幕遅延時間算出部と、を備えることを特徴とする請求項2に記載の字幕付き映像信号の遅延制御装置。
【請求項8】
前記字幕遅延時間算出部は、前記字幕信号の入力開始タイミングと前記字幕信号の受信タイミングとの時間間隔を前記字幕遅延時間とすることを特徴とする請求項7に記載の字幕付き映像信号の遅延制御装置。
【請求項9】
前記字幕遅延部は、前記検出部が前記字幕信号の入力開始タイミングを検出できない場合には、所定のデフォルト字幕遅延時間を前記字幕遅延時間に設定することを特徴とする請求項8に記載の字幕付き映像信号の遅延制御装置。
【請求項10】
前記デフォルト字幕遅延時間は、前記字幕付き映像信号が構成する番組の開始からその時点までに算出された字幕遅延時間の平均値又は最頻値に相当する遅延時間、もしくは予め経験的に決定された平均的な字幕遅延時間であることを特徴とする請求項9に記載の字幕付き映像信号の遅延制御装置。
【請求項11】
前記検出部は、
前記音声信号を所定のスライスレベルでスライスしてスライス信号を生成する手段と、
前記スライス信号に基づいて、前記音声信号の無音期間を検出する手段と、
前記無音期間の終了時点を前記字幕信号の入力開始タイミングとして抽出する手段と、を備えることを特徴とする請求項7に記載の字幕付き映像信号の遅延制御装置。
【請求項12】
請求項1乃至11のいずれか一項に記載の字幕付き映像信号の遅延制御装置と、
音声信号を受信し、前記固定遅延時間だけ遅延させて遅延音声信号を生成する音声遅延部と、
前記字幕同期映像信号及び前記遅延音声信号を再生する再生部と、を備えることを特徴とする字幕付き映像/音声再生装置。
【請求項13】
コンピュータ端末により実行されることにより、前記コンピュータ端末を、
字幕付き映像信号を受信する受信部と、
前記字幕付き映像信号から、字幕信号を抽出する抽出部と、
前記映像信号を所定の固定遅延時間で遅延させ、遅延映像信号を生成する映像遅延部と、
前記字幕信号を、当該字幕信号に応じた可変遅延時間で遅延させ、遅延字幕信号を生成する字幕遅延部と、
前記遅延映像信号及び前記遅延字幕信号を合成して、映像と字幕とが同期した字幕同期映像信号を生成する合成部として機能させることを特徴とする字幕付き映像信号の遅延制御プログラム。
【請求項1】
字幕付き映像信号を受信する受信部と、
前記字幕付き映像信号から、字幕信号を抽出する抽出部と、
前記映像信号を所定の固定遅延時間で遅延させ、遅延映像信号を生成する映像遅延部と、
前記字幕信号を、当該字幕信号に応じた可変遅延時間だけ遅延させ、遅延字幕信号を生成する字幕遅延部と、
前記遅延映像信号及び前記遅延字幕信号を合成して、映像と字幕とが同期した字幕同期映像信号を生成する合成部と、を備えることを特徴とする字幕付き映像信号の遅延制御装置。
【請求項2】
前記字幕遅延部は、前記字幕付き映像信号中の映像信号に対する字幕信号の遅れ時間である字幕遅延時間に基づいて、前記可変遅延時間を決定することを特徴とする請求項1に記載の字幕付き映像信号の遅延制御装置。
【請求項3】
前記字幕遅延部は、前記固定遅延時間から前記字幕遅延時間を減算することにより、前記可変遅延時間を算出することを特徴とする請求項2に記載の字幕付き映像信号の遅延制御装置。
【請求項4】
前記字幕付き映像信号は、前記映像信号に対する前記字幕信号の入力開始タイミングを示す情報及び重畳タイミングを示す情報を含む遅延制御信号を有し、
前記字幕遅延部は、前記遅延制御信号に基づいて、前記入力開始タイミングと前記重畳タイミングとの時間差を前記字幕遅延時間と決定することを特徴とする請求項2又は3に記載の字幕付き映像信号の遅延制御装置。
【請求項5】
前記字幕信号の入力開始タイミングを示す情報は、透明字幕に対応する字幕信号中に含められることを特徴とする請求項4に記載の字幕付き映像信号の遅延制御装置。
【請求項6】
前記固定遅延時間は、前記字幕付き映像信号に含まれる前記字幕信号の最大の字幕遅延時間よりも大きく設定されることを特徴とする請求項2に記載の字幕付き映像信号の遅延制御装置。
【請求項7】
前記受信部は、前記字幕付き映像信号に対応する音声信号を受信し、
前記抽出部は、前記字幕信号の受信タイミングを検出し、
前記字幕遅延部は、前記音声信号に基づいて字幕信号の入力開始タイミングを検出する検出部と、前記字幕信号の入力開始タイミング及び前記字幕信号の受信タイミングに基づいて前記字幕遅延時間を算出する字幕遅延時間算出部と、を備えることを特徴とする請求項2に記載の字幕付き映像信号の遅延制御装置。
【請求項8】
前記字幕遅延時間算出部は、前記字幕信号の入力開始タイミングと前記字幕信号の受信タイミングとの時間間隔を前記字幕遅延時間とすることを特徴とする請求項7に記載の字幕付き映像信号の遅延制御装置。
【請求項9】
前記字幕遅延部は、前記検出部が前記字幕信号の入力開始タイミングを検出できない場合には、所定のデフォルト字幕遅延時間を前記字幕遅延時間に設定することを特徴とする請求項8に記載の字幕付き映像信号の遅延制御装置。
【請求項10】
前記デフォルト字幕遅延時間は、前記字幕付き映像信号が構成する番組の開始からその時点までに算出された字幕遅延時間の平均値又は最頻値に相当する遅延時間、もしくは予め経験的に決定された平均的な字幕遅延時間であることを特徴とする請求項9に記載の字幕付き映像信号の遅延制御装置。
【請求項11】
前記検出部は、
前記音声信号を所定のスライスレベルでスライスしてスライス信号を生成する手段と、
前記スライス信号に基づいて、前記音声信号の無音期間を検出する手段と、
前記無音期間の終了時点を前記字幕信号の入力開始タイミングとして抽出する手段と、を備えることを特徴とする請求項7に記載の字幕付き映像信号の遅延制御装置。
【請求項12】
請求項1乃至11のいずれか一項に記載の字幕付き映像信号の遅延制御装置と、
音声信号を受信し、前記固定遅延時間だけ遅延させて遅延音声信号を生成する音声遅延部と、
前記字幕同期映像信号及び前記遅延音声信号を再生する再生部と、を備えることを特徴とする字幕付き映像/音声再生装置。
【請求項13】
コンピュータ端末により実行されることにより、前記コンピュータ端末を、
字幕付き映像信号を受信する受信部と、
前記字幕付き映像信号から、字幕信号を抽出する抽出部と、
前記映像信号を所定の固定遅延時間で遅延させ、遅延映像信号を生成する映像遅延部と、
前記字幕信号を、当該字幕信号に応じた可変遅延時間で遅延させ、遅延字幕信号を生成する字幕遅延部と、
前記遅延映像信号及び前記遅延字幕信号を合成して、映像と字幕とが同期した字幕同期映像信号を生成する合成部として機能させることを特徴とする字幕付き映像信号の遅延制御プログラム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【公開番号】特開2006−211636(P2006−211636A)
【公開日】平成18年8月10日(2006.8.10)
【国際特許分類】
【出願番号】特願2005−206393(P2005−206393)
【出願日】平成17年7月15日(2005.7.15)
【出願人】(504380655)株式会社テレビ朝日データビジョン (3)
【出願人】(391016093)エル・エス・アイ ジャパン株式会社 (21)
【Fターム(参考)】
【公開日】平成18年8月10日(2006.8.10)
【国際特許分類】
【出願日】平成17年7月15日(2005.7.15)
【出願人】(504380655)株式会社テレビ朝日データビジョン (3)
【出願人】(391016093)エル・エス・アイ ジャパン株式会社 (21)
【Fターム(参考)】
[ Back to top ]