説明

シネマ判定方法、シネマ判定装置、および字幕検出方法

【課題】入力映像が映像と字幕をともに含んだ状態であっても高精度にシネマ判定を行なえるようにする。
【解決手段】フレーム差分算出部101で入力映像の現フィールドの入力信号と現フィールドよりも前の入力信号のフレーム差分値を画面上の画素ごとに計算し、全画面フレーム差分累積部102によって、そのフレーム差分値を画面全体について累積する。また、文字検出部103で文字検出を行なって、文字領域検出部104で字幕領域窓を決定する。さらに、文字領域フレーム差分累積部105で、入力信号のフレーム差分値を、文字領域検出部104によって決定された字幕領域窓内にある全ての画素に対して計算するとともに、この窓内にある全ての画素についてのフレーム差分値を累積する。そして、フレーム差分減算部106によって累積したフレーム差分値を、全画面フレーム差分累積部102で累積したフレーム差分値から減算して出力する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、入力映像がシネマソースかどうかを判定するシネマ判定方法、シネマ判定装置、および入力映像の字幕検出方法に関するものである。
【背景技術】
【0002】
24フレーム(もしくは25フレーム)のプログレッシブ信号である映画ソースを、プルダウンの規則性にのって静止はめ込み処理を行うことによって、60フィールド(もしくは50フィールド)のインタレース信号に変換し、忠実な映像を再現することをデジタルシネマリアリティという。これを実現するためには、予め入力映像がシネマソースかどうかを判定する必要がある(以下、この判定をシネマ判定と呼ぶ)。
【0003】
シネマ判定を行なう従来のシネマ判定装置では、入力映像の第1と第2フィールドにおける各画像の相関値を計算して、相関値に基づいて複製フィールドか否かを判定することによって、シネマソースかどうかを判定するものがある(例えば特許文献1を参照)。
【特許文献1】特開平8−289199号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
しかしながら、シネマソースには文字(字幕)が付加される場合があり、付加された文字は、プルダウンの規則性を含んでいないため、映像と字幕をともに含んだ状態でシネマ検出を行うと、シネマソースかどうかの判定を誤ってしまう可能性がある。
【0005】
本発明は、上記の問題に着目してなされたものであり、入力映像が映像と字幕をともに含んだ状態であっても高精度にシネマ判定を行なえるようにすること目的としている。
【課題を解決するための手段】
【0006】
前記の課題を解決するため、本発明の第1の態様は、
入力映像がシネマソースかどうかを判定するシネマ判定方法であって、
入力映像の現フィールドの入力信号と現フィールドよりも前の入力信号のフレーム差分値を画面上の画素ごとに計算するフレーム差分算出ステップと、
前記フレーム差分算出ステップで計算したフレーム差分値を、画面全体について累積する全画面フレーム差分累積ステップと、
画面上に予め定められた領域である字幕検出領域の内部を走査して、この領域内に表示されている文字を検出する文字検出ステップと、
前記文字検出ステップでの文字検出結果に基づいて、字幕の開始点と終了点を決定して、字幕が表示されている領域である字幕領域窓を決定する文字領域検出ステップと、
入力信号のフレーム差分値を、前記文字領域検出ステップによって決定された字幕領域窓内にある全ての画素に対して計算するとともに、この窓内にある全ての画素についてのフレーム差分値を累積する文字領域フレーム差分累積ステップと、
前記文字領域フレーム差分累積ステップで累積したフレーム差分値を、前記全画面フレーム差分累積ステップで累積したフレーム差分値から減算して出力するフレーム差分減算ステップと、
前記フレーム差分減算ステップの出力を基に、フィールド時間単位で、入力映像のプルダウンの規則性を検出し、検出結果に応じて、入力映像の変換を行なって画面出力を行なうシネマ判定ステップと、
を備えたことを特徴とする。
【0007】
これにより、字幕が表示されている領域である字幕領域窓が決定され、字幕領域窓を除いた領域を用いてシネマ判定を行なわれる。それゆえ、入力映像が映像と字幕をともに含んだ状態であっても高精度にシネマ判定できる。
【0008】
また、本発明の第2の態様は、
画面上で、文字走査を行なう字幕検出領域を決定するステップと、
前記字幕検出領域を走査して文字を検出し、文字検出地点に基づいて字幕領域窓の開始点を決定するステップと、
前記字幕領域窓の開始点から何れの方向に文字が連続性を持つかを検出するステップと、
文字走査を行なって、字幕領域窓の終点を決定するステップと、
を有することを特徴とする。
【0009】
これにより、画面上で字幕が表示されている位置が検出される。
【0010】
また、本発明の第3の態様は、
入力映像がシネマソースかどうかを判定するシネマ判定装置であって、
入力映像の現フィールドの入力信号と現フィールドよりも前の入力信号のフレーム差分値を画面上の画素ごとに計算するフレーム差分算出部と、
前記フレーム差分算出部で計算したフレーム差分値を、画面全体について累積する全画面フレーム差分累積部と、
画面上に予め定められた領域である字幕検出領域の内部を走査して、この領域内に表示されている文字を検出する文字検出部と、
前記文字検出部での文字検出結果に基づいて、字幕の開始点と終了点を決定して、字幕が表示されている領域である字幕領域窓を決定する文字領域検出部と、
入力信号のフレーム差分値を、前記文字領域検出部によって決定された字幕領域窓内にある全ての画素に対して計算するとともに、この窓内にある全ての画素についてのフレーム差分値を累積する文字領域フレーム差分累積部と、
前記文字領域フレーム差分累積部で累積したフレーム差分値を、前記全画面フレーム差分累積部で累積したフレーム差分値から減算して出力するフレーム差分減算部と、
前記フレーム差分減算部の出力を基に、フィールド時間単位で、入力映像のプルダウンの規則性を検出し、検出結果に応じて、入力映像の変換を行なって画面出力を行なうシネマ判定部と、
を備えたことを特徴とする。
【0011】
これにより、字幕が表示されている領域である字幕領域窓が決定され、字幕領域窓を除いた領域を用いてシネマ判定を行なわれる。それゆえ、入力映像が映像と字幕をともに含んだ状態であっても高精度にシネマ判定できる。
【発明の効果】
【0012】
本発明によれば、字幕が表示されている領域である字幕領域窓を決定し、字幕領域窓を除いた領域を用いてシネマ判定を行なうので、入力映像が映像と字幕をともに含んだ状態であっても高精度にシネマ判定できる。
【発明を実施するための最良の形態】
【0013】
以下、本発明の実施形態について図面を参照しながら説明する。
【0014】
図1は、本発明の実施形態に係るシネマ判定装置100の構成を示すブロック図である。同図に示すようにシネマ判定装置100は、フレーム差分算出部101、全画面フレーム差分累積部102、文字検出部103、文字領域検出部104、文字領域フレーム差分累積部105、フレーム差分減算部106、およびシネマ判定部107を備えている。
【0015】
フレーム差分算出部101は、入力映像の現フィールドの入力信号(入力輝度信号)と、2フィールドまたは1フィールド前の入力信号のフレーム差分値を画面上の画素ごとに計算するようになっている。
【0016】
全画面フレーム差分累積部102は、フレーム差分算出部101が計算したフレーム差分値を、画面全体について累積するようになっている。
【0017】
文字検出部103は、画面上に予め定められた字幕検出領域(後述)の内部を走査して、この領域内に表示されている文字を検出するようになっている。具体的には、文字検出部103は、映像の信号レベルが黒レベルのスレッシュレベルより小さくなり、次に白レベルのスレッシュレベルより大きくなり、そして黒レベルのスレッシュレベルより小さくなるパターンを検出した場合に白文字であると認識するようになっている。図2は、字幕が画面下に表示されている場合の信号レベル変化パターンを示す例である。ここで、白および黒の判定にスレッシュ値を設けているのは、黒レベル・白レベルがある程度の連続した幅を持たせて、文字の誤検出防止するためである。本実施形態では、字幕検出領域としては、字幕が出現すると考えられる画面の上下左右の領域(候補領域)を予め設定している(図3を参照)。このように字幕検出領域を設定することで字幕の誤り検出を防ぐことが可能になる。
【0018】
文字領域検出部104は、文字検出部103の文字検出結果に基づいて、字幕の開始点と終了点を決定して、字幕が表示されている領域(字幕領域窓)を決定するようになっている。詳しくは、文字領域検出部104は、以下のように字幕領域窓を決定する。
【0019】
まず、文字検出部103によって、予め字幕検出領域に定められた走査開始点から、順次走査を行なって文字を検出する。走査開始点としては、例えば図4に示した例では、画面上部横方向窓生成用、画面右部縦方向窓生成用、画面左部縦方向窓生成用、および画面下部横方向窓生成用の4点が開始点として定められ、各開始点について、開始点ごとに定められた方向(図4の矢印の方向)に向かって、順次走査が行なわれる。図4に示すように、横方向に走査が行なわれて、文字が横に続く横窓が生成される場合と、あるいは下方向に走査が行なわれて、文字が縦に続く縦窓が生成される場合の2通りがある(図5を参照)。
【0020】
最初に文字が検出された画素地点(文字検出地点)から左上方部を、字幕領域窓の開始点に決定する。この際、文字検出地点をそのまま字幕領域窓の開始点に決定すると、出現文字の初めが「A」や「C」のときには、字幕領域窓で字幕全体を囲むことができないので、文字検出地点から左方向と上方向にマージンをとって開始点を定め、広めに字幕領域窓を作成する。
【0021】
字幕領域窓の開始点が定まると、次に文字がどの方向に連続性を持つかを検出する。これには、字幕領域窓の開始点から縦方向または横方向に向かって、文字検出部103に文字の走査を行なわせる。この際、文字の連続性を見るために、一度文字を検出してから次の文字を検出するまでの間隔を決めるスレッシュ値を設ける。このスレッシュ値は、走査の方向が縦横の何れの方向の場合についても設けておく。
【0022】
文字が連続する方向が定まった後は、字幕の終点を決定するために、引き続き文字の走査を行なう。そして、所定の間隔以上走査しても文字が検出されなかった場合は、その点を字幕検出窓の終点として検出する。字幕検出窓の終点も右方向と下方向の設定値のマージンをとって右下方向に設定する。
【0023】
一方、文字領域フレーム差分累積部105は、入力信号のフレーム差分値を、文字領域検出部104によって決定された字幕領域窓内にある全ての画素に対して計算するとともに、この窓内にある全ての画素についてのフレーム差分値を累積するようになっている。
【0024】
フレーム差分減算部106は、文字領域フレーム差分累積部105が累積しているフレーム差分値を、全画面フレーム差分累積部102が累積しているフレーム差分値から減算し、減算結果を後段のシネマ判定部107に送るようになっている。すなわち、フレーム差分減算部106の出力は、字幕を含まない映像部分のみのフレーム差分の累積値である。
【0025】
シネマ判定部107は、以下のようにして画面出力を行うようになっている。すなわち、シネマ判定部107は、フレーム差分減算部106の出力をもとにフィールド時間単位で、入力映像のプルダウンの規則性を検出し、入力映像がシネマソースと判定された場合には全画面領域から字幕領域を除く全ての画素に対し、入力ソースの静止はめ込み処理を施して画面出力する。また、入力映像がシネマソースと判定されていない時間と、シネマソースを検出するシーケンスに入っている時間と、シネマソースと完全に判定されている時間の字幕領域窓内の画素に関しては、入力映像の動き検出結果の情報に基づいて動画静止混合を行う通常のIP(Interlace−Progressive)変換を行い、画面出力を行う。
【0026】
上記のシネマ判定装置100では、まず、フレーム差分算出部101が、入力映像の現フィールドの入力信号(入力輝度信号)と、2フィールド(または1フィールド)前の入力信号のフレーム差分値を画面上の画素ごとに計算し、フレーム差分算出部101が計算したフレーム差分値を、全画面フレーム差分累積部102が画面全体について累積する。
【0027】
一方、文字領域検出部104は、文字検出部103の文字検出結果に基づいて、字幕の開始点と終了点を決定して、字幕が表示されている領域(字幕領域窓)を決定する。そして、文字領域フレーム差分累積部105が、入力信号のフレーム差分値を、文字領域検出部104によって決定された字幕領域窓内にある全ての画素に対して計算し、さらに、この窓内にある全ての画素についてのフレーム差分値を累積する。
【0028】
次に、フレーム差分減算部106が、文字領域フレーム差分累積部105が累積しているフレーム差分値を、全画面フレーム差分累積部102が累積しているフレーム差分値から減算し、減算結果を後段のシネマ判定部107に送る。その後、シネマ判定部107がフレーム差分減算部106の減算結果に基づいて、シネマ判定を行なうとともに、判定結果に応じて、入力映像の変換を行い、画面出力を行う。
【0029】
以上のように、本実施形態は、入力信号レベルと白色および黒色のスレッシュレベルとを比較して文字を検出することによって字幕領域を検出し、字幕領域を除いた領域を用いてシネマ判定を行なうので、入力映像が映像と字幕をともに含んだ状態であっても高精度にシネマ判定できる。
【産業上の利用可能性】
【0030】
本発明に係るシネマ判定方法、シネマ判定装置、および字幕検出方法は、字幕が表示されている領域である字幕領域窓を決定し、字幕領域窓を除いた領域を用いてシネマ判定を行なうので、入力映像が映像と字幕をともに含んだ状態であっても高精度にシネマ判定できるという効果を有し、入力映像がシネマソースかどうかを判定するシネマ判定方法、シネマ判定装置、および入力映像の字幕検出方法等として有用である。
【図面の簡単な説明】
【0031】
【図1】本発明の実施形態に係るシネマ判定装置の構成を示すブロック図である。
【図2】字幕が画面下に表示されている場合の信号レベル変化パターンを示す図である。
【図3】字幕検出領域の設定例を示す図である。
【図4】走査開始点および走査方向の一例を示す図である。
【図5】文字が横に続く横窓が生成された例と、文字が縦に続く縦窓が生成された例を示す図である。
【符号の説明】
【0032】
100 シネマ判定装置
101 フレーム差分算出部
102 全画面フレーム差分累積部
103 文字検出部
104 文字領域検出部
105 文字領域フレーム差分累積部
106 フレーム差分減算部
107 シネマ判定部

【特許請求の範囲】
【請求項1】
入力映像がシネマソースかどうかを判定するシネマ判定方法であって、
入力映像の現フィールドの入力信号と現フィールドよりも前の入力信号のフレーム差分値を画面上の画素ごとに計算するフレーム差分算出ステップと、
前記フレーム差分算出ステップで計算したフレーム差分値を、画面全体について累積する全画面フレーム差分累積ステップと、
画面上に予め定められた領域である字幕検出領域の内部を走査して、この領域内に表示されている文字を検出する文字検出ステップと、
前記文字検出ステップでの文字検出結果に基づいて、字幕の開始点と終了点を決定して、字幕が表示されている領域である字幕領域窓を決定する文字領域検出ステップと、
入力信号のフレーム差分値を、前記文字領域検出ステップによって決定された字幕領域窓内にある全ての画素に対して計算するとともに、この窓内にある全ての画素についてのフレーム差分値を累積する文字領域フレーム差分累積ステップと、
前記文字領域フレーム差分累積ステップで累積したフレーム差分値を、前記全画面フレーム差分累積ステップで累積したフレーム差分値から減算して出力するフレーム差分減算ステップと、
前記フレーム差分減算ステップの出力を基に、フィールド時間単位で、入力映像のプルダウンの規則性を検出し、検出結果に応じて、入力映像の変換を行なって画面出力を行なうシネマ判定ステップと、
を備えたことを特徴とするシネマ判定方法。
【請求項2】
画面上で、文字走査を行なう字幕検出領域を決定するステップと、
前記字幕検出領域を走査して文字を検出し、文字検出地点に基づいて字幕領域窓の開始点を決定するステップと、
前記字幕領域窓の開始点から何れの方向に文字が連続性を持つかを検出するステップと、
文字走査を行なって、字幕領域窓の終点を決定するステップと、
を有することを特徴とするシネマ字幕検出方法。
【請求項3】
入力映像がシネマソースかどうかを判定するシネマ判定装置であって、
入力映像の現フィールドの入力信号と現フィールドよりも前の入力信号のフレーム差分値を画面上の画素ごとに計算するフレーム差分算出部と、
前記フレーム差分算出部で計算したフレーム差分値を、画面全体について累積する全画面フレーム差分累積部と、
画面上に予め定められた領域である字幕検出領域の内部を走査して、この領域内に表示されている文字を検出する文字検出部と、
前記文字検出部での文字検出結果に基づいて、字幕の開始点と終了点を決定して、字幕が表示されている領域である字幕領域窓を決定する文字領域検出部と、
入力信号のフレーム差分値を、前記文字領域検出部によって決定された字幕領域窓内にある全ての画素に対して計算するとともに、この窓内にある全ての画素についてのフレーム差分値を累積する文字領域フレーム差分累積部と、
前記文字領域フレーム差分累積部で累積したフレーム差分値を、前記全画面フレーム差分累積部で累積したフレーム差分値から減算して出力するフレーム差分減算部と、
前記フレーム差分減算部の出力を基に、フィールド時間単位で、入力映像のプルダウンの規則性を検出し、検出結果に応じて、入力映像の変換を行なって画面出力を行なうシネマ判定部と、
を備えたことを特徴とするシネマ判定装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate