説明

静止字幕検出装置、静止字幕を含む画像を表示する映像機器、および静止字幕を含んだ画像の処理方法

【課題】ビデオ信号中に映像または画像の一部として含まれる静止字幕部分を画素単位で検出できるようにする。
【解決手段】複数画素で構成されるビデオフレーム内の画像に含まれる字幕部分を画素単位で検出する装置は、字幕部分判定部(133〜136)と、静止字幕検出部(131、132)を備えている。ここで、字幕部分判定部は、例えば輝度レベルが変化する画像エッジ(文字の縁)の検出箇所と隣接する高輝度領域側(白ピーク領域側)の画素もしくは画素群を、字幕部分と判定する。また、静止字幕検出部は、時間軸に沿って連続する2つのビデオフレーム(前フレームと現フレーム)を比較することにより、前記字幕部分が無変化であることが検出された場合に、その字幕部分を静止字幕として検出する。

【発明の詳細な説明】
【技術分野】
【0001】
この発明は、ビデオ信号中に映像(ピクチャ)または画像(イメージ)の一部として含まれる静止字幕の検出装置、静止字幕を含む画像を表示する映像機器、および静止字幕を含んだ画像の処理方法に関する。
【背景技術】
【0002】
例えば字幕入り映画フィルム(毎秒24フレーム)をテレシネし2−3プルダウン処理によりビデオ化した信号(毎秒30フレームまたは毎秒60フィールド)、あるいはテレシネした映画フィルム映像に字幕映像をスーパーインポーズしてビデオ化した信号のように、動画のビデオ信号中に静止字幕が含まれることはよくある。このような静止字幕入りビデオ信号の映像または画像の補間フレームを生成する際に、誤ったベクトルで字幕部分の補間画素を生成することで字幕部分に乱れが生じることがあるが、字幕部分にノイズがあると見苦しい。
【0003】
補間フレームの字幕部分のノイズを低減する処理を行うには、ビデオ信号中に映像または画像の一部として含まれる静止字幕の領域を検出する必要がある。この字幕領域を検出する方法として、字幕領域を小領域(複数画素のブロック)単位で検出する方法(特許文献1参照)と、画素単位で検出する方法(特許文献2参照)が考えられる。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2008−252561号公報
【特許文献2】特開2009−017325号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
特許文献1では、毎秒24コマのフィルム映像を毎秒30フレームのビデオ映像に変換するテレシネ処理において、2−3プルダウン処理された映像信号中の字幕領域を小領域(複数画素ブロック)単位で検出できるようにしている(段落0004〜0009参照)。特許文献1では字幕ブロックを小領域単位で正確に検出するものの、さらに細かく画素単位で検出することはできない。
【0006】
特許文献2では、文字列矩形領域(字幕領域)の抽出において、画素単位の検出も行っている(段落0018、0019、0030、0033参照)。特許文献2では、しかしながら、隣接フレーム間での字幕領域の変化を見ておらず、ビデオ映像(動画)に含まれる静止字幕の検出方法としては十全でない。
【0007】
この発明の課題の1つは、ビデオ信号中に映像または画像の一部として含まれる静止字幕部分を画素単位で検出できるようにすることである。
【課題を解決するための手段】
【0008】
この発明の一実施の形態に係る静止字幕検出装置は、複数画素で構成されるビデオフレーム内の画像に含まれる字幕部分を画素単位で検出するもの(図1の画素単位字幕検出部130を含む静止字幕検出装置)である。この装置は、字幕部分判定モジュール(図2のエッジ検出部133,135、エッジ隣接白ピーク領域検出部134,136)と、静止字幕検出モジュール(図2の静止判定部131、画素単位静止字幕検出部132)を備えている。
【0009】
ここで、字幕部分判定モジュールは、輝度レベルが変化する画像エッジ(文字の縁)の検出箇所と隣接する高輝度領域側(白ピーク領域側)または輝度レベルが変化する画像エッジ(文字の縁)の検出箇所と隣接する低輝度領域側(黒ボトム領域側)の画素もしくは画素群を、字幕部分と判定する(例えば、前者の白ピーク領域側では黒地に白文字の字幕部分と判定し、後者の黒ボトム領域側では白地に黒文字の字幕部分と判定する)。
【0010】
また、静止字幕検出モジュールは、時間軸に沿って連続する2つのビデオフレーム(例えば図8の前フレームと現フレーム)を比較することにより前記字幕部分が無変化であることが検出された場合に、その字幕部分を静止字幕として検出する。
【発明の効果】
【0011】
この発明によれば、画素単位で高品位な静止字幕検出を行うことができる。
【図面の簡単な説明】
【0012】
【図1】この発明の一実施の形態に係る静止字幕検出装置を含んだ補間フレーム生成装置を説明する図。
【図2】画素単位字幕検出部の構成例を説明する図。
【図3】静止字幕検出処理の一例を説明するフローチャート図。
【図4】画素単位の字幕領域検出例を説明する図。
【図5】小領域単位の字幕領域検出結果の一例を説明する図。
【図6】画素単位の字幕領域検出結果の一例を説明する図。
【図7】小領域単位の字幕領域検出結果に基づく静止判定および補間フレーム生成の一例を説明する図。
【図8】画素単位の字幕領域検出結果に基づく静止判定および補間フレーム生成の一例を説明する図。
【図9】小領域単位の字幕領域検出処理の一例を説明するフローチャート図。
【図10】補間フレーム生成処理の一例を説明するフローチャート図。
【発明を実施するための形態】
【0013】
以下、図面を参照してこの発明の種々な実施の形態を説明する。図1は、この発明の一実施の形態に係る、静止字幕検出装置を含んだ補間フレーム生成装置を説明する図である。この補間フレーム生成装置を構成するフレーム補間部10は、複数画素で構成されるビデオフレーム内の画像に含まれる字幕部分を画素単位で検出するもので、動きベクトル探索部110、補間フレーム生成部120、および画素単位字幕検出部130を備えている。
【0014】
前記字幕部分は、例えばMPEG−2またはH.264/AVCでエンコードされたデータストリームをデコードして得たデジタルビデオ信号に含まれる。このデジタルビデオ信号は、図1の入力画像信号S01、S02に対応する。この入力画像信号S01、S02は、時間軸に沿って連続する複数のビデオフレームを含む。このビデオフレームは、第1フレームレート(24 frame/s:毎秒24フレーム)を持ち、その中に時間軸上で隣接する前フレーム(S01)および現フレーム(S02)を含んでいる。動きベクトル探索部110は、入力画像信号中の前フレーム(S01)および現フレーム(S02)から入力画像の動きベクトル(二次元フレームのx−y平面上におけるx方向ベクトルとy方向ベクトル)を検出する。この動きベクトル検出は、例えば、前後のフレームからブロックマッチング方式によりブロック内の画素差分値の総和(SAD: Sum of Absolute Difference)が小さいものを最も類似性の高いブロックと判断してそのブロックのベクトルと判定する技術分野で周知である。
【0015】
動きベクトルの検出結果S110と前フレーム(S01)の画像情報は、補間フレーム生成部120に入力される。補間フレーム生成部120にはさらに、画素単位字幕検出部130から画素単位字幕検出フラグS130が入力される。この画素単位字幕検出フラグS130は、以下のようにして得られる。
【0016】
すなわち、図1の装置は、前フレーム用小領域単位字幕検出部30および現フレーム用小領域単位字幕検出部40をさらに備えている。前フレーム用小領域単位字幕検出部30は、入力された前フレーム(S01)を小領域に分割しこの小領域単位で前記字幕部分を検出する。この検出がなされたら、前フレーム用小領域単位字幕検出部30は小領域単位字幕検出フラグS30を出力する。また、現フレーム用小領域単位字幕検出部40は、入力された現フレーム(S02)を小領域に分割しこの小領域単位で前記字幕部分を検出する。この検出がなされたら、現フレーム用小領域単位字幕検出部40は小領域単位字幕検出フラグS40を出力する。
【0017】
なお、前フレーム用小領域単位字幕検出部30および現フレーム用小領域単位字幕検出部40それぞれは、例えば背景技術の1つとして前述した特許文献1(特開2008−252561号公報)の図1に示すような構成で具現できる。小領域単位字幕検出に関する詳細については、この特許文献1を参照することをお勧めする。
【0018】
前フレーム少領域単位字幕検出モジュール30からの小領域単位字幕検出フラグS30と、現フレーム少領域単位字幕検出モジュール40からの小領域単位字幕検出フラグS40は、画素単位字幕検出部130に入力される。この画素単位字幕検出部130には、入力画像信号S01、S02の前フレーム(S01)および現フレーム(S02)も入力される。画素単位字幕検出部130は、この発明の一実施の形態に係る静止字幕検出装置の主要部の1つであり、以下に述べるような構成を持っている。
【0019】
図2は、画素単位字幕検出部130の構成の一例を示す。ここでは、相対的に低輝度な画像(黒地)にスーパーインポーズされた相対的に高輝度な文字形状(白文字)により字幕が構成される場合を例にとって説明する。
【0020】
入力画像信号の前フレーム(S01)および、前フレーム用小領域単位字幕検出部30からの小領域単位字幕検出フラグS30は、エッジ検出部133に入力される。そして、エッジ検出部133によるエッジ検出結果S133は、エッジ隣接白ピーク領域検出部134に入力される。
【0021】
いま、エッジ検出部133に入力された前フレームの画像に例えば図4(a)に示すような白文字「A」が含まれており、小領域単位字幕検出フラグS30が例えば図4(g)に示すような範囲の小領域単位字幕検出領域を示し、この小領域単位字幕検出領域内に例えば図4(c)に示すような「白文字Aの一部」が含まれていたとする。この場合、エッジ検出部133は、小領域単位字幕検出領域を含むビデオフレーム内の1つの水平ライン(注目ライン)L上に存在する画素群の、輝度レベル分布(図4(d))を検出する。
【0022】
図4(d)の例では、黒色系背景領域から白文字Aの一方縁に入ると一旦輝度レベルが下がり、その縁を越えて白文字Aの実体部分(文字Aを構成する、複数画素からなる文字線部分)に入ると輝度レベルが高輝度側(白ピーク)に急増する。白文字Aの実体部分を越えて白文字Aの他方縁に入ると輝度レベルが低輝度側(黒ボトム)に急落し、この他方縁を超えると黒色系背景領域の輝度レベルに戻る。
【0023】
注目ラインL上において上記のような輝度レベル変化が検出された場合、この輝度レベル変化を示すエッジ検出結果S133がエッジ隣接白ピーク領域検出部134に入力される。エッジ隣接白ピーク領域検出部134は、白文字Aの文字線(ラインL上で複数画素分の幅を持つ)の左右エッジにおける輝度レベル急変部分を微分して、白文字Aのエッジを画素単位で検出する(図4(e))。また、検出された白文字Aのエッジの左右にある黒い文字縁を含めて、画素単位の字幕検出領域とする(図4(f))。エッジ隣接白ピーク領域検出部134は、文字の縁まで含めた白文字Aの検出結果(図4(f))を、前フレーム(S01)の画素単位字幕検出フラグS134として出力する。
【0024】
この白文字Aの検出結果(画素単位字幕検出フラグS134に対応)を図4(a)の小領域単位字幕検出領域全体に渡って収集すれば、図4(b)に示すような画素単位の字幕検出結果が、前フレーム(S01)に対して得られる。(この検出結果は、画素単位字幕検出部130に接続されあるいは内蔵される図示しないメモリに一時記憶される。)
同様に、入力画像信号の現フレーム(S02)および現フレーム用小領域単位字幕検出部40からの小領域単位字幕検出フラグS40が、エッジ検出部135に入力される。そして、エッジ検出部135によるエッジ検出結果S135はエッジ隣接白ピーク領域検出部136に入力される。エッジ隣接白ピーク領域検出部136は、文字の縁まで含めた白文字Aの検出結果を、現フレーム(S02)の画素単位字幕検出フラグS136として出力する。この白文字Aの検出結果(画素単位字幕検出フラグS136に対応)を図4(a)の小領域単位字幕検出領域全体に渡って収集すれば、図4(b)に示すような画素単位の字幕検出結果が、現フレーム(S02)に対して得られる。(この検出結果も、画素単位字幕検出部130に接続されあるいは内蔵される図示しないメモリに一時記憶される。)
入力画像信号S01、S02の前フレーム(S01)および現フレーム(S02)は、静止判定部131に入力される。静止判定部131は、前フレーム(S01)と現フレーム(S02)の間(隣接2フレーム間)で前記字幕部分に変化があったか否かをチェックする。このチェックでは、例えば、1x1〜4x4画素のような小さな画素ブロック内で、隣接2フレーム間の各対応画素の輝度レベルの差分の和が所定の閾値以下の場合に、そのブロック内では変化なしと判断する。この変化がなければ、静止判定フラグS131を出力する。この静止判定フラグS131と、エッジ隣接白ピーク領域検出部134からの画素単位字幕検出フラグS134と、エッジ隣接白ピーク領域検出部136からの画素単位字幕検出フラグS136は、画素単位静止字幕検出部132に入力される。
【0025】
画素単位静止字幕検出部132は、時間軸に沿って連続する2つのフレーム間(前フレームと現フレームの間)で前記字幕部分に変化がなかったことを静止判定フラグS131から検知したフレームについて、前フレームの画素単位字幕検出フラグS134と現フレームの画素単位字幕検出フラグS136を比較する。前フレームの画素単位字幕検出フラグS134と現フレームの画素単位字幕検出フラグS136が一致すれば、前フレーム(S01)の字幕と現フレーム(S02)の字幕は画素単位で静止していると判定される。その場合、画素単位字幕検出フラグS136は画素単位静止字幕検出フラグS130を出力する。このフラグS130が、図1の補間フレーム生成部120に、前述した画素単位字幕検出フラグS130として入力される。
【0026】
図1の補間フレーム生成部120は、入力画像信号S01、S02の第1フレームレート(24 frame/s)よりも高い第2フレームレート(120 frame/s)で、静止画字幕を含む補間フレームを生成する。補間フレーム生成部120は、所定数の補間フレームを入力画像信号の隣接フレーム間に挿入することで、入力画像信号を高フレームレートの出力画像信号S10に変換する。この出力画像信号S10が、高精細表示パネル(表示装置)20において表示される。
【0027】
なお、画素単位静止字幕検出フラグS130が立っている場合(現在のフレームに含まれる字幕が静止字幕である場合)、補間フレーム生成部120は、字幕として検出された画素については動きベクトル探索部110で求めた動きベクトルS110は使わずにゼロベクトルを使って補間フレームを生成する。そうすれば、補間フレームに含まれる字幕の背景が動いていても、補間フレームに含まれる字幕部分の文字自体は安定に静止して乱れのない見やすい字幕となる。
【0028】
図2の画素単位字幕検出部130の機能を纏めると次のようになる。すなわち、例えば映画の静止字幕は黒色で縁取られた白文字であることが殆どなので、エッジ検出部(133、135)により、静止字幕の縁取り黒と文字の白の境界(エッジ部)を検出する(図4(e))。そして、エッジ隣接白ピーク領域検出部(134、136)において、検出されたエッジ部の白ピーク領域側(図4(d))を字幕の白文字領域(図4(c))として、画素単位の字幕検出フラグ(図4(f))を生成する。こうして生成された字幕検出フラグ(S134、S136)は、画素単位静止字幕検出部132へ出力される。画素単位静止字幕検出部132では、隣接2フレーム間での静止判定により生成される静止判定フラグS131が立っている字幕領域の画素を静止字幕の画素と判定して、静止字幕検出フラグS130を生成する。
【0029】
図4(a)の例示では、白文字Aを含む小領域が全て静止字幕検出されている。図4(a)のように字幕検出された小領域から図4(b)のような画素単位の字幕検出結果が得られるまでの処理の流れは、簡単に纏めると次のようになる。まず、図4(c)で示される小領域字幕検出ラインL上の輝度分布は図4(d)に例示されるようになる。この輝度分布から、白と黒のエッジ部が図4(e)のように検出される。エッジ境界からある幅(複数画素)以上で白と黒レベルが存在した場合、図4(f)のように白ピーク領域を字幕領域として検出する。
【0030】
上記の説明では「相対的に低輝度な画像(黒地)にスーパーインポーズされた相対的に高輝度な文字形状(白文字)により字幕が構成される場合」を例にとったが、字幕を含む映像信号または画像信号の白黒レベルが反転されている場合(例えばポジフィルム画像に対するネガフィルム画像のような場合)も同様である。すなわち、「相対的に高輝度な画像(白地)にスーパーインポーズされた相対的に低輝度な文字形状(黒文字)により字幕が構成される場合」も同様に処理できる。その場合は上記の説明における「白」と「黒」を「黒」と「白」に適宜読み替えればよい。
【0031】
図3は、図2の画素単位字幕検出部130における静止字幕検出処理の一例を説明するフローチャートである。まず、小領域単位(画素フロック単位)に分割されたビデオフレームの最初の小領域単位において、小領域単位の字幕検出フラグ(S30またはS40)が立っているか否かがチェックされる(ST10)。フラグが立っておらず(ST10no)そのフレーム全体のチェックが終わっていなければ(ST20no)、次の小領域単位において、小領域単位の字幕検出フラグ(S30またはS40)が立っているか否かがチェックされる(ST10)。
【0032】
小領域単位の字幕検出フラグ(S30またはS40)が立っている場合(ST10yes)、字幕検出されたその小領域内において、エッジ検出フラグ(S133またはS135)が立っているか否かがチェックされる(ST12)。フラグが立っておらず(ST12no)そのフレーム全体のチェックが終わっていなければ(ST20no)、次の小領域単位において小領域単位の字幕検出フラグ(S30またはS40)が立っているか否かがチェックされ(ST10)、続いて字幕検出された小領域内においてエッジ検出フラグ(S133またはS135)が立っているか否かがチェックされる(ST12)。
【0033】
エッジ検出フラグ(S133またはS135)が立っている場合(ST12yes)、白文字の白ピーク領域であることを示す画素単位字幕検出フラグ(S134またはS136)が立っているか否かがチェックされる(ST14)。フラグが立っておらず(ST14no)そのフレーム全体のチェックが終わっていなければ(ST20no)、次の小領域単位において小領域単位の字幕検出フラグ(S30またはS40)が立っているか否かがチェックされ(ST10)、続いて字幕検出された小領域内においてエッジ検出フラグ(S133またはS135)が立っているか否かがチェックされ(ST12)、そして画素単位字幕検出フラグ(S134またはS136)が立っているか否かがチェックされる(ST14)。
【0034】
画素単位字幕検出フラグ(S134またはS136)が立っている場合(ST14yes)、静止判定フラグS131を参照することにより、字幕検出された領域が静止領域にあるか否かがチェックされる(ST16)。字幕検出された領域が静止領域にない場合(例えば字幕が動いていたり字幕の内容が変化している場合)(ST16no)、そのフレーム全体のチェックが終わっていなければ(ST20no)、ST10〜ST16の処理が再度実行される。
【0035】
字幕検出された領域が静止領域にあるときは(ST16yes)、静止判定フラグS131が立っている領域を「画素単位の字幕領域」として検出する(ST18)。この検出がなされると、図1の画素単位字幕検出フラグS130あるいは図2の画素単位静止字幕検出フラグS130が立つ。
【0036】
あるビデオフレーム内の何処かで「画素単位の字幕領域」が検出された(フラグS130が立つ)ときは、そのフレームに画素単位で検出できた静止字幕があったものとして処理を終了する(ST20yes)。あるビデオフレームの全体を通して「画素単位の字幕領域」が検出されなかったときは、そのフレームには、画素単位で検出できる静止字幕がなかったものとして処理を終了する(ST20yes)。図3の処理結果(フラグS130が立っているか否か)は、図1の補間フレーム生成部120における補間フレーム生成の際に、参照される。
【0037】
図9は、小領域単位の字幕領域検出処理の一例を説明するフローチャートである。まず、あるフレーム内の画像(種々な空間周波数成分を含む)において、特定の小領域を字幕領域として検出する(ST30)。ここで、特定の小領域は、(1)空間周波数高域成分が大きい画素が所定数以上あること、(2)低輝度から高輝度までのダイナミックレンジが所定の閾値を超えていること、そして(3)高輝度画素数が所定数以上あることの3条件を同時に満たす画素のブロックとして、検出できる。この検出は、当該フレーム内全域に渡り行う。当該フレーム内における全小領域の検出が完了したら(ST32yes)、検出された小領域を字幕領域として出力する(ST34)。
【0038】
図10は、補間フレーム生成処理の一例を説明するフローチャートである。まず、時間軸に沿って連続する前フレームと現フレーム(前後フレーム)から、ベクトル探索を行う(ST40)。このベクトル探索は、図1の動きベクトル探索部110により行うことができる。ベクトル探索が終了したら、前後フレーム内で、小領域単位の字幕検出があったか否かが判定される(ST42)。図9の処理において字幕領域の出力(ST34)がなければ、この判定は検出なしという判定となる(ST42no)。その場合は、ベクトル探索で求めたベクトルによって、例えば毎秒120フレームの補間フレームが生成される(ST44)。生成された毎秒120フレームの補間フレームは、毎秒24フレームの前フレームと現フレームとの間に、複数挿入される。こうして毎秒24フレームの入力画像信号が毎秒120フレームの出力画像信号に変換される(ST52)。
【0039】
このフレーム変換処理を実行中に、小領域単位の字幕検出があったと判定されると(ST42yes)、画素単位の字幕検出があったか否かが判定される(ST46)。図3の処理において画素単位の字幕検出(ST18)がなければ(ST46no)、ベクトル探索で求めたベクトルによって毎秒120フレームの補間フレームが生成される(ST44)。画素単位の字幕検出があったときは(ST46yes)、図2の静止判定部131により、字幕が静止しているか否かが判定される(ST48)。字幕が静止していなければ(静止判定フラグS131が立っていない)(ST48no)、ベクトル探索で求めたベクトルによって毎秒120フレームの補間フレームが生成される(ST44)。
【0040】
字幕が静止しているときは(静止判定フラグS131が立っている)(ST48yes)、字幕領域の動きベクトルをゼロベクトルとして、毎秒120フレームの補間フレームが生成される(ST50)。字幕領域の動きをゼロベクトルとして生成された毎秒120フレームの補間フレームは、毎秒24フレームの前フレームと現フレームとの間に複数挿入される。こうして毎秒24フレームの入力画像信号(静止画字幕入り)が毎秒120フレームの出力画像信号(静止画字幕入り)に変換される(ST52)。
【0041】
以上の処理は、高フレームレートに変換された出力画像信号を生成している間、反復される(ST54no)。入力画像信号が字幕なしの信号に切り換えられたら、あるいは補間フレーム生成処理が終了すれば(ST54yes)、図10の処理は終了する。
【0042】
図5は小領域単位の字幕領域検出結果の一例を示し、図6は画素単位の字幕領域検出結果の一例を示す。字幕領域の検出が小領域単位に止まる場合は、図5に示すように字幕部分の面積が背景の画像を邪魔する程度が大きい。しかし、字幕領域の検出をさらに進めて画素単位にすると、図6に示すように字幕部分の面積が小さくなり、背景画像をあまり邪魔しないが、それでいて字幕の明瞭度は維持される。すなわち、図6のように画素単位の字幕領域検出を行った方がより高品位できめ細かな字幕表示を行うことができる。
【0043】
図7は、小領域単位の字幕領域検出結果に基づく静止判定および補間フレーム生成の一例を説明する図である。また、図8は、画素単位の字幕領域検出結果に基づく静止判定および補間フレーム生成の一例を説明する図である。図8の例では、画素単位で字幕領域が検出された画素を中心に、前フレームと後フレームが静止しているか否かを検出している。例えば3x3画素のような小さなブロック内の画素差分の和が小さい場合には静止していると判断する。また、ブロックに限らず画素毎の差分で静止判定を行うこともできる。
【0044】
図10の処理において画素単位の字幕検出がなされてなかったときは、図7(b)のような字幕を含む複数の補間フレームが前フレーム(図7(a))と現フレーム(図7(c))の間に挿入される。一方、図10の処理において画素単位の字幕検出がされときは、図8(b)のような字幕を含む複数の補間フレームが前フレーム(図8(a))と現フレーム(図8(c))の間に挿入される。ここで、静止画字幕領域の動きベクトルをゼロベクトルとしたときは、背景(この例示では犬の画像)が動いていても、字幕は乱れることなく安定に静止する。
【0045】
このように、エッジ判定、白ピーク領域検出、静止判定などにより、画素ブロックよりさらに細かい画素単位で字幕検出を処理することができる。これにより、高品位な静止字幕の補間が可能となる。
【0046】
<実施の形態の効果>
例えばテレシネ映像のジャダーを低減するフィルムデジャダにおいて、字幕領域の画素ブロックから画素単位で文字部分検出することで、字幕の文字周辺をより細かく検出が可能になり、字幕部分についてより高精度な補間フレームが生成できる。すなわち、画素単位で字幕を検出する処理を行うことにより、字幕領域検出の精度が向上し、静止字幕においてより良い品位の補間フレームの生成が可能となる。
【0047】
なお、この発明の実施において、「静止字幕」とは複数フレームに渡って変化しない字幕をいう。例えばあるフレームの字幕が次のフレームで変化しなければ、その複数フレームに関して、その字幕は静止字幕である。ある複数フレーム間で静止字幕であったものがその後のフレームで別の字幕に変化し、変化後の字幕が複数フレームに渡り変化しなければ、その変化後の字幕も静止字幕といえる。
【0048】
<実施の形態のまとめ>
1.ビデオフレームを小領域に分割して小領域内の字幕の特徴を検出し、小領域を字幕として検出する装置または方法において、字幕として検出された小領域近傍の任意の範囲に含まれる小領域毎に、高輝度画素と判定された画素数が任意の閾値を超える場合、その小領域を字幕領域として処理する。さらに、字幕として検出された小領域、および前述の処理により字幕領域とされた小領域近傍の任意の範囲に含まれる小領域毎に、低輝度画素と判定された画素数が任意の閾値を超える場合、その小領域を字幕領域として処理する。そうすることで、小領域毎に字幕領域として検出された字幕ブロックにおいて、白黒のエッジ検出箇所と隣接する黒から白への変化点の白ピーク領域側を字幕と判定し、字幕部分が前後のフレームより静止判定された部分を静止字幕として判定する。
【0049】
2.フレーム補間処理においては、画面内で静止字幕と判定された領域をゼロベクトルとする。
【0050】
<実施の形態と発明との対応例>
(a)この発明の一実施の形態に係る映像機器は、字幕部分判定モジュールと、静止字幕検出モジュールと、動きベクトル検出モジュールと、補間フレーム生成モジュールと、表示モジュールを具備している。
【0051】
ここで、字幕部分判定モジュール(図2の133〜136)は、複数画素で構成されるビデオフレーム内の画像のソースを入力画像信号としたとき、この入力画像信号に含まれる字幕部分を画素単位で検出するものであって、輝度レベルが変化する画像エッジの検出箇所と隣接する高輝度領域側または輝度レベルが変化する画像エッジの検出箇所と隣接する低輝度領域側の画素もしくは画素群を字幕部分と判定する。
【0052】
静止字幕検出モジュール(図2の131、132)は、前記ビデオフレームに相当するものであって時間軸に沿って連続する前フレームと現フレームを比較することにより、前記字幕部分が無変化であることが検出された場合に、その字幕部分を静止字幕として検出する。
【0053】
動きベクトル検出モジュール(図1の110)は、前記前フレームおよび現フレームから第1フレームレート(毎秒24フレーム)の前記入力画像信号に含まれる入力画像の動きベクトルを検出する。
【0054】
補間フレーム生成モジュール(図1の120)は、前記動きベクトル検出モジュール(110)による動きベクトルの検出結果(S110)または前記静止字幕検出モジュール(131、132)による静止字幕の検出結果(S130)に基づいて、前記第1フレームレート(毎秒24フレーム)よりも高レートである第2フレームレート(毎秒120フレーム)の補間フレームを生成(図10のST44またはST50)する。そして、この補間フレームを前記前フレームと前記現フレームの間に挿入することにより、前記入力画像信号(S01、S02)が前記第2フレームレート(毎秒120フレーム)の出力画像信号(S10)に変換される。
【0055】
そして、表示モジュール(図1の20)は、前記補間フレーム生成モジュール(120)からの前記出力画像信号(S10)を表示する。
【0056】
(b)前記静止字幕検出モジュール(131、132)が前記静止字幕として検出した字幕部分については、前記動きベクトル検出モジュール(110)による動きベクトル検出結果を用いず、その字幕部分の動きベクトルをゼロベクトルとして前記補間フレームを生成する(図10のST46〜ST50)。
【0057】
(c)前記字幕部分判定モジュール(図2のエッジ検出部133,135、エッジ隣接白ピーク領域検出部134,136)は、前フレームエッジ検出部(133)と、前フレームエッジ隣接ピーク領域検出部(134)を含む。ここで、前記前フレームエッジ検出部(133)は、前記ビデオフレーム内の1つの水平ライン(注目ラインL)上に存在する画素群の輝度レベル分布(図4(d))において輝度レベル変化を検出し、この輝度レベル変化を示す前フレームエッジ検出結果(S133)が前記前フレームエッジ隣接ピーク領域検出部(134)に入力される。前記前フレームエッジ隣接ピーク領域検出部(134)は、前記前フレームエッジ検出結果(S133)から前記前フレームにおける前記字幕部分の文字(A)のエッジを画素単位で検出する(図4(e))。
【0058】
(d)また、前記字幕部分判定モジュール(図2のエッジ検出部133,135、エッジ隣接白ピーク領域検出部134,136)は、現フレームエッジ検出部(135)と、現フレームエッジ隣接ピーク領域検出部(136)を含む。ここで、前記現フレームエッジ検出部(135)は、前記ビデオフレーム内の1つの水平ライン(注目ラインL)上に存在する画素群の輝度レベル分布(図4(d))において輝度レベル変化を検出し、この輝度レベル変化を示す現フレームエッジ検出結果(S135)が前記現フレームエッジ隣接ピーク領域検出部(136)に入力される。前記現フレームエッジ隣接ピーク領域検出部(136)は、前記現フレームエッジ検出結果(S135)から前記現フレームにおける前記字幕部分の文字(A)のエッジを画素単位で検出する(図4(e))。
【0059】
(e)この発明の一実施の形態に係る画像処理方法では、
複数画素で構成されるビデオフレーム内の画像のソースを入力画像信号としたとき、この入力画像信号に含まれる字幕部分を画素単位で検出する際に、輝度レベルが変化する画像エッジの検出箇所と隣接する高輝度領域側または輝度レベルが変化する画像エッジの検出箇所と隣接する低輝度領域側の画素もしくは画素群を字幕部分と判定し(図3のST10yes〜ST14yes;図10のST42yes〜ST46yes)、
前記ビデオフレームに相当するものであって時間軸に沿って連続する前フレームと現フレームを比較することにより前記字幕部分が無変化であることが検出された場合に、その字幕部分を静止字幕として検出し(図3のST16yes、ST18;図10のST48yes)、
前記前フレームおよび現フレームから第1フレームレート(毎秒24フレーム)の前記入力画像信号に含まれる入力画像の動きベクトルを検出し(図10のST40)、
前記動きベクトルの検出結果(S110)または前記静止字幕の検出結果(S130)に基づいて前記第1フレームレート(毎秒24フレーム)よりも高レートである第2フレームレート(毎秒120フレーム)の補間フレームを生成し(図10のST44またはST50)、この補間フレームを前記前フレームと前記現フレームの間に挿入して、前記入力画像信号(S01、S02)を前記第2フレームレート(毎秒120フレーム)の出力画像信号(S10)に変換する(図10のST52)。
【0060】
なお、この発明は前述した実施の形態に限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で種々に変形することが可能である。また、各実施形態は可能な限り適宜組み合わせて実施してもよく、その場合組み合わせた効果が得られる。更に、上記実施形態には種々の段階の発明が含まれており、開示される複数の構成要件における適当な組み合わせにより種々の発明が抽出され得る。例えば、実施形態に示される全構成要件からいくつかの構成要件が削除されても、発明が解決しようとする課題の欄で述べた課題が解決でき、発明の効果の欄で述べられている効果が得られる場合には、この構成要件が削除された構成が発明として抽出され得る。
【符号の説明】
【0061】
10…フレーム補間部;20…表示パネル(表示装置);30…小領域単位字幕検出部(前フレーム用);40…小領域単位字幕検出部(現フレーム用);110…動きベクトル探索部;120…補間フレーム生成部;130…画素単位字幕検出部;131…静止判定部;132…画素単位静止字幕検出部;133、135…エッジ検出部;134、136…エッジ隣接白ピーク領域検出部。

【特許請求の範囲】
【請求項1】
複数画素で構成されるビデオフレーム内の画像に含まれる字幕部分を画素単位で検出するものであって、
輝度レベルが変化する画像エッジの検出箇所と隣接する高輝度領域側または輝度レベルが変化する画像エッジの検出箇所と隣接する低輝度領域側の画素もしくは画素群を字幕部分と判定する字幕部分判定モジュールと、
時間軸に沿って連続する2つのビデオフレームを比較することにより前記字幕部分が無変化であることが検出された場合に、その字幕部分を静止字幕として検出する静止字幕検出モジュールを具備した静止字幕検出装置。
【請求項2】
前記字幕部分を含む入力画像信号が第1フレームレートの前フレームおよび現フレームを含み、
前記静止字幕検出装置が前記入力画像信号を前記第1フレームレートより高レートである第2フレームレートの出力画像信号に変換するフレーム補間モジュールを具備し、
前記フレーム補間モジュールが、前記入力画像信号の前フレームおよび現フレームから入力画像の動きベクトルを検出する動きベクトル検出モジュールと、前記前フレームと前記現フレームの間に前記第2フレームレートの補間フレームを挿入する補間フレーム挿入モジュールを含み、
前記補間フレーム挿入モジュールが、前記動きベクトル検出モジュールによる動きベクトルの検出結果または前記静止字幕検出モジュールによる静止字幕の検出結果に基づいて、前記補間フレームを生成するように構成される請求項1に記載の静止字幕検出装置。
【請求項3】
前記静止字幕検出モジュールが前記静止字幕として検出した字幕部分については前記動きベクトル検出モジュールによる動きベクトル検出結果を用いずその字幕部分の動きベクトルをゼロベクトルとして前記補間フレームを生成するように構成される請求項2に記載の静止字幕検出装置。
【請求項4】
前記前フレームを小領域に分割しこの小領域単位で前記字幕部分を検出する前フレーム少領域単位字幕検出モジュールと、前記現フレームを小領域に分割しこの小領域単位で前記字幕部分を検出する現フレーム少領域単位字幕検出モジュールをさらに具備した請求項2に記載の静止字幕検出装置。
【請求項5】
前記字幕部分判定モジュールは、前フレームエッジ検出部と、前フレームエッジ隣接ピーク領域検出部を含み、
前記前フレームエッジ検出部は、前記ビデオフレーム内の1つの水平ライン上に存在する画素群の輝度レベル分布において輝度レベル変化を検出し、この輝度レベル変化を示す前フレームエッジ検出結果が前記前フレームエッジ隣接ピーク領域検出部に入力され、
前記前フレームエッジ隣接ピーク領域検出部は、前記前フレームエッジ検出結果から前記前フレームにおける前記字幕部分の文字のエッジを画素単位で検出する請求項2に記載の静止字幕検出装置。
【請求項6】
前記字幕部分判定モジュールは、現フレームエッジ検出部と、現フレームエッジ隣接ピーク領域検出部を含み、
前記現フレームエッジ検出部は、前記ビデオフレーム内の1つの水平ライン上に存在する画素群の輝度レベル分布において輝度レベル変化を検出し、この輝度レベル変化を示す現フレームエッジ検出結果が前記現フレームエッジ隣接ピーク領域検出部に入力され、
前記現フレームエッジ隣接ピーク領域検出部は、前記現フレームエッジ検出結果から前記現フレームにおける前記字幕部分の文字のエッジを画素単位で検出する請求項2に記載の静止字幕検出装置。
【請求項7】
前記画素単位で検出される前記文字には、その周辺の文字縁が含まれる請求項5または請求項6に記載の静止字幕検出装置。
【請求項8】
複数画素で構成されるビデオフレーム内の画像のソースを入力画像信号としたとき、この入力画像信号に含まれる字幕部分を画素単位で検出するものであって、輝度レベルが変化する画像エッジの検出箇所と隣接する高輝度領域側または輝度レベルが変化する画像エッジの検出箇所と隣接する低輝度領域側の画素もしくは画素群を字幕部分と判定する字幕部分判定モジュールと、
前記ビデオフレームに相当するものであって時間軸に沿って連続する前フレームと現フレームを比較することにより前記字幕部分が無変化であることが検出された場合に、その字幕部分を静止字幕として検出する静止字幕検出モジュールと、
前記前フレームおよび前記現フレームから第1フレームレートの前記入力画像信号に含まれる入力画像の動きベクトルを検出する動きベクトル検出モジュールと、
前記動きベクトル検出モジュールによる動きベクトルの検出結果または前記静止字幕検出モジュールによる静止字幕の検出結果に基づいて前記第1フレームレートよりも高レートである第2フレームレートの補間フレームを生成し、この補間フレームを前記前フレームと前記現フレームの間に挿入して、前記入力画像信号を前記第2フレームレートの出力画像信号に変換する補間フレーム生成モジュールと、
前記補間フレーム生成モジュールからの前記出力画像信号を表示する表示モジュールを具備した映像機器。
【請求項9】
複数画素で構成されるビデオフレーム内の画像のソースを入力画像信号としたとき、この入力画像信号に含まれる字幕部分を画素単位で検出する際に、輝度レベルが変化する画像エッジの検出箇所と隣接する高輝度領域側または輝度レベルが変化する画像エッジの検出箇所と隣接する低輝度領域側の画素もしくは画素群を字幕部分と判定し、
前記ビデオフレームに相当するものであって時間軸に沿って連続する前フレームと現フレームを比較することにより前記字幕部分が無変化であることが検出された場合に、その字幕部分を静止字幕として検出し、
前記前フレームおよび前記現フレームから第1フレームレートの前記入力画像信号に含まれる入力画像の動きベクトルを検出し、
前記動きベクトルの検出結果または前記静止字幕の検出結果に基づいて前記第1フレームレートよりも高レートである第2フレームレートの補間フレームを生成し、この補間フレームを前記前フレームと前記現フレームの間に挿入して前記入力画像信号を前記第2フレームレートの出力画像信号に変換する画像処理方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate