説明

画像出力装置及び画像出力方法

【課題】原画像以外の内挿画像を生成して出力する回路を備えた画像出力装置において、静止字幕部分の乱れによる画質劣化を最少限に抑え、高画質化を行う回路を実現でき、かつ特別なバッファメモリを追加することなく回路を実装することを可能とする。
【解決手段】静止字幕検出回路3にて検出された静止字幕領域に対して、内挿画像生成回路6において原画像をもとに求めた内挿ベクトルから内挿画像を生成する際に、静止字幕領域と判定された画素に対する内挿ベクトルの値を0として扱う。これにより静止字幕が周辺の動画像部分に侵食されて静止字幕が削られてしまうのを防ぐ。また、静止字幕領域外における画素で内挿画像生成時に、内挿ベクトルが指示する画素が静止字幕領域であった場合に、その内挿ベクトルの値を0として内挿画像生成を行う。これにより、静止字幕領域内の画素が静止字幕領域外に飛び出してしまうのを防ぐ。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像出力装置及び画像出力方法に関し、液晶テレビなどの映像表示装置に画像を表示する技術に属する。
【背景技術】
【0002】
従来、テレビ放送は1秒間に60フレームの画像を送信し、テレビ受像機側でこれを受信し、1秒間に60フレームの画像を出力することで動画を表現している。液晶テレビなどのホールド型ディスプレイでは、非特許文献1にあるように、人間の視覚特性上、エッジぼやけなどの画質劣化を生むひとつの原因となっていた。
【0003】
この画質劣化を低減する技術のひとつとして、1秒間に表示する画像枚数を2倍(秒間120フレーム)に増加した倍速表示技術がある。
これは、受信した秒間60フレームの原画像に対して、原画像と原画像の間に、原画像を元に生成した補間画像(以後「内挿画像」という)を生成し、1フレームおきに原画像と内挿画像を交互に表示させる方法である。
【0004】
内挿画像を生成する方法については種々の方法があるが、その一例として、ある時刻の原画像(フレームN)と、その1/60秒後の原画像(フレームN+1)の2つの原画像間の動きベクトルを求め、その動きベクトルを元に原画像(フレームN)の1/120秒後の内挿画像を生成する方法がある。
【0005】
図4にこの内挿画像を生成し、原画像と内挿画像を交互に表示するための表示回路の構成例を示す。本構成例では、なんらかの形式で入力された原画像の入力データを、画像入力部1でRGBフォーマットとした画像を用いる。
この表示回路は、RGBフォーマットの画像を蓄積するためのRGBバッファメモリ9と、同じRGBフォーマットの画像を輝度(Y)信号に変換するRGB−Y変換回路2と、RGB―Y変換回路2で変換された輝度画像を蓄積するためのYバッファメモリ8と、連続する2フレームの原画像の輝度画像から動きベクトルを検出する動きベクトル検出回路4と、求めた動きベクトルから最適な動きベクトルを判定し選択する内挿ベクトル評価回路5と、求めた内挿ベクトルと原画像から内挿画像を生成する内挿画像生成回路6と、原画像と内挿画像とを同期信号とともに交互に出力する画像出力部7とから構成される。
【0006】
以下、本構成例での動作について示す。
入力された原画像データのRGBフォーマット画像は、原画像フレームとして出力されたり、および内挿画像生成に用いられるため、RGBバッファメモリ9へ書き込まれる。一方で、入力された原画像データのRGBフォーマット画像は、動きベクトルを求めるためにRGB−Y変換回路2にて輝度画像に変換される。変換後の輝度画像は、Yバッファメモリ8に格納されると同時に、前フレームの輝度画像と共に動きベクトル検出回路4へと送信される。
【0007】
動きベクトル検出回路4では、得られた2フレーム間の輝度画像より動きベクトルを求める。動きベクトルを求める方法には種々の方法があるが、いずれの方法でもよいものとする。ただし、いずれの方法にせよ、画像の内容によってはベクトル検出結果に大きな誤差を含む場合がある。例えば原画像(フレームN−1)の時刻では存在していたある物体が、原画像(フレームN)では別の物体の奥側に入りこむことで存在しなくなってしまい、動きベクトルが正常に検出できない場合などである。
【0008】
次に、求められた動きベクトルを、内挿ベクトル評価回路5へと送信する。内挿ベクトル評価回路5では、主に、得られた動きベクトルの候補の中から最適な動きベクトルを判定し選択を行う。評価対象となるある画素(x,y)を評価した場合に、場合によっては2つ以上の動きベクトルが交差する場合もあるし、逆に1つの動きベクトルも指示されない場合がある。このような場合に、最も確からしいと判断されるベクトルを選択したり、あるいは周辺の動きベクトルの状態を鑑みて、その平均値などで補間されたベクトルを割り当てて、最終的に原画像から内挿画像を生成するための内挿ベクトルを決定する。この時に、内挿ベクトルの判定精度が良くない場合は、生成される内挿画像が前後の原画像との連続性を失い、画質劣化の原因となる。
【0009】
最後に、求められた内挿ベクトルが内挿画像生成回路6へ送信される。原画像を元に生成された該内挿ベクトルで補間した内挿画像は、画像出力部7によって同期信号とともに原画像と交互に出力される。
【0010】
このようにして、秒間60フレームの画像を倍速の秒間120フレームの画像に拡張して液晶テレビなどのディスプレイに表示する。さらなる画質劣化を防ぐ方法として、原画像(フレームN)と原画像(フレームN−1)の間に生成する内挿画像を2フレームに増やして、原画像(フレームN)の1/180秒後、2/180秒後に表示させて、3倍の1秒間180フレーム表示にさせたり、同様に4倍の1秒間240フレーム表示させることも可能である。
この場合、動きベクトルから生成する内挿ベクトルの大きさを、内挿する画像の時刻に合わせて調整することが必要である。
【0011】
なお、動きベクトル検出においては、RGBフォーマット画像のまま実現することも可能であるが、回路規模が大きくなってしまう事を鑑みて、本構成例ではRGB−Y変換回路2を用いている。
【0012】
一方、画像から文字などの字幕を検出する技術が存在し、特許文献1〜3に示すような方法がある。
特許文献1では、ダイジェスト映像を作成する目的で、動画像から静止字幕領域(テロップ領域)を抽出する方法について開示している。この発明では、時間的に隣接する2フレームの画像間で、輝度データの差分を用いて静止字幕領域の判定を行っている。
しかしながら、特許文献1の発明のようにして検出された静止字幕領域は、たとえば2フレーム間で静止字幕部分以外の画像でほとんど動きの無い画像が連続した場合、本来静止字幕では無い画像部分についても、誤って静止字幕領域と判定されてしまう可能性があった。
【0013】
特許文献2に示す方法では、1フレーム内の画像のみを用いて、輝度分布からテロップ文字を抽出する提案がなされている。この発明では時間的に隣接するフレーム間の情報が全く使われていないため、フレーム間で動きのある字幕、静止している字幕を問わず検出される。
【0014】
特許文献3に示す方法では、1フレーム内で輝度が均一である部分の抽出、および高周波領域検出による字幕境界部分の抽出、さらに多数のフレームメモリによる一定時間無変化である部分の抽出を行い、これらの抽出結果から静止字幕領域を抽出する提案がなされている。この発明では、静止字幕(テロップ)の下記特徴を利用して検出を行っている。
(1)同一信号レベルの画素で構成される。
(2)通常3〜4秒以上は表示されるので、テロップを構成する画素は所定の時間以上、同一の信号レベルを保持する。
(3)テロップを目立たせるため、背景となる画と信号レベルで大きく差がある。
【0015】
つまりテロップ領域は画像平面において比較的空間周波数の高い領域となる。ただし、特許文献3の発明によれば、抽出される静止字幕領域は、テロップ全体を包含する矩形領域に留まる。また、輝度差分の演算を全て隣接する画素間との差分で行っているために、例えば静止字幕部分が鮮明な画像においては精度良く検出可能であるが、字幕境界部分がボケてしまっているような画像に対しては検出することができない。
【先行技術文献】
【特許文献】
【0016】
【特許文献1】特開平12−23062号公報
【特許文献2】特開平12−182053号公報
【特許文献3】特開平10−233994号公報
【非特許文献】
【0017】
【非特許文献1】電子情報通信学会技術研究報告、電子ディスプレイ(EID2001-102)
【発明の概要】
【発明が解決しようとする課題】
【0018】
上記背景技術によれば、倍速表示技術により高画質化が可能な一方で、防ぎ得ない動きベクトル検出の検出誤りや、内挿ベクトルの補間処理により、動画像の連続性を損なった内挿画像を生成してしまい、視聴者にとって見苦しい動画を出力してしまうという課題があった。特に、静止字幕のように輪郭が鮮鋭でかつ静止状態にある画像の乱れは、動画像において視認され易く、画質劣化の要因となっていた。
【0019】
一方、字幕の検出技術については、動いている字幕と静止字幕の区別ができなかったり、静止字幕を検出できても、字幕以外の静止画像部分まで誤検出される場合もある。また、鮮鋭な画像に対しては精度よく静止字幕を検出を行うアルゴリズムであっても、例えば原画からスケーリング処理などによって静止字幕境界部分がボケてしまったような画像に対して、正確な検出が行えない問題があった。
また、数フレーム間の連続するデータを記憶するために、大量のメモリが必要であったり、検出される静止字幕領域が大まかな矩形領域のみであった。
【0020】
本発明は、上述のごとき実情に鑑みてなされたもので、原画像以外の内挿画像を生成して出力する回路を備えた画像出力装置において、静止字幕部分の乱れによる画質劣化を最少限に抑え、高画質化を行う回路を実現でき、かつ特別なバッファメモリを追加することなく回路を実装すること可能とした画像出力装置、及び画像出力装置で実行する画像出力方法を提供することを目的とするものである。
【課題を解決するための手段】
【0021】
上記課題を解決するために、本発明の第1の技術手段は、表示する画像フレームを時間的に連続する2つの入力画像フレームの間に、1つまたは複数の内挿フレーム(補間フレーム)を生成し出力する画像出力装置において、画像を入力するための画像入力部と、入力した画像の画像フォーマットを変換せずにそのまま蓄積するための原画像蓄積用バッファメモリと、入力した画像を順次輝度情報のみの画像フォーマットに変換し輝度画像を生成する画像フォーマット変換回路と、輝度画像を蓄積するための輝度画像蓄積用バッファメモリと、時間的に連続した2フレームの輝度画像間の動きベクトルを検出する動きベクトル検出回路と、動きベクトルを用いて時間的に連続した2フレームの間に挿入される内挿フレームの各画素または複数画素で構成されるブロックの内挿ベクトルを選定する内挿ベクトル評価回路と、入力した時間的に連続した2フレームの輝度画像間の静止している字幕画像を検出する静止字幕検出回路と、原画像蓄積用バッファメモリに蓄積された原画像を元に内挿ベクトルおよび静止字幕検出結果から所望の内挿フレームを生成する内挿画像生成回路と、原画像蓄積用バッファメモリに蓄えられた原画像フレームおよび内挿画像生成回路で生成された内挿フレームを時間的に連続するように並べて出力する画像出力部とを有し、内挿画像生成回路は、静止字幕検出回路で字幕と判定された画素または複数画素を含むブロックに割り当てられた内挿ベクトルの値を0とし、静止字幕検出回路で字幕と判定されなかった画素または複数画素を含むブロックのうち内挿ベクトルが指示する画素において字幕と判定された場合は画素または複数画素を含むブロックに割り当てられた内挿ベクトルを0として内挿フレームを生成することを特徴としたものである。
【0022】
第2の技術手段は、第1の技術手段において、静止字幕検出回路が、評価対象画素を中心として点対象位置にある2点の画素の輝度差分絶対値が時間的に連続する2フレームにおいてともに閾値を超え、かつ2フレーム間で輝度差分絶対値がほとんど同じ値である場合に、評価対象画素を字幕境界画素と判定し、複数画素で構成されるブロック内に字幕境界画素の数がある閾値を超えた場合に、ブロック内の画素を字幕と判定することを特徴としたものである。
【0023】
第3の技術手段は、第2の技術手段において、静止字幕検出回路が、字幕境界画素として判定された画素について、評価対象画素が属する行(ライン)に存在する字幕境界画素として判定された画素数と、ラインの直下のラインに存在する字幕境界画素として判定された画素数が、共にある閾値を超えている場合に、評価対象画素が属するラインの画素全てを黒帯境界と判定し、字幕境界画素として判定した画素の判定を解除することを特徴としたものである。
【0024】
第4の技術手段は、第2または第3の技術手段において、時間的に連続する2つの原画像フレームの各々の評価対象画素について、静止字幕検出回路が、評価対象画素の輝度差分絶対値がある閾値を超えた場合に、評価対象画素を静止画素と判定し、静止画素の周辺画素に前記字幕境界画素が存在する場合に、静止画素を字幕と判定し、複数画素で構成されるブロック内における字幕境界画素の数と字幕画素の数の和がある閾値を超えた場合に、ブロック内の画素を字幕と判定することを特徴としたものである。
【0025】
第5の技術手段は、第2〜第4のいずれか1の技術手段において、入力画像フレームのうち時間的に連続する2つのフレームについて、画面全体でほとんど差分が無い画像と判断された場合に、いずれか一方のフレームを破棄し2つのフレームの間に内挿フレームを生成せず、静止字幕検出回路における字幕検出処理を行わないことを特徴としたものである。
【0026】
第6の技術手段は、表示する画像フレームを時間的に連続する2つの入力画像フレームの間に、1つまたは複数の内挿フレーム(補間フレーム)を生成し出力する画像出力装置により実行する画像出力方法において、画像出力装置に画像を入力する画像入力ステップと、入力した画像の画像フォーマットを変換せずにバッファメモリにそのまま蓄積する原画像蓄積ステップと、入力した画像を順次輝度情報のみの画像フォーマットに変換し輝度画像を生成する画像フォーマット変換ステップと、輝度画像をバッファメモリに蓄積する輝度画像蓄ステップと、時間的に連続した2フレームの輝度画像間の動きベクトルを検出する動きベクトル検出ステップと、動きベクトルを用いて前記時間的に連続した2フレームの間に挿入される内挿フレームの各画素または複数画素で構成されるブロックの内挿ベクトルを選定する内挿ベクトル評価ステップと、入力した時間的に連続した2フレームの輝度画像間の静止している字幕画像を検出する静止字幕検出ステップと、原画像蓄積ステップでバッファメモリに蓄積された原画像を元に内挿ベクトルおよび静止字幕検出結果から所望の内挿フレームを生成する内挿画像生成ステップと、原画像蓄積ステップでバッファメモリに蓄えられた原画像フレームおよび内挿画像生成ステップで生成された内挿フレームを時間的に連続するように並べて出力する画像出力ステップとを有し、内挿画像生成ステップは、静止字幕検出ステップで字幕と判定された画素または複数画素を含むブロックに割り当てられた内挿ベクトルの値を0とし、静止字幕検出ステップで字幕と判定されなかった画素または複数画素を含むブロックのうち内挿ベクトルが指示する画素において字幕と判定された場合は画素または複数画素を含むブロックに割り当てられた内挿ベクトルを0として内挿フレームを生成することを特徴としたものである。
【0027】
第7の技術手段は、第6の技術手段において、静止字幕検出ステップが、評価対象画素を中心として点対象位置にある2点の画素の輝度差分絶対値が、時間的に連続する2フレームにおいてともに閾値を超え、かつ2フレーム間で輝度差分絶対値がほとんど同じ値である場合に、評価対象画素を字幕境界画素と判定し、複数画素で構成されるブロック内に字幕境界画素の数がある閾値を超えた場合に、ブロック内の画素を字幕と判定することを特徴としたものである。
【0028】
第8の技術手段は、第7の技術手段において、静止字幕検出ステップが、字幕境界画素として判定された画素について、評価対象画素が属する行(ライン)に存在する字幕境界画素として判定された画素数と、ラインの直下のラインに存在する字幕境界画素として判定された画素数が、共にある閾値を超えている場合に、評価対象画素が属するラインの画素全てを黒帯境界と判定し、字幕境界画素として判定した画素の判定を解除することを特徴としたものである。
【0029】
第9の技術手段は、第7または第8の技術手段において、静止字幕検出ステップが、時間的に連続する2つの原画像フレームの各々の評価対象画素について、評価対象画素の輝度差分絶対値がある閾値を超えた場合に、評価対象画素を静止画素と判定し、静止画素の周辺画素に字幕境界画素が存在する場合に、静止画素を字幕と判定し、複数画素で構成されるブロック内における字幕境界画素の数と字幕画素の数の和がある閾値を超えた場合に、ブロック内の画素を字幕と判定することを特徴としたものである。
【0030】
第10の技術手段は、第7〜第9のいずれか1の技術手段において、入力画像フレームのうち時間的に連続する2つのフレームについて、画面全体でほとんど差分が無い画像と判断された場合に、いずれか一方のフレームを破棄し2つのフレームの間に内挿フレームを生成せず、静止字幕検出ステップにおける字幕検出処理を行わないことを特徴とする画像出力方法。
【発明の効果】
【0031】
本発明によれば、倍速表示可能な液晶テレビなどのディスプレイにおいて、静止字幕部分の乱れによる画質劣化を最少限に抑え、高画質化を行う回路を実現でき、かつ特別なバッファメモリを追加することなく、実装することが可能となる。
また、倍速表示以外のディスプレイについても、原画像以外に内挿画像を生成するような場合についても同様である。
【図面の簡単な説明】
【0032】
【図1】本発明の画像出力装置が備えるフレームレート変換処理回路の一形態を示す構成を模式的に示す説明図である。
【図2】図1の静止字幕検出回路による静止字幕領域の検出手順を説明するための図である。
【図3】本発明の画像出力装置が備えるフレームレート変換処理回路の一形態を示す構成を模式的に示す説明図である。
【図4】従来の画像出力装置が備えるフレームレート変換処理回路の一形態を示す構成を模式的に示す説明図である。
【図5】3−2プルダウンされた映像フレームを模式的に示す説明図である。
【図6】3−2プルダウンされた映像フレームに対して、内挿画像を生成するフレーム構成、および静止字幕検出の更新タイミングの一形態を模式的に示す説明図である。
【発明を実施するための形態】
【0033】
本発明の実施形態では、倍速表示技術等による内挿画像生成時に発生する静止字幕部分の乱れを防ぐために、高精度な静止字幕検出による静止字幕検出回路を、2フレーム分のバッファメモリで実装可能な回路を構成する。
字幕検出回路にて検出された静止字幕領域に対して、内挿画像生成回路において原画像をもとに求めた内挿ベクトルから内挿画像を生成する際に、静止字幕領域と判定された画素に対する内挿ベクトルの値を0として扱うことにより、静止字幕が周辺の動画像部分に侵食されて静止字幕が削られてしまうのを防ぐ。また、静止字幕領域外における画素で内挿画像生成時に、内挿ベクトルが指示する画素が静止字幕領域であった場合に、その内挿ベクトルの値を0として内挿画像生成を行うことにより、静止字幕領域内の画素が静止字幕領域外に飛び出してしまうのを防ぐことが可能となり、画質劣化を防ぎ高画質化を実現する。
上記の特徴を有する本発明の実施形態を図面を参照して、さらに具体的に説明する。
【0034】
(実施形態1)
実施形態1として、秒間60フレームの入力画像を取得し、フレームレート変換処理(秒間60フレームの映像を秒間120フレームの映像に変換する)を行う回路において、字幕付き映像が入力される場合について説明する。
【0035】
(実施形態1:構成)
図1は、本発明の画像出力装置が備えるフレームレート変換処理回路の一形態を示す構成を模式的に示す説明図である。
図1において、入力画像データ11が画像入力部1に入力され、RGBフォーマットの原画像データ17は、2つの信号系統に分散される。第1の信号系統は、RGB−Y変換回路2へ入力され、輝度画像へフォーマット変換された後、Yバッファメモリ8に輝度画像データを蓄積する。Yバッファメモリ8は2フレーム分のデータ容量を持つメモリで構成されており、静止字幕検出回路3、および動きベクトル検出回路4に接続されている。
【0036】
静止字幕検出回路3は、連続する2つのフレームの輝度画像データ(フレームN)12および輝度画像データ(フレームN−1)13から、画像内の静止字幕領域を検出する。検出された字幕領域情報16は内挿画像生成回路6に送られる。
動きベクトル検出回路4は、連続する2つのフレームの輝度画像データ12および輝度画像データ13から、画像間の動きベクトル検出を行う。
【0037】
動きベクトル検出回路4で検出された結果は動きベクトル14として、内挿ベクトル評価回路5に送られ、動きベクトル検出回路4で検出された結果が妥当であるかの評価が行われ、背景技術と同様な方法により最終的な内挿ベクトル15が得られる。得られた内挿ベクトル15は静止字幕検出回路3で生成された字幕領域情報16と共に、内挿画像生成回路6へ送られる。
【0038】
第2の信号系統は、RGBバッファメモリ9に接続され、RGBフォーマットの原画像データ17をRGBバッファメモリ9へ蓄積する。蓄積された原画像データ17は、第1の信号系統で生成された内挿ベクトル15と字幕領域情報16と同期したタイミングで内挿画像生成用原画像データ18として内挿画像生成回路6へと出力するよう構成されている。
【0039】
内挿画像生成回路6は、得られた内挿画像生成用原画像データ18、および内挿ベクトル15、字幕領域情報16を元に内挿画像20を生成する。参照する内挿画像生成用原画像データ18は、フレームN番目の原画像データであってもフレームN−1番目の原画像データであっても構わず、フレームN番目の原画像データで内挿する場合は、ベクトルの方向が反転する。
【0040】
内挿画像生成回路6は、生成した内挿画像20を出力用原画像データ19と交互に画像出力部7へと出力する。出力順序は、N−1番目の原画像データ、内挿画像データ、N番目の原画像データの順になるようにする。
画像出力部7では、ディスプレイ表示に必要な同期信号が付加されて所定のタイミングで出力画像データ21をディスプレイ表示装置に対して出力する。
【0041】
(実施形態1:動作)
続いて、本実施形態の動作について説明する。
画像入力部1に対して、ある時刻の第N番目の入力画像データ11が入力され、第1の信号系統および第2の信号系統にRGBフォーマットの原画像データ17が送信される。
第1の信号系統ではRGBフォーマットの原画像データ17がRGB−Y変換回路2に入力され、フォーマット変換処理により輝度画像(フレームN)12が生成される。輝度画像(フレームN)12はYバッファメモリ8に書き込まれると同時に、時間的に連続する過去の輝度画像(フレームN−1)13がYバッファメモリ8から読み出され、これら2つのフレーム(フレームN,フレームN−1)の輝度画像が静止字幕検出回路3および動きベクトル検出回路4に送信される。
【0042】
動きベクトル検出回路4では、入力された2フレームの輝度画像から、動きベクトル14を求める。動きベクトル14を求める方法については種々の提案がなされており、例えばブロックマッチングによる動きベクトルの検出方法がある。これは複数の画素をまとめてブロック化し、フレームNとフレームN−1の2フレーム間で、ブロック単位に一致しているか否かを評価し、最も一致したブロックとの位置関係から動きベクトルを求める方法である。得られた動きベクトル14は内挿ベクトル評価回路5に送信される。
【0043】
内挿ベクトル評価回路5では、内挿画像生成に必要な内挿ベクトル15を生成する。内挿ベクトル評価回路5は動きベクトル14を元に、評価対象画素(または複数の画素からなる評価対象ブロック)の内挿ベクトルとして当該画素を指示している動きベクトルを内挿ベクトルとするが、複数の動きベクトルが当該画素を指示している場合や、ひとつの動きベクトルも当該画素を指示していない場合がある。このような場合に、例えば、当該画素を指示していない評価対象画素(または評価対象ブロック)においては、評価対象画素の周辺画素の内挿ベクトルで補間したり、あるいは動きが無いものとして0ベクトルを割り当てたり、適宜もっともらしい内挿ベクトルの割り当てを行う。評価対象画素に割り当てた内挿ベクトル15は、内挿画像生成回路6へ送信される。
【0044】
一方、静止字幕検出回路3では、時間的に連続する2つの輝度画像(フレームN)12と輝度画像(フレームN−1)13とから、静止字幕領域の検出を行う。
静止字幕検出回路3では、図2に示す手順で静止字幕領域の検出が行われる。ステップS1で、字幕境界検出部101にて字幕境界画素の検出が行われる。字幕境界検出部101では、ある評価対象画素(x,y)を中心として点対称位置にある2点間の画素の輝度差分絶対値を、過去の輝度画像(フレームN−1)13および現在の輝度画像(フレームN)12のそれぞれで求める。
【0045】
評価対象画素からの画素位置差分p、q、フレーム番号Nを用いて、式(1)および式(2)のように表わされる。
(p,q)=|Y(x−p,y−q)−Y(x+p,y+q)| ・・・(1)
N−1(p,q)=|YN−1(x−p,y−q)−YN−1(x+p,y+q)| ・・・(2)
【0046】
本実施例では、評価対象画素(x,y)を中心として周囲3×3tapの上記輝度差分絶対値を求めるものとする。この時、(p,q)=(1,1),(0,1),(−1,1),(1,0)の各組み合わせで輝度差分絶対値Y(p,q)、YN−1(p,q)を求める。
評価対象画素(x,y)を中心として周囲P×Qtapで同様の値を求める場合は、[(Q−1)/2≧q>0,(P−1)/2≧p≧−(P−1)/2]の全組み合わせと、[q=0,(P−1)/2≧p≧0]の全組み合わせとなる。
【0047】
ここで、求めた各輝度差分絶対値について、式(3)乃至式(5)の条件を満たすか評価を行う。式(3)の条件式は時間的に連続する2つのフレームの同じ位置にある輝度差分絶対値の差の絶対値を求め、該差分絶対値がある閾値Tdiffより小さいか判定し「静止していること」が評価される。また、式4、式5の条件式では、それぞれの輝度差分絶対値Y(p,q)、YN−1(p,q)が閾値Tpowerより大きいかを判定し、字幕境界部分の特徴である「背景となる画と信号レベルで大きく差がある」ことが評価される。
【0048】
|Y(p,q)−YN−1(p,q)|<Tdiff ・・・(3)
(p,q)>Tpower ・・・(4)
N−1(p,q)>Tpower ・・・(5)
【0049】
全ての条件式(式(3)、式(4)、式(5))を満たす(p,q)の組み合わせ数をカウントし、この組み合わせの数がある閾値を超えた場合に、画素(x,y)が静止字幕境界であると判定する。
【0050】
本方式によれば、評価対象画素(x,y)自身の輝度値は一切用いずに静止字幕境界が検出される。また、tap数に応じて間隔の離れた画素間の輝度差分絶対値の結果も考慮される。入力画像データ11が本回路への入力の前段階において、例えばSD解像度(640×480)の映像がFullHD解像度(1920×1080)の映像へスケーリング処理されていた場合に、静止字幕境界部分が中間輝度によって補間されてしまい、隣接画素部分でボケてしまうような場合がある。このような場合に、隣接画素間で字幕境界を検出しようとしても中間輝度画素によって段階的に輝度が移行してしまい検出できない。しかしながら、本方式によれば数画素離れた画素間での輝度差分絶対値を用いて検出することが可能なため、精度良く字幕境界の検出が可能である。
【0051】
また、画素(x,y)に対する字幕境界の検出においては、複数の(p,q)の組み合わせの結果を用いて閾値判定を行っている。これは字幕境界部分では、付近の画素も字幕境界画素の特徴を含む画素の組み合わせが多く存在するという特徴に基づいており、tap数を増加させた場合に字幕境界部分以外の誤検出を防ぐのに有効である。
【0052】
ステップS2では、検出された字幕境界画素111に対して黒帯境界検出部102において黒帯境界検出を行い、黒帯が検出された場合に必要なフィルタ処理を行う。
一部の映像コンテンツにおいては、上下が黒帯表示になるレターボックス表示される場合がある。この場合、黒帯と撮影映像との境界ラインが水平方向に発生し、撮影映像の状態によっては字幕境界とよく似た特徴を示し、この境界線上が字幕境界画素として誤判定される場合がある。
【0053】
このレターボックス表示での誤判定を回避する目的で、同一ライン上に検出された字幕境界画素数が、その上下のラインにある字幕境界画素数に比べて、ある閾値以上に多い場合は、そのライン上のすべての字幕境界画素を字幕境界画素から除外するフィルタ処理を行う。
ただし、レターボックス表示においては、黒帯と撮影映像との境界ライン上に字幕が重畳される場合もある。この場合、字幕境界画素として検出されるべき画素が、黒帯検出によって該フィルタ処理が行われてしまう場合がある。
字幕境界画素であるのか、黒帯と撮影画素との境界ラインであるのかの区別をすることは困難であるため、該画素についてはステップS4により救済措置が施される。
【0054】
ステップS3では、静止画素検出部103により静止画素の検出が行われる。字幕画素は静止していて、輝度が高いという特徴をもつことから、字幕境界画素周辺で本特徴をもつ画素を抽出する。過去の輝度画像(フレームN−1)13と現在の輝度画像(フレームN)12の2フレームの評価対象画素(x,y)に対して、輝度差分絶対値Y(p,q)、YN−1(p,q)の差分絶対値がある閾値Tdiff以下である場合は評価対象画素(x,y)を静止画素と判定する。
|YN−1(x,y)−Y(x,y)|<Tdiff ・・・(6)
【0055】
ステップS4では、ステップS2で求めたフィルタ処理後の字幕境界画素112と、ステップS3で求めた静止画素113を用いて、静止画素と判定された画素(x,y)に対して、自身を除く±1画素の範囲内にある画素の字幕境界画素検出結果を参照し、字幕境界画素が存在すれば画素(x,y)を字幕画素として判定する。
本処理によって、ステップS1にて本来字幕では無い画素が、誤検出により字幕境界画素として検出されてしまった場合についても、周辺に字幕画素が検出されないので、ステップS5以降の処理によりノイズ除去の効果を果たす。また、字幕境界画素と黒帯境界ラインとが重畳してしまっている場合については、黒帯境界と判定されて、字幕境界画素から除外されてしまった画素を字幕画素として再度検出することで信頼性を向上している。
【0056】
ステップS5では、m*n画素を単位とする複数画素で構成されるブロックを形成し(これを、検出ブロックという)、ステップS2で得られたフィルタ処理後の字幕境界画素112およびステップS4で得られた字幕画素114を元に、検出ブロック中の字幕境界画素および字幕画素の検出数の和を、検出ブロックの字幕らしさを示す指標とする(以後、この指標の値を字幕信頼度と記す)。
【0057】
ステップS6では、ステップS5で得られた字幕信頼度115を用い、評価対象の検出ブロックに対して、評価対象としている検出ブロックの字幕信頼度と、評価対象周辺の検出ブロックの字幕信頼度に対してそれぞれ重みづけを行い、その総和がある閾値Tblockを超えた場合に、評価対象の検出ブロックを字幕ブロックとして、検出ブロック内にある画素全てを字幕であると判定する。
【0058】
評価対象周辺の検出ブロックに対する重み付け方法については以下に示す限りではないが、ここでは、下記の字幕の特徴を用いて重みづけを行う方法を示す。
(特徴1) 字幕ブロックに隣接する検出ブロックは字幕ブロックである可能性が高い。
(特徴2) 字幕ブロック周囲に存在する検出ブロックは、少なくともいずれか一方向に対して、数ブロック連続して字幕ブロックが存在する可能性が高い。
上記特徴から、評価対象周辺の検出ブロックに対して次のような手順で重みづけを行う。
【0059】
(a)評価対象検出ブロックの字幕信頼度S(x,y)に対して重みづけ(α倍)を行う。
(b)評価対象検出ブロックの周辺1ブロック以内の検出ブロックの字幕信頼度の総和S(x±1,y±1)に対して重みづけ(β倍)を行う。
(c)評価対象検出ブロックから垂直/水平位置にある複数(t)ブロックの検出ブロックの字幕信頼度S(x±t,y)、S(x,y±1)に対して重みづけ(γ倍)を行う。
【0060】
手順(a)(b)(c)で重複する検出ブロックに対しては(a)(b)(c)の順で優先として一度用いられた字幕信頼度は以降の後段の手順で用いないものとする。また、手順(c)で重みづけされた値については、上下左右の各方向で和を求め、最も大きい値となった一方向分を代表値とする。
手順(a)(b)(c)で求めた値の総和を閾値Tdiffと比較し、ある閾値を超えた場合は評価対象の検出ブロックを字幕ブロックと判定し、当該検出ブロック内にある画素全てを字幕領域と判定し、字幕領域情報16として内挿画像生成回路6に送信する。
【0061】
次に内挿画像生成回路6では、内挿ベクトル評価回路5で生成された内挿ベクトル15と、静止字幕検出回路3で生成された字幕領域情報16を受信し、RGBバッファメモリ9に蓄積された内挿画像用原画像データ18を元に、内挿画像を生成する。内挿画像用原画像データ18は、フレームNの原画像データであっても良いし、フレームN−1の原画像データであっても良いが、原画像データとしてフレームNを用いる場合は、画素(x,y)に対する内挿ベクトル(vx,vy)の値を、正負反転し(−vx,−vy)とする必要がある。以下、本動作例では内挿画像生成用原画像データ18としてフレームN−1の原画像データを用いるものとする。
【0062】
内挿画像生成回路6では、生成しようとする画素(x,y)の位置にある内挿ベクトル(vx,vy)を参照し、内挿画像生成用原画像データ18において、内挿ベクトルの指示する画素(x−vx,y−vy)の値を、生成する内挿画像20の画素(x,y)の画素値に割り当てる。ただし、画素(x、y)の生成処理において、該画素を含む検出ブロックが字幕領域情報16により字幕領域であると判定されている場合(マスク条件1)、または内挿ベクトルの指示する画素(x−vx,y−vy)を含む検出ブロックが字幕領域情報16により字幕領域である判定されている場合(マスク条件2)は、画素(x,y)に対する内挿ベクトルを0(vx=vy=0)として画素(x,y)の生成処理を行う。
【0063】
マスク条件1により生成された画素(x,y)は、本来字幕領域内にあるべき画素に対して、動きベクトルの誤検出により別の画素が飛び込んで字幕画素を破壊することを防ぐ効果がある。また、マスク条件2により生成された画素(x,y)は、本来字幕領域ではない画素に対して、動きベクトルの誤検出により字幕領域内の画素が飛び込んで撮影画像を破壊することを防ぐ効果がある。
【0064】
最後に画像出力部7により、RGBバッファメモリ9より出力用原画像データ19を受信し、内挿画像生成回路6より内挿画像20を受信し、これらを交互に出力画像データ21として、ディスプレイ表示装置に出力する。この時の出力順序は、原画像データ(フレームN−1)、内挿画像データ、原画像データ(フレームN)の順になるように制御する。
【0065】
以上のようにして、内挿画像フレームを生成して画質向上を図るフレームレート変換回路が備えられた画像出力装置において、字幕部分の破綻による画質劣化を防ぐことで高画質化を実現する回路を、字幕領域検出用に特別なメモリを増加することなく実現することが可能となる。
また、本発明によれば、フレームレートを変換する全ての装置に同様に有効であり、例えば、秒間24フレームで撮影された映像コンテンツを、秒間60フレーム乃至秒間120フレームで出力する装置においても同様である。
【0066】
(実施形態2)
実施形態2として、秒間24フレームの画像を秒間60フレームの画像に変換した画像、即ち、3−2プルダウンされた秒間60フレームの入力画像を取得し、フレームレート変換処理(秒間60フレームの映像を秒間120フレームの映像に変換する)を行う回路において、字幕付き映像が入力される場合について説明する。
【0067】
(実施形態2:構成)
図3は、本発明の画像出力装置が備えるフレームレート変換処理回路の一形態を示す構成を模式的に示す説明図である。本実施形態の構成は、図1に示す実施形態1の構成と同様であるが、Yバッファメモリ8、静止字幕検出回路3、動きベクトル検出回路4,内挿ベクトル評価回路5、内挿画像生成回路6等における機能や動作が以下に示すように実施形態1とは異なっている。
【0068】
図4において、入力画像データ11が画像入力部1に入力され、RGBフォーマットの原画像データ17は、2つの信号系統に分散される。第1の信号系統は、RGB−Y変換回路2へ入力され、輝度画像へフォーマット変換された後、Yバッファメモリ8に輝度画像データを蓄積する。Yバッファメモリ8は2フレーム分以上のデータ容量を持つメモリで構成されており、静止字幕検出回路3、および動きベクトル検出回路4に接続されている。
【0069】
静止字幕検出回路3は、輝度画像データ(フレームN)12、および起動画像データ(フレームN)から時間的に1/24秒だけずれた(同一時刻でないフレーム)の輝度画像データ(フレームN−1)13の2つのフレームから、画像内の静止字幕領域を検出する。検出された字幕領域情報16は内挿画像生成回路6に送られる。
動きベクトル検出回路4は、輝度画像データ12および輝度画像データ13から、画像間の動きベクトル検出を行う。
【0070】
動きベクトル検出回路4で検出された結果は動きベクトル14として、内挿ベクトル評価回路5に送られ、動きベクトル検出回路4で検出された結果が妥当であるかの評価が行われ、背景技術と同様な方法により最終的な内挿ベクトル15が得られる。得られた内挿ベクトル15は静止字幕検出回路3で生成された字幕領域情報16と共に、内挿画像生成回路6へ送られる。
【0071】
第2の信号系統は、RGBバッファメモリ9に接続され、RGBフォーマットの原画像データ17をRGBバッファメモリ9へ蓄積する。蓄積された原画像データ17は、第1の信号系統で生成された内挿ベクトル15と字幕領域情報16と同期したタイミングで内挿画像生成用原画像データ18として内挿画像生成回路6へと出力するよう構成されている。
【0072】
内挿画像生成回路6は、得られた内挿画像生成用原画像データ18、および内挿ベクトル15、字幕領域情報16を元に内挿画像20を生成する。参照する内挿画像生成用原画像データ18は、フレームN番目の原画像データであってもフレームN−1番目の原画像データであっても構わず、フレームN番目の原画像データで内挿する場合は、ベクトルの方向が反転する。
【0073】
内挿画像生成回路6は、生成した内挿画像20を4フレーム連続で画像出力部7へと出力する。次に出力用原画像データ19を1フレームだけ画像出力部7へと出力する。出力順序は、ある時刻の出力原画像データを基準として、N−1番目の原画像データ、内挿画像データ4フレーム、N番目の原画像データの順に出力するように制御する。
画像出力部7では、ディスプレイ表示に必要な同期信号が付加されて所定のタイミングで出力画像データ21をディスプレイ表示装置に対して出力する。
【0074】
以上のようにして、内挿画像フレームを生成して画質向上を図るフレームレート変換回路が備えられた画像出力装置において、字幕部分の破綻による画質劣化を防ぐことで高画質化を実現する回路を、字幕領域検出用に特別なメモリを増加することなく実現することが可能となる。
【0075】
(実施形態2:動作)
続いて、本実施形態の動作について説明する。
画像入力部1に対して、ある時刻の第N番目の入力画像データ11が入力され、第1の信号系統および第2の信号系統にRGBフォーマットの原画像データ17が送信される。
第1の信号系統ではRGBフォーマットの原画像データ17がRGB−Y変換回路2に入力され、フォーマット変換処理により輝度画像(フレームN)12が生成される。輝度画像(フレームN)12はYバッファメモリ8に書き込まれると同時に、時間的に1/24秒だけずれた過去の輝度画像(フレームN−1)13がYバッファメモリ8から読み出され、これら2つのフレーム(フレームN,フレームN−1)の輝度画像が静止字幕検出回路3および動きベクトル検出回路4に送信される。
【0076】
なお、入力画像は同一時刻に撮影されたフレームが3フレーム入力、2フレーム入力、3フレーム入力と交互に続く、いわゆる3−2プルダウンされた映像である。この映像の入力の様子を図5に示す。入力フレームN―1が2フレーム(フレームN−1(1)乃至フレームN−1(2))入力され、次に入力フレームNが3フレーム(フレームN(1)乃至フレームN(3))入力され、さらに入力フレームN+1が2フレーム(フレームN+1(1)乃至フレームN+1(2))入力され、以後、3フレーム入力、2フレーム入力を繰り返す。このように3−2プルダウンされた入力フレームに対して内挿画像を生成して出力する様子を図6に示す。フレームN−1とフレームNとの間で4枚の内挿画像を生成するが、この時に必要なフレーム画像データはフレームN−1の画像データとフレームNの画像データの2フレームであり、同じフレームを示すフレームデータを複数必要としないため、Yバッファメモリ8に3フレーム以上の容量を実装し、入力順にYバッファメモリ8に対して書き込んでおいて読み出す時点である時刻のフレーム(フレームN)と、それに対して1/24秒ずれた過去の画像(フレームN−1)を読み出すように制御しても良いし、Yバッファメモリ8に書き込む前に同一時刻のフレームについて書き込まないように制御するか、同一時刻のフレームが書き込まれているYバッファメモリ8上の領域に上書きして、同一時刻のフレームデータを破棄する。本発明ではその制御方法、およびYバッファメモリの容量については上記方法に限定されない。
【0077】
動きベクトル検出回路4では、入力された2フレームの輝度画像から、動きベクトル14を求める。動きベクトル14を求める方法については種々の提案がなされており、例えばブロックマッチングによる動きベクトルの検出方法がある。これは複数の画素をまとめてブロック化し、フレームNとフレームN−1の2フレーム間で、ブロック単位に一致しているか否かを評価し、最も一致したブロックとの位置関係から動きベクトルを求める方法である。得られた動きベクトル14は内挿ベクトル評価回路5に送信される。
【0078】
内挿ベクトル評価回路5では、内挿画像生成に必要な内挿ベクトル15を生成する。内挿ベクトル評価回路5は動きベクトル14を元に、評価対象画素(または複数の画素からなる評価対象ブロック)の内挿ベクトルとして当該画素を指示している動きベクトルを内挿ベクトルとするが、複数の動きベクトルが当該画素を指示している場合や、ひとつの動きベクトルも当該画素を指示していない場合がある。このような場合に、例えば、当該画素を指示していない評価対象画素(または評価対象ブロック)においては、評価対象画素の周辺画素の内挿ベクトルで補間したり、あるいは動きが無いものとして0ベクトルを割り当てたり、適宜もっともらしい内挿ベクトルの割り当てを行う。評価対象画素に割り当てた内挿ベクトル15は、内挿画像生成回路6へ送信される。
【0079】
また、前出のように3−2プルダウンされた入力画像では時間的に1/24秒ずれた2つのフレーム間に、4つの内挿フレームを生成する必要がある。これらの内挿フレームは時間的にそれぞれ1/120秒ずつずれた動きベクトルを用いたフレームを生成することが理想である。例えば、動きベクトル検出回路4で得られた動きベクトルを元に、このベクトルの1/5、2/5、3/5、4/5の大きさのベクトルを用いて、内挿ベクトル評価を各々行なうことで実現することが可能である。また、この時に生成されるフレームNとフレームN−1の間の内挿フレームを、それぞれ内挿フレームN−1’(ベクトル1/5倍)、内挿フレームN−1’’(ベクトル2/5倍)、内挿フレームN−1’’’(ベクトル3/5倍)、内挿フレームN−1’’’’(ベクトル4/5倍)とする。ただし、内挿ベクトルの生成方法については本例の方法に限定されるものではない。
【0080】
一方、静止字幕検出回路3では、時間的に連続する(同一時刻でない)2つの輝度画像(フレームN)12と輝度画像(フレームN−1)13とから、静止字幕領域の検出を行う。静止字幕領域の検出方法については、(実施形態1:動作)と同様である。
【0081】
次に内挿画像生成回路6では、内挿ベクトル評価回路5で生成された内挿ベクトル15と、静止字幕検出回路3で生成された字幕領域情報16を受信し、RGBバッファメモリ9に蓄積された内挿画像用原画像データ18を元に、内挿画像を生成する。内挿画像用原画像データ18は、フレームNの原画像データであっても良いし、フレームN−1の原画像データであっても良いが、原画像データとしてフレームNを用いる場合は、画素(x,y)に対する内挿ベクトル(vx,vy)の値を、正負反転し(−vx,−vy)とする必要がある。以下、本動作例では内挿画像生成用原画像データ18としてフレームN−1の原画像データを用いるものとする。
【0082】
内挿画像生成回路6では、生成しようとする画素(x,y)の位置にある内挿ベクトル(vx,vy)を参照し、内挿画像生成用原画像データ18において、内挿ベクトルの指示する画素(x−vx,y−vy)の値を、生成する内挿画像20の画素(x,y)の画素値に割り当てる。ただし、画素(x、y)の生成処理において、該画素を含む検出ブロックが字幕領域情報16により字幕領域であると判定されている場合(マスク条件1)、または内挿ベクトルの指示する画素(x−vx,y−vy)を含む検出ブロックが字幕領域情報16により字幕領域である判定されている場合(マスク条件2)は、画素(x,y)に対する内挿ベクトルを0(vx=vy=0)として画素(x,y)の生成処理を行う。
【0083】
マスク条件1により生成された画素(x,y)は、本来字幕領域内にあるべき画素に対して、動きベクトルの誤検出により別の画素が飛び込んで字幕画素を破壊することを防ぐ効果がある。また、マスク条件2により生成された画素(x,y)は、本来字幕領域ではない画素に対して、動きベクトルの誤検出により字幕領域内の画素が飛び込んで撮影画像を破壊することを防ぐ効果がある。
【0084】
また、原画像データ(フレームN−1)と原画像データ(フレームN)との間には、4フレームの内挿画像データが生成されるが、マスク条件として使用する字幕領域情報16は、この4フレームでも同じ情報を用いる。このため、図6に示すようにフレームN−1とフレームNへの切替り時のみ静止字幕領域の検出を行い、静止字幕領域情報の更新を行うように制御する。
【0085】
最後に画像出力部7により、RGBバッファメモリ9より出力用原画像データ19を受信し、内挿画像生成回路6より内挿画像20を受信し、これらを出力画像データ21として、ディスプレイ表示装置に出力する。この時の出力順序は、図6に示すように原画像データ(フレームN−1)、内挿画像データ(内挿フレームN−1’)、内挿画像データ(内挿フレームN−1’’)、内挿画像データ(内挿フレームN−1’’’)、内挿画像データ(内挿フレームN−1’’’’)、原画像データ(フレームN)の順になるように制御する。
【0086】
以上のようにして、内挿画像フレームを生成して画質向上を図るフレームレート変換回路が備えられた画像出力装置において、字幕部分の破綻による画質劣化を防ぐことで高画質化を実現する回路を、3−2プルダウンされた入力画像のように、連続する入力画像間で同一時刻の画像が複数入力されるような場合でも適用可能である。
【符号の説明】
【0087】
1…画像入力部、2…Y変換回路、3…静止字幕検出回路、4…動きベクトル検出回路、5…内挿ベクトル評価回路、6…内挿画像生成回路、7…画像出力部、8…Yバッファメモリ、9…RGBバッファメモリ、11…入力画像データ、12…輝度画像、13…輝度画像、14…動きベクトル、15…内挿ベクトル、16…字幕領域情報、17…原画像データ、18…内挿画像生成用原画像データ、19…出力用原画像データ、20…内挿画像、21…出力画像データ、101…字幕境界検出部、102…黒帯境界検出部、103…静止画素検出部、111…字幕境界画素、112…字幕境界画素、113…静止画素、114…字幕画素、115…字幕信頼度。

【特許請求の範囲】
【請求項1】
表示する画像フレームを時間的に連続する2つの入力画像フレームの間に、1つまたは複数の内挿フレームを生成し出力する画像出力装置において、
画像を入力するための画像入力部と、入力した画像の画像フォーマットを変換せずにそのまま蓄積するための原画像蓄積用バッファメモリと、入力した画像を順次輝度情報のみの画像フォーマットに変換し輝度画像を生成する画像フォーマット変換回路と、輝度画像を蓄積するための輝度画像蓄積用バッファメモリと、時間的に連続した2フレームの輝度画像間の動きベクトルを検出する動きベクトル検出回路と、動きベクトルを用いて前記時間的に連続した2フレームの間に挿入される内挿フレームの各画素または複数画素で構成されるブロックの内挿ベクトルを選定する内挿ベクトル評価回路と、入力した時間的に連続した2フレームの輝度画像間の静止している字幕画像を検出する静止字幕検出回路と、前記原画像蓄積用バッファメモリに蓄積された原画像を元に内挿ベクトルおよび静止字幕検出結果から所望の内挿フレームを生成する内挿画像生成回路と、前記原画像蓄積用バッファメモリに蓄えられた原画像フレームおよび前記内挿画像生成回路で生成された内挿フレームを時間的に連続するように並べて出力する画像出力部とを有し、
前記内挿画像生成回路は、前記静止字幕検出回路で字幕と判定された画素または複数画素を含むブロックに割り当てられた内挿ベクトルの値を0とし、前記静止字幕検出回路で字幕と判定されなかった画素または複数画素を含むブロックのうち前記内挿ベクトルが指示する画素において字幕と判定された場合は該画素または複数画素を含むブロックに割り当てられた内挿ベクトルを0として前記内挿フレームを生成することを特徴とする画像出力装置。
【請求項2】
請求項1記載の画像出力装置において、前記静止字幕検出回路は、評価対象画素を中心として点対象位置にある2点の画素の輝度差分値が、時間的に連続する2フレームにおいてともに閾値を超え、かつ前記2フレーム間で前記輝度差分値がほとんど同じ値である場合に、前記評価対象画素を字幕境界画素と判定し、複数画素で構成されるブロック内に前記字幕境界画素の数がある閾値を超えた場合に、前記ブロック内の画素を字幕と判定することを特徴とする画像出力装置。
【請求項3】
請求項2記載の画像出力装置において、前記静止字幕検出回路は、前記字幕境界画素として判定された画素について、評価対象画素が属するラインに存在する前記字幕境界画素として判定された画素数と、前記ラインの直下のラインに存在する前記字幕境界画素として判定された画素数が、共にある閾値を超えている場合に、前記評価対象画素が属するラインの画素全てを黒帯境界と判定し、前記字幕境界画素として判定した画素の判定を解除することを特徴とする画像出力装置。
【請求項4】
請求項2または3記載の画像出力装置において、時間的に連続する2つの原画像フレームの各々の評価対象画素について、前記静止字幕検出回路は、前記評価対象画素の輝度差分値がある閾値を超えた場合に、該評価対象画素を静止画素と判定し、該静止画素の周辺画素に前記字幕境界画素が存在する場合に、前記静止画素を字幕と判定し、複数画素で構成されるブロック内における前記字幕境界画素の数と前記字幕画素の数の和がある閾値を超えた場合に、前記ブロック内の画素を字幕と判定することを特徴とする画像出力装置。
【請求項5】
請求項2〜4のいずれか1に記載の画像出力装置において、入力画像フレームのうち時間的に連続する2つのフレームについて、画面全体でほとんど差分が無い画像と判断された場合に、いずれか一方のフレームを破棄し前記2つのフレームの間に内挿フレームを生成せず、前記静止字幕検出回路における字幕検出処理を行わないことを特徴とする画像出力装置。
【請求項6】
表示する画像フレームを時間的に連続する2つの入力画像フレームの間に、1つまたは複数の内挿フレームを生成し出力する画像出力装置により実行する画像出力方法において、
前記画像出力装置に画像を入力する画像入力ステップと、
入力した画像の画像フォーマットを変換せずにバッファメモリにそのまま蓄積する原画像蓄積ステップと、
入力した画像を順次輝度情報のみの画像フォーマットに変換し輝度画像を生成する画像フォーマット変換ステップと、
輝度画像をバッファメモリに蓄積する輝度画像蓄ステップと、
時間的に連続した2フレームの輝度画像間の動きベクトルを検出する動きベクトル検出ステップと、
動きベクトルを用いて前記時間的に連続した2フレームの間に挿入される内挿フレームの各画素または複数画素で構成されるブロックの内挿ベクトルを選定する内挿ベクトル評価ステップと、
入力した時間的に連続した2フレームの輝度画像間の静止している字幕画像を検出する静止字幕検出ステップと、
前記原画像蓄積ステップでバッファメモリに蓄積された原画像を元に内挿ベクトルおよび静止字幕検出結果から所望の内挿フレームを生成する内挿画像生成ステップと、
前記原画像蓄積ステップでバッファメモリに蓄えられた原画像フレームおよび前記内挿画像生成ステップで生成された内挿フレームを時間的に連続するように並べて出力する画像出力ステップとを有し、
前記内挿画像生成ステップは、前記静止字幕検出ステップで字幕と判定された画素または複数画素を含むブロックに割り当てられた内挿ベクトルの値を0とし、前記静止字幕検出ステップで字幕と判定されなかった画素または複数画素を含むブロックのうち前記内挿ベクトルが指示する画素において字幕と判定された場合は該画素または複数画素を含むブロックに割り当てられた内挿ベクトルを0として前記内挿フレームを生成することを特徴とする画像出力方法。
【請求項7】
請求項6記載の画像出力方法において、前記静止字幕検出ステップは、評価対象画素を中心として点対象位置にある2点の画素の輝度差分値が、時間的に連続する2フレームにおいてともに閾値を超え、かつ前記2フレーム間で前記輝度差分値がほとんど同じ値である場合に、前記評価対象画素を字幕境界画素と判定し、複数画素で構成されるブロック内に前記字幕境界画素の数がある閾値を超えた場合に、前記ブロック内の画素を字幕と判定することを特徴とする画像出力方法。
【請求項8】
請求項7記載の画像出力方法において、前記静止字幕検出ステップは、前記字幕境界画素として判定された画素について、評価対象画素が属するラインに存在する前記字幕境界画素として判定された画素数と、前記ラインの直下のラインに存在する前記字幕境界画素として判定された画素数が、共にある閾値を超えている場合に、前記評価対象画素が属するラインの画素全てを黒帯境界と判定し、前記字幕境界画素として判定した画素の判定を解除することを特徴とする画像出力方法。
【請求項9】
請求項7または8記載の画像出力方法において、前記静止字幕検出ステップは、時間的に連続する2つの原画像フレームの各々の評価対象画素について、前記評価対象画素の輝度差分値がある閾値を超えた場合に、該評価対象画素を静止画素と判定し、該静止画素の周辺画素に前記字幕境界画素が存在する場合に、前記静止画素を字幕と判定し、複数画素で構成されるブロック内における前記字幕境界画素の数と前記字幕画素の数の和がある閾値を超えた場合に、前記ブロック内の画素を字幕と判定することを特徴とする画像出力方法。
【請求項10】
請求項7〜9のいずれか1に記載の画像出力方法において、入力画像フレームのうち時間的に連続する2つのフレームについて、画面全体でほとんど差分が無い画像と判断された場合に、いずれか一方のフレームを破棄し前記2つのフレームの間に内挿フレームを生成せず、前記静止字幕検出ステップにおける字幕検出処理を行わないことを特徴とする画像出力方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2010−169822(P2010−169822A)
【公開日】平成22年8月5日(2010.8.5)
【国際特許分類】
【出願番号】特願2009−11111(P2009−11111)
【出願日】平成21年1月21日(2009.1.21)
【出願人】(000005049)シャープ株式会社 (33,933)
【Fターム(参考)】