画像処理装置、画像処理方法、およびプログラム
【課題】処理対象の画像信号に基づいて、符号化ノイズを検出することが可能な、画像処理装置、画像処理方法、およびプログラムを提供する。
【解決手段】入力画像信号が示す画像の特徴を示す画像特徴を、複数検出する第1特徴検出部と、検出された複数の画像特徴と、複数の画像特徴と符号化ノイズとの因果関係が示される確率モデルに基づき生成される、学習画像を示す学習画像信号における符号化ノイズの発生確率を示す参照確率情報とに基づいて、符号化ノイズの発生確率を算出するノイズ発生確率算出部と、算出された符号化ノイズの発生確率に基づいて、入力画像信号に含まれる符号化ノイズを特定するノイズ特定部と、を備える画像処理装置が提供される。
【解決手段】入力画像信号が示す画像の特徴を示す画像特徴を、複数検出する第1特徴検出部と、検出された複数の画像特徴と、複数の画像特徴と符号化ノイズとの因果関係が示される確率モデルに基づき生成される、学習画像を示す学習画像信号における符号化ノイズの発生確率を示す参照確率情報とに基づいて、符号化ノイズの発生確率を算出するノイズ発生確率算出部と、算出された符号化ノイズの発生確率に基づいて、入力画像信号に含まれる符号化ノイズを特定するノイズ特定部と、を備える画像処理装置が提供される。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像処理装置、画像処理方法、およびプログラムに関する。
【背景技術】
【0002】
近年、例えばVOD(Video On Demand)などのように、インターネット(Internet)を介して動画像を配信するサービスの普及が進んでいる。また、例えば日本では、テレビジョン放送がデジタル化している。例えば上記のような、動画像配信サービスやデジタルテレビジョン放送において、高解像度のデジタル画像の配信や放送を可能とした技術の一つとして、画像圧縮技術がある。画像圧縮技術の規格としては、例えば、ISO/IEC MPEG(Motion Picture Experts Group)とITU−T VCEG(Video Coding Experts Group)とが共同で標準化した、MPEG−2やH.264/MPEG−4 AVC(以下、「H.264」と示す場合がある。)が挙げられる。MPEG−2やH.264は、動画像符号化国際標準規格として、様々な機器において採用されている。
【0003】
例えば、MPEG−2やH.264では、所定の符号化方式にて画像が非可逆に圧縮される。そのため、例えば上記のような符号化方式が用いられる場合には、画像のデータ量の削減には有利であるが、その反面、例えばブロックノイズやモスキートノイズなどの符号化に起因するノイズ(歪)が、画像をみるユーザに認識されてしまうことが起こりうる。
【0004】
このような中、符号化に起因するノイズを検出する技術が開発されている。符号化に起因するノイズの検出に係る技術としては、例えば、特許文献1に記載の技術や、特許文献2に記載の技術、特許文献3に記載の技術に記載の技術が挙げられる。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2007−266684号公報
【特許文献2】特開2006−121131号公報
【特許文献3】特開2007−27980号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
例えば特許文献1に記載の技術では、ブロック境界の不連続性を検出することによって、ブロックノイズを検出する。また、例えば特許文献2に記載の技術では、DCT(Discrete Cosine Transform。離散コサイン変換)係数の孤立係数を検出することによって、モスキートノイズを検出する。また、例えば特許文献3に記載の技術では、符号化情報(動きベクトルや量子化ステップ)に基づいて符号化ノイズを検出する。よって、例えば特許文献1〜3の技術を用いる場合には、符号化ノイズを検出できる可能性はある。
【0007】
しかしながら、符号化ノイズは複合的な要因によって発生するが、例えば特許文献1〜3の技術は、ブロック境界の不連続性や、DCT係数の孤立係数、動きベクトルや量子化ステップなど、ある特定の情報に基づいて符号化ノイズを検出するものであり、例えば特許文献1〜3の技術では、当該複合的な要因について考慮がなされていない。そのため、例えば特許文献1〜3の技術を用いたとしても、画像本来の構造とノイズ成分とを高精度に分離して符号化ノイズを特定することは困難である。
【0008】
本発明は、上記問題に鑑みてなされたものであり、本発明の目的とするところは、処理対象の画像信号に基づいて、符号化ノイズを検出することが可能な、新規かつ改良された画像処理装置、画像処理方法、およびプログラムを提供することにある。
【課題を解決するための手段】
【0009】
上記目的を達成するために、本発明の第1の観点によれば、入力画像信号が示す画像の特徴を示す画像特徴を、複数検出する第1特徴検出部と、検出された複数の上記画像特徴と、複数の上記画像特徴と符号化ノイズとの因果関係が示される確率モデルに基づき生成される、学習画像を示す学習画像信号における符号化ノイズの発生確率を示す参照確率情報とに基づいて、符号化ノイズの発生確率を算出するノイズ発生確率算出部と、算出された符号化ノイズの発生確率に基づいて、上記入力画像信号に含まれる符号化ノイズを特定するノイズ特定部と、を備える画像処理装置が提供される。
【0010】
かかる構成によって、処理対象の画像信号に基づいて、符号化ノイズを検出することができる。
【0011】
また、上記第1特徴検出部における検出対象の画像特徴と同一の、上記学習画像の特徴を示す複数の画像特徴と、上記確率モデルとに基づいて、上記参照確率情報を生成する参照確率情報生成部をさらに備えていてもよい。
【0012】
また、上記参照確率情報生成部は、上記第1特徴検出部における検出対象の画像特徴と同一の、上記学習画像の特徴を示す画像特徴を、複数検出する第2特徴検出部と、検出された複数の上記画像特徴と上記確率モデルとに基づいて、上記学習画像信号における符号化ノイズの発生確率を算出し、上記参照確率情報を生成する情報生成部と、を備えていてもよい。
【0013】
また、上記確率モデルは、ベイジアンネットワークであってもよい。
【0014】
また、複数の上記画像特徴は、画像における動きを示す動き特徴、画像に含まれるエッジを示すエッジ特徴、画像に含まれるテクスチャを示すテクスチャ特徴、画像に含まれる色を示す色特徴、画像における空間周波数を示す空間周波数特徴、画像における場面を示すシーン特徴、画像に含まれるオブジェクトを示すオブジェクト特徴、ブロック歪特徴、モスキート歪特徴、リンギング歪特徴、符号化に関する特徴、画像の内容に関する特徴、ユーザの知覚に関する特徴のうち、少なくとも2つ以上であってもよい。
【0015】
また、上記目的を達成するために、本発明の第2の観点によれば、入力画像信号が示す画像の特徴を示す画像特徴を、複数検出するステップと、検出された複数の上記画像特徴と、複数の上記画像特徴と符号化ノイズとの因果関係が示される確率モデルに基づき生成される、学習画像を示す学習画像信号における符号化ノイズの発生確率を示す参照確率情報とに基づいて、符号化ノイズの発生確率を算出するステップと、算出された符号化ノイズの発生確率に基づいて、上記入力画像信号に含まれる符号化ノイズを特定するステップと、を有する画像処理方法が提供される。
【0016】
かかる方法を用いることによって、処理対象の画像信号に基づいて、符号化ノイズを検出することができる。
【0017】
また、上記目的を達成するために、本発明の第3の観点によれば、入力画像信号が示す画像の特徴を示す画像特徴を、複数検出するステップ、検出された複数の上記画像特徴と、複数の上記画像特徴と符号化ノイズとの因果関係が示される確率モデルに基づき生成される、学習画像を示す学習画像信号における符号化ノイズの発生確率を示す参照確率情報とに基づいて、符号化ノイズの発生確率を算出するステップ、算出された符号化ノイズの発生確率に基づいて、上記入力画像信号に含まれる符号化ノイズを特定するステップ、をコンピュータに実行させるためのプログラムが提供される。
【0018】
かかるプログラムを用いることによって、処理対象の画像信号に基づいて、符号化ノイズを検出することができる。
【発明の効果】
【0019】
本発明によれば、処理対象の画像信号に基づいて、符号化ノイズを検出することができる。
【図面の簡単な説明】
【0020】
【図1】本発明の第1の実施形態に係る画像処理装置の構成の一例を示すブロック図である。
【図2】本発明の実施形態に係る確率テーブルの一例を示す説明図である。
【図3】本発明の第1の実施形態に係るベイジアンネットワークモデルの一例を示す説明図である。
【図4】本発明の実施形態に係るノイズ発生確率算出部における処理の一例を説明するための説明図である。
【図5】本発明の実施形態に係るノイズ発生確率算出部における処理の一例を説明するための説明図である。
【図6】本発明の実施形態に係るノイズ発生確率算出部における処理の一例を説明するための説明図である。
【図7】本発明の実施形態に係るノイズ発生確率算出部における処理の一例を説明するための説明図である。
【図8】本発明の実施形態に係るノイズ検出部における処理の一例を示す流れ図である。
【図9】本発明の第1の実施形態に係る参照確率情報生成部の構成の一例を示すブロック図である。
【図10】本発明の実施形態に係る参照確率情報生成部における処理の一例を示す流れ図である。
【図11】本発明の第2の実施形態に係る画像処理装置の構成の一例を示すブロック図である。
【図12】本発明の第2の実施形態に係るベイジアンネットワークモデルの一例を示す説明図である。
【図13】本発明の第2の実施形態に係る参照確率情報生成部の構成の一例を示すブロック図である。
【発明を実施するための形態】
【0021】
以下に添付図面を参照しながら、本発明の好適な実施の形態について詳細に説明する。なお、本明細書および図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
【0022】
(本発明の実施形態に係る画像処理方法)
本発明の実施形態に係る画像処理装置の構成について説明する前に、本発明の実施形態に係る画像処理方法について説明する。また、以下では、本発明の実施形態に係る画像処理装置が、処理対象の画像信号(以下、「入力画像信号」と示す場合がある。)に対して、本発明の実施形態に係る画像処理方法に係る処理を行うものとして説明する。
【0023】
ここで、本発明の実施形態に係る入力画像信号としては、例えば、MPEG−2やH.264/MPEG−4 AVCなど、所定の符号化方式により符号化された動画像(または、複数の静止画像)や静止画像を示す画像信号が挙げられる。以下では、本発明の実施形態に係る画像処理装置が、フレーム画像(静止画像)からなる動画像を示す画像信号を処理するものとして説明する。ここで、本発明の実施形態に係るフレーム画像とは、例えば、動画像の1フレーム(動画像がインタレース画像の場合には、1フィールドに対応する。)に対応する画像である。以下では、本発明の実施形態に係る画像処理装置が、時間順に1フレームずつ入力される画像信号を処理する場合を例に挙げて説明する。
【0024】
また、本発明の実施形態に係る画像処理装置は、例えば、本発明の実施形態に係る画像処理装置がテレビ塔などから送信された放送波を(直接的、またはセットトップボックスなどを介して間接的に)受信してデコードした結果得られる画像信号を、入力画像信号として処理する。なお、本発明の実施形態に係る画像処理装置が処理する入力画像信号は、上記に限られない。例えば、本発明の実施形態に係る画像処理装置は、ネットワークを介して(または直接的に)外部装置から送信された入力画像信号を処理することも可能である。また、本発明の実施形態に係る画像処理装置は、例えば、記憶部(後述する)や、本発明の実施形態に係る画像処理装置から着脱可能な外部記録媒体に記憶された画像データをデコードすることにより得られた画像信号を処理してもよい。さらに、本発明の実施形態に係る画像処理装置が、例えば、画像(動画像/静止画像)を撮像することが可能な撮像部(後述する)を備えている場合、すなわち、本発明の実施形態に係る画像処理装置が撮像装置として機能する場合には、本発明の実施形態に係る画像処理装置は、例えば、当該撮像部(後述する)により撮像された画像(動画像/静止画像)に対応する画像信号を処理してもよい。
【0025】
本発明の実施形態に係る画像処理装置は、入力画像信号が示す画像(以下、「入力画像」と示す場合がある。)の特徴を示す画像特徴を、複数検出する(画像特徴検出処理)。
【0026】
ここで、本発明の実施形態に係る画像特徴としては、例えば、画像における動きを示す動き特徴、画像に含まれるエッジを示すエッジ特徴、画像に含まれるテクスチャを示すテクスチャ特徴、画像に含まれる色を示す色特徴、画像における空間周波数を示す空間周波数特徴、画像における場面を示すシーン特徴、画像に含まれるオブジェクト(例えば、人や、物体など)を示すオブジェクト特徴、ブロック歪特徴、モスキート歪特徴、リンギング歪特徴、符号化に関する特徴、画像の内容に関する特徴、ユーザの知覚に関する特徴が挙げられる。
【0027】
本発明の実施形態に係る画像処理装置は、例えば、上記画像特徴のうちの少なくとも2つ以上の画像特徴を検出する。
【0028】
本発明の実施形態に係る画像処理装置は、符号化に関する特徴を検出する場合には、例えば入力画像信号に係る符号化処理を行ったデコーダなどから、符号化に関する特徴を示す符号化情報を取得し、取得された符号化情報から符号化に関する特徴を検出する。また、本発明の実施形態に係る画像処理装置は、例えば、入力画像信号と対応付けて送信される符号化情報を受信することによって、符号化情報を取得する。なお、本発明の実施形態に係る符号化情報は、例えばMPEG−2やH.264により圧縮された画像に係るビットストリームに多重化されていてもよい。
【0029】
ここで、本発明の実施形態に係る符号化情報が示す符号化に関する特徴としては、例えば、動きベクトルやマイクロブロック・モード、DCT係数、量子化ステップなど、符号化に関するパラメータが挙げられる。符号化情報は、符号化ノイズと直接的に関係する画像特徴である。例えば量子化ステップが大きい場合には、符号化ノイズが大きくなり、量子化ステップが小さい場合には、符号化ノイズは小さくなる。
【0030】
また、本発明の実施形態に係る画像処理装置は、画像の内容に関する特徴を検出する場合には、取得された画像内容情報に基づいて画像の内容に関する特徴を検出する。本発明の実施形態に係る画像処理装置は、例えば、データ放送などのように入力画像信号と対応付けて送信される信号を受信することや、入力画像信号を受信することによって、画像内容情報を取得する。
【0031】
ここで、本発明の実施形態に係る画像内容情報に基づく画像の内容に関する特徴としては、例えば、データ放送において送信される信号に多重化される番組情報や文字情報や、インターネット配信される画像に付けられたタグなどに基づき設定される特徴が挙げられる。より具体的には、本発明の実施形態に係る画像処理装置は、例えば、上記番組情報や、上記文字情報、上記タグなど(画像内容情報の一例)に、予め規定されたキーワードが含まれているか否かを判定し、判定結果に応じて2値化されたものを画像の内容に関する特徴とする。上記のように、予め規定されたキーワードが含まれているか否かの判定結果に基づき画像の内容に関する特徴を検出する場合には、本発明の実施形態に係る画像処理装置は、入力画像から画像の内容に関する特徴を検出する場合よりも、より簡単な処理によって画像の内容に関する特徴を検出することができる。
【0032】
また、本発明の実施形態に係る画像処理装置は、ユーザの知覚に関する特徴を検出する場合には、ユーザ(人間)が主観的に知覚可能なノイズの度合いを示す知覚情報に基づいて、ユーザの知覚に関する特徴を検出する。
【0033】
ここで、本発明の実施形態に係る知覚情報に基づくユーザの知覚に関する特徴としては、例えば、人間の知覚レベルを2値または多値で表したものが挙げられる。本発明の実施形態に係る知覚情報は、例えば、ユーザが操作部(後述する)やリモート・コントローラなどの外部操作装置を用いて、画像を複数段階で評価した結果を示す。なお、本発明の実施形態に係る知覚情報は、上記に限られない。例えば、本発明の実施形態に係る知覚情報は、照度センサなど人間の知覚に関連する値を検出するセンサの検出値や、当該検出値が閾値処理によって複数段階に分類された結果を示すものであってもよい。
【0034】
また、本発明の実施形態に係る画像処理装置は、符号化に関する特徴、画像の内容に関する特徴、ユーザの知覚に関する特徴を除く他の画像特徴(動き特徴、エッジ特徴、テクスチャ特徴、色特徴、空間周波数特徴、シーン特徴、オブジェクト特徴、ブロック歪特徴、モスキート歪特徴、リンギング歪特徴)を検出する場合には、処理対象の入力画像信号に基づいて画像の内容に関する特徴を検出する。なお、上記他の画像特徴については、後述する。
【0035】
本発明の実施形態に係る画像処理装置は、例えば上記のような入力画像の特徴を示す画像特徴を、複数検出する。
【0036】
複数の画像特徴が検出されると、本発明の実施形態に係る画像処理装置は、検出された複数の画像特徴と、学習画像を示す学習画像信号における符号化ノイズの発生確率を示す参照確率情報とに基づいて、符号化ノイズの発生確率を算出する(ノイズ発生確率算出処理)。
【0037】
ここで、本発明の実施形態に係る参照確率情報としては、例えば、画像特徴と符号化ノイズとの組合せごとに、符号化ノイズの発生確率が記録された確率テーブルが挙げられる。なお、本発明の実施形態に係る参照確率情報は、確率テーブルに限られず、例えば、画像特徴と符号化ノイズとの組合せごとに符号化ノイズの発生確率を特定することが可能であれば、任意の形式のデータであってもよい。
【0038】
また、本発明の実施形態に係る参照確率情報は、例えば、本発明の実施形態に係る画像処理装置の外部装置によって生成される。より具体的には、上記外部装置は、例えば、上記本発明の実施形態に係る画像処理方法に係る特徴検出処理における検出対象の画像特徴と同一の、学習画像の特徴を示す複数の画像特徴と、符号化ノイズとの因果関係が示される確率モデルに基づいて、参照確率情報を生成する。
【0039】
ここで、本発明の実施形態に係る確率モデルとしては、例えば、ベイジアンネットワーク(Bayesian Network)や、HMM(Hidden Markov Model:隠れマルコフモデル)、ニューラルネットワーク(Neural Network)などが挙げられる。
【0040】
なお、本発明の実施形態に係る参照確率情報は、外部装置によって生成されることに限られない。例えば、本発明の実施形態に係る画像処理装置が、参照確率情報を生成する参照確率情報生成部を備える場合には、本発明の実施形態に係る画像処理装置は、参照確率情報生成部において生成される参照確率情報を用いて、処理を行うことが可能である。参照確率情報部を備える構成の一例、および本発明の実施形態に係る参照確率情報の生成に係る処理の具体例については、後述する本発明の第1の実施形態に係る画像処理装置、および本発明の第2の実施形態に係る画像処理装置において説明する。
【0041】
符号化ノイズの発生確率が算出されると、本発明の実施形態に係る画像処理装置は、算出された符号化ノイズの発生確率に基づいて、入力画像信号に含まれる符号化ノイズを特定する(ノイズ特定処理)。より具体的には、本発明の実施形態に係る画像処理装置は、算出された符号化ノイズの発生確率に基づいて、例えば、符号化ノイズが発生している量や、符号化ノイズが発生している位置および符号化ノイズが発生している量を特定する。
【0042】
本発明の実施形態に係る画像処理装置は、上記のように、複数の画像特徴と符号化ノイズとの因果関係を示す確率モデルに基づき符号化ノイズの発生確率が記録されている参照確率情報に基づいて、本来未知である入力画像信号における符号化ノイズの発生確率を算出する。そして、本発明の実施形態に係る画像処理装置は、算出された符号化ノイズの発生確率に基づいて、入力画像信号に含まれる符号化ノイズを特定する。
【0043】
したがって、本発明の実施形態に係る画像処理装置は、処理対象の画像信号に基づいて、符号化ノイズを検出することができる。
【0044】
また、本発明の実施形態に係る画像処理装置における符号化ノイズの検出結果が、本発明の実施形態に係る確率モデルに反映されることによって(符号化ノイズの検出結果のフィードバックにより確率モデルが更新されることによって)、本発明の実施形態に係る画像処理装置は、さらに柔軟かつ精度の高い符号化ノイズの検出を実現することができる。
【0045】
以下、本発明の実施形態に係る画像処理装置の構成の一例について説明をすると共に、本発明の実施形態に係る画像処理方法に係る処理の具体例についても併せて説明する。
【0046】
また、以下では、本発明の実施形態に係る画像処理装置が、参照確率情報を生成する参照確率情報生成部を備える構成である場合を例に挙げて、本発明の実施形態に係る画像処理装置の構成の一例について説明をする。なお、上述したように、本発明の実施形態に係る画像処理装置は、参照確率情報を生成する参照確率情報生成部を備えない構成をとることも可能である。
【0047】
また、以下では、本発明の実施形態に係る確率モデルが、ベイジアンネットワークである場合を例に挙げて説明する。本発明の実施形態に係る確率モデルがベイジアンネットワークである場合には、確率モデルが更新された際に、確率テーブルなどの参照確率情報を更新することによって対応することが可能である。よって、本発明の実施形態に係る確率モデルとしてベイジアンネットワークを用いることによって、例えば他の確率モデルを用いる場合と比較して、より柔軟な実装を実現することができる。なお、上述したように、本発明の実施形態に係る確率モデルが、ベイジアンネットワークに限らないことは、言うまでもない。
【0048】
(本発明の第1の実施形態に係る画像処理装置)
図1は、本発明の第1の実施形態に係る画像処理装置100の構成の一例を示すブロック図である。画像処理装置100は、例えば、ノイズ検出部102と、参照確率情報生成部104とを備える。
【0049】
また、画像処理装置100は、例えば、制御部(図示せず)や、ROM(Read Only Memory。図示せず)、RAM(Random Access Memory。図示せず)、記憶部(図示せず)、ユーザが操作可能な操作部(図示せず)、様々な画面を表示画面に表示する表示部(図示せず)、外部装置と通信を行うための通信部(図示せず)、撮像部(図示せず)などを備えていてもよい。画像処理装置100は、例えば、データの伝送路としてのバスにより上記各構成要素間を接続する。
【0050】
ここで、制御部(図示せず)は、例えば、CPU(Central Processing Unit)や各種処理回路などで構成され、画像処理装置100全体を制御する。また、制御部(図示せず)は、例えば、ノイズ検出部102、および参照確率情報生成部104(または、これらのうちのいずれか1つの部)の役目を果たしてもよい。なお、ノイズ検出部102、および参照確率情報生成部104は、各部の処理を実現可能な専用の(または汎用の)処理回路で構成されていてもよいことは、言うまでもない。
【0051】
また、制御部(図示せず)は、例えば、ノイズ検出部102における符号化ノイズの検出結果に基づき、検出された符号化ノイズを低減するノイズ低減処理を行う役目を果たしてもよい。さらに、制御部(図示せず)は、例えば、ノイズ低減処理が行われた画像信号をエンコードして、記憶部(図示せず)に記録する、および/または、出力画像信号が示す画像を表示部(図示せず)や外部表示装置の表示画面に表示させるなど、出力画像信号に対する処理を行う役目を果たすことも可能である。
【0052】
ROM(図示せず)は、制御部(図示せず)が使用するプログラムや演算パラメータなどの制御用データを記憶する。RAM(図示せず)は、制御部(図示せず)により実行されるプログラムなどを一時的に記憶する。
【0053】
記憶部(図示せず)は、画像処理装置100が備える記憶手段であり、例えば、画像データや、アプリケーションなど様々なデータを記憶する。ここで、記憶部(図示せず)としては、例えば、ハードディスク(Hard Disk)などの磁気記録媒体や、フラッシュメモリ(flash memory)などの不揮発性メモリ(nonvolatile memory)などが挙げられる。また、記憶部(図示せず)は、画像処理装置100から着脱可能であってもよい。
【0054】
操作部(図示せず)としては、例えば、ボタンや、方向キー、あるいは、これらの組み合わせなどが挙げられる。また、画像処理装置100は、例えば、画像処理装置100の外部装置としての操作入力デバイス(例えば、キーボードやマウスなど)と接続することもできる。
【0055】
表示部(図示せず)としては、例えば、液晶ディスプレイ(Liquid Crystal Display;LCD)や有機ELディスプレイ(organic ElectroLuminescence display)などが挙げられる。なお、表示部(図示せず)は、例えばタッチスクリーンなどのように、表示とユーザ操作とが可能なデバイスであってもよい。また、画像処理装置100は、表示部(図示せず)の有無に関わらず、画像処理装置100の外部装置としての表示デバイス(例えば、外部ディスプレイなど)と接続することもできる。
【0056】
通信部(図示せず)は、画像処理装置100が備える通信手段であり、ネットワークを介して(あるいは、直接的に)、外部装置と無線/有線で通信を行う。ここで、通信部(図示せず)としては、例えば、通信アンテナおよびRF(Radio Frequency)回路(無線通信)や、IEEE802.15.1ポートおよび送受信回路(無線通信)、IEEE802.11bポートおよび送受信回路(無線通信)、あるいはLAN(Local Area Network)端子および送受信回路(有線通信)などが挙げられる。また、本発明の実施形態に係るネットワークとしては、例えば、LANやWAN(Wide Area Network)などの有線ネットワーク、無線LAN(WLAN;Wireless Local Area Network)や基地局を介した無線WAN(WWAN;Wireless Wide Area Network)などの無線ネットワーク、あるいは、TCP/IP(Transmission Control Protocol/Internet Protocol)などの通信プロトコルを用いたインターネットなどが挙げられる。
【0057】
撮像部(図示せず)は、静止画像または動画像を撮像する役目を果たす。撮像部(図示せず)を備える場合には、画像処理装置100は、例えば、撮像部(図示せず)における撮像により生成された画像信号を処理することが可能である。
【0058】
ここで、本発明の実施形態に係る撮像部(図示せず)としては、例えば、レンズ/撮像素子と信号処理回路とから構成される撮像デバイスが挙げられる。レンズ/撮像素子は、例えば、光学系のレンズと、CMOS(Complementary Metal Oxide Semiconductor)などの撮像素子を複数用いたイメージセンサとで構成される。また、信号処理回路は、例えば、AGC(Automatic Gain Control)回路やADC(Analog to Digital Converter)を備え、撮像素子により生成されたアナログ信号をデジタル信号(画像データ)に変換し、各種信号処理を行う。信号処理回路が行う信号処理としては、例えば、White Balance補正処理、色調補正処理、ガンマ補正処理、YCbCr変換処理、エッジ強調処理などが挙げられる。
【0059】
以下、図1に示す第1の実施形態に係る画像処理装置100の構成例について説明しつつ、画像処理装置100における処理(画像処理方法に係る処理)の一例について説明する。
【0060】
ノイズ検出部102は、本発明の実施形態に係る画像処理方法に係る処理(例えば、上記画像特徴検出処理、ノイズ発生確率算出処理、およびノイズ特定処理)を主導的に行う役目を果たす。ノイズ検出部102は、参照確率情報に基づいて、入力画像信号における符号化ノイズの発生確率を算出し、算出された符号化ノイズの発生確率に基づいて、入力画像信号に含まれる符号化ノイズを特定する。
【0061】
ここで、図1では、本発明の実施形態に係る参照確率情報として、確率テーブル150を示している。ノイズ検出部102(より厳密には、後述するノイズ発生確率算出部108)は、例えば記憶部(図示せず)に記憶されている確率テーブル150(参照確率情報の一例)を適宜読み出し、読み出した確率テーブル150と、入力画像信号から検出された複数の画像特徴とに基づいて、入力画像信号における符号化ノイズの発生確率を算出する。
【0062】
なお、本発明の実施形態に係るノイズ検出部102における処理は、上記に限られない。例えば、ノイズ検出部102は、ネットワークを介して(または直接的に)通信可能な、確率テーブル150(参照確率情報の一例)を記憶する外部装置と通信を行うことによって、入力画像信号における符号化ノイズの発生確率を算出することも可能である。より具体的には、ノイズ検出部102は、例えば、入力画像信号から検出された複数の画像特徴を含み、確率テーブル150に記録されている符号化ノイズの発生確率を外部装置に送信させるための発生確率送信要求を、通信部(図示せず)を介して外部装置へ送信する。そして、ノイズ検出部102は、上記発生確率送信要求に応じて外部装置から送信された、発生確率を示すデータを、通信部(図示せず)を介して受信し、受信されたデータと、入力画像信号から検出された複数の画像特徴とに基づいて、入力画像信号における符号化ノイズの発生確率を算出する。
【0063】
図2は、本発明の実施形態に係る確率テーブル150の一例を示す説明図である。本発明の実施形態に係る確率テーブル150は、例えば図2に示すように、ある画像特徴Fにおける符号化ノイズXの条件付き確率を示すテーブルである。ここで、確率テーブルは、条件付確率表(Conditional Probability Table :CPT)ともよばれ、例えば、図2のように画像特徴Fと符号化ノイズXの条件付き確率を表にしたものとして表される。
【0064】
ノイズ検出部102は、例えば図2に示すような確率テーブル150に基づいて、入力画像信号における符号化ノイズの発生確率を算出し、算出された符号化ノイズの発生確率に基づいて、入力画像信号に含まれる符号化ノイズを特定する。なお、図2では、画像特徴Fが3つと、符号化ノイズXが3つの確率テーブルを示しているが、本発明の実施形態に係る確率テーブル150が、図2に示す例に限られないことは、言うまでもない。
【0065】
再度図1を参照して、本発明の実施形態に係るノイズ検出部102の構成についてより具体的に説明する。ノイズ検出部102は、特徴検出部106(第1特徴検出部)と、ノイズ発生確率算出部108と、ノイズ特定部110とを備える。
【0066】
特徴検出部106は、本発明の実施形態に係る画像処理方法に係る上記画像特徴検出処理を主導的に行う役目を果たし、入力画像信号が示す画像の特徴を示す画像特徴を、複数検出する。
【0067】
ここで、特徴検出部106は、符号化ノイズと因果関係を有する画像特徴として、例えば、動き特徴、エッジ特徴、テクスチャ特徴、色特徴、空間周波数特徴、シーン特徴、オブジェクト特徴、ブロック歪特徴、モスキート歪特徴、リンギング歪特徴を検出する。なお、特徴検出部106が検出する画像特徴は、上記に限られない。例えば、特徴検出部106は、動き特徴、エッジ特徴、テクスチャ特徴、色特徴、空間周波数特徴、シーン特徴、オブジェクト特徴、ブロック歪特徴、モスキート歪特徴、リンギング歪特徴のうちの、2つ以上を検出してもよい。
【0068】
図3は、本発明の第1の実施形態に係るベイジアンネットワークモデルの一例を示す説明図であり、画像特徴と符号化ノイズとの関係をベイジアンネットワークモデルを用いて記述した例を示している。図3に示すように、本発明の実施形態に係る画像特徴は、例えば、符号化ノイズを発生させる要因となる画像特徴(つまり、符号化ノイズに対して親ノードとなる特徴)である「観測画像特徴」と、符号化ノイズが要因となって発生する画像特徴(つまり、符号化ノイズに対して子ノードとなる特徴)である「観測歪特徴」とに分類される。
【0069】
まず、本発明の実施形態に係る観測画像特徴について説明する。観測画像特徴としては、図3に示すように、例えば、動き特徴Fmotionと、エッジ特徴Fedgeと、テクスチャ特徴Ftextureと、色特徴Fcolorと、空間周波数特徴Ffrequencyと、シーン特徴Fsceneと、オブジェクト特徴Fobjectとが挙げられる。ここで、動き特徴Fmotionと、エッジ特徴Fedgeと、テクスチャ特徴Ftextureと、色特徴Fcolorと、空間周波数特徴Ffrequencyとは、符号化ノイズと直接因果関係がある特徴に該当する。また、画像特徴は、上記符号化ノイズと直接因果関係がある特徴に限られず、ある画像特徴と因果関係を有する特徴であってもよい。例えば、シーン特徴Fsceneと、オブジェクト特徴Fobjectとが、画像特徴と因果関係を有する特徴に該当する。
【0070】
動き特徴Fmotionは、動きの複雑さや動きの大きさを表す特徴量である。ここで、MPEG−2やH.264では、動き補償後の予測誤差を符号化するため、動きが大きい場合や複雑な動きの場合には予測誤差が大きくなり、予測誤差が大きくなることにより符号化ノイズが発生しやすくなる。特徴検出部106は、例えば、フレーム間差分の大きさや、ブロックマッチングにより求められる動きベクトルのばらつきなどを用いて、動き特徴Fmotionを検出する。
【0071】
エッジ特徴Fedgeは、エッジの大きさや方向を表す特徴量である。ここで、エッジは、符号化におけるDCTおよび量子化処理により符号化ノイズが発生しやすい画像特徴の一つである。特徴検出部106は、例えば、SobelやLaplacianなどのエッジ検出Operatorを用いてエッジ特徴Fedgeを検出する。
【0072】
テクスチャ特徴Ftextureは、画素値のばらつきを表す特徴量である。ここで、テクスチャは、エッジと同様に、符号化におけるDCTおよび量子化処理により符号化ノイズが発生しやすい特徴の一つである。特徴検出部106は、例えば、輝度値の分散や標準偏差、隣接画素差分値の分散を用いてテクスチャ特徴Ftextureを検出する。
【0073】
色特徴Fcolorは、配色や色相、彩度などを表す特徴量である。ここで、色は、コントラストが強いとノイズが発生しやすく、また、色によってノイズの見え方が異なる。特徴検出部106は、例えば、色ヒストグラムを用いて色特徴Fcolorを検出する。
【0074】
空間周波数特徴Ffrequencyは、空間周波数の高低を表す特徴量である。ここで、符号化におけるDCTおよび量子化処理により、空間周波数が高い場合には符号化ノイズが発生しやすく、また、空間周波数が低い場合には符号化ノイズが発生し難いという関係がある。特徴検出部106は、例えば、フーリエ変換やDCTなどの空間周波数変換を用いて色特徴Fcolorを検出する。
【0075】
シーン特徴Fsceneは、Flashやシーンチェンジなどシーン(場面)固有の特徴や、スポーツ、ニュース、アニメーションなどのジャンルを表す特徴である。また、オブジェクト特徴Fobjectは、例えば、画像中に含まれる人物や車などの物体を表す特徴である。ここで、これらの特徴は、上述した動き特徴Fmotion、エッジ特徴Fedge、テクスチャ特徴Ftexture、色特徴Fcolor、および空間周波数特徴Ffrequencyと因果関係を有する。特徴検出部106は、例えば、既存のシーン認識手法などを用いてシーン特徴Fsceneを検出し、既存の物体認識手法などを用いてオブジェクト特徴Fobjectを検出する。
【0076】
次に、本発明の実施形態に係る観測歪特徴について説明する。観測歪特徴としては、図3に示すように、例えば、ブロック歪特徴Fblockと、モスキート歪特徴Fmosquitoと、リンギング歪特徴Fringingとが挙げられる。
【0077】
ブロック歪特徴Fblockは、ブロック境界に段差が生じているようにユーザに認識される歪(いわゆる、ブロックノイズ)を表す特徴量である。ここで、ブロックノイズは、符号化におけるDCTおよび量子化処理によって、隣接ブロックの低周波成分に不連続が生じるために起こる歪であり、符号化ノイズが要因となって生じる画像の歪の一つである。特徴検出部106は、例えば、ブロック境界における隣接画素の差分値などを用いてブロック歪特徴Fblockを検出する。
【0078】
モスキート歪特徴Fmosquitoは、エッジ周辺に蚊が飛んでいるようにユーザに認識される歪(いわゆる、モスキートノイズ)を表す特徴量である。モスキートノイズは、符号化におけるDCTおよび量子化処理によって、エッジを構成する周波数成分に量子化誤差が生じるために起こる歪であり、符号化ノイズが要因となって生じる画像の歪の一つである。特徴検出部106は、例えば、DCT係数の孤立係数などを用いてモスキート歪特徴Fmosquitoを検出する。
【0079】
リンギング歪特徴Fringingは、直線エッジ付近が波打つように画素値が振幅する歪(いわゆる、リンギングノイズ)を表す特徴量である。リンギングノイズは、符号化におけるDCTおよび量子化処理によって、直線エッジを構成する周波数成分に量子化誤差が生じるために起こる歪であり、符号化ノイズが要因となって生じる画像の歪の一つである。特徴検出部106は、例えば、エッジに垂直な方向の画素振幅を用いてリンギング歪特徴Fringingを検出する。
【0080】
特徴検出部106は、例えば、図3に示す観測画像特徴と観測歪特徴とを、画像特徴として検出する。なお、本発明の実施形態に係る特徴検出部106が検出する画像特徴が、図3に示す例に限られないことは、言うまでもない。
【0081】
また、特徴検出部106は、例えば、画像全体を処理対象として画像特徴を検出してもよいし、画像における局所領域ごとに画像特徴を検出してもよい。画像全体を処理対象とするか、または、各局所領域を処理対象とするかは、予め規定されていてもよいし、画像処理装置100のユーザが選択可能であってもよい。
【0082】
特徴検出部106が局所領域ごとに画像特徴を検出する場合には、画像処理装置100(より厳密には、後述するノイズ特定部110)は、局所領域ごとに符号化ノイズの発生の有無(または、さらに符号化ノイズが発生している量)を特定することが可能となる。よって、特徴検出部106が局所領域ごとに画像特徴を検出する場合には、画像処理装置100は、符号化ノイズの発生の有無(または、さらに符号化ノイズが発生している量)に加え、符号化ノイズが発生している位置を特定することができる。
【0083】
ここで、本発明の実施形態に係る局所領域としては、例えば、4×4画素の矩形の領域や、8×8画素の矩形の領域、16×16画素の矩形の領域など、符号化ブロックサイズに対応する領域が挙げられる。画像処理装置100は、例えば、入力画像信号をデコードしたデコーダからブロック境界の情報を取得することによって、符号化ブロックサイズに対応する領域を局所領域とする。なお、本発明の実施形態に係る局所領域は、上記に限られない。例えば、画像処理装置100は、符号化ブロックサイズが未知の場合には、H.264の最小ブロックサイズである4×4画素の矩形の領域など、予め規定された大きさの領域を、局所領域としてもよい。
【0084】
再度図1を参照して、本発明の実施形態に係るノイズ検出部102の構成の一例について説明する。ノイズ発生確率算出部108は、本発明の実施形態に係る画像処理方法に係る上記ノイズ発生確率算出処理を主導的に行う役目を果たし、特徴検出部106において検出された複数の画像特徴と、確率テーブル150(参照確率情報の一例)とに基づいて、符号化ノイズの発生確率を算出する。
【0085】
ノイズ発生確率算出部108は、例えば図2に示すような確率テーブル150を参照して得られる条件付き確率に基づいて、符号化ノイズの発生確率を算出する。以下、より具体的に、ノイズ発生確率算出部108における符号化ノイズの発生確率の算出処理の一例について説明する。
【0086】
図4は、本発明の実施形態に係るノイズ発生確率算出部108における処理の一例を説明するための説明図である。図4は、符号化ノイズの有無の確率を推定するベイジアンネットワークモデルの一例を示している。以下では、ノイズ発生確率算出部108が、検出された、空間周波数特徴(図4において確率変数Aで表記されるノード)、動き特徴(図4において確率変数Bで表記されるノード)、ブロック歪特徴(図4において確率変数Cで表記されるノード)、およびモスキート歪特徴(図4において確率変数Dで表記されるノード)に基づいて、符号化ノイズ(図4において確率変数Xで表記)が発生する確率P(X=x1)、および発生しない確率P(X=x2)を推定する場合を例に挙げて、符号化ノイズの発生確率の算出処理の一例について説明する。
【0087】
ノードAで観測される情報を“ea”、ノードBで観測される情報を“eb”、ノードCで観測される情報を“ec”、ノードDで観測される情報を“ed”とする。ここで、eaとしては、例えばDCT係数値などが挙げられ、ebとしては、例えばフレーム間差分値などが挙げられる。また、ecとしては、例えばブロック境界の隣接画素差分値などが挙げられ、edとしては、例えばDCT係数の孤立係数値などが挙げられる。なお、本発明の実施形態に係る観測される情報(以下、「観測情報」と示す場合がある。)ea、eb、ec、edは、上記に限られない。例えば、本発明の実施形態に係る観測される情報ea、eb、ec、edは、同様な性質を持つ他の特徴量であってもよい。
【0088】
ここで、ノードXの親ノードであるノードAとノードBとにおいて観測される情報の集合を“e+”、ノードXの子ノードであるノードCとノードDとにおいて観測される情報の集合を“e−”とすると、集合e+と集合e−とは、例えば下記の数式1で表される。
【0089】
【数1】
・・・(数式1)
【0090】
また、ノードX以外の全ての観測情報e={e+,e−}が与えられたときのノードXがX=xとなる確率を“P(x|e)=P(x|e+,e−)”とすると、確率P(x|e)は、ベイズの定理と条件付き独立とを用いて、例えば下記の数式2で表される。ここで、数式2に示す“α”は、xの値に依存しない定数であり、例えば下記の数式3で表される。また、数式2に示す“π(x)”は、親ノードA、Bに基づく確率であり、例えば下記の数式4で表される。
【0091】
【数2】
・・・(数式2)
【0092】
【数3】
・・・(数式3)
【0093】
【数4】
・・・(数式4)
【0094】
ここで、数式4の“P(ai|ea)”は、ノードAの状態がaiになる確率P(ai)と考えてもよく、また、数式4の“P(bj|eb)”は、ノードBの状態がbiになる確率P(bi)と考えてもよい。よって、数式4は、例えば下記の数式5のように表すことができる。
【0095】
【数5】
・・・(数式5)
【0096】
また、数式2に示すλ(x)は、例えば下記の数式6で表される。
【0097】
【数6】
・・・(数式6)
【0098】
ノイズ発生確率算出部108は、例えば、上記数式2、数式5、数式6から、ノードX以外の全ての観測情報e={e+,e−}={ea,eb,ec,ed}が与えられたときに、ノードXがX=xとなる確率P(x|e)を求めることによって、符号化ノイズの発生確率を算出する。
【0099】
次に、具体的な数値を用いて、ノイズ発生確率算出部108における符号化ノイズが発生する確率の算出例について説明する。以下では、図4に示すベイジアンネットワークモデルを例に挙げて、ノイズ発生確率算出部108における符号化ノイズが発生する確率の算出例を説明する。
【0100】
図5、図6、図7は、本発明の実施形態に係るノイズ発生確率算出部108における処理の一例を説明するための説明図である。図5は、符号化ノイズの発生の有無に影響を及ぼす、図4における親ノードであるノードA(空間周波数特徴)とノードB(動き特徴)とに関する条件付き確率を示す確率テーブルの一例を示している。また、図6は、図4における子ノードであるノードC(ブロック歪特徴)に関する条件付き確率を示す確率テーブルの一例を示しており、図7は、図4における子ノードであるノードD(モスキート歪特徴)に関する条件付き確率を示す確率テーブルの一例を示している。
【0101】
ノイズ発生確率算出部108は、特徴検出部106から伝達される各ノードの観測情報{ea,eb,ec,ed}が互いに独立であると仮定する。伝達されるノードAの空間周波数特徴が“中”であるとすると、ノイズ発生確率算出部108は、P(a1|ea)=1、P(a2|ea)=0、P(a3|ea)=0とする。また、伝達されるノードBの動き特徴が“複雑”であったとすると、ノイズ発生確率算出部108は、P(b1|eb)=1、P(b2|eb)=0とする。また、伝達されるノードCのブロック歪特徴が“大”であったとすると、ノイズ発生確率算出部108は、P(ec|c1)=1、P(ec|c2)=0、P(ec|c3)=0とする。そして、伝達されるノードDのモスキート歪特徴が“大”であったとすると、ノイズ発生確率算出部108は、P(ed|d1)=1、P(ed|d2)=0、P(ed|d3)=0とする。
【0102】
上記観測情報と図5〜図7に示す確率テーブルから得られる値とを、上記数式5、数式6に代入した後、上記数式2によって、上記数式5、数式6に代入された値を乗算し、最終的に値を正規化することによって、ノイズ発生確率算出部108は、符号化ノイズの有無を示すx1およびx2のそれぞれの確率を求めることができる。具体的には、π(x1)、π(x2)、λ(x1)、λ(x2)は、例えば下記の数式7〜数式10に示す値となる。また、下記の数式7〜数式10に示す値の正規化処理によって、ノードXの最終的な推定結果は、例えば下記の数式11、数式12に示す値となる。
【0103】
【数7】
・・・(数式7)
【0104】
【数8】
・・・(数式8)
【0105】
【数9】
・・・(数式9)
【0106】
【数10】
・・・(数式10)
【0107】
【数11】
・・・(数式11)
【0108】
【数12】
・・・(数式12)
【0109】
ノイズ発生確率算出部108は、例えば上記のように、符号化ノイズの発生確率を算出する。なお、上記の例では、観測情報の状態が一意に決まるものとし、その他の状態の発生確率を0(ゼロ)としているが、本発明の実施形態に係るノイズ発生確率算出部108における処理は、上記に限られない。例えば、ノイズ発生確率算出部108は、観測情報の状態に確率値を与えてもよい。また、ノイズ発生確率算出部108は、例えば、ノードCにおいてP(ec|c1)=1.0、P(ec|c2)=0.5、P(ec|c3)=0.1のように設定することもできる。
【0110】
また、ノイズ発生確率算出部108は、特徴検出部106において画像全体を処理対象として画像特徴が検出された場合には、画像全体に対する符号化ノイズの発生確率を算出する。また、ノイズ発生確率算出部108は、特徴検出部106において画像における局所領域ごとに画像特徴が検出された場合には、局所領域ごとに符号化ノイズの発生確率を算出する。
【0111】
再度図1を参照して、本発明の実施形態に係るノイズ検出部102の構成の一例について説明する。ノイズ特定部110は、本発明の実施形態に係る画像処理方法に係る上記ノイズ特定処理を主導的に行う役目を果たし、算出された符号化ノイズの発生確率に基づいて、入力画像信号に含まれる符号化ノイズを特定する。ここで、ノイズ特定部110における符号化ノイズの特定は、符号化ノイズの検出に相当する。
【0112】
また、ノイズ特定部110は、例えば、符号化ノイズの特定結果を示す信号(または、特定結果を示すデータ)を、通信部(図示せず)を介してノイズ低減処理を行う機能を有する外部装置に送信する。なお、本発明の実施形態に係る画像処理装置がノイズ低減処理を行うノイズ低減部(図示せず)を備える場合、すなわち、本発明の実施形態に係る画像処理装置がノイズ低減処理を行う機能を有する場合には、ノイズ特定部110は、例えば、符号化ノイズの特定結果を示す信号をノイズ低減部(図示せず)に伝達してもよい。
【0113】
ノイズ特定部110における処理についてより具体的に説明すると、例えば、ノイズ発生確率算出部108において画像全体に対する符号化ノイズの発生確率が算出された場合には、ノイズ特定部110は、例えば符号化ノイズが発生している量を特定することによって、入力画像信号に含まれる符号化ノイズを特定する。ここで、ノイズ特定部110は、例えば、ノイズ発生確率算出部108から伝達される符号化ノイズの発生確率の値をノイズ量としてもよいし、閾値処理によって当該符号化ノイズの発生確率の値を量子化した値をノイズ量としてもよい。
【0114】
また、例えば、ノイズ発生確率算出部108において局所領域ごとに符号化ノイズの発生確率が算出された場合には、ノイズ特定部110は、局所領域ごとに符号化ノイズが発生している量を特定することによって、入力画像信号に含まれる符号化ノイズを特定する。上記のように局所領域ごとに符号化ノイズが発生している量を特定することによって、符号化ノイズが発生している位置の絞り込みを行うことが可能となるので、ノイズ特定部110は、さらに、符号化ノイズが発生している位置を特定することができる。
【0115】
ノイズ検出部102は、例えば、特徴検出部106と、ノイズ発生確率算出部108と、ノイズ特定部110とを備えることによって、本発明の実施形態に係る画像処理方法に係る処理(例えば、上記画像特徴検出処理、ノイズ発生確率算出処理、およびノイズ特定処理)を主導的に行う。よって、ノイズ検出部102は、処理対象の画像信号に基づいて、符号化ノイズを検出することができる。
【0116】
なお、図1では、ノイズ検出部102が、特徴検出部106と、ノイズ発生確率算出部108と、ノイズ特定部110とを備える構成を示しているが、本発明の実施形態に係る画像処理装置の構成は、上記に限られない。例えば、本実施形態に係る画像処理装置は、図1に示す特徴検出部106、ノイズ発生確率算出部108、およびノイズ特定部110を個別に備える(例えば、それぞれを個別の処理回路で実現する)ことができる。
【0117】
図8は、本発明の実施形態に係るノイズ検出部102における処理の一例を示す流れ図である。
【0118】
ノイズ検出部102は、入力画像から画像特徴を検出する(S100)。ステップS100の処理は、例えば、ノイズ検出部102を構成する特徴検出部106が行う。
【0119】
ステップS100において画像特徴が検出されると、ノイズ検出部102は、確率テーブル150を参照し、ベイジアンネットワーク演算により、検出された画像特徴に対応する符号化ノイズの発生確率を算出する(S102)。ステップS102の処理は、例えば、ノイズ検出部102を構成するノイズ発生確率算出部108が行う。
【0120】
ステップS102において符号化ノイズの発生確率が算出されると、ノイズ検出部102は、算出された符号化ノイズの発生確率に基づいて、符号化ノイズを特定する(S104)。ステップS104の処理は、例えば、ノイズ検出部102を構成するノイズ特定部110が行う。
【0121】
ノイズ検出部102は、例えば図8に示す処理によって、処理対象の画像信号に基づいて、符号化ノイズを検出する。
【0122】
再度図1を参照して、本発明第1の実施形態に係る画像処理装置100の構成の一例について説明する。参照確率情報生成部104は、参照確率情報を生成する役目を果たす。より具体的には、参照確率情報生成部104は、特徴検出部106(第1特徴検出部)における検出対象の画像特徴と同一の、学習画像の特徴を示す複数の画像特徴と、確率モデルとに基づいて、参照確率情報を生成する。
【0123】
図9は、本発明の第1の実施形態に係る参照確率情報生成部104の構成の一例を示すブロック図である。参照確率情報生成部104は、例えば、特徴検出部112(第2特徴検出部)と、情報生成部114とを備える。
【0124】
特徴検出部112は、学習画像信号が示す学習画像の特徴を示す画像特徴を、複数検出する。特徴検出部112は、特徴検出部106(第1特徴検出部)における検出対象の画像特徴と同一の画像特徴を、学習画像を対象として検出する。すなわち、入力される画像信号が同一であれば、特徴検出部112と特徴検出部106とは、同一の画像特徴を検出することとなる。特徴検出部112は、上述した特徴検出部106と同様の処理を行うことによって、学習画像の特徴を示す画像特徴を複数検出する。
【0125】
ここで、特徴検出部112は、例えば、記憶部(図示せず)や外部記録媒体に記憶された、学習画像を示す画像データをデコードすることにより得られた画像信号を、学習画像信号として処理する。なお、特徴検出部112が処理する学習画像信号は、上記に限られない。例えば、特徴検出部112は、ネットワークを介して(または直接的に)外部装置から送信された学習画像を示す画像信号を、学習画像信号として処理することも可能である。
【0126】
また、本発明の実施形態に係る学習画像信号としては、例えば、MPEG−2やH.264/MPEG−4 AVCなど、所定の符号化方式により符号化された動画像(または、複数の静止画像)や静止画像を示す画像信号が挙げられる。
【0127】
情報生成部114は、特徴検出部112において検出された複数の画像特徴と、ベイジアンネットワークなどの確率モデルとに基づいて、学習画像信号における符号化ノイズの発生確率を算出する。ここで、情報生成部114は、例えば、上述したノイズ発生確率算出部108と同様の処理を行うことによって、学習画像信号における符号化ノイズの発生確率を算出する。そして、情報生成部114は、参照確率情報を生成する。図9では、情報生成部114が、例えば確率テーブルを参照確率情報として生成する例を示している。
【0128】
ここで、情報生成部114における参照確率情報の生成とは、例えば、参照確率情報の新規生成が挙げられるが、情報生成部114における処理は、上記に限られない。例えば、参照確率情報が既に生成されている場合には、情報生成部114は、当該既に生成されている参照確率情報を更新してもよい。つまり、情報生成部114における参照確率情報の生成とは、例えば、参照確率情報の新規生成、または、既に生成されている参照確率情報の更新を意味する。
【0129】
参照確率情報生成部104は、例えば、特徴検出部112と情報生成部114とを備えることによって、特徴検出部106(第1特徴検出部)における検出対象の画像特徴と同一の、学習画像の特徴を示す複数の画像特徴と、確率モデルとに基づいて、参照確率情報を生成する。
【0130】
図10は、本発明の実施形態に係る参照確率情報生成部104における処理の一例を示す流れ図である。
【0131】
参照確率情報生成部104は、学習画像から画像特徴を検出する(S200)。ステップS200の処理は、例えば、参照確率情報生成部104を構成する特徴検出部112が行う。
【0132】
ステップS200において画像特徴が検出されると、参照確率情報生成部104は、検出された画像特徴と符号化ノイズとの関係を示す確率テーブル(参照確率情報の一例)を生成する(S202)。そして、参照確率情報生成部104は、生成した確率テーブル(参照確率情報の一例)を、例えば記憶部(図示せず)などに記録する(S204)。ステップS202、S204の処理は、例えば、参照確率情報生成部104を構成する情報生成部114が行う。
【0133】
参照確率情報生成部104は、例えば図10に示す処理によって、参照確率情報を生成する。
【0134】
本発明の第1の実施形態に係る画像処理装置100は、例えば上記のような処理を行う、ノイズ検出部102と、参照確率情報生成部104とを備える。
【0135】
ここで、ノイズ検出部102は、検出した複数の画像特徴と、参照確率情報とに基づいて、本来未知である入力画像信号における符号化ノイズの発生確率を算出する。そして、ノイズ検出部102は、は、算出された符号化ノイズの発生確率に基づいて、入力画像信号に含まれる符号化ノイズを特定する。
【0136】
したがって、画像処理装置100は、処理対象の画像信号に基づいて、符号化ノイズを検出することができる。
【0137】
また、参照確率情報生成部104は、ノイズ検出部102が符号化ノイズの発生確率の算出に用いる参照確率情報を生成する。
【0138】
したがって、例えば、ノイズ検出部102における符号化ノイズの検出結果が、本発明の実施形態に係る確率モデルに反映されることによって(符号化ノイズの検出結果のフィードバックにより確率モデルが更新されることによって)、画像処理装置100は、さらに柔軟かつ精度の高い符号化ノイズの検出を実現することができる。
【0139】
なお、本発明の第1の実施形態に係る画像処理装置の構成は、図1に示す構成に限られない。例えば、本発明の第1の実施形態に係る画像処理装置は、参照確率情報生成部104を備えていなくてもよい。参照確率情報生成部104を備えない構成であっても、本発明の第1の実施形態に係る画像処理装置は、本発明の実施形態に係る画像処理方法に係る処理(例えば、上記画像特徴検出処理、ノイズ発生確率算出処理、およびノイズ特定処理)を実現することが可能である。よって、参照確率情報生成部104を備えない構成であっても、本発明の第1の実施形態に係る画像処理装置は、処理対象の画像信号に基づいて、符号化ノイズを検出することができる。
【0140】
(本発明の第2の実施形態に係る画像処理装置)
例えば図1に示す第1の実施形態に係る画像処理装置100(または、第1の実施形態の変形例に係る画像処理装置。以下、同様とする。)の構成によって、本発明の実施形態に係る画像処理方法に係る処理を実現し、処理対象の画像信号に基づいて、符号化ノイズを検出することができる。しかしながら、本発明の実施形態に係る画像処理方法に係る処理を実現することが可能な構成は、図1に示す構成に限られない。
【0141】
図11は、本発明の第2の実施形態に係る画像処理装置200の構成の一例を示すブロック図である。
【0142】
図11に示す本発明の第2の実施形態に係る画像処理装置200は、図1に示す第1の実施形態に係る画像処理装置100と基本的に同様の構成を有するが、図1に示す第1の実施形態に係る画像処理装置100と比較すると、第2の実施形態に係る画像処理装置200は、ノイズ検出部202を構成する特徴検出部206(第1特徴検出部)の機能、構成と、参照確率情報生成部204の機能、構成とが異なる。
【0143】
特徴検出部206は、本発明の実施形態に係る画像処理方法に係る上記画像特徴検出処理を主導的に行う役目を果たし、入力画像信号が示す画像の特徴を示す画像特徴を、複数検出する。
【0144】
ここで、図1に示す第1の実施形態に係る特徴検出部106が、例えば図3に示す観測画像特徴と観測歪特徴のように、画像そのものから算出できる特徴量を画像特徴として検出するのに対して、特徴検出部206は、さらに、符号化に関する特徴、画像の内容に関する特徴、ユーザの知覚に関する特徴を、画像特徴として検出する。
【0145】
図12は、本発明の第2の実施形態に係るベイジアンネットワークモデルの一例を示す説明図である。図12に示すように、本発明の第2の実施形態に係るベイジアンネットワークモデルは、図3に示す本発明の第1の実施形態に係るベイジアンネットワークモデルと同様の観測画像特徴Fimageと観測歪特徴Fartifactとに加え、さらに、符号化に関する特徴Fcodec、画像の内容に関する特徴Fcontents、ユーザの知覚に関する特徴Fperceptionを有している。
【0146】
特徴検出部206は、観測画像特徴検出部208と、符号化情報取得部210と、画像内容情報取得部212と、知覚情報取得部214とを備える。
【0147】
観測画像特徴検出部208は、上述した第1の実施形態に係る特徴検出部106と同様に、例えば図3に示す観測画像特徴と観測歪特徴のように、画像そのものから算出できる特徴量を画像特徴として検出する。
【0148】
符号化情報取得部210は、入力画像信号と対応付けて送信される符号化情報を取得し、符号化情報から符号化に関する特徴を検出する。ここで、符号化情報取得部210は、入力画像信号に多重化されている符号化情報を、入力画像信号から取得するが、符号化情報取得部210における符号化情報の取得方法は、上記に限られない。例えば、符号化情報取得部210は、入力画像信号に係る符号化処理を行ったデコーダなどから符号化情報を取得してもよい。
【0149】
また、符号化情報取得部210は、例えば、動きベクトルやマイクロブロック・モード、DCT係数、量子化ステップなど、符号化に関するパラメータを、符号化に関する特徴として検出する。
【0150】
画像内容情報取得部212は、例えば入力画像信号を受信することによって、画像内容情報を取得し、画像内容情報から画像の内容に関する特徴を検出する。なお、画像内容情報取得部212における画像内容情報の取得方法は、上記に限られない。例えば、画像内容情報取得部212は、データ放送などのように入力画像信号と対応付けて送信される信号を受信することによって、画像内容情報を取得することも可能である。
【0151】
また、画像内容情報取得部212は、例えば、番組情報や文字情報、タグなど(画像内容情報の一例)に、予め規定されたキーワードが含まれているか否かを判定し、判定結果に応じて2値化することによって、画像の内容に関する特徴を検出する。
【0152】
知覚情報取得部214は、知覚情報に基づいて、ユーザの知覚に関する特徴を検出する。ここで、知覚情報取得部214は、例えば、ユーザ操作に基づき画像が複数段階で評価された結果を示す知覚情報を、記憶部(図示せず)などから読み出すことによって、知覚情報を取得する。そして、知覚情報取得部214は、取得された知覚情報が示す値(段階を示す値)を、ユーザの知覚に関する特徴として検出する。
【0153】
なお、知覚情報取得部214におけるユーザの知覚に関する特徴の検出方法は、上記に限られない。例えば、知覚情報取得部214は、照度センサなど人間の知覚に関連する値を検出するセンサ(図示せず)から、当該センサにおける検出値を知覚情報として取得し、検出値を閾値処理によって複数段階に分類することによって、複数段階に分類された結果をユーザの知覚に関する特徴として検出することも可能である。
【0154】
特徴検出部206は、例えば図11に示す構成によって、画像そのものから算出できる特徴量に加え、さらに、符号化に関する特徴、画像の内容に関する特徴、ユーザの知覚に関する特徴を、画像特徴として検出する。なお、本発明の第2の実施形態に係る特徴検出部の構成は、図11に示す構成に限られない。例えば、本発明の第2の実施形態に係る特徴検出部は、図11に示す符号化情報取得部210、画像内容情報取得部212、および知覚情報取得部214のうちの、1または2の取得部を備える構成であってもよい。
【0155】
特徴検出部206を備えるノイズ検出部202は、図1に示す第1の実施形態に係るノイズ検出部102と基本的に同様の構成を有する。したがって、ノイズ検出部202は、図11に示す構成によって、図1に示す第1の実施形態に係るノイズ検出部102と同様に、処理対象の画像信号に基づいて、符号化ノイズを検出することができる。
【0156】
参照確率情報生成部204は、図1に示す第1の実施形態に係る参照確率情報生成部104と同様に、特徴検出部206(第1特徴検出部)における検出対象の画像特徴と同一の、学習画像の特徴を示す複数の画像特徴と、確率モデルとに基づいて、参照確率情報を生成する。
【0157】
図13は、本発明の第2の実施形態に係る参照確率情報生成部204の構成の一例を示すブロック図である。参照確率情報生成部204は、例えば、特徴検出部216(第2特徴検出部)と、情報生成部114とを備える。
【0158】
特徴検出部216は、観測画像特徴検出部218と、符号化情報取得部220と、画像内容情報取得部222と、知覚情報取得部224とを備え、学習画像信号が示す学習画像の特徴を示す画像特徴を、複数検出する。ここで、観測画像特徴検出部218は、図11に示す観測画像特徴検出部208と同様の機能を有し、符号化情報取得部220、画像内容情報取得部222、および知覚情報取得部224それぞれは、図11に示す符号化情報取得部210、画像内容情報取得部212、および知覚情報取得部214と同様の機能を有する。
【0159】
特徴検出部216は、図9に示す第1の実施形態に係る特徴検出部112と同様に、特徴検出部206(第1特徴検出部)における検出対象の画像特徴と同一の画像特徴を、学習画像を対象として検出する。すなわち、入力される画像信号が同一であれば、特徴検出部216と特徴検出部206とは、同一の画像特徴を検出することとなる。
【0160】
特徴検出部216を備える参照確率情報生成部204は、図9に示す第1の実施形態に係る参照確率情報生成部104と基本的に同様の構成を有する。したがって、参照確率情報生成部204は、図13に示す構成によって、図9に示す第1の実施形態に係る参照確率情報生成部204と同様に、特徴検出部206(第1特徴検出部)における検出対象の画像特徴と同一の、学習画像の特徴を示す複数の画像特徴と、確率モデルとに基づいて、参照確率情報を生成する。
【0161】
本発明の第2の実施形態に係る画像処理装置200は、図1に示す第1の実施形態に係る画像処理装置100と基本的に同様の構成を有する。したがって、画像処理装置200は、図11に示す構成によって、図1に示す第1の実施形態に係る画像処理装置100と同様に、処理対象の画像信号に基づいて、符号化ノイズを検出することができる。
【0162】
また、例えば、ノイズ検出部202における符号化ノイズの検出結果が、本発明の実施形態に係る確率モデルに反映されることによって(符号化ノイズの検出結果のフィードバックにより確率モデルが更新されることによって)、画像処理装置200は、図1に示す第1の実施形態に係る画像処理装置100と同様に、さらに柔軟かつ精度の高い符号化ノイズの検出を実現することができる。
【0163】
以上のように、本発明の実施形態に係る画像処理装置は、符号化ノイズと因果関係を有する複数の画像特徴をベイジアンネットワークなどの確率モデルで確率的に統合し、入力画像信号などから検出される画像特徴に基づいて符号化ノイズの発生確率を算出することにより、複合的な要因で発生する符号化ノイズを検出する。よって、本発明の実施形態に係る画像処理装置は、複合的な要因で発生する符号化ノイズに対応した符号化ノイズの検出を実現することができる。
【0164】
また、本発明の実施形態に係る画像処理装置は、学習画像により集約された知識が反映された参照確率情報を用いる符号化ノイズの検出を行うことが可能であり、また、ノイズ検出結果をフィードバックして確率モデルを更新することにより、柔軟かつ精度の高いノイズ検出を行うことができる。
【0165】
また、例えばベイジアンネットワークを確率モデルとして用いる場合には、本発明の実施形態に係る画像処理装置は、ノードである画像特徴の追加、修正を容易に行うことが可能であるので、汎用性が高いノイズ検出を実現することができる。
【0166】
さらに、本発明の実施形態に係る画像処理装置が、人間の視覚特性を考慮した確率テーブルなどの参照確率情報を用いて符号化ノイズの検出を行うことによって、本発明の実施形態に係る画像処理装置は、人間が知覚できるノイズを効果的に検出するような符号化ノイズ検出を行うことができる。
【0167】
以上、本発明の実施形態として画像処理装置を挙げて説明したが、本発明の実施形態は、かかる形態に限られない。本発明の実施形態は、例えば、デジタルカメラなどの撮像装置や、PCやサーバなどのコンピュータ、テレビ受像機などの表示装置、携帯電話やスマートフォンなどの通信装置、映像/音楽再生装置(または映像/音楽記録再生装置)、ゲーム機など、画像信号の処理が可能な様々な機器に適用することができる。また、本発明の実施形態は、例えば、上記のような機器に組み込むことが可能な、画像処理IC(Integrated Circuit)に適用することもできる。
【0168】
(本発明の実施形態に係るプログラム)
コンピュータを、本発明の実施形態に係る画像処理装置として機能させるためのプログラム(例えば、上記画像特徴検出処理、上記ノイズ発生確率算出処理、および上記ノイズ特定処理など、本発明の実施形態に係る画像処理方法に係る処理を実行することが可能なプログラム)によって、処理対象の画像信号に基づいて、符号化ノイズを検出することができる。
【0169】
また、上記プログラムには、コンピュータを、さらに、図1に示す参照確率情報生成部104や、図11に示す参照確率情報生成部204を備える画像処理装置として機能させるためのプログラムが、含まれていてもよい。
【0170】
以上、添付図面を参照しながら本発明の好適な実施形態について説明したが、本発明は係る例に限定されないことは言うまでもない。当業者であれば、特許請求の範囲に記載された範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。
【0171】
例えば、上記では、コンピュータを、本発明の実施形態に係る画像処理装置として機能させるためのプログラム(コンピュータプログラム)が提供されることを示したが、本発明の実施形態は、さらに、上記プログラムをそれぞれ記憶させた記録媒体も併せて提供することができる。
【符号の説明】
【0172】
100、200 画像処理装置
102、202 ノイズ検出部
104、204 参照確率情報生成部
106、112、206、216 特徴検出部
108 ノイズ発生確率産出部
110 ノイズ特定部
114 情報生成部
208、218 観測画像特徴検出部
210、220 符号化情報取得部
212、222 画像内容情報取得部
214、224 知覚情報取得部
【技術分野】
【0001】
本発明は、画像処理装置、画像処理方法、およびプログラムに関する。
【背景技術】
【0002】
近年、例えばVOD(Video On Demand)などのように、インターネット(Internet)を介して動画像を配信するサービスの普及が進んでいる。また、例えば日本では、テレビジョン放送がデジタル化している。例えば上記のような、動画像配信サービスやデジタルテレビジョン放送において、高解像度のデジタル画像の配信や放送を可能とした技術の一つとして、画像圧縮技術がある。画像圧縮技術の規格としては、例えば、ISO/IEC MPEG(Motion Picture Experts Group)とITU−T VCEG(Video Coding Experts Group)とが共同で標準化した、MPEG−2やH.264/MPEG−4 AVC(以下、「H.264」と示す場合がある。)が挙げられる。MPEG−2やH.264は、動画像符号化国際標準規格として、様々な機器において採用されている。
【0003】
例えば、MPEG−2やH.264では、所定の符号化方式にて画像が非可逆に圧縮される。そのため、例えば上記のような符号化方式が用いられる場合には、画像のデータ量の削減には有利であるが、その反面、例えばブロックノイズやモスキートノイズなどの符号化に起因するノイズ(歪)が、画像をみるユーザに認識されてしまうことが起こりうる。
【0004】
このような中、符号化に起因するノイズを検出する技術が開発されている。符号化に起因するノイズの検出に係る技術としては、例えば、特許文献1に記載の技術や、特許文献2に記載の技術、特許文献3に記載の技術に記載の技術が挙げられる。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2007−266684号公報
【特許文献2】特開2006−121131号公報
【特許文献3】特開2007−27980号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
例えば特許文献1に記載の技術では、ブロック境界の不連続性を検出することによって、ブロックノイズを検出する。また、例えば特許文献2に記載の技術では、DCT(Discrete Cosine Transform。離散コサイン変換)係数の孤立係数を検出することによって、モスキートノイズを検出する。また、例えば特許文献3に記載の技術では、符号化情報(動きベクトルや量子化ステップ)に基づいて符号化ノイズを検出する。よって、例えば特許文献1〜3の技術を用いる場合には、符号化ノイズを検出できる可能性はある。
【0007】
しかしながら、符号化ノイズは複合的な要因によって発生するが、例えば特許文献1〜3の技術は、ブロック境界の不連続性や、DCT係数の孤立係数、動きベクトルや量子化ステップなど、ある特定の情報に基づいて符号化ノイズを検出するものであり、例えば特許文献1〜3の技術では、当該複合的な要因について考慮がなされていない。そのため、例えば特許文献1〜3の技術を用いたとしても、画像本来の構造とノイズ成分とを高精度に分離して符号化ノイズを特定することは困難である。
【0008】
本発明は、上記問題に鑑みてなされたものであり、本発明の目的とするところは、処理対象の画像信号に基づいて、符号化ノイズを検出することが可能な、新規かつ改良された画像処理装置、画像処理方法、およびプログラムを提供することにある。
【課題を解決するための手段】
【0009】
上記目的を達成するために、本発明の第1の観点によれば、入力画像信号が示す画像の特徴を示す画像特徴を、複数検出する第1特徴検出部と、検出された複数の上記画像特徴と、複数の上記画像特徴と符号化ノイズとの因果関係が示される確率モデルに基づき生成される、学習画像を示す学習画像信号における符号化ノイズの発生確率を示す参照確率情報とに基づいて、符号化ノイズの発生確率を算出するノイズ発生確率算出部と、算出された符号化ノイズの発生確率に基づいて、上記入力画像信号に含まれる符号化ノイズを特定するノイズ特定部と、を備える画像処理装置が提供される。
【0010】
かかる構成によって、処理対象の画像信号に基づいて、符号化ノイズを検出することができる。
【0011】
また、上記第1特徴検出部における検出対象の画像特徴と同一の、上記学習画像の特徴を示す複数の画像特徴と、上記確率モデルとに基づいて、上記参照確率情報を生成する参照確率情報生成部をさらに備えていてもよい。
【0012】
また、上記参照確率情報生成部は、上記第1特徴検出部における検出対象の画像特徴と同一の、上記学習画像の特徴を示す画像特徴を、複数検出する第2特徴検出部と、検出された複数の上記画像特徴と上記確率モデルとに基づいて、上記学習画像信号における符号化ノイズの発生確率を算出し、上記参照確率情報を生成する情報生成部と、を備えていてもよい。
【0013】
また、上記確率モデルは、ベイジアンネットワークであってもよい。
【0014】
また、複数の上記画像特徴は、画像における動きを示す動き特徴、画像に含まれるエッジを示すエッジ特徴、画像に含まれるテクスチャを示すテクスチャ特徴、画像に含まれる色を示す色特徴、画像における空間周波数を示す空間周波数特徴、画像における場面を示すシーン特徴、画像に含まれるオブジェクトを示すオブジェクト特徴、ブロック歪特徴、モスキート歪特徴、リンギング歪特徴、符号化に関する特徴、画像の内容に関する特徴、ユーザの知覚に関する特徴のうち、少なくとも2つ以上であってもよい。
【0015】
また、上記目的を達成するために、本発明の第2の観点によれば、入力画像信号が示す画像の特徴を示す画像特徴を、複数検出するステップと、検出された複数の上記画像特徴と、複数の上記画像特徴と符号化ノイズとの因果関係が示される確率モデルに基づき生成される、学習画像を示す学習画像信号における符号化ノイズの発生確率を示す参照確率情報とに基づいて、符号化ノイズの発生確率を算出するステップと、算出された符号化ノイズの発生確率に基づいて、上記入力画像信号に含まれる符号化ノイズを特定するステップと、を有する画像処理方法が提供される。
【0016】
かかる方法を用いることによって、処理対象の画像信号に基づいて、符号化ノイズを検出することができる。
【0017】
また、上記目的を達成するために、本発明の第3の観点によれば、入力画像信号が示す画像の特徴を示す画像特徴を、複数検出するステップ、検出された複数の上記画像特徴と、複数の上記画像特徴と符号化ノイズとの因果関係が示される確率モデルに基づき生成される、学習画像を示す学習画像信号における符号化ノイズの発生確率を示す参照確率情報とに基づいて、符号化ノイズの発生確率を算出するステップ、算出された符号化ノイズの発生確率に基づいて、上記入力画像信号に含まれる符号化ノイズを特定するステップ、をコンピュータに実行させるためのプログラムが提供される。
【0018】
かかるプログラムを用いることによって、処理対象の画像信号に基づいて、符号化ノイズを検出することができる。
【発明の効果】
【0019】
本発明によれば、処理対象の画像信号に基づいて、符号化ノイズを検出することができる。
【図面の簡単な説明】
【0020】
【図1】本発明の第1の実施形態に係る画像処理装置の構成の一例を示すブロック図である。
【図2】本発明の実施形態に係る確率テーブルの一例を示す説明図である。
【図3】本発明の第1の実施形態に係るベイジアンネットワークモデルの一例を示す説明図である。
【図4】本発明の実施形態に係るノイズ発生確率算出部における処理の一例を説明するための説明図である。
【図5】本発明の実施形態に係るノイズ発生確率算出部における処理の一例を説明するための説明図である。
【図6】本発明の実施形態に係るノイズ発生確率算出部における処理の一例を説明するための説明図である。
【図7】本発明の実施形態に係るノイズ発生確率算出部における処理の一例を説明するための説明図である。
【図8】本発明の実施形態に係るノイズ検出部における処理の一例を示す流れ図である。
【図9】本発明の第1の実施形態に係る参照確率情報生成部の構成の一例を示すブロック図である。
【図10】本発明の実施形態に係る参照確率情報生成部における処理の一例を示す流れ図である。
【図11】本発明の第2の実施形態に係る画像処理装置の構成の一例を示すブロック図である。
【図12】本発明の第2の実施形態に係るベイジアンネットワークモデルの一例を示す説明図である。
【図13】本発明の第2の実施形態に係る参照確率情報生成部の構成の一例を示すブロック図である。
【発明を実施するための形態】
【0021】
以下に添付図面を参照しながら、本発明の好適な実施の形態について詳細に説明する。なお、本明細書および図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
【0022】
(本発明の実施形態に係る画像処理方法)
本発明の実施形態に係る画像処理装置の構成について説明する前に、本発明の実施形態に係る画像処理方法について説明する。また、以下では、本発明の実施形態に係る画像処理装置が、処理対象の画像信号(以下、「入力画像信号」と示す場合がある。)に対して、本発明の実施形態に係る画像処理方法に係る処理を行うものとして説明する。
【0023】
ここで、本発明の実施形態に係る入力画像信号としては、例えば、MPEG−2やH.264/MPEG−4 AVCなど、所定の符号化方式により符号化された動画像(または、複数の静止画像)や静止画像を示す画像信号が挙げられる。以下では、本発明の実施形態に係る画像処理装置が、フレーム画像(静止画像)からなる動画像を示す画像信号を処理するものとして説明する。ここで、本発明の実施形態に係るフレーム画像とは、例えば、動画像の1フレーム(動画像がインタレース画像の場合には、1フィールドに対応する。)に対応する画像である。以下では、本発明の実施形態に係る画像処理装置が、時間順に1フレームずつ入力される画像信号を処理する場合を例に挙げて説明する。
【0024】
また、本発明の実施形態に係る画像処理装置は、例えば、本発明の実施形態に係る画像処理装置がテレビ塔などから送信された放送波を(直接的、またはセットトップボックスなどを介して間接的に)受信してデコードした結果得られる画像信号を、入力画像信号として処理する。なお、本発明の実施形態に係る画像処理装置が処理する入力画像信号は、上記に限られない。例えば、本発明の実施形態に係る画像処理装置は、ネットワークを介して(または直接的に)外部装置から送信された入力画像信号を処理することも可能である。また、本発明の実施形態に係る画像処理装置は、例えば、記憶部(後述する)や、本発明の実施形態に係る画像処理装置から着脱可能な外部記録媒体に記憶された画像データをデコードすることにより得られた画像信号を処理してもよい。さらに、本発明の実施形態に係る画像処理装置が、例えば、画像(動画像/静止画像)を撮像することが可能な撮像部(後述する)を備えている場合、すなわち、本発明の実施形態に係る画像処理装置が撮像装置として機能する場合には、本発明の実施形態に係る画像処理装置は、例えば、当該撮像部(後述する)により撮像された画像(動画像/静止画像)に対応する画像信号を処理してもよい。
【0025】
本発明の実施形態に係る画像処理装置は、入力画像信号が示す画像(以下、「入力画像」と示す場合がある。)の特徴を示す画像特徴を、複数検出する(画像特徴検出処理)。
【0026】
ここで、本発明の実施形態に係る画像特徴としては、例えば、画像における動きを示す動き特徴、画像に含まれるエッジを示すエッジ特徴、画像に含まれるテクスチャを示すテクスチャ特徴、画像に含まれる色を示す色特徴、画像における空間周波数を示す空間周波数特徴、画像における場面を示すシーン特徴、画像に含まれるオブジェクト(例えば、人や、物体など)を示すオブジェクト特徴、ブロック歪特徴、モスキート歪特徴、リンギング歪特徴、符号化に関する特徴、画像の内容に関する特徴、ユーザの知覚に関する特徴が挙げられる。
【0027】
本発明の実施形態に係る画像処理装置は、例えば、上記画像特徴のうちの少なくとも2つ以上の画像特徴を検出する。
【0028】
本発明の実施形態に係る画像処理装置は、符号化に関する特徴を検出する場合には、例えば入力画像信号に係る符号化処理を行ったデコーダなどから、符号化に関する特徴を示す符号化情報を取得し、取得された符号化情報から符号化に関する特徴を検出する。また、本発明の実施形態に係る画像処理装置は、例えば、入力画像信号と対応付けて送信される符号化情報を受信することによって、符号化情報を取得する。なお、本発明の実施形態に係る符号化情報は、例えばMPEG−2やH.264により圧縮された画像に係るビットストリームに多重化されていてもよい。
【0029】
ここで、本発明の実施形態に係る符号化情報が示す符号化に関する特徴としては、例えば、動きベクトルやマイクロブロック・モード、DCT係数、量子化ステップなど、符号化に関するパラメータが挙げられる。符号化情報は、符号化ノイズと直接的に関係する画像特徴である。例えば量子化ステップが大きい場合には、符号化ノイズが大きくなり、量子化ステップが小さい場合には、符号化ノイズは小さくなる。
【0030】
また、本発明の実施形態に係る画像処理装置は、画像の内容に関する特徴を検出する場合には、取得された画像内容情報に基づいて画像の内容に関する特徴を検出する。本発明の実施形態に係る画像処理装置は、例えば、データ放送などのように入力画像信号と対応付けて送信される信号を受信することや、入力画像信号を受信することによって、画像内容情報を取得する。
【0031】
ここで、本発明の実施形態に係る画像内容情報に基づく画像の内容に関する特徴としては、例えば、データ放送において送信される信号に多重化される番組情報や文字情報や、インターネット配信される画像に付けられたタグなどに基づき設定される特徴が挙げられる。より具体的には、本発明の実施形態に係る画像処理装置は、例えば、上記番組情報や、上記文字情報、上記タグなど(画像内容情報の一例)に、予め規定されたキーワードが含まれているか否かを判定し、判定結果に応じて2値化されたものを画像の内容に関する特徴とする。上記のように、予め規定されたキーワードが含まれているか否かの判定結果に基づき画像の内容に関する特徴を検出する場合には、本発明の実施形態に係る画像処理装置は、入力画像から画像の内容に関する特徴を検出する場合よりも、より簡単な処理によって画像の内容に関する特徴を検出することができる。
【0032】
また、本発明の実施形態に係る画像処理装置は、ユーザの知覚に関する特徴を検出する場合には、ユーザ(人間)が主観的に知覚可能なノイズの度合いを示す知覚情報に基づいて、ユーザの知覚に関する特徴を検出する。
【0033】
ここで、本発明の実施形態に係る知覚情報に基づくユーザの知覚に関する特徴としては、例えば、人間の知覚レベルを2値または多値で表したものが挙げられる。本発明の実施形態に係る知覚情報は、例えば、ユーザが操作部(後述する)やリモート・コントローラなどの外部操作装置を用いて、画像を複数段階で評価した結果を示す。なお、本発明の実施形態に係る知覚情報は、上記に限られない。例えば、本発明の実施形態に係る知覚情報は、照度センサなど人間の知覚に関連する値を検出するセンサの検出値や、当該検出値が閾値処理によって複数段階に分類された結果を示すものであってもよい。
【0034】
また、本発明の実施形態に係る画像処理装置は、符号化に関する特徴、画像の内容に関する特徴、ユーザの知覚に関する特徴を除く他の画像特徴(動き特徴、エッジ特徴、テクスチャ特徴、色特徴、空間周波数特徴、シーン特徴、オブジェクト特徴、ブロック歪特徴、モスキート歪特徴、リンギング歪特徴)を検出する場合には、処理対象の入力画像信号に基づいて画像の内容に関する特徴を検出する。なお、上記他の画像特徴については、後述する。
【0035】
本発明の実施形態に係る画像処理装置は、例えば上記のような入力画像の特徴を示す画像特徴を、複数検出する。
【0036】
複数の画像特徴が検出されると、本発明の実施形態に係る画像処理装置は、検出された複数の画像特徴と、学習画像を示す学習画像信号における符号化ノイズの発生確率を示す参照確率情報とに基づいて、符号化ノイズの発生確率を算出する(ノイズ発生確率算出処理)。
【0037】
ここで、本発明の実施形態に係る参照確率情報としては、例えば、画像特徴と符号化ノイズとの組合せごとに、符号化ノイズの発生確率が記録された確率テーブルが挙げられる。なお、本発明の実施形態に係る参照確率情報は、確率テーブルに限られず、例えば、画像特徴と符号化ノイズとの組合せごとに符号化ノイズの発生確率を特定することが可能であれば、任意の形式のデータであってもよい。
【0038】
また、本発明の実施形態に係る参照確率情報は、例えば、本発明の実施形態に係る画像処理装置の外部装置によって生成される。より具体的には、上記外部装置は、例えば、上記本発明の実施形態に係る画像処理方法に係る特徴検出処理における検出対象の画像特徴と同一の、学習画像の特徴を示す複数の画像特徴と、符号化ノイズとの因果関係が示される確率モデルに基づいて、参照確率情報を生成する。
【0039】
ここで、本発明の実施形態に係る確率モデルとしては、例えば、ベイジアンネットワーク(Bayesian Network)や、HMM(Hidden Markov Model:隠れマルコフモデル)、ニューラルネットワーク(Neural Network)などが挙げられる。
【0040】
なお、本発明の実施形態に係る参照確率情報は、外部装置によって生成されることに限られない。例えば、本発明の実施形態に係る画像処理装置が、参照確率情報を生成する参照確率情報生成部を備える場合には、本発明の実施形態に係る画像処理装置は、参照確率情報生成部において生成される参照確率情報を用いて、処理を行うことが可能である。参照確率情報部を備える構成の一例、および本発明の実施形態に係る参照確率情報の生成に係る処理の具体例については、後述する本発明の第1の実施形態に係る画像処理装置、および本発明の第2の実施形態に係る画像処理装置において説明する。
【0041】
符号化ノイズの発生確率が算出されると、本発明の実施形態に係る画像処理装置は、算出された符号化ノイズの発生確率に基づいて、入力画像信号に含まれる符号化ノイズを特定する(ノイズ特定処理)。より具体的には、本発明の実施形態に係る画像処理装置は、算出された符号化ノイズの発生確率に基づいて、例えば、符号化ノイズが発生している量や、符号化ノイズが発生している位置および符号化ノイズが発生している量を特定する。
【0042】
本発明の実施形態に係る画像処理装置は、上記のように、複数の画像特徴と符号化ノイズとの因果関係を示す確率モデルに基づき符号化ノイズの発生確率が記録されている参照確率情報に基づいて、本来未知である入力画像信号における符号化ノイズの発生確率を算出する。そして、本発明の実施形態に係る画像処理装置は、算出された符号化ノイズの発生確率に基づいて、入力画像信号に含まれる符号化ノイズを特定する。
【0043】
したがって、本発明の実施形態に係る画像処理装置は、処理対象の画像信号に基づいて、符号化ノイズを検出することができる。
【0044】
また、本発明の実施形態に係る画像処理装置における符号化ノイズの検出結果が、本発明の実施形態に係る確率モデルに反映されることによって(符号化ノイズの検出結果のフィードバックにより確率モデルが更新されることによって)、本発明の実施形態に係る画像処理装置は、さらに柔軟かつ精度の高い符号化ノイズの検出を実現することができる。
【0045】
以下、本発明の実施形態に係る画像処理装置の構成の一例について説明をすると共に、本発明の実施形態に係る画像処理方法に係る処理の具体例についても併せて説明する。
【0046】
また、以下では、本発明の実施形態に係る画像処理装置が、参照確率情報を生成する参照確率情報生成部を備える構成である場合を例に挙げて、本発明の実施形態に係る画像処理装置の構成の一例について説明をする。なお、上述したように、本発明の実施形態に係る画像処理装置は、参照確率情報を生成する参照確率情報生成部を備えない構成をとることも可能である。
【0047】
また、以下では、本発明の実施形態に係る確率モデルが、ベイジアンネットワークである場合を例に挙げて説明する。本発明の実施形態に係る確率モデルがベイジアンネットワークである場合には、確率モデルが更新された際に、確率テーブルなどの参照確率情報を更新することによって対応することが可能である。よって、本発明の実施形態に係る確率モデルとしてベイジアンネットワークを用いることによって、例えば他の確率モデルを用いる場合と比較して、より柔軟な実装を実現することができる。なお、上述したように、本発明の実施形態に係る確率モデルが、ベイジアンネットワークに限らないことは、言うまでもない。
【0048】
(本発明の第1の実施形態に係る画像処理装置)
図1は、本発明の第1の実施形態に係る画像処理装置100の構成の一例を示すブロック図である。画像処理装置100は、例えば、ノイズ検出部102と、参照確率情報生成部104とを備える。
【0049】
また、画像処理装置100は、例えば、制御部(図示せず)や、ROM(Read Only Memory。図示せず)、RAM(Random Access Memory。図示せず)、記憶部(図示せず)、ユーザが操作可能な操作部(図示せず)、様々な画面を表示画面に表示する表示部(図示せず)、外部装置と通信を行うための通信部(図示せず)、撮像部(図示せず)などを備えていてもよい。画像処理装置100は、例えば、データの伝送路としてのバスにより上記各構成要素間を接続する。
【0050】
ここで、制御部(図示せず)は、例えば、CPU(Central Processing Unit)や各種処理回路などで構成され、画像処理装置100全体を制御する。また、制御部(図示せず)は、例えば、ノイズ検出部102、および参照確率情報生成部104(または、これらのうちのいずれか1つの部)の役目を果たしてもよい。なお、ノイズ検出部102、および参照確率情報生成部104は、各部の処理を実現可能な専用の(または汎用の)処理回路で構成されていてもよいことは、言うまでもない。
【0051】
また、制御部(図示せず)は、例えば、ノイズ検出部102における符号化ノイズの検出結果に基づき、検出された符号化ノイズを低減するノイズ低減処理を行う役目を果たしてもよい。さらに、制御部(図示せず)は、例えば、ノイズ低減処理が行われた画像信号をエンコードして、記憶部(図示せず)に記録する、および/または、出力画像信号が示す画像を表示部(図示せず)や外部表示装置の表示画面に表示させるなど、出力画像信号に対する処理を行う役目を果たすことも可能である。
【0052】
ROM(図示せず)は、制御部(図示せず)が使用するプログラムや演算パラメータなどの制御用データを記憶する。RAM(図示せず)は、制御部(図示せず)により実行されるプログラムなどを一時的に記憶する。
【0053】
記憶部(図示せず)は、画像処理装置100が備える記憶手段であり、例えば、画像データや、アプリケーションなど様々なデータを記憶する。ここで、記憶部(図示せず)としては、例えば、ハードディスク(Hard Disk)などの磁気記録媒体や、フラッシュメモリ(flash memory)などの不揮発性メモリ(nonvolatile memory)などが挙げられる。また、記憶部(図示せず)は、画像処理装置100から着脱可能であってもよい。
【0054】
操作部(図示せず)としては、例えば、ボタンや、方向キー、あるいは、これらの組み合わせなどが挙げられる。また、画像処理装置100は、例えば、画像処理装置100の外部装置としての操作入力デバイス(例えば、キーボードやマウスなど)と接続することもできる。
【0055】
表示部(図示せず)としては、例えば、液晶ディスプレイ(Liquid Crystal Display;LCD)や有機ELディスプレイ(organic ElectroLuminescence display)などが挙げられる。なお、表示部(図示せず)は、例えばタッチスクリーンなどのように、表示とユーザ操作とが可能なデバイスであってもよい。また、画像処理装置100は、表示部(図示せず)の有無に関わらず、画像処理装置100の外部装置としての表示デバイス(例えば、外部ディスプレイなど)と接続することもできる。
【0056】
通信部(図示せず)は、画像処理装置100が備える通信手段であり、ネットワークを介して(あるいは、直接的に)、外部装置と無線/有線で通信を行う。ここで、通信部(図示せず)としては、例えば、通信アンテナおよびRF(Radio Frequency)回路(無線通信)や、IEEE802.15.1ポートおよび送受信回路(無線通信)、IEEE802.11bポートおよび送受信回路(無線通信)、あるいはLAN(Local Area Network)端子および送受信回路(有線通信)などが挙げられる。また、本発明の実施形態に係るネットワークとしては、例えば、LANやWAN(Wide Area Network)などの有線ネットワーク、無線LAN(WLAN;Wireless Local Area Network)や基地局を介した無線WAN(WWAN;Wireless Wide Area Network)などの無線ネットワーク、あるいは、TCP/IP(Transmission Control Protocol/Internet Protocol)などの通信プロトコルを用いたインターネットなどが挙げられる。
【0057】
撮像部(図示せず)は、静止画像または動画像を撮像する役目を果たす。撮像部(図示せず)を備える場合には、画像処理装置100は、例えば、撮像部(図示せず)における撮像により生成された画像信号を処理することが可能である。
【0058】
ここで、本発明の実施形態に係る撮像部(図示せず)としては、例えば、レンズ/撮像素子と信号処理回路とから構成される撮像デバイスが挙げられる。レンズ/撮像素子は、例えば、光学系のレンズと、CMOS(Complementary Metal Oxide Semiconductor)などの撮像素子を複数用いたイメージセンサとで構成される。また、信号処理回路は、例えば、AGC(Automatic Gain Control)回路やADC(Analog to Digital Converter)を備え、撮像素子により生成されたアナログ信号をデジタル信号(画像データ)に変換し、各種信号処理を行う。信号処理回路が行う信号処理としては、例えば、White Balance補正処理、色調補正処理、ガンマ補正処理、YCbCr変換処理、エッジ強調処理などが挙げられる。
【0059】
以下、図1に示す第1の実施形態に係る画像処理装置100の構成例について説明しつつ、画像処理装置100における処理(画像処理方法に係る処理)の一例について説明する。
【0060】
ノイズ検出部102は、本発明の実施形態に係る画像処理方法に係る処理(例えば、上記画像特徴検出処理、ノイズ発生確率算出処理、およびノイズ特定処理)を主導的に行う役目を果たす。ノイズ検出部102は、参照確率情報に基づいて、入力画像信号における符号化ノイズの発生確率を算出し、算出された符号化ノイズの発生確率に基づいて、入力画像信号に含まれる符号化ノイズを特定する。
【0061】
ここで、図1では、本発明の実施形態に係る参照確率情報として、確率テーブル150を示している。ノイズ検出部102(より厳密には、後述するノイズ発生確率算出部108)は、例えば記憶部(図示せず)に記憶されている確率テーブル150(参照確率情報の一例)を適宜読み出し、読み出した確率テーブル150と、入力画像信号から検出された複数の画像特徴とに基づいて、入力画像信号における符号化ノイズの発生確率を算出する。
【0062】
なお、本発明の実施形態に係るノイズ検出部102における処理は、上記に限られない。例えば、ノイズ検出部102は、ネットワークを介して(または直接的に)通信可能な、確率テーブル150(参照確率情報の一例)を記憶する外部装置と通信を行うことによって、入力画像信号における符号化ノイズの発生確率を算出することも可能である。より具体的には、ノイズ検出部102は、例えば、入力画像信号から検出された複数の画像特徴を含み、確率テーブル150に記録されている符号化ノイズの発生確率を外部装置に送信させるための発生確率送信要求を、通信部(図示せず)を介して外部装置へ送信する。そして、ノイズ検出部102は、上記発生確率送信要求に応じて外部装置から送信された、発生確率を示すデータを、通信部(図示せず)を介して受信し、受信されたデータと、入力画像信号から検出された複数の画像特徴とに基づいて、入力画像信号における符号化ノイズの発生確率を算出する。
【0063】
図2は、本発明の実施形態に係る確率テーブル150の一例を示す説明図である。本発明の実施形態に係る確率テーブル150は、例えば図2に示すように、ある画像特徴Fにおける符号化ノイズXの条件付き確率を示すテーブルである。ここで、確率テーブルは、条件付確率表(Conditional Probability Table :CPT)ともよばれ、例えば、図2のように画像特徴Fと符号化ノイズXの条件付き確率を表にしたものとして表される。
【0064】
ノイズ検出部102は、例えば図2に示すような確率テーブル150に基づいて、入力画像信号における符号化ノイズの発生確率を算出し、算出された符号化ノイズの発生確率に基づいて、入力画像信号に含まれる符号化ノイズを特定する。なお、図2では、画像特徴Fが3つと、符号化ノイズXが3つの確率テーブルを示しているが、本発明の実施形態に係る確率テーブル150が、図2に示す例に限られないことは、言うまでもない。
【0065】
再度図1を参照して、本発明の実施形態に係るノイズ検出部102の構成についてより具体的に説明する。ノイズ検出部102は、特徴検出部106(第1特徴検出部)と、ノイズ発生確率算出部108と、ノイズ特定部110とを備える。
【0066】
特徴検出部106は、本発明の実施形態に係る画像処理方法に係る上記画像特徴検出処理を主導的に行う役目を果たし、入力画像信号が示す画像の特徴を示す画像特徴を、複数検出する。
【0067】
ここで、特徴検出部106は、符号化ノイズと因果関係を有する画像特徴として、例えば、動き特徴、エッジ特徴、テクスチャ特徴、色特徴、空間周波数特徴、シーン特徴、オブジェクト特徴、ブロック歪特徴、モスキート歪特徴、リンギング歪特徴を検出する。なお、特徴検出部106が検出する画像特徴は、上記に限られない。例えば、特徴検出部106は、動き特徴、エッジ特徴、テクスチャ特徴、色特徴、空間周波数特徴、シーン特徴、オブジェクト特徴、ブロック歪特徴、モスキート歪特徴、リンギング歪特徴のうちの、2つ以上を検出してもよい。
【0068】
図3は、本発明の第1の実施形態に係るベイジアンネットワークモデルの一例を示す説明図であり、画像特徴と符号化ノイズとの関係をベイジアンネットワークモデルを用いて記述した例を示している。図3に示すように、本発明の実施形態に係る画像特徴は、例えば、符号化ノイズを発生させる要因となる画像特徴(つまり、符号化ノイズに対して親ノードとなる特徴)である「観測画像特徴」と、符号化ノイズが要因となって発生する画像特徴(つまり、符号化ノイズに対して子ノードとなる特徴)である「観測歪特徴」とに分類される。
【0069】
まず、本発明の実施形態に係る観測画像特徴について説明する。観測画像特徴としては、図3に示すように、例えば、動き特徴Fmotionと、エッジ特徴Fedgeと、テクスチャ特徴Ftextureと、色特徴Fcolorと、空間周波数特徴Ffrequencyと、シーン特徴Fsceneと、オブジェクト特徴Fobjectとが挙げられる。ここで、動き特徴Fmotionと、エッジ特徴Fedgeと、テクスチャ特徴Ftextureと、色特徴Fcolorと、空間周波数特徴Ffrequencyとは、符号化ノイズと直接因果関係がある特徴に該当する。また、画像特徴は、上記符号化ノイズと直接因果関係がある特徴に限られず、ある画像特徴と因果関係を有する特徴であってもよい。例えば、シーン特徴Fsceneと、オブジェクト特徴Fobjectとが、画像特徴と因果関係を有する特徴に該当する。
【0070】
動き特徴Fmotionは、動きの複雑さや動きの大きさを表す特徴量である。ここで、MPEG−2やH.264では、動き補償後の予測誤差を符号化するため、動きが大きい場合や複雑な動きの場合には予測誤差が大きくなり、予測誤差が大きくなることにより符号化ノイズが発生しやすくなる。特徴検出部106は、例えば、フレーム間差分の大きさや、ブロックマッチングにより求められる動きベクトルのばらつきなどを用いて、動き特徴Fmotionを検出する。
【0071】
エッジ特徴Fedgeは、エッジの大きさや方向を表す特徴量である。ここで、エッジは、符号化におけるDCTおよび量子化処理により符号化ノイズが発生しやすい画像特徴の一つである。特徴検出部106は、例えば、SobelやLaplacianなどのエッジ検出Operatorを用いてエッジ特徴Fedgeを検出する。
【0072】
テクスチャ特徴Ftextureは、画素値のばらつきを表す特徴量である。ここで、テクスチャは、エッジと同様に、符号化におけるDCTおよび量子化処理により符号化ノイズが発生しやすい特徴の一つである。特徴検出部106は、例えば、輝度値の分散や標準偏差、隣接画素差分値の分散を用いてテクスチャ特徴Ftextureを検出する。
【0073】
色特徴Fcolorは、配色や色相、彩度などを表す特徴量である。ここで、色は、コントラストが強いとノイズが発生しやすく、また、色によってノイズの見え方が異なる。特徴検出部106は、例えば、色ヒストグラムを用いて色特徴Fcolorを検出する。
【0074】
空間周波数特徴Ffrequencyは、空間周波数の高低を表す特徴量である。ここで、符号化におけるDCTおよび量子化処理により、空間周波数が高い場合には符号化ノイズが発生しやすく、また、空間周波数が低い場合には符号化ノイズが発生し難いという関係がある。特徴検出部106は、例えば、フーリエ変換やDCTなどの空間周波数変換を用いて色特徴Fcolorを検出する。
【0075】
シーン特徴Fsceneは、Flashやシーンチェンジなどシーン(場面)固有の特徴や、スポーツ、ニュース、アニメーションなどのジャンルを表す特徴である。また、オブジェクト特徴Fobjectは、例えば、画像中に含まれる人物や車などの物体を表す特徴である。ここで、これらの特徴は、上述した動き特徴Fmotion、エッジ特徴Fedge、テクスチャ特徴Ftexture、色特徴Fcolor、および空間周波数特徴Ffrequencyと因果関係を有する。特徴検出部106は、例えば、既存のシーン認識手法などを用いてシーン特徴Fsceneを検出し、既存の物体認識手法などを用いてオブジェクト特徴Fobjectを検出する。
【0076】
次に、本発明の実施形態に係る観測歪特徴について説明する。観測歪特徴としては、図3に示すように、例えば、ブロック歪特徴Fblockと、モスキート歪特徴Fmosquitoと、リンギング歪特徴Fringingとが挙げられる。
【0077】
ブロック歪特徴Fblockは、ブロック境界に段差が生じているようにユーザに認識される歪(いわゆる、ブロックノイズ)を表す特徴量である。ここで、ブロックノイズは、符号化におけるDCTおよび量子化処理によって、隣接ブロックの低周波成分に不連続が生じるために起こる歪であり、符号化ノイズが要因となって生じる画像の歪の一つである。特徴検出部106は、例えば、ブロック境界における隣接画素の差分値などを用いてブロック歪特徴Fblockを検出する。
【0078】
モスキート歪特徴Fmosquitoは、エッジ周辺に蚊が飛んでいるようにユーザに認識される歪(いわゆる、モスキートノイズ)を表す特徴量である。モスキートノイズは、符号化におけるDCTおよび量子化処理によって、エッジを構成する周波数成分に量子化誤差が生じるために起こる歪であり、符号化ノイズが要因となって生じる画像の歪の一つである。特徴検出部106は、例えば、DCT係数の孤立係数などを用いてモスキート歪特徴Fmosquitoを検出する。
【0079】
リンギング歪特徴Fringingは、直線エッジ付近が波打つように画素値が振幅する歪(いわゆる、リンギングノイズ)を表す特徴量である。リンギングノイズは、符号化におけるDCTおよび量子化処理によって、直線エッジを構成する周波数成分に量子化誤差が生じるために起こる歪であり、符号化ノイズが要因となって生じる画像の歪の一つである。特徴検出部106は、例えば、エッジに垂直な方向の画素振幅を用いてリンギング歪特徴Fringingを検出する。
【0080】
特徴検出部106は、例えば、図3に示す観測画像特徴と観測歪特徴とを、画像特徴として検出する。なお、本発明の実施形態に係る特徴検出部106が検出する画像特徴が、図3に示す例に限られないことは、言うまでもない。
【0081】
また、特徴検出部106は、例えば、画像全体を処理対象として画像特徴を検出してもよいし、画像における局所領域ごとに画像特徴を検出してもよい。画像全体を処理対象とするか、または、各局所領域を処理対象とするかは、予め規定されていてもよいし、画像処理装置100のユーザが選択可能であってもよい。
【0082】
特徴検出部106が局所領域ごとに画像特徴を検出する場合には、画像処理装置100(より厳密には、後述するノイズ特定部110)は、局所領域ごとに符号化ノイズの発生の有無(または、さらに符号化ノイズが発生している量)を特定することが可能となる。よって、特徴検出部106が局所領域ごとに画像特徴を検出する場合には、画像処理装置100は、符号化ノイズの発生の有無(または、さらに符号化ノイズが発生している量)に加え、符号化ノイズが発生している位置を特定することができる。
【0083】
ここで、本発明の実施形態に係る局所領域としては、例えば、4×4画素の矩形の領域や、8×8画素の矩形の領域、16×16画素の矩形の領域など、符号化ブロックサイズに対応する領域が挙げられる。画像処理装置100は、例えば、入力画像信号をデコードしたデコーダからブロック境界の情報を取得することによって、符号化ブロックサイズに対応する領域を局所領域とする。なお、本発明の実施形態に係る局所領域は、上記に限られない。例えば、画像処理装置100は、符号化ブロックサイズが未知の場合には、H.264の最小ブロックサイズである4×4画素の矩形の領域など、予め規定された大きさの領域を、局所領域としてもよい。
【0084】
再度図1を参照して、本発明の実施形態に係るノイズ検出部102の構成の一例について説明する。ノイズ発生確率算出部108は、本発明の実施形態に係る画像処理方法に係る上記ノイズ発生確率算出処理を主導的に行う役目を果たし、特徴検出部106において検出された複数の画像特徴と、確率テーブル150(参照確率情報の一例)とに基づいて、符号化ノイズの発生確率を算出する。
【0085】
ノイズ発生確率算出部108は、例えば図2に示すような確率テーブル150を参照して得られる条件付き確率に基づいて、符号化ノイズの発生確率を算出する。以下、より具体的に、ノイズ発生確率算出部108における符号化ノイズの発生確率の算出処理の一例について説明する。
【0086】
図4は、本発明の実施形態に係るノイズ発生確率算出部108における処理の一例を説明するための説明図である。図4は、符号化ノイズの有無の確率を推定するベイジアンネットワークモデルの一例を示している。以下では、ノイズ発生確率算出部108が、検出された、空間周波数特徴(図4において確率変数Aで表記されるノード)、動き特徴(図4において確率変数Bで表記されるノード)、ブロック歪特徴(図4において確率変数Cで表記されるノード)、およびモスキート歪特徴(図4において確率変数Dで表記されるノード)に基づいて、符号化ノイズ(図4において確率変数Xで表記)が発生する確率P(X=x1)、および発生しない確率P(X=x2)を推定する場合を例に挙げて、符号化ノイズの発生確率の算出処理の一例について説明する。
【0087】
ノードAで観測される情報を“ea”、ノードBで観測される情報を“eb”、ノードCで観測される情報を“ec”、ノードDで観測される情報を“ed”とする。ここで、eaとしては、例えばDCT係数値などが挙げられ、ebとしては、例えばフレーム間差分値などが挙げられる。また、ecとしては、例えばブロック境界の隣接画素差分値などが挙げられ、edとしては、例えばDCT係数の孤立係数値などが挙げられる。なお、本発明の実施形態に係る観測される情報(以下、「観測情報」と示す場合がある。)ea、eb、ec、edは、上記に限られない。例えば、本発明の実施形態に係る観測される情報ea、eb、ec、edは、同様な性質を持つ他の特徴量であってもよい。
【0088】
ここで、ノードXの親ノードであるノードAとノードBとにおいて観測される情報の集合を“e+”、ノードXの子ノードであるノードCとノードDとにおいて観測される情報の集合を“e−”とすると、集合e+と集合e−とは、例えば下記の数式1で表される。
【0089】
【数1】
・・・(数式1)
【0090】
また、ノードX以外の全ての観測情報e={e+,e−}が与えられたときのノードXがX=xとなる確率を“P(x|e)=P(x|e+,e−)”とすると、確率P(x|e)は、ベイズの定理と条件付き独立とを用いて、例えば下記の数式2で表される。ここで、数式2に示す“α”は、xの値に依存しない定数であり、例えば下記の数式3で表される。また、数式2に示す“π(x)”は、親ノードA、Bに基づく確率であり、例えば下記の数式4で表される。
【0091】
【数2】
・・・(数式2)
【0092】
【数3】
・・・(数式3)
【0093】
【数4】
・・・(数式4)
【0094】
ここで、数式4の“P(ai|ea)”は、ノードAの状態がaiになる確率P(ai)と考えてもよく、また、数式4の“P(bj|eb)”は、ノードBの状態がbiになる確率P(bi)と考えてもよい。よって、数式4は、例えば下記の数式5のように表すことができる。
【0095】
【数5】
・・・(数式5)
【0096】
また、数式2に示すλ(x)は、例えば下記の数式6で表される。
【0097】
【数6】
・・・(数式6)
【0098】
ノイズ発生確率算出部108は、例えば、上記数式2、数式5、数式6から、ノードX以外の全ての観測情報e={e+,e−}={ea,eb,ec,ed}が与えられたときに、ノードXがX=xとなる確率P(x|e)を求めることによって、符号化ノイズの発生確率を算出する。
【0099】
次に、具体的な数値を用いて、ノイズ発生確率算出部108における符号化ノイズが発生する確率の算出例について説明する。以下では、図4に示すベイジアンネットワークモデルを例に挙げて、ノイズ発生確率算出部108における符号化ノイズが発生する確率の算出例を説明する。
【0100】
図5、図6、図7は、本発明の実施形態に係るノイズ発生確率算出部108における処理の一例を説明するための説明図である。図5は、符号化ノイズの発生の有無に影響を及ぼす、図4における親ノードであるノードA(空間周波数特徴)とノードB(動き特徴)とに関する条件付き確率を示す確率テーブルの一例を示している。また、図6は、図4における子ノードであるノードC(ブロック歪特徴)に関する条件付き確率を示す確率テーブルの一例を示しており、図7は、図4における子ノードであるノードD(モスキート歪特徴)に関する条件付き確率を示す確率テーブルの一例を示している。
【0101】
ノイズ発生確率算出部108は、特徴検出部106から伝達される各ノードの観測情報{ea,eb,ec,ed}が互いに独立であると仮定する。伝達されるノードAの空間周波数特徴が“中”であるとすると、ノイズ発生確率算出部108は、P(a1|ea)=1、P(a2|ea)=0、P(a3|ea)=0とする。また、伝達されるノードBの動き特徴が“複雑”であったとすると、ノイズ発生確率算出部108は、P(b1|eb)=1、P(b2|eb)=0とする。また、伝達されるノードCのブロック歪特徴が“大”であったとすると、ノイズ発生確率算出部108は、P(ec|c1)=1、P(ec|c2)=0、P(ec|c3)=0とする。そして、伝達されるノードDのモスキート歪特徴が“大”であったとすると、ノイズ発生確率算出部108は、P(ed|d1)=1、P(ed|d2)=0、P(ed|d3)=0とする。
【0102】
上記観測情報と図5〜図7に示す確率テーブルから得られる値とを、上記数式5、数式6に代入した後、上記数式2によって、上記数式5、数式6に代入された値を乗算し、最終的に値を正規化することによって、ノイズ発生確率算出部108は、符号化ノイズの有無を示すx1およびx2のそれぞれの確率を求めることができる。具体的には、π(x1)、π(x2)、λ(x1)、λ(x2)は、例えば下記の数式7〜数式10に示す値となる。また、下記の数式7〜数式10に示す値の正規化処理によって、ノードXの最終的な推定結果は、例えば下記の数式11、数式12に示す値となる。
【0103】
【数7】
・・・(数式7)
【0104】
【数8】
・・・(数式8)
【0105】
【数9】
・・・(数式9)
【0106】
【数10】
・・・(数式10)
【0107】
【数11】
・・・(数式11)
【0108】
【数12】
・・・(数式12)
【0109】
ノイズ発生確率算出部108は、例えば上記のように、符号化ノイズの発生確率を算出する。なお、上記の例では、観測情報の状態が一意に決まるものとし、その他の状態の発生確率を0(ゼロ)としているが、本発明の実施形態に係るノイズ発生確率算出部108における処理は、上記に限られない。例えば、ノイズ発生確率算出部108は、観測情報の状態に確率値を与えてもよい。また、ノイズ発生確率算出部108は、例えば、ノードCにおいてP(ec|c1)=1.0、P(ec|c2)=0.5、P(ec|c3)=0.1のように設定することもできる。
【0110】
また、ノイズ発生確率算出部108は、特徴検出部106において画像全体を処理対象として画像特徴が検出された場合には、画像全体に対する符号化ノイズの発生確率を算出する。また、ノイズ発生確率算出部108は、特徴検出部106において画像における局所領域ごとに画像特徴が検出された場合には、局所領域ごとに符号化ノイズの発生確率を算出する。
【0111】
再度図1を参照して、本発明の実施形態に係るノイズ検出部102の構成の一例について説明する。ノイズ特定部110は、本発明の実施形態に係る画像処理方法に係る上記ノイズ特定処理を主導的に行う役目を果たし、算出された符号化ノイズの発生確率に基づいて、入力画像信号に含まれる符号化ノイズを特定する。ここで、ノイズ特定部110における符号化ノイズの特定は、符号化ノイズの検出に相当する。
【0112】
また、ノイズ特定部110は、例えば、符号化ノイズの特定結果を示す信号(または、特定結果を示すデータ)を、通信部(図示せず)を介してノイズ低減処理を行う機能を有する外部装置に送信する。なお、本発明の実施形態に係る画像処理装置がノイズ低減処理を行うノイズ低減部(図示せず)を備える場合、すなわち、本発明の実施形態に係る画像処理装置がノイズ低減処理を行う機能を有する場合には、ノイズ特定部110は、例えば、符号化ノイズの特定結果を示す信号をノイズ低減部(図示せず)に伝達してもよい。
【0113】
ノイズ特定部110における処理についてより具体的に説明すると、例えば、ノイズ発生確率算出部108において画像全体に対する符号化ノイズの発生確率が算出された場合には、ノイズ特定部110は、例えば符号化ノイズが発生している量を特定することによって、入力画像信号に含まれる符号化ノイズを特定する。ここで、ノイズ特定部110は、例えば、ノイズ発生確率算出部108から伝達される符号化ノイズの発生確率の値をノイズ量としてもよいし、閾値処理によって当該符号化ノイズの発生確率の値を量子化した値をノイズ量としてもよい。
【0114】
また、例えば、ノイズ発生確率算出部108において局所領域ごとに符号化ノイズの発生確率が算出された場合には、ノイズ特定部110は、局所領域ごとに符号化ノイズが発生している量を特定することによって、入力画像信号に含まれる符号化ノイズを特定する。上記のように局所領域ごとに符号化ノイズが発生している量を特定することによって、符号化ノイズが発生している位置の絞り込みを行うことが可能となるので、ノイズ特定部110は、さらに、符号化ノイズが発生している位置を特定することができる。
【0115】
ノイズ検出部102は、例えば、特徴検出部106と、ノイズ発生確率算出部108と、ノイズ特定部110とを備えることによって、本発明の実施形態に係る画像処理方法に係る処理(例えば、上記画像特徴検出処理、ノイズ発生確率算出処理、およびノイズ特定処理)を主導的に行う。よって、ノイズ検出部102は、処理対象の画像信号に基づいて、符号化ノイズを検出することができる。
【0116】
なお、図1では、ノイズ検出部102が、特徴検出部106と、ノイズ発生確率算出部108と、ノイズ特定部110とを備える構成を示しているが、本発明の実施形態に係る画像処理装置の構成は、上記に限られない。例えば、本実施形態に係る画像処理装置は、図1に示す特徴検出部106、ノイズ発生確率算出部108、およびノイズ特定部110を個別に備える(例えば、それぞれを個別の処理回路で実現する)ことができる。
【0117】
図8は、本発明の実施形態に係るノイズ検出部102における処理の一例を示す流れ図である。
【0118】
ノイズ検出部102は、入力画像から画像特徴を検出する(S100)。ステップS100の処理は、例えば、ノイズ検出部102を構成する特徴検出部106が行う。
【0119】
ステップS100において画像特徴が検出されると、ノイズ検出部102は、確率テーブル150を参照し、ベイジアンネットワーク演算により、検出された画像特徴に対応する符号化ノイズの発生確率を算出する(S102)。ステップS102の処理は、例えば、ノイズ検出部102を構成するノイズ発生確率算出部108が行う。
【0120】
ステップS102において符号化ノイズの発生確率が算出されると、ノイズ検出部102は、算出された符号化ノイズの発生確率に基づいて、符号化ノイズを特定する(S104)。ステップS104の処理は、例えば、ノイズ検出部102を構成するノイズ特定部110が行う。
【0121】
ノイズ検出部102は、例えば図8に示す処理によって、処理対象の画像信号に基づいて、符号化ノイズを検出する。
【0122】
再度図1を参照して、本発明第1の実施形態に係る画像処理装置100の構成の一例について説明する。参照確率情報生成部104は、参照確率情報を生成する役目を果たす。より具体的には、参照確率情報生成部104は、特徴検出部106(第1特徴検出部)における検出対象の画像特徴と同一の、学習画像の特徴を示す複数の画像特徴と、確率モデルとに基づいて、参照確率情報を生成する。
【0123】
図9は、本発明の第1の実施形態に係る参照確率情報生成部104の構成の一例を示すブロック図である。参照確率情報生成部104は、例えば、特徴検出部112(第2特徴検出部)と、情報生成部114とを備える。
【0124】
特徴検出部112は、学習画像信号が示す学習画像の特徴を示す画像特徴を、複数検出する。特徴検出部112は、特徴検出部106(第1特徴検出部)における検出対象の画像特徴と同一の画像特徴を、学習画像を対象として検出する。すなわち、入力される画像信号が同一であれば、特徴検出部112と特徴検出部106とは、同一の画像特徴を検出することとなる。特徴検出部112は、上述した特徴検出部106と同様の処理を行うことによって、学習画像の特徴を示す画像特徴を複数検出する。
【0125】
ここで、特徴検出部112は、例えば、記憶部(図示せず)や外部記録媒体に記憶された、学習画像を示す画像データをデコードすることにより得られた画像信号を、学習画像信号として処理する。なお、特徴検出部112が処理する学習画像信号は、上記に限られない。例えば、特徴検出部112は、ネットワークを介して(または直接的に)外部装置から送信された学習画像を示す画像信号を、学習画像信号として処理することも可能である。
【0126】
また、本発明の実施形態に係る学習画像信号としては、例えば、MPEG−2やH.264/MPEG−4 AVCなど、所定の符号化方式により符号化された動画像(または、複数の静止画像)や静止画像を示す画像信号が挙げられる。
【0127】
情報生成部114は、特徴検出部112において検出された複数の画像特徴と、ベイジアンネットワークなどの確率モデルとに基づいて、学習画像信号における符号化ノイズの発生確率を算出する。ここで、情報生成部114は、例えば、上述したノイズ発生確率算出部108と同様の処理を行うことによって、学習画像信号における符号化ノイズの発生確率を算出する。そして、情報生成部114は、参照確率情報を生成する。図9では、情報生成部114が、例えば確率テーブルを参照確率情報として生成する例を示している。
【0128】
ここで、情報生成部114における参照確率情報の生成とは、例えば、参照確率情報の新規生成が挙げられるが、情報生成部114における処理は、上記に限られない。例えば、参照確率情報が既に生成されている場合には、情報生成部114は、当該既に生成されている参照確率情報を更新してもよい。つまり、情報生成部114における参照確率情報の生成とは、例えば、参照確率情報の新規生成、または、既に生成されている参照確率情報の更新を意味する。
【0129】
参照確率情報生成部104は、例えば、特徴検出部112と情報生成部114とを備えることによって、特徴検出部106(第1特徴検出部)における検出対象の画像特徴と同一の、学習画像の特徴を示す複数の画像特徴と、確率モデルとに基づいて、参照確率情報を生成する。
【0130】
図10は、本発明の実施形態に係る参照確率情報生成部104における処理の一例を示す流れ図である。
【0131】
参照確率情報生成部104は、学習画像から画像特徴を検出する(S200)。ステップS200の処理は、例えば、参照確率情報生成部104を構成する特徴検出部112が行う。
【0132】
ステップS200において画像特徴が検出されると、参照確率情報生成部104は、検出された画像特徴と符号化ノイズとの関係を示す確率テーブル(参照確率情報の一例)を生成する(S202)。そして、参照確率情報生成部104は、生成した確率テーブル(参照確率情報の一例)を、例えば記憶部(図示せず)などに記録する(S204)。ステップS202、S204の処理は、例えば、参照確率情報生成部104を構成する情報生成部114が行う。
【0133】
参照確率情報生成部104は、例えば図10に示す処理によって、参照確率情報を生成する。
【0134】
本発明の第1の実施形態に係る画像処理装置100は、例えば上記のような処理を行う、ノイズ検出部102と、参照確率情報生成部104とを備える。
【0135】
ここで、ノイズ検出部102は、検出した複数の画像特徴と、参照確率情報とに基づいて、本来未知である入力画像信号における符号化ノイズの発生確率を算出する。そして、ノイズ検出部102は、は、算出された符号化ノイズの発生確率に基づいて、入力画像信号に含まれる符号化ノイズを特定する。
【0136】
したがって、画像処理装置100は、処理対象の画像信号に基づいて、符号化ノイズを検出することができる。
【0137】
また、参照確率情報生成部104は、ノイズ検出部102が符号化ノイズの発生確率の算出に用いる参照確率情報を生成する。
【0138】
したがって、例えば、ノイズ検出部102における符号化ノイズの検出結果が、本発明の実施形態に係る確率モデルに反映されることによって(符号化ノイズの検出結果のフィードバックにより確率モデルが更新されることによって)、画像処理装置100は、さらに柔軟かつ精度の高い符号化ノイズの検出を実現することができる。
【0139】
なお、本発明の第1の実施形態に係る画像処理装置の構成は、図1に示す構成に限られない。例えば、本発明の第1の実施形態に係る画像処理装置は、参照確率情報生成部104を備えていなくてもよい。参照確率情報生成部104を備えない構成であっても、本発明の第1の実施形態に係る画像処理装置は、本発明の実施形態に係る画像処理方法に係る処理(例えば、上記画像特徴検出処理、ノイズ発生確率算出処理、およびノイズ特定処理)を実現することが可能である。よって、参照確率情報生成部104を備えない構成であっても、本発明の第1の実施形態に係る画像処理装置は、処理対象の画像信号に基づいて、符号化ノイズを検出することができる。
【0140】
(本発明の第2の実施形態に係る画像処理装置)
例えば図1に示す第1の実施形態に係る画像処理装置100(または、第1の実施形態の変形例に係る画像処理装置。以下、同様とする。)の構成によって、本発明の実施形態に係る画像処理方法に係る処理を実現し、処理対象の画像信号に基づいて、符号化ノイズを検出することができる。しかしながら、本発明の実施形態に係る画像処理方法に係る処理を実現することが可能な構成は、図1に示す構成に限られない。
【0141】
図11は、本発明の第2の実施形態に係る画像処理装置200の構成の一例を示すブロック図である。
【0142】
図11に示す本発明の第2の実施形態に係る画像処理装置200は、図1に示す第1の実施形態に係る画像処理装置100と基本的に同様の構成を有するが、図1に示す第1の実施形態に係る画像処理装置100と比較すると、第2の実施形態に係る画像処理装置200は、ノイズ検出部202を構成する特徴検出部206(第1特徴検出部)の機能、構成と、参照確率情報生成部204の機能、構成とが異なる。
【0143】
特徴検出部206は、本発明の実施形態に係る画像処理方法に係る上記画像特徴検出処理を主導的に行う役目を果たし、入力画像信号が示す画像の特徴を示す画像特徴を、複数検出する。
【0144】
ここで、図1に示す第1の実施形態に係る特徴検出部106が、例えば図3に示す観測画像特徴と観測歪特徴のように、画像そのものから算出できる特徴量を画像特徴として検出するのに対して、特徴検出部206は、さらに、符号化に関する特徴、画像の内容に関する特徴、ユーザの知覚に関する特徴を、画像特徴として検出する。
【0145】
図12は、本発明の第2の実施形態に係るベイジアンネットワークモデルの一例を示す説明図である。図12に示すように、本発明の第2の実施形態に係るベイジアンネットワークモデルは、図3に示す本発明の第1の実施形態に係るベイジアンネットワークモデルと同様の観測画像特徴Fimageと観測歪特徴Fartifactとに加え、さらに、符号化に関する特徴Fcodec、画像の内容に関する特徴Fcontents、ユーザの知覚に関する特徴Fperceptionを有している。
【0146】
特徴検出部206は、観測画像特徴検出部208と、符号化情報取得部210と、画像内容情報取得部212と、知覚情報取得部214とを備える。
【0147】
観測画像特徴検出部208は、上述した第1の実施形態に係る特徴検出部106と同様に、例えば図3に示す観測画像特徴と観測歪特徴のように、画像そのものから算出できる特徴量を画像特徴として検出する。
【0148】
符号化情報取得部210は、入力画像信号と対応付けて送信される符号化情報を取得し、符号化情報から符号化に関する特徴を検出する。ここで、符号化情報取得部210は、入力画像信号に多重化されている符号化情報を、入力画像信号から取得するが、符号化情報取得部210における符号化情報の取得方法は、上記に限られない。例えば、符号化情報取得部210は、入力画像信号に係る符号化処理を行ったデコーダなどから符号化情報を取得してもよい。
【0149】
また、符号化情報取得部210は、例えば、動きベクトルやマイクロブロック・モード、DCT係数、量子化ステップなど、符号化に関するパラメータを、符号化に関する特徴として検出する。
【0150】
画像内容情報取得部212は、例えば入力画像信号を受信することによって、画像内容情報を取得し、画像内容情報から画像の内容に関する特徴を検出する。なお、画像内容情報取得部212における画像内容情報の取得方法は、上記に限られない。例えば、画像内容情報取得部212は、データ放送などのように入力画像信号と対応付けて送信される信号を受信することによって、画像内容情報を取得することも可能である。
【0151】
また、画像内容情報取得部212は、例えば、番組情報や文字情報、タグなど(画像内容情報の一例)に、予め規定されたキーワードが含まれているか否かを判定し、判定結果に応じて2値化することによって、画像の内容に関する特徴を検出する。
【0152】
知覚情報取得部214は、知覚情報に基づいて、ユーザの知覚に関する特徴を検出する。ここで、知覚情報取得部214は、例えば、ユーザ操作に基づき画像が複数段階で評価された結果を示す知覚情報を、記憶部(図示せず)などから読み出すことによって、知覚情報を取得する。そして、知覚情報取得部214は、取得された知覚情報が示す値(段階を示す値)を、ユーザの知覚に関する特徴として検出する。
【0153】
なお、知覚情報取得部214におけるユーザの知覚に関する特徴の検出方法は、上記に限られない。例えば、知覚情報取得部214は、照度センサなど人間の知覚に関連する値を検出するセンサ(図示せず)から、当該センサにおける検出値を知覚情報として取得し、検出値を閾値処理によって複数段階に分類することによって、複数段階に分類された結果をユーザの知覚に関する特徴として検出することも可能である。
【0154】
特徴検出部206は、例えば図11に示す構成によって、画像そのものから算出できる特徴量に加え、さらに、符号化に関する特徴、画像の内容に関する特徴、ユーザの知覚に関する特徴を、画像特徴として検出する。なお、本発明の第2の実施形態に係る特徴検出部の構成は、図11に示す構成に限られない。例えば、本発明の第2の実施形態に係る特徴検出部は、図11に示す符号化情報取得部210、画像内容情報取得部212、および知覚情報取得部214のうちの、1または2の取得部を備える構成であってもよい。
【0155】
特徴検出部206を備えるノイズ検出部202は、図1に示す第1の実施形態に係るノイズ検出部102と基本的に同様の構成を有する。したがって、ノイズ検出部202は、図11に示す構成によって、図1に示す第1の実施形態に係るノイズ検出部102と同様に、処理対象の画像信号に基づいて、符号化ノイズを検出することができる。
【0156】
参照確率情報生成部204は、図1に示す第1の実施形態に係る参照確率情報生成部104と同様に、特徴検出部206(第1特徴検出部)における検出対象の画像特徴と同一の、学習画像の特徴を示す複数の画像特徴と、確率モデルとに基づいて、参照確率情報を生成する。
【0157】
図13は、本発明の第2の実施形態に係る参照確率情報生成部204の構成の一例を示すブロック図である。参照確率情報生成部204は、例えば、特徴検出部216(第2特徴検出部)と、情報生成部114とを備える。
【0158】
特徴検出部216は、観測画像特徴検出部218と、符号化情報取得部220と、画像内容情報取得部222と、知覚情報取得部224とを備え、学習画像信号が示す学習画像の特徴を示す画像特徴を、複数検出する。ここで、観測画像特徴検出部218は、図11に示す観測画像特徴検出部208と同様の機能を有し、符号化情報取得部220、画像内容情報取得部222、および知覚情報取得部224それぞれは、図11に示す符号化情報取得部210、画像内容情報取得部212、および知覚情報取得部214と同様の機能を有する。
【0159】
特徴検出部216は、図9に示す第1の実施形態に係る特徴検出部112と同様に、特徴検出部206(第1特徴検出部)における検出対象の画像特徴と同一の画像特徴を、学習画像を対象として検出する。すなわち、入力される画像信号が同一であれば、特徴検出部216と特徴検出部206とは、同一の画像特徴を検出することとなる。
【0160】
特徴検出部216を備える参照確率情報生成部204は、図9に示す第1の実施形態に係る参照確率情報生成部104と基本的に同様の構成を有する。したがって、参照確率情報生成部204は、図13に示す構成によって、図9に示す第1の実施形態に係る参照確率情報生成部204と同様に、特徴検出部206(第1特徴検出部)における検出対象の画像特徴と同一の、学習画像の特徴を示す複数の画像特徴と、確率モデルとに基づいて、参照確率情報を生成する。
【0161】
本発明の第2の実施形態に係る画像処理装置200は、図1に示す第1の実施形態に係る画像処理装置100と基本的に同様の構成を有する。したがって、画像処理装置200は、図11に示す構成によって、図1に示す第1の実施形態に係る画像処理装置100と同様に、処理対象の画像信号に基づいて、符号化ノイズを検出することができる。
【0162】
また、例えば、ノイズ検出部202における符号化ノイズの検出結果が、本発明の実施形態に係る確率モデルに反映されることによって(符号化ノイズの検出結果のフィードバックにより確率モデルが更新されることによって)、画像処理装置200は、図1に示す第1の実施形態に係る画像処理装置100と同様に、さらに柔軟かつ精度の高い符号化ノイズの検出を実現することができる。
【0163】
以上のように、本発明の実施形態に係る画像処理装置は、符号化ノイズと因果関係を有する複数の画像特徴をベイジアンネットワークなどの確率モデルで確率的に統合し、入力画像信号などから検出される画像特徴に基づいて符号化ノイズの発生確率を算出することにより、複合的な要因で発生する符号化ノイズを検出する。よって、本発明の実施形態に係る画像処理装置は、複合的な要因で発生する符号化ノイズに対応した符号化ノイズの検出を実現することができる。
【0164】
また、本発明の実施形態に係る画像処理装置は、学習画像により集約された知識が反映された参照確率情報を用いる符号化ノイズの検出を行うことが可能であり、また、ノイズ検出結果をフィードバックして確率モデルを更新することにより、柔軟かつ精度の高いノイズ検出を行うことができる。
【0165】
また、例えばベイジアンネットワークを確率モデルとして用いる場合には、本発明の実施形態に係る画像処理装置は、ノードである画像特徴の追加、修正を容易に行うことが可能であるので、汎用性が高いノイズ検出を実現することができる。
【0166】
さらに、本発明の実施形態に係る画像処理装置が、人間の視覚特性を考慮した確率テーブルなどの参照確率情報を用いて符号化ノイズの検出を行うことによって、本発明の実施形態に係る画像処理装置は、人間が知覚できるノイズを効果的に検出するような符号化ノイズ検出を行うことができる。
【0167】
以上、本発明の実施形態として画像処理装置を挙げて説明したが、本発明の実施形態は、かかる形態に限られない。本発明の実施形態は、例えば、デジタルカメラなどの撮像装置や、PCやサーバなどのコンピュータ、テレビ受像機などの表示装置、携帯電話やスマートフォンなどの通信装置、映像/音楽再生装置(または映像/音楽記録再生装置)、ゲーム機など、画像信号の処理が可能な様々な機器に適用することができる。また、本発明の実施形態は、例えば、上記のような機器に組み込むことが可能な、画像処理IC(Integrated Circuit)に適用することもできる。
【0168】
(本発明の実施形態に係るプログラム)
コンピュータを、本発明の実施形態に係る画像処理装置として機能させるためのプログラム(例えば、上記画像特徴検出処理、上記ノイズ発生確率算出処理、および上記ノイズ特定処理など、本発明の実施形態に係る画像処理方法に係る処理を実行することが可能なプログラム)によって、処理対象の画像信号に基づいて、符号化ノイズを検出することができる。
【0169】
また、上記プログラムには、コンピュータを、さらに、図1に示す参照確率情報生成部104や、図11に示す参照確率情報生成部204を備える画像処理装置として機能させるためのプログラムが、含まれていてもよい。
【0170】
以上、添付図面を参照しながら本発明の好適な実施形態について説明したが、本発明は係る例に限定されないことは言うまでもない。当業者であれば、特許請求の範囲に記載された範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。
【0171】
例えば、上記では、コンピュータを、本発明の実施形態に係る画像処理装置として機能させるためのプログラム(コンピュータプログラム)が提供されることを示したが、本発明の実施形態は、さらに、上記プログラムをそれぞれ記憶させた記録媒体も併せて提供することができる。
【符号の説明】
【0172】
100、200 画像処理装置
102、202 ノイズ検出部
104、204 参照確率情報生成部
106、112、206、216 特徴検出部
108 ノイズ発生確率産出部
110 ノイズ特定部
114 情報生成部
208、218 観測画像特徴検出部
210、220 符号化情報取得部
212、222 画像内容情報取得部
214、224 知覚情報取得部
【特許請求の範囲】
【請求項1】
入力画像信号が示す画像の特徴を示す画像特徴を、複数検出する第1特徴検出部と、
検出された複数の前記画像特徴と、複数の前記画像特徴と符号化ノイズとの因果関係が示される確率モデルに基づき生成される、学習画像を示す学習画像信号における符号化ノイズの発生確率を示す参照確率情報とに基づいて、符号化ノイズの発生確率を算出するノイズ発生確率算出部と、
算出された符号化ノイズの発生確率に基づいて、前記入力画像信号に含まれる符号化ノイズを特定するノイズ特定部と、
を備えることを特徴とする、画像処理装置。
【請求項2】
前記第1特徴検出部における検出対象の画像特徴と同一の、前記学習画像の特徴を示す複数の画像特徴と、前記確率モデルとに基づいて、前記参照確率情報を生成する参照確率情報生成部をさらに備えることを特徴とする、請求項1に記載の画像処理装置。
【請求項3】
前記参照確率情報生成部は、
前記第1特徴検出部における検出対象の画像特徴と同一の、前記学習画像の特徴を示す画像特徴を、複数検出する第2特徴検出部と、
検出された複数の前記画像特徴と前記確率モデルとに基づいて、前記学習画像信号における符号化ノイズの発生確率を算出し、前記参照確率情報を生成する情報生成部と、
を備えることを特徴とする、請求項2に記載の画像処理装置。
【請求項4】
前記確率モデルは、ベイジアンネットワークであることを特徴とする、請求項1〜3のいずれか1項に記載の画像処理装置。
【請求項5】
複数の前記画像特徴は、画像における動きを示す動き特徴、画像に含まれるエッジを示すエッジ特徴、画像に含まれるテクスチャを示すテクスチャ特徴、画像に含まれる色を示す色特徴、画像における空間周波数を示す空間周波数特徴、画像における場面を示すシーン特徴、画像に含まれるオブジェクトを示すオブジェクト特徴、ブロック歪特徴、モスキート歪特徴、リンギング歪特徴、符号化に関する特徴、画像の内容に関する特徴、ユーザの知覚に関する特徴のうち、少なくとも2つ以上であることを特徴とする、請求項1〜4のいずれか1項に記載の画像処理装置。
【請求項6】
入力画像信号が示す画像の特徴を示す画像特徴を、複数検出するステップと、
検出された複数の前記画像特徴と、複数の前記画像特徴と符号化ノイズとの因果関係が示される確率モデルに基づき生成される、学習画像を示す学習画像信号における符号化ノイズの発生確率を示す参照確率情報とに基づいて、符号化ノイズの発生確率を算出するステップと、
算出された符号化ノイズの発生確率に基づいて、前記入力画像信号に含まれる符号化ノイズを特定するステップと、
を有することを特徴とする、画像処理方法。
【請求項7】
入力画像信号が示す画像の特徴を示す画像特徴を、複数検出するステップ、
検出された複数の前記画像特徴と、複数の前記画像特徴と符号化ノイズとの因果関係が示される確率モデルに基づき生成される、学習画像を示す学習画像信号における符号化ノイズの発生確率を示す参照確率情報とに基づいて、符号化ノイズの発生確率を算出するステップ、
算出された符号化ノイズの発生確率に基づいて、前記入力画像信号に含まれる符号化ノイズを特定するステップ、
をコンピュータに実行させるためのプログラム。
【請求項1】
入力画像信号が示す画像の特徴を示す画像特徴を、複数検出する第1特徴検出部と、
検出された複数の前記画像特徴と、複数の前記画像特徴と符号化ノイズとの因果関係が示される確率モデルに基づき生成される、学習画像を示す学習画像信号における符号化ノイズの発生確率を示す参照確率情報とに基づいて、符号化ノイズの発生確率を算出するノイズ発生確率算出部と、
算出された符号化ノイズの発生確率に基づいて、前記入力画像信号に含まれる符号化ノイズを特定するノイズ特定部と、
を備えることを特徴とする、画像処理装置。
【請求項2】
前記第1特徴検出部における検出対象の画像特徴と同一の、前記学習画像の特徴を示す複数の画像特徴と、前記確率モデルとに基づいて、前記参照確率情報を生成する参照確率情報生成部をさらに備えることを特徴とする、請求項1に記載の画像処理装置。
【請求項3】
前記参照確率情報生成部は、
前記第1特徴検出部における検出対象の画像特徴と同一の、前記学習画像の特徴を示す画像特徴を、複数検出する第2特徴検出部と、
検出された複数の前記画像特徴と前記確率モデルとに基づいて、前記学習画像信号における符号化ノイズの発生確率を算出し、前記参照確率情報を生成する情報生成部と、
を備えることを特徴とする、請求項2に記載の画像処理装置。
【請求項4】
前記確率モデルは、ベイジアンネットワークであることを特徴とする、請求項1〜3のいずれか1項に記載の画像処理装置。
【請求項5】
複数の前記画像特徴は、画像における動きを示す動き特徴、画像に含まれるエッジを示すエッジ特徴、画像に含まれるテクスチャを示すテクスチャ特徴、画像に含まれる色を示す色特徴、画像における空間周波数を示す空間周波数特徴、画像における場面を示すシーン特徴、画像に含まれるオブジェクトを示すオブジェクト特徴、ブロック歪特徴、モスキート歪特徴、リンギング歪特徴、符号化に関する特徴、画像の内容に関する特徴、ユーザの知覚に関する特徴のうち、少なくとも2つ以上であることを特徴とする、請求項1〜4のいずれか1項に記載の画像処理装置。
【請求項6】
入力画像信号が示す画像の特徴を示す画像特徴を、複数検出するステップと、
検出された複数の前記画像特徴と、複数の前記画像特徴と符号化ノイズとの因果関係が示される確率モデルに基づき生成される、学習画像を示す学習画像信号における符号化ノイズの発生確率を示す参照確率情報とに基づいて、符号化ノイズの発生確率を算出するステップと、
算出された符号化ノイズの発生確率に基づいて、前記入力画像信号に含まれる符号化ノイズを特定するステップと、
を有することを特徴とする、画像処理方法。
【請求項7】
入力画像信号が示す画像の特徴を示す画像特徴を、複数検出するステップ、
検出された複数の前記画像特徴と、複数の前記画像特徴と符号化ノイズとの因果関係が示される確率モデルに基づき生成される、学習画像を示す学習画像信号における符号化ノイズの発生確率を示す参照確率情報とに基づいて、符号化ノイズの発生確率を算出するステップ、
算出された符号化ノイズの発生確率に基づいて、前記入力画像信号に含まれる符号化ノイズを特定するステップ、
をコンピュータに実行させるためのプログラム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【公開番号】特開2013−110701(P2013−110701A)
【公開日】平成25年6月6日(2013.6.6)
【国際特許分類】
【出願番号】特願2011−256411(P2011−256411)
【出願日】平成23年11月24日(2011.11.24)
【出願人】(598045058)株式会社サムスン横浜研究所 (294)
【Fターム(参考)】
【公開日】平成25年6月6日(2013.6.6)
【国際特許分類】
【出願日】平成23年11月24日(2011.11.24)
【出願人】(598045058)株式会社サムスン横浜研究所 (294)
【Fターム(参考)】
[ Back to top ]