説明

画像処理装置及びプログラム

【課題】撮像手段により撮像された被写体の画像を含む撮像画像のうちで被写体の画像に対応する領域である被写体領域を検出する場合における、被写体領域の検出精度を向上させる。
【解決手段】撮像画像に基づいて、被写体領域の輪郭を構成する直線の候補を複数特定する直線候補特定部(24)と、特定された候補が被写体領域の輪郭を構成する直線となる確からしさを表す直線確度を、撮像画像に基づいて特定される、当該候補との間の距離が基準距離以内である位置の特徴量に基づいて算出する直線確度算出部(26)と、特定された複数の候補のうちから選出される4つの候補により囲まれる領域である領域候補が被写体領域である確からしさを表す領域確度を、該4つの候補の各々の直線確度に基づいて算出する領域確度算出部(30)と、算出された領域確度に基づいて被写体領域を検出する領域選択部(32)と、を含む画像処理装置である。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像処理装置及びプログラムに関する。
【背景技術】
【0002】
下記特許文献1には、画像から検出された複数の直線で構成される領域の形状に関する特徴に基づいて、その領域が検出対象の矩形領域である確からしさを示す情報を生成すること、生成した情報に基づいて、検出対象の矩形領域を検出すること、が記載されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2010−062722号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
本発明の目的は、撮像手段により撮像された被写体の画像を含む撮像画像のうちで被写体の画像に対応する領域である被写体領域を検出する場合における、被写体領域の検出精度を従来よりも向上させることである。
【課題を解決するための手段】
【0005】
上記課題を解決するための請求項1の発明は、撮像手段により撮像された被写体の画像を含む撮像画像に基づいて、前記被写体の画像に対応する領域である被写体領域の輪郭を構成する直線の候補を複数特定する直線候補特定手段と、前記直線候補特定手段により特定された候補が前記被写体領域の輪郭を構成する直線となる確からしさを表す直線確度情報を、前記撮像画像に基づいて特定される、当該候補との間の距離が基準距離以内である位置の特徴量に基づいて算出する直線確度算出手段と、前記直線候補特定手段により特定された複数の候補のうちから選出される所定数の候補により囲まれる領域である注目領域が前記被写体領域である確からしさを表す領域確度情報を、該所定数の候補の各々の直線確度情報に基づいて算出する領域確度算出手段と、前記領域確度算出手段により算出された領域確度情報に基づいて前記被写体領域を検出する被写体領域検出手段と、を含むことを特徴とする画像処理装置である。
【0006】
また、請求項2の発明は、請求項1の発明において、前記直線確度算出手段は、前記直線候補特定手段により特定された候補との間の距離が前記基準距離以内である位置の特徴量を取得し、取得した特徴量の均一性に関する評価情報に基づいて当該候補の直線確度情報を算出すること、を特徴とする。
【0007】
また、請求項3の発明は、請求項2の発明において、ある位置の前記特徴量は、該ある位置のエッジ強度、該ある位置のエッジ勾配の勾配方向、又は、該ある位置の前記撮像画像の画素値が表す色空間距離、であることを特徴とする。
【0008】
また、請求項4の発明は、請求項1の発明において、前記直線確度算出手段は、前記直線候補特定手段により特定された候補との間の距離が前記基準距離以内である位置の特徴量を取得し、予め定められた条件を満足する特徴量を有する位置の数に基づいて当該候補の直線確度情報を算出することを特徴とする。
【0009】
また、請求項5の発明は、請求項1の発明において、前記直線確度算出手段は、前記直線候補特定手段により特定された候補との間の距離が前記基準距離以内である位置の特徴量を取得し、予め定められた条件を満足する特徴量を有する位置の分布に関する情報に基づいて当該候補の直線確度情報を算出することを特徴とする。
【0010】
また、請求項6の発明は、請求項4又5の発明において、ある位置の前記特徴量は、該ある位置がエッジ位置であるか否かを示し、前記条件を満足する特徴量は、エッジ位置であることを示すことを特徴とする。
【0011】
また、請求項7の発明は、請求項1の発明において、前記領域確度算出手段は、前記注目領域を構成する隣接する2つの辺の各々につき、前記撮像画像に基づいて定まる、当該辺との間の距離が閾値距離以内にある位置の特徴量を取得し、取得した特徴量と、前記所定数の候補の各々の直線確度情報と、に基づいて領域確度情報を算出することを特徴とする。
【0012】
また、請求項8の発明は、請求項7の発明において、前記領域確度算出手段は、前記2つの辺のうちの一方について取得した特徴量と、他方について取得した特徴量と、の類似度に関する情報を生成し、生成した情報と、前記所定数の候補の各々の直線確度情報と、に基づいて領域確度情報を算出することを特徴とする。
【0013】
また、請求項9の発明は、請求項7又は8の発明において、前記領域確度算出手段は、
前記注目領域を構成する隣接する2つの辺の各々につき、当該辺との間の距離が前記閾値距離以内にある位置のエッジ強度、又は、当該辺との間の距離が前記閾値距離以内にある位置の撮像画像における画素値、を取得することを特徴とする。
【0014】
また、請求項10の発明は、請求項1の発明において、前記領域確度算出手段は、前記注目領域内の位置の前記撮像画像における画素値を取得し、取得した画素値と、前記所定数の候補の各々の直線確度情報と、に基づいて領域確度情報を算出することを特徴とする。
【0015】
また、請求項11の発明は、請求項10の発明において、前記領域確度算出手段は、取得した画素値の均一性に関する評価情報と、前記所定数の候補の各々の直線確度情報と、に基づいて領域確度情報を算出することを特徴とする。
【0016】
また、請求項12の発明は、請求項1の発明において、前記領域確度算出手段は、前記注目領域内に含まれる、文字を表す文字画像を検出し、検出した文字画像の数と、前記所定数の候補の各々の直線確度情報と、に基づいて領域確度情報を算出することを特徴とする。
【0017】
また、上記課題を解決するための請求項13の発明は、撮像手段により撮像された被写体の画像を含む撮像画像に基づいて、前記被写体の画像に対応する領域である被写体領域の輪郭を構成する直線の候補を複数特定する直線候補特定手段、前記直線候補特定手段により特定された候補が前記被写体領域の輪郭を構成する直線となる確からしさを表す直線確度情報を、前記撮像画像に基づいて特定される、当該候補との間の距離が基準距離以内である位置の特徴量に基づいて算出する直線確度算出手段、前記直線候補特定手段により特定された複数の候補のうちから選出される所定数の候補により囲まれる領域である注目領域が前記被写体領域である確からしさを表す領域確度情報を、該所定数の候補の各々の直線確度情報に基づいて算出する領域確度算出手段、前記領域確度算出手段により算出された領域確度情報に基づいて前記被写体領域を検出する被写体領域検出手段、としてコンピュータを機能させるプログラムである。
【発明の効果】
【0018】
請求項1及び13の発明によれば、撮像手段により撮像された被写体の画像を含む撮像画像のうちで被写体の画像に対応する領域である被写体領域を検出する場合における、被写体領域の検出精度を従来よりも向上させることが可能になる。
【0019】
請求項2の発明によれば、本構成を有しない場合に比して、被写体領域の検出精度をより向上させることができる。
【0020】
請求項3の発明によれば、本構成を有しない場合に比して、被写体領域の検出精度をより向上させることができる。
【0021】
請求項4の発明によれば、本構成を有しない場合に比して、被写体領域の検出精度をより向上させることができる。
【0022】
請求項5の発明によれば、本構成を有しない場合に比して、被写体領域の検出精度をより向上させることができる。
【0023】
請求項6の発明によれば、本構成を有しない場合に比して、被写体領域の検出精度をより向上させることができる。
【0024】
請求項7の発明によれば、本構成を有しない場合に比して、被写体領域の検出精度をより向上させることができる。
【0025】
請求項8の発明によれば、本構成を有しない場合に比して、被写体領域の検出精度をより向上させることができる。
【0026】
請求項9の発明によれば、本構成を有しない場合に比して、被写体領域の検出精度をより向上させることができる。
【0027】
請求項10の発明によれば、本構成を有しない場合に比して、被写体領域の検出精度をより向上させることができる。
【0028】
請求項11の発明によれば、本構成を有しない場合に比して、被写体領域の検出精度をより向上させることができる。
【0029】
請求項12の発明によれば、本構成を有しない場合に比して、被写体領域の検出精度をより向上させることができる。
【図面の簡単な説明】
【0030】
【図1】画像処理装置の構成を例示する図である。
【図2】ホワイトボードを例示する図である。
【図3】撮像画像を例示する図である。
【図4】被写体領域を例示する図である。
【図5】画像処理装置にて実現される機能群を示す機能ブロック図である。
【図6A】第1のエッジ画像を例示する図である。
【図6B】第2のエッジ画像を例示する図である。
【図6C】第3のエッジ画像を例示する図である。
【図7】合成エッジ画像を例示する図である。
【図8】直線候補が特定されたときの様子を概念的に示す図である。
【発明を実施するための形態】
【0031】
以下、本発明の実施形態の例について図面に基づき詳細に説明する。
【0032】
[画像処理装置]
図1は、本発明の実施形態に係る画像処理装置2の構成を例示する図である。画像処理装置2は、例えばパーソナルコンピュータであり、制御部4と、主記憶6と、操作部8と、表示部10と、ハードディスク12と、を備える。また、これらの他にも、ネットワークとデータ授受を行うためのネットワークインタフェース、及び、外部機器(例えば、デジタルカメラ)とデータ授受を行うためのI/Oインタフェースなどが備えられる。
【0033】
制御部4は、例えばマイクロプロセッサであり、主記憶6に記憶されるプログラムに従って情報処理を実行する。主記憶6は、RAM及びROMを含む。主記憶6には上記プログラムが格納される。このプログラムは、DVD(登録商標)−ROM等のコンピュータ読取可能な情報記憶媒体から読み出されて主記憶6に格納されてもよいし、ネットワーク等の通信網から供給されて主記憶6に格納されてもよい。主記憶6には、情報処理の過程で必要となる各種データも格納される。
【0034】
操作部8は、例えばマウス及びキーボードであり、利用者が画像処理装置2を操作するためのインタフェースであり、例えばマウス及びキーボード等である。操作部8は、利用者が行った操作の内容を表す情報を制御部4に出力する。表示部10は、例えば液晶ディスプレイであり、制御部4によって入力される情報を表示する。
【0035】
ハードディスク12は、各種情報を記憶するための記憶媒体であり、デジタルカメラ(撮像手段)により撮像されたカラーの画像を表す基礎画像が格納される。この基礎画像は、被写体を撮影したデジタルカメラからI/Oインタフェースを介して供給される。ここでは、基礎画像は、各画素(位置)の画素値を含む。画素値は、複数の色成分値、すなわち、輝度成分Yの値(以下、Y値)、第1色差成分Cbの値(以下、Cb値)、及び第2色差成分Crの値(以下、Cr値)を含む。
【0036】
ここでは、デジタルカメラにより壁面に設置されたホワイトボード14が撮影される。図2に、ホワイトボード14を例示した。同図に示すように、ホワイトボード14は、横長の矩形形状を有する。ここでは、同図に示すように、ホワイトボード14には、アルファベット文字「X」、「Y」、「Z」とが描かれている。
【0037】
[機能ブロック]
この画像処理装置2では、ユーザが予め定められた被写体抽出操作を行った場合に基礎画像が読み出され、撮像画像が生成されるようになっている。撮像画像は、基礎画像の縮小画像を表し、各画素(位置)の画素値を含む。基礎画像と同様に、画素値は、Y値と、Cb値と、Cr値と、を含む。
【0038】
図3に、撮像画像を例示した。ここでは、ホワイトボード14に向かって右側の位置からホワイトボード14を撮影した場合を想定している。同図に示すように、撮像画像には、ホワイトボード14の画像が含まれる。ハッチングされている部分は壁面を表している。なお、撮像画像には、x座標軸とy座標軸とが設定されており、各画素は座標値により特定される。なお、画像サイズが異なるものの、上述の基礎画像も図3に示す撮像画像と同様の画像となる。
【0039】
また、この画像処理装置2では、ユーザが被写体抽出操作を行った場合に、撮像画像が生成されるだけでなく、ホワイトボード14の画像に対応する被写体領域16が撮像画像のうちで検出され、この被写体領域16に基づいてホワイトボード14を正面から見たときの画像が生成され表示部10に表示されるようになっている。図4に、被写体領域16を例示した。
【0040】
この画像処理装置2では、被写体抽出操作が行われた場合における被写体領域16の検出精度の向上が図られている。以下、この点について説明する。
【0041】
図5は、画像処理装置2にて実現される機能群を示す機能ブロック図である。同図に示すように、画像処理装置2では、エッジ検出部18と、合成部20と、線候補特定部24と、直線確度算出部26と、領域候補選出部28と、領域確度算出部30と、領域選択部32と、幾何変換パラメータ算出部34と、幾何変換処理部36と、を含む。これらの機能は、制御部4が、被写体抽出操作が行われた場合に上記プログラムに従って動作することによって実現される。
【0042】
[エッジ検出部]
エッジ検出部18は、まず、撮像画像に対して色分解処理を行うことによって撮像画像を3つの色成分に分解し、第1の色分解画像と第2の色分解画像と第3の色分解画像からなる3つの色分解画像を生成する。各々の色分解画像は、各画素の画素値を含む。第1の色分解画像に含まれる任意の画素の画素値は、撮像画像の当該画素の画素値に含まれるY値を表す。第2の色分解画像に含まれる任意の画素の画素値は、撮像画像の当該画素の画素値に含まれるCb値を表す。第3の色分解画像に含まれる任意の画素の画素値は、撮像画像の当該画素の画素値に含まれるCr値を表す。
【0043】
こうして、3つの色分解画像を生成すると、エッジ検出部18は、各色分解画像に対してエッジ検出処理を実行する。
【0044】
すなわち、エッジ検出部18は、まず、各色分解画像について、各画素におけるエッジ勾配の勾配方向θ及びエッジ強度Iを算出する。
【0045】
より詳しくは、エッジ検出部18は、色分解画像ごとに、Sobelフィルタを用いて、各画素におけるx方向のエッジ勾配Gx及びy方向のエッジ勾配Gyを算出し、任意の画素における勾配方向θ及びエッジ強度Iを、その画素におけるエッジ勾配Gx及びエッジ勾配Gyに基づいて算出する。なお、勾配方向θ及びエッジ強度Iは、以下の数式で表される。
【0046】
θ=tan−1(Gy/Gx)
I=(Gx+Gy1/2
【0047】
その結果、第1の色分解画像の各画素における勾配方向θを表す第1のエッジ勾配画像と、第2の色分解画像の各画素における勾配方向θを表す第2のエッジ勾配画像と、第3の色分解画像の各画素における勾配方向θを表す第3のエッジ勾配画像と、が生成される。第1のエッジ勾配画像に含まれる任意の画素の画素値は、第1の色分解画像の当該画素における勾配方向θを表し、第2のエッジ勾配画像に含まれる任意の画素の画素値は、第2の色分解画像の当該画素における勾配方向θを表し、第3のエッジ勾配画像に含まれる任意の画素の画素値は、第3の色分解画像の当該画素における勾配方向θを表す。
【0048】
また、第1の色分解画像の各画素におけるエッジ強度Iを表す第1のエッジ強度画像、第2の色分解画像の各画素におけるエッジ強度Iを表す第2のエッジ強度画像、及び第3の色分解画像の各画素におけるエッジ強度Iを表す第3のエッジ強度画像も生成される。第1のエッジ強度画像に含まれる任意の画素の画素値は、第1の色分解画像の当該画素におけるエッジ強度Iを表し、第2のエッジ強度画像に含まれる任意の画素の画素値は、第2の色分解画像の当該画素におけるエッジ強度を表し、第3のエッジ強度画像に含まれる任意の画素の画素値は、第3の色分解画像の当該画素におけるエッジ強度Iを表す。
【0049】
そして、エッジ検出部18は、3つのエッジ強度画像及び3つのエッジ勾配画像に基づいて、各色分解画像についてエッジ画素(エッジ位置)を検出する。
【0050】
すなわち、エッジ検出部18は、第1のエッジ強度画像及び第1のエッジ勾配画像に基づいて、第1の色分解画像についてエッジ画素を検出する。具体的には、エッジ検出部18は、キャニー法を用いて、第1の色分解画像のうちからエッジ画素を検出する。ここで、エッジ画素とは、勾配方向のエッジ強度が局所的に最大となる画素のことである。そして、第1のエッジ画像を生成する。第1のエッジ画像は二値画像であり、第1のエッジ画像の各画素値は、「0」又は「1」の値を示す。エッジ画素の画素値は「1」となり、エッジ画素でない画素の画素値は「0」となる。図6Aに、第1のエッジ画像を例示した。
【0051】
同様に、エッジ検出部18は、第2のエッジ強度画像及び第2のエッジ勾配画像に基づいて、第2の色分解画像についてエッジ画素を検出し、二値画像である第2のエッジ画像を生成する。第2のエッジ画像の各画素値は「0」または「1」の値を示す。エッジ画素の画素値は「1」となり、エッジ画素でない画素の画素値は「0」となる。図6Bに、第2のエッジ画像を例示した。
【0052】
同様に、エッジ検出部18は、第3のエッジ強度画像及び第3のエッジ勾配画像に基づいて、第3の色分解画像についてエッジ画素を検出し、二値画像である第2のエッジ画像を生成する。第3のエッジ画像の各画素値は「0」または「1」の値を示す。エッジ画素の画素値は「1」となり、エッジ画素でない画素の画素値は「0」となる。図6Cに、第3のエッジ画像を例示した。
【0053】
[合成部]
合成部20は、第1のエッジ画像と、第2のエッジ画像と、第3のエッジ画像と、をOR合成した合成エッジ画像を生成する。画素値が「1」である画素が、エッジ画素(エッジ位置)となる。図7に合成エッジ画像を例示した。
【0054】
また、合成部20は、第1のエッジ強度画像、第2のエッジ強度画像、及び第3のエッジ強度画像を合成した合成エッジ強度画像を生成する。合成エッジ強度画像の任意の画素の画素値(エッジ強度)は、第1のエッジ強度画像と第2のエッジ強度画像と第3のエッジ強度画像とのうち当該画素の画素値が表すエッジ強度Iが最大のエッジ強度画像、における当該画素のエッジ強度Iを表している。合成エッジ強度画像を生成する際、合成部は、各画素について、第1のエッジ強度画像の画素値が表すエッジ強度Iと、第2のエッジ強度画像の画素値が表すエッジ強度Iと、第3のエッジ強度画像の画素値が表すエッジ強度Iと、のうちで最大のエッジ強度を特定することとなる。
【0055】
また、合成部20は、第1のエッジ勾配画像と、第2のエッジ勾配画像と、第3のエッジ勾配画像と、を合成した合成エッジ勾配画像を生成する。合成エッジ強度画像の任意の画素の画素値(勾配方向)は、第1のエッジ強度画像の当該画素の画素値が表すエッジ強度Iが最大である場合、第1のエッジ勾配画像の当該画素の画素値が表す勾配方向θを示し、第2のエッジ強度画像の当該画素の画素値が表すエッジ強度Iが最大である場合、第2のエッジ勾配画像の当該画素の画素値が表す勾配方向θを示し、第3のエッジ強度画像の当該画素の画素値が表すエッジ強度Iが最大である場合、第3のエッジ勾配画像の当該画素の画素値が表す勾配方向θを示す。合成エッジ勾配画像を生成する際、合成部20は、各画素について、第1のエッジ強度画像と第2のエッジ強度画像と第3のエッジ強度画像とのうちで当該画素の画素値が表すエッジ強度Iが最大となるエッジ強度画像MAXを特定するとともに、エッジ強度画像MAXが第「N」(N=1〜3)のエッジ強度画像であれば、第「N」のエッジ勾配画像の当該画素の画素値が表す勾配方向θを特定することとなる。
【0056】
なお、ノイズの影響を避けるため、合成エッジ強度画像のうちにエッジ強度Iが閾値強度以下である画素(以下、削除対象画素と呼ぶ)が存在する場合、削除対象画素の画素値が、合成エッジ画像、合成エッジ強度画像、及び合成エッジ勾配画像、から削除される。
【0057】
[直線候補特定部]
そして、直線候補特定部24(直線候補特定手段)は、合成エッジ画像が表すエッジ画素の各々をハフ変換することによって、被写体領域16の領域の輪郭を構成する直線の候補となる直線候補lを複数特定する。
【0058】
例えば、直線候補特定部24は、合成エッジ画像が表すエッジ画素の各々をハフ変換して、エッジ画素の数だけ曲線r(θ)を求める。ここで、曲線r(θ)は以下の数式で表される。
r(θ)=x0×cosθ+y0×sinθ
【0059】
なお、x0は、エッジ画素のx座標値であり、y0は、エッジ画素のy座標値である。
【0060】
そして、直線候補特定部24は、−πから+πまでの角度範囲を「M」(Mは正の整数)等分してなる「M」個の注目角度範囲ごとに、所定数以上の曲線が交わる交点のハフ空間における座標値(ハフ変換の結果)を特定し、特定した座標値から直線候補lを特定する。
【0061】
なお、直線候補特定部24は、必ずしもすべての注目角度範囲について交点の座標値の特定を行わなくてもよい。例えば、直線候補特定部24は、「M」個の注目角度範囲のうち、合成エッジ勾配画像が表す勾配方向θに応じた注目角度範囲について交点の座標値の特定を行うようにしてよい。例えば、直線候補特定部24は、注目角度範囲ごとに、当該注目角度範囲内の角度を示す勾配方向θが合成エッジ勾配画像にて出現する出現数をカウントし、出現数が「1」〜「L」(「L」は例えば「4」)番目に多い注目角度範囲について交点の座標値を特定するようにしてよい。また、例えば、直線候補特定部24は、予め定められた「L」個の注目画素の各々の合成エッジ勾配画像における勾配方向θを特定し、特定したエッジ勾配方向θを含む注目角度範囲について交点の座標値を特定するようにしてもよい。こうすれば、ノイズの影響を軽減しつつ、高速に直線候補lが特定されるようになる。
【0062】
図8に、直線候補が特定されたときの様子を概念的に示した。1の実践が、1つの直線候補lを表している。
【0063】
[直線確度算出部]
そして、直線確度算出部26(直線確度算出手段)は、直線候補lごとに、当該直線候補が被写体領域16の輪郭を構成する直線となる確からしさを示す直線確度P1を算出する。
【0064】
具体的には、直線確度算出部26は、任意の直線候補l(以下、直線候補lxと記載する)の直線確度P1を算出する場合、直線候補lxの近傍の画素の合成エッジ強度画像におけるエッジ強度Iと、直線候補lxの近傍の画素の合成エッジ勾配画像における勾配方向θと、直線候補lxの近傍の画素の撮像画像における画素値と、に基づいて直線確度P1を算出する。
【0065】
より詳しくは、直線確度算出部26は、直線候補lxとの間の距離が基準距離S以下である画素(以下、基準画素と記載する)全部のエッジ強度Iを合成エッジ強度画像から読み出し、読み出したエッジ強度Iの均一性に関する評価情報を生成する。すなわち、直線確度算出部26は、読み出したエッジ強度Iの分散の逆数D1を評価情報として算出する。また、直線確度算出部26は、基準画素全部の勾配方向θを合成エッジ勾配画像から読み出し、読み出した勾配方向θの均一性に関する評価情報を生成する。すなわち、直線確度算出部26は、読み出した勾配方向θの分散、又は、読み出した勾配方向θと直線候補lxの法線方向又は延伸方向との差の分散、の逆数D2を評価情報として算出する。
【0066】
また、直線確度算出部26は、基準画素全部の画素値を撮像画像から読み出し、読み出した画素値に含まれるY値、Cb値、及びCr値により表される色空間距離、の均一性に関する評価情報を生成する。すなわち、直線確度算出部26は、読み出した画素値の各々により表される色空間距離を算出し、算出した色空間距離の分散の逆数D3を評価情報として算出する。
【0067】
D1〜D3は、どれも基準画素の特徴量の均一性を示している。すなわち、D1は、基準画素のエッジ強度Iの均一性を示し、D2は、基準画素の勾配方向θの均一性を示し、D3は、基準画素の色空間距離の均一性を示している。
【0068】
また、直線確度算出部26は、基準画素全部の画素値を合成エッジ画像から読み出し、読み出した画素値のうち「1」を示す基準画素、すなわち、エッジ画素となっている基準画素の個数を特定し、特定した個数の基準画素の総数に対する割合Rを算出する。また、直線確度算出部26は、合成エッジ画像から読み出した基準画素の画素値に基づいて、直線候補lx上をスキャンした場合に、連続して出現する「画素値「1」を示す基準画素(エッジ画素となっている基準画素)」の個数Cを特定する。個数Cは、エッジ画素となっている基準画素の分布に関する情報を示している。
【0069】
そして、直線確度算出部26は、逆数D1、逆数D2、逆数D3、割合R、及び個数Cに基づいて、直線候補lxの直線確度P1を算出する。本実施形態の場合、直線確度算出部26は、逆数D1、逆数D2、逆数D3、割合R、及び個数Cを、所定の重み付け係数を掛けて足し合わせることにより、直線確度P1を算出する。
【0070】
被写体領域16の輪郭を構成する直線近傍の画素の特徴量(勾配方向θ、エッジ強度I、色空間距離)はほぼ均一である。そのため、直線候補lxの近傍の画素の特徴量の均一性が高いほど、直線候補lxが被写体領域16の輪郭を構成する直線である可能性は高いと考えられる。この点、この画像処理装置2では、基準画素の特徴量の均一性を考慮して直線確度P1が算出される。そのため、基準画素の特徴量の均一性を考慮して直線候補lxが被写体領域16の輪郭を構成する直線である可能性が評価されるようになり、後に行われる被写体領域16の検出が高い精度で行われ易くなる。
【0071】
また、被写体領域16の輪郭を構成する直線近傍の画素の大部分はエッジ画素になる。そのため、直線候補lxの近傍の画素の多くがエッジ画素であれば、直線候補lxが被写体領域16の輪郭を構成する直線である可能性は高いと考えられる。この点、この画像処理装置2では、直線候補lxの近傍にあるエッジ画素の数や、直線候補lxの近傍にあるエッジ画素の連なりの長さを考慮して直線確度P1が算出される。そのため、これらを考慮して直線候補lxが被写体領域16の輪郭を構成する直線である可能性が評価されるようになり、後に行われる被写体領域16の検出が高い精度で行われ易くなる。
【0072】
[領域候補選出部]
次に、領域候補選出部28は、直線候補特定部22により特定された複数の直線候補lのうちから直線確度P1が「1」〜「Q」(「Q」は例えば「10」)番目に大きい直線候補lを選出し、選出した「Q」本の直線候補lのうちから選出される4本の直線候補lにより囲まれる四角形の領域を被写体領域16の候補となる領域候補Kとして選出する。なお、領域候補Kは、4本の直線候補lの組み合わせの数だけ選出される。
【0073】
そして、領域確度算出部30(領域確度算出手段)が、領域候補選出部28により選出された領域候補Kの各々につき、当該領域候補が被写体領域16となる確からしさを示す領域確度P2を、当該領域候補Kを構成する直線候補lの直線確度P1に基づいて算出する。
【0074】
本実施形態の場合、領域確度算出部30は、任意の領域候補K(以下、領域候補Kx)の領域確度P2を算出する場合、まず、領域候補Kxを構成する4本の直線候補lの各々の直線確度の平均を指数E1として算出する。
【0075】
また、領域確度算出部30は、領域候補Kxの外接矩形の短辺と長辺の比を指数E2として算出する。なお、領域確度算出部30は、領域候補Kxにおける、基準角度(例えば、5度)以下の角度を有する頂点の有無、を指数E2としてよい。
【0076】
また、領域確度算出部30は、領域候補Kxを構成する隣接する2つの辺の各々について、特徴平均を算出し、算出した2つの特徴平均の類似度を、指数E2として算出する。
【0077】
例えば、領域確度算出部30は、隣接する2つの辺のうちの一の辺(以下、辺eと記載する)について特徴平均を算出する場合、両辺の交点との間の距離と辺eとの間の距離との双方が基準距離S以下である画素(以下、第2基準画素と記載する)の画素値(すなわち、エッジ強度I)を、合成エッジ強度画像から読み出し、読み出したエッジ強度Iの平均を特徴平均として算出する。或いは、領域確度算出部30は、第2基準画素の画素値を撮像画像から読み出し、読み出した画素値に含まれるY値、Cb値、及びCr値のうちのいずれかの平均を特徴平均として算出する。或いは、領域確度算出部30は、撮像画像のグレースケール画像を生成するとともに、第2基準画素の画素値をグレースケール画像から読み出し、読み出した画素値の平均を特徴平均として算出する。
【0078】
さらに、領域確度算出部30は、領域候補Kxに含まれる画素の画素値を撮像画像から読み出し、読み出した画素値の均一性に関する評価情報を生成する。例えば、領域確度算出部30は、読み出した画素値の各々に含まれるY値の分散の逆数を、評価情報である指数E3として算出する。なお、領域確度算出部30は、読み出した画素値の空間周波数を指数E3として算出してよい。
【0079】
さらに、領域確度算出部30は、OCR処理を行うことにより、撮像画像に含まれる、文字を表す文字画像を、領域候補Kx内で検出し、検出した文字画像の数を指数E4として設定する。
【0080】
そして、領域確度算出部30は、指数E1〜E4を、指数E1〜E4のそれぞれに所定の重み付け計数を掛けて足し合わせることにより、領域候補Kxの領域確度P2を算出する。
【0081】
このように、領域候補Kxを構成する直線候補lのそれぞれの直線確度P1を考慮して領域確度P2が算出される。そのため、領域候補Kxを構成する直線候補lのそれぞれの直線確度P1を領域候補Kxが被写体領域16である可能性が評価されるようになり、後に行われる被写体領域16の検出が高い精度で行われ易くなる。
【0082】
また、被写体領域16の輪郭を構成する隣接する2辺の近傍の画素の特徴はほぼ類似する。そのため、領域候補Kxを構成する隣接する2辺の近傍の画素の特徴が類似していれば、領域候補Kxが被写体領域16である可能性は高いと考えられる。この点、この画像処理装置2では、領域候補Kxを構成する隣接する2辺の近傍の画素の特徴の類似性を考慮して領域確度P2が算出される。そのため、領域候補Kxを構成する隣接する2辺の近傍の画素の特徴の類似性を考慮して領域候補Kxが被写体領域16である可能性が評価されるようになり、後に行われる被写体領域16の検出が高い精度で行われ易くなる。
【0083】
また、被写体がホワイトボード14である場合、被写体領域16内部の画素はほぼ均一の特徴を有する。そのため、領域候補Kx内部の画素がほぼ均一の特徴を有していれば、領域候補Kxが被写体領域16である可能性は高いと考えられる。この点、この画像処理装置2では、領域候補Kx内部の画素それぞれの特徴の均一性を考慮して領域確度P2が算出される。そのため、領域候補Kx内部の画素それぞれの特徴の均一性を考慮して領域候補Kxが被写体領域16である可能性が評価されるようになり、後に行われる被写体領域16の検出が高い精度で行われ易くなる。
【0084】
また、被写体がホワイトボード14である場合、被写体領域16の内部には多数の文字画像が含まれる場合が多い。そのため、領域候補Kxに多くの文字画像が含まれていれば、領域候補Kxが被写体領域16である可能性は高いと考えられる。この点、この画像処理装置2では、領域候補Kx内部の文字画像の数を考慮して領域確度P2が算出される。そのため、領域候補Kx内部の文字画像の数を考慮して領域候補Kxが被写体領域16である可能性が評価されるようになり、後に行われる被写体領域16の検出が高い精度で行われ易くなる。
【0085】
[領域選択部]
以上のようにして、各領域候補Kの領域確度P2の算出が完了すると、領域選択部32(被写体領域検出手段)は、領域確度P2が最も大きい領域候補Kを検出し、被写体領域16として選択する。
【0086】
[幾何変換パラメータ算出部]
被写体領域16が検出されると、幾何変換パラメータ算出部34は、被写体領域16を拡大し、拡大した被写体領域16(以下、拡大被写体領域と記載する)の4つの頂点の座標値を算出する。
【0087】
なお、ホワイトボード14の画像が上述した基礎画像において占める領域が、拡大被写体領域となる。
【0088】
そして、幾何変換パラメータ算出部34は、算出した各頂点の座標値と、基礎画像に対して予め設定されている矩形領域の各頂点の座標値と、を比較することにより、拡大被写体領域を上記矩形領域へと幾何変換するための幾何変換パラメータを算出する。幾何変換パラメータは、いわゆる射影変換の変換パラメータである。
【0089】
[幾何変換処理部]
そして、幾何変換処理部36は、基礎画像から拡大被写体領域の画像、すなわち、基礎画像に含まれるホワイトボード14の画像を切り出した後、切り出した画像を、幾何変換パラメータ算出部34により算出された幾何変換パラメータに従って幾何変換し、幾何変換後の画像を表示部10に表示させる。その結果、ホワイトボード14を正面から見たときの画像が表示部10に表示される。
【0090】
なお、本発明の実施形態は、上記実施形態だけに限らない。
【0091】
例えば、領域確度算出部30は、領域候補Kxの外接矩形の短辺と長辺の比ではなく、領域候補Kxのうちの最長辺と領域候補Kxのうちの最短辺との比、を指数E2として算出してもよい。
【0092】
また、被写体は、ホワイトボード14でなくてもよく、例えば、紙媒体であってもよい。
【符号の説明】
【0093】
2 画像処理装置、4 制御部、6 主記憶、8 操作部、10 表示部、12 ハードディスク、14 ホワイトボード、16 被写体領域、18 エッジ検出部、20 合成部、24 直線候補特定部、26 直線確度算出部、28 領域候補選出部、30 領域確度算出部、32 領域選択部、34 幾何変換パラメータ算出部、36 幾何変換処理部。

【特許請求の範囲】
【請求項1】
撮像手段により撮像された被写体の画像を含む撮像画像に基づいて、前記被写体の画像に対応する領域である被写体領域の輪郭を構成する直線の候補を複数特定する直線候補特定手段と、
前記直線候補特定手段により特定された候補が前記被写体領域の輪郭を構成する直線となる確からしさを表す直線確度情報を、前記撮像画像に基づいて特定される、当該候補との間の距離が基準距離以内である位置の特徴量に基づいて算出する直線確度算出手段と、
前記直線候補特定手段により特定された複数の候補のうちから選出される所定数の候補により囲まれる領域である注目領域が前記被写体領域である確からしさを表す領域確度情報を、該所定数の候補の各々の直線確度情報に基づいて算出する領域確度算出手段と、
前記領域確度算出手段により算出された領域確度情報に基づいて前記被写体領域を検出する被写体領域検出手段と、
を含むことを特徴とする画像処理装置。
【請求項2】
前記直線確度算出手段は、
前記直線候補特定手段により特定された候補との間の距離が前記基準距離以内である位置の特徴量を取得し、取得した特徴量の均一性に関する評価情報に基づいて当該候補の直線確度情報を算出すること、
を特徴とする請求項1に記載の画像処理装置。
【請求項3】
ある位置の前記特徴量は、該ある位置のエッジ強度、該ある位置のエッジ勾配の勾配方向、又は、該ある位置の前記撮像画像の画素値が表す色空間距離、であること、
を特徴とする請求項2に記載の画像処理装置。
【請求項4】
前記直線確度算出手段は、
前記直線候補特定手段により特定された候補との間の距離が前記基準距離以内である位置の特徴量を取得し、予め定められた条件を満足する特徴量を有する位置の数に基づいて当該候補の直線確度情報を算出すること、
を特徴とする請求項1に記載の画像処理装置。
【請求項5】
前記直線確度算出手段は、
前記直線候補特定手段により特定された候補との間の距離が前記基準距離以内である位置の特徴量を取得し、予め定められた条件を満足する特徴量を有する位置の分布に関する情報に基づいて当該候補の直線確度情報を算出すること、
を特徴とする請求項1に記載の画像処理装置。
【請求項6】
ある位置の前記特徴量は、該ある位置がエッジ位置であるか否かを示し、
前記条件を満足する特徴量は、エッジ位置であることを示すこと、
を特徴とする請求項4又は5に記載の画像処理装置。
【請求項7】
前記領域確度算出手段は、
前記注目領域を構成する隣接する2つの辺の各々につき、前記撮像画像に基づいて定まる、当該辺との間の距離が閾値距離以内にある位置の特徴量を取得し、取得した特徴量と、前記所定数の候補の各々の直線確度情報と、に基づいて領域確度情報を算出すること、
を特徴とする請求項1に記載の画像処理装置。
【請求項8】
前記領域確度算出手段は、
前記2つの辺のうちの一方について取得した特徴量と、他方について取得した特徴量と、の類似度に関する情報を生成し、生成した情報と、前記所定数の候補の各々の直線確度情報と、に基づいて領域確度情報を算出すること、
を特徴とする請求項7に記載の画像処理装置。
【請求項9】
前記領域確度算出手段は、
前記注目領域を構成する隣接する2つの辺の各々につき、当該辺との間の距離が前記閾値距離以内にある位置のエッジ強度、又は、当該辺との間の距離が前記閾値距離以内にある位置の撮像画像における画素値、を取得すること、
を特徴とする請求項7又は8に記載の画像処理装置。
【請求項10】
前記領域確度算出手段は、
前記注目領域内の位置の前記撮像画像における画素値を取得し、取得した画素値と、前記所定数の候補の各々の直線確度情報と、に基づいて領域確度情報を算出すること、
を特徴とする請求項1に記載の画像処理装置。
【請求項11】
前記領域確度算出手段は、
取得した画素値の均一性に関する評価情報と、前記所定数の候補の各々の直線確度情報と、に基づいて領域確度情報を算出すること、
を特徴とする請求項10に記載の画像処理装置。
【請求項12】
前記領域確度算出手段は、
前記注目領域内に含まれる、文字を表す文字画像を検出し、検出した文字画像の数と、前記所定数の候補の各々の直線確度情報と、に基づいて領域確度情報を算出すること、
を特徴とする請求項1に記載の画像処理装置。
【請求項13】
撮像手段により撮像された被写体の画像を含む撮像画像に基づいて、前記被写体の画像に対応する領域である被写体領域の輪郭を構成する直線の候補を複数特定する直線候補特定手段、
前記直線候補特定手段により特定された候補が前記被写体領域の輪郭を構成する直線となる確からしさを表す直線確度情報を、前記撮像画像に基づいて特定される、当該候補との間の距離が基準距離以内である位置の特徴量に基づいて算出する直線確度算出手段、
前記直線候補特定手段により特定された複数の候補のうちから選出される所定数の候補により囲まれる領域である注目領域が前記被写体領域である確からしさを表す領域確度情報を、該所定数の候補の各々の直線確度情報に基づいて算出する領域確度算出手段、
前記領域確度算出手段により算出された領域確度情報に基づいて前記被写体領域を検出する被写体領域検出手段、
としてコンピュータを機能させるプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6A】
image rotate

【図6B】
image rotate

【図6C】
image rotate

【図7】
image rotate

【図8】
image rotate


【公開番号】特開2012−221118(P2012−221118A)
【公開日】平成24年11月12日(2012.11.12)
【国際特許分類】
【出願番号】特願2011−84803(P2011−84803)
【出願日】平成23年4月6日(2011.4.6)
【出願人】(000005496)富士ゼロックス株式会社 (21,908)
【Fターム(参考)】