説明

画像処理装置

【課題】焦点距離に関する情報がなくても、幾何学的歪みの補正を適切に行う画像処理装置を提供する。
【解決手段】画像処理装置1は、撮像文書画像における水平方向の消失点の位置および垂直方向の消失点の位置を示す消失点情報を生成する消失点情報推定部14と、撮像文書画像におけるコーナーを検出するコーナー検出部15と、水平方向の消失点の位置に集まる2つの線分を上辺および下辺とし、垂直方向の消失点の位置に集まる2つの線分を左辺および右辺とし、検出されたコーナーを囲む四角形の輪郭を輪郭四角形として決定する輪郭決定部16と、輪郭四角形に基づいて、幾何学的補正後の第1画像サイズを決定する画像サイズ決定部19と、上記輪郭四角形と上記第1画像サイズとに基づいた第1補正方法により撮像文書画像に対して幾何学的補正を行う補正処理部20とを備えている。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、撮像手段によって撮像された文書画像(原稿画像)におけるアーチファクト(欠陥)の補正、特に幾何学的歪みの補正のための方法、システムおよび装置に関する。
【背景技術】
【0002】
従来、撮影対象物を斜め方向から撮像した画像における撮像対象物の幾何学的歪みを補正して、あたかも正面から撮影したような画像を取得する技術が知られている。例えば、特許文献1には、撮影対象物の画像から当該画像の輪郭を取得し、取得した輪郭から画像の形状を求める。そして、求められた画像の形状が適切な四角形であるか否かの判定を行い、適切であると判定された場合に、上記四角形から射影パラメータを求め、求めた射影パラメータを用いて撮影対象物の画像の画像変換を行う。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2005−122319号公報(2005年5月12日公開)
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1に記載の技術では、カメラレンズの焦点距離と撮影対象物の画像の頂点位置とに基づいて撮影対象物の画像の大きさを求め、求めた画像の大きさを射影パラメータに基づいて調整している。すなわち、特許文献1では画像変換を行う際にカメラレンズの焦点距離に関する情報を予め有しておく必要がある。しかしながら、携帯電話やスマートフォン、タブレット情報端末に付属しているカメラで撮像した場合、焦点距離に関する情報の取得が困難であり、特許文献1の技術では適切な画像変換を行うことができない。
【0005】
本発明は、上記課題を解決するためになされたものであり、カメラレンズの焦点距離に関する情報がなくても、幾何学的歪みの補正を適切に行うことが可能な画像処理装置、画像処理方法、プログラムおよび記録媒体を提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明の一態様に係る画像処理装置は、撮像装置により撮像された画像に対して幾何学的補正を行う画像処理装置であって、(a)撮像装置が矩形状の文書を撮像することにより得られた撮像文書画像を取得する撮像画像取得部と、(b)上記撮像文書画像における水平方向の消失点の位置または水平方向の消失点の方向を示す水平方向消失点情報を生成するとともに、上記撮像文書画像における垂直方向の消失点の位置または垂直水平方向の消失点の方向を示す垂直方向消失点情報を生成する消失点情報生成部と、(c)上記撮像文書画像におけるコーナーを検出するコーナー検出部と、(d)(1)上記水平方向消失点情報が水平方向の消失点の位置を示す場合、当該水平方向の消失点の位置に集まる2つの線分を上辺および下辺とし、上記水平方向消失点情報が水平方向の消失点の方向を示す場合、当該水平方向の消失点の方向に平行な2つの線分を上辺および下辺とし、(2)上記垂直方向消失点情報が垂直方向の消失点の位置を示す場合、当該垂直方向の消失点の位置に集まる2つの線分を左辺および右辺とし、上記垂直方向消失点情報が垂直方向の消失点の方向を示す場合、当該垂直方向の消失点の方向に平行な2つの線分を左辺および右辺とし、(3)上記コーナー検出部により検出されたコーナーを囲む四角形の輪郭を輪郭四角形として決定する輪郭決定部と、(e)上記輪郭四角形の信頼性を示す第1の評価値を算出する幾何学的補正評価部と、(f)上記第1の評価値を基に、上記輪郭四角形に基づいた第1補正方法により幾何学的補正を行うか否かを決定する補正方法決定部と、(g)上記補正方法決定部が第1補正方法による幾何学的補正を行うと決定した場合に、上記輪郭四角形に基づいて、幾何学的補正後の第1画像サイズを決定する画像サイズ決定部と、(h)上記補正方法決定部が第1補正方法による幾何学的補正を行うと決定した場合に、上記輪郭四角形と上記第1画像サイズとに基づいて上記撮像文書画像に対して幾何学的補正を行う補正処理部とを備えている。
【発明の効果】
【0007】
本発明によれば、カメラレンズの焦点距離に関する情報がなくても、幾何学的歪みの補正を適切に行うことができる。
【図面の簡単な説明】
【0008】
【図1】本発明の一実施形態に係る画像処理装置の構成を示すブロック図である。
【図2】撮像対象物となるである文書と、当該文書を傾斜した方向から撮像したときの撮像文書画像とを示す図である。
【図3】図1に示す画像処理装置の処理の流れを示すフローチャートである。
【図4】撮像文書画像における水平方向および垂直方向のライングループを用いて消失点情報を生成する処理の流れを示すフローチャートである。
【図5】撮像文書画像から直線構造を抽出する処理を説明する図であり、(a)は撮像文書画像の一例を示し、(b)は(a)の撮像文書画像から検出されたエッジマスクを示し、(c)は(b)のエッジマスクから抽出された所定長さ以上の直線構造を示し、(d)は(c)の直線構造のうちラインギャップが占める占有率が所定の占有閾値よりも小さい直線構造を示す。
【図6】図5の(d)で示される直線構造に対して水平方向および垂直方向のライングループへのグループ分けを行った結果を示す図である。
【図7A】水平方向の消失点を推定するための前処理の流れを示すフローチャートである。
【図7B】水平方向のライングループに属する直線構造の数が2よりも多いときの水平方向消失点情報の生成処理の流れを示すフローチャートである。
【図7C】水平方向のライングループに属する直線構造の数が2であるときの水平方向消失点情報の生成処理の流れを示すフローチャートである。
【図7D】水平方向のライングループに属する直線構造の数が1以下であるときの水平方向消失点情報の生成処理の流れを示すフローチャートである。
【図8】水平方向のライングループに属する直線構造に対して求められる水平方向のベースライン量を示す図である。
【図9A】垂直方向の消失点を推定するための前処理の流れを示すフローチャートである。
【図9B】垂直方向のライングループに属する直線構造の数が2よりも多いときの垂直方向消失点情報の生成処理の流れを示すフローチャートである。
【図9C】垂直方向のライングループに属する直線構造の数が2であるときの垂直方向消失点情報の生成処理の流れを示すフローチャートである。
【図9D】垂直方向のライングループに属する直線構造の数が1以下であるときの垂直方向消失点情報の生成処理の流れを示すフローチャートである。
【図10】垂直方向のライングループに属する直線構造に対して求められる垂直方向のベースライン量を示す図である。
【図11】図1に示すコーナー検出部によるコーナー検出結果の一例を示す図である。
【図12】図1に示す輪郭決定部により決定された輪郭四角形の一例を示す図である。
【図13】図1に示す輪郭決定部により決定された輪郭四角形を模式的に示す図である。
【図14】図1に示す輪郭決定部が領域成長方法による文書着目領域を検出する処理の流れを示すフローチャートである。
【図15】図1に示す画像サイズ決定部が文書面における文書領域の頂点座標を求める方法を説明する説明図である。
【発明を実施するための形態】
【0009】
本発明の実施形態は、カメラにより撮像された文書画像(撮像文書画像)における幾何学的歪み(遠近法による歪み)を補正する方法、システムおよび装置に関するものである。
【0010】
本発明の一態様によれば、水平方向消失点情報、垂直方向消失点情報およびコーナー検出結果から、撮像文書画像における文書の輪郭(境界)となる四角形(輪郭四角形)が特定される。次に、特定された輪郭四角形に対応する幾何学的補正の方法を決定するために、幾何学的補正の評価を示す複数の評価値を求める。撮像文書画像の幾何学的補正の方法は、検出された輪郭四角形に対応する補正方法(修正方法)、および、1以上の別の補正方法(修正方法)の中から選択される。
【0011】
本発明の別の一態様によれば、水平方向消失点情報は、水平方向のラインを用いて推定される。水平方向消失点情報は、水平方向の消失点または水平方向の消失点の方向である。
【0012】
また、本発明の別の一態様によれば、垂直方向消失点情報は、垂直方向のラインを用いて推定される。垂直方向消失点情報は、垂直方向の消失点または垂直方向の消失点の方向である。
【0013】
また、本発明の別の一態様によれば、コーナー検出は、注目する四角形領域の境界を特定するために使用される。
【0014】
また、本発明の別の一態様によれば、撮像文書画像に対する幾何学的補正のための補正方法(修正方法)の選択は、階層的(hierarchically)に実行される。
【0015】
本発明の前述および他の目的、特徴、効果は、図面とともに以下の説明を考慮することで容易に理解されるであろう。
【0016】
本発明の一実施形態は、図面を参照することによってより理解されるであろう。図面では、類似する部材には、類似する番号が付けられている。上述した図面は、詳細な説明の一部として特別に援用される。
【0017】
図面において図示され、説明されるように、本発明の実施形態は、異なる構成の幅広い変形例で変更または設定されてもよいことが十分に理解されるであろう。このように、本発明の方法およびシステムに係る実施形態の以下の詳細な説明は、本発明の目的を限定するものではなく、単に、本発明の好ましい一実施形態を代表するものにすぎない。
【0018】
本発明の実施形態の構成は、ハードウェアによって実現されてもよいし、コンピュータシステムをプログラムするために使用され、各種の命令が格納されたコンピュータ読取可能な記録媒体を含む、ファームウェアおよび/または非一時的なコンピュータプログラムの製品によって実現されてもよい。ここで述べる実施形態は単にこれらの形態の一例にすぎず、当業者であれば、本発明の目的の範囲内で、様々な形態の構成を導き出してもよい。
【0019】
図面に示すチャートやグラフは特定の実行順序を示すものであるが、これらの実行順序は、図面に示したものと異なっていてもよい。例えば、ブロックの実行順序は、図示された順序から相互に入れ替えてもよい。また、図において順に示された2つ以上のブロックを、同時に、または部分的に同時に実行してもよい。当業者によれば、コンピュータシステム、ハードウェア、および/またはファームウェアをプログラムするために使用される指令が格納されたコンピュータ読取可能な記録媒体を含む非一時的なコンピュータプログラム製品が、ここで述べた様々な論理的機能を実行するために当業者によって作り出すことができる。
【0020】
カメラ等の撮像手段により撮像された文書画像(撮像文書画像)が幾何学的歪みのない状態か否かの評価は、撮像手段の理想的ではない位置を補正するために必要とされる。カメラの光学を通して撮像画像面上に撮像対象物(文書)が遠近投影されるために生じる幾何学的歪みを最小限にするためには、カメラの撮像面は理想的には文書の面に平行であることが望ましい。カメラが文書に対して傾いていると、カメラから遠く離れた文書面中の文字は、カメラに近い文字と比べて小さくなる。文字の形状が不均一になると、OCR(Optical Character Recognition)アルゴリズムなどの文書処理アルゴリズムの精度を低下させることになる。また、人が読むときにも好ましくない。また、撮像文書画像全体の乱雑さにより、撮像文書画像の中から検知されたパターンに対してノイズや何らかの構造が付加されることとなり、これにより正確な状態評価が困難となる。さらに、撮像パラメータが既知ではないために、正確な状態評価を行うことも困難である。このように、撮像文書画像の状態評価を精度よく行う方法、システムおよび装置が望まれている。さらに、撮像文書画像における歪みを状態評価を用いて補正することが望まれている。理想的ではないカメラの位置によって生じる画像の歪みを補正する処理は、幾何学的補正(geometric rectification)という。
【0021】
本発明の実施形態は、カメラにより撮像された文書画像(撮像文書画像)における歪みを補正する方法、システムおよび装置を有する。
【0022】
図1は、本実施形態に係る画像処理装置の構成を示すブロック図である。図1に示されるように画像処理装置1は、撮像画像取得部11、エッジ検出部12、直線構造抽出部13、消失点情報推定部14、コーナー検出部15、輪郭決定部16、幾何学的補正評価部17、補正方法決定部18、画像サイズ決定部19、および、補正処理部20とを備えている。
【0023】
撮像画像取得部11は、カメラなどの撮像装置から、当該撮像装置により文書を撮像対象物として撮像された撮像文書画像のデータを取得するものである。
【0024】
ここで、撮像対象物となる文書とは、矩形の用紙に文字等が印刷された印刷物に限らず、標識、ホワイトボード、黒板、ポスター、投影されたスライド、あるいはその他の文書を表示する物なども含まれる。このような撮像対象物である文書は、矩形の面(文書面)に文字等が示されたものである。図2に示されるように、このような文書は、文書面の法線方向(正面)から見れば矩形であるが、文書面の法線に対して傾斜した方向から見ると歪んだ四角形となる。なお、図2の(a)は、正面からみたときの文書を示し、図2の(b)は、文書面の法線に対して傾斜した方向から撮像した撮像文書画像を示している。
【0025】
エッジ検出部12は、撮像画像取得部11により取得された撮像文書画像に対して、エッジ画素を検出する処理を行い、各画素がエッジであるか否かを示すエッジマスクを生成する。エッジマスクとは、例えばエッジ画素の画素値が「1」に設定され、非エッジ画素の画素値が「0」に設定された画像データである。
【0026】
直線構造抽出部13は、エッジ検出部12により生成されたエッジマスクを用いて、文書領域と背景領域との境界となる文書領域の輪郭、文書内部の各領域の輪郭、図式の枠(フレーム)、画像の枠(フレーム)、文字の直線部分、罫線などの直線構造を抽出する処理を行う。
【0027】
直線構造抽出部13は、例えばハフ変換をエッジマスクに適用することで直線構造を抽出する。ハフ変換は、線が途切れるなど不連続であっても、比較的安定して直線を検出できる方法である。
【0028】
なお、本実施形態では、直線構造抽出部13は、所定閾値以上の長さを有するとともに、ラインギャップの割合が所定閾値未満である(もしくは、ラインギャップの数が所定閾値未満である)直線構造のみを抽出する。ここで、ラインギャップとは、線が途切れるなど不連続な部分を意味する。
【0029】
また、直線構造抽出部13は、抽出した直線構造を、水平方向のライングループと、垂直方向のライングループとの何れかにグループ分けする。
【0030】
消失点情報推定部14は、撮像文書画像における消失点の位置(座標)または消失点の方向を推定するブロックである。ここで消失点とは、遠近法のために実際には平行線になっているものが撮像画像において平行ではないときに、その線が交わる点のことである。消失点情報推定部14は、直線構造抽出部13により抽出された水平方向のライングループに属する直線構造を基に、水平方向の消失点の位置、または、水平方向の消失点の方向を求める。同様に、消失点情報推定部14は、直線構造抽出部13により抽出された垂直方向のライングループに属する直線構造を基に、垂直方向の消失点の位置、または、垂直方向の消失点の方向を求める。消失点情報推定部14は、求めた消失点の位置または消失点の方向を示す消失点情報を生成する。
【0031】
コーナー検出部15は、撮像文書画像の中からコーナーを検出する。コーナーの検出方法としては様々な公知の方法を用いることができ、例えばShi−Tomasi法を用いればよい。
【0032】
輪郭決定部16は、撮像文書画像において、文書領域の輪郭となる四角形(輪郭四角形)を決定する。本実施形態では、輪郭決定部16は、コーナー検出部15による検出結果と消失点情報とに基づいて輪郭四角形を決定する。
【0033】
図2の(b)に示されるように、実際には矩形である文書の輪郭は、遠近法により撮像文書画像において歪んだ四角形になる場合がある。この場合、文書の輪郭となる四角形の上辺および下辺は水平方向の消失点に集まり、左辺および右辺は垂直方向の消失点に集まる。そのため、消失点情報が消失点の位置を示す場合、輪郭決定部16は、当該消失点の位置に集まるように、輪郭四角形の各辺を決定する。また、消失点情報が消失点の方向を示す場合、輪郭決定部16は、当該消失点の方向に平行になるように、輪郭四角形の各辺を決定する。
【0034】
また、コーナー検出部15により検出されるコーナーは、文書の中の文字領域で多くなる。そのため、輪郭決定部16は、コーナー検出部15により検出されたコーナーを囲むように輪郭四角形を決定する。
【0035】
また、輪郭決定部16は、領域成長方法に基づいて撮像文書画像における文書着目領域も検出する。
【0036】
幾何学的補正評価部17は、輪郭決定部16により決定された輪郭四角形、消失点情報で示される消失点の位置または方向に対する各種の評価値を算出する。本実施形態では、幾何学的補正評価部17は、文書面の法線ベクトルnや焦点距離f^などを算出する。さらに、幾何学的補正評価部17は、領域成長方法に基づいて検出された文書着目領域に対する各種の評価値も算出する。
【0037】
補正方法決定部18は、幾何学的補正評価部17により算出された評価値を基に、幾何学的補正の方法を決定する。具体的には、補正方法決定部18は、輪郭決定部16により決定された輪郭四角形と消失点情報推定部により生成された消失点情報とに基づいた補正方法、文書着目領域に基づいた補正方法などから一つの補正方法を選択する。
【0038】
画像サイズ決定部19は、文書面の法線ベクトルnや焦点距離f^などを基に、文書面のアスペクト比を推定し、幾何学的補正後の画像サイズを決定する。
【0039】
補正処理部20は、補正方法決定部18により決定された補正方法に従って、撮像文書画像に対して幾何学的補正を行う。
【0040】
本実施形態の画像処理装置1における処理例を図3を参照しながら説明する。図3は、画像処理装置1における画像補正処理100を示すフローチャートである。なお、図3に示す処理の順序に限定されるものではない。また、この方法やこの方法の変形例を実行する際、図3に示すいくつかの処理を結合して行ってもよい。
【0041】
まず、撮像画像取得部11は、撮像文書画像を取得する(102)。取得した撮像文書画像は複数の画素からなり、各画素は対応する値を有している。次に、取得した撮像文書画像を用いて、当該撮像文書画像における消失点が推定される(104)。
【0042】
消失点の推定処理104は、図4を参照することで理解されるであろう。図4は、消失点の推定処理の一例を示す図である。なお、図4に示す処理の順序に限定されるものではない。また、この方法やこの方法の変形例を実行する際、図4に示すいくつかの処理を結合して行ってもよい。
【0043】
エッジ検出部12は、例えばCannyエッジ検出法や、弱いコントラスト領域でも直線構造を検出できるような他のエッジ検出方法を用いて、取得した撮像文書画像のエッジ検出処理200を実行する。そして、エッジ検出部12は、画素毎にエッジ画素か否かを示す画像データであるエッジマスクを生成する。なお、エッジ検出部12は、勾配を基にエッジを検出する方法(例えば、Sobelエッジ検出方法、ラプラスエッジ検出方法、Scharrエッジ検出方法など)を用いて、取得した撮像文書画像のエッジ検出処理200を実行してもよい。
【0044】
エッジ検出部12によるエッジ検出結果から、直線構造抽出部13は、消失点を推定するために重要となる直線構造を抽出する(202)。直線構造は、例えば、文書の輪郭(文書と背景の境界)、文書内部の領域の輪郭、図式の枠(フレーム)、画像の枠(フレーム)、文字の直線部分、段落間に引く線、罫線などから抽出される。本実施形態では、直線構造抽出部13は、エッジ検出部12により生成されたエッジマスクに、ライン連結処理(line linking)を有するハフ変換を適用することで、直線構造を抽出する。ここでは、直線構造抽出部13は、確率的ハフ変換により、断片化された線セグメント(ラインセグメント)を検出する。そして、直線構造抽出部13は、断片化された線セグメント(ラインセグメント)同士が所定閾値未満の距離だけ離れている場合、当該線セグメント同士を連結して直線構造を特定する。このとき、直線構造抽出部13は、所定閾値より短い長さの線セグメントを連結対象から外してもよい。
【0045】
次に、本実施形態では、直線構造抽出部13は、各直線構造に対して、ラインギャップの合計長さ(「length of line gaps」)とライン長さ(「length of line」)との比率である占有率Lfragmentationを以下の式に従って算出する。ここで、ラインギャップは、直線構造における線セグメント間の連結部分(線が途切れるなど不連続な部分)である。
【0046】
【数1】

【0047】
そして、直線構造抽出部13は、以下の条件を満たす直線構造のみを出力対象として受け入れ、以下の条件を満たさない直線構造を出力対象から除外する。すなわち、占有率Lfragmentationが所定の占有閾値Tfragmentationに対する基準を満たし、ライン長さLlengthが所定のライン閾値Tlengthに対する基準を満たす場合、例えば、以下の数式を満たす場合である。
fragmentation<Tfragmentation かつ Llength≧Tlength
ここで、閾値の具体的な数値としては、例えば、Tfragmentation=0.3、Llength=25である。
【0048】
もしくは、直線構造におけるラインギャップの数であるギャップ数Lnumgapsを求め、当該ギャップ数Lnumgapsが所定のギャップカウント閾値Tnumgapsに対する所定の基準、例えば
numgaps>Tnumgaps
を満たす場合に、直線構造を出力対象から除外してもよい。ギャップカウント閾値Tnumgapsは例えば3である。
【0049】
また、直線構造抽出部13は、各直線構造に対して線分の断片度(line fragmentation)を算出してもよい。そして、断片度が大きい直線構造は、消失点を推定するときの信頼性が低いものとして出力対象から除外される。例えば、断片度は、距離変換をエッジマスクに適用することにより算出される。距離変換されたエッジマスクの画素値は、距離基準に従った、最近接エッジ画素との距離を示す値である。検出された直線構造における断片度は、距離変換されたエッジマスクにおいて当該直線構造を構成する画素の画素値の合計値である。断片度は、線分が断片化された直線構造の方が、切れ目なしに連続している直線構造よりも大きくなる。
【0050】
図5は、撮像文書画像から出力対象となる直線構造が抽出される様子を示す図である。図5の(a)は撮像文書画像の一例を示している。図5の(b)は、エッジ検出部12が(a)の撮像文書画像に対してエッジ検出を行うことで生成されたエッジマスクを示している。図5の(c)は、(b)のエッジマスクから直線構造抽出部13により抽出された直線構造のうち、Llength≧Tlength を満たす直線構造を示している。図5の(d)は、(c)の直線構造のうち、Lfragmentation<Tfragmentation を満たし、出力対象として抽出された直線構造を示している。
【0051】
次に、直線構造抽出部13は、出力対象として抽出した直線構造のグループ分けを行う(204)。ここでは、水平方向のライングループである水平方向ラインセットと、垂直方向のライングループである垂直方向のラインセットとにグループ分けされる。水平方向のライングループは、水平方向の消失点が存在する場合、当該消失点に集まる直線構造の全てを含む。垂直方向のライングループは、垂直方向の消失点が存在する場合、当該消失点に集まる直線構造の全てを含む。
【0052】
水平方向のライングループLは、出力対象として抽出された直線構造Lsigのうち、以下の式を満たす全ての直線構造Lからなるセットである。
【0053】
【数2】

【0054】
垂直方向のライングループLは、出力対象として抽出された直線構造Lsigのうち、以下の式を満たす全ての直線構造Lからなるセットである。
【0055】
【数3】

【0056】
図6は、図5の(d)に示される直線構造を水平方向のライングループLと垂直方向のライングループLとにグループ分けされたときを示す図である。
【0057】
消失点情報推定部14は、ライングループLおよびLを用いて、水平方向消失点情報を推定し(206)、垂直方向消失点情報を推定する(208)。水平方向消失点情報は、水平方向の消失点の位置または水平方向の消失点の方向を示し、垂直方向消失点情報は、垂直方向の消失点の位置または垂直方向の消失点の方向を示す。文書面の法線方向に対して傾斜した状態で撮像された撮像文書画像では、遠近法による投影により、実際には平行な直線が消失点を集まることとなる。光学的歪みや直線構造抽出部13における直線構造の抽出精度のため、平行な直線は、常に単一の点に集まるわけではなく、場合によっては異なる状態になるときがある。なお、本実施形態では、水平方向の消失点の位置または水平方向の消失点の方向が最初に推定され、それから垂直方向の消失点の位置または垂直方向の消失点の方向が推定される。
【0058】
水平方向のライングループに対する消失点の推定は、図7A〜図7Dを参照することにより理解されるであろう。図7A〜図7Dは、水平方向のライングループを用いた水平方向の消失点の推定方法の一例を示す図である。なお、図7A〜図7Dに示す処理の順序に限定されるものではない。また、この方法やこの方法の変形例を実行する際、図7A〜図7Dに示すいくつかの処理を結合して行ってもよい。
【0059】
水平方向のライングループLに属する各直線構造について、消失点情報推定部14は、陰関数表示の係数 ax+by+c=0 を求める(300)。次に、水平方向のライングループLに対して、消失点情報推定部14は、水平方向のベースライン量baselineを求める(302)。水平方向のライングループLに対する水平方向のベースライン量baselineは、以下の式に従って決定される。
【0060】
【数4】

【0061】
上記の式において、di,jは、水平方向のライングループLの第1ラインLと撮像文書画像の中央を通る垂直方向のラインVとの交点と、水平方向のライングループLの第2ラインLと撮像文書画像の中央を通る垂直方向のラインVとの交点との距離を示している。
【0062】
図8は、図6の水平方向のライングループLに対して求められた水平方向のベースライン量baselineの一例を示す図である。
【0063】
消失点情報推定部14は、水平方向のライングループLに属する直線構造の数が2より多いか確認する(304)。水平方向のライングループLに2より多い直線構造が存在する場合(306)、消失点情報推定部14は、係数行列Lを生成する(308)。係数行列Lは、N個のベクトルL=[a](i=1,2,・・・、N) を連結させることにより生成される。ここで、Nは、水平方向のライングループLに属する直線構造の数であり、a,b,cは、水平方向のライングループLのi番目の直線構造の陰関数形式の係数を示す。次に、消失点情報推定部14は、係数行列Lに対して特異値分解(SVD:singular value decomposition)を行う(310)。対応する固有ベクトルおよび固有値のセット{{v,λ},{v,λ},{v,λ}} (λ>λ>λ)が、特異値分解により得られる。そして、消失点情報推定部14は、最大の固有値λに対する最小の固有値λの割合である固有値割合(eigen-ratio)Λを以下の式
Λ=λ/λ
に従って算出する(312)。
【0064】
固有値割合Λは、水平方向のライングループに属する直線構造における単一の消失点への集合度を評価している。大きな固有値割合Λを有する水平方向のライングループは、2つの直線構造の交点がはっきりと変化するグループに対応している。一方、小さい固有値割合Λを有する水平方向のライングループは、直線構造がほぼ同じ点で交わるようなグループに対応している。
【0065】
消失点情報推定部14は、水平方向のライングループに対するベースライン量と水平方向のベースライン閾値THbaselineとを比較するとともに、固有値割合と水平方向に対する所定の固有値割合閾値THeigenratioと比較する(図7Bの314)。水平方向のベースライン量が大きく(広く)、かつ、固有値割合で示される単一点への集中度が高いことを示す条件が満たされた場合(316)、消失点情報推定部14は、最小の固有値に対応する固有ベクトルを用いて水平方向の消失点の位置(座標)を求める(318)。本実施形態では、水平方向のベースライン量が大きく、かつ、固有値割合で示される単一点への集中度が高いことを示す条件は、
(baseline>THbaseline)&(Λ<THeigenratio
で示される。ここで、「&」は、論理演算子「AND」を意味する。各閾値は、例えば、THbaseline=imgH/2
Heigenratio=0.0005
である。なお、imgHは、水平方向の画像寸法を示している。
【0066】
水平方向のベースライン量が大きく、かつ、固有値割合で示される単一点への集中度が高いことを示す条件が満たされた場合(316)、消失点情報推定部14は、水平方向の消失点の位置を以下の式に従って算出する(318)。
【0067】
【数5】

【0068】
ここで、ν(1)、ν(2)、ν(3)は、それぞれ、
固有ベクトルv=[ν(1) ν(2) ν(3)]
の第1要素、第2要素、第3要素である。消失点情報推定部14は、算出した水平方向の消失点の位置を示す水平方向消失点情報を生成し、出力する(320)。
【0069】
水平方向のベースライン量が大きく、かつ、固有値割合で示される単一点への集中度が高いことを示す条件が満たされない場合(322)、消失点情報推定部14は、水平方向のライングループLに属する直線構造の法線の平均を求める(324)。N個の法線の平均は、以下の式に従って決定される。
【0070】
【数6】

【0071】
そして、消失点情報推定部14は、法線の平均に垂直な方向を水平方向の消失点の方向として決定する(326)。消失点情報推定部14は、決定した水平方向の消失点の方向を示す水平方向消失点情報を生成し、出力する(328)。
【0072】
水平方向のライングループLに2より多い直線構造が存在しない場合(330)、消失点情報推定部14は、水平方向のライングループに属する直線構造がちょうど2つ存在するか否か確認する(332)。水平方向のライングループに属する直線構造がちょうど2つ存在する場合(334)、消失点情報推定部14は、水平方向のライングループに対するベースライン量と水平方向のベースライン閾値THbaselineとを比較するとともに、2つの直線構造がどの程度平行であるかを示す平行度と平行度閾値THparallelとを比較する(図7Cの336)。水平方向のベースライン量が小さい(狭い)、または、2つの直線構造がほぼ平行であることを示す条件を満たす場合(344)、消失点情報推定部14は、水平方向のライングループに属する2つの直線構造の平均に垂直な方向を、水平方向の消失点の方向として決定する(346)。本実施形態では、2つの直線構造がどの程度平行であるかを示す平行度は、これら直線構造の法線間の角度を決定することにより求められる。本実施形態では、水平方向のベースライン量が小さい(狭い)、または、2つの直線構造がほぼ平行であることを示す条件は、
(baseline<THbaseline)|(angle<THparallel
で示される。ここで、「|」は、論理演算子の「OR」を意味している。また、angleは、2つの直線構造の法線間の角度である。各閾値は、例えば、
Hbaseline=imgH/2
Hparallel=1°
である。ここで、imgHは、水平方向の画像寸法である。そして、消失点情報推定部14は、決定した水平方向の消失点の方向を示す水平方向消失点情報を生成し、出力する(348)。
【0073】
水平方向のベースライン量が大きく、かつ、2つの直線構造がほぼ平行ではない場合(338)、消失点情報推定部14は、水平方向のライングループに属する2つの直線構造の交点を水平方向の消失点として決定する(340)。そして、消失点情報推定部14は、決定した水平方向の消失点の位置を示す水平方向消失点情報を生成し、出力する(342)。
【0074】
水平方向のライングループに属する直線構造が2つ存在しない場合(図7Aの350)、消失点情報推定部14は、水平方向のライングループに属する直線構造の数がちょうど1つであるか確認する(図7Dの352)。水平方向のライングループにちょうど1つの直線構造が存在する場合(354)、消失点情報推定部14は、その直線構造の法線に垂直な方向を水平方向の消失点の方向として決定し(356)、決定した水平方向の消失点の方向を示す水平方向消失点情報を出力する(358)。水平方向のライングループにちょうど1つの直線構造が存在しない場合(360)、消失点情報推定部14は、水平方向の消失点の方向として、基本的な水平方向を水平方向の消失点の方向として決定し、決定した水平方向の消失点の方向を示す水平方向消失点情報を出力する(362)。
【0075】
垂直方向のライングループに対する消失点の推定は、図9A〜図9Dを参照することにより理解されるであろう。図9A〜図9Dは、垂直方向のライングループを用いた垂直方向の消失点の推定方法の一例を示す図である。なお、図9A〜図9Dに示す処理の順序に限定されるものではない。また、この方法やこの方法の変形例を実行する際、図9A〜図9Dに示すいくつかの処理を結合して行ってもよい。
【0076】
垂直方向のライングループLに属する各直線構造について、消失点情報推定部14は、陰関数表示の係数 ax+by+c=0 を求める(400)。次に、垂直方向のライングループLに対して、消失点情報推定部14は、垂直方向のベースライン量baselineを求める(402)。垂直方向のライングループLに対する垂直方向のベースライン量baselineは、以下の式に従って決定される。
【0077】
【数7】

【0078】
上記の式において、di,jは、垂直方向のライングループLの第1ラインLと撮像文書画像の中央を通る水平方向のラインHとの交点と、垂直方向のライングループLの第2ラインLと撮像文書画像の中央を通る水平方向のラインHとの交点との距離を示している。
【0079】
図10は、図6の垂直方向のライングループLに対して求められた垂直方向のベースライン量baselineの一例を示す図である。
【0080】
消失点情報推定部14は、垂直方向のライングループLに属する直線構造の数が2より多いか確認する(404)。垂直方向のライングループLに2より多い直線構造が存在する場合(406)、消失点情報推定部14は、係数行列Lを生成する(408)。係数行列Lは、N個のベクトルL=[a](i=1,2,・・・、N) を連結させることにより生成される。ここで、Nは、垂直方向のライングループLに属する直線構造の数であり、a,b,cは、垂直方向のライングループLのi番目の直線構造の陰関数形式の係数を示す。次に、消失点情報推定部14は、係数行列Lに対して特異値分解(SVD:singular value decomposition)を行う(410)。対応する固有ベクトルおよび固有値のセット{{v,λ},{v,λ},{v,λ}} (λ>λ>λ)が、特異値分解により得られる。そして、消失点情報推定部14は、最大の固有値λに対する最小の固有値λの割合である固有値割合(eigen-ratio)Λを以下の式
Λ=λ/λ
に従って算出する(412)。
【0081】
固有値割合Λは、垂直方向のライングループに属する直線構造における単一の消失点への集合度を評価している。大きな固有値割合Λを有する垂直方向のライングループは、2つの直線構造の交点がはっきりと変化するグループに対応している。一方、小さい固有値割合Λを有する垂直方向のライングループは、直線構造がほぼ同じ点で交わるようなグループに対応している。
【0082】
消失点情報推定部14は、垂直方向のライングループに対するベースライン量と垂直方向のベースライン閾値TVbaselineとを比較するとともに、固有値割合と垂直方向に対する所定の固有値割合閾値TVeigenratioと比較する(図9Bの414)。垂直方向のベースライン量が大きく(広く)、かつ、固有値割合で示される単一点への集中度が高いことを示す条件が満たされた場合(416)、消失点情報推定部14は、最小の固有値に対応する固有ベクトルを用いて垂直方向の消失点の位置(座標)を求める(418)。本実施形態では、垂直方向のベースライン量が大きく、かつ、固有値割合で示される単一点への集中度が高いことを示す条件は、
(baseline>TVbaseline)&(Λ<TVeigenratio
で示される。ここで、「&」は、論理演算子「AND」を意味する。各閾値は、例えば、TVbaseline=imgV/2
Veigenratio=0.0005
である。なお、imgVは、垂直方向の画像寸法を示している。
【0083】
垂直方向のベースライン量が大きく、かつ、固有値割合で示される単一点への集中度が高いことを示す条件が満たされた場合(416)、消失点情報推定部14は、垂直方向の消失点の位置を以下の式に従って算出する(418)。
【0084】
【数8】

【0085】
ここで、ν(1)、ν(2)、ν(3)は、それぞれ、
固有ベクトルv=[ν(1) ν(2) ν(3)]
の第1要素、第2要素、第3要素である。消失点情報推定部14は、算出した垂直方向の消失点の位置を示す垂直方向消失点情報を生成し、出力する(420)。
【0086】
垂直方向のベースライン量が大きく、かつ、固有値割合で示される単一点への集中度が高いことを示す条件が満たされない場合(422)、消失点情報推定部14は、垂直方向のライングループLに属する直線構造の法線の平均を求める(424)。N個の法線の平均は、以下の式に従って決定される。
【0087】
【数9】

【0088】
そして、消失点情報推定部14は、法線の平均に垂直な方向を垂直方向の消失点の方向として決定する(426)。消失点情報推定部14は、決定した垂直方向の消失点の方向を示す垂直方向消失点情報を生成し、出力する(428)。
【0089】
垂直方向のライングループLに2より多い直線構造が存在しない場合(430)、消失点情報推定部14は、垂直方向のライングループに属する直線構造がちょうど2つ存在するか否か確認する(432)。垂直方向のライングループに属する直線構造がちょうど2つ存在する場合(434)、消失点情報推定部14は、垂直方向のライングループに対するベースライン量と垂直方向のベースライン閾値TVbaselineとを比較するとともに、2つの直線構造がどの程度平行であるかを示す平行度と平行度閾値TVparallelとを比較する(図9Cの436)。垂直方向のベースライン量が小さい(狭い)、または、2つの直線構造がほぼ平行であることを示す条件を満たす場合(444)、消失点情報推定部14は、垂直方向のライングループに属する2つの直線構造の平均に垂直な方向を、垂直方向の消失点の方向として決定する(446)。本実施形態では、2つの直線構造がどの程度平行であるかを示す平行度は、これら直線構造の法線間の角度を決定することにより求められる。本実施形態では、垂直方向のベースライン量が小さい(狭い)、または、2つの直線構造がほぼ平行であることを示す条件は、
(baseline<TVbaseline)|(angle<TVparallel
で示される。ここで、「|」は、論理演算子の「OR」を意味している。また、angleは、2つの直線構造の法線間の角度である。各閾値は、例えば、
Vbaseline=imgV/2
Vparallel=1°
である。ここで、imgVは、垂直方向の画像寸法である。そして、消失点情報推定部14は、決定した垂直方向の消失点の方向を示す垂直方向消失点情報を生成し、出力する(448)。
【0090】
垂直方向のベースライン量が大きく、かつ、2つの直線構造がほぼ平行ではない場合(438)、消失点情報推定部14は、垂直方向のライングループに属する2つの直線構造の交点を垂直方向の消失点として決定する(440)。そして、消失点情報推定部14は、決定した垂直方向の消失点の位置を示す垂直方向消失点情報を生成し、出力する(442)。
【0091】
垂直方向のライングループに属する直線構造が2つ存在しない場合(図9Aの450)、消失点情報推定部14は、垂直方向のライングループに属する直線構造の数がちょうど1つであるか確認する(図9Dの452)。垂直方向のライングループにちょうど1つの直線構造が存在する場合(454)、消失点情報推定部14は、その直線構造の法線に垂直な方向を垂直方向の消失点の方向として決定し(456)、決定した垂直方向の消失点の方向を示す垂直方向消失点情報を出力する(458)。垂直方向のライングループにちょうど1つの直線構造が存在しない場合(460)、消失点情報推定部14は、水平方向の消失点の方向に直交する方向を垂直方向の消失点の方向として決定し、垂直方向消失点情報を出力する(462)。
【0092】
図1に戻って、次に、コーナー検出部15がコーナー検出処理を行う(106)。コーナー検出処理は、文書領域の範囲を決定し、背景のノイズから文書領域を分離するために行われる。コーナー検出部15は、線の交点に対して検出反応がよく、線の交点をコーナーとして検出しやすい。そのため、テキスト領域内では検出されるコーナーが高密度であり、非テキスト領域では検出密度が低い。検出されたコーナーの密度が高い領域は、文書としてよりよい候補領域となる。本実施形態では、コーナー検出部15は、Shi−Tomasi法を用いてコーナー検出処理を実行する。Shi−Tomasi法については、「Jianbo Shi and Carlo Tomasi, “Good Features to Track”, the 9th IEEE Conference on Computer Vision and Pattern Recognition, June 1994」に記載されている。この文献は、本願において完全に参照により引用される。なお、コーナー検出の方法としては、他の公知の方法を用いてもよい。本実施形態では、コーナー検出部15は、コーナー点のリストと、コーナーマスクCとを生成する。コーナーマスクCにおける画素値は、入力画像における対応する画素がコーナー画素として検出されたか否かを示す。例えば、コーナーマスクCにおいて、画素値「1」はコーナーとして検出された画素であることを示し、画素値「0」はコーナーとして検出されなかった画素であることを示す。
【0093】
図11は、図5の(a)に示される撮像文書画像に対するコーナー検出結果を示す図である。図11において、白点部分が検出されたコーナーを示す。図示されるように、テキスト部分でコーナーがよく検出される。
【0094】
輪郭決定部16は、消失点情報とコーナー検出結果とを用いて、撮像文書画像における文書領域の輪郭となる四角形(輪郭四角形)を決定する(108)。すなわち、輪郭決定部16は、遠近法による歪みを有する文書の矩形とみなされる四角形を輪郭四角形として検出する。本実施形態では、輪郭決定部16は、消失点の位置を示す消失点情報が出力された場合、推定された消失点の位置に集まる辺を有する四角形を輪郭四角形として決定し、消失点の方向を示す消失点情報が出力された場合、推定された消失点の方向に平行な辺を有する四角形を輪郭四角形として決定する。また、輪郭決定部16は、コーナー検出部15により検知されたコーナーを包含するような四角形を輪郭四角形として決定する。本実施形態では、全ての検出されたコーナーが包含されるように、輪郭四角形を決定する。しかしながら、別の実施形態では、検知されたコーナーの全てではなく一部が輪郭四角形により包含されるように、輪郭四角形を決定してもよい。
【0095】
例えば、輪郭決定部16は、コーナー検出部15により検知されたコーナーを全て包含し、消失点から求めた4辺を有する四角形のうち、最小面積の四角形を輪郭四角形として決定する。また、上記の占有率に着目し、水平・垂直グループそれぞれで、全ての検出されたコーナーが包含されるような候補のうち、最も占有率の高い四角形を輪郭四角形として決定してもよい。
【0096】
図12は、図5の(a)に示される撮像文書画像に対して決定された輪郭四角形の一例を示す図である。
【0097】
次に、幾何学的補正評価部17は、決定された輪郭四角形と消失点または消失点の方向とに対する、幾何学的補正のための評価を行う(110)。幾何学的補正評価部17は、幾何学的補正の強度、状態推定およびカメラパラメータ推定の信頼性を示す値を幾何学的補正のための評価値として求める。幾何学的補正の評価値は、複数の幾何学的補正の方法を比較するために使用される。
【0098】
文書を撮像したカメラが未知の有効焦点距離(画素数で示される)を有する場合、2つの消失点が検出されたときに精度の高い幾何学的補正を実行することができる。本実施形態では、輪郭四角形と対応する消失点が信頼性のある焦点評価を有しているとみなしてよいか否かを決定するために、幾何学的補正評価部17は、複数の焦点距離評価値を算出する。
【0099】
幾何学的補正評価部17は、推定される焦点距離の信頼性を示す第1の焦点距離評価値#VPを求める。幾何学的補正評価部17は、輪郭線がほとんど平行である場合を除いて、消失点の数をカウントすることにより第1の焦点距離評価値#VPを求める。これらの実施形態は、図13を参照することにより理解されるであろう。図13は、4つの頂点q1,q2,q3,q4により決定される輪郭四角形500の一例を示す。水平方向の一対の輪郭線は、輪郭四角形の水平方向の2つの辺510,512であり、垂直方向の一対の輪郭線は、輪郭四角形の垂直方向の2つの辺514,516である。なお、符号526は基本となる水平方向を示し、符号528は基本となる垂直方向を示している。の水平方向の一対の輪郭線のなす角度は、以下の式に従って算出される。
【0100】
【数10】

【0101】
ここで、nh1とnh2は、それぞれ水平方向の辺510と辺512に対する単位法線ベクトルである。また、「・」はベクトルの内積(ドット積)を示している。垂直方向の一対の輪郭線のなす角度は、以下の式に従って算出される。
【0102】
【数11】

【0103】
ここで、nv1とnv2は、それぞれ垂直方向の辺514と辺516に対する単位法線ベクトルである。また、「・」はベクトルの内積(ドット積)を示している。
【0104】
そして、幾何学的補正評価部17は、以下の式に従って第1の焦点距離評価値#VPを求める。
【0105】
【数12】

【0106】
ここで、thは、平行であるか否かを判断するための閾値であり、例えば、th=1°である。
【0107】
また、幾何学的補正評価部17は、第2の焦点距離評価値farVPDistを算出してもよい。第2の焦点距離評価値farVPDistは、画像の光学中心Oから存在する消失点までの最大長である。本実施形態では、画像の光学中心Oから水平方向の消失点へのベクトルvpCは、 vpC=vp−O で示される。ここで、vpは水平方向の消失点における画像座標を示し、Oは画像中心における画像座標を示している。また、画像の光学中心Oから垂直方向の消失点へのベクトルvpCは、 vpC=vp−O で示される。ここで、vpは垂直方向の消失点における画像座標を示している。
【0108】
そして、幾何学的補正評価部17は、
farVPDist=max(‖vpC‖,‖vpC‖)
に従って、第2の焦点距離評価値farVPDistを求める。
ここで、‖ ‖はノルム演算子を示しており、例えばL2ノルムが用いられる。
【0109】
また、幾何学的補正評価部17は、第3の焦点距離評価値vptestを算出してもよい。第3の焦点距離評価値vptestは、
vptest=vpC・vpC
で示される。「・」はベクトルの内積を示しており、vpCは、画像の光学中心から水平方向の消失点へのベクトル、vpCは、画像の光学中心から垂直方向の消失点へのベクトルを示している。
【0110】
ここで、焦点距離f^は、以下のように定義される。
【0111】
【数13】

【0112】
上記の焦点距離f^が決定されると、幾何学的補正評価部17は、第4の焦点距離評価値FOVを算出する。第4の焦点距離評価値FOVは、最大の画像寸法に対する視野角度を評価する値であり、以下の式に従って算出される。
【0113】
【数14】

【0114】
ここで、imgWおよびimgHは、それぞれ画像の幅および高さを示している。
【0115】
本発明の一実施形態において、輪郭四角形と対応する消失点について求められた焦点距離f^は、焦点評価の信頼性に関する所定条件を満たすときに、信頼性が高いものとみなされる。具体的には、幾何学的補正評価部17は、以下の条件を全て満たすときに、焦点距離f^の信頼性が高いものと判断する。
estF=(#vp=2)and(vptest<0)and(FOV>thFOV)and(farVPDist<thVPDist
ここで、thFOVは、視野に関する閾値(視野閾値)であり、thVPDistは最大距離閾値であり、estFは焦点距離の信頼性を示すブーリアン(Boolean)型の値である。閾値は、例えば、thFOV=20°であり、thVPDist=5×10 である。
【0116】
次に、図5に示されるように、幾何学的補正評価部17は、消失点間の角度vpAngleを以下の式に従って算出する。
【0117】
【数15】

【0118】
ここで、Vは、画像中心Oから垂直方向の消失点の方向への単位ベクトルであり、Vは、画像中心Oから水平方向の消失点の方向への単位ベクトルである。
【0119】
垂直方向の消失点が存在しない場合、垂直方向の消失点の方向を示すVは、以下の式に従って求められる。
【0120】
【数16】

【0121】
同様に、水平方向の消失点が存在しない場合、水平方向の消失点の方向を示すVは、以下の式に従って求められる。
【0122】
【数17】

【0123】
さらに、幾何学的補正評価部17は、補正強度の評価値を決定してもよい。補正強度の評価値は、例えば、光軸と輪郭四角形から推定される文書面の法線方向とのなす角度である。焦点距離が既知であるカメラの場合(焦点距離f^が上記数13により決定された場合)、幾何学的補正評価部17は、文書面の法線ベクトルnを以下のようにして推定する。
【0124】
【数18】

【0125】
ここで、VCは、消失点が存在する場合、推定された消失点vpCと焦点距離f^から生成され、消失点が存在しない場合、消失点の方向Vから生成される3要素のベクトルである。また、VCは、消失点が存在する場合、推定された消失点vpCと焦点距離f^から生成され、消失点が存在しない場合、消失点の方向Vから生成される3要素のベクトルである。
【0126】
本実施形態によれば、幾何学的補正評価部17は、estFが「false」である場合、デフォルトの焦点距離f_defaultが以下の式に従って決定される。ここでは、デフォルトの視野角を50°としている。
【0127】
【数19】

【0128】
さらに、幾何学的補正評価部17は、補正角度correctionAngleを以下の式に従って算出する。ここで、z=[0,0,1]である。
【0129】
【数20】

【0130】
次に、図1に示されるように、輪郭決定部16は、消失点情報とコーナー検出結果とを用いた上記の方法とは異なる方法により特定された、撮像文書画像における文書領域の候補である文書着目領域を取得する(112)。そして、幾何学的補正評価部17は、文書着目領域に対して、幾何学的補正の評価値を決定する(114)。次に、補正方法決定部18は、幾何学的補正評価部17により算出された評価値を比較し、幾何学的補正で用いる補正方法を選択する(フィルタリングする)(116)。
【0131】
ここで、文書面の法線に対して傾いていない角度から撮像したときを標準状態とし、当該標準状態に基づく補正方法も取り得る一つの補正方法のリストに含まれている。標準状態は、幾何学的補正が必要ではなく、文書平面の法線が光軸に近い状態を意味している。なお、標準状態に対する補正方法をH’とする。
【0132】
本実施形態では、文書着目領域を取得する処理112および文書着目領域に対して幾何学的補正の評価値を決定する処理114を行うものとしたが、当該処理112,114は行わなくてもよい。この場合、標準状態に対応する補正方法と、上述したライングループの方法に従って決定された輪郭四角形および対応する消失点(または消失点の方向)に対応する補正方法との2つから補正方法が選択される。
【0133】
本実施形態によれば、標準状態に対応する補正方法H’に加えて、2つの補正方法が選択対象となる。第1の補正方法Hは、輪郭四角形および対応する消失点(または消失点の方向)に対応しており、上述したライングループの方法に従って決定される補正方法である。
【0134】
第2の補正方法Hは、112で取得された文書着目領域に基づく補正方法である。本実施形態によれば、第2の補正方法Hの基となる文書着目領域は、例えば、2011年2月24日に出願された米国特許出願番号13/034,594(発明の名称「画像における文書着目領域を決定する方法およびシステム」に記載されている領域成長技術を用いて生成される。米国特許出願番号13/034,594は、本願において完全に参照により引用される。具体的に説明すれば以下のとおりである。
【0135】
図14は、輪郭決定部16による文書着目領域の取得方法を示す説明図である。輪郭決定部16は、撮像文書画像における輝度成分を示す入力輝度画像データを生成する。
【0136】
輪郭決定部16は、入力輝度画像データに対して、前景除去処理1104、エッジ検出処理1106、およびテキスト(文字)の特徴点を算出するテキスト特徴算出処理1108を行う。
【0137】
輪郭決定部16は、前景除去処理1104において、撮像文書画像に対応する入力輝度画像データから前景成分を除去し、エッジデータをほとんど含まない均一に近い背景領域を得る。
【0138】
輪郭決定部16は、入力輝度画像データをダウンサンプリングして、低解像画像データにダウンサンプリングする。そして、低解像画像データに対して流し込み法(flood-filling operation)を適用することにより、前景除去画像データ1110(画像データISF)を生成する。流し込み法では、テキスト画素の低グレースケールレベルの値を周囲の明るい色の背景画素のグレースケールレベルに置換する(テキスト画素を周囲の明るい色の背景画素のグレースケールレベルで塗り潰す)。これにより、不要成分(高周波成分)を除去した略均一なグレースケールレベルを有する文書領域が生成される。なお、前景除去処理の方法はこれに限るものではなく、例えば、輪郭決定部16は、拡大、中央値フィルタ処理、あるいはその他の画像処理技術を用いて前景除去処理を行うようにしてもよい。
【0139】
図11に示したように、輪郭決定部16は、前景除去処理1104の結果である出力画像データISF(前景除去画像データ1110)に対して、不均一性低減処理1112を行う。
【0140】
輪郭決定部16は、不均一性低減処理1112において、前景除去画像データ1110における不均一性(輝度ムラ)を低減し、前景除去画像データ1110におけるグレア効果を除去する。例えば、輪郭決定部16は、前景除去画像データ1110の中央領域(前景除去画像の中心を含む領域)におけるピークを拡大あるいは伸長するために、前景除去画像データ1110に対してモフォロジー処理(拡大縮小処理)による再構成処理を行う。典型的な実施例では、前景除去画像データ1110(画像データISF)からマーカー画像(種画像)Iを抽出し、抽出したマーカー画像Iを用いてモフォロジー処理による再構成処理を行う。モフォロジー処理による再構成処理において、マーカー画像Iをマスク画像の特性に基づいて処理するようにしてもよい。上記マスク画像として、例えば、上記の前景除去画像データ1110(画像データISF)を用いてもよい。上記マーカー画像の選択方法は特に限定されるものではなく、例えば、マーカー画像Iの中心付近における所定サイズの領域である第1領域に属する各画素の画素値を当該画素に対応する前景除去画像データ1110(画像データISF)の画素の画素値に応じた値に設定し、マーカー画像Iにおける第1領域を除く領域である第2領域に属する各画素の画素値をゼロに設定してもよい。これにより、マーカー画像Iにおける全画素の画素値は、マスク画像における対応する画素の画素値以下になる。モフォロジー処理による再構成処理は、概念的には、マーカー画像におけるマスク画像にマスクされる位置を連続的に拡大する処理として理解できる。この拡大処理は、前回の拡大によって再構成された画像と今回の拡大によって再構成された画像との間に変化が生じなかった場合に終了する。モフォロジー処理による再構成処理を実行する方法として多様な方法を採用可能であることは当業者にとって自明であろう。輪郭決定部16は、モフォロジー処理による再構成処理が施された最終的な再構成画像データ1114(画像データI)に対して、2値化処理1116を行う。
【0141】
なお、輪郭決定部16が、背景色と文字色および前景色との関係を検出するようにしてもよい。この場合、マーカー画像におけるゼロ以外の画素値を有する画素の平均グレー値μIMを算出し、前景除去画像データ1110(画像データISF)における残りの画素の平均グレー値μICMと比較する。そして、μIM>μICM、かつμIM>TBGであれば、上記画像における文書部分は前景画像に暗い色のテキストを含む明るい色の背景になり、処理が継続される。なお、上記TBGは、背景の輝度値と白に対応する輝度値との差に応じた閾値である。μIM>μICM、かつμIM>TBGでなければ、文書着目領域の決定処理を終了するようにしてもよい。あるいは、μIM>μICM、かつμIM>TBGでなければ、輪郭決定部16は、2値化処理1116によって決定される第1文書着目領域候補マスクを反転させて文書着目領域の決定処理を継続するようにしてもよい。上記TBGの典型的な値は100である。
【0142】
輪郭決定部16は、再構成画像データ1114に対して、第1文書着目領域候補マスク(第1文書ROI候補マスク)1118を生成する2値化処理1116を行う。輪郭決定部16は、文書着目領域と非文書着目領域とを分離するための閾値を選択して2値化処理(閾値処理)を行う。閾値の選択方法は特に限定されず、多様な方法を用いることができる。例えば、「Nobuyuki Otsu著、“A threshold selection method from gray-level histograms”、IEEE Transactions on Systems、Man and Cybernetics、volume 9、62-66頁、1979年」に開示されている方法を用いてもよい。
【0143】
図11に示したように、輪郭決定部16は、エッジ検出処理1106において、上記の輝度のみからなる入力輝度画像データからエッジマスク1122を抽出し、第1文書着目領域候補マスク1118から不要成分を除去するために用いる。輪郭決定部16は、低解像画像データLに基づいてエッジマスク1122を抽出するようにしてもよく、フル解像度の画像データに基づいてエッジマスク1122を抽出するようにしてもよい。輪郭決定部16は、におけるエッジ検出方法は特に限定されるものではなく、従来からの公知の種々の方法を用いることができる。例えば、勾配に基づく方法、ゼロ公差法、あるいはその他の方法を用いることができる。エッジ検出処理1106によって抽出されたエッジマスク1122は、結合処理1124において下記式(1)に基づいて第1文書着目領域候補マスク1118と結合される。
【0144】
【数21】

【0145】
なお、第2文書着目領域候補マスクにおける各要素内の孔(holes)を除去するために、第2文書着目領域候補マスクに対して塗り潰しアルゴリズム(image filling algorithm)による処理を適用してもよい。あるいは、塗り潰し処理を行わなくてもよい。
【0146】
輪郭決定部16は、着目領域補正処理(ROI補正処理)1128において、上記の第2文書着目領域候補マスク1126を補正(精製)する。具体的には、輪郭決定部16は、第2文書着目領域候補マスク1126における連結要素(隣接する画素同士の画素値が同じである画素からなる集合)を識別し、それら各連結要素が文書着目領域の一部であるか否かを分析する。
【0147】
輪郭決定部16は、第2文書着目領域候補マスク1126における連結要素cによってカバーされたテキスト状の内容の量を決定する。具体的には、輪郭決定部16は、入力輝度画像データLから検出されたコーナーの特徴点(複数のエッジの交点。テキストの特徴点。)1132をテキスト特徴算出処理1108することで取得する。テキスト特徴算出部1108は、例えば「C.Harris、M.Stephens著、“A combined corner and edge detector”、Proceedings of the 4th Alvey Vision Conference、147-151頁、1988年」に開示されているハリス法を用いて入力輝度画像データLからコーナーの特徴点1132を検出する。
【0148】
輪郭決定部16は、第2文書着目領域候補マスク1126における連結要素cによって規定されるテキスト範囲として、コーナーの特徴点の総数に対する上記連結要素cに含まれるコーナーの特徴点の数の割合rを算出する。上記割合rの値が所定の閾値Tを超えている場合には最終文書着目領域マスク1134(MROI)に連結要素cを加え、そうでない場合には連結要素cを廃棄する。これにより、テキストの特徴点が密集している領域が最終文書着目領域マスク1134に含まれ、その他の領域は最終文書着目領域マスク1134から除外される。本実施形態では閾値Tを2.5%に設定している。ただし、閾値Tの値はこれに限るものではない。そして、着目領域補正処理1128により生成された最終文書着目領域マスク1134で示される領域を文書着目領域として設定される。
【0149】
文書着目領域に対して幾何学的補正の評価値を決定する処理114でも、幾何学的補正評価部17は、輪郭四角形に対して求めた方法と同様にして、各種の評価値(correctionAngle、vpAngle、#vp、f^)を算出してもよい。
【0150】
例えば、幾何学的補正評価部17は、文書着目領域が四角形である場合、その上辺、下辺、左辺、右辺の単位法線ベクトルをnh1、nh2、nv1、nv2として、上記の数10〜数12を基に、#vpを求めることができる。また、上辺、下辺の交点を水平方向の消失点とし、画像の光学中心Oから水平方向の消失点へのベクトルvpCを求める。同様に、文書着目領域の輪郭となる四角形の左辺、右辺の交点を垂直方向の消失点とし、画像の光学中心Oから垂直方向の消失点へのベクトルvpCを求める。これにより、幾何学的補正評価部17は、vptesutを求めることができ、f^,vpAngleを決定できる。さらに、幾何学的補正評価部17は、数18を基に、文書面の法線ベクトルnとともにcorrectionAngleを算出できる。なお、文書着目領域が四角形ではない場合、幾何学的補正評価部17は、各評価値が算出不可能であると判断してもよい。
【0151】
上述のように、各補正方法Hに対応する幾何学的補正の評価値(correctionAnglei、vpAnglei、#vpi)が決定される。ここで、iは、対応する各補正方法Hを示している。標準状態に対応する補正方法はH’である。また、本実施形態では、幾何学的補正評価部17は、処理114において、文書着目領域Qiと検出されたコーナーCとの間の交わり部分が、撮像文書画像の中のコーナー全体に占める割合(パーセンテージ)を重なり度overlapiとして算出する。重なり度overlapは以下に式で示される。
【0152】
【数22】

【0153】
幾何学的補正の補正方法のフィルタリング処理は、補正方法の選定となる仮定を検証することである。補正方法決定部18は、上述したようなライングループを用いて導かれる補正方法Hに対応するcorrectionAngleがcorrectionAngle>θmax を満たすとき、補正方法Hを採用しない。ここで、角度閾値θmaxは、信頼性があると見なされる最大補正角度であり、例えば40°である。また、補正方法決定部18は、補正方法Hに対応する消失点の数が2つであり、かつ、補正方法Hに対応する消失点間の角度vpAngleが予め設定された角度範囲内にない場合、補正方法Hを採用しない。すなわち、以下のような条件を満たす場合である。
#vp=2 and (vpAngle<80° or vpAngle>110°)
また、補正方法決定部18は、領域成長方法により決定された文書着目領域に基づく補正方法Hに対応するcorrectionAngleが角度閾値θmaxよりも大きく、かつ、補正方法Hに対応する重なり度overlapが重複閾値thよりも小さい場合、補正方法Hを採用しない。この条件は、以下のように示される。
correctionAngle>θmax かつ overlap<th
ここで、角度閾値θmaxは、信頼性があると見なされる最大補正角度であり、例えば40°である。thは、文書着目領域の中に含まれるべきコーナーの最低パーセンテイジであり、例えばth=98%である。このように、領域成長方法により出力される文書着目領域の形状が四角形に十分にマッチしない場合、補正方法Hは拒絶される。
【0154】
本実施形態によれば、補正方法の選択処理(フィルタリング処理)は、階層的に実行されてもよい。領域成長方法に基づく補正方法Hが適切であると判断された場合、補正方法Hが幾何学的補正の方法として選択される。領域成長方法に基づく補正方法Hが適切ではないと判断され、ライングループに基づく補正方法Hが適切であると判断された場合、ライングループに基づく補正方法Hが幾何学的補正の方法として選択される。これ以外の場合、標準状態に基づく補正方法H’が選択され、撮像文書画像に対する幾何学的補正は実行されない。
【0155】
十分な幾何学的補正のためには、文書の辺の相対的な長さを知る必要がある。ただし、十分な幾何学的補正は常に可能であるわけではない。十分な幾何学的補正が可能ではない場合、カメラの遠近法による幾何学形状と文書の法線との近似を推定するのために、近似値が使用される。
【0156】
カメラの焦点距離が予め既知ではない場合、または、焦点距離に対する評価値の信頼性が低い場合(例えば、estFが「false」である場合)、デフォルトの焦点距離が使用される。そして、図5および図6に示されるように、画像サイズ決定部19は、補正後の画像サイズを決定する(118)。カメラ原点602から画像面606上の四角形の点[q1、q2、q3、q4]を通って、カメラ原点からDだけ離れた文書面610の点pに向けた光線rが画像上に投影される。文書面610上の点pは、陰関数式 n・(p−p)=0により決定される。ここで、p=[0 0 D]である。点pは、以下の式により決定される。
【0157】
【数23】

【0158】
ここで、nは、文書面610の単位法線ベクトルである。「・」は、ベクトルの内積を示す。点[p1、p2、p3、p4]は、文書面610上の文書の矩形の頂点を示し、距離Dは、カメラの投影原点から文書面610までの距離である。本実施形態では、D=5f^であり、f^は焦点距離である。
【0159】
画像サイズ決定部19は、文書のアスペクト比A^を以下の式に従って決定する。
【0160】
【数24】

【0161】
ここで、H^は、文書面610における推定された文書の高さであり、Wは推定された文書の幅である。H^は、H^=‖p−p‖により決定され、W^は、W^=‖p−p‖により決定される。
【0162】
画像サイズ決定部19は、補正された画像のスケールを、四角形の点[q1、q2、q3、q4]と文書のアスペクト比A^とから求める。そして、画像サイズ決定部19は、補正後の画像サイズ(w,h)を以下の式に従って算出する。
【0163】
【数25】

【0164】
ここで、s=min(max(dh、dh),imgW)であり、最大の水平方向の辺の長さと入力画像の幅imgWとの小さいほうである。また、s=min(max(dv、dv),imgH)であり、最大の垂直方向の辺の長さと入力画像の高さimgHとの小さいほうである。dh=‖q−q‖は、四角形の上方の頂点間の長さであり、dh=‖q−q‖は、四角形の下方の頂点間の長さである。dv=‖q−q‖は、四角形の左側の頂点間の長さであり、dv=‖q−q‖は、四角形の右側の頂点間の長さである。
【0165】
なお、画像サイズ決定部19は、補正方法決定部18が補正方法Hを選択した場合、輪郭四角形および消失点情報に基づいて算出された評価値を用いて画像サイズを決定し、補正方法決定部18が補正方法Hを選択した場合、文書着目領域に基づいて算出された評価値を用いて画像サイズを決定すればよい。
【0166】
そして、図1に示されるように、補正処理部20は、撮像文書画像に対して幾何学的補正を実行する(120)。本実施形態では、補正処理部20は、バイキュービック補間を用いて、推定された画像の四角形と所望の画像サイズで設定される出力矩形とに基づいた幾何学的補正を行う。本実施形態では、補正処理部20は、入力点[q1、q2、q3、q4]を用いた透過平面投影変換の演算を用いて補正を行う。そして、補正画像の所望の対応出力点が、算出された補正後の画像サイズ[(0,0)、(w、0)、(w、h)、(0、h)]から決定される。平面投影変換の演算を用いた遠近法の歪みの補正により、補正された画像が出力される。
【0167】
例えば、補正処理部20は、補正方法決定部18により補正方法Hが選択された場合、輪郭決定部16が消失点情報とコーナー検出結果とに基づいて決定した輪郭四角形を、画像サイズ決定部19により決定された画像サイズの矩形に写像変換する。このとき、バイキュービック補間を用いて、各画素の値を求めればよい。
【0168】
また、補正処理部20は、補正方法決定部18により補正方法Hが選択された場合、輪郭決定部16が領域成長方法により決定した文書着目領域を、画像サイズ決定部19により決定された画像サイズの矩形に写像変換する。このとき、バイキュービック補間を用いて、各画素の値を求めればよい。
【0169】
また、上述した各処理の実行順序は、図面中に示した順序に限定されるものではなく、適宜変更してもよい。また、図面中に連続して実行されるように示されている各処理の一部を、並行処理するようにしてもよく、処理期間の一部が重複するようにしてもよい。
【0170】
また、上記実施形態において、画像処理装置1に備えられる各部(各ブロック)を、CPU等のプロセッサを用いてソフトウェアによって実現してもよい。この場合、画像処理装置1は、各機能を実現する制御プログラムの命令を実行するCPU(central processing unit)、上記プログラムを格納したROM(read only memory)、上記プログラムを展開するRAM(random access memory)、上記プログラムおよび各種データを格納するメモリ等の記憶装置(記録媒体)などを備えている。そして、本発明の目的は、上述した機能を実現するソフトウェアである画像処理装置1の制御プログラムのプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)をコンピュータで読み取り可能に記録した記録媒体を、画像処理装置1に供給し、そのコンピュータ(またはCPUやMPU)が記録媒体に記録されているプログラムコードを読み出し実行することによって達成される。
【0171】
上記記録媒体としては、例えば、磁気テープやカセットテープ等のテープ系、フロッピー(登録商標)ディスク/ハードディスク等の磁気ディスクやCD−ROM/MO/MD/DVD/CD−R等の光ディスクを含むディスク系、ICカード(メモリカードを含む)/光カード等のカード系、あるいはマスクROM/EPROM/EEPROM(登録商標)/フラッシュROM等の半導体メモリ系などを用いることができる。
【0172】
また、画像処理装置1を通信ネットワークと接続可能に構成し、通信ネットワークを介して上記プログラムコードを供給してもよい。この通信ネットワークの構成は特に限定されるものではなく、例えば、インターネット、イントラネット、エキストラネット、LAN、ISDN、VAN、CATV通信網、仮想専用網(virtual private network)、電話回線網、移動体通信網、衛星通信網等が利用可能である。また、通信ネットワークを構成する伝送媒体についても特に限定されず、例えば、IEEE1394、USB、電力線搬送、ケーブルTV回線、電話線、ADSL回線等の有線でも、IrDAやリモコンのような赤外線、Bluetooth(登録商標)、802.11無線、HDR、携帯電話網、衛星回線、地上波デジタル網等の無線でも利用可能である。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。
【0173】
また、画像処理装置1の各ブロックは、ソフトウェアを用いて実現されるものに限らず、ハードウェアロジックによって構成されるものであってもよい。また、画像処理装置1の各ブロックは、処理の一部を行うハードウェアと当該ハードウェアの制御や残余の処理を行うソフトウェアを実行する演算手段とを組み合わせたものであってもよい。
【0174】
本発明は上述した実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能である。すなわち、請求項に示した範囲で適宜変更した技術的手段を組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
【0175】
(まとめ)
以上のように、本発明の一態様に係る画像処理装置は、撮像装置により撮像された画像に対して幾何学的補正を行う画像処理装置であって、(a)撮像装置が矩形状の文書を撮像することにより得られた撮像文書画像を取得する撮像画像取得部と、(b)上記撮像文書画像における水平方向の消失点の位置または水平方向の消失点の方向を示す水平方向消失点情報を生成するとともに、上記撮像文書画像における垂直方向の消失点の位置または垂直水平方向の消失点の方向を示す垂直方向消失点情報を生成する消失点情報生成部(消失点情報推定部14)と、(c)上記撮像文書画像におけるコーナーを検出するコーナー検出部と、(d)(1)上記水平方向消失点情報が水平方向の消失点の位置を示す場合、当該水平方向の消失点の位置に集まる2つの線分を上辺および下辺とし、上記水平方向消失点情報が水平方向の消失点の方向を示す場合、当該水平方向の消失点の方向に平行な2つの線分を上辺および下辺とし、(2)上記垂直方向消失点情報が垂直方向の消失点の位置を示す場合、当該垂直方向の消失点の位置に集まる2つの線分を左辺および右辺とし、上記垂直方向消失点情報が垂直方向の消失点の方向を示す場合、当該垂直方向の消失点の方向に平行な2つの線分を左辺および右辺とし、(3)上記コーナー検出部により検出されたコーナーを囲む四角形の輪郭を輪郭四角形として決定する輪郭決定部と、(e)上記輪郭四角形の信頼性を示す第1の評価値を算出する幾何学的補正評価部と、(f)上記第1の評価値を基に、上記輪郭四角形に基づいた第1補正方法により幾何学的補正を行うか否かを決定する補正方法決定部と、(g)上記補正方法決定部が第1補正方法による幾何学的補正を行うと決定した場合に、上記輪郭四角形に基づいて、幾何学的補正後の第1画像サイズを決定する画像サイズ決定部と、(h)上記補正方法決定部が第1補正方法による幾何学的補正を行うと決定した場合に、上記輪郭四角形と上記第1画像サイズとに基づいて上記撮像文書画像に対して幾何学的補正を行う補正処理部とを備えている。
【0176】
上記の構成によれば、消失点を用いて輪郭四角形を決定する。消失点は、撮像装置の焦点距離に依存して変化する。そのため、消失点情報を用いることにより撮像装置の焦点距離を考慮した幾何学的補正を行うことができる。その結果、カメラレンズの焦点距離に関する情報がなくても、幾何学的歪みの補正を適切に行うことができる。
【0177】
また、本発明の一態様において、(a)上記輪郭決定部は、(1)撮像文書画像の前景成分を除去して前景除去画像を生成し、上記前景除去画像における不均一性を低減して再構成画像を生成し、(2)上記再構成画像に2値化処理を施すことにより第1文書着目領域候補マスクを生成し、(3)上記撮像文書画像におけるエッジ部を示すエッジマスクと上記第1文書着目領域候補マスクとを結合して第2文書着目領域候補マスクを生成し、(4)上記撮像文書画像から算出されるテキストの特徴点に基づいて上記第2文書着目領域候補マスクを補正することにより最終文書着目領域を特定し、(b)上記幾何学的補正評価部は、上記最終文書着目領域の信頼性を示す第2の評価値を算出し、(c)上記補正方法決定部は、上記第1の評価値および第2の評価値に基づいて、上記第1補正方法により幾何学的補正を行うか、上記最終文書着目領域に基づいた第2補正方法により幾何学的補正を行うか決定し、(d)上記画像サイズ決定部は、上記補正方法決定部が第2補正方法を選択した場合に、最終文書着目領域に基づいて、幾何学的補正後の第2画像サイズを決定し、(e)上記補正処理部は、上記補正方法決定部が第2補正方法を選択した場合に、上記最終文書着目領域と上記第2画像サイズとに基づいて上記撮像文書画像に対して幾何学的補正を行ってもよい。
【0178】
また、本発明の一態様において、上記補正方法決定部は、(1)上記第2の評価値が予め設定された第1条件を満たす場合に、上記第2補正方法を幾何学的補正の方法として決定し、(2)上記第2の評価値が上記の第1条件を満たさず、かつ、上記第1の評価値が予め設定された第2条件を満たす場合に、上記第1補正方法を幾何学的補正の方法として決定し、(3)上記第2の評価値が上記の第1条件を満たさず、かつ、上記第1の評価値が上記第2条件を満たさない場合に、幾何学的補正を行わないものと決定し、上記補正処理部は、上記補正方法決定部が幾何学的補正を行わないと決定した場合、撮像文書画像に対して幾何学的補正を行わなくてもよい。
【0179】
また、本発明の一態様の画像処理装置は、上記撮像文書画像におけるエッジ部を示すエッジマスクを生成するエッジ検出部と、上記エッジマスクから複数の直線構造を抽出し、当該複数の直線構造を水平方向のライングループと垂直方向のライングループとにグループ分けする直線構造抽出部とを備え、上記消失点情報生成部は、(1)上記水平方向のライングループに属する各直線構造について陰関数形式の複数の係数を求め、(2)上記水平方向のライングループに属する直線構造間の最大距離を示す水平方向ベースライン量を算出し、(3)上記水平方向のライングループに属する直線構造の数が2よりも大きい場合に、上記水平方向のライングループに属する各直線構造に対応する上記複数の係数を連結した係数行列を生成し、当該係数行列に特異値分解を適用して、複数の固有ベクトルおよび固有値を決定し、(4)上記複数の固有値のうちの最大値に対する最小値の割合を示す第1固有値割合を算出し、(5)上記水平方向ベースライン量が予め設定されたベースライン閾値よりも大きく、かつ、上記第1固有値割合が予め設定された平行度閾値よりも小さい場合に、上記複数の固有値のうちの最小値に対応する固有ベクトルを用いて水平方向の消失点の位置を求め、当該水平方向の消失点の位置を示す水平方向消失点情報を生成してもよい。
【0180】
また、本発明の一態様において、上記消失点情報生成部は、(1)上記水平方向のライングループに属する2つの直線構造について、一方の直線構造と上記撮像文書画像の中心を通る垂直方向のラインである垂直ラインとの第1交点を決定するとともに、他方の直線構造と上記垂直ラインとの第2交点を決定し、上記第1交点と第2交点との距離を算出し、(2)上記水平方向のライングループに属する2つの直線構造の全ての組合せについて求めた上記第1交点と第2交点との距離のうちの最大値を水平方向ベースライン量として設定してもよい。
【0181】
また、本発明の一態様において、上記消失点情報生成部は、(1)上記垂直方向のライングループに属する各直線構造について陰関数形式の複数の係数を求め、(2)上記垂直方向のライングループに属する直線構造間の最大距離を示す垂直方向ベースライン量を算出し、(3)上記垂直方向のライングループに属する直線構造の数が2よりも大きい場合に、上記垂直方向のライングループに属する各直線構造に対応する上記複数の係数を連結した係数行列を生成し、当該係数行列に特異値分解を適用して、複数の固有ベクトルおよび固有値を決定し、(4)上記複数の固有値のうちの最大値に対する最小値の割合を示す第2固有値割合を算出し、(5)上記垂直方向ベースライン量が予め設定されたベースライン閾値よりも大きく、かつ、上記第2固有値割合が予め設定された平行度閾値よりも小さい場合に、上記複数の固有値のうちの最小値に対応する固有ベクトルを用いて垂直方向の消失点の位置を求め、当該垂直方向の消失点の位置を示す垂直方向消失点情報を生成してもよい。
【0182】
また、本発明の一態様において、上記消失点情報生成部は、(1)上記垂直方向のライングループに属する2つの直線構造について、一方の直線構造と上記撮像文書画像の中心を通る水平方向のラインである水平ラインとの第3交点を決定するとともに、他方の直線構造と上記水平ラインとの第4交点を決定し、上記第3交点と第4交点との距離を算出し、(2)上記垂直方向のライングループに属する2つの直線構造の全ての組合せについて求めた上記第3交点と第4交点との距離のうちの最大値を垂直方向ベースライン量として設定してもよい。
【0183】
また、本発明の一態様において、上記第1の評価値は、消失点の数、焦点距離の信頼度、基準点および水平方向の消失点を通る直線と基準点および垂直方向の消失点を通る直線とのなす角度、検出されたコーナーと輪郭四角形との重なり度、および、推定される文書面の法線に対する撮像装置の光軸との角度である補正角度から選択される少なくとも1つであることが好ましい。
【0184】
本発明のより具体的な一態様では、幾何学的補正評価部は、(1)輪郭四角形における対向する2辺のなす角度を基に消失点の数#vpを算出し、(2)消失点の位置に基づいて焦点距離f^を推定し、(3)基準点(例えば画像中心)から2つの消失点への方向のなす角度vpAngleを算出し、(3)消失点の位置と推定された焦点距離f^とを基に、文書面の法線ベクトルnおよび法線ベクトルnとカメラの光軸とのなす角度correctionAngleを算出する。
【0185】
そして、#vp=2 and (vpAngle<80° or vpAngle>110°) and correctionAngle>θmax を満たす場合に、補正方法Hを選択する。
【0186】
このとき、画像サイズ決定部19は、焦点距離f^の所定倍(例えば5)の距離をカメラと文書との距離として、画像面上の輪郭四角形の4頂点および法線ベクトルnを基に上述した数23に従って文書面の4頂点座標を特定する。そして、画像サイズ決定部19は、文書面のアスペクト比を推定し、推定したアスペクト比となるように画像サイズを決定する。
【0187】
その後、補正処理部20は、輪郭四角形を画像サイズ決定部19が決定した画像サイズになうように写像変換すればよい。
【0188】
また、本発明の一態様は以下のようにも表現できる。
【0189】
本発明の一態様は、撮像装置により撮像された文書画像における幾何学的歪みを補正する方法であって、処理部が上記撮像文書画像を取得するステップと、上記撮像文書画像に対して、水平方向の消失点情報を生成するステップと、上記撮像文書画像に対して、垂直方向の消失点情報を生成するステップと、上記撮像文書画像におけるコーナーを検出するコーナー検出処理を行うステップと、上記コーナー検出処理の結果と上記水平方向の消失点情報と上記垂直方向の消失点情報とを用いて、四角形の輪郭を第1輪郭四角形として検出するステップと、上記第1輪郭四角形に対応する、幾何学的補正の程度を示す第1の複数の評価値を決定するステップと、上記第1の複数の評価値に基づいて、補正用仮定を選択するステップと、選択された補正用仮定を用いて、補正画像のサイズを決定するステップと、選択された補正用仮定が標準状態に対応する仮定ではない場合、選択された補正用仮定を用いて上記撮像文書画像を補正し、補正後文書画像を生成するステップとを含む。
【0190】
選択された補正用仮定が標準状態に対応する仮定である場合、上記撮像文書画像を補正しなくてもよい。
【0191】
上記水平方向の消失点情報は、水平方向の消失点、または、水平方向の消失点の方向を示す情報である。
【0192】
上記垂直方向の消失点情報は、垂直方向の消失点、または、垂直方向の消失点の方向を示す情報である。
【0193】
また、本発明の一態様は、別の輪郭領域を取得するステップと、上記別の輪郭領域に対応する、幾何学的補正の程度を示す第2の複数の評価値を決定するステップとをさらに含み、補正用仮定を選択するステップにおいて、上記第2の複数の評価値に基づいて補正用仮定を選択する。
【0194】
上記別の輪郭領域は、領域成長方法により生成される。
【0195】
補正用仮定を選択するステップは、上記別の輪郭領域と上記第2の複数の評価値とに対応する第1仮定に基づく第1補正処理を実行するステップと、上記第1補正処理が上記第1仮定を却下する場合、上記第1輪郭四角形と上記第1の複数の評価値とに対応する第2仮定に基づく第2補正処理を実行するステップと、上記第1補正処理が上記第1仮定を受け入れる場合、上記第1仮定を上記補正用仮定として選択するステップと、上記第2補正処理が上記第2仮定を却下する場合、標準状態に対応する仮定を上記補正用仮定として選択するステップと、上記第2補正処理が上記第2仮定を受け入れる場合、上記第2仮定を上記補正用仮定として選択するステップとを含む。
【0196】
上記水平方向の消失点情報を生成するステップは、上記撮像文書画像においてエッジを検出し、エッジマスクを生成するステップと、上記エッジマスクから複数のライン構造を抽出するステップと、上記複数のライン構造を、水平方向のラインセットにグループ分けするステップと、上記水平方向のラインセットに属する各ラインについて陰関数形式の複数の係数を演算するステップと、上記水平方向のラインセットに対して、水平方向のベースライン量を算出するステップと、上記水平方向のラインセットに属するラインの数が2よりも大きい場合に、上記複数の係数を用いて係数マトリクスを生成するステップと、上記係数マトリクスに特異値分解を適用して、複数の固有ベクトルおよび固有値を決定するステップと、上記複数の固有値のうちの最大値に対する最小値の割合を示す固有値割合を算出するステップと、上記水平方向のベースライン量と水平方向のベースライン閾値とを比較する第1比較処理を行うステップと、上記固有値割合と水平方向の固有値割合に対する閾値とを比較する第2比較処理を行うステップと、上記第1比較処理の結果が広いベースライン量であることを示し、上記第2比較処理の結果が単一点への集中度が良いことを示している場合、上記複数の固有値のうちの最小値に対応する固有ベクトルを用いて水平方向の消失点を算出するステップとを含み、上記水平方向の消失点情報は、上記水平方向の消失点を示す情報である。
【0197】
上記第1比較処理の結果が広いベースライン量であることを示していない、もしくは、上記第2比較処理の結果が単一点への集中度が良いことを示していない場合、水平方向の消失点の方向を算出するステップを含み。上記水平方向の消失点情報は、上記水平方向の消失点の方向を示す情報である。
【0198】
上記水平方向のラインセットに属するラインの数が2である場合、上記水平方向のラインセットに属する一方のラインである第1ラインの法線と、他方のラインである2ラインの法線とのなす角度を、平行閾値と比較する第3比較処理を行うステップと、上記第1比較処理の結果が小さいベースライン量であることを示している場合、もしくは、上記第3比較処理の結果がほとんど平行であることを示している場合、上記第1ラインの法線と上記第2ラインの法線との平均に垂直な方向を水平方向の消失点の方向と決定するステップとを含み、上記水平方向の消失点情報は、上記水平方向の消失点の方向を示す情報である。
【0199】
上記第1比較処理の結果が小さいベースライン量であることを示しておらず、かつ、上記第3比較処理の結果がほとんど平行であることを示していない場合、上記第1ラインと第2ラインとの交点を水平方向の消失点として求めるステップを含み、上記水平方向の消失点情報は、上記水平方向の消失点を示す情報である。
【0200】
上記水平方向のラインセットに属するラインの数が1である場合、上記水平方向のラインセットに属する第1ラインの法線を決定するステップと、上記第1ラインの法線に垂直な方向を、水平方向の消失点の方向と決定するステップとを含み、上記水平方向の消失点情報は、上記水平方向の消失点の方向を示す情報である。
【0201】
上記水平方向のラインセットに属するラインの数が0である場合、基本となる水平方向を、水平方向の消失点の方向として設定し、上記水平方向の消失点情報は、上記水平方向の消失点の方向を示す情報である。
【0202】
上記複数のライン構造の中の第1ライン構造は、第1の水平方向の消失点に集中する場合、上記水平方向のラインセットにグループ分けされる。
【0203】
上記水平方向のベースライン量を算出するステップは、上記水平方向のラインセットに属する各対のラインについて、当該対の一方の第1ラインと、上記撮像文書画像の中心を通る垂直方向のラインである垂直ラインとの第1交点を決定するステップと、当該対の他方の第2ラインと上記垂直ラインとの第2交点を決定するステップと、上記第1交点と第2交点との距離を算出するステップとを含み、上記水平方向のラインセットに属する全ての対について求められた複数の距離の最大値を上記水平方向のベースライン量として設定するステップを含む。
【0204】
上記水平方向のベースライン量がベースライン閾値よりも大きい場合、上記第1比較処理において広いベースライン量である結果が出力される。
【0205】
上記固有値割合が上記固有値割合閾値よりも小さい場合に、上記第2比較処理において、単一点への集中度が良いとの結果が出力される。
【0206】
上記垂直方向の消失点情報を生成するステップは、上記撮像文書画像においてエッジを検出し、エッジマスクを生成するステップと、上記エッジマスクから複数のライン構造を抽出するステップと、上記複数のライン構造を、垂直方向のラインセットにグループ分けするステップと、上記垂直方向のラインセットに属する各ラインについて陰関数形式の複数の係数を演算するステップと、上記垂直方向のラインセットに対して、垂直方向のベースライン量を算出するステップと、上記垂直方向のラインセットに属するラインの数が2よりも大きい場合に、上記複数の係数を用いて係数マトリクスを生成するステップと、上記係数マトリクスに特異値分解を適用して、複数の固有ベクトルおよび固有値を決定するステップと、上記複数の固有値のうちの最大値に対する最小値の割合を示す固有値割合を算出するステップと、上記垂直方向のベースライン量と垂直方向のベースライン閾値とを比較する第1比較処理を行うステップと、上記固有値割合と垂直方向の固有値割合に対する閾値とを比較する第2比較処理を行うステップと、上記第1比較処理の結果が広いベースライン量であることを示し、上記第2比較処理の結果が単一点への集中度が良いことを示している場合、上記複数の固有値のうちの最小値に対応する固有ベクトルを用いて垂直方向の消失点を算出するステップとを含む。
【0207】
上記第1比較処理の結果が広いベースライン量であることを示していない、もしくは、上記第2比較処理の結果が単一点への集中度が良いことを示していない場合、垂直方向の消失点の方向を算出するステップを含み、上記垂直方向の消失点情報は、上記垂直方向の消失点の方向を示す情報である。
【0208】
上記垂直方向のラインセットに属するラインの数が2である場合、上記垂直方向のラインセットに属する一方のラインである第1ラインの法線と、他方のラインである2ラインの法線とのなす角度を、平行閾値と比較する第3比較処理を行うステップと、上記第1比較処理の結果が小さいベースライン量であることを示している場合、もしくは、上記第3比較処理の結果がほとんど平行であることを示している場合、上記第1ラインの法線と上記第2ラインの法線との平均に垂直な方向を垂直方向の消失点の方向と決定するステップとを含み、上記垂直方向の消失点情報は、上記垂直方向の消失点の方向を示す情報である。
【0209】
上記第1比較処理の結果が小さいベースライン量であることを示しておらず、かつ、上記第3比較処理の結果がほとんど平行であることを示していない場合、上記第1ラインと第2ラインとの交点を垂直方向の消失点として求めるステップを含み、上記垂直方向の消失点情報は、上記垂直方向の消失点を示す情報である。
【0210】
上記垂直方向のラインセットに属するラインの数が1である場合、上記垂直方向のラインセットに属する第1ラインの法線を決定するステップと、上記第1ラインの法線に垂直な方向を、垂直方向の消失点の方向と決定するステップとを含み、上記垂直方向の消失点情報は、上記垂直方向の消失点の方向を示す情報である。
【0211】
上記垂直方向のラインセットに属するラインの数が0である場合、基本となる垂直方向を、垂直方向の消失点の方向として設定し、上記垂直方向の消失点情報は、上記垂直方向の消失点の方向を示す情報である。
【0212】
上記複数のライン構造の中の第1ライン構造は、第1の垂直方向の消失点に集中する場合、上記垂直方向のラインセットにグループ分けされる。
【0213】
上記垂直方向のベースライン量を算出するステップは、上記垂直方向のラインセットに属する各対のラインについて、当該対の一方の第1ラインと、上記撮像文書画像の中心を通る水平方向のラインである水平ラインとの第1交点を決定するステップと、当該対の他方の第2ラインと上記水平ラインとの第2交点を決定するステップと、上記第1交点と第2交点との距離を算出するステップとを含み、上記垂直方向のラインセットに属する全ての対について求められた複数の距離の最大値を上記垂直方向のベースライン量として設定するステップを含む。
【0214】
上記垂直方向のベースライン量がベースライン閾値よりも大きい場合、上記第1比較処理において広いベースラインである結果が出力される。
【0215】
上記固有値割合が上記固有値割合閾値よりも小さい場合に、上記第2比較処理において、単一点への集中度が良いとの結果が出力される。
【0216】
上記第1の複数の評価値は、消失点の数、焦点長の信頼度、水平方向の消失点と垂直方向の消失点との角度、補正強度、検出されたコーナーと文書四角形との重なり度、および、補正角度から選択される少なくとも1つである。
【0217】
デジタル画像のライン構造を検出する方法であって、デジタル画像に対応するエッジマスクを取得するステップと、上記エッジマスク内のライン構造候補に対して、当該ライン構造候補の長さに対する当該ライン構造候補内の複数のラインギャップの合計の割合を示す占有度を算出するステップと、上記占有度に対応する第1基準を満たす場合に、上記ライン構造候補をライン構造とするステップとを含む。
【符号の説明】
【0218】
1 画像処理装置
11 撮像画像取得部
12 エッジ検出部
13 直線構造抽出部
14 消失点情報推定部
15 コーナー検出部
16 輪郭決定部
17 幾何学的補正評価部
18 補正方法決定部
19 画像サイズ決定部
20 補正処理部
100 画像補正処理
104 推定処理
1104 前景除去処理
1106 エッジ検出処理
1108 テキスト特徴算出処理
1112 不均一性低減処理
1116 2値化処理
1128 着目領域補正処理
500 輪郭四角形
606 画像面
610 文書面
水平方向のライングループ
垂直方向のライングループ
O 画像中心(基準点)

【特許請求の範囲】
【請求項1】
撮像装置により撮像された画像に対して幾何学的補正を行う画像処理装置であって、
撮像装置が矩形状の文書を撮像することにより得られた撮像文書画像を取得する撮像画像取得部と、
上記撮像文書画像における水平方向の消失点の位置または水平方向の消失点の方向を示す水平方向消失点情報を生成するとともに、上記撮像文書画像における垂直方向の消失点の位置または垂直水平方向の消失点の方向を示す垂直方向消失点情報を生成する消失点情報生成部と、
上記撮像文書画像におけるコーナーを検出するコーナー検出部と、
(1)上記水平方向消失点情報が水平方向の消失点の位置を示す場合、当該水平方向の消失点の位置に集まる2つの線分を上辺および下辺とし、上記水平方向消失点情報が水平方向の消失点の方向を示す場合、当該水平方向の消失点の方向に平行な2つの線分を上辺および下辺とし、(2)上記垂直方向消失点情報が垂直方向の消失点の位置を示す場合、当該垂直方向の消失点の位置に集まる2つの線分を左辺および右辺とし、上記垂直方向消失点情報が垂直方向の消失点の方向を示す場合、当該垂直方向の消失点の方向に平行な2つの線分を左辺および右辺とし、(3)上記コーナー検出部により検出されたコーナーを囲む四角形の輪郭を輪郭四角形として決定する輪郭決定部と、
上記輪郭四角形の信頼性を示す第1の評価値を算出する幾何学的補正評価部と、
上記第1の評価値を基に、上記輪郭四角形に基づいた第1補正方法により幾何学的補正を行うか否かを決定する補正方法決定部と、
上記補正方法決定部が第1補正方法による幾何学的補正を行うと決定した場合に、上記輪郭四角形に基づいて、幾何学的補正後の第1画像サイズを決定する画像サイズ決定部と、
上記補正方法決定部が第1補正方法による幾何学的補正を行うと決定した場合に、上記輪郭四角形と上記第1画像サイズとに基づいて上記撮像文書画像に対して幾何学的補正を行う補正処理部とを備えたことを特徴とする画像処理装置。
【請求項2】
上記輪郭決定部は、(1)撮像文書画像の前景成分を除去して前景除去画像を生成し、上記前景除去画像における不均一性を低減して再構成画像を生成し、(2)上記再構成画像に2値化処理を施すことにより第1文書着目領域候補マスクを生成し、(3)上記撮像文書画像におけるエッジ部を示すエッジマスクと上記第1文書着目領域候補マスクとを結合して第2文書着目領域候補マスクを生成し、(4)上記撮像文書画像から算出されるテキストの特徴点に基づいて上記第2文書着目領域候補マスクを補正することにより最終文書着目領域を特定し、
上記幾何学的補正評価部は、上記最終文書着目領域の信頼性を示す第2の評価値を算出し、
上記補正方法決定部は、上記第1の評価値および第2の評価値に基づいて、上記第1補正方法により幾何学的補正を行うか、上記最終文書着目領域に基づいた第2補正方法により幾何学的補正を行うか決定し、
上記画像サイズ決定部は、上記補正方法決定部が第2補正方法を選択した場合に、最終文書着目領域に基づいて、幾何学的補正後の第2画像サイズを決定し、
上記補正処理部は、上記補正方法決定部が第2補正方法を選択した場合に、上記最終文書着目領域と上記第2画像サイズとに基づいて上記撮像文書画像に対して幾何学的補正を行うことを特徴とする請求項1に記載の画像処理装置。
【請求項3】
上記補正方法決定部は、(1)上記第2の評価値が予め設定された第1条件を満たす場合に、上記第2補正方法を幾何学的補正の方法として決定し、(2)上記第2の評価値が上記第1条件を満たさず、かつ、上記第1の評価値が予め設定された第2条件を満たす場合に、上記第1補正方法を幾何学的補正の方法として決定し、(3)上記第2の評価値が上記の第1条件を満たさず、かつ、上記第1の評価値が上記第2条件を満たさない場合に、幾何学的補正を行わないものと決定し、
上記補正処理部は、上記補正方法決定部が幾何学的補正を行わないと決定した場合、撮像文書画像に対して幾何学的補正を行わないことを特徴とする請求項2に記載の画像処理装置。
【請求項4】
上記撮像文書画像におけるエッジ部を示すエッジマスクを生成するエッジ検出部と、
上記エッジマスクから複数の直線構造を抽出し、当該複数の直線構造を水平方向のライングループと垂直方向のライングループとにグループ分けする直線構造抽出部とを備え、
上記消失点情報生成部は、(1)上記水平方向のライングループに属する各直線構造について陰関数形式の複数の係数を求め、(2)上記水平方向のライングループに属する直線構造間の最大距離を示す水平方向ベースライン量を算出し、(3)上記水平方向のライングループに属する直線構造の数が2よりも大きい場合に、上記水平方向のライングループに属する各直線構造に対応する上記複数の係数を連結した係数行列を生成し、当該係数行列に特異値分解を適用して、複数の固有ベクトルおよび固有値を決定し、(4)上記複数の固有値のうちの最大値に対する最小値の割合を示す第1固有値割合を算出し、(5)上記水平方向ベースライン量が予め設定されたベースライン閾値よりも大きく、かつ、上記第1固有値割合が予め設定された平行度閾値よりも小さい場合に、上記複数の固有値のうちの最小値に対応する固有ベクトルを用いて水平方向の消失点の位置を求め、当該水平方向の消失点の位置を示す水平方向消失点情報を生成することを特徴とする請求項1から3の何れか1項に記載の画像処理装置。
【請求項5】
上記消失点情報生成部は、(1)上記水平方向のライングループに属する2つの直線構造について、一方の直線構造と上記撮像文書画像の中心を通る垂直方向のラインである垂直ラインとの第1交点を決定するとともに、他方の直線構造と上記垂直ラインとの第2交点を決定し、上記第1交点と第2交点との距離を算出し、(2)上記水平方向のライングループに属する2つの直線構造の全ての組合せについて求めた上記第1交点と第2交点との距離のうちの最大値を水平方向ベースライン量として設定することを特徴とする請求項4に記載の画像処理装置。
【請求項6】
上記消失点情報生成部は、(1)上記垂直方向のライングループに属する各直線構造について陰関数形式の複数の係数を求め、(2)上記垂直方向のライングループに属する直線構造間の最大距離を示す垂直方向ベースライン量を算出し、(3)上記垂直方向のライングループに属する直線構造の数が2よりも大きい場合に、上記垂直方向のライングループに属する各直線構造に対応する上記複数の係数を連結した係数行列を生成し、当該係数行列に特異値分解を適用して、複数の固有ベクトルおよび固有値を決定し、(4)上記複数の固有値のうちの最大値に対する最小値の割合を示す第2固有値割合を算出し、(5)上記垂直方向ベースライン量が予め設定されたベースライン閾値よりも大きく、かつ、上記第2固有値割合が予め設定された平行度閾値よりも小さい場合に、上記複数の固有値のうちの最小値に対応する固有ベクトルを用いて垂直方向の消失点の位置を求め、当該垂直方向の消失点の位置を示す垂直方向消失点情報を生成することを特徴とする請求項4または5に記載の画像処理装置。
【請求項7】
上記消失点情報生成部は、(1)上記垂直方向のライングループに属する2つの直線構造について、一方の直線構造と上記撮像文書画像の中心を通る水平方向のラインである水平ラインとの第3交点を決定するとともに、他方の直線構造と上記水平ラインとの第4交点を決定し、上記第3交点と第4交点との距離を算出し、(2)上記垂直方向のライングループに属する2つの直線構造の全ての組合せについて求めた上記第3交点と第4交点との距離のうちの最大値を垂直方向ベースライン量として設定することを特徴とする請求項6に記載の画像処理装置。
【請求項8】
上記第1の評価値は、消失点の数、焦点距離の信頼度、基準点および水平方向の消失点を通る直線と基準点および垂直方向の消失点を通る直線とのなす角度、検出されたコーナーと輪郭四角形との重なり度、および、推定される文書面の法線に対する撮像装置の光軸との角度である補正角度から選択される少なくとも1つであることを特徴とする請求項1から7の何れか1項に記載の画像処理装置。


【図1】
image rotate

【図3】
image rotate

【図4】
image rotate

【図7A】
image rotate

【図7B】
image rotate

【図7C】
image rotate

【図7D】
image rotate

【図9A】
image rotate

【図9B】
image rotate

【図9C】
image rotate

【図9D】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図2】
image rotate

【図5】
image rotate

【図6】
image rotate

【図8】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate


【公開番号】特開2013−89234(P2013−89234A)
【公開日】平成25年5月13日(2013.5.13)
【国際特許分類】
【出願番号】特願2012−219840(P2012−219840)
【出願日】平成24年10月1日(2012.10.1)
【出願人】(000005049)シャープ株式会社 (33,933)
【Fターム(参考)】