説明

画像処理方法、画像処理装置、スキャナ及びコンピュータプログラム

【課題】本の上下の輪郭線に基づき本のページの曲面を補正する画像処理方法等を提供する。
【解決手段】画像処理方法は、概して、2次元画像における曲面上で消失点を取得するステップと、消失点によって前記曲面の上輪郭線及び下輪郭線の間の全ての直線セグメントを取り出すステップと、平行な直線セグメントを得るよう透視歪みを除去するステップと、直線セグメントの長さを取得し、その長さに従って3次元空間における各直線セグメントの正確な幅及び直線セグメントの奥行き増分を取得するステップと、正確な幅及び奥行き増分に従って各直線セグメントの拡大された幅を取得するステップと、曲面を平面に変換するよう曲面の全体的な拡大された幅を取得するステップと、曲面上の画像コンテンツを平面上に変換するステップとを有する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像処理の分野に関し、特に、捕捉画像をデワーピング(de-warping)する画像処理方法に関する。
【背景技術】
【0002】
本は、その画像が非接触式スキャナ又はカメラにより捕捉される場合に、本の厚みにより通常湾曲し、従って、スキャナ又はカメラにより捕捉された画像は、たわみにより生じる幾何学歪みを免れない傾向がある。図1aは、非接触式スキャナによりスキャンされた本の画像の一例を表し、その画像はたわみにより生じる幾何学的歪みを有する。そのような本の内容を読むことは厄介であり、その後の動作のための歪んだ画像の使用は認識精度の低下をもたらすこともある。
【0003】
本の歪み画像における歪みを補正するための多数の方法が提案されている。本の画像を補整するための従来の方法は、2つのカテゴリ、すなわち、内容に依存しない補正方法及び内容に依存した補正方法に分類され得る。
【0004】
内容に依存しない補正方法では、ユーザは、本の開いた湾曲ページ上に近接して位置する方眼紙の用紙を有する。方眼紙の画像は、本のページの辺りに浮かぶカメラにより捕捉され得る。次いで、本の曲面が、検出された格子からモデル化され得、補正されていない格子と補正された格子との間のマッピング関係が、導出され得る。本が静止したままである状態で、方眼紙は静かに移動することができ、次いで、本のページ画像が捕捉され得、本の湾曲したページが、格子マッピング関係に従って本の平らなページにマッピングされ得る。この方法の欠点は、毎回本のページ上に方眼紙の用紙を置くことがユーザにとって極めて不便であることにある。
【0005】
多数の内容に依存した方法は、本の異なるページ内容に基づき利用可能であり、通常は、例えば、連続ラインマージンスケルトン、単語に基づくスキュー補正、テキストラインに基づく書籍湾曲部抽出、及びテキストライン隆線抽出等がある。これらの方法は、長いテキストラインが本のページに含まれると仮定しているので、適用範囲が限られている。しかし、多くの本画像のページには、長いテキストは含まれず、ピクチャしか含まれないことがある。
【発明の概要】
【発明が解決しようとする課題】
【0006】
上記の問題を鑑み、本発明の実施形態は、本の上下の輪郭線に基づき本のページの曲面を補正する方法を提供する。この方法は、内容に依存しない補正方法に属する。
【課題を解決するための手段】
【0007】
本発明の実施形態に従って、画像装置によって取得された2次元画像における曲面上で消失点を取得し、前記曲面上の特定の単位における幅によって前記曲面の上輪郭線及び下輪郭線のうち長い方と前記消失点との間の全ての直線を取り出し、該直線は互いに隣接し且つ前記消失点で交わり、交差する前記直線が平行な直線になるように前記曲面の透視歪みを除去し、前記上輪郭線と前記下輪郭線との間の直線の直線セグメントの長さを取得し、該長さに従って3次元空間における前記直線セグメントの夫々の正確な幅及び前記直線セグメントの奥行き増分を取得し、前記正確な幅及び前記奥行き増分に従って前記直線セグメントの夫々の拡大された幅を取得し、前記曲面を平面に変換するために、前記直線セグメントの全ての拡大された幅を前記曲面の全体的な拡大された幅へと総計し、前記曲面上の点と前記平面上の点との間の対応関係に従って前記曲面上の画像コンテンツを前記平面上に変換する画像処理方法が提供される。
【0008】
本発明の他の実施形態に従って、画像装置によって取得された2次元画像における曲面上で消失点を取得するよう構成される消失点取得手段と、前記曲面上の特定の単位における幅によって前記曲面の上輪郭線及び下輪郭線のうち長い方と前記消失点との間の全ての直線を取り出すよう構成され、該直線は互いに隣接し且つ前記消失点で交わる取出手段と、交差する前記直線が平行な直線になるように前記曲面の透視歪みを除去するよう構成される透視歪み除去手段と、前記上輪郭線と前記下輪郭線との間の直線の直線セグメントの長さを取得し、該長さに従って3次元空間における前記直線セグメントの夫々の正確な幅及び前記直線セグメントの奥行き増分を取得し、前記正確な幅及び前記奥行き増分に従って前記直線セグメントの夫々の拡大された幅を取得し、前記曲面を平面に変換するために前記直線セグメントの全ての拡大された幅を前記曲面の全体的な拡大された幅へと総計するよう構成される拡大幅取得手段と、前記曲面上の点と前記平面上の点との間の対応関係に従って前記曲面上の画像コンテンツを前記平面上に変換するよう構成される画像変換手段とを有する画像処理装置が提供される。
【0009】
本発明の他の実施形態に従って、本発明の実施形態に従う上記の画像処理装置を有するスキャナが提供される。
【0010】
本発明の実施形態に従って、さらに、機械によって読み出されて実行される場合に本発明に従う上記の画像処理方法を実行する機械読み出し可能な命令コードを記憶したプログラムプロダクトが提供される。
【0011】
本発明の実施形態に従って、さらに、機械によって読み出されて実行される場合に本発明に従う上記の画像処理方法を実行する機械読み出し可能な命令コードを坦持した記憶媒体が提供される。
【発明の効果】
【0012】
本発明の実施形態に従う上記の画像処理技術によれば、本の歪んだページにおける歪みが、本のページ画像の他のその後の処理(例えば、画像認識)の円滑な実行を容易にするよう都合よく除去され得る。
【図面の簡単な説明】
【0013】
【図1】非接触式スキャナによりスキャンされた本の画像の例及びその3次元モデルを表す。
【図2】本発明の実施形態に従って本の湾曲したページによる歪みを補正して、最終的に本のページの内容をレイアウトする処理のフローチャートである。
【図3】本発明の実施形態に従う画像処理方法における3つのおおまかなステップの概略図を表す。
【図4】直線セグメントの拡大された幅を取得する概略図である。
【図5】原画像の内容を歪み補正画像に変換する場合のマッピング変換の概略図である。
【図6】補正されていない画像と補整された画像との間の比較を説明する概略図である。
【図7】本発明の他の実施形態に従う画像処理装置の構成ブロック図を表す。
【図8】本発明の実施形態に従う画像処理方法が具現され得る汎用コンピュータシステムの全体的な構造図を表す。
【発明を実施するための形態】
【0014】
本発明の上記の及び他の目的、特徴及び利点は、図面に関連して本発明の実施形態に関して以下で与えられる詳細な説明から、より明らかになるであろう。図面において、構成要素は実寸通りではなく、単に、本発明の原理を説明することを目的としている。本発明の幾つかの態様に関する説明の便宜上、図面における対応する構成要素は拡大されていることがある。すなわち、それらは、本発明に従って実際に製造される装置における他の構成要素に比較して大きくなっていることがある。図面において、同じ又は類似する技術的特徴又は構成要素は、同じ又は類似する参照符号により表記される。
【0015】
本発明の実施形態は、図面を参照して以下で記載される。図面又は本発明の実施形態において記載される要素及び特徴は、1又はそれ以上の他の図面又は実施形態において表される要素及び特徴と組み合わされてよい。当然のことながら、本発明にとって無関係であり且つ当業者によく知られている構成要素及び処理についての表示及び記載は、明りょうさのために、図面及び明細書において省略されている。
【0016】
図2は、本発明の実施形態に従う画像処理方法の全体的なフローチャートを表す。図2に表されるように、画像処理方法200はS210から始まり、その後に、画像装置によって取得された2次元画像における曲面上で消失点を取得するステップ(S220)と、曲面上の特定の単位における幅によって曲面の上輪郭線及び下輪郭線のうち長い方と消失点との間の、互いに隣接し且つ消失点で交わる全ての直線を取り出すステップ(S230)と、交差する直線が平行な直線になるように曲面の透視歪みを除去するステップ(S240)と、上輪郭線と下輪郭線との間の直線の直線セグメントの長さを取得し、その長さに従って3次元空間における直線セグメントの夫々の正確な幅及び直線セグメントの奥行き増分を取得するステップ(S250)と、正確な幅及び奥行き増分に従って直線セグメントの夫々の拡大された幅を取得するステップ(S260)と、曲面を平面に変換するために直線セグメントの全ての拡大された幅を曲面の全体的な拡大された幅へと総計するステップ(S270)と、曲面上の点と平面上の点との間の対応関係に従って曲面上の画像コンテンツを平面上に変換するステップ(S280)とを有する。次いで、処理は終了する(S290)。
【0017】
本のページ曲面を補正する処理は、本発明の実施形態に従う上記の画像処理方法の例として、夫々の図面を参照して以下で詳述される。
【0018】
図1(b)に表されるような本のページの曲面の簡単な3次元モデルが、本発明の例となる処理において利用される。開いた本のページの曲面は、3次元空間において多数の平行線から成る円筒の形をしているとする。全ての線は、画像の2次元空間における共通の交差点、すなわち、消失点(vanishing point)を有する。図1(b)から明らかなように、本のページの曲面は、本の表面に対する画像装置の角度による透視歪みと、湾曲により生ずる幾何学歪みとにさらされている。
【0019】
最初に、図2における方法200のS220で消失点を取得する具体例が記載される。図1(b)を参照すると、本の2ページは、2ページの6つの制御点(すなわち、本の2頁の4つの端点1、3、4及び6並びに本の中心線の2つの端点2及び5)から計算される消失点を共有することができる。あるいは、本のページの夫々は、そのページの4つの制御点(左ページについては1、2、4及び5、右ページについては2、3、5及び6)から別々に計算される消失点を別々に有する。2ページが消失点を共有することができる場合において、図1(b)に表されている3本の直線が1つの点で交差しないならば、3本の線の交差点は、例えば、最小二乗法において取得され得る。消失点を取得する方法は、制御点に従って消失点を取得することを含むが、それに限られない。いかにして制御点を取得すべきかは、本発明にとって全く無関係ではないが、先行技術において知られており、従って、その繰り返しとなる記載はここでは省略される。
【0020】
次に、図2の方法200におけるS230の処理の具体例が記載される。この実例において、消失点と本のページの下輪郭線上の全ての点との間の直線が取り出される。ここで、下輪郭線は上輪郭線よりも長いとされるが、上輪郭線の方が長い場合、消失点は図1(b)において下輪郭線の下に位置し、このとき、消失点と本のページの上輪郭線上の全ての点との間の直線が取り出される。そして、それらの直線は互いに隣接し、3次元画像において平行である。よって、必要とされる直線セグメントは、図1(b)の本のページ内に破線により表されるように、上輪郭線上にあるそれらの開始端点及び下輪郭線上にある終結端点を有して取得される。直線セグメントの幅は、実際には精度要求に依存して、1ピクセルであるか、又は1ピクセルよりも小さくても若しくは大きくてもよい。ここで、取出処理は1ピクセルの単位で実行されるとする。
【0021】
図2の方法200のS240で、透視歪みが除去されて、本のページの曲面上の全ての交差する直線セグメントを平行な直線セグメントに変換する。ここで、透視歪みは、例えば平面射影変換行列(homography matrix)において、除去され得る。いかにして平面射影変換行列を解いて透視歪みを除去するのかの詳細については、インドのハイデラーバードにあるInternational Information Technology AssociationのVisual Information Technology Centerに属するL.Jagannathan及びC.V.Jawaharより著された“Perspective Correction Methods for Camera-Based Document Analysis”と、R.Harley及びA.Zissermanによって著され、2000年にケンブリッジ大学出版局によって出版された“Multiple View Geometry in Computer Vision”とを参照することができる。透視歪みを除去された画像は、図3(b)において表されているとおりである。上述されたように、本のページが画像を捕捉するよう位置付けられる平面に対して垂直に画像装置が配置される場合、そのような透視歪みは存在せず、従って、透視歪みを除去するステップは省略される。
【0022】
図3において表されているように、幾何学歪みは、透視歪みが除去された本のページ画像から除去される。
【0023】
図2に戻り、全ての平行な直線セグメントの長さlength(x)(すなわち、撮像された長さ)、正確な幅dx及び奥行き増分dzは、方法200のS250で計算される。ここで、iは、直線セグメントのインデックスを表し、1からmまでのいずれかの数であり(mは、直線セグメントの数を表す。)、xは、直線セグメントiの横座標である。特に、座標系は次のように配置され得る。図3(b)に表される本のページ画像において、横座標は水平方向であり、縦座標は垂直方向であり、座標の原点は本の中心線の下側端点又は必要に応じてどこかに配置され得る。
【0024】
長さ、正確な幅及び奥行き増分を求める例は夫々、以下で記載される。
【0025】
直線セグメントiの長さlength(x)は、次のように、上輪郭線及び下輪郭線との直線セグメントの交点の座標から求められ得る:
【数2】

【0026】
全ての直線セグメントの正確な長さ(すなわち、3次元空間におけるそれらの長さ)は同じである(本のページの全ての列は同じ高さである。)が、直線セグメントの撮像された長さは、本の湾曲したページにより同じでないことがある。直線セグメントが画像装置(本実施形態ではスキャナ)に近ければ近いほど、その撮像される長さは長くなりうる。従って、直線セグメントの撮像された長さは、画像装置に対するそれらの距離に反比例する。
【0027】
正確な幅dxに関し、取り出される直線セグメントの幅は、図3(b)の本の中間ページ(透視歪みが除去された本のページ)においては1ピクセルであるが、各直線セグメントは、異なる奥行きで観測される(ここでは、奥行きは、レンズの焦点からその直線セグメントまでの距離である。)。本のページが同じ奥行きで観測される場合、水平方向におけるそれらの投影はその時点で観測され、観測される幅は正確な幅dxと称される。撮像される幅が同じである場合、正確な幅は、画像装置までの直線セグメントの距離が短いほど狭くなり、反対に、画像装置までの直線セグメントの距離が長いほど広くなる。従って、直線セグメントの正確な幅は、撮像距離に比例し、直線セグメントの撮像される長さに反比例する。その場合に、直線セグメントiの正確な幅は、次のとおりである:
【数3】

【0028】
ここで、Cは定数を表す。補正された画像において最も長い直線セグメントの正確な幅が1ピクセルと定義される場合(すなわち、C=Max(length(x)))、残りの直線セグメントの全ての正確な幅は1ピクセルよりも長い。ここで、Cの値は、実際上必要に応じて選択されても、又は経験的に決定されてもよいが、上記の例に限られない。
【0029】
奥行き増分dzに関し、2つの隣接する直線セグメントの撮像距離(すなわち、レンズの焦点までのそれらの距離)は異なってよい。上述されたように、直線セグメントの距離がレンズの焦点に対して長ければ長いほど、撮像される直線セグメントの長さは短くなる。従って、直線セグメントの撮像距離は、次のように、直線セグメントの撮像される長さに反比例する:
【数4】

【0030】
ここで、C=k×Cは定数を表し、kは、実際上必要に応じて、例えば画像装置の関連パラメータから、決定され得る一定の係数を表す。
【0031】
撮像距離間の差は奥行き増分と称される。これにより、直線セグメントiの奥行き増分は、次のとおりである:
【数5】

【0032】
奥行き増分を決定する方法はそれに限らない。例えば、直線セグメントiの奥行き増分は、画像装置のレンズの焦点までの長さ方向におけるその2つの辺の距離の間の差であってよい。
【0033】
次に、平行な直線セグメントの拡大された幅が、図2における方法200のS260で、正確な幅dx及び奥行き増分dzから計算される。拡大された幅は、本表面が平らであるよう広げられる場合の幅である。拡大された幅dsを計算する処理の具体例は、図4を参照して以下で詳述される。
【0034】
図4において、x軸は、図3(b)に表されるように水平方向を表し、z軸は、図3(b)に表されるように本のページ画像から観測者への方向を表し、直線セグメントiの拡大された幅dsは、正確な幅dxi及び奥行き増分dziとともに直角三角形を構成する。次の式は、ピタゴラスの定理から導出され得る:
【数6】

【0035】
次いで、本の湾曲したページの全体の拡大された幅が、図2における方法200のS270で、夫々の直線セグメントの拡大された幅から求められる。本の湾曲したページの全体の拡大された幅は、平行な直線セグメントの曲面幅の累積合計に等しい(すなわち、S=sum ds(i=1,2,・・・m))。よって、平らにされた本の実際の幅は、図3(c)に表されるように本の表面を平らにさせるよう、求められる。
【0036】
上記の処理において用いられる本のページの上輪郭線及び下輪郭線は、自動で又は半自動で位置付けられ得るので、この補正方法を扱うことは、ユーザにとって極めて容易である。
【0037】
次に、本の原ページにおける内容(以降、入力画像)が、図2における方法200のS280で、本の補正されたページ(以降、出力画像)に変換される。
【0038】
この変換処理の具体例は、図5を参照して以下で詳述される。ここで、変換処理は、「補正マッピング変換」と称される。最初に、入力画像における対応する縦線セグメント(点(x’,y’)及び点(x’,y’)によって定義される線セグメント)が、出力画像における縦列(点(x,y)及び点(x,y)によって定義される直線セグメント)に関して位置付けられる。図5を参照すると、次の関係が、対応する縦列と縦線セグメントとの間で満足される。すなわち、右側の図における幅の比r=x/Wは、左側の図における拡大された幅の比r’=S(x’)/S(x’)に等しい。ここで:
【数7】



【0039】
左側の図における対応する縦線セグメントは、この比例関係に従って位置付けられ得る。
【0040】
縦線セグメント上の対応する点は、縦列上の夫々の点について位置付けられる。対応する点を位置付ける処理の例は、以下で記載される。右側の図の縦列((x,y)及び(x,y)によって定義される縦列)上の各ピクセル点(x,y)に対応する左側の図の縦線セグメント上の点は、次の式において計算され得る:
【数8】

【0041】
ここで、aは、消失点に関連する一定の係数を表し、b及びcは、消失点及び平面上の横座標xに関連する一定の係数を表し、実験的又は経験的に導出され得る。左側の図における全ての縦線セグメントが消失点(x’vanish,y’vanish)で交わり、縦列の消失点のy座標は∞であるとすると、y’vanish=(∞+c)/(a∞+b)=1/a及びa=1/y’vanishは式(6)において導出され得る。2次元平行線に関し、この消失点は無限に位置付けられてよく、その場合に、aは0の値をとり、残り2つの係数b及びcは、次の式の組を解くことによって導出され得る:
【数9】

【0042】
従って、y’座標は、y座標から計算され得、x’座標は、縦線セグメントに対する直線セグメントの比例関係、すなわち、x’=x’+(x’−X’)(y’−y’)/(y’−y’)に従って計算され得る。ここで、比例関係に従ってx’座標を計算するために用いられる点は、(x’,y’)及び(x’,y’)に限られず、計算される座標を有する如何なる点が使用されてもよい。このようにして、右側の図における縦列上の点(x,y)に対応する左側の図における縦線セグメント上の点の座標(x’,y’)が求められる。
【0043】
最後に、右側の図における点(x,y)のピクセル値は、双線形補間により左側の図における点(x’,y’)の隣接点のピクセル値から求められ、それにより、図3(c)に表されるように、本の平らにされたページの画像の内容を得ることができる。左側にある画像におけるいずれかの点のピクセル値を求める方法は双線形補間に限られず、右側の図における点(x,y)のピクセル値である限りは、双3次補間、B−スプライン補間、ガウス補間等の如何なる適切な補間方法であってもよい。
【0044】
要約すると、本発明の実施形態に従う画像処理方法において、本の湾曲したページの正確な幅が求められ、ページは本の平らなページに広げられる。単純に本のページ上の上輪郭又は下輪郭から推定される本の湾曲したページの拡大された幅は、本のページの湾曲部の実際の形状が輪郭の形状と同じでないので、正しくないことがある。本発明の実施形態に従う方法において、画像装置によって捕捉される画像における線セグメントの正確な拡大された長さは、それらの長さから推定され、本のページの拡大された幅に総計され、それにより、本の平らにされたページが得られる。本の平らにされたページが得られた後、原画像の内容は、元々捕捉された画像における曲面上の点を一対一対応で拡大された平面上の点に位置付けることによって、横になった平面に変換される。本の内容は本の実際の幅を有して提示されるので、本発明は、より良い視覚的な効果を与えることができる。さらに、もはやテキストライン又は他の内容情報は、内容に依存しない方法である当該方法において必要とされないので、より良い効果が、図6(a)〜(d)に表されるように、ピクチャ及びテキストの両方について達成され得る。
【0045】
本の元々撮像された画像の曲面と広げられた本の平面との間で対応する点を位置付けるマッピング処理と、それらの対応する点のピクセルを導出する補間処理とは、幾何学的歪みが除去された後に実行されなくてよい点に留意すべきである。図3に表されるように、マッピング処理及び補間処理は、透視歪みが除去された後に最初に実行され、次いで、透視歪みが除去された画像と、幾何学的歪みが除去された後に画像を平らにすることとの間で実行されてよい。
【0046】
撮像された本の面は、実施形態において一例として考えられてきたが、本発明の実施形態に従う画像処理方法はそれに限定されず、面が撮像時に曲げ歪みを有する限りあらゆる他の面の補正にも適用可能であってよい。
【0047】
本発明の実施形態に従う画像処理方法との対応において、本発明の実施形態は、図7に表されるような画像処理装置をさらに提供する。画像処理装置は:
画像装置によって取得された2次元画像における曲面上で消失点を取得するよう構成される消失点取得部710と、
曲面上の特定の単位における幅によって曲面の上輪郭線及び下輪郭線のうち長い方と消失点との間の全ての直線を取り出すよう構成され、直線は互いに隣接し且つ消失点で交わる取出部720と、
交差する直線が平行な直線になるように曲面の透視歪みを除去するよう構成される透視歪み除去部730と、
上輪郭線と下輪郭線との間の直線の直線セグメントの長さを取得し、その長さに従って3次元空間における夫々の直線セグメント正確な幅及び夫々の直線セグメントの奥行き増分を取得し、正確な幅及び奥行き増分に従って夫々の直線セグメントの拡大された幅を取得し、曲面を平面に変換するために全ての直線セグメントの拡大された幅を曲面の全体的な拡大された幅へと総計するよう構成される拡大幅取得部740と、
曲面上の点と平面上の点との間の対応関係に従って曲面上の画像コンテンツを平面上に変換するよう構成される画像変換部750と
を有する。
【0048】
本発明の実施形態に従う画像処理装置及び夫々の構成要素は、本発明に従う方法の実施形態における処理と同様の処理を実行するよう構成されてよく、従って、詳述されていない装置の実施形態におけるそれらの態様の詳細については、方法の実施形態における対応する説明が参照され得る点に留意すべきであり、その繰り返しとなる説明はここでは省略される。
【0049】
本発明の他の実施形態に従って、画像装置(例えば、スキャナ)は、上記の様々な画像処理機能を可能にするように本発明の実施形態に従う画像処理装置を装備され得る。
【0050】
上記の詳細な記載は、本発明の実施形態に従う方法及び/又は装置の様々な実施を説明するようブロック図、フローチャート及び/又は実施形態において提示されてきた。これらのブロック図、フローチャート及び/又は実施形態が1又はそれ以上の機能及び/又は動作を有する場合に、当業者には当然のことながら、それらのブロック図、フローチャート及び/又は実施形態における夫々の機能及び/又は動作が様々なハードウェア、ソフトウェア、ファームウェア又は原則的にそれらの組み合わせにおいて別々に及び/又は集合的に実行され得る。実施形態において、本明細書において記載される対象の幾つかの態様は、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、デジタル信号プロセッサ(DSP)又は他の集積形態において具現されてよい。なお、当業者には当然のことながら、本明細書において記載される実施の幾つかの態様は、1又はそれ以上のコンピュータにおいて実行される1又はそれ以上のコンピュータプログラムの形で(例えば、1又はそれ以上のコンピュータシステムにおいて実行される1又はそれ以上のコンピュータプログラムの形で)、1又はそれ以上のプロセッサで実行される1又はそれ以上のコンピュータプログラムの形で(例えば、1又はそれ以上のマイクロプロセッサにおいて実行される1又はそれ以上のコンピュータプログラムの形で)、ファームウェアの形で、又は同等に原則的にそれらのいずれかの組み合わせの形で、集積回路において全体的又は部分的に具現されてよく、当業者は、本明細書における開示に照らして、本開示の回路を設計し且つ/あるいは本開示のソフトウェア及び/又はファームウェアのコードを記述することができる。
【0051】
例えば、図2に表されるような、本の表面の曲げによる歪みを補正して、最終的に本の面上の内容を平らにさせるための処理のフローチャートにおける夫々のステップは、ソフトウェア、ファームウェア、ハードウェア又はそれらのいずれかの組み合わせにおいて実行されてよい。ソフトウェア又はハードウェアにおいて実行される場合に、プログラムを構成するプログラムは、記憶媒体又はネットワークから特殊化したハードウェア構造におけるコンピュータ(例えば、図8に表される汎用のコンピュータ800)にインストールされてよく、コンピュータは、様々なプログラムが自身にインストールされる場合に、様々な機能を実行することができる。
【0052】
図8は、本発明の実施形態に従う画像処理方法を実行する情報処理装置として機能することができる汎用のコンピュータシステムの全体的な構造図を表す。コンピュータシステム800は、単なる例示に過ぎず、本発明に従う方法及び装置の機能又は適用範囲の如何なる制限を提示しない。さらに、コンピュータシステム800は、例となるコンピュータシステム800において表されている構成要素のいずれか1つ又は組み合わせに依存し又はそれらを必要とすると解されるべきではない。
【0053】
図8において、中央演算処理装置(CPU)801は、読み出し信用メモリ(ROM)802に記憶されている又は記憶部808からランダムアクセスメモリ(RAM)803にロードされるプログラムに従って、様々な処理を実行する。RAM803には、CPU801が様々な処理を実行するときに必要とされるデータも必要に応じて記憶される。CPU801、ROM802及びRAM803は、バス804を介して互いに接続されている。バス804には、入出力インターフェース805も接続されている。
【0054】
次の構成要素も入出力インターフェース805に接続されている。すなわち、入力部806(キーボード、マウス等を含む。)、出力部807(ディスプレイ(例えば、陰極線管(CRT)、液晶ディスプレイ(LCD)等)、スピーカ等を含む。)、記憶部808(ハードディスク等を含む。)、及び通信部809(ネットワークインターフェースカード(例えば、LANカード)、モデム等を含む。)である。通信部809は、ネットワーク(例えば、インターネット)を介して通信処理を実行する。ドライブ810も必要に応じて入出力インターフェース805に接続される。リムーバブル媒体811(例えば、磁気ディスク、光ディスク、光学磁気ディスク、半導体メモリ等)が必要に応じてドライブ810にインストールされてよく、それにより、媒体811からフェッチされたコンピュータプログラムが記憶部808にインストールされ得る。
【0055】
上記の一連の処理がソフトウェアにおいて実行される場合に、ソフトウェアを構成するプログラムは、ネットワーク(例えば、インターネット等)又は記憶媒体(例えば、リムーバブル媒体811)からインストールされる。
【0056】
当業者には当然のことながら、そのような記憶媒体は、プログラムが記憶されており、ユーザにプログラムを提供するよう装置とは別に配布される図8に表されるようなリムーバブル媒体811に限られない。リムーバブル媒体811の例には、磁気ディスク(フロッピー(登録商標)ディスクを含む。)、光ディスク(コンパクトディスク読出専用メモリ(CD−ROM)及びデジタル・バーサタイル・ディスク(DVD)を含む。)、光学磁気ディスク(ミニディスク(MD)(登録商標)を含む。)及び半導体メモリがある。代替的に、記憶媒体は、プログラムが記憶されており、その記憶媒体を含む装置とともにユーザに配布されるROM802、記憶部808に含まれるハードディスク等であってよい。
【0057】
従って、本発明は、機械によって読み出されて実行される場合に本発明の実施形態に従う上記の画像処理方法を実行することができる機械読み出し可能な命令コードを記憶するプログラムプロダクトをさらに提案する。これに対して、プログラムプロダクトが具現される上記の様々な記憶媒体も本発明の適用範囲内にある。
【0058】
本発明の実施形態の上記の説明において、実施形態において記載及び/又は図示される特徴は、他の実施形態における特徴と組み合わせて又はそれに代えて、1又はそれ以上の他の実施形態において全く同じに又は同様に使用されてよい。
【0059】
本願で使用される語「有する」及びその活用形は、特徴、要素、ステップ又はコンポーネントの存在に言及するが、1又はそれ以上の他の特徴、要素、ステップ又はコンポーネントの存在又は付加を除外しない点に留意すべきである。序数に関連する語「第1」、「第2」等は、それらの語を用いて定義される特徴、要素、ステップ又はコンポーネントのいかなる実行順序も又は如何なる重要度も意味せず、単に、記載の明りょうさのためにそれらの特徴、要素、ステップ又はコンポーネントを特定することを目的とする。
【0060】
さらに、本発明の夫々の実施形態に従う方法は、明細書において記載される又は図面において図示される自警例において実行されることに限られず、他の時系列において連続して又は別々に実行されてもよい。従って、明細書において記載される、方法が実行される順序は、本発明の適用範囲を制限しない。
【0061】
また、以下の付記が、上記の実施形態に関連して開示される。
【0062】
(付記1)
画像装置によって取得された2次元画像における曲面上で消失点を取得し、
前記曲面上の特定の単位における幅によって前記曲面の上輪郭線及び下輪郭線のうち長い方と前記消失点との間の全ての直線を取り出し、該直線は互いに隣接し且つ前記消失点で交わり、
交差する前記直線が平行な直線になるように前記曲面の透視歪みを除去し、
前記上輪郭線と前記下輪郭線との間の直線の直線セグメントの長さを取得し、該長さに従って3次元空間における前記直線セグメントの夫々の正確な幅及び前記直線セグメントの奥行き増分を取得し、
前記正確な幅及び前記奥行き増分に従って前記直線セグメントの夫々の拡大された幅を取得し、
前記曲面を平面に変換するために、前記直線セグメントの全ての拡大された幅を前記曲面の全体的な拡大された幅へと総計し、
前記曲面上の点と前記平面上の点との間の対応関係に従って前記曲面上の画像コンテンツを前記平面上に変換する
画像処理方法。
【0063】
(付記2)
前記直線セグメントの夫々の拡大された幅を取得することは、前記正確な幅及び前記奥行き増分の二乗和を取得して、該二乗和について平方根を取得することによって、前記直線セグメントの夫々の拡大された幅を取得することを含む、
付記1に記載の画像処理方法。
【0064】
(付記3)
前記平面上の点と前記曲面上の対応する点との間の対応関係は、
【数10】


により表され、
は、前記直線セグメントの消失点に関連する定数を表し、b及びcは、前記直線セグメントの消失点及びxに関連する定数を表し、x及びyは夫々、前記平面上の点の横座標及び縦座標であり、x’及びy’は夫々、前記曲面上の対応する点の横座標及び縦座標であり、x’、y’及びx’、y’は夫々、前記平面上で座標(x,y)がある直線セグメントに対応する前記曲面上の直線セグメントにおけるいずれかの点の横座標及び縦座標である、
付記1又は2に記載の画像処理方法。
【0065】
(付記4)
前記奥行き増分は、直線セグメントから前記画像装置のレンズの焦点までの距離と、該直線セグメントに隣接する直線セグメントから前記画像装置の前記レンズの焦点までの距離との間の差である、
付記1乃至3のうちいずれか一つに記載の画像処理方法。
【0066】
(付記5)
前記奥行き増分は、長さ方向における直線セグメントの2つの辺から前記画像装置のレンズの焦点までの距離の間の差である、
付記1乃至3のうちいずれか一つに記載の画像処理方法。
【0067】
(付記6)
前記消失点は、前記曲面の前記上輪郭線及び前記下輪郭線における端点から得られる、
付記1乃至5のうちいずれか一つに記載の画像処理方法。
【0068】
(付記7)
前記曲面は、前記画像装置によって取得された2次元画像の形をとる本の面である、
付記1乃至6のうちいずれか一つに記載の画像処理方法。
【0069】
(付記8)
画像装置によって取得された2次元画像における曲面上で消失点を取得するよう構成される消失点取得手段と、
前記曲面上の特定の単位における幅によって前記曲面の上輪郭線及び下輪郭線のうち長い方と前記消失点との間の全ての直線を取り出すよう構成され、該直線は互いに隣接し且つ前記消失点で交わる取出手段と、
交差する前記直線が平行な直線になるように前記曲面の透視歪みを除去するよう構成される透視歪み除去手段と、
前記上輪郭線と前記下輪郭線との間の直線の直線セグメントの長さを取得し、該長さに従って3次元空間における前記直線セグメントの夫々の正確な幅及び前記直線セグメントの奥行き増分を取得し、前記正確な幅及び前記奥行き増分に従って前記直線セグメントの夫々の拡大された幅を取得し、前記曲面を平面に変換するために前記直線セグメントの全ての拡大された幅を前記曲面の全体的な拡大された幅へと総計するよう構成される拡大幅取得手段と、
前記曲面上の点と前記平面上の点との間の対応関係に従って前記曲面上の画像コンテンツを前記平面上に変換するよう構成される画像変換手段と
を有する、画像処理装置。
【0070】
(付記9)
前記拡大幅取得手段は、前記正確な幅及び前記奥行き増分の二乗和を取得して、該二乗和について平方根を取得することによって、前記直線セグメントの夫々の拡大された幅を取得するよう構成される、
付記8に記載の画像処理装置。
【0071】
(付記10)
前記平面上の点と前記曲面上の対応する点との間の対応関係は、
【数11】

により表され、
は、前記直線セグメントの消失点に関連する定数を表し、b及びcは、前記直線セグメントの消失点及びxに関連する定数を表し、x及びyは夫々、前記平面上の点の横座標及び縦座標であり、x’及びy’は夫々、前記曲面上の対応する点の横座標及び縦座標であり、x’、y’及びx’、y’は夫々、前記平面上で座標(x,y)がある直線セグメントに対応する前記曲面上の直線セグメントにおけるいずれかの点の横座標及び縦座標である、
付記8又は9に記載の画像処理装置。
【0072】
(付記11)
前記奥行き増分は、直線セグメントから前記画像装置のレンズの焦点までの距離と、該直線セグメントに隣接する直線セグメントから前記画像装置の前記レンズの焦点までの距離との間の差である、
付記8乃至10のうちいずれか一つに記載の画像処理装置。
【0073】
(付記12)
前記奥行き増分は、長さ方向における直線セグメントの2つの辺から前記画像装置のレンズの焦点までの距離の間の差である、
付記8乃至10のうちいずれか一つに記載の画像処理装置。
【0074】
(付記13)
前記消失点取得手段は、前記曲面の前記上輪郭線及び前記下輪郭線における端点から前記消失点を取得する、
付記8乃至12のうちいずれか一つに記載の画像処理装置。
【0075】
(付記14)
前記曲面は、前記画像装置によって取得された2次元画像の形をとる本の面である、
付記8乃至13のうちいずれか一つに記載の画像処理装置。
【0076】
(付記15)
付記8乃至14のうちいずれか一つに記載の画像処理装置を有するスキャナ。
【0077】
(付記16)
コンピュータで実行されると付記1乃至7のうちいずれか一つに記載の画像処理方法を実行するコンピュータプログラム。
【0078】
(付記17)
コンピュータで実行されると付記1乃至7のうちいずれか一つに記載の画像処理方法を実行するコンピュータプログラムを記憶する記憶媒体。
【0079】
本発明は、本発明の実施形態の説明において先に開示されてきたが、当然のことながら、当業者は、本発明の主旨及び適用範囲から逸脱することなしに本発明に対して様々な変形、適応又は均等なものに想到可能である。それらの変形、適応又は均等なものも本発明の適用範囲内にあると解されるべきである。
【符号の説明】
【0080】
200 画像処理方法
710 消失点取得部
720 取出部
730 透視歪み除去部
740 拡大幅取得部
750 画像変換部
800 コンピュータシステム
801 CPU
802 ROM
803 RAM
804 バス
805 入出力インターフェース
806 入力部
807 出力部
808 記憶部
809 通信部
810 ドライブ
811 リムーバブル媒体

【特許請求の範囲】
【請求項1】
画像装置によって取得された2次元画像における曲面上で消失点を取得し、
前記曲面上の特定の単位における幅によって前記曲面の上輪郭線及び下輪郭線のうち長い方と前記消失点との間の全ての直線を取り出し、該直線は互いに隣接し且つ前記消失点で交わり、
交差する前記直線が平行な直線になるように前記曲面の透視歪みを除去し、
前記上輪郭線と前記下輪郭線との間の直線の直線セグメントの長さを取得し、該長さに従って3次元空間における前記直線セグメントの夫々の正確な幅及び前記直線セグメントの奥行き増分を取得し、
前記正確な幅及び前記奥行き増分に従って前記直線セグメントの夫々の拡大された幅を取得し、
前記曲面を平面に変換するために、前記直線セグメントの全ての拡大された幅を前記曲面の全体的な拡大された幅へと総計し、
前記曲面上の点と前記平面上の点との間の対応関係に従って前記曲面上の画像コンテンツを前記平面上に変換する
画像処理方法。
【請求項2】
前記直線セグメントの夫々の拡大された幅を取得することは、前記正確な幅及び前記奥行き増分の二乗和を取得して、該二乗和について平方根を取得することによって、前記直線セグメントの夫々の拡大された幅を取得することを含む、
請求項1に記載の画像処理方法。
【請求項3】
前記平面上の点と前記曲面上の対応する点との間の対応関係は、
【数1】

により表され、
は、前記直線セグメントの消失点に関連する定数を表し、b及びcは、前記直線セグメントの消失点及びxに関連する定数を表し、x及びyは夫々、前記平面上の点の横座標及び縦座標であり、x’及びy’は夫々、前記曲面上の対応する点の横座標及び縦座標であり、x’、y’及びx’、y’は夫々、前記平面上で座標(x,y)がある直線セグメントに対応する前記曲面上の直線セグメントにおけるいずれかの点の横座標及び縦座標である、
請求項1又は2に記載の画像処理方法。
【請求項4】
前記奥行き増分は、直線セグメントから前記画像装置のレンズの焦点までの距離と、該直線セグメントに隣接する直線セグメントから前記画像装置の前記レンズの焦点までの距離との間の差である、
請求項1乃至3のうちいずれか一項に記載の画像処理方法。
【請求項5】
前記奥行き増分は、長さ方向における直線セグメントの2つの辺から前記画像装置のレンズの焦点までの距離の間の差である、
請求項1乃至3のうちいずれか一項に記載の画像処理方法。
【請求項6】
前記消失点は、前記曲面の前記上輪郭線及び前記下輪郭線における端点から得られる、
請求項1乃至5のうちいずれか一項に記載の画像処理方法。
【請求項7】
前記曲面は、前記画像装置によって取得された2次元画像の形をとる本の面である、
請求項1乃至6のうちいずれか一項に記載の画像処理方法。
【請求項8】
画像装置によって取得された2次元画像における曲面上で消失点を取得するよう構成される消失点取得手段と、
前記曲面上の特定の単位における幅によって前記曲面の上輪郭線及び下輪郭線のうち長い方と前記消失点との間の全ての直線を取り出すよう構成され、該直線は互いに隣接し且つ前記消失点で交わる取出手段と、
交差する前記直線が平行な直線になるように前記曲面の透視歪みを除去するよう構成される透視歪み除去手段と、
前記上輪郭線と前記下輪郭線との間の直線の直線セグメントの長さを取得し、該長さに従って3次元空間における前記直線セグメントの夫々の正確な幅及び前記直線セグメントの奥行き増分を取得し、前記正確な幅及び前記奥行き増分に従って前記直線セグメントの夫々の拡大された幅を取得し、前記曲面を平面に変換するために前記直線セグメントの全ての拡大された幅を前記曲面の全体的な拡大された幅へと総計するよう構成される拡大幅取得手段と、
前記曲面上の点と前記平面上の点との間の対応関係に従って前記曲面上の画像コンテンツを前記平面上に変換するよう構成される画像変換手段と
を有する、画像処理装置。
【請求項9】
請求項8に記載の画像処理装置を有するスキャナ。
【請求項10】
コンピュータで実行されると請求項1乃至7のうちいずれか一項に記載の画像処理方法を実行するコンピュータプログラム。

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図7】
image rotate

【図8】
image rotate

【図1】
image rotate

【図6】
image rotate


【公開番号】特開2013−4088(P2013−4088A)
【公開日】平成25年1月7日(2013.1.7)
【国際特許分類】
【出願番号】特願2012−131791(P2012−131791)
【出願日】平成24年6月11日(2012.6.11)
【出願人】(000005223)富士通株式会社 (25,993)
【Fターム(参考)】