説明

輪郭情報生成方法及びシステム、並びにプログラム

【課題】画像内に存在する対象物の輪郭を効率よく、確実に抽出する。
【解決手段】入力した点と入力ポインタの間を一定の太さを有するラバーバンドが表示され、入力する線分を該ラバーバンド内に入れるように点を入力させる。これによりオペレータは入力ポインタの位置を精密に決めて入力決定を行うという手間を省くことができ効率よく入力を行うことができる。しかし、入力した線分をそのまま表示させては正確さに欠ける輪郭が生成されてしまう。そこで入力した線分を画像に合わせて補正する処理を行うことにより画像に撮像されている地物に合った輪郭を生成することができる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、輪郭情報生成方法及びシステム、並びにプログラムに関し、例えば、高空から撮影した画像から、画像内に撮像されている線分で構成された地物の輪郭を抽出する方法に関するものである。
【背景技術】
【0002】
近年、インターネット上での電子地図サービスやカーナビの発展により電子地図の需要が急激に伸びている。しかし、電子地図は作成や更新を行うのに非常に多大な工数を要する。
【0003】
それを解決する方法として、航空写真や衛星画像など高空から撮影した画像から自動的に地図の構成物である地物を抽出する技術が研究されている。例えば、特許文献1では、画像上に建物内の1点を入力することにより建物の形状を抽出するプログラムが提案されている。
【0004】
また、オペレータによる手作業の入力を行う場合は、その入力補助手段として特許文献2に示すようなラバーバンドを表示させるのは広く一般的に使用されている。
【0005】
【特許文献1】特開2004−341422号公報
【特許文献2】特開平7−168552号公報
【発明の開示】
【発明が解決しようとする課題】
【0006】
しかしながら、特許文献1にあるような画像から自動的に地物の輪郭形状を抽出する技術は、現在のところ実用的なレベルにはいたっていない。なぜならば、空中写真は撮影状況や撮影された地物の状態が異なると、設定するパラメータをその都度変更する必要が生じ、そもそも抽出が困難な場合があるためである。
【0007】
従って、未だにオペレータによる手作業の入力が一般的である。オペレータによる地物の輪郭入力において、オペレータは輪郭の接点、つまり線分と線分が交差する部分を目標に点を入力していくわけであるが、正確に入力するには次のような作業が必要となる。つまり、図1に示されるように、空中写真に撮像されている建物100の輪郭をトレースする場合、まず描き始めの始点を決めるのに線分101と線分102の交点と思われる点104を認識する必要がある。はっきり交点が認識できる場合もあるが線分101と線分102の交わる部分がはっきりしない場合も多々ありその場合は始点の決定に時間を要してしまう。点104を入力した後、入力ポインタ107の動きに従い特許文献2に示すようなラバーバンド106が追随するが、このラバーバンドを線分102にあわせつつ、終点の線分102と線分103の交点と思われる点105を入力しなくてはならない。
【0008】
以上のように、正確に入力するには効率を落とさざるを得ないという問題、さらに図形の正確さがオペレータによって異なってしまうという問題がある。
【0009】
本発明はこのような状況に鑑みてなされたものであり、正確な線分の始点と終点の座標情報を入力する必要がなく、効率よくかつ正確に、輪郭を構成する線分を抽出することのできる方法を提供するものである。
【課題を解決するための手段】
【0010】
上記目的を達成するために、本発明では、入力した点と入力ポインタの間を一定の太さを有するラバーバンドが表示され、入力する線分を該ラバーバンド内に入れるように点を入力させる。これによりオペレータは入力ポインタの位置を精密に決めて入力決定を行うという手間を省くことができ効率よく入力を行うことができる。しかし、入力した線分をそのまま表示させては正確さに欠ける輪郭が生成されてしまう。そこで、入力した線分を画像に合わせて補正する処理を行うことにより画像に撮像されている対象物に合った輪郭を生成する。
【0011】
即ち、本発明による輪郭情報生成方法は、情報処理装置を用いて、画像内に存在する対象物の輪郭情報を生成する輪郭情報生成方法であって、入力された始点と終点で構成される線分を含む所定の範囲内の複数の線分を、輪郭構成線分候補として生成するステップと、輪郭構成線分候補としての前記複数の線分のうち、エッジ強度値が最も高い線分を輪郭構成線分として抽出するステップと、を備え、輪郭構成線分を用いて対象物の輪郭情報生成することを特徴とする。
【0012】
上述の生成するステップでは、始点と終点の入力に対応して、始点と終点で構成される線分を含み、この線分の法線方向に一定の幅を有するラバーバンドを表示部に表示し、ラバーバンドの範囲内の複数の線分を、輪郭構成線分候補とする。
【0013】
また、上述の抽出するステップでは、輪郭構成線分候補となる複数の線分のそれぞれについて、線分が通過する画像上の画素に対して勾配ベクトルを計算し、勾配ベクトルを計算した線分の法線ベクトルと勾配ベクトルとの内積から線分の法線方向へのエッジ強度値を計算し、このエッジ強度値が最も高い線分を輪郭構成線分として確定する。
【0014】
さらなる本発明の特徴は、以下本発明を実施するための最良の形態および添付図面によって明らかになるものである。
【発明の効果】
【0015】
本発明によれば、オペレータによる画像からの地物の輪郭入力作業において効率よく輪郭を抽出できるだけでなく、画像に撮像されている地物に合った輪郭を正確に抽出することが可能となる。
【発明を実施するための最良の形態】
【0016】
以下、添付図面を参照して本発明の実施形態について説明する。ただし、本実施形態は本発明を実現するための一例に過ぎず、本発明の技術的範囲を限定するものではないことに注意すべきである。また、各図において共通の構成については同一の参照番号が付されている。
【0017】
<地物輪郭生成システムの構成>
図2は、本発明の実施形態に係る地物輪郭生成システムの概略構成を示す図である。地物輪郭生成システム20は、輪郭情報を生成する情報処理装置100と、輪郭情報生成過程の線分情報や生成された輪郭情報を表示するモニタ206と、を備えている。
【0018】
情報処理装置200は、記憶装置201を有し、そこには画像データ202及び各画素の画素値ベクトルデータ203が格納されている。情報処理装置200が画像データ202及び画素値ベクトルデータ203を重ね合わせることにより、モニタ206に地物の情報を映し出すことができる。
【0019】
情報処理装置200は、さらに、図5に対応する線分群を生成してモニタ206に表示する入力補助線表示手段(輪郭構成線分候補生成手段を含む)204と、線分群から適切な線分を選択する入力線分補正手段(輪郭構成線分抽出手段を含む)205とを有する。
【0020】
オペレータ208は、マウス207等の入力手段を用いてモニタ206上で画像データに撮像されている地物の輪郭をトレースする。その際、入力補助線表示手段204により、複数の線分を包含できる程度の一定の太さを持ったラバーバンドが表示される。そして、線分を入力した際には入力線分補正手段205により入力した線が補正される。
【0021】
<入力画面の例>
図3は、入力補助線表示手段204を用いて始点と終点間に線分を引く際の入力画面の一例を示す図である。図3に示されるように、描画しようとしている線分の始点と終点は、一定の太さを有するラバーバンド306がカバーする範囲内に含まれていればよい。従って、オペレータ208が決定した始点と終点とが、地物の輪郭を構成する実際の線分の視点と終点と異なっていても、ラバーバンド306がカバーする範囲内であれば輪郭構成線分を確定する上で問題はない。
【0022】
例えば、始点304と終点305を含む線分302を描画したい場合、初期ラバーバンド308内に始点304が含まれるように入力ポインタ307を動かしてクリックし、その後、ラバーバンド306内に終点305が含まれるように入力ポインタ307を動かしてクリックする。その際、描画したい線分302はラバーバンド306内に含まれているはずである。このようにあまり入力ポインタを打つべき点に正確に合わせようとせずに、ラバーバンド306内に描画しようとする線分が含まれるようにしていけばよい。
【0023】
<輪郭図形確定処理>
図4は、入力された始点と終点とで定まる線分に基づいて図形を確定する処理を説明するためのフローチャートである。
【0024】
まず、ステップS400では、入力された線分情報を基に、入力補助線表示手段204は、線分の候補となる線分をすべて挙げる。より詳細には、図5で示されるような処理が実行されて、候補となる線分がすべて求められる。つまり、入力された線分500に関し、線分500を構成する端点501と502から線分500に対して垂直な線分504及び505をラバーバンド503の端部に交わるまで引く。その線分を均等に分割して線分504と線分505上に複数の点506及び507を作成する。分割の仕方は間隔が画像のピクセルの大きさ程度とする。点群506と点群507を結ぶすべての線分の組み合わせを求め、これらを候補の線分群508とする。よって、例えば、線分505及び506上に分割点が10個(ピクセル)ずつあるとすれば、線分の数は10×10=100個となる。
【0025】
次に、ステップS401では、入力線分補正手段205は、ステップS400で求められた各線分の候補に対して画像上のエッジの強度値を計算し、そのエッジ強度値を比較して一番大きな値を持つ線分を補正後線分として確定する。より詳細には、図6で示されるような処理が実行される。つまり、図6で示されるように、まずステップS600で、各候補線分604が通過する画像上の画素605をすべて求める。そして、ステップS601で、各画素に対してSobelフィルタを用いて各画素の勾配ベクトル(vi)606を求める。なお、Sobelフィルタの構成を図7に示す。ベクトルデータ格納部203から読み出した、注目画素の周辺の各画素素値ベクトルに対して、図7で示されるフィルタ係数を掛けることにより勾配ベクトルを生成するのである。直線604に対して強いエッジが存在すれば、勾配ベクトル(vi)606は直線604の法線方向を向いた長さの長いベクトルとなる。また、ステップS602では、直線604の単位法線ベクトルを(n)607として、勾配ベクトル(vi)606と法線(n)607の内積を求める。すべての画素605に対してこの内積を求める。そして、それら内積の合計値をエッジ強度値(S)608とし、すべて線分候補に対してエッジ強度値(S)を求める。ステップS603では、エッジ強度値(S)の値が一番大きい線分を補正後線分とする(ステップ603)。
【0026】
最後に、ステップS402では、情報処理装置200は、図形の接点を求めるのに補正後の線分同士の交点を利用して図形を確定する。なお、ステップS402において、トリミング処理を併せて実行しても良い。つまり、各線分の少なくとも一方か短すぎたて交点に足りない場合、或いは、各線分の少なくとも一方が長すぎて交点から線分がはみ出ている場合に、当該交点が線分の始点(終点)となるようにトリミング処理を実行する。
【0027】
<まとめ>
以上の本実施形態では、高空から撮影した画像から、線分で構成された対象地物の輪郭を抽出する例に説明したが、これに限らず、画像内に存在する対象物の輪郭を抽出際に広く適用できる。
【0028】
本実施形態では、オペレータによって入力された始点と終点で構成される線分を含む所定の範囲内の複数の線分を、輪郭構成線分候補として生成する。また、輪郭構成線分候補としての複数の線分のうち、エッジ強度値が最も高い線分を輪郭構成線分として抽出する。そして、これらの工程を繰り返して得られた複数の輪郭構成線分を用いて対象物の輪郭情報を生成する。このようにすることにより、オペレータとしても輪郭を構成する線分の始点と終点を正確に入力する必要がなくなり、対象物の輪郭確定作業が非常に効率的になる。
【0029】
また、上述の所定の範囲内については、始点と終点で構成される線分を含み、この線分の法線方向に一定の幅(太さ)を有するラバーバンドを表示部に表示し、ラバーバンドの範囲内の複数の線分を、輪郭構成線分候補とする。このようにすることにより、オペレータは、対象物の輪郭を構成する1つの線分について、ラバーバンド内にその線分の始点と終点が含まれてさえいれば、適正に輪郭を構成する線分を確定できるので、非常に効率がよく、輪郭確定作業にストレスを感じることが少なくなる。
【0030】
さらに、輪郭構成線分候補となる複数の線分のそれぞれについて、線分が通過する画像上の画素に対して勾配ベクトルを計算し、勾配ベクトルを計算した線分の法線ベクトルと勾配ベクトルとの内積から線分の法線方向へのエッジ強度値を計算し、このエッジ強度値が最も高い線分を輪郭構成線分として確定する。このようにすることにより、確実に輪郭を構成する線分を候補の中から確定することができる。
【0031】
なお、本発明は、実施形態の機能を実現するソフトウェアのプログラムコードによっても実現できる。この場合、プログラムコードを記録した記憶媒体をシステム或は装置に提供し、そのシステム或は装置のコンピュータ(又はCPUやMPU)が記憶媒体に格納されたプログラムコードを読み出す。この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコード自体、及びそれを記憶した記憶媒体は本発明を構成することになる。このようなプログラムコードを供給するための記憶媒体としては、例えば、フロッピィ(登録商標)ディスク、CD−ROM、DVD−ROM、ハードディスク、光ディスク、光磁気ディスク、CD−R、磁気テープ、不揮発性のメモリカード、ROMなどが用いられる。
【0032】
また、プログラムコードの指示に基づき、コンピュータ上で稼動しているOS(オペレーティングシステム)などが実際の処理の一部又は全部を行い、その処理によって前述した実施の形態の機能が実現されるようにしてもよい。さらに、記憶媒体から読み出されたプログラムコードが、コンピュータ上のメモリに書きこまれた後、そのプログラムコードの指示に基づき、コンピュータのCPUなどが実際の処理の一部又は全部を行い、その処理によって前述した実施の形態の機能が実現されるようにしてもよい。
【0033】
また、実施の形態の機能を実現するソフトウェアのプログラムコードを、ネットワークを介して配信し、当該コードがシステム又は装置のハードディスクやメモリ等の記憶手段又はCD-RW、CD-R等の記憶媒体に格納され、そのシステム又は装置のコンピュータ(又はCPUやMPU)が当該記憶手段や当該記憶媒体に格納されたプログラムコードを読み出して当該機能を実行するようにしてもよい。
【図面の簡単な説明】
【0034】
【図1】一般的なラバーバンド機能を用いた入力画面例である。
【図2】本発明の実施形態による地物輪郭生成システムの概略構成例を示す図である。
【図3】本発明の入力補助線表示手段を用いた入力画面例である。
【図4】入力した線分を元に図形を確定する流れを示した図である。
【図5】候補となる線分をすべて求める方法を示した図である。
【図6】候補線分群から補正後の線分を決定する方法を示した図である。
【図7】Sobelフィルタを示した図である。
【符号の説明】
【0035】
100…画像に撮像されている地物 101…地物を構成する線分 102…地物を構成する線分 103…地物を構成する線分 104…線分を描画する際の始点 105…線分を描画する際の終点 106…一般的なラバーバンド 107…入力ポインタ 200…情報処理装置 201…記憶装置 202…画像データ 203…ベクトルデータ 204…入力補助線表示手段 205…入力線分補正手段 206…モニタ 207…マウス 208…オペレータ 300…画像に撮像されている地物 301…地物を構成する線分 302…地物を構成する線分 303…地物を構成する線分 304…線分を描画する際の始点 305…線分を描画する際の終点 306…一定の太さを有するラバーバンド 307…入力ポインタ 308…1点目を入力する際のラバーバンド 400…線分の候補をすべて挙げるステップ 401…各線分のエッジ強度値を計算して比較し、エッジ強度値が一番高い線分を補正後線分とするステップ 402…図形の接点を補正後線分の交点として求めるステップ 500…入力した線分 501…入力した線分の始点 502…入力した線分の終点 503…一定の太さを有するラバーバンド 504…入力した線分の始点を通り入力した線分と直角を形成する線分 505…入力した線分の終点を通り入力した線分と直角を形成する線分 506…線分504を等間隔に分割した点群 507…線分505を等間隔に分割した点群 508…候補となる線分群 600…各線分の通過する画像上の画素を求めるステップ 601…Sobelフィルタを用いて各画素の勾配ベクトルを求めるステップ 602…直線の単位法線ベクトルと勾配ベクトルの内積を合計したエッジ強度値を求めるステップ 603…エッジ強度値が一番大きな線分を補正後線分とするステップ 604…候補線分 605…線分が通過する画像上の画素 606…勾配ベクトル 607…直線の単位法線ベクトル 608…エッジ強度値の計算式

【特許請求の範囲】
【請求項1】
情報処理装置を用いて、画像内に存在する対象物の輪郭情報を生成する輪郭情報生成方法であって、
入力された始点と終点で構成される線分を含む所定の範囲内の複数の線分を、輪郭構成線分候補として生成するステップと、
前記輪郭構成線分候補としての前記複数の線分のうち、エッジ強度値が最も高い線分を輪郭構成線分として抽出するステップと、
を備え、前記輪郭構成線分を用いて前記対象物の輪郭情報を生成することを特徴とする輪郭情報生成方法。
【請求項2】
前記生成するステップでは、前記始点と終点の入力に対応して、前記始点と終点で構成される線分を含み、この線分の法線方向に一定の幅を有するラバーバンドを表示部に表示し、前記ラバーバンドの範囲内の複数の線分を、前記輪郭構成線分候補とすることを特徴とする請求項1に記載の輪郭情報生成方法。
【請求項3】
前記抽出するステップでは、前記輪郭構成線分候補となる前記複数の線分のそれぞれについて、線分が通過する画像上の画素に対して勾配ベクトルを計算し、前記勾配ベクトルを計算した線分の法線ベクトルと前記勾配ベクトルとの内積から線分の法線方向へのエッジ強度値を計算し、このエッジ強度値が最も高い線分を前記輪郭構成線分として確定することを特徴とする請求項1又は2に記載の輪郭情報生成方法。
【請求項4】
画像内に存在する対象物の輪郭情報を生成する輪郭情報生成システムであって、
入力された始点と終点で構成される線分を含む所定の範囲内の複数の線分を、輪郭構成線分候補として生成する輪郭構成線分候補生成手段と、
前記輪郭構成線分候補としての前記複数の線分のうち、エッジ強度値が最も高い線分を輪郭構成線分として抽出する輪郭構成線分抽出手段と、
を備え、前記輪郭構成線分を用いて前記対象物の輪郭情報を生成することを特徴とする輪郭情報生成システム。
【請求項5】
前記輪郭構成線分候補生成手段は、前記始点と終点の入力に対応して、前記始点と終点で構成される線分を含み、この線分の法線方向に一定の幅を有するラバーバンドを表示部に表示し、前記ラバーバンドの範囲内の複数の線分を、前記輪郭構成線分候補とすることを特徴とする請求項4に記載の輪郭情報生成システム。
【請求項6】
前記輪郭構成線分抽出手段は、前記輪郭構成線分候補となる前記複数の線分のそれぞれについて、線分が通過する画像上の画素に対して勾配ベクトルを計算し、前記勾配ベクトルを計算した線分の法線ベクトルと前記勾配ベクトルとの内積から線分の法線方向へのエッジ強度値を計算し、このエッジ強度値が最も高い線分を前記輪郭構成線分として確定することを特徴とする請求項4又は5に記載の輪郭情報生成システム。
【請求項7】
コンピュータを請求項4乃至6の何れか1項に記載の輪郭情報生成システムとして機能させるためのプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2009−116464(P2009−116464A)
【公開日】平成21年5月28日(2009.5.28)
【国際特許分類】
【出願番号】特願2007−286412(P2007−286412)
【出願日】平成19年11月2日(2007.11.2)
【出願人】(000233055)日立ソフトウエアエンジニアリング株式会社 (1,610)
【Fターム(参考)】