画像処理装置、画像処理方法及び画像処理プログラム
【課題】斜めから撮影された看板が写った画像から看板の画像領域を検出する。
【解決手段】画像中の画像領域の矩形度、該画像領域と該画像領域の周辺領域との色差、または該画像領域のエッジ比のうちいずれか1つまたは2つ以上の組に基づいて、画像から看板の画像を表す看板領域を選択する看板領域選択部23を備える。
【解決手段】画像中の画像領域の矩形度、該画像領域と該画像領域の周辺領域との色差、または該画像領域のエッジ比のうちいずれか1つまたは2つ以上の組に基づいて、画像から看板の画像を表す看板領域を選択する看板領域選択部23を備える。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像処理装置、画像処理方法及び画像処理プログラムに関する。
【背景技術】
【0002】
画像又は映像の中からある特定の物体を認識する特定物体認識という技術分野において、SIFT(Scale−Invariant Feature Transform、非特許文献1参照)又はSURF(Speeded Up Robust Features、非特許文献2参照)といった局所特徴量に基づく画像認識技術が知られている。このSIFT又はSURFを用いて、標識を認識する研究が行われている。
【先行技術文献】
【非特許文献】
【0003】
【非特許文献1】Lowe, Distinctive Image Features from Scale-Invariant Keypoints:International Journal of Computer Vision, 60(2), 91-110, 2004
【非特許文献2】Bay et al., SURF: Speeded-Up Robust. Features:Proc. of the 9th European Conference on Computer Vision (ECCV), 1:404-417, May 2006
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかし、これらの技術は画像中から特定の形を高速に検出することができ、(撮影方向を軸とする)回転や大きさの変化にも強いといった特徴があるが、形に着目した特徴量を利用しているため、被写体が斜めを向くような角度から撮影することによって被写体の見え方(被写体の形)が変わってしまう条件下では、画像中から特定の形を検出する検出率が落ちてしまうという問題がある。
【0005】
視点(カメラ位置)に対し高いところや低いところ、あるいは通路の脇に設置された看板又は標識は、その面の法線方向(正面)から撮影することが、不可能あるいは不便である。そのため、斜めから撮影された看板又は標識が写った画像から、正面より写した画像を得るために看板又は標識の画像領域を検出することが望まれる。
【0006】
そこで本発明は、上記問題に鑑みてなされたものであり、斜めから撮影された看板が写った画像から看板の画像領域を検出することを可能とする技術を提供することを課題とする。
【課題を解決するための手段】
【0007】
本発明は上記の課題を解決するためになされたものであり、本発明の一態様は、画像中の画像領域の矩形度、該画像領域と該画像領域の周辺領域との色差、または該画像領域のエッジ比のうちいずれか1つまたは2つ以上の組に基づいて、前記画像から看板の画像を表す看板領域を選択する看板領域選択部を備えることを特徴とする画像処理装置である。
【0008】
また、本発明の一態様は、上記の画像処理装置において、前記看板領域選択部は、前記画像領域の前記矩形度、該画像領域と該画像領域の周辺領域との前記色差、および該画像領域の前記エッジ比に基づいて、前記画像から前記看板領域を選択することを特徴とする。
【0009】
また、本発明の一態様は、上記の画像処理装置において、前記画像から四角形の画像領域を形成する四頂点を抽出する頂点抽出部と、前記看板領域に基づいて、前記頂点抽出部が抽出した四頂点から前記看板領域の四頂点を選出する頂点選出部と、を備えることを特徴とする。
【0010】
また、本発明の一態様は、上記の画像処理装置において、前記頂点選出部により選出された前記看板領域の四頂点の座標に基づいて、前記看板領域の画像から看板の正面画像を生成する正面画像生成部を備えることを特徴とする。
【0011】
また、本発明の一態様は、上記の画像処理装置において、前記看板領域選択部が選択した看板領域の特徴量に基づいて、前記看板が設置されている位置を示す位置情報を取得する属性取得部を備えることを特徴とする。
【0012】
また、本発明の一態様は、画像処理装置が実行する画像処理方法であって、画像中の画像領域の矩形度、該画像領域と該画像領域の周辺領域との色差、または該画像領域のエッジ比のうちいずれか1つまたは2つ以上の組に基づいて、前記画像から看板の画像を表す看板領域を選択する看板領域選択手順を有することを特徴とする画像処理方法である。
【0013】
また、本発明の一態様は、画像中の画像領域の矩形度、該画像領域と該画像領域の周辺領域との色差、または該画像領域のエッジ比のうちいずれか1つまたは2つ以上の組に基づいて、前記画像から看板の画像を表す看板領域を選択する看板領域選択ステップを実行させるための画像処理プログラムである。
【発明の効果】
【0014】
本発明によれば、斜めから撮影された看板が写った画像から看板の画像領域を検出することができる。
【図面の簡単な説明】
【0015】
【図1】第1の実施形態における画像処理装置のハードウェアの構成を示す概略ブロック図である。
【図2】第1の実施形態における制御部の論理的な構成を示す概略ブロック図である。
【図3】第1の実施形態における看板領域選択部の構成を示す概略ブロック図である。
【図4】記憶部に記憶されているセグメント画像テーブルT1の一例である。
【図5】正規化色差、正規化エッジ比、矩形度又はスコアを示したグラフの一例である。
【図6】第1の実施形態における頂点抽出部の構成を示す概略ブロック図である。
【図7】線分抽出部の処理を説明するための図である。
【図8】エッジ限定部の処理を説明するための図である。
【図9】記憶部に記憶されている線分テーブルT2の一例である。
【図10】交点抽出部の処理を説明するための図である。
【図11】記憶部に記憶されている交点テーブルT3の一例である。
【図12】記憶部に記憶されている四角形テーブルT4の一例である。
【図13】頂点選出部の処理を説明するための図である。
【図14】第1の実施形態における正面画像生成部の概略ブロック図である。
【図15】座標変換部の処理を説明するための図である。
【図16】画素値生成部の処理を説明するための図である。
【図17】第1の実施形態における属性取得部の構成を示す概略ブロック図である。
【図18】記憶部に記憶されている看板画像ファイルテーブルT5の一例である。
【図19】記憶部に記憶されている看板特徴量テーブルT6の一例である。
【図20】記憶部に記憶されている看板属性テーブルT7の一例である。
【図21】第1の実施形態における画像処理装置の処理の流れを示すフローチャートである。
【図22】第2の実施形態における測位システムの概略ブロック図である。
【図23】第2の実施形態における端末装置のハードウェア構成を示す概略ブロック図である。
【図24】第2の実施形態における画像処理装置のハードウェア構成を示す概略ブロック図である。
【図25】第2の実施形態における画像処理装置の制御部の論理的な構成を示す概略ブロック図である。
【図26】第2の実施形態における地図画像記憶装置のハードウェア構成を示す概略ブロック図である。
【図27】第2の実施形態における看板検索装置のハードウェア構成を示す概略ブロック図である。
【図28】第2の実施形態における看板検索装置の制御部の論理的な構成を示す概略ブロック図である。
【発明を実施するための形態】
【0016】
以下、本発明の実施形態について、図面を参照して詳細に説明する。本発明の各実施形態における看板は、長方形の形をした板に文字または図形が描かれて、見るものに対して何らかの情報を伝えるものである。従って、本発明の各実施形態における看板は、宣伝又は広告のために使われる板状の物体だけでなく、標識(例えば、道路標識)、設備または機器に付けられている銘板及び案内板を含むものとする。
【0017】
<第1の実施形態>
図1は、第1の実施形態における画像処理装置1のハードウェアの構成を示す概略ブロック図である。画像処理装置1は、入力部10と、制御部20と、記憶部30と、表示部40とを備える。
入力部10は、看板の撮影画像データ(以下、撮影画像データと称す)PIの入力を受け付ける。入力部10は、受け付けた撮影画像データPIを制御部20に出力する。ここで、撮影画像データは、ある看板が斜めから撮影されることにより得られた画像データである。
【0018】
制御部20は、入力部10から入力された撮影画像データPIに基づいて、看板の正面の画像である看板正面画像を生成し、生成した看板正面画像のデータ(以下、正面画像データと称す)FIを記憶部30に記憶させる。
そして、制御部20は、生成した正面画像データFIが示す画像の特徴量に基づいて、看板が設定されている位置を示す位置情報Lを取得し、取得した位置情報Lを表示部40に表示させる。
【0019】
図2は、第1の実施形態における制御部20の論理的な構成を示す概略ブロック図である。制御部20は、ノイズ除去部21と、領域分割部22と、看板領域選択部23と、頂点抽出部24と、頂点選出部25と、正面画像生成部26と、属性取得部27とを備える。
【0020】
ノイズ除去部21は、入力部10から入力された撮影画像データPIに対して、一例としてMedianフィルタを施し、撮影画像データPIを平滑化した平滑化画像データを生成する。これにより、ノイズ除去部21は、看板画像データPIを平滑化することにより看板画像データPIからノイズを除去することができる。ノイズ除去部21は、生成した平滑化画像データを領域分割部22と、頂点抽出部24とへ出力する。
【0021】
なお、本実施形態におけるノイズ除去部21は、Medianフィルタを用いたが、これに限らず、フィルタはノイズを低減するフィルタであればよい。
【0022】
領域分割部22は、ノイズ除去部21から入力された平滑化画像データを、MeanShift(平均値シフト)法を用いて、類似する色情報をもつ複数の画像領域(以下、セグメントと称する)に分割する。ここで、本実施形態において、画像の領域分割に用いるMeanShift(平均値シフト)法は、Comaniciu, D. and Meer, P. (2002). Mean Shift: A Robust Approach Toward Feature Space Analysis. IEEE Transactions on Pattern Analysis and Machine Intelligence, 24(5):603-619に開示されている。
【0023】
看板はおもに単色の文字、単色の背景で構成されるので、領域分割部22は看板が撮影された撮影画像を色情報にもとづいて、複数のセグメントに分割(以後、セグメンテーションとも称す)する。
領域分割部22は、分割したセグメントを示す分割セグメント情報を看板領域選択部23に出力する。また、領域分割部22は、分割したセグメントの画像のファイル(セグメント画像ファイル)を記憶部30に記憶させる。
【0024】
看板領域選択部23は、領域分割部22から入力された分割セグメント情報が示すセグメントの矩形度とエッジ比と色差とに基づいて、画像から看板の画像を表す看板領域を選択する。看板領域選択部23は、選択した看板領域を示す看板領域情報を頂点選出部25に出力する。
【0025】
頂点抽出部24は、ノイズ除去部21から入力された平滑化画像データ画像から四角形の画像領域を形成する四頂点を抽出する。頂点抽出部24は、抽出した四頂点を記憶部30に記憶させる。
【0026】
頂点選出部25は、看板領域選択部23から入力された看板領域情報が示す看板領域に基づいて、頂点抽出部24が抽出した四頂点から看板領域の四頂点を選出する。頂点選出部25は、選出した看板領域の四頂点の座標を正面画像生成部26に出力する。
【0027】
正面画像生成部26は、頂点選出部25により選出された看板領域の四頂点の座標に基づいて、看板領域の画像から看板の正面画像を生成する。
正面画像生成部26は、生成した看板の正面画像を、正面看板画像ファイルとして記憶部30に記憶させる。また、正面画像生成部26は、生成した看板の正面画像データFIを属性取得部27に出力する。
【0028】
属性取得部27は、正面画像生成部26により入力された看板の正面画像データFIが示す看板領域の特徴量を算出し、算出した特徴量に基づいて、看板の属性を示す属性情報Aを記憶部30から取得する。属性取得部27は、取得した属性情報Aを表示部40に表示させる。
【0029】
図3は、第1の実施形態における看板領域選択部23の構成を示す概略ブロック図である。看板領域選択部23は、面積上位領域抽出部23_1と、色差算出部23_2と、エッジ比算出部23_3と、矩形度算出部23_4と、スコア算出部23_5と、スコア最大領域抽出部23_6とを備える。
【0030】
面積上位領域抽出部23_1は、領域分割部22から入力された分割セグメント情報を用いて各セグメントの面積を算出する。そして、面積上位領域抽出部23_1は、分割セグメント情報が示す分割セグメントのうちから、面積の大きい上位10個のセグメント(以下、面積上位10セグメントと称す)を抽出する。これにより、面積上位領域抽出部23_1は、分割された画像領域を、面積の大きい順に上位10領域を抽出する。
【0031】
なお、面積上位領域抽出部23_1は、セグメントを10領域分抽出したが、これに限らず、9以下の領域でもよいし、11以上の領域でもよい。
【0032】
面積上位領域抽出部23_1は、抽出した面積上位10セグメントに対して、セグメントの面積の大きい順にセグメントを識別するセグメントIDを振る。そして、面積上位領域抽出部23_1は、セグメントID、セグメント画像ファイルのファイル名、面積及びエッジのピクセル座標を関連付けて記憶部30のセグメント画像テーブルT1に記憶させる。
面積上位領域抽出部23_1は、抽出した面積上位10セグメントを色差算出部23_2と、エッジ比算出部23_3と、矩形度算出部23_4とへ出力する。
【0033】
色差算出部23_2は、面積上位領域抽出部23_1から入力された面積上位10セグメントに対して、各セグメントと当該セグメントの周辺領域との平均色差を算出する。具体的には、例えば、色差算出部23_2は、セグメントのエッジを構成する各ピクセルについて、上下左右4近傍のピクセルとのL*a*b*表色系における色差(L*、a*、b*成分それぞれの差分の二乗の和の平方根)をそれぞれ算出する。なお、L*a*b*表色系以外の表色系でもよい。
【0034】
そして、色差算出部23_2は、算出した4つの値のうち最も大きいものをそのピクセルにおける色差とする。更に、色差算出部23_2は、セグメントエッジを構成する全てのピクセルにおける色差の平均値を平均色差として算出する。
ここで、平均色差は、看板内部の文字又は図形と、看板内部の背景部分とでは色差が大きいことに基づいて、数式化されたものである。
【0035】
色差算出部23_2は、算出したセグメント毎の平均色差を、面積上位10セグメント分の平均色差の最大値で正規化する。色差算出部23_2が面積上位10セグメント分の平均色差の最大値を分母にして正規化するので、正規化後の平均色差の最大値は1である。
色差算出部23_2は、正規化後の平均色差を正規化色差Cとして、面積上位10セグメント分の正規化色差Cをスコア算出部23_5に出力する。
【0036】
エッジ比算出部23_3は、面積上位領域抽出部23_1から入力された面積上位10セグメントに対して、セグメントの内側のエッジ長に対する該セグメントの外側のエッジ長の比(内側長さ/外側長さ)をエッジ比として算出する。ここで、セグメントの内側のエッジ長とは、セグメント内部に存在する内部セグメントの外縁のピクセル数である。また、セグメントの外側のエッジ長とは、セグメント全体の外縁のピクセル数である。すなわち、エッジ比は、セグメント内部に存在する内部セグメントの外縁のピクセル数に対するセグメント全体の外縁のピクセル数の比といえる。
ここで、看板内部には文字又は図形が存在し、内部セグメントの外縁は、その文字又は図形の輪郭となる。その文字又は図形の輪郭が通常入り組んでいるため、セグメントが看板領域の場合の該セグメントの内側のエッジ長は、面積が同一で輪郭が入り組んでいないセグメントのエッジ長よりも長くなる。エッジ比は、セグメントが看板領域の場合に、1に近くなることを利用して、数式化されたものである。
【0037】
エッジ比算出部23_3は、算出した各エッジ比を、面積上位10セグメント分のエッジ比の最大値で正規化する。エッジ比算出部23_3が面積上位10セグメント分のエッジ比の最大値で正規化するので、正規化後のエッジ比の最大値は1である。
エッジ比算出部23_3は、正規化後のエッジ比を正規化エッジ比Eとして、面積上位10セグメント分の正規化エッジ比Eをスコア算出部23_5に出力する。
【0038】
矩形度算出部23_4は、面積上位領域抽出部23_1から入力された面積上位10セグメントのそれぞれに対し、セグメントの垂直エッジピクセル数Nvと、セグメントの水平エッジピクセル数Nhと、セグメントを構成する画素数であるセグメントピクセル数Npとを算出する。ここで、セグメントピクセル数は、セグメントの面積を反映している。
【0039】
矩形度算出部23_4は、算出したセグメントの垂直エッジピクセル数Nvとセグメントの水平エッジピクセル数Nhとセグメントピクセル数Npとに基づいて、面積上位10セグメント分の矩形度Kを算出する。
具体的には、例えば、矩形度算出部23_4は、以下の式(1)に従って、矩形度Kを算出する。
【0040】
K=Nv×Nh/Np …(1)
【0041】
上式(1)の矩形度Kは、看板の外形は、長方形のものが多いので、セグメントの垂直エッジピクセル数と水平エッジピクセル数を掛け合わせたものを、セグメント内ピクセル数で除したものがほぼ1となることを利用して数式化されたものである。
矩形度算出部23_4は、算出した面積上位10セグメント分の矩形度Kを、スコア算出部23_5に出力する。
【0042】
スコア算出部23_5は、色差算出部23_2から入力された正規化色差Cと、エッジ比算出部23_3から入力された正規化エッジ比Eと、矩形度算出部23_4から入力された矩形度Kとに基づいて、面積上位10セグメント分のスコアSを算出する。
具体的には、例えば、スコア算出部23_5は、以下の式(2)に従って、スコアSを算出する。
【0043】
S=C+K−|E−d| …(2)
【0044】
ここで、上式(2)の定数d(例えば、0.6)は、正規化項である。
スコア算出部23_5は、算出した各スコアSを、記憶部30のセグメント画像テーブルT1内の該当するセグメントIDの箇所に追記する。
【0045】
スコア最大領域抽出部23_6は、スコア算出部23_5から入力された面積上位10セグメント分のスコアSのうち、スコアSが最大となるセグメントIDを記憶部30に記憶されているセグメント画像テーブルT1から抽出する。
スコア最大領域抽出部23_6は、抽出したセグメントIDをスコア最大セグメントIDとして、頂点選出部25に出力する。
【0046】
図4は、記憶部30に記憶されているセグメント画像テーブルT1の一例である。同図のセグメント画像テーブルT1には、セグメントID、セグメント画像ファイルのファイル名、セグメントの面積、スコアS及びエッジのピクセル座標の組が示されている。例えば、セグメントIDが1の場合、セグメント画像ファイルのファイル名は「EDGE001.BMP」で、面積が「2353pixels」で、スコアSが「1.54」で、エッジのピクセル座標が「(10,140),…,(50,200)」あることが示されている。
【0047】
図5は、正規化色差、正規化エッジ比、矩形度又はスコアを示したグラフの一例である。縦軸は、正規化色差C、正規化エッジ比E、矩形度K又はスコアSであり、横軸は、領域番号である。この例では、セグメントIDは、セグメントの面積の大きい順につけられている。すなわちセグメントIDが1のセグメントの面積が最も大きく、セグメントIDが10のセグメントの面積が最も小さい。
【0048】
同図において、正規化色差の折れ線O41と、正規化エッジ比の折れ線O42、矩形度の折れ線O43、スコアの折れ線O44とが示されている。同図では、スコアが最大となるセグメントIDが3であることが示されている。同図の例では、スコア最大領域抽出部23_6は、セグメントidが3のセグメントを看板領域として抽出する。
【0049】
<頂点抽出部24の処理の詳細>
続いて、頂点抽出部24の処理の詳細について説明する。図6は、第1の実施形態における頂点抽出部24の構成を示す概略ブロック図である。
頂点抽出部24は、線分抽出部24_1と、エッジ限定部24_2と、交点抽出部24_3と、四交点選出部24_4とを備える。
【0050】
線分抽出部24_1は、ノイズ除去部21から入力された平滑化画像データが示す平滑化画像から線分を抽出する。具体的には、例えば、線分抽出部24_1は、平滑化画像データが示す平滑化画像に対してCannyエッジ抽出を行い、エッジの点の座標を示すエッジデータを生成する。
【0051】
線分抽出部24_1によるCannyエッジ抽出は、具体的には、例えば、以下の処理を行う。線分抽出部24_1は、平滑化画像データに対して、ガウシアンフィルタを施して平滑化する。次に、線分抽出部24_1は、ソーベルフィルタを用いてガウシアンフィルタ後の画像内のエッジ強度を算出する。また、エッジの勾配方向を4方向に振り分ける(量子化する)。
【0052】
線分抽出部24_1は、算出された画素毎のエッジの強度と、エッジにおける量子化された勾配方向とに基づいて、エッジを細線化する。具体的には、線分抽出部24_1は、画素毎に、エッジの画素と、エッジの勾配方向の隣接画素2つとを比較し、最大でなければその画素値を0とする。
【0053】
線分抽出部24_1は、画素毎に、2つの閾値(第1の閾値>第2の閾値)に基づいて、画素毎にエッジであるか否か判定する。具体的には、線分抽出部24_1は、第1の閾値より大きいエッジ強度の画素と、第2の閾値以上第1の閾値以下のエッジ強度の画素のうちエッジに結合している画素とをエッジと判定する。また、線分抽出部24_1は、それ以外は、エッジでないと判定する。
【0054】
そして、線分抽出部24_1は、生成したエッジデータに対して、Hough変換を行い、エッジ画像から線分を抽出する。線分抽出部24_1は、抽出した線分に対して線分を識別する線分IDを割り振り、線分IDと線分の始点と終点とを関連付けて記憶部30の線分テーブルT2に記憶させる。
【0055】
ここで、線分抽出部24_1によるHough変換は、具体的には、例えば、以下の処理により行われる。まず、線分抽出部24_1は、ρ−θパラメータ空間を表す2次元配列Vを用意し、その値を全てに初期化する(処理1)。次に、線分抽出部24_1は、エッジデータが示すエッジの点の座標値を直線ρ=xcosθ+ysinθの変数x、変数yに代入した式を変数ρと変数θに関する方程式とみなし、変数θを一定間隔Δθずつ増加させながら、その変数ρと変数θに関する方程式をみたす変数ρを算出する(処理2)。
【0056】
次に、線分抽出部24_1は、2次元配列Vにおいて、算出したρとθの組を表す要素の数を1増加させる(処理3)。そして、線分抽出部24_1は、全てのエッジの点で上記処理2と処理3の処理を行った後に、2次元配列Vが極大となる要素が示す変数ρと変数θの組を1以上抽出する。このρとθの組毎に、変数ρと変数θを直線ρ=xcosθ+ysinθの式に代入することにより、線分の式を得る。
【0057】
エッジ限定部24_2は、記憶部30から看板領域のエッジのピクセル座標を読み出す。エッジ限定部24_2は、看板領域のエッジのピクセル座標に基づいて、線分抽出部24_1により抽出された線分のうち、看板領域として選ばれたスコア最大セグメントから予め決められた閾値距離以上の距離にある線分を除外する。
【0058】
具体的には、例えば、エッジ限定部24_2は、記憶部30の線分テーブルT2から各線分idに関連付けられた始点と終点とを読み出しては、以下の処理を行う。エッジ限定部24_2は、看板領域のエッジのピクセル座標から、看板領域の重心を算出する。そして、エッジ限定部24_2は、看板領域の重心と線分との距離を算出する。
【0059】
そして、エッジ限定部24_2は、算出した距離が予め決められた閾値距離以上であれば、記憶部30の線分テーブルT2内の線分idに関連付けられた線分が看板領域の近傍であるか否かを示す近傍判定を偽と追記する。一方、エッジ限定部24_2は、算出した距離が予め決められた閾値距離未満であれば、記憶部30の線分テーブルT2内の線分idに関連付けられた近傍判定を真と追記する。エッジ限定部24_2は、上記処理を、線分抽出部24_1により抽出された線分の分だけ繰り返す。
エッジ限定部24_2は、閾値距離以上の距離にある線分を除外することにより限定された線分を示す限定線分情報を交点抽出部24_3に出力する。
【0060】
交点抽出部24_3は、エッジ限定部24_2から入力された限定線分情報が示す限定された線分を直線化し、直線化した線分の交点を抽出する。交点抽出部24_3は、各交点に交点を識別する交点IDを割り振り、交点IDと交点を形成する2つの線分の線分IDと交点の座標とを関連付けて記憶部30の交点テーブルT3に記憶させる。
【0061】
四交点選出部24_4は、記憶部30の交点テーブルT3に記憶されている交点の4つの組み合わせのうち、当該組み合わせを構成する4つの交点を頂点とする四角形が有する内角がいずれも180度未満である組み合わせを選出する。
具体的には、例えば、四交点選出部24_4は、記憶部30の交点テーブルT3に記憶されている交点の座標を4つ取得し、4つの交点を頂点とする四角形が有する内角を全て算出する。四交点選出部24_4は、その四角形が有する内角がいずれも180度未満である場合、四角形が有する内角がいずれも180度未満であるか否かを示す凸包判定フラグを真とし、上記以外の場合、凸包判定フラグを偽とする。
【0062】
そして、四交点選出部24_4は、交点の4つの組み合わせ全てに四角形IDを割り振り、四角形IDと頂点座標列と、凸包判定フラグとを関連付けて記憶部30の四角形テーブルT4に記憶させる。四交点選出部24_4は、上記処理を、交点の4つの組がとりうる全ての組み合わせ分、繰り返す。
【0063】
図7は、線分抽出部24_1の処理を説明するための図である。同図において、線分抽出部24_1に入力される画像G81の一例が示されている。また、画像G81からエッジが抽出されたエッジ画像G82が示されている。すなわち、エッジ画像G82は、線分抽出部24_1により抽出されたエッジデータを画像として表示したものである。また、画像G82から線分が抽出された線分抽出画像G83が示されている。すなわち、線分抽出画像G83は、線分抽出部24_1により抽出された線分を画像として表示したものである。
図7の例のように、線分抽出部24_1は、入力された画像からエッジを抽出し、エッジの点の座標を示すエッジデータから線分を抽出する。
【0064】
図8は、エッジ限定部24_2の処理を説明するための図である。同図において、図7で示された線分抽出画像G83と、看板領域のエッジのピクセル座標(20,100),…,(200,400)とが示されている。ここで、看板領域のエッジのピクセル座標は、ij座標系における座標である。また、同図において、線分が抽出された画像G83から看板領域として選ばれたスコア最大セグメントから一定以上の距離にある線分が除外された線分限定画像G91が示されている。
【0065】
図8の例のように、エッジ限定部24_2は、看板領域のエッジのピクセル座標に基づいて、線分抽出画像G83中に示された線分のうち、看板領域として選ばれたスコア最大セグメントから予め決められた閾値距離以上の距離にある線分を除外する。
【0066】
図9は、記憶部30に記憶されている線分テーブルT2の一例である。同図に線分テーブルT2において、線分ID、始点、終点、近傍判定の組が示されている。例えば、線分idが1の場合、始点が(43,74)で、終点が(194,523)で、近傍判定が「真」であることが示されている。すなわち、線分idが1の線分は、エッジ限定部24_2により限定された線分に含まれる。
【0067】
図10は、交点抽出部24_3の処理を説明するための図である。同図において、図8で示された線分限定画像G91と、線分限定画像G91中の線分が直線化された直線化画像G111と、直線化画像G111における直線の交点が抽出された交点抽出画像G112とが示されている。
図10の例のように、交点抽出部24_3は、エッジ限定部24_2により限定された線分を直線化し、直線化した線分の交点を抽出する。
【0068】
図11は、記憶部30に記憶されている交点テーブルT3の一例である。同図の交点テーブルT3において、交点ID、線分ID1、線分ID2の組が示されている。ここで、線分ID1は、交点IDが示す交点を形成する二つの線分のうち、一つの線分を識別する線分IDであり、線分ID2は、当該交点IDが示す交点を形成する二つの線分のうち、もう一方の線分を識別する線分IDである。例えば、交点IDが1の場合、線分ID1が「1」で、線分ID2が「2」であることが示されている。
【0069】
図12は、記憶部30に記憶されている四角形テーブルT4の一例である。同図の四角形テーブルT4において、四角形ID、頂点座標列、凸包判定フラグの組が示されている。例えば、四角形IDが1の場合、「(11,39)、(502,64)、(982,765)、(54,874)」であり、凸包判定フラグが真であることが示されている。
ここで、頂点座標列は、四角形を構成する4つの頂点の座標の列である。また、凸包判定フラグが真である場合、対応する四角形が有する内角がいずれも180度未満であることを示し、凸包判定フラグが偽である場合、対応する四角形が有する内角のいずれかが180度以上であることを示している。
【0070】
<頂点選出部25の処理の詳細>
続いて、頂点選出部25における処理の詳細について説明する。頂点選出部25は、看板領域選択部23のスコア最大領域抽出部23_6から入力されたスコア最大セグメントIDに関連付けられたエッジのピクセル座標を、記憶部30のセグメント画像テーブルT1から読み出す。
【0071】
頂点選出部25は、記憶部30に記憶されている四角形テーブルT4から、凸包判定フラグが真である頂点座標列を読み出す。
頂点選出部25は、読み出した頂点座標列毎に、以下の処理を行う。頂点選出部25は、その頂点座標列に含まれる4つの座標を頂点とする四角形のエッジが通るピクセルの座標を算出する。
【0072】
頂点選出部25は、算出したピクセルの座標と、スコア最大セグメントIDに関連付けられたエッジのピクセル座標とを比較し、重複する座標の数を計数する。
頂点選出部25は、以上の処理を読み出した頂点座標列毎に行った後に、頂点選出部25は、重複する座標の数が最大の場合の頂点座標列(四角形を構成する4つの頂点の座標の列)を抽出する。これにより、頂点選出部25は、四つの頂点を抽出することができる。
【0073】
図13は、頂点選出部25の処理を説明するための図である。同図において、選定した四角形131と、スコア最大セグメントのエッジ132とが示されている。ここで、選定した四角形131とは、凸包判定フラグが真である頂点座標列の各座標を頂点とする四角形のことである。
【0074】
また同図において、一つの座標空間において、選定した四角形131とスコア最大セグメントのエッジ132とを重ねた図133とが示されている。そして、選定した四角形131とスコア最大セグメントのエッジ132とが重なるピクセルの数が一番多くなる四角形を構成する四頂点を選出することが示されている。
【0075】
図13の例において、頂点選出部25は、選定した四角形131の外縁を構成するピクセルの座標群と、スコア最大セグメントのエッジ132の座標群との間で、重複する座標の数が最大の場合における四角形を抽出し、抽出した四角形の4つの頂点を選出する。
【0076】
図14は、第1の実施形態における正面画像生成部26の概略ブロック図である。正面画像生成部26は、座標変換部26_1と、画素値生成部26_2とを備える。
座標変換部26_1は、頂点選出部25から入力された看板領域の四頂点の座標を、長方形を構成する四つの座標に座標変換する。座標変換部26_1は、座標変換したことにより得られた四つの座標を画素値生成部26_2に出力する。
【0077】
画素値生成部26_2は、座標変換部26_1から入力された四つの座標に基づいて、看板領域の画素値から座標変換後の長方形内の画素値を生成する。具体的には、例えば、画素値生成部26_2は、看板領域を予め決められた分割方式(例えば、横×縦4×3)で、各分割領域に分割する。同様に、画素値生成部26_2は、座標変換後の長方形内を看板領域と同じ分割方式(例えば、4×3)で、各分割領域に分割する。そして、画素値生成部26_2は、看板領域の分割領域の色情報を、対応する長方形内の分割領域の色情報とする。
画素値生成部26_2は、座標変換後の長方形内の画素値を記憶部30に記憶させる。
【0078】
図15は、座標変換部26_1の処理を説明するための図である。同図は、看板を撮像した際のカメラの位置原点(0,0,0)とするxyz座標系であり、平面(0,0,h)は、カメラの撮像面である。頂点Pa´、頂点Pb´、頂点Pc´及び頂点Pd´からなる長方形152は、看板の外縁をなす長方形である。平面(0,0,h)において四角形151を構成する頂点Pa、Pb、Pc及びPdが示されている。
【0079】
頂点Pa´、頂点Pb´、頂点Pc´及び頂点Pd´からなる長方形が、原点にあるカメラから撮像された場合、頂点Pa´、頂点Pb´、頂点Pc´及び頂点Pd´からなる長方形は平面(0,0,h)上に射影され、平面(0,0,h)において、頂点Pa、頂点Pb、頂点Pc及び頂点Pdからなる四角形が形成される。
すなわち三次元空間中の頂点Pa´、頂点Pb´、頂点Pc´及び頂点Pd´からなる長方形は、射影変換された結果、頂点Pa、頂点Pb、頂点Pc及び頂点Pdを頂点とする四角形に変換されたものとする。
【0080】
図15の例において、逆射影変換により、座標変換部26_1は、看板領域の外縁をなす四角形の四頂点(頂点Pa、頂点Pb、頂点Pc及び頂点Pd)の座標から、内角がいずれも90度である長方形の四頂点(頂点Pa´、頂点Pb´、頂点Pc´及び頂点Pd´)の座標を算出する。
【0081】
具体的には、例えば、座標変換部26_1は、以下の処理に従って、長方形の四頂点(頂点Pa´、頂点Pb´、頂点Pc´及び頂点Pd´)の座標を算出する。
図15において、頂点Pa´、頂点Pb´、頂点Pc´及び頂点Pd´の座標と、頂点Pa、頂点Pb、頂点Pc及び頂点Pdの座標との関係をベクトル表記で表すと以下のように表される。
【0082】
【数1】
【0083】
ここで、Pa´、Pa、Pb´、Pb、Pc´、Pc、Pd´、Pdはベクトルであり、v1、v2、v3及びv4は係数である。ここで、四角形151を構成する頂点(Pa、Pb、Pc及びPd)の座標は既知であるから、座標変換部26_1は、係数v1、v2、v3及びv4を算出し、係数v1、v2、v3及びv4を用いて長方形152を構成する頂点(Pa´、Pb´、Pc´及びPd´)の座標を算出する。
【0084】
このとき、四角形151の対角線の交点Poは、ベクトル表記で、以下の2つの式で表される。
【0085】
【数2】
【0086】
ここで、u1及びu2は係数である。座標変換部26_1は、上式(9)と(10)からu1及びu2を算出し、算出したu1又はu2を用いて四角形151の対角線の交点Poの座標を算出する。
射影変換前後で、四角形151の対角線の交点Poが一致するので、以下の式が導出される。
【0087】
【数3】
【0088】
ここで、式(9)に式(3)と式(4)が代入され、式(10)に式(5)と式(6)が代入されると、以下のベクトル表現の式が導出される。
【0089】
【数4】
【0090】
式(11)と式(12)の関係は、平面(0,0,h)上の点の関係である。そのため、式(11)と式(12)の関係のz成分についての関係式において、z=hであるから、以下の式が得られる。
【0091】
【数5】
【0092】
式(11)と式(13)より、係数v1と係数v2とが以下のように算出される。
【0093】
【数6】
【0094】
また、式(12)と式(14)より、係数v3と係数v4とが以下のように算出される。
【0095】
【数7】
【0096】
また、頂点Pa´、四角形151の対角線の交点Po及び頂点Pb´を頂点とする三角形は二等辺三角形であるから、交点Poから頂点Pa´までの距離と、交点Poから頂点Pb´までの距離が等しいので、以下の式が導出される。
【0097】
【数8】
【0098】
座標変換部26_1は、式(15)〜(18)に従って、係数v1、v2、v3及びv4を算出する。また、座標変換部26_1は、算出した係数v1、v2、v3及びv4から、頂点Pa´、頂点Pb´、頂点Pc´及び頂点Pd´の座標を算出する。また、座標変換部26_1は、式(19)に従って、hを算出する。
なお、座標変換部26_1は、次の式(20)に従って、hを算出してもよい。
【0099】
【数9】
【0100】
ここで、頂点Pb´から頂点Pa´までの線分と、頂点Pb´から頂点Pc´までの線分とが成す角度が90度であるので、頂点Pb´から頂点Pa´までのベクトルと頂点Pb´から頂点Pc´までのベクトルの内積が0である。この内積が0であることをベクトル表記で表すと、上式(20)が導出される。
【0101】
図16は、画素値生成部26_2の処理を説明するための図である。同図において、頂点Pa、Pb、Pc及びPdを頂点とする四角形151が、4×3の領域に分割されている。また、頂点Pa´、Pb´、Pc´及びPd´を頂点とする長方形152が、同様に4×3の領域に分割されている。四角形R162の領域R161は、4×3の領域に分割された分割領域のうちの一つの領域である。長方形152の領域R162に、4×3の領域に分割された分割領域のうちの一つの領域である。
【0102】
図16の例において、画素値生成部26_2は、四角形151および長方形152を、それぞれ長辺を4分割、短辺を3分割した12個の分割領域に分割する。そして、画素値生成部26_2は、長方形152の分割領域の色情報を、対応する四角形151の分割領域の色情報とする。例えば、画素値生成部26_2は、長方形152の領域R162の色情報を、四角形151の領域R161の色情報とする。これにより、画素値生成部26_2は、長方形内の色情報を生成する。
【0103】
図17は、第1の実施形態における属性取得部27の構成を示す概略ブロック図である。属性取得部27は、特徴量算出部27_1と、特徴量照合部27_2と、属性読出部27_3とを備える。
【0104】
ここで、記憶部30には、看板が撮像された看板画像ファイルと、看板を識別する看板IDと看板画像ファイルの名前とが関連付けられた看板画像ファイルテーブルT5が記憶されている。また、記憶部30には、看板IDと看板の正面画像から抽出された特徴量とが関連付けられた看板特徴量テーブルT6が記憶されている。また、記憶部30には、看板IDとその看板の属性情報とが関連付けられた看板属性テーブルT7が記憶されている。
【0105】
特徴量算出部27_1は、正面画像生成部26から入力された看板の正面画像データFIから特徴量を抽出する。具体的には、例えば、特徴量算出部27_1は、SIFTを用いて、看板の正面画像データFIから特徴量を抽出する。
【0106】
例えば、特徴量算出部27_1は、特徴抽出にDoG(Difference of Gaussian)を用いることで拡大縮小に不変な特徴点を抽出し、輝度勾配のヒストグラムを用いることで特徴点近傍の回転を求める。そして、特徴量算出部27_1は、特徴点の周辺を4×4のブロックに分割し、ブロックごとに8方向の勾配ヒストグラムを求め、128次元の特徴ベクトルを特徴量として算出する。
【0107】
なお、特徴量算出部27_1における特徴量の抽出に、SIFTを用いたが、これに限らず、SURFを用いてもよい。
特徴量算出部27_1は、抽出した特徴量を正面看板画像特徴量として特徴量照合部27_2へ出力する。
【0108】
特徴量照合部27_2は、特徴量算出部27_1から入力された正面看板画像特徴量にマッチする特徴量を記憶部30に記憶されている看板特徴量テーブルT6より検索し、マッチした特徴量に関連付けられた看板IDを読み出す。特徴量照合部27_2は、読み出した看板IDを属性読出部27_3に出力する。
【0109】
属性読出部27_3は、特徴量照合部27_2から入力された看板IDに関連付けられた属性情報Aを看板属性テーブルT7から読み出す。属性読出部27_3は、読み出した属性情報Aを表示部40に表示させる。
【0110】
図18は、記憶部30に記憶されている看板画像ファイルテーブルT5の一例である。同図の看板画像ファイルテーブルT5において、看板ID及び看板画像ファイルの名前の組が示されている。例えば、看板IDが1の場合、看板画像ファイルの名前は「CAFE.BMP」である。
【0111】
図19は、記憶部30に記憶されている看板特徴量テーブルT6の一例である。同図の看板特徴量テーブルT6において、看板ID及び看板の正面画像の特徴量の組が示されている。例えば、看板IDが1の場合、看板の正面画像の特徴量は「C1,…,C128」である。ここで、看板の正面画像の特徴量は、128次元のベクトルを表すために、128個の成分から構成されている。
【0112】
図20は、記憶部30に記憶されている看板属性テーブルT7の一例である。同図の看板属性テーブルT7において、看板ID、看板場所、業種、店舗名の組が示されている。例えば、看板IDが1の場合、看板場所は「北緯111度、東経221度」で、業種は「飲食店」であり、店舗名が「居酒屋XXX」であることが示されている。ここで、看板場所は緯度と経度の組み合わせで表されている。
【0113】
図21は、第1の実施形態における画像処理装置1の処理の流れを示すフローチャートである。まず、ノイズ除去部21は、撮影画像データPIのノイズを除去した平滑化画像データを生成する(ステップS101)。次に、領域分割部22は、平滑化画像データが示す画像を、複数の画像領域に分割する(ステップS102)。次に、看板領域選択部23は、分割された複数の画像領域から看板領域を選択する(ステップS103)。
【0114】
次に、頂点抽出部24は、平滑化画像データから看板領域の四つの頂点の候補を抽出する(ステップS104)。次に、頂点選出部25は、四つの頂点の候補から看板領域の四つの頂点を選出する(ステップS105)。次に、正面画像生成部26は、看板領域の画像を、その看板の正面画像へ変換する(ステップS106)。次に、属性取得部27は、看板の正面画像に基づいて、看板の位置を取得する(ステップS107)。以上で、本フローチャートの処理を終了する。
【0115】
以上、本実施形態の画像処理装置1は、看板が撮像された画像を複数のセグメントに分割し、分割したセグメントの矩形度とエッジ比と色差とに基づいて、複数のセグメントから看板セグメントを選択する。
これにより、画像処理装置1は、セグメントのエッジだけでなくセグメントの矩形度と色差とを用いて、分割したセグメントをスコア化しているので、看板が斜めから撮影された画像から看板セグメントを正確に抽出することができる。
【0116】
また、画像処理装置1は、画像から線分を抽出し、線分を延長して直線化する。そして、直線化した線分の交点から看板領域の四つの頂点の候補を求める。そして、画像処理装置1は、選択した看板セグメントの情報を用いて、看板領域の四つの頂点の候補から、看板領域の四つの頂点を選択する。
これにより、画像処理装置1は、看板セグメントの情報を用いて多数存在する看板領域の四つの頂点の候補を絞り込むことができるので、短時間で看板領域の四つの頂点を抽出することができる。
【0117】
また、画像処理装置1は、抽出した看板領域の四つの頂点から構成される四角形の看板領域を、内角の全てが直角の長方形の画像に変換する。すなわち、画像処理装置1は、看板が長方形であることを利用して逆射影変換することにより、斜めから撮影された看板領域の画像から看板の正面画像を得ることができる。
【0118】
また、画像処理装置1は、得られた看板の正面画像の特徴量を算出し、算出した特徴量と予め記憶部30に記憶されている看板の正面画像の特徴量とを照合することにより、看板の位置を抽出することができる。
これによれば、画像処理装置1は、看板の正面画像を得ることができたことで看板の正面画像の特徴量を算出できるので、予め記憶部30に記憶されている特徴量との照合の精度を高めることができる。その結果、画像処理装置1は、看板の正しい位置を取得することができる。
【0119】
なお、本実施形態の看板領域選択部23は、画像中の画像領域の矩形度、該画像領域と該画像領域の周辺領域との色差、および該画像領域のエッジ比に基づいて、画像から看板領域を選択したが、これに限ったものではない。
看板領域選択部23は、画像中の画像領域の矩形度、該画像領域と該画像領域の周辺領域との色差、または該画像領域のエッジ比のうち少なくもいずれか1つに基づいて、前記画像から看板の画像を表す看板領域を選択してもよい。
その一例として、看板領域選択部23は、矩形度だけに基づいて、看板セグメントを抽出してもよい。具体的には、例えば、画像処理装置1の看板領域選択部23は、矩形度が予め決められた範囲(例えば、0.6から0.7)のセグメントを看板セグメントとして抽出してもよい。
【0120】
また、別の例として、看板領域選択部23は、セグメントとそのセグメントの周辺領域との色差だけに基づいて、看板セグメントを抽出してもよい。具体的には、例えば、看板領域選択部23は、正規化された色差が予め決められた範囲(例えば、0.7から0.8)のセグメントを看板セグメントとして抽出してもよい。
【0121】
また、看板領域選択部23は、画像領域の矩形度、該画像領域と該領域の周辺領域の色差または該画像領域のエッジ比のうち2つ以上の組に基づいて、画像領域から看板領域を選択してもよい。
例えば、看板領域選択部23は、セグメントの矩形度とそのセグメントとそのセグメントの周辺領域との色差とに基づいて、看板のセグメントを抽出してもよい。具体的には、例えば、看板領域選択部23は、矩形度が予め決められた範囲(例えば、0.6から0.8)であって正規化色差が予め決められた閾値(例えば、0.7)以上であるセグメントを看板セグメントとして抽出してもよい。
【0122】
また、看板領域選択部23は、セグメントの矩形度とそのセグメントのエッジ比とに基づいて、看板のセグメントを抽出してもよい。また、例えば、画像処理装置1の看板領域選択部23は、矩形度が予め決められた範囲(例えば、0.6から0.8)であって正規化エッジ比が予め決められた閾値(例えば、0.6)以上であるセグメントを看板セグメントとして抽出してもよい。
【0123】
また、看板領域選択部23は、セグメントとそのセグメントの周辺領域との色差とそのセグメントのエッジ比とに基づいて、看板セグメントを抽出してもよい。具体的には、例えば、看板領域選択部23は、正規化された色差が予め決められた範囲(例えば、0.6から0.8)であって正規化エッジ比が予め決められた閾値(例えば、0.6)以上であるセグメントを看板セグメントとして抽出してもよい。
以上についてまとめると、看板領域選択部23は、画像中の画像領域の矩形度、該画像領域と該画像領域の周辺領域との色差、または該画像領域のエッジ比のうちいずれか1つまたは2つ以上の組に基づいて、当該画像から看板の画像を表す看板領域を選択すればよい。
【0124】
なお、画像処理装置1は、一つの看板領域から看板の位置を特定したが、これに限らず、複数の看板領域を抽出した場合には、複数の看板領域に基づいて、看板の位置を特定してもよい。
【0125】
なお、画像処理装置1は、四角形の看板領域を抽出したが、これに限らず、四角形を除く多角形の看板領域を抽出してもよい。その場合、例えば、画像処理装置1は、以下のようにすればよい。頂点抽出部24は、画像から多角形の画像領域を形成する全ての頂点を抽出する。そして、頂点選出部25は、看板領域選択部23により選択された看板領域に基づいて、頂点抽出部24が抽出した全ての頂点から看板領域の全ての頂点を選出する。
そして、座標変換部26_1は、頂点選出部25により選出された看板領域の全ての頂点の座標を、逆射影変換により、当該看板領域を正面から見た多角形の頂点座標に変換する。そして、画素値生成部26_2は、変換した後の頂点座標に基づいて、看板領域の画素値から看板領域を正面から見た多角形内の画素値を生成する。
【0126】
<第1の実施形態の変形例1>
続いて、第1の実施形態の変形例1について説明する。第1の実施形態の変形例1における画像処理装置1は、検索部28を更に備える。属性情報取得部27の属性読出部27_3は、看板IDに対応する店舗名(例えば、「居酒屋XXX」)を読み出す。
検索部28は、読み出した店舗名(例えば、「居酒屋XXX」)を検索キーにして、インターネットを介して外部データベースを検索し、その検索結果またはその店舗名の店舗が行っているクーポン情報を取得する。そして、検索部28は、取得した検索結果またはクーポン情報を表示部40に表示する。これにより、ユーザは、その店舗に関する情報またはその店舗クーポン情報を得ることができる。
【0127】
<第1の実施形態の変形例2>
続いて、第1の実施形態の変形例2について説明する。第1の実施形態の変形例1における画像処理装置1は、看板画像中の文字または図形を特定し、特定した文字または図形を検索キーとして外部データベースを検索することにより、看板の関連情報を取得する。
【0128】
第1の実施形態の変形例1における画像処理装置1は、検索部28bと文字特定部29とを更に備える。文字図形特定部29は、正面画像生成部26により得られた正面画像に対し、OCR(Optical Character Reader)により文字または図形を特定する。
具体的には、例えば、記憶部30は、予め文字を表す文字画像と文字とが関連付けられた文字テーブル及び図形を表す図形画像と図形とが関連付けられた図形テーブルを記憶している。文字図形特定部29は、看板画像からエッジで囲まれた画像領域を抽出する。そして、文字図形特定部29は、抽出した画像領域と文字テーブルに記憶されている文字画像と照合し、画像領域の文字を特定する。文字を特定できなかった場合には、文字図形特定部29は、抽出した画像領域と図形テーブルに記憶されている図形画像と照合し、画像領域の図形を特定する。
【0129】
そして、検索部28bは、特定した文字または図形を検索キーにインターネットを介して、外部データベースを検索し、検索結果を取得する。具体的には、例えば、文字図形特定部29が「XXXカフェ」という文字を抽出した場合、検索部28bは、それを検索キーにインターネットを介して、外部データベースを検索し、その店舗に関する情報(口コミ等)を取得する。そして、検索部28bは、取得した検索結果(例えば、その店舗に関する情報)を表示部40に表示する。これにより、ユーザは、その店舗に関する情報を得ることができる。
【0130】
また、検索部28bは、看板画像をキーとして、インターネットを介して外部のデータベース中からその看板画像に類似する類似画像を検索し、その検索によりヒットしたその看板の提供元の企業のホームページまたは私的に書いたブログ等のホームページを取得する。そして、検索部28bは、取得したホームページを表示部40に表示する。
【0131】
これにより、画像処理装置1は、記憶部30の看板特徴量テーブルに該当の看板がなく、何の看板か分からない場合であっても、その検索によりヒットしたその看板の提供元の企業のホームページまたは私的に書いたブログ等のホームページを取得することができるので、ユーザは、ヒットしたWebページによりその看板の情報を取得することができる。
【0132】
なお、変形例2は、変形例1に記載の看板特徴量による看板の特定とは独立しているので、画像処理装置1は、変形例1における看板属性による情報取得と、変形例2を組み合せて使ってもよい。
【0133】
<第2の実施形態>
続いて、第2の実施形態について説明する。図22は、第2の実施形態における測位システム2の概略ブロック図である。測位システム2は、画像処理装置1bと、端末装置100と、地図画像記憶装置300と、看板検索装置400とを備える。
端末装置100は、看板を撮像し、看板が撮像された撮影画像データPIを画像処理装置1bへ無線送信する。
【0134】
画像処理装置1bは、端末装置100から受信した撮影画像データPIから看板正面画像のデータである正面画像データFIを生成し、生成した正面画像データFIを看板検索装置400へ送信する。
地図画像記憶装置300には、地図画像データMIが記憶されている。地図画像記憶装置300は、看板検索装置400から受信した位置情報Lを伴った地図画像データMIの要求Rに応じて、その位置情報Lが示す位置の地図画像データMIを看板検索装置400へ送信する。
【0135】
看板検索装置400は、画像処理装置1bから受信した正面画像データFIから、看板の位置を抽出する。そして、看板検索装置400は、看板の位置における地図画像データMIを地図画像記憶装置300から取得する。更に、看板検索装置400は、取得した地図画像データMIを用いて、看板の位置を地図上に重畳した重畳画像データTIを生成し、生成した重畳画像データTIを端末装置100に無線送信する。
【0136】
端末装置100は、看板検索装置400から受信した重畳画像データTIを表示する。これにより、端末装置100は、看板の位置を地図上に重畳した画像を表示するので、端末装置100のユーザは、看板の位置を知ることができる。
【0137】
図23は、第2の実施形態における端末装置100のハードウェア構成を示す概略ブロック図である。端末装置100は、記憶部101と、入力部102と、制御部103と、撮像部104と、通信部105と、表示部106とを備える。
記憶部101には、制御部103により実行されるプログラムが記憶されている。
入力部102は、シャッターボタンが押された旨の入力を受け付け、受け付けたシャッターボタンが押された旨を制御部103に出力する。また、入力部102は、看板位置を要求する看板位置要求を受け付け、受け付けた看板位置要求を制御部103に出力する。
【0138】
制御部103は、入力部102からシャッターボタンが押された旨が入力された場合、撮像部104に撮像させる。これにより、端末装置100のユーザは、看板を撮像することができる。
制御部103は、撮像部104により看板が撮像された撮影画像データPIを記憶部101に記憶させる。制御部103は、入力部103から看板位置要求が入力された場合、記憶部101から撮影画像データPIを読み出し、読み出した撮影画像データPIを通信部105へ出力する。
【0139】
また、制御部103は、通信部105から入力された重畳画像データTIを表示部106に表示させる。
通信部105は、画像処理装置1b及び看板検索装置400と無線により通信可能である。通信部105は、制御部103から入力された撮影画像データPIを符号化し、符号化後の撮影画像データPIを変調し、変調後の撮影画像データPIを画像処理装置1bへ送信する。
また、通信部105は、無線により看板検索装置400から受信した変調後の重畳画像データTIを復調し、復調後の重畳画像データTIを復号し、元の重畳画像データTIを生成する。そして、通信部105は、生成した重畳画像データTIを制御部103に出力する。
【0140】
図24は、第2の実施形態における画像処理装置1bのハードウェア構成を示す概略ブロック図である。図24の画像処理装置1bの構成は、図1の画像処理装置1の構成に対し、制御部20が制御部20bに変更され、通信部50が追加されたものになっている。なお、図1の第1の実施形態における画像処理装置1と共通する要素には同一の符号を付し、その具体的な説明を省略する。
【0141】
通信部50は、端末装置100から無線により送信された変調後の撮影画像データPIを受信し、変調後の撮影画像データPIを復調し、復調後の撮影画像データPIを復号することにより、元の撮影画像データPIを得る。通信部50は、得られた撮影画像データPIを制御部20bに出力する。
また、通信部50は、制御部20bから入力された正面画像データFIを看板検索装置400へ送信する。
【0142】
制御部20bは、通信部50から入力された撮影画像データPIから、正面画像データFIを抽出する。制御部20bは、抽出した正面画像データFIを通信部50へ出力し、正面画像データFIを通信部50から看板検索装置400を送信させる。
【0143】
図25は、第2の実施形態における画像処理装置1bの制御部20bの論理的な構成を示す概略ブロック図である。図25の制御部20bの構成は、図2の画像処理装置の構成に対し、属性取得部27が削除されたものになっている。なお、図2の第1の実施形態における制御部20と共通する要素には同一の符号を付し、その具体的な説明を省略する。
【0144】
図26は、第2の実施形態における地図画像記憶装置300のハードウェア構成を示す概略ブロック図である。地図画像記憶装置300は、記憶部310と、通信部320と、制御部320とを備える。
記憶部310には、位置情報Lと地図画像データMIとが記憶されている。
【0145】
通信部320は、看板検索装置400から送信された地図画像データMIの要求Rと位置情報Lとを受信し、受信した地図画像データMIの要求Rと位置情報Lとを制御部330へ送信する。また、通信部320は、制御部330から入力された地図画像データMIを看板検索装置400へ送信する。
【0146】
制御部330は、通信部320から地図画像データMIの要求Rと位置情報Lとが入力された場合、位置情報Lが示す位置に対応する地図画像データMIを記憶部310から読み出す。そして、制御部330は、読み出した地図画像データMIを通信部320に出力し、通信部320から看板検索装置400へ送信させる。
【0147】
図27は、第2の実施形態における看板検索装置400のハードウェア構成を示す概略ブロック図である。看板検索装置400は、記憶部410と、通信部420と、制御部430とを備える。
記憶部410には、看板画像ファイルと、看板画像ファイルテーブルT5と、かんばん特徴量テーブルT6と、看板属性テーブルT7とが記憶されている。
【0148】
通信部420は、画像処理装置1bから正面画像データFIを受信し、受信した正面画像データFIを制御部430へ送信する。また、通信部420は、制御部430から入力された位置情報Lと地図画像データMIの要求Rとを地図画像記憶装置300へ送信する。
【0149】
また、通信部420は、地図画像記憶装置300から地図画像データMIを受信し、受信した地図画像データMIを制御部430へ出力する。通信部420は、制御部430から入力された重畳画像データTIを符号化し、符号化後の重畳画像データTIを変調し、変調後の重畳画像データTIを端末装置100へ無線送信する。
【0150】
制御部430は、通信部420から入力された正面画像データFIから看板の位置情報Lを取得し、位置情報Lと地図画像データMIの要求Rとを通信部420へ出力する。そして、制御部430は、通信部420から位置情報Lと地図画像データMIの要求Rとを地図画像記憶装置300へ送信させる。
また、制御部430は、通信部420から入力された地図画像データMIに基づいて、看板の位置を地図上に重畳した重畳画像データTIを生成し、生成した重畳画像データTIを通信部420に出力する。そして、制御部430は、通信部420から重畳画像データTIを端末装置100へ無線送信させる。
【0151】
図28は、第2の実施形態における看板検索装置400の制御部430の論理的な構成を示す概略ブロック図である。制御部430は、特徴量算出部27_1と、特徴量照合部27_2と属性読出部27_3bと、現在位置地図作成部431とを備える。なお、図17の第1の実施形態における属性取得部27と共通する要素には同一の符号を付し、その具体的な説明を省略する。
【0152】
属性読出部27_3bは、第1の実施形態における属性読出部27_3と同様の機能を持つが、以下の点で異なる。属性読出部27_3bは、看板属性テーブルT7から読み出した位置情報Lと、地図画像データMIの要求Rとを通信部420へ出力する。また、属性読出部27_3bは、看板属性テーブルT7から読み出した位置情報Lを現在位置地図作成部431へ出力する。
【0153】
現在位置地図作成部431は、通信部420から入力された地図画像データMIが示す地図上に、属性読出部27_3bから入力された位置情報Lが示す看板の位置を重畳した重畳画像データTIを生成する。そして、現在位置地図作成部431は、生成した重畳画像データTIを通信部420へ出力する。
【0154】
以上、本実施形態の測位システム2は、端末装置1が撮像した看板が撮像された画像から、看板領域を抽出し、抽出された看板領域に基づいて現在位置を特定し、特定した現在位置を端末装置1に表示させる。これにより、端末装置1のユーザは、地下街などGPSが使えない場所でも、現在居る地点の周囲にある看板を端末装置1が備えるカメラで撮影することにより、現在居る位置を知ることができる。
【0155】
また、本実施形態の測位システム2は、電波が届かない屋内や地下においても、低コストで現在位置を取得し、現在位置を表示することができる。また、本実施形態の測位システム2は、街中にマーカーを貼り付けて位置を特定する技術のように、無機質で不自然なマーカー形状を貼り付ける必要がないので、街の景観を損なわないというメリットがある。
【0156】
なお、本実施形態の測位システム2では、画像処理装置1bと、看板検索装置400とを別装置にしたが、一つの装置で実現してもよい。また、測位システム2では、看板検索装置400と、地図画像記憶装置300とを別装置にしたが、一つの装置で実現してもよい。また、測位システム2では、画像処理装置1bと、地図画像記憶装置300とを別装置にしたが、一つの装置で実現してもよい。また、測位システム2では、画像処理装置1bと看板検索装置400と地図画像記憶装置300とを別装置にしたが、上記3つの装置を一つの装置で実現してもよい。
【0157】
<第2の実施形態の変形例1>
また、本発明の実施形態では、画像処理装置の応用例として測位システム2を説明したが、応用例はこれに限ったものでない。
例えば、画像処理装置(1、1b)を、自動車が道路標識を認識して、運転手を支援する運転手支援システムに適用してもよい。道路標識は車に対して高いところ又は道路脇に設置されているので、読み出す常に自動車に搭載したカメラに正対しているわけではない。そのため、自動車に搭載したカメラで撮影された画像から道路標識の画像領域を検出する場合、多くの場合、自動車に搭載したカメラは斜めから道路標識を撮影する。
【0158】
変形例1における画像処理装置1cは、道路標識が撮像された画像から、道路標識の正面画像を取得する。そして、画像処理装置1cは、道路標識の正面画像を予め記憶されている道路標識画像と照合することにより、道路標識が何であるか判定することができる。画像処理装置1cは、道路標識の正面画像を得た上で照合するので、道路標識をより正確に判定することができる。
【0159】
<第2の実施形態の変形例2>
また、本発明の実施形態における画像処理装置を、銘板が撮像された画像から銘板を認識させることで作業を支援する保守管理システムに適用してもよい。
屋内には電子機器の筐体にはメーカーロゴや、型式・シリアル番号等が記載された銘板が存在する。屋外でも様々な設備に設置日や規格を示す銘板が取り付けられている。そのような銘板を全て正対して撮像することは、労力がかかることである。
【0160】
変形例2における画像処理装置1dは、例えば、以下のような処理を行う。ここで、画像処理装置1dは、銘板を識別する銘板識別情報、その銘板の銘板画像、その銘板が付けられた設備または機器が設置された位置、設備または機器の保守情報、所有者の情報及び設置管理者情報を関連付けて記憶している。
【0161】
画像処理装置1dは、銘板が撮像された画像から、銘板の正面画像を取得する。そして、画像処理装置1dは、銘板の正面画像を予め記憶されている銘板画像と照合することにより、銘板識別情報を得る。
これにより、画像処理装置1dは、銘板の正面画像を得た上で照合するので、銘板が何であるか否かより正確に判定することができる。その結果、銘板を正対して撮像する必要がないので、画像処理装置1dは、設備または機器の保守または管理にかかる労力を少なくすることができる。
【0162】
また、画像処理装置1dは、銘板識別情報に関連付けられたその銘板が付けられた設備または機器が設置された位置、設備または機器の保守情報、所有者の情報及び設置管理者情報を抽出する。これにより、画像処理装置1dは、銘板識別情報に関連付けられた各種の情報を提供することができるので、銘板が付けられた設備または機器の保守及び管理を容易にすることができる。
【0163】
また、本実施形態の画像処理装置(1、1b、1c、1d)の各処理を実行するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、当該記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより、画像処理装置(1、1b、1c、1d)に係る上述した種々の処理を行ってもよい。
【0164】
なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものであってもよい。また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、フラッシュメモリ等の書き込み可能な不揮発性メモリ、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。
【0165】
さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(例えばDRAM(Dynamic Random Access Memory))のように、一定時間プログラムを保持しているものも含むものとする。また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
【0166】
以上、本発明の実施形態について図面を参照して詳述したが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
【符号の説明】
【0167】
1、 1b、1c、1d 画像処理装置
2 測位システム
10 入力部
20 制御部
21 ノイズ除去部
22 領域分割部
23 看板領域選択部
23_1 面積上位領域抽出部
23_2 色差算出部
23_3 エッジ比算出部
23_4 矩形度算出部
23_5 スコア算出部
23_6 スコア最大領域抽出部
24 頂点抽出部
24_1 線分抽出部
24_2 エッジ限定部
24_3 交点抽出部
24_4 四交点選出部
25 頂点選出部
26 正面画像生成部
26_1 座標変換部
26_2 画素値生成部
27 属性取得部
27_1 特徴量算出部
27_2 特徴量照合部
27_3、27_3b 属性読出部
28、28b 検索部
29 文字図形特定部
30 記憶部
40 表示部
100 端末装置
300 地図画像記憶装置
400 看板検索装置
431 現在位置地図作成部
【技術分野】
【0001】
本発明は、画像処理装置、画像処理方法及び画像処理プログラムに関する。
【背景技術】
【0002】
画像又は映像の中からある特定の物体を認識する特定物体認識という技術分野において、SIFT(Scale−Invariant Feature Transform、非特許文献1参照)又はSURF(Speeded Up Robust Features、非特許文献2参照)といった局所特徴量に基づく画像認識技術が知られている。このSIFT又はSURFを用いて、標識を認識する研究が行われている。
【先行技術文献】
【非特許文献】
【0003】
【非特許文献1】Lowe, Distinctive Image Features from Scale-Invariant Keypoints:International Journal of Computer Vision, 60(2), 91-110, 2004
【非特許文献2】Bay et al., SURF: Speeded-Up Robust. Features:Proc. of the 9th European Conference on Computer Vision (ECCV), 1:404-417, May 2006
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかし、これらの技術は画像中から特定の形を高速に検出することができ、(撮影方向を軸とする)回転や大きさの変化にも強いといった特徴があるが、形に着目した特徴量を利用しているため、被写体が斜めを向くような角度から撮影することによって被写体の見え方(被写体の形)が変わってしまう条件下では、画像中から特定の形を検出する検出率が落ちてしまうという問題がある。
【0005】
視点(カメラ位置)に対し高いところや低いところ、あるいは通路の脇に設置された看板又は標識は、その面の法線方向(正面)から撮影することが、不可能あるいは不便である。そのため、斜めから撮影された看板又は標識が写った画像から、正面より写した画像を得るために看板又は標識の画像領域を検出することが望まれる。
【0006】
そこで本発明は、上記問題に鑑みてなされたものであり、斜めから撮影された看板が写った画像から看板の画像領域を検出することを可能とする技術を提供することを課題とする。
【課題を解決するための手段】
【0007】
本発明は上記の課題を解決するためになされたものであり、本発明の一態様は、画像中の画像領域の矩形度、該画像領域と該画像領域の周辺領域との色差、または該画像領域のエッジ比のうちいずれか1つまたは2つ以上の組に基づいて、前記画像から看板の画像を表す看板領域を選択する看板領域選択部を備えることを特徴とする画像処理装置である。
【0008】
また、本発明の一態様は、上記の画像処理装置において、前記看板領域選択部は、前記画像領域の前記矩形度、該画像領域と該画像領域の周辺領域との前記色差、および該画像領域の前記エッジ比に基づいて、前記画像から前記看板領域を選択することを特徴とする。
【0009】
また、本発明の一態様は、上記の画像処理装置において、前記画像から四角形の画像領域を形成する四頂点を抽出する頂点抽出部と、前記看板領域に基づいて、前記頂点抽出部が抽出した四頂点から前記看板領域の四頂点を選出する頂点選出部と、を備えることを特徴とする。
【0010】
また、本発明の一態様は、上記の画像処理装置において、前記頂点選出部により選出された前記看板領域の四頂点の座標に基づいて、前記看板領域の画像から看板の正面画像を生成する正面画像生成部を備えることを特徴とする。
【0011】
また、本発明の一態様は、上記の画像処理装置において、前記看板領域選択部が選択した看板領域の特徴量に基づいて、前記看板が設置されている位置を示す位置情報を取得する属性取得部を備えることを特徴とする。
【0012】
また、本発明の一態様は、画像処理装置が実行する画像処理方法であって、画像中の画像領域の矩形度、該画像領域と該画像領域の周辺領域との色差、または該画像領域のエッジ比のうちいずれか1つまたは2つ以上の組に基づいて、前記画像から看板の画像を表す看板領域を選択する看板領域選択手順を有することを特徴とする画像処理方法である。
【0013】
また、本発明の一態様は、画像中の画像領域の矩形度、該画像領域と該画像領域の周辺領域との色差、または該画像領域のエッジ比のうちいずれか1つまたは2つ以上の組に基づいて、前記画像から看板の画像を表す看板領域を選択する看板領域選択ステップを実行させるための画像処理プログラムである。
【発明の効果】
【0014】
本発明によれば、斜めから撮影された看板が写った画像から看板の画像領域を検出することができる。
【図面の簡単な説明】
【0015】
【図1】第1の実施形態における画像処理装置のハードウェアの構成を示す概略ブロック図である。
【図2】第1の実施形態における制御部の論理的な構成を示す概略ブロック図である。
【図3】第1の実施形態における看板領域選択部の構成を示す概略ブロック図である。
【図4】記憶部に記憶されているセグメント画像テーブルT1の一例である。
【図5】正規化色差、正規化エッジ比、矩形度又はスコアを示したグラフの一例である。
【図6】第1の実施形態における頂点抽出部の構成を示す概略ブロック図である。
【図7】線分抽出部の処理を説明するための図である。
【図8】エッジ限定部の処理を説明するための図である。
【図9】記憶部に記憶されている線分テーブルT2の一例である。
【図10】交点抽出部の処理を説明するための図である。
【図11】記憶部に記憶されている交点テーブルT3の一例である。
【図12】記憶部に記憶されている四角形テーブルT4の一例である。
【図13】頂点選出部の処理を説明するための図である。
【図14】第1の実施形態における正面画像生成部の概略ブロック図である。
【図15】座標変換部の処理を説明するための図である。
【図16】画素値生成部の処理を説明するための図である。
【図17】第1の実施形態における属性取得部の構成を示す概略ブロック図である。
【図18】記憶部に記憶されている看板画像ファイルテーブルT5の一例である。
【図19】記憶部に記憶されている看板特徴量テーブルT6の一例である。
【図20】記憶部に記憶されている看板属性テーブルT7の一例である。
【図21】第1の実施形態における画像処理装置の処理の流れを示すフローチャートである。
【図22】第2の実施形態における測位システムの概略ブロック図である。
【図23】第2の実施形態における端末装置のハードウェア構成を示す概略ブロック図である。
【図24】第2の実施形態における画像処理装置のハードウェア構成を示す概略ブロック図である。
【図25】第2の実施形態における画像処理装置の制御部の論理的な構成を示す概略ブロック図である。
【図26】第2の実施形態における地図画像記憶装置のハードウェア構成を示す概略ブロック図である。
【図27】第2の実施形態における看板検索装置のハードウェア構成を示す概略ブロック図である。
【図28】第2の実施形態における看板検索装置の制御部の論理的な構成を示す概略ブロック図である。
【発明を実施するための形態】
【0016】
以下、本発明の実施形態について、図面を参照して詳細に説明する。本発明の各実施形態における看板は、長方形の形をした板に文字または図形が描かれて、見るものに対して何らかの情報を伝えるものである。従って、本発明の各実施形態における看板は、宣伝又は広告のために使われる板状の物体だけでなく、標識(例えば、道路標識)、設備または機器に付けられている銘板及び案内板を含むものとする。
【0017】
<第1の実施形態>
図1は、第1の実施形態における画像処理装置1のハードウェアの構成を示す概略ブロック図である。画像処理装置1は、入力部10と、制御部20と、記憶部30と、表示部40とを備える。
入力部10は、看板の撮影画像データ(以下、撮影画像データと称す)PIの入力を受け付ける。入力部10は、受け付けた撮影画像データPIを制御部20に出力する。ここで、撮影画像データは、ある看板が斜めから撮影されることにより得られた画像データである。
【0018】
制御部20は、入力部10から入力された撮影画像データPIに基づいて、看板の正面の画像である看板正面画像を生成し、生成した看板正面画像のデータ(以下、正面画像データと称す)FIを記憶部30に記憶させる。
そして、制御部20は、生成した正面画像データFIが示す画像の特徴量に基づいて、看板が設定されている位置を示す位置情報Lを取得し、取得した位置情報Lを表示部40に表示させる。
【0019】
図2は、第1の実施形態における制御部20の論理的な構成を示す概略ブロック図である。制御部20は、ノイズ除去部21と、領域分割部22と、看板領域選択部23と、頂点抽出部24と、頂点選出部25と、正面画像生成部26と、属性取得部27とを備える。
【0020】
ノイズ除去部21は、入力部10から入力された撮影画像データPIに対して、一例としてMedianフィルタを施し、撮影画像データPIを平滑化した平滑化画像データを生成する。これにより、ノイズ除去部21は、看板画像データPIを平滑化することにより看板画像データPIからノイズを除去することができる。ノイズ除去部21は、生成した平滑化画像データを領域分割部22と、頂点抽出部24とへ出力する。
【0021】
なお、本実施形態におけるノイズ除去部21は、Medianフィルタを用いたが、これに限らず、フィルタはノイズを低減するフィルタであればよい。
【0022】
領域分割部22は、ノイズ除去部21から入力された平滑化画像データを、MeanShift(平均値シフト)法を用いて、類似する色情報をもつ複数の画像領域(以下、セグメントと称する)に分割する。ここで、本実施形態において、画像の領域分割に用いるMeanShift(平均値シフト)法は、Comaniciu, D. and Meer, P. (2002). Mean Shift: A Robust Approach Toward Feature Space Analysis. IEEE Transactions on Pattern Analysis and Machine Intelligence, 24(5):603-619に開示されている。
【0023】
看板はおもに単色の文字、単色の背景で構成されるので、領域分割部22は看板が撮影された撮影画像を色情報にもとづいて、複数のセグメントに分割(以後、セグメンテーションとも称す)する。
領域分割部22は、分割したセグメントを示す分割セグメント情報を看板領域選択部23に出力する。また、領域分割部22は、分割したセグメントの画像のファイル(セグメント画像ファイル)を記憶部30に記憶させる。
【0024】
看板領域選択部23は、領域分割部22から入力された分割セグメント情報が示すセグメントの矩形度とエッジ比と色差とに基づいて、画像から看板の画像を表す看板領域を選択する。看板領域選択部23は、選択した看板領域を示す看板領域情報を頂点選出部25に出力する。
【0025】
頂点抽出部24は、ノイズ除去部21から入力された平滑化画像データ画像から四角形の画像領域を形成する四頂点を抽出する。頂点抽出部24は、抽出した四頂点を記憶部30に記憶させる。
【0026】
頂点選出部25は、看板領域選択部23から入力された看板領域情報が示す看板領域に基づいて、頂点抽出部24が抽出した四頂点から看板領域の四頂点を選出する。頂点選出部25は、選出した看板領域の四頂点の座標を正面画像生成部26に出力する。
【0027】
正面画像生成部26は、頂点選出部25により選出された看板領域の四頂点の座標に基づいて、看板領域の画像から看板の正面画像を生成する。
正面画像生成部26は、生成した看板の正面画像を、正面看板画像ファイルとして記憶部30に記憶させる。また、正面画像生成部26は、生成した看板の正面画像データFIを属性取得部27に出力する。
【0028】
属性取得部27は、正面画像生成部26により入力された看板の正面画像データFIが示す看板領域の特徴量を算出し、算出した特徴量に基づいて、看板の属性を示す属性情報Aを記憶部30から取得する。属性取得部27は、取得した属性情報Aを表示部40に表示させる。
【0029】
図3は、第1の実施形態における看板領域選択部23の構成を示す概略ブロック図である。看板領域選択部23は、面積上位領域抽出部23_1と、色差算出部23_2と、エッジ比算出部23_3と、矩形度算出部23_4と、スコア算出部23_5と、スコア最大領域抽出部23_6とを備える。
【0030】
面積上位領域抽出部23_1は、領域分割部22から入力された分割セグメント情報を用いて各セグメントの面積を算出する。そして、面積上位領域抽出部23_1は、分割セグメント情報が示す分割セグメントのうちから、面積の大きい上位10個のセグメント(以下、面積上位10セグメントと称す)を抽出する。これにより、面積上位領域抽出部23_1は、分割された画像領域を、面積の大きい順に上位10領域を抽出する。
【0031】
なお、面積上位領域抽出部23_1は、セグメントを10領域分抽出したが、これに限らず、9以下の領域でもよいし、11以上の領域でもよい。
【0032】
面積上位領域抽出部23_1は、抽出した面積上位10セグメントに対して、セグメントの面積の大きい順にセグメントを識別するセグメントIDを振る。そして、面積上位領域抽出部23_1は、セグメントID、セグメント画像ファイルのファイル名、面積及びエッジのピクセル座標を関連付けて記憶部30のセグメント画像テーブルT1に記憶させる。
面積上位領域抽出部23_1は、抽出した面積上位10セグメントを色差算出部23_2と、エッジ比算出部23_3と、矩形度算出部23_4とへ出力する。
【0033】
色差算出部23_2は、面積上位領域抽出部23_1から入力された面積上位10セグメントに対して、各セグメントと当該セグメントの周辺領域との平均色差を算出する。具体的には、例えば、色差算出部23_2は、セグメントのエッジを構成する各ピクセルについて、上下左右4近傍のピクセルとのL*a*b*表色系における色差(L*、a*、b*成分それぞれの差分の二乗の和の平方根)をそれぞれ算出する。なお、L*a*b*表色系以外の表色系でもよい。
【0034】
そして、色差算出部23_2は、算出した4つの値のうち最も大きいものをそのピクセルにおける色差とする。更に、色差算出部23_2は、セグメントエッジを構成する全てのピクセルにおける色差の平均値を平均色差として算出する。
ここで、平均色差は、看板内部の文字又は図形と、看板内部の背景部分とでは色差が大きいことに基づいて、数式化されたものである。
【0035】
色差算出部23_2は、算出したセグメント毎の平均色差を、面積上位10セグメント分の平均色差の最大値で正規化する。色差算出部23_2が面積上位10セグメント分の平均色差の最大値を分母にして正規化するので、正規化後の平均色差の最大値は1である。
色差算出部23_2は、正規化後の平均色差を正規化色差Cとして、面積上位10セグメント分の正規化色差Cをスコア算出部23_5に出力する。
【0036】
エッジ比算出部23_3は、面積上位領域抽出部23_1から入力された面積上位10セグメントに対して、セグメントの内側のエッジ長に対する該セグメントの外側のエッジ長の比(内側長さ/外側長さ)をエッジ比として算出する。ここで、セグメントの内側のエッジ長とは、セグメント内部に存在する内部セグメントの外縁のピクセル数である。また、セグメントの外側のエッジ長とは、セグメント全体の外縁のピクセル数である。すなわち、エッジ比は、セグメント内部に存在する内部セグメントの外縁のピクセル数に対するセグメント全体の外縁のピクセル数の比といえる。
ここで、看板内部には文字又は図形が存在し、内部セグメントの外縁は、その文字又は図形の輪郭となる。その文字又は図形の輪郭が通常入り組んでいるため、セグメントが看板領域の場合の該セグメントの内側のエッジ長は、面積が同一で輪郭が入り組んでいないセグメントのエッジ長よりも長くなる。エッジ比は、セグメントが看板領域の場合に、1に近くなることを利用して、数式化されたものである。
【0037】
エッジ比算出部23_3は、算出した各エッジ比を、面積上位10セグメント分のエッジ比の最大値で正規化する。エッジ比算出部23_3が面積上位10セグメント分のエッジ比の最大値で正規化するので、正規化後のエッジ比の最大値は1である。
エッジ比算出部23_3は、正規化後のエッジ比を正規化エッジ比Eとして、面積上位10セグメント分の正規化エッジ比Eをスコア算出部23_5に出力する。
【0038】
矩形度算出部23_4は、面積上位領域抽出部23_1から入力された面積上位10セグメントのそれぞれに対し、セグメントの垂直エッジピクセル数Nvと、セグメントの水平エッジピクセル数Nhと、セグメントを構成する画素数であるセグメントピクセル数Npとを算出する。ここで、セグメントピクセル数は、セグメントの面積を反映している。
【0039】
矩形度算出部23_4は、算出したセグメントの垂直エッジピクセル数Nvとセグメントの水平エッジピクセル数Nhとセグメントピクセル数Npとに基づいて、面積上位10セグメント分の矩形度Kを算出する。
具体的には、例えば、矩形度算出部23_4は、以下の式(1)に従って、矩形度Kを算出する。
【0040】
K=Nv×Nh/Np …(1)
【0041】
上式(1)の矩形度Kは、看板の外形は、長方形のものが多いので、セグメントの垂直エッジピクセル数と水平エッジピクセル数を掛け合わせたものを、セグメント内ピクセル数で除したものがほぼ1となることを利用して数式化されたものである。
矩形度算出部23_4は、算出した面積上位10セグメント分の矩形度Kを、スコア算出部23_5に出力する。
【0042】
スコア算出部23_5は、色差算出部23_2から入力された正規化色差Cと、エッジ比算出部23_3から入力された正規化エッジ比Eと、矩形度算出部23_4から入力された矩形度Kとに基づいて、面積上位10セグメント分のスコアSを算出する。
具体的には、例えば、スコア算出部23_5は、以下の式(2)に従って、スコアSを算出する。
【0043】
S=C+K−|E−d| …(2)
【0044】
ここで、上式(2)の定数d(例えば、0.6)は、正規化項である。
スコア算出部23_5は、算出した各スコアSを、記憶部30のセグメント画像テーブルT1内の該当するセグメントIDの箇所に追記する。
【0045】
スコア最大領域抽出部23_6は、スコア算出部23_5から入力された面積上位10セグメント分のスコアSのうち、スコアSが最大となるセグメントIDを記憶部30に記憶されているセグメント画像テーブルT1から抽出する。
スコア最大領域抽出部23_6は、抽出したセグメントIDをスコア最大セグメントIDとして、頂点選出部25に出力する。
【0046】
図4は、記憶部30に記憶されているセグメント画像テーブルT1の一例である。同図のセグメント画像テーブルT1には、セグメントID、セグメント画像ファイルのファイル名、セグメントの面積、スコアS及びエッジのピクセル座標の組が示されている。例えば、セグメントIDが1の場合、セグメント画像ファイルのファイル名は「EDGE001.BMP」で、面積が「2353pixels」で、スコアSが「1.54」で、エッジのピクセル座標が「(10,140),…,(50,200)」あることが示されている。
【0047】
図5は、正規化色差、正規化エッジ比、矩形度又はスコアを示したグラフの一例である。縦軸は、正規化色差C、正規化エッジ比E、矩形度K又はスコアSであり、横軸は、領域番号である。この例では、セグメントIDは、セグメントの面積の大きい順につけられている。すなわちセグメントIDが1のセグメントの面積が最も大きく、セグメントIDが10のセグメントの面積が最も小さい。
【0048】
同図において、正規化色差の折れ線O41と、正規化エッジ比の折れ線O42、矩形度の折れ線O43、スコアの折れ線O44とが示されている。同図では、スコアが最大となるセグメントIDが3であることが示されている。同図の例では、スコア最大領域抽出部23_6は、セグメントidが3のセグメントを看板領域として抽出する。
【0049】
<頂点抽出部24の処理の詳細>
続いて、頂点抽出部24の処理の詳細について説明する。図6は、第1の実施形態における頂点抽出部24の構成を示す概略ブロック図である。
頂点抽出部24は、線分抽出部24_1と、エッジ限定部24_2と、交点抽出部24_3と、四交点選出部24_4とを備える。
【0050】
線分抽出部24_1は、ノイズ除去部21から入力された平滑化画像データが示す平滑化画像から線分を抽出する。具体的には、例えば、線分抽出部24_1は、平滑化画像データが示す平滑化画像に対してCannyエッジ抽出を行い、エッジの点の座標を示すエッジデータを生成する。
【0051】
線分抽出部24_1によるCannyエッジ抽出は、具体的には、例えば、以下の処理を行う。線分抽出部24_1は、平滑化画像データに対して、ガウシアンフィルタを施して平滑化する。次に、線分抽出部24_1は、ソーベルフィルタを用いてガウシアンフィルタ後の画像内のエッジ強度を算出する。また、エッジの勾配方向を4方向に振り分ける(量子化する)。
【0052】
線分抽出部24_1は、算出された画素毎のエッジの強度と、エッジにおける量子化された勾配方向とに基づいて、エッジを細線化する。具体的には、線分抽出部24_1は、画素毎に、エッジの画素と、エッジの勾配方向の隣接画素2つとを比較し、最大でなければその画素値を0とする。
【0053】
線分抽出部24_1は、画素毎に、2つの閾値(第1の閾値>第2の閾値)に基づいて、画素毎にエッジであるか否か判定する。具体的には、線分抽出部24_1は、第1の閾値より大きいエッジ強度の画素と、第2の閾値以上第1の閾値以下のエッジ強度の画素のうちエッジに結合している画素とをエッジと判定する。また、線分抽出部24_1は、それ以外は、エッジでないと判定する。
【0054】
そして、線分抽出部24_1は、生成したエッジデータに対して、Hough変換を行い、エッジ画像から線分を抽出する。線分抽出部24_1は、抽出した線分に対して線分を識別する線分IDを割り振り、線分IDと線分の始点と終点とを関連付けて記憶部30の線分テーブルT2に記憶させる。
【0055】
ここで、線分抽出部24_1によるHough変換は、具体的には、例えば、以下の処理により行われる。まず、線分抽出部24_1は、ρ−θパラメータ空間を表す2次元配列Vを用意し、その値を全てに初期化する(処理1)。次に、線分抽出部24_1は、エッジデータが示すエッジの点の座標値を直線ρ=xcosθ+ysinθの変数x、変数yに代入した式を変数ρと変数θに関する方程式とみなし、変数θを一定間隔Δθずつ増加させながら、その変数ρと変数θに関する方程式をみたす変数ρを算出する(処理2)。
【0056】
次に、線分抽出部24_1は、2次元配列Vにおいて、算出したρとθの組を表す要素の数を1増加させる(処理3)。そして、線分抽出部24_1は、全てのエッジの点で上記処理2と処理3の処理を行った後に、2次元配列Vが極大となる要素が示す変数ρと変数θの組を1以上抽出する。このρとθの組毎に、変数ρと変数θを直線ρ=xcosθ+ysinθの式に代入することにより、線分の式を得る。
【0057】
エッジ限定部24_2は、記憶部30から看板領域のエッジのピクセル座標を読み出す。エッジ限定部24_2は、看板領域のエッジのピクセル座標に基づいて、線分抽出部24_1により抽出された線分のうち、看板領域として選ばれたスコア最大セグメントから予め決められた閾値距離以上の距離にある線分を除外する。
【0058】
具体的には、例えば、エッジ限定部24_2は、記憶部30の線分テーブルT2から各線分idに関連付けられた始点と終点とを読み出しては、以下の処理を行う。エッジ限定部24_2は、看板領域のエッジのピクセル座標から、看板領域の重心を算出する。そして、エッジ限定部24_2は、看板領域の重心と線分との距離を算出する。
【0059】
そして、エッジ限定部24_2は、算出した距離が予め決められた閾値距離以上であれば、記憶部30の線分テーブルT2内の線分idに関連付けられた線分が看板領域の近傍であるか否かを示す近傍判定を偽と追記する。一方、エッジ限定部24_2は、算出した距離が予め決められた閾値距離未満であれば、記憶部30の線分テーブルT2内の線分idに関連付けられた近傍判定を真と追記する。エッジ限定部24_2は、上記処理を、線分抽出部24_1により抽出された線分の分だけ繰り返す。
エッジ限定部24_2は、閾値距離以上の距離にある線分を除外することにより限定された線分を示す限定線分情報を交点抽出部24_3に出力する。
【0060】
交点抽出部24_3は、エッジ限定部24_2から入力された限定線分情報が示す限定された線分を直線化し、直線化した線分の交点を抽出する。交点抽出部24_3は、各交点に交点を識別する交点IDを割り振り、交点IDと交点を形成する2つの線分の線分IDと交点の座標とを関連付けて記憶部30の交点テーブルT3に記憶させる。
【0061】
四交点選出部24_4は、記憶部30の交点テーブルT3に記憶されている交点の4つの組み合わせのうち、当該組み合わせを構成する4つの交点を頂点とする四角形が有する内角がいずれも180度未満である組み合わせを選出する。
具体的には、例えば、四交点選出部24_4は、記憶部30の交点テーブルT3に記憶されている交点の座標を4つ取得し、4つの交点を頂点とする四角形が有する内角を全て算出する。四交点選出部24_4は、その四角形が有する内角がいずれも180度未満である場合、四角形が有する内角がいずれも180度未満であるか否かを示す凸包判定フラグを真とし、上記以外の場合、凸包判定フラグを偽とする。
【0062】
そして、四交点選出部24_4は、交点の4つの組み合わせ全てに四角形IDを割り振り、四角形IDと頂点座標列と、凸包判定フラグとを関連付けて記憶部30の四角形テーブルT4に記憶させる。四交点選出部24_4は、上記処理を、交点の4つの組がとりうる全ての組み合わせ分、繰り返す。
【0063】
図7は、線分抽出部24_1の処理を説明するための図である。同図において、線分抽出部24_1に入力される画像G81の一例が示されている。また、画像G81からエッジが抽出されたエッジ画像G82が示されている。すなわち、エッジ画像G82は、線分抽出部24_1により抽出されたエッジデータを画像として表示したものである。また、画像G82から線分が抽出された線分抽出画像G83が示されている。すなわち、線分抽出画像G83は、線分抽出部24_1により抽出された線分を画像として表示したものである。
図7の例のように、線分抽出部24_1は、入力された画像からエッジを抽出し、エッジの点の座標を示すエッジデータから線分を抽出する。
【0064】
図8は、エッジ限定部24_2の処理を説明するための図である。同図において、図7で示された線分抽出画像G83と、看板領域のエッジのピクセル座標(20,100),…,(200,400)とが示されている。ここで、看板領域のエッジのピクセル座標は、ij座標系における座標である。また、同図において、線分が抽出された画像G83から看板領域として選ばれたスコア最大セグメントから一定以上の距離にある線分が除外された線分限定画像G91が示されている。
【0065】
図8の例のように、エッジ限定部24_2は、看板領域のエッジのピクセル座標に基づいて、線分抽出画像G83中に示された線分のうち、看板領域として選ばれたスコア最大セグメントから予め決められた閾値距離以上の距離にある線分を除外する。
【0066】
図9は、記憶部30に記憶されている線分テーブルT2の一例である。同図に線分テーブルT2において、線分ID、始点、終点、近傍判定の組が示されている。例えば、線分idが1の場合、始点が(43,74)で、終点が(194,523)で、近傍判定が「真」であることが示されている。すなわち、線分idが1の線分は、エッジ限定部24_2により限定された線分に含まれる。
【0067】
図10は、交点抽出部24_3の処理を説明するための図である。同図において、図8で示された線分限定画像G91と、線分限定画像G91中の線分が直線化された直線化画像G111と、直線化画像G111における直線の交点が抽出された交点抽出画像G112とが示されている。
図10の例のように、交点抽出部24_3は、エッジ限定部24_2により限定された線分を直線化し、直線化した線分の交点を抽出する。
【0068】
図11は、記憶部30に記憶されている交点テーブルT3の一例である。同図の交点テーブルT3において、交点ID、線分ID1、線分ID2の組が示されている。ここで、線分ID1は、交点IDが示す交点を形成する二つの線分のうち、一つの線分を識別する線分IDであり、線分ID2は、当該交点IDが示す交点を形成する二つの線分のうち、もう一方の線分を識別する線分IDである。例えば、交点IDが1の場合、線分ID1が「1」で、線分ID2が「2」であることが示されている。
【0069】
図12は、記憶部30に記憶されている四角形テーブルT4の一例である。同図の四角形テーブルT4において、四角形ID、頂点座標列、凸包判定フラグの組が示されている。例えば、四角形IDが1の場合、「(11,39)、(502,64)、(982,765)、(54,874)」であり、凸包判定フラグが真であることが示されている。
ここで、頂点座標列は、四角形を構成する4つの頂点の座標の列である。また、凸包判定フラグが真である場合、対応する四角形が有する内角がいずれも180度未満であることを示し、凸包判定フラグが偽である場合、対応する四角形が有する内角のいずれかが180度以上であることを示している。
【0070】
<頂点選出部25の処理の詳細>
続いて、頂点選出部25における処理の詳細について説明する。頂点選出部25は、看板領域選択部23のスコア最大領域抽出部23_6から入力されたスコア最大セグメントIDに関連付けられたエッジのピクセル座標を、記憶部30のセグメント画像テーブルT1から読み出す。
【0071】
頂点選出部25は、記憶部30に記憶されている四角形テーブルT4から、凸包判定フラグが真である頂点座標列を読み出す。
頂点選出部25は、読み出した頂点座標列毎に、以下の処理を行う。頂点選出部25は、その頂点座標列に含まれる4つの座標を頂点とする四角形のエッジが通るピクセルの座標を算出する。
【0072】
頂点選出部25は、算出したピクセルの座標と、スコア最大セグメントIDに関連付けられたエッジのピクセル座標とを比較し、重複する座標の数を計数する。
頂点選出部25は、以上の処理を読み出した頂点座標列毎に行った後に、頂点選出部25は、重複する座標の数が最大の場合の頂点座標列(四角形を構成する4つの頂点の座標の列)を抽出する。これにより、頂点選出部25は、四つの頂点を抽出することができる。
【0073】
図13は、頂点選出部25の処理を説明するための図である。同図において、選定した四角形131と、スコア最大セグメントのエッジ132とが示されている。ここで、選定した四角形131とは、凸包判定フラグが真である頂点座標列の各座標を頂点とする四角形のことである。
【0074】
また同図において、一つの座標空間において、選定した四角形131とスコア最大セグメントのエッジ132とを重ねた図133とが示されている。そして、選定した四角形131とスコア最大セグメントのエッジ132とが重なるピクセルの数が一番多くなる四角形を構成する四頂点を選出することが示されている。
【0075】
図13の例において、頂点選出部25は、選定した四角形131の外縁を構成するピクセルの座標群と、スコア最大セグメントのエッジ132の座標群との間で、重複する座標の数が最大の場合における四角形を抽出し、抽出した四角形の4つの頂点を選出する。
【0076】
図14は、第1の実施形態における正面画像生成部26の概略ブロック図である。正面画像生成部26は、座標変換部26_1と、画素値生成部26_2とを備える。
座標変換部26_1は、頂点選出部25から入力された看板領域の四頂点の座標を、長方形を構成する四つの座標に座標変換する。座標変換部26_1は、座標変換したことにより得られた四つの座標を画素値生成部26_2に出力する。
【0077】
画素値生成部26_2は、座標変換部26_1から入力された四つの座標に基づいて、看板領域の画素値から座標変換後の長方形内の画素値を生成する。具体的には、例えば、画素値生成部26_2は、看板領域を予め決められた分割方式(例えば、横×縦4×3)で、各分割領域に分割する。同様に、画素値生成部26_2は、座標変換後の長方形内を看板領域と同じ分割方式(例えば、4×3)で、各分割領域に分割する。そして、画素値生成部26_2は、看板領域の分割領域の色情報を、対応する長方形内の分割領域の色情報とする。
画素値生成部26_2は、座標変換後の長方形内の画素値を記憶部30に記憶させる。
【0078】
図15は、座標変換部26_1の処理を説明するための図である。同図は、看板を撮像した際のカメラの位置原点(0,0,0)とするxyz座標系であり、平面(0,0,h)は、カメラの撮像面である。頂点Pa´、頂点Pb´、頂点Pc´及び頂点Pd´からなる長方形152は、看板の外縁をなす長方形である。平面(0,0,h)において四角形151を構成する頂点Pa、Pb、Pc及びPdが示されている。
【0079】
頂点Pa´、頂点Pb´、頂点Pc´及び頂点Pd´からなる長方形が、原点にあるカメラから撮像された場合、頂点Pa´、頂点Pb´、頂点Pc´及び頂点Pd´からなる長方形は平面(0,0,h)上に射影され、平面(0,0,h)において、頂点Pa、頂点Pb、頂点Pc及び頂点Pdからなる四角形が形成される。
すなわち三次元空間中の頂点Pa´、頂点Pb´、頂点Pc´及び頂点Pd´からなる長方形は、射影変換された結果、頂点Pa、頂点Pb、頂点Pc及び頂点Pdを頂点とする四角形に変換されたものとする。
【0080】
図15の例において、逆射影変換により、座標変換部26_1は、看板領域の外縁をなす四角形の四頂点(頂点Pa、頂点Pb、頂点Pc及び頂点Pd)の座標から、内角がいずれも90度である長方形の四頂点(頂点Pa´、頂点Pb´、頂点Pc´及び頂点Pd´)の座標を算出する。
【0081】
具体的には、例えば、座標変換部26_1は、以下の処理に従って、長方形の四頂点(頂点Pa´、頂点Pb´、頂点Pc´及び頂点Pd´)の座標を算出する。
図15において、頂点Pa´、頂点Pb´、頂点Pc´及び頂点Pd´の座標と、頂点Pa、頂点Pb、頂点Pc及び頂点Pdの座標との関係をベクトル表記で表すと以下のように表される。
【0082】
【数1】
【0083】
ここで、Pa´、Pa、Pb´、Pb、Pc´、Pc、Pd´、Pdはベクトルであり、v1、v2、v3及びv4は係数である。ここで、四角形151を構成する頂点(Pa、Pb、Pc及びPd)の座標は既知であるから、座標変換部26_1は、係数v1、v2、v3及びv4を算出し、係数v1、v2、v3及びv4を用いて長方形152を構成する頂点(Pa´、Pb´、Pc´及びPd´)の座標を算出する。
【0084】
このとき、四角形151の対角線の交点Poは、ベクトル表記で、以下の2つの式で表される。
【0085】
【数2】
【0086】
ここで、u1及びu2は係数である。座標変換部26_1は、上式(9)と(10)からu1及びu2を算出し、算出したu1又はu2を用いて四角形151の対角線の交点Poの座標を算出する。
射影変換前後で、四角形151の対角線の交点Poが一致するので、以下の式が導出される。
【0087】
【数3】
【0088】
ここで、式(9)に式(3)と式(4)が代入され、式(10)に式(5)と式(6)が代入されると、以下のベクトル表現の式が導出される。
【0089】
【数4】
【0090】
式(11)と式(12)の関係は、平面(0,0,h)上の点の関係である。そのため、式(11)と式(12)の関係のz成分についての関係式において、z=hであるから、以下の式が得られる。
【0091】
【数5】
【0092】
式(11)と式(13)より、係数v1と係数v2とが以下のように算出される。
【0093】
【数6】
【0094】
また、式(12)と式(14)より、係数v3と係数v4とが以下のように算出される。
【0095】
【数7】
【0096】
また、頂点Pa´、四角形151の対角線の交点Po及び頂点Pb´を頂点とする三角形は二等辺三角形であるから、交点Poから頂点Pa´までの距離と、交点Poから頂点Pb´までの距離が等しいので、以下の式が導出される。
【0097】
【数8】
【0098】
座標変換部26_1は、式(15)〜(18)に従って、係数v1、v2、v3及びv4を算出する。また、座標変換部26_1は、算出した係数v1、v2、v3及びv4から、頂点Pa´、頂点Pb´、頂点Pc´及び頂点Pd´の座標を算出する。また、座標変換部26_1は、式(19)に従って、hを算出する。
なお、座標変換部26_1は、次の式(20)に従って、hを算出してもよい。
【0099】
【数9】
【0100】
ここで、頂点Pb´から頂点Pa´までの線分と、頂点Pb´から頂点Pc´までの線分とが成す角度が90度であるので、頂点Pb´から頂点Pa´までのベクトルと頂点Pb´から頂点Pc´までのベクトルの内積が0である。この内積が0であることをベクトル表記で表すと、上式(20)が導出される。
【0101】
図16は、画素値生成部26_2の処理を説明するための図である。同図において、頂点Pa、Pb、Pc及びPdを頂点とする四角形151が、4×3の領域に分割されている。また、頂点Pa´、Pb´、Pc´及びPd´を頂点とする長方形152が、同様に4×3の領域に分割されている。四角形R162の領域R161は、4×3の領域に分割された分割領域のうちの一つの領域である。長方形152の領域R162に、4×3の領域に分割された分割領域のうちの一つの領域である。
【0102】
図16の例において、画素値生成部26_2は、四角形151および長方形152を、それぞれ長辺を4分割、短辺を3分割した12個の分割領域に分割する。そして、画素値生成部26_2は、長方形152の分割領域の色情報を、対応する四角形151の分割領域の色情報とする。例えば、画素値生成部26_2は、長方形152の領域R162の色情報を、四角形151の領域R161の色情報とする。これにより、画素値生成部26_2は、長方形内の色情報を生成する。
【0103】
図17は、第1の実施形態における属性取得部27の構成を示す概略ブロック図である。属性取得部27は、特徴量算出部27_1と、特徴量照合部27_2と、属性読出部27_3とを備える。
【0104】
ここで、記憶部30には、看板が撮像された看板画像ファイルと、看板を識別する看板IDと看板画像ファイルの名前とが関連付けられた看板画像ファイルテーブルT5が記憶されている。また、記憶部30には、看板IDと看板の正面画像から抽出された特徴量とが関連付けられた看板特徴量テーブルT6が記憶されている。また、記憶部30には、看板IDとその看板の属性情報とが関連付けられた看板属性テーブルT7が記憶されている。
【0105】
特徴量算出部27_1は、正面画像生成部26から入力された看板の正面画像データFIから特徴量を抽出する。具体的には、例えば、特徴量算出部27_1は、SIFTを用いて、看板の正面画像データFIから特徴量を抽出する。
【0106】
例えば、特徴量算出部27_1は、特徴抽出にDoG(Difference of Gaussian)を用いることで拡大縮小に不変な特徴点を抽出し、輝度勾配のヒストグラムを用いることで特徴点近傍の回転を求める。そして、特徴量算出部27_1は、特徴点の周辺を4×4のブロックに分割し、ブロックごとに8方向の勾配ヒストグラムを求め、128次元の特徴ベクトルを特徴量として算出する。
【0107】
なお、特徴量算出部27_1における特徴量の抽出に、SIFTを用いたが、これに限らず、SURFを用いてもよい。
特徴量算出部27_1は、抽出した特徴量を正面看板画像特徴量として特徴量照合部27_2へ出力する。
【0108】
特徴量照合部27_2は、特徴量算出部27_1から入力された正面看板画像特徴量にマッチする特徴量を記憶部30に記憶されている看板特徴量テーブルT6より検索し、マッチした特徴量に関連付けられた看板IDを読み出す。特徴量照合部27_2は、読み出した看板IDを属性読出部27_3に出力する。
【0109】
属性読出部27_3は、特徴量照合部27_2から入力された看板IDに関連付けられた属性情報Aを看板属性テーブルT7から読み出す。属性読出部27_3は、読み出した属性情報Aを表示部40に表示させる。
【0110】
図18は、記憶部30に記憶されている看板画像ファイルテーブルT5の一例である。同図の看板画像ファイルテーブルT5において、看板ID及び看板画像ファイルの名前の組が示されている。例えば、看板IDが1の場合、看板画像ファイルの名前は「CAFE.BMP」である。
【0111】
図19は、記憶部30に記憶されている看板特徴量テーブルT6の一例である。同図の看板特徴量テーブルT6において、看板ID及び看板の正面画像の特徴量の組が示されている。例えば、看板IDが1の場合、看板の正面画像の特徴量は「C1,…,C128」である。ここで、看板の正面画像の特徴量は、128次元のベクトルを表すために、128個の成分から構成されている。
【0112】
図20は、記憶部30に記憶されている看板属性テーブルT7の一例である。同図の看板属性テーブルT7において、看板ID、看板場所、業種、店舗名の組が示されている。例えば、看板IDが1の場合、看板場所は「北緯111度、東経221度」で、業種は「飲食店」であり、店舗名が「居酒屋XXX」であることが示されている。ここで、看板場所は緯度と経度の組み合わせで表されている。
【0113】
図21は、第1の実施形態における画像処理装置1の処理の流れを示すフローチャートである。まず、ノイズ除去部21は、撮影画像データPIのノイズを除去した平滑化画像データを生成する(ステップS101)。次に、領域分割部22は、平滑化画像データが示す画像を、複数の画像領域に分割する(ステップS102)。次に、看板領域選択部23は、分割された複数の画像領域から看板領域を選択する(ステップS103)。
【0114】
次に、頂点抽出部24は、平滑化画像データから看板領域の四つの頂点の候補を抽出する(ステップS104)。次に、頂点選出部25は、四つの頂点の候補から看板領域の四つの頂点を選出する(ステップS105)。次に、正面画像生成部26は、看板領域の画像を、その看板の正面画像へ変換する(ステップS106)。次に、属性取得部27は、看板の正面画像に基づいて、看板の位置を取得する(ステップS107)。以上で、本フローチャートの処理を終了する。
【0115】
以上、本実施形態の画像処理装置1は、看板が撮像された画像を複数のセグメントに分割し、分割したセグメントの矩形度とエッジ比と色差とに基づいて、複数のセグメントから看板セグメントを選択する。
これにより、画像処理装置1は、セグメントのエッジだけでなくセグメントの矩形度と色差とを用いて、分割したセグメントをスコア化しているので、看板が斜めから撮影された画像から看板セグメントを正確に抽出することができる。
【0116】
また、画像処理装置1は、画像から線分を抽出し、線分を延長して直線化する。そして、直線化した線分の交点から看板領域の四つの頂点の候補を求める。そして、画像処理装置1は、選択した看板セグメントの情報を用いて、看板領域の四つの頂点の候補から、看板領域の四つの頂点を選択する。
これにより、画像処理装置1は、看板セグメントの情報を用いて多数存在する看板領域の四つの頂点の候補を絞り込むことができるので、短時間で看板領域の四つの頂点を抽出することができる。
【0117】
また、画像処理装置1は、抽出した看板領域の四つの頂点から構成される四角形の看板領域を、内角の全てが直角の長方形の画像に変換する。すなわち、画像処理装置1は、看板が長方形であることを利用して逆射影変換することにより、斜めから撮影された看板領域の画像から看板の正面画像を得ることができる。
【0118】
また、画像処理装置1は、得られた看板の正面画像の特徴量を算出し、算出した特徴量と予め記憶部30に記憶されている看板の正面画像の特徴量とを照合することにより、看板の位置を抽出することができる。
これによれば、画像処理装置1は、看板の正面画像を得ることができたことで看板の正面画像の特徴量を算出できるので、予め記憶部30に記憶されている特徴量との照合の精度を高めることができる。その結果、画像処理装置1は、看板の正しい位置を取得することができる。
【0119】
なお、本実施形態の看板領域選択部23は、画像中の画像領域の矩形度、該画像領域と該画像領域の周辺領域との色差、および該画像領域のエッジ比に基づいて、画像から看板領域を選択したが、これに限ったものではない。
看板領域選択部23は、画像中の画像領域の矩形度、該画像領域と該画像領域の周辺領域との色差、または該画像領域のエッジ比のうち少なくもいずれか1つに基づいて、前記画像から看板の画像を表す看板領域を選択してもよい。
その一例として、看板領域選択部23は、矩形度だけに基づいて、看板セグメントを抽出してもよい。具体的には、例えば、画像処理装置1の看板領域選択部23は、矩形度が予め決められた範囲(例えば、0.6から0.7)のセグメントを看板セグメントとして抽出してもよい。
【0120】
また、別の例として、看板領域選択部23は、セグメントとそのセグメントの周辺領域との色差だけに基づいて、看板セグメントを抽出してもよい。具体的には、例えば、看板領域選択部23は、正規化された色差が予め決められた範囲(例えば、0.7から0.8)のセグメントを看板セグメントとして抽出してもよい。
【0121】
また、看板領域選択部23は、画像領域の矩形度、該画像領域と該領域の周辺領域の色差または該画像領域のエッジ比のうち2つ以上の組に基づいて、画像領域から看板領域を選択してもよい。
例えば、看板領域選択部23は、セグメントの矩形度とそのセグメントとそのセグメントの周辺領域との色差とに基づいて、看板のセグメントを抽出してもよい。具体的には、例えば、看板領域選択部23は、矩形度が予め決められた範囲(例えば、0.6から0.8)であって正規化色差が予め決められた閾値(例えば、0.7)以上であるセグメントを看板セグメントとして抽出してもよい。
【0122】
また、看板領域選択部23は、セグメントの矩形度とそのセグメントのエッジ比とに基づいて、看板のセグメントを抽出してもよい。また、例えば、画像処理装置1の看板領域選択部23は、矩形度が予め決められた範囲(例えば、0.6から0.8)であって正規化エッジ比が予め決められた閾値(例えば、0.6)以上であるセグメントを看板セグメントとして抽出してもよい。
【0123】
また、看板領域選択部23は、セグメントとそのセグメントの周辺領域との色差とそのセグメントのエッジ比とに基づいて、看板セグメントを抽出してもよい。具体的には、例えば、看板領域選択部23は、正規化された色差が予め決められた範囲(例えば、0.6から0.8)であって正規化エッジ比が予め決められた閾値(例えば、0.6)以上であるセグメントを看板セグメントとして抽出してもよい。
以上についてまとめると、看板領域選択部23は、画像中の画像領域の矩形度、該画像領域と該画像領域の周辺領域との色差、または該画像領域のエッジ比のうちいずれか1つまたは2つ以上の組に基づいて、当該画像から看板の画像を表す看板領域を選択すればよい。
【0124】
なお、画像処理装置1は、一つの看板領域から看板の位置を特定したが、これに限らず、複数の看板領域を抽出した場合には、複数の看板領域に基づいて、看板の位置を特定してもよい。
【0125】
なお、画像処理装置1は、四角形の看板領域を抽出したが、これに限らず、四角形を除く多角形の看板領域を抽出してもよい。その場合、例えば、画像処理装置1は、以下のようにすればよい。頂点抽出部24は、画像から多角形の画像領域を形成する全ての頂点を抽出する。そして、頂点選出部25は、看板領域選択部23により選択された看板領域に基づいて、頂点抽出部24が抽出した全ての頂点から看板領域の全ての頂点を選出する。
そして、座標変換部26_1は、頂点選出部25により選出された看板領域の全ての頂点の座標を、逆射影変換により、当該看板領域を正面から見た多角形の頂点座標に変換する。そして、画素値生成部26_2は、変換した後の頂点座標に基づいて、看板領域の画素値から看板領域を正面から見た多角形内の画素値を生成する。
【0126】
<第1の実施形態の変形例1>
続いて、第1の実施形態の変形例1について説明する。第1の実施形態の変形例1における画像処理装置1は、検索部28を更に備える。属性情報取得部27の属性読出部27_3は、看板IDに対応する店舗名(例えば、「居酒屋XXX」)を読み出す。
検索部28は、読み出した店舗名(例えば、「居酒屋XXX」)を検索キーにして、インターネットを介して外部データベースを検索し、その検索結果またはその店舗名の店舗が行っているクーポン情報を取得する。そして、検索部28は、取得した検索結果またはクーポン情報を表示部40に表示する。これにより、ユーザは、その店舗に関する情報またはその店舗クーポン情報を得ることができる。
【0127】
<第1の実施形態の変形例2>
続いて、第1の実施形態の変形例2について説明する。第1の実施形態の変形例1における画像処理装置1は、看板画像中の文字または図形を特定し、特定した文字または図形を検索キーとして外部データベースを検索することにより、看板の関連情報を取得する。
【0128】
第1の実施形態の変形例1における画像処理装置1は、検索部28bと文字特定部29とを更に備える。文字図形特定部29は、正面画像生成部26により得られた正面画像に対し、OCR(Optical Character Reader)により文字または図形を特定する。
具体的には、例えば、記憶部30は、予め文字を表す文字画像と文字とが関連付けられた文字テーブル及び図形を表す図形画像と図形とが関連付けられた図形テーブルを記憶している。文字図形特定部29は、看板画像からエッジで囲まれた画像領域を抽出する。そして、文字図形特定部29は、抽出した画像領域と文字テーブルに記憶されている文字画像と照合し、画像領域の文字を特定する。文字を特定できなかった場合には、文字図形特定部29は、抽出した画像領域と図形テーブルに記憶されている図形画像と照合し、画像領域の図形を特定する。
【0129】
そして、検索部28bは、特定した文字または図形を検索キーにインターネットを介して、外部データベースを検索し、検索結果を取得する。具体的には、例えば、文字図形特定部29が「XXXカフェ」という文字を抽出した場合、検索部28bは、それを検索キーにインターネットを介して、外部データベースを検索し、その店舗に関する情報(口コミ等)を取得する。そして、検索部28bは、取得した検索結果(例えば、その店舗に関する情報)を表示部40に表示する。これにより、ユーザは、その店舗に関する情報を得ることができる。
【0130】
また、検索部28bは、看板画像をキーとして、インターネットを介して外部のデータベース中からその看板画像に類似する類似画像を検索し、その検索によりヒットしたその看板の提供元の企業のホームページまたは私的に書いたブログ等のホームページを取得する。そして、検索部28bは、取得したホームページを表示部40に表示する。
【0131】
これにより、画像処理装置1は、記憶部30の看板特徴量テーブルに該当の看板がなく、何の看板か分からない場合であっても、その検索によりヒットしたその看板の提供元の企業のホームページまたは私的に書いたブログ等のホームページを取得することができるので、ユーザは、ヒットしたWebページによりその看板の情報を取得することができる。
【0132】
なお、変形例2は、変形例1に記載の看板特徴量による看板の特定とは独立しているので、画像処理装置1は、変形例1における看板属性による情報取得と、変形例2を組み合せて使ってもよい。
【0133】
<第2の実施形態>
続いて、第2の実施形態について説明する。図22は、第2の実施形態における測位システム2の概略ブロック図である。測位システム2は、画像処理装置1bと、端末装置100と、地図画像記憶装置300と、看板検索装置400とを備える。
端末装置100は、看板を撮像し、看板が撮像された撮影画像データPIを画像処理装置1bへ無線送信する。
【0134】
画像処理装置1bは、端末装置100から受信した撮影画像データPIから看板正面画像のデータである正面画像データFIを生成し、生成した正面画像データFIを看板検索装置400へ送信する。
地図画像記憶装置300には、地図画像データMIが記憶されている。地図画像記憶装置300は、看板検索装置400から受信した位置情報Lを伴った地図画像データMIの要求Rに応じて、その位置情報Lが示す位置の地図画像データMIを看板検索装置400へ送信する。
【0135】
看板検索装置400は、画像処理装置1bから受信した正面画像データFIから、看板の位置を抽出する。そして、看板検索装置400は、看板の位置における地図画像データMIを地図画像記憶装置300から取得する。更に、看板検索装置400は、取得した地図画像データMIを用いて、看板の位置を地図上に重畳した重畳画像データTIを生成し、生成した重畳画像データTIを端末装置100に無線送信する。
【0136】
端末装置100は、看板検索装置400から受信した重畳画像データTIを表示する。これにより、端末装置100は、看板の位置を地図上に重畳した画像を表示するので、端末装置100のユーザは、看板の位置を知ることができる。
【0137】
図23は、第2の実施形態における端末装置100のハードウェア構成を示す概略ブロック図である。端末装置100は、記憶部101と、入力部102と、制御部103と、撮像部104と、通信部105と、表示部106とを備える。
記憶部101には、制御部103により実行されるプログラムが記憶されている。
入力部102は、シャッターボタンが押された旨の入力を受け付け、受け付けたシャッターボタンが押された旨を制御部103に出力する。また、入力部102は、看板位置を要求する看板位置要求を受け付け、受け付けた看板位置要求を制御部103に出力する。
【0138】
制御部103は、入力部102からシャッターボタンが押された旨が入力された場合、撮像部104に撮像させる。これにより、端末装置100のユーザは、看板を撮像することができる。
制御部103は、撮像部104により看板が撮像された撮影画像データPIを記憶部101に記憶させる。制御部103は、入力部103から看板位置要求が入力された場合、記憶部101から撮影画像データPIを読み出し、読み出した撮影画像データPIを通信部105へ出力する。
【0139】
また、制御部103は、通信部105から入力された重畳画像データTIを表示部106に表示させる。
通信部105は、画像処理装置1b及び看板検索装置400と無線により通信可能である。通信部105は、制御部103から入力された撮影画像データPIを符号化し、符号化後の撮影画像データPIを変調し、変調後の撮影画像データPIを画像処理装置1bへ送信する。
また、通信部105は、無線により看板検索装置400から受信した変調後の重畳画像データTIを復調し、復調後の重畳画像データTIを復号し、元の重畳画像データTIを生成する。そして、通信部105は、生成した重畳画像データTIを制御部103に出力する。
【0140】
図24は、第2の実施形態における画像処理装置1bのハードウェア構成を示す概略ブロック図である。図24の画像処理装置1bの構成は、図1の画像処理装置1の構成に対し、制御部20が制御部20bに変更され、通信部50が追加されたものになっている。なお、図1の第1の実施形態における画像処理装置1と共通する要素には同一の符号を付し、その具体的な説明を省略する。
【0141】
通信部50は、端末装置100から無線により送信された変調後の撮影画像データPIを受信し、変調後の撮影画像データPIを復調し、復調後の撮影画像データPIを復号することにより、元の撮影画像データPIを得る。通信部50は、得られた撮影画像データPIを制御部20bに出力する。
また、通信部50は、制御部20bから入力された正面画像データFIを看板検索装置400へ送信する。
【0142】
制御部20bは、通信部50から入力された撮影画像データPIから、正面画像データFIを抽出する。制御部20bは、抽出した正面画像データFIを通信部50へ出力し、正面画像データFIを通信部50から看板検索装置400を送信させる。
【0143】
図25は、第2の実施形態における画像処理装置1bの制御部20bの論理的な構成を示す概略ブロック図である。図25の制御部20bの構成は、図2の画像処理装置の構成に対し、属性取得部27が削除されたものになっている。なお、図2の第1の実施形態における制御部20と共通する要素には同一の符号を付し、その具体的な説明を省略する。
【0144】
図26は、第2の実施形態における地図画像記憶装置300のハードウェア構成を示す概略ブロック図である。地図画像記憶装置300は、記憶部310と、通信部320と、制御部320とを備える。
記憶部310には、位置情報Lと地図画像データMIとが記憶されている。
【0145】
通信部320は、看板検索装置400から送信された地図画像データMIの要求Rと位置情報Lとを受信し、受信した地図画像データMIの要求Rと位置情報Lとを制御部330へ送信する。また、通信部320は、制御部330から入力された地図画像データMIを看板検索装置400へ送信する。
【0146】
制御部330は、通信部320から地図画像データMIの要求Rと位置情報Lとが入力された場合、位置情報Lが示す位置に対応する地図画像データMIを記憶部310から読み出す。そして、制御部330は、読み出した地図画像データMIを通信部320に出力し、通信部320から看板検索装置400へ送信させる。
【0147】
図27は、第2の実施形態における看板検索装置400のハードウェア構成を示す概略ブロック図である。看板検索装置400は、記憶部410と、通信部420と、制御部430とを備える。
記憶部410には、看板画像ファイルと、看板画像ファイルテーブルT5と、かんばん特徴量テーブルT6と、看板属性テーブルT7とが記憶されている。
【0148】
通信部420は、画像処理装置1bから正面画像データFIを受信し、受信した正面画像データFIを制御部430へ送信する。また、通信部420は、制御部430から入力された位置情報Lと地図画像データMIの要求Rとを地図画像記憶装置300へ送信する。
【0149】
また、通信部420は、地図画像記憶装置300から地図画像データMIを受信し、受信した地図画像データMIを制御部430へ出力する。通信部420は、制御部430から入力された重畳画像データTIを符号化し、符号化後の重畳画像データTIを変調し、変調後の重畳画像データTIを端末装置100へ無線送信する。
【0150】
制御部430は、通信部420から入力された正面画像データFIから看板の位置情報Lを取得し、位置情報Lと地図画像データMIの要求Rとを通信部420へ出力する。そして、制御部430は、通信部420から位置情報Lと地図画像データMIの要求Rとを地図画像記憶装置300へ送信させる。
また、制御部430は、通信部420から入力された地図画像データMIに基づいて、看板の位置を地図上に重畳した重畳画像データTIを生成し、生成した重畳画像データTIを通信部420に出力する。そして、制御部430は、通信部420から重畳画像データTIを端末装置100へ無線送信させる。
【0151】
図28は、第2の実施形態における看板検索装置400の制御部430の論理的な構成を示す概略ブロック図である。制御部430は、特徴量算出部27_1と、特徴量照合部27_2と属性読出部27_3bと、現在位置地図作成部431とを備える。なお、図17の第1の実施形態における属性取得部27と共通する要素には同一の符号を付し、その具体的な説明を省略する。
【0152】
属性読出部27_3bは、第1の実施形態における属性読出部27_3と同様の機能を持つが、以下の点で異なる。属性読出部27_3bは、看板属性テーブルT7から読み出した位置情報Lと、地図画像データMIの要求Rとを通信部420へ出力する。また、属性読出部27_3bは、看板属性テーブルT7から読み出した位置情報Lを現在位置地図作成部431へ出力する。
【0153】
現在位置地図作成部431は、通信部420から入力された地図画像データMIが示す地図上に、属性読出部27_3bから入力された位置情報Lが示す看板の位置を重畳した重畳画像データTIを生成する。そして、現在位置地図作成部431は、生成した重畳画像データTIを通信部420へ出力する。
【0154】
以上、本実施形態の測位システム2は、端末装置1が撮像した看板が撮像された画像から、看板領域を抽出し、抽出された看板領域に基づいて現在位置を特定し、特定した現在位置を端末装置1に表示させる。これにより、端末装置1のユーザは、地下街などGPSが使えない場所でも、現在居る地点の周囲にある看板を端末装置1が備えるカメラで撮影することにより、現在居る位置を知ることができる。
【0155】
また、本実施形態の測位システム2は、電波が届かない屋内や地下においても、低コストで現在位置を取得し、現在位置を表示することができる。また、本実施形態の測位システム2は、街中にマーカーを貼り付けて位置を特定する技術のように、無機質で不自然なマーカー形状を貼り付ける必要がないので、街の景観を損なわないというメリットがある。
【0156】
なお、本実施形態の測位システム2では、画像処理装置1bと、看板検索装置400とを別装置にしたが、一つの装置で実現してもよい。また、測位システム2では、看板検索装置400と、地図画像記憶装置300とを別装置にしたが、一つの装置で実現してもよい。また、測位システム2では、画像処理装置1bと、地図画像記憶装置300とを別装置にしたが、一つの装置で実現してもよい。また、測位システム2では、画像処理装置1bと看板検索装置400と地図画像記憶装置300とを別装置にしたが、上記3つの装置を一つの装置で実現してもよい。
【0157】
<第2の実施形態の変形例1>
また、本発明の実施形態では、画像処理装置の応用例として測位システム2を説明したが、応用例はこれに限ったものでない。
例えば、画像処理装置(1、1b)を、自動車が道路標識を認識して、運転手を支援する運転手支援システムに適用してもよい。道路標識は車に対して高いところ又は道路脇に設置されているので、読み出す常に自動車に搭載したカメラに正対しているわけではない。そのため、自動車に搭載したカメラで撮影された画像から道路標識の画像領域を検出する場合、多くの場合、自動車に搭載したカメラは斜めから道路標識を撮影する。
【0158】
変形例1における画像処理装置1cは、道路標識が撮像された画像から、道路標識の正面画像を取得する。そして、画像処理装置1cは、道路標識の正面画像を予め記憶されている道路標識画像と照合することにより、道路標識が何であるか判定することができる。画像処理装置1cは、道路標識の正面画像を得た上で照合するので、道路標識をより正確に判定することができる。
【0159】
<第2の実施形態の変形例2>
また、本発明の実施形態における画像処理装置を、銘板が撮像された画像から銘板を認識させることで作業を支援する保守管理システムに適用してもよい。
屋内には電子機器の筐体にはメーカーロゴや、型式・シリアル番号等が記載された銘板が存在する。屋外でも様々な設備に設置日や規格を示す銘板が取り付けられている。そのような銘板を全て正対して撮像することは、労力がかかることである。
【0160】
変形例2における画像処理装置1dは、例えば、以下のような処理を行う。ここで、画像処理装置1dは、銘板を識別する銘板識別情報、その銘板の銘板画像、その銘板が付けられた設備または機器が設置された位置、設備または機器の保守情報、所有者の情報及び設置管理者情報を関連付けて記憶している。
【0161】
画像処理装置1dは、銘板が撮像された画像から、銘板の正面画像を取得する。そして、画像処理装置1dは、銘板の正面画像を予め記憶されている銘板画像と照合することにより、銘板識別情報を得る。
これにより、画像処理装置1dは、銘板の正面画像を得た上で照合するので、銘板が何であるか否かより正確に判定することができる。その結果、銘板を正対して撮像する必要がないので、画像処理装置1dは、設備または機器の保守または管理にかかる労力を少なくすることができる。
【0162】
また、画像処理装置1dは、銘板識別情報に関連付けられたその銘板が付けられた設備または機器が設置された位置、設備または機器の保守情報、所有者の情報及び設置管理者情報を抽出する。これにより、画像処理装置1dは、銘板識別情報に関連付けられた各種の情報を提供することができるので、銘板が付けられた設備または機器の保守及び管理を容易にすることができる。
【0163】
また、本実施形態の画像処理装置(1、1b、1c、1d)の各処理を実行するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、当該記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより、画像処理装置(1、1b、1c、1d)に係る上述した種々の処理を行ってもよい。
【0164】
なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものであってもよい。また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、フラッシュメモリ等の書き込み可能な不揮発性メモリ、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。
【0165】
さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(例えばDRAM(Dynamic Random Access Memory))のように、一定時間プログラムを保持しているものも含むものとする。また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
【0166】
以上、本発明の実施形態について図面を参照して詳述したが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
【符号の説明】
【0167】
1、 1b、1c、1d 画像処理装置
2 測位システム
10 入力部
20 制御部
21 ノイズ除去部
22 領域分割部
23 看板領域選択部
23_1 面積上位領域抽出部
23_2 色差算出部
23_3 エッジ比算出部
23_4 矩形度算出部
23_5 スコア算出部
23_6 スコア最大領域抽出部
24 頂点抽出部
24_1 線分抽出部
24_2 エッジ限定部
24_3 交点抽出部
24_4 四交点選出部
25 頂点選出部
26 正面画像生成部
26_1 座標変換部
26_2 画素値生成部
27 属性取得部
27_1 特徴量算出部
27_2 特徴量照合部
27_3、27_3b 属性読出部
28、28b 検索部
29 文字図形特定部
30 記憶部
40 表示部
100 端末装置
300 地図画像記憶装置
400 看板検索装置
431 現在位置地図作成部
【特許請求の範囲】
【請求項1】
画像中の画像領域の矩形度、該画像領域と該画像領域の周辺領域との色差、または該画像領域のエッジ比のうちいずれか1つまたは2つ以上の組に基づいて、前記画像から看板の画像を表す看板領域を選択する看板領域選択部を備えることを特徴とする画像処理装置。
【請求項2】
前記看板領域選択部は、前記画像領域の前記矩形度、該画像領域と該画像領域の周辺領域との前記色差、および該画像領域の前記エッジ比に基づいて、前記画像から前記看板領域を選択することを特徴とする請求項1に記載の画像処理装置。
【請求項3】
前記画像から四角形の画像領域を形成する四頂点を抽出する頂点抽出部と、
前記看板領域に基づいて、前記頂点抽出部が抽出した四頂点から前記看板領域の四頂点を選出する頂点選出部と、
を備えることを特徴とする請求項1又は請求項2に記載の画像処理装置。
【請求項4】
前記頂点選出部により選出された前記看板領域の四頂点の座標に基づいて、前記看板領域の画像から看板の正面画像を生成する正面画像生成部を備えることを特徴とする請求項3に記載の画像処理装置。
【請求項5】
前記看板領域選択部が選択した看板領域の特徴量に基づいて、前記看板の属性を示す属性情報を取得する属性取得部を備えることを特徴とする請求項1から請求項4のいずれか1項に記載の画像処理装置。
【請求項6】
画像処理装置が実行する画像処理方法であって、
画像中の画像領域の矩形度、該画像領域と該画像領域の周辺領域との色差、または該画像領域のエッジ比のうちいずれか1つまたは2つ以上の組に基づいて、前記画像から看板の画像を表す看板領域を選択する看板領域選択手順を有することを特徴とする画像処理方法。
【請求項7】
コンピュータに、
画像中の画像領域の矩形度、該画像領域と該画像領域の周辺領域との色差、または該画像領域のエッジ比のうちいずれか1つまたは2つ以上の組に基づいて、前記画像から看板の画像を表す看板領域を選択する看板領域選択ステップを実行させるための画像処理プログラム。
【請求項1】
画像中の画像領域の矩形度、該画像領域と該画像領域の周辺領域との色差、または該画像領域のエッジ比のうちいずれか1つまたは2つ以上の組に基づいて、前記画像から看板の画像を表す看板領域を選択する看板領域選択部を備えることを特徴とする画像処理装置。
【請求項2】
前記看板領域選択部は、前記画像領域の前記矩形度、該画像領域と該画像領域の周辺領域との前記色差、および該画像領域の前記エッジ比に基づいて、前記画像から前記看板領域を選択することを特徴とする請求項1に記載の画像処理装置。
【請求項3】
前記画像から四角形の画像領域を形成する四頂点を抽出する頂点抽出部と、
前記看板領域に基づいて、前記頂点抽出部が抽出した四頂点から前記看板領域の四頂点を選出する頂点選出部と、
を備えることを特徴とする請求項1又は請求項2に記載の画像処理装置。
【請求項4】
前記頂点選出部により選出された前記看板領域の四頂点の座標に基づいて、前記看板領域の画像から看板の正面画像を生成する正面画像生成部を備えることを特徴とする請求項3に記載の画像処理装置。
【請求項5】
前記看板領域選択部が選択した看板領域の特徴量に基づいて、前記看板の属性を示す属性情報を取得する属性取得部を備えることを特徴とする請求項1から請求項4のいずれか1項に記載の画像処理装置。
【請求項6】
画像処理装置が実行する画像処理方法であって、
画像中の画像領域の矩形度、該画像領域と該画像領域の周辺領域との色差、または該画像領域のエッジ比のうちいずれか1つまたは2つ以上の組に基づいて、前記画像から看板の画像を表す看板領域を選択する看板領域選択手順を有することを特徴とする画像処理方法。
【請求項7】
コンピュータに、
画像中の画像領域の矩形度、該画像領域と該画像領域の周辺領域との色差、または該画像領域のエッジ比のうちいずれか1つまたは2つ以上の組に基づいて、前記画像から看板の画像を表す看板領域を選択する看板領域選択ステップを実行させるための画像処理プログラム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【図21】
【図22】
【図23】
【図24】
【図25】
【図26】
【図27】
【図28】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【図21】
【図22】
【図23】
【図24】
【図25】
【図26】
【図27】
【図28】
【公開番号】特開2013−33406(P2013−33406A)
【公開日】平成25年2月14日(2013.2.14)
【国際特許分類】
【出願番号】特願2011−169584(P2011−169584)
【出願日】平成23年8月2日(2011.8.2)
【出願人】(397065480)エヌ・ティ・ティ・コムウェア株式会社 (187)
【Fターム(参考)】
【公開日】平成25年2月14日(2013.2.14)
【国際特許分類】
【出願日】平成23年8月2日(2011.8.2)
【出願人】(397065480)エヌ・ティ・ティ・コムウェア株式会社 (187)
【Fターム(参考)】
[ Back to top ]