画像処理装置、画像処理方法及びプログラム
【課題】ホワイトボードや紙資料等の撮影対象の矩形を撮影する作業を効率化させる。
【解決手段】画像処理装置3は、撮影装置2から画像データを入力し、当該画像データから線分を検出する。そして、画像処理装置3は、ホワイトボード1の領域に係る情報に基づいて、画像データに含まれるホワイトボード1を囲む四角枠を、検出した線分から決定する。
【解決手段】画像処理装置3は、撮影装置2から画像データを入力し、当該画像データから線分を検出する。そして、画像処理装置3は、ホワイトボード1の領域に係る情報に基づいて、画像データに含まれるホワイトボード1を囲む四角枠を、検出した線分から決定する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ホワイトボードや紙資料等の撮影対象の矩形を撮影する技術に関するものである。
【背景技術】
【0002】
今日、会社、学校及び研究機関等で会議や集会を行う際には、ホワイトボードを用いて会議や集会の内容をまとめることが広く行われている。その際、デジタルカメラ等を用いてホワイトボードを撮影し、会議の記録として残しておくことがよく行われている。しかし、ホワイトボードの前に人や物が置かれているために正面から撮影できずに斜めから撮影しなければならないことが度々発生する。このようにして撮影された画像データは、ホワイトボードの板書内容が歪んで写っているため、保存や表示に適さないことが多い。
【0003】
また、無線LANの普及に伴い無線LAN機能付きデジタルカメラや、カメラに刺して使うSDカード型無線アダプタが市販されている。このような機器の中には、撮影した画像データを直ぐにPCに送信して保存、表示させることが可能なものがある。この種の機器を使用することにより、手元の物体を撮影して直ぐに会議参加者全員に見せることが可能になる。
【0004】
特許文献1に開示される技術は、画像データから直線パラメータを抽出し、直線を組み合わせてホワイトボードの輪郭を形成する四角枠の候補を複数個生成する。そして、ユーザが目視で四角枠の候補の中からホワイトボードの輪郭に合った四角枠を探し出し、その四角枠で画像データを切り出した後、射影変換によって正面から見たときと等価な画像データを生成する。
【0005】
また、特許文献2に開示される技術は、撮影された画像データからエッジを抽出した後に四角枠の候補を算出し、四角枠の候補が複数存在する場合は四角枠の重心と大きさに基づいてグループ分けを行う。そして、複数の四角枠の候補を順に強調表示し、その中からユーザが目視で最適な四角枠を選択し、選択された四角枠に基づいて射影変換を行い、歪み補正された画像データを得る。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特許第4363151号公報
【特許文献2】特開2010−224934号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、特許文献1に開示される技術においては、四角枠の候補の数が多くなると、ユーザが目視によって最適な四角枠を探し出すことは困難である。また、特許文献2に開示される技術においては、グループ分けによる近接候補のクラスタリングは、ユーザの作業量を減らす効果はあるが、最適な四角枠の位置が代表的な四角枠の位置に丸められてしまう恐れがあり、正確性を損なう可能性がある。
【0008】
そこで、本発明の目的は、ホワイトボードや紙資料等の撮影対象の矩形を撮影する作業を効率化させることにある。
【課題を解決するための手段】
【0009】
本発明の画像処理装置は、画像データを入力する入力手段と、前記入力手段により入力された前記画像データから線分を検出する検出手段と、撮影対象の矩形の領域に係る情報に基づいて、前記画像データに含まれる前記撮影対象の矩形を囲む四角枠を、前記検出手段により検出された線分から決定する決定手段とを有することを特徴とする。
【発明の効果】
【0010】
本発明によれば、ホワイトボードや紙資料等の撮影対象の矩形を撮影する作業を効率化させることが可能となる。
【図面の簡単な説明】
【0011】
【図1】本発明の実施形態に係る画像処理システムの構成を示す図である。
【図2】ホワイトボードを撮影装置によって撮影される状況を示す図である。
【図3】撮影装置によって撮影されたホワイトボードを含む画像データを示す図である。
【図4】画像処理装置の内部構成を示す図である。
【図5】射影変換を説明するための図である。
【図6】第1の実施形態における画像処理装置の処理を示すフローチャートである。
【図7】図6のステップS607の歪み補正処理を示すフローチャートである。
【図8】事前に登録しておく画像データを示す図である。
【図9】四角枠を修正する四角枠修正ウィンドウを示す図である。
【図10】画像データに対する歪み補正処理を説明するための図である。
【図11】エッジ線分の集合から生成された四角枠の集合の例を示す図である。
【図12】画像データを表示する画像表示ウィンドウを示す図である。
【図13】画像データを表示する画像表示ウィンドウを示す図である。
【図14】図7のステップS705の四角枠の第1候補の算出処理を示すフローチャートである。
【図15】第2の実施形態における画像処理装置の処理を示すフローチャートである。
【発明を実施するための形態】
【0012】
以下、本発明を適用した好適な実施形態を、添付図面を参照しながら詳細に説明する。なお、以下に説明する実施形態は飽くまでも本発明の適用例に過ぎず、本発明を限定するものではない。また、以下の説明では、撮影対象の矩形としてホワイトボードを例に挙げているが、ホワイトボードに限定されるものではなく、紙資料や名刺等の矩形且つ平面形状の対象物全般に適用可能である。
【0013】
先ず、本発明の第1の実施形態について説明する。図1は、本発明の第1の実施形態に係る画像処理システムの構成を示す図である。図1に示すように、第1の実施形態に係る画像処理システム7は、撮影装置2、画像処理装置3及び表示装置4から構成される。撮影装置2と画像処理装置3とは無線LAN等の無線通信路5で接続されているが、特に無線である必要はなく、有線であっても構わない。また、画像処理装置3と表示装置4とはHDMI(High Definition Multimedia Interface)等の有線通信路6で接続されているが、特に有線である必要はなく、無線であっても構わない。
【0014】
撮影装置2は、撮影ボタン21と液晶パネル等のビューファインダ22とを備える。図1では、撮影装置2の撮影対象の矩形としてホワイトボード1が配置されているが、特にホワイトボード1に限定する必要はなく、机の上に置かれた名刺や紙資料のように矩形且つ平面形状の対象物であればよい。ビューファインダ22には撮影対象の矩形が表示され、この状態で撮影ボタン21が押下されることにより、撮影装置2は撮影対象の矩形の画像データを生成し、無線通信路5を介して画像処理装置3に送信する。画像処理装置3は、有線通信路6を介して撮影対象の矩形の画像データやGUIを表示装置4に対して送信する。表示装置4は、画像処理装置3から受信した撮影対象の矩形の画像データやGUIを表示する。
【0015】
図2に示すように、ホワイトボード1を撮影装置2aや撮影装置2bによって斜めから撮影すると、撮影装置2aは、図3の31aに示すような歪んだ画像データを生成し、撮影装置2bは、図3の31bに示すような歪んだ画像データを生成する。画像処理装置3は、このように歪んだ画像データを撮影装置2から入力すると、射影変換等の画像処理によって画像データに対する歪み補正を行い、正面から撮影したような画像データ(図3の34)を生成する。なお、射影変換時に使用されるパラメータは、撮影装置2から入力された画像データの特徴点に基づいて自動的に算出される。
【0016】
図4は、画像処理装置3の内部構成を示す図である。UI(User Interface)デバイス401は、マウス、デジタイザ及びキーボード等であり、画像処理装置3にユーザの指示を入力するために用いられる。CPU(Central Processing Unit)402は、プログラム用記憶領域406からRAM(Random Access Memory)403にプログラムを読み込み、当該プログラムを解釈、実行することによって画像処理装置3内の各種制御や計算、UIの表示等を行う。通信インタフェース(IF)404は、撮影装置2や表示装置4との間の通信インタフェースである。UI表示部405は、画像処理装置3の状態や処理内容を表示するLEDや液晶パネル等であるが、表示装置4を制御して表示する構成であってもよい。プログラム用記憶領域406及びデータ用記憶領域407は、ハードディスクやフラッシュメモリ等に構成することが可能であるが、特定の記憶媒体に限定する必要はない。
【0017】
なお、本実施形態に係る画像処理システム7は、会議の際に使用されることが多いため、実際の運用では、画像処理装置3上で議事録の作成や会議情報の管理等を行う会議システムと統合して使用されることが多い。
【0018】
次に、画像処理装置3で実行される射影変換を表す各種数式と射影変換の際に使用される各種パラメータの算出式とについて説明する。図5に示すように、撮影対象の矩形501の四隅をP1、P2、P3、P4とし、撮影対象の矩形501(ここでは、ホワイトボード1)上の任意の点PをベクトルS、A、Bで表すものとする。ここで、各ベクトルは次のように定義される。
【0019】
【数1】
【0020】
次に、P1、P2、P3、P4から視点である原点Oに向けて直線を引いたときに投射面81と交わる点をそれぞれp1、p2、p3、p4とする。これらの点は投射面502をz=fで表すと、次の式1のように定義される。ここで、fは焦点距離に対応する。
【0021】
【数2】
【0022】
なお、xn、ynは画像データ上の座標であり、その範囲は次のようになる。
【0023】
【数3】
【0024】
これらの点p1、p2、p3、p4は、画像データを解析することにより座標値xn、ynを決定することが可能である。次に、P1、P2、P3、P4から原点Oに向かう直線は次の式2で表される。
【0025】
【数4】
【0026】
ここで、投射面502と交わる点がp1、p2、p3、p4であることから、式2に式1のxn、yn、fを代入すると次の連立方程式を得る。
【0027】
【数5】
【0028】
また、撮影対象の矩形501上の点Pから原点Oに向かう直線は次の式で表される。
【0029】
【数6】
【0030】
従って、投射面502上の点pの座標x、yは次の式4のように表される。
【0031】
【数7】
【0032】
ここで、x、yをu、vから数値的に算出するための式を導出するために、先ず式3をAx、Ay、Az、Bx、By、Bz、Sx、Syについて解く。
【0033】
【数8】
【0034】
これを式4に代入すると、分子分母でfとSzとが消えるため、次のような式6を得る。
【0035】
【数9】
【0036】
ここで、Ax´、Ay´、Az´、Bx´、By´、Bz´、Sx´、Sy´は、次の式7のようにxn、ynから数値的に算出可能であり、射影変換のパラメータと呼ばれる。
【0037】
【数10】
【0038】
また、式6をu、vについて解くと、u、vをx、yから数値的に算出するための次の式8を得る。
【0039】
【数11】
【0040】
次に、焦点距離fをxn、ynから求めるための式を導出する。先ず、ベクトルAとベクトルBとは撮影対象の矩形501の辺に沿って定義していることから、AとBとは直交する。即ち、内積が零になることから次の式9を得る。
【0041】
【数12】
【0042】
式9に式5を代入すると、Szが消えて次の式10を得る。
【0043】
【数13】
【0044】
ここで、α、βは次の式11、式12のように、xn、ynから数値的に算出される。
【0045】
【数14】
【0046】
式10をfについて解くことにより、次の式13のように、焦点距離fを数値的に算出することができる。
【0047】
【数15】
【0048】
次に、撮影対象の矩形501の縦横比を求めるための式は、次の式14の通りである。
【0049】
【数16】
【0050】
次に、図6を参照しながら、第1の実施形態における画像処理装置3の処理について詳細に説明する。図6は、第1の実施形態における画像処理装置3の処理を示すフローチャートである。
【0051】
ステップS602、S603、S604において、画像処理装置3は、撮影対象の矩形501について領域情報Pを取得する。これらの処理は歪み補正処理(ステップS607)の前に行われていればよいため、実際の運用では会議の直前やシステムインストール時に行われる。また、領域情報Pは、同じ会議室で同じホワイトボードを使っている限り、再利用することが可能なため、会議システムの会議室情報に付随して登録してもよい。その際、会議室に複数個のホワイトボードが存在する場合にはそれぞれについて領域情報Pを事前に登録しておく。また、照明を点灯している場合と消灯している場合とで夫々領域情報Pを登録しておいてもよい。
【0052】
ステップS601において、画像処理装置3は、領域情報Pにデフォルト値を設定する。デフォルト値としては、例えば以下のような値が設定される。
・撮影対象の矩形(ホワイトボード1)の縦横比:3/4
・撮影対象の矩形(ホワイトボード1)の縁の色:黒
・撮影対象の矩形(ホワイトボード1)の内外の色合い:内側→白、外側→グレー
・撮影対象の矩形(ホワイトボード1)の周辺画像データ:なし
【0053】
ステップS602において、画像処理装置3は、図8に示すように、画像データ801を撮影装置2から取得し、事前に登録しておく画像データ(以下、事前登録済み画像データと称す)として保存する。その際、ホワイトボード1には何も書かれていない方が望ましい。
【0054】
ステップS603において、画像処理装置3は、図9に示すように、四角枠修正ウィンドウ901を表示装置4に表示する。この四角枠修正ウィンドウ901には、ステップS402で取得された事前登録済み画像データ801が表示されており、その上に四角枠902が表示されている。四角枠902は、デフォルト値の領域情報Pに基づいて表示される。ユーザは、UIデバイス401を用いて四角枠902を修正し、ホワイトボード1の領域を囲むように調整する。そしてユーザが修正画像表示ボタン903を押下すると、四角枠902が決定され、歪み補正が施された画像データが表示される。
【0055】
ステップS604において、画像処理装置3は、四角枠902の周辺画像データを解析して次のような情報を取得し、領域情報Pとして保持する。
・撮影対象の矩形(ホワイトボード1)の縦横比:(図8の801参照)
・撮影対象の矩形(ホワイトボード1)の縁の色:(図8の802参照)
・撮影対象の矩形(ホワイトボード1)の内外の色合い:(図8の803参照)
・撮影対象の矩形(ホワイトボード1)の周辺画像データ:(図8の804参照)
なお、領域情報Pは四角枠902周辺の複数個所から取得される。また、周辺画像データの解析対象となる事前登録済み画像データ801としては、歪み補正後の画像データが用いられる。
【0056】
これら以外にも、事前登録済み画像データ801から撮影対象の矩形の輪郭線を検出する際に使用されたハフ変換の適切な閾値を、領域情報Pに含めて保持してもよい。また、事前登録済み画像データ801を撮影する際に使用された撮影パラメータ(絞り、露光時間、ISO感度、ホワイトバランス等)も、領域情報Pに含めて保持してもよい。
【0057】
上述したように、ステップS602〜S604において、画像処理装置3は、事前登録済み画像データ801から個々の領域情報Pを抽出している。他の実施形態として、領域情報Pとして、歪み補正後の事前登録済み画像データ801自体を登録しておき、後段の処理で必要になった際に、事前登録済み画像データ801から領域情報Pを取得するようにしてもよい。
【0058】
次に、ステップS605、S606、S607において、画像処理装置3は、ユーザの撮影動作に合わせた歪み補正処理を行う。実際の運用では、会議中に撮影対象の矩形が撮影され、当該撮影によって生成された画像データを即時歪み補正して会議フォルダに保存したり、議事録等に張り付けることを想定している。
【0059】
ステップS605において、画像処理装置3は、撮影装置2からの画像データの入力を待つ。ステップS606において、画像処理装置3は、撮影装置2から画像データが入力されたか否かを判定する。画像データが入力された場合、処理はステップS607に移行する。一方、画像データが入力されていない場合、処理はステップS605に戻る。ステップS607において、画像処理装置3は、入力された画像データの歪み補正処理を行う。ステップS607の後、処理はステップS605に戻る。
【0060】
次に、図7を参照しながら、図6のステップS607の歪み補正処理について詳細に説明する。図7は、図6のステップS607の歪み補正処理を示すフローチャートである。
【0061】
ステップS701において、画像処理装置3は、図10の1001に示すような、撮影対象の矩形を含む画像データIを撮影装置2から入力する。なお、図7に示す歪み補正処理によって補正された後の画像データは、図10の1004に示すような撮影対象の矩形が切り出された画像データJとなる。
【0062】
ステップS702において、画像処理装置3は、画像データI内の直線的なエッジ部分(エッジ線分)を、ハフ変換を用いて抽出し、エッジ線分の集合Eを生成する。その際、領域情報Pにハフ変換の閾値を含めているならば、これを用いてエッジ線分の抽出レベルを調節してもよい。図10の1002は、画像データI1001上にエッジ線分を重ねて表示した状態を示している。
【0063】
ステップS703において、画像処理装置3は、エッジ線分の集合Eの中から縦線らしい線分と横線らしい線分とを抽出し、縦線の集合Vと横線の集合Hとを生成する。ステップS704において、画像処理装置3は、縦線の集合Vから任意の縦線2本、横線の集合Hから任意の横線2本を抽出し、これらを組み合わせて四角枠を生成する処理を、集合Vと集合Hとの全ての要素に適用することにより、四角枠の集合Qを生成する。図11の1101〜1104は、エッジ線分の集合Eから生成された四角枠の集合Qの例を示す図である。
【0064】
ステップS705において、画像処理装置3は、四角枠の集合Qの中から撮影対象の矩形を投射面に投影した際にできる四角枠として最も相応しい第1候補を算出する。ステップS705の詳細は後述するが、処理結果として、図11の1104に示す第1候補の四角枠とその候補レベル値とが得られる。ここで候補レベル値とは、どれだけ撮影対象の矩形を正しく囲んでいる四角枠なのかを数値化した値である。
【0065】
ステップS706において、画像処理装置3は、第1候補の四角枠の候補レベル値が一定の値以上であるか否かを判定する。第1候補の四角枠の候補レベル値が一定の値以上である場合、処理はステップS707に移行する。一方、第1候補の四角枠の候補レベル値が一定の値未満である場合、画像処理装置3は、撮影対象の矩形の切り出しが不可能であるとして処理を終了する。ステップS707において、画像処理装置3は、第1候補の四角枠に従って画像データIから撮影対象の矩形を切り出し、射影変換を行って画像データJを生成する。ここで、画像データJのある点(u,v)に対応する画像データI上の点(x,y)は、式6によって算出される。点(x,y)が画素の中心ではない場合にはバイリニア補間等の適切な補間処理が行われる。また、逆に画像データI上の点から対応する画像データJ上の点を求める際には、式8が使用される。
【0066】
ステップS708において、画像処理装置3は、図12又は図13の画像表示ウィンドウ1201、1301に示すように画像データJを表示装置4に表示する。図12の画像表示ウィンドウ1201は、切り出し用の四角枠が適切ではなかった場合に画像データJが表示された例を示している。ユーザが再修正ボタン1211を押下することにより、図12の四角枠修正ウィンドウ1202が表示され、ユーザによる手動修正を行うことが可能となる。即ち、ユーザは四角枠1222の四隅等をUIデバイス401でドラッグすることにより、図13の四角枠修正ウィンドウ1302に示すように撮影対象の矩形をぴったりと囲むように四角枠1322を修正することが可能である。最後に修正を確定し、修正後の射影変換結果をもう一度表示させるためには、ユーザは修正画像表示ボタン1321を押せばよい。これにより、図13に示すように、画像表示ウィンドウ1301内に画像データJが適切に表示される。
【0067】
他の実施形態として、射影変換結果の表示と四角枠の修正とを表示装置4上で行うのではなく、撮影装置2のビューファインダ22上で行うようにしてもよい。この場合、ビューファインダ22をタッチパネルとして構成し、指によるポインティングができることが望ましい。
【0068】
ステップS709において、画像処理装置3は、ユーザによって四角枠が修正されたか否かを判定する。即ちここでは、ユーザによって四角枠が修正され、修正画像表示ボタン1221、1321が押されたか否かが判定される。ユーザによって四角枠が修正された場合、処理はステップS710に移行する。一方、ユーザによって四角枠が修正されていない場合、処理はS711に移行する。
【0069】
ステップS710において、画像処理装置3は、図6のステップS604と同じ周辺画像データの解析処理によって、四角枠の修正結果から撮影対象の矩形の正しい領域情報Pを学習(再登録)する。なお、領域情報Pは四角枠周辺の複数個所から取得される。また、周辺画像データの解析対象となる事前登録済み画像データとしては、歪み補正後の画像データが用いられる。このように、四角枠の修正時に正しい領域情報Pを学習するため、図6のステップS602、S603、S604に示すような事前の登録作業を行わなくても、システムを使用していく過程で自然に領域情報Pの登録が行われる。領域情報Pの学習後はステップS707に戻って修正後の射影変換結果が表示される。
【0070】
ステップS711において、画像処理装置3は、射影変換によって歪み補正された画像データJをデータ用記憶領域407に保存する。具体的には、会議システムによって用意される会議フォルダに保存される。また、保存された画像データは議事録等に張り付けることも可能である。
【0071】
次に、図14を参照しながら、図7のステップS705の四角枠の第1候補の算出処理について詳細に説明する。図14は、図7のステップS705の四角枠の第1候補の算出処理を示すフローチャートである。
【0072】
ステップS1401において、画像処理装置3は、四角枠の集合Qを入力する。四角枠の集合Qには、例えば図11の点線に示すような四角枠1101〜1104が含まれる。図14を用いて説明する四角枠の第1候補の算出処理では、このような四角枠の集合Qから撮影対象の矩形を囲むのに最適な四角枠が算出される。図11の例では、四角枠1104が四角枠の第1候補Tとして算出される。
【0073】
ステップS1402において、画像処理装置3は、四角枠の集合Qのそれぞれに対して、式7に従って四隅の点(xn,yn)(n=1,2,3,4,)から射影変換のパラメータAx´、Ay´、Az´、Bx´、By´、Bz´、Sx´、Sy´を算出する。ステップS1403において、画像処理装置3は、式11、式12に従って四隅の点(xn,yn)(n=1,2,3,4)からαとβとを算出し、式13に従って焦点距離fを算出する。
【0074】
ステップS1404において、画像処理装置3は、撮影装置2の焦点距離とステップS1403で算出した焦点距離fとを比較し、撮影装置2の焦点距離に近い焦点距離fを持つ四角枠の候補レベル値をアップする。ここでは、例えば、撮影装置2の焦点距離との差分が一定の値以下である焦点距離fを持つ四角枠の候補レベル値をアップすることが考えられる。なお、撮影装置2の焦点距離は撮影装置2から直接取得する他に、出力される画像データに付加されているメタデータ(JPEGのExifデータ等)に記載されている値を用いてもよい。
【0075】
ステップS1405において、画像処理装置3は、四角枠の集合Qのそれぞれに対して、式14に従って各四角枠が切り出すであろう撮影対象の矩形の縦横比を算出する。ステップS1406において、画像処理装置3は、領域情報Pの中から撮影対象の矩形の縦横比を抽出し、撮影対象の矩形の縦横比とステップS1405で算出した縦横比とを比較する。そして画像処理装置3は、撮影対象の矩形の縦横比に近い縦横比を持つ四角枠の候補レベル値をアップする。ここでは、例えば、撮影対象の矩形の縦横比との差分が一定の値以下である縦横比を持つ四角枠の候補レベル値をアップすることが考えられる。
【0076】
ステップS1407において、画像処理装置3は、四角枠の集合Qのそれぞれに対して、領域情報Pの中から抽出した撮影対象の矩形の縁の色と四角枠の縁の色とを比較し、撮影対象の矩形の縁の色に近い色の縁を持つ四角枠の候補レベル値をアップする。ステップS1408において、画像処理装置3は、四角枠の集合Qのそれぞれに対して、領域情報Pの中から抽出された撮影対象の矩形の内外の色合いと四角枠の内外の色合いとを比較し、撮影対象の矩形の内外の色合いと近い内外の色合いを持つ四角枠の候補レベル値をアップする。なお、ステップS1407とS1408とにおける色や色合いの比較は次の方法によって行うことが可能であるが、本発明はこの方法に限定されるものではない。
【0077】
画像データの画素I(x,y)の赤色成分、緑色成分、青色成分をR(x,y)、G(x,y)、B(x,y)とし、撮影対象の矩形の画像データにおける画素IP(x,y)の赤色成分、緑色成分、青色成分をRP(x,y)、GP(x,y)、BP(x,y)とすると、ある領域KとKPの色の平均の差分は次の式15により求められる。そして、例えば、この差分が一定の値以下となる色や色合いを持つ四角枠の候補レベル値をアップすることが考えられる。
【0078】
【数17】
【0079】
ステップS1409において、画像処理装置3は、四角枠の集合Qのそれぞれに対して、式6に従って四角枠の周辺画像データを射影変換する。なお、射影変換の際には必要に応じてバイリニア補間等の適切な補間処理が行われる。ステップS1410において、画像処理装置3は、領域情報Pの中から撮影対象の矩形の周辺画像データを抽出し、撮影対象の矩形の周辺画像データとステップS1405で射影変換処理された周辺画像データとを比較する。そして画像処理装置3は、撮影対象の矩形の周辺画像データと近い周辺画像データを持つ四角枠の候補レベル値をアップする。なお、周辺画像データの比較は次の方法によって行うことが可能であるが、本発明はこの方法に限定されるものではない。
【0080】
四角枠の周辺画像データの画素I(x,y)の明るさ成分をO(x,y)とし、撮影対象の矩形の周辺画像データの画素IP(x、y)の明るさ成分をOP(x,y)とすると、或る領域Kの画像データの差分は次の式16により求められる。そして、例えば、この差分が一定の値以下となる周辺画像データを持つ四角枠の候補レベル値をアップすることが考えられる。
【0081】
【数18】
【0082】
領域情報Pに撮影パラメータを含めているならば、画像処理装置3は、ステップS1407〜S1410において、当該撮影パラメータを用いて色の比較処理や画像データの比較処理を行ってもよい。また、ステップS1403〜S1410の各段階において、候補レベル値が一定値に満たない候補を切り落とし、順次絞込みを行うようにしてもよい。さらに、焦点距離、縦横比、縁の色、内外の色合い、周辺画像データに関する各比較処理は、必ずしもこの順番で全て行う必要はなく、幾つかの比較処理を選択して別の順番で実行してもよい。ステップS1411において、画像処理装置3は、候補レベル値が最大となった四角枠を第1候補Tとし、その候補レベル値をLTとする。
【0083】
以上により、本実施形態によれば、ホワイトボードや紙資料等の撮影対象の矩形を撮影する作業を効率化させることが可能となる。
【0084】
次に、本発明の第2の実施形態について説明する。本発明の第2の実施形態では、撮影された画像データがホワイトボードを含むものであれば、画像データを表示装置4に表示させずにそのまま保存する。一方、撮影された画像データがホワイトボードを含むものでなければ、画像データを表示装置4に表示させる。これにより、会議記録として保存さえできればよいホワイトボードを含む画像データはそのまま会議フォルダに保存し、画像データを表示することによる会議の一時的中断を防ぐことができる。また、撮影装置2によってホワイトボード以外のものが撮影された場合には、画像データを加工することなく直ぐに表示することで会議参加者全員に見せることが可能になる。なお、画像データがホワイトボードを含まない場合に直ぐに表示すること以外にも、画像データを指定のサーバにアップロードする等、事前に指定された処理を行うようにしてもよい。
【0085】
図15のステップS701〜S706の処理の流れは、図7と同一符号のステップの処理の流れと同じであるため、説明は省略する。ステップS706において第1候補の四角枠の候補レベル値が一定の値以上であると判定された場合、処理はステップS1501に移行する。一方、ステップS706において第1候補の四角枠の候補レベル値が一定の値未満であると判定された場合、処理はステップS1503に移行する。
【0086】
ステップS1501において、画像処理装置3は、図7のステップS707と同様に、第1候補の四角枠に従って画像データIから撮影対象の矩形を切り出し、射影変換を行って画像データJを生成する。ステップS1502おいて、画像処理装置3は、射影変換によって歪み補正された画像データJをデータ用記憶領域407に保存する。
【0087】
ステップS1503において、画像処理装置3は、撮像装置2から入力した画像データIを画像データJにそのままコピーする。ステップS1504において、画像処理装置3は、図7のステップS708と同様に、図12又は図13の画像表示ウィンドウ1201、1301に示すように画像データJを表示装置4に表示する。ステップS1505において、画像処理装置3は、図7のステップS709と同様に、ユーザによって四角枠が修正されたか否かを判定する。ユーザによって四角枠が修正された場合、処理はステップS1506に移行する。ユーザによって四角枠が修正されていない場合、処理はステップS1502に移行する。ステップS1506において、画像処理装置3は、図7のステップS710と同様に、周辺画像データの解析処理によって、四角枠の修正結果から撮影対象の矩形の正しい領域情報Pを学習する。ステップS1507において、画像処理装置3は、第1候補の四角枠に従って画像データIから撮影対象の矩形を切り出し、射影変換を行って画像データJを生成する。
【0088】
なお、ステップS1503〜S1507は、画像データI内にホワイトボードが含まれていたが、ステップS702〜S705で検出できなかったときの救済処理であるため、救済処理が必要なければ省いても構わない。
【0089】
以上、本発明の実施形態について説明したが、本発明は、例えば、システム、装置、方法、プログラム又は記録媒体(記憶媒体)等としての実施態様をとることが可能である。具体的には、複数の機器(例えば、ホストコンピュータ、インタフェース機器、撮像装置、Webアプリケーション等)から構成されるシステムに適用してもよいし、また、一つの機器からなる装置に適用してもよい。
【0090】
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
【符号の説明】
【0091】
1:ホワイトボード、2:撮影装置、3:画像処理装置、4:表示装置、7:画像処理システム
【技術分野】
【0001】
本発明は、ホワイトボードや紙資料等の撮影対象の矩形を撮影する技術に関するものである。
【背景技術】
【0002】
今日、会社、学校及び研究機関等で会議や集会を行う際には、ホワイトボードを用いて会議や集会の内容をまとめることが広く行われている。その際、デジタルカメラ等を用いてホワイトボードを撮影し、会議の記録として残しておくことがよく行われている。しかし、ホワイトボードの前に人や物が置かれているために正面から撮影できずに斜めから撮影しなければならないことが度々発生する。このようにして撮影された画像データは、ホワイトボードの板書内容が歪んで写っているため、保存や表示に適さないことが多い。
【0003】
また、無線LANの普及に伴い無線LAN機能付きデジタルカメラや、カメラに刺して使うSDカード型無線アダプタが市販されている。このような機器の中には、撮影した画像データを直ぐにPCに送信して保存、表示させることが可能なものがある。この種の機器を使用することにより、手元の物体を撮影して直ぐに会議参加者全員に見せることが可能になる。
【0004】
特許文献1に開示される技術は、画像データから直線パラメータを抽出し、直線を組み合わせてホワイトボードの輪郭を形成する四角枠の候補を複数個生成する。そして、ユーザが目視で四角枠の候補の中からホワイトボードの輪郭に合った四角枠を探し出し、その四角枠で画像データを切り出した後、射影変換によって正面から見たときと等価な画像データを生成する。
【0005】
また、特許文献2に開示される技術は、撮影された画像データからエッジを抽出した後に四角枠の候補を算出し、四角枠の候補が複数存在する場合は四角枠の重心と大きさに基づいてグループ分けを行う。そして、複数の四角枠の候補を順に強調表示し、その中からユーザが目視で最適な四角枠を選択し、選択された四角枠に基づいて射影変換を行い、歪み補正された画像データを得る。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特許第4363151号公報
【特許文献2】特開2010−224934号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、特許文献1に開示される技術においては、四角枠の候補の数が多くなると、ユーザが目視によって最適な四角枠を探し出すことは困難である。また、特許文献2に開示される技術においては、グループ分けによる近接候補のクラスタリングは、ユーザの作業量を減らす効果はあるが、最適な四角枠の位置が代表的な四角枠の位置に丸められてしまう恐れがあり、正確性を損なう可能性がある。
【0008】
そこで、本発明の目的は、ホワイトボードや紙資料等の撮影対象の矩形を撮影する作業を効率化させることにある。
【課題を解決するための手段】
【0009】
本発明の画像処理装置は、画像データを入力する入力手段と、前記入力手段により入力された前記画像データから線分を検出する検出手段と、撮影対象の矩形の領域に係る情報に基づいて、前記画像データに含まれる前記撮影対象の矩形を囲む四角枠を、前記検出手段により検出された線分から決定する決定手段とを有することを特徴とする。
【発明の効果】
【0010】
本発明によれば、ホワイトボードや紙資料等の撮影対象の矩形を撮影する作業を効率化させることが可能となる。
【図面の簡単な説明】
【0011】
【図1】本発明の実施形態に係る画像処理システムの構成を示す図である。
【図2】ホワイトボードを撮影装置によって撮影される状況を示す図である。
【図3】撮影装置によって撮影されたホワイトボードを含む画像データを示す図である。
【図4】画像処理装置の内部構成を示す図である。
【図5】射影変換を説明するための図である。
【図6】第1の実施形態における画像処理装置の処理を示すフローチャートである。
【図7】図6のステップS607の歪み補正処理を示すフローチャートである。
【図8】事前に登録しておく画像データを示す図である。
【図9】四角枠を修正する四角枠修正ウィンドウを示す図である。
【図10】画像データに対する歪み補正処理を説明するための図である。
【図11】エッジ線分の集合から生成された四角枠の集合の例を示す図である。
【図12】画像データを表示する画像表示ウィンドウを示す図である。
【図13】画像データを表示する画像表示ウィンドウを示す図である。
【図14】図7のステップS705の四角枠の第1候補の算出処理を示すフローチャートである。
【図15】第2の実施形態における画像処理装置の処理を示すフローチャートである。
【発明を実施するための形態】
【0012】
以下、本発明を適用した好適な実施形態を、添付図面を参照しながら詳細に説明する。なお、以下に説明する実施形態は飽くまでも本発明の適用例に過ぎず、本発明を限定するものではない。また、以下の説明では、撮影対象の矩形としてホワイトボードを例に挙げているが、ホワイトボードに限定されるものではなく、紙資料や名刺等の矩形且つ平面形状の対象物全般に適用可能である。
【0013】
先ず、本発明の第1の実施形態について説明する。図1は、本発明の第1の実施形態に係る画像処理システムの構成を示す図である。図1に示すように、第1の実施形態に係る画像処理システム7は、撮影装置2、画像処理装置3及び表示装置4から構成される。撮影装置2と画像処理装置3とは無線LAN等の無線通信路5で接続されているが、特に無線である必要はなく、有線であっても構わない。また、画像処理装置3と表示装置4とはHDMI(High Definition Multimedia Interface)等の有線通信路6で接続されているが、特に有線である必要はなく、無線であっても構わない。
【0014】
撮影装置2は、撮影ボタン21と液晶パネル等のビューファインダ22とを備える。図1では、撮影装置2の撮影対象の矩形としてホワイトボード1が配置されているが、特にホワイトボード1に限定する必要はなく、机の上に置かれた名刺や紙資料のように矩形且つ平面形状の対象物であればよい。ビューファインダ22には撮影対象の矩形が表示され、この状態で撮影ボタン21が押下されることにより、撮影装置2は撮影対象の矩形の画像データを生成し、無線通信路5を介して画像処理装置3に送信する。画像処理装置3は、有線通信路6を介して撮影対象の矩形の画像データやGUIを表示装置4に対して送信する。表示装置4は、画像処理装置3から受信した撮影対象の矩形の画像データやGUIを表示する。
【0015】
図2に示すように、ホワイトボード1を撮影装置2aや撮影装置2bによって斜めから撮影すると、撮影装置2aは、図3の31aに示すような歪んだ画像データを生成し、撮影装置2bは、図3の31bに示すような歪んだ画像データを生成する。画像処理装置3は、このように歪んだ画像データを撮影装置2から入力すると、射影変換等の画像処理によって画像データに対する歪み補正を行い、正面から撮影したような画像データ(図3の34)を生成する。なお、射影変換時に使用されるパラメータは、撮影装置2から入力された画像データの特徴点に基づいて自動的に算出される。
【0016】
図4は、画像処理装置3の内部構成を示す図である。UI(User Interface)デバイス401は、マウス、デジタイザ及びキーボード等であり、画像処理装置3にユーザの指示を入力するために用いられる。CPU(Central Processing Unit)402は、プログラム用記憶領域406からRAM(Random Access Memory)403にプログラムを読み込み、当該プログラムを解釈、実行することによって画像処理装置3内の各種制御や計算、UIの表示等を行う。通信インタフェース(IF)404は、撮影装置2や表示装置4との間の通信インタフェースである。UI表示部405は、画像処理装置3の状態や処理内容を表示するLEDや液晶パネル等であるが、表示装置4を制御して表示する構成であってもよい。プログラム用記憶領域406及びデータ用記憶領域407は、ハードディスクやフラッシュメモリ等に構成することが可能であるが、特定の記憶媒体に限定する必要はない。
【0017】
なお、本実施形態に係る画像処理システム7は、会議の際に使用されることが多いため、実際の運用では、画像処理装置3上で議事録の作成や会議情報の管理等を行う会議システムと統合して使用されることが多い。
【0018】
次に、画像処理装置3で実行される射影変換を表す各種数式と射影変換の際に使用される各種パラメータの算出式とについて説明する。図5に示すように、撮影対象の矩形501の四隅をP1、P2、P3、P4とし、撮影対象の矩形501(ここでは、ホワイトボード1)上の任意の点PをベクトルS、A、Bで表すものとする。ここで、各ベクトルは次のように定義される。
【0019】
【数1】
【0020】
次に、P1、P2、P3、P4から視点である原点Oに向けて直線を引いたときに投射面81と交わる点をそれぞれp1、p2、p3、p4とする。これらの点は投射面502をz=fで表すと、次の式1のように定義される。ここで、fは焦点距離に対応する。
【0021】
【数2】
【0022】
なお、xn、ynは画像データ上の座標であり、その範囲は次のようになる。
【0023】
【数3】
【0024】
これらの点p1、p2、p3、p4は、画像データを解析することにより座標値xn、ynを決定することが可能である。次に、P1、P2、P3、P4から原点Oに向かう直線は次の式2で表される。
【0025】
【数4】
【0026】
ここで、投射面502と交わる点がp1、p2、p3、p4であることから、式2に式1のxn、yn、fを代入すると次の連立方程式を得る。
【0027】
【数5】
【0028】
また、撮影対象の矩形501上の点Pから原点Oに向かう直線は次の式で表される。
【0029】
【数6】
【0030】
従って、投射面502上の点pの座標x、yは次の式4のように表される。
【0031】
【数7】
【0032】
ここで、x、yをu、vから数値的に算出するための式を導出するために、先ず式3をAx、Ay、Az、Bx、By、Bz、Sx、Syについて解く。
【0033】
【数8】
【0034】
これを式4に代入すると、分子分母でfとSzとが消えるため、次のような式6を得る。
【0035】
【数9】
【0036】
ここで、Ax´、Ay´、Az´、Bx´、By´、Bz´、Sx´、Sy´は、次の式7のようにxn、ynから数値的に算出可能であり、射影変換のパラメータと呼ばれる。
【0037】
【数10】
【0038】
また、式6をu、vについて解くと、u、vをx、yから数値的に算出するための次の式8を得る。
【0039】
【数11】
【0040】
次に、焦点距離fをxn、ynから求めるための式を導出する。先ず、ベクトルAとベクトルBとは撮影対象の矩形501の辺に沿って定義していることから、AとBとは直交する。即ち、内積が零になることから次の式9を得る。
【0041】
【数12】
【0042】
式9に式5を代入すると、Szが消えて次の式10を得る。
【0043】
【数13】
【0044】
ここで、α、βは次の式11、式12のように、xn、ynから数値的に算出される。
【0045】
【数14】
【0046】
式10をfについて解くことにより、次の式13のように、焦点距離fを数値的に算出することができる。
【0047】
【数15】
【0048】
次に、撮影対象の矩形501の縦横比を求めるための式は、次の式14の通りである。
【0049】
【数16】
【0050】
次に、図6を参照しながら、第1の実施形態における画像処理装置3の処理について詳細に説明する。図6は、第1の実施形態における画像処理装置3の処理を示すフローチャートである。
【0051】
ステップS602、S603、S604において、画像処理装置3は、撮影対象の矩形501について領域情報Pを取得する。これらの処理は歪み補正処理(ステップS607)の前に行われていればよいため、実際の運用では会議の直前やシステムインストール時に行われる。また、領域情報Pは、同じ会議室で同じホワイトボードを使っている限り、再利用することが可能なため、会議システムの会議室情報に付随して登録してもよい。その際、会議室に複数個のホワイトボードが存在する場合にはそれぞれについて領域情報Pを事前に登録しておく。また、照明を点灯している場合と消灯している場合とで夫々領域情報Pを登録しておいてもよい。
【0052】
ステップS601において、画像処理装置3は、領域情報Pにデフォルト値を設定する。デフォルト値としては、例えば以下のような値が設定される。
・撮影対象の矩形(ホワイトボード1)の縦横比:3/4
・撮影対象の矩形(ホワイトボード1)の縁の色:黒
・撮影対象の矩形(ホワイトボード1)の内外の色合い:内側→白、外側→グレー
・撮影対象の矩形(ホワイトボード1)の周辺画像データ:なし
【0053】
ステップS602において、画像処理装置3は、図8に示すように、画像データ801を撮影装置2から取得し、事前に登録しておく画像データ(以下、事前登録済み画像データと称す)として保存する。その際、ホワイトボード1には何も書かれていない方が望ましい。
【0054】
ステップS603において、画像処理装置3は、図9に示すように、四角枠修正ウィンドウ901を表示装置4に表示する。この四角枠修正ウィンドウ901には、ステップS402で取得された事前登録済み画像データ801が表示されており、その上に四角枠902が表示されている。四角枠902は、デフォルト値の領域情報Pに基づいて表示される。ユーザは、UIデバイス401を用いて四角枠902を修正し、ホワイトボード1の領域を囲むように調整する。そしてユーザが修正画像表示ボタン903を押下すると、四角枠902が決定され、歪み補正が施された画像データが表示される。
【0055】
ステップS604において、画像処理装置3は、四角枠902の周辺画像データを解析して次のような情報を取得し、領域情報Pとして保持する。
・撮影対象の矩形(ホワイトボード1)の縦横比:(図8の801参照)
・撮影対象の矩形(ホワイトボード1)の縁の色:(図8の802参照)
・撮影対象の矩形(ホワイトボード1)の内外の色合い:(図8の803参照)
・撮影対象の矩形(ホワイトボード1)の周辺画像データ:(図8の804参照)
なお、領域情報Pは四角枠902周辺の複数個所から取得される。また、周辺画像データの解析対象となる事前登録済み画像データ801としては、歪み補正後の画像データが用いられる。
【0056】
これら以外にも、事前登録済み画像データ801から撮影対象の矩形の輪郭線を検出する際に使用されたハフ変換の適切な閾値を、領域情報Pに含めて保持してもよい。また、事前登録済み画像データ801を撮影する際に使用された撮影パラメータ(絞り、露光時間、ISO感度、ホワイトバランス等)も、領域情報Pに含めて保持してもよい。
【0057】
上述したように、ステップS602〜S604において、画像処理装置3は、事前登録済み画像データ801から個々の領域情報Pを抽出している。他の実施形態として、領域情報Pとして、歪み補正後の事前登録済み画像データ801自体を登録しておき、後段の処理で必要になった際に、事前登録済み画像データ801から領域情報Pを取得するようにしてもよい。
【0058】
次に、ステップS605、S606、S607において、画像処理装置3は、ユーザの撮影動作に合わせた歪み補正処理を行う。実際の運用では、会議中に撮影対象の矩形が撮影され、当該撮影によって生成された画像データを即時歪み補正して会議フォルダに保存したり、議事録等に張り付けることを想定している。
【0059】
ステップS605において、画像処理装置3は、撮影装置2からの画像データの入力を待つ。ステップS606において、画像処理装置3は、撮影装置2から画像データが入力されたか否かを判定する。画像データが入力された場合、処理はステップS607に移行する。一方、画像データが入力されていない場合、処理はステップS605に戻る。ステップS607において、画像処理装置3は、入力された画像データの歪み補正処理を行う。ステップS607の後、処理はステップS605に戻る。
【0060】
次に、図7を参照しながら、図6のステップS607の歪み補正処理について詳細に説明する。図7は、図6のステップS607の歪み補正処理を示すフローチャートである。
【0061】
ステップS701において、画像処理装置3は、図10の1001に示すような、撮影対象の矩形を含む画像データIを撮影装置2から入力する。なお、図7に示す歪み補正処理によって補正された後の画像データは、図10の1004に示すような撮影対象の矩形が切り出された画像データJとなる。
【0062】
ステップS702において、画像処理装置3は、画像データI内の直線的なエッジ部分(エッジ線分)を、ハフ変換を用いて抽出し、エッジ線分の集合Eを生成する。その際、領域情報Pにハフ変換の閾値を含めているならば、これを用いてエッジ線分の抽出レベルを調節してもよい。図10の1002は、画像データI1001上にエッジ線分を重ねて表示した状態を示している。
【0063】
ステップS703において、画像処理装置3は、エッジ線分の集合Eの中から縦線らしい線分と横線らしい線分とを抽出し、縦線の集合Vと横線の集合Hとを生成する。ステップS704において、画像処理装置3は、縦線の集合Vから任意の縦線2本、横線の集合Hから任意の横線2本を抽出し、これらを組み合わせて四角枠を生成する処理を、集合Vと集合Hとの全ての要素に適用することにより、四角枠の集合Qを生成する。図11の1101〜1104は、エッジ線分の集合Eから生成された四角枠の集合Qの例を示す図である。
【0064】
ステップS705において、画像処理装置3は、四角枠の集合Qの中から撮影対象の矩形を投射面に投影した際にできる四角枠として最も相応しい第1候補を算出する。ステップS705の詳細は後述するが、処理結果として、図11の1104に示す第1候補の四角枠とその候補レベル値とが得られる。ここで候補レベル値とは、どれだけ撮影対象の矩形を正しく囲んでいる四角枠なのかを数値化した値である。
【0065】
ステップS706において、画像処理装置3は、第1候補の四角枠の候補レベル値が一定の値以上であるか否かを判定する。第1候補の四角枠の候補レベル値が一定の値以上である場合、処理はステップS707に移行する。一方、第1候補の四角枠の候補レベル値が一定の値未満である場合、画像処理装置3は、撮影対象の矩形の切り出しが不可能であるとして処理を終了する。ステップS707において、画像処理装置3は、第1候補の四角枠に従って画像データIから撮影対象の矩形を切り出し、射影変換を行って画像データJを生成する。ここで、画像データJのある点(u,v)に対応する画像データI上の点(x,y)は、式6によって算出される。点(x,y)が画素の中心ではない場合にはバイリニア補間等の適切な補間処理が行われる。また、逆に画像データI上の点から対応する画像データJ上の点を求める際には、式8が使用される。
【0066】
ステップS708において、画像処理装置3は、図12又は図13の画像表示ウィンドウ1201、1301に示すように画像データJを表示装置4に表示する。図12の画像表示ウィンドウ1201は、切り出し用の四角枠が適切ではなかった場合に画像データJが表示された例を示している。ユーザが再修正ボタン1211を押下することにより、図12の四角枠修正ウィンドウ1202が表示され、ユーザによる手動修正を行うことが可能となる。即ち、ユーザは四角枠1222の四隅等をUIデバイス401でドラッグすることにより、図13の四角枠修正ウィンドウ1302に示すように撮影対象の矩形をぴったりと囲むように四角枠1322を修正することが可能である。最後に修正を確定し、修正後の射影変換結果をもう一度表示させるためには、ユーザは修正画像表示ボタン1321を押せばよい。これにより、図13に示すように、画像表示ウィンドウ1301内に画像データJが適切に表示される。
【0067】
他の実施形態として、射影変換結果の表示と四角枠の修正とを表示装置4上で行うのではなく、撮影装置2のビューファインダ22上で行うようにしてもよい。この場合、ビューファインダ22をタッチパネルとして構成し、指によるポインティングができることが望ましい。
【0068】
ステップS709において、画像処理装置3は、ユーザによって四角枠が修正されたか否かを判定する。即ちここでは、ユーザによって四角枠が修正され、修正画像表示ボタン1221、1321が押されたか否かが判定される。ユーザによって四角枠が修正された場合、処理はステップS710に移行する。一方、ユーザによって四角枠が修正されていない場合、処理はS711に移行する。
【0069】
ステップS710において、画像処理装置3は、図6のステップS604と同じ周辺画像データの解析処理によって、四角枠の修正結果から撮影対象の矩形の正しい領域情報Pを学習(再登録)する。なお、領域情報Pは四角枠周辺の複数個所から取得される。また、周辺画像データの解析対象となる事前登録済み画像データとしては、歪み補正後の画像データが用いられる。このように、四角枠の修正時に正しい領域情報Pを学習するため、図6のステップS602、S603、S604に示すような事前の登録作業を行わなくても、システムを使用していく過程で自然に領域情報Pの登録が行われる。領域情報Pの学習後はステップS707に戻って修正後の射影変換結果が表示される。
【0070】
ステップS711において、画像処理装置3は、射影変換によって歪み補正された画像データJをデータ用記憶領域407に保存する。具体的には、会議システムによって用意される会議フォルダに保存される。また、保存された画像データは議事録等に張り付けることも可能である。
【0071】
次に、図14を参照しながら、図7のステップS705の四角枠の第1候補の算出処理について詳細に説明する。図14は、図7のステップS705の四角枠の第1候補の算出処理を示すフローチャートである。
【0072】
ステップS1401において、画像処理装置3は、四角枠の集合Qを入力する。四角枠の集合Qには、例えば図11の点線に示すような四角枠1101〜1104が含まれる。図14を用いて説明する四角枠の第1候補の算出処理では、このような四角枠の集合Qから撮影対象の矩形を囲むのに最適な四角枠が算出される。図11の例では、四角枠1104が四角枠の第1候補Tとして算出される。
【0073】
ステップS1402において、画像処理装置3は、四角枠の集合Qのそれぞれに対して、式7に従って四隅の点(xn,yn)(n=1,2,3,4,)から射影変換のパラメータAx´、Ay´、Az´、Bx´、By´、Bz´、Sx´、Sy´を算出する。ステップS1403において、画像処理装置3は、式11、式12に従って四隅の点(xn,yn)(n=1,2,3,4)からαとβとを算出し、式13に従って焦点距離fを算出する。
【0074】
ステップS1404において、画像処理装置3は、撮影装置2の焦点距離とステップS1403で算出した焦点距離fとを比較し、撮影装置2の焦点距離に近い焦点距離fを持つ四角枠の候補レベル値をアップする。ここでは、例えば、撮影装置2の焦点距離との差分が一定の値以下である焦点距離fを持つ四角枠の候補レベル値をアップすることが考えられる。なお、撮影装置2の焦点距離は撮影装置2から直接取得する他に、出力される画像データに付加されているメタデータ(JPEGのExifデータ等)に記載されている値を用いてもよい。
【0075】
ステップS1405において、画像処理装置3は、四角枠の集合Qのそれぞれに対して、式14に従って各四角枠が切り出すであろう撮影対象の矩形の縦横比を算出する。ステップS1406において、画像処理装置3は、領域情報Pの中から撮影対象の矩形の縦横比を抽出し、撮影対象の矩形の縦横比とステップS1405で算出した縦横比とを比較する。そして画像処理装置3は、撮影対象の矩形の縦横比に近い縦横比を持つ四角枠の候補レベル値をアップする。ここでは、例えば、撮影対象の矩形の縦横比との差分が一定の値以下である縦横比を持つ四角枠の候補レベル値をアップすることが考えられる。
【0076】
ステップS1407において、画像処理装置3は、四角枠の集合Qのそれぞれに対して、領域情報Pの中から抽出した撮影対象の矩形の縁の色と四角枠の縁の色とを比較し、撮影対象の矩形の縁の色に近い色の縁を持つ四角枠の候補レベル値をアップする。ステップS1408において、画像処理装置3は、四角枠の集合Qのそれぞれに対して、領域情報Pの中から抽出された撮影対象の矩形の内外の色合いと四角枠の内外の色合いとを比較し、撮影対象の矩形の内外の色合いと近い内外の色合いを持つ四角枠の候補レベル値をアップする。なお、ステップS1407とS1408とにおける色や色合いの比較は次の方法によって行うことが可能であるが、本発明はこの方法に限定されるものではない。
【0077】
画像データの画素I(x,y)の赤色成分、緑色成分、青色成分をR(x,y)、G(x,y)、B(x,y)とし、撮影対象の矩形の画像データにおける画素IP(x,y)の赤色成分、緑色成分、青色成分をRP(x,y)、GP(x,y)、BP(x,y)とすると、ある領域KとKPの色の平均の差分は次の式15により求められる。そして、例えば、この差分が一定の値以下となる色や色合いを持つ四角枠の候補レベル値をアップすることが考えられる。
【0078】
【数17】
【0079】
ステップS1409において、画像処理装置3は、四角枠の集合Qのそれぞれに対して、式6に従って四角枠の周辺画像データを射影変換する。なお、射影変換の際には必要に応じてバイリニア補間等の適切な補間処理が行われる。ステップS1410において、画像処理装置3は、領域情報Pの中から撮影対象の矩形の周辺画像データを抽出し、撮影対象の矩形の周辺画像データとステップS1405で射影変換処理された周辺画像データとを比較する。そして画像処理装置3は、撮影対象の矩形の周辺画像データと近い周辺画像データを持つ四角枠の候補レベル値をアップする。なお、周辺画像データの比較は次の方法によって行うことが可能であるが、本発明はこの方法に限定されるものではない。
【0080】
四角枠の周辺画像データの画素I(x,y)の明るさ成分をO(x,y)とし、撮影対象の矩形の周辺画像データの画素IP(x、y)の明るさ成分をOP(x,y)とすると、或る領域Kの画像データの差分は次の式16により求められる。そして、例えば、この差分が一定の値以下となる周辺画像データを持つ四角枠の候補レベル値をアップすることが考えられる。
【0081】
【数18】
【0082】
領域情報Pに撮影パラメータを含めているならば、画像処理装置3は、ステップS1407〜S1410において、当該撮影パラメータを用いて色の比較処理や画像データの比較処理を行ってもよい。また、ステップS1403〜S1410の各段階において、候補レベル値が一定値に満たない候補を切り落とし、順次絞込みを行うようにしてもよい。さらに、焦点距離、縦横比、縁の色、内外の色合い、周辺画像データに関する各比較処理は、必ずしもこの順番で全て行う必要はなく、幾つかの比較処理を選択して別の順番で実行してもよい。ステップS1411において、画像処理装置3は、候補レベル値が最大となった四角枠を第1候補Tとし、その候補レベル値をLTとする。
【0083】
以上により、本実施形態によれば、ホワイトボードや紙資料等の撮影対象の矩形を撮影する作業を効率化させることが可能となる。
【0084】
次に、本発明の第2の実施形態について説明する。本発明の第2の実施形態では、撮影された画像データがホワイトボードを含むものであれば、画像データを表示装置4に表示させずにそのまま保存する。一方、撮影された画像データがホワイトボードを含むものでなければ、画像データを表示装置4に表示させる。これにより、会議記録として保存さえできればよいホワイトボードを含む画像データはそのまま会議フォルダに保存し、画像データを表示することによる会議の一時的中断を防ぐことができる。また、撮影装置2によってホワイトボード以外のものが撮影された場合には、画像データを加工することなく直ぐに表示することで会議参加者全員に見せることが可能になる。なお、画像データがホワイトボードを含まない場合に直ぐに表示すること以外にも、画像データを指定のサーバにアップロードする等、事前に指定された処理を行うようにしてもよい。
【0085】
図15のステップS701〜S706の処理の流れは、図7と同一符号のステップの処理の流れと同じであるため、説明は省略する。ステップS706において第1候補の四角枠の候補レベル値が一定の値以上であると判定された場合、処理はステップS1501に移行する。一方、ステップS706において第1候補の四角枠の候補レベル値が一定の値未満であると判定された場合、処理はステップS1503に移行する。
【0086】
ステップS1501において、画像処理装置3は、図7のステップS707と同様に、第1候補の四角枠に従って画像データIから撮影対象の矩形を切り出し、射影変換を行って画像データJを生成する。ステップS1502おいて、画像処理装置3は、射影変換によって歪み補正された画像データJをデータ用記憶領域407に保存する。
【0087】
ステップS1503において、画像処理装置3は、撮像装置2から入力した画像データIを画像データJにそのままコピーする。ステップS1504において、画像処理装置3は、図7のステップS708と同様に、図12又は図13の画像表示ウィンドウ1201、1301に示すように画像データJを表示装置4に表示する。ステップS1505において、画像処理装置3は、図7のステップS709と同様に、ユーザによって四角枠が修正されたか否かを判定する。ユーザによって四角枠が修正された場合、処理はステップS1506に移行する。ユーザによって四角枠が修正されていない場合、処理はステップS1502に移行する。ステップS1506において、画像処理装置3は、図7のステップS710と同様に、周辺画像データの解析処理によって、四角枠の修正結果から撮影対象の矩形の正しい領域情報Pを学習する。ステップS1507において、画像処理装置3は、第1候補の四角枠に従って画像データIから撮影対象の矩形を切り出し、射影変換を行って画像データJを生成する。
【0088】
なお、ステップS1503〜S1507は、画像データI内にホワイトボードが含まれていたが、ステップS702〜S705で検出できなかったときの救済処理であるため、救済処理が必要なければ省いても構わない。
【0089】
以上、本発明の実施形態について説明したが、本発明は、例えば、システム、装置、方法、プログラム又は記録媒体(記憶媒体)等としての実施態様をとることが可能である。具体的には、複数の機器(例えば、ホストコンピュータ、インタフェース機器、撮像装置、Webアプリケーション等)から構成されるシステムに適用してもよいし、また、一つの機器からなる装置に適用してもよい。
【0090】
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
【符号の説明】
【0091】
1:ホワイトボード、2:撮影装置、3:画像処理装置、4:表示装置、7:画像処理システム
【特許請求の範囲】
【請求項1】
画像データを入力する入力手段と、
前記入力手段により入力された前記画像データから線分を検出する検出手段と、
撮影対象の矩形の領域に係る情報に基づいて、前記画像データに含まれる前記撮影対象の矩形を囲む四角枠を、前記検出手段により検出された線分から決定する決定手段とを有することを特徴とする画像処理装置。
【請求項2】
前記撮影対象の矩形の領域に係る情報として、前記撮影対象の矩形の縦横比、前記撮影対象の矩形の縁の色、前記撮影対象の矩形の内外の色合い、及び、前記撮影対象の矩形の周辺画像データのうちの少なくとも何れか一つを含むことを特徴とする請求項1に記載の画像処理装置。
【請求項3】
前記撮影対象の矩形の領域に係る情報に基づいて、前記画像データに前記撮影対象の矩形が含まれているか否かを判定する判定手段と、
前記判定手段により前記画像データに前記撮影対象の矩形が含まれていないと判定された場合、所定の処理を実行する制御手段とを有することを特徴とする請求項1又は2に記載の画像処理装置。
【請求項4】
前記所定の処理は、前記画像データを表示させる処理であることを特徴とする請求項3に記載の画像処理装置。
【請求項5】
前記四角枠を修正する修正手段と、
前記修正手段により修正された前記四角枠に基づいて、前記撮影対象の矩形の領域に係る情報を再登録する再登録手段とを更に有することを特徴とする請求項1乃至4の何れか1項に記載の画像処理装置。
【請求項6】
画像処理装置によって実行される画像処理方法であって、
画像データを入力する入力ステップと、
前記入力ステップにより入力された前記画像データから線分を検出する検出ステップと、
撮影対象の矩形の領域に係る情報に基づいて、前記画像データに含まれる前記撮影対象の矩形を囲む四角枠を、前記検出ステップにより検出された線分から決定する決定ステップとを含むことを特徴とする画像処理方法。
【請求項7】
画像データを入力する入力ステップと、
前記入力ステップにより入力された前記画像データから線分を検出する検出ステップと、
撮影対象の矩形の領域に係る情報に基づいて、前記画像データに含まれる前記撮影対象の矩形を囲む四角枠を、前記検出ステップにより検出された線分から決定する決定ステップとをコンピュータに実行させるためのプログラム。
【請求項1】
画像データを入力する入力手段と、
前記入力手段により入力された前記画像データから線分を検出する検出手段と、
撮影対象の矩形の領域に係る情報に基づいて、前記画像データに含まれる前記撮影対象の矩形を囲む四角枠を、前記検出手段により検出された線分から決定する決定手段とを有することを特徴とする画像処理装置。
【請求項2】
前記撮影対象の矩形の領域に係る情報として、前記撮影対象の矩形の縦横比、前記撮影対象の矩形の縁の色、前記撮影対象の矩形の内外の色合い、及び、前記撮影対象の矩形の周辺画像データのうちの少なくとも何れか一つを含むことを特徴とする請求項1に記載の画像処理装置。
【請求項3】
前記撮影対象の矩形の領域に係る情報に基づいて、前記画像データに前記撮影対象の矩形が含まれているか否かを判定する判定手段と、
前記判定手段により前記画像データに前記撮影対象の矩形が含まれていないと判定された場合、所定の処理を実行する制御手段とを有することを特徴とする請求項1又は2に記載の画像処理装置。
【請求項4】
前記所定の処理は、前記画像データを表示させる処理であることを特徴とする請求項3に記載の画像処理装置。
【請求項5】
前記四角枠を修正する修正手段と、
前記修正手段により修正された前記四角枠に基づいて、前記撮影対象の矩形の領域に係る情報を再登録する再登録手段とを更に有することを特徴とする請求項1乃至4の何れか1項に記載の画像処理装置。
【請求項6】
画像処理装置によって実行される画像処理方法であって、
画像データを入力する入力ステップと、
前記入力ステップにより入力された前記画像データから線分を検出する検出ステップと、
撮影対象の矩形の領域に係る情報に基づいて、前記画像データに含まれる前記撮影対象の矩形を囲む四角枠を、前記検出ステップにより検出された線分から決定する決定ステップとを含むことを特徴とする画像処理方法。
【請求項7】
画像データを入力する入力ステップと、
前記入力ステップにより入力された前記画像データから線分を検出する検出ステップと、
撮影対象の矩形の領域に係る情報に基づいて、前記画像データに含まれる前記撮影対象の矩形を囲む四角枠を、前記検出ステップにより検出された線分から決定する決定ステップとをコンピュータに実行させるためのプログラム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【公開番号】特開2012−238098(P2012−238098A)
【公開日】平成24年12月6日(2012.12.6)
【国際特許分類】
【出願番号】特願2011−105360(P2011−105360)
【出願日】平成23年5月10日(2011.5.10)
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】
【公開日】平成24年12月6日(2012.12.6)
【国際特許分類】
【出願日】平成23年5月10日(2011.5.10)
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】
[ Back to top ]