メモ情報管理システム、メモ情報処理装置及びプログラム
【課題】対象領域内の一部を撮影した撮影画像に対して入力されたメモ情報について、そのメモ情報の入力対象である注目範囲を特定して記録できるようにする。
【解決手段】空間モデル記憶部120には、対象領域に配置された各目印物体の位置及び画像特徴を示す目印情報124が記録される。調査者は、携帯型のメモ端末200により対象領域内での人々の作業風景を撮影し、撮影した画像に対応づけてメモ情報を入力する。フィールドワーク記録管理部130は、撮影画像とメモ情報のペアをメモ端末200から受け取り、その撮影画像と各目印物体の画像特徴を照合することにより、撮影画像に含まれる目印物体を特定し、撮影画像内の目印物体の配置関係から、その撮影画像を撮影した際に調査者が注目していた範囲の三次元的な位置を特定する。特定した位置をメモ情報と対応づけてフィールドワーク記録記憶部140に記憶する。
【解決手段】空間モデル記憶部120には、対象領域に配置された各目印物体の位置及び画像特徴を示す目印情報124が記録される。調査者は、携帯型のメモ端末200により対象領域内での人々の作業風景を撮影し、撮影した画像に対応づけてメモ情報を入力する。フィールドワーク記録管理部130は、撮影画像とメモ情報のペアをメモ端末200から受け取り、その撮影画像と各目印物体の画像特徴を照合することにより、撮影画像に含まれる目印物体を特定し、撮影画像内の目印物体の配置関係から、その撮影画像を撮影した際に調査者が注目していた範囲の三次元的な位置を特定する。特定した位置をメモ情報と対応づけてフィールドワーク記録記憶部140に記憶する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、メモ情報管理システム、メモ情報処理装置及びプログラムに関する。
【背景技術】
【0002】
現場の状況を調査するフィールドワーク調査では、ビデオカメラや静止画カメラ、音声レコーダーなどといった様々な記録装置を用いて現場の状況を記録し、記録された動画、画像、音声などを用いて分析を行っている。
【0003】
特許文献1には、入力操作に応じて処理された結果が表示される入出力装置において、表示画面及び操作キーを平面上に投影する投影手段と、平面上に投影された表示画面又は操作キーに対して操作者が行う入力操作を撮影する撮像手段と、撮像手段が撮影した画像を解析して、操作者が行った入力操作を識別する画像識別手段と、識別した入力操作に応じた処理を行い、投影手段を制御して表示画面の表示に処理結果を反映させる処理手段とを設けることが開示されている。
【0004】
特許文献2に開示されるモデルデータベースは、対象物の三次元ワイヤフレーム情報を記憶しており、移動体抽出部は、CCDカメラによる映像ソースからブロックマッチング法により移動体領域を抽出する。空間量子化部は、移動体領域の二次元画像とテクスチャマッピングにより生成した推定画像との間の比較計算を行いながら、移動対象物の三次元位置姿勢を推定する。テクスチャマッピング部は、対象物メモリ中のワイヤフレーム情報を基準にし、かつ空間量子化部から出力される位置姿勢情報を用いて、対象物のワイヤフレームへのテクスチャマッピングを実行し、画像推定部は、斯様なテクスチャマッピングを元にして対象物の仮想実画像を生成する。
【0005】
特許文献3には、バーチャル環境に関するモデリング及び対話のために設けられた装置が開示される。当該環境のイメージ、及びその内部におけるユーザーの存在についての表示は、メモリからのデータに基づいてCPUによって生成され、立体的なディスプレイによってユーザーに提供される。ユーザーは、単一の制御ボタンを有するハンドヘルド・ユニットを装備される。ボタンが押されていないとき、制御装置のユーザーの運動は、モデリングされるアイコン(バーチャル・ハンドのような)によって前記バーチャル環境内において複製され、対話を可能にする。ボタンが作動されているとき、制御装置のユーザーの運動は、その代わりに、ナビゲーション指令に変換され、バーチャル環境におけるユーザーの存在の位置をシフトさせる。
【0006】
非特許文献1に開示されたDOTSシステムは、研究目的で実際のオフィス環境に設置された、屋内型、リアルタイム、マルチカメラの監視システムである。多人数の人を追跡する効果的アプローチを組み込み、個々のカメラから得られる結果をマルチカメラの軌跡として一体化している。DOTSのユーザインタフェースは、簡単に参照することでユーザーが重要なイベントに注目できるようにしている。また、同一ユーザインタフェースの中の異なる表現により、より簡単なナビゲーションが出来る空間情報も提供される。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】特開2000−298544号公報
【特許文献2】特開平08−114416号公報
【特許文献3】特表平11−513157号公報
【非特許文献】
【0008】
【非特許文献1】Andreas Girgensohn他9名、” DOTS: support for effective video surveillance”、[online]、2007年、International Multimedia Conference、 Proceedings of the 15th international conference on Multimedia、 [平成21年10月8日検索]、インターネット<http://portal.acm.org/citation.cfm?doid=1291233.1291332>
【発明の概要】
【発明が解決しようとする課題】
【0009】
本発明は、対象領域内の一部を撮影した撮影画像に対して入力されたメモ情報について、そのメモ情報の入力対象である注目範囲を特定して記録できるようにすることを目的とする。
【課題を解決するための手段】
【0010】
請求項1に係る発明は、対象領域内の各目印物体の位置情報及び認識用特徴情報を記憶する目印情報記憶手段と、前記対象領域の少なくとも一部を撮影することにより得られた撮影画像を表示する撮影画像表示手段と、メモ情報の入力を受け付けて前記撮影画像表示手段に表示された撮影画像と関連づける入力受付手段と、前記入力受付手段で受け付けたメモ情報に関連づけられた撮影画像と前記目印情報記憶手段に記憶された各目印物体の認識用特徴情報との照合により、当該撮影画像に含まれる1以上の目印物体の画像を特定し、特定した各目印物体の画像の前記撮影画像中での位置と前記目印情報記憶手段に記憶された当該各目印物体の位置情報とに基づき、当該メモ情報に対応する前記対象領域内の注目範囲を特定する注目範囲特定手段と、前記入力受付手段で受け付けたメモ情報を、前記注目範囲特定手段が特定した当該メモ情報に対応する注目範囲を示す注目範囲情報と対応づけて記憶するメモ情報記憶手段と、を備えるメモ情報管理システムである。
【0011】
請求項2に係る発明は、前記対象領域の三次元形状モデル情報を記憶するモデル記憶手段と、前記モデル記憶手段に記憶された前記対象領域の三次元形状モデル情報に基づき、前記対象領域の二次元画像を生成する領域画像生成手段と、前記領域画像生成手段が生成した二次元画像内に前記メモ情報記憶手段に記憶されたメモ情報に関連づけられた注目範囲が含まれる場合に、当該二次元画像内の当該注目範囲に対応づけて当該メモ情報を出力するメモ情報出力手段と、を備える請求項1に記載のメモ情報管理システムである。
【0012】
請求項3に係る発明は、前記対象領域の少なくとも一部を撮影することにより前記撮影画像表示手段に表示するための撮影画像を生成するとともに、当該撮影画像中での焦点位置の情報を当該撮影画像と対応づけて出力する撮影手段、を更に備え、前記注目範囲特定手段は、前記メモ情報に関連づけられた撮影画像に対応づけて前記撮影手段から出力された焦点位置を加味して、当該メモ情報に対応する前記注目範囲を特定する、ことを特徴とする請求項1に記載のメモ情報管理システムである。
【0013】
請求項4に係る発明は、前記対象領域の動画を撮影する動画撮影手段と、前記動画撮影手段が撮影した動画の動画データを記憶する動画記憶手段と、前記動画記憶手段が記憶している動画データに基づき前記対象領域の動画を再生する動画再生手段と、前記領域画像生成手段が生成した前記対象領域の二次元画像と、前記動画再生手段が再生した動画と、を対応づけて表示する動画表示手段と、を更に備え、前記撮影画像表示手段は、前記動画撮影手段が撮影した動画を前記撮影画像として表示し、前記入力受付手段は、前記メモ情報の入力を受け付けた時点で前記撮影画像表示手段が表示していた撮影画像の前記動画データ内での時点を求め、前記メモ情報記憶手段は、前記メモ情報に関連づけられた前記撮影画像の前記動画データ内での時点を、当該メモ情報に対応づけて記憶し、前記メモ情報出力手段は、前記動画表示手段に表示されている画像の前記動画データ内での時点に対応する時点のメモ情報を出力する、ことを特徴とする請求項1に記載のメモ情報管理システムである。
【0014】
請求項5に係る発明は、対象領域内の各目印物体の位置情報及び認識用特徴情報を記憶する目印情報記憶手段と、メモ入力装置からメモ情報と撮影画像の組を受信する受信手段と、前記受信手段が受信した撮影画像と前記目印情報記憶手段に記憶された各目印物体の認識用特徴情報との照合により、当該撮影画像に含まれる1以上の目印物体の画像を特定し、特定した各目印物体の画像の前記撮影画像中での位置と前記目印情報記憶手段に記憶された当該各目印物体の位置情報とに基づき、当該撮影画像と共に受信したメモ情報に対応する前記対象領域内の注目範囲を特定する注目範囲特定手段と、前記メモ情報を、前記注目範囲特定手段が特定した当該メモ情報に対応する注目範囲を示す注目範囲情報と対応づけて記憶するメモ情報記憶手段と、を備えるメモ情報処理装置である。
【0015】
請求項6に係る発明は、コンピュータを、対象領域内の各目印物体の位置情報及び認識用特徴情報を記憶する目印情報記憶手段、メモ入力装置からメモ情報と撮影画像の組を受信する受信手段、前記受信手段が受信した撮影画像と前記目印情報記憶手段に記憶された各目印物体の認識用特徴情報との照合により、当該撮影画像に含まれる1以上の目印物体の画像を特定し、特定した各目印物体の画像の前記撮影画像中での位置と前記目印情報記憶手段に記憶された当該各目印物体の位置情報とに基づき、当該撮影画像と共に受信したメモ情報に対応する前記対象領域内の注目範囲を特定する注目範囲特定手段、前記メモ情報を、前記注目範囲特定手段が特定した当該メモ情報に対応する注目範囲を示す注目範囲情報と対応づけて記憶するメモ情報記憶手段、として機能させるためのプログラムである。
【発明の効果】
【0016】
請求項1,5又は6に係る発明によれば、対象領域内の一部を撮影した撮影画像に対して入力されたメモ情報について、そのメモ情報の入力対象である注目範囲を特定して記録できる。
【0017】
請求項2に係る発明によれば、メモ情報を、対象領域の三次元モデルの画像内における注目範囲に対応づけて出力することができる。
【0018】
請求項3に係る発明によれば、メモ情報に対応する注目範囲を、焦点位置の情報を用いない場合によりも高精度に特定することができる。
【0019】
請求項4に係る発明によれば、対象領域を撮影した動画の再生と同期してメモ情報を出力することができる。
【図面の簡単な説明】
【0020】
【図1】実施形態のシステム構成の一例を示す図である。
【図2】対象領域に対する定置カメラの配置例を示す図である。
【図3】空間モデル管理部の機能構成の一例を示す図である。
【図4】対象領域内から抽出された目印物体の位置を例示する図である。
【図5】目印情報のデータ構造の一例を示す図である。
【図6】フィールドワーク記録管理部の機能構成の一例を示す図である。
【図7】撮影画像内に含まれる目印物体の例を示す図である。
【図8】メモレコードのデータ構造の一例を示す図である。
【図9】表示編集処理部の機能構成の一例を示す図である。
【図10】表示画面の例を示す図である。
【図11】変形例のシステム構成の一例を示す図である。
【図12】対象領域に対する位置センサの配置例を示す図である。
【図13】個々の対象の位置変化データのデータ構造の一例を示す図である。
【発明を実施するための形態】
【0021】
図1を参照して、実施形態のシステムの例を説明する。
【0022】
図1に例示したシステムは、フィールドワーク支援装置100、メモ端末200、複数の定置カメラ250を備えている。
【0023】
このシステムは、例えば、顧客組織の業務改善コンサルタント業務などにおけるフィールドワークを支援するために用いられる。例えば、このようなフィールドワークでは、調査者(例えばコンサルタント)が顧客組織の業務現場に入り、業務現場(例えばオフィス)で実際に行われている業務の進め方を実地に調べる。以下では、調査の対象となる現場の物理的な領域(部屋など)のことを、対象領域と呼ぶ。
【0024】
このシステムでは、調査者がメモ端末200を携帯して対象領域を自由な視点から撮影し、撮影した画像に対するメモ情報を調査者が入力する。メモ情報は、例えば、調査者がその画像を撮影しているときに感じた現場の印象や思いついた業務改善案などの情報であり、アノテーション(注釈情報)とも呼ばれる。このようなメモ情報の記録のために、メモ端末200は、カメラ210、表示画面220、入力装置230及びメモ入力処理部240を備える。
【0025】
カメラ210は、撮影した画像のデータを生成し、出力することが可能なデジタルカメラである。カメラ210は、静止画カメラであっても、動画カメラであってもよい。表示画面220は、例えばカメラ210が現在撮影している画像を表示する。入力装置230は、調査者がメモ情報の入力のために用いる装置であり、例えばキーボードやキーパッドなどであり、この場合、入力されるメモ情報はテキストデータとなる。また、入力装置230は、表示画面220上に表示されるソフトウエアキーボードなどであってもよい。また、入力装置230は、音声を入力するマイクであってもよく、この場合メモ情報は音声データとなる。調査者は、表示画面220に表示されている、カメラ210が現在撮影中の画像を見ながら、その画像に写された現場の状況に対するメモ情報を入力装置230から入力する。
【0026】
メモ入力処理部240は、入力装置230から入力されたメモ情報を、そのメモ情報の対象となった撮影画像、すなわちメモ情報が入力されていたときに表示画面220に表示されている、カメラ210が撮影中の画像、に対応づける処理を行う。この対応づけ処理では、例えば、撮影画像の静止画像データとメモ情報とを対応づけてメモ端末200内の記憶装置に保存したり、或いは、撮影画像の静止画像データとメモ情報とを対応づけてフィールドワーク支援装置100に無線LANなどの通信回線経由で送信したりする。撮影画像の静止画像データとメモ情報とを対応づけてメモ端末200内の記憶装置に保存した場合、それら記憶したデータは、メモ端末200をフィールドワーク支援装置100に接続した際に、メモ端末200からフィールドワーク支援装置100に転送される。
【0027】
また、カメラ210が動画を撮影するものである場合、入力されたメモ情報の撮影画像への対応づけは、例えば、その動画全体の時間幅の中での、そのメモ情報の入力時点を表す情報を記録することにより行ってもよい。メモ情報の入力時点の情報が記録されていれば、動画データの中からその時点の画像を取り出すことで、そのメモ情報の入力対処となった撮影画像を再現できる。
【0028】
メモ端末200は、例えばカメラ付き携帯電話機にメモ入力処理部240の処理を行うプログラムをインストールしたものであってもよい。また、ネットブック等の携帯型のコンピュータにデジタルカメラを有線又は無線で接続したものをメモ端末200として用いてもよい。
【0029】
調査者は対象領域内を移動しながら、メモ端末200で、注目すべき箇所を撮影し、メモ情報を入力する。したがって、メモ情報の入力対象となった撮影画像は、対象領域の一部分を捉えたものであることが多い。フィールドワーク後の分析作業の際、メモ情報を、その情報の入力対象であった撮影画像と共に提示することは有益であるが、それだけでは対象領域内のどの場所でそのメモ情報の対象となった出来事が起こったのかが分かりにくい場合がある。
【0030】
そこで、この実施形態では、メモ情報が、対象領域全体の中のどの場所(での出来事)に対して入力されたのかを表示する。このために、フィールドワーク支援装置100は、対象領域の三次元モデル等の情報を記憶した空間モデル記憶部120を備え、その対象領域の三次元モデル内のどの領域に対してメモ情報が入力されたのかを解析し、表示する。
【0031】
空間モデル記憶部120は、レイアウト情報122と目印情報124を記憶している。レイアウト情報122は、対象領域の三次元モデルを表す情報であり、例えば対象領域内の各物体(例えば机、ホワイトボード、複写機など)の三次元的な位置や形状などの情報を含んでいる。目印情報124は、対象領域内での目印となる各物体(目印物体と呼ぶ)の特徴を表す情報である。目印情報は、メモ端末200が撮影した撮影画像から、メモ情報の対象となった場所(以下、「注目範囲」と呼ぶ)を特定するのに用いられる。
【0032】
空間モデル管理部110は、空間モデル記憶部120の記憶情報を管理する。特に空間モデル管理部110は、対象領域内に配置された複数の定置カメラ250が撮影した画像と、レイアウト情報122とを用いて、目印情報124を生成する。
【0033】
定置カメラ250は対象領域300内に固定配置されるカメラである。図2に例示するように、各定置カメラ250は、例えば対象領域300のほぼすべての物体が複数の定置カメラ250の視野(撮影範囲)に収められるように、それぞれ適切な場所に配置される。1つの物体を、位置の異なる2以上のカメラで撮影することにより、周知のステレオ法によりその物体の三次元的な位置や形状を求めることができる。定置カメラ250は、チルトやパンなどといった視線方向を変える機能や、ズーム機能などを備えていてもよい。各定置カメラ250が撮影した画像のデータは、空間モデル管理部110に、有線又は無線により送信される。また、定置カメラ250は、チルト、パン、ズームの機能を備える場合、撮影した画像のデータを、その画像を撮影したときのチルト角、パン角、ズーム倍率などの情報とともに空間モデル管理部110に送信する。或いは、空間モデル管理部110が定置カメラ250にチルト角、パン角、ズーム倍率を指示し、定置カメラ250がその指示に従ってチルト、パン、ズームの制御を行って撮影するようにしてもよい。
【0034】
空間モデル管理部110は、各定置カメラ250が配置された位置や視野(視線方向や視野角など)の情報を有している。定置カメラ250の視野はチルト、パン、ズームなどにより変化し得るが、空間モデル管理部110は、チルト角等の情報から定置カメラ250の視野を特定可能である。空間モデル管理部110は、各定置カメラ250から送られてきた画像に基づき、対象領域内の目印物体を抽出する。
【0035】
図3に、空間モデル管理部110の詳細な機能構成の例を示す。この例では、空間モデル管理部110は、データ受信部112、目印情報登録部114、及び画像特徴抽出部116を備える。
【0036】
データ受信部112は、各定置カメラ250から、撮影された画像のデータや視野の情報を受信する。目印情報登録部114は、それら定置カメラ250からの情報を画像特徴抽出部116に渡し、対象領域300内にある各目印物体を抽出させ、それら各目印物体の特徴を求めさせる。ここで、抽出する目印物体は、例えば柱、壁、机、複合機(プリンタ、スキャナ、コピー機等の機能を併せ持つ装置)等の事務機器、ホワイトボードなどといった、比較的大きな物体とする。
【0037】
抽出のために、画像特徴抽出部116は、各定置カメラ250の配置位置及び視野の情報と、各定置カメラ250から送られてきた画像と、に基づき、公知のステレオ法及び三次元オブジェクト認識のための演算処理を実行する。ここで画像特徴抽出部116は、各定置カメラ250から送られてきた画像に対してそれぞれ輪郭抽出を行い、抽出された輪郭画像に対してステレオ法及び三次元オブジェクト認識の演算処理を行うようにしてもよい。例えば、画像特徴抽出部116は、この結果求められたいくつかの三次元物体のうち、あらかじめ定めたサイズ以上のサイズを持つ物体を目印物体として抽出すればよい。また、抽出の条件として、サイズ以外に、形状についての条件(例えば直方体に近いなど)を課してもよい。
【0038】
また、画像特徴抽出部116は、ステレオ法やオブジェクト認識のために、対象領域300の三次元モデルであるレイアウト情報122を参照してもよい。例えば、各定置カメラ250の画像に対するステレオ法による三次元形状認識結果と、レイアウト情報122に含まれている各三次元オブジェクトの位置や形状とを比較して、画像から求められたオブジェクトがレイアウト情報122中のどのオブジェクトに対応するかを求めるなどである。このような処理により、各目印物体の三次元的な位置及び形状を示す情報が求められる。
【0039】
また、画像特徴抽出部116は、抽出した各目印物体について、その特徴を表す目印物体特徴情報を求める。例えば、当該目印物体の三次元形状(例えば輪郭情報や各頂点の配置関係の情報など)自体も目印物体特徴情報の一種である。また、目印物体の三次元形状についての定量的な性質、例えば幅と奥行きと高さの比や、各面の平行度なども、目印物体特徴情報の一例である。また、目印物体の表面(面が複数ある場合は各面)の色やテクスチャ、空間周波数なども目印物体特徴情報の一例である。目印物体特徴情報は、後述するフィールドワーク記録管理部130による、メモ端末200の撮影画像中からの目印物体の認識のための基礎情報として用いられる。この認識処理は、公知のオブジェクト認識処理により行うことができる。画像特徴抽出部116は、上に例示したものも含む公知の三次元オブジェクト特徴のうち、フィールドワーク記録管理部130が実行するオブジェクト認識処理で用いられるものを目印物体特徴情報として求めればよい。このような目印物体特徴情報は、公知の方法で求めることができるので、これ以上の説明は省略する。
【0040】
以上は、画像特徴抽出部116が目印物体を自動抽出する例であったが、別の例として、レイアウト情報122に含まれる各三次元オブジェクトの中から、ユーザーがあらかじめ目印物体を指定しておいてもよい。この場合、目印物体の位置や形状は既知である。画像特徴抽出部116は、それら各目印物体の位置や形状と、各定置カメラ250の画像とを突き合わせることで、それら各画像のどの部分がどの目的物体に対応するかを判定し、各目印物体の目印物体特徴情報を生成すればよい。
【0041】
また、形状や表面の模様が既知の目印物体(例えば球体や立方体などといった既知形状の目印部分を有する置物)を対象領域300内に複数配置し、各定置カメラ250の画像からそれら既知の目印物体を抽出してその位置や特徴情報を求めてもよい。
【0042】
図4に示す例では、対象領域300の中から、A〜Fの6つの目印物体が抽出されている。
【0043】
目印情報登録部114は、画像特徴抽出部116が抽出した各目印物体の三次元的な位置や目印物体特徴情報を、空間モデル記憶部120の目印情報124に登録する。目印情報124は、図5に例示するように、目印物体ごとに、その目印物体の対象領域300内での三次元的な位置125の情報と目印物体特徴情報126とを含んでいる。
【0044】
また、別の例として、各目印物体の各面の色やテクスチャなどの画像特徴を、レイアウト情報122におけるそれら各目印物体の三次元モデルに対応づける(貼り付ける)などして、目印物体の画像特徴を目印物体の三次元モデル自体に統合してもよい。
【0045】
なお、空間モデル管理部110は、各定置カメラ250の撮影した画像を合成することで、三次元自由視点画像(視点や視線方向を自由に変えられる画像)を生成し、空間モデル記憶部120に記憶してもよい。これには、例えば金出武雄による「アイビジョン」の技術を用いればよい。
【0046】
以上のようにして目印情報124が完成すると、この目印情報124を用いてフィールドワークでのメモ情報の対象となった注目範囲の特定を行うことができる。すなわち、調査者が前述したメモ端末200にて現場を撮影しながらメモ情報を入力すると、メモ情報とそのメモ情報の入力対象となった撮影画像とがフィールドワーク記録管理部130に入力される。フィールドワーク記録管理部130は、その撮影画像に含まれる目印物体を、目印情報124を参照して特定し、それら目印物体の撮影画像中での位置から、メモ情報の対象となった注目領域を特定する。
【0047】
フィールドワーク記録管理部130の詳細構成の一例を図6に例示する。この例では、フィールドワーク記録管理部130は、データ受信部132、照合処理部134及び画像特徴抽出部136を備える。データ受信部132は、メモ端末200から、メモ情報とそのメモ情報の対象となった撮影画像との情報を受信する。なお、メモ端末200は、その撮影画像を撮影した時点を示す時刻情報(メモ時刻と呼ぶ)をメモ情報及び撮影画像と共にフィールドワーク記録管理部130に送ってもよい。メモ時刻は、年月日時分などといった通常の時刻でもよいし、メモ端末200が撮影した動画データ中でのその撮影画像の位置(撮影時点)を表すものであってもよい。また、メモ時刻として、厳密な時刻の代わりに、ある長さの時間を記録できるようにしてもよい。この時間の幅は、あらかじめ定めておいてもよいし、調査者がメモ情報を入力した際などに指定してもよい。また、例えばメモ情報の入力開始から終了までの時間を、メモ時刻の情報として記録してもよい。
【0048】
また、メモ端末200が動画を撮影する場合、データ受信部132は、メモ端末200から動画データを受信する。受信した動画データは、フィールドワーク記録記憶部140に動画データ142として記録される。
【0049】
照合処理部134は、メモ情報と対応づけて受信した撮影画像と、目印情報124内の各目印物体特徴情報126とを照合することで、撮影画像に含まれる目印物体を特定する。このとき、照合処理部134は、撮影画像を画像特徴抽出部136に渡し、撮影画像内に含まれる各オブジェクトの特徴(例えば輪郭又は頂点など)を抽出させ、その特徴を加味して撮影画像内のオブジェクトと目印情報124内の目印物体特徴情報126との照合を行ってもよい。なお、空間モデル管理部110の画像特徴抽出部116の一部の機能を、この画像特徴抽出部136として利用してもよい。照合に当たっては、例えば、撮影画像上でのオブジェクトの形状やテクスチャなどといった特徴を、空間モデル記憶部120に記憶された各目印物体の目印物体特徴情報126とを比較することで、目印物体に該当する画像オブジェクトを検出する。なお、この照合処理は、公知の三次元オブジェクト認識処理(例えば特開2009−93611号公報で言及された技術)を用いればよいので、これ以上の説明は省略する。
【0050】
また照合処理部134は、上述のようにして撮影画像内に含まれる各目印物体の画像を特定すると、撮影画像中でのそれら各目印物体の位置に基づき、その撮影画像に対応するメモ情報の入力対象である注目範囲を特定する。一つの例では、各目印物体の撮影画像中での位置と、レイアウト情報122におけるそれら各目印物体の三次元位置との比較により、その撮影画像上での目印物体の配置が得られるための撮影位置(三次元位置)を特定する。そして、その撮影位置から撮影画像の中心に向かう三次元方向を求め、その方向に沿って撮影位置からカメラ210の焦点深さだけ進んだ位置を、注目範囲の中心位置とし、その中心位置に対して所定の範囲(例えばその中心位置を中心点とする所定半径の球体)を注目範囲として特定すればよい。焦点深さの情報は、メモ端末200から撮影画像と対応づけて送ればよい。これは、調査者は注目する範囲を視野の中心において撮影する可能性が高いとの前提に基づく処理である。
【0051】
また、別の例として、メモ端末200のカメラ210が、公知の人物認識処理により画像中の人物を認識し、認識した人物に自動的に焦点合わせを行う機能を持つ場合には、次のような処理も可能である。すなわち、この処理では、カメラ210から認識した人物の撮影画像中での位置や焦点深さの情報(これらを合わせて焦点位置情報と呼ぶ)をフィールドワーク記録管理部130に送る。フィールドワーク記録管理部130の照合処理部134は、撮影画像中の各目印物体の位置から特定した撮影位置から、焦点位置情報が示す人物の位置の方向に焦点深さだけ進んだ位置を注目範囲の中心位置とし、その中心位置を基準に注目範囲を特定する。業務分析のフィールドワークの場合、注目の対象となるのが人物である場合が多いので、このように注目範囲も人物を中心に定めることが考えられる。
【0052】
例えば、図7に例示する撮影画像400中には、目印物体A(ホワイトボード)とE(複合機)が写っており、それら物体AとEがそのような位置関係で写る撮影位置はカメラ210の光学系のパラメータと対象領域のレイアウト情報122から特定される。また、図7の例では、カメラ210が画像中から認識した人物の領域のうち、調査者がフォーカス対象として選択した領域が枠410により表示されている。この枠410の撮影画像400中での位置、及びそのフォーカス対象に焦点合わせしたときの焦点深さの情報が、カメラ210からフィールドワーク記録管理部130に提供される。
【0053】
照合処理部134は、このように求めた注目範囲情報を、撮影画像に対応するメモ情報と対応づけて、フィールドワーク記録記憶部140に登録する。すなわち、各メモ情報について、図8に例示するようなメモレコードを作成し、フィールドワーク記録管理部130に登録する。図8の例では、メモレコードは、メモ情報147と、そのメモ情報147が入力されたメモ時刻145(前述)、及びそのメモ情報147に対応する撮影画像から求めた注目範囲情報146を含む。注目範囲情報146は、例えば対象領域内での注目範囲の三次元的な位置及び形状を示す情報である。1つの例では、注目範囲情報146は、注目範囲の中心の三次元位置の情報であってもよい。また、図示は省略したが、メモ情報147を入力した入力者(この場合は調査者)を特定する情報をメモレコードに含めてもよい。
【0054】
以上のようにして、メモ端末200に入力された各メモ情報が、フィールドワーク記録管理部130により当該メモ情報の入力対象である三次元的な注目範囲に対応づけて保存される(メモレコード群144)。
【0055】
表示編集処理部160は、フィールドワーク記録記憶部140に記憶されたメモレコード群144や動画データ142を、視聴者(例えばフィールドワーク記録を分析する人又は人々)に提示する。特に表示編集処理部160(図1参照)は、そのメモレコード群144を参照して、各メモ情報の注目範囲を三次元的に表示する機能を備える。表示編集処理部160の詳細な機能構成の例を図9に示す。
【0056】
図9の例では、表示編集処理部160は、モデル画像生成部162、動画再生部164、メモ情報出力部166、表示画面情報生成部168を備える。
【0057】
モデル画像生成部162は、空間モデル記憶部120に記憶されているレイアウト情報122を参照して、対象領域300を自由な視点から見た場合の二次元画像(以下「モデル画像」と呼ぶ)を生成する。視聴者がポインティングデバイス等の入力装置172を操作して視点の位置や視線方向などのパラメータを指定すると、モデル画像生成部162は、指定された視点等に従ってレイアウト情報122の三次元モデルをレンダリングし、モデル画像を生成する。視点等のパラメータは、モデル画像の表示中でも変更できるようにしてもよい。また、モデル画像生成部162は、目印物体などのオブジェクトにテクスチャ等の画像特徴が対応づけられている場合は、その画像特徴もレンダリングするようにしてもよい。
【0058】
動画再生部164は、フィールドワーク記録記憶部140に記憶された動画データ142を再生する。
【0059】
メモ情報出力部166は、メモレコード群144に含まれる各メモ情報を、モデル画像中の当該メモ情報の注目範囲と対応づけて出力する。
【0060】
表示画面情報生成部168は、モデル画像生成部162、動画再生部164、メモ情報出力部166が生成した画像をまとめた表示画面情報を生成する。生成された表示画面情報は、表示装置170に表示される。表示装置170及びこれに対応する入力装置172は、フィールドワーク支援装置100のハードウエア基盤であるコンピュータに直接接続されたものであってもよいし、フィールドワーク支援装置100に対してインターネット等のネットワークを介して接続された他のコンピュータ装置であってもよい。
【0061】
図10に、表示装置170に表示される表示画面500の一例を模式的に示す。この例では、表示画面500は、モデル画面表示ウインドウ510と動画表示ウインドウ550とを含む。
【0062】
モデル画像表示ウインドウ510にはモデル画像生成部162が生成したモデル画像512が表示され、動画表示ウインドウ550には動画再生部164が再生した動画が表示される。
【0063】
また、モデル画像表示ウインドウ510に表示されるモデル画像512には、各メモ情報に対応する注目範囲514a、514b、514cが表示される。このような表示のために、メモ情報出力部166は、各メモ情報の注目範囲の三次元位置や範囲(例えば形状)の情報をモデル画像生成部162に渡す。モデル画像生成部162は、それらメモ情報の注目範囲をレイアウト情報122の三次元モデルに重畳し、指定された視点等のパラメータにしたがってレンダリングする。これにより、モデル画像生成部162がレンダリングする範囲内に注目範囲が含まれていると、その注目範囲がレンダリング結果のモデル画像に表示されることになる。
【0064】
また、モデル画像表示ウインドウ510には、メモ表示欄520が含まれる。メモ表示欄520には、各メモ情報522a、522b、522cが表示される。表示されるメモ情報522a等は、当該メモ情報のテキストである。個々のメモ情報522a等の表示範囲が限られている場合は、その範囲に当該メモ情報の冒頭部分を表示し、その範囲に対してクリック操作などのあらかじめ定めた操作を行うと、当該メモ情報全体を表示するウインドウが開くなどの操作系としてもよい。各メモ情報522a等は、当該メモ情報の入力された時刻(メモ時刻)の順に並べられる。この例では、メモ表示欄520に複数のメモ情報を縦に並べる構成なので、各メモ情報520aは、時系列順に上から下へと配列されている。
【0065】
メモ情報出力部166は、このようなメモ情報522a等の画像を生成し、表示画面情報生成部168に供給する。
【0066】
メモ表示欄520上の各メモ情報522a等とモデル画像512内の各注目範囲514a等との対応づけには、様々な方法を用いることができる。例えば、対応するメモ情報522aと注目範囲514a等とを同じ表示形態(例えば同じ色や同じ模様)で表示する方法がある。
【0067】
また、メモ表示欄520内のメモ情報522a等のいずれかをクリック操作などの操作で選択すると、それに対応するモデル画像512内の注目範囲514a等を強調表示する方法で対応関係を表してもよい。もちろん、この逆に注目範囲を選択するとそれに対応するメモ情報を強調表示するようにしてもよい。
【0068】
また、モデル画像512を、動画表示ウインドウ550内に表示される動画と時間的に同期させる方法もある。この方法では、動画の表示時点があるメモ情報のメモ時刻に一致すると(或いはメモ時刻が示す時間幅内にある間)、メモ表示欄520内のそのメモ情報と、そのメモ情報に対応するモデル画像512内の注目範囲とを強調表示する。図10の例はこのような動機表示の例であり、メモ情報522bとこれに対応する注目範囲514bとが強調表示されている。
【0069】
なお、モデル画像512は対象領域300の全域をカバーしているとは限らないので、メモレコード群144に含まれるすべてのメモ情報の注目範囲がモデル画像512内に表示されるとは限らない。一方、メモ表示欄520には、モデル画像512の視野に含まれない注目範囲に対応するメモ情報も表示してもよい。また、この代わりにモデル画像512のカバーする視野の三次元範囲に含まれる注目範囲を持つメモ情報のみを表示してもよい。
【0070】
メモ情報の数がメモ表示欄520内に一覧表示できる数より多い場合は、メモ表示欄520をスクロール可能とし、メモ情報群のうちメモ表示欄520内に表示する時系列範囲をスクロール操作により選択できるようにしてもよい。また、現在の動画再生位置の時刻の近傍の時刻に入力されたメモ情報がメモ表示欄520内に表示されるように制御してもよい。この場合、動画の表示が進むに連れて、メモ表示欄520内に表示されるメモ情報の範囲が変化する。
【0071】
また、図10の例では、モデル画像表示ウインドウ510内に時刻表示のためのスライダーバー530が表示されている。スライダーバー530の全長が、動画データ142全体の時間幅を表す。視聴者が、このスライダーバー530上で表示時間帯532を指定できるようにしてもよい。この場合、メモ情報出力部166は、指定された表示時間帯532にメモ時刻が含まれるメモ情報をメモ表示欄520内に表示するとともに、それら表示されるメモ情報に対応する注目範囲をモデル画像512内に表示させる。また、動画再生部164は、指定された表示時間帯532の始点から動画データ142の再生を開始する。動画の再生位置(再生時点)を示す再生位置インジケータ534が、動画の再生が進むにつれてスライダーバー530上を左から右へと移動する。再生位置インジケータ534をポインティングデバイスなどによりスライダーバー530上で移動させることで、動画データの再生位置を視聴者が指定できるようにしてもよい。
【0072】
また、スライダーバー530上に、各メモ情報のメモ時刻を示す線(メモ時刻インジケータ540)を表示してもよい。
【0073】
また、メモ表示欄520内のメモ情報522a等又はモデル画像512内の注目範囲514a等のいずれかをクリック操作などにより選択すると、動画データ142の再生位置を、選択されたメモ情報又は注目範囲に対応するメモ時刻へと変更してもよい。
【0074】
以上では、テキストのメモ情報を表示する場合を例示したが、メモ情報が音声情報である場合、例えばモデル画像512上の注目範囲514a等を視聴者が選択すると、選択された注目範囲に対応するメモ情報をメモ情報出力部166が音声出力するようにしてもよい。また、動画データ142の再生位置がメモ時刻に達すると、そのメモ時刻に対応するメモ情報の音声を再生するようにしてもよい。
【0075】
また、表示編集処理部160は、上述の表示画面上で、視聴者からの編集操作を受け付ける。例えば、視聴者が入力装置172を操作して既存のメモ情報を選択し、それに対してコメントを入力すると、表示編集処理部160は、そのコメントがメモ情報に対応づけてフィールドワーク記録記憶部140に登録する。また、視聴者が、モデル画像512上で新たな注目範囲を範囲指定し、その注目範囲に対応するメモ情報を入力できるようにしてもよい。この場合のメモ時刻は、動画表示ウインドウ550に表示されている動画の再生位置とすればよい。表示編集処理部160は、このように新たに入力されたメモ情報のメモレコードを作成し、フィールドワーク記録記憶部140に登録する。なお、その新たなメモ情報を入力した入力者を特定する情報を、そのメモ情報に対応づけて登録してもよい。
【0076】
なお、以上の例において、定置カメラ250として、レーザーレンジファインダ等の三次元距離計測装置を用いてもよい。この例では、1台の三次元距離計測装置が、上述の実施形態における2台の定置カメラの組と同じ働きをする。死角をなくすため、三次元距離計測装置は異なる複数の箇所に配置する。
【0077】
次に、変形例を説明する。この変形例では、図11に示すように対象領域内に位置センサ260を設ける。この位置センサ260により、例えばメモ端末200の位置を検出する。例えば、図12に例示するように、位置センサ260として無線LANの基地局を対象領域300内の複数の位置に配置する。この例では、メモ端末200と各基地局(位置センサ260)との間の通信に要する時間に基づき、三角測量の原理でメモ端末200の位置が特定される。
【0078】
また、別の例では、RFID(無線タグ)システムを利用して位置検知を行ってもよい。この場合、位置センサ260としてRFIDリーダを対象領域300内の複数の位置に配置し、各RFIDリーダが対象(例えばメモ端末200)に装着されたRFIDタグと通信し、タグとそれら各リーダとの間の通信に要した時間から、三角測量の原理で対象の位置を特定する。
【0079】
また、このような無線を利用したタグの代わりに、視覚的なタグ(例えば特定の模様を持つ物体)をメモ端末200に装着し、光学的な位置センサ(例えばレーザーレンジファインダ)によりその視覚的なタグの位置を検出してもよい。
【0080】
メモ端末200にメモ情報が入力された時点(メモ時刻)でのメモ端末200の位置を検知し、メモ情報と対応づけてフィールドワーク記録管理部130に提供してもよい。これにより、フィールドワーク記録管理部130は、メモ情報に対応する注目範囲を特定する際に、メモ端末200の位置の情報を撮影位置とする。そして、この既知の撮影位置を基準に、メモ情報に対応する撮影画像と各目印物体の特徴情報とを照合する。上述の実施形態では、撮影画像と目印物体との照合において、撮影位置自体が未知であったが、この例では撮影位置が既知となるため、照合の処理のための計算負荷が上記実施形態の場合よりも小さくなる。
【0081】
このようにメモ端末200の位置を検知するだけでなく、フィールドワーク現場にいる人々(すなわち調査者から見た観察対象者)にタグを持たせ、フィールドワーク期間(動画撮影期間)中の各人の位置変化を記録してもよい。各人には、それぞれ異なる識別情報(タグIDと呼ぶ)を持つタグを携帯させる。この場合、フィールドワーク支援装置100は、複数の位置センサ260により各人(各タグID)の時々刻々に位置を検出し、図13に例示するように時系列位置データ154としてタグID152に対応づけてフィールドワーク記録記憶部140に記憶する。時系列位置データ154には、例えば、時刻毎に、その時刻における当該タグIDのタグの位置が記録されている。このような各タグIDに対応する時系列位置データ154の集まりが、図11には位置変化データ150として示されている。
【0082】
表示編集処理部160は、この位置変化データ150を参照して、動画表示ウインドウ550に表示されている動画に同期して、モデル画像表示ウインドウ510内のモデル画像512内に各人の位置を表示してもよい。例えば、対象領域の三次元モデル内の各人の位置に、人間の形状を模した三次元モデルを配置し、これをモデル画像生成部162がレンダリングしてもよい。この場合、モデル画像512内に表示される各人のモデルの位置が、動画の再生位置が進むに連れて、時系列位置データ154に従って変化する。これにより、各メモ情報の対象となった注目範囲と、対象領域300内の人の位置とが同じモデル画像512内に表示されることとなる。
【0083】
また、空間モデル管理部110が、この位置検知の仕組みを用いて各目印物体の位置を検知し、目印物体の位置情報125(図5参照)として記録するようにしてもよい。
【0084】
以上に例示したフィールドワーク支援装置100及びメモ端末200は、例えば、汎用のコンピュータに上述の各機能モジュールの処理を表すプログラムを実行させることにより実現される。ここで、コンピュータは、例えば、ハードウエアとして、CPU等のマイクロプロセッサ、ランダムアクセスメモリ(RAM)およびリードオンリメモリ(ROM)等のメモリ(一次記憶)、HDD(ハードディスクドライブ)を制御するHDDコントローラ、各種I/O(入出力)インタフェース、ローカル・エリア・ネットワークなどのネットワークとの接続のための制御を行うネットワークインタフェース等が、たとえばバスを介して接続された回路構成を有する。また、そのバスに対し、例えばI/Oインタフェース経由で、CDやDVDなどの可搬型ディスク記録媒体に対する読み取り及び/又は書き込みのためのディスクドライブ、フラッシュメモリなどの各種規格の可搬型の不揮発性記録媒体に対する読み取り及び/又は書き込みのためのメモリリーダライタ、などが接続されてもよい。上に例示した各機能モジュールの処理内容が記述されたプログラムがCDやDVD等の記録媒体を経由して、又はネットワーク等の通信手段経由で、ハードディスクドライブ等の固定記憶装置に保存され、コンピュータにインストールされる。固定記憶装置に記憶されたプログラムがRAMに読み出されCPU等のマイクロプロセッサにより実行されることにより、上に例示した機能モジュール群が実現される。なお、それら機能モジュール群のうちの一部又は全部を、専用LSI(Large Scale Integration)、ASIC(Application Specific Integrated Circuit、特定用途向け集積回路)又はFPGA(Field Programmable Gate Array)等のハードウエア回路として構成してもよい。
【0085】
また、空間モデル管理部110、フィールドワーク記録管理部130、表示編集処理部160などといった各機能モジュールを、それぞれ別のコンピュータ上に実装してもよい。
【符号の説明】
【0086】
100 フィールドワーク支援装置、110 空間モデル管理部、120 空間モデル記憶部、122 レイアウト情報、124 目印情報、130 フィールドワーク記録管理部、140 フィールドワーク記録記憶部、142 動画データ、144 メモレコード群、160 表示編集処理部。
【技術分野】
【0001】
本発明は、メモ情報管理システム、メモ情報処理装置及びプログラムに関する。
【背景技術】
【0002】
現場の状況を調査するフィールドワーク調査では、ビデオカメラや静止画カメラ、音声レコーダーなどといった様々な記録装置を用いて現場の状況を記録し、記録された動画、画像、音声などを用いて分析を行っている。
【0003】
特許文献1には、入力操作に応じて処理された結果が表示される入出力装置において、表示画面及び操作キーを平面上に投影する投影手段と、平面上に投影された表示画面又は操作キーに対して操作者が行う入力操作を撮影する撮像手段と、撮像手段が撮影した画像を解析して、操作者が行った入力操作を識別する画像識別手段と、識別した入力操作に応じた処理を行い、投影手段を制御して表示画面の表示に処理結果を反映させる処理手段とを設けることが開示されている。
【0004】
特許文献2に開示されるモデルデータベースは、対象物の三次元ワイヤフレーム情報を記憶しており、移動体抽出部は、CCDカメラによる映像ソースからブロックマッチング法により移動体領域を抽出する。空間量子化部は、移動体領域の二次元画像とテクスチャマッピングにより生成した推定画像との間の比較計算を行いながら、移動対象物の三次元位置姿勢を推定する。テクスチャマッピング部は、対象物メモリ中のワイヤフレーム情報を基準にし、かつ空間量子化部から出力される位置姿勢情報を用いて、対象物のワイヤフレームへのテクスチャマッピングを実行し、画像推定部は、斯様なテクスチャマッピングを元にして対象物の仮想実画像を生成する。
【0005】
特許文献3には、バーチャル環境に関するモデリング及び対話のために設けられた装置が開示される。当該環境のイメージ、及びその内部におけるユーザーの存在についての表示は、メモリからのデータに基づいてCPUによって生成され、立体的なディスプレイによってユーザーに提供される。ユーザーは、単一の制御ボタンを有するハンドヘルド・ユニットを装備される。ボタンが押されていないとき、制御装置のユーザーの運動は、モデリングされるアイコン(バーチャル・ハンドのような)によって前記バーチャル環境内において複製され、対話を可能にする。ボタンが作動されているとき、制御装置のユーザーの運動は、その代わりに、ナビゲーション指令に変換され、バーチャル環境におけるユーザーの存在の位置をシフトさせる。
【0006】
非特許文献1に開示されたDOTSシステムは、研究目的で実際のオフィス環境に設置された、屋内型、リアルタイム、マルチカメラの監視システムである。多人数の人を追跡する効果的アプローチを組み込み、個々のカメラから得られる結果をマルチカメラの軌跡として一体化している。DOTSのユーザインタフェースは、簡単に参照することでユーザーが重要なイベントに注目できるようにしている。また、同一ユーザインタフェースの中の異なる表現により、より簡単なナビゲーションが出来る空間情報も提供される。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】特開2000−298544号公報
【特許文献2】特開平08−114416号公報
【特許文献3】特表平11−513157号公報
【非特許文献】
【0008】
【非特許文献1】Andreas Girgensohn他9名、” DOTS: support for effective video surveillance”、[online]、2007年、International Multimedia Conference、 Proceedings of the 15th international conference on Multimedia、 [平成21年10月8日検索]、インターネット<http://portal.acm.org/citation.cfm?doid=1291233.1291332>
【発明の概要】
【発明が解決しようとする課題】
【0009】
本発明は、対象領域内の一部を撮影した撮影画像に対して入力されたメモ情報について、そのメモ情報の入力対象である注目範囲を特定して記録できるようにすることを目的とする。
【課題を解決するための手段】
【0010】
請求項1に係る発明は、対象領域内の各目印物体の位置情報及び認識用特徴情報を記憶する目印情報記憶手段と、前記対象領域の少なくとも一部を撮影することにより得られた撮影画像を表示する撮影画像表示手段と、メモ情報の入力を受け付けて前記撮影画像表示手段に表示された撮影画像と関連づける入力受付手段と、前記入力受付手段で受け付けたメモ情報に関連づけられた撮影画像と前記目印情報記憶手段に記憶された各目印物体の認識用特徴情報との照合により、当該撮影画像に含まれる1以上の目印物体の画像を特定し、特定した各目印物体の画像の前記撮影画像中での位置と前記目印情報記憶手段に記憶された当該各目印物体の位置情報とに基づき、当該メモ情報に対応する前記対象領域内の注目範囲を特定する注目範囲特定手段と、前記入力受付手段で受け付けたメモ情報を、前記注目範囲特定手段が特定した当該メモ情報に対応する注目範囲を示す注目範囲情報と対応づけて記憶するメモ情報記憶手段と、を備えるメモ情報管理システムである。
【0011】
請求項2に係る発明は、前記対象領域の三次元形状モデル情報を記憶するモデル記憶手段と、前記モデル記憶手段に記憶された前記対象領域の三次元形状モデル情報に基づき、前記対象領域の二次元画像を生成する領域画像生成手段と、前記領域画像生成手段が生成した二次元画像内に前記メモ情報記憶手段に記憶されたメモ情報に関連づけられた注目範囲が含まれる場合に、当該二次元画像内の当該注目範囲に対応づけて当該メモ情報を出力するメモ情報出力手段と、を備える請求項1に記載のメモ情報管理システムである。
【0012】
請求項3に係る発明は、前記対象領域の少なくとも一部を撮影することにより前記撮影画像表示手段に表示するための撮影画像を生成するとともに、当該撮影画像中での焦点位置の情報を当該撮影画像と対応づけて出力する撮影手段、を更に備え、前記注目範囲特定手段は、前記メモ情報に関連づけられた撮影画像に対応づけて前記撮影手段から出力された焦点位置を加味して、当該メモ情報に対応する前記注目範囲を特定する、ことを特徴とする請求項1に記載のメモ情報管理システムである。
【0013】
請求項4に係る発明は、前記対象領域の動画を撮影する動画撮影手段と、前記動画撮影手段が撮影した動画の動画データを記憶する動画記憶手段と、前記動画記憶手段が記憶している動画データに基づき前記対象領域の動画を再生する動画再生手段と、前記領域画像生成手段が生成した前記対象領域の二次元画像と、前記動画再生手段が再生した動画と、を対応づけて表示する動画表示手段と、を更に備え、前記撮影画像表示手段は、前記動画撮影手段が撮影した動画を前記撮影画像として表示し、前記入力受付手段は、前記メモ情報の入力を受け付けた時点で前記撮影画像表示手段が表示していた撮影画像の前記動画データ内での時点を求め、前記メモ情報記憶手段は、前記メモ情報に関連づけられた前記撮影画像の前記動画データ内での時点を、当該メモ情報に対応づけて記憶し、前記メモ情報出力手段は、前記動画表示手段に表示されている画像の前記動画データ内での時点に対応する時点のメモ情報を出力する、ことを特徴とする請求項1に記載のメモ情報管理システムである。
【0014】
請求項5に係る発明は、対象領域内の各目印物体の位置情報及び認識用特徴情報を記憶する目印情報記憶手段と、メモ入力装置からメモ情報と撮影画像の組を受信する受信手段と、前記受信手段が受信した撮影画像と前記目印情報記憶手段に記憶された各目印物体の認識用特徴情報との照合により、当該撮影画像に含まれる1以上の目印物体の画像を特定し、特定した各目印物体の画像の前記撮影画像中での位置と前記目印情報記憶手段に記憶された当該各目印物体の位置情報とに基づき、当該撮影画像と共に受信したメモ情報に対応する前記対象領域内の注目範囲を特定する注目範囲特定手段と、前記メモ情報を、前記注目範囲特定手段が特定した当該メモ情報に対応する注目範囲を示す注目範囲情報と対応づけて記憶するメモ情報記憶手段と、を備えるメモ情報処理装置である。
【0015】
請求項6に係る発明は、コンピュータを、対象領域内の各目印物体の位置情報及び認識用特徴情報を記憶する目印情報記憶手段、メモ入力装置からメモ情報と撮影画像の組を受信する受信手段、前記受信手段が受信した撮影画像と前記目印情報記憶手段に記憶された各目印物体の認識用特徴情報との照合により、当該撮影画像に含まれる1以上の目印物体の画像を特定し、特定した各目印物体の画像の前記撮影画像中での位置と前記目印情報記憶手段に記憶された当該各目印物体の位置情報とに基づき、当該撮影画像と共に受信したメモ情報に対応する前記対象領域内の注目範囲を特定する注目範囲特定手段、前記メモ情報を、前記注目範囲特定手段が特定した当該メモ情報に対応する注目範囲を示す注目範囲情報と対応づけて記憶するメモ情報記憶手段、として機能させるためのプログラムである。
【発明の効果】
【0016】
請求項1,5又は6に係る発明によれば、対象領域内の一部を撮影した撮影画像に対して入力されたメモ情報について、そのメモ情報の入力対象である注目範囲を特定して記録できる。
【0017】
請求項2に係る発明によれば、メモ情報を、対象領域の三次元モデルの画像内における注目範囲に対応づけて出力することができる。
【0018】
請求項3に係る発明によれば、メモ情報に対応する注目範囲を、焦点位置の情報を用いない場合によりも高精度に特定することができる。
【0019】
請求項4に係る発明によれば、対象領域を撮影した動画の再生と同期してメモ情報を出力することができる。
【図面の簡単な説明】
【0020】
【図1】実施形態のシステム構成の一例を示す図である。
【図2】対象領域に対する定置カメラの配置例を示す図である。
【図3】空間モデル管理部の機能構成の一例を示す図である。
【図4】対象領域内から抽出された目印物体の位置を例示する図である。
【図5】目印情報のデータ構造の一例を示す図である。
【図6】フィールドワーク記録管理部の機能構成の一例を示す図である。
【図7】撮影画像内に含まれる目印物体の例を示す図である。
【図8】メモレコードのデータ構造の一例を示す図である。
【図9】表示編集処理部の機能構成の一例を示す図である。
【図10】表示画面の例を示す図である。
【図11】変形例のシステム構成の一例を示す図である。
【図12】対象領域に対する位置センサの配置例を示す図である。
【図13】個々の対象の位置変化データのデータ構造の一例を示す図である。
【発明を実施するための形態】
【0021】
図1を参照して、実施形態のシステムの例を説明する。
【0022】
図1に例示したシステムは、フィールドワーク支援装置100、メモ端末200、複数の定置カメラ250を備えている。
【0023】
このシステムは、例えば、顧客組織の業務改善コンサルタント業務などにおけるフィールドワークを支援するために用いられる。例えば、このようなフィールドワークでは、調査者(例えばコンサルタント)が顧客組織の業務現場に入り、業務現場(例えばオフィス)で実際に行われている業務の進め方を実地に調べる。以下では、調査の対象となる現場の物理的な領域(部屋など)のことを、対象領域と呼ぶ。
【0024】
このシステムでは、調査者がメモ端末200を携帯して対象領域を自由な視点から撮影し、撮影した画像に対するメモ情報を調査者が入力する。メモ情報は、例えば、調査者がその画像を撮影しているときに感じた現場の印象や思いついた業務改善案などの情報であり、アノテーション(注釈情報)とも呼ばれる。このようなメモ情報の記録のために、メモ端末200は、カメラ210、表示画面220、入力装置230及びメモ入力処理部240を備える。
【0025】
カメラ210は、撮影した画像のデータを生成し、出力することが可能なデジタルカメラである。カメラ210は、静止画カメラであっても、動画カメラであってもよい。表示画面220は、例えばカメラ210が現在撮影している画像を表示する。入力装置230は、調査者がメモ情報の入力のために用いる装置であり、例えばキーボードやキーパッドなどであり、この場合、入力されるメモ情報はテキストデータとなる。また、入力装置230は、表示画面220上に表示されるソフトウエアキーボードなどであってもよい。また、入力装置230は、音声を入力するマイクであってもよく、この場合メモ情報は音声データとなる。調査者は、表示画面220に表示されている、カメラ210が現在撮影中の画像を見ながら、その画像に写された現場の状況に対するメモ情報を入力装置230から入力する。
【0026】
メモ入力処理部240は、入力装置230から入力されたメモ情報を、そのメモ情報の対象となった撮影画像、すなわちメモ情報が入力されていたときに表示画面220に表示されている、カメラ210が撮影中の画像、に対応づける処理を行う。この対応づけ処理では、例えば、撮影画像の静止画像データとメモ情報とを対応づけてメモ端末200内の記憶装置に保存したり、或いは、撮影画像の静止画像データとメモ情報とを対応づけてフィールドワーク支援装置100に無線LANなどの通信回線経由で送信したりする。撮影画像の静止画像データとメモ情報とを対応づけてメモ端末200内の記憶装置に保存した場合、それら記憶したデータは、メモ端末200をフィールドワーク支援装置100に接続した際に、メモ端末200からフィールドワーク支援装置100に転送される。
【0027】
また、カメラ210が動画を撮影するものである場合、入力されたメモ情報の撮影画像への対応づけは、例えば、その動画全体の時間幅の中での、そのメモ情報の入力時点を表す情報を記録することにより行ってもよい。メモ情報の入力時点の情報が記録されていれば、動画データの中からその時点の画像を取り出すことで、そのメモ情報の入力対処となった撮影画像を再現できる。
【0028】
メモ端末200は、例えばカメラ付き携帯電話機にメモ入力処理部240の処理を行うプログラムをインストールしたものであってもよい。また、ネットブック等の携帯型のコンピュータにデジタルカメラを有線又は無線で接続したものをメモ端末200として用いてもよい。
【0029】
調査者は対象領域内を移動しながら、メモ端末200で、注目すべき箇所を撮影し、メモ情報を入力する。したがって、メモ情報の入力対象となった撮影画像は、対象領域の一部分を捉えたものであることが多い。フィールドワーク後の分析作業の際、メモ情報を、その情報の入力対象であった撮影画像と共に提示することは有益であるが、それだけでは対象領域内のどの場所でそのメモ情報の対象となった出来事が起こったのかが分かりにくい場合がある。
【0030】
そこで、この実施形態では、メモ情報が、対象領域全体の中のどの場所(での出来事)に対して入力されたのかを表示する。このために、フィールドワーク支援装置100は、対象領域の三次元モデル等の情報を記憶した空間モデル記憶部120を備え、その対象領域の三次元モデル内のどの領域に対してメモ情報が入力されたのかを解析し、表示する。
【0031】
空間モデル記憶部120は、レイアウト情報122と目印情報124を記憶している。レイアウト情報122は、対象領域の三次元モデルを表す情報であり、例えば対象領域内の各物体(例えば机、ホワイトボード、複写機など)の三次元的な位置や形状などの情報を含んでいる。目印情報124は、対象領域内での目印となる各物体(目印物体と呼ぶ)の特徴を表す情報である。目印情報は、メモ端末200が撮影した撮影画像から、メモ情報の対象となった場所(以下、「注目範囲」と呼ぶ)を特定するのに用いられる。
【0032】
空間モデル管理部110は、空間モデル記憶部120の記憶情報を管理する。特に空間モデル管理部110は、対象領域内に配置された複数の定置カメラ250が撮影した画像と、レイアウト情報122とを用いて、目印情報124を生成する。
【0033】
定置カメラ250は対象領域300内に固定配置されるカメラである。図2に例示するように、各定置カメラ250は、例えば対象領域300のほぼすべての物体が複数の定置カメラ250の視野(撮影範囲)に収められるように、それぞれ適切な場所に配置される。1つの物体を、位置の異なる2以上のカメラで撮影することにより、周知のステレオ法によりその物体の三次元的な位置や形状を求めることができる。定置カメラ250は、チルトやパンなどといった視線方向を変える機能や、ズーム機能などを備えていてもよい。各定置カメラ250が撮影した画像のデータは、空間モデル管理部110に、有線又は無線により送信される。また、定置カメラ250は、チルト、パン、ズームの機能を備える場合、撮影した画像のデータを、その画像を撮影したときのチルト角、パン角、ズーム倍率などの情報とともに空間モデル管理部110に送信する。或いは、空間モデル管理部110が定置カメラ250にチルト角、パン角、ズーム倍率を指示し、定置カメラ250がその指示に従ってチルト、パン、ズームの制御を行って撮影するようにしてもよい。
【0034】
空間モデル管理部110は、各定置カメラ250が配置された位置や視野(視線方向や視野角など)の情報を有している。定置カメラ250の視野はチルト、パン、ズームなどにより変化し得るが、空間モデル管理部110は、チルト角等の情報から定置カメラ250の視野を特定可能である。空間モデル管理部110は、各定置カメラ250から送られてきた画像に基づき、対象領域内の目印物体を抽出する。
【0035】
図3に、空間モデル管理部110の詳細な機能構成の例を示す。この例では、空間モデル管理部110は、データ受信部112、目印情報登録部114、及び画像特徴抽出部116を備える。
【0036】
データ受信部112は、各定置カメラ250から、撮影された画像のデータや視野の情報を受信する。目印情報登録部114は、それら定置カメラ250からの情報を画像特徴抽出部116に渡し、対象領域300内にある各目印物体を抽出させ、それら各目印物体の特徴を求めさせる。ここで、抽出する目印物体は、例えば柱、壁、机、複合機(プリンタ、スキャナ、コピー機等の機能を併せ持つ装置)等の事務機器、ホワイトボードなどといった、比較的大きな物体とする。
【0037】
抽出のために、画像特徴抽出部116は、各定置カメラ250の配置位置及び視野の情報と、各定置カメラ250から送られてきた画像と、に基づき、公知のステレオ法及び三次元オブジェクト認識のための演算処理を実行する。ここで画像特徴抽出部116は、各定置カメラ250から送られてきた画像に対してそれぞれ輪郭抽出を行い、抽出された輪郭画像に対してステレオ法及び三次元オブジェクト認識の演算処理を行うようにしてもよい。例えば、画像特徴抽出部116は、この結果求められたいくつかの三次元物体のうち、あらかじめ定めたサイズ以上のサイズを持つ物体を目印物体として抽出すればよい。また、抽出の条件として、サイズ以外に、形状についての条件(例えば直方体に近いなど)を課してもよい。
【0038】
また、画像特徴抽出部116は、ステレオ法やオブジェクト認識のために、対象領域300の三次元モデルであるレイアウト情報122を参照してもよい。例えば、各定置カメラ250の画像に対するステレオ法による三次元形状認識結果と、レイアウト情報122に含まれている各三次元オブジェクトの位置や形状とを比較して、画像から求められたオブジェクトがレイアウト情報122中のどのオブジェクトに対応するかを求めるなどである。このような処理により、各目印物体の三次元的な位置及び形状を示す情報が求められる。
【0039】
また、画像特徴抽出部116は、抽出した各目印物体について、その特徴を表す目印物体特徴情報を求める。例えば、当該目印物体の三次元形状(例えば輪郭情報や各頂点の配置関係の情報など)自体も目印物体特徴情報の一種である。また、目印物体の三次元形状についての定量的な性質、例えば幅と奥行きと高さの比や、各面の平行度なども、目印物体特徴情報の一例である。また、目印物体の表面(面が複数ある場合は各面)の色やテクスチャ、空間周波数なども目印物体特徴情報の一例である。目印物体特徴情報は、後述するフィールドワーク記録管理部130による、メモ端末200の撮影画像中からの目印物体の認識のための基礎情報として用いられる。この認識処理は、公知のオブジェクト認識処理により行うことができる。画像特徴抽出部116は、上に例示したものも含む公知の三次元オブジェクト特徴のうち、フィールドワーク記録管理部130が実行するオブジェクト認識処理で用いられるものを目印物体特徴情報として求めればよい。このような目印物体特徴情報は、公知の方法で求めることができるので、これ以上の説明は省略する。
【0040】
以上は、画像特徴抽出部116が目印物体を自動抽出する例であったが、別の例として、レイアウト情報122に含まれる各三次元オブジェクトの中から、ユーザーがあらかじめ目印物体を指定しておいてもよい。この場合、目印物体の位置や形状は既知である。画像特徴抽出部116は、それら各目印物体の位置や形状と、各定置カメラ250の画像とを突き合わせることで、それら各画像のどの部分がどの目的物体に対応するかを判定し、各目印物体の目印物体特徴情報を生成すればよい。
【0041】
また、形状や表面の模様が既知の目印物体(例えば球体や立方体などといった既知形状の目印部分を有する置物)を対象領域300内に複数配置し、各定置カメラ250の画像からそれら既知の目印物体を抽出してその位置や特徴情報を求めてもよい。
【0042】
図4に示す例では、対象領域300の中から、A〜Fの6つの目印物体が抽出されている。
【0043】
目印情報登録部114は、画像特徴抽出部116が抽出した各目印物体の三次元的な位置や目印物体特徴情報を、空間モデル記憶部120の目印情報124に登録する。目印情報124は、図5に例示するように、目印物体ごとに、その目印物体の対象領域300内での三次元的な位置125の情報と目印物体特徴情報126とを含んでいる。
【0044】
また、別の例として、各目印物体の各面の色やテクスチャなどの画像特徴を、レイアウト情報122におけるそれら各目印物体の三次元モデルに対応づける(貼り付ける)などして、目印物体の画像特徴を目印物体の三次元モデル自体に統合してもよい。
【0045】
なお、空間モデル管理部110は、各定置カメラ250の撮影した画像を合成することで、三次元自由視点画像(視点や視線方向を自由に変えられる画像)を生成し、空間モデル記憶部120に記憶してもよい。これには、例えば金出武雄による「アイビジョン」の技術を用いればよい。
【0046】
以上のようにして目印情報124が完成すると、この目印情報124を用いてフィールドワークでのメモ情報の対象となった注目範囲の特定を行うことができる。すなわち、調査者が前述したメモ端末200にて現場を撮影しながらメモ情報を入力すると、メモ情報とそのメモ情報の入力対象となった撮影画像とがフィールドワーク記録管理部130に入力される。フィールドワーク記録管理部130は、その撮影画像に含まれる目印物体を、目印情報124を参照して特定し、それら目印物体の撮影画像中での位置から、メモ情報の対象となった注目領域を特定する。
【0047】
フィールドワーク記録管理部130の詳細構成の一例を図6に例示する。この例では、フィールドワーク記録管理部130は、データ受信部132、照合処理部134及び画像特徴抽出部136を備える。データ受信部132は、メモ端末200から、メモ情報とそのメモ情報の対象となった撮影画像との情報を受信する。なお、メモ端末200は、その撮影画像を撮影した時点を示す時刻情報(メモ時刻と呼ぶ)をメモ情報及び撮影画像と共にフィールドワーク記録管理部130に送ってもよい。メモ時刻は、年月日時分などといった通常の時刻でもよいし、メモ端末200が撮影した動画データ中でのその撮影画像の位置(撮影時点)を表すものであってもよい。また、メモ時刻として、厳密な時刻の代わりに、ある長さの時間を記録できるようにしてもよい。この時間の幅は、あらかじめ定めておいてもよいし、調査者がメモ情報を入力した際などに指定してもよい。また、例えばメモ情報の入力開始から終了までの時間を、メモ時刻の情報として記録してもよい。
【0048】
また、メモ端末200が動画を撮影する場合、データ受信部132は、メモ端末200から動画データを受信する。受信した動画データは、フィールドワーク記録記憶部140に動画データ142として記録される。
【0049】
照合処理部134は、メモ情報と対応づけて受信した撮影画像と、目印情報124内の各目印物体特徴情報126とを照合することで、撮影画像に含まれる目印物体を特定する。このとき、照合処理部134は、撮影画像を画像特徴抽出部136に渡し、撮影画像内に含まれる各オブジェクトの特徴(例えば輪郭又は頂点など)を抽出させ、その特徴を加味して撮影画像内のオブジェクトと目印情報124内の目印物体特徴情報126との照合を行ってもよい。なお、空間モデル管理部110の画像特徴抽出部116の一部の機能を、この画像特徴抽出部136として利用してもよい。照合に当たっては、例えば、撮影画像上でのオブジェクトの形状やテクスチャなどといった特徴を、空間モデル記憶部120に記憶された各目印物体の目印物体特徴情報126とを比較することで、目印物体に該当する画像オブジェクトを検出する。なお、この照合処理は、公知の三次元オブジェクト認識処理(例えば特開2009−93611号公報で言及された技術)を用いればよいので、これ以上の説明は省略する。
【0050】
また照合処理部134は、上述のようにして撮影画像内に含まれる各目印物体の画像を特定すると、撮影画像中でのそれら各目印物体の位置に基づき、その撮影画像に対応するメモ情報の入力対象である注目範囲を特定する。一つの例では、各目印物体の撮影画像中での位置と、レイアウト情報122におけるそれら各目印物体の三次元位置との比較により、その撮影画像上での目印物体の配置が得られるための撮影位置(三次元位置)を特定する。そして、その撮影位置から撮影画像の中心に向かう三次元方向を求め、その方向に沿って撮影位置からカメラ210の焦点深さだけ進んだ位置を、注目範囲の中心位置とし、その中心位置に対して所定の範囲(例えばその中心位置を中心点とする所定半径の球体)を注目範囲として特定すればよい。焦点深さの情報は、メモ端末200から撮影画像と対応づけて送ればよい。これは、調査者は注目する範囲を視野の中心において撮影する可能性が高いとの前提に基づく処理である。
【0051】
また、別の例として、メモ端末200のカメラ210が、公知の人物認識処理により画像中の人物を認識し、認識した人物に自動的に焦点合わせを行う機能を持つ場合には、次のような処理も可能である。すなわち、この処理では、カメラ210から認識した人物の撮影画像中での位置や焦点深さの情報(これらを合わせて焦点位置情報と呼ぶ)をフィールドワーク記録管理部130に送る。フィールドワーク記録管理部130の照合処理部134は、撮影画像中の各目印物体の位置から特定した撮影位置から、焦点位置情報が示す人物の位置の方向に焦点深さだけ進んだ位置を注目範囲の中心位置とし、その中心位置を基準に注目範囲を特定する。業務分析のフィールドワークの場合、注目の対象となるのが人物である場合が多いので、このように注目範囲も人物を中心に定めることが考えられる。
【0052】
例えば、図7に例示する撮影画像400中には、目印物体A(ホワイトボード)とE(複合機)が写っており、それら物体AとEがそのような位置関係で写る撮影位置はカメラ210の光学系のパラメータと対象領域のレイアウト情報122から特定される。また、図7の例では、カメラ210が画像中から認識した人物の領域のうち、調査者がフォーカス対象として選択した領域が枠410により表示されている。この枠410の撮影画像400中での位置、及びそのフォーカス対象に焦点合わせしたときの焦点深さの情報が、カメラ210からフィールドワーク記録管理部130に提供される。
【0053】
照合処理部134は、このように求めた注目範囲情報を、撮影画像に対応するメモ情報と対応づけて、フィールドワーク記録記憶部140に登録する。すなわち、各メモ情報について、図8に例示するようなメモレコードを作成し、フィールドワーク記録管理部130に登録する。図8の例では、メモレコードは、メモ情報147と、そのメモ情報147が入力されたメモ時刻145(前述)、及びそのメモ情報147に対応する撮影画像から求めた注目範囲情報146を含む。注目範囲情報146は、例えば対象領域内での注目範囲の三次元的な位置及び形状を示す情報である。1つの例では、注目範囲情報146は、注目範囲の中心の三次元位置の情報であってもよい。また、図示は省略したが、メモ情報147を入力した入力者(この場合は調査者)を特定する情報をメモレコードに含めてもよい。
【0054】
以上のようにして、メモ端末200に入力された各メモ情報が、フィールドワーク記録管理部130により当該メモ情報の入力対象である三次元的な注目範囲に対応づけて保存される(メモレコード群144)。
【0055】
表示編集処理部160は、フィールドワーク記録記憶部140に記憶されたメモレコード群144や動画データ142を、視聴者(例えばフィールドワーク記録を分析する人又は人々)に提示する。特に表示編集処理部160(図1参照)は、そのメモレコード群144を参照して、各メモ情報の注目範囲を三次元的に表示する機能を備える。表示編集処理部160の詳細な機能構成の例を図9に示す。
【0056】
図9の例では、表示編集処理部160は、モデル画像生成部162、動画再生部164、メモ情報出力部166、表示画面情報生成部168を備える。
【0057】
モデル画像生成部162は、空間モデル記憶部120に記憶されているレイアウト情報122を参照して、対象領域300を自由な視点から見た場合の二次元画像(以下「モデル画像」と呼ぶ)を生成する。視聴者がポインティングデバイス等の入力装置172を操作して視点の位置や視線方向などのパラメータを指定すると、モデル画像生成部162は、指定された視点等に従ってレイアウト情報122の三次元モデルをレンダリングし、モデル画像を生成する。視点等のパラメータは、モデル画像の表示中でも変更できるようにしてもよい。また、モデル画像生成部162は、目印物体などのオブジェクトにテクスチャ等の画像特徴が対応づけられている場合は、その画像特徴もレンダリングするようにしてもよい。
【0058】
動画再生部164は、フィールドワーク記録記憶部140に記憶された動画データ142を再生する。
【0059】
メモ情報出力部166は、メモレコード群144に含まれる各メモ情報を、モデル画像中の当該メモ情報の注目範囲と対応づけて出力する。
【0060】
表示画面情報生成部168は、モデル画像生成部162、動画再生部164、メモ情報出力部166が生成した画像をまとめた表示画面情報を生成する。生成された表示画面情報は、表示装置170に表示される。表示装置170及びこれに対応する入力装置172は、フィールドワーク支援装置100のハードウエア基盤であるコンピュータに直接接続されたものであってもよいし、フィールドワーク支援装置100に対してインターネット等のネットワークを介して接続された他のコンピュータ装置であってもよい。
【0061】
図10に、表示装置170に表示される表示画面500の一例を模式的に示す。この例では、表示画面500は、モデル画面表示ウインドウ510と動画表示ウインドウ550とを含む。
【0062】
モデル画像表示ウインドウ510にはモデル画像生成部162が生成したモデル画像512が表示され、動画表示ウインドウ550には動画再生部164が再生した動画が表示される。
【0063】
また、モデル画像表示ウインドウ510に表示されるモデル画像512には、各メモ情報に対応する注目範囲514a、514b、514cが表示される。このような表示のために、メモ情報出力部166は、各メモ情報の注目範囲の三次元位置や範囲(例えば形状)の情報をモデル画像生成部162に渡す。モデル画像生成部162は、それらメモ情報の注目範囲をレイアウト情報122の三次元モデルに重畳し、指定された視点等のパラメータにしたがってレンダリングする。これにより、モデル画像生成部162がレンダリングする範囲内に注目範囲が含まれていると、その注目範囲がレンダリング結果のモデル画像に表示されることになる。
【0064】
また、モデル画像表示ウインドウ510には、メモ表示欄520が含まれる。メモ表示欄520には、各メモ情報522a、522b、522cが表示される。表示されるメモ情報522a等は、当該メモ情報のテキストである。個々のメモ情報522a等の表示範囲が限られている場合は、その範囲に当該メモ情報の冒頭部分を表示し、その範囲に対してクリック操作などのあらかじめ定めた操作を行うと、当該メモ情報全体を表示するウインドウが開くなどの操作系としてもよい。各メモ情報522a等は、当該メモ情報の入力された時刻(メモ時刻)の順に並べられる。この例では、メモ表示欄520に複数のメモ情報を縦に並べる構成なので、各メモ情報520aは、時系列順に上から下へと配列されている。
【0065】
メモ情報出力部166は、このようなメモ情報522a等の画像を生成し、表示画面情報生成部168に供給する。
【0066】
メモ表示欄520上の各メモ情報522a等とモデル画像512内の各注目範囲514a等との対応づけには、様々な方法を用いることができる。例えば、対応するメモ情報522aと注目範囲514a等とを同じ表示形態(例えば同じ色や同じ模様)で表示する方法がある。
【0067】
また、メモ表示欄520内のメモ情報522a等のいずれかをクリック操作などの操作で選択すると、それに対応するモデル画像512内の注目範囲514a等を強調表示する方法で対応関係を表してもよい。もちろん、この逆に注目範囲を選択するとそれに対応するメモ情報を強調表示するようにしてもよい。
【0068】
また、モデル画像512を、動画表示ウインドウ550内に表示される動画と時間的に同期させる方法もある。この方法では、動画の表示時点があるメモ情報のメモ時刻に一致すると(或いはメモ時刻が示す時間幅内にある間)、メモ表示欄520内のそのメモ情報と、そのメモ情報に対応するモデル画像512内の注目範囲とを強調表示する。図10の例はこのような動機表示の例であり、メモ情報522bとこれに対応する注目範囲514bとが強調表示されている。
【0069】
なお、モデル画像512は対象領域300の全域をカバーしているとは限らないので、メモレコード群144に含まれるすべてのメモ情報の注目範囲がモデル画像512内に表示されるとは限らない。一方、メモ表示欄520には、モデル画像512の視野に含まれない注目範囲に対応するメモ情報も表示してもよい。また、この代わりにモデル画像512のカバーする視野の三次元範囲に含まれる注目範囲を持つメモ情報のみを表示してもよい。
【0070】
メモ情報の数がメモ表示欄520内に一覧表示できる数より多い場合は、メモ表示欄520をスクロール可能とし、メモ情報群のうちメモ表示欄520内に表示する時系列範囲をスクロール操作により選択できるようにしてもよい。また、現在の動画再生位置の時刻の近傍の時刻に入力されたメモ情報がメモ表示欄520内に表示されるように制御してもよい。この場合、動画の表示が進むに連れて、メモ表示欄520内に表示されるメモ情報の範囲が変化する。
【0071】
また、図10の例では、モデル画像表示ウインドウ510内に時刻表示のためのスライダーバー530が表示されている。スライダーバー530の全長が、動画データ142全体の時間幅を表す。視聴者が、このスライダーバー530上で表示時間帯532を指定できるようにしてもよい。この場合、メモ情報出力部166は、指定された表示時間帯532にメモ時刻が含まれるメモ情報をメモ表示欄520内に表示するとともに、それら表示されるメモ情報に対応する注目範囲をモデル画像512内に表示させる。また、動画再生部164は、指定された表示時間帯532の始点から動画データ142の再生を開始する。動画の再生位置(再生時点)を示す再生位置インジケータ534が、動画の再生が進むにつれてスライダーバー530上を左から右へと移動する。再生位置インジケータ534をポインティングデバイスなどによりスライダーバー530上で移動させることで、動画データの再生位置を視聴者が指定できるようにしてもよい。
【0072】
また、スライダーバー530上に、各メモ情報のメモ時刻を示す線(メモ時刻インジケータ540)を表示してもよい。
【0073】
また、メモ表示欄520内のメモ情報522a等又はモデル画像512内の注目範囲514a等のいずれかをクリック操作などにより選択すると、動画データ142の再生位置を、選択されたメモ情報又は注目範囲に対応するメモ時刻へと変更してもよい。
【0074】
以上では、テキストのメモ情報を表示する場合を例示したが、メモ情報が音声情報である場合、例えばモデル画像512上の注目範囲514a等を視聴者が選択すると、選択された注目範囲に対応するメモ情報をメモ情報出力部166が音声出力するようにしてもよい。また、動画データ142の再生位置がメモ時刻に達すると、そのメモ時刻に対応するメモ情報の音声を再生するようにしてもよい。
【0075】
また、表示編集処理部160は、上述の表示画面上で、視聴者からの編集操作を受け付ける。例えば、視聴者が入力装置172を操作して既存のメモ情報を選択し、それに対してコメントを入力すると、表示編集処理部160は、そのコメントがメモ情報に対応づけてフィールドワーク記録記憶部140に登録する。また、視聴者が、モデル画像512上で新たな注目範囲を範囲指定し、その注目範囲に対応するメモ情報を入力できるようにしてもよい。この場合のメモ時刻は、動画表示ウインドウ550に表示されている動画の再生位置とすればよい。表示編集処理部160は、このように新たに入力されたメモ情報のメモレコードを作成し、フィールドワーク記録記憶部140に登録する。なお、その新たなメモ情報を入力した入力者を特定する情報を、そのメモ情報に対応づけて登録してもよい。
【0076】
なお、以上の例において、定置カメラ250として、レーザーレンジファインダ等の三次元距離計測装置を用いてもよい。この例では、1台の三次元距離計測装置が、上述の実施形態における2台の定置カメラの組と同じ働きをする。死角をなくすため、三次元距離計測装置は異なる複数の箇所に配置する。
【0077】
次に、変形例を説明する。この変形例では、図11に示すように対象領域内に位置センサ260を設ける。この位置センサ260により、例えばメモ端末200の位置を検出する。例えば、図12に例示するように、位置センサ260として無線LANの基地局を対象領域300内の複数の位置に配置する。この例では、メモ端末200と各基地局(位置センサ260)との間の通信に要する時間に基づき、三角測量の原理でメモ端末200の位置が特定される。
【0078】
また、別の例では、RFID(無線タグ)システムを利用して位置検知を行ってもよい。この場合、位置センサ260としてRFIDリーダを対象領域300内の複数の位置に配置し、各RFIDリーダが対象(例えばメモ端末200)に装着されたRFIDタグと通信し、タグとそれら各リーダとの間の通信に要した時間から、三角測量の原理で対象の位置を特定する。
【0079】
また、このような無線を利用したタグの代わりに、視覚的なタグ(例えば特定の模様を持つ物体)をメモ端末200に装着し、光学的な位置センサ(例えばレーザーレンジファインダ)によりその視覚的なタグの位置を検出してもよい。
【0080】
メモ端末200にメモ情報が入力された時点(メモ時刻)でのメモ端末200の位置を検知し、メモ情報と対応づけてフィールドワーク記録管理部130に提供してもよい。これにより、フィールドワーク記録管理部130は、メモ情報に対応する注目範囲を特定する際に、メモ端末200の位置の情報を撮影位置とする。そして、この既知の撮影位置を基準に、メモ情報に対応する撮影画像と各目印物体の特徴情報とを照合する。上述の実施形態では、撮影画像と目印物体との照合において、撮影位置自体が未知であったが、この例では撮影位置が既知となるため、照合の処理のための計算負荷が上記実施形態の場合よりも小さくなる。
【0081】
このようにメモ端末200の位置を検知するだけでなく、フィールドワーク現場にいる人々(すなわち調査者から見た観察対象者)にタグを持たせ、フィールドワーク期間(動画撮影期間)中の各人の位置変化を記録してもよい。各人には、それぞれ異なる識別情報(タグIDと呼ぶ)を持つタグを携帯させる。この場合、フィールドワーク支援装置100は、複数の位置センサ260により各人(各タグID)の時々刻々に位置を検出し、図13に例示するように時系列位置データ154としてタグID152に対応づけてフィールドワーク記録記憶部140に記憶する。時系列位置データ154には、例えば、時刻毎に、その時刻における当該タグIDのタグの位置が記録されている。このような各タグIDに対応する時系列位置データ154の集まりが、図11には位置変化データ150として示されている。
【0082】
表示編集処理部160は、この位置変化データ150を参照して、動画表示ウインドウ550に表示されている動画に同期して、モデル画像表示ウインドウ510内のモデル画像512内に各人の位置を表示してもよい。例えば、対象領域の三次元モデル内の各人の位置に、人間の形状を模した三次元モデルを配置し、これをモデル画像生成部162がレンダリングしてもよい。この場合、モデル画像512内に表示される各人のモデルの位置が、動画の再生位置が進むに連れて、時系列位置データ154に従って変化する。これにより、各メモ情報の対象となった注目範囲と、対象領域300内の人の位置とが同じモデル画像512内に表示されることとなる。
【0083】
また、空間モデル管理部110が、この位置検知の仕組みを用いて各目印物体の位置を検知し、目印物体の位置情報125(図5参照)として記録するようにしてもよい。
【0084】
以上に例示したフィールドワーク支援装置100及びメモ端末200は、例えば、汎用のコンピュータに上述の各機能モジュールの処理を表すプログラムを実行させることにより実現される。ここで、コンピュータは、例えば、ハードウエアとして、CPU等のマイクロプロセッサ、ランダムアクセスメモリ(RAM)およびリードオンリメモリ(ROM)等のメモリ(一次記憶)、HDD(ハードディスクドライブ)を制御するHDDコントローラ、各種I/O(入出力)インタフェース、ローカル・エリア・ネットワークなどのネットワークとの接続のための制御を行うネットワークインタフェース等が、たとえばバスを介して接続された回路構成を有する。また、そのバスに対し、例えばI/Oインタフェース経由で、CDやDVDなどの可搬型ディスク記録媒体に対する読み取り及び/又は書き込みのためのディスクドライブ、フラッシュメモリなどの各種規格の可搬型の不揮発性記録媒体に対する読み取り及び/又は書き込みのためのメモリリーダライタ、などが接続されてもよい。上に例示した各機能モジュールの処理内容が記述されたプログラムがCDやDVD等の記録媒体を経由して、又はネットワーク等の通信手段経由で、ハードディスクドライブ等の固定記憶装置に保存され、コンピュータにインストールされる。固定記憶装置に記憶されたプログラムがRAMに読み出されCPU等のマイクロプロセッサにより実行されることにより、上に例示した機能モジュール群が実現される。なお、それら機能モジュール群のうちの一部又は全部を、専用LSI(Large Scale Integration)、ASIC(Application Specific Integrated Circuit、特定用途向け集積回路)又はFPGA(Field Programmable Gate Array)等のハードウエア回路として構成してもよい。
【0085】
また、空間モデル管理部110、フィールドワーク記録管理部130、表示編集処理部160などといった各機能モジュールを、それぞれ別のコンピュータ上に実装してもよい。
【符号の説明】
【0086】
100 フィールドワーク支援装置、110 空間モデル管理部、120 空間モデル記憶部、122 レイアウト情報、124 目印情報、130 フィールドワーク記録管理部、140 フィールドワーク記録記憶部、142 動画データ、144 メモレコード群、160 表示編集処理部。
【特許請求の範囲】
【請求項1】
対象領域内の各目印物体の位置情報及び認識用特徴情報を記憶する目印情報記憶手段と、
前記対象領域の少なくとも一部を撮影することにより得られた撮影画像を表示する撮影画像表示手段と、
メモ情報の入力を受け付けて前記撮影画像表示手段に表示された撮影画像と関連づける入力受付手段と、
前記入力受付手段で受け付けたメモ情報に関連づけられた撮影画像と前記目印情報記憶手段に記憶された各目印物体の認識用特徴情報との照合により、当該撮影画像に含まれる1以上の目印物体の画像を特定し、特定した各目印物体の画像の前記撮影画像中での位置と前記目印情報記憶手段に記憶された当該各目印物体の位置情報とに基づき、当該メモ情報に対応する前記対象領域内の注目範囲を特定する注目範囲特定手段と、
前記入力受付手段で受け付けたメモ情報を、前記注目範囲特定手段が特定した当該メモ情報に対応する注目範囲を示す注目範囲情報と対応づけて記憶するメモ情報記憶手段と、
を備えるメモ情報管理システム。
【請求項2】
前記対象領域の三次元形状モデル情報を記憶するモデル記憶手段と、
前記モデル記憶手段に記憶された前記対象領域の三次元形状モデル情報に基づき、前記対象領域の二次元画像を生成する領域画像生成手段と、
前記領域画像生成手段が生成した二次元画像内に前記メモ情報記憶手段に記憶されたメモ情報に関連づけられた注目範囲が含まれる場合に、当該二次元画像内の当該注目範囲に対応づけて当該メモ情報を出力するメモ情報出力手段と、
を備える請求項1に記載のメモ情報管理システム。
【請求項3】
前記対象領域の少なくとも一部を撮影することにより前記撮影画像表示手段に表示するための撮影画像を生成するとともに、当該撮影画像中での焦点位置の情報を当該撮影画像と対応づけて出力する撮影手段、を更に備え、
前記注目範囲特定手段は、前記メモ情報に関連づけられた撮影画像に対応づけて前記撮影手段から出力された焦点位置を加味して、当該メモ情報に対応する前記注目範囲を特定する、
ことを特徴とする請求項1に記載のメモ情報管理システム。
【請求項4】
前記対象領域の動画を撮影する動画撮影手段と、
前記動画撮影手段が撮影した動画の動画データを記憶する動画記憶手段と、
前記動画記憶手段が記憶している動画データに基づき前記対象領域の動画を再生する動画再生手段と、
前記領域画像生成手段が生成した前記対象領域の二次元画像と、前記動画再生手段が再生した動画と、を対応づけて表示する動画表示手段と、
を更に備え、
前記撮影画像表示手段は、前記動画撮影手段が撮影した動画を前記撮影画像として表示し、
前記入力受付手段は、前記メモ情報の入力を受け付けた時点で前記撮影画像表示手段が表示していた撮影画像の前記動画データ内での時点を求め、
前記メモ情報記憶手段は、前記メモ情報に関連づけられた前記撮影画像の前記動画データ内での時点を、当該メモ情報に対応づけて記憶し、
前記メモ情報出力手段は、前記動画表示手段に表示されている画像の前記動画データ内での時点に対応する時点のメモ情報を出力する、
ことを特徴とする請求項1に記載のメモ情報管理システム。
【請求項5】
対象領域内の各目印物体の位置情報及び認識用特徴情報を記憶する目印情報記憶手段と、
メモ入力装置からメモ情報と撮影画像の組を受信する受信手段と、
前記受信手段が受信した撮影画像と前記目印情報記憶手段に記憶された各目印物体の認識用特徴情報との照合により、当該撮影画像に含まれる1以上の目印物体の画像を特定し、特定した各目印物体の画像の前記撮影画像中での位置と前記目印情報記憶手段に記憶された当該各目印物体の位置情報とに基づき、当該撮影画像と共に受信したメモ情報に対応する前記対象領域内の注目範囲を特定する注目範囲特定手段と、
前記メモ情報を、前記注目範囲特定手段が特定した当該メモ情報に対応する注目範囲を示す注目範囲情報と対応づけて記憶するメモ情報記憶手段と、
を備えるメモ情報処理装置。
【請求項6】
コンピュータを、
対象領域内の各目印物体の位置情報及び認識用特徴情報を記憶する目印情報記憶手段、
メモ入力装置からメモ情報と撮影画像の組を受信する受信手段、
前記受信手段が受信した撮影画像と前記目印情報記憶手段に記憶された各目印物体の認識用特徴情報との照合により、当該撮影画像に含まれる1以上の目印物体の画像を特定し、特定した各目印物体の画像の前記撮影画像中での位置と前記目印情報記憶手段に記憶された当該各目印物体の位置情報とに基づき、当該撮影画像と共に受信したメモ情報に対応する前記対象領域内の注目範囲を特定する注目範囲特定手段、
前記メモ情報を、前記注目範囲特定手段が特定した当該メモ情報に対応する注目範囲を示す注目範囲情報と対応づけて記憶するメモ情報記憶手段、
として機能させるためのプログラム。
【請求項1】
対象領域内の各目印物体の位置情報及び認識用特徴情報を記憶する目印情報記憶手段と、
前記対象領域の少なくとも一部を撮影することにより得られた撮影画像を表示する撮影画像表示手段と、
メモ情報の入力を受け付けて前記撮影画像表示手段に表示された撮影画像と関連づける入力受付手段と、
前記入力受付手段で受け付けたメモ情報に関連づけられた撮影画像と前記目印情報記憶手段に記憶された各目印物体の認識用特徴情報との照合により、当該撮影画像に含まれる1以上の目印物体の画像を特定し、特定した各目印物体の画像の前記撮影画像中での位置と前記目印情報記憶手段に記憶された当該各目印物体の位置情報とに基づき、当該メモ情報に対応する前記対象領域内の注目範囲を特定する注目範囲特定手段と、
前記入力受付手段で受け付けたメモ情報を、前記注目範囲特定手段が特定した当該メモ情報に対応する注目範囲を示す注目範囲情報と対応づけて記憶するメモ情報記憶手段と、
を備えるメモ情報管理システム。
【請求項2】
前記対象領域の三次元形状モデル情報を記憶するモデル記憶手段と、
前記モデル記憶手段に記憶された前記対象領域の三次元形状モデル情報に基づき、前記対象領域の二次元画像を生成する領域画像生成手段と、
前記領域画像生成手段が生成した二次元画像内に前記メモ情報記憶手段に記憶されたメモ情報に関連づけられた注目範囲が含まれる場合に、当該二次元画像内の当該注目範囲に対応づけて当該メモ情報を出力するメモ情報出力手段と、
を備える請求項1に記載のメモ情報管理システム。
【請求項3】
前記対象領域の少なくとも一部を撮影することにより前記撮影画像表示手段に表示するための撮影画像を生成するとともに、当該撮影画像中での焦点位置の情報を当該撮影画像と対応づけて出力する撮影手段、を更に備え、
前記注目範囲特定手段は、前記メモ情報に関連づけられた撮影画像に対応づけて前記撮影手段から出力された焦点位置を加味して、当該メモ情報に対応する前記注目範囲を特定する、
ことを特徴とする請求項1に記載のメモ情報管理システム。
【請求項4】
前記対象領域の動画を撮影する動画撮影手段と、
前記動画撮影手段が撮影した動画の動画データを記憶する動画記憶手段と、
前記動画記憶手段が記憶している動画データに基づき前記対象領域の動画を再生する動画再生手段と、
前記領域画像生成手段が生成した前記対象領域の二次元画像と、前記動画再生手段が再生した動画と、を対応づけて表示する動画表示手段と、
を更に備え、
前記撮影画像表示手段は、前記動画撮影手段が撮影した動画を前記撮影画像として表示し、
前記入力受付手段は、前記メモ情報の入力を受け付けた時点で前記撮影画像表示手段が表示していた撮影画像の前記動画データ内での時点を求め、
前記メモ情報記憶手段は、前記メモ情報に関連づけられた前記撮影画像の前記動画データ内での時点を、当該メモ情報に対応づけて記憶し、
前記メモ情報出力手段は、前記動画表示手段に表示されている画像の前記動画データ内での時点に対応する時点のメモ情報を出力する、
ことを特徴とする請求項1に記載のメモ情報管理システム。
【請求項5】
対象領域内の各目印物体の位置情報及び認識用特徴情報を記憶する目印情報記憶手段と、
メモ入力装置からメモ情報と撮影画像の組を受信する受信手段と、
前記受信手段が受信した撮影画像と前記目印情報記憶手段に記憶された各目印物体の認識用特徴情報との照合により、当該撮影画像に含まれる1以上の目印物体の画像を特定し、特定した各目印物体の画像の前記撮影画像中での位置と前記目印情報記憶手段に記憶された当該各目印物体の位置情報とに基づき、当該撮影画像と共に受信したメモ情報に対応する前記対象領域内の注目範囲を特定する注目範囲特定手段と、
前記メモ情報を、前記注目範囲特定手段が特定した当該メモ情報に対応する注目範囲を示す注目範囲情報と対応づけて記憶するメモ情報記憶手段と、
を備えるメモ情報処理装置。
【請求項6】
コンピュータを、
対象領域内の各目印物体の位置情報及び認識用特徴情報を記憶する目印情報記憶手段、
メモ入力装置からメモ情報と撮影画像の組を受信する受信手段、
前記受信手段が受信した撮影画像と前記目印情報記憶手段に記憶された各目印物体の認識用特徴情報との照合により、当該撮影画像に含まれる1以上の目印物体の画像を特定し、特定した各目印物体の画像の前記撮影画像中での位置と前記目印情報記憶手段に記憶された当該各目印物体の位置情報とに基づき、当該撮影画像と共に受信したメモ情報に対応する前記対象領域内の注目範囲を特定する注目範囲特定手段、
前記メモ情報を、前記注目範囲特定手段が特定した当該メモ情報に対応する注目範囲を示す注目範囲情報と対応づけて記憶するメモ情報記憶手段、
として機能させるためのプログラム。
【図1】
【図3】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図13】
【図2】
【図4】
【図12】
【図3】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図13】
【図2】
【図4】
【図12】
【公開番号】特開2011−108086(P2011−108086A)
【公開日】平成23年6月2日(2011.6.2)
【国際特許分類】
【出願番号】特願2009−263867(P2009−263867)
【出願日】平成21年11月19日(2009.11.19)
【出願人】(000005496)富士ゼロックス株式会社 (21,908)
【Fターム(参考)】
【公開日】平成23年6月2日(2011.6.2)
【国際特許分類】
【出願日】平成21年11月19日(2009.11.19)
【出願人】(000005496)富士ゼロックス株式会社 (21,908)
【Fターム(参考)】
[ Back to top ]