説明

情報処理システムおよび情報処理方法

【課題】 人や物など物体の位置関係を利用して映像から所定のシーンを絞り込むことができる情報処理システムを提供する。
【解決手段】 情報処理システム1は、ビデオカメラにより所定の空間を撮像したときの映像情報の各シーンを該空間内に存在する物体の位置情報に関連付けて記憶する会議データベース30と、物体を指示する情報を検索要求として受け付けるクエリ受付部と、検索要求に基づいて会議データベース30内の映像情報から物体が所定の位置に存在するシーンを検索する検索部42とを具備する。また、クエリ受付部41は、付加情報を指定する手段を検索画面上に提供すると共に、付加情報を指定する手段の操作に応じて検索要求を受け付ける。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理システムおよび情報処理方法に関する。
【背景技術】
【0002】
昨今のコンピューティング技術の発展に伴い、コンピュータがオフィスや一般家庭内に深く浸透してきている。これと相俟って、さまざまな適用業務はコンピュータの支援を受けることができるようになってきている。例えば、企業における産業活動やその他のさまざまに日常生活において、会議が頻繁に行なわれているが、会議室にコンピュータを取り込むことで、会議の運用を支援することができる。
【0003】
また、会議などでの決定事項などは、後に発行される議事録を見返すことにより振り返ることができる。また、会議を録画したビデオを閲覧することにより会議の振り返りを支援するという方法が提案されている。この時、いかに目的のシーンを容易に検索することができるかということが問題となる。また、特許文献1記載の技術では、会議中の発話をチャートにして、一覧することにより特定の時間を指示することによりその時間の映像を見ることが出来るようにしている。
【特許文献1】特開平07−56748号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
しかし、上記従来技術によるアプローチでは、映像に含まれていない現実場面でのオブジェクトや人との位置関係から、そのときの(時間が一致した)関連映像を検索することはできない。この問題点を解決する技術として、ユーザが容易に思い出せる内容をクエリとして受け取り、合致したシーンを結果としてユーザへ返すというものが提案されている(特願2004−040622)。また会議のコンテキスト情報として参加者の位置や使用した文書や映像を保存しておき、そのコンテキスト情報を閲覧することにより、会議の内容を思い出しながら詳細なコンテキスト情報にアクセスすることが出来る技術が提案されている(特願2004−278096)。
【0005】
しかしながら、実空間内のオブジェクトと人の位置関係を利用したかたちの映像検索方法が網羅的に追究されているわけではない。たとえば、上記特願2004−040622では始めに会議室を選定して人物や物の配置を行なう。また、特定の会議室が選定できない場合は、いくつかある標準的なレイアウトを選択して人物や物を配置した。しかし、人や物の配置が思い出せても、会議室のレイアウトが思い出せない場合は上記の方法を利用することは出来ない。また、特願2004−278096では、閲覧する会議のコンテキスト情報が多くなると、ユーザが保する情報を探し出すのに時間がかかる。
【0006】
そこで、本発明は、上記問題点に鑑みてなされたもので、人や物など物体の位置関係を利用して映像から所定のシーンを絞り込むことができる情報処理システムおよび情報処理方法を提供することを目的とする。
【課題を解決するための手段】
【0007】
上記課題を解決するために、本発明の情報処理システムは、撮像手段により所定の空間を撮像したときの映像情報の各シーンを該空間内に存在する物体の位置情報に関連付けて記憶する記憶部と、前記物体を指示する情報を検索要求として受け付ける受付部と、前記検索要求に基づいて前記記憶部内の映像情報から前記物体が所定の位置に存在するシーンを検索する検索部とを具備している。本発明によれば、人や物など物体の位置関係を利用して映像から所定のシーンを絞り込むことができる。前記物体は、前記空間内に存在する人物、機器及び設備のうちの少なくとも一つであるのが好ましい。
【0008】
前記記憶部は、前記物体の識別子、前記空間の識別子、前記物体が人物である場合の該人物の発話状況、前記物体が機器である場合の該機器の動作状況の少なくとも一つを付加情報として前記映像情報に関連付けて記憶し、前記受付部は、前記付加情報を前記検索要求として受け付け、前記検索部は、前記記憶部内の映像情報から前記検索要求に該当するシーンを検索する。本発明によれば、撮影時に発生する付加情報を利用して映像情報の中から該当するシーンを絞り込むことができる。前記記憶部は、前記付加情報を前記映像情報のシーンごとに記憶している。
【0009】
前記受付部は、前記付加情報を指定する手段を検索画面上に提供すると共に、該付加情報を指定する手段の操作に応じて前記検索要求を受け付ける。本発明によれば、想起を支援しながら目的のシーンを検索できる。前記受付部は、前記付加情報を指定する手段を検索画面上に提供とする共に、前記付加情報を指定する手段を所定の領域に配置する形式で前記検索要求を受け付ける。本発明によれば、撮影時に発生した出来事を手掛かりとして映像から所望のシーンを検索できる。
【0010】
前記受付部は、前記物体のうち第1の物体に対する第2の物体の相対的な位置を指定する手段を検索画面上に提供すると共に、該第2の物体の相対的な位置を指定する手段の操作状況に応じて前記検索要求を受け付ける。本発明によれば、人の向きを考慮して検索を行うことができる。
【0011】
本発明の情報処理システムは、前記検索部による検索結果を表示する表示部をさらに具備している。本発明によれば、該当するシーンを知ることができる。本発明の情報処理システムは、前記映像情報のうち前記検索部により検索されたシーンの箇所を識別可能に表示する表示部をさらに具備している。本発明によれば、全体の中で該当するシーンがどれくらいあるのかを一目で把握できる。本発明の情報処理システムは、前記検索部により検索されたシーンの縮小画像を生成し該縮小画像を表示する表示部をさらに具備している。
【0012】
本発明の情報処理方法は、物体を指示する情報を検索要求として受け付けるステップと、前記検索要求に基づいて撮像手段により所定の空間を撮像したときの映像情報の各シーンを該空間内に存在する物体の位置情報に関連付けて記憶する記憶部内の映像情報から前記物体が所定の位置に存在するシーンを検索するステップとを有する。本発明によれば、人や物など物体の位置情報を利用して撮影した映像から所定のシーンを絞り込むことができる。
【発明の効果】
【0013】
本発明によれば、人や物など物体の位置関係を利用して映像から所定のシーンを絞り込むことができる情報処理システムおよび情報処理方法を提供できる。
【発明を実施するための最良の形態】
【0014】
以下、本発明を実施するための最良の形態について説明する。図1は、本発明のシステムの全体構成を示す図である。図1に示すように、情報処理システム1は、会議情報を記録する会議記録装置10、会議記録装置10で記録した会議情報を管理する情報管理装置20、記憶部としての会議データベース(DB)30および情報処理部40を備える。会議記録装置10は、文書管理装置11、人物位置特定装置12、機器位置特定装置13、話者認識装置14、機器動作特定装置15及び撮像手段としての映像記録装置16を備えている。以下において、物体には空間内に存在する人物、機器及び設備が含まれる。また空間として会議室を例にとって説明する。また会議の参加者として社員が出席している。この会議記録装置10は、会議室毎に用意されている。各会議室に設置された会議記録装置10には会議室IDが割り当てられている。
【0015】
文書管理装置11は、各会議で用いられる文書を管理するものであり、例えばプロジェクタによって投影された文書のイメージとその投影時間をキャプチャするハードウエアやソフトウエア、また、上映されているスライド文書のファイル名と各ページのタイトルを時間とともに記録するソフトウエアやアクセスしたURL(Uniform Resource Locator)とその時間を記録するためのソフトウエア等により構成される。具体的には、文書管理装置11は、プロジェクタに接続されているPC上で表示されているスライドを監視するソフトウエアや文書ファイルのオープン・クローズを監視するソフトウエアなどで構成されている。
【0016】
人物位置特定装置12は、各参加者の会議室内での位置を特定し保存する。この人物位置特定装置12は、例えば人物IDを記録したICタグ(RFIDタグ)、ICタグから人物IDを読み取るためのリーダから構成される。各個人はICタグを埋め込んだIDカードを身に付ける。ICタグには個人を特定できるような人物IDが記憶されている。会議室の床面、壁面にはこの人物IDを読み取るためのリーダが複数個埋め込まれている。例えば、会議室の床面には、格子状に区切られた区画の中央にリーダが埋め込まれている。リーダは、ある一定間隔で人物ID、発話フラグを読み取り、読み取った情報を情報管理装置20へ送る。また、位置の認識方法としてリーダを机に設置してもよい。各座席に向かい合う位置にリーダを設置することにより、机の周辺に座っている人の位置と人が向いている方向を認識できる。なお、人物位置特定装置12では、超音波センサーを利用した位置推定技術や、マイクロフォンアレーを利用した音源推定技術などを利用することにより、人物の位置情報を自動的に取得するようにしてもよい。
【0017】
機器位置特定装置13は、会議室内でのテーブルやホワイトボードなどの機器及び設備の位置を特定し保存する。ここでは上記の人物位置特定装置12と同様の仕組みを利用する。機器および設備には例えば、移動式のホワイトボード、椅子、机、スクリーン、ディスプレイ、プリンタ、スピーカなど会議室にあるものすべてが含まれる。話者認識装置14は、会議中に話者を認識し保存する。この話者認識装置14は、例えば各個人が携帯するIDカードに小型のマイクロフォンと書き込み機を取り付け、ある一定以上の強度の発話があった場合、ICタグに発話したことを示す発話フラグをオンにする回路を持ち、人物IDと読取装置IDと発話フラグを情報管理装置20へ転送する。なお、話者認識装置14を音声認識技術を用いることにより実現してもよい。機器動作特定装置15は、会議室内に存在するプロジェクタや照明などの機器の動作状況を監視し、その状態の変化を情報管理装置20へ送る。映像記録装置16は、例えばビデオカメラで構成され、記録しているビデオ画像を情報管理装置20へ送る。
【0018】
情報管理装置20は、会議DB30に問い合わせをし、新しい会議IDを取得し、会議IDと会議室の対(会議IDリスト)を内部に保存する。会議IDリストには現在会議が行なわれている会議室名とその会議IDが保存されている。次に、情報管理装置20は、会議DB30に対して新たなレコードを作成し、その中に、会議ID、会議室名、日付、時間を格納する。このとき、情報管理装置20は、開始日時と時間も会議DB30に送り保存する。ユーザは、記録を終了する場合、会議記録装置10に会議終了を指示する。会議記録装置10は、会議室名と状態が終了となったことを情報管理装置20へ送る。情報管理装置20は、会議IDリストから該当する会議IDを取得し、終了時間又は会議の時間を記録する。情報管理装置20は、会議IDリストから該当する会議室名と会議IDを削除する。情報管理装置20は、IDリストを参照し、会議室名から会議IDを検索し、検索された会議IDに対応するレコードにビデオ画像を保存する。
【0019】
会議の記録時における人物位置特定装置12並びに話者認識装置14による処理では、IDカード内のマイクによって、IDカードを装着している人物の発話を検出する。人物位置特定装置12は、人物の発話を検出した場合、書き込み装置は、IDカードに埋め込まれている無線ICタグの発話フラグをオンにする。人物位置特定装置12は、人物の発話を検出しなかった場合はオフにする。また、無線ICタグに人物を特定するための人物IDが記録されており、リーダによって読み取られる。ここではISO15693に規定されている無線方式を採用するものとする。リーダは読み取った人物IDと発話フラグとリーダ自身のリーダID及びリーダが設置されている会議室名を情報管理装置20へ送る。情報管理装置20は、人物ID変換リストを使って人物名を取得し、会議IDリストを使って会議IDを求める。情報管理装置20は、それらの情報を会議DB30に送る。ここでは、リーダは1秒毎に読み取りをしているものとする。
【0020】
また、機器位置検出装置13は、機器や設備にIDを付与した無線ICタグを付与することにより、人物位置特定装置12と同じ方法が利用できるので、ここでは説明を省略する。会議の記録時、機器動作特定装置15は、プロジェクタ、照明の電源のオン・オフを監視する。機器動作特定装置15は、オン・オフに変更があった場合は、その機器名、及び変化後の機器の状態、その会議室名を情報管理装置20へ送る。情報管理装置20は、会議室名から会議IDリストを利用して、会議IDを取得し、その会議ID、機器ID、機器状態、時間を記録する。情報管理装置20は、ビデオ映像と上記の各読取装置から読み取られた人物IDと発話フラグ、読み取った読取装置の読取装置ID及び機器の動作状態を受け取り、会議DB30に保存する。このとき、1つの記録装置の開始から終了までの間に送られてきた情報を1つのレコードとして保存する。
【0021】
会議DB30は、映像記録装置により会議室である所定の空間を撮像したときの映像情報の各シーンを該空間内に存在する物体の位置情報に関連付けて記憶している。この会議DB30は、各会議のメタデータを保存している。この会議DB30は、各会議ごとに1レコードを持ち、各レコード内には、付加情報として会議ID、開催日時、物体の識別子である参加者の識別子や機器、設備の識別子、会議室名、参加者の位置、参加者(人物)の発話状況、装置や設備の位置、機器の動作状況、機器や設備の使用状況が映像情報であるビデオデータに関連付けられて記憶されている。図2は、会議DB30の会議データ構造の例を示す図である。会議DB30内の会議データは、各会議ごとにIDが付与され、その会議の参加者、日時、時間、会議室、設置されている設備や装置が記録されている。また、会議DB30にはこの会議のビデオデータへのリンクも記録されている。動作状態として、参加者については参加者の位置と発話しているか否かが毎秒事に記載されている。また、会議室内の設備や装置については、それらの位置と動作状態が記載されている。位置は例えば、部屋を一定幅、例えば40センチ幅で格子状に区切り、人物あるいは装置等があるブロックを部屋のある一角から数えた場合のXY座標で表すことができる。
【0022】
例えば、動作状態の例として、「0004,2:4:0、4:4:0、3:4:0、3:1:1、4:2:0、2:3:0、1:3:0、2:1:0」について説明すると、会議開始後4(0004)秒において、社員Aが会議室のX座標2、Y座標4にいて発話はしていない(0)、社員BがX座標4、Y座標4、発話なし(0)であることを示す。以下、社員C、社員E、社員Fについても同様にX座標、Y座標、発話状態を表す。また、機器類に関しても、例えば、ホワイトボードがX座標2、Y座標1にあることを示している。また、プロジェクタなどの電化製品の場合は、その電源のON・OFFの状態を1または0で表すこととする。ホワイトボードのようにON・OFFの状態がないものについては常に0にしておく。ここではメタデータの取得方法については問わない。これらの情報は自動で付与されるのが望ましいが、手動で入力しても良い。なお、会議DB30には、上記付加情報が映像情報のシーンごとに記録されているのがよい。
【0023】
図3は、本発明の情報処理部の構成例を示す図である。図3に示すように、情報処理部40は、受付部としてのクエリ受付部41、検索部42、メンバーオブジェクト情報DB43および表示部としての結果表示部44を備えている。参照符号1は情報処理システム、30は会議DBを示す。この情報処理部40は、ユーザからの検索要求に基づいて会議映像情報から物体が所定の位置に存在するシーンを検索する機能を持つ。クエリ受付部41は、ユーザからの操作を受け付けるGUI(Graphical User Interface)を備えており、GUI上のユーザの操作を監視して物体を指示する情報を検索要求として受け付け、検索部42にクエリを発行する機能を持つ。ここでクエリとは、データベース管理システムに対する処理要求を文字列として表したものである。
【0024】
メンバーオブジェクト情報DB43は、検索に使用されるキューとして、会議に参加しているメンバー情報、会議室内に存在する機器や設備のオブジェクト情報が予め登録されている。ユーザが手動により入力した情報や図1で示した人物位置特定装置12および機器位置特定装置13からの情報を用いて、会議に参加しているメンバー情報、会議室内に存在する機器や設備のオブジェクト情報は、メンバーオブジェクト情報DB43に予め登録されている。検索部42は、検索要求に基づくクエリを元に、会議DB30内の映像情報から物体が所定の位置に存在するシーンを検索し、検索結果を結果表示部44へ送る。結果表示部44は、ユーザに対して検索部42による検索結果を表示するためのGUIを備えており、検索部42から受け取った検索結果を表示する機能を持つ。なお、クエリ受付部41が、ユーザから付加情報を検索要求として受け付けた場合、検索部は、会議DB30内の映像情報から検索要求に該当するシーンを検索することもできる。
【0025】
図4は、クエリ受付部41が提供するGUIを示す図である。このGUI410は、シーン構成エリア420、メンバーエリア430、オブジェクトエリア440から構成される。シーン構成エリア420は、クエリを発行するためのシーンを構成するための作業スペースである。このシーン構成エリア420は、シーン追加ボタン421を備え、ユーザがマウス等によりこのシーン追加ボタン421を押下するごとにシーンエリア422が追加される。メンバーエリア430には会議に参加する可能性のあるメンバー(社員A〜社員F)の顔写真と名前からなる人物アイコンが表示される。これらの情報はメンバーオブジェクト情報DB43に予め登録されており、クエリ受付部41がメンバーオブジェクト情報DB43に問い合わせすることにより顔写真、名前を取得できる。クエリ受付部41は、他の情報として社員番号、役職などをメンバーエリア430に表示しても良い。
【0026】
オブジェクトエリア440には会議室に設置される設備や装置のアイコンが表示される。ここでは、メンバーオブジェクト情報DBには、会議室に設置される設備としてホワイトボードが登録され、会議室に設置される装置としてプロジェクタおよび投影スクリーンが登録されているものとする。このため、オブジェクトエリア440には、投影スクリーンのアイコン441、プロジェクタのアイコン442及びホワイトボードのアイコン443が表示されている。これらの情報はメンバーオブジェクト情報DB43に予め登録されている。この人物アイコン(社員A〜社員F)及び機器や設備のアイコン441〜443は、付加情報を指定する手段となる。
【0027】
クエリ受付部41は、メンバーオブジェクト情報DB43に問い合わせすることにより写真または抽象化したアイコン、装置や設備の名前を取得し、人物アイコン(社員A〜社員F)及び機器や設備のアイコン441〜443を検索画面上に提供すると共に、人物アイコン(社員A〜社員F)及び機器や設備のアイコン441〜443の操作に応じて検索要求を受け付ける。例えば、クエリ受付部41は、人物アイコン(社員A〜社員F)及び機器や設備のアイコン441〜443を所定の領域に配置する形式で検索要求を受け付ける。
【0028】
次に、情報処理部40の動作例を詳細に説明する。図5は、クエリ受付部41が提供するGUIを示す図である。図6は、情報処理部40の動作処理フローチャートである。図7は、情報処理部40の検索部42における検索時の処理フローチャートである。図8は、情報処理部40の検索部42における隣接ブロック算出時の処理フローチャートである。
【0029】
ユーザは振り返りたい会議のシーンがある場合、GUI410を利用してそのシーンを検索できる。まず、ユーザはそのシーンを想起し、自分(社員C)のすぐ隣に社員Bと社員Aがいたことを思い出したとする。クエリ受付部41は、シーン追加ボタン421の押下を監視し(図6のステップS100)、シーン構成エリア420にシーンエリア422を表示する。ユーザが自分を示す社員Cのアイコンと社員A、Bのアイコンをシーンエリア422にドラッグ&ドロップすると、クエリ受付部41は、GUI410上でユーザからの変更を監視し(図6のステップS100)、GUI410上で変化があった場合、GUI410の状態から検索要求を生成し(図6のステップS200)、これを検索部42へと渡す。
【0030】
シーン1としてシーンエリア422に社員A、B、Cが配置された状態での検索要求は次のようになる。
・シーン1:社員A、社員B、社員C
検索部42は、クエリ受付部41からクエリを受け取り、受け取ったクエリをもとに会議DB30内を検索する(図6のステップS300)。
【0031】
検索部42は、会議DB30内の参加者・設備機器欄を調べて該当するレコードを検索する(ステップS310)。より詳細には、検索部42は、検索要求に含まれる参加者および機器類を含む、会議メタデータを検索する。このとき、検索部42は、検索要求に含まれる参加者および機器類が各会議レコードの参加者および設備・機器の項目のマッチングを取ることにより検索を行なう。検索部42は、該当レコードがない場合、ステップS340へ進み、該当なしを検索結果とし(ステップS340)、該当レコードがある場合、ステップS320へ進み、結果として該当するレコードの会議IDを得る。ここでは、シーン1としてシーンエリア422に社員A,B,Cが指定されているので、検索部42は、これらを参加者として含む会議を検索する。例えば会議ID0123、0124の2つの会議IDが検索されたとする。
【0032】
次に、検索部42は、参加者または機器が合計で2つ以上指定されているかを調べ(ステップS320)、参加者または機器の指定が一つだけの場合は、該当するレコードの会議IDのみを検索結果とする(ステップS350)。ステップS320で、検索部42は、参加者または機器が合計で2つ以上指定されている場合、ステップS330へ進む。検索部42は、得た会議IDで示される会議について、参加者が複数人指定されている場合は指定された参加者同士が隣接するブロックに存在するかの判定を行なう(図7のステップS330)。
【0033】
このとき、検索部42は、検索された会議IDの動作状態の欄を指定された参加者が隣接するブロックに存在するか否かを毎秒事に検索する。より詳細には以下のようになる。検索部42は、一人目の参加者(または機器)について位置情報を取得する。ここでは、検索部42は、社員Aの位置情報を取得する。次に、検索部42は、時間t=0をセットする(ステップS331)。検索部42は、時間tに対して以下の処理を行う(ステップS332)。まず、検索部42は、1人目の参加者に対して取得した位置情報に基づいて隣接ブロックを求める(ステップS333)。図9は、時間0000秒における社員Aの隣接ブロックを示す図である。たとえば、検索部42は、会議ID0123について社員Aがある時間、例えば0秒に(X、Y)=(2、4)にいた場合、Xの値を±1、Yの値を±1した全てのブロックを求める。この場合、検索部42は、隣接ブロック(2,4)=(1,3)(2,3)(3,3)(3,4)(3,5)(2,5)(1,5)(1,4)の8個の隣接ブロックを得る。
【0034】
図10は、時間0000秒における社員Aの隣接ブロックABlockと社員Cの隣接ブロックCblockを示す図である。次に、検索部42は、ある時間に対して他の参加者が隣接ブロックに含まれるか判定する(図8のステップS334)。ここでは、検索部42は、社員Aの隣接ブロックに他の参加者が含まれるか判定する。この場合、検索部42は、社員Cがブロック(3,4)に存在するので隣接ブロックに含まれると判断する。検索部42は、他の参加者がその隣接ブロックに含まれない場合、ステップS338へ進む。検索部42は、仮に社員Bや社員Cが図10において、(6,7)のような位置にいるような場合は隣接ブロックに含まれないと判定する(図8のステップS334)。検索部42は、他の参加者がその隣接ブロックに含まれる場合、その参加者の隣接ブロックを求め、既存の隣接ブロックに追加する(ステップS335)。ここでは検索部42は、社員Cの隣接ブロックを求め既存の隣接ブロックに追加する。
【0035】
検索部42は、参加者全員が隣接ブロックに含まれるかどうかを調べる(ステップS336)。検索部42は、参加者全員が隣接ブロックに含まれていない場合はステップS334にもどる。ここでは、まだ社員Bが隣接ブロックに含まれていないのでステップS334に戻って、隣接ブロックに含まれるかを調べる。結果、社員Bが隣接ブロックに含まれる。検索部42は、指定された参加者全てが、隣接ブロックに含まれることが分かったのでここで判定を終了する(図8のステップS336)。検索部42は、ステップS336で参加者全員が隣接ブロックに含まれる場合、時間tを結果リストに加える(ステップS337)。この場合、検索部42は、時間0秒において3人が隣接していることを結果として保持する。そして、検索部42は、時間tが最後の時間かを判断し(図8のステップS338)、最後の時間でない場合、時間を1単位(秒)進め(図8のステップS339)、最後の時間の場合には処理を終了する。
【0036】
検索部42は、該当するレコードの会議IDと該当する時間を検索結果とする(ステップS360)。ここでは、検索部42は、該当した会議IDおよび、その会議IDごとに該当した時間をリストにし、検索結果として結果表示部44に渡す。図11は、会議IDごとに検索部42が作成したリストを示す図である。結果表示部45は、検索部42から検索結果を受け取り、GUI上に表示する(図6のステップS500)。この例ではシーンは1つしかないため図6のステップS400の処理は特に行なわない。
【0037】
図12は、結果表示部45が提供するGUI450を示す図である。結果表示部45は、映像情報のうち検索部42により検索されたシーンの箇所を識別可能に表示するために、図11で示したリストに対してタイムライン451、456を用意し、検索された時間帯に対してタイムライン451、456の太さを変えて表示する。また、結果表示部45は、各タイムライン451、456の先頭の時間のシーンをビデオデータから抽出しサムネイル(縮小画像)化し、時間情報452A〜452C、457A、457Bとともにサムネイル453A〜453C、458A、458Bをタイムライン451、456上に表示する。このように、結果表示部45は、検索部42により検索されたシーンのサムネイルを生成しサムネイルを表示するので、検索されたシーンの概略をつかむことができる。
【0038】
次にユーザは、社員Eがホワイトボードの隣で説明していたのを思い出したのでそのシーンを追加する。図13は、クエリ受付部41が提供するGUI410を示す図である。まず、クエリ受付部41は、ユーザがマウス等を利用してシーン追加ボタン421を押下したことを検出すると、シーンエリア423を表示する。次にユーザはマウス等により社員Eのアイコンとホワイトボードのアイコン443をシーンエリア423にドラッグ&ドロップする。クエリ受付部41は、GUI410上でユーザからの変更が加えられるごとに、検索要求をGUIの状態から生成し検索部42へと渡す(図6のステップS100,S200)。
【0039】
シーン1としてシーンエリア422に社員A、B、Cが配置され、シーン2としてシーンエリア423に社員Eとホワイトボードが配置された状態での検索要求は以下のようになる。
・シーン1:社員A、社員B、社員C
・シーン2:社員E,ホワイトボード
検索部42は、クエリ受付部41から検索要求を受け取り、会議DB30内を検索する。検索部42は、ここではシーン1かつシーン2を含む場面を検索する(アンド条件)。まず、検索部42は、シーン1に関して検索を行なうが、これは既に上で示した手順と同じであるので省略する。次に検索部42は、シーン2について検索を行なう。検索部42は、シーン2では参加者の代わりに機器を含むが、これもデータの表現上は位置情報と状態で表されており、シーン1同様の検索手順で検索する。つまり、検索部42は、はじめに、社員Eとホワイトボードを含む会議を検索し、該当する会議の動作状態について、社員Eの隣接ブロックにホワイトボードが存在する時間を検索する。
【0040】
図14(a)は、シーン1の検索結果、同図(b)はシーン2の検索結果をそれぞれ示す図である。検索部42は、それぞれのシーンの検索結果の該当時間の共通部分をとる(図6のステップS400)。検索部42は、この場合、会議ID0124がシーン2の結果に含まれないので削除する。図15は、シーン1とシーン2の共通部分の検索結果の例を示す図である。検索部42は、ID0123の会議において、両方のシーンにおいて検索されている時間を抽出する。ここでは会議開始後3秒からしばらく続き、288秒までがシーン1およびシーン2を含む時間帯となる。検索部42は、得られた検索結果を結果表示部44に送る。結果表示部44は、検索部42から検索結果を受け取り、GUI上に検索結果を表示する(図ステップ6の500)。
【0041】
図16は、結果表示部44が提供するGUI460を示す図である。結果表示部44は、表示例としては上述したようにタイムライン461を用意し検索された時間帯に対してタイムライン461の太さを変えて表示する。結果表示部44は、タイムライン461の先頭の時間のシーンをビデオデータから抽出しサムネイル化し、時間情報462とともにサムネイル463をタイムライン443上に表示する。ユーザがマウス等を操作してサムネイル463をクリックすることにより、結果表示部45はクリックされたサムネイル463の時間および会議IDを検索部42に渡す。検索部42は、会議IDからその会議のビデオを求め、検索部42は、サムネイルの時間からビデオプレーヤーを立ちあげて再生する。本実施形態によれば、会議室のレイアウト図を利用せず、人や物の位置関係で映像を絞り込むことができる。とくに自分の周りにいた人物や物、メインスピーカの周りにいた人物や物などをキーとして映像中のシーンを検索することができる。
【0042】
次に、本発明の第2実施形態について説明する。第2実施形態では、参加者同士または機器の近接する位置についてだけではなく、参加者の発話状態、機器の電源状態について指定し検索することが出来る場合の例である。図17は、クエリ受付部41が提供するGUI510を示す図である。ユーザは自分(社員C)および、すぐ隣に社員Aがいて、何か大事なことをしゃべっていたことを想い出したいとする。クエリ受付部41は、ユーザがマウス等によりシーン追加ボタン421を押下するのを監視し、シーンエリア424を作成する。ユーザは社員Cと社員Aのアイコンをシーンエリア424に配置し、社員Aをマウスでダブルクリックし発話していることを指示すると、クエリ受付部41は、社員Aに発話マーク4241を付与する。
【0043】
次に、ユーザは、社員Eがプロジェクタの近くにいて、そのプロジェクタの電源がONになっていたことを思い出し、シーン追加ボタン421を押下すると、クエリ受付部41はシーンエリア425を作成する。ユーザはマウス等を利用して社員Eとプロジェクタのアイコンをシーンエリア425に配置し、プロジェクタをダブルクリックし電源がオンであることを指示すると、クエリ受付部41は、プロジェクタには“ON”の文字4251を付与する。クエリ受付部41は、GUI510上でユーザからの変更が加えられるごとに、検索要求をGUIの状態から生成し、これを検索部42へと渡す。
上述するシーン1とシーン2が構成された直後の検索要求は以下のようになる。
・シーン1:社員A:発話、社員C
・シーン2:社員E、プロジェクタ:ON
【0044】
検索部42は、クエリ受付部41から受け取った検索要求をもとに、会議のメタデータを検索する。すでに上述した処理フロー等の違いは、検索部42は、一人目の参加者または機器についてその発話または動作状態にもとづいて、位置情報を取得する。検索部42は、取得した位置情報にもとづいて、隣接するブロックを求める。ここでは検索部42は、位置情報のみならず、その参加者または機器に動作情報が指定されている場合は、動作情報(発話または電源ON)も含めて検索を行なう。すなわち、検索部42は、シーン1の例では社員Aが発話している場合の位置情報を求める。
【0045】
検索部42は、その位置が特定できた場合、あとは同様に隣接ブロックを求める。検索部42は、ある時間に対して隣接ブロックに他の参加者や機器が指定された動作状態で含まれるか判定する(図8のステップS334)。検索部42は、
ある時間に対して隣接ブロックに他の参加者や機器が指定された動作状態で含まれる場合は、その参加者または機器の隣接ブロックを求め、既存の隣接ブロックに追加しステップS334にもどる。
【0046】
検索部42は、隣接ブロックに他の参加者や機器が含まれるか調べる場合についても、動作状態が指定されている場合はその動作状態も含めて含まれるか否かを判定する。また、動作が指定されていない場合は、実施形態1のように動作状態は問わないこととする。検索部42は、シーン1の例では、社員Aが発話しているときのある時間の位置の隣接ブロックに社員Cが動作状態を問わず存在する場合を検索する。検索部42は、シーン2についても同様に、社員Eの隣接ブロックにプロジェクタがONの状態で存在する時間帯を検索する。
【0047】
図18(a)はシーン1の検索結果、同図(b)はシーン2の検索結果を示す図である。検索部42は、それぞれのシーンの検索結果の該当時間の共通部分をとる(図6のステップS400)。この場合、検索部42は、会議ID0123がシーン2の結果に含まれないので削除する。検索部42は、ID0124の会議において、両方のシーンにおいて検索されている時間を抽出する。例えばここでは会議開始後803秒、804秒、821秒、1113秒、1754秒、1755秒、1758秒がシーン1およびシーン2に合致する時間帯となる。これらのシーンは社員Aと社員Cが近くにいて、社員Aが何かを発言しており、かつ社員Eが電源の入ったプロジェクタの近くにいるというシーンである。検索部42は、この検索結果を結果表示部44に送る。結果表示部44は、検索部42から受け取った検索結果をもとにGUI上に表示する。
【0048】
図19は、結果表示部44が提供するGUI550を示す図である。結果表示部44は、表示例としては第1実施形態と同様にタイムライン551上の該当する時間帯のタイムラインの太さを変えて表示する。また、結果表示部44は、連続した時間の先頭の時間のシーンをビデオデータから抽出しサムネイル化し時間情報552A〜552Cとともにサムネイル553A〜553Cをタイムライン551上に表示する。
【0049】
また、この例のように発話を含むようなシーンを検索する場合、細切れの多くのシーンが検索される可能性がある。このような場合、サムネイル553A〜553Cが多くなり表示が煩雑になる可能性がある。これを解決するため、結果表示部44は、たとえば、ある一定時間内に該当シーンがある場合はそれらを連続した時間と見なし表示してもよい。この例では、例えば60秒の間隔をあけずに同じシーンがある場合は前のシーンが続いていると見なす。該当時間803、804、821は該当時間803から821まで連続と見なす。該当時間1113は単独で1つのシーンとなる。該当時間1754,1755,1758は該当時間1754から1758まで連続と見なす。本実施形態によれば、参加者同士または機器の近接する位置についてだけではなく、参加者の発話状態、機器の電源状態について指定し検索することが出来る。
【0050】
次に、本発明の第3実施形態について説明する。第3の実施形態では、参加者または機器が隣接するか否かのみでなく、人物の向きを考慮して検索をすることが可能な場合の例である。
【0051】
図21は、会議DB30の会議データのデータ構造を示す図である。図2との違いは毎秒毎に各参加者の体の向きが記録されることである。例えば、以下に示す会議開始後4(0004)秒のデータについて着目すると、社員Aが会議室のX座標2、Y座標4にいて発話はしていない(0)、体の向きは南向き(S)、参加者BがX座標4、Y座標4、発話なし(0)、体の向きは西向き(W)、参加者CがX座標3、Y座標4、発話なし(0)、体の向きは南向き(S)であることを示している。
・0004,2:4:0:S、4:4:0:W、3:4:0:S、2:3:0、1:3:0、2:1:0
【0052】
ここでは体の向きの取得方法については問わない。これらの情報は自動で付与されるのが望ましいが、手動で入力しても良い。自動の場合は、会議を記録しているビデオ画像で顔の向きを認識したり、RFIDタグや長音音波センサーを椅子に設置し椅子の向きで体の向きの代替値とすることも考えられる。
【0053】
図20は、クエリ受付部41が提供するGUI610を示す図である。クエリ受付部41は、人物のうち第1の物体である社員Cに対する第2の物体である社員Aの相対的な位置を指定する手段となる位置関係指定ボタン428を検索画面上に提供すると共に、位置関係指定ボタン428の操作状況に応じて検索要求を受け付ける。この位置関係指定ボタン428により、右側、左側、前、後ろなどのように物体間の相対的な位置関係を指定できる。ユーザが振り返りたいシーンの手掛かりとして、自分(社員C)の右隣に社員Aがいたことを思い出したとする。クエリ受付部41は、ユーザがマウス等によりシーン追加ボタン421を押下したことを検出し、シーンエリア426を生成する。ユーザが社員Cと社員Aのアイコンをシーンエリア426に配置し、社員C、右ボタン、社員Aの順でマウスでクリックをすると、クエリ受付部41は、社員Cから社員Aへの矢印427を表示する。これは社員Cの右隣に社員Aがいるということを示す。クエリ受付部41は、GUI610上でユーザからの変更が加えられるごとに、検索要求をGUIの状態から生成し、これを検索部42へと渡す。
【0054】
上述するシーン1が構成された直後の検索要求は以下のようになる。
・シーン1:社員C:右:社員A
検索部42は、クエリ受付部41から受け取った検索要求をもとに、会議DB30内のメタデータを検索する。
【0055】
ここで、検索部42は、ある時間に対して隣接ブロックに他の参加者が含まれるか判定する(図8のステップS334)。検索部42は、このとき隣接判定とともに、前後左右の位置関係の判定も行なう。この場合、まず、検索部42は、社員Cの隣接ブロックを求め同時に社員Cの向きを求める。たとえば0004秒の時点でX=3、Y=4の位置にいて、向きは南(S)向きである。次に検索部42は、社員Cの右隣の位置を求める。この時、東西南北と部屋を分割する矩形の向きは以下のようになっているとする。図22は、参加者の隣接ブロックを示す図である。この場合、社員Cは(3,4)において南を向いているので、右隣は(2,4)になる。
【0056】
検索部42は、(2,4)に社員Aが含まれる時間帯を検索する。検索部42は、(2,4)に社員Aが含まれる場合はさらに社員Aの隣接ブロックを求め、前後左右の位置関係が指定されている場合は、他の参加者についてもどの矩形に納まるべきかを計算し、すべて参加者が指定された位置と向きに納まる時間帯を検索する。この場合、検索部42は、社員Cの右隣に社員Aがいる時間帯を調べる。社員Cの右隣に社員Aがいる時間帯は結果として図23のようになったとする。検索部42は、この検索結果を結果表示部44に送る。結果表示部44は検索結果を受け取り、GUI上に表示する。
【0057】
図24は、結果表示部44が提供するGUI650を示す図である。結果表示部44は、表示例としては上記実施形態のようにタイムライン651上の該当する時間帯のタイムラインの太さを変えて表示する。結果表示部44は、また連続した時間の先頭の時間のシーンをビデオデータから抽出しサムネイル化し時間情報652A、652Bとともにタイムライン651上にサムネイル653A、653Bを表示する。第3の実施形態によれば、参加者または機器が隣接するか否かのみでなく、人物の向きを考慮して検索をすることができる。
【0058】
なお、本実施形態では、人の向きとして、東西南北の4方向のみの分類であったが、北東、北西、南東、南西を加えて8方向を想定し分類しても良い。北東、北西、南東、南西を向いている場合の前後左右となる矩形は、基本となる矩形の右上、右下、左上、左下を割り当てればよい。
【0059】
上記各実施形態によれば、部分的なシーンの組み合わせで、それを含むシーンを検索することにより、部屋のレイアウトを憶えていなくてもシーンを検索することができる。部分的なシーンとしては、参加者同士、参加者と機器、機器同士が近接している場合、また参加者の発話状態、機器の電源状態を含む。また、複数のシーンを指定した場合、それらを共通に含む(AND検索)会議の時間を取得したが(図6のステップS400)、別の例として、複数のシーンのいずれかを含む(OR検索)会議の時間を取得しても良い。
【0060】
会議DB30および情報処理部40をたとえばそれぞれサーバにより構成し、情報処理部40がネットワークに接続されたクライアント端末へ上述した処理を提供するようにしてもよい。また、上記では検索表示部44が、ディスプレイ装置上に検索結果を表示する例について説明したが、プリンタから印刷するなどして検索結果を出力するようにしてもよい。また、上記実施形態では、撮像手段により撮像する空間として会議室を例にとって説明したが本発明はこれに限定されることなく、撮像手段により撮像できる空間であればどのような空間であってもよい。また、上記実施形態では、物体の例として会議室に登場する場合の例について説明したが本発明はこれに限定されることなく、空間内に存在する物体であればどのような物体であってもよい。また、上記実施形態では、映像の例として会議映像を例にとって説明したが本発明はこれに限定されることなく、撮像手段により撮像できる映像であればどのような映像であってもよい。
【0061】
なお、本発明による情報処理方法は、情報処理部40によって実現されている。情報処理部40は、例えば、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)等を用いて構成され、CPUが所定のプログラムを実行することによって情報処理方法の各ステップが実現される。
【0062】
以上本発明の好ましい実施形態について詳述したが、本発明は係る特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形、変更が可能である。
【図面の簡単な説明】
【0063】
【図1】本発明のシステムの全体構成を示す図である。
【図2】会議DB会議データ構造の例を示す図である。
【図3】本発明の情報処理部の構成例を示す図である。
【図4】クエリ受付部が提供するGUIを示す図である。
【図5】クエリ受付部が提供するGUIを示す図である。
【図6】情報処理部の動作処理フローチャートである。
【図7】情報処理部の検索部における検索時の処理フローチャートである。
【図8】情報処理部の検索部における隣接ブロック算出時の処理フローチャートである。
【図9】時間0000秒における社員Aの隣接ブロックを示す図である。
【図10】時間0000秒における社員Aと社員Cの隣接ブロックを示す図である。
【図11】会議IDごとに検索部が作成したリストを示す図である。
【図12】結果表示部が提供するGUIを示す図である。
【図13】クエリ受付部が提供するGUIを示す図である。
【図14】(a)は、シーン1の検索結果、(b)はシーン2の検索結果をそれぞれ示す図である。
【図15】シーン1とシーン2の共通部分の検索結果の例を示す図である。
【図16】結果表示部が提供するGUIを示す図である。
【図17】クエリ受付部が提供するGUIを示す図である。
【図18】(a)はシーン1の検索結果、(b)はシーン2の検索結果を示す図である。
【図19】結果表示部が提供するGUIを示す図である。
【図20】クエリ受付部が提供するGUIを示す図である。
【図21】会議DBの会議データのデータ構造を示す図である。
【図22】参加者の隣接ブロックを示す図である。
【図23】検索部による検索結果を示す図である。
【図24】結果表示部が提供するGUIを示す図である。
【符号の説明】
【0064】
1 情報処理システム
10 会議記録装置
11 文書管理装置
12 人物位置特定装置
13 機器位置特定装置
14 話者認識装置
15 機器動作特定装置
16 映像記録装置
20 情報管理装置
30 会議DB
40 情報処理部
41 クエリ受付部
42 検索部
43 メンバーオブジェクト情報DB
44 表示結果部

【特許請求の範囲】
【請求項1】
撮像手段により所定の空間を撮像したときの映像情報の各シーンを該空間内に存在する物体の位置情報に関連付けて記憶する記憶部と、
前記物体を指示する情報を検索要求として受け付ける受付部と、
前記検索要求に基づいて前記記憶部内の映像情報から前記物体が所定の位置に存在するシーンを検索する検索部とを具備することを特徴とする情報処理システム。
【請求項2】
前記物体は、前記空間内に存在する人物、機器及び設備のうちの少なくとも一つである請求項1に記載の情報処理システム。
【請求項3】
前記記憶部は、前記物体の識別子、前記空間の識別子、前記物体が人物である場合の該人物の発話状況、前記物体が機器である場合の該機器の動作状況の少なくとも一つを付加情報として前記映像情報に関連付けて記憶し、
前記受付部は、前記付加情報を前記検索要求として受け付け、
前記検索部は、前記記憶部内の映像情報から前記検索要求に該当するシーンを検索することを特徴とする請求項1に記載の情報処理システム。
【請求項4】
前記記憶部は、前記付加情報を前記映像情報のシーンごとに記憶することを特徴とする請求項1に記載の情報処理システム。
【請求項5】
前記受付部は、前記付加情報を指定する手段を検索画面上に提供すると共に、該付加情報を指定する手段の操作に応じて前記検索要求を受け付けることを特徴とする請求項3に記載の情報処理システム。
【請求項6】
前記受付部は、前記付加情報を指定する手段を検索画面上に提供すると共に、前記付加情報を指定する手段を所定の領域に配置する形式で前記検索要求を受け付けることを特徴とする請求項1に記載の情報処理システム。
【請求項7】
前記受付部は、前記物体のうち第1の物体に対する第2の物体の相対的な位置を指定する手段を検索画面上に提供すると共に、該第2の物体の相対的な位置を指定する手段の操作状況に応じて前記検索要求を受け付けることを特徴とする請求項1に記載の情報処理システム。
【請求項8】
前記検索部による検索結果を表示する表示部をさらに具備することを特徴とする請求項1に記載の情報処理システム。
【請求項9】
前記映像情報のうち前記検索部により検索されたシーンの箇所を識別可能に表示する表示部をさらに具備することを特徴とする請求項1に記載の情報処理システム。
【請求項10】
前記検索部により検索されたシーンの縮小画像を生成し該縮小画像を表示する表示部をさらに具備することを特徴とする請求項1に記載の情報処理システム。
【請求項11】
物体を指示する情報を検索要求として受け付けるステップと、
前記検索要求に基づいて撮像手段により所定の空間を撮像したときの映像情報の各シーンを該空間内に存在する物体の位置情報に関連付けて記憶する記憶部内の映像情報から前記物体が所定の位置に存在するシーンを検索するステップとを有することを特徴とする情報処理方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22】
image rotate

【図23】
image rotate

【図24】
image rotate


【公開番号】特開2007−52564(P2007−52564A)
【公開日】平成19年3月1日(2007.3.1)
【国際特許分類】
【出願番号】特願2005−236175(P2005−236175)
【出願日】平成17年8月16日(2005.8.16)
【出願人】(000005496)富士ゼロックス株式会社 (21,908)
【Fターム(参考)】