説明

ポインタ領域検出装置、方法及びプログラム、画像の対応付け装置、方法及びプログラム、並びにコンテンツ配信サーバ、コンテンツ配信方法

ビデオフレームの画像中に撮像されているOHP画像において、OHP画像の所定箇所を指示している光学ポインタの領域を検出するポインタ領域検出部114と、前記ビデオフレームの画像中に撮像されているOHP画像と前記OHP画像の元文書であるOHPファイルとを対応付ける画像対応付け部109と、前記ポインタ領域検出部により検出された光学ポインタの領域を前記画像対応付け部により対応付けられたOHPファイルの領域に対応付けるポインタ領域対応付け部115とを備えてなる。

【発明の詳細な説明】
【技術分野】
本発明は、OHP(Overhead Projector)を使用した講義を撮像したビデオフレームの画像において、OHP上でのポインタ位置を検出するポインタ位置検出装置、ポインタ位置検出方法、並びにポインタ位置検出プログラムに関する。また、本発明は、例えば講義などで使用されたOHPファイルと、講義などを撮影した動画像とを対応付けると共に、講義において指示されているOHPの部分をOHPファイル上に明確に表示できるようにした画像対応付け装置及び画像対応付け方法並びに画像対応付けプログラム、及びそのようにして作成されたコンテンツを配信することができるコンテンツ配信サーバに関するものである。
【背景技術】
社内教育や、一般の教育分野では、e−learningの導入が行われつつある。E−learningは、インターネットを使った遠隔地教育で、WEB画面を使って行われることが多い。E−learningの形態は多種あるが、その中で普通の講義をもっともよく再現するものとして、講義の動画像(ビデオ画像)の再生と、それに同期したOHPの拡大表示のコンテンツがある。このコンテンツを使うことで、受講者は、講師が使用するOHPの拡大表示を視認することによって、OHPの内容が容易に理解されることになる。つまり従来のコンピュータディスプレイ画面上の制約から課題であった、講師が示したOHPの場所とその内容の詳細表示が同時に可能になり、実際に講義を受講しているのとほぼ同じ環境が提供できることになる。
しかし、このシステムを実現するためには、OHPを説明する動画像と、そこに映し出されているOHPの詳細表示が時間的に同期がとれている必要がある。現在のe−learningのコンテンツ作成用のオーサリングシステムでは、この部分を手動で行っていたため、コンテンツ作成には膨大な時間がかかっている。この問題の解決のため、本発明者等は、既に「動画像元文書対応付け方式」として、動画と元文書の対応付けの自動化を提案している(特願2002−080500号)。
一方、実際の講義では、講師は、OHPの内容を順番に説明していく。つまり、音声による話の内容に従って、注目するOHP上の箇所が移動していく。上述の動画−OHP同期型のe−learningコンテンツでは、動画内のOHPの切り替わりだけを検出して、対応するOHP表示を切り替えているだけなので、1つのOHPの中で、講師が話している箇所を注目させることはできなかった。
このため、動画に同期して表示されるOHPにおいて、講師の説明箇所を表示するようにできれば、受講者はOHPにおける講師の説明箇所を容易に注目することができるが、このためには、上記コンテンツを作成するに際して動画像(ビデオフレームの画像)中から講師がOHPにおいて指示しているポインタ位置を検出しなければならない。
従来より、このようなポインタ位置の検出装置としては、例えば以下のようなものが知られている。
(1)指示棒を使うもの
(a)指示棒を使い、ビデオカメラで撮影した指示棒と指示棒の影を抽出して、ポインティング位置を獲得する方法(例えば、特許文献1参照)。
(b)先端発光型の特殊指示棒を使い、特定の波長光だけを抽出することでポインティング位置を獲得する方法(例えば、特許文献2参照)。
(2)レーザーポインタを使うもの
(a)レーザーポインタを使用し、レーザー光の点滅とビデオフレームを同期させて映像投影領域とポインティング位置を獲得する方法(例えば、特許文献3参照)。
(b)レーザーポインタを使用し、投影画像と撮影画像が全く同じ大きさになる装置を使って、投影画像と撮影画像の差分によりポインティング位置を獲得する方法(例えば、特許文献4参照)。
(c)レーザーポインタを使用し、投影画像と撮影画像が全く同じ大きさになる装置を使って、スクリーン上のポインティングマーカの座標を特定波長光、または特定周期明滅または特定偏光または投影映像と撮像映像の差分画像により獲得する方法(例えば特許文献5参照)。
(d)レーザーポインタを使用し、スクリーン上の基準マーカとポインティングマーカを赤外線ポインタで表示して、赤外線フィルタを通してその位置を獲得して、ポインティングマーカの座標を獲得する方法(例えば特許文献6参照)。
【特許文献1】 特開平8−320921号公報
【特許文献2】 特開平10−83246公報
【特許文献3】 特開平8−331667号公報
【特許文献4】 特開平9−62444号公報
【特許文献5】 特開平9−80372号公報
【特許文献6】 特開平11−85395号公報
しかしながら、(1)の指示棒を使うものは、講師が講義し難いという課題がある。また、コンテンツでは、講師の顔を中心にアップで撮影したいというニーズがあり、指示棒を使うことで顔が移動することは、この場合に好ましくない。
また、(2)のレーザーポインタを使う方法においては、以下のような理由によりコストが掛かるという問題がある。
(a)の場合、ビデオフレームに同期させて点滅をさせる特殊なレーザーポインタと、レーザーポインタの点滅同期とビデオ映像を同時にキャプチャする特殊な装置が必要となる。
(b)の場合は、ビデオ投影と撮影を同時に行う一体型の特殊な装置が必要となる。また、投影画像と撮影画像が全く同じ大きさになる装置が必要となる。
(c)の場合は、(b)の場合と同様に投影画像と撮影画像が全く同じ大きさになる装置が必要となる。
(d)の場合は、スクリーン上に赤外線で照射した基準マーカとポインティングマーカが必要で、このために特殊なレーザーポインタ、投影装置が必要となる。
つまり、上述した従来のポインタ検出技術では、1)レーザーポインタを撮影したビデオからレーザーポインタ位置を検出するために、特殊な装置、環境が必要となる。2)プロジェクタで投影した映像を撮影した映像からポインタ位置を検出し、それを元のコンテンツ内の座標に変換、または対応付けるために、特殊な装置が必要となる。3)常にプロジェクタ投影画像全体がカメラフレームに収まるように撮影すること(またはそのような装置)が条件で、プロジェクタ投影画像をズーム撮影したり、カメラを上下左右に移動してプロジェクタ投影画像の一部だけ撮影したりすることができない。
本発明は、上述した課題を解決するためになされたものであり、特殊な装置を必要とせず、パソコン、プロジェクタの投影装置と、レーザーポインタ、ビデオカメラという一般的な装置だけで撮影したビデオ画像からレーザーポインタ位置を検出することができ、もって、低コストに実現できるポインタ領域検出装置、ポインタ領域検出方法、並びにポインタ領域検出プログラムを提供することを目的とする。
また、本発明は、例えば講義などで使用されたOHPファイル(元文書)と、講義などを撮影した動画像とを対応付けると共に、講義において指示されているOHP画像の部分をOHPファイル上に明確に表示できるようにした画像対応付け装置及び画像対応付け方法並びに画像対応付けプログラムを提供するとともに、このように対応付けされた動画像とOHPファイルとをコンテンツとして配信するコンテンツ配信サーバ及びそのようなコンテンツ配信方法を提供することを目的としている。
【発明の開示】
上述した課題を解決するため、本発明は、OHP画像の所定箇所を指示している光学ポインタの領域を該OHP画像が撮像されたビデオフレームの画像において検出するポインタ領域検出装置であって、ビデオフレームの画像の各画素領域におけるRGB値を取得するRGB値取得部と、前記RGB取得部により取得されたRGB値のそれぞれを変数とする所定の式を満たす画素領域をポインタ領域候補として抽出するポインタ領域候補抽出部と、前記ポインタ領域抽出部により抽出されたポインタ領域候補のうち、所定の評価値が最も高くなる画素領域をポインタ領域と判定するポインタ領域判定部とを備えてなるものである。
ここに、前記所定の式はR≧230、且つ、3R−2G−B≧155であり、前記評価値は、3R−2G−B で与えられることを特徴とする。
また、本発明は、ビデオフレームの画像中に撮像されているOHP画像においてOHP画像の所定箇所を指示している光学ポインタの領域を検出するポインタ領域検出装置であって、ビデオフレームの画像の各画素領域におけるRGB値を取得するRGB値取得部と、前記RGB取得部により取得されたRGB値及び色相における所定の式を満たすか否かで2値画像を作成する2値画像作成部と、前記2値画像において、ラベリングを用いて複数の領域候補を抽出する領域候補抽出部と、ビデオフレームの画像における前記複数の領域候補のそれぞれが含まれる各領域において前記領域候補を除く部分を用いて背景色を求める背景色演算部と、ビデオフレームの画像における前記複数の領域候補のそれぞれが含まれる各領域において前記領域候補の部分を用いてポインタ領域候補の平均色を求めるポインタ領域候補平均色演算部と、前記背景色に対するポインタ領域候補の平均色の色分布に基づいて前記ポインタ領域候補がポインタ領域であるか否かを判定する、色情報を用いたポインタ領域判定部とを備えてなるものである。
このポインタ領域検出装置において、前記領域候補抽出部は、前記ラベリングにより得られたパターンについて外形矩形を求め、さらに外形矩形の周囲及びそれから一定距離内にある外形矩形を一つのグループとして複数のグループを作成して各グループを前記領域候補とすることを特徴とする。このポインタ領域検出装置において、前記領域候補抽出部は、さらに前記各グループを所定画素数だけ周囲に拡大してなる領域を前記領域候補とすることを特徴とする。
また、本発明のポインタ領域検出装置において、前記背景色演算部は、前記領域候補抽出部により抽出された領域における前記ビデオ画像を色ラベリングし、前記パターンの領域を除いた部分で最大面積を有するラベル領域を背景領域として、該背景領域について平均色を求めることを特徴とする。
また、本発明のポインタ領域検出装置において、前記ポインタ領域候補平均色演算部は、ビデオフレームの画像における前記複数の領域候補のそれぞれが含まれる各領域において平均色を求めると共に、前記領域候補内で平均色と一定のしきい値以内の画素をポインタ領域候補として抽出して、該ポインタ領域候補における平均色を求めてポインタ領域候補の平均色とすることを特徴とする。
また、本発明のポインタ領域検出装置において、前記ポインタ領域判定部は、前記背景色演算部により求められた背景色に対する前記ポインタ領域平均色演算部により得られた平均色の色分布と、予め記憶された前記背景色に対するレーザーポインタの色分布とが一致すると認められるか否かにより前記ポインタ領域候補がポインタ領域であるか否かを判定することを特徴とする。
さらに、本発明のポインタ領域検出装置において、各背景色毎にレーザーポインタの色分布テーブルを備えていることを特徴とする。
また、本発明は、OHP画像の所定箇所を指示している光学ポインタの領域を該OHP画像が撮像されたビデオフレームの画像において検出するポインタ領域検出装置であって、ビデオフレームの画像の各画素領域におけるRGB値を取得するRGB値取得部と、前記RGB取得部により取得されたRGB値及び色相における所定の式を満たすか否かで2値画像を作成する2値画像作成部と、前記2値画像において、ラベリングを用いて複数の領域候補を抽出する領域候補抽出部と、ビデオフレームの画像において、前記複数の領域候補のそれぞれが含まれる各領域における平均色を求める平均色演算部と、前記平均色を用いて前記各領域候補の領域内でポインタパターンの候補を抽出するポインタパターン候補抽出部と、前記ポインタパターンの包絡線を用いて楕円形状を求める楕円形状演算部と、前記楕円形状の面積と前記ポインタパターンを形成する画素の占める面積との比率に基づいて前記ポインタパターン候補がレーザポインタ領域であるか否かを判定する、形状を用いたポインタ領域判定部とを備えてなるものである。
また、本発明のポインタ領域検出装置において、前記ポインタパターン候補抽出部は、前記平均色と一定のしきい値内にある色を有する画素を含んで前記ポインタパターンとすることを特徴とする。
また、本発明のポインタ領域検出装置において、前記ポインタ領域判定部は、前記楕円形状内で、奇数ラスターと偶数ラスターを別に調べ、どちらかのラスターで求めた前記ポインタパターンを形成する画素がある比率をラスター上の総画素数と比較し、それが一定比率以上であればレーザーポインタであると判定することを特徴とする。
また、本発明は、OHP画像の所定箇所を指示している光学ポインタの領域を該OHP画像が撮像されたビデオフレームの画像において検出するポインタ領域検出方法であって、ビデオフレームの画像の各画素領域におけるRGB値を取得するRGB値取得ステップと、前記RGB取得部により取得されたRGB値のそれぞれを変数とする所定の式を満たす画素領域をポインタ領域候補として抽出するポインタ領域候補抽出ステップと、前記ポインタ領域抽出部により抽出されたポインタ領域候補のうち、所定の評価値が最も高くなる画素領域をポインタ領域と判定するポインタ領域判定ステップとを備えてなるものである。
また、本発明は、OHP画像の所定箇所を指示している光学ポインタの領域を該OHP画像が撮像されたビデオフレームの画像において検出するポインタ領域検出方法であって、ビデオフレームの画像の各画素領域におけるRGB値を取得するRGB値取得ステップと、前記RGB取得部により取得されたRGB値及び色相における所定の式を満たすか否かで2値画像を作成する2値画像作成ステップと、前記2値画像において、ラベリングを用いて複数の領域候補を抽出する領域候補抽出ステップと、ビデオフレームの画像における前記複数の領域候補のそれぞれが含まれる各領域において前記領域候補を除く部分を用いて背景色を求める背景色演算ステップと、ビデオフレームの画像における前記複数の領域候補のそれぞれが含まれる各領域において前記領域候補の部分を用いてポインタ領域候補の平均色を求めるポインタ領域候補平均色演算ステップと、前記背景色に対するポインタ領域候補の平均色の色分布に基づいて前記ポインタ領域候補がポインタ領域であるか否かを判定する色情報を用いたポインタ領域判定ステップとを備えてなるものである。
また、本発明は、OHP画像の所定箇所を指示している光学ポインタの領域を該OHP画像が撮像されたビデオフレームの画像において検出するポインタ領域検出方法であって、ビデオフレームの画像の各画素領域におけるRGB値を取得するRGB値取得ステップと、前記RGB取得部により取得されたRGB値及び色相における所定の式を満たすか否かで2値画像を作成する2値画像作成ステップと、前記2値画像において、ラベリングを用いて複数の領域候補を抽出する領域候補抽出ステップと、ビデオフレームの画像において、前記複数の領域候補のそれぞれが含まれる各領域における平均色を求める平均色演算ステップと、前記平均色を用いて前記各領域候補の領域内でポインタパターンの候補を抽出するポインタパターン候補抽出ステップと、前記ポインタパターンの包絡線を用いて楕円形状を求める楕円形状演算ステップと、前記楕円形状の面積と前記ポインタパターンを形成する画素の占める面積との比率に基づいて前記ポインタパターン候補がレーザポインタ領域であるか否かを判定する形状情報を用いたポインタ領域判定ステップとを備えてなるものである。
また、本発明は、OHP画像の所定箇所を指示している光学ポインタの領域を該OHP画像が撮像されたビデオフレームの画像において検出する処理をコンピュータに実行させるポインタ領域検出プログラムであって、ビデオフレームの画像の各画素領域におけるRGB値を取得するRGB値取得ステップと、前記RGB取得部により取得されたRGB値のそれぞれを変数とする所定の式を満たす画素領域をポインタ領域候補として抽出するポインタ領域候補抽出ステップと、前記ポインタ領域抽出部により抽出されたポインタ領域候補のうち、所定の評価値が最も高くなる画素領域をポインタ領域と判定するポインタ領域判定ステップとをコンピュータに実行させるものである。
また、本発明は、OHP画像の所定箇所を指示している光学ポインタの領域を該OHP画像が撮像されたビデオフレームの画像において検出する処理をコンピュータに実行させるポインタ領域検出プログラムであって、ビデオフレームの画像の各画素領域におけるRGB値を取得するRGB値取得ステップと、前記RGB取得部により取得されたRGB値及び色相における所定の式を満たすか否かで2値画像を作成する2値画像作成ステップと、前記2値画像において、ラベリングを用いて複数の領域候補を抽出する領域候補抽出ステップと、ビデオフレームの画像における前記複数の領域候補のそれぞれが含まれる各領域において前記領域候補を除く部分を用いて背景色を求める背景色演算ステップと、ビデオフレームの画像における前記複数の領域候補のそれぞれが含まれる各領域において前記領域候補の部分を用いてポインタ領域候補の平均色を求めるポインタ領域候補平均色演算ステップと、前記背景色に対するポインタ領域候補の平均色の色分布に基づいて前記ポインタ領域候補がポインタ領域であるか否かを判定する色情報を用いたポインタ領域判定ステップとをコンピュータに実行させるものである。
また、本発明は、OHP画像の所定箇所を指示している光学ポインタの領域を該OHP画像が撮像されたビデオフレームの画像において検出する処理をコンピュータに実行させるポインタ領域検出プログラムであって、ビデオフレームの画像の各画素領域におけるRGB値を取得するRGB値取得ステップと、前記RGB取得部により取得されたRGB値及び色相における所定の式を満たすか否かで2値画像を作成する2値画像作成ステップと、前記2値画像において、ラベリングを用いて複数の領域候補を抽出する領域候補抽出ステップと、ビデオフレームの画像において、前記複数の領域候補のそれぞれが含まれる各領域における平均色を求める平均色演算ステップと、前記平均色を用いて前記各領域候補の領域内でポインタパターンの候補を抽出するポインタパターン候補抽出ステップと、前記ポインタパターンの包絡線を用いて楕円形状を求める楕円形状演算ステップと、前記楕円形状の面積と前記ポインタパターンを形成する画素の占める面積との比率に基づいて前記ポインタパターン候補がレーザポインタ領域であるか否かを判定する形状情報を用いたポインタ領域判定ステップとをコンピュータに実行させるものである。
また、本発明に係る画像対応付け装置は、OHP画像の所定箇所を指示している光学ポインタの領域を該OHP画像が撮像されたビデオフレームの画像において検出するポインタ領域検出部と、ビデオフレームの画像中に撮像されているOHP画像と前記OHP画像の元文書であるOHPファイルとを対応付ける画像対応付け部と、前記ポインタ領域検出部により検出された光学ポインタの領域を前記画像対応付け部により対応付けられたOHPファイルの領域に対応付けるポインタ領域対応付け部とを備えてなるものである。
この画像対応付け装置において、前記ポインタ領域対応付け部は、前記ポインタ領域検出部により検出された領域に関連する領域におけるOHP画像中の文字情報と、前記OHPファイルの文字情報とに基づいて、前記ポインタ領域検出部により検出された光学ポインタの領域を前記ビデオフレームの画像中に撮像されているOHP画像の元文書であるOHPファイルの領域に対応付けることを特徴とする。
また、本発明の画像対応付け装置において、前記画像対応付け部は、ビデオフレームの番号とOHPファイルの頁番号とを対応付け、前記ポインタ領域対応付け部は、前記ポインタ領域検出部により検出された光学ポインタの領域を前記OHPファイルにおける座標として対応付けることを特徴とする。
また、本発明の画像対応付け装置において、前記ポインタ領域対応付け部は前記OHPファイルにおける前記ポインタ領域と関連する領域をハイライト表示させるように対応付けることを特徴とする。
また、本発明に係る画像対応付け方法は、OHP画像の所定箇所を指示している光学ポインタの領域を該OHP画像が撮像されたビデオフレームの画像において検出するポインタ領域検出ステップと、ビデオフレームの画像中に撮像されているOHP画像と前記OHP画像の元文書であるOHPファイルとを対応付ける画像対応付けステップと、前記ポインタ領域検出部により検出された光学ポインタの領域を前記画像対応付け部により対応付けられたOHPファイルの領域に対応付けるポインタ領域対応付けステップとを備えてなるものである。
また、本発明は、ビデオフレームとビデオフレームの画像に撮像されているOHP画像に対応するOHPファイルとを対応付ける処理をコンピュータに実行させる画像対応付けプログラムであって、ビデオフレームの画像中に撮像されているOHP画像においてOHP画像の所定箇所を指示している光学ポインタの領域を検出するポインタ領域検出ステップと、前記ビデオフレームの画像中に撮像されているOHP画像と前記OHP画像の元文書であるOHPファイルとを対応付ける画像対応付けステップと、前記ポインタ領域検出部により検出された光学ポインタの領域を前記画像対応付け部により対応付けられたOHPファイルの領域に対応付けるポインタ領域対応付けステップとをコンピュータに実行させるものである。
また、本発明に係るコンテンツ配信サーバは、ビデオ画像を記憶するビデオ画像記憶部と、該ビデオ画像に撮像されているOHP画像の元文書であるOHPファイルを記憶したOHPファイル記憶部と、前記ビデオ画像のフレーム番号と、前記ビデオ画像に撮像されているOHP画像に対応するOHPファイルの頁番号とを対応付けると共に、前記ビデオ画像に撮像されているOHP画像において示される光学ポインタの領域を前記OHPファイルの領域に対応付ける対応付け情報とを記憶した対応付け情報記憶部と、前記ビデオフレームの画像に対応付けられたOHPファイル画像と前記OHPファイルにおける光学ポインタ領域の情報とを送信するための送信部とを備えてなるものである。
また、本発明のコンテンツ配信サーバと該サーバに接続されたクライアントとの間でコンテンツ配信を行うコンテンツ配信方法であって、クライアントがコンテンツ配信サーバに対して指定コンテンツの配信を要求するコンテンツ配信要求ステップと、前記要求に対し、コンテンツ配信サーバは、各記憶部から要求に係るコンテンツを検索し、該当するビデオ画像、該ビデオ画像に対応付けられたOHPファイル、及びOHPファイル内のポインタ位置情報を送信するコンテンツ送信ステップと、クライアントにおいて、配信されたコンテンツの中からビデオデータを再生すると共に、ビデオフレームに同期したOHPファイル画像とOHPファイル画像内のポインティング位置情報を表示する表示ステップとを備えてなるものである。
【図面の簡単な説明】
第1図は、本発明の実施の形態の概念図である。
第2図は、画像対応付け・コンテンツ作成装置の機能構成図である。
第3図は、画像対応付け・コンテンツ作成装置のハードウェア構成図である。
第4図は、画像対応付け装置の対応付け処理の流れを示したフローチャートである。
第5図は、OHP領域画像抽出処理の流れを示したフローチャートである。
第6図は、文字情報により類似度を算出する類似度算出部の機能構成図である。
第7図は、第6図の類似度算出部により実行される類似度算出処理の流れを示したフローチャートである。
第8図は、文字認識処理の詳細を示したフローチャートである。
第9図は、ポインタ領域検出部の処理を示すフローチャートである。
第10図は、色情報を用いたポインタ領域の検証処理を示すフローチャートである。
第11図は、背景色(RGB)毎のレーザーポインタの色(RGB)分布を示す図である。
第12図は、形状を用いたポインタ領域の検証処理を示すフローチャートである。
第13図は、レーザーポインタの動きが速いときのレーザーポインタの画像パターンの一例を示す図である。
第14図は、レーザーポインタの動きが遅いときのレーザーポインタの画像パターンの一例を示す図である。
第15図は、動画像のポインタ領域をOHP画像に対応付ける処理を概念的に示す図であり、第15図(a)は動画像のフレーム画像を示す図である。第15図(b)はOHP画像(ビットマップ)を示す図である。
第16図は、OHP画像にハイライト表示を行った場合の一例を示す図である。
第17図は、コンテンツ配信サーバとクライアントの構成を示すブロック図である。
【発明を実施するための最良の形態】
以下、図を用いて本発明の実施の形態を詳細に説明する。
第1図は、本発明の実施の形態の概念図である。まず、レーザポイントとOHPを使った講演2をE−learningの教材として使用する場合、その講演の映像を動画(ビデオ画像)としてカメラ撮影3し、パソコン等から構成される画像対応付け・コンテンツ作成装置1に保存する。また、講演に使用したOHPのファイル4を同じ装置(画像対応付け・コンテンツ作成装置1)へ保存する。画像対応付け・コンテンツ作成装置1では、様々な画像処理技術を使用して、動画中のOHPの切り代わりタイミングを求め、元のOHPの画像が動画像のどのフレームに対応しているかを求めるとともに、そのOHPにおいて、講師が講演中に指し示した座標を求め、それらの対応表を作成する。そして、この対応表を使用して、動画とOHPの画像との同期をとり、かつ、講師が指し示す場所6をハイライト表示で再生するe−learning用のコンテンツ5を作成する。これにより従来手動で行っていた動画とOHPの各ページとの対応付けおよび、ポインティング位置情報(以下、ポインタ領域という)抽出、ハイライト表示が自動化できる。なお、以下の説明において、画像とはカラー画像を意味するものとする。
第2図は、上述した画像対応付け・コンテンツ作成装置1の機能構成の一例を示した図である。図において、画像対応付け・コンテンツ作成装置1は、画像対応付け装置1aとコンテンツ作成装置1bとにより構成される。画像対応付け装置1aは、カメラ等の撮像装置で講義等の動画像を入力する動画像入力部101と、入力された動画像をAVI(Audio Visual Interleave)形式等で記憶する動画像記憶部102と、他のコンピュータシステム等からOHPファイル(画像ファイルとそれに対応する文字情報)を入力する入力部103と、入力されたOHPファイル1頁毎に対応を付けて記憶するOHPファイル記憶部104と、動画像記憶部102に記憶された動画像からフレーム毎の画像を取得するフレーム取得部105と、フレーム画像(ビデオフレームの画像)からOHP領域を抽出するOHP領域抽出部106と、OHPファイル記憶部104に記憶されたOHPファイルを取得するOHP取得部107と、OHP領域抽出部106により抽出されたフレーム画像にあるOHP部分とOHP取得部107により取得されたOHPファイルの類似度を算出する類似度算出部108と、類似度算出部108により算出された類似度に基づいて動画像のフレームとOHPファイルの頁とを対応付ける動画/OHP対応付け処理部109aとを備える。
また、この画像対応付け・コンテンツ作成装置1は、動画/OHP対応付け部により対応付けられたフレームの画像からポインタ領域を検出するポインタ領域検出部114と、ポインタ領域検出部114により検出されたポインタ領域をOHP取得部107から取得されたOHPファイル画像上に対応付ける(フレーム画像にあるOHP画像のポインタ領域をOHPファイルの画像上に設定する)ポインタ領域対応付け処理部115と、対応付けられたOHP画像にハイライト表示を行うハイライト表示付きOHP画像作成部116と、動画/OHP対応付け処理部109による対応付け結果とポインタ領域対応付け処理部115により処理結果とに基づいて、動画像のフレームとその動画像において示された光学ポインタの領域のそれぞれをOHPファイルとそのOHPファイル上の領域とに対応付ける対応付け情報を作成する動画/OHP/ポインタ領域対応付け処理部109bと、対応付け情報をテーブルとして保存する対応付けテーブル(テーブル記憶部)110とを備えている。
また、コンテンツ作成装置1bは、コンテンツ作成部111と、コンテンツ記憶部112とから構成されている。コンテンツ作成部111は、対応付けテーブル110からフレーム画像とOHPファイル画像との対応付けを参照して、E−learning用のコンテンツを作成する。コンテンツ記憶部112はコンテンツ作成部111により作成されたコンテンツを記憶する。
なお、画像対応付け装置1a内に備えられているとして説明したハイライト表示付きOHP画像作成部116は、コンテンツ作成部111内に備えられるようにしても良い。
また、第3図は、画像対応付け・コンテンツ作成装置1のハードウェア構成の一例を示した図である。第3図において、画像対応付け・コンテンツ作成装置1は、ビデオ入力制御装置11と、CPU(Central Processing Unit)12と、メモリ13と、画像用HDD(Hard Disk Drive)15と、ファイル入出力装置14と、プログラムHDD16と、コンテンツHDD17と、対応付けテーブル(ビデオ−OHP−ポインタ位置対応付けテーブル)HDD18と、OHPファイルHDD19と、LAN(Local Aria Network)インタフェース20と、CD−ROMドライブ21と、ハイライト表示付きOHP画像HDD22とを備えている。
本実施の形態において、第2図の機能構成図に示した各機能ブロックは、第3図のプログラムHDD16に記憶されたプログラム群が画像対応付け・コンテンツ作成装置1の起動時にメモリ13上に展開された状態を示しており、CPU12により実行される。ただし、第2図の動画像入力部101或いはOHPファイル入力部103は、第3図のビデオ入力制御装置11或いはファイル入出力制御装置14とが、上記メモリ13上に展開されたプログラム群と協働して機能する。また、動画像記憶部102は画像用HDD15により構成され、OHPファイル記憶部104はOHPファイルHDD19により構成され、対応付けテーブル110は対応付けテーブルHDD18により構成され、コンテンツ記憶部112はコンテンツHDD17により構成されるものとする。なお、ハイライト表示付きOHP画像HDD22は、コンテンツとしてコンテンツHDD17内に設けられても良い。
また、上記プログラム群はプログラムHDD16でなくとも、例えば、コンピュータにより読取り可能な媒体、例えば、CD−ROMやFD、磁気ディスク、DVDディスク、光磁気ディスク、ICカード等の可搬型記憶媒体に記憶されていてもよく、また、コンピュータプログラムを保持するデータベース、或いは、他のコンピュータ並びにそのデータベースや、更に回線上の伝送媒体等からダウンロードしてメモリ13上に展開され実行されるようにしてもよく、プログラム群のインストール形態は限定されない。上述したように本実施の形態では、CD−ROMドライブ21が備えられており、可搬型記憶媒体を読み取り可能としている。また、LANインタフェース20やファイル入出力装置14により、他のコンピュータやデータベースからLAN等を介してプログラム群を容易にダウンロードできる構成となっている。
以下、フローチャートを用いて、画像対応付け装置1aの対応付け処理の流れを詳細に説明する。第4図は、対応付け処理全体の処理フローを示したフローチャートである。まず、動画像記憶部102からフレーム取得部105が動画像の最初のフレームの画像を抽出する(S1000)。OHP領域抽出部106が、抽出されたフレーム画像内でOHPの画像が映る領域(以下、OHP領域画像と呼称する)を探索して抽出する(S1001)。OHP領域抽出処理についての詳細を以下に示す。
第5図は、OHP領域画像抽出処理の流れを示したフローチャートである。まず、OHP領域抽出部106にフレーム画像のデータが入力される(S1100)。次に、フレーム画像を二値化して、フレーム画像内のエッジ抽出を行う(S1101)。続いて、抽出されたエッジに対してハフ変換を行い、直線を抽出する(S1102)。抽出された直線成分を統合して、矩形作成する(S1103)。この矩形から予め定められた所定のサイズより大きい矩形のみを抽出する(S1104)。この抽出処理で矩形が抽出されない場合には(S1105、NO)、フレームの画像全体がOHP画像の領域であると判断し、画像全体を抽出する(S1107)。矩形が抽出された場合には(S1105、YES)、抽出された中で最も大きな矩形をOHP領域画像として抽出する(S1106)。
なお、通常、OHPを用いた講義等を撮影した動画像においては、OHPの画像が最も大きな矩形となるのが一般的であるため、S1106の処理でその領域を抽出するようにしている。
OHP領域画像抽出後、初期値として最大類似度に0をセットする(第4図、S1002)。続いて、OHP取得部107がOHP画像の最初のページをOHPファイル記憶部104から抽出する(S1003)。ここで類似度算出部108が、S1003で抽出されたOHP画像の最初のページと、S1001で抽出されたフレームのOHP領域の画像とを照合して、類似度を計算する(S1004)。ここで、類似度計算について、図を用いて詳細に説明する。
第6図は、類似度計算の一例を示す類似度算出部108の機能構成図である。本手法では、文字情報を用いて類似度を算出する。また、ここでは連続する2文字が同一であるか否かを照合して類似度を算出する。図において、類似度算出部108は、画像正規化部130と、フレーム文字抽出部131と、OHP文字抽出部132と、文字照合部133と、照合結果加算部134とからなる。画像正規化部130は、フレーム画像から抽出されたOHP領域画像がOHP画像の方向と一致するよう回転処理を実行して傾きを補正する。また、OHP画像とサイズが異なる場合、拡大処理を実行して、OHP画像と同一のサイズとなるよう補正する。なお、このような正規化処理は、第5図のS1106での抽出の際に、OHP領域抽出部106が実行するようにしてもよく、特に限定されるものではない。
フレーム文字抽出部131は、第5図のS1106で抽出されたOHP領域画像から文字を認識して抽出する。OHP文字抽出部132は、OHP取得部107で取得したページの文字を抽出する。なお、本実施の形態ではOHP画像の文字情報は、既にOHPファイル記憶部104において1ページ毎の画像ファイルと、それに対応する文字情報を別々に記憶しているため、文字認識処理を行う必要なく、OHPファイル記憶部104を参照するのみで文字を抽出できる。文字照合部133は、フレーム文字抽出部131とOHP文字抽出部132から抽出された文字を照合する。照合結果加算部134は文字照合部133にて照合された結果を数値化して加算する。加算した結果が類似度となる。
第7図は、上記類似度算出部108により実行される類似度算出処理の流れを示したフローチャートである。まず、フレーム取得部105からOHP領域画像を取得し(S1300)、フレーム文字抽出部131が文字認識処理を行う(S1301)。この文字認識処理は公知の技術を用いて行われる。第8図はこの文字認識処理の詳細を示したフローチャートである。まず、得られたOHP領域画像を二値化し(S1310)、領域識別を行う(S1311)。続いて文字認識を行い(S1312)、認識結果がテキスト出力される(S1313)。
文字認識処理後、類似度の初期値を0にセットする(第7図、S1302)。次に基準文字としてフレーム文字抽出部131による認識結果の最初の文字をセットする。また、OHP画像において該セットされた基準文字に対応する位置にある文字とその隣に位置する文字を、OHP文字抽出部132により抽出する(S1303)。ここで、文字照合部133により、フレーム文字抽出部131により認識された文字列と、OHP文字抽出部132により抽出された文字列とを比較し、連続2文字が同じであるか否かを照合する。同じであれば(S1304、YES)、照合結果加算部134が類似度をインクリメントする(S1305)。同じでない場合には(S1304,NO)、類似度はインクリメントされない。続いて基準文字に隣の文字をセットし、同様に照合を行う(S1306)。S1304からS1306までの処理が文字認識処理結果の文字が終了するまで(S1307、YES)繰り返される。最終的には、照合結果加算部134により類似度が以下のように補正される(S1308)。
類似度=類似度/OHP文字数
なお、類似度算出は、文字情報を用いるほかにも画像(画素信号)情報やレイアウト情報(図、表、文字列ブロック等の領域属性とその座標情報)を用いて行っても良く、あるいはこれらを併用するようにしても良い。
上述した類似度算出部108は、あるフレームのOHP領域画像について、全てのOHP画像との類似度を算出する。具体的には、第4図において、OHP画像の最初のページの類似度が算出された後(S1004)、その類似度が最大類似度(最初の段階では0)以上であれば(S1005、YES)、最大類似度に類似度をセットし、そのOHP画像のページ番号を記録する(S1006)。この時点でOHP画像の全てのページの照合が終了していなければ(S1007、NO)、OHP画像の次ページを抽出し、S1004の類似度計算処理を繰り返す。こうしてOHP画像全てのページの照合が終了すると(S1007、YES)、次に、後で抽出されるフレーム画像におけるレーザーポインタの位置をOHPの位置に対応付けるため、各フレーム画像中の文字とOHP中の文字の対応付けを行う(S1008)。但し、本実施の形態においては、上述した類似度計算のときに生成されている文字の対応付けを利用することができるので、この処理は省略することができる。なお、OHPの文字情報が用意されていない場合は、類似度計算と別に文字の対応付けを求めることとなる。例えば、フレーム画像を文字認識して、文字コード列を獲得する。これと別にOHP画像を文字認識して同様に文字コード列を獲得して、2つの文字コード列を上から順番に一致させる。一致手法には、公知のDPマッチングなどを利用する。
次に、フレーム画像からのポインタ領域を検出(抽出)する(S1009)。このポインタ領域の抽出は、第2図に示したポインタ領域検出部114により行われる。なお、本発明のポインタ領域検出装置は、これから説明する処理をコンピュータとソフトウェアとにより実行するポインタ領域検出部により構成されているものである。ポインタ領域検出部114における処理の一つは、まず、フレーム画像を取得すると(S1401)、フレーム画像中のRGB値から例えば下のような特定の条件式を満足する点の中で、3R−2G−Bが最大の点を求めることによりポインタ領域を抽出する。
R≧230 かつ 3R−2G−B≧155 (条件式)
他の一つは、フレーム画像から第9図に示す処理を行って、第13図に示すようなポインタ領域の重心Gを求める。まず、フレーム画像を取得し(S1401)、次式(1)を満足する点を抽出して2値画像を作成する(S1402)。
R≧THR 且つ (THH1≦色相、又は、色相≦THH2) (1)
次にラベリング処理を行い外接矩形を求める(S1403)。
上記ステップで求まった矩形の周囲、あるいはそれから一定距離にあるものを同じグループとし、複数の候補領域を抽出する(S1404)。
抽出された全ての候補領域について、以下のステップS1406〜ステップS1409を行う(S1405、S1412)。
即ち、各候補領域に対して、まず色情報でのポインタ領域の検証を行い(S1406)、次に形状でのポインタ領域の検証を行う(S1407)。そして双方の検証結果が認められると、その領域をポインタ領域として記録する(S1408)。以上の処理が全ての候補領域に行われると(S1409,YES)。記録されたポインタ領域の1つが選択されて(S1410)、OHP画像中の座標計算が行われる(S1411)。なお、本実施の形態において、ポインタ領域の検証は色情報と形状情報の両方を用いて行うようにしたが、いずれか一方のみを用いても構わない。両方を用いると精度が高められるが計算処理に時間を要する。一方のみを用いた場合は精度が落ちるが計算処理の時間短縮が図れる。
ここで、上記色情報を用いたポインタ領域の検証処理について第10図を用いて説明する。これは背景色とレーザポインタ領域候補の平均色を求め、背景色と、この背景色に対するレーザーポインタ領域候補の平均色との組合せが、予め求められたそれらの組み合わせのいずれかに該当するか否かを判定することでレーザーポインタ領域であるか否かを判定する。
まず、S1404でグループ化されたグループ領域の座標を取得する(S1501)。次に背景色を求める第1処理として、カラー画像全体からグループ領域枠を拡大(グループ領域を周囲に規定画素数分だけ拡大)して切り出しカラー画像を作成する(S1502)し、色ラベリングを行う(S1503)。グループ領域内での2値画像で得られたパターン以外で最大面積のラベル領域を背景として抽出し、その平均色を求める(S1504)。次に、レーザーポインタ領域を仮定した場合のその領域の平均色を求める第2処理として、グループ領域内の2値画像部分に相当するカラー画像で平均色を作成する(S1505)。次に、グループ領域内で平均色と色差が一定しきい値以内の画素をポインタ領域として抽出し、その平均色を求める(S1506)。次に、第1処理と第2処理を合わせて、第11図に示す背景色毎のレーザーポインタ色分布表に画像から抽出したポインタ領域の色分布が一致するか否か判断し(S1507)、一致する場合はレーザポインタ領域と判定する(S1508)。一方、一致しない場合はレーザーポインタ領域であると判定しない(S1509)。
次に、上記形状情報を用いたポインタ領域の検証処理について第12図を用いて説明する。まず、グループ領域の座標を取得し(S1601)、S1404で得られたグループ領域を周囲に規定画素数分だけ拡大したものを新たなグループ領域として、そのグループ内の2値画像部分に相当するカラー画像の画素で平均色を作成する(S1602)。
次に、S1402で抽出された2値画像のパターンの内、グループ領域内にあるものに注目し、このパターンの座標と同じ座標をもつカラー画像(フレーム画像)上の点の平均色(Rm,Gm,Bm)を求める。そして、同じグループ領域内で平均色と色差が一定しきい値以内の画素をポインタパターンとして抽出する(S1603)。即ち、グループ領域内で平均色に近い色のパターンを抽出する。例えば、次式(2)を満たす画素を全て抽出する。
|Ri−Rm|+|Gi−Gm|+|Bi−Bm|<Th_dist (2)
ここで、(Ri,Gi,Bi)は、グループ領域内の画素iのRGB値Th_distは予め決めた固定しきい値である。
次に、抽出画素を全て内包する楕円包絡線を求める。即ち、パターンの包絡線に近い楕円を求める(S1604)。
例えば、レーザーポインタをスクリーンに照射して、それをビデオカメラで撮影した画像では、レーザーポインタ(あるいはカメラの)動きによって、第13図及び第14図のようなレーザーポインタパターンが観測される。第13図は、動きが速いときであり、このようになるのは、ビデオ撮影時にインターレース撮影をしているため、インターレースのスキャン時間の間にレーザーポインタが移動してしまうためである。第14図は、動きが遅いときであり、欠損部分はノイズで正しくレーザーポインタが抽出できなかった箇所である。このような場合に、第13図や第14図に示す包絡線を形成する楕円曲線を求める。
求め方は以下a)〜d)で示される。
a)グループ領域内の黒画素の座標をベクトルとみなして、全黒画素のベクトルから分散・共分散行列を作成する。
b)分散・共分散行列から固有値・固有ベクトルを求める。
c)黒画素の重心を求め、上位2つの寄与度の固有ベクトルで決まる方向を求め、重心からこの2方向の直交軸を決める。各軸上の中心=重心から標準偏差の4倍の距離の点(中心から距離a、b)を求め、この4点を通る楕円を求める。
d)楕円の軸の切片a,bを少しずつ同じ比率だけ小さくしていき、最初に黒画素に接したところで停止する。
5)楕円曲線内で、奇数ラスターと偶数ラスターを別に調べ、どちらかのラスターにおいて、S1603で求めた黒画素がある比率をラスター上の総画素数と比較し(S1605)、それが一定比率以上であればレーザーポインタであると判定し(S1606)、それ以外はレーザーポインタでないと判定する(S1607)。
次に第9図に示したS1410の記録ポインタ領域から1つを選択する処理について説明する。
1つのフレーム画像から複数のポインタ領域が記録されることがある。講演者が指し示したのは、1カ所であるので、この中から1つを選択する必要がある。複数の候補領域の中で、上の領域の検証処理の中の「グループ領域内で平均色と色差が一定しきい値以内の画素をポインタ領域として抽出」(S1506)で求めた画素数が最も多いものを正しいポインタ領域であるとして選択するものとする。
ポインタ領域が抽出されると、次に第4図におけるOHP画像上の位置抽出処理が行われる(S1010)。
フレーム画像中のレーザーポインタ位置が抽出されたら、e−Learningの表示のためにOHP画像中の対応する座標を推定して求める。これには、以下の第15図(a),第15図(b)で示すような方法を用いる。
即ち、第15図(a)に示すフレーム画像において、a)フレーム画像中のポインタの位置31を求める。次に、b)フレーム画像中でポインタ位置に近い1つ、あるいは複数の対応付けがされている文字32を選択し、ポインタ31とそれらの文字32との相対的な位置関係を計算し記録する。次に、c)このフレーム画像に対応付けられている、第15図(b)に示すOHPスライド(PPTスライド)を求め、その内部の対応付いている文字の中から、b)で記録されている文字33を選択する。そして、d)それらの文字から相対的位置関係を用いてOHPスライドのポインタ位置34を推定する。
この結果、フレーム毎の対応OHP番号、OHPスライド中のポインタ座標テーブル(表1:フレーム番号、OHP番号、OHP中のポインタ座標対応表)が生成される(S1011:第4図)。

表1において、座標値は、OHP画像の絶対座標だけでなく、表示画像の縦横長の%表示でもよい。また、座標値に示される−1は、ポインタが照射されてないことを示している。
第4図に示した対応付け処理が終了すると、コンテンツ作成装置1bにより、ポインティング情報対応e−Learning用コンテンツが作成される。以下、WBT(Web based Training)表示用画像作成処理として説明する。
このコンテンツ作成処理においては、表2の内容を表示するWBTコンテンツであるHTMLファイルを作成する。以下、その一例として、最も簡単な例を第16図を用いて説明する。
OHP画像中のポインタの座標を元に、OHP画像の中でポインタ41がある付近をハイライト表示させた画像を生成する。具体的には、OHPの該当スライドで文字列やテキストボックス、図、表などの領域42をOHPスライドであるPPTファイルから直接求め(または、OHPの画像をレイアウト解析して、ポインタ付近の領域を求め)、その領域に赤などの目立つ色で枠線を付けた画像を作成する。この画像名はOHP番号名_インデックス番号(OHP番号内で1からインクリメントされる番号)とする。但し、座標値が−1のものはハイライト表示を行わないでOHP番号名だけの画像名とする。
表1を上から順に走査して生成されるハイライト領域の座標が1つ前のものと完全に一致するものは、同じ画像名を付ける。これを上から順番に繰り返し処理していくと、以下のような表(表2:フレーム番号、OHP番号、OHP中のポインタ座標、画像名対応表)が作成できる。


表2を上から走査していき、連続する2つのエントリ(行)で、OHP番号と画像名が完全に一致する場合に、2つを統合して、以下のようなOHP番号をキーとする表3(表3:WBTコンテンツ)を作成する。

この表がe−Learning用のWBTコンテンツのHTMLファイルのコア部分である。すなわち、フレーム区間で示される間だけ、それに対応するハイライト表示された画像を表示することで、講義道がの内容と同期したレーザーポインタでの指示情報を含んだ講義OHPの詳細な画像を表示することができる。
上記の方法の他にも、フレーム毎のOHP画像上のポインタの座標値が抽出されているので、それをそのまま、表示することも可能である。例えば、あるOHP番号の画像を表3でOHP番号が同じ区間だけ表示して、その上にオーバーラップして、各フレーム毎の座標値をそのまま大きな矢印や赤丸で表示してもよい。
第17図は、上述したように作成したコンテンツを配信するためのコンテンツ配信サーバとそれを受信するクライアントを示すブロック図である。
コンテンツ配信サーバには、ビデオ−OHP−ポインタ位置対応テーブル記憶部51と、OHPファイル記憶部52と、ビデオ画像記憶部53と、ビデオ−OHP対応テーブル記憶部58と、ハイライト表示付OHP画像記憶部57とが記憶部として設けられ、コンテンツ配信要求受信部54と配信要求コンテンツ送信部55と、これらを制御するコンテンツ配信制御部56とが設けられている。
一方、クライアント60は、コンテンツ配信要求送信部61と、コンテンツ受信部62と、ビデオ再生部64と、ビデオ対応OHP/ポインタ位置取得部63と、表示部65と、これらを制御する制御部66が設けられている。
以下、これらの動作について説明する。
1)ユーザは、クライアントから指定したコンテンツの表示を指示すると、クライアントがサーバに対して指定コンテンツの配信を要求する。
2)コンテンツサーバは、記憶装置上の指定のコンテンツを検索し、該当するコンテンツを読み取り、それをクライアントに配信する。このコンテンツにはビデオ画像、それに同期付けられたOHPファイル、及びOHPファイル内のポインタ位置情報が含まれる。このOHPファイルはハイライト表示されたものを使用することができるし、そうでないものを使用することもできる。
3)クライアントは、配信されたコンテンツの中からビデオデータを再生すると共に、ビデオフレームに同期したOHP(スライド)とOHP内のポインティング位置情報を表示する。
以上に詳述した本発明の実施の形態によれば、以下のような効果を奏する。
従来のe−learningのコンテンツ作成用のオーサリングシステムでは、OHPを説明する動画像と、そこに映し出されているOHP画像表示の時間的な同期付けを自動的に行い、さらに、講師がポインティングツールのレーザーポインタを使用した場合に、説明中のOHPの中でどこを話しているのかを自動的に示すことはできなかった。これらOHP画像と動画像との同期付けを行い、さらに講師が指し示したポインタ情報を表現するためには、人が膨大な時間を掛けてこれを再現するコンテンツを作成する必要があった。本実施の形態によれば、OHPと動画像との同期付けを自動的に行うことができると共に、ポインタ情報を自動的に抽出、再現してe−Learning用のコンテンツ開発を自動化できる。
【産業上の利用の可能性】
以上に詳述したように、本発明によれば、特殊な装置を必要とせず、パソコン、プロジェクタの投影装置と、レーザーポインタ、ビデオカメラという一般的な装置だけで撮影したビデオからレーザーポインタ位置を検出することができ、もって、低コストに実現できるポインタ領域(位置)検出装置、ポインタ領域検出方法、並びにポインタ領域検出プログラムを提供することができる。また、本発明によれば、例えば講義などで使用されたOHPファイル(元文書)と、講義などを撮影した動画像とを対応付けると共に、講義において指示されているOHP画像の部分をOHPファイル上に明確に表示できるようにした画像対応付け装置及び画像対応付け方法並びに画像対応付けプログラムを提供することができるとともに、このように対応付けされた動画像とOHPファイルとをコンテンツとして配信するコンテンツ配信サーバ及びそのようなコンテンツ配信方法を提供することができるという効果を奏する。
【図1】

【図2】

【図3】

【図4】

【図5】

【図6】

【図7】

【図8】

【図9】

【図10】

【図11】

【図12】

【図13】

【図14】

【図15】

【図16】

【図17】


【特許請求の範囲】
【請求項1】
OHP画像の所定箇所を指示している光学ポインタの領域を該OHP画像が撮像されたビデオフレームの画像において検出するポインタ領域検出装置であって、
ビデオフレームの画像の各画素領域におけるRGB値を取得するRGB値取得部と、
前記RGB取得部により取得されたRGB値のそれぞれを変数とする所定の式を満たす画素領域をポインタ領域候補として抽出するポインタ領域候補抽出部と、
前記ポインタ領域抽出部により抽出されたポインタ領域候補のうち、所定の評価値が最も高くなる画素領域をポインタ領域と判定するポインタ領域判定部と
を備えてなるポインタ領域検出装置。
【請求項2】
請求の範囲第1項に記載のポインタ領域検出装置において、
前記所定の式はR≧230、且つ、3R−2G−B≧155であり、前記評価値は、3R−2G−B で与えられることを特徴とするポインタ領域検出装置。
【請求項3】
OHP画像の所定箇所を指示している光学ポインタの領域を該OHP画像が撮像されたビデオフレームの画像において検出するポインタ領域検出装置であって、
ビデオフレームの画像の各画素領域におけるRGB値を取得するRGB値取得部と、
前記RGB取得部により取得されたRGB値及び色相における所定の式を満たすか否かで2値画像を作成する2値画像作成部と、
前記2値画像において、ラベリングを用いて複数の領域候補を抽出する領域候補抽出部と、
ビデオフレームの画像における前記複数の領域候補のそれぞれが含まれる各領域において前記領域候補を除く部分を用いて背景色を求める背景色演算部と、
ビデオフレームの画像における前記複数の領域候補のそれぞれが含まれる各領域において前記領域候補の部分を用いてポインタ領域候補の平均色を求めるポインタ領域候補平均色演算部と、
前記背景色に対するポインタ領域候補の平均色の色分布に基づいて前記ポインタ領域候補がポインタ領域であるか否かを判定する、色情報を用いたポインタ領域判定部と
を備えてなるポインタ領域検出装置。
【請求項4】
請求の範囲第3項に記載のポインタ領域検出装置において、
前記領域候補抽出部は、前記ラベリングにより得られたパターンについて外形矩形を求め、さらに外形矩形の周囲及びそれから一定距離内にある外形矩形を一つのグループとして複数のグループを作成して各グループを前記領域候補とすることを特徴とするポインタ領域検出装置。
【請求項5】
請求の範囲第4項に記載のポインタ領域検出装置において、
前記領域候補抽出部は、さらに前記各グループを所定画素数だけ周囲に拡大してなる領域を前記領域候補とすることを特徴とするポインタ領域検出装置。
【請求項6】
請求の範囲第4項に記載のポインタ領域検出装置において、
前記背景色演算部は、前記領域候補抽出部により抽出された領域における前記ビデオ画像を色ラベリングし、前記パターンの領域を除いた部分で最大面積を有するラベル領域を背景領域として、該背景領域について平均色を求めることを特徴とするポインタ領域検出装置。
【請求項7】
請求の範囲第3項に記載のポインタ領域検出装置において、
前記ポインタ領域候補平均色演算部は、ビデオフレームの画像における前記複数の領域候補のそれぞれが含まれる各領域において平均色を求めると共に、前記領域候補内で平均色と一定のしきい値以内の画素をポインタ領域候補として抽出して、該ポインタ領域候補における平均色を求めてポインタ領域候補の平均色とすることを特徴とするポインタ領域検出装置。
【請求項8】
請求の範囲第3項に記載のポインタ領域検出装置において、
前記ポインタ領域判定部は、前記背景色演算部により求められた背景色に対する前記ポインタ領域平均色演算部により得られた平均色の色分布と、予め記憶された前記背景色に対するレーザーポインタの色分布とが一致すると認められるか否かにより前記ポインタ領域候補がポインタ領域であるか否かを判定することを特徴とするポインタ領域検出装置。
【請求項9】
請求の範囲第8項に記載のポインタ領域検出装置において、
各背景色毎にレーザーポインタの色分布テーブルを備えていることを特徴とするポインタ領域検出装置。
【請求項10】
OHP画像の所定箇所を指示している光学ポインタの領域を該OHP画像が撮像されたビデオフレームの画像において検出するポインタ領域検出装置であって、
ビデオフレームの画像の各画素領域におけるRGB値を取得するRGB値取得部と、
前記RGB取得部により取得されたRGB値及び色相における所定の式を満たすか否かで2値画像を作成する2値画像作成部と、
前記2値画像において、ラベリングを用いて複数の領域候補を抽出する領域候補抽出部と、
ビデオフレームの画像において、前記複数の領域候補のそれぞれが含まれる各領域における平均色を求める平均色演算部と、
前記平均色を用いて前記各領域候補の領域内でポインタパターンの候補を抽出するポインタパターン候補抽出部と、
前記ポインタパターンの包絡線を用いて楕円形状を求める楕円形状演算部と、
前記楕円形状の面積と前記ポインタパターンを形成する画素の占める面積との比率に基づいて前記ポインタパターン候補がレーザポインタ領域であるか否かを判定する、形状を用いたポインタ領域判定部と
を備えてなるポインタ領域検出装置。
【請求項11】
請求の範囲第10項に記載のポインタ領域検出装置において、
前記領域候補抽出部は、前記ラベリングにより得られたパターンについて外形矩形を求め、さらに外形矩形の周囲及びそれから一定距離内にある外形矩形を一つのグループとして複数のグループを作成して各グループを前記領域候補とすることを特徴とするポインタ領域検出装置。
【請求項12】
請求の範囲第10項に記載のポインタ領域検出装置において、
前記領域候補抽出部は、さらに前記各グループを所定画素数だけ周囲に拡大してなる領域を前記領域候補とすることを特徴とするポインタ領域検出装置。
【請求項13】
請求の範囲第10項に記載のポインタ領域検出装置において、
前記ポインタパターン候補抽出部は、前記平均色と一定のしきい値内にある色を有する画素を含んで前記ポインタパターンとすることを特徴とするポインタ領域検出装置。
【請求項14】
請求の範囲第10項に記載のポインタ領域検出装置において、
前記ポインタ領域判定部は、前記楕円形状内で、奇数ラスターと偶数ラスターを別に調べ、どちらかのラスターで求めた前記ポインタパターンを形成する画素がある比率をラスター上の総画素数と比較し、それが一定比率以上であればレーザーポインタであると判定することを特徴とするポインタ領域検出装置。
【請求項15】
OHP画像の所定箇所を指示している光学ポインタの領域を該OHP画像が撮像されたビデオフレームの画像において検出するポインタ領域検出方法であって、
ビデオフレームの画像の各画素領域におけるRGB値を取得するRGB値取得ステップと、
前記RGB取得部により取得されたRGB値のそれぞれを変数とする所定の式を満たす画素領域をポインタ領域候補として抽出するポインタ領域候補抽出ステップと、
前記ポインタ領域抽出部により抽出されたポインタ領域候補のうち、所定の評価値が最も高くなる画素領域をポインタ領域と判定するポインタ領域判定ステップと
を備えてなるポインタ領域検出方法。
【請求項16】
OHP画像の所定箇所を指示している光学ポインタの領域を該OHP画像が撮像されたビデオフレームの画像において検出するポインタ領域検出方法であって、
ビデオフレームの画像の各画素領域におけるRGB値を取得するRGB値取得ステップと、
前記RGB取得部により取得されたRGB値及び色相における所定の式を満たすか否かで2値画像を作成する2値画像作成ステップと、
前記2値画像において、ラベリングを用いて複数の領域候補を抽出する領域候補抽出ステップと、
ビデオフレームの画像における前記複数の領域候補のそれぞれが含まれる各領域において前記領域候補を除く部分を用いて背景色を求める背景色演算ステップと、
ビデオフレームの画像における前記複数の領域候補のそれぞれが含まれる各領域において前記領域候補の部分を用いてポインタ領域候補の平均色を求めるポインタ領域候補平均色演算ステップと、
前記背景色に対するポインタ領域候補の平均色の色分布に基づいて前記ポインタ領域候補がポインタ領域であるか否かを判定する色情報を用いたポインタ領域判定ステップと
を備えてなるポインタ領域検出方法。
【請求項17】
OHP画像の所定箇所を指示している光学ポインタの領域を該OHP画像が撮像されたビデオフレームの画像において検出するポインタ領域検出方法であって、
ビデオフレームの画像の各画素領域におけるRGB値を取得するRGB値取得ステップと、
前記RGB取得部により取得されたRGB値及び色相における所定の式を満たすか否かで2値画像を作成する2値画像作成ステップと、
前記2値画像において、ラベリングを用いて複数の領域候補を抽出する領域候補抽出ステップと、
ビデオフレームの画像において、前記複数の領域候補のそれぞれが含まれる各領域における平均色を求める平均色演算ステップと、
前記平均色を用いて前記各領域候補の領域内でポインタパターンの候補を抽出するポインタパターン候補抽出ステップと、
前記ポインタパターンの包絡線を用いて楕円形状を求める楕円形状演算ステップと、
前記楕円形状の面積と前記ポインタパターンを形成する画素の占める面積との比率に基づいて前記ポインタパターン候補がレーザポインタ領域であるか否かを判定する形状情報を用いたポインタ領域判定ステップと
を備えてなるポインタ領域検出方法。
【請求項18】
OHP画像の所定箇所を指示している光学ポインタの領域を該OHP画像が撮像されたビデオフレームの画像において検出する処理をコンピュータに実行させるポインタ領域検出プログラムであって、
ビデオフレームの画像の各画素領域におけるRGB値を取得するRGB値取得ステップと、
前記RGB取得部により取得されたRGB値のそれぞれを変数とする所定の式を満たす画素領域をポインタ領域候補として抽出するポインタ領域候補抽出ステップと、
前記ポインタ領域抽出部により抽出されたポインタ領域候補のうち、所定の評価値が最も高くなる画素領域をポインタ領域と判定するポインタ領域判定ステップと
をコンピュータに実行させるポインタ領域検出プログラム。
【請求項19】
OHP画像の所定箇所を指示している光学ポインタの領域を該OHP画像が撮像されたビデオフレームの画像において検出する処理をコンピュータに実行させるポインタ領域検出プログラムであって、
ビデオフレームの画像の各画素領域におけるRGB値を取得するRGB値取得ステップと、
前記RGB取得部により取得されたRGB値及び色相における所定の式を満たすか否かで2値画像を作成する2値画像作成ステップと、
前記2値画像において、ラベリングを用いて複数の領域候補を抽出する領域候補抽出ステップと、
ビデオフレームの画像における前記複数の領域候補のそれぞれが含まれる各領域において前記領域候補を除く部分を用いて背景色を求める背景色演算ステップと、
ビデオフレームの画像における前記複数の領域候補のそれぞれが含まれる各領域において前記領域候補の部分を用いてポインタ領域候補の平均色を求めるポインタ領域候補平均色演算ステップと、
前記背景色に対するポインタ領域候補の平均色の色分布に基づいて前記ポインタ領域候補がポインタ領域であるか否かを判定する色情報を用いたポインタ領域判定ステップと
をコンピュータに実行させるポインタ領域検出プログラム。
【請求項20】
OHP画像の所定箇所を指示している光学ポインタの領域を該OHP画像が撮像されたビデオフレームの画像において検出する処理をコンピュータに実行させるポインタ領域検出プログラムであって、
ビデオフレームの画像の各画素領域におけるRGB値を取得するRGB値取得ステップと、
前記RGB取得部により取得されたRGB値及び色相における所定の式を満たすか否かで2値画像を作成する2値画像作成ステップと、
前記2値画像において、ラベリングを用いて複数の領域候補を抽出する領域候補抽出ステップと、
ビデオフレームの画像において、前記複数の領域候補のそれぞれが含まれる各領域における平均色を求める平均色演算ステップと、
前記平均色を用いて前記各領域候補の領域内でポインタパターンの候補を抽出するポインタパターン候補抽出ステップと、
前記ポインタパターンの包絡線を用いて楕円形状を求める楕円形状演算ステップと、
前記楕円形状の面積と前記ポインタパターンを形成する画素の占める面積との比率に基づいて前記ポインタパターン候補がレーザポインタ領域であるか否かを判定する形状情報を用いたポインタ領域判定ステップと
をコンピュータに実行させるポインタ領域検出プログラム。
【請求項21】
OHP画像の所定箇所を指示している光学ポインタの領域を該OHP画像が撮像されたビデオフレームの画像において検出するポインタ領域検出部と、
ビデオフレームの画像中に撮像されているOHP画像と前記OHP画像の元文書であるOHPファイルとを対応付ける画像対応付け部と、
前記ポインタ領域検出部により検出された光学ポインタの領域を前記画像対応付け部により対応付けられたOHPファイルの領域に対応付けるポインタ領域対応付け部と
を備えてなる画像対応付け装置。
【請求項22】
請求の範囲第21項に記載の画像対応付け装置において、
前記ポインタ領域対応付け部は、前記ポインタ領域検出部により検出された領域に関連する領域におけるOHP画像中の文字情報と、前記OHPファイルの文字情報とに基づいて、前記ポインタ領域検出部により検出された光学ポインタの領域を前記ビデオフレームの画像中に撮像されているOHP画像の元文書であるOHPファイルの領域に対応付けることを特徴とする画像対応付け装置。
【請求項23】
請求の範囲第21項に記載の画像対応付け装置において、
前記画像対応付け部は、ビデオフレームの番号とOHPファイルの頁番号とを対応付け、前記ポインタ領域対応付け部は、前記ポインタ領域検出部により検出された光学ポインタの領域を前記OHPファイルにおける座標として対応付けることを特徴とする画像対応付け装置。
【請求項24】
請求の範囲第21項に記載の画像対応付け装置において、
前記ポインタ領域対応付け部は前記OHPファイルにおける前記ポインタ領域と関連する領域をハイライト表示させるように対応付けることを特徴とする画像対応付け装置。
【請求項25】
OHP画像の所定箇所を指示している光学ポインタの領域を該OHP画像が撮像されたビデオフレームの画像において検出するポインタ領域検出ステップと、
ビデオフレームの画像中に撮像されているOHP画像と前記OHP画像の元文書であるOHPファイルとを対応付ける画像対応付けステップと、
前記ポインタ領域検出部により検出された光学ポインタの領域を前記画像対応付け部により対応付けられたOHPファイルの領域に対応付けるポインタ領域対応付けステップと
を備えてなる画像対応付け方法。
【請求項26】
ビデオフレームとビデオフレームの画像に撮像されているOHP画像に対応するOHPファイルとを対応付ける処理をコンピュータに実行させる画像対応付けプログラムであって、
OHP画像の所定箇所を指示している光学ポインタの領域を該OHP画像が撮像されたビデオフレームの画像において検出するポインタ領域検出ステップと、
前記ビデオフレームの画像中に撮像されているOHP画像と前記OHP画像の元文書であるOHPファイルとを対応付ける画像対応付けステップと、
前記ポインタ領域検出部により検出された光学ポインタの領域を前記画像対応付け部により対応付けられたOHPファイルの領域に対応付けるポインタ領域対応付けステップと
をコンピュータに実行させる画像対応付けプログラム。
【請求項27】
ビデオ画像を記憶するビデオ画像記憶部と、
該ビデオ画像に撮像されているOHP画像の元文書であるOHPファイルを記憶したOHPファイル記憶部と、
前記ビデオ画像のフレーム番号と、前記ビデオ画像に撮像されているOHP画像に対応するOHPファイルの頁番号とを対応付けると共に、前記ビデオ画像に撮像されているOHP画像において示される光学ポインタの領域を前記OHPファイルの領域に対応付ける対応付け情報を記憶した対応付け情報記憶部と、
前記ビデオフレームの画像に対応付けられたOHPファイル画像と前記OHPファイルにおける光学ポインタ領域の情報とを送信するための送信部と
を備えてなるコンテンツ配信サーバ。
【請求項28】
請求の範囲第27項に記載のコンテンツ配信サーバと該サーバに接続されたクライアントとの間でコンテンツ配信を行うコンテンツ配信方法であって、
クライアントがコンテンツ配信サーバに対して指定コンテンツの配信を要求するコンテンツ配信要求ステップと、
前記要求に対し、コンテンツ配信サーバは、各記憶部から要求に係るコンテンツを検索し、該当するビデオ画像、該ビデオ画像に対応付けられたOHPファイル、及びOHPファイル内のポインタ位置情報を送信するコンテンツ送信ステップと、
クライアントにおいて、配信されたコンテンツの中からビデオデータを再生すると共に、ビデオフレームに同期したOHPファイル画像とOHPファイル画像内のポインティング位置情報を表示する表示ステップと
を備えてなるコンテンツ配信方法。

【国際公開番号】WO2004/081783
【国際公開日】平成16年9月23日(2004.9.23)
【発行日】平成18年6月15日(2006.6.15)
【国際特許分類】
【出願番号】特願2004−569359(P2004−569359)
【国際出願番号】PCT/JP2003/003069
【国際出願日】平成15年3月14日(2003.3.14)
【出願人】(000005223)富士通株式会社 (25,993)
【Fターム(参考)】