説明

方法、プログラム、及びコンピュータ化されたシステム

【課題】コンテンツの特定時間におけるユーザの関心領域に、自動的にフォーカスする方法を提供する。
【解決手段】キャプチャモジュールが、プレゼンタよって提供されたプレゼンテーションの少なくとも一部を取り込み、キャプチャモジュールが、プレゼンタの行為の少なくとも一部を取り込み、プレゼンテーション分析モジュールが、取り込まれたプレゼンタの行為に基づいて、プレゼンテーションにおける関心領域を分析して識別し、プレゼンテーション分析モジュールが、取り込まれたプレゼンタの行為に基づいて、プレゼンテーションの時間的パスを識別し、ビデオ作成モジュールが、識別されたプレゼンテーションにおける一連の関心領域及び識別されたプレゼンテーションの時間的パスに基づいて、識別されたプレゼンテーションにおける関心領域にフォーカスしたプレゼンテーションの時間単位コンテンツ表現を作成する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、広くは、コンテンツ(例えば、マルチメディアコンテンツ)を生成して提示する技法に関し、より具体的には、ビデオ又はその他のマルチメディア記録を自動的に生成するシステム及びそれに伴う方法であって、提示されたコンテンツにおいて、ユーザが特に関心を持ち得る部分に、特定時間自動的にフォーカスする、システム及びそれに伴う方法に関する。即ち、本発明は、このような方法、プログラム、及びコンピュータ化されたシステムに関する。
【背景技術】
【0002】
記録されたプレゼンテーション、講義、及び、例えば、スクリーンキャスト等のチュートリアルは、モバイル装置(例えば、携帯電話又はPDA)の小さな画面上では見にくい。一般的なコンピュータ画面が、少なくとも800×600ピクセルの解像度でプレゼンテーションを示すのに対し、携帯電話の一般的な画面の解像度は、たったの240×160ピクセルである。たとえ画面の解像度が高くされても(アップル(Apple)社のiPhone(登録商標)のような最近のモデルは320×480ピクセルまで向上)、携帯電話画面の実際の物理的な大きさは、携帯できる小型の装置が好まれるため、実質的に小さいままであることが多い。従って、携帯電話画面の不十分な表面面積をどのように用いて、最大の情報を効率良くユーザに伝えるか、という問題が残っている。
【0003】
これまでに、何人かの著者が、この問題に対処しようとしてきた。例えば、下記の非特許文献1において、著者たちは、写真、例えば、人々の写真、に関して算出された関心領域(Region of Interest)を示す技法を提案している。このシステムは、次に、検出された顔の周囲の写真のみを切り取って、全ての顔を順に示す。
【0004】
下記の非特許文献2において、著者たちは、PDFファイルのドキュメントレイアウトを自動的に分析して、ユーザがどの領域に関心を持つ可能性が最も高いか判定することを提案している。例えば、ページ上のある図が関連しているものとして見つけ出され、この図にフォーカスする。また、このシステムは、テキスト−音声合成を用いて、この図のキャプションを読み上げる。
【0005】
別の例では、下記の非特許文献3において、著者たちは、モバイル装置が傾きセンサを用いてドキュメントにおけるリストを連続的にナビゲートするシステムについて、ローロデックス(Rolodex)の例えを用いて説明している。しかしながら、この技法は、リストの純粋な連続的ブラウジングに限定されるため、プレゼンテーションの流れが非線形であり得るため、他のプレゼンテーションコンテキストへの適用性を制限してしまう。
【0006】
このように、既存の技法では、小型提示装置を用いて特定時点における最も関連したコンテンツをユーザに提供することに関する問題に対し、効果的な解決法をもたらすことができない。
【非特許文献1】ワン(Wang)外,「MobiPicture:モバイル装置における写真のブラウジング(browsing pictures on mobile devices)」,マルチメディアに関する第11回ACM(米国計算機学会)国際会議会報(Proceedings of the eleventh ACM international conference on Multimedia),(米国、カリフォルニア州、バークリー(Berkeley)),2003年,P.106−107
【非特許文献2】エロール(Erol)外,「ドキュメントのマルチメディアサムネイル(Multimedia thumbnails for documents)」,マルチメディアに関する第14回ACM年次国際会議会報(Proceedings of the 14th annual ACM international conference on Multimedia),(米国、カリフォルニア州、サンタバーバラ(Santa Barbara)),2006年,P.231−240
【非特許文献3】ハリソン(Harrison)外,「握って、構えて、傾けて!操作的ユーザインタフェースの探究(Squeeze Me, Hold Me, Tilt Me! An Exploration of Manipulative User Interfaces)」,CHI(コンピュータヒューマンインタラクション)'98会報(Proceedings of CHI '98),p.17−24
【発明の開示】
【発明が解決しようとする課題】
【0007】
本発明の手法は、コンテンツをユーザに提示する従来の技法に関する上記及びその他の問題のうち、1つ以上を実質的に取り除く方法及びシステムを提供する。
【課題を解決するための手段】
【0008】
本発明の第1の態様は、方法であって、a.キャプチャモジュールが、プレゼンタよって提供されたプレゼンテーションの少なくとも一部を取り込み、b.キャプチャモジュールが、プレゼンタの行為の少なくとも一部を取り込み、c.プレゼンテーション分析モジュールが、取り込まれたプレゼンタの行為に基づいて、プレゼンテーションにおける関心領域を分析して識別し、d.プレゼンテーション分析モジュールが、取り込まれたプレゼンタの行為に基づいて、プレゼンテーションの時間的パスを識別し、e.ビデオ作成モジュールが、識別されたプレゼンテーションにおける一連の関心領域及び識別されたプレゼンテーションの時間的パスに基づいて、識別されたプレゼンテーションにおける関心領域にフォーカスしたプレゼンテーションの時間単位コンテンツ表現を作成する。
【0009】
本発明の第2の態様は、第1の態様において、取り込まれたプレゼンタの行為の少なくとも一部が、プレゼンタの発言を含み、プレゼンテーション分析モジュールが、プレゼンテーションにおける関心領域を、プレゼンタの発言に対して音声認識を行うと共に取り込まれたプレゼンタが提供するプレゼンテーションの少なくとも一部を用いて識別する。
【0010】
本発明の第3の態様は、第1の態様において、モバイル装置より入力されるユーザからのコマンドの受信によって、ビデオ作成モジュールが、プレゼンテーションにおける次の識別された関心領域にフォーカスする。
【0011】
本発明の第4の態様は、第1の態様において、プレゼンテーションが、棒グラフを含み、識別されたプレゼンテーションにおける一連の関心領域が、棒グラフの先端の輪郭を辿る。
【0012】
本発明の第5の態様は、第1の態様において、プレゼンテーションが、1セットの矢印を含むチャートを含み、識別されたプレゼンテーションにおける一連の関心領域が、矢印によって示された方向を辿る。
【0013】
本発明の第6の態様は、第1の態様において、プレゼンテーションが、それぞれが1セットのいろいろな方向の矢印を有する複数の要素を含むチャートを含み、識別された一連の関心領域における関心領域が、複数の要素の各要素と関連付けられた矢印の数に基づいて順序付けられる。
【0014】
本発明の第7の態様は、第1の態様において、プレゼンテーションが、表を含み、プレゼンテーション分析モジュールが、識別された一連の関心領域中の関心領域を、タイトル及び項目に沿って表をスキミングすることにより識別する。
【0015】
本発明の第8の態様は、第1の態様において、モバイル装置が、ユーザによって用いられるモバイル装置の位置方向を検出し、プレゼンテーションの少なくとも一部を表示する、ことを更に含み、プレゼンテーション分析モジュールが、プレゼンテーションにおける一連の関心領域を、検出された位置方向に基づいて識別する。
【0016】
本発明の第9の態様は、第1の態様において、取り込まれたプレゼンタの行為の少なくとも一部が、プレゼンタの手振りを含み、プレゼンテーション分析モジュールが、プレゼンテーションにおける一連の関心領域を、取り込まれたプレゼンタの手振りに基づいて識別する。
【0017】
本発明の第10の態様は、第1の態様において、取り込まれたプレゼンタの行為の少なくとも一部が、プレゼンタの使用する指示装置の位置又は方向の指示を含み、プレゼンテーション分析モジュールが、プレゼンテーションにおける一連の関心領域を、取り込まれたプレゼンタの指示装置の位置又は方向に基づいて識別する。
【0018】
本発明の第11の態様は、第1の態様において、取り込まれたプレゼンタの行為の少なくとも一部が、プレゼンタがプレゼンテーションに付けた注釈を含み、プレゼンテーション分析モジュールが、プレゼンテーションにおける一連の関心領域を、取り込まれたプレゼンタがプレゼンテーションに付けた注釈に基づいて識別する。
【0019】
本発明の第12の態様は、プログラムであって、a.プレゼンタが提供するプレゼンテーションの少なくとも一部を取り込み、b.プレゼンタの行為の少なくとも一部を取り込み、c.取り込まれたプレゼンタの行為を用いて、プレゼンテーションにおける関心領域を分析して識別し、d.取り込まれたプレゼンタの行為を用いて、プレゼンテーションの時間的パスを識別し、e.識別されたプレゼンテーションにおける一連の関心領域及び識別されたプレゼンテーションの時間的パスに基づいて、識別されたプレゼンテーションにおける関心領域にフォーカスしたプレゼンテーションの時間単位コンテンツ表現を作成する、処理をコンピュータに実行させる。
【0020】
本発明の第13の態様は、第12の態様において、取り込まれたプレゼンタの行為の少なくとも一部が、プレゼンタが発言を含み、プレゼンテーションにおける関心領域は、プレゼンタが発言に対して音声認識を行うと共に、取り込まれたプレゼンタが提供するプレゼンテーションの少なくとも一部を用いることにより識別される。
【0021】
本発明の第14の態様は、第12の態様において、ユーザからのコマンドによって、プレゼンテーションにおける次の識別された関心領域にフォーカスすることを更に含む。
【0022】
本発明の第15の態様は、第12の態様において、プレゼンテーションが、棒グラフを含み、識別されたプレゼンテーションにおける一連の関心領域が、棒グラフの先端の輪郭を辿る。
【0023】
本発明の第16の態様は、第12の態様において、プレゼンテーションが、1セットの矢印を含むチャートを含み、識別されたプレゼンテーションにおける一連の関心領域が、矢印によって示された方向を辿る。
【0024】
本発明の第17の態様は、第12の態様において、プレゼンテーションが、それぞれが1セットのいろいろな方向の矢印を有する複数の要素を含むチャートを含み、識別された一連の関心領域中の関心領域が、複数の要素の各要素と関連付けられた矢印の数に基づいて順序付けられる。
【0025】
本発明の第18の態様は、第12の態様において、プレゼンテーションが、表を含み、識別された一連の関心領域における関心領域が、タイトル及び項目に沿って表をスキミングすることにより識別される。
【0026】
本発明の第19の態様は、第12の態様において、ユーザが用いる装置の位置方向を検出し、プレゼンテーションの少なくとも一部を表示することを更に含み、プレゼンテーションにおける一連の関心領域が、検出された位置方向に基づいて識別される。
【0027】
本発明の第20の態様は、第12の態様において、取り込まれたプレゼンタの行為の少なくとも一部が、プレゼンタの手振りを含み、プレゼンテーションにおける一連の関心領域が、取り込まれたプレゼンタの手振りに基づいて識別される。
【0028】
本発明の第21の態様は、第12の態様において、取り込まれたプレゼンタの行為の少なくとも一部が、プレゼンタの指示装置の位置又は方向を含み、プレゼンテーションにおける一連の関心領域が、取り込まれたプレゼンタの指示装置の位置又は方向に基づいて識別される。
【0029】
本発明の第22の態様は、第12の態様において、取り込まれたプレゼンタの行為の少なくとも一部が、プレゼンタがプレゼンテーションに付けた注釈を含み、プレゼンテーションにおける一連の関心領域が、取り込まれたプレゼンタがプレゼンテーションに付けた注釈に基づいて識別される。
【0030】
本発明の第23の態様は、コンピュータ化されたシステムであって、a.プレゼンタが提供するプレゼンテーションの少なくとも一部を取り込むと共に、プレゼンタの行為の少なくとも一部を取り込むように作動可能な、キャプチャモジュールと、b.取り込まれたプレゼンタの行為を用いて、プレゼンテーションにおける関心領域を分析して識別すると共に、取り込まれたプレゼンタの行為を用いて、プレゼンテーションの時間的パスを識別するように作動可能な、プレゼンテーション分析モジュールと、c.識別されたプレゼンテーションにおける一連の関心領域及び識別されたプレゼンテーションの時間的パスに基づいて、識別されたプレゼンテーションにおける関心領域にフォーカスしたプレゼンテーションの時間単位コンテンツ表現を作成するように作動可能な、ビデオ作成モジュールと、を備える。
【0031】
本発明の第24の態様は、第23の態様において、プレゼンテーションの少なくとも一部を取り込むように作動可能にキャプチャモジュールにつながれた、プロジェクタ、プレゼンタのコンピュータシステム、カメラ、及びマイクのうちの少なくとも1つを更に備える。
【0032】
本発明の第25の態様は、第23の態様において、ユーザ装置の向きに関する情報を受信するように作動可能な、ユーザ装置方向検出インタフェースを更に備える。
【発明を実施するための最良の形態】
【0033】
本発明に関する更なる態様について、一部は以下の説明で述べられ、一部は以下の説明から明らかであるか又は本発明を実施することにより分かるであろう。本発明の態様は、要素によって、並びに、様々な要素と以下の詳細な説明及び添付の特許請求の範囲で特に示された態様とを組み合わせることによって、実現及び達成され得る。
【0034】
当然のことながら、上記の記述及び下記の記述はいずれも、単なる例示及び説明であって、いかなる形においても特許請求の範囲に記載の本発明又はその適用を制限するものではない。
【0035】
以下の詳細な説明では、図面を参照するが、これらの図面において同一の機能要素は、同じ参照番号で示されている。図面は、本発明の原理に従った具体的な実施形態及び実施例を、限定目的ではなく例示目的で示している。これらの実施例は、当業者が本発明を実施することができるように詳細に説明されており、当然のことながら、他の実施例を利用してもよく、本発明の範囲及び精神を逸脱しない限り、様々な要素の構造的変更及び/又は置換を行ってもよい。従って、以下の詳細な説明は、限定された意味で解釈されない。更に、説明されているような本発明の様々な実施形態は、汎用コンピュータで作動するソフトウェアの形態で実施されてもよいし、専用ハードウェアの形態で実施されてもよいし、ソフトウェアとハードウェアとを組み合わせた形態で実施されてもよい。
【0036】
上記のように、小型装置(例えば、携帯電話)の画面は小さすぎて、一般的にはテキストを含むコンテンツ(例えば、プレゼンテーションスライド又はスクリーンショット)をきちんと描画することができないため、このような小型装置では、プレゼンテーション、チュートリアル、及びスクリーンキャストが見にくい。この問題に対処するため、本発明の一実施形態は、1)映像ストリーム、音声ストリーム、及びメタストリームを用いて、オリジナルのストリームから関心領域を自動的に識別し、2)これらの関心領域とオリジナルのメディアストリームとを同期化し、3)パン及びスキャンを用いて、ズームイン/ズームアウトする(即ち、フォーカスを移動する)ことにより、既存のメディアストリームからユーザ制御可能な動画を生成しやすくする。生成された時間単位のメディアストリームは、ユーザがシームレスに割り込んで、一時的に特定の関心領域にフォーカスすることができる。その間、オリジナルメディアストリームは、再生を続けることができる、又は、ユーザが関心領域間をジャンプするのに伴ってタイムラインをジャンプして繰り返すこともできる。
【0037】
本発明のシステムの一実施形態は、提示されたコンテンツにおいて、特定時間ユーザが特に関心を持ち得る部分に、自動的にフォーカスすることにより、ビデオ又はその他のマルチメディア記録の自動的な生成を容易にする。具体的には、本発明のシステムの一実施形態は、パン及びスキャンを2つの主な技法として用いて、以下に詳細に説明するように、メディアストリームにおける特定要素に自動的に(又は、ユーザの要求に応じて)フォーカスする。
【0038】
図1は、本発明のシステムの一例としての実施形態100及びその構成要素を示している。本発明のシステムのこの図示されている実施形態は、キャプチャモジュール101を含んでいてもよく、このキャプチャモジュール101は、様々な装置を用いて構成され(例えば、プロジェクタ102、プレゼンタのコンピュータ103、動画若しくは静止画カメラ104、及び/又はマイク105が挙げられるが、これらに限定されない)、マルチメディアプレゼンテーション及びその他のコンテンツを取り込み得る。本発明の様々な実施形態では、メディアストリームは例えば講義のビデオであって、そのフレーム中にはその前でプレゼンタが動いたり身振り手振りをしたりしている全画面表示のスライドを含んでいたり、即ち、ProjectorBoxのように、講演の模様を静止画のスライド画像とその時の音声とをシステムによってキャプチャした、例えば、jpeg画像及びmp3ファイルとを1セットにした同期化ストリームであってもよい。別の一例である設定としては、プレゼンタとルームディスプレイ上のスライドとのやりとりを検出して追跡する複数のカメラ、並びに、スライド及び音声を記録するその他のキャプチャ装置が備えられた部屋が挙げられる。このようなプレゼンテーションモードは全て、キャプチャモジュール101及びこれに関連付けられたキャプチャ装置102〜105によって取り込むことができる。
【0039】
次に、キャプチャモジュール101は、この取り込まれたプレゼンテーションスライド、取り込まれた音声、及び/又は、その他のコンテンツ109、並びに、これに関連付けられたメタデータ110を、プレゼンテーション分析モジュール106に送信する。次に、プレゼンテーション分析モジュール106は、音声と映像の特徴を用いることにより、全オリジナルプレゼンテーション中の領域であって、特定時点においてユーザに関連すると判断される領域である、同期した関心領域を、プレゼンテーションの流れという観点から見つけ出す。
【0040】
プレゼンテーション分析モジュール106によって生成された、同期化関心領域に関する情報を含む情報111は、動画又はその他の時間単位で作成されたフォーカス化マルチメディアコンテンツ112を生成する、ビデオ作成モジュール107に送られる。この動画又はその他の時間単位で作成されたフォーカス化マルチメディアコンテンツ112は、フォーカスされてきちんとユーザの関連領域と同期化されたプレゼンテーションの光景をユーザに提供すると共に、全オリジナルプレゼンテーションの、プレゼンテーションの流れの特定時点における最も関連した領域をユーザに届けるように、ユーザの小型提示装置に合わせてデザインされる。また、この動画又はその他の時間単位で作成されたフォーカス化マルチメディアコンテンツ112は、それに伴うプレゼンテーションの音声部分を含んでいてもよい。
【0041】
最後に、生成されたこの動画又はその他のフォーカス化マルチメディアコンテンツ112は、ユーザの提示装置108に提供される。このユーザの提示装置108は、モバイル装置(例えば、PDA)であってもよいし、携帯電話(例えば、アップル社のiPhone(登録商標))であってもよいし、生成された動画又はその他のフォーカス化マルチメディアコンテンツ112(それに伴う音声を含む)が効果的にユーザに提示され得る、あらゆるその他の適切な装置であってもよい。
【0042】
図2は、本発明のシステムの一実施形態(例えば、図1に示した実施形態100)の一例としての動作シーケンス200を示している。実施形態100の動作は、ステップ201において開始する。ステップ202において、プレゼンテーションが取り込まれる。ステップ203において、プレゼンテーションを行う人の行為も取り込まれる。ステップ204において、プレゼンテーション分析モジュール106が、取り込まれたプレゼンテーションを分析し、プレゼンテーションの流れの観点から特定時点において関連した関心領域を識別する。ステップ205において、プレゼンテーションのこの時間的パス(経路)が、プレゼンテーション分析モジュールによって識別される。ステップ206において、ビデオ作成モジュール107が、この分析されたプレゼンテーション、その時間的パス、及び関心領域に基づいて、動画又はその他の時間単位で作成されたフォーカス化コンテンツ112を生成し、ステップ207において、動作が終了する。上記動作シーケンスは、動画又はその他の時間単位でフォーカス化コンテンツ112をユーザのモバイル装置又はその他の提示装置に転送するステップ、及び、この転送されたメディアをユーザに提示するステップも含み得ることに留意されたい。これらのステップは、あらゆる既知の技法を用いて行われてもよいため、これらの動作を行う厳密な方法は、本発明にとって重要なものではない。従って、これらのステップは、図2に示されていない。
【0043】
初期設定により、図1に示した本発明のシステムの実施形態は、自動で動作する。つまり、システム100は、オリジナルの又はインデックスが再作成されたビデオストリームを再生するが、適切な時点で関心領域を拡大してから、スライドのフルスクリーンを示すように元に戻る。適切な場合、このシステムは、スキャンも用いて、関心領域周囲を示す。例えば、光学式文字認識(OCR:optical character recognition)を用いてスライド上において見つけられた文字が、2分30秒の時点で音声ストリームにおいて見つけられた場合、このシステムは、2分30秒の時点でこの文字をズームインして示し、この文字が見つけられた行の残りの部分をパンする。従って、本発明のシステムの一実施形態は、OCR機能を備えて、上記のような音声ストリームにおいて見つけられた文字の光学式文字認識(OCR)を行ってもよい。
【0044】
図3は、本発明のシステムの一実施形態の一例の動作結果を示している。この図3は、本発明の一実施形態により行われるスライドの自動パン及びスキャンによって、ユーザには、スライドにおける関心領域が、キャプチャ装置102〜105によって取り込まれたプレゼンタの身振り手振り、及び、プレゼンテーションの音声特性に合わせて同期化されて示される、ということを示している。例えば、同じプレゼンテーションスライド301のフォーカス部分302及び303は、プレゼンタによって行われる説明に応じて、ユーザに示される。つまり、プレゼンタがスライドの特定部分に位置する項目について説明すると、本発明のシステムは、その説明された構成要素に自動的にフォーカスを行い、スライドの適切な領域302及び303を拡大する。このような拡大を行うために、本発明のシステムの一実施形態は、プレゼンテーション音声の音声認識を用いて得られた文字と、OCRを用いて抽出されるかプレゼンテーションファイルから直接的に抽出され得る、プレゼンテーションスライドにおいて見つけ出された文字とを比較する。一致する又は十分に一致していると判断される場合、このシステムは適切なズーム動作を行う。このシステムは、プレゼンタが、プレゼンテーションにある文字そのものを用いずに、別の文字(例えば、同義語)を用いることがある、ということを考慮し得る。従って、このシステムは、同義語をチェックしてもよいし、プレゼンテーションの時間の流れにおける現時点が、プレゼンテーションにおける特定項目に関連することを示すその他のものを用いてもよい。例えば、本発明のシステムは、プレゼンタによる指示装置の指す箇所(例えば、指し棒やレーザポインタの指示位置はビデオ分析から、マウスポインタの指示位置はアプリケーションを動作させているコンピュータに接続したマウスの入力から)を検出して用いる。
【0045】
本発明の一実施形態では、ユーザは、再生中のいつでも制御可能であり、プレゼンテーションの通常のタイムラインとは関係なく、手動で次の関心領域に進むことができる。例えば、ユーザは、文字、人、写真、又は、プレゼンテーションのその他何らかの部分、に関してもっと読みたいと思う場合、装置のナビゲーションキーを押す(又は、傾きセンサを備えた装置を傾ける)ことにより、次の又は前の関心領域にジャンプすることができる。スライドに関し、関心領域は、OCRによって、或いは、その他の抽出方法(例えば、ファイル抽出方法)を用いて抽出された文字(例えば、PowerPoint(登録商標)は、PPTファイルの文字を囲んだバウンディングボックスを抽出することができる)、及び、画像を含み得る。携帯電話に関し、ナビゲーションキーは、上下左右であり、それぞれ、スライド上における前の行、次の行、前の文字、次の文字に行くようにマッピングされている。
【0046】
ユーザが手動ナビゲーションモードを開始すると、現時点でフォーカスされた点が現在選択されているフォーカスとなり、ここからユーザはナビゲーションを開始することができる。例えば、本発明のシステムの一実施形態の別の一例の動作を示す図4では、システムがプレゼンテーションスライド401における文字“Flexible”402をズームインしており、ユーザが制御して「次へ」というキーを押すと、システムは、同じスライド401における文字“Not”404が前記OCR機能を用いて見つけ出され得る次の関心領域であるため、この文字“Not”404にフォーカスする。ユーザが制御したときにシステムが特定の関心領域をズームインしない場合、そのスライド上における最初の関心領域(例えば、OCRによって見つけ出された最初の左上の文字)がフォーカスとなる。この領域を拡大することにより、つなぎ目の無い移行が行われる。
【0047】
同様に、ユーザが手動制御を終了すると、本発明のシステムの一実施形態は、ズームアウト、全景、及び、ズームインを用いて、次に示される予定となっていた関心領域にフォーカスを合わせて、自動再生に戻る。
【0048】
[グラフ、チャート、表のパン及びスキャン]
プレゼンテーションでは、グラフ、チャート、及び、表がよく用いられる。これらのオブジェクトは、プレゼンテーションキャプチャモジュール101によって、多くの異なる方法で抽出することができる。ユーザがMicrosoft社のPowerPoint(登録商標)ソフトウェアを使用している場合、これらのオブジェクトは、PowerPoint(登録商標)のアプリケーションプログラミングインタフェース(API)を介して抽出することができる。ユーザがグラフ/チャートを別のアプリケーションからのオブジェクトとして組み込んだ場合には、そのオブジェクトのデータを、Excel又はその他のActiveX(登録商標)コントロールから得ることができる。また、オブジェクトが単純な画像である場合には、画像解析法(例えば、OCR)が適用される。
【0049】
[グラフ]
図5は、棒グラフを含むプレゼンテーション501の状況における、本発明のシステムの一実施形態の別の一例の動作を示している。この図5に示されているように、棒グラフに関し、パン及びスキャンパス502〜504は、この棒グラフの先端の輪郭を辿り得る。
【0050】
[チャート]
図6は、1セットの矢印を含むプレゼンテーションチャートの状況における、本発明のシステムの一実施形態の一例の動作を示している。本発明の一実施形態は、矢印を含むチャートをパンする新しい技法を含む。矢印の形には、一方向に向かう矢印といろいろな方向に向かう矢印との2つのタイプがあり得る、ということに留意されたい。前記図6は、1セットの単一方向の矢印を含むチャートを示している。このチャートにおける矢印はそれぞれ、単一方向を示している。従って、本発明のシステムの一実施形態は、これらの矢印によって示された方向に従ってパンする(図6に示したパンウィンドウ601〜604参照)。
【0051】
図7は、1セットのいろいろな方向の矢印を含むプレゼンテーションチャートの状況における、本発明のシステムの一実施形態の一例の動作を示している。パンアニメーションは、入ってくる矢印が最も多い中央のボックス(702、705)から開始する。スライドは、この中央のボックス(702、705)から、入ってくる矢印が2つで出ていく矢印が2つの左側のボックス(701、704)へパンし、最後に、入ってくる矢印が2つで出ていく矢印が1つの右側のボックス(703、706)へパンする。このように、本発明の一実施形態は、矢印を用いることにより関心領域がチャートにおける他の要素とのつながりの数に基づいて格付けされる、チャートをパンする方法を用いる。
【0052】
[表]
図8は、4×9の欄から成るプレゼンテーション表の状況における、本発明のシステムの一実施形態の一例の動作を示している。パンアニメーションは、タイトル(801、805)から開始して、ボックス(802、806)へ水平方向に移動し、次に、このパン領域は、ボックス(804、807)へ垂直方向に移動する。最後に、このパン領域は、表の右下部分(803、808)へ移動する。つまり、本発明のシステムの一実施形態は、タイトル及び項目に沿って表をスキミングすることにより、表のチャートをパンする方法を用いる。
【0053】
[傾きセンサを用いた関心領域のナビゲーション]
本発明の別の実施形態によれば、このシステムは、ユーザ入力に対する運動センサを備えたモバイル装置及び携帯電話を用いる。例えば、NTT DoCoMo社の新しい携帯電話FOMAは、運動センサを有している(タブチ(Tabuchi),「新しい日本の携帯電話は動きを検出(New Japanese Mobile Phones Detect Motion)」,ABCニュースオンライン(ABC News online),2007年4月25日,[2007年6月19日検索],http://abcnews.go.com/Technology/wireStory?id=3078694,に記載)。また、携帯電話のカメラを用いて動きを測定することも可能であり、これは、例えば、TinyMotionシステム(ワン 外,「カメラ付き携帯電話に基づいた動作感知:インタラクション技法、アプリケーション、及び性能研究(Camera Phone Based Motion Sensing: Interaction Techniques, Applications and Performance Study)」,ACM UIST(User Interface Software and Technology) 2006,(スイス、モントルー(Montreux)),2006年10月15〜18日,に記載)において行われている。
【0054】
これらの技法を用いて、本発明のシステムは、関心領域をナビゲートする新しい方法を利用する。このインタラクション(interaction)は、非常に直観的であって、図9に示されているように、ユーザは、見たいと思う関心領域の方へ装置を傾けるだけである。具体的には、この図9は、手振りの動きを利用してパン及びスキャン動画の生成を促す、本発明のシステムの一例の実施形態を示している。この図9では、ユーザは、装置901の動きを利用して、スライド904における関心領域905〜910の再生制御を促す。本発明のシステムがフォーカスする特定の関心領域は、装置の回転位置に基づいて選択される。例えば、装置901が位置903へ時計回りに回転されると、本発明のシステムによって、右下の隅にある関心領域910にフォーカスされる。装置901が位置902へ反時計回りに回転されると、左下の隅にある関心領域908にフォーカスされる。
【0055】
モバイル装置が傾きセンサを用いてドキュメントにおけるリストを連続的にナビゲートする上記の非特許文献3でローロデックスの例えを用いて説明されたシステムとは異なり、関心領域を見つけ出す上記本発明の技法の少なくとも1つの実施形態は、非線形である、ということにも留意されたい。
【0056】
[技術的詳細−同期化された関心領域の検出]
本発明の別の実施形態では、いくつかの入力ソース、即ち、ビデオファイル(例えば、記録された講義のGoogleVidep)、pboxのようなプレゼンテーションキャプチャ装置、又は、PowerPoint(登録商標)スライドから得られた情報を用いて、関心領域を見つけ出すことができる。ビデオファイルに関し、このシステムは、フレーム差分を用いて、スライドを単位要素として検出する。従って、オリジナルビデオは、時間単位にセグメント化されて、それぞれが、代表スライドとそれに関連付けられた音声セグメントを有する。次に、このシステムは、光学式文字認識、文字を囲んだバウンディングボックス、及び動作領域(例えば、スライド又はアニメーション内で再生するビデオクリップ)を用いて、各単位(即ち、スライド)において関心領域を見つけ出す。また、音声−テキスト認識を用いることにより、いくつかの関心領域が、音声ストリームで認識された文字とリンクされる。
【0057】
pboxのような装置に関しては、入力データは、音声セグメントを伴う既にセグメント化されたスライドから成る。本実施例には、これらと同じ処理が用いられる。PowerPoint(登録商標)ファイルに関しては、このシステムは、スライドを抽出し、関心領域(例えば、文字、画像、チャート、及びメディア要素(例えば、ビデオクリップ))がもしあれば、ドキュメントオブジェクトモデルを用いて抽出する。時間情報が入手できないため、このシステムは、そのスライドに提示された情報量に基づいて、時間間隔と各スライドとを任意に関連付ける。このスライドにアニメーションが定義されている場合には、その時間が考慮される。好適な実施形態では、テキスト1行又は写真1枚がそれぞれ3秒間とされる。
【0058】
[スライドに対するプレゼンタのインタラクションの検出及び追跡]
本発明のシステムの別の実施形態では、スライドに対するプレゼンタのインタラクションを用いて、活動的な関心領域の検出とパスの算出とが促される。インタラクションとしては、手振り、レーザポインタの動き、カーソルの移動、マーク、及び注釈が挙げられるが、これらに限定されない。スライドに対する手振りは、非常によく行われるものであり、非公式試験において、1週間に5つの講義を観察したところ、4人の話者がスライドに対して身振り手振りを使い、1人の話者がレーザポインタを用いた。
【0059】
本発明のシステムの一実施形態では、ディスプレイ前におけるインタラクションを、ディスプレイのスナップショットの相違を計算することによって抽出することができる。カーソルの移動、マーク、及び注釈は、PowerPointから(登録商標)、又は、プレゼンタのコンピュータシステム103のオペレーティングシステムのAPIを用いて、より正確に得ることができる。
【0060】
図10は、手振りの動きを利用してパン及びスキャン動画の生成を促す、本発明のシステムの一例の実施形態を示している。この例では、連続画像1002〜1004において、プレゼンタは、手振りを用いて、プレゼンテーションスライド1001の要素1007〜1009をそれぞれ指し示している。本発明のシステムのこの実施形態は、プレゼンタの前記手振りを検出して、プレゼンテーションスライドの同じ関心領域1007〜1009に連続的にフォーカスすることにより、本発明のシステムのこの実施形態によって行われる前記フォーカス動作が、プレゼンテーションの時間の流れと同期化される。
【0061】
図11は、スライド上のマーク又は注釈を利用してパン及びスキャン動画の生成を促す、本発明のシステムの一例としての実施形態を示している。この実施形態では、本発明のシステムは、プレゼンテーション中にプレゼンテーションスライド1101上にプレゼンタが付ける注釈1102を検出する。このような検出に従って、前記注釈を含む関心領域1103に、本発明のシステムによってフォーカスされる。
【0062】
[関心領域間における移行]
オリジナルストリームが単位にセグメント化され、各単位において関心領域が見つけ出されると、本発明のシステムの一実施形態のビデオ作成モジュール107は、これらの単位間及び各単位内の関心領域間を移行するアニメーションを自動的に生成する。各単位は、時間間隔に対応する(例えば、1つのスライドは30秒間示される)。関心領域とタイムラインとの間におけるマッピングが可能である場合には、このマッピングを用いて、再生中の適切な時点で、ズームイン/ズームアウトパンアニメーションに直接的にフォーカスされる。
【0063】
マッピングが可能でない場合には、ズームスキャンアニメーションは、関心領域の数及び位置に合うように設定される。例えば、5行のテキストが検出され、そのセグメントの時間が30秒間である場合、アルゴリズムは、1行目の最初の文を拡大し、その行を30/5〜1秒間で走査し、2行目へ1秒間で走査し、というように最終行が示されるまで続ける。
【0064】
[自動モードと手動モードとの間における移行]
ユーザは、いつでも、あらゆる利用可能なコントローラ(例えば、装置上のボタン、傾き検出器、又はタッチスクリーン)を用いて、自動再生に割り込み、異なる関心領域に手動でジャンプすることができる。1つのモードでは、音声トラックは再生を続け、ユーザが手動ナビゲーションモードを終了すると、自動再生は、その時居たであろう場所に戻り、ズームイン/ズームアウト又は走査を用いて視覚的に移行する。
【0065】
[適用例−ビデオ講義の観賞]
次に、本発明のシステムの様々な実施形態の様々な適用例について説明する。第1の例では、ある日本の学生が電車通学をしている。彼は、オンラインVideoサイトにおいて、MySQLデータベース最適化に関する興味深い動画を見つける。彼は、本発明のシステムを用いて、インタラクションを必要とすることなく、その記録を見ることができる。即ち、このシステムは、オリジナルビデオストリームを自動的にセグメント化してスライドを示し、スライド内において、(例えば、話者の身振り手振り及び音声と同期化された)適切な時点で自動的にズームイン/ズームアウトする。システムが関心領域として見つけ出していない興味深い箇所が、スライド上に現れたとする。彼が携帯電話上の「次へ」を押すことにより、手動制御モードとなる。これにより、現在の関心領域がズームインされる。彼は、帰宅したら、この最適化法を試してみたいと思う。彼は、PCにおいて本発明のシステムの一実施形態を用いることにより、システムが自動的に見つけ出した関心領域と手動制御モードで自分が見つけ出した関心領域との両方をブラウズすることができる。
【0066】
[注釈付きPowerPoint(登録商標)の閲覧]
第2の例では、ある会社員が、コメント及び手書き注釈の付いたPowerPoint(登録商標)プレゼンテーションが添付された電子メールを受信する。このユーザは、本発明の一実施形態のシステムが、ドキュメントのページを自動的にめくっていき、関心領域(この場合には、各スライドにおける注釈が付けられた領域)をズームイン/ズームアウトすることで、PowerPoint(登録商標)の再生を歩きながら見ることができる。
【0067】
[ビデオ講義のブラウジング]
別の例では、ある学生が、来期に取る講座を探したいと思っている。彼は、Knowledge Driveによって配信されている大学のオープンコースウェアにアクセスする。彼は、本発明のシステムを用い、教師の意図(例えば、身振り手振り、注釈)及びそれに対する学生の留意(例えば、ノート取り、ブックマーク)に基づいて、評価の高いスライドをブラウズすることができる。彼が携帯電話を揺らすことにより、次から次へと動画がスキップされる。運動センサが内蔵された手動制御モードでは、携帯電話を傾けることによって、関心領域を選択することができる。
【0068】
[コンピュータシステム例]
図12は、本発明の手法の一実施形態が実施され得る、コンピュータ/サーバシステム1200の一実施形態を示すブロック図である。このシステム1200は、コンピュータ/サーバプラットフォーム1201、周辺装置1202、及びネットワーク資源1203を含む。
【0069】
コンピュータプラットフォーム1201は、その様々な部分の間にわたって情報をやりとりするデータバス1204又はその他の通信機構と、このバス1204につながれて情報を処理したりその他の計算及び制御タスクを行ったりするプロセッサ1205とを含み得る。また、このコンピュータプラットフォーム1201は、バス1204につながれて、様々な情報及びプロセッサ1205によって実行される命令を記憶する、揮発性記憶装置1206(例えば、ランダムアクセスメモリ(RAM)、又はその他の動的記憶装置)も含む。この揮発性記憶装置1206は、プロセッサ1205が命令を実行する間、一時的数値変数又はその他の中間情報を記憶するのに用いられてもよい。更に、コンピュータプラットフォーム1201は、バス1204につながれて、静的情報及びプロセッサ1205(例えば、基本入出力システム(BIOS))に対する命令並びに様々なシステム構成パラメータを記憶する、読出し専用メモリ(ROM若しくはEPROM)1207又はその他の静的記憶装置も含み得る。永続性記憶装置1208(例えば、磁気ディスク、光ディスク、又は固体フラッシュメモリ素子)が設けられてバス1204につながれており、情報及び命令を記憶する。
【0070】
コンピュータプラットフォーム1201は、バス1204を介して、ディスプレイ1209(例えば、ブラウン管(CRT)、プラズマディスプレイ、又は液晶ディスプレイ(LCD))につながれて、システム管理者又はこのコンピュータプラットフォーム1201のユーザに情報を表示してもよい。英数字キー及びその他のキーを含む入力装置1210が、バス1204につながれており、選択された情報及びコマンドをプロセッサ1205に伝達する。別のタイプのユーザ入力装置として、カーソル制御装置1211(例えば、マウス、トラックボール、又はカーソル方向キー)があり、この装置は、選択された方向情報及びコマンドをプロセッサ1205に伝達すると共に、ディスプレイ1209上におけるカーソル移動を制御する。一般的に、この入力装置は、2つの軸(即ち、第1の軸(例えば、x)及び第2の軸(例えば、y))において自由度2を有し、これにより、平面において位置を特定することができる。
【0071】
外部記憶装置1212をコンピュータプラットフォーム1201にバス1204を介して接続し、コンピュータプラットフォーム1201に追加の若しくはリムーバブルの記憶容量を提供してもよい。コンピュータシステム1200の一実施形態では、このリムーバブル外部記憶装置1212を用いて、他のコンピュータシステムとデータを交換しやすくし得る。
【0072】
本発明は、本明細書中に説明した技法を実施するための、コンピュータシステム1200の使用法に関する。一実施形態において、本発明のシステムは、コンピュータプラットフォーム1201のような装置に備えられ得る。本発明の一実施形態によれば、本明細書中に説明した技法は、コンピュータシステム1200が、プロセッサ1205に応答して、揮発性メモリ1206に収容されている1つ以上の命令のうちの1つ以上のシーケンスを実行することにより行われる。このような命令は、別のコンピュータ可読媒体(例えば、永続性記憶装置1208)から揮発性メモリ1206に読み込まれてもよい。このように揮発性メモリ1206に収容されている命令のシーケンスを実行することにより、プロセッサ1205は、本明細書中に説明した処理ステップを行う。別の実施形態では、ソフトウェア命令の代わりに又はソフトウェア命令と組み合わせて配線回路を用いて、本発明を実施してもよい。従って、本発明の実施形態は、ハードウェア回路とソフトウェアとのいずれの特定の組み合わせにも限定されない。
【0073】
本明細書中で用いる「コンピュータ可読媒体」という言葉は、実行するための命令をプロセッサ1205に提供することに関与するあらゆる媒体を指す。このコンピュータ可読媒体は、本明細書中に説明したあらゆる方法及び/又は技法を実施するための命令を保持し得る機械可読媒体の一例にすぎない。このような媒体は、多数の形態を取ってよく、例えば、不揮発性媒体、揮発性媒体、及び伝送媒体が挙げられるが、これらに限定されない。不揮発性媒体としては、光ディスク又は磁気ディスク(例えば、永続性記憶装置1208)が挙げられる。揮発性媒体としては、動的メモリ(例えば、揮発性記憶装置1206)が挙げられる。伝送媒体としては、同軸ケーブル、銅線、及び光ファイバー(例えば、データバス1204を構成するワイヤ)が挙げられる。また、伝送媒体は、電波及び赤外線データ通信中に発生するような、音波又は光波の形態を取ってもよい。
【0074】
コンピュータ可読媒体の一般的な形態としては、例えば、フロッピー(登録商標)ディスク、フレキシブルディスク、ハードディスク、磁気テープ、その他あらゆる磁気媒体、CD−ROM、その他あらゆる光媒体、パンチカード、紙テープ、孔パターンを備えたその他あらゆる物理的媒体、RAM、PROM、EPROM、フラッシュEPROM、フラッシュドライブ(登録商標)、メモリカード、その他あらゆるメモリチップ若しくはカートリッジ、これから説明する搬送波、又は、コンピュータが読み取ることのできるその他あらゆる媒体が挙げられる。
【0075】
実行する1つ以上の命令のうちの1つ以上のシーケンスをプロセッサ1205に搬送するのに、様々な形態のコンピュータ可読媒体を用いてもよい。例えば、命令は、まず、リモートコンピュータから磁気ディスクに搬送され得る。或いは、リモートコンピュータが、その動的メモリに命令をロードし、モデムを用い電話回線を介してこの命令を送信してもよい。コンピュータシステム1200内のモデムは、この電話回線上のデータを受信し、赤外線送信機を用いてこのデータを赤外線信号に変換することができる。赤外線検出器が、赤外線信号で搬送されたこのデータを受信し、適切な回路が、このデータをデータバス1204上に置くことができる。バス1204は、このデータを揮発性記憶装置1206に搬送し、プロセッサ1205は、この揮発性記憶装置1206から命令を読み出して実行する。揮発性メモリ1206によって受信されたこの命令は、任意で、プロセッサ1205が実行する前或いは実行した後に、永続性記憶装置1208に記憶されてもよい。また、この命令は、当業界では周知の様々なネットワークデータ通信プロトコルを用い、インターネットを介してコンピュータプラットフォーム1201にダウンロードされてもよい。
【0076】
コンピュータプラットフォーム1201は、データバス1204につながれたネットワークインタフェースカード1213のような通信インタフェースも含む。この通信インタフェース1213は、ローカルネットワーク1215に接続されたネットワークリンク1214につなぐ双方向データ通信をもたらす。例えば、この通信インタフェース1213は、対応するタイプの電話回線へのデータ通信接続をもたらす、総合デジタル通信網サービス(ISDN)カード又はモデムであってよい。また、別の例として、この通信インタフェース1213は、互換LANへのデータ通信接続をもたらす、ローカルエリアネットワークインタフェースカード(LANNIC)であってもよい。ネットワークの実施には、更に、周知の802.11a、802.11b、802.11g、及びブルートゥース(Bluetooth)のような、無線リンクを用いてもよい。このような実施例のいずれにおいても、通信インタフェース1213は、様々なタイプの情報を表すデジタルデータストリームを搬送する、電気信号、電磁信号、又は光信号を送受信する。
【0077】
ネットワークリンク1214は、一般的に、1つ以上のネットワークを介して、他のネットワーク資源へのデータ通信をもたらす。例えば、このネットワークリンク1214は、ローカルネットワーク1215を介して、ホストコンピュータ1216又はネットワーク記憶装置/サーバ1222に接続し得る。更に又は或いは、このネットワークリンク1214は、ゲートウェイ/ファイアウォール1217を介して、広域若しくはグローバルネットワーク(例えば、インターネット)1218に接続し得る。従って、コンピュータプラットフォーム1201は、インターネット1218上のいずれの位置にあるネットワーク資源(例えば、遠隔ネットワーク記憶装置/サーバ1219)にもアクセスすることができる。一方、コンピュータプラットフォーム1201も、ローカルエリアネットワーク1215及び/又はインターネット1218上のいずれの位置にあるクライアントによってもアクセスされ得る。ネットワーククライアント1220及び1221自体は、コンピュータプラットフォーム1201に類似したコンピュータプラットフォームに基づいて実施され得る。
【0078】
ローカルネットワーク1215及びインターネット1218はいずれも、デジタルデータストリームを搬送する電気信号、電磁信号、又は光信号を用いる。様々なネットワークを介する信号、並びに、コンピュータプラットフォーム1201とデジタルデータをやりとりするネットワークリンク1214上の及び通信インタフェース1213を介する信号は、情報を輸送する搬送波の例としての形態である。
【0079】
コンピュータプラットフォーム1201は、インターネット1218及びLAN1215並びにネットワークリンク1214及び通信インタフェース1213を含む様々なネットワークを介して、プログラムコードを含むメッセージやデータを送受信することができる。インターネットの例において、コンピュータプラットフォーム1201は、ネットワークサーバとして機能する場合、インターネット1218、ゲートウェイ/ファイアウォール1217、ローカルエリアネットワーク1215、及び通信インタフェース1213を介して、クライアント1220及び/又は1221で稼動するアプリケーションプログラムに対して要求されたコード若しくはデータを送信する。同様にして、コンピュータプラットフォーム1201は、他のネットワーク資源からコードを受信する。
【0080】
この受信コードは、受信されたら、プロセッサ1205によって実行されてもよいし、且つ/或いは、後で実行するために、永続性記憶装置1208若しくは揮発性記憶装置1206又はその他の不揮発性記憶装置に記憶されてもよい。このように、コンピュータプラットフォーム1201は、搬送波の形態でアプリケーションコードを取得し得る。
【0081】
本発明は、いずれの特定のファイアウォールシステムにも限定されない、ということに留意されたい。本発明の方策に基づいたコンテンツ処理システムは、3つのファイアウォール動作モード(具体的には、NATモード、ルートモード、透過モード)のいずれにおいて用いられてもよい。
【0082】
最後に、当然のことながら、本明細書中に説明した処理及び技法は、本質的にはいずれの特定装置にも関連せず、あらゆる適切な構成要素の組み合わせによって実施され得る。更に、本明細書中に説明した教示に従って、様々なタイプの汎用装置を用いてもよい。また、本明細書中に説明した方法ステップを行うように特殊化された装置を構成することも有益であろう。本発明を特定の例に関して説明してきたが、これらの例は、全ての点において限定ではなく例示を意図している。本発明を実施するのに、ハードウェア、ソフトウェア、及びファームウェアの多数の異なる組み合わせが適していることは、当業者には認められるであろう。例えば、本明細書中に説明したソフトウェアは、多種多様なプログラミング若しくはスクリプト言語(例えば、アセンブラ、C/C++、パール、シェル、PHP、Java(登録商標)など)で実施され得る。
【0083】
更に、本明細書を考察してここに開示した本発明を実施することにより、当業者には、本発明の他の実施例が明らかとなるであろう。このデータ複製機能を備えたコンピュータ記憶システムには、ここに説明した実施形態の様々な態様及び/又は構成要素を単独で或いはあらゆる組み合わせで用いてもよい。本明細書及びここに挙げた実施例は、単なる例と見なすことが意図されており、本発明の真の範囲及び精神は、添付の特許請求の範囲により示されている。
【図面の簡単な説明】
【0084】
【図1】本発明のシステムの一例としての実施形態及びその構成要素を示す図である。
【図2】本発明のシステムの一実施形態の一例としての動作シーケンスを示すフローチャートである。
【図3】本発明のシステムの一実施形態の一例としての動作結果を示す図である。
【図4】本発明のシステムの一実施形態の別の一例としての動作結果を示す図である。
【図5】棒グラフを含むプレゼンテーションの状況における、本発明のシステムの一実施形態の更に別の一例としての動作結果を示す図である。
【図6】1セットの単一方向の矢印を含むプレゼンテーションチャートの状況における、本発明のシステムの一実施形態の一例としての動作結果を示す図である。
【図7】1セットのいろいろな方向の矢印を含むプレゼンテーションチャートの状況における、本発明のシステムの一実施形態の一例としての動作結果を示す図である。
【図8】4×9の欄から成るプレゼンテーション表の状況における、本発明のシステムの一実施形態の一例としての動作結果を示す図である。
【図9】ユーザのモバイル装置の傾きを利用してユーザの関心領域にフォーカスする、本発明のシステムの一例としての実施形態を示す図である。
【図10】手振りの動きを利用してパン及びスキャン動画の生成を促す、本発明のシステムの一例としての実施形態を示す図である。
【図11】スライド上のマーク又は注釈を利用してパン及びスキャン動画の生成を促す、本発明のシステムの一例としての実施形態を示す図である。
【図12】本発明のシステムが実施され得る、コンピュータプラットフォームの一例としての実施形態を示す図である。
【符号の説明】
【0085】
100 システム
102 プロジェクタ
103 コンピュータ
104 カメラ
105 マイク
108 提示装置
111 情報
200 動作シーケンス
301、401、501 プレゼンテーションスライド
904、1001、1101 プレゼンテーションスライド
302、303 フォーカス部分
402、404 文字
502〜504 パン及びスキャンパス
601〜604 パンウィンドウ
701〜706、801〜808 ボックス
901 モバイル装置
902、903 位置
905〜910、1007〜1009、1103 関心領域
1002〜1004 連続画像
1102 注釈
1200 コンピュータシステム
1201 コンピュータプラットフォーム
1202 周辺装置
1203 ネットワーク資源
1214 ネットワークリンク

【特許請求の範囲】
【請求項1】
a.キャプチャモジュールが、プレゼンタよって提供されたプレゼンテーションの少なくとも一部を取り込み、
b.前記キャプチャモジュールが、前記プレゼンタの行為の少なくとも一部を取り込み、
c.プレゼンテーション分析モジュールが、取り込まれた前記プレゼンタの行為に基づいて、前記プレゼンテーションにおける関心領域を分析して識別し、
d.前記プレゼンテーション分析モジュールが、取り込まれた前記プレゼンタの行為に基づいて、前記プレゼンテーションの時間的パスを識別し、
e.ビデオ作成モジュールが、識別された前記プレゼンテーションにおける一連の前記関心領域及び識別された前記プレゼンテーションの時間的パスに基づいて、識別された前記プレゼンテーションにおける関心領域にフォーカスしたプレゼンテーションの時間単位コンテンツ表現を作成する、
ことを含むことを特徴とする、方法。
【請求項2】
取り込まれた前記プレゼンタの行為の少なくとも一部が、前記プレゼンタの発言を含み、
前記プレゼンテーション分析モジュールが、前記プレゼンテーションにおける関心領域を、前記プレゼンタの発言に対して音声認識を行うと共に取り込まれた前記プレゼンタが提供するプレゼンテーションの少なくとも一部を用いて識別する、
ことを特徴とする、請求項1に記載の方法。
【請求項3】
モバイル装置より入力されるユーザからのコマンドの受信によって、前記ビデオ作成モジュールが、前記プレゼンテーションにおける次の識別された前記関心領域にフォーカスする、
ことを更に特徴とする、請求項1に記載の方法。
【請求項4】
前記プレゼンテーションが、棒グラフを含み、識別された前記プレゼンテーションにおける一連の前記関心領域が、前記棒グラフの先端の輪郭を辿る、
ことを特徴とする、請求項1に記載の方法。
【請求項5】
前記プレゼンテーションが、1セットの矢印を含むチャートを含み、識別された前記プレゼンテーションにおける一連の前記関心領域が、前記矢印によって示された方向を辿る、
ことを特徴とする、請求項1に記載の方法。
【請求項6】
前記プレゼンテーションが、それぞれが1セットのいろいろな方向の矢印を有する複数の要素を含むチャートを含み、識別された一連の前記関心領域における関心領域が、前記複数の要素の各要素と関連付けられた矢印の数に基づいて順序付けられる、
ことを特徴とする、請求項1に記載の方法。
【請求項7】
前記プレゼンテーションが、表を含み、
前記プレゼンテーション分析モジュールが、識別された一連の前記関心領域中の関心領域を、タイトル及び項目に沿って前記表をスキミングすることにより識別する、
ことを特徴とする、請求項1に記載の方法。
【請求項8】
モバイル装置が、ユーザによって用いられる前記モバイル装置の位置方向を検出し、前記プレゼンテーションの少なくとも一部を表示する、ことを更に含み、
前記プレゼンテーション分析モジュールが、前記プレゼンテーションにおける一連の前記関心領域を、検出された前記位置方向に基づいて識別する、
ことを特徴とする、請求項1に記載の方法。
【請求項9】
取り込まれた前記プレゼンタの行為の少なくとも一部が、前記プレゼンタの手振りを含み、
前記プレゼンテーション分析モジュールが、前記プレゼンテーションにおける一連の前記関心領域を、取り込まれた前記プレゼンタの手振りに基づいて識別する、ことを特徴とする、請求項1に記載の方法。
【請求項10】
取り込まれた前記プレゼンタの行為の少なくとも一部が、前記プレゼンタの使用する指示装置の位置又は方向の指示を含み、
前記プレゼンテーション分析モジュールが、前記プレゼンテーションにおける一連の関心領域を、取り込まれた前記プレゼンタの指示装置の位置又は方向に基づいて識別する、
ことを特徴とする、請求項1に記載の方法。
【請求項11】
取り込まれた前記プレゼンタの行為の少なくとも一部が、前記プレゼンタが前記プレゼンテーションに付けた注釈を含み、
前記プレゼンテーション分析モジュールが、前記プレゼンテーションにおける一連の関心領域を、取り込まれた前記プレゼンタが前記プレゼンテーションに付けた注釈に基づいて識別する、
ことを特徴とする、請求項1に記載の方法。
【請求項12】
a.プレゼンタが提供するプレゼンテーションの少なくとも一部を取り込み、
b.前記プレゼンタの行為の少なくとも一部を取り込み、
c.取り込まれた前記プレゼンタの行為を用いて、前記プレゼンテーションにおける関心領域を分析して識別し、
d.取り込まれた前記プレゼンタの行為を用いて、前記プレゼンテーションの時間的パスを識別し、
e.識別された前記プレゼンテーションにおける一連の前記関心領域及び識別された前記プレゼンテーションの時間的パスに基づいて、識別された前記プレゼンテーションにおける関心領域にフォーカスしたプレゼンテーションの時間単位コンテンツ表現を作成する、
処理をコンピュータに実行させることを特徴とするプログラム。
【請求項13】
取り込まれた前記プレゼンタの行為の少なくとも一部が、前記プレゼンタが発言を含み、
前記プレゼンテーションにおける関心領域は、前記プレゼンタが発言に対して音声認識を行うと共に、取り込まれた前記プレゼンタが提供するプレゼンテーションの少なくとも一部を用いることにより識別される、
ことを特徴とする、請求項12に記載のプログラム。
【請求項14】
ユーザからのコマンドによって、前記プレゼンテーションにおける次の識別された関心領域にフォーカスすることを更に含む、
ことを特徴とする、請求項12に記載のプログラム。
【請求項15】
前記プレゼンテーションが、棒グラフを含み、識別された前記プレゼンテーションにおける一連の関心領域が、前記棒グラフの先端の輪郭を辿る、
ことを特徴とする、請求項12に記載のプログラム。
【請求項16】
前記プレゼンテーションが、1セットの矢印を含むチャートを含み、
識別された前記プレゼンテーションにおける一連の前記関心領域が、前記矢印によって示された方向を辿る、
ことを特徴とする、請求項12に記載のプログラム。
【請求項17】
前記プレゼンテーションが、それぞれが1セットのいろいろな方向の矢印を有する複数の要素を含むチャートを含み、
識別された一連の前記関心領域中の関心領域が、前記複数の要素の各要素と関連付けられた矢印の数に基づいて順序付けられる、
ことを特徴とする、請求項12に記載のプログラム。
【請求項18】
前記プレゼンテーションが、表を含み、
識別された一連の前記関心領域における関心領域が、タイトル及び項目に沿って前記表をスキミングすることにより識別される、
ことを特徴とする、請求項12に記載のプログラム。
【請求項19】
ユーザが用いる装置の位置方向を検出し、前記プレゼンテーションの少なくとも一部を表示することを更に含み、
前記プレゼンテーションにおける一連の前記関心領域が、検出された前記位置方向に基づいて識別される、
ことを特徴とする、請求項12に記載のプログラム。
【請求項20】
取り込まれた前記プレゼンタの行為の少なくとも一部が、前記プレゼンタの手振りを含み、
前記プレゼンテーションにおける一連の前記関心領域が、取り込まれた前記プレゼンタの手振りに基づいて識別される、
ことを特徴とする、請求項12に記載のプログラム。
【請求項21】
取り込まれた前記プレゼンタの行為の少なくとも一部が、前記プレゼンタの指示装置の位置又は方向を含み、
前記プレゼンテーションにおける一連の前記関心領域が、取り込まれた前記プレゼンタの指示装置の位置又は方向に基づいて識別される、
ことを特徴とする、請求項12に記載のプログラム。
【請求項22】
取り込まれた前記プレゼンタの行為の少なくとも一部が、前記プレゼンタが前記プレゼンテーションに付けた注釈を含み、
前記プレゼンテーションにおける一連の前記関心領域が、取り込まれた前記プレゼンタが前記プレゼンテーションに付けた注釈に基づいて識別される、
ことを特徴とする、請求項12に記載のプログラム。
【請求項23】
a.プレゼンタが提供するプレゼンテーションの少なくとも一部を取り込むと共に、前記プレゼンタの行為の少なくとも一部を取り込むように作動可能な、キャプチャモジュールと、
b.取り込まれた前記プレゼンタの行為を用いて、前記プレゼンテーションにおける関心領域を分析して識別すると共に、取り込まれた前記プレゼンタの行為を用いて、前記プレゼンテーションの時間的パスを識別するように作動可能な、プレゼンテーション分析モジュールと、
c.識別された前記プレゼンテーションにおける一連の前記関心領域及び識別された前記プレゼンテーションの時間的パスに基づいて、識別された前記プレゼンテーションにおける関心領域にフォーカスしたプレゼンテーションの時間単位コンテンツ表現を作成するように作動可能な、ビデオ作成モジュールと、
を備えることを特徴とする、コンピュータ化されたシステム。
【請求項24】
プレゼンテーションの少なくとも一部を取り込むように作動可能に前記キャプチャモジュールにつながれた、プロジェクタ、前記プレゼンタのコンピュータシステム、カメラ、及びマイクのうちの少なくとも1つを更に備える、
ことを特徴とする、請求項23に記載のコンピュータ化されたシステム。
【請求項25】
ユーザ装置の向きに関する情報を受信するように作動可能な、ユーザ装置方向検出インタフェースを更に備える、
ことを特徴とする、請求項23に記載のコンピュータ化されたシステム。

【図2】
image rotate

【図12】
image rotate

【図1】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate


【公開番号】特開2009−123197(P2009−123197A)
【公開日】平成21年6月4日(2009.6.4)
【国際特許分類】
【出願番号】特願2008−266112(P2008−266112)
【出願日】平成20年10月15日(2008.10.15)
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.Bluetooth
【出願人】(000005496)富士ゼロックス株式会社 (21,908)
【Fターム(参考)】