説明

映像推薦方法、映像推薦装置、映像推薦プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体

【課題】本発明は、時々刻々と変化するユーザの興味に適合する映像を取得してユーザに提示する新たな映像推薦技術の提供を目的とする。
【解決手段】能動的な動機による映像利用場面でない場面において、ユーザ操作をモニタリングして操作ログを収集して、それを解析することでユーザが興味を持っていると推定される映像の検索に用いられる検索パラメータを設定し、それを使って映像を検索することで、ユーザが興味を持っていると推定される複数の映像を取得する。そして、能動的な動機により映像を利用する場面ではないことを考慮して、現在表示中の処理画面上に映像推薦用の提示ウィンドウを表示して、その提示ウィンドウ上に、取得した映像を一覧表示し、この一覧表示する映像に対してのユーザの注視度を測定して、その測定結果に応じて提示ウィンドウ上に表示する映像の表示形態を変更する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、時々刻々と変化するユーザの興味に適合する映像を取得してユーザに提示することを実現する映像推薦方法およびその装置と、その映像推薦方法の実現に用いられる映像推薦プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体とに関する。
【背景技術】
【0002】
個人が手軽に映像を扱うことのできる環境が整いつつあり、パーソナルコンピュータ(PC)のディスクドライブ(HDD)やWebサーバ上で扱われる映像の量が日々増加している。
【0003】
それと同時に、Web動画検索エンジンや、デスクトップツール等の一機能としての映像検索ツールが拡充されつつある。これらのエンジンやツール類により、膨大な映像の中から所望の映像を取得するために必要なコストは、近年、相対的に低くなりつつあると言える。
【0004】
しかしながら、個人が映像を利用する場面は幅広く、それらは必ずしも、「映像を取得する必要に駆られ、様々なサービスやツールを自らの意図で駆使し能動的に映像を探索する」という場面のみに限定されない。すなわち、このような、必要に駆られて映像検索を行い所望の映像を取得する場面を「能動的な動機による映像利用場面」と称するならば、その反対である「受動的な動機による映像利用場面」も数多く考えられる。以下は、その代表的な場面の例である。
【0005】
(i)余暇に動画共有サイトを利用しており、利用時点では明確に視聴対象となる映像は想定できていないものの、何か興味を抱く映像を取得できないか期待し、閲覧中のWebページに表示される一連の映像の中から無作為に映像を選択する場面
(ii)映像の閲覧とは無関係の何らかの作業をしていたが、作業中の気分転換に、Webページやデスクトップツールに動的に表示される映像を再生する場面
これらの場面は全て、必要に駆られて特定の映像を検索する場面とは異なり、予め特定の映像を取得対象としてユーザが望んでいた場面ではない。これらの場面では、興味を抱かせる映像か、あるいは取得の対象になりえる映像が、検索コストを掛けずに簡単に取得できるか、あるいは既にユーザの視認範囲内で再生されている状態であるならば、ユーザはその映像にアクセスし閲覧するであろう。
【0006】
映像コンテンツの内容に端を発するユーザ間コミュニケーション活動の活性化、映像広告の閲覧率の向上、および映像閲覧ユーザの更なる増加を目指すには、所望の映像を取得する際のコストを下げるのみならず、より受動的な動機による映像利用場面における映像へのアクセス率を向上させることが重要である。
【0007】
このようなことを背景にして、動的に変わりうるユーザの嗜好に合致した映像を提供できるようにする映像推薦方法が必要となってきている。
【0008】
一方、そのような技術の関連技術として、個人の嗜好情報に基づいた情報推薦方法があり、下記の特許文献1,2に記載されるような技術が既に開示されている。
【0009】
これらの先行技術文献に開示される技術では、過去の参照履歴の中から所望のファイルを効率的に探索することや、過去の参照履歴から嗜好を分析することができる。しかしながら、過去の参照履歴に依存しないユーザの嗜好を反映することはできない。また、情報獲得のために検索行為が必要であって、受動的なユーザの映像へのアクセスを狙った提示方法については検討していない。
【特許文献1】特開2007−148687号公報, 倉恒子, 森田哲之, 加藤泰久, 「閲覧履歴検索・表示方法及び装置及びコンピュータ読み取り可能な記録媒体」
【特許文献2】特開2003−250146号公報(特許第4009940号), 土井俊介, 塩原寿子, 東野豪, 石黒正典, 「番組選択支援情報提供サービスシステムとサーバ装置および端末装置ならびに番組選択支援情報提供方法とプログラムおよび記録媒体」
【発明の開示】
【発明が解決しようとする課題】
【0010】
従来技術では、利用履歴に基づいて嗜好情報を求める必要があった。さらに、嗜好に合致する映像を自動的に取得できても、それらをユーザのアクセスを促すような提示手法でもって提示してはいなかった。
【0011】
すなわち、従来技術では、受動的な動機による映像利用場面において、動的に変わるユーザの嗜好に適合した映像を取得し、これを自動的に提供してアクセスを促すことができないという問題があった。
【0012】
本発明はかかる事情に鑑みてなされたものであって、時々刻々と変化するユーザの行動をモデル化し、嗜好情報を動的に生成し、嗜好に合致する映像を自動で取得し、映像へのアクセスを促すことが可能な提示方法でもって、それらを提示することを実現する新たな映像推薦技術の提供を目的とする。
【課題を解決するための手段】
【0013】
この目的を達成するために、本発明の映像推薦装置は、時々刻々と変化するユーザの興味に適合する映像を取得してユーザに提示することを実現するために、(1)ユーザ操作をモニタリングして操作ログを収集する収集手段と、(2)収集手段の収集した操作ログを解析することで、収集手段が操作ログを収集した時点にユーザが興味を持っていると推定される映像の検索に用いられる検索パラメータを設定する設定手段と、(3)設定手段の設定した検索パラメータを使って映像を検索することで、収集手段が操作ログを収集した時点にユーザが興味を持っていると推定される複数の映像を取得する取得手段と、(4)現在表示中の処理画面上に映像推薦用の提示ウィンドウを表示して、その提示ウィンドウ上に、取得手段の取得した映像を一覧表示する表示手段と、(5)表示手段が一覧表示する映像に対してのユーザの注視度を測定して、その測定結果に応じて表示手段が提示ウィンドウ上に表示する映像の表示形態を変更する変更手段とを備えるように構成する。
【0014】
この構成を採るときに、取得手段の取得した映像のダイジェスト映像を生成する生成手段を備えることがあり、この生成手段を備えるときには、表示手段は、提示ウィンドウ上に、生成手段の生成したダイジェスト映像を一覧表示する。
【0015】
以上の各処理手段が動作することで実現される本発明の映像推薦方法はコンピュータプログラムでも実現できるものであり、このコンピュータプログラムは、適当なコンピュータ読み取り可能な記録媒体に記録して提供されたり、ネットワークを介して提供され、本発明を実施する際にインストールされてCPUなどの制御手段上で動作することにより本発明を実現することになる。
【0016】
このように構成される本発明の映像推薦装置では、ユーザが映像の検索を要求しない場面(能動的な動機による映像利用場面でない場面)において、操作ログを一度クリアしてから所定時間の間のユーザ操作をモニタリングして操作ログを収集し、その操作ログを解析することで、その操作ログを収集した時点にユーザが興味を持っていると推定される映像の検索に用いられる検索パラメータを設定する。
【0017】
続いて、設定した検索パラメータを使って映像を検索することで、操作ログを収集した時点にユーザが興味を持っていると推定される複数の映像を取得する。
【0018】
続いて、ユーザが能動的な動機により映像を利用する場面ではないことを考慮して、現在表示中の処理画面上に映像推薦用の小さな提示ウィンドウを表示して、その小さな提示ウィンドウ上に、その取得した映像を一覧表示する。
【0019】
この提示ウィンドウを使った検索映像の一覧表示に対して、ユーザはその中の映像に興味を示すことがある。そこで、提示ウィンドウ上に一覧表示する映像に対してのユーザの注視度を測定して、その測定結果に応じて提示ウィンドウ上に表示する映像の表示形態を変更することで、ユーザの興味に応えるようにする。
【0020】
例えば、提示ウィンドウ上に一覧表示する映像に重畳するポインティングデバイスの滞留時間を測定することでユーザの注視度を測定して、例えば、ポインティングデバイスの指す映像については、その滞留時間に応じて、より明示的な表示形態(提示ウィンドウを大きくするようなことも含む)となるようにと表示形態を変更し、ポインティングデバイスの指さない映像については、その表示形態(例えば、初期状態として設定される目立たない表示形態)を変更しないようにする。
【0021】
このとき、例えば、ポインティングデバイスの滞留時間が規定の最大値を越える場合には、ユーザが大きな興味を持っていることに応えるべく、ポインティングデバイスの指す映像を提示ウィンドウのサイズに拡大して、その拡大した映像のみを提示ウィンドウ上に表示するという表示形態に変更する。
【0022】
また、ポインティングデバイスが提示ウィンドウ上に一覧表示する映像に重畳しない場合には、ユーザが処理画面上の提示ウィンドウ以外の画面領域でポインティングデバイスを操作していることで、ユーザが提示ウィンドウ上の映像に興味を示していないことを判断して、その一覧表示する映像を所定の表示形態(例えば、初期状態として設定される目立たない表示形態)で表示するようにする。
【発明の効果】
【0023】
本発明によれば、時々刻々と変化するユーザの行動をモデル化し、嗜好情報を動的に生成し、嗜好に合致する映像を自動で取得し、映像へのアクセスを促すことが可能な提示方法でもって、それらを提示することができるようになる。
【0024】
これにより、本発明によれば、受動的な動機による映像利用場面において、動的に変わるユーザの嗜好に適合した動画を取得し、これを自動的に提供してアクセスを促すことができるようになる。
【発明を実施するための最良の形態】
【0025】
以下、本発明を具備する映像推薦装置がPC上で映像を自動再生する場合の動作を具体例にして、本発明について説明する。
【0026】
図1に、本発明を具備する映像推薦装置1の装置構成の一実施形態例を図示する。
【0027】
図1に示すように、本実施形態例の映像推薦装置1は、中央処理ユニット(CPU:Central Processing Unit)11を備え、この中央処理ユニット11には、バス12を介してプログラムメモリ13、データメモリ14、マウスを持つ表示機器15がそれぞれ接続されている。
【0028】
そして、プログラムメモリ13には、起動プログラム監視部13a、操作監視部13b、ログ分析部13c、映像検索部13d、提示方法決定部13e(映像を解析し、提示セグメントを決定する処理部)が記憶され、データメモリ14には、ログ記憶部14a、映像記憶部14bが設けられている。
【0029】
このように構成される本実施形態例の映像推薦装置1では、従来技術の持つ問題を解決するために、受動的な動機による映像利用場面において、ユーザの操作ログに基づいて動的に検索パラメータを設定して、それを使って映像を検索することで、ユーザの興味に適合する映像を検索するという構成を採って、それらの映像をユーザのアクセスを促すような形でユーザに提示することを実現するために、図2(a)に示すように、現在表示中の処理画面上に映像推薦用の小さな提示インタフェース100を表示して、図2(b)に示すように、その提示インタフェース100に、ユーザに推薦する例えば9つの検索結果の映像の一覧を表示するように処理する。
【0030】
図3に、本実施形態例の映像推薦装置1が実行する全体動作を示すフローチャートを図示し、図4に、図3のフローチャートの映像検索ステップ(s12)で実行する詳細なフローチャートを図示し、図5に、図3のフローチャートの映像提示ステップ(s13)で実行する詳細なフローチャートを図示する。
【0031】
次に、これらのフローチャートに従って、本実施形態例の映像推薦装置1の実行する映像推薦処理について詳細に説明する。
【0032】
本実施形態例の映像推薦装置1は、大きく分けて、図3のフローチャートに示すように、初期化ステップ(s10)と行動取得ステップ(s11)と映像検索ステップ(s12)と映像提示ステップ(s13)と更新ステップ(s14)という4つのステップを実行する。
【0033】
〔A〕初期化ステップ(s10)の処理
初期化ステップ(s10)では、全てのログをクリアする。このクリア処理に従って、これから説明する処理により、現時点においてユーザが興味を持っていると推定される映像を取得してユーザに提示することができるようになる。
【0034】
〔B〕行動取得ステップ(s11)の処理
行動取得ステップ(s11)では、
(1)起動プログラム名と、マウス操作頻度と、キーボード入力文字列と、
(2)メモリ上のクリップボード領域のテキスト文字列と、
(3)メモリ上のクリップボード領域の静止画または映像の色特徴量および動き特徴量 と、
(4)メモリ上のクリップボード領域の音声音楽特徴量と、
(5)ローカルのファイルへのアクセス履歴と、Webページへのアクセス履歴と、
(6)ローカルのファイルまたはWebページのキャッシュデータに含まれるテキスト ファイルの文字列と、
(7)ローカルのファイルまたはWebページのキャッシュデータに含まれる静止画ま たは映像の色特徴量および動き特徴量と、
(8)ローカルのファイルまたはWebページのキャッシュデータに含まれる音声音楽 特徴量と、
を取得し、これらの情報を時刻と関連付けたログデータとして、ログ記憶部14aに記憶する。
【0035】
〔C〕映像検索ステップ(s12)の処理
映像検索ステップ(s12)では、図4のフローチャートに示すように、検索パラメータ設定ステップ(s121)と検索ステップ(s122)とダイジェスト生成ステップ(s123)とを実行する。
【0036】
〔C−1〕検索パラメータ設定ステップ(s121)の処理
映像検索ステップ(s12)を構成する検索パラメータ設定ステップ(s121)では、図4のフローチャートに示すように、検索キーワード生成ステップ(s1211)と特徴ベクトル生成ステップ(s1212)とを実行することで、検索パラメータを設定する。
【0037】
ここで、検索キーワード生成ステップ(s1211)と特徴ベクトル生成ステップ(s1212)については、いずれのステップを先に実行してもよいし、2つのステップを並列で実行してもよい。
【0038】
〔C−1−1〕検索キーワード生成ステップ(s1211)の処理
検索パラメータ設定ステップ(s121)を構成する検索キーワード生成ステップ(s1211)では、ログ記憶部14aからログデータを入力し、ローカルのファイルまたはWebページのキャッシュデータに含まれるテキストファイルの文字列を解析し、単語頻度に基づくスコアを算出し、スコアに基づいて降順にソートする。
【0039】
このとき、例えば、
・単語がログデータのクリップボード領域にあるテキスト文字列と一致した場合
・単語がログデータのキーボード入力文字列と一致した場合
・単語が色を表す単語であって、これを色特徴量として表した数値とクリップボード領 域にある静止画の色特徴量とが類似する場合
には、当該単語へのスコアは2倍与える等してもよい。
【0040】
検索キーワード生成ステップ(s1211)では、最終的に、ソートの結果上位2件の単語をキーワードとして出力するとともに、データメモリ14に記録する。
【0041】
〔C−1−2〕特徴ベクトル生成ステップ(s1212)の処理
検索パラメータ設定ステップ(s121)を構成する特徴ベクトル生成ステップ(s1212)では、ログ記憶部14aからログデータを入力し、ローカルのファイルまたはWebページのキャッシュデータに含まれる静止画または映像の色特徴量および動き特徴量のうち、色情報(R、G、B)の値からなるベクトルを生成する。そして、ローカルのファイルまたはWebページのキャッシュデータに含まれる音声音楽特徴量のうち、音声を固定長のフレーム毎に分解し、それぞれのフレームからケプストラムの係数からなるベクトル(ベクトルの次元数はケプストラムの係数の次元数で決められる)を生成し、これを量子化し、最終的に、例えば256ベクトルからなるコードブックを生成し、さらに、パワーの変化周期の値を算出する。
【0042】
特徴ベクトル生成ステップ(s1212)では、最終的に、3次元の色情報、256個の音声情報、1個の音声の周期情報を出力する。このとき、静止画の情報がない等で色特徴の抽出ができない場合には、色情報については出力しない。
【0043】
〔C−2〕検索ステップ(s122)の処理
映像検索ステップ(s12)を構成する検索ステップ(s122)では、検索パラメータ設定ステップ(s121)で生成したキーワードまたは特徴ベクトルを用いて、ローカルの映像ファイルとWebページのキャッシュデータに含まれる映像ファイルまたはWeb上の映像ファイルとを検索する。
【0044】
そして、キーワードによる検索の結果および特徴ベクトルによる検索の結果である映像ファイルについて、検索の結果の第1位以下それぞれ上位9件ずつ、合計18件の映像ファイルを取得する。
【0045】
〔C−3〕ダイジェスト生成ステップ(s123)の処理
映像検索ステップ(s12)を構成するダイジェスト生成ステップ(s123)では、検索ステップ(s122)で取得した映像ファイルを解析して、図4のフローチャートに示すように、区間分割ステップ(s1231)と優先順位付与ステップ(s1232)とを実行することで、検索ステップ(s122)で取得した映像のダイジェストを生成する。
【0046】
〔C−3−1〕区間分割ステップ(s1231)の処理
ダイジェスト生成ステップ(s123)を構成する区間分割ステップ(s1231)では、映像記憶部14bに格納された映像(検索ステップ(s122)で取得した映像ファイル)を入力し、区間分割を行い、分割された区間の番号と、分割された映像の時刻情報とを出力する。
【0047】
図6に、区間分割ステップ(s1231)により出力される区間分割情報の一例を図示する。
【0048】
本ステップの区間分割処理は、映像中のシーンチェンジ位置の検出および音声の連続性の検出に基づいて実行することができる。
【0049】
シーンチェンジ位置の検出は、例えば、下記の参考文献1に記載される方法に基づいて実施可能である。また、音声の連続性の検出は、例えば、下記の参考文献2に記載される方法において、フレーム毎のパワー値か、無音らしさを表すスコアを用いて検出することができる(段落0019〜段落0020に記載)。または、下記の参考文献3に記載される方法では、音声の有性区間に着目してシーン分割する手法が述べられており、これを用いてもよい。
【0050】
参考文献1:「映像ショット切換え検出法とその映像アクセスインタフェースへの応 用」, 電子情報通信学会論文誌 Vol.J79-D2 No.4,(1996年4月), 谷口 行信, 外村佳伸, 浜田洋著, 社団法人電子情報通信学会発行
参考文献2:特開平11−85180号公報(特許第3207378号), 野田喜昭 , 松永昭一, 「音声認識方法」
参考文献3:特開2003−316378号公報(特許第3803311号), 日高 浩太, 水野理, 中嶌信弥, 「音声処理方法及びその方法を使用した装置 及びそのプログラム」
〔C−3−2〕優先順位付与ステップ(s1232)の処理
ダイジェスト生成ステップ(s123)を構成する優先順位付与ステップ(s1232)では、区間分割ステップ(s1231)で得られた区間に対し、映像音声の処理によってイベントの発生確率(そのイベントを検出したときの確度(尤度))を算出し、イベントの種類、イベントの発生確率、イベントの開始時刻・終了時刻、イベントの代表静止画を出力する。
【0051】
本ステップでは、図4のフローチャートに示すように、映像解析ステップ(s12321)と音声解析ステップ(s12322)と優先順位決定ステップ(s12323)とを実行する。次に、それぞれのステップについて説明する。
【0052】
〔C−3−2−1〕映像解析ステップ(s12321)の処理
優先順位付与ステップ(s1232)を構成する映像解析ステップ(s12321)では、映像信号からフレーム画像を抽出し、ピクセルの輝度変化、動きベクトル、特徴点の位置情報、特徴点の移動情報を解析し、その解析に基づいて、映像中から、テロップ挿入区間、カメラワーク区間、顔表示区間、笑顔表示区間、動物体アップショット区間のうち一つ以上について、そのイベントの発生確率を算出し、区間情報と共に出力する。
【0053】
このとき、これらの各処理については、具体的には、以下に説明する処理によって実施することができる。
【0054】
〔テロップ挿入区間〕
テロップの挿入区間については、下記の参考文献4に記載される方法を用い、テロップの挿入されている確率(発生確率)とテロップ挿入区間の開始時刻・終了時刻とを算出できる。また、その開始時刻と終了時刻の中間の時刻のフレーム画像を、代表静止画として用いる。
【0055】
参考文献4:特開平10−40391号公報(特許第3569390号), 桑野秀豪 , 倉掛正治, 「文字出現フレーム抽出装置および方法」
〔カメラワーク区間〕
カメラワーク区間については、下記の参考文献5に記載される方法を用い、カメラパラメータの滑らかな変化が生じた部分をカメラワーク区間として検出することが可能であり、カメラワーク区間の確率(発生確率)とカメラワーク区間の開始時刻・終了時刻とを算出できる。また、その開始時刻と終了時刻の中間の時刻のフレーム画像を、代表静止画として用いる。
【0056】
参考文献5:特開平11−15953号公報(特許第3408117号), 谷口行信 , 阿久津明人, 外村佳伸, 「カメラ操作推定方法およびカメラ操作推定 プログラムを記録した記録媒体」
〔顔表示区間〕
顔表示区間については、下記の参考文献6に記載される方法を用い、人物の顔画像が含まれている確率(発生確率)と、その人物の顔画像が含まれている区間の開始時刻・終了時刻とを算出できる。また、その開始時刻と終了時刻の中間の時刻のフレーム画像を、代表静止画として用いる。
【0057】
参考文献6:特開平9−50528号公報, 福島和恵, 川村春美, 曽根原登, 水谷伸 , 「人物検出装置」
〔笑顔表示区間〕
笑顔表示区間については、下記の参考文献7に記載される方法に基づき、映像中から人間の笑い状態を検出し、笑い状態の確率(発生確率)を笑顔度として求め、笑顔度と笑顔区間の開始時刻・終了時刻とを算出する。また、その開始時刻と終了時刻の中間の時刻のフレーム画像を、代表静止画として用いる。
【0058】
参考文献7:Uwe Kowalik, Kota Hidaka, Go Irie, Yukinobu Taniguchi, "Detectin g Facial Expression of Joy Based on Feature Point Dynamics",映像 情報メディア学会技術報告, ITE Technical Report Vol31, No47, pp35 -38
〔動物体アップショット区間〕
動物体アップショッ卜区間については、下記の参考文献8に記載される方法により、映像中から動物体がアップで表示されている部分を検出し、動物体被写体がアップで写されている確率(発生確率)と、動物体被写体がアップで写されている区間の開始時刻・終了時刻とを算出する。また、その開始時刻と終了時刻の中間の時刻のフレーム画像を、代表静止画として用いる。
【0059】
参考文献8:特開2006−244074号公報, 鳥井陽介, 紺谷精一, 森本正志, 「動物体アップフレーム検出方法及びプログラム及びプログラムを格納 した記憶媒体及び動物体アップショット検出方法及び動物体アップフレ ームあるいはショット検出方法及びプログラム及びプログラムを格納し た記憶媒体」
〔C−3−2−2〕音声解析ステップ(s12322)の処理
優先順位付与ステップ(s1232)を構成する音声解析ステップ(s12322)では、映像に付帯する音声を解析し、周波数の値、周波数の変化率、パワーの値、パワーの変化率、ピッチ、ピッチの変化、倍音、倍音のゆらぎの度合い、音響モデルとの類似度を解析し、その解析により、音声の強調区間、感情表現を含む区間、人物音声が含まれる区間、主要人物の発話区間、発話中の頻出フレーズ区間、音楽挿入区間の検出のうち一つ以上について、そのイベントの発生確率を算出し、区間情報と共に出力する。
【0060】
このとき、これらの各処理については、具体的には、以下に説明する処理によって実施することができる。
【0061】
〔音声の強調区間〕
音声の強調区間については、前述した参考文献3に記載される方法により、音声の強調状態を強調度として算出することができる。強調度が所定の数値を上回る区間を強調区間とし、その強調区間の開始時刻・終了時刻の値を出力する。また、その強調区間の強調度の値を確率値(発生確率の値)として出力する。また、その開始時刻と終了時刻の中間の時刻のフレーム画像を、強調区間の代表静止画として用いる。
【0062】
〔感情表現を含む区間〕
感情表現を含む区間については、下記の参考文献9に記載される方法により、感情度と時刻情報を算出できる。感情度が所定の数値を上回る区間を感情区間とし、その感情区間の開始時刻・終了時刻の値を出力する。また、その感情区間の感情度の値を確率値(発生確率の値)として出力する。また、その開始時刻と終了時刻の中間の時刻のフレーム画像を、感情区間の代表静止画として用いる。
【0063】
参考文献9:入江豪, 日高浩太, 佐藤隆, 谷口行信, 中嶌信弥, 「CGM動画を対象 とした感情表出区間自動検出法」, 電子情報通信学会総合大会講演論文 集, Proceedings of the IEICE General Conference, Vol.2007 年情報 ・システム, No.2(20070307), p.210,社団法人電子情報通信学会
〔人物音声が含まれる区間〕
人物音声が含まれる区間については、下記の参考文献10に記載される方法により、人物音声が含まれる区間の開始時刻・終了時刻、およびその確率(発生確率)を算出できる。その開始時刻と終了時刻の中間の時刻のフレーム画像を、人物音声が含まれる区間の代表静止画として用いる。
【0064】
参考文献10:南憲一, 他, 「音情報を用いた映像インデクシングとその応用」, 信 学論(D-II)vol.J81-D-II, no.3, pp.529-537, 1998
〔主要人物の発話区間〕
主要人物の発話区間については、下記の参考文献11に記載される方法により、発話区間のスペクトルの包絡を表現するケプストラム係数によるベクトルを生成し、これをLBGアルゴリズム等で所定のクラスに到るまで量子化することにより、主要発話者の発話区間とその確率(発生確率)を算出できる。主要発話者の発話区間の開始時刻と終了時刻の中間の時刻のフレーム画像を、主要発話者の発話区間の代表静止画として用いる。
【0065】
参考文献11:古井貞煕, 「音響・音声工学」近代科学社, 電子・情報工学入門シリ ーズ2, pp.119-121
〔発話中の頻出フレーズ区間〕
発話中の頻出フレーズ区間については、下記の参考文献12に記載される方法で、音声からキーワードを生成し、頻出するキーワードを発見し、その発見された区間を、発話中の頻出フレーズ区間として、頻度に応じて、頻出フレーズ区間の発生確率と、頻出フレーズ区間の開始時刻・終了時刻を求めることができる。
【0066】
参考文献12:特開2000−89791号公報, 宮崎昇, 川端豪, 「音声認識応答 方法、その装置及びプログラム記録媒体」
〔音楽挿入区間〕
音楽挿入区間については、下記の参考文献13に記載される方法を用い、音楽挿入部分の確率(発生確率)および時刻情報を求めることができる。
【0067】
参考文献13:特開平11−265396号公報(特許第3517349号), 南憲 一, 阿久津明人, 佐藤隆, 外村佳伸, 「音楽映像分類方法、装置およ び音楽映像分類プログラムを記録した記録媒体」
図7に、映像解析ステップ(s12321)および音声解析ステップ(s12322)で出力される情報の一例を図示する。ここで、優先順位については、これから説明する優先順位決定ステップ(s12323)で付与されることになる。
【0068】
〔C−3−2−3〕優先順位決定ステップ(s12323)の処理
優先順位付与ステップ(s1232)を構成する優先順位決定ステップ(s12323)では、映像解析ステップ(s12321)および音声解析ステップ(s12322)で求められたイベントの発生確率を、発生確率の値を0〜1として、その確率の値に基づいて、図7中に示すように、各イベントの区間に対し降順に優先順位を付与する。
【0069】
そして、映像の先頭側の部分区間から順に後方に向かって、所定の時間に到るまで、イベントの優先順位の高い順に、部分区間内でダイジェストとなる区間を選択し、選択された区間のダイジェストを出力する。
【0070】
ここで、原則的には、各区間において優先順位が1位のイベントの映像区間部分をつなぎ合わせることでダイジェスト映像を作成することになるが、ダイジェスト映像に与えられる再生時間に余裕がある場合には、優先順位が2位以下のイベントの映像区間部分を含ませるようにしてもよい。
【0071】
〔D〕映像提示ステップ(s13)の処理
映像提示ステップ(s13)では、図5のフローチャートに示すように、映像選択ステップ(s131)と提示モード決定ステップ(s132)と提示ステップ(s133)とを実行することで、ユーザに映像を提示する。
【0072】
〔D−1〕映像選択ステップ(s131)の処理
映像提示ステップ(s13)を構成する映像選択ステップ(s131)では、提示インタフェース100(図2に示したもの)に表示する映像を選択する。
【0073】
ログデータのうち、起動プログラムにWebブラウザまたは映像再生プログラムが起動していない場合には、検索ステップ(s122)で取得した映像のうち、キーワードによる検索結果である9件の映像ファイルを選択する。一方、Webブラウザまたは映像再生プログラムのいずれかが起動されている場合には、検索ステップ(s122)で取得した映像のうち、特徴ベクトルによる検索結果である9件の映像ファイルを選択する。
【0074】
また、Webブラウザにおけるアドレスの更新頻度か、あるいはWebブラウザのキャッシュデータの更新頻度を用いて、その頻度が所定の頻度以上となる場合には、検索ステップ(s122)で取得した映像のうち、特徴ベクトルによる検索結果である9件の映像ファイルを選択してもよい。あるいは、行動取得ステップ(s11)で取得したログデータのうち、過去のある時点からある時点までの起動プログラムの起動順序からなる時系列パターンを分析して、統計的に、現在の起動プログラムがローカルディスクの情報を閲覧するか,あるいはWeb情報を閲覧するかの判別を行い、この判別結果に従って、9件の映像ファイルを選択してもよい。
【0075】
〔D−2〕提示モード決定ステップ(s132)の処理
映像提示ステップ(s13)を構成する提示モード決定ステップ(s132)では、提示インタフェース100上に配置された9つの映像に対して、ユーザの操作状態に応じて、提示モードを動的に切り替える。
【0076】
具体的には、提示インタフェース100上にユーザが重畳したマウスの滞留時間をモニタリングし、滞留時間の長さに応じて、「提示モード1→提示モード2→提示モード3→提示モード4」というように、以下の4種類の提示モードを進行させる。
【0077】
〔提示モード1〕
提示モード1は、音声およびメタデータの両方を含まない映像ダイジェストの表示を行うモードである。
【0078】
マウスの重畳された領域にあたる映像は、ダイジェスト生成ステップ(s123)で生成した映像のダイジェストを音声なしで提示インタフェース100に再生表示する。ダイジェストの終端に至った場合、ダイジェストの先頭に戻り再生を繰り返す。なお、このモードは初期状態であり、提示インタフェース100上にマウスが重畳されない場合は常にこのモードで映像が再生される。
【0079】
〔提示モード2〕
提示モード2は、音声を含みメタデータを含まない映像ダイジェストの表示を行うモードである。
【0080】
マウスの重畳された領域にあたる映像は、ダイジェスト生成ステップ(s123)で生成した映像のダイジェストを音声付きで提示インタフェース100に再生表示する。ダイジェストの終端に至った場合、ダイジェストの先頭に戻り再生を繰り返す。
【0081】
〔提示モード3〕
提示モード3は、音声とメタデータとを含む映像ダイジェストの表示を行うモードである。
【0082】
マウスの重畳された領域にあたる映像は、ダイジェスト生成ステップ(s123)で生成した映像のダイジェストを音声付きで提示インタフェース100に再生表示する。さらに、映像のファィル名、URL、検索ステップ(s122)で検索に用いたキーワード(検索キーワード生成ステップ(s1211)で出力し、データメモリ14に記録したキーワード)を、当該再生画面上に映像とともに重畳表示する。ダイジェストの終端に至った場合、ダイジェストの先頭に戻り再生を繰り返す。
【0083】
〔提示モード4〕
提示モードは、全編映像の再生表示を行うモードである。
【0084】
マウスの重畳された領域にあたる映像を、提示インタフェース100の画面領域全体のサイズに拡大し、先頭から再生する。映像の終端まで再生された場合、ダイジェストの先頭に戻り繰り返す。
【0085】
なお、本ステップでは、マウスなどのようなポインティングデバイスの提示インタフェース100の特定領域への重畳滞留時間だけでなく、所定の時間幅におけるポインティングデバイスの動作方向の変化頻度を用いて提示モードを更新するようにしてもよい。さらに、ポインティングデバイスが重畳領域内でクリック等のアクションを発生した場合、そのアクションに応じて提示モードを更新するようにしてもよい。
【0086】
〔D−3〕提示ステップ(s133)の処理
映像提示ステップ(s13)を構成する提示ステップ(s133)では、提示モード決定ステップ(s132)の決定した提示モードに従って、提示インタフェース100上で映像を提示する。
【0087】
〔E〕更新ステップ(s14)の処理
更新ステップ(s14)では、一定時間経過後に初期化ステップ(s10)の実行に戻る。
【0088】
以上に説明した処理を実行することにより、本発明によれば、ユーザがPCを操作中に、その嗜好に適合する映像を取得することができ、さらに、ユーザの興味に応じてそれらの映像の提示方法を制御することが可能となる。
【産業上の利用可能性】
【0089】
本発明は、映像を検索してユーザに提示する機能を有する情報処理装置に適用できるものであり、本発明を適用することで、受動的な動機による映像利用場面において、動的に変わるユーザの嗜好に適合した動画を取得し、これを自動的に提供してアクセスを促すことができるようになる。
【図面の簡単な説明】
【0090】
【図1】本発明を具備する映像推薦装置の装置構成図である。
【図2】提示インタフェースの説明図である。
【図3】映像推薦装置が実行する全体動作を示すフローチャートである。
【図4】映像検索ステップで実行するフローチャートである。
【図5】映像提示ステップで実行するフローチャートである。
【図6】区間分割ステップで出力される区間分割情報の一例を示す図である。
【図7】映像解析ステップおよび音声解析ステップで出力される情報の一例を示す図である。
【符号の説明】
【0091】
1 映像推薦装置
11 中央処理ユニット
12 バス
13 プログラムメモリ
14 データメモリ
15 表示機器
13a 起動プログラム監視部
13b 操作監視部
13c ログ分析部
13d 映像検索部
13e 提示方法決定部
14a ログ記憶部
14b 映像記憶部
100 提示インタフェース

【特許請求の範囲】
【請求項1】
時々刻々と変化するユーザの興味に適合する映像を取得してユーザに提示する映像推薦装置が実行する映像推薦方法であって、
ユーザ操作をモニタリングして操作ログを収集する過程と、
前記操作ログを解析することで、前記操作ログを収集した時点にユーザが興味を持っていると推定される映像の検索に用いられる検索パラメータを設定する過程と、
前記検索パラメータを使って映像を検索することで、前記操作ログを収集した時点にユーザが興味を持っていると推定される複数の映像を取得する過程と、
現在表示中の処理画面上に映像推薦用の提示ウィンドウを表示して、その提示ウィンドウ上に、前記取得した映像を一覧表示する過程と、
前記一覧表示する映像に対してのユーザの注視度を測定して、その測定結果に応じて前記提示ウィンドウ上に表示する映像の表示形態を変更する過程とを備えることを、
特徴とする映像推薦方法。
【請求項2】
請求項1に記載の映像推薦方法において、
前記変更する過程では、前記一覧表示する映像に重畳するポインティングデバイスの滞留時間を測定することでユーザの注視度を測定して、ポインティングデバイスの指す映像についてはその滞留時間に応じて表示形態を変更し、ポインティングデバイスの指さない映像については表示形態を変更しないことを、
特徴とする映像推薦方法。
【請求項3】
請求項2に記載の映像推薦方法において、
前記変更する過程では、前記滞留時間が規定の最大値を越える場合には、ポインティングデバイスの指す映像を前記提示ウィンドウのサイズに拡大して、その拡大した映像のみを前記提示ウィンドウ上に表示する表示形態に変更することを、
特徴とする映像推薦方法。
【請求項4】
請求項2又は3に記載の映像推薦方法において、
前記一覧表示する過程では、ポインティングデバイスが前記一覧表示する映像に重畳しない場合には、前記一覧表示する映像を所定の表示形態で表示することを、
特徴とする映像推薦方法。
【請求項5】
請求項1ないし4のいずれか1項に記載の映像推薦方法において、
前記取得した映像のダイジェスト映像を生成する過程を備え、
前記一覧表示する過程では、前記提示ウィンドウ上に、前記ダイジェスト映像を一覧表示することを、
特徴とする映像推薦方法。
【請求項6】
時々刻々と変化するユーザの興味に適合する映像を取得してユーザに提示する映像推薦装置であって、
ユーザ操作をモニタリングして操作ログを収集する手段と、
前記操作ログを解析することで、前記操作ログを収集した時点にユーザが興味を持っていると推定される映像の検索に用いられる検索パラメータを設定する手段と、
前記検索パラメータを使って映像を検索することで、前記操作ログを収集した時点にユーザが興味を持っていると推定される複数の映像を取得する手段と、
現在表示中の処理画面上に映像推薦用の提示ウィンドウを表示して、その提示ウィンドウ上に、前記取得した映像を一覧表示する手段と、
前記一覧表示する映像に対してのユーザの注視度を測定して、その測定結果に応じて前記提示ウィンドウ上に表示する映像の表示形態を変更する手段とを備えることを、
特徴とする映像推薦装置。
【請求項7】
請求項1ないし5のいずれか1項に記載の映像推薦方法をコンピュータに実行させるための映像推薦プログラム。
【請求項8】
請求項1ないし5のいずれか1項に記載の映像推薦方法をコンピュータに実行させるための映像推薦プログラムを記録したコンピュータ読み取り可能な記録媒体。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2009−302985(P2009−302985A)
【公開日】平成21年12月24日(2009.12.24)
【国際特許分類】
【出願番号】特願2008−156152(P2008−156152)
【出願日】平成20年6月16日(2008.6.16)
【出願人】(000004226)日本電信電話株式会社 (13,992)
【Fターム(参考)】