説明

画像処理装置、画像処理方法、及び、プログラム

【課題】1つのコンテンツ内の複数箇所を同時に視聴する。
【解決手段】コンテンツを、時間的に連続する1フレーム以上のフレームの集まりである動画セグメントに区分することにより得られる動画セグメントを代表する画像であるセグメント代表画像を配置したマップであるセグメントマップが表示され、セグメント代表画像に対する、再生を要求するユーザの再生操作に応じて、そのセグメント代表画像に対応する動画セグメントが再生される。コンテンツの動画セグメントの再生中に、そのコンテンツの、他の動画セグメントのセグメント代表画像に対する再生操作が行われた場合、再生中の動画セグメントの再生を維持したまま、再生操作が行われたセグメント代表画像に対応する動画セグメントである他の動画セグメントが再生される。本技術は、例えば、コンテンツを再生する装置等に適用できる。

【発明の詳細な説明】
【技術分野】
【0001】
本技術は、画像処理装置、画像処理方法、及び、プログラムに関し、特に、例えば、1つのコンテンツ内の、ユーザが興味のある複数のシーン等の複数箇所を、ユーザが同時に視聴することができるようにする画像処理装置、画像処理方法、及び、プログラムに関する。
【背景技術】
【0002】
例えば、ユーザが、動画のコンテンツ内の興味のあるシーンを視聴するには、ユーザが、そのシーンの再生を指示すること、つまり、再生の対象となるシーン(の位置)を指示することが必要である。
【0003】
ユーザが、再生の対象となるシーンを指示するには、コンテンツに含まれるシーンの概要を把握している必要がある。
【0004】
ユーザがコンテンツに含まれるシーンの概要を把握する手法としては、コンテンツのサムネイルを表示する方法がある。
【0005】
コンテンツのサムネイルを表示する方法としては、例えば、コマーシャルと本編との切り替わりや、画像に映る人物や物体の切り替わり等を、シーンチェンジとして検出し、そのシーンチェンジの直後のフレームを縮小したサムネイルを生成して表示する方法がある(例えば、特許文献1を参照)。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2008-312183号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
コンテンツの一部のフレームのサムネイルを、フィルムロール状に表示し、サムネイルをクリックすると、そのサムネイルに対応するフレームから再生を開始する動画管理アプリケーションがある。
【0008】
かかる動画管理アプリケーションによれば、ユーザは、サムネイルを見て、そのサムネイルに対応するフレーム等から始まるシーンの概要を把握し、興味のあるシーンのサムネイルをクリックすることで、そのシーンを視聴することができる。
【0009】
ところで、以上のような動画アプリケーションにおいて、ユーザが、あるサムネイルAをクリックすることにより、そのサムネイルAに対応する(フレームから始まる)シーンが再生されている最中に、ユーザが、他のサムネイルBを見て、そのサムネイルBに対応するシーンに興味を持ち、そのシーンを視聴しようとして、サムネイルBをクリックした場合、それまで行われていた、サムネイルAに対応するシーンの再生が中止され、サムネイルBに対応するシーンの再生が開始される。
【0010】
したがって、ユーザが、フィルムロール状に表示されたサムネイルを見て、複数としての、例えば、2つのサムネイルA及びBそれぞれに対応するシーンに興味を持った場合であっても、その2つのサムネイルA及びBそれぞれに対応するシーンを、同時に視聴することが困難であった。
【0011】
本技術は、このような状況に鑑みてなされたものであり、1つ又は複数のコンテンツ内の複数箇所を、ユーザが同時に視聴することができるようにするものである。
【課題を解決するための手段】
【0012】
本技術の一側面の画像処理装置、又は、プログラムは、コンテンツを、時間的に連続する1フレーム以上のフレームの集まりである動画セグメントに区分することにより得られる前記動画セグメントを代表する画像であるセグメント代表画像を配置したマップであるセグメントマップを、表示装置に表示させる表示制御部と、前記セグメント代表画像に対する、再生を要求するユーザの再生操作に応じて、そのセグメント代表画像に対応する前記動画セグメントの再生を制御する再生制御部とを備え、コンテンツの動画セグメントの再生中に、そのコンテンツの、他の動画セグメントのセグメント代表画像に対する再生操作が行われた場合、前記再生制御部は、再生中の動画セグメントの再生を維持したまま、再生操作が行われた前記セグメント代表画像に対応する動画セグメントである前記他の動画セグメントを再生する画像処理装置、又は、画像処理装置として、コンピュータを機能させるためのプログラムである。
【0013】
本技術の一側面の画像処理方法は、コンテンツを、時間的に連続する1フレーム以上のフレームの集まりである動画セグメントに区分することにより得られる前記動画セグメントを代表する画像であるセグメント代表画像を配置したマップであるセグメントマップを、表示装置に表示させ、前記セグメント代表画像に対する、再生を要求するユーザの再生操作に応じて、そのセグメント代表画像に対応する前記動画セグメントの再生を制御するステップを含み、前記動画セグメントの再生の制御では、コンテンツの動画セグメントの再生中に、そのコンテンツの、他の動画セグメントのセグメント代表画像に対する再生操作が行われた場合、再生中の動画セグメントの再生を維持したまま、再生操作が行われた前記セグメント代表画像に対応する動画セグメントである前記他の動画セグメントを再生する画像処理方法である。
【0014】
以上のような一側面においては、コンテンツを、時間的に連続する1フレーム以上のフレームの集まりである動画セグメントに区分することにより得られる前記動画セグメントを代表する画像であるセグメント代表画像を配置したマップであるセグメントマップが、表示装置に表示される。そして、前記セグメント代表画像に対する、再生を要求するユーザの再生操作に応じて、そのセグメント代表画像に対応する前記動画セグメントが再生される。コンテンツの動画セグメントの再生中に、そのコンテンツの、他の動画セグメントのセグメント代表画像に対する再生操作が行われた場合、再生中の動画セグメントの再生を維持したまま、再生操作が行われた前記セグメント代表画像に対応する動画セグメントである前記他の動画セグメントが再生される。
【0015】
なお、画像処理装置は、独立した装置であっても良いし、1つの装置を構成している内部ブロックであっても良い。
【0016】
また、プログラムは、伝送媒体を介して伝送することにより、又は、記録媒体に記録して、提供することができる。
【発明の効果】
【0017】
本技術の一側面によれば、1つのコンテンツ内の、ユーザが興味のある複数のシーン等の複数箇所を、ユーザが同時に視聴することができる。
【図面の簡単な説明】
【0018】
【図1】本技術を適用した画像処理装置の一実施の形態の構成例を示すブロック図である。
【図2】画像処理装置のブラウジング処理を説明するフローチャートである。
【図3】セグメントマップ生成部14の構成例を示すブロック図である。
【図4】クラスタリング部21の構成例を示すブロック図である。
【図5】クラスタリングモデル学習部31の構成例を示すブロック図である。
【図6】クラスタ判定部33の構成例を示すブロック図である。
【図7】マップ生成部24の構成例を示すブロック図である。
【図8】マップ描画部64で描画されるモデルマップの例を示す図である。
【図9】セグメントマップ生成部14のセグメントマップ生成処理の概要を説明する図である。
【図10】セグメントマップ生成部14で生成されるセグメントマップの例を示す図である。
【図11】状態の重要度を求める方法を説明する図である。
【図12】セグメントマップ生成部14が行うセグメントマップ生成処理を説明するフローチャートである。
【図13】タイル画像が重畳されたセグメントマップの表示例を示す図である。
【図14】タイル画像が表示されるときの表示制御部16の表示制御の処理を説明するフローチャートである。
【図15】固定タイル画像の表示例を示す図である。
【図16】固定タイル画像の詳細を示す図である。
【図17】注目代表画像の強調表示の表示例を示す図である。
【図18】タイムライン画像の表示例を示す図である。
【図19】タイムライン画像が表示されるときの表示制御部16の表示制御の処理を説明するフローチャートである。
【図20】タイムライン画像に配置される構成画像としてのセグメント代表画像のスクロールの表示例を示す図である。
【図21】再生制御部15において再生された動画セグメントの画像の表示例を示す図である。
【図22】再生ウインドウの表示例を示す図である。
【図23】お気に入り情報記憶部13にお気に入り情報が記憶されている場合の、セグメントマップの表示例を示す図である。
【図24】セグメントマップにおいて強調表示されているセグメント代表画像をダブルクリックすることにより行われる動画セグメントの再生を説明する図である。
【図25】表示モードの移行と各表示モードで行われる処理を説明する図である。
【図26】本技術を適用したコンピュータの一実施の形態の構成例を示すブロック図である。
【発明を実施するための形態】
【0019】
[本技術を適用した画像処理装置の一実施の形態]
【0020】
図1は、本技術を適用した画像処理装置の一実施の形態の構成例を示すブロック図である。
【0021】
図1において、画像処理装置は、コンテンツ記憶部11、操作イベント処理部12、お気に入り情報記憶部13、セグメントマップ生成部14、再生制御部15、表示制御部16、及び、表示部17から構成される。
【0022】
コンテンツ記憶部11は、例えば、テレビジョン放送の番組等のコンテンツを記憶(記録)する。コンテンツ記憶部11に記憶されたコンテンツは、例えば、ユーザの操作に応じて再生される。
【0023】
操作イベント処理部12は、ユーザの操作に応じたイベント(操作イベント)を発生し、その操作イベントに応じて、画像処理装置を構成する各ブロックの制御等の各種の処理を行う。
【0024】
ここで、ユーザの操作(操作イベント)としては、マウスやタッチパネル等のポインティングデバイスの操作である(シングル)クリックや、ダブルクリック、タップ、ダブルタップ等がある。また、操作イベント処理部12が発生する操作イベントには、例えば、マウスに従って移動するカーソルの位置や、タッチパネル上のタッチがされている位置等の情報が含まれる。
【0025】
お気に入り情報記憶部13は、操作イベント処理部12の制御に従って、後述するように、ユーザが興味のある(お気に入りの)動画セグメントがクラスタリングされるクラスタに関する情報等を、お気に入り情報として記憶する。
【0026】
セグメントマップ生成部14は、操作イベント処理部12の制御等に従い、コンテンツ記憶部11に記憶されたコンテンツを、時間的に連続する1フレーム以上のフレームの集まりである動画セグメントに区分することにより得られる動画セグメントを代表する画像であるセグメント代表画像を配置した2次元又は3次元のマップであるセグメントマップを生成し、表示制御部16に供給する。
【0027】
再生制御部15は、操作イベント処理部12の制御に従い、コンテンツ記憶部11に記憶されたコンテンツの再生を制御する。
【0028】
すなわち、再生制御部15は、例えば、セグメント代表画像に対する、再生を要求するユーザの再生操作に応じて、そのセグメント代表画像に対応する動画セグメントの再生を制御する。
【0029】
具体的には、再生制御部15は、コンテンツ記憶部11に記憶されたコンテンツの一部である動画セグメントを読み出し、デコード等の必要な処理を行って、動画セグメントの画像と音声(のデータ)を得る。そして、再生制御部15は、動画セグメントの画像を、表示制御部16に供給するとともに、動画セグメントの音声を、図示せぬスピーカに供給して出力させる。
【0030】
表示制御部16は、再生制御部15から供給される動画セグメントの画像、及び、セグメントマップ生成部14から供給されるセグメントマップ等を、表示部17に表示させる表示制御を行う。
【0031】
なお、表示制御部16は、お気に入り情報記憶部13に記憶されたお気に入り情報に応じて、セグメントマップの表示を制御する。
【0032】
表示部17は、液晶パネルや有機EL(Electro Luminescence)等で構成され、表示制御部16の制御に従って、画像を表示する。
【0033】
図2は、図1の画像処理装置が行う処理(ブラウジング処理)を説明するフローチャートである。
【0034】
ユーザが、コンテンツを再生するように指示する操作を行うと、ステップS11において、操作イベント処理部12は、再生の指示があったコンテンツを、再生の対象とするコンテンツである再生対象コンテンツとして選択し、その再生対象コンテンツのセグメントマップを生成するように、セグメントマップ生成部14を制御して、処理は、ステップS12に進む。
【0035】
ステップS12では、セグメントマップ生成部14は、コンテンツ記憶部11から再生対象コンテンツを読み出し、その再生対象コンテンツのセグメントマップを生成するセグメントマップ生成処理を行う。
【0036】
すなわち、セグメントマップ生成部14は、再生対象コンテンツを、時間的に連続する1フレーム以上のフレームの集まりである動画セグメントに区分し、各動画セグメントを代表する画像であるセグメント代表画像を配置(表示)した2次元又は3次元のマップであるセグメントマップを生成する。
【0037】
そして、セグメントマップ生成部14は、再生対象コンテンツのセグメントマップを、表示制御部16に供給して、処理は、ステップS12からステップS13に進む。
【0038】
なお、コンテンツのセグメントマップは、そのコンテンツがコンテンツ記憶部11に記憶された後の任意のタイミングで、あらかじめ生成し、コンテンツ記憶部11に記憶しておくことができる。この場合、ステップS12では、コンテンツ記憶部11から、再生対象コンテンツのコンテンツマップを読み出すだけでよい。
【0039】
ステップS13では、表示制御部16は、セグメントマップ生成部14からの再生対象コンテンツのセグメントマップを、表示部17に表示して、処理は、ステップS14に進む。
【0040】
ステップS14では、ユーザの操作、すなわち、操作イベント処理部12で発生する操作イベントに応じて、再生制御部15が再生対象コンテンツの再生制御を行うとともに、表示制御部16がセグメントマップの表示制御を行う。
【0041】
その後、ユーザが、ブラウジング処理を終了するように、操作を行うと(ブラウジング処理を終了することを要求する操作イベントが発生すると)、画像処理装置は、ブラウジング処理を終了する。
【0042】
ここで、ステップS14において、表示制御部16が行うセグメントマップの表示制御としては、ユーザがカーソルや指によって指示する、セグメントマップが表示された表示部17の表示画面上の位置である指示位置に応じて行われる、後述するタイル画像の表示や、強調表示、その他、セグメントマップの表示モードの設定(変更)等がある。
【0043】
また、ステップS14において、再生制御部15が行う再生対象コンテンツの再生制御としては、例えば、再生対象コンテンツの複数の動画セグメントを並列に再生する制御等がある。
【0044】
すなわち、ユーザは、表示部17に表示された再生対象コンテンツのセグメントマップのセグメント代表画像に対する、ダブルクリックやダブルタップを、そのセグメント代表画像に対応する動画セグメントの再生を要求する再生操作として行うことができる。
【0045】
再生制御部15は、コンテンツ記憶部11に記憶された再生対象コンテンツのある動画セグメント#Aの再生中に、すなわち、動画セグメント#Aの画像が、表示部17に表示されている最中に、再生対象コンテンツの、他の動画セグメント#Bのセグメント代表画像に対する再生操作が行われた場合、再生中の動画セグメント#Aの再生を維持したまま、再生操作が行われたセグメント代表画像に対応する動画セグメント#Bの再生を開始し、その動画セグメント#Bの画像を、表示制御部16に供給する。
【0046】
したがって、ステップS14の再生制御によれば、ユーザは、1つの再生対象コンテンツ内の、ユーザが興味のある複数のシーン等の複数箇所を同時に視聴することができる。
【0047】
[セグメントマップ生成部14の構成例]
【0048】
図3は、図1のセグメントマップ生成部14の構成例を示すブロック図である。
【0049】
図3において、セグメントマップ生成部14は、クラスタリング部21、セグメント区分部22、セグメント代表画像生成部23、及び、マップ生成部24を有する。
【0050】
クラスタリング部21には、コンテンツ記憶部11(図1)から、再生対象コンテンツが供給される。
【0051】
クラスタリング部21は、コンテンツ記憶部11からの再生対象コンテンツの各フレームを、例えば、あらかじめ定められた複数のクラスタのうちのいずれかのクラスタにクラスタリングし、そのクラスタリング結果を表すクラスタ情報を、セグメント区分部22に供給(出力)する。
【0052】
ここで、クラスタ情報には、再生対象コンテンツの各フレームが属するクラスタを特定する情報(例えば、クラスタを表すユニークな番号等)が、少なくとも含まれる。
【0053】
セグメント区分部22は、クラスタリング部21でクラスタリングされ得る複数のクラスタそれぞれについて、そのクラスタに属するフレームを、時間的に連続する1フレーム以上のフレームの集まりである動画セグメントに区分する。
【0054】
すなわち、セグメント区分部22は、クラスタリング部21でクラスタリングされ得る複数のクラスタそれぞれを、順次、注目する注目クラスタに選択し、クラスタリング部21からのクラスタ情報に基づいて、注目クラスタに属する、再生対象コンテンツのフレームを認識する。
【0055】
さらに、セグメント区分部22は、注目クラスタに属するフレームを、時系列に並べたときに、時間的に連続する1フレーム以上のフレームの集まりを、1動画セグメントとして、動画セグメントに区分する。
【0056】
したがって、例えば、いま、再生対象コンテンツの先頭からt1番目のフレームt1から連続するn1(枚の)フレームと、再生対象コンテンツの先頭からt2(>t1+n1)番目のフレームt2から連続するn2(枚の)フレームとが、注目クラスタに属する場合、セグメント区分部22では、注目クラスタに属するn1+n2フレームが、再生対象コンテンツのフレームt1から連続するn1フレームを有する動画セグメントと、再生対象コンテンツのフレームt2から連続するn2フレームを有する動画セグメントとに区分される。
【0057】
そして、セグメント区分部22は、注目クラスタに属するフレームから得られた動画セグメントを、注目クラスタに属する動画セグメントとして、その動画セグメントを表すセグメント情報を、セグメント代表画像生成部23に供給する。
【0058】
ここで、セグメント情報には、動画セグメントが有するフレームを特定するフレーム情報(例えば、再生対象コンテンツの先頭から何番目のフレームであるかを表す番号)と、動画セグメント(ひいては、動画セグメントが有するフレーム)が属するクラスタを表すクラスタ情報とが、少なくとも含まれる。
【0059】
セグメント代表画像生成部23には、セグメント区分部22から、再生対象コンテンツの各動画セグメントのセグメント情報が供給される他、コンテンツ記憶部11から、再生対象コンテンツが供給される。
【0060】
セグメント代表画像生成部23は、再生対象コンテンツの各動画セグメントについて、動画セグメントを代表するセグメント代表画像を生成する。
【0061】
すなわち、セグメント代表画像生成部23は、セグメント区分部22からのセグメント情報に基づいて、再生対象コンテンツのすべての動画セグメントを認識し、順次、注目する注目動画セグメントに選択する。
【0062】
さらに、セグメント代表画像生成部23は、セグメント区分部22からのセグメント情報に基づいて、注目動画セグメントが有するフレームを認識し、コンテンツ記憶部11からの、注目動画セグメントが有するフレームを用いて、注目動画セグメント(の内容)を表すセグメント代表画像を生成する。
【0063】
そして、セグメント代表画像生成部23は、注目動画セグメントのセグメント代表画像を、注目動画セグメントのセグメント情報とともに、マップ生成部24に供給する。
【0064】
ここで、動画セグメントのセグメント代表画像としては、例えば、動画セグメントの、例えば、先頭のフレーム等の所定のフレームを縮小したサムネイルを採用することができる。
【0065】
また、動画セグメントのセグメント代表画像としては、動画セグメントが有するフレームのうちの、例えば、複数フレームを縮小した画像をアニメーション(動画)で表示するアニメーションGIF等の画像を採用することができる。
【0066】
マップ生成部24は、セグメント代表画像生成部23からの再生対象コンテンツの動画セグメントを代表する画像であるセグメント代表画像を配置したマップであるセグメントマップを生成し、表示制御部16(図1)に供給する。
【0067】
[クラスタリング部21の構成例]
【0068】
図4は、図3のクラスタリング部21の構成例を示すブロック図である。
【0069】
図4において、クラスタリング部21は、クラスタリングモデル学習部31、クラスタリングモデル記憶部32、及び、クラスタ判定部33を有する。
【0070】
クラスタリングモデル学習部31は、コンテンツの各フレームをクラスタリングするのに用いるモデルであるクラスタリングモデルの学習を行い、クラスタリングモデル記憶部32に供給する。
【0071】
なお、クラスタリングモデルとしては、例えば、状態と状態遷移とを有する状態遷移モデルを採用することができる。
【0072】
クラスタリングモデルとなる状態遷移モデルとしては、例えば、HMM等を採用することができる。
【0073】
クラスタリングモデル学習部31は、例えば、コンテンツ記憶部11等に記憶されたコンテンツの中から、所定のカテゴリに属する1以上のコンテンツを、学習用コンテンツとして選択し、学習用コンテンツを、カテゴリごとに分類する。
【0074】
ここで、所定のカテゴリに属するコンテンツとは、例えば、ジャンルが同一の番組や、連続番組、毎週又は毎日その他周期的に放送される番組(タイトルが同一の番組)等の、コンテンツに潜む、コンテンツの構造が共通するコンテンツを意味する。
【0075】
ジャンルとしては、例えば、スポーツ番組やニュース番組等といった、いわば大まかな分類を採用することもできるが、例えば、サッカーの試合の番組や野球の試合の番組等といった、いわば細かい分類であることが望ましい。
【0076】
また、例えば、サッカーの試合の番組であれば、チャンネル(放送局)が異なるごとに、異なるカテゴリに属するコンテンツに分類することもできる。
【0077】
なお、コンテンツのカテゴリとして、どのようなカテゴリを採用するかは、例えば、図1の画像処理装置に、あらかじめ設定されていることとする。
【0078】
また、コンテンツ記憶部11に記憶されたコンテンツのカテゴリは、例えば、テレビジョン放送で番組とともに送信されてくる、番組のタイトルやジャンル等のメタデータや、インターネット上のサイトが提供する番組の情報等から認識することができる。
【0079】
クラスタリングモデル学習部31は、各カテゴリについて、そのカテゴリの学習用コンテンツを用いて、そのカテゴリのクラスタリングモデルの学習を行い、カテゴリごとのクラスタリングモデルを生成(獲得)する。
【0080】
すなわち、クラスタリングモデルとして、例えば、HMMを採用する場合には、クラスタリングモデル学習部31は、各カテゴリについて、そのカテゴリの学習用コンテンツを用いて、クラスタリングモデルとしてのHMMの学習を行う。
【0081】
なお、クラスタリングモデル学習部31では、コンテンツ記憶部11に記憶されたコンテンツの他、例えば、インターネット上のサイト等の外部のコンテンツを、学習用コンテンツとして用いて、クラスタリングモデルとしてのHMMの学習を行うことができる。
【0082】
クラスタリングモデル記憶部32は、クラスタリングモデル学習部31等で生成される、カテゴリごとのクラスタリングモデルを記憶する。
【0083】
ここで、クラスタリングモデルの学習は、例えば、インターネット上のサイト等で行うことができ、クラスタリングモデル記憶部32は、そのサイトから、クラスタリングモデルをダウンロード(取得)して記憶することができる。
【0084】
この場合、クラスタリング部21は、クラスタリングモデル学習部31を設けずに構成することができる。
【0085】
クラスタ判定部33は、クラスタリングモデル記憶部32に記憶されたクラスタリングモデルを用いて、コンテンツ記憶部11から供給される再生対象コンテンツの各フレームが属するクラスタを判定し、そのクラスタであるクラスタリング結果を表すクラスタ情報を、セグメント区分部22に供給(出力)する。
【0086】
[クラスタリングモデル学習部31の構成例]
【0087】
図5は、図4のクラスタリングモデル学習部31の構成例を示すブロック図である。
【0088】
クラスタリングモデル学習部31は、例えば、状態が遷移する状態遷移確率と、状態から、所定の観測値が観測される観測尤度とで規定される状態遷移モデルの1つであるHMM(Hidden Marcov Model)をクラスタリングモデルとして、そのクラスタリングモデルの学習に用いるコンテンツである学習用コンテンツの各フレームの特徴量を抽出する。さらに、クラスタリングモデル学習部31は、学習用コンテンツの各フレームの特徴量(時系列の特徴量)を用いて、HMMの学習を行う。
【0089】
すなわち、クラスタリングモデル学習部31は、学習用コンテンツ選択部41、特徴量抽出部42、特徴量記憶部43、及び、学習部44から構成される。
【0090】
学習用コンテンツ選択部41は、コンテンツ記憶部11に記憶されたコンテンツの中から、HMMの学習に用いるコンテンツを、学習用コンテンツとして選択し、特徴量抽出部42に供給する。
【0091】
特徴量抽出部42は、学習用コンテンツ選択部41からの学習用コンテンツの各フレームの特徴量(ベクトル)を抽出して、特徴量記憶部43に供給する。
【0092】
ここで、フレーム#fの特徴量としては、例えば、GIST等のフレーム#fの画像の特徴量や、MFCC(Mel Frequency Cepstrum Coefficient)等のフレーム#fを含む複数フレームの区間の音声の特徴量、フレーム#f内の人全体、又は、顔の位置を表す位置情報、それらのうちの複数の組み合わせ等を採用することができる。
【0093】
特徴量記憶部43は、特徴量抽出部42から供給される学習用コンテンツの各フレームの特徴量を時系列に記憶する。
【0094】
学習部44は、特徴量記憶部43に記憶された学習用コンテンツの各フレームの特徴量を、カテゴリごとに用いて、HMMの学習を、カテゴリごとに行う。さらに、学習部44は、学習後のHMMを、クラスタリングモデルとして、そのHMMの学習に用いた学習用コンテンツのカテゴリと対応付けて、クラスタリングモデル記憶部32に供給する。
【0095】
ここで、HMMは、状態siの初期確率πi、状態遷移確率aij、及び、状態siから、所定の観測値oが観測される観測尤度bi(o)で規定される。i及びjは、HMMの状態を表すインデクスであり、HMMの状態の数がN個である場合には、1ないしNの範囲の整数をとる。
【0096】
初期確率πiは、状態siが、初期の状態(最初の状態)である確率を表し、状態遷移確率aijは、状態siから状態sjに遷移する確率を表す。
【0097】
観測尤度bi(o)は、状態siへの状態遷移時に、状態siから観測値oが観測される尤度(確率)を表す。観測尤度bi(o)としては、観測値oが離散値である場合には、確率となる値(離散値)が用いられ、観測値oが連続値である場合には、確率分布関数が用いられる。確率分布関数としては、例えば、平均値(平均ベクトル)と分散(共分散行列)とで定義されるガウス分布等を採用することができる。
【0098】
ここで、観測値oが離散値のHMMを、離散HMMともいい、離散値oが連続値のHMMを、連続HMMともいう。
【0099】
HMMの学習は、例えば、EMアルゴリズムを利用した統計学習法であるBaum-Welchアルゴリズムによって行うことができる。
【0100】
クラスタリングモデルとしてのHMMによれば、学習用コンテンツに潜む、コンテンツの構造(例えば、番組構成や、カメラワーク等が作り出す構造)が自己組織的に獲得される。
【0101】
その結果、クラスタリングモデルとしてのHMMの各状態は、学習によって獲得されたコンテンツの構造の要素に対応し、状態遷移は、コンテンツの構造の要素どうしの間での、時間的な遷移を表現する。
【0102】
そして、HMMの状態は、特徴量空間(特徴量抽出部42で抽出される特徴量の空間)において、空間的な距離が近く、かつ、時間的な前後関係が似ているフレーム群(つまり「似たシーン」)をまとめて表現する。
【0103】
ここで、例えば、学習用コンテンツがクイズ番組であり、大雑把には、クイズの出題、ヒントの提示、出演者による解答、正解発表、という流れを、番組の基本的な流れとして、この基本的な流れの繰り返しによって、番組が進行していくこととすると、番組の基本的な流れが、コンテンツの構造に相当し、その流れ(構造)を構成する、クイズの出題、ヒントの提示、出演者による解答、正解発表のそれぞれが、コンテンツの構造の要素に相当する。
【0104】
また、例えば、クイズの出題から、ヒントの提示への進行等が、コンテンツの構造の要素どうしの間での、時間的な遷移に相当する。
【0105】
なお、HMMの観測値oとしては、フレームから抽出された特徴量そのものを用いることもできるし、フレームから抽出された特徴量を離散化した離散値を用いることもできる。
【0106】
フレームから抽出された特徴量そのものを、HMMの観測値oとして用いる場合には、観測値oである特徴量が連続値であり、学習部44では、連続HMMの学習の結果られる連続HMMが、クラスタリングモデルとして求められる。
【0107】
一方、フレームから抽出された特徴量を離散化した離散値を、HMMの観測値oとして用いる場合には、学習部44では、HMMの学習の前に、フレームから抽出された特徴量を離散化する必要がある。
【0108】
フレームから抽出された特徴量(ベクトル)を離散化する方法としては、例えば、ベクトル量子化がある。
【0109】
ベクトル量子化では、特徴量空間内の有限個のセントロイドベクトルと、そのセントロイドベクトルを表すコード(シンボル)とが対応付けられたコードブックを参照して、フレームから抽出された連続値の特徴量が、その特徴量との(ユークリッド)距離が最も近いセントロイドベクトルを表すコードに変換(離散化)される。
【0110】
また、ベクトル量子化に用いられるコードブックは、例えば、コンテンツ記憶部11に記憶されたコンテンツ等を、カテゴリごとに用いて、k-means法等により求めることができる。
【0111】
この場合、学習部44では、学習用コンテンツの各フレームから抽出された特徴量が、その学習用コンテンツのカテゴリのコードブックを参照してベクトル量子化される。さらに、学習部44では、ベクトル量子化の結果得られる、学習用コンテンツの各フレームから抽出された特徴量のコードを用いて、離散HMMの学習が行われ、その結果得られる離散HMMと、特徴量のベクトル量子化に用いられたコードブックとが、クラスタリングモデルとして求められる。
【0112】
なお、学習部44では、その他、上述のベクトル量子化に用いるコードブック(だけ)を、クラスタリングモデルとして求めることができる。
【0113】
この場合、クラスタ判定部33(図4)では、再生対象コンテンツの各フレームから抽出される特徴量が、クラスタリングモデルとしてのコードブックを用いて(参照して)ベクトル量子化され、その結果得られるコードが、フレームのクラスタリング結果(フレームのクラスタ)を表すクラスタ情報として出力される。
【0114】
[クラスタ判定部33の構成例]
【0115】
図6は、図4のクラスタリング部21のクラスタ判定部33の構成例を示すブロック図である。
【0116】
クラスタ判定部33は、コンテンツ選択部51、モデル選択部52、特徴量抽出部53、及び、最尤状態系列推定部54から構成される。
【0117】
コンテンツ選択部51は、コンテンツ記憶部11に記憶されたコンテンツの中から、再生対象コンテンツを選択し、特徴量抽出部53に供給する。
【0118】
また、コンテンツ選択部51は、再生対象コンテンツのカテゴリを認識し、モデル選択部52に供給する。
【0119】
モデル選択部52は、クラスタリングモデル記憶部32に記憶されたクラスタリングモデルの中から、コンテンツ選択部51からの、再生対象コンテンツのカテゴリと一致するカテゴリのクラスタリングモデル(再生対象コンテンツのカテゴリに対応付けられたクラスタリングモデル)を、注目モデルに選択する。
【0120】
そして、モデル選択部52は、注目モデルを、最尤状態系列推定部54に供給する。
【0121】
特徴量抽出部53は、コンテンツ選択部51から供給される再生対象コンテンツの各フレームの特徴量を、図5の特徴量抽出部42と同様にして抽出し、再生対象コンテンツの各フレームの特徴量(の時系列)を、最尤状態系列推定部54に供給する。
【0122】
最尤状態系列推定部54は、例えば、Viterbiアルゴリズムに従い、モデル選択部52からの注目モデルとしてのHMMにおいて、特徴量抽出部53からの再生対象コンテンツの特徴量(の時系列)が観測される尤度が最も高い状態遷移が生じる状態系列である最尤状態系列(いわゆるビタビパスを構成する状態の系列)を推定する。
【0123】
そして、最尤状態系列推定部54は、注目モデルとしてのHMMにおいて、再生対象コンテンツの各フレームの特徴量が観測される場合の最尤状態系列(以下、再生対象コンテンツに対する注目モデルの最尤状態系列ともいう)を構成する状態のインデクス(以下、状態ID(Identification)ともいう)を、再生対象コンテンツの各フレームをクラスタリングしたクラスタリング結果を表すクラスタ情報として、セグメント区分部22(図3)に供給する。
【0124】
ここで、注目モデルにおいて、再生対象コンテンツの特徴量が観測される場合の最尤状態系列(再生対象コンテンツに対する注目モデルの最尤状態系列)の先頭を基準とする時刻tの状態(最尤状態系列を構成する、先頭からt番目の状態)を、s(t)と表すとともに、再生対象コンテンツのフレーム数を、Tと表すこととする。
【0125】
この場合、再生対象コンテンツに対する注目モデルの最尤状態系列は、T個の状態s(1),S(2),・・・,s(T)の系列であり、そのうちのt番目の状態(時刻tの状態)s(t)は、再生対象コンテンツの時刻tのフレーム(フレームt)に対応する。
【0126】
また、注目モデルの状態の総数をNと表すこととすると、時刻tの状態s(t)は、N個の状態s1,s2,・・・,sNのうちのいずれかである。
【0127】
いま、再生対象コンテンツに対する注目モデルの最尤状態系列の時刻tの状態s(t)が、N個の状態s1ないしsNのうちのi番目の状態siであるとすると、時刻tのフレームは、状態siに対応する。
【0128】
再生対象コンテンツに対する注目モデルの最尤状態系列の実体は、再生対象コンテンツの各時刻tのフレームが対応する、N個の状態s1ないしsNのうちのいずれかの状態の状態IDの系列である。
【0129】
以上のような、再生対象コンテンツに対する注目モデルの最尤状態系列は、再生対象コンテンツが、注目モデル上において、どのような状態遷移を起こすかを表現する。
【0130】
また、再生対象コンテンツに対する注目モデルの最尤状態系列において、上述したように、時刻tの状態s(t)が、N個の状態s1ないしsNのうちのi番目の状態siであるとすると、時刻tのフレームは、状態siに対応する。
【0131】
したがって、注目モデルのN個の状態それぞれを、クラスタとみなすことにより、時刻tのフレームは、注目モデルのN個の状態のうちの、最尤状態系列の、時刻tの状態s(t)であるi番目の状態siに対応するクラスタにクラスタリングされており、再生対象コンテンツに対する注目モデルの最尤状態系列の推定では、再生対象コンテンツの各フレームが属するクラスタが判定されている、ということができる。
【0132】
なお、クラスタリングモデルが、連続HMMである場合には、最尤状態系列推定部54は、Viterbiアルゴリズムに従い、クラスタリングモデルとしての連続HMMにおいて、特徴量抽出部53からの再生対象コンテンツの各フレームの特徴量が観測される最尤状態系列を推定し、その最尤状態系列を構成する状態(の状態ID)を、各フレームのクラスタ情報として、セグメント区分部22(図3)に供給する。
【0133】
また、クラスタリングモデルが、離散HMMと、コードブックである場合、最尤状態系列推定部54は、特徴量抽出部53からの再生対象コンテンツの各フレームの特徴量を、クラスタリングモデルとしてのコードブックを用いてベクトル量子化する。さらに、最尤状態系列推定部54は、Viterbiアルゴリズムに従い、クラスタリングモデルとしての離散HMMにおいて、再生対象コンテンツの各フレームの特徴量のベクトル量子化によって得られるコードが観測される最尤状態系列を推定し、その最尤状態系列を構成する状態(の状態ID)を、各フレームのクラスタ情報として、セグメント区分部22に供給する。
【0134】
また、クラスタリングモデルが、コードブック(のみ)である場合、最尤状態系列推定部54は、特徴量抽出部53からの再生対象コンテンツの各フレームの特徴量を、クラスタリングモデルとしてのコードブックを用いてベクトル量子化し、そのベクトル量子化によって得られるコードを、各フレームのクラスタ情報として、セグメント区分部22に供給する。
【0135】
図3のセグメント区分部22では、以上のようにして、クラスタ判定部33(の最尤状態系列推定部54)から供給されるクラスタ情報に基づいて、各クラスタに属する、再生対象コンテンツのフレームが認識され、各クラスタについて、そのクラスタに属するフレームを、時系列に並べたときに、時間的に連続する1フレーム以上のフレームの集まりが、1動画セグメントとして、動画セグメントに区分される。
【0136】
[マップ生成部24の構成例]
【0137】
図7は、図3のマップ生成部24の構成例を示すブロック図である。
【0138】
マップ生成部24は、クラスタ代表画像選択部61、状態間距離算出部62、座標算出部63、及び、マップ描画部64から構成される。
【0139】
クラスタ代表画像選択部61には、セグメント代表画像生成部23(図3)からのセグメント代表画像が供給される。
【0140】
クラスタ代表画像選択部61は、(注目モデルとしてのHMMの各状態に対応する)各クラスタについて、そのクラスタに属する動画セグメントのセグメント代表画像の中から、クラスタを代表するクラスタ代表画像を選択する。
【0141】
そして、クラスタ代表画像選択部61は、各クラスタに属する(動画セグメントの)セグメント代表画像を、クラスタ代表画像に選択されたセグメント代表画像を表すフラグとともに、マップ描画部64に供給する。
【0142】
ここで、クラスタ代表画像選択部61は、クラスタに、1つのセグメント代表画像のみが属する場合、そのセグメント代表画像を、クラスタ代表画像に選択する。
【0143】
また、クラスタ代表画像選択部61は、クラスタに、複数のセグメント代表画像が属する場合、例えば、その複数のセグメント代表画像のうちの、フレーム数が最大の動画セグメントのセグメント代表画像や、再生時刻が最も早い動画セグメントのセグメント代表画像等の複数のセグメント代表画像のうちの1つを、クラスタ代表画像に選択する。
【0144】
状態間距離算出部62には、クラスタリング部21(図3)において、再生対象コンテンツのクラスタリングに用いられた注目モデルとしてのHMM(クラスタリングモデル)が供給される。
【0145】
状態間距離算出部62は、注目モデルとしてのHMMの1つの状態siから他の1つの状態sjへの状態間距離dij*を、1つの状態siから他の1つの状態sjへの状態遷移確率aijに基づいて求める。そして、状態間距離算出部62は、注目モデルとしてのHMMのN個の状態の任意の状態siから任意の状態sjへの状態間距離dij*を求めると、その状態間距離dij*をコンポーネントとするN行N列の行列(状態間距離行列)を、座標算出部63に供給する。
【0146】
ここで、状態間距離算出部62は、例えば、状態遷移確率aijが所定の閾値(例えば、(1/N)×10-2)より大である場合、状態間距離dij*を、例えば、0.1(小さい値)とし、状態遷移確率aijが所定の閾値以下である場合、状態間距離dij*を、例えば、1.0(大きい値)とする。
【0147】
座標算出部63は、注目モデルのN個の状態s1ないしsNが配置される2次元又は3次元のマップ(注目モデルとしてのHMMを2次元平面又は3次元空間に投射したマップ)であるモデルマップ上の、1つの状態siから他の1つの状態sjへのユークリッド距離dijと、状態間距離算出部62からの状態間距離行列の状態間距離dij*との誤差が小さくなるように、モデルマップ上の状態siの位置の座標である状態座標Yiを求める。
【0148】
すなわち、座標算出部63は、ユークリッド距離dijと、状態間距離dij*との統計的な誤差に比例するSammon Mapのエラー関数Eを最小にするように、状態座標Yiを求める。
【0149】
ここで、Sammon Mapは、多次元尺度法の1つであり、その詳細は、例えば、J. W. Sammon, JR., "A Nonlinear Mapping for Data Structure Analysis", IEEE Transactions on Computers, vol. C-18, No. 5, May 1969に記載されている。
【0150】
Sammon Mapでは、例えば、式(1)のエラー関数Eを最小にするように、例えば、2次元のマップであるモデルマップ上の状態座標Yi=(xi,yi)が求められる。
【0151】
E=1/(Σdij)×Σ((dij*−dij2/dij*) ・・・(1)
【0152】
ここで、式(1)において、Σは、式i<jを満たすインデクスi及びjを、1ないしNの範囲の整数に変えて、サメーションをとることを表す。
【0153】
dij*は、状態間距離行列の第i行第j列の要素を表し、状態siから状態sjへの状態間距離を表す。dijは、モデルマップ上の、状態siの位置の座標(状態座標)Yi=(xi,yi)と、状態sjの位置の座標Yjとの間のユークリッド距離を表す。
【0154】
なお、状態座標Yi=(xi,yi)のxi及びyiは、それぞれ、2次元のモデルマップ上の状態座標Yiのx座標及びy座標を表す。モデルマップとして、3次元のマップを採用する場合、状態座標Yiは、x座標、y座標、及び、z座標を有する3次元の座標になる。
【0155】
座標算出部63は、式(1)のエラー関数Eが最小になるように、状態座標Yi(i=1,2,・・・,N)を、勾配法の反復適用により求め、マップ描画部64に供給する。
【0156】
マップ描画部64は、座標算出部63からの状態座標Yiの位置に、対応する状態si(の画像)を配置し、状態どうしの間を、その状態どうしの間の状態遷移確率に応じて結ぶ線分を、内蔵するメモリ(図示せず)に描画することで、注目モデルとしてのHMMを、2次元(や3次元)のモデルマップ(のグラフィクス)に変換する。
【0157】
そして、マップ描画部64は、モデルマップ上の状態siの位置に、クラスタ代表画像選択部61からのセグメント代表画像のうちの、状態siに対応するクラスタのクラスタ代表画像に選択されたセグメント代表画像を描画する。
【0158】
これにより、マップ描画部64は、モデルマップ上の各状態の位置に、その状態に対応するクラスタのクラスタ代表画像に選択されたセグメント代表画像が配置されたマップであるセグメントマップを生成する。
【0159】
さらに、マップ描画部64は、セグメントマップの各状態に、その状態に対応するクラスタに属する(フレームからなる動画セグメントの)セグメント代表画像を対応付け、その結果得られるセグメントマップを、表示制御部16(図1)に供給する。
【0160】
なお、モデルマップは、HMM等のクラスタリングモデルの構造を、状態に対応するノードと状態遷移に対応するエッジとによって可視化した2次元(や3次元)のネットワーク(グラフ)表現であるということができる。HMM等のクラスタリングモデルを、そのようなネットワーク表現としてのモデルマップに変換(投射)する方法としては、Sammon Mapの他、任意の多次元尺度法を採用することができる。
【0161】
また、クラスタリングモデルが、コードブック(のみ)である場合には、そのクラスタリングモデルとしてのコードブックは、各コードベクトルに対応する各クラスタ(各コードベクトルを表す各コードに対応する各クラスタ)について、再生対象コンテンツを用い、その再生対象コンテンツにおいて、時系列のフレームが属するクラスタが遷移(変化)する遷移回数(各クラスタから各クラスタに、フレームが属するクラスタが遷移する回数)をカウントし、コードベクトルに対応するクラスタを、HMMの状態とみなすとともに、各クラスタの遷移回数に対応する確率を、HMMの状態遷移確率とみなすことで、Sammon Map等の多次元尺度法により、2次元や3次元のマップであるモデルマップに変換することができる。
【0162】
ここで、クラスタの遷移回数に対応する確率としては、例えば、そのクラスタから、各クラスタへの遷移回数のうちの、閾値以下の遷移回数を0.0に変換し、さらに、総和が1.0になるように、遷移回数を正規化した値を採用することができる。
【0163】
また、各クラスタから(各クラスタへ)の遷移回数は、再生対象コンテンツを用いて求める他、コードブックを求めるときに用いられたすべてのコンテンツを用いて求めることができる。
【0164】
[モデルマップ]
【0165】
図8は、図7のマップ描画部64で描画されるモデルマップの例を示す図である。
【0166】
図8のモデルマップにおいて、点は、クラスタリングモデル(注目モデル)としてのHMMの状態を表し、点どうしを結ぶ線分は、状態遷移を表す。
【0167】
モデルマップ描画部64は、上述したように、座標算出部63で求められる状態座標Yiの位置に、対応する状態si(の画像(図8では、点))を描画する。
【0168】
さらに、マップ描画部64は、状態どうしの間を、その状態どうしの間の状態遷移確率に応じて結ぶ線分を描画する。すなわち、マップ描画部64は、状態siから他の状態sjへの状態遷移確率が、所定の閾値より大である場合に、それらの状態siとsjとの間を結ぶ線分を描画する。
【0169】
マップ描画部64は、以上のようにして、注目モデルとしてのHMMの構造を可視化した2次元(又は3次元)のネットワーク表現であるモデルマップを描画する。
【0170】
なお、図7の座標算出部63において、式(1)のエラー関数Eを、そのまま採用し、エラー関数Eを最小にするように、モデルマップ上の状態座標Yiを求めた場合、状態(を表す点)は、モデルマップ上に、円状に配置され、モデルマップの円周付近(外側)(外縁)に、状態が密集し、状態の配置が見にくくなって、いわば、可視性が損なわれることがある。
【0171】
そこで、図7の座標算出部63では、式(1)のエラー関数Eを修正し、修正後のエラー関数Eを最小にするように、モデルマップ上の状態座標Yiを求めることができる。
【0172】
すなわち、座標算出部63では、ユークリッド距離dijが、所定の閾値THd(例えば、THd=1.0等)より大であるかどうかを判定する。
【0173】
そして、ユークリッド距離dijが、所定の閾値THdより大でない場合には、座標算出部63は、式(1)のエラー関数の演算において、ユークリッド距離dijとして、そのユークリッド距離dijを、そのまま用いる。
【0174】
一方、ユークリッド距離dijが、所定の閾値THdより大である場合には、座標算出部63は、式(1)のエラー関数の演算において、ユークリッド距離dijとして、状態間距離dij*を用いる(dij=dij*とする)(ユークリッド距離dijを、状態間距離dij*に等しい距離とする)。
【0175】
この場合、モデルマップにおいて、ユークリッド距離dijが、ある程度近い(閾値THdより大でない)2つの状態si及びsjに注目したときには、状態座標Yi及びYjは、ユークリッド距離dijと状態間距離dij*とが一致するように(ユークリッド距離dijが状態間距離dij*に近づくように)変更される。
【0176】
一方、モデルマップにおいて、ユークリッド距離dijが、ある程度遠い(閾値THdより大の)2つの状態si及びsjに注目したときには、状態座標Yi及びYjは、変更されない。
【0177】
その結果、ユークリッド距離dijが、ある程度遠い2つの状態si及びsjは、ユークリッド距離dijが遠いままとされるので、モデルマップの円周(外縁)付近に、状態が密集することを防止し、ひいては、可視性が損なわれることを防止することができる。
【0178】
図8のモデルマップについては、以上のようにして、モデルマップの円周(外縁)付近に、状態が密集することが防止されている。
【0179】
[セグメントマップ生成部14の処理]
【0180】
図9は、図3のセグメントマップ生成部14の処理(セグメントマップ生成処理)の概要を説明する図である。
【0181】
セグメントマップ生成部14では、クラスタリング部21において、コンテンツ記憶部11に記憶された再生対象コンテンツの各フレームf1,f2,・・・について、特徴量が抽出される。
【0182】
そして、クラスタリング部21では、各フレームf1,f2,・・・の特徴量と、クラスタリングモデルとしてのHMMを用いて、各フレームf1,f2,・・・がクラスタリングされ、各フレームf1,f2,・・・が属するクラスタを表すクラスタ情報としての、例えば、フレームf1,f2,・・・の特徴量の時系列が観測される最尤状態系列を構成するHMMの状態のインデクスである状態IDの系列が、セグメント区分部22に供給される。
【0183】
図9では、再生対象コンテンツのフレームf1及びf2が、状態IDが3の状態に対応するクラスタに、フレームf3が、状態IDが2の状態に対応するクラスタに、フレームf4が、状態IDが3の状態に対応するクラスタに、フレームf5が、状態IDが5の状態に対応するクラスタに、フレームf6,f7,f8・・・が、状態IDが4の状態に対応するクラスタに、それぞれクラスタリングされている。
【0184】
セグメント区分部22(図3)は、各クラスタに属するフレームを、時間的に連続する1フレーム以上のフレームの集まりである動画セグメントに区分する。
【0185】
したがって、セグメント区分部22では、クラスタリング部21からのクラスタ情報としての状態IDの系列を、先頭からシーケンシャルに注目していった場合に、注目している状態IDが、直前の状態IDに一致している場合には、注目している状態IDに対応するフレームは、直前の状態IDに対応するフレームを含む動画セグメントに含められる。
【0186】
そして、注目している状態IDが、直前の状態IDに一致していない場合には、直前の状態IDに対応するフレームまでが、1つの動画セグメントに区分され、注目している状態IDに対応するフレームからは、新たな動画セグメントに区分される。
【0187】
図9では、状態IDが3の状態に対応するクラスタに属する、連続するフレームf1及びf2、状態IDが2の状態に対応するクラスタに属するフレームf3、状態IDが3の状態に対応するクラスタに属するフレームf4、状態IDが5の状態に対応するクラスタに属するフレームf5、及び、状態IDが4の状態に対応するクラスタに属する、連続するフレームf6,f7,f8・・・が、それぞれ、動画セグメントに区分されている。
【0188】
セグメント区分部22は、以上のような動画セグメント(のセグメント情報としての、動画セグメントが有するフレームを特定するフレーム情報と、動画セグメント(のフレーム)が属するクラスタを表すクラスタ情報)を、セグメント代表画像生成部23に供給する。
【0189】
セグメント代表画像生成部23(図3)は、例えば、上述したように、セグメント区分部22からの動画セグメントについて、その動画セグメントを代表するセグメント代表画像として、その動画セグメントの先頭のフレームを縮小したサムネイルを生成し、マップ生成部24に供給する。
【0190】
ここで、状態IDが値iの状態を状態#iとも記載することとすると、図9において、状態#3に対応するクラスタに属する、連続するフレームf1及びf2を有する動画セグメントについては、先頭のフレームf1のサムネイルが、セグメント代表画像として生成される。
【0191】
また、状態#2に対応するクラスタに属するフレームf3を有する動画セグメントについては、先頭のフレームf3のサムネイルが、状態#3に対応するクラスタに属するフレームf4を有する動画セグメントについては、先頭のフレームf4のサムネイルが、状態#5に対応するクラスタに属するフレームf5を有する動画セグメントについては、先頭のフレームf5のサムネイルが、状態#4に対応するクラスタに属する、連続するフレームf6,f7,f8・・・を有する動画セグメントについては、先頭のフレームf6のサムネイルが、それぞれ、セグメント代表画像として生成される。
【0192】
マップ生成部24(図3)では、各クラスタについて、そのクラスタに属する動画セグメントのセグメント代表画像の中から、クラスタ(に対応する状態)を代表するクラスタ代表画像が選択される。
【0193】
また、マップ生成部24では、注目モデルとしてのHMMが、モデルマップに変換されるとともに、モデルマップ上の各状態の位置に、その状態に対応するクラスタのクラスタ代表画像に選択されたセグメント代表画像が配置されたセグメントマップが生成される。
【0194】
そして、マップ生成部24では、セグメントマップの各状態に、その状態に対応するクラスタに属する動画セグメントのすべてのセグメント代表画像が対応付けられる。
【0195】
図9では、状態#3に対応するクラスタに属する、連続するフレームf1及びf2を有する動画セグメントのセグメント代表画像であるフレームf1のサムネイルが、状態#3に、状態#2に対応するクラスタに属するフレームf3を有する動画セグメントのセグメント代表画像であるフレームf3のサムネイルが、状態#2に、状態#3に対応するクラスタに属するフレームf4を有する動画セグメントのセグメント代表画像であるフレームf4のサムネイルが、状態#3に、状態#5に対応するクラスタに属するフレームf5を有する動画セグメントのセグメント代表画像であるフレームf5のサムネイルが、状態#5に、状態#4に対応するクラスタに属する、連続するフレームf6,f7,f8・・・を有する動画セグメントのセグメント代表画像であるフレームf6のサムネイルが、状態#4に、それぞれ対応付けられている。
【0196】
図10は、セグメントマップ生成部14(図3)で生成されるセグメントマップの例を示す図である。
【0197】
セグメントマップにおいては、図8のモデルマップの各状態の位置に、その状態に対応するクラスタのクラスタ代表画像に選択されたセグメント代表画像が配置されている。
【0198】
所定のカテゴリのコンテンツとしての、例えば、毎日、又は、毎週放送されているニュースのテレビジョン放送番組(ニュース番組)の2回以上の放送分のうちの、最新の放送分のニュース番組を除く、過去の放送分のニュース番組を、学習用コンテンツとして用いて、クラスタリングモデルとしてのHMMの学習を行い、最新の放送分のニュース番組を、再生対象コンテンツとして、セグメントマップ生成部14に与えることにより、図10に示したようなセグメントマップが生成される。
【0199】
以上のように、セグメントマップは、モデルマップ(図8)に、(クラスタ代表画像に選択された)セグメント代表画像を配置した、モデルマップを、いわばベースとするマップである。
【0200】
モデルマップは、学習後のHMMを、多次元尺度法により2次元平面に投射したマップであり、かかるモデルマップによれば、見た目の特徴等が似ており、かつ、時間前後関係が近接するシーン(フレーム)がクラスタリングされるクラスタ群が、2次元表現上での遷移可能な近傍状態群として表現される。
【0201】
そして、そのようなモデルマップをベースとするセグメントマップによれば、例えば、再生対象コンテンツとしてのニュース番組のキャスタが映っているシーン(フレーム、ひいては、動画セグメント)が、ある状態(に対応するクラスタ)にクラスタリングされて集まり、そのようなシーンから遷移する、例えば、スポーツコーナの各シーンや、明日の天気予報のシーン群等が、それぞれ、他の状態にクラスタリングされて集まる、という形で、番組のシーン構成が、2次元の地図として表現される。
【0202】
したがって、セグメントマップは、再生対象コンテンツの、いわばシーン地図である、ということができ、ユーザに、再生対象コンテンツを俯瞰させることができる可視化の有効な手段として機能する。
【0203】
なお、図10では、(クラスタ代表画像に選択された)セグメント代表画像が配置されていない状態が存在する。セグメント代表画像が配置されていない状態の存在は、その状態(に対応するクラスタ)にクラスタリングされる再生対象コンテンツのフレームがなかったことを表す。
【0204】
ところで、セグメントマップの各状態に配置されるセグメント代表画像のサイズは、状態ごとに異なるサイズにすることもできるし、状態によらず一定のサイズにすることもできる。
【0205】
セグメントマップの各状態に配置されるセグメント代表画像のサイズを、状態ごとに異なるサイズにする場合には、マップ描画部64(図7)において、例えば、各状態について、重要度を求め、その重要度に対応するサイズで、セグメント代表画像を、セグメントマップ(モデルマップ)上に配置することができる。
【0206】
図11は、状態の重要度を求める方法を説明する図である。
【0207】
マップ描画部64は、モデルマップの各状態(クラスタリングモデルとしてのHMMの各状態)について、その状態が、再生対象コンテンツ全体内で、どの程度重要なシーンを表現しているのか(どの程度重要なシーンがクラスタリングされるクラスタに対応する状態であるのか)を表す指標DoI(Degree of Importance)を、重要度として求める。
【0208】
いま、状態siの重要度を、DoI(i)と表すとともに、状態si(に対応するクラスタ)にクラスタリングされた再生対象コンテンツの動画セグメントのうちの、k番目の動画セグメントの長さ(フレーム数)であるセグメント長を、LEN(k)と表すこととすると、マップ描画部64は、式DoI(i)=max{LEN(k)}に従って、状態siの重要度DoI(i)を求める。
【0209】
なお、max{LEN(k)}は、状態siにクラスタリングされた再生対象コンテンツの動画セグメントの数をKで表すこととすると、LEN(1),LEN(2),・・・,LEN(K)の中の最大値、つまり、状態siにクラスタリングされた再生対象コンテンツの動画セグメントの最大のフレーム数を表す。
【0210】
マップ描画部64は、各状態siの重要度DoI(i)を求めると、すべての状態s1,s2,・・・,sNの重要度DoI(1),DoI(2),・・・,DoI(N)の平均値DoIAV=(DoI(1),DoI(2),・・・,DoI(N))/Nを求める。
【0211】
さらに、マップ描画部64は、重要度DoIを引数として、セグメント代表画像のサイズを決定するための係数であるサイズ係数αを求める関数である係数関数α=f(DoI)を、重要度の平均値DoIAVを用いて求める。
【0212】
ここで、係数関数α=f(DoI)は、例えば、図11に示すように、引数である重要度DoIが、0から重要度の平均値DoIAVまでの範囲では、引数である重要度DoIに比例して増加し、引数である重要度DoIが0のときに、α=0となり、引数である重要度DoIがDoIAVのときに、α=1.0となる関数であり、かつ、引数である重要度DoIが、重要度の平均値DoIAVを超える範囲では、α=1.0の一定値となる関数である。
【0213】
マップ描画部64は、重要度の平均値DoIAVを用いて、係数関数α=f(DoI)を求めると、各状態siについて、サイズ係数α=f(DoI(i))を求め、そのサイズ係数α=f(DoI(i))を、あらかじめ設定されたセグメント代表画像のサイズである標準サイズに乗算することにより、セグメントマップに配置するセグメント代表画像のサイズを求め、そのサイズで、(クラスタ代表画像に選択された)セグメント代表画像を、セグメントマップに配置する。
【0214】
以上のように、状態の重要度に対応するサイズで、セグメント代表画像を、セグメントマップ上に配置することにより、セグメントマップでは、図10に示したように、重要度が大きい状態にクラスタリングされたセグメント代表画像ほど、大きいサイズで表示される。
【0215】
したがって、ユーザは、セグメントマップを見ることで、重要度が大きい状態にクラスタリングされている動画セグメント、ひいては、再生対象コンテンツにおいて重要なシーンを、迅速に認識することができる。
【0216】
図12は、セグメントマップ生成部14(図3)が、図2のステップS12で行うセグメントマップ生成処理を説明するフローチャートである。
【0217】
ステップS21では、クラスタリング部21(図3)が、再生対象コンテンツの各フレームをクラスタリングして、処理は、ステップS22に進む。
【0218】
すなわち、クラスタリング部21では、クラスタ判定部33(図4)が、再生対象コンテンツの各フレームの特徴量を抽出する。
【0219】
さらに、クラスタ判定部33は、クラスタリングモデル記憶部32(図4)に記憶されたクラスタリングモデルとしてのHMMのうちの、再生対象コンテンツと同一のカテゴリのHMMを、注目モデルに選択する。
【0220】
そして、クラスタ判定部33は、注目モデルとしてのHMMにおいて、再生対象コンテンツの各フレームの特徴量の時系列が観測される最尤状態系列を推定し、その最尤状態系列(を構成するHMMの状態のインデクスである状態IDの系列)を、再生対象コンテンツの各フレームのクラスタリング結果を表すクラスタ情報として、セグメント区分部22に供給する。
【0221】
ステップS22では、セグメント区分部22(図3)が、クラスタリング部21(のクラスタ判定部33)からのクラスタ情報に基づいて、各クラスタに属するフレームを、時間的に連続する1フレーム以上のフレームの集まりである動画セグメントに区分する。
【0222】
そして、セグメント区分部22は、再生対象コンテンツの各動画セグメントについて、その動画セグメントを表すセグメント情報を、セグメント代表画像生成部23に供給して、処理は、ステップS22からステップS23に進む。
【0223】
ステップS23では、セグメント代表画像生成部23(図3)は、再生対象コンテンツの各動画セグメントについて、セグメント区分部22からのセグメント情報に基づいて認識される、動画セグメントを構成するフレームを用いて、その動画セグメントを代表するセグメント代表画像を生成する。
【0224】
そして、セグメント代表画像生成部23は、各動画セグメントのセグメント代表画像を、マップ生成部24に供給して、処理は、ステップS23からステップS24に進む。
【0225】
ステップS24では、マップ生成部24(図3)は、セグメント代表画像生成部23からのセグメント代表画像を用いて、セグメントマップを生成し、表示制御部16に供給して、セグメントマップ生成処理が終了する。
【0226】
すなわち、マップ生成部24では、状態間距離算出部62(図7)が、注目モデルとしてのHMMの1つの状態siから他の1つの状態sjへの状態間距離dij*を、状態遷移確率aijに基づいて求め、その状態間距離dij*をコンポーネントとするN行N列の行列である状態間距離行列を算出して、座標算出部63に供給する。
【0227】
座標算出部63(図7)は、Sammon Map等の多次元尺度法に従い、状態間距離算出部62からの状態間距離行列を用いて、例えば、上述の式(1)のエラー関数Eを最小にするように、注目モデルとしてのHMMの各状態siのモデルマップ上の座標Yi=(xi,yi)を求め、マップ描画部64に供給する。
【0228】
マップ描画部64(図7)は、座標算出部63からの座標Yiの位置に、対応する状態si(の画像)を配置し、状態どうしの間を、その状態どうしの間の状態遷移確率に応じて結ぶ線分を描画することで、注目モデルとしてのHMMを、2次元のモデルマップ(のグラフィクス)に変換する。
【0229】
また、マップ生成部24において、クラスタ代表画像選択部61(図7)は、(注目モデルとしてのHMMの各状態に対応する)各クラスタについて、そのクラスタに属する動画セグメントのセグメント代表画像の中から、クラスタを代表するクラスタ代表画像を選択する。
【0230】
そして、クラスタ代表画像選択部61は、各クラスタに属するセグメント代表画像を、クラスタ代表画像に選択されたセグメント代表画像を表すフラグとともに、マップ描画部64に供給する。
【0231】
マップ描画部64(図7)は、モデルマップ(セグメントマップ)の各状態について、その状態に対応するクラスタに属するセグメント代表画像を、クラスタ代表画像選択部61からのセグメント代表画像から抽出し、そのセグメント代表画像が属する(クラスタに対応する)状態に対応付ける。
【0232】
また、マップ描画部64は、モデルマップの各状態の重要度DoIを、例えば、図11で説明したようにして求める。
【0233】
そして、マップ描画部64は、モデルマップ上の各状態siについて、状態siに対応付けられているセグメント代表画像のうちの、状態siに対応するクラスタのクラスタ代表画像に選択されたセグメント代表画像を、状態siの位置に描画することで、セグメントマップを生成する。
【0234】
なお、マップ描画部64は、状態siに対応するクラスタのクラスタ代表画像に選択されたセグメント代表画像を描画するにあたり、状態siの重要度DoI(i)に対応するサイズで、セグメント代表画像を描画する。
【0235】
以上のようなセグメントマップ生成処理によって得られるセグメントマップは、セグメントマップ生成部14から表示制御部16(図1)に供給される。
【0236】
そして、表示制御部16では、セグメントマップが、表示部17に表示される。
【0237】
セグメントマップが、表示部17に表示された後、表示制御部16では、図2のステップS14で説明したように、ユーザの操作(操作イベント処理部12(図1)で発生する操作イベント)に応じて、セグメントマップの表示制御が行われる。
【0238】
[表示制御部16によるセグメントマップ等の表示制御]
【0239】
表示制御部16がセグメントマップの表示の表示制御を行うときの表示モード(セグメントマップの表示時の表示制御部16の内部状態)としては、レイヤ0モード、レイヤ1モード、及び、レイヤ2モードの3つのモードがある。
【0240】
表示制御部16は、セグメントマップ生成部14からセグメントマップが供給されると、表示モードをレイヤ0モードにして、セグメントマップを表示部17に表示する(表示させる)。
【0241】
レイヤ0モードでは、表示部17において、セグメントマップは、例えば、図10に示したように表示される。
【0242】
図13は、レイヤ0モードにおいて、ユーザが、表示部17の表示画面上の位置を指示したときのセグメントマップの表示例を示す図である。
【0243】
ここで、以下では、説明を分かりやすくするために、ユーザが操作を行う操作手段として、例えば、マウスを採用し、操作イベント処理部12(図1)では、マウスの(シングル)クリックや、ダブルクリック、(マウス)カーソルの移動等の操作イベントが発生されることとする。
【0244】
また、操作イベントには、カーソルの位置の情報が含まれることとする。
【0245】
なお、ユーザが操作を行う操作手段としては、マウスの他、タッチパネルその他のポインティングデバイス等を採用することができる。操作手段として、タッチパネルを採用する場合、マウスのタップ、及び、ダブルタップは、例えば、それぞれ、マウスのクリック、及び、ダブルクリックに対応させることができる。
【0246】
さらに、マウスでのカーソルの移動は、例えば、指等をタッチパネルにタッチした状態で、その指を移動させることに対応させることができる。なお、タッチパネルが、指等の近接を検出することができる場合には、マウスでのカーソルの移動は、例えば、タッチパネルに近接した指を移動させることに対応させることができる。
【0247】
レイヤ0モードでは、表示制御部16は、マウスの操作に従って移動するカーソルの位置を、ユーザが指示する指示位置とし、その指示位置に最も近いセグメントマップ上の状態を、注目する注目状態として、注目状態(に対応するクラスタ)に対応付けられたセグメント代表画像の一覧の画像であるタイル画像を、セグメントマップに重畳する形で、表示部17に表示する。
【0248】
図13は、タイル画像が重畳されたセグメントマップの表示例を示す図である。
【0249】
レイヤ0モードにおいて、表示制御部16は、ユーザの指示位置に最も近いセグメントマップ上の状態を、注目する注目状態として、その注目状態の位置と、指示位置との距離が閾値以下である場合には、注目状態に対応付けられたセグメント代表画像の一覧の画像であるタイル画像を生成し、セグメントマップに重畳して表示する。
【0250】
ここで、タイル画像においては、注目状態に対応付けられたセグメント代表画像が、例えば、時系列に、左から右、及び、上から下方向に、タイル状(格子状)に並ぶように配置される。
【0251】
図14は、以上のようにタイル画像が表示されるときの表示制御部16の表示制御の処理を説明するフローチャートである。
【0252】
図14の処理は、例えば、カーソルが移動されたとき等の不定期のタイミングで、又は、周期的なタイミングで開始される。
【0253】
ステップS41において、表示制御部16は、セグメントマップの状態のうちの、ユーザの指示位置であるカーソルの位置に最も近い状態を、注目状態に選択して、処理は、ステップS42に進む。
【0254】
ステップS42では、表示制御部16は、ユーザの指示位置であるカーソルの位置から注目状態の位置までの距離(以下、カーソル間距離ともいう)が、閾値以下であるかどうかを判定する。
【0255】
ステップS42において、カーソル間距離が、閾値以下でないと判定された場合、すなわち、カーソルが、例えば、表示部17の表示画面の端部等の、セグメントマップのいずれの状態からも離れた位置にある場合、表示制御部16は、ステップS43及びS44をスキップして、処理を終了する。
【0256】
なお、カーソル間距離が、閾値以下でない場合に、表示部17に、タイル画像が表示されているときには、表示制御部16は、そのタイル画像を消去する。
【0257】
一方、ステップS42において、カーソル間距離が、閾値以下であると判定された場合、処理は、ステップS43に進み、表示制御部16は、注目状態に対応付けられたセグメント代表画像を、時系列順に並べた一覧の画像であるタイル画像を生成して、処理は、ステップS44に進む。
【0258】
ここで、表示制御部43は、タイル画像を表示する表示エリアのサイズを、注目状態に対応付けられたセグメント代表画像の数に応じて設定する。
【0259】
すなわち、表示制御部43は、タイル画像を表示する表示エリアのサイズについて、あらかじめ決められている最小のサイズから最大のサイズまでの範囲において、注目状態に対応付けられたセグメント代表画像の数が多くなるほど、サイズが大になるように、タイル画像を表示する表示エリアのサイズを設定する。
【0260】
以下、注目状態に対応付けられたセグメント代表画像の数に応じて設定された表示エリアのサイズを、設定サイズともいう。
【0261】
表示制御部43は、設定サイズの表示エリアに表示されるタイル画像内に、注目状態に対応付けられたセグメント代表画像すべてを配置することができるように、タイル画像の横と縦のそれぞれに配置するセグメント代表画像の数と、タイル画像に配置するセグメント代表画像のサイズとを決定する。
【0262】
なお、最大の表示エリアに表示されるタイル画像内に配置することができるセグメント代表画像の数の最大値NUMmax(、及び、そのセグメント代表画像のサイズの最小値)は、あらかじめ決められており、注目状態に対応付けられているセグメント代表画像の数が、最大値NUMmaxを超える場合には、タイル画像に配置されるセグメント代表画像の数は、最大値NUMmaxに制限される。すなわち、注目状態に対応付けられているセグメント代表画像のうちの、例えば、時系列順で、最大値NUMmaxに等しい数のセグメント代表画像が、タイル画像に配置される。
【0263】
ステップS44では、表示制御部14は、注目状態に対応付けられたセグメント代表画像を並べたタイル画像を、セグメントマップの注目状態の近傍に重畳する形で表示して、処理を終了する。
【0264】
なお、カーソル間距離が、閾値以下である場合に、表示部17に、注目状態のタイル画像(注目状態に対応付けられたセグメント代表画像を並べたタイル画像)が、既に表示されているときには、表示制御部16は、ステップS43及びS44をスキップし、既に表示されているタイル画像の表示を、そのまま維持する。
【0265】
また、カーソル間距離が、閾値以下である場合に、表示部17に、注目状態以外の状態のタイル画像が表示されているときには、表示制御部16は、そのタイル画像を消去する。
【0266】
以上のように、レイヤ0モードでは、ユーザの指示位置に最も近いセグメントマップ上の状態(注目状態)に対応付けられたセグメント代表画像の一覧の画像であるタイル画像が表示されるので、ユーザは、カーソルを、所望の状態の位置付近に移動するだけで、その所望の状態に対応付けられたセグメント代表画像の一覧を確認し、ひいては、その所望の状態(に対応するクラスタ)にクラスタリングされているシーンを把握することができる。
【0267】
ここで、上述の場合には、ユーザの指示位置に最も近いセグメントマップ上の状態(注目状態)に対応付けられたセグメント代表画像の一覧の画像であるタイル画像を表示することとしたが、タイル画像の表示に代えて、注目状態の位置に表示されている(クラスタ代表画像に選択された)セグメント代表画像の強調表示を行うことができる。
【0268】
セグメント代表画像の強調表示を行う方法としては、例えば、セグメント代表画像のサイズを大きくする方法や、セグメント代表画像の周囲を囲む赤枠を表示する方法等を採用することができる。
【0269】
なお、タイル画像の表示、及び、注目状態の位置に表示されているセグメント代表画像の強調表示のうちのいずれを行うかは、ユーザの操作に応じて設定することができる。
【0270】
以下では、タイル画像の表示が行われることとする。
【0271】
レイヤ0モードにおいて、タイル画像が表示されているときに、ユーザが、あらかじめ決められた所定の操作としての、例えば、マウスの(シングル)クリックを行うと、表示制御部16は、表示モードを、レイヤ0モードから、レイヤ1モードに移行(変更)(設定)する。
【0272】
レイヤ1モードでは、表示制御部16は、タイル画像の表示を固定(ロック)する。
【0273】
すなわち、レイヤ0モードでは、ユーザがカーソルを移動させると、移動後のカーソルに最も近い状態に対応付けられたセグメント代表画像が時系列に配置されたタイル画像が表示されるため、カーソルの移動によって、カーソルに最も近い状態が変化すると、タイル画像も変化する。
【0274】
そのような、タイル画像が表示されるレイヤ0モードにおいて、タイル画像が表示されているときに、クリックが行われると、表示制御部16は、表示モードを、レイヤ0モードから、レイヤ1モードに移行し、そのとき表示されていたタイル画像の表示が維持されるように、タイル画像の表示を固定する。
【0275】
ここで、レイヤ1モードにおいて、表示が固定されたタイル画像を、固定タイル画像ともいう。
【0276】
図15は、固定タイル画像の表示例を示す図である。
【0277】
固定タイル画像は、レイヤ0モードにおいてクリックが行われる直前に表示されていたタイル画像、すなわち、レイヤ0モードにおいてクリックが行われたときのカーソルの位置に最も近い位置の状態である注目状態に対応付けられたセグメント代表画像が配置されたタイル画像を含む画像であり、レイヤ1モードにおいて、固定タイル画像が表示された後は、カーソルが移動しても(ユーザの指示位置が変化しても)、固定タイル画像の表示は、そのまま維持される。
【0278】
図16は、固定タイル画像の詳細を示す図である。
【0279】
固定タイル画像においては、下部に、レイヤ0モードにおいてクリックが行われる直前に表示されていたタイル画像が配置され、その上部に、ヘッダ部が配置されている。
【0280】
ヘッダ部には、ブックマークボタン、保存ボタン、時計マーク、及び、タイムラインバーが配置される。
【0281】
ブックマークボタンは、注目状態、すなわち、固定タイル画像の下部のタイル画像に配置されたセグメント代表画像が対応付けられた状態を、ユーザがお気に入りのシーンがクラスタリングされるお気に入りの状態として、仮登録するときに操作(例えば、クリック)される。
【0282】
ブックマークボタンが操作されると、注目状態は、お気に入りの状態として仮登録され、再度、ブックマークボタンが操作されると、注目状態の仮登録が解除される。
【0283】
保存ボタンは、お気に入りの状態の仮登録を、本登録するときに操作(例えば、クリック)される。
【0284】
保存ボタンが操作されたときに、注目状態が、お気に入りの状態として仮登録されていれば、注目状態が、お気に入り状態として本登録される。また、例えば、注目状態が、既に、お気に入り状態として本登録されている場合に、保存ボタンが操作されると、注目状態の本登録が解除される。
【0285】
ここで、以上のように、保存ボタンが操作されたときに、注目状態が、お気に入りの状態として仮登録されていると、注目状態が、お気に入りの状態として本登録されるので、注目状態が、お気に入りの状態として仮登録されている場合の、保存ボタンの操作は、注目状態の本登録を要求する操作であり、以下、お気に入り操作ともいう。
【0286】
お気に入り操作に応じて行われる本登録では、操作イベント処理部12(図1)において、ユーザを識別するユーザIDに対応付けて、再生対象コンテンツのセグメントマップのベースとなったモデルマップの生成に用いられた注目モデルとしてのHMMを識別するモデルIDと、お気に入りの状態として本登録する状態(クラスタ)を識別する状態IDとが、お気に入り情報として、お気に入り情報記憶部13に記憶される。
【0287】
なお、ユーザIDは、ユーザが、図1の画像処理装置を使用するときに、ユーザによって入力されることとする。
【0288】
また、クラスタリングモデルとしてのHMMには、クラスタリングモデル学習部31において、学習後に、そのHMMを識別するためのモデルIDが割り当てられることとする。
【0289】
時計マークは、例えば、再生対象コンテンツの先頭から最後までの再生時間を、時計の針の1周の時間(0分から60分までの1時間)に割り当て、タイル画像に配置されているセグメント代表画像(注目状態に対応付けられたセグメント代表画像)のうちの、注目している注目代表画像に対応する動画セグメントの、再生対象コンテンツ内での再生のタイミングを表す時刻を表示するアイコンである。
【0290】
図16では、注目代表画像が存在しない(選択されていない)ため、時計マークは、再生対象コンテンツの先頭のタイミングを表す0分を表示している。
【0291】
タイムラインバーは、横長のバーであり、再生対象コンテンツの先頭から最後までの再生時間を、タイムラインバーの左端から右端までに割り当て、タイル画像に配置されているセグメント代表画像それぞれに対応する動画セグメントの、再生対象コンテンツ内での再生のタイミングに相当する時刻(位置)を表す。
【0292】
図16のタイムラインバーにおいて、斜線を付してある部分が、タイル画像に配置されているセグメント代表画像それぞれに対応する動画セグメントの、再生対象コンテンツ内での再生のタイミングに相当する時刻を表す。
【0293】
レイヤ1モードでは、表示制御部16は、マウスの操作に従って移動するカーソルの位置を、ユーザが指示する指示位置として、固定タイル画像(のタイル画像)に配置されたセグメント代表画像(注目状態に対応付けられたセグメント代表画像)のうちの、指示位置(カーソルの位置)に最も近いセグメント代表画像を、注目する注目代表画像として、その注目代表画像を強調表示する。
【0294】
図17は、注目代表画像の強調表示の表示例を示す図である。
【0295】
レイヤ1モードでは、表示制御部16は、固定タイル画像に配置されたセグメント代表画像のうちの、ユーザの指示位置に最も近いセグメント代表画像を、注目代表画像に選択し、その注目代表画像を、固定タイル画像とは別に強調表示する。
【0296】
注目代表画像の強調表示では、注目代表画像を、例えば、固定タイル画像に配置されているサイズの2倍のサイズ等の大きなサイズで表示することや、注目代表画像を、赤枠で囲んで表示することができる。
【0297】
図17では、注目代表画像が、固定タイル画像に配置されているサイズよりも大きなサイズで表示されることにより、強調表示されている。
【0298】
なお、レイヤ1モードでは、表示制御部16は、例えば、ユーザの指示位置が、固定タイル画像上にある場合にのみ、その指示位置に最も近いセグメント代表画像を、注目代表画像に選択する。
【0299】
したがって、ユーザの指示位置(カーソル)が、固定タイル画像上にない場合には、固定タイル画像に配置されているセグメント代表画像のいずれも、注目代表画像には選択されない。
【0300】
また、図17では、固定タイル画像に配置されたセグメント代表画像のうちの、ユーザの指示位置に最も近いセグメント代表画像が、注目代表画像に選択されており、そのため、時計マークは、注目代表画像に対応する動画セグメントの、再生対象コンテンツ内での再生のタイミングを表す時刻を表示している。
【0301】
さらに、図17では、ユーザが、注目代表画像に対応する動画セグメントの、再生対象コンテンツ内での再生のタイミングを認識することができるように、タイムラインバーにおいて、注目代表画像に対応する動画セグメントの、再生対象コンテンツ内での再生のタイミングに相当する部分(黒塗りの部分)が、他の部分と異なる表示になっている。
【0302】
レイヤ1モードにおいて、注目代表画像が選択されているときに、ユーザが、あらかじめ決められた所定の操作としての、例えば、マウスの(シングル)クリックを行うと、表示制御部16は、表示モードを、レイヤ1モードから、レイヤ2モードに移行する。
【0303】
レイヤ2モードでは、表示制御部16は、固定タイル画像に代えて、又は、固定タイル画像に重畳して、タイムライン画像を表示する。
【0304】
すなわち、レイヤ1モードでは、ユーザが、固定タイル画像上においてカーソルを移動させると、移動後のカーソルに最も近いセグメント代表画像が、注目代表画像に選択され、注目画像が強調表示されるが、注目代表画像が選択されているときに、クリックが行われると、表示制御部16は、表示モードを、レイヤ1モードから、レイヤ2モードに移行し、固定タイル画像に配置されたセグメント代表画像(注目状態に対応付けられたセグメント代表画像)のうちの、注目代表画像と、注目代表画像の前後に続く所定の数のセグメント代表画像とを、注目画像を中心として、時系列に配置したタイムライン画像を生成し、表示部17に表示する。
【0305】
図18は、タイムライン画像の表示例を示す図である。
【0306】
レイヤ1モードにおいて、固定タイル画像に配置されたセグメント代表画像(注目状態に対応付けられたセグメント代表画像)のうちのいずれかのセグメント代表画像が、注目代表画像に選択されているときに、クリックが行われると、表示制御部16は、表示モードを、レイヤ1モードから、レイヤ2モードに移行し、固定タイル画像に配置されたセグメント代表画像のうちの、注目代表画像と、注目代表画像の前後に続く所定の数のセグメント代表画像とを、タイムライン画像を構成する構成画像として選択する。
【0307】
そして、表示制御部16は、構成画像を、例えば、左から右に、時系列順に並べて配置したタイムライン画像を生成し、表示部17に表示する。
【0308】
図18では、注目代表画像と、その注目代表画像の時間的に前に続く(過去側の)3枚のセグメント代表画像、及び、注目代表画像の時間的に後に続く(未来側の)3枚のセグメント代表画像との、合計で、7枚のセグメント代表画像が、構成画像として選択されている。
【0309】
そして、7枚の構成画像を、左から右に、時系列順に並べて配置することによって、タイムライン画像が構成されている。
【0310】
以上のように、タイムライン画像においては、構成画像としての、固定タイル画像に配置されたセグメント代表画像のうちの、注目代表画像と、注目代表画像の前後それぞれに続く3枚のセグメント代表画像との、合計で7枚のセグメント代表画像が、時系列順に配置されるので、注目代表画像は、タイムライン画像の中央部分に配置される。
【0311】
タイムライン画像においては、構成画像としての7枚のセグメント代表画像を、すべて、同一のサイズで配置することもできるし、中央部分に配置される注目代表画像から離れた位置の構成画像ほど、小さいサイズで配置することもできる。
【0312】
図18のタイムライン画像では、中央部分に配置される注目代表画像から離れた位置の構成画像ほど、小さいサイズで配置されている。
【0313】
また、タイムライン画像においては、図18に示すように、その上部に、固定タイル画像(図16)のヘッダ部に配置されるのと同様の時計マークとタイムラインバーを配置することができる。
【0314】
ここで、図18では、固定タイル画像に配置されたセグメント代表画像(注目状態に対応付けられたセグメント代表画像)のうちの、注目代表画像を中心とする時系列に7枚のセグメント代表画像を、タイムライン画像の構成画像として採用することとしたが、タイムライン画像の構成画像は、7枚に限定されるものではない。
【0315】
図19は、タイムライン画像が表示されるときの表示制御部16の表示制御の処理を説明するフローチャートである。
【0316】
レイヤ1モードにおいて、固定タイル画像に配置されたセグメント代表画像(注目状態に対応付けられたセグメント代表画像)のうちのいずれかのセグメント代表画像が、注目代表画像に選択されているときに、所定の操作としてのクリックが行われると、表示モードがレイヤ1モードからレイヤ2モードとなって、図19の処理が開始される。
【0317】
ステップS51において、表示制御部16は、固定タイル画像に配置されたセグメント代表画像(注目状態に対応付けられたセグメント代表画像)のうちの、注目代表画像と、注目代表画像の前後に続く所定の数のセグメント代表画像(過去側に並ぶ所定の数のセグメント代表画像、及び、未来側に並ぶ所定の数のセグメント代表画像)とを、タイムライン画像を構成する構成画像として選択して、処理は、ステップS52に進む。
【0318】
ステップS52では、表示制御部16は、構成画像を、左から右に、時系列順に並べて配置したタイムライン画像を生成して、処理は、ステップS53に進む。
【0319】
ここで、構成画像を、左から右に、時系列順に並べて配置したタイムライン画像は、構成画像のうちの、注目代表画像を中心として、その注目代表画像よりも(動画セグメントが)過去側の構成画像としてのセグメント代表画像が、時系列順に左側に配置されるとともに、注目代表画像よりも未来側の構成画像としてのセグメント代表画像が、時系列順に右側に配置された画像となる。
【0320】
また、表示制御部16は、構成画像を配置するときに、中央部分に配置される注目代表画像から離れた位置の構成画像ほど、小さいサイズで配置する。
【0321】
ステップS53では、表示制御部16は、タイムライン画像を、セグメントマップの注目状態の近傍に表示して、処理を終了する。
【0322】
以上のようにして、レイヤ2モードでは、タイムライン画像が、図18に示したように表示される。
【0323】
なお、タイムライン画像については、固定タイル画像に配置されたセグメント代表画像、すなわち、注目状態に対応付けられたセグメント代表画像の中から、注目代表画像と、注目代表画像の前後に続く所定の数のセグメント代表画像とを、構成画像として選択する他、例えば、再生対象コンテンツを構成する動画セグメントのすべてのセグメント代表画像の中から、注目代表画像と、注目代表画像に対応する動画セグメントの前後に続く所定の数の動画セグメントそれぞれのセグメント代表画像(注目状態に対応付けられたセグメント代表画像に限られない)とを、構成画像として選択することができる。
【0324】
以下では、注目状態に対応付けられたセグメント代表画像の中から、タイムライン画像の構成画像が選択されることとする。
【0325】
表示制御部16がレイヤ2モードにおいて表示するタイムライン画像に配置される構成画像としてのセグメント代表画像は、ユーザの操作に応じてスクロールすることができる。
【0326】
図20は、タイムライン画像に配置される構成画像としてのセグメント代表画像のスクロールの表示例を示す図である。
【0327】
表示制御部16において、タイムライン画像の左端側の一部のエリアは、過去側へのスクロールを指示する過去スクロールエリア(図示せず)に設定されており、タイムライン画像の右端側の一部のエリアは、未来側へのスクロールを指示する未来スクロールエリア(図示せず)に設定されている。
【0328】
ここで、タイムライン画像に設定された過去スクロールエリア、及び、未来スクロールエリアの両方、又は、一方を、以下、単に、スクロールエリアともいう
【0329】
表示制御部16は、レイヤ2モードにおいて、ユーザの指示位置であるカーソルの位置が、タイムライン画像上に設定されたスクロールエリア内である場合、スクロールを行うことを、ユーザに報知するためのスクロールマークを表示し、タイムライン画像に配置される構成画像としてのセグメント代表画像をスクロールする。
【0330】
図20では、カーソルが、タイムライン画像上に設定された左端側の過去スクロールエリア内に位置しており、過去側へのスクロールを行うことを表すスクロールマークが、タイムライン画像の左端に表示されている。
【0331】
この場合、表示制御部16は、注目状態に対応付けられた時系列のセグメント代表画像のうちの、注目代表画像に隣接する過去側のセグメント代表画像を、タイムライン画像の中央部分に配置すべき中央画像とし、その中央画像と、中央画像の前後それぞれに続く3枚のセグメント代表画像との、合計で7枚のセグメント代表画像を、構成画像として新たに選択する。
【0332】
そして、表示制御部16は、タイムライン画像に、いま表示されている構成画像に代えて、新たに選択した構成画像を、時系列に配置する。
【0333】
その結果、タイムライン画像を構成する構成画像は、注目状態に対応付けられた時系列のセグメント代表画像のうちの、注目代表画像に隣接する過去側のセグメント代表画像を中心とする時系列の7枚のセグメント代表画像になり、過去側に、1枚のセグメント代表画像分だけ過去側にスクロールされる。
【0334】
ここで、過去側へのスクロールの方向は、図20に矢印で示すように、左から右方向になる(タイムライン画像を構成する構成画像が、左から右方向にずれる)。
【0335】
以上のように、スクロールが行われた後、カーソルが、タイムライン画像上に設定された左端側の過去スクロールエリア内に位置したままになっていると、表示制御部16は、スクロールマークの表示を維持し、さらに、注目状態に対応付けられた時系列のセグメント代表画像のうちの、中央画像に隣接する過去側のセグメント代表画像を、新たな中央画像とし、その新たな中央画像と、新たな中央画像の前後それぞれに続く3枚のセグメント代表画像との、合計で7枚のセグメント代表画像を、構成画像として新たに選択する。
【0336】
そして、表示制御部16は、タイムライン画像に、いま表示されている構成画像に代えて、新たに選択した構成画像を、時系列に配置する。
【0337】
その結果、タイムライン画像を構成する構成画像は、注目状態に対応付けられた時系列のセグメント代表画像のうちの、前回の中央画像に隣接する過去側のセグメント代表画像を中心とする時系列の7枚のセグメント代表画像になり、過去側に、さらに、1枚のセグメント代表画像分だけ過去側にスクロールされる。
【0338】
以下、カーソルが、タイムライン画像上に設定された左端側の過去スクロールエリア内に位置している限り、同様の処理が行われ、タイムライン画像の過去側へのスクロールが続行される。
【0339】
なお、図示していないが、カーソルが、タイムライン画像上に設定された右端側の未来スクロールエリア内に位置している場合には、未来側へのスクロールを行うことを表すスクロールマークが、タイムライン画像の右端に表示され、タイムライン画像が、未来側(スクロールの方向としては、右から左方向)にスクロールされる。
【0340】
したがって、レイヤ2モードでは、ユーザは、タイムライン画像上のスクロールエリア(過去スクロールエリア、未来スクロールエリア)に、カーソルを移動するだけで、タイムライン画像をスクロールすることができ、その結果、所望の動画セグメント(のセグメント代表画像)を、容易に探し出すことができる。
【0341】
[再生制御部15による動画セグメントの再生制御]
【0342】
表示モードが、レイヤ0モード、レイヤ1モード、及び、レイヤ2モードのうちのいずれであっても、再生制御部15は、動画セグメントの再生を要求する再生操作としての、例えば、その動画セグメントのセグメント代表画像に対するダブルクリックが行われると、ダブルクリック(再生操作)が行われたセグメント代表画像に対応する動画セグメントを、コンテンツ記憶部11から再生する。
【0343】
再生制御部15において再生された動画セグメントの画像は、表示制御部16に供給され、表示部17に表示される。
【0344】
図21は、再生制御部15において再生された動画セグメントの画像の表示例を示す図である。
【0345】
図21においては、セグメントマップを表示するマップウインドウと、動画セグメントの画像を表示する再生ウインドウ#1,#2、及び、#3とがオープンしている。
【0346】
図21では、レイヤ0モードにおいて、まず、マップウインドウに表示された再生対象コンテンツのセグメントマップに配置されたセグメント代表画像(クラスタ代表画像に選択されたセグメント代表画像)#1がダブルクリックされ、再生制御部15において、そのダブルクリックに応じて、セグメント代表画像#1に対応する動画セグメント#1の再生が開始されて、動画セグメント#1の画像が、再生ウインドウ#1に表示されている。
【0347】
さらに、図21では、セグメント代表画像#1に対応する動画セグメント#1の再生中に、マップウインドウに表示された再生対象コンテンツのセグメントマップに配置されたセグメント代表画像#2がダブルクリックされ、再生制御部15において、そのダブルクリックに応じて、セグメント代表画像#2に対応する動画セグメント#2の再生が開始されて、動画セグメント#2の画像が、再生ウインドウ#2に表示されている。
【0348】
その後、図21では、セグメント代表画像#1及び#2それぞれに対応する動画セグメント#1及び#2の再生中に、マップウインドウに表示された再生対象コンテンツのセグメントマップに配置されたセグメント代表画像#3がダブルクリックされ、再生制御部15において、そのダブルクリックに応じて、セグメント代表画像#3に対応する動画セグメント#3の再生が開始されて、動画セグメント#3の画像が、再生ウインドウ#3に表示されている。
【0349】
以上のように、再生制御部15では、再生対象コンテンツのセグメント代表画像に対して、再生操作としてのダブルクリックが行われると、そのダブルクリックがされたセグメント代表画像に対応する動画セグメントを再生する再生制御が行われる。
【0350】
そして、再生制御部15では、ダブルクリックがされたセグメント代表画像に対応する動画セグメントを再生する際に、他の動画セグメントの再生が行われているときには、その既に行われている他の動画セグメントの再生を維持したまま、ダブルクリックがされたセグメント代表画像に対応する動画セグメントが再生される。
【0351】
したがって、ユーザは、1つのコンテンツである再生対象コンテンツ内の、ユーザが興味のある複数のシーン等の複数箇所を、同時に視聴することができる。
【0352】
なお、再生が行われている動画セグメント(以下、再生動画セグメントともいう)の画像は、再生ウインドウをオープンして、その再生ウインドウに表示する他、セグメントマップ上の、再生動画セグメントのセグメント代表画像が対応付けられた状態の近傍に、セグメント代表画像の標準サイズよりも大きいサイズ等で表示することができる。
【0353】
再生動画セグメントの画像を、再生ウインドウに表示するか、又は、セグメントマップ上の、再生動画セグメントのセグメント代表画像が対応付けられた状態の近傍に表示するかは、例えば、ユーザの操作に応じて設定することができる。
【0354】
また、再生動画セグメントの画像は、再生ウインドウと、セグメントマップ上の、再生動画セグメントのセグメント代表画像が対応付けられた状態の近傍との両方に表示することができる。
【0355】
さらに、再生動画セグメントの画像を再生ウインドウに表示する場合には、再生ウインドウと、その再生ウインドウに画像が表示されている再生動画セグメント(のセグメント代表画像)が対応付けられている状態の近傍に表示されているセグメント代表画像とに、例えば、同一の装飾を施すことができる。
【0356】
図18では、再生ウインドウ#1と、その再生ウインドウ#1に画像が表示されている動画セグメント#1が対応付けられている状態の近傍に表示されているセグメント代表画像#1とに、同一の装飾としての、左上がりの斜線の模様が、画像を囲む枠に施されている。
【0357】
さらに、図18では、再生ウインドウ#2と、その再生ウインドウ#2に画像が表示されている動画セグメント#2が対応付けられている状態の近傍に表示されているセグメント代表画像#2とに、同一の装飾としての、右上がりの斜線の模様が、画像を囲む枠に施されており、再生ウインドウ#3と、その再生ウインドウ#3に画像が表示されている動画セグメント#3が対応付けられている状態の近傍に表示されているセグメント代表画像#3とに、同一の装飾としての、横線の模様が、画像を囲む枠に施されている。
【0358】
この場合、ユーザは、再生ウインドウに画像が表示されている動画セグメント(のセグメント代表画像)が対応付けられている状態を、即座に認識することができる。
【0359】
なお、再生動画セグメントの画像を再生ウインドウに表示する場合、再生ウインドウは、セグメント代表画像に対して、再生操作としてのダブルクリックが行われるたびにオープンされ、そのオープンされたウインドウに、ダブルクリックがされたセグメント代表画像に対応する動画セグメントの画像が表示される。
【0360】
セグメント代表画像に対するダブルクリックが行われ、そのセグメント代表画像に対応する動画セグメントの画像を表示するための再生ウインドウがオープンされた直後は、その再生ウインドウ(のみ)が、いわゆるアクティブウインドウになる。
【0361】
また、複数の再生ウインドウが既にオープンしている場合には、その複数の再生ウインドウの中で、最後にアクティブウインドウになった再生ウインドウに画像が表示されている動画セグメントの音声が出力され、他の再生ウインドウに画像が表示されている動画セグメントの音声は、ミュートされる。
【0362】
ここで、再生制御部15では、表示モードが、レイヤ0モード、レイヤ1モード、及び、レイヤ2モードのいずれの場合であっても、セグメント代表画像に対するダブルクリックが行われたときには、そのセグメント代表画像に対応する動画セグメントの再生が行われる。
【0363】
また、動画セグメントの再生は、セグメントマップ上のセグメント代表画像の他、レイヤ1モードで表示される固定タイル画像に配置されたセグメント代表画像(図15)や、強調表示されるセグメント代表画像(図17)、レイヤモード2で表示されるタイムライン画像に配置されたセグメント代表画像(図18、図20)がダブルクリックされた場合も、行われる。
【0364】
したがって、ユーザは、表示モードにかかわらず、セグメント代表画像をダブルクリックするという、いわば統一した操作を行うだけで、そのセグメント代表画像に対応する動画セグメントを視聴することができる。
【0365】
図22は、再生ウインドウの表示例を示す図である。
【0366】
再生ウインドウの大部分は、動画セグメントの画像が表示される表示エリアになっている。そして、表示エリアの上部には、時計マーク、タイムラインバー、及び、スピーカアイコンが配置されている。
【0367】
時計マーク、及び、タイムラインバーは、図16の時計マーク、及び、タイムラインバーと同様である。
【0368】
但し、再生ウインドウの時計マークは、再生ウインドウに画像が表示されている動画セグメントの、再生対象コンテンツ内での再生のタイミングを表す時刻を表示する。
【0369】
また、再生ウインドウのタイムラインバーでは、再生ウインドウに画像が表示されている動画セグメントの、再生対象コンテンツ内での再生のタイミングに相当する部分(斜線を付してある部分)が、他の部分と異なる表示になっている。
【0370】
スピーカアイコンは、表示エリアに画像が表示されている動画セグメントの音声のミュートのオンとオフとを提示するアイコンであり、アクティブな再生ウインドウでは、スピーカの表示になり、アクティブでない再生ウインドウでは、スピーカにバツ印が付された表示になる。
【0371】
図23は、お気に入り情報記憶部13にお気に入り情報が記憶(登録)されている場合の、レイヤ0モードのセグメントマップの表示例を示す図である。
【0372】
図16で説明したように、レイヤ1モードにおいて、ユーザがお気に入り操作を行うと、すなわち、注目状態が、お気に入りの状態として仮登録されている場合に、保存ボタンの操作を行うと、操作イベント処理部12(図1)では、(お気に入り操作を行った)ユーザを識別するユーザIDに対応付けて、再生対象コンテンツのセグメントマップのベースのモデルマップの生成に用いられた注目モデルとしてのHMMを識別するモデルIDと、お気に入りの状態として本登録する状態を識別する状態IDとが、お気に入り情報として、お気に入り情報記憶部13(図1)に記憶(登録)される。
【0373】
ここで、お気に入り情報記憶部13にお気に入り情報として状態IDが記憶された状態を、登録状態ともいう。
【0374】
ユーザが、図1の画像処理装置の使用時に、ユーザIDを入力し、そのユーザIDが、お気に入り情報(の一部)として、お気に入り情報記憶部13に記憶されている場合、表示制御部16(図1)は、お気に入り情報記憶部13から、画像処理装置を使用するユーザ(以下、使用ユーザともいう)のユーザIDに対応付けられたモデルIDと状態IDとを読み出す。
【0375】
さらに、表示制御部16は、再生対象コンテンツのセグメントマップの生成に用いられたクラスタリングモデルとしてのHMMが、使用ユーザのユーザIDに対応付けられたモデルIDによって識別されるHMMである場合、つまり、使用ユーザのユーザIDに対応付けられたモデルIDによって識別されるHMMを用いて、再生対象コンテンツのセグメントマップが生成された場合には、そのセグメントマップの、使用ユーザのユーザIDに対応付けられた状態IDによって識別される状態である登録状態に対応付けられた(クラスタ代表画像に選択された)セグメント代表画像を強調表示する。
【0376】
図23では、セグメントマップの登録状態に対応付けられたセグメント代表画像が、枠で囲まれることにより強調表示されている。
【0377】
ここで、セグメントマップ生成部14では、例えば、毎日等の定期的に放送されるニュース番組のセグメントマップの生成には、同一のHMMが用いられる。この同一のHMM、すなわち、定期的に放送されるあるニュース番組のセグメントマップの生成に用いられるHMMを、ニュース用HMMということとする。
【0378】
いま、使用ユーザが、ある日のニュース番組のセグメントマップを見て、お気に入り操作を行い、興味を持ったシーンとしての動画セグメントのセグメント代表画像が対応付けられた状態を、登録状態として、その登録状態の状態IDが、ニュース用HMMのモデルIDとともに、使用ユーザのユーザIDと対応付けられて、お気に入り情報として、お気に入り情報記憶部13(図1)に記憶されたとする。
【0379】
この場合、使用ユーザが、後日、その日に放送された最新のニュース番組を、再生対象コンテンツとして選択すると、セグメントマップ生成部14では、ニュース用HMMを用いて、再生対象コンテンツである最新のニュース番組のセグメントマップが生成される。
【0380】
そして、表示制御部16では、ニュース用HMMの登録状態が、お気に入り情報記憶部13に記憶されたお気に入り情報から認識され、そのニュース用HMMを用いて生成された、最新のニュース番組のセグメントマップの登録状態に対応付けられたセグメント代表画像が強調表示される。
【0381】
したがって、ユーザが、例えば、過去に放送されたニュース番組のセグメントマップを見て、お気に入り操作を行い、興味を持ったシーンとしての動画セグメントのセグメント代表画像が対応付けられた状態を、登録状態としておくことにより、その後に放送されるニュース番組のセグメントマップでは、登録状態に対応付けられたセグメント代表画像が強調表示されるので、興味を持ったシーンとしての動画セグメント(のセグメント代表画像)が対応付けられている状態(登録状態)を、一目で認識することができる。
【0382】
さらに、再生制御部15では、セグメント代表画像をダブルクリックするだけで、そのセグメント代表画像に対応する動画セグメントが再生されるので、ユーザは、その後に放送されるニュース番組のセグメントマップにおいて強調表示されているセグメント代表画像をダブルクリックすることにより、容易に、興味を持ったシーン、つまり、登録状態に対応付けられたセグメント代表画像に対応する動画セグメントを視聴することができる。
【0383】
すなわち、ユーザが、ある日に放送されたニュース番組のセグメントマップを見て、お気に入り操作を行い、例えば、スポーツコーナのシーンが映っている動画セグメントのセグメント代表画像が対応付けられた(1以上の)状態を、登録状態としておくことにより、その後に放送されるニュース番組のセグメントマップ(レイヤ0モードのセグメントマップ)では、登録状態に対応付けられたセグメント代表画像、つまり、スポーツコーナのシーンが映っている動画セグメントのセグメント代表画像が強調表示されるので、ユーザは、その後に放送されるニュース番組については、スポーツコーナのシーンだけを、容易に視聴することができる。
【0384】
図24は、セグメントマップにおいて強調表示されているセグメント代表画像をダブルクリックすることにより行われる動画セグメントの再生を説明する図である。
【0385】
図24では、ユーザが、レイヤ0モードのセグメントマップにおいて強調表示されているセグメント代表画像をダブルクリックし、そのダブルクリックに応じて、動画セグメントの再生が開始されるとともに、再生ウインドウがオープンされ、再生ウインドウに、再生が開始された動画セグメントの動画が表示されている。
【0386】
ここで、セグメントマップ(の生成に用いられたクラスタリングモデルとしてのHMM)の状態のいずれかが、登録状態になっている場合には、再生制御部15(図1)では、セグメントマップにおいて強調表示されているセグメント代表画像(いずれかの登録状態に対応付けられているセグメント代表画像)がダブルクリックされたときに、そのセグメント代表画像に対応する動画セグメントだけを再生するのではなく、セグメントマップにおいて、すべての登録状態に対応付けられている動画セグメントのすべてを、時系列に再生することができる。
【0387】
この場合、使用ユーザは、例えば、ニュース番組のスポーツコーナのシーンが映っている動画セグメントのセグメント代表画像が対応付けられたすべて状態を、登録状態としておくことにより、ニュース番組のセグメントマップのいずれかの登録状態に対応付けられたセグメント代表画像(強調表示されたセグメント代表画像)をダブルクリックするだけで、再生制御部15では、ニュース番組のスポーツコーナのシーンが映っている動画セグメント(登録状態に対応付けられたセグメント代表画像に対応する動画セグメント)だけが、時系列に再生され、結果として、スポーツコーナだけのダイジェスト再生、つまり、スポーツコーナのシーンが映っている時系列の動画セグメントの頭出し再生が行われる。
【0388】
ここで、登録状態(の状態ID)は、ユーザIDに対応付けられ、お気に入り情報として、お気に入り情報記憶部13(図1)に記憶されるので、ユーザごとに記憶しておくことができる。
【0389】
したがって、再生制御部15が、いずれかの登録状態に対応付けられているセグメント代表画像がダブルクリックされた場合に、セグメントマップにおいて、すべての登録状態に対応付けられている動画セグメントのすべてを、時系列に再生するときには、ユーザごとに、そのユーザが興味のあるシーンを再生する、ユーザごとのハイライト再生(ハイライト再生の個人化)を実現することができる。
【0390】
なお、セグメントマップの状態のいずれかが、登録状態になっている場合において、セグメントマップにおいて強調表示されているセグメント代表画像(いずれかの登録状態に対応付けられているセグメント代表画像)がダブルクリックされたときに、そのセグメント代表画像に対応する動画セグメントだけを再生するか、又は、セグメントマップにおいて、すべての登録状態に対応付けられている動画セグメントのすべてを、時系列に再生するかは、ユーザの操作に応じて設定することができる。
【0391】
以上のように、図1の画像処理装置では、動画のコンテンツを、学習用コンテンツとして用いて、クラスタリングモデルとしてのHMMの学習が行われ、その学習後のHMMを、2次元平面に投射することで、コンテンツのシーン構造をグラフで表現するモデルマップが生成される。
【0392】
一方、再生対象コンテンツの各フレームが、学習後のHMMを用いてクラスタリングされ、各クラスタに属するフレームが、動画セグメントとしての1以上の連続するフレームに区分される。
【0393】
そして、モデルマップ上のHMMの各状態の位置に、その状態に対応するクラスタに属する(フレームで構成される)動画セグメントを代表するセグメント代表画像が配置されたセグメントマップが生成される。
【0394】
したがって、ユーザは、セグメントマップを見ることで、再生対象コンテンツを俯瞰することができる。
【0395】
また、図1の画像処理装置では、セグメントマップ等に配置されたセグメント代表画像がダブルクリックされると、そのセグメント代表画像に対応する動画セグメント(そのセグメント代表画像が代表する動画セグメント)が再生されるので、ユーザは、例えば、セグメントマップによって、所望のシーンのセグメント代表画像を、容易に見つけ出し、そのシーンが映った動画セグメントに、迅速にアクセスする(所望のシーンを視聴する)ことができる。
【0396】
以上のように、図1の画像処理装置によれば、再生対象コンテンツを俯瞰し、所望のシーンに効率的にアクセスすることができる特徴を持った新しいブラウジング方法を実現することができる。
【0397】
また、図1の画像処理装置では、ダブルクリックがされたセグメント代表画像に対応する動画セグメントを再生する際に、他の動画セグメントの再生が行われているときには、その既に行われている他の動画セグメントの再生を維持したまま、ダブルクリックがされたセグメント代表画像に対応する動画セグメントが再生される。
【0398】
したがって、図1の画像処理装置によれば、家族等の複数人の各自が、同一のコンテンツの、各自が興味がある異なる箇所を、同時に視聴することができ、また、デジタルネイティブ世代が得意な、いわゆる「ながら視聴」や「見ながらザッピング」に適したコンテンツ再生手段を提供することができる。
【0399】
[表示モードの移行と、各表示モードで行われる処理]
【0400】
図25は、表示モードの移行と各表示モードで行われる処理を説明する図である。
【0401】
表示制御部16は、セグメントマップ生成部14から再生対象コンテンツのセグメントマップが供給されると、ステップS101において、表示モードをレイヤ0モードにして、セグメントマップ(が表示されたマップウインドウ)を、表示部17に表示する。
【0402】
なお、ステップS101のレイヤ0モードでは、タイル画像(図13)は表示されず、図10に示したように、セグメントマップだけが表示される。
【0403】
ステップS101の、タイル画像が表示されていないレイヤ0モードにおいて、ユーザがダブルクリックを行うと、処理は、ステップS102に移行し、表示制御部16は、再生ウインドウがオープンされていれば、すべての再生ウインドウを、セグメントマップが表示されたマップウインドウよりも前面側に表示する。
【0404】
また、ステップS101の、タイル画像が表示されていないレイヤ0モードになってから、所定の時間が経過すると、処理は、ステップS103に移行し、表示制御部16は、ユーザが指示している指示位置としてのカーソルの位置が移動し、指示位置と、その指示位置に最も近いセグメントマップ上の状態との距離(カーソル間距離)が、閾値以内であるかどうかを判定する。
【0405】
ここで、図25において、点線の矢印は、矢印の始点側のステップが行われてから(になってから)、所定の時間が経過すると、矢印の終点側のステップに移行することを表す。
【0406】
ステップS103において、カーソル間距離が、閾値以内でないと判定された場合、処理は、ステップS101に移行する。そして、所定の時間が経過すると、処理は、ステップS101からステップS103に移行し、以下、同様の処理が繰り返される。
【0407】
一方、ステップS103において、カーソル間距離が、閾値以内であると判定された場合、処理は、ステップS104に移行し、表示制御部16は、指示位置に最も近いセグメントマップ上の状態である注目状態に対応付けられたセグメント代表画像を時系列順に並べたタイル画像を生成し、図13に示したように、セグメントマップの注目状態の近傍に重畳する形で表示する。
【0408】
以上のように、ステップS104では、レイヤ0モードにおいて、タイル画像が表示されるが、このように、ステップS104の、タイル画像が表示されたレイヤ0モードになってから、所定の時間が経過すると、処理は、ステップS103に移行し、表示制御部16は、ユーザが指示している指示位置としてのカーソルの位置が移動し、指示位置と、その指示位置に最も近いセグメントマップ上の状態との距離であるカーソル間距離が、閾値以内であるかどうかを判定する。
【0409】
ステップS103において、カーソル間距離が、閾値以内でないと判定された場合、処理は、ステップS101に移行し、タイル画像は消去され、タイル画像が表示されていないレイヤ0モードになる。
【0410】
また、ステップS103において、カーソル間距離が、閾値以内であると判定された場合、処理は、ステップS104に移行し、表示制御部16は、上述したように、指示位置に最も近いセグメントマップ上の状態である注目状態に対応付けられたセグメント代表画像を時系列順に並べたタイル画像を生成し、図13に示したように、セグメントマップの注目状態の近傍に重畳する形で表示する。
【0411】
また、ステップS104の、タイル画像が表示されたレイヤ0モード(図13)において、ダブルクリックが行われると、処理は、ステップS105に移行し、再生制御部15は、動画セグメントを再生する動画セグメント再生処理を行う。
【0412】
すなわち、ステップS105の動画セグメント再生処理では、再生制御部15は、ダブルクリックが行われたときのユーザの指示位置(ダブルクリックがされた位置)に最も近いセグメント代表画像に対応する動画セグメントを再生する。
【0413】
なお、指示位置に最も近いセグメント代表画像が、セグメントマップ(の生成に用いられたHMM)の登録状態に対応付けられたセグメント代表画像である場合、すなわち、セグメントマップの登録状態に対応付けられたセグメント代表画像がダブルクリックされた場合、再生制御部15は、図24で説明したように、セグメントマップのすべての登録状態に対応付けられたセグメント代表画像すべてに対応する動画セグメントを、時系列に再生するダイジェスト再生を行う。
【0414】
ステップS104の、タイル画像が表示されたレイヤ0モード(図13)において、シングルクリックが行われると、処理は、ステップS106に移行し、表示制御部16は、表示モードをレイヤ0モードからレイヤ1モードに移行して、図15に示したように、直前に表示されていたタイル画像を固定した固定タイル画像を表示する。
【0415】
なお、ステップS106のレイヤ1モードでは、図15に示したように、固定タイル画像に配置されたセグメント代表画像の強調表示は行われない。
【0416】
ステップS106の、強調表示なしのレイヤ1モードにおいて、ユーザがダブルクリックを行うと、処理は、ステップS107に移行し、ステップS105と同様に、再生制御部15は、動画セグメント再生処理を行う。
【0417】
すなわち、再生制御部15は、ダブルクリックがされたセグメント代表画像に対応する動画セグメントを再生する(セグメントマップの登録状態に対応付けられたセグメント代表画像がダブルクリックされた場合には、セグメントマップのすべての登録状態に対応付けられたセグメント代表画像すべてに対応する動画セグメントを、時系列に再生するダイジェスト再生を行う)。
【0418】
ステップS106の、強調表示なしのレイヤ1モードになってから、所定の時間が経過すると、処理は、ステップS108に移行し、表示制御部16は、ユーザが指示している指示位置としてのカーソルの位置が移動し、指示位置と、その指示位置に最も近い固定タイル画像(図15)に配置されたセグメント代表画像との距離が、閾値以内であるかどうかを判定する。
【0419】
ステップS108において、指示位置と、その指示位置に最も近い固定タイル画像に配置されたセグメント代表画像との距離が、閾値以内でないと判定された場合、処理は、ステップS109に移行し、表示制御部16は、指示位置が、固定タイル画像上にない、すなわち、指示位置が、固定タイル画像が表示されているエリア外に移動したかどうかを判定する。
【0420】
ステップS109において、指示位置が、固定タイル画像(図15)上にあると判定された場合、処理は、ステップS106に移行する。そして、所定の時間が経過すると、処理は、ステップS106からステップS108に移行し、以下、同様の処理が繰り返される。
【0421】
また、ステップS109において、指示位置が、固定タイル画像(図15)上にないと判定された場合、処理は、ステップS101に移行し、表示制御部16は、表示モードを、レイヤ1モードからレイヤ0モードに移行する。
【0422】
ステップS101のレイヤ0モードでは、図10に示したように、タイル画像は表示されず、セグメントマップだけが表示される。
【0423】
なお、ステップS101のレイヤ0モードに移行する直前のレイヤ1モードにおいて表示された固定タイル画像(図15)は、レイヤ1モードからレイヤ0モードの移行時に消去される。
【0424】
一方、ステップS108において、指示位置と、その指示位置に最も近い固定タイル画像に配置されたセグメント代表画像との距離が、閾値以内であると判定された場合、処理は、ステップS110に移行し、表示制御部16は、図17に示したように、指示位置に最も近い固定タイル画像に配置されたセグメント代表画像である注目代表画像を強調表示する。
【0425】
以上のように、ステップS110では、レイヤ1モードにおいて、固定タイル画像に配置されたセグメント代表画像のうちの、指示位置に最も近いセグメント代表画像を、注目代表画像として強調表示が行われる。
【0426】
そして、そのようなステップS110の、強調表示ありのレイヤ1モード(強調表示が行われるレイヤ1モード)になってから、所定の時間が経過すると、処理は、ステップS108に移行し、以下、同様処理が繰り返される。
【0427】
また、ステップS110の、強調表示ありのレイヤ1モードにおいて、ユーザがダブルクリックを行うと、処理は、ステップS111に移行し、ステップS105と同様に、再生制御部15は、動画セグメント再生処理を行う。
【0428】
すなわち、再生制御部15は、ダブルクリックがされたセグメント代表画像に対応する動画セグメントを再生する(セグメントマップの登録状態に対応付けられたセグメント代表画像がダブルクリックされた場合には、セグメントマップのすべての登録状態に対応付けられたセグメント代表画像すべてに対応する動画セグメントを、時系列に再生するダイジェスト再生を行う)。
【0429】
ステップS110の、強調表示ありのレイヤ1モード(図17)において、シングルクリックが行われると、処理は、ステップS112に移行し、表示制御部16は、表示モードをレイヤ1モードからレイヤ2モードに移行して、図18に示したように、直前に強調表示されていたセグメント代表画像を中心とする複数のセグメント代表画像を時系列に配置したタイムライン画像を表示する。
【0430】
ステップS112のレイヤ2モードにおいて、ユーザがダブルクリックを行うと、処理は、ステップS113に移行し、ステップS105と同様に、再生制御部15は、動画セグメント再生処理を行う。
【0431】
すなわち、再生制御部15は、ダブルクリックがされたセグメント代表画像に対応する動画セグメントを再生する(セグメントマップの登録状態に対応付けられたセグメント代表画像がダブルクリックされた場合には、セグメントマップのすべての登録状態に対応付けられたセグメント代表画像すべてに対応する動画セグメントを、時系列に再生するダイジェスト再生を行う)。
【0432】
ステップS112のレイヤ2モード(図18)になってから、所定の時間が経過すると、処理は、ステップS114に移行し、表示制御部16は、ユーザが指示している指示位置としてのカーソルの位置が移動し、指示位置が、タイムライン画像上に設定された左端側の過去スクロールエリア内に位置しているかどうかを判定する。
【0433】
ステップS114において、指示位置が、過去スクロールエリア内に位置していると判定された場合、処理は、ステップS115に進み、表示制御部16は、より過去側のセグメント代表画像が表示されるように、タイムライン画像を、図20に矢印で示したようにスクロールして、処理は、ステップS112に移行する。
【0434】
また、ステップS114において、指示位置が、過去スクロールエリア内に位置していないと判定された場合、処理は、ステップS116に移行し、表示制御部16は、指示位置が移動し、指示位置が、タイムライン画像上に設定された右端側の未来スクロールエリア内に位置しているかどうかを判定する。
【0435】
ステップS116において、指示位置が、未来スクロールエリア内に位置していると判定された場合、処理は、ステップS117に進み、表示制御部16は、より未来側のセグメント代表画像が表示されるように、タイムライン画像をスクロールして、処理は、ステップS112に移行する。
【0436】
また、ステップS116において、指示位置が、未来スクロールエリア内に位置していないと判定された場合、すなわち、指示位置が、過去スクロールエリア、及び、未来スクロールエリアのいずれにも位置していない場合、処理は、ステップS118に移行し、表示制御部16は、指示位置が、タイムライン画像(図18、図20)上にない、すなわち、指示位置が、タイムライン画像が表示されているエリア外に移動したかどうかを判定する。
【0437】
ステップS118において、指示位置が、タイムライン画像(図18、図20)上にあると判定された場合、処理は、ステップS112に移行する。そして、所定の時間が経過すると、処理は、ステップS112からステップS114に移行する。
【0438】
また、ステップS118において、指示位置が、タイムライン画像上にないと判定された場合、処理は、ステップS101に移行し、表示制御部16は、表示モードを、レイヤ2モードからレイヤ0モードに移行する。
【0439】
ステップS101のレイヤ0モードでは、図10に示したように、タイル画像は表示されず、セグメントマップだけが表示される。
【0440】
なお、ステップS101のレイヤ0モードに移行する直前のレイヤ2モードにおいて表示されたタイムライン画像(図18、図20)は、レイヤ2モードからレイヤ0モードの移行時に消去される。
【0441】
[本技術を適用したコンピュータの説明]
【0442】
次に、上述した一連の処理は、ハードウェアにより行うこともできるし、ソフトウェアにより行うこともできる。一連の処理をソフトウェアによって行う場合には、そのソフトウェアを構成するプログラムが、汎用のコンピュータ等にインストールされる。
【0443】
そこで、図26は、上述した一連の処理を実行するプログラムがインストールされるコンピュータの一実施の形態の構成例を示している。
【0444】
プログラムは、コンピュータに内蔵されている記録媒体としてのハードディスク105やROM103に予め記録しておくことができる。
【0445】
あるいはまた、プログラムは、リムーバブル記録媒体111に格納(記録)しておくことができる。このようなリムーバブル記録媒体111は、いわゆるパッケージソフトウエアとして提供することができる。ここで、リムーバブル記録媒体111としては、例えば、フレキシブルディスク、CD-ROM(Compact Disc Read Only Memory),MO(Magneto Optical)ディスク,DVD(Digital Versatile Disc)、磁気ディスク、半導体メモリ等がある。
【0446】
なお、プログラムは、上述したようなリムーバブル記録媒体111からコンピュータにインストールする他、通信網や放送網を介して、コンピュータにダウンロードし、内蔵するハードディスク105にインストールすることができる。すなわち、プログラムは、例えば、ダウンロードサイトから、ディジタル衛星放送用の人工衛星を介して、コンピュータに無線で転送したり、LAN(Local Area Network)、インターネットといったネットワークを介して、コンピュータに有線で転送することができる。
【0447】
コンピュータは、CPU(Central Processing Unit)102を内蔵しており、CPU102には、バス101を介して、入出力インタフェース110が接続されている。
【0448】
CPU102は、入出力インタフェース110を介して、ユーザによって、入力部107が操作等されることにより指令が入力されると、それに従って、ROM(Read Only Memory)103に格納されているプログラムを実行する。あるいは、CPU102は、ハードディスク105に格納されたプログラムを、RAM(Random Access Memory)104にロードして実行する。
【0449】
これにより、CPU102は、上述したフローチャートにしたがった処理、あるいは上述したブロック図の構成により行われる処理を行う。そして、CPU102は、その処理結果を、必要に応じて、例えば、入出力インタフェース110を介して、出力部106から出力、あるいは、通信部108から送信、さらには、ハードディスク105に記録等させる。
【0450】
なお、入力部107は、キーボードや、マウス、マイク等で構成される。また、出力部106は、LCD(Liquid Crystal Display)やスピーカ等で構成される。
【0451】
ここで、本明細書において、コンピュータがプログラムに従って行う処理は、必ずしもフローチャートとして記載された順序に沿って時系列に行われる必要はない。すなわち、コンピュータがプログラムに従って行う処理は、並列的あるいは個別に実行される処理(例えば、並列処理あるいはオブジェクトによる処理)も含む。
【0452】
また、プログラムは、1のコンピュータ(プロセッサ)により処理されるものであっても良いし、複数のコンピュータによって分散処理されるものであっても良い。さらに、プログラムは、遠方のコンピュータに転送されて実行されるものであっても良い。
【0453】
なお、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。
【0454】
例えば、本技術は、1つの機能をネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。
【0455】
すなわち、図1の画像処理装置において、例えば、お気に入り情報記憶部13やセグメントマップ生成部14は、サーバ側に設け、残りのコンテンツ記憶部11、操作イベント処理部12、再生制御部15、表示制御部16、及び、表示部17は、クライアント側に設けることができる。
【0456】
また、上述のフローチャートで説明した各ステップは、1つの装置で実行する他、複数の装置で分担して実行することができる。
【0457】
さらに、1つのステップに複数の処理が含まれる場合には、その1つのステップに含まれる複数の処理は、1つの装置で実行する他、複数の装置で分担して実行することができる。
【0458】
すなわち、図1の画像処理装置において、セグメントマップ生成部14の一部の処理は、サーバ側で行い、残りの処理は、クライアント側で行うことができる。
【0459】
なお、本技術は、以下のような構成をとることができる。
【0460】
[1]
コンテンツを、時間的に連続する1フレーム以上のフレームの集まりである動画セグメントに区分することにより得られる前記動画セグメントを代表する画像であるセグメント代表画像を配置したマップであるセグメントマップを、表示装置に表示させる表示制御部と、
前記セグメント代表画像に対する、再生を要求するユーザの再生操作に応じて、そのセグメント代表画像に対応する前記動画セグメントの再生を制御する再生制御部と
を備え、
コンテンツの動画セグメントの再生中に、そのコンテンツの、他の動画セグメントのセグメント代表画像に対する再生操作が行われた場合、前記再生制御部は、再生中の動画セグメントの再生を維持したまま、再生操作が行われた前記セグメント代表画像に対応する動画セグメントである前記他の動画セグメントを再生する
画像処理装置。
[2]
前記セグメントマップを生成するマップ生成部と、
コンテンツの各フレームを、複数のクラスタのうちのいずれかのクラスタにクラスタリングするクラスタリング部と、
前記複数のクラスタそれぞれについて、前記クラスタに属するフレームを、時間的に連続する1フレーム以上のフレームの集まりである前記動画セグメントに区分するセグメント区分部と、
前記動画セグメントを代表するセグメント代表画像を生成するセグメント代表画像生成部と
をさらに備え、
前記マップ生成部は、
前記複数のクラスタそれぞれについて、前記クラスタに、そのクラスタに属する動画セグメントのセグメント代表画像を対応付け、前記クラスタに対応付けられたセグメント代表画像から、そのクラスタを代表するクラスタ代表画像を選択し、
前記クラスタ代表画像に選択された前記セグメント代表画像を、前記セグメントマップに配置する
[1]に記載の画像処理装置。
[3]
前記クラスタリング部は、
状態と状態遷移とを有する状態遷移モデルを用い、前記コンテンツのフレームの時系列の特徴量が観測される最尤状態系列を求め、
前記コンテンツの各フレームを、前記最尤状態系列において、そのフレームの特徴量が観測される状態に対応するクラスタにクラスタリングする
[2]に記載の画像処理装置。
[4]
前記マップ生成部は、
前記状態遷移モデルを2次元平面又は3次元空間に投射したマップであるモデルマップを生成し、
前記モデルマップの各状態の位置に、その状態に対応するクラスタのクラスタ代表画像に選択された前記セグメント代表画像を配置することで、前記セグメントマップを生成する
[3]に記載の画像処理装置。
[5]
前記マップ生成部は、前記状態に対応するクラスタに対応付けられた前記セグメント代表画像のうちの、フレーム数が最大の動画セグメントのセグメント代表画像、又は、再生時刻が最も早い動画セグメントのセグメント代表画像を、前記クラスタ代表画像に選択する
[4]に記載の画像処理装置。
[6]
前記マップ生成部は、前記モデルマップの各状態の位置に、その状態に対応するクラスタのクラスタ代表画像に選択された前記セグメント代表画像を、その状態の重要度に対応するサイズで配置する
[4]又は[5]に記載の画像処理装置。
[7]
前記マップ生成部は、前記状態に対応するクラスタに対応付けられた前記セグメント代表画像に対応する動画セグメントの最大のフレーム数を、前記状態の重要度として求める
[6]に記載の画像処理装置。
[8]
前記状態を登録することを要求するユーザのお気に入り操作に応じて、前記状態を、登録状態として記憶する記憶部をさらに備え、
前記表示制御部は、前記セグメントマップの、前記登録状態に対応するクラスタの前記クラスタ代表画像に選択された前記セグメント代表画像を強調表示する
[4]ないし[7]のいずれかに記載の画像処理装置。
[9]
前記登録状態に対応するクラスタの前記クラスタ代表画像に選択された前記セグメント代表画像に対する再生操作が行われた場合、前記再生制御部は、前記記憶部に記憶されたすべての登録状態に対応するクラスタに対応付けられた前記セグメント代表画像に対応する動画セグメントを、時系列に再生する
[8]に記載の画像処理装置。
[10]
前記表示制御部は、ユーザが指示する指示位置に最も近いセグメントマップ上の状態を、注目する注目状態として、前記注目状態に対応するクラスタに対応付けられた前記セグメント代表画像の一覧の画像であるタイル画像を、前記表示装置に表示する表示制御を行う
[4]ないし[9]のいずれかに記載の画像処理装置。
[11]
前記表示制御部は、前記タイル画像の前記セグメント代表画像のうちの、前記指示位置に最も近い前記セグメント代表画像を、注目する注目画像として、前記注目画像を強調表示する
[10]に記載の画像処理装置。
[12]
前記表示制御部は、ユーザの所定の操作に応じて、前記注目状態に対応付けられた前記セグメント代表画像のうちの、前記注目画像と、前記注目画像の前後に続く所定の数の前記セグメント代表画像とを、前記注目画像を中心として、時系列に配置したタイムライン画像を、前記表示装置に表示する表示制御を行う
[11]に記載の画像処理装置。
[13]
前記表示制御部は、ユーザの操作に応じて、前記タイムライン画像に配置される前記セグメント代表画像をスクロールする
[12]に記載の画像処理装置。
[14]
コンテンツを、時間的に連続する1フレーム以上のフレームの集まりである動画セグメントに区分することにより得られる前記動画セグメントを代表する画像であるセグメント代表画像を配置したマップであるセグメントマップを、表示装置に表示させ、
前記セグメント代表画像に対する、再生を要求するユーザの再生操作に応じて、そのセグメント代表画像に対応する前記動画セグメントの再生を制御する
ステップを含み、
前記動画セグメントの再生の制御では、コンテンツの動画セグメントの再生中に、そのコンテンツの、他の動画セグメントのセグメント代表画像に対する再生操作が行われた場合、再生中の動画セグメントの再生を維持したまま、再生操作が行われた前記セグメント代表画像に対応する動画セグメントである前記他の動画セグメントを再生する
画像処理方法。
[15]
コンテンツを、時間的に連続する1フレーム以上のフレームの集まりである動画セグメントに区分することにより得られる前記動画セグメントを代表する画像であるセグメント代表画像を配置したマップであるセグメントマップを、表示装置に表示させる表示制御部と、
前記セグメント代表画像に対する、再生を要求するユーザの再生操作に応じて、そのセグメント代表画像に対応する前記動画セグメントの再生を制御する再生制御部と
して、コンピュータを機能させるためのプログラムであり、
コンテンツの動画セグメントの再生中に、そのコンテンツの、他の動画セグメントのセグメント代表画像に対する再生操作が行われた場合、前記再生制御部は、再生中の動画セグメントの再生を維持したまま、再生操作が行われた前記セグメント代表画像に対応する動画セグメントである前記他の動画セグメントを再生する
プログラム。
【符号の説明】
【0461】
11 コンテンツ記憶部, 12 操作イベント処理部, 13 お気に入り情報記憶部, 14 セグメントマップ生成部, 15 再生制御部, 16 表示制御部, 17 表示部, 21 クラスタリング部, 22 セグメント区分部, 23 セグメント代表画像生成部, 24 マップ生成部, 31 クラスタリングモデル学習部, 32 クラスタリングモデル記憶部, 33 クラスタ判定部, 41 学習用コンテンツ選択部, 42 特徴量抽出部, 43 特徴量記憶部, 44 学習部, 51 コンテンツ選択部, 52 モデル選択部, 53 特徴量抽出部, 54 最尤状態系列推定部, 61 クラスタ代表画像選択部, 62 状態間距離算出部, 63 座標算出部, 64 マップ描画部, 101 バス, 102 CPU, 103 ROM, 104 RAM, 105 ハードディスク, 106 出力部, 107 入力部, 108 通信部, 109 ドライブ, 110 入出力インタフェース, 111 リムーバブル記録媒体

【特許請求の範囲】
【請求項1】
コンテンツを、時間的に連続する1フレーム以上のフレームの集まりである動画セグメントに区分することにより得られる前記動画セグメントを代表する画像であるセグメント代表画像を配置したマップであるセグメントマップを、表示装置に表示させる表示制御部と、
前記セグメント代表画像に対する、再生を要求するユーザの再生操作に応じて、そのセグメント代表画像に対応する前記動画セグメントの再生を制御する再生制御部と
を備え、
コンテンツの動画セグメントの再生中に、そのコンテンツの、他の動画セグメントのセグメント代表画像に対する再生操作が行われた場合、前記再生制御部は、再生中の動画セグメントの再生を維持したまま、再生操作が行われた前記セグメント代表画像に対応する動画セグメントである前記他の動画セグメントを再生する
画像処理装置。
【請求項2】
前記セグメントマップを生成するマップ生成部と、
コンテンツの各フレームを、複数のクラスタのうちのいずれかのクラスタにクラスタリングするクラスタリング部と、
前記複数のクラスタそれぞれについて、前記クラスタに属するフレームを、時間的に連続する1フレーム以上のフレームの集まりである前記動画セグメントに区分するセグメント区分部と、
前記動画セグメントを代表するセグメント代表画像を生成するセグメント代表画像生成部と
をさらに備え、
前記マップ生成部は、
前記複数のクラスタそれぞれについて、前記クラスタに、そのクラスタに属する動画セグメントのセグメント代表画像を対応付け、前記クラスタに対応付けられたセグメント代表画像から、そのクラスタを代表するクラスタ代表画像を選択し、
前記クラスタ代表画像に選択された前記セグメント代表画像を、前記セグメントマップに配置する
請求項1に記載の画像処理装置。
【請求項3】
前記クラスタリング部は、
状態と状態遷移とを有する状態遷移モデルを用い、前記コンテンツのフレームの時系列の特徴量が観測される最尤状態系列を求め、
前記コンテンツの各フレームを、前記最尤状態系列において、そのフレームの特徴量が観測される状態に対応するクラスタにクラスタリングする
請求項2に記載の画像処理装置。
【請求項4】
前記マップ生成部は、
前記状態遷移モデルを2次元平面又は3次元空間に投射したマップであるモデルマップを生成し、
前記モデルマップの各状態の位置に、その状態に対応するクラスタのクラスタ代表画像に選択された前記セグメント代表画像を配置することで、前記セグメントマップを生成する
請求項3に記載の画像処理装置。
【請求項5】
前記マップ生成部は、前記状態に対応するクラスタに対応付けられた前記セグメント代表画像のうちの、フレーム数が最大の動画セグメントのセグメント代表画像、又は、再生時刻が最も早い動画セグメントのセグメント代表画像を、前記クラスタ代表画像に選択する
請求項4に記載の画像処理装置。
【請求項6】
前記マップ生成部は、前記モデルマップの各状態の位置に、その状態に対応するクラスタのクラスタ代表画像に選択された前記セグメント代表画像を、その状態の重要度に対応するサイズで配置する
請求項4に記載の画像処理装置。
【請求項7】
前記マップ生成部は、前記状態に対応するクラスタに対応付けられた前記セグメント代表画像に対応する動画セグメントの最大のフレーム数を、前記状態の重要度として求める
請求項6に記載の画像処理装置。
【請求項8】
前記状態を登録することを要求するユーザのお気に入り操作に応じて、前記状態を、登録状態として記憶する記憶部をさらに備え、
前記表示制御部は、前記セグメントマップの、前記登録状態に対応するクラスタの前記クラスタ代表画像に選択された前記セグメント代表画像を強調表示する
請求項4に記載の画像処理装置。
【請求項9】
前記登録状態に対応するクラスタの前記クラスタ代表画像に選択された前記セグメント代表画像に対する再生操作が行われた場合、前記再生制御部は、前記記憶部に記憶されたすべての登録状態に対応するクラスタに対応付けられた前記セグメント代表画像に対応する動画セグメントを、時系列に再生する
請求項8に記載の画像処理装置。
【請求項10】
前記表示制御部は、ユーザが指示する指示位置に最も近いセグメントマップ上の状態を、注目する注目状態として、前記注目状態に対応するクラスタに対応付けられた前記セグメント代表画像の一覧の画像であるタイル画像を、前記表示装置に表示する表示制御を行う
請求項4に記載の画像処理装置。
【請求項11】
前記表示制御部は、前記タイル画像の前記セグメント代表画像のうちの、前記指示位置に最も近い前記セグメント代表画像を、注目する注目画像として、前記注目画像を強調表示する
請求項10に記載の画像処理装置。
【請求項12】
前記表示制御部は、ユーザの所定の操作に応じて、前記注目状態に対応付けられた前記セグメント代表画像のうちの、前記注目画像と、前記注目画像の前後に続く所定の数の前記セグメント代表画像とを、前記注目画像を中心として、時系列に配置したタイムライン画像を、前記表示装置に表示する表示制御を行う
請求項11に記載の画像処理装置。
【請求項13】
前記表示制御部は、ユーザの操作に応じて、前記タイムライン画像に配置される前記セグメント代表画像をスクロールする
請求項12に記載の画像処理装置。
【請求項14】
コンテンツを、時間的に連続する1フレーム以上のフレームの集まりである動画セグメントに区分することにより得られる前記動画セグメントを代表する画像であるセグメント代表画像を配置したマップであるセグメントマップを、表示装置に表示させ、
前記セグメント代表画像に対する、再生を要求するユーザの再生操作に応じて、そのセグメント代表画像に対応する前記動画セグメントの再生を制御する
ステップを含み、
前記動画セグメントの再生の制御では、コンテンツの動画セグメントの再生中に、そのコンテンツの、他の動画セグメントのセグメント代表画像に対する再生操作が行われた場合、再生中の動画セグメントの再生を維持したまま、再生操作が行われた前記セグメント代表画像に対応する動画セグメントである前記他の動画セグメントを再生する
画像処理方法。
【請求項15】
コンテンツを、時間的に連続する1フレーム以上のフレームの集まりである動画セグメントに区分することにより得られる前記動画セグメントを代表する画像であるセグメント代表画像を配置したマップであるセグメントマップを、表示装置に表示させる表示制御部と、
前記セグメント代表画像に対する、再生を要求するユーザの再生操作に応じて、そのセグメント代表画像に対応する前記動画セグメントの再生を制御する再生制御部と
して、コンピュータを機能させるためのプログラムであり、
コンテンツの動画セグメントの再生中に、そのコンテンツの、他の動画セグメントのセグメント代表画像に対する再生操作が行われた場合、前記再生制御部は、再生中の動画セグメントの再生を維持したまま、再生操作が行われた前記セグメント代表画像に対応する動画セグメントである前記他の動画セグメントを再生する
プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22】
image rotate

【図23】
image rotate

【図24】
image rotate

【図25】
image rotate

【図26】
image rotate


【公開番号】特開2013−90119(P2013−90119A)
【公開日】平成25年5月13日(2013.5.13)
【国際特許分類】
【出願番号】特願2011−228538(P2011−228538)
【出願日】平成23年10月18日(2011.10.18)
【出願人】(000002185)ソニー株式会社 (34,172)
【Fターム(参考)】