説明

電子機器および顔画像表示装置

【課題】映像コンテンツデータを再生することなく、映像コンテンツデータ全体の中のどの辺りの時間帯にどの人物がどの程度の出現頻度で登場するのかを提示できる電子機器を提供すること。
【解決手段】顔画像一覧表示処理部301は、映像コンテンツデータ全体内の顔画像の一覧を2次元の顔サムネイル表示エリアに、出現時間帯毎に人物の出現頻度に応じたサイズで表示する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、映像コンテンツデータに登場する顔画像を表示する電子機器および顔画像表示方法に関する。
【背景技術】
【0002】
一般に、ビデオレコーダ、パーソナルコンピュータといった電子機器は、テレビジョン放送番組データのような各種映像コンテンツデータを記録および再生することが可能である。この場合、電子機器に格納された各映像コンテンツデータにはタイトル名が付加されるが、タイトル名だけでは、ユーザが、各映像コンテンツデータがどのような内容のものであるかを把握することは困難である。このため、映像コンテンツデータの内容を把握するためには、その映像コンテンツデータを再生することが必要となる。しかし、総時間長の長い映像コンテンツデータの再生には、たとえ早送り再生機能等を用いた場合であっても、多くの時間が要される。
【0003】
特許文献1には、登場人物一覧表示機能を有する装置が開示されている。この装置は、映像コンテンツにおける登場人物の一覧として、映像コンテンツにおける登場人物それぞれの顔の画像を並べて表示する機能を有している。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2001−309269号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかし、特許文献1のように単純に登場人物の一覧を表示しただけでは、ユーザは、それら人物が映像コンテンツデータ内のどの辺りの時間帯に登場するのかを把握することはできない。例えば、ユーザは、ユーザにとって興味のある人物(または人物群)が登場する時間帯だけを選択的に再生することを希望する場合もある。したがって、映像コンテンツデータ全体の中のどの辺りの時間帯にどの人物が登場するのかを提示するための新たな機能の実現が必要である。さらに、表示される顔画像の数も出来るだけ多くしたいという要望もある。
【0006】
本発明は上述の事情を考慮してなされたものであり、映像コンテンツデータを再生することなく、映像コンテンツデータ全体の中のどの辺りの時間帯にどの人物がどの程度の出現頻度で登場するのかを提示できる電子機器および顔画像表示方法を提供することを目的とする。
【課題を解決するための手段】
【0007】
本発明の一例に係わる電子機器は、映像コンテンツデータから抽出された複数の顔画像を含む顔画像インデキシング情報を格納する記憶装置と、前記顔画像インデキシング情報に含まれる顔画像を分類する分類手段と、分類されたそれぞれの顔画像の出現頻度を算出する算出手段と、前記分類されたそれぞれの顔画像の一覧を表示する顔画像一覧表示手段であって、前記分類されたそれぞれの顔画像は、前記出現頻度に基づいたサイズで表示されている、顔画像一覧表示手段とを具備する。
【図面の簡単な説明】
【0008】
【図1】本発明の一実施形態に係る電子機器の概観の例を示す斜視図。
【図2】同実施形態の電子機器のシステム構成の例を示すブロック図。
【図3】同実施形態の電子機器の顔画像一覧表示機能を説明するためのブロック図。
【図4】同実施形態の電子機器で用いられるプログラムの機能構成を示すブロック図。
【図5】同実施形態の電子機器によって表示装置に表示されるインデキシングビュー画面の例を示す図。
【図6】図5のインデキシングビュー画面内に含まれる顔サムネイル表示エリアの構成例を示す図。
【図7】図6のインデキシングビュー画面内に含まれる、顔サムネイル表示エリアとじゃばらサムネイル表示エリアとの関係を説明するための図。
【図8】顔サムネイル表示エリアの大区間に表示される顔画像の配列形式の例を示す図。
【図9】図8(A)〜図8(C)に示す配列形式からユーザが一つの配列形式を選択するために用いられる設定画面の例を示す図。
【図10】図8(A)に示す配列形式で顔画像を表示ステップしたインデキシングビュー画面の例を示す図。
【図11】顔サムネイル表示エリア内の顔画像にマウスオーバーしたときに拡大表示される顔画像の例を示す図。
【図12】ユーザが顔画像が表示されるまでの時間を設定するための画面の例を示す図。
【図13】顔画像が切り出された元画像を表示するための設定画面の例を示す図。
【図14】同実施形態の電子機器によって実行される顔画像一覧表示処理の手順の例を示すフローチャート。
【図15】同実施形態の電子機器によって顔画像それぞれがカテゴリ別に分類された様子を示す図。
【図16】同実施形態の電子機器によって実行される表示処理の手順の例を示すフローチャート。
【発明を実施するための形態】
【0009】
以下、図面を参照して、本発明の実施形態を説明する。
まず、図1および図2を参照して、本発明の一実施形態に係る電子機器の構成を説明する。本実施形態の電子機器は、例えば、情報処理装置として機能するノートブック型の携帯型パーソナルコンピュータ10から実現されている。
【0010】
このパーソナルコンピュータ10は、放送番組データ、外部機器から入力されるビデオデータといった、映像コンテンツデータ(オーディオビジュアルコンテンツデータ)を記録および再生することができる。即ち、パーソナルコンピュータ10は、テレビジョン放送信号によって放送される放送番組データの視聴および録画を実行するためのテレビジョン(TV)機能を有している。このTV機能は、例えば、パーソナルコンピュータ10に予めインストールされているTVアプリケーションプログラムによって実現されている。また、TV機能は、外部のAV機器から入力されるビデオデータを記録する機能、および記録されたビデオデータおよび記録された放送番組データを再生する機能も有している。
【0011】
さらに、パーソナルコンピュータ10は、パーソナルコンピュータ10に格納されたビデオデータ、放送番組データのような映像コンテンツデータに登場する人物の顔画像の一覧等を表示する顔画像一覧表示機能を有している。この顔画像一覧表示機能は、例えば、TV機能内にその一機能として実装されている。顔画像一覧表示機能は、映像コンテンツデータの概要等をユーザに提示するための映像インデキシング機能の一つである。この顔画像一覧表示機能は、映像コンテンツデータ全体の中のどの時間帯にどの人物が登場するのかをユーザに提示することができる。また、この顔画像一覧表示機能は、映像コンテンツデータ内に含まれる所定の属性区間に着目して人物の一覧を表示することもできる。
【0012】
図1はコンピュータ10のディスプレイユニットを開いた状態における斜視図である。本コンピュータ10は、コンピュータ本体11と、ディスプレイユニット12とから構成されている。ディスプレイユニット12には、TFT−LCD(Thin Film Transistor Liquid Crystal Display)17から構成される表示装置が組み込まれている。
【0013】
ディスプレイユニット12は、コンピュータ本体11に対し、コンピュータ本体11の上面が露出される開放位置とコンピュータ本体11の上面を覆う閉塞位置との間を回動自在に取り付けられている。コンピュータ本体11は薄い箱形の筐体を有しており、その上面にはキーボード13、本コンピュータ10をパワーオン/パワーオフするためのパワーボタン14、入力操作パネル15、タッチパッド16、およびスピーカ18A,18Bなどが配置されている。
【0014】
入力操作パネル15は、押されたボタンに対応するイベントを入力する入力装置であり、複数の機能をそれぞれ起動するための複数のボタンを備えている。これらボタン群には、TV機能(視聴、録画、録画された放送番組データ/ビデオデータの再生)を制御するための操作ボタン群も含まれている。また、コンピュータ本体11の正面には、本コンピュータ10のTV機能をリモート制御するリモコンユニットとの通信を実行するためのリモコンユニットインタフェース部20が設けられている。リモコンユニットインタフェース部20は、赤外線信号受信部などから構成されている。
【0015】
コンピュータ本体11の例えば右側面には、TV放送用のアンテナ端子19が設けられている。また、コンピュータ本体11の例えば背面には、例えばHDMI(high-definition multimedia interface)規格に対応した外部ディスプレイ接続端子が設けられている。この外部ディスプレイ接続端子は、放送番組データのような映像コンテンツデータに含まれる映像データ(動画像データ)を外部ディスプレイに出力するために用いられる。
【0016】
次に、図2を参照して、本コンピュータ10のシステム構成について説明する。
【0017】
本コンピュータ10は、図2に示されているように、CPU101、ノースブリッジ102、主メモリ103、サウスブリッジ104、グラフィクスプロセッシングユニット(GPU)105、ビデオメモリ(VRAM)105A、サウンドコントローラ106、BIOS−ROM109、LANコントローラ110、ハードディスクドライブ(HDD)111、DVDドライブ112、ビデオプロセッサ113、メモリ113A、無線LANコントローラ114、IEEE 1394コントローラ115、エンベデッドコントローラ/キーボードコントローラIC(EC/KBC)116、TVチューナ117、およびEEPROM118等を備えている。
【0018】
CPU101は本コンピュータ10の動作を制御するプロセッサであり、ハードディスクドライブ(HDD)111から主メモリ103にロードされる、オペレーティングシステム(OS)201、およびTVアプリケーションプログラム202のような各種アプリケーションプログラムを実行する。TVアプリケーションプログラム202はTV機能を実行するためのソフトウェアである。このTVアプリケーションプログラム202は、TVチューナ117によって受信された放送番組データを視聴するためのライブ再生処理、受信された放送番組データをHDD111に記録する録画処理、およびHDD111に記録された放送番組データ/ビデオデータを再生する再生処理等を実行する。また、CPU101は、BIOS−ROM109に格納されたBIOS(Basic Input Output System)も実行する。BIOSはハードウェア制御のためのプログラムである。
【0019】
ノースブリッジ102はCPU101のローカルバスとサウスブリッジ104との間を接続するブリッジデバイスである。ノースブリッジ102には、主メモリ103をアクセス制御するメモリコントローラも内蔵されている。また、ノースブリッジ102は、PCI EXPRESS規格のシリアルバスなどを介してGPU105との通信を実行する機能も有している。
【0020】
GPU105は、本コンピュータ10のディスプレイモニタとして使用されるLCD17を制御する表示コントローラである。このGPU105によって生成される表示信号はLCD17に送られる。また、GPU105は、HDMI制御回路3およびHDMI端子2を介して、外部ディスプレイ装置1にデジタル映像信号を送出することもできる。
【0021】
HDMI端子2は上述の外部ディスプレイ接続端子である。HDMI端子2は、非圧縮のデジタル映像信号と、デジタルオーディオ信号とを一本のケーブルでテレビのような外部ディスプレイ装置1に送出することができる。HDMI制御回路3は、HDMIモニタと称される外部ディスプレイ装置1にデジタル映像信号をHDMI端子2を介して送出するためのインタフェースである。
【0022】
サウスブリッジ104は、LPC(Low Pin Count)バス上の各デバイス、およびPCI(Peripheral Component Interconnect)バス上の各デバイスを制御する。また、サウスブリッジ104は、ハードディスクドライブ(HDD)111およびDVDドライブ112を制御するためのIDE(Integrated Drive Electronics)コントローラを内蔵している。さらに、サウスブリッジ104は、サウンドコントローラ106との通信を実行する機能も有している。
【0023】
またさらに、サウスブリッジ104には、PCI EXPRESS規格のシリアルバスなどを介してビデオプロセッサ113が接続されている。
【0024】
ビデオプロセッサ113は、前述の映像インデキシングに関する各種処理を実行するプロセッサである。このビデオプロセッサ113は、映像インデキシング処理を実行するためのインデキシング処理部として機能する。すなわち、映像インデキシング処理においては、ビデオプロセッサ113は、映像コンテンツデータに含まれる動画像データから複数の顔画像を抽出すると共に、抽出された各顔画像が映像コンテンツデータ内に登場する時点を示すタイムスタンプ情報、等を出力する。顔画像の抽出は、例えば、動画像データの各フレームから顔領域を検出する顔検出処理、検出された顔領域をフレームから切り出す切り出し処理等によって実行される。顔領域の検出は、例えば、各フレームの画像の特徴を解析して、予め用意された顔画像特徴サンプルと類似する特徴を有する領域を探索することによって行うことができる。顔画像特徴サンプルは、多数の人物それぞれの顔画像特徴を統計的に処理することによって得られた特徴データである。
【0025】
メモリ113Aは、ビデオプロセッサ113の作業メモリとして用いられる。インデキシング処理(CM検出処理、映像インデキシング処理)を実行するためには多くの演算量が必要とされる。本実施形態においては、CPU101とは異なる専用のプロセッサであるビデオプロセッサ113がバックエンドプロセッサとして使用され、このビデオプロセッサ113によってインデキシング処理が実行される。よって、CPU101の負荷の増加を招くことなく、インデキシング処理を実行することが出来る。
【0026】
サウンドコントローラ106は音源デバイスであり、再生対象のオーディオデータをスピーカ18A,18BまたはHDMI制御回路3に出力する。
【0027】
無線LANコントローラ114は、たとえばIEEE 802.11規格の無線通信を実行する無線通信デバイスである。IEEE 1394コントローラ115は、IEEE 1394規格のシリアルバスを介して外部機器との通信を実行する。
【0028】
エンベデッドコントローラ/キーボードコントローラIC(EC/KBC)116は、電力管理のためのエンベデッドコントローラと、キーボード(KB)13およびタッチパッド16を制御するためのキーボードコントローラとが集積された1チップマイクロコンピュータである。このエンベデッドコントローラ/キーボードコントローラIC(EC/KBC)116は、ユーザによるパワーボタン14の操作に応じて本コンピュータ10をパワーオン/パワーオフする機能を有している。さらに、エンベデッドコントローラ/キーボードコントローラIC(EC/KBC)116は、リモコンユニットインタフェース20との通信を実行する機能を有している。
【0029】
TVチューナ117はテレビジョン(TV)放送信号によって放送される放送番組データを受信する受信装置であり、アンテナ端子19に接続されている。このTVチューナ117は、例えば、地上波デジタルTV放送のようなデジタル放送番組データを受信可能なデジタルTVチューナとして実現されている。また、TVチューナ117は、外部機器から入力されるビデオデータをキャプチャする機能も有している。
【0030】
次に、図3を参照して、TVアプリケーションプログラム202によって実行される顔画像一覧表示機能について説明する。
【0031】
放送番組データのような映像コンテンツデータに対するインデキシング処理(映像インデキシング処理)は、上述したように、インデキシング処理部として機能するビデオプロセッサ113によって実行される。
【0032】
ビデオプロセッサ113は、TVアプリケーションプログラム202の制御の下、例えば、ユーザによって指定された録画済みの放送番組データ等の映像コンテンツデータに対してインデキシング処理を実行する。また、ビデオプロセッサ113は、TVチューナ117によって受信された放送番組データをHDD111に格納する録画処理と並行して、当該放送番組データに対するインデキシング処理を実行することもできる。
【0033】
映像インデキシング処理(顔画像インデキシング処理とも云う)においては、ビデオプロセッサ113は、映像コンテンツデータに含まれる動画像データをフレーム単位で解析する。そして、ビデオプロセッサ113は、動画像データを構成する複数のフレームそれぞれから人物の顔画像を抽出すると共に、抽出された各顔画像が映像コンテンツデータ内に登場する時点を示すタイムスタンプ情報を出力する。各顔画像に対応するタイムスタンプ情報としては、映像コンテンツデータの開始から当該顔画像が登場するまでの経過時間、または当該顔画像が抽出されたフレーム番号、等を使用することが出来る。
【0034】
さらに、ビデオプロセッサ113は、抽出された各顔画像のサイズ(解像度)も出力する。ビデオプロセッサ113から出力される顔検出結果データ(顔画像、タイムスタンプ情報TS、およびサイズ)は、データベース111Aに顔画像インデキシング情報として格納される。このデータベース111Aは、HDD111内に用意されたインデキシングデータ記憶用の記憶領域である。
【0035】
さらに、映像インデキシング処理においては、ビデオプロセッサ113は、顔画像を抽出する処理と並行して、サムネイル画像取得処理も実行する。サムネイル画像は、映像コンテンツデータから例えば等時間間隔で抽出された複数のフレームの各々に対応する画像(縮小画像)である。すなわち、ビデオプロセッサ113は、顔画像を含むフレームであるか否かに関係なく、映像コンテンツデータから例えば所定の等時間間隔でフレームを順次抽出し、抽出した各フレームに対応する画像(サムネイル画像)と、そのサムネイル画像が出現する時点を示すタイムスタンプ情報TSとを出力する。ビデオプロセッサ113から出力されるサムネイル画像取得結果データ(サムネイル、タイムスタンプ情報TS)も、データベース111Aにサムネイルインデキシング情報として格納される。
【0036】
図3に示されているように、TVアプリケーションプログラム202は、顔画像一覧表示機能を実行するための顔画像一覧表示処理部301を含んでいる。この顔画像一覧表示処理部301は、例えば、インデキシングビューワプログラムとして実現されており、データベース111Aに格納されたインデキシング情報(顔画像インデキシング情報、サムネイルインデキシング情報等)を用いて、映像コンテンツデータの概要を俯瞰するためのインデキシングビュー画面を表示する。
【0037】
具体的には、顔画像一覧表示処理部301は、データベース111Aから顔画像インデキシング情報(顔画像、タイムスタンプ情報TS、およびサイズ)を読み出し、そしてその顔画像インデキシング情報を用いて、映像コンテンツデータに登場する人物の顔画像の一覧を、インデキシングビュー画面上の2次元の表示エリア(以下、顔サムネイル表示エリアと称する)上に表示する。この場合、顔画像一覧表示処理部301は、映像コンテンツデータの総時間長を、例えば等間隔で、複数の時間帯に分割し、時間帯毎に、抽出された顔画像の内から当該時間帯に登場する顔画像を所定個選択する。そして、顔画像一覧表示処理部301は、時間帯毎に、選択した所定個の顔画像それぞれを並べて表示する。
【0038】
すなわち、2次元の顔サムネイル表示エリアは、複数の行および複数の列を含むマトリクス状に配置された複数の顔画像表示エリアを含む。複数の列それぞれには、映像コンテンツデータの総時間長を構成する複数の時間帯が割り当てられている。具体的には、例えば、複数の列それぞれには、映像コンテンツデータの総時間長をこれら複数の列の数で等間隔に分割することによって得られる、互いに同一の時間長を有する複数の時間帯がそれぞれ割り当てられる。もちろん、各列に割り当てられる時間帯は必ずしも同一の時間長でなくてもよい。
【0039】
顔画像一覧表示処理部301は、顔画像それぞれに対応するタイムスタンプ情報TSに基づき、各列内に属する行数分の顔画像表示エリア上に、当該各列に割り当てられた時間帯に属する顔画像それぞれを、例えば、それら顔画像の出現頻度順(顔画像の検出時間長順)のような順序で並べて表示する。この場合、例えば、当該各列に割り当てられた時間帯に属する顔画像の内から、出現頻度(登場頻度)の高い順に顔画像が行数分だけ選択され、選択された顔画像が登場頻度順に上から下に向かって並んで配置される。もちろん、出現頻度順ではなく、各列に割り当てられた時間帯に出現する顔画像それぞれを、その出現順に並べて表示してもよい。
【0040】
この顔画像一覧表示機能により、映像コンテンツデータ全体の中のどの時間帯にどの人物が登場するのかをユーザに分かりやすく提示することができる。顔サムネイル表示エリアの具体的な構成例については、図5以降で後述する。
【0041】
また、顔画像一覧表示処理部301は、データベース111Aからサムネイルインデキシング情報(サムネイル、タイムスタンプ情報TS)を読み出し、そしてサムネイルインデキシング情報を用いて、サムネイル画像それぞれを、顔サムネイル表示エリアの下方側または上方側の一方に配置されたサムネイル表示エリア(以下、じゃばらサムネイル表示エリアと称する)上に、それらサムネイル画像の出現時間順に一列に並べて表示する。
【0042】
映像コンテンツデータによっては、顔画像が登場しない時間帯も存在する。したがって、インデキシングビュー画面上に顔サムネイル表示エリアのみならず、じゃばらサムネイル表示エリアも表示することにより、顔画像が登場しない時間帯においても、その時間帯の映像コンテンツデータの内容をユーザに提示することができる。
【0043】
次に、図4を参照して、TVアプリケーションプログラム202の機能構成を説明する。
【0044】
TVアプリケーションプログラム202は、上述の顔画像一覧表示処理部301に加え、記録処理部401、インデキシング制御部402、再生処理部403等を備えている。
【0045】
記録処理部401は、TVチューナ117によって受信された放送番組データ、または外部機器から入力されるビデオデータをHDD111に記録する記録処理を実行する。また、記録処理部401は、ユーザによって予め設定された録画予約情報(チャンネル番号、日時)によって指定される放送番組データをTVチューナ117を用いて受信し、その放送番組データをHDD111に記録する予約録画処理も実行する。
【0046】
インデキシング制御部402は、ビデオプロセッサ(インデキシング処理部)113を制御して、映像インデキシング処理をビデオプロセッサ113に実行させる。ユーザは、録画対象の放送番組データ毎にインデキシング処理を実行するか否かを指定することができる。例えば、インデキシング処理の実行が指示された録画対象の放送番組データについては、その放送番組データがHDD111に記録された後に、インデキシング処理が自動的に開始される。また、ユーザは、既にHDD111に格納されている映像コンテンツデータの内から、インデキシング処理を実行すべき映像コンテンツデータを指定することもできる。
【0047】
再生処理部403は、HDD111に格納されている各映像コンテンツデータを再生する処理を実行する。また、再生処理部403は、ある映像コンテンツデータの顔画像一覧の中の一つの顔画像が選択されている状態でユーザ操作によって再生指示イベントが入力された時、選択されている顔画像が登場する時点よりも所定時間前の時点から映像コンテンツデータの再生を開始する機能を有している。
【0048】
なお、インデキシング処理は、必ずしもビデオプロセッサ113によって実行する必要はなく、例えば、TVアプリケーションプログラム202にインデキシング処理を実行する機能を設けてもよい。この場合、インデキシング処理は、TVアプリケーションプログラム202の制御の下に、CPU101によって実行される。
【0049】
次に、図5乃至図7を参照して、インデキシングビュー画面の具体的な構成について説明する。
【0050】
図5には、顔画像一覧表示処理部301によってLCD17に表示されるインデキシングビュー画面の例が示されている。このインデキシングビュー画面は、ある映像コンテンツデータ(例えば放送番組データ)をインデキシング処理することによって得られた画面である。このインデキシングビュー画面には、顔画像の一覧を表示するための上述の顔サムネイル表示エリアと、サムネイル画像の一覧をじゃばら形式で表示するための上述のじゃばらサムネイル表示エリアとを含んでいる。
【0051】
ここで、じゃばら形式とは、選択されているサムネイル画像を通常サイズ(フルサイズ)で表示し、他の各サムネイル画像についてはその横方向サイズを縮小して表示する表示形式である。図5においては、選択されたサムネイル画像との距離が大きいサムネイル画像ほど、その横方向サイズが縮小されている。
【0052】
図6は、顔サムネイル表示エリアの構成例が示されている。
【0053】
顔サムネイル表示エリアは、複数の行と複数の列とを含むマトリクス状に配置された複数個の顔画像表示エリアを含んでいる。図6においては、顔サムネイル表示エリアは6行×16列から構成されている。顔サムネイル表示エリアに含まれる顔画像表示エリアの数は、96個である。
【0054】
列1〜列16のそれぞれには、例えば、映像コンテンツデータの総時間長を列数(=16)で等間隔で分割することによって得られる、互いに同一の時間長Tを有する複数の時間帯がそれぞれ割り当てられる。
【0055】
例えば、映像コンテンツデータの総時間長が2時間であるならば、その2時間が16個の時間帯に等間隔で分割される。この場合、各時間帯の時間長Tは、7.5分である。例えば、列1には、先頭0:00:00から0:07:30までの時間帯が割り当てられ、列2には、0:07:30から0:15:00までの時間帯が割り当てられ、列3には、0:15:00から0:22:30までの時間帯が割り当てられる。映像コンテンツデータの総時間長に応じて、各時間帯の時間長Tは変化する。
【0056】
もちろん、複数の列それぞれに割り当てられる時間帯の長さは、必ずしも同一である必要はない。
【0057】
顔画像一覧表示処理部301は、ビデオプロセッサ113によって抽出された顔画像それぞれに対応するタイムスタンプ情報に基づき、各列内の6個の顔画像表示エリア上に、当該各列に割り当てられた時間帯に属する顔画像それぞれをたとえば上述の頻度順に並べて表示する。この場合、顔画像一覧表示処理部301は、表示処理対象の列に割り当てられた時間帯に属する顔画像の内から行数分(6個)の顔画像を選択し、選択した行数分の顔画像それぞれを並べて表示する。
【0058】
このように、顔サムネイル表示エリアにおいては、左端位置(1,1)を基点とし、右端位置(6,16)を映像コンテンツデータの終端とする時間軸が用いられている。
【0059】
顔サムネイル表示エリアの各顔画像表示エリアに表示される顔画像のサイズは“大”、 “中”、“小”の内からユーザが選択することができる。行と列の数は、ユーザが選択した顔画像のサイズに応じて変化される。顔画像のサイズと行と列の数との関係は、次の通りである。
【0060】
(1)“大”の場合; 3行×8列
(2)“中”の場合; 6行×16列
(3)“小”の場合: 10行×24列
“大”の場合においては、各顔画像は、例えば、180×180ピクセルのサイズで表示される。“中”の場合においては、各顔画像は、例えば、90×90ピクセルのサイズで表示される。“小”の場合においては、各顔画像は、例えば、60×60ピクセルのサイズで表示される。デフォルトの顔画像サイズは、例えば、“中”に設定されている。
【0061】
顔サムネイル表示エリア内の各顔画像は、選択されていない“標準”状態、選択されている“フォーカス”状態の2つの状態のいずれかに設定される。“フォーカス”状態の顔画像のサイズは、“標準”状態の時のサイズ(180×180、90×90、または60×60)よりも大きく設定される。図6においては、座標(1,12)の顔画像が“フォーカス”状態である場合を示している。
【0062】
じゃばらサムネイル表示エリアに表示されるサムネイル画像の枚数は、ユーザ設定に従って、例えば240枚、144枚、96枚、48枚のいずれかに設定される。デフォルトは例えば240枚である。
【0063】
サムネイル画像は、選択されていない“標準”状態、選択されている“フォーカス”状態の2つの状態のいずれかに設定される。“フォーカス”状態のサムネイル画像は、他のサムネイル画像よりも大きいサイズで表示される。
【0064】
次に、図7を参照して、顔サムネイル表示エリアとじゃばらサムネイル表示エリアとの関係について説明する。
【0065】
同一列に属する顔画像表示エリア群の集合、つまり顔サムネイル表示エリア内の個々の列を“大区間”と称する。また、“大区間”をさらに分割したものを“小区間”と称する。1つの大区間に含まれる小区間の数は、じゃばらサムネイル表示エリアに表示されるサムネイル画像の数を顔サムネイル表示エリアの列数で割った商で与えられる。例えば、顔サムネイル表示エリアが6行×16列で、じゃばらサムネイル表示エリアに表示されるサムネイル画像の数が240枚であるならば、1つの大区間に含まれる小区間の数は、15(=240÷16)となる。1つの大区間は15個の小区間を含む。換言すれば、1つの大区間に対応する時間帯には、15枚のサムネイル画像が属することになる。
【0066】
じゃばらサムネイル表示エリア上のあるサムネイル画像が選択された時、顔画像一覧表示処理部301は、選択されたサムネイル画像のタイムスタンプ情報に基づき、顔サムネイル表示エリア内の複数の列(複数の大区間)の内で、選択されたサムネイル画像が属する時間帯が割り当てられた列(大区間)を選択する。選択される大区間は、選択されたサムネイル画像を小区間として含む大区間である。そして、顔画像一覧表示処理部301は、選択した大区間を強調表示する。
【0067】
このように、じゃばらサムネイル表示エリア上のサムネイル画像が選択された時には、顔サムネイル表示エリア内の複数の列の内から、選択されたサムネイル画像が属する時間帯が割り当てられている列(大区間)が自動選択される。これにより、ユーザは、選択したサムネイル画像が、顔サムネイル表示エリア内のどの列(大区間)に対応する画像であるかを識別することができる。さらに、縦長のバーにより、ユーザは、選択したサムネイル画像が、どの列(大区間)内のどの辺りの時点に対応する画像であるかも識別することができる。
【0068】
ところで、顔サムネイル表示エリアの各顔画像表示エリアに表示される顔画像のサイズとして、出現頻度に応じて顔画像のサイズを変更する設定にすることが出来る。
【0069】
この設定は、さらに予め用意された複数の配列形式から選択することが出来る。例えば、図8(A)〜図8(C)に示すように、ユーザは3つの配列形式から一つの配列形式を選ぶことが出来る。図8に示す配列形式は、一つの大区間を示しており、この配列形式が8列表示される。なお、図8(A)〜図8(C)において、各エリア内の矩形領域は顔画像が表示される領域である。買う矩形領域内に表示され得いる数字は、出現頻度の順番を表す。
【0070】
図8(A)に示す配列形式は、大顔画像エリア、中顔画像エリア、および小顔画像エリアを有する。大画像エリアには、出現頻度が最も高い1枚の顔画像が表示される。中顔画像エリアには、出現頻度が2番目から5番目の4枚の顔画像が表示される。小顔画像エリアには、出現頻度が6番目から21番目の16枚の顔画像が表示される。
【0071】
図8(B)に示す配列形式は、大顔画像エリア、および中顔画像エリアを有する。大画像エリアには、出現頻度が最も高い顔と2番目の顔との2枚の顔画像が表示される。中顔画像エリアには、出現頻度が3番目から6番目の4枚の顔画像が表示される。
【0072】
図8(C)に示す配列形式は、大顔画像エリア、および中顔画像エリアを有する。大画像エリアには、出現頻度が最も高い1枚の顔画像が表示される。中顔画像エリアには、出現頻度が2番目から8番目の8枚の顔画像が表示される。
【0073】
図8(A)〜図8(C)の3種類の配列形式から一つの配列形式をユーザが選択するためのウィンドウの例を図9に示す。図9に示すように、大区間の配列形式の例が3つ表示されている。そして、それぞれの配列形式の上側にそれぞれラジオボタンが設けられている。ラジオボタンは3つのボタンの中から一つのボタンだけを選択した後、OKボタンを操作することによって、選択された配列形式が表示されるようになる。
【0074】
図8(A)に示した配列形式の表示例を図10に示す。図10に示すように、じゃばらサムネイル表示エリア上の8列の大区間に、図8(A)と同様な配列形式で顔画像が表示されている。各大区間には出現頻度が高い顔から順に顔画像が表示されている。
【0075】
なお、中顔画像エリア、および小顔画像エリアの画像は小さく、判別しにくいことがある。しかし、本装置では、中顔画像エリア、および小顔画像エリアにポインタ501を重ねて静止した状態(所謂、マウスオーバー)で所定の時間が経過すると、サイズが多きな顔画像、例えば大顔画像エリアの画像と同じ大きさの顔画像502がポインタ501の脇にポップアップ表示されるようにしてもよい(図11)。
【0076】
マウスオーバーしてから顔画像がポップアップ表示されるまでの時間は、ユーザが設定することが出来る。図12に示す設定ウィンドウ中において、チェックボックス511を選択し、矩形領域512内の秒数の数字を変化させることで設定することが出来る。
【0077】
設定した時間、マウスオーバーの時間が経過すると顔画像一覧表示処理部301にイベントが入力され、顔画像一覧表示処理部301は顔画像の拡大表示を行う。
【0078】
また、設定に応じては、マウスオーバーしてから顔画像が切り出された元画像を表示することも出来る。これは、大画像エリア、中顔画像エリア、および小顔画像エリアの全てのエリアで有効になる。顔画像が切り出された元画像を表示する設定ウィンドウの例を図13に示す。図13に示すように、排他的に選択可能な二つのラジオボタン521,522の一方をユーザが選択することによって、中顔画像エリアおよび小顔画像エリアにおける顔画像拡大表示並びに切り出し元画像表示の一方が設定される。
【0079】
設定した時間、マウスオーバーの時間が経過すると顔画像一覧表示処理部301にイベントが入力され、顔画像一覧表示処理部301は、設定に応じて顔画像の拡大表示、または切り出し元画像の表示を行う。
【0080】
次に、図14のフローチャートを参照して、顔画像一覧表示処理部301によって実行される表示処理の手順を説明する。
【0081】
まず、顔画像一覧表示処理部301は、データベース111Aに格納されている顔画像それぞれを、それら顔画像に対応するタイムスタンプ情報に基づいて、それら顔画像の登場時間順にソートする(ステップS101)。次いで、顔画像一覧表示処理部301は、ユーザによって指定された参照すると共に、例えばインデキシング対象の映像コンテンツデータの総時間長を列数で均等に分割することによって、各列(大区間)に割り当てる時間帯を算出する。そして、顔画像一覧表示処理部301は、表示処理対象の列に割り当てられた時間帯内に属する顔画像の内から、選択されている表示形式に応じた大区間に表示される顔画像の数の顔画像を選択する(ステップS102)。
【0082】
顔画像一覧表示処理部301は、表示処理対象の列に割り当てられた時間帯に属する顔画像の内から、当該時間帯において登場する頻度の高い顔画像を優先的に選択する。例えば、ビデオプロセッサ113は、抽出した顔画像それぞれの特徴データの相関に基づいて、同一人物の顔画像それぞれを同一カテゴリーに分類するクラスタリング処理を実行することができる。この場合、図15に示すように、顔画像それぞれは、人物毎(すなわちカテゴリー毎)に分類されてデータベース111Aに格納される。図15においては、カテゴリー1は、ある人物Aの顔画像の集合を示しており、カテゴリー2は、ある人物Bの顔画像の集合を示しており、またカテゴリー3は、ある人物Bの顔画像の集合を示している。顔画像一覧表示処理部301は、登場する頻度の高い人物の顔画像を優先的に選択する。なお、ある同一人物の顔画像のみが比較的長い時間出現され続けている時間帯においては、当該時間帯に対応する列上に同一人物の異なる複数の顔画像を表示してもよい。
【0083】
次いで、顔画像一覧表示処理部301は、表示処理対象の列内の複数の顔画像表示エリアに、選択した顔画像それぞれを例えば出現頻度順に並べて表示する(ステップS103)。出現頻度の高い顔画像ほど、上方の顔画像表示エリアに表示される。
【0084】
ステップS102,S103の処理は、全ての列に対する処理が完了するまで、表示処理対象の列の番号を更新しながら繰り返し実行される(ステップS104,S105)。
【0085】
全ての列に対する処理が完了すると(ステップS104のNO)、顔画像一覧表示処理部301は、データベース11Aに格納されているサムネイル画像それぞれを、それらサムネイル画像それぞれのタイムスタンプ情報に基づいて、じゃばらサムネイル表示エリア上にそれらサムネイル画像が出現する時間順に一列に並べて表示する(ステップS106)。
【0086】
次に、図16のフローチャートを参照して、再生処理部403によって実行される再生処理の手順を説明する。
【0087】
ユーザ操作に応じてある顔画像上で一定時間マウスオーバーが行われて顔画像一覧表示処理部301にイベントが入力された時(ステップS301のYES)、顔画像一覧表示処理部301は、顔画像の拡大表示を行う設定になっているか判別する(ステップS302)。拡大表示する設定ならば(ステップS302のYES)、顔画像一覧表示処理部301は、選択されている顔画像を拡大表示する(ステップS303)。拡大表示する設定はない(ステップS302のNO)、すなわち顔画像の切り出し元画像を表示する設定ならば、顔画像一覧表示処理部301は選択されている顔画像の切り出し元画像を表示する(ステップS303)。
【0088】
以上のように、本実施形態においては、映像コンテンツデータ全体を対象に顔画像の一覧を出現時間帯毎に出現頻度に応じたサイズで表示する。よって、映像コンテンツデータを再生することなく、映像コンテンツデータ全体の中のどの辺りの時間帯にどの人物がどの程度の頻度で登場するのかをユーザに提示できる。
【0089】
なお、本実施形態では、インデキシング処理部として機能するビデオプロセッサ113によって顔画像インデキシング情報を生成したが、例えば、放送番組データ内に予め当該放送番組データに対応するインデキシング情報が含まれている場合には、インデキシング処理を行う必要はない。よって、本実施形態の顔画像一覧表示機能は、データベース111Aと顔画像一覧表示処理部301のみによっても実現することが出来る。
【0090】
また、本実施形態の顔画像一覧表示処理の手順は全てソフトウェアによって実現することができるので、このソフトウェアをコンピュータ読み取り可能な記憶媒体を通じて通常のコンピュータに導入することにより、本実施形態と同様の効果を容易に実現することができる。
【0091】
また、本実施形態の電子機器はコンピュータ10によって実現するのみならず、例えば、HDDレコーダ、DVDレコーダ、テレビジョン装置といった様々なコンシューマ電子機器によって実現することもできる。この場合、TVアプリケーションプログラム202の機能は、DSP、マイクロコンピュータのようなハードウェアによって実現することができる。
【0092】
なお、本発明は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合せにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。更に、異なる実施形態に亘る構成要素を適宜組み合せてもよい。
以下に、本願の原出願の特許査定時の特許請求の範囲に記載された発明を付記する。 [1]映像コンテンツデータから抽出された複数の顔画像と前記各顔画像が前記映像コンテンツデータ内に登場する時点を示すタイムスタンプ情報と含む顔画像インデキシング情報とを格納する記憶装置と、
前記映像コンテンツデータに複数の時間帯を割り当て、前記タイムスタンプ情報に基づいて前記各時間帯に属する顔画像をそれぞれ抽出する手段と、
抽出された顔画像から同一人物の顔画像をそれぞれ分類する手段と、
分類されたそれぞれの顔画像の出現頻度を算出する手段と、
前記顔画像インデキシング情報に含まれる複数の顔画像の一覧を2次元の表示エリア内の顔画像表示エリアに表示する顔画像一覧表示手段であって、前記顔画像表示エリアは、前記複数の時間帯に応じた複数列の時間帯別表示エリアを有し、前記各時間帯別表示エリアに表示される各顔画像は、前記出現頻度に基づいたサイズで表示されている、前記顔画像一覧表示手段とを具備することを特徴とする電子機器。
[2]前記映像コンテンツデータから複数の顔画像を抽出すると共に、抽出された各顔画像が前記映像コンテンツデータ内に登場する時点を示す前記タイムスタンプ情報を出力するインデキシング処理部を更に具備することを特徴とする[1]記載の電子機器。
[3]前記出現頻度に基づいたサイズで表示される複数の表示形式から前記顔画像表示エリアに表示される表示形式をユーザが指定するための手段を更に具備することを特徴とする[1]または[2]のいずれか1項に記載の電子機器。
[4]前記顔画像一覧表示手段は、ユーザの操作に応じて一枚の顔画像に対してのイベントが入力された場合、顔画像一覧表示手段は、前記一枚の顔画像を拡大して表示する、または前記顔画像の抽出元の画像を表示することを特徴とする[1]、[2]、[3]のいずれか1項に記載の電子機器。
[5]前記イベントが入力されるユーザの操作を設定するための設定手段を更に具備することを特徴とする[4]記載の電子機器。
[6]前記ユーザの操作に応じて表示位置が変化するポインタが表示され、
前記設定手段によって、前記顔画像上で前記ポインタが静止している時間が設定されることを特徴とする[5]記載の電子機器。
[7]映像コンテンツデータから抽出された複数の顔画像と前記各顔画像が前記映像コンテンツデータ内に登場する時点を示すタイムスタンプ情報と含む顔画像インデキシング情報を生成し、
前記映像コンテンツデータに複数の時間帯を割り当て、前記タイムスタンプ情報に基づいて前記各時間帯に属する顔画像をそれぞれ抽出し、
抽出された同一の時間帯に属する顔画像から同一人物の顔画像をそれぞれ分類し、
分類されたそれぞれの顔画像の出現頻度を算出し、
前記顔画像インデキシング情報に含まれる複数の顔画像の一覧を2次元の表示エリア内に顔画像表示エリアに表示する顔画像表示方法であって、
前記顔画像表示エリアは、前記複数の時間帯に応じた複数列の時間帯別表示エリアを有し、前記各時間帯別表示エリアに表示される各顔画像は、前記出現頻度に基づいたサイズで表示されていることを特徴とする顔画像表示方法。
[8]前記出現頻度に基づいたサイズで表示される表示形式が複数用意され、ユーザが指定した表示形式に応じて前記各時間帯別表示エリアに顔画像が表示されることを特徴とする[7]記載の顔画像表示方法。
[9]ユーザの操作に応じて一枚の顔画像に対して発生するイベントが発生した場合、前記一枚の顔画像を拡大して表示する、または前記顔画像の抽出元の画像を表示することを特徴とする[7]記載の顔画像表示方法。
[10]前記ユーザの操作に応じて表示位置が変化するポインタが表示され、
前記顔画像上で前記ポインタが静止している時間が、設定された時間を経過した場合に前記イベントが発生することを特徴とする[9]記載の顔画像表示方法。
【符号の説明】
【0093】
10…電子機器(コンピュータ)、111A…データベース、113…ビデオプロセッサ、117…TVチューナ、301…顔画像一覧表示処理部、402…インデキシング制御部、403…再生処理部。

【特許請求の範囲】
【請求項1】
映像コンテンツデータから抽出された複数の顔画像を含む顔画像インデキシング情報を格納する記憶装置と、
前記顔画像インデキシング情報に含まれる顔画像を分類する分類手段と、
分類されたそれぞれの顔画像の出現頻度を算出する算出手段と、
前記分類されたそれぞれの顔画像の一覧を表示する顔画像一覧表示手段であって、前記分類されたそれぞれの顔画像は、前記出現頻度に基づいたサイズで表示されている、顔画像一覧表示手段とを具備する電子機器。
【請求項2】
前記顔画像インデキシング情報は各顔画像が前記映像コンテンツデータ内に登場する時点を示すタイムスタンプ情報を含み、
前記映像コンテンツデータに複数の時間帯を割り当て、前記タイムスタンプ情報に基づいて各時間帯に属する顔画像をそれぞれ抽出する抽出手段を更に具備し、
前記算出手段は、前記複数の時間帯毎に前記分類されたそれぞれ顔画像の出現頻度を算出し、
顔画像一覧表示手段は、2次元の表示エリア内の顔画像表示エリアに前記分類されたそれぞれの顔画像の一覧を表示し、
前記顔画像表示エリアは、前記複数の時間帯に応じた複数列の時間帯別表示エリアを有し、複数の時間帯の内の第1の時間帯に対応する前記複数の時間帯別表示エリアの内の第1の時間帯別表示エリアに表示される各顔画像は前記第1の時間帯における出現頻度に基づいたサイズで表示されている、
請求項1記載の電子機器。
【請求項3】
前記映像コンテンツデータから複数の顔画像を抽出するインデキシング処理部を更に具備する請求項1記載の電子機器。
【請求項4】
前記インデキシング処理部は、前記抽出されたそれぞれの顔画像が前記映像コンテンツデータ内に登場する時点を示す前記タイムスタンプ情報を出力する請求項3記載の電子機器。
【請求項5】
前記出現頻度に基づいたサイズで表示される複数の表示形式から前記顔画像表示エリアに表示される表示形式をユーザが指定するための手段を更に具備する請求項1、2、3、4のいずれか1項に記載の電子機器。
【請求項6】
前記顔画像一覧表示手段は、ユーザの操作に応じて一枚の顔画像に対してのイベントが入力された場合、顔画像一覧表示手段は、前記一枚の顔画像を拡大して表示する、または前記顔画像の抽出元の画像を表示する請求項1、2、3、4、5のいずれか1項に記載の電子機器。
【請求項7】
前記イベントが入力されるユーザの操作を設定するための設定手段を更に具備する請求項6記載の電子機器。
【請求項8】
前記ユーザの操作に応じて表示位置が変化するポインタが表示され、
前記設定手段によって、前記顔画像上で前記ポインタが静止している時間が設定される請求項7記載の電子機器。
【請求項9】
映像コンテンツデータから抽出された複数の顔画像を含む顔画像インデキシング情報に含まれる顔画像を分類し、
分類されたそれぞれの顔画像の出現頻度を算出し、
前記分類されたそれぞれの顔画像の一覧を表示する、前記分類されたそれぞれの顔画像は前記出現頻度に基づいたサイズで表示されている
顔画像表示方法。
【請求項10】
前記顔画像インデキシング情報は各顔画像が前記映像コンテンツデータ内に登場する時点を示すタイムスタンプ情報を含み、
前記映像コンテンツデータに複数の時間帯を割り当て、前記タイムスタンプ情報に基づいて各時間帯に属する顔画像をそれぞれ抽出し、
前記複数の時間帯毎に前記分類されたそれぞれの顔画像の出現頻度を算出し、
2次元の表示エリア内の顔画像表示エリアに前記分類されたそれぞれの顔画像の一覧を表示し、
前記顔画像表示エリアは、前記複数の時間帯に応じた複数列の時間帯別表示エリアを有し、
前記複数の時間帯の内の第1の時間帯に対応する前記複数の時間帯別表示エリアの内の第1の時間帯別表示エリアに表示される各顔画像は前記第1の時間帯における出現頻度に基づいたサイズで表示されている、
請求項9に記載の顔画像表示方法。
【請求項11】
前記出現頻度に基づいたサイズで表示される表示形式が複数用意され、ユーザが指定した表示形式に応じて顔画像が表示される請求項9記載の顔画像表示方法。
【請求項12】
ユーザの操作に応じて一枚の顔画像に対して発生するイベントが発生した場合、前記一枚の顔画像を拡大して表示する、または前記顔画像の抽出元の画像を表示する請求項9記載の顔画像表示方法。
【請求項13】
前記ユーザの操作に応じて表示位置が変化するポインタが表示され、
前記顔画像上で前記ポインタが静止している時間が、設定された時間を経過した場合に前記イベントが発生する請求項12記載の顔画像表示方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate


【公開番号】特開2012−95334(P2012−95334A)
【公開日】平成24年5月17日(2012.5.17)
【国際特許分類】
【出願番号】特願2011−279891(P2011−279891)
【出願日】平成23年12月21日(2011.12.21)
【分割の表示】特願2007−256524(P2007−256524)の分割
【原出願日】平成19年9月28日(2007.9.28)
【出願人】(000003078)株式会社東芝 (54,554)
【Fターム(参考)】