電子機器、メタデータ生成方法及びプログラム

【課題】ネットワーク上のコンテンツに関するメタデータを自身で生成できない場合に、当該ネットワーク上の他の機器に当該メタデータを生成させること。
【解決手段】ＰＶＲ３００のＣＰＵ４２は、ネットワーク５０上の各コンテンツについて、特殊再生等の処理に必要なメタデータが生成されているか否かを判断し、メタデータが生成されていない場合、ネットワーク５０上から当該メタデータの生成が可能な機器を探索し、当該機器へメタデータの生成を指示する。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、ネットワーク上の他の機器と通信可能な電子機器、当該電子機器におけるメタデータ生成方法及びプログラムに関する。
【背景技術】
【０００２】
従来から、家庭内のＡＶ（Audio/Visual）ネットワークシステムでは、例えばある部屋に存在する機器を用いて、別の部屋に存在する機器に記憶されたコンテンツを、その記憶場所をユーザに意識させずに再生することが可能となっている。
また、このような機器の中には、コンテンツの編集やダイジェスト再生等の特殊再生機能を有するものも存在する。例えば下記特許文献１には、放送番組のジャンルをコーナー単位で検出してダイジェスト再生を行うことが可能な記録再生装置が開示されている。
【先行技術文献】
【特許文献】
【０００３】
【特許文献１】特開２００７−２９４０２０号公報
【発明の概要】
【発明が解決しようとする課題】
【０００４】
ところで、ある機器のユーザが、ネットワーク上の他の機器に記憶されたコンテンツについて、上記特殊再生を行いたい場合、当該ユーザの機器がそのような特殊再生機能を有している必要がある。一方、そのような特殊再生機能は、コンテンツの通常再生機能に比べて使用頻度が低いため、あらゆる機器にその機能を組み込むことも効率的ではない。
【０００５】
また、ネットワーク上に特殊再生機能を有する機器が存在していたとしても、ユーザが特殊再生を望むたびに当該特殊再生用のメタデータを生成するのでは、処理の繰り返し、無駄が生じる場合があり、効率的ではない。
【０００６】
以上のような事情に鑑み、本発明の目的は、ネットワーク上のコンテンツに関するメタデータを自身で生成できない場合に、当該ネットワーク上の他の機器に当該メタデータを生成させることが可能な電子機器、当該電子機器におけるメタデータ生成方法及びプログラムを提供することにある。
【課題を解決するための手段】
【０００７】
上記目的を達成するため、本発明の一形態に係る電子機器は、通信部及び制御部を有する。上記通信部は、当該電子機器をネットワークに接続させる。上記制御部は、上記ネットワーク上の第１の機器に記憶されたコンテンツについて、当該コンテンツから抽出された所定の特徴を示すメタデータが生成されているか否かを判断する。また制御部は、当該メタデータが生成されていないと判断された場合に、上記通信部を用いて、上記ネットワーク上から当該メタデータを生成可能な第２の機器を検索し当該検索された第２の機器へ上記メタデータの生成を指示するコマンドを送信する。
【０００８】
この構成により、電子機器は、当該電子機器自身が上記メタデータを生成できない場合であっても、それが可能なネットワーク上の第２の機器を検索してメタデータを生成させることができ、当該メタデータを種々の処理に活用することができる。
【０００９】
ここでメタデータとは、例えばコンテンツのダイジェスト生成等の編集処理やダイジェスト再生（スキップ再生）等の特殊再生処理に用いられる盛り上がりシーン区間（キーフレーム）の情報や、チャプター付与等の編集処理に用いられるシーンチェンジの情報等である。上記所定の特徴とは、例えば顔特徴、音声特徴、パン、チルト、ズームといったカメラ特徴等である。上記ネットワークは例えばＬＡＮ（Local Area Network）、ＷＡＮ（Wide Area Network）、インターネット等である。上記第１の機器は複数存在し、それぞれが上記コンテンツを記憶していてもよい。また上記コンテンツは、第１の機器のディスクドライブに挿入された光ディスク（BD, DVD）等の可般性の記録媒体に記録されたものであってもよい。
【００１０】
上記制御部は、上記通信部を用いて、上記第１の機器に、上記メタデータの生成の可否を問い合わせる問合せデータを上記第２の機器へ送信するよう要求し、当該問合せデータに応答して上記他の機器から上記第１の機器に返送され当該第１の機器から転送された返答データを基に、当該他の機器による上記メタデータの生成の可否を判断してもよい。この場合上記第１の機器は、上記第２の機器へ上記問合せデータが送信されてから当該第２の機器から上記返答データが受信されるまでの遅延時間または当該返答データのエラーレートに関する評価データを当該電子機器へ送信してもよい。この場合上記制御部は、上記返答データを基に、上記メタデータを生成可能な第２の機器が複数存在すると判断した場合に、上記評価データを基に、上記遅延時間または上記エラーレートが最小となる１つの第２の機器を選択してもよい。
【００１１】
これにより電子機器は、メタデータを生成可能な第２の機器が複数見つかった場合に、メタデータを最も高効率かつ高精度に生成可能な１つの第２の機器にメタデータを生成させることができる。
【００１２】
上記コンテンツは当該コンテンツのジャンルを示すジャンル情報を有してもよい。この場合上記返答データは、上記コンテンツにおける複数種類の特徴を示す複数種類のメタデータの生成の可否をそれぞれ示すものであってもよい。この場合上記制御部は、上記通信部を用いて上記第１の機器から上記コンテンツを受信し、上記ジャンル情報を基に当該受信されたコンテンツのジャンルを判断してもよい。そして制御部は、上記第２の機器が複数存在すると判断した場合に、上記返答データを基に、上記判断されたジャンルに応じた特定の種類のメタデータを生成可能な１つの第２の機器を選択してもよい。
【００１３】
これにより電子機器は、コンテンツのジャンルに応じて、異なるメタデータを生成するために最適な第２の機器をそれぞれ選択することができる。ここでジャンルとは、例えばニュース、スポーツ、音楽等の分類、もしくは、放送コンテンツかプライベートコンテンツコンテンツかといった分類である。また複数種類の特徴とは顔特徴、テロップ特徴、音声特徴、カメラ特徴等である。
【００１４】
また上記第１の機器が複数存在する場合、上記制御部は、上記通信部を用いて、上記第２の機器により生成された複数のコンテンツの各メタデータを受信し、当該各メタデータを基に、上記各第１の機器に記憶された各コンテンツを分類してもよい。
【００１５】
これにより電子機器は、自らメタデータを生成できない場合であっても、第２の機器に生成させたメタデータを用いて、複数の第１の機器に分散して記憶されたコンテンツを分類することができる。例えば上記メタデータがコンテンツ中の顔特徴を示すデータであれば、制御部は、各コンテンツを、人物が映っているコンテンツとそれ以外のコンテンツとに分類できる。また上記メタデータがカメラの手振れ特徴を示すデータであれば、制御部は、各コンテンツを、放送番組コンテンツとパーソナルコンテンツとに分類できる。さらに、上記メタデータが、特定のオブジェクト、特定の人物、テロップ、音声（音楽）等を示すものであれば、制御部は、各コンテンツをニュース、スポーツ、音楽等のジャンル毎に分類することも可能である。当該分類にあたって、制御部は、上記各メタデータを基に判別分析を行い、各コンテンツを分類しても構わない。
【００１６】
上記電子機器は、表示装置に接続された出力部をさらに具備してもよい。この場合上記制御部は、上記分類されたコンテンツの分類毎のリストを生成し、当該リストを上記出力部を介して上記表示装置に表示させてもよい。
【００１７】
これにより電子機器は、自らメタデータを生成できない場合であっても、第２の機器に生成させたメタデータを用いて、複数の第１の機器に分散して記憶された各コンテンツをまとめたリストをユーザに分類毎に視覚的に提供することができる。当該リストには、各コンテンツの代表画像のサムネイルが含まれていてもよい。
【００１８】
本発明の他の形態に係る電子機器は、通信部と、記憶部と、制御部とを有する。上記通信部は、当該電子機器をネットワークに接続させる。上記記憶部は、コンテンツを記憶する。上記制御部は、上記コンテンツについて、当該コンテンツから抽出された所定の特徴を示すメタデータが生成されているか否かを判断する。そして制御部は、当該メタデータが生成されていないと判断された場合に、上記通信部を用いて、上記ネットワーク上から当該メタデータを生成可能な他の機器を検索し当該検索された他の機器へ上記メタデータの生成を指示するコマンドを送信する。
【００１９】
この構成により、電子機器は、当該電子機器が記憶しているコンテンツについてメタデータを生成できない場合であっても、それが可能なネットワーク上の他の機器を検索してメタデータを生成させることができ、当該メタデータを種々の処理に活用することができる。
【００２０】
本発明のまた別の形態に係るメタデータ生成方法は、ネットワーク上の第１の機器に記憶されたコンテンツについて、当該コンテンツから抽出された所定の特徴を示すメタデータが生成されているか否かを判断するステップを含む。当該ステップにより上記メタデータが生成されていないと判断された場合、上記ネットワーク上から当該メタデータを生成可能な第２の機器が検索される。当該検索された第２の機器には、上記メタデータの生成を指示するコマンドが送信される。
【００２１】
本発明のさらに別の形態に係るプログラムは、電子機器に、判断ステップと検索ステップと送信ステップとを実行させる。上記判断ステップでは、ネットワーク上の第１の機器に記憶されたコンテンツについて、当該コンテンツから抽出された所定の特徴を示すメタデータが生成されているか否かが判断される。上記検索ステップでは、上記メタデータが生成されていないと判断された場合に、上記ネットワーク上から当該メタデータを生成可能な第２の機器が検索される。上記送信ステップでは、上記検索された第２の機器へ上記メタデータの生成を指示するコマンドが送信される。
【発明の効果】
【００２２】
以上のように、本発明によれば、ネットワーク上のコンテンツに関するメタデータを自身で生成できない場合に、当該ネットワーク上の他の機器に当該メタデータを生成させることができる。
【図面の簡単な説明】
【００２３】
【図１】本発明の一実施形態において想定されるＡＶ（Audio/Visual）ネットワークシステムの一例を概略的に示す図である。
【図２】本発明の一実施形態においてコンテンツのメタデータ生成機能を有するＰＶＲのハードウェア構成を示す図である。
【図３】本発明の一実施形態においてコンテンツのメタデータ生成機能を有しないＰＶＲのハードウェア構成を示す図である。
【図４】本発明の一実施形態におけるＰＶＲによるデフォルトでのメタデータ生成処理の流れを示したフローチャートである。
【図５】本発明の一実施形態において、ＰＶＲが、メタデータを生成可能な他の機器を探索する処理の詳細な流れを示したフローチャートである。
【図６】上記コンテンツ記憶機器から返信されるテストデータのデータ構造の例を示した図である。
【図７】図６に示したテストデータに含まれる動作モード用データの詳細を示した図である。
【図８】図６に示したテストデータに含まれる処理用データの詳細を示した図である。
【図９】本発明の一実施形態において、コンテンツジャンルが、放送コンテンツであって、ニュース番組の場合に各動作モードの実行に必要とされる処理を示した図である。
【図１０】本発明の一実施形態において、コンテンツジャンルが、放送コンテンツであって、スポーツ番組の場合に各動作モードの実行に必要とされる処理を示した図である。
【図１１】本発明の一実施形態において、コンテンツジャンルが、放送コンテンツであって、音楽番組の場合に各動作モードの実行に必要とされる処理を示した図である。
【図１２】本発明の一実施形態において、コンテンツジャンルがプライベートコンテンツの場合に各動作モードの実行に必要とされる処理を示した図である。
【図１３】本発明の一実施形態における手振れ特徴抽出処理を概念的に示す図である。
【図１４】本発明の一実施形態におけるキーフレーム検出処理を概念的に示す図である。
【図１５】本発明の一実施形態におけるデフォルトによるメタデータ生成処理を概念的に示す図である。
【図１６】本発明の一実施形態におけるＰＶＲによるマニュアルでのメタデータ生成処理の流れを示したフローチャートである。
【図１７】本発明の一実施形態におけるマニュアルでのメタデータ生成処理を概念的に示す図である。
【図１８】本発明の一実施形態におけるコンテンツ分類処理の流れを示したフローチャートである。
【図１９】本発明の一実施形態において生成されるコンテンツリストの表示例を示した図である。
【図２０】本発明の一実施形態における、トラフィック状況等に応じたコンテンツリストの表示制御処理の流れを示したフローチャートである。
【図２１】本発明の一実施形態において、コンテンツリストの表示制御処理によりサムネイルの状態が変化する様子を示した図である。
【図２２】本発明の一実施形態における、顔識別メタデータに基づくアクセス制御処理の流れを示したフローチャートである。
【図２３】本発明の一実施形態における、動作モードに応じたアクセス制御処理の概要を示した表である。
【発明を実施するための形態】
【００２４】
以下、図面を参照しながら、本発明の実施形態を説明する。
【００２５】
［ＡＶネットワークシステムの概要］
図１は、本発明の一実施形態において想定されるＡＶネットワークシステムの一例を概略的に示す図である。
【００２６】
同図に示すように、当該ＡＶネットワークシステムでは、例えば異なる家（Ａさん宅及びＢさん宅）に設置された機器が例えばインターネット等のネットワーク５０を介して接続されている。例えばＡさん宅には、２台のＰＶＲ（Personal Video Recorder）１００及び２００と、当該ＰＶＲ１００及び２００にそれぞれ接続されたＴＶ６０が異なる部屋に設置されている。また例えばＢさん宅には、１台のＰＶＲ３００が１つの部屋に設置され、当該ＰＶＲに接続された２台のＴＶ６０が、ＰＶＲ３００が設置された部屋及びそれとは別の部屋にそれぞれ設置されている。
【００２７】
同図においては、Ａさん宅内の４つの機器とＢさん宅内の３つの機器とがネットワーク５０を介して接続されている例が示されているが、もちろん、各家に設置される機器の数や種類はこれに限られず、またその他の家の機器もネットワーク５０に接続可能である。以下でも、同図に示した機器以外の機器がネットワーク５０に接続されていることを前提に説明がなされる場合がある。
【００２８】
このような構成において、Ａさん宅の機器とＢさん宅の機器とは、所定の認証が行えた場合には、ネットワーク５０を介して相互にアクセスすることが可能となっている。したがって例えばＢさんは、Ｂさん宅に存在するＰＶＲ３００から、ネットワーク５０を介してＡさん宅のＰＶＲ１００及び２００へアクセスし、当該ＰＶＲ１００及び２００に記憶されたコンテンツを視聴することができる。
【００２９】
ここで、上記ＰＶＲ１００、２００及び３００のうち、ＰＶＲ１００は、コンテンツの編集やダイジェスト再生等の特殊再生やコンテンツの分類等を行うためのメタデータを生成する機能を有しており、ＰＶＲ２００及び３００はそのような機能を有していない。したがって、例えばＢさんがＢさん宅からＰＶＲ２００に記憶されたコンテンツの特殊再生や分類を行いたい場合でも、当該ＰＶＲ３００によっては当該特殊再生や分類を行うことができない。
【００３０】
そこで本実施形態では、上記ＰＶＲ３００のようにコンテンツのメタデータ生成機能を有しない機器が、上記ＰＶＲ１００のように当該メタデータ生成機能を有するネットワーク５０上の他の機器に当該メタデータを生成させることを可能としている。
【００３１】
［ＰＶＲのハードウェア構成］
図２は、メタデータ生成機能を有する上記ＰＶＲ１００のハードウェア構成を示す図である。同図に示すように、このＰＶＲ１００は、デジタルチューナ１、復調部２、デマルチプレクサ３、デコーダ４、記録再生部５、ＨＤＤ（Hard Disk Drive）８、光ディスクドライブ９、通信部１１を有する。またＰＶＲ１００は、ＣＰＵ（Central Processing Unit）１２、フラッシュメモリ１３、ＲＡＭ（Random Access Memory）１４を有する。さらにＰＶＲ１００は、操作入力部１５、グラフィック制御部１６、映像Ｄ／Ａ（Digital/Analog）コンバータ１７、音声Ｄ／Ａ（Digital/Analog）コンバータ１８、外部インタフェース１９及び特徴抽出回路２０を有する。
【００３２】
デジタルチューナ１は、ＣＰＵ１２の制御に従って、アンテナ２２を介してデジタル放送の特定のチャンネルを選局して、番組のデータを含む放送信号を受信する。この放送信号は、例えばＭＰＥＧ−２ＴＳフォーマットで符号化されたＭＰＥＧストリーム（ＴＳ：トランスポートストリーム）であるが、このフォーマットに限られるものではない。復調部２は、変調された当該放送信号を復調する。
【００３３】
デマルチプレクサ３は、多重化された上記放送信号を、映像信号、音声信号、字幕信号、ＳＩ（Service Information）信号等の各信号に分離し、デコーダ４へ供給する。またデマルチプレクサ３は、分離したデコード前の各信号を、特徴抽出回路２０へも供給可能である。上記ＳＩ信号は、ＥＰＧ（Electronic Program Guide）を表示するためのデータ等を伝送するための信号である。当該ＥＰＧ情報は、後述するようにコンテンツのジャンル判定に用いられる。
【００３４】
デコーダ４は、デマルチプレクサ３で分離された映像信号、音声信号、字幕信号、ＳＩ信号をそれぞれデコードする。デコードされた各信号は記録再生部５へ供給される。
【００３５】
記録再生部５は、記録部６及び再生部７を有する。記録部６は、デコーダ４によりデコードされ入力された映像信号及び音声信号を一時的に蓄積して、タイミングやデータ量を制御しながらＨＤＤ８や光ディスクドライブ９に出力して記録させる。また記録部６は、ＨＤＤ８に記録されたコンテンツを読み出して光ディスクドライブ９に出力し、光ディスク１０に記録させることも可能である。再生部７は、ＨＤＤ８や光ディスク１０に記録された映像コンテンツの映像信号及び音声信号を読み出し、タイミングやデータ量を制御しながらデコーダ４へ出力して再生させる。
【００３６】
ＨＤＤ８は、デジタルチューナ１を介して受信した番組や、通信部１１によりネットワーク５０を介して受信される種々のコンテンツを内蔵のハードディスクに記憶する。これらの記憶されたコンテンツが再生される際には、ＨＤＤ８は、これらのデータを上記ハードディスクから読み出し、記録再生部５へ出力する。
【００３７】
またＨＤＤ８は、各種プログラムやその他のデータ等を記憶する場合もある。これらのプログラムやデータは、それらの実行時及び参照時に、ＣＰＵ１２の指令によりＨＤＤ８から読み出され、ＲＡＭ１４へ展開される。
【００３８】
光ディスクドライブ９は、上記ＨＤＤ８と同様に、当該装着された光ディスク１０に上記番組コンテンツ等の各種データを記録し、また記録されたデータを読み出すことが可能である。また上記各種プログラムは、これら光ディスク１０等の可般性の記録媒体に記録され、光ディスクドライブ９によりＰＶＲ１００にインストールされてもよい。
【００３９】
通信部１１は、上記ネットワーク５０に接続してＴＣＰ／ＩＰ（Transmission Control Protocol / Internet Protocol）等のプロトコルによりネットワーク５０上の他の装置とデータのやり取りを行うためのネットワークインタフェースである。通信部１１により受信されたデータが多重化されている場合、デマルチプレクサ３に供給される。また受信されたデータのうち少なくとも一部は、必要に応じて特徴抽出回路２０にも供給される。上記ＥＰＧ情報は、デジタルチューナ１が受信した放送信号からではなく、ネットワーク５０上から通信部１１により取得されてもよい。
【００４０】
外部インタフェース１９は、例えばＵＳＢインタフェースやメモリカードインタフェース等からなり、例えばデジタルビデオカメラ、デジタルスチルカメラ等の外部機器やメモリカード等と接続し、それらからコンテンツ等のデータを読み出す。
【００４１】
ＣＰＵ１２は、必要に応じてＲＡＭ１４等にアクセスし、映像データの受信処理、コンテンツの記録再生処理、特徴抽出（メタデータ生成）処理等、ＰＶＲ１００の各ブロックの処理を統括的に制御する。
【００４２】
フラッシュメモリ１３は、例えばＮＡＮＤ型のものであり、ＣＰＵ１２に実行させるＯＳ、プログラムや各種パラメータなどのファームウェアが固定的に記憶されている不揮発性のメモリである。またフラッシュメモリ１３は、メタデータ生成処理において特徴抽出回路２０とともに動作するプログラムやその他の各種プログラム、上記ＥＰＧ情報等の各種データを記憶する。
【００４３】
ＲＡＭ１４は、ＣＰＵ１２の作業用領域等として用いられ、上記コンテンツの記録再生処理やメタデータ生成処理の最中に、ＯＳやプログラム、処理データ等を一時的に保持するメモリである。
【００４４】
操作入力部１５は、例えば複数のキーを有するリモートコントローラ２１（以下、リモコン２１と称する）から、ユーザの操作による各種設定値や指令を入力してＣＰＵ１２へ出力する。もちろん、操作入力部１５は、リモコン２１によらずに、ＰＶＲ１００に接続されたキーボードやマウス、ＰＶＲ１００に実装されたスイッチ等で構成されていても構わない。
【００４５】
グラフィック制御部１６は、デコーダ４から出力された映像信号やＣＰＵ１２から出力されるその他の映像データにＯＳＤ（On Screen Display）処理等のグラフィック処理を施し、例えばＴＶ６０等の表示装置に表示させるための映像信号を生成する。
【００４６】
映像Ｄ／Ａコンバータ１７は、上記グラフィック制御部１６から入力されたデジタル映像信号をアナログ映像信号に変換して、映像出力端子等を介して表示装置へ出力する。
【００４７】
音声Ｄ／Ａコンバータ１８は、上記デコーダ４から入力されたデジタル音声信号をアナログ音声信号に変換して、音声出力端子等を介してＴＶ等へ出力する。
【００４８】
特徴抽出回路２０は、ＨＤＤ８に記憶されたコンテンツやネットワーク５０上の他の機器に記憶されたコンテンツから、所定の映像特徴及び音声特徴を抽出し、当該各特徴を基に、各コンテンツの特殊再生処理や分類処理等に用いられる各種メタデータを生成する。具体的には、特徴抽出回路２０は、コンテンツの映像信号及び音声信号を所定の時間毎（フレーム間隔毎）のデータに分割し（データセグメンテーション処理）、それをＲＡＭ１４に一時的に保存する。そして特徴抽出回路２０は、当該保存された各データのうち映像データについては例えば動きベクトルを検出することで映像特徴を抽出し、音声データについては例えばパワーレベルを解析することで音声特徴を抽出する。
【００４９】
上記所定の映像特徴とは、例えばパン、チルト、ズーム等のカメラ特徴や、人物（顔）、動物、建物等のオブジェクトを示す画像特徴等である。所定の音声特徴とは、例えば人の声を示す特徴、より具体的には音声パワーの継続時間を示す特徴等である。またメタデータとは、上記カメラ特徴や音声特徴を基に生成されるコンテンツ内の盛り上がりシーン（キーフレーム）に関するメタデータ（シーン特徴メタデータ）、コンテンツ内の被写体（人かそれ以外か）等に応じてコンテンツを分類するためのメタデータ（分類用メタデータ）、コンテンツ内の人の顔を識別してコンテンツへのアクセスを制御するために用いられるメタデータ（顔識別メタデータ）等である。これらの各種メタデータの詳細については後述する。またメタデータは、上記特徴抽出処理により抽出された特徴データそのものであってもよい。
【００５０】
図３は、メタデータ生成機能を有しない上記ＰＶＲ３００のハードウェア構成を示す図である。同図に示すように、ＰＶＲ３００の構成は、上記図２に示したＰＶＲ１００と比較して、ＰＶＲ１００の特徴抽出回路２０を有していないこと以外は共通している。したがってここではＰＶＲ３００の各ブロックについての説明は省略する。上記ＰＶＲ２００の構成も当該ＰＶＲ３００の構成と同様である。
【００５１】
［ＡＶネットワークシステム内の各機器の動作］
次に、以上のように構成されたＡＶネットワークシステムにおける各機器の動作について説明する。以下では、特にＰＶＲ３００の動作を中心に説明する。以下では、ＰＶＲ３００のＣＰＵ４２を主な動作主体としてＰＶＲ３００の動作が説明されるが、この動作は、その他のハードウェア及びＣＰＵ４２の制御下において実行されるプログラムとも協働して行われる。
【００５２】
（メタデータの生成処理）
まず、本システムにおけるメタデータの生成処理について説明する。本実施形態では、ネットワーク５０上の全ての機器に記憶された全てのコンテンツについてデフォルトで自動的にメタデータが生成される場合と、特定のコンテンツについてメタデータが生成される場合とがある。
【００５３】
まず、ネットワーク５０上の各機器に記憶された各コンテンツのメタデータがデフォルトで生成される場合について説明する。図４は、ＰＶＲ３００によるデフォルトでのメタデータ生成処理の流れを示したフローチャートである。
【００５４】
同図に示すように、ＰＶＲ３００のＣＰＵ４２は、ネットワーク５０上の各機器にアクセスを試み、各機器からアクセス認証を受ける（ステップ４１）。当該認証に通った場合（ステップ４２のＹｅｓ）、ＣＰＵ４２は、当該アクセスした機器に記憶されたコンテンツを検出する（ステップ４３）。認証に通らなかった場合（Ｎｏ）、すなわちアクセス可能な他の機器がネットワーク５０上に存在しない場合、ＣＰＵ４２は、ユーザから、例えばコンテンツの通常再生等、メタデータの生成動作以外の動作モードへ移行する指示があったか否かを判断し（ステップ４４）、当該指示があった場合（Ｙｅｓ）は他の動作モードへ移行する。
【００５５】
上記ステップ４２においてアクセス可能な他の機器が存在した場合（Ｙｅｓ）、ＣＰＵ４２は、当該他の機器に記憶されたコンテンツを検出する（ステップ４３）。そしてＣＰＵ４２は、当該検出された各コンテンツについて、メタデータが生成されているか否かを判断する（ステップ４５）。
【００５６】
上記ステップ４５においてメタデータが生成されていると判断された場合（Ｙｅｓ）、ＣＰＵ４２は、ネットワーク５０上の全ての機器に記憶された全てのコンテンツについてメタデータが生成されているか否か、すなわちその他にメタデータを生成すべきコンテンツがないかを判断する（ステップ５１）。メタデータを生成すべきコンテンツが存在しないと判断された場合（Ｙｅｓ）、処理は終了し、存在する場合（Ｎｏ）には上記ステップ４１へ戻り処理を繰り返す。
【００５７】
上記ステップ４５においてメタデータが生成されていないと判断された場合（Ｎｏ）、ＣＰＵ４２は、メタデータを生成可能な他の機器をネットワーク５０上から探索する（ステップ４６）。この探索処理の詳細は後述する。
【００５８】
上記探索処理の結果、メタデータの生成に対応した他の機器が見つかった場合（ステップ４７のＹｅｓ）、ＣＰＵ４２は、当該他の機器へメタデータを生成させるためのコマンドを送信する（ステップ４８）。そしてＣＰＵ４２は、当該コマンドに応じて他の機器で生成されたメタデータを受信する（ステップ５０）。ＣＰＵ４２は、以上の処理を、ネットワーク５０上の全ての機器の全てのコンテンツについて繰り返す（ステップ５１）。
【００５９】
上記探索処理の結果、メタデータの生成に対応した他の機器が見つからなかった場合（ステップ４７のＹｅｓ）、ＣＰＵ４２は、例えば当該ＰＶＲ３００に接続されたＴＶ６０を介して、メタデータを生成できない旨の警告表示を行う（ステップ４９）。
【００６０】
図５は、上記メタデータを生成可能な他の機器の探索処理の詳細な流れを示したフローチャートである。
同図に示すように、ＣＰＵ４２は、まず、コンテンツを記憶するネットワーク５０上の他の機器（以下、コンテンツ記憶機器と称する）に対して、当該他の機器以外の各機器へテストデータを送信するよう指示するコマンドを送信する（ステップ６１）。ここでテストデータは、メタデータを生成可能か否かを問い合わせるデータであり、かつ、そのメタデータ生成処理を最も確実に効率よく行える機器を探索するために送信されるデータである。
【００６１】
続いてＣＰＵ４２は、上記コンテンツ記憶機器が他の機器から受信した上記テストデータの返信結果の転送を受ける（ステップ６２）。ここで、当該テストデータの詳細について説明する。
【００６２】
図６は、上記他の機器からコンテンツ記憶機器へ返信されるテストデータのデータ構造の例を示した図である。同図に示すように、当該テストデータは、同期データ７１、システム用データ７２、動作モード用データ７３、処理用データ７４及びエラー処理用データ７５からなる。
【００６３】
同期データ７１は、コンテンツ記憶機器が送信したテストデータと他の機器から返信されたテストデータとの同期をとるためのデータである。システム用データ７２は、当該返信元の他の機器のＩＰアドレス等のデータである。
【００６４】
図７は、上記動作モード用データ７３の詳細を示した図である。同図に示すように、動作モード用データ７３は例えば16ビット（m1〜m16）からなり、複数の動作モードについて、それが当該他の機器において処理が可能か否かを０か１のビットで示したものである。同図において動作モードが定義されていない箇所（−）には、適宜動作モードを追加可能である。動作モードとしては、映像音声表示出力モード、コンテンツの通常再生モード、コンテンツのダイジェスト再生モード、コンテンツの自動編集モード、コンテンツ蓄積（記録）モード、コンテンツ撮影（カメラ機能）モード等がある。同図に示した例では、テストデータの返信元の他の機器がこれらの各モード全てに対応していることが示されている。
【００６５】
図４及び図５のフローチャートでは、他の機器に生成させるメタデータは、予め決まっており、当該特定のメタデータが生成可能な否かが上記動作モード用データから判断されることとなる。例えば、ダイジェスト再生用のメタデータの生成が意図されている場合、上記動作モード用データから、他の機器がダイジェスト再生に対応しているか否かが判断されることとなる。
【００６６】
図８は、上記処理用データ７４の詳細を示した図である。同図に示すように、処理用データ７４は、例えば12ビット（g1〜g4, c1〜c4, a1〜a4）からなり、上記ダイジェスト再生モードや自動編集モード等において必要となる各種映像音声特徴抽出処理の可否を０か１のビットで示したものである。同図において処理機能が定義されていない箇所（−）には、適宜処理機能を追加可能である。処理用データは、画像特徴、カメラ特徴及び音声特徴からなる。画像特徴の処理機能としては、顔検出機能やテロップ検出機能がある。カメラ特徴としては、ズーム、パン、チルト、手振れの各検出機能がある。音声特徴としては、音声の盛り上がり（レベル大）検出機能、音楽検出機能、人の声検出機能がある。同図に示した例では、テストデータの返信元の他の機器がこれらの各処理機能全てに対応していることが示されている。
【００６７】
エラー処理用データ７５は、例えば16ビットからなり、当該テストデータがコンテンツ記憶機器から送信されて返信されるまでの間に発生したエラーのエラーレートを計測するためのデータである。具体的には、例えばＣＲＣコードやリードソロモン符号等のエラー検出コードが用いられる。
【００６８】
図５のフローチャートに戻り、ＣＰＵ４２は、上記テストデータの返信結果データを受信すると、当該データから、特定のメタデータの生成に対応した他の機器（以下、単に対応機器ともいう。）が存在するか否かを判断する（ステップ６３）。対応機器が存在しないと判断された場合（Ｎｏ）、ＣＰＵ４２は、図４のステップ４９で示した警告表示を行う。
【００６９】
対応機器が存在すると判断された場合（Ｙｅｓ）、ＣＰＵ４２は、当該対応機器が複数存在するか否かを判断する（ステップ６４）。対応機器が複数存在すると判断された場合（Ｙｅｓ）、ＣＰＵ４２は、上記テストデータの返信結果データを基に、上記エラーレート及び遅延時間を検出する（ステップ６５）。エラーレートは、上記返信されたテストデータ中のエラー処理用データから算出される。遅延時間は、コンテンツ記憶装置がテストデータを送信した時刻と他の装置からそれを返信した時刻とから算出される。ＣＰＵ４２は、当該エラーレート及び遅延時間を、各対応機器について算出する。
【００７０】
そしてＣＰＵ４２は、上記複数の対応機器のうち、当該エラーレート及び遅延時間が最小となる対応機器を選択する（ステップ６６）。すなわち、ＣＰＵ４２は、メタデータ生成を行った場合にそれを最も効率的かつ高精度に行える他の機器を選択する。またＣＰＵ４２は、上記エラーレート及び遅延時間を乗じた値を基に上記選択を行ってもよい。
【００７１】
続いてＣＰＵ４２は、コンテンツ記憶装置に記憶された各コンテンツについて、ジャンルを判定する（ステップ６７）。ここでコンテンツのジャンルが判定されるのは、当該ジャンルに応じて、上記自動編集モードやダイジェスト再生モードに必要な特徴データが異なるからである。すなわち、コンテンツのジャンルが異なると、他の機器に生成を要求するメタデータ及びそのために対応すべき動作モードも異なってくるため、ＰＶＲ３００は、当該ジャンル及び動作モードに応じて対応機器を適切に選択することとしている。
【００７２】
ここで、コンテンツのジャンルと、当該コンテンツのメタデータを生成するために必要となる動作モードとの関係について説明する。
図９〜図１２は、コンテンツジャンルが、放送コンテンツ（テレビコンテンツ）であって、ニュース番組の場合（図９）、スポーツ番組の場合（図１０）、音楽番組の場合（図１１）及びコンテンツジャンルが一般ユーザにより撮影されたプライベートコンテンツ（図１２）である場合のそれぞれについて、各動作モードの実行に必要とされる処理を示した図である。
【００７３】
図９に示すように、コンテンツが放送コンテンツであってニュース番組の場合、ダイジェスト再生及び自動編集の各モードを実行するには、画像特徴抽出処理のうち顔検出及びテロップ検出の各処理が必須となり、音声特徴抽出処理のうち人の声の検出処理が必須となる。これは、ニュース番組には、ニュースキャスターの画像、当該ニュースキャスターの下部に通常表示されるテロップ等、ニュース番組特有の特徴が存在するからである。またこの場合、カメラ特徴のうちズーム、パン、チルトの各カメラ特徴の検出処理は、必須ではないが精度を良くするにはあった方がよい。これは、実際のニュース現場の映像から特徴的なシーンを抽出するためである。
【００７４】
図１０に示すように、コンテンツが放送コンテンツであってスポーツ番組の場合、ダイジェスト再生及び自動編集の各モードを実行するには、画像特徴抽出処理のうち顔検出処理が必須となり、カメラ特徴抽出処理のうちズーム、パン、チルトの各カメラ特徴の検出処理が必須となり、音声特徴抽出処理のうち音声盛り上がり検出処理が必須となる。これは、スポーツ番組では、例えばサッカーのゴールシーン等では選手の動き及びカメラの動きが活発となり、また歓声も大きくなるという特徴があるからである。またこの場合、画像特徴のうちテロップ検出処理は、必須ではないがあった方がよい。これは選手情報や試合経過等の情報がテロップとして表示される場合があるからである。
【００７５】
図１１に示すように、コンテンツが放送コンテンツであって音楽番組の場合、ダイジェスト再生及び自動編集の各モードを実行するには、画像特徴抽出処理のうち顔検出処理が必須となり、音声特徴抽出処理のうち音楽検出処理及び人の声検出処理が必須となる。これは、音楽番組では、出演している歌手及びその歌手が歌う音楽を識別する必要があるからである。またこの場合、カメラ特徴抽出処理のうちズーム、パン、チルトの各カメラ特徴の検出処理は、必須ではないがあった方がよい。これは、歌手が実際に歌を歌っているシーン等を抽出するためである。
【００７６】
図１２に示すように、コンテンツがプライベートコンテンツの場合、画像特徴抽出処理のうち顔検出処理が必須となり、ズーム、パン、チルト及び手振れの各カメラ特徴の検出処理が必須となり、音声特徴抽出処理のうち音声盛り上がり検出処理及び人の声検出処理が必須となる。これは、当該プライベートコンテンツに映っている人及びその人の言動を検出するためである。また、手振れ特徴検出処理は、当該プライベートコンテンツからキーフレームを検出する際に、見るに耐えない手振れ映像を除外するためである。
【００７７】
ここで、上記コンテンツが放送コンテンツである場合には、各ジャンルは、各コンテンツ記憶装置においてコンテンツが記録される際に、例えば上記ＲＰＧ情報を基に当該コンテンツ自体と共に記録されたジャンル情報を基に判別することができる。一方、コンテンツが放送コンテンツかプライベートコンテンツかは、上記手振れ特徴を検出することで判別することができる。すなわち、コンテンツの映像中に手振れ映像があれば当該コンテンツは、プロではなく一般ユーザが撮影したプライベートコンテンツであると判断され得るからである。ただし、本実施形態においては、当該ＰＶＲ３００は、そもそもメタデータ生成機能を有していないため、上記カメラ特徴抽出処理に対応していない。したがってＰＶＲ３００は、上記返信されたテストデータを基に、手振れ特徴抽出処理に対応した機器（例えば上記ＰＶＲ１００等）に、当該放送コンテンツかプライベートコンテンツかの判別処理を依頼する。後述するが、この手振れ特徴に基づく判別データを含めたコンテンツのジャンルに関するデータは、上記分類用メタデータとしても用いられる。
【００７８】
また、放送コンテンツ当該放送コンテンツかプライベートコンテンツかの判別データは、例えば放送コンテンツ及びプライベートコンテンツがコンテンツ記憶装置に記録される際に、上記ＥＰＧ情報に基づくジャンル情報と共に、自動的にジャンルＩＤとして記憶されてもよい。これは例えばプライベートコンテンツの入力元となる機器（カムコーダ等）を識別することで達成し得る。
【００７９】
当該判別処理の依頼を受けた他の機器は、コンテンツ記憶装置から対象コンテンツを取得し、自身が有する手振れ特徴抽出機能を用いて、当該コンテンツから手振れ特徴を抽出する。ここで、当該手振れ特徴抽出処理の詳細について説明する。
【００８０】
図１３は、当該手振れ特徴抽出処理を概念的に示す図である。ＰＶＲ３００から依頼を受けた他の機器は、特徴抽出回路を用いて、コンテンツ中の基準フレームと探索フレームとの間でブロックマッチング処理により動きベクトルを検出し、当該動きベクトルを基に、重回帰分析によりアフィン係数を算出する。そして他の機器は、同図に示すように、映像コンテンツ中の所定区間（ｔ０〜ｔ１、ｔ１〜ｔ２、ｔ２〜ｔ３、ｔ３〜ｔ４）毎のアフィン係数から算出した、パン係数Ｐｘ、チルト係数Ｐｙの分散と、所定区間の平均値レベルとの交差回数とで手振れを判定することができる。所定区間としては、例えば０．５秒〜５秒程度の時間長が設定される。
【００８１】
例えば、同図のｔ０〜ｔ１の区間においては、ＰｘまたはＰｙは、平均レベルの値と１２回交差している。他の機器の特徴抽出回路は、この交差回数の閾値をＴｈｃｒとし、交差回数がＴｈｃｒより大きく、かつ、ＰｘまたはＰｙの上記各所定区間での分散値が所定の閾値Ｔｈｖより大きい場合には、当該所定区間の映像は手振れ映像であると判定し、そうでない場合には手振れ映像ではないと判定する。当該判定結果は、上記放送コンテンツかパーソナルコンテンツかの判別のためにＰＶＲ３００へ送信される。
【００８２】
図５に戻り、ＣＰＵ４２は、上記図９〜図１２に示した基準を用いて、各コンテンツについて判定したジャンルに応じて、他の機器に生成させるべきメタデータに必要な動作モードを検出する（ステップ６８）。そしてＣＰＵ４２は、当該動作モードの実行に必須となる、動作用特徴量ＩＤ（上記g1〜g4, c1〜c4, a1〜a4）を検出する（ステップ６９）。
【００８３】
続いてＣＰＵ４２は、図４のステップ４７において、当該動作用特徴量ＩＤで示される処理に対応した他の機器が存在するか否かを判断し、当該対応機器を選択する。そしてＣＰＵ４２は、上述したように、当該選択した機器へ、メタデータの生成を指示するコマンドを送信する（ステップ４８）。
【００８４】
上記メタデータ生成を指示された他の機器は、当該指示対象のコンテンツを、コンテンツ記憶機器から受信し、当該他の機器が有する特徴抽出回路を用いて、特徴抽出処理及びそれに基づくメタデータ生成処理を実行する。
【００８５】
ここで、当該特徴抽出処理について説明する。図１４は、当該特徴抽出処理を概念的に示した図である。同図では、例えば上記シーン特徴メタデータの生成のために、特徴量として盛り上がりシーン（キーフレーム）が検出される例を示している。
【００８６】
同図に示すように、上記メタデータ生成を指示された他の機器の特徴抽出回路は、動画像コンテンツの映像シーンについて、上記カメラ特徴抽出処理、画像特徴抽出処理、音声特徴抽出処理を実行し、当該抽出結果を基に、所定の閾値以上の特徴が抽出された区間のフレームを、キーフレームとして抽出する。
【００８７】
ここで、カメラ特徴や画像特徴を基にキーフレームが抽出されるのは、カメラ特徴区間はユーザが意図してカメラを操作して撮影した区間であるため、ユーザにとって重要度が高いシーンであると考えられ、また人の顔はユーザの注目の的となりやすいためである。また、音声特徴を基にキーフレームが抽出されるのも、例えば音声レベルが大きい区間はユーザの注目度が高いと考えられるからである。
【００８８】
具体的には、上記特徴抽出回路は、映像コンテンツ中の基準フレームと探索フレームとの間でブロックマッチング処理により動きベクトルを検出する。そして特徴抽出回路は、当該動きベクトルを基に、重回帰分析によりアフィン係数を算出し、当該アフィン係数から、パン係数Ｐｘ、チルト係数Ｐｙ及びズーム係数Ｐｚを算出する。当該パン係数Ｐｘ、チルト係数Ｐｙ及びズーム係数Ｐｚがそれぞれ所定の閾値を超えた区間が、キーフレームとして検出される。また、特徴抽出回路は、動画像コンテンツの音声信号について、例えば所定の閾値以上のパワーを有する区間を音声盛り上がり区間として抽出する。そして特徴抽出回路は、例えば、上記映像シーンから抽出されたキーフレーム区間と、上記音声信号から抽出された音声盛り上がり区間とが重複する区間を、当該動画像コンテンツのキーフレームとして検出する。そして、このキーフレームの情報（タイムコード等）がシーン特徴メタデータとして生成される。
【００８９】
図１５は、以上説明したデフォルトによるメタデータ生成処理を概念的に示す図である。同図に示すように、例えば、ネットワーク５０上に、メタデータの生成に対応しているＰＶＲ１００及び５００と、メタデータの生成に対応していないＰＶＲ２００、３００及び４００が存在しているとする。また、ＰＶＲ２００及び４００は、それぞれコンテンツＡ、コンテンツＢを記憶する上記コンテンツ記憶機器である。
【００９０】
この例において、メタデータの生成に対応していないＰＶＲ３００が、ＰＶＲ２００に記憶されたコンテンツＡについてメタデータを生成させる場合、ＰＶＲ３００は、上記テストデータを基に、対応機器のうち、メタデータを生成させた場合にエラーレート及び遅延時間が最小となる他の機器として、ＰＶＲ１００を選択し、メタデータを生成させる。同図に示すように、対応機器であるＰＶＲ１００とＰＶＲ５００とでは、ＰＶＲ１００の方が、コンテンツ記憶機器であるＰＶＲ２００により近い距離に存在するためである。当該生成されたメタデータ（デフォルトメタデータＡ）は、ＰＶＲ２００の記録媒体に記憶され、例えば特殊再生等の必要に応じてＰＶＲ３００にダウンロードされる。
【００９１】
同様に、ＰＶＲ３００が、ＰＶＲ４００に記憶されたコンテンツＢについてメタデータを生成させる場合、ＰＶＲ３００は、上記テストデータを基に、対応機器のうち、エラーレート及び遅延時間が最小となる他の機器として、ＰＶＲ５００を選択し、メタデータを生成させる。当該生成されたメタデータ（デフォルトメタデータＢ）は、ＰＶＲ４００の記録媒体に記憶され、必要に応じてＰＶＲ３００にダウンロードされる。
【００９２】
次に、ネットワーク５０上の特定のコンテンツについてメタデータがマニュアルで生成される場合について説明する。図１６は、ＰＶＲ３００によるマニュアルでのメタデータ生成処理の流れを示したフローチャートである。当該処理は、通常、コンテンツの再生処理（特殊再生または通常再生）に際して実行される。
【００９３】
同図に示すように、ＰＶＲ３００のＣＰＵ４２は、上記図４のフローチャートにおけるステップ４１及び４２と同様に、ネットワーク５０上の特定の機器にアクセスを試み、当該機器からアクセス認証を受ける（ステップ１６１）。当該認証に通った場合（ステップ１６２のＹｅｓ）、ＣＰＵ４２は、当該アクセスした機器に記憶されたコンテンツから、特定のコンテンツを選択する（ステップ１６３）。認証に通らなかった場合（Ｎｏ）、ＣＰＵ４２は、ユーザから、コンテンツの再生動作以外の動作モードへ移行する指示があったか否かを判断し（ステップ１６４）、当該指示があった場合（Ｙｅｓ）は他の動作モードへ移行する。
【００９４】
ここで、上記コンテンツの選択は、ＰＶＲ３００に接続されたＴＶ６０等の表示装置に表示されるコンテンツリストに基づいて行われるが、当該コンテンツリストについては後述する。
【００９５】
続いてＣＰＵ４２は、上記選択したコンテンツについて特殊再生を行うか通常再生を行うかを、ユーザの操作に基づいて判断する（ステップ１６５）。通常再生を行うことが指示された場合（Ｎｏ）、ＣＰＵ４２は、当該コンテンツの通常再生モードへ移行し、通常再生させる（ステップ１６７）。
【００９６】
上記ステップ１６５において特殊再生が指示された場合（Ｙｅｓ）、ＣＰＵ４２は、上記選択したコンテンツについて、メタデータが存在するか否かを判断する（ステップ１６６）。メタデータが存在すると判断された場合（Ｙｅｓ）、ＣＰＵ４２は、当該メタデータを受信して当該メタデータを基に上記選択したコンテンツの特殊再生を実行する（ステップ１７９）。
【００９７】
上記ステップ１６６においてメタデータが存在しないと判断された場合（Ｎｏ）、ＣＰＵ４２は、メタデータ生成動作モードへ移行する（ステップ１６８）。そしてＣＰＵ４２は、上記選択されたコンテンツについて、上記図５の処理と同様に、メタデータ生成に対応する機器を探索する（ステップ１６９）。この場合、対応機器が複数存在する場合、上述と同様に、上記テストデータに基づいて、エラーレート及び遅延時間が最小となる機器が選択される。
【００９８】
メタデータ生成に対応する機器が存在する場合（ステップ１７０のＹｅｓ）、ＣＰＵ４２は、当該選択されたコンテンツがその時点でコンテンツ記憶機器に存在するか否かを確認し（ステップ１７２）、存在する場合には、上記選択した機器へメタデータ生成を指示する（ステップ１７８）。そしてＣＰＵ４２は、当該生成されたメタデータを受信し（ステップ１７８）、当該メタデータを用いてコンテンツの特殊再生を実行する（ステップ１７９）。
【００９９】
上記ステップ１７０において、対応機器が存在しないと判断された場合、ＣＰＵ４２は、上述と同様の警告表示を行い（ステップ１７３）、上記コンテンツについて通常再生を実行するか否かについてユーザに指示を促す（ステップ１７４）。当該通常再生が指示された場合（Ｙｅｓ）には、ＣＰＵ４２は、上記通常再生モードへ移行する（ステップ１６７）。通常再生が指示されなかった場合（Ｎｏ）、ＣＰＵ４２は、処理を終了する。
【０１００】
また上記ステップ１７５においてコンテンツが存在しないと判断された場合（Ｎｏ）、ＣＰＵ４２は、その旨の警告表示を行い（ステップ１７７）、処理を終了する。
【０１０１】
図１７は、以上説明したマニュアルでのメタデータ生成処理を概念的に示す図である。同図において、ネットワーク５０上の機器の構成は上記図１５と同様である。
【０１０２】
同図に示すように、上記図１５と比較して、ＰＶＲ２００に記憶されたコンテンツＡについての個別メタデータＡは、当該ＰＶＲ２００には記憶されず、メタデータ生成を指示したＰＶＲ３００により直接受信され、特殊再生処理等に用いられる。同様に、ＰＶＲ４００に記憶されたコンテンツＢについての個別メタデータＢは、当該ＰＶＲ４００には記憶されず、ＰＶＲ３００により直接受信され、特殊再生処理等に用いられる。
【０１０３】
（コンテンツの分類処理）
次に、上記ネットワーク５０上の各機器に存在するコンテンツの分類処理について説明する。当該コンテンツの分類処理の前提として、ネットワーク５０上の各機器には、コンテンツとともに、上述したメタデータ生成処理により、上記分類用メタデータが生成され記憶されているものとする。当該分類用メタデータは、上述したコンテンツのジャンルに関するデータである。この分類用メタデータは、上述した図５のステップ６７におけるコンテンツジャンル判定処理において既に生成されているものとする。
【０１０４】
図１８は、ＰＶＲ３００によるコンテンツ分類処理の流れを示したフローチャートである。同図に示すように、ＣＰＵ４２は、上述と同様に、ネットワーク５０上の各機器からアクセス認証を受ける（ステップ１８１）。当該認証に通った場合（ステップ１８２のＹｅｓ）、ＣＰＵ４２は、各機器に記憶されているコンテンツを検出する（ステップ１８３）。当該コンテンツの検出処理の対象には、自機（ＰＶＲ３００）も含まれる。
【０１０５】
上記認証に通らなかった場合（Ｎｏ）、ＣＰＵ４２は、他動作モードへの移行がユーザから指示されたか否かを判断し（ステップ１８６）、当該移行が指示された場合（Ｙｅｓ）には他動作モードへ移行し、指示されなかった場合（Ｎｏ）は上記ステップ１８１へ戻る。
【０１０６】
上記ステップ１８３においてコンテンツを検出すると、ＣＰＵ４２は、当該検出されたコンテンツが、まだ分類処理の対象になっていない新コンテンツであるか否かを判断する（ステップ１８４）。当該コンテンツが既に分類処理の対象になっているコンテンツであると判断された場合（Ｎｏ）、ＣＰＵ４２は、上記ステップ１８６以降の処理を実行する。
【０１０７】
上記コンテンツがまだ分類処理の対象となっていないコンテンツであると判断された場合（Ｙｅｓ）、ＣＰＵ４２は、上記分類用メタデータを基に、コンテンツのジャンルを検出する（ステップ１８５）。ここで、当該コンテンツについて分類用メタデータが生成されていない場合には、上述のメタデータ生成処理にしたがって、ネットワーク５０上の他の機器に分類用メタデータの生成を指示する。プライベートコンテンツについての分類用メタデータの生成にあたっては、上述したように、手振れ特徴抽出処理も実行される。
【０１０８】
続いて、ＣＰＵ４２は、検出したジャンルと同一のジャンルまたは類似のジャンルが他のコンテンツについて存在するか否かを判断する（ステップ１８７）。当該ジャンルの類似を判断するために、ＰＶＲ３００は、類似関係を記載したデータを予め記憶していてもよい。
【０１０９】
上記ステップ１８７において、同一または類似のジャンルがあると判断された場合（Ｙｅｓ）、ＣＰＵ４２は、当該コンテンツを既存のジャンルに追加し、分類ＩＤを付加する（ステップ１８８）。一方、同一または類似のジャンルがないと判断された場合（Ｎｏ）、ＣＰＵ４２は、当該コンテンツを新規のジャンルに追加し、新規の分類ＩＤを付加する（ステップ１８９）。当該分類ＩＤには、上記プライベートコンテンツか放送コンテンツかの判別データも含まれる。
【０１１０】
ＣＰＵ４２は、以上の分類処理により生成された上記分類ＩＤを用いて、当該ＰＶＲ３００に記憶されたものも含むネットワーク５０上のコンテンツについてのコンテンツリストを生成し、当該コンテンツリストをＴＶ６０等の表示装置に表示させることができる。
【０１１１】
図１９は、当該生成されたコンテンツリストの表示例を示した図である。同図に示すように、当該コンテンツリストでは、複数のコンテンツが、上記分類ＩＤプライベートコンテンツとテレビコンテンツとに分類され、当該分類毎に、コンテンツのサムネイル９１及びタイトル９２が表示される。ここで、プライベートコンテンツについて、その内容を示す情報（運動会、旅行等）が表示されてもよい。当該情報は、当該プライベートコンテンツの記録時または他の機器への転送時に例えばユーザの入力等により生成される。またテレビコンテンツについては、上記分類ＩＤに基づいて、そのジャンルまたはサブジャンル（野球、歌番組等）が表示される。
【０１１２】
当該コンテンツリスト上で、ユーザが、特定のコンテンツを再生のために選択する操作を行った場合、ＣＰＵ４２は、当該コンテンツを、当該コンテンツが記憶されたコンテンツ記憶機器から受信し、再生することができる。
【０１１３】
（トラフィック状況等に応じたコンテンツリストの表示制御処理）
ここで、本実施形態においては、ＰＶＲ３００は、上記表示されるコンテンツリスト上で、当該コンテンツリスト上の各コンテンツが円滑に再生可能か否かを示すことが可能となっている。すなわち、ＰＶＲ３００は、ネットワーク５０のトラフィック状況（アクセス状態）に応じて、その円滑な再生の可否を、上記各コンテンツに対応するサムネイルの状態を変化させることでユーザに把握させる。さらに、ＰＶＲ３００は、ネットワーク５０上に新たなコンテンツが追加された場合、またはネットワーク５０上にコンテンツが存在しなくなった場合に、それらの状況をコンテンツリスト上に反映してユーザに把握させることができる。以下、当該処理の詳細について説明する。
【０１１４】
図２０は、上記トラフィック状況等に応じたコンテンツリストの表示制御処理の流れを示したフローチャートである。
同図に示すように、ＣＰＵ４２は、まず、各コンテンツの判別用のカウンタｎを０に初期設定する（ステップ１９１）。続いてＣＰＵ４２は、ネットワーク５０上の各機器からアクセス認証を受け（ステップ１９２）、認証に通った場合（ステップ１９３のＹｅｓ）、各機器に記憶されたコンテンツを検出する（ステップ１９４）。当該コンテンツの検出は、当該ＰＶＲ３００自身に記憶されたコンテンツについても実行される。したがって上記コンテンツリストでは、ＰＶＲ３００自身及び他の機器に記憶されたコンテンツ全てが表示されることとなる。これによりユーザは、当該ユーザが操作する機器に記憶されたコンテンツか、他の機器に記憶されたコンテンツかを意識しなくて済む。
【０１１５】
上記ステップ１９３において認証に通らなかった場合（Ｎｏ）、ＣＰＵ４２は、コンテンツリストの表示動作モードが続行中か否かを判断し（ステップ１９８）、続行中である場合にはステップ２０２へ移る。表示動作モードの終了がユーザから指示された場合（Ｎｏ）、他の動作モードへの移行がユーザから指示されたか否かを判断し（ステップ１９９）、指示された場合（Ｙｅｓ）には当該他の動作モードへ移行する。一方他の動作モードへの移行が指示されていない場合（Ｎｏ）、ＣＰＵ４２は、上記ステップ１９２へ戻り、以降の処理を繰り返す。
【０１１６】
上記ステップ１９４においてコンテンツを検出すると、ＣＰＵ４２は、上記コンテンツのうち、まだ当該コンテンツリスト表示制御処理の対象となっていないコンテンツが存在するか否かを判断する（ステップ１９５）。当該処理の対象となっていないコンテンツが存在すると判断された場合（Ｙｅｓ）、ＣＰＵ４２は、当該コンテンツ（ｎ）について、それがコンテンツリスト上で表示可能か否かを示す表示可能フラグをＯＮに設定する（ステップ１９６）。
【０１１７】
続いてＣＰＵ４２は、ネットワーク５０上の全てのコンテンツを検出したか否かを判断し（ステップ１９７）、まだ検出すべきコンテンツが存在する場合（Ｎｏ）には、上記カウンタｎをインクリメントして上記ステップ１９４以降の処理を繰り返す。
【０１１８】
全てのコンテンツを検出したと判断された場合（Ｙｅｓ）、ＣＰＵ４２は、コンテンツリストの表示動作モードが続行中か否かを判断し（ステップ２０１）、続行中の場合（Ｙｅｓ）には、コンテンツへのアクセス状態を検出するためのカウンタｋを０に初期設定する（ステップ２０２）。上記ステップ２０１において、上記表示動作モードの終了がユーザから指示された場合（Ｎｏ）、上記ステップ１９９と同様の処理が実行される。
【０１１９】
上記カウンタｋを初期設定すると、ＣＰＵ４２は、コンテンツ（ｋ）について、そのアクセス状態を検出する（ステップ２０３）。すなわち、ＣＰＵ４２は、上述したテストデータを各機器へ送信しその返信を受け、トラフィック状況（エラーレート）を検出することで、各機器に記憶されたコンテンツのエラーレートを推定し、当該エラーレートが所定の閾値を上回った場合には当該コンテンツの円滑な再生はできない（アクセス不可能である）と判断する。
【０１２０】
続いてＣＰＵ４２は、上記アクセス可能と判断されたコンテンツ（ｋ）については上記コンテンツリスト上で上記サムネイルを通常の状態で表示し（ステップ２０５）、アクセス不可能と判断された場合（Ｎｏ）には、当該サムネイルの状態を変化させて表示させる（ステップ２０８）。
【０１２１】
続いてＣＰＵ４２は、上記カウンタｋをインクリメントし、上記検出された全てのコンテンツ（ｎ個のコンテンツ）について、以上の処理を繰り返す（ステップ２０７）。そしてＣＰＵ４２は、ネットワーク５０上の各機器を認証する所定のタイミングが到来したか否かを判断する（ステップ２０９）。当該タイミングが到来していないと判断された場合（Ｎｏ）、ＣＰＵ４２は上記ステップ２０１へ戻り、到来したと判断した場合（Ｙｅｓ）には上記ステップ１９２へ戻って認証処理を実行する。
【０１２２】
以上の処理により、ネットワーク５０上のトラフィック状況に応じて、コンテンツの円滑な再生が不可能である場合にはサムネイルが変化した状態で表示される。またＣＰＵ４２は、上記認証処理を所定タイミングで繰り返すことで、ネットワーク５０上に新たなコンテンツが追加された場合またはコンテンツがネットワーク５０上から切り離された場合に、それらの状態に応じて上記コンテンツリスト上のサムネイルを追加または削除することができる。
【０１２３】
図２１は、上記コンテンツリストの表示制御処理によりサムネイルの状態が変化する様子を示した図である。同図（Ａ）が変化前の状態、同図（Ｂ）が変化後の状態を示す。同図（Ａ）に示すように、通常表示されていたコンテンツ２ａのサムネイル９１は、同図（Ｂ）に示すように、トラフィック状況の悪化または当該コンテンツ２ａがネットワーク５０上から切り離されたことにより、影付き（グレー）で表示されている。当該サムネイルの表示状態の変化は、影付きによるものに限られず、例えば彩度や明度の変化により行われても構わない。
【０１２４】
また、上記図２０のフローチャートでは、エラーレートに関する所定の閾値を１つ設定されたが、当該閾値を複数設定し、エラーレートに応じて段階的に上記表示変化が行われても構わない。
【０１２５】
また、ＣＰＵ４２は、上記トラフィック状況が改善し、エラーレートが低下した場合には、上記サムネイルの状態を通常表示に変化させるとともに、それを示す何らかのマークを当該サムネイル近傍に表示してもよい。この際、ＣＰＵ４２は、上記コンテンツリスト上で、予めユーザが再生を所望するコンテンツを選択させておき、当該選択されたコンテンツのみについて当該マークを表示してもよい。
【０１２６】
（顔識別メタデータによるアクセス制御処理）
本実施形態においては、ネットワーク５０上の各機器は、各機器へのコンテンツへのアクセス権限の認証を、当該コンテンツに、アクセス元の機器のユーザの顔が映っているか否かにより行うことができる。すなわち、各機器は、自身が記憶するコンテンツへアクセスがあった場合、当該コンテンツに、アクセス元の機器のユーザの顔が映っている場合にはアクセスを許可し、そうでない場合には許否することができる。これは、ユーザは、当該ユーザ自身が映っているコンテンツにはアクセスを許可されるべきであるという考え方に基づいている。以下、当該アクセス制御処理について説明する。このアクセス制御処理には、上記メタデータ生成処理において生成される顔識別メタデータが用いられる。
【０１２７】
図２２は、当該顔識別メタデータに基づくアクセス制御処理の流れを示したフローチャートである。同図においては、上記メタデータ生成処理に対応するＰＶＲ１００が、ネットワーク５０上の全てのコンテンツについて、アクセス許可／不許可を示すデータを生成する場合について説明する。
【０１２８】
同図に示すように、ＰＶＲ１００のＣＰＵ１２は、他の機器から、当該他の機器のユーザＡの顔画像の登録を受け付ける（ステップ２１１）。当該顔画像は、当該他の機器が有するカメラにより撮影されたものであってもよいし、当該ユーザＡが有するデジタルカメラやカメラ付き携帯電話によりユーザＡが撮影し、他の機器を介して送信されたものであってもよい。
【０１２９】
当該顔画像の登録があると、ＣＰＵ１２は、当該顔画像データから、目、鼻、口、輪郭、テクスチャ特徴等の顔特徴データ（特徴ベクトル）を抽出する。当該顔特徴データの抽出には、例えば、顔の各パーツの位置関係に応じた特徴フィルター、輝度分布情報、肌色情報等が用いられる。
【０１３０】
続いて、ＣＰＵ１２は、ネットワーク５０上の各機器からアクセス認証を受け（ステップ２１２）、認証に通った場合（ステップ２１３のＹｅｓ）、各機器からコンテンツを検出する（ステップ２１４）。当該コンテンツの検出対象となる各機器には、自機（ＰＶＲ１００）も含まれる。認証に通らなかった場合（Ｎｏ）、ＣＰＵ１２は、他の動作モードへの移行が当該ＰＶＲ１００のユーザから指示されたか否かを判断し（ステップ２１９）、指示があった場合（Ｙｅｓ）は当該他の動作モードへ移行し、指示がない場合（Ｎｏ）には上記ステップ２１２へ戻る。
【０１３１】
上記コンテンツを検出すると、ＣＰＵ１２は、まだ当該アクセス制御処理の対象となっていないコンテンツが存在するか否かを判断する（ステップ２１５）。当該コンテンツが存在しない場合には上記ステップ２１９へ移る。当該コンテンツが存在する場合、ＣＰＵ１２は、当該コンテンツから、顔画像及び顔特徴を検出する。顔画像の検出には、例えば肌色検出等の既知の手法が用いられる。顔特徴の検出は、上記登録された顔画像についての処理と同様である。ここで、当該各検出処理は、上記顔識別メタデータが生成されている場合には不要であり、当該顔識別メタデータをそのままアクセス制御処理に用いることができる。当該検出処理により顔画像が検出されなかった場合（ステップ２１７のＮｏ）には、上記ステップ２１２へ戻り、その他の機器について処理を繰り返す。
【０１３２】
上記ステップ２１６において何らかの顔画像が検出された場合（ステップ２１７のＹｅｓ）、ＣＰＵ１２は、上記登録された顔画像の顔特徴データと、上記コンテンツから検出された顔特徴データを照合し、上記登録したユーザＡの顔が当該コンテンツに存在するか否かを判断する（ステップ２１８）。
【０１３３】
当該コンテンツにユーザＡの顔が存在すると判断された場合（ステップ２２０のＹｅｓ）、ＣＰＵ１２は、当該コンテンツについて、ユーザＡの機器からのアクセスを許可する許可データを生成する（ステップ２２１）。そしてＣＰＵ１２は、例えば当該コンテンツから検出された顔画像のサムネイルをユーザＡの機器へ転送する（ステップ２２２）。当該サムネイルは、コンテンツリストとして転送されてもよい。これにより、ユーザＡの機器が表示動作モードである場合、アクセス可能なコンテンツがコンテンツリストとして表示されることで、ユーザＡの機器は当該リスト上のコンテンツに即座にアクセスして当該コンテンツを再生することが可能となる。
【０１３４】
そしてＣＰＵ１２は、上記新たにアクセス制御対象とすべき全てのコンテンツについて解析が終了したか否かを判断し（ステップ２２３）、終了した場合（Ｙｅｓ）には処理を終了し、終了していない場合（Ｎｏ）には上記２１２へ戻って以降の処理を繰り返す。
【０１３５】
以上の処理は、上記アクセス許可データを自動的に生成するモードであるが、当該許可データは、手動で行われてもよい。図２３は、当該手動／自動の各動作モードに応じたアクセス制御処理の概要を示した表である。
【０１３６】
同図に示すように、自動モードにおいては、ＣＰＵ１２は、コンテンツに映っている顔が、機器に顔登録したユーザの場合に、上述のように、それを自動で知らせる。この場合、上述したように、当該ユーザの機器の例えばキャッシュメモリへ上記サムネイルを転送する。また、手動モードにおいては、登録元の機器は、ユーザが映っているコンテンツがネットワーク５０上に存在するか否かを検出する動作モードを、当該機器のユーザの操作に基づいて設定する。この場合、上記顔画像の探索によりその存在有無が検出された場合には、登録元の機器のキャッシュメモリへ上記サムネイルが転送される。
【０１３７】
以上の処理により、顔画像をキーとして、ネットワーク５０上の各コンテンツへのアクセス権限を認証することができ、ＩＤやパスワードを用いる場合に比べてより直感的な認証が可能となる。
【０１３８】
ここで、上記各コンテンツ内の顔画像及び顔特徴データの検出処理は、当該コンテンツの記録時に当該記録した機器により実行され、当該検出された顔特徴データがメタデータとして当該コンテンツと共に記憶されてもよい。これにより各機器はアクセス要求に対して即座にその認証を行うことができる。
【０１３９】
また、コンテンツに映っているユーザのみならず、当該コンテンツの作成者もアクセスを許可されてよい。この場合、コンテンツの記録（作成）時に、当該コンテンツの作成者の顔画像から検出された顔特徴データがメタデータとして記憶される。そして、上記解析時に、コンテンツ内の顔画像の顔特徴データとの照合に加えて、当該記憶された作成者の顔画像の顔特徴データとの照合も行われる。これにより、コンテンツ作成者が、自身のコンテンツを再生できなくなる事態を防ぐことができる。
【０１４０】
［まとめ］
以上説明したように、本実施形態によれば、ネットワーク５０上の各機器は、当該機器自身がメタデータを生成できない場合であっても、それが可能なネットワーク上の他の機器を検索してメタデータを生成させることができ、当該メタデータを種々の処理に活用することができる。
【０１４１】
また、各機器は、コンテンツを再生した場合に推定されるエラーレートに応じてコンテンツリスト上のサムネイル画像の状態を変化させることで、当該サムネイル画像に対応するコンテンツが円滑に再生可能か否かをユーザに直感的に把握させることができる。したがって各機器は、トラフィック状況が悪く円滑な再生ができないコンテンツをユーザが再生してしまい不快感を覚えるような事態を防ぐことができる。
【０１４２】
さらに、各機器は、他の機器から送信された顔画像と合致する顔画像がコンテンツに含まれている場合には、当該コンテンツが当該他の機器のユーザにより作成されたものでなくても、当該コンテンツに対する他の機器からのアクセスを許可することができる。
【０１４３】
［変形例］
本発明は上述の実施形態にのみ限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々変更され得る。
【０１４４】
上述の実施形態においては、ＰＶＲ３００が、他の機器に記憶されたコンテンツのメタデータの生成をＰＶＲ１００へ指示する例を示したが、ＰＶＲ３００自身が記憶するコンテンツについて、自らＰＶＲ１００との間でテストデータを送受信することで、メタデータの生成を指示してもよい。
【０１４５】
上述の実施形態においては、コンテンツがＨＤＤ等の記憶装置に記憶されている場合について説明されたが、例えばＢＤやＤＶＤ等の可般性の記録媒体に記憶されたコンテンツについても本発明を適用することができる。
【０１４６】
上述の実施形態において説明した各種メタデータは例示にすぎず、あらゆる動作に対応したあらゆるメタデータについて本発明を適用することができる。
【０１４７】
上述の実施形態においては、コンテンツリスト上におけるトラフィック状況に応じたサムネイルの表示変化処理について、コンテンツの分類処理がなされたことを前提に説明がなされたが、もちろん、コンテンツの分類処理がなされていない状態でも当該表示変化が実行されてもよい。
【０１４８】
上述の実施形態においては、本発明をＰＶＲに適用した例を説明した。しかし本発明は、例えばＰＣ（Personal Computer）、テレビジョン装置、ゲーム機器、携帯電話機、その他ＡＶ（Audio/Visual）機器等、あらゆる電子機器に適用可能である。
【符号の説明】
【０１４９】
７、３７…再生部
８、３８…ＨＤＤ
１１、４１…通信部
１２、４２…ＣＰＵ
１４、４４…ＲＡＭ
１５、４５…操作入力部
１６、４６…グラフィック制御部
２０…特徴抽出回路
５０…ネットワーク
６０…ＴＶ
７３…動作モード用データ
７４…処理用データ
７５…エラー処理用データ
９１…サムネイル
１００、２００、３００、４００、５００…ＰＶＲ

【特許請求の範囲】
【請求項１】
ネットワークに接続する通信部と、
前記ネットワーク上の第１の機器に記憶されたコンテンツについて、当該コンテンツから抽出された所定の特徴を示すメタデータが生成されているか否かを判断し、当該メタデータが生成されていないと判断された場合に、前記通信部を用いて、前記ネットワーク上から当該メタデータを生成可能な第２の機器を検索し当該検索された第２の機器へ前記メタデータの生成を指示するコマンドを送信する制御部と
を具備する電子機器。
【請求項２】
請求項１に記載の電子機器であって、
前記制御部は、前記通信部を用いて、前記第１の機器に、前記メタデータの生成の可否を問い合わせる問合せデータを前記第２の機器へ送信するよう要求し、当該問合せデータに応答して前記他の機器から前記第１の機器に返送され当該第１の機器から転送された返答データを基に、当該他の機器による前記メタデータの生成の可否を判断し、
前記第１の機器は、前記第２の機器へ前記問合せデータが送信されてから当該第２の機器から前記返答データが受信されるまでの遅延時間または当該返答データのエラーレートに関する評価データを当該電子機器へ送信し、
前記制御部は、前記返答データを基に、前記メタデータを生成可能な第２の機器が複数存在すると判断した場合に、前記評価データを基に、前記遅延時間または前記エラーレートが最小となる１つの第２の機器を選択する
電子機器。
【請求項３】
請求項２に記載の電子機器であって、
前記コンテンツは当該コンテンツのジャンルを示すジャンル情報を有し、
前記返答データは、前記コンテンツにおける複数種類の特徴を示す複数種類のメタデータの生成の可否をそれぞれ示し、
前記制御部は、前記通信部を用いて前記第１の機器から前記コンテンツを受信し、前記ジャンル情報を基に当該受信されたコンテンツのジャンルを判断し、前記第２の機器が複数存在すると判断した場合に、前記返答データを基に、前記判断されたジャンルに応じた特定の種類のメタデータを生成可能な１つの第２の機器を選択する
電子機器。
【請求項４】
請求項２に記載の電子機器であって、
前記第１の機器は複数存在し、
前記制御部は、前記通信部を用いて、前記第２の機器により生成された複数のコンテンツの各メタデータを受信し、当該各メタデータを基に、前記各第１の機器に記憶された各コンテンツを分類する
電子機器。
【請求項５】
請求項４に記載の電子機器であって、
表示装置に接続された出力部をさらに具備し、
前記制御部は、前記分類されたコンテンツの分類毎のリストを生成し、当該リストを前記出力部を介して前記表示装置に表示させる
電子機器。
【請求項６】
ネットワークに接続する通信部と、
コンテンツを記憶する記憶部と、
前記コンテンツについて、当該コンテンツから抽出された所定の特徴を示すメタデータが生成されているか否かを判断し、当該メタデータが生成されていないと判断された場合に、前記通信部を用いて、前記ネットワーク上から当該メタデータを生成可能な他の機器を検索し当該検索された他の機器へ前記メタデータの生成を指示するコマンドを送信する制御部と
を具備する電子機器。
【請求項７】
ネットワーク上の第１の機器に記憶されたコンテンツについて、当該コンテンツから抽出された所定の特徴を示すメタデータが生成されているか否かを判断し、
前記メタデータが生成されていないと判断された場合に、前記ネットワーク上から当該メタデータを生成可能な第２の機器を検索し
前記検索された第２の機器へ前記メタデータの生成を指示するコマンドを送信する
メタデータ生成方法。
【請求項８】
電子機器に、
ネットワーク上の第１の機器に記憶されたコンテンツについて、当該コンテンツから抽出された所定の特徴を示すメタデータが生成されているか否かを判断するステップと、
前記メタデータが生成されていないと判断された場合に、前記ネットワーク上から当該メタデータを生成可能な第２の機器を検索するステップと、
前記検索された第２の機器へ前記メタデータの生成を指示するコマンドを送信するステップと
を実行させるプログラム。

【図１】