説明

番組再生装置および番組再生方法

【課題】番組の映像に含まれている複数の対象から視聴者が所望の対象を簡単に選択して、その対象の情報をネットワーク経由で速やかに得ることができる番組再生装置を実現する。
【解決手段】1つのフレームから1箇所または複数の領域を画像データとして抽出する画像抽出手段と、抽出した画像データの位置を明示するマーカーを生成するGUI制御手段と、マーカーを1つのフレームに重畳して表示する表示制御手段と、視聴者によってマーカーを用いて1つの画像データが選択される操作手段と、番組配列情報および番組特定情報から画像検索キーを生成する画像検索キー生成手段と、画像検索キーを用いて外部のサーバーから参照画像を取得して画像データと照合する画像検索照合手段と、照合結果に基づいて画像データの属性を示す情報検索キーを生成し、ネットワーク経由で画像データに関連する情報を取得する情報検索手段とを備えたものである。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、文字、静止画、動画、音声などで構成される番組を再生することができるとともに、番組に関連する情報の検索ができる番組再生装置に関するものである。
【背景技術】
【0002】
デジタル放送やネットワーク配信される番組を視聴している際に、視聴者が未知の出演者を見つけた場合、出演者の名前やプロフィールをその場で知りたくなることがある。例えばデジタル放送においては、放送ストリームに番組配列情報(Service Information:以降SI情報と称する)が含まれているので、受像機側でこのSI情報を用いて電子番組表(Electronic Program Guide:以降EPGと称する)画面を生成する。視聴者はこのEPGを参照することで視聴中の番組の主な出演者名を見ることができる。
【0003】
しかし、視聴者は、そもそも出演者の顔を知らないこともあるので、どの出演者がEPGに記載された出演者名であるかがわからない場合が多い。名前と顔とを一致させるためには、例えばパソコンなどを介して、Webの検索サイトを利用して出演者の名前で検索して出演者の顔を知る必要がある。例えば、EPGの出演者名を順次検索することで当該出演者名に対応した顔画像をパソコンの画面に呼び出して、この顔画像と番組の出演者映像とを照合することが考えられるが、視聴者にとっては非常に煩雑である。また、パソコンなどの検索環境が手元にない場合には、視聴者は、結局誰だか分からずにあきらめる可能性がある。また、SI情報には主要な出演者名しか含まれていないため、当該の出演者名がEPGに記載されてない可能性もある。
【0004】
このような課題を解決するために、放送映像に含まれる顔画像データを抽出した上で、抽出した顔画像データを、データベース化された基準画像と照合する装置に転送することで、抽出した顔画像に対応する情報(名前、性別、プロフィールなど)を取得して受像機の画面に表示することで、視聴者が未知の出演者を特定する事を可能とする方法が開示されている(例えば、特許文献1参照)。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2009−118411号公報(第4−9頁、図6)
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、上記のような従来の方法においては、画像から対象となる顔画像を切り出すために、領域を示すフレームを画面に表示させ、視聴者がリモコン操作などでフレームを移動させる方法と、顔画像検出処理によってフレームを自動的に顔の範囲に表示する方法とが示されているが、いずれの方法であっても1つの画面に複数の人物が映っている場面から所望の顔画像を切り出すことは困難である。また、画像サイズが小さい、顔が横を向いている、輝度やコントラストが不十分など、顔の照合に不適切な品質の画像が切り出される可能性もあり、このような場合、顔画面の切り出し以降の照合処理が困難になるという問題がある。
【0007】
この発明は、上述のような課題を解決するためになされたもので、デジタル放送やネットワーク配信される番組の映像に含まれている複数の対象から視聴者が所望の対象を簡単に選択して、その対象の情報を速やかに得ることができる番組再生装置を実現することを目的とする。
【課題を解決するための手段】
【0008】
この発明に係る番組再生装置は、受信した番組を再生する番組再生装置であって、ネットワークを経由して外部のサーバーと通信する通信手段と、前記番組の伝送ストリームを映像ストリーム、音声ストリームおよびデータセクションに分離するデマルチプレクス手段と、前記映像ストリームをデコードして映像信号に変換する映像デコード手段と、前記映像信号に含まれる1つのフレームから1箇所または複数の領域を切り出して画像データとして抽出する画像抽出手段と、前記1つのフレーム内において、前記抽出した1箇所または複数の画像データの位置を明示するマーカーを生成するGUI制御手段と、前記マーカーを前記1つのフレームに重畳して表示する表示制御手段と、視聴者によって前記マーカーを用いて前記1箇所または複数の画像データから1つの画像データが選択される操作手段と、前記データセクションに含まれる番組配列情報および番組特定情報を抽出する番組データ抽出手段と、前記番組配列情報および前記番組特定情報から参照画像を検索するための画像検索キーを生成する画像検索キー生成手段と、前記画像検索キーを用いて、前記通信手段によって前記ネットワーク経由で前記外部のサーバーから前記参照画像を取得し、前記画像データと前記参照画像とを照合する画像検索照合手段と、前記照合結果に基づいて前記画像データの属性を示す情報検索キーを生成し、前記情報検索キーを用い前記通信手段によって前記ネットワーク経由で前記画像データに関連する情報を取得する情報検索手段とを備えたものである。
【発明の効果】
【0009】
この発明は、番組の映像から抽出した1枚もしくは複数の画像データの位置を明示するマーカーを、画像データを抽出した元のフレームに重ねて表示し、視聴者がマーカーを基に1枚の画像データを選択してその画像データを参照画像と照合することで、視聴者が選択した画像データの属性を特定して、その属性を基にネットワーク経由で視聴者が選択した画像データの情報を取得するように構成することで、視聴者は番組の映像に含まれている複数の対象から特定の対象を簡単に選択して、その対象の情報を速やかに得ることが可能となる。
【図面の簡単な説明】
【0010】
【図1】この発明の実施の形態1における番組再生装置を示すブロック構成図である。
【図2】この発明の実施の形態1におけるネットワーク構成図である。
【図3】この発明の実施の形態1における番組再生装置の動作を示すフローチャートである。
【図4】この発明の実施の形態1における操作入力部の外観例である。
【図5】この発明の実施の形態1における設定画面の構成例である。
【図6】この発明の実施の形態1における設定画面のフォーカス移動例である。
【図7】この発明の実施の形態1における番組再生画面例である。
【図8】この発明の実施の形態1における顔画像切り出し領域例である。
【図9】この発明の実施の形態1における抽出画像テーブル例である。
【図10】この発明の実施の形態1における抽出画像領域の選択画面例である。
【図11】この発明の実施の形態1における抽出画像領域に対するマーカー設定例である。
【図12】この発明の実施の形態1における画像検索キーリストの例である。
【図13】この発明の実施の形態1における参照画像取得要求メッセージおよび参照画像取得応答メッセージの例である。
【図14】この発明の実施の形態1における情報取得要求メッセージの例である。
【図15】この発明の実施の形態1における情報取得応答メッセージの例である。
【図16】この発明の実施の形態1における情報表示画面の例である。
【図17】この発明の実施の形態2における番組再生装置の動作を示すフローチャートである。
【図18】この発明の実施の形態2における抽出画像テーブル例である。
【図19】この発明の実施の形態2における抽出画像領域の選択画面例である。
【図20】この発明の実施の形態3における番組再生装置を示すブロック構成図である。
【図21】この発明の実施の形態3における画像検索キーデータベースの例である。
【発明を実施するための形態】
【0011】
実施の形態1.
図1は、この発明を実施するための実施の形態1における番組再生装置1の構成の一形態を示すブロック構成図である。番組再生装置1は、主な要素としてチューナー/復調部10、デスクランブル部11、デマルチプレクス部12、映像デコード部13、番組データ抽出部14、画像検索キー生成部16、画像抽出部17、画像検索照合部18、情報検索制御部19、通信プロトコル処理部20、ネットワーク通信部21、GUI(Graphical User Interface)制御部22、操作入力部23、操作解析部24、表示制御部25、表示部26、音声デコード部27および音声出力部28から構成される。
【0012】
チューナー/復調部10は、放送を受信するためのフロントエンド処理を行う部分であり、放送を選局して復調することで放送波からストリームデータを抽出する。チューナー/復調部10によって放送波から抽出されたストリームデータは、暗号化されているためデスクランブル部11で復号化される。デマルチプレクス部12は、デスクランブル部11で復号化されたストリームデータから映像ストリーム、音声ストリーム、およびSI情報、番組特定情報などのデータを含んだセクションに分離する。
【0013】
映像デコード部13は、MPEG−2(Moving Picture Experts Group phase 2)などの形式で圧縮符号化されている映像ストリームを復号化することでビデオ信号に変換する。番組データ抽出部14は、セクションからSI情報、番組特定情報などのデータを抽出する。画像検索キー生成部16は、画像を検索する際の検索キーを生成する。画像抽出部17は映像デコード部13が復号化したビデオ信号から顔画像の切り出しを行う。画像検索照合部18は、画像抽出部17で切り出された顔画像データを参照画像データと比較して顔の照合を行い、情報検索のための検索キーを生成する。
【0014】
情報検索制御部19は、ネットワーク経由で検索キーを基に検索を行う。通信プロトコル処理部20は、必要なプロトコルに応じた送信メッセージの生成および受信メッセージの解析を行う。ネットワーク通信部21は、ネットワーク経由でパケットの送受信を行う。
【0015】
GUI制御部22は、各種操作画面や状態通知画面の生成、入力コマンドに応じた画面の切り替えなどを行う。操作入力部23は、リモコン、キーボード、マウスなどであり、ユーザーが操作の指示を入力するための入力デバイスの総称である。操作解析部24は、操作入力部23から入力されたコマンドを解析してGUI制御部22に通知する。表示制御部25は、映像デコード部13で復号化されたビデオ信号やGUI制御部22で生成された各種画面の表示制御を行う。表示部26は、表示制御部25の表示制御にしたがって適切な映像を表示するディスプレイである。
【0016】
音声デコード部27は、AAC(Advanced Audio Codec)などの形式で圧縮符号化されている音声ストリームを復号化することで音声信号データに変換する。音声出力部28は、音声デコード部27で復号化された音声信号データをアナログ信号に変換し、増幅してスピーカーから出力する。
【0017】
図2は、本実施の形態の番組再生装置1がネットワークに接続された状態を示すネットワーク構成図である。番組再生装置1は、ネットワーク通信部21を介して、図2に示すとおりネットワーク2に接続されている。この図におけるネットワーク2の代表的なものとしてインターネットであるが、その他専用のイントラネットやホームネットワークなどの場合もある。
【0018】
ネットワーク2には画像データベースサーバー3と情報データベースサーバー4とが接続されている。画像データベースサーバー3には顔照合に必要な参照画像データと、参照画像の内容を説明する属性情報(例えば、人物画像の場合はその人物の名前、性別、年齢などの情報)を対応付けたデータベースとが格納されている。情報データベースサーバー4には特定の人物のプロフィールなど詳細な情報が格納されている。
【0019】
なお、図2において、画像データベースサーバー3と情報データベースサーバー4とをそれぞれ1台ずつ別のものとして記載しているが、物理的に同じサーバーに統合されていてもよい。また、図2において、番組再生装置1と画像データベースサーバー3と情報データベースサーバー4とをそれぞれ1台ずつ記載してあるが、それぞれが複数台接続されていてもよい。
【0020】
次に、本実施の形態における、番組再生装置1の動作について説明する。図3は、本実施の形態における番組再生装置1の動作のフローを示す図である。図4に、本実施の形態における番組再生装置1の操作に用いる操作入力部23の一例である。図4に示す通り、操作入力部23としてリモコンを例として説明を行う。
【0021】
操作入力部23にはリモコンキーが配列されている。本実施の形態で使用するキーとして、チャンネル番号の直接選択や数字を入力するためのキーが3列×4行の形状で配置されている。これらのキーの名称は、それぞれ数字1キー41、数字2キー42、数字3キー43、数字4キー44、数字5キー45、数字6キー46、数字7キー47、数字8キー48、数字9キー49、数字10/0キー50、数字11キー51および数字12キー52とする。また、上記の12個のキーを総称して数字キーと称する。
【0022】
番組再生装置1において、チャンネル指定、音量変更などリモコンキーを押下することで直接実行される操作ではなく、表示部26に表示されたメニュー画面等のGUI画面(設定画面)を見ながら実行する操作の場合、ユーザーは、設定画面の選択可能な項目が表示されている部分にフォーカスを当てることで所望の項目を選択する。ここで言う「フォーカスを当てる」とは、表示画面に含まれている選択可能な箇所から任意の箇所を特定していることを示す。
【0023】
図5は、本実施の形態における設定画面の構成例である。図5に示すようにフォーカスが当っている領域の色やトーンを変えたり、枠で囲んだりする。図5は「ネットワーク設定」にフォーカスが当っていることを示している。フォーカスの移動は、リモコンの「十字キー(上下左右の矢印キー)」を用いて、選択可能な箇所を順番に移動する方法が用いられる。
【0024】
図4に示す操作入力部23にはフォーカスを移動するための十字キーが配列されている。十字キーは、実際には上側に移動するキー、下側に移動するキー、右側に移動するキーおよび左側に移動するキーの4種類で構成されている。これらのキーは、それぞれ図4の31、32、33および34に相当し、以降は便宜的に上キー31、下キー32、右キー33および左キー34と称する。また、上キー31、下キー32、右キー33および左キー34の4つのキーを総称する場合は十字キーと称する。図6は、本実施の形態における設定画面のフォーカス移動例である。図6の例では、「受信設定」にフォーカスが当っている状態から「ネットワーク設定」にフォーカスを移動する場合を示しており、この移動には下キー32を2回押下する必要がある。上記のキーに加えて操作入力部23には図4の通り顔検索キー36が配置されている。
【0025】
番組再生装置1は、チューナー/復調部10で放送波の同調および復調を行い、復調したストリームをデスクランブル部11で暗号解除を行った後、暗号解除されたストリームデータからデマルチプレクス部12によって映像ストリーム、音声ストリーム、およびSI情報、番組特定情報などのデータを含んだセクションに分離する。なお、ストリームデータは、データストリーム(例えば、字幕に関するデータなど)を含んでいる場合があり、その場合にはデマルチプレクス部12は、このデータストリームも分離する。映像ストリームは映像デコード部13によって映像信号に復号化され、映像信号は表示制御部25を経由して表示部26に表示される。
【0026】
図7は、本実施の形態における番組再生画面例である。これ以降、図3を用いて本実施の形態における番組再生装置1の動作を説明する。視聴者は、図7に示す通り4名の人物が映っている番組を視聴している状態で、ステップS101において番組再生装置1の操作入力部23の顔検索キー36を押下する。操作入力部23は、操作解析部24に対して押下されたキーのコード情報を送信する。操作解析部24は、受信したキーコード情報から顔検索機能のGUI画面を有効にするようにGUI制御部22に要求を行う。GUI制御部22は、画像抽出部17に対して出画中の映像から顔画像の切り出しを行うように要求を行うと同時に、表示制御部25に対して画像静止の要求を行う。
【0027】
ステップS102において、画像抽出部17は、映像デコード部13によって復号化された映像信号に含まれる任意のフレームから顔画像の切り出しを行う。図8は、本実施の形態における顔画像切り出し領域例である。この例では4つの顔を検出して、図8に示す4つの領域A1、A2、A3およびA4を切り出したとする。画像抽出部17は、この切り出した領域が画面中のどこに位置するかを示す座標値を含んだ抽出画像テーブルを生成する。また、併せて切り出した4つの領域の画像をそれぞれ個別の抽出画像ファイルとして生成する。
【0028】
図9は、本実施の形態における抽出画像テーブル例である。抽出画像テーブルの要素としては、この画面内におけるA1〜A4領域それぞれの左上角の位置を示すための水平座標位置および垂直座標位置、領域A1〜A4それぞれのサイズを示すための水平サイズおよび垂直サイズ、並びに領域A1〜A4のそれぞれを特定するための画像IDから構成される。また、一番右側の列には説明の便宜上、領域を区別する符号番号を示しているが実際の抽出画像テーブルの要素としては不要である。座標は、図8に示す通り、画面全体の左上を原点(座標0)として、水平方向は右側に進むにつれ座標値は増加する。また垂直方向は下側に進むにつれ座標値は増加する。
【0029】
座標は画素数を単位としている。この例ではフルハイビジョン(水平方向:1920画素×垂直方向:1080画素)の画像を想定しているので、右端の水平位置座標は1919、下端の垂直位置座標は1079となる。図9の抽出画像テーブルにおいて、領域A1は、画像IDが1、左上角の位置座標が水平位置座標=320、垂直位置座標=212、水平サイズ=330画素、垂直サイズ340画素であることを示している。また、この抽出画像テーブルにおいて、番組中のどのフレームに相当するかを示すためにフレームIDと抽出画像テーブルとの対応付けが行われる。フレームIDはある程度長い期間中(例えば番組単位)でそれぞれのフレームがユニークに特定できるように割り付けた番号である。例えばデコード時にフレーム1枚ごとに1ずつ増加させるカウンター値を割り付けることで実現できる。
【0030】
ステップS103において、GUI制御部22は、抽出画像テーブルを参照して、視聴者が顔画像を区別して選択できるように、顔が表示されている領域を区別するためのマーカーのグラフィックスデータを生成し、生成したマーカーを重畳表示するフレームを指定するために、抽出画像テーブルに対応付けられたフレームIDとともにマーカーのグラフィックスデータを表示制御部25に引き渡す。表示制御部25は受け取ったフレームIDに対応するフレームを静止画として表示部26に表示するとともに、マーカーのグラフィックスデータをこのフレームに重ねて表示する。図10は、このようにしてグラフィックスデータがフレームに重畳して表示された、抽出画像領域の選択画面例である。
【0031】
図10の例では、顔の周辺を囲む楕円形を配置し、視聴者が区別できるようにそれぞれに「1」、「2」、「3」および「4」の番号を付加して表示している。図11は、抽出画像領域に対するマーカー設定例である。この楕円形は、図11に示す通り、抽出画像テーブルにおける水平座標位置、垂直座標位置、水平サイズおよび垂直サイズの4つの変数から領域A2の長方形に内接する楕円として算出されて表示されている。この方法により、顔が近接している場面でもマーカー同士が重なりにくくなり視聴者による視認性が高まる効果が得られる。
【0032】
ステップS104において、視聴者は検索したい顔の選択を行う。具体的な操作としては、図10に示す抽出画像領域の選択画面を見ながら、所望の顔に該当する番号を操作入力部23の数字キーを押下することで選択する。例えば、数字2キー42を押下すると、領域A2に対応する顔の選択を行ったことになる。この方法により視聴者は操作入力部23のリモコンボタンの1つを1回押すだけで所望の顔を選択することが可能となり、操作が容易になるという効果が得られる。例えば、図10の画面のように顔が縦一列もしくは横一列に並んでいないような場面では、十字キーを押したときにフォーカスが移動する方向が分かりにくいという問題がある(例えば、1にフォーカスが当たっている場合に右キー33を押下したら2と3のどちらにフォーカスが移動するか分かりにくい)。しかしながら、本実施の形態のようにマーカーに個別の番号が付与されており、ユーザーはこの番号を数字キーで直接入力することができるので、視聴者が迷うことなく所望の顔を選択できる効果が得られる。
【0033】
このステップS104において、操作解析部24は、押下された数字キーのコードを受信して、受信したキーコード情報からGUI制御部22に数字の「2」が選択されたことを通知する。GUI制御部22は、数字の「2」が選択された通知に従って、視聴者が選択した抽出画像の画像IDを画像検索照合部18に引き渡す。また、これと同時にGUI制御部は、表示制御部25に対して画像静止終了の要求を行う、この要求を受けて表示制御部25は、マーカーのグラフィックスの重畳表示を終了するとともに番組映像の再生表示を再開する。これにより視聴者が自身の選択操作が受付けられたことを認識できるという効果が得られる。
【0034】
ステップS105において、画像検索照合部18は、画像検索キー生成部16に対して画像検索キーの生成要求を行う。画像検索キー生成部16は、番組データ抽出部14でセクションデータから抽出された番組特定情報を入手して、現在視聴中の番組を特定した上で、同じく番組データ抽出部14でセクションデータから抽出された番組配列情報(SI情報)を参照して出演者名の一覧から構成される画像検索キーリストを生成する。図12は、本実施の形態における画像検索キーリストの例である。画像検索キー生成部16は、画像検索照合部18に生成した画像検索キーリストを引き渡す。
【0035】
ステップS106において、画像検索キー生成部16は、画像検索キーリストを参照して、まず先頭に登録されている出演者名(図12の例では画像検索キー番号1の「小田健二」)をキーとして、通信プロトコル処理部20に参照画像取得要求のメッセージ作成コマンドを発行する。通信プロトコル部20は、所定のプロトコルに従った参照画像取得要求メッセージを生成する。この場合の所定のプロトコルとは例えばHTTP(Hypertext Transfer protocol)に従って構成されたGETメソッドなどである。図13は、参照画像取得要求メッセージおよび参照画像取得応答メッセージの例である。このメッセージではrefimg.bmpという名称の参照画像を要求している。この後に通信プロトコル部20は、ネットワーク通信部21を介してネットワーク経由で画像データベース3に対してこの参照画像取得要求メッセージを送信する。
【0036】
画像データベース3は、受信した参照画像取得要求メッセージを解析して、「小田健二」に合致する参照画像データを参照画像取得応答メッセージとして番組再生装置1のネットワーク通信部21に送信する。図13には参照画像取得応答メッセージの例も示している。このメッセージでは、HTTPのGETメソッドに対するレスポンスメッセージの形式を採用している。通常、参照画像データは1枚であるが、照合精度を向上させるために複数枚用いてもよい。
【0037】
ステップS107において、番組再生装置1の通信プロトコル処理20は、ネットワーク通信部21を介して、参照画像取得応答メッセージを受信する。通信プロトコル処理20は、参照画像取得応答メッセージから参照画像データのみを抽出して画像検索照合部18に引き渡す。画像検索照合部18は、ステップS102で画像抽出部17が生成した抽出画像ファイルおよび抽出画像テーブルを基に、ステップS104でGUI制御部22から引き渡された抽出画像の画像IDからステップS106で取得した参照画像データとの照合を行う1つの抽出画像ファイルを決定し、この参照画像データとの照合判定を行う。
【0038】
抽出画像ファイルと参照画像データとの照合判定の方法としては、一般に顔照合処理技術して知られている、例えば、固有顔法、LFA(Local Feature Analysys)法などのアルゴリズムを適用することができる。これらの方法においては、抽出画像ファイルと参照画像データとの類似度など照合結果のスコア値がある一定の閾値以上であれば一致すると判定する。
【0039】
ステップS108において、照合判定結果が「参照画像と合致しない」となった場合、すなわち照合結果のスコアが所定の閾値を越えなかった場合はステップS109に遷移する。ステップS109では、画像検索キー番号が画像検索キーリストの最後の画像を示す値ではなかった場合、例えば図12の画像検索キーリストにおける画像検索キー番号が1から8のいずれかの場合は、ステップS110に遷移する。ステップS110において、画像検索キー番号を+1増加させて再度ステップS106に遷移する。
【0040】
ステップS108において、照合判定結果が「参照画像と合致する」となった場合、すなわち照合結果のスコアが所定の閾値を越えた場合はステップS111に遷移する。
【0041】
ステップS111において、画像検索照合部18は、情報検索制御部19に参照画像と合致した検索キーを引渡し、情報検索要求を行う。
【0042】
ステップS112において、情報検索制御部19は、受け取った検索キーをベースとして、通信プロトコル処理部20に対して情報取得要求のメッセージ作成コマンドを発行する。通信プロトコル部20は、所定のプロトコルに従った情報取得要求メッセージを生成する。この場合の所定のプロトコルとは例えばHTTPに従って構成されたPOSTメソッドなどである。図14は、情報取得要求メッセージの一例である。この例では、XML(eXtended Markup Language)形式の文書に検索キーを埋め込む形でメッセージを生成している。この後に通信プロトコル部20は、ネットワーク通信部21を介してネットワーク経由で情報データベース4に対してこの情報取得要求メッセージを送信する。
【0043】
情報データベース4は、受信した情報取得要求メッセージを解析して、例えば「小田健二」に合致するプロフィールデータを情報取得応答メッセージとして番組再生装置1に送信する。図15は、情報取得要求応答メッセージの一例である。この例では、メッセージはHTTPのPOSTメソッドに対するレスポンスメッセージの形式を採用している。プロフィールデータは、XML形式のテキスト文書の構成が採用されており、このXML文書の中に、本名、年齢、性別、経歴、代表作などの情報がタグにより構造化されたデータとして埋め込まれている。
【0044】
ステップS113において、番組再生装置1の通信プロトコル処理部20は、ネットワーク通信部21を介して、情報取得応答メッセージを受信する。通信プロトコル処理部20は、情報取得応答メッセージからXML形式のプロフィールデータのみを抽出して画像検索照合部18に引き渡す。
【0045】
画像検索照合部18は、受け取ったXML形式のプロフィールデータを解析し、タグで囲まれている個別の要素を取り出してGUI制御部22に引き渡す。GUI表示部22は、プロフィールを表示するグラフィックスデータを生成して、表示制御部25に引き渡す。表示制御部25は、番組再生画面に重ねてプロフィール表示のグラフィックスデータを表示する。図16は、本実施の形態における情報表示画面の一例である。
【0046】
このように構成された番組再生装置においては、番組の映像から抽出した1枚もしくは複数の画像データの位置を明示するマーカー表示を、画像データを抽出した元のフレームに重ねて表示し、視聴者がマーカー表示を基に1枚の画像データを選択してその画像データを参照画像と照合することで、視聴者が選択した画像データの属性を特定して、その属性を基にネットワーク経由で視聴者が選択した画像データの情報を取得することができるので、視聴者は番組の映像に含まれている複数の対象から特定の対象を簡単に選択して、その対象の情報を速やかに得ることが可能となる。
【0047】
実施の形態2.
実施の形態1において、図3に示すステップS102では、画像抽出部17は映像デコード部13によって復号化された映像信号に含まれる任意のフレームからから顔画像の切り出しを行うが、この際に切り出しを行った顔画像が例えばサイズが小さいなど顔照合に適さない場合がある。このような場合、これ以降のステップS107において実行される抽出画像と参照画像データと照合判定においてエラーが発生することがありうる。実施の形態2においては、このような課題を事前に回避することができる方法について説明する。
【0048】
図17は本実施の形態の番組再生装置の動作フローを示した図である。ステップS101において、視聴者は、図7に示す通り4名の人物が映っている番組を視聴している状態で、番組再生装置1の操作入力部23の顔検索キー36を押下する。操作入力部23は、操作解析部24に対して押下されたキーのコード情報を送信する。操作解析部24は、受信したキーコード情報から顔検索機能のGUI画面を有効にするようにGUI制御部22に要求を行う。GUI制御部22は、画像抽出部17に対して出画中の映像から顔画像の切り出しを行うように要求を行うと同時に、表示制御部25に対して画像静止の要求を行う。
【0049】
ステップS102において、画像抽出部17は、映像デコード部13によって復号化された映像信号に含まれる任意のフレームからから顔画像の切り出しを行う。本実施の形態では、実施の形態1と同様に4つの顔を検出して、図8に示す4つの領域A1、A2、A3およびA4を切り出したとする。画像抽出部17は、この切り出した領域が画面中のどこに位置するかを示す座標値を含んだ抽出画像テーブルを生成する。また、併せて切り出した4つの領域の画像を個別の抽出画像ファイルとして生成する。
【0050】
画像抽出部17は、切り出した4つの抽出画像ファイルそれぞれに対して、参照画像データとの照合に適切かどうかの評価を行う。評価パラメータおよび判断基準は照合を行う画像検索照合部18の性能に応じて適当なものを使用する。例えば抽出画像の画素数、平均輝度などである。評価パラメータとして抽出画像のサイズを使用する場合、画像における水平方向の画素数および垂直方向の画素数の閾値として、それぞれPHrefおよびPVrefと定め、抽出画像の水平方向の画素数をPHext、垂直方向の画素数をPVextとしたとき、下記の不等式(1)もしくは不等式(29に示す条件のいずれか一方もしくは両方が満たされない場合、照合に適切ではないと判断する。
【0051】
PHref > PHext ・・・・ (1)
PVref > PVext ・・・・ (2)
【0052】
評価パラメータとして平均輝度を使用する場合、画像中の全画素における輝度値の平均値を平均輝度とする。平均輝度の閾値としてBrefと定め、抽出画像の平均輝度をBextとした時、下記の不等式(3)に示す条件が満たされない場合、照合に適切ではないと判断する。
【0053】
Bref > Bext ・・・・・・ (3)
【0054】
上記の(1)、(2)および(3)の3つの不等式を組み合わせて、全ての条件を満たした場合のみ照合に適切と判断し、それ以外の場合は照合に適切でないと判断してもよい。
【0055】
ステップS201において、画像抽出部17は、切り出した4つの抽出画像ファイルそれぞれに対して、参照画像データとの照合に適切かどうかの判定を行い、照合に適切と判断した場合、ステップS202に進み抽出画像テーブルの照合有効フラグにONを設定する。また、照合に適切ではないと判断した場合、ステップS203に進み抽出画像テーブルの照合有効フラグにOFFを設定する。
【0056】
図18は、本実施の形態における抽出画像テーブル例である。この例では、領域A1、領域A2および領域A4は照合に適切と判断され、領域A3は照合に適切ではないと判断されている。
【0057】
ステップS103において、GUI制御部22は、抽出画像テーブルを参照して、視聴者が顔画像を区別して選択できるように、顔が表示されている領域を区別するためのマーカーのグラフィックスデータを生成する。この際にマーカーは照合に適切と判断された領域A1、領域A2および領域A4のみについて生成する。
【0058】
この後、GUI制御部22は、生成したマーカーを重畳表示するフレームを指定するために、抽出画像テーブルに対応付けられたフレームIDとともにマーカーのグラフィックスデータを表示制御部25に引き渡す。表示制御部25は、受け取ったフレームIDに対応するフレームを静止画として表示部26に表示するとともに、マーカーのグラフィックスデータをこのフレームに重ねて表示する。その後ステップS104に遷移し、以降は実施の形態1の図3で説明した手順と同様である。
【0059】
図19は、本実施の形態における抽出画像領域の選択画面例である。実施の形態1と異の図10に示された符号3の領域A3は、本実施の形態においては照合に適切ではないと判断されている。その結果、図19に示すように、図10に示された符号3マーカーは表示されず、視聴者は、この画像(顔)を選択することができない。
【0060】
このように構成された番組再生装置においては、ステップS104で視聴者が検索したい顔の選択を行う場合に、照合に適切ではないと判断された領域の顔を選ぶことができないため、ステップS107において実行される抽出画像と参照画像データと照合判定においてエラーが発生することを回避できる。
【0061】
実施の形態3.
図20は、この発明の実施の形態3における番組再生装置1の構成の一形態を示すブロック構成図である。本実施の形態の番組再生装置は、実施の形態1で示した番組再生装置に対して、画像検索キー生成部16に画像検索キーデータベース15が追加されたものである。画像検索キーデータベース15は、ネットワーク等の手段で随時更新可能な特定の番組に対する出演者のリストであり、メモリーなどに保持されている。図21は、本実施の形態における画像検索キーデータベースの例である。
【0062】
実施の形態1の図3に示すフローチャートにおけるステップS105において、画像検索照合部18は、画像検索キー生成部16に対して画像検索キーの生成要求を行う。画像検索キー生成部16は番組データ抽出部14がセクションデータから抽出した番組特定情報を入手して、現在視聴中の番組を特定した上で、画像検索キーデータベース15に対して視聴中の番組の出演者名のリスト検索要求を行う。画像検索キーデータベース15は、指定された番組名をキーにして検索した当該番組の出演者リストを画像検索キー生成部16に引き渡す。この出演者リストを基に画像検索キー生成部16は出演者名の一覧から構成される画像検索キーリストを生成する。以降は実施の形態1の図3で説明した手順と同様である。
【0063】
このように構成された番組再生装置においては、画像検索キーデータベース15が特定の番組に対する出演者のリストをネットワーク等の手段で随時更新可能であるため、番組配列情報に含まれる情報よりも豊富に(例えば端役の出演者名を含むなど)画像検索キーの情報を入手できるので、より多くの出演者を特定することができる。
【符号の説明】
【0064】
1 番組再生装置
2 ネットワーク
3 画像データベース
4 情報データベース
10 チューナー/復調部
11 デスクランブル部
12 デマルチプレクス部
13 映像デコード部
14 番組データ抽出部
15 画像検索キーデータベース
16 画像検索キー生成部
17 画像抽出部
18 画像検索照合部
19 情報検索制御部
20 通信プロトコル処理部
21 ネットワーク通信部
22 GUI制御部
23 操作入力部
24 操作解析部
25 表示制御部
26 表示部
27 音声デコード部
28 音声出力部
31 上キー
32 下キー
33 左キー
34 右キー
35 決定キー
36 顔検索キー
41〜52 数字キー

【特許請求の範囲】
【請求項1】
受信した番組を再生する番組再生装置であって、
ネットワークを経由して外部のサーバーと通信する通信手段と、
前記番組の伝送ストリームを映像ストリーム、音声ストリームおよびデータセクションに分離するデマルチプレクス手段と、
前記映像ストリームをデコードして映像信号に変換する映像デコード手段と、
前記映像信号に含まれる1つのフレームから1箇所または複数の領域を切り出して画像データとして抽出する画像抽出手段と、
前記1つのフレーム内において、前記抽出した1箇所または複数の画像データの位置を明示するマーカーを生成するGUI制御手段と、
前記マーカーを前記1つのフレームに重畳して表示する表示制御手段と、
視聴者によって前記マーカーを用いて前記1箇所または複数の画像データから1つの画像データが選択される操作手段と、
前記データセクションに含まれる番組配列情報および番組特定情報を抽出する番組データ抽出手段と、
前記番組配列情報および前記番組特定情報から参照画像を検索するための画像検索キーを生成する画像検索キー生成手段と、
前記画像検索キーを用いて、前記通信手段によって前記ネットワーク経由で前記外部のサーバーから前記参照画像を取得し、前記画像データと前記参照画像とを照合する画像検索照合手段と、
前記照合結果に基づいて前記画像データの属性を示す情報検索キーを生成し、前記情報検索キーを用い前記通信手段によって前記ネットワーク経由で前記画像データに関連する情報を取得する情報検索手段とを備えることを特徴とする番組再生装置。
【請求項2】
画像抽出手段によって切り出される画像データの領域は矩形形状であり、
GUI制御手段によって生成されるマーカーは、画像データの矩形形状の領域に内接する円形形状であることを特徴とするとする請求項1に記載の番組再生装置。
【請求項3】
GUI制御手段によって生成されるマーカーは、抽出された1箇所または複数の画像データにそれぞれ個別の番号が付与されることを特徴とする請求項1または2に記載の番組再生装置。
【請求項4】
GUI制御手段によってマーカーが生成された後、
操作手段によって選択画面データが選択されるまでは、表示制御手段によって表示される1つのフレームが静止画として表示されることを特徴とするとする請求項1〜3のいずれか1項に記載の番組再生装置。
【請求項5】
画像抽出手段は、画像データの水平方向の画素数および前記画像データの垂直方向の画素数の少なくとも1方が所定の閾値以下の場合には、前記画像データが参照画像との照合に適切ではないと判定することを特徴とする請求項1〜4のいずれか1項に記載の番組再生装置。
【請求項6】
画像抽出手段は、画像データの平均輝度が所定の閾値以下の場合には、前記画像データが参照画像との照合に適切ではないと判定することを特徴とする請求項1〜4のいずれか1項に記載の番組再生装置。
【請求項7】
画像抽出手段は、画像データの水平方向の画素数、前記画像データの垂直方向の画素数の少なくとも1方が所定の閾値以下の場合、あるいは前記画像データの平均輝度が所定の閾値以下の場合には、前記画像データが参照画像との照合に適切ではないと判定することを特徴とする請求項1〜4のいずれか1項に記載の番組再生装置。
【請求項8】
画像抽出手段によって画像データが参照画像との照合に適切ではないと判断された場合、
GUI制御手段は、照合に適切ではないと判断された前記画像データに対応したマーカー表示を生成しないことを特徴とするとする請求項5〜7のいずれか1項に記載の番組再生装置。
【請求項9】
受信した番組を再生する番組再生装置であって、
ネットワークを経由して外部のサーバーと通信する通信手段と、
前記番組の伝送ストリームを映像ストリーム、音声ストリームおよびデータセクションに分離するデマルチプレクス手段と、
前記映像ストリームをデコードして映像信号に変換する映像デコード手段と、
前記映像信号に含まれる1つのフレームから1箇所または複数の領域を切り出して画像データとして抽出する画像抽出手段と、
前記1つのフレーム内において、前記抽出した1箇所または複数の画像データの位置を明示するマーカーを生成するGUI制御手段と、
前記ママーカーを前記1つのフレームに重畳して表示する表示制御手段と、
視聴者によって前記マーカーを用いて前記1箇所または複数の画像データから1つの画像データが選択される操作手段と、
前記データセクションに含まれる番組特定情報を抽出する番組データ抽出手段と、
前記番組に関する番組情報をデータベースとして保持するデータベース保持手段と、
前記データベースおよび前記番組特定情報から参照画像を検索するための画像検索キーを生成する画像検索キー生成手段と、
前記画像検索キーを用いて、前記通信手段によって前記ネットワーク経由で前記外部のサーバーから前記参照画像を取得し、前記画像データと前記参照画像とを照合する画像検索照合手段と、
前記照合結果に基づいて前記画像データの属性を示す情報検索キーを生成し、前記情報検索キーを用い前記通信手段によって前記ネットワーク経由で前記画像データに関連する情報を取得する情報検索手段とを備えることを特徴とする番組再生装置。
【請求項10】
番組を受信する受信ステップと、
受信した前記番組の伝送ストリームを映像ストリーム、音声ストリームおよびデータセクションに分離するデマルチプレクスステップと、
前記映像ストリームをデコードして映像信号に変換する映像デコードステップと、
前記映像信号に含まれる1つのフレームから1箇所または複数の領域を切り出して画像データとして抽出する画像抽出ステップと、
前記1つのフレーム内において、前記抽出した1箇所または複数の画像データの位置を明示するマーカーを生成するGUI制御ステップと、
前記マーカーを前記1つのフレームに重畳して表示する表示制御ステップと、
視聴者によって前記マーカーを用いて前記1箇所または複数の画像データから1つの選択画像データが選択される操作ステップと、
前記データセクションに含まれる番組配列情報および番組特定情報を抽出する番組データ抽出ステップと、
前記番組配列情報および前記番組特定情報から参照画像を検索するための画像検索キーを生成する画像検索キー生成ステップと、
前記画像検索キーを用いて、ネットワーク経由で外部のサーバーから前記参照画像を取得し、前記選択画像データと前記参照画像とを照合する画像検索照合ステップと、
前記照合結果に基づいて前記選択画像データの属性を示す情報検索キーを生成し、前記情報検索キーを用い前記ネットワーク経由で前記選択画像データに関連する情報を取得する情報検索ステップとを備えたことを特徴とする番組再生方法。
【請求項11】
画像抽出ステップによって切り出される画像データの領域は矩形形状であり、
GUI制御ステップによって生成されるマーカー表示は、画像データの矩形形状の領域に内接する円形形状であることを特徴とするとする請求項10に記載の番組再生方法。
【請求項12】
GUI制御ステップによって生成されるマーカーは、抽出された1箇所または複数の画像データにそれぞれ個別の番号が付与されることを特徴とする請求項10または11に記載の番組再生方法。
【請求項13】
GUI制御ステップによってマーカーが生成された後、
操作ステップによって選択画面データが選択されるまでは、表示制御ステップによって表示される1つのフレームが静止画として表示されることを特徴とするとする請求項10〜12のいずれか1項に記載の番組再生方法。
【請求項14】
画像抽出ステップは、画像データの水平方向の画素数および前記画像データの垂直方向の画素数の少なくとも1方が所定の閾値以下の場合には、前記画像データが参照画像との照合に適切ではないと判定することを特徴とする請求項10〜13のいずれか1項に記載の番組再生方法。
【請求項15】
画像抽出ステップは、画像データの平均輝度が所定の閾値以下の場合には、前記画像データが参照画像との照合に適切ではないと判定することを特徴とする請求項10〜13のいずれか1項に記載の番組再生方法。
【請求項16】
画像抽出ステップは、画像データの水平方向の画素数、前記画像データの垂直方向の画素数の少なくとも1方が所定の閾値以下の場合、あるいは前記画像データの平均輝度が所定の閾値以下の場合には、前記画像データが参照画像との照合に適切ではないと判定することを特徴とする請求項10〜13のいずれか1項に記載の番組再生方法。
【請求項17】
画像抽出ステップによって画像データが参照画像との照合に適切ではないと判断された場合、
GUI制御ステップは、照合に適切ではないと判断された前記画像データに対応したマーカーを生成しないことを特徴とするとする請求項14〜16のいずれか1項に記載の番組再生方法。
【請求項18】
番組を受信する受信ステップと、
受信した前記番組の伝送ストリームを映像ストリーム、音声ストリームおよびデータセクションに分離するデマルチプレクスステップと、
前記映像ストリームをデコードして映像信号に変換する映像デコードステップと、
前記映像信号に含まれる1つのフレームから1箇所または複数の領域を切り出して画像データとして抽出する画像抽出ステップと、
前記1つのフレーム内において、前記抽出した1箇所または複数の画像データの位置を明示するマーカーを生成するGUI制御ステップと、
前記マーカーを前記1つのフレームに重畳して表示する表示制御ステップと、
視聴者によって前記マーカーを用いて前記1箇所または複数の画像データから1つの選択画像データが選択される操作ステップと、
前記データセクションに含まれる番組特定情報を抽出する番組データ抽出ステップと、
前記番組に関する番組情報をデータベースとして保持するデータベース保持ステップと、
前記データベースおよび前記番組特定情報から参照画像を検索するための画像検索キーを生成する画像検索キー生成ステップと、
前記画像検索キーを用いて、ネットワーク経由で外部のサーバーから前記参照画像を取得し、前記選択画像データと前記参照画像とを照合する画像検索照合ステップと、
前記照合結果に基づいて前記選択画像データの属性を示す情報検索キーを生成し、前記情報検索キーを用い前記ネットワーク経由で前記選択画像データに関連する情報を取得する情報検索ステップとを備えたことを特徴とする番組再生方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate


【公開番号】特開2013−16030(P2013−16030A)
【公開日】平成25年1月24日(2013.1.24)
【国際特許分類】
【出願番号】特願2011−148395(P2011−148395)
【出願日】平成23年7月4日(2011.7.4)
【出願人】(000006013)三菱電機株式会社 (33,312)
【Fターム(参考)】