説明

静止画生成方法、静止画生成システム、静止画生成サーバおよび操作クライアント

【課題】 映像ストリームから切り出した静止画にテキストを関連付ける際に、静止画の内容を的確に示したテキストを簡単かつ迅速に作成することが可能となる。
【解決手段】本発明の静止画生成方法は、静止画生成サーバ410が、操作クライアント42が遂行する指示に応じて、コンテンツを構成する映像ストリームを切り出して静止画を抽出し、抽出した静止画に関連付けられたテキストを分割した複数のテキスト素片を操作クライアント420に表示させる。ユーザのテキスト素片の選択入力を受け付けた操作クライアント420が遂行する指示に応じて、静止画生成サーバ410はテキスト素片グループを生成して、抽出した静止画に関連付けることを特徴としている。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、映像ストリームから静止画を切り出して加工する静止画生成方法、静止画生成システム、静止画生成サーバおよび操作クライアントに関する。
【背景技術】
【0002】
近年、電子掲示板、ブログ、Web日記等サーバ型ネットワークサービスにアップロードしたり、プレゼンテーションに利用したりする目的で、ユーザが録画したテレビ番組等の映像ストリームを切り出して静止画を生成することが広く行われている。しかし、このようにして生成した静止画は、映像ストリームの一場面を示しているにすぎない。したがって、ユーザは、かかる静止画を見ただけでは、その静止画の生成元の映像ストリームの内容まで理解するのは困難である。
【0003】
そこで、かかる静止画にテキストを付加して、静止画を視認するユーザに、静止画の生成元の映像ストリームの内容等を把握させることが一般的に行われている。
【0004】
例えば、映像を所定の時間で区切り、区切った時間ごとに静止画を生成し、かかる静止画に、コンピュータキーボード、タッチパネルディスプレイ等のインターフェースを通じて、ユーザが逐一文字を入力して生成したテキスト列を付加する技術が開示されている(例えば、特許文献1)。
【0005】
また、パーソナルコンピュータ上で動作し、動画を編集可能なソフトウエアが公開されている(例えば、非特許文献1)。かかるソフトウエアでは、動画をキャプチャして静止画を生成し、かかる静止画に、パーソナルコンピュータのキーボードを通じて、ユーザが逐一文字を入力し生成したテキストを付加することができる。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特許第3496866号公報
【非特許文献1】http://www.adobe.com/jp/products/premiere/
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかし、上述した従来技術を用いて、録画したテレビ番組等の映像ストリームから生成した静止画にテキストを付加する場合、映像ストリームに適したテキストをユーザ自身が考案しなければならず、ユーザにとっては面倒な作業となっていた。
【0008】
また、ユーザは、自身が考案したテキストを、キーボードを通じて逐一入力しなければならないため、ユーザに煩雑な作業を強いていた。
【0009】
そこで本発明は、このような課題に鑑み、映像ストリームから切り出した静止画にテキストを関連付ける際に、静止画の内容を的確に示したテキストを簡単かつ迅速に作成することが可能な、静止画生成方法、静止画生成システム、静止画生成サーバおよび操作クライアントを提供することを目的としている。
【課題を解決するための手段】
【0010】
上記課題を解決するために、本発明は下記の方法、システム、および装置を提供するものである。
(1)静止画生成サーバと、前記静止画生成サーバに接続された操作クライアントとを用いた静止画生成方法であって、前記静止画生成サーバは、映像ストリームと、前記映像ストリームと時間軸で多重化されたテキスト情報とを含むコンテンツを保持し、前記映像ストリームを前記操作クライアントに送信し、前記操作クライアントは、送信された前記映像ストリームを受信してディスプレイに表示させ、ユーザ入力に応じて、前記映像ストリームの任意のポイントを指定し、前記静止画生成サーバは、保持した前記映像ストリームから、前記操作クライアントが指定した前記任意のポイントを基準とした第1の所定範囲内に位置する静止画を抽出し、保持した前記テキスト情報のうち、指定された前記任意のポイントを基準とした前記第1の所定範囲よりも広い第2の所定範囲または前記静止画を抽出したポイントを基準とした前記第2の所定範囲の前記テキスト情報であるテキスト列を抽出し、抽出した前記テキスト列を分割して複数のテキスト素片を生成し、生成した前記複数のテキスト素片を前記操作クライアントに送信し、前記操作クライアントは、送信された前記複数のテキスト素片を受信し、受信した前記複数のテキスト素片をディスプレイに表示させ、ユーザ入力に応じて、表示させた前記複数のテキスト素片のうち2以上のテキスト素片を選択し、その選択された2以上のテキスト素片を示す選択結果を前記静止画サーバに送信し、前記静止画生成サーバは、送信された前記選択結果を受信し、受信した前記選択結果に基づいて、前記選択された2以上のテキスト素片を連接してテキスト素片グループを生成し、抽出した前記静止画と、生成した前記テキスト素片グループとを関連付けることを特徴とする静止画生成方法。
(2)静止画生成サーバと、前記静止画生成サーバに接続された操作クライアントとを備える静止画生成システムであって、前記静止画生成サーバは、映像ストリームと、前記映像ストリームと時間軸で多重化されたテキスト情報とを含むコンテンツを保持するコンテンツ保持部と、前記映像ストリームを前記操作クライアントに送信するストリーム送信部と、保持された前記映像ストリームから、前記操作クライアントが指定した任意のポイントを基準とした第1の所定範囲内に位置する静止画を抽出する静止画抽出部と、保持された前記テキスト情報のうち、前記指定された任意のポイントを基準とした前記第1の所定範囲よりも広い第2の所定範囲または前記静止画抽出部が静止画を抽出したポイントを基準とした前記第2の所定範囲の前記テキスト情報であるテキスト列を抽出するテキスト抽出部と、抽出された前記テキスト列を分割して複数のテキスト素片を生成する素片生成部と、生成された前記複数のテキスト素片を前記操作クライアントに送信する素片送信部と、前記操作クライアントがユーザ入力に応じて選択し送信した、前記複数のテキスト素片のうちの2以上のテキスト素片を示す選択結果を受信する結果受信部と、受信された前記選択結果に基づいて、前記選択された2以上のテキスト素片を連接してテキスト素片グループを生成するグループ生成部と、抽出された前記静止画と、生成された前記テキスト素片グループとを関連付ける関連付部と、を備え、前記操作クライアントは、前記静止画生成サーバが送信した前記映像ストリームを受信するストリーム受信部と、ユーザ入力に応じて、前記映像ストリームの任意のポイントを指定するポイント指定部と、送信された前記複数のテキスト素片を受信する素片受信部と、受信された前記映像ストリームおよび前記複数のテキスト素片をディスプレイに表示させる表示制御部と、ユーザ入力に応じて、表示させた前記複数のテキスト素片のうち2以上のテキスト素片を選択し、その選択された2以上のテキスト素片を示す選択結果を前記静止画生成サーバに送信する結果送信部と、を備えることを特徴とする静止画生成システム。
(3)ユーザ入力を受け付ける操作クライアントに接続された静止画生成サーバであって、映像ストリームと、前記映像ストリームと時間軸で多重化されたテキスト情報とを含むコンテンツを保持するコンテンツ保持部と、前記映像ストリームを前記操作クライアントに送信するストリーム送信部と、保持された前記映像ストリームから、前記操作クライアントが指定した任意のポイントを基準とした第1の所定範囲内に位置する静止画を抽出する静止画抽出部と、保持された前記テキスト情報のうち、前記指定された任意のポイントを基準とした前記第1の所定範囲よりも広い第2の所定範囲または前記静止画抽出部が静止画を抽出したポイントを基準とした前記第2の所定範囲の前記テキスト情報であるテキスト列を抽出するテキスト抽出部と、抽出された前記テキスト列を分割して複数のテキスト素片を生成する素片生成部と、生成された前記複数のテキスト素片を前記操作クライアントに送信する素片送信部と、前記操作クライアントがユーザ入力に応じて選択し送信した、前記複数のテキスト素片のうち2以上のテキスト素片を示す選択結果を受信する結果受信部と、受信された前記選択結果に基づいて、前記選択された2以上のテキスト素片を連接してテキスト素片グループを生成するグループ生成部と、抽出された前記静止画と、生成された前記テキスト素片グループとを関連付ける関連付部と、を備えることを特徴とする静止画生成サーバ。
(4)前記コンテンツ保持部は、前記映像ストリームに関連付けられた、番組名、番組カテゴリ、番組説明、出演者、放送事業者名の群から選択される1または複数を含むメタデータも保持し、前記テキスト抽出部は、前記メタデータからもテキスト列を抽出することを特徴とする上記(3)に記載の静止画生成サーバ。
(5)前記素片生成部は、形態素でテキスト列を分割してテキスト素片を生成することを特徴とする上記(3)または(4)に記載の静止画生成サーバ。
(6)映像ストリームから静止画を生成し得る静止画生成サーバと接続された操作クライアントであって、映像ストリームを受信するストリーム受信部と、ユーザ入力に応じて、前記映像ストリームの任意のポイントを指定するポイント指定部と、前記静止画生成サーバが送信した複数のテキスト素片を受信する素片受信部と、受信された前記映像ストリームおよび前記複数のテキスト素片をディスプレイに表示させる表示制御部と、ユーザ入力に応じて、表示させた前記複数のテキスト素片のうち2以上のテキスト素片を選択し、その選択された2以上のテキスト素片を示す選択結果を前記静止画生成サーバに送信する選択結果送信部と、を備えることを特徴とする操作クライアント。
(7)前記表示制御部は、前記静止画生成サーバが抽出した複数の静止画もディスプレイに表示させ、ユーザの選択入力に応じて、表示させた前記複数の静止画のうち、1の静止画を選択する静止画選択部をさらに備え、前記選択結果送信部は、前記静止画選択部による選択結果も前記静止画生成サーバに送信することを特徴とする(6)に記載の操作クライアント。
【発明の効果】
【0011】
本発明によれば、映像ストリームから切り出した静止画にテキストを関連付ける際に、静止画の内容を的確に示したテキストを簡単かつ迅速に作成することが可能となる。
【図面の簡単な説明】
【0012】
【図1】第1の実施形態にかかる静止画生成システムの概略的な接続関係を示した説明図である。
【図2】静止画生成装置の概略的な構成を示した機能ブロック図である。
【図3】静止画抽出部による静止画の抽出を説明するための説明図である。
【図4】表示制御部が静止画をディスプレイに表示させた画面を示す図である。
【図5】素片生成部によるテキスト素片の生成を説明するための説明図である
【図6】表示制御部がテキスト素片をディスプレイに表示させた画面の例を示す図である。
【図7】表示制御部が静止画およびテキスト素片を併せて表示させた画面の例を示す図である。
【図8】グループ生成部の処理の流れの例を説明するためのフローチャートである。
【図9】関連付部が合成した静止画ファイルを表示制御部がディスプレイに表示させた例を示す図である。
【図10】第1の実施形態にかかる静止画生成方法の具体的な処理を示したフローチャートである。
【図11】第2の実施形態にかかる静止画生成システムの概略的な接続関係を示した説明図である。
【図12】第2の実施形態にかかる静止画生成サーバの概略的な構成を示した機能ブロック図である。
【図13】チャンネル情報データおよび番組情報テーブルのデータ構造の例を示す図である。
【図14】映像インデックスファイルのデータ構造の例を示す図である。
【図15】第2の実施形態にかかる操作クライアントの概略的な構成を示した機能ブロック図である。
【図16】第2の実施形態にかかる静止画生成方法の具体的な処理を示したシーケンス図である。
【図17】受信したEPGファイルに基づいてディスプレイに表示させたEPGページの例を示す図である。
【図18】プレイヤーページファイルに含まれるプラグイン起動タグの例を説明するための図である。
【図19】受信したプレイヤーページファイルに基づいてディスプレイに表示させたプレイヤーページの例を示す図である。
【図20】対話選択ページファイルであるHTMLファイルの例を説明するための説明図である。
【図21】受信した対話選択ページファイルに基づいてディスプレイに表示させた対話選択ページの例を示す図である。
【図22】対話選択ページを介したポイント指定部、静止画選択部および選択結果送信部の具体的な処理の流れを説明するためのフローチャートである。
【図23】テロップファイルを説明するための説明図である。
【図24】リダイレクトページファイルであるHTMLファイルを説明するための説明図である。
【図25】受信したリダイレクトページファイルに基づいてディスプレイに表示させたリダイレクトページの例を示す図である。
【図26】ブックマークページファイルであるHTMLファイルを説明するための説明図である。
【図27】受信したブックマークページに基づいてディスプレイに表示させたブックマークページを説明するための説明図である。
【発明を実施するための形態】
【0013】
以下に添付図面を参照しながら、本発明の好適な実施形態について詳細に説明する。かかる実施形態に示す寸法、材料、その他具体的な数値等は、発明の理解を容易とするための例示にすぎず、特に断る場合を除き、本発明を限定するものではない。なお、本明細書及び図面において、実質的に同一の機能、構成を有する要素については、同一の符号を付することにより重複説明を省略し、また本発明に直接関係のない要素は図示を省略する。
【0014】
(第1の実施形態:静止画生成システム100)
図1は、第1の実施形態にかかる静止画生成システム100の概略的な接続関係を示した説明図である。静止画生成システム100は、例えば、静止画生成装置110と、リモコン112と、ディスプレイ120とを含んで構成される。
【0015】
本実施形態において、静止画生成装置110は、リモコン112を通じて操作可能なHDD内蔵型DVDレコーダ等の記録再生装置を例に挙げて説明するが、これに限定されず、デジタルビデオカメラ、携帯電話、PHS(Personal Handy phone System)、PDA(Personal Digital Assistant)、カーナビゲーション、ゲーム機器等、映像ストリームおよびかかる映像ストリームと時間軸で多重化されたテキスト情報を取得可能な様々な電子機器を用いることが可能となる。
【0016】
上記静止画生成装置110は、放送局130から送信される放送波を受信して、時間軸で多重化された映像ストリーム、音声ストリーム、テキスト情報、およびメタデータ等で構成されるコンテンツを取得したり、静止画生成装置110に装着されたDVD、BD、メモリーカード等のリムーバブル記録媒体140からコンテンツを取得したりする。テキスト情報は、映像ストリームと時間軸で多重化された字幕ストリーム、時刻データ、その他の補足的なデータである。メタデータは、映像ストリームに関連付けられ、番組名、番組カテゴリ、番組説明、出演者、放送事業者名の群から選択される1または複数の情報を含む。
【0017】
そして、静止画生成装置110は、リモコン112等を介した、コンテンツを再生するためのユーザによる操作入力を受け付けると、取得したコンテンツを再生しディスプレイ120に表示させる。また、静止画生成装置110は、リモコン112等を介した、字幕を表示させるためのユーザによる操作入力を受け付けると、テキスト情報中の字幕ストリームを再生しディスプレイ120に表示させる。ここで、ユーザが任意のポイント(時点)を指定すると、コンテンツを構成する映像ストリームから、かかるポイント近傍に位置する静止画を抽出する(切り出す)。
【0018】
本実施形態の静止画生成装置110は、映像ストリームと時間軸で多重化されたテキスト情報を利用することで、ユーザに煩雑な操作入力を強いることなく、抽出した静止画の内容に適したテキスト列を付加することが可能となる。以下、静止画生成装置110の詳細な構成を説明する。
【0019】
(静止画生成装置110)
図2は、静止画生成装置110の概略的な構成を示した機能ブロック図である。静止画生成装置110は、中央制御部210と、HDD212と、ストリーム保持部214と、ファイル保持部216と、リモコンI/F218とを含んで構成される。
【0020】
中央制御部210は、中央処理装置(CPU)や信号処理装置(DSP:Digital Signal Processor)を含む半導体集積回路で構成され、所定のプログラムを用いて静止画生成装置110全体を管理および制御する。
【0021】
HDD212は、例えばアンテナ222を通じて中央制御部210が受信した、放送局130から送信される放送波に含まれるコンテンツを保持する。なお、HDD212は正確には装置に相当するが、説明の便宜上、本説明では記録媒体と同義として扱う。
【0022】
ストリーム保持部214は、後述するストリーム取得部230が取得したコンテンツのうち、メタデータと、その時点で再生されているポイントを基準とした所定時間分の映像ストリームおよびテキスト情報を一時的に保持する。
【0023】
ファイル保持部216は、後述する関連付部246が生成したテロップファイルを保持する。かかるファイル保持部216は、HDD212やストリーム保持部214と一体的に構成されてもよいし、別体の記録媒体で構成されてもよい。
【0024】
リモコンI/F218は、リモコン112との赤外線通信を通じてユーザによる操作入力に対応したコマンドを取得し、中央制御部210に出力する。中央制御部210は、かかるコマンドが入力されると、そのコマンドに対応した処理、例えば再生処理、録画処理等を遂行する。
【0025】
また本実施形態において、中央制御部210は、HDD212、ストリーム保持部214、ファイル保持部216や他の回路と協働して、ストリーム取得部230、ポイント指定部232、静止画抽出部234、表示制御部236、静止画選択部238、テキスト抽出部240、素片生成部242、グループ生成部244、関連付部246としても機能する。
【0026】
ストリーム取得部230は、HDD212、またはディスクドライブ220に装着されたリムーバブル記録媒体140から、コンテンツを取得したり、放送局130から送信される放送波からアンテナ222を通じてコンテンツを取得したりして再生し、後述する表示制御部236を通じて、ディスプレイ120に取得したコンテンツの再生画像を表示させる。また、ストリーム取得部230は、そのコンテンツのうち、映像ストリームと、テキスト情報と、メタデータとをストリーム保持部214に保持させる。
【0027】
ポイント指定部232は、リモコン112等へのユーザ入力に応じて、ストリーム取得部230が取得し、ストリーム保持部214が保持している映像ストリームの任意のポイントを指定する。
【0028】
本実施形態では、まず、リモコンI/F218が、リモコン112を通じた、映像ストリームを再生するためのユーザによる操作入力を受け付けると、ストリーム取得部230は、取得した映像ストリームを再生し、その再生画像を、表示制御部236を通じてディスプレイ120に表示させる。ユーザが、ディスプレイ120が表示する再生画像を視認しながら所望する切り出しタイミングでリモコン112の操作入力を行うと、リモコンI/F218は、そのユーザによる操作入力を受け付ける。そして、ポイント指定部232は、リモコンI/F218が、かかるユーザによる操作入力を受け付けた時点の映像ストリームの相対再生時刻を任意のポイント(以下、単に指定ポイントと称する)として指定する。
【0029】
静止画抽出部234は、ストリーム保持部214が保持する映像ストリームから、ポイント指定部232が指定した指定ポイント近傍に位置し、かつ抽出可能な静止画を抽出する。ここで、指定ポイント近傍とは、指定ポイントを基準とした第1の所定範囲内であり、かかる第1の所定範囲は予め設定しても、その都度ユーザ入力に応じて設定してもよい。また、コンテンツのジャンルや、放送時間長等に応じて自動的に設定されるとしてもよい。例えば、ストリーム取得部230が取得したコンテンツがMPEG2やMPEG4/AVCに準じる圧縮方式で形成されている場合、容易にデコード可能な参照ピクチャ(Iピクチャ、IDRピクチャ)のうち指定ポイントに一番近い参照ピクチャをデコードして1の静止画を抽出する。
【0030】
また、静止画抽出部234は、指定ポイント近傍に位置する静止画に加えて、指定ポイントから所定間隔離れたポイント近傍に位置する静止画を1または複数抽出することもできる。
【0031】
図3は、静止画抽出部234による複数の静止画の抽出を説明するための説明図である。
【0032】
図3(a)に示すように、本実施形態において静止画抽出部234は、ポイント指定部232が指定した指定ポイント(図3(a)中Pで示す)と、指定ポイントを基準として1秒前および2秒前(図3(a)中、それぞれP−1およびP−2で示す)と、1秒後、2秒後および3秒後(図3(a)中、それぞれP+1、P+2およびP+3で示す)と、それぞれのポイント(合計6ポイント)近傍に位置する参照ピクチャをデコードして6つの静止画を抽出する。
【0033】
ここでは、静止画抽出部234は、指定ポイントを基準として1秒間隔で、前2秒、後3秒のポイント近傍に位置する静止画も抽出しているが、これに限定されず、指定ポイントを基準として2秒間隔、3秒間隔等、任意の間隔のポイント近傍に位置する静止画を抽出してもよい。
【0034】
例えば、図3(b)に示すように、指定ポイント(図3(b)中Pで示す)を基準として前後1秒のポイント(図3(b)中、それぞれP−1およびP+1で示す)、P−1の前およびP+1後2秒のポイント(図3(b)中、それぞれP−3およびP+3で示す)等任意の間隔のポイント近傍に位置する静止画を抽出してもよい。
【0035】
このように指定ポイントのみならずその前後の静止画も併せて抽出する構成により、ユーザがポイントを指定するタイミングが、所望する映像が表示されたタイミングより遅れたとしても、遡及して所望する静止画を得ることができる。また、任意の間隔を隔てた静止画を複数表示することで動きのある映像の複数の場面(履歴)を参照でき、ユーザはその中から最適の静止画を選択することが可能となる。
【0036】
指定ポイントを基準とした複数のポイントそれぞれについて静止画を抽出する場合、例えば、指定ポイントPの場合を例に挙げると、図3(c)に示すように、静止画抽出部234は、指定ポイントPに一番近い参照ピクチャ(図3(c)中黒の塗り潰しで示したIピクチャ)をデコードして静止画を抽出する。そして、他のポイントも同様に一番近い参照ピクチャをデコードして静止画を抽出する。こうしてポイントの数だけの静止画が抽出されることとなる。
【0037】
表示制御部236は、ストリーム取得部230が取得したコンテンツの再生画像、静止画抽出部234が抽出した静止画、後述する素片生成部242が生成したテキスト素片、および最終的に生成されたテロップファイル等を適宜ディスプレイ120に表示させる。
【0038】
静止画選択部238は、静止画抽出部234が抽出した1または複数の静止画を、表示制御部236を通じてディスプレイ120に表示させ、ユーザの選択入力に応じて、その1または複数の静止画から1の静止画を選択する。
【0039】
図4は、表示制御部236が静止画をディスプレイ120に表示させた画面を示す図である。図4(a)に示すように、表示制御部236は、静止画抽出部234が抽出した6枚の静止画250(図4(a)中、250aから250fで示す)を時系列にディスプレイ120に表示させる。
【0040】
本実施形態において、静止画選択部238は、ユーザによるリモコン112の十字キー(図示せず)等への入力を受付けて、図4(a)に示すように、静止画250のフォーカス(例えば図4(a)のように静止画250外枠に縁取りを施す)を移動させる。そして、例えば、静止画250dをフォーカスさせた状態で、ユーザによるリモコン112への選択入力を受付けると、静止画選択部238は、そのときフォーカスされている静止画250dを選択する。そして、例えば、図4(b)に示すように、静止画選択部238は、選択結果である静止画250dのみを図4(a)に示した場合よりも拡大して、表示制御部236を通じてディスプレイ120に表示させる。このように、静止画選択部238を備える構成により、ユーザが所望する静止画を確実に選択することができる。
【0041】
テキスト抽出部240は、ストリーム保持部214が保持するテキスト情報のうち、静止画選択部238が選択した1の静止画を抽出したポイントを基準とした第2の所定範囲(例えば、抽出したポイントを基準とした前後20秒)のテキスト情報であるテキスト列をデコードして抽出する。本実施形態において、かかる第2の所定範囲は、静止画を抽出する際の第1の所定範囲よりも広い範囲である。
【0042】
かかる静止画250近傍に位置するテキスト情報を抽出する構成により、静止画選択部238が選択した静止画を表現するのに適したテキスト列をテキスト情報から抽出することができる。
【0043】
また、テキスト抽出部240は、ストリーム保持部214が保持するメタデータに含まれる番組名、番組カテゴリ、番組説明、出演者、放送事業者名の群から選択される1または複数のテキスト列を抽出することもできる。
【0044】
テキスト抽出部240が、映像ストリームに関連付けられたテキスト情報およびメタデータからテキスト列を抽出する構成により、映像ストリームから抽出した静止画に、より適したテキスト列を付与することができる。また、映像ストリームの提供者がテキスト情報やメタデータも提供しており、テキスト抽出部240が、その提供されたテキスト情報およびメタデータからテキスト列を抽出することで、映像ストリームの提供者の意に沿ったテキスト列を抽出することが可能となる。
【0045】
素片生成部242は、テキスト抽出部240が抽出したテキスト列を分割して1または複数のテキスト素片を生成する。本実施形態において、素片生成部242は、テキスト列を形態素で分割してテキスト素片を生成する。
【0046】
図5は、素片生成部242によるテキスト素片の生成を説明するための説明図である。例えば、図5(a)に示すように、テキスト抽出部240が抽出したテキスト列が「延長10回にもつれ込んでいます、3−3。東京、勝ち越しのチャンス。チームリーダー、太郎、世界の太郎が2点タイムリーヒット!やってくれました!太郎」であったとする。この場合、素片生成部242は、テキスト列を形態素で分割し、「延長」「10」「回」「にもつれ」「込んで」「います」「、」「3−3」「。」「東京」「、」「勝ち越し」「の」「チャンス」「。」「チームリーダー」「、」「太郎」「、」「世界」「の」「太郎」「が」「2」「点」「タイムリーヒット」「!」「やってくれました」「!」「太郎」のそれぞれのテキスト素片を生成する。
【0047】
本実施形態において、素片生成部242は、テキスト列を形態素で分割してテキスト素片を生成するが、これに限定されず、漢字、ひらがな、カタカナ、英字、数字等の文字種が変更された箇所でテキスト列を分割したり、字幕パケット単位でテキスト列を分割したりすることもできる。
【0048】
グループ生成部244は、ユーザの選択入力に応じて、表示制御部236がディスプレイ120に表示させたテキスト素片のうち1または複数を選択し、選択したテキスト素片を連接してテキスト素片グループを生成する。本実施形態においてグループ生成部244は、FIFOバッファ(図示せず)を用いて、ユーザの選択入力に応じて選択された順にテキスト素片を連接してテキスト素片グループを生成する。
【0049】
図6は、表示制御部236がテキスト素片をディスプレイ120に表示させた画面の例を示す図である。
【0050】
図6(a)に示すように、ディスプレイ120には、静止画選択部238が選択した静止画250dと、ビットマップフォントで示したテキスト素片252が表示される。また、本実施形態において、表示制御部236は、中央制御部210による制御に応じて、それぞれのテキスト素片252が表示されるディスプレイ120上の位置の近傍にそれぞれのテキスト素片に対応した対話選択可能なチェックボックス254を表示させる。
【0051】
本実施形態において、グループ生成部244は、例えば、図6(a)に示すように、ユーザによるリモコン112の十字キー(図示せず)等への入力を受けて、ビットマップフォントで示したテキスト素片252aのフォーカス(例えば図6(a)のように縁取り256を施す)を移動させる。そして、例えば図6(b)に示すように、ビットマップフォントで示したテキスト素片252bをフォーカスさせた状態で、ユーザによるリモコン112への選択入力を受けると、グループ生成部244は、ビットマップフォントで示したテキスト素片252bに対応したテキスト素片を選択するとともに、選択したテキスト素片に対応したチェックボックス254にチェック(図6(b)中、黒の塗り潰しで示す)を入れた画面をディスプレイ120に表示させる。そしてユーザによるリモコン112の決定キー(図示せず)等への決定入力を受け付けて、グループ生成部244は、テキスト素片グループを生成する。
【0052】
本実施形態において、グループ生成部244は、ユーザの選択入力に応じて選択された順にテキスト素片を連接してテキスト素片グループを生成する。ここで例えば、ユーザの選択入力に応じてテキスト素片が「やってくれました」、「!」、「太郎」、「、」、「タイムリーヒット」、「!」の順で選択された場合、かかる順番でテキスト素片を連接してテキスト素片グループ「やってくれました!太郎、タイムリーヒット!」を生成する。
【0053】
このように、テキスト抽出部240が、映像ストリームに関連付けられたテキスト情報やメタデータからテキスト列を抽出し、抽出されたテキスト列を素片生成部242が分割してテキスト素片を生成し、グループ生成部244が、ユーザ入力に応じて、生成したテキスト素片を連接してテキスト素片グループを生成する。
【0054】
したがって、コンピュータのキーボードで逐一文字を入力せずとも、ユーザは、簡単な選択入力を行うだけで、その静止画の内容に適したテキスト素片グループを生成することができる。
【0055】
なお、本実施形態において、表示制御部236は、素片生成部242が生成したテキスト素片を表示させるが、これに限定されず、中央制御部210の指示に応じて、例えば、「て」、「に」、「を」、「は」等の助詞を含む任意の文字をビットマップフォントで表示させるとともに、それぞれの文字が表示されるディスプレイ120上の位置の近傍にそれぞれの文字に対応した対話選択可能なチェックボックスをディスプレイ120に表示させてもよい。
【0056】
これにより、テキスト素片グループを生成する上で重要となる名詞、動詞、形容詞等のテキスト素片の選択範囲を制限しつつも、テキスト素片の選択の自由度を向上させることができ、より的確にテキスト素片グループを生成することが可能となる。
【0057】
また、本実施形態において上述したテキスト抽出部240は、静止画選択部238が選択した1の参照ピクチャを抽出したポイントを基準としてテキスト列を抽出しているが、ユーザ入力に応じてポイント指定部232が指定した指定ポイントを基準としてテキスト列を抽出してもよい。またテキスト抽出部240は、静止画抽出部234が複数の静止画を抽出する場合、静止画を抽出したすべてのポイントを基準とした広い範囲でテキスト列を抽出してもよい。
【0058】
図7は、静止画抽出部234が複数の静止画を抽出する場合、静止画を抽出したすべてのポイントを基準としてテキスト抽出部240がテキスト列を抽出した場合に、表示制御部236が静止画およびテキスト素片を併せて表示させた画面の例を示す図である。
【0059】
図7に示す例では、表示制御部236は、中央制御部210の指示に応じて、静止画抽出部234が抽出した複数(ここでは6枚)の静止画250と、それぞれの静止画250が表示されるディスプレイ120上の位置の近傍にそれぞれの静止画に対応したラジオボタン258を表示させる。また、表示制御部236は、ビットマップフォントで示したテキスト素片252と、それぞれのビットマップフォントで示したテキスト素片252が表示されるディスプレイ120上の位置の近傍にそれぞれのテキスト素片に対応した対話選択可能なチェックボックス254をディスプレイ120に表示させる。
【0060】
ここでテキスト抽出部240は、静止画抽出部234が複数の静止画を抽出したポイントすべてを基準としてテキスト列を抽出している。したがって、図6に示した静止画選択部238が選択した1の静止画を抽出したポイントを基準としてテキスト列を抽出する場合と比較して、テキスト列を抽出する総時間が長くなるため、図6に示す例よりも多くの単語数を抽出することになる。
【0061】
図7に示すように、表示制御部236は、静止画抽出部234が抽出した複数の静止画と、かかる複数の静止画を抽出したすべてのポイントを基準として抽出したテキスト列から生成したテキスト素片とをディスプレイ120に表示させる。したがって、図7に示す画面を通じて、静止画選択部238の静止画の選択と、グループ生成部244のテキスト素片グループの生成とを並行して遂行することができる。また、グループ生成部244がテキスト素片グループを生成する上で、選択肢が増えるため静止画の内容をより的確に示したテキスト列を簡単かつ迅速に作成することが可能となる。
【0062】
図8は、グループ生成部244の処理の流れの例を説明するためのフローチャートである。図8に示すように、本実施形態において、まず、グループ生成部244は、素片生成部242が生成したI個分のテキスト素片を取得し(S270)、取得した順にテキスト素片配列word[n](nは整数)に格納する(S272)。したがって、word[1]からword[I]までの配列が生成される。そして、表示制御部236は、I個分のテキスト素片word[n]をnが示す順にディスプレイ120に表示させる(S274)。また、テキスト素片グループの生成に用いるFIFOバッファをクリアしておく(S276)。
【0063】
そして、リモコン112を通じたユーザ入力を受け付けると(S278のYES)、かかるユーザ入力がテキスト素片word[n]を選択したものか否かを判定する(S280)。テキスト素片word[n]を選択したものであると判定された場合、すなわち、テキスト素片の番号nが特定された場合(S280のYES)、選択されたテキスト素片word[n]をFIFOバッファに投入し(S282)、ユーザ入力受付ステップS278へ戻る。
【0064】
入力判定ステップS280で、テキスト素片word[n]を選択したものでないと判定された場合(S280のNO)、ユーザ入力受付ステップS278において受け付けた入力が対話入力の結果のオールクリアであるか否かを判定する(S284)。
【0065】
オールクリアである場合(S284のYES)、FIFOクリアステップS276へ戻り、オールクリアでない場合(S284のNO)、ユーザ入力受付ステップS278において受け付けた入力が対話入力の結果の決定入力であるか否か判定する(S286)。
【0066】
そして、決定入力でない場合(S286のNO)、ユーザ入力受付ステップS278へ戻り、決定入力である場合(S286のYES)、グループ生成部244は、FIFOバッファに蓄積されたテキスト素片をすべて読み出し、連接してテキスト素片グループを生成する(S288)。
【0067】
関連付部246は、静止画選択部238が選択した静止画と、グループ生成部244が生成したテキスト素片グループとを関連付ける。本実施形態において、関連付部246は、静止画選択部238が選択した静止画と、グループ生成部244が生成したテキスト素片グループとを合成したテロップファイルを生成する。
【0068】
図9は、関連付部246が合成したテロップファイルを表示制御部236がディスプレイ120に表示させた例を示す図である。ここで、関連付部246は、図9に示すように、静止画選択部238が選択した静止画の上部に、グループ生成部244が生成したテキスト素片グループを重畳させたテロップファイルを生成する。
【0069】
以上説明したように、本実施形態にかかる静止画生成装置110によれば、静止画の抽出元である映像ストリームに関連付けられたテキスト情報やメタデータからテキスト列を抽出する。そして静止画生成装置110は、抽出したテキスト列を分割したテキスト素片を生成し、ユーザの選択入力に応じて、かかるテキスト素片を選択してテキスト素片グループを生成する。したがって、静止画の内容に適したテキスト列のうちユーザが所望するテキスト素片のみを選択してテキスト素片グループを生成することが可能となる。
【0070】
上述した構成により、パーソナルコンピュータのキーボードを用いて逐一文字を入力せずとも、ディスプレイ120に表示された画面を視認しながら、ユーザがリモコン112等を通じてテキスト素片を選択するだけで、静止画の内容を的確に示し、かつユーザが所望するテキスト素片グループを容易に静止画に関連付けることができる。
【0071】
(静止画生成方法)
また、上述した静止画生成装置110を用いて、静止画の内容を的確に示したテキスト素片グループを容易かつ迅速に生成し、静止画に関連付けることができる静止画生成方法も提供される。
【0072】
図10は、第1の実施形態にかかる静止画生成方法の具体的な処理を示したフローチャートである。
【0073】
まず、ストリーム取得部230が、映像ストリームと、映像ストリームと時間軸で多重化されたテキスト情報と、メタデータを含むコンテンツを取得する(S300)。そして、取得した映像ストリームを再生し、ポイント指定部232が、ユーザ入力に応じて、映像ストリームの指定ポイントを指定する(S302)。
【0074】
静止画抽出部234は、ストリーム取得ステップS300において取得した映像ストリームから、ポイント指定ステップS302において指定された指定ポイント近傍に位置する静止画を抽出する(S304)。
【0075】
また、テキスト抽出部240は、ストリーム取得ステップS300において取得したテキスト情報から、ポイント指定ステップS302において指定された指定ポイントを基準として、または静止画抽出ステップS304において静止画を抽出したポイントを基準としてテキスト列を抽出する(S306)。
【0076】
そして、素片生成部242は、テキスト列抽出ステップS306において抽出したテキスト列を分割して1または複数のテキスト素片を生成し(S308)、表示制御部236は、生成したテキスト素片をディスプレイ120に表示させる(S310)。
【0077】
グループ生成部244は、ユーザの選択入力に応じて、表示ステップS310において表示させたテキスト素片のうち1または複数を選択し、選択したテキスト素片を連接してテキスト素片グループを生成する(S312)。そして、関連付部246は、静止画抽出ステップS304において抽出した静止画と、グループ生成ステップS312において生成したテキスト素片グループとを関連付け、特に本実施形態では抽出した静止画とテキスト素片グループとを合成し、テロップファイルを生成する(S314)。
【0078】
以上説明したように、本実施形態にかかる静止画生成方法においても、パーソナルコンピュータのキーボードを用いて逐一文字を入力せずとも、ディスプレイ120に表示された画面を視認しながら、ユーザがリモコン112等を通じてテキスト素片を選択するだけで、静止画の内容を的確に示し、かつユーザが所望するテキスト素片グループを容易に静止画に関連付けることが可能となる。
【0079】
(第2の実施形態:静止画生成システム400)
図11は、第2の実施形態にかかる静止画生成システム400の概略的な接続関係を示した説明図である。静止画生成システム400は、静止画生成サーバ410と、インターネット、ISDN(Integrated Services Digital Network)回線、専用回線等で構成される通信網150と、通信網150を通じて静止画生成サーバ410に接続された操作クライアント420とを含んで構成される。
【0080】
本実施形態において、静止画生成サーバ410は、HDD内蔵型DVDレコーダ等の記録再生装置を例に挙げて説明するが、これに限定されず、パーソナルコンピュータ、デジタルビデオカメラ、携帯電話、PHS、PDA、カーナビゲーション、ゲーム機器等映像ストリームおよびかかる映像ストリームと時間軸で多重化されたテキスト情報を取得でき、操作クライアント420と接続可能な様々な電子機器を用いることが可能となる。
【0081】
また、本実施形態において操作クライアント420は、パーソナルコンピュータを例に挙げて説明するが、これに限定されず、HDD内蔵型DVDレコーダ等の記録再生装置、デジタルビデオカメラ、携帯電話、PHS、PDA、カーナビゲーション、ゲーム機器等、ユーザ入力を受け付け可能であり、ディスプレイ120と接続し得るまたはディスプレイを一体的に備える様々な電子機器を用いることができる。
【0082】
図11に示すように、静止画生成サーバ410は、例えば、放送局130から送信される放送波(ここでは特にデジタル放送波)を受信して、時間軸で多重化された映像ストリーム、音声ストリーム、テキスト情報およびメタデータで構成されるコンテンツを取得したり、静止画生成サーバ410に装着されたDVD、BD、メモリーカード等のリムーバブル記録媒体140からコンテンツを取得したりする。
【0083】
本実施形態において静止画生成サーバ410は、操作クライアント420を通じたユーザの指示に応じて、コンテンツを構成する映像ストリームを切り出して静止画を抽出する。静止画生成サーバ410は、抽出した静止画に関連付けられたテキスト列を分割したテキスト素片を操作クライアント420に表示させる。その後、操作クライアント420が受け付けたユーザによる選択入力に応じて、静止画生成サーバ410はテキスト素片グループを生成して、抽出した静止画にそのテキスト素片グループを関連付ける。
【0084】
したがって、映像ストリームから切り出した静止画にテキストを関連付ける際に、静止画の内容を的確に示したテキスト列を簡単かつ迅速に作成することが可能となる。
【0085】
以下、まず、静止画生成システム400を構成する静止画生成サーバ410および操作クライアント420の個々の構成を説明し、次いで静止画生成サーバ410および操作クライアント420を用いた静止画生成方法について説明する。
【0086】
(静止画生成サーバ410)
図12は、第2の実施形態にかかる静止画生成サーバ410の概略的な構成を示した機能ブロック図である。図12に示すように、静止画生成サーバ410は、サーバ制御部510と、コンテンツ保持部として機能するHDD512と、ファイル保持部514と、サーバ通信部516と、ディスクドライブ220とを含んで構成される。なお、上述した第1の実施形態の静止画生成装置110と実質的に等しい構成要素については、同一の符号を付して説明を省略する。
【0087】
サーバ制御部510は、中央処理装置(CPU)や信号処理装置(DSP)を含む半導体集積回路で構成され、所定のプログラムを用いて静止画生成サーバ410全体を管理および制御する。
【0088】
HDD512は、サーバ制御部510の制御に応じて、例えばアンテナ222を通じて受信した、放送局130から送信される放送波に含まれる映像ストリーム、テキスト情報、音声ストリーム、メタデータ等で構成されるコンテンツや電子番組表(Electronic Program Guide、以下、単にEPGと称する)を生成するためのチャンネル情報データおよび番組情報テーブル等を保持する。なお、HDD512は正確には装置に相当するが、説明の便宜上本説明では記録媒体と同義として扱う。
【0089】
図13は、チャンネル情報データおよび番組情報テーブルのデータ構造の例を示す図である。図13(a)に示すように、チャンネル情報データでは、Provider Name(放送事業者名)と、ChannelID(デジタル放送の物理チャンネル番号)とが関連付けられている。なお、Provider NameおよびChannelIDは、コンテンツとともに放送されるPSI/SIのうちのSDT(Service Description Table)を解析することで取得することができる。
【0090】
図13(b)に示すように、番組情報テーブルでは、EventIDと、StartTimeと、Durationと、EventNameと、EventDescと、ChannelIDとが関連付けられている。ここで、EventIDは、放送事業者によって番組ごとに付与されたIDである。StartTimeは、放送開始時刻を示す。Durationは、放送期間であり、番組の時間的な長さを示す。EventNameは、番組タイトル(番組名)を、EventDescは、番組説明をそれぞれ示す。EventID、StartTime、Duration、EventName、EventDesc、ChannelIDは、コンテンツとともに放送されるPSI/SIのEIT(Event Information Table)を解析することで取得することができる。後述するEPGページ生成部530は、かかるチャンネル情報データおよび番組情報テーブルを用いてEPGページファイルを生成する。なおEPGページファイルについては、後述する静止画生成方法において詳述する。
【0091】
本実施形態において、HDD512が保持するコンテンツは、放送局130から送信されたコンテンツを例に挙げて説明し、かかるコンテンツはISO/IEC 13818 MPEG2Systemsに準拠しているものとする。また、映像ストリーム、音声ストリーム、およびテキスト情報の符号化方式は、ARIB−STD−24第1編 データ符号化方式に、メタデータの構成は、ARIB−TR−B14第3編 データ放送運用規定およびARIB−TR−B14第4編 PSI/SI運用規定に準拠するものとする。
【0092】
本実施形態にかかる映像ストリームは、アンテナ222を通じて放送波を受信した際に、命名規則として「YYMMDDhh_nn.ts」のファイル名が付されてHDD512内の階層型ディレクトリファイルに保持される。ここで「YY」は受信年の下2桁を、「MM」は受信月を、「DD」は受信日を、「hh」は受信時を、「nn」は受信チャンネル番号を示す。例えば、「2009年3月26日 8時30分から9時55分までデジタル放送の物理チャンネル21で放映された番組」の映像ストリームは、「09032608_21.ts」と「09032609_21.ts」と2つの映像ストリーム(以下、映像ストリームファイルとも称することがある)に分割してHDD512に保持される。
【0093】
また、映像ストリームファイルには、ランダムアクセス用のインデックスフィルである映像インデックスファイルが関連付けられている。かかる映像インデックスファイルは、命名規則として「YYMMDDhh_nn.idx」のファイル名が付されてHDD512に保持される。
【0094】
図14は、映像インデックスファイルのデータ構造の例を示す図である。図14に示すように、映像インデックスファイルは、1つの映像ストリームファイル内の放映時刻と、映像ストリームファイル先頭からのバイトオフセット(相対バイト)を関連付けて数秒間隔で書き込んだものである。したがって、ストリーム送信部532は、任意の再生区間の映像ストリームを容易に取得することができる。なお、放映時刻は、コンテンツとともに放送されるPSI/SIのTOT(Time Offset Table)を解析することで取得することができる。
【0095】
本実施形態において、コンテンツ保持部としてHDD512を例に挙げて説明するが、これに限定されず、ディスクドライブ220に装着されたリムーバブル記録媒体140、フラッシュメモリ等さまざまな記録媒体をコンテンツ保持部として用いることができる。
【0096】
ファイル保持部514は、後述する関連付部542が生成したテロップファイルを保持する。かかるファイル保持部514は、HDD512と一体的に構成されてもよいし、別体の記録媒体で構成されてもよい。
【0097】
サーバ通信部516は、無線または有線で通信網150と接続し、操作クライアント420や、コンテンツ提供サーバ(図示せず)等の通信網150に接続された様々な装置と通信を行う。
【0098】
また本実施形態において、サーバ通信部516は、後述する素片生成部538が生成したテキスト素片を操作クライアント420に送信する素片送信部としても機能する。ここでサーバ通信部516は、テキスト素片の代わりに、素片生成部538がテキスト素片を用いて生成した対話選択ページファイルを操作クライアント420に送信してもよい。
【0099】
さらに本実施形態において、サーバ通信部516は、操作クライアント420がユーザ入力に応じて選択し送信したテキスト素片を示す選択結果を受信する結果受信部としても機能する。ここでサーバ通信部516は、操作クライアント420が送信したグループ生成リンク情報を受信することで、テキスト素片を示す選択結果を受信する。なお対話選択ページファイルおよびグループ生成リンク情報については、後述する静止画生成方法において詳述する。
【0100】
また本実施形態において、サーバ制御部510は、HDD512、ファイル保持部514や他の回路と協働して、EPGページ生成部530、ストリーム送信部532、静止画抽出部534、テキスト抽出部536、素片生成部538、グループ生成部540、関連付部542としても機能する。
【0101】
EPGページ生成部530は、操作クライアント420が送信したEPGページ取得要求であるEPGページリンク情報をサーバ通信部516が受信すると、HDD512に保持された、チャンネル情報データおよび番組情報テーブル(図13参照)を用いてEPGページファイルを生成する。なおEPGページリンク情報については、後述する静止画生成方法において詳述する。
【0102】
ストリーム送信部532は、操作クライアント420が送信したストリーム取得要求をサーバ通信部516が受信すると、かかるストリーム取得要求に基づいた映像ストリームを、HDD512から抽出し、サーバ通信部516を通じて、操作クライアント420に送信する。ここでストリーム送信部532は、操作クライアント420に、少なくとも映像ストリームを送信するが、コンテンツの他の要素、例えば、テキスト情報(字幕ストリーム)を併せて送信してもよい。
【0103】
本実施形態においてストリーム送信部532は、操作クライアント420が送信したプレイヤーページリンク情報をサーバ通信部516が受信すると、かかるプレイヤーページリンク情報に基づいた映像ストリームを、HDD512から抽出し、抽出した映像ストリームを関連付けたプレイヤーページファイルを送信する。そして、操作クライアント420が送信した映像ストリームを再生するためのユーザによる再生入力に応じた指示情報を受信すると、映像ストリームを操作クライアント420に送信する。なおプレイヤーページリンク情報およびプレイヤーページファイルについては、後述する静止画生成方法において詳述する。
【0104】
静止画抽出部534は、操作クライアント420から送信された指定ポイントをサーバ通信部516が受信すると、HDD512が保持する映像ストリームから、指定ポイント近傍に位置する静止画を抽出する。本実施形態において静止画抽出部534は、指定ポイント近傍に位置する静止画に加えて、指定ポイントから所定間隔離れたポイント近傍に位置する静止画も抽出する。静止画抽出部534が映像ストリームから静止画を抽出する構成については、上述した第1の実施形態にかかる静止画抽出部234の構成と同様であるため、説明を省略する。
【0105】
具体的に、本実施形態において静止画抽出部534は、サーバ通信部516が指定ポイントを示す指定ポイントリンク情報を受信すると、HDD512が保持する映像ストリームから、かかる指定ポイントリンク情報に示された指定ポイント基づいて、指定ポイント近傍に位置する静止画を抽出する。指定ポイントリンク情報については後述する静止画生成方法において詳述する。
【0106】
静止画抽出部534が抽出した静止画は、一時的にファイル保持部514が保持する。この際、静止画は、命名規則「YY_MM_DD_hh_mm_ss_nn.jpg」を用いたファイル名を有するJPEG符号化ファイルとしてファイル保持部514に保持される。ここで、「YY」は、映像ストリームを抽出したポイントの西暦下2桁を、「MM」、「DD」、「hh」、「mm」、「ss」は、それぞれ抽出したポイントの月、日、時、分、秒を、「nn」は、チャンネル番号を示す変数である。
【0107】
静止画抽出部534が、指定ポイントのみならずその前後の静止画も併せて抽出する構成により、ユーザがポイントを指定するタイミングが、所望する映像が表示されたタイミングより遅れたとしても、遡及して所望する静止画を得ることができる。また、任意の間隔を隔てた静止画を複数表示することで動きのある映像の複数の場面(履歴)を参照でき、ユーザはその中から最適の静止画を選択することが可能となる。
【0108】
テキスト抽出部536は、HDD512が保持したテキスト情報のうち、指定ポイントを基準とした第2の所定範囲または静止画抽出部534が静止画を抽出したポイントを基準とした第2の所定範囲のテキスト情報であるテキスト列を抽出する。またテキスト抽出部536は、HDD512が保持するメタデータに含まれる番組名、番組カテゴリ、番組説明、出演者、放送事業者名の群から選択される1または複数のテキスト列を抽出することもできる。テキスト抽出部536がテキスト情報およびメタデータからテキスト列を抽出する構成については、上述した第1の実施形態にかかるテキスト抽出部240の構成と同様であるため、説明を省略する。
【0109】
具体的に、本実施形態においてテキスト抽出部536は、サーバ通信部516が指定ポイントリンク情報を受信すると、かかる指定ポイントリンク情報に示された指定ポイント基づいて、HDD512が保持するテキスト情報およびメタデータからテキスト列を抽出する。
【0110】
テキスト抽出部536が、映像ストリームに関連付けられたテキスト情報およびメタデータからテキスト列を抽出する構成により、映像ストリームから抽出した静止画に、より適したテキスト列を付与することができる。また、映像ストリームの提供者がテキスト情報やメタデータも提供しており、テキスト抽出部536が、その提供されたテキスト情報およびメタデータからテキスト列を抽出することで、映像ストリームの提供者の意に沿ったテキスト列を抽出することが可能となる。
【0111】
テキスト抽出部536が抽出したテキスト列は、一時的にファイル保持部514が保持する。この際、テキスト列は、命名規則「YY_MM_DD_hh_mm_ss_nn.html」を用いたファイル名を有するHTML(Hyper Text Markup Language)ファイルとして保持される。ここで、「YY」は、映像ストリームを抽出したポイントの西暦下2桁を、「MM」、「DD」、「hh」、「mm」、「ss」は、それぞれ抽出したポイントの月、日、時、分、秒を、「nn」は、チャンネル番号を示す変数である。
【0112】
素片生成部538は、テキスト抽出部536が抽出し、ファイル保持部514に一時的に保持されたテキスト列を分割して1または複数のテキスト素片を生成する。素片生成部538がテキスト列を分割してテキスト素片を生成する構成については、上述した第1の実施形態にかかる素片生成部242の構成と同様であるため、説明を省略する。
【0113】
本実施形態において、素片生成部538は、生成したテキスト素片を用いて、後述する図20に示す対話選択ページファイルを生成する。
【0114】
グループ生成部540は、サーバ通信部516が受信した、上記対話選択ページファイルに基づいて表示された対話選択ページを通じて操作クライアント420がユーザ入力に応じて選択し送信した、1または複数のテキスト素片を示す選択結果に基づいて、選択されたテキスト素片を連接してテキスト素片グループを生成する。グループ生成部540がテキスト素片を連接してテキスト素片グループを生成する構成については、上述した第1の実施形態にかかるグループ生成部244の構成と同様であるため、説明を省略する。
【0115】
本実施形態において、グループ生成部540は、操作クライアント420が送信したグループ生成リンク情報に基づいて、テキスト素片グループを生成する。なおグループ生成リンク情報については、後述する静止画生成方法において詳述する。
【0116】
関連付部542は、静止画抽出部534が抽出した静止画と、グループ生成部540が生成したテキスト素片グループを関連付ける。
【0117】
具体的に、本実施形態において関連付部542は、操作クライアント420が送信したグループ生成リンク情報に含まれる画像リンク情報に基づいて指定されるファイル保持部514に保持された静止画と、グループ生成部540が生成したテキスト素片グループとを関連付ける。ここで関連付部542は、画像リンク情報と、生成されたテキスト素片グループと、イベント識別子dvidと、HDD512が保持するメタデータから番組名とを取得し、テロップファイルを生成し、ファイル保持部514に保持させる。なおテロップファイルについては、後述する静止画生成方法において詳述する。
【0118】
また、本実施形態において、関連付部542は、指定ポイントごとに1つのテロップファイルを生成する。関連付部542は、このようにして生成された複数のテロップファイルをさらに連接してHTMLファイルに必要なタグを付加したものをブックマークページファイルとして生成する。
【0119】
そして関連付部542は、ブックマークリンク情報を含み、自体にリダイレクト(誘導)するリダイレクトページファイルを生成し、サーバ通信部516を通じて、操作クライアント420に送信する。
【0120】
さらに関連付部542は、サーバ通信部516を通じて、操作クライアント420が送信したブックマークリンク情報を受信すると、ブックマークページファイルを生成し、生成したブックマークページファイルを操作クライアント420へ送信する。なお、リダイレクトページファイル、ブックマークページファイルおよびブックマークリンク情報については、後述する静止画生成方法において詳述する。
【0121】
(操作クライアント420)
図15は、第2の実施形態にかかる操作クライアント420の概略的な構成を示した機能ブロック図である。図15に示すように、操作クライアント420は、装置制御部560と、装置メモリ562と、操作部564と、装置通信部566とを含んで構成される。なお、上述した第1の実施形態の静止画生成装置110と実質的に等しい構成要素については、同一の符号を付して説明を省略する。
【0122】
装置制御部560は、中央処理装置(CPU)や信号処理装置(DSP)を含む半導体集積回路で構成され、所定のプログラムを用いて操作クライアント420全体を管理および制御する。
【0123】
装置メモリ562は、後述する装置通信部566が受信した、上述した静止画生成サーバ410が送信したEPGページファイル、プレイヤーページファイル、対話選択ページファイル、リダイレクトページファイル、ブックマークページファイルを一時的に保持する。
【0124】
操作部564は、ユーザ入力を受け付けるインターフェースであり、キーボード、マウス、十字キー、ジョイスティック等で構成される。
【0125】
装置通信部566は、無線または有線で通信網150と接続し、静止画生成サーバ410と通信を行う。本実施形態において、装置通信部566は、静止画生成サーバ410が送信した映像ストリームを受信するストリーム受信部、テキスト素片を受信する素片受信部としても機能する。ここでは、装置通信部566は、静止画生成サーバ410が送信したテキスト素片を含む対話選択ページファイルを受信する。また、装置通信部566(ストリーム受信部)は、映像ストリームを静止画生成サーバ410から受信する際、コンテンツの他の要素、例えば、音声ストリーム、テキスト情報(字幕ストリーム)、メタデータを併せて受信してもよい。
【0126】
装置通信部566は、上述した静止画生成サーバ410が送信したEPGページファイル、プレイヤーページファイル、リダイレクトページファイル、ブックマークページファイルを受信する。
【0127】
また本実施形態において、装置制御部560は、装置メモリ562や、他の回路と協働して、EPG取得部570、表示制御部572、ストリーム選択部574、ストリーム再生制御部576、ポイント指定部578、静止画選択部580、選択結果送信部582としても機能する。
【0128】
EPG取得部570は、操作部564を通じて、EPGページを表示させるためのユーザによる操作入力を受け付けると、EPGページリンク情報を生成し、装置通信部566を通じて、静止画生成サーバ410へ送信する。そして上述したように、静止画生成サーバ410は、受信したEPGページリンク情報のレスポンスとしてEPGページファイルを操作クライアント420に送信する。
【0129】
表示制御部572は、EPG取得部570が送信したEPGページリンク情報に応じて静止画生成サーバ410から送信されたEPGページファイルの他、装置通信部566が受信し、装置メモリ562が保持しているプレイヤーページファイル、対話選択ページファイル、リダイレクトページファイル、ブックマークページファイルを、Webブラウザを用いて、ユーザが視認しやすい形でレンダリングしディスプレイ120に表示させる。また、本実施形態において表示制御部572は、静止画生成サーバ410が送信したレスポンスのHTMLファイルに含まれるタグを解釈することで、後述するストリーム再生制御部576を起動する。
【0130】
なお、本実施形態において、表示制御部572は、対話選択ページファイルをそのままレンダリングした対話選択ページをディスプレイ120に表示させるが、これに限定されず、装置制御部560の指示に応じて、対話選択ページに、例えば、「て」、「に」、「を」、「は」等の助詞をビットマップフォントで表示させるとともに、それぞれの助詞が表示されるディスプレイ120上の位置の近傍にそれぞれの助詞に対応した対話選択可能なチェックボックスを表示させてもよい。
【0131】
これにより、テキスト素片グループを生成する上で重要となる名詞、動詞、形容詞等のテキスト素片の選択範囲を制限しつつも、テキスト素片の選択の自由度を向上させることができ、より的確に静止画生成サーバ410にテキスト素片グループを生成させることが可能となる。
【0132】
ストリーム選択部574は、EPGページファイルに含まれる複数のプレイヤーページリンク情報から任意のプレイヤーページリンク情報が選択されたことを示す選択入力を受け付けると、選択されたプレイヤーページリンク情報を、装置通信部566を通じて、静止画生成サーバ410へ送信する。そして上述したように、静止画生成サーバ410は、受信したプレイヤーページリンク情報のレスポンスとしてプレイヤーページファイルを操作クライアント420に送信する。
【0133】
ストリーム再生制御部576は、表示制御部572によってディスプレイ120に表示させたプレイヤーページ内の「再生・停止・早送り・巻き戻し」ボタンのうちのいずれか1つが選択されたら、そのボタンに対応する再生入力を操作部564を通じて受け付け、静止画生成サーバ410へ、その再生入力に対応した指示情報を送信する。その後、その指示情報に対応して静止画生成サーバ410から送信される映像ストリームを装置通信部566が受信する。そしてストリーム再生制御部576は、受信された映像ストリームを、表示制御部572によってデコード処理させ、ディスプレイ120に表示させる。
【0134】
本実施形態において、ストリーム再生制御部576は、装置通信部566が受信したプレイヤーページファイルに含まれるプラグイン起動タグを装置制御部560が解釈することに基づいて起動する。なおプラグイン起動タグについては、後述する静止画生成方法において詳述する。
【0135】
ポイント指定部578は、ユーザ入力に応じて、ストリーム再生制御部576が表示制御部572によってディスプレイ120に表示させた映像ストリームの指定ポイントを指定する。本実施形態では、ユーザがディスプレイ120を視認しながら所望する切り出しタイミングで操作部564を通じた操作入力を行うと、ポイント指定部578は、かかる操作入力を受け付けた時点の映像ストリームの相対再生時刻を指定ポイントとして指定する。
【0136】
本実施形態においてポイント指定部578は、指定ポイントを指定するためのユーザ入力を受け付けると、その指定ポイントに基づいて指定ポイントリンク情報を生成し、装置通信部566を通じて、静止画生成サーバ410へ送信する。そして上述したように、静止画生成サーバ410は、受信した指定ポイントリンク情報のレスポンスとして対話選択ページファイルを操作クライアント420に送信する。なお指定ポイントリンク情報については、後述する静止画生成方法において詳述する。
【0137】
静止画選択部580は、静止画抽出部534が複数の静止画を抽出した場合、操作部564を通じた、ユーザの選択入力に応じて、表示制御部572がディスプレイ120に表示させた複数の静止画のうち、1の静止画を選択する。本実施形態において、静止画選択部580は、対話選択ページ上でユーザが操作部564を通じて行った選択入力を受け付けると後述する選択結果送信部582が生成したグループ生成リンク情報に、選択された静止画を示す画像リンク情報を書き込む。なおグループ生成リンク情報については、後述する静止画生成方法において詳述する。
【0138】
選択結果送信部582は、表示制御部572がディスプレイ120に表示させたテキスト素片のうち、操作部564を通じた、ユーザの選択入力に応じて選択された1または複数のテキスト素片を示す選択結果を、装置通信部566を通じて、静止画生成サーバ410に送信する。また、選択結果送信部582は、静止画選択部580が1の静止画を選択した場合、選択した静止画を示す選択結果も静止画生成サーバ410に送信する。
【0139】
本実施形態において選択結果送信部582は、対話選択ページ上でユーザが操作部564を通じて行った選択入力を受け付けるとグループ生成リンク情報を生成し、選択されたテキスト素片に対応するテキスト素片選択番号を書き込んで静止画生成サーバ410へ送信する。すなわち選択結果送信部582は、選択された静止画を示す選択結果および選択されたテキスト素片を示す選択結果を静止画生成サーバ410に送信する。そして上述したように、静止画生成サーバ410は、受信したグループ生成リンク情報のレスポンスとして、リダイレクトページファイルを操作クライアント420に送信する。
【0140】
次に上述した静止画生成サーバ410および操作クライアント420を用いた静止画生成方法について説明する。
【0141】
(静止画生成方法)
図16は、第2の実施形態にかかる静止画生成方法の具体的な処理を示したシーケンス図である。
【0142】
静止画生成サーバ410のHDD512は、映像ストリーム、映像ストリームと時間軸で多重化されたテキスト情報、およびメタデータを含むコンテンツと、EPGを生成するためのチャンネル情報データおよび番組情報テーブルを保持している(S600)。
【0143】
操作クライアント420の操作部564が、EPGページを表示させるためのユーザによる操作入力を受け付けると、EPG取得部570は、EPGページリンク情報生成し、かかるEPGページリンク情報を、装置通信部566を通じて送信する(S602)。静止画生成サーバ410が、EPGページリンク情報を受信すると、EPGページ生成部530は、プレイヤーページリンク情報を含むEPGページファイルを送信する(S604)。操作クライアント420は、かかるEPGページファイルを受信し、表示制御部572が、EPGページファイルに基づいてEPGページをディスプレイ120に表示させる(S606)。
【0144】
EPGページリンク情報は、EPGページファイルを受信するための、年指定year、月指定month、日指定dayのパラメータを含む命名規則「epg.pl?year=yyyy&month=MM&day=DD」を用いて表されるパラメータを含むURL(URI)である。ここで、「yyyy」は、受信を所望するEPGページファイルの西暦を、「MM」は月を、「DD」は日を示す変数である。
【0145】
EPGページリンク情報のレスポンスであるEPGページファイルは、少なくとも再生番組を選択可能なプレイヤーページリンク情報を1つ以上含むHTMLファイルであり、ここでは、横軸を放送事業者名、縦軸を時間帯とした帯番組表にレンダリングされるよう構成する。
【0146】
図17は、受信したEPGページファイルに基づいてディスプレイ120に表示されたEPGページの例を示す図である。図17に示すように、EPGページ430は、横軸に放送事業者名430aを、縦軸に時間帯430bを示す。またEPGページ430には、プレイヤーページリンク情報が関連付けられた画像432が含まれており、その画像432を選択することでユーザによる選択入力を受け付けることができる。
【0147】
そして、ユーザによるプレイヤーページリンク情報の選択入力を受け付けると(S608)、操作クライアント420のストリーム選択部574は、かかるプレイヤーページリンク情報を送信する(S610)。静止画生成サーバ410は、プレイヤーページリンク情報を受信すると、ストリーム送信部532が、プレイヤーページファイルを送信する(S612)。操作クライアント420は、かかるプレイヤーページファイルを受信すると、表示制御部572が、プレイヤーページファイルに基づいてプレイヤーページをディスプレイ120に表示させる。
【0148】
プレイヤーページリンク情報は、プレイヤーページファイルを受信するための、再生区間request、相対再生時刻pos、イベント識別子dvidのパラメータを含む命名規則「player.pl?request=YYMMDD-hhmmss-ehemes-nn&pos=sec&dvid=eventid」を用いて表されるURLである。ここで、「YY」は、所望する映像ストリームの再生開始の西暦下2桁を、「MM」、「DD」、「hh」、「mm」、「ss」は、それぞれ再生開始の月、日、時、分、秒を、「eh」「em」、「es」は、それぞれ再生終了の時、分、秒を示す変数である。また、「sec」は、再生区間の先頭をゼロ秒とした場合の相対再生時刻を、「eventid」は、後述する番組情報テーブルのイベント識別子を、「nn」は、再生チャンネル番号を示す変数である。
【0149】
例えば、「player.pl?request=090326-095500-145400-22&pos=16086.5&dvid=87533」は、「イベント識別子87533が示す番組名である「日本シリーズ決勝 東京vs大阪」という番組を、再生区間2009年3月26日9時55分00秒から14時54分00秒までの4時間59分59秒分の映像ストリームとみなし、再生区間からの相対再生時刻16086.5秒から再生するプレイヤーページファイルをリクエストする」を示す。
【0150】
プレイヤーページリンク情報のレスポンスであるプレイヤーページファイルは、操作クライアント420のストリーム再生制御部576を起動させるためのプラグイン起動タグを含むHTMLファイルである。具体的には、操作クライアント420の装置制御部560は、かかるプラグイン起動タグを解釈し、ストリーム再生制御部576を起動させる。そしてストリーム再生制御部576は、装置通信部566が受信した映像ストリームを表示制御部572にデコード処理させ、プレイヤーページ内に映像ストリームをグラフィカルに埋め込んで表示させる。
【0151】
図18は、プレイヤーページファイルに含まれるプラグイン起動タグの例を説明するための図である。図18に示す「※」は、ストリーム送信部リンク情報であって、映像ストリームを受信するための、命名規則「streaming.pl?request=YYMMDD-hhmmss-ehemes-nn&pos=sec」を用いて表されるパラメータを含むURLである。ここでの変数はプレイヤーページリンク情報の変数と同一であるので、説明を省略する。
【0152】
プレイヤーページファイルを受信した操作クライアント420は、かかるプレイヤーページファイルに含まれるプラグイン起動タグに従ってストリーム再生制御部576を起動させ、プラグイン起動タグに含まれるストリーム送信部リンク情報で指定される映像ストリームを静止画生成サーバ410に要求する(S614)。そして、静止画生成サーバ410のストリーム送信部532が送信した映像ストリームを、装置通信部566が受信し(S616)、ストリーム再生制御部576は、その映像ストリームを表示制御部572にデコード処理させ、ディスプレイ120に表示させる(S618)。
【0153】
図19は、受信したプレイヤーページファイルに基づいてディスプレイ120に表示させたプレイヤーページの例を示す図である。図19に示すように、操作クライアント420のストリーム再生制御部576は、装置通信部566が受信した映像ストリーム436を、表示制御部572にデコード処理させ、プレイヤーページ434内にグラフィカルに埋め込んで表示させる。またプレイヤーページ434には、指定ポイントリンク情報が関連付けられた画像438が含まれている。
【0154】
そして、操作クライアント420のポイント指定部578は、画像438を通じた、指定ポイントを指定するためのユーザ入力を受け付けると(S620)、受け付けたタイミングに基づいて指定ポイントリンク情報を送信する(S622)。
【0155】
指定ポイントリンク情報を受信した静止画生成サーバ410は、指定ポイントリンク情報に示された指定ポイントを基準として、HDD512が保持した映像ストリームから静止画を抽出し(S624)、テキスト情報からテキスト列を抽出する(S626)。続いて静止画生成サーバ410は、テキスト列抽出ステップS626において抽出したテキスト列を分割してテキスト素片を生成する(S628)。そして静止画生成サーバ410は、静止画抽出ステップS624において抽出した静止画と、素片生成ステップS628において生成したテキスト素片を用いて生成した対話選択ページファイルを送信する(S630)。操作クライアント420は、かかる対話選択ページファイルを受信し、表示制御部572は、対話選択ページをディスプレイ120に表示させる(S632)。
【0156】
指定ポイントリンク情報は、対話選択ページファイルを受信するための命名規則「icapture.pl?request=YYMMDD-hhmmss-ehemes-nn&pos=sec」を用いて表されるパラメータを含むURLである。ここでの変数はプレイヤーページリンク情報の変数と同一であるため、説明を省略する。本実施形態において、指定ポイントリンク情報における相対再生時刻「pos」は、指定ポイントを指定するためのユーザ入力を受け付けた時点の相対再生時刻をストリーム再生制御部576から取得して、整数値として書き込む。
【0157】
この指定ポイントを指定するためのユーザ入力とURL生成とを、ストリーム再生制御部576のプログラムコードとして実装してもよいし、操作クライアント420の表示制御部572がECMAScriptに類するインタプリタ言語を備えている場合は、予めプレイヤーページファイルにストリーム再生制御部576を監視するコードを記述しておき、HTMLファイルの一部分を動的に書き換えることで、リンク情報の相対再生時刻のパラメータを常時書き換えてもよい。また、相対再生時刻を図示するべく、画像438を常時書き換えてもよい。
【0158】
既存のストリーミングプレイヤプラグインは、相対再生時刻出力API(Application Programming Interface)を備えていることが多いため、表示制御部572がECMAScriptに類するインタプリタ言語を備える構成により、バイナリコードを一切変更せずとも、既存のストリーミングプレイヤプラグインを利用して、ストリーム再生制御部576とすることができる。この場合、ECMAScriptがうまく実行できなかったり、ストリーミングプレイヤプラグインの相対再生時刻出力APIがうまく機能しなかったりする場合はエラーを示す相対再生時刻=−1(マイナス1)としてもよい。
【0159】
指定ポイントリンク情報のレスポンスである対話選択ページファイルは、静止画生成サーバ410の素片生成部538が生成する対話入力のためのフォームタグを含むHTMLファイルである。
【0160】
図20は、対話選択ページファイルであるHTMLファイルの例を説明するための説明図である。図20に示すように、HTMLファイルのインプットタグにおいてtype="radio"は同名のnameパラメータとして1つのvalueのみを採用するラジオボタンが対話選択ページに表示され、type="checkbox"は同名のnameパラメータとして複数のvalueを採用するチェックボックスが対話選択ページに表示され、type="hidden"は対話入力画面には表示されず、単にパラメータとして受け渡される。
【0161】
図21は、受信した対話選択ページファイルに基づいてディスプレイ120に表示させた対話選択ページの例を示す図である。図21は、操作クライアント420の表示制御部572が、図20に示した対話選択ページファイルにかかるHTMLファイルをレンダリングした結果である。図21に示すように、操作クライアント420の表示制御部572は、受信した対話選択ページファイルに基づいて、ディスプレイ120の画面上部にラジオボタン442aと静止画生成サーバ410が抽出した静止画442bとを隣接して並置し、画面下部にチェックボックス444aと複数のテキスト素片のフォントビットマップ444bを隣接して並置した対話選択ページ440を表示させる。
【0162】
操作クライアント420の選択結果送信部582は、対話選択ページ440を介したユーザによる選択入力および対話選択ページ440に含まれる「Executeボタン」446を介した決定入力を受け付けると(S634)、フォームタグのaction属性において指定されたURLに上述したパラメータ群を全て連接し、グループ生成リンク情報を生成し、静止画生成サーバ410に送信する(S636)。
【0163】
図22は、対話選択ページを介したポイント指定部578、静止画選択部580および選択結果送信部582の具体的な処理の流れを説明するためのフローチャートである。
【0164】
まず、操作クライアント420のポイント指定部578は、指定ポイントを指定するためのユーザ入力を受け付けると(S800のYES)、指定ポイントリンク情報の「request」に再生区間を、「pos」に相対再生時刻を代入する(S802)。そして、ポイント指定部578は、代入した相対再生時刻posが再生区間requestの実際の再生範囲に収まっているか否かを判定する(S804)。再生区間requestの実際の再生範囲に収まっていたら(S804のYES)、再生区間requestと相対再生時刻posを書き込んだ指定ポイントリンク情報を静止画生成サーバ410に送信し、静止画生成サーバ410が、かかる指定ポイントリンク情報を受信すると、静止画抽出部534は、指定ポイントリンク情報に基づいて、P個の静止画を抽出する(S806)。
【0165】
再生範囲判定ステップS804において、相対再生時刻posが、エラー値−1を含む範囲外であった場合は、ポイント指定部578は、静止画生成サーバ410のストリーム送信部532から相対再生時刻を取得して、かかる相対再生時刻を「pos」へ代入する(S808)。この際、現在、ストリーム送信部532が送信している映像ストリームの相対再生時刻を「pos」に代入するため、「伝送路遅延+装置メモリ562等におけるバッファリング遅延」分の差分β秒が生じているはずであるが、予め指定ポイント前後数枚の静止画候補とある程度の時間幅を持ったテキスト情報から生成されたテキスト素片を以降のステップで抽出するので、ユーザがβ分のズレを意識して対話選択すれば問題は生じない。
【0166】
並行して、テキスト抽出部536も、指定ポイントリンク情報に基づいて、テキスト列を抽出し、素片生成部538が、かかるテキスト列を分割して、S個のテキスト素片の生成を行う(S810)。
【0167】
そして、対話選択ページの開始HTMLソース(HTMLタグの開始タグ、ヘッダータグ、ボディタグの開始タグなど)を出力し(S812)、P回分の繰り返し処理を開始する(変数jは0からP未満の整数で+1ずつ単調増加する)(S814)。それぞれの候補静止画を操作クライアント420のWebブラウザに読み込ませるためのIMGタグの生成と、type="radio"のINPUTタグの生成を行う(S816)。変数jがそのままINPUTタグのvalueとなる。
【0168】
続いてS回分の繰り返し処理を開始する(変数iは0からS未満の整数で+1ずつ単調増加する)(S818)。それぞれのテキスト素片を抽出し、さらにtype="checkbox"のINPUTタグの生成を行う(S820)。変数iがそのままINPUTタグのvalueとなる。最後に対話選択ページの終了HTMLソース(ボディタグの終了タグ、HTMLタグの終了タグなど)を出力し(S822)全体の処理を終了する。
【0169】
グループ生成リンク情報は、再生区間request、相対再生時刻pos、イベント識別子dvid、サブミット文字列submit、画像選択番号imgnum、テキスト素片選択番号word列、のパラメータを含む命名規則「output.pl?request= YYMMDD-hhmmss-ehemes-nn &pos=sec&dvid=87533&submit=Execute&imgnum=画像選択番号&word=テキスト素片選択番号1& word=テキスト素片選択番号2・・・&word=テキスト素片選択番号p」を用いて表されるパラメータを含むURLである。ここで、プレイヤーページリンク情報の変数と同一である変数については説明を省略する。
【0170】
グループ生成リンク情報中の画像選択番号imgnumは、静止画生成サーバ410が抽出したP個の候補静止画に0〜(P−1)までの番号を示すものであり、操作クライアント420がテキスト素片グループのイメージタグに埋め込む画像リンク情報に予め関連付けられている。例えば、図20に示す例において、「imgnum=0」を選択決定するユーザ入力を受け付けた場合、静止画生成サーバ410は、操作クライアント420の静止画選択部580が、画像リンク情報として「09_03_24_14_23_06_21.jpg」を選択決定したこととみなす。
【0171】
テキスト素片選択番号は、静止画生成サーバ410が生成したS個のテキスト素片に0〜(S−1)までの番号を示すものである。
【0172】
静止画生成サーバ410は、グループ生成リンク情報を受信すると、グループ生成部540が、テキスト素片選択番号のうち任意のp個の選択されたテキスト素片を連結して、テキスト素片グループを生成する(S638)。例えば、図21に示す例において、「タイムリーヒット」、「!」、「やってくれました」、「!」の選択入力をこの順で受付け、選択結果送信部582が送信した「word=38&word=39&word=40&word=41」が書き込まれたグループ生成リンク情報を受信すると、静止画生成サーバ410は、「タイムリーヒット!やってくれました!」であるテキスト素片グループを生成する。
【0173】
そして静止画生成サーバ410の関連付部542は、確定された画像リンク情報と生成されたテキスト素片グループとを関連付ける(S640)。ここで関連付部542は、受信した画像リンク情報と、生成されたテキスト素片グループと、イベント識別子dvidと、静止画生成サーバ410のHDD512が保持するチャンネル情報データおよび番組情報テーブルから番組名とを取得し、テロップファイルを生成し、ファイル保持部514に保持させる。
【0174】
図23は、テロップファイルを説明するための説明図である。ここで、「※1」は映像ストリームを番組開始時刻から再生するプレイヤーページファイルを受信するためのプレイヤーリンク情報であり、「※2」は番組情報テーブルの番組名を表すEventNameの内容であり、「※3」は映像ストリームを番組中の指定ポイントから再生するプレイヤーページファイルを受信するためのプレイヤーリンク情報であり、「※4」は、操作クライアント420の静止画選択部580が選択した静止画を埋め込むイメージタグ用の画像リンク情報であり、「※5」はユーザの選択入力に応じたグループ生成リンク情報に基づいて、生成されたテキスト素片グループであり、「※6」はテロップファイル名である。
【0175】
また、静止画生成サーバ410の関連付部542は、グループ生成リンク情報のレスポンスとして、自体へリダイレクトするリダイレクトページファイルを生成し、サーバ通信部516を通じて、操作クライアント420に送信する(S642)。
【0176】
図24は、リダイレクトページファイルであるHTMLファイルを説明するための説明図である。図24に示すように、リダイレクトページファイルは、ブックマークリンク情報を含むHTMLファイルである。図24に示す例において、METAリフレッシュタグにより、操作クライアント420の表示制御部572がリダイレクトページファイルをレンダリングして表示(S644)してから1秒後に、ブックマークリンク情報に自動的にリダイレクトする(S646)。
【0177】
図25は、受信したリダイレクトページファイルに基づいてディスプレイ120に表示させたリダイレクトページの例を示す図である。図25に示すように、ディスプレイ120に表示させたリダイレクトページ450は、表示制御部572が図23に示すリダイレクトページファイルにかかるHTMLファイルをレンダリングした結果である。グループ生成リンク情報リクエストが静止画生成サーバ410に受け付けられたことをユーザに示し、すぐにブックマークページへ自動遷移する。万が一自動遷移が受け付けられない(表示制御部572の内部状態による)場合は、ブックマークリンク情報が関連付けられた画像452を介したユーザ入力に応じて、操作クライアント420の装置制御部560は、ブックマークリンク情報を静止画生成サーバ410に送信する。
【0178】
ここで、ブックマークリンク情報は、ブックマークページファイルを受信するための、ファイル名「bookmark.pl」を含むURLである。
【0179】
静止画生成サーバ410が、ブックマークリンク情報を受信すると、関連付部542がブックマークページファイルを操作クライアント420に送信する(S648)。ブックマークリンク情報のレスポンスであるブックマークページファイルは、複数のテロップファイルの内容を含んだHTMLファイルである。
【0180】
図26は、ブックマークページファイルであるHTMLファイルを説明するための説明図であり、図27は、受信したブックマークページファイルに基づいてディスプレイ120に表示させたブックマークページを説明するための説明図である。
【0181】
図27は、表示制御部572が、図26に示すブックマークページファイルにかかるHTMLファイルをレンダリングした結果であるブックマークページ454である。ブックマークページ454は、今回作成されたテロップファイルに基づいた画像456を含み、それ以前に作成されたテロップファイルに基づいた画像458と併せて表示される。また、各テロップファイルに基づいた画像のタイトル部分460は番組先頭から再生されるプレイヤーリンク情報にリンクされてもよく、静止画部分は指定ポイントを相対再生時刻とするプレイヤーページリンク情報にリンクされていてもよい。
【0182】
以上説明したように、ユーザは、操作クライアント420の表示制御部572がディスプレイ120に表示させる図17、図19、図21、図25、図27という一連のページ遷移によって為される対話操作のみで、映像ストリームから静止画を抽出し、抽出した静止画にテキスト列を関連付ける際に、静止画の内容を的確に示したテキスト列であるテキスト素片グループを簡単かつ迅速に作成することが可能となる。
【0183】
上述した如く、本実施形態にかかる静止画生成サーバ410および操作クライアント420においても、映像ストリームから切り出した静止画にテキストを関連付ける際に、静止画の内容を的確に示したテキストを簡単かつ迅速に作成することが可能となる。
【0184】
以上、添付図面を参照しながら本発明の好適な実施形態について説明したが、本発明はかかる実施形態に限定されないことは言うまでもない。当業者であれば、特許請求の範囲に記載された範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。
【0185】
なお、本明細書の静止画生成方法における各工程は、必ずしもフローチャートおよびシーケンス図として記載された順序に沿って時系列に処理する必要はなく、並列的あるいはサブルーチンによる処理を含んでもよい。
【産業上の利用可能性】
【0186】
本発明は、映像ストリームから静止画を切り出して加工する静止画生成方法、静止画生成システム、静止画生成サーバおよび操作クライアントに利用することができる。
【符号の説明】
【0187】
100、400 …静止画生成システム
110 …静止画生成装置
120 …ディスプレイ
230 …ストリーム取得部
232、578 …ポイント指定部
234、534 …静止画抽出部
236、572 …表示制御部
238、580 …静止画選択部
240、536 …テキスト抽出部
242、538 …素片生成部
244、540 …グループ生成部
246、542 …関連付部
410 …静止画生成サーバ
420 …操作クライアント
512 …HDD(コンテンツ保持部)
516 …サーバ通信部(素片送信部、結果受信部)
532 …ストリーム送信部
566 …装置通信部(ストリーム受信部、素片受信部)
576 …ストリーム再生制御部
582 …選択結果送信部

【特許請求の範囲】
【請求項1】
静止画生成サーバと、前記静止画生成サーバに接続された操作クライアントとを用いた静止画生成方法であって、
前記静止画生成サーバは、
映像ストリームと、前記映像ストリームと時間軸で多重化されたテキスト情報とを含むコンテンツを保持し、
前記映像ストリームを前記操作クライアントに送信し、
前記操作クライアントは、
送信された前記映像ストリームを受信してディスプレイに表示させ、
ユーザ入力に応じて、前記映像ストリームの任意のポイントを指定し、
前記静止画生成サーバは、
保持した前記映像ストリームから、前記操作クライアントが指定した前記任意のポイントを基準とした第1の所定範囲内に位置する静止画を抽出し、
保持した前記テキスト情報のうち、指定された前記任意のポイントを基準とした前記第1の所定範囲よりも広い第2の所定範囲または前記静止画を抽出したポイントを基準とした前記第2の所定範囲の前記テキスト情報であるテキスト列を抽出し、
抽出した前記テキスト列を分割して複数のテキスト素片を生成し、
生成した前記複数のテキスト素片を前記操作クライアントに送信し、
前記操作クライアントは、
送信された前記複数のテキスト素片を受信し、
受信した前記複数のテキスト素片をディスプレイに表示させ、
ユーザ入力に応じて、表示させた前記複数のテキスト素片のうち2以上のテキスト素片を選択し、その選択された2以上のテキスト素片を示す選択結果を前記静止画サーバに送信し、
前記静止画生成サーバは、
送信された前記選択結果を受信し、
受信した前記選択結果に基づいて、前記選択された2以上のテキスト素片を連接してテキスト素片グループを生成し、
抽出した前記静止画と、生成した前記テキスト素片グループとを関連付けることを特徴とする静止画生成方法。
【請求項2】
静止画生成サーバと、前記静止画生成サーバに接続された操作クライアントとを備える静止画生成システムであって、
前記静止画生成サーバは、
映像ストリームと、前記映像ストリームと時間軸で多重化されたテキスト情報とを含むコンテンツを保持するコンテンツ保持部と、
前記映像ストリームを前記操作クライアントに送信するストリーム送信部と、
保持された前記映像ストリームから、前記操作クライアントが指定した任意のポイントを基準とした第1の所定範囲内に位置する静止画を抽出する静止画抽出部と、
保持された前記テキスト情報のうち、前記指定された任意のポイントを基準とした前記第1の所定範囲よりも広い第2の所定範囲または前記静止画抽出部が静止画を抽出したポイントを基準とした前記第2の所定範囲の前記テキスト情報であるテキスト列を抽出するテキスト抽出部と、
抽出された前記テキスト列を分割して複数のテキスト素片を生成する素片生成部と、
生成された前記複数のテキスト素片を前記操作クライアントに送信する素片送信部と、
前記操作クライアントがユーザ入力に応じて選択し送信した、前記複数のテキスト素片のうちの2以上のテキスト素片を示す選択結果を受信する結果受信部と、
受信された前記選択結果に基づいて、前記選択された2以上のテキスト素片を連接してテキスト素片グループを生成するグループ生成部と、
抽出された前記静止画と、生成された前記テキスト素片グループとを関連付ける関連付部と、
を備え、
前記操作クライアントは、
前記静止画生成サーバが送信した前記映像ストリームを受信するストリーム受信部と、
ユーザ入力に応じて、前記映像ストリームの任意のポイントを指定するポイント指定部と、
送信された前記複数のテキスト素片を受信する素片受信部と、
受信された前記映像ストリームおよび前記複数のテキスト素片をディスプレイに表示させる表示制御部と、
ユーザ入力に応じて、表示させた前記複数のテキスト素片のうち2以上のテキスト素片を選択し、その選択された2以上のテキスト素片を示す選択結果を前記静止画生成サーバに送信する結果送信部と、
を備えることを特徴とする静止画生成システム。
【請求項3】
ユーザ入力を受け付ける操作クライアントに接続された静止画生成サーバであって、
映像ストリームと、前記映像ストリームと時間軸で多重化されたテキスト情報とを含むコンテンツを保持するコンテンツ保持部と、
前記映像ストリームを前記操作クライアントに送信するストリーム送信部と、
保持された前記映像ストリームから、前記操作クライアントが指定した任意のポイントを基準とした第1の所定範囲内に位置する静止画を抽出する静止画抽出部と、
保持された前記テキスト情報のうち、前記指定された任意のポイントを基準とした前記第1の所定範囲よりも広い第2の所定範囲または前記静止画抽出部が静止画を抽出したポイントを基準とした前記第2の所定範囲の前記テキスト情報であるテキスト列を抽出するテキスト抽出部と、
抽出された前記テキスト列を分割して複数のテキスト素片を生成する素片生成部と、
生成された前記複数のテキスト素片を前記操作クライアントに送信する素片送信部と、
前記操作クライアントがユーザ入力に応じて選択し送信した、前記複数のテキスト素片のうち2以上のテキスト素片を示す選択結果を受信する結果受信部と、
受信された前記選択結果に基づいて、前記選択された2以上のテキスト素片を連接してテキスト素片グループを生成するグループ生成部と、
抽出された前記静止画と、生成された前記テキスト素片グループとを関連付ける関連付部と、
を備えることを特徴とする静止画生成サーバ。
【請求項4】
前記コンテンツ保持部は、前記映像ストリームに関連付けられた、番組名、番組カテゴリ、番組説明、出演者、放送事業者名の群から選択される1または複数を含むメタデータも保持し、
前記テキスト抽出部は、前記メタデータからもテキスト列を抽出することを特徴とする請求項3に記載の静止画生成サーバ。
【請求項5】
前記素片生成部は、形態素でテキスト列を分割してテキスト素片を生成することを特徴とする請求項3または4に記載の静止画生成サーバ。
【請求項6】
映像ストリームから静止画を生成し得る静止画生成サーバと接続された操作クライアントであって、
映像ストリームを受信するストリーム受信部と、
ユーザ入力に応じて、前記映像ストリームの任意のポイントを指定するポイント指定部と、
前記静止画生成サーバが送信した複数のテキスト素片を受信する素片受信部と、
受信された前記映像ストリームおよび前記複数のテキスト素片をディスプレイに表示させる表示制御部と、
ユーザ入力に応じて、表示させた前記複数のテキスト素片のうち2以上のテキスト素片を選択し、その選択された2以上のテキスト素片を示す選択結果を前記静止画生成サーバに送信する選択結果送信部と、
を備えることを特徴とする操作クライアント。
【請求項7】
前記表示制御部は、前記静止画生成サーバが抽出した複数の静止画もディスプレイに表示させ、
ユーザの選択入力に応じて、表示させた前記複数の静止画のうち、1の静止画を選択する静止画選択部をさらに備え、
前記選択結果送信部は、前記静止画選択部による選択結果も前記静止画生成サーバに送信することを特徴とする請求項6に記載の操作クライアント。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22】
image rotate

【図23】
image rotate

【図24】
image rotate

【図25】
image rotate

【図26】
image rotate

【図27】
image rotate


【公開番号】特開2010−278632(P2010−278632A)
【公開日】平成22年12月9日(2010.12.9)
【国際特許分類】
【出願番号】特願2009−127728(P2009−127728)
【出願日】平成21年5月27日(2009.5.27)
【出願人】(000004329)日本ビクター株式会社 (3,896)
【Fターム(参考)】