検索装置
【課題】 録画コンテンツ中からユーザが入力したキーワードが含まれるシーンを検索し、検索結果を提示、再生する使い勝手に優れた安価な映像録画再生装置をと検索結果提示方法を提供する。
【解決手段】 番組処理部104は、映像コンテンツに含まれる音声信号と映像信号及びインターネットから取得したメタデータを処理し、音声特徴データ、字幕特徴データ、テロップ特徴データ、メタデータ特徴データを生成し、検索キーワードと一致するシーンをこれら特徴データを用いて検索し、検索対象である特徴データ毎に検索結果をそれぞれ色、形を変えて表現する。
【解決手段】 番組処理部104は、映像コンテンツに含まれる音声信号と映像信号及びインターネットから取得したメタデータを処理し、音声特徴データ、字幕特徴データ、テロップ特徴データ、メタデータ特徴データを生成し、検索キーワードと一致するシーンをこれら特徴データを用いて検索し、検索対象である特徴データ毎に検索結果をそれぞれ色、形を変えて表現する。
【発明の詳細な説明】
【技術分野】
【0001】
技術分野は、映像を表示する際、映像に含まれるシーンを検索する検索装置に関する。
【背景技術】
【0002】
近年、記録装置の大容量化により、テレビ放送番組やインターネットから配信される映像等を蓄積して視聴する際に、蓄積した映像等の中から、特定のシーンを検索する技術が重要になってきている。
【0003】
例えば特許文献1には、「ユーザの嗜好に応じて情報を検索表示できる情報検索表示装置を提供する」ことを課題とし、解決手段として「映像情報や前記映像情報に関連する情報をユーザに対して表示する表示部124と、ユーザの嗜好に関する情報であるユーザ嗜好情報を記憶した視聴履歴記憶部130、嗜好キーワード記憶部131、検索履歴記憶部132と、前記ユーザ嗜好情報に基づいて、前記映像情報の一部である部分情報および前記ユーザ嗜好情報に関連する情報である関連情報を検索する関連情報検索部110と、前記関連情報検索部110が検索した前記関連情報と前記映像情報とを前記表示部124に表示する表示制御部123とを備えた」ことが記載されている。
【0004】
また特許文献2には、「映像及び又は音声の検索においてユーザが希望するシーンを、あらかじめ辞書などに登録された単語やキーワード以外の未知語や、ユーザが入力した不確かなキーワードであっても、正確かつ高速に検索できること」を課題とし、解決手段として「検索データの生成と検索処理とに一連の音声認識処理手順を分割して適用することにより、ユーザが希望する映像・音声シーンを高速に検索でき、高速に再生できるシーン検索システムであり、映像信号に同期した音声信号から特徴パタンを抽出して映像検索のためのインデックスを生成する検索データ生成部100と、検索者から入力されるキーワードと前記インデックスとを照合して所望とする映像を検索する検索処理部200とを具備」することが記載されている。
【0005】
【特許文献1】特開2006−186426号公報
【特許文献2】特開2002−175304号公報
【発明の開示】
【発明が解決しようとする課題】
【0006】
しかしながら、特許文献1はユーザの嗜好を予め記憶しておくものであり、ユーザのそのときの気分に応じて選択するなどのユーザにとってのフレキシビリティ(自由度)が低いという課題がある。また、特許文献2は検索対象として音声認識結果を考慮しているが、認識技術には得意不得意があるところそれらへの考慮がない。
【課題を解決するための手段】
【0007】
そこで、ユーザがキーワードを指定するにあたり、キーワードに対して複数の検索対象を選択できる技術を提供する。また、複数の検索対象を用いた場合の検索結果の提示技術を提供する。具体的には例えば、特許請求の範囲の構成を採用する。
【発明の効果】
【0008】
上記手段によれば、ユーザに対して使い勝手のよい検索装置などを提供できる。
【0009】
上記以外の課題、手段、効果も実施形態の例の説明で述べられる。
【発明を実施するための最良の形態】
【0010】
以下、本発明に好適な実施形態の例を、図面を用いて説明する。ただし本発明は本例に限定されるものではない。
【0011】
図1は、番組録画再生装置の一実施例を示すブロック構成図である。番組録画再生装置1は、TV放送(例えば地上デジタル放送)をアンテナ101で受信し、チューナ102で所望の番組を選局する。選局した番組を録画再生制御部103を介してハードディスクや光ディスクなどのストレージ部119部に録画する。また、録画した番組はキーワードを入力することにより、キーワードが含まれるシーンを検索し、再生することができる。録画再生のためには様々な信号処理を伴うが、図1では省略している。また、番組録画再生装置1は、インターネット網から放映される映像コンテンツやメタデータをLANアダプタ121を通じて受信し、受信したコンテンツを録画再生制御部103を介してハードディスクや光ディスクなどのストレージ部119部に録画する。
【0012】
音声入力部117は、受信した放送番組から音声信号を分離して逐次デジタル変換し、インターフェイス108を介して番組処理部104に入力する。デジタル信号に変換する際の音声のサンプリング周波数、チャンネル数といった各種情報も、音声入力部117から番組処理部104に受け渡される。もちろん、これらの情報は、番組処理部104で設定したものを音声入力部117に与えるようにしてもよい。
【0013】
映像入力部118は、受信した放送番組から映像信号を分離して逐次デジタル変換し、インターフェイス108を介して番組処理部104に入力する。デジタル信号に変換する際の映像のサンプリング周波数などの各種情報も、映像入力部118から番組処理部104に受け渡される。もちろん、これらの情報は、番組処理部104で設定したものを映像入力部118に与えるようにしてもよい。
【0014】
音声入力部117と映像入力部118の前段の分岐点には分離部が存在する。この分離部で映像信号、音声信号、データ信号のうち少なくとも二つを分離する。
【0015】
番組処理部104は、受け取った音声信号から、音声検索用の特徴データを生成する。番組処理部104は、受け取った映像信号から、字幕がある場合には、字幕特徴データを生成する。字幕は映像信号とは別のデータ信号に含まれていることもある。また、テロップ特徴データを生成する。番組処理部104は、メタデータ(インターネットから取得するだけでなくアンテナ101から受信するデータ信号に含まれていることもある)からメタデータ特徴データを生成する。番組処理部104のうち、特徴データを生成する部位を特徴データ生成部ともいう。
【0016】
録画再生制御部103と番組処理部104は、インターフェイス109を介して検索キーワードを含むシーンの再生制御命令や応答の送受信をする。録画再生する映像信号の各フレームに、映像の先頭から順にフレーム番号が割り付けられている場合には、該フレーム番号及び検索命令を番組処理部104から録画再生制御部103に送信することにより、当該フレーム番号の画像を検索するとともに、そのフレーム番号の画像をスキップ再生させることができる。
【0017】
番組処理部104では、入力した音声デジタル信号及び映像デジタル信号を一旦メモリ107に入力し、CPU106によって、特徴データ生成などの解析処理を実施する。その処理プログラムは補助記憶部105に格納しておき、CPU106はこれを適宜読み出し、メモリ107に転送して処理する。メモリ107には、処理によって作成される各種のデータ及び計算結果が蓄積され、必要に応じて参照される。また、音声デジタル信号や処理結果等の各種情報は補助記憶部105に格納することもできる。なお本例ではCPUでプログラムを実行することとするが、複数のLSIに分かれても、すべてがハードウェアで実行されてもよい。
【0018】
PDPやLCDなどのディスプレイ装置120は、インターフェイス111を介して、番組処理部104の出力内容を表示する。スピーカ113は、番組処理部104に入力した音声信号をインターフェイス110を介して出力したり、メモリ107に蓄積された音声信号をユーザの要求に応じて出力したりする。入力装置115は、マウスなどのポインティングデバイスやキーボードなどの数値入力デバイス、マイクなどの音声入力デバイスからなり、インターフェイス114を介して番組処理部104に対する命令や閾値及び検索キーワードの設定を行う。
【0019】
なお、番組録画再生装置の構成は、図1の構成に限定されるものではなく、チューナ102などの放送受信部、ストレージ部119、ディスプレイ装置120やスピーカ113などの映像・音声出力部は、装置内蔵型でも外付け型でも構わない。
【0020】
図2を用いて、音声検索用特徴データ生成処理の例を説明する。
【0021】
まず、音声入力部117は、受信した放送番組から音声信号を分離して逐次デジタル変換し、インターフェイス108を介して番組処理部104に入力する。番組処理部104は録画中に、この音声デジタル信号から音声検索用特徴データを生成し、ストレージ部119に格納する。なお、本発明の実施の形態では、音声検索用特徴データの生成を録画中に実施するが、録画後に音声検索用特徴データの生成処理を実施してもよいことは言うまでもないことである。
【0022】
処理ステップS201では、録画コンテンツが音声検索用データを生成する対象であるか否かを判定する。一般に、字幕を対象としたテキストのマッチングと異なり、映像中の音声からキーワードを含むシーンを検索するには、映像中の音声が明瞭であることが必要条件となる。例えば、映像コンテンツがニュースである場合などは、音声が明瞭なので、映像中の音声を用いた検索が可能となる。そこで映像コンテンツのカテゴリが音声検索に耐えうるカテゴリのものであるか否かを判定する。音声検索が有効なカテゴリである場合には、処理ステップS202に進み、音声検索が有効なカテゴリでない場合には、処理ステップS203に進む。
【0023】
処理ステップS202では、音声検索を有効にする。処理ステップS203では、音声検索を無効にする。処理ステップS204では、音声検索用特徴データ生成処理を実施する。
【0024】
以上により、音声検索用特徴データを生成するか否かを判定し、不要な処理を省略することができる。
【0025】
同様に、字幕を対象としたテキストのマッチングと異なり、映像中のテロップからキーワードを含むシーンを検索するには、映像中のテロップ領域を抽出後、テロップ領域に各種画像処理を実施し、最終的にはOCRによりテロップをテキストに変換した結果と指定キーワードとのマッチングをとることになる。したがって、テロップ領域が背景画像と比較して十分明瞭であることが必要条件となる。図2で用いた判別方法と同様にして、テロップ認識対象カテゴリである場合にはテロップ特徴データ生成を実施し、テロップ認識対象カテゴリではない場合には、テロップ特徴データ生成は実施しない。
【0026】
一方、テキスト同士のマッチングのため、字幕を対象としたシーン検索及びメタデータを対象としたシーン検索は検索精度が高い。したがって字幕を含んだ番組は、字幕特徴データを生成し、字幕を含まない番組では、字幕特徴データを生成しない。同様に,メタデータを含んだ番組はメタデータ特徴データを生成し,メタデータを含まない番組では,メタデータ特徴データは生成しない。
【0027】
図4は、番組提示画面の一例である。
【0028】
番組提示画面4は、現在放送中の番組を表示するミニ画面41と、現在放送中の番組に関する情報を提示する番組放送情報表示画面42と、映像操作ボタン群43と、テレビ欄切り替えボタン44と、キーワード検索画面切り替えボタン45と、録画一覧表示切替ボタン46と、電子番組表表示領域47とから構成される。番組放送情報画面42に表示されているチャンネルを選択すると、選択チャンネルがハイライト表示される。録画一覧表示切替ボタン46を押すと、番組提示画面4は、図5に示す録画一覧表画面5に切り替わる。
【0029】
図5に示す録画一覧表画面5と図4における番組提示画面4との主な違いを説明する。録画一覧表画面5は、録画コンテンツを再生表示するミニ画面51と、録画コンテンツに関する情報を提示する録画コンテンツ情報表示画面52と、録画コンテンツの一覧表示画面53をもつ。録画コンテンツの一覧表示画面53は、サムネイル54で表示され、選択された録画コンテンツは、サムネイルの周囲がハイライト表示となり、他と視覚的に区別できるようになっている。
【0030】
キーワード検索画面切替ボタン45を押すと、録画一覧表画面5は、図6に示すキーワード検索画面6に切り替わる。
【0031】
図6に示すキーワード検索画面6と図5に示す録画一覧表画面5の主な違いを説明する。
【0032】
キーワード検索画面6では、録画コンテンツ情報表示画面52の領域が、検索キーワード入力領域62となっている。また、録画コンテンツの一覧表示画面53の領域が、検索結果を表示する検索結果表示画面66となっている。
【0033】
検索キーワード入力領域62は、検索キーワード入力欄63、検索開始ボタン64、検索対象表示切替チェックボックス65からなる。
【0034】
検索キーワード入力欄63は、ユーザが過去に入力したキーワードが履歴として表示選択できる、ドロップダウンリストボックスとなっている。
【0035】
次に、例えば図6のキーワード入力欄63に入力されたキーワードによるシーン検索方法の概要に関して説明する。
【0036】
図3を用いて、検索処理の例を説明する。なお、本処理は番組処理部104で実行される。番組処理部のうち、検索を実行する部位を検索部とも呼ぶ。
【0037】
処理ステップS301では、ユーザから入力されたキーワードを処理する。なお、本実施例においては、キーワードの入力方法は、キーボードによるテキスト入力としたが、マイクを通じた音声入力でもよいことはいうまでもない。
【0038】
処理ステップS302では、字幕が検索対象であるか否かを判定する。字幕が検索対象である場合には、処理ステップS303に進む。一方、字幕が検索対象でない場合には、処理ステップS305に進む。
【0039】
処理ステップS303では、字幕特徴データがあるか否かを判定する。番組によっては、字幕が付加されていない場合がある。字幕が付加されていない場合には、字幕特徴データは生成されないので、処理ステップS305に進む。一方、字幕特徴データがある場合には、処理ステップS304に進む。
【0040】
処理ステップS304では、処理ステップS301で入力されたキーワードと一致する文字列を字幕特徴データ中から検索する、字幕検索処理を実施する。
【0041】
処理ステップS305では、テロップが検索対象であるか否かを判定する。テロップが検索対象である場合には、処理ステップS306に進む。一方、テロップが検索対象でない場合には、処理ステップS308に進む。
処理ステップS306では、テロップ特徴データがあるか否かを判定する。テロップ特徴データがある場合には、処理ステップS307に進み、テロップ特徴データがない場合には、処理ステップS308に進む。
【0042】
処理ステップS307では、処理ステップS301で入力されたキーワードと一致する文字列をテロップ特徴データ中から検索する、テロップ検索処理を実施する。
【0043】
処理ステップS308では、音声が検索対象であるか否かを判定する。音声が検索対象である場合には、処理ステップS309に進む。一方、音声が検索対象でない場合には、処理ステップS311に進む。
【0044】
処理ステップS309では、音声特徴データがあるか否かを判定する。音声特徴データがある場合には、処理ステップS310に進み、音声特徴データがない場合には、処理ステップS311に進む。
【0045】
本発明では、シーン検索に使用する各種特徴データ(字幕特徴データ、テロップ特徴データ、音声特徴データ)は、番組録画時に生成し、ストレージ部119に格納する。したがって、ユーザがシーン検索する際には、既にシーン検索に使用する各種特徴データ生成が完了しているので、ユーザは録画終了直後から、所望のキーワードによるシーン検索機能を実施することが出来る。
【0046】
処理ステップS310では、処理ステップS301で入力されたキーワードと一致する文字列の音声パタンを音声特徴データ中から検索する、音声検索処理を実施する。
【0047】
処理ステップS311では、メタデータが検索対象であるか否かを判定する。メタデータが検索対象である場合には、処理ステップS312に進む。一方、メタデータが検索対象でない場合には、処理ステップS314に進む。
処理ステップS312では、メタデータ特徴データがあるか否かを判定する。メタデータ特徴データがある場合には、処理ステップS313に進み、メタデータ特徴データがない場合には、処理ステップS314に進む。
【0048】
処理ステップS313では、処理ステップS301で入力されたキーワードと一致する文字列をメタデータ特徴データ中から検索する、メタデータ検索処理を実施する。
【0049】
処理ステップS314では、上記4つの処理ステップ、すなわち処理ステップS304での字幕検索処理の結果と、処理ステップS307でのテロップ検索処理の結果と、処理ステップS310で音声検索処理の結果と、処理ステップS313でのメタデータ検索処理の結果とを比較して、時系列順に並び替えを実施し、キーワードの出現位置が最も小さい結果を保持する。
【0050】
なお、処理ステップの実施順序は、本実施の形態に限られるものではないことは言うまでもないことである。
【0051】
処理ステップS315では、検索範囲がコンテンツの終端まで達したか否かを判定し、コンテンツの終端まで達した場合には、処理ステップS316に進み、コンテンツの終端に達していない場合には、処理ステップS302に進み、繰り返し処理をする。
【0052】
なお、字幕についてコンテンツの終端まで達した後に、次にテロップについて終端まで達する方法もある。この場合、パーソナルコンピュータのように処理能力に余裕がある場合(ソフトウェアで実装し比較的高速なCPUで処理)には並列処理により、処理時間が短時間で済む。一方で処理中の負荷が高いので、高機能な演算処理装置を必要とする。一般に高機能な演算処理装置は高価である。また、組込みシステム(ハードウェアで実装)で使用する場合には、直列処理により、処理中の負荷は並列処理と比較すると低い。処理負荷が、小さいので、計算能力が低い演算処理装置を用いることができる。一般に、計算処理能力が低い演算処理装置は、経済的に安い傾向がある。安価に実現可能である。ただし、直列処理なので、処理時間が比較的長い。
【0053】
処理ステップS312では、一連の検索結果をユーザに提示する、検索結果提示処理を実施する。
【0054】
このように本処理によれば、ユーザはキーワードを入力すると、検索対象を意識することなく、検索結果を得ることが可能となる。
【0055】
以下、図3の検索結果の提示の方法について、複数の表示例を説明する。なお、当該表示例は番組処理部104で画面データが生成されI/F111から出力され、ディスプレイ装置120で表示される。この出力又は表示を提示と呼ぶ。また番組処理部104で画面データを生成し出力する部位を提示部とも呼ぶ。
【0056】
(検索結果表示例1)
図7に、図6の検索キーワード入力欄63に検索キーワードとして「太陽」を入力し、検索開始ボタン64を押して検索した場合の、検索結果の一例を示す。検索結果表示画面71には、検索キーワードが出現するシーンを頭だし部分として表示する。現在表示中のシーンは、特に太線で表現することにより、視覚的に区別できるようになっている。頭出しがしてあるので、ユーザはスキップ操作により、次から次へと、所望のシーンにスキップできる。
【0057】
本表示例の、他の表示例に対する長所は、検索対象の表示を同時に表示できるので,視認性が良好であることである。一方、検索対象の表示領域を個別に設けているため,表示画面サイズが比較的大きくなるという面や、次の検索結果シーンにスキップするためには,ユーザはリモコン操作でスキップを押すことになるという面もある。
【0058】
(検索結果表示例2)
図8に、検索結果表示画面81に字幕、テロップ、音声、メタデータを混在して表示する例を示す。字幕、テロップ、音声、メタデータを混在して表示するので、区別をつける必要がある。本実施例においては、区別として、マーカを用いることとする。例えば、字幕及びメタデータによる検索結果の場合には、先端に丸をつける。また、テロップによる検索結果の場合には、先端に菱形をつける。さらには、音声検索による結果の場合には、無印とするという具合である。
【0059】
検索結果には、検索結果の信頼度も返ってくるので、この信頼度を棒の長さとして表現する。スレッショルド82は、ユーザが上下に移動させることによりスレッショルド値を設定することが可能である。ユーザはスレッショルドを設定することにより、検索結果をさらにフィルタリングすることができる。
【0060】
本表示例の、他の表示例に対する長所は、ユーザが検索結果に対する信頼度のスレッショルド82を指定できるので,ユーザはシーン検索の検索結果表示に対して,さらに細かく制御することができることである。一方、次の検索結果シーンにスキップするためには,ユーザはリモコン操作でスキップを押すことになるという面もある。
【0061】
(検索結果表示例3)
図9に、検索結果表示画面91に字幕、テロップ、音声、メタデータを混在して表示する例を示す。字幕、テロップ、音声、メタデータを混在して表示するので、区別をつける必要がある。本実施例においては、区別として、色を用いることとする。例えば、字幕やメタデータによる検索結果は赤色で、テロップによる検索結果は緑色で、音声による検索結果は青色で表現するといった具合である。
【0062】
本表示例の、他の表示例に対する長所は、シーン検索対象の検索結果表示領域を共用することにより,表示画面サイズを小さくすることができることである。一方、次の検索結果シーンにスキップするためには,ユーザはリモコン操作でスキップを押すことになるという面もある。
【0063】
(検索結果表示例4)
図10に、検索結果表示画面91に字幕、テロップ、音声、メタデータを混在して表示する例を示す。図9までは、頭出し位置を線で表現していたが、本実施例においては、頭出し位置のサムネイルを用いることを特徴とする。字幕、テロップ、音声、メタデータを混在して表示するので、区別をつける必要がある。本実施例においては、区別として、色を用いることとする。例えば、字幕やメタデータによる検索結果は赤色で、テロップによる検索結果は緑色で、音声による検索結果は青色で表現するといった具合である。各サムネイルの周囲を上記の色の枠で囲うことにより、ユーザが容易に識別できるようにする。
【0064】
本表示例の、他の表示例に対する長所は、シーン検索結果をサムネイル表示するので,前記図7から9よりも検索結果を確認する際,検索結果が妥当か否かが分かりやすくなることである。一方、サムネイル表示により,コンテンツ中の時間的にどの部分から(前半であるか否か,後半であるのか否か)を直感的に把握することが難しい面や、サムネイル生成処理による負荷が大きい面や、サムネイル表示をしているので,検索結果が多いと,すべての検索結果を確認するのにスクロールする必要がある場合もある面、次の検索結果シーンにスキップするためには,ユーザはリモコン操作でスキップを押すことになるという面もある。
【0065】
(検索結果表示例5)
図11に、検索結果表示画面に字幕、テロップ、音声、メタデータを混在して表示する例を示す。字幕、テロップ、音声、メタデータを混在して表示するので、区別をつける必要がある。本実施例においては、区別として、色を用いることとする。例えば、字幕やメタデータによる検索結果は赤色で、テロップによる検索結果は緑色で、音声による検索結果は青色で表現するといった具合である。図7から図10までは、頭出し、すなわちキーワードが出現する瞬間をユーザに提示していたが、本実施例においては、キーワードが出現するある時間長さの塊として提示する。ある時間長さの塊としてユーザに提示することにより、ユーザは、キーワードを含んだシーンのダイジェストを視聴することが可能となる。
【0066】
本表示例の、他の表示例に対する長所は、シーン検索対象の検索結果表示領域を共用することにより,表示画面サイズを小さくすることができることである。また、検索結果が頭出しではなく,シーンとして検索されるので,ある検索結果から次の検索結果まで,自動的にスキップされ,利便性が向上する。
【図面の簡単な説明】
【0067】
【図1】番組録画再生装置の一実施例を示すブロック構成図。
【図2】音声検索用特徴データ生成判定処理手順の一例を示すフローチャート。
【図3】キーワードによるシーン検索の理手順の一例を示すフローチャート。
【図4】番組録画再生装置の番組放映画面構成の一例を示す図。
【図5】番組録画再生装置の録画コンテンツ選択用画面構成の一例を示す図。
【図6】番組録画再生装置のキーワード検索用画面構成の一例を示す図。
【図7】番組録画再生装置のキーワード検索結果提示用画面構成の一例を示す図(検索結果表示例1)。
【図8】番組録画再生装置のキーワード検索結果提示用画面構成の一例を示す図(検索結果表示例2)。
【図9】番組録画再生装置のキーワード検索結果提示用画面構成の一例を示す図(検索結果表示例3)。
【図10】番組録画再生装置のキーワード検索結果提示用画面構成の一例を示す図(検索結果表示例4)。
【図11】番組録画再生装置のキーワード検索結果提示用画面構成の一例を示す図(検索結果表示例5)。
【符号の説明】
【0068】
1…番組録画再生装置、
101…アンテナ、
102…チューナ、
103…録画再生制御部、
104…番組処理部、
105…補助記憶部、
106…CPU、
107…メモリ
113…スピーカ
115…入力装置
117…音声入力部、
118…映像入力部、
119…ストレージ部、
120…ディスプレイ装置
【技術分野】
【0001】
技術分野は、映像を表示する際、映像に含まれるシーンを検索する検索装置に関する。
【背景技術】
【0002】
近年、記録装置の大容量化により、テレビ放送番組やインターネットから配信される映像等を蓄積して視聴する際に、蓄積した映像等の中から、特定のシーンを検索する技術が重要になってきている。
【0003】
例えば特許文献1には、「ユーザの嗜好に応じて情報を検索表示できる情報検索表示装置を提供する」ことを課題とし、解決手段として「映像情報や前記映像情報に関連する情報をユーザに対して表示する表示部124と、ユーザの嗜好に関する情報であるユーザ嗜好情報を記憶した視聴履歴記憶部130、嗜好キーワード記憶部131、検索履歴記憶部132と、前記ユーザ嗜好情報に基づいて、前記映像情報の一部である部分情報および前記ユーザ嗜好情報に関連する情報である関連情報を検索する関連情報検索部110と、前記関連情報検索部110が検索した前記関連情報と前記映像情報とを前記表示部124に表示する表示制御部123とを備えた」ことが記載されている。
【0004】
また特許文献2には、「映像及び又は音声の検索においてユーザが希望するシーンを、あらかじめ辞書などに登録された単語やキーワード以外の未知語や、ユーザが入力した不確かなキーワードであっても、正確かつ高速に検索できること」を課題とし、解決手段として「検索データの生成と検索処理とに一連の音声認識処理手順を分割して適用することにより、ユーザが希望する映像・音声シーンを高速に検索でき、高速に再生できるシーン検索システムであり、映像信号に同期した音声信号から特徴パタンを抽出して映像検索のためのインデックスを生成する検索データ生成部100と、検索者から入力されるキーワードと前記インデックスとを照合して所望とする映像を検索する検索処理部200とを具備」することが記載されている。
【0005】
【特許文献1】特開2006−186426号公報
【特許文献2】特開2002−175304号公報
【発明の開示】
【発明が解決しようとする課題】
【0006】
しかしながら、特許文献1はユーザの嗜好を予め記憶しておくものであり、ユーザのそのときの気分に応じて選択するなどのユーザにとってのフレキシビリティ(自由度)が低いという課題がある。また、特許文献2は検索対象として音声認識結果を考慮しているが、認識技術には得意不得意があるところそれらへの考慮がない。
【課題を解決するための手段】
【0007】
そこで、ユーザがキーワードを指定するにあたり、キーワードに対して複数の検索対象を選択できる技術を提供する。また、複数の検索対象を用いた場合の検索結果の提示技術を提供する。具体的には例えば、特許請求の範囲の構成を採用する。
【発明の効果】
【0008】
上記手段によれば、ユーザに対して使い勝手のよい検索装置などを提供できる。
【0009】
上記以外の課題、手段、効果も実施形態の例の説明で述べられる。
【発明を実施するための最良の形態】
【0010】
以下、本発明に好適な実施形態の例を、図面を用いて説明する。ただし本発明は本例に限定されるものではない。
【0011】
図1は、番組録画再生装置の一実施例を示すブロック構成図である。番組録画再生装置1は、TV放送(例えば地上デジタル放送)をアンテナ101で受信し、チューナ102で所望の番組を選局する。選局した番組を録画再生制御部103を介してハードディスクや光ディスクなどのストレージ部119部に録画する。また、録画した番組はキーワードを入力することにより、キーワードが含まれるシーンを検索し、再生することができる。録画再生のためには様々な信号処理を伴うが、図1では省略している。また、番組録画再生装置1は、インターネット網から放映される映像コンテンツやメタデータをLANアダプタ121を通じて受信し、受信したコンテンツを録画再生制御部103を介してハードディスクや光ディスクなどのストレージ部119部に録画する。
【0012】
音声入力部117は、受信した放送番組から音声信号を分離して逐次デジタル変換し、インターフェイス108を介して番組処理部104に入力する。デジタル信号に変換する際の音声のサンプリング周波数、チャンネル数といった各種情報も、音声入力部117から番組処理部104に受け渡される。もちろん、これらの情報は、番組処理部104で設定したものを音声入力部117に与えるようにしてもよい。
【0013】
映像入力部118は、受信した放送番組から映像信号を分離して逐次デジタル変換し、インターフェイス108を介して番組処理部104に入力する。デジタル信号に変換する際の映像のサンプリング周波数などの各種情報も、映像入力部118から番組処理部104に受け渡される。もちろん、これらの情報は、番組処理部104で設定したものを映像入力部118に与えるようにしてもよい。
【0014】
音声入力部117と映像入力部118の前段の分岐点には分離部が存在する。この分離部で映像信号、音声信号、データ信号のうち少なくとも二つを分離する。
【0015】
番組処理部104は、受け取った音声信号から、音声検索用の特徴データを生成する。番組処理部104は、受け取った映像信号から、字幕がある場合には、字幕特徴データを生成する。字幕は映像信号とは別のデータ信号に含まれていることもある。また、テロップ特徴データを生成する。番組処理部104は、メタデータ(インターネットから取得するだけでなくアンテナ101から受信するデータ信号に含まれていることもある)からメタデータ特徴データを生成する。番組処理部104のうち、特徴データを生成する部位を特徴データ生成部ともいう。
【0016】
録画再生制御部103と番組処理部104は、インターフェイス109を介して検索キーワードを含むシーンの再生制御命令や応答の送受信をする。録画再生する映像信号の各フレームに、映像の先頭から順にフレーム番号が割り付けられている場合には、該フレーム番号及び検索命令を番組処理部104から録画再生制御部103に送信することにより、当該フレーム番号の画像を検索するとともに、そのフレーム番号の画像をスキップ再生させることができる。
【0017】
番組処理部104では、入力した音声デジタル信号及び映像デジタル信号を一旦メモリ107に入力し、CPU106によって、特徴データ生成などの解析処理を実施する。その処理プログラムは補助記憶部105に格納しておき、CPU106はこれを適宜読み出し、メモリ107に転送して処理する。メモリ107には、処理によって作成される各種のデータ及び計算結果が蓄積され、必要に応じて参照される。また、音声デジタル信号や処理結果等の各種情報は補助記憶部105に格納することもできる。なお本例ではCPUでプログラムを実行することとするが、複数のLSIに分かれても、すべてがハードウェアで実行されてもよい。
【0018】
PDPやLCDなどのディスプレイ装置120は、インターフェイス111を介して、番組処理部104の出力内容を表示する。スピーカ113は、番組処理部104に入力した音声信号をインターフェイス110を介して出力したり、メモリ107に蓄積された音声信号をユーザの要求に応じて出力したりする。入力装置115は、マウスなどのポインティングデバイスやキーボードなどの数値入力デバイス、マイクなどの音声入力デバイスからなり、インターフェイス114を介して番組処理部104に対する命令や閾値及び検索キーワードの設定を行う。
【0019】
なお、番組録画再生装置の構成は、図1の構成に限定されるものではなく、チューナ102などの放送受信部、ストレージ部119、ディスプレイ装置120やスピーカ113などの映像・音声出力部は、装置内蔵型でも外付け型でも構わない。
【0020】
図2を用いて、音声検索用特徴データ生成処理の例を説明する。
【0021】
まず、音声入力部117は、受信した放送番組から音声信号を分離して逐次デジタル変換し、インターフェイス108を介して番組処理部104に入力する。番組処理部104は録画中に、この音声デジタル信号から音声検索用特徴データを生成し、ストレージ部119に格納する。なお、本発明の実施の形態では、音声検索用特徴データの生成を録画中に実施するが、録画後に音声検索用特徴データの生成処理を実施してもよいことは言うまでもないことである。
【0022】
処理ステップS201では、録画コンテンツが音声検索用データを生成する対象であるか否かを判定する。一般に、字幕を対象としたテキストのマッチングと異なり、映像中の音声からキーワードを含むシーンを検索するには、映像中の音声が明瞭であることが必要条件となる。例えば、映像コンテンツがニュースである場合などは、音声が明瞭なので、映像中の音声を用いた検索が可能となる。そこで映像コンテンツのカテゴリが音声検索に耐えうるカテゴリのものであるか否かを判定する。音声検索が有効なカテゴリである場合には、処理ステップS202に進み、音声検索が有効なカテゴリでない場合には、処理ステップS203に進む。
【0023】
処理ステップS202では、音声検索を有効にする。処理ステップS203では、音声検索を無効にする。処理ステップS204では、音声検索用特徴データ生成処理を実施する。
【0024】
以上により、音声検索用特徴データを生成するか否かを判定し、不要な処理を省略することができる。
【0025】
同様に、字幕を対象としたテキストのマッチングと異なり、映像中のテロップからキーワードを含むシーンを検索するには、映像中のテロップ領域を抽出後、テロップ領域に各種画像処理を実施し、最終的にはOCRによりテロップをテキストに変換した結果と指定キーワードとのマッチングをとることになる。したがって、テロップ領域が背景画像と比較して十分明瞭であることが必要条件となる。図2で用いた判別方法と同様にして、テロップ認識対象カテゴリである場合にはテロップ特徴データ生成を実施し、テロップ認識対象カテゴリではない場合には、テロップ特徴データ生成は実施しない。
【0026】
一方、テキスト同士のマッチングのため、字幕を対象としたシーン検索及びメタデータを対象としたシーン検索は検索精度が高い。したがって字幕を含んだ番組は、字幕特徴データを生成し、字幕を含まない番組では、字幕特徴データを生成しない。同様に,メタデータを含んだ番組はメタデータ特徴データを生成し,メタデータを含まない番組では,メタデータ特徴データは生成しない。
【0027】
図4は、番組提示画面の一例である。
【0028】
番組提示画面4は、現在放送中の番組を表示するミニ画面41と、現在放送中の番組に関する情報を提示する番組放送情報表示画面42と、映像操作ボタン群43と、テレビ欄切り替えボタン44と、キーワード検索画面切り替えボタン45と、録画一覧表示切替ボタン46と、電子番組表表示領域47とから構成される。番組放送情報画面42に表示されているチャンネルを選択すると、選択チャンネルがハイライト表示される。録画一覧表示切替ボタン46を押すと、番組提示画面4は、図5に示す録画一覧表画面5に切り替わる。
【0029】
図5に示す録画一覧表画面5と図4における番組提示画面4との主な違いを説明する。録画一覧表画面5は、録画コンテンツを再生表示するミニ画面51と、録画コンテンツに関する情報を提示する録画コンテンツ情報表示画面52と、録画コンテンツの一覧表示画面53をもつ。録画コンテンツの一覧表示画面53は、サムネイル54で表示され、選択された録画コンテンツは、サムネイルの周囲がハイライト表示となり、他と視覚的に区別できるようになっている。
【0030】
キーワード検索画面切替ボタン45を押すと、録画一覧表画面5は、図6に示すキーワード検索画面6に切り替わる。
【0031】
図6に示すキーワード検索画面6と図5に示す録画一覧表画面5の主な違いを説明する。
【0032】
キーワード検索画面6では、録画コンテンツ情報表示画面52の領域が、検索キーワード入力領域62となっている。また、録画コンテンツの一覧表示画面53の領域が、検索結果を表示する検索結果表示画面66となっている。
【0033】
検索キーワード入力領域62は、検索キーワード入力欄63、検索開始ボタン64、検索対象表示切替チェックボックス65からなる。
【0034】
検索キーワード入力欄63は、ユーザが過去に入力したキーワードが履歴として表示選択できる、ドロップダウンリストボックスとなっている。
【0035】
次に、例えば図6のキーワード入力欄63に入力されたキーワードによるシーン検索方法の概要に関して説明する。
【0036】
図3を用いて、検索処理の例を説明する。なお、本処理は番組処理部104で実行される。番組処理部のうち、検索を実行する部位を検索部とも呼ぶ。
【0037】
処理ステップS301では、ユーザから入力されたキーワードを処理する。なお、本実施例においては、キーワードの入力方法は、キーボードによるテキスト入力としたが、マイクを通じた音声入力でもよいことはいうまでもない。
【0038】
処理ステップS302では、字幕が検索対象であるか否かを判定する。字幕が検索対象である場合には、処理ステップS303に進む。一方、字幕が検索対象でない場合には、処理ステップS305に進む。
【0039】
処理ステップS303では、字幕特徴データがあるか否かを判定する。番組によっては、字幕が付加されていない場合がある。字幕が付加されていない場合には、字幕特徴データは生成されないので、処理ステップS305に進む。一方、字幕特徴データがある場合には、処理ステップS304に進む。
【0040】
処理ステップS304では、処理ステップS301で入力されたキーワードと一致する文字列を字幕特徴データ中から検索する、字幕検索処理を実施する。
【0041】
処理ステップS305では、テロップが検索対象であるか否かを判定する。テロップが検索対象である場合には、処理ステップS306に進む。一方、テロップが検索対象でない場合には、処理ステップS308に進む。
処理ステップS306では、テロップ特徴データがあるか否かを判定する。テロップ特徴データがある場合には、処理ステップS307に進み、テロップ特徴データがない場合には、処理ステップS308に進む。
【0042】
処理ステップS307では、処理ステップS301で入力されたキーワードと一致する文字列をテロップ特徴データ中から検索する、テロップ検索処理を実施する。
【0043】
処理ステップS308では、音声が検索対象であるか否かを判定する。音声が検索対象である場合には、処理ステップS309に進む。一方、音声が検索対象でない場合には、処理ステップS311に進む。
【0044】
処理ステップS309では、音声特徴データがあるか否かを判定する。音声特徴データがある場合には、処理ステップS310に進み、音声特徴データがない場合には、処理ステップS311に進む。
【0045】
本発明では、シーン検索に使用する各種特徴データ(字幕特徴データ、テロップ特徴データ、音声特徴データ)は、番組録画時に生成し、ストレージ部119に格納する。したがって、ユーザがシーン検索する際には、既にシーン検索に使用する各種特徴データ生成が完了しているので、ユーザは録画終了直後から、所望のキーワードによるシーン検索機能を実施することが出来る。
【0046】
処理ステップS310では、処理ステップS301で入力されたキーワードと一致する文字列の音声パタンを音声特徴データ中から検索する、音声検索処理を実施する。
【0047】
処理ステップS311では、メタデータが検索対象であるか否かを判定する。メタデータが検索対象である場合には、処理ステップS312に進む。一方、メタデータが検索対象でない場合には、処理ステップS314に進む。
処理ステップS312では、メタデータ特徴データがあるか否かを判定する。メタデータ特徴データがある場合には、処理ステップS313に進み、メタデータ特徴データがない場合には、処理ステップS314に進む。
【0048】
処理ステップS313では、処理ステップS301で入力されたキーワードと一致する文字列をメタデータ特徴データ中から検索する、メタデータ検索処理を実施する。
【0049】
処理ステップS314では、上記4つの処理ステップ、すなわち処理ステップS304での字幕検索処理の結果と、処理ステップS307でのテロップ検索処理の結果と、処理ステップS310で音声検索処理の結果と、処理ステップS313でのメタデータ検索処理の結果とを比較して、時系列順に並び替えを実施し、キーワードの出現位置が最も小さい結果を保持する。
【0050】
なお、処理ステップの実施順序は、本実施の形態に限られるものではないことは言うまでもないことである。
【0051】
処理ステップS315では、検索範囲がコンテンツの終端まで達したか否かを判定し、コンテンツの終端まで達した場合には、処理ステップS316に進み、コンテンツの終端に達していない場合には、処理ステップS302に進み、繰り返し処理をする。
【0052】
なお、字幕についてコンテンツの終端まで達した後に、次にテロップについて終端まで達する方法もある。この場合、パーソナルコンピュータのように処理能力に余裕がある場合(ソフトウェアで実装し比較的高速なCPUで処理)には並列処理により、処理時間が短時間で済む。一方で処理中の負荷が高いので、高機能な演算処理装置を必要とする。一般に高機能な演算処理装置は高価である。また、組込みシステム(ハードウェアで実装)で使用する場合には、直列処理により、処理中の負荷は並列処理と比較すると低い。処理負荷が、小さいので、計算能力が低い演算処理装置を用いることができる。一般に、計算処理能力が低い演算処理装置は、経済的に安い傾向がある。安価に実現可能である。ただし、直列処理なので、処理時間が比較的長い。
【0053】
処理ステップS312では、一連の検索結果をユーザに提示する、検索結果提示処理を実施する。
【0054】
このように本処理によれば、ユーザはキーワードを入力すると、検索対象を意識することなく、検索結果を得ることが可能となる。
【0055】
以下、図3の検索結果の提示の方法について、複数の表示例を説明する。なお、当該表示例は番組処理部104で画面データが生成されI/F111から出力され、ディスプレイ装置120で表示される。この出力又は表示を提示と呼ぶ。また番組処理部104で画面データを生成し出力する部位を提示部とも呼ぶ。
【0056】
(検索結果表示例1)
図7に、図6の検索キーワード入力欄63に検索キーワードとして「太陽」を入力し、検索開始ボタン64を押して検索した場合の、検索結果の一例を示す。検索結果表示画面71には、検索キーワードが出現するシーンを頭だし部分として表示する。現在表示中のシーンは、特に太線で表現することにより、視覚的に区別できるようになっている。頭出しがしてあるので、ユーザはスキップ操作により、次から次へと、所望のシーンにスキップできる。
【0057】
本表示例の、他の表示例に対する長所は、検索対象の表示を同時に表示できるので,視認性が良好であることである。一方、検索対象の表示領域を個別に設けているため,表示画面サイズが比較的大きくなるという面や、次の検索結果シーンにスキップするためには,ユーザはリモコン操作でスキップを押すことになるという面もある。
【0058】
(検索結果表示例2)
図8に、検索結果表示画面81に字幕、テロップ、音声、メタデータを混在して表示する例を示す。字幕、テロップ、音声、メタデータを混在して表示するので、区別をつける必要がある。本実施例においては、区別として、マーカを用いることとする。例えば、字幕及びメタデータによる検索結果の場合には、先端に丸をつける。また、テロップによる検索結果の場合には、先端に菱形をつける。さらには、音声検索による結果の場合には、無印とするという具合である。
【0059】
検索結果には、検索結果の信頼度も返ってくるので、この信頼度を棒の長さとして表現する。スレッショルド82は、ユーザが上下に移動させることによりスレッショルド値を設定することが可能である。ユーザはスレッショルドを設定することにより、検索結果をさらにフィルタリングすることができる。
【0060】
本表示例の、他の表示例に対する長所は、ユーザが検索結果に対する信頼度のスレッショルド82を指定できるので,ユーザはシーン検索の検索結果表示に対して,さらに細かく制御することができることである。一方、次の検索結果シーンにスキップするためには,ユーザはリモコン操作でスキップを押すことになるという面もある。
【0061】
(検索結果表示例3)
図9に、検索結果表示画面91に字幕、テロップ、音声、メタデータを混在して表示する例を示す。字幕、テロップ、音声、メタデータを混在して表示するので、区別をつける必要がある。本実施例においては、区別として、色を用いることとする。例えば、字幕やメタデータによる検索結果は赤色で、テロップによる検索結果は緑色で、音声による検索結果は青色で表現するといった具合である。
【0062】
本表示例の、他の表示例に対する長所は、シーン検索対象の検索結果表示領域を共用することにより,表示画面サイズを小さくすることができることである。一方、次の検索結果シーンにスキップするためには,ユーザはリモコン操作でスキップを押すことになるという面もある。
【0063】
(検索結果表示例4)
図10に、検索結果表示画面91に字幕、テロップ、音声、メタデータを混在して表示する例を示す。図9までは、頭出し位置を線で表現していたが、本実施例においては、頭出し位置のサムネイルを用いることを特徴とする。字幕、テロップ、音声、メタデータを混在して表示するので、区別をつける必要がある。本実施例においては、区別として、色を用いることとする。例えば、字幕やメタデータによる検索結果は赤色で、テロップによる検索結果は緑色で、音声による検索結果は青色で表現するといった具合である。各サムネイルの周囲を上記の色の枠で囲うことにより、ユーザが容易に識別できるようにする。
【0064】
本表示例の、他の表示例に対する長所は、シーン検索結果をサムネイル表示するので,前記図7から9よりも検索結果を確認する際,検索結果が妥当か否かが分かりやすくなることである。一方、サムネイル表示により,コンテンツ中の時間的にどの部分から(前半であるか否か,後半であるのか否か)を直感的に把握することが難しい面や、サムネイル生成処理による負荷が大きい面や、サムネイル表示をしているので,検索結果が多いと,すべての検索結果を確認するのにスクロールする必要がある場合もある面、次の検索結果シーンにスキップするためには,ユーザはリモコン操作でスキップを押すことになるという面もある。
【0065】
(検索結果表示例5)
図11に、検索結果表示画面に字幕、テロップ、音声、メタデータを混在して表示する例を示す。字幕、テロップ、音声、メタデータを混在して表示するので、区別をつける必要がある。本実施例においては、区別として、色を用いることとする。例えば、字幕やメタデータによる検索結果は赤色で、テロップによる検索結果は緑色で、音声による検索結果は青色で表現するといった具合である。図7から図10までは、頭出し、すなわちキーワードが出現する瞬間をユーザに提示していたが、本実施例においては、キーワードが出現するある時間長さの塊として提示する。ある時間長さの塊としてユーザに提示することにより、ユーザは、キーワードを含んだシーンのダイジェストを視聴することが可能となる。
【0066】
本表示例の、他の表示例に対する長所は、シーン検索対象の検索結果表示領域を共用することにより,表示画面サイズを小さくすることができることである。また、検索結果が頭出しではなく,シーンとして検索されるので,ある検索結果から次の検索結果まで,自動的にスキップされ,利便性が向上する。
【図面の簡単な説明】
【0067】
【図1】番組録画再生装置の一実施例を示すブロック構成図。
【図2】音声検索用特徴データ生成判定処理手順の一例を示すフローチャート。
【図3】キーワードによるシーン検索の理手順の一例を示すフローチャート。
【図4】番組録画再生装置の番組放映画面構成の一例を示す図。
【図5】番組録画再生装置の録画コンテンツ選択用画面構成の一例を示す図。
【図6】番組録画再生装置のキーワード検索用画面構成の一例を示す図。
【図7】番組録画再生装置のキーワード検索結果提示用画面構成の一例を示す図(検索結果表示例1)。
【図8】番組録画再生装置のキーワード検索結果提示用画面構成の一例を示す図(検索結果表示例2)。
【図9】番組録画再生装置のキーワード検索結果提示用画面構成の一例を示す図(検索結果表示例3)。
【図10】番組録画再生装置のキーワード検索結果提示用画面構成の一例を示す図(検索結果表示例4)。
【図11】番組録画再生装置のキーワード検索結果提示用画面構成の一例を示す図(検索結果表示例5)。
【符号の説明】
【0068】
1…番組録画再生装置、
101…アンテナ、
102…チューナ、
103…録画再生制御部、
104…番組処理部、
105…補助記憶部、
106…CPU、
107…メモリ
113…スピーカ
115…入力装置
117…音声入力部、
118…映像入力部、
119…ストレージ部、
120…ディスプレイ装置
【特許請求の範囲】
【請求項1】
映像コンテンツ中から所望の場面を検索する映像検索装置であって、
映像コンテンツから音声信号、映像信号、データ信号の少なくとも二つを分離する分離部と、
前記分離部で分離したそれぞれの信号から、キーワード検索用の特徴データを生成する特徴データ生成部と、
前記特徴データ生成部で生成した特徴データに対して所望のキーワードが対応するかを検索する検索部と、
前記検索部で対応すると判断されたとき、音声信号と映像信号とデータ信号のうちいずれの信号から生成された特徴データと対応しているかを提示する検索結果提示部とを有する映像検索装置。
【請求項2】
請求項1の映像検索装置であって、
前記特徴データ生成部は、前記データ信号に含まれる字幕データから前記特徴データを生成する映像検索装置。
【請求項3】
請求項1又は2の映像検索装置であって、
前記特徴データ生成部は、前記映像信号に含まれるテロップ映像から前記特徴データを生成する映像検索装置。
【請求項4】
請求項1から3のいずれかの映像検索装置であって、
前記特徴データ生成部は、前記音声信号に含まれる音声から前記特徴データを生成する映像検索装置。
【請求項5】
請求項1から4のいずれかの映像検索装置であって、
前記特徴データ生成部は、前記データ信号に含まれるメタデータから前記特徴データを生成する映像検索装置。
【請求項6】
請求項1から5のいずれかの映像検索装置であって、
前記検索結果提示部は、音声信号と映像信号とデータ信号のうちいずれの信号から生成された特徴データと対応しているかに応じて、表示する色又はマークの形状を変えて出力する映像検索装置。
【請求項7】
請求項1から6のいずれかの情報検索装置であって、
前記検索結果提示部は、前記特徴データと前記キーワードとが対応している場面の時間幅も示す情報検索装置。
【請求項8】
請求項1から7のいずれかの映像検索装置であって、
前記検索結果提示部での提示のうち一つが選択されたとき、映像コンテンツのうち当該提示に対応する場面を再生する場面再生部を有する映像検索装置。
【請求項9】
映像コンテンツ中から所望の場面を検索する検索方法であって、
映像コンテンツの音声情報、テロップ情報、字幕情報、メタデータ情報の少なくとも二つの情報のうち、検索対象とする情報の選択を受け、
選択された情報に基づいて、所望のキーワードに対応する場面があるかを検索する検索方法。
【請求項10】
請求項9の検索方法であって、
前記検索の結果、音声情報、テロップ情報、字幕情報、メタデータ情報のうちいずれの情報に基づいて検索されたかを区別して提示する検索方法。
【請求項11】
請求項9の検索方法であって、
映像コンテンツのカテゴリを検出し、
当該検出したカテゴリに応じて、音声情報、テロップ情報、字幕情報、メタデータ情報のうち検索対象とする情報を選択する検索結果提示方法。
【請求項1】
映像コンテンツ中から所望の場面を検索する映像検索装置であって、
映像コンテンツから音声信号、映像信号、データ信号の少なくとも二つを分離する分離部と、
前記分離部で分離したそれぞれの信号から、キーワード検索用の特徴データを生成する特徴データ生成部と、
前記特徴データ生成部で生成した特徴データに対して所望のキーワードが対応するかを検索する検索部と、
前記検索部で対応すると判断されたとき、音声信号と映像信号とデータ信号のうちいずれの信号から生成された特徴データと対応しているかを提示する検索結果提示部とを有する映像検索装置。
【請求項2】
請求項1の映像検索装置であって、
前記特徴データ生成部は、前記データ信号に含まれる字幕データから前記特徴データを生成する映像検索装置。
【請求項3】
請求項1又は2の映像検索装置であって、
前記特徴データ生成部は、前記映像信号に含まれるテロップ映像から前記特徴データを生成する映像検索装置。
【請求項4】
請求項1から3のいずれかの映像検索装置であって、
前記特徴データ生成部は、前記音声信号に含まれる音声から前記特徴データを生成する映像検索装置。
【請求項5】
請求項1から4のいずれかの映像検索装置であって、
前記特徴データ生成部は、前記データ信号に含まれるメタデータから前記特徴データを生成する映像検索装置。
【請求項6】
請求項1から5のいずれかの映像検索装置であって、
前記検索結果提示部は、音声信号と映像信号とデータ信号のうちいずれの信号から生成された特徴データと対応しているかに応じて、表示する色又はマークの形状を変えて出力する映像検索装置。
【請求項7】
請求項1から6のいずれかの情報検索装置であって、
前記検索結果提示部は、前記特徴データと前記キーワードとが対応している場面の時間幅も示す情報検索装置。
【請求項8】
請求項1から7のいずれかの映像検索装置であって、
前記検索結果提示部での提示のうち一つが選択されたとき、映像コンテンツのうち当該提示に対応する場面を再生する場面再生部を有する映像検索装置。
【請求項9】
映像コンテンツ中から所望の場面を検索する検索方法であって、
映像コンテンツの音声情報、テロップ情報、字幕情報、メタデータ情報の少なくとも二つの情報のうち、検索対象とする情報の選択を受け、
選択された情報に基づいて、所望のキーワードに対応する場面があるかを検索する検索方法。
【請求項10】
請求項9の検索方法であって、
前記検索の結果、音声情報、テロップ情報、字幕情報、メタデータ情報のうちいずれの情報に基づいて検索されたかを区別して提示する検索方法。
【請求項11】
請求項9の検索方法であって、
映像コンテンツのカテゴリを検出し、
当該検出したカテゴリに応じて、音声情報、テロップ情報、字幕情報、メタデータ情報のうち検索対象とする情報を選択する検索結果提示方法。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【公開番号】特開2008−276340(P2008−276340A)
【公開日】平成20年11月13日(2008.11.13)
【国際特許分類】
【出願番号】特願2007−116314(P2007−116314)
【出願日】平成19年4月26日(2007.4.26)
【出願人】(000005108)株式会社日立製作所 (27,607)
【Fターム(参考)】
【公開日】平成20年11月13日(2008.11.13)
【国際特許分類】
【出願日】平成19年4月26日(2007.4.26)
【出願人】(000005108)株式会社日立製作所 (27,607)
【Fターム(参考)】
[ Back to top ]