説明

ダイジェスト映像生成装置およびプログラム

【課題】 ダイジェスト映像生成で実行する解析処理パラメータの候補のうち抽出結果をよくする解析処理パラメータを選択できるダイジェスト映像生成装置を提供する。
【解決手段】 ダイジェスト映像生成装置1は,映像2中でダイジェスト映像として抽出すべき区間を示す正解区間を指定する正解区間指定部11,パラメータ情報4をもとに各解析処理パラメータの値の変更の範囲を設定するパラメータ範囲設定部12,設定範囲内で解析処理パラメータの値を変更するパラメータ変更部13,解析処理パラメータおよびその値によって映像2を解析しダイジェスト映像と判断する区間を抽出するダイジェスト映像生成部14,抽出された区間と正解区間3の一致度を計算する一致度算出部15,一致度をもとに解析処理パラメータの評価値を算出するパラメータ評価値算出部16,評価値が高い解析処理パラメータを選択するパラメータ選択部17を備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は,ダイジェスト映像生成における,映像データを解析して映像部分を抽出する解析処理のパラメータの選択技術に関する。
【背景技術】
【0002】
近年,ハードディスクレコーダの普及により,TV映像など自動録画された映像が大量に蓄積されるようになっており,見たい映像を見つける手間が問題となっている。また,監視カメラ映像,ホームビデオ,企業内の業務映像など他の様々なジャンルの映像に関しても同様の問題がある。
【0003】
上記の問題への対処として,蓄積された映像から,所望する映像部分(あるまとまりをもった映像の一部分)を抽出して繋げたダイジェスト映像を用いる方法がある。ダイジェスト映像として抽出される映像は,いわゆる見所となるシーンである。例えば,「野球の得点シーン」といえば,野球試合の映像中で得点があがった場面だけを切り出した映像部分(シーン)である。
【0004】
このような見所となるシーンを繋げたダイジェスト映像を見ることによって,映像全体の内容を短時間で把握することができる。また,ダイジェスト映像を次々と再生して見ることによって,見たい映像を見つける手間を軽減することができる。
【0005】
ユーザが所望する見所となるシーン(以下,ハイライトシーンという)を抽出してダイジェスト映像を人手で生成することは手間がかかる。そのため,映像データから見所となるシーンを自動的に抽出してダイジェスト映像を生成するダイジェスト映像生成装置が必要とされている。
【0006】
従来,映像データから特定部分を抽出する処理技術として,コンテンツデータを時間分割し,分割時間ごとに長いシーンを複数抽出し,サムネイルとなる特徴点をもとに,抽出したシーンから特定のサムネイル画像を生成する装置が知られている。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】特開2001−298711号公報
【発明の概要】
【発明が解決しようとする課題】
【0008】
ハイライトシーンは,映像のジャンルや要求される見所の内容によって異なる。例えば,テレビ放映される野球,サッカーなどのスポーツ映像の場合には,一般的に,ハイライトシーンとして「得点シーン」があげられる。一方,アクション映画の場合のハイライトシーンは,戦闘シーン,カーチェイスシーンなどの「アクションシーン」である。また,監視カメラで撮影された映像でのハイライトシーンは,不審者らしき存在が映っているシーンである。
【0009】
ダイジェスト映像生成処理において,映像からハイライトシーンを抽出する場合に,映像や見所に対応させた解析処理を行う必要がある。一例として,野球の得点シーンがハイライトシーンであれば,映像中の観客の歓声を解析する処理によって,アクション映画のカーチェイスシーンがハイライトシーンであれば,カーチェイス時の音を解析する処理によって,適切なダイジェスト映像のためのシーンの抽出が可能である。
【0010】
したがって,ダイジェスト映像生成で実行される解析処理パラメータが複数ある場合に,対象となる映像データのジャンルに応じて適切にハイライトシーンを抽出できる解析処理パラメータを選択できるようにする必要がある。
【0011】
本発明の目的は,ダイジェスト映像生成で実行される複数の解析処理パラメータから,対象となる映像データのジャンルに応じた解析処理パラメータを選択して,映像データのジャンルに対応したハイライトシーンを適切に抽出するダイジェスト映像生成装置を提供することである。
【0012】
また,本発明の別の目的は,コンピュータに,前記ダイジェスト映像生成装置で実現される処理を実行させるためのプログラムを提供することである。
【課題を解決するための手段】
【0013】
本願において開示されるダイジェスト映像生成装置は,特定ジャンルの映像を解析処理して抽出した区間を用いてダイジェスト映像を生成するダイジェスト映像生成装置であって,1)ダイジェスト映像とすべき区間の指定を受け付けて、受け付けた区間を正解区間とする正解区間指定部と,2)ダイジェスト映像とする区間を特定すべき解析処理パラメータと該パラメータの値を変化させる範囲の指定を受け付け,受け付けた解析処理パラメータおよびその値によって映像を解析してダイジェスト映像と判断する区間を抽出するダイジェスト映像生成部と,3)前記ダイジェスト映像生成部が映像からダイジェスト映像と判断する区間を抽出する度に,前記抽出した区間と前記正解区間との一致度を算出する一致度算出部と,4)前記一致度が高い抽出区間を抽出した解析処理パラメータおよびその値が高い評価値となる評価処理を行って,前記解析処理パラメータの変更された値ごとに評価値を算出するパラメータ評価値算出部と,5)前記ダイジェスト映像生成部で実行された解析処理パラメータから,前記評価値が最も高い解析処理パラメータおよびその値を選択するパラメータ選択部とを有する。
【発明の効果】
【0014】
上記の開示したダイジェスト映像生成装置によれば,ダイジェスト映像生成のための映像データの解析処理において,ハイライトシーン抽出の判定条件となる解析処理パラメータおよびその値を映像のジャンルにもとづいて選択することができ,よって映像のジャンルに応じた適切なダイジェスト映像を生成することができる。
【図面の簡単な説明】
【0015】
【図1】解析処理パラメータと抽出結果との関連性を説明するための図である。
【図2】解析処理パラメータと抽出結果との関連性を説明するための図である。
【図3】音の大きさの解析処理パラメータ例を説明するための図である。
【図4】一実施例におけるダイジェスト映像生成装置の構成例を示す図である。
【図5】一実施例における映像および正解区間の例を示す図である。
【図6】一実施例におけるパラメータ情報の例を示す図である。
【図7】一実施例における正解区間の例を示す図である。
【図8】一実施例におけるパラメータ調査テーブルの例を示す図である。
【図9】一実施例におけるダイジェスト映像生成の例を示す図である。
【図10】一実施例におけるダイジェスト映像抽出結果テーブルの例を示す図である。
【図11】一実施例における一致度算出の例を示す図である。
【図12】一実施例におけるパラメータ一致度テーブルの例を示す図である。
【図13】一実施例における解析処理パラメータの一致度の変換の不規則さを説明するための図である。
【図14】一実施例におけるパラメータ評価テーブルの例を示す図である。
【図15】一実施例におけるダイジェスト映像生成装置の処理フロー例を示す図である。
【発明を実施するための形態】
【0016】
まず,本発明者が考察した,ダイジェスト映像生成装置で実行される解析処理について説明する。
【0017】
ダイジェスト映像を生成するために映像からハイライトシーンを抽出する処理では,映像中の「音の大きさの抽出」,「画像の変化量の抽出」など各種の解析処理を組み合わせて実現される。これらの解析処理はパラメータを有し,各パラメータは1つの数値を持つ。解析処理パラメータの一例として,「音の大きさの抽出」処理における,音の大きさを抽出する時間間隔などがある。したがって,解析処理パラメータを変更することによって,解析処理を変更することができ,また,解析処理パラメータの数値を変更することによって解析処理の抽出結果を変更することができる。
【0018】
上述したように,映像のジャンルごとにハイライトシーンが異なる。映像のジャンルとは,映像の内容のジャンルである。映像のジャンル例として,放送番組映像,映画,ホームビデオ映像,監視カメラ映像,業務用映像などのジャンルがある。また,各ジャンルは下位ジャンルを持つ。例えば,放送番組映像であれば,ニュース,スポーツ,ドラマなどの下位ジャンルがあり,さらに,スポーツには,野球,サッカー,フィギュアスケートなどの下位ジャンルがある。
【0019】
したがって,映像のジャンルごとにハイライトシーンが異なるため,処理対象の映像のジャンルに対応した解析処理パラメータを設定したダイジェスト映像生成装置を用意する必要がある。
【0020】
一方で,抽出したいハイライトシーンが同じようなものである場合は,解析処理パラメータの値を変更することで対応が可能な場合もある。例えば,スポーツ映像のダイジェスト映像を生成する場合に,ハイライトシーンとして得点シーンを抽出すると仮定する。得点シーンでは,一般的に,観客が歓声をあげるため,歓声を抽出できれば,得点シーンを抽出することができる。抽出する歓声の特徴として,スポーツが野球であれば,タイムリーヒットなどが発生すると即座に観客が歓声をあげることから,「音の大きさが急に大きくなる」ことがあげられる。そこで,映像の音声を解析し,「音の大きさが大きく,かつ,音の大きくなる速度が速い」という条件を満たす映像部分を,ハイライトシーンとして抽出することができる。なお,実際のダイジェスト映像生成では,これ以外にも多くの解析処理を組み合わせている。また,サッカーの映像でも,一般的に,得点シーンでは観客が歓声をあげるため,同様に歓声を抽出できれば,得点シーンを抽出することができる。したがって,野球やサッカーの試合の映像から得点シーンをハイライトシーンとして抽出する場合に,同じ解析処理パラメータを用いることができる。
【0021】
ただし,野球とサッカーとでは,得点時の観客の歓声のあげ方が異なるため,「音の大きさ」,「音の大きくなる速度」の解析処理パラメータの値は同じではない。例えば,野球映像の場合は,得点シーンはホームランやタイムリーヒットなどであり,打った瞬間に観客が反応して歓声があがるため,上記2つのパラメータのうち,「音の大きくなる速度」が重視される。一方,サッカー映像の場合は,野球と同様に一瞬の攻防から急にチャンスが生まれ観客が反応する場合もあるが,ボールを中央付近からドリブルで持ち込んでシュートする場合もある。ドリブルからのシュートによる場合は,ボールをゴール付近に持ちこむのにある程度時間がかかるため,ゴールが近づくにつれて観客の歓声が徐々に大きくなる傾向があり,急に大きくなるという条件を満たしにくい。そこで,上記2つのパラメータのうち,「音の大きさ」がより重視される。
【0022】
このように,映像からハイライトシーンを抽出する処理の構築において,問題になるのは,上記のように,どのような解析処理パラメータを設定するか,および,どのような値を設定するかという点である。すなわち,解析処理パラメータおよびその値によって,抽出処理の処理結果,すなわち抽出されるハイライトシーンが大きく変化する。
【0023】
そのため,処理対象の映像のジャンルにもとづいて,ダイジェスト映像生成のための解析処理パラメータ,および解析処理パラメータの値を選択する必要がある。
【0024】
以下,本発明の一態様として開示するダイジェスト映像生成装置の一実施形態を説明する。
【0025】
(1)解析処理パラメータの選択
ダイジェスト映像生成装置は,複数の解析処理パラメータの候補から選択された解析処理パラメータを実行して,処理対象となる映像を解析して抽出した1または複数のハイライトシーンを用いてダイジェスト映像を生成する。
【0026】
ダイジェスト映像生成装置は,実行可能な複数の解析処理パラメータの候補を予め備えておく。ダイジェスト映像生成装置は,対象となる特定のジャンルの映像を受け付け,さらに,その映像から,ユーザが所望する見所となるシーン(ハイライトシーン)として抽出されるべき区間(開始時刻と終了時刻との組)を示す指定を受け付けて,受け付けた区間を正解区間として設定する。
【0027】
次に,ダイジェスト映像生成装置は,複数の解析処理パラメータの候補を1つずつ取り出して,その値(パラメータ値)を変化させて映像を解析し,解析の結果として抽出した区間と正解区間との一致度を算出する。その後,ダイジェスト映像生成装置は,抽出した区間と正解区間との一致度が最高となった場合の解析処理パラメータの候補とその値を選択し,処理したジャンルに対するダイジェスト映像生成における解析処理パラメータとして設定する。
【0028】
解析処理パラメータおよびその値が変更されることにより抽出結果の範囲が変わることから,ダイジェスト映像生成装置は,映像のジャンルごとに最適な解析処理パラメータの値を選択することができる。
【0029】
(2)解析処理パラメータの値の調整
ダイジェスト映像生成の処理精度の向上をはかり,新たな解析処理を追加させる場合がある。例えば,テレビ放映の野球映像中に広告映像(CM)が存在するため,CMを見所シーンとして抽出してしまうことがある。このような誤抽出に対応するため,ダイジェスト映像生成における解析処理として,映像中のCMを解析して除外する機能が追加される。そのような場合には,新たなパラメータが増えるだけでなく,既存のパラメータの最適値も変わるおそれがあり,多くの場合に解析処理パラメータの値を再調整する必要がある。実際には全ての解析処理パラメータの値を変更する必要はないが,どの解析処理パラメータの値を変更すれば有効な調整となるかを知る必要がある。ダイジェスト映像生成に実行する解析処理パラメータ数が増加すると,値を調整する解析処理パラメータの特定には多くの時間を要する。
【0030】
さらに,解析処理パラメータによっては,その値を変更しても抽出結果が良くならないものがある。すなわち,値を変更した解析処理によっても,抽出されたハイライトシーンが正解区間に近づかない場合,抽出されたハイライトシーンが,変更前のものとどのように変化しているのかが人間にとって分かりにくい場合などがある。
【0031】
図1および図2は,解析処理パラメータと抽出結果との関連性を説明するための図である。
【0032】
図1に示すように,値を100,150,300と変化させた場合に,各値と抽出結果(抽出した区間)とに関連性がない解析処理パラメータがある。このような解析処理パラメータを,不規則な解析処理パラメータと呼ぶ。一方,図2に示すように,値を同様に変化させた場合に,各値と抽出結果とに関連性があると考えられる解析処理パラメータがある。このような解析処理パラメータを,不規則ではない解析処理パラメータと呼ぶ。
【0033】
解析処理パラメータを調整する際に,不規則な解析処理パラメータの値を変更することは効率がよくない。例えば,音の大きさの解析処理に関して,音の大きさを抽出する時間間隔や画像を部分領域に分割しそれぞれの変化量を求める際に,部分領域のサイズのパラメータは,不規則なものと考えられる。
【0034】
逆に,歓声の長さの解析処理に関して,長さのパラメータは,不規則ではないものと考えられる。野球で観客が歓声をあげた場合に,一般的に,得点シーンであれば歓声が長く持続するが,大きめの外野フライなどの惜しいプレイのシーンであれば,歓声があがった後急に大きさが小さくなる。例えば,図2に示すように,歓声の長さを決めるパラメータの値を大きく(長く)すると,得点シーンに該当する部分以外は抽出されにくくなるが,大き過ぎる(長すぎる)と得点シーンに該当する部分ですら抽出されなくなる。また,歓声の長さを決めるパラメータの値を小さく(短く)すると,得点シーン以外の部分も抽出されやすくなる。したがって,不規則ではない画像解析処理パラメータの値を調整の対象とすることで,抽出結果を効率的に変更させることができる。
【0035】
開示するダイジェスト映像生成装置は,上記のような不規則ではない解析処理パラメータを選択し,パラメータの値を変更する対象とすることができる。よって,画像解析処理パラメータの調節を効率化することができる。
【0036】
(3)解析処理パラメータの具体例
次に,ダイジェスト映像生成装置で実行するダイジェスト映像生成の解析処理パラメータについて,より具体的に説明する。
【0037】
野球映像のダイジェスト映像として得点シーンを抽出する場合を例とする。得点シーンでは,一般的に観客が歓声をあげるため,歓声を抽出できれば,得点シーンを抽出することができる。
【0038】
歓声の特徴としては,タイムリーヒットなどが発生すると,即座に観客が歓声をあげるため,「音の大きさ」が大きくなることがあげられる。さらに,得点シーンの場合は,歓声が長く持続するが,逆に,大きめの外野フライなどの惜しいプレイの場合は,歓声があがった後,急に大きさが小さくなる。
【0039】
そこで,野球映像からダイジェスト映像に用いるシーンを抽出方法として,まず「音の大きさ」を抽出する処理を実行する。
【0040】
図3は,音の大きさの解析処理パラメータ例を説明するための図である。
【0041】
図3は,映像に含まれる音声の所定時間間隔での平均を表す。音の大きさは,一定時間間隔(たとえば,0.1秒間隔)での音声データの平均を行うことで抽出できる。
【0042】
歓声が急に大きくなったという時点を抽出するため,ある時点の前後の一定時間内での音の大きさの平均化処理を行う。
【0043】
ある時点で歓声があがった場合に,その時点の前の区間での音の大きさの平均は小さくなり,その時点の後の区間での音の大きさの平均は大きくなる。図3に示すように,平均を行う一定時間の範囲の長さは前と後で違う値にする。
【0044】
特に,後の区間の長さが得点シーンの抽出に大きく影響することが考えられる。得点シーンの歓声の場合には歓声が長く続くので,後の方の平均をとる区間の長さを,歓声の長さとして解析処理パラメータで指定する。前の平均をとる区間の長さを“2秒”程度,後の平均をとる区間の長さ(歓声の長さ)を“10秒”程度として,前の平均と後の平均の差分を抽出し,その差分が大きい時点を,抽出する区間の評価値の1つとする。
【0045】
さらに,歓声が大きくなる速度を抽出するために,上記の処理で特定したその時点前後での音の大きさの傾きを算出する。この傾きの大きさを評価値の1つとして,2つの評価値を重み付きで加えることで,最終的な評価値を算出する。
【0046】
さらに,ダイジェスト映像生成では別の解析処理パラメータも使用することができる。放送映像の場合には,広告映像(CM)が挿入されているため,CM区間をハイライトシーンとして誤抽出してしまうことがある。そのような誤抽出に対処するために,予めCM区間を検出して,検出したCM区間からハイライトシーンを抽出しないようにすることができる。
【0047】
ダイジェスト映像生成においてCM区間を検出する際に,CM区間の長さが15秒の倍数であること,CM区間の開始と終了には0.5秒程度(2つのCM区間の間では合計1秒)の無音区間が含まれることなどのCM区間の特徴を利用する。なお,実際の放映映像の場合には番組編集の都合やノイズなどの影響によって,CM区間が必ずしも0.5秒程度の無音区間を含むとは限らない。また,野球映像中に挿入されるニュース番組等に無音区間が含まれるため誤検出が多くなる。
【0048】
そこで,CM区間を精度よく検出するための解析処理パラメータとして,音の大きさから無音区間を抽出する際の無音の閾値,CM区間での無音区間の最小値(秒)などの解析処理パラメータを使用する。さらに,CM区間は連続して現れることが多いので,連続として現れたCM区間の最大長,最小長などの解析処理パラメータを使用する。
【0049】
(4)ダイジェスト映像生成装置の構成例
次に,開示するダイジェスト映像生成装置の一実施例における構成例を説明する。
【0050】
図4は,一実施例におけるダイジェスト映像生成装置の構成例を示す図である。
【0051】
上述のような処理を実現するダイジェスト映像生成装置1は,正解区間指定部11,パラメータ範囲設定部12,パラメータ変更部13,ダイジェスト映像生成部14,一致度算出部15,パラメータ評価値算出部16,およびパラメータ選択部17を備える。
【0052】
正解区間指定部11は,映像2においてダイジェスト映像とすべき区間の指定を受け付けて,受け付けた区間を示す正解区間3を保持する。
【0053】
図5は,映像2および正解区間3の例を示す図である。
【0054】
映像2は,ダイジェスト映像生成の対象であって,音声を含む映像データである。
【0055】
正解区間指定部11は,映像2を受け付け,ユーザによって指定された映像2中で正解区間を示す区間の開始時刻および終了事項を特定して正解区間3とする。
【0056】
正解区間3は,ある映像2に対して人手によって指定された,ダイジェスト映像5として抽出される正しい区間(ハイライトシーン)を示す情報である。
【0057】
図6は,正解区間3の例を示す図である。
【0058】
正解区間3の一例である正解区間テーブル31は,映像ID,区間ID,開始時刻,終了時刻の項目を持つ。
【0059】
区間IDは,ある映像2の区間における一意の識別番号である。映像IDは,対象となる映像2を一意に識別する番号である。図6の正解区間テーブル31では,映像IDの項目を持つ例を示しているが,映像2が1つだけの場合は,映像IDのデータ項目は不要である。映像2が複数である場合は,該当する映像のファイル名などを管理する映像テーブルを別途設けて参照して映像ファイル名を記述する。開始時刻および終了時刻は,正解区間として示された区間の開始と終了の位置を,映像2の先頭からの時刻で示すものである。
【0060】
正解区間テーブル31には,正解区間3として指定された各区間の開始時刻および終了時刻が記述される。
【0061】
パラメータ範囲設定部12は,ダイジェスト映像とする区間を特定すべき解析処理パラメータと,そのパラメータの値を変化させる範囲を示すパラメータ情報4を受け付け,受け付けたパラメータ情報4をもとに,ダイジェスト映像生成部14が使用する解析処理パラメータごとに,指定された範囲内で変更させる値を決定してパラメータ調査テーブル121に設定する。
【0062】
パラメータ情報4は,ダイジェスト映像生成における解析処理パラメータごとの初期値,および値の変化の範囲(最大値および最小値)が設定された情報である。
【0063】
図7は,パラメータ情報4の例を示す図である。
【0064】
パラメータ情報4の一例であるパラメータテーブル41は,パラメータID,パラメータ名,初期値,最小値,最大値の項目を持つ。パラメータIDは,解析処理パラメータごとに一意な識別番号である。初期値は,ダイジェスト映像生成部14の最初の解析処理で使用される値,最小値および最大値は,2回目以降の処理で,値が変更される範囲を示す値である。
【0065】
パラメータテーブル41では,解析処理パラメータごとに,これらのデータ項目にデータが設定されている。例えば,パラメータID=0の「歓声の長さ」は,初期値として“10.0”をとり,最小値“5.0”から最大値“20.0”の範囲で値が変更されて処理に使用されることを表す。
【0066】
図8は,パラメータ調査テーブル121の例を示す図である。
【0067】
パラメータ調査テーブル121には,パラメータID,パラメータ調査ID,パラメータ値の項目を持つ。パラメータIDは,解析処理パラメータの一意の識別番号である。パラメータ値は,パラメータ範囲設定部12が決定した値であり,値を一意に識別するパラメータ調査IDが対応付けられて設定される。
【0068】
パラメータ変更部13は,ダイジェスト映像生成部14の解析処理パラメータの値を,パラメータ調査テーブル121に設定された値を用いて変更する。
【0069】
ダイジェスト映像生成部14は,パラメータ調査テーブル121をもとに,解析処理パラメータおよび変更された値によって映像2を解析してダイジェスト映像と判断する区間を抽出する。
【0070】
図9は,ダイジェスト映像生成の例を示す図である。
【0071】
一例として,ダイジェスト映像生成部14は,画像と音声とを含む映像2について,その音声を指定された解析処理パラメータの値で解析して区間(ハイライトシーン)を抽出し,ダイジェスト映像抽出結果テーブル141に,抽出結果を記述する。
【0072】
図10は,ダイジェスト映像抽出結果テーブル141の例を示す図である。
【0073】
ダイジェスト映像抽出結果テーブル141は,映像ID,パラメータ調査ID,区間ID,開始時刻,終了時刻の項目を持つ。
【0074】
映像IDは,抽出した映像2の識別番号である。パラメータ調査IDは,解析処理パラメータの各値の識別番号である。区間IDは,解析処理により抽出した区間を一意に識別する番号である。開始時刻および終了時刻は,抽出された区間の開始と終了の位置を,映像2の先頭からの時刻で示すものである。
【0075】
図10の例では,映像IDが“0”の映像2において,パラメータ調査IDが“0(値=0.1)”の場合に抽出された区間(区間IDが“0”)は,開始時刻が“11.0”から終了時刻が“14.5”の区間であることを表す。
【0076】
一致度算出部15は,ダイジェスト映像生成部14が映像2を解析して正解区間3と判断する区間を抽出する度に,抽出した区間と正解区間3との一致度を算出する。
【0077】
図11は,一致度算出の例を示す図である。
【0078】
図11に示すように,一致度算出部15は,例えば,正解区間3とダイジェスト映像生成部14の抽出結果である区間とを比較し,両者の一致区間と不一致区間との割合を求めて,ハイライトシーンを抽出した解析処理パラメータとその値に対する一致度を計算する。
【0079】
図12は,パラメータ一致度テーブル151の例を示す図である。
【0080】
パラメータ一致度テーブル151は,映像ID,パラメータID,パラメータ調査ID,一致度の項目を持つ。映像IDは,映像2の識別番号,パラメータIDは,処理した解析処理パラメータの識別番号,パラメータ調査IDは,処理した解析処理パラメータの値の識別番号,一致度は,計算された一致度である。
【0081】
パラメータ評価値算出部16は,ダイジェスト映像生成部14が実行した解析処理パラメータの値ごとに,一致度が大きいほど高い評価値となる式を用いて評価値を算出する。
【0082】
または,パラメータ評価値算出部16は,ダイジェスト映像生成部14が実行した解析処理パラメータごとに,変化させた値に対応して計算された一致度の変化の不規則さを調べて,不規則ではないものが高い評価値となる式を用いて評価値を算出する。
【0083】
図13は,解析処理パラメータの一致度の変換の不規則さを説明するための図である。
【0084】
図13(A)は不規則な解析処理パラメータである場合の一致度の変化をグラフ化して示す図,図13(B)は不規則ではない解析処理パラメータである場合の一致度の変化をグラフ化して示す。
【0085】
図13(A)に示すように,不規則なパラメータは,その値が変化する(例えば増加する)場合に,値の変化とは無関係に一致度が上下を繰り返す。一方,図13(B)に示すように,不規則ではないパラメータは,その値が変化する(例えば増加する)場合に,パラメータの値の変化に対応して,各パラメータの値に対する一致度が,増加傾向,減少傾向,または1つのピークを持つ増加減少傾向を示す。
【0086】
図13(A)および図13(B)に示すように,解析処理パラメータの値について一致度の変化が不規則であるほど,一致度をグラフ化した場合のグラフ線の道のりが長くなる。
【0087】
パラメータ評価値算出部16は,解析処理パラメータpの値pを変更した場合の一致度m(p)の変化をグラフ化し,グラフの道のりの長さを求める。一例として,パラメータ評価値算出部16は,以下の条件で,各解析処理パラメータに対する評価値を算出する。
【0088】
・ 一致度の変化をグラフにした場合の道のりの長さが短い,
・ 一致度の最大値が大きい。
【0089】
パラメータ評価値算出部16は,例えば,以下の評価式を用いて評価値rを算出する。
【0090】
【数1】

【0091】
上記の式(1)右辺の左側項目は,一致度の最大値である。右辺の中央項目は,一致度の最大値と最小値の差であり,一致度の道のりを計算する際の大きさを合わせるための項目(正規化項)である。右辺の右側項目は,道のりの長さであり,この値が小さいほど評価値が大きくなる。式(1)の中央項目は,右側項目より必ず小さくなるため,評価値rは,0から1の間の値をとる。
【0092】
パラメータ評価値算出部16は,各解析処理パラメータについて計算した評価値を,パラメータ評価テーブル161に格納する。
【0093】
図14は,パラメータ評価テーブル161の例を示す図である。
【0094】
パラメータ評価テーブル161は,パラメータID,評価値のデータ項目を持つ。パラメータIDは,解析処理パラメータの一意の識別番号であり,評価値は,対応して計算された評価値である。
【0095】
パラメータ選択部17は,パラメータ評価値算出部16の結果から,高い評価値を持つ解析処理パラメータとその値を選択する。
【0096】
(5)ダイジェスト映像生成装置の処理例
次に,ダイジェスト映像生成装置1の処理の流れを説明する。
【0097】
図15は,ダイジェスト映像生成装置1の処理フロー例を示す図である。
【0098】
ステップS1: 正解区間指定部11が,映像2についての正解区間3を指定する。
【0099】
正解区間指定部11は,予め正解区間テーブル31を用意しておき,受け付けた映像2においてユーザが指定した正解の区間(ハイライトシーン)を示す各区間の開始時刻,終了時刻を検出し,正解区間テーブル31に設定する。
【0100】
ステップS2: パラメータ範囲設定部12が,変更する解析処理パラメータの値のリストを指定する。
【0101】
パラメータ範囲設定部12は,パラメータ情報4の一例であるパラメータテーブル41を受け付け,パラメータテーブル41をもとに,解析処理パラメータごとに,変化させる範囲として抽出すべき複数の値を決定し,決定した値をパラメータ調査テーブル121に設定する。
【0102】
パラメータ範囲設定部12は,値の決定処理として,以下のいずれかの処理を行い,以下の式で値を決定する。以下の式(2)〜式(4)では,パラメータのi番目の値をp(i),パラメータの初期値をinit,パラメータの最大値をmax,パラメータの最小値をmin,パラメータの個数をNとする。
【0103】
パラメータ範囲設定部12は,最大値,最小値間を等分にして値を決定する場合に,p(i)を式(2)で求める。
【0104】
式(2): p(i)=(max-min)・i/N+min
また,パラメータ範囲設定部12は,初期値から最大値,最小値を等分にして値を決定する場合に,p(i)を式(3)で求める。
【0105】
式(3):
if i>=N/2 p(i)=(max-init)・(i-N/2)N+init
else p(i)=(max-min) ・i/N+min
パラメータ範囲設定部12は,最大値と最小値,初期値の関係をもとに値を決定する場合,例えば,最小値が初期値の10分の1,最大値が初期値の10倍になっている場合に,対数とみなして対数軸で等分して値を決定する。この場合に,p(i)を以下の式(4)で求めることができる。
【0106】
式(4):
if i>=N/2 p(i)=exp(log max - log init)・(i-N/2)N + log init
else p(i)=exp(log max - log min) ・i/N + log min
ステップS3: パラメータ範囲設定部12が,パラメータテーブル41をもとに,ダイジェスト映像生成部13が実行する解析処理パラメータを初期値に設定する。
【0107】
ステップS4: ダイジェスト映像生成部14が,現在の解析処理パラメータの値で,映像2から区間を抽出する。例えば,ダイジェスト映像生成部14は,野球映像である映像2から,音声の大きさを解析処理して区間(ハイライトシーン)を抽出し,抽出結果として,抽出した区間,実行した解析処理パラメータとその値などをダイジェスト映像抽出結果テーブル141に格納する。
【0108】
ダイジェスト映像生成部14は,1回目の処理として,全ての解析処理パラメータが初期値の状態で解析処理を行って,映像2からハイライトシーンを抽出する。2回目以降の処理では,ダイジェスト映像生成部14は,パラメータ調査テーブル121にもとづいてパラメータ変更部13が変更した値(変更値)を用いて同様に解析処理したハイライトシーンを抽出する。
【0109】
ステップS5: 一致度算出部15が,正解範囲3とダイジェスト映像生成部14の抽出結果との一致度を算出する。
【0110】
一致度算出部15は,ダイジェスト映像抽出結果テーブル141と正解区間テーブル31とをもとに,パラメータ調査IDごとに一致度を求める。一致度は,区間と区間とを重ねたときに一致している割合(一致度)とする。
【0111】
例えば,一致度算出部15は,2つのテーブル(ダイジェスト映像抽出結果テーブル141,正解区間テーブル31)の各区間の開始時刻と終了時刻とをもとに,一致区間と不一致区間とを求めて,それぞれの区間の長さから一致度を求める。
【0112】
一致度算出部15は,2つのテーブルの上から順に,それぞれ1つの区間を取得し,取得した2つの区間の重なりを判定し,2つのテーブルのデータが終了するまで,以下の処理を繰り返す。
【0113】
一致度算出部15は,取り出した2つの区間に全く重なりがない場合は,時間的に前(開始時刻が前)の方の区間の長さを不一致区間の長さに加算する。そして,一致度算出部15は,時間的に前の方の区間の次の区間を取得する。次の区間がない場合は,一致度算出部15は,もう一方の区間の長さを不一致区間の長さに加算し,計算を終了する。
【0114】
一致度算出部15は,2つの区間に重なりがある場合であって,開始時間がずれているときは,「ずれ」の分だけ不一致区間の長さに加算し,重なっている区間を一致区間の長さに加算する。そして,一致度算出部15は,終了時刻が早い方の区間の次の区間を取得する。終了時刻が遅い方の区間の開始時刻を,重なりの終了区間に設定する。次の区間がない場合は,一致度算出部15は,もう一方の区間の長さを不一致区間の長さに加算して,計算を終了する。
【0115】
また,別の方法として,一致度算出部15は,一致度を所定の計算式で求めることができる。
【0116】
一致度mの計算式は,抽出結果の長さの合計をe,正解区間の長さの合計をc,一致区間の長さの合計をuとした場合に,以下の式(5)で表すことができる。
【0117】
式(5): m=2u/(e+c)
正解区間の長さの合計cは,正解区間テーブル31の各区間の同一映像IDの開始時刻と終了時刻の時間差を全て加算することで求めることができる。一致区間の長さの合計uも,同様に,ダイジェスト映像抽出結果テーブル141の同一映像IDの同一パラメータ調査IDの区間の開始時刻と終了時刻との時間差を全て加算することで求めることができる。上記の式(5)では,分母が全ての区間の和,分子が一致している区間の長さ(×2)となっている。したがって,全ての区間が完全に一致した場合に1,全く重ならなかった場合に0,どちらでもない場合は,0より大きく1より小さい値になる。この値が大きいほど,2つの区間が一致していると見ることができる。
【0118】
一致度算出部15は,計算した一致度をパラメータ一致度テーブル151に保存する。
【0119】
ステップS6: パラメータ変更部13が,解析処理パラメータについて全ての値の変更が完了したかを調べる。
【0120】
パラメータ調査テーブル121に設定されている,解析処理パラメータの全ての値の変更が完了していなければ(ステップS6のN),ステップS7の処理を行い,完了していれば(ステップS6のY),ステップS8の処理を行う。
【0121】
ステップS7: パラメータ変更部13が,解析処理パラメータを変更する。
【0122】
パラメータ変更部13は,パラメータ調査テーブル121をもとに,パラメータIDおよびパラメータ調査IDで指定されるその解析処理パラメータの次の値を得て,ダイジェスト映像生成部14の解析処理パラメータ値を変更する。
【0123】
ステップS8: パラメータ評価値算出部16が,解析処理パラメータの評価値を算出する。
【0124】
パラメータ評価値算出部16は,パラメータ一致度テーブル151の結果をもとに解析処理パラメータの評価値を算出する。
【0125】
パラメータ評価値算出部16は,不規則な解析処理パラメータの評価値がより低くなるような評価式を用いて,パラメータ一致度テーブル151をもとに評価値を計算する。
【0126】
例えば,1つのパラメータあたりのパラメータ調査IDの個数をN,パラメータ一致度テーブル151のi番目の一致度をm(i)とし,iが0以上N未満の場合の一致度の最大値と最小値を以下のように記述するとする。
【0127】
最大値=max(m(i))
最小値=min(m(i))
その場合に,評価値rは,以下の式(6)で表すことができる。
【0128】
【数2】

【0129】
図12に示すパラメータ一致度テーブル151の場合に,パラメータIDが“0”の解析処理パラメータにおいて,上記式(6)では,左側項目(一致度の最大値)が“0.3”,中央項目(正規化項)が“0.15”,右側項目(道のりの長さ)が“0.35”となり,その結果,評価値rが“約0.13”となる。
【0130】
パラメータ評価値算出部16は,各パラメータについて計算した評価値を,パラメータ評価テーブル161に格納する。
【0131】
ステップS9: パラメータ評価値算出部16が,全ての解析処理パラメータについて評価したかを調べる。パラメータ評価値算出部16は,全ての解析処理パラメータを評価していなければ(ステップS9のN),ステップS10の処理を行い,全ての解析処理パラメータを評価していれば(ステップS9のY),ステップS11の処理を行う。
【0132】
ステップS10: パラメータ変更部13は,変更していた解析処理パラメータの値を初期値に戻し,ステップS7の処理へ進む。
【0133】
ステップS11: パラメータ選択部17が,評価値の高い解析処理パラメータを選択する。
【0134】
パラメータ選択部17は,パラメータ評価テーブル161をもとに,評価値でパラメータIDのソート処理を行い,評価値が大きい解析処理パラメータから順に所定数の解析処理パラメータを選択する。パラメータ選択部17は,選択した解析処理パラメータとその値を,映像2のジャンルに対応付けて保持する。
【0135】
ダイジェスト映像生成装置1が備えるパラメータ調整部(図4に図示しない)が解析処理パラメータの値を調整する場合に,選択された解析処理パラメータとその値とが参照され,調整対象として優先的に提示されて,パラメータ値の変更を行えるようにする。これにより,効率的な調整が可能となる。
【0136】
(6)ダイジェスト映像生成装置のハードウェア構成
ダイジェスト映像生成装置1は,CPUおよびメモリ等を有するハードウェアとソフトウェアプログラムとを備えるコンピュータ・システム,または専用ハードウェアによって実現される。すなわち,ダイジェスト映像生成装置1は,演算装置(CPU),一時記憶装置(DRAM,フラッシュメモリなど)および永続性記憶装置(HDD,フラッシュメモリなど)を有し,外部とデータの入出力をするコンピュータによって実施することができる。
【0137】
また,ダイジェスト映像生成装置1は,このコンピュータが実行可能なプログラムによっても実施することができる。この場合に,ダイジェスト映像生成装置1が有すべき機能の処理内容を記述したプログラムが提供される。提供されたプログラムを上記コンピュータが実行することによって,上記説明したダイジェスト映像生成装置1の処理機能がコンピュータ上で実現される。なお,上記コンピュータは,可搬型記録媒体から直接プログラムを読み取り,そのプログラムに従った処理を実行することもできる。さらに,上記プログラムは,コンピュータで読み取り可能な記録媒体に記録しておくことができる。
【0138】
(7) ダイジェスト映像生成装置1の効果
以上説明したように,ダイジェスト映像生成装置1は,解析処理パラメータの各値について,抽出されたハイライトシーンと正解区間3との一致度が高いほど高い評価値となる式で評価値を算出する。よって,ダイジェスト映像生成装置1によれば,パラメータ情報4に含まれる解析処理パラメータから,正解区間3に最も近い区間を抽出した解析処理パラメータおよびその値を選択することができる。選択した解析処理パラメータおよび値を用いたダイジェスト映像生成が可能となり,正解区間3により一致するシーンを含むダイジェスト映像5を出力することができる。
【0139】
また,ダイジェスト映像生成装置1は,各解析処理パラメータについて,変更させた値に対する一致度の変化の不規則さが不規則であるほど低い評価値となる式で評価値を算出する。よって,ダイジェスト映像生成装置1によれば,パラメータ情報4に含まれる解析処理パラメータから,値の変化に対応して抽出区間が変化する解析処理パラメータを選択することができる。選択した解析処理パラメータの優先的な値の調整が可能となり,効率的な調整を実現することができる。
【符号の説明】
【0140】
1 ダイジェスト映像生成装置
11 正解区間指定部
12 パラメータ範囲設定部
13 パラメータ変更部
14 ダイジェスト映像生成部
15 一致度算出部
16 パラメータ評価値算出部
17 パラメータ選択部
2 映像
3 正解区間
4 パラメータ情報
5 ダイジェスト映像


【特許請求の範囲】
【請求項1】
特定ジャンルの映像を解析処理して抽出した区間を用いてダイジェスト映像を生成するダイジェスト映像生成装置であって,
ダイジェスト映像とすべき区間の指定を受け付けて、受け付けた区間を正解区間とする正解区間指定部と,
ダイジェスト映像とする区間を特定すべき解析処理パラメータと該パラメータの値を変化させる範囲の指定を受け付け,受け付けた解析処理パラメータおよびその値によって映像を解析してダイジェスト映像と判断する区間を抽出するダイジェスト映像生成部と,
前記ダイジェスト映像生成部が映像からダイジェスト映像と判断する区間を抽出する度に,前記抽出した区間と前記正解区間との一致度を算出する一致度算出部と,
前記一致度が高い抽出区間を抽出した解析処理パラメータおよびその値が高い評価値となる評価処理を行って,前記解析処理パラメータの変更された値ごとに評価値を算出するパラメータ評価値算出部と,
前記ダイジェスト映像生成部で実行された解析処理パラメータから,前記評価値が最も高い解析処理パラメータおよびその値を選択するパラメータ選択部とを備える
ことを特徴とするダイジェスト映像生成装置。
【請求項2】
前記パラメータ評価値算出部は,解析処理パラメータについて,その値を変更させた場合の抽出結果に対する一致度の変化が不規則であるほど低い評価値となる評価処理を行って,前記解析処理パラメータの変化された値に対する評価値の代わりに,前記解析処理パラメータごとに前記一致度の変化の不規則さにもとづく評価値を算出し,
前記パラメータ選択部は,前記解析処理パラメータから前記評価値が最も高い解析処理パラメータを選択する
ことを特徴とする請求項1に記載のダイジェスト映像生成装置。
【請求項3】
コンピュータに,特定ジャンルの映像を解析処理して抽出した区間を用いてダイジェスト映像を生成する処理を実行させるためのダイジェスト映像生成プログラムであって,
ダイジェスト映像とすべき区間の指定を受け付けて、受け付けた区間を正解区間とする正解区間指定処理と,
ダイジェスト映像とする区間を特定すべき解析処理パラメータと該パラメータの値を変化させる範囲の指定を受け付け,受け付けた解析処理パラメータおよびその値によって映像を解析してダイジェスト映像と判断する区間を抽出するダイジェスト映像生成処理と,
前記ダイジェスト映像生成部が映像からダイジェスト映像と判断する区間を抽出する度に,前記抽出した区間と前記正解区間との一致度を算出する一致度算出処理と,
前記一致度が高い抽出区間を抽出した解析処理パラメータおよびその値が高い評価値となる評価処理を行って,前記解析処理パラメータの変更された値ごとに評価値を算出するパラメータ評価値算出処理と,
前記ダイジェスト映像生成処理で実行された解析処理パラメータから,前記評価値が最も高い解析処理パラメータおよびその値を選択するパラメータ選択処理とを,
前記コンピュータに実行させる
ことを特徴とするダイジェスト映像生成プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate


【公開番号】特開2012−195811(P2012−195811A)
【公開日】平成24年10月11日(2012.10.11)
【国際特許分類】
【出願番号】特願2011−58967(P2011−58967)
【出願日】平成23年3月17日(2011.3.17)
【出願人】(000005223)富士通株式会社 (25,993)
【Fターム(参考)】