説明

映像・音声再生装置および映像・音声再生方法

【課題】映像・音声をバランス良く高速生成する映像・音声再生装置および映像・音声再生方法を提供する。
【解決手段】
フレーム内符号化された第1の画像データと,フレーム間予測符号化された第2の画像データと,フレームに対応する音声データとを有する映像・音声データを再生する映像・音声再生装置であって,再生速度に対応して,映像・音声データから第1の画像データおよび音声データをそれぞれ抽出する第1,第2の間隔と,抽出された第1の画像を再生する回数または時間と,を決定する決定部と,映像・音声データから第1の画像データを第1の間隔で抽出する第1の抽出部と,前記映像・音声データから音声データを第2の間隔で抽出する第2の抽出部と,第1の画像データを前記回数または時間再生する映像再生部と,音声データを再生する音声再生部と,を具備する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は,映像・音声再生装置および映像・音声再生方法に関する。
【背景技術】
【0002】
映像・音声はデジタル化されMPEG等で符号化されて記録媒体に記録され,復号化されて再生される。ここで,映像・音声を通常より高速で再生する技術が公開されている(例えば,特許文献1参照)。例えば,数フレーム毎の1フレームのピクチャの再生後に,所定数のフレームのピクチャを順次に通常再生することで,ある程度連続性のある駒飛ばし再生が可能となる。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2004−140723号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら,特許文献1記載の技術には,映像・音声をバランス良く高速生成する技術は示されていない。
上記に鑑み,本発明は映像・音声をバランス良く高速生成する映像・音声再生装置および映像・音声再生方法を提供することを目的とする。
【課題を解決するための手段】
【0005】
本発明の一態様に係る映像・音声再生装置は,フレーム内符号化された第1の画像データと,フレーム間予測符号化された第2の画像データと,フレームに対応する音声データとを有する映像・音声データを再生する映像・音声再生装置であって,再生速度を入力する入力部と,前記入力された再生速度に対応して,前記映像・音声データから第1の画像データおよび音声データをそれぞれ抽出する第1,第2の間隔と,抽出された第1の画像を再生する回数または時間と,を決定する決定部と,前記映像・音声データから第1の画像データを前記決定された第1の間隔で抽出する第1の抽出部と,前記映像・音声データから音声データを前記決定された第2の間隔で抽出する第2の抽出部と,前記抽出された第1の画像データを前記決定された回数または時間再生する映像再生部と,前記抽出された音声データを再生する音声再生部と,を具備する。
【0006】
本発明の一態様に係る映像・音声再生方法は,フレーム内符号化された第1の画像データと,フレーム間予測符号化された第2の画像データと,フレームに対応する音声データとを有する映像・音声データを再生する映像・音声再生方法であって,再生速度を入力するステップと,前記入力された再生速度に対応して,前記映像・音声データから第1の画像データおよび音声データをそれぞれ抽出する第1,第2の間隔と,抽出された第1の画像を再生する回数または時間と,を決定するステップと,前記映像・音声データから第1の画像データを前記決定された第1の間隔で抽出するステップと,前記映像・音声データから音声データを前記決定された第2の間隔で抽出するステップと,前記抽出された第1の画像データを前記決定された回数または時間再生するステップと,前記抽出された音声データを再生するステップと,を具備する。
【発明の効果】
【0007】
本発明によれば,本発明は映像・音声をバランス良く高速生成する映像・音声再生装置および映像・音声再生方法を提供できる。
【図面の簡単な説明】
【0008】
【図1】本発明の第1実施形態に係る映像・音声記録再生装置10を表すブロック図である。
【図2】抽出・再生条件テーブルTの一例を表す模式図である。
【図3】映像・音声記録再生装置10の動作手順の一例を表すフロー図である。
【発明を実施するための形態】
【0009】
以下,図面を参照して,本発明の実施の形態を詳細に説明する。
図1は本発明の一実施形態に係る映像・音声記録再生装置10を表すブロック図である。映像・音声記録再生装置10は,映像および音声の記録再生が可能であり,映像および音声の再生速度を適宜に調節できる。
【0010】
映像・音声記録再生装置10は,映像入力部111a,音声入力部111b,符号化部112,媒体制御部113,記録媒体114,映像・音声分離部121,映像抽出部122a,音声抽出部122b,映像復号部123a,音声復号部123b,映像出力部124a,音声出力部124b,主制御部131,記憶部132,操作入力部133を有する。
【0011】
映像入力部111aは,映像を入力する装置,例えば,テレビカメラである。映像入力部111aから符号化部112に映像信号が出力される。
音声入力部111bは,音声を入力する装置,例えば,マイクロフォンである。音声入力部111bから符号化部112に音声信号が出力される。
【0012】
符号化部112は,映像入力部111a,音声入力部111bから出力される映像信号,音声信号を符号化して,PS(プログラム・ストリーム)を生成する。
【0013】
PSは,それぞれMPEG−2の規格により符号化された映像信号(映像ES(エレメンタリ・ストリーム))および音声信号(音声ES(エレメンタリ・ストリーム))がパケット化されて結合されたものである。PSは,「フレーム内符号化された第1の画像データと,フレーム間予測符号化された第2の画像データと,フレームに対応する音声データとを有する映像・音声データ」に対応する。
【0014】
映像ESは,複数(例えば,15)のフレーム(画像)を単位とするGOP(Group of Picture)から構成される。GOPには,Iピクチャ(Intra Picture),Pピクチャ(Predictive Picture),Bピクチャ(Bidirectionally Predictive Picture)を含めることができる。例えば,GOPが15フレームから構成されるとき,「IBBPBBPBBPBBPBB」を1のGOPとすることができる。なお,ここでは「IBB」等は「Iピクチャ,Bピクチャ,Bピクチャ」の順次の組み合わせを意味する。
【0015】
Iピクチャは,フレーム内符号化された第1の画像データに対応する。即ち,Iピクチャは,そのフレーム(画像)内で画像を圧縮・符号化している。この圧縮・符号化には,8×8ピクセルを単位としたDCT(離散コサイン変換)を利用できる。
【0016】
PピクチャおよびBピクチャは,フレーム間予測符号化された第2の画像データに対応する。Pピクチャは,フレーム内での圧縮・符号化の他に、フレーム間(時間軸)順方向で画像を予測符号化している。Bピクチャは,フレーム内での圧縮・符号化の他に、フレーム間(時間軸)順方向および逆方向(双方向)で画像を予測符号化している。
【0017】
媒体制御部113は,記録媒体114への情報の記録および再生を制御する。媒体制御部113は,符号化部112から出力されるPSを記録媒体114に書き込む。媒体制御部113は,再生速度に対応する速度でPSを記録媒体114から読み出す。即ち,n倍速の場合,標準のn倍以上の速度でPSを記録媒体114から読み出す。
【0018】
記録媒体114は,情報の記録,再生が可能な媒体,例えば,磁気テープ,光ディスク(DVD(Digital Versatile Disk)等),メモリ−カード(SDカード等)である。
【0019】
映像・音声分離部121は,媒体制御部113によって記録媒体114から読み出されたPSを映像ES,音声ESに分離する。
【0020】
映像抽出部122aは,映像ESから再生速度に対応した画像フレームを抽出する。映像抽出部122aは,映像・音声データから第1の間隔で第1の画像データを抽出する第1の抽出部に対応する。
【0021】
音声抽出部122bは,音声ESから再生速度に対応した音声フレームを抽出する。音声抽出部122bは,映像・音声データから第2の間隔で音声データを抽出する第2の抽出部に対応する。
【0022】
映像復号部123aは,抽出された第1の画像データを決定された回数または時間再生する映像再生部として機能する。映像復号部123aは,映像抽出部122aによって抽出された画像フレームを復号し,映像信号として出力する。
【0023】
音声復号部123bは,抽出された音声データを再生する音声再生部として機能する。音声復号部123bは,音声抽出部122bによって抽出された音声フレームを復号し,音声信号として出力する。
【0024】
映像出力部124aは,映像復号部123aによって復号された映像信号により映像を出力する表示装置,例えば,液晶表示装置,プラズマ表示装置,CRTである。
音声出力部124bは,音声復号部123bによって復号された音声信号により音声を出力する装置,例えば,スピーカ,ヘッドフォンである。
【0025】
主制御部131は,映像・音声記録再生装置10全体を制御する制御装置である。主制御部131は,再生速度に対応して,映像・音声データから第1の画像データおよび音声データをそれぞれ抽出する第1,第2の間隔と,抽出された第1の画像を再生する回数と,を決定する決定部として機能する。なお,この決定に後述の抽出・再生条件テーブルTを利用できる。
【0026】
記憶部132は,データを記憶するメモリ,ハードディスクであり,抽出・再生条件テーブルTを記憶する。図2は,抽出・再生条件テーブルTの一例を表す模式図である。抽出・再生条件テーブルTは,再生速度と,フレームの抽出間隔・再生回数の関係を表す。ここでは,1のGOPが15フレームから構成されるとする(L(Long)GOP)。
【0027】
(1)映像フレームの抽出・再生
n倍速のとき(n>1,高速再生時),映像フレームにおいて,1/(n・m)のIピクチャが抽出され,m回再生される。ここでは,LGOP(15フレーム)から1のIピクチャが抽出され,3倍速,5倍速,15倍速のときそれぞれ,5回,3回,1回再生される。Iピクチャのみを抽出し,繰り返し再生することで,簡便,確実な高速での再生処理が可能となり,かつ映像の視認が容易となる。
【0028】
(2)音声フレームの抽出・再生
音声フレームの抽出の仕方は映像フレームの抽出の仕方と異なる。映像に比べて,音声は復号が容易であるので,再生する映像フレーム以外のフレームを用いて,繰り返し再生を行わずに,簡便,確実な高速での再生処理が可能であり,かつ音声の聞き取りが容易となる。
【0029】
n倍速のとき(n>1,高速再生時),音声フレームにおいて,1/nのフレームが抽出,再生される。例えば,3倍速,5倍速,15倍速のときそれぞれ,3フレーム,5フレーム,15フレーム毎に1の音声フレームが抽出される(抽出条件1:1/3,1/5,1/15)。利用するフレームを映像フレームよりも多くすることで,再生する音声に含まれる情報量を多くすることができる。また,繰り返しの再生を行わないことで,再生される音声への違和感を低減できる。
【0030】
あるいは,3倍速,5倍速のときそれぞれ,21フレームから7フレーム,および20フレームから4フレームを抽出する(抽出条件2:7/21,4/20)。このとき,連続するフレームを抽出することで,より認識容易な音声を再生できる。
【0031】
ここで,音声フレームでの抽出条件1,2を固定とすることができる。また,操作入力部133からの入力により,抽出条件1,2を切替可能としても良い。
【0032】
なお,一倍速(標準速度)のとき,映像,音声の双方において,全てのフレームが抽出,再生される。
【0033】
操作入力部133は,ユーザによる情報(例えば,再生速度)の入力を可能とする入力装置,例えば,キーボードである。
【0034】
(映像・音声記録再生装置10の動作)
以下,映像・音声記録再生装置10の動作手順を説明する。
図3は,映像・音声記録再生装置10の動作手順の一例を表すフロー図である。
【0035】
(1)再生速度の設定(ステップS11)
再生速度が設定される。例えば,操作入力部133によって,n倍の再生速度(n=1,3,5,15倍)が選択,入力される。
【0036】
(2)データの抽出間隔・再生回数の決定(ステップS12)
再生速度に基づき,データの抽出間隔・再生回数が決定される。抽出・再生条件テーブルTに基づき,主制御部131がデータの抽出間隔・再生回数を決定する。
【0037】
(3)映像・音声データの抽出(ステップS13)
決定された抽出間隔・再生回数に基づき,映像・音声データが抽出される。映像抽出部122a,音声抽出部122bはそれぞれ,映像ESおよび音声ESから再生速度に対応した画像フレームおよび音声フレームを抽出する。
【0038】
なお,この映像ES,音声ESは,記録媒体114からn倍の再生速度に対応して読み出されたPSから映像・音声分離部121によって分離されることで生成される。
【0039】
(4)映像・音声データの再生(ステップS14)
映像・音声データが再生される。映像復号部123aおよび音声復号部123bはそれぞれ,抽出された画像フレームおよび音声フレームを復号し,映像信号および音声信号として出力する。このとき,映像復号部123aは映像フレームを決定された回数連続して復号する。一方,音声復号部123bは音声フレームを1回ずつ復号する。この結果,本来のフレーム数の1/nの映像フレームおよび音声フレームが再生され,n倍速での再生がなされる。
【0040】
(その他の実施形態)
本発明の実施形態は上記の実施形態に限られず拡張,変更可能であり,拡張,変更した実施形態も本発明の技術的範囲に含まれる。
上記実施形態では,映像復号部123aにおいて,同一のフレームを複数回再生している。これに換えて,映像抽出部122aが同一のフレームを複数回出力しても良い。このようにすると,映像復号部123aが再生する回数を認識する必要が無くなる。また,映像復号部123aが同一のフレームを複数回再生することに換えて,1フレームを再生する時間を遅くしても良い。このようにすると,映像復号部123aでの処理が容易となる。いずれにしろ,結果として,映像復号部123aが複数回あるいは複数倍の時間だけ,同一のフレームを再生すれば足りる。
【0041】
上記実施形態では,音声ES,即ち,符号化(圧縮)された音声信号を用いている。これに対して,非圧縮の音声信号を用いることも可能である。例えば,所定のフレーム数(一例として,5フレーム)において,音声信号が映像信号と同期していれば,音声信号の圧縮の有無に依らず,本発明を適用することが可能である。一例として,映像信号が映像ESで,音声信号が非圧縮の信号の組み合わせを利用できる。
【符号の説明】
【0042】
10…映像・音声記録再生装置,111a…映像入力部,111b…音声入力部,112…符号化部,113…媒体制御部,114…記録媒体,121…映像・音声分離部,122a…映像抽出部,122b…音声抽出部,123a…映像復号部,123b…音声復号部,124a…映像出力部,124b…音声出力部,131…主制御部,132…記憶部,133…操作入力部

【特許請求の範囲】
【請求項1】
フレーム内符号化された第1の画像データと,フレーム間予測符号化された第2の画像データと,フレームに対応する音声データとを有する映像・音声データを再生する映像・音声再生装置であって,
再生速度を入力する入力部と,
前記入力された再生速度に対応して,前記映像・音声データから第1の画像データおよび音声データをそれぞれ抽出する第1,第2の間隔と,抽出された第1の画像を再生する回数または時間と,を決定する決定部と,
前記映像・音声データから第1の画像データを前記決定された第1の間隔で抽出する第1の抽出部と,
前記映像・音声データから音声データを前記決定された第2の間隔で抽出する第2の抽出部と,
前記抽出された第1の画像データを前記決定された回数または時間再生する映像再生部と,
前記抽出された音声データを再生する音声再生部と,
を具備することを特徴とする映像・音声再生装置。
【請求項2】
前記第2の抽出部が,連続する複数の音声データを抽出する
ことを特徴とする請求項1記載の映像・音声再生装置。
【請求項3】
前記第1の画像データがMPEGのIピクチャであり,前記第2の画像データがMPEGのPピクチャまたはBピクチャである
ことを特徴とする請求項1または2に記載の映像・音声再生装置。
【請求項4】
フレーム内符号化された第1の画像データと,フレーム間予測符号化された第2の画像データと,フレームに対応する音声データとを有する映像・音声データを再生する映像・音声再生方法であって,
再生速度を入力するステップと,
前記入力された再生速度に対応して,前記映像・音声データから第1の画像データおよび音声データをそれぞれ抽出する第1,第2の間隔と,抽出された第1の画像を再生する回数または時間と,を決定するステップと,
前記映像・音声データから第1の画像データを前記決定された第1の間隔で抽出するステップと,
前記映像・音声データから音声データを前記決定された第2の間隔で抽出するステップと,
前記抽出された第1の画像データを前記決定された回数または時間再生するステップと,
前記抽出された音声データを再生するステップと,
を具備することを特徴とする映像・音声再生方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate


【公開番号】特開2010−166206(P2010−166206A)
【公開日】平成22年7月29日(2010.7.29)
【国際特許分類】
【出願番号】特願2009−5527(P2009−5527)
【出願日】平成21年1月14日(2009.1.14)
【出願人】(000003078)株式会社東芝 (54,554)
【Fターム(参考)】