説明

編集装置、制御方法及びプログラム

【課題】Video符号とAudio符号とが多重化された映像データの先頭部分と末尾部分との少なくとも一方の部分で再多重化する再多重化対象のAudio符号がGOP単位のカット編集を行う中央部分に存在する場合でも、その一方の部分で再多重化処理を行うことが可能な編集装置を提供する。
【解決手段】本実施形態の編集装置(100)は、Video符号とAudio符号とが多重化された映像データの先頭部分と末尾部分との少なくとも一方の部分で再多重化する再多重化対象のAudio符号がGOP単位のカット編集を行う中央部分に存在する場合に、無音のAudio符号をその一方の部分に挿入する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、MPEG(Moving Picture Expert Group)規格の符号をカット編集する編集装置、制御方法及びプログラムに関する。
【背景技術】
【0002】
TS(Transport Stream)符号のカット編集としては、GOP(Group Of Picture)単位で行うカット編集(図8(a)参照)、フレーム単位で行うカット編集(図8(b)参照)がある。
【0003】
GOP単位のカット編集は、DIT(Discontinue Information Table)をカット点に挿入することで、TS符号の分離処理(TS符号をAudio符号とVideo符号とに分離する処理)や再多重化処理(Audio符号とVideo符号とを再多重化する処理)を行わずに、TS符号の編集を行う処理である。GOP単位のカット編集は、Video符号のGOP単位で元符号を再利用するため、簡単な構成で実現することができるというメリットがある。しかし、GOPの途中でカットすることができないデメリットがある。
【0004】
フレーム単位のカット編集は、TS符号をVideo符号とAudio符号とに分離し、Video符号は、映像シーン毎に先頭部分と末尾部分とで再圧縮する(先頭部分と末尾部分以外の中央部分は再圧縮しない)。そして、そのVideo符号とAudio符号とを再多重化する処理である。フレーム単位のカット編集は、Video符号とAudio符号とに分離し、Video符号のフレーム単位に編集した後に再多重化処理を行うため、GOPの途中でもカットすることができるというメリットがある。しかし、元符号を再多重化する必要があるので、構成が複雑になってしまうデメリットがある。また、元符号に欠落している箇所がある場合は、再多重化処理を行うために、その欠落した箇所の符号を補正(補足)する必要がある。また、再多重化処理でサポートされていない符号が元符号に存在する場合は、そのサポートされていない符号が削除されてしまうことになる。
【0005】
なお、フレーム単位のカット編集にGOP単位のカット編集を組み合わせたカット編集もある。このカット編集は、映像シーンの先頭部分と末尾部分とを除いた中央部分に対し、GOP単位のカット編集を行うことになる。このため、中央部分は、元符号を再利用することができる。また、先頭部分と末尾部分とで再圧縮を行う部分は、各々1秒程度になるため、先頭部分と末尾部分とで元符号に欠落している箇所がある場合でも、その欠落した箇所の符号を補正(補足)しなくても済むことになる。また、再多重化処理でサポートされていない符号が元符号に存在し、そのサポートされていない符号が削除されてしまっても符号再生時に大きな支障が生じないで済むことになる。また、GOP単位のカット編集を行う中央部分は、元符号を再利用するため、フレーム単位のカット編集のように、再多重化処理でサポートされていない符号が削除されてしまうことも回避することができる。
【0006】
しかし、GOP単位のカット編集の範囲内に含まれるVideo符号とAudio符号とは完全に同じ再生時刻にはならない。このため、Video符号とAudio符号とが多重化された映像データの先頭部分と末尾部分との少なくとも一方の部分で再多重化する再多重化対象のAudio符号がGOP単位のカット編集を行う中央部分に存在する場合は、その一方の部分で再多重化処理を行うことができない問題がある。
【0007】
このため、Video符号とAudio符号とが多重化された映像データの先頭部分と末尾部分との少なくとも一方の部分で再多重化する再多重化対象のAudio符号がGOP単位のカット編集を行う中央部分に存在する場合でも、その一方の部分で再多重化処理を行うことが可能な手法の開発が必要視されることになる。
【0008】
なお、本発明より先に出願された技術文献として、MPEG-2トランスポートストリームデータを分割編集する技術について開示された文献がある(例えば、特許文献1参照)。
【0009】
上記特許文献1では、分割編集位置から前方のストリームデータに対応するオーディオ信号が上記分割編集位置を跨いで後方のストリームデータ中に存在する場合は、前方のストリームデータに、該オーディオ信号を含み、且つ上記分割編集位置から該オーディオ信号間のビデオ信号をダミーデータに書き換えたTSパケットデータを追加する。また、上記分割編集位置から後方のストリームデータに、該オーディオ信号のTSパケットデータをダミーデータに書き換える編集を施すことにしている。これにより、上記特許文献1は、分割後に生成された二つのストリームを復号再生した時にユーザに違和感を与えるような異音の発生或いは無音状態を生じる可能性のある音声データを除去することができ、快適なAV情報の視聴を実現することを可能にしている。
【先行技術文献】
【特許文献】
【0010】
【特許文献1】特開2005−117556号公報
【発明の概要】
【発明が解決しようとする課題】
【0011】
しかし、上記特許文献1は、ビデオ信号をGOP単位でカット編集する場合におけるオーディオ信号の異音発生の解消を目的とするものである。このため、上記特許文献1の発明を、フレーム単位のカット編集とGOP単位のカット編集とを組み合わせたカット編集に適用すると、フレーム単位編集部分とGOP単位編集部分との間にダミーデータが挿入されるため、却ってユーザに違和感を与えてしまうことになる。
【0012】
本発明は、上記事情に鑑みてなされたものであり、Video符号とAudio符号とが多重化された映像データの先頭部分と末尾部分との少なくとも一方の部分で再多重化する再多重化対象のAudio符号がGOP単位のカット編集を行う中央部分に存在する場合でも、その一方の部分で再多重化処理を行うことが可能な編集装置、制御方法及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0013】
かかる目的を達成するために、本発明は、以下の特徴を有することとする。
【0014】
<編集装置>
本発明にかかる編集装置は、
Video符号とAudio符号とが多重化された映像データの先頭部分と末尾部分に対し、前記Video符号と前記Audio符号とを分離して前記Video符号のフレーム単位に編集した後に再多重化を行うフレーム単位のカット編集を行い、前記先頭部分と末尾部分とを除いた中央部分に対し、前記Video符号のGOP(Group of Pictures)単位で前記映像データを再利用するGOP単位のカット編集を行う編集装置であって、
前記先頭部分と前記末尾部分との少なくとも一方の部分で再多重化する再多重化対象のAudio符号が前記中央部分に存在する場合に、無音のAudio符号を前記一方の部分に挿入する挿入手段を有することを特徴とする。
【0015】
<制御方法>
本発明にかかる制御方法は、
Video符号とAudio符号とが多重化された映像データの先頭部分と末尾部分に対し、前記Video符号と前記Audio符号とを分離して前記Video符号のフレーム単位に編集した後に再多重化を行うフレーム単位のカット編集を行い、前記先頭部分と末尾部分とを除いた中央部分に対し、前記Video符号のGOP(Group of Pictures)単位で前記映像データを再利用するGOP単位のカット編集を行う編集装置で行う制御方法であって、
前記先頭部分と前記末尾部分との少なくとも一方の部分で再多重化する再多重化対象のAudio符号が前記中央部分に存在する場合に、無音のAudio符号を前記一方の部分に挿入する挿入工程を有することを特徴とする。
【0016】
<プログラム>
本発明にかかるプログラムは、
Video符号とAudio符号とが多重化された映像データの先頭部分と末尾部分に対し、前記Video符号と前記Audio符号とを分離して前記Video符号のフレーム単位に編集した後に再多重化を行うフレーム単位のカット編集を行い、前記先頭部分と末尾部分とを除いた中央部分に対し、前記Video符号のGOP(Group of Pictures)単位で前記映像データを再利用するGOP単位のカット編集を行う編集装置に実行させるプログラムであって、
前記先頭部分と前記末尾部分との少なくとも一方の部分で再多重化する再多重化対象のAudio符号が前記中央部分に存在する場合に、無音のAudio符号を前記一方の部分に挿入する挿入処理を、コンピュータに実行させることを特徴とする。
【発明の効果】
【0017】
本発明によれば、Video符号とAudio符号とが多重化された映像データの先頭部分と末尾部分との少なくとも一方の部分で再多重化する再多重化対象のAudio符号がGOP単位のカット編集を行う中央部分に存在する場合でも、その一方の部分で再多重化処理を行うことができる。
【図面の簡単な説明】
【0018】
【図1】本実施形態の編集装置100の構成例を示す図である。
【図2】編集装置100の処理動作例を示す図である。
【図3】先頭部分編集部1013と、末尾部分編集部1015と、の内部構成例を示す図である。
【図4】先頭部分編集部1013と、末尾部分編集部1015と、で行う処理動作例を示す図である。
【図5】図4に示す処理動作例を説明するための図である。
【図6】第2の実施形態の処理動作例を示す図である。
【図7】図6に示す処理動作例を説明するための図である。
【図8】GOP単位で行うカット編集(a)と、フレーム単位で行うカット編集(b)と、を説明するための図である。
【発明を実施するための形態】
【0019】
<本実施形態の編集装置100の概要>
まず、図1を参照しながら、本実施形態の編集装置100の概要について説明する。
【0020】
本実施形態の編集装置100は、先頭部分編集部1013と、中央部分編集部1014と、末尾部分編集部1015と、を有して構成し、Video符号とAudio符号とが多重化された映像データの先頭部分と末尾部分に対し、Video符号とAudio符号とを分離してVideo符号のフレーム単位に編集した後に再多重化を行うフレーム単位のカット編集を行い、先頭部分と末尾部分とを除いた中央部分に対し、Video符号のGOP(Group of Pictures)単位で映像データを再利用するGOP単位のカット編集を行う。
【0021】
本実施形態の編集装置100は、Video符号とAudio符号とが多重化された映像データの先頭部分と末尾部分との少なくとも一方の部分で再多重化する再多重化対象のAudio符号がGOP単位のカット編集を行う中央部分に存在する場合に、無音のAudio符号をその一方の部分に挿入する。
【0022】
これにより、本実施形態の編集装置100は、Video符号とAudio符号とが多重化された先頭部分と末尾部分との少なくとも一方の部分で再多重化する再多重化対象のAudio符号がGOP単位のカット編集を行う中央部分に存在する場合でも、その少なくとも一方の部分に挿入された無音のAudio符号を用いて、その少なくとも一方の部分で再多重化処理を行うことができる。以下、添付図面を参照しながら、本実施形態の編集装置100について詳細に説明する。
【0023】
<本実施形態の編集装置100の構成例>
まず、図1を参照しながら、本実施形態の編集装置100の構成例について説明する。
【0024】
本実施形態の編集装置100は、制御部101と、記憶部102と、を有して構成している。
【0025】
記憶部102は、各種情報を記憶する部分である。記憶部102は、MPEG2暗号化ファイル1021を記憶する。MPEG2暗号化ファイル1021は、MPEG2規格の符号を暗号化したTS符号を格納したファイルである。
【0026】
制御部101は、編集装置100全体の制御を司る部分である。本実施形態の制御部101は、暗号解除部1011と、DIT(Discontinue Information Table)挿入部1012と、先頭部分編集部1013と、中央部分編集部1014と、末尾部分編集部1015と、再暗号化部1016と、を有して構成する。
【0027】
暗号解除部1011は、MPEG2暗号化ファイル1021に格納されているTS符号の暗号を解除する。
【0028】
DIT挿入部1012は、カット編集を行うTS符号のカット点(各映像シーンの先頭部分の最初の位置)にDIT(Discontinue Information Table)を挿入する。
【0029】
先頭部分編集部1013は、映像シーンの先頭部分の編集を行う。先頭部分編集部1013は、映像シーンの先頭部分に対し、フレーム単位のカット編集を行う。
【0030】
中央部分編集部1014は、映像シーンの中央部分の編集を行う。中央部分編集部1014は、映像シーンの中央部分に対し、GOP単位のカット編集を行う。
【0031】
末尾部分編集部1015は、映像シーンの末尾部分の編集を行う。末尾部分編集部1015は、映像シーンの末尾部分に対し、フレーム単位のカット編集を行う。
【0032】
再暗号化部1016は、カット編集を行ったTS符号に暗号を行う。
【0033】
<編集装置100の処理動作>
次に、図2を参照しながら、本実施形態の編集装置100の処理動作について説明する。
【0034】
暗号解除部1011は、MPEG2暗号化ファイル1021からTS符号を読み取り、TS符号の暗号を解除する(ステップS1)。TS符号の暗号解除については公知の手法であるため、具体的な処理については割愛する。
【0035】
DIT挿入部1012は、カット編集を行うTS符号のカット点(映像シーンの先頭部分の最初の位置)にDITを挿入する(ステップS2)。DITの挿入については公知の手法であるため、具体的な処理については割愛する。
【0036】
先頭部分編集部1013は、映像シーンの先頭部分に対し、フレーム単位のカット編集を行い、先頭部分のTS符号の再圧縮、再多重化を行う(ステップS3)。先頭部分編集部1013は、先頭部分のTS符号をVideo符号とAudio符号とに分離し、Video符号に対しては再圧縮を行う。そして、再圧縮を行ったVideo符号と、Audio符号と、を再多重化する。
【0037】
中央部分編集部1014は、映像シーンの中央部分に対し、GOP単位のカット編集を行う(ステップS4)。中央部分編集部1014は、中央部分のTS符号を抜き取り、そのTS符号をそのまま再利用する。なお、中央部分編集部1014は、TS符号のタイムスタンプを書き換えたり、GOPヘッダを書き換えたりすることも可能である。
【0038】
末尾部分編集部1015は、映像シーンの末尾部分に対し、フレーム単位のカット編集を行い、末尾部分のTS符号の再圧縮、再多重化を行う(ステップS5)。末尾部分編集部1015は、末尾部分のTS符号をVideo符号とAudio符号とに分離し、Video符号に対しては再圧縮を行う。そして、再圧縮を行ったVideo符号と、Audio符号と、を再多重化する。
【0039】
再暗号化部1016は、カット編集を行ったTS符号に対し、再暗号化処理を行い、再暗号化を行ったTS符号をMPEG2暗号化ファイル1021に格納する(ステップS6)。TS符号の暗号化については公知の手法であるため、具体的な処理については割愛する。
【0040】
本実施形態の編集装置100は、フレーム単位のカット編集にGOP単位のカット編集を組み合わせ、Video符号とAudio符号とが多重化された映像データの先頭部分と末尾部分に対し、Video符号とAudio符号とを分離してVideo符号のフレーム単位に編集した後に再多重化を行うフレーム単位のカット編集を行い、先頭部分と末尾部分とを除いた中央部分に対し、Video符号のGOP(Group of Pictures)単位で映像データを再利用するGOP単位のカット編集を行うことにしている。このため、中央部分は、元符号を再利用することができ、再多重化を行う範囲を減らすことができる。
【0041】
しかし、GOP単位のカット編集の範囲内に含まれるVideo符号とAudio符号とは完全に同じ再生時刻にはならない。このため、Video符号とAudio符号とが多重化された映像データの先頭部分と末尾部分との少なくとも一方の部分で再多重化する再多重化対象のAudio符号がGOP単位のカット編集を行う中央部分に存在する場合は、その一方の部分で再多重化処理を行うことができない問題がある。
【0042】
このため、本実施形態では、Video符号とAudio符号とが多重化された映像データの先頭部分と末尾部分との少なくとも一方の部分で再多重化する再多重化対象のAudio符号がGOP単位のカット編集を行う中央部分に存在する場合に、無音のAudio符号をその一方の部分に挿入することにした。
【0043】
これにより、本実施形態の編集装置100は、Video符号とAudio符号とが多重化された映像データの先頭部分と末尾部分との少なくとも一方の部分で再多重化する再多重化対象のAudio符号がGOP単位のカット編集を行う中央部分に存在する場合でも、その少なくとも一方の部分に挿入された無音のAudio符号を用いて、その少なくとも一方の部分で再多重化処理を行うことができる。以下、その具体的な方法について説明する。
【0044】
<先頭部分編集部1013、末尾部分編集部1015の構成例>
まず、先頭部分編集部1013、末尾部分編集部1015の構成例について説明する。先頭部分編集部1013、末尾部分編集部1015の構成は同様に構成するため、図3を参照しながら、先頭部分編集部1013について説明する。
【0045】
先頭部分編集部1013は、Audio符号検索部10と、無音Audio符号挿入部11と、Audio符号抜取部12と、Video符号検索部13と、Video符号抜取部14と、Video符号再圧縮部15と、再多重化部16と、を有して構成する。
【0046】
Audio符号検索部10は、TS符号に含まれるAudio符号を検索する。
【0047】
無音Audio符号挿入部11は、再多重化部16で再多重化するAudio符号に無音のAudio符号を挿入する。
【0048】
Audio符号抜取部12は、TS符号に含まれるAudio符号を抜き取る。
【0049】
Video符号検索部13は、TS符号に含まれるVideo符号を検索する。
【0050】
Video符号抜取部14は、TS符号に含まれるVideo符号を抜き取る。
【0051】
Video符号再圧縮部15は、Video符号抜取部14で抜き取ったVideo符号を再圧縮する。
【0052】
再多重化部16は、Audio符号とVideo符号とを再多重化する。
【0053】
<先頭部分編集部1013、末尾部分編集部1014の処理動作例>
次に、先頭部分編集部1013、末尾部分編集部1014の処理動作例について説明する。先頭部分編集部1013、末尾部分編集部1014の処理動作は同様な処理を行うため、先頭部分編集部1013の処理動作について説明する。
【0054】
Audio符号検索部10は、TS符号に含まれるAudio符号を検索し、その検索結果を無音Audio符号挿入部11と、Audio符号抜取部12と、に通知する(ステップS10)。
【0055】
無音Audio符号挿入部11は、Audio符号検索部10から受け付けた検索結果を基に、再多重化部16で再多重化する再多重化対象のAudio符号がGOP単位のカット編集を行う中央部分に存在する場合に、再多重化部16で再多重化するAudio符号に無音のAudio符号を挿入する(ステップS11)。
【0056】
Audio符号抜取部12は、Audio符号検索部10から受け付けた検索結果を基に、TS符号に含まれるAudio符号を抜き取り、その抜き取ったAudio符号を再多重化部16に渡す(ステップS12)。
【0057】
Video符号検索部13は、TS符号に含まれるVideo符号を検索し、その検索結果をVideo符号抜取部14に通知する(ステップS13)
【0058】
Video符号抜取部14は、Video符号検索部13から受け付けた検索結果を基に、TS符号に含まれるVideo符号を抜き取る(ステップS14)。
【0059】
Video符号再圧縮部15は、Video符号抜取部14で抜き取ったVideo符号を再圧縮し、その再圧縮を行ったVideo符号を再多重化部16に渡す(ステップS15)。
【0060】
再多重化部16は、Audio符号抜取部12から渡されたAudio符号、または、Audio符号抜取部12から渡されたAudio符号に無音のAudio符号が挿入されたAudio符号と、Video符号再圧縮部15から渡されたVideo符号と、を再多重化する(ステップS16)。
【0061】
本実施形態の先頭部分編集部1013は、無音Audio符号挿入部11を有して構成し、再多重化部16で再多重化する再多重化対象のAudio符号がGOP単位のカット編集を行う中央部分に存在する場合に、再多重化部16で再多重化するAudio符号に無音のAudio符号を挿入することにしている。これにより、再多重化部16は、再多重化対象のAudio符号がGOP単位のカット編集を行う中央部分に存在する場合でも、無音Audio符号挿入部11により挿入された無音のAudio符号を用いて再多重化処理を行うことができる。
【0062】
なお、上記の処理は、先頭部分編集部1013での処理動作について説明した。しかし、末尾部分編集部1014についても上記と同様な処理を行うことになる。
【0063】
<無音Audio符号挿入部11>
次に、図4、図5を参照しながら、無音Audio符号挿入部11の具体的な処理動作について説明する。
【0064】
無音Audio符号挿入部11は、シーン先頭部分の最初(1番目)のVideo符号のタイムスタンプに近いAudio符号のタイムスタンプを検索し、そのAudio符号のファイル位置を取得する(ステップA1)。
【0065】
例えば、図5に示すシーン先頭部分の最初(1番目)のVideo符号のタイムスタンプは、0.256(s)であるため、その0.256(s)に近いAudio符号のタイムスタンプを検索すると、0.264(s)が該当し、その0.264(s)のAudio符号のファイル位置を取得する。図5に示す時刻は、秒(s)を示し、各パケットは、最小符号化単位を示す。
【0066】
無音Audio符号挿入部11は、ステップA1で取得したAudio符号のファイル位置がGOP単位のカット編集範囲内(中央部分)に存在するか否かを判定する(ステップA2)。
【0067】
無音Audio符号挿入部11は、ステップA1で取得したAudio符号のファイル位置がGOP単位のカット編集範囲内(中央部分)に存在する場合は(ステップA2/Yes)、シーン先頭部分の最初(1番目)のVideo符号のファイル位置に近いAudio符号のタイムスタンプ(AT1)を取得する(ステップA3)。
【0068】
図5に示す0.264(s)のAudio符号のファイル位置は、GOP単位のカット編集範囲内(中央部分)に存在するため、シーン先頭部分の最初(1番目)のVideo符号のファイル位置に近いAudio符号のタイムスタンプ(AT1)を取得することになる。図5に示すシーン先頭部分の最初(1番目)のVideo符号のファイル位置に近いAudio符号のタイムスタンプ(AT1)は、0.072(s)であるため、AT1として0.072を取得する。
【0069】
次に、無音Audio符号挿入部11は、シーン先頭部分の最初(1番目)のVideo符号のタイムスタンプに近いAudio符号のタイムスタンプ(AT2)を取得する(ステップA4)。
【0070】
図5に示すシーン先頭部分の最初(1番目)のVideo符号のタイムスタンプ(0.256)に近いAudio符号のタイムスタンプ(AT2)は、0.264(s)であるため、AT2として0.264を取得する。
【0071】
無音Audio符号挿入部11は、AT1とAT2との差分からAU(Access Unit)数を計算する(ステップA5)。
【0072】
AT1=0.072、AT2=0.264であるため、AU数は、0.072〜0.264の範囲に相当するAU数になる。図5の場合は、AU数が9個となる。
【0073】
次に、無音Audio符号挿入部11は、ステップA5で計算したAU数に相当する無音のAudio符号を再多重化部16に渡す(ステップA6)。
【0074】
図5では、AU数が9個となるため、9個の無音のAudio符号を再多重化部16に渡す。このため、無音Audio符号挿入部11は、9個の無音のAudio符号をシーン先頭部分のAudio符号に挿入することになる。
【0075】
これにより、シーン先頭部分のVideo符号と、Audio符号と、の再生時間をほぼ同じにすることができる。その結果、再多重化部16は、再多重化部16で再多重化する再多重化対象のAudio符号がGOP単位のカット編集を行う中央部分に存在する場合でも、シーン先頭部分の符号(Video符号、Audio符号)の再多重化処理を行うことが可能となる。また、シーン先頭部分のVideo符号のタイムスタンプよりも前の時刻を示すタイムスタンプのAudio符号を無音のAudio符号にすることができる。図5では、シーン先頭部分のVideo符号のタイムスタンプ(0.256)よりも前の時刻を示す0.072〜0.243までのAudio符号を無音のAudio符号にすることができる。
【0076】
なお、無音Audio符号挿入部11は、ステップA1で取得したAudio符号のファイル位置がGOP単位のカット編集範囲内(中央部分)に存在しない場合は(ステップA2/No)、無音のAudio符号の挿入を行わず、Audio符号抜取部12は、シーン先頭部分の最初のAudio符号からシーン先頭部分の最後のAudio符号までを抜き取り、その抜き取ったAudio符号を再多重化部16に渡す(ステップA7)。図5を例に説明すると、シーン先頭部分の最初のAudio符号は、0.072に該当し、シーン先頭部分の最後のAudio符号は、0.243に該当するため、その0.072〜0.243までのAudio符号を抜き取り、その抜き取ったAudio符号を再多重化部16に渡すことになる。これにより、再多重化部12は、Audio符号抜取部12から渡されたAudio符号と、Video符号再圧縮部15から渡されたVideo符号と、を基に、シーン先頭部分の符号(Video符号、Audio符号)の最多重化を行うことになる。
【0077】
<本実施形態の編集装置100の作用・効果>
このように、本実施形態の編集装置100は、Video符号とAudio符号とが多重化された映像データの先頭部分で再多重化する再多重化対象のAudio符号がGOP単位のカット編集を行う中央部分に存在する場合に、無音のAudio符号を先頭部分に挿入する。これにより、Video符号とAudio符号とが多重化された映像データの先頭部分で再多重化する再多重化対象のAudio符号がGOP単位のカット編集を行う中央部分に存在する場合でも、無音のAudio符号を用いて再多重化処理を行うことが可能となる。
【0078】
なお、本実施形態の編集装置100は、上述した先頭部分編集部1013の処理を、末尾部分編集1015でも同様に行うことになる。このため、本実施形態の編集装置100は、Video符号とAudio符号とが多重化された映像データの末尾部分で再多重化する再多重化対象のAudio符号がGOP単位のカット編集を行う中央部分に存在する場合に、無音のAudio符号を末尾部分に挿入することになる。これにより、Video符号とAudio符号とが多重化された映像データの末尾部分で再多重化する再多重化対象のAudio符号がGOP単位のカット編集を行う中央部分に存在する場合でも、無音のAudio符号を用いて再多重化処理を行うことが可能となる。
【0079】
(第2の実施形態)
次に、第2の実施形態について説明する。
【0080】
第1の実施形態では、シーン先頭部分の最初(1番目)のVideo符号のタイムスタンプを用いて、無音のAudio符号を挿入するか否かを判定することにした。
【0081】
第2の実施形態では、無音のAudio符号を挿入するか否かを判定するVideo符号を指定し、その指定した所定番目のVideo符号のタイムスタンプを用いて、無音のAudio符号を挿入するか否かを判定することを特徴とする。
【0082】
これにより、無音のAudio符号を挿入するか否かを判定するVideo符号を任意に指定し、該指定した所定番目のVideo符号のタイムスタンプを用いて第1の実施形態と同様な処理を行うことが可能となる。以下、図6、図7を参照しながら、第2の実施形態について詳細に説明する。なお、以下の処理動作では、無音のAudio符号を挿入するか否かを判定するVideo符号として4番目のVideo符号を指定した場合について説明する。
【0083】
無音Audio符号挿入部11は、シーン先頭部分の所定番目(4番目)のVideo符号のタイムスタンプに近いAudio符号のタイムスタンプを検索し、そのAudio符号のファイル位置を取得する(ステップB1)。
【0084】
例えば、図7に示すシーン先頭部分の所定番目(4番目)のVideo符号のタイムスタンプは、0.256(s)であるため、その0.256(s)に近いAudio符号のタイムスタンプを検索すると、0.264(s)が該当し、その0.264(s)のAudio符号のファイル位置を取得する。
【0085】
無音Audio符号挿入部11は、ステップB1で取得したAudio符号のファイル位置がGOP単位のカット編集範囲内(中央部分)に存在するか否かを判定する(ステップB2)。
【0086】
無音Audio符号挿入部11は、ステップB1で取得したAudio符号のファイル位置がGOP単位のカット編集範囲内(中央部分)に存在する場合は(ステップB2/Yes)、シーン先頭部分の最初(1番目)のVideo符号のファイル位置に近いAudio符号のタイムスタンプ(AT1)を取得する(ステップB3)。
【0087】
図7に示す0.264(s)のAudio符号のファイル位置は、GOP単位のカット編集範囲内(中央部分)に存在するため、シーン先頭部分の最初(1番目)のVideo符号のファイル位置に近いAudio符号のタイムスタンプ(AT1)を取得することになる。図7に示すシーン先頭部分の最初(1番目)のVideo符号のファイル位置に近いAudio符号のタイムスタンプ(AT1)は、0.072(s)であるため、AT1として0.072を取得する。
【0088】
次に、無音Audio符号挿入部11は、シーン先頭部分の所定番目(4番目)のVideo符号のタイムスタンプに近いAudio符号のタイムスタンプ(AT2)を取得する(ステップB4)。
【0089】
図7に示すシーン先頭部分の所定番目(4番目)のVideo符号のタイムスタンプ(0.256)に近いAudio符号のタイムスタンプ(AT2)は、0.264(s)であるため、AT2として0.264を取得する。
【0090】
無音Audio符号挿入部11は、AT1とAT2との差分からAU(Access Unit)数を計算する(ステップB5)。
【0091】
AT1=0.072、AT2=0.264であるため、AU数は、0.072〜0.264の範囲に相当するAU数になる。図7の場合は、AU数が9個となる。
【0092】
次に、無音Audio符号挿入部11は、AT1からAT2までの範囲内に再多重化処理で利用可能なAudio符号が存在するか否かを判定する(ステップB6)。
【0093】
無音Audio符号挿入部11は、再多重化処理で利用可能なAudio符号が存在する場合は(ステップB6/Yes)、ステップB5で計算したAU数から、その利用可能なAudio符号のAU数を減算したAU数に相当する無音のAudio符号を再多重化部16に渡す(ステップB8)。
【0094】
図7の場合は、0.158〜0.243の範囲のAudio符号は、シーン先頭部分に含まれるVideo符号のタイムスタンプ(0.167〜0.423)に含まれることになる。このため、0.158〜0.243の範囲のAudio符号は、再多重化処理で利用可能なAudio符号に該当し、利用可能なAudio符号が存在すると判定することになる(ステップB6/Yes)。この場合、無音Audio符号挿入部11は、ステップB5で計算したAU数(9個)から利用可能なAudio符号のAU数(5個)を減算したAU数(4個)に相当する無音のAudio符号を再多重化部16に渡す。これにより、無音Audio符号挿入部11は、4個の無音のAudio符号をシーン先頭部分のAudio符号に挿入し、再多重化処理で利用可能なAudio符号はそのまま再多重化処理で利用させることになる。
【0095】
これにより、再多重化処理で利用可能なAudio符号については無音のAudio符号にせずに、元のAudio符号を利用して再多重化処理を行うことができる。
【0096】
また、無音Audio符号挿入部11は、利用可能なAudio符号が存在しない場合は(ステップB6/No)、第1の実施形態と同様に、ステップB5で計算したAU数に相当する無音のAudio符号を再多重化部16に渡す(ステップB7)。これにより、再多重化部16で再多重化する再多重化対象のAudio符号がGOP単位のカット編集を行う中央部分に存在する場合でも、シーン先頭部分の符号(Video符号、Audio符号)の再多重化処理を行うことができる。
【0097】
また、無音Audio符号挿入部11は、ステップB1で取得したAudio符号のファイル位置がGOP単位のカット編集範囲内(中央部分)に存在しない場合は(ステップB2/No)、第1の実施形態と同様に、無音のAudio符号の挿入を行わず、Audio符号抜取部12は、シーン先頭部分の最初(1番目)のAudio符号からシーン先頭部分の最後のAudio符号までのAudio符号を抜き取り、その抜き取ったAudio符号を再多重化部16に渡す(ステップB9)。図7を例に説明すると、シーン先頭部分の最初(1番目)のAudio符号は、0.072に該当し、シーン先頭部分の最後のAudio符号は、0.243に該当するため、その0.072〜0.243までのAudio符号を抜き取り、その抜き取ったAudio符号を再多重化部16に渡すことになる。これにより、再多重化部12は、Audio符号抜取部12から渡されたAudio符号と、Video符号再圧縮部15から渡されたVideo符号と、を基に、シーン先頭部分の符号(Video符号、Audio符号)の最多重化を行うことになる。
【0098】
<本実施形態の編集装置100の作用・効果>
このように、本実施形態の編集装置100は、無音のAudio符号を挿入するか否かを判定するVideo符号を指定し、その指定した所定番目のVideo符号のタイムスタンプを用いて、無音のAudio符号を挿入するか否かを判定する。これにより、無音のAudio符号を挿入するか否かを判定するVideo符号を任意に指定し、該指定した所定番目のVideo符号のタイムスタンプを用いて第1の実施形態と同様な処理を行うことができる。
【0099】
なお、上述する実施形態は、本発明の好適な実施形態であり、上記実施形態のみに本発明の範囲を限定するものではなく、本発明の要旨を逸脱しない範囲において種々の変更を施した形態での実施が可能である。
【0100】
例えば、上述した本実施形態における編集装置100を構成する各装置における制御動作は、ハードウェア、または、ソフトウェア、あるいは、両者の複合構成を用いて実行することも可能である。
【0101】
なお、ソフトウェアを用いて処理を実行する場合には、処理シーケンスを記録したプログラムを、専用のハードウェアに組み込まれているコンピュータ内のメモリにインストールして実行させることが可能である。あるいは、各種処理が実行可能な汎用コンピュータにプログラムをインストールして実行させることが可能である。
【0102】
例えば、プログラムは、記録媒体としてのハードディスクやROM(Read Only Memory)に予め記録しておくことが可能である。あるいは、プログラムは、リムーバブル記録媒体に、一時的、あるいは、永続的に格納(記録)しておくことが可能である。このようなリムーバブル記録媒体は、いわゆるパッケージソフトウエアとして提供することが可能である。なお、リムーバブル記録媒体としては、フロッピー(登録商標)ディスク、CD-ROM(Compact Disc Read Only Memory)、MO(Magneto optical)ディスク、DVD(Digital Versatile Disc)、磁気ディスク、半導体メモリなどが挙げられる。
【0103】
なお、プログラムは、上述したようなリムーバブル記録媒体からコンピュータにインストールすることになる。また、ダウンロードサイトから、コンピュータに無線転送することになる。また、ネットワークを介して、コンピュータに有線で転送することになる。
【0104】
また、本実施形態における編集装置100は、上記実施形態で説明した処理動作に従って時系列的に実行されるのみならず、処理を実行する装置の処理能力、あるいは、必要に応じて並列的にあるいは個別に実行するように構築することも可能である。
【産業上の利用可能性】
【0105】
本発明は、MPEG規格の符号を編集する技術に適用可能である。
【符号の説明】
【0106】
100 編集装置
101 制御部
1011 暗号解除部
1012 DIT挿入部
1013 先頭部分編集部
1014 中央部分編集部
1015 末尾部分編集部
1016 再暗号化部
102 記憶部
1021 MPEG暗号化ファイル
10 Audio符号検索部
11 無音Audio符号挿入部
12 Audio符号抜取部
13 Video符号検索部
14 Video符号抜取部
15 Video符号再圧縮部
16 再多重化部

【特許請求の範囲】
【請求項1】
Video符号とAudio符号とが多重化された映像データの先頭部分と末尾部分に対し、前記Video符号と前記Audio符号とを分離して前記Video符号のフレーム単位に編集した後に再多重化を行うフレーム単位のカット編集を行い、前記先頭部分と末尾部分とを除いた中央部分に対し、前記Video符号のGOP(Group of Pictures)単位で前記映像データを再利用するGOP単位のカット編集を行う編集装置であって、
前記先頭部分と前記末尾部分との少なくとも一方の部分で再多重化する再多重化対象のAudio符号が前記中央部分に存在する場合に、無音のAudio符号を前記一方の部分に挿入する挿入手段を有することを特徴とする編集装置。
【請求項2】
前記挿入手段は、
前記一方の部分に存在するVideo符号のタイムスタンプに近いAudio符号のタイムスタンプを特定し、該特定したAudio符号のファイル位置が前記中央部分に存在する場合に、前記再多重化対象のAudio符号が前記中央部分に存在すると判定することを特徴とする請求項1記載の編集装置。
【請求項3】
前記挿入手段は、
前記再多重化対象のAudio符号が前記中央部分に存在すると判定した場合に、前記一方の部分の最初に存在するVidio符号のファイル位置に近いAudio符号のタイムスタンプから前記Video符号のタイムスタンプに近いAudio符号のタイムスタンプまでの間に存在するAudio符号数に相当する数の無音のAudio符号を挿入することを特徴とする請求項2記載の編集装置。
【請求項4】
前記一方の部分に存在するVideo符号を指定する指定手段を有し、
前記挿入手段は、
前記指定手段で指定されたVideo符号のタイムスタンプに近いAudio符号のタイムスタンプを特定し、該特定したAudio符号のファイル位置が前記中央部分に存在するか否かを判定することを特徴とする請求項2または3記載の編集装置。
【請求項5】
前記挿入手段は、
前記特定したAudio符号のファイル位置が前記中央部分に存在すると判定した場合に、前記一方の部分の最初に存在するVidio符号のファイル位置に近いAudio符号のタイムスタンプから前記指定手段で指定されたVideo符号のタイムスタンプに近いAudio符号のタイムスタンプまでの間に存在するAudio符号数に相当する数の無音のAudio符号を挿入することを特徴とする請求項4記載の編集装置。
【請求項6】
前記挿入手段は、
前記Audio符号数の中で再利用可能なAudio符号が存在する場合は、前記Audio符号数から前記再利用可能なAudio符号数を減算した符号数に相当する数の無音のAudio符号を挿入することを特徴とする請求項3または5記載の編集装置。
【請求項7】
Video符号とAudio符号とが多重化された映像データの先頭部分と末尾部分に対し、前記Video符号と前記Audio符号とを分離して前記Video符号のフレーム単位に編集した後に再多重化を行うフレーム単位のカット編集を行い、前記先頭部分と末尾部分とを除いた中央部分に対し、前記Video符号のGOP(Group of Pictures)単位で前記映像データを再利用するGOP単位のカット編集を行う編集装置で行う制御方法であって、
前記先頭部分と前記末尾部分との少なくとも一方の部分で再多重化する再多重化対象のAudio符号が前記中央部分に存在する場合に、無音のAudio符号を前記一方の部分に挿入する挿入工程を有することを特徴とする制御方法。
【請求項8】
Video符号とAudio符号とが多重化された映像データの先頭部分と末尾部分に対し、前記Video符号と前記Audio符号とを分離して前記Video符号のフレーム単位に編集した後に再多重化を行うフレーム単位のカット編集を行い、前記先頭部分と末尾部分とを除いた中央部分に対し、前記Video符号のGOP(Group of Pictures)単位で前記映像データを再利用するGOP単位のカット編集を行う編集装置に実行させるプログラムであって、
前記先頭部分と前記末尾部分との少なくとも一方の部分で再多重化する再多重化対象のAudio符号が前記中央部分に存在する場合に、無音のAudio符号を前記一方の部分に挿入する挿入処理を、コンピュータに実行させることを特徴とするプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate


【公開番号】特開2011−44931(P2011−44931A)
【公開日】平成23年3月3日(2011.3.3)
【国際特許分類】
【出願番号】特願2009−192164(P2009−192164)
【出願日】平成21年8月21日(2009.8.21)
【出願人】(302069930)NECパーソナルプロダクツ株式会社 (738)
【Fターム(参考)】