編集装置、制御方法及びプログラム

【課題】Video符号とAudio符号とが多重化された映像データの先頭部分と末尾部分との少なくとも一方の部分で再多重化する再多重化対象のAudio符号がGOP単位のカット編集を行う中央部分に存在する場合でも、その一方の部分で再多重化処理を行うことが可能な編集装置を提供する。
【解決手段】本実施形態の編集装置（100）は、Video符号とAudio符号とが多重化された映像データの先頭部分と末尾部分との少なくとも一方の部分で再多重化する再多重化対象のAudio符号がGOP単位のカット編集を行う中央部分に存在する場合に、無音のAudio符号をその一方の部分に挿入する。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、MPEG（Moving Picture Expert Group）規格の符号をカット編集する編集装置、制御方法及びプログラムに関する。
【背景技術】
【０００２】
TS（Transport Stream）符号のカット編集としては、GOP（Group Of Picture）単位で行うカット編集（図８（a）参照）、フレーム単位で行うカット編集（図８（b）参照）がある。
【０００３】
GOP単位のカット編集は、DIT（Discontinue Information Table）をカット点に挿入することで、TS符号の分離処理（TS符号をAudio符号とVideo符号とに分離する処理）や再多重化処理（Audio符号とVideo符号とを再多重化する処理）を行わずに、TS符号の編集を行う処理である。GOP単位のカット編集は、Video符号のGOP単位で元符号を再利用するため、簡単な構成で実現することができるというメリットがある。しかし、GOPの途中でカットすることができないデメリットがある。
【０００４】
フレーム単位のカット編集は、TS符号をVideo符号とAudio符号とに分離し、Video符号は、映像シーン毎に先頭部分と末尾部分とで再圧縮する（先頭部分と末尾部分以外の中央部分は再圧縮しない）。そして、そのVideo符号とAudio符号とを再多重化する処理である。フレーム単位のカット編集は、Video符号とAudio符号とに分離し、Video符号のフレーム単位に編集した後に再多重化処理を行うため、GOPの途中でもカットすることができるというメリットがある。しかし、元符号を再多重化する必要があるので、構成が複雑になってしまうデメリットがある。また、元符号に欠落している箇所がある場合は、再多重化処理を行うために、その欠落した箇所の符号を補正（補足）する必要がある。また、再多重化処理でサポートされていない符号が元符号に存在する場合は、そのサポートされていない符号が削除されてしまうことになる。
【０００５】
なお、フレーム単位のカット編集にGOP単位のカット編集を組み合わせたカット編集もある。このカット編集は、映像シーンの先頭部分と末尾部分とを除いた中央部分に対し、GOP単位のカット編集を行うことになる。このため、中央部分は、元符号を再利用することができる。また、先頭部分と末尾部分とで再圧縮を行う部分は、各々１秒程度になるため、先頭部分と末尾部分とで元符号に欠落している箇所がある場合でも、その欠落した箇所の符号を補正（補足）しなくても済むことになる。また、再多重化処理でサポートされていない符号が元符号に存在し、そのサポートされていない符号が削除されてしまっても符号再生時に大きな支障が生じないで済むことになる。また、GOP単位のカット編集を行う中央部分は、元符号を再利用するため、フレーム単位のカット編集のように、再多重化処理でサポートされていない符号が削除されてしまうことも回避することができる。
【０００６】
しかし、GOP単位のカット編集の範囲内に含まれるVideo符号とAudio符号とは完全に同じ再生時刻にはならない。このため、Video符号とAudio符号とが多重化された映像データの先頭部分と末尾部分との少なくとも一方の部分で再多重化する再多重化対象のAudio符号がGOP単位のカット編集を行う中央部分に存在する場合は、その一方の部分で再多重化処理を行うことができない問題がある。
【０００７】
このため、Video符号とAudio符号とが多重化された映像データの先頭部分と末尾部分との少なくとも一方の部分で再多重化する再多重化対象のAudio符号がGOP単位のカット編集を行う中央部分に存在する場合でも、その一方の部分で再多重化処理を行うことが可能な手法の開発が必要視されることになる。
【０００８】
なお、本発明より先に出願された技術文献として、MPEG-2トランスポートストリームデータを分割編集する技術について開示された文献がある（例えば、特許文献１参照）。
【０００９】
上記特許文献１では、分割編集位置から前方のストリームデータに対応するオーディオ信号が上記分割編集位置を跨いで後方のストリームデータ中に存在する場合は、前方のストリームデータに、該オーディオ信号を含み、且つ上記分割編集位置から該オーディオ信号間のビデオ信号をダミーデータに書き換えたTSパケットデータを追加する。また、上記分割編集位置から後方のストリームデータに、該オーディオ信号のTSパケットデータをダミーデータに書き換える編集を施すことにしている。これにより、上記特許文献１は、分割後に生成された二つのストリームを復号再生した時にユーザに違和感を与えるような異音の発生或いは無音状態を生じる可能性のある音声データを除去することができ、快適なAV情報の視聴を実現することを可能にしている。
【先行技術文献】
【特許文献】
【００１０】
【特許文献１】特開２００５−１１７５５６号公報
【発明の概要】
【発明が解決しようとする課題】
【００１１】
しかし、上記特許文献１は、ビデオ信号をGOP単位でカット編集する場合におけるオーディオ信号の異音発生の解消を目的とするものである。このため、上記特許文献１の発明を、フレーム単位のカット編集とGOP単位のカット編集とを組み合わせたカット編集に適用すると、フレーム単位編集部分とGOP単位編集部分との間にダミーデータが挿入されるため、却ってユーザに違和感を与えてしまうことになる。
【００１２】
本発明は、上記事情に鑑みてなされたものであり、Video符号とAudio符号とが多重化された映像データの先頭部分と末尾部分との少なくとも一方の部分で再多重化する再多重化対象のAudio符号がGOP単位のカット編集を行う中央部分に存在する場合でも、その一方の部分で再多重化処理を行うことが可能な編集装置、制御方法及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【００１３】
かかる目的を達成するために、本発明は、以下の特徴を有することとする。
【００１４】
＜編集装置＞
本発明にかかる編集装置は、
Video符号とAudio符号とが多重化された映像データの先頭部分と末尾部分に対し、前記Video符号と前記Audio符号とを分離して前記Video符号のフレーム単位に編集した後に再多重化を行うフレーム単位のカット編集を行い、前記先頭部分と末尾部分とを除いた中央部分に対し、前記Video符号のGOP（Group of Pictures）単位で前記映像データを再利用するGOP単位のカット編集を行う編集装置であって、
前記先頭部分と前記末尾部分との少なくとも一方の部分で再多重化する再多重化対象のAudio符号が前記中央部分に存在する場合に、無音のAudio符号を前記一方の部分に挿入する挿入手段を有することを特徴とする。
【００１５】
＜制御方法＞
本発明にかかる制御方法は、
Video符号とAudio符号とが多重化された映像データの先頭部分と末尾部分に対し、前記Video符号と前記Audio符号とを分離して前記Video符号のフレーム単位に編集した後に再多重化を行うフレーム単位のカット編集を行い、前記先頭部分と末尾部分とを除いた中央部分に対し、前記Video符号のGOP（Group of Pictures）単位で前記映像データを再利用するGOP単位のカット編集を行う編集装置で行う制御方法であって、
前記先頭部分と前記末尾部分との少なくとも一方の部分で再多重化する再多重化対象のAudio符号が前記中央部分に存在する場合に、無音のAudio符号を前記一方の部分に挿入する挿入工程を有することを特徴とする。
【００１６】
＜プログラム＞
本発明にかかるプログラムは、
Video符号とAudio符号とが多重化された映像データの先頭部分と末尾部分に対し、前記Video符号と前記Audio符号とを分離して前記Video符号のフレーム単位に編集した後に再多重化を行うフレーム単位のカット編集を行い、前記先頭部分と末尾部分とを除いた中央部分に対し、前記Video符号のGOP（Group of Pictures）単位で前記映像データを再利用するGOP単位のカット編集を行う編集装置に実行させるプログラムであって、
前記先頭部分と前記末尾部分との少なくとも一方の部分で再多重化する再多重化対象のAudio符号が前記中央部分に存在する場合に、無音のAudio符号を前記一方の部分に挿入する挿入処理を、コンピュータに実行させることを特徴とする。
【発明の効果】
【００１７】
本発明によれば、Video符号とAudio符号とが多重化された映像データの先頭部分と末尾部分との少なくとも一方の部分で再多重化する再多重化対象のAudio符号がGOP単位のカット編集を行う中央部分に存在する場合でも、その一方の部分で再多重化処理を行うことができる。
【図面の簡単な説明】
【００１８】
【図１】本実施形態の編集装置100の構成例を示す図である。
【図２】編集装置100の処理動作例を示す図である。
【図３】先頭部分編集部1013と、末尾部分編集部1015と、の内部構成例を示す図である。
【図４】先頭部分編集部1013と、末尾部分編集部1015と、で行う処理動作例を示す図である。
【図５】図４に示す処理動作例を説明するための図である。
【図６】第２の実施形態の処理動作例を示す図である。
【図７】図６に示す処理動作例を説明するための図である。
【図８】GOP単位で行うカット編集（a）と、フレーム単位で行うカット編集（b）と、を説明するための図である。
【発明を実施するための形態】
【００１９】
＜本実施形態の編集装置100の概要＞
まず、図１を参照しながら、本実施形態の編集装置100の概要について説明する。
【００２０】
本実施形態の編集装置100は、先頭部分編集部1013と、中央部分編集部1014と、末尾部分編集部1015と、を有して構成し、Video符号とAudio符号とが多重化された映像データの先頭部分と末尾部分に対し、Video符号とAudio符号とを分離してVideo符号のフレーム単位に編集した後に再多重化を行うフレーム単位のカット編集を行い、先頭部分と末尾部分とを除いた中央部分に対し、Video符号のGOP（Group of Pictures）単位で映像データを再利用するGOP単位のカット編集を行う。
【００２１】
本実施形態の編集装置100は、Video符号とAudio符号とが多重化された映像データの先頭部分と末尾部分との少なくとも一方の部分で再多重化する再多重化対象のAudio符号がGOP単位のカット編集を行う中央部分に存在する場合に、無音のAudio符号をその一方の部分に挿入する。
【００２２】
これにより、本実施形態の編集装置100は、Video符号とAudio符号とが多重化された先頭部分と末尾部分との少なくとも一方の部分で再多重化する再多重化対象のAudio符号がGOP単位のカット編集を行う中央部分に存在する場合でも、その少なくとも一方の部分に挿入された無音のAudio符号を用いて、その少なくとも一方の部分で再多重化処理を行うことができる。以下、添付図面を参照しながら、本実施形態の編集装置100について詳細に説明する。
【００２３】
＜本実施形態の編集装置100の構成例＞
まず、図１を参照しながら、本実施形態の編集装置100の構成例について説明する。
【００２４】
本実施形態の編集装置100は、制御部101と、記憶部102と、を有して構成している。
【００２５】
記憶部102は、各種情報を記憶する部分である。記憶部102は、MPEG2暗号化ファイル1021を記憶する。MPEG2暗号化ファイル1021は、MPEG2規格の符号を暗号化したTS符号を格納したファイルである。
【００２６】
制御部101は、編集装置100全体の制御を司る部分である。本実施形態の制御部101は、暗号解除部1011と、DIT（Discontinue Information Table）挿入部1012と、先頭部分編集部1013と、中央部分編集部1014と、末尾部分編集部1015と、再暗号化部1016と、を有して構成する。
【００２７】
暗号解除部1011は、MPEG2暗号化ファイル1021に格納されているTS符号の暗号を解除する。
【００２８】
DIT挿入部1012は、カット編集を行うTS符号のカット点（各映像シーンの先頭部分の最初の位置）にDIT（Discontinue Information Table）を挿入する。
【００２９】
先頭部分編集部1013は、映像シーンの先頭部分の編集を行う。先頭部分編集部1013は、映像シーンの先頭部分に対し、フレーム単位のカット編集を行う。
【００３０】
中央部分編集部1014は、映像シーンの中央部分の編集を行う。中央部分編集部1014は、映像シーンの中央部分に対し、GOP単位のカット編集を行う。
【００３１】
末尾部分編集部1015は、映像シーンの末尾部分の編集を行う。末尾部分編集部1015は、映像シーンの末尾部分に対し、フレーム単位のカット編集を行う。
【００３２】
再暗号化部1016は、カット編集を行ったTS符号に暗号を行う。
【００３３】
＜編集装置100の処理動作＞
次に、図２を参照しながら、本実施形態の編集装置100の処理動作について説明する。
【００３４】
暗号解除部1011は、MPEG2暗号化ファイル1021からTS符号を読み取り、TS符号の暗号を解除する（ステップS1）。TS符号の暗号解除については公知の手法であるため、具体的な処理については割愛する。
【００３５】
DIT挿入部1012は、カット編集を行うTS符号のカット点（映像シーンの先頭部分の最初の位置）にDITを挿入する（ステップS2）。DITの挿入については公知の手法であるため、具体的な処理については割愛する。
【００３６】
先頭部分編集部1013は、映像シーンの先頭部分に対し、フレーム単位のカット編集を行い、先頭部分のTS符号の再圧縮、再多重化を行う（ステップS3）。先頭部分編集部1013は、先頭部分のTS符号をVideo符号とAudio符号とに分離し、Video符号に対しては再圧縮を行う。そして、再圧縮を行ったVideo符号と、Audio符号と、を再多重化する。
【００３７】
中央部分編集部1014は、映像シーンの中央部分に対し、GOP単位のカット編集を行う（ステップS4）。中央部分編集部1014は、中央部分のTS符号を抜き取り、そのTS符号をそのまま再利用する。なお、中央部分編集部1014は、TS符号のタイムスタンプを書き換えたり、GOPヘッダを書き換えたりすることも可能である。
【００３８】
末尾部分編集部1015は、映像シーンの末尾部分に対し、フレーム単位のカット編集を行い、末尾部分のTS符号の再圧縮、再多重化を行う（ステップS5）。末尾部分編集部1015は、末尾部分のTS符号をVideo符号とAudio符号とに分離し、Video符号に対しては再圧縮を行う。そして、再圧縮を行ったVideo符号と、Audio符号と、を再多重化する。
【００３９】
再暗号化部1016は、カット編集を行ったTS符号に対し、再暗号化処理を行い、再暗号化を行ったTS符号をMPEG2暗号化ファイル1021に格納する（ステップS6）。TS符号の暗号化については公知の手法であるため、具体的な処理については割愛する。
【００４０】
本実施形態の編集装置100は、フレーム単位のカット編集にGOP単位のカット編集を組み合わせ、Video符号とAudio符号とが多重化された映像データの先頭部分と末尾部分に対し、Video符号とAudio符号とを分離してVideo符号のフレーム単位に編集した後に再多重化を行うフレーム単位のカット編集を行い、先頭部分と末尾部分とを除いた中央部分に対し、Video符号のGOP（Group of Pictures）単位で映像データを再利用するGOP単位のカット編集を行うことにしている。このため、中央部分は、元符号を再利用することができ、再多重化を行う範囲を減らすことができる。
【００４１】
しかし、GOP単位のカット編集の範囲内に含まれるVideo符号とAudio符号とは完全に同じ再生時刻にはならない。このため、Video符号とAudio符号とが多重化された映像データの先頭部分と末尾部分との少なくとも一方の部分で再多重化する再多重化対象のAudio符号がGOP単位のカット編集を行う中央部分に存在する場合は、その一方の部分で再多重化処理を行うことができない問題がある。
【００４２】
このため、本実施形態では、Video符号とAudio符号とが多重化された映像データの先頭部分と末尾部分との少なくとも一方の部分で再多重化する再多重化対象のAudio符号がGOP単位のカット編集を行う中央部分に存在する場合に、無音のAudio符号をその一方の部分に挿入することにした。
【００４３】
これにより、本実施形態の編集装置100は、Video符号とAudio符号とが多重化された映像データの先頭部分と末尾部分との少なくとも一方の部分で再多重化する再多重化対象のAudio符号がGOP単位のカット編集を行う中央部分に存在する場合でも、その少なくとも一方の部分に挿入された無音のAudio符号を用いて、その少なくとも一方の部分で再多重化処理を行うことができる。以下、その具体的な方法について説明する。
【００４４】
＜先頭部分編集部1013、末尾部分編集部1015の構成例＞
まず、先頭部分編集部1013、末尾部分編集部1015の構成例について説明する。先頭部分編集部1013、末尾部分編集部1015の構成は同様に構成するため、図３を参照しながら、先頭部分編集部1013について説明する。
【００４５】
先頭部分編集部1013は、Audio符号検索部10と、無音Audio符号挿入部11と、Audio符号抜取部12と、Video符号検索部13と、Video符号抜取部14と、Video符号再圧縮部15と、再多重化部16と、を有して構成する。
【００４６】
Audio符号検索部10は、TS符号に含まれるAudio符号を検索する。
【００４７】
無音Audio符号挿入部11は、再多重化部16で再多重化するAudio符号に無音のAudio符号を挿入する。
【００４８】
Audio符号抜取部12は、TS符号に含まれるAudio符号を抜き取る。
【００４９】
Video符号検索部13は、TS符号に含まれるVideo符号を検索する。
【００５０】
Video符号抜取部14は、TS符号に含まれるVideo符号を抜き取る。
【００５１】
Video符号再圧縮部15は、Video符号抜取部14で抜き取ったVideo符号を再圧縮する。
【００５２】
再多重化部16は、Audio符号とVideo符号とを再多重化する。
【００５３】
＜先頭部分編集部1013、末尾部分編集部1014の処理動作例＞
次に、先頭部分編集部1013、末尾部分編集部1014の処理動作例について説明する。先頭部分編集部1013、末尾部分編集部1014の処理動作は同様な処理を行うため、先頭部分編集部1013の処理動作について説明する。
【００５４】
Audio符号検索部10は、TS符号に含まれるAudio符号を検索し、その検索結果を無音Audio符号挿入部11と、Audio符号抜取部12と、に通知する（ステップS10）。
【００５５】
無音Audio符号挿入部11は、Audio符号検索部10から受け付けた検索結果を基に、再多重化部16で再多重化する再多重化対象のAudio符号がGOP単位のカット編集を行う中央部分に存在する場合に、再多重化部16で再多重化するAudio符号に無音のAudio符号を挿入する（ステップS11）。
【００５６】
Audio符号抜取部12は、Audio符号検索部10から受け付けた検索結果を基に、TS符号に含まれるAudio符号を抜き取り、その抜き取ったAudio符号を再多重化部16に渡す（ステップS12）。
【００５７】
Video符号検索部13は、TS符号に含まれるVideo符号を検索し、その検索結果をVideo符号抜取部14に通知する（ステップS13）
【００５８】
Video符号抜取部14は、Video符号検索部13から受け付けた検索結果を基に、TS符号に含まれるVideo符号を抜き取る（ステップS14）。
【００５９】
Video符号再圧縮部15は、Video符号抜取部14で抜き取ったVideo符号を再圧縮し、その再圧縮を行ったVideo符号を再多重化部16に渡す（ステップS15）。
【００６０】
再多重化部16は、Audio符号抜取部12から渡されたAudio符号、または、Audio符号抜取部12から渡されたAudio符号に無音のAudio符号が挿入されたAudio符号と、Video符号再圧縮部15から渡されたVideo符号と、を再多重化する（ステップS16）。
【００６１】
本実施形態の先頭部分編集部1013は、無音Audio符号挿入部11を有して構成し、再多重化部16で再多重化する再多重化対象のAudio符号がGOP単位のカット編集を行う中央部分に存在する場合に、再多重化部16で再多重化するAudio符号に無音のAudio符号を挿入することにしている。これにより、再多重化部16は、再多重化対象のAudio符号がGOP単位のカット編集を行う中央部分に存在する場合でも、無音Audio符号挿入部11により挿入された無音のAudio符号を用いて再多重化処理を行うことができる。
【００６２】
なお、上記の処理は、先頭部分編集部1013での処理動作について説明した。しかし、末尾部分編集部1014についても上記と同様な処理を行うことになる。
【００６３】
＜無音Audio符号挿入部11＞
次に、図４、図５を参照しながら、無音Audio符号挿入部11の具体的な処理動作について説明する。
【００６４】
無音Audio符号挿入部11は、シーン先頭部分の最初（１番目）のVideo符号のタイムスタンプに近いAudio符号のタイムスタンプを検索し、そのAudio符号のファイル位置を取得する（ステップA1）。
【００６５】
例えば、図５に示すシーン先頭部分の最初（１番目）のVideo符号のタイムスタンプは、0.256（s）であるため、その0.256（s）に近いAudio符号のタイムスタンプを検索すると、0.264（s）が該当し、その0.264（s）のAudio符号のファイル位置を取得する。図５に示す時刻は、秒（s）を示し、各パケットは、最小符号化単位を示す。
【００６６】
無音Audio符号挿入部11は、ステップA1で取得したAudio符号のファイル位置がGOP単位のカット編集範囲内（中央部分）に存在するか否かを判定する（ステップA2）。
【００６７】
無音Audio符号挿入部11は、ステップA1で取得したAudio符号のファイル位置がGOP単位のカット編集範囲内（中央部分）に存在する場合は（ステップA2/Yes）、シーン先頭部分の最初（１番目）のVideo符号のファイル位置に近いAudio符号のタイムスタンプ（AT1）を取得する（ステップA3）。
【００６８】
図５に示す0.264（s）のAudio符号のファイル位置は、GOP単位のカット編集範囲内（中央部分）に存在するため、シーン先頭部分の最初（１番目）のVideo符号のファイル位置に近いAudio符号のタイムスタンプ（AT1）を取得することになる。図５に示すシーン先頭部分の最初（１番目）のVideo符号のファイル位置に近いAudio符号のタイムスタンプ（AT1）は、0.072（s）であるため、AT1として0.072を取得する。
【００６９】
次に、無音Audio符号挿入部11は、シーン先頭部分の最初（１番目）のVideo符号のタイムスタンプに近いAudio符号のタイムスタンプ（AT2）を取得する（ステップA4）。
【００７０】
図５に示すシーン先頭部分の最初（１番目）のVideo符号のタイムスタンプ（0.256）に近いAudio符号のタイムスタンプ（AT2）は、0.264（s）であるため、AT2として0.264を取得する。
【００７１】
無音Audio符号挿入部11は、AT1とAT2との差分からAU（Access Unit）数を計算する（ステップA5）。
【００７２】
AT1＝0.072、AT2＝0.264であるため、AU数は、0.072〜0.264の範囲に相当するAU数になる。図５の場合は、AU数が９個となる。
【００７３】
次に、無音Audio符号挿入部11は、ステップA5で計算したAU数に相当する無音のAudio符号を再多重化部16に渡す（ステップA6）。
【００７４】
図５では、AU数が９個となるため、９個の無音のAudio符号を再多重化部16に渡す。このため、無音Audio符号挿入部11は、９個の無音のAudio符号をシーン先頭部分のAudio符号に挿入することになる。
【００７５】
これにより、シーン先頭部分のVideo符号と、Audio符号と、の再生時間をほぼ同じにすることができる。その結果、再多重化部16は、再多重化部16で再多重化する再多重化対象のAudio符号がGOP単位のカット編集を行う中央部分に存在する場合でも、シーン先頭部分の符号（Video符号、Audio符号）の再多重化処理を行うことが可能となる。また、シーン先頭部分のVideo符号のタイムスタンプよりも前の時刻を示すタイムスタンプのAudio符号を無音のAudio符号にすることができる。図５では、シーン先頭部分のVideo符号のタイムスタンプ（0.256）よりも前の時刻を示す0.072〜0.243までのAudio符号を無音のAudio符号にすることができる。
【００７６】
なお、無音Audio符号挿入部11は、ステップA1で取得したAudio符号のファイル位置がGOP単位のカット編集範囲内（中央部分）に存在しない場合は（ステップA2/No）、無音のAudio符号の挿入を行わず、Audio符号抜取部12は、シーン先頭部分の最初のAudio符号からシーン先頭部分の最後のAudio符号までを抜き取り、その抜き取ったAudio符号を再多重化部16に渡す（ステップA7）。図５を例に説明すると、シーン先頭部分の最初のAudio符号は、0.072に該当し、シーン先頭部分の最後のAudio符号は、0.243に該当するため、その0.072〜0.243までのAudio符号を抜き取り、その抜き取ったAudio符号を再多重化部16に渡すことになる。これにより、再多重化部12は、Audio符号抜取部12から渡されたAudio符号と、Video符号再圧縮部15から渡されたVideo符号と、を基に、シーン先頭部分の符号（Video符号、Audio符号）の最多重化を行うことになる。
【００７７】
＜本実施形態の編集装置100の作用・効果＞
このように、本実施形態の編集装置100は、Video符号とAudio符号とが多重化された映像データの先頭部分で再多重化する再多重化対象のAudio符号がGOP単位のカット編集を行う中央部分に存在する場合に、無音のAudio符号を先頭部分に挿入する。これにより、Video符号とAudio符号とが多重化された映像データの先頭部分で再多重化する再多重化対象のAudio符号がGOP単位のカット編集を行う中央部分に存在する場合でも、無音のAudio符号を用いて再多重化処理を行うことが可能となる。
【００７８】
なお、本実施形態の編集装置100は、上述した先頭部分編集部1013の処理を、末尾部分編集1015でも同様に行うことになる。このため、本実施形態の編集装置100は、Video符号とAudio符号とが多重化された映像データの末尾部分で再多重化する再多重化対象のAudio符号がGOP単位のカット編集を行う中央部分に存在する場合に、無音のAudio符号を末尾部分に挿入することになる。これにより、Video符号とAudio符号とが多重化された映像データの末尾部分で再多重化する再多重化対象のAudio符号がGOP単位のカット編集を行う中央部分に存在する場合でも、無音のAudio符号を用いて再多重化処理を行うことが可能となる。
【００７９】
（第２の実施形態）
次に、第２の実施形態について説明する。
【００８０】
第１の実施形態では、シーン先頭部分の最初（１番目）のVideo符号のタイムスタンプを用いて、無音のAudio符号を挿入するか否かを判定することにした。
【００８１】
第２の実施形態では、無音のAudio符号を挿入するか否かを判定するVideo符号を指定し、その指定した所定番目のVideo符号のタイムスタンプを用いて、無音のAudio符号を挿入するか否かを判定することを特徴とする。
【００８２】
これにより、無音のAudio符号を挿入するか否かを判定するVideo符号を任意に指定し、該指定した所定番目のVideo符号のタイムスタンプを用いて第１の実施形態と同様な処理を行うことが可能となる。以下、図６、図７を参照しながら、第２の実施形態について詳細に説明する。なお、以下の処理動作では、無音のAudio符号を挿入するか否かを判定するVideo符号として４番目のVideo符号を指定した場合について説明する。
【００８３】
無音Audio符号挿入部11は、シーン先頭部分の所定番目（４番目）のVideo符号のタイムスタンプに近いAudio符号のタイムスタンプを検索し、そのAudio符号のファイル位置を取得する（ステップB1）。
【００８４】
例えば、図７に示すシーン先頭部分の所定番目（４番目）のVideo符号のタイムスタンプは、0.256（s）であるため、その0.256（s）に近いAudio符号のタイムスタンプを検索すると、0.264（s）が該当し、その0.264（s）のAudio符号のファイル位置を取得する。
【００８５】
無音Audio符号挿入部11は、ステップB1で取得したAudio符号のファイル位置がGOP単位のカット編集範囲内（中央部分）に存在するか否かを判定する（ステップB2）。
【００８６】
無音Audio符号挿入部11は、ステップB1で取得したAudio符号のファイル位置がGOP単位のカット編集範囲内（中央部分）に存在する場合は（ステップB2/Yes）、シーン先頭部分の最初（１番目）のVideo符号のファイル位置に近いAudio符号のタイムスタンプ（AT1）を取得する（ステップB3）。
【００８７】
図７に示す0.264（s）のAudio符号のファイル位置は、GOP単位のカット編集範囲内（中央部分）に存在するため、シーン先頭部分の最初（１番目）のVideo符号のファイル位置に近いAudio符号のタイムスタンプ（AT1）を取得することになる。図７に示すシーン先頭部分の最初（１番目）のVideo符号のファイル位置に近いAudio符号のタイムスタンプ（AT1）は、0.072（s）であるため、AT1として0.072を取得する。
【００８８】
次に、無音Audio符号挿入部11は、シーン先頭部分の所定番目（４番目）のVideo符号のタイムスタンプに近いAudio符号のタイムスタンプ（AT2）を取得する（ステップB4）。
【００８９】
図７に示すシーン先頭部分の所定番目（４番目）のVideo符号のタイムスタンプ（0.256）に近いAudio符号のタイムスタンプ（AT2）は、0.264（s）であるため、AT2として0.264を取得する。
【００９０】
無音Audio符号挿入部11は、AT1とAT2との差分からAU（Access Unit）数を計算する（ステップB5）。
【００９１】
AT1＝0.072、AT2＝0.264であるため、AU数は、0.072〜0.264の範囲に相当するAU数になる。図７の場合は、AU数が９個となる。
【００９２】
次に、無音Audio符号挿入部11は、AT1からAT2までの範囲内に再多重化処理で利用可能なAudio符号が存在するか否かを判定する（ステップB6）。
【００９３】
無音Audio符号挿入部11は、再多重化処理で利用可能なAudio符号が存在する場合は（ステップB6/Yes）、ステップB5で計算したAU数から、その利用可能なAudio符号のAU数を減算したAU数に相当する無音のAudio符号を再多重化部16に渡す（ステップB8）。
【００９４】
図７の場合は、0.158〜0.243の範囲のAudio符号は、シーン先頭部分に含まれるVideo符号のタイムスタンプ（0.167〜0.423）に含まれることになる。このため、0.158〜0.243の範囲のAudio符号は、再多重化処理で利用可能なAudio符号に該当し、利用可能なAudio符号が存在すると判定することになる（ステップB6/Yes）。この場合、無音Audio符号挿入部11は、ステップB5で計算したAU数（９個）から利用可能なAudio符号のAU数（５個）を減算したAU数（４個）に相当する無音のAudio符号を再多重化部16に渡す。これにより、無音Audio符号挿入部11は、４個の無音のAudio符号をシーン先頭部分のAudio符号に挿入し、再多重化処理で利用可能なAudio符号はそのまま再多重化処理で利用させることになる。
【００９５】
これにより、再多重化処理で利用可能なAudio符号については無音のAudio符号にせずに、元のAudio符号を利用して再多重化処理を行うことができる。
【００９６】
また、無音Audio符号挿入部11は、利用可能なAudio符号が存在しない場合は（ステップB6/No）、第１の実施形態と同様に、ステップB5で計算したAU数に相当する無音のAudio符号を再多重化部16に渡す（ステップB7）。これにより、再多重化部16で再多重化する再多重化対象のAudio符号がGOP単位のカット編集を行う中央部分に存在する場合でも、シーン先頭部分の符号（Video符号、Audio符号）の再多重化処理を行うことができる。
【００９７】
また、無音Audio符号挿入部11は、ステップB1で取得したAudio符号のファイル位置がGOP単位のカット編集範囲内（中央部分）に存在しない場合は（ステップB2/No）、第１の実施形態と同様に、無音のAudio符号の挿入を行わず、Audio符号抜取部12は、シーン先頭部分の最初（１番目）のAudio符号からシーン先頭部分の最後のAudio符号までのAudio符号を抜き取り、その抜き取ったAudio符号を再多重化部16に渡す（ステップB9）。図７を例に説明すると、シーン先頭部分の最初（１番目）のAudio符号は、0.072に該当し、シーン先頭部分の最後のAudio符号は、0.243に該当するため、その0.072〜0.243までのAudio符号を抜き取り、その抜き取ったAudio符号を再多重化部16に渡すことになる。これにより、再多重化部12は、Audio符号抜取部12から渡されたAudio符号と、Video符号再圧縮部15から渡されたVideo符号と、を基に、シーン先頭部分の符号（Video符号、Audio符号）の最多重化を行うことになる。
【００９８】
＜本実施形態の編集装置100の作用・効果＞
このように、本実施形態の編集装置100は、無音のAudio符号を挿入するか否かを判定するVideo符号を指定し、その指定した所定番目のVideo符号のタイムスタンプを用いて、無音のAudio符号を挿入するか否かを判定する。これにより、無音のAudio符号を挿入するか否かを判定するVideo符号を任意に指定し、該指定した所定番目のVideo符号のタイムスタンプを用いて第１の実施形態と同様な処理を行うことができる。
【００９９】
なお、上述する実施形態は、本発明の好適な実施形態であり、上記実施形態のみに本発明の範囲を限定するものではなく、本発明の要旨を逸脱しない範囲において種々の変更を施した形態での実施が可能である。
【０１００】
例えば、上述した本実施形態における編集装置100を構成する各装置における制御動作は、ハードウェア、または、ソフトウェア、あるいは、両者の複合構成を用いて実行することも可能である。
【０１０１】
なお、ソフトウェアを用いて処理を実行する場合には、処理シーケンスを記録したプログラムを、専用のハードウェアに組み込まれているコンピュータ内のメモリにインストールして実行させることが可能である。あるいは、各種処理が実行可能な汎用コンピュータにプログラムをインストールして実行させることが可能である。
【０１０２】
例えば、プログラムは、記録媒体としてのハードディスクやROM（Read Only Memory）に予め記録しておくことが可能である。あるいは、プログラムは、リムーバブル記録媒体に、一時的、あるいは、永続的に格納（記録）しておくことが可能である。このようなリムーバブル記録媒体は、いわゆるパッケージソフトウエアとして提供することが可能である。なお、リムーバブル記録媒体としては、フロッピー（登録商標）ディスク、CD-ROM（Compact Disc Read Only Memory）、MO（Magneto optical）ディスク、DVD（Digital Versatile Disc）、磁気ディスク、半導体メモリなどが挙げられる。
【０１０３】
なお、プログラムは、上述したようなリムーバブル記録媒体からコンピュータにインストールすることになる。また、ダウンロードサイトから、コンピュータに無線転送することになる。また、ネットワークを介して、コンピュータに有線で転送することになる。
【０１０４】
また、本実施形態における編集装置100は、上記実施形態で説明した処理動作に従って時系列的に実行されるのみならず、処理を実行する装置の処理能力、あるいは、必要に応じて並列的にあるいは個別に実行するように構築することも可能である。
【産業上の利用可能性】
【０１０５】
本発明は、MPEG規格の符号を編集する技術に適用可能である。
【符号の説明】
【０１０６】
１００編集装置
１０１制御部
１０１１暗号解除部
１０１２ＤＩＴ挿入部
１０１３先頭部分編集部
１０１４中央部分編集部
１０１５末尾部分編集部
１０１６再暗号化部
１０２記憶部
１０２１ＭＰＥＧ暗号化ファイル
１０Ａｕｄｉｏ符号検索部
１１無音Ａｕｄｉｏ符号挿入部
１２Ａｕｄｉｏ符号抜取部
１３Ｖｉｄｅｏ符号検索部
１４Ｖｉｄｅｏ符号抜取部
１５Ｖｉｄｅｏ符号再圧縮部
１６再多重化部

【特許請求の範囲】
【請求項１】
Video符号とAudio符号とが多重化された映像データの先頭部分と末尾部分に対し、前記Video符号と前記Audio符号とを分離して前記Video符号のフレーム単位に編集した後に再多重化を行うフレーム単位のカット編集を行い、前記先頭部分と末尾部分とを除いた中央部分に対し、前記Video符号のGOP（Group of Pictures）単位で前記映像データを再利用するGOP単位のカット編集を行う編集装置であって、
前記先頭部分と前記末尾部分との少なくとも一方の部分で再多重化する再多重化対象のAudio符号が前記中央部分に存在する場合に、無音のAudio符号を前記一方の部分に挿入する挿入手段を有することを特徴とする編集装置。
【請求項２】
前記挿入手段は、
前記一方の部分に存在するVideo符号のタイムスタンプに近いAudio符号のタイムスタンプを特定し、該特定したAudio符号のファイル位置が前記中央部分に存在する場合に、前記再多重化対象のAudio符号が前記中央部分に存在すると判定することを特徴とする請求項１記載の編集装置。
【請求項３】
前記挿入手段は、
前記再多重化対象のAudio符号が前記中央部分に存在すると判定した場合に、前記一方の部分の最初に存在するVidio符号のファイル位置に近いAudio符号のタイムスタンプから前記Video符号のタイムスタンプに近いAudio符号のタイムスタンプまでの間に存在するAudio符号数に相当する数の無音のAudio符号を挿入することを特徴とする請求項２記載の編集装置。
【請求項４】
前記一方の部分に存在するVideo符号を指定する指定手段を有し、
前記挿入手段は、
前記指定手段で指定されたVideo符号のタイムスタンプに近いAudio符号のタイムスタンプを特定し、該特定したAudio符号のファイル位置が前記中央部分に存在するか否かを判定することを特徴とする請求項２または３記載の編集装置。
【請求項５】
前記挿入手段は、
前記特定したAudio符号のファイル位置が前記中央部分に存在すると判定した場合に、前記一方の部分の最初に存在するVidio符号のファイル位置に近いAudio符号のタイムスタンプから前記指定手段で指定されたVideo符号のタイムスタンプに近いAudio符号のタイムスタンプまでの間に存在するAudio符号数に相当する数の無音のAudio符号を挿入することを特徴とする請求項４記載の編集装置。
【請求項６】
前記挿入手段は、
前記Audio符号数の中で再利用可能なAudio符号が存在する場合は、前記Audio符号数から前記再利用可能なAudio符号数を減算した符号数に相当する数の無音のAudio符号を挿入することを特徴とする請求項３または５記載の編集装置。
【請求項７】
Video符号とAudio符号とが多重化された映像データの先頭部分と末尾部分に対し、前記Video符号と前記Audio符号とを分離して前記Video符号のフレーム単位に編集した後に再多重化を行うフレーム単位のカット編集を行い、前記先頭部分と末尾部分とを除いた中央部分に対し、前記Video符号のGOP（Group of Pictures）単位で前記映像データを再利用するGOP単位のカット編集を行う編集装置で行う制御方法であって、
前記先頭部分と前記末尾部分との少なくとも一方の部分で再多重化する再多重化対象のAudio符号が前記中央部分に存在する場合に、無音のAudio符号を前記一方の部分に挿入する挿入工程を有することを特徴とする制御方法。
【請求項８】
Video符号とAudio符号とが多重化された映像データの先頭部分と末尾部分に対し、前記Video符号と前記Audio符号とを分離して前記Video符号のフレーム単位に編集した後に再多重化を行うフレーム単位のカット編集を行い、前記先頭部分と末尾部分とを除いた中央部分に対し、前記Video符号のGOP（Group of Pictures）単位で前記映像データを再利用するGOP単位のカット編集を行う編集装置に実行させるプログラムであって、
前記先頭部分と前記末尾部分との少なくとも一方の部分で再多重化する再多重化対象のAudio符号が前記中央部分に存在する場合に、無音のAudio符号を前記一方の部分に挿入する挿入処理を、コンピュータに実行させることを特徴とするプログラム。

【図１】