説明

情報処理装置及び情報処理方法

【課題】編集後のデータ構造を事前に考慮したBox構造を利用することができる情報処理
装置及び情報処理方法を提供する。
【解決手段】ISO14496に規定するデータ構造を有し、データ先頭のメタデータと
前記メタデータに続くメディアデータとからなるデータにおける切り出しをする切り出し
手段と、前記切り出し手段が切り出した前記データの先頭部分に相当する前記メタデータ
のISO14496に規定するフリーボックス(free box)をSD-Video規格に規定する SDP
rofile Boxに置換する置換する置換手段とを備えた情報処理装置。

【発明の詳細な説明】
【技術分野】
【0001】
本発明の実施形態は、MP4データを編集する情報処理装置及び情報処理方法に関する。
【背景技術】
【0002】
MP4データ等のマルチメディアデータの再生方法に工夫がなされてきている。例えば特
許文献1では、マルチメディアデータ中の動画像データ中のキーフレームを特定する情報
を再生制御データとして生成し、再生制御データを、マルチメディアデータの所定位置に
配置する。特殊再生時には、この再生制御データを用いることで、ランダムアクセス等に
用いるキーフレームを容易に特定、読み出して再生することが可能である。再生制御デー
タをマルチメディアデータの、従来機器が無視する領域に配置することで、ファイル互換
性も維持することができる。この特許文献1はランダムアクセス用の情報をMP4データ中
に挿入しておき、特殊再生に利用するものである。
【0003】
また特許文献1は、ファイル変換装置で、予めMP4ファイル生成装置で、free boxを生
成して置き、ファイル変換時にmdatのコピー処理を不要にしている。手段としては、編集
後のmoovサイズ増加分を予め見積もってfree boxをmoovの前に挿入しておくものである。
【0004】
一方、編集後のデータ構造を事前に考慮したBox構造を利用することで、編集時の作業
用メモリサイズの削減を図る要望があるが、かかる要望を実現するための手段は知られて
いない。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2006−74531号公報
【特許文献2】特開2003−173625号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
本発明は、編集後のデータ構造を事前に考慮したBox構造を利用することができる情報
処理装置及び情報処理方法を提供することを目的とする。
【課題を解決するための手段】
【0007】
上記課題を解決するために、実施形態の情報処理装置によれば、ISO14496に規
定するデータ構造を有し、データ先頭のメタデータと前記メタデータに続くメディアデー
タとからなるデータにおける切り出しをする切り出し手段と、前記切り出し手段が切り出
した前記データの先頭部分に相当する前記メタデータのISO14496に規定するフリ
ーボックス(free box)をSD-Video規格に規定する SD Profile Boxに置換する置換する置換手段とを備えた。
【図面の簡単な説明】
【0008】
【図1】本発明の一実施形態に係わるテレビ受信装置の構成を概略的に示すブロック図。
【図2】ISOファイル形式のデータ構造を単純化して示す図。
【図3】実施形態の切り出しを考慮したBox構造列を説明するために示す図。
【図4】同実施形態の切り出し後のデータ列を示す図。
【図5】同実施形態に用いられる切り出し区間のmoov構築フロー図。
【図6】同他の形態のtrak 内に free boxを挿入しておくケースを示す図。
【発明を実施するための形態】
【0009】
以下、本発明の実施形態を説明する。
(第1の実施形態)
本発明による第1の実施形態を図1乃至図5を参照して説明する。
本発明は、映像・音声コンテンツの再生機能を有するデジタルテレビやカーナビゲーシ
ョン装置等、デジタルメディア再生機器全般に適用することができる。
(放送受信装置の構成と動作)
まず、本発明の一実施形態であるテレビ受信装置を、図1を用いて説明する。
図1は、後に述べる図3以下のシステムを適用する情報処理装置の一実施形態であるデ
ジタル放送受信装置等のテレビ受信装置の構成の一例を示すブロック図である。
【0010】
このテレビ受信装置は、地上アナログ放送波、並びにBS、CS及び地上デジタル放送
波を受信可能であり、マイクロプロセッサ10、デジタル用チューナ11、アナログ用チ
ューナ12、デジタル用復調器13、アナログ用復調器14及びTS復号器15を備えて
いる。
【0011】
BS、CS及び地上デジタル放送波は、アンテナ1で受信され、この受信信号がデジタ
ル用チューナ11に供給される。同様に、地上アナログ放送波は、アンテナ1で受信され
、この受信信号がアナログ用チューナ12に供給される。デジタル用チューナ11及びア
ナログ用チューナ12は、フェーズロックドループ(PLL)方式を採用し、マイクロプロ
セッサ10の制御により中心周波数及び帯域幅等の受信パラメータを指定してそれぞれ所
望の放送波を選局するために用いられる。
【0012】
デジタル用チューナ11で選局した放送波の受信信号は、例えば日本の地上デジタル放
送の場合にOFDM(orthogonal frequency division multiplexing)方式のデジタル用復
調器13及びTS復号器15に順次供給され、これらでデジタル映像信号及び音声信号に
復調及び復号される。アナログ用チューナ12で選局された受信信号は、アナログ用復調
器14に供給され、ここでアナログ映像信号及び音声信号に復調される。
【0013】
このテレビ受信装置は、更に、信号処理部16、グラフィック処理部17、OSD(on
screen display)信号生成部18、映像処理部19、ディスプレイ20、音声処理部21
、スピーカー22、操作パネル23、赤外線受光部24、リモコン25、フラッシュメモ
リ26、USB(Universal Serial Bus)コネクタ27、カードコネクタ28、及びネット
ワーク通信回路29を備える。信号処理部16は、TS復号器15からのデジタル映像信
号及び音声信号に対して選択的に所定のデジタル信号処理を施し、それぞれグラフィック
処理部17及び音声処理部21に出力する。また、信号処理部16は、アナログ用復調器
14からのアナログ映像信号及び音声信号を選択的にデジタル化し、このデジタル化され
た映像信号及び音声信号に対して所定のデジタル信号処理を施し、それぞれグラフィック
処理部17及び音声処理部21に出力する。
【0014】
グラフィック処理部17は、信号処理部16から出力されたデジタル映像信号にOSD
信号生成部18で生成されたOSD信号を選択的に重畳して出力する。映像処理部19は
、グラフィック処理部17から出力されたデジタル映像信号に対してディスプレイ20に
適合させる例えばサイズ調整等の変換を行う。ディスプレイ20は、映像処理部19から
出力された映像信号に対応する映像を表示する。音声処理部21は、信号処理部16から
出力されたデジタル音声信号をスピーカー22に適合させる音量調整等の変換を行う。ス
ピーカー22は、音声処理部21から出力された音声信号に対応する音声を再生する。
【0015】
マイクロプロセッサ10は、操作パネル23からの操作情報、またはリモコン25から
送出され赤外線受光部24で受信された操作情報を受けて、その操作内容が反映されるよ
うに各コンポーネントを制御する。ここで、操作パネル或いはキーボード23及びリモコ
ン25は、ユーザーインタフェースとして機能する操作モジュールに相当している。図1
に示すように、マイクロプロセッサ10は、様々な処理及び制御を行うCPU(central p
rocessing unit)31、このCPU31の制御プログラム及び様々な初期データを保持す
るROM(read only memory)32、CPU31の入出力情報を一時的に格納する作業エ
リアを提供するRAM(random access memory)33、ICバス等を介して各コンポー
ネントに対する設定情報及び制御情報を入出力するインタフェース34、及び放送波やネ
ットワーク経由で取得される時刻情報及び日付情報に従って補正される時計回路35を含
んでいる。
【0016】
USBコネクタ27は、様々なUSB機器を接続するために設けられている。カードコ
ネクタ28は、様々なメディアカードを接続するために設けられている。また、ネットワ
ーク通信回路29は、インターネットに直接あるいはLAN(local area network)経由で
接続されている。時刻情報を放送波から取得する場合は、アンテナ1で受信した信号から
、また時刻情報等基礎データをネットワークから取得する場合は、ネットワーク通信回路
29から、それぞれマイクロプロセッサ10に取り込まれる。
【0017】
またUSBコネクタ27やカードコネクタ28は、外部からUSB機器(メモリ等)や
メディアカードを接続して動画、写真、音楽データを読み出すことができる。
マイクロプロセッサ10は、USBコネクタ27に接続されるUSBメモリやカードコ
ネクタ28に接続されるメディアカードにファイルとして保持される映像を取り込み、信
号処理部16、グラフィック処理部17、及び映像処理部19での処理を経て各映像をデ
ィスプレイ20に表示させる制御を行えるように構成されている。
【0018】
なお次の図1に関し、ハードディスクHに相当する部分は記載を省略しているが、上記
USB機器として備えられていて記憶媒体を構成していてもよい。
図2は、ISOファイル形式のデータ構造を単純化して示す図である。
ISOファイル形式のBox構成は通常、図2で示されるように、動画像や音声サンプ
ルの管理情報のような、メディアデータのメタデータを格納するためのmoov201と、動
画像や音声のサンプルデータのような実際のメディアデータを格納するmdat202とから
構成される。
【0019】
moov201内には、個々のメディアデータに対応するtrakと呼ばれるBox203が包
含される。また、mdat202内のメディアデータは、チャンク(chunk)と呼ばれる動画像
や音声の連続する複数サンプルのセットに分割されて格納されており、mdat202のdata
フィールドにはチャンクの配列が格納される。なお、このチャンクのサイズや含まれるサ
ンプルの個数には特に制約はなく、環境や状況に応じて任意の大きさやサンプル数を持つ
チャンクを構成し、格納することが出来る。
【0020】
このようなISOファイル形式においては、ランダムアクセス(特殊再生) 処理用の
情報として、ランダムアクセスポイントを特定するためのデータ構造が規定されている。
【0021】
ランダムアクセスは主にstbl204に含まれている子Boxを使うことによって行われ
る。
stts(time-to-sample)205は、トラックのサンプルがどの時刻と対応するかを示して
いる。与えられた時刻以前の最初のサンプルを見つけるために、このBoxを使用する。
【0022】
尚、ここではstts205を例に挙げたが、図示せぬcttsと呼ばれるBoxを使用しても
、同様に与えられた時刻以前の最初のサンプルを見つけることが可能である。
【0023】
しかし、見つかったサンプルはランダムアクセスポイントではないかもしれない為、最
も近いランダムアクセスポイントを見つけるには更に以下のBoxを調べる必要がある。
【0024】
stss(sync sample table)206は、どのサンプルが実際のランダムアクセスポイント
であるかを示す。このBoxを使用すると、与えられた時刻以前の最初のサンプル番号を
探すことが出来る。stss206が無い場合は、すべてのサンプルがランダムアクセスポイ
ントであることを示しているため、ランダムアクセスは容易になる。
【0025】
この時点で、ランダムアクセスのために使用すべきサンプル番号を見つけることができ
た。次に、このサンプル番号がどのチャンクに配置されているかを決定するため、stsc(s
ample-to-chunk)207を使用する。
【0026】
更に、そのチャンクがどこで始まるかを解決するためにstco(chunk offset)208を使
用する。尚、ここではstcoを例に挙げたが、図示せぬco64( 64bit chunk offset)と呼ば
れるBoxを使用しても、同様にチャンクのオフセット位置を知ることが可能である。
【0027】
このオフセットから出発し、このチャンク内での目的のサンプルが配置されている位置
までの間に存在する各サンプルのサイズをstsz(sample size)209から取得し、サイズ
の総和を計算する。この総サイズを目的のチャンクオフセット位置に加えた位置が、目的
とするサンプルの開始位置となる。
【0028】
このようにして得られるサンプルの開始位置及びサイズを用いて、mdat202からラン
ダムアクセスに用いるサンプルデータを特定することが可能になる。
さて本実施形態の目的として、例えば長時間録画したテレビ番組(MP4形式)をSDカー
ドに入れて持ち出せるようにMP4データの切り出しを行う。例えばこの切り出し処理をソ
フトウェアで実現する場合、一般的な手法よりもメモリ使用量および処理負荷を削減する

【0029】
(概要)
ターゲットのMP4データから再生したい区間を抜き出して新たなMP4データを作成する場
合、分離したストリームから再生区間を選び再多重化を行うのが一般的な方法である。mo
ovを再構築すると元データの情報が失われがちで、しかし元データの情報を保ったまま再
多重化するにはデマルチプレクス(demux)処理時の処理負荷とメモリ使用量が増加する。m
datの部分を抜き出してMP4データを作成する場合、以下の手順が必要である。
【0030】
(1)Audio/Videoストリームを分離する(≒demux)
(2)切り出し範囲のAudio/Videoストリームを取得する
(3)再多重化を行う
この手順によれば、詳細な切り出しが可能だが、使用メモリサイズが大きく、処理負荷
も高い。
しかし本実施形態の特徴として、再多重化を行わずに、元データのコピーによってMedi
a Dataの切り出し後のmoovを構築する。即ちストリームを分離せずに各トラックのstbl b
ox以下を作り直す。その他の情報は出来るだけオリジナルをそのままコピーし、moovを構
築する。(ただし各trakのstbl box以下(Mediaデータのサイズ・オフセットなどの情報
が格納された領域)のテーブル縮小処理やdurationの更新などは行う)
【0031】
図3は、実施形態の切り出しを考慮したBox構造列を説明するために示す図である。
フリーボックスは、ISO14496に規定するtrakと同位に列せられる。破線囲いで示
したのは、Audio/Video各trakの想定された減少データである(図4参照)。
【0032】
SDカードにデータを移す際にSD Profile Box(sdvp)の挿入が必要になるが、事前(元
データの多重化時)に26[byte]分(User_data および Extra_data area のサイズを 0 と
した場合)の free box を挿入しておく。
【0033】
図4は、実施形態の切り出し後のデータ列を示す図である。
破線囲いで示したtrakの減少データ分はsdvpの自由領域として利用できるようにする。
(フローチャートの説明)
図5は、実施形態に用いられる切り出し区間のmoov構築フロー図である。このフローチ
ャートは、図3のBox構造で多重化されたMP4データをSDカード用に切り出す場合を示した
。以下、マイクロプロセッサ10が主に制御するステップS1-1から順に詳細を述べる。
【0034】
<事前準備>
ステップS1-1: 切り出したい範囲を時間単位で指定する。(この例では時間単位で指定
したが、切り出す範囲がstbl box上で検出できればどんな単位でも良い)
【0035】
ステップS1-2: MP4データでは先頭からの通し番号でサンプルを管理しており、切り出
し後のstbl boxサイズを取得するため、切り出し範囲に対応するサンプル番号を取得する

【0036】
ステップS1-3: ステップS1-2で取得したサンプル番号を元にstbl box以下の各Boxのテ
ーブルサイズを見積もり、切り出し後のstbl boxサイズを取得する。
【0037】
(切り出し後のstbl box サイズ減少分) diff [bytes] は、(オリジナルの stbl box
サイズ)から(切り出し後の stbl Box サイズ)を差し引いたものである。
【0038】
なお上記のステップS1-2〜ステップS1-3は全トラックに対して実施し、ステップS1-3で
得られる diff は全トラック分の合計サイズである。
<切り出し後のmoov構築>
ステップS1-4: moov から mvhd の終端までをそのままコピーする。(なおdurationやmod
ification_timeなど、最新の情報で更新しなければならないパラメータは後段ステップS1
-9で対応する。)
【0039】
ステップS1-5:事前に用意した free box を sdvp box で置き換える。事前に用意した fr
ee box は User_data_len = 0 および Extra_data_len = 0 の場合であるので、ステップ
S1-3で求めた diff 分の領域を User_data または Extra_data 用に利用する。
【0040】
free box の中身は sdvp box として記載すべきデータにしておく。これによってbox typ
e と box size のみ書き換えれば良い。
【0041】
<trak 毎の処理>
以下、(ステップS1-6からステップS1-8は挿入された trak 毎に処理を行う。
ステップS1-6: trak から stbl box (child box の直前まで)をそのままコピーする。
ステップS1-7: ステップS1-2およびステップS1-3で得られた情報を元に、stbl box 内の
child box を構築する。
ステップS1-8:全ての trak に対してステップS1-6からステップS1-7を実行する。
<必要データの更新>
ステップS1-9: stbl box 以下のサイズが小さくなった trak の各 box サイズを更新する
。その他、duration や modifictaion_time 等、必要に応じて更新する。
【0042】
<終了処理>
ステップS1-10: moov 内に uuid 等が挿入されていれば、そのままコピーする。
ステップS1-11: moov の構築が完了。
以上の第1の実施形態では、trakと同位に単一のfree boxを構成するのみで効果をえる
ことができる。
(第2の実施形態)
本発明による第2の実施形態を図1乃至図2及び図6を参照して説明する。実施形態1
と共通する部分は説明を省略する。
図6は、trak 内に free boxを挿入しておくケースを示す図である。
切り出し後のstbl boxサイズについて、減少分が9[byte]以上である場合、free boxで
置き換えることが可能である(本願発明者による特許公開番号P2009-239861を参照)。fr
ee boxを挿入してオリジナルと同じサイズに保てば、trakの再配置などが不要になる。し
かし、減少分が 9 [byte] 未満の場合はfree boxで置換することが出来ない。
【0043】
そこで、事前に各trakの終端にboxサイズが9[byte] になるようなfree boxを挿入して
おく。これによって、減少分が9[byte]未満の場合でも、事前に挿入しておいたfree box
に吸収することが出来る。
【0044】
上記のようにtrakを多重分離しないため、本実施形態ではソフトウェア処理に必要なメ
モリサイズが少なくて済む。特に長時間コンテンツの編集には有用である。
【0045】
(1)MP4データから再生したい区間を部分的に抜き出し別のMP4データを作成する場合を
想定して、free boxを挿入しておく。切り出し後のMP4データをSDカードで持ち出す場合
、この挿入したfree boxのヘッダをSDカード向けの sdvp box で置き換えれば良い。これ
によって再多重化を行わずに、簡単なデータの置換で新たなMP4データを作成することが
出来る。
【0046】
(2)MP4データから再生したい区間を部分的に抜き出すと、各トラックの再生に関する
情報(stbl box以下のデータ)が削減される。この削減された領域をsdvp boxのUser_dat
a または Extra_dataとして利用するため、各トラックを後ろにずらし、sdvp boxのUser_
data または Extra_data領域を用意する。これによって、moovのサイズを維持したままSD
カード向けのMP4仕様を満たすことが出来る。
【0047】
即ち、moovに続いてmdatが存在するBox構造になっているMP4データの場合、moovのデー
タサイズが変わると格納先のオフセット値を更新しなければならない。Mdatの切り出しを
行なっても、moovの終端位置が同じであればmoovのデータ長を考慮しなくて済む。
【0048】
なお、この発明は上記実施形態に限定されるものではなく、この外その要旨を逸脱しな
い範囲で種々変形して実施することができる。
また、上記した実施の形態に開示されている複数の構成要素を適宜に組み合わせること
により、種々の発明を形成することができる。例えば、実施の形態に示される全構成要素
から幾つかの構成要素を削除しても良いものである。さらに、異なる実施の形態に係わる
構成要素を適宜組み合わせても良いものである。
【符号の説明】
【0049】
10…マイクロプロセッサ、16…信号処理部、17…グラフィック処理部、18…O
SD信号生成部、19…映像処理部、20…ディスプレイ、23…操作パネル、24…赤
外線受光部、25…リモコン、26…フラッシュメモリ、27…USBコネクタ、28…
カードコネクタ、29…ネットワーク通信回路、R…リモコン。

【特許請求の範囲】
【請求項1】
ISO14496に規定するデータ構造を有し、データ先頭のメタデータと前記メタデ
ータに続くメディアデータとからなるデータにおける切り出しをする切り出し手段と、
前記切り出し手段が切り出した前記データの先頭部分に相当する前記メタデータのIS
O14496に規定するフリーボックス(free box)をSD-Video規格に規定する SD
Profile Boxに置換する置換手段とを
備えた情報処理装置。
【請求項2】
前記フリーボックスは、ISO14496に規定するtrakと同位に列せられる、請求項
1に記載の情報処理装置。
【請求項3】
前記フリーボックスは、ISO14496に規定するtrakの下位に列せられる、請求項
1に記載の情報処理装置。
【請求項4】
切り出し手段が、ISO14496に規定するデータ構造を有し、データ先頭のメタデ
ータと前記メタデータに続くメディアデータとからなるデータにおける切り出しを実行し

更新手段が、前記切り出し手段が切り出した前記データの先頭部分に相当する前記メタ
データのISO14496に規定するフリーボックス(free box)をSD-Video規格に規定す
る SD
Profile Boxに置換する、情報処理方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2012−10038(P2012−10038A)
【公開日】平成24年1月12日(2012.1.12)
【国際特許分類】
【出願番号】特願2010−143178(P2010−143178)
【出願日】平成22年6月23日(2010.6.23)
【出願人】(000003078)株式会社東芝 (54,554)
【Fターム(参考)】