説明

ファイル生成装置およびデータ出力装置

【課題】音声データや動画データ等について、再生装置の特性やデータの制作者の意図を反映した出力を得る技術を提供する。
【解決手段】時間経過を伴う電気信号を符号化した各種データをファイル化するにあたり、データを出力する出力装置におけるデータの出力態様を制御するための出力制御パラメータを併せてファイルに格納する。出力装置は、この出力制御パラメータを参照することにより、出力装置の特性やデータの制作者の意図を反映した出力制御を行うことができる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、時間経過を伴う電気信号を符号化したデータの出力を制御する技術に関する。
【背景技術】
【0002】
ビデオテープやDVDに記録された動画、あるいはCDに記録された音楽などのデータには、その制作過程において、フェードイン・フェードアウトや色調補正、周波数イコライジングや残響効果等の様々なエフェクトが施されている。また、そのデータを再生する再生装置は、各メーカから多種多様な商品がラインナップされている。
【0003】
しかし、データの制作者は、このような多種多様の再生装置の特性等を個々に考慮してデータを制作することは困難である。そのため、ある装置では効果的なエフェクトが、ある装置では効果的に感じられない場合等が生じていた。例えば、フェードイン処理が施された音楽を再生する際に、その再生可能な音量範囲の違いから、大口径スピーカを備えたステレオ装置では、直線的に音が経ち上がるように聞こえるが、携帯型プレーヤのヘッドフォンで聞く場合には、突然音が経ち上がるように聞こえる場合などがある。他の例としては、あるメーカのテレビの発色を基準として制作された動画が、他のメーカのテレビで再生すると、肌色が赤味がかって見えてしまう場合などがある。
【発明の開示】
【発明が解決しようとする課題】
【0004】
本発明は、これらの課題に鑑みてなされたものであり、個々の再生環境に応じてデータを制作することなく、再生装置の特性やデータの制作者の意図を反映したデータの出力を得る技術を提供することを目的とする。
【課題を解決するための手段】
【0005】
上記課題の少なくとも一部を解決するために、本発明は、第1の構成として、時間経過を伴う電気信号を符号化したデータを入力するデータ入力部と、前記データを復号して出力する出力装置における前記データの時間依存の出力態様を制御する出力制御パラメータを入力するパラメータ入力部と、前記データと前記出力制御パラメータとを備えるファイルを生成するファイル生成部と、を備えるファイル生成装置を採用した。
【0006】
このような構成によれば、データの時間依存の出力態様を制御可能なファイルを生成することができる。例えば、時間経過に応じて連続的または段階的に出力態様を変化させる制御や、あるまとまった時間単位で出力態様を変化させる制御等が可能となる。時間経過を伴う電気信号を符号化したデータとは、例えば、音声データや動画データとすることができる。なお、本発明および後述の種々の発明において、符号化とは、デジタル化や圧縮化、暗号化等の意味を表し、復号とは、前記各々に対応し、アナログ化や伸張化、平文化等の意味を表す。
【0007】
また、上記構成において、前記ファイル生成部は、前記データの少なくとも一部と前記出力制御パラメータとを備えるフレームデータを複数配することによりファイルを生成することとしてもよい。このような態様とすれば、フレームデータ毎に詳細な出力制御を行うことができる。フレームデータは、例えば、前記データを音声データとした場合、任意の単位時間で音声データを断片化し、その断片毎に出力制御パラメータを含むヘッダを付加したデータをフレームデータとすることができる。また、前記データを動画データとした場合は、1/30秒毎に表示される画像毎に出力制御パラメータを含むヘッダを付加することによりフレームデータとすることができる。このようなフレームデータを複数配することにより、1つのファイルとなる。ファイル内の各フレームデータの大きさは、固定長でもよいし、可変長でもよい。
【0008】
また、上記構成において、前記出力制御パラメータは、前記データのフェードインまたはフェードアウト出力を制御することとしてもよい。このような態様とすれば、出力装置はフェードインやフェードアウト処理が可能となる。例えば、音声データの場合、音量を制御することによりフェードイン・フェードアウト処理が可能となり、動画データの場合は、明るさや表示領域のサイズを制御することにより可能となる。
【0009】
また、上記構成において、前記出力制御パラメータは、前記データの出力速度変更時に出力される部分を特定することとしてもよい。このような態様とすれば、出力装置における早送り出力等の処理において、出力するデータの部分を特定することができる。例えば、出力変化の緩やかなデータ部では、次に出力するデータまでの間隔を長くし、出力変化が激しいデータ部については、短い間隔で出力する等といった制御が可能となる。このような部分の特定は、時間で指定してもよいし、出力するフレームを指定してもよい。
【0010】
また、上記構成において、前記出力制御パラメータは、所定のタイミングで出力態様の切り替えを制御することとしてもよい。出力態様の切り替えは、出力に関し、知覚可能ないずれかのパラメータを変更することで実現することが好ましい。このような態様とすれば、例えば、音楽データにおいて、曲の転調時や第一楽章終了時等に音量や音色、あるいは施すエフェクトを変化させたり、動画データにおいて、シーンが変わった時等に色調や明度等を変化させるなどといった出力態様の切り替えを行うことができる。切り替えは1箇所に限られることはなく、複数箇所で可能である。
【0011】
また、上記構成や種々の態様において、前記パラメータ入力部は、前記出力装置における出力環境に応じた出力制御パラメータを入力するファイル生成装置とすることができる。このような態様とすれば、出力装置における出力環境に応じた出力制御が可能となる。例えば、データを音声データとした場合、出力装置のダイナミックレンジに応じてフェードイン処理の初期音量を設定したり、その周波数特性に応じて高音の出力を弱めたイコライジング処理を設定すること等ができる。また、リビングルームやコンサートホール等の、出力装置が設置された周りの環境に応じてパラメータを設定することとしてもよい。データを動画データとした場合は、CRT、テレビ、プロジェクタ、プラズマディスプレイ等の動画を表示する装置の特性に応じて、色調やフェードイン処理の初期明度等を設定することができる。
【0012】
また、上記構成や種々の態様において、前記出力制御パラメータは、前記データの一部を省略して出力するためのデータとしてもよい。例えば、音声データや動画データの全フレームのうち、一部のフレームを間引くことにより、一部の時間範囲のみを再生する制御パラメータが相当する。かかるパラメータを用いることにより、例えば、「ダイジェストモード」が指定された場合には、音声データのサビにあたる部分、または動画データのクライマックスにあたる部分など、特定の場面のみを簡易に再生させることが可能となる。
上記パラメータは、音声データや動画データの各フレームの情報を削減するためのデータとしてもよい。例えば、試聴が指定されている場合には、音声データの高音域、低音域を削除し、音質を若干落とした状態で再生させたり、画像データの解像度を粗くして画質を落とした状態で再生させたりすることができる。音声データや動画データがネットワークを介して配信される場合、試聴が指定されている条件下では、満足のいく音質、画質での再生がされないため、音声データや動画データの適正な入手をユーザに促すことができる。
【0013】
また、上記パラメータは、動画データの一部分をトリミングする情報としてもよい。こうすれば、例えば、解像度の粗い表示装置で動画を再生する場合でも、人の表情や文字など、重要な部分が視認可能な状態で表示させることができる。
【0014】
上記構成や種々の態様において、前記データが複数のチャンネルを含んでいる場合には、前記出力制御パラメータは、各チャンネル単位で出力態様を制御するデータとしてもよい。こうすることにより、例えば、データに含まれる全チャンネルを再生することができない出力装置を用いる場合でも、十分な音響効果または画像効果が得られるよう、再生されるチャンネルを制御することができる。例えば、低音を強調すべき場面においては、低音チャンネルを優先的に使用し、その他の場面では、低音チャンネルを抑えることができる。
【0015】
本発明は、第2の構成として、時間経過を伴う電気信号を符号化したデータと、該データの時間依存の出力態様を制御する出力制御パラメータとを備えるファイルを入力するファイル入力部と、復号した前記データの出力態様を、前記出力制御パラメータを参照し制御する出力制御部と、を備えるデータ出力装置を採用した。
【0016】
このような構成とすれば、出力制御パラメータを参照して、データの出力態様を制御することができる。時間経過を伴う電気信号を符号化したデータとは、既説のように、音声データや動画データとすることができる。データの出力態様は、本発明の第1の構成で説明した種々の出力制御パラメータに基づく制御が可能である。
【0017】
本発明は、第3の構成として、次のような装置を採用可能である。すなわち、音声ファイルを生成する音声ファイル生成装置であって、音声データを入力する音声データ入力部と前記音声データを再生する再生装置に応じて該音声データの再生態様を制御する再生制御パラメータを入力するパラメータ入力部と、前記音声データと前記再生制御パラメータとを備える音声ファイルを生成する音声ファイル生成部と、を備えることを要旨とする。
【0018】
このような構成とすれば、再生装置に応じて再生態様を制御することができ、音声ファイル生成者の意図に即した再生を実現させることができる。
【0019】
なお、上記構成において、前記再生制御パラメータは、前記音声データの少なくとも一部の周波数成分を制御することとしてもよい。このような態様であれば、音声データに対し、種々のイコライジング処理が可能となる。例えば、低城の周波数を強調したり、高域の周波数を強調したりすることができる。
【0020】
また、上記構成において、前記再生制御パラメータは、前記音声データ再生時の音量を制御することとしてもよい。このような態様であれば、柔軟に音量の制御が可能となる。
【0021】
また、上記構成において、前記再生制御パラメータは、前記音声データの少なくとも一部の繰り返し再生を制御することとしてもよい。かかる構成によれば、例えば、一連の音声データのうち、繰り返して演奏等される部分については、1回の演奏に対応する音声データのみを記録し、再生制御パラメータによって、この部分の繰り返し数、繰り返し時の音量、音色、エフェクトなどの少なくとも一部を制御する態様が考えられる。このような態様であれば、従来繰り返す分だけ記録していたデータが、1回の記録だけで済むこととなる。そのため、データ容量の削減が可能となる。
【0022】
本発明の第4の構成は、音声データを再生する音声データ再生装置であって、音声データと、該音声データの時間依存の再生態様を制御する再生制御パラメータとを含む音声ファイルを入力する音声ファイル入力部と、前記再生制御パラメータを参照して、前記音声データの再生態様を制御する再生制御部と、を備える音声データ再生装置を採用した。
【0023】
このような構成とすれば、音声データの再生態様を、再生制御パラメータを参照することにより制御することができる。再生態様は、本発明の第3の構成で説明した各種再生制御パラメータに基づき制御可能である。
【0024】
本発明の第5の構成は、動画ファイルを生成する動画ファイル生成装置であって、動画データを入力する動画データ入力部と前記音声データを再生する再生装置における該動画データの時間依存の再生態様を制御する再生制御パラメータを入力するパラメータ入力部と、前記動画データと前記再生制御パラメータとを備える動画ファイルを生成する動画ファイル生成部と、を備える動画ファイル生成装置を採用した。
【0025】
このような構成とすれば、動画データの出力態様を制御可能なファイルを生成可能となる。
【0026】
なお、上記構成において、前記再生制御パラメータは、前記動画データの少なくとも一部の繰り返し再生を制御することとしてもよい。このような態様であれば、従来繰り返す分だけ記録していた動画データが、1回の記録だけで済むこととなる。そのため、データ容量の削減が可能となる。
【0027】
また、上記構成において、前記動画データには、動画に連動して表示される文字列データが含まれており、前記再生制御パラメータは、該文字列データの表示位置、大きさ、色の少なくとも一つを制御することとしてもよい。このような態様であれば、例えば動画データとともに記録した文字列データの位置や大きさ、色などを時間経過に応じて制御することが可能となる。また、時間経過に応じた制御以外にも、再生装置やその環境の特性に依存して制御してもよい。
【0028】
本発明の第6の構成は、動画データを再生する動画データ再生装置であって、動画データと、該動画データの時間依存の再生態様を制御する再生制御パラメータとを含む動画ファイルを入力する動画ファイル入力部と、前記再生制御パラメータを参照して、前記動画データの再生態様を制御する再生制御部と、を備える動画データ再生装置を採用した。
このような構成であれば、再生制御パラメータを参照することにより、動画データの再生態様を制御可能となる。再生態様は、本発明の第5の構成で説明した各種再生制御パラメータに基づき制御可能である。
【0029】
本発明は、上述のように、ファイル生成装置、データ出力装置、音声ファイル生成装置、音声データ再生装置、動画ファイル生成装置、動画データ再生装置として構成可能であるが、ファイル生成方法、データ出力方法、音声ファイル生成方法、音声データ再生方法、動画ファイル生成方法、動画データ再生方法として構成することもできる。
【0030】
また、本発明は、上述の各種装置をコンピュータを用いて構成した場合に、その機能を実現するプログラムとして構成してもよい。プログラムとして構成した場合は、フレキシブルディスクやCD−ROM、DVD、MO、ICカード、ROMカートリッジ、ハードディスク等のコンピュータ読取可能な記録媒体に記録することができる。
【発明を実施するための最良の形態】
【0031】
以下、本発明の実施の形態について図面を参照しつつ次の順序で説明する。
A.第1実施例
(A1)音声ファイル生成装置:
(A2)音声ファイル生成処理:
(A3)音声ファイル構造:
(A4)音声再生装置:
(A5)音声再生処理:
(A6)再生制御:
B.第2実施例
(B1)動画ファイル生成装置:
(B2)動画ファイル生成処理:
(B3)動画ファイル構造:
(B4)動画再生装置:
(B5)動画再生処理:
(B6)再生制御
【0032】
A.第1実施例:
(A1)音声ファイル生成装置:
図1は、音声ファイル生成装置の概略構成図である。音声ファイル生成装置100は、時間経過を伴う電気信号である音声信号を符号化して生成した音声データと、各種パラメータを記録したヘッダとを含む音声ファイルを生成する。音声ファイル生成装置100は、音声入力部101、A/D変換部102、エンコーダ部103、パラメータ入力部104、ヘッダ生成部105、ファイル生成部106等により構成されている。
【0033】
音声入力部101は、マイク等を用いることができ、音声を電気信号に変換して音声信号とする。A/D変換部102は、アナログ信号である音声信号を、指定されたサンプリングレートや量子化ビット数でデジタル信号に変換する。エンコーダ部103は、このようにデジタル化した音声を、指定されたエンコード形式で符号化して音声データを生成する。エンコード形式は、mp3形式やpcm形式等を用いることができる。パラメータ入力部104は、上記サンプリングレートや量子化ビット数、エンコード方式の入力を行う。パラメータ入力部104は、また、後述する音声再生装置で参照される再生制御パラメータをユーザから入力する。ヘッダ生成部105は、パラメータ入力部104より入力した各種パラメータを記録したヘッダを生成する。ファイル生成部106は、上記生成した音声データとヘッダとを含む音声ファイルを生成する。生成した音声ファイルは記録媒体107に格納される。
【0034】
mp3形式とは、音声を、サブバンド分解、心理聴覚評価、変形離散コサイン変換(MDCT)、量子化、ハフマン符号化等の各種処理を経ることにより圧縮する形式である。また、pcm形式とは、音声を任意のサンプリングレートと量子化ビット数で単純にデジタル化した形式である。両者とも周知の技術であるため、本実施例では詳しい説明を省略する。
【0035】
(A2)音声ファイル生成処理:
図2は、音声ファイル生成処理のフローチャートである。音声ファイル生成装置100は、まず、音声をデジタル信号としてデータ化するために、サンプリングレートや量子化ビット数、およびエンコード形式等の指定をユーザからパラメータ入力部104を介して入力する(ステップS100)。音声ファイル生成装置100は、これらの指定に基づき、音声入力部101とA/D変換部102とエンコーダ部103とを用いて音声を入力し、音声データを生成する(ステップS101)。次に、音声ファイル生成装置100は、再生制御パラメータを、パラメータ入力部104を介しユーザから入力する(ステップS102)。音声ファイル生成装置100は、入力された再生制御パラメータや、上記入力されたサンプリングレートや量子化ビット数、エンコード形式を記録したヘッダを生成する(ステップS103)。最後に、音声ファイル生成装置100は、ファイル生成部106を用いてステップS101で生成した音声データと、ステップS103で生成したヘッダとを含む音声ファイルを生成して処理を終了する(ステップS104)。
【0036】
(A3)音声ファイル構造:
図3は、上記音声ファイル生成処理によって生成された音声ファイルの概略構造図である。音声ファイルは、ヘッダを格納するヘッダ部と、音声データを格納する音声データ格納部とにより構成されている。音声ファイルは、このように、ヘッダ1つと音声データ1つとにより構成される態様のほか、図4で示すように、ヘッダと音声データとを含むフレームデータを複数連続して配する態様とすることもできる。このような態様であれば、フレームデータ単位で各種パラメータの設定を行うことができるため、音声再生時の木目細かな再生制御を行うことができる。
【0037】
図5は、前記ヘッダの詳細な構造図である。ヘッダには、図示するように、対応する音声データのサンプリングレート、量子化ビット数、エンコード形式が記録されている。後述する音声再生装置は、これらのパラメータを参照することにより、音声データの復号を行うことができる。
【0038】
ヘッダには、その他に、再生制御パラメータが記録されている。再生制御パラメータは、後述する音声再生装置の音声再生時に参照されることにより、各種再生制御が可能となる。図示した「フェードイン」や「フェードアウト」等の各種パラメータによる再生制御の説明は後述する。
【0039】
(A4)音声再生装置:
図6は、音声再生装置の概略構成図である。本実施例における音声再生装置200は、音声ファイル生成装置100によって生成した音声ファイルを用いて音声を再生する。音声再生装置200は、音声ファイル入力部201、ヘッダ解析部203、デコーダ部204、DSP部205、D/A変換部206、音声出力部207等により構成される。
音声ファイル入力部201は、記録媒体202から音声ファイルを入力する。ヘッダ解析部203は、入力した音声ファイルからヘッダを抽出し解析する。デコーダ部204は、音声ファイルから音声データを入力し、ヘッダ解析部203により解析されたエンコード形式、サンプリングレート、量子化ビット数に基づき音声データを復号する。DSP部205は、ヘッダ解析部203により解析された再生制御パラメータに基づき、復号した音声データに対し再生制御を行う。D/A変換部206は、デジタル信号である音声データをアナログ信号に変換する。音声出力部207は、アンプやスピーカ若しくはヘッドフォン等により構成されており、前記アナログ信号に基づき音声を出力する。
【0040】
(A5)音声再生処理:
図7は、音声再生処理のフローチャートである。まず、音声再生装置200は、記録媒体202から音声ファイルを入力する(ステップS200)。音声ファイルにはヘッダと音声データとが格納されている。そこで、音声再生装置200は、まず、ヘッダ解析部によりヘッダを解析し、音声データのサンプリングレート、量子化ビット数、エンコード形式、再生制御パラメータ等のパラメータを獲得する(ステップS201)。音声再生装置200は、獲得したこれらのパラメータのうち、サンプリングレート、量子化ビット数、エンコード形式等に基づき、デコーダ部を用いて音声データを復号する(ステップS202)。次に、音声再生装置200は、ステップS201により獲得した再生制御パラメータに基づき、復号した音声データにDSP部を用いて再生制御を行う(ステップS203)。音声再生装置200は、再生制御を行った音声データを、D/A変換部206によりアナログ信号に変換し、音声出力部により出力する(ステップS204)。
【0041】
なお、本実施例では、DSP部205において復号された音声データを出力する際にD/A変換を行うこととしたが、例えば、PWM(pulse width modulation)方式の音声データであれば、D/A変換を用いることなくアナログフィルタを介して音声出力を行うことも可能である。
【0042】
(A6)再生制御:
次に、再生制御パラメータに基づく音声データの再生制御について再び図5を用いて説明する。図5の再生制御パラメータには、フェードイン処理、フェードアウト処理、イコライジング処理および繰り返し再生処理、ダイジェスト情報、チャンネル制御が設定されている。音声再生装置は、これらのパラメータの指示に従い音声の再生を制御する。
【0043】
「フェードイン」パラメータには、(a)通常、(b)ラジカセ、(c)ヘッドフォンステレオ用のプロファイルが設定されている。そのため、音声再生装置200は、自身の特性に最適なプロファイルを選択し、音声データにフェードイン処理を施す。図中のグラフは、横軸がフェードイン処理を行う時間を表し、縦軸は、元の音声データの振幅に乗ずる係数を表す。フェードイン処理を行うデータの範囲は、時間によって設定してもよいし、フレームデータの範囲を指定することにより設定してもよい。また、パラメータは、プロファイルではなく、演算式を直接パラメータ中に定義することにより設定してもよい。演算式が音声再生装置200によって予め定義されている場合は、演算式に用いる所定の係数をパラメータ中に設定することとしてもよい。
【0044】
「フェードアウト」パラメータには、「フレームデータ1〜3」と設定されている。このような設定方法は、複数のフレームデータにより構成されている音声ファイルを用いて音声を再生する際に利用可能であり、フレームデータ1からフレームデータ3にかけて徐々に音量を小さくする処理を意味する。無論、フェードイン処理と同様に、プロファイルや演算式、係数による指定も行うことができる。
【0045】
「イコライジング」パラメータには、フェードインパラメータと同じく3種類のプロファイルが設定されている。音声再生装置200は、自身の特性に最適なプロファイルを選択してイコライジング処理を施す。図中のグラフは、横軸が音声の周波数帯域、縦軸が強調度合いを表す。なお、この場合も、プロファイルではなく、演算式や係数による指定を行うことができる。例えば、pcm形式のような時間領域の信号に対して特定の周波数領域の信号を強調したり逆に弱めたりする場合、一般にデジタルフィルタ処理を施すが、このデジタルフィルタの演算式、もしくはフィルタの係数をパラメータ中に定義することによって、周波数領域における変調をかけることが可能となる。
【0046】
「繰り返し再生」パラメータには、繰り返し再生を行う時間と回数が指定されている。図によれば、音声データ中の360秒から370秒の範囲にある音声データを3回繰り返して再生する処理を行うこととなる。指定方法は、時間による指定以外にも、繰り返すフレームデータの範囲を設定することにより可能である。
【0047】
「ダイジェスト情報」は、ダイジェストモードでの再生が指示されている時に、再生されるべきフレームを特定するデータである。本実施例では、フレームに対して、1〜5の範囲で、ダイジェストレベルが付与されているものとした。ダイジェストレベル「1」は重要度の高いフレームを意味し、数値が大きくなる程、重要度が低下する。「レベル2」というダイジェスト情報は、ダイジェストモードにおいては、レベル1または2が付されたフレームを再生し、レベル3〜5のフレームは再生を省略することを意味する。各フレームに付したダイジェストレベルによって、ダイジェストモードでの再生時に、再生される個所を容易に制御することができる。例えば、音声データの場合には、ダイジェストモードでサビの部分を再生することができ、動画データの場合には、ダイジェストモードでクライマックスの場面を再生することができる。また、ダイジェスト情報を変更することにより、各フレームの情報を変更するまでなく、ダイジェストモードで再生される範囲を制御することができる。
【0048】
ダイジェスト情報としては、このように再生範囲を制御する情報の他、動画データについて各フレームのトリミングを制御する情報を用いても良い。こうすることにより、例えば、解像度が低い表示装置で動画データを再生する場合には、画像をトリミングして表示することが可能となり、人間の表情や文字など、重要な部分を視認しやすい状態で表示することができる。
【0049】
「チャンネル情報」は、データが多チャンネルの場合に、出力機器に応じて、各チャンネルの再生を制御するデータである。図の例では、音声データは、左チャンネル(L)、右チャンネル(R)、センタチャンネル(C)、左サラウンド(LS)、右サラウンド(RS)、低域強調チャンネル(LFE)を有している。この音声データを、1チャンネルの出力機器で再生する場合には、図示する通り、Lチャンネルを0.5、Cチャンネルを0.3、LFEチャンネルを0.2の割合でミキシングして出力する。2チャンネルの出力機器で再生する場合には、左チャンネル(L)からは、Lチャンネルを0.5、Cチャンネルを0.1、LSチャンネルを0.4でミキシングして出力する。右チャンネル(R)からは、Cチャンネルを0.2、Rチャンネルを0.5、LSチャンネルを0.3でミキシングして出力する。このようにチャンネル単位での制御を行うことにより、出力機器のチャンネル数に応じて、音声データ作成時の意図を反映した出力が可能となる。本実施例では、ヘッダ部分にチャンネル制御を組み込んでいるが、各フレームに組み込んでも良い。こうすれば、音声データのうち、部分ごとに、強調すべきチャンネルを切り替えることができ、音声データ作成時の意図をより反映した出力が可能となる。
【0050】
上述のイコライジング処理は、例えば、mp3形式で符号化された音声データであれば、ハフマン復号、逆量子化等の処理を経て、データを周波数領域の信号とした際に行うことができる。この場合、周波数領域において各周波数ごとに重み係数を乗じる等すればよい。また、「フェードアウト」「フェードイン」「繰り返し再生」の各種処理は、上記の処理後、逆MDCT変換等を行い、データを時間領域の信号とした際に行うことができる。時間領域では、各データは音の振幅をデジタル化したものに相当するため、重み係数を乗じるなどして、振幅を調整することにより「フェードイン」「フェードアウト」などを実現できる。
【0051】
上述した再生制御パラメータを用いることにより、音声再生装置は、自身の特性を考慮してフェードインやフェードアウト処理を施すことができる。例えば、図5のフェードインパラメータで設定されているヘッドフォンステレオ用のプロファイルは、フェードイン開始の音量が大きく設定されているため、ダイナミックレンジの狭いヘッドフォンで再生する際に効果的である、また、イコライジングパラメータで設定されているヘッドフォンステレオ用のプロファイルを用いれば、高域の周波数成分を抑えた出力が可能のため、電車内等で使用する場合に耳障りな高音の音漏れを防ぐことができる。
【0052】
その他にも、音量を制御するパラメータを付加することもできる。ヘッダ1つにより構成される音声ファイルであれば、時間を指定して、ある時間からある時間までは音量を小さくし、ある時間を超えれば音量を大きくするといった制御が可能である。フレームデータにより構成される音声ファイルであれば、フレーム毎に音量を詳細に設定することができる。また、音声再生装置が、リバーブ機能やコンプレッサー機能、あるいはピッチシフト機能等の各種エフェクト機能を備えていれば、これらの機能を利用可能とするパラメータを付加してもよい。
【0053】
上述のフェードインやフェードアウト、イコライジング等の各種処理は、音声再生装置の特性にかかわらず制御することも可能である。この場合、音声データの作成者が意図した積極的な効果を反映させることができる。
【0054】
B.第2実施例:
(B1)動画ファイル生成装置:
次に、時間経過を伴う電気信号として、映像信号を扱う動画ファイル生成装置について説明する。図8は、動画ファイル生成装置の概略構成図である。動画ファイル生成装置300は、映像入力部301、A/D変換部302、エンコーダ部303、パラメータ入力部304、ヘッダ生成部305、ファイル生成部306等により構成されている。
映像入力部301は、CCDカメラ等を用いることができ、映像を電気信号に変換する。A/D変換部302は、電気信号として入力した映像を、デジタル信号に変換する。エンコーダ部303は、指定されたエンコード形式で前記デジタル信号を符号化して動画データを生成する。エンコード形式は、DV形式、MPEG形式等を用いることができる。パラメータ入力部30Aは、上記エンコード形式の指定のほか、後述する動画再生装置で参照されるユーザ所望の再生制御パラメータを入力する。ヘッダ生成部305は、パラメータ入力部304より入力した各種パラメータを記録したヘッダを生成する。ファイル生成部306は、上記生成した動画データとヘッダとを含む動画ファイルを生成する。生成した動画ファイルは、記録媒体307に格納される。
【0055】
(B2)動画ファイル生成処理:
図9は、動画ファイル生成処理のフローチャートである。動画ファイル生成装置300は、まず、入力する映像を符号化するためのエンコード形式を、パラメータ入力部304を介しユーザから入力する(ステップS300)。動画ファイル生成装置300は、入力されたエンコード形式に基づき、映像入力部301と、A/D変換部302と、エンコーダ部303とを用いて映像を入力し、動画データを生成する(ステップS301)。次に、動画ファイル生成装置300は、パラメータ入力部304を介し、ユーザから再生制御パラメータを入力する(ステップS302)。動画ファイル生成装置300は、入力された再生制御パラメータや、上記エンコード形式等を記録したヘッダを生成する(ステップS303)。最後に、動画ファイル生成装置300は、ファイル生成部306を用いてステップS301で生成した動画データと、ステップS303で生成したヘッダとを含む動画ファイルを生成して処理を終了する(ステップS304)。
【0056】
(B3)動画ファイル構造:
上記動画ファイル生成処理によって生成した動画ファイルは、先に説明した音声ファイルの構造と同様の構造を採ることができる。すなわち、図3で示した音声ファイル構造において、ヘッダ部に、上記動画ファイル生成処理のステップS303で生成したヘッダを格納し、音声データ格納部を動画データ格納部として、上記ステップS301で生成した動画データを格納すればよい。また、動画ファイルにおいても、フレームデータを用いた構成を採ることができる。この場合においても、図4で示した音声ファイル構造と同様の構造で実現可能である。
【0057】
図10は、動画ファイルのヘッダの詳細な構造図である。ヘッダには、図示するように、動画データのエンコード形式が記録されている。後述する動画再生装置は、このパラメータを参照することにより動画データの復号を行うことができる。本図によれば、「MPEG4」形式でエンコードされていることがわかる。
【0058】
また、ヘッダには、再生制御パラメータが記録されている。再生制御パラメータは、後述する動画再生装置において参照されることにより、各種再生制御が可能となる。図によれば、画質補正、字幕補正、繰り返し再生に関するパラメータが設定されている。これらのパラメータを用いた再生制御の説明については後述する。
【0059】
(B4)動画再生装置:
図11は、動画再生装置の概略構成図である。本実施例における動画再生装置400は、動画ファイル生成装置300によって生成した動画ファイルを用いて動画を再生する。動画再生装置400は、動画ファイル入力部401、ヘッダ解析部403、デコーダ部404、DSP部405、D/A変換部406、映像出力部407等により構成される。
【0060】
動画ファイル入力部401は、記録媒体402から動画ファイルを入力する。ヘッダ解析部403は、入力した動画ファイルからヘッダを抽出し解析する。デコーダ部404は、ヘッダ解析部403により解析されたエンコード形式に基づき動画ファイル内の動画データを復号する。DSP部405は、ヘッダ解析部403により解析された再生制御パラメータに基づき、復号した動画データに対し再生制御を行う。D/A変換部406は、デジタル信号である動画データを、RGB信号やコンポジット信号等のアナログ信号に変換する。映像出力部は、CRTやテレビ等により構成されており、前記アナログ信号に基づき映像を出力する。
【0061】
(B5)動画再生処理:
図12は、動画再生処理のフローチャートである。まず、動画再生装置400は、記録媒体402から動画ファイルを入力する(ステップS400。)動画ファイルにはヘッダと動画データとが格納されている。そこで、動画再生装置400は、まず、ヘッダ解析部によりヘッダを解析し、動画データのエンコード形式を示すパラメータや、再生制御パラメータを獲得する(ステップS401)。動画再生装置400は、獲得したエンコード形式を示すパラメータに基づき、動画データを復号する(ステップS402)。次に、動画再生装置400は、ステップS401により獲得した再生制御パラメータに基づき、復号した動画データにDSP部405を用いて再生制御を行う(ステップS403)。動画再生装置400は、再生制御を行った動画データを、D/A変換部406によりアナログ信号に変換し、映像出力部により出力する(ステップS404)。
【0062】
(B6)再生制御:
次に、動画ファイルのヘッダに記録された再生制御パラメータに基づく動画データの再生制御について図10および図13を用いて説明する。図10の再生制御パラメータには、画質補正処理、字幕補正処理、繰り返し再生処理を指定するパラメータが記録されており、動画再生装置は、これらのパラメータに従い動画データの出力を制御する。
【0063】
「画質補正」パラメータには、動画再生装置のメーカ毎にシャープネス、RGB補正、ガンマ値を設定するプロファイルが記録されている。図によれば、例えば、A社の装置に対しては、元の動画に対してシャープネスを「+2」だけ強め、RGB(赤、緑、青)の内、R(赤)を「+2」だけ強調し、ガンマ値を1.8に補正して再生する設定となっている。本実施例において、シャープネスとRGB補正の値は、元の動画データに対する強調度合いを10段階で示したものであり、「+2」は「+20%」の意である。一方、ガンマ値は絶対値を表す。動画再生装置400は、これらのプロファイルの中から、自身の製造元を表すプロファイルを選択し、DSP部405を用いて動画データに対し画質補正を施す。
【0064】
「字幕補正」パラメータには、CRTやテレビ等により構成された映像出力部407のサイズに応じたプロファイルが設定されている。図によれば、例えば22インチから32インチまでの映像出力部407に対しては、元の文字よりサイズを1ピクセルだけ小さくした字幕を、画面下方に灰色で表示する設定となっている。無論、字幕を表示するためには、動画ファイル内に、字幕を表示するための文字列データが独立して格納されていなければならない。なお、ここでは「字幕」という表現を用いたが、テロップ等と同義の意味であり、文字列を表示する態様であればよい。動画再生装置400は、自身の映像出力部407のサイズに対応したプロファイルを選択し、DSP部405を用いて文字を修正し、字幕を表示する。
【0065】
「繰り返し再生」パラメータには、繰り返し再生を行う動画データの部分が設定されている。図によれば、動画データの開始から360秒経た後、370秒までの10秒間に記録されている動画データを3回再生する設定がされている。動画再生装置400は、この設定により、繰り返し再生を行う。なお、繰り返し再生は、時間による範囲の指定のほかにも、フレームデータの範囲を指定することに行ってもよい。また、繰り返し再生を行うデータの範囲は、連続的な範囲とする必要はない。例えば、特定のシーンを、動画の冒頭と末尾などで使用する態様も含まれる。この場合には、繰り返し数に代えて、そのシーンを挿入する時刻を特定する情報をパラメータとして用いることができる。
【0066】
再生制御パラメータには、早送り再生に関するパラメータを設定することもできる。図13は、早送り再生に関する再生制御パラメータを設定した動画ファイルの概略図である。図示するように、動画ファイルは、フレームデータを連続して複数配することにより構成されており、一部のフレームデータのヘッダには、パラメータとして、「x2」あるいは「x3」というフラグが設定されている。この例では、「x2」フラグは、2フレーム毎に設定されており、「x3」フラグは、3フレーム毎に設定されている。動画再生装置400は、ユーザから2倍速再生あるいは3倍速再生の指示があった場合に、このヘッダを解析し、2倍速再生であれば「x2」フラグが存在するヘッダに対応したA、C、E、G、Iの動画データを再生し、3倍速再生であれば、「x3」フラグの存在するヘッダに対応したA、D、G、Jの動画データを再生する。
【0067】
なお、フラグは必ずしも等間隔に設定する必要はない。例えば、n倍速再生の場合は、全体として再生するフレーム数が1/n倍となるようにフラグを設定すればよい。このような構成とすれば、各シーンの重み付けを考慮した再生速度の制御が可能となる。例えば、動きの速いスポーツ中継等の動画データが記録された部分は、スキップするフレームデータを少なくすることにより、ゆっくりとした速度で早送り再生することができ、動きの遅い風景を撮影したような部分あれば、スキップするフレームデータを多くすることにより、早送り再生をより早く行うことができる。
【0068】
また、動画の出力態様は、動画のシーンに応じて制御を切り替え可能であれば好適である。例えば、動きの激しいシーンであれば、シャープネスを強めることにより、はっきりと映像を映し出すことができる。また、夕日のシーンであれば、赤色を少し強調することにより、夕日をより効果的に映し出すことができる。
【0069】
なお、再生制御にともなう上述の各種処理は、動画再生装置400の特性にかかわらず制御可能であることは無論である。
【0070】
以上、本発明の実施例を、第1実施例および第2実施例に基づき説明したが、本発明はこれらの実施例に限定されず、その趣旨を逸脱しない範囲で種々の構成を採ることができる。上述した各種処理はソフトウェアで実現してもよいし、ハードウェア的に実現するものとしてもよい。また、上述した実施例における音声ファイルや動画ファイルが記録される記録媒体は、フレキシブルディスクやCD−ROM/R/RW、DVD、DVD−R/RW/RAM、MO、メモリカード、ハードディスク、ビデオテープ、音楽テープ、MD等が利用可能である。音声ファイルや動画ファイルは、記録媒体によるデータの受け渡し以外にも、ネットワークや無線通信によって受け渡しを行ってもよい。
【0071】
産業上の利用可能性
本発明は、時間経過を伴う電気信号を符号化したデータの出力に利用可能である。
【図面の簡単な説明】
【0072】
【図1】音声ファイル生成装置の概略構成図である。
【図2】音声ファイル生成処理のフローチャートである。
【図3】音声ファイルの概略構造図である。
【図4】音声ファイルの他の態様を示す概略構造図である。
【図5】音声ファイルに格納されたヘッダの詳細な構造図である。
【図6】音声再生装置の概略構成図である。
【図7】音声再生処理のフローチャートである。
【図8】動画ファイル生成装置の概略構成図である。
【図9】動画ファイル生成処理のフローチャートである。
【図10】動画ファイルに格納されたヘッダの詳細な構造図である。
【図11】動画再生装置の概略構成図である。
【図12】動画再生処理のフローチャートである。
【図13】早送り再生パラメータを設定した動画ファイルの概略構造図である。

【特許請求の範囲】
【請求項1】
時間経過を伴う電気信号を符号化したデータを入力するデータ入力部と、
前記データを復号して出力する出力装置における前記データの時間依存の出力態様を制御する出力制御パラメータを入力するパラメータ入力部と、
前記データと前記出力制御パラメータとを備えるファイルを生成するファイル生成部と、
を備えるファイル生成装置。
【請求項2】
請求項1に記載のファイル生成装置であって、
前記ファイル生成部は、前記データの少なくとも一部と前記出力制御パラメータとを備えるフレームデータを複数配することによりファイルを生成するファイル生成装置。
【請求項3】
請求項1に記載のファイル生成装置であって、
前記出力制御パラメータは、前記データのフェードインまたはフェードアウト出力を制御するファイル生成装置。
【請求項4】
請求項1に記載のファイル生成装置であって、
前記出力制御パラメータは、前記データの出力速度変更時に出力される部分を特定するファイル生成装置。
【請求項5】
請求項1に記載のファイル生成装置であって、
前記出力制御パラメータは、所定のタイミングで出力態様の切り替えを制御するファイル生成装置。
【請求項6】
請求項1のいずれかに記載のファイル生成装置であって、
前記パラメータ入力部は、前記出力装置における出力環境に応じた出力制御パラメータを入力するファイル生成装置。
【請求項7】
請求項1記載のファイル生成装置であって、
前記出力制御パラメータは、所定条件下での出力時において、前記データの一部を省略して出力するためのデータであるファイル生成装置。
【請求項8】
請求項1記載のファイル生成装置であって、
前記データは複数のチャンネルを有しており、
前記出力制御パラメータは、各チャンネル単位で出力態様を制御するデータであるファイル生成装置。
【請求項9】
時間経過を伴う電気信号を符号化したデータと、該データの時間依存の出力態様を制御する出力制御パラメータとを備えるファイルを入力するファイル入力部と、
復号した前記データの出力態様を、前記出力制御パラメータを参照し制御する出力制御部と、
を備えるデータ出力装置。
【請求項10】
音声ファイルを生成する音声ファイル生成装置であって、
音声データを入力する音声データ入力部と
前記音声データを再生する再生装置に応じて該音声データの再生態様を制御する再生制御パラメータを入力するパラメータ入力部と、
前記音声データと前記再生制御パラメータとを備える音声ファイルを生成する音声ファイル生成部と、
を備える音声ファイル生成装置。
【請求項11】
請求項10に記載の音声ファイル生成装置であって、
前記再生制御パラメータは、前記音声データの少なくとも一部の周波数成分を制御する音声ファイル生成装置。
【請求項12】
請求項10に記載の音声ファイル生成装置であって、
前記再生制御パラメータは、前記音声データ再生時の音量を制御する音声ファイル生成装置。
【請求項13】
請求項10に記載の音声ファイル生成装置であって、
前記再生制御パラメータは、前記音声データの少なくとも一部の繰り返し再生を制御する音声ファイル生成装置。
【請求項14】
音声データを再生する音声データ再生装置であって、
音声データと、該音声データの時間依存の再生態様を制御する再生制御パラメータとを含む音声ファイルを入力する音声ファイル入力部と、
前記再生制御パラメータを参照して、前記音声データの再生態様を制御する再生制御部と、
を備える音声データ再生装置。
【請求項15】
動画ファイルを生成する動画ファイル生成装置であって、
動画データを入力する動画データ入力部と
前記動画データを再生する再生装置における該動画データの時間依存の再生態様を制御する再生制御パラメータを入力するパラメータ入力部と、
前記動画データと前記再生制御パラメータとを備える動画ファイルを生成する動画ファイル生成部と、
を備える動画ファイル生成装置。
【請求項16】
請求項15に記載の動画ファイル生成装置であって、
前記再生制御パラメータは、前記動画データの少なくとも一部の繰り返し再生を制御する動画ファイル生成装置。
【請求項17】
請求項15に記載の動画ファイル生成装置であって、
前記動画データには、動画に連動して表示される文字列データが含まれており、
前記再生制御パラメータは、該文字列データの表示位置、大きさ、色の少なくとも一つを制御する動画ファイル生成装置
【請求項18】
動画データを再生する動画データ再生装置であって、
動画データと、該動画データの時間依存の再生態様を制御する再生制御パラメータとを含む動画ファイルを入力する動画ファイル入力部と、
前記再生制御パラメータを参照して、前記動画データの再生態様を制御する再生制御部と、
を備える動画データ再生装置。
【請求項19】
時間経過を伴う電気信号を符号化したデータを入力するステップと、
前記データを復号して出力する出力装置における前記データの時間依存の出力態様を制御する出力制御パラメータを入力するステップと、
前記データと前記出力制御パラメータとを備えるファイルを生成するステップと、
を備えるファイル生成方法。
【請求項20】
時間経過を伴う電気信号を符号化したデータと、該データの時間依存の出力態様を制御する出力制御パラメータとを備えるファイルを入力するステップと、
復号した前記データの出力態様を、前記出力制御パラメータを参照し制御するステップと、
を備えるデータ出力方法。
【請求項21】
音声ファイルを生成する音声ファイル生成方法であって、
音声データを入力するステップと、
前記音声データを再生する再生装置における該音声データの時間依存の再生態様を制御する再生制御パラメータを入力するステップと、
前記音声データと前記再生制御パラメータとを備える音声ファイルを生成するステップと、
を備える音声ファイル生成方法。
【請求項22】
音声データを再生する音声データ再生方法であって、
音声データと、該音声データの時間依存の再生態様を制御する再生制御パラメータとを含む音声ファイルを入力するステップと、
前記再生制御パラメータを参照して、前記音声データの再生態様を制御するステップと、
を備える音声データ再生方法。
【請求項23】
動画ファイルを生成する動画ファイル生成方法であって、
動画データを入力するステップと、
前記音声データを再生する再生装置における該動画データの時間依存の再生態様を制御する再生制御パラメータを入力するステップと、
前記動画データと前記再生制御パラメータとを備える動画ファイルを生成するステップと、
を備える動画ファイル生成方法。
【請求項24】
動画データを再生する動画データ再生方法であって、
動画データと、該動画データの時間依存の再生態様を制御する再生制御パラメータとを含む動画ファイルを入力するステップと、
前記再生制御パラメータを参照して、前記動画データの再生態様を制御するステップと、
を備える動画データ再生方法。
【請求項25】
時間経過を伴う電気信号を符号化したデータを入力する機能と、
前記データを復号して出力する出力装置における前記データの時間依存の出力態様を制御する出力制御パラメータを入力する機能と、
前記データと前記出力制御パラメータとを備えるファイルを生成する機能と、
をコンピュータに実現させるコンピュータプログラムを記録したコンピュータ読み取り可能な記録媒体。
【請求項26】
時間経過を伴う電気信号を符号化したデータと、該データの時間依存の出力態様を制御する出力制御パラメータとを備えるファイルを入力する機能と、
復号した前記データの出力態様を、前記出力制御パラメータを参照し制御する機能と、
をコンピュータに実現させるコンピュータプログラムを記録したコンピュータ読み取り可能な記録媒体。
【請求項27】
音声ファイルを生成するコンピュータプログラムを記録したコンピュータ読み取り可能な記録媒体であって、
音声データを入力する機能と、
前記音声データを再生する再生装置における該音声データの時間依存の再生態様を制御する再生制御パラメータを入力する機能と、
前記音声データと前記再生制御パラメータとを備える音声ファイルを生成する機能と、
をコンピュータに実現させるコンピュータプログラムを記録したコンピュータ読み取り可能な記録媒体。
【請求項28】
音声データを再生するコンピュータプログラムを記録したコンピュータ読み取り可能な記録媒体であって、
音声データと、該音声データの時間依存の再生態様を制御する再生制御パラメータとを含む音声ファイルを入力する機能と、
前記再生制御パラメータを参照して前記音声データの再生態様を制御する機能と、
をコンピュータに実現させるコンピュータプログラムを記録したコンピュータ読み取り可能な記録媒体。
【請求項29】
動画ファイルを生成するコンピュータプログラムを記録したコンピュータ読み取り可能な記録媒体であって、
動画データを入力する機能と、
前記音声データを再生する再生装置における該動画データの時間依存の再生態様を制御する再生制御パラメータを入力する機能と、
前記動画データと前記再生制御パラメータとを備える動画ファイルを生成する機能と、
をコンピュータに実現させるコンピュータプログラムを記録したコンピュータ読み取り可能な記録媒体。
【請求項30】
動画データを再生するコンピュータプログラムを記録したコンピュータ読み取り可能な記録媒体であって、
動画データと、該動画データの時間依存の再生態様を制御する再生制御パラメータとを含む動画ファイルを入力する機能と、
前記再生制御パラメータを参照して、前記動画データの再生態様を制御する機能と、
をコンピュータに実現させるコンピュータプログラムを記録したコンピュータ読み取り可能な記録媒体。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate


【公開番号】特開2009−5369(P2009−5369A)
【公開日】平成21年1月8日(2009.1.8)
【国際特許分類】
【出願番号】特願2008−177124(P2008−177124)
【出願日】平成20年7月7日(2008.7.7)
【分割の表示】特願2003−537312(P2003−537312)の分割
【原出願日】平成14年10月15日(2002.10.15)
【出願人】(000002369)セイコーエプソン株式会社 (51,324)
【Fターム(参考)】