説明

オーディオストリームの段階的な適応型スクランブル

【課題】聴覚品質を確保しながら、メモリまたはハードディスクに記録されるオーディオプログラムの不正利用を回避する。
【解決手段】オーディオシーケンスが、簡単なデジタル符号化オーディオエレメントに対応する複数の係数を集めた少なくとも一つのブロックをそれぞれ含む、一連のフレームから構成され、オリジナルストリームの少なくとも一つのブロックの修正ステップを含んでおり、前記修正ステップが、オリジナルオーディオストリームの構造、内容、およびパラメータと、受信者8のプロフィールと、外部事象との代表的な特徴の少なくとも一部に応じて、前記オリジナルストリームに適応するように作用する。修正ステップが、係数の一部を代えて、公称フォーマットでメインオーディオストリームを発生するとともに、受信装置のデコーダによりオリジナルストリームを再構成可能にする補足修正情報を発生する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、デジタルオーディオストリーム処理の分野に関する。
【0002】
本発明では、聴覚的にスクランブルしてデジタルオーディオコンテンツを再構成可能なシステムを提供することを提案する。
【0003】
本発明は、特に、音楽または音声の再生装置(「player」)に、聴覚的に高品質のオーディオストリームの集合を安全に伝送し、オーディオ再生装置に遠隔伝送ネットワークを接続するデコーダボックスのメモリまたはハードディスクにこれを記録することができ、聴覚品質を保持しながらも、デコーダボックスのメモリまたはハードディスクに記録されるオーディオプログラムの不正コピーの可能性などのあらゆる不正利用を回避する装置に関する。
【0004】
本発明は、また、公称ストリームフォーマットに従ってデジタルオーディオシーケンスを供給する方法に関し、関与するストリーム内部で明確なモードに従ってデジタル符号化される簡単なオーディオエレメントに対応する幾つかの係数を集めた、少なくとも一つのデジタルオーディオブロックをそれぞれが含む一連のフレームからなり、この方法は、これを再生(jouer)して適切にデコード可能な全てのオーディオデコーダにより使用される。上記の方法は、
・前記係数の少なくとも一つを修正することからなる準備ステップと、
・−準備ステップ中に修正されたブロックを含むフレームからなる、公称フォーマットに適合するメインストリームを伝送し、
−前記メインストリームとは別の経路により補足デジタル情報を伝送するステップとを含み、前記メインストリームと前記補足情報とに応じて受信装置で計算によりオリジナルストリームを再構成可能にする。前記補足情報は、データ(たとえばオリジナルデジタルストリームを記述する係数またはオリジナルストリームの抽出部分)および関数(たとえば代替関数または置換関数)からなる集合として定義される。関数は、データおよび演算子と関連する少なくとも一つの命令を含むものとして定義される。前記補足デジタル情報は、修正ストリームからオリジナルストリームを回収するために実行される演算を記述している。
【0005】
オリジナルストリームの再生は、受信装置に既に存在するかまたはリアルタイムで受信装置に送られる修正メインストリームと、聴取時にリアルタイムで送られて、デジタルルーチン(命令セット)により実行されるデータおよび関数を含む補足情報とにより、受信装置で行われる。
【背景技術】
【0006】
従来技術では、既に、国際公開第0058963号パンフレット(Liquid Audio)により、携帯式の音楽再生装置のための安全システムが知られている。音楽作品等のデータは、一つまたは複数の再生装置(「players」)に接続可能であって特定のバックアップ手段に接続可能な、安全携帯トラック(SPT:secure portable track)としてバックアップされ、それによって特定のプレーヤでSPTを再生するよう制限し、オリジナルのバックアップ手段によってのみ再生が実施されるようにする。SPTは、プレーヤに一つしかないバックアップキーを用いることにより、SPTのデータ暗号化によってプレーヤに結合される。このキーは変更が難しく、厳密な安全条件で再生装置により保持される。SPTは、偽造に強い形態で、すなわち署名により暗号化される形態でバックアップ手段だけを識別するデータを含むことにより、個別のバックアップ手段に結合される。
【0007】
また、米国特許第4600941号明細書(Sony)により、一つのオーディオ信号が複数ブロックに分割されるオーディオ信号用のスクランブルシステムが知られており、各ブロックは複数のフレームからなり、複数のフレームが、各ブロックで予め決められた順序により時間軸で再配列されて符号化され、符号化された信号が、時間軸で最初の順序に配列しなおされてデコードされる。このシステムでは、隣接フレーム間の一部に冗長な部分を挿入して、符号化時に冗長部分に対応するフレームを時間軸で圧縮するための第一の信号処理回路と、冗長部分にオーディオ情報以外の制御信号を挿入するための信号発生回路と、デコード時に制御信号を検出するための制御信号検出回路と、検出された制御信号と同期して冗長部分を除去し、冗長部分に対応してフレームを時間軸で解凍(decompressant)する第二の信号処理回路とが提供されている。
【0008】
また、米国特許第5058159号明細書(Macrovision corporation)から、オーディオ情報信号をスクランブルおよびデスクランブルする方法と、システムとが知られている。オーディオ信号は、オリジナル周波数スペクトルを逆転することによりスクランブルされ、その結果、オーディオ周波数帯域において最初は下にあった周波数部分が上に移動し、最初は帯域の上にあった部分が下に移動する。既知の周波数の制御音が、移動した周波数のオーディオ信号と共に記録される。再生時には制御音(son pilote)が各々の位相変化および周波数変化を探し、これを用いて復調信号を発生し、オーディオ信号の周波数の最初の内容を再生する。
【0009】
従来技術では、また、国際公開第99/55089号パンフレット「Multimedia Adaptive Scrambling System」(「適応型マルチメディアスクランブルシステム」)から、マルチメディアデータ(音響および映像)を示すデジタルサンプルをスクランブルして、これらのサンプルの内容を劣化させるが認識可能にし、あるいは必要な品質で供給するシステムが知られている。品質レベルは、関連するSN比に関係づけられ、客観的なテストおよび主観的なテストにより決定される。所定数のLSB(「Least Significant Bits」最も小さい重み付けビット)が、可能な値のダイナミクスに応じて適合されるように、フレームごとにスクランブルされる。音響/映像ストリームには全ての暗号化キーが含まれており、デスクランブルしてストリームを再生するためにデコーダにより用いられる。デスクランブル後、暗号化キーは、それ自体がデコーダによりスクランブルされるので回収不能である。
【0010】
従来技術は、オーディオストリームの内容とは独立した暗号化キー、従って組織化されたストリームのフォーマットを修正する暗号化キーを付加することによって、主にデータの暗号化に基づく多数のオーディオストリーム保護システムを示している。それとは異なる特定の実施形態は、Coding Technologies社のものであり、ビットストリーム全体ではなく、ビットストリームの選択した部分をスクランブルして保護することからなる(オーディオエンコーダの出力におけるビットストリームを「ビットストリーム」と呼ぶ)。保護された部分は、オーディオ信号のスペクトル値を示し、暗号を解読しないでデコードすると、オーディオストリームがゆがんで聞こえづらくなる。
【発明の概要】
【発明が解決しようとする課題】
【0011】
本発明は、オーディオストリームの構造と、クライアントのプロフィールと、外部事象とに応じて、適応性のある段階的なオーディオストリームのスクランブルを行うことを提案することによって、従来技術の不都合を解消しようとするものである。
【0012】
本発明において、「スクランブル」という用語は、適切な方法でデジタルオーディオストリームを修正して、このオーディオストリームがデジタル符号化された規格または標準に適合し続けるようにすると同時に、オーディオ再生装置(またはプレーヤ)により聴取可能にしながらも人間の聴覚の観点からは劣化させることを意味する。
【0013】
本発明において、「デスクランブル」という用語は、最初のストリームを適切な方法で再生するプロセスを意味し、デスクランブル後に再生されるオーディオストリームが最初のオリジナルオーディオストリームと同じになる。オリジナルストリームの再生は、受信装置に既に存在するかまたはリアルタイムで送られる修正メインストリームと、聴取時にリアルタイムで送られて、デジタルルーチン(命令セット)により実行されるデータおよび関数を含む補足情報とにより、受信装置で行われる。補足情報の全体または部分集合は、クライアントのプロフィールおよび権利に応じて送られる。接続中に受信者に送られる補足情報に属するデータおよび/または関数の数を、前記補足情報の部分集合に含まれる情報量として定義する。
【0014】
前記部分集合に含まれる情報のタイプは、受信者のプロフィールに応じて決定されるスケーラビリティレベルに対応する。接続中に受信者に送られる補足情報に属するデータおよび/または機能の種類を、情報のタイプとして定義する。たとえば、データのタイプは、受信者の習慣(接続時刻、接続時間、接続周期、および支払い)、受信者の環境(大都市に住んでいる、現在の天候)、および特徴(年齢、性別、宗教、地域社会)に関連する。
【0015】
前記補足情報は、接続セッションに対して各受信者のためにカスタマイズされる関数から少なくとも構成される。接続時刻、持続時間、聴取される前記修正ストリームのタイプ、接続される要素(受信者、サーバ)から、一つのセッションを定義する。
【0016】
前記補足情報は、少なくとも2個の部分集合に分割され、各部分集合を様々なメディアまたは同じメディアから供給可能である。たとえば、複数のメディアから補足情報を供給する場合、受信者の権利の管理をいっそう複雑化することができる。
【0017】
ユーザの「プロフィール」とは、たとえばユーザの文化的な好み、社会的および文化的なその特徴、ユーザの使用習慣等の、ユーザに固有の記述子および情報を含むデジタルファイルを意味し、ユーザの使用習慣としては、オーディオ手段を使う周期、スクランブルされたオーディオシーケンスを聴く平均時間、スクランブルされたシーケンスを聴く頻度、ユーザに支払い用意のある価格、または、オーディオシーケンスの利用に関する他のあらゆる補足的な特徴等が挙げられる。このプロフィールは、情報処理手段が利用可能なデジタルファイルまたはデジタルテーブルによって形式化される。
【0018】
多くのスクランブルシステムが即時に作用し、最初のストリームをすっかりスクランブルするか、または、最初のストリームを全くスクランブルしない。従って、一般には、様々なオーディオシーケンスを同じアルゴリズムおよび同じ調整パラメータでスクランブルすることができる。使用される多数の保護手段は、オーディオストリームのスクランブルをその内容に応じて変更するわけではない。
【0019】
本発明では、オーディオストリームの様々な特徴とユーザの用途とに応じてスクランブルのアルゴリズムおよび/またはパラメータを変更することにより、オーディオストリーム(ビットストリーム)の構造および/またはその内容に応じて適応性のある段階的なスクランブルを実施する。これは、オリジナルストリームの劣化および不正コピー防止の観点から最小コストで信頼性のある保護を行って、受信者またはクライアントが必要とするサービス品質を最終的に得られるようにすることを目的としている。たとえば後述するようにスクランブルを様々に適応させる。
【課題を解決するための手段】
【0020】
本発明は、その最も一般的な意味において、公称ストリームフォーマットに従ってデジタルオーディオシーケンスを供給する方法に関し、前記シーケンスが、簡単なデジタル符号化オーディオエレメントに対応する複数の係数を集めた少なくとも一つのデジタルオーディオブロックをそれぞれが含む、一連のフレームから構成され、この方法が、オリジナルストリームの少なくとも一つのブロックの修正ステップを含んでおり、前記修正ステップが、オリジナルオーディオストリームの構造、内容、およびパラメータと、受信者のプロフィールと、外部事象との代表的な特徴の少なくとも一部に応じて前記オリジナルストリームに適応するように作用することを特徴とする。
【0021】
好適には、修正ステップが、前記係数の一部を代えて、公称フォーマットでメインオーディオストリームを発生するとともに、受信装置のデコーダによりオリジナルストリームを再構成可能にする補足修正情報を発生することからなり、修正範囲は、可変であって、前記代表的な特徴により決定される。
【0022】
変形実施形態によれば、修正されたメインストリームが、受信装置への補足情報の伝送の前に受信装置に記録される。
【0023】
変形実施形態によれば、修正されたメインストリームが、受信装置への補足情報の伝送の前に受信装置に伝達されるように、物理媒体に記録される。
【0024】
別の変形実施形態によれば、修正されたメインストリームと補足情報とが、リアルタイムで一緒に伝送される。
【0025】
有利には、前記補足修正情報が、一つの機能を実行可能な少なくとも一つのデジタルルーチンを含む。
【0026】
特定の実施形態によれば、前記補足修正情報が、少なくとも2個の部分集合に分割される。
【0027】
変形実施形態によれば、前記補足修正情報の部分集合が様々なメディアから供給される。
【0028】
別の変形実施形態によれば、前記補足修正情報の部分集合が同じメディアから供給される。
【0029】
特定の実施形態によれば、補足情報が物理ベクトルで伝達される。
【0030】
変形実施形態によれば、補足情報がオンライン伝送される。
【0031】
有利には、前記デジタルオーディオシーケンスが、オーディオコンテンツに応じて異なる仕方で修正される。
【0032】
有利には、前記デジタルオーディオシーケンスが、修正されたスケーラビリティ層に応じて異なる仕方で修正される。
【0033】
有利には、前記デジタルオーディオシーケンスが、オリジナルストリームのビットレート(kビット/秒)に応じて異なる仕方で修正される。
【0034】
変形実施形態によれば、前記デジタルオーディオシーケンスは、プロフィールと、これらのデジタルオーディオシーケンスが符号化された規格または標準により規定されるデジタルレベルとに応じて、異なる仕方で修正される。
【0035】
別の変形実施形態によれば、前記デジタルオーディオシーケンスが、ストリーム内に存在するオーディオチャンネル数に応じて異なる仕方で修正される。
【0036】
有利には、前記デジタルオーディオシーケンスが、ストリーム内に存在する様々なオーディオチャネルの結合および多重化に応じて異なる仕方で修正される。
【0037】
変形実施形態によれば、前記デジタルオーディオシーケンスは、オーディオストリームが符号化されたサンプリング周波数に応じて異なる仕方で修正される。
【0038】
別の変形実施形態によれば、前記デジタルオーディオシーケンスは、使用される心理音響モデルに応じて異なる仕方で修正される。
【0039】
特定の実施形態によれば、前記デジタルオーディオシーケンスは、スケーラビリティの粒度に応じて異なる仕方で修正される。
【0040】
有利には、前記デジタルオーディオシーケンスが、オーディオストリームを完全にスクランブルするまで劣化作用を増しながら段階的に修正される。
【0041】
好適には、前記デジタルオーディオシーケンスが、スクランブルのパラメータと構成とを任意に発生しながら修正される。
【0042】
変形実施形態によれば、この方法は、組織化されたフォーマットでの事前のA/D変換ステップを含み、この方法が、アナログオーディオ信号に適用される。
【0043】
本発明は、また、前記方法の任意の一つに従って修正されたストリームを送る手段を含むオーディオサーバと、スクランブル回路を備えた複数の装置とを含む、デジタルオーディオシーケンスの供給システムに関し、サーバが、さらに、各受信者のデジタルプロフィールの記録手段と、オリジナルオーディオストリームの構造、内容、パラメータ、受信者のプロフィール、および外部事象といった代表的な特徴の、少なくとも一部に対応する入力変数に応じた修正手段の制御手段とを含むことを特徴とする。
【0044】
デジタルオーディオストリームは、一般に、各オーディオコーダに対して特別なデジタルフォーマットで組織された複数のフレームまたはブロックからなるシーケンスから構成され、様々な符号化パラメータと、デジタルオーディオサンプルの特別な表示に関する係数とを有するフレームのヘッダを含む。所定のオーディオコーダおよび/または、標準もしくは規格に対して、オーディオ信号のモデル化、圧縮、および符号化を実施する方法が分かると、この方法を記述する主要パラメータをビットストリームから取り出してデコーダに送ることが常に可能になる。
【0045】
パラメータを識別したら、これを修正して、所定のコーダおよび/または標準から発生するオーディオストリームが前記コーダおよび/または標準に適合するようにする。さらに、こうした修正により音響信号の安定性を確保する一方で、スクランブルによりユーザによる使用を不能にする。しかしながら、この音響信号は、その符号化に対応するデコーダでは理解および解釈されて、妨害されることなくプレーヤで再生(jouer)可能である。
【0046】
前記オーディオ信号の一つまたは複数の成分(スペクトルエンベロープ、基本波、または高調波、心理−音響モデル、経過時間、SN比、合成、圧縮、量子化、変換)を修正すると、この信号は聴覚的に劣化され、自覚される聴覚の観点からは完全に理解不能で不快な信号に変換される。修正されるオーディオ信号部分すなわちオーディオ信号の記述成分は、これが音声用、音楽用、ノイズまたは特殊効果音用、合成音用であろうと、同種のあらゆるオーディオ信号用であろうと、所定の各コーダ−デコーダに対して符号化によって決定される。符号化を行う方法と、結果として得られるパラメータの伝送とに応じて、オーディオ信号の主要特性についての直接または間接情報を得られ、従って、これらの特性を修正できる。この原則は、あらゆるタイプのデジタルコーダならびにそれらのあらゆる基本層または強化層(「base and enhancement layers」)またはその2つの組み合わせに適応可能である。
【0047】
オーディオストリームの内容、すなわち自然音声、合成音声、音楽、ノイズ、自然音、合成音、または複合音、特殊効果に応じて、スクランブルの各パラメータを適応させる。たとえば、MPEG−4規格により規定された音声用のエンコーダHVXC(Harmonic Vector eXcitation Coding)および音楽用のエンコーダHILN(Harmonic and Incividual Lines plus Noise)は、内容に応じてオーディオ信号を別々または一緒に符号化するパラメトリックコーダである。たとえば、音声が主要である場合、HVXCから送られるビットストリームは、LPC(Linear Predictive Coding)パラメータを示すLSP(Line Spectral Pairs)の値を含む。現行フレームのLSP値は2段階でベクトル量子化され、一定の値に安定化されて、LPC合成フィルタの安定性を確保し、その後、隣接する係数間の距離を最短にしながら小さい順にビットストリーム内に並べられる。ベクトル量子化によるLSP対の指数はデコーダに伝送され、デコーダは、標準テーブルからLSP値、従ってLPC値を再生する。規格で予め規定されているテーブルから選択した他の値によりオリジナル指数を代替することによって、ビットストリームは適合し続けるが、デコードされたLSP値はオリジナルのLPCパラメータに対応しない。その結果、スペクトルエンベロープが修正され、音声が劣化する。
【0048】
多くのオーディオコーダは、スケーラビリティを特徴とする。多層シーケンスを生成または再生するように、ビットストリームの順序集合を符号化可能なエンコーダ、またはデコード可能なデコーダを特徴づける「スケーラビリティ」(「scalability」)を定義する。オーディオエンコーダの構成に応じて、基本層または強化層に対して適応性のあるスクランブルを行う。たとえば、HVXCエンコーダおよびHILNエンコーダはそれぞれ基本層と強化層とを含むので、複数の構成が可能になる。所望のスクランブル度に応じて、基本層、強化層、またはこの2つの層に対してパラメータを修正する。
【0049】
同様に、一定であっても可変であってもオーディオストリームのビットレート(一秒あたりのキロビット数:kビット/秒)に応じて、適応を実施する。さらに複雑な幾つかのオーディオストリームに対しては(非常に広範な割合(2kbits/秒〜64kbits/秒)でビットレートが変化するMPEG−4タイプのストリームなど)、ビットレートに応じてスクランブルのパラメータを選択する。何故なら、約2kbits/秒の低いビットレートのスクランブルは、高いビットレートに対してはそれほど有効でなく、高いビットレートでは符号化精度がもっとずっと大きいことが分かっているからである。
【0050】
また、一定のオーディオストリームを特徴づける粒度の細かいスケーラビリティ(「fine granular scalability」)に応じて、スクランブルのパラメータを適応させる。「スケーラビリティの粒度」(「glanular scalability」)の概念は、MPEG−4規格で用いられ、多層シーケンスを生成または再生するように、ビットストリームの順序集合を符号化可能なエンコーダ、またはデコード可能なデコーダを特徴づける。粒度とは、任意のスケーラビリティを特徴とするシステムの各層が伝送可能な情報量として定義され、その場合、システムにもまた粒度がある。たとえば、BSAC(Bit Sliced Arithmetic Coding)を用いたAAC(Advanced Audio Coding)符号化構成により、AACビットストリームを、そのノイズを低減しながら、1kbits/秒のピッチでビットレートを修正可能な1チャンネル当たり16kbits/秒〜64kbits/秒の粒度の細かいスケーラビリティのビットストリームに、符号化することができる。
【0051】
(MPEG−4規格で定義されているような)もっと複雑な幾つかのオーディオストリームでは、このストリームに含まれるオブジェクトのタイプ、プロフィール(「profile」)、複雑度を示すレベル(「level」)、オーディオストリームの構成時に使用される任意選択に応じて、適応性のあるスクランブルを行う。実際、オーディオMPEG−4の範囲では、多数のオーディオオブジェクトおよびオーディオプロフィールがある。たとえば、自然のオーディオオブジェクトに対して、プロフィールの一つは、ツールCELP(「Code Excited Linear Prediction」と、AAC(「Advanced Audio Coding」)とを含む、「Simple scalable」)である。スクランブルは、この2つのコーダのパラメータに応じて実施される。オーディオストリームのエレメントの適応性のある修正は、各プロフィールおよびレベルが含むオーディオオブジェクトのタイプに応じて行われる。
【0052】
また、ストリーム内に存在するオーディオチャンネル数に応じてスクランブルのパラメータを適応させる。
【0053】
ストリーム内に存在する様々なオーディオチャンネル間の結合および多重化に応じてスクランブルのパラメータを適応させる。
【0054】
オーディオストリームが符号化されたサンプリング周波数に応じてスクランブルのパラメータを適応させる。
【0055】
幾つかのオーディオエンコーダを特徴づける、使用された心理音響モデルに応じて、スクランブルのパラメータを適応させる。
【0056】
たとえば、MPEG−4規格AACでは、心理−音響モデルが、オーディオ品質を保持しながら圧縮時に許可されうる最大の量子化誤差を決定する閾値を推定する。スペクトルデータは、これらの推定閾値に応じて量子化され、符号化される。量子化は、推定閾値に応じて選択され、たとえば均質であっても不均質であってもよく、スケールファクタ(「scale factors」)を用いて行われる。ビットストリームで差分符号化されたこれらのスケールファクタの値を修正することにより、量子化誤差を挿入する。何故なら、スケールファクタは、心理−音響モデルの推定により定義されたスケールファクタにもはや対応しないからである。軽いスクランブルを望む場合、所望の聴覚劣化にスクランブルを適応させ、最新のスケールファクタを修正する。著しい聴覚劣化を得ることを望む場合、有利には、第一のスケールファクタを修正する。これは、全てのスケールファクタが第一のスケールファクタに対して差分符号化されるので、全ての後続値が誤り、オーディオ信号が甚だしく妨害されるからである。
【0057】
また、段階的なスクランブルを施して、スクランブルされていないオーディオストリームをユーザが聞き始めるようにする。その後、軽いスクランブルから始まって、だんだんスクランブルを強くし、オーディオストリーム全体がスクランブルされるまで続ける。ここでの目的は、オーディオストリームに対してユーザの興味を呼び覚ますが、聴く権利を購入しない場合は、この権利を剥奪することにある。この用法を実現するには、一つまたは複数の所定のアルゴリズムでオーディオストリームをスクランブルし、所定の時間中、スクランブルパラメータを徐々に修正することによって聞きづらさを増していき、完全にスクランブルされた聴取不能なストリームに至るまで続ける。
【0058】
一般に、所定の規格または標準により規定されたデジタルストリームの内容、様々な特徴、構造、および成分に応じて適応性のあるスクランブルが実施される。
【0059】
また、オーディオストリームをスクランブルするために付与されるパラメータの組み合わせを任意に生成してスクランブルが行われる。このようにして、不正な意図を持つ人から攻撃されにくく、または非合法なコピーをされることのない、堅牢な保護が得られる。
【0060】
同様に、受信者のプロフィール、サーバへの接続中の受信者の挙動(たとえば支払いの規則性および受取り)、受信者が支払う用意のある価格、受信者の習慣(たとえば接続時間、接続時刻)、受信者の種々の特徴(たとえば年齢、性別、宗教、地域社会)、あるいは第三者により伝達されるデータ(たとえば協会への所属または消費者データベースへの掲載)に応じて、スクランブルのパラメータおよびアルゴリズムを適応させる。
【0061】
同様に、たとえば放送時間、視聴率、社会−政治学的な事象、あるいは放送中の妨害に応じて、スクランブルのパラメータおよびアルゴリズムを適応させる。
【0062】
以下、添付図面に関して本発明の実施形態を全くの例として示した説明により、本発明がいっそう理解されるであろう。
【図面の簡単な説明】
【0063】
【図1】本発明によるクライアント−サーバシステムの特定の実施形態を示す図である。
【発明を実施するための形態】
【0064】
安全化を望むMPEG−AACタイプのオーディオストリーム(1)を分析システム(121)およびスクランブルシステム(122)に送り、スクランブルシステムが、修正されたメインストリームと、補足情報とを出力で発生する。
【0065】
オリジナルストリーム(1)は、直接、デジタルフォーマット(10)またはアナログフォーマット(11)とすることができる。後者の場合、アナログストリーム(11)は、図示されていないコーダによりデジタルフォーマット(10)に変換される。以下、入力オーディオデジタルストリームを(1)と記す。
【0066】
MPEG−AACフォーマットの第一のストリーム(124)は、その係数および/または値のいくつかを修正したことを除いて、入力デジタルストリーム(1)と同じフォーマットであり、出力バッファメモリ(125)に配置される。
【0067】
任意のフォーマットの補足情報(123)は、修正されたオーディオサンプル部分のリファレンスを含み、バッファ(126)に配置される。入力ストリーム(1)の特徴に応じて、分析システム(121)およびスクランブルシステム(122)は、どの適応型スクランブルを実施して、ストリームのどのパラメータを修正するか決定し、またクライアントの権利に応じて修正をどのように行うか、たとえば段階的に行うかそうでないかを決定する。
【0068】
その後、MPEG−AACストリーム(125)を、CD−ROM、不揮発性メモリ、DVD等で物理的に、または電話網、DSL(Digital Subscriber Line)、BLR(Boucle Locale Radio無線ローカルループ)、DAB(Digital Audio Broadcasting)、RTC(電話交換網)、デジタル移動体(GSM(登録商標)、GPRS、UMTS)、ヘルツ波、ケーブル、衛星等のタイプのネットワーク(4)を介して、クライアント(8)に伝送し、より詳しくは、RAM、ROM、ハードディスクタイプのメモリ(81)に伝送する。受信者(8)がメモリ(81)に存在するオーディオシーケンスの聴取要求をする場合、次のような2つの可能性が考えられる。
−受信者(8)が、オーディオシーケンスを再生するために必要な権利をもたない場合。この場合、スクランブルシステム(122)が発生するストリーム(125)は、メモリ(81)内にあって合成システム(82)に移行し、合成システムはこれを修正せずに従来のオーディオ再生装置(83)と同じ再生装置に伝送し、聴覚的に著しく劣化されたその内容が、ヘッドホンまたはスピーカ(9)でプレーヤ(83)により再生される。
−または、受信者(8)が、オーディオシーケンスを聴く権利を有する場合。受信者の権利に応じて、サーバ(12)は、実施されるスクランブルのタイプに対応して接続線(6)により適切な補足情報(126)を伝送する。この場合、合成システムは、オリジナルオーディオシーケンス(1)の回収に必要な情報(126)を含むサーバ(12)に聴取要求を行う。サーバ(12)は、接続線(6)によりアナログまたはデジタル電話線、DSL(Digital Subscriber Line)、BLR(Boucle Locale Radio無線ローカルループ)、DAB(Digital Audio Broadcasting)、RTC(電話交換網)、デジタル移動体ネットワーク(GSM、GPRS、UMTS)、ヘルツ波、ケーブル、または衛星タイプの伝送ネットワークを介して、オーディオシーケンスを再構成可能にする補足情報(126)を送り、クライアント(8)がオーディオシーケンスを聴取および/または保存できるようにする。その場合、合成システム(82)は、修正されたメインストリーム(125)と補足情報(126)との組み合わせによってオリジナルストリームを再構成することによりオーディオシーケンスをデスクランブルする。合成システム(82)の出力でこのように得られたオーディオストリームは、従来のオーディオ再生装置(83)に伝送され、オリジナルオーディオシーケンスがヘッドホンまたはスピーカ(9)で再生される。
【0069】
同様に、オーディオフレームのビットレート、構造、および成分に応じて、また、得ようとする聴覚的な劣化作用に応じて異なる修正が行われる第二の実施形態により、本発明について説明する。
【0070】
ますます多くのコーダが、たとえば有限の通過帯域の制約に応じる等の特殊な用途にこたえるために、可変ビットレートによる動作を選択するようになっている。ビットレートが低い通過帯域を尊重しながら音声に対して受入可能な品質の確保を目的とするコーダの一例は、携帯電話用に設計されたAMR(「Adaptive Multi Rate」)コーダであり、4.75kbits/秒〜12.2kbit/秒の異なる8個のモードでビットレートが動作可能である。本発明は、オーディオストリームが符号化されたモードに応じて、すなわち、ビットレート、フレームの各成分の長さ、ならびに聴覚的な所望の劣化度に応じて、異なる修正を実施する。
【0071】
たとえば12.2kbits/秒のモードでは、AMRフレームの構造は次のようになる。
−LSP(「Line Spectra Pairs」)パラメータに関連し、従ってLPC(「Linear Predictive Coding」)パラメータに同様に関連し、すなわちフォルマントフィルタとして、LSF(「Line Spectral Frequencies」)と呼ばれる周波数のスペクトル対に対応する指数。前記指数は全てのフレームで共通である。
−フレーム全体に含まれる4個のサブフレームに関連し、160個のオーディオサンプルを示す4つのパラメータ群。
【0072】
各サブフレームの各パラメータ群は、次のように構成される。
−基本波の遅延(「pitch delay」)
−基本波の振幅(「pitch gain」)
−励起パルスの符号と周波数位置とに関するデータ
−数値テーブル(「codebook」)の利得に関する指標
【0073】
所望の聴覚劣化に応じて、これらのパラメータを異なる仕方で修正する。
【0074】
たとえば、基本波の遅延値を異なる値で代替して修正すると、周波数がオフセットされる。すなわち、小さい値では音声が変形されて、「音声の消滅」と同種の雑音(gresillements)を伴う無声効果が得られる。
【0075】
大きい値で代替することにより基本波の振幅を修正すると、不規則な変形が得られ、増幅部分もあれば「かき消される部分」も出てくる。
【0076】
LSFの値にはまた、次のような複数の修正が実施される。
−LSFの値を固定値で代替すると、雑音の混じる無線チャンネルと同種の既知のオーディオ効果が生じる。
−指数を任意に変更することによりLSFの値を代替し、音を全体として使えなくする。何故なら、様々な周波数および振幅の雑音が加わって音響的な著しい不快性を生じ、音声が理解不能になるからである。
−LSFを修正することにより、聴取可能な劣化が「ヒッシング(sifflement)」タイプのバックサウンドと同種になるが、音の一部は聴き取り可能であり、この場合には修正を適応させて、たとえば、ユーザが音を聴いてそれによって権利の要求を選択し、または権利を要求しない選択を可能にするようにしたいとき、予備聴取(「teasing」)を行えるようにする。たとえば同一値で指数値を代替することによって、たとえば、1個のLSFを修正し、第二、第三、第四、第五のLSFに段階的に修正を加えていって、LSFの全ての値を修正するまでこれを行う。この事例で得られる結果は、一つの周波数を中心とするスペクトルの集中であり、たとえば指数を1に設定すると、低周波数の理解不能な音が得られる。
【0077】
LSFの異なる修正によって付与される補足情報は、聴覚的な劣化が大きい場合でも、量が少ない。好適には、これらの修正が他の修正と組み合わされる。
【0078】
有利には、励起構造に関するパルスの符号を修正する。さらに、「偽」位置でパルス位置を代替することにより、同様に励起を修正し、I番目の音全体を変形する。
【0079】
7.95kbits/秒のモードでは、3個のLSFからなる単一組を含むことを除いてフレーム構造が同じである。その場合、こうした特性と、このモードに対応するフレーム長とを考慮して、異なる修正を行う。
【0080】
AMRコーダの他のモードに対してはフレーム構造がわずかに異なり、基本波の振幅も固定数値テーブルの利得も含まないが、適応型の固定数値テーブルに関する利得の集合を含む。この利得は、適応性のある革新的なベクトルコードの付加により、構成された励起のスケールを設定するために用いられる。適用される修正は、こうした特殊性を考慮する。LSFを修正すると著しい劣化が生じるが、オーディオビットレートはそれほど高くないので、著しい聴覚的な劣化を得る場合でも少ない修正で十分である。
【0081】
好適には、補足情報のための所望のビットレートを考慮することにより、異なる修正が行われる。
【0082】
本発明は、実施例として挙げた修正に制限されるものではない。前記修正は、許可された音の振幅値を越えることがなく、修正されたメインストリームがオリジナルオーディオストリームと適合するようにしている。
【0083】
有利には、再構成されたストリームは、修正されたメインストリームと補足情報とからユーザ装置で再構成された後、聴覚的にはオリジナルストリームと同じであるが、オリジナルストリームのビットの観点からは異なり、これは安全性を高めることを目的としている。
【0084】
有利には、再構成されたストリームは、修正されたメインストリームと補足情報とからユーザ装置で再構成された後、オリジナルストリームと厳密に同じであって、この方法には損失がない。
【符号の説明】
【0085】
1 オリジナルオーディオストリーム
10 デジタルフォーマット
11 アナログフォーマット
12 サーバ
121 分析システム
122 スクランブルシステム
123 補足情報
124 第一のストリーム
125 出力バッファメモリまたはMPEG−AACストリームまたは修正されたメインストリーム
126 バッファ
8 受信者またはクライアント
81 メモリ
82 合成システム
83 従来のオーディオ再生装置
9 ヘッドホンまたはスピーカ
6 接続線

【特許請求の範囲】
【請求項1】
公称ストリームフォーマットに従ってデジタルオーディオシーケンスを供給する方法であって、前記シーケンスが、簡単なデジタル符号化オーディオエレメントに対応する複数の係数を集めた少なくとも一つのデジタルオーディオブロックをそれぞれが含む、一連のフレームから構成され、この方法が、オリジナルストリームの少なくとも一つのブロックの修正ステップを含んでおり、前記修正ステップが、オリジナルオーディオストリームの構造、内容、およびパラメータと、受信者のプロフィールと、外部事象との代表的な特徴の少なくとも一部に応じて、前記オリジナルストリームに適応するように作用することを特徴とする方法。
【請求項2】
修正ステップが、前記係数の一部を代えて、公称フォーマットでメインオーディオストリームを発生するとともに、受信装置のデコーダによりオリジナルストリームを再構成可能にする補足修正情報を発生することからなり、修正範囲は、可変であって、前記代表的な特徴により決定されることを特徴とする請求項1に記載のデジタルオーディオシーケンスの供給方法。
【請求項3】
修正されたメインストリームが、受信装置への補足情報の伝送の前に受信装置に記録されることを特徴とする請求項2に記載のデジタルオーディオシーケンスの供給方法。
【請求項4】
修正されたメインストリームが、受信装置への補足情報の伝送の前に受信装置に伝送されるように物理媒体に記録されることを特徴とする請求項2に記載のデジタルオーディオシーケンスの供給方法。
【請求項5】
修正されたメインストリームと補足情報とが、リアルタイムで一緒に伝送されることを特徴とする請求項2に記載のデジタルオーディオシーケンスの供給方法。
【請求項6】
前記補足修正情報が、一つの機能を実行可能な少なくとも一つのデジタルルーチンを含むことを特徴とする請求項2から5のいずれか一項に記載のデジタルオーディオシーケンスの供給方法。
【請求項7】
前記補足修正情報が、少なくとも2個の部分集合に分割されることを特徴とする請求項2から6のいずれか一項に記載のデジタルオーディオシーケンスの供給方法。
【請求項8】
前記補足修正情報の部分集合が、様々なメディアから供給されることを特徴とする請求項7に記載のデジタルオーディオシーケンスの供給方法。
【請求項9】
前記補足修正情報の部分集合が、同じメディアから供給されることを特徴とする請求項7に記載のデジタルオーディオシーケンスの供給方法。
【請求項10】
補足情報が、物理ベクトルで伝達されることを特徴とする請求項2から9のいずれか一項に記載のデジタルオーディオシーケンスの供給方法。
【請求項11】
補足情報がオンライン伝送されることを特徴とする請求項2から9のいずれか一項に記載のデジタルオーディオシーケンスの供給方法。
【請求項12】
前記デジタルオーディオシーケンスが、オーディオコンテンツに応じて異なる仕方で修正されることを特徴とする請求項1から11のいずれか一項に記載のデジタルオーディオシーケンスの供給方法。
【請求項13】
前記デジタルオーディオシーケンスが、修正されたスケーラビリティ層に応じて異なる仕方で修正されることを特徴とする請求項1から12のいずれか一項に記載のデジタルオーディオシーケンスの供給方法。
【請求項14】
前記デジタルオーディオシーケンスが、オリジナルストリームのビットレート(kビット/秒)に応じて異なる仕方で修正されることを特徴とする請求項1から13のいずれか一項に記載のデジタルオーディオシーケンスの供給方法。
【請求項15】
前記デジタルオーディオシーケンスは、プロフィールと、これらのオーディオシーケンスが符号化された規格または標準により規定されるデジタルレベルとに応じて、異なる仕方で修正されることを特徴とする請求項1から14のいずれか一項に記載のデジタルオーディオシーケンスの供給方法。
【請求項16】
前記デジタルオーディオシーケンスが、ストリーム内に存在するオーディオチャンネル数に応じて異なる仕方で修正されることを特徴とする請求項1から15のいずれか一項に記載のデジタルオーディオシーケンスの供給方法。
【請求項17】
前記デジタルオーディオシーケンスが、ストリーム内に存在する様々なオーディオチャネル間の結合および多重化に応じて異なる仕方で修正されることを特徴とする請求項1から16のいずれか一項に記載のデジタルオーディオシーケンスの供給方法。
【請求項18】
前記デジタルオーディオシーケンスは、オーディオストリームが符号化されたサンプリング周波数に応じて、異なる仕方で修正されることを特徴とする請求項1から17のいずれか一項に記載のデジタルオーディオシーケンスの供給方法。
【請求項19】
前記デジタルオーディオシーケンスは、使用される心理音響モデルに応じて異なる仕方で修正されることを特徴とする請求項1から18のいずれか一項に記載のデジタルオーディオシーケンスの供給方法。
【請求項20】
前記デジタルオーディオシーケンスは、スケーラビリティの粒度に応じて異なる仕方で修正されることを特徴とする請求項1から19のいずれか一項に記載のデジタルオーディオシーケンスの供給方法。
【請求項21】
前記デジタルオーディオシーケンスが、所望の聴覚劣化作用に応じて異なる仕方で修正されることを特徴とする請求項1から20のいずれか一項に記載のデジタルオーディオシーケンスの供給方法。
【請求項22】
前記デジタルオーディオシーケンスが、補足情報用の所望のビットレートに応じて異なる仕方で修正されることを特徴とする請求項1から21のいずれか一項に記載のデジタルオーディオシーケンスの供給方法。
【請求項23】
前記デジタルオーディオシーケンスのLSP(「Line Spectral Pairs」)指標値またはLSF(「Line Spectral Frequencies」)指標値が修正されることを特徴とする請求項1から22のいずれか一項に記載のデジタルオーディオシーケンスの供給方法。
【請求項24】
前記デジタルオーディオシーケンスの基本波の持続時間および振幅の値が修正されることを特徴とする請求項1から23のいずれか一項に記載のデジタルオーディオシーケンスの供給方法。
【請求項25】
前記デジタルオーディオシーケンスの励起パルスの符号と位置とが修正されることを特徴とする請求項1から24のいずれか一項に記載のデジタルオーディオシーケンスの供給方法。
【請求項26】
前記修正が、許可された音の振幅値を超えないようにすることを特徴とする請求項1から25のいずれか一項に記載のデジタルオーディオシーケンスの供給方法。
【請求項27】
修正メインストリームと補足情報とから再生された前記オーディオシーケンスが、オリジナルストリームと聴覚的には同じであるが、オリジナルストリームのビットの観点からは異なることを特徴とする請求項1から26のいずれか一項に記載のデジタルオーディオシーケンスの供給方法。
【請求項28】
修正メインストリームと補足情報とから再生された前記オーディオシーケンスが、聴覚的にもビットの観点からもオリジナルストリームと同じであることを特徴とする請求項1から27のいずれか一項に記載のデジタルオーディオシーケンスの供給方法。
【請求項29】
前記デジタルオーディオシーケンスが、オーディオストリームを完全にスクランブルするまで劣化作用を増しながら段階的に修正されることを特徴とする請求項1から28のいずれか一項に記載のデジタルオーディオシーケンスの供給方法。
【請求項30】
前記デジタルオーディオシーケンスが、スクランブルのパラメータと構成とを任意に発生しながら修正されることを特徴とする請求項1から29のいずれか一項に記載のデジタルオーディオシーケンスの供給方法。
【請求項31】
組織化されたフォーマットでの事前のA/D変換ステップを含み、この方法が、アナログオーディオ信号に適用されることを特徴とする請求項1から30のいずれか一項に記載のデジタルオーディオシーケンスの供給方法。
【請求項32】
請求項1から31のいずれか一項に記載の修正ストリームを送る手段を含むオーディオサーバと、スクランブル回路を備えた複数の装置とを含む、デジタルオーディオシーケンスの供給システムであって、サーバが、さらに、各受信者のデジタルプロフィールの記録手段と、オリジナルオーディオストリームの構造、内容、パラメータ、受信者のプロフィール、および外部事象といった代表的な特徴の、少なくとも一部に対応する入力変数に応じた修正手段の制御手段とを含むことを特徴とするシステム。

【図1】
image rotate


【公開番号】特開2013−41661(P2013−41661A)
【公開日】平成25年2月28日(2013.2.28)
【国際特許分類】
【出願番号】特願2012−202039(P2012−202039)
【出願日】平成24年9月13日(2012.9.13)
【分割の表示】特願2004−546127(P2004−546127)の分割
【原出願日】平成15年10月21日(2003.10.21)
【出願人】(508362457)クーレル データ リミテッド ライアビリティ カンパニー (1)
【Fターム(参考)】