説明

音響信号の演奏を制御する方法と装置

【課題】
【解決手段】 本発明にかかる装置と方法は、問題となる単語のクローズキャプションテキストを、対応する音響信号の分析に関連させて分析する(210)ことによって、音響信号の再生を制御する方法を具える。クローズキャプション信号中の問題となるテキストあるいはその他の特定のテキストが、ユーザが同定した問題になるテキストとの比較を介して認定される。問題となるテキストを認定したら、その音響信号を分析して、問題になるテキストを問題の音響シーケンス(240)と合致させることによって問題になるテキストに対応する音響部分を同定する。音響部分を同定したら、音響信号をコントロールして可聴の問題になるテキストをミュートするよう制御することができる。

【発明の詳細な説明】
【技術分野】
【0001】
関連出願
本出願は非暫定出願であり、ここに引用して含まれている、2003年8月26日に出願した「関連する音響信号の分析に基づくメディアコンテンツのフィルタリング;当該分析を助ける関連するクローズドキャプション信号の使用」と題する暫定出願60/497,769号の優先権を主張する。
【0002】
発明の属する技術分野
本発明は、一般的に、演奏および音響/視覚表示に関し、特に、音響信号から問題のある単語をフィルタする方法と装置に関する。
【背景技術】
【0003】
発明の背景
ライブ又はテープに録音したテレビおよびラジオのプログラム、映画、あるいは様々な音響表現は、時に、汚い単語、不明瞭な単語、あるいは特定の人物が問題であると考えるような単語やフレーズを含んでいる。多くの場合、問題となる言語が存在するため、人々は、表示を積極的に回避する。さらに、親は、時に、子供がこのような言語に触れることを禁止しようとする。
【0004】
問題となる単語を含む全フレーズをミュートできる製品がある。しかしながら、全フレーズをミュートすると、時に会話の大部分が不完全なものとなり、見る者の理解が貧弱になり、見るもののフラストレーションが増すことがある。この全体のミュートは、しばしば、音響表示の質を下げる結果になる。
【0005】
通常のテレビジョンセット、セットトップボックスなどは、音響成分と、ビデオ成分の双方を含むテレビジョン信号を受信し、音響信号を演奏し、ビデオ信号を表示する様々な処理エレメントを具えている。しかしながら、この処理エレメントは、音響/視覚信号の処理専用のものではなく、その他の動作を実行するためにわずかに余分な帯域を有している。
【0006】
本発明の態様は、この背景を心に留めて考えられた。本発明は、単体の、あるいは音響/視覚信号の一部を形成する、音響信号の演奏を制御する装置と方法に関するものである。本発明の実施例は、問題となる単語のみを音響ストリームからミュートするように構成することができる。更に、本発明の実施例は、現存する物理的プラットフォームをわずかに変更する、あるいはまったく変更を加えずに、テレビジョンプロセッサ、セットトップボックスなどの従来の音響/視覚処理装置が稼動するように構成することができ、また、特定のアプリケーション用に必要があればリアルタイムで稼動するように構成することができる。本発明の実施例の詳細を以下により詳しく述べる。
【0007】
発明の概要
本発明の一の態様は、クローズキャプション信号を受信するステップと、特定のテキストについてのクローズキャプション信号を分析するステップと、を具える音響信号の演奏制御方法である。この特定のテキストを同定すると、前記クローズキャプション信号から特定のテキストを同定する機能として音響信号を分析する。次いで、特定のテキストに対応する音響信号の再生を制御することができる。
【0008】
再生を制御する動作は、(1)クローズキャプション信号の特定のテキストに対応する音響信号部分を減衰させるステップと;(2)クローズキャプション信号の特定のテキストに対応する音響信号の部分を実質的に削除するステップと;(3)クローズキャプション信号の特定のテキストに対応する音響信号用に構成した部分を減衰させる少なくとも一のコマンドを発するステップと;及び(4)音響信号中に少なくとも一の制御コードを挿入するステップであって、この制御コードがクローズキャプション信号からの特定されたテキストに対応する音響信号の部分を減衰させるように構成されているステップと;を具えていても良い。
【0009】
この方法は、更に、特定のテキストを、特定のテキストの音声表示に変換する動作を具えていても良い。更に、この方法は、特定のテキストの時間を延長した音声表示を規定するために、特定のテキストの音声表示の時間を延長するステップを具えていても良い。音声表示用に、少なくとも一のエネルギィ値を決定して、特定のテキストの比較フォームを規定するようにしてもよい。同様に、この方法は、前記音響信号用の少なくとも一のエネルギィ値を決定して、音響信号の比較フォームを決定するステップを具えていても良い。
【0010】
音響信号を分析する動作は、更に、特定のテキストの比較フォームと音響信号の比較フォームとを比較する動作を具えていても良い。したがって、本方法は、特定のテキストに対応する音響信号の部分を同定する動作を更に具えていても良い。
【0011】
特定のテキストは、スペース、文字、単語、フレーズ、センテンス、制御コード、およびシンボルであっても良い。更に、特定のテキストは、ユーザによって選択されても良い。最後に、特定のテキストは、問題があると考えられるテキストから選択されたものであっても良い。
【0012】
いくつかの特別な実装では、特定のテキストを同定する動作が更に、特定のテキストに時間的に先行する先行テキストを同定する動作を具えていてもよい。クローズキャプション信号から特定のテキストを同定する機能として音響信号を分析する動作が更に、クローズキャプション信号から先行テキストを同定する機能として音響信号を分析するステップを具えていても良い。更に、特定のテキストに対応する音響信号の再生制御動作が、更に、先行テキストに対応する音響信号の再生を制御するステップを具えていても良い。
【0013】
本発明のもう一つの態様は、クローズキャプションテキスト信号の特定の部分をこの特定の部分の音響エクイバレントに変換するステップと;クローズキャプションテキスト信号の特定の部分の音響エクイバレントを音響信号と比較して、クローズキャプション信号の特定の部分に対応する音響信号の部分を同定するステップと;クローズキャプション信号の特定の部分に対応する音響信号の部分の再生を制御するステップとを具える、音響信号の演奏を制御する方法である。
【0014】
再生を制御する動作が、更に、(1)クローズキャプション信号の特定の部分に対応する音響信号の部分を減衰させるステップと;(2)クローズキャプション信号の特定の部分に対応する音響信号の部分を実質的に削除するステップと;(3)クローズキャプション信号の特定の部分に対応する音響信号の特定の部分を減衰させるように構成した少なくとも一のコマンドを発生するステップと;及び、(4)少なくとも一の制御コードを音響信号中に挿入するステップであって、この制御コードがクローズキャプション信号の特定の部分に対応する音響信号を減衰させるように構成した制御コードであるステップと;を更に具えていても良い。
【0015】
この第2の方法は、クローズキャプション信号の特定の部分をクローズキャプション信号の特定の部分の音声表示に変換する動作を具えていても良い。更に、この方法は、クローズキャプション信号の特定の部分の音声表示の時間を延長して、時間を延長した音声表示を規定する動作を具えていても良い。時間延長バージョンを含めた音声表示に関して、本方法は、音声表示の少なくとも一のエネルギィ値を決定して、クローズキャプション信号の特定の部分の比較フォームを規定するステップを具えていても良い。
【0016】
比較のために、第2の方法は、音響信号用の少なくとも一のエネルギィ値を決定して、音響信号の比較フォームを規定するためステップを具えていても良い。比較動作は、更に、クローズキャプション信号の特定の部分の比較フォームと音響信号の比較フォームを比較する動作を具えていても良い。更に、この比較動作は、クローズキャプション信号の特定の部分に対応する音響信号の部分を同定するステップを更に具えていても良い。
【0017】
ここに述べたいずれかの方法を用いる場合、コンピュータで実行可能な複数の命令を有するプロセッサが、様々な方法を実行するように構成することができる。
【0018】
本発明の第3の態様は、少なくとも一の問題となる単語の表示を受信するステップと;クローズキャプション信号内のこの少なくとも一つの問題となる単語を同定するステップと;音響信号中の少なくとも一つの問題となる単語を、クローズキャプション信号の少なくとも一つの問題となる単語を同定する動作の機能として同定するステップと;を具える音響信号の再生を制御する方法である。
【0019】
第3の方法によって、あるいはその他の方法によって、同定動作の機能として音響信号の音響表示を制御することが可能である。
【0020】
第3の方法は、さらに、少なくとも一つの問題となる単語に対応する音響信号の部分の音響表示をミュートするステップを具えていても良い。更に、第3の方法は、問題となる単語に先行するクローズキャプション信号の一部を同定するステップを具えていても良い。この先行する部分は、スペース、文字、単語、フレーズ、シンボル、およびクローズキャプション制御信号からなる群から選択することができる。
【0021】
第3の方法は、クローズキャプション信号中の少なくとも一の問題となる単語を同定するステップと、この問題となる単語に先行するクローズキャプション信号の一部を同定する動作の機能として音響信号中の少なくとも一の問題となる単語を同定するステップを具えていても良い。制御動作は、前記問題となる単語に先行するクローズキャプション信号の一部を同定する機能である。この方法は、更に、音響ストリーム中の問題となる単語に先行するクローズキャプション信号の部分の同定を行う機能として、音響表示のミュートを行わせる動作を具える。また、この方法は、音響信号中の少なくとも一の問題となる単語の同定を行う機能としてのミュートを終了するステップを具えていても良い。
【0022】
本発明の第4の態様は、少なくとも一の問題となる単語の表示を受信するステップと;音響信号を受信するステップと;この音響信号をメモリに保存するステップと;前記保存した音響信号を処理して前記音響信号中に前記少なくとも一の問題となる単語が存在するかどうかを決定するステップと;前記処理動作の機能として、前記音響信号の音響表示を制御するステップと;を具える音響表示の再生制御方法である。前記制御の動作は:(1)少なくとも一の問題となる単語に対応する音響信号の部分を減衰させるステップと;(2)少なくとも一の問題となる単語に対応する音響信号の部分を実質的に削除するステップと;少なくとも一の制御コードを音響信号も挿入するステップであって、少なくとも一の問題となる単語に対応する音響信号に減衰を生じさせるようにこのコントロールコードが構成されているステップと;を具えていても良い。更に、前記処理動作が、前記音響信号の少なくとも一のチャンネルを解析するステップを具えていても良い。
【0023】
実施例の詳細な説明
本発明の態様は、テレビション受信機、ケーブルまたはサテライトセットボックス、ビデオカセットレコーダ、DVDプレーヤ、あるいは音響ストリームを受信あるいは処理するように構成されたその他の音響信号処理装置を具える。一の特別な実装においては、音響信号処理装置は、音響ストリーム内の、特定の視聴者に対して問題となると考えられる単語など、所定の単語をミュートするように構成されている。本発明にかかる装置あるいは方法は、ユーザが問題となるとする様々な単語を表示することができるメカニズムを提供する。本発明にかかる一の実施例は、クローズキャプションストリームを解析して問題となる単語あるいはフレーズを検出し、クローズキャプション単語を音響表示に変換して、次いでクローズキャプションの音響表示を音響ストリームと比較して、音響ストリーム中の問題となる単語を同定する。問題となる単語が同定されると、本発明の実施例は、問題となる単語の音響表示をミュートする。
【0024】
図1−8および以下の説明は、本発明の実施例を実装することができる一の好適なコンピュータ環境あるいは信号処理環境の簡単で一般的な説明を提供しようとするものである。要求されてはいないが、本発明の実施例は、テレビジョンプロセッサなどの、一またはそれ以上の処理エレメントによって実行されるプログラムモジュールといった、コンピュータで実行可能な命令の一般的なコンテキストで記載されている。通常、プログラムモジュールは、特定のタスクを実行するまたは特定の抽象データ型を実装する、ルーチン、プログラム、オブジェクト、コンポーネント、データ構造、その他を具えている。コンピュータで実行可能な命令と、関連するデータ構造及びプログラムモジュールは、ここに述べる方法のステップを実行するプログラムコード手段の例である。このような実行可能な命令あるいは関連するデータ構造の特定のシーケンスは、このようなステップに記載された機能を実装するための対応する行為の例である。更に、処理ユニットによって実行されているプログラムコード手段は、プロセッサ手段の一例である。
【0025】
図1は、本発明にかかるプロセッサプラットフォーム10の特定の実装を示すブロック図である。このプロセッサプラットフォームは、クローズキャプションアナライザ12と音響ストリームアナライザ14を実装している。クローズドキャプションアナライザは、従来の音響/ビデオテレビジョン信号からのクローズドキャプションストリームを受信して処理するように構成されている。ここに使用されているように、「クローズキャプション」は、音響信号のテキストの表現を規定する信号を意味する。音響信号は、アナログまたはデジタルであり、コード化されていても良く、ビデオ信号を伴うものであっても良い。クローズキャプションは、文字、スペース、単語、フレーズ、およびシンボルを具えていても良い。デジタル環境において、クローズキャプショニングは、さらに、データパケット、ネットワークコマンド及びリンク、及びその他のデータを具えていても良い。一の特別な例では、クローズキャプションは、EIA−608、あるいはEIA−708B、あるいは関連するクローズキャプション企画に合致する信号を意味する。クローズキャプショニングは、アナログ又はデジタルのテレビジョン放送伝送、ケーブル、サテライト伝送、また、保存されている音響信号と対応させた、DVDs、その他といった保存されているメディアソースから伝送されたもの、に設けることができる。典型的には、アナログテレビジョン信号用には、クローズドキャプションストリームは、テレビジョン信号の垂直帰線消去インターバル(VBI)に見られるライン21データ領域に存在する。プロセッサプラットフォーム10は、従来のクローズキャプションデコーダを具えている。クローズキャプションアナライザは、復号されたクローズキャプション信号を受信するように構成されている。しかしながら、デコーダ付のクローズキャプションアナライザに構成しても良い。デジタルテレビジョン信号はVBIをもっていないので、デジタルテレビジョン信号用にはクローズキャプショニングはVBIには設けられていない。そうではなく、クローズキャプショニング信号は、コード化したデジタルテレビジョン信号に多重化されている。デジタルテレビジョン信号用に、デジタルテレビジョン受信機プラットフォームによってクローズキャプショニングを抽出することができる。
【0026】
クローズドキャプションアナライザは、また、特定のユーザによって同定される問題になる単語のリストを受信するように構成されている。ユーザは、オンスクリーン選択プロセスを介して問題になる単語を選択することができ、これによって、問題になる可能性のある全単語リストから、様々な問題になる単語をユーザが選択することができる。テレビジョンベースの実施例では、本発明によって構成された、テレビの遠隔コントロール、セットトップボックス、受信機、その他を介してユーザが特定の問題になる単語を操作して選択する、問題になる単語のリスト付きのオンスクリーンメニュを提供することができる。代替的に、ユーザは、キーボードや、アルファベットのオンスクリーンディスプレイと共に使用される遠隔コントロールの矢印キーなどのその他のテキスト入力デバイスなどによって、問題となる単語を直接入力することもできる。
【0027】
「問題となる単語」のほかに、本発明の実施例は、あらゆるテキストの再生を検出及び制御するように構成することができる。クローズドキャプションアナライザ12は、クローズドキャプションストリーム内の各単語をユーザによって同定された問題になる単語のリストと比較する。クローズドキャプションストリームの単語と、問題になる単語の間に合致があったと同定されると、問題になる単語のリストが音響ストリームアナライザ14に転送される。
【0028】
問題となる単語のリストは、本発明の特別な実装に応じて、同定された問題となるテキストのみ、問題となるテキストと先行するテキスト、あるいは問題となるテキストとフラッグの付いた前のテキストを伴うクローズキャプションストリーム全体、のいずれかを含んでいても良い。ここに使用されているとおり、「テキスト」の用語は、文字、単語、スペース、フレーズ、シンボル、および制御コードなど、クローズキャプションストリームのいずれかの成分を意味する。この単語リストは、クローズキャプション単語オーディオタイザ16へ送られ、このオーディオタイザは、以下に述べるように、このテキストを更に処理して、音響信号または音響信号の比較フォームとの比較が可能であり、音響エクイバレントとしていくつかのフォームで引用されているテキストフォームを生成する。その他の処理エレメントトが付いている場合、オーディオタイザは、別の処理エレメント、テレビジョンプロセッサの機能部分、クローズキャプションアナライザ、または、音響ストリームアナライザであっても良い。本発明の図1の実施例の機能部品をより詳しく説明するために、別に示す。
【0029】
音響ストリームアナライザ14は、アナログ又はデジタルテレビジョン信号の音響部分などの音響ストリームを受信するように構成されている。音響ストリームアナライザ14は、音響ストリームがデジタルフォーマットになっていない場合に、音響ストリームをデジタル化するためのアナログ−デジタル変換素子を具えていても良い。音響ストリームアナライザは以下に詳細を示すように、デジタル化した音響ストリームを、クローズドキャプションアナライザで同定した問題となる単語のリストと比較する様々なアルゴリズムを処理するように構成されており、音響ストリーム中の問題となる単語の再生を制御する。いくつかの実装においては、再生ステップは、問題となる単語をミュートするステップを具えている。ミュートステップは、問題となる単語の音響信号がブランクとなるか、振幅あるいは大きさが減衰するかした変形音響ストリームを定義するステップ、連続した処理エレメントが問題となる音響を読み取ってミュートする音響ストリーム中に埋め込まれたミュートコマンドで、問題となる単語を同定するステップと、問題となる単語の音響バージョンを含まないように音響表示と同期したミュートコマンドを発生するステップと、によって実行される。以下の議論は、クローズドキャプションアナライザと音響ストリームアナライザが音響信号の問題となる単語の再生制御に関連して機能する、様々な方法を述べている。クローズドキャプションアナライザ12と音響ストリームアナライザは、同じプロセッサでコード化しても、別のプロセッサでコード化しても良く、様々なハードウエア構成で規定することができる。
【0030】
図2は、本発明による、問題となる単語をミュートするなどの、音響表示の演奏を制御する一の方法を記載したフローチャートである。上述したとおり、クローズドキャプションアナライザは、垂直帰線消去インターバルのライン21におけるクローズドキャプショニングを有する標準アナログテレビジョン信号である、音響表示からクローズドキャプションストリームを受信する(動作200)。本発明の一の実施例では、クローズドキャプショニングストリームは、関連する音響ストリームの前に、あるいは関連する音響ストリームと同時発生的に受信される。次いで、クローズドキャプションアナライザが、問題となる単語のリストのクローズドキャプションストリームをサーチする(動作210)。問題となる単語は、ユーザ/視聴者によって同定され、クローズドキャプションアナライザと通信するメモリに保存される。クローズドキャプションテキスト中の問題となる単語を同定すると、クローズドキャプションアナライザが問題となる単語とその問題となる単語に先行する単語を音響ストリームアナライザに送信する。例えば、映画「風と共に去りぬ」では、クラークゲーブルがヴィヴィアンリーに、「Frankly Scarlett, I don’t give a damn」という。ユーザがこの単語「damn」が問題となると表示している場合、この単語「damn」は問題となる単語のリストに保存される。上記の引用のクローズドキャプショニング信号がクローズドキャプショニングアナライザで受信されルートワード「damn」は現ユーザにとって問題となるものであると認識され、この単語「damn」が先行する単語「a」と共に、音響ストリームアナライザへ送信される。
【0031】
問題となる単語(最初は、テキストフォームで)を音響ストリームと適正に比較するために、問題となるテキストと、先行するテキストが、音響信号との比較用フォームに変換される(動作220)。一の実装では、オーディオタイザにおいて、この先行するテキストと問題となるテキストとが、テキストを音声表示に変換する文字から音へ(letter-to-sound)のアルゴリズムで処理される。この音声表示は、その後、テキストの平均的なあるいは典型的な期間と、テキストの音響エクイバレントを提供する単語に対する様々な周波数帯における、典型的なトータルエネルギィと特定のエネルギィの表示によって特徴付けられる。クローズドキャプショニングテキストが処理されるのと同時に、あるいは好ましくはクローズドキャプショニングテキストの処理に続いて、音響ストリームも比較用フォームに処理される(動作230)。以下に述べる一例では、音響ストリームを処理して、トータルエネルギィと、音響ストリームの時間インターバルを分離するための特定の周波数帯域の特定のエネルギィを決定する。クローズドキャプショニングテキスト処理と、音響ストリーム処理は、クローズドキャプションテキストと、比較の対象となるフォーマットにした音響ストリームを表している。
【0032】
問題となる単語のテキストと先行する単語のテキストと、音響ストリームが同じフォーマットで表示されると、音響ストリーム中の問題となる単語が同定される(動作240)。このように、問題となるテキストが音響ストリーム中の特定の音響シーケンスと合致する。合致が、音響ストリームを伴う問題となるテキストと先行するテキストの間で同定されると、ミュートコマンドまたはその他のミュート処理が生じ、音響ストリームと関連するテレビジョンプロセッサが問題となる音響をミュートする(動作250)。したがって、図2について記載した方法によれば、テレビジョンあるいはその他のオーディオデバイスまたはオーディオ/ビジュアルデバイスが、一般的にミュートされた問題となる単語、フレーズ、音響を伴う音響シーケンスを演奏することができる。ここで使用されているように、「ミュート」という用語は、オーディオシーケンスの音量が低減された状態を意味し、ゼロにする必要はない。本発明のいくつかの実施例では、音響シーケンス中のミュートされた単語またはフレーズが可聴であるが、ミュートされた単語の音量は、隣接する単語より低い。
【0033】
図3は、クローズドキャプションテキストを分析して、クローズドキャプションテキストがユーザによって問題になると同定された単語あるいはフレーズを含んでいるかどうかを確かめるための一の特定の方法を記載したフローチャートである。本発明の一の特定の実装においては、問題となる単語の選択プロセスにおいて、ユーザは、音響表示から排除する特定の単語、および音響表示から排除する原因となる単語(root words)を選択するようにしても良い。問題となるルートワードは、ルートワードフィルタリストに保存されている。「ルートワード」とは、一般的に、「damn」などの所定の問題となる単語のことであり、「damnit」や「***damnit.」といった、問題となる単語およびフレーズのホスト中のルートワードであっても良い。ルートワードフィルタリストを用いて、ルートワードを含むあらゆる単語がフィルタにかけられ、表示の音響部分から除去される。完全な問題となる単語は、除外単語リストに保存されている。
【0034】
ユーザは、様々なメカニズムを介して問題となる単語を選択することができる。一の実装では、オンスクリーン選択メニューが、例えばテレビジョンモニタなどのスクリーン上に表示されている。このメニューは、ユーザがオンスクリーンメニューと通信するように構成された遠隔コントロールを用いて選択するであろうたくさんの潜在的な問題となる単語とフレーズを、単独であるいは組み合わせて、含んでいる。このメニューは、問題となる単語のグループ分けとレベル分けを具えていても良い。
【0035】
図3を参照すると、クローズキャプションアナライザは、クローズドキャプショニングテキストストリームをルートワードと比較する(動作300)。比較は、単語ごとに、各々が受信されるときにシリアルに実行することができる。また、この比較は、セグメントごとにクローズキャプションストリーム上で実行することもできる。クローズキャプショニングテキストの開始と終端は、クローズキャプションセグメントを表示するべきかを表示するマーカを具えている。本発明の実施例は、これらのマーカの間に生じるテキストのセグメントを分析するように構成することもできる。クローズキャプショニングストリーム中のテキストが問題となるルートワードを有している場合、このルートワードを含むテキストが、先行する単語と共に問題になるとしてフラッグがつけられる。次いで、クローズドキャプショニングストリームが、排除単語フィルタリストと比較される(動作310)。あらゆる問題となるテキストと先行するテキストにフラグがつけられる。以下により詳細に説明するように、問題となるテキストに先行するテキストは、ミュートの開始(すなわち、問題となる単語に先行する単語のオーディオシーケンスの端部がミュートの開始である)を同定するのに使用することができる。フラッグをつけるのに加えて、先行する単語を、ついで、問題となる単語を先入れ先出しバッファ(FIFO)にロードすることもできる。先行する単語、次いで問題となる単語がFIFOの順に処理され、比較フォームになる。先行するテキストを伴う音響に合致があった場合、それは放棄される。次いで、問題になるテキストに合致があった場合、それが放棄される。したがって、クローズキャプションと関連する音響との間の順次の時間的関係によって、クローズキャプション中の単語の同定から、音響のミュートへ、FIFOの順に動作が行われる。
【0036】
いくつかの実装では、ルートワードからあるいは排除単語リストからの問題になるテキストを更に分析して、使用のコンテキストに基づいて、実際に単語が許可されるか、問題となるかを決定する(動作330)。例えば、「bitch」という単語は、犬について議論するコンテキストでは使用可であるかもしれないが、その他では不可である。可能か否かを決定するために、一の実装では、その単語の使用のコンテキストをたしかめるために、クローズキャプションフレーズ中のその他のすべての単語について比較がなされる。例えば、「dog」という単語が同じフレーズに示されていれば、この単語は使用可能であり、問題となるとは認定されない。その他の方法が、2004年10月23日に出願された米国暫定特許出願第60/481,548号「メディアコンテントに関連する情報に基づくペアレンタル制御フィルタセッティング」に記載されている。この出願は、ここに引用によって含まれている。
【0037】
合致がない場合は、プロセッサが、クローズドキャプショニングストリームの端部が検出されたか否かを決定する(動作340)。上述したとおり、クローズドキャプショニングストリームは、通常、クローズドキャプションセグメントの開始とクローズドキャプションセグメントの終端のインディケータを含んでいる。上述した例では、クローズドキャプショニングセグメントが「Frankly Scarlett, I don’t give a damn」というフレーズを具えている。この音響セグメント用のクローズドキャプショニングテキストは、「Frankly」という単語に先行するインディケータと、「damn」という単語に続くインディケータを含むことになる。フレーズの終端が検出されたら、テキストバッファとストリームミュートアナライザが空になり、音響表示からの問題になる単語が提供される。単語ごとのFIFO構成では、動作340は実装されない。フレーズの終端が検出されない場合は、上述したルートワードリストと排除する単語リストに対して次の単語が分析される。
【0038】
図4は、本発明の一の実装を示すフローチャートであり、ここでは、問題となるクローズドキャプショニングテキストと先行するテキストが、文字ごとのベースで、問題となるテキストを提供するプロセスの一部として、音響エクイバレントとして音声表示に変換される。図4に示すフローチャートの特別な例では、文字から音へのアルゴリズムを用いて、先行するテキストと問題になるテキストのテキスト表示を音声表示に変換する。様々な文字から音へのアルゴリズムを使用することができる。一の例では、音声表示が、スペース用カテゴリ、母音、二重母音、半母音用カテゴリ、ストップ用カテゴリ、鼻音用カテゴリ、摩擦音、ささやき、破擦音用カテゴリ、の5つの主カテゴリに分けられている。
【0039】
第1の動作では、テキストを分析して、このテキストがスペースを含むかどうかを決定する(動作400)。スペースは、延長したサイレンスあるいは会話に関連する特性の欠如によって決定することができる。文字から音へのアルゴリズムが、テキストがスペースを含んでいると決定し場合、「−」が割り当てられる(動作405)。次いで、テキストを分析して、テキストが母音、二重母音、または半母音を含むかどうかを決定する(動作410)。通常、母音、二重母音及び半母音は、低周波数の高エネルギィレベルで特徴づけられる。一例は、母音「a, e, i, o, u」と、「ou」「ow」「oi」などの文字の組み合わせ、および半母音「w, l, r およびy」を具えている。更に、母音、二重母音、半母音は、「beet」という単語に見られる「ee」の周波数の高い母音や、「boot」の単語中の「oo」といった周波数の低い母音に分けることができる。文字から音へのアルゴリズムが、単語を構成している文字が母音を含むかどうかを決定する場合は、「V」が割り当てられる(動作415)。次いで、先行するテキストまたは問題となるテキストを分析して、このテキストがストップを含むかどうかを決定する(動作420)。ストップは、バースト音が続いて口が全体的に閉じる間の短い期間によって特徴づけられる。一例では、p、t、kなど無声ストップが、b、d、gなどの有声ストップと区別される。文字から音へのアルゴリズムが、単語の文字がストップを含んでいるかを決定した場合は、「S」が割り当てられる(動作425)。次いで、先行するテキストあるいは問題となるテキストが分析され、鼻音を含むかどうかを決定する(動作430)。鼻音は、通常、m、n、ngの発音に見られるように、口ではなく鼻腔からの周波数の低い音として特徴付けられる。文字から音へのアルゴリズムでテキストが鼻音を含むと決定すると、このテキストは「N」が割り当てられる(動作435)。最後に、先行するテキストまたは問題となるテキストを分析して、摩擦音、ささやき、破擦音を含んでいるかどうかを決定する。摩擦音、ささやき、破擦音は、より高い周波数で集中したエネルギィで特徴づけられ、v、ph、z、zh(「azure」にあるように)、f、s、sh、j、ch、およびhの文字に関連する音にあるように、圧縮されたパッセージから息を押し付けることによって生じる。文字から音へのアルゴリズムが、テキストが摩擦音、ささやき、破擦音を含むと決定した場合は、このテキストは「F」に割り当てられる(動作445)。各単語は、完全に特徴づけられ、したがって、動作450では、アルゴリズムがその単語が完全であるかどうかを決定する。完全でない場合は、最初の動作400から始めて、分析を続ける。
【0040】
文字から音へのアルゴリズムによる先行するテキストと問題となるテキストの分析は、フレーズまたは単語に、記識別子、すなわち、―、V、S、NおよびF、のうちの一つを割り当てる。「Frankly Scarlett, I don’t give a damn」というフレーズは、シンボルストリングに変換される。先行する単語「a」は、識別子「V」を含み、その後にスペース識別子が続き、次いで、「damn」の単語がシンボルS、VおよびNで同定される。ここで、Sは、文字「d」のストップを表し、Vは母音「a」を表し、Nは鼻音「mn」を表す。
【0041】
図5は、クローズドキャプショニング信号から同定された問題になるテキストの比較フォームに対する比較を準備する際に音響信号を分析あるいは処理する一の方法を示すフローチャートである。まず、音響ストリームアナライザは、デジタル化した音響信号とセグメントを受信し、音響信号を一連の20ミリ秒部分に分ける(動作500)。アナログまたはデジタル化した時間信号の各20ミリ秒部分は、以下で、「スピーチスライス」とよぶ。音響ストリームアナライザは、各スピーチスライスのトータルエネルギィを計算する(動作510)。一の例では、時間スライスのトータルエネルギィは、平均信号強度を標準化するための長期間のエネルギィ平均によって標準化された振幅の2乗の和である。更に、スピーチスライスの様々な周波数帯域のエネルギィが決定される(動作520−540)。一例では、音響アナライザが、150〜1500Hzの周波数帯で(動作520)、1500〜3000Hzの周波数帯で(動作530)、および3000Hz以上の周波数帯で(動作540)のスピーチスライスのエネルギィを決定する。一の例では、各周波数帯の測定値が標準化され、全エネルギィのパーセンテージとなる。このようなエネルギィの決定は、高速フーリエ変換などで、デジタルフィルタリングを行い、次いで、周波数帯域を決定するために加算することによって行われる。代替的に、バンドエネルギィの代わりに、ケプストラム係数によるアプローチを用いることもできる。
【0042】
トータルエネルギィと周波数帯のエネルギィを決定することは、クローズドキャプショニングテキストに関して決定されたスピーチサウンドのカテゴリ(すなわち、―、V、S、N、及びF)を区別するための十分な情報を捕らえる4つの明確な特徴を提供する。スピーチサウンドは、エネルギィの4つの番号の単一の表示ではなく、その音を含む時間インターバルを越えた各時間スライスを表す、一連の4つの番号のエネルギィ表示である。
【0043】
図6は、ミュートが生じるべきときを決定するために、先行するテキストと問題になるテキストの比較フォームを音響ストリームの比較フォームと比較する一方法を記載したフローチャートである。テキストと音響信号を適正に比較するために、テキストを更に処理して、テキストの音声シンボル表示を音タイプの平均持続時間へ延長し、音の正しいエネルギィ特性に関連させる。上述したとおり、音響信号は20ミリ秒のタイムスライスに分けられ、各20ミリ秒のタイムスライスは、トータルエネルギィと、3つの特定の周波数帯のエネルギィによって特徴付けられる。このように、音響信号は、時間とエネルギィによって広く特徴づけられる。したがって、先行するテキストと問題になるテキストの音声表示は、さらに音響信号と比較する目的で、時間とエネルギィによって特徴付けられる。
【0044】
まず、先行するテキストと問題になるテキストの音声表示は、音タイプの平均持続時間と関連するべく延長された時間である(動作600)。各音タイプの平均持続時間は、実験によって決定することができる。例えば、母音が平均160ミリ秒であれば、8つの20ミリ秒のタイムスライスを繰り返す。時間を延長する動作中に、各シンボルは、そのシンボルの平均持続時間を越えて延長される。このようにして、母音は160ミリ秒に延長される。例えば、音声には「V」として表示される「damn」中の「a」は、160ミリ秒に延長されるであろう。
【0045】
各音声表示用の時間長に加えて、各音声表示は、トータルエネルギィ値にも、音響信号の同じ周波数帯のエネルギィ値(すなわち、150−1500Hz、1500−3000Hz、及び3000Hz以上)にも関連している(動作610)。一例では、各音声シンボル用に、典型的なエネルギィ値のマトリックスが、所定の時間インターバルを超えて提供されている。したがって、例えば、平均160ミリ秒の母音に対して、エネルギィマトリックスは、160ミリ秒の範囲を超えたエネルギィ値に与えられる。このマトリックスあるいは「テンプレート」は、様々なシンボルの異なる発音の実験と、音声シンボルに存在する文字とによって各音声シンボルに発展する。このように、マトリックスは各音声シンボルについて多くの異なる音表示を含んでいても良い。このマトリックス技術は、Computer-Oriented Approaches to Pattern Recognition, Academic Press, 1972、のMeiselによる「Cluster Analysis and Unsupervised Learning」に記載されている。この文献は、ここに引用されている。
【0046】
クローズドキャプションテキストが比較フォームである場合、音響ストリームの比較フォームと比較される(エネルギィ値で)(動作620)。合致がある場合(動作630)、先行するテキストの終端が続く音響ストリーム中にミュートコード又はコマンドがセットされる(動作640)。合致した先行テキストの表示上のミュートは、本発明の3つの異なる構成において実行することができる。一の構成では、先行するテキストの後端の検出と同時に音響アナライザがミュートコマンドを出す。ミュートコマンドによって音響が一瞬ミュートされる。このコマンドが音響ストリームに比較して所定の潜在期間を有する場合、様々な潜在期間メカニズムを用いて、コマンドを十分に遅らせて、音響ストリームを実際の演奏と同期させるようにする。もう一つの構成では、音響ストリームを変調して、先行するスピーチの後端が続く音響データがブランクになるか、減衰されるか、するようにする。ブランキングまたは減衰は、問題になるテキストの後端が検出されるまで続く。最後に、第3の代替では、デジタルコマンドを音響ストリーム中の先行するテキストと問題になるテキストの間に挿入することができる。音響ストリーム中にミュートコマンドを検出すると、デジタル化された音響ストリーム中に挿入されたミュートコードに従って、音響が瞬間的にミュートされる。
【0047】
先行するテキストを比較した後、問題になるテキストの音響比較フォームが音響ストリームの比較フォームと比較される(動作650)。合致が検出されると(動作660)、問題になる言語の後端において第2のミュートコード又はコマンドが発せられる(動作670)。問題になる言語の後端で、音響をミュートするコマンドを出す実施例では、正常の音量で音響を再度演奏するコマンドを出す、すなわち、そのミュートを不可能とする。デジタル化した音響ストリームが減衰される、あるいはブランクになる実施例では、問題となる単語の後端が検出されると、ブランキング動作または減衰動作が停止され、音響ストリームはもはや変更されない。最後に、デジタル化した音響ストリーム中に複合コマンドを使用する実施例では、続く非ミュートコマンドが、問題となる単語の端部の後ろの位置で音響ストリーム内に挿入される。
【0048】
図7は、先行するあるいは問題になるテキストの比較フォームを音響ストリームの比較フォームと比較する一の方法を示すフローチャートである。第1の動作は、テキストの比較フォーム(予測信号)と、音響信号の比較フォーム(観察信号)間の時間アラインメントを含む(動作700)。特別な一の実装では、時間アラインメントが、一般的にダイナミック時間ワーピング(dynamic time-warping)として呼ばれている広く認識されたテンプレートを合致させる会話認識システムによって実行される。
【0049】
図8は、ダイナミック時間ワーピングアルゴリズムに基づく、観察信号と予測信号間の時間アラインメントの一例を示す図である。図4、および図6の動作600と610で述べた方法によって予測信号が発生する。観察信号は、本明細書で図5を参照に述べた方法に基づいて発生する。上述したとおり、観察信号は、トータルエネルギィと、150−1500Hzの周波数帯域のエネルギィ、1500−3000Hzの周波数帯域のエネルギィ、3000Hz超の周波数帯域のエネルギィを含む、一連の4次元ベクトルである。更に、4次元ベクトルは各々20ミリ秒のスライスを具える。図8に示す例では、14個の20ミリ秒のタイムスライスと、関連する4次元ベクトル(×1-×14)がある。ダイナミック時間ワーピングアルゴリズムは、予測した値と観察した値間の合致を調べる「スコア」の使用を介して、予測した一連の信号(−FFFVVVVVVVNN)の観察した信号に対する最良の合致を、合致の最良の方法を決定するトータルスコアを用いて見出す。このダイナミック時間ワーピングアルゴリズムはまた、一の予測した値をあまりに多くの実際の値の上に「引き伸ばし」たりしたくない、又その逆を起こしたくないという要望を考慮に入れている。その結果、上述の予測値インターバルと実際の値のインターバルとが合致する最良の割り当てとなろう。そうであれば、このアルゴリズムは、先行するテキストを合致させている場合に、例えば、先行するフレーズなどの合致されるフレーズが観察信号スライス×14にて終了すること、及び、その時間スライスの後にミュートが開始すべきであることを予測する。したがって、処理を行っている間に、先行するテキストの終了が検出された場合、ここに述べた様々な方法のいずれかによって、ミュートが開始される。例えば、エラー、雑なトランスクリプション、あるいは過剰なバックグラウンドノイズなどで、音響がスピーチに合理的に合致しない場合は、スコアは、合致が貧弱であることを表示し、スコアに基づいては何のアクションも取られないであろう。
【0050】
時間アラインメントの一部として、単一の観察した時間セグメント(4つの特長値を持つ)と、例えば、母音(V)などの5つの音声カテゴリの一つによって特徴付けられた予測した時間セグメントとの合致を比較することによってスコアが作られる。テキストを音響エクイバレントに変換することに関して前述したように、一のオプションは、例えば、展開フェーズの間にそのカテゴリの典型的な例を平均化することによって、各特長の「典型的な」値を有することである。これによって、そのスコアは観察した値に対する典型的な値の最良の合致となる。この合致は、単純な「距離」の測定、つまり各特長の2乗残差法によって測定できる:距離の二乗を与えるためのベクトル表示は‖Xobserved −Xtarget。合致が正確であれば、スコアはゼロになる。最良の合致は、最小のトータルスコアのカテゴリに入る。変形例は、この特徴に別々に重み付けすることである。例えば、それによって性能が改善するのであれば、各周波数帯域のエネルギィ以上にトータルエネルギィに重み付けするなどである。上述したとおり、スピーチの各カテゴリィに、一以上の典型的な例(テンプレート)がある場合、スコアはそのカテゴリ中のすべてのテンプレートについて最小である。
Mini[‖Xobserved −Xtarget-i]
要約すると、スコアリング機能の選択とそのスコアリング機能を用いるためのダイナミック時間ワーピングなどのアルゴリズムによって、いつフレーズが終了するかを決定するためのアルゴリズムが特定される。
【0051】
本発明の代替の実施例は、クローズキャプション信号の分析を含まない。むしろ、音響信号が受信され、メモリに保存される。この保存された音響信号を、スピーチ認識アルゴリズムで処理する。このようなスピーチ認識アルゴリズムは、音響信号を分析するにあたって、振幅、周波数、波長、および様々なそのほかのファクタを考慮する。スピーチ認識アルゴリズムによって同定される、各単語、フレーズ、その他は、ユーザによって同定された問題となる単語と、及び/又は、ユーザによって同定された問題になるルートワードと比較される。合致した音響シーケンスは、保存した信号セグメントの動作、あるいは保存した信号に埋め込まれているミュートコードによってメモリ内で直接減衰する。
【0052】
音響信号が話し単語とその他の音、すなわち、バックグラウンドノイズ、音楽、周辺ノイズなどのその他の音を含む場合、様々なフィルタリング技術を用いて、話し単語をその他の音から分離するようにしても良い。更に、例えば、センターチャネル、フロントチャネル、リアチャネル、などの多重トラックの音響信号に対しては、各音響トラックを別々に分析することができる。通常、中央チャネルはマルチチャネル音響信号中の話し単語のほとんどあるいはすべてを含む。したがって、中央チャネルのみを分析すれば十分なことがある。
【0053】
本発明の実施例は、様々なコンピュータハードウエアを具える特定目的のあるいは汎用目的のコンピュータ、テレビジョンシステム、音響システム、及び/又は、これらの組み合わせを具えていても良い。これらの実施例は、上記に詳細に述べられている。しかしながら、すべてのケースにおいて、上述の実施例は、本発明の範囲を限定するものではなく、例示であると考えるべきである。
【0054】
本発明の範囲内の実施例も、コンピュータで実行可能な命令またはコンピュータに保存されたデータ構造を搬送するあるいは有するためのコンピュータで読み出し可能な媒体を具えている。このようなコンピュータで読み出し可能な媒体は、テレビジョン、セットトップボックス、その他の処理エレメントなど、一般目的あるいは特別な目的のコンピュータによってアクセスすることができるあらゆる入手可能な媒体であっても良い。限定ではなく例示としての、このようなコンピュータで読み出し可能な媒体は、RAM、ROM、EEPROM、CD−ROM、DVD、あるいはその他の光ディスクストレージ、磁気ディスクストレージ、あるいはその他の磁気ストレージデバイス、又は、コンピュータで実行可能な命令またはデータ構造の形式の所望のプログラムコード手段を搬送または保存するのに使用することができ、一般目的あるいは特別な目的のコンピュータでアクセス可能なその他のあらゆる媒体を具える。情報がネットワークまたはその他の通信リンク又はコネクション(ハードワイヤ、無線、あるいは、ハードワイヤと無線の組み合わせのいずれか)を介してコンピュータに転送される、あるいは提供される場合、このコンピュータはコンピュータで読み取り可能な媒体としての接続を適正に見ている。したがって、このようなコネクションもすべて、適正に、コンピュータで読み出し可能な媒体と呼ばれる。上述した媒体の組み合わせも、コンピュータで読み出し可能な媒体の範囲に含まれる。コンピュータで実行可能な命令は、例えば、一般的な目的のコンピュータ、特別な目的のコンピュータ、あるいは特別な目的の処理デバイスにある機能、又は機能群を実行させる命令およびデータを具える。
【0055】
図1と、それに関連する記載は、本発明を実装することのできる好適なコンピュータの今日の簡単で一般的な記載を提供することを意図したものである。要求されているわけではないが、本発明は、テレビジョンプロセッサなどの一またはそれ以上の処理エレメントで実行されるプログラムモジュールなど、コンピュータで実行可能な命令の一般的なコンテキストで説明されている。一般的に、プログラムモジュールは、特定のタスクを実行するあるいは特定の抽象データ型を実装する、ルーチン、プログラム、対象、コンポネント、データ、構造、その他を有する。コンピュータで実行可能な命令、関連するデータ構造、およびプログラムモジュールは、ここに記載されている方法のステップを実行するためのプログラムコード手段の例を示すものである。このような実行可能な命令あるいは関連するデータ構造の特定のシーケンスは、このようなステップに述べられている機能を実装するための対応する行為の例を示すものである。更に、処理ユニットで実行されているプログラムコード手段は、プロセッサ手段の一例を提供するものである。
【図面の簡単な説明】
【0056】
【図1】図1は、本発明の一の処理アレンジメントを示すブロック図である。
【図2】図2は、特定のテキスト用に対応するクローズキャプション信号をモニタし、次いで、特定のテキストに対応する音響信号の一部を同定することによって音響信号の再生を制御する本発明による一の方法のフローチャートである。
【図3】図3は、クローズキャプション信号が本発明に合致する特定のテキストを含んでいるかどうかを決定するクローズキャプション信号をモニタする方法を示すフローチャートである。
【図4】図4は、クローズキャプションストリームのテキストに文字−音アルゴリズムを適用して、本発明に合致するテキストの音声表示を決定する方法を示すフローチャートである。
【図5】図5は、本発明に合致するエネルギィ値を割り当てるための音響信号の時間セグメントを分析する方法を示すフローチャートである。
【図6】図6は、本発明にかかる、音響信号のある部分をミュートすることによるなどして、音響信号の再生を制御するために、クローズキャプション信号のテキストの比較フォームを音響信号の比較フォームと比較する方法を示すフローチャートである。
【図7】図7は、本発明にかかるクローズキャプション信号の比較フォームを音響信号の比較フォームと比較する方法を示すフローチャートでる。
【図8】図8は、本発明にかかる、クローズキャプション信号のテキストの比較フォームを、音響信号の比較フォームに整列させて比較するための時間アラインメントとスコアリングルーチンを図に示したものである。

【特許請求の範囲】
【請求項1】
音響信号の演奏を制御する方法において:
クローズキャプション信号を受信するステップと;
特定のテキストについての前記クローズキャプション信号を分析するステップと;
前記特定のテキストを同定するステップと;
前記クローズキャプション信号から前記特定のテキストを同定する機能として音響信号を分析するステップと;及び
前記特定のテキストに対応する音響信号の再生を制御するステップと;
を具えることを特徴とする方法。
【請求項2】
請求項1に記載の方法において、前記再生を制御する動作が更に、前記クローズキャプション信号の特定のテキストに関連する音響信号の部分を減衰させるステップを具えることを特徴とする方法。
【請求項3】
請求項1に記載の方法において、前記再生を制御する動作が、更に、前記クローズキャプション信号の特定のテキストに対応する音響信号の部分を実質的に削除するステップを具えることを特徴とする方法。
【請求項4】
請求項1に記載の方法において、前記再生を制御する動作がさらに、前記クローズキャプション信号の特定のテキストに関連する音響信号の部分の減衰を生じさせるように構成された少なくとも一つのコマンドを発生するステップを具えることを特徴とする方法。
【請求項5】
請求項1に記載の方法において、前記再生を制御する動作がさらに、前記音響信号中に少なくとも一の制御コードを挿入するステップを具え、当該制御コードが前記クローズキャプション信号の特定のテキストに関連する音響信号の部分の減衰を生じさせるように構成されていることを特徴とする方法。
【請求項6】
請求項1に記載の方法が更に、前記特定のテキストを前記特定のテキストの音声表示に変換する動作を具えることを特徴とする方法。
【請求項7】
請求項6に記載の方法が更に、前記特定のテキストの音声表示を時間延長して、前記特定のテキストの時間延長した音声表示を規定するステップを具えることを特徴とする方法。
【請求項8】
請求項7に記載の方法が更に、前記特定のテキストの時間延長された音声表示の少なくとも一のエネルギィ値を決定して、前記特定のテキストの比較フォームを規定するステップを具えることを特徴とする方法。
【請求項9】
請求項8に記載の方法が更に、前記音響信号の比較フォームを規定するための前記音響信号の少なくと一のエネルギィ値を決定するステップを具えることを特徴とする方法。
【請求項10】
請求項9に記載の方法において、前記音響信号を分析する動作が更に、前記特定のテキストの比較フォームを前記音響信号の比較フォームと比較する動作を具えることを特徴とする方法。
【請求項11】
請求項10に記載の方法において、前記比較動作が更に、前記特定のテキストに対応する前記音響信号の一部を同定するステップを具えることを特徴とする方法。
【請求項12】
請求項1に記載の方法において、前記特定のテキストが、スペース、文字、単語、フレーズ、センテンス、制御コード、シンボルを具える群から選択されることを特徴とする方法。
【請求項13】
請求項1に記載の方法において、特定のテキストがユーザによって選択されることを特徴とする方法。
【請求項14】
請求項1に記載の方法において、前記特定のテキストが問題があると考えられるテキストから選択されることを特徴とする方法。
【請求項15】
請求項1に記載の方法において、前記特定のテキストを同定する動作が更に、先行するテキストを同定する動作を具え、当該先行するテキストが前記特定のテキストに時間的に先行していることを特徴とする方法。
【請求項16】
請求項15に記載の方法において、前記クローズキャプション信号から前記特定のテキストを同定する機能として音響信号を分析する動作が更に、前記クローズキャプション信号から前記先行するテキストの同定する機能として前記音響信号を分析するステップを具えることを特徴とする方法。
【請求項17】
請求項16に記載の方法において、前記特定のテキストに対応する音響信号の再生を制御する動作が、前記先行するテキストに対応する音響信号の再生を制御するステップを具えることを特徴とする方法。
【請求項18】
請求項6に記載の方法において、前記特定のテキストを前記特定のテキストの音声表示に変換する動作が、前記特定のテキストに文字から音へのアルゴリズムを適用するステップを具えることを特徴とする方法。
【請求項19】
請求項1に記載の方法において、前記クローズキャプション信号から前記特定のテキストを同定する機能として音響信号を分析する動作が、ダイナミック時間ワーピングアルゴリズムを適用するステップを具えることを特徴とする方法。
【請求項20】
請求項1に記載の方法を実行するように構成された複数のコンピュータで実行可能な命令を具えるプロセッサ。
【請求項21】
請求項6に記載の方法が更に、前記特定のテキストの音声表示用の少なくとも一のエネルギィ値を決定して、前記特定のテキストの比較フォームを規定するステップを具えることを特徴とする方法。
【請求項22】
請求項21に記載の方法が更に、前記音響信号についての少なくとも一のエネルギィ値を決定して、前記音響信号の比較フォームを規定するステップを具えることを特徴とする方法。
【請求項23】
請求項22に記載の方法において、前記音響信号を分析する動作が更に、前記特定のテキストの比較フォームを前記音響信号の比較フォームと比較する動作を具えることを特徴とする方法。
【請求項24】
請求項23に記載の方法において、前記比較動作が更に、前記特定のテキストに対応する音響信号の一部を同定するステップを具えることを特徴とする方法。
【請求項25】
音響信号の演奏を制御する方法において:
クローズキャプションテキスト信号の特定部分を、当該特定部分の音響エクイバレントに変換するステップと;
前記クローズキャプションテキスト信号の特定の部分の音響エクイバレントを、音響信号と比較して、前記クローズキャプション信号の特定した部分に対応する音響信号の部分を同定するステップと;
前記クローズキャプション信号の特定した部分に対応する音響信号の部分の再生を制御するステップと;
を具えることを特徴とする方法。
【請求項26】
請求項25に記載の方法において、前記再生を制御する動作が更に、前記クローズキャプション信号の特定の部分に対応する音響信号の部分を減衰させるステップを具えることを特徴とする方法。
【請求項27】
請求項25に記載の方法において、前記再生を制御する動作が更に、前記クローズキャプション信号の特定の部分に対応する音響信号の部分を実質的に除去するステップを具えることを特徴とする方法。
【請求項28】
請求項25に記載の方法において、前記再生を制御する動作が更に、前記クローズキャプション信号の特定の部分に対応する音響信号の部分の減衰を起こすように構成された少なくとも一のコマンドを発生するステップステップを具えることを特徴とする方法。
【請求項29】
請求項25に記載の方法において、前記再生を制御する動作が更に、前記音響信号中に少なくとも一の制御コードを挿入するステップを具え、当該制御コードが前記クローズキャプション信号の特定の部分に対応する音響信号の部分の減衰を起こすように構成されていることを特徴とする方法。
【請求項30】
請求項25に記載の方法において、前記クローズキャプションテキスト信号の特定の部分を、当該特定の部分の音響エクイバレントに変換する動作が更に、前記クローズキャプション信号の特定の部分を前記クローズキャプション信号の特定部分の音声表示に変換する動作を具えることを特徴とする方法。
【請求項31】
請求項30に記載の方法が更に、前記クローズキャプション信号の特定部分の音声表示を時間延長して、時間を延長した音声表示を規定するステップを具えることを特徴とする方法。
【請求項32】
請求項31に記載の方法が更に、前記時間延長された音声表示の少なくとも一のエネルギィ値を決定して、前記クローズキャプション信号の特定の部分の比較フォームを規定するステップを具えることを特徴とする方法。
【請求項33】
請求項32に記載の方法が更に、前記音響信号の少なくと一のエネルギィ値を決定して、前記音響信号の比較フォームを規定するステップを具えることを特徴とする方法。
【請求項34】
請求項33に記載の方法において、前記比較動作が更に、前記クローズキャプション信号の特定の部分の比較フォームを前記音響信号の比較フォームと比較する動作を具えることを特徴とする方法。
【請求項35】
請求項34に記載の方法において、前記比較動作が更に、前記クローズキャプション信号の特定の部分に対応する前記音響信号の部分を同定するステップを具えることを特徴とする方法。
【請求項36】
請求項25に記載の方法を実行するように構成された複数のコンピュータで実行可能な命令を具えるプロセッサ。
【請求項37】
音響信号の再生を制御する方法において:
少なくとも一の問題になる単語の同定を受信するステップと;
クローズキャプション信号中の前記少なくとも一つの問題になる単語を同定するステップと;
音響信号中の少なくとも一つの問題になる単語を、クローズキャプション信号中の少なくとも一つの問題になる単語を同定する動作の機能として同定するステップと;
を具えることを特徴とする方法。
【請求項38】
請求項37に記載の方法が更に、同定動作の機能として音響信号の音響表示を制御するステップを具えることを特徴とする方法。
【請求項39】
請求項38に記載の方法が更に、前記少なくとも一つの問題になる単語に対応する音響信号の部分の音響表示をミュートするステップを具えることを特徴とする方法。
【請求項40】
請求項38に記載の方法が更に、前記問題となる単語に先行するクローズキャプション信号の部分を同定するステップを具えることを特徴とする方法。
【請求項41】
請求項40に記載の方法において、前記先行する部分がスペース、文字、単語、フレーズ、シンボル、及びクローズキャプション制御信号を具える群から選択されることを特徴とする方法。
【請求項42】
請求項40に記載の方法が更に、クローズキャプション信号中の前記少なくとも一の問題になる単語を同定する動作と、前記問題になる単語に先行するクローズキャプション信号の一部を同定する動作の機能として、音響信号中の少なくとも一の問題になる単語を同定するステップを具えることを特徴とする方法。
【請求項43】
請求項42に記載の方法において、前記制御動作が、前記問題になる単語に先行するクローズキャプション信号の一部を同定する機能であることを特徴とする方法。
【請求項44】
請求項43に記載の方法が更に、音響ストリーム中の問題になる単語に先行する前記クローズキャプション信号の部分を同定する機能として前記音響表示のミュートを行うステップを具えることを特徴とする方法。
【請求項45】
請求項44に記載の方法が更に、前記音響信号中の少なくとも一の問題となる単語を同定する機能として前記ミュートを終了するステップを具えることを特徴とする方法。
【請求項46】
請求項37に記載の方法を実行するように構成されたコンピュータで実行可能な複数の命令を具えるプロセッサ。
【請求項47】
音響表示の再生を制御する方法において:
少なくとも一の問題になる単語の表示を受信するステップと;
音響信号を受信するステップと;
前記音響信号をメモリに保存するステップと;
前記保存した音響信号を処理して、少なくとも一の問題になる単語が前記音響信号中に存在するかどうかを決定するステップと;
前記処理動作の機能として前記音響信号の音響表示を制御するステップと;
を具えることを特徴とする方法。
【請求項48】
請求項47に記載の方法において、前記制御動作が更に、前記少なくとも一の問題になる単語に対応する音響信号の部分を減衰させるステップを具えることを特徴とする方法。
【請求項49】
請求項47に記載の方法において、前記制御動作が更に、前記少なくとも一の問題になる単語に対応する音響信号の部分を実質的に削除するステップを具えることを特徴とする方法。
【請求項50】
請求項47に記載の方法において、前記制御動作が更に、前記音響信号中に少なくとも一の制御コードを挿入するステップを具え、当該制御コードが、前記少なくとも一の問題になる単語に対応する音響信号の部分に減衰を生じさせるように構成されていることを特徴とする方法。
【請求項51】
請求項46に記載の方法において、前記処理動作が更に、前記音響信号の少なくとも一のチャネルを分析するステップを具えることを特徴とする方法。
【請求項52】
請求項47に記載の方法を実行するように構成されたコンピュータで実行できる複数の命令を具えるプロセッサ。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate


【公表番号】特表2007−504495(P2007−504495A)
【公表日】平成19年3月1日(2007.3.1)
【国際特許分類】
【出願番号】特願2006−524879(P2006−524879)
【出願日】平成16年8月26日(2004.8.26)
【国際出願番号】PCT/US2004/027882
【国際公開番号】WO2005/020034
【国際公開日】平成17年3月3日(2005.3.3)
【出願人】(506058392)クリアプレイ,インク. (1)
【Fターム(参考)】