説明

ビデオ信号中にエンコードされたテキストの翻訳

クローズドキャプションまたはその他の種類のエンコードされたテキストデータに基づいて多様な異なる言語および書式が表示できる。ある実施形態では、本発明はエンコードされたテキストデータをもつビデオ信号を受信し、エンコードされたテキストデータをデコードし、デコードされたテキストデータを翻訳し、翻訳されたテキストデータを表示のために当該ビデオ信号のビデオ部分と組み合わせることを含む。


【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ブロードキャストおよびマルチキャストメディアを用いてテキストを呈示する分野に、特にブロードキャストまたはマルチキャストチャネル上で受信される際にエンコードされたテキストを翻訳すること関する。
【背景技術】
【0002】
多くの現行のブロードキャストおよびマルチキャストビデオ信号はテレビまたは他のディスプレイ装置で表示できるテキストを含む。そのような種類のテキストの一つがクローズドキャプション(CC)テキストである。CCテキストは典型的にはビデオ中で話される言葉の転記で、時にはサウンドトラックにほとんど言葉がない部分で説明的な語りが付く。元来は聴覚障害者のためであったが、CCテキストは、バー、レストラン、空港、病院などのような環境ノイズレベル(高くても低くても)が信号の音声部分を聞き取るのを難しくするような状況においても使われる。
【0003】
ビデオ信号に含められるテキストサービスはほかにもある。それには、テレテキスト(TeleText)、シーファクス(Ceefax)、オラクル(Oracle)といったものが含まれ、番組に関するテキスト、電子番組表、ニュース、スポーツおよび非常情報ならびにその他多くの種類の情報を含むことができる。たいていのテキストサービスは現在のところビデオ信号のVBI(vertical blanking interval[垂直帰線期間])にエンコードされている。しかし、MPEG-2(Motion Picture Experts Group[動画像専門家グループ])でエンコードされた信号を含むデジタル信号はまた、信号のオーディオおよびビデオ部分とともにいくらかのテキストデータをも運ぶ構造になっている。
【発明の開示】
【発明が解決しようとする課題】
【0004】
どんなビデオ信号でも、搬送できるテキストの量はエンコードシステムによって制限される。VBIを使うシステムはテキスト搬送には限られた容量しかない。CCテキストはみなVBIの線21上で運ばねばならず、よって各フレームにエンコードできる文字数には制限がある。さらに、送信できるキャラクタの種類および書式は制限され、たとえばアラビア文字やアジアの文字も、大きさやフォントの変更もサポートされていない。TeleTextはより上の機能をもつが、それでも著しく制限されたものである。
【0005】
埋め込みテキスト信号は、何を送るかについての信号の作成者または供給者の決断によっても制限される。たとえば米国では、CCテキストは英語で、そしてしばしばスペイン語でも利用できる。信号の容量と市場の需要から、これ以外の選択の余地はほとんどない。ポルトガル語、アルメニア語、ハンガリー語および他の多くの言語への翻訳は、容量不足と市場の需要のためサポートされていない。中国語、ブルガリア語、タイ語およびヘブライ語への翻訳は、エンコード構造がこれらの、そして他の多くの言語で使われる文字をサポートしないため提供できない。TeleTextおよび他のエンコードテキスト送信システムも同様の拘束を受ける。
【0006】
本発明は、以下に与えられる詳細な記述から、そして本発明のさまざまな実施形態の付属の図面からより完全に理解されるであろう。しかし、図面は本発明を特定の実施形態に限定するものと解釈してはならない。図面は単に説明と理解のためのものである。
【発明を実施するための最良の形態】
【0007】
図1を参照すると、クローズドキャプションまたは他の任意の種類のエンコードされたテキストデータが、ユーザーの選択するいかなる言語にも翻訳できる。まず、エンコードされたテキストデータをもつビデオ信号がブロック13で受信される。このビデオ信号は異なるさまざまなソース、たとえばビデオテープ、ディスクもしくはメモリプレーヤー、ネットワーク接続または放送チューナーのいずれから受信されてもよい。そのようなビデオ信号の一般的なソースの一つが無線およびケーブルメディアを通じたテレビ放送である。そのような信号はエンコードされたテキストをサポートするいかなる種類のものであってもよい。中でも、米国はNTSC(National Television Standards Committee[全国テレビ方式委員会])およびATSC(Advanced Television Systems Committee[高度テレビ方式委員会])規格を採用し、ヨーロッパはPAL(Phase Alternating Line[位相交互線])およびSECAM規格を採用しており、日本はまた別の規格を使っている。
【0008】
エンコードされたテキストは、エンコードされたテキストを送信するためのこれらを含むさまざまな規格で使われる異なる多くのフォーマットに対応している可能性がある。アナログビデオ信号では、エンコードされたテキストは通例、信号のVBI(垂直帰線期間)に対応するラスタ走査線において送信される。CC(クローズドキャプション)、ビデオテックス、TeleText、Ceefax、Oracleおよびその他の規格もVBI中の線を使っている。
【0009】
デジタル信号はまた、各パケットのある部分をテキストデータの送信のために割り当てている。ATSCはクローズドキャプションの用途のために9600bpsのデータレートを割り当てている。これはNTSCシステムの10倍の容量であり、装飾されたテキスト属性、多色、より多くの言語チャンネルおよび他の多くの機能を提供する可能性を開く。HD-SDI(High Definition-Serial Digital Interface[高精細度‐シリアルデジタルインターフェース])クローズドキャプションおよび関係データは、HD-SDIビットストリームの3つの別個の部分において運ばれる。映像ユーザーデータ(Picture User Data)、番組マッピング表(PMT: Program Mapping Table)およびイベント情報表(EIT: Event Information Table)である。キャプションテキストおよびウィンドウコマンドは、HD-SDIトランスポートチャネルにおいて運ばれる(このHD-SDIトランスポートチャネルは今度は映像ユーザービット(Picture User Bits)において運ばれる)。HD-SDIキャプションチャネルサービスディレクトリーはPMTにおいて、そして任意的にEITにおいてケーブルのために運ばれる。
【0010】
使用中および開発中のテキストエンコードシステムはほかにも多数ある。上述したテキストエンコードシステムは例として挙げられたものである。本発明は、受信、エンコード、変調のいずれの仕方にも関わりなく、埋め込まれた、あるいは同時的に送信されるいかなるテキストにも適用可能である。これは、埋め込まれた、および側波帯のテキストデータならびに異なるチャンネル、周波数またはストリームで提供される補足テキストデータを含みうる。
【0011】
ビデオ信号を受信すると、ブロック15で、エンコードされたテキストデータがデコードされる。デコードは通常のCCまたはTeleTextデコーダによって実行でき、これらは広範な異なる発売元から市販されている。あるいはまた、デコーダは一般化されたデジタルデコーダまたはその他のビデオ処理デバイスの一部であることもできる。本発明のNTSCのCCテキストでの実施例については、デコーダはVBIの線21上の信号を読み、その信号を英数文字にデコードする。異なるアナログおよびビデオ規格では適用される慣例も異なってくる。
【0012】
デコード工程の結果は典型的にはビデオに同期された順序付けられたテキスト文字列である。テキストは、ビデオ番組と同じ言語でもよいし(たとえばCCまたはOracleテキスト)、あるいは別の言語でもよい(たとえば字幕)。しかし、いくつかのテキストシステムでは、テキストはビデオとの同期を必要としない、すなわち要求しないことがある。たとえば、テキストがプロスポーツ試合のスコアに関係するものである場合、スコアは現在のビデオのタイミングとは何ら有意な関係をもたないかもしれない。たとえばOracleはビデオサウンドトラックの転記を送信するのに使われるが、TeleTextは本体の映像とは特に関係のない一般的なニュースを提供する。
【0013】
デコードされたテキストデータはブロック17で翻訳される。翻訳の行い方はさまざまである。ある実施形態では、テキストが電子辞書に与えられ、電子辞書がもとの言語の単語を別の言語の単語に置き換える。いかなる言語でも、その言語のための適切な辞書を提供することによって対応できる。ソフトウェア翻訳システムを使うことによって、翻訳の文法、用法、言葉遣いおよびその他のニュアンスを取り入れて翻訳の改善に供することができる。多様なさまざまな翻訳システムのいずれを使ってもよい。この翻訳の結果、別の言語での新規のテキストストリームが生じる。
【0014】
翻訳されたテキストは次いでブロック19でビデオ信号と組み合わせることができる。ビデオとのこの組み合わせは、もとのエンコードされたテキストを新しいテキストで置き換えることでもできるし、あるいはテキストとビデオを組み合わせた完全に新規のビデオ信号を生成してもできる。翻訳されたテキストを表示する方法の選択は、受信機および表示システムの機能を含む特定の用途に依存する。
【0015】
ある別の実施形態では、テキストは翻訳されない。テキストは上記したようにデコードされ、辞書に与えられる。しかし、デコードされたテキストと同じ言語での辞書を与えることによって、辞書はエンコードされたテキストにおける綴り、文法および統辞の誤りを正すのに使われる。ライブ中継やいくつかの低予算制作では、テキストはリアルタイムで、あるいは性急に入力されて、その後編集されない。その場合、辞書を使えば単純な誤りを正すことができる。訂正されたテキストは次いで、図1のブロック19との関連で上記したようにビデオ信号と組み合わされることができる。
【0016】
図2を参照すると、エンコードされたテキストを翻訳する機能のあるチューナーシステム11が示されている。このシステムは単一のアダプターカードすなわちプリント回路基板上に、単一モジュール上に構築されてもよいし、より大きなシステム中の別々の位置からコードでつながれてもよい。そのような例の一つが図3に示されているメディアセンターである。このようなシステムは、テレビまたはビデオディスプレイ、ビデオまたはオーディオレコーダー、娯楽システムへの接続のための独立したチューナーまたは多様なその他の機器のうちいずれであってもよい。
【0017】
図2のチューナーシステム11は一つまたは複数のアナログ、デジタルまたは両者組み合わせのビデオチューナー13を有している。諸チューナーは、ピクチャーインピクチャー視聴または同時的な視聴および録画ができるよう同じタイプのものであってもよいし、異なる種類のソースの受信ができるよう異なるタイプのものであってもよい。チューナーは、ブロードキャスト、マルチキャストまたはポイントツーポイントのいずれであろうと、多様な異なるアナログおよびデジタルテレビまたはビデオ信号のいずれのためのものであってもよい。例として含まれるものには、NTSC、ATSC信号、PAL(Phase Alternating Line)、多様な可能な規格に従うケーブルテレビ信号または他のあらゆる種類のオーディオもしくはビデオ信号がある。
【0018】
今の例では、チューナーはテレビの同軸ケーブル、地上波放送アンテナまたはDBS(Direct Broadcast Satellite[直接衛星放送])アンテナに結合されており、他の構成要素に与えるためにMPEG-2(Motion Picture Experts Group)でエンコードされた信号を生成する。好ましい出力信号が厳密にどのようなものであるかは特定の機器に依存することになる。代替としては、チューナーは、圧縮なしのデジタルまたはアナログビデオ出力信号を生成するためにデコーダを含んでいることもできる。
【0019】
今の例では、チューナー出力信号はクローズドキャプション(CC)デコーダ27に与えられて、同調された信号からデジタル文字列が引き出される。引き出された文字列はCC論理29に送られ、ここでCCテキストを表示すべきかどうか、翻訳すべきかどうかが決定される。この論理はチューナーシステム内にあってもよいし、あるいはシステム中の何らかの別のプロセッサにあってもよい。これらの決定に基づいて、テキストは翻訳エンジン31に送られうる。この翻訳エンジン31がテキストを辞書15に適用する。辞書はCCテキストを置き換えるための、自分の言語での単語、句、表現または転写を提供する。CCテキストの例については、該テキストはしばしば、場面で起こっていることについて情報を中継するための常套句を含む。これらの常套句はうまく翻訳できないことがある。したがって、翻訳の理解可能性を高めるため、CCテキストの常套句のために特別に設計されたカスタム辞書も使うことができる。
【0020】
翻訳されたCCテキストは使用のためにCC論理に送り返される。CC論理、翻訳エンジンおよび辞書はみな同じハードウェアで実装されることもできるし、あるいはシステムの異なる諸部分において実装されることもできる。異なるユーザーのために異なる言語がサポートできるよう、辞書は書き換え可能メモリに保存されていてもよい。こうした通信は単一コンポーネント内で実行されることもできるし、I2C(Inter-IC:フィリップス・セミコンダクターズによって設計されたバスの種類)または他の任意の種類のデータバスといった通信バスを通じて実行されることもできる。
【0021】
同じ種類の翻訳プロセスはオーディオ信号にも適用できる。放送オーディオに補助としてテキストを加えるためのさまざまな規格が提案されており、一部の衛星ラジオシステムはすでに実行している。AM(Amplitude Modulation[振幅変調])およびFM(Frequency Modulation[周波数変調])放送ラジオはPTY(Program Type[番組種別])データを含むRDS(Radio Data System[ラジオデータシステム])テキストを運ぶことができる。このデータに、あるいは他のいかなる埋め込まれたもしくは側波帯データに対しても前記翻訳を適用し、該データを表示する前に抽出して翻訳することができる。
【0022】
上記したRF(Radio Frequency[無線周波数])チューナーの代わり、あるいは追加として、コンポジットビデオチューナーを使用してもよい。そのような機器はシステムがビデオレコーダー、カメラ、外部チューナーまたは他の任意の機器からビデオおよびオーディオ信号を受信できるようにすることができる。この信号は次いでデコーダ27および翻訳エンジン29を通じていかなるビデオまたはオーディオ信号とも同じ方法で処理されうる。このチューナーのために使用できるコネクタは実に多様な異なるものがあり、同軸ケーブルからRCAコンポーネントビデオ、Sビデオ、DINコネクタ、DVI(digital video interface[デジタルビデオインターフェース])、HDMI(High Definition Multimedia Interface[高精細度マルチメディアインターフェース])、VGA(Video Graphics Adapter[ビデオグラフィックスアダプター])およびより多くのものがある。
【0023】
図2にさらに示されるように、CCデコーダは前記ビデオを、オーディオチャンネルがあればそれも含めて、グラフィックコントローラまたはその他のビデオ信号処理デバイスのビデオプレーン17に送る。好適なデバイスの一つは図3のグラフィックコントローラ41であろうが、より高機能または低機能の諸コンポーネントを使ってもよい。前記の翻訳されたCCテキストは、グラフィックプレーン19を通じて同じコントローラに送られる。これらの信号はアルファブレンダー21において組み合わされてビデオデバイスによって表示または保存されることのできる信号が生成される。アルファブレンダーはアルファ値を使ってビデオおよびグラフィックプレーンを混合してメニュー、EPG(Electronic Program Guide)データおよび番組情報を与える。ビデオプレーン、グラフィックプレーンおよびアルファブレンダーの機能は他の多くのデバイスによって実行されることもできる。図2のアーキテクチャは本発明に必須のものではない。
【0024】
混合された出力は、異なるテキストがエンコードされた同じビデオ信号であることもできるし、あるいはビデオ画像の一部として翻訳されたテキストを含むビデオ信号であることもできる。ある実施形態では、視聴者はエンコードされたテキストか、グラフィックとしてビデオに埋め込まれたテキストかを選択することが認められる。グラフィックコントローラは、翻訳されたテキストをエンコードし、元来のテキストを置き換えることによって、テキストを制御するための従来のテキストエンコード、デコードおよび表示技術のすべてを許容する。たとえば、CCテキストをもつNTSC信号では、テレビモニターは翻訳されたテキストを、テレビの組み込みデコーダを使って表示できる。テキスト表示機能は、チューナーシステムまたはCC論理にいっさいコマンドを送らなくてもテレビによって制御できる。他方、テキストをビデオ画像中に含めれば、表示機器でのデコーダの必要性が回避され、エンコードされたテキストと特定のビデオフレームとの同期のための精度要求も軽減される。
【0025】
代替的に、翻訳された文字のグラフィック表示を生成してそれをビデオ信号の画像と組み合わせることによって、テキストデータシステムの機能を向上させることができる。たとえば、文字数を拡張できる。英語からフランス語への翻訳はしばしばもとの英語より5割増しの文字数を必要とすることがある。エンコードされたテキストがすでに最大容量に近い場合、フランス語訳はビデオ信号に英語テキストと同じ方法でエンコードすることはできない。ビデオテキスト、テレテキスト、クローズドキャプションまたはその他のテキストシステムによってサポートされていない追加文字を生成することもできる。たとえば、エンコードされた英語CCテキストをもつATSC信号を中国語に翻訳し、それを繁体字または簡体字を用いて表示することもできる。中国語はCCエンコードでは全くサポートされていないのである。
【0026】
さらに、テキストをビデオにスーパーインポーズすることによって、翻訳されたテキストをさまざまな大きさ、フォント、色で、さまざまな背景効果などを加えて表示することができる。ビデオプロセッサ21にプログラムできるいかなる機能も、ディスプレイ中のテキストデコーダを必要とすることなくディスプレイ上で提供できる。視聴者は、テキストの背景の種類(たとえば標準的な黒、他の色または透明)、テキストの色、テキストの位置さらにはフォントと大きさを選択するためのメニューを提供されることができる。たとえば、モニターの表示よりも幅広のフォーマットのビデオを見る場合、視聴者は上または下の水平の黒い帯にテキストを置くよう選択しうる。これは、テキストがビデオ信号内にエンコードし戻されていたら不可能である。
【0027】
図3は上記したチューナーシステムを使うのに好適なメディアセンター43のブロック図を示している。図2のシステムはより大きなシステムの全体であってもよい。図2との関連で示され、記載されたハードウェアは、統合されたまたはセットトップボックスのチューナーに高度テキスト機能を提供するのに十分すぎるほどである。チューナー13において入力を受信し、アルファブレンダー21から出力を与える。ユーザーはディスプレイを通じたインターフェースをもち、ユーザー入力は論理エンジン29を通じて管理され、処理されることができる。図2のハードウェアは、テープ、ディスクもしくはメモリレコーダーを用いて、追加的な入出力または追加的なチューナーを用いて増強できる。辞書15は工場デフォルトとして、あるいは交換可能なメモリチップもしくはモジュールとして提供されうる。入出力インターフェースを提供することによって、任意の所望の単数または複数の言語を提供するよう、辞書を同一または異なるメモリ内で更新、変更または入れ替えることができる。入出力インターフェースは辞書に直結でもよいし、論理エンジン29を通じてでもよい。
【0028】
図3では、図2のより単純なシステムの機能が広範に向上させられる。図2のチューナーシステム11は、たとえば上記したI2Cインターフェースを使ったグラフィックコントローラ41に結合される。ある実施形態では、ビデオプレーン17、グラフィックプレーン19およびアルファブレンダー21はみなこのグラフィックコントローラ内にあるが、別の構成も可能である。図2との関連で記載された多重のビデオ、オーディオおよびテキスト出力はマルチプレクサ51に結合される。望むなら該マルチプレクサに他のソースも結合してもよい。例として、同様に前記マルチプレクサに結合されているものとしてIEEE1394機器53が示されている。そのような機器の例としては、中でもテーププレーヤー、ディスクプレーヤーおよびMP3プレーヤーが含まれうる。マルチプレクサは、グラフィックコントローラの制御のもとで、前記チューナーまたはその他の入力のうちのどれがメディアセンターの残りの部分に接続されるかを選択する。
【0029】
選択されたチューナー入力はマルチプレクサ出力に結合される。これらのマルチプレクサ出力は、今の例では、それぞれのMPEG-2エンコーダ53−1、53−2に、それからグラフィックコントローラ41に経路制御される。デジタルテレビ、ラジオ、デジタルケーブルまたは衛星信号の場合、信号はすでにエンコードされているのであるから、マルチプレクサは信号をMPEG-2エンコーダを迂回するよう経路制御するか、あるいはエンコードプロセスを無効にするかしてもよい。
【0030】
グラフィックコントローラから、ビデオおよびオーディオ信号は表示、保存または記録のために出力されうる。ある実施形態では、グラフィックコントローラはビデオ信号プロセッサと並んでMPEG-2およびMPEG-3デコーダを含んでいる。これはビデオおよびオーディオ信号を所望の機器による使用のためにフォーマットし、チューナーからのビデオおよびオーディオ信号にコントロール、メニュー、メッセージ交換および他の画像を組み合わせるためである。グラフィックコントローラは全デバイスを駆動してもよいし、あるいはのちに述べるような別のより高いレベルのプロセッサの制御のもとでグラフィック機能のためだけに動作してもよい。
【0031】
簡単のため、図3はビデオ出力一つとオーディオ出力一つしか示していないが、出力の数および多様性は、特定の用途に応じて大いに変化がありうる。メディアセンターがチューナーとして機能する場合なら、単一のDVIまたはコンポーネントビデオ出力と、光S/PDIF(Sony/Philips Digital Interface)出力のような単一のデジタルオーディオ出力とがあれば十分でありうる。図示した構成では、メディアセンターは、モニターでのピクチャーインピクチャー表示をもつチューナーとして使用してもよいし、あるいはあるチャンネルを録画しながら別のチャンネルを表示するのに使用してもよい。メディアセンターがより多くの機能を果たすのであれば、一つまたは複数の種類の追加的なオーディオおよびビデオ接続が望まれることもある。
【0032】
ビデオおよびオーディオ接続のための実際のコネクタおよびフォーマットとしては、多くの異なる種類およびさまざまな数がありうる。いくつかのコネクタフォーマットとしては、同軸ケーブル、RCAコンポジットビデオ、Sビデオ、コンポーネントビデオ、DIN(Deutsche Industrie Norm[ドイツ工業規格])コネクタ、DVI(digital video interface)、HDMI(High Definition Multimedia Interface)、VGA(Video Graphics Adapter)ならびにUSBおよびIEEE1394さえ含まれる。また、特定の用途について好まれることがあるいくつかの異なる独自仕様のコネクタもある。コネクタの種類は特定の用途に適合するよう修正されてもよいし、あるいは異なるコネクタが採用されることになってもよい。
【0033】
メディアセンターはまた、ハードディスクドライブ、揮発性メモリ、テープドライブ(たとえばVTRのための)または光ドライブといった大容量記憶装置をも含みうる。これは、グラフィックコントローラのための命令を保存し、EPG(Electronic Program Guide)を維持し、あるいはチューナーシステムから受信したオーディオまたはビデオを記録するために使用されうる。
【0034】
上記した構成要素は、中でもチューナー(地上波、ケーブルおよび衛星セットトップボックス)、VTR、PVRおよびテレビといった多くの消費者電子製品、家庭エンタータインメントおよびホームシアター機器には十分である。下記に述べる追加的な構成要素のいくつかを使ってさらなる機能を設けてもよい。さらに、前置増幅器および電力増幅器、コントロールパネルまたはディスプレイ(図示せず)が所望に応じてグラフィックコントローラに結合されていてもよい。
【0035】
メディアセンターはまた、ホストコントローラ63またはチップセットに結合されたCPU(Central Processing Unit[中央処理装置])61をも含みうる。使用するCPUおよびチップセットの数は異なりうる。ある実施例では、モバイル・インテル(登録商標)・セレロン(登録商標)・プロセッサをインテル(登録商標)830チップセットと一緒に使用するが、本発明はそれに限定されるものではない。それは十分以上の処理能力、接続機能および節電モードを提供する。ホストプロセッサは、インテル(登録商標)FW82801DB(ICH4)のようなI/Oコントローラハブ(ICH)65に結合されたノースブリッジと、RAM(Random Access Memory[ランダムアクセスメモリ])のようなオンボードメモリ67に結合されたサウスブリッジとを有する。チップセットはまた、グラフィックコントローラ41と結合するためのインターフェースも有する。本発明は、ここに示唆されているプロセッサの特定の選択に限定されるものではないことを注意しておく。ある実施例では、翻訳エンジン31はCPUとチップセットによって提供され、辞書15は下記に述べるハードディスクドライブ87に保存される。
【0036】
ICH65は幅広い異なる機器への接続機能を提供する。そうした接続のためには、十分確立された慣用およびプロトコルが使用されうる。接続は、LAN(Local Area Network[構内ネットワーク])ポート69、USBハブ71およびローカルBIOS(Basic Input/Output System[基本入出力システム])フラッシュメモリ73を含みうる。SIO(Super Input/Output[超入出力])ポート75が、ボタンおよびディスプレイをもつフロントパネル77、キーボード79、マウス81ならびにIRブラスターもしくはリモコンセンサーのような赤外線デバイス85のための接続機能を提供する。前記I/Oポートはまた、フロッピー(登録商標)ディスク、パラレルポートおよびシリアルポートの接続もサポートすることができる。あるいはまた、これらのデバイスのうちの一つまたは複数のいかなるものも、USB、PCIまたはいかなる種類のバスからサポートされてもよい。
【0037】
前記ICHはまた、ディスクドライブ87,89またはその他の大容量記憶デバイスへの接続のためのIDE(Integrated Device Electronics[統合デバイスエレクトロニクス])バスを提供することもできる。前記大容量記憶装置としては、ハードディスクドライブおよび光ドライブが含まれうる。よって、たとえば、ソフトウェアプログラム、ユーザーデータ、EPGデータおよび録画された娯楽番組はハードディスクまたはその他のドライブ上に保存されることができる。さらに、CD(Compact Disc[コンパクトディスク])、DVD(Digital Versatile Disc[デジタル多用途ディスク])およびその他の記憶メディアが前記IDEバスに結合されたドライブ上で再生されうる。
【0038】
前記ICHにはPCI(Peripheral Component Interconnect[周辺コンポーネント相互接続])バス91が結合されており、幅広い範囲のデバイスおよびポートがICHに結合できるようにしている。図3での例はWAN(Wide Area Network[広域ネットワーク])ポート93、無線ポート95、データカードコネクタ97およびビデオアダプターカード99を含んでいる。PCIポート接続用に利用可能なその他多くのデバイスおよびその他多くの可能な機能がある。PCIデバイスは、カメラ、メモリカード、電話、PDA(Personal Digital Assistant[携帯情報端末])または近くのコンピュータのようなローカルな装置への接続を許容できる。PCIデバイスはまた、プリンタ、スキャナ、レコーダー、ディスプレイその他といったさまざまな周辺機器への接続をも許容できる。PCIデバイスはまた、よりリモートな装置またはいくつかの異なるインターフェースのうちのいかなるものへの有線または無線の接続をも許容しうる。前記リモート装置は、メンテナンスもしくはリモートコントロールのために、またはゲームのために、プログラミングまたはEPGデータの通信を許容しうる。
【0039】
最後に、前記ICHはACリンク(Audio Codec Link[オーディオコーデックリンク])101をもつものとして示されている。ACリンクとは、オーディオとモデムのためのそれぞれ独立した機能をもつコーデックをサポートするデジタルリンクである。オーディオ部では、マイクロホン入力および左右のオーディオチャンネルがサポートされる。図3の例では、ACリンクは、グラフィックコントローラ41へのオーディオリンクと並んで、PSTNへの接続のためモデム103をサポートしている。ACリンクはCPU、ホストコントローラまたはICHによって生成されるいかなるオーディオをも、オーディオ出力57との統合のためにグラフィックコントローラに運ぶ。代替的にはISA(Industry Standard Architecture[産業標準アーキテクチャ])バス、PCIバスまたは他のいかなる種類の接続でもこの目的のために使用しうる。図3から見て取れるように、チューナーによって生成される信号をサポートし、チューナーの動作を制御するには多くの異なる方法がある。図3のアーキテクチャは幅広い範囲の異なる機能および性能を許容する。
【0040】
図4は、図3のメディアセンターとともに使うのに好適な娯楽システム111のブロック図である。図4は幅広い範囲の組み込まれた装置をもつ娯楽システムを示している。装置は、数多くの可能性のうちの例として示されている。本発明は、ずっと簡単な、あるいはより複雑なシステムにおいて使用してもよい。図3に記載されているメディアセンターは、WANおよびLAN接続、ブルートゥース、IEEE802.11、USB、1394、IDE、PCIおよび赤外線を通じた通信をサポートすることができる。さらに、チューナーシステムはアンテナ、コンポーネントおよびコンポジット・ビデオおよびオーディオならびにIEEE1394デバイスから入力を受信する。これは、接続され、メディアセンターとともに動作しうるデバイスの種類の、この上ない柔軟性および多様性を提供する。新たなインターフェースが開発されれば、当該メディアセンターのための特定の用途に従って、その他のインターフェースが追加され、あるいは記載されたものと置き換えられてもよい。前記接続の多くはコスト削減のために除去してもよい。図4に示した特定の諸デバイスは、消費者家庭エンターテインメントシステムのために好適となりうる構成の一つの例を表すものである。
【0041】
メディアセンター43は上記したようにいくつかの異なる可能な入力をもつ。図4の例では、これらはテレビケーブル117、放送アンテナ119、衛星受信機121、テープもしくはディスクプレーヤーのようなビデオプレーヤー123、テープもしくはメモリプレーヤーのようなオーディオプレーヤー125ならびにたとえばIEEE1394接続によって接続されたデジタルデバイス127を含む。
【0042】
これらの入力は、処理、選択および制御の後、ユーザーのために出力を生成するのに使われうる。出力はモニター129もしくはプロジェクター131または他の任意の種類の知覚可能なビデオディスプレイ上に表現されうる。オーディオ部分は、A/V受信機もしくはサウンド処理エンジンのような増幅器133を通じて、ヘッドホン135、スピーカー137または他の任意の種類の音響生成デバイスに向けられうる。出力は、VTR、PVR、CDまたはDVDレコーダー、メモリカードなどのような外部レコーダー139にも送られうる。
【0043】
メディアセンターはまた、たとえば電話ポート141およびネットワークポート143を通じて外部デバイスへの接続機能を提供する。ユーザーインターフェースはたとえばキーボード145またはリモコン147を通じて提供されており、メディアセンターは自らの赤外線ポート149を通じて他のデバイスと通信しうる。リムーバブル記憶装置153はMP3で圧縮されたオーディオを保存し、のちにポータブルデバイス上で再生することを許容したり、あるいはカメラ画像をモニター129上で表示するのを許容したりしうる。
【実施例】
【0044】
図3のメディアセンターを使った娯楽センターのためには多くの異なる装置構成があり、接続すべき装置の選択も多くの異なる可能性がある。現在利用可能な典型的な装置を使った典型的な家庭エンターテインメントシステムは次のようなものでありうる。入力としては、この典型的な家庭エンターテインメントシステムは、メディアセンターのチューナーシステムへの入力として、テレビアンテナ119およびケーブルテレビ117もしくはDBS121を有しうる。VTRまたはDVDレコーダーが入力デバイス123および出力デバイス139として接続されていることもありうる。CDプレーヤー125およびMP3プレーヤー127が音楽のために加えられることもありうる。そのようなシステムはまた、ワイドスクリーンの高精細度テレビ129および6つまたは8つのスピーカー137に結合されたサラウンドサウンド受信機133をも含んでいることもありうる。この同じユーザーシステムはユーザーのために小さなリモコン147を有し、当該メディアセンターからテレビ、受信機、VTRおよびCDプレーヤーへのリモートコントロール149を提供する。インターネット接続141およびキーボード145はウェブサーフィン、アップグレードおよび情報ダウンロードを許容し、他方、コンピュータネットワークはファイル交換ならびに家の中のパソコンから、または該パソコンへのリモートコントロールを許容する。
【0045】
上記の例よりも装備の少ない、あるいは多い娯楽システムおよびメディアセンターがある種の実装のためには好ましいことがありうることは理解されるものとする。したがって、娯楽システムおよびメディアセンターの構成は、実装ごとに、数多くの要因に依存して変わるものである。要因としては、価格の制約、要求されるパフォーマンス、技術の進展またはその他の状況といったものがある。本発明の諸実施形態は、図2、3および4に示されたのとは異なるハードウェアアーキテクチャを使う他の種類のソフトウェア駆動システムにも適用されうる。
【0046】
上記の記述では、説明の目的上、本発明の十全なる理解を提供するため数多くの特定の詳細が述べられている。しかし、本発明がそうした特定の詳細のいくつかがなくても実施しうることは当業者には明らかであろう。他方、よく知られた構造および装置はブロック図の形で示されている。
【0047】
本発明はさまざまなステップを含みうる。本発明のステップは、図2、3および4に示したようなハードウェアコンポーネントによって実行されうるし、あるいは機械実行可能命令においても実施されうる。その命令とは、該命令をプログラムされている汎用もしくは専用目的プロセッサまたは論理回路をして前記諸ステップを実行せしめるために使用されうるものである。あるいはまた、諸ステップはハードウェアおよびソフトウェアの組み合わせによって実行されてもよい。
【0048】
本発明は、本発明に基づくプロセスを実行するようメディアセンター(または他の電子デバイス)をプログラムするのに使用されうる命令が保存されている機械可読媒体を含みうるコンピュータプログラムプロダクトとして提供されうる。該機械可読媒体として含まれうるものには、これに限られるものではないが、フロッピー(登録商標)ディスケット、光ディスク、CD-ROMおよび光磁気ディスク、ROM、RAM、EPROM、EEPROM、磁気もしくは光カード、フラッシュメモリまたは電子的命令を保存するために好適なその他の種類の媒体/機械可読媒体がある。さらに、本発明はコンピュータプログラムプロダクトとしてダウンロードされてもよい。ダウンロードとは、該プログラムがリモートコンピュータから要求側のコンピュータに搬送波またはその他の伝搬媒体において具現されるデータ信号によって通信リンク(たとえばモデムまたはネットワーク接続)を通じて転送されうるものである。
【0049】
上記の方法および装置の多くはこの上なく基本的な形において記述されているが、前記諸方法のいずれでもステップを追加したりあるいは削除したりしてもよく、前記の装置のいずれでも構成要素を追加したり差し引いたりしてもよく、それにより本発明の基本的範囲から外れるものではない。数多くのさらなる修正および改変がなしうることは当業者には明らかであろう。特定の実施形態は、本発明を限定するためではなく、説明するために与えられているものである。本発明の範囲は上に与えられている特定の例によってではなく、付属の請求項によってのみ決定されるものである。

【図面の簡単な説明】
【0050】
【図1】本発明のある実施形態に基づくクローズドキャプションテキストを翻訳するフロー図である。
【図2】本発明のある実施形態に基づくクローズドキャプションテキスト翻訳システムのブロック図である。
【図3】本発明のある実施形態を実装するために好適なメディアセンターのブロック図である。
【図4】本発明とともに使用するのに好適な娯楽システムのブロック図である。

【特許請求の範囲】
【請求項1】
エンコードされたテキストデータをもつビデオ信号を受信するビデオ受信器と、
前記エンコードされたテキストデータをデコードするデコーダと、
前記デコードされたテキストデータを、該テキストが受信された言語からある第二の言語に翻訳するテキスト翻訳器と、
前記翻訳されたテキストデータを表示のために前記ビデオ信号のビデオ部分と組み合わせるビデオプロセッサ、
とを有することを特徴とする装置。
【請求項2】
前記エンコードされたテキストデータがクローズドキャプションテキストを有していることを特徴とする、請求項1記載の装置。
【請求項3】
前記テキスト翻訳器が、辞書と、前記デコードされたテキストデータを前記辞書に適用して該テキストデータを翻訳するためのプロセッサとをさらに有することを特徴とする、請求項1記載の装置。
【請求項4】
前記ビデオプロセッサが前記翻訳されたテキストデータのキャラクタ画像を生成し、該キャラクタ画像を前記ビデオ信号のビデオ部分の画像の上にスーパーインポーズすることを特徴とする、請求項1記載の装置。
【請求項5】
機械によって実行されたときに前記機械をして、
エンコードされたテキストデータをもつビデオ信号を受信し、
前記エンコードされたテキストデータをデコードし、
前記デコードされたテキストデータを、該テキストが受信された言語からある第二の言語に翻訳し、
前記翻訳されたテキストデータを表示のために前記ビデオ信号のビデオ部分と組み合わせる、
ことを有する動作を実行せしめることを特徴とする命令を表すデータがその上に保存されている機械可読媒体を有する物品。
【請求項6】
前記テキストデータの翻訳がさらに、前記デコードされたテキストデータ中のフレーズをフレーズ辞書に適用することを有することを特徴とする、請求項5記載の物品。
【請求項7】
エンコードされたテキストデータをもつビデオ信号を受信するビデオ受信器と、
前記エンコードされたテキストデータをデコードするデコーダと、
前記デコードされたテキストデータを処理するテキストプロセッサと、
前記処理されたテキストデータを表示のために前記ビデオ信号のビデオ部分と組み合わせるビデオプロセッサ、
とを有することを特徴とする装置。
【請求項8】
前記デコーダが前記ビデオ信号の垂直帰線期間からデータを読むことを特徴とする、請求項7記載の装置。
【請求項9】
前記デコーダがデジタルビデオトランスポートストリームデコーダを有することを特徴とする、請求項7記載の装置。
【請求項10】
前記テキストプロセッサが、辞書と、前記デコードされたテキストデータを前記辞書に適用して該テキストデータを翻訳するためのプロセッサとをさらに有することを特徴とする、請求項7記載の装置。
【請求項11】
前記テキストプロセッサが、辞書と、前記デコードされたテキストデータを前記辞書に適用して該テキストデータを訂正するためのプロセッサとをさらに有することを特徴とする、請求項7記載の装置。
【請求項12】
前記ビデオプロセッサが前記翻訳されたテキストデータのキャラクタ画像を生成し、該キャラクタ画像を前記ビデオ信号のビデオ部分の画像の上にスーパーインポーズすることを特徴とする、請求項7記載の装置。
【請求項13】
前記ビデオプロセッサが前記翻訳されたテキストをテキストデータにエンコードし、該エンコードされた翻訳されたテキストデータで前記受信されたビデオ信号のエンコードされたテキストデータを置き換えることを特徴とする、請求項7記載の装置。
【請求項14】
エンコードされたテキストデータをもつビデオ信号を受信し、
前記エンコードされたテキストデータをデコードし、
前記デコードされたテキストデータを処理し、
前記処理されたテキストデータを表示のために前記ビデオ信号のビデオ部分と組み合わせる、
ことを有することを特徴とする方法。
【請求項15】
前記テキストデータのデコードが前記ビデオ信号の垂直帰線期間からのテキストデータをデコードすることを有することを特徴とする、請求項14記載の方法。
【請求項16】
前記テキストデータのデコードが前記ビデオ信号のビデオトランスポートストリームからテキストデータパケットを抽出することを有することを特徴とする、請求項14記載の方法。
【請求項17】
前記テキストデータの処理が、前記デコードされたテキスト中のフレーズをフレーズ辞書に適用することを有することを特徴とする、請求項14記載の方法。
【請求項18】
組み合わせが、前記処理されたテキストデータのキャラクタ画像を生成し、該キャラクタ画像を前記ビデオ信号のビデオ部分の画像の上にスーパーインポーズすることを有することを特徴とする、請求項14記載の方法。
【請求項19】
組み合わせが、前記処理されたテキストをテキストデータにエンコードし、該エンコードされた翻訳されたテキストデータで前記受信されたビデオ信号のエンコードされたテキストデータを置き換えることを有することを特徴とする、請求項14記載の方法。
【請求項20】
機械によって実行されたときに前記機械をして、
エンコードされたテキストデータをもつビデオ信号を受信し、
前記エンコードされたテキストデータをデコードし、
前記デコードされたテキストデータを処理し、
前記処理されたテキストデータを表示のために前記ビデオ信号のビデオ部分と組み合わせる、
ことを有する動作を実行せしめることを特徴とする命令を表すデータがその上に保存されている機械可読媒体を有する物品。
【請求項21】
前記テキストデータのデコードが、前記ビデオ信号のビデオトランスポートストリームからテキストデータパケットを抽出することを有することを特徴とする、請求項20記載の物品。
【請求項22】
前記テキストデータの処理が、前記デコードされたテキストデータ中のフレーズをフレーズ辞書に適用することを有することを特徴とする、請求項20記載の物品。
【請求項23】
組み合わせが、前記翻訳されたテキストデータのキャラクタ画像を生成し、該キャラクタ画像を前記ビデオ信号のビデオ部分の画像の上にスーパーインポーズすることをさらに有することを特徴とする、請求項20記載の物品。
【請求項24】
組み合わせが、前記処理されたテキストデータをエンコードし、該エンコードされた処理されたテキストデータで前記受信されたビデオ信号のエンコードされたテキストデータを置き換えることをさらに有することを特徴とする、請求項20記載の物品。
【請求項25】
エンコードされたテキストデータをもつ無線ビデオ信号を受信するビデオ受信器と、
前記エンコードされたテキストデータをデコードするデコーダと、
前記デコードされたテキストデータを処理するテキストプロセッサと、
前記処理されたテキストデータを表示のために前記ビデオ信号のビデオ部分と組み合わせるビデオプロセッサ、
とを有することを特徴とする無線ビデオ受信器。
【請求項26】
前記デコーダが前記ビデオ信号の垂直帰線期間からデータを読むことを特徴とする、請求項25記載のチューナー。
【請求項27】
前記デコーダがデジタルビデオトランスポートストリームデコーダを有することを特徴とする、請求項25記載のチューナー。
【請求項28】
前記テキストプロセッサが、辞書と、前記デコードされたテキストデータを前記辞書に適用して処理されたテキストデータを得るためのプロセッサとをさらに有することを特徴とする、請求項25記載のチューナー。
【請求項29】
前記ビデオプロセッサが前記処理されたテキストデータのキャラクタ画像を生成し、該キャラクタ画像を前記ビデオ信号のビデオ部分の画像の上にスーパーインポーズすることを特徴とする、請求項25記載のチューナー。
【請求項30】
前記ビデオプロセッサが前記処理されたテキストをテキストデータにエンコードし、該エンコードされた処理されたテキストデータで前記受信されたビデオ信号のエンコードされたテキストデータを置き換えることを特徴とする、請求項25記載のチューナー。


【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate


【公表番号】特表2007−508785(P2007−508785A)
【公表日】平成19年4月5日(2007.4.5)
【国際特許分類】
【出願番号】特願2006−535560(P2006−535560)
【出願日】平成16年10月7日(2004.10.7)
【国際出願番号】PCT/US2004/033167
【国際公開番号】WO2005/041573
【国際公開日】平成17年5月6日(2005.5.6)
【出願人】(593096712)インテル コーポレイション (931)
【Fターム(参考)】