説明

国際特許分類[G10L21/06]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 他の可聴信号,または不可聴信号への音声信号変換処理,例.特性や明瞭性を修正するための視覚,触覚 (2,017) | 音声から不可聴表現への変換,例.音声の可視化または触覚の補助のための音声処理 (94)

国際特許分類[G10L21/06]に分類される特許

81 - 90 / 94


【課題】複数チャンネルで放送されている番組の番組情報を画面を見ることなく簡単に把握することを可能にする。
【解決手段】番組情報取得部10bは、選局部14aにより選局されたチャンネルの番組に関連する番組情報を取得する。番組情報解析部10cは、番組情報取得部10bにより取得された番組情報を音声読み上げの対象とする形式の番組情報に変換して番組情報蓄積部10dに蓄積する。番組情報音声出力制御部10aは、選局部14aにより選択されるチャンネルを順次切り換えることにより、番組情報蓄積部10dに複数のチャンネルの番組情報に対する番組情報を蓄積させ、音声合成部10fにより順次音声合成によってスピーカ22から出力させる。 (もっと読む)


【課題】本発明は駅及び鉄道の交通機関において、その利用者が簡易に使用することができ、必要な最新情報を供給することかでき、且つ的確な誘導案内をすることができる誘導案内システム及びそのシステムに用いる誘導案内装置を提供することを課題とする。
【解決手段】鉄道、地下鉄、バス等の交通機関を利用する者を、駅の発券装置又は案内板等で目的地/目的物件を誘導案内する誘導案内システムにおいて、誘導案内する際に、利用者の発声する目的地/目的物件等の音声を取り込んで音声の目的地/目的物件等を正確に認識し、蓄積された情報より目的地/目的物件迄の交通機関及び各種情報を検索した後、探索された情報を音声に合成して利用者に報知することである。 (もっと読む)


【課題】設備コストの低減を図り得る音楽信号変換装置、及び、これを用いた音楽制御システムを提供する。
【解決手段】 音楽信号S1が入力され、入力された音楽信号S1を周波数変換して、周波数レベル信号S21〜23を生成し、周波数レベル信号S21〜23は、音楽信号S1に含まれる複数の周波数帯域毎に区分して生成され、周波数帯域毎に音楽信号S1の強さに対応したレベルを有しており、独立する出力端子21〜23のそれぞれから、複数の周波数帯域毎に、個別的に、周波数レベル信号S21〜23を出力する。 (もっと読む)


【課題】 音声情報を種々のユーザが興味を持つようにして聞かせる。
【解決手段】 音声出力装置100は、近傍に位置する物体の属性に関する情報を含む物体の説明情報を取得する物体情報取得部102と、属性に関する情報に基づき物体を擬人化して所定の類型の人間に設定した場合に、当該類型の人間が話すことが想定される言葉で、物体の説明情報を音声出力する音声出力部110と、を含む。 (もっと読む)


【課題】 楽曲を再生し、再生する楽曲の紹介音声を出力する楽曲再生装置が、従来よりも多様な楽曲紹介を行えるようにすることを目的とする。
【解決手段】 楽曲再生機能を有するカーナビゲーション装置が、再生する楽曲が切り替わる毎に(ステップ210)、楽曲の再生順序の形式を特定し(ステップ220)、さらにタイトルの長さ、副題の有無、バージョンの有無、アーティスト名、発売日、トラック番号、録音日、過去の再生回数等の、これから再生する楽曲の情報を特定し(ステップ230)、さらに現在の自車両の走行環境を特定する(ステップ240)。そして、このような特定した情報に基づいて、楽曲紹介用の定型句を選択し(ステップ250)、選出した定型句を用いて、再生する楽曲の紹介音声を出力する(ステップ260、270)。 (もっと読む)


音響再生システムは、送信機装置(1)及び受信機装置(2)を有する。送信機装置(1)は、選択された周波数範囲の音響信号(Vin)のエンベロープ信号を決定し、そしてエンベロープ信号(V)を通信路(C)へ送信する。受信機装置(2)は、受信したエンベロープ信号(V)を発振器信号(V)と結合し、トランスデューサ信号を生成する。通信路(C)は、望ましくは無線である。トランスデューサ(30)は、望ましくは、最大効率を達成するよう、その共振周波数で動作するよう設計される。
(もっと読む)


システム及び方法は、音響活動又はその検出された特徴部を視覚化すること、及び、音響活動を、カメラによって取得されたビデオと共に視覚信号として表示することを含む。簡単な信号処理の使用か、より複雑な音声解析又は音認識の使用のいずれかにより、音響信号から有益な情報を抽出することができる。抽出された情報は、カメラによって取得されたビデオ信号上に重ね合わされる視覚信号に変換することができる。
(もっと読む)


話者の種類、発話語彙、発話様式、発話環境等の特定条件により多様化する特徴パラメータの分布を考慮して不特定話者用の音響モデルを生成するのに好適で、且つ、特定の個人の音声に最も適合した不特定話者用の音響モデルを提供するのに好適なデータ処理装置及びデータ処理装置制御プログラムを提供する。 データ処理装置1を、データ分類部1aと、データ記憶部1bと、パターンモデル生成部1cと、データ制御部1dと、数学的距離算出部1eと、パターンモデル変換部1fと、パターンモデル表示部1gと、領域区分部1hと、区分内容変更部1iと、領域選択部1jと、特定パターンモデル生成部1kと、を含んだ構成とした。 (もっと読む)


本発明はディスプレイ装置を備えた再生装置に格納された音声ドキュメントのコレクション内を巡回する方法に関する。本方法は、各ドキュメントに固有の「ローレベル」と呼ばれるオーディオパラメータを求めるためにドキュメントを分析するステップを有している。つぎに、音声ドキュメントの少なくとも一部のグラフィック識別子がグラフィックページ内に置かれる。グラフィック識別子の配置は事前に計算されたパラメータに依存している。最後に、本発明は、グラフィックページ内でのドキュメント識別子の位置を考慮に入れて、決定されたストラテジーに従って音声ドキュメントを逐次再生することにより自動巡回を行うステップを有している。
本発明はまた、決定されたストラテジーとグラフィックページ内でのドキュメント識別子の位置とに従って音声ドキュメントを再生するソフトウェアモジュールを実行することのできる装置にも関する。
(もっと読む)


【課題】従来の技術では、英語の音素「l」及び「r」の発音及び識別を学習する際に、学習者は十分に納得の行く成果を得ることが困難であった。学ぼうと思っても限られた学習現場でしか当該学習をすることが出来なかった。
【解決手段】本発明の第1部は、英語の音素「l」及び「r」の母国語人による模範パターンと、学習者による模倣パターンを並列して同一画面にリアルタイムに連続的に表示する。よって学習者は視覚的に容易に自己評価を行ない、主体的に発音の訓練を進められる。第2部は、基本音声、加工音声、単語、更に合成音声を用いて学習者は当該音素の特徴的相違を容易に且つ正確に把握出来、更に特別に考案された訓練方法により、識別能力を高め母国語人のそれに類似した能力に近づけることを可能にした。第3部は、コンピュータによるネットワークシステムを利用する事で、誰でも容易に好みの場所で発音及び識別訓練を実施する事が可能になった。 (もっと読む)


81 - 90 / 94