説明

国際特許分類[G10L15/00]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声認識 (6,879)

国際特許分類[G10L15/00]の下位に属する分類

国際特許分類[G10L15/00]に分類される特許

1,851 - 1,860 / 1,893


本発明は、車両用の制御システムであって、複数のメニューレベルを有するメニュー構造の項目を表示するための複数の表示領域を有するディスプレイ(2)を備え、メニュー構造の実際のメニューレベルにおいて、少なくとも1つの項目を選択し及び/又はアクティブにするための手動操作手段(3)を備える制御システムに関する。本発明の制御システムは、音声制御手段(6)用のキーワードを同時に形成するメニュー構造の少なくとも1つの項目を重複して選択し及び/又はアクティブにするための音声制御手段(6)も備える。本発明によれば、メニュー構造の項目は、種々の群に分割され、これにより、第1群は、手動操作手段(3)によって選択し及び/又はアクティブにすることができる項目を含み、第2群は、操作手段(3)によって及び/又は音声制御手段(6)によって選択し及び/又はアクティブにすることができる項目を含む。第2群は、メニュー制御のために、どのキーワードを現在入力できるかを決定する簡単な規則によって確立できる少なくとも2つの言葉群に分割される。
(もっと読む)


音声認識部(2)は、音声入力部(1)が入力した話者の音声に音声認識を施して、この音声が表している可能性のある単語とそのスコアとを特定し、自然言語解析部(3)がこれらの単語の品詞を特定して、これらの単語を表す単語データをエージェント処理部(7)に供給する。エージェント処理部(7)は、単語データ等を取得するデータ取得処理や、判別処理、入出力処理を定義する処理項目データと、ひとつの処理から次の処理への遷移を定義しこの遷移に重み係数を与えるデータであるワイヤとを記憶しており、処理項目データとワイヤとが全体として表すフローを実行することにより、話者の要求を適切に把握し、この要求を満たすように、入出力対象機器群(6)に属する機器を制御する。 (もっと読む)


言語解析部(2)は、音声入力部(1)が入力した音声に音声認識を施して、この音声が表している可能性のある単語とそのスコアとを特定し、これらを表す単語データをエージェント処理部(6)に供給する。エージェント処理部(6)は、単語データ等を取得するデータ取得処理や、判別処理、入出力処理を定義する処理項目データと、ひとつの処理から次の処理への遷移を定義し、この遷移に遷移定数を与えるデータであるワイヤと、を記憶しており、処理項目データとワイヤとが全体として表すフローを実行することにより、入出力対象機器群(5)に属する機器を制御する。フロー内のどの処理へと遷移するかは、処理が進んだ地点とワイヤの接続関係とにより決まる各ワイヤの重み係数と、単語データのスコアとにより決まる。 (もっと読む)


言語解析部2は、音声入力部1が入力した音声に音声認識を施して、この音声が表している可能性のある単語とそのスコアとを特定し、これらを表す単語データをエージェント処理部6に供給する。エージェント処理部6は、単語データ等を取得するデータ取得処理や、判別処理、入出力処理を定義する処理項目データと、ひとつの処理から次の処理への遷移を定義しこの遷移に重み係数を与えるデータであるワイヤとを記憶しており、処理項目データとワイヤとが全体として表すフローを実行することにより、入出力対象機器群5に属する機器を制御する。フロー内のどの処理へと遷移するかは、処理が進んだ地点とワイヤの接続関係とにより決まる各ワイヤの重み係数と、単語データのスコアとにより決まる。ワイヤや処理項目データは外部サーバよりダウンロード可能である。 (もっと読む)


ディジタル・カメラ114をオーディオ制御又はボイス制御を介して制御できる、組合せ携帯電話機100及びディジタル・カメラ114。携帯電話機100に、可聴入力を検出する少なくとも1つのマイクロホン106、118が含まれる。検出された可聴入力が、電気信号に変換され、プロセッサに送られる。プロセッサは、検出された可聴入力をプロセッサに操作させるソフトウェアを含む記憶媒体にアクセスできる。プロセッサは、検出された可聴入力をカメラ・コマンドのデータベース412と比較して、検出された可聴入力がデータベース内のカメラ・コマンドの1つと一致するかどうかを判定する414。一致がある場合には、プロセッサは、カメラ・コマンドに関連する一連の命令を実行504して、所望の機能を実行する。
(もっと読む)


言語解析部2は、音声入力部1が入力した音声に音声認識を施して、この音声が表している可能性のある単語とそのスコアとを特定し、これらを表す単語データをエージェント処理部6に供給する。エージェント処理部6は、単語データ等を取得するデータ取得処理や、判別処理、入出力処理を定義する処理項目データと、ひとつの処理から次の処理への遷移を定義しこの遷移に重み係数を与えるデータであるワイヤとを記憶しており、処理項目データとワイヤとが全体として表すフローを実行することにより、入出力対象機器群5に属する機器を制御する。フロー内のどの処理へと遷移するかは、処理が進んだ地点とワイヤの接続関係とにより決まる各ワイヤの重み係数と、単語データのスコアとにより決まる。ワイヤや処理項目データは外部サーバよりダウンロード可能である。 (もっと読む)


言語解析部(2)は、音声入力部1が入力した音声に音声認識を施して、この音声が表している可能性のある単語とそのスコアとを特定し、これらを表す単語データをエージェント処理部(6)に供給する。エージェント処理部(6)は、単語データ等を取得するデータ取得処理や、判別処理、入出力処理を定義する処理項目データと、ひとつの処理から次の処理への遷移を定義しこの遷移に重み係数を与えるデータであるワイヤとを記憶しており、処理項目データとワイヤとが全体として表すフローを実行することにより、
入出力対象機器群(5)に属する機器を制御する。フロー内のどの処理へと遷移するかは、処理が進んだ地点とワイヤの接続関係とにより決まる各ワイヤの重み係数と、単語データのスコアとにより決まる。ワイヤや処理項目データは外部サーバよりダウンロード可能である。 (もっと読む)


オーディオ対話システムとボイスブラウズ方法を記載している。オーディオ入力部(12)がオーディオ入力信号を取得する。スピーチ認識手段(20)がオーディオ入力信号をテキスト入力データ(21)に変換する。コンテントデータ(D1)は、テキストコンテントと少なくとも1つの参照(LN1)を有する。参照は、参照先と起動フレーズを有する。ブラウズ手段は、取得した入力テキストデータ821)を起動フレーズ(28)と比較する。入力テキストデータ(21)が起動フレーズ(28)と同一でなくても、入力テキストデータと起動フレーズが類似した意味を有する場合マッチしたとされる。マッチした場合、参照先に対応するコンテントデータにアクセスする。
(もっと読む)


車輌内装置用に、ユーザの音声プロファイルを選択するシステムは、音声認識システム及びメモリを有する制御モジュールを含む。音声認識システムは、音声信号を処理するよう構成され、少なくとも1人のユーザのユーザ音声プロファイルを生成するよう構成される発話者登録機能を有する。メモリは、発話者登録機能により生成される複数のユーザ音声プロファイルを格納するよう構成される。このシステムは、識別子を含む制御信号を、車輌に送信するよう構成される外部装置を含んでよい。代替的に、システムは、識別子を含む入力コマンドをユーザから受信するよう構成されるユーザ入力装置を含んでよい。制御モジュールは、識別子を使用して、複数のユーザ音声プロファイルからユーザ音声プロファイルを選択し、音声認識システムは、選択されたユーザ音声プロファイルを使用して、ユーザからの音声信号を処理する。 (もっと読む)


【課題】取込メディアの検索および再生を容易にする。
【解決手段】メディア取込装置は、メディア取込アクティビティとの密接な時間的関係においてメディア取込アクティビティに関係する音声入力を有する。各々がメディア取込アクティビティに関連する複数の集中的音声認識辞書は装置に格納され、音声認識部は集中的音声認識辞書のうち選択されたものに基づいてユーザ音声を認識する。メディアタグ付加部は生成された認識テキストを用いて取込メディアにタグ付加し、メディア注釈付加部は音声認識部への入力に適しているユーザ音声のサンプルを用いて取込メディアに注釈付加する。タグ付加および注釈付加は、ユーザ音声の受け取りと取込メディアの取込との密接な時間的関係に基づく。注釈は、取込メディアを検索するために文字から音声への変換規則,スペル単語入力,または音声への直接一致を使用して辞書の編集に適用される後処理中にタグに変換されても良い。 (もっと読む)


1,851 - 1,860 / 1,893