音声認識 | 目的、機能 | 不特定話者音声の認識

Fターム［5D015AA02］の内容

音声認識 (5,191) | 目的、機能 (1,020) | 不特定話者音声の認識 (117)

Fターム［5D015AA02］に分類される特許

1 - 20 / 117

音声処理装置及び音声処理装置の検査方法

【課題】実装された状態遷移モデルの評価において、時間などの要件に対するコストバランスを考慮した評価が可能な音声処理装置を提供する。
【解決手段】音声処理装置が、音声認識部と、状態遷移モデルと、前記音声認識部の認識結果を用いて前記状態遷移モデルの状態遷移を制御する第１の制御部と、を含み、前記第１の制御部は、第１の実行モードと第２の実行モードとを有し、前記第１の実行モードは、前記状態遷移モデルにおける分岐ノードの実行が１回であり、前記第２の実行モードは、前記分岐ノードの実行がすべての分岐に対して行われることが可能であることを特徴とする。（もっと読む）

セイコーエプソン株式会社 (51,324)

対話制御装置、対話制御方法及び対話制御用コンピュータプログラム

【課題】複数の情報供給源が有っても、ユーザが所望する情報を正確に提供できる対話制御装置を提供する。
【解決手段】対話制御装置１は、サービス識別子と情報識別子の複数の組と各組に関連するキーワード及び重み係数とを記憶する記憶部３２と、各キーワードについて入力された音声信号から検出された認識候補単語との類似度を重み係数が大きいほど大きくなるように算出し、類似度が最大となるキーワードを検出するキーワード決定部３４と、検出されたキーワードと関連するサービス識別子と情報識別子の組により特定される提示情報を取得する提示情報取得部３５と、現在の提示情報の供給源を表す第１のサービス識別子が以前に取得された提示情報の供給源を表す第２のサービス識別子との差異の有無に基づいて第１のサービス識別子と関連するキーワードの重み係数及び第２のサービス識別子と関連するキーワードの重み係数を更新する重み更新部３９とを有する。（もっと読む）

富士通株式会社 (25,993)

楽曲検索装置

【課題】あいまいな情報に基づいて楽曲に関する検索が可能であり、その検索を行うために必要な手間およびコストを低減することができる楽曲検索装置を提供すること。
【解決手段】オーディオ装置１は、複数の楽曲のそれぞれに対応させて複数の付属情報を格納するコンテンツリスト格納部３０と、付属情報の特定に必要な検索情報を指定する検索情報指定部１２と、指定された検索情報を検索キーとしてインターネットを介して接続された検索処理部８０に対して情報の検索を依頼する検索依頼部１４と、この依頼に応じて送られてくる検索結果情報を取得する検索結果取得部１６と、取得した検索結果情報に基づいて検索対象の付属情報を特定する付属情報特定部１８とを備えている。（もっと読む）

アルパイン株式会社 (2,424)

発言管理システム、発言管理方法及び発言管理プログラム

【課題】会議等における発言についての記録を作成するとともに、円滑な議事進行を支援するための発言管理システム、発言管理方法及び発言管理プログラムを提供する。
【解決手段】会議支援サーバ２０の制御部２１は、音声を取得し、音声認識処理を実行する。そして、発言管理情報記憶部２５に、認識結果を記録する。次に、制御部２１は、発言管理情報記憶部２５を用いて、キーワード抽出処理を実行する。キーワードに基づいて実行される会議進行管理処理において、議事進行があったと判定した場合、制御部２１は、議事項目の消込処理を実行する。また、キーワードに基づいて実行される説明表示管理処理においては、制御部２１は、参考情報を検索し、クライアント端末１０において表示候補を出力する。（もっと読む）

みずほ情報総研株式会社 (187)

音声認識システムおよびこれを用いた検索システム

【課題】認識精度を向上させることができるとともに正しい認識結果を得るまでの操作を簡略化することができる音声認識システムを提供すること。
【解決手段】車載装置１００は、話者が発声した音声を保存する音声保存バッファ１１２と、認識辞書１１６を用いて、音声保存バッファ１１２に保存された音声に対して音声認識処理を行う音声認識部１１４とを備える。施設検索サーバ１５０は、認識辞書１１６と異なる認識辞書１６２を用いて、音声保存バッファ１１２に保存された音声に対して音声認識処理を行う音声認識部１６０とを備える。車載装置１００に備わった優先度調整部１２２は、２つの音声認識部１１４、１６０の認識結果に基づいて、音声保存バッファ１１２に保存された音声に対応する認識候補を決定する。（もっと読む）

アルパイン株式会社 (2,424)

機械翻訳装置、機械翻訳方法および機械翻訳プログラム

【課題】
利用者の現在の利用シーンに対応する適応モデルをオンラインで動的に生成する機械翻訳装置を実現することである。
【解決手段】
実施形態の機械翻訳装置は、第１言語を入力する言語入力手段と、前記言語入力手段に入力された第１言語の利用者もしくは利用場所に関する付加情報を取得する付加情報取得手段と、第２言語と当該第２言語を取得した際の利用者もしくは利用場所に関する付加情報を対応付けた第２言語の参照データを格納する参照データ格納手段と、前記付加情報取得手段で取得された第１言語の付加情報の全部あるいは一部と同一な内容の付加情報を有する第２言語のテキスト情報を取得するテキスト情報取得手段と、前記テキスト情報取得手段によって取得された第２言語のテキスト情報を利用して、前記言語入力手段に入力された第１言語を第２言語に翻訳する翻訳手段とを備える。（もっと読む）

株式会社東芝 (54,554)

自然言語インターフェースコントロールシステム

【課題】音声認識方法において、自然言語の音声を認識する。
【解決手段】複数のデバイス（１１４）を操作する自然言語インターフェースコントロールシステム（２０６）は、第１のマイクロフォンセット（１０８）と、第１のマイクロフォンセットに接続された特徴抽出モジュール（２０２）と、記特徴抽出モジュールに接続された音声認識モジュール（２０４）を有し、音声認識モジュールは隠れマルコフモデルを用いる。また、システムは、音声認識モジュール（２０４）に接続された自然言語インタフェースモジュール（２２２）と、自然言語インターフェースモジュール（２２２）に接続されたデバイスインターフェース（２１０）を有し、自然言語インターフェースモジュールは、ユーザからの非プロンプト式で開放型の自然言語要求に基づいて、デバイスインターフェースに接続された複数のデバイスを操作する。（もっと読む）

ソニー　エレクトロニクス　インク (371)

ウェブ・ページを音声付勢するためのシステム及び方法

【課題】ウェブ・ページを特定するデータのための音声リクエストを処理するための方法を提供する。
【解決手段】前記方法は、ルールベースのグラマ・ステートマントを含む、ウェブ・ページを特定するデータのための音声リクエストを処理するための方法であって、ルールベースのグラマ・ステートマントと関連したグラマを識別する段階と、グラマと関連しているとして識別された第１の接続が、１つまたは複数の接続を識別するデータ構造において特定されているか否かを決定する段階と、グラマと関連しているとして識別された第１の接続がデータ構造内に特定される場合には、ウェブ・ページを提起することができかつ第１の接続と関連するウインドウの少なくとも部分におけるリクエストを処理する段階と、を含む方法。（もっと読む）

ザ・トラスティーズ・オブ・コロンビア・ユニバーシティ・イン・ザ・シティ・オブ・ニューヨーク (25)

ＡＶ機器

【課題】ユーザの所望とする情報やこれに対する付加的情報を容易に出力できるＡＶ機器を実現する。
【解決手段】関連情報取得部１０には、外部ソース装置から外部ソース音信号Ｓｓ０，Ｓｓ１が入力される。関連情報取得部１０には、エコーキャンセル後収音信号Ｓｍｅ１〜Ｓｍｅ８が入力される。関連情報取得部１０は、エコーキャンセル後収音信号Ｓｍｅ１〜Ｓｍｅ８から話者音声信号Ｓｓｐを生成し、ユーザの発言に対応する発音信号Ｓｓｐａを生成する。関連情報取得部１０は、発音信号Ｓｓｐａに対応する発音区間外部ソース音信号Ｓｓａを生成し、これらを音声認識処理する。関連情報取得部１０は、音声認識結果を参照して、ユーザの発言、および、この発言と同じタイミングでの外部ソース音に基づく情報検索の語句を抽出し、関連情報を検索する。得られた関連情報は、表示装置３００に表示される。（もっと読む）

ヤマハ株式会社 (5,930)

情報記録装置、情報記録方法、情報記録プログラムおよび記録媒体

【課題】煩雑な操作をおこなうことなく訪問地の印象を記録すること。
【解決手段】情報記録装置１００は、所定の地物に対するコメントを記録する。位置情報取得部１０１は、自装置が搭載された移動体の現在位置情報を取得する。位置判断部１０２は、所定の地物から所定範囲内に移動体が位置するか否かを判断する。音声解析部１０３は、移動体が所定の地物から所定範囲内に位置する場合、移動体の搭乗者の発話の内容を継続的に解析する。関連性判断部１０４は、音声解析部１０３による解析結果に基づいて、発話の内容が所定の地物に関するものか否かを判断する。記録部１０５は、発話の内容が所定の地物に関するものであると判断された場合、所定の地物と発話の内容とを関連付けて記録する。（もっと読む）

パイオニア株式会社 (3,620)

情報処理装置及びプログラム

【課題】使い勝手をより向上させることができる情報処理装置を提供する。
【解決手段】音声入力部１は、入力された音声に対応する音声信号に位相差が生じるように、その数及び配置が決定された複数のマイクロホンを用いて周囲の音声を入力する。音源定位分離部２は、複数のマイクロホンにそれぞれ入力された音声に対応する音声信号の位相差に基づいてその音声信号に対応する音声が発せられた音源の位置を特定し、特定された音源の位置に基づいて音声信号から音声情報を音源ごとに分離抽出する。音声解析部３は、音源定位分離部２によって分離抽出された音声情報を解析して、音声情報に対応する文章情報を作成し、作成された文章情報を音源に対応付ける。記憶部４は、音声解析部３によって作成された文章情報を蓄積する。（もっと読む）

ＮＥＣカシオモバイルコミュニケーションズ株式会社 (1,081)

位置に基づくサービスシステムのための自然言語処理

【課題】種々の形式の通信システムに接続された遠隔端末へ、位置に基づくサービスを提供するための方法及びシステムを提供する。
【解決手段】あつらえた情報要求が遠隔端末で発生される。遠隔端末に関連した地理的インジケータも発生される。上記あつらえた情報要求及び地理的インジケータは、位置に基づくアプリケーションサーバーへ送信される。そのあつらえた情報要求に対する構造化された応答が、位置に基づくアプリケーションサーバーで発生され、この構造化された応答は、遠隔端末の地理的インジケータに基づくものである。この構造化された応答は、多数の異なる形式の通信プロトコル及び／又は媒体の１つを使用して遠隔端末へ送信される。（もっと読む）

アクセンチュア　リミテッド　ライアビリティ　パートナーシップ (1)

音声認識装置、音声認識方法および、そのプログラム並びに記録媒体

【課題】特定話者と不特定話者が混在した音声を発話単位ごとに精度よくテキストに変換する音声認識装置を提供する。
【解決手段】音声認識を行なう分野に応じた不特定話者用専門用語辞書２３０、２３１、２３２を設定し、音声２００が入力されると発話単位ごとに、音声２００の特徴を抽出し、予め登録した話者モデル２１０、２１１、２１２と照合し話者を推定する。その推定結果に応じて、話者ごとの特定話者用辞書２２０、２２１、２２２、話者が特定できない場合の話者不明用辞書２２３の中から辞書を選択する。入力された音声２００が不特定話者用専門用語辞書２３０、２３１、２３２に登録された音声であれば、音声認識を行なう辞書を不特定話者用専門用語辞書２３０、２３１、２３２に切り替える。設定された辞書により音声認識処理を行いテキスト２０４に変換する。（もっと読む）

パナソニック株式会社 (73,050)

オペレーティングシステム及びオペレーティング方法

【課題】より適切に要求される情報の候補を検索することが可能なオペレーティングシステム及びオペレーティング方法を提供する。
【解決手段】ドライバーとオペレータとの対話に基づいて、情報が記憶された用件ＤＢ２１０からドライバーが要求する用件の候補を検索し、ドライバーへの案内のためにオペレータに提示する用件判定機能部２０５を備えたオペレーティングシステム１０において、用件判定機能部２０５は、ドライバーとオペレータとの対話に基づいて検索される用件の候補に応じて、オペレータに検索に用いることが可能な情報を提示する。そのため、オペレータは、提示された検索に用いることが可能な情報を用いて、より適切に要求される用件の候補を検索することが可能となる。（もっと読む）

トヨタ自動車株式会社 (59,920)

感情推定装置及び感情推定方法

【課題】個人毎で異なる音質に対応し、感情を推定できる感情推定装置を提供する。
【解決手段】車両のイベントを検出するイベント検出手段と、車両のイベント毎に操作者の感情を表す感情データがそれぞれ対応づけられている第１のテーブルを予め保持するイベント感情データ保持手段と、操作者の音声を入力する音声入力手段と、音声入力手段に入力される音声の特徴を抽出する音響特徴抽出手段と、音声の特徴と感情データが示す感情とを対応づけて第２のテーブルに保持する音声感情格納手段と、第２のテーブルを用いて、音声入力手段に入力される音声の特徴から操作者の感情を推定する制御手段とを備える。（もっと読む）

日産自動車株式会社 (16,386)

音声認識装置、音声認識方法およびプログラム

【課題】登録する語彙数を少なくし、かつ認識が容易でない語彙の認識性能を向上する音声認識装置を提供する。
【解決手段】音声認識装置１は、繰り返し発声を判定する繰り返し発声判定部１５と、繰り返し発声の各音声の特徴量を抽出する音声特徴量抽出部１２と、各音声についての音声認識処理を行い、各音声に類似する語彙との類似度を含む認識データを得る音声認識部１３と、音声認識部１３により得られた認識データの類似度に基づいて、認識結果を出力する認識結果処理部１４と、繰り返し発声判定部１５により繰り返し発声と判定され、かつ認識結果処理部１４により音声認識に成功した認識結果が出力されたときに、各音声の特徴量に基づく登録データを特定話者認識辞書１７に登録する音声特徴登録部１６とを有する。（もっと読む）

株式会社東芝 (54,554)

情報処理装置、プログラム、および音響モデルを生成する方法

【課題】音声データ中から低い認識率の音声データに類似する音声データを選択する。
【解決手段】情報処理装置30は、不特定多数話者の音声データセット242内の各音声データについて、低認識率話者の音声データセット222における平均的な声に対する類似度S0を求める類似度算出部110と、類似度が選択範囲内となる音声データを選択音声データセット232に保存する音声データ選択部112と、音声データセットと選択音声データセットに保存されている音声データとを用いて、音響モデル330を生成する音響モデル生成部と、を具えている。（もっと読む）

富士通株式会社 (25,993)

分散音声認識プロセスにおけるエラーの軽減方法および装置

【課題】分散音声認識プロセスにおいてエラーを緩和する手段を提供する。
【解決手段】特定されたベクトル・グループ内の一つまたはそれ以上の音声認識パラメータが、この特定されたベクトル・グループの後に受信されたベクトルからの一つまたはそれ以上の音声認識パラメータを参照することによって判定された各置換パラメータによって置換される際に、音声認識プロセスにおいて待ち時間(latency)を許容する可能性が有利に利用される。（もっと読む）

モトローラ・リミテッド (2)

販売支援システム、その店舗サーバ装置および店頭収容ラックおよび販売処理装置およびユーザ操作端末、そのコンピュータプログラムおよびデータ処理方法

【課題】一般ユーザによるアクセスが容易ではないレジ店員スペースに配置されていることがあるタバコパックなどの店頭販売商品でも、購入を簡単かつ迅速としてＬＴＶとリテンションを向上させる販売支援システムを提供する。
【解決手段】一般ユーザが音声入力部１１０に所望のタバコパックＳＴＰの商品呼称発声を音声入力すると、そのタバコパックＳＴＰの商品収容位置ＰＫＳが店頭収容ラック３００で報知出力されるとともに、そのタバコパックＳＴＰが販売処理装置２００で報知出力される。従って、店舗作業員は販売処理装置２００を入力操作している状態でも、一般ユーザが所望しているタバコパックＳＴＰを即座に正確に認識することができ、そのタバコパックＳＴＰが収容されている店頭収容ラック３００の商品収容位置ＰＫＳも即座に正確に発見することができる。（もっと読む）

日本たばこ産業株式会社 (406)

検索装置、検索方法、及び、プログラム

【課題】曖昧な記憶に基づく音声入力による検索によっても、効果的に検索対象を抽出することが可能な検索装置を提供する。
【解決手段】履歴記憶手段は、検索により得られた施設情報及び検索日を記憶部に履歴として記憶する。関連記憶手段は、複数の日に関する文言を含む日検索用語、並びに、施設情報及び属性を関連づけて記憶部に記憶する。日に係る検索用語は月日の経過により変化することから変更手段は、記憶部に記憶した検索日及び時計部から出力される日に基づき、記憶部に記憶した日検索用語を変更する。音声による検索のため、受け付け手段は音声入力された日検索用語、及び、施設情報または属性を受け付ける。そして、抽出手段は記憶部に記憶した変更手段による変更後の日検索用語、施設情報及び属性を参照し、受け付けた日検索用語、及び、施設情報または属性に対応する検索対象を抽出する。（もっと読む）

富士通株式会社 (25,993)

1 - 20 / 117

[ Back to top ]

Fターム［5D015AA02］の内容

Fターム［5D015AA02］に分類される特許

音声処理装置及び音声処理装置の検査方法

対話制御装置、対話制御方法及び対話制御用コンピュータプログラム

楽曲検索装置

発言管理システム、発言管理方法及び発言管理プログラム

音声認識システムおよびこれを用いた検索システム

機械翻訳装置、機械翻訳方法および機械翻訳プログラム

自然言語インターフェースコントロールシステム

ウェブ・ページを音声付勢するためのシステム及び方法

ＡＶ機器

情報記録装置、情報記録方法、情報記録プログラムおよび記録媒体

情報処理装置及びプログラム

位置に基づくサービスシステムのための自然言語処理

音声認識装置、音声認識方法および、そのプログラム並びに記録媒体

オペレーティングシステム及びオペレーティング方法

感情推定装置及び感情推定方法

音声認識装置、音声認識方法およびプログラム

情報処理装置、プログラム、および音響モデルを生成する方法

分散音声認識プロセスにおけるエラーの軽減方法および装置

販売支援システム、その店舗サーバ装置および店頭収容ラックおよび販売処理装置およびユーザ操作端末、そのコンピュータプログラムおよびデータ処理方法

検索装置、検索方法、及び、プログラム

メニュー

スポンサーリンク

Fターム［5D015AA02］の内容

Fターム［5D015AA02］に分類される特許

メニュー

スポンサー リンク

スポンサーリンク