説明

Fターム[5D015AA02]の内容

音声認識 (5,191) | 目的、機能 (1,020) | 不特定話者音声の認識 (117)

Fターム[5D015AA02]に分類される特許

1 - 20 / 117


【課題】実装された状態遷移モデルの評価において、時間などの要件に対するコストバランスを考慮した評価が可能な音声処理装置を提供する。
【解決手段】音声処理装置が、音声認識部と、状態遷移モデルと、前記音声認識部の認識結果を用いて前記状態遷移モデルの状態遷移を制御する第1の制御部と、を含み、前記第1の制御部は、第1の実行モードと第2の実行モードとを有し、前記第1の実行モードは、前記状態遷移モデルにおける分岐ノードの実行が1回であり、前記第2の実行モードは、前記分岐ノードの実行がすべての分岐に対して行われることが可能であることを特徴とする。 (もっと読む)


【課題】複数の情報供給源が有っても、ユーザが所望する情報を正確に提供できる対話制御装置を提供する。
【解決手段】対話制御装置1は、サービス識別子と情報識別子の複数の組と各組に関連するキーワード及び重み係数とを記憶する記憶部32と、各キーワードについて入力された音声信号から検出された認識候補単語との類似度を重み係数が大きいほど大きくなるように算出し、類似度が最大となるキーワードを検出するキーワード決定部34と、検出されたキーワードと関連するサービス識別子と情報識別子の組により特定される提示情報を取得する提示情報取得部35と、現在の提示情報の供給源を表す第1のサービス識別子が以前に取得された提示情報の供給源を表す第2のサービス識別子との差異の有無に基づいて第1のサービス識別子と関連するキーワードの重み係数及び第2のサービス識別子と関連するキーワードの重み係数を更新する重み更新部39とを有する。 (もっと読む)


【課題】あいまいな情報に基づいて楽曲に関する検索が可能であり、その検索を行うために必要な手間およびコストを低減することができる楽曲検索装置を提供すること。
【解決手段】オーディオ装置1は、複数の楽曲のそれぞれに対応させて複数の付属情報を格納するコンテンツリスト格納部30と、付属情報の特定に必要な検索情報を指定する検索情報指定部12と、指定された検索情報を検索キーとしてインターネットを介して接続された検索処理部80に対して情報の検索を依頼する検索依頼部14と、この依頼に応じて送られてくる検索結果情報を取得する検索結果取得部16と、取得した検索結果情報に基づいて検索対象の付属情報を特定する付属情報特定部18とを備えている。 (もっと読む)


【課題】会議等における発言についての記録を作成するとともに、円滑な議事進行を支援するための発言管理システム、発言管理方法及び発言管理プログラムを提供する。
【解決手段】会議支援サーバ20の制御部21は、音声を取得し、音声認識処理を実行する。そして、発言管理情報記憶部25に、認識結果を記録する。次に、制御部21は、発言管理情報記憶部25を用いて、キーワード抽出処理を実行する。キーワードに基づいて実行される会議進行管理処理において、議事進行があったと判定した場合、制御部21は、議事項目の消込処理を実行する。また、キーワードに基づいて実行される説明表示管理処理においては、制御部21は、参考情報を検索し、クライアント端末10において表示候補を出力する。 (もっと読む)


【課題】認識精度を向上させることができるとともに正しい認識結果を得るまでの操作を簡略化することができる音声認識システムを提供すること。
【解決手段】車載装置100は、話者が発声した音声を保存する音声保存バッファ112と、認識辞書116を用いて、音声保存バッファ112に保存された音声に対して音声認識処理を行う音声認識部114とを備える。施設検索サーバ150は、認識辞書116と異なる認識辞書162を用いて、音声保存バッファ112に保存された音声に対して音声認識処理を行う音声認識部160とを備える。車載装置100に備わった優先度調整部122は、2つの音声認識部114、160の認識結果に基づいて、音声保存バッファ112に保存された音声に対応する認識候補を決定する。 (もっと読む)


【課題】
利用者の現在の利用シーンに対応する適応モデルをオンラインで動的に生成する機械翻訳装置を実現することである。
【解決手段】
実施形態の機械翻訳装置は、第1言語を入力する言語入力手段と、前記言語入力手段に入力された第1言語の利用者もしくは利用場所に関する付加情報を取得する付加情報取得手段と、第2言語と当該第2言語を取得した際の利用者もしくは利用場所に関する付加情報を対応付けた第2言語の参照データを格納する参照データ格納手段と、前記付加情報取得手段で取得された第1言語の付加情報の全部あるいは一部と同一な内容の付加情報を有する第2言語のテキスト情報を取得するテキスト情報取得手段と、前記テキスト情報取得手段によって取得された第2言語のテキスト情報を利用して、前記言語入力手段に入力された第1言語を第2言語に翻訳する翻訳手段とを備える。 (もっと読む)


【課題】音声認識方法において、自然言語の音声を認識する。
【解決手段】複数のデバイス(114)を操作する自然言語インターフェースコントロールシステム(206)は、第1のマイクロフォンセット(108)と、第1のマイクロフォンセットに接続された特徴抽出モジュール(202)と、記特徴抽出モジュールに接続された音声認識モジュール(204)を有し、音声認識モジュールは隠れマルコフモデルを用いる。また、システムは、音声認識モジュール(204)に接続された自然言語インタフェースモジュール(222)と、自然言語インターフェースモジュール(222)に接続されたデバイスインターフェース(210)を有し、自然言語インターフェースモジュールは、ユーザからの非プロンプト式で開放型の自然言語要求に基づいて、デバイスインターフェースに接続された複数のデバイスを操作する。 (もっと読む)


【課題】ウェブ・ページを特定するデータのための音声リクエストを処理するための方法を提供する。
【解決手段】前記方法は、ルールベースのグラマ・ステートマントを含む、ウェブ・ページを特定するデータのための音声リクエストを処理するための方法であって、ルールベースのグラマ・ステートマントと関連したグラマを識別する段階と、グラマと関連しているとして識別された第1の接続が、1つまたは複数の接続を識別するデータ構造において特定されているか否かを決定する段階と、グラマと関連しているとして識別された第1の接続がデータ構造内に特定される場合には、ウェブ・ページを提起することができかつ第1の接続と関連するウインドウの少なくとも部分におけるリクエストを処理する段階と、を含む方法。 (もっと読む)


【課題】ユーザの所望とする情報やこれに対する付加的情報を容易に出力できるAV機器を実現する。
【解決手段】関連情報取得部10には、外部ソース装置から外部ソース音信号Ss0,Ss1が入力される。関連情報取得部10には、エコーキャンセル後収音信号Sme1〜Sme8が入力される。関連情報取得部10は、エコーキャンセル後収音信号Sme1〜Sme8から話者音声信号Sspを生成し、ユーザの発言に対応する発音信号Sspaを生成する。関連情報取得部10は、発音信号Sspaに対応する発音区間外部ソース音信号Ssaを生成し、これらを音声認識処理する。関連情報取得部10は、音声認識結果を参照して、ユーザの発言、および、この発言と同じタイミングでの外部ソース音に基づく情報検索の語句を抽出し、関連情報を検索する。得られた関連情報は、表示装置300に表示される。 (もっと読む)


【課題】煩雑な操作をおこなうことなく訪問地の印象を記録すること。
【解決手段】情報記録装置100は、所定の地物に対するコメントを記録する。位置情報取得部101は、自装置が搭載された移動体の現在位置情報を取得する。位置判断部102は、所定の地物から所定範囲内に移動体が位置するか否かを判断する。音声解析部103は、移動体が所定の地物から所定範囲内に位置する場合、移動体の搭乗者の発話の内容を継続的に解析する。関連性判断部104は、音声解析部103による解析結果に基づいて、発話の内容が所定の地物に関するものか否かを判断する。記録部105は、発話の内容が所定の地物に関するものであると判断された場合、所定の地物と発話の内容とを関連付けて記録する。 (もっと読む)


【課題】使い勝手をより向上させることができる情報処理装置を提供する。
【解決手段】音声入力部1は、入力された音声に対応する音声信号に位相差が生じるように、その数及び配置が決定された複数のマイクロホンを用いて周囲の音声を入力する。音源定位分離部2は、複数のマイクロホンにそれぞれ入力された音声に対応する音声信号の位相差に基づいてその音声信号に対応する音声が発せられた音源の位置を特定し、特定された音源の位置に基づいて音声信号から音声情報を音源ごとに分離抽出する。音声解析部3は、音源定位分離部2によって分離抽出された音声情報を解析して、音声情報に対応する文章情報を作成し、作成された文章情報を音源に対応付ける。記憶部4は、音声解析部3によって作成された文章情報を蓄積する。 (もっと読む)


【課題】種々の形式の通信システムに接続された遠隔端末へ、位置に基づくサービスを提供するための方法及びシステムを提供する。
【解決手段】あつらえた情報要求が遠隔端末で発生される。遠隔端末に関連した地理的インジケータも発生される。上記あつらえた情報要求及び地理的インジケータは、位置に基づくアプリケーションサーバーへ送信される。そのあつらえた情報要求に対する構造化された応答が、位置に基づくアプリケーションサーバーで発生され、この構造化された応答は、遠隔端末の地理的インジケータに基づくものである。この構造化された応答は、多数の異なる形式の通信プロトコル及び/又は媒体の1つを使用して遠隔端末へ送信される。 (もっと読む)


【課題】特定話者と不特定話者が混在した音声を発話単位ごとに精度よくテキストに変換する音声認識装置を提供する。
【解決手段】音声認識を行なう分野に応じた不特定話者用専門用語辞書230、231、232を設定し、音声200が入力されると発話単位ごとに、音声200の特徴を抽出し、予め登録した話者モデル210、211、212と照合し話者を推定する。その推定結果に応じて、話者ごとの特定話者用辞書220、221、222、話者が特定できない場合の話者不明用辞書223の中から辞書を選択する。入力された音声200が不特定話者用専門用語辞書230、231、232に登録された音声であれば、音声認識を行なう辞書を不特定話者用専門用語辞書230、231、232に切り替える。設定された辞書により音声認識処理を行いテキスト204に変換する。 (もっと読む)


【課題】より適切に要求される情報の候補を検索することが可能なオペレーティングシステム及びオペレーティング方法を提供する。
【解決手段】ドライバーとオペレータとの対話に基づいて、情報が記憶された用件DB210からドライバーが要求する用件の候補を検索し、ドライバーへの案内のためにオペレータに提示する用件判定機能部205を備えたオペレーティングシステム10において、用件判定機能部205は、ドライバーとオペレータとの対話に基づいて検索される用件の候補に応じて、オペレータに検索に用いることが可能な情報を提示する。そのため、オペレータは、提示された検索に用いることが可能な情報を用いて、より適切に要求される用件の候補を検索することが可能となる。 (もっと読む)


【課題】個人毎で異なる音質に対応し、感情を推定できる感情推定装置を提供する。
【解決手段】車両のイベントを検出するイベント検出手段と、車両のイベント毎に操作者の感情を表す感情データがそれぞれ対応づけられている第1のテーブルを予め保持するイベント感情データ保持手段と、操作者の音声を入力する音声入力手段と、音声入力手段に入力される音声の特徴を抽出する音響特徴抽出手段と、音声の特徴と感情データが示す感情とを対応づけて第2のテーブルに保持する音声感情格納手段と、第2のテーブルを用いて、音声入力手段に入力される音声の特徴から操作者の感情を推定する制御手段とを備える。 (もっと読む)


【課題】登録する語彙数を少なくし、かつ認識が容易でない語彙の認識性能を向上する音声認識装置を提供する。
【解決手段】音声認識装置1は、繰り返し発声を判定する繰り返し発声判定部15と、繰り返し発声の各音声の特徴量を抽出する音声特徴量抽出部12と、各音声についての音声認識処理を行い、各音声に類似する語彙との類似度を含む認識データを得る音声認識部13と、音声認識部13により得られた認識データの類似度に基づいて、認識結果を出力する認識結果処理部14と、繰り返し発声判定部15により繰り返し発声と判定され、かつ認識結果処理部14により音声認識に成功した認識結果が出力されたときに、各音声の特徴量に基づく登録データを特定話者認識辞書17に登録する音声特徴登録部16とを有する。 (もっと読む)


【課題】音声データ中から低い認識率の音声データに類似する音声データを選択する。
【解決手段】情報処理装置30は、不特定多数話者の音声データセット242内の各音声データについて、低認識率話者の音声データセット222における平均的な声に対する類似度S0を求める類似度算出部110と、類似度が選択範囲内となる音声データを選択音声データセット232に保存する音声データ選択部112と、音声データセットと選択音声データセットに保存されている音声データとを用いて、音響モデル330を生成する音響モデル生成部と、を具えている。 (もっと読む)


【課題】分散音声認識プロセスにおいてエラーを緩和する手段を提供する。
【解決手段】特定されたベクトル・グループ内の一つまたはそれ以上の音声認識パラメータが、この特定されたベクトル・グループの後に受信されたベクトルからの一つまたはそれ以上の音声認識パラメータを参照することによって判定された各置換パラメータによって置換される際に、音声認識プロセスにおいて待ち時間(latency)を許容する可能性が有利に利用される。 (もっと読む)


【課題】一般ユーザによるアクセスが容易ではないレジ店員スペースに配置されていることがあるタバコパックなどの店頭販売商品でも、購入を簡単かつ迅速としてLTVとリテンションを向上させる販売支援システムを提供する。
【解決手段】一般ユーザが音声入力部110に所望のタバコパックSTPの商品呼称発声を音声入力すると、そのタバコパックSTPの商品収容位置PKSが店頭収容ラック300で報知出力されるとともに、そのタバコパックSTPが販売処理装置200で報知出力される。従って、店舗作業員は販売処理装置200を入力操作している状態でも、一般ユーザが所望しているタバコパックSTPを即座に正確に認識することができ、そのタバコパックSTPが収容されている店頭収容ラック300の商品収容位置PKSも即座に正確に発見することができる。 (もっと読む)


【課題】曖昧な記憶に基づく音声入力による検索によっても、効果的に検索対象を抽出することが可能な検索装置を提供する。
【解決手段】履歴記憶手段は、検索により得られた施設情報及び検索日を記憶部に履歴として記憶する。関連記憶手段は、複数の日に関する文言を含む日検索用語、並びに、施設情報及び属性を関連づけて記憶部に記憶する。日に係る検索用語は月日の経過により変化することから変更手段は、記憶部に記憶した検索日及び時計部から出力される日に基づき、記憶部に記憶した日検索用語を変更する。音声による検索のため、受け付け手段は音声入力された日検索用語、及び、施設情報または属性を受け付ける。そして、抽出手段は記憶部に記憶した変更手段による変更後の日検索用語、施設情報及び属性を参照し、受け付けた日検索用語、及び、施設情報または属性に対応する検索対象を抽出する。 (もっと読む)


1 - 20 / 117