説明

Fターム[5D015AA01]の内容

音声認識 (5,191) | 目的、機能 (1,020) | 連続音声の認識 (112)

Fターム[5D015AA01]に分類される特許

1 - 20 / 112



【課題】会議の議事録に記録された発話内容が、どの資料に関連するものであるのかが分かるようにすることを目的とする。
【解決手段】議事録作成装置は、ユーザが発話した場合に、当該発話したユーザが用いる情報端末に資料の情報を要求する資料情報要求手段と、前記ユーザの発話内容と前記資料の情報とを関連付けた議事録を作成する議事録作成手段と、を有し、前記情報端末は、前記資料情報要求手段からの要求を受けつける資料情報要求受付手段と、前記資料情報要求受付手段が前記要求を受け付けた場合に当該端末が表示中の前記資料の情報を取得する資料情報取得手段と、取得された前記資料の情報を前記議事録作成装置に送信する資料情報送信手段と、を有する、議事録作成システムを提供する。 (もっと読む)


【課題】MP3などの音声圧縮方法等により予め作成した種々の会話のデータを、好きな音声に置換し、センサにより簡便に会話モードを適選設定して、当該モードでの対話型の会話を行うことができる音声発生及び認識装置を提供する。
【解決手段】
音声発生及び認識装置に、書き換え可能な記憶手段と、音声入力手段と、MP3などの音声圧縮方法等により予め作成した種々の会話データの入力手段と、音声認識手段と、声紋分析置換手段と、筐体の状態を検出する少なくとも1つのセンサとを設けた構成とした (もっと読む)


【課題】ユーザが入力するメッセージテキストに合致する音声を再現した任意のメッセージ映像データの作成を容易に実現する。
【解決手段】映像データに付随し時刻毎に分割された音声データの発声内容を示すと共に前記映像データと前記発声内容とを対応付ける対応情報を格納する素材情報データベース17と、ユーザにより入力されたテキストデータを構成する最小単位のテキストデータにそれぞれ対応する発声内容の音声データおよび前記音声データに対応付けられた映像データを、対応情報に基づいて元映像データベース3から抽出する素材選択部23と、前記抽出した音声データおよび映像データを前記テキストデータの並び順に連結して音声データが付随した映像データの候補を提示する候補提示部25と、を備える。 (もっと読む)


【課題】発音の変化にも対応可能な音声認識装置を提供する。
【解決手段】音響モデル記憶部11、辞書情報記憶部12、音声信号に応じた特徴量を受け付け、音響モデル、辞書情報、辞書情報に含まれる音素列に関する言語モデルである音素列言語モデルを用いて、特徴量に対応する確率の高い音素列の並びを取得する取得部16、音素の並びと、音素の並びに対応する文字列の並びとを対応付けるパラレルコーパスから生成された変換モデルが記憶される変換モデル記憶部17、文字列言語モデルが記憶される文字列言語モデル記憶部18、変換モデルと文字列言語モデルを用いて、取得された音素列の並びに対応する文字列の並びのうち、確率の高いものを選択することによって、音素列の並びを文字列の並びに統計的に変換する変換部19、変換後の文字列の並びである音声認識結果を出力する出力部20を備える。 (もっと読む)


【課題】 音声認識辞書の単語単位とキーワードの単語単位とが異なる場合でも、音声認識結果に所定のキーワードが含まれるかどうかを精度よく判定できる音声認識結果検索装置を提供する。
【解決手段】 音声認識結果検索装置は、入力音声に対する認識処理の結果の候補である認識候補と、該各認識候補に付与された前記入力音声と類似する度合いを示す音声認識スコアとを、音声認識結果として取得すると共に、前記各音声認識スコアを、互いに共通の所定の特徴を有する認識候補にそれぞれ付与された音声認識スコアを用いて再計算する音声認識スコア再計算手段と、前記再計算された音声認識スコアに基づいて、所定のキーワードと前記音声認識結果との距離を算出する距離計算手段と、前記算出された距離に基づいて、前記所定のキーワードが前記音声認識結果に含まれるか否かを判定するキーワード探索手段とを備える。 (もっと読む)


【課題】周囲の雑音による影響を受け難く、特定の話者の音声を精度よく翻訳して表示できる眼鏡型表示装置を提供する。
【解決手段】周囲の音を受音して音信号に変換し視界を撮像する眼鏡型表示装置1は、撮像された視界の画像データから話者の顔画像データ及び顔特徴データの少なくとも一方を抽出し、その顔画像データ及び顔特徴データ並びに周囲の音の音信号の少なくとも一つに基づいて、話者の音声信号を特定して抽出する。また、前記話者の音声信号をテキストデータに変換し、そのテキストデータを、そのテキストデータの言語とは異なる他の言語のテキストデータに変換する。他の言語に翻訳されたテキストデータは視界内に重ねて表示される。 (もっと読む)


【課題】利用者の発話に適したエキスパート部を選択する。
【解決手段】音声入力部は音声を入力し、音声認識部は入力した音声を認識し、予め定めた処理を行う場合、音声認識部が認識した認識結果に基づいて前記処理を継続するか否かを判定し、前記処理を行わない場合、音声認識部が認識した認識結果に基づいて適合性を推定する複数のエキスパート部と、複数のエキスパート部のうち前記処理を行うエキスパート部が処理を継続しないと判断した場合、前記処理を行わない場合に推定した適合性に基づいて前記処理を行うエキスパート部を選択する動作理解部とを備える。 (もっと読む)


【課題】 管制官から経路に関係する音声の管制指示で経路情報を自動的に構成することにより、手動操作による管制指示の問題を解消し、周囲状況の継続監視の徹底を図る。
【解決手段】 管制官から発せられる経路に関係する音声の管制指示が入力される音声入力部52と、この音声入力部52から出力される電気的な管制指示データを意味情報に変換する音声認識部54と、この音声認識部54で変換された意味情報から少なくとも経路要素情報を抽出する管制指示分析部55と、抽出された経路要素情報を所定の順序で繋ぎあわせて経路情報を構成する経路情報構成部57とを備える管制操作支援装置である。 (もっと読む)


【課題】ユーザが音声認識を利用してデータベースから特定の情報を絞り込む際に、効率的に検索結果を絞り込むことのできる音声検索インタフェース装置を得る。
【解決手段】検索手段105は、音声認識結果の単語または単語列に対して検索用データベース104を検索してその検索結果と検索候補数を出力する。修正候補生成手段111は、修正対象単語選択手段109で修正対象単語が選択された場合、その修正対象単語と、読み・音節記憶手段110の単語とのマッチングを行い、単語単位の修正候補を生成し、かつ、修正候補に対する検索候補数を取得する。修正候補表示手段112は、修正候補生成手段111で得られた修正候補と検索候補数とを表示する。 (もっと読む)


【課題】例えばデータマイニングに用いるテキストを生成するのに好適な音声認識方法を提供する。
【解決手段】この発明の音声認識方法は、音声認識過程と、音声文書認識信頼度計算過程と、音声文書除去過程と、単語除去過程と、を含み、音声認識過程は入力される音声文書を音声認識処理した単語毎に単語認識信頼度を付与した音声認識結果を出力し、音声文書認識信頼度計算過程は音声認識結果を入力として音声文書全体の認識信頼度である音声文書認識信頼度を計算して出力する。そして、音声文書除去過程は音声認識結果と音声文書認識信頼度とを入力として所定の音声文書認識信頼度閾値未満の音声文書を除去し、単語除去過程は音声文書除去過程で除去されなかった音声文書の音声認識結果から所定の単語認識信頼度閾値未満の単語認識信頼度の単語を除去する。 (もっと読む)


【課題】既存のアプリケーションに対し極めて容易に音声入力機能を採り入れることができる業務支援装置を提供すること。
【解決手段】プラットフォームサーバ600は、アプリケーションを対象とした入力音声を受信する音声受信部621と、音声認識処理を音声認識システムに実行させる音声認識制御部620と、音声認識処理の結果を送信するテキスト送信部641とを有する。音声受信部621は、アプリケーションに組み込まれた入力切替機能部から、発話者を特定する発話者IDと、入力対象を特定する入力対象IDとを受信する。音声認識制御部620は、発話者IDに基づいて、音声認識システムに対し、発話者毎にカスタマイズされた音声認識処理を実行させる。テキスト送信部641は、音声認識処理の結果であるテキストを、発話者IDおよび入力対象IDに基づいて、発話者によるテキスト入力としてアプリケーションへ送信する。 (もっと読む)


【課題】回動可能な頭部に備えられた音声入力部に、360度全方向から入力される音声から、ノイズ音が出力される方向を除外して、発話者がいる方向を推定するロボットを提供する。
【解決手段】ロボットRは、回動可能な頭部R1にて所定の角度で離間して配設される3以上の音声入力部MCと、それら音声入力部が出力する音声データ(音響信号データ)から全方向音圧成分データを生成する音声データ処理部22と、頭部R1の回動角度を測定する回動角測定部(自律移動制御部50)と、音源として推定しない方向の範囲(除外角度範囲)が記憶された記憶部30と、音源方向を推定する音源方向推定部23とを備え、音源方向推定部23が、測定された回動角度を用いて、全方向音圧成分データから除外角度範囲内にあるデータを除去する。 (もっと読む)


【課題】音声認識方法において、自然言語の音声を認識する。
【解決手段】複数のデバイス(114)を操作する自然言語インターフェースコントロールシステム(206)は、第1のマイクロフォンセット(108)と、第1のマイクロフォンセットに接続された特徴抽出モジュール(202)と、記特徴抽出モジュールに接続された音声認識モジュール(204)を有し、音声認識モジュールは隠れマルコフモデルを用いる。また、システムは、音声認識モジュール(204)に接続された自然言語インタフェースモジュール(222)と、自然言語インターフェースモジュール(222)に接続されたデバイスインターフェース(210)を有し、自然言語インターフェースモジュールは、ユーザからの非プロンプト式で開放型の自然言語要求に基づいて、デバイスインターフェースに接続された複数のデバイスを操作する。 (もっと読む)


【課題】中断した発話を円滑に再開する音声対話装置を提供する。
【解決手段】 音声対話装置(コミュニケーションロボット)は、音声合成部21aによって、発話情報に基づいて音声出力(発話)する。音声対話装置は、音声入力部21bによって音声の入力を検出すると、発話中断処理手段473aによって音声合成部21aによる発話を中断させる。次に、音声対話装置は、応答行動選択手段473cによって、中断の原因となった入力音声に対する応答行動を選択して実行する。そして、音声対話装置は、再開位置決定手段473bによって、応答行動の実行状況に応じて、中断させた発話情報おける発話の再開位置を決定し、決定した再開位置から発話を再開させる。 (もっと読む)


【課題】ユーザの発した音声に応じて認識処理を順方向に行うか逆方向に行うかを適切に切り替え可能な音声認識装置およびプログラムを提供する。
【解決手段】順方向辞書に基づき、音声情報を順方向に再生することにより認識処理を順方向に行い(S401)、順方向に認識処理した認識結果に基づき、音声情報における固定語の位置を推定する(S403、S405)。固定語が音声情報の後半にあると推定された場合(S405)、逆方向辞書に基づき、音声情報を逆方向に再生することにより認識処理を逆方向に行う(S406)。これにより、ユーザの発した音声の固定語の位置に基づき、音声情報の認識処理を順方向に行うか逆方向に行うか、を適切に切り替えることができるので、ユーザに認識処理方向に関する操作を意識させることなく音声認識の精度が向上する。 (もっと読む)


【課題】辞書に存在しない未知語あるいは認識誤りを含む大量の音声データから、音声およびテキスト入力による音声検索装置および音声検索方法を提供すること
【解決手段】音声あるいはテキストによる検索入力により、前記入力からの音声データを認識する大語彙連続音声認識において未知語に索引を付与し、さらに未知語の音声データに対して未知語もしくは検索語を音素あるいは音節に分割し、前記未知語の索引に対して複数の検出候補を生成することにより、辞書に存在しない未知語あるいは認識誤りを含む大量の音声データから検索結果を提示する。 (もっと読む)


【課題】ユーザの操作を簡素化することができ、ユーザの使い勝手を向上することが可能な情報処理装置、を提供することを目的とする。
【解決手段】本明細書に記載の情報処理装置は、音声を入力する音声入力部と、入力した音声をテキストデータに変換するテキストデータ生成部と、前記音声入力部が特定の周波数を入力した際に、前記テキストデータ生成部による変換を開始する制御部と、を備えたことを特徴とする情報処理装置である。 (もっと読む)


【課題】データを記憶するための記憶容量を低減するとともに、プライバシーに配慮した、ユーザにとって使い勝手の良い情報処理システムを提供することを目的とする。
【解決手段】本発明の情報処理システムは、音声を入力する入力部と、前記入力部に入力した音声に基づいてテキストデータを生成するテキストデータ生成部と、前記入力部に入力した音声の声紋データを解析する解析部と、前記解析部による解析結果に応じて前記テキストデータ生成部によりテキストデータが生成された音声を消去する消去部と、を備えることを特徴とする情報処理システムである。 (もっと読む)


【課題】音声認識結果として出力させたい読み情報を登録する単語辞書を簡単に作成・編集でき、かつ音声認識処理における認識確率を高めることができる音声認識装置を提供する。
【解決手段】音声認識装置は、音声認識用の複数の単語の読み情報が登録されている第1単語辞書と、音声認識する複数の単語の読み情報が登録される第2単語辞書と、音声データを入力して、第1単語辞書を用いて音声認識する音声認識部と、第2単語辞書に登録されている複数の読み情報の中から、音声認識部で認識された読み情報に少なくとも一部が一致する読み情報を検出する再検出部と、検出された読み情報を出力する結果出力部とを含む。 (もっと読む)


1 - 20 / 112