説明

国際特許分類[G10L15/00]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声認識 (6,879)

国際特許分類[G10L15/00]の下位に属する分類

国際特許分類[G10L15/00]に分類される特許

81 - 90 / 1,893


【課題】両手がふさがった状態でも、正解文字列と実際に記載されている文字列との照合作業を音声により行うことを可能とする音認識装置の提供。
【解決手段】装着者の音声を検出するマイクロフォンと、装着者に音声情報を伝達するスピーカと、正解文字列を読み取るための読取装置と、処理装置と、を備えるハンズフリー型の音声認識装置であって、処理装置が、装着者の読み上げた文字列を音声認識処理し、読取装置で読み取った正解文字列とのマッチングを行い、マッチングの判定結果を出力することを特徴とする音声認識装置。 (もっと読む)


【課題】 AVRCPの制御コマンドに対応しておらず、HFP/HSPに対応している再生装置に対して、ヘッドセットがユーザによる音声入力を要することなく再生装置を制御する。
【解決手段】 ヘッドセットは、ユーザ操作に基づく指示に対応した制御用音声ファイルをROM3に記憶している。再生装置がAVRCPに対応している場合には、ヘッドセットは、第1モードに設定し、入力された指示に対応するAVRCPの制御コマンドを再生装置に送信する。一方、再生装置がAVRCPに対応していない場合には、ヘッドセットは、第2モードに設定し、AVRCPの制御コマンドの代わりに、入力された指示に対応する制御用音声ファイルを読み出して再生し、その音声データをHFP/HSPを用いて再生装置に送信する。 (もっと読む)


【課題】あいまいな情報に基づいて楽曲に関する検索が可能であり、その検索を行うために必要な手間およびコストを低減することができる楽曲検索装置を提供すること。
【解決手段】オーディオ装置1は、複数の楽曲のそれぞれに対応させて複数の付属情報を格納するコンテンツリスト格納部30と、付属情報の特定に必要な検索情報を指定する検索情報指定部12と、指定された検索情報を検索キーとしてインターネットを介して接続された検索処理部80に対して情報の検索を依頼する検索依頼部14と、この依頼に応じて送られてくる検索結果情報を取得する検索結果取得部16と、取得した検索結果情報に基づいて検索対象の付属情報を特定する付属情報特定部18とを備えている。 (もっと読む)


【課題】例えば会議の議事録中における特定の箇所に関連する音声を、高い精度で特定する。
【解決手段】音声変換部201は、複数の発言の内容を複数の第1のテキストデータに変換するとともに、各発言の開始時間を特定する。発言者特定部202は、各発言の発言者を特定する。テキスト入力部206は、第2のテキストデータを入力する。入力時間特定部208は、第2のテキストデータの入力時間及び第2のテキストデータに対応する発言者を特定する。マッチング箇所特定部204は、複数の第1のテキストデータと第2のテキストデータとをマッチングする。音声区間特定部205は、音声変換部201、発言者特定部202、入力時間特定部208及びマッチング箇所特定部204の特定処理の結果に基づいて、複数の第1のテキストデータから第2のテキストデータに対応する第1のテキストデータを特定する。 (もっと読む)


【課題】会議に関する補足項目を容易に管理することが可能な会議システムおよびそれに関連する技術を提供する。
【解決手段】この会議システムは、各発言者の発言内容を音声認識して文字データに変換する音声認識手段と、文字データに変換された発言内容から所定のキーワード(例えば「「フォローアップ必要」)をトリガー情報として検出する検出手段とを備える。また、この会議システムは、トリガー情報の検出に応じて、或る発言者の発言に関連して補足処理(フォローアップ処理)を行うべき補足項目(フォローアップ項目)LM1,LM2,...を作成し、当該補足項目LM1,LM2,...を含む補足リスト(フォローアップリスト)FLを作成するリスト作成手段を備えるとともに、当該補足リストの表示用データを生成する表示制御手段をさらに備える。 (もっと読む)


【課題】タッチパネルを用いて操作入力を行う携帯端末の画面を車両用装置で表示させる場合において、車両用装置側で受け付けた音声コマンドに基づいて携帯端末を操作することを可能にする。
【解決手段】携帯電話機1から受信した画像データが示す画面中に含まれることになるテキスト符号データを抽出するとともに、画面上の配置領域を特定する。また、抽出したテキスト符号データとそのテキスト符号データについての配置領域との対応関係を示す辞書を辞書作成部31で作成する。そして、ユーザが発話した音声コマンドを変換したテキストをもとに辞書を参照し、当該テキストに相当するテキスト符号データに対応する配置領域を得て、得られた当該配置領域に対応する携帯電話機1の画面上での操作対象領域を特定し、その領域を示す信号を携帯電話機1へ送信する。 (もっと読む)


【課題】会議等における発言についての記録を作成するとともに、円滑な議事進行を支援するための発言管理システム、発言管理方法及び発言管理プログラムを提供する。
【解決手段】会議支援サーバ20の制御部21は、音声を取得し、音声認識処理を実行する。そして、発言管理情報記憶部25に、認識結果を記録する。次に、制御部21は、発言管理情報記憶部25を用いて、キーワード抽出処理を実行する。キーワードに基づいて実行される会議進行管理処理において、議事進行があったと判定した場合、制御部21は、議事項目の消込処理を実行する。また、キーワードに基づいて実行される説明表示管理処理においては、制御部21は、参考情報を検索し、クライアント端末10において表示候補を出力する。 (もっと読む)


【課題】リソースが制限された環境のための一組のアプリケーション・プログラム・インターフェース(Application Program Interface)(API)を提供する。
【解決手段】APIは、リソースが制限された環境のためのオペレーティング・システムの様々なコンポーネント及びモジュールと接続するためのメカニズムを、コンピュータ・アプリケーションに供給する。前記APIはさらに、リソースが制限された環境においてランする埋め込み型システムにおいて共通して見られる入力/出力装置と接続するためのメカニズムを供給する。 (もっと読む)


【課題】音響信号の時間伸縮の可能性を考慮し、参照信号と蓄積信号上の参照信号に類似した区間の長さが異なる場合にも、参照信号と類似する音を含む区間を、蓄積信号中で精度よく検出することができるようにする。
【解決手段】周波数帯域毎に、各小領域参照信号スペクトログラムと類似する小領域蓄積信号スペクトログラムを検出する。周波数帯域毎に検出された、各小領域参照信号スペクトログラムに類似した小領域蓄積信号スペクトログラムの小領域類似度を、予め定められた区間伸縮率の範囲に基づく、該小領域蓄積信号スペクトログラムを含む蓄積信号の複数の時刻tを先頭とする区間の各々の区間類似度に加算することにより、蓄積信号の各区間に対する区間類似度を計算する。区間類似度に基づいて、蓄積信号中の参照信号と類似する音を含む区間を検出する。 (もっと読む)


【課題】 音声認識処理を行う場合に、優先度に応じて音声認識処理を行うことができる音声認識装置及び音声認識処理方法を提供することを目的とする。
【解決手段】 音声認識装置300は、音声データを外部から取得し、取得した音声データを一次出力データベース303へ記録し、一次出力データベース303に記録される音声データを、処理すべき優先度に応じた条件を記憶する優先度メモリ305に記憶される条件と比較し、条件に一致した音声データをその条件の優先度に応じて音声認識処理を行わせるとともに、その音声データに対する追加処理を音声認識処理部306に対して指示する。音声認識処理された音声認識結果は、格納処理部307によって音声認識結果データベース300Dへ優先度と関連付けされて格納される。 (もっと読む)


81 - 90 / 1,893