説明

国際特許分類[G10L15/00]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声認識 (6,879)

国際特許分類[G10L15/00]の下位に属する分類

国際特許分類[G10L15/00]に分類される特許

11 - 20 / 1,893


【課題】乗りかご外部に騒音が発生している状況下での乗りかご内の音声認識精度を向上することができるエレベータ装置を提供する。
【解決手段】音声認識により呼び登録を行うエレベータ装置において、乗りかご内に設けられ、利用者が発した音声の入力を受ける音声入力部と、音声入力部に入力された音声が呼び登録の行先階を表す所定の語彙と合致するかを判定して音声認識を行う音声認識部と、かご戸の開閉動作を制御する戸開閉制御部と、乗りかご内に利用者が乗り込んだことを検知する乗客乗込検知手段と、乗りかご戸開中に音声入力部に入力された騒音レベルを所定の規定値と比較する騒音判定部と、を備え、戸開閉制御部は、乗りかご内に利用者が乗り込んだことが検知され、かつ、騒音判定部により乗りかご戸開中に音声入力部に入力された騒音レベルが規定値を上回っていると判定された場合に、かご戸を戸閉する。 (もっと読む)


【課題】ゲスト及びホストの音声に基づき、ゲストに提供しようとする不動産物件情報をより正確に検索できるようにする。
【解決手段】H/G判別部41は、異なる位置に着座するホストとゲストの音声を、集音方向を調整自在な指向性マイク22〜25による検出音の強度に基づき識別する。キーワードテーブル45には、質問キーワードと1つ以上の質問キーワードで分類される質問の種類毎の回答キーワードとが登録されている。キーワード判別部44は、識別されたホストの音声に、登録された質問キーワードのどれが含まれているか及び該質問キーワードに基づく質問の種類を判別し、識別されたゲストの音声に、直近の質問の種類に対応した、登録された回答キーワードのどれが含まれているかを判別し、判別した回答キーワードを該質問の種類と対応させて検索用キーワード記憶部46に記憶させる。 (もっと読む)


【課題】検索精度が高い音声検索装置、音声検索方法及びプログラムを提供する。
【解決手段】検索対象取得部62は、検索対象の音声データに含まれる各音素を中心音素とし、中心音素とその音素の前側直近の音素と後側直近の音素とを含むトライフォンが時系列順に配列されたトライフォン列Aを取得する。入力部64は、音声データに対して検索する検索語を入力する。検索語取得部66は、入力部64によって入力された検索語を音素列に変換し、トライフォン列Bを取得する。探索部67は、トライフォン列Bの最初及び最後のバイフォンを除くトライフォン列であるトライフォン列Cとトライフォン列Aに含まれる部分列との類似度を算出し、算出された類似度が所定の条件を満たす部分列を、トライフォン列Aから抽出する。出力部69は、探索部67によって抽出された部分列の音声データにおける再生開始時間を表示する。 (もっと読む)


【課題】使用者がロボットに向けて発話するとき、使用者がより話し易く、より親しみを感じることができるコミュニケーションロボットを提供する。
【解決手段】使用者が発する話し言葉を検知する音声検知手段と、所定の応答反応を表出する反応表出手段とを有したコミュニケーションロボットに、使用者の話し言葉に反応して予め定められた複数パターンの応答反応を表出させる。このとき、話し言葉が通常表現であるか否かの判定、話し言葉が同意要求表現であるか否かの判定、話し言葉が断定表現であるか否かの判定の少なくともいずれかの判定を実施し、判定結果に基づいて異なる応答反応を表出させる。 (もっと読む)


【課題】従来、通話録音データと接触履歴情報を関連付けることは可能であったが、キーワードを指定して、接触履歴と関連する内容を検索することはできなかった。
本発明の目的は、キーワード等の検索条件に該当する通話録音内容を容易に検索できるようにすることにより、接触履歴に関連する通話録音内容の検索を効率的に行うことができる証券向け顧客情報管理システムを提供することにある。
【解決手段】本発明の顧客との接触情報である音声データを文字データに変換して管理する顧客情報管理システムは、顧客との接触履歴情報データを入力する接触履歴情報データ入力手段と、文字データを接触履歴情報データと関連付ける文字データ関連付手段と、接触履歴情報データと文字データを表示する表示手段とを有することを特徴とする。 (もっと読む)


【課題】ドライバー端末機から送信された音源情報を管理し、運転者からの音声による指示に対応する音源情報を抽出し、再生リストを作成してドライバー端末機へ提供する。
【解決手段】ドライバー端末機は車両に備えられ、音源格納部、音声入力部、無線通信部、表示部、及び制御部を有し、管理サーバーと通信する車両用マルチメディア装置である。管理サーバーは、音源情報格納部、無線通信部、音声認識部、及び制御部を有し、ドライバー端末機から送信された音源情報を管理し、運転者から音声による指示(例えば、歌手名、曲名など)が送信されてくると、音源情報を抽出して再生リストの形態でドライバー端末機へ提供し、ドライバー端末機が再生リストに基づき当該音源データを再生する。 (もっと読む)


【課題】1つの自然文によって複数のコマンドを実行可能とした音声制御システムにおいて、従来よりも幅広い表現の自然文を受け入れることを可能とし、ユーザの利便性を向上する。
【解決手段】自然文から抽出される言葉と制御コマンドとを直接結びつけるコマンド変換辞書を記憶手段104に備えると共に、制御コマンドに直接結びつかない言葉を制御コマンド生成用のパラメータに変換するための変換補助情報を記憶手段106に記憶する。また、制御コマンドに直接結びつかない言葉については変換補助情報を参照して制御コマンド生成用のパラメータに変換し、制御コマンドを生成するコマンド変換手段103を備える。 (もっと読む)


【課題】クライアントとサーバとで分散して音声認識処理を行う場合に認識結果が得られるまでに要する時間を短縮するとともに、音声認識処理に関するクライアントの規模および処理負担の軽減が可能な音声認識システムを提供すること。
【解決手段】車載装置1において入力された利用者の音声に対して、この車載装置1あるいはネットワーク3を介して接続されたサーバ2による音声認識処理が行われる。車載装置1は、マイクロホン22と、あらかじめ用意された複数の単語あるいは文章を対象に音声認識処理を行う音声認識処理部100と、入力された音声について音声認識処理部100において音声認識処理を行うものとサーバ2において音声認識処理を行うものとを振り分ける振り分け判定部102と、サーバ2側で音声認識処理を行う場合に音声データをサーバ2に送信する音声データ送信部56とを備える。 (もっと読む)


【課題】広範なソーシャル・コミュニケーションを喚起する。
【解決手段】インターネットに接続可能なネットワーク端末に接続され、ユーザの頭部に装着可能なヘッドセットシステムから得られるユーザの主観的な視野等を反映した画像、及び音声信号を、ネットワーク端末経由で知識情報処理サーバシステムにアップロードし、画像に内包されているユーザが着目した特定物体等に対し、音声認識システムとの協調動作により、ユーザ自身の音声による着目対象の指定、選択等を、サーバシステム上で可能にし、ユーザによる一連の画像認識プロセス及び画像認識結果を、音声合成システムとの協調動作により、サーバシステム側がインターネットを介し、ユーザのネットワーク端末経由で、画像認識結果及びその認識プロセスをユーザのヘッドセットシステムに組込まれたイヤフォンに対し音声情報として通知し、ユーザのメッセージやつぶやきを広範なユーザ間で共有可能にする。 (もっと読む)


【課題】利用者が正しい発音を素早く習得するため音声を視覚的に捉えるフィードバック資料を提示する。
【解決手段】音声の音量基準値とフォルマント周波数基準値と予め格納しておき、利用者が発声した音声を採取した音声データの音量を特定し、該当する音声の音量基準値と比較し、音量基準値との誤差を導出するとともに、音声データの周波数スペクトルを解析してフォルマント周波数を特定し、該当する音声のフォルマント周波数基準値と比較し、フォルマント周波数基準値との誤差を導出し、音量基準値との誤差及びフォルマント周波数基準値との誤差を図形として表示するとともに、正しい発音に近づけるためのアドバイス資料を表示する発音トレーニング装置である。 (もっと読む)


11 - 20 / 1,893