説明

Fターム[5D015LL12]の内容

音声認識 (5,191) | 音声認識装置の制御 (1,048) | 音声認識装置の用途 (261) | 情報の伝送 (38)

Fターム[5D015LL12]に分類される特許

1 - 20 / 38


【課題】高いセキュリティを求められるアプリケーションに対して高精度な音声入力機能を簡単に追加することができる入力支援システムを提供すること。
【解決手段】アプリケーションソフトウェアを含む情報処理装置200と、音声認識処理を行う音声認識サーバ600とを有し、アプリケーションソフトウェアに対する入力作業を支援する入力支援システム100であって、公共通信網500を介して音声認識サーバ600に接続する網通信部と、公共通信網500とは別の通信経路により情報処理装置200に接続する装置通信部と、音声を入力する音声入力部と、入力した音声の音声認識サーバ600への送信と、音声認識サーバ600から受信した音声認識処理の結果を表す情報の情報処理装置200への送信とを、交互に行う音声認識管理部とを有する無線通信端末400を有する。 (もっと読む)


【課題】安定した品質の音声認識サービスを提供する。
【解決手段】音声データ中継装置110は、車載端末102と音声認識サーバ104との間を中継するにあたって、音声認識サーバ104の音声認識性能の変化を調べるために、評価用音声データを雑音抑圧モジュール118において雑音抑圧処理した後、音声認識サーバ104に送信し、認識結果を受信する。そして、音声データ中継装置110は、音声認識サーバ104の認識結果に基づいて、雑音抑圧処理に用いる雑音抑圧用パラメータや音声認識サーバ104から得られた複数の認識結果の統合処理に用いる結果統合用パラメータの値を最適な値に設定する。これにより、音声認識サーバ104の音声認識性能が変化する場合においても、適切なパラメータを設定することができる。 (もっと読む)


【課題】音声認識システムを提供すること。
【解決手段】無線通信システム(100)の中で、加入者ユニットのユーザーと他の者との間の音声通話中の加入者ユニットの中のインターラプト表示の検出が、提供される。前記のインターラプト表示に応答して、音声認識エレメントが、動作させられて、音声をベースとするコマンドの処理を開始する。前記の音声認識エレメントを、クライアント−サーバ音声認識構成(115)の中のようなインフラの少なくとも一部の中で実行することができる。前記のインターラプト表示を、加入者の装置の一部を形成するデバイスを使用するか、あるいは加入者の装置(140)の中の音声認識装置を経由して、提供することができる。前記の加入者の装置の所でインターラプト表示を検出することで、この発明で、無線通信環境の中の電子アシスタントと同様のサービスを利用することが容易にできる。 (もっと読む)


【課題】メールもしくは双方の通話をコピー用紙に出力する。
【解決手段】人工頭脳により解析し、通話、メール等の双方の内容を記録用紙に出力する。メールそして(A)側からの通話内容と(B)よりの通話内容をコピー複写用紙に出力する。故に通話もしくはメールを用紙にメモすることが、人工頭脳を持つことにより可能となる。 (もっと読む)


【課題】2台以上の携帯型自動通訳端末間の通信を通じて自動通訳に活用できる情報を交換することによって、自動通訳の性能を向上させる自動通訳端末及び自動通訳端末間の通信を通じて通訳する方法を提供する。
【解決手段】本発明の通訳端末は、相手の通訳端末と通信を行うネットワークインターフェースと、当事者の発話された音声を認識する音声認識器と、前記音声認識器を通じて認識された音声を設定された言語に翻訳する翻訳モジュールと、前記ネットワークインターフェースを通じて相手と通訳する言語を設定し、前記翻訳モジュールにより翻訳された文章を相手の通訳端末に提供する制御部とを含む。 (もっと読む)


【課題】分散音声認識プロセスにおいてエラーを緩和する手段を提供する。
【解決手段】特定されたベクトル・グループ内の一つまたはそれ以上の音声認識パラメータが、この特定されたベクトル・グループの後に受信されたベクトルからの一つまたはそれ以上の音声認識パラメータを参照することによって判定された各置換パラメータによって置換される際に、音声認識プロセスにおいて待ち時間(latency)を許容する可能性が有利に利用される。 (もっと読む)


【課題】音声認識処理に誤認識が発生した場合であっても適切な応対処理を行うことが可能な来客受付装置、担当者端末、及び来客受付プログラムを提供する。
【解決手段】来訪者1の来訪時、来客受付装置11のボタン15が押下され、来訪担当者3との取次が依頼される。来客受付装置11では、来訪者1の身元や来訪担当者3の身元を問い合わせるための音声が出力される。これに応じて来訪者1より発声された音声の音声認識処理が実行され、来訪者身元情報や来訪担当者身元情報が特定される。特定された情報は、担当者端末41に送信され、来訪担当者3に対して出力される。また、来訪者1の発声した音声が担当者端末41に送信され、来訪担当者3に対して出力される。これにより、音声認識にて情報が特定できなかった場合でも、来訪担当者3は来訪者1の発声した音声を聴覚し、来訪者1の来訪を認識することが可能となる。 (もっと読む)


【課題】端末機器と音声認識装置とがデータ通信可能な状態になった後、短時間で端末機器を音声認識により操作可能な状態とする。
【解決手段】S100で、外部オーディオ機器2に音声認識辞書が記憶されていれば(S100:YES)、S110に進み、S110でナビゲーション装置1が有する音声認識エンジン情報と外部オーディオ機器2に記憶されている音声認識エンジン情報とが同一であれば(S110:YES)、S120に進む。S120で、外部オーディオ機器2に記憶されている楽曲などに対応して、全ての音声認識辞書が記憶されている場合(S120:全て有り)、S130に進み、外部オーディオ機器2に記憶されている全ての音声認識辞書を受信し、ナビゲーション装置1のメモリ17に記憶して、処理を終了する。 (もっと読む)


【課題】 認識結果に誤りがあった場合に、ユーザの手間をかけることなく認識誤りを訂正することができる音声認識結果訂正装置および音声認識結果訂正方法を提供することを目的とする。
【解決手段】 サーバ装置120に対して音声の特徴量データを送信する。そして、サーバ装置120において認識処理を行い、受信部235は認識結果をサーバ装置120から受信する。誤り区間指定部240は、受信された認識結果において、認識誤りが発生している誤り区間を信頼度等に基づいて指定する。そして、誤り区間特徴量抽出部260は、誤り区間の特徴量データを抽出し、訂正部270は、抽出された誤り区間における認識結果を、再認識処理を行うことにより訂正処理を行う。 (もっと読む)


音声認識クライアントは、ネットワークを介してサーバ側での音声認識装置に向けて、音声ストリームおよび制御ストリームを並列に送出する。ネットワークは、信頼性の低い、低遅延のネットワークでもよい。サーバ側での音声認識装置は、絶えず音声ストリームを認識する。音声認識クライアントは、クライアントからの要求に応答するサーバ側での認識装置から認識結果を受信する。認識している間、クライアントは、サーバ側での認識装置の状態を遠隔で再構成してもよい。 (もっと読む)


【課題】文字列変換の効率を向上させること。
【解決手段】辞書受信部121は、文字列と読みが対応付けられて携帯端末110に登録された辞書データを携帯端末110から受信する。音声受信部123は、音声の特徴を示す音声データを携帯端末110から受信する。音声認識部124は、音声受信部123によって受信された音声データの読みを認識する。変換候補生成部125は、辞書受信部121によって受信された辞書データを用いて、音声認識部124によって認識された読みの変換候補を生成する。変換候補送信部126は、変換候補生成部125によって生成された変換候補を携帯端末110へ送信する。 (もっと読む)


【課題】情報センタなどに設置された外部装置との通信品質の影響を少なくし、安価でレスポンスの速い車両用音声認識システムを提供する。
【解決手段】車載端末装置200において使用者の音声の音声認識を実行し、その音声認識結果の信頼度を判定して、信頼度が所定の値より高いときは、そのままその音声認識結果を用い、信頼度が所定の値以下のときは、音声処理部10で抽出した音声の特徴量を、送受信部30を介して、可搬型の車載処理装置50と地上処理装置60に送信する。車載端末装置200では、車載処理装置50と通信を行うことにより、車載処理装置50の存在を認識できるか否かを判定し、車載処理装置50の存在を認識できる場合には、車載処理装置50から音声認識結果を受信する処理を行い、車載処理装置50の存在を認識できない場合には、地上処理装置60から音声認識結果を受信する処理を行う。 (もっと読む)


【課題】外部から入力される音声に含まれる内容が外部に出力される範囲を制限する。
【解決手段】MFPは、外部から入力される音声を取得する音声取得部と、取得された音声を文字情報に変換する音声変換部と、文字情報のうちからユーザを識別するためのユーザ識別情報を抽出するユーザ抽出部と、抽出されたユーザ識別情報に基づいて、文字情報を出力する出力制御部とを備える。 (もっと読む)


【課題】携帯電話等で音声入力すれば、自動的にテキストデータを作成し、その作成したテキストデータを所定の配信先に自動的に配信することのできる音声情報管理システムを提供する。
【解決手段】本発明の音声情報管理システムは、実際の送信番号と受信番号に基づき、第1記憶手段から音声データを読み出し、この音声データをテキストデータ作成手段に送ってテキストデータを作成する一方、第2記憶手段から特定の仕事識別記号を読み出し、この読み出した仕事識別記号に基づき第3記憶手段から仕事情報を読み出し、この仕事情報に関連付けてテキストデータを第4記憶手段に記憶させ、この第4記憶手段に記憶されたテキストデータを、仕事情報中に含まれる配信先データに基づいて該配信先データが示す配信先に配信することを特徴とする音声情報管理システム。 (もっと読む)


【課題】認識結果を出力することによって運転操作に対する注意力を低下させてしまうことを少なくでき、且つ、認識結果が誤認識であった場合にも、取り消し操作を容易に行うことができる音声認識装置を提供する。
【解決手段】ユーザが発話した音声が文字データ(認識結果)として出力されたか否かを判断し(S10)、認識結果が出力された場合であって、その認識結果が優先コマンドではない場合、車両の走行状態を示す走行関連信号および外部状況取得装置52から出力される状況情報から、運転操作に注意を要する状況であるか否かを判定する(S40、S50)。運転操作に注意を要する状況であると判定した場合には認識結果を出力せず、運転操作に注意を要する状況であるか否かの判断を繰り返す。そして、運転操作に注意を要する状況ではないと判断したら認識結果を出力する。 (もっと読む)


【課題】患者の前で使用した言葉を、音声認識によるテキスト変換時にその診察や検査などが行われた場面や状況に応じて適切な言葉に変換し、電子カルテやレポーティング装置などに表示させる医療支援装置を提供する。
【解決手段】患者の医療情報を表示手段013に表示する医用支援装置であって、あらかじめ音声を文字に変換する言語モデル及び音響モデルを含む複数の辞書、及び事前に登録された単語と辞書との対応を記憶しておく記憶手段004と、音声が入力される音声入力手段011と、操作者により入力された音声を文字に変えるための変換条件を基に辞書を複数選択する変換制御手段002と、変換条件に応じて選択された辞書及び登録された単語と辞書との対応を参照して、入力された音声を認識し文字に変換する認識変換手段001と、変換された文字を表示手段013に表示する表示制御手段005とを備える。 (もっと読む)


【課題】処理の時間を短縮できるとともに情報の秘匿性に優れた文字起こしシステムを提供する。
【解決手段】管理サーバ10において話者の発言・会話が記録されている音声データが複数の音声区間に細分化され、細分化された各音声区間がネットワーク30を介して管理サーバと接続された複数の情報端末20a〜20cへ送られる。各情報端末では当該音声区間の文字起こしが行われてその結果が文字列として管理サーバ10へ送り返される。そして管理サーバ10は、個々の文字列を結合して元の音声データの会話全体を文章化した文章データを構築する。 (もっと読む)


【課題】本発明の目的は、複数のエージェント(外部装置)とやり取りを行う際に、ユーザが行うインタラクションを軽減し、ユーザの利便性の良好な音声対話装置を提供することである。
【解決手段】ユーザからの音声情報を入力する手段(201)と、音声言語解析用辞書を記憶する手段(205)と、前記音声言語解析用辞書を用いて前記ユーザからの音声情報を解析することによって、前記ユーザの要求を抽出する手段(203)と、抽出した前記ユーザの要求を満たす外部装置との間で、前記ユーザの要求およびその応答結果の授受を制御する制御手段(207)と、前記応答結果をユーザに出力する出力手段(202)と、を備える音声対話装置。 (もっと読む)


【課題】サーバ・クライアント型音声認識装置において、雑音の重畳に伴う符号化歪みの発生を低減し、音声認識性能の劣化を阻止する。
【解決手段】クライアント側において、発声前に観測した雑音をもとに雑音モデルを作成し、事前に用意した音声モデルとでモデル合成処理を実施して雑音重畳音声モデルを作成し、雑音重畳音声モデルが表現する特徴量分布をもとに特徴量・コード変換テーブルを作成する。更に、クライアント側からサーバへ、雑音モデルのパラメータを送信する。サーバ側では、受信した雑音モデルと、事前に用意したクライアント側と同じ音声モデルとでモデル合成処理して雑音重畳音声モデルを作成し、雑音重畳音声モデルが表現する特徴量分布をもとにコード・特徴量変換テーブルを作成する。特徴量分布から、特徴量とコードを対応づけるロジックはクライアント側とサーバ側で同一とする。 (もっと読む)


【課題】通信端末にあらかじめ内蔵されたプログラムおよびデータと音声処理とを連携させて動作させるシステムの提供。
【解決手段】通信端末100は、第1プログラムおよびデータ格納手段101と、音声処理手段102と、音声処理手段用の言語情報を作成する音声処理言語情報作成手段103と、サーバ200からプログラム/データを取得する送受信手段104と、取得したプログラム/データを記憶する第2プログラムおよびデータ格納手段105と、第2プログラムおよびデータ格納手段105に記憶されたプログラム/データに基づいて、音声処理手段102と、第1プログラムおよびデータ格納手段101のプログラム/データを連携制御する制御手段106を含み、サーバ200は、送受信手段201と、通信端末から送信されたデータを基に言語情報を作成する音声処理言語情報作成手段202を含む。 (もっと読む)


1 - 20 / 38