説明

Fターム[5D015KK03]の内容

音声認識 (5,191) | 他機器との結合 (1,170) | 他機器への言語情報入力 (573) | 電気計算機、タイプライタへの入力 (36)

Fターム[5D015KK03]に分類される特許

1 - 20 / 36


【課題】会議の重要な部分を抽出して議事録を作成することができる議事録作成支援装置、議事録作成支援システム、および、議事録作成用プログラムを提供する。
【解決手段】議事録作成支援装置(サーバー100)は、会議の参加者同士の会話が成立している状態を検知するための検知手段(会話集中度算出部840)と、前記会議の参加者が発する音声を記録するための記録手段(データ保存部920)と、前記検知手段による会話の成立状態の検知結果に基づいて、前記記録手段に記録された音声から特定の音声を抽出するための抽出手段(抽出部850)と、前記特定の音声を用いて前記会議の議事録を作成するための議事録作成手段とを備える。 (もっと読む)


【課題】音声入力ワープロにおいて、音声認識エンジンが音声認識困難な単語、文章の入力を可能とする。
また、音声のみによる音声ワープロを可能にする。
【解決手段】(1)あらかじめ、音声認識が容易な単語、文章と音声認識困難な単語、文章は、対で登録しておく。
(2)音声入力者は、音声認識困難な単語、文章のかわりに、よく使用される音声認識が容易な単語、文章を連想文言として発声する。
(3)音声認識エンジンは、音声認識が容易な単語、文章のため、認識結果群を返却し、それらが音声認識が容易な単語、文章と一致する確率が高くなる。
(4)ひとつでも一致した場合、音声認識困難な単語、文章を表示させ、選択候補とする。これにより、音声認識エンジンでは、認識困難な語彙の入力が可能になる。
(5)選択候補のキー(番号など)を音声により、発声し、その認識結果が選択候補のキーと一致した場合、選択確定とする。
これにより、音声の発声のみによる音声ワープロが可能となる。 (もっと読む)


【課題】会議等における会議等における議事録を作成するための議事録作成システム、議事録作成方法及び議事録作成プログラムを提供する。
【解決手段】議事録作成処理において、会議支援サーバ20の制御部21は、各タブレット端末10から録音ファイルを取得する。そして、各録音ファイルの録音開始時刻を同期させる。次に、制御部21は、各録音ファイルの各時間帯での音量を比較し、最大音量の音声を特定する。そして、制御部21は、最大音量の音声を用いて、録音ファイル毎にフィルタリング処理を実行する。次に、フィルタリングされた音声を用いて音声認識処理を実行し、利用者ID、録音された時間帯に関連付けて、音声認識結果の記録処理を実行する。そして、すべての録音ファイルの処理を終了した場合、制御部21は、音声認識結果を時系列に並べた議事録ファイルを作成する。 (もっと読む)


【課題】音声をテキストに変換する装置及び方法を提供することを目的とする。
【解決手段】音声受信モジュール、音声識別モジュール、表示モジュール、格納モジュール、話者識別モジュール及び制御モジュールを備え、格納モジュールは異なる音声データに対応するテキストデータ及び異なる音声信号に対応する話者データを格納し、音声受信モジュールは、外部の音声信号を受け取り、音声識別モジュールは、前記音声信号を音声データに変換してから、格納モジュールから前記音声データに対応するテキストデータを探して制御モジュールに送信し、話者識別モジュールは、格納モジュールから前記音声信号に対応する話者データを探して制御モジュールに送信し、制御モジュールは、前記テキストデータ及び前記話者データを表示モジュールに表示させる。 (もっと読む)


【課題】ラジオCMまたはテレビCMから、携帯端末をホームページに誘導するためのシステムを提供する。
【解決手段】放送局12から放送される番組中のコマーシャルにURL対応番号を含ませておき、ラジオ14またはテレビ16などの音響出力機器で受信する。音響出力機器が出力するコマーシャル(音響)を携帯電話機18などの携帯端末で受けて、携帯端末内でURL対応番号を再生し、管理センター20に送信する。管理センターでは、受信した番号に対応するURLを検出して、携帯端末に送信する。携帯端末は受信したURLに接続して、携帯端末のユーザをホームページに誘導する。 (もっと読む)


【課題】従来からの、入力された音声データを文字に変換する技術については、音声データからテキストデータへ変換されたデータと、元からテキスト形態にて入力されたデータとが混在する状態では、元のデータが何であったかを出力されたデータから区別することは困難であった。
【解決手段】本発明は、データの表現形態を他の表現形態に変換可能であり、変換された、又は変換されなかったデータを、その旨や、表示形態を示す識別情報に関連付けて出力する情報処理装置を提案するものである。このとき、所定表現形態で取得されたデータを、その表現形態で出力することが適切な出力環境か判断するための条件と、出力環境情報とを比較することもできる。 (もっと読む)


【課題】すべての言語の音声識別及び音声識別を利用した単字入力の方法を提供する。
【解決手段】すべての言語の音声識別及び音声識別を利用した単字入力の方法は、ある単字は、英語、中国語、或いは他の文字で、ある単字の発音を単音と呼び、先ず、一群のm個の未知(既知も可)の異なる単音にm個の異なる類を代表させ、常用単字を一回発音し、各単字の発音を、1個の線形予測ケプストラム係数マトリックスに転換し、次に、ベイズ或いは距離分類法を用いて、常用字を、m類中の一類に分類し、使用者は、単音を発声後、m個の未知の単音において、F個の最も相似した未知の単音を探し出し、続いて、F個の相似する未知の単音が代表するF個類内において、すべての単字を、必要な単字発音との相似度及び文字(或いは画数)に応じて、配列し、使用者の発音後、非常に迅速に必要な字を探し出すことができる。 (もっと読む)


【課題】音声認識誤り処理装置では、認識誤りの自動検出を誤りなく行うことは困難である。
【解決手段】本発明による音声認識結果修正候補検出装置200は、処理対象の音声認識結果の正誤を判定した正誤判定結果を記憶する正誤判定結果記憶手段201と、処理対象の音声認識結果とは異なる音声認識結果を編集した事例を示す情報である編集事例を記憶する編集事例記憶手段202と、処理対象の音声認識結果のうち、編集事例と正誤判定結果とが一致するものの中から、編集事例と類似する箇所を、修正対象箇所の候補として検出する修正候補検出手段203とを含むことを特徴とする。 (もっと読む)


【課題】人の発話音声の中から、有意性の高い要点部分を客観的かつ容易に抽出する。
【解決手段】発話特徴解析制御部50が、音声認識部41により発話音声から生成されたテキスト情報、区間種別情報等、瞳孔径解析部42により眼球映像を解析して得られた瞳孔径、顔面動き量推定部43により通常顔映像から推定された顔面動きを入力し、発話音声の相対音量及び相対音高、発話速度、無意区間、テキスト化不可部分、発話者情動反応値及び聴取者情動反応値を発話特徴の解析結果として求める。また、表示装置20は、発声音の強弱及び高低、発声速度、無意区間の有無、テキスト化不可部分及び発話者情動反応値(または/及び聴取者情動反応値)を発話音声のテキスト情報の特性として、テキスト文字の形態に反映し、テキスト文字に対応した箇所に表現する。 (もっと読む)


【課題】講演の内容を迅速に理解してレベルの高い講演の資料を迅速に作成することができる講演資料作成支援システム、講演資料作成支援方法及び講演資料作成支援プログラムを提供することにある。
【解決手段】講演資料作成管理装置10の制御手段11は、講演中に録音した音声データを文字テキストデータに変換する。制御手段11は、対象頁に対応する文字テキストの抽出処理を実行し、質疑応答が開始されたか否かを判定する。質疑応答が開始される前の場合、制御手段11は、対象頁の頁識別子を含むノートデータ領域に、抽出した音声ブロックデータの文字テキストを記録する。質疑応答が開始され対象頁に質問者の文字テキストがある場合、制御手段11は、質問者の文字テキストを仮記憶し、質問前の文字テキストをこの対象頁に関連付けて記憶する。制御手段11は、次の対象頁を特定すると、この対象頁に関連付けて仮記憶した文字テキストデータを記憶する。 (もっと読む)


【課題】患者に対する医師の説明に解説を付与する医療支援システム及びその解説提供方法を提供する。
【解決手段】患者に対する音声データ形式の説明情報を取得し、その説明情報を解析して文字データ形式に置き換える。予め、用語とその解説文とを対応づけた解説用辞書を予め記憶しておき、文字データ形式の説明情報に含まれる各用語と解説用辞書とを比較して、説明情報とこの説明情報に含まれている用語に対応する解説文とから解説付説明情報を生成する。そして、この解説付説明情報を出力する。 (もっと読む)


【課題】情報を書面に記録することが容易でなく、該情報を電子化することが困難な環境下であっても、音声情報として情報を収集し、該音声情報を簡易に短時間で文字情報に変換する。
【解決手段】録音した音声情報を文字情報として管理可能な音声情報管理システムであって、音声を録音する録音部と、該録音部で録音した音声情報を入出力処理する入出力情報処理部と、音声情報或いは文字情報を記憶する記憶部と、処理された情報を画面表示する表示部とを具備し、該入出力情報処理部は前記音声情報を文字情報に変換する文字情報変換機能と、音声情報或いは文字情報と予め登録してある登録文字情報とをひも付けて文字情報に変換する辞書機能、文字情報を条件にあてはめて抽出する条件抽出機能、抽出された文字情報を前記記憶部に格納する格納機能、格納された文字情報を前記表示部に任意のフォーマットで出力する。 (もっと読む)


【課題】字幕の有無だけでなく、放送番組の内容に字幕が対応することを、人手をかけずに監視できる字幕監視装置を提供することを目的とする。
【解決手段】字幕監視装置1は、放送番組信号から音声信号と字幕信号と電子番組表情報とを分離させる放送番組受信手段10と、音声信号を音声認識して音声テキストを生成する音声認識手段20と、行単位音声テキストを形態素解析する音声テキスト形態素解析手段30と、字幕信号を復号して字幕テキストを生成する字幕復号手段40と、行単位字幕テキストを形態素解析する字幕テキスト形態素解析手段50と、行単位で、行単位音声テキストと行単位字幕テキストとの一致率を算出し、その一致率に基づいて警告を出力するテキスト比較手段60と、を備える。 (もっと読む)


【課題】
従来の音声入力パーソナルコンピュータでは、一個のMPUで音声文字化とワープロソフトウェアを一個で実行していた。その為、各種ソフトウェア毎にそれぞれに音声文字化ソフトウェアを組み入れる必要があった。
【解決の手段】
音声文字化処理部分を下位コンピュータを専用に使用して下位コンピュータで音声から文字に変換して上位コンピュータ、MPU部分で平仮名、カナ漢字変換などのワードプロセッサ機能に専念させる。その為CADなどのアプリケーションソフトに音声入力ソフトウェアを組み合わせる必要がない。 (もっと読む)


【課題】顧客の意見を取得する効率が低いという問題を解決する情報分析システムを提供する。
【解決手段】音声入力部11は、音声情報を取得する携帯用の音声入力装置である。音声認識部22は、その音声情報をテキスト情報に変換する。コメント抽出部33は、そのテキスト情報から、キーワードDB31に格納されたキーワード基づいて、商品に関するコメントを抽出する。商品情報DB65は、そのコメントを格納する。 (もっと読む)


【課題】議事録に必要なデータ量を節約することができ、議事録を作成するときの処理効率を高めることができる議事録作成装置を提供すること。
【解決手段】電子会議の各参加者のうち発言が記録される対象参加者の情報および発言が記録されない参加者の情報を指定させる参加者指定部11と、参加者が発言したときの音声データを受信する音声データ受信部12と、音声データ受信部12によって受信された音声データのうち、参加者指定部11で指定された対象参加者に対応する音声データを検出する音声データ検出部13と、音声データ検出部13によって検出された音声データを保存する音声データ保存部14と、音声データ保存部14によって保存された音声データをテキストデータに変換する音声認識部15と、音声認識部15で変換されたテキストデータに基づいて議事録を作成する議事録作成部16とを備えて構成する。 (もっと読む)


【課題】音声認識システムが、訓練された言語とは別の自然言語から来るリスト要素の音声駆動の選択の機会を提供すること。
【解決手段】音声入力を介して、要素のリストからリスト要素を選択する方法であって、該方法は、該音声入力に対する一連のサブワード単位を認識するステップと、該認識された一連のサブワード単位を該要素のリストと比較し、該比較の結果に基づいて最も良く調和する要素の候補リストを生成するステップであって、該最も良く調和する要素の該候補リストを生成するために、異なる言語のサブワード単位の混同の可能性に関する情報を含む行列成分を含む混同行列が使用される、ステップとを包含する、方法。 (もっと読む)


【課題】音源ごとの音データを時間に沿って概観することができるように構成された音データ記録再生装置を提供する。
【解決手段】本装置は、音データ取得部(101)と、音源定位部(103)と、音源分離部(105)と、時系列データ格納部(109)と、ストリームデータ格納部(111)と、前記2個の格納部に接続され、データの処理を行うデータ処理部(115)と、を備える。本装置は、音データを再生する音データ再生部(119)と、ストリームデータを表示する表示部(117)と、をさらに備え、前記表示部によって表示されたストリームデータが選択されると、前記音データ再生部が、選択されたストリームデータに関する音データを再生するように構成される。 (もっと読む)


【課題】
コンシューマは、オーディオストリームが、以前に送信された部分的なオーディオストリームを無効にする編集操作を含むとしても、オーディオストリームを、それが生成され送信される間に、処理することが可能であり、それにより、完全なオーディオストリームのディクテーションとコンサンプションとの間のターンアラウンドタイムをより短くすることを可能にする。
【解決手段】
音声処理システムは、話されたオーディオストリームを部分的なオーディオストリーム(「スニペット」)に分ける。該システムは、話者が、一時停止し、次に録音を再開する。コンシューマは、スニペットが受信される際、スニペットを処理する(例えば、認識するまたは再生する)ことが可能である。コンシューマは、スニペットに反映された編集操作に反応して出力を修正することが可能である。 (もっと読む)


【課題】バーバル入力からデータベースおよび構造化情報を生成するための好適なシステムを提供すること。
【解決手段】バーバル情報を利用して、タグ(2)またはXMLコードなどの挿入コードを有する構造化データを作成し得るシステムは、容易に採用するためのハンドヘルド機能を提供する。ディクテーション時の視覚ディスプレイ(13)は、チェックリスト、プロンプトを提供するか、そうでなければ、選択されたデータコンテキストに調和するエントリを形成する。視覚ディスプレイはまたトランスクリプショニストシステム(7)の一部であり得る。コード化方式でデータを提供することによって、警報、バイオテロ警報が迅速かつおそらく自動的に識別され、そしてヘルスケア警報またはまたは位置指向統計分析情報を提供する際などに機能させ得る。中央当局(11)への中央データベース(1)通報機能はテロリストおよび他の事件管理のために含まれ得る。 (もっと読む)


1 - 20 / 36