説明

国際特許分類[G10L15/00]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声認識 (6,879)

国際特許分類[G10L15/00]の下位に属する分類

国際特許分類[G10L15/00]に分類される特許

901 - 910 / 1,893


【課題】インデキシングの精度を向上させることが可能なインデキシング装置、方法及びプログラムを提供する。
【解決手段】音声信号を特徴づけるための音響モデルを生成する際、所定時間毎の音声特徴量から生成した音響モデル同士の類似度のうち、当該類似度が所定値以上となる領域の音声特徴量から音響モデルを生成し、この領域の音響モデルと前記音声特徴量とを用いて導出された第2区間毎の音声信号を特徴づける特徴ベクトルを話者毎に分類する。 (もっと読む)


【課題】ユーザが意図した時に確実に音声認識処理を実行できる車載音声認識システムを提供すること。
【解決手段】音声操作したい車載機器を選択するための機器選択スイッチ21〜26を設けるとともに、それとは別に、音声認識処理を開始させるための音認スイッチ29を設ける。これにより、ユーザは、音声認識処理を開始させるためにスイッチを長押しする必要がなくなる。そのため、押下時間不足により音声認識処理動作が開始されていないという状態がなくなるので、ユーザが意図した時に確実に音声認識処理が実行される。 (もっと読む)


【課題】 グループ対抗歌合戦を行う場合に、楽曲の登録操作が容易であるばかりでなく、歌唱する順番に注意を必要とせずに、歌合戦の興趣を十分に味わうことを可能とする。
【解決手段】 マイク51から入力された音声データに基づき利用者毎に声紋データを解析する声紋認識手段2と、解析された声紋データに利用者IDを付与して声紋情報登録部に登録する声紋情報登録手段3と、利用者を任意のグループに区別すると共に利用者IDを付加してグループ登録部に登録するグループ登録手段4と、歌唱された楽曲に対して利用者IDを特定する利用者ID特定手段5と、歌唱採点手段8で採点された当該楽曲の歌唱採点結果に基づき所定のアルゴリズムを用いて取得ポイントを生成してグループ毎に管理する採点結果管理手段6と、グループ間の優劣評価を表示手段53に表示させる管理情報表示手段7と、を備える。 (もっと読む)


【課題】対面している人たちと相手の顔を見ながらコミュニケーションを簡便に取る。
【解決手段】眼鏡のテンプル12,16を起立させることで電源SW25がONする。自分の喋った言葉は、骨導音により骨伝導マイク部15に取り込まれ、光送信部22に送られる。光送信部22は、送信用音声信号を赤外光で相手側に送出する。相手側から受信する音声信号は、赤外光として光受信部20に入力される。光受信部20に入力した受信用音声信号は、音声認識回路、音声文字変換回路を介してプロジェクタ17に送られ、プロジェクタ17が眼鏡のレンズ18内面に文字を投映する。レンズ18内面には、指向性範囲フレームの画像が投映されている。指向性調節部23の操作により指向性範囲フレームの大きさが変化する。大きさを変えることで、光通信の通信範囲及び通信距離が調節され、特定の人のみと会話することができる。 (もっと読む)


人間の編集者は、文書編集システムを使用して草案文書を編集する。編集者の編集行動は、監視され、ログが取られる。編集者の生産性評価を作成するように、ログから統計が展開される。この評価、ならびに他の編集者の評価を用いて、編集行動と生産性との間の相関を示す行動計量を展開することができる。行動計量を用いて、異なる編集行動の効果的な編集に対する相対的な寄与を含めた識別をすることができる。このような計量を用いて、個々の編集者の編集行動に基づく生産性を評価すること、個々の編集者の生産性を改善するために個々の編集者が採用し得る行動を識別すること、および編集者の生産性を改善するための編集システム自体に対する変更を識別することができる。編集者の編集行動は、編集者の低い生産性の原因の識別を試みるために、人間によって「再生」および観察することができる。 (もっと読む)


【課題】広告効果を高めるため、表示すべき広告等を、話者の感情に基づいて選択する。
【解決手段】話者の音声を取得し(S11)、取得した音声に基づいて話者の感情を分析し(S12)、感情の分析結果をデータベースに蓄積し(S13)、感情分析結果に基づいて画面表示を変更する(S14)。例えば、感情分析結果が「興奮」であったら、「興奮」という感情種別に関連付けて予め記憶されている広告を話者が見ているモニターの画面に表示させる。また、ワードスポッティング結果に基づいて画面表示を変更する(S15)。例えば、会話中から「温泉」という単語が抽出されたら、「温泉」という単語に関連付けて予め記憶されている広告を話者が見ているモニターの画面に表示させる。そして、画面に表示されたバナー広告をマウスなどのポインティングデバイスを用いてクリックすることによってバナー広告のリンク先Webサイトへアクセスする(S16)。 (もっと読む)


【課題】 環境雑音が予測不可能な状況でも、高い精度で音信号の発音期間を特定する。
【解決手段】 音信号処理装置10のトリガ信号取得部113は、音信号認識装置40に音信号の認識を開始させる条件の少なくとも一部を満たすイベントをトリガ信号として取得する。特定部114は、マイク20からの音信号のうちトリガ信号取得時以降の音信号のレベルのトリガ信号取得時以前の音信号のレベルに対する比をS/N比として算出し、S/N比が所定の条件を満たす期間を発音期間として特定する。トリガ信号取得の契機となるイベントとしては、音信号処理装置へのユーザの接触、設置エリアへのユーザの入場等、各種のものがあり得る。 (もっと読む)


【課題】音声を介して行われる顧客応対業務の支援を簡素確実に実行できる文書検索方法及び装置を提供する。
【解決手段】対話中の音声を音声認識してテキスト化する音声認識手段と、音声認識手段で得られたテキストの中からキーワードを検出するキーワード検出手段と、キーワード検出手段が検出したキーワードを表示するキーワード表示手段と、表示されたキーワードの中から任意のキーワードを選択するキーワード選択手段と、キーワード選択手段で選択されたキーワードを含む表題を表題蓄積手段に蓄積された表題群の中から検索する表題検索手段と、表題検索手段で得られた表題を表示する表題表示手段とを備える。 (もっと読む)


【課題】システムが過去に出力した音声案内に対する応答を適時にやり直すことができるようにすることで自然な対話を継続させることができる対話制御装置を提供すること。
【解決手段】音声案内データと音声案内データの出力を開始させるためのユーザ発話を定める音声認識対象語とを有するノードから構成されるシナリオに沿ってユーザとの対話を制御する対話制御装置100は、ユーザ発話をテキストデータとして認識する音声認識手段10と、出力した音声案内データを有するノードを記録するノード記録手段12と、ノード記録手段12が記録したノードに関する音声認識対象語を取得する音声認識対象語取得手段13と、音声認識手段10が認識したテキストデータと音声認識対象語取得手段13が取得した音声認識対象語とに基づいて次に出力させる音声案内データを決定する次出力決定手段14と、を備える。 (もっと読む)


【課題】ジェスチャーを交えながらユーザと会話することができるようにする。
【解決手段】会話集データベース1から音声認識処理部6により解析された言葉に応答する台詞を表現する音声データを検索する音声データ検索部7と、ジェスチャーデータベース3から台詞に対応するジェスチャーを実現する制御データを検索する制御データ検索部8とを設け、音声再生部9が音声データ検索部7により検索された音声データにしたがって音声を出力し、体制御部10が制御データ検索部8により検索された制御データにしたがって体を動かすようにする。 (もっと読む)


901 - 910 / 1,893