説明

国際特許分類[G10L11/00]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 15/00〜21/00のグループ中のどれか一つに限定されない音声または音響の特徴量の測定または検出 (1,940)

国際特許分類[G10L11/00]の下位に属する分類

国際特許分類[G10L11/00]に分類される特許

61 - 70 / 1,456


【課題】を提供する。
【解決手段】携帯電話端末装置は、受信した音声符号化データを復号して音声出力する。このとき、音声符号化データのなかのインデックス情報を用いて各フレームの音声らしさを判定する(ST12)。すなわち、合成フィルタに関するインデックスを用い、合成フィルタの周波数特性またはそれに準ずる特性から各フレームの音声らしさを判定する。詳しくは、現フレームのフィルタ周波数特性と過去フレームのフィルタ周波数特性との類似度を算出し、算出された前記類似度が所定閾値を超えている場合には、現フレームを音声らしくないと判定し、算出された前記類似度が所定閾値以下である場合には、現フレームに音声らしさがあると判定する。音声らしくないフレームに対してその音が出力されないようにパラメータエラー処理を行う(ST14)。 (もっと読む)


【課題】言語では明示的に認識されない情報を反映する語句を分析するための情報処理装置、情報処理方法、情報処理システム、およびプログラムを提供する。
【解決手段】情報処理装置120は、会話を記録した音声データから当該音声データにおける言語では明示されない情報を識別しており、音声データを音響データを使用して音響分析するための音響分析部208と、音声データの前後がポーズで分離された領域を識別し、識別された領域の音響分析により前記識別された領域の語句を識別し、当該語句の韻律特徴値を要素とする当該語句の1以上の韻律特徴値を生成する韻律情報取得部212と、音響分析部208が取得した語句の音声データにおける出現頻度を取得する出現頻度取得部210と、出現頻度の高い語句の韻律特徴値の前記音声データ中におけるばらつき度を計算し、特徴語句を決定する韻律ばらつき解析部214とを含む。 (もっと読む)


【課題】背景音と音声が混合している場合でも、安定して適応的な話速変換倍率を決定する。
【解決手段】話速変換倍率決定装置1aは、入力信号の有音区間と無音区間とを判別する有音無音判定部102と、有音区間にて入力信号の基本周波数を算出するとともに安定区間と不安定区間とを決定する基本周波数算出部104と、安定区間にて基本周波数の時間変化を平滑化する周波数平滑化部106と、不安定区間及び無音区間にて基本周波数を内挿した擬似基本周波数を算出する擬似基本周波数算出部108と、平滑化された基本周波数及び擬似基本周波数を接続して基本周波数の概形の標本値を得る基本周波数概形連結部110とを有し、基本周波数の概形の標本値を物理指標として出力する物理指標算出部2と、この物理指標に基づいて話速変換倍率を算出する話速変換倍率指定部120とを備える。 (もっと読む)


【課題】写っている人物の体調/気分をわかりやすく撮影すること。
【解決手段】デジタルカメラは、被写体を撮像して画像データを生成する撮像手段13と、被写体画像データに基づいて人物の顔の表情を検出する表情検出手段17と、撮影開始前に撮像手段13で生成された画像データを用いて表情検出手段17が検出した表情に基づいて人物の体調/気分を判定する体調/気分判定手段17と、体調/気分判定手段17による判定結果に基づいて所定の撮影開始条件を選択する撮影開始条件選択手段17と、選択された撮影開始条件を満たす場合に撮影を開始させる撮影制御手段17と、を備える。 (もっと読む)


【課題】不特定の人物の間で不定期に発生する会話を解析する。
【解決手段】情報処理装置100は、ユーザの発話および1または複数の他の人物の発話の音声情報を取得する音声取得部112と、音声情報を外部装置200に送信し、音声情報に基づいて1または複数の他の人物の中から抽出される会話メンバーとユーザとを含む会話グループの情報を用いて生成される会話グループ関連情報を外部装置200から受信する通信部170とを含み、会話メンバーは、1または複数の他の人物のうち、音声情報の音声特徴量と類似した音声特徴量を有する音声情報を外部装置200に送信する他の情報処理装置を保持する1または複数の人物である。 (もっと読む)


【課題】発音不要かつ非接触な入力操作を実現することができるようにする。
【解決手段】覆われ検出部103は、時間周波数変換部102により音響信号が変換されて得られたパワースペクトルを解析し、そのパワースペクトルに観測される共振点の特徴(例えば周波数や大きさ等)から、音響信号入力部101が覆われている様子(覆われ状態)を判定し、その判定結果(覆われ状態を示す情報)を機器制御決定部104に供給する。機器制御決定部104は、覆われ検出部103から供給される判定結果(音響信号入力部101の覆われ状態を示す情報)に応じて、図示せぬ電子機器の制御内容を決定し、その制御情報(命令やデータ等)を、その電子機器等に出力する。本発明は、例えば、画像処理装置に適用することができる。 (もっと読む)


【課題】ユーザが意図して発したパルス音であるか、ユーザの意図によらず発せられたパルス音であるかを、より正確に判断することができる電子機器、制御方法、及び制御プログラムを提供する
【解決手段】音声取得部は、電子機器の周囲の音波を音声信号へと変換する。パルス音検出部は、音声信号にパルス音に基づく信号が含まれているか否かを判断する。動作指示音検出部は、パルス音に基づく信号が判断基準を満たすか否かを判断する。動作制御部は、判断基準に基づいた報知動作を行うよう報知部を制御する。 (もっと読む)


【課題】瞬間的事象を含む信号に音声効果を適用する。
【解決手段】瞬間的事象を有する音声信号を操作するための信号操作器は、瞬間的事象信号除去器100、信号処理器110、および信号挿入器120を含む。信号操作器は、瞬間的事象信号除去器100によって瞬間的事象が取り除かれた信号位置にて、処理音声信号に時間部分を挿入する。その結果、操作された音声信号は、処理によって影響を受けなかった瞬間的事象を含む。ここで、瞬間的事象の垂直コヒーレンスは、信号処理器110の中で実行される処理が、垂直コヒーレンスを破壊しないで維持される。 (もっと読む)


【課題】対話時の発話から特定の発話を抽出する発話抽出プログラム、発話抽出方法、発話抽出装置を提供する。
【解決手段】第1の話者および第2の話者の発話区間を抽出して、日時または経過時間に関連付けて記録させる処理と、特徴操作記憶部を参照して、対話中に機器を第1の話者が操作した機器の状態を、日時または経過時間に関連付けて記録した操作情報から、特徴操作テーブルに合致する操作情報を抽出し、抽出した操作情報の発生した日時または経過時間を示す特徴操作時刻情報を取得させる処理と、発話抽出条件を参照して、発話抽出条件に合致する区間を、第1の話者および第2の話者の抽出した発話区間と抽出した特徴操作時刻情報を用いて抽出し、抽出した合致する区間から発話抽出条件に関連付けられている時間範囲に存在する第1の話者の発話区間に対応する発話を抽出させる処理と、をコンピュータに実行させる発話抽出プログラム。 (もっと読む)


【課題】マーカを撮影できない状況でも拡張現実感用CGを表示する位置を高精度で決定することができ、室内でも使用可能な拡張現実感表示システムを提供する。
【解決手段】特定の音(マーカ用音)の発生位置(空間座標)が解析され、同発生位置を含む範囲の映像が映像取得部(カメラ)13により取得された場合に、この撮影された映像内におけるマーカ用音の発生位置を表示位置として、現実空間映像内に仮想空間映像(拡張現実感用コンピュータグラフィック)が追加され、拡張現実感映像が作成されて表示される。 (もっと読む)


61 - 70 / 1,456