説明

国際特許分類[G10L11/02]の内容

国際特許分類[G10L11/02]に分類される特許

71 - 80 / 242


【課題】同時発話が発生しても、話者毎に発話内容を明確に再生すること。
【解決手段】信号処理部4は、複数の音声データより話者を特定する話者特定部42と、話者特定部42によって少なくとも第1及び第2の話者を特定した場合に、特定された第1及び第2の話者が発話した発話区間を特定し、第1及び第2の話者が同時に発話した区間を同時発話区間として判定する同時発話区間判定部43と、を備える。また、信号処理部4は、同時発話区間判定部43で判定された同時発話区間の第1の話者の音声データと第2の話者の音声データとを分離し、分離された各話者の音声データをそれぞれ時間的に異なるタイミングとして出力させる整列部45と、を備える。 (もっと読む)


【課題】表示情報に対して、利用者が注目している情報と利用者の音声とを容易に対応付けて格納することができる装置を提供する。
【解決手段】文書データ又は画像データの少なくとも一方を含む表示情報を格納する格納部と、格納部が格納した表示情報を表示する表示部と、利用者の視線を検出する視線検出部と、利用者の視線に基づいて、表示部に表示された表示情報のうち、利用者が注目している注目情報を検出する注目情報検出部と、利用者の音声を検出し、音声を注目情報に対応付けて格納部に格納する音声検出部とを備える情報管理装置を提供する。 (もっと読む)


【課題】モード情報を符号化/伝送することなく、音源部の符号化モードの切換を行うことが可能となり、音声信号を高能率に符号化すること。
【解決手段】加算器606は、現在の処理単位時間における平滑化量子化LSPパラメータと1つ前の処理単位時間における平滑化量子化LSPパラメータとの差を算出する。2乗和算出手段607は、加算器606の出力について次数毎の差の2乗和を計算する。AR型平均値算出手段611は、雑音区間における平均的LSPパラメータを算出する。加算器612は、現在の処理単位時間における量子化LSPパラメータと雑音区間における平均的量子化LSPパラメータとの差を次数毎に算出する。2乗和算出手段613は、加算器612について次数毎の2乗和を算出する。音声区間検出手段619は、現在の処理単位時間における入力信号が音声区間であるか否かの判定を行う。 (もっと読む)


【課題】楽器などの発音体から発せられた音声の出力と、その楽器以外の音声の出力とが時間的に重ならないようにする。
【解決手段】発音体としてのアップライトピアノ100から発音が無いと判定されている期間にわたっては、マイクロホン161によって収音された演奏者の発話音声がスピーカ162から出力される。一方、アップライトピアノ100から発音が有ると判定されている期間にわたっては、マイクロホン161によって収音された演奏者の発話音声がスピーカ162から出力されることはない。よって、アップライトピアノ100から発せられた音声と、演奏者の発話音声とが重なる期間を無くすか、或いはその期間があっても極めて短くすることができる。 (もっと読む)


【課題】システム構成が複雑となることを抑制しつつ、車室内における乗員間のコミュニケーションを取り易くする。
【解決手段】本発明の車室内乗員コミュニケーションシステム10は、車室内の乗員P1の音声を検出するためのマイク12と、マイク12によって検出された音声を出力する指向性を備えたスピーカ14と、スピーカ14から出力された音声が車室内における第一領域A1に伝達される第一伝達態様と、車室内における第二領域A2に伝達される第二伝達態様と、に変更可能な回動機構16と、乗員P1が第一領域A1を視認可能な第一視認態様と第二領域A2を視認可能な第二視認態様とに変更可能なミラー18と、ミラー18が第一視認態様にあるときに回動機構16を第一伝達態様にさせ、ミラー18が第二視認態様にあるときに回動機構16を第二伝達態様にさせる連動機構20と、を備える。 (もっと読む)


【課題】入力音声に対する音声終端までの音声認識の結果の取得を高速化できる音声認識装置を提供する。
【解決手段】特徴抽出部2は入力音声を所定の音声区間毎のフレームに区分けしてその特徴パラメータを抽出し、FIFO3に時系列に格納すると共に、音声区間以上の設定期間、無音状態が継続した音声終端で有るかを音声終端検出部5を用いて検出し、検出した場合には終端フレーム情報として終端情報記憶部6に書き込む。音声認識部4はFIFO3から読み出した各フレームの特徴パラメータに対する音声認識を行う場合、終端フレーム情報を参照し、その特徴パラメータのフレームが無音状態のフレーム情報に該当する場合にはそのフレームの特徴パラメータに対する音声認識の処理を省略する。 (もっと読む)


【課題】音声処理中であっても、マイクロフォンアレイを構成する複数のマイクロフォンの異常動作判定を行えるようにする。
【解決手段】無音判定部1241は、無音判定を行い、マイクロフォンアレイ異常動作判定部124は、無音判定部1241が無音と判定したときは、マイクロフォンアレイ異常動作判定処理を行わない。無音でない場合、マイクロフォンアレイ異常動作判定部124は、マイクロフォン1211〜1213に対応するデジタル音声信号の各信号レベルの信号レベル差、相関係数に基づいて、マイクロフォンアレイ異常動作の判定を行う。制御部17は、マイクロフォンアレイ異常動作判定部124からマイクロフォンアレイ異常動作等の通知があったときは、異常動作のマイクロフォンを音声処理に使用しないように、音声処理に使用するマイクロフォン1211〜1213の変更を行う。 (もっと読む)


【課題】作業の効率を向上させる。
【解決手段】区切り点設定手段1dは、音声データ記憶手段1aから音声データを読み出し、区切り点を設定して区間音声データを抽出する。音声データ編集手段1eは、1音声当たりに付加される音声設定されているランクに基づいて算出される無音部を区間音声データに付加する編集を行って編集音声データ記憶手段1bに格納する。編集が終了した編集済音声データは、音声再生制御手段1fによって再生される。ランク調整手段1gは、聞き直し時間を含む編集済音声データが再生された時間と、編集済音声データの音声数とに基づいて作業者の処理速度を算出し、設定ランクを動的に調整する。 (もっと読む)


【課題】受聴者に対してより快適に音声を聞き取り易くする。
【解決手段】受聴者に受聴させる音声の所定の区間を強調して音声を出力する補聴装置において、受聴者に受聴させる音声を入力する音声入力部と、前記音声入力部により入力された音声から強調させる音声区間及び音声開始点を検出する音声区間検出部と、前記音声区間検出部により検出された前記音声開始点を基準として、話速及びホルマントを制御して補聴音声を生成する補聴音声生成部と、前記補聴音声生成部により生成された補聴制御された音声を出力する音声出力部とを有することにより、上記課題を解決する。 (もっと読む)


複数のマイクロホンを使用する音声アクティビティ検出は、スピーチ参照マイクロホン及びノイズ参照マイクロホンの各々のエネルギー間の関係に基づくことができる。スピーチ参照マイクロホン及びノイズ参照マイクロホンの各々からのエネルギー出力は、決定されることができる。ノイズエネルギーに対するスピーチエネルギーの比は、決定されて、所定の音声アクティビティ閾値と比較されることができる。他の実施形態では、スピーチ及びノイズ参照信号の自己相関の絶対値は、決定され、自己相関値に基づく比が決定される。所定の閾値を超える比は、音声信号の存在を示すことができる。スピーチ及びノイズのエネルギー又は自己相関は、加重平均を使用して、或いは、個別のフレームサイズにわたって、決定されることができる。
(もっと読む)


71 - 80 / 242