説明

国際特許分類[G10L11/02]の内容

国際特許分類[G10L11/02]に分類される特許

21 - 30 / 242


【課題】無線通信を効率よく行うこと、及び音声信号に悪影響を与えないようにする。
【解決手段】複数の音声入力を有する機器に、情報を無線伝送する無線伝送部と、無線伝送部の送信開始や、送信電力の減衰量を制御する送信制御部と、複数の音声入力を選択する音声選択部と、音声選択部で選択された音声入力部からの音声レベルを検出する音声レベル検出部と、音声選択部で選択された音声入力によって無線送信電力を減衰させる閾値を決定して閾値設定を行う閾値抽出部と、前記音声レベル検出部の値と閾値抽出部の値により送信制御部を制御する制御手段とを設け、無線通信時に発生するノイズの悪影響を可能な限り排除した無線通信制御を行うことができるようにする。 (もっと読む)


【課題】スピーチ信号の可変ビットレート符号化のための方法および装置であり、低いビットレートを実現する。
【解決手段】入力の分類に基づき適切な符号化モードが選択される。各分類について許容可能なスピーチ再生品質で最も低いビットレートを達成する符号化モードが選択される。高忠実度モードを、この忠実度が許容可能な出力のために要求されるスピーチの部分の期間中に使用するだけで、低い平均ビットレートが達成される。低ビットレートモードはこれらのモードが許容可能な出力を生成するスピーチの部分の期間中に使用される。入力スピーチ信号はアクティブおよび非アクティブ領域に分類される。要求される忠実度のレベルに応じて、種々の符号化モードがアクティブスピーチに適用される。符号化モードは、特定のモードのそれぞれの強さおよび弱さに応じて使用されうる。装置は、スピーチ信号の特性が時間的な変化に伴いモード間で動的に切換わる。 (もっと読む)


【課題】光学ズーム動作に伴うノイズを記録音声および/または出力音声から除去可能な、撮像装置、撮像方法およびプログラムを提供する。
【解決手段】ユーザからのズーム指示に応じて、光学ズーム動作を行う撮像部15と、マイクロホン35から入力される音声信号を、記録装置および/または出力装置に供給する音声信号供給部(主制御部11)と、音声信号の入力状況を判定する音声信号判定部(主制御部11)と、ズーム指示の操作信号が入力されるかを判定する操作信号判定部(主制御部11)と、ズーム指示の操作信号が入力されると、音声信号の入力状況に応じて、光学ズームの作動時点を調節するズーム作動調節部(主制御部11)と、を備える。 (もっと読む)


【課題】雑音中であっても正確に使用者の発生する操作用の音声を聞き取り、それに基づき制御する電動車椅子を提供する。
【解決手段】電動車椅子は、ユーザ音声をマルチチャンネルで複数受音するために任意数のマイクロフォンを設けたマイクロフォンアレイ30a、30bを複数個相互に離間して配置してなる受音手段を備えた音声入力手段と、3次元空間中の任意の位置に配置された前記受音手段で受音したマルチチャネル音声データに基づいてMUSIC法によりユーザの発声位置を推定し発声位置推定信号を出力する発声位置推定手段と、前記発声位置推定信号に基づき車輪35a、35b、36bの駆動源を制御する制御手段を有する。 (もっと読む)


【課題】音声データ中の無音区間の検出処理に係る演算数を減らすことができる音声処理装置、プログラム、音声処理方法および録画装置を提供する。
【解決手段】デジタルテレビ録画再生装置は、複数の音声サンプルの集合である音声信号を出力し、出力された音声信号の音声サンプルの内、一定間隔の音声サンプルに対して音量レベルが一定の音量範囲内か否かを判別し、音量レベルが一定の音量範囲内であると少なくとも一定回数連続して判別された区間を無音区間として検出する。 (もっと読む)


【課題】収音装置、利得制御方法、およびプログラムを提供すること。
【解決手段】指向性を形成して指向方向ごとに信号を取得する信号取得部と、指向方向と信号閾値が対応付けて記録される記録部と、前記信号取得部により取得された信号から音声信号を検出する音声検出部と、前記音声検出部により検出された音声信号の信号レベルが、前記音声信号が取得された指向方向に対応する信号閾値を上回るか否かを判断する判断部と、前記判断部による判断結果に基づき、前記信号閾値を上回る音声信号を第1の信号レベルに利得調整を行う利得制御部と、を備え、前記利得制御部は、前記信号閾値を下回る音声信号の利得調整を行わない、または、前記第1の信号レベルより低い第2の信号レベルに利得調整する、収音装置。 (もっと読む)


【課題】入力信号の音量が小さいときでも、有音無音の判定精度を向上させること。
【解決手段】有音無音判定装置1aは、フレーム音量算出部11が計算したフレーム音量が閾値音量より小さいときに、フレーム音量を閾値音量に変更するフレーム音量選択部22と、フレーム音量と、推定された前回までの雑音音量とをもとに、今回の雑音音量を推定する雑音音量推定部12と、フレーム音量が今回の雑音音量をもとにした判定用閾値より大きいときに、前記フレーム音量の計算元となるフレームを有音フレームと判定する有音無音判定部13と、を有する。 (もっと読む)


【課題】
音声情報と画像情報を総合的に用いるマルチモーダル音声区間検出により、音声区間検出における音響雑音の影響を抑制することができる音声区間検出装置を提供する。
【解決手段】
音声区間検出装置100は、音響特徴量と画像特徴量を合わせた音響画像特徴量を生成して、該音響画像特徴量に基づいて音声区間を判定する第1マルチモーダルVAD部131と、音響特徴量のみを用いて音声区間の判定を行う音声ユニモーダルVAD部132と、画像特徴量のみを用いて音声区間の判定を行う画像ユニモーダルVAD部133と、音声ユニモーダルVAD部132及び画像ユニモーダルVAD部133の判定を統合して、音声区間の判定を行う第2マルチモーダルVAD部134と、第1マルチモーダルVAD部131、第2マルチモーダルVAD部134の判定結果を多数決原理で統合して音声区間の判定を行う第3マルチモーダルVAD部135を備える。 (もっと読む)


【課題】玄関子機との間で音声信号を送受信して通話を行うにあたり居室親機に形成される通話路の切り換えを、住戸内外の周囲環境下の騒音レベルの差に依存せず偏りなく実行する。
【解決手段】玄関子機マイクに入力され居室親機のスピーカから受話音声として出力させる受話側デジタル音声信号のノイズレベル、親機マイクに入力され子機スピーカから受話音声として出力させる送話側デジタル音声信号のノイズレベルを推定し、推定されたノイズレベルに送話、受話の各デジタル音声信号が無音信号又は有音信号であるかを判別する音声判別閾値を算出し、算出された音声判別閾値との比較に基づき送話、受話の各デジタル音声信号が無音信号又は有音信号であるかを判別する。また、送話側で有音信号と判別された音声信号の信号電圧及び送話側の音声判別閾値の差分と、受話側で有音信号と判別された音声信号の信号電圧及び受話側の音声判別閾値の差分とを比較する。 (もっと読む)


【課題】操作性を向上させて音声データの文区切りを設定すること。
【解決手段】無音検出部106は、音声データに含まれる無音区間を検出し、無音情報保持部107は、無音区間の尤度を算出し、設定部108は、検出された無音区間のうち、予め設定された閾値以上の尤度を有する無音区間を音声データの区切り位置として設定し、修正部112は、音声データの区切りの追加を指示する修正指示が発生した時刻の直前の区切り位置と、修正指示が発生した時刻の直後の区切り位置との間の区間内の無音区間のうち、尤度が最も高い無音区間を音声データの区切り位置として追加する。 (もっと読む)


21 - 30 / 242