レベル調整判定装置、その方法、およびそのプログラム
【課題】入力信号の波形の振幅を正確に過大、過小であるかを判断できる。
【解決手段】入力信号のレベルLを算出し(102、S2)、レベルLが予め定められた第1閾値Amax以上/より大きいか否かを判定し(104、S4)、レベルLが第1閾値Amax以上/より大きいと判定されると、過去の予め定められた判定時間Tf内で、レベルLが第1閾値Amax以上/より大きい時間の合計時間である閾値大時間THを算出し(108、S8)、閾値大時間THを用いて、第1閾値Amax以上/より大きいレベルについての相加平均である閾値大平均レベルMHを算出し(112、S10)、閾値大平均レベルが予め定められた第2閾値Bmax以上/より大きいか否かを判定し(116、S12)、この判定結果に応じた入力信号のレベルを調整するための調整命令信号を生成、出力する(124、S14、S16)。
【解決手段】入力信号のレベルLを算出し(102、S2)、レベルLが予め定められた第1閾値Amax以上/より大きいか否かを判定し(104、S4)、レベルLが第1閾値Amax以上/より大きいと判定されると、過去の予め定められた判定時間Tf内で、レベルLが第1閾値Amax以上/より大きい時間の合計時間である閾値大時間THを算出し(108、S8)、閾値大時間THを用いて、第1閾値Amax以上/より大きいレベルについての相加平均である閾値大平均レベルMHを算出し(112、S10)、閾値大平均レベルが予め定められた第2閾値Bmax以上/より大きいか否かを判定し(116、S12)、この判定結果に応じた入力信号のレベルを調整するための調整命令信号を生成、出力する(124、S14、S16)。
【発明の詳細な説明】
【技術分野】
【0001】
この発明は、例えば、入力された信号のレベルの調整量を自動的に判定するレベル調整判定装置、その方法、およびそのプログラムに関する。
【背景技術】
【0002】
入力された音声信号を例えば音声認識システムなどで認識する場合、音声信号のレベル、つまり、音量(波形振幅レベル)を適正な一定の範囲内に調整した後に、使用したい場合がある。従来の入力された音声のレベルを自動調整する方法としては、予め定められた過去の一定時間(以下、「判定時間」という)内で、入力された音声のレベル(例えば、「パワー」や「振幅絶対値」)の相加平均値を平均レベルとして算出する。そして、この平均レベルが予め定められた閾値を上回っているか、もしくは、下回っている場合にレベル調整するというのが一般的な方法である。この技術を従来技術1とする。
【0003】
また、単に音声信号の振幅や低周波数部分の音声信号の振幅を観測して、振幅が小さければ当該音声信号のレベルを上げ、振幅が大きければ当該音声信号のレベルを下げるという技術もある。この技術の詳細は特許文献1に記載されており、この技術を従来技術2とする。
【0004】
また、背景騒音の音量から音声音量の大小を判定してスピーカから出る音量を一定レベルとして聴こえるように自動調整する方法もある。この技術の詳細は特許文献2に記載されており、この技術を従来技術3とする。
【特許文献1】特開2004−328699号
【特許文献2】特開2006−165865号
【発明の開示】
【発明が解決しようとする課題】
【0005】
図1に、従来技術1のレベル調整判定装置を用いた場合の入力された音声信号F(t)の波形(以下、「音声波形」という場合もある。)を示す。ただし、横軸が時間を表し、縦軸が振幅値である。また図1に、従来技術1のレベル調整判定装置が算出する当該波形に対応する平均レベルGも示す。平均レベルGについての上限Amaxと平均レベルの下限Aminは予め定められており、平均レベルGが上限Amaxより大であればその判定時間内の音声の音量は過大であると判定される。また、平均レベルGが下限Aminより小であればその判定時間内の音声の音量は過小であると判定される。図1に示す入力された音声信号F(t)は、判定時間内で、波形が極端に大きい振幅(クリッピングした状態など)と、波形が小さい振幅と、が短い時間間隔で交互に存在する波形であり、F(t)の振幅は全体的に過大である。平均レベルGは、上述のように、判定時間Tf(t1〜t2)での相加平均である。t2はt1よりも過去の時刻を表す。また、t1を現在の時刻とし、t1=0とすることが好ましい。従って、平均レベルGは以下の式で求まる。
【0006】
【数1】
【0007】
図1記載の音声信号の波形の場合に、上記式(1)の演算で平均レベルGを求めると、平均レベルGは、図1記載のように、波形が極端に大きい振幅値L1と比べて小さくなる。そして、区間α1でレベルが過小と判断され、区間α2でレベルが過大であると判断される。従って、音声信号F(t)の波形は実際には全体的に過大であるが、従来技術1のレベル調整判定装置は、区間α2のみで過大と判断し、音声信号F(t)の波形を全体的に過大であるとは判断しない。このように、従来技術1のレベル調整判定装置は、入力された音声信号の波形が常に過大な場合や、常に過小な場合には、ゆったりとした速度で大雑把に振幅の大小を判定できる。しかし、図1記載の波形の場合には、振幅の大小を判定できず、結果として、正確に音量を自動調整することは難しいという問題がある。
【0008】
次に、図2記載のように、入力された音声信号F(t)の波形の振幅が、ある部分だけ(図2では区間α3)が過大である場合について考える。図2記載の音声信号F(t)に対して、従来技術1のレベル調整判定装置を用いた場合の平均レベルGも図2に示す。平均レベルGの求め方は上記式(1)で求める。図2に示すように、区間α3内であっても、平均レベルGは、波形が極端に大きい振幅値L1と比べて小さくなり、AmaxとAminとの間であると判定される。従って、従来技術1では、音声波形の振幅が部分的に過大(もしくは過小)な場合には、過大(もしくは過小)と判定できないという問題がある。また、従来技術2や従来技術3であっても上述の理由同様、音声波形の振幅が過大もしくは過小であるかは判断できない。
【0009】
本発明の目的は、どのような音声波形の振幅であっても、正確に振幅が過大もしくは過小であるかを判断するレベル調整判定装置、その方法、およびそのプログラムを提供することを目的とする。
【課題を解決するための手段】
【0010】
この発明のレベル調整判定装置は、信号レベル算出部と、第1判定部と、閾値大時間算出部と、閾値大平均レベル算出部と、第2判定部と、調整命令信号生成部と、を備える。信号レベル算出部は、入力信号のレベルを算出する。第1判定部は、レベルが予め定められた第1閾値以上または、第1閾値より大きいか否かを判定する。閾値大時間算出部は、レベルが第1閾値以上または、第1閾値より大きいと判定されると、過去の予め定められた判定時間内で、レベルが第1閾値以上または、第1閾値より大きい時間の合計時間である閾値大時間を算出する。閾値大平均レベル算出部は、閾値大時間を用いて、第1閾値以上または、第1閾値より大きいレベルについての相加平均である閾値大平均レベルを算出する。第2判定部は、閾値大平均レベルが予め定められた第2閾値以上または、第2閾値より大きいか否かを判定する。調整命令信号生成部は、第2判定部の判定結果に応じた入力信号のレベルを調整するための調整命令信号を生成、出力する。
【0011】
また、この発明のレベル調整判定装置は、信号レベル算出部と、第4判定部と、閾値小時間算出部と、閾値小平均レベル算出部と、第5判定部と、調整命令信号生成部と、を備えても良い。信号レベル算出部は、入力信号のレベルを算出する。第4判定部は、レベルが予め定められた第4閾値以下または、第4閾値より小さいか否かを判定する。閾値小時間算出部は、レベルが前記第4閾値以下または、第4閾値より小さいと判定されると、過去の予め定められた判定時間内で、レベルが前記第4閾値以下または、第4閾値より小さい時間の合計時間である閾値小時間を算出する。閾値小平均レベル算出部は、閾値小時間を用いて、第4閾値以下または、第4閾値より小さいレベルについての相加平均である閾値小平均レベルを算出する。第5判定部は、閾値小平均レベルが予め定められた第5閾値以下または、第5閾値より小さいか否かを判定する。調整命令信号生成部は、第5判定部の判定結果に応じた前記入力信号のレベルを調整するための調整命令信号を生成、出力する。
【発明の効果】
【0012】
上記の構成により、入力された信号がどのような波形であっても、正確に振幅が過大もしくは過小であるかを判断できる。
【発明を実施するための最良の形態】
【0013】
以下に、発明を実施するための最良の形態を示す。なお、同じ機能を持つ構成部や同じ処理を行う過程には同じ番号を付し、重複説明を省略する。また、以下の説明では、入力される信号を音声信号として説明する。
【実施例1】
【0014】
図3に、本発明のレベル調整判定装置が実施される場合の構成例を示す。音声入力部2とは例えば、マイクロホン付きヘッドセットとマイクアンプであり、音声入力部2は、入力された音声のレベル(音量)を調整する調整手段22を有する。調整手段22は、後述するレベル調整判定装置4よりの調整命令信号に応じて、レベルを調整する。アプリケーション6とは例えば、音声認識システムである。レベル調整判定装置が使用される状況の一例として、オペレータ(人間)が音声入力部2(ヘッドセット)を装着して、マイクロホンに対して音声を発する。そして、レベル調整判定装置4に当該音声が入力されると、レベル調整判定装置4は、入力された音声信号を適度なレベルにさせるための調整命令信号を生成して、音声入力部2中の調整手段22に出力する。調整命令信号の生成手法は後ほど詳細に説明する。そして、調整手段22により適度なレベルになった音声信号はアプリケーション6(音声認識システム)に入力され、音声認識処理などが行われる。以下に、レベル調整判定装置4による調整命令信号の生成手法を説明する。また、アプリケーション6は音声認識装置に限られない。
【0015】
図4に実施例1のレベル調整判定装置4−1の機能構成例を示し、図5にレベル調整判定装置4−1の主な処理の流れを示す。まず、信号レベル算出部102が、音声信号F(t)のレベルLを算出する(ステップS2)。ここで、レベルLとは例えば、入力音声の振幅絶対値│F(t)│やパワー│(F(t))2│である。
【0016】
第1判定部104は、レベルLが予め定められた第1閾値Amax以上か否かを判定する、もしくは、レベルLが予め定められた第1閾値Amaxより大きいか否かを判定する(ステップS4)。以下の説明では、これらのことをまとめて「第1閾値以上/より大きいか否か」という場合もある。第1閾値Amaxは予め第1閾値記憶部106に記憶されている。
【0017】
閾値大時間算出部108は、レベルLが第1閾値Amax以上/より大きいと判定されると、過去の予め定められた判定時間Tf(t1〜t2)内で、レベルLが第1閾値Amax以上/より大きい時間の合計時間である閾値大時間THを算出する(ステップS6)。また、t1を現在の時刻とし、t1=0とすることが好ましい。算出された閾値大時間THを、一旦、閾値大時間記憶部110に記憶させることが好ましい。閾値大時間算出部108は、レベルLが第1閾値Amaxより小さい/以下と判定されると、閾値大時間THの算出を行わない。
【0018】
閾値大平均レベル算出部112は、閾値大時間THを用いて、第1閾値Amax以上/より大きいレベルLについての相加平均である閾値大平均レベルMHを算出する(ステップS10)。具体的には、閾値大平均レベルMHを以下の式で表すことができる。
【0019】
【数2】
【0020】
式(2)の分子は、レベルLが閾値大平均レベルMH以上/より大きい時間間隔において積分を行い、判定時間Tf内でのそれらの合計を算出していることを示す。閾値大平均レベルMHは、一旦、閾値大平均レベル記憶部114に記憶させてもよい。
【0021】
第2判定部116は、閾値大平均レベルMHが予め定められた第2閾値Bmax以上か否かを判定する、もしくは、予め定められた第2閾値Bmaxより大きいか否かを判定する(ステップS12)。もし、第2判定部116が、MHはBmax以上でない、もしくはBmaxより大きくないと判定すれば、レベルLは少し大きいと判断し、調整命令信号生成部124に、入力信号のレベルLを少し下げるような調整命令信号を生成させる(ステップS14)。また、第2判定部116が、MHはBmax以上である、もしくはBmaxより大きいと判定すれば、レベルLはかなり大きいと判断し、調整命令信号生成部124に、入力信号のレベルLをかなり下げるような調整命令信号を生成させる(ステップS16)。このように、調整命令信号生成部124は、第2判定部116の判定結果に応じた入力信号のレベルLを調整するための調整命令信号を生成、出力する。出力した調整命令信号は、音声入力部2中の調整手段22(図3参照)に入力される。
【0022】
これらの構成により、レベル調整判定装置4−1は、入力音声の波形が極端に大きい振幅と、波形が小さい振幅と、が短い時間間隔で交互に存在する波形(図1参照)であったり、部分的にレベルが過大な波形(図2参照)であっても、高精度に入力音声のレベルの大小を判断できる。
【0023】
また、レベル調整判定装置4−1は、入力音声の波形のレベルが、部分的に過小であっても、高精度に入力音声のレベルを調整できる。以下、詳細に説明する。
【0024】
第4判定部132は、レベルLが予め定められた第4閾値Amin以下か否かを判定する、もしくは、レベルLが予め定められた第4閾値Aminより小さいか否かを判定する(ステップS24)。第4閾値Aminは予め第4閾値記憶部134に記憶されている。
【0025】
閾値小時間算出部136は、レベルLが第4閾値Amin以下/より小さいと判定されると、過去の予め定められた判定時間Tf(t1〜t2)内で、レベルLが第4閾値Amin以下/より小さい時間の合計時間である閾値小時間TLを算出する(ステップS26)。また、t1を現在の時刻とし、t1=0とすることが好ましい。算出された閾値小時間TLは、一旦、閾値小時間記憶部138に記憶させてもよい。閾値小時間算出部136は、レベルLが第4閾値Amin以上/より大きいと判定されると、閾値小時間TLの算出を行わない。
【0026】
閾値小平均レベル算出部144は、閾値小時間TLを用いて、第4閾値Amin以下/より小さいレベルLについての相加平均である閾値小平均レベルMLを算出する(ステップS30)。具体的には、閾値小平均レベルMLを以下の式で表すことができる。
【0027】
【数3】
【0028】
式(3)の分子は、レベルLが閾値小平均レベルML以下/より小さい時間間隔において積分を行い、それらの合計を算出していることを示す。閾値小平均レベルMLは、一旦、閾値小平均レベル記憶部146に記憶させてもよい。
【0029】
第5判定部148は、閾値小平均レベルMLが予め定められた第5閾値Bmin以下か否かを判定する、もしくは、予め定められた第5閾値Bminより小さいか否かを判定する(ステップS32)。もし、第5判定部148が、MLはBmin以下でない、もしくはBmaxより小さくないと判定すれば、レベルLは少し小さいと判断し、調整命令信号生成部124に、入力信号のレベルLを少し上げるような調整命令信号を生成させる(ステップS34)。また、第2判定部116が、MHはBmax以下である、もしくはBmaxより小さいと判定すれば、レベルLはかなり小さいと判断し、調整命令信号生成部124に、入力信号のレベルLをかなり上げるような調整命令信号を生成させる(ステップS36)。このように、調整命令信号生成部124は、第5判定部148の判定結果に応じた入力信号のレベルLを調整するための調整命令信号を生成、出力する。
【0030】
このように、レベル調整判定装置4−1は、入力音声の波形が極端に大きい振幅と、波形が小さい振幅と、が短い時間間隔で交互に存在する波形(図1参照)であったり、部分的にレベルが過大な波形(図2参照)であったり、部分的にレベルが過小な波形であっても、高精度に入力音声のレベルの大小を判断できる。また、入力音声のレベルの大小の判断をリアルタイムで行うために、図5に示した各処理を短い時間間隔で行うことが好ましい。
【0031】
[変形例1]
次に、変形例1であるレベル調整判定装置4−2について説明する。図6にレベル調整判定装置4−2の機能構成例を示し、図7にレベル調整判定装置4−2の主な処理の流れを示す。
レベル調整判定装置4−2は、レベル調整判定装置4−1と比較して、第4判定部132、第4閾値記憶部134、閾値小時間算出部136、閾値小時間記憶部138、閾値小平均レベル算出部144、閾値小平均レベル記憶部146、第5判定部148、第5閾値記憶部150がない点で異なる。レベル調整判定装置4−2のような構成にすることで、例えば、入力音声のレベルが部分的に過大である波形であっても、高精度に入力音声のレベルを調整できる。
【0032】
[変形例2]
次に、変形例2であるレベル調整判定装置4−3について説明する。図8にレベル調整判定装置4−3の機能構成例を示し、図9にレベル調整判定装置4−3の主な処理の流れを示す。
レベル調整判定装置4−3は、レベル調整判定装置4−1と比較して、第1判定部104、第1閾値記憶部106、閾値大時間算出部108、閾値大時間記憶部110、閾値大平均レベル算出部112、閾値大平均レベル記憶部114、第2判定部116、第2閾値記憶部118がない点で異なる。レベル調整判定装置4−3のような構成にすることで、例えば、入力音声のレベルが部分的に過小である波形であっても、高精度に入力音声のレベルを調整できる。
【実施例2】
【0033】
音声入力部2(ヘッドセット)から入力された音声において、例えば、咳払いなどの発話以外の音が入力されることがある。このように、通常の発話中の音量が適正な場合に、咳払いをしてしまうと、突発的に、短時間の間、過大な音量となり、クリッピングする場合がある。また、発話中に発話者が短時間、黙り込むことでわずかな無音(過小)になってしまうこともある。このような、短時間の間の過大なレベルLや短時間の間の過小なレベルLを自動調整の情報として用いるのは、好ましくない。何故なら、入力音声のレベルが頻繁に上下に調整されることになり、入力音声のレベルが安定せず、調整後の音声を音声認識システム(図3参照)で用いる場合には、的確に音声認識できなくなる。このような突発的で、短時間の過大もしくは過小な音に対しても、入力音声が過大もしくは過小であると判断できる方法として、振幅絶対値の短時間平均値を求めて、利用する方法がある。この技術を従来技術4とする。図10に、入力音声と、従来技術4のレベル調整判定装置が算出する当該入力音声の平均レベルGと、を示す。また、図1や図2と同様に、従来技術4のレベル調整判定装置は、平均レベルGが、上限Amaxより大であれば過大と判断し、下限Aminより小であれば過小と判断する。図10に示すように、例えば、区間α4で咳払いがされたとすると、区間α4での音声が過大と判断され音声レベルを下げてしまうと、逆に、短い無音区間や弱い発音の発話区間に対しても、実際には下限Aminより大きいにも関わらず、レベルが過小と判断されてしまう。その結果、入力音声のレベルが頻繁に上下することになる。
【0034】
そこで、この実施例2で説明するレベル調整判定装置4−4は、このような突発的で短時間の過大な音声や短時間の過小な音声であっても、高精度に音声レベルの過大、過小を判断できる。図11に、レベル調整判定装置4−4の機能構成例を示し、図12にレベル調整判定装置4−4の主な処理の流れを示す。レベル調整判定装置4−4は、レベル調整判定装置4−1と比較して、第3判定部120、第3閾値記憶部122、第6判定部140、第6閾値記憶部142を有する点で異なる。また、図5(レベル調整判定装置4−1の処理の流れ)と図11(レベル調整判定装置4−4の処理の流れ)では、ステップS6とステップS10との間にステップS8があること、かつ、ステップS26とステップS30との間にステップS28がある点で異なる。
【0035】
第3判定部120は、閾値大時間THが予め定められた第3閾値Cmax以下であるか否か、もしくは閾値大時間THが第3閾値Cmaxより小さいか否かを判定する(ステップS8)。第3閾値Cmaxは、予め、第3閾値記憶部122に記憶されている。閾値大時間THが第3閾値Cmax以下もしくは、第3閾値Cmaxより小さいということは、判定時間Tf内で入力音声のレベルLがAmaxより大きい時間の合計時間(閾値大時間TH)が極端に短いということである。つまり、閾値を超えている区間は例えば、突発的で短時間の過大な音声(例えば、咳払い)の時間と判断される。閾値大時間THが第3閾値Cmax以上/より大きいと判定されると、閾値大平均レベル算出部112によるステップS12の処理を行う。閾値大時間THが第3閾値Cmax以下/より小さいと判定されると、調整命令信号生成部124に調整命令信号を生成させないようにする。
【0036】
また、第6判定部140は、閾値小時間記憶部138よりの閾値小時間TLについても第6閾値Cmin以下か否か、もしくは第6閾値Cminより小さいか否かを判定する(ステップS28)。閾値小時間TLが第6閾値Cmax以下もしくは、第3閾値Cmaxより小さいということは、判定時間Tf内で入力音声のレベルLがAminより小さい時間の合計時間(閾値小時間TL)が極端に短いということである。つまり、閾値を下回っている区間は、突発的で短時間の過小な音声(例えば、発話者の黙り込み)の時間などと判断される。閾値小時間TLが第6閾値Cmin以上/より大きいと判定されると、閾値小平均レベル算出部144によるステップS30の処理を行う。閾値小時間TLが第6閾値Cmin以下/より小さいと判定されると、調整命令信号生成部124に調整命令信号を生成させないようにする。
【0037】
図13に、入力音声と、レベル調整判定装置4−4が算出する当該入力音声の閾値大平均レベルMH(黒色実線で示す)と、閾値小平均レベルML(白色実線で示す)と、を示す。閾値大平均レベルMHと、閾値小平均レベルMLとが、図13記載のように、デジタル的な波形になるのは、以下の2点になったときにMHとMLとの振幅値が変化するからである。閾値大平均レベルMHの場合は、(1)音声信号F(t)が第1閾値Amax以上/より大きくなったとき(2)第1閾値Amax以上/より大きい音声信号F(t)が、判定時間Tf外になったときに、振幅値が変化する。閾値小平均レベルMLの場合は、(1)音声信号F(t)が第4閾値Amin以下/より小さくなったとき(2)第4閾値Amin以下/より小さい音声信号F(t)が、判定時間Tf外になったときに振幅値が変化する。図13中の区間α5において、閾値大平均レベルMHが、第1閾値Amaxを超えている。しかし、閾値大時間THが、第3閾値Cmaxより短いので、入力音声のレベルLは過大とは判断されない。一方、区間α6において、閾値大平均レベルMHが、第1閾値Amaxを超えており、閾値大時間THが、第3閾値Cmaxより長いので、入力音声のレベルLは過大と判断される。
【0038】
上述のように、第3判定部120で、閾値大時間THが第3閾値Cmaxより小さいと判定されると、第1閾値Amaxを越えている区間は突発的な短時間の過大な音声(例えば、咳払い)の時間と判断される。また、第6判定部140で、閾値小時間TLが第6閾値Cminより小さいと判定されると、第1閾値Aminを越えている区間は突発的な短時間の過小な音声(例えば、発話者の黙り込み)の時間と判断される。これらの場合には、調整命令信号生成部124には、調整命令信号を生成させない。つまり、このレベル調整判定装置4−4は、従来技術のように単に予め定められた閾値より大きな値(または小さい値)の相加平均値を用いて入力音声レベルの過大、過小を判断するのではなく、閾値を超えた(または下回った)場合のみの時間(閾値大時間THもしくは、閾値小時間TL)と、その時間による相加平均値(閾値大平均レベルMHと閾値小平均レベルML)との両方を用いて、入力音声レベルの過大、過小を判断する。
【0039】
このようにすることで、咳払いやわずかな黙り込みのように、短時間の過大な音や過小な音をレベル調整の判断の対象から外すことができ、かつ、入力音声の波形が極端に大きい振幅と波形が小さい振幅とが短い時間間隔で交互に存在する波形(図1参照)であったり、部分的にレベルが過大な波形(図2参照)であったり、部分的にレベルが過小な波形であっても、入力音声のレベルが頻繁に上下することがなくなり、高精度に入力音声のレベルの自動調整を行うことができる。
【0040】
[変形例3]
次に変形例3のレベル調整判定装置4−5を説明する。図14にレベル調整判定装置4−5の機能構成例を示し、図15にレベル調整判定装置4−5の主な処理の流れを示す。レベル調整判定装置4−5は、レベル調整判定装置4−2と比較すると、第3判定部120と第3閾値記憶部122を備える点で異なる。
レベル調整判定装置4−5のような構成にすることで、入力音声のレベルが部分的に過大である波形であり、かつ、突発的な短時間の過大な音声であっても、高精度に入力音声のレベルを調整させることができる。
【0041】
[変形例4]
次に変形例4のレベル調整判定装置4−6を説明する。図16にレベル調整判定装置4−6の機能構成例を示し、図17にレベル調整判定装置4−6の主な処理の流れを示す。レベル調整判定装置4−6は、レベル調整判定装置4−3と比較すると、第6判定部140、第6閾値記憶部142を備える点で異なる。
レベル調整判定装置4−6のような構成にすることで、入力音声のレベルが部分的に過小である波形であり、かつ、突発的な短時間の過小な音声であっても、高精度に入力音声のレベルを調整させることができる。
【図面の簡単な説明】
【0042】
【図1】従来技術1のレベル調整判定装置を用いた場合の平均レベルGを示した図。
【図2】図1とは異なる入力音声についての従来技術1のレベル調整判定装置を用いた場合の平均レベルGを示した図。
【図3】本発明のレベル調整判定装置が実施される場合の構成例を示す図。
【図4】実施例1のレベル調整判定装置の機能構成例を示す図。
【図5】実施例1のレベル調整判定装置の主な処理の流れを示す図。
【図6】変形例1のレベル調整判定装置の機能構成例を示す図。
【図7】変形例1のレベル調整判定装置の主な処理の流れを示す図。
【図8】変形例2のレベル調整判定装置の機能構成例を示す図。
【図9】変形例2のレベル調整判定装置の主な処理の流れを示す図。
【図10】咳払いが含まれる入力音声についての従来技術1のレベル調整判定装置を用いた場合の平均レベルGを示した図。
【図11】実施例2のレベル調整判定装置の機能構成例を示す図。
【図12】実施例2のレベル調整判定装置の主な処理の流れを示す図。
【図13】咳払いが含まれる入力音声の波形についての実施例1のレベル調整判定装置を用いた場合の平均レベルGを示した図。
【図14】変形例3のレベル調整判定装置の機能構成例を示す図。
【図15】変形例3のレベル調整判定装置の主な処理の流れを示す図。
【図16】変形例4のレベル調整判定装置の機能構成例を示す図。
【図17】変形例4のレベル調整判定装置の主な処理の流れを示す図。
【技術分野】
【0001】
この発明は、例えば、入力された信号のレベルの調整量を自動的に判定するレベル調整判定装置、その方法、およびそのプログラムに関する。
【背景技術】
【0002】
入力された音声信号を例えば音声認識システムなどで認識する場合、音声信号のレベル、つまり、音量(波形振幅レベル)を適正な一定の範囲内に調整した後に、使用したい場合がある。従来の入力された音声のレベルを自動調整する方法としては、予め定められた過去の一定時間(以下、「判定時間」という)内で、入力された音声のレベル(例えば、「パワー」や「振幅絶対値」)の相加平均値を平均レベルとして算出する。そして、この平均レベルが予め定められた閾値を上回っているか、もしくは、下回っている場合にレベル調整するというのが一般的な方法である。この技術を従来技術1とする。
【0003】
また、単に音声信号の振幅や低周波数部分の音声信号の振幅を観測して、振幅が小さければ当該音声信号のレベルを上げ、振幅が大きければ当該音声信号のレベルを下げるという技術もある。この技術の詳細は特許文献1に記載されており、この技術を従来技術2とする。
【0004】
また、背景騒音の音量から音声音量の大小を判定してスピーカから出る音量を一定レベルとして聴こえるように自動調整する方法もある。この技術の詳細は特許文献2に記載されており、この技術を従来技術3とする。
【特許文献1】特開2004−328699号
【特許文献2】特開2006−165865号
【発明の開示】
【発明が解決しようとする課題】
【0005】
図1に、従来技術1のレベル調整判定装置を用いた場合の入力された音声信号F(t)の波形(以下、「音声波形」という場合もある。)を示す。ただし、横軸が時間を表し、縦軸が振幅値である。また図1に、従来技術1のレベル調整判定装置が算出する当該波形に対応する平均レベルGも示す。平均レベルGについての上限Amaxと平均レベルの下限Aminは予め定められており、平均レベルGが上限Amaxより大であればその判定時間内の音声の音量は過大であると判定される。また、平均レベルGが下限Aminより小であればその判定時間内の音声の音量は過小であると判定される。図1に示す入力された音声信号F(t)は、判定時間内で、波形が極端に大きい振幅(クリッピングした状態など)と、波形が小さい振幅と、が短い時間間隔で交互に存在する波形であり、F(t)の振幅は全体的に過大である。平均レベルGは、上述のように、判定時間Tf(t1〜t2)での相加平均である。t2はt1よりも過去の時刻を表す。また、t1を現在の時刻とし、t1=0とすることが好ましい。従って、平均レベルGは以下の式で求まる。
【0006】
【数1】
【0007】
図1記載の音声信号の波形の場合に、上記式(1)の演算で平均レベルGを求めると、平均レベルGは、図1記載のように、波形が極端に大きい振幅値L1と比べて小さくなる。そして、区間α1でレベルが過小と判断され、区間α2でレベルが過大であると判断される。従って、音声信号F(t)の波形は実際には全体的に過大であるが、従来技術1のレベル調整判定装置は、区間α2のみで過大と判断し、音声信号F(t)の波形を全体的に過大であるとは判断しない。このように、従来技術1のレベル調整判定装置は、入力された音声信号の波形が常に過大な場合や、常に過小な場合には、ゆったりとした速度で大雑把に振幅の大小を判定できる。しかし、図1記載の波形の場合には、振幅の大小を判定できず、結果として、正確に音量を自動調整することは難しいという問題がある。
【0008】
次に、図2記載のように、入力された音声信号F(t)の波形の振幅が、ある部分だけ(図2では区間α3)が過大である場合について考える。図2記載の音声信号F(t)に対して、従来技術1のレベル調整判定装置を用いた場合の平均レベルGも図2に示す。平均レベルGの求め方は上記式(1)で求める。図2に示すように、区間α3内であっても、平均レベルGは、波形が極端に大きい振幅値L1と比べて小さくなり、AmaxとAminとの間であると判定される。従って、従来技術1では、音声波形の振幅が部分的に過大(もしくは過小)な場合には、過大(もしくは過小)と判定できないという問題がある。また、従来技術2や従来技術3であっても上述の理由同様、音声波形の振幅が過大もしくは過小であるかは判断できない。
【0009】
本発明の目的は、どのような音声波形の振幅であっても、正確に振幅が過大もしくは過小であるかを判断するレベル調整判定装置、その方法、およびそのプログラムを提供することを目的とする。
【課題を解決するための手段】
【0010】
この発明のレベル調整判定装置は、信号レベル算出部と、第1判定部と、閾値大時間算出部と、閾値大平均レベル算出部と、第2判定部と、調整命令信号生成部と、を備える。信号レベル算出部は、入力信号のレベルを算出する。第1判定部は、レベルが予め定められた第1閾値以上または、第1閾値より大きいか否かを判定する。閾値大時間算出部は、レベルが第1閾値以上または、第1閾値より大きいと判定されると、過去の予め定められた判定時間内で、レベルが第1閾値以上または、第1閾値より大きい時間の合計時間である閾値大時間を算出する。閾値大平均レベル算出部は、閾値大時間を用いて、第1閾値以上または、第1閾値より大きいレベルについての相加平均である閾値大平均レベルを算出する。第2判定部は、閾値大平均レベルが予め定められた第2閾値以上または、第2閾値より大きいか否かを判定する。調整命令信号生成部は、第2判定部の判定結果に応じた入力信号のレベルを調整するための調整命令信号を生成、出力する。
【0011】
また、この発明のレベル調整判定装置は、信号レベル算出部と、第4判定部と、閾値小時間算出部と、閾値小平均レベル算出部と、第5判定部と、調整命令信号生成部と、を備えても良い。信号レベル算出部は、入力信号のレベルを算出する。第4判定部は、レベルが予め定められた第4閾値以下または、第4閾値より小さいか否かを判定する。閾値小時間算出部は、レベルが前記第4閾値以下または、第4閾値より小さいと判定されると、過去の予め定められた判定時間内で、レベルが前記第4閾値以下または、第4閾値より小さい時間の合計時間である閾値小時間を算出する。閾値小平均レベル算出部は、閾値小時間を用いて、第4閾値以下または、第4閾値より小さいレベルについての相加平均である閾値小平均レベルを算出する。第5判定部は、閾値小平均レベルが予め定められた第5閾値以下または、第5閾値より小さいか否かを判定する。調整命令信号生成部は、第5判定部の判定結果に応じた前記入力信号のレベルを調整するための調整命令信号を生成、出力する。
【発明の効果】
【0012】
上記の構成により、入力された信号がどのような波形であっても、正確に振幅が過大もしくは過小であるかを判断できる。
【発明を実施するための最良の形態】
【0013】
以下に、発明を実施するための最良の形態を示す。なお、同じ機能を持つ構成部や同じ処理を行う過程には同じ番号を付し、重複説明を省略する。また、以下の説明では、入力される信号を音声信号として説明する。
【実施例1】
【0014】
図3に、本発明のレベル調整判定装置が実施される場合の構成例を示す。音声入力部2とは例えば、マイクロホン付きヘッドセットとマイクアンプであり、音声入力部2は、入力された音声のレベル(音量)を調整する調整手段22を有する。調整手段22は、後述するレベル調整判定装置4よりの調整命令信号に応じて、レベルを調整する。アプリケーション6とは例えば、音声認識システムである。レベル調整判定装置が使用される状況の一例として、オペレータ(人間)が音声入力部2(ヘッドセット)を装着して、マイクロホンに対して音声を発する。そして、レベル調整判定装置4に当該音声が入力されると、レベル調整判定装置4は、入力された音声信号を適度なレベルにさせるための調整命令信号を生成して、音声入力部2中の調整手段22に出力する。調整命令信号の生成手法は後ほど詳細に説明する。そして、調整手段22により適度なレベルになった音声信号はアプリケーション6(音声認識システム)に入力され、音声認識処理などが行われる。以下に、レベル調整判定装置4による調整命令信号の生成手法を説明する。また、アプリケーション6は音声認識装置に限られない。
【0015】
図4に実施例1のレベル調整判定装置4−1の機能構成例を示し、図5にレベル調整判定装置4−1の主な処理の流れを示す。まず、信号レベル算出部102が、音声信号F(t)のレベルLを算出する(ステップS2)。ここで、レベルLとは例えば、入力音声の振幅絶対値│F(t)│やパワー│(F(t))2│である。
【0016】
第1判定部104は、レベルLが予め定められた第1閾値Amax以上か否かを判定する、もしくは、レベルLが予め定められた第1閾値Amaxより大きいか否かを判定する(ステップS4)。以下の説明では、これらのことをまとめて「第1閾値以上/より大きいか否か」という場合もある。第1閾値Amaxは予め第1閾値記憶部106に記憶されている。
【0017】
閾値大時間算出部108は、レベルLが第1閾値Amax以上/より大きいと判定されると、過去の予め定められた判定時間Tf(t1〜t2)内で、レベルLが第1閾値Amax以上/より大きい時間の合計時間である閾値大時間THを算出する(ステップS6)。また、t1を現在の時刻とし、t1=0とすることが好ましい。算出された閾値大時間THを、一旦、閾値大時間記憶部110に記憶させることが好ましい。閾値大時間算出部108は、レベルLが第1閾値Amaxより小さい/以下と判定されると、閾値大時間THの算出を行わない。
【0018】
閾値大平均レベル算出部112は、閾値大時間THを用いて、第1閾値Amax以上/より大きいレベルLについての相加平均である閾値大平均レベルMHを算出する(ステップS10)。具体的には、閾値大平均レベルMHを以下の式で表すことができる。
【0019】
【数2】
【0020】
式(2)の分子は、レベルLが閾値大平均レベルMH以上/より大きい時間間隔において積分を行い、判定時間Tf内でのそれらの合計を算出していることを示す。閾値大平均レベルMHは、一旦、閾値大平均レベル記憶部114に記憶させてもよい。
【0021】
第2判定部116は、閾値大平均レベルMHが予め定められた第2閾値Bmax以上か否かを判定する、もしくは、予め定められた第2閾値Bmaxより大きいか否かを判定する(ステップS12)。もし、第2判定部116が、MHはBmax以上でない、もしくはBmaxより大きくないと判定すれば、レベルLは少し大きいと判断し、調整命令信号生成部124に、入力信号のレベルLを少し下げるような調整命令信号を生成させる(ステップS14)。また、第2判定部116が、MHはBmax以上である、もしくはBmaxより大きいと判定すれば、レベルLはかなり大きいと判断し、調整命令信号生成部124に、入力信号のレベルLをかなり下げるような調整命令信号を生成させる(ステップS16)。このように、調整命令信号生成部124は、第2判定部116の判定結果に応じた入力信号のレベルLを調整するための調整命令信号を生成、出力する。出力した調整命令信号は、音声入力部2中の調整手段22(図3参照)に入力される。
【0022】
これらの構成により、レベル調整判定装置4−1は、入力音声の波形が極端に大きい振幅と、波形が小さい振幅と、が短い時間間隔で交互に存在する波形(図1参照)であったり、部分的にレベルが過大な波形(図2参照)であっても、高精度に入力音声のレベルの大小を判断できる。
【0023】
また、レベル調整判定装置4−1は、入力音声の波形のレベルが、部分的に過小であっても、高精度に入力音声のレベルを調整できる。以下、詳細に説明する。
【0024】
第4判定部132は、レベルLが予め定められた第4閾値Amin以下か否かを判定する、もしくは、レベルLが予め定められた第4閾値Aminより小さいか否かを判定する(ステップS24)。第4閾値Aminは予め第4閾値記憶部134に記憶されている。
【0025】
閾値小時間算出部136は、レベルLが第4閾値Amin以下/より小さいと判定されると、過去の予め定められた判定時間Tf(t1〜t2)内で、レベルLが第4閾値Amin以下/より小さい時間の合計時間である閾値小時間TLを算出する(ステップS26)。また、t1を現在の時刻とし、t1=0とすることが好ましい。算出された閾値小時間TLは、一旦、閾値小時間記憶部138に記憶させてもよい。閾値小時間算出部136は、レベルLが第4閾値Amin以上/より大きいと判定されると、閾値小時間TLの算出を行わない。
【0026】
閾値小平均レベル算出部144は、閾値小時間TLを用いて、第4閾値Amin以下/より小さいレベルLについての相加平均である閾値小平均レベルMLを算出する(ステップS30)。具体的には、閾値小平均レベルMLを以下の式で表すことができる。
【0027】
【数3】
【0028】
式(3)の分子は、レベルLが閾値小平均レベルML以下/より小さい時間間隔において積分を行い、それらの合計を算出していることを示す。閾値小平均レベルMLは、一旦、閾値小平均レベル記憶部146に記憶させてもよい。
【0029】
第5判定部148は、閾値小平均レベルMLが予め定められた第5閾値Bmin以下か否かを判定する、もしくは、予め定められた第5閾値Bminより小さいか否かを判定する(ステップS32)。もし、第5判定部148が、MLはBmin以下でない、もしくはBmaxより小さくないと判定すれば、レベルLは少し小さいと判断し、調整命令信号生成部124に、入力信号のレベルLを少し上げるような調整命令信号を生成させる(ステップS34)。また、第2判定部116が、MHはBmax以下である、もしくはBmaxより小さいと判定すれば、レベルLはかなり小さいと判断し、調整命令信号生成部124に、入力信号のレベルLをかなり上げるような調整命令信号を生成させる(ステップS36)。このように、調整命令信号生成部124は、第5判定部148の判定結果に応じた入力信号のレベルLを調整するための調整命令信号を生成、出力する。
【0030】
このように、レベル調整判定装置4−1は、入力音声の波形が極端に大きい振幅と、波形が小さい振幅と、が短い時間間隔で交互に存在する波形(図1参照)であったり、部分的にレベルが過大な波形(図2参照)であったり、部分的にレベルが過小な波形であっても、高精度に入力音声のレベルの大小を判断できる。また、入力音声のレベルの大小の判断をリアルタイムで行うために、図5に示した各処理を短い時間間隔で行うことが好ましい。
【0031】
[変形例1]
次に、変形例1であるレベル調整判定装置4−2について説明する。図6にレベル調整判定装置4−2の機能構成例を示し、図7にレベル調整判定装置4−2の主な処理の流れを示す。
レベル調整判定装置4−2は、レベル調整判定装置4−1と比較して、第4判定部132、第4閾値記憶部134、閾値小時間算出部136、閾値小時間記憶部138、閾値小平均レベル算出部144、閾値小平均レベル記憶部146、第5判定部148、第5閾値記憶部150がない点で異なる。レベル調整判定装置4−2のような構成にすることで、例えば、入力音声のレベルが部分的に過大である波形であっても、高精度に入力音声のレベルを調整できる。
【0032】
[変形例2]
次に、変形例2であるレベル調整判定装置4−3について説明する。図8にレベル調整判定装置4−3の機能構成例を示し、図9にレベル調整判定装置4−3の主な処理の流れを示す。
レベル調整判定装置4−3は、レベル調整判定装置4−1と比較して、第1判定部104、第1閾値記憶部106、閾値大時間算出部108、閾値大時間記憶部110、閾値大平均レベル算出部112、閾値大平均レベル記憶部114、第2判定部116、第2閾値記憶部118がない点で異なる。レベル調整判定装置4−3のような構成にすることで、例えば、入力音声のレベルが部分的に過小である波形であっても、高精度に入力音声のレベルを調整できる。
【実施例2】
【0033】
音声入力部2(ヘッドセット)から入力された音声において、例えば、咳払いなどの発話以外の音が入力されることがある。このように、通常の発話中の音量が適正な場合に、咳払いをしてしまうと、突発的に、短時間の間、過大な音量となり、クリッピングする場合がある。また、発話中に発話者が短時間、黙り込むことでわずかな無音(過小)になってしまうこともある。このような、短時間の間の過大なレベルLや短時間の間の過小なレベルLを自動調整の情報として用いるのは、好ましくない。何故なら、入力音声のレベルが頻繁に上下に調整されることになり、入力音声のレベルが安定せず、調整後の音声を音声認識システム(図3参照)で用いる場合には、的確に音声認識できなくなる。このような突発的で、短時間の過大もしくは過小な音に対しても、入力音声が過大もしくは過小であると判断できる方法として、振幅絶対値の短時間平均値を求めて、利用する方法がある。この技術を従来技術4とする。図10に、入力音声と、従来技術4のレベル調整判定装置が算出する当該入力音声の平均レベルGと、を示す。また、図1や図2と同様に、従来技術4のレベル調整判定装置は、平均レベルGが、上限Amaxより大であれば過大と判断し、下限Aminより小であれば過小と判断する。図10に示すように、例えば、区間α4で咳払いがされたとすると、区間α4での音声が過大と判断され音声レベルを下げてしまうと、逆に、短い無音区間や弱い発音の発話区間に対しても、実際には下限Aminより大きいにも関わらず、レベルが過小と判断されてしまう。その結果、入力音声のレベルが頻繁に上下することになる。
【0034】
そこで、この実施例2で説明するレベル調整判定装置4−4は、このような突発的で短時間の過大な音声や短時間の過小な音声であっても、高精度に音声レベルの過大、過小を判断できる。図11に、レベル調整判定装置4−4の機能構成例を示し、図12にレベル調整判定装置4−4の主な処理の流れを示す。レベル調整判定装置4−4は、レベル調整判定装置4−1と比較して、第3判定部120、第3閾値記憶部122、第6判定部140、第6閾値記憶部142を有する点で異なる。また、図5(レベル調整判定装置4−1の処理の流れ)と図11(レベル調整判定装置4−4の処理の流れ)では、ステップS6とステップS10との間にステップS8があること、かつ、ステップS26とステップS30との間にステップS28がある点で異なる。
【0035】
第3判定部120は、閾値大時間THが予め定められた第3閾値Cmax以下であるか否か、もしくは閾値大時間THが第3閾値Cmaxより小さいか否かを判定する(ステップS8)。第3閾値Cmaxは、予め、第3閾値記憶部122に記憶されている。閾値大時間THが第3閾値Cmax以下もしくは、第3閾値Cmaxより小さいということは、判定時間Tf内で入力音声のレベルLがAmaxより大きい時間の合計時間(閾値大時間TH)が極端に短いということである。つまり、閾値を超えている区間は例えば、突発的で短時間の過大な音声(例えば、咳払い)の時間と判断される。閾値大時間THが第3閾値Cmax以上/より大きいと判定されると、閾値大平均レベル算出部112によるステップS12の処理を行う。閾値大時間THが第3閾値Cmax以下/より小さいと判定されると、調整命令信号生成部124に調整命令信号を生成させないようにする。
【0036】
また、第6判定部140は、閾値小時間記憶部138よりの閾値小時間TLについても第6閾値Cmin以下か否か、もしくは第6閾値Cminより小さいか否かを判定する(ステップS28)。閾値小時間TLが第6閾値Cmax以下もしくは、第3閾値Cmaxより小さいということは、判定時間Tf内で入力音声のレベルLがAminより小さい時間の合計時間(閾値小時間TL)が極端に短いということである。つまり、閾値を下回っている区間は、突発的で短時間の過小な音声(例えば、発話者の黙り込み)の時間などと判断される。閾値小時間TLが第6閾値Cmin以上/より大きいと判定されると、閾値小平均レベル算出部144によるステップS30の処理を行う。閾値小時間TLが第6閾値Cmin以下/より小さいと判定されると、調整命令信号生成部124に調整命令信号を生成させないようにする。
【0037】
図13に、入力音声と、レベル調整判定装置4−4が算出する当該入力音声の閾値大平均レベルMH(黒色実線で示す)と、閾値小平均レベルML(白色実線で示す)と、を示す。閾値大平均レベルMHと、閾値小平均レベルMLとが、図13記載のように、デジタル的な波形になるのは、以下の2点になったときにMHとMLとの振幅値が変化するからである。閾値大平均レベルMHの場合は、(1)音声信号F(t)が第1閾値Amax以上/より大きくなったとき(2)第1閾値Amax以上/より大きい音声信号F(t)が、判定時間Tf外になったときに、振幅値が変化する。閾値小平均レベルMLの場合は、(1)音声信号F(t)が第4閾値Amin以下/より小さくなったとき(2)第4閾値Amin以下/より小さい音声信号F(t)が、判定時間Tf外になったときに振幅値が変化する。図13中の区間α5において、閾値大平均レベルMHが、第1閾値Amaxを超えている。しかし、閾値大時間THが、第3閾値Cmaxより短いので、入力音声のレベルLは過大とは判断されない。一方、区間α6において、閾値大平均レベルMHが、第1閾値Amaxを超えており、閾値大時間THが、第3閾値Cmaxより長いので、入力音声のレベルLは過大と判断される。
【0038】
上述のように、第3判定部120で、閾値大時間THが第3閾値Cmaxより小さいと判定されると、第1閾値Amaxを越えている区間は突発的な短時間の過大な音声(例えば、咳払い)の時間と判断される。また、第6判定部140で、閾値小時間TLが第6閾値Cminより小さいと判定されると、第1閾値Aminを越えている区間は突発的な短時間の過小な音声(例えば、発話者の黙り込み)の時間と判断される。これらの場合には、調整命令信号生成部124には、調整命令信号を生成させない。つまり、このレベル調整判定装置4−4は、従来技術のように単に予め定められた閾値より大きな値(または小さい値)の相加平均値を用いて入力音声レベルの過大、過小を判断するのではなく、閾値を超えた(または下回った)場合のみの時間(閾値大時間THもしくは、閾値小時間TL)と、その時間による相加平均値(閾値大平均レベルMHと閾値小平均レベルML)との両方を用いて、入力音声レベルの過大、過小を判断する。
【0039】
このようにすることで、咳払いやわずかな黙り込みのように、短時間の過大な音や過小な音をレベル調整の判断の対象から外すことができ、かつ、入力音声の波形が極端に大きい振幅と波形が小さい振幅とが短い時間間隔で交互に存在する波形(図1参照)であったり、部分的にレベルが過大な波形(図2参照)であったり、部分的にレベルが過小な波形であっても、入力音声のレベルが頻繁に上下することがなくなり、高精度に入力音声のレベルの自動調整を行うことができる。
【0040】
[変形例3]
次に変形例3のレベル調整判定装置4−5を説明する。図14にレベル調整判定装置4−5の機能構成例を示し、図15にレベル調整判定装置4−5の主な処理の流れを示す。レベル調整判定装置4−5は、レベル調整判定装置4−2と比較すると、第3判定部120と第3閾値記憶部122を備える点で異なる。
レベル調整判定装置4−5のような構成にすることで、入力音声のレベルが部分的に過大である波形であり、かつ、突発的な短時間の過大な音声であっても、高精度に入力音声のレベルを調整させることができる。
【0041】
[変形例4]
次に変形例4のレベル調整判定装置4−6を説明する。図16にレベル調整判定装置4−6の機能構成例を示し、図17にレベル調整判定装置4−6の主な処理の流れを示す。レベル調整判定装置4−6は、レベル調整判定装置4−3と比較すると、第6判定部140、第6閾値記憶部142を備える点で異なる。
レベル調整判定装置4−6のような構成にすることで、入力音声のレベルが部分的に過小である波形であり、かつ、突発的な短時間の過小な音声であっても、高精度に入力音声のレベルを調整させることができる。
【図面の簡単な説明】
【0042】
【図1】従来技術1のレベル調整判定装置を用いた場合の平均レベルGを示した図。
【図2】図1とは異なる入力音声についての従来技術1のレベル調整判定装置を用いた場合の平均レベルGを示した図。
【図3】本発明のレベル調整判定装置が実施される場合の構成例を示す図。
【図4】実施例1のレベル調整判定装置の機能構成例を示す図。
【図5】実施例1のレベル調整判定装置の主な処理の流れを示す図。
【図6】変形例1のレベル調整判定装置の機能構成例を示す図。
【図7】変形例1のレベル調整判定装置の主な処理の流れを示す図。
【図8】変形例2のレベル調整判定装置の機能構成例を示す図。
【図9】変形例2のレベル調整判定装置の主な処理の流れを示す図。
【図10】咳払いが含まれる入力音声についての従来技術1のレベル調整判定装置を用いた場合の平均レベルGを示した図。
【図11】実施例2のレベル調整判定装置の機能構成例を示す図。
【図12】実施例2のレベル調整判定装置の主な処理の流れを示す図。
【図13】咳払いが含まれる入力音声の波形についての実施例1のレベル調整判定装置を用いた場合の平均レベルGを示した図。
【図14】変形例3のレベル調整判定装置の機能構成例を示す図。
【図15】変形例3のレベル調整判定装置の主な処理の流れを示す図。
【図16】変形例4のレベル調整判定装置の機能構成例を示す図。
【図17】変形例4のレベル調整判定装置の主な処理の流れを示す図。
【特許請求の範囲】
【請求項1】
入力信号のレベルを算出する信号レベル算出部と、
前記レベルが予め定められた第1閾値以上または、第1閾値より大きいか否かを判定する第1判定部と、
前記レベルが前記第1閾値以上または、前記第1閾値より大きいと判定されると、過去の予め定められた判定時間内で、前記レベルが前記第1閾値以上または、前記第1閾値より大きい時間の合計時間である閾値大時間を算出する閾値大時間算出部と、
前記閾値大時間を用いて、前記第1閾値以上または、前記第1閾値より大きいレベルについての相加平均である閾値大平均レベルを算出する閾値大平均レベル算出部と、
前記閾値大平均レベルが予め定められた第2閾値以上または、第2閾値より大きいか否かを判定する第2判定部と、
前記第2判定部の判定結果に応じた前記入力信号のレベルを調整するための調整命令信号を生成、出力する調整命令信号生成部と、
を備えることを特徴とするレベル調整判定装置。
【請求項2】
請求項1記載のレベル調整判定装置であって、
更に、
前記閾値大時間が予め定められた第3閾値以下または、第3閾値より小さいか否かを判定し、前記閾値大時間が前記第3閾値以下または、前記第3閾値より小さいと判定されると、前記調整命令信号生成部に前記調整命令信号を生成させない第3判定部と、を備えることを特徴とするレベル調整判定装置。
【請求項3】
入力信号のレベルを算出する信号レベル算出部と、
前記レベルが予め定められた第4閾値以下または、第4閾値より小さいか否かを判定する第4判定部と、
前記レベルが前記第4閾値以下または、前記第4閾値より小さいと判定されると、過去の予め定められた判定時間内で、前記レベルが前記第4閾値以下または、前記第4閾値より小さい時間の合計時間である閾値小時間を算出する閾値小時間算出部と、
前記閾値小時間を用いて、前記第4閾値以下または、前記第4閾値より小さいレベルについての相加平均である閾値小平均レベルを算出する閾値小平均レベル算出部と、
前記閾値小平均レベルが予め定められた第5閾値以下または、第5閾値より小さいか否かを判定する第5判定部と、
前記第5判定部の判定結果に応じた前記入力信号のレベルを調整するための調整命令信号を生成、出力する調整命令信号生成部と、
を備えることを特徴とするレベル調整判定装置。
【請求項4】
請求項3記載のレベル調整判定装置であって、
更に、
前記閾値小時間が予め定められた第6閾値以下または、第6閾値より小さいか否かを判定し、前記閾値小時間が前記第6閾値以下または、前記第6閾値より小さいと判定されると、前記調整命令信号生成部に前記調整命令信号を生成させない第6判定部と、を備えることを特徴とする音量自動調整装置。
【請求項5】
請求項1または2記載のレベル調整判定装置であって、
更に、
前記レベルが予め定められた第4閾値以下または、第4閾値より小さいか否かを判定する第4判定部と、
前記レベルが前記第4閾値以下または、前記第4閾値より小さいと判定されると、過去の予め定められた判定時間内で、前記レベルが前記第4閾値以下または、前記第4閾値より小さい時間の合計時間である閾値小時間を算出する閾値小時間算出部と、
前記閾値小時間を用いて、前記第4閾値以下または、前記第4閾値より小さいレベルについての相加平均である閾値小平均レベルを算出する閾値小平均レベル算出部と、
前記閾値小平均レベルが予め定められた第5閾値以下または、第5閾値より小さいか否かを判定する第5判定部と、を備え、
前記調整命令信号生成部は、前記第5判定部の判定結果にも応じた前記入力信号のレベルを調整するための調整命令信号を生成、出力するものであることを特徴とするレベル調整判定装置。
【請求項6】
請求項5記載のレベル調整判定装置であって、
更に、
前記閾値小時間が予め定められた第6閾値以下または、第6閾値より小さいか否かを判定し、前記閾値小時間が前記第6閾値以下または、前記第6閾値より小さいと判定されると、前記調整命令信号生成部に前記調整命令信号を生成させない第6判定部と、を備えることを特徴とするレベル調整判定装置。
【請求項7】
入力信号のレベルを算出する信号レベル算出過程と、
前記レベルが予め定められた第1閾値以上または、第1閾値より大きいか否かを判定する第1判定過程と、
前記レベルが前記第1閾値以上または、前記第1閾値より大きいと判定されると、過去の予め定められた判定時間内で、前記レベルが前記第1閾値以上または、前記第1閾値より大きい時間の合計時間である閾値大時間を算出する閾値大時間算出過程と、
前記閾値大時間を用いて、前記第1閾値以上または、前記第1閾値より大きいレベルについての相加平均である閾値大平均レベルを算出する閾値大平均レベル算出過程と、
前記閾値大平均レベルが予め定められた第2閾値以上または、第2閾値より大きいか否かを判定する第2判定過程と、
前記第2判定過程の判定結果に応じた前記入力信号のレベルを調整するための調整命令信号を生成、出力する調整命令信号生成過程と、
を有することを特徴とするレベル調整判定方法。
【請求項8】
入力信号のレベルを算出する信号レベル算出過程と、
前記レベルが予め定められた第4閾値以下または、第4閾値より小さいか否かを判定する第4判定過程と、
前記レベルが前記第4閾値以下または、前記第4閾値より小さいと判定されると、過去の予め定められた判定時間内で、前記レベルが前記第4閾値以下または、前記第4閾値より小さい時間の合計時間である閾値小時間を算出する閾値小時間算出過程と、
前記閾値小時間を用いて、前記第4閾値以下または、前記第4閾値より小さいレベルについての相加平均である閾値小平均レベルを算出する閾値小平均レベル算出過程と、
前記閾値小平均レベルが予め定められた第5閾値以下または、第5閾値より小さいか否かを判定する第5判定過程と、
前記第5判定過程の判定結果に応じた前記入力信号のレベルを調整するための調整命令信号を生成、出力する調整命令信号生成過程と、
を有することを特徴とするレベル調整判定方法。
【請求項9】
請求項7記載のレベル調整判定方法であって、
更に、
前記レベルが予め定められた第4閾値以下または、第4閾値より小さいか否かを判定する第4判定過程と、
前記レベルが前記第4閾値以下または、前記第4閾値より小さいと判定されると、過去の予め定められた判定時間内で、前記レベルが前記第4閾値以下または、前記第4閾値より小さい時間の合計時間である閾値小時間を算出する閾値小時間算出過程と、
前記閾値小時間を用いて、前記第4閾値以下または、前記第4閾値より小さいレベルについての相加平均である閾値小平均レベルを算出する閾値小平均レベル算出過程と、
前記閾値小平均レベルが予め定められた第5閾値以下または、第5閾値より小さいか否かを判定する第5判定過程と、を有し、
前記調整命令信号生成過程は、前記第5判定過程での判定結果にも応じた前記入力信号のレベルを調整するための調整命令信号を生成、出力するものであることを特徴とするレベル調整判定方法。
【請求項10】
請求項1〜6何れかに記載のレベル調整判定装置の各処理をコンピュータに実行させるためのレベル調整判定プログラム。
【請求項1】
入力信号のレベルを算出する信号レベル算出部と、
前記レベルが予め定められた第1閾値以上または、第1閾値より大きいか否かを判定する第1判定部と、
前記レベルが前記第1閾値以上または、前記第1閾値より大きいと判定されると、過去の予め定められた判定時間内で、前記レベルが前記第1閾値以上または、前記第1閾値より大きい時間の合計時間である閾値大時間を算出する閾値大時間算出部と、
前記閾値大時間を用いて、前記第1閾値以上または、前記第1閾値より大きいレベルについての相加平均である閾値大平均レベルを算出する閾値大平均レベル算出部と、
前記閾値大平均レベルが予め定められた第2閾値以上または、第2閾値より大きいか否かを判定する第2判定部と、
前記第2判定部の判定結果に応じた前記入力信号のレベルを調整するための調整命令信号を生成、出力する調整命令信号生成部と、
を備えることを特徴とするレベル調整判定装置。
【請求項2】
請求項1記載のレベル調整判定装置であって、
更に、
前記閾値大時間が予め定められた第3閾値以下または、第3閾値より小さいか否かを判定し、前記閾値大時間が前記第3閾値以下または、前記第3閾値より小さいと判定されると、前記調整命令信号生成部に前記調整命令信号を生成させない第3判定部と、を備えることを特徴とするレベル調整判定装置。
【請求項3】
入力信号のレベルを算出する信号レベル算出部と、
前記レベルが予め定められた第4閾値以下または、第4閾値より小さいか否かを判定する第4判定部と、
前記レベルが前記第4閾値以下または、前記第4閾値より小さいと判定されると、過去の予め定められた判定時間内で、前記レベルが前記第4閾値以下または、前記第4閾値より小さい時間の合計時間である閾値小時間を算出する閾値小時間算出部と、
前記閾値小時間を用いて、前記第4閾値以下または、前記第4閾値より小さいレベルについての相加平均である閾値小平均レベルを算出する閾値小平均レベル算出部と、
前記閾値小平均レベルが予め定められた第5閾値以下または、第5閾値より小さいか否かを判定する第5判定部と、
前記第5判定部の判定結果に応じた前記入力信号のレベルを調整するための調整命令信号を生成、出力する調整命令信号生成部と、
を備えることを特徴とするレベル調整判定装置。
【請求項4】
請求項3記載のレベル調整判定装置であって、
更に、
前記閾値小時間が予め定められた第6閾値以下または、第6閾値より小さいか否かを判定し、前記閾値小時間が前記第6閾値以下または、前記第6閾値より小さいと判定されると、前記調整命令信号生成部に前記調整命令信号を生成させない第6判定部と、を備えることを特徴とする音量自動調整装置。
【請求項5】
請求項1または2記載のレベル調整判定装置であって、
更に、
前記レベルが予め定められた第4閾値以下または、第4閾値より小さいか否かを判定する第4判定部と、
前記レベルが前記第4閾値以下または、前記第4閾値より小さいと判定されると、過去の予め定められた判定時間内で、前記レベルが前記第4閾値以下または、前記第4閾値より小さい時間の合計時間である閾値小時間を算出する閾値小時間算出部と、
前記閾値小時間を用いて、前記第4閾値以下または、前記第4閾値より小さいレベルについての相加平均である閾値小平均レベルを算出する閾値小平均レベル算出部と、
前記閾値小平均レベルが予め定められた第5閾値以下または、第5閾値より小さいか否かを判定する第5判定部と、を備え、
前記調整命令信号生成部は、前記第5判定部の判定結果にも応じた前記入力信号のレベルを調整するための調整命令信号を生成、出力するものであることを特徴とするレベル調整判定装置。
【請求項6】
請求項5記載のレベル調整判定装置であって、
更に、
前記閾値小時間が予め定められた第6閾値以下または、第6閾値より小さいか否かを判定し、前記閾値小時間が前記第6閾値以下または、前記第6閾値より小さいと判定されると、前記調整命令信号生成部に前記調整命令信号を生成させない第6判定部と、を備えることを特徴とするレベル調整判定装置。
【請求項7】
入力信号のレベルを算出する信号レベル算出過程と、
前記レベルが予め定められた第1閾値以上または、第1閾値より大きいか否かを判定する第1判定過程と、
前記レベルが前記第1閾値以上または、前記第1閾値より大きいと判定されると、過去の予め定められた判定時間内で、前記レベルが前記第1閾値以上または、前記第1閾値より大きい時間の合計時間である閾値大時間を算出する閾値大時間算出過程と、
前記閾値大時間を用いて、前記第1閾値以上または、前記第1閾値より大きいレベルについての相加平均である閾値大平均レベルを算出する閾値大平均レベル算出過程と、
前記閾値大平均レベルが予め定められた第2閾値以上または、第2閾値より大きいか否かを判定する第2判定過程と、
前記第2判定過程の判定結果に応じた前記入力信号のレベルを調整するための調整命令信号を生成、出力する調整命令信号生成過程と、
を有することを特徴とするレベル調整判定方法。
【請求項8】
入力信号のレベルを算出する信号レベル算出過程と、
前記レベルが予め定められた第4閾値以下または、第4閾値より小さいか否かを判定する第4判定過程と、
前記レベルが前記第4閾値以下または、前記第4閾値より小さいと判定されると、過去の予め定められた判定時間内で、前記レベルが前記第4閾値以下または、前記第4閾値より小さい時間の合計時間である閾値小時間を算出する閾値小時間算出過程と、
前記閾値小時間を用いて、前記第4閾値以下または、前記第4閾値より小さいレベルについての相加平均である閾値小平均レベルを算出する閾値小平均レベル算出過程と、
前記閾値小平均レベルが予め定められた第5閾値以下または、第5閾値より小さいか否かを判定する第5判定過程と、
前記第5判定過程の判定結果に応じた前記入力信号のレベルを調整するための調整命令信号を生成、出力する調整命令信号生成過程と、
を有することを特徴とするレベル調整判定方法。
【請求項9】
請求項7記載のレベル調整判定方法であって、
更に、
前記レベルが予め定められた第4閾値以下または、第4閾値より小さいか否かを判定する第4判定過程と、
前記レベルが前記第4閾値以下または、前記第4閾値より小さいと判定されると、過去の予め定められた判定時間内で、前記レベルが前記第4閾値以下または、前記第4閾値より小さい時間の合計時間である閾値小時間を算出する閾値小時間算出過程と、
前記閾値小時間を用いて、前記第4閾値以下または、前記第4閾値より小さいレベルについての相加平均である閾値小平均レベルを算出する閾値小平均レベル算出過程と、
前記閾値小平均レベルが予め定められた第5閾値以下または、第5閾値より小さいか否かを判定する第5判定過程と、を有し、
前記調整命令信号生成過程は、前記第5判定過程での判定結果にも応じた前記入力信号のレベルを調整するための調整命令信号を生成、出力するものであることを特徴とするレベル調整判定方法。
【請求項10】
請求項1〜6何れかに記載のレベル調整判定装置の各処理をコンピュータに実行させるためのレベル調整判定プログラム。
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図11】
【図12】
【図14】
【図15】
【図16】
【図17】
【図1】
【図2】
【図10】
【図13】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図11】
【図12】
【図14】
【図15】
【図16】
【図17】
【図1】
【図2】
【図10】
【図13】
【公開番号】特開2009−80219(P2009−80219A)
【公開日】平成21年4月16日(2009.4.16)
【国際特許分類】
【出願番号】特願2007−248414(P2007−248414)
【出願日】平成19年9月26日(2007.9.26)
【出願人】(000004226)日本電信電話株式会社 (13,992)
【Fターム(参考)】
【公開日】平成21年4月16日(2009.4.16)
【国際特許分類】
【出願日】平成19年9月26日(2007.9.26)
【出願人】(000004226)日本電信電話株式会社 (13,992)
【Fターム(参考)】
[ Back to top ]