説明

音声処理装置、音声処理方法及び音声処理プログラム

【課題】 ノイズ処理に必要とされる時間と音声符号化処理とからなるデータ処理時間を短縮する。
【解決手段】 本発明は、携帯端末などで発生するキークリックノイズ等に対して、ノイズ部分の符号化データを無音データに置き換えることでノイズを除去し、データ置き換えの判定を符号化処理と並行して行い、データ置換を符号化処理時間内に行うことで処理遅延時間を増やすことなく雑音除去を行う。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、機器の操作により発生する雑音を除去する音声処理装置、音声処理方法及び音声処理プログラムに関する。
【背景技術】
【0002】
音声を入力する各種機器では、利用者の周囲の環境に基づく雑音や機器自身が発生する雑音が目的とする音声に加わってしまう。このような雑音は定常的なものと非定常的なものに分けることができる。非定常的な雑音の例として携帯電話等の移動端末の操作上発生する雑音をあげる。携帯電話などでは、構造上、マイク等の音声入力部分とキーのように音を発してしまう機構を持つ部分とが近接することが避けられず、操作に伴い雑音が混入する。すなわち、キーを押下した場合に発生するキークリック雑音がマイクに入力され、それが雑音として音声に乗ってしまう。
【0003】
このような雑音を抑圧する方法としては、収音した雑音を取り出してこの雑音と逆の位相を有する音波を発生させる方法や、周波数領域において低パワー部分を取り除く方法などが知られている。
【0004】
これら現在行われている雑音除去方法では、雑音抑圧の方法や雑音を抑圧する音声処理上の段階に相違はあるものの、その処理には共通点がある。すなわち、これらの方法では、入力された音声を分析し、雑音を検出して雑音除去処理を行い、その後に符号化処理が行われる。音声の分析と雑音の検出・除去とは不可分の関係にある。
【0005】
特許文献1では骨伝導マイクロホンの検出する音声から、パルス性の異音(歯当たり音)を除去する方法を開示している。この発明では、パルス性の雑音が検出されると、ゲイン調整回路及び遅れ回路を用いて雑音の除去を行っている。
【0006】
特許文献2では、符号誤り率が大きく変動する伝送路において、電力パラメータを小音量に対応する値に置き換えることで音声の品質の劣化を防ぐことが行われている。
【特許文献1】特許第3420831号公報(図7、(0020)〜(0022)段落)
【特許文献2】特開昭60−173600号公報(第5−8頁)
【発明の開示】
【発明が解決しようとする課題】
【0007】
しかしながら、雑音処理に要する時間は、データ処理における遅延となり、上記のような雑音の除去方法では、雑音除去処理に要する時間分の遅延が発生することになる。本発明は、上記問題点に鑑み、従来の方法よりも音声処理時間の遅延を短縮することを目的とする。
【課題を解決するための手段】
【0008】
上記問題を解決する為に、本発明は雑音検出処理を音声符号化処理と並行して行い、更に符号化後のデータにおいて、雑音データを無音のデータと入れ替えることで雑音除去処理を行う。
【発明の効果】
【0009】
本発明によれば、音声データが符号化されて送られるまでの処理で遅延が発生することを利用し、その処理時間内に雑音検出及び通知処理を並行して行うことにより、雑音検出処理分の遅延時間を増やすことなく雑音を除去することが可能となる。
【0010】
また、音声処理を行わずに電気的に雑音を検出することと、雑音終了タイミングを検出する必要がないことから、雑音検出のための信号処理が不要となる。更に、雑音部分を符号化データの状態で無音データに置き換えるため、雑音の解析処理も不要となる。
【発明を実施するための最良の形態】
【0011】
機器自体から発生する雑音の検出を音声符号化と並行して行い、またその雑音を除去する音声処理を以下のように実現した。
【実施例1】
【0012】
図1及び2を参照し、第1の実施例の構成を説明する。
入力部10は、入力された音声データを、任意時間単位に分割したフレームという単位で処理部20に送る(処理1及び2)。
処理部20は、入力部10から受けた音声フレームを符号化し、出力部40に送る(処理3及び4)。
キー検出部30は、入力部60からキー等の入力装置の操作を通知されると、雑音発生の動作と見なし、検出結果を出力部40に送る(処理5及び6)。
出力部40は、検出部30からの検出結果により、処理部20より受けた符号化データフレーム、もしくは出力部40にてあらかじめ符号化した無音フレームを選択し、選択したフレームを通信部50に送る(処理7)。
通信部50は無線基地局とのデータの送受信を行う。
入力部60は入力キーやボタンなどの入力装置であり、文字等の入力を行う。入力部60は電話番号入力や文字入力等の処理部(不図示)に接続されているが、キー検出部30にも接続されており、入力装置の操作が行われるとこれをキー検出部30に通知する。
この他に本発明の動作を記述したプログラムを保持するメモリを有していてもよい。
図2の処理1〜4及び7は雑音を含む音声データの符号化処理を表している。
【0013】
<実施例の動作の説明>
以下、本実施例の動作について携帯端末を例にとって説明する。
携帯端末のキー(入力部10)を押すことによりキークリック音等の雑音が発生すると、図1においてこの雑音は入力部10から入力され、処理部20を経由して、出力部40で通信部50に送られるデータフレームとして準備される。キーを押下した後の各部での処理や各部間のデータ伝送(処理1、処理2、処理3、処理4)に要する時間を図2に示す。
【0014】
検出部30では、キー押下等の雑音発生原因となる動作を電気的に検出し(処理5)、当該動作が発生したことを出力部40に通知する(処理6)。キー検出は、雑音発生後一定の遅れを持って検出されるが、キー検出の処理時間(処理5、処理6)はデータ処理遅延(処理1〜処理4)よりも一般的に短いため、データ処理と並列に処理することにより、雑音検出のための遅延時間を追加することなく検出結果を通知できる。
【0015】
出力部40は、検出部30からの検出結果が「検出なし」の場合、処理部20から受け取ったフレームを通信部50に送る。検出結果が「検出あり」の場合、処理部から受け取ったフレームを破棄し、無音フレームを通信部50に送る(処理7)。
【0016】
本実施例によれば、雑音を検出する処理と通常の音声処理とが独立して行われるので、雑音検出の為の時間が不要である。また、キー押下によって発生する雑音を音声信号の中から検出する処理が不要である為、簡素な方法で出力音声が改善される。
【実施例2】
【0017】
図3を参照して、第2の実施例を説明する。本実施例では、雑音の検出方法を更に工夫している。図3においては、図1のキー検出部30が雑音検出部70に置き換えられている。
【0018】
雑音検出部70は、キー検出でなく入力音声を利用した一般的な音声処理による雑音検出方法を行う(処理5´)。入力された音声データは処理部20と雑音検出部70に伝達され、雑音検出処理と音声符号化処理とが独立して行われる。これにより、従来の雑音検出方法を使用する場合においても、雑音検出処理と音声符号化処理を並行して行うことが可能であり、雑音検出処理の遅延が低減される。雑音検出処理に必要とされる時間は音声処理符号化処理と並行して処理する上で支障がない程度のものである。雑音の除去は第1の実施例と同じように、無声フレームで置き換えることにより行われる。
【0019】
本実施例によれば、雑音を検出する処理と音声データを符号化する処理とが独立して行われる為、雑音検出の為に余分な時間をとる必要がなく、処理時間の短縮が図れる。
【実施例3】
【0020】
図4を参照して、第3の実施例を説明する。本実施例では、図3の構成に雑音記憶部80を加えられている。
雑音記憶部80は入力部60で発生する様々なキークリック音をサンプルデータとして保持し、これを雑音検出部70に提供することで、雑音の検出を容易にする。雑音検出処理の際に雑音検出部70は雑音記憶部80に保持されたサンプルの雑音データを参照し、音声データから適合する雑音を検出する。雑音の除去処理は実施例1に同じである。
サンプルデータとしては、雑音検出部70で検出したものを蓄積してもよいし、予めキーを操作して採取したものを保持してもよい。
【0021】
本実施例によれば、雑音検出処理の時間が短縮され、音声データの符号化処理の時間に合わせた並列処理が可能である。
【実施例4】
【0022】
図5を参照して第4の実施例を説明する。本実施例では、図4の構成に入力部60が加えられている。
入力部60はキー等が操作されたことを検出すると、これを雑音検出部70に通知する。雑音検出部70では、入力部60から通知があった場合であって、且つ雑音を検出した場合に、検出した雑音が入力部60の操作により発生したものであると判断し、雑音記憶部80にこの雑音データを送る。雑音記憶部80ではこのようにして採取された雑音データを蓄積する。
雑音記憶部80に蓄積された雑音データの利用法及び出力部40での雑音除去処理は実施例3と同様にして行われる。
【0023】
本実施例によれば、非定常的な雑音が音声データに混入したことが通知され、また入力部で発生する非定常的な雑音の形状を装置が学習することにより、非定常的な雑音の検出処理が容易になる。
【実施例5】
【0024】
第5の実施例では、図6に示すように、通信部50をデータ保存可能な記憶部90に置き換える。これにより、第1及び第2の実施例で示した音声処理を行う音声記録装置が実現される。
【産業上の利用可能性】
【0025】
本発明は筐体に入力装置を有する携帯電話、無線機、音声記録装置等に応用することが可能である。
【図面の簡単な説明】
【0026】
【図1】本発明における第1の実施例の構成を示す図である。
【図2】キー操作により発生する雑音を含む音声データの符号化処理及びキー操作の検出処理に要する時間を示す図である。
【図3】本発明における第2の実施例の構成を示す図である。
【図4】本発明における第3の実施例の構成を示す図である。
【図5】本発明における第4の実施例の構成を示す図である。
【図6】本発明における第5の実施例の構成を示す図である。
【符号の説明】
【0027】
10 音声入力部
20 処理部
30 キー検出部
40 出力部
50 通信部
60 入力部
70 雑音検出部
80 雑音記憶部
90 記憶部

【特許請求の範囲】
【請求項1】
入力部を備えた音声処理装置であって、
音声データをフレームに分割して音声フレームを出力する音声入力部と、
前記音声フレームを符号化する処理部と、
雑音の検出結果を通知する検出部と、
前記検出部からの通知を受けると、符号化された音声フレームから雑音を除去する出力部と
を有し、雑音検出処理と音声符号化処理とを並行して行うことを特徴とする音声処理装置。
【請求項2】
前記出力部は雑音が検出された場合に、音声フレームを符号化された無声フレームで置き換えることで雑音を除去することを特徴とする請求項1に記載の音声処理装置。
【請求項3】
前記検出部は前記入力部が操作されたことを検出し、操作の検出を雑音の検出と見なして検出の結果を前記出力部に通知することを特徴とする請求項2に記載の音声処理装置。
【請求項4】
前記検出部は音声データから雑音を検出することを特徴とする請求項2に記載の音声処理装置。
【請求項5】
前記検出部が検出した雑音を保持する雑音記憶部を更に有することを特徴とする請求項4に記載の音声処理装置。
【請求項6】
基地局との通信を行う通信部を更に有することを特徴とする請求項3又は4に記載の音声処理装置。
【請求項7】
音声データを保存する保存部を更に有することを特徴とする請求項3又は4に記載の音声処理装置。
【請求項8】
符号化部、検出部及び出力部を有する音声処理装置において、
符号化部が、入力部が操作されることにより発生する雑音を含む音声データを符号化し、且つ検出部が、入力部が操作されたことを検出して出力部に通知する工程と、
出力部が、雑音を含むフレームを無声フレームに置き換える工程とを有することを特徴とする音声処理方法。
【請求項9】
符号化部、検出部及び出力部を有する音声処理装置において、
符号化部が、入力部が操作されることにより発生する雑音を含む音声データを符号化し、且つ検出部が、入力された音声から雑音を検出する工程と、
出力部が、雑音を含むフレームを無声フレームに置き換える工程とを有することを特徴とする音声処理方法。
【請求項10】
符号化部、検出部及び出力部を有する音声処理装置において、
符号化部が、入力部が操作されることにより発生する雑音を含む音声データを符号化し、且つ検出部が、入力部が操作されたことを検出して出力部に通知する処理と、
出力部が、雑音を含むフレームを無声フレームに置き換える処理とをコンピュータに実行させるための音声処理プログラム。
【請求項11】
符号化部、検出部及び出力部を有する音声処理装置において、
符号化部が、入力部が操作されることにより発生する雑音を含む音声データを符号化し、且つ検出部が、入力された音声から雑音を検出する処理と、
出力部が、雑音を含むフレームを無声フレームに置き換える処理とをコンピュータに実行させるための音声処理プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2006−65067(P2006−65067A)
【公開日】平成18年3月9日(2006.3.9)
【国際特許分類】
【出願番号】特願2004−248540(P2004−248540)
【出願日】平成16年8月27日(2004.8.27)
【出願人】(000004237)日本電気株式会社 (19,353)
【Fターム(参考)】