説明

受信機及び受信機を同調する方法

【課題】特別に改良された送信機を必要とせずに単側波帯音声信号を自動的に同調する。
【構成】 単側波帯受信機同調方法は、音声信号を取得し、該信号を時間領域において処理し(ステップS22)、その信号を周波数領域に変換し、周波数領域における信号を信号変更のために処理し(ステップS24)、変更信号を周波数領域から相関領域に変換し、相関領域における信号を処理し(ステップS26)、相関領域で処理された信号を解析して受信機同調誤差を決定する。

【発明の詳細な説明】
【技術分野】
【0001】
この発明は、受信機と受信機を同調する方法に関する。
【背景技術】
【0002】
単側波帯変調(SSB)は、振幅変調(AM)や周波数変調(FM)のような普及している一般の変調方式と比較して、周波数スペクトルの使用効率が非常によい。AMは、SSBの2倍のスペクトルを必要とし、FMは4倍から8倍のスペクトルを必要とする。周波数スペクトルは希少な資源であり、周波数スペクトルを浪費しない技術は高価値を持つ。
【0003】
さらに、SSBは、電力効率が高い。AMと比較すると、SSB通信は10分の1未満の電力で通信を行うことができる。この送信電力の軽減は他の通信サービスへの干渉を軽減でき、それによって、周波数スペクトルの使用効率を改善することも可能となる。
【0004】
これらの優れた特性を有する一方で、SSB信号は、再生音声の歪みを防ぐために、ほぼ10ヘルツ(Hz)以内で同調する必要があるという技術的な課題を有している。この制限を超えて離調した場合には、離調の方向に応じて、大きな轟音のような音あるいはドナルドダックの声のような音声が再生されてしまう。
【0005】
この問題の1つの解決法は、ある特定の周波数(チャネル)だけで送信を行うことである。しかしながら、高周波数送信機と受信機の双方は、正確に正しい周波数に同調することを要求される。これは、搬送波に応じて、約10億分の20以内での同調を要求されることになる。この信頼度は、特に環境条件の広い範囲で実行するのは高額となり、またラジオの耐用年数にわたってそれを維持しなくてはならない。これは海上HF SSBラジオが受信機周波数のオペレータ調整のクラリファイア制御を有することが理由である。この調整は難しく、適切な音質を調整するための訓練が要求される。チャネル化動作の第2の不都合はスペクトル利用効率が低下することである。チャネルの完全な放棄と他のチャネルへの移行の代わりにRF干渉を回避する周波数の僅かな変更はしばしば好都合となる。
【0006】
当業者にはよく知られている第2の解決法は、送信信号に既知の周波数音声トーン(パイロットトーン)を追加することである。受信局は、送信パイロットトーン周波数を知っている場合、受信パイロットトーンを所望の受信周波数に自動的に調整する。この解決法には少なくとも3つの不具合がある。第1には、送信機と受信機は同じパイロットトーン周波数と振幅とで動作するように設計しなくてはならない。これはアドホック通信の形成を阻止し、現存する無線インフラに相容れない。今日用いられているSSBトランシーバの膨大な台数を考慮すると、この装置を更新することは現実的ではなく、またパイロットトーンを用いる発明は限定された実用的なものとなる。第2には、付加されたパイロットトーンは送信機に電力を必要以上に消費させる。最大送信電力は規制によって通常は制限される;無駄な電力は信号の範囲と可読性を減少させる。最後に、受信機帯域はノイズと干渉を最小限にするために制限される。それ故、受信機が数百Hz以上離調した場合にはパイロットトーンはフィルタ・オフを行い、自動同調は失敗する。
【0007】
様々な同調技術が、音声信号の特性を用いることにより、SSB音声信号に自動的に同調することを試みてきている。例えば、非特許文献1〜4を参照されたい。これらの技術は、実際には、音声SSB信号に適切に同調できていない。
【0008】
上述の先行技術と対象的に、この発明は送信機の改良を必要としない。また、この発明を備えている受信機は既存のSSB送信機と共に使用される。この発明はまた大きな同調誤差の訂正を行うことができる。下記に詳細に記述するが、この発明に係る受信機は、送信された人間の声の特性を言語に依存せずに分析し、実際の送信信号周波数に高精度で同調する。このことにより、熟練のオペレータより早くラジオの再同調を行うことができる。
【非特許文献1】「同一チャネル干渉分離」、ロバート・ディック著、1980年12月(“Co-Channel Interference Separation” by Robert Dick、Dec.1980)
【非特許文献2】「SSB自動同調」、ロバート・ディック著、QEXマガジン、1999年1月/2月(”Tune SSB Automatically” by Robert Dick、QEX magazine, Jan/Feb 1999)
【非特許文献3】「単側波帯用隠れ自動周波数制御アルゴリズム」、ゲーリー・ガイシンガー、QEXマガジン、2005年7月/8月(“Automatic Frequency Control Algorithm for Single Sideband” by Gary Geissinger, QEX magazine, Jul/Aug 2005)
【非特許文献4】「通信受信機」、ウルリッヒ・ローデ博士著(”Communications Receivers” by Dr. Ulrich Rohde )
【発明の開示】
【発明が解決しようとする課題】
【0009】
この発明の目的は、特別に改良された送信機を必要とせずに単側波帯音声信号を自動的に同調する新しい方法とシステムを提供することにある。
この発明は、新たな受信機において内部的に実施されるか、あるいは外部付けのハードウェアおよびパーソナル・コンピュータ(あるいは他のコンピュータ装置)並びに従来のSSB受信機で実施されうる。
【課題を解決するための手段】
【0010】
この目的と他の目的を達成するために、本発明の同調方法は、
音声信号を取得し、
取得した前記信号を時間領域において処理し、
時間領域で処理した前記信号を周波数領域に変換し、該周波数領域における前記信号を信号変更のために処理し、
周波数領域で処理した信号を周波数領域から相関領域に変換し、相関領域における前記信号を処理し、
相関領域で処理された前記信号を解析して受信機同調誤差を決定し、
前記時間領域における信号処理は、前記信号を中央クリッピングすることにより、スペクトル平坦化する処理を含み、
前記周波数領域における信号処理は、信号から時間情報を取り除くために、振幅を示す信号に変換し、変換後の信号をスペクトル平坦化する処理を含み、
前記相関領域での信号処理は、前記時間領域での信号処理のために信号を補正するステップと、前記相関領域での信号のピーク振幅の位置を決定し、それに基づいてピッチとオフセット周波数とを算定するステップを含む、
ことを特徴とする。
【0011】
また、本発明の受信機は、
音声信号を取得する取得手段と、
前記取得手段で取得した信号に、中央クリッピングすることによりそのスペクトル分布を平坦化する処理を含む時間領域での処理を施す時間領域処理手段と、
前記時間領域処理手段で処理した信号を周波数領域の信号に変換し、変換した信号から時間情報を取り除くために、振幅を示す信号に変換し、変換後の信号をスペクトル平坦化する処理を含む周波数領域での処理を施す周波数領域処理手段と、
前記周波数領域処理手段で処理した信号を相関領域の信号に変換し、前記時間領域での信号処理のために補正し、前記相関領域での信号のピーク振幅の位置を決定し、それに基づいてピッチとオフセット周波数とを算定する処理を含む相関領域における信号処理を実行する相関領域処理手段と、
前記相関領域処理手段で処理された信号から同調誤差を判別する同調誤差判別手段と、
を備える。
【0012】
さらに、この発明のプログラムは、
プロセッサを、
音声信号に、中央クリッピングすることによりそのスペクトル分布を平坦化する処理を含む時間領域での処理を施す時間領域処理手段、
前記時間領域処理手段で処理した信号を周波数領域の信号に変換し、変換した信号から時間情報を取り除くために、振幅を示す信号に変換し、変換後の信号をスペクトル平坦化する処理を含む周波数領域での処理を施す周波数領域処理手段、
前記周波数領域処理手段で処理した信号を相関領域の信号に変換し、前記時間領域での信号処理のために補正し、前記相関領域での信号のピーク振幅の位置を決定し、それに基づいてピッチとオフセット周波数とを算定する処理を含む相関領域における信号処理を実行する相関領域処理手段、
前記相関領域処理手段で処理された信号から同調誤差を判別する同期誤差判別素手段、
として機能させる。
【0013】
受信機同調誤差は、当業者にはよく知られているどんな目的にも用いることができる。例えば、通信士はラジオの再同調を可能にする受信機同調誤差について知らされる。ラジオ自動再同調は、またこの発明を用いて得られた受信機同調誤差を用いて実行される。また、多くのラジオに見出される受信機増加同調(RIT)機能は受信機同調推定を適用して用いられる。この機能はラジオに表示される周波数設定を変更するのではなく、同調を変更するものである。この利点は、RITがクリアされた場合、ラジオは元の周波数に戻るというものである。
【0014】
この発明の一実施形態によれば、時間領域における信号処理は信号を中央クリッピングすることによって話者の声道効果を除去する。時間領域において、これは、二乗平均平方根(RMS)あるいは平均絶対偏差(MAD)基準に基づいて信号を中央クリップする水準の決定を含む。中央クリップされた信号は、例えば、三角形窓を用いてウインドウ化され、そして信号にゼロパッドされる。そして周波数領域において位相情報を取り除く。さらに、不要な周波数は取り除かれ(負の周波数を含む)、振幅である周波数成分は最大周波数成分の所定の割合未満となる。
【0015】
音声サンプルのピッチと周波数オフセットは相関領域において推定される。このことは時間領域ウインドウ化の好ましくない効果を補正することを伴うのが好ましい。ピッチを推定して周波数をオフセットするには、相関領域における信号は少なくとも5点の回帰を用いる曲線適合が望ましい。信号の最大振幅の位置は補間によって決定され、オフセット周波数とピッチはそれに基づいて算定される。
【0016】
処理された信号の分析は、有声音の最大振幅が閾値標記以上かどうかの決定を含み、閾値標記以上でなければ、処理された信号は無視される。
【0017】
処理された信号の分析は、倍あるいは半(ハーフ)ピッチが従来技術方法でエラーをしばしば引き起こすかどうかを判定するために推定ピッチ周波数を2分の1あるいは2回でピーク周波数を比較することをさらに含む。
【0018】
音声ピッチの全ての周波数成分がこの周波数領域に存在した場合、綿密な同調信号の受信機同調誤差の決定はささいなものである。
【0019】
しかしながら、典型的なSSB送信機フィルタ・オフ周波数成分は約300Hz以下である。多くの大人の音声は約50Hzから約250Hzのピッチを有する。それで基本ピッチといくつかの倍音は送信の前にフィルタ・オフされる。それ故、単一測定で、受信機同調誤差がピッチ振幅以内に在ることだけを知る可能性がある。この問題は、受信機が送信信号から追加のピッチ倍音を除去できる受信機フィルタとして大きく離調した場合に、さらに悪化する。それらの理由のため、短い音声セグメント用ピッチと周波数オフセットを抽出した後、信号の更なる処理を行う必要がある。
【0020】
時間と共に音声ピッチでの自然変化は、ピッチと周波数オフセットの多数の推定から実際の受信機同調誤差を決定することを可能にする。この発明の実施形態において、評価関数は受信機同調誤差の多数の推定から形成され、実際の受信機同調誤差を決定することに用いる。評価関数において、受信機同調誤差の試行推定でない有声音は評価関数に大きな誤差として貢献する。
【0021】
この発明の他の特別な利点の実施形態は、音声のサンプルが正確に受信機同調誤差を決定するために十分かどうかを確認する統計的テストを用いる。特に、統計的有意差が評価関数から受信機同調誤差のベスト推定と第2のベスト推定の間に在るかどうかを決定する。存在するならば、第1の推定を実際の受信機同調誤差と見做す。一方、受信同調信号の他のセグメントは処理される。
【0022】
統計的テストを用いる利点は、いくつの音声セグメントを処理すべきが先験的に知られていないことである。自然音声は受信機同調誤差の推定に寄与しない休止と摩擦(非音声)音を有する。十分な有声音声セグメントを取得するのに必要な時間は知られていない。従来の代替手法は、過度に長時間の音声を処理することである。この長い処理時間は、有声音声を処理するには十分に尤度(保証されるものではない)を向上させるが、同調時間を増加させる。
【発明を実施するための最良の形態】
【0023】
以下、本発明の実施の形態にかかる受信機と該受信機が実施する受信方法を説明する。
なお、添付の図面に関して、参照番号は同一あるいは類似要素を示す。
【0024】
本願発明の実施の形態に係る受信機10は、図1に示すように、受信回路11と、A/D変換器12と、DSP13と、D/A変換器14と、アンプ15と、スピーカ16と、は出力端子17と、制御部18と、操作部19と、から構成される。
【0025】
受信回路11は、アンテナを備え、制御部18により指示された受信周波数の電波に同調し、受信信号を増幅すると共にダウンコンバージョンして出力する。
A/D変換器12は、受信回路11の出力信号(受信信号)を、所定のサンプリング周波数でアナログ・デジタル変換して出力する。
【0026】
DSP(Digital Signal Processor)13は、予め記憶している動作プログラムに従って、供給されたデジタル信号(受信信号)を処理して、例えば、音声信号や同調誤差を示す同調誤差信号を出力する。DSP13が実行する処理の内容については、後述する。
【0027】
D/A変換器14は、DSP13のデジタル出力信号(音声信号)を、アナログ信号に変換して出力する。
アンプ15は、D/A変換器14の出力するアナログ信号を増幅して、出力する。
スピーカ16は、アンプ15からの電気信号を空気信号(音声信号)に変換して出力する。
出力端子17は、外部の端子が着脱可能に構成され、外部回路にアンプ15からの信号を出力する。
【0028】
制御部18は、CPUなどから構成され、操作部19からの指示に応答して、受信回路11の同調周波数、DSP13の処理動作モード、アンプ15の増幅率、等を制御する。特に、制御部18は、DSP13の出力する同調誤差信号に従って、同調回路に指示した同調周波数を調整(変更)する。
【0029】
操作部19は、ユーザの操作に応答して、受信回路11に、受信周波数等を指示し、また、DSP13に種々の指示を与える。
【0030】
次に、図1に示す受信機10が実施する同調方法を、図2のフローチャートを参照して説明する。
なお、以下の動作の説明において、動作の主体は、主に、制御部18とDSP13である。ただし、理解を容易にするため、他の部材の動作を合わせて説明することがある。
【0031】
制御部18は、例えば、操作部19からの指示に応答して、受信機10を起動し、図2のフローチャートに示す同調方法を開始する。
まず、制御部18は、この同調方法をステップ10で開始し、まず、受信機10を目的周波数に同調させるために初期化する。
【0032】
初期化後、DSP13は最初の音声レコードの収集を開始する(ステップ12)。続いて、音声レコードが終了、すなわち完了したかどうかを判定し、音声レコードが終了したと判別すると、次の音声レコードの収集を直ちに開始し(ステップ16)、さらに、収集した音声レコードへの信号処理を開始する(ステップ18)。
【0033】
DSP13は、連続的な音声の収集と収集した音声の処理を、1つの音声レコードを処理している間に、次の音声レコードを収集するように行う。すなわち、音声信号の信号処理は、音声入力部分が信号処理の間に欠落しないように、他の音声レコードを得ることを終えていなくてはならない。DSP13が実行する信号レコードの信号処理は、図3に概略的に示される。まず、DSP13は、(任意に)最初の音声フィルタリングを行う(ステップ20)。それから時間領域処理(ステップ22)、周波数領域処理(ステップ24)と相関領域処理(ステップ26)を行う。
【0034】
音声フィルタリング(ステップ20)は、所望の音声あるいは信号が通過している間に、デジタル信号からDC成分と高周波数ノイズを除去するものである。これらの不要成分を他の方法で除去するようになっていれば、このステップは割愛してもよい。
【0035】
時間領域処理(ステップ22)は図4に概略的に示され、話者の声道(フォルマント)効果を取り除く「スペクトル・フィルタリング」として音声処理の専門家にはよく知られている。いずれのスペクトル・フィルタリング技術でも、この発明を用いることができる。好適な実施形態において、中央クリッピング(ステップ28)は音声から声道効果を取り除くために用いる。しかしながら、ラジオを自動的に同調する方法でのスペクトル・フィルタリングは新規なものである。
【0036】
図7は、中央クリッピングを時間領域で実施した形態のグラフを示す。音声レコードでの原音声を曲線Aで表わし、中央クリップ後の音声を曲線Bで表わす。
時間領域中央クリッピングは図7に示され、次のように定義される。
【0037】
Y(t)=0 │x(t)│≦clip のとき
Y(t)=x(t)−clip x(t)>clip のとき
Y(t)=x(t)+clip x(t)<−clip のとき
【0038】
最大振幅の割合であるクリップ水準を設定する様々な方法が音声処理で用いられる。しかしながら、最大振幅に基づくクリッピング水準を用いると、高周波数SSB信号での雑音スパイクを強調することになる。発明者の研究により、2つの他の基準が信号特性、RMS(二乗平均平方根)とMAD(平均絶対偏差)により適合することが分かった。雑音スパイクは高い振幅であるが低エネルギ−なので、RMS基準は閾値水準への雑音スパイクの影響は最小限になる傾向がある。好適な実施形態では、RMS水準の30%が最善なクリッピング水準である。ただし、他の基準値を使用することも可能である。
【0039】
ウインドウ化(窓掛け)(ステップ30)は、周波数領域での最善結果を生じさせるために用いる。ウインドウ化自体は、信号処理の分野では一般に知られているが、受信機を同調のアプリーションに適用することは知られていない。定常信号分析では、ウインドウの長さは要求される周波数領域分解能に基づいて選択される。受信機が同調を行ったとき、周波数領域分解能は関係せず、短いウインドウは音声信号の非定常特性にもかかわらずピッチ推定のために必要な定常状態を近似するために用いられる。しかしながら、長いウインドウはピッチ、特に低ピッチを有する男性話者のピッチをより正確に推定するために望まれる。好適な実施形態では、40msecウインドウを用いる。ただし、ウインドウの長さは、これに限定されるものではなく、他の長さでもよい。
【0040】
第2に、ウインドウ関数の形態は、ウインドウの周波数変換が相関領域にて実行されるウインドウ補正を可能にするために全ての周波数で負でないことを確実にするため選択することができる。ディック(Dick)方法のような同調方法の従来技術でのかかる訂正をしない相関領域でのウインドウ関数の好ましくない効果は、実際のピッチでピークを減衰させるので、ピッチ周波数の推定が高過ぎることが予想される。
【0041】
ここでのウインドウの例は、周波数領域では常に正であり、それらの相関領域効果は補正が容易な三角形ウインドウである。周波数変換はsinf/f2形態を有する。かかる三角形ウインドウが好ましいウインドウであるが、他のウインドウもこの発明に用いることができる。
【0042】
ウインドウ漏れに関して、短時間ウインドウ化は、周波数領域では大きな漏れを引き起こす。このような漏れは周波数オフセット推定では誤差の原因になる。この発明に従ったアルゴリズムは、相関振幅関数のピークで、位相は周波数同調誤差によって決定されることだけを前提にする。しかしながら、このアルゴリズムはオフセットピッチ周波数の近傍にある周波数でエネルギーがないときにだけ正しい。
【0043】
他の実施形態では多数の幅ウインドウを用いる。ピッチは上述したウインドウで最初に推定する。ピッチが正確な推定のためにはあまりにも低ければ(ウインドウにおいて約4サイクル未満)、レコード処理は約2倍の長さのウインドウで再開する。十分な処理能力が利用できるならば、この技術は同調周波数の補正を速くそして確実に行なう。受信機を同調するために多数のウインドウの利用は新規なものと確信する。
【0044】
更に、音声信号の窓関数掛け(ウインドウ化)について考慮すべきことは、ウインドウを重ね合せるかどうかである。周波数変換前の時間レコードの重なりが定常状態信号の雑音低減を平均化することは当業者にはよく知られている。しかしながら、受信機同調に適用することは新規である。
【0045】
例えば、受信機同調の先行技術は、ウインドウが50%以上重ねられていないことが最善であることを示唆しており、従って、それが冗長すぎるということはない。複数の推定(評価)は統計的には独立していないので、重なり処理を雑音低減のために用いることは妥当なことである。しかしながら、この発明においては、重なり処理は、雑音低減のためではなく、ウインドウと短い有声音を自己整合させるために評価関数と併せて用いる。
【0046】
重なり処理を実際のSSB受信信号に実行する場合、図8に示されるように、40ミリ秒三角形ウインドウの75%重なり(25%遅れ)を用いて動作が最適化されることが分かる。音声信号は本質的には非常に変化し易く、短い有声音のウインドウの配置は、最良の同調誤差推定を推進する上で重要である。
【0047】
好適な時間領域処理における最後のステップは、時間レコードをゼロ詰めにするためのものである(ステップ30)。ゼロ詰めは自動相関領域でのエイリアシングを避けるための技術であり、自動相関処理の専門家にはよく知られている。しかしながら、SSBラジオを自動同調におけるピッチと周波数オフセットの推定確度の改善のためにゼロ詰めを行うことは新規なものと確信する。
【0048】
順方向高速フーリエ変換(FFTステップ32)は、時間領域信号を周波数に変換する信号処理技術であり、専門家にはよく知られている。FFTは周波数領域に変換するのに好適な実施形態であるが、離散フーリエ、離散コサイン、ウィグナー(Winger)、コーエン(Cohen)、ガボール(Gabor)、およびウェ−ブレット(Wavelet)変換のような他の変換も専門家には明白な他の変換方法としてこの発明に含まれる。
【0049】
図5は周波数領域処理を概略的に示す。この処理はゼロに負の周波数成分を設定するものである(ヒルベルト(Hilbert)変換を用いてSSBに変換するのと同じである)(ステップ34)。ここで注意すべきことは、このステップはアルゴリズム入力がIF SSB信号からのものであれば必要がないということである。好適の実施形態である追加の周波数領域処理は、周波数領域での処理結果を振幅だけの信号に変換を行い(ステップ36)、非ピッチに関連する成分を取り除く中央クリッピングを行い(ステップ38)、そして、逆高速フーリエ変換の適用を行う(ステップ40)。
【0050】
受信機の音声応答の範囲外にあることを知られている低周波数又は高周波数での処理結果も連続推定において誤りを最小化するためにゼロに設定する。特に、電力線ハム音および高周波数雑音はこの動作によって取り除かれる。
【0051】
(位相情報を取り除く)周波数領域処理結果の振幅変換(ステップ36)はその結果から全ての絶対的時間情報を取り除くだけである。それ故、アルゴリズムは会話の開始時と終了時の音声レコードの間では区別することができず、全ての有声音は一様に処理される。振幅への変換は専門家には知られている様々な技術と類似技術のいずれかによって行なう。
【0052】
周波数領域での中央クリッピング(ステップ38)は、声帯によっては生成されない全ての音を取り除く。これは音声レコードのピッチと周波数オフセットの正確な推定を決定するために好ましい。これを行う1つの方法は、適切なクリッピング機能(上述した時間領域クリッピング機能と類似の方法で定義される)を用いるゼロに対する最大成分所定の割合、例えば、5%未満の全ての周波数成分を設定することである。図9は、周波数領域の中央クリッピングの効果を示す。
【0053】
好適な実施形態において、中央クリッピング振幅データは相関領域に直接変換される。しかしながら、他の周波数領域処理はこのポイントで機能するが、この発明の範囲内に含まれる。
【0054】
特に、更なる信号処理が振幅の対数を含むときには、当業者には知られている、ケプストラム(Cepstrum)に類似する相関領域に処理結果をもたらす。振幅データは、また整数乗あるいは少数乗される。このことは、周波数領域ピークの振幅における差違を強調するかあるいは非強調する。
【0055】
最後の周波数領域の処理の強調方法が、本発明の範囲内に含まれるので、周波数スペクトルはゼロ詰めと大きな逆周波数変換を使用できる。これは、時間サンプルレートを増やすことなく、改善されたピッチと周波数オフセット推定をもたらす相関領域での分解能を増大させる。
【0056】
上述した中央クリッピングといずれかの追加の信号処理が周波数領域で実行されると、処理結果は逆高速フーリエ変換を適用して相関領域と呼ばれるタイムライク領域に戻る変換を行う(ステップ40)。逆高速フーリエ変換は当業者にはよく知られている。前述した周波数領域変換のように、逆変換は離散フーリエ変換、離散コサイン、ウィグナー(Winger)、コーエン(Cohen)、ガボール(Gabor)、およびウェ−ブレット(Wavelet)変換のようなよく知られている他の変換によって実現でき、当業者には明白な他の変換方法と同じように、またこの発明に含まれる。
【0057】
図6に概略的に示される相関領域処理の好適な実施形態は、ウインドウ効果を補正し(ステップ42)、二乗化された相関振幅上の2次の回帰オーダによってピッチを推定し(ステップ44)、ピッチ周波数で相関位相からオフセット周波数の推定(ステップ46)を行う。
【0058】
好適な相関領域処理における第1のステップはウインドウ効果の補正を行う(ステップ42)。短時間の窓掛けは通常の声の非定常ピッチのため必要とされるが、相関領域ではいつも問題を引き起こす。特に、短い時間領域の窓掛けは、相関領域において低ピッチである男性話者の所望のピークを大きく減少させる。これを修正しないと、ピッチとオフセット周波数推定での全体誤差を大抵引き起こす。それ故、相関領域でのウインドウ修正を実行する。このステップは完全に新規なものであり、従来技術を超える多大な利点をもたらす。
【0059】
さらに具体的に、音声信号の時間領域ウインドウは増加τごとにロールオフとの相関を生じる。ピッチと周波数オフセットの推定前にウインドウ効果を取り除くことを必要としないならば、望みがある。しかしながら、周波数領域における非直線動作のために、相関領域におけるウインドウ効果のシンプルな分析の数学的記述は記入することができない。幸いにも、測定された実際のウインドウ誤差への線形近似はピッチ範囲が約50Hz〜約250Hzでテスト波形を用いるときにうまくいく。
【0060】
好適な実施形態において、相関領域でのウインドウの補正後、例えば、ピッチは最大振幅サンプルを決定することによって概略的に推定される。この推定が音声ピッチの通常範囲外であれば、音声レコードは破棄される。音声は、またピッチ倍増と呼ばれる音声処理の当業者には知られている現象をテストされる。ピークは、またピッチの2分の1と2倍で相関振幅と比較される。ピークの振幅がそれら周波数の40%以上でなければ、音声レコードは捨てられる(40%以外の値も使用可能である。)このステップは完全に新規で、受信機同調の従来技術を超える多大な利点をもたらす。
【0061】
音声レコードの相関がそれらテストをパスすれば、ピーク振幅は最大振幅の位置補間に適合する曲線によってより正確に推定される。振幅ピーク位置は音声レコードを窓掛けしている間の音声ピッチ期間に対応する。当業者にはよく知られている多くの曲線適合ルーチンがある。それらはこの発明に用いられる。好適な実施形態において、計算負荷が小さいので、二乗化された相関振幅の第2の少なくとも二乗回帰が用いられる。この補間の複雑性は低減でき、あるいは受信音声信号のサンプルレートを増大することにより完全に推定された補間、あるいは周波数変換における増大された複雑性の費用において上述したように周波数領域にゼロ詰めを行うことができる。それらの変形はこの発明の範囲内に含まれる。
【0062】
相関の計算値(デイック(Dick)方法)の間を補間するため放物線に適合する3点を用いることを提案する。これはこの発明に用いることができる。しかしながら、雑音と他の誤差に極めて敏感に反応する。
【0063】
したがって、この発明の一実施形態によれば、放物線に適合する3点を用いる代わりに、正確さを改善するために二乗化された相関振幅のピークサンプルの中心周辺の5またはそれ以上の点に適合する回帰を用いて大きな利点を得ることができる。回帰技術は個々の点のどんな誤差も取り除くものである。位相関数はピークでの実数と虚数値の推定における小さな誤差に極めて敏感に反応するので、雑音を平坦にすることは極めて重要なことである。
【0064】
最大相関振幅に対応するピッチ周期を見つけるために、最大値を見つけるための周知技術である上述の曲線適合の微分型が計算され、ゼロに設定される。
【0065】
相関領域処理における最後のステップは相関振幅ピークで曲線適合からオフセット周波数を推定するためのものである(ステップ46)。かさねて当業者にはよく知られている曲線適合技術のいずれもこの発明に用いられる。好適な実施形態において、位相は2次のオーダである、二乗化された相関振幅のピークサンプルの相関中央周囲の実数と虚数部分の5点最小二乗回帰によって推定し、そして最大ピークで推定される実数と虚数曲線適合から位相推定を計算すること、を再度用いて推定される。
実数と虚数推定から、周波数オフセットは次の式を用いて計算される;
【0066】
e=fp arctan(im/re)/(2π)

ここで、f=周波数オフセット
=ピッチ周波数
=ピークでの虚数成分
=ピークでの実数成分
【0067】
代わりの実施形態において、相関領域への全体の変換は周波数領域での曲線適合によって取り除かれる。5点最小二乗回帰曲線方程式は周波数領域に変換ができる。計算された多項式係数の結果は相関領域における計算と同じであり、ピッチと周波数オフセット結果推定は各実施形態とも全く同じである。
【0068】
これで信号処理(ステップ18)を終了する。
図2の説明に戻る。最良なS/N比を有する有声音が音声レコードに在るかどうかを判別する(ステップ48)。有声音がなければ、次の音声レコードが完成および一旦完成したかどうかの連続的な決定を行い、信号処理を次の音声レコードで開始する。
【0069】
相関ピーク振幅が十分に大きくなければ、音声レコードは有声音を含んでいないとみなされるので、受信機同調誤差の推定に用いるべきではない。この判断は重要である。受信機音声信号は、受信機同調誤差に推定される多くの無効ノイズを増加する音声中の長い休止を含んでいるからである。
【0070】
音響が与えられたときだけではなく、有声音あるいは無声音であっても判断することがこの発明では重要なことである。有声音は誤同調を推定するのに必要なピッチ情報を有し、非有声音はほとんどが雑音のようなものであり、自動同調のために不要な情報を有するものである。
【0071】
上述したDickのチューニング方法においては、全てのタイムレコードは、誤同調周波数推定に影響を与え、唯一重みだけが、相関のピークのエネルギーである。言及していないが、以下の仮定に基づいている。無声音及びノイズは低い相関を有し、従って、重み付けされた効果は小さい。しかしながら、タイムレコードの多数は、ノイズか無声音であるので、これらは容易に累積され、誤同調エラーを推定する上で、大きな誤差の原因となる。
【0072】
また、以下のことが見出された。それは、レコードに有音声があるか否かを判別する上で、重要なファクターは、全ての相関二乗値の和に対する相関ピーク値の二乗の割合を測定することである。
例えば、現実的な実施例において、この割合がおよそ0.3%未満であれば、測定は否定される。この値は、サンプルレートに依存する。0.3%という割合は、実験に基づいた、11KHzのサンプルレートでの測定に基づいて選択された値である。
【0073】
音声(スピーチ)レコードに、有声音が、有効なピッチレンジで良好なS/N比で存在し、スピーチレコード内で受信機が再同調されていない場合には、受信機は、評価関数は更新される(ステップ50)。このステップは、全体に新規でありこの発明による特有の効果を与える。この評価関数により、先行技術で使用されているヒストグラムを用いる手法よりも、より正確に受信機同調エラーが推定値できる。
【0074】
従来技術に使用されているヒストグラム技術では、多様な平均ピッチ振幅により受信機同調誤差推定がオフに戻ることがある。例えば、受信機同調誤差推定は100Hz〜200Hzでオフされる。対照的に、この発明では、評価関数は5Hzの精度である。5Hz誤差は聞き取れず、他方、100Hz〜200Hzは極めて好ましくない。
【0075】
評価関数は、推定受信機同調誤差からかけ離れた有声音は、大きな誤差として評価関数に寄与するように構成されている。それ故、最小の評価関数値を有する周波数は受信機同調エラーと見做すことができる。
評価関数は、十分な音声レコードが精密な受信機同調誤差を推定する処理がされたか否かの判断を容易なテストによって可能とするように、設定されている。
【0076】
数学的に、評価関数は、むしろ受信機同調誤差の最小二乗推定であり、以下のように定義される:
【0077】
J(f)=Σw*〔Int(n+e−f)〕
ここで、
f 可能な受信機同調周波数誤差
第i番目レコードの二乗した相関最大電力
Int 直近の整数(切り捨てではない、丸め)
Int((f−e)/p)、同調誤差のピッチ係数
第i番目の測定の推定オフセットピッチ
第i番目の測定の推定オフセット周波数
i 測定インデックス
【0078】
この関数は、−900〜+1100の整数fのアレーj(f)を生成するために用いる(図11を参照)。受信機同調誤差の最良推定はjの全体の極小値を持ったfである。なお、回路をDSPに組み込む場合には、補足周波数を拡張するため、−1400〜+1500程度の整数fのアレーを生成する関数とすることが望ましい。
【0079】
他の重み付け関数と評価関数はこの発明の範囲内にある。また、fが所望のどんな周波数分解能にスケールできるということも留意すべきである。
【0080】
評価関数を考慮したこと及び評価関数を上述のように構成したことの利点は、後述するアルゴリズムを終了する際、優れた基盤を形成することである。
【0081】
SSB自動同調プログラムにおいて、どれだけの音声測定が必要かを判別するために、第2の最良推定(次の最良最小値)の評価関数の割合は、全体最小値(最良推定値)で除される。この割合は、受信機同調誤差推定が他のどんな周波数より著しく良くなると見做すことができれば、Fテスト値より大きくなる。
【0082】
Fテストは統計学の専門家にはよく知られている標準的な統計テストである。仮定の間の重要な差違を求めるために使用される他の統計テストも、この発明に使用可能である。しかしながら、ラジオを自動的に同調させる方法における統計テストの使用は新規なものと確信する。
【0083】
その相違が所望の信頼度について固定的に大きくなければ、処理はレコードの最大数まで持続する。すなわち、テスト終了基準が合致しなければ、以前の結果を再計算することなく、評価関数を存続するために新たな測定を追加してテストを継続しやすい。
【0084】
図10は2つの異なる信頼水準のためのテストの数に対するプロットされた必要とされる比率のグラフを示す。F値は同調推定の決定に用いた測定数と信頼度に左右される。2つの評価関数の値の割合がFより大きければ、同調推定の間に大きな差違があると結論せざるを得ない。
【0085】
好適な実施形態において、与えられた信頼水準とサンプル数に対するF値は参照テーブルに載っている。F値はまたより小さいテーブルから補間あるいは測定数が多いときは下記のような近似式によって計算が行われる。
【0086】
F〜n/(n−2){(4n−4}/(n−4)/n}1/2+n/(n−2)

ここで、
y〜t−(2.30753+0.27061t)/(1+0.99229t+0.04481t
および
t={−21n(1−P)}1/2
【0087】
前述のように、割合がFテスト値を超えなければ、プログラムは音声時間レコード分析を継続する。アルゴリズムは音声ピッチの自然変位に左右されるので、少数の時間レコードでの受信機同調誤差の最良の推定の集中は極めてありそうもない。計算時間をセーブするために、好適な実施形態では、信頼テストは評価関数が100回更新されたときだけに実行する。それでテストは、各追加の50評価関数が許容最大レコード数まで更新された後に実行される(ステップ52)。他のレコード数と更新数を使用することも可能である。
【0088】
次の音声レコードが終了と以前終了したかどうかを連続的に判定する。信号処理は、良好な信号対雑音と干渉比を有する有声音の存在の継続的な判定とともに次の音声レコードの信号処理を開始する。
【0089】
50の追加の更新が得られたとき、判定は、結果、つまり更新評価が統計的に重要かどうかに応じて行われる(ステップ54)。
結果が重要であった場合には、制御部18は、受信回路11を同調する(ステップ56)。
【0090】
結果が重要でなかった場合には、つまり、最良の同調推定と第2の最良の同調推定の間の評価関数値にわずかな差違しかなければ、決定は、最大レコ−ド数に達したかどうかで行う(ステップ58)。達していなければ、決定は、収集された音声レコードが終了したかどうかで行い(ステップ14)、この方法は良好な信号対雑音と干渉比を有する有声音を含む新たなレコードの追加セットを得ることを続行する。最大レコ−ド数に達していれば、伝送はこの発明に従った同調ができず、処理は停止する(ステップ60)。
【0091】
この発明は、上述したいずれの実施形態においても、自動同調方法の従来技術を超えた改善であり、そこで固定されたテスト回数は考慮される。固定されたテスト回数を考慮すれば、受信機の結果は不正確な周波数に大抵同調することになる。テスト回数の増加はエラー回数を減少させるが、多くの推定のためには、回数が増加してしまう。
【0092】
なお、受信機10の好適な実施態様はSSBラジオである。しかしながら、パーソナル・コンピュータ、PDAおよびカスタム外部ハードウェアを含む他の装置での実施もこの発明の範囲内にある。
【0093】
さらに、受信機10として、中間周波数を処理するデジタル信号処理装置(DSP)を備えた構成を例示したが、RFおよびIF DSP処理装置を備えたものでもよい。また、伝統的なアナログ型ラジオにも適用可能である。
【0094】
さらに、この発明は、音声信号がデジタル形式であっても、あるいはアナログ形式であっても、実施できる。また、この発明の範囲内には、SSB復調器の前に、アナログ形式あるいはデジタル形式で、中間周波数と呼ばれている音声信号の処理装置が含まれる。
【0095】
好適な実施形態において、復調音声信号はアナログ形式とかデジタル形式のいずれかでこの発明に投入される。信号処理がDSPで実施される場合は、通常、以下に記述するADCとフイルタリング・ステップを設ける必要はない。
【0096】
音声信号はナイキスト周波数より大きい周波数でサンプルされなければならないことは、デジタル信号処理の当業者には理解される。SSB受信機は音声信号を、通常、最大周波数3KHzでフィルタリングする。従って、サンプリング周波数は、通常、6KHz以上でなくてはならない。相関領域における分解能を改善するために、サンプリング周波数をさらに増加してもよい。これにより、ピッチ及び周波数オフセットの推定を改善することができる。また、相関領域は畳み込み領域と呼ばれることもある。
【0097】
好適な実施形態では、少なくとも11KHzのサンプルレートを用いているが、他のサンプルレートを用いることも、この発明の範囲内にある。
【0098】
この発明の特別な実施形態を図示し、記述したが、その変更と修正は、より広範な態様において発明から逸脱することなく実施できることは当業者には明らかである。それ故、添付の特許請求の範囲の狙いはこの発明の真の精神と範囲内にある全てのかかる変更と改良を対象とすることである。
【図面の簡単な説明】
【0099】
【図1】この発明の実施形態に係る受信機の構成を示すブロック図である。
【図2】図1に示す受信機を同調する方法の動作を示すフローチャートである。
【図3】図2における信号処理ブロックの詳細を示すフローチャートである。
【図4】図3における時間領域処理ブロックの詳細を示すフローチャートである。
【図5】図3における周波数領域処理ブロックの詳細を示すフローチャートである。
【図6】図3における相関領域処理ブロックの詳細を示すフローチャートである。
【図7】時間領域中央クリッピング効果を示すグラフである。
【図8】75%オーバラップ三角形窓を示すグラフである。
【図9】周波数領域中央クリッピング効果を示すグラフである。
【図10】この発明の実施形態に従った同調方法において用いられるFテスト分配のチャートである。
【図11】同調推定を示す評価関数のチャートである。
【符号の説明】
【0100】
10 受信機
11 受信回路
12 A/D変換器
13 DSP
14 D/A変換器
15 アンプ
16 スピーカ
17 出力端子
18 制御部
19 操作部

【特許請求の範囲】
【請求項1】
受信機を同調する方法であって
音声信号を取得し、
取得した前記信号を時間領域において処理し、
時間領域で処理した前記信号を周波数領域に変換し、該周波数領域における前記信号を信号変更のために処理し、
周波数領域で処理した信号を周波数領域から相関領域に変換し、相関領域における前記信号を処理し、
相関領域で処理された前記信号を解析して受信機同調誤差を決定し、
前記時間領域における信号処理は、前記信号を中央クリッピングすることにより、スペクトル平坦化する処理を含み、
前記周波数領域における信号処理は、時間情報を取り除くために、振幅を示す信号に変換し、変換後の信号をスペクトル平坦化する処理を含み、
前記相関領域での信号処理は、前記時間領域での信号処理のために信号を補正するステップと、前記相関領域での信号のピーク振幅の位置を決定し、それに基づいてピッチとオフセット周波数とを算定するステップを含む、
ことを特徴とする受信機を同調する方法。
【請求項2】
前記信号を、二乗平均平方根(RMS)あるいは平均絶対偏差基準に基づいて信号のクリップ水準を決定して、時間領域において中央クリッッピングする、請求項1に記載の受信機を同調する方法。
【請求項3】
前記信号を時間領域で中央クリップし、前記時間領域での信号処理ステップは前記中央クリップされた信号をウインドウ化し、ウインドウ化された中央クリップ信号をゼロパッドすることを有する請求項1又は2に記載の受信機を同調する方法。
【請求項4】
前記中央クリップ信号のウインドウ化処理は、信号ピッチの初期推定値に基づいてウインドウの長さを選択する、ことを有する請求項3に記載の受信機を同調する方法。
【請求項5】
前記中央クリップされた信号のウインドウ化ステップは、三角形のウインドウを用いる、ことを有する請求項3又は4に記載の受信機を同調する方法。
【請求項6】
前記中央クリップされた信号のウインドウ化ステップは、所定の周期で新たな時間レコ−ドを取得する重ね処理を用いること、を有する請求項3、4又は5に記載の受信機を同調する方法。
【請求項7】
前記周波数領域での信号振幅を、不要な雑音を取り除くために、中央クリッピングすることを、更に有する請求項1乃至6のいずれか1項に記載の受信機を同調する方法。
【請求項8】
前記時間領域での信号処理は前記信号をウインドウ化し、前記時間領域での信号処理のための補正は、前記時間領域での信号処理による悪影響を補正することを、有する請求項1乃至7のいずれか1項に記載の受信機を同調する方法。
【請求項9】
前記相関領域における信号処理は、少なくとも5点の放物線回帰を用いる曲線に、信号を適合させることを、更に特徴とする請求項1乃至8のいずれか1項に記載の受信機を同調する方法。
【請求項10】
前記相関領域での信号処理は、前記相関領域での信号のピーク振幅の位置を決定し、それに基づいてピッチとオフセット周波数とを算定することを、更に有し、
この算定ステップでは、前記ピーク振幅が有声音の閾値指標以上かどうかを判別し、閾値以上でなければ、処理した信号を無視する、ことを有する請求項1乃至9のいずれか1項に記載の受信機を同調する方法。
【請求項11】
前記受信機同調誤差を判別するために、前記相関領域に在る前記処理された信号を分析するステップは、前記ピーク振幅が閾値以上の場合、前記相関領域に在る前記処理された信号から評価関数を形成し、前記評価関数は、推定された受信機同調誤差から遠いほど有声音が大きな誤差に寄与するように形成する、ことを有する請求項10に記載の受信機を同調する方法。
【請求項12】
前記評価関数は、最小二乗推定値を求める関数である、ことを有する請求項11に記載の受信機を同調する方法。
【請求項13】
前記評価関数は、相関ピーク電力の合計処理電力に対する割合によって重み付けされた受信同調誤差の最小二乗推定値を求める関数である、ことを有する請求項11に記載の受信機を同調する方法。
【請求項14】
前記受信機同調誤差を決定するための前記相関領域に在る前記処理信号の分析は、統計的に有効な差違が、評価関数から導出される受信機同調誤差の第1と第2の推定値の間に在るかどうか決定し、在る場合には、第1の推定値を受信機同調誤差とする、請求項11に記載の受信機を同調する方法。
【請求項15】
前記受信機同調誤差の第1と第2の推定値の間に統計的な大きな差違がない場合には、追加の受信音声信号が処理される、請求項14に記載の受信機を同調する方法。
【請求項16】
前記受信機同調誤差を決定するために前記相関領域に在る信号の分析は、受信音声信号の数が処理される分設定されたかを決定し、受信音声信号の数が処理される分設定されたときにだけ、評価関数から導出される前記受信機同調誤差の第1と第2の推定値の間に統計的に大きな差違が在るか否かを決定することを、更に有する請求項14に記載の受信機を同調する方法。
【請求項17】
音声信号の取得と音声信号の処理は一方の音声信号は処理され、他方の音声信号は取得されるように同時に実行される、ことを有する請求項1乃至16のいずれか1項に記載の受信機を同調する方法。
【請求項18】
音声信号を取得する取得手段と、
前記取得手段で取得した信号に、中央クリッピングすることによりそのスペクトル分布を平坦化する処理を含む時間領域での処理を施す時間領域処理手段と、
前記時間領域処理手段で処理した信号を周波数領域の信号に変換し、変換した信号から時間情報を取り除くために、振幅を示す信号に変換し、変換後の信号をスペクトル平坦化する処理を含む周波数領域での処理を施す周波数領域処理手段と、
前記周波数領域処理手段で処理した信号を相関領域の信号に変換し、前記時間領域での信号処理のために補正し、前記相関領域での信号のピーク振幅の位置を決定し、それに基づいてピッチとオフセット周波数とを算定する処理を含む相関領域における信号処理を実行する相関領域処理手段と、
前記相関領域処理手段で処理された信号から同調誤差を判別する同調誤差判別手段と、
を備える受信機。
【請求項19】
プロセッサを、
音声信号に、中央クリッピングすることによりそのスペクトル分布を平坦化する処理を含む時間領域での処理を施す時間領域処理手段、
前記時間領域処理手段で処理した信号を周波数領域の信号に変換し、変換した信号から時間情報を取り除くために、振幅を示す信号に変換し、変換後の信号をスペクトル平坦化する処理を含む周波数領域での処理を施す周波数領域処理手段、
前記周波数領域処理手段で処理した信号を相関領域の信号に変換し、前記時間領域での信号処理のために補正し、前記相関領域での信号のピーク振幅の位置を決定し、それに基づいてピッチとオフセット周波数とを算定する処理を含む相関領域における信号処理を実行する相関領域処理手段、
前記相関領域処理手段で処理された信号から同調誤差を判別する同調誤差判別手段、
として機能させるプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate


【公開番号】特開2008−160844(P2008−160844A)
【公開日】平成20年7月10日(2008.7.10)
【国際特許分類】
【出願番号】特願2007−328085(P2007−328085)
【出願日】平成19年12月19日(2007.12.19)
【出願人】(000100746)アイコム株式会社 (273)
【Fターム(参考)】