受信機及び受信機を同調する方法

【課題】特別に改良された送信機を必要とせずに単側波帯音声信号を自動的に同調する。
【構成】単側波帯受信機同調方法は、音声信号を取得し、該信号を時間領域において処理し（ステップＳ２２）、その信号を周波数領域に変換し、周波数領域における信号を信号変更のために処理し（ステップＳ２４）、変更信号を周波数領域から相関領域に変換し、相関領域における信号を処理し（ステップＳ２６）、相関領域で処理された信号を解析して受信機同調誤差を決定する。

【発明の詳細な説明】
【技術分野】
【０００１】
この発明は、受信機と受信機を同調する方法に関する。
【背景技術】
【０００２】
単側波帯変調（ＳＳＢ）は、振幅変調（ＡＭ）や周波数変調（ＦＭ）のような普及している一般の変調方式と比較して、周波数スペクトルの使用効率が非常によい。ＡＭは、ＳＳＢの２倍のスペクトルを必要とし、ＦＭは４倍から８倍のスペクトルを必要とする。周波数スペクトルは希少な資源であり、周波数スペクトルを浪費しない技術は高価値を持つ。
【０００３】
さらに、ＳＳＢは、電力効率が高い。ＡＭと比較すると、ＳＳＢ通信は１０分の１未満の電力で通信を行うことができる。この送信電力の軽減は他の通信サービスへの干渉を軽減でき、それによって、周波数スペクトルの使用効率を改善することも可能となる。
【０００４】
これらの優れた特性を有する一方で、ＳＳＢ信号は、再生音声の歪みを防ぐために、ほぼ１０ヘルツ（Ｈｚ）以内で同調する必要があるという技術的な課題を有している。この制限を超えて離調した場合には、離調の方向に応じて、大きな轟音のような音あるいはドナルドダックの声のような音声が再生されてしまう。
【０００５】
この問題の１つの解決法は、ある特定の周波数（チャネル）だけで送信を行うことである。しかしながら、高周波数送信機と受信機の双方は、正確に正しい周波数に同調することを要求される。これは、搬送波に応じて、約１０億分の２０以内での同調を要求されることになる。この信頼度は、特に環境条件の広い範囲で実行するのは高額となり、またラジオの耐用年数にわたってそれを維持しなくてはならない。これは海上ＨＦＳＳＢラジオが受信機周波数のオペレータ調整のクラリファイア制御を有することが理由である。この調整は難しく、適切な音質を調整するための訓練が要求される。チャネル化動作の第２の不都合はスペクトル利用効率が低下することである。チャネルの完全な放棄と他のチャネルへの移行の代わりにＲＦ干渉を回避する周波数の僅かな変更はしばしば好都合となる。
【０００６】
当業者にはよく知られている第２の解決法は、送信信号に既知の周波数音声トーン（パイロットトーン）を追加することである。受信局は、送信パイロットトーン周波数を知っている場合、受信パイロットトーンを所望の受信周波数に自動的に調整する。この解決法には少なくとも３つの不具合がある。第１には、送信機と受信機は同じパイロットトーン周波数と振幅とで動作するように設計しなくてはならない。これはアドホック通信の形成を阻止し、現存する無線インフラに相容れない。今日用いられているＳＳＢトランシーバの膨大な台数を考慮すると、この装置を更新することは現実的ではなく、またパイロットトーンを用いる発明は限定された実用的なものとなる。第２には、付加されたパイロットトーンは送信機に電力を必要以上に消費させる。最大送信電力は規制によって通常は制限される；無駄な電力は信号の範囲と可読性を減少させる。最後に、受信機帯域はノイズと干渉を最小限にするために制限される。それ故、受信機が数百Ｈｚ以上離調した場合にはパイロットトーンはフィルタ・オフを行い、自動同調は失敗する。
【０００７】
様々な同調技術が、音声信号の特性を用いることにより、ＳＳＢ音声信号に自動的に同調することを試みてきている。例えば、非特許文献１〜４を参照されたい。これらの技術は、実際には、音声ＳＳＢ信号に適切に同調できていない。
【０００８】
上述の先行技術と対象的に、この発明は送信機の改良を必要としない。また、この発明を備えている受信機は既存のＳＳＢ送信機と共に使用される。この発明はまた大きな同調誤差の訂正を行うことができる。下記に詳細に記述するが、この発明に係る受信機は、送信された人間の声の特性を言語に依存せずに分析し、実際の送信信号周波数に高精度で同調する。このことにより、熟練のオペレータより早くラジオの再同調を行うことができる。
【非特許文献１】「同一チャネル干渉分離」、ロバート・ディック著、１９８０年１２月（“Co-Channel Interference Separation” by Robert Dick、Dec.1980）
【非特許文献２】「ＳＳＢ自動同調」、ロバート・ディック著、ＱＥＸマガジン、１９９９年１月／２月（”Tune SSB Automatically” by Robert Dick、QEX magazine, Jan/Feb 1999）
【非特許文献３】「単側波帯用隠れ自動周波数制御アルゴリズム」、ゲーリー・ガイシンガー、ＱＥＸマガジン、２００５年７月／８月（“Automatic Frequency Control Algorithm for Single Sideband” by Gary Geissinger, QEX magazine, Jul/Aug 2005）
【非特許文献４】「通信受信機」、ウルリッヒ・ローデ博士著（”Communications Receivers” by Dr. Ulrich Rohde ）
【発明の開示】
【発明が解決しようとする課題】
【０００９】
この発明の目的は、特別に改良された送信機を必要とせずに単側波帯音声信号を自動的に同調する新しい方法とシステムを提供することにある。
この発明は、新たな受信機において内部的に実施されるか、あるいは外部付けのハードウェアおよびパーソナル・コンピュータ（あるいは他のコンピュータ装置）並びに従来のＳＳＢ受信機で実施されうる。
【課題を解決するための手段】
【００１０】
この目的と他の目的を達成するために、本発明の同調方法は、
音声信号を取得し、
取得した前記信号を時間領域において処理し、
時間領域で処理した前記信号を周波数領域に変換し、該周波数領域における前記信号を信号変更のために処理し、
周波数領域で処理した信号を周波数領域から相関領域に変換し、相関領域における前記信号を処理し、
相関領域で処理された前記信号を解析して受信機同調誤差を決定し、
前記時間領域における信号処理は、前記信号を中央クリッピングすることにより、スペクトル平坦化する処理を含み、
前記周波数領域における信号処理は、信号から時間情報を取り除くために、振幅を示す信号に変換し、変換後の信号をスペクトル平坦化する処理を含み、
前記相関領域での信号処理は、前記時間領域での信号処理のために信号を補正するステップと、前記相関領域での信号のピーク振幅の位置を決定し、それに基づいてピッチとオフセット周波数とを算定するステップを含む、
ことを特徴とする。
【００１１】
また、本発明の受信機は、
音声信号を取得する取得手段と、
前記取得手段で取得した信号に、中央クリッピングすることによりそのスペクトル分布を平坦化する処理を含む時間領域での処理を施す時間領域処理手段と、
前記時間領域処理手段で処理した信号を周波数領域の信号に変換し、変換した信号から時間情報を取り除くために、振幅を示す信号に変換し、変換後の信号をスペクトル平坦化する処理を含む周波数領域での処理を施す周波数領域処理手段と、
前記周波数領域処理手段で処理した信号を相関領域の信号に変換し、前記時間領域での信号処理のために補正し、前記相関領域での信号のピーク振幅の位置を決定し、それに基づいてピッチとオフセット周波数とを算定する処理を含む相関領域における信号処理を実行する相関領域処理手段と、
前記相関領域処理手段で処理された信号から同調誤差を判別する同調誤差判別手段と、
を備える。
【００１２】
さらに、この発明のプログラムは、
プロセッサを、
音声信号に、中央クリッピングすることによりそのスペクトル分布を平坦化する処理を含む時間領域での処理を施す時間領域処理手段、
前記時間領域処理手段で処理した信号を周波数領域の信号に変換し、変換した信号から時間情報を取り除くために、振幅を示す信号に変換し、変換後の信号をスペクトル平坦化する処理を含む周波数領域での処理を施す周波数領域処理手段、
前記周波数領域処理手段で処理した信号を相関領域の信号に変換し、前記時間領域での信号処理のために補正し、前記相関領域での信号のピーク振幅の位置を決定し、それに基づいてピッチとオフセット周波数とを算定する処理を含む相関領域における信号処理を実行する相関領域処理手段、
前記相関領域処理手段で処理された信号から同調誤差を判別する同期誤差判別素手段、
として機能させる。
【００１３】
受信機同調誤差は、当業者にはよく知られているどんな目的にも用いることができる。例えば、通信士はラジオの再同調を可能にする受信機同調誤差について知らされる。ラジオ自動再同調は、またこの発明を用いて得られた受信機同調誤差を用いて実行される。また、多くのラジオに見出される受信機増加同調（ＲＩＴ）機能は受信機同調推定を適用して用いられる。この機能はラジオに表示される周波数設定を変更するのではなく、同調を変更するものである。この利点は、ＲＩＴがクリアされた場合、ラジオは元の周波数に戻るというものである。
【００１４】
この発明の一実施形態によれば、時間領域における信号処理は信号を中央クリッピングすることによって話者の声道効果を除去する。時間領域において、これは、二乗平均平方根（ＲＭＳ）あるいは平均絶対偏差（ＭＡＤ）基準に基づいて信号を中央クリップする水準の決定を含む。中央クリップされた信号は、例えば、三角形窓を用いてウインドウ化され、そして信号にゼロパッドされる。そして周波数領域において位相情報を取り除く。さらに、不要な周波数は取り除かれ（負の周波数を含む）、振幅である周波数成分は最大周波数成分の所定の割合未満となる。
【００１５】
音声サンプルのピッチと周波数オフセットは相関領域において推定される。このことは時間領域ウインドウ化の好ましくない効果を補正することを伴うのが好ましい。ピッチを推定して周波数をオフセットするには、相関領域における信号は少なくとも５点の回帰を用いる曲線適合が望ましい。信号の最大振幅の位置は補間によって決定され、オフセット周波数とピッチはそれに基づいて算定される。
【００１６】
処理された信号の分析は、有声音の最大振幅が閾値標記以上かどうかの決定を含み、閾値標記以上でなければ、処理された信号は無視される。
【００１７】
処理された信号の分析は、倍あるいは半（ハーフ）ピッチが従来技術方法でエラーをしばしば引き起こすかどうかを判定するために推定ピッチ周波数を２分の１あるいは２回でピーク周波数を比較することをさらに含む。
【００１８】
音声ピッチの全ての周波数成分がこの周波数領域に存在した場合、綿密な同調信号の受信機同調誤差の決定はささいなものである。
【００１９】
しかしながら、典型的なＳＳＢ送信機フィルタ・オフ周波数成分は約３００Ｈｚ以下である。多くの大人の音声は約５０Ｈｚから約２５０Ｈｚのピッチを有する。それで基本ピッチといくつかの倍音は送信の前にフィルタ・オフされる。それ故、単一測定で、受信機同調誤差がピッチ振幅以内に在ることだけを知る可能性がある。この問題は、受信機が送信信号から追加のピッチ倍音を除去できる受信機フィルタとして大きく離調した場合に、さらに悪化する。それらの理由のため、短い音声セグメント用ピッチと周波数オフセットを抽出した後、信号の更なる処理を行う必要がある。
【００２０】
時間と共に音声ピッチでの自然変化は、ピッチと周波数オフセットの多数の推定から実際の受信機同調誤差を決定することを可能にする。この発明の実施形態において、評価関数は受信機同調誤差の多数の推定から形成され、実際の受信機同調誤差を決定することに用いる。評価関数において、受信機同調誤差の試行推定でない有声音は評価関数に大きな誤差として貢献する。
【００２１】
この発明の他の特別な利点の実施形態は、音声のサンプルが正確に受信機同調誤差を決定するために十分かどうかを確認する統計的テストを用いる。特に、統計的有意差が評価関数から受信機同調誤差のベスト推定と第２のベスト推定の間に在るかどうかを決定する。存在するならば、第１の推定を実際の受信機同調誤差と見做す。一方、受信同調信号の他のセグメントは処理される。
【００２２】
統計的テストを用いる利点は、いくつの音声セグメントを処理すべきが先験的に知られていないことである。自然音声は受信機同調誤差の推定に寄与しない休止と摩擦（非音声）音を有する。十分な有声音声セグメントを取得するのに必要な時間は知られていない。従来の代替手法は、過度に長時間の音声を処理することである。この長い処理時間は、有声音声を処理するには十分に尤度（保証されるものではない）を向上させるが、同調時間を増加させる。
【発明を実施するための最良の形態】
【００２３】
以下、本発明の実施の形態にかかる受信機と該受信機が実施する受信方法を説明する。
なお、添付の図面に関して、参照番号は同一あるいは類似要素を示す。
【００２４】
本願発明の実施の形態に係る受信機１０は、図１に示すように、受信回路１１と、Ａ／Ｄ変換器１２と、ＤＳＰ１３と、Ｄ／Ａ変換器１４と、アンプ１５と、スピーカ１６と、は出力端子１７と、制御部１８と、操作部１９と、から構成される。
【００２５】
受信回路１１は、アンテナを備え、制御部１８により指示された受信周波数の電波に同調し、受信信号を増幅すると共にダウンコンバージョンして出力する。
Ａ／Ｄ変換器１２は、受信回路１１の出力信号（受信信号）を、所定のサンプリング周波数でアナログ・デジタル変換して出力する。
【００２６】
ＤＳＰ（Digital Signal Processor）１３は、予め記憶している動作プログラムに従って、供給されたデジタル信号（受信信号）を処理して、例えば、音声信号や同調誤差を示す同調誤差信号を出力する。ＤＳＰ１３が実行する処理の内容については、後述する。
【００２７】
Ｄ／Ａ変換器１４は、ＤＳＰ１３のデジタル出力信号（音声信号）を、アナログ信号に変換して出力する。
アンプ１５は、Ｄ／Ａ変換器１４の出力するアナログ信号を増幅して、出力する。
スピーカ１６は、アンプ１５からの電気信号を空気信号（音声信号）に変換して出力する。
出力端子１７は、外部の端子が着脱可能に構成され、外部回路にアンプ１５からの信号を出力する。
【００２８】
制御部１８は、ＣＰＵなどから構成され、操作部１９からの指示に応答して、受信回路１１の同調周波数、ＤＳＰ１３の処理動作モード、アンプ１５の増幅率、等を制御する。特に、制御部１８は、ＤＳＰ１３の出力する同調誤差信号に従って、同調回路に指示した同調周波数を調整（変更）する。
【００２９】
操作部１９は、ユーザの操作に応答して、受信回路１１に、受信周波数等を指示し、また、ＤＳＰ１３に種々の指示を与える。
【００３０】
次に、図１に示す受信機１０が実施する同調方法を、図２のフローチャートを参照して説明する。
なお、以下の動作の説明において、動作の主体は、主に、制御部１８とＤＳＰ１３である。ただし、理解を容易にするため、他の部材の動作を合わせて説明することがある。
【００３１】
制御部１８は、例えば、操作部１９からの指示に応答して、受信機１０を起動し、図２のフローチャートに示す同調方法を開始する。
まず、制御部１８は、この同調方法をステップ１０で開始し、まず、受信機１０を目的周波数に同調させるために初期化する。
【００３２】
初期化後、ＤＳＰ１３は最初の音声レコードの収集を開始する（ステップ１２）。続いて、音声レコードが終了、すなわち完了したかどうかを判定し、音声レコードが終了したと判別すると、次の音声レコードの収集を直ちに開始し（ステップ１６）、さらに、収集した音声レコードへの信号処理を開始する（ステップ１８）。
【００３３】
ＤＳＰ１３は、連続的な音声の収集と収集した音声の処理を、１つの音声レコードを処理している間に、次の音声レコードを収集するように行う。すなわち、音声信号の信号処理は、音声入力部分が信号処理の間に欠落しないように、他の音声レコードを得ることを終えていなくてはならない。ＤＳＰ１３が実行する信号レコードの信号処理は、図３に概略的に示される。まず、ＤＳＰ１３は、（任意に）最初の音声フィルタリングを行う（ステップ２０）。それから時間領域処理（ステップ２２）、周波数領域処理（ステップ２４）と相関領域処理（ステップ２６）を行う。
【００３４】
音声フィルタリング（ステップ２０）は、所望の音声あるいは信号が通過している間に、デジタル信号からＤＣ成分と高周波数ノイズを除去するものである。これらの不要成分を他の方法で除去するようになっていれば、このステップは割愛してもよい。
【００３５】
時間領域処理（ステップ２２）は図４に概略的に示され、話者の声道（フォルマント）効果を取り除く「スペクトル・フィルタリング」として音声処理の専門家にはよく知られている。いずれのスペクトル・フィルタリング技術でも、この発明を用いることができる。好適な実施形態において、中央クリッピング（ステップ２８）は音声から声道効果を取り除くために用いる。しかしながら、ラジオを自動的に同調する方法でのスペクトル・フィルタリングは新規なものである。
【００３６】
図７は、中央クリッピングを時間領域で実施した形態のグラフを示す。音声レコードでの原音声を曲線Ａで表わし、中央クリップ後の音声を曲線Ｂで表わす。
時間領域中央クリッピングは図７に示され、次のように定義される。
【００３７】
Ｙ（ｔ）＝０ │ｘ（ｔ）│≦ｃｌｉｐのとき
Ｙ（ｔ）＝ｘ（ｔ）−ｃｌｉｐｘ（ｔ）＞ｃｌｉｐのとき
Ｙ（ｔ）＝ｘ（ｔ）＋ｃｌｉｐｘ（ｔ）＜−ｃｌｉｐのとき
【００３８】
最大振幅の割合であるクリップ水準を設定する様々な方法が音声処理で用いられる。しかしながら、最大振幅に基づくクリッピング水準を用いると、高周波数ＳＳＢ信号での雑音スパイクを強調することになる。発明者の研究により、２つの他の基準が信号特性、ＲＭＳ（二乗平均平方根）とＭＡＤ（平均絶対偏差）により適合することが分かった。雑音スパイクは高い振幅であるが低エネルギ−なので、ＲＭＳ基準は閾値水準への雑音スパイクの影響は最小限になる傾向がある。好適な実施形態では、ＲＭＳ水準の３０％が最善なクリッピング水準である。ただし、他の基準値を使用することも可能である。
【００３９】
ウインドウ化（窓掛け）（ステップ３０）は、周波数領域での最善結果を生じさせるために用いる。ウインドウ化自体は、信号処理の分野では一般に知られているが、受信機を同調のアプリーションに適用することは知られていない。定常信号分析では、ウインドウの長さは要求される周波数領域分解能に基づいて選択される。受信機が同調を行ったとき、周波数領域分解能は関係せず、短いウインドウは音声信号の非定常特性にもかかわらずピッチ推定のために必要な定常状態を近似するために用いられる。しかしながら、長いウインドウはピッチ、特に低ピッチを有する男性話者のピッチをより正確に推定するために望まれる。好適な実施形態では、４０ｍｓｅｃウインドウを用いる。ただし、ウインドウの長さは、これに限定されるものではなく、他の長さでもよい。
【００４０】
第２に、ウインドウ関数の形態は、ウインドウの周波数変換が相関領域にて実行されるウインドウ補正を可能にするために全ての周波数で負でないことを確実にするため選択することができる。ディック（Dick）方法のような同調方法の従来技術でのかかる訂正をしない相関領域でのウインドウ関数の好ましくない効果は、実際のピッチでピークを減衰させるので、ピッチ周波数の推定が高過ぎることが予想される。
【００４１】
ここでのウインドウの例は、周波数領域では常に正であり、それらの相関領域効果は補正が容易な三角形ウインドウである。周波数変換はｓｉｎ^２ｆ／ｆ²形態を有する。かかる三角形ウインドウが好ましいウインドウであるが、他のウインドウもこの発明に用いることができる。
【００４２】
ウインドウ漏れに関して、短時間ウインドウ化は、周波数領域では大きな漏れを引き起こす。このような漏れは周波数オフセット推定では誤差の原因になる。この発明に従ったアルゴリズムは、相関振幅関数のピークで、位相は周波数同調誤差によって決定されることだけを前提にする。しかしながら、このアルゴリズムはオフセットピッチ周波数の近傍にある周波数でエネルギーがないときにだけ正しい。
【００４３】
他の実施形態では多数の幅ウインドウを用いる。ピッチは上述したウインドウで最初に推定する。ピッチが正確な推定のためにはあまりにも低ければ（ウインドウにおいて約４サイクル未満）、レコード処理は約２倍の長さのウインドウで再開する。十分な処理能力が利用できるならば、この技術は同調周波数の補正を速くそして確実に行なう。受信機を同調するために多数のウインドウの利用は新規なものと確信する。
【００４４】
更に、音声信号の窓関数掛け（ウインドウ化）について考慮すべきことは、ウインドウを重ね合せるかどうかである。周波数変換前の時間レコードの重なりが定常状態信号の雑音低減を平均化することは当業者にはよく知られている。しかしながら、受信機同調に適用することは新規である。
【００４５】
例えば、受信機同調の先行技術は、ウインドウが５０％以上重ねられていないことが最善であることを示唆しており、従って、それが冗長すぎるということはない。複数の推定（評価）は統計的には独立していないので、重なり処理を雑音低減のために用いることは妥当なことである。しかしながら、この発明においては、重なり処理は、雑音低減のためではなく、ウインドウと短い有声音を自己整合させるために評価関数と併せて用いる。
【００４６】
重なり処理を実際のＳＳＢ受信信号に実行する場合、図８に示されるように、４０ミリ秒三角形ウインドウの７５％重なり（２５％遅れ）を用いて動作が最適化されることが分かる。音声信号は本質的には非常に変化し易く、短い有声音のウインドウの配置は、最良の同調誤差推定を推進する上で重要である。
【００４７】
好適な時間領域処理における最後のステップは、時間レコードをゼロ詰めにするためのものである（ステップ３０）。ゼロ詰めは自動相関領域でのエイリアシングを避けるための技術であり、自動相関処理の専門家にはよく知られている。しかしながら、ＳＳＢラジオを自動同調におけるピッチと周波数オフセットの推定確度の改善のためにゼロ詰めを行うことは新規なものと確信する。
【００４８】
順方向高速フーリエ変換（ＦＦＴステップ３２）は、時間領域信号を周波数に変換する信号処理技術であり、専門家にはよく知られている。ＦＦＴは周波数領域に変換するのに好適な実施形態であるが、離散フーリエ、離散コサイン、ウィグナー（Ｗｉｎｇｅｒ）、コーエン（Ｃｏｈｅｎ）、ガボール（Ｇａｂｏｒ）、およびウェ−ブレット（Ｗａｖｅｌｅｔ）変換のような他の変換も専門家には明白な他の変換方法としてこの発明に含まれる。
【００４９】
図５は周波数領域処理を概略的に示す。この処理はゼロに負の周波数成分を設定するものである（ヒルベルト（Ｈｉｌｂｅｒｔ）変換を用いてＳＳＢに変換するのと同じである）（ステップ３４）。ここで注意すべきことは、このステップはアルゴリズム入力がＩＦＳＳＢ信号からのものであれば必要がないということである。好適の実施形態である追加の周波数領域処理は、周波数領域での処理結果を振幅だけの信号に変換を行い（ステップ３６）、非ピッチに関連する成分を取り除く中央クリッピングを行い（ステップ３８）、そして、逆高速フーリエ変換の適用を行う（ステップ４０）。
【００５０】
受信機の音声応答の範囲外にあることを知られている低周波数又は高周波数での処理結果も連続推定において誤りを最小化するためにゼロに設定する。特に、電力線ハム音および高周波数雑音はこの動作によって取り除かれる。
【００５１】
（位相情報を取り除く）周波数領域処理結果の振幅変換（ステップ３６）はその結果から全ての絶対的時間情報を取り除くだけである。それ故、アルゴリズムは会話の開始時と終了時の音声レコードの間では区別することができず、全ての有声音は一様に処理される。振幅への変換は専門家には知られている様々な技術と類似技術のいずれかによって行なう。
【００５２】
周波数領域での中央クリッピング（ステップ３８）は、声帯によっては生成されない全ての音を取り除く。これは音声レコードのピッチと周波数オフセットの正確な推定を決定するために好ましい。これを行う１つの方法は、適切なクリッピング機能（上述した時間領域クリッピング機能と類似の方法で定義される）を用いるゼロに対する最大成分所定の割合、例えば、５％未満の全ての周波数成分を設定することである。図９は、周波数領域の中央クリッピングの効果を示す。
【００５３】
好適な実施形態において、中央クリッピング振幅データは相関領域に直接変換される。しかしながら、他の周波数領域処理はこのポイントで機能するが、この発明の範囲内に含まれる。
【００５４】
特に、更なる信号処理が振幅の対数を含むときには、当業者には知られている、ケプストラム（Ｃｅｐｓｔｒｕｍ）に類似する相関領域に処理結果をもたらす。振幅データは、また整数乗あるいは少数乗される。このことは、周波数領域ピークの振幅における差違を強調するかあるいは非強調する。
【００５５】
最後の周波数領域の処理の強調方法が、本発明の範囲内に含まれるので、周波数スペクトルはゼロ詰めと大きな逆周波数変換を使用できる。これは、時間サンプルレートを増やすことなく、改善されたピッチと周波数オフセット推定をもたらす相関領域での分解能を増大させる。
【００５６】
上述した中央クリッピングといずれかの追加の信号処理が周波数領域で実行されると、処理結果は逆高速フーリエ変換を適用して相関領域と呼ばれるタイムライク領域に戻る変換を行う（ステップ４０）。逆高速フーリエ変換は当業者にはよく知られている。前述した周波数領域変換のように、逆変換は離散フーリエ変換、離散コサイン、ウィグナー（Ｗｉｎｇｅｒ）、コーエン（Ｃｏｈｅｎ）、ガボール（Ｇａｂｏｒ）、およびウェ−ブレット（Ｗａｖｅｌｅｔ）変換のようなよく知られている他の変換によって実現でき、当業者には明白な他の変換方法と同じように、またこの発明に含まれる。
【００５７】
図６に概略的に示される相関領域処理の好適な実施形態は、ウインドウ効果を補正し（ステップ４２）、二乗化された相関振幅上の２次の回帰オーダによってピッチを推定し（ステップ４４）、ピッチ周波数で相関位相からオフセット周波数の推定（ステップ４６）を行う。
【００５８】
好適な相関領域処理における第１のステップはウインドウ効果の補正を行う（ステップ４２）。短時間の窓掛けは通常の声の非定常ピッチのため必要とされるが、相関領域ではいつも問題を引き起こす。特に、短い時間領域の窓掛けは、相関領域において低ピッチである男性話者の所望のピークを大きく減少させる。これを修正しないと、ピッチとオフセット周波数推定での全体誤差を大抵引き起こす。それ故、相関領域でのウインドウ修正を実行する。このステップは完全に新規なものであり、従来技術を超える多大な利点をもたらす。
【００５９】
さらに具体的に、音声信号の時間領域ウインドウは増加τごとにロールオフとの相関を生じる。ピッチと周波数オフセットの推定前にウインドウ効果を取り除くことを必要としないならば、望みがある。しかしながら、周波数領域における非直線動作のために、相関領域におけるウインドウ効果のシンプルな分析の数学的記述は記入することができない。幸いにも、測定された実際のウインドウ誤差への線形近似はピッチ範囲が約５０Ｈｚ〜約２５０Ｈｚでテスト波形を用いるときにうまくいく。
【００６０】
好適な実施形態において、相関領域でのウインドウの補正後、例えば、ピッチは最大振幅サンプルを決定することによって概略的に推定される。この推定が音声ピッチの通常範囲外であれば、音声レコードは破棄される。音声は、またピッチ倍増と呼ばれる音声処理の当業者には知られている現象をテストされる。ピークは、またピッチの２分の１と２倍で相関振幅と比較される。ピークの振幅がそれら周波数の４０％以上でなければ、音声レコードは捨てられる（４０％以外の値も使用可能である。）このステップは完全に新規で、受信機同調の従来技術を超える多大な利点をもたらす。
【００６１】
音声レコードの相関がそれらテストをパスすれば、ピーク振幅は最大振幅の位置補間に適合する曲線によってより正確に推定される。振幅ピーク位置は音声レコードを窓掛けしている間の音声ピッチ期間に対応する。当業者にはよく知られている多くの曲線適合ルーチンがある。それらはこの発明に用いられる。好適な実施形態において、計算負荷が小さいので、二乗化された相関振幅の第２の少なくとも二乗回帰が用いられる。この補間の複雑性は低減でき、あるいは受信音声信号のサンプルレートを増大することにより完全に推定された補間、あるいは周波数変換における増大された複雑性の費用において上述したように周波数領域にゼロ詰めを行うことができる。それらの変形はこの発明の範囲内に含まれる。
【００６２】
相関の計算値（デイック（Ｄｉｃｋ）方法）の間を補間するため放物線に適合する３点を用いることを提案する。これはこの発明に用いることができる。しかしながら、雑音と他の誤差に極めて敏感に反応する。
【００６３】
したがって、この発明の一実施形態によれば、放物線に適合する３点を用いる代わりに、正確さを改善するために二乗化された相関振幅のピークサンプルの中心周辺の５またはそれ以上の点に適合する回帰を用いて大きな利点を得ることができる。回帰技術は個々の点のどんな誤差も取り除くものである。位相関数はピークでの実数と虚数値の推定における小さな誤差に極めて敏感に反応するので、雑音を平坦にすることは極めて重要なことである。
【００６４】
最大相関振幅に対応するピッチ周期を見つけるために、最大値を見つけるための周知技術である上述の曲線適合の微分型が計算され、ゼロに設定される。
【００６５】
相関領域処理における最後のステップは相関振幅ピークで曲線適合からオフセット周波数を推定するためのものである（ステップ４６）。かさねて当業者にはよく知られている曲線適合技術のいずれもこの発明に用いられる。好適な実施形態において、位相は２次のオーダである、二乗化された相関振幅のピークサンプルの相関中央周囲の実数と虚数部分の５点最小二乗回帰によって推定し、そして最大ピークで推定される実数と虚数曲線適合から位相推定を計算すること、を再度用いて推定される。
実数と虚数推定から、周波数オフセットは次の式を用いて計算される；
【００６６】
ｆ_e＝ｆ_pａｒｃｔａｎ（ｉｍ／ｒｅ）／（２π）

ここで、ｆ_ｅ＝周波数オフセット
ｆ_ｐ＝ピッチ周波数
ｉ_ｍ＝ピークでの虚数成分
ｒ_ｅ＝ピークでの実数成分
【００６７】
代わりの実施形態において、相関領域への全体の変換は周波数領域での曲線適合によって取り除かれる。５点最小二乗回帰曲線方程式は周波数領域に変換ができる。計算された多項式係数の結果は相関領域における計算と同じであり、ピッチと周波数オフセット結果推定は各実施形態とも全く同じである。
【００６８】
これで信号処理（ステップ１８）を終了する。
図２の説明に戻る。最良なＳ／Ｎ比を有する有声音が音声レコードに在るかどうかを判別する（ステップ４８）。有声音がなければ、次の音声レコードが完成および一旦完成したかどうかの連続的な決定を行い、信号処理を次の音声レコードで開始する。
【００６９】
相関ピーク振幅が十分に大きくなければ、音声レコードは有声音を含んでいないとみなされるので、受信機同調誤差の推定に用いるべきではない。この判断は重要である。受信機音声信号は、受信機同調誤差に推定される多くの無効ノイズを増加する音声中の長い休止を含んでいるからである。
【００７０】
音響が与えられたときだけではなく、有声音あるいは無声音であっても判断することがこの発明では重要なことである。有声音は誤同調を推定するのに必要なピッチ情報を有し、非有声音はほとんどが雑音のようなものであり、自動同調のために不要な情報を有するものである。
【００７１】
上述したＤｉｃｋのチューニング方法においては、全てのタイムレコードは、誤同調周波数推定に影響を与え、唯一重みだけが、相関のピークのエネルギーである。言及していないが、以下の仮定に基づいている。無声音及びノイズは低い相関を有し、従って、重み付けされた効果は小さい。しかしながら、タイムレコードの多数は、ノイズか無声音であるので、これらは容易に累積され、誤同調エラーを推定する上で、大きな誤差の原因となる。
【００７２】
また、以下のことが見出された。それは、レコードに有音声があるか否かを判別する上で、重要なファクターは、全ての相関二乗値の和に対する相関ピーク値の二乗の割合を測定することである。
例えば、現実的な実施例において、この割合がおよそ０．３％未満であれば、測定は否定される。この値は、サンプルレートに依存する。０．３％という割合は、実験に基づいた、１１ＫＨｚのサンプルレートでの測定に基づいて選択された値である。
【００７３】
音声（スピーチ）レコードに、有声音が、有効なピッチレンジで良好なＳ／Ｎ比で存在し、スピーチレコード内で受信機が再同調されていない場合には、受信機は、評価関数は更新される（ステップ５０）。このステップは、全体に新規でありこの発明による特有の効果を与える。この評価関数により、先行技術で使用されているヒストグラムを用いる手法よりも、より正確に受信機同調エラーが推定値できる。
【００７４】
従来技術に使用されているヒストグラム技術では、多様な平均ピッチ振幅により受信機同調誤差推定がオフに戻ることがある。例えば、受信機同調誤差推定は１００Ｈｚ〜２００Ｈｚでオフされる。対照的に、この発明では、評価関数は５Ｈｚの精度である。５Ｈｚ誤差は聞き取れず、他方、１００Ｈｚ〜２００Ｈｚは極めて好ましくない。
【００７５】
評価関数は、推定受信機同調誤差からかけ離れた有声音は、大きな誤差として評価関数に寄与するように構成されている。それ故、最小の評価関数値を有する周波数は受信機同調エラーと見做すことができる。
評価関数は、十分な音声レコードが精密な受信機同調誤差を推定する処理がされたか否かの判断を容易なテストによって可能とするように、設定されている。
【００７６】
数学的に、評価関数は、むしろ受信機同調誤差の最小二乗推定であり、以下のように定義される：
【００７７】
Ｊ（ｆ）＝Σｗ_ｉ＊〔Ｉｎｔ（ｎ_ｉｐ_ｉ＋e_ｉ−ｆ）〕^２
ここで、
ｆ可能な受信機同調周波数誤差
ｗ_ｉ第ｉ番目レコードの二乗した相関最大電力
Ｉｎｔ直近の整数（切り捨てではない、丸め）
ｎ_ｉＩｎｔ（（ｆ−ｅ_ｉ）／ｐ_ｉ）、同調誤差のピッチ係数
ｐ_ｉ第ｉ番目の測定の推定オフセットピッチ
ｅ_ｉ第ｉ番目の測定の推定オフセット周波数
ｉ測定インデックス
【００７８】
この関数は、−９００〜＋１１００の整数ｆのアレーｊ（ｆ）を生成するために用いる（図１１を参照）。受信機同調誤差の最良推定はｊの全体の極小値を持ったｆである。なお、回路をＤＳＰに組み込む場合には、補足周波数を拡張するため、−１４００〜＋１５００程度の整数ｆのアレーを生成する関数とすることが望ましい。
【００７９】
他の重み付け関数と評価関数はこの発明の範囲内にある。また、ｆが所望のどんな周波数分解能にスケールできるということも留意すべきである。
【００８０】
評価関数を考慮したこと及び評価関数を上述のように構成したことの利点は、後述するアルゴリズムを終了する際、優れた基盤を形成することである。
【００８１】
ＳＳＢ自動同調プログラムにおいて、どれだけの音声測定が必要かを判別するために、第２の最良推定（次の最良最小値）の評価関数の割合は、全体最小値（最良推定値）で除される。この割合は、受信機同調誤差推定が他のどんな周波数より著しく良くなると見做すことができれば、Ｆテスト値より大きくなる。
【００８２】
Ｆテストは統計学の専門家にはよく知られている標準的な統計テストである。仮定の間の重要な差違を求めるために使用される他の統計テストも、この発明に使用可能である。しかしながら、ラジオを自動的に同調させる方法における統計テストの使用は新規なものと確信する。
【００８３】
その相違が所望の信頼度について固定的に大きくなければ、処理はレコードの最大数まで持続する。すなわち、テスト終了基準が合致しなければ、以前の結果を再計算することなく、評価関数を存続するために新たな測定を追加してテストを継続しやすい。
【００８４】
図１０は２つの異なる信頼水準のためのテストの数に対するプロットされた必要とされる比率のグラフを示す。Ｆ値は同調推定の決定に用いた測定数と信頼度に左右される。２つの評価関数の値の割合がＦより大きければ、同調推定の間に大きな差違があると結論せざるを得ない。
【００８５】
好適な実施形態において、与えられた信頼水準とサンプル数に対するＦ値は参照テーブルに載っている。Ｆ値はまたより小さいテーブルから補間あるいは測定数が多いときは下記のような近似式によって計算が行われる。
【００８６】
Ｆ〜ｎ／（ｎ−2）｛（4ｎ−4｝／（ｎ−4）／ｎ｝^１／２＋ｎ／（ｎ−2）

ここで、
ｙ〜ｔ−（2.30753＋0.27061ｔ）／（1＋0.99229ｔ＋0.04481ｔ^２）
および
ｔ＝｛−21ｎ（1−Ｐ）｝^１／２
【００８７】
前述のように、割合がＦテスト値を超えなければ、プログラムは音声時間レコード分析を継続する。アルゴリズムは音声ピッチの自然変位に左右されるので、少数の時間レコードでの受信機同調誤差の最良の推定の集中は極めてありそうもない。計算時間をセーブするために、好適な実施形態では、信頼テストは評価関数が１００回更新されたときだけに実行する。それでテストは、各追加の５０評価関数が許容最大レコード数まで更新された後に実行される（ステップ５２）。他のレコード数と更新数を使用することも可能である。
【００８８】
次の音声レコードが終了と以前終了したかどうかを連続的に判定する。信号処理は、良好な信号対雑音と干渉比を有する有声音の存在の継続的な判定とともに次の音声レコードの信号処理を開始する。
【００８９】
５０の追加の更新が得られたとき、判定は、結果、つまり更新評価が統計的に重要かどうかに応じて行われる（ステップ５４）。
結果が重要であった場合には、制御部１８は、受信回路１１を同調する（ステップ５６）。
【００９０】
結果が重要でなかった場合には、つまり、最良の同調推定と第２の最良の同調推定の間の評価関数値にわずかな差違しかなければ、決定は、最大レコ−ド数に達したかどうかで行う（ステップ５８）。達していなければ、決定は、収集された音声レコードが終了したかどうかで行い（ステップ１４）、この方法は良好な信号対雑音と干渉比を有する有声音を含む新たなレコードの追加セットを得ることを続行する。最大レコ−ド数に達していれば、伝送はこの発明に従った同調ができず、処理は停止する（ステップ６０）。
【００９１】
この発明は、上述したいずれの実施形態においても、自動同調方法の従来技術を超えた改善であり、そこで固定されたテスト回数は考慮される。固定されたテスト回数を考慮すれば、受信機の結果は不正確な周波数に大抵同調することになる。テスト回数の増加はエラー回数を減少させるが、多くの推定のためには、回数が増加してしまう。
【００９２】
なお、受信機１０の好適な実施態様はＳＳＢラジオである。しかしながら、パーソナル・コンピュータ、ＰＤＡおよびカスタム外部ハードウェアを含む他の装置での実施もこの発明の範囲内にある。
【００９３】
さらに、受信機１０として、中間周波数を処理するデジタル信号処理装置（ＤＳＰ）を備えた構成を例示したが、ＲＦおよびＩＦＤＳＰ処理装置を備えたものでもよい。また、伝統的なアナログ型ラジオにも適用可能である。
【００９４】
さらに、この発明は、音声信号がデジタル形式であっても、あるいはアナログ形式であっても、実施できる。また、この発明の範囲内には、ＳＳＢ復調器の前に、アナログ形式あるいはデジタル形式で、中間周波数と呼ばれている音声信号の処理装置が含まれる。
【００９５】
好適な実施形態において、復調音声信号はアナログ形式とかデジタル形式のいずれかでこの発明に投入される。信号処理がＤＳＰで実施される場合は、通常、以下に記述するＡＤＣとフイルタリング・ステップを設ける必要はない。
【００９６】
音声信号はナイキスト周波数より大きい周波数でサンプルされなければならないことは、デジタル信号処理の当業者には理解される。ＳＳＢ受信機は音声信号を、通常、最大周波数３ＫＨｚでフィルタリングする。従って、サンプリング周波数は、通常、６ＫＨｚ以上でなくてはならない。相関領域における分解能を改善するために、サンプリング周波数をさらに増加してもよい。これにより、ピッチ及び周波数オフセットの推定を改善することができる。また、相関領域は畳み込み領域と呼ばれることもある。
【００９７】
好適な実施形態では、少なくとも１１ＫＨｚのサンプルレートを用いているが、他のサンプルレートを用いることも、この発明の範囲内にある。
【００９８】
この発明の特別な実施形態を図示し、記述したが、その変更と修正は、より広範な態様において発明から逸脱することなく実施できることは当業者には明らかである。それ故、添付の特許請求の範囲の狙いはこの発明の真の精神と範囲内にある全てのかかる変更と改良を対象とすることである。
【図面の簡単な説明】
【００９９】
【図１】この発明の実施形態に係る受信機の構成を示すブロック図である。
【図２】図１に示す受信機を同調する方法の動作を示すフローチャートである。
【図３】図２における信号処理ブロックの詳細を示すフローチャートである。
【図４】図３における時間領域処理ブロックの詳細を示すフローチャートである。
【図５】図３における周波数領域処理ブロックの詳細を示すフローチャートである。
【図６】図３における相関領域処理ブロックの詳細を示すフローチャートである。
【図７】時間領域中央クリッピング効果を示すグラフである。
【図８】７５％オーバラップ三角形窓を示すグラフである。
【図９】周波数領域中央クリッピング効果を示すグラフである。
【図１０】この発明の実施形態に従った同調方法において用いられるＦテスト分配のチャートである。
【図１１】同調推定を示す評価関数のチャートである。
【符号の説明】
【０１００】
１０受信機
１１受信回路
１２Ａ／Ｄ変換器
１３ＤＳＰ
１４Ｄ／Ａ変換器
１５アンプ
１６スピーカ
１７出力端子
１８制御部
１９操作部

【特許請求の範囲】
【請求項１】
受信機を同調する方法であって
音声信号を取得し、
取得した前記信号を時間領域において処理し、
時間領域で処理した前記信号を周波数領域に変換し、該周波数領域における前記信号を信号変更のために処理し、
周波数領域で処理した信号を周波数領域から相関領域に変換し、相関領域における前記信号を処理し、
相関領域で処理された前記信号を解析して受信機同調誤差を決定し、
前記時間領域における信号処理は、前記信号を中央クリッピングすることにより、スペクトル平坦化する処理を含み、
前記周波数領域における信号処理は、時間情報を取り除くために、振幅を示す信号に変換し、変換後の信号をスペクトル平坦化する処理を含み、
前記相関領域での信号処理は、前記時間領域での信号処理のために信号を補正するステップと、前記相関領域での信号のピーク振幅の位置を決定し、それに基づいてピッチとオフセット周波数とを算定するステップを含む、
ことを特徴とする受信機を同調する方法。
【請求項２】
前記信号を、二乗平均平方根（ＲＭＳ）あるいは平均絶対偏差基準に基づいて信号のクリップ水準を決定して、時間領域において中央クリッッピングする、請求項１に記載の受信機を同調する方法。
【請求項３】
前記信号を時間領域で中央クリップし、前記時間領域での信号処理ステップは前記中央クリップされた信号をウインドウ化し、ウインドウ化された中央クリップ信号をゼロパッドすることを有する請求項１又は２に記載の受信機を同調する方法。
【請求項４】
前記中央クリップ信号のウインドウ化処理は、信号ピッチの初期推定値に基づいてウインドウの長さを選択する、ことを有する請求項３に記載の受信機を同調する方法。
【請求項５】
前記中央クリップされた信号のウインドウ化ステップは、三角形のウインドウを用いる、ことを有する請求項３又は４に記載の受信機を同調する方法。
【請求項６】
前記中央クリップされた信号のウインドウ化ステップは、所定の周期で新たな時間レコ−ドを取得する重ね処理を用いること、を有する請求項３、４又は５に記載の受信機を同調する方法。
【請求項７】
前記周波数領域での信号振幅を、不要な雑音を取り除くために、中央クリッピングすることを、更に有する請求項１乃至６のいずれか１項に記載の受信機を同調する方法。
【請求項８】
前記時間領域での信号処理は前記信号をウインドウ化し、前記時間領域での信号処理のための補正は、前記時間領域での信号処理による悪影響を補正することを、有する請求項１乃至７のいずれか１項に記載の受信機を同調する方法。
【請求項９】
前記相関領域における信号処理は、少なくとも５点の放物線回帰を用いる曲線に、信号を適合させることを、更に特徴とする請求項１乃至８のいずれか１項に記載の受信機を同調する方法。
【請求項１０】
前記相関領域での信号処理は、前記相関領域での信号のピーク振幅の位置を決定し、それに基づいてピッチとオフセット周波数とを算定することを、更に有し、
この算定ステップでは、前記ピーク振幅が有声音の閾値指標以上かどうかを判別し、閾値以上でなければ、処理した信号を無視する、ことを有する請求項１乃至９のいずれか１項に記載の受信機を同調する方法。
【請求項１１】
前記受信機同調誤差を判別するために、前記相関領域に在る前記処理された信号を分析するステップは、前記ピーク振幅が閾値以上の場合、前記相関領域に在る前記処理された信号から評価関数を形成し、前記評価関数は、推定された受信機同調誤差から遠いほど有声音が大きな誤差に寄与するように形成する、ことを有する請求項１０に記載の受信機を同調する方法。
【請求項１２】
前記評価関数は、最小二乗推定値を求める関数である、ことを有する請求項１１に記載の受信機を同調する方法。
【請求項１３】
前記評価関数は、相関ピーク電力の合計処理電力に対する割合によって重み付けされた受信同調誤差の最小二乗推定値を求める関数である、ことを有する請求項１１に記載の受信機を同調する方法。
【請求項１４】
前記受信機同調誤差を決定するための前記相関領域に在る前記処理信号の分析は、統計的に有効な差違が、評価関数から導出される受信機同調誤差の第１と第２の推定値の間に在るかどうか決定し、在る場合には、第１の推定値を受信機同調誤差とする、請求項１１に記載の受信機を同調する方法。
【請求項１５】
前記受信機同調誤差の第１と第２の推定値の間に統計的な大きな差違がない場合には、追加の受信音声信号が処理される、請求項１４に記載の受信機を同調する方法。
【請求項１６】
前記受信機同調誤差を決定するために前記相関領域に在る信号の分析は、受信音声信号の数が処理される分設定されたかを決定し、受信音声信号の数が処理される分設定されたときにだけ、評価関数から導出される前記受信機同調誤差の第１と第２の推定値の間に統計的に大きな差違が在るか否かを決定することを、更に有する請求項１４に記載の受信機を同調する方法。
【請求項１７】
音声信号の取得と音声信号の処理は一方の音声信号は処理され、他方の音声信号は取得されるように同時に実行される、ことを有する請求項１乃至１６のいずれか１項に記載の受信機を同調する方法。
【請求項１８】
音声信号を取得する取得手段と、
前記取得手段で取得した信号に、中央クリッピングすることによりそのスペクトル分布を平坦化する処理を含む時間領域での処理を施す時間領域処理手段と、
前記時間領域処理手段で処理した信号を周波数領域の信号に変換し、変換した信号から時間情報を取り除くために、振幅を示す信号に変換し、変換後の信号をスペクトル平坦化する処理を含む周波数領域での処理を施す周波数領域処理手段と、
前記周波数領域処理手段で処理した信号を相関領域の信号に変換し、前記時間領域での信号処理のために補正し、前記相関領域での信号のピーク振幅の位置を決定し、それに基づいてピッチとオフセット周波数とを算定する処理を含む相関領域における信号処理を実行する相関領域処理手段と、
前記相関領域処理手段で処理された信号から同調誤差を判別する同調誤差判別手段と、
を備える受信機。
【請求項１９】
プロセッサを、
音声信号に、中央クリッピングすることによりそのスペクトル分布を平坦化する処理を含む時間領域での処理を施す時間領域処理手段、
前記時間領域処理手段で処理した信号を周波数領域の信号に変換し、変換した信号から時間情報を取り除くために、振幅を示す信号に変換し、変換後の信号をスペクトル平坦化する処理を含む周波数領域での処理を施す周波数領域処理手段、
前記周波数領域処理手段で処理した信号を相関領域の信号に変換し、前記時間領域での信号処理のために補正し、前記相関領域での信号のピーク振幅の位置を決定し、それに基づいてピッチとオフセット周波数とを算定する処理を含む相関領域における信号処理を実行する相関領域処理手段、
前記相関領域処理手段で処理された信号から同調誤差を判別する同調誤差判別手段、
として機能させるプログラム。

【図１】