音処理装置

【課題】比較的簡素な演算プロセスを用いて音環境の分類を行い、その結果を音処理に反映させる。
【解決手段】音処理装置（補聴器）１０は、マイクロホン１４を通じて入力された音データを前処理するデータ処理部３２と、音データから特徴パラメータを演算する特徴パラメータ演算部３６と、特徴パラメータを用いて判別分析による分類演算を行う分類クラス演算部３８と、分類演算の結果に基づいて音環境を識別する識別部４０と、識別された音環境に応じて信号処理のパラメータを設定するパラメータ設定部２４と、設定されたパラメータを用いてイヤホン１８に出力する音の出力特性を調整する信号処理部２２とを備える。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、出力しようとする音の特性を各種の音環境に応じて自動的に調整する機能を有した音処理装置に関する。ここで、音環境とは、マイクロホンに入力される全ての音について、聴取したい音声の有無、その他の音の発生源の種類と数、距離、分布状態等の音の発生状況や、障害物の有無、風、気温等の音に伝達に影響を与える要素の状況を総合した環境をいう。
【背景技術】
【０００２】
例えば従来、音声処理の技術分野において、ロバストな音声分類を実現するための方法が知られている（例えば、特許文献１参照。）。この先行技術は、各種の条件下で音声についての複数の特徴パラメータを評価し、各種の音声モードを高精度で分類しようとするものである。この先行技術で分類しようとする各種の音声モードには、例えば会話の過渡部、活動状態の音声への遷移、単語の終端部における有声音、無声音、そして無音といった数多くの態様が含まれる。さらに先行技術は、周囲のノイズレベルが変化する音環境においても、各種の音声モードを分類する手法について開示している。
【０００３】
上記の先行技術に示されているように、音声モードを分類し、その結果に応じた音声処理を行うことは、音声そのものの伝達を目的とした通信手段（例えば電話）にとって有用であると考えられる。このような通信手段とは別に、音声を含めた周囲音（環境として存在する雑音を含む）をも伝達しようとする音処理技術にとっては、音声モードの分類とはまた違った観点が要求される。
【０００４】
例えば、補聴器における信号処理（以降、「補聴処理」という。）の技術分野において、補聴器における音の分類に有用な音環境の分析手法に関する報告がなされている（例えば、非特許文献１参照。）。この報告では、補聴器に入力されてくる音データを時間帯で分割し、各時間帯別に抽出した周波数成分の分布態様から音環境としての特徴量を求めることが示されている。この場合、求めた特徴量を事前に用意しておいたデータと比較すれば、現在の音環境をある程度まで分析することが可能である。このようにして分析された音環境の結果は、補聴器で行われる補聴処理にも反映させることができる。
【先行技術文献】
【特許文献】
【０００５】
【特許文献１】特表２００４−５１５８０９号公報
【非特許文献】
【０００６】
【非特許文献１】”ＳｏｕｎｄＣｌａｓｓｉｆｉｃａｔｉｏｎｉｎＨｅａｒｉｎｇＡｉｄｓＩｎｓｐｉｒｅｄｂｙＡｕｄｉｔｏｒｙＳｃｅｎｅＡｎａｌｙｓｉｓ” ＥＵＲＡＳＩＰＪｏｕｒｎａｌｏｎＡｐｐｌｉｅｄＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇ２００５：１８，第２９９１−３００２頁
【発明の概要】
【発明が解決しようとする課題】
【０００７】
先に挙げた先行技術（特許文献１）の手法は、特に音声モードの分類に特化したものであるから、音声のみの伝達に関しては有効であると考えられる。しかし、補聴処理のように音環境をも含めた音の伝達に関して、音声モードだけの分類を行うだけでは不充分である。
【０００８】
一方、後に挙げた報告（非特許文献１）は、補聴処理等の音処理技術にとって直接的に有用なものであると考えられる。しかし、上記の報告で示されている分析手法は、特徴量を求める過程で極めて複雑かつ膨大な量の演算処理を必要とするという問題がある。
【０００９】
そこで本発明は、比較的簡素な演算プロセスを用いて音環境の分類を行い、その結果を音処理に反映させることができる技術の提供を課題とする。
【課題を解決するための手段】
【００１０】
上記の課題を解決するため、本発明は以下の解決手段を採用する。
すなわち本発明は、音環境の識別に際して判別分析の手法を採用している。判別分析の手法には、入力音から抽出した複数の特徴パラメータを用いることができる。特に判別分析の手法は、一般的に線形のベクトル演算プロセスが中心であるため、比較的簡素な演算処理で音環境を識別することができる。その結果、識別した音環境に応じて出力音の出力特性を調整すれば、各種の音環境に応じて適切な音処理を迅速に実現することができる。
【００１１】
また出力特性の調整には、予め音環境別に記憶しておいたパラメータを用いることができる。すなわち、入力音から音環境を識別すると、予め記憶しているパラメータの中から識別された音環境に対応する適切なパラメータの設定を調節して、出力音の出力特性を調整する。これにより、識別された音環境に合わせて出力特性を自動的に最適化することができる。
【００１２】
本発明において、入力音から抽出される複数の特徴パラメータには、少なくとも第１の特徴パラメータ群、及び第２の特徴パラメータ群が含まれる。このとき識別される複数の音環境には、少なくとも単独に分類される特定の音環境、及びその他として複数に分類される特定以外の音環境が含まれることとする。この場合、第１の特徴パラメータ群を用いて判別分析を行った結果、その入力音が特定の音環境であると識別できた場合、第２の特徴パラメータを用いて判別分析を行うことなく、音環境の識別を終了するこができる。
【００１３】
この場合、全ての音環境について同時並行的に識別を行う必要がなく、特定の音環境についての識別が得られた場合、その時点で以後の処理をキャンセルすることができる。これにより、音環境の識別に要する処理負担を軽減し、作業の効率化（限られたハードウエア資源の有効活用）を図ることができる。
【００１４】
特徴パラメータは、所定時間内に入力された入力音の時間帯を表す「時間」の要素と、前記時間帯別の周波数スペクトルを表す「周波数」の要素と、前記周波数帯別の音圧レベルを表す「音圧」の要素とから構成される三次元のデータから算出することができる。
【００１５】
上記の三次元データを用いることで、上記の報告（非特許文献１）に示されるようなある時点における周波数特性データを用いる場合に比較して、周波数特性の時間変化をより一層考慮した音環境の識別をさせることができる。これにより、出力特性の調整をより最適化しつつ、利用者にとって快適な出力音を得ることができる。
【００１６】
本発明による判別分析に用いる分類関数は、予め複数の既知である音環境からそれぞれ発せられた入力音のスペクトログラムを画像処理して抽出された複数の特徴パラメータに基づいて、予め設定しておく。
【００１７】
判別分析に画像処理の手法を使って抽出した特徴量を用いることで、音環境の特徴を画像の特徴量として捉えることができる。またスペクトログラムは、１つ１つの画素が二次元の座標を表すだけでなく、画素の値（濃度値）を表すことができるため、三次元データを視覚的に捉える対象（媒体）として好適である。これにより、判別分析に用いる分類関数を構築する作業（オフライン作業）においても、作業者にとって直感的で捉えやすい作業を行うことができる。
【発明の効果】
【００１８】
本発明の音処理装置によれば、演算プロセスを簡略化して処理負担を軽減しつつ、より正確な音環境の識別結果を得ることができる。
【図面の簡単な説明】
【００１９】
【図１】音処理装置の第１実施形態である補聴器の構成例を概略的に示す斜視図である。
【図２】補聴器に内蔵されている各種電装品とその機能上の構成を概略的に示したブロック図である。
【図３】前処理された入力音データの構造例とその可視画像の例を示した図である。
【図４】特徴パラメータ演算部で実行される特徴パラメータ演算処理の手順例を示すフローチャートである。
【図５】特徴パラメータ演算処理の中で実行される二値化処理の様子を可視画像として表した図である。
【図６】特徴パラメータ演算処理の中で作成される垂直方向ヒストグラムの例を可視画像として表した図である。
【図７】特徴パラメータ演算処理での特徴パラメータｆ_３の算出手法を模式的に表した図である。
【図８】特徴パラメータ演算処理の中で作成される濃度ヒストグラムの例を可視画像として表した図である。
【図９】特徴パラメータｆ_７〜ｆ_１５の演算用に取得される二値変換後のデータを可視画像として表した図である。
【図１０】特徴パラメータｆ_１〜ｆ_１５を用いた判別分析の手順例を示すフローチャートである。
【図１１】第２実施形態となる補聴器の構成例を概略的に示したブロック図である。
【図１２】音処理装置を録音装置として実施した場合の構成例を示すブロック図である。
【図１３】音処理装置をオーディオプレーヤーとして実施した場合の構成例を示すブロック図である。
【発明を実施するための形態】
【００２０】
以下、本発明の実施形態について図面を参照しながら説明する。
【００２１】
〔第１実施形態〕
図１は、音処理装置の第１実施形態である補聴器１０の構成例を概略的に示す斜視図である。この補聴器１０は耳かけ型であり、補聴器１０はその本体１０ａのフック部分にジョイント付きチューブ１０ｂ及び耳せん１０ｃを接続して使用することができる。本体１０ａには、図示しないマイクロホンやイヤホン、電池の他に、音処理用ＩＣが内蔵されている。なお、ここでは耳かけ型の補聴器１０を例に挙げているが、耳あな型やポケット型の補聴器を第１実施形態としてもよい。
【００２２】
また、本体１０ａには通信コネクタ１０ｄが内蔵されており、この通信コネクタ１０ｄは本体１０ａの内部で上記の音処理用ＩＣに接続されている。通信コネクタ１０ｄは通常、コネクタカバー１０ｅで覆われているが、図１に示されているように、コネクタカバー１０ｅを開くと通信コネクタ１０ｄが露出し、そこに通信ケーブル１２を接続することができる。通信ケーブル１２は、例えば図示しないパーソナルコンピュータ（以下、「パソコン」と略称）に接続されており、これによりパソコンと音処理用ＩＣとの間でデータ通信（例えばシリアル通信）が可能となる。
【００２３】
図２は、補聴器１０に内蔵されている各種電装品とその機能上の構成を概略的に示したブロック図である。補聴器１０は主に、マイクロホン１４、音処理用ＩＣ１６及びイヤホン１８から構成されている。このうちマイクロホン１４は、図１に示される本体１０ａの内部で、例えば前方向（前よりの斜め上方向）から入力音を捕捉することができる位置に設けられている。またイヤホン１８は、同じく本体１０ａの内部で、フック部分に連通して出力音を発することができる位置に設けられている。
【００２４】
〔音処理用ＩＣの概要〕
音処理用ＩＣ１６は、例えば半導体集積回路（ＩＣチップ）を用いて実現されている。音処理用ＩＣ１６の構成には機能上、大きく分けて補聴処理部２０及び判別分析部３０が含まれている。また音処理用ＩＣ１６は、ＡＤＣ２６及びＤＡＣ２８を有している。また、その他に、音処理用ＩＣ１６はデータ処理部３２及びワークメモリ３４を有している。なお、ここでは特に図示していないが、ＡＤＣ２６の前段（マイクロホン１４との間）とＤＡＣ２８の後段（イヤホン１８との間）には、それぞれアンプが設けられている。
【００２５】
〔補聴処理部〕
補聴処理部２０は、信号処理部２２及びパラメータ設定部２４から構成されている。このうち信号処理部２２は、ＡＤＣ２６でデジタル変換された音信号を補聴処理する。具体的には、音信号の周波数帯域毎の増幅やダイナミックレンジの圧縮、ノイズリダクション、指向性（マイクロホン１４が複数ある場合）、ハウリング除去、出力制限等の信号処理が信号処理部２２で行われる。これら信号処理の内容は、使用者の聞こえ具合や用途（自宅用、会議用、雑踏用、音楽観賞用等）等に応じて決定される。
【００２６】
パラメータ設定部２４は、信号処理部２２で行われる信号処理に必要な各種パラメータを設定する。すなわち、パラメータ設定部２４は記憶領域を有しており、この記憶領域には、予め使用者の聞こえ具合や上記の用途別に、信号処理で用いられる各種パラメータ（例えば増幅率、圧縮率、ノイズリダクション機能の有無、指向性機能の有無、ハウリング除去機能の有無、出力制限機能の有無）を予め定めた設定情報が記憶されている。
【００２７】
設定情報は、例えばパソコン４４からパラメータ設定部２４に書き込むことができる。例えば、補聴器１０を店頭や工場で調整する場合、パソコン４４を接続してデータ通信を行い、上記の通信ケーブル１２及びＩ／Ｏ（入出力ドライバ）４２を通じてパラメータ設定部２４にアクセスすることができる。パソコン４４には調整用のアプリケーションが実装されており、この調整用アプリケーションを用いて各種のパラメータを調整し、パラメータ設定部２４に調整済みのパラメータを反映させることができる。
【００２８】
また各種パラメータは、例えば用途別に何通りかの「プリセットメモリ」として予めセットで記憶しておくことができる。識別部４０（後述）がいずれかの「プリセットメモリ」を選択することで、使用者の用途に応じて最適なパラメータの組み合わせを設定することができる。また選択される「プリセットメモリ」は、例えば図示しない操作スイッチ等の操作に応じて切り替えることができる。
【００２９】
〔判別分析部〕
判別分析部３０は、主に特徴パラメータ演算部３６、分類クラス演算部３８及び識別部４０から構成されている。判別分析部３０は、入力音のデータを用いて各種の演算を行い、その結果として最終的に現在の音環境を識別する機能を有している。前段のデータ処理部３２は、ＡＤＣ２６でデジタル変換された音信号の前処理を行い、判別分析部３０での演算に必要な構造の入力音データに加工する。
【００３０】
データ処理部３２で前処理された音信号は、例えば「時間」、「周波数」、「音圧」の三次元の入力音データに加工される。具体的には、データ処理部３２は入力された音信号をスペクトル分析し、これを時分割（例えば毎１０ｍｓ分割）して各時間帯における各周波数帯の音圧レベルをデータ化する。これにより、時系列を表す時間帯（時間ｘ）、周波数帯（周波数ｙ）、そして、各周波数帯の音圧レベル（音圧Ｉ［ｘ］［ｙ］）からなる三次元の入力音データが得られる。データ処理部３２は音信号のスペクトル分析や三次元データを構築するため、適宜ワークメモリ３４のメモリ空間を使用することができる。なおワークメモリ３４は、例えばＲＡＭ、ＲＷＭ等の半導体メモリで構成されている。
【００３１】
〔特徴パラメータ演算部〕
特徴パラメータ演算部３６は、三次元の入力音データから特徴パラメータｆ_１，ｆ_２，ｆ_３，ｆ_４，ｆ_５，ｆ_６，ｆ_７，ｆ_８，ｆ_９，ｆ_１０，ｆ_１１，ｆ_１２，ｆ_１３，ｆ_１４，ｆ_１５を算出する。なお、これら特徴パラメータｆ_１〜ｆ_１５の算出手法については、具体例を挙げてさらに後述する。本実施形態では、特徴パラメータｆ_１，ｆ_２，ｆ_３，ｆ_４，ｆ_５，ｆ_６，ｆ_７，ｆ_８，ｆ_９，ｆ_１０，ｆ_１１，ｆ_１２，ｆ_１３，ｆ_１４，ｆ_１５を用いて説明するが、特徴パラメータの選択は適宜なされればよく、権利範囲はこれに限定されない。
【００３２】
〔分類クラス演算部〕
分類クラス演算部３８は、特徴パラメータｆ_１〜ｆ_１５を用いて分類関数による分類クラス演算を行う。このとき演算に使用される分類関数は、例えばパソコン４４から予め分類クラス演算部３８に設定されている。また分類関数は、特徴パラメータｆ_１〜ｆ_１５を説明変量としたマハラノビス距離による判別分析（正準判別分析）を行うための関数として、その定義が予め判別分析の手法に則って定められている。
【００３３】
〔識別部〕
識別部４０は、分類クラスの演算結果から入力音がいずれの音環境であるかを識別する。この実施形態において音環境は、例えば以下の４つに予め分類されているものとする。
（１）「静かな環境での会話」・・・例えば、居室内等の静かな場所で会話が行われる音環境である。この実施形態では、会話の音声に対して、例えばＳ／Ｎ比が３０ｄＢ〜５８ｄＢのホワイトノイズ又はマルチトーカーノイズが付加される程度の音環境とする。
（２）「うるさい環境での会話」・・・例えば、駅構内や交通量の多い路上等で会話が行われる音環境である。この実施形態では、会話の音声に対して、例えばＳ／Ｎ比が０ｄＢ〜２８ｄＢのホワイトノイズ又はマルチトーカーノイズが付加される程度の音環境とする。
（３）「うるさい環境」・・・例えば、駅構内や交通量の多い路上、工場内、工事現場等で特に音声が発せられていない音環境である。
（４）「音楽」・・・例えば、コンサートホールや室内での音楽鑑賞、再生された音楽の鑑賞が行われる音環境である。この実施形態では、例えばホワイトノイズやマルチトーカーノイズ等が存在しない音環境とする。
【００３４】
〔識別結果の反映〕
識別部４０で識別された音環境（１）〜（４）の結果は、補聴処理部２０に対して反映させることができる。すなわち、パラメータ設定部２４には、音環境（１）〜（４）のそれぞれについて最適なパラメータが予め設定されており、識別部４０から現在の音環境の情報が伝達されると、パラメータ設定部２４で音環境（１）〜（４）に応じたパラメータが選択される。これを受けて、信号処理部２２は現在使用しているパラメータを変更して信号処理を行う。
【００３５】
〔出力音の出力特性〕
これにより、イヤホン１８から出力される出力音は、使用者の聞こえ具合や用途に加え、補聴器１０の使用者が居る場所の音環境に応じて最適化された出力特性を有したものとなる。このとき得られる出力特性には、予め用途に応じて「プリセットメモリ」に設定されていたパラメータの他に、識別された音環境に応じてカスタマイズされたパラメータを用いた信号処理の結果が反映されている。
【００３６】
〔特徴パラメータの算出手法〕
次に、特徴パラメータｆ_１〜ｆ_１５の算出例について説明する。特徴パラメータ演算部３６で行われる特徴パラメータｆ_１〜ｆ_１５の算出には、上記のようにデータ処理部３２で前処理された三次元の入力音データが用いられる。
【００３７】
〔入力音データ〕
図３は、前処理された入力音データの構造例とその可視画像（スペクトログラム）の例を示した図である。なお図３中（Ａ）は入力音データの構造例を示し、図３中（Ｂ）はその可視画像の例を示している。
【００３８】
〔データ範囲〕
図３中（Ａ）：前処理された入力音データは、上記のように「時間ｘ」、「周波数ｙ」、「音圧Ｉ［ｘ］［ｙ］」の三次元で表される。この構造例では、左カラムに「時間ｘ」の数値を配置し、中カラムには「周波数ｙ」の数値を配置し、そして右カラムには「音圧Ｉ［ｘ］［ｙ］」の数値を配置している。なお図中の数値はいずれも１６進表記である。このとき、データの範囲をそれぞれ以下に規定する。
０≦ｘ≦４９９（毎１０ｍｓ分割で５．００秒間分）
０≦ｙ≦３１（毎１２５ｋＨｚの帯域分割で０〜４０００Ｈｚ）
０≦Ｉ［ｘ］［ｙ］≦２５５（音圧レベルを２５６段階）
上記のデータ範囲から、（５００×３２）行×３列のデータを構成することができる。
【００３９】
〔可視画像〕
次に図３中（Ｂ）は、三次元構造の入力音データを可視化して表したグレースケール画像の例である。このグレースケール画像は、例えばｘ方向が時間の経過（１ピクセルが１００ｍｓ）を表しており、また、ｙ方向が周波数帯（１ピクセルが１２５ｋＨｚ）を表すとともに、各画素の濃度値Ｉ［ｘ］［ｙ］が各時間帯及び各周波数帯の音圧（２５６階調）を表している。なお音圧については、濃度値Ｉ［ｘ］［ｙ］が０のときを無音とし、濃度値Ｉ［ｘ］［ｙ］が２５５のときを最大音圧とする。また、ここでは日本人女性の話し声から得られた入力音データを例に用いている。
【００４０】
ここで可視画像を例に挙げているのは、以下の背景による。すなわち、本発明の発明者等は、予め既知である各種の音環境から発せられた入力音の信号を上記のように三次元にデータ化し、これを可視画像として表すと、その画像データを画像処理することによって得られる数値を特徴パラメータとし、音環境を判別分析で識別するための分類関数を作成することが可能となることを見出した。すなわち、実際に得られた可視画像には、既知である音環境の違いによって見た目上にも顕著な差異が現れる。このような音環境別の差異は、それぞれの画像データから抽出した特徴量（特徴パラメータ）の傾向にも顕著に現れる。したがって、未知の音環境から発せられた入力音についても、これを三次元構造のデータに加工し、擬似的な画像と見立てた上で特徴量を抽出すれば、その特徴量を用いて音環境を判別分析する手法を確立することができる。
【００４１】
上記のような発明者等の知見に基づき、この実施形態で使用する判別分析には、潜在的に画像データへの変換が可能な構造の入力音データ（図３中（Ａ））を用いることとしている。ただし、この実施形態において、実際に補聴器１０内で可視画像（図３中（Ｂ）等）を作成する必要はない。データ処理部３２等において入力音データを三次元構造に加工しているのは、あくまで今回の判別分析の手法に則って予め定義されている分類関数に対して特徴パラメータを適用するためである。
【００４２】
図４は、特徴パラメータ演算部３６で実行される特徴パラメータ演算処理の手順例を示すフローチャートである。特徴パラメータ演算処理を行う前に、予め既知である各種の音環境から発せられた入力音の信号を用いて分類関数をパソコン４４で作成し、この分類関数を分類クラス演算部３８に設定しておく。以下、特徴パラメータ演算処理について順を追って説明する。
【００４３】
ステップＳ１０：先ず特徴パラメータ演算部３６は、処理済データを取得する。具体的には、上記のようにデータ処理部３２にて前処理がなされた入力音データを取得する。なお処理済データの取得は、ワークメモリ３４のアドレスを指定するだけでもよい。この場合、音処理用ＩＣ１６のハードウエア構成上、特徴パラメータ演算部３６からワークメモリ３４へのアクセスが可能なアーキテクチャを採用していればよい。
【００４４】
ステップＳ１２：次に特徴パラメータ演算部３６は、二値化処理を実行する。この処理では、取得した処理済データに基づき、「音圧Ｉ［ｘ］［ｙ］」の値を０又は１に二値変換する。具体的には、以下の手順を実行する。
（１）例えば１０ｍｓ間隔でサンプリングされた５秒間分のデータについて、Ｉ［ｘ］［ｙ］の値が０であるデータを除いて全音圧データＩ［ｘ］［ｙ］の平均値μを求める。このとき平均値μは、５秒間分のデータを蓄積した後に算出するだけでなく、サンプリングのたびに（１０ｍｓ周期で）逐次更新してもよい。
（２）二値変換する際の閾値Ｔとして、平均値μに所定値α（例えば１０程度、または０でもよい。）を加算した値（Ｔ＝μ＋α）を用いる。そして、閾値以上の音圧データを「１」、閾値未満の音圧データを「０」に変換し、Ｉ_１［ｘ］［ｙ］とする。なお、所定値α＝１０は実験的に定められる値であり、その他の値を採用してもよい。
（３）二値変換後のデータを擬似的に（メモリ空間上の）画像データに見立てたとき、孤立点となる画素を４近傍法により消去する。具体的には、孤立点の画素に相当する値「１」の音圧データを「０」に書き換える。
【００４５】
ステップＳ１４：特徴パラメータ演算部３６は二値化処理から復帰すると、二値変換されたデータから垂直方向ヒストグラムＨ［ｙ］を作成する。入力音データに無音区間（３２行全ての濃度値が「０」の区間）がある場合、その無音期間を除いた区間を５秒分（５００ピクセル分）に引き延ばす。このためＨ［ｙ］は、例えば次式（１）で求められる。
【数１】

ここに、
ｔ：入力データから無音区間を除いた区間の秒数
とする。
【００４６】
〔特徴パラメータｆ_１の算出〕
ステップＳ１６：次に特徴パラメータ演算部３６は、垂直方向ヒストグラムＨ［ｙ］から特徴パラメータｆ_１を算出する。ｆ_１は、例えば次式（２）で求められる。
【数２】

ここに、
Ｈ［ｙ−１］＜Ｈ［ｙ］＞Ｈ［ｙ＋１］であれば、
ｇ（ｙ）＝Ｈ［ｙ］−Ｈ［ｙ−１］（Ｈ［ｙ＋１］−Ｈ［ｙ−１］≧０のとき）
ｇ（ｙ）＝Ｈ［ｙ］−Ｈ［ｙ＋１］（上記以外のとき）
とする。
またＨ［ｙ−１］＜Ｈ［ｙ］＞Ｈ［ｙ＋１］でなければ、
ｇ（ｙ）＝０
とする。
【００４７】
〔特徴パラメータｆ_２の算出〕
ステップＳ１８：また特徴パラメータ演算部３６は、垂直方向ヒストグラムＨ［ｙ］から特徴パラメータｆ_２を算出する。ｆ_２は、例えば次式（３）で求められる。
ｆ_２＝Ｈ［ｍａｘ］−Ｈ［ｍｉｎ］（３）
ここに、
ｍａｘ：Ｈ［ｙ］が最大のときのｙ
ｍｉｎ：Ｈ［ｙ］が最小のときのｙ
とする。
【００４８】
〔特徴パラメータｆ_３の算出〕
ステップＳ２０：さらに特徴パラメータ演算部３６は、二値変換後のデータから特徴パラメータｆ_３を算出する。ｆ_３は、例えば次式（４）で求められる。
【数３】

ここに、
Ｉ_１［ｘ−１］［ｙ＋１］＝０、かつ
Ｉ_１［ｘ＋１］［ｙ＋１］＝０、かつ
Ｉ_１［ｘ−１］［ｙ］＝０、かつ
Ｉ_１［ｘ］［ｙ］＝１、かつ
Ｉ_１［ｘ＋１］［ｙ］＝０、かつ
Ｉ_１［ｘ−１］［ｙ−１］＝０、かつ
Ｉ_１［ｘ］［ｙ−１］＝１、かつ
Ｉ_１［ｘ＋１］［ｙ−１］＝０
の場合、
Ｊ［ｘ］［ｙ］＝１、
その他の場合、
Ｊ［ｘ］［ｙ］＝０
とする。
【００４９】
ステップＳ２２：次に特徴パラメータ演算部３６は、二値化処理（ステップＳ１２）前の処理済データから濃度ヒストグラムを作成する。濃度ヒストグラムは、擬似的な画像データでみたとき、０〜２５５の濃度値Ｉ_１［ｘ］［ｙ］ごとにカウントした画素数で表される。なお、特徴パラメータ演算部３６が行う演算処理では、実際の画像データとしては現れてこない。
【００５０】
〔特徴パラメータｆ_４〜ｆ_６算出〕
ステップＳ２４：特徴パラメータ演算部３６は、濃度ヒストグラムから特徴パラメータｆ_４〜ｆ_６を算出する。
先ず、ｆ_４は、例えば次式（５）で求められる。
ｎ_ｉが最大値をとるとき、ｆ_４＝ｉ（５）
ここに、
ｉ：濃度値（０〜２５５）
ｎ_ｉ：濃度値ｉの画素数
とする。
【００５１】
次にｆ_５は、例えば次式（６）で求められる。
ｆ_４＝ｉのとき、ｆ_５＝ｎ_ｉ（６）
【００５２】
またｆ_６は、例えば次式（７）で求められる。
【数４】

ここに、
ｋ：ｎ_ｉ≠０のｉの個数
とする。
【００５３】
ステップＳ２６：次に特徴パラメータ演算部３６は、先のステップＳ１２で二値化処理を行ったときと同様の手順で二値化処理を実行する。ただし、二値化する際の閾値Ｔは、平均値μに所定値β（０でもよい。またはαと同じ値でもよい。α＝βとする場合は、ステップＳ２６を省略可。）を加算した値（Ｔ＝μ＋β）を用い、二値化したデータはＩ_２［ｘ］［ｙ］とする。
【００５４】
〔特徴パラメータｆ_７算出〕
ステップＳ２８：特徴パラメータ演算部３６は、ステップＳ２６のデータログ（ステップＳ２６を省略した場合は、ステップＳ１２で二値化処理を行ったときのデータログを取得する。）から特徴パラメータｆ_７を算出する。具体的には、データログの内容として４近傍で消去した孤立点の白画素数をカウントし、その値をｆ_７とする。
【００５５】
〔特徴パラメータｆ_８〜ｆ_１５算出〕
ステップＳ３２：特徴パラメータ演算部３６は、二値変換後のデータから特徴パラメータｆ_８〜ｆ_１５を算出する。
〔特徴パラメータｆ_８算出〕
具体的には、値「１」のＩ_２［ｘ］［ｙ］をカウントし、その値をｆ_８とする。このためｆ_８は、例えば次式（８）で求められる。
【数５】

【００５６】
〔特徴パラメータｆ_９算出〕
次に、ｙ方向について下半分領域の値「１」のＩ_２［ｘ］［ｙ］の数と上半分の値「１」のＩ_２［ｘ］［ｙ］の数との差を求め、その値をｆ_９とする。このためｆ_９は、例えば次式（９）で求められる。
【数６】

【００５７】
〔特徴パラメータｆ_１０算出〕
また、ｙ方向について下半分領域の値「１」のＩ_２［ｘ］［ｙ］をカウントし、その値をｆ_１０とする。このためｆ_１０は、例えば次式（１０）で求められる。
【数７】

【００５８】
〔特徴パラメータｆ_１１算出〕
ｘ方向のランレングスの数Ｘ［ｘ］［ｙ］をカウントし、その値をｆ_１１とする。ｆ_１１は、例えば次式（１１）で求められる。
【数８】

ここに、
Ｉ_２［ｘ］［ｙ］＋Ｉ_２［ｘ＋１］［ｙ］＝１の場合、
Ｘ［ｘ］［ｙ］＝１、
その他の場合、
Ｘ［ｘ］［ｙ］＝０
とする。
【００５９】
〔特徴パラメータｆ_１２算出〕
また、ｙ方向のランレングスの数Ｙ［ｘ］［ｙ］をカウントし、その値をｆ_１２とする。ｆ_１２は、例えば次式（１２）で求められる。
【数９】

ここに、
Ｉ_２［ｘ］［ｙ］＋Ｉ_２［ｘ］［ｙ＋１］＝１の場合、
Ｙ［ｘ］［ｙ］＝１、
その他の場合、
Ｙ［ｘ］［ｙ］＝０
とする。
【００６０】
〔特徴パラメータｆ_１３算出〕
次に、ｙ方向について上４分の１領域の値「０」のＩ_２［ｘ］［ｙ］をカウントし、その値をｆ_１３とする。このためｆ_１３は、例えば次式（１３）で求められる。
【数１０】

【００６１】
〔特徴パラメータｆ_１４算出〕
また、ｙ方向について下４分の１領域の値「０」のＩ_２［ｘ］［ｙ］をカウントし、その値をｆ_１４とする。このためｆ_１４は、例えば次式（１４）で求められる。
【数１１】

【００６２】
〔特徴パラメータｆ_１５算出〕
そして、ｙ方向について下４行の値「０」のＩ_２［ｘ］［ｙ］をカウントし、その値をｆ_１５とする。このためｆ_１５は、例えば次式（１５）で求められる。
【数１２】

【００６３】
ステップＳ３４：最後に特徴パラメータ演算部３６は、算出した特徴パラメータｆ_１〜ｆ_１５を保存し、演算処理を終了する。特徴パラメータｆ_１〜ｆ_１５の保存場所は、例えば図示しないバッファ領域とする。
【００６４】
なお、ステップＳ１２において平均値μを逐次処理で更新する場合、特徴パラメータ演算部３６により図４の処理をサンプリング周期（１０ｍｓ割り込み）で実行し、特徴パラメータｆ_１〜ｆ_１５をその都度更新する。
【００６５】
〔二値化処理の例〕
図５は、上記の特徴パラメータ演算処理の中で実行される二値化処理（ステップＳ１２）の様子をスペクトログラムとして表した図である。
【００６６】
〔二値化処理前〕
図５中（Ａ）：ここでは先と別の例として、クラッシック音楽の入力音から得られたデータを用いている。この場合、データ処理部３２から取得した処理済データをスペクトログラムとして表すと、上記のようにｘ方向に時間、ｙ方向に周波数、グレー階調として音圧Ｉ［ｘ］［ｙ］が可視化される。この画像例からも明らかなように、音環境が「音楽」である場合、話し声の入力音から得られた画像（図３中（Ｂ））とは、見た目上でも大きな差違を有していることが分かる。クラッシック音楽の入力音から得られた画像の特徴は、ｙ方向の低周波域で音圧が定常的に大きく現れるとともに、ｘ方向（時間軸）全域にわたって広範囲の周波数スペクトルが観測されることである。
【００６７】
〔二値化処理後〕
図５中（Ｂ）：二値化処理（ステップＳ１２）で二値化及び４近傍での孤立点消去を行うと、上記の特徴がより視覚的にも強調される。もちろん、特徴パラメータｆ_１〜ｆ_９の演算に視覚情報を用いるわけではないが、このようにスペクトログラムとして表すことで、音環境の特徴を視覚的に捉えることができ、分類関数を作成に際し、適切な特徴パラメータ選択することができる。
【００６８】
〔垂直方向ヒストグラムの例〕
次に図６は、上記の特徴パラメータ演算処理（ステップＳ１４）の中で作成される垂直方向ヒストグラムの例を可視画像として表した図である。
【００６９】
図６中（Ａ）：垂直方向（ｙ方向）のヒストグラムは、時間内で各周波数帯別に閾値以上の音圧が現れたデータ数（画素数）を表している。この例からも明らかなように、クラッシック音楽の入力音から得られた画像には、低周波域での頻度が高いという傾向が顕著である。
【００７０】
図６中（Ｂ）：ヒストグラム上で隣接する頻度同士の差を集積した結果も画像の特徴として顕著に表れる。この例は、特徴パラメータｆ_１の算出式（２）で表したように、Ｈ［ｙ−１］＜Ｈ［ｙ］＞Ｈ［ｙ＋１］であって、Ｈ［ｙ＋１］−Ｈ［ｙ−１］≧０のときはｇ（ｙ）＝Ｈ［ｙ］−Ｈ［ｙ−１］とし、上記以外のときはｇ（ｙ）＝Ｈ［ｙ］−Ｈ［ｙ＋１］とすることを視覚的に表している。
【００７１】
図７は、上記の特徴パラメータ演算処理（ステップＳ２０）での特徴パラメータｆ_３の算出条件を模式的に表した図である。すなわちこの例は、特徴パラメータｆ_３の算出式（４）で表したように、ある画素の濃度値Ｉ［ｘ］［ｙ］が「１（白画素）」の場合は、両隣の列の濃度値が「０」で、かつ真下の画素の濃度値が「１」ならば、Ｊ［ｘ］［ｙ］＝１とし、その他の場合はＪ［ｘ］［ｙ］＝０とすることを模式的に表している。なお特徴パラメータｆ_３は、画像としての太さが１ピクセルである線の画素数をカウントした結果に相当する。
【００７２】
〔濃度ヒストグラムの例〕
また図８は、上記の特徴パラメータ演算処理（ステップＳ２２）の中で作成される濃度ヒストグラムの例を可視画像として表した図である。濃度ヒストグラムは、全データ内の音圧分布を表している。クラッシック音楽の入力音から得られた画像には、濃度値がある程度の正規分布を示す傾向にあることが分かる。
【００７３】
濃度ヒストグラムからは、上記のように特徴パラメータｆ_４〜ｆ_６を算出することができる。図８中に示されているように、ｆ_４はヒストグラムの最頻値であって、ｆ_５はその最大度数である。なおｆ_６は度数の平均である。
【００７４】
図９は、特徴パラメータｆ_８〜ｆ_１５の演算用に取得される二値変換後のデータを可視画像として表した図である。
特徴パラメータｆ_８については、画像中の白画素（二値変換後のデータで値「１」を有するデータ）の総数から算出することができる。
また特徴パラメータｆ_９については、画像の下半分の領域内にある白画素（二値変換後のデータで値「１」を有するデータ）数から、上半分の領域内にある白画素（二値変換後のデータで値「１」を有するデータ）数を差し引いて算出することができる。
特徴パラメータｆ_１０については、画像の下半分の領域内にある黒画素（二値変換後のデータで値「１」を有するデータ）の総数から算出することができる。
【００７５】
次に、特徴パラメータｆ_１１については、画像の値を横方向へ順に追っていったとき、各行（０〜３１まで）で白画素から黒画素、又は黒画素から白画素に変化した回数の合計（横方向のランレングスの数Ｘ［ｘ］［ｙ］）から算出することができる。
また、特徴パラメータｆ_１２については、画像の値を縦方向へ順に追っていったとき、各列（０〜４９９まで）で白画素から黒画素、又は黒画素から白画素に変化した回数の合計（縦方向のランレングスの数Ｙ［ｘ］［ｙ］）から算出することができる。
【００７６】
特徴パラメータｆ_１３については、画像の上４分の１の領域内にある白画素（二値変換後のデータで値「０」を有するデータ）の総数から算出することができる。
また、特徴パラメータｆ_１４については、画像の下４分の１の領域内にある白画素（二値変換後のデータで値「０」を有するデータ）の総数から算出することができる。
そして、特徴パラメータｆ_１５については、画像の下４行の領域内にある白画素（二値変換後のデータで値「０」を有するデータ）の総数から算出することができる。
【００７７】
上記のように既知の音環境についてスペクトログラム及びスペクトログラムを画像処理した画像から音環境の特徴を捉えることで、分類関数の作成に際し、適切な特徴パラメータを選択できる。余分な特徴パラメータを無くすことで、後述の判別分析処理における補聴処理用ＩＣ１６の負担が軽減される。
【００７８】
〔判別分析の例〕
図１０は、特徴パラメータｆ_１〜ｆ_１５を用いた判別分析の手順例を示すフローチャートである。判別分析の手順は、特徴パラメータｆ_１〜ｆ_１５の演算を実行した後に実行することができる。以下、順を追って説明する。
【００７９】
ステップＳ１００：判別分析部３０の分類クラス演算部３８にて、先ず特徴パラメータｆ_１〜ｆ_３，ｆ_１０〜ｆ_１２（第１群の特徴パラメータ）を取得する。
ステップＳ１０２：次に分類クラス演算部３８は、特徴パラメータｆ_１〜ｆ_３，ｆ_１０〜ｆ_１２を説明変量としたマハラノビス距離の分類演算を行う。なお分類演算には、予めこの実施形態で用いる判別分析の手法に則って定義された分類関数を用いることができる。
【００８０】
ステップＳ１０４：分類クラス演算部３８による演算結果に基づき、識別部４０で「音楽クラス」に分類されるか否かを識別、つまり判別分析を行う。具体的には、予め「音楽クラス」の音環境について得られたデータ特徴パラメータｆ_１〜ｆ_３，ｆ_１０〜ｆ_１２の分布を既知としておき、その分布に対して補聴器使用時の入力音の特徴パラメータｆ_１〜ｆ_３，ｆ_１０〜ｆ_１２から分類演算したマハラノビス距離を算出する。このとき、分類演算したマハラノビス距離が小さいほど、その特徴パラメータｆ_１〜ｆ_３，ｆ_１０〜ｆ_１２がマハラノビス空間において既知の分布に近いことを意味する。このため、例えば予め「音楽クラス」に分類できるマハラノビス距離についての閾値を設定しておき、演算結果が閾値以下の場合は音環境が「音楽」であると識別し、閾値を超えてしまう場合は音環境が「音楽」以外であると識別することができる。
【００８１】
〔音楽クラスと識別した場合〕
ステップＳ１０６：音環境が「音楽クラス」であると識別した場合（ステップＳ１１４：Ｙｅｓ）、識別部４０は「音環境（４）」の結果をパラメータ設定部２４に反映させる。音環境（４）は、上記のように「音楽」の音環境に応じて予め最適化されたパラメータの設定情報である。そしてこの場合、ここで識別部４０による音環境の識別は完了しているため、これ移行の判別分析の手順を終了することができる。
【００８２】
〔音楽クラス以外と識別した場合〕
ステップＳ１０８：これに対し、識別部４０で音環境が「音楽クラス」以外であると識別した場合（ステップＳ１０４：Ｎｏ）、分類クラス演算部３８は、その他の特徴パラメータｆ_４〜ｆ_９，ｆ_１１〜ｆ_１５（第２群の特徴パラメータ）を取得する。なお、この中で特徴パラメータｆ_１１，ｆ_１２については、上記のように「音楽クラス」の判別分析だけでなく、それ以外のクラスの判別分析にも用いることができる。このため特徴パラメータｆ_１１，ｆ_１２は、第１群の特徴パラメータ、第２群の特徴パラメータの両方に該当する。
【００８３】
ステップＳ１１０：そして分類クラス演算部３８は、今度は特徴パラメータｆ_４〜ｆ_９，ｆ_１１〜ｆ_１５を説明変量としたマハラノビス距離の分類演算を行う。ここでも分類演算には、予めこの実施形態で用いる判別分析の手法に則って定義された分類関数を用いることができる。
【００８４】
ステップＳ１１２：分類クラス演算部３８による演算結果に基づき、識別部４０で分類クラスが上記の音環境（１）〜（３）のいずれに分類されるかを識別、つまり判別分析を行う。具体的には、予め音環境（１）〜（３）についてそれぞれ得られたデータから特徴パラメータｆ_４〜ｆ_９，ｆ_１１〜ｆ_１５の分布を音環境別で既知としておく。したがって、ここでのマハラノビス空間には、予め３つの既知のグループが存在することになる。そしてマハラノビス空間内にて、補聴器使用時の入力音の特徴パラメータｆ_４〜ｆ_９，ｆ_１１〜ｆ_１５から分類演算したマハラノビス距離をあてはめる。そして、このとき分類演算したマハラノビス距離が最も近いグループが音環境（１）〜（３）のいずれであるかを識別する。
【００８５】
〔音環境（１）のクラスと識別した場合〕
ステップＳ１１４：先のステップＳ１１２で音環境（１）のクラスであると識別した場合、識別部４０は「音環境（１）」の結果をパラメータ設定部２４に反映させる。音環境（１）は、上記のように「静かな環境での会話」の音環境に応じて予め最適化されたパラメータの設定情報である。
【００８６】
〔音環境（２）のクラスと識別した場合〕
ステップＳ１１６：また、先のステップＳ１１２で音環境（２）のクラスであると識別した場合、識別部４０は「音環境（２）」の結果をパラメータ設定部２４に反映させる。音環境（２）は、上記のように「うるさい環境での会話」の音環境に応じて予め最適化されたパラメータの設定情報である。
【００８７】
〔音環境（３）のクラスと識別した場合〕
ステップＳ１１８：あるいは、先のステップＳ１１２で音環境（３）のクラスであると識別した場合、識別部４０は「音環境（３）」の結果をパラメータ設定部２４に反映させる。音環境（３）は、上記のように「うるさい環境」の音環境に応じて予め最適化されたパラメータの設定情報である。
【００８８】
以上の手順を実行すると、判別分析部３０（分類クラス演算部３８、識別部４０）はひとまず処理を終了する。この後、例えばある程度の時間が経過したり、あるいは入力音が大きく変化したりすると、判別分析部３０は特徴パラメータｆ_１〜ｆ_９の演算処理（図４）をリトライする。そして、判別分析部３０はリトライ後の特徴パラメータｆ_１〜ｆ_９を用いて判別分析の手順を実行し、改めて現在の音環境を識別する。識別結果は、同様にパラメータ設定部２４に対して反映されるので、音環境の変化に応じてイヤホン１８から出力される音の出力特性を自動調整することができる。
【００８９】
〔第２実施形態〕
次に、音処理装置の第２実施形態を説明する。図１１は、第２実施形態となる補聴器５０の構成例を概略的に示したブロック図である。第２実施形態の補聴器５０は、補聴処理部２０の構成が第１実施形態の補聴器１０と異なっている。以下、第１実施形態との相違点を中心として説明する。その他の第１実施形態と共通する構成には図中に同じ符号を付し、その重複した説明を省略するものとする。
【００９０】
第２実施形態の補聴器５０は、音環境（１）〜（４）のそれぞれに対応して第１〜第４補聴処理部５２〜５８を有している。これら第１〜第４補聴処理部５２〜５８には、予め環境（１）〜（４）に応じて最適化されたパラメータの設定情報が格納されている。第１〜第４補聴処理部５２〜５８は、設定されたパラメータを用いて出力音の信号処理を行う機能を有している。なお第２実施形態においても、第１〜第４補聴処理部５２〜５８のそれぞれに対し、パソコン４４からパラメータを書き換えることができる。
【００９１】
また第２実施形態の補聴器５０は選択部５１を有しており、この選択部５１は、識別された音環境（１）〜（４）に応じて第１〜第４補聴処理部５２〜５８のいずれかを選択する。したがって、識別部４０により識別された音環境に変化が生じた場合、その識別結果に基づき、選択部５１は第１〜第４補聴処理部５２〜５８の選択を切り替える。これにより、第１実施形態と同じく音環境の変化に応じてイヤホン１８から出力される音の出力特性をダイナミックに自動調整することができる。
【００９２】
上述した第１，第２実施形態によれば、補聴器１０，５０の使用者を取り巻く音環境が変化した場合であっても、これを判別分析部３０で自動的に識別し、その結果に応じて信号処理に必要なパラメータを自動的に設定することができる。
また、「時間」−「周波数」−「音圧レベル」の三次元のデータから抽出した値を判別分析の特徴パラメータに用いているため、従来の一般的なある時点での周波数特性を基礎とした分析手法に比較して、周波数特性の時間変化をより一層考慮した音環境の識別を実行することができる。これにより、実際の音環境に応じて補聴処理の内容を最適な状態に維持することができる。
【００９３】
また、判別分析で設定している分類クラスを追加・変更することで、より多様な音環境にも対応することができる。これにより、補聴器の用途や使用場所についての選択の幅を広げ、より高性能な補聴動作を実現することができる。
【００９４】
さらに、パラメータ設定部２４や第１〜第４補聴処理部５２〜５８に設定されている音環境に応じたパラメータは、パソコン４４を通じてカスタマイズすることができる。これにより、各音環境についても、使用者の聞こえ具合や嗜好に合わせた補聴処理をきめ細かく設定することができる。
【００９５】
〔その他の実施形態〕
ここまでに挙げた第１，第２実施形態は、音処理装置を補聴器１０，５０等として構成するものであったが、音処理装置の実施形態は、補聴器以外であってもよい。
【００９６】
〔録音装置としての実施形態〕
図１２は、音処理装置を録音装置６０として実施した場合の構成例を示すブロック図である。録音装置６０は、マイクロホン１４で捕捉した入力音をＡＤＣ２６でデジタル信号に変換し、これを信号処理して記憶部６２にデジタルデータとして記憶（録音）することができる。記憶部６２は、例えば内蔵の半導体メモリや、ハードディスク、外部メモリ等の大容量記憶媒体である。
【００９７】
このような録音装置６０は、例えばボイスレコーダ、ＩＣレコーダ等として一般に実用化されている。なお録音装置６０については、これまでの補聴処理部２０が録音処理部２０に置き換わるものとする。その他の構成については、第１，第２実施形態と共通であり、ここではその重複した説明を省略する。
【００９８】
音処理装置を録音装置６０として実施する場合、パラメータ設定部２４には、予め音環境に応じて最適な録音時の信号処理に必要なパラメータを設定しておくことができる。そして判別分析部３０は、入力音のデータから特徴パラメータｆ_１〜ｆ_１５を演算して判別分析の手順を実行し、録音場所についての音環境を識別する。識別結果は、これまでと同様にパラメータ設定部２４に対して反映されるので、音環境の変化に応じて記憶部６２に記録される音の特性（記録のための出力特性）をダイナミックに自動調整することができる。
【００９９】
〔オーディオプレーヤーとしての実施形態〕
図１３は、音処理装置をオーディオプレーヤー７０として実施した場合の構成例を示すブロック図である。オーディオプレーヤー７０は、例えばデジタル音源となる音データ７２を信号処理部２２にて読み出し、これを再生（出力）用に信号処理して出力音データを生成すると、ＤＡＣ２８でアナログ信号に変換してイヤホン１８（スピーカ）を駆動することができる。なお音データ７２は、例えば内蔵の半導体メモリや、ハードディスク、光ディスク、外部メモリ等の大容量記憶媒体に格納されている。このようなオーディオプレーヤー７０は、例えば携帯型音楽プレーヤーとして一般に実用化されている。なおオーディオプレーヤー７０については、これまでの補聴処理部２０が再生処理部２０に置き換わるものとする。その他の構成については、第１，第２実施形態と共通であり、ここではその重複した説明を省略する。
【０１００】
音処理装置をオーディオプレーヤー７０として実施する場合、パラメータ設定部２４には、予め音環境に応じて最適な再生時の信号処理に必要なパラメータを設定しておくことができる。一方でオーディオプレーヤー７０は、マイクロホン１４で捕捉した周囲の入力音をＡＤＣ２６でデジタル信号に変換し、これをデータ処理部３２で加工して判別分析部３０に提供する。そして判別分析部３０は、入力音のデータから特徴パラメータｆ_１〜ｆ_１５を演算して判別分析の手順を実行し、音楽の再生場所についての音環境を識別する。識別結果は、これまでと同様にパラメータ設定部２４に対して反映されるので、音環境の変化に応じて再生される音の出力特性をダイナミックに自動調整することができる。
【０１０１】
本発明は上述した実施形態に制約されることなく、種々に変形して実施することができる。例えば、全ての実施形態において判別分析の手順は、例えば２段階に分けて行うことができる。例えば、１段階目で特徴パラメータｆ_１〜ｆ_３，ｆ_１０〜ｆ_１２の合計６つだけを演算し、その上で「音楽クラス」又はそれ以外の識別を実行する。このとき、識別結果が「音楽クラス」であれば、そこで判別分析の手順を終了する。識別結果が「音楽クラス以外」となった場合、さらに２段階目に進んで残りの特徴パラメータｆ_４〜ｆ_９，ｆ_１３〜ｆ_１５を演算し、その上で音環境の識別を実行する。これにより、１段階目で「音楽クラス」と識別できた場合、その後は判別分析の手順を実行する必要がなくなるため、それだけ判別分析に要する処理負担を軽減することができる。
【０１０２】
特徴パラメータｆ_１〜ｆ_１５は、その一部（例えばｆ_１〜ｆ_９）だけを用いて判別分析を行うこともできる。例えば、図１０のステップＳ１００で特徴パラメータｆ_１〜ｆ_３を取得しておき、ステップＳ１０４で「音楽クラス」の判別分析を行うこととしてもよい。また、ステップＳ１０８では残りの特徴パラメータｆ_４〜ｆ_９を取得し、ステップＳ１１２で「音環境（１）」〜「音環境（３）」の判別分析を行うこととしてもよい。
【０１０３】
また、実施形態で挙げた音環境の分類はあくまで一例に過ぎず、その他に分類される音環境を判別分析によって識別することとしてもよい。
【符号の説明】
【０１０４】
１０補聴器
１２通信ケーブル
１４マイクロホン
１６音処理用ＩＣ
１８イヤホン
２０補聴処理部
３０判別分析部
４４パソコン

【特許請求の範囲】
【請求項１】
入力音から抽出した複数の特徴パラメータを用いて判別分析を行い、その入力音が予め複数に分類された音環境のいずれであるかを識別する識別手段と、
前記識別手段により識別された音環境に応じて出力音の出力特性を調整する調整手段と
を備えた音処理装置。
【請求項２】
マイクロホンを通じて入力された入力音の信号から複数の特徴パラメータを抽出するパラメータ抽出手段と、
前記パラメータ抽出手段により抽出された複数の特徴パラメータを用いて、予め判別分析の手法に基づいて定められた分類関数から分類クラスを演算する分類クラス演算手段と、
前記分類クラス演算手段による分類クラスの演算結果に基づき、入力音が予め複数に分類された音環境のいずれであるかを識別する識別手段と、
前記識別手段により識別された音環境に応じて出力音の出力特性を調整する調整手段と
を備えた音処理装置。
【請求項３】
請求項１又は２に記載の音処理装置において、
前記調整手段は、
複数の音環境別に出力音の出力特性を調整するためのパラメータを予め記憶するとともに、その記憶しているパラメータの中から、識別された音環境に対応するパラメータを設定して出力音の出力特性を調整することを特徴とする音処理装置。
【請求項４】
請求項１から３のいずれかに記載の音処理装置において、
入力音から抽出される複数の特徴パラメータには、少なくとも第１の特徴パラメータ群、及び第２の特徴パラメータ群を含み、
識別される複数の音環境には、少なくとも単独に分類される特定の音環境、及びその他として複数に分類される特定以外の音環境を含み、
前記識別手段は、
前記第１の特徴パラメータ群を用いて判別分析を行い、その入力音が前記特定の音環境であると識別できた場合、前記第２の特徴パラメータを用いて判別分析を行うことなく音環境の識別を終了することを特徴とする音処理装置。
【請求項５】
請求項１から４のいずれかに記載の音処理装置において、
前記特徴パラメータは、
所定時間内に入力された入力音の時間帯を表す「時間」の要素と、前記時間帯別の周波数スペクトルを表す「周波数」の要素と、前記周波数帯別の音圧レベルを表す「音圧」の要素とから構成される三次元のデータから算出されることを特徴とする音処理装置。
【請求項６】
請求項５に記載の音処理装置において、
前記判別分析に用いる分類関数は、
予め複数の既知である音環境からそれぞれ発せられた入力音のスペクトログラムを画像処理して抽出された複数の特徴パラメータに基づいて、予め設定されることを特徴とする音処理装置。

【図１】