説明

音処理装置、音処理方法及びプログラム

【課題】処理量を抑えつつ、エコーハイディングされた音声データに対し、付加データの抽出精度を向上させること。
【解決手段】音処理装置は、所定時間遅延されたエコー信号に基づいて所定データが更新間隔毎に付加された音声データに対し、更新間隔に対応する長さの音声データが複数に分割された各フレームでケプストラム計算を行う計算部と、各フレームのケプストラム計算結果に基づいて抽出される所定データが同じであるフレームの連続回数が、所定値以上であるか否かを判定し、一の更新間隔に対する所定データを決定する第1判定部と、決定された所定データを出力する出力部と、を備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、エコーハイディングされたデータを処理する音処理装置、音処理方法及びプログラムに関する。
【背景技術】
【0002】
従来、画像データや音声データに対して、人間が感知しにくい領域に所定データを埋め込むステガノグラフィーという技術がある。所定データは、以下では付加データとも呼ばれる。
【0003】
ステガノグラフィーは、既存の通信路のみで新たに情報を付加することができるため、
著作権保護や秘匿データの送信などに利用されている。
【0004】
例えば、音声データに付加データを付加する手段として、エコーハイディング法がある。この方法は、元の音声データに対し、人間が感知できない程度の遅延時間のエコーをかけ、遅延時間を付加データとして送る手法である。
【0005】
音声データを受信する受信機側では、音声データのケプストラムを求めると、エコーがかけられた遅延時間のケフレンシーに有意な大きな値が得られ、予め送信側と定めた遅延時間とデータとの対応表から、付加データを再現することができる。
【0006】
ケプストラムとは、フーリエ変換結果を対数変換し、さらにフーリエ変換をかけたもので、音声データのピッチなどを求めるときに使われるデータである。ケプストラムの各要素をケフレンシーと呼び、次元は時間と同じである。
【0007】
エコーハイディング法では、付加データを更新する間隔は既知であるため、この更新タイミングと、音声データの読み出しタイミングとを合わせることで精度よく付加データを抽出することができる。
【0008】
例えば、透かしが埋め込まれたセグメントの位相シフトの推定値とこの位相シフトの平均値との距離が所定の閾値以上であるか否かで、セグメントの境界を判定する技術がある
【先行技術文献】
【特許文献】
【0009】
【特許文献1】特表2009−515371号公報
【発明の概要】
【発明が解決しようとする課題】
【0010】
ここで、エコーハイディング法により、音声データに付加データを連続して付加する場合、音声データが不連続になると音質の劣化が目立つ。そこで、実際は、付加データの更新タイミングでエコーが急に切り替わるのではなく、前のデータのエコーをフェードアウトさせ、次のデータのエコーをフェードインさせて、エコーが徐々に切り替わるようにする。
【0011】
この場合、受信装置側で、音声データの読み出しタイミングが、付加データの更新タイミングとずれてしまうと、異なるエコーが付加された音声データのケプストラム計算をすることになり、適切に付加データを抽出することができないという問題点があった。
【0012】
そこで、開示の技術は、処理量を抑えつつ、エコーハイディングされた音声データに対し、付加データの抽出精度を向上させることができる音処理装置、音処理方法及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0013】
開示の一態様における音処理装置は、所定時間遅延されたエコー信号に基づいて所定データが更新間隔毎に付加された音声データに対し、前記更新間隔に対応する長さの音声データが複数に分割された各フレームでケプストラム計算を行う計算部と、各フレームのケプストラム計算結果に基づいて抽出される所定データが同じであるフレームの連続回数が、所定値以上であるか否かを判定し、一の更新間隔に対する所定データを決定する第1判定部と、前記決定された所定データを出力する出力部と、を備える。
【発明の効果】
【0014】
開示の技術によれば、処理量を抑えつつ、エコーハイディングされた音声データに対し、付加データの抽出精度を向上させることができる。
【図面の簡単な説明】
【0015】
【図1】実施例1における音処理装置の構成の一例を示すブロック図。
【図2】エンコードフレームの一例を示す図。
【図3】デコードフレームの一例を示す図。
【図4】ケプストラム計算結果の一例を示す図。
【図5】実施例1における判定部の機能の一例を示すブロック図。
【図6】実施例1における付加データの判定処理を説明するための図。
【図7】実施例1における音処理装置の処理の一例を示すフローチャート。
【図8】実施例2における判定部の機能の一例を示すブロック図。
【図9】実施例2における付加データの判定処理を説明するための図。
【図10】実施例2における音処理装置の処理の一例を示すフローチャート。
【図11】実施例3における判定部の機能の一例を示すブロック図。
【図12】実施例3における付加データの判定処理を説明するための図。
【図13】実施例3における音処理装置の処理の一例を示すフローチャート。
【図14】実施例4における音処理装置の構成の一例を示すブロック図。
【図15】実施例4における付加データの判定処理を説明するための図。
【図16】実施例4における音処理装置の処理の一例を示すフローチャート。
【図17】実施例5における携帯端末装置のハードウェアの一例を示すブロック図。
【発明を実施するための形態】
【0016】
以下、音声データへの所定の遅延時間のエコーを所定データとして加えることをエンコードと呼び、1つの付加データを埋め込んだ一連の音声データ列をエンコードフレームと呼ぶ。所定データは、前述した通り付加データとも呼ぶ。また、音を受信する音処理装置側で音声データから付加データを抽出することをデコードと呼び、デコードする対象の一連の音声データ列をデコードフレームと呼ぶ。
【0017】
[実施例1]
<構成>
図1は、実施例1における音処理装置1の構成の一例を示すブロック図である。図1に示す音処理装置1は、マイク部11、音声データカウント部12、音声データ記憶部13、計算部14、デコード部15、判定部16、出力部17を有する。
【0018】
マイク部11は、音を電気信号の音声データに変換し、変換された音声データを音声データカウント部12及び音声データ記憶部13に出力する。なお、マイク部11は、音声データを受信する受信部などでもよい。
【0019】
ここで、入力される音には、付加データが付加されているとする。図2は、エンコードフレームの一例を示す図である。図2に示す原信号には、t1間隔で、所定時間遅延されたエコー信号が付加される。この所定時間の違いにより、どのデータが付加されたかを判定することができる。
【0020】
図2に示す1つのエンコードフレームは、原信号に1つの付加データを示すエコー信号が付加されたフレームである。また、t1間隔毎に、任意のΔtだけ遅延されたエコー信号が付加されることで、t1毎に付加データが1つずつ抽出される。
【0021】
図1に戻り、音声データカウント部12は、マイク部11から取得した音声データの数をカウントする。このとき、カウントされる音声データは、更新間隔t1が複数に分割されたデコードフレームとする。
【0022】
図3は、デコードフレームの一例を示す図である。図3に示すように、デコードフレームは、例えば1つのエンコードフレームを複数に分割したうちの1つのフレームである。音声データカウント部12は、このデコードフレームの数が例えば閾値以上になると、計算部14に対し、計算可能なデータが記憶されたことを通知する。閾値は、例えば1つのエンコードフレームに含まれるデコードフレームの数などである。
【0023】
また、1つのデコードフレームは、例えば数10msec(ミリセック)などであり、また、1つのエンコードフレームは、例えばデコードフレームの16個分などである。デコードフレームのサイズやエンコードフレームのサイズは、あくまでも一例であり、この例に限らない。
【0024】
計算部14は、音声データカウント部12から通知を受けると、音声データ記憶部13から音声データを読み出し、デコードフレーム毎にケプストラムを計算する。計算部14は、各デコードフレームのケプストラム計算結果をデコード部15に出力する。
【0025】
デコード部15は、計算部14から取得したケプストラム計算結果に基づき、ピーク値の間隔に対応する遅延時間を求める。
【0026】
図4は、ケプストラム計算結果の一例を示す図である。図4に示すように、1つのデコードフレームに対して図4に示すようなケプストラム計算結果が得られる。ケフレンシーのピーク値までの間隔がエコー信号の遅延時間に対応する。
【0027】
図1に戻り、デコード部15は、求めた遅延時間に基づいて、付加データにデコードする。デコード部15は、遅延時間と付加データとの対応表を保持し、遅延時間を計算部14から取得する度に付加データにデコードし、付加データを示すデコード結果を判定部16に出力する。よって、デコード部15は、デコードフレーム毎に付加データを抽出することができる。
【0028】
判定部16は、デコード部15からデコード結果を取得し、デコード結果に基づいて、1つの更新間隔に対して1つの付加データを判定する。付加データの更新間隔は、音処理装置1に予め設定されているとする。ここで、判定部16の詳細は図5を用いて説明する。判定部16は、判定した付加データを出力部17に出力する。
【0029】
出力部17は、判定部16から取得した付加データを後段の処理部に出力する。後段の処理部は、例えば表示部である。これにより、付加データが表示されることで、音声データに付加されていたデータをユーザは把握することができる。
【0030】
<判定部の機能>
図5は、実施例1における判定部16の機能の一例を示すブロック図である。図5に示す判定部16は、最初の付加データを判定するための判定部101、2つ目以降の付加データを判定するための判定部102を有する。
【0031】
判定部101は、連続回数カウント部111、付加データ第1判定部112を有する。連続回数カウント部111は、例えば、デコード部15から、最初のエンコードフレーム内にある各デコードフレームのデコード結果を取得し、同じデコード結果(同じ付加データ)が続くデコードフレームの回数をカウントする。連続回数カウント部111は、連続回数を付加データ第1判定部112及び中心算出部121に出力する。
【0032】
付加データ第1判定部112は、連続回数カウント部111から取得した連続回数が、所定値以上であるか否かを判定する。ここで、所定値をNとし、Nは、付加データの更新間隔t1に基づいて予め決定される。Nが取りうる最大値は、エンコードフレーム内にあるデコードフレーム数から、データ切替のフェードにかかるフレーム数を除いた数である。よって、Nは、この最大値よりも小さい値とする。
【0033】
付加データ第1判定部112は、連続回数がN以上である場合、この連続した付加データを、エンコードフレームに付加された所定データと決定する。付加データ第1判定部112は、決定した付加データを出力部17に出力する。
【0034】
これにより、付加データの更新タイミングと、音声データの読み出しタイミングとを調整する必要がなく、読み出しタイミングが予め決められたデコードフレームを用いて適切に付加データを抽出することができる。
【0035】
判定部16は、最初の付加データの判定が終わると、判定部102により、2つ目以降の付加データの判定を行う。よって、2つ目以降のエンコードフレームに対応するデコード部15のデコード結果は、判定部102に入力される。デコード結果の入力の切替については、例えばスイッチなどを用いればよい。
【0036】
判定部102は、中心算出部121、第1決定部122、付加データ第2判定部123を有する。中心算出部121は、連続回数カウント部111から取得した連続回数の中心を求める。中心算出部121は、例えば、同じデコード結果が連続したデコードフレームの中心時刻を算出する。中心算出部121は、求めた中心時刻を第1決定部122に出力する。
【0037】
第1決定部122は、中心算出部121から取得した中心時刻に付加データの更新間隔を加算していく。第1決定部122は、加算した後の時刻を中心として所定数のフレームを、以降の付加データの判定位置であると決定する。この所定数は、例えばNとするが、Nに限らず適切な値が設定されればよい。第1決定部122は、決定した判定位置に含まれる所定数のフレームを、付加データ第2判定部123に通知する。
【0038】
付加データ第2判定部123は、第1決定部122により決定された判定位置のフレームを用いて、付加データを判定する。付加データ第2判定部122は、所定数のフレームのデコード結果で最も多く抽出された付加データを判定し、最も多く抽出された付加データを前記出力部17に出力する。
【0039】
付加データ第2判定部123は、2つ目以降の付加データの判定については、第1決定部122により決定される判定位置に含まれるフレームを用いる。
【0040】
これにより、2つ目以降の付加データの判定処理については、更新間隔の中心付近のデコードフレームを用いて付加データを判定することができるので、付加データの抽出精度を向上させることができる。また、2つ目以降の付加データの判定処理については、連続回数などをカウントする必要がないため、1つ目の付加データの判定処理よりも処理量を抑えることができる。
【0041】
<付加データ判定処理の例>
次に、実施例1における付加データの判定処理の例について説明する。図6は、実施例1における付加データの判定処理を説明するための図である。図6に示す付加データEn11〜14は、各付加データB〜Eがエンコードされたエンコードフレームを表す。図6に示す例では、付加データBからデコードするとする。
【0042】
図6に示すDen(n=101〜)は、デコードフレームを表す。図6に示す例では、デコード部15によるデコード結果が、De101は「A」、De102〜107は「B」とする。連続回数カウント部111は、De102〜107でデコード結果が「B」で連続するので、連続回数を6とする。ここで、所定値Nを例えば3とする。
【0043】
付加データ第1判定部112は、連続回数が所定値N以上であるため、このデコード結果「B」を出力部17に出力する。
【0044】
次に、中心算出部121は、連続回数6の中心T0を求める。中心T0は、例えば、デコードフレームDe102〜107の中心時刻である。
【0045】
第1決定部122は、中心時刻T0に付加データの更新間隔t1を加算し、次のフレーム判定位置の中心時刻T1を算出する。第1決定部122は、更新間隔T1を含むフレームを中心に所定数Nのフレームを決定する。
【0046】
付加データ第2判定部123は、時刻T1を含む所定数Nのフレームのデコード結果で、最も多く抽出された付加データを判定する。ここでは、付加データ「C」が3つなので、付加データ「C」が出力部17に出力される。
【0047】
以降の付加データ判定については、第1決定部122は、時刻T1に更新間隔t1を加算し、次のフレーム判定位置の中心時刻T2を算出する。付加データ第2判定部123は、時刻T2を含む所定数Nのフレームのデコード結果で、最も多く抽出された付加データを判定する。ここでは、付加データ「D」が出力部17に出力される。
【0048】
なお、各付加データの判定に用いる所定フレームの中心時刻は、中心算出部121が算出し、第1決定部122は、中心算出部121から取得した中心時刻を含むフレームを中心とする所定数のフレームを決定するようにしてもよい。
【0049】
このようにして、最初の付加データの更新間隔の中心時刻T0を推定し、あとは更新間隔t1を加算していけば、更新間隔の中心付近で付加データの判定ができるようになり、付加データを適切に抽出することができる。
【0050】
<動作>
次に、実施例1における音処理装置1の動作について説明する。図7は、実施例1における音処理装置1の処理の一例を示すフローチャートである。図7に示すステップS101で、マイク部11は、音声データを受信し、音声データカウント部12、音声データ記憶部13に出力する。
【0051】
ステップS102で、音声データカウント部12は、デコードフレームを必要数受信したか否かを判定する。デコードフレームが必要数受信されれば(ステップS102−YES)ステップS103に進み、デコードフレームが必要数受信されなければ(ステップS102−NO)ステップS101に戻る。
【0052】
ステップS103で、計算部14は、デコードフレーム毎にケプストラムを計算する。計算部14は、ケプストラム計算結果から遅延時間を求め、デコード部15に出力する。
【0053】
ステップS104で、デコード部15は、ケプストラム計算結果からピークを検出し、エコー信号の遅延時間を求める。デコード部15は、求めた遅延時間に対応する付加データを対応表から取得する。対応表には、遅延時間と付加データとが対応付けられている。
【0054】
ステップS105で、判定部16の連続回数カウント部111は、同じデコード結果となるデコードフレームの連続回数をカウントする。
【0055】
ステップS106で、付加データ第1判定部112は、連続回数がN以上であるか否かを判定する。連続回数がN以上であれば(ステップS106−YES)ステップS107に進み、連続回数がN未満であれば(ステップS106−NO)ステップS101に戻る。
【0056】
ステップS107で、出力部17は、連続回数がN以上のデコード結果が示す付加データを出力する。
【0057】
ステップS108で、中心算出部121及び第1決定部122は、次のデコードフレームの判定位置を決定する。
【0058】
ステップS109で、マイク部11は、音声データを受信し、音声データカウント部12、音声データ記憶部13に出力する。
【0059】
ステップS110で、音声データカウント部12は、デコードフレームを必要数受信したか否かを判定する。デコードフレームが必要数受信されれば(ステップS110−YES)ステップS111に進み、デコードフレームが必要数受信されなければ(ステップS110−NO)ステップS109に戻る。
【0060】
ステップS111で、計算部14は、デコードフレーム毎にケプストラムを計算する。計算部14は、ケプストラム計算結果から遅延時間を求め、デコード部15に出力する。
【0061】
ステップS112で、デコード部15は、ケプストラム計算結果からピークを検出し、エコー信号の遅延時間を求める。デコード部15は、求めた遅延時間に対応する付加データを対応表から取得する。対応表には、遅延時間と付加データとが対応付けられている。
【0062】
なお、ステップS109〜S112は、説明の都合上ステップS108の後に記載したが、実際は、ステップS101に続いてステップS109で次の音声データが受信され、ステップS110以降の処理が行われている。
【0063】
ステップS113で、付加データ第2判定部123は、判定対象のデコード結果であるか否かを判定する。例えば、付加データ第2判定部123は、第1決定部122により決定された判定位置にあるデコードフレームのデコード結果であるかを判定する。デコード結果が判定対象であれば(ステップS113−YES)ステップS114に進み、デコード結果が判定対象でなければ(ステップS113−NO)ステップS109に戻り、次の音声データを受信する。
【0064】
ステップS114で、付加データ第2判定部123は、判定対象のデコード結果の回数をカウントする。
【0065】
ステップS115で、付加データ第2判定部123は、判定対象のカウント回数がN回であるか否かを判定する。カウント回数がN回であれば(ステップS115−YES)ステップS116に進み、カウント回数がN回でなければ(ステップS115−NO)ステップS109に戻り、次の音声データを受信する。
【0066】
ステップS116で、付加データ第2判定部123は、N個のデコード結果の多数決をとり、最も多く抽出された付加データを判定する。
【0067】
ステップS117で、付加データ第2判定部123は、カウントしていた回数をリセットする。
【0068】
ステップS117の処理後、ステップS107に進み、出力部17は、多数決の結果である付加データを出力する。
【0069】
以降は、ステップS107〜S117の処理を繰り返し、判定された付加データを順に出力していく。
【0070】
以上、実施例1によれば、処理量を抑えつつ、エコーハイディングされた音声データに対し、付加データの抽出精度を向上させることができる。
【0071】
[実施例2]
次に、実施例2における音処理装置について説明する。実施例2における音処理装置は、最初の付加データが複数のエンコードフレームに連続して付加される場合であっても、付加データを適切に抽出することができる。
【0072】
<構成>
実施例2における音処理装置の構成は、実施例1における音処理装置と同様の構成であるから、その説明を省略する。実施例2における音処理装置の構成を用いる場合は、図1に示す符号と同じ符号を用いて説明する。
【0073】
<判定部の機能>
次に、実施例2における判定部16の機能について説明する。図8は、実施例2における判定部16の機能の一例を示すブロック図である。図8に示す判定部16は、最初の付加データを判定するための判定部201、2つ目以降の付加データを判定するための判定部202を有する。
【0074】
判定部201は、連続回数カウント部211、付加データ第1判定部212を有する。連続回数カウント部211は、実施例1と同様に、デコード部15からのデコード結果を取得し、同じデコード結果が続く回数をカウントする。連続回数カウント部211は、連続回数を付加データ第1判定部212及び中心算出部221に出力する。
【0075】
付加データ第1判定部212は、連続回数カウント部211から取得した連続回数が、エンコードフレーム内のデコードフレームの数の所定倍を超えるか否かを判定する。また、付加データ第1判定部212は、連続回数分のデコードフレームの時間が、エンコードフレームの更新間隔の所定倍を超えたか否かを判定してもよい。
【0076】
この判定は、1つ目の付加データが連続して複数のエンコードフレームに付加されたか否かを判定するために行う。付加データ第1判定部212は、連続回数が所定倍を超えるとき、(連続回数/エンコードフレームに含まれるデコードフレーム数)又は(連続回数分のデコードフレームの時間/エンコードフレームの更新間隔)の整数値に1を加算した整数値Mを算出する。付加データ第1判定部212は、整数値Mの分だけ、デコード結果が示す付加データを出力部17に出力する。
【0077】
付加データ第1判定部212は、連続回数が所定倍を超えないときは、実施例1と同様にして、連続回数が所定値N以上であるか否かを判定する。
【0078】
これにより、最初に判定する付加データが複数のエンコードフレームに連続して付加されている場合でも、付加データを適切に抽出することができる。
【0079】
判定部16は、最初の付加データの判定が終わると、判定部202により、2つ目以降の付加データの判定を行う。よって、2つ目以降のエンコードフレームに対応するデコード部15のデコード結果は、判定部202に入力される。デコード結果の入力の切替については、例えばスイッチなどを用いればよい。
【0080】
判定部202は、中心算出部221、第2決定部222、付加データ第2判定部223を有する。中心算出部221は、連続回数カウント部211から取得した連続回数の中心を求める。中心算出部221は、例えば、同じデコード結果が連続したデコードフレームの中心時刻を算出する。中心算出部221は、求めた中心時刻を第2決定部222に出力する。
【0081】
第2決定部222は、中心算出部221から取得した中心時刻に付加データの更新間隔を加算していく。第2決定部222は、中心時刻が所定倍を超えたときの中心である場合、Mが奇数の場合、取得した中心は、エンコードフレームの更新間隔の中心付近であると判断し、中心時刻に((M+1)/2)倍の更新間隔を加算した時刻を算出する。
【0082】
また、第2決定部222は、Mが偶数の場合、取得した中心は、エンコードフレームの更新タイミング付近であると判断し、この中心に更新間隔の半分を加算して更新間隔の中心付近を求める。第2決定部222は、更新間隔の半分を加算した中心に、さらに(M/2)倍の更新間隔を加算した時刻を算出する。
【0083】
よって、第2決定部222は、整数値Mが偶数の場合も奇数の場合も、取得した中心に対し、((M+1)/2)倍の更新間隔を加算した時刻を算出する。第2決定部222は、一度((M+1)/2)倍の更新間隔を加算すると、次からは1倍の更新間隔を加算していく。
【0084】
第2決定部222は、加算した後の時刻を中心とした所定数のフレームを、以降の付加データの判定位置であると決定する。この所定数は、例えばNとするが、Nに限らず適切な値が設定されればよい。第2決定部222は、決定した判定位置に含まれる所定数のフレームを、付加データ第2判定部223に通知する。
【0085】
付加データ第2判定部223は、第2決定部222により決定された判定位置のフレームを用いて、付加データを判定する。付加データ第2判定部222は、所定数のフレームのデコード結果で最も多く抽出された付加データを判定し、最も多く抽出された付加データを前記出力部17に出力する。
【0086】
付加データ第2判定部223は、2つ目以降の付加データの判定については、第2決定部222により決定される判定位置に含まれるフレームを用いる。
【0087】
これにより、1つ目の付加データが複数のエンコードフレームに連続して付加されている場合でも、2つ目以降の付加データの判定処理を、実施例1と同様に処理量を増やさずに適切に行うことができる。
【0088】
<付加データ判定処理の例>
次に、実施例2における付加データの判定処理の例について説明する。図9は、実施例2における付加データの判定処理を説明するための図である。図9に示す付加データEn21〜24は、各付加データB、D、Eがエンコードされたエンコードフレームを表す。図9に示す例では、付加データBからデコードするとする。
【0089】
図9に示すDen(n=201〜)は、デコードフレームを表す。図9に示す例では、デコード部15によるデコード結果が、De201は「A」、De202〜214は「B」とする。連続回数カウント部211は、De202〜214でデコード結果が「B」で連続するので、連続回数を12とする。このとき、1つのエンコードフレームに含まれるデコードフレームの数を8とすると、連続回数は、この「8」の数を超えている。
【0090】
そこで、付加データ第1判定部212は、(12/8)の整数値(商)1に1を加算して整数値M=2を算出する。付加データ第1判定部212は、連続回数8のデコード結果が示す付加データ「B」をM=2回分、出力部17に出力する。
【0091】
次に、中心算出部221は、連続回数の中心T0を求める。図9に示す中心T0は、M=2であるため、エンコードフレームEn21、En22の更新タイミング付近になる。
【0092】
第2決定部222は、まず、中心時刻T0に付加データの更新間隔の半分(t1/2)を加算し、更新間隔の中心付近を求める。第2決定部222は、次に、この(T0+(t1/2))の時刻に、(M/2)×t1を加算する。つまり、次のフレーム判定位置の中心時刻T1は、次の式を用いて算出される。
T1=T0+((M+1)/2)×t1
第2決定部222は、更新間隔T1を含むフレームを中心に所定数Nのフレームを決定する。
【0093】
付加データ第2判定部223は、時刻T1を含む所定数Nのフレームのデコード結果で、最も多く抽出された付加データを判定する。ここでは、付加データ「D」が3つなので、付加データ「D」が出力部17に出力される。
【0094】
以降の付加データ判定については、第2決定部222は、時刻T1に更新間隔t1を加算し、次のフレーム判定位置の中心時刻T2を算出する。付加データ第2判定部223は、時刻T2を含む所定数Nのフレームのデコード結果で、最も多く抽出された付加データを判定する。ここでは、付加データ「E」が出力部17に出力される。
【0095】
なお、各付加データの判定に用いる所定フレームの中心時刻は、中心算出部221が算出し、第2決定部222は、中心算出部221から取得した中心時刻を含むフレームを中心とする所定数のフレームを決定するようにしてもよい。
【0096】
これにより、最初の付加データが複数のエンコードフレームに連続して付加された場合でも、付加データの判定に用いる所定数のフレームを適切に決定することができる。
【0097】
<動作>
次に、実施例2における音処理装置の動作について説明する。図10は、実施例2における音処理装置の処理の一例を示すフローチャートである。図10に示すステップS201〜S206の処理は、図7に示すステップS101〜S106の処理と同様であるため、その説明を省略する。
【0098】
ステップS207で、付加データ第1判定部212は、連続回数分のデコードフレームの時間を、エンコードフレームの更新間隔の整数値M倍に切り上げる。
【0099】
ステップS208で、出力部17は、付加データ第1判定部212が判定したM個の付加データを出力する。
【0100】
ステップS209で、中心算出部221及び第2決定部222は、次のデコードフレームの判定位置を決定する。2つ目の付加データの判定位置は、中心時刻T0+((M+1)/2)×更新間隔t1を中心とする所定数のフレームである。
【0101】
ステップS210〜S218の処理は、図7に示すステップS109〜S117の処理と同様であるため、その説明を省略する。
【0102】
ステップS218の処理後、ステップS208に進み、出力部17は、多数決の結果である付加データを出力する。
【0103】
以降は、ステップS208〜S218の処理を繰り返し、判定された付加データを順に出力していく。なお、ステップS209で、3つ目以降の付加データを判定する際は、2つ目の付加データに対する中心時刻T1に更新間隔t1を加算していけばよい。
【0104】
以上、実施例2によれば、処理量を抑えつつ、エコーハイディングされた音声データに対し、付加データの抽出精度を向上させることができる。また、実施例2によれば、最初の付加データが複数のエンコードフレームに連続して付加される場合であっても、付加データを適切に抽出することができる。
【0105】
[実施例3]
次に、実施例3における音処理装置について説明する。実施例3における音処理装置は、2つ目以降の付加データを判定するために用いる中心時刻を修正することができる。
【0106】
<構成>
実施例3における音処理装置の構成は、実施例1における音処理装置と同様の構成であるから、その説明を省略する。実施例3における音処理装置の構成を用いる場合は、図1に示す符号と同じ符号を用いて説明する。
【0107】
<判定部の機能>
次に、実施例3における判定部16の機能について説明する。図11は、実施例3における判定部16の機能の一例を示すブロック図である。図11に示す判定部16は、最初の付加データを判定するための判定部301、2つ目以降の付加データを判定するための判定部302を有する。
【0108】
判定部301は、連続回数カウント部311、付加データ第1判定部312を有する。連続回数カウント部311、付加データ第1判定部312は、実施例1に記載の連続回数カウント部111、付加データ第1判定部112と同様であるため、その説明を省略する。
【0109】
判定部302は、中心算出部321、第3決定部322、付加データ第3判定部323を有する。中心算出部321は、実施例1に記載の中心算出部121と同様であるため、その説明を省略する。
【0110】
第3決定部322は、中心算出部321から取得した中心時刻に付加データの更新間隔を加算していく。第3決定部322は、加算した後の時刻を中心として所定数のフレームを、以降の付加データの判定位置であると決定する。この所定数は、例えばNとするが、Nに限らず適切な値が設定されればよい。
【0111】
第3決定部322は、決定した所定数のフレームを第1群とし、この第1群を、1つのデコードフレーム分、前にずらしたデコードフレームの群を第2群とし、第1群を、1つのデコードフレーム分、後にずらしたデコードフレームの群を第3群とする。
【0112】
第3決定部322は、決定した所定数のフレームの3つの群を、付加データ第3判定部323に通知する。なお、群の数は3つに限らない。
【0113】
付加データ第3判定部323は、第3決定部322により決定された3つの郡の判定位置のフレームを用いて、付加データを判定する。付加データ第3判定部323は、それぞれの群で、所定数のフレームのデコード結果で最も多く抽出された付加データを判定する。
【0114】
付加データ第3判定部323は、この3つの群で、同じ付加データの抽出数で多数決をとる。付加データ第3判定部323は、抽出数が一番多い付加データを出力部17に出力する。付加データ第3判定部323は、同じ付加データの抽出数が一番多い群の中に、第1群が含まれていれば、第1群の中心時刻を基準として以降の付加データの判定位置を決定させる。
【0115】
付加データ第3判定部323は、同じ付加データの抽出数が一番多い群の中に、第1群が含まれない場合、抽出数が一番多い郡の中心時刻を以降の付加データの判定位置の基準とするよう、第3決定部322に通知する。なお、付加データ第3判定部323は、第2群と第3群の両方で抽出数が一番多い場合、予め設定しておいたいずれかの群の中心時刻を用いればよい。
【0116】
これにより、付加データの判定に用いる中心時刻を修正することができる。この修正は、実際のエンコードフレームの中心時刻と、判定された中心時刻との間に少しのズレがあるので、このズレが蓄積されるのを防ぐのに役立つ。
【0117】
<付加データ判定処理の例>
次に、実施例3における付加データの判定処理の例について説明する。図12は、実施例3における付加データの判定処理を説明するための図である。図12に示す付加データEn31〜34は、各付加データB〜Eがエンコードされたエンコードフレームを表す。図12に示す例では、付加データBからデコードするとする。
【0118】
図12に示すDen(n=301〜)は、デコードフレームを表す。図12に示す例では、デコード部15によるデコード結果が、例えばDe301は「A」、De302〜307は「B」とする。連続回数カウント部311は、De302〜307でデコード結果が「B」で連続するので、連続回数を6とする。ここで、所定値Nを例えば3とする。
【0119】
付加データ第1判定部312は、連続回数が所定値N以上であるため、このデコード結果「B」を出力部17に出力する。
【0120】
次に、中心算出部321は、連続回数6の中心T0を求める。中心T0は、例えば、デコードフレームDe302〜307の中心時刻である。
【0121】
第3決定部322は、中心時刻T0に付加データの更新間隔t1を加算し、次のフレーム判定位置の中心時刻T1を算出する。第3決定部322は、更新間隔T1を含むフレームを中心に所定数Nのフレームを第1群として決定する。
【0122】
第3決定部322は、第1群から1デコードフレーム前にずらした第2群、第1群から1デコードフレーム後にずらした第3群を決定する。例えば、図12に示す例では、De310〜312が第1群、De309〜311が第2群、De311〜313が第3群となる。
【0123】
付加データ第3判定部323は、群毎に、所定数Nのフレームのデコード結果で、多数決をとる。例えば、付加データ第3判定部323は、同じ付加データの抽出数を用いて判定する。ここでは、いずれの群も付加データ「C」が3つずつ抽出されるので、付加データ「C」が出力部17に出力される。
【0124】
以降の付加データ判定については、第3決定部322は、時刻T1に更新間隔t1を加算し、次のフレーム判定位置の中心時刻T2を算出する。第3決定部322は、中心時刻T2に基づき、第1群〜第3群のフレームを決定する。
【0125】
付加データ第3判定部323は、第3群で、付加データ「D」が3つ抽出されるので、付加データ「D」を判定し、出力部17に出力する。ここでは、第3群の付加データ「D」の抽出数「3」が、第1群の付加データ「D」の抽出数「2」、第2群の付加データ「C」の抽出数「2」よりも大きい。
【0126】
よって、付加データ第3判定部323は、第3群の所定数のデコードフレームの中心を、中心時刻T2’とし、第3決定部322に通知する。第3決定部322は、中心時刻T2’を取得すると、このT2’に更新間隔t1を加算し、次のフレーム判定位置の中心時刻T3を算出する。
【0127】
なお、各付加データの判定に用いる所定フレームの中心時刻は、中心算出部321が算出し、第3決定部322は、中心算出部321から取得した中心時刻に基づき、各群の所定数のフレームを決定するようにしてもよい。
【0128】
これにより、2つ目以降の付加データの判定において、中心時刻を修正することができ、より適切な付加データを抽出することができる。
【0129】
<動作>
次に、実施例3における音処理装置の動作について説明する。図13は、実施例3における音処理装置の処理の一例を示すフローチャートである。図13に示すステップS301〜S314の処理は、図7に示すステップS101〜S114の処理と同様であるため、その説明を省略する。
【0130】
ステップS315で、付加データ第3判定部323は、判定対象のカウント回数がN+2回であるか否かを判定する。カウント回数がN+2回であれば(ステップS315−YES)ステップS316に進み、カウント回数がN+2回でなければ(ステップS315−NO)ステップS309に戻り、次の音声データを受信する。
【0131】
ステップS316で、付加データ第3判定部323は、第1群のN個のデコード結果の多数決をとり、最も多く抽出された付加データを判定する。
【0132】
ステップS317で、付加データ第3判定部323は、第2群のN個のデコード結果の多数決をとり、最も多く抽出された付加データを判定する。
【0133】
ステップS318で、付加データ第3判定部323は、第3群のN個のデコード結果の多数決をとり、最も多く抽出された付加データを判定する。
【0134】
ステップS319で、付加データ第3判定部323は、同じ付加データの抽出数が最も多い群を判定する。付加データ第3判定部323は、判定した群の最も多く抽出された付加データを出力部17に出力する。
【0135】
ステップS320で、付加データ第3判定部323は、カウントしていた回数をリセットする。
【0136】
ステップS320の処理後、ステップS307に進み、出力部17は、多数決の結果である付加データを出力する。
【0137】
以降は、ステップS307〜S320の処理を繰り返し、判定された付加データを順に出力していく。なお、ステップS308で、3つ目以降の付加データを判定する際は、ステップS319で決定された群の中心時刻に対して更新間隔t1を加算していけばよい。
【0138】
以上、実施例3によれば、処理量を抑えつつ、エコーハイディングされた音声データに対し、付加データの抽出精度を向上させることができる。また、2つ目以降の付加データの判定に用いる中心時刻を修正することができ、付加データの抽出精度をさらに向上させることができる。
【0139】
[実施例4]
次に、実施例4における音処理装置4について説明する。実施例4における音処理装置4は、付加データの判定に用いる音声データのみを取得するようにして、省電力を実現する。
【0140】
<構成>
図14は、実施例4における音処理装置4の構成の一例を示すブロック図である。図14に示す構成で、図1に示す構成と同様のものは同じ符号を付し、その説明を省略する。
【0141】
判定部21は、付加データの判定が終わると、電源制御部22に電源切断を通知する。また、判定部21は、次の付加データの判定に用いるデコードフレームの読み込み開始時刻までの時間をタイマ部23に設定する。
【0142】
電源制御部22は、判定部21から電源切断を通知されると、マイク部11、音声データカウント部12、音声データ記憶部13、計算部14、デコード部15に対して電源を切断する。
【0143】
また、電源制御部22は、タイマ部23から電源供給の指示を通知されると、マイク部11、音声データカウント部12、音声データ記憶部13、計算部14、デコード部15に対して電源を供給する。よって、電源制御部22は、音声データの読み込み処理を含む各部の処理を行わせないようにする制御機能を有する。
【0144】
タイマ部23は、時計を内蔵しており、判定部21から通知された時間が経過したら電源制御部22に対して電源供給を指示する。
【0145】
<判定部の機能>
実施例4における判定部21は、前述した以外の機能は、実施例1〜3のいずれかの機能を有していればよい。判定部21は、実施例1〜3のいずれかを用いて、次の付加データの判定に用いるデコードフレームの読み込み開始時刻までの時間を算出し、この時間をタイマ部23に通知する。
【0146】
これにより、付加データを判定するデコードフレームのみを処理すればよいので、電力消費を抑えることができる。
【0147】
<付加データ判定処理の例>
次に、実施例4における付加データの判定処理の例について説明する。図15は、実施例4における付加データの判定処理を説明するための図である。なお、図15に示す例では、判定部21の判定処理として実施例1で説明した図5の符号を用いて説明する。
【0148】
図15に示す付加データEn41〜44は、各付加データB〜Eがエンコードされたエンコードフレームを表す。図15に示す例では、付加データBからデコードするとする。
【0149】
図15に示すDen(n=401〜)は、デコードフレームを表す。図15に示す例では、デコード部15によるデコード結果が、De401は「A」、De402〜407は「B」とする。連続回数カウント部111は、De402〜407でデコード結果が「B」で連続するので、連続回数を6とする。ここで、所定値Nを例えば3とする。
【0150】
付加データ第1判定部112は、連続回数が所定値N以上であるため、このデコード結果「B」を出力部17に出力する。
【0151】
次に、中心算出部121は、連続回数6の中心T0を求める。中心T0は、例えば、デコードフレームDe402〜407の中心時刻である。
【0152】
第1決定部122は、中心時刻T0に付加データの更新間隔t1を加算し、次のフレーム判定位置の中心時刻T1を算出する。第1決定部122は、更新間隔T1を含むフレームを中心に所定数Nのフレームを決定する。判定部21は、De408のデコードフレームの判定処理が終了すると、電源制御部22に電源切断を通知する。また、判定部21は、De409のデコードフレームを読み込む開始時刻までの時間をタイマ部23に設定する。判定部21は、以降も同様の処理を行い、電源制御部22への電源切断の通知と、タイマ部23への時間の設定を行う。
【0153】
これにより、次の付加データの判定において、De409〜411のデコードフレーム以外のデコードフレームについて音声データについては処理されず、省電力を実現できる。
【0154】
<動作>
次に、実施例4における音処理装置1の動作について説明する。図16は、実施例4における音処理装置4の処理の一例を示すフローチャートである。なお、図16に示す処理は、実施例1の判定処理を行う場合の処理である。
【0155】
図16に示すステップS401〜S408の処理は、図7に示すステップS101〜S108の処理と同様であるため、その説明を省略する。
【0156】
ステップS409で、判定部21は、現在の時刻から次のデコードフレームの読み込み開始時刻までの時間を算出し、タイマ部23に設定する。
【0157】
ステップS410で、判定部21は、電源制御部22に対し、電源切断を通知する。これにより、各部の不要な電源を切断することができる。
【0158】
ステップS411で、タイマ部23は、設定された時間が経過したか否かを判定する。設定時間が経過すれば(ステップS411−YES)ステップS412に進み、設定時間が経過していなければ(ステップS411−NO)ステップS411に戻る。
【0159】
ステップS412で、電源制御部22は、電源を切断した各部に対し、電源供給を開始する。これにより、付加データの判定処理が再開する。
【0160】
ステップS413〜S420の処理は、図1に示すS109〜S117の処理と同様であるため、その説明を省略する。
【0161】
以上、実施例4によれば、処理量を抑えつつ、エコーハイディングされた音声データに対し、付加データの抽出精度を向上させ、かつ、電力消費を抑えることができる。
【0162】
[実施例5]
図17は、実施例5における携帯端末装置5のハードウェアの一例を示すブロック図である。携帯端末装置5は、アンテナ501、無線部502、ベースバンド処理部503、制御部504、端末インタフェース部505、主記憶部506、補助記憶部507、マイク508、表示部509を有する。
【0163】
アンテナ501は、送信アンプで増幅された無線信号を送信し、また、基地局から無線信号を受信する。無線部502は、ベースバンド処理部503で拡散された送信信号をD/A変換し、直交変調により高周波信号に変換し、その信号を電力増幅器により増幅する。無線部702は、受信した無線信号を増幅し、その信号をA/D変換してベースバンド処理部703に伝送する。
【0164】
ベースバンド部503は、送信データの誤り訂正符号の追加、データ変調、拡散変調、受信信号の逆拡散、受信環境の判定、各チャネル信号の閾値判定、誤り訂正復号などのベースバンド処理などを行う。
【0165】
制御部504は、制御信号の送受信などの無線制御を行う。また、制御部504は、補助記憶部507などに記憶されている音処理プログラムを実行し、各実施例で説明した音処理を行う。
【0166】
端末インタフェース部505は、データ用アダプタ処理、ハンドセットおよび外部データ端末とのインタフェース処理を行う。
【0167】
主記憶部506は、ROM(Read Only Memory)やRAM(Random Access Memory)などであり、制御部504が実行する基本ソフトウェアであるOS(Operating System)やアプリケーションソフトウェアなどのプログラムやデータを記憶又は一時保存する記憶装置である。
【0168】
補助記憶部507は、HDD(Hard Disk Drive)などであり、アプリケーションソフトウェアなどに関連するデータを記憶する記憶装置である。補助記憶部507は、前述した音処理プログラムを記憶する。
【0169】
マイク508は、付加データが付加されたアナウンスなどを電気信号の音声データに変換する。表示部509は、例えば、LCD(Liquid Crystal Display)等であり、制御部504から入力される表示データに応じた表示が行われる。表示部509は、例えば、抽出された付加データを表示する。
【0170】
また、各実施例の音処理装置のマイク部11と音声データ記憶部13以外の各部の機能は、例えば制御部504、及びワークメモリとしての主記憶部506により実現されうる。音声データ記憶部13は、例えば主記憶部506などにより実現されうる。マイク部11は、例えばマイク508などにより実現されうる。
【0171】
なお、各実施例における音処理装置の各部の一部をハードウェアで実装し、その他のソフトウェアで実装してもよい。例えば、マイク部11、デコード部15、音声データ記憶部13などをハードウェアで実装し、その他をソフトウェアで実装してもよい。
【0172】
以上、実施例5によれば、携帯端末装置5において、実施例1〜4での付加データ判定処理を行うことができる。
【0173】
また、開示の技術は、携帯端末装置5に限らず、他の機器にも実装することができる。例えば、前述した音処理装置は、付加データが付加された音声データを入力するマイクや受信部と制御部とを有する処理装置であれば適用可能である。
【0174】
また、前述した各実施例で説明した音処理を実現するためのプログラムを記録媒体に記録することで、各実施例での音処理をコンピュータに実施させることができる。
【0175】
また、このプログラムを記録媒体に記録し、このプログラムが記録された記録媒体をコンピュータや携帯端末装置に読み取らせて、前述した音処理を実現させることも可能である。なお、記録媒体は、CD−ROM、フレキシブルディスク、光磁気ディスク等の様に情報を光学的,電気的或いは磁気的に記録する記録媒体、ROM、フラッシュメモリ等の様に情報を電気的に記録する半導体メモリ等、様々なタイプの記録媒体を用いることができる。記録媒体は、搬送波を含まない。
【0176】
なお、上記各実施例で説明した装置は、例えば、電車の車内アナウンスに、アナウンスと同じ内容を付加データで付加し、耳の不自由な人が、付加データが示すアナウンスを表示部に表示する際に用いられる。これにより、各実施例の装置は、アナウンスの内容を知ることなどに適用することができる。
【0177】
以上、実施例について詳述したが、上記の各実施例に限定されるものではなく、特許請求の範囲に記載された範囲内において、種々の変形及び変更が可能である。また、前述した実施例の構成要素を全部又は複数を組み合わせることも可能である。また、前述した各実施例同士を組み合わせたりすることもできる。
【0178】
なお、以上の実施例に関し、さらに以下の付記を開示する。
(付記1)
所定時間遅延されたエコー信号に基づいて所定データが更新間隔毎に付加された音声データに対し、前記更新間隔に対応する長さの音声データが複数に分割された各フレームでケプストラム計算を行う計算部と、
各フレームのケプストラム計算結果に基づいて抽出される所定データが同じであるフレームの連続回数が、所定値以上であるか否かを判定し、一の更新間隔に対する所定データを決定する第1判定部と、
前記決定された所定データを出力する出力部と、
を備える音処理装置。
(付記2)
連続して同じ所定データが抽出されるフレームの中心時刻を求める中心算出部と、
求められた中心時刻に前記更新間隔を加算して、次の付加データの抽出に用いる所定数のフレームを決定する第1決定部と、
決定された所定数のフレームのケプストラム計算結果に基づいて、最も多く抽出される所定データを判定し、最も多く抽出された所定データを前記出力部に出力する第2判定部とをさらに備える付記1記載の音処理装置。
(付記3)
前記第1判定部は、
連続して同じ所定データが抽出されるフレームの時間が前記更新間隔の所定倍を超える場合、前記所定倍に1を加算した整数値の数だけ、該所定データを前記出力部に出力する付記1記載の音処理装置。
(付記4)
連続して同じ所定データが抽出されるフレームの中心を求める中心算出部と、
求められた中心に前記更新間隔の(前記整数値+1)/2倍を加算して、次の付加データの抽出に用いる所定数のフレームを決定する第2決定部と、
決定された所定数のフレームのケプストラム計算結果に基づいて、最も多く抽出される所定データを判定し、最も多く抽出された所定データを前記出力部に出力する第2判定部とをさらに備える付記3記載の音処理装置。
(付記5)
連続して同じ所定データが抽出されるフレームの中心を求める中心算出部と、
求められた中心に前記更新間隔を加算して、次の付加データの抽出に用いる所定数のフレームの群を複数決定する第3決定部と、
決定された各群で所定数のフレームのケプストラム計算結果に基づいて、最も多く抽出される所定データを判定し、最も多く抽出された所定データを前記出力部に出力する第3判定部とをさらに備え、
前記中心算出部は、
前記所定データが最も多く抽出された群のフレームの中心を求める付記1記載の音処理装置。
(付記6)
前記次の付加データの抽出に用いる所定数のフレーム以外のフレームでは、前記音声データの読み込みを行わないよう制御する制御部をさらに備える付記2、4及び5いずれか一項に記載の音処理装置。
(付記7)
前記エコー信号は、前記更新間隔の前後でフェードイン、フェードアウトされ、
前記所定値は、前記更新間隔から前記フェードイン及び前記フェードアウトされる時間を除いた時間に対するデコードフレームの数に基づいて決定される付記1乃至6いずれか一項に記載の音処理装置。
(付記8)
所定時間遅延されたエコー信号に基づいて所定データが更新間隔毎に付加された音声データに対し、前記更新間隔に対応する長さの音声データが複数に分割された各フレームでケプストラム計算を行い、
各フレームのケプストラム計算結果に基づいて抽出される所定データが同じであるフレームの連続回数が、所定値以上であるか否かを判定し、一の更新間隔に対する所定データを決定し、
前記決定された所定データを出力する処理をコンピュータが実行する音処理方法。
(付記9)
所定時間遅延されたエコー信号に基づいて所定データが更新間隔毎に付加された音声データに対し、前記更新間隔に対応する長さの音声データが複数に分割された各フレームでケプストラム計算を行い、
各フレームのケプストラム計算結果に基づいて抽出される所定データが同じであるフレームの連続回数が、所定値以上であるか否かを判定し、一の更新間隔に対する所定データを決定し、
前記決定された所定データを出力する処理をコンピュータに実行させるためのプログラム。
【符号の説明】
【0179】
1、4 音処理装置
5 携帯端末装置
11 マイク部
12 音声データカウント部
13 音声データ記憶部
14 計算部
15 デコード部
16、21 判定部
17 出力部
22 電源制御部
23 タイマ部
111、211、311 連続回数カウント部
112、212、312 付加データ第1判定部
121、221、321 中心算出部
122 第1決定部
123、223 付加データ第2判定部
222 第2決定部
322 第3決定部
323 付加データ第3判定部
504 制御部
506 主記憶部
507 補助記憶部
508 マイク
509 表示部

【特許請求の範囲】
【請求項1】
所定時間遅延されたエコー信号に基づいて所定データが更新間隔毎に付加された音声データに対し、前記更新間隔に対応する長さの音声データが複数に分割された各フレームでケプストラム計算を行う計算部と、
各フレームのケプストラム計算結果に基づいて抽出される所定データが同じであるフレームの連続回数が、所定値以上であるか否かを判定し、一の更新間隔に対する所定データを決定する第1判定部と、
前記決定された所定データを出力する出力部と、
を備える音処理装置。
【請求項2】
連続して同じ所定データが抽出されるフレームの中心時刻を求める中心算出部と、
求められた中心時刻に前記更新間隔を加算して、次の付加データの抽出に用いる所定数のフレームを決定する第1決定部と、
決定された所定数のフレームのケプストラム計算結果に基づいて、最も多く抽出される所定データを判定し、最も多く抽出された所定データを前記出力部に出力する第2判定部とをさらに備える請求項1記載の音処理装置。
【請求項3】
前記第1判定部は、
連続して同じ所定データが抽出されるフレームの時間が前記更新間隔の所定倍を超える場合、前記所定倍に1を加算した整数値の数だけ、該所定データを前記出力部に出力する請求項1記載の音処理装置。
【請求項4】
連続して同じ所定データが抽出されるフレームの中心を求める中心算出部と、
求められた中心に前記更新間隔の(前記整数値+1)/2倍を加算して、次の付加データの抽出に用いる所定数のフレームを決定する第2決定部と、
決定された所定数のフレームのケプストラム計算結果に基づいて、最も多く抽出される所定データを判定し、最も多く抽出された所定データを前記出力部に出力する第2判定部とをさらに備える請求項3記載の音処理装置。
【請求項5】
連続して同じ所定データが抽出されるフレームの中心を求める中心算出部と、
求められた中心に前記更新間隔を加算して、次の付加データの抽出に用いる所定数のフレームの群を複数決定する第3決定部と、
決定された各群で所定数のフレームのケプストラム計算結果に基づいて、最も多く抽出される所定データを判定し、最も多く抽出された所定データを前記出力部に出力する第3判定部とをさらに備え、
前記中心算出部は、
前記所定データが最も多く抽出された群のフレームの中心を求める請求項1記載の音処理装置。
【請求項6】
前記次の付加データの抽出に用いる所定数のフレーム以外のフレームでは、前記音声データの読み込みを行わないよう制御する制御部をさらに備える請求項2、4及び5いずれか一項に記載の音処理装置。
【請求項7】
所定時間遅延されたエコー信号に基づいて所定データが更新間隔毎に付加された音声データに対し、前記更新間隔に対応する長さの音声データが複数に分割された各フレームでケプストラム計算を行い、
各フレームのケプストラム計算結果に基づいて抽出される所定データが同じであるフレームの連続回数が、所定値以上であるか否かを判定し、一の更新間隔に対する所定データを決定し、
前記決定された所定データを出力する処理をコンピュータが実行する音処理方法。
【請求項8】
所定時間遅延されたエコー信号に基づいて所定データが更新間隔毎に付加された音声データに対し、前記更新間隔に対応する長さの音声データが複数に分割された各フレームでケプストラム計算を行い、
各フレームのケプストラム計算結果に基づいて抽出される所定データが同じであるフレームの連続回数が、所定値以上であるか否かを判定し、一の更新間隔に対する所定データを決定し、
前記決定された所定データを出力する処理をコンピュータに実行させるためのプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate


【公開番号】特開2013−97202(P2013−97202A)
【公開日】平成25年5月20日(2013.5.20)
【国際特許分類】
【出願番号】特願2011−240596(P2011−240596)
【出願日】平成23年11月1日(2011.11.1)
【出願人】(000005223)富士通株式会社 (25,993)