説明

通信装置、通信方法、および通信用プログラム

【課題】 相手側への音声がどの程度の音量となっているのかを把握することのできる通信装置を提供する。
【解決手段】 提示音声集音部105は、相手側装置20から受信した音声を再生したときの音量レベルを測定する。伝播状態情報生成部108は、音声をユーザに提示する空間内での音声の伝播モデルを予め求めておく。そして、伝播状態情報生成部108は、相手側装置20からの音声が再生されたとき、提示音声集音部105で測定された音量レベルと伝播モデルとから、相手側装置20からの音声の空間内での伝播状態を算出し、その伝播状態の情報を相手側装置20に送信する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、遠隔の通信装置において、相手側の空間での音伝播の様子を可視化する方法に関する。
【背景技術】
【0002】
音声を含む通信において音量は重要であり、ユーザが音量を容易に把握することができるように可視化する手法が用いられることがある。例えば、映像音声通信装置において、自分側の装置に入力する音量を可視化する手法として、ピークメータを用いる手法がある。
【0003】
しかし、遠隔の相手側の音声提示部から再生される音量を可視化する手法はなかった。そのため、従来の映像音声通信装置では、遠隔の相手側の音声提示部から再生される音量が未知であるために、コミュニケーションの成立が阻害されることがあった(非特許文献1参照)。
【非特許文献1】Fish, R. S., Kraut, R. E., and Chalfonete, B. L., : The Video Window System in Informal Communications, Proceedings of the ACM1990 Conference on Computer Supported Cooperative Work(CSCW90), ACM, pp.1−11(1990).
【発明の開示】
【発明が解決しようとする課題】
【0004】
従来の手法では、自分の声が相手側の装置でどの程度の音量で再生され、相手にどの程度の音量で伝わっているのかわからず、自分が望んでいる音量、相手が望んでいる音量で相手と会話をすることが難しい。
【0005】
本発明の目的は、相手側への音声がどの程度の音量となっているのかを把握することのできる通信装置を提供することである。
【課題を解決するための手段】
【0006】
上記目的を達成するために、本発明の通信装置は、少なくとも音声を相互に送受信して通信を行う通信装置であって、相手側装置から受信した音声を再生したときの音量レベルを測定する提示音声集音部と、音声をユーザに提示する空間内での音声の伝播モデルを予め求めておき、前記相手側装置からの音声が再生されたとき、前記提示音声集音部で測定された音量レベルと前記伝播モデルとから、前記相手側装置からの前記音声の前記空間内での伝播状態を算出し、該伝播状態の情報を前記相手側装置に送信する伝播状態情報生成部とを有している。
【0007】
本発明によれば、受話側の通信装置が予め音の伝播モデルを求めておき、通信時、その伝播モデルを用いて送話側の通信装置からの音声の伝播状態を求め、それを送話側の通信装置に送るので、送話側の通信装置のユーザは、自分の発した音声が、受話側の通信装置のユーザの周囲の空間にどのように提示されているかを把握することができる。
【0008】
また、音声に加えて前記空間内の映像が相互に送受信されており、前記伝播状態情報生成部は、前記伝播状態の情報を前記空間内の映像にエフェクトとして付加して前記相手側装置に送信することとしてもよい。
【0009】
これによれば、受話側の通信装置が送話側の通信装置20からの音声の伝播状態をエフェクトとして映像に付加して送話側の通信装置に送るので、送話側の通信装置のユーザは、自分の発した音声が、受話側の通信装置のユーザの周囲の空間にどのように提示されているかを視覚的に把握することができる。
【0010】
また、所定のテスト音が発生されたときの、前記空間内の複数箇所の音量レベルを測定する音場測定部をさらに有し、前記伝播状態情報生成部は、前記音場測定部で測定された複数の音量レベルを用いて前記伝播モデルを算出することとしてもよい。
【0011】
これによれば、音場測定部の複数箇所の音量レベルにより伝播モデルを算出することができ、実際の音声の伝播状態の推定が可能である。
【0012】
また、前記伝播モデルは、前記提示音声集音部で測定される音量レベルと前記空間内の任意点の音量レベルとの関係を示すn次近似関数であり、前記音場測定部は、前記n次近似関数の次数に応じた数の箇所の音量レベルを測定することとしてもよい。
【0013】
これによれば、空間内にて複雑な伝播状態を示すような場合にも、必要に応じて高次数の伝播モデルを利用することにより実際の伝播状態を高い精度で把握することができる。
【0014】
また、前記相手側装置から受信した音声について、該相手側装置での波形と前記提示音声集音部での波形が一致するか否かを判定する波形一致判定部をさらに有し、前記伝播状態情報生成部は、前記波形一致判定部にて一致と判定された期間について、前記伝播状態の情報を前記相手側装置に送信することとしてもよい。
【0015】
これによれば、受話側の通信装置は、送話側波形と受話側波形との一致を判定し、それらが一致したときに伝播状態の情報を送信するので、受話側の通信装置の周囲に大きな騒音が発生する場合にも、騒音の影響を除去し、送話側の通信装置から送った音声の伝播状態を送話側の通信装置のユーザに把握させることができる。
【発明の効果】
【0016】
本発明によれば、受話側の通信装置が予め音の伝播モデルを求めておき、通信時、その伝播モデルを用いて送話側の通信装置からの音声の伝播状態を求め、それを送話側の通信装置に送るので、送話側の通信装置のユーザは、自分の発した音声が、受話側の通信装置のユーザの周囲の空間にどのように提示されているかを把握することができる。
【発明を実施するための最良の形態】
【0017】
本発明を実施するための形態について図面を参照して詳細に説明する。本実施形態では、双方向に映像および音声を送受信する通信システムを例示する。本実施形態の通信システムは、送話者から受話者に音声が送られるとき、受話者側での音量の情報を、送話者側に提示される受話者側の映像にエフェクトとして付加することにより、送話者に提示するものである。エフェクトとは、映像に対して付加される映像効果であり、例えば、映像に効果画像を重ね合わせて表示する(重畳)ものである。
【0018】
図1は、本実施形態による通信システムの概略構成を示すブロック図である。図1を参照すると、本実施形態の通信システムは、通信装置10と通信装置20が通信網30を介して相互に接続されている。ここでは2つの通信装置を有する構成を例示するが、本発明はこの構成に限定されるものではなく、通信装置が複数であればよい。
【0019】
図2は、本実施形態による通信システムの各装置の構成および各部の配置を示す図である。図3は、本実施形態による通信装置の構成を示すブロック図である。通信装置10はユーザa109に使用され、通信装置20はユーザb110に使用されるものとする。また、ここではユーザa109とユーザb110の間の通信を想定する。
【0020】
図1および図2を参照すると、通信装置10、20は双方向の通信を可能にするために、同じ構成を有している。
【0021】
通信装置10は、集音部101、音声提示部102、撮像部103、映像提示部104、提示音声集音部105、音場測定部106、およびエフェクト生成部108を有している。音場測定部106には、音声提示部102および映像提示部104の前に配置された複数のマイク入力部107が含まれている。
【0022】
同様に、通信装置20は、集音部201、音声提示部202、撮像部203、映像提示部204、提示音声集音部205、音場測定部206、およびエフェクト生成部208を有している。音場測定部206には複数のマイク入力部207が含まれている。集音部201、音声提示部202、撮像部203、映像提示部204、提示音声集音部205、音場測定部206、エフェクト生成部208の各々は、通信装置10における集音部101、音声提示部102、撮像部103、映像提示部104、提示音声集音部105、音場測定部106、エフェクト生成部108と同じものである。ここでは、通信装置10について説明する。
【0023】
集音部101は、ユーザa109の発話を集音し、音声を相手側の通信装置20に送る。
【0024】
撮像部103は、ユーザa109の画像を撮影し、画像をエフェクト生成部108に送る。
【0025】
音声提示部102は、相手側の通信装置20から受信した音声を再生し、ユーザa109に提示する。
【0026】
映像提示部104は、相手側の通信装置20からの映像を再生し、ユーザa109に提示する。
【0027】
提示音声集音部105は、音声提示部102の前に設置されており、音声提示部102による再生音の音量レベルを測定し、その音量レベルをエフェクト生成部108に通知する。
【0028】
音場測定部106は、撮像部103の画角内に平面的に配置した複数(本実施形態では10個)のマイク入力部107より構成されており、音声提示部102からの再生音の各マイク入力部107での音量レベルを測定し、その音量レベルをエフェクト生成部108に通知する。
【0029】
エフェクト生成部108は、本装置が通信に使用される前に、予め、音声提示部102から発せられる音の伝播状態を算出するための伝播モデルとなる空間伝播二次近似関数を算出しておく。空間伝播二次近似関数は、音声提示部102から所定のテスト音を発生させ、提示音声集音部105で得られる音量レベルと、音場測定部106で得られる音量レベルとに基づいて算出される。
【0030】
また、エフェクト生成部108は、本装置が通信に使用されるとき、音声提示部102で再生され、音声提示集音部105で測定される、相手側の通信装置20からの音声の音量レベルを、予め求めておいた空間伝播二次近似関数に代入し、空間の任意点での音量レベルを算出する。そして、エフェクト生成部108は、得られた空間内の音量レベルの情報をエフェクトとして、撮像部103で撮像された空間の映像に重畳して相手側の通信装置に送る。
【0031】
なお、撮像部103の設置位置および撮影方向は音場測定部106に対して固定されており、撮像部103による映像と音場測定部106の平面座標との対応関係は予め得られているものとしてもよい。また、撮像部103で撮像される映像と音場測定部106のマイク入力部107の配置などから、撮像された映像と音場測定部106の平面座標との対応関係を求めることとしてもよい。また、撮像部103の設置位置および撮影方向から、撮像された映像と音場測定部106の平面座標との対応関係を求めることとしてもよい。
【0032】
次に、空間伝播二次近似関数を算出する処理について説明する。
【0033】
図4は、本実施形態による通信装置の空間伝播二次近似関数算出処理を示すフローチャートである。ここでは音量の異なる複数のテスト音を用いるものとし、各テスト音を示す番号をmとする。
【0034】
空間伝播二次近似関数は、通信装置が通信に用いられる前に算出される。図4を参照すると、まず、本実施形態の通信装置は、音声提示部102より所定のテスト音を提示する(ステップA101)。その状態で、通信装置は、提示音声集音部105にてその音声を集音して音量レベルを測定するとともに(ステップA102)、音場測定部106の10個のマイク入力部107により、マイクの配置された位置(x,y)の音量レベル(V)を測定する(ステップA103)。
【0035】
ここで用いるテスト音は、男性の発声時の平均基本周波数130Hz、あるいは女性の発声時の平均基本周波数245Hzのどちらかの音声であることが好ましい。また、このテスト音は、提示音声集音部105で測定される音量レベル(Wm)が人の発声時の主な音量帯である20、30、40、50、60、70、80dBのいずれかであることが好ましい。
【0036】
提示音声集音部105で測定されるテスト音(Wm)と、10個のマイク入力部107の座標位置(x,y)および音量レベル(V)の測定値とを式(1)に代入し、各係数(a,b,c)を求める(ステップA104)。音量(V)には、複数のテスト音により各周波数(130Hz、245Hz)に対して得られた音量の平均値を用いれば良い。
【0037】
【数1】

次に、通信装置は、得られた各係数に基づき、提示音声集音部105での音量レベルがWであるときの空間内の任意点(x,y)での音の伝播状態を近似する二次関数を式(2)として求める(ステップA105)。音の伝播状態は、音がどの領域に有効に到達するかを示すものである。例えば、平常時のノイズがある環境において、有意な音声が人間の聴覚により認識可能な程度で到達するか否かを基準とすることとしてもよい。
【0038】
【数2】

なお、ここで通信装置10(ユーザa109側)における空間伝播二次近似関数の算出には通信装置20(ユーザb110)における集音部201での入力の音量レベルでなく、通信装置10の提示音声集音部105における音量レベルを用いている。これは、通信装置の使用に際し、通信装置20における集音部201のゲインなどのセッティングや、通信装置10における音声提示部102のボリュームなどのセッティングがユーザにより自由に変更される可能性があり、セッティングが変更された場合にも空間伝播二次近似関数が影響を受けないようにしておくためである。
【0039】
また、装置利用前に、音場測定部106の各マイク入力部107により装置を設置する環境の定常ノイズレベル(Vavg)を測定しておくこととしてもよい。この定常ノイズレベルの値は、提示音声集音部102の音量レベルからユーザb110の発話の有無を判定するのに用いることができる。
【0040】
マイク入力部107で測定される音量レベル(V)が定常ノイズレベル(Vavg)より大きいとき、そのマイク入力部107で測定される音声が音声提示部102からの再生音であると考えられる。例えば、再生音が検出されていることを、エフェクト401を映像に重畳させる条件としてもよい。
【0041】
また、本実施形態では、本装置を通信に利用するとき、音場測定部106でリアルタイムに測定される音量レベルからではなく、予め求めておいた空間二次近時関数と提示音声集音部105で得られたリアルタイムの音量とから任意点(x,y)での音量を求めている。そのため、音場測定部106は、空間二次近似関数を算出するときに必要とされるだけで、その後は必ずしも必要ではない。音場測定部106のマイク入力部107は、ユーザb110の発話以外の音声を集音する可能性もあるので、例えば、空間二次近似関数を求める処理が終了したら、音場測定部106を撤去することとしてもよい。
【0042】
次に、エフェクト生成部108によるエフェクト重畳処理について説明する。
【0043】
図5は、本実施形態による通信装置のエフェクト重畳処理を示すフローチャートである。図5を参照すると、通信装置10と通信装置20の通信時、まず、通信装置20の集音部201にユーザb110の音声が入力されると(ステップB101)、通信装置10の音声提示部102はその音声を再生し、ユーザa109に提示する(ステップB102)。音声提示部102により再生された音声の音量レベルを提示音声集音部105が測定し(ステップB103)、エフェクト生成部108が式(2)の空間伝播二次近似関数を用いて任意点の音量レベル(V)を算出する(ステップB104)。
【0044】
一方、それと並行して、通信装置10の撮像部103では映像が取得される(ステップC101)。そして、エフェクト生成部108では、取得された映像と音場測定部106の平面座標との対応関係を求め、座標系を一致させる(ステップC102)。さらに、エフェクト生成部108は、式(2)においてV=Vavg(定常ノイズレベル)、W=W+5(Wの初期値は0であるとする)を満たす領域を求め、その領域の境界を識別するエフェクト401の1つの波を作成する(ステップC103)。エフェクト401は、所定の座標の領域を他の領域と識別可能にする画像効果をいい、ここでは一例として曲線で示された波により識別するものとする。
【0045】
次に、任意点での音量レベル(V)が定常ノイズレベル(Vavg)より大きいか否か判定し、大きくなければ透明度を0としエフェクト401を映像に重畳し(ステップD102)、大きければ透明度を100としてエフェクト401を映像に重畳する(ステップD103)。ここでは透明度0は透明であることを示し、透明度100は不透明であることを示すものとする。したがって、音声レベルが定常ノイズレベルより大きければ、音声がそこまで伝播するものとして不透明の曲線のエフェクト401を提示する。一方、音声レベルが定常ノイズレベルより大きくなければ、音声がそこまで伝播しないものとしてエフェクト401の曲線を透明にする。エフェクト401の重畳された映像は通信装置20に送られ、通信装置20の映像提示部203にて再生され、ユーザb110に提示される(ステップD104)。
【0046】
図6は、本実施形態における、通信装置10における音場測定部106の平面の座標軸と、通信装置20の映像提示部204に提示される映像の座標軸との対応の一例を示す図である。図7は、通信装置10における音場測定部106の平面の座標軸と対応付けられた、通信装置20の映像提示部204にて提示される映像の一例を示す図である。
【0047】
図6および図7を参照すると、撮像部103の設置位置および撮像方向が固定されており、音場測定部106の各マイク入力部107が平面状に設置されている。撮像部103で撮像される映像から、画像認識により、平面状に設置されたマイク入力部107のうち、座標が既知な3つのマイク入力部107の位置を求め、撮像された映像の座標軸と音場測定部106の平面上の座標との対応付けを求める。これらの処理は、装置を通信に利用する前に予め行っておけばよい。これにより、通信装置20の映像提示部204にてユーザb110に提示される映像の座標と通信装置10の音場測定部106の座標を一致させることができる。エフェクト401を良好に重畳させることができる。
【0048】
図8は、映像提示部にてユーザに提示されるエフェクト401の重畳された映像の、音量が小さいときの一例を示す図である。図9は、映像提示部にてユーザに提示されるエフェクトの重畳された映像の、音量が大きいときの一例を示す図である。
【0049】
空間伝播二次近似関数を求めるときには、音声提示部102で複数のテスト音を発生させる。ここでは、テスト音は、提示音声集音部105で集音する音量レベルが0dBから、5dB間隔の音量レベル(Wm)となるような5段階の音量とする。
【0050】
そして、エフェクト生成部108は、各テスト音について、各マイク入力部107で得られる音量から、音量レベル(V)が定常ノイズレベル(Vavg)を超えると推定される領域を求め、その領域に対応する映像提示部204で提示される映像領域を求める。
これを5段階の音量について行うことにより5つの領域(領域a501、領域b502、領域c503、領域d504、領域e505が得られる。
【0051】
各音量レベルについて得られた領域は、その音量レベルの音声が再生されたときの音の伝播範囲とみなすことができる。そして、各領域の境界にエフェクト401の曲線を描くことにより、エフェクト401は波紋の形状になり、通信装置20の映像提示部
204では、通信装置10の音声提示部102から波紋が発生しているように見える。
【0052】
これらの曲線を含むエフェクト401は、常に映像とともに映像提示部に204に提示可能なように、撮像部103で撮影された映像に予め重畳されている。そして、初期状態では、このエフェクト401の透明度設定は0にされており、エフェクト401は透明に描画されている。
【0053】
通信装置20にてユーザb110が発話すると、通信装置10の提示音声集音部102における音量レベルに応じて、通信装置20の映像提示部204では、音の伝播範囲内のエフェクト401の波紋の透明度が100にされる。
【0054】
ユーザa109側の音声提示部102での音量レベルが小さければ、エフェクト401はあまり広がらずエフェクト401を形成する波の数は少なくなる(図8参照)。ユーザa109側の音声提示部102での音量レベルが大きければ、エフェクト401は大きく広がりエフェクト401を形成する波の数が多くなる(図9参照)。
【0055】
以上説明したように、本実施形態によれば、予め受話側の通信装置10が音の空間伝播近似二次関数を求めておき、通信時、受話側の通信装置10が空間伝播近似二次関数を用いて送話側の通信装置20からの音声の伝播状態を求め、それをエフェクトとして、受話側の通信装置10の映像に重畳して送話側の通信装置20に送るので、通信装置20のユーザb110は、自分の発した音声が、通信装置10のユーザa109の周囲の空間にどのように提示されているかを視覚的に把握することができる。
【0056】
なお、本実施形態では、空間内の複数箇所に設置したマイク入力部107により測定した音量レベルから得られた空間伝播二次近似関数を算出することにより、空間内での実際の音声の伝播状態を推定可能である。しかし、本発明は、空間伝播関数を二次関数として近似する構成に限定されるものではない。音場測定部106のマイク入力部107の数を増やすことによって、音の空間伝播関数算出時に、高次数の関数を算出することが可能となる。複雑な音の伝播を表現できる高次数の関数によって、より精度の高い音の伝播の推定が可能となる。空間内の音声の伝播が音声提示部102で再生される音量から単純に推定できないような複雑な伝播状態を示すような場合にも、必要に応じて高次数の伝播モデルを利用することにより実際の伝播状態を高い精度で把握することができる。
【0057】
また、本実施形態では、映像上の音声の伝播状態を複数の曲線からなるエフェクト401として重畳する例を示したが、本発明はこれに限定されるものではない。受話側の音声の伝播状態を送話側にフィードバックするものであれば、どのような手段によってもよい。例えば、音声の伝播状態を、色の変化など他の態様のエフェクトとして映像上にマッピングし、フィードバックすることとしてもよい。また、音声の伝播状態をフィードバックする手段は映像によるものに限定されるものでもない。
【0058】
また、本実施形態は、双方向の映像および音声を送受信する通信システムを例示したが、本発明はこれに限定されるものではない。少なくとも音声を送受信するものであれば、必ずしも映像の送受信は必要とされない。音声通信の場合、映像以外の手段により音声の伝播状態をフィードバックすればよく、例えば、音声の伝播状態のみを表示可能な簡易な表示装置があればよい。
【0059】
また、本実施形態では、提示音声集音部105は、音声提示部102で再生された音声の音量レベルを測定することとしたが、本発明はこれに限定されるものではない。提示音声集音部105は音声提示部102のスピーカ(不図示)への入力信号のレベルを音量レベルとして測定することとし、伝播モデルの算出および実際の伝播状態の算出においてその入力信号レベルを用いることとしてもよい。
【0060】
次に、本発明の他の実施形態について説明する。
【0061】
図10は、他の実施形態による通信装置の構成を示すブロック図である。
【0062】
図10を参照すると、本実施形態の通信装置60は、集音部101、音声提示部102、撮像部103、映像提示部104、提示音声集音部105、音場測定部106、エフェクト生成部108、および波形一致判定部601を有している。
【0063】
図10には、ユーザa109の使用する通信装置のみが示されているが、これと通信するユーザb110の使用する通信装置も同様の構成である。不図示であるが、ユーザb110の使用する通信装置70は、通信装置60の各部に対応する、集音部201、音声提示部202、撮像部203、映像提示部204、提示音声集音部205、音場測定部206、エフェクト生成部208、および波形一致判定部701を有しているものとする。
【0064】
図10における集音部101、音声提示部102、撮像部103、映像提示部104、提示音声集音部105、音場測定部106は図3に示したものと同じものである。
【0065】
波形一致判定部601は、送話側波形と受話側波形が一致するか否かの判定を行う。
【0066】
ユーザb110が発話すると、その音声が通信装置70の集音部201で集音される。このときの集音部201での音量レベルを時系列で取得した波形を送話側波形1101とする。なお、送話側波形1101は、ユーザb110の使用する通信装置70で測定された波形であるが、この波形をユーザa109の使用する通信装置60に通知することとすればよい。また、通信装置10側で音声提示部102にて再生する音声データから送話側波形1101を求めることとしてもよい。
【0067】
一方、通信装置60における提示音声集音部105での音量レベルを時系列で取得した波形を受話側波形1102とする。
【0068】
送話側波形1101は、ユーザb110が発話し、集音部201で音量レベルが変化したときに取得が開始され、集音部201で1秒間の無音時間帯が計測された時点で取得が終了する。その間の時間が入力時間(T)とされる。
【0069】
受話側波形1102は、ユーザa109側の通信装置60の音声提示部102で音声が再生されるとき、取得が開始され、ユーザb110側の通信装置70の集音部201で測定された入力時間(T)が経過すると、取得が終了する。
【0070】
提示音声集音部105での集音には、音声提示部102での再生に対して遅延があり、入力時間(T)で波形の取得を終了することで、必要な音声波形を逃すことが考えられるが、ユーザb110側の集音部201の開始から終了までの時間には、1秒間の無音時間帯が含まれているため、ユーザb110の発話時の音声波形を逃すことはない。
【0071】
波形一致判定部601は、切り出された送話側波形1101と受話側波形1102の一致を判定するため、一定の誤差範囲(ここでは3dB)で両波形の一致処理を行う。この一致処理では、2つの波形が一定誤差範囲内にあれば一致と判定する。一致していないと判定されれば、提示音声集音部105に入力された音は音声提示部102からの再生音以外の音であり、ユーザb110側の集音部201へ入力された音声ではないとみなされる。一方、2つの波形が一致していると判定されれば、音場測定部106のマイク入力部107に入力された音声であるとみなされる。
【0072】
この判定結果は、波形一致判定部601からエフェクト生成部108に通知される。エフェクト生成部108は、波形が一致しないと通知された場合、エフェクト401の透明度を0に設定する。
【0073】
図11は、波形一致判定部による波形一致判定処理を示すフローチャートである。図11を参照すると、ユーザb110が通信装置70の集音部201に音声を入力すると(ステップE101)、通信装置70の集音部201にて集音が開始される(ステップE102)。ここで集音される波形が送話側波形1101となる。
【0074】
その音声は通信装置70から通信装置60に送られる。そして、通信装置60の音声提示部102にて音声が再生され、ユーザa109に提示される(ステップE103)。音声提示部102で再生された音声は、提示音声集音部105にて集音される(ステップE104)。そこで、波形一致判定部601は、送話側波形と受話側波形の一致判定を開始する(ステップE105)。
【0075】
通信装置70の集音部201にて1秒間の無音状態が検出されると、その時点で入力時間(T)が算出される(ステップE106)。そして、一致判定の開始から時間Tが経過すると、通信装置60の波形一致判定部601による一致判定が終了する(ステップE107)。
【0076】
次に、通信装置60の波形一致判定部601は、送話側波形と受話側波形の一致処理の結果、それらが一致しているか否か判定する(ステップE108)。送話側波形と受話側波形が一致していれば、そのまま処理が繰り返される。また、送話側波形と受話側波形が類似していなければ、エフェクト生成部108は、エフェクト401の透明度を0に設定する(ステップE109)。
【0077】
図12は、送話側波形と受話側波形の関係を示す図である。図12を参照すると、送話側波形1101と受話側波形1102が示されている。送話側波形と受話側波形の間にはt(ms)の遅延があるが、送話側波形の(a)の部分と受話側波形の(b)の部分とは類似している。波形一致判定部601は、この部分を一致すると判定し、エフェクト生成部108は、この部分にてエフェクト401を提示する。一方、受話側波形の(c)の部分や(d)の部分に現れている波形は、送話側波形1101にはない。波形一致判定部601は、この部分で一致しないと判定し、エフェクト生成部108はこの部分のエフェクト401の透明度を0にし、エフェクト401を透明にする。
【0078】
以上説明したように本実施形態によれば、受話側の通信装置10は、送話側波形と受話側波形との一致を判定し、それらが一致したときに不透明なエフェクト401を重畳するので、受話側の通信装置10の周囲に音声提示部102以外に大きな騒音が発生する場合にも、騒音の影響を除去し、送話側の通信装置10から送った音声の伝播状態を送話側の通信装置10のユーザb110に把握させることができる。
【0079】
なお、上述した各実施形態における通信装置は、ソフトウェアプログラムおよびそれを実行するコンピュータにより実現することができる。また、そのソフトウェアプログラムは記録媒体に記録することができ、あるいはネットワークを通じて提供することもできる。
【図面の簡単な説明】
【0080】
【図1】本実施形態による通信システムの概略構成を示すブロック図である。
【図2】本実施形態による通信システムの各装置の構成および各部の配置を示す図である。
【図3】本実施形態による通信装置の構成を示すブロック図である。
【図4】本実施形態による通信装置の空間伝播二次近似関数算出処理を示すフローチャートである。
【図5】本実施形態による通信装置のエフェクト重畳処理を示すフローチャートである。
【図6】受話側の通信装置における音場測定部の平面の座標軸と、送話側の通信装置の映像提示部に提示される映像の座標軸との対応の一例を示す図である。
【図7】受話側の通信装置における音場測定部の平面の座標軸と対応付けられた、送話側の通信装置の映像提示部にて提示される映像の一例を示す図である。
【図8】映像提示部にてユーザに提示されるエフェクトの重畳された映像の、音量が小さいときの一例を示す図である。
【図9】映像提示部にてユーザに提示されるエフェクトの重畳された映像の、音量が大きいときの一例を示す図である。
【図10】他の実施形態による通信装置の構成を示すブロック図である。
【図11】波形一致判定部による波形一致判定処理を示すフローチャートである。
【図12】送話側波形と受話側波形の関係を示す図である。
【符号の説明】
【0081】
10、60 通信装置
101 集音部
102 音声提示部
103 撮像部
104 映像提示部
105 提示音声集音部
106 音場測定部
107 マイク入力部
108 エフェクト生成部
109 ユーザa
110 ユーザb
20、70 通信装置
201 集音部
202 音声提示部
203 撮像部
204 映像提示部
205 提示音声集音部
206 音場測定部
207 マイク入力部
208 エフェクト生成部208
30 通信網
401 エフェクト
501 領域a
502 領域b
503 領域c
504 領域d
505 領域e
61 波形一致判定部
1101 送話側波形
1102 受話側波形
A101〜A105、B101〜B104、C101〜C103、D101〜D1041、E101〜E109 ステップ

【特許請求の範囲】
【請求項1】
少なくとも音声を相互に送受信して通信を行う通信装置であって、
相手側装置から受信した音声を再生したときの音量レベルを測定する提示音声集音部と、
音声をユーザに提示する空間内での音声の伝播モデルを予め求めておき、前記相手側装置からの音声が再生されたとき、前記提示音声集音部で測定された音量レベルと前記伝播モデルとから、前記相手側装置からの前記音声の前記空間内での伝播状態を算出し、該伝播状態の情報を前記相手側装置に送信する伝播状態情報生成部とを有する通信装置。
【請求項2】
音声に加えて前記空間内の映像が相互に送受信されており、
前記伝播状態情報生成部は、前記伝播状態の情報を前記空間内の映像にエフェクトとして付加して前記相手側装置に送信する、請求項1記載の通信装置。
【請求項3】
所定のテスト音が発生されたときの、前記空間内の複数箇所の音量レベルを測定する音場測定部をさらに有し、
前記伝播状態情報生成部は、前記音場測定部で測定された複数の音量レベルを用いて前記伝播モデルを算出する、請求項1または2に記載の通信装置。
【請求項4】
前記伝播モデルは、前記提示音声集音部で測定される音量レベルと前記空間内の任意点の音量レベルとの関係を示すn次近似関数であり、
前記音場測定部は、前記n次近似関数の次数に応じた数の箇所の音量レベルを測定する、請求項3に記載の通信装置。
【請求項5】
前記相手側装置から受信した音声について、該相手側装置での波形と前記提示音声集音部での波形が一致するか否かを判定する波形一致判定部をさらに有し、
前記伝播状態情報生成部は、前記波形一致判定部にて一致と判定された期間について、前記伝播状態の情報を前記相手側装置に送信する、請求項1〜4のいずれか1項に記載の通信装置。
【請求項6】
通信装置にて少なくとも音声を相互に送受信して通信を行う通信方法であって、
音声をユーザに提示する空間内での音声の伝播モデルを予め求めておくステップと、
相手側装置から受信した音声を再生したときの音量レベルを測定するステップと、
前記相手側装置からの音声が再生されたときに測定された前記音量レベルと前記伝播モデルとから、前記相手側装置からの前記音声の前記空間内での伝播状態を算出し、該伝播状態の情報を前記相手側装置に送信するステップとを有する通信方法。
【請求項7】
音声に加えて前記空間内の映像が相互に送受信されており、
前記伝播状態の情報を前記空間内の映像にエフェクトとして付加して前記相手側装置に送信する、請求項6記載の通信方法。
【請求項8】
所定のテスト音を発声されたときの前記空間内の複数箇所の音量レベルを測定し、
前記空間内の複数箇所で測定された前記音量レベルを用いて前記伝播モデルを算出する、請求項6または7に記載の通信方法。
【請求項9】
前記相手側装置から受信した音声について、該相手側装置での波形と自装置にて測定した波形とが一致するか否かを判定し、一致と判定された期間について、前記伝播状態の情報を前記相手側装置に送信する、請求項6〜8のいずれか1項に記載の通信方法。
【請求項10】
請求項6〜9のいずれか1項に記載の通信方法における各ステップの動作をコンピュータに実行させるための通信用プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate


【公開番号】特開2006−238344(P2006−238344A)
【公開日】平成18年9月7日(2006.9.7)
【国際特許分類】
【出願番号】特願2005−53540(P2005−53540)
【出願日】平成17年2月28日(2005.2.28)
【出願人】(000004226)日本電信電話株式会社 (13,992)
【Fターム(参考)】