説明

電話会議装置

【課題】ステレオ方式の電話会議装置を提供する。
【解決手段】筺体と、筺体の両端に収容されている第1マイクロホンおよび第2マイクロホンと、筺体の両端に収容されている第1スピーカおよび第2スピーカと、他地点からの音声信号を受信し、当該他地点へ音声信号を送信する送受信部を具備し、第1マイクロホンと第2マイクロホンの配列方向は、第1スピーカと第2スピーカとの配列方向と直交する方向にあり、送受信部により受信した、他地点の電話会議装置の第1マイクロホン、第2マイクロホンで収音された音声はそれぞれ、自地点の電話会議装置の第1スピーカ、第2スピーカで再生され、送受信部により送信した、自地点の電話会議装置の第1マイクロホン、第2マイクロホンで収音された音声は、それぞれ、他地点の電話会議装置の第1スピーカ、第2スピーカで再生される。

【発明の詳細な説明】
【技術分野】
【0001】
この発明は、遠隔地を結んで行う通信会議で利用される電話会議装置に関する。
【背景技術】
【0002】
遠隔地を通信網で結んで行われる通信会議は、遠隔地に出向く必要がなく、移動時間の短縮や出張費の削減が可能なため、ビジネス用途として広く利用されている。通信会議は映像を用いたTV会議と、音声のみを用いた電話会議の2つのタイプに分けることが出来る。従来では、モノラル(1チャネル)音声伝送で実現されている電話会議装置がある(非特許文献1、特許文献1など参照)。
【非特許文献1】”音声会議装置”[online]NTT東日本[平成20年11月7日検索]インターネット〈URL:http://www.ntt-east.co.jp/office/goods/mbox/index.html〉
【特許文献1】特開2004−260280号
【発明の開示】
【発明が解決しようとする課題】
【0003】
現在、電話会議はモノラル(1チャネル)音声伝送で実現されているが、電話会議ではステレオ(2チャネル)音声伝送による遠隔通信の要望があり、今後、ステレオ音声伝送に移行していくと考えられる。ステレオ(2チャネル)再生はモノラル再生に比べて、2つのスピーカがあるために再生音の空間的な分離が可能であり、異なる再生音の識別性を向上させることが出来る。具体的には、2人の男性の声を1つのスピーカからまとめて再生するよりも、空間的に分かれた2つのスピーカから独立に再生する方がその識別性が向上する。電話会議は、TV会議に比べて、使用する装置自体が小型のためにオフィスの色々な場所に持ち運ぶことができ、手軽に利用できるという点があるが、電話会議は音声のみを用い映像がないため、TV会議と比べると、話者の識別性が劣る(誰が話しているか分かりにくい)。そのため、ステレオ音声による通信は電話会議の識別性向上のためにも有効である。しかし、従来には、ステレオ(2チャネル収音/再生)通信を想定して、マイク・スピーカを配置した電話会議装置はこれまで実現されていなかった。
【課題を解決するための手段】
【0004】
この発明の電話会議装置は、筺体と、第1マイクロホンおよび第2マイクロホンと、第1スピーカおよび第2スピーカと、送受信部と、を具備する。第1マイクロホンおよび第2マイクロホンはそれぞれ音声を収音し、筺体の両端に収容されている。第1スピーカおよび第2スピーカは、それぞれ音声を再生し、筺体の両端に収容されている。送受信部は他地点からの音声信号を受信し、当該他地点へ音声信号を送信する。第1マイクロホンと第2マイクロホンの配列方向は、第1スピーカと第2スピーカとの配列方向と直交する方向にある。送受信部により受信した、他地点の電話会議装置の第1マイクロホン、第2マイクロホンで収音された音声はそれぞれ、自地点の電話会議装置の第1スピーカ、第2スピーカで再生される。送受信部により送信した、自地点の電話会議装置の第1マイクロホン、第2マイクロホンで収音された音声は、それぞれ、他地点の電話会議装置の第1スピーカ、第2スピーカで再生される。
【発明の効果】
【0005】
この発明の電話会議装置によれば、ステレオ(2チャネル収音/再生)通信を想定した電話会議を行うことができる。従って、話者の識別性を向上させた電話会議を行うことができる。
【発明を実施するための最良の形態】
【0006】
以下に、発明を実施するための最良の形態を示す。なお、同じ機能を持つ構成部や同じ処理を行う過程には同じ番号を付し、重複説明を省略する。
【実施例1】
【0007】
図1に実施例1の電話会議装置100の機能構成例の斜視図を示し、図2に網部106、108、110を省略した場合の電話会議装置100の機能構成例の斜視図を示す。まず、図1、図2を用いて電話会議装置100の形状について説明する。収音手段とは例えばマイクロホンであり、再生手段とは例えばスピーカである。以下では収音手段をマイクロホンとし、再生手段をスピーカとする。筺体102内に第1マイクロホン32および第2マイクロホン34、第1スピーカ22および第2スピーカ24が収容される。筺体102の形状は、直方体形状などの一定の方向に伸びた形状であることが好ましい。以下では、図1に示すように、筺体102が直方体形状であるとして説明する。筺体102は網部106、108、110と本体部112、キャビティ部1124、キャビティ部1122と、で構成されている。
【0008】
本体部112の長手方向両端にスピーカを収容するためのキャビティ部1122、1124がそれぞれ設けられる。キャビティ部1122、1124はそれぞれ上面が開口された筺体であり、それぞれ第1スピーカ22、第2スピーカ24が収容される。図2の記載では、キャビティ部1122、1124の厚みについては、省略している。キャビティ部1122、1124の開口が位置する面をそれぞれ開口面1122a、1124aとする。図2の例では、スピーカ22、24の振動面22a、24aが上向きになるようにし、振動面22a、24aが開口面1122a、1124aと同一平面になるように、第1スピーカ22、第2スピーカ24が収容される。振動面22a、24aに設けられた固定部(図示せず)により第1スピーカ22、第2スピーカ24は固定される。キャビティ部1122、1124の開口を網部108、110で覆う。網部108、110は、スピーカ22、24からの再生音を通すような金網などを用いれば良い。この例では、スピーカ22、24の振動面22a、24aを上方に向けているが、お互いに内側に向けなければ、どの方向でもよい。
【0009】
図3に、キャビティ部に2つのスピーカを収容させた場合の電話会議装置の機能構成例の斜視図を示し、図4にキャビティ部1124の拡大斜視図を示す。図3に示すように、キャビティ部1124(キャビティ部1122も同様)に2つのスピーカ24、24を収容させることもできる。図4に示すように、、筺体102の長辺と同一方向にあり、かつ上側に位置する辺をそれぞれ102b、102cとすると、各スピーカ24、24の中心軸24a、24aをそれぞれ長辺102b、102cと直交する方向にし、102aを垂直に貫く垂直軸24bと、各スピーカ22、22の中心軸22a、22aとが例えば約45度をなすように傾けければ良い。なお、説明簡略化のためにスピーカの収容穴を省略する。
【0010】
本体部112の中央上面には、筺体102の幅方向に貫通溝を設ける(凹型にする)ことでマイクロホン収容部1130が設けられる。マイクロホン収容部1130の面のうち、上面102aと平行な面である収容面1130a上には、筺体102の幅方向両端にマイクロホン32、34を配置させる。お互いの収音面(図示せず)を相反して外側に向けることが好ましいが、お互いに内側に向けなければ、どの方向でもよい。そして、図1のように、貫通溝(マイクロホン収容部1130)を網部106で覆う。また、第1マイクロホン32と第2マイクロホン34の配列方向は、第1スピーカ22と第2スピーカ24との配列方向と直交する方向にあることが好ましい。理由は以下で説明する。
次に、この電話会議装置100を用いた電話会議システムを説明する。電話会議装置を用いた電話会議を行う場所は会社の会議室であり、電話会議に用いられる会議卓の天板は長方形状であり、電話会議装置を挟んで2つの長辺部分に参加者が対峙して座る場合が多い。例えば、営業担当と開発担当、管理者と作業者などである。そして、発明者は会議卓に置かれた電話会議装置を参加者が取り囲んで行う場合が多いことに着目し、このような電話会議に適した電話会議装置を発明した。図5に電話会議装置を真上から見た場合のマイクロホンとスピーカの配置、電話会議の話者(参加者)と装置の相対位置、2つのスピーカから再生される相手側の話者音声の対応を示す。図6に、この実施例1の電話会議システムの機能構成例を示す。当該電話会議はお互いに遠隔である自地点と他地点で行うとする。自地点、他地点にある電話会議装置をそれぞれ第1電話会議装置100、第2電話会議装置100とし、電話会議装置100、100はそれぞれネットワーク50で結ばれているとする。また、図5では便宜上、第1スピーカ22、第2スピーカ24の振動面がそれぞれ相反して外側に向いているように記載している。電話会議装置100、100の長辺と会議卓の天板の長辺とが平行になるように、会議卓の中央に配置させることが好ましく、図5の記載では会議卓を省略している。電話会議装置を挟んで会議卓の2つの長辺部分に参加者が対峙して座る場合を想定する。自地点では第1話者(電話会議の参加者)12、第2話者14が対峙して座り、他地点では第1話者16、第2話者18が対峙して座る。第1話者12、第2話者14に向けて、第1電話会議装置100の第1マイクロホン32、第2マイクロホン34が配置され、第1話者16、第2話者18に向けて、第2電話会議装置100の第1マイクロホン36、第2マイクロホン38が配置されるとする。第1話者12、第2話者14、第1話者16、第2話者18はそれぞれ複数いてもよい。また、本発明の電話会議装置ではマイクロホンへの音声入力とスピーカの出力を対応させる。対応例を以下に示す。お互いの電話会議装置の音声の送受信は、送受信部(以下で説明)により行われる。
【0011】
第1電話会議装置100の第1マイクロホン32(主に第1話者12の音声)→第2会議装置100の第1スピーカ26から出力
第1電話会議装置100の第2マイクロホン34(主に第2話者14の音声)→第2会議装置100の第2スピーカ28から出力
第2電話会議装置100の第1マイクロホン36(主に第1話者16の音声)→第1会議装置100の第1スピーカ22から出力
第2電話会議装置100の第1マイクロホン38(主に第2話者18の音声)→第1会議装置100の第2スピーカ24から出力
つまり、図4からも明らかなように、マイクロホンによる音声の収音位置と、スピーカによる音声の再生位置とが相対的に90度回転(図4の例では時計回り)されていることが理解できよう。このように、相対的に90度回転させた理由は、第1話者12側に複数人(図5では図示せず)の話者の音声と、第2話者14側に複数人の話者の音声がそれぞれまとめて第1スピーカ26、第2スピーカ28から別々に分離して再生するためである。
【0012】
次に、図6に第1電話会議装置100、第2電話会議装置100、の詳細図を示し、各構成部の処理内容を説明する。第1マイクロホン32、第2マイクロホン34で収音された第1話者12、第2話者14からの音声(この例では、それぞれLチャネル、Rチャネルのアナログ音声信号とする。)はそれぞれAD変換部62、AD変換部64に入力され、それぞれLチャネル、Rチャネルのデジタル音声信号に変換される。Lチャネル、Rチャネルのデジタル音声信号は送受信部82によりネットワーク50を経由して、第2電話会議装置の送受信部84に送信される。送受信部84で受信したLチャネル、Rチャネルのデジタル音声信号はクロストーク低減部92に入力され、Lチャネル、Rチャネルのクロストークが低減される。
【0013】
ここでクロストークについて説明する。図4記載のように2つ(または複数)のマイクロホンで音声を収音すると、例えば第1話者12に最も近いメインのマイクロホン(図4中では、第1マイクロホン32)以外のマイクロホンである第2マイクロホン34にも、第1話者12の音声が若干、収音される。このように、メインマイクロホン(第1マイクロホン32)以外のマイクロホン(第2マイクロホン34)に収音された音声信号はクロストークという。このような環境で第2電話会議装置100の第1スピーカ26、第2スピーカ28から再生する場合を考える。この場合、第1マイクロホン32で収音された音声の大部分は、第1スピーカ26から再生されるが、第1話者12のクロストークが第2スピーカ28から再生される。通常、ステレオ再生のスイートスポットと呼ばれる場所(2つのスピーカの中央位置)でこのクロストークを含んだステレオ音声を受聴すると、少し音像が中心にずれたように聴こえる。これに対して、スイートスポットの位置以外の、第2スピーカ28に近い位置で受聴すると、先行音効果などによりどちらかのスピーカから音声が再生されたか曖昧になってしまう問題がある。これでは、ステレオ(2チャネル)で収音再生しても、音像がずれたり、ぼけたりして、話者の識別性が劣化してしまうという問題がある。そこで、クロストークを低減させるための技術が、特開2007−74665号(以下、「参考文献1」という。)などに、記載されている。クロストーク低減部の処理内容を簡単に説明すると、聴取者の位置に寄らず、全ての聴取者に音の方向を正しく知覚させる技術である。参考文献1の図7や図8に記載されている。具体的には、2本のマイクロホンで収音した信号をチャネル間のレベル差や位相差に基づいて重み付けし、各出力信号には個々の音源の信号成分が含まれるよう、音源数と同数の出力信号を作成し、各々のスピーカで再生し実現する。クロストーク低減部92は当該参考文献1に記載されているものや、その他、公知技術を用いればよい。
クロストーク低減部92によりクロストークが低減されたLチャネル、Rチャネルのデジタル音声信号はそれぞれDA変換部72、74に入力され、アナログ音声信号に変換される。そして、第1スピーカ26でLチャネルの再生音に変換され、再生され、第2スピーカ28でRチャネルの再生音に変換され、再生される。
【0014】
次に、他地点にいる第1話者16、第2話者18の音声が第1マイクロホン36、第2マイクロホン38に収音されてから、自地点の第1スピーカ22、第2スピーカ24に再生されるまでの処理の流れは、同様であるが、念のため説明する。
【0015】
第1マイクロホン36、第2マイクロホン38で収音された第1話者16、第2話者18からの音声(それぞれLチャネル、Rチャネルのアナログ音声信号)はそれぞれAD変換部66、AD変換部68に入力され、それぞれLチャネル、Rチャネルのデジタル音声信号に変換される。Lチャネル、Rチャネルのデジタル音声信号は送受信部84によりネットワーク50を経由して、第1電話会議装置の送受信部82に送信される。送受信部82に受信したLチャネル、Rチャネルのデジタル音声信号はクロストーク低減部90に入力され、Lチャネル、Rチャネルのクロストークが低減される。クロストーク低減部90によりクロストークが低減されたLチャネル、Rチャネルのデジタル音声信号はそれぞれDA変換部72、74に入力され、アナログ音声信号に変換される。そして、第1スピーカ22でLチャネルの再生音に変換され、再生され、第2スピーカ24でRチャネルの再生音に変換され、再生される。送受信部と低減クロストーク部は電話会議装置の筺体102に収容されている。
【0016】
ここで、本発明の電話会議装置の特長である、第1スピーカ22、第2スピーカ24、第1マイクロホン32、第2マイクロホン34の配置、電話会議装置の寸法および重さの詳細について説明する。
【0017】
まず、各スピーカの位置について説明する。第1スピーカ22と、第2スピーカ24との距離(以下、「スピーカ間距離」という。)を短くして、音声を再生すると、話者を分離して再生することが難しい。つまり、2つのスピーカがあっても、それぞれが近くに位置するスピーカから音声が再生されるので、1つのスピーカから再生されている場合と変わらず、話者の識別性は低くなってしまう。逆に、スピーカ間距離を長くすると、電話会議装置自体のサイズが大きくなってしまい、持ち運びに不便なものになってしまう。更には、スピーカ間距離はマイクロホン間距離よりも長くしなければならず、筺体はある方向に伸びた立体的形状であることが好ましく、例えば略直方体形状であることが好ましい。ここで、略直方体形状とは、完全な直方体形状も含むものとする。そして、スピーカ間距離(≒筺体の長手方向の長さL)を略20cm以上であれば良いことを度重なる実験により求めた。
【0018】
次に、各マイクロホンの位置について説明する。第1マイクロホン32、第2マイクロホン34の距離(以下、「マイクロホン間距離」という。)を短くすると、クロストーク量が多くなってしまい、上述のようにステレオ再生の効果が薄れてしまう。マイクロホン間距離を長くすると、クロストーク量は少なくなるが、電話会議装置のサイズは大きくなってしまい、持ち運びに不便なものになってしまう。また、少量のクロストークであれば、上記クロストーク低減部で低減させることができる。従って、マイクロホン間距離はスピーカ間距離より短くてもよい。例えば、電話会議装置の筺体が直方体形状である場合の幅方向両端に収容させればよい。そして、電話会議装置のサイズ、クロストークの量を勘案して、筺体の幅(≒マイクロホン間距離)(図1記載のL)を略10cmであればよいことを度重なる実験により求めた。
【0019】
次に、各マイクロホンと各スピーカの相対的位置について説明する。マイクロホンとスピーカとの距離が短いと、ハウリングを起こしてしまう。また、マイクロホンとスピーカとの距離が長いと、電話会議装置のサイズは大きくなってしまう。そこで、第1マイクロホン32と第2マイクロホン34の配列方向は、第1スピーカ22と第2スピーカ24との配列方向と直交する方向にある、換言する
と、第1マイクロホン32および第2マイクロホン34を結ぶ線分(以下、「マイクロホン間線分」という。)は、第1スピーカ22および第2スピーカ24を結ぶ線分(以下、「スピーカ間線分」という。)と直交する方向であることが好ましいことを求めた。ここで、「マイクロホン間線分はスピーカ間線分と直交する方向である」とは、適切にステレオ方式の電話会議をできる程度(つまり、マイクロホンとスピーカとの間でハウリングを起こさない程度)に、マイクロホン間線分とスピーカ間線分とが位置することも含むとする。
また、マイクロホン間線分はスピーカ間線分を二分する方向であることがなお好ましい。
【0020】
また上述のように、電話会議に用いられる会議卓の天板は長方形状であり、当該天板上に電話会議装置を置き、電話会議装置を挟んで2つの長辺部分に参加者が対峙して座り、複数の話者が電話会議装置を取り囲んで会議を行う場合が多い。そして、電話会議装置が略直方体形状であれば、電話会議装置の長辺と会議卓の長辺とがほぼ平行になるように、電話会議装置を会議卓に配置させることができるので、このような形態の会議では使い勝手がよい。
【0021】
一般的に、電話会議装置は持ち運びできるようにすることが望ましい。従って、人間が抱えて移動できる程度の大きさ、重さにすることが好ましく、1〜2kgの重さであり、電話会議装置の容積を小さくした方がよい。従って、電話会議装置の高さ(図1記載のL)が約10cmであることが好ましく、また、電話会議装置の長さ方向の長さLを約150cm以下であることが好ましいことを求めた。
【0022】
この実施例の電話会議装置100は、ステレオ方式の電話会議装置である。そして、発明者はステレオ方式の電話会議を実現すべく、「マイクロホン間距離」「スピーカ間距離」「各マイクロホンと各スピーカの相対的位置」「電話会議の形態」全てを勘案した上で、この電話会議装置100を発明した。そして、上述のように、スピーカ間距離は20cm以上であり、電話会議装置100の長手方向の長さLは150cm以下であり、幅Lは約10cm、高さLは約10cmであることが好ましいことを度重なる実験の上、求めた。このような構成をとることにより、他地点の話者を識別できるステレオ方式の電話会議を実現できるという顕著な効果を有する。
【実施例2】
【0023】
実施例1の電話会議装置100中のクロストーク低減部によって、クロストークを完全に消し去ることは難しく、少量のクロストークが残ってしまう。また、過剰なクロストーク低減を行うと、メインの音声を歪ませるという問題がある。そこで、図5中の他地点の電話会議装置100において少量のクロストークが残ったまま、スピーカから音声が再生される場合を考える。そうすると、自地点の第1話者12の音声(第1マイクロホン32で収音)は、主に他地点の第1スピーカ26で再生される。しかし、クロストークが残っていることにより、第1話者12の多少の音声が、第2スピーカ28からも再生される。そのため、第1話者12の音声は、第1スピーカ26よりも若干、電話会議装置の中央側(第2スピーカ28側)に寄って聴こえる。同様に、残っているクロストークの影響で、自地点の第2話者14の音声も同様に第2スピーカ28から再生されるが、第1スピーカ26よりも若干、電話会議装置の中央側(第2スピーカ28側)に寄って聴こえる。したがって、本来、完全に独立したステレオ信号で再生されるよりも電話会議装置の中央による分、分離精度が劣化する。そこで、この実施例2では、クロストーク低減は実施例1のままとし、視覚的な情報提示により、ステレオ音声の分離を強調(補助)する。
【0024】
図7に、実施例2の電話会議装置200および200とからなる電話会議システムの機能構成例を示し、図8に電話会議装置200および200の機能構成例を示す。電話会議装置200は、電話会議装置100と比較して、第1スピーカ22、第2スピーカ24の近傍に第1発光素子92、第2発光素子94が配置されている点、および、発光素子制御信号生成部202、発光素子制御部204が具備されている点で異なる。同様に、電話会議装置200は、電話会議装置100と比較して、第1スピーカ26、第2スピーカ28の近傍に第1発光素子96、第2発光素子98が配置されている点、および、発光素子制御信号生成部206、発光素子制御部208が具備されている点で異なる。ここで、「スピーカの近傍」とはスピーカ自身に発光素子が取り付けられていることも含む。また発光素子とは、発光ダイオード(LED)や、ランプ、液晶素子を用いれば良い。
【0025】
発光素子制御信号生成部202は、他地点の第1マイクロホン36側の第1話者16よりの音声が当該第1マイクロホン36で主に収音されると、自地点の第1発光素子92を発光させ、他地点の第2マイクロホン38側の第2話者18よりの音声が当該第2マイクロホン38で主に収音されると、自地点の第2発光素子94を発光させる。換言すれば、自地点の第1スピーカ22から再生される音声が他地点の第1話者16により支配的に発声されている場合、即ち、他地点の第1話者16が主に発言している場合には、第1発光素子92を発光させる。逆に、自地点の第2スピーカ24から再生される音声が他地点の第2話者18により支配的に発声されている場合、即ち、第2話者18が主に発言している場合には、第2発光素子94を発光させる。他地点の第1発光素子96、第2発光素子98についても同様であるので、説明は省略する。このような視覚提示を再生音の再生とともに行うことにより、ステレオ再生による話者の識別性を向上させる。
【0026】
図8を用いて、発光素子制御信号生成部202の処理内容を具体的に説明する。第1電話会議装置200のクロストーク低減部90から出力されたLチャネル、Rチャネルのデジタル音声信号はそれぞれ、発光素子制御信号生成部202に入力される。そして、発光素子制御信号生成部202はLチャネル、Rチャネルのどちらか支配的か、すなわち、他地点の第1話者16、第2話者18のどちらが発言しているかを判別して、発光素子制御信号を生成、出力する。
【0027】
ここで、判別の方法は、最も簡単な方法としては、任意の時間内のLチャネルの信号(他地点の第1マイクロホンから入力された信号)パワー、またはRチャネルの信号(他地点の第2マイクロホンから入力された信号)パワーを比較してその大小を判別し、大きいほうのチャネルに対応する発光素子を発光させる発光素子制御信号を生成する。もしくは、LチャネルおよびRチャネルの信号を離散フーリエ変換等の処理を行うことで、周波数成分に変換し、各周波数成分毎に個別にパワーを比較した後、その総数で判別し、総数の多いほうのチャネルに対応する発光素子を発光させる発光素子制御信号を生成してもよい。発光素子制御信号は発光素子制御部204に入力される。
【0028】
発光素子制御部204は、入力された発光素子制御信号に応じて、発光素子を発光させる。上述のように、Lチャネル信号が支配的な場合、すなわち、他地点の第1話者16が発言している場合には、第1スピーカ22から第1話者16の音声が再生されると同時に、発光素子制御部204は、自地点の第1発光素子92を発光させる。Rチャネル信号が支配的な場合、すなわち、他地点の第2話者18が発言している場合には、第2スピーカ24から第2話者18の音声が再生されると同時に、発光素子制御部204は、自地点の第2発光素子94を発光させる。
【0029】
このようにクロストークの残存により明確にステレオ音声の分離をできない場合であっても、この実施例2の電話会議装置200であれば、視覚的に話者を判断できるので、結果としてステレオ音声の分離を強調できる。
【実施例3】
【0030】
実施例2の電話会議装置200では、第1マイクロホン側の話者が存在し得る領域(以下、「第1領域」という。)、第2マイクロホン側の話者が存在し得る領域(以下、「第2領域」という。)のどちらか(ステレオ信号でいえば、L側もしくはR側のどちらか)しか判別できない。そこで、この実施例3では、第1領域、第2領域に複数の話者がいる場合であっても、どの話者が発声しているかを、他地点の話者に示すものである。この実施例3の基本理念は、「特許出願番号:特願2008−244099号 発明の名称「通信装置」」に記載されているが、念のため説明する。
【0031】
図9に実施例3の電話会議装置300、300を電話会議システムの機能構成例を示し、図10に電話会議装置300、300の機能構成例を示す。図10では、説明簡略化のために、ネットワーク50の記載を省略しているが、第1電話会議装置300と、第2電話会議装置300とはネットワーク50で接続されている。
【0032】
電話会議装置300は電話会議装置200と比較して、第1マイクロホン、第2マイクロホンを複数、第1スピーカ、第2スピーカ近傍に具備する点で異なる。電話会議装置300の複数の第1マイクロホンを32〜32とし、複数の第2マイクロホンを34〜34とし、複数の第1発光素子を92〜92とし、複数の第2発光素子を94〜94とする。同様に、電話会議装置300の複数の第1マイクロホンを36〜36とし、複数の第2マイクロホンを38〜38とし、複数の第1発光素子を96〜96とし、複数の第2発光素子を98〜98とする。
【0033】
この実施例では、第1領域、第2領域を複数の領域に分割する。図9では、自地点の第1領域、第2領域をそれぞれV個、W個の区分領域に分割し、他地点の第1領域、第2領域をX個、Y個の区分領域に分割する。自地点の第1区分領域、第2区分領域をそれぞれA〜A、B〜Bとし、他地点の第1区分領域、第2区分領域をそれぞれC〜C、D〜Dとする。そして、他地点の第1区分領域C〜Cと自地点の複数の第1発光素子92〜92とをそれぞれ対応させ、他地点の第2区分領域C〜Cと自地点の複数の第2発光素子94〜94とをそれぞれ対応させる。この例では、複数の区分領域、複数の発光素子の対応は、それぞれの参照番号の添え字で対応させるものとする。例えば、Cと92、Cと94とが対応されているとする。そして、図9に示すように、他地点の第2区分領域Dに第1話者18が位置し、第1区分領域Dに第2話者18が位置する場合を考える。この場合、第1話者18が発声すると、(第1話者18が位置する第1区分領域Dに対応する)自地点の第2発光素子94が発光する。また、第2話者18が発声すると、(第2話者18が位置する第2区分領域Dに対応する)自地点の第2発光素子94が発光する。なお、他地点の第1区分領域、自地点の第1区分領域、第2区分領域についても同様である。このように、自地点の電話会議の話者(参加者)達は、自地点の発光素子の発光により、どの領域に位置する他地点の話者が発声しているかを認識できる。
【0034】
図10を用いて、具体的な発光素子の発光処理について説明する。第1マイクロホン32〜32から入力されたアナログの音声信号(Lチャネル)はそれぞれ対応するAD変換部62〜62に入力され、それぞれ、デジタル音声信号に変換される。同様に、第1マイクロホン34〜34から入力されたアナログの音声信号(Rチャネル)はそれぞれ対応するAD変換部64〜64に入力され、それぞれ、デジタル音声信号に変換される。変換されたデジタル音声信号は全て、クロストーク低減部90に入力され、各々の信号のクロストークが低減された後に、2チャネル集約部310および位置情報生成部312に入力される。
【0035】
位置情報生成部312は、複数の第1マイクロホンから入力されたデジタル音声信号から、複数の第1マイクロホン32〜32側にいる第1話者の位置を検出することで第1話者位置情報を生成し、複数の第2マイクロホン34〜34から入力された音声信号から、複数の第2マイクロホン34〜34側にいる話者の位置を検出することで第2話者位置情報を生成する。話者位置情報とは話者がどの位置にいるかを示す情報である。
【0036】
位置情報生成部312による具体的な話者位置情報の生成手法は、複数マイクロホン32〜32各々の到来時間差を用いて、話者の発話位置(方向)を推定したり、それぞれのマイクロホンに入力された音声信号のパワーが一番大きいものを選択したりすることにより、入力された音声と各話者をマッピングする。その他、この話者の位置の推定はマイクロホンアレー技術としては一般的なものを用いれば良い。また、この実施例3ではマイクロホンが複数ある場合を説明しているが、1つのマイクロホンでも実施できる。この場合には、例えば、複数の鋭い指向性1つのマイクロホンを使用して実施できる。話者位置情報の生成手法の詳細は、特開平9−261351号の明細書等に記載されているので参照されたい。生成された話者位置情報は発光素子制御信号生成部314に入力される。
【0037】
次に、発光素子制御信号生成部314は、第1話者位置情報が示す第1話者(図9では、第1話者12、12)が位置する区分領域(図9では、区分領域A、A)に対応する他地点の複数の第1発光素子(図9では、第1発光素子96、96)を発光させる第1発光素子制御信号を生成する。また、発光素子制御信号生成部314は、第2話者位置情報が示す第2話者が位置する区分領域に対応する他地点の第2発光素子を発光させる第2発光素子制御信号を生成する。
【0038】
また、2チャネル集約部310は、複数のAD変換部62〜62のデジタル音声信号を集約してLチャネル信号を生成する。具体的には、それぞれのデジタル音声信号を加算した後、総数Nで割る等の手法がある。同様に、複数のAD変換部64〜64のデジタル音声信号を集約してLチャネル信号を生成し、例えば、それぞれのデジタル音声信号を加算した後、総数Mで割る等の手法がある。
【0039】
そして、送受信部82は、2チャネル集約部310よりのLチャネル信号およびRチャネル信号(以下、まとめて「ステレオ信号」という。)、発光素子制御信号生成部314よりの第1発光素子制御信号、第2発光素子制御信号をネットワーク50を経由して他地点の電話会議装置300に向けて送信する。2つの発光素子制御信号は、ステレオ信号自体に埋め込んでも良いし、符号化されたステレオ信号自体のヘッダに書き込んでも良いし、ステレオ信号とは個別に第1発光素子制御信号、第2発光素子制御信号を送信してもよい。
【0040】
一方、他地点の電話会議装置300から、ステレオ信号、第1発光素子制御信号、第2発光素子制御信号が送信された場合を説明する。図9の例では、電話会議装置300からのLチャネルの信号は存在せず、Rチャネル信号とは第2話者18、18の音声が混合されたものである。また、第1発光素子制御信号については存在せず、第2発光素子制御信号については、区分領域D(第2話者18が位置する区分領域)と区分領域D(第2話者18が位置する区分領域)に対応する第2発光素子を発光させる旨のものである。
【0041】
ステレオ信号であるLチャネル信号、Rチャネル信号はそれぞれDA変換部72、DA変換部74に入力され、アナログ音声信号に変換される。そして第1スピーカ22、第2スピーカ24により、Lチャネルの再生音、Rチャネルの再生音として再生される。
【0042】
また、発光素子制御部304は、入力された第1話者位置情報を用いて音声を発している第1話者が位置する領域に対応する第1発光素子を発光させ、前記第2話者位置情報を用いて音声を発している第2話者が位置する領域に対応する第2発光素子を発光させる。図9の例では、他地点の第2区分領域D、Dにはそれぞれ第2話者18、第2話者18がそれぞれ位置するので、第2話者18が音声を発している時間区間中は、発光素子制御部304は第1発光素子94(第2話者18が位置する区分領域Dに対応する発光素子)を発光させ、第2話者18が音声を発している時間区間中は、発光素子制御部304は第1発光素子94(第2話者18が位置する区分領域Dに対応する発光素子)を発光させる。他地点の第2電話会議装置300の処理内容についても、第1電話会議装置300の処理内容と同様なので省略する。
【0043】
次に変形例について説明する。上述の説明では、第1発光素子、第2発光素子をそれぞれ複数設けたが、それぞれの発光素子を1つとしても良い。この場合には1つの発光素子が複数の発光色で発光するようにし、発光色と他地点の区分領域とを対応させるようにしておけば良い。例えば、複数の発光色を赤色、青色、黄色とした場合に、赤色と第1区分領域A、青色と第1区分領域A、黄色と第1区分領域A、というように対応させる。このようにすることで、発光素子を1つのみ具備すればよいので結果として、電話会議装置の更なる小型化を図ることができる。
【0044】
また、技術思想1として複数の第1発光素子のそれぞれの発光色、複数の第2発光素子のそれぞれの発光色が異なるようにすることもできる。これにより、他地点の話者(参加者)達は視覚的に発光素子の発光を認識でき、結果として、より明確な自地点の話者の識別ができる。
【0045】
また、技術思想2として複数の第1発光素子のそれぞれの発光面の形状が異なり、複数の第2発光素子のそれぞれの発光面の形状が異なるようにすることもできる。例えば、それぞれの発光面の形状を、矩形、丸形、星形などにすればよい。これにより、他地点の話者(参加者)達は視覚的に発光素子の発光を認識でき、結果として、より明確な自地点の話者の識別ができる。また、技術思想1と技術思想2と組み合わせてもよい。
【0046】
また、図11に示すように、発光素子400aを複数具備することで発光素子群400とし、当該発光素子群400の発光により、領域に対応した領域特定情報が提示するようにしてもよい。図11の例では発光素子群400により「2」を示し、例えば、2番目の第1区分領域Aを示すようにしても良い。
【0047】
この実施例3のように、複数の発光素子また、複数の発光色を有する発光素子を用いることで、第1領域、第2領域に位置する話者の識別を明確に行うことができる。
【0048】
また、図6、図8、図10の例では、クロストーク低減部はDA変換部の前段に位置しているが、AD変換部の前段に位置しても良い。
【図面の簡単な説明】
【0049】
【図1】実施例1の電話会議装置の機能構成例を示した斜視図。
【図2】実施例1の網部を取り除いた場合の電話会議装置の機能構成例を示した図。
【図3】キャビティ部にスピーカを2つ収容させた電話会議装置の機能構成例の斜視図。
【図4】2つのスピーカを収容させたキャビティ部の拡大斜視図。
【図5】実施例1の電話会議システムの機能構成例を示した図。
【図6】実施例1の電話会議装置の機能構成例を示したブロック図。
【図7】実施例2の電話会議システムの機能構成例を示した図。
【図8】実施例2の電話会議装置の機能構成例を示したブロック図。
【図9】実施例3の電話会議システムの機能構成例を示した図。
【図10】実施例3の電話会議装置の機能構成例を示したブロック図。
【図11】複数の発光素子の構成例を示した図。

【特許請求の範囲】
【請求項1】
筺体と、
前記筺体の両端に収容されている、それぞれ音声を収音する第1収音手段および第2収音手段と、
前記筺体の両端に収容されている、それぞれ音声を再生する第1再生手段および第2再生手段と、
他地点からの音声信号を受信し、当該他地点へ音声信号を送信する送受信部を具備する電話会議装置であって、
前記第1収音手段と前記第2収音手段の配列方向は、前記第1再生手段と前記第2再生手段との配列方向と直交する方向にあり、
前記送受信部により入力された、他地点の電話会議装置の第1収音手段、第2収音手段で収音された音声はそれぞれ、自地点の電話会議装置の第1再生手段、第2再生手段で再生され、
前記送受信部により出力した、自地点の電話会議装置の第1収音手段、第2収音手段で収音された音声は、それぞれ、他地点の電話会議装置の第1再生手段、第2再生手段で再生される電話会議装置。
【請求項2】
請求項1記載の電話会議装置であって、
当該電話会議装置の筺体は略直方体形状であり、
前記第1再生手段および前記第2再生手段はそれぞれ長手方向両端に配置され、
前記第1収音手段および前記第2収音手段はそれぞれ幅方向両端に配置されていることを特徴とする電話会議装置。
【請求項3】
請求項2記載の電話会議装置であって、
前記第1再生手段と前記第2再生手段の距離は略20cm以上であることを特徴とする電話会議装置。
【請求項4】
請求項2または3記載の電話会議装置であって、
前記第1再生手段と前記第2再生手段の距離は略150cm以下であることを特徴とする電話会議装置。
【請求項5】
請求項2〜4何れかに記載の電話会議装置であって、
前記筺体の幅は略10cmであることを特徴とする電話会議装置。
【請求項6】
請求項1〜5何れかに記載の電話会議装置であって、
更に、
前記第1再生手段および第2再生手段それぞれの近傍に配置された第1発光素子および第2発光素子と、
他地点の第1収音手段側の第1話者よりの音声が当該第1収音手段で主に収音されると前記第1発光素子を発光させ、他地点の第2収音手段側の第2話者よりの音声が当該第2収音手段で主に収音されると前記第2発光素子を発光させる発光素子制御部と、を具備することを特徴とする電話会議装置。
【請求項7】
請求項1〜6何れかに記載の電話会議装置であって、
更に、
前記第1再生手段近傍に配置され、他地点の前記複数の前記第1収音手段側の複数の区分領域と対応されている複数の第1発光素子と、
前記第2再生手段近傍に配置され、他地点の前記複数の前記第2収音手段側の複数の区分領域と対応されている複数の第2発光素子と、
前記複数の第1収音手段から入力された音声信号から、前記複数の第1収音手段側にいる音声を発している話者の位置を検出することで第1話者位置情報を生成し、前記複数の第2収音手段から入力された音声信号から、前記複数の第2収音手段側にいる音声を発している話者の位置を検出することで第2話者位置情報を生成する位置情報生成部と、
前記第1話者位置情報が示す音声を発している第1話者が位置する区分領域に対応する他地点の第1発光素子を発光させる第1発光素子制御信号を生成し、前記第2話者位置情報が示す音声を発している第2話者が位置する区分領域に対応する他地点の第2発光素子を発光させる第2発光素子制御信号を生成する発光素子制御信号生成部と、
他地点から受信した第1話者位置情報を用いて音声を発している他地点の第1話者が位置する領域に対応する第1発光素子を発光させ、他地点から受信した第2話者位置情報を用いて音声を発している他地点の第2話者が位置する領域に対応する第2発光素子を発光させる発光素子制御部と、を具備することを特徴とする電話会議装置。
【請求項8】
請求項7記載の電話会議装置であって、
前記複数の第1発光素子はそれぞれの発光色が異なり、
前記複数の第2発光素子はそれぞれの発光色が異なる
ことを特徴とする電話会議装置。
【請求項9】
請求項7または8記載の電話会議装置であって、
前記複数の第1発光素子はそれぞれの発光面の形状が異なり、
前記複数の第2発光素子はそれぞれの発光面の形状が異なる
ことを特徴とする電話会議装置。
【請求項10】
請求項1〜6何れかに記載の電話会議装置であって、
更に、
前記第1再生手段近傍に配置され、他地点の前記複数の前記第1収音手段側の複数の区分領域と対応されている複数の発光色を有する第1発光素子と、
前記第2再生手段近傍に配置され、他地点の前記複数の前記第2収音手段側の複数の区分領域と対応されている複数の発光色を有する第2発光素子と、
前記複数の第1収音手段から入力された音声信号から、前記複数の第1収音手段側にいる音声を発している話者の位置を検出することで第1話者位置情報を生成し、前記複数の第2収音手段から入力された音声信号から、前記複数の第2収音手段側にいる音声を発している話者の位置を検出することで第2話者位置情報を生成する位置情報生成部と、
前記第1話者位置情報が示す音声を発している第1話者が位置する区分領域に対応する発光色で他地点の第1発光素子を発光させる第1発光素子制御信号を生成し、前記第2話者位置情報が示す音声を発している第2話者が位置する区分領域に対応する発光色で他地点の第2発光素子を発光させる第2発光素子制御信号を生成する発光素子制御信号生成部と、
他地点から受信した第1話者位置情報を用いて音声を発している他地点の第1話者が位置する領域に対応する第1発光素子を発光させ、他地点から受信した第2話者位置情報を用いて音声を発している他地点の第2話者が位置する領域に対応する第2発光素子を発光させる発光素子制御部と、を具備することを特徴とする電話会議装置。




【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate


【公開番号】特開2010−118809(P2010−118809A)
【公開日】平成22年5月27日(2010.5.27)
【国際特許分類】
【出願番号】特願2008−289506(P2008−289506)
【出願日】平成20年11月12日(2008.11.12)
【出願人】(000004226)日本電信電話株式会社 (13,992)
【Fターム(参考)】