説明

通信装置、および記録用音声受信装置の選定方法

【課題】少なくとも音声データをP2Pで送受信する複数の通信装置を備えた通信システムにおいて、記録するために最適な音声のデータを受信する通信装置を的確に選定することができる通信装置、および記録用音声受信装置の選定方法を提供する。
【解決手段】通信システムは、複数のPCを備える。各PCは、音声データをP2Pで相互に送受信することで、各拠点の音声を共有することができる。PCは、自装置を含む通信システム内の複数のPCの各々から、各々のPCが受信する音声の品質を示す音声パラメータを取得する(S1,S9)。PCは、取得した音声パラメータを参照して、通信システム内の複数のPCの中から、受信する音声の品質が所定よりも高いPCを、情報を記録するために用いられる音声を受信する記録用音声受信装置として選定する(S15)。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、少なくとも音声データが複数の通信装置間で相互にP2Pで送受信される通信システムにおいて使用される通信装置、および記録用音声受信装置の選定方法に関する。
【0002】
テレビ会議システム等の音声データを送受信する通信システムにおいて、ユーザの発言内容を記録する技術が知られている。例えば、特許文献1は、送受信される音声データに対して音声認識を行うことで、テレビ会議において発言された発言内容を集約して議事録を作成する方法を開示している。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開平10−294798号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
記録する音声の品質が低いと、音声情報を記録する記録装置は、音声情報を正確に記録できない可能性がある。従って、記録する音声の品質は高いことが望ましい。サーバを介して音声データを送受信する通信システムでは、サーバが受信する高品質の音声情報を記録することができる。しかし、音声データをP2Pで相互に送受信する複数の通信装置によって通信システムが構成されている場合、各通信装置が受信する音声データの品質が異なる。よって、品質が低い音声のデータを用いて音声情報が記録され、音声情報が不正確になるという問題が一例として挙げられる。
【0005】
本発明は、少なくとも音声データをP2Pで送受信する複数の通信装置を備えた通信システムにおいて、記録するために最適な音声のデータを受信する通信装置を的確に選定することができる通信装置、および記録用音声受信装置の選定方法を提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明の第一の態様に係る通信装置は、少なくとも音声データが複数の通信装置間で相互にP2Pで送受信される通信システムにおいて使用される通信装置であって、自装置を含む前記複数の通信装置の各々から、各々の通信装置が受信する音声の品質を示す音声パラメータを取得するパラメータ取得手段と、前記パラメータ取得手段によって取得された音声パラメータを参照して、前記複数の通信装置の中から、受信する音声の品質が所定よりも高い通信装置を、情報を記録するために用いられる音声を受信する記録用音声受信装置として選定する選定手段とを備えている。
【0007】
第一の態様に係る通信装置は、通信システム内の各通信装置が受信する音声の品質を示す音声パラメータに基づいて、品質が所定よりも高い音声を受信する通信装置を記録用音声受信装置として選定することができる。従って、通信システムは、品質が高い音声を用いて正確に情報を記録することができる。
【0008】
前記音声パラメータは、前記複数の通信装置の各々が受信することができるデータの伝送速度である受信伝送速度を含んでもよい。前記選定手段は、前記パラメータ取得手段によって取得された受信伝送速度が大きい通信装置を、受信する音声の品質が高い通信装置として、前記記録用音声受信装置を選定してもよい。通信装置は、受信可能なデータの伝送速度が大きい通信装置を、受信する音声の品質が高い通信装置とすることで、高品質の音声を受信する通信装置を記録用音声受信装置として適切に選定することができる。
【0009】
前記音声パラメータは、エコーおよびノイズの少なくとも一方を低減する雑音低減手段の有無、および前記雑音低減手段の性能の少なくともいずれかを示す雑音低減情報を含んでもよい。前記選定手段は、前記パラメータ取得手段によって取得された雑音低減情報を参照することで、受信する音声のエコーおよびノイズの少なくとも一方が低減される通信装置を、受信する音声の品質が高い通信装置として、前記記録用音声受信装置を選定してもよい。通信装置は、エコーおよびノイズの少なくとも一方が低減された音声を受信する通信装置を、高品質の音声を入力する通信装置とすることで、記録用音声受信装置を適切に選定することができる。
【0010】
前記音声パラメータは、各種データの処理能力を示す処理能力情報を含んでもよい。前記選定手段は、前記パラメータ取得手段によって取得された処理能力情報が示す各種データの処理能力が高い通信装置を、受信する音声の品質が高い通信装置として、前記記録用音声受信装置を選定してもよい。各種データの処理能力が高い通信装置は、音声データの欠損および処理遅延等の不具合が発生する可能性が低いため、高品質の音声を受信することができる。従って、通信装置は、処理能力情報を用いることで、高品質の音声を受信する通信装置を記録用音声受信装置として適切に選定することができる。
【0011】
前記複数の通信装置の各々の前記選定手段は、受信する音声の品質が前記複数の通信装置の中で所定よりも高い前記記録用音声受信装置が自装置であるか否かを判断することで、前記記録用音声受信装置が選定されてもよい。記録用音声受信装置が自装置であるか否かを各通信装置が判断することで、通信システムは、システム内で高品質の音声を受信することができる記録用音声受信装置を的確に選定することができる。
【0012】
前記通信装置は、各種データの処理能力を示す処理能力情報を、自装置を含む前記通信装置の各々から取得する処理能力取得手段と、前記複数の通信装置の中から、前記処理能力取得手段によって取得された処理能力情報が示す処理能力が最も高い通信装置を、前記選定手段による前記記録用音声受信装置の選定を行う選定装置として決定する決定手段と、前記決定手段によって自装置以外の他の通信装置を前記選定装置として決定した場合に、決定した前記選定装置に、前記記録用音声受信装置の選定を行うことを指示する第一指示情報を送信する第一指示送信手段とをさらに備えてもよい。前記選定手段は、前記選定装置として自装置を決定した場合、および他の通信装置から前記第一指示情報を受信した場合に、前記記録用音声受信装置を選定すればよい。通信システムの中で各種データの処理能力が最も高い通信装置のみが記録用音声受信装置を選定することになり、システム内の他の通信装置は選定処理を行う必要はない。従って、通信装置は、処理能力が低い通信装置の処理負担が増大することを防止することができる。よって、通信システムは、記録用音声受信装置を円滑に選定することができる。
【0013】
前記通信装置は、前記選定手段によって自装置以外の他の通信装置を前記記録用音声受信装置として選定した場合に、選定した通信装置に、受信した音声を用いて議事録を作成することを指示する第二指示情報を送信する第二指示送信手段と、自装置の前記選定手段によって自装置が前記記録用音声受信装置に選定された場合、および他の通信装置から前記第二指示情報を受信した場合に、自装置が受信した音声に対して音声認識処理を行いテキストを生成することで議事録を作成する議事録作成手段とをさらに備えてもよい。通信システムは、システム内の各通信装置が受信する音声のうち品質が高い音声を用いて、テキスト化された議事録を作成することができる。従って、通信システムは、音声情報を正確に文字で記録することができる。
【0014】
前記通信装置は、前記議事録作成手段によって作成された議事録を他の通信装置に送信する議事録送信手段をさらに備えてもよい。各通信装置を使用している複数のユーザは、精度良く作成された議事録を容易に共有することができる。
【0015】
前記通信装置は、前記パラメータ取得手段によって取得された自装置の音声パラメータを参照して、送受信される音声の品質を向上させる機能の使用をユーザに促す動作を実行する使用勧告手段をさらに備えてもよい。通信装置は、自装置の音声パラメータに応じて、音声の品質を向上させる機能の使用を適切にユーザに促すことができる。従って、通信システムは、より品質が高い音声を用いて音声情報を記録することができる。
【0016】
本発明の第二の態様に係る記録用音声受信装置の選定方法は、少なくとも音声データが複数の通信装置間で相互にP2Pで送受信される通信システムを構成する通信装置によって行われる記録用音声受信装置の選定方法であって、自装置を含む前記複数の通信装置の各々から、各々の通信装置が受信する音声の品質を示す音声パラメータを取得するパラメータ取得ステップと、前記パラメータ取得ステップによって取得された音声パラメータを参照して、前記複数の通信装置の中から、受信する音声の品質が所定よりも高い通信装置を、情報を記録するために用いられる音声を受信する記録用音声受信装置として選定する選定ステップとを備えている。
【0017】
第二の態様に係る記録用音声受信装置の選定方法によると、通信装置は、通信システム内の各通信装置が受信する音声の品質を示す音声パラメータに基づいて、品質が所定よりも高い音声を受信する通信装置を記録用音声受信装置として選定することができる。従って、通信システムは、品質が高い音声を用いて正確に情報を記録することができる。
【図面の簡単な説明】
【0018】
【図1】通信システム100のシステム構成を示す図である。
【図2】PC1の電気的構成を示すブロック図である。
【図3】PC1が実行する会議処理のフローチャートである。
【図4】HDD13の音声パラメータ記憶エリアに記憶されている音声パラメータを説明するための説明図である。
【図5】会議処理中に実行される選定装置決定処理のフローチャートである。
【図6】会議処理中に実行される選定処理のフローチャートである。
【図7】図4に示す4つのPC1の音声パラメータから判断される、各PC1の受信音声の品質を説明するための説明図である。
【図8】変形例に係るPC1が実行する会議処理のフローチャートである。
【発明を実施するための形態】
【0019】
以下、本発明の通信装置を具現化した一実施の形態であるパーソナルコンピュータ(以下、「PC」という。)1、および複数のPC1を備えた通信システム100について、図面を参照して説明する。参照する図面は、本発明が採用し得る技術的特徴を説明するために用いられるものである。図面に記載されている装置の構成、各種処理のフローチャート等は、それのみに限定する趣旨ではなく、単なる説明例である。
【0020】
図1を参照して、通信システム100のシステム構成について説明する。通信システム100は、複数のPC1を備える。各PC1は、インターネット等のネットワーク8を介して、他のPC1との間でデータを送受信する。詳細には、PC1は、他のPC1のそれぞれとの間で、サーバ等を介さずにP2P(peer to peer)でデータを送受信することができる。なお、本発明における通信装置として用いることができるのはPC1に限られず、他の通信装置とP2Pでデータを送受信できるものであればよい。例えば、テレビ会議を実行するために各拠点に配置される専用のテレビ会議端末等を、本発明における通信装置として用いることも可能である。
【0021】
通信システム100は、音声および映像を用いた遠隔会議を実行するためのテレビ会議システムである。各PC1は、自拠点のマイク31(図2参照)によって入力した音声のデータ、およびカメラ33によって入力した映像のデータを、他のPC1に送信する。各PC1は、他のPC1から受信したデータに基づいて、他の拠点の音声をスピーカ32(図2参照)から出力し、且つ他の拠点の映像を表示装置34に表示させる。その結果、複数の拠点の音声および映像が、通信システム100内で共有される。よって、通信システム100によると、全てのユーザが同一の拠点にいない場合でも、ユーザは円滑に会議を実行することができる。
【0022】
通信システム100は、遠隔会議の議事録を作成することができる。詳細には、PC1は、他のPC1から受信した音声のデータ、および自拠点のマイク31(図2参照)から入力した音声のデータに対して、周知の音声認識処理を行う。すなわち、PC1は、会議中に他の拠点および自拠点のユーザが発した音声のデータに対して音声認識処理を行い、音声情報をテキスト化することで、遠隔会議の議事録を自動的に作成する。ユーザは、遠隔会議の終了後であっても、遠隔会議の内容を文字によって容易に把握することができる。
【0023】
通信システム100では、音声データはP2Pで相互に送受信されるため、各PC1が受信する音声の品質は異なる。品質が低い音声のデータに対して音声認識処理を行うと、音声を正確にテキスト化できない可能性がある。PC1は、通信システム100が備える複数のPC1のうち、議事録を作成するために最適な音声データを受信するPC1を的確に選定し、正確な議事録を作成できる点に特徴を有する。なお、PC1は、実際にはデータ化された音声を他のPC1から受信する。「音声の品質」とは、本実施の形態では、受信した音声のデータによって再生される音声の品質となる。しかし、以下では、「受信した音声のデータによって再生される音声の品質」を簡略化して「受信する音声の品質」という場合もある。
【0024】
図2を参照して、PC1の電気的構成について説明する。PC1は、PC1の制御を司るCPU10を備えている。CPU10には、ROM11、RAM12、ハードディスクドライブ(以下、「HDD」という。)13、および入出力インターフェース19が、バス18を介して接続されている。
【0025】
ROM11は、PC1を動作させるためのプログラムおよび初期値等を記憶している。RAM12は、制御プログラムで使用される各種の情報を一時的に記憶する。HDD13は、制御プログラム等の各種の情報を記憶する不揮発性の記憶装置である。具体的には、HDD13には、音声認識を行うための音響モデル、言語モデル、および単語辞書が記憶されている。CPU10は、議事録を作成するための音声を受信する記録用音声受信装置として選定されると、音声データを分析し、特徴量を抽出した後、音響モデルと言語モデルとのマッチングを行う。その結果、言語モデルで受理可能な文毎に尤度が求まり、尤度が最も高い文が認識結果として得られる。マッチングの際、言語モデルは単語辞書を参照する。尤度が規定の閾値以下の値になった場合には、認識失敗として認識結果は得られない。CPU10は、音声認識の結果得られたテキストを議事録としてHDD13に記憶し、且つ他のPC1に送信する。HDD13には、後述する音声パラメータ(図4参照)等も記憶されるが、この詳細は後述する。HDD13の代わりに、EEPROMまたはメモリカード等の記憶装置を用いてもよい。
【0026】
入出力インターフェース19には、音声入力処理部21、音声出力処理部22、映像入力処理部23、映像出力処理部24、操作入力処理部25、および外部通信I/F26が接続されている。音声入力処理部21は、音声を入力するマイク31からの音声データの入力を処理する。音声出力処理部22は、音声を出力するスピーカ32の動作を処理する。映像入力処理部23は、映像を撮像するカメラ33からの動画データの入力を処理する。映像出力処理部24は、映像を表示する表示装置34の動作を処理する。操作入力処理部25は、キーボードおよびマウス等の操作部35から入力されるデータを処理する。外部通信I/F26は、PC1をネットワーク8に接続する。
【0027】
以下、図3から図7を参照して、PC1が実行する会議処理について説明する。ユーザが操作部35を操作し、テレビ会議を実行する指示を入力すると、PC1のCPU10は、HDD13に記憶されているプログラムに従って会議処理を実行する。図3に示すように、会議処理が開始されると、自装置の音声パラメータが取得される(S1)。
【0028】
図4に、HDD13の音声パラメータ記憶エリアに記憶されている音声パラメータの一例を示す。音声パラメータとは、各PC1が他のPC1から受信する音声の品質を示すパラメータである。本実施の形態では、「CPUクロック数」、「帯域」における「上り」(以下、「上り帯域」という。)、「帯域」における「下り」(以下、「下り帯域」という。)、「雑音低減(送信)」における「エコーキャンセラ有無」、「雑音低減(送信)」における「ノイズキャンセラ有無/低減性能」、「雑音低減(受信)」における「エコーキャンセラ有無」、「雑音低減(受信)」における「ノイズキャンセラ有無/低減性能」、およびイヤホン接続有無が、音声パラメータとして取得される。
【0029】
「CPUクロック数」は、PC1が備えるCPU10のクロック数(単位:GHz)であり、各PC1のHDD13にあらかじめ記憶されている。CPUクロック数は、PC1における各種データの処理能力を示す値として参照される。なお、CPUのモデル番号、物理コア数、論理コア数、キャッシュ段数、キャッシュ容量等の情報の少なくともいずれかを、PC1の処理能力を示す値として用いることも可能である。CPUのモデル番号等の上記の情報を用いることで、PC1の処理能力をより正確に判定することができる。
【0030】
「上り帯域」は、PC1が単位時間当たりにネットワーク8に送信できる最大のデータ容量である。「下り帯域」は、PC1が単位時間当たりにネットワーク8を介して受信できる最大のデータ容量である。帯域と、各PC1間におけるデータの伝送速度とを比較するため、帯域を伝送路容量(Mbps)で表す。PC1は、データを受信する際に使用される帯域(以下、「受信帯域」という。)が大きい程、容量の大きい音声データ、つまり、高品質の音声を再生できるデータを受信することができる。本実施の形態では、各PC1は、データをテスト送信して帯域を計測する周知の手法を利用し、自装置の上り帯域および下り帯域の値を取得する。しかし、PC1は、あらかじめ記憶された値(例えば、理論値)を帯域の値として取得してもよい。なお、送受信できる最大のデータ容量を「上り帯域」および「下り帯域」とする必要はない。データを送受信する際のデータ容量の平均値または最低値を、「上り帯域」および「下り帯域」の音声パラメータとして用いることも可能である。
【0031】
「雑音低減(送信)」における「エコーキャンセラ有無」は、送信する音声データに含まれるエコーを低減する機能の有無を示す。「雑音低減(送信)」における「ノイズキャンセラ有無/低減性能」は、送信する音声データに含まれるノイズ(雑音)を低減する機能の有無と、機能を有する場合のノイズの低減性能とを示す。送信側のPC1が、送信する音声データに含まれるエコーおよびノイズを低減すれば、受信側のPC1は高品質の音声のデータを受信できる。従って、PC1が受信する音声の品質は、他のPC1の「雑音低減(送信)」における「エコーキャンセラ有無」および「ノイズキャンセラ有無/低減性能」に影響される。「雑音低減(受信)」における「エコーキャンセラ有無」は、受信する音声データに含まれるエコーを低減する機能の有無を示す。「雑音低減(受信)」における「ノイズキャンセラ有無/低減性能」は、受信する音声データに含まれるノイズを低減する機能の有無と、機能を有する場合のノイズの低減性能とを示す。PC1が受信する音声の品質は、自装置の「雑音低減(受信)」における「エコーキャンセラ有無」および「ノイズキャンセラ有無/低減性能」に影響される。以下では、説明を簡略化するため、ノイズキャンセラはノイズを純粋にn%低減できると仮定し、ノイズの低減性能を「n(%)」で表す。エコーキャンセラおよびノイズキャンセラは、専用の集積回路(IC)であってもよいし、CPU10がエコーキャンセラおよびノイズキャンセラの機能を実行してもよい。
【0032】
「イヤホン接続有無」は、PC1にイヤホンが接続されているか否かを示す。ユーザがイヤホンを使用して音声を聞く場合には、スピーカ32の音声を聞く場合とは異なり、イヤホンから出力された音声がマイク31に入力される可能性は低い。従って、イヤホンが接続されていれば、エコーが生じる可能性が低下し、他のPC1に送信する音声の品質が向上する。よって、PC1が受信する音声の品質は、他のPC1の「イヤホン接続有無」に影響される。
【0033】
図3の説明に戻る。自装置の音声パラメータが取得されると(S1)、取得された自装置の音声パラメータによって、自装置にイヤホンが接続されているか否かが判断される(S2)。イヤホンが接続されていなければ(S2:NO)、イヤホン接続勧告画面が表示装置34に表示される(S3)。イヤホン接続勧告画面は、ユーザにイヤホンの使用を促すメッセージ、および、イヤホンを使用する場合にはエコーキャンセラをOFFとするように促すメッセージを表示する画面である。具体的には、本実施の形態では、「イヤホンを使用した方が、音声の品質が向上します。イヤホンを使用する場合には、エコーが生じる可能性が低いため、エコーキャンセラはOFFにする方が望ましいです。」という旨のメッセージが表示される。前述したように、ユーザがイヤホンを使用すれば、エコーが生じる可能性は低下するため、エコーキャンセラを動作させなくてもよい。イヤホンが使用されている場合、ユーザは、送信する音声データのエコーを低減するエコーキャンセラをOFFとすることで、PC1にかかる処理負担を低下させることができる。PC1にかかる処理負担が低下すれば、処理遅延およびデータの欠損等が生じる可能性が低下するため、音声の品質が向上する。よって、PC1は、イヤホン接続勧告画面を表示することで、音声の品質を向上させるための適切な動作をユーザに通知することができる。なお、自装置がエコーキャンセラを備えていなければ、CPU10は、イヤホンの使用を促すメッセージのみを表示装置34に表示させる。
【0034】
自装置にイヤホンが接続されていれば(S2:YES)、エコーキャンセラOFF勧告画面が表示装置34に表示される(S4)。エコーキャンセラOFF勧告画面では、「イヤホンが接続されているため、エコーが生じる可能性は低いです。エコーキャンセラをOFFにして、PCにかかる負担を減らしましょう。」という旨のメッセージが表示される。なお、イヤホンが接続されている場合でも、自装置がエコーキャンセラを備えていなければ、メッセージは表示されない。CPU10は、音声およびランプ等を用いることで、適切な動作をユーザに通知してもよい。
【0035】
自装置が、複数のPC1のうち、遠隔会議を開始させるために最初にネットワーク8に接続したPC1であるか否かが判断される(S6)。他のPC1が既にネットワーク8に接続しており、他のPC1から遠隔会議が開始されたと判断された場合には(S6:NO)、処理はそのままS8へ移行する。自装置から遠隔会議が開始される場合には(S6:YES)、選定実行フラグが「ON」とされる(S7)。選定実行フラグは、記録用音声受信装置を選定する選定装置が自装置であるか否かを示すフラグである。前述したように、通信システム100では、複数のPC1のうち、品質が高い音声を受信するPC1が、議事録を作成するための音声を受信する記録用音声受信装置として選定される。本実施の形態では、各種データの処理性能が最も高いPC1が、記録用音声受信装置を選定する処理を行う。PC1は、選定実行フラグが「ON」とされている場合にのみ、記録用音声受信装置を選定する処理を行う。遠隔会議開始時には、最初にネットワーク8に接続したPC1が選定実行フラグを「ON」とし、暫定的に選定装置となる。
【0036】
次いで、選定装置を決定するための処理が行われる。まず、自装置を含むいずれかのPC1が、通信システム100に新たに接続したか否かが判断される(S8)。接続していなければ(S8:NO)、処理はそのままS12の判断へ移行する。いずれかのPC1が新たに接続した場合には(S8:YES)、各PC1の音声パラメータが送受信される(S9)。詳細には、自装置の音声パラメータが通信システム100内の他のPC1に送信され、他のPC1から音声パラメータが受信される。受信されたパラメータは、HDD13の音声パラメータ記憶エリア(図4参照)に記憶される。自装置が暫定的な選定装置とされているか否かが判断される(S10)。選定実行フラグが「OFF」となっており、自装置が暫定的な選定装置でないと判断された場合には(S10:NO)、処理はそのままS12の判断へ戻る。選定実行フラグが「ON」となっている場合には(S10:YES)、選定装置決定処理が行われて(S11)、処理はS12の判断へ移行する。
【0037】
図5に示すように、選定装置決定処理では、音声パラメータ記憶エリア(図4参照)に記憶されている情報のうち、自装置を含む全てのPC1のCPUクロック数が参照される。通信システム100内の複数のPC1のうち、CPU性能が最も高い(CPUクロック数の値が最も大きい)PC1が、次の暫定的な選定装置として決定される(S21)。CPU性能が最も高いPC1が複数存在する場合には、CPU10は、ランダムに1つの選定装置を決定してもよいし、所定のアルゴリズムに従って1つの選定装置を決定してもよい。例えば、CPU10は、CPU性能が最も高い複数のPC1のうち、通信システム100に最も早く接続したPC1を選定装置として決定してもよい。
【0038】
次の暫定的な選定装置として決定されたPC1が自装置であるか否かが判断される(S22)。自装置でなければ(S22:NO)、暫定的な決定装置を自装置から他のPC1に交代する必要がある。よって、選定実行フラグが「OFF」とされる(S23)。次の暫定的な選定装置に、選定装置に決定されたことを示す選定指示情報が送信される(S24)。処理は会議処理へ戻る。次の暫定的な選定装置として決定されたPC1が自装置であれば(S22:YES)、暫定的な決定装置は自装置のままであるため、処理はそのまま会議処理へ戻る。
【0039】
図3の説明に戻る。他のPC1から選定指示情報を受信したか否かが判断される(S12)。選定指示情報を受信した場合には(S12:YES)、選定実行フラグが「ON」とされ、自装置が暫定的に選定装置とされる(S13)。選定指示情報を受信していなければ(S12:NO)、処理はそのままS14の判断へ移行する。遠隔会議の開始指示が入力されたか否かが判断される(S14)。遠隔会議に参加するユーザの1人が、自らが使用するPC1の操作部35を操作して遠隔会議の開始指示を入力すると、PC1は、通信システム100内の他のPC1に開始指示を出力する。他のPC1または自装置の操作部35から遠隔会議の開始指示が入力されていなければ(S14:NO)、処理はS8の判断へ戻り、S8,S12,S14の判断が繰り返される。開始指示が入力されると(S14:YES)、選定処理が行われる(S15)。選定処理では、通信システム100内の複数のPC1のうち、品質が高い音声を受信するPC1が、議事録を作成するための音声を受信する記録用音声受信装置として選定される。
【0040】
図6に示すように、選定処理が開始されると、自装置が選定装置とされているか否かが、選定実行フラグによって判断される(S31)。選定実行フラグが「ON」となっており、自装置が選定装置とされている場合には(S31:YES)、音声パラメータ記憶エリア(図4参照)に記憶されている各PC1の音声パラメータに基づいて、記録用音声受信装置が選定される。まず、最低限のCPU性能を有さないPC1が、記録用音声受信装置に選定される候補から除外される(S32)。データとして受信した時点の音声の品質が高い場合でも、PC1のCPU性能が低すぎる場合には、処理遅延、データの欠損等が生じて音声の品質が低下する可能性がある。従って、PC1は、CPUクロック数が閾値未満であるPC1を候補から除外する。つまり、本実施の形態における「受信する音声の品質」とは、PC1が他のPC1からデータとして受信した時点の音声の品質のみを示すものではない。「受信する音声の品質」とは、受信したデータの記憶装置への記憶、受信したデータに対する音声認識処理、および受信したデータの他の機器への送信のいずれかが行われる時点における音声の品質も含む。次いで、CPU性能が閾値以上であるPC1のうち、受信帯域の最低値が最も高いPC1が特定される(S33)。
【0041】
図7は、図4に示す4つのPC1の音声パラメータから判断される、各PC1の受信音声の品質を説明するための説明図である。図7の表の左側は、各PC1におけるデータ送信時の音声パラメータを示す。図7の表の上側は、各PC1におけるデータ受信時の音声パラメータを示す。例えば、拠点AのPC1の「上り帯域」は1.4Mbpsである。従って、拠点B,C,DのPC1は、「下り帯域」の値が1.4以上ではあるが、拠点AのPC1からは1.4Mbpsでしかデータを受信できない。一方、拠点DのPC1は35Mbpsでデータを送信できるが、拠点AのPC1の「下り帯域」は35Mbpsよりも小さい7.4Mbpsである。よって、拠点AのPC1は、拠点DのPC1から7.4Mbpsでしかデータを受信できない。つまり、送信側のPC1の「上り帯域」の値、および受信側のPC1の「下り帯域」の値のうち小さい値が、受信側のPC1の受信帯域となる。受信帯域の値が小さければ、送信側のPC1は、送信する音声データの伝送速度を小さくしなければならないため、受信側のPC1における受信音声の品質は低下する。仮に、送信側のPC1が受信帯域を越える伝送速度でデータを送信しても、データの損失が生じて音声の品質は低下する。従って、S33では、受信帯域の最低値が最も高いPC1が、記録用音声受信装置に選定される候補として特定される。図7に示す例では、拠点CのPC1の受信帯域の最低値「1.4」が、他の拠点のPC1の受信帯域の最低値「1」よりも大きいため、拠点CのPC1が特定される。
【0042】
特定されたPC1が複数であるか否かが判断される(S34)。特定されたPC1が1つであれば(S34:NO)、特定された1つのPC1が記録用音声受信装置に選定される(S35)。
【0043】
特定されたPC1が複数であれば(S34:YES)、各PC1におけるデータ受信時の音声パラメータによって、受信した音声データに対する雑音低減手段を有するPC1が特定される(S36)。図7に示す例では、拠点CのPC1および拠点DのPC1が、受信した音声データに対するノイズキャンセラを有する。
【0044】
特定されたPC1が複数であるか否かが判断される(S37)。1つであれば(S37:NO)、特定された1つのPC1が記録用音声受信装置に選定される(S35)。特定されたPC1が未だに複数であれば(S37:YES)、受信した音声データに対する雑音低減性能が最も高いPC1が特定される(S38)。特定されたPC1が、記録用音声受信装置に選定される(S35)。例えば、図7に示す例における拠点BのPC1は、送信する音声データに対するノイズキャンセラを有さない。従って、拠点A,C,DのPC1は、ノイズが除去されていない音声データ(図中、「+noise(100%)」と表記する)を、拠点BのPC1から受信する。しかし、拠点Cおよび拠点DのPC1は、受信した音声データに含まれるノイズを低減できる。従って、拠点CのPC1が受信した音声データのノイズは、50%に低減される(図中、「+noise(50%)」と表記する)。拠点DのPC1も、受信した音声データのノイズを低減できるが、低減性能は20%であるため、残存するノイズ(80%)は拠点Cにおけるノイズよりも多い。つまり、受信した音声データに対する雑音低減性能が高い程、高品質の音声を受信できる。
【0045】
なお、S38の処理を経ても複数のPC1が特定される場合には、CPU10は、複数のPC1のうちの1つをランダムに選択し、選択したPC1を記録用音声受信装置に選定する。しかし、CPU10は、複数のPC1を記録用音声受信装置に選定してもよい。CPU10は、各PC1のCPUクロック数等の他の音声パラメータを用いて、記録用音声受信装置の数をさらに絞り込んでもいい。
【0046】
記録用音声受信装置が選定されると(S35)、自装置を記録用音声受信装置に選定したか否かが判断される(S39)。自装置を選定した場合には(S39:YES)、自装置が他のPC1から受信した音声データ、および自装置のマイク31から入力した音声データによる議事録の作成が開始されて(S40)、処理は会議処理へ戻る。前述したように、議事録は、受信した音声データに対して音声認識が行われることで作成される。作成された議事録は、HDD13に記憶される。
【0047】
CPU10は、自装置以外の他のPC1を記録用音声受信装置に選定した場合には(S39:NO)、選定した記録用音声受信装置に、議事録作成指示情報を送信する(S41)。議事録作成指示情報とは、記録用音声受信装置に対して、記録用音声受信装置が受信した音声データから議事録を作成する指示を行うための情報である。次いで、記録用音声受信装置以外の他のPC1に、会議開始を指示するための情報が送信されて(S42)、処理は会議処理へ戻る。
【0048】
次いで、自装置が選定装置とされていない場合の処理について説明する。選定実行フラグが「OFF」となっており、自装置が選定装置とされていないと判断されると(S31:NO)、他のPC1の1つである選定装置から議事録作成指示情報を受信したか否かが判断される(S44)。受信していなければ(S44:NO)、会議開始指示を受信したか否かが判断される(S45)。受信していなければ(S45:NO)、処理はS44の判断へ戻り、S44およびS45の判断が繰り返される。会議開始指示を受信する前に議事録作成指示情報を受信した場合には(S44:YES)、議事録の作成が開始されて(S40)、処理は会議処理へ戻る。会議開始指示を受信した場合には(S45:YES)、処理はそのまま会議処理へ戻る。
【0049】
図3の説明に戻る。選定処理(S15)が終了すると、音声データおよび映像データが複数のPC1間で相互に送受信されて、遠隔会議が実行される(S16)。遠隔会議中、記録用音声受信装置に選定されたPC1は、議事録を作成する。会議終了の指示が入力されたか否かが判断され(S17)、入力されていなければ(S17:NO)、遠隔会議が継続される(S16)。自装置の操作部35、または他のPC1から会議終了の指示が入力されると(S17:YES)、作成された議事録が配布される(S18)。詳細には、自装置が記録用音声受信装置であれば、CPU10は、作成した議事録のデータを他のPC1に送信する。自装置が記録用音声受信装置でなければ、CPU10は、他のPC1から送信される議事録のデータを受信し、HDD13に記憶する。処理は終了する。
【0050】
以上説明したように、本実施の形態に係るPC1は、通信システム100内の各PC1が受信する音声の品質を示す音声パラメータに基づいて、品質が高い音声を受信するPC1を記録用音声受信装置として選定することができる。従って、通信システム100は、品質が高い音声を用いて正確に情報を記録することができる。詳細には、PC1は、受信可能なデータの伝送速度である受信帯域が大きいPC1を、受信する音声の品質が高いPC1とすることで、記録用音声受信装置を適切に選定することができる。PC1は、エコーおよびノイズの少なくとも一方が低減された音声を受信するPC1を、高品質の音声を入力するPC1とすることで、記録用音声受信装置を適切に選定することができる。PC1は、各PC1のデータ処理能力を示すCPUクロック数を用いることで、高品質の音声を受信するPC1を適切に選定することができる。
【0051】
本実施の形態の通信システム100では、システム内でデータ処理能力が最も高いPC1のみが記録用音声受信装置を選定することになり、システム内の他のPC1は選定処理を行う必要がない。従って、PC1は、処理能力が低いPC1の処理負担が増大することを防止することができる。よって、通信システム100は、記録用音声受信装置を円滑に選定することができる。
【0052】
記録用音声受信装置として選定されたPC1は、通信システム100内の各PC1が受信する音声のうち品質が高い音声を用いて、テキスト化された議事録を作成することができる。従って、通信システム100は、遠隔会議の内容を文字で正確に記録することができる。議事録を作成したPC1は、作成した議事録をシステム内の他のPC1に送信することができる。よって、複数のユーザが、精度良く作成された議事録を容易に共有することができる。PC1は、自装置の音声パラメータに応じて、音声の品質を向上させる機能の使用を適切にユーザに促すことができる。従って、通信システム100は、より品質が高い音声を用いて音声情報を記録することができる。
【0053】
上記実施の形態において、PC1が本発明の「通信装置」に相当する。図3のS1およびS9で各PC1の音声パラメータを取得するCPU10が「パラメータ取得手段」として機能する。図6のS32〜S38で記録用音声受信装置を選定するCPU10が「選定手段」として機能する。PC1の「下り帯域」のパラメータが「受信伝送速度」に相当する。音声パラメータのうち、「雑音低減(送信)」におけるエコーキャンセラ有無およびノイズキャンセラ有無/低減性能のパラメータと、「雑音低減(受信)」におけるエコーキャンセラ有無およびノイズキャンセラ有無/低減性能のパラメータとが「雑音低減情報」に相当する。CPUクロック数のパラメータが「処理能力情報」に相当する。
【0054】
図5のS21で選定装置を決定するCPU10が「決定手段」として機能する。図5のS24で送信される選定指示情報が「第一指示情報」に相当する。図5のS24で選定指示情報を送信するCPU10が「第一指示送信手段」として機能する。図6のS41で送信される議事録作成指示情報が「第二指示情報」に相当する。図6のS41で議事録作成指示情報を送信するCPU10が「第二指示送信手段」として機能する。図6のS40で音声認識処理を行って議事録を作成するCPU10が「議事録作成手段」として機能する。図3のS18で他のPC1に議事録のデータを送信するCPU10が「議事録送信手段」として機能する。図3のS2〜S4で表示装置34に勧告画面を表示させるCPU10が「使用勧告手段」として機能する。図3のS1およびS9で各PC1の音声パラメータを取得する処理が「パラメータ取得ステップ」に相当する。図6のS32〜S38で記録用音声受信装置を選定する処理が「選定ステップ」に相当する。
【0055】
本発明は上記実施の形態に限定されることはなく、様々な変形が可能であることは言うまでもない。以下、図8を参照して、上記実施の形態の一変形例について説明する。図8に示す変形例では、通信システム100内のそれぞれのPC1が、自装置を記録用音声受信装置とするか否かを判断することで、記録用音声受信装置が選定される。図8に示す会議処理は、記録用音声受信装置の選定方法が、上記実施の形態における会議処理(図3参照)と異なるのみである。よって、以下の変形例では、上記実施の形態と同一の構成および処理については同一の番号を付し、説明を省略または簡略化する。
【0056】
図8に示すように、変形例に係る会議処理が開始されると、自装置の音声パラメータが取得される(S1)。取得された音声パラメータに応じて勧告画面が表示装置34に表示される(S2〜4)。自装置を含むいずれかのPC1が、通信システム100に新たに接続したか否かが判断される(S8)。いずれかのPC1が新たに通信システム100に接続した場合には(S8:YES)、各PC1の音声パラメータが送受信される(S9)。遠隔会議が開始されるまで(S14:NO)、S8の判断が繰り返される。
【0057】
遠隔会議を開始させる指示が入力されると(S14:YES)、通信システム100内のPC1のそれぞれにおいて、自装置を記録用音声受信装置とするか否かが判断される。まず、雑音低減性能が最も高いPC1が、音声パラメータによって特定される(S61)。特定されたPC1が1つであれば(S62:NO)、処理はそのままS66へ移行する。特定されたPC1が複数であれば(S62:YES)、特定された複数のPC1から、CPUクロック数が最も高いPC1がさらに特定される(S63)。特定されたPC1が1つとなれば(S64:NO)、処理はS66へ移行する。特定されたPC1が未だ複数であれば(S64:YES)、特定された複数のPC1から、受信帯域の最低値が最も高いPC1がさらに特定される(S65)。
【0058】
次いで、特定されたPC1が記録用音声受信装置に選定される(S66)。自装置を記録用音声受信装置に選定したか否かが判断される(S67)。自装置を選定していなければ(S67:NO)、そのまま遠隔会議が実行される(S16)。自装置を選定していれば(S67:YES)、自装置が他のPC1から受信する音声のデータ、および自装置のマイク31から入力される音声のデータによって、議事録が作成される(S68)。遠隔会議が終了すると、作成された議事録が、記録用音声受信装置から他のPC1に配布されて(S18)、処理は終了する。
【0059】
以上説明したように、受信する音声の品質が所定よりも高いPC1が自装置であるか否かを、通信システム100内の複数のPC1のそれぞれが判断することで、記録用音声受信装置を選定してもよい。上記変形例では、記録用音声受信装置を選定するための処理負担が、特定のPC1にのみ集中することを防止しつつ、記録用音声受信装置を的確に選定することができる。上記変形例における図8のS61〜S67で、記録用音声受信装置が自装置であるか否かを判断するCPU10が、「選定手段」として機能する。
【0060】
上記実施の形態は、その他の変更も可能である。上記実施の形態では、PC1のデータ処理能力、受信帯域、および雑音低減性能の順に音声パラメータが参照されることで、記録用音声受信装置が選定される。しかし、上記変形例に示すように、音声パラメータを参照する順番は変更できる。さらに、参照するパラメータの数も変更できる。例えば、PC1は、データ処理能力、受信帯域、および雑音低減性能のいずれか1つのみを参照して記録用音声受信装置を選定してもよい。
【0061】
上記実施の形態では、複数のPC1のうち、受信する音声の品質が最も高い1つのPC1が、記録用音声受信装置に選定される。しかし、選定装置は、複数のPC1を記録用音声受信装置に選定してもよい。例えば、選定装置は、データ処理能力、受信帯域、および雑音低減性能の音声パラメータに所定の閾値を設定しておく。選定装置は、音声パラメータが閾値よりも高い1または複数のPC1を、記録用音声受信装置に選定してもよい。選定装置は、受信する音声の品質が高い順に所定数のPC1を記録用音声受信装置として選定してもよい。
【0062】
PC1は、データ処理能力、受信帯域、および雑音低減性能以外の他の音声パラメータを参照して記録用音声受信装置を選定してもよい。例えば、音声データの送信元のPC1にイヤホンが接続されていれば、受信する音声データにエコーが含まれる可能性は低い。従って、PC1は、送信元のPC1にイヤホンが接続されているか否かを参照することで、受信する音声の品質が高いか否かを判断することもできる。PC1が備えるHDD13等の記憶手段の記憶容量を、PC1のデータ処理能力を示す音声パラメータとして参照してもよい。PC1は、遠隔会議を実行する毎に他のPC1の音声パラメータを取得する必要はない。例えば、PC1は、通信相手のPC1との間で過去に遠隔会議を実行し、既に通信相手のPC1の音声パラメータを取得していれば、既に取得している音声パラメータに基づいて処理を行ってもよい。
【0063】
PC1は、自装置内で循環する間に増幅される音声のレベル(以下、「ループバック音声レベル」という。)を算出し、算出したループバック音声レベルを音声パラメータとして用いてもよい。例えば、CPU10は、ループバック音声レベルを算出するための基準音声をスピーカ32から出力し、マイク31に入力させる。CPU10は、スピーカ32から出力する音声のデータから、マイク31によって入力された基準音声の増幅率を算出する。基準音声の増幅率が高ければ、ループバック音声レベルが高いため、PC1が送信する音声データの品質は低下する。よって、PC1は、ループバック音声レベルを参照することで、記録用音声受信装置を的確に選定することができる。
【0064】
上記実施の形態では、記録用音声受信装置として選定されたPC1は、自装置が受信した音声データに対して音声認識処理を行い、テキストデータである議事録を作成する。しかし、記録用音声受信装置は、遠隔会議の内容をテキストデータで記録しなくてもよい。例えば、記録用音声受信装置は、自装置が受信した音声データをそのままHDD13等に記憶することで、遠隔会議の内容を記録(録音)してもよい。記録用音声受信装置が受信する音声の品質は高いので、高品質の音声が録音される。よって、通信システム100は、遠隔会議の内容を正確な音声で記録することができる。
【0065】
遠隔会議の内容を記録する装置は、記録用音声受信装置である必要はない。例えば、記録用音声受信装置は、受信した音声データを他の録音機器に転送してもよい。音声データを転送された録音機器が、音声を録音してもよい。つまり、上記実施の形態のPC1は、通信システム100内の複数のPC1の中で、最も品質が高い音声を受信することができるPC1を、記録用音声受信装置として選定することができる。従って、記録用音声受信装置が受信する音声データを用いて遠隔会議の内容が記録されれば、いずれの装置が記録を行っても、遠隔会議の内容を正確に記録することができる。
【0066】
通信システム100内に、記録用音声受信装置を選定することができない通信装置が含まれていてもよい。PC1は、いずれのPC1を記録用音声受信装置に選定したかをユーザに通知してもよい。ユーザが、通知された記録用音声受信装置を操作して、遠隔会議の内容の記録を開始させてもよい。
【符号の説明】
【0067】
1 PC
10 CPU
13 HDD
31 マイク
32 スピーカ
34 表示装置
100 通信システム

【特許請求の範囲】
【請求項1】
少なくとも音声データが複数の通信装置間で相互にP2Pで送受信される通信システムにおいて使用される通信装置であって、
自装置を含む前記複数の通信装置の各々から、各々の通信装置が受信する音声の品質を示す音声パラメータを取得するパラメータ取得手段と、
前記パラメータ取得手段によって取得された音声パラメータを参照して、前記複数の通信装置の中から、受信する音声の品質が所定よりも高い通信装置を、情報を記録するために用いられる音声を受信する記録用音声受信装置として選定する選定手段と
を備えたことを特徴とする通信装置。
【請求項2】
前記音声パラメータは、前記複数の通信装置の各々が受信することができるデータの伝送速度である受信伝送速度を含み、
前記選定手段は、前記パラメータ取得手段によって取得された受信伝送速度が大きい通信装置を、受信する音声の品質が高い通信装置として、前記記録用音声受信装置を選定することを特徴とする請求項1に記載の通信装置。
【請求項3】
前記音声パラメータは、エコーおよびノイズの少なくとも一方を低減する雑音低減手段の有無、および前記雑音低減手段の性能の少なくともいずれかを示す雑音低減情報を含み、
前記選定手段は、前記パラメータ取得手段によって取得された雑音低減情報を参照することで、受信する音声のエコーおよびノイズの少なくとも一方が低減される通信装置を、受信する音声の品質が高い通信装置として、前記記録用音声受信装置を選定することを特徴とする請求項1または2に記載の通信装置。
【請求項4】
前記音声パラメータは、各種データの処理能力を示す処理能力情報を含み、
前記選定手段は、前記パラメータ取得手段によって取得された処理能力情報が示す各種データの処理能力が高い通信装置を、受信する音声の品質が高い通信装置として、前記記録用音声受信装置を選定することを特徴とする請求項1から3のいずれかに記載の通信装置。
【請求項5】
前記複数の通信装置の各々の前記選定手段は、受信する音声の品質が前記複数の通信装置の中で所定よりも高い前記記録用音声受信装置が自装置であるか否かを判断することで、前記記録用音声受信装置が選定されることを特徴とする請求項1から4のいずれかに記載の通信装置。
【請求項6】
各種データの処理能力を示す処理能力情報を、自装置を含む前記通信装置の各々から取得する処理能力取得手段と、
前記複数の通信装置の中から、前記処理能力取得手段によって取得された処理能力情報が示す処理能力が最も高い通信装置を、前記選定手段による前記記録用音声受信装置の選定を行う選定装置として決定する決定手段と、
前記決定手段によって自装置以外の他の通信装置を前記選定装置として決定した場合に、決定した前記選定装置に、前記記録用音声受信装置の選定を行うことを指示する第一指示情報を送信する第一指示送信手段とをさらに備え、
前記選定手段は、前記選定装置として自装置を決定した場合、および他の通信装置から前記第一指示情報を受信した場合に、前記記録用音声受信装置を選定することを特徴とする請求項1から4のいずれかに記載の通信装置。
【請求項7】
前記選定手段によって自装置以外の他の通信装置を前記記録用音声受信装置として選定した場合に、選定した通信装置に、受信した音声を用いて議事録を作成することを指示する第二指示情報を送信する第二指示送信手段と、
自装置の前記選定手段によって自装置が前記記録用音声受信装置に選定された場合、および他の通信装置から前記第二指示情報を受信した場合に、自装置が受信した音声に対して音声認識処理を行いテキストを生成することで議事録を作成する議事録作成手段と
をさらに備えたことを特徴とする請求項6に記載の通信装置。
【請求項8】
前記議事録作成手段によって作成された議事録を他の通信装置に送信する議事録送信手段をさらに備えたことを特徴とする請求項7に記載の通信装置。
【請求項9】
前記パラメータ取得手段によって取得された自装置の音声パラメータを参照して、送受信される音声の品質を向上させる機能の使用をユーザに促す動作を実行する使用勧告手段をさらに備えたことを特徴とする請求項1から8のいずれかに記載の通信装置。
【請求項10】
少なくとも音声データが複数の通信装置間で相互にP2Pで送受信される通信システムを構成する通信装置によって行われる記録用音声受信装置の選定方法であって、
自装置を含む前記複数の通信装置の各々から、各々の通信装置が受信する音声の品質を示す音声パラメータを取得するパラメータ取得ステップと、
前記パラメータ取得ステップによって取得された音声パラメータを参照して、前記複数の通信装置の中から、受信する音声の品質が所定よりも高い通信装置を、情報を記録するために用いられる音声を受信する記録用音声受信装置として選定する選定ステップと
を備えたことを特徴とする記録用音声受信装置の選定方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate


【公開番号】特開2011−199327(P2011−199327A)
【公開日】平成23年10月6日(2011.10.6)
【国際特許分類】
【出願番号】特願2010−60287(P2010−60287)
【出願日】平成22年3月17日(2010.3.17)
【出願人】(000005267)ブラザー工業株式会社 (13,856)
【Fターム(参考)】