説明

サーバ装置及び通信セッション確立方法

【課題】複数の通信端末間で通信セッションを確立する場合において、通信セッションの確立処理の進み具合を利用者が容易に把握することのできる技術を提供する。
【解決手段】サーバ装置20の記憶部22には、複数の通信端末10間における通信セッションを複数の段階(フェーズ)に分けて順番に確立するための確立処理の順番を示すリストが記憶されているとともに、音を表す音データがフェーズ毎に記憶されている。サーバ装置20の制御部21は、複数の通信端末10間における通信セッションを、複数の段階に分けて順番に確立する。このとき、制御部21は、処理中のフェーズに対応する音データを記憶部22から読み出し、読み出した音データを通信端末10へストリーミング配信する。通信端末10は、サーバ装置20からストリーミング配信されてくる音データをスピーカ18に出力する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、複数の通信端末との間に通信セッションを確立して通信する技術に関する。
【背景技術】
【0002】
近年、通信網を介して接続された複数の通信端末を用いて会議を行う遠隔会議システムが普及している。この種の遠隔会議システムにおいては、各通信端末は、映像や音声などの情報を他の全ての端末へ同時に送信する必要があるため、他の全ての通信端末の各々との間に通信セッションを予め確立しておく必要がある。この場合、通信端末の利用者は、通信セッションを確立する相手端末の通信アドレスの入力や選択といった操作を行う必要があり、これらの操作は利用者にとって煩わしいものである場合が多い。特に、接続する相手端末の台数が多いほど、利用者が行うべき操作はより煩雑なものとなる。そこで、例えば、特許文献1には、遠隔会議システムにおいて、複数の通信端末を自動接続したり、回線の接続確認を行ったりすることのできる技術が開示されている。
【特許文献1】特開昭60−208124号公報
【発明の開示】
【発明が解決しようとする課題】
【0003】
ところで、複数の通信端末間で通信セッションを確立する場合には、通信網上の問題などの種々の理由により、通信セッションが確立されない場合があり得る。従来の遠隔会議システムにおいては、通信セッションが確立されなかった場合であっても、そのことを利用者が容易に認識することはできなかった。特に、多数の通信端末との間で通信セッションを確立する場合には、どの通信端末との通信セッションの確立が成功してどの通信端末との通信セッションの確立に失敗しているのかを利用者が認識することは困難であった。また、利用者が会議の時間を忘れていた等の理由により、会議に参加すべき利用者が会議の開始に気付かない場合があった。
【0004】
本発明は上述した背景に鑑みてなされたものであり、複数の通信端末間で通信セッションを確立する場合において、通信セッションの確立処理の進み具合を利用者が容易に把握することのできる技術を提供することを目的とする。
【課題を解決するための手段】
【0005】
本発明の好適な態様であるサーバ装置は、複数の通信端末間における通信セッションを複数の段階に分けて順番に確立するための確立処理の順番を示す順番情報であって、各段階において通信セッションの確立先となる通信端末を示す確立先情報を含む順番情報を記憶する順番情報記憶手段と、音を表す音データを前記段階毎に記憶する音データ記憶手段と、前記複数の通信端末間における通信セッションを複数の段階に分けて順番に確立する通信セッション確立手段であって、前記段階毎に、当該段階に対応する確立先情報を前記順番情報記憶手段から読み出し、読み出した確立先情報の示す通信端末との間で通信セッションを確立する通信セッション確立手段と、前記段階に対応する音データを前記音データ記憶手段から読み出し、読み出した音データを前記通信セッション確立手段により確立された通信セッションを介して前記通信端末へ送信する音データ送信手段とを備えることを特徴とする。
この態様において、前記音データ送信手段は、前記音データ記憶手段に記憶された音データに符号化処理を施してリアルタイム伝送用の音データを生成して生成した音データを送信し、前記音データ送信手段の送信処理の処理状況に基づいて、前記通信網の混雑状況を判定する混雑状況判定手段と、前記混雑状況判定手段による判定結果に基づいて、前記音データ送信手段の符号化処理におけるビットレートを調整するビットレート調整手段とを備えてもよい。
【0006】
また、この発明の好適な態様である通信セッション確立方法は、複数の通信端末と、当該複数の通信端末間との通信セッションを複数の段階に分けて順番に確立するための確立処理の順番を示す順番情報であって各段階において通信セッションの確立先となる通信端末を示す確立先情報を含む順番情報を記憶する順番情報記憶手段と音を表す音データを前記段階毎に記憶する音データ記憶手段とを備えるサーバ装置とを有するシステムを用いた通信セッション確立方法であって、前記サーバ装置が、前記段階毎に、当該段階に対応する確立先情報を前記順番情報記憶手段から読み出し、読み出した確立先情報の示す通信端末との間で通信セッションを確立する第1の工程と、前記サーバ装置が、前記段階に対応する音データを前記音データ記憶手段から読み出し、読み出した音データを確立された通信セッションを介して前記通信端末へ送信する第2の工程と、前記通信端末が、前記サーバ装置から送信されてくる音データを受信する第3の工程と、前記通信端末が、受信した音データを放音手段に出力する第4の工程とを有することを特徴とする。
【発明の効果】
【0007】
本発明によれば、複数の通信端末間で通信セッションを確立する場合において、通信セッションの確立処理の進み具合を、利用者が容易に把握することができる。
【発明を実施するための最良の形態】
【0008】
<構成>
図1は、この発明の一実施形態である遠隔会議システム1の構成を示すブロック図である。この遠隔会議システム1は、各地に設置された複数の通信端末101,102,103,…,10nと、サーバ装置20とが、例えばインターネットなどの通信網30に有線接続されて構成される。この遠隔会議システム1は、複数の通信端末101,102,103,…,10nの間で、通信セッションを複数の段階に分けて順番に確立して通信を行う。なお、以下の説明においては、説明の便宜上、通信端末101,102,103,…,10nを各々区別する必要がない場合には、これらを「通信端末10」と称して説明する。
【0009】
各通信端末10は、サーバ装置20との間に通信セッションを確立し、自端末の利用者の音声を表す音声データを各通信セッションを介して送信する一方、各通信セッションを介して送信されてくる音声データを受信し、各音声データに応じた音声を合成して再生することによって、遠隔会議を実現する。より詳細に説明すると、サーバ装置20は、各通信端末10に対して、所定のメッセージフォーマットを有する通信メッセージを、通信端末10の通信アドレス宛に送信することによって、通信端末10に対する通信セッションの確立要求を行う。以下では、通信端末10へ通信セッションの確立を要求する旨の通信メッセージを「確立要求メッセージ」と称する。通信端末10は、サーバ装置20から確立要求メッセージ受信すると、サーバ装置20に対して通信セッションの確立許可を示す通信メッセージを送信する。なお、通信セッションの確立処理や通信セッションの切断処理については、従来の通信端末で行われる処理と同様であるため、ここではその詳細な説明を省略する。
【0010】
図2は、通信端末10のハードウェア構成を示すブロック図である。図において、制御部11は、CPU(Central Processing Unit)やROM(Read Only Memory)、RAM(Random Access Memory)を備え、ROM又は記憶部12に記憶されているコンピュータプログラムを読み出して実行することにより、バスBUSを介して通信端末10の各部を制御する。記憶部12は、制御部11によって実行されるプログラムやその実行時に使用されるデータを記憶するための記憶手段であり、例えばハードディスク装置である。表示部13は、液晶表示パネルなどを備え、制御部11による制御の下に各種の画像を表示する。操作部14は、利用者による操作に応じた信号を制御部11に出力する。通信部15は、サーバ装置20や他の通信端末10の間で通信網30を介した通信を行うための通信手段であり、通信網30に有線接続されている。この通信部15は、制御部11から引き渡された通信メッセージや音声データを通信網30へ送出する一方、通信網30から送信されてくる通信メッセージや音声データを受信し制御部11へ引き渡すものである。マイクロフォン16は、会議に参加している者が発声した音声を収音し、収音した音声を表す音声信号(アナログ信号)を出力する。音声処理部17は、マイクロフォン16が出力する音声信号(アナログ信号)をデジタルデータに変換して制御部11に出力する。スピーカ18は、音声処理部17でデジタルデータからアナログ信号に変換され出力される音声信号に応じた強度で放音する放音手段である。計時部19は、計時を行う計時手段であり、予め定められた時刻になるとその旨を示す信号を制御部11に出力する。
【0011】
なお、この実施形態では、マイクロフォン16とスピーカ18とが通信端末10に含まれている場合について説明するが、音声処理部17へ入力端子及び出力端子を設け、オーディオケーブルを介してその入力端子に外部マイクロフォンを接続するとしても良く、同様に、オーディオケーブルを介してその出力端子に外部スピーカを接続するとしても勿論良い。また、本実施形態では、マイクロフォン16から音声処理部17へ入力される音声信号及び音声処理部17からスピーカ18へ出力される音声信号がアナログ音声信号である場合について説明するが、デジタル音声データを入出力するようにしても良い。このような場合には、音声処理部17にてA/D変換やD/A変換を行う必要はない。
【0012】
記憶部12は、図示のように、音データ記憶領域121を有している。音データ記憶領域121には、音を表すデータが記憶されている。以下の説明では、説明の便宜上、音データ記憶領域121に記憶された音データの表す音を、「接続待ち曲」という。
【0013】
図3は、サーバ装置20のハードウェア構成を示すブロック図である。図において、制御部21は、CPUやROM、RAMを備え、ROM又は記憶部22に記憶されているコンピュータプログラムを読み出して実行することにより、バスBUSを介してサーバ装置20の各部を制御する。記憶部22は、制御部21によって実行されるプログラムやその実行時に使用されるデータを記憶するための記憶手段であり、例えばハードディスク装置である。通信部25は、各通信端末10の間で通信網30を介した通信を行うための通信手段であり、通信網30に有線接続されている。この通信部25は、制御部21から引き渡された通信メッセージなどを通信網30へ送出する一方、通信網30から送信されてくる通信メッセージなどを受信し制御部21へ引き渡すものである。計時部29は、計時を行う計時手段であり、予め定められた時刻になるとその旨を示す信号を制御部21に出力する。
なお、この実施形態では、通信部15や通信部25が、通信網30に有線接続されている場合について説明するが、通信網30と無線通信する無線通信部であっても良いことは勿論である。
【0014】
記憶部22は、図示のように、リスト記憶領域221と、音データテーブル記憶領域222と会議情報記憶領域223とを有している。リスト記憶領域221には、通信端末10を識別する端末情報が並べられて構成されたリストが、会議を識別する会議IDに対応付けて記憶されている。このリストは、複数の通信端末10間における通信セッションを複数の段階に分けて順番に確立するための確立処理の順番を示す順番情報であって、各段階において通信セッションの確立先となる通信端末10を示す確立先情報とを含む順番情報である。会議情報記憶領域223には、会議に参加する通信端末10の総数などの会議に関わる各種情報が、会議毎に記憶されている。
【0015】
図4は、リスト記憶領域221に記憶されたリストの内容の一例を示す図である。なお、この実施形態においては、通信端末101,102,103,…,10nの端末IDを、それぞれ、「101」,「102」,「103」,…,「10n」として説明する。図4に示す例においては、このリストは、通信端末101,102,103,…,10nの順番で端末IDが並べられて構成されている。また、図示のように、複数の端末IDは、複数のフェーズ(段階)毎にグループ化されている。言い換えると、複数の通信端末10のそれぞれに複数のフェーズのうちのいずれかが割り当てられている。なお、各フェーズに割り当てる通信端末10の台数は、1台であってもよく、また、複数台であってもよい。
この実施形態においては、サーバ装置20は、通信端末10間の通信セッションをこのリストの順番で確立する。
【0016】
記憶部22の音データテーブル記憶領域222には、音を表す音データがフェーズ(段階)毎に記憶されている。図5は、音データテーブルの内容の一例を示す図である。図示のように、音データテーブル記憶領域222には、「フェーズ番号」と「音データ」との各項目が互いに関連付けて記憶されている。これらの項目のうち、「フェーズ番号」の項目には、通信セッションを複数の段階に分けて順番に確立するための各段階(フェーズ)を示す情報が記憶される。「音データ」の項目には、音を表すデータが記憶される。この実施形態では、「フェーズ1」に対応する「音データ」の項目には、ストリングスの演奏音を表す音データが記憶されており、「フェーズ2」に対応する「音データ」の項目には、ストリングスとリズムの演奏音を表す音データが記憶されている。「フェーズ3」に対応する「音データ」の項目には、ストリングス、リズム及びオルガンの演奏音を表す音データが記憶されている。このように、この実施形態では、マルチトラック音源のように、参加トラックがフェーズ毎に増えていくようになっている。このように、最初はストリングス、次にリズムが加わり、オルガン、ピアノ、ベース、ギター、ホーン、そして最後にボーカルが加わるようになっている。つまり、「フェーズN」に対応する「音データ」の項目には、ストリングス、リズム、オルガン、ピアノなどの演奏音に加えてボーカルの歌唱音声を表す音データが記憶されている。
【0017】
会議情報記憶領域223には、「総フェーズ数Nfall」と「端末総数Nlall」と「割り当てフェーズ番号Nf」とが、「会議ID」に関連付けて記憶されている。「総フェーズ数Nfall」は、その会議におけるフェーズの総数を示す情報である。「端末総数Nlall」は、その会議において通信セッションを確立する通信端末10(遠隔会議に参加する通信端末10)の総数を示す情報である。「割り当てフェーズ番号Nf」は、それぞれの通信端末10に割り当てられているフェーズ番号である。サーバ装置20の制御部21は、この会議情報記憶領域223に記憶されている情報を用いて、通信端末10間の通信セッションの確立処理を行う。
なお、リスト情報記憶領域221に記憶されたリストや、音データ記憶領域222に記憶された音データ、会議情報記憶領域223に記憶された会議情報は、サーバ装置20の管理者がその内容を変更できるようにしてもよく、また、遠隔会議システム1の利用者が通信端末10の操作部14を操作して変更できるようにしてもよい。
【0018】
<動作>
まず、サーバ装置20が行う処理の流れについて、図6に示すフローチャートを参照しつつ以下に説明する。
制御部21は、図6に示す処理を実行する際に、「現フェーズ番号nf」と「リストポインタnl」とを変数として用いる。「現フェーズ番号nf」は、遠隔会議システム1の通信セッションの確立処理においてその時点の段階を示す情報である。「リストポインタnl」は、リスト記憶領域221に記憶されたリストに含まれる通信端末10のいずれかを指し示す情報である。なお、以下の説明においては、説明の便宜上、通信セッションを確立する処理を、単に「接続処理」という。
【0019】
サーバ装置20の制御部21は、まず、予め定められた処理開始時刻(例えば、会議の開始時刻の5分前、等)であるか否かを判定し、処理開始時刻でないと判定した場合には、処理開始時刻まで待機する。この判定は、計時部29から、処理開始時刻である旨を示す信号が制御部21に供給されたか否かを判定することによって行われる。すなわち、制御部21は、計時部29からの信号の入力を受け付ける入力受付手段として機能する。ここで、計時部29から制御部21に信号が入力された場合、すなわち、処理開始時刻である場合には(ステップS1)、制御部21は、その会議に対応する会議情報を会議情報記憶領域223から読み出すとともに、その会議に対応するリストをリスト記憶領域221から読み出す(ステップS2)。
【0020】
次に、制御部21は、「現フェーズ番号nf」の値を「0」にする初期化処理を行うとともに、「リストポインタnl」の値を「0」にする初期化処理を行う(ステップS3)。
【0021】
次に、制御部21は、「リストポインタnl」が「端末総数Nlall」より大きいか否か、すなわち「リストポインタnl」がリストの最後尾まで移動したか否かを判定する(ステップS4)。判定結果が否定的である場合、すなわち「リストポインタnl」がリストの最後尾まで移動していないと判定された場合には(ステップS4;NO)、制御部21は、「現フェーズ番号nf」が「割り当てフェーズ番号Nf」と一致するか否か、すなわち、「リストポインタnl」で指し示された通信端末10に割り当てられているフェーズ番号(「割り当てフェーズ番号Nf」)と「現フェーズ番号nf」とが一致するか否かを判定する(ステップS5)。一致すると判定した場合には、制御部21は、「リストポインタnl」で指し示された通信端末10へ、通信セッションを確立するための確立要求メッセージを送信し、その通信端末10との通信セッションを確立する(ステップS6)。次いで、制御部21は、通信セッションを確立した通信端末10に対して、「現フェーズ番号nf」に対応する音データを音データテーブル記憶領域222から読み出して、ストリーミング配信する(ステップS7)。このとき、制御部21は読み出した音データに符号化処理を施してリアルタイム伝送用の音データを生成し、生成した音データをストリーミング配信する。また、このとき、ステップS7において、制御部21は、フェーズが切り換わった場合には、前のフェーズの音と後のフェーズの音とがクロスフェードするような音データを端末装置10にストリーミング配信する。
【0022】
次いで、制御部21は、ストリーミング配信の通信状況を確認することにより、ビットレート調整処理を行う(ステップS8)。より具体的には、通信端末10の制御部11は、サーバ装置20からストリーミング配信されてくる音データの再生におけるノイズの発生頻度を検出し、検出結果を示す情報をサーバ装置20へ送信する。サーバ装置20の制御部21は、検出結果を示す情報を受信すると、受信した情報に基づいて通信網30の混雑状況を判定し、判定結果に基づいてビットレートを調整する。すなわち、制御部11は、送信処理の処理状況に基づいて、通信網の混雑状況を判定する混雑状況判定手段として機能するとともに、該判定結果に基づいて、符号化処理におけるビットレートを調整するビットレート調整手段として機能する。
【0023】
次いで、制御部21は、「リストポインタnl」に1を加算し(ステップS9)、ステップS4の処理に戻る。ステップS4〜ステップS9の処理が繰り返されることにより、リストに含まれる通信端末10との間で通信セッションがリストの順番に確立されていく。
【0024】
一方、ステップS5において、「リストポインタnl」で指し示された通信端末10に割り当てられているフェーズ番号と現フェーズ番号とが一致しないと判断された場合には、制御部21は、「フェーズ番号nf」に1を加算する(ステップS10)。これにより、次のフェーズに移行する。次いで、制御部11は、「現フェーズ番号nf」が、「総フェーズ数nfall」より大きいか否かを判定する(ステップS11)。ステップS11の判定結果が否定的である場合には(ステップS11;NO)、制御部21は、ステップS5の処理に戻る。一方、判定結果が肯定的である場合には(ステップS11;YES)、制御部21は、エラーが発生した旨を利用者に報知するなどの処理を行って、そのまま処理を終了する。
【0025】
一方、ステップS4において、判定結果が肯定的である場合、すなわち「リストポインタnl」がリストの最後尾まで移動したと判定された場合には(ステップS5;YES)、制御部21は、開始時刻になるまで待機する(ステップS12,ステップS13;NO)。制御部21は、計時部29からの信号に応じて会議の開始時刻になったか否かを判定し、会議の開始時刻になったと判定された場合には(ステップS13;YES)、制御部21は、会議開始時刻になった旨を示す情報を、全ての通信端末10に送信することによって、会議の開始時刻であることを全ての通信端末10へ伝える(ステップS14)。また、制御部21は、音データのストリーミング配信を停止する(ステップS15)。
【0026】
次に、通信端末10が行う処理の流れについて、図7に示すフローチャートを参照しつつ説明する。通信端末10の制御部11は、予め定められた処理開始時刻であるか否かを判定し、処理開始時刻でない場合には、処理開始時刻まで待機する。この判定は、計時部19から、処理開始時刻である旨を示す信号が制御部11に供給されたか否かを判定することによって行われる。すなわち、制御部11は、計時部19からの信号の入力を受け付ける入力受付手段として機能する。ここで、計時部19から制御部11に信号が入力された場合、すなわち、処理開始時刻である場合には(ステップS21)、制御部11は、音データ記憶領域121に記憶された音データに応じた音をスピーカ18から放音させる(ステップS22)。すなわち、制御部11は、音データ記憶領域121に記憶された音データを音声処理部17に供給し、音声処理部17は、制御部11から供給される音データをアナログ信号に変換してスピーカ18に供給し、スピーカ18から音として放音させる。通信端末10の利用者は、スピーカ18から放音される音を聴取することで、通信端末10が接続待ち中である旨を認識することができる。
【0027】
そして、制御部11は、サーバ装置20から確立要求メッセージが送信されてくるのを待機する(ステップS23,ステップS24;NO)。サーバ装置20から確立要求メッセージを受信したことを検知すると(ステップS24;YES)、制御部11は、サーバ装置20との通信セッションの確立処理を行う。通信セッションが確立されると、制御部11は、サーバ装置20からストリーミング配信されてくる音データに応じた音をスピーカ18から放音させる(ステップS25)。すなわち、制御部11は、通信部15を介して受信する音データを音声処理部17に供給し、音声処理部17は、制御部11から供給される音データをアナログ信号に変換してスピーカ18に供給し、スピーカ18から放音させる。
【0028】
次いで、制御部11は、サーバ装置20から会議の開始時刻である旨を示す情報を受信するまで待機する(ステップS26,ステップS27;NO)。サーバ装置20から会議の開始時刻である旨を示す情報を受信したことを検知する(ステップS27;YES)と、制御部11は、サーバ装置20からストリーミング配信されてくる音データの放音をフェードアウトさせ、処理を終了する。
【0029】
次に、この実施形態の具体的な動作例について、図8を参照しつつ以下に説明する。図8は、遠隔会議システム1の通信セッションの確立の様子を概略的に示す図である。この動作例においては、サーバ装置20は、複数の通信端末10の間の通信セッションを、複数の段階(フェーズ)に分けて順番に確立する。より具体的には、この実施形態では、サーバ装置20は、まず、「フェーズ1」に含まれる通信端末10との通信セッションを確立する処理を行い、次いで、「フェーズ2」に含まれる通信端末10との通信セッションを確立する。同様にして、フェーズ3、フェーズ4,…と、サーバ装置20は、通信端末10の間の通信セッションをフェーズ毎に順番に確立する。
【0030】
まず、予め定められた時刻(例えば、会議開始の10分前、等)になると、サーバ装置20は、図6に示した処理を開始する。また、通信端末10も、サーバ装置20からの通信セッション確立要求メッセージの受信を待機する。
サーバ装置20は、通信セッションの確立要求を示す確立要求メッセージを、まず、リスト記憶領域221に記憶されたリストに含まれる端末IDの示す通信端末であって、フェーズ1に含まれる通信端末へ順番に送信する。通信端末10はそれぞれ、送信されてくる確立要求メッセージに応じて通信セッションを確立するための処理を行う。なお、通信セッションの確立処理は、一般的な通信端末で行われる処理と同様であるため、ここではその詳細な説明を省略する。
【0031】
サーバ装置20との間で通信セッションが確立されると、通信端末10は、サーバ装置20からストリーミング配信されてくる音データを音声処理部17を介してスピーカ18に供給し、スピーカ18から放音させる。
【0032】
サーバ装置20は、フェーズ毎に、そのフェーズに対応する音データを通信端末10にストリーミング配信する。このとき、サーバ装置20は、フェーズが移行する毎に、前のフェーズの音と後のフェーズの音とがクロスフェードするような音データを端末装置10にストリーミング配信する。通信端末10は、サーバ装置20からストリーミング配信されてくる音データに応じて放音するから、これにより、通信端末10の利用者は、通信セッションの処理の進み具合がどのフェーズであるかを認識することができる。
【0033】
全ての通信端末10の間で通信セッションを確立すると、サーバ装置20は、全ての通信端末10に対して最終フェーズに対応する音データをストリーミング配信している状態で、会議開始時刻まで待機する。
【0034】
会議の開始時刻になると、サーバ装置20は、会議の開始時刻である旨を示す情報を、全ての通信端末10に送信する。この情報を受信すると、通信端末10は、放音している音をフェードアウトさせることによって会議の開始を利用者に報知する。
【0035】
以上説明したようにこの実施形態によれば、遠隔会議システム1は、複数の通信端末10における通信セッションを複数の段階(フェーズ)に分けて順番に確立する。このとき、フェーズが移行する毎に、スピーカ18から放音される音は切り換わる。具体的には、この実施形態においては、「フェーズ1」の段階では通信端末10からストリングスの演奏音が放音され、「フェーズ2」の段階ではストリングスとリズムの演奏音が放音される。次いで、「フェーズ3」の段階ではストリングス、リズム及びオルガンの演奏音が放音される。このように、通信端末10からは、フェーズが移行する毎に楽器が順番にセッションに参加していくような演奏音が放音され、最終フェーズでは、ボーカルの歌唱音声が加わった演奏音及び歌唱音声が放音される。このように、フェーズが移行する毎に放音される音が切り換わるから、これにより、遠隔会議システム1の利用者は、通信端末10から放音される音を聴取することで、通信セッションの確立処理の進み具合を段階的に把握することができる。
具体的には、例えば、「フェーズ2」に対応する音が通信端末10から放音されている場合には、利用者は、その音を聴取することで確立処理の処理段階が「フェーズ2」であることを認識できる。また、フェーズ毎に放音する音を変えることにより、利用者は、通信端末10の周辺にいるだけで、会議の開始時刻が近づいていることを認識できる。
特に、この実施形態では、楽器(又はボーカル)の演奏音(又は歌唱音声)がフェーズが移行する毎に順番に重なっていくように利用者に聴かせることができ、処理の進み具合を利用者により分かり易く報知することができる。
【0036】
また、この実施形態では、ストリーミング配信される音データを利用してビットレート調整を行うから、伝送路の混み具合も確認でき、ビットレートを調整するためのデータを別途配信する必要がなく、通信セッションの確立処理の進み具合を利用者に報知しつつビットレート調整を行うことができる。
【0037】
<変形例>
以上、この実施形態について説明したが、この実施形態は上述した実施形態に限定されることなく、他の様々な形態で実施可能である。以下にその一例を示す。
(1)上述した実施形態では、サーバ装置20の制御部21が、ストリーミング配信する音データの再生具合で回線の太さを判断し、ビットレートを変更する構成としたが、必ずしもビットレートを変更する必要はなく、ビットレートを変更しない構成としてもよい。
【0038】
(2)上述した実施形態において、制御部21が、あるフェーズである通信端末10との通信セッションの確立に失敗した場合には、次のフェーズに移行した後、所定時間経過後にリトライするようにしてもよい。また、制御部21が、通信セッションの確立に失敗した通信端末をリストで保持し、最後のフェーズまで移行した後に、通信セッションの確立に失敗した通信端末10に対してリトライするようにしてもよい。すなわち、通信セッションの確立に失敗した場合に、失敗した通信セッションの確立先である通信端末10を示す端末情報を記憶する記憶手段を備える構成とし、制御部11が、リストに含まれる通信端末10との通信セッションの確立処理を一通り終えた後に、その記憶手段に記憶された端末情報の示す通信端末10との通信セッションを確立するための処理を再度行うようにしてもよい。
【0039】
(3)上述した実施形態では、通信セッションを確立する順番を示すリストを、サーバ装置20の記憶部22に予め記憶させておく構成とした。これに代えて、通信セッションの確立処理を開始するタイミングで、所定のコンピュータ装置からリストデータを受信するようにしてもよい。
【0040】
また、上述した実施形態では、複数の通信端末10間の通信セッションを複数の段階に分けて順番に確立するための確立処理の順番を示す順番情報として、リスト記憶領域221に記憶されたリストを用いたが、順番情報はこれに限定されるものではなく、例えば、フェーズ番号と端末IDとを対応付けて記憶したテーブルを用いてもよい。要するに、順番情報は、複数の通信端末10間の通信セッションを複数の段階に分けて順番に確立するための確立処理の順番を示すものであればどのようなものであってもよい。
【0041】
(4)上述した実施形態では、サーバ装置20の制御部21は、計時部29から信号を受信することをトリガとして、通信セッションの確立処理を開始した。通信セッションの確立処理を開始するトリガはこれに限らず、例えば、通信端末10から通信セッションの確立処理を開始する旨の指示情報を受信することをトリガとしてもよい。また、例えば、制御部21が、操作部からの操作信号の入力を受け付ける構成とし、操作部から操作信号が入力された場合に、制御部21が通信セッションの確立処理を開始してもよい。この場合は、利用者によって操作が行われると、制御部21が通信セッションの確立処理を開始する。要するに、信号の入力を受け付ける入力受付手段は、操作部からの信号を受信するものであってもよく、また、計時部29からの信号を受信するものであってもよく、また、通信端末10からの指示情報を受信するものであってもよい。
【0042】
(5)上述した実施形態では、フェーズが移行した場合に音をクロスフェードさせる構成としたが、必ずしもクロスフェードさせる必要はなく、クロスフェードさせない構成としてもよい。
また、上述した実施形態では、通信端末10は、サーバ装置20から通信セッションの確立要求メッセージを受信するまでは自端末に記憶された音データに応じた音(接続待ち曲)を放音したが、接続待ち曲を放音しない構成としてもよい。
【0043】
(6)上述した実施形態では、会議の開始時刻になると、端末装置10は音をフェードアウトさせることによって、会議の開始時刻である旨を利用者に報知した。会議の開始時刻である旨を報知する態様はこれに限らず、例えば、サーバ装置20が、全てのフェーズに対応する音データをミキシングしてストリーミング配信し、通信端末10から放音させることによって報知してもよい。また、例えば、サーバ装置20が、拍子を表す音を表す音データをストリーミング配信させる構成としてもよい。また、例えば、サーバ装置20が、「会議の開始時刻です」といった音声メッセージを表す音データをストリーミング配信してもよく、また、会議の開始時刻である旨を示す画像を表す画像データを、通信端末10に送信してもよい。また、通信端末10の制御部11が、予め記憶された音データを読み出してスピーカ18に出力してもよい。要するに、通信端末10が、会議の開始を報知するためのデータをスピーカ18に出力すればよい。
【0044】
(7)上述した実施形態では、複数の通信端末10の端末IDが、フェーズ毎にグループ化されて予め記憶されていた。これに代えて、サーバ装置20の制御部21が、所定のアルゴリズムに基づいて複数の通信端末10を複数のフェーズに分けるようにしてもよい。具体的には、例えば、N個のフェーズに分割する場合には、会議に参加する通信端末10の総数をほぼN等分することによって、各フェーズに通信端末10を割り当てるようにしてもよい。
【0045】
(8)サーバ装置20の音データテーブル記憶領域222に記憶される音データは、上述した実施形態で示したようなオルガンの演奏音を表すデータや、歌唱音声を表すデータに限らず、例えば、トランペットやバイオリンなど他の種々の楽器の演奏音を表す音データであってもよい。また、例えば、ある特定の音高の音を表すデータであってもよい。例えば、「ド」、「ミ」、「ソ」、…といったそれぞれの音高の音を表すデータを記憶させておき、フェーズが移行する毎に放音される音高が高くなっているような態様であってもよい。なお、この場合には、音データを必ずしもストリーミング配信する必要はない。
【0046】
また、例えば、音データテーブル記憶領域222に、ドラムの演奏音を表すデータ、ベースの演奏音を表すデータ、ギターの演奏音を表すデータ、ボーカルの歌唱音声を表すデータをフェーズ毎に記憶させておいてもよい。また、フェーズ毎に異なる楽曲を表す音データを記憶させておいてもよい。
要するに、音データテーブル記憶領域222に記憶される音データは、音を表す音データであればどのようなものであってもよい。
【0047】
また、上述した実施形態では、サーバ装置20は、段階(フェーズ)が移行する毎に、前の段階の音と次の段階の音とがクロスフェードするような音データを通信端末10にストリーミング配信した。これに代えて、通信端末10が、前の段階の音データと次の段階の音データとをミキシングして配信するようにしてもよい。この場合も、楽器(又はボーカル)の演奏音(又は歌唱音声)が、フェーズが移行する毎に順番に重なっていくように利用者に聴かせることができ、処理の進み具体を利用者により分かり易く報知することができる。要するに、サーバ装置20が、音データテーブル記憶領域222に記憶された音データのうちの、少なくとも現フェーズに対応する音データを、通信端末10に送信する構成であればよい。
【0048】
(9)また、上述した実施形態では、サーバ装置20の音データテーブル記憶領域222に音データをフェーズ毎に予め記憶させておく構成とした。これに代えて、1種類の音データのみを記憶させておく構成とし、フェーズが移行する毎に、サーバ装置20の制御部21が、記憶された音データに対して所定のアルゴリズムに基づいた処理を施して音データを加工し、加工した音データをストリーミング配信する構成としてもよい。このように、サーバ装置20は、予め記憶された音データを通信端末10にストリーミング配信してもよく、また、予め記憶された音データを加工して配信してもよい。
【0049】
(10)上述した実施形態におけるサーバ装置20の制御部21又は通信端末10の制御部11によって実行されるプログラムは、磁気テープ、磁気ディスク、フレキシブルディスク、光記録媒体、光磁気記録媒体、RAM、ROMなどの記録媒体に記録した状態で提供し得る。また、インターネットのようなネットワーク経由でサーバ装置20又は通信端末10にダウンロードさせることも可能である。
【図面の簡単な説明】
【0050】
【図1】遠隔会議システムの構成の一例を示すブロック図である。
【図2】通信端末のハードウェア構成の一例を示すブロック図である。
【図3】サーバ装置のハードウェア構成の一例を示すブロック図である。
【図4】リストの内容の一例を示す図である。
【図5】音データテーブルの内容の一例を示す図である。
【図6】サーバ装置が行う処理の流れを示すフローチャートである。
【図7】通信端末が行う処理の流れを示すフローチャートである。
【図8】通信セッションが確立される様子を概略的に示す図である。
【符号の説明】
【0051】
1…遠隔会議システム、10,101,102,103,10n…通信端末、11,21…制御部、12,22…記憶部、13…表示部、14…操作部、15,25…通信部、16…マイクロフォン、17…音声処理部、18…スピーカ、19,29…計時部、20…サーバ装置、30…通信網、121…音データ記憶領域、221…リスト記憶領域、222…音データテーブル記憶領域、223…会議情報記憶領域。

【特許請求の範囲】
【請求項1】
複数の通信端末間における通信セッションを複数の段階に分けて順番に確立するための確立処理の順番を示す順番情報であって、各段階において通信セッションの確立先となる通信端末を示す確立先情報を含む順番情報を記憶する順番情報記憶手段と、
音を表す音データを前記段階毎に記憶する音データ記憶手段と、
前記複数の通信端末間における通信セッションを複数の段階に分けて順番に確立する通信セッション確立手段であって、前記段階毎に、当該段階に対応する確立先情報を前記順番情報記憶手段から読み出し、読み出した確立先情報の示す通信端末との間で通信セッションを確立する通信セッション確立手段と、
前記段階に対応する音データを前記音データ記憶手段から読み出し、読み出した音データを前記通信セッション確立手段により確立された通信セッションを介して前記通信端末へ送信する音データ送信手段と
を備えることを特徴とするサーバ装置。
【請求項2】
前記音データ送信手段は、前記音データ記憶手段に記憶された音データに符号化処理を施してリアルタイム伝送用の音データを生成して生成した音データを送信し、
前記音データ送信手段の送信処理の処理状況に基づいて、前記通信網の混雑状況を判定する混雑状況判定手段と、
前記混雑状況判定手段による判定結果に基づいて、前記音データ送信手段の符号化処理におけるビットレートを調整するビットレート調整手段と
を備えることを特徴とする請求項1に記載のサーバ装置。
【請求項3】
複数の通信端末と、当該複数の通信端末間との通信セッションを複数の段階に分けて順番に確立するための確立処理の順番を示す順番情報であって各段階において通信セッションの確立先となる通信端末を示す確立先情報を含む順番情報を記憶する順番情報記憶手段と音を表す音データを前記段階毎に記憶する音データ記憶手段とを備えるサーバ装置とを有するシステムを用いた通信セッション確立方法であって、
前記サーバ装置が、前記段階毎に、当該段階に対応する確立先情報を前記順番情報記憶手段から読み出し、読み出した確立先情報の示す通信端末との間で通信セッションを確立する第1の工程と、
前記サーバ装置が、前記段階に対応する音データを前記音データ記憶手段から読み出し、読み出した音データを確立された通信セッションを介して前記通信端末へ送信する第2の工程と、
前記通信端末が、前記サーバ装置から送信されてくる音データを受信する第3の工程と、
前記通信端末が、受信した音データを放音手段に出力する第4の工程と
を有することを特徴とする通信セッション確立方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate


【公開番号】特開2008−97096(P2008−97096A)
【公開日】平成20年4月24日(2008.4.24)
【国際特許分類】
【出願番号】特願2006−275027(P2006−275027)
【出願日】平成18年10月6日(2006.10.6)
【出願人】(000004075)ヤマハ株式会社 (5,930)
【Fターム(参考)】