説明

セッション端末及びネットワークセッションシステム

【課題】ネットワークセッションにおいて通信遅延による演奏の違和感を緩和すること。
【解決手段】このネットワークセッションシステムでは、バック演奏を鳴らすユーザ端末Aで、他のセッションメンバーであるユーザ端末Bとの通信遅延時間Tcを測定し、バック演奏情報について、再生開始を指示してから、測定した遅延時間Tc=30msと同じだけの遅延時間(モニター遅延時間)Tm=30msの後で再生を行い、ユーザ端末Bに対しては、遅延をかけずに直ちに送信を始める。これにより、ユーザ端末B側では、Tc=30msたってからバック演奏を聞き、ユーザ端末A側でも、Tm=30msたってからバック演奏を聞くことになる。例えば、バック演奏の開始に合わせて、ユーザA,Bが夫々ユーザ端末A,Bで歌唱の演奏を始めると、ユーザ端末A,B側では、それぞれ、ユーザB,Aの歌が、バック演奏からTc=30ms分だけ遅れてから聞こえる。

【発明の詳細な説明】
【技術分野】
【0001】
この発明は、インターネットなどの通信ネットワークを介して接続された複数の電子音楽端末の間で演奏などのセッションを行うネットワークセッションシステムに関する。
【背景技術】
【0002】
従来より、インターネットを介した楽器の演奏(合奏)やデュエット等の合唱などの音楽的なセッションを可能とした技術が知られている。例えば、特許文献1の合奏システムでは、自端末(A)での演奏動作を表わす演奏情報を、他端末(B)に送信すると共に、所定時間だけ遅延させて自端末(A)の楽音生成部に供給することにより、自端末(A)での演奏動作に応じた楽音を両端末(A,B)において同時に発音させることができる。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特許第4259329号公報
【0004】
また、インターネット回線を介した従来の楽器の合奏やデュエットなどのセッションでは、図1(1)に示すように、二つのユーザ端末A,B間に或る程度の通信遅延(例えば、30ms)が存在する環境において、ユーザ端末Aで、ユーザA自身の楽器演奏や歌唱などの演奏を30ms遅らせて発音させることで、ユーザ端末Bからの楽器演奏や歌唱などの演奏と同期させ、また、ユーザ端末Bでも、ユーザB自身の楽器演奏や歌唱などの演奏を30ms遅らせて発音させることで、ユーザ端末Aからの楽器演奏や歌唱などの演奏と同期させる。つまり、従来のネットセッション技術では、自端末における楽器演奏や歌唱などを表わす演奏データを他端末へ送信する一方、他端末における楽器演奏や歌唱などを表わす演奏データを自端末で受信し、自端末の演奏と他端末から受信した演奏を同時に発音させることでセッションを行い(他端末においても同様)、その際、他端末から受信した演奏と自端末で発生した演奏が同期するように、通信遅延を考慮した時間だけ、自端末における演奏の発音タイミングを遅延させる。しかしながら、端末ユーザ自身の楽器演奏や歌唱などが遅れて聞こえてしまうので、違和感を感じ、演奏者や歌唱者は気持ちよく演奏や歌唱をすることができない。
【0005】
ところで、例えばカラオケなどのバック演奏をどちらかの端末で鳴らし、それに合わせてデュエットで歌いたい或いは楽器を合奏したいといったユースケースの場合には、図1(2)に示すような遅延の偏りが発生する。例えば、ユーザ端末A側でバック演奏を鳴らし両端末A,Bでデュエットで歌うとした場合、ユーザ端末B側では、30msたってからバック演奏を聞き、バック演奏と同時にユーザAの歌が聞こえる。これに対して、ユーザ端末A側では、同図(a)のように、バック演奏の遅延は0msであるのに、ユーザBの歌が、バック演奏から往復の60ms分遅れて聞こえてしまう。これを時系列的に表わすと同図(b)のようになる。
【0006】
このように、インターネット越しなどの遅延が大きい環境では、片道の遅延であればセッション・デュエットが成り立つ場合でも、往復分の遅延が発生すると、聴感上不自然に聞こえて違和感を覚え、演奏が困難になってしまうことになる。
【発明の概要】
【発明が解決しようとする課題】
【0007】
この発明は、このような事情に鑑み、通信ネットワークを介して音楽的なセッションを行う際の通信遅延による演奏の違和感を緩和することができるネットワークセッションシステムを提供することを目的とする。
【課題を解決するための手段】
【0008】
〔解決策の概要〕
この発明によるネットワークセッションシステムでは、端的にいうと、図1で説明した問題点に対処する解決策として、図2(1)に示すように、バック演奏に対し、当該バック演奏を鳴らす端末つまりユーザ端末A側でも、片道のネットワークの遅延分Tc=30msだけ強制的に遅延Tm=30msを入れる。つまり、ユーザ端末Aでは、インターネット回線などの通信ネットワークにおける他のセッションメンバーであるユーザ端末Bとの通信遅延時間Tcを測定し、図2(2)に示すように、バック演奏情報について、再生開始を指示してから、測定した遅延時間Tc=30msと同じだけの遅延時間(モニター遅延時間)Tm=30msだけ経過した後で、再生を開始し、ユーザ端末Bに対しては、遅延をかけずに直ちに送信を始め、端末A,B間の通信遅延Tc=30msを許す。これにより、ユーザ端末B側では、Tc=30msたってからバック演奏を聞き、ユーザ端末A側でも、Tm=30msたってからバック演奏を聞くことになる。従って、バック演奏の開始に合わせて、例えば、ユーザA,Bが夫々ユーザ端末A,Bで歌唱の演奏を始めると、ユーザ端末B側では、ユーザAの歌が、バック演奏からTc=30ms分だけ遅れてから聞こえ、ユーザ端末A側でも、ユーザBの歌が、バック演奏からTc=30ms分だけ遅れて聞こえる。
【0009】
このようにバック演奏を鳴らすユーザ端末Aで、ネットワーク遅延分Tc=30msだけ強制的にバック演奏に遅延Tm=30msを入れることによって、ユーザA及びユーザBの両端末で同時にバック演奏を聴くことができ、従来技術ではユーザ端末A側に偏っていた遅延を、両端末A,Bで30msずつに平均化することができる。この発明によるネットワークセッションシステムは、片道の遅延ではなんとかデュエット等のセッションが可能であるが、往復分の遅延では演奏が破綻してしまうようなネットワーク遅延環境(だいたい、片道25ms〜50msぐらいの遅延環境)において、特に効果を発揮する。現在の国内の一般的な固定回線(ADSLや光回線)を使ってインターネット越しのセッションを行おうとすると、だいたい、この範囲内に入ることになるので、この発明により、有用なネットワークセッションシステムを提供することができるものと期待される。
【0010】
〔解決手段の構成〕
従って、この発明の具体的な解決手段の構成について説明すれば、端末構成上の特徴に従うと、通信ネットワーク(CN)を介して通信可能に接続された他のセッション端末(TMb,…,TMd)と共にネットワークセッションシステムを構成するセッション端末(TMa)であって、演奏情報を再生するための演奏再生手段(9)と、他のセッション端末(TMb,…,TMd)と通信するための通信手段(10)と、バック演奏情報(Bp)の再生を指示するバック演奏指示手段(A1)と、バック演奏指示手段により再生が指示されたバック演奏情報(Bp)を通信手段(10)を通じて他のセッション端末(TMb,…,TMd)に送信すると共に、当該再生が指示された後、他のセッション端末(TMb,…,TMd)との間の通信遅延時間(Tc)に相当するモニター遅延時間(Tm)だけ経過したときに、演奏再生手段(9)に当該バック演奏情報(Bp)の再生を開始させるバック演奏制御手段(A1〜A3)と、ユーザの演奏に基づくユーザ演奏情報(Upa)を入力するユーザ演奏入力手段(13−6,14−7;A4)と、ユーザ演奏入力手段(13−6,14−7;A4)により入力されたユーザ演奏情報(Upa)を通信手段(10)を通じて他のセッション端末(TMb,…,TMd)に送信すると共に、当該ユーザ演奏情報(Upa)及び他のセッション端末(TMb,…,TMd)から通信手段(10)を通じて受信された他のユーザ演奏情報(Upb,…,Upd)を演奏再生手段(9)に再生させるユーザ演奏制御手段(A4〜A6)とを具備するセッション端末(TMa)〔請求項1〕が提供される。なお、括弧書きは、実施例の参照記号や箇所等を表わし、以下においても同様である。
【0011】
また、システム構成上の特徴に従うと、通信ネットワーク(CN)を介して通信可能に接続された第1セッション端末(TMa)及び第2セッション端末(TMb,…,TMd)により構成されるネットワークセッションシステムであって、第1セッション端末(TMa)は、演奏情報を再生するための第1端末演奏再生手段(9)と、第2セッション端末(TMb,…,TMd)と通信するための第1端末通信手段(10)と、バック演奏情報(Bp)の再生を指示するバック演奏指示手段(A1)と、バック演奏指示手段(A1)により再生が指示されたバック演奏情報(Bp)を第1端末通信手段(10)を通じて第2セッション端末(TMb,…,TMd)に送信すると共に、当該再生が指示された後、第1及び第2セッション端末(TMa;TMb,…,TMd)間の通信遅延時間(Tc)に相当するモニター遅延時間(Tm)だけ経過したときに、第1端末演奏再生手段(9)に当該バック演奏情報(Bp)の再生を開始させる第1端末バック演奏制御手段(A1〜A3)と、第1セッション端末ユーザの演奏に基づく第1端末ユーザ演奏情報(Upa)を入力する第1端末ユーザ演奏入力手段(13−6,14−7;A4)と、第1端末ユーザ演奏入力手段(13−6,14−7;A4)により入力された第1端末ユーザ演奏情報(Upa)を第1端末通信手段(10)を通じて第2セッション端末(TMb,…,TMd)に送信すると共に、当該第1端末ユーザ演奏情報(Upa)及び第2セッション端末(TMb,…,TMd)から通信手段(10)を通じて受信された第2端末ユーザ演奏情報(Upb,…,Upd)を第1端末演奏再生手段(9)に再生させる第1端末ユーザ演奏制御手段(A4〜A6)とを具備し、第2セッション端末(TMb,…,TMd)は、演奏情報を再生するための第2端末演奏再生手段(9)と、第1セッション端末(TMa)と通信するための第2端末通信手段(10)と、第1セッション端末(TMa)から第2端末通信手段(10)を通じて受信されるバック演奏情報(Bp)を第2端末演奏再生手段(9)に再生させるバック演奏手段(B1,…,D1)と、第2セッション端末ユーザの演奏に基づく第2端末ユーザ演奏情報(Upb,…,Upd)を入力する第2端末ユーザ演奏入力手段(13−6,14−7;B2,…,D2)と、第2端末ユーザ演奏入力手段(13−6,14−7;B2,…,D2)により入力された第2端末ユーザ演奏情報(Upb,…,Upd)を第2端末通信手段(10)を通じて第1セッション端末(TMa)に送信すると共に、当該第2端末ユーザ演奏情報(Upb,…,Upd)及び第1セッション端末(TMa)から第2端末通信手段(10)を通じて受信された第1端末ユーザ演奏情報(Upa)を第2端末楽音演奏再生手段(9)に再生させる第2端末ユーザ演奏制御手段(B2〜B3,…,D2〜D3)とを具備するネットワークセッションシステム〔請求項2〕が提供される。
【発明の効果】
【0012】
この発明によるネットワークセッションシステムでは、通信ネットワーク(CN)で接続されシステムを構成する複数のセッション端末(TM:TMa,TMb,…,TMd)のうち、第1セッション端末と呼ばれるセッション端末(TMa)に用意されたバック演奏情報(Bp)が、システムのバック演奏に用いられ、第1セッション端末(TMa)から、第2セッション端末と呼ばれる他のセッション端末(TMb,…,TMd)へと送信される。第2セッション端末(TMb,…,TMd)では、端末ユーザが、このバック演奏情報(Bp)に基づくバック演奏音を聴きながら(B1,…,D1)、楽器演奏や歌唱などのユーザ演奏をすることができる(B2〜B3,…,D2〜D3)。第1セッション端末(TMa)においても、端末ユーザは、バック演奏情報(Bp)に基づくバック演奏音を聴きながら(A3)、楽器演奏や歌唱などのユーザ演奏をするが(A4)、その際、第1セッション端末(TMa)〜第2セッション端末(TMb,…,TMd)〜第1セッション端末(TMa)間の往復分通信遅延の略半分つまり片道分の通信遅延時間(Tc)に相当するモニター遅延時間(Tm)だけ、バック演奏情報(Bp)の再生つまりバック演奏音の発音が遅延される(A2〜A3)。また、ユーザ演奏の際は、第1セッション端末(TMa)のユーザ演奏情報(Upa)は第1セッション端末(TMb〜TMd)に送られ、第2セッション端末(TMb,…,TMd)のユーザ演奏情報(Upb,…,Upd)は第1セッション端末(TMa)に戻されるので、第2セッション端末(TMb,…,TMd)では、バック演奏(B1,…,D1)から片道分の通信遅延時間(Tc)分だけ遅れてから第1セッション端末ユーザの演奏が聞こえ(B3,…,D3)、第1セッション端末(TMa)でも、バック演奏(A3)から通信遅延時間(Tc)に相当するモニター遅延時間(Tm)分だけ遅れてから第2端末ユーザの演奏が聞こえる(A5〜A6)。従って、この発明によれば、第1セッション端末及び第2セッション端末で、バック演奏情報の再生の遅れを均等化することができ、従来技術では第1セッション端末に偏っていた通信遅延による演奏の違和感を緩和することができる。
【図面の簡単な説明】
【0013】
【図1】ネットワークセッションシステムの問題点を説明するための図である。
【図2】この発明による解決策の概要を説明するための図である。
【図3】この発明の一実施例によるネットワークセッションシステムの構成を示す。
【図4】この発明の一実施例によるネットワークセッションシステムの動作を示す。
【図5】この発明によるネットワークセッションシステムの種々の実施形態を示す。
【発明を実施するための形態】
【0014】
〔システム構成の概要〕
図3は、この発明の一実施例によるネットワークセッションシステムのシステム構成を示す。このネットワークセッションシステムは、図3(1)に示すように、セッション管理サーバSVと複数のセッション端末TM(記号“TM”はセッション端末を代表的に表わす):TMa〜TMdで構成され、セッション管理サーバSVは、メンバーとなるセッション端末TM間の接続支援、例えば、セッションの開始に先立って行われる各セッション端末TM同士の接続手続きなどを行う。各セッション端末TM間、例えば、セッション端末TMa〜TMd間で接続が成立した後は、セッション管理サーバSVを介することなく、これらセッション端末TMa〜TMd間において、MIDIデータやオーディオデータなどの演奏情報が送受信される。セッション管理サーバSVの動作は、よく知られているので、ここでは、より詳細な動作については説明を省略する。
【0015】
ネットワークセッションのメンバーとなる複数のセッション端末TMa〜TMdは、それぞれ、楽器演奏及び/又はカラオケが可能な電子音楽装置であり、これらセッション端末TMa〜TMdには、さらに、楽器演奏及び/又はカラオケのためのバック演奏機能を有するセッション端末がある。バック演奏機能を有するセッション端末のうち、メンバーの構成時に任意に設定された何れか1つのセッション端末は、「第1セッション端末」と呼ばれ、第1セッション端末のバック演奏機能をその時のネットワークセッションのバック演奏に利用することができる。この場合、第1セッション端末のバック演奏情報は、第1セッション端末で再生されると共に、「第2セッション端末」と呼ばれる残りの他のセッション端末に送信されて再生される。以下の説明では、セッション端末TMaが第1セッション端末として振る舞い、他のセッション端末TMb〜TMdが第2セッション端末として振る舞うものとする。また、個々のセッション端末TMa〜TMdについてはそれぞれ「セッション端末A〜D」で表わすものとする。
【0016】
図3(2)は、このネットワークセッションシステムを構成するセッション端末のハードウエア構成例を示すブロック図である。この発明の一実施例によるネットワークセッションシステムを構成するセッション端末TMは、電子的な音楽情報処理機能を有する一種のコンピュータであり、電子楽器や音楽情報処理アプリケーションがインストールされたパーソナルコンピュータ(PC)のような電子音楽装置を用いることができる。このセッション端末TMは、図1(1)に示すように、中央処理装置(CPU)1、ランダムアクセスメモリ(RAM)2、読出専用メモリ(ROM)3、記憶装置4、設定操作検出回路5、演奏操作検出回路6、アナログ−ディジタル(A/D)変換回路7、表示回路8、音源・効果回路9、通信インターフェース(I/F)10などを備え、これらの要素1〜10はバス11を介して互いに接続される。
【0017】
CPU1は、RAM2及ROM3と共にデータ処理部を構成し、ネットワークセッションプログラムを含む所定の制御プログラムに従い、ネットワークセッション処理を含む種々の情報処理を実行する。RAM2は、これらの処理に際して必要なデータを利用可能に保持するための記憶管理領域や各種データを一時記憶するためのワーク領域として用いられ、また、ROM3には、これらの処理を実行するために、ネットワークセッションプログラムを含む各種制御プログラムやプリセットされたデータ等が予め記憶される。
【0018】
記憶装置4は、HD(ハードディスク)、FD(フレキシブルディスク)、CD(コンパクトディスク)、DVD(デジタル多目的ディスク)、フラッシュメモリなどの半導体メモリなどの記憶媒体と、その駆動装置を含み、任意の制御プログラムや、バック演奏データを含むMIDI演奏データなどを任意の記憶媒体に記憶することができる。また、記憶媒体は、着脱可能であってもよいし、セッション端末TMに内蔵されていてもよい。
【0019】
設定操作検出回路5は、スイッチやマウス等の設定操作子(パネル操作子)12と共に設定操作部(パネル操作部)を構成し、設定操作子12の操作を検出して設定操作に対応する設定操作情報をデータ処理部(1〜3)に導入し、データ処理部は、この設定操作情報に基づき種々の設定を行う。演奏操作検出回路6は、鍵盤などの演奏操作子13と共に楽器演奏入力部を構成し、端末ユーザによる演奏操作子13の操作を検出して演奏操作に対応する演奏操作情報をデータ処理部に導入し、データ処理部は、演奏操作情報に基いて楽器演奏の内容をイベント列で表わしたイベント記述形式即ちMIDI形式の演奏データ(MIDI演奏データという)を作成し、音源・効果回路9に送る。A/D変換回路7は、マイクロフォン14と共に歌唱入力部を構成し、端末ユーザによる歌唱の演奏によりマイクロフォン14から入力された歌唱音声信号をディジタル信号に変換してデータ処理部に導入し、データ処理部は、歌唱音声の内容を波形で表わしたオーディオ形式の演奏データ(オーディオ演奏音データという)を音源・効果回路9に送る。表示回路8は、種々の設定、楽器演奏や歌唱などの演奏入力に必要な各種画面を表示するLCD等のディスプレイ15や、インジケータ/ランプ(図示せず)を備え、これらの表示・点灯内容をデータ処理部からの指令に従って制御し、設定や演奏入力などに関する表示援助を行う。
【0020】
音源・効果回路9は、MIDI形式のデータからオーディオデータを生成する音源部と、DSPを含み種々のオーディオデータ処理を行う効果部とを有し、サウンドシステム16と共に演奏再生部として機能する。例えば、音源部は、演奏操作検出回路6からの演奏操作情報から得られるMIDI演奏データ、或いは、ROM3、記憶装置4又は通信I/F10から得られるMIDI演奏データに基づいて、オーディオ演奏音データを生成し、効果部は、マイクロフォン14から入力されたオーディオ演奏音データや、音源部で生成されたオーディオ演奏音データ、或いは、通信I/F10などから得られるオーディオ演奏音データについて、所定の効果を付与したりミキシングを行い、オーディオ出力データを生成する。サウンドシステム16は、D/A変換部やアンプ、スピーカ(ヘッドフォンを含む)等を備え、音源・効果回路9からのオーディオ出力データに基づく楽音(楽器演奏音や歌唱音声)を発生する。
【0021】
通信I/F10は、MIDI等の音楽専用有線I/F、IEEE1394等の汎用近距離有線I/F、Ethernet(登録商標)等の汎用ネットワークI/F、無線LanやBluetooth(登録商標)等の汎用近距離無線I/Fなどの1又は複数を含み、インターネットなどの通信ネットワークCNを介して他のセッション端末との間でMIDI演奏データやオーディオ演奏音データを授受したり、サーバコンピュータ等の外部機器から制御プログラムやデータ等を受信して記憶装置4に保存することができる。
【0022】
〔ネットワークセッションの動作例〕
なお、セッション端末TMとして電子楽器を使用しカラオケを行わない場合は歌唱入力部14−7は不要であり、セッション端末TMとして音楽情報処理アプリケーション付きPCを使用しカラオケのみを行う場合には楽器演奏入力部13−6は不要である。また、セッション管理サーバSVのハードウエア構成については、図2(2)とほぼ同様に構成されるが、楽器演奏入力部13−6や演奏再生部9−16は不要である。
【0023】
〔ネットワークセッションの動作例〕
図4は、この発明の一実施例によるネットワークセッションシステムの動作を説明するための図である。まず、このネットワークセッションシステムにおける情報授受の概要について説明すると、このシステムでは、第1セッション端末として機能するセッション端末Aで再生されるバック演奏情報データは、セッション端末Aにおいて再生されると共に(A1〜A3)、セッションメンバーである他のセッション端末B〜Dへも、MIDI演奏データの形式のまま或いはオーディオ演奏音データの形式に変換されて、バック演奏情報Bpとして送信される。バック演奏情報Bpがセッション端末Aから各セッション端末B〜Dに送られると、各セッション端末B〜Dでは、夫々の端末ユーザにより、受信したバック演奏情報Bpを再生すると共に(B1〜D1)、バック演奏情報(オーディオ)Bpの再生に合わせて楽器演奏及び/又は歌唱が行われる(B2〜D2)。この楽器演奏及び/又は歌唱の内容を表わし各セッション端末B〜Dで生成されるユーザ演奏データは、楽器演奏の場合はMIDI演奏データ又はオーディオ演奏音データであり、歌唱の場合はオーディオ演奏音データであり、当該セッション端末B〜Dのユーザ演奏情報Upb〜Updとしてセッション端末Aに送信される。
【0024】
セッション端末Aでは、セッション端末Aの端末ユーザにより、自機で再生されたバック演奏に合わせて楽器演奏及び/又は歌唱が行われると共に(A4)、他のセッション端末B〜Dの楽器演奏及び/又は歌唱とミックスされる(A5〜A6)。つまり、バック演奏とユーザによる楽器演奏及び/又は歌唱の内容を表わす演奏情報Bp,Upaは、音源・効果回路9内の効果部で、他のセッション端末B〜Dから受信したユーザ演奏情報Upb〜Updとミキシングされて再生される。これにより、バック演奏に合わせて各セッション端末A〜Dで楽器演奏及び/又は歌唱されたセッション音楽が完成する。
【0025】
完成したセッション音楽を表わす合奏データは、セッション端末Aで再生されるだけでもよいし、録音されてもよいし、通信ネットワークCNを介して他の装置(図示せず)へ送信してもよく、送信例としては、録音したファイルをファイル共有サーバにアップロードしたり、ネット生放送アプリケーションを使って生放送の聴取者端末へリアルタイムに送信する方法がある(A6)。さらに、合奏データを録音、送信するだけでなく、動画をも合わせて録画したり送信してもよい。
【0026】
さて、このネットワークセッションシステムは、各セッション端末A〜D間に或る程度の通信遅延が存在する環境にある。ここで、セッション端末間の通信遅延時間Tcとは、図4(1)に示すように、送信側及び受信側セッション端末TMs,Tmr間の純粋なネットワークCN上の通信遅延時間Tnに加え、両端末TMs,Tmrにおける演奏データ送信及び受信駆動部(オーディオ演奏音データの場合はオーディオドライバ、MIDI演奏データの場合はMIDIドライバ)DRs,DRrの送信及び受信動作遅延時間Tds,Tdrをも含んだ時間である。特に、送信動作遅延時間Tdsについては、送信側セッション処理部SPsの送信指示を受ける演奏データ送信駆動部DRs内の送信バッファBUsの動作遅延が占める割合が高く、受信動作遅延時間Tdrについても、演奏データの受信から受信側セッション処理部SPrでの再生開始に至るまでの動作を行う演奏データ受信駆動部DRr内の受信バッファBUrの動作遅延が占める割合が高い。
【0027】
このシステムでは、第1セッション端末として機能しバック演奏データを用意するセッション端末Aは、第2セッション端末として機能しセッション端末Aからのバック演奏データを利用する他のセッション端末B〜Dと通信することにより、セッション端末Aと他のセッション端末B〜Dとの間の純粋な通信遅延時間Tnを計測することができる。具体的には、セッション端末Aからパケット送信時刻ta1が付された遅延測定用パケットを各セッション端末B〜Dへと送信し、各セッション端末B〜Dにおいては、遅延測定用パケットを受信した時刻tk1及び応答時の時刻tk2を付した応答パケット(但し、添字「k」は、「b」〜「d」であり、各端末B〜Dに関わることを表わす)をセッション端末Aへと返信する。そして、セッション端末Aにおいて、応答パケットを受信した時刻ta2と上述した各時刻ta1、tk1、tk2に基づき、セッション端末B〜Dとの間の往復の遅延時間dkを次の式<1>で計算する。
dk = (ta2−ta1)−(tk2−tk1) …<1>
【0028】
ここで、時刻ta1,ta2は、セッション端末Aにおいて管理されている時刻であり、時刻tk1、tk2は各セッション端末B〜Dにおいて管理されている時刻である。従って、各端末A〜Dにおける絶対時刻は厳密に一致している必要はない。何故なら、式<1>から明らかなように、セッション端末Aにおけるパケット送信からパケット受信までの時間差、或いは、セッション端末B〜Dにおけるパケット受信からパケット送信までの時間差を求めており、絶対時刻の考慮は不要となるからである。
【0029】
このようにして求められた往復の遅延時間dkを2分の1した値は片道の純粋な通信遅延時間Tnとみなすことができる。厳密には、パケットの往路と復路とで通信遅延時間が同−とは限らないが、実装上は問題がない程度の差異であるので、この実施例では、往復の遅延時間の2分の1を片道の純粋な通信遅延時間Tnとして採用している。
【0030】
そして、得られた純粋な通信遅延時間Tnに送信動作遅延時間Tds及び受信動作遅延時間Tdrを加えて、片道の通信遅延時間Tcを求め、この片道の通信遅延時間Tcをモニター遅延時間Tmとして設定する。
【0031】
なお、計測した各セッション端末B〜Dとの通信遅延時間の値が異なることがあるが、その場合は、次の何れかの値を適宜採用すればよい。
(1)平均値。
(2)最大値。
(3)基本的には最大値を採用するが、所定の閾値(現実的にセッションを行い得る範囲の遅延時間)Ttを越える場合は該閾値Ttを採用する。
(4)各セッション端末B〜Dごとに異なる遅延時間を設定する(具体例は後述)。
【0032】
セッション開始の際は、図4(2)の機能ブロック図に示すように、セッション端末Aにおいて、バック演奏再生の指示があると(A1)、再生する所望のバック演奏データが記憶装置4から読み出され、これに対応するバック演奏情報Bpがセッション端末B〜Dに送信されると共に、設定されたモニター遅延時間Tm分だけ自機におけるバック演奏音の再生が遅延される(A2〜A3)。つまり、セッション端末Aは、バック演奏再生が指示された後(A1)モニター遅延時間Tmだけ経過したときに(A2)、演奏再生部9に当該バック演奏データの再生に基づくバック演奏音の放音を開始させる(A3)。
【0033】
セッション端末B〜Dは、セッション端末Aで再生されるバック演奏データに対応するバック演奏情報Upaを再生指示から通信遅延Tc分だけ遅れて受信し、受信したバック演奏情報Upaを再生して対応するバック演奏音を放音する(B1〜D1)。そこで、セッション端末B〜Dのユーザが、このバック演奏を聴きながら楽器演奏乃至(=及び/又は)歌唱をすると(B2〜D2)と、これに対応するユーザ演奏音が放音されると共に(B3〜D3)、当該楽器演奏乃至歌唱の内容を表わすユーザ演奏情報Upb〜Updがセッション端末Aに送信される。
【0034】
セッション端末Aでも、この端末のユーザが、自機で再生したバック演奏音を聴きながら楽器演奏乃至歌唱をすることができ(A4)、併せて、その内容を表わすユーザ演奏情報Upaがセッション端末B〜Dに送信される。なお、端末Aでのバック演奏音は、バック演奏の再生指示からモニター遅延時間Tm分だけ遅れて放音されているが、この遅れ(Tm)は、セッション端末Aが第2セッション端末として機能していた場合の遅れ(Tc)とほぼ等しく、セッション端末Aのユーザにとってはその影響は感じられない。また、端末Aのユーザによる楽器演奏乃至歌唱の内容に対応するユーザ演奏音データ(Upa)は、音源・効果回路9内の効果部で、バック演奏音データ(Bp)や、他のセッション端末B〜Dから受信したユーザ演奏情報Upb〜Updに対応するユーザ演奏音データと共にミキシングされ(A5)、これらの演奏音データを合わせたセッション演奏音が放音、録音乃至送信される(A6)。
【0035】
このようにして、他のセッション端末B〜Dでは、バック演奏音の放音(B1〜D1)から遅れることほぼモニター遅延時間Tm後に、セッション端末Aで楽器演奏乃至歌唱された音が放音され(B3〜D3)、セッション端末B〜Dのユーザは、これを聴きながら更に楽器演奏乃至歌唱をする。セッション端末B〜Dのユーザにとっては、セッション端末Aのユーザの楽器演奏乃至歌唱は、バック演奏から、ほぼ通信遅延時間Tcと等しいモニター遅延時間Tm分だけ遅れているが、このモニター遅延時間Tmが所定時間以内(例えば30ms以内)であればそれほど違和感なく楽器演奏乃至歌唱が可能である。また、セッション端末Aでも、バック演奏の放音(A3)から遅れること通信遅延時間Tc後に、セッション端末B〜Dで楽器演奏乃至歌唱されたユーザ演奏音が放音されるが(A6)、この通信遅延Tcが所定時間以内(例えば30ms以内)であれば、セッション端末B〜Dと同様に、それほど違和感なく楽器演奏乃至歌唱が可能である。
【0036】
仮に、セッション端末Aにおいて、モニター遅延を入れないと、図1(2)で既に説明したように、セッション端末Aのユーザの楽器演奏乃至歌唱による自機ユーザ演奏音の放音と、セッション端末B〜Dのユーザの楽器演奏乃至歌唱による他機ユーザ演奏音の放音とは、セッション端末B〜Dにおいてはこれら演奏音がほぼ同時に放音されるのに比べて、通信遅延Tcの往復分だけ(例えば60ms程度)ずれてしまい、他機ユーザ演奏音の遅延が大きくなり過ぎて違和感が大きい。このシステムでは、モニター遅延Tmを入れることで、セッション端末Aにおける自機ユーザ演奏音の遅延が半減し、しかも、セッション端末Aとセッション端末B〜Dとで両ユーザ演奏音の遅延が均一化される(各セッション端末A〜Dが第1セッション端末として機能する場合も第2セッション端末として機能する場合もほぼ同じ遅延となる)ので、違和感を軽減することができる。
【0037】
なお、各セッション端末B〜Dにそれぞれ異なる遅延時間を設定する場合〔前記(4)の場合〕について、その具体的な設定例を説明する。セッション端末Aにおけるモニター遅延時間Tmには、測定した各セッション端末との通信遅延時間のうちの最大値、或いは、前述した所定の閾値Tt〔前記(3)参照〕を設定する。また、各セッション端末B〜Dへは、「モニター遅延時間Tm−夫々の通信遅延時間Tc」(但し、所定の閾値Ttを設定した場合には、通信遅延時間Tcが該閾値Ttを越えるときは通信時間Tcに代えて該閾値Ttとする)だけ待ってからパック演奏情報Bpを送信する。
【0038】
例えば、セッション端末B,C,Dとの通信遅延時間Tcが、それぞれ、20ms、40ms、60msであった場合、セッション端末Aにおけるモニター遅延時間Tmには、最大値の60ms(閾値Tt=50msを設定した場合は50ms)を設定し、セッション端末Bへは、60−20=40ms(閾値Tt=50msを設定した場合は50−20=30ms)だけ遅らせてから送信し、セッション端末Cへは、60−40=20ms(閾値Tt=50msを設定した場合は50−40=10ms)遅らせてから送信し、セッション端末Dへは、60−60=0ms(閾値Tt=50msを設定した場合は50−50=0ms)、つまり、遅延なしで送信する。このようにすると、各セッション端末においてほぼ同時にバック演奏を鳴らすことができる。
【0039】
〔種々の実施形態〕
以上、この発明の実施に関するネットワークセッションシステムの基本的な動作例について説明したが、具体的には種々の実施形態を採用することができる。図5は、この発明によるネットワークセッションシステムの種々の実施形態を説明するための機能ブロック図である。例えば、セッション端末Aでバック演奏を用意したり、各セッション端末A〜Dで楽器演奏をする場合、図5(1)に示すように、自端末Aに用意されたバック演奏データをMIDI形式とし、このMIDI形式のままバック演奏情報Bpとして他端末B〜Dへ送信したり、自端末A;B〜Dで生成されたMIDI形式のユーザ演奏情報Upa;Upb〜Updを他端末B〜D;Aへ送信してもよいし、図5(2)に示すように、自端末A;B〜Dにおける音源・効果回路9内の音源部にてオーディオ形式に変換された演奏音データ(A2a,A5c;B3c)をバック演奏情報Bp或いはユーザ演奏情報Upa;Upb〜Updとして他端末B〜D;Aへ送信してもよい。
【0040】
図5(1)のようにMIDIで送信する場合には、受信側の各セッション端末は、MIDIで受信した演奏情報Bp;Upを音源部(9)でオーディオ形式に変換してから(A3a,B1a;A5b,B3b)放音する(A3,B1;A6,B3)。また、セッション端末Aにおいてモニター遅延Tmを入れる場合は、バック演奏データがMIDI形式なら、図5(1)のように、MIDIのままで遅延しもよいし(A1→A2)、図5(2)のように、音源部(9)でオーディオ形式に変換されたバック演奏音データを遅延するようにしてもよい(A2a→A2)。
【0041】
また、各セッション端末A〜Dにおいて歌唱する場合、放音されたバック演奏音がマイクロフォン14で集音されてしまうということがないように、バック演奏音の放音にはヘッドフォンを利用するのが望ましい。例えば、セッション端末Bにおいて、放音されるバック演奏音をマイクで集音し、これをセッション端末Aに送信してしまうと、セッション端末Aでは、再生された本来のバック演奏音に対して、通信遅延Tcだけ遅延されたセッション端末Bからのユーザ演奏情報Upbが混ざってしまい、好ましくないからである。
【0042】
さらに、モニター遅延Tmの挿入態様をユーザにより選択することができるようにしてもよい。例えば、モニター遅延時間Tmを、計測した通信遅延時間Tcに応じて自動的に設定してもよいし、計測した通信遅延時間Tcを参考にしながらユーザが設定できるようにしてもよい。自動設定する場合は、既に説明したように通信路の往復遅延時間(2×Tc)の半分をモニター遅延時間Tmに設定しても良いし、片道の遅延時間をそのままモニター遅延時間Tmに設定してもよい。また、通信遅延時間Tcが、違和感の発生が生じてしまう時間以上ある場合、ディスプレイ15等を通じて、セッションの成立が困難である旨をユーザに通知するようにしてもよい。
【0043】
また、各セッション端末A〜Dが電子楽器の場合、図5(1);(2)に※印が付けれた破線枠のブロックA5a,B3a;A5d,B3dで示すように、ユーザによる演奏操作子13の演奏操作(A4,B2)から、音源・効果回路9内の音源部によりユーザ演奏音データの生成(A5b,B3c)が開始されるまで、或いは、ユーザ演奏音データの生成(A5c,B3b)の後ユーザ演奏音が放音されるまで(A6,B3)の間に、上限がモニター遅延時間Tmや通信遅延時間Tc程度の多少の演奏遅延Tpを入れても良い。このようにすると、他のセッション端末から受信した他端末ユーザの楽器演奏に対応するユーザ演奏音の生成と、自端末ユーザの楽器演奏に対応するユーザ演奏音(モニター音)の生成との時間差を短くすることができる。ただし、演奏操作から発音までの遅延があるため、ユーザによっては違和感を感じる可能性があるので、この演奏遅延Tpの値は、上述のように、大きくしない方が望ましい。
【符号の説明】
【0044】
TM:TMa〜TMd;TMs,TMr セッション端末、
Tc,Tm,Tp 通信遅延[時間]、モニター遅延[時間]及び演奏遅延[時間]、
Bp バック演奏情報、
Up:Upa〜Upd ユーザ演奏情報、
DRs,DRr 送信用及び受信用オーディオ又はMIDIドライバ。

【特許請求の範囲】
【請求項1】
通信ネットワークを介して通信可能に接続された他のセッション端末と共にネットワークセッションシステムを構成するセッション端末であって、
演奏情報を再生するための演奏再生手段と、
他のセッション端末と通信するための通信手段と、
バック演奏情報の再生を指示するバック演奏指示手段と、
バック演奏指示手段により再生が指示されたバック演奏情報を通信手段を通じて他のセッション端末に送信すると共に、当該再生が指示された後、他のセッション端末との間の通信遅延時間に相当するモニター遅延時間だけ経過したときに、演奏再生手段に当該バック演奏情報の再生を開始させるバック演奏制御手段と、
ユーザの演奏に基づくユーザ演奏情報を入力するユーザ演奏入力手段と、
ユーザ演奏入力手段により入力されたユーザ演奏情報を通信手段を通じて他のセッション端末に送信すると共に、当該ユーザ演奏情報及び他のセッション端末から通信手段を通じて受信された他のユーザ演奏情報を演奏再生手段に再生させるユーザ演奏制御手段と
を具備することを特徴とするセッション端末。
【請求項2】
通信ネットワークを介して通信可能に接続された第1セッション端末及び第2セッション端末により構成されるネットワークセッションシステムであって、
第1セッション端末は、
演奏情報を再生するための第1端末演奏再生手段と、
第2セッション端末と通信するための第1端末通信手段と、
バック演奏情報の再生を指示するバック演奏指示手段と、
バック演奏指示手段により再生が指示されたバック演奏情報を第1端末通信手段を通じて第2セッション端末に送信すると共に、当該再生が指示された後、第1及び第2セッション端末間の通信遅延時間に相当するモニター遅延時間だけ経過したときに、第1端末演奏再生手段に当該バック演奏情報の再生を開始させる第1端末バック演奏制御手段と、
第1セッション端末ユーザの演奏に基づく第1端末ユーザ演奏情報を入力する第1端末ユーザ演奏入力手段と、
第1端末ユーザ演奏入力手段により入力された第1端末ユーザ演奏情報を第1端末通信手段を通じて第2セッション端末に送信すると共に、当該第1端末ユーザ演奏情報及び第2セッション端末から通信手段を通じて受信された第2端末ユーザ演奏情報を第1端末演奏再生手段に再生させる第1端末ユーザ演奏制御手段と
を具備し、
第2セッション端末は、
演奏情報を再生するための第2端末演奏再生手段と、
第1セッション端末と通信するための第2端末通信手段と、
第1セッション端末から第2端末通信手段を通じて受信されるバック演奏情報を第2端末演奏再生手段に再生させるバック演奏手段と、
第2セッション端末ユーザの演奏に基づく第2端末ユーザ演奏情報を入力する第2端末ユーザ演奏入力手段と、
第2端末ユーザ演奏入力手段により入力された第2端末ユーザ演奏情報を第2端末通信手段を通じて第1セッション端末に送信すると共に、当該第2端末ユーザ演奏情報及び第1セッション端末から第2端末通信手段を通じて受信された第1端末ユーザ演奏情報を第2端末楽音演奏再生手段に再生させる第2端末ユーザ演奏制御手段と
を具備する
ことを特徴とするネットワークセッションシステム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate