説明

通信ネットワーク環境におけるアナウンスメディアの処理

ユーザメディアとアナウンスメディアとの切替を効果的に処理するために、基本ステップ(S1)は、まず、ユーザメディアのコンフィグレーションを判定することである。次に、判定されたユーザメディアコンフィグレーションに基づいて、提示されるアナウンスメディアのコンフィグレーションが判定される(S2)。続いて、アナウンスメディアコンフィグレーションに従って、アナウンスメディアがコンフィグレーションされ(S3)、最後にコンフィグレーションされたアナウンスメディアが意図したユーザに送信される(S4)。このようにして、アナウンスの全体的な外観または音は、ユーザメディアの全体的な外観または音と事実上同一または少なくとも類似し、好ましくは歪がない。これにより、ユーザは、アナウンスをできるだけはっきりと知覚することが可能になる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、一般的には、現代の通信ネットワークにおけるアナウンス技術(announcement technology)に関し、より詳細には、アナウンスメディアの処理と、ユーザメディアとアナウンスメディアとの切替に関係する課題とに関するものである。
【背景技術】
【0002】
アナウンス(告知)は、テレフォニーサービス等の通信サービスにおいて重要な役割を果たす。アナウンスは、通常は、予め録音されたメディア(pre-recorded media)、または機械で生成されたメディア(machine-generated media)である。機械で生成されたメディアは、例えば、テキストを音声に変換する機能(別名、音声合成)またはテキストを画像に変換する機能で生成され得る。アナウンスは、通信ネットワーク内で生成されてもよいし、またリモートユーザの交換台またはコンピュータによって生成されてもよい。
【0003】
通信ネットワークからのアナウンスの使用例には、以下のものを含む。
【0004】
・ユーザが開始しているコマンドを完了できない場合のエラーメッセージ。例えば、発呼者が電話番号を非通知にしていて、電話番号を見ることなしには電話に応答しないと着呼者が設定している場合、システムは、発呼者にエラーメッセージを提示しなければならない。
【0005】
・ユーザがセッションを保留する場合、システムは、通話相手に保留メッセージまたは保留音を再生することができる。
【0006】
・会議電話において、新規のユーザがセッションに参加する場合またはユーザがセッションから退出する場合に、会議サーバが、例えば、「John Smith(ジョン スミス)が会議に参加しました」および「John Smithが会議から退出しました」等のアナウンスを提示することができる。
【0007】
・ユーザが料金を前払いしていて、その前払い金を使い切りそうになっている。オペレータは、残金が少ないので使用を制限してもよく、セッション開始時またはセッション中(非常に長いセッションのことがある)にそれについてアナウンスしたい。
【0008】
・インターネットでますます使用されている方法は、ウェブページ上にピンコード(またはパスワード)を有する画像を提示することである。ピンコードの画像はかなり歪んでいるので、自動テキスト認識システムはピンコードを検出できないはずであるが、賢明な人間にとっては、それでも文字と数字を読むことができるはずである。これは、(安全でない)電子メールで、対応するピンコードを送信する代わりに使用される。
【0009】
着呼者側のアナウンスの使用例には、以下のものがある。
【0010】
・ユーザが旅行会社に電話してチケットを予約する。以下のシナリオが想定される。
【0011】
1.ユーザが旅行会社のスタッフと相談して、最善の旅行プランを見つける。このステップでは、話し合いは2人の人間の間で行われる。
【0012】
2.旅行について決定後、ユーザは、自身のクレジットカード番号をキーインするように依頼される。これは、人間と機械の通信であり、ここで、ユーザは、事前録音メッセージまたは機械生成メッセージを聞いて、ダイヤルボタン(0〜9)を押して自身のクレジットカード番号を入力する。このプロセスでは、以下の文が想定される。「あなたのクレジットカード番号をキーインしてください」、「番号は、1234 5678 9012 3456ですね」、「これで正しい場合は1を押してください、正しくない場合は2を押してください」、「あなたのクレジットカードの有効期限を入力してください」、「有効期限は、2007年1月1日ですね」。これらの文は、アナウンスサーバによって生成されるであろう。
【0013】
3.クレジットカード番号および他の必要なデータをキーイン後、更なる旅行のオプションを決定するために、旅行会社のスタッフとのセッションは続く。
【0014】
4.これらのステップは、複数回繰り返される場合がある。
【0015】
・ユーザは、新しいコンピュータの購入後後のいくつかの問題を解決するために、サービスデスクまたは顧客電話窓口に電話する。サービスデスクは、スクリーニングプロセスを使用して問題を分類してから、電話を技術者に連絡する。このスクリーニングプロセスでは、ユーザは次のような質問に回答しなければならない。「お客様の問題がソフトウェア関連の場合は『1』と#を押してください。ハードウェア関連の場合は『2』を押してください。わからない場合は『3』を押してください」。このスクリーニングプロセス後、セッションは保留され、待機メッセージがユーザに対して再生される。技術者が電話に応答してもよく、また、待機メッセージを任意の時点で中断してもよい。
【0016】
従来、プロンプトおよび音声アナウンス等の情報メッセージの生成は、エンコーディング(encoding:符号化)およびデコーディング(decoding:復号)用の従来のパルス符号変調(PCM)または適応的差分PCM(ADPCM)を使用する、回線交換システムの相対的に単純な時分割多重(TDM)ベースのアナウンスマシンによって実行されている。現代および未来の通信システムでは、アナウンスを処理する条件および要件は劇的に変化するであろうから、そのような通信システムにおいてアナウンスメディアを効果的に処理するためのソリューションを提供する一般的必要性がある。
【発明の概要】
【発明が解決しようとする課題】
【0017】
本発明は、上述および他の先行技術の装置の欠点を解決する。
【0018】
本発明の一般的な目的は、通信ネットワーク環境におけるアナウンスメディアの処理を改良することである。
【0019】
本発明の一目的は、遷移に伴う不快さおよび歪の少なくとも一方を伴うことなく、または少なくとも切替によって引き起こされる歪を削減するように、ユーザメディアとアナウンスメディアとの切替を効果的に処理することである。
【0020】
特に、ユーザができるだけはっきりとアナウンスを知覚できるようにすることが望ましい。
【0021】
特に、具体的な一目的は、ユーザメディアとアナウンスメディアとを切り替える方法およびシステムを改良し提供することである。
【0022】
別の具体的な目的は、通信ネットワーク用のアナウンスサーバを改良し提供することである。
【課題を解決するための手段】
【0023】
上述および他の目的は、添付の特許請求の範囲によって定義される本発明によって達成される。
【0024】
現代の通信ネットワークがもたらす広範囲の様々なメディアコンフィグレーションにより、アナウンスメディアの全体的な音または外観が通常のユーザメディアの音または外観と比べて非常に異なることになることがあるので、それはアナウンスサーバに問題を引き起こすことがあることを、発明者たちは認識している。これは、ユーザにとって非常に不快なことがある。
【0025】
ユーザメディアとアナウンスメディアの切替を処理するために、本発明の基本的な概念は、まず、ユーザメディアのコンフィグレーションを判定し、次いで判定したユーザメディアコンフィグレーションに基づいて、提示されるアナウンスメディアのコンフィグレーションを判定することである。続いて、アナウンスメディアをアナウンスメディアコンフィグレーションに従ってコンフィグレーションし、このコンフィグレーションされたアナウンスメディアを、意図したユーザに送信する。このようにして、アナウンスの全体的な外観または音は、ユーザメディアの全体的な外観または音と事実上同一または少なくとも類似し、好ましくは、歪がなく、ユーザができるだけはっきりとアナウンスを知覚することを可能にするであろう。
【0026】
しかしながら、本発明が、音声やオーディオに限定されず、映像にも適用されてもよいことも理解されるべきである。
【0027】
通常、ユーザメディアは、通話相手のリモートユーザから到来し、アナウンスメディアは、アナウンスサーバまたはプロセッサから到来する。しかしながら、アナウンスサーバは、ネットワークベースのアナウンスサーバとしてネットワーク側に配置されてもよいし、またリモートユーザに関連したユーザ側、例えば、ユーザ機器もしくは構内交換機(PBX)内に配置されてもよい。
【0028】
本発明の好ましい例示的実施形態では、そのユーザメディアコンフィグレーションから適切なユーザメディアコンフィグレーションを選択または他の手段で判定されてもよい、1つ以上の有効なユーザメディアコンフィグレーションを識別するために、当該ユーザ(considered users)間のユーザメディアに関する通信セッションのセットアップがモニタされる。
【0029】
好ましくは、現在使用されているユーザメディアコンフィグレーションを検出するために、ユーザ通信がモニタされ、アナウンスメディアコンフィグレーションを現在のユーザメディアコンフィグレーションに一致(マッチング)させることを可能にする。次いで、アナウンスサーバにそのコンフィグレーションされたアナウンスメディアをセッションに挿入させることによって、コンフィグレーションされたアナウンスメディアは、意図したユーザに転送されることが好ましい。選択的には、アナウンスメディアは、例えば、アナウンスメディア用の新規のセッションを確立することによって、ユーザメディアと並行して送信される。
【0030】
好ましくは、ユーザメディアに対するコーデックおよび/または伝送フォーマットコンフィグレーションが判定され、次いで、アナウンスメディアコンフィグレーションが、アナウンスメディアのコーデックおよび/または伝送フォーマットコンフィグレーションとユーザメディアのコーデックおよび/または伝送フォーマットコンフィグレーションとの一致(マッチング)に基づいて判定される。
【0031】
別の態様では、本発明は、通信ネットワーク用のアナウンスサーバに関する。基本的には、アナウンスサーバは、ネットワークの通信セッションにおけるユーザメディアのコンフィグレーションを示すメディアコンフィグレーション情報を取得するように、かつメディアコンフィグレーション情報に基づいてセッションに挿入されるアナウンスメディアをコンフィグレーションするように構成される。さらに、アナウンスサーバは、コンフィグレーションされたアナウンスメディアをセッションに挿入するように動作可能である。
【0032】
本発明によって提供される他の利点は、本発明の実施形態についての以下の説明を読むと理解されるであろう。
【0033】
本発明の他の目的および利点とともに、本発明は、添付の図面と一緒に以下の説明を参照することにより最もよく理解されるであろう。
【図面の簡単な説明】
【0034】
【図1】例示的システム概観を示す概略図である。
【図2】エンコーダ状態がリセットされるのに対してデコーダ状態がリセットされない場合の歪を示す概略図である。
【図3】デコーダ状態がリセットされるのに対してエンコーダ状態がリセットされない場合の歪を示す概略図である。
【図4】本発明の一例示的実施形態に従うユーザメディアとアナウンスメディアの切替の基本的方法の概略のフロー図である。
【図5】本発明の別の例示的実施形態に従うユーザメディアとアナウンスメディアの切替方法の概略のフロー図である。
【図6】本発明の一例示的実施形態に従うネットワーク側およびユーザ側を含むシステム概観図である。
【図7】本発明の別の例示的実施形態に従う概観図である。
【図8】本発明のまた別の例示的実施形態に従う概観図である。
【図9】取り得る好ましい実施形態に従うアナウンスサーバの概略のブロック図である。
【発明を実施するための形態】
【0035】
図面全体を通して、同一の参照文字は、対応する要素または同様の要素に対して使用される。
【0036】
本発明のより良い理解のためには、簡潔なシステム概観から始めるのが役立つであろう。
【0037】
図1は、例示的なシステムの概観を示す概略図である。この例示的なシステムは、関連基地局20−1、20−2経由で通信中の2人のエンドユーザAおよびBのユーザ機器(UE)10−1、10−2と、ネットワークベースのアナウンスサーバ30とを有する。この場合、リアルタイムプロトコル(RTP)[1]メディアストリーム等のメディアストリームは、メディアリソース機能プロセッサ(MRFP)[2]でもよいアナウンスサーバを常に通過する。この例では、アナウンスサーバは、ユーザAからのRTPストリームをアナウンスに置換する、これは、インバンドアナウンス(in-band announcement:帯域内アナウンス)と呼ばれる。
【0038】
アナウンスを導入する他の方法も可能であり、例えば、アナウンスサーバを通過することなく、メディアがAとBの間で直接送信されるものがある。この場合、アナウンスは、アナウンスサーバからUE(ユーザ機器)BへSIP INVITEで送信されてもよく、UE Bは、アナウンスサーバから受信されるメディアを生成するために、UE Aから受信されるメディアを破棄しなければならない。別の代替方法としては、アナウンスメディアへのリンク(URL)を含むSIP INFOまたはSIP NOTIFYメッセージ等のメッセージを送信することである。一般に、代替方法は、このように、アナウンスメディア用に新規のセッションを確立してまたは確立せずに、ユーザメディアに並行してアナウンスメディアを送信することである。
【0039】
アナウンスサーバは、通信ネットワーク内に設置されてもよい。IPマルチメディアサブシステム(IMS)等の現代のシステムでは、アナウンスサーバは、メディアリソース機能プロセッサ(MRFP)内に通常設置されるであろうが、例えば、会議サーバ等のアプリケーションサーバにも設置できよう。
【0040】
アナウンスサーバを、エンドポイント内もしくはエンドポイント近くに、ユーザ機器内に、コンピュータ内に、または構内交換機(PBX)内に有することも可能である。
【0041】
発明者たちによる入念な分析で、既存のソリューションは、以下に説明する1つ以上の問題に晒されていることが明らかになっている。
【0042】
現在のところ既存の回線交換システムでは、アナウンスが機能しているが、これは、使用されるコーデックが典型的にはPCM[4]またはADPCM[5]であるからうまく機能しているのである。これらのコーデックは、予測を全く使用しない(PCM)、または非常に限られた量の予測しか使用しない(ADPCM)、サンプル単位のコーデックである。これは、デコーダが状態不一致から非常に急激に回復すると、聞き取れる歪を引き起こす可能性が低いことを意味する。
【0043】
さらに、従来のシステムは、コーデックを1つだけ使用する、例えば、PCMまたはADPCMのどちらかを使用するのであって、決して両方を使用しない。システムは、全セッション中に、同一の伝送フォーマットも使用し、例えば、コーデックレート、フレームアグリゲーション(frame aggregation:フレーム集約)、または冗長度を決して状況に応じて変化させない。実際のところ、システムは、すべてのセッションに対して同一の構成を使用する。
【0044】
IPマルチメディアサブシステム(IMS)等の現代および将来のシステムでは、その中でも特にマルチメディアテレフォニ(MMTel)[6]に関しては、状況は完全に異なる。数種類のメディアを送信することが可能である。このメディアは、異なるコーデックでかつ異なるレートで符号化され得る。異なる伝送フォーマットが使用される可能性がある。すなわち、ペイロードフォーマットが、フレームアグリゲーションありでまたはなしで、冗長度ありでまたはなしでも、使用される得る。これらの変形は、ネットワーク輻輳に対するリスクを減らし、輻輳期間中でさえ合理的な品質でセッションを維持できるようにセッションを適応させるために必要である。これは、無線チャネルが大幅に変化するセルラ方式では特に重要である。しかしながら、これらの変形は、アナウンスサーバに対して問題を引き起こす。以前したような1つの方法だけでアナウンスメディアを符号化し、受信者が満足することを望むことはできない。UE AとUE Bとの間のメディアは、通常、広帯域コーデック(AMR−WB)で符号化されているが、アナウンスを狭帯域コーデック(適応マルチレート:AMR)で符号化する場合、メディアは全く異なって聞こえるであろうし、受信ユーザは、アナウンスが通常のメディアとはなぜ大幅に異なって聞こえるのか疑問に感じるであろう。最悪の場合、受信ユーザは、不快になりアナウンスの実際の内容よりメディア品質に関心が行ってしまうかもしれず、これは、ユーザがアナウンスを誤解さえしかねないことを意味する。
【0045】
さらに、現代の予測ベースのコーデックの使用は、アナウンスが通常のメディアを中断する場合に、状態不一致をもたらすことがあり、同様に、ユーザを不快にさせることがある聞き取り可能な歪を生じる可能性がある。予測は、例えば、AMR[7]またはAMR−WB[8]等の現代のコーデックに関しては非常に重要である。フレーム間予測は、ビットレートを減少させるために、すなわち、高圧縮比にするために使用されるが、それでもよい品質を提供する。フレーム間予測では、フレームからフレームへ状態が渡される必要がある。アナウンスが通常のメディアを中断する場合、ユーザからの音声メディアに対するUE Aの1つのコーデックインスタンスと、アナウンスサーバの1つのコーデックインスタンスとの2つの異なるコーデックインスタンスが使用されるので、状態不一致となるであろう。UE Aの状態は、使用される予測に従って進展しているのに対して、アナウンスサーバの状態は、初期設定状態から開始する。状態不一致は、現在のコンテンツに依存して、多かれ少なかれ聞き取れる歪を引き起こし得るる。そのような歪の2つの例が、図2および図3に示されている。両方の場合とも歪は、はっきり聞き取れ、聞き手によって容易に気付かれるが、図2のスパイクの方がはるかに気に障る。
【0046】
図2および3からは、非同期のリセット後、合成音が正常な状態に回復させるためには、約100〜200msかかることを把握することができる。その代わりに、PCM等のステートレス(state-less)コーデックは、状態(ステート)を適切なコンテンツに「作り上げる」必要がないので、直ぐに正常な状態に戻るであろう。
【0047】
従来の回線交換システムは、典型的には、音量レベルの制御も有しており、音量が適切でない場合、ネットワーク内で音量を調節する。マルチメディアテレフォニのようなVoIPシステムは、着想が変換(transcoding:トランスコーディング)および他の種類の変更なしにVoIPパケットをエンドツーエンドで送信するものなので、おそらくそのような機能を持たないであろう。VoIPに関しては、それゆえ、通話相手が大声または小声で話している場合、エンドユーザは音量をかなり多く調整していそうである。アナウンスサーバが音量を確認せずにアナウンスメディアを挿入する場合、小さすぎる音量で提示されたり、とても大きな音量で提示され、聞き手が直ぐに耳から電話機を離さなければならなかったりするので、メッセージ全部が聞き洩らされるかもしれない。
【0048】
これらの問題は、音声に限られていない。同様の問題は、オーディオおよび映像に関しても起こる。これらの問題に関して、これらのメディアタイプに対するコーデックが、典型的には、音声コーデックよりさらに高い圧縮比を有し、また、この圧縮比を達成するために、よい品質状態にさらにもっと依存するので、さらに大きな問題を予想することができる。
【0049】
本発明の実施形態は、これらの問題の1つ以上に関連する。
【0050】
最初に、現代の通信ネットワークの多種多様の可能なメディアコンフィグレーション(configuration:構成)によってもたらされる問題に、主に向けられている実施形態例を説明する。この問題は、アナウンスメディアの全体的な音または外観(appearance:アピアランス)が、通常のユーザメディアの音または外観と比べて非常に異なっていることになることがあるということである。これは、ユーザにとって非常に不快となり得る。
【0051】
図4は、本発明の一例示的実施形態に従う、ユーザメディアとアナウンスメディア間の切替の基本的方法の概略のフロー図である。ユーザメディアとアナウンスメディア間の切替を効果的に処理するために、基本ステップ(S1)は、まず、ユーザメディアのコンフィグレーションを判定する。次に、提示されるアナウンスメディアのコンフィグレーションが、判定されたユーザメディアコンフィグレーションに基づいて判定される(S2)。続いて、アナウンスメディアがアナウンスメディアコンフィグレーションに従ってコンフィグレーションされ(S3)、コンフィグレーションされたアナウンスメディアが意図したユーザに最終的に送信される(S4)。このようにして、アナウンスの全体的な外観または音は、好ましくは、歪みなしに、ユーザメディアの全体的な外観または音と事実上同一または少なくとも類似することになる。これにより、ユーザに、できるだけはっきりとアナウンスを知覚させることが可能になる。例えば、ユーザメディアおよびアナウンスメディアは、音声、オーディオまたは映像であってもよい。
【0052】
好ましくは、本発明の例示的実施形態では、ユーザメディアのコーデックコンフィグレーションが判定され、次いで、アナウンスメディアのコーデックコンフィグレーションがユーザメディアの判定されたコーデックコンフィグレーションに一致させることが好ましい。これは、アナウンスメディアに対して同一または少なくとも類似のコーデックコンフィグレーションが使用されることを意味する。こうすることにより、2つのメディアが意図したユーザに同様に聞こえるまたは同様に見える機会が増加する。例えば、コーデックコンフィグレーションは、コーデックのタイプ、コーデックモード、およびオプションでコーデックモード切替機能も含んでもよい。
【0053】
また、ユーザメディアの伝送フォーマットコンフィグレーションを判定し、アナウンスメディアの伝送フォーマットコンフィグレーションをユーザメディアの伝送フォーマットコンフィグレーションに一致させようとすることも可能である。このようにして、アナウンスメディアは、伝送機能障害によって深刻な影響を受けなさそうである。
【0054】
オプションとして、ユーザメディアのフレームアグリゲーションおよび冗長度フォーマットコンフィグレーションが判定され、アナウンスメディアのフレームアグリゲーションおよび冗長度フォーマットコンフィグレーションを、ユーザメディアのアナウンスメディアのフレームアグリゲーションおよび冗長度フォーマットコンフィグレーションと一致させることが可能になる。
【0055】
図5は、本発明の別の例示的実施形態によるユーザメディアとアナウンスメディアの切替方法の概略のフロー図である。
【0056】
好ましくは、適切なユーザメディアコンフィグレーションを選択または判定することができる、1つ以上の有効なユーザメディアコンフィグレーションを識別するために、該当ユーザのユーザ機器間のユーザメディアに対する通信セッションのセットアップがモニタされる(S11)。続いて、有効なユーザメディアコンフィグレーションの中の現在使用されているメディアコンフィグレーションを検出するために、セッション中のユーザ通信がモニタされる(S12)。次いで、アナウンスメディアコンフィグレーションが現在のユーザメディアコンフィグレーションに一致される(S13)。オプションで、セッション中にアナウンスメディアを挿入する適切なタイミングが、例えば、アナウンスの緊急性を検討することによって判定される(S14)。アナウンスサーバにコンフィグレーションされたアナウンスメディアをセッションに挿入させる(S15)ことによって、コンフィグレーションされたアナウンスメディアは、意図したユーザに最終的に転送される。選択的には、例えば、アナウンスメディア用に新規のセッションを確立することによって、またはアナウンスメディアへのリンクを有する制御メッセージを単に送信することによって、アナウンスメディアは、ユーザメディアと並行して送信される。
【0057】
この特定のシナリオでは、セッションの基本定義は、例えば、セッション開始プロトコル(SIP)のセッション記述プロトコル(SDP)を使用することによって、セッションセットアップ中に普通はネゴシエートされる。例えば、いくつかの取り得る有効なメディアコンフィグレーションは、SDPシグナリングで定義され、かつそれぞれの識別子に関連付けられてもよい。特定の例示的実施形態では、識別子として、ペイロードタイプ番号を利用することによって、メディアコンフィグレーションを識別するために、RTPパケットのペイロードタイプフィールドが使用されてもよい。この番号は、有効なメディアコンフィグレーションに関係付けることができる。ペイロードタイプ番号とメディアコンフィグレーションの関連付けは、セッションセットアップ中(例えば、SIP INVITE)およびセッション再コンフィグレーション時(SIP UPDATE、またはいわゆるSIP RE−INVITE)の少なくとも一方の時点で行われるのが好ましい。その後の通信中に、RTPパケット等のメディアパケットの送信時、ペイロードタイプ番号を抽出するために、ペイロードタイプフィールドがモニタされてもよく、次いで、ペイロードタイプ番号は、現在使用されているメディアコンフィグレーションに関連付けられ得る。
【0058】
一例として、メディアコンフィグレーションは、以下の情報項目の1つまたはいくつかによって定義され得る。
【0059】
・コーデック(群)
例えば、AMR、GSM−EFR(GSM Enhanced Full Rate:GSM拡張フルレート)、EVRC(Enhanced Variable Rate Codec」拡張可変レートコーデック)等。
【0060】
・コーデックモード(群)
適用可能な場合
例えば、AMRに対して、8つのコーデックモードのすべてが許容されてもよいし、またコーデックモードのサブセットが許容されてもよい。
【0061】
・コーデックモード切替機能
適用可能な場合
例えば、AMRに対して、コーデックモード切替が隣接したコーデックモード間だけで許容されると指定されてもよい、すなわち、一例として、ビットレート12.2、7.4、5.9および4.75kbpsで規定されるコーデックモード等のAMRコーデックモードのサブセットが許容され、かつビットレート12.2のコーデックモードからビットレート4.75のコーデックモードへの切替が望まれる場合、その切替は、コーデックモード7.4および5.9を通過しなければならない。
【0062】
・ペイロードフォーマット
適用可能な場合
例えば、AMRに対しては、帯域幅高効率およびオクテット配列(octet-aligned)の2つの基本的なオプションがある。
【0063】
・パケット当たり推奨フレーム数
これは一般に厳格な要件ではない。
【0064】
・パケット当たり最大データ量
これは一般に厳格な要件である。
【0065】
それゆえ、セッションセットアップ時、様々な取り得るメディアコンフィグレーションの範囲が通常は指定される。セッションセットアップ中にネゴシエートされるメディアコンフィグレーションの中の任意のメディアコンフィグレーションを単に選択することによって、適正ではあるが、通常は次善のソリューションを取得することが可能である。いくつかの有効なメディアコンフィグレーションが許容される場合、より良いソリューションは、種々のコンフィグレーションが好ましくはどの順番で使用されるべきかを示す優先順を提供することであってもよい。例えば、例示的なコンフィグレーションA、BおよびCが許容される場合、SIP INVITEの中で好ましい順番はB、C、Aであると指定することができる。
【0066】
しかしながら、ユーザ通信中にどのコンフィグレーション(群)が現在使用されているかをモニタすることによって、アナウンスメディアに対するメディアコンフィグレーションの選択を最適化することが可能である。
【0067】
一例として、ユーザクライアントが状態の悪いチャネルを感知し、例えば、可能な最低のビットレートを使用し、かつ同一のフレームを数回送信して冗長性を加えることによってして、ロバスト性(robustness)を最大に適用させている場合、同一のまたは同様のコンフィグレーションを使用してアナウンスが処理される場合が最善となるであろう。そうでなければ、音声コーディング(符号化)に対するデフォルトコンフィグレーションは、可能な最高のビットレートで通常開始され、続いて、よりロバスト性になる方向に適応を実行することになるであろう。しかしながら、この適応は、通常は時間がかかり、ユーザメディアに対して使用されたものに対応する同一のロバスト性のレベルに適応が到達する前に、アナウンスが既に完了しているというリスクがある。本発明を使用して、現在使用されているメディアコンフィグレーションをモニタすることによって、アナウンスメディアコンフィグレーションをユーザメディアコンフィグレーションに直ぐに一致させることができる。
【0068】
アナウンスサーバが何らかの理由でセッションセットアップ中に示される有効なメディアコンフィグレーションの一部または全部をサポートしない場合、どのメディアコンフィグレーションを使用すべきかについてのローカルでの決定は、アナウンスサーバによって許容されているコンフィグレーション(のサブセット)に基づき、アナウンスサーバで行われてもよい。
【0069】
一般に、ユーザメディアおよびアナウンスメディアは、第1のユーザのユーザ機器等の第1のネットワーク要素を対象にしている。ユーザメディアは、通常、リモートユーザのユーザ機器等の第2のネットワーク要素から到来する。アナウンスメディアは、通常、アナウンスサーバ等の第3のネットワーク要素から到来する。しかしながら、アナウンスサーバは、ネットワークベースのアナウンスサーバとしてネットワーク側に配置されてもよいし、リモートユーザに関連するユーザ側に配置されてもよいことに留意するべきである。後者の場合、第2のネットワーク要素および第3のネットワーク要素は同一であっても良いし、または少なくとも互いに近い関係にあってもよい。本発明の種々の例示的な実施形態について説明する。
【0070】
図6は、本発明の一例示的実施形態に従うネットワーク側およびユーザ側を含むシステム概観図である。基本的に、2人のユーザAおよびBのユーザ機器(UE)10−1、10−2が、通信ネットワークを介して通信している。この特定の例では、通信はアナウンスサーバ30を通過し、このアナウンスサーバ30は、適切にコンフィグレーションされたアナウンスをユーザ間の通信に挿入する。アナウンスサーバ30は、ユーザメディアコンフィグレーションおよびアナウンスメディアコンフィグレーションの判定のためのモジュール32と、1つ以上の事前録音アナウンスまたは機械生成アナウンスを保持するデータベース34と、アナウンスメディアのコンフィグレーション用のモジュール36と、ユーザメディアストリームをコンフィグレーションされたアナウンスメディアで置換するための制御可能切替機構38とを備える。
【0071】
好ましくは、アナウンスサーバ30は、ユーザ間のセッションセットアップをモニタし、1つ以上の有効なユーザメディアコンフィグレーションを識別するようにコンフィグレーションされる。有効なユーザメディアコンフィグレーションについての情報は、通常、アナウンスサーバに関連するテーブル(不図示)内に関連識別子とともに記憶される。次いで、アナウンスサーバ30は、いくつかの異なる方法でこれらのメディアコンフィグレーションの中から選択してもよい。本発明の好ましい例示的実施形態では、ユーザメディアパケットが、現在使用されているユーザメディアコンフィグレーションを識別するために、セッション中モニタされる。好ましくは、これは、1つ以上のメディアパケットのパケットヘッダからメディアコンフィグレーション識別子を抽出し、この識別子を有効なユーザメディアコンフィグレーションのテーブルに記憶されている特定のユーザメディアコンフィグレーションにマッピングすることによって実行される。
【0072】
指定のユーザメディアコンフィグレーションについての情報に基づいて、次いで、アナウンスメディアの適切なコンフィグレーションを判定することが可能である。一旦、アナウンスメディアコンフィグレーションが判定されると、データベース34から取得されるまたは他の手段で生成される、選択されたアナウンスが、それに応じてコンフィグレーションモジュール36でコンフィグレーションされてもよい。これは、典型的には、判定されたコンフィグレーションに従うアナウンスメディアのエンコーディング(encoding)およびフォーマッティング(formatting)の少なくとも一方を含んでいる。次いで、アナウンスメディアは、通信セッションに挿入されてもよい。詳細は後述するが、状況に応じて、アナウンスを挿入するための適切なタイミングを判定する必要があってもよいしなくてもよい。
【0073】
ユーザ間の通信セッション中に引き続き制御情報をモニタすることも有利なことがある。特に、コーデックモードもしくは冗長モードの変更等のユーザメディアコンフィグレーションに起こり得るいかなる変化も識別するために、リンク適応に対するフィードバック情報をモニタすることは有利なことがあり、これは、ユーザメディアコンフィグレーションについての最新情報に従ってアナウンスメディアのコンフィグレーションの適応を可能にする。
【0074】
モニタリングは、アナウンスサーバ30またはアナウンスサーバに関連するオプション部40で実行されてもよい。
【0075】
図7は、本発明の別の例示的実施形態による概観図である。この例では、ユーザメディアは、ネットワークを通してユーザの10−1、10−2間で送信されるが、アナウンスサーバ30を直接通過しない。好ましくは、外部モニタ部40がセッションセットアップおよびオプションでユーザ通信および制御フィードバックの少なくとも一方もモニタして、判定モジュール32にユーザメディアコンフィグレーションおよびアナウンスメディアコンフィグレーションを判定させる。次いで、判定されたアナウンスメディアコンフィグレーションに従って、コンフィグレーションモジュール36で、アナウンスデータベース34から取得されるまたは他の手段で生成されるアナウンスがコンフィグレーションされる。次いで、コンフィグレーションされたアナウンスは、例えば、アナウンスメディア用の新規のセッションを確立するために、SIP INVITE等を使用することによって、出力モジュール38から意図したユーザへ送信されてもよい。次いで、意図したユーザ、例えば、ユーザBは、そのユーザ機器によって複数のセッションがサポートされない限り、アナウンスメディアを生成するためにユーザAからのユーザメディアを通常破棄しなければならない。
【0076】
図8は、本発明のまた別の例示的実施形態による概観図である。この例では、アナウンスサーバは、ユーザ側に存在する。ユーザ間通信に対する通常の機器に加えて、ユーザAのユーザ機器(UE)システム10−1全体では、アナウンスサーバ(AS)またはアナウンスメディアを提供できる同等のアナウンスデバイスも備える。ユーザ機器システム全体では、メディアコンフィグレーション部(MC)をさらに備える。ユーザメディアのコンフィグレーションについての情報に基づいて、次いで、MC部は、適切なアナウンスメディアコンフィグレーションを判定し、それに応じて通話相手のユーザB 10−2に提示するアナウンスをコンフィグレーションする。ユーザシステム全体では、ユーザメディアからアナウンスメディアに切替、次いで切り戻ししてもよい。
【0077】
また、別の代替実施形態では、アナウンスサーバは、エンドポイントに接続した構内交換機(PBX)に実装される。
【0078】
実際のところ、当該ネットワークシステムに1つを超えるアナウンスサーバがあってもよく、本発明は、第1のアナウンスサーバからのアナウンスメディアと第2のアナウンスサーバからのアナウンスメディアとの間の切替も、ユーザメディアとアナウンスメディアとの切替に対する上述の方法と同一のまたは同様の方法で処理することができる。例えば、UEからのユーザメディアは、PBXのアナウンスサーバからのアナウンスメディアで置換されてもよく、PBXのアナウンスサーバからのアナウンスメディアは、ネットワークベースのアナウンスサーバからのアナウンスメディアで置換されてもよい。
【0079】
以下では、通話相手の(人間の)ユーザからのメディアとアナウンスサーバからのメディアとの間の切替をどのように管理することができるかについての、さらなる例示的実施形態について説明する。
【0080】
例えば、ユーザは、メディア伝送用にIP、UDPおよびRTPを使用し、セッション制御用にSIPを使用するマルチメディアテレフォニーにかかわっていてもよい。アナウンスサーバは、電気通信ネットワークに配置されても、また遠隔(リモート)の通話相手(の位置)に配置されてもよい。
【0081】
全体的な目標は、2つのメディアソース間およびメディアタイプ間の切替が気に障らないようにすることを保証することである。好ましくは、これは、アナウンスメディアが、UE AとUE Bとの間のメディアと同様のコーデックで、同様のビットレートでエンコードされるべきであり、また、同様の伝送フォーマットを使用して伝送されるべきであることを意味する。これは、切替が歪を全く作らないかまたは少なくともできるだけ少ない歪にするべきであることも意味する。これは、以下の例示的方法で行われてもよい。
【0082】
アナウンスサーバは、
1.セッションセットアップをモニタし、セッションでどのコーデックを使用してもよいかを判定する。これは、通常は、セッション中の静的情報であるが、任意のセッションパラメータがセッション中に再ネゴシエートされる場合、変更されてもよい。
【0083】
2.現在使用されているコーデックおよび伝送フォーマットを判定するために、メディアパケットおよび品質フィードバックの少なくとも一方をモニタする。これは、通常かなり頻繁に更新される必要のある一時的情報であり、おそらく一つ一つのパケットごとではないが、少なくとも定期的に更新される必要がある。これらの更新の頻度は、システム負荷に依存してもよい。高システム負荷およびチャネル状態の変化の少なくとも一方に対しては、ユーザ間のメディアをかなり頻繁に適応する必要があることを予想してもよい。しかしながら、低システム負荷に対しては、適応はかなり稀なはずである。
【0084】
3.アナウンスメディアに対する適切な符号化および伝送フォーマットを判定する。
【0085】
4.適切な遷移をどのようにして生成するかを判定する。
【0086】
a.アナウンスに、フェードインおよびフェードアウトを使用すべきかどうか。
【0087】
b.アイドル期間(無音、空白画像)を加えるべきかどうか。
【0088】
c.デコーダをリセット(コーデックホーミング(codec homing)、CRCを確実に機能しなくする等)させる必要があるかどうか。
【0089】
5.アナウンスを挿入すべき適切なタイミングを判定する。このタイミングは、通常、アナウンスの緊急度に依存する。
【0090】
6.アナウンスを挿入し、UE Aからのメディアを破棄する。音量は、UE Aからのメディアの音量と合わせるために調整される必要があってもよい。
【0091】
7.アナウンスの完了後、UE Aからのメディアへの適切な遷移をどのようにして生成するかについても判定する。
【0092】
これらのステップのすべてが正確にこの順序で行われる必要はないことに留意されたい。場合によっては、これらのステップのいくつかをスキップすることも可能な場合がある。
【0093】
本発明のより良い理解のために、あり得る好ましい実施形態に従うアナウンスサーバについて、これより図9を参照してより詳細に説明する。
【0094】
この特定の例では、様々なブロックの機能は、以下のようにまとめることができる。
【0095】
・UE AとUE Bとの間のセッションセットアップは、SIPで行われるのが好ましい。これは、セッションでどのメディアを使用できるか、各メディアをどのようにエンコードするか、およびどの伝送フォーマットを使用すべきかを判定する。明らかにする例のいくつかは、
−メディアは、音声および/または映像および/またはテキストかどうか。
【0096】
−各メディアに対してどのコーデックを使用すべきか。1つのメディアに対していくつかのコーデックが許容されてもよい。セッションセットアップは、例えば、AMRとAMR−WBの両方とも、セッションでの音声に許容されると結論付けても良い。コーデックは、いくつかのコーデックモードも含んでいてもよい。例えば、AMRは8つのコーデックモードを定義している。各コーデックモードは、それ自体のビットレート(12.2、10.2、7.95、7.4、6.7、5.9、5.15および4.75kbps)を有する。一部の映像コーデックは、代わりに映像がどのようにエンコードされるべきかを判定する「プロファイル」および「レベル」を定義している。
【0097】
−どのペイロードフォーマットを使用すべきか。各コーデックは、それ自体のペイロードフォーマットを有する。一部のペイロードフォーマットは、ペイロードフォーマットのいくつかの変形を定義している。例えば、AMRおよびAMR−WBに対しては、ペイロードフォーマットは、帯域幅高効率フォーマットとオクテット配列フォーマットの両方を定義している。
【0098】
−エンコーダがネゴシエートされたどのモードにもいつの時点でも自由に切替できる場合、コーデックモード切替がどのように行われてもよいか。例えば、UTRANおよびGERANにおけるAMRに対する、回線交換サービスとの相互作用のシナリオに関しては、そのようなコーデックモードの切替は、UTRANおよびGERAN CSの少なくとも一方のネットワークに存在する制約に合うように制限される必要がある場合もある。
【0099】
−このように、メディアは、通常、いくつかの異なる方法でコンフィグレーションされてもよい。セッションに許容される各コンフィグレーションに対して、1つのRTPペイロードタイプ番号が定義される。各メディアに対していくつかのコンフィグレーションを予想してもよいことに気付かれたい。
【0100】
・メディア入力は、UE Aからのメディア(音声、オーディオ、映像、テキスト等)である。選択的には、メディアは、上述のように別のアナウンスサーバからのメディアであることができよう。このメディアは、アナウンスによって中断されることになる。RTPは、通常、メディアを伝送するために使用される。
【0101】
・メディア出力は、UE Bに送信されるメディアである。
【0102】
・UE Bは、UE Aに品質フィードバックまたは適応要求を送信する。品質フィードバックは、典型的には、RTCPで送信され、たいていは数的指標(パケット損失率、ジッタ等)の形態である。適応要求の例には、コーデックモード要求、フレームアグリゲーション要求、冗長性要求、および映像フレームのイントラリフレッシュがある。フィードバックは、伝送機能障害のメディアへの影響を削減するために、ビットレート、パケットレートおよび冗長度を適応させるように送信者(UE A)によって使用される。
【0103】
−適応をトリガする伝送の制約がUE Aとアナウンスサーバとの間にあるかどうか、またはそれがアナウンスサーバとUE Bとの間にあるかどうかを知らないことに気付かれたい。しかし、アナウンスがサーバとUE Bとの間の伝送機能障害によってひどく損なわれるリスクを最小にするために、アナウンスがUE Aからのメディアと同一の方法でエンコードされ、かつフォーマットされることは有益である。
【0104】
・セッションおよびメディア分析部は、セッションセットアップおよび/またはメディアおよび/またはメディアフィードバックを分析し、入力メディアの特性および現在使用されている伝送フォーマットを検出する。検出される特性の例には、以下のものがある。
【0105】
−メディアタイプ(群)
−コーデック(群)、コーデックレート(群)もしくはコーデックモード(群)、フレームアグリゲーション、冗長度等
−ペイロードフォーマット(群)
−メディアの音のレベル、すなわち、音量。これは、おそらくメディアのデコーディングを必要とする。休みなくデコーダを実行することを回避するために、この分析は、少ない頻度で行われるべきであり、セッション中に、1回だけかまたは2、3回程度行われるのが好ましい。
【0106】
−メディアがアイドル状態、例えば、無音、背景雑音、空白画像等であるかどうか。これを検出する1つの方法は、SID UPDATEフレームが現在送信されているかどうかを検証することであり、これには、RTPパケットを構文解析する必要がある(または少なくともサイズを点検する必要がある)が、メディアのデコーディングを必要としない。
【0107】
−メディアがアクティブ状態、例えば、話中の音声、動画等であるかどうか。その場合は、
・メディアが構築されているかどうか、または、例えば、音声開始直後等の開始されたばかりかどうか。
【0108】
・メディアがフェードアウトしていくかどうか、これは文および語の終わりで起こる。
【0109】
−状況次第では、この分析のすべての部分が連続的に実行される必要があるわけではない、または全く必要がないことに留意されたい。一部分は、セッションセットアップおよびセッションが再ネゴシエートされる場合だけに適用されるのに対して、他の部分はセッション中に(頻度に程度の差はあるが)モニタされるのが好ましい。この分析の一部分は、RTPパケットのデコーディングを必要としてもよい。
【0110】
・メディアデータベースは、実際のアナウンスメディア(音声、オーディオ、映像、画像等)を収容する。
【0111】
・メディアエンコーダおよびモディファイア(modifier:モディファイア)は、UE Aからのメディアと同様にメディアをエンコードおよびフォーマットの少なくと一方を行なう能力を有し、例えば、
−様々なコーデック(AMR、AMR−WB、H.263[9]、H.264[10]等)を使用してもよい。
【0112】
−音響帯域幅を変更してもよい(狭帯域フィルタ(filter to narrowband)、広帯域フィルタ(filter to wideband)、帯域幅拡張、スクリーンサイズ、フェードインおよびフェードアウトの適用等)。
【0113】
−アイドル期間(無音、空白画像)が開始および終了の少なくとも一方の時点に加えられるべきかどうか)。
【0114】
−デコーダをリセットさせるために、アナウンスの開始と終了にコーデックホーミング情報も追加してもよい。
【0115】
−ボリュームレベルを調整する。
【0116】
−様々なペイロードフォーマットを使用する。
【0117】
−UE Aによって使用される場合、フレームアグリゲーションおよび冗長度を適用する。
【0118】
・アナウンスコマンドは、アナウンスサーバに以下の情報を通知する。
【0119】
−どのアナウンスを使用すべきか。
【0120】
−アナウンスの緊急性、すなわち、アナウンスをユーザに直ちに提示することがどのくらい重要であるか、またはアナウンスが少しの間遅延してもよいかどうか。
【0121】
・可能なメディアの変更方法のリストは、メディア分析部によって判定された、各状態に対してどのメディア変更方法が適しているかの記述である。様々な状態に対して適切な様々な動作の例について、以下に説明する。
【0122】
・コントローラは、アナウンスコマンド、およびUE AとUE Bとの間のセッションでメディアが現在どのようにフォーマットされているかについての情報を受信する。
【0123】
−コントローラは、メディアを送信する前に何らかの方法でそれを変更するべきである場合、メディアをどのようにエンコードすべききか、またエンコードされたメディアがRTPパケットにどのようにフォーマットされるべきかを判定する。この情報は、メディアエンコーダおよびモディファイアに送信される。
【0124】
−コントローラは、UE Aからのメディアがいつ中断されるか、およびアナウンスメディアがいつ挿入されるかも判定する。
【0125】
・緊急性が高い場合、直ちにまたはできるだけ短い遅延で、UE Aからのメディアを中断するべきである。
【0126】
・緊急性が低い場合、UE Aからのメディアにアイドル期間を検出するまで待機するべきである。
【0127】
アナウンスコマンドは、アナウンスもトリガする。このトリガは、背景技術セクションで例示されるように、いくつかの異なる場所から発生してもよい。追加の例としては、緊急呼が待機していることを通話者の一人に通知するために通話を中断することを要望する場合がある電話交換手、または「円滑な中断」を行うことを要望する場合があるネットワークオペレータを含んでいる。例えば、通話者の一人がサービス圏外に移動する場合、オペレータは、単にサービスを中断する代わりに、「通話相手がサービス圏外に移動しました」という種類のアナウンスを挿入したいと要望してもよい。
【0128】
例示的メディア符号化および変更方法
エンコーディングおよび伝送フォーマット
コントローラは、エンコーディングおよび伝送フォーマットを、UE AとUE Bとの間で送信されている現在のメディアのエンコーディングおよび伝送フォーマットに一致させるべきである。
【0129】
・コントローラは、セッションで現在使用されているコーデック及びコーデックモード/レートと同一のコーデックおよびコーデックモード/レートを選択するべきである。
【0130】
−アナウンスメディアがより広い音響帯域幅を有する場合、選択されたコーデックに一致させるために帯域通過フィルタを通するべきである。
【0131】
−アナウンスメディアがより狭い音響帯域幅を有する場合、帯域幅拡張が適用されるべきである。
【0132】
−正確に同一のコーデックまたはコーデックモード/レートを選択できない場合、類似の特性(音響帯域幅、ビットレート、フレームレート、エンコーディング品質等)を有するコーデックを選択するべきである。
【0133】
・コントローラは、セッションで現在使用されているフレームアグリゲーション(パケット当たりフレーム数)および冗長フォーマット(数RTPパケットごとにフレームの繰り返し)と同一のフレームアグリゲーションおよび冗長フォーマットを選択するべきである。
【0134】
・コントローラは、セッションで現在使用されている伝送フォーマット(RTPペイロードタイプ、ペイロードフォーマット、ペイロードフォーマットバージョン)と同一の伝送フォーマットを選択するべきである。
【0135】
適切なエンコーディングフォーマットの選択は、2つのメディアが事実上同一のように聞こえる機会を増加する。
【0136】
適切な伝送フォーマットの選択は、アナウンスメディアが伝送機能障害によって深刻な影響を受けない機会を増加する。
【0137】
切替時の円滑な遷移
アナウンスメッセージがあまり重要でない場合で、かつアナウンスサーバが音声内にアイドル期間を検出するまでメッセージを保持している場合、異なる情報源からのメディアの途中で切り替わる場合に、特別なスムージングが必要とされるべきでない。
【0138】
アナウンスメッセージが非常に重要である場合、アナウンスサーバは、UE Aからのメディアがアクティブな場合でさえ通常は中断することになるであろう。この場合、アナウンスサーバは、以下をするべきである。
【0139】
・UE Aからのメディアにフェードアウトを適用する(これは常に可能ではなくてもよい)。
【0140】
・アナウンスメディアをフォーマットし、これが、デコーダを段階的にリセットさせるように、デコーダ状態または数フレームに対するECUの動作のリセットを、例えば、以下によりトリガするようにする。
【0141】
−AMRに対しては、これは、アナウンスメディアが開始する前に、コーデックホーミングフレームを挿入することによって行うことができる。他のコーデックは、同様の特性を持たない場合がある。
【0142】
−CRCまたはチェックサム検証を確実に失敗させる。すべてのペイロードフォーマットが、そのような情報を含むわけではない。このソリューションは、信号を十分に弱めることを確実にするために、いくつかのフレームに対して繰り返される必要がある。
【0143】
−不良フレームインジケータ(BFI)ビットを設定し、これで受信機でECUの動作をトリガさせる。すべてのペイロードフォーマットがそのような情報を含むわけではない。このソリューションは、信号を十分に弱めることを確実にするために、いくつかのフレームに対して繰り返される必要がある。
【0144】
−ダミーフレームまたはアイドルフレーム(NO_DATA、無音、空白画像)を挿入する。NO_DATAは、すべてのコーデックに対して定義されているわけではない。アナウンスサーバは、これを実現するために無音フレームを符号化しなければならない。このソリューションは、信号を十分に弱めることを確実にするために、いくつかのフレームに対して繰り返される必要がある。
【0145】
−これらの方法の存在はコーデックに依存するので、コントローラは、どの動作を現在使用されているコーデックに適用するか決定する必要がある。
【0146】
・UE Aからのメディアの大きさと同程度になるように、アナウンスメディアの大きさを調整する。
【0147】
・アナウンスメディアに対してフェードインを適用する。
【0148】
・アナウンスメディアの送信が完了する場合で、かつUE Aからのメディアに切り戻す場合に、同様の動作が行われるべきである。
【0149】
スムージングは、アナウンスメディアの開始もしくは終了のどちらかまたは両方で必要とされてもよいし、また全く必要とされなくてもよいことに留意されたい。
【0150】
既に説明したように、本発明は、電気通信ネットワークで挿入されるアナウンスだけに限定されない。同様のアナウンスは、ほとんどの商用サービスデスクにも存在する(「切符の注文を続ける場合は1を押してください。日時の変更は2を押してください。販売スタッフと話す場合は3を押してください」)。この場合、アナウンスはリモート「ユーザ」から到来しており、また、リモート「ユーザ」は、事前録音メッセージと人間の話し手を切り替えてもよい。
【0151】
メディア間の切替による歪は、完全に取り除かれるまたは少なくとも減少されるであろう。アナウンスメディアのフォーマットは、会話で使用されるメディアのフォーマットに一致されることが好ましい。これは、UE Aからのメディアとアナウンスメディアとの間でのより心地良い遷移を提供する。
【0152】
受信側のUEで、MIPSとメモリの両方に関して複雑さの面で利点もあるが、これは、並行して実行するいくつかのアクティブコーデックインスタンスを有する必要がないからである。
【0153】
本発明は、RTPメディアストリームに限定されないし、伝送プロトコルとしてのUDPの使用にも限定されないし、また、セッションセットアップに対するSIPの使用にも限定されないことも理解されるべきである。
【0154】
上述の実施形態は単に例として与えられており、本発明がそれらに限定されないことは理解されるべきである。本明細書で開示され特許請求の範囲で定義されている基礎をなす基本的な原理を維持する、さらなる修正、変更および改良は、本発明の範囲内にある。
【0155】
略語
ADPCM 適応的差分PCM(Adaptive Differential PCM)
AMR 適応マルチレート(Adaptive Multi-Rate)
AMR−WB AMR広帯域(AMR-WideBand)
BFI 不良フレームインジケータ(Bad Frame Indicator)
CRC 巡回冗長コード(Cyclic Redundancy Code)
CS 回線交換(Circuit Switched)
ECU エラー隠蔽部(Error Concealment Unit)
EVRC 拡張可変レートコーデック(Enhanced Variable Rate Codec)
GERAN GSM/EDGE無線アクセスネットワーク(GSM Edge Radio Access Network)
GSM 移動通信用グローバルシステム(Global System for Mobile communications)
GSM−EFR GSM拡張フルレート(GSM Enhanced Full Rate)
IMS IPマルチメディアサブシステム(IP Multimedia Subsystem)
IP インターネットプロトコル(Internet Protocol)
MIPS 100万命令/秒(Million Instructions Per Second)
MMTel マルチメディアテレフォニー(Multi Media Telephony)
MRFP メディアリソース機能プロセッサ(Media Resource Function Processor)
PCM パルス符号変調(Pulse Code Modulation)
PBX 構内交換機(Private Branch eXchange)
PS パケット交換(Packet Switched)
RTCP リアルタイム制御プロトコル(Real-Time Control Protocol)
RTP リアルタイムプロトコル(Real-Time Protocol)
SDP セッション記述プロトコル(Session Description Protocol)
SIP セッション開始プロトコル(Session Initiation Protocol)
TDM 時分割多重(Time Division Multiplexing)
UDP ユーザデータグラムプロトコル(User Datagram Protocol)
UMTS ユニバーサル移動通信システム(Universal Mobile Telecommunication System)
UTRAN UMTS地上無線アクセスネットワーク(UMTS Terrestrial Radio Access Network)
UE ユーザ機器(User Equipment)
VoIP ボイスオーバIP(Voice over IP)
参考文献
[1] RFC 3550「RTP:リアルタイムアプリケーション用伝送プロトコル(RTP:A Transport Protocol for Real-Time Applications)」、H.Schulzrinne、S.Casner、R.Frederick、V.Jacobson著
[2] 3GPP TS 23.228「IPマルチメディアサブシステム(IMS)ステージ2(IP Multimedia Subsystem(IMS), Stage 2)」
[3] RFC 3261「SIP:セッション開始プロトコル(SIP:Session Initiation Protocol)」、RFC 3261、2002年6月、Rosenberg,J、Schulzrinne,H.、Camarillo,G.、Johnston,A.、Peterson,J.、Sparks,R.、Handley,M.、E.Schooler著
[4] ITU−T勧告G.711「音声周波数のパルス符号変調(PCM)方式(Pulse Code Modulation (PCM) of Voice Frequencies)」
[5] ITU−T勧告G.726「40、32、24、16キロビット/秒適応的差分パルス符号変調(ADPCM)方式(40,32,24,16 kbit/s Adaptive Differential Pulse Code Modulation (ADPCM)」
[6] 3GPP TS 26.114「IPマルチメディアサブシステム(IMS):マルチメディアテレフォニ:メディア処理および相互作用(IP Multimedia Subsystem(IMS); Multimedia Telephony; Media handling and interaction)」
[7] 3GPP TS 26.071「音声コーデックの必須音声処理機能:AMR音声コーデック:一般記述(Mandatory Speech Codec speech processing functions; AMR Speech CODEC; General description)」
[8] 3GPP TS 26.171「音声コーデックの音声処理機能:適応マルチレート広帯域(AMR−WB)音声コーデック:一般記述(Speech codec speech processing functions; Adaptive Multi-Rate-Wideband (AMR-WB) speech codec; General description)」
[9] ITU−T勧告H.263、低ビットレート通信用ビデオ符号化方式(Video coding for low bit rate communication)
[10] ITU−T勧告H.264、オーディオビジュアルサービス全般のための高度ビデオ符号化方式(Advanced video coding for generic audiovisual services)

【特許請求の範囲】
【請求項1】
通信ネットワークにおける第1のネットワーク要素に向けられている、ユーザメディアとアナウンスメディアとを切り替える方法であって、
前記ユーザメディアは、第2のネットワーク要素から到来するものであり、
前記アナウンスメディアは、第3のネットワーク要素から到来するものであり、
前記方法は、
前記ユーザメディアのコンフィグレーションを判定するステップと、
前記判定されたユーザメディアのコンフィグレーションに基づいて、前記第1のネットワーク要素に提示される前記アナウンスメディアのコンフィグレーションを判定するステップと、
前記アナウンスメディアのコンフィグレーションに従って、前記アナウンスメディアをコンフィグレーションするステップと、
前記コンフィグレーションされたアナウンスメディアを前記第1のネットワーク要素に送信するステップと
を備えることを特徴とする方法。
【請求項2】
前記ユーザメディアのコンフィグレーションを判定するステップは、前記ユーザメディアのコーデックコンフィグレーションを判定するステップを含み、
前記アナウンスメディアのコンフィグレーションを判定するステップは、前記アナウンスメディアのコーデックコンフィグレーションと前記ユーザメディアのコーデックコンフィグレーションとのマッチングに基づいている
ことを特徴とする請求項1に記載の方法。
【請求項3】
前記ユーザメディアのコンフィグレーションを判定するステップは、前記ユーザメディアの伝送フォーマットコンフィグレーションを判定するステップを更に含み、
前記アナウンスメディアのコンフィグレーションを判定するステップは、更に、前記アナウンスメディアの伝送フォーマットコンフィグレーションと前記ユーザメディアの伝送フォーマットコンフィグレーションとのマッチングに基づいている
ことを特徴とする請求項2に記載の方法。
【請求項4】
前記ユーザメディアのコンフィグレーションを判定するステップは、前記ユーザメディアのフレームアグリゲーションコンフィグレーションと冗長性フォーマットコンフィグレーションを判定するステップを更に含み、
前記アナウンスメディアのコンフィグレーションを判定するステップは、更に、前記アナウンスメディアのフレームアグリゲーションコンフィグレーションと冗長性フォーマットコンフィグレーションと、前記ユーザメディアのフレームアグリゲーションコンフィグレーションと冗長性フォーマットコンフィグレーションとのマッチングに基づいている
ことを特徴とする請求項2または3に記載の方法。
【請求項5】
前記ユーザメディアのコーデックコンフィグレーションを判定するステップは、コーデックのタイプ、コーデックモード、及びプションでコーデックモード切替機能の判定を含んでいる
ことを特徴とする請求項2に記載の方法。
【請求項6】
通信セッションが、前記第1のネットワーク要素と前記第2のネットワーク要素との間のユーザメディアに対してセットアップされ、
前記コンフィグレーションされたアナウンスメディアを前記第1のネットワーク要素に送信するステップは、前記通信セッションに前記コンフィグレーションされたアナウンスメディアを挿入するステップを含んでいる
ことを特徴とする請求項1に記載の方法。
【請求項7】
前記ユーザメディアのコンフィグレーションを判定するステップは、
少なくとも1つの有効なユーザメディアのコンフィグレーションを識別するために、前記第1のネットワーク要素と前記第2のネットワーク要素との間のユーザメディア用の通信セッションのセットアップをモニタするステップと、
前記少なくとも1つの有効なユーザメディアのコンフィグレーションに基づいて、前記ユーザメディアのコンフィグレーションを判定するステップと
を備えることを特徴とする請求項1に記載の方法。
【請求項8】
複数の有効なユーザメディアのコンフィグレーションが、前記セッションセットアップをモニタする場合に識別され、
前記ユーザメディアのコンフィグレーションは、前記複数の有効なユーザメディアのコンフィグレーションから判定される
ことを特徴とする請求項7に記載の方法。
【請求項9】
前記ユーザメディアのコンフィグレーションを判定するステップは、更に、前記複数の有効なユーザメディアコンフィグレーションの内の、現在使用されているものを検出するために、前記セッションにおけるネットワーク要素間の通信をモニタするステップを含んでいる
ことを特徴とする請求項8に記載の方法。
【請求項10】
前記ネットワーク要素間の通信をモニタするステップは、前記アナウンスメディアのコンフィグレーションの適切な判定を実現するために、前記ユーザメディアのコンフィグレーションの適応用の情報を検出するステップを含んでいる
ことを特徴とする請求項9に記載の方法。
【請求項11】
前記セッションに前記アナウンスメディアを挿入するタイミングは、前記アナウンスの緊急性に基づいて判定され、
前記コンフィグレーションされたアナウンスメディアは、前記判定されたタイミングに従って、前記セッションに挿入される
ことを特徴とする請求項6に記載の方法。
【請求項12】
前記アナウンスメディアが前記セッションに挿入される場合、前記ユーザメディアと前記アナウンスメディアとの間の円滑な遷移のための遷移処理を適用するステップを更に備える
ことを特徴とする請求項6に記載の方法。
【請求項13】
前記第1のネットワーク要素は、第1のユーザのユーザ機器を含み、
前記第2のネットワーク要素は、第2のユーザのユーザ機器を含み、
前記第3のネットワーク要素は、第3のユーザのユーザ機器を含む
ことを特徴とする請求項1に記載の方法。
【請求項14】
前記アナウンスサーバは、前記ネットワークの側と前記ユーザの側との一方に配置されている
ことを特徴とする請求項13に記載の方法。
【請求項15】
前記ユーザは、メディア伝送用のリアルタイムプロトコル(RTP)と、セッション制御用のセッション開始プロトコル(SIP)を使用するマルチメディアセッションに関与している
ことを特徴とする請求項13に記載の方法。
【請求項16】
通信ネットワークにおける通信セッションで、ユーザメディアとアナウンスメディアの切替を行なうためのシステムであって、
前記通信セッション用の前記ユーザメディアのコンフィグレーションを判定する手段と、
前記判定されたユーザメディアコンフィグレーションに基づいて、前記セッションに挿入される前記アナウンスメディアのコンフィグレーションを判定する手段と、
前記アナウンスメディアのコンフィグレーションに従って、前記アナウンスメディアをコンフィグレーションする手段と
前記セッションに、前記コンフィグレーションされたアナウンスメディアを挿入する手段と
を備えることを特徴とするシステム。
【請求項17】
前記ユーザメディアのコンフィグレーションを判定する手段は、前記セッションにおける前記ユーザメディアのコーデックコンフィグレーションを判定する手段を含み、
前記アナウンスメディアのコンフィグレーションを判定する手段は、前記アナウンスメディアのコーデックコンフィグレーションと前記ユーザメディアのコーデックコンフィグレーションとのマッチングを行なうように構成されている
ことを特徴とする請求項16に記載のシステム。
【請求項18】
前記ユーザメディアのコンフィグレーションを判定する手段は、前記セッションにおける前記ユーザメディアの伝送フォーマットコンフィグレーションを判定する手段を更に含み、
前記アナウンスメディアのコンフィグレーションを判定する手段は、更に、前記アナウンスメディアの伝送フォーマットコンフィグレーションと前記ユーザメディアの伝送フォーマットコンフィグレーションとのマッチングを行なうように構成されている
ことを特徴とする請求項17に記載のシステム。
【請求項19】
前記セッションにおける前記ユーザメディアのコーデックコンフィグレーションを判定する手段は、コーデックのタイプ及びコーデックモードを判定する手段を含んでいる
ことを特徴とする請求項17に記載のシステム。
【請求項20】
前記ユーザメディアのコンフィグレーションを判定する手段は、
少なくとも1つの有効なユーザメディアのコンフィグレーションを識別するために、前記セッションのセットアップをモニタする手段と、
前記少なくとも1つの有効なユーザメディアのコンフィグレーションに基づいて、前記ユーザメディアのコンフィグレーションを判定する手段と
を備えていることを特徴とする16に記載のシステム。
【請求項21】
前記ユーザメディアのコンフィグレーションを判定する手段は、
複数の有効なユーザメディアのコンフィグレーションを識別するために、前記セッションのセットアップをモニタする手段と、
前記複数の有効なユーザメディアのコンフィグレーションの内の、現在使用されているものを検出するために、前記セッションにおけるユーザ間の通信をモニタする手段と
を備えていることを特徴とする16に記載のシステム。
【請求項22】
前記アナウンスの緊急性に基づいて、前記セッションにおいて前記アナウンスメディアを挿入するタイミングを判定する手段を更に備え、
前記コンフィグレーションされたアナウンスメディアを挿入する手段は、前記判定されたタイミングに従って、前記セッションに、前記コンフィグレーションされたアナウンスメディアを挿入するように動作可能である
ことを特徴とする16に記載のシステム。
【請求項23】
前記アナウンスメディアが前記セッションに挿入される場合、前記ユーザメディアと前記アナウンスメディアとの間の円滑な遷移のための遷移処理を適用する手段を更に備える
ことを特徴とする16に記載のシステム。
【請求項24】
前記通信セッションは、異なるユーザのユーザ機器間の通信に関連し、
前記アナウンスは、前記ネットワークの側と前記ユーザの側との内の一方に配置されているアナウンスサーバから到来する
ことを特徴とする16に記載のシステム。
【請求項25】
通信ネットワーク用のアナウンスサーバであって、
前記通信ネットワークのセッションにおけるユーザメディアのコンフィグレーションを示すメディアコンフィグレーション情報を取得する手段と、
前記メディアコンフィグレーション情報に基づいて、前記セッションに挿入されるアナウンスメディアをコンフィグレーションする手段と、
前記セッションに、前記コンフィグレーションされたアナウンスメディアを挿入する手段と
を備えることを特徴とするアナウンスサーバ。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公表番号】特表2010−512106(P2010−512106A)
【公表日】平成22年4月15日(2010.4.15)
【国際特許分類】
【出願番号】特願2009−540202(P2009−540202)
【出願日】平成19年11月30日(2007.11.30)
【国際出願番号】PCT/SE2007/001061
【国際公開番号】WO2008/069723
【国際公開日】平成20年6月12日(2008.6.12)
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.GSM
【出願人】(598036300)テレフオンアクチーボラゲット エル エム エリクソン(パブル) (2,266)
【Fターム(参考)】