セッションネゴシエーションのための方法及び装置
セルラー通信システムにおける第1のクライアントと第2のクライアントとの間でのセッションネゴシエーションを行う方法において、前記第1のクライアントと前記第2のクライアントとが、セッション用の第1のコーデックタイプをネゴシエートし、かつ同意するS10。次に、前記第1のクライアントと前記第2のクライアントが、前記セッションを開始し、前記第1のコーデックタイプに従ってメディアデータフレームを交換するS20。続いて、前記開始されたセッション中に、前記第1のクライアントと前記第2のクライアントとの少なくとも一方が、少なくとも1つの後続のメディアデータフレームにおける第2のコーデックタイプに対する指示を提供するS30。そして、前記指示の受信及び認識に応じて、前記第1のクライアントと前記第2のクライアントの一方が、次のメディアデータフレームにおいて、前記第2のコーデックタイプに切り替え、それによって、前記第1のクライアントと前記第2のクライアントとが、前記第2のコーデックタイプを利用して後続のメディアデータフレームを交換することを可能にする。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、一般的には、セルラー音声セッションに関するものであり、特に、そのようなセッションのためのメディアフォーマットのネゴシエーションに関するものである。
【背景技術】
【0002】
3GPPは、3Gネットワークにおけるボイスサービス用の必須の音声コーデックとして、AMR及びAMR−WBを規定している。これらのコーデックは、IMSを介する3GPPマルチメディアテレフォニー内で規定される3GPP VoIPサービスに対しても必須となっている。メディア処理及び対話のための支配的な仕様には、3GPP TS26.114がある。これらのコーデックの必須の状況に関わらず、新規のボイスコーデックを規定することが3GPP内で現在も要望されていて、この新規のボイスコーデックとは、AMR−WBで可能なこと以上により高度のサービスを実現可能とするものである。
【0003】
しかしながら、新規の音声コーデックを音声通信システムに導入することは、いくつかの観点では問題がある可能性がある。1つの問題には、その新規のコーデックとは別に、既存の3GPPコーデック群だけあるいはそれらの1つだけ、例えば、AMR−WBをサポートする従来の機器の設置基盤を常に用意する必要があることである。これは、相互運用性の問題を招く可能性がある。この相互運用性の問題とは、システム内に適切なメカニズムを実装しない限り、新規の機器と従来の機器との間で通信ができないことである。この問題に対処するための従来の方法には、例えば、メディアゲート内にトランスコーダを提供することである。ここで、このメディアゲートウェイは、新規のコーディングフォーマットと旧来のコーディングフォーマットとの間の変換を行うものである。あるいは、この問題に対処するための従来の方法には、新規の端末における新規のコーデックとは別に従来の機器のコーデックを提供することである。ここで、新規の端末とは、従来の端末との接続が確立される場合に従来のコーディングフォーマットを選択することが可能なものである。後者の方法は、両方の端末をサポートする共通のコーデックを識別する実際の音声接続の前に端末間でケイパビリティの交換を行うことを要求する。IMS内では、セッション記述プロトコル(SDP) IETF RFC4566が、このケイパビリティ交換を実行するために使用される。
【0004】
新規のコーデックを通信システムに導入する場合の相互運用性を保証するための上述の方法は、可能性だけでなく、様々な欠点を有している。トランスコーダを提供することは、追加する機器によって、ネットワークへの投資コスト及びメンテナンスコストを生じさせることを意味する。トランスコーダによる処理は、望ましくない音声品質低下にも関係する。発呼の前に端末間でのケイパビリティ交換を使用することはかなり洗練された方法であるが、常に可能であるとは限らない。常に可能であるとは限らない例には、複数人による会議や、MTSIをサポートすることなくセルへローミングする移動ユーザに伴うハンドオーバの状況、ボイスメッセージング等がある。端末の実装の観点からも、新規のコーデックと従来のコーデックの完全なセットに対するサポートを提供することも望ましくない場合がある。これは、実装コスト及び技術のライセンス供与のコストが増加する可能性あるからである。
【0005】
ここで、上述の問題を回避するために、好適なソリューションには、新規のコーデックに、従来のコーデックの(少なくとも)1つと相互運用可能なビットストリームを埋め込むことである。コーデックレベルでのこのような類のビットストリームの「埋込」は、相互運用性に対する必要な条件である一方で、システムレベルでの相互運用性を達成するための要件を満足するための更なる態様が必要とされる。2つの更なる必要な態様には、SDPシグナリング互換性とビットストリームトランスポートフォーマットの互換性がある。SDPケイパビリティネゴシエーションに関しては、トランスペアレントな方法で新規のデバイスと従来のデバイスとの間をSDPケイパビリティネゴシエーションができることが要望される。このトランスペアレントな方法とは、新規コーデックを依然として認識していない従来の機器が新規のデバイスと音声サービスセッションを確立できることを意味する。
【発明の概要】
【発明が解決しようとする課題】
【0006】
3GPP MTSIの場合での音声ビットストリームデータに対して使用されるトランスポートフォーマットは、リアルタイムアプリケーション(RTP) IETF RFC 3550用のトランスポートプロトコルに対するIETF仕様と、音声コーデック専用音声ペイロードフォーマットの仕様に従う。ここで、AMRとAMR−WBの場合、この使用は、IETF RFC 4867である。明らかなことは、従来の端末は専用音声ペイロードフォーマットに依存し、また、別の(新規の)フォーマットに従う音声ビットスリームを作成あるいは適切に受信することができないことである。
【0007】
上述の問題及び要件のために、トランスペアレントな方法で新規のデバイスと従来のデバイスとの間でセッションネゴシエーションを実現可能にするための要望が存在する。
【課題を解決するための手段】
【0008】
本発明は、既存のセッションネゴシエーション手順を再使用することを可能にするために、進行中のセッション中に新規のコーデックタイプをネゴシエートすることを可能にするための方法を提供する。
【0009】
基本的には、セルラー通信システムにおける第1のクライアントと第2のクライアントとの間でのセッションネゴシエーションを行う方法は、以下のステップ群を備える。第1のインスタンスでは、前記第1のクライアントと前記第2のクライアントとが、セッション用の第1のコーデックタイプをネゴシエートし、かつ同意するS10。次に、このセッションが開始され、メディアデータフレームが、前記第1のコーデックタイプに従って前記第1のクライアントと前記第2のクライアントとの間で交換されるS20。続いて、そのセッション中に、前記第1のクライアントと前記第2のクライアントとの内の少なくとも一方が、少なくとも1つの後続のメディアデータフレームにおける第2のコーデックタイプに対する指示を提供するS30。そして、提供される指示の受信及び認識に応じて、前記第1のクライアントと前記第2のクライアントの内の他方が、次のメディアデータフレームにおいて、前記第2のコーデックタイプに切り替えS40、それによって、前記第1のクライアントと前記第2のクライアントとが、前記第2のコーデックタイプを利用して後続のメディアデータフレームを交換することを可能にする。
【0010】
本発明の更なる態様に従えば、セルラー通信システムにおけるクライアントは、別のクライアントとのセッション用の第1のコーデックタイプについてネゴシエートし同意する手段10と、セッションを開始し、前記第1のコーデックタイプに従ってメディアデータフレームを交換する手段20を含んでいる。加えて、前記開始されるセッション中に、第2のコーデックタイプに対する指示を少なくとも1つの後続のメディアデータフレームに提供する手段30が、クライアントに提供される。そして、クライアントは、対応する指示の受信及び認識に応じて、次のメディアデータフレームで前記第2のコーデックタイプに切り替える手段40を含んでいて、それによって、当該クライアントと前記別のクライアントとが前記第2のコーデックタイプを利用して後続のメディアデータフレームを交換することを可能にする。
【0011】
本発明の効果は、以下の点を含んでいる。
【0012】
本発明の実施形態に従うセッションネゴシエーション用の2段階の方法を使用する利点は、SIP/SDPシグナリングプレーン上で表現される後方互換性によるである。通常のAMR−WBセッションのように見えるが、これに代えて、新規の音声コーデックを使用する可能性のためのCMRシグナリング「プローブ」となる。CMRビットの特性はこの後方互換性を実現する。これは、従来のデコーダはCMRリクエストあるいは「新規」のFTを伴う受信フレームを理解しない場合、自動的にそれらを却下するからである。
【図面の簡単な説明】
【0013】
【図1】周知のRTPペイロードフォーマットを示す図である。
【図2】本発明の実施形態のシグナリングを示す図である。
【図3】本発明の更なる実施形態のシグナリングを示す図である。
【図4】パケットフォーマットを示す図である。
【図5】本発明に従う方法の実施形態に対するフローチャートである。
【図6】本発明に従う方法の更なる実施形態に対するフローチャートである。
【図7】図6のフローチャートの続きを示すフローチャートである。
【図8】本発明の実施形態に従うユーザ機器を示す図である。
【発明を実施するための形態】
【0014】
略語
3GPP 第3世代パートナシッププロジェクト
AMR 適応多重レート
AMR−WB AMRワイドバンド
CMR コーデックモードリクエスト
EVS 拡張ボイスサービス
IMS IPマルチメディアサブシステム
MTSI IMS用マルチメディアテレフォニーサービス
RTP リアルタイムトランスポートプロトコル
RTCP リアルタイムトランポート制御プロトコル
RTCP_APP アプリケーション定義に従うリアルタイムトランポート制御プロトコル
SDP セッション記述プロトコル
SIP セッション開始プロトコル
SSRC 同期ソース(Synchornization SouRCe)
UE ユーザ機器
本発明は、上述の問題を解消するための方法を記載する。これは、AMR−WBに基づくMTSIをサポートする従来の端末と、新規のビットストリームで相互運用可能なコーデックに基づいてMTSIを展開する新規の端末との間でシステムレベルの相互運用性を可能にすることになる。特に、本発明は、コーデックタイプシグナリングとその用途に対するソリューションを定義し、これは、AMR−WBの既存の設備と完全な互換性がある一方で、3GPPにおいて任意の新規のビットストリーム埋込音声コーデックの互換性の完全な使用を依然として実現可能にする。
【0015】
本発明の利点を更に説明するために、従来技術の詳細説明を以下に示す。
【0016】
サービスに対する通常のあるいは従来のセッションネゴシエーション手順において、セッション用のコーデック選択が、制御プレーンシグナリング中、典型的には、SIPとSDPの中で実行される。ここで、その重要なことは、動作の後方互換モードを有する新規のコーデックが、既に存在して装備されているセッションネゴシエーションメカニズムを再使用できることである。そうでない場合、既存のコーデックとのビットストリーム相互運用性は使用されないことになる。これは、一致するコーデックタイプあるいはコーデックコンフィグレーションが検出されない場合にはセッションネゴシエーションが失敗することになるからである。
【0017】
基本的には、本発明は、SIP/SDPを使用するセッションネゴシエーション用の既存のシグナリングスキームを再使用し、かつAMR−WBペイロードフォーマットで利用可能なシグナリングの範囲で再使用するための2つのステップによる方法を開示する。基本の概念は、SIP/SDPにおけるセッションを標準AWR−WBセッションとしてセットアップすることであり、これは、場合によっては、後方互換性の程度に依存して制限されたコーデックモード(即ち、すべてのモードあるいはいくつかの選択されたモード)を使用する。続いて、新規のコーデックについての指示がペイロードパケット内に導入され、そうすることで、受信クライアントに、新規のセッションネゴシエーション手順を必要とさせることなく、可能性のある新規のコーデックタイプを識別しかつ利用することを可能にする。
【0018】
本発明の実施形態の説明はAMR−WBペイロードフォーマットで使用可能な構成に依存するので、このペイロードフォーマットの簡単な説明を、図1のRTPパケットを参照しながら以下に示す。このペイロードフォーマットは、AMRとAMR−WBの両方に対して同一である。この詳細については、文献[1]を参照されたい。
【0019】
RTPパケットの最初の12バイトは汎用RTPヘッダであり、AMR専用ペイロードヘッダはCMRビット、Fビット、FTビット及ぶQビットを含んでいる。AMRデータは、特に、この場合には、d(0)、...、d(243)で示される。最後のPビットはパディングビットである。尚、このパケットは、ペイロード内の1つのAMRパケットが12.2kbpsモードで符号化される場合の一例である。また、帯域幅が有効な形式のペイロードフォーマットが使用され、別のオプションでは、いくつかの追加のパディングビットがペイロードフォーマットヘッダ内にある場合にはオクテット配列を使用する。フィールドF、FT及びQは、目次(ToC: Table of Contents(テーブルオブコンテンツ))と呼ばれる1つのエンティティにグループ化される。これは、パケット内の音声フレーム単位で一度に送信される。CMRフィールドは、パケット内に存在する音声フレームがどんなに多くても、各RTPパケットで一度に送信される。ペイロードヘッダ内のAMR固有シグナリングビットは以下のようになる。
【0020】
CMR− コーデックモードリクエスト(codec mode requests)の略称であり、これは、一方向で符号化及び送信を行う場合に使用するパケットの受信機に対する送信機のモードリクエストを符号化する。モードリクエストの符号化は、以下で説明するフレームタイプに従って実行される。
【0021】
F− 別の音声フレームが、現在のToCを記述するフレームに後続するかどうかを示すものである。
【0022】
FT− フレームタイプの略称である。これは、現在のフレームを符号化するために使用されたコーデックモードが何であるかを識別するものである。フレームタイプの符号化は、以下で説明するフレームタイプに従って実行される。
【0023】
Q− フレーム品質インジケータの略称である。これは、フレームがエラーのないものであるかどうかを識別するものである。但し、音声データがIPを使用してエンドツーエンドでトランスポートされる場合、配信されるすべての音声フレームがエラーのないものであるということではない。
【0024】
この実施形態に関連して、RTPパケットの重要なフィールドはCMRフィールドとFTフィールドである。これらのフィールドの両方は、以下の表1及び表2で参照される、AMR[2]とAMR−WB[3]における表を符号化する。
【0025】
【表1】
【0026】
【表2】
【0027】
尚、AMRとAMR−WBの両方で利用可能なフレームタイプが存在し、これは、将来用のために予約されていて、AMRについてはこれはフレームタイプインデックス12から14であり、AMR−WBについてはこれはフレームタイプインデックス10から13である。
【0028】
図2を参照すると、本発明に従う方法の基本的な実施形態は、セルラー通信システムにおいて第1のクライアントと第2のクライアントとの間の改良されたセッションネゴシエーションの方法を開示している。S10で、これら2つのクライアントはセッション用の第1のコーデックタイプについてネゴシエートして同意し、続いて、S20で、セッションを開始して、ネゴシエートした第1のコーデックタイプに従ってメディアデータフレームを交換する。開始されたセッション内でのメディアデータフレームの進行中の交換の間では、S30で、第1のクライアントと第2のクライアントの少なくとも一方が、少なくとも1つの後続のメディアデータフレームで第2のコーデックタイプに対する指示を提供する。そして、提供される指示を受信して認識した際には、S40で、第1のクライアントと第2のクライアントのもう一方が、次のメディアデータフレームにおいて指示された第2のコーデックタイプに切り替える。これによって、2つのクライアントは、第2のコーデックタイプを利用して後続のメディアデータフレームを交換することが可能になる。
【0029】
クライアントは、所定数のステータスタイプインジケータが送信されるまで、あるいは対応するステータスタイプインジケータが受信されるまで、いくつかの連続する音声あるいはメディアデータフレームにステータスタイプインジケータを含める。所定数のインジケータが、対応するインジケータをクライアントが受信することなく送信される場合、クライアントは、インジケータの送信を停止し、最初にネゴシエートしたコーデックタイプを使用して送信を維持する。本発明の実施形態に従えば、クライアントは、後続のデータフレームにおいてリクエストされたコーデックタイプを直ちに切り替えることによって受信するステータスインジケータに応答する。しかしながら、少なくとも1つの対応するコーデックタイプインジケータを送信し、その後、リクエストされたコーデックタイプに切り替えることによって、受信するコーデックタイプインジケータに応答することも等しく可能である。
【0030】
これによって、新規のセッションネゴシエーションを必要とすることがなく、また、新規のコーデック実装デバイスと従来のコーデック実装デバイスとの両方は、最初に交換されたメディアデータフレームにビットストリーム後方互換性があるという条件で、通信することができる。
【0031】
本明細書で記載される本発明の開示の実施形態の重要な要素は、伝統的なセッション制御プロトコルシグナリング、例えば、メディアコンフィグレーション用のセッションをネゴシエートする場合のSIP/SDPと、ペイロードヘッダ内のCMRフィールドでコーデックモード/タイプを信号送信してかつリクエストすることができるものと組み合わせることである。これらの2つのメカニズムを一緒に使用することによって、シグナリングレベルで従来のAMR−WB対応クライアントと相互動作することを脅かすことなく新規の音声コーダの使用をネゴシエートすることが可能になる。それゆえ、このセッションネゴシエーションは3つのステップで実行される。
【0032】
まず、最初に、SIP/SDPを使用して、「通常」のAMR−WBセッションがネゴシエートされる。ここでは、新規の音声コーデックタイプの使用を指示するシグナリングは実行されない。次に、メディアが、クライアントAとクライアントB(及びその逆)との間でフローすることを開始する場合、新規の音声コーデックタイプをサポートするクライアントがAMR−WBタイプテーブル(表)において予約されている符号化の1つを使用してコーデックモードリクエスト(CMR)を送信する。これは、適切な検出を保証するために第1のN個のフレームについて繰り返されることになる。このNは1から∞の範囲で構成設定可能である。数を限定する理由は他の値でCMRが送信される場合の混同を回避するためである。最後に、クライアントが、新規のコーデックタイプのサポートを示すCMRを受信するとすぐに、新規のコーデックのコーデックモードを使用して、一方のクライアントがそれを復号できることを確実にすることを開始することができる。
【0033】
コーデックの使用についての「階層的な」シグナリングに伴う主要な利点は、従前の装備を脅かすことなく新規の音声コーデックの装備を実現可能とし、かつシグナリングプレーン上での任意の更新を必要としないことである。
【0034】
本発明は、AMR−WBセッションをネゴシエートする既存の方法の再使用に基づいている。
【0035】
【表3】
【0036】
表3は、IMSマルチメディアテレフォニーにおける典型的なAMR−WBネゴシエーションの一例を示している。2つの異なるバージョンのAMR−WBが提案されていて、1つは帯域幅有効ペイロードフォーマット(好ましくは)を使用し、もう1つはオクテット配列のペイロードフォーマットを使用する。RTPクロックレートは16kHzに設定され、1つのオーディオチャネルが使用されることになる。
【0037】
本発明に従う新規の音声コーデックに対するセッションネゴシエーションは、後方互換性がすべてのAMR−WBモードに対して配備されている場合に同一のものとみなすことになる。一定のモード(群)だけに対して制限された後方互換性が存在する場合、モードの設定制限が信号通信されることになる。次に、SDPは、例示の指示がモード設定1、2に対してのみサポートすることに変更する。
【0038】
【表4】
【0039】
SDPの使用の種類は、AMR−WBをサポートする任意の2つのクライアントの間のセッションをセットアップし、また、これは、新規の音声コーデックに対する任意のサポートを示すことはない。
【0040】
本発明の実施形態に従うネゴシエーション手順の第2の段階は、表2の空きフレームのタイプのインデックスの使用を行うことになる。この例では、フレームタイプ12は新規の音声コーデックに対するサポートを示すために使用されているが、他のフレームタイプも使用することができる。セッションネゴシエーションのこの部分は、メディアフロー内の帯域内(インバンド:in-band)で実行されるので、ネゴシエーションが実行可能である専用のプロービング(probing)期間が設定される。新規の音声モードがプロービング期間内部で発生していることを示すCMRビットの共同の交換がない場合、ネゴシエーションの第2の段階は失敗していると想定され、また、そのセッションは標準的なAMR−WBセッションとして取り扱われることになる。
【0041】
図3に示される例示のシグナリングスキームでは、全二重セッションが想定されることに注意されたい。この全二重セッションでは、クライアントの両方が音声データを送信し、それによって、自動的に、インバンドCMRビット用のシグナリングチャネルを作成するものである。しかしながら、半二重フローの場合(図4参照)、つまり、メディアが一方向に流れる場合、これは不可能である。これらの場合、CMRビットを搬送する他の手段が、2段階のネゴシエーションを成功させるために使用されることを必要とする。このことを実現するための様々な方法が存在するが、その1つには、3GPP[4]におけるMTSIサービスとの直接互換がある方法が1つ存在する。例示のシグナリングでは、第1のクライアントUE1は一般的なSDP オファー(OFFER:提案) AMR−WBを第2のクライアントUE2へ送信し、これは、200 OKで応答して、提案されるコーデックタイプを受け入れる。続いて、セッションが開始され、メディアデータフレームであるRTP MEDIA(メディア),FT8が、2つのクライアントとの間で交換される。第1のクライアントは、次に、CMR=12を含めることによって、N個の連続するメディアデータフレームに、第2のコーデックタイプ用の指示を含める。コーデックタイプの指示を受信し及び認識することで、第2のユーザ機器UE2は、CMR=12を含むN個のメディアデータフレームで応答する。そして、2つのクライアントは、完全に新規なセッションネゴシエーション手順を開始することなく、現在同意されている第2のコーデックタイプを使用してメディアデータの交換を開始することができる。
【0042】
CMRに基づくネゴシエーションに対する代替のソリューションは、CMRビットを搬送するためにRTCP−APPを使用することである。このメカニズムに伴う更なる利点は、半二重セッションに対しても動作することである。図4及び図5を参照されたい。MTSIは、音声データがフローしている場合のセッション中に使用されるべき適合パラメータを搬送するための専用のAPPレポートを定義している。この手順は、基本的には、いくつかの点を除いて、図5を参照して説明される手順と同一である。半二重セッションは、メディアフローの逆方向にRTCPレポートを送信することになるので、これは、発生するシグナリングに対する可能性を広げる。ここで、CMRリクエスト用のRTCP−APPエンコーディングは、インバンド形式と同一のものであり、そうすることで、同一の行動を確認することができることに注意されたい。RTCPを使用して送信されるCMRリクエストの速度に1つの違いがあり、これは、RTCP送信ルールによって設定される制限の1つである。しかしながら、この制限の最大の結論は、ネゴシエーションの第2の段階に対するセットアップ時間がわずかに延びることであり、最後には同一の正常な速度になる。
【0043】
図6及び図7を参照して、本発明に従う方法の特定の実施形態を説明する。この例では、CMR=12は新規のコーデックに対する代替に相当し、パラメータNを構成設定可能である(ほぼ10程度の値が使用されることになる)。AMR−WBへの拡張、即ち、新規の後方互換音声コーデックは、EVSと呼ばれる。ここで、CMR値は、AMR−WBフレームタイプのインデックスで現在利用可能な任意の値とすることができることに注意されたい。
【0044】
特定の実施形態はAMR−WBとEVSを使用しているが、これは第1のコーデックタイプ及び第2のコーデックタイプの一例であり、同一の方法を他の音声コーデックタイプの組み合わせにも等しく利用することができることは明らかである。
【0045】
最初に、AMR−WBの場合、クライアントあるいはユーザ機器は、第1のコーデックタイプを含むインビテーション(招待)を伴うセッションネゴシエーション信号を送信する。次に、クライアントがそのインビテーションに対する肯定応答(200 OK)を受信する場合、クライアントは、そのネゴシエーションされるコーデックタイプを使用してメディアフレームの送信/交換を開始することを継続する。N個の連続するデータフレームまで、クライアントは第2のコーデックタイプを使用することができることを示すために、CMR=12を含める。同時に、クライアントは、受信する音声パケット、及び対応する指示用のRTPCP−APPレポートの少なくとも一方を監視する。対応する指示を受信すると、クライアントは、第2のコーデックタイプ、例えば、EVSモードに従ってデータフレームを送信することを開始する。このような指示が提供されない場合、クライアントは、従前にネゴシエートされたコーデックタイプ、例えば、AMR−WBモードを維持する。
【0046】
ここで、図6及び図7のフローは一例であり、EVSネゴシエーションの開始は、200 OKが受信された直後であることが必須ではなく、セッション中の任意の時間に実行することができることに注意されたい。また、テスト「CMR=12?」は、厳密なテストにしなければならないわけではない。このことを実行するための代替の方法は、例えば、以下のものがある。
【0047】
1)リモートクライアント(EVS用のCMRリクエストを受信するクライアント)は、EVSフレームタイプ(FT=12あるいは13、あるいはそれ以外)を使用して直ちに開始することができる。このことは、EVSが可能であり、また、「CMR=12」を指示するために「CMR=12」を送信することが必要ないことを宣言することにもなる。
【0048】
2)1つの構成には、「FT=12」が「EVSケイパビリティ用の問い合わせ/招待」であること、また、「FT=13」が確認応答であることを定義することができる。
【0049】
図8を参照して、本発明に従うユーザ機器あるいはクライアントの実施形態を説明する。ユーザ機器あるいはクライアントについての1つの特定の態様は、リクエストされている新規のあるいは第2のコーデックタイプについての指示の受信を、認識して動作することができることが必要であることである。このことのために、ユーザ機器は、信号を送受信することを可能にするための汎用入力/出力ユニットI/O、別のクライアントとのセッション用の第1のコーデックタイプについてネゴシエートしかつ同意するためのネゴシエーションユニット10と、ネゴシエートされた第1のコーデックタイプに従って別のユーザ機器とのセッションを開始し、メディアデータフレームを交換するためのセッションユニット20とを含んでいる。また、クライアントは、開始されたセッション中に、第2のコーデックタイプのための指示を少なくとも1つの後続のメディアデータフレームで提供するためのコーデック切替ユニット30を含んでいる。そして、クライアントは、対応する指示を受信し及び認識すると、次のメディアデータフレームで指示された第2のコーデックタイプへ切り替えるためのユニット40を含み、これによって、第1のクライアントと第2のクライアントに第2のコーデックタイプを利用して後続のメディアデータフレームを交換することを可能にする。つまり、ユーザ機器あるいはクライアントはコーデック切替指示を提供するだけでなく、対応する指示を受信しそれに応答するように適合されている。上述のユニット群は、典型的には、1つ以上のハードウェアプロセッサあるいは、本開示の方法の開示される実施形態のステップ群を実行するように構成されているソフトウェアアルゴリズムによって実現可能である。加えて、上述のクライアントあるいはユーザ機器の機能は、電気通信システム内のノードにおいて実現することができる。
【0050】
開示される方法及び構成に対する前提条件は、データパケット、例えば、RTPパケットが、ビットストリーム埋込後方互換コーデックフォーマットを有することである。本発明はパケット交換システムの内容で説明されるが、回線交換システムにも等しく適用可能である。
【0051】
本発明の効果は、以下のことを含んでいる。
【0052】
本発明の実施形態に従うセッションネゴシエーション用の2段階の方法を使用する利点は、SIP/SDPシグナリングプレーン上で表現される後方互換性によるものである。通常のAMR−WBセッションのように見えるが、これに代えて、新規の音声コーデックを使用する可能性のためのCMRシグナリング「プローブ」となる。CMRビットの特性はこの後方互換性を実現する。これは、従来のデコーダはCMRリクエストあるいは「新規」のFTを伴う受信フレームを理解しない場合、自動的にそれらを却下するからである。
【0053】
文献群
[1] IETF RFC 4867
[2] 3GPP TS26.101、「適合マルチレート(AMR)音声コーデックフレーム構造」
[3] 3GPP TS26.201、「適合マルチレート−ワイドバンド(AMR−WB)音声コーデック、フレーム構造」
[4] 3GPP TS26.114、「IPマルチメディアサブシステム(IMS)、マルチメディアテレフォニー、メディア処理及び対話」
【技術分野】
【0001】
本発明は、一般的には、セルラー音声セッションに関するものであり、特に、そのようなセッションのためのメディアフォーマットのネゴシエーションに関するものである。
【背景技術】
【0002】
3GPPは、3Gネットワークにおけるボイスサービス用の必須の音声コーデックとして、AMR及びAMR−WBを規定している。これらのコーデックは、IMSを介する3GPPマルチメディアテレフォニー内で規定される3GPP VoIPサービスに対しても必須となっている。メディア処理及び対話のための支配的な仕様には、3GPP TS26.114がある。これらのコーデックの必須の状況に関わらず、新規のボイスコーデックを規定することが3GPP内で現在も要望されていて、この新規のボイスコーデックとは、AMR−WBで可能なこと以上により高度のサービスを実現可能とするものである。
【0003】
しかしながら、新規の音声コーデックを音声通信システムに導入することは、いくつかの観点では問題がある可能性がある。1つの問題には、その新規のコーデックとは別に、既存の3GPPコーデック群だけあるいはそれらの1つだけ、例えば、AMR−WBをサポートする従来の機器の設置基盤を常に用意する必要があることである。これは、相互運用性の問題を招く可能性がある。この相互運用性の問題とは、システム内に適切なメカニズムを実装しない限り、新規の機器と従来の機器との間で通信ができないことである。この問題に対処するための従来の方法には、例えば、メディアゲート内にトランスコーダを提供することである。ここで、このメディアゲートウェイは、新規のコーディングフォーマットと旧来のコーディングフォーマットとの間の変換を行うものである。あるいは、この問題に対処するための従来の方法には、新規の端末における新規のコーデックとは別に従来の機器のコーデックを提供することである。ここで、新規の端末とは、従来の端末との接続が確立される場合に従来のコーディングフォーマットを選択することが可能なものである。後者の方法は、両方の端末をサポートする共通のコーデックを識別する実際の音声接続の前に端末間でケイパビリティの交換を行うことを要求する。IMS内では、セッション記述プロトコル(SDP) IETF RFC4566が、このケイパビリティ交換を実行するために使用される。
【0004】
新規のコーデックを通信システムに導入する場合の相互運用性を保証するための上述の方法は、可能性だけでなく、様々な欠点を有している。トランスコーダを提供することは、追加する機器によって、ネットワークへの投資コスト及びメンテナンスコストを生じさせることを意味する。トランスコーダによる処理は、望ましくない音声品質低下にも関係する。発呼の前に端末間でのケイパビリティ交換を使用することはかなり洗練された方法であるが、常に可能であるとは限らない。常に可能であるとは限らない例には、複数人による会議や、MTSIをサポートすることなくセルへローミングする移動ユーザに伴うハンドオーバの状況、ボイスメッセージング等がある。端末の実装の観点からも、新規のコーデックと従来のコーデックの完全なセットに対するサポートを提供することも望ましくない場合がある。これは、実装コスト及び技術のライセンス供与のコストが増加する可能性あるからである。
【0005】
ここで、上述の問題を回避するために、好適なソリューションには、新規のコーデックに、従来のコーデックの(少なくとも)1つと相互運用可能なビットストリームを埋め込むことである。コーデックレベルでのこのような類のビットストリームの「埋込」は、相互運用性に対する必要な条件である一方で、システムレベルでの相互運用性を達成するための要件を満足するための更なる態様が必要とされる。2つの更なる必要な態様には、SDPシグナリング互換性とビットストリームトランスポートフォーマットの互換性がある。SDPケイパビリティネゴシエーションに関しては、トランスペアレントな方法で新規のデバイスと従来のデバイスとの間をSDPケイパビリティネゴシエーションができることが要望される。このトランスペアレントな方法とは、新規コーデックを依然として認識していない従来の機器が新規のデバイスと音声サービスセッションを確立できることを意味する。
【発明の概要】
【発明が解決しようとする課題】
【0006】
3GPP MTSIの場合での音声ビットストリームデータに対して使用されるトランスポートフォーマットは、リアルタイムアプリケーション(RTP) IETF RFC 3550用のトランスポートプロトコルに対するIETF仕様と、音声コーデック専用音声ペイロードフォーマットの仕様に従う。ここで、AMRとAMR−WBの場合、この使用は、IETF RFC 4867である。明らかなことは、従来の端末は専用音声ペイロードフォーマットに依存し、また、別の(新規の)フォーマットに従う音声ビットスリームを作成あるいは適切に受信することができないことである。
【0007】
上述の問題及び要件のために、トランスペアレントな方法で新規のデバイスと従来のデバイスとの間でセッションネゴシエーションを実現可能にするための要望が存在する。
【課題を解決するための手段】
【0008】
本発明は、既存のセッションネゴシエーション手順を再使用することを可能にするために、進行中のセッション中に新規のコーデックタイプをネゴシエートすることを可能にするための方法を提供する。
【0009】
基本的には、セルラー通信システムにおける第1のクライアントと第2のクライアントとの間でのセッションネゴシエーションを行う方法は、以下のステップ群を備える。第1のインスタンスでは、前記第1のクライアントと前記第2のクライアントとが、セッション用の第1のコーデックタイプをネゴシエートし、かつ同意するS10。次に、このセッションが開始され、メディアデータフレームが、前記第1のコーデックタイプに従って前記第1のクライアントと前記第2のクライアントとの間で交換されるS20。続いて、そのセッション中に、前記第1のクライアントと前記第2のクライアントとの内の少なくとも一方が、少なくとも1つの後続のメディアデータフレームにおける第2のコーデックタイプに対する指示を提供するS30。そして、提供される指示の受信及び認識に応じて、前記第1のクライアントと前記第2のクライアントの内の他方が、次のメディアデータフレームにおいて、前記第2のコーデックタイプに切り替えS40、それによって、前記第1のクライアントと前記第2のクライアントとが、前記第2のコーデックタイプを利用して後続のメディアデータフレームを交換することを可能にする。
【0010】
本発明の更なる態様に従えば、セルラー通信システムにおけるクライアントは、別のクライアントとのセッション用の第1のコーデックタイプについてネゴシエートし同意する手段10と、セッションを開始し、前記第1のコーデックタイプに従ってメディアデータフレームを交換する手段20を含んでいる。加えて、前記開始されるセッション中に、第2のコーデックタイプに対する指示を少なくとも1つの後続のメディアデータフレームに提供する手段30が、クライアントに提供される。そして、クライアントは、対応する指示の受信及び認識に応じて、次のメディアデータフレームで前記第2のコーデックタイプに切り替える手段40を含んでいて、それによって、当該クライアントと前記別のクライアントとが前記第2のコーデックタイプを利用して後続のメディアデータフレームを交換することを可能にする。
【0011】
本発明の効果は、以下の点を含んでいる。
【0012】
本発明の実施形態に従うセッションネゴシエーション用の2段階の方法を使用する利点は、SIP/SDPシグナリングプレーン上で表現される後方互換性によるである。通常のAMR−WBセッションのように見えるが、これに代えて、新規の音声コーデックを使用する可能性のためのCMRシグナリング「プローブ」となる。CMRビットの特性はこの後方互換性を実現する。これは、従来のデコーダはCMRリクエストあるいは「新規」のFTを伴う受信フレームを理解しない場合、自動的にそれらを却下するからである。
【図面の簡単な説明】
【0013】
【図1】周知のRTPペイロードフォーマットを示す図である。
【図2】本発明の実施形態のシグナリングを示す図である。
【図3】本発明の更なる実施形態のシグナリングを示す図である。
【図4】パケットフォーマットを示す図である。
【図5】本発明に従う方法の実施形態に対するフローチャートである。
【図6】本発明に従う方法の更なる実施形態に対するフローチャートである。
【図7】図6のフローチャートの続きを示すフローチャートである。
【図8】本発明の実施形態に従うユーザ機器を示す図である。
【発明を実施するための形態】
【0014】
略語
3GPP 第3世代パートナシッププロジェクト
AMR 適応多重レート
AMR−WB AMRワイドバンド
CMR コーデックモードリクエスト
EVS 拡張ボイスサービス
IMS IPマルチメディアサブシステム
MTSI IMS用マルチメディアテレフォニーサービス
RTP リアルタイムトランスポートプロトコル
RTCP リアルタイムトランポート制御プロトコル
RTCP_APP アプリケーション定義に従うリアルタイムトランポート制御プロトコル
SDP セッション記述プロトコル
SIP セッション開始プロトコル
SSRC 同期ソース(Synchornization SouRCe)
UE ユーザ機器
本発明は、上述の問題を解消するための方法を記載する。これは、AMR−WBに基づくMTSIをサポートする従来の端末と、新規のビットストリームで相互運用可能なコーデックに基づいてMTSIを展開する新規の端末との間でシステムレベルの相互運用性を可能にすることになる。特に、本発明は、コーデックタイプシグナリングとその用途に対するソリューションを定義し、これは、AMR−WBの既存の設備と完全な互換性がある一方で、3GPPにおいて任意の新規のビットストリーム埋込音声コーデックの互換性の完全な使用を依然として実現可能にする。
【0015】
本発明の利点を更に説明するために、従来技術の詳細説明を以下に示す。
【0016】
サービスに対する通常のあるいは従来のセッションネゴシエーション手順において、セッション用のコーデック選択が、制御プレーンシグナリング中、典型的には、SIPとSDPの中で実行される。ここで、その重要なことは、動作の後方互換モードを有する新規のコーデックが、既に存在して装備されているセッションネゴシエーションメカニズムを再使用できることである。そうでない場合、既存のコーデックとのビットストリーム相互運用性は使用されないことになる。これは、一致するコーデックタイプあるいはコーデックコンフィグレーションが検出されない場合にはセッションネゴシエーションが失敗することになるからである。
【0017】
基本的には、本発明は、SIP/SDPを使用するセッションネゴシエーション用の既存のシグナリングスキームを再使用し、かつAMR−WBペイロードフォーマットで利用可能なシグナリングの範囲で再使用するための2つのステップによる方法を開示する。基本の概念は、SIP/SDPにおけるセッションを標準AWR−WBセッションとしてセットアップすることであり、これは、場合によっては、後方互換性の程度に依存して制限されたコーデックモード(即ち、すべてのモードあるいはいくつかの選択されたモード)を使用する。続いて、新規のコーデックについての指示がペイロードパケット内に導入され、そうすることで、受信クライアントに、新規のセッションネゴシエーション手順を必要とさせることなく、可能性のある新規のコーデックタイプを識別しかつ利用することを可能にする。
【0018】
本発明の実施形態の説明はAMR−WBペイロードフォーマットで使用可能な構成に依存するので、このペイロードフォーマットの簡単な説明を、図1のRTPパケットを参照しながら以下に示す。このペイロードフォーマットは、AMRとAMR−WBの両方に対して同一である。この詳細については、文献[1]を参照されたい。
【0019】
RTPパケットの最初の12バイトは汎用RTPヘッダであり、AMR専用ペイロードヘッダはCMRビット、Fビット、FTビット及ぶQビットを含んでいる。AMRデータは、特に、この場合には、d(0)、...、d(243)で示される。最後のPビットはパディングビットである。尚、このパケットは、ペイロード内の1つのAMRパケットが12.2kbpsモードで符号化される場合の一例である。また、帯域幅が有効な形式のペイロードフォーマットが使用され、別のオプションでは、いくつかの追加のパディングビットがペイロードフォーマットヘッダ内にある場合にはオクテット配列を使用する。フィールドF、FT及びQは、目次(ToC: Table of Contents(テーブルオブコンテンツ))と呼ばれる1つのエンティティにグループ化される。これは、パケット内の音声フレーム単位で一度に送信される。CMRフィールドは、パケット内に存在する音声フレームがどんなに多くても、各RTPパケットで一度に送信される。ペイロードヘッダ内のAMR固有シグナリングビットは以下のようになる。
【0020】
CMR− コーデックモードリクエスト(codec mode requests)の略称であり、これは、一方向で符号化及び送信を行う場合に使用するパケットの受信機に対する送信機のモードリクエストを符号化する。モードリクエストの符号化は、以下で説明するフレームタイプに従って実行される。
【0021】
F− 別の音声フレームが、現在のToCを記述するフレームに後続するかどうかを示すものである。
【0022】
FT− フレームタイプの略称である。これは、現在のフレームを符号化するために使用されたコーデックモードが何であるかを識別するものである。フレームタイプの符号化は、以下で説明するフレームタイプに従って実行される。
【0023】
Q− フレーム品質インジケータの略称である。これは、フレームがエラーのないものであるかどうかを識別するものである。但し、音声データがIPを使用してエンドツーエンドでトランスポートされる場合、配信されるすべての音声フレームがエラーのないものであるということではない。
【0024】
この実施形態に関連して、RTPパケットの重要なフィールドはCMRフィールドとFTフィールドである。これらのフィールドの両方は、以下の表1及び表2で参照される、AMR[2]とAMR−WB[3]における表を符号化する。
【0025】
【表1】
【0026】
【表2】
【0027】
尚、AMRとAMR−WBの両方で利用可能なフレームタイプが存在し、これは、将来用のために予約されていて、AMRについてはこれはフレームタイプインデックス12から14であり、AMR−WBについてはこれはフレームタイプインデックス10から13である。
【0028】
図2を参照すると、本発明に従う方法の基本的な実施形態は、セルラー通信システムにおいて第1のクライアントと第2のクライアントとの間の改良されたセッションネゴシエーションの方法を開示している。S10で、これら2つのクライアントはセッション用の第1のコーデックタイプについてネゴシエートして同意し、続いて、S20で、セッションを開始して、ネゴシエートした第1のコーデックタイプに従ってメディアデータフレームを交換する。開始されたセッション内でのメディアデータフレームの進行中の交換の間では、S30で、第1のクライアントと第2のクライアントの少なくとも一方が、少なくとも1つの後続のメディアデータフレームで第2のコーデックタイプに対する指示を提供する。そして、提供される指示を受信して認識した際には、S40で、第1のクライアントと第2のクライアントのもう一方が、次のメディアデータフレームにおいて指示された第2のコーデックタイプに切り替える。これによって、2つのクライアントは、第2のコーデックタイプを利用して後続のメディアデータフレームを交換することが可能になる。
【0029】
クライアントは、所定数のステータスタイプインジケータが送信されるまで、あるいは対応するステータスタイプインジケータが受信されるまで、いくつかの連続する音声あるいはメディアデータフレームにステータスタイプインジケータを含める。所定数のインジケータが、対応するインジケータをクライアントが受信することなく送信される場合、クライアントは、インジケータの送信を停止し、最初にネゴシエートしたコーデックタイプを使用して送信を維持する。本発明の実施形態に従えば、クライアントは、後続のデータフレームにおいてリクエストされたコーデックタイプを直ちに切り替えることによって受信するステータスインジケータに応答する。しかしながら、少なくとも1つの対応するコーデックタイプインジケータを送信し、その後、リクエストされたコーデックタイプに切り替えることによって、受信するコーデックタイプインジケータに応答することも等しく可能である。
【0030】
これによって、新規のセッションネゴシエーションを必要とすることがなく、また、新規のコーデック実装デバイスと従来のコーデック実装デバイスとの両方は、最初に交換されたメディアデータフレームにビットストリーム後方互換性があるという条件で、通信することができる。
【0031】
本明細書で記載される本発明の開示の実施形態の重要な要素は、伝統的なセッション制御プロトコルシグナリング、例えば、メディアコンフィグレーション用のセッションをネゴシエートする場合のSIP/SDPと、ペイロードヘッダ内のCMRフィールドでコーデックモード/タイプを信号送信してかつリクエストすることができるものと組み合わせることである。これらの2つのメカニズムを一緒に使用することによって、シグナリングレベルで従来のAMR−WB対応クライアントと相互動作することを脅かすことなく新規の音声コーダの使用をネゴシエートすることが可能になる。それゆえ、このセッションネゴシエーションは3つのステップで実行される。
【0032】
まず、最初に、SIP/SDPを使用して、「通常」のAMR−WBセッションがネゴシエートされる。ここでは、新規の音声コーデックタイプの使用を指示するシグナリングは実行されない。次に、メディアが、クライアントAとクライアントB(及びその逆)との間でフローすることを開始する場合、新規の音声コーデックタイプをサポートするクライアントがAMR−WBタイプテーブル(表)において予約されている符号化の1つを使用してコーデックモードリクエスト(CMR)を送信する。これは、適切な検出を保証するために第1のN個のフレームについて繰り返されることになる。このNは1から∞の範囲で構成設定可能である。数を限定する理由は他の値でCMRが送信される場合の混同を回避するためである。最後に、クライアントが、新規のコーデックタイプのサポートを示すCMRを受信するとすぐに、新規のコーデックのコーデックモードを使用して、一方のクライアントがそれを復号できることを確実にすることを開始することができる。
【0033】
コーデックの使用についての「階層的な」シグナリングに伴う主要な利点は、従前の装備を脅かすことなく新規の音声コーデックの装備を実現可能とし、かつシグナリングプレーン上での任意の更新を必要としないことである。
【0034】
本発明は、AMR−WBセッションをネゴシエートする既存の方法の再使用に基づいている。
【0035】
【表3】
【0036】
表3は、IMSマルチメディアテレフォニーにおける典型的なAMR−WBネゴシエーションの一例を示している。2つの異なるバージョンのAMR−WBが提案されていて、1つは帯域幅有効ペイロードフォーマット(好ましくは)を使用し、もう1つはオクテット配列のペイロードフォーマットを使用する。RTPクロックレートは16kHzに設定され、1つのオーディオチャネルが使用されることになる。
【0037】
本発明に従う新規の音声コーデックに対するセッションネゴシエーションは、後方互換性がすべてのAMR−WBモードに対して配備されている場合に同一のものとみなすことになる。一定のモード(群)だけに対して制限された後方互換性が存在する場合、モードの設定制限が信号通信されることになる。次に、SDPは、例示の指示がモード設定1、2に対してのみサポートすることに変更する。
【0038】
【表4】
【0039】
SDPの使用の種類は、AMR−WBをサポートする任意の2つのクライアントの間のセッションをセットアップし、また、これは、新規の音声コーデックに対する任意のサポートを示すことはない。
【0040】
本発明の実施形態に従うネゴシエーション手順の第2の段階は、表2の空きフレームのタイプのインデックスの使用を行うことになる。この例では、フレームタイプ12は新規の音声コーデックに対するサポートを示すために使用されているが、他のフレームタイプも使用することができる。セッションネゴシエーションのこの部分は、メディアフロー内の帯域内(インバンド:in-band)で実行されるので、ネゴシエーションが実行可能である専用のプロービング(probing)期間が設定される。新規の音声モードがプロービング期間内部で発生していることを示すCMRビットの共同の交換がない場合、ネゴシエーションの第2の段階は失敗していると想定され、また、そのセッションは標準的なAMR−WBセッションとして取り扱われることになる。
【0041】
図3に示される例示のシグナリングスキームでは、全二重セッションが想定されることに注意されたい。この全二重セッションでは、クライアントの両方が音声データを送信し、それによって、自動的に、インバンドCMRビット用のシグナリングチャネルを作成するものである。しかしながら、半二重フローの場合(図4参照)、つまり、メディアが一方向に流れる場合、これは不可能である。これらの場合、CMRビットを搬送する他の手段が、2段階のネゴシエーションを成功させるために使用されることを必要とする。このことを実現するための様々な方法が存在するが、その1つには、3GPP[4]におけるMTSIサービスとの直接互換がある方法が1つ存在する。例示のシグナリングでは、第1のクライアントUE1は一般的なSDP オファー(OFFER:提案) AMR−WBを第2のクライアントUE2へ送信し、これは、200 OKで応答して、提案されるコーデックタイプを受け入れる。続いて、セッションが開始され、メディアデータフレームであるRTP MEDIA(メディア),FT8が、2つのクライアントとの間で交換される。第1のクライアントは、次に、CMR=12を含めることによって、N個の連続するメディアデータフレームに、第2のコーデックタイプ用の指示を含める。コーデックタイプの指示を受信し及び認識することで、第2のユーザ機器UE2は、CMR=12を含むN個のメディアデータフレームで応答する。そして、2つのクライアントは、完全に新規なセッションネゴシエーション手順を開始することなく、現在同意されている第2のコーデックタイプを使用してメディアデータの交換を開始することができる。
【0042】
CMRに基づくネゴシエーションに対する代替のソリューションは、CMRビットを搬送するためにRTCP−APPを使用することである。このメカニズムに伴う更なる利点は、半二重セッションに対しても動作することである。図4及び図5を参照されたい。MTSIは、音声データがフローしている場合のセッション中に使用されるべき適合パラメータを搬送するための専用のAPPレポートを定義している。この手順は、基本的には、いくつかの点を除いて、図5を参照して説明される手順と同一である。半二重セッションは、メディアフローの逆方向にRTCPレポートを送信することになるので、これは、発生するシグナリングに対する可能性を広げる。ここで、CMRリクエスト用のRTCP−APPエンコーディングは、インバンド形式と同一のものであり、そうすることで、同一の行動を確認することができることに注意されたい。RTCPを使用して送信されるCMRリクエストの速度に1つの違いがあり、これは、RTCP送信ルールによって設定される制限の1つである。しかしながら、この制限の最大の結論は、ネゴシエーションの第2の段階に対するセットアップ時間がわずかに延びることであり、最後には同一の正常な速度になる。
【0043】
図6及び図7を参照して、本発明に従う方法の特定の実施形態を説明する。この例では、CMR=12は新規のコーデックに対する代替に相当し、パラメータNを構成設定可能である(ほぼ10程度の値が使用されることになる)。AMR−WBへの拡張、即ち、新規の後方互換音声コーデックは、EVSと呼ばれる。ここで、CMR値は、AMR−WBフレームタイプのインデックスで現在利用可能な任意の値とすることができることに注意されたい。
【0044】
特定の実施形態はAMR−WBとEVSを使用しているが、これは第1のコーデックタイプ及び第2のコーデックタイプの一例であり、同一の方法を他の音声コーデックタイプの組み合わせにも等しく利用することができることは明らかである。
【0045】
最初に、AMR−WBの場合、クライアントあるいはユーザ機器は、第1のコーデックタイプを含むインビテーション(招待)を伴うセッションネゴシエーション信号を送信する。次に、クライアントがそのインビテーションに対する肯定応答(200 OK)を受信する場合、クライアントは、そのネゴシエーションされるコーデックタイプを使用してメディアフレームの送信/交換を開始することを継続する。N個の連続するデータフレームまで、クライアントは第2のコーデックタイプを使用することができることを示すために、CMR=12を含める。同時に、クライアントは、受信する音声パケット、及び対応する指示用のRTPCP−APPレポートの少なくとも一方を監視する。対応する指示を受信すると、クライアントは、第2のコーデックタイプ、例えば、EVSモードに従ってデータフレームを送信することを開始する。このような指示が提供されない場合、クライアントは、従前にネゴシエートされたコーデックタイプ、例えば、AMR−WBモードを維持する。
【0046】
ここで、図6及び図7のフローは一例であり、EVSネゴシエーションの開始は、200 OKが受信された直後であることが必須ではなく、セッション中の任意の時間に実行することができることに注意されたい。また、テスト「CMR=12?」は、厳密なテストにしなければならないわけではない。このことを実行するための代替の方法は、例えば、以下のものがある。
【0047】
1)リモートクライアント(EVS用のCMRリクエストを受信するクライアント)は、EVSフレームタイプ(FT=12あるいは13、あるいはそれ以外)を使用して直ちに開始することができる。このことは、EVSが可能であり、また、「CMR=12」を指示するために「CMR=12」を送信することが必要ないことを宣言することにもなる。
【0048】
2)1つの構成には、「FT=12」が「EVSケイパビリティ用の問い合わせ/招待」であること、また、「FT=13」が確認応答であることを定義することができる。
【0049】
図8を参照して、本発明に従うユーザ機器あるいはクライアントの実施形態を説明する。ユーザ機器あるいはクライアントについての1つの特定の態様は、リクエストされている新規のあるいは第2のコーデックタイプについての指示の受信を、認識して動作することができることが必要であることである。このことのために、ユーザ機器は、信号を送受信することを可能にするための汎用入力/出力ユニットI/O、別のクライアントとのセッション用の第1のコーデックタイプについてネゴシエートしかつ同意するためのネゴシエーションユニット10と、ネゴシエートされた第1のコーデックタイプに従って別のユーザ機器とのセッションを開始し、メディアデータフレームを交換するためのセッションユニット20とを含んでいる。また、クライアントは、開始されたセッション中に、第2のコーデックタイプのための指示を少なくとも1つの後続のメディアデータフレームで提供するためのコーデック切替ユニット30を含んでいる。そして、クライアントは、対応する指示を受信し及び認識すると、次のメディアデータフレームで指示された第2のコーデックタイプへ切り替えるためのユニット40を含み、これによって、第1のクライアントと第2のクライアントに第2のコーデックタイプを利用して後続のメディアデータフレームを交換することを可能にする。つまり、ユーザ機器あるいはクライアントはコーデック切替指示を提供するだけでなく、対応する指示を受信しそれに応答するように適合されている。上述のユニット群は、典型的には、1つ以上のハードウェアプロセッサあるいは、本開示の方法の開示される実施形態のステップ群を実行するように構成されているソフトウェアアルゴリズムによって実現可能である。加えて、上述のクライアントあるいはユーザ機器の機能は、電気通信システム内のノードにおいて実現することができる。
【0050】
開示される方法及び構成に対する前提条件は、データパケット、例えば、RTPパケットが、ビットストリーム埋込後方互換コーデックフォーマットを有することである。本発明はパケット交換システムの内容で説明されるが、回線交換システムにも等しく適用可能である。
【0051】
本発明の効果は、以下のことを含んでいる。
【0052】
本発明の実施形態に従うセッションネゴシエーション用の2段階の方法を使用する利点は、SIP/SDPシグナリングプレーン上で表現される後方互換性によるものである。通常のAMR−WBセッションのように見えるが、これに代えて、新規の音声コーデックを使用する可能性のためのCMRシグナリング「プローブ」となる。CMRビットの特性はこの後方互換性を実現する。これは、従来のデコーダはCMRリクエストあるいは「新規」のFTを伴う受信フレームを理解しない場合、自動的にそれらを却下するからである。
【0053】
文献群
[1] IETF RFC 4867
[2] 3GPP TS26.101、「適合マルチレート(AMR)音声コーデックフレーム構造」
[3] 3GPP TS26.201、「適合マルチレート−ワイドバンド(AMR−WB)音声コーデック、フレーム構造」
[4] 3GPP TS26.114、「IPマルチメディアサブシステム(IMS)、マルチメディアテレフォニー、メディア処理及び対話」
【特許請求の範囲】
【請求項1】
セルラー通信システムにおける第1のクライアントと第2のクライアントとの間でのセッションネゴシエーションを行う方法であって、
前記第1のクライアントと前記第2のクライアントとが、セッション用の第1のコーデックタイプをネゴシエートし、かつ同意するステップと、
前記第1のクライアントと前記第2のクライアントが、前記セッションを開始し、前記第1のコーデックタイプに従ってメディアデータフレームを交換するステップと、
前記開始されたセッション中に、前記第1のクライアントと前記第2のクライアントとの内の少なくとも一方が、少なくとも1つの後続のメディアデータフレームにおける第2のコーデックタイプに対する指示を提供するステップと、
前記指示の受信及び認識に応じて、前記第1のクライアントと前記第2のクライアント内の他方が、次のメディアデータフレームにおいて、前記第2のコーデックタイプに切り替え、それによって、前記第1のクライアントと前記第2のクライアントとが、前記第2のコーデックタイプを利用して後続のメディアデータフレームを交換することを可能にするステップと
を有することを特徴とする方法。
【請求項2】
前記指示を所定数の連続するメディアデータフレームに提供する
ことを特徴とする請求項1に記載の方法。
【請求項3】
前記セッションは全二重セッションを含み、
前記第1のクライアントと前記第2のクライアントの両方は、前記指示を少なくとも1つの後続のメディアデータフレームに提供する
ことを特徴とする請求項1に記載の方法。
【請求項4】
前記セッションは半二重セッションであり、
前記第1のクライアントは、前記指示を後続のメディアデータフレームに提供し、
前記第2のクライアントは、前記指示を少なくとも1つの後続のシグナリング制御データフレームに提供する
ことを特徴とする請求項1に記載の方法。
【請求項5】
前記指示は、交換される前記メディアデータフレーム用のペイロードヘッダに含まれる
ことを特徴とする請求項1に記載の方法。
【請求項6】
前記指示は、前記メディアデータフレームのコーデックタイプリクエストに含まれる
ことを特徴とする請求項5に記載の方法。
【請求項7】
前記第1のクライアントは、前記指示を、交換される前記メディアデータフレームのペイロードに提供し、
前記第2のクライアントは、前記指示を、前記シグナリング制御データフレームのペイロードヘッダに提供する
ことを特徴とする請求項4に記載の方法。
【請求項8】
前記第1のクライアントと前記第2のクライアントの内の他方は、前記第2のコーデックタイプに切り替える前に、提供される指示に対応する指示を少なくとも1つの後続のメディアデータフレームに提供することによって、受信し認識する前記提供される指示に応答する
ことを特徴とする請求項1に記載の方法。
【請求項9】
前記第2のクライアントは、前記指示を伴う所定数のメディアデータフレームを受信した後に、前記第2のコーデックタイプに切り替える
ことを特徴とする請求項8に記載の方法。
【請求項10】
前記セッションは、RTPパケット内に含まれるメディアデータフレームの送信を含んでいる
ことを特徴とする請求項1乃至9のいずれか1項に記載の方法。
【請求項11】
セルラー通信システムにおけるクライアントであって、
別のクライアントとのセッション用の第1のコーデックタイプについてネゴシエートし同意する手段と、
前記セッションを開始し、かつ前記第1のコーデックタイプに従ってメディアデータフレームを交換する手段と、
前記開始されるセッション中に、第2のコーデックタイプに対する指示を少なくとも1つの後続のメディアデータフレームに提供する手段と、
対応する指示の受信及び認識に応じて、次のメディアデータフレームで前記第2のコーデックタイプに切り替える手段であって、それによって、当該クライアントと前記別のクライアントとが前記第2のコーデックタイプを利用して後続のメディアデータフレームを交換することを可能にする、切り替える手段と
を有することを特徴とするクライアント。
【請求項12】
前記提供する手段は、前記指示を所定数の連続するメディアデータフレームに提供するように構成されている
ことを特徴とする請求項11に記載のクライアント。
【請求項13】
前記切り替える手段は、前記第2のコーデックタイプに直ちに切り替えるように構成されている
ことを特徴とする請求項11または12に記載のクライアント。
【請求項14】
前記切り替える手段は、所定数の前記指示を受信しかつ認識した後に、前記第2のコーデックタイプに切り替えるように構成されている
ことを特徴とする請求項11または12に記載のクライアント。
【請求項15】
電気通信システムにおけるノードであって、
請求項11に記載のクライアントを有する
ことを特徴とするノード。
【請求項1】
セルラー通信システムにおける第1のクライアントと第2のクライアントとの間でのセッションネゴシエーションを行う方法であって、
前記第1のクライアントと前記第2のクライアントとが、セッション用の第1のコーデックタイプをネゴシエートし、かつ同意するステップと、
前記第1のクライアントと前記第2のクライアントが、前記セッションを開始し、前記第1のコーデックタイプに従ってメディアデータフレームを交換するステップと、
前記開始されたセッション中に、前記第1のクライアントと前記第2のクライアントとの内の少なくとも一方が、少なくとも1つの後続のメディアデータフレームにおける第2のコーデックタイプに対する指示を提供するステップと、
前記指示の受信及び認識に応じて、前記第1のクライアントと前記第2のクライアント内の他方が、次のメディアデータフレームにおいて、前記第2のコーデックタイプに切り替え、それによって、前記第1のクライアントと前記第2のクライアントとが、前記第2のコーデックタイプを利用して後続のメディアデータフレームを交換することを可能にするステップと
を有することを特徴とする方法。
【請求項2】
前記指示を所定数の連続するメディアデータフレームに提供する
ことを特徴とする請求項1に記載の方法。
【請求項3】
前記セッションは全二重セッションを含み、
前記第1のクライアントと前記第2のクライアントの両方は、前記指示を少なくとも1つの後続のメディアデータフレームに提供する
ことを特徴とする請求項1に記載の方法。
【請求項4】
前記セッションは半二重セッションであり、
前記第1のクライアントは、前記指示を後続のメディアデータフレームに提供し、
前記第2のクライアントは、前記指示を少なくとも1つの後続のシグナリング制御データフレームに提供する
ことを特徴とする請求項1に記載の方法。
【請求項5】
前記指示は、交換される前記メディアデータフレーム用のペイロードヘッダに含まれる
ことを特徴とする請求項1に記載の方法。
【請求項6】
前記指示は、前記メディアデータフレームのコーデックタイプリクエストに含まれる
ことを特徴とする請求項5に記載の方法。
【請求項7】
前記第1のクライアントは、前記指示を、交換される前記メディアデータフレームのペイロードに提供し、
前記第2のクライアントは、前記指示を、前記シグナリング制御データフレームのペイロードヘッダに提供する
ことを特徴とする請求項4に記載の方法。
【請求項8】
前記第1のクライアントと前記第2のクライアントの内の他方は、前記第2のコーデックタイプに切り替える前に、提供される指示に対応する指示を少なくとも1つの後続のメディアデータフレームに提供することによって、受信し認識する前記提供される指示に応答する
ことを特徴とする請求項1に記載の方法。
【請求項9】
前記第2のクライアントは、前記指示を伴う所定数のメディアデータフレームを受信した後に、前記第2のコーデックタイプに切り替える
ことを特徴とする請求項8に記載の方法。
【請求項10】
前記セッションは、RTPパケット内に含まれるメディアデータフレームの送信を含んでいる
ことを特徴とする請求項1乃至9のいずれか1項に記載の方法。
【請求項11】
セルラー通信システムにおけるクライアントであって、
別のクライアントとのセッション用の第1のコーデックタイプについてネゴシエートし同意する手段と、
前記セッションを開始し、かつ前記第1のコーデックタイプに従ってメディアデータフレームを交換する手段と、
前記開始されるセッション中に、第2のコーデックタイプに対する指示を少なくとも1つの後続のメディアデータフレームに提供する手段と、
対応する指示の受信及び認識に応じて、次のメディアデータフレームで前記第2のコーデックタイプに切り替える手段であって、それによって、当該クライアントと前記別のクライアントとが前記第2のコーデックタイプを利用して後続のメディアデータフレームを交換することを可能にする、切り替える手段と
を有することを特徴とするクライアント。
【請求項12】
前記提供する手段は、前記指示を所定数の連続するメディアデータフレームに提供するように構成されている
ことを特徴とする請求項11に記載のクライアント。
【請求項13】
前記切り替える手段は、前記第2のコーデックタイプに直ちに切り替えるように構成されている
ことを特徴とする請求項11または12に記載のクライアント。
【請求項14】
前記切り替える手段は、所定数の前記指示を受信しかつ認識した後に、前記第2のコーデックタイプに切り替えるように構成されている
ことを特徴とする請求項11または12に記載のクライアント。
【請求項15】
電気通信システムにおけるノードであって、
請求項11に記載のクライアントを有する
ことを特徴とするノード。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【公表番号】特表2012−523199(P2012−523199A)
【公表日】平成24年9月27日(2012.9.27)
【国際特許分類】
【出願番号】特願2012−504656(P2012−504656)
【出願日】平成22年4月6日(2010.4.6)
【国際出願番号】PCT/SE2010/050378
【国際公開番号】WO2010/117326
【国際公開日】平成22年10月14日(2010.10.14)
【出願人】(598036300)テレフオンアクチーボラゲット エル エム エリクソン(パブル) (2,266)
【Fターム(参考)】
【公表日】平成24年9月27日(2012.9.27)
【国際特許分類】
【出願日】平成22年4月6日(2010.4.6)
【国際出願番号】PCT/SE2010/050378
【国際公開番号】WO2010/117326
【国際公開日】平成22年10月14日(2010.10.14)
【出願人】(598036300)テレフオンアクチーボラゲット エル エム エリクソン(パブル) (2,266)
【Fターム(参考)】
[ Back to top ]