説明

トラヒック予測方法及び装置及びプログラム

【課題】 トラヒック予測の精度を高め、サンプリングによる処理規模を削減し、かつ、現実的な時間内でトラヒック予測を可能にする。
【解決手段】 本発明は、通信網を介してパケットが流れた時間とパケットのサイズを取得し、パケットデータ記憶手段に格納し、トラヒック量に影響する要因を含む外的要因情報を格納した外的要因情報記憶手段から外的要因情報を抽出し、パケットデータ記憶手段からパケットデータを抽出し、与えられた予測したい時間粒度を用いてトラヒック量予測式を求め、将来の外的要因の予測情報を格納した外的要因予測情報記憶手段から予測したい期間の外的要因のデータを取得して、トラヒック量予測式に適用することにより予測トラヒック量を算出する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、トラヒック予測方法及び装置及びプログラムに係り、特に、通信網上を流れるトラヒック量、および、通信網から得られないデータである外的要因(気象情報やイベント情報など)を用いて、将来のトラヒック量を推定するためトラヒック予測方法及び装置及びプログラムに関する。
【背景技術】
【0002】
通信網上を流れるトラヒック量は大きく変動しており、その要因としては各ユーザが通信網を使うかどうかを決定する要因(カレンダ情報(平日/休日や時間帯)、天気、イベントなど)や、アプリケーションの普及状況等の様々な要因によって決定しており、非常に複雑である。
【0003】
従来の技術として、これらの要因は考慮せず、単純にトラヒック量の時系列データから、回帰分析等で将来のトラヒック量を予測する検討がある。例えば、トラヒックの直近の時系列の変動データを入力として与え、サポートベクタマシンを用いて次の時間でのトラヒック量を推定する方法がある(例えば、非特許文献1参照)。この手法の入力はトラヒック量のみであるが、トラヒック量を変動させる上記の要因は間接的に含まれていることとなる。
【0004】
一方で、アトラクタという定常状態の概念を用いて、時系列のトラヒックデータから、トラヒックがどの範囲で変動するかを求めることで今後のトラヒック量を予測している。この時に、アトラクタを求める際のトラヒックとして、どのデータを与えるかをカレンダの情報を元に決定している(例えば、特許文献1参照)。
【0005】
また、入力としてカレンダ情報と天気の情報を入力として、これらの情報がトラヒック量にどのように影響を与えるかを分析し、重回帰分析法によってトラヒック量の推定を行っている(例えば、非特許文献2参照)。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開平11−96135号公報
【非特許文献】
【0007】
【非特許文献1】Bermolen, P. et al. "Support vector regression for link load prediction"in proceedings of the Telecommunication Networking Workshop on QoS in Multiservice IP Networks, 2008, pp268-273, 2008.
【非特許文献2】秋永和計、金田茂、品川準輝、三浦章、"呼特性と周辺環境特性を用いたトラヒック予測法の提案" 信学技報, NS2005-6, pp.21-24, April 2005.
【発明の概要】
【発明が解決しようとする課題】
【0008】
ユーザが通信網を使うかどうかを決定する要因は多くが非線形である(例えば、気温が1度上昇した際の、トラヒック量の増加量は気温によって異なる事は容易に想像できる)。また、それぞれの要素が複雑に影響しあっている。例えば、『夜の雨の日にはトラヒック量が多くなる』等のケースでは、それぞれ(「夜」、「雨」)が独立で発生した場合よりも、2つの要素が同時に発生した場合のほうがトラヒック量の増加量は多くなる。このように、非線形な複数の要素を同時に考慮しなければ予測精度が向上しないという問題がある。よって、非特許文献2の手法を含む多くの予測手法で使われているような重回帰分析では線形性を仮定しているため精度の良い予測は困難である。
【0009】
本発明は、上記の点に鑑みなされたもので、トラヒック予測の精度を高め、サンプリングによる処理規模を削減し、かつ、現実的な時間内でトラヒック予測が可能なトラヒック予測方法及び装置及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0010】
上記の課題を解決するために、本発明(請求項1)は、 将来のトラヒック量を推定するトラヒック予測方法であって、
トラヒックデータ収集手段が、通信網を介してパケットが流れた時間とパケットのサイズを取得し、パケットデータ記憶手段に格納するトラヒックデータ収集ステップと、
学習手段が、トラヒック量に影響する要因を含む外的要因情報を格納した外的要因情報記憶手段から前記外的要因情報を抽出し、前記パケットデータ記憶手段から前記パケットデータを抽出し、与えられた予測したい時間粒度を用いてトラヒック量予測式を求める学習ステップと、
予測手段が、将来の外的要因の予測情報を格納した外的要因予測情報記憶手段から予測したい期間の外的要因のデータを取得して、前記トラヒック量予測式に適用することにより予測トラヒック量を算出する予測ステップと、を行うことを特徴とする。
【0011】
また、本発明(請求項2)は、前記学習ステップにおいて、
前記パケットデータについて、前記時間粒度の単位で求められたトラヒック量と、前記外的要因情報から求められた外的要因の合計数を特徴ベクトルとする特徴量計算ステップと、
前記特徴ベクトルにK-平均法を適用してサンプル数を削減するサンプル削減ステップと、
前記サンプル削減ステップで削減されたサンプルに対して、前記外的要因情報と前記トラヒック量を用いてカーネル回帰分析を適用して、前記トラヒック量予測式を求めるトラヒック予測式作成ステップと、を含む。
【発明の効果】
【0012】
本発明では、高精度でトラヒック量を予測する手法を提案している。天気やカレンダ情報といった外的要因を使用することで、数日〜数週間先までのトラヒック量を予測する。トラヒック量を予測することができれば、通信網が混雑して品質劣化が起こる可能性を予見できる.その際に、トラヒックエンジニアリング技術やサーバの増設等の対処を行うことで、混雑による影響を事前に抑えることができる。また、どのような条件でトラヒックが増大するかを明らかにすることで、今後の設備設計計画にも寄与する。
【図面の簡単な説明】
【0013】
【図1】本発明の一実施形態におけるトラヒック予測装置の構成図である。
【図2】本発明の一実施形態におけるトラヒックデータ収集部の構成図である。
【図3】本発明の一実施形態におけるトラヒック予測部の学習部の構成図である。
【図4】本発明の一実施形態における学習部の特徴量計算部のフローチャートである。
【図5】本発明の一実施形態における指定した粒度でのトラヒック量集計のイメージである。
【図6】本発明の一実施形態におけるダミー変数のイメージである。
【図7】本発明の一実施形態における学習部のサンプル数削減部のフローチャートである。
【図8】本発明の一実施形態における学習部のカーネル回帰による予測式作成部のフローチャートである。
【図9】本発明の一実施形態におけるトラヒック予測部の予測部の構成図である。
【図10】本発明の一実施形態における特徴空間での分布の様子である。
【発明を実施するための形態】
【0014】
以下図面と共に、本発明の実施の形態を説明する。
【0015】
本発明では、下記の3つの要因を組み合わせることにより、高精度なトラヒック予測を行う。
【0016】
(1) 予測のための入力データ:
入力データに通信網内で得られるトラヒック量の情報だけでなく、気象情報、カレンダ情報、イベント情報などのトラヒック量に影響する要因を通信網の内外から設定することで、トラヒック予測の精度を高めることができる。後述するトラヒック予測装置では、これを外的要因DB101に格納されているものとして説明する。
【0017】
(2)サンプリングによる処理規模の削減:
得られた複数のサンプル点から、代表的な点のみを用いて予測を行うことにより、(3)に示すように計算量がかかる非線形処理にも対応ができるようになる。具体的には、「文献1:市野将嗣、坂野 鋭、小松尚久、"クラスタリングを用いた核非線形相互部分空間法の処理量削減手法、"電子情報通信学会論文誌D、 J90-D、 no.8、pp.2168-2181、(2007.8)」に示す手法を用いることにより、カーネル法を用いた他の手法において、大幅な処理量削減を可能としている。当該手法は、後述する学習部130のサンプル数削減部132に適用される。
【0018】
(3)カーネル回帰によるトラヒック予測:
トラヒックの非線形性や、複数の要素の相関を考慮して予測式を立てるために、カーネル法による高次元への写像を行っている。高次元空間上で、重回帰分析の様な線形の回帰を行い、元の次元に戻すことにより、非線形の処理が可能となる。高次元空間での処理は非常に計算量がかかるが、(2)に示すサンプル削減を行うことにより、現実的な時間内での予測が可能となる。当該処理は、後述する学習部130のカーネル回帰による予測式作成部133に適用される。
【0019】
以下、具体的に説明する。
【0020】
以下の実施形態では、気象情報、カレンダ情報、トラヒック量からインターネットのトラヒック予測を実現するものとして説明する。以下では、気象情報とカレンダ情報を外的要因と呼ぶ。
【0021】
図1は、本発明の一実施形態におけるトラヒック予測装置の構成を示す。
【0022】
同図に示すトラヒック予測装置は、トラヒックデータ収集部110、トラヒック量予測部120、予測トラヒック量表示部150、外的要因DB101、将来の外的要因予測DB103から構成される。
【0023】
トラヒックデータ収集部110は、パケットデータDB102を有し、通信網を介して取得したトラヒックデータを格納する。外的要因DB101は、例えば気象情報ならば気象庁等から取得することで作成する。
【0024】
以下に、トラヒック予測装置の各構成要素について説明する。
【0025】
・トラヒックデータ取得部:
トラヒックデータ取得部110は、トラヒック量と外的要因の関係を学習するために、予測したい箇所に流れるトラヒック量を事前に測定するための機能部である。トラヒックデータ取得部110のブロック図を図2に示す。パケットデータ取得部112では、トラヒック量を取得するため、通信網(インターネット)111を流れるパケット(データの分割単位)それぞれに付いて、そのパケットが流れた時間とパケットの大きさを記録し、パケットデータDB102に逐次格納していく。
【0026】
・トラヒック予測部:
トラヒック予測部120は、既存のデータからトラヒック量を予測する式を設計する学習部130と、予測式を用いて実際に将来のトラヒック量を予測する予測部140に分かれている。
【0027】
まず、学習部130について説明する。学習部130のブロック図を図3に示す.学習部130は、特徴量計算部131、サンプル数削減部132、予測式作成部133から構成され、予測したい時間粒度を与えることにより、パケットデータDB101と外的要因DB102からデータを抽出しトラヒック量予測式を設計する。
特徴量計算部131は、トラヒックデータより特徴量を計算する。特徴量計算部131においては、外的要因DB101、パケットデータDB102から指定した予測粒度でトラヒック量を予測するための集計を行う。その動作を図4に示す。
【0028】
ステップ101) まず、特徴量計算部131は、外部要因DB101、パケットデータDB102から、予測に用いるため、過去1年分のデータを取得する(この例では1年としているが、実際には計算量・精度から適切な期間を設定する必要がある)。
【0029】
ステップ102) 次に、1年分のデータを指定した予測粒度の単位でトラヒック量と外的要因を集計する。例えば、図5のa,b,cのように、1日のトラヒック負荷を予測する場合には、1日毎にトラヒック量を合計する。外的要因に関して、数量で表すことができるものについては抽出区間に対応するものを算出する。数量で表すことができない外的要因については、図6に示すようにダミー変数で表現する。
【0030】
ステップ103) これにより、求めたトラヒック量、外的要因を特徴ベクトルとして出力する。トラヒック量、外的要因の合計数Nが各ベクトルの次元数となる。ベクトルの数自体は、1年を予測粒度で割った数計算される(1日単位でのトラヒック量を予測する場合には365個のN次元ベクトルが計算される)。
【0031】
次に、学習部130のサンプル数削減部132では、特徴ベクトル(サンプル)の削減を行うためにK-平均量を利用する。これにより、現実的な時間内での予測が可能となる。
【0032】
サンプル数削減部132の動作を図7に示す。
【0033】
クラスタ中心の数(この数が、最終的に削減されたサンプル数となる)をKとする。各サンプルはK個あるどれかのクラスに分類される。各クラスCjに分類されるサンプルの数をN(j=1,…,K)とし、各クラスCj (j=1,…,K)のクラスタ中心を
【0034】
【数1】

とする。以下の処理を行うことで、与えたサンプルを代表するのに適切なK個のクラスタ中心を得ることが出来る。ただし、
【0035】
【数2】

はi番目のサンプルである.
ステップ201) m個のサンプル集合
【0036】
【数3】

からj個のクラスタ中心をランダムに選ぶ。
【0037】
ステップ202) m個のサンプル
【0038】
【数4】

それぞれに対して、
【0039】
【数5】

(あるサンプルデータとクラス中心の距離の2乗)が最小になるクラスタCjへクラス分けする。
【0040】
ステップ203) サンプルデータ全体で適切なクラスに分けられているかの指標(=全てのサンプルデータのクラス中心との距離の2乗。小さいほど良い))
【0041】
【数6】

を計算する。
【0042】
ステップ204) ステップ203で求められた距離の和の2乗の値が閾値ε以下であれば適切なクラスタ中心が得られたとして、ステップ206に移行し、閾値εより大きければより良いクラスタ中心を得るためにステップ205に移行する。
【0043】
ステップ205) 各クラスタについてクラスタ中心
【0044】
【数7】

を再計算し、クラスタ中心を更新してステップ203に移行する。
【0045】
ステップ206) ステップ203で求められたクラスタ中心
【0046】
【数8】

を学習データとしてメモリ(図示せず)に保存する。
【0047】
ステップ207) ユーザからの入力で指定されたサンプル数K個にサンプル削減されたクラスタ中心のN次元ベクトルを出力する。
【0048】
上記の処理が終了すると、m個のデータを代表するK個の点
【0049】
【数9】

が求められるのでこれを削減されたサンプルとして利用する.
次に、学習部130のカーネル回帰によるトラヒック予測式作成部133について説明する。
【0050】
ステップ102において事前に測定したトラヒック量と外的要因を用いて、トラヒック量(目的変数)と外的要因(説明変数)の関係を表す回帰式を求める。
【0051】
トラヒック量と外的要因を各軸に取った空間(以下、「特徴空間」とす記す)において、トラヒックの分布は非線形性を持つことが考えられる。これは、外的要因に依存して特徴空間上でとり得る状態が多く、さらに予測に使用する外的要因の数を増やすについて自由度も大きくなるためである。特徴空間での分布の様子の一例を図10に示す。
【0052】
そこで、本発明ではカーネル回帰分析を組み合わせたトラヒック予測手法を提案する.カーネル回帰分析とは、非線形関数により各点をより高次の空間へ写像して回帰分析を行うにより元の次元空間での非線形回帰分析を行うことができる手法である。
【0053】
図8にカーネル回帰によるトラヒック予測式作成部133のフローを示す。
【0054】
ステップ301) サンプル数削減部132によりサンプル削減された特徴ベクトル
【0055】
【数10】

を入力する。
【0056】
ステップ302) 入力されたサンプル削減された特徴ベクトルをメモリ(図示せず)に格納する。
【0057】
ステップ303) 使用するカーネル関数kを選択する。
【0058】
ステップ304) カーネル関数の中にあるカーネルパラメータの値を設定する。
【0059】
ステップ305) ステップ302で保持されているサンプル削減された特徴ベクトルとカーネルパラメータを用いて予測式を生成し、出力する。
【0060】
具体的には以下の様に回帰モデルを表すことができる。
【0061】
【数11】

ただし、
【0062】
【数12】


【0063】
【数13】

における予測値、
【0064】
【数14】

はカーネル関数、
【0065】
【数15】

は事前に測定した各サンプルのうち、それぞれのクラスタに所属しているトラヒック量の平均値である。
【0066】
次に、トラヒック予測部120の予測部140について説明する。
【0067】
図9に予測部140の構成を示す。
【0068】
予測部140は、特徴量計算部141、予測処理部142から構成される。
【0069】
特徴量計算部141は、状来の外的要因予測DB103から予測したい期間の外的要因のデータを取得する。取得後、数量で表すことができるものについては抽出区間に対応する特徴量を算出する。数量で表すことができない外的要因については、図6に示すようにダミー変数で表現する。そして、予測処理部142は、特徴量を学習部130で求められた予測式(1)に代入し、予測値を計算する。
【0070】
なお、上記の実施の形態におけるトラヒックデータ収集部110、トラヒック予測部120の動作をプログラムとして構築し、トラヒック予測装置として利用されるコンピュータにインストールして実行させる、または、ネットワークを介して流通させることも可能である。
【0071】
本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において種々変更・応用が可能である。
【符号の説明】
【0072】
100 トラヒック予測装置
101 外的要因DB
102 パケットデータDB
103 将来の外的要因予測DB
110 トラヒックデータ収集部
120 トラヒック予測部
130 学習部
131 特徴量計算部
132 サンプル数削減部
133 カーネル回帰による予測式作成部
140 予測部
141 特徴量計算部
142 予測処理部
150 予測トラヒック量表示部

【特許請求の範囲】
【請求項1】
将来のトラヒック量を推定するトラヒック予測方法であって、
トラヒックデータ収集手段が、通信網を介してパケットが流れた時間とパケットのサイズを取得し、パケットデータ記憶手段に格納するトラヒックデータ収集ステップと、
学習手段が、トラヒック量に影響する要因を含む外的要因情報を格納した外的要因情報記憶手段から前記外的要因情報を抽出し、前記パケットデータ記憶手段から前記パケットデータを抽出し、与えられた予測したい時間粒度を用いてトラヒック量予測式を求める学習ステップと、
予測手段が、将来の外的要因の予測情報を格納した外的要因予測情報記憶手段から予測したい期間の外的要因のデータを取得して、前記トラヒック量予測式に適用することにより予測トラヒック量を算出する予測ステップと、
を行うことを特徴とするトラヒック予測方法。
【請求項2】
前記学習ステップにおいて、
前記パケットデータについて、前記時間粒度の単位で求められたトラヒック量と、前記外的要因情報から求められた外的要因の合計数を特徴ベクトルとする特徴量計算ステップと、
前記特徴ベクトルにK-平均法を適用してサンプル数を削減するサンプル削減ステップと、
前記サンプル削減ステップで削減されたサンプルに対して、前記外的要因情報と前記トラヒック量を用いてカーネル回帰分析を適用して、前記トラヒック量予測式を求めるトラヒック予測式作成ステップと、
を含む請求項1記載のトラヒック予測方法。
【請求項3】
将来のトラヒック量を推定するトラヒック予測装置であって、
トラヒック量に影響する要因を含む外的要因情報を格納した外的要因情報記憶手段と、
将来の外的要因の予測情報を格納した外的要因予測情報記憶手段と、
通信網を介してパケットが流れた時間とパケットのサイズを取得し、パケットデータ記憶手段に格納するトラヒックデータ収集手段と、
前記外的要因情報記憶手段から前記外的要因情報を抽出し、前記パケットデータ記憶手段から前記パケットデータを抽出し、与えられた予測したい時間粒度を用いてトラヒック量予測式を求める学習手段と、
前記外的要因予測情報記憶手段から予測したい期間の外的要因のデータを取得して、前記トラヒック量予測式に適用することにより予測トラヒック量を算出する予測手段と、
を有することを特徴とするトラヒック予測装置。
【請求項4】
前記学習手段は、
前記パケットデータについて、前記時間粒度の単位で求められたトラヒック量と、前記外的要因情報から求められた外的要因の合計数を特徴ベクトルとする特徴量計算手段と、
前記特徴ベクトルにK-平均法を適用してサンプル数を削減するサンプル削減手段と、
前記サンプル削減手段で削減されたサンプルに対して、前記外的要因情報と前記トラヒック量を用いてカーネル回帰分析を適用して、前記トラヒック量予測式を求めるトラヒック予測式作成手段と、
を含む請求項3記載のトラヒック予測装置。
【請求項5】
コンピュータを、
請求項3または4に記載のトラヒック予測装置の各手段として機能させるためのトラヒック予測プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate


【公開番号】特開2012−253445(P2012−253445A)
【公開日】平成24年12月20日(2012.12.20)
【国際特許分類】
【出願番号】特願2011−122599(P2011−122599)
【出願日】平成23年5月31日(2011.5.31)
【出願人】(000004226)日本電信電話株式会社 (13,992)
【出願人】(899000068)学校法人早稲田大学 (602)
【Fターム(参考)】