トラヒック予測方法及び装置及びプログラム

【課題】トラヒック予測の精度を高め、サンプリングによる処理規模を削減し、かつ、現実的な時間内でトラヒック予測を可能にする。
【解決手段】本発明は、通信網を介してパケットが流れた時間とパケットのサイズを取得し、パケットデータ記憶手段に格納し、トラヒック量に影響する要因を含む外的要因情報を格納した外的要因情報記憶手段から外的要因情報を抽出し、パケットデータ記憶手段からパケットデータを抽出し、与えられた予測したい時間粒度を用いてトラヒック量予測式を求め、将来の外的要因の予測情報を格納した外的要因予測情報記憶手段から予測したい期間の外的要因のデータを取得して、トラヒック量予測式に適用することにより予測トラヒック量を算出する。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、トラヒック予測方法及び装置及びプログラムに係り、特に、通信網上を流れるトラヒック量、および、通信網から得られないデータである外的要因(気象情報やイベント情報など)を用いて、将来のトラヒック量を推定するためトラヒック予測方法及び装置及びプログラムに関する。
【背景技術】
【０００２】
通信網上を流れるトラヒック量は大きく変動しており、その要因としては各ユーザが通信網を使うかどうかを決定する要因(カレンダ情報(平日/休日や時間帯)、天気、イベントなど)や、アプリケーションの普及状況等の様々な要因によって決定しており、非常に複雑である。
【０００３】
従来の技術として、これらの要因は考慮せず、単純にトラヒック量の時系列データから、回帰分析等で将来のトラヒック量を予測する検討がある。例えば、トラヒックの直近の時系列の変動データを入力として与え、サポートベクタマシンを用いて次の時間でのトラヒック量を推定する方法がある(例えば、非特許文献１参照)。この手法の入力はトラヒック量のみであるが、トラヒック量を変動させる上記の要因は間接的に含まれていることとなる。
【０００４】
一方で、アトラクタという定常状態の概念を用いて、時系列のトラヒックデータから、トラヒックがどの範囲で変動するかを求めることで今後のトラヒック量を予測している。この時に、アトラクタを求める際のトラヒックとして、どのデータを与えるかをカレンダの情報を元に決定している（例えば、特許文献１参照）。
【０００５】
また、入力としてカレンダ情報と天気の情報を入力として、これらの情報がトラヒック量にどのように影響を与えるかを分析し、重回帰分析法によってトラヒック量の推定を行っている(例えば、非特許文献２参照)。
【先行技術文献】
【特許文献】
【０００６】
【特許文献１】特開平１１−９６１３５号公報
【非特許文献】
【０００７】
【非特許文献１】Bermolen, P. et al. "Support vector regression for link load prediction"in proceedings of the Telecommunication Networking Workshop on QoS in Multiservice IP Networks, 2008, pp268-273, 2008.
【非特許文献２】秋永和計、金田茂、品川準輝、三浦章、"呼特性と周辺環境特性を用いたトラヒック予測法の提案" 信学技報, NS2005-6, pp.21-24, April 2005.
【発明の概要】
【発明が解決しようとする課題】
【０００８】
ユーザが通信網を使うかどうかを決定する要因は多くが非線形である(例えば、気温が1度上昇した際の、トラヒック量の増加量は気温によって異なる事は容易に想像できる)。また、それぞれの要素が複雑に影響しあっている。例えば、『夜の雨の日にはトラヒック量が多くなる』等のケースでは、それぞれ（「夜」、「雨」）が独立で発生した場合よりも、２つの要素が同時に発生した場合のほうがトラヒック量の増加量は多くなる。このように、非線形な複数の要素を同時に考慮しなければ予測精度が向上しないという問題がある。よって、非特許文献２の手法を含む多くの予測手法で使われているような重回帰分析では線形性を仮定しているため精度の良い予測は困難である。
【０００９】
本発明は、上記の点に鑑みなされたもので、トラヒック予測の精度を高め、サンプリングによる処理規模を削減し、かつ、現実的な時間内でトラヒック予測が可能なトラヒック予測方法及び装置及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【００１０】
上記の課題を解決するために、本発明（請求項１）は、将来のトラヒック量を推定するトラヒック予測方法であって、
トラヒックデータ収集手段が、通信網を介してパケットが流れた時間とパケットのサイズを取得し、パケットデータ記憶手段に格納するトラヒックデータ収集ステップと、
学習手段が、トラヒック量に影響する要因を含む外的要因情報を格納した外的要因情報記憶手段から前記外的要因情報を抽出し、前記パケットデータ記憶手段から前記パケットデータを抽出し、与えられた予測したい時間粒度を用いてトラヒック量予測式を求める学習ステップと、
予測手段が、将来の外的要因の予測情報を格納した外的要因予測情報記憶手段から予測したい期間の外的要因のデータを取得して、前記トラヒック量予測式に適用することにより予測トラヒック量を算出する予測ステップと、を行うことを特徴とする。
【００１１】
また、本発明(請求項２)は、前記学習ステップにおいて、
前記パケットデータについて、前記時間粒度の単位で求められたトラヒック量と、前記外的要因情報から求められた外的要因の合計数を特徴ベクトルとする特徴量計算ステップと、
前記特徴ベクトルにK-平均法を適用してサンプル数を削減するサンプル削減ステップと、
前記サンプル削減ステップで削減されたサンプルに対して、前記外的要因情報と前記トラヒック量を用いてカーネル回帰分析を適用して、前記トラヒック量予測式を求めるトラヒック予測式作成ステップと、を含む。
【発明の効果】
【００１２】
本発明では、高精度でトラヒック量を予測する手法を提案している。天気やカレンダ情報といった外的要因を使用することで、数日〜数週間先までのトラヒック量を予測する。トラヒック量を予測することができれば、通信網が混雑して品質劣化が起こる可能性を予見できる．その際に、トラヒックエンジニアリング技術やサーバの増設等の対処を行うことで、混雑による影響を事前に抑えることができる。また、どのような条件でトラヒックが増大するかを明らかにすることで、今後の設備設計計画にも寄与する。
【図面の簡単な説明】
【００１３】
【図１】本発明の一実施形態におけるトラヒック予測装置の構成図である。
【図２】本発明の一実施形態におけるトラヒックデータ収集部の構成図である。
【図３】本発明の一実施形態におけるトラヒック予測部の学習部の構成図である。
【図４】本発明の一実施形態における学習部の特徴量計算部のフローチャートである。
【図５】本発明の一実施形態における指定した粒度でのトラヒック量集計のイメージである。
【図６】本発明の一実施形態におけるダミー変数のイメージである。
【図７】本発明の一実施形態における学習部のサンプル数削減部のフローチャートである。
【図８】本発明の一実施形態における学習部のカーネル回帰による予測式作成部のフローチャートである。
【図９】本発明の一実施形態におけるトラヒック予測部の予測部の構成図である。
【図１０】本発明の一実施形態における特徴空間での分布の様子である。
【発明を実施するための形態】
【００１４】
以下図面と共に、本発明の実施の形態を説明する。
【００１５】
本発明では、下記の３つの要因を組み合わせることにより、高精度なトラヒック予測を行う。
【００１６】
（１）予測のための入力データ：
入力データに通信網内で得られるトラヒック量の情報だけでなく、気象情報、カレンダ情報、イベント情報などのトラヒック量に影響する要因を通信網の内外から設定することで、トラヒック予測の精度を高めることができる。後述するトラヒック予測装置では、これを外的要因ＤＢ１０１に格納されているものとして説明する。
【００１７】
（２）サンプリングによる処理規模の削減：
得られた複数のサンプル点から、代表的な点のみを用いて予測を行うことにより、（３）に示すように計算量がかかる非線形処理にも対応ができるようになる。具体的には、「文献１：市野将嗣、坂野鋭、小松尚久、"クラスタリングを用いた核非線形相互部分空間法の処理量削減手法、"電子情報通信学会論文誌D、 J90-D、 no.8、pp.2168-2181、（2007.8）」に示す手法を用いることにより、カーネル法を用いた他の手法において、大幅な処理量削減を可能としている。当該手法は、後述する学習部１３０のサンプル数削減部１３２に適用される。
【００１８】
（３）カーネル回帰によるトラヒック予測：
トラヒックの非線形性や、複数の要素の相関を考慮して予測式を立てるために、カーネル法による高次元への写像を行っている。高次元空間上で、重回帰分析の様な線形の回帰を行い、元の次元に戻すことにより、非線形の処理が可能となる。高次元空間での処理は非常に計算量がかかるが、（２）に示すサンプル削減を行うことにより、現実的な時間内での予測が可能となる。当該処理は、後述する学習部１３０のカーネル回帰による予測式作成部１３３に適用される。
【００１９】
以下、具体的に説明する。
【００２０】
以下の実施形態では、気象情報、カレンダ情報、トラヒック量からインターネットのトラヒック予測を実現するものとして説明する。以下では、気象情報とカレンダ情報を外的要因と呼ぶ。
【００２１】
図１は、本発明の一実施形態におけるトラヒック予測装置の構成を示す。
【００２２】
同図に示すトラヒック予測装置は、トラヒックデータ収集部１１０、トラヒック量予測部１２０、予測トラヒック量表示部１５０、外的要因ＤＢ１０１、将来の外的要因予測ＤＢ１０３から構成される。
【００２３】
トラヒックデータ収集部１１０は、パケットデータＤＢ１０２を有し、通信網を介して取得したトラヒックデータを格納する。外的要因ＤＢ１０１は、例えば気象情報ならば気象庁等から取得することで作成する。
【００２４】
以下に、トラヒック予測装置の各構成要素について説明する。
【００２５】
・トラヒックデータ取得部：
トラヒックデータ取得部１１０は、トラヒック量と外的要因の関係を学習するために、予測したい箇所に流れるトラヒック量を事前に測定するための機能部である。トラヒックデータ取得部１１０のブロック図を図２に示す。パケットデータ取得部１１２では、トラヒック量を取得するため、通信網（インターネット）１１１を流れるパケット(データの分割単位)それぞれに付いて、そのパケットが流れた時間とパケットの大きさを記録し、パケットデータDB１０２に逐次格納していく。
【００２６】
・トラヒック予測部：
トラヒック予測部１２０は、既存のデータからトラヒック量を予測する式を設計する学習部１３０と、予測式を用いて実際に将来のトラヒック量を予測する予測部１４０に分かれている。
【００２７】
まず、学習部１３０について説明する。学習部１３０のブロック図を図３に示す．学習部１３０は、特徴量計算部１３１、サンプル数削減部１３２、予測式作成部１３３から構成され、予測したい時間粒度を与えることにより、パケットデータDB１０１と外的要因DB１０２からデータを抽出しトラヒック量予測式を設計する。
特徴量計算部１３１は、トラヒックデータより特徴量を計算する。特徴量計算部１３１においては、外的要因DB１０１、パケットデータDB１０２から指定した予測粒度でトラヒック量を予測するための集計を行う。その動作を図４に示す。
【００２８】
ステップ１０１）まず、特徴量計算部１３１は、外部要因DB１０１、パケットデータDB１０２から、予測に用いるため、過去1年分のデータを取得する(この例では1年としているが、実際には計算量・精度から適切な期間を設定する必要がある)。
【００２９】
ステップ１０２）次に、1年分のデータを指定した予測粒度の単位でトラヒック量と外的要因を集計する。例えば、図５のａ，ｂ，ｃのように、1日のトラヒック負荷を予測する場合には、1日毎にトラヒック量を合計する。外的要因に関して、数量で表すことができるものについては抽出区間に対応するものを算出する。数量で表すことができない外的要因については、図６に示すようにダミー変数で表現する。
【００３０】
ステップ１０３）これにより、求めたトラヒック量、外的要因を特徴ベクトルとして出力する。トラヒック量、外的要因の合計数Nが各ベクトルの次元数となる。ベクトルの数自体は、1年を予測粒度で割った数計算される(1日単位でのトラヒック量を予測する場合には365個のN次元ベクトルが計算される)。
【００３１】
次に、学習部１３０のサンプル数削減部１３２では、特徴ベクトル（サンプル）の削減を行うためにK-平均量を利用する。これにより、現実的な時間内での予測が可能となる。
【００３２】
サンプル数削減部１３２の動作を図７に示す。
【００３３】
クラスタ中心の数(この数が、最終的に削減されたサンプル数となる)をＫとする。各サンプルはＫ個あるどれかのクラスに分類される。各クラスＣ_jに分類されるサンプルの数をN_ｊ(ｊ=1，…，Ｋ)とし、各クラスＣ_j （ｊ＝１，…，Ｋ）のクラスタ中心を
【００３４】
【数１】

とする。以下の処理を行うことで、与えたサンプルを代表するのに適切なK個のクラスタ中心を得ることが出来る。ただし、
【００３５】
【数２】

はi番目のサンプルである．
ステップ２０１） m個のサンプル集合
【００３６】
【数３】

からj個のクラスタ中心をランダムに選ぶ。
【００３７】
ステップ２０２）ｍ個のサンプル
【００３８】
【数４】

それぞれに対して、
【００３９】
【数５】

（あるサンプルデータとクラス中心の距離の2乗)が最小になるクラスタＣ_jへクラス分けする。
【００４０】
ステップ２０３）サンプルデータ全体で適切なクラスに分けられているかの指標（＝全てのサンプルデータのクラス中心との距離の2乗。小さいほど良い)）
【００４１】
【数６】

を計算する。
【００４２】
ステップ２０４）ステップ２０３で求められた距離の和の２乗の値が閾値ε以下であれば適切なクラスタ中心が得られたとして、ステップ２０６に移行し、閾値εより大きければより良いクラスタ中心を得るためにステップ２０５に移行する。
【００４３】
ステップ２０５）各クラスタについてクラスタ中心
【００４４】
【数７】

を再計算し、クラスタ中心を更新してステップ２０３に移行する。
【００４５】
ステップ２０６）ステップ２０３で求められたクラスタ中心
【００４６】
【数８】

を学習データとしてメモリ(図示せず)に保存する。
【００４７】
ステップ２０７）ユーザからの入力で指定されたサンプル数K個にサンプル削減されたクラスタ中心のN次元ベクトルを出力する。
【００４８】
上記の処理が終了すると、m個のデータを代表するK個の点
【００４９】
【数９】

が求められるのでこれを削減されたサンプルとして利用する．
次に、学習部１３０のカーネル回帰によるトラヒック予測式作成部１３３について説明する。
【００５０】
ステップ１０２において事前に測定したトラヒック量と外的要因を用いて、トラヒック量(目的変数)と外的要因(説明変数)の関係を表す回帰式を求める。
【００５１】
トラヒック量と外的要因を各軸に取った空間(以下、「特徴空間」とす記す)において、トラヒックの分布は非線形性を持つことが考えられる。これは、外的要因に依存して特徴空間上でとり得る状態が多く、さらに予測に使用する外的要因の数を増やすについて自由度も大きくなるためである。特徴空間での分布の様子の一例を図１０に示す。
【００５２】
そこで、本発明ではカーネル回帰分析を組み合わせたトラヒック予測手法を提案する．カーネル回帰分析とは、非線形関数により各点をより高次の空間へ写像して回帰分析を行うにより元の次元空間での非線形回帰分析を行うことができる手法である。
【００５３】
図８にカーネル回帰によるトラヒック予測式作成部１３３のフローを示す。
【００５４】
ステップ３０１）サンプル数削減部１３２によりサンプル削減された特徴ベクトル
【００５５】
【数１０】

を入力する。
【００５６】
ステップ３０２）入力されたサンプル削減された特徴ベクトルをメモリ（図示せず）に格納する。
【００５７】
ステップ３０３）使用するカーネル関数ｋを選択する。
【００５８】
ステップ３０４）カーネル関数の中にあるカーネルパラメータの値を設定する。
【００５９】
ステップ３０５）ステップ３０２で保持されているサンプル削減された特徴ベクトルとカーネルパラメータを用いて予測式を生成し、出力する。
【００６０】
具体的には以下の様に回帰モデルを表すことができる。
【００６１】
【数１１】

ただし、
【００６２】
【数１２】

は
【００６３】
【数１３】

における予測値、
【００６４】
【数１４】

はカーネル関数、
【００６５】
【数１５】

は事前に測定した各サンプルのうち、それぞれのクラスタに所属しているトラヒック量の平均値である。
【００６６】
次に、トラヒック予測部１２０の予測部１４０について説明する。
【００６７】
図９に予測部１４０の構成を示す。
【００６８】
予測部１４０は、特徴量計算部１４１、予測処理部１４２から構成される。
【００６９】
特徴量計算部１４１は、状来の外的要因予測ＤＢ１０３から予測したい期間の外的要因のデータを取得する。取得後、数量で表すことができるものについては抽出区間に対応する特徴量を算出する。数量で表すことができない外的要因については、図６に示すようにダミー変数で表現する。そして、予測処理部１４２は、特徴量を学習部１３０で求められた予測式（１）に代入し、予測値を計算する。
【００７０】
なお、上記の実施の形態におけるトラヒックデータ収集部１１０、トラヒック予測部１２０の動作をプログラムとして構築し、トラヒック予測装置として利用されるコンピュータにインストールして実行させる、または、ネットワークを介して流通させることも可能である。
【００７１】
本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において種々変更・応用が可能である。
【符号の説明】
【００７２】
１００トラヒック予測装置
１０１外的要因ＤＢ
１０２パケットデータＤＢ
１０３将来の外的要因予測ＤＢ
１１０トラヒックデータ収集部
１２０トラヒック予測部
１３０学習部
１３１特徴量計算部
１３２サンプル数削減部
１３３カーネル回帰による予測式作成部
１４０予測部
１４１特徴量計算部
１４２予測処理部
１５０予測トラヒック量表示部

【特許請求の範囲】
【請求項１】
将来のトラヒック量を推定するトラヒック予測方法であって、
トラヒックデータ収集手段が、通信網を介してパケットが流れた時間とパケットのサイズを取得し、パケットデータ記憶手段に格納するトラヒックデータ収集ステップと、
学習手段が、トラヒック量に影響する要因を含む外的要因情報を格納した外的要因情報記憶手段から前記外的要因情報を抽出し、前記パケットデータ記憶手段から前記パケットデータを抽出し、与えられた予測したい時間粒度を用いてトラヒック量予測式を求める学習ステップと、
予測手段が、将来の外的要因の予測情報を格納した外的要因予測情報記憶手段から予測したい期間の外的要因のデータを取得して、前記トラヒック量予測式に適用することにより予測トラヒック量を算出する予測ステップと、
を行うことを特徴とするトラヒック予測方法。
【請求項２】
前記学習ステップにおいて、
前記パケットデータについて、前記時間粒度の単位で求められたトラヒック量と、前記外的要因情報から求められた外的要因の合計数を特徴ベクトルとする特徴量計算ステップと、
前記特徴ベクトルにK-平均法を適用してサンプル数を削減するサンプル削減ステップと、
前記サンプル削減ステップで削減されたサンプルに対して、前記外的要因情報と前記トラヒック量を用いてカーネル回帰分析を適用して、前記トラヒック量予測式を求めるトラヒック予測式作成ステップと、
を含む請求項１記載のトラヒック予測方法。
【請求項３】
将来のトラヒック量を推定するトラヒック予測装置であって、
トラヒック量に影響する要因を含む外的要因情報を格納した外的要因情報記憶手段と、
将来の外的要因の予測情報を格納した外的要因予測情報記憶手段と、
通信網を介してパケットが流れた時間とパケットのサイズを取得し、パケットデータ記憶手段に格納するトラヒックデータ収集手段と、
前記外的要因情報記憶手段から前記外的要因情報を抽出し、前記パケットデータ記憶手段から前記パケットデータを抽出し、与えられた予測したい時間粒度を用いてトラヒック量予測式を求める学習手段と、
前記外的要因予測情報記憶手段から予測したい期間の外的要因のデータを取得して、前記トラヒック量予測式に適用することにより予測トラヒック量を算出する予測手段と、
を有することを特徴とするトラヒック予測装置。
【請求項４】
前記学習手段は、
前記パケットデータについて、前記時間粒度の単位で求められたトラヒック量と、前記外的要因情報から求められた外的要因の合計数を特徴ベクトルとする特徴量計算手段と、
前記特徴ベクトルにK-平均法を適用してサンプル数を削減するサンプル削減手段と、
前記サンプル削減手段で削減されたサンプルに対して、前記外的要因情報と前記トラヒック量を用いてカーネル回帰分析を適用して、前記トラヒック量予測式を求めるトラヒック予測式作成手段と、
を含む請求項３記載のトラヒック予測装置。
【請求項５】
コンピュータを、
請求項３または４に記載のトラヒック予測装置の各手段として機能させるためのトラヒック予測プログラム。

【図１】