トラヒック分析モデルの構築方法、装置および構築プログラムならびにその記憶媒体
【課題】ネットワークに収容済の既存ユーザの属性情報および実績トラヒックに基づいて、任意のユーザのトラヒック特性を、そのユーザ属性およびカレンダ属性から分析するトラヒック分析モデルの構築方法および装置を提供する。
【解決手段】トラヒック特性分析部103は、通常負荷に分類された単位期間のトラヒック特性を分析する。トラヒック分析教師データ生成部104は、トラヒック量が通常負荷に分類された各単位期間に関して、そのユーザ属性、カレンダ属性およびトラヒック特性のカテゴリ分類結果の対応関係をトラヒック分析用の教師データとして登録する。トラヒック分析モデル構築部106は、教師データに基づいて、任意のユーザの任意のカレンダ属性に対応した複数のトラヒック特性を各ユーザのユーザ属性およびカレンダ属性から分析するトラヒック分析モデルを構築する。
【解決手段】トラヒック特性分析部103は、通常負荷に分類された単位期間のトラヒック特性を分析する。トラヒック分析教師データ生成部104は、トラヒック量が通常負荷に分類された各単位期間に関して、そのユーザ属性、カレンダ属性およびトラヒック特性のカテゴリ分類結果の対応関係をトラヒック分析用の教師データとして登録する。トラヒック分析モデル構築部106は、教師データに基づいて、任意のユーザの任意のカレンダ属性に対応した複数のトラヒック特性を各ユーザのユーザ属性およびカレンダ属性から分析するトラヒック分析モデルを構築する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ネットワークに収容済の既存ユーザの属性情報および実績トラヒックに基づいて、任意のユーザのトラヒック特性を、その属性情報に基づいて分析するトラヒック分析モデルの構築方法、装置および構築プログラムならびにその記憶媒体に関する。
【背景技術】
【0002】
既設のネットワークに新規ユーザを収容するための収容設計、あるいは新規にネットワークを構築する際の設備設計では、ネットワークに新規に収容するユーザのトラヒック特性を正確に分析することが必要不可欠となる。
【0003】
非特許文献1には、各既存ユーザの日次トラヒック変動(解像度:30分)を、クラスタリング分析技術により、その変動の特徴に応じて分類(カテゴリ化)する技術が開示されている。
【0004】
非特許文献2には、上記した文献1の分類手法で得られたカテゴリと個々のトラヒック変動との対応関係を教師データとして、トラヒック変動データから、同トラヒックが属するカテゴリを予測する技術が開示されている。
【0005】
非特許文献3では、ダイヤルアップユーザおよびADSL回線ユーザのトラヒック特性を、アクセス回線の違いに着目して分析し、アクセス回線速度に殆ど影響を受けない特性(TCPセッション継続時間、TCPコネクションレートなど)と、影響を受ける特性(転送トラヒック量)とがあることが明らかにされている。
【0006】
特許文献1には、日毎に測定される通信トラヒックの統計量の時系列データと、月情報、曜日情報を含む通信トラヒック測定日の暦上の属性を示すカレンダー情報をニューラルネットワークの入力とし、日毎に測定される通信トラヒックのk日先までの通信トラヒックを予測する技術が開示されている。
【非特許文献1】M.R. de Oliveira et al, "Cluster Analysis of Internet Users Based on Hourly Traffic Utilization," In Proc. of the First International Working Conference on Performance Modeling and Evaluation of Heterogenious Networks (HET-NETs'03), July 2003.
【非特許文献2】A. Nogueira et al, "Using Neural Networks to Classify Internet Users," in Proc. of Advanced Industrial Conference on Telecommunications/Service Assurance with Partial and Intermittent Resources Conference/E-Learning on Telecommunicatrions Workshop (AICT/SAPIR/ELETE 2005), 2005.
【非特許文献3】N.Vicari et al, "The Dependence of Internet User Traffic Characteristics on Access Speed," in Proc. of the 25th Local Computer Networks (LCN) Conference, pp.670-677, Tampa, FL, USA, Nov.2000.
【特許文献1】特開2004−23114号公報
【発明の開示】
【発明が解決しようとする課題】
【0007】
上記した各文献に開示されている技術は、いずれもユーザのトラヒック特性を、その実績データに基づいて分類あるいは予測する技術であるが、ネットワークに新たに収容する新規ユーザのように、実績トラヒックが全く未知のユーザのトラヒック特性を予測することはできなかった。
【0008】
本発明の目的は、上記した従来技術の課題を解決し、ネットワークに収容済の既存ユーザの属性情報およびその実績トラヒックに基づいて、任意のユーザのトラヒック特性を、そのユーザ属性に基づいて分析するトラヒック分析モデルの構築方法、装置および構築プログラムならびにその記憶媒体を提供することにある。
【課題を解決するための手段】
【0009】
本発明の発明者等の調査によれば、各ユーザのトラヒック特性は、その契約条件(契約速度、契約サービス種別、契約地域など)、性別、年齢などの各ユーザに固有の属性情報(以下、ユーザ属性と表現する)に依存し、ユーザ属性が異なれば、そのトラヒック特性も大きく異なる一方、ユーザ属性が類似していれば、そのトラヒック特性も類似している場合が多い。
【0010】
図10,11,12は、ユーザ属性とトラヒック負荷との関係を示した図であり、ここでは、トラヒック量の少ない低負荷ユーザと、それ以外の非低負荷ユーザとの割合をユーザ属性ごとに示している。
【0011】
図10は、低負荷ユーザと非低負荷ユーザとの割合を契約速度ごとに求めた結果を示した図である。図11は、低負荷ユーザと非低負荷ユーザとの割合を各ユーザの契約地域ごとに求めた図である。図12は、低負荷ユーザと非低負荷ユーザとの割合を契約サービス種別ごとに求めた図である。
【0012】
いずれの図でも、実績トラヒックの特徴(トラヒック負荷)とユーザ属性との間に有意な関係が存在していることが判る。したがって、既存ユーザのユーザ属性と実績トラヒックとの対応関係を求め、この対応関係に任意のユーザのユーザ属性を適用すれば、任意のユーザのトラヒック特性を高い確度で分析できることが判る。
【0013】
同様に、図13は、ユーザ属性の一つである契約サービス種別と、トラヒック特性の一つであって、トラヒック変動の特性を表す多次元ベクトルとの関係を示した図であり、ここでは、多次元ベクトルをトラヒックが昼間に集中する「昼型」および夜間に集中する「夜型」にカテゴリ化している。同図によれば、トラヒック特性が「昼型」および「夜型」のいずれであるかが、契約サービス種別に依存していることが示されている。
【0014】
さらに、図14は、後述するカレンダ属性の一つである曜日と、トラヒック変動の特性を表す多次元ベクトルとの関係を示した図であり、トラヒック特性が昼間に集中する「昼型」および夜間に集中する「夜型」のいずれであるかが、カレンダ属性に依存していることが示されている。
【0015】
本発明は、上記した知見に基づいてなされたものであり、ネットワークに収容済の既存ユーザのユーザ属性および実績トラヒックに基づいて、任意のユーザのトラヒック特性を、その属性情報に基づいて分析するトラヒック分析モデルの構築装置において、既存ユーザの実績トラヒックを記憶する手段と、既存ユーザのユーザ属性を記憶する手段と、既存ユーザの実績トラヒックから、所定のカレンダ属性で特定される単位期間ごとに、複数のトラヒック特性を分析するトラヒック分析手段と、各単位期間のユーザ属性、カレンダ属性および各トラヒック特性の対応関係を収集してトラヒック分析用の教師データを生成する教師データ生成手段と、トラヒック特性をユーザ属性およびカレンダ属性に基づいて単位期間ごとに分析するトラヒック分析モデルを、前記トラヒック分析用の教師データに基づいて構築するトラヒック分析モデル構築手段とを含むことを特徴とする。
【発明の効果】
【0016】
本発明によれば、以下のような効果が達成される。
(1)既存ユーザのユーザ属性および実績トラヒックに基づいて、カレンダ属性で特定される単位期間ごとに、ユーザ属性、カレンダ属性およびトラヒック特性の対応関係が求められ、この対応関係を教師データとしてトラヒック分析モデルが構築される。したがって、任意のユーザに関して、そのユーザ属性と共に、トラヒック特性を分析したい単位期間をカレンダ属性として指定すれば、当該ユーザの所望のカレンダ属性に対応したトラヒック特性を分析できるようになる。
(2)ユーザ属性、カレンダ属性およびトラヒック特性の対応関係を教師データとして用いて分析モデルを構築したので、既存ユーザの情報が存在しないようなユーザ属性・カレンダ属性の組み合わせに対応したトラヒック特性も分析できるようになる。
【発明を実施するための最良の形態】
【0017】
以下、図面を参照して本発明の最良の実施の形態について詳細に説明する。図1は、本発明に係るトラヒック分析システムを用いて予測された予測結果が適用されるネットワークの一例を示した図であり、コアネットワークにNC(ネットワークセンタ)を介して複数のGC局(市内交換局)がリング型ネットワーク(GCリング)でつながれ、各GC局にはスイッチ/ルータ(S/R)を介して多数のユーザ端末が接続される。
【0018】
図2は、本発明に係るトラヒック分析システムの主要部の構成を示したブロック図であり、ここでは、本発明の説明に不用な構成は図示が省略されている。
【0019】
トラヒック分析モデル構築部1は、ネットワークに収容済みの既存ユーザのユーザ属性と、この既存ユーザの実績トラヒックを所定のカレンダ属性で特定される単位期間ごとに分析して得られるトラヒック特性との対応関係に基づいて、任意のユーザの任意のカレンダ属性に対応したトラヒック特性を、そのユーザ属性およびカレンダ属性のみから予測するトラヒック分析モデルを構築する。
【0020】
例えば、前記カレンダ属性として「月内通日」が指定されれば、既存ユーザごとに、「1日」のトラヒック特性、「2日」のトラヒック特性…「31日」のトラヒック特性がそれぞれ求められ、各トラヒック特性が当該既存ユーザのユーザ属性と対応付けられる。前記トラヒック特性としては、1日(24時間)のトラヒック平均値やトラヒック標準偏差などが求められる。
【0021】
同様に、前記カレンダ属性として「年内通月」が指定されれば、既存ユーザごとに、「1月」のトラヒック特性、「2月」のトラヒック特性…「12月」のトラヒック特性がそれぞれ求められ、各トラヒック特性が当該既存ユーザのユーザ属性と対応付けられる。前記トラヒック特性としては、1ヶ月のトラヒック平均値やトラヒック標準偏差などが求められる。
【0022】
同様に、前記カレンダ属性として「日内通時間」が指定されれば、既存ユーザごとに、「0時台」のトラヒック特性、「1時台」のトラヒック特性…「23時台」のトラヒック特性がそれぞれ求められ、各トラヒック特性が当該既存ユーザのユーザ属性と対応付けられる。前記トラヒック特性としては、1時間のトラヒック平均値やトラヒック標準偏差などが求められる。
【0023】
なお、カレンダ属性もユーザ属性と同様に同時の複数の指定が可能であり、例えば、「月内通日」と「曜日」との組み合わせであれば、「3日の月曜日」、「25日の金曜日」といった指定も可能である。また、「月内通週」と「年内通月」との組み合わせであれば、「1月の第2週」、「3月の第1週」といった指定も可能である。
【0024】
トラヒック予測部2は、前記トラヒック分析モデル構築部1で構築されたトラヒック分析モデルを用いて、新規ユーザの前記カレンダ属性で特定される単位期間のトラヒック特性を、そのユーザ属性のみから予測する。例えば、ユーザ属性と共にカレンダ属性として「25日」が入力されれば、このユーザ属性に対応した新規ユーザの「25日」のトラヒック特性が予測される。
【0025】
同様に、ユーザ属性と共にカレンダ属性として「25日」と「月曜日」とが入力されれば、このユーザ属性に対応した新規ユーザの「25日の月曜日」のトラヒック特性が予測される。
【0026】
このとき、本実施形態では「25日の月曜日」のトラヒック特性を分析する場合でも、「25日」と「月曜日」との組み合わせに対応した既存ユーザの情報が登録されている必要はなく、この組み合わせに対応した既存ユーザの情報が未登録であっても、他の通日および曜日の情報に基づいて分析できる。
【0027】
前記トラヒック分析モデル構築部1において、既存ユーザデータベース(DB)101は、多数の既存ユーザのユーザ属性を記憶するユーザ属性記憶部101aと、別途に計測された各既存ユーザの実績トラヒックを記憶する実績トラヒック記憶部101bとを含み、この既存ユーザDB101上では、既存ユーザごとに、そのユーザ属性と実績トラヒックとが相互に対応付けられている。図3は、既存ユーザDB1の構成を模式的に示した図であり、各ユーザ(ポート番号)を一意に識別するユーザIDごとに、ユーザ属性と実績トラヒックとが対応付けられている。
【0028】
本実施形態では、ユーザ属性として契約速度、契約サービス種別、契約地域などの契約条件、およびユーザの性別、年齢を含む各種の情報が登録されている。実績トラヒックは、例えば前記スイッチ/ルータにおいて各既存ユーザのアクセス回線を収容しているポート上の上り下りの各トラヒックを所定の期間(例えば、1ヶ月)にわたって周期的(例えば、1時間ごと)にタップして得られた時系列の計測データである。
【0029】
図2へ戻り、負荷分析部102は、各既存ユーザの実績トラヒックを所定のカレンダ属性で特定される単位期間ごとに分析し、負荷特性が特異的なトラヒックを識別する。本実施形態では、各単位期間のトラヒックを、トラヒックがほとんど流れない「低負荷」、データのバックアップなどを目的としてトラヒックが一時的に発生する「一時負荷」、および上記以外の「通常負荷」のいずれかに分類する。
【0030】
トラヒック特性分析部103は、通常負荷に分類された単位期間のトラヒック特性を分析する。本実施形態では、トラヒック特性分析部103がカテゴリ分類部103aを含み、通常負荷のトラヒック特性が、平均値の観点からは「小」、「中」、「大」の3つのカテゴリに分類され、標準偏差の観点からは「小」、「中」、「大」の3つのカテゴリに分類される。
【0031】
さらに、本実施形態では、例えば1時間ごとのトラヒック量で構成される多次元(本実施形態では、24次元)ベクトルもトラヒック特性の一つとして採用し、この多次元ベクトルが複数のカテゴリに分類される。
【0032】
例えば、この多次元ベクトルが24時間のトラヒック特性を示しているのであれば、トラヒックが昼または夜のいずれに集中しているか、すなわち、昼の時刻に対応するベクトル成分が他の成分に比して大きいか(昼型)、夜の時刻に対応するベクトル成分が他の成分に比して大きいか(夜型)に応じて「昼型」、「夜型」の2つのカテゴリに分類される。
【0033】
例えば、図4に示したように、トラヒック量が相対的に少なく、トラヒック量の変動が小さく、夜間のトラヒック量が昼間のトラヒック量よりも多い通常負荷のトラヒックは、平均値が「小」、標準偏差が「小」、形状が「夜間」の各カテゴリに分類される。また、図5に示したように、トラヒック量が相対的に多く、トラヒック量の変動が大きく、昼間のトラヒック量が夜間のトラヒック量よりも多い通常負荷のトラヒックは、平均値が「大」、標準偏差が「大」、形状が「昼間」の各カテゴリに分類される。
【0034】
図2へ戻り、トラヒック分析教師データ生成部104は、トラヒック量が通常負荷に分類された各単位期間に関して、そのユーザ属性、カレンダ属性およびトラヒック特性のカテゴリ分類結果の対応関係を、トラヒック分析用の教師データとして教師データテーブル104aに登録する。
【0035】
図6は、前記教師データテーブル104aの一例を模式的に表現した図であり、ユーザ属性、カレンダ属性および各トラヒック特性のカテゴリ分類結果の対応関係が登録されている。
【0036】
トラヒック分析モデル構築部106は、前記トラヒック分析教師データテーブル104aに登録されている教師データに基づいて、任意のユーザの任意のカレンダ属性に対応した複数のトラヒック特性を、ユーザ属性およびカレンダ属性から分析するトラヒック分析モデルを構築する。
【0037】
本実施形態では、トラヒック特性の各項目(平均、標準偏差、多次元ベクトル)のカテゴリ分類結果を目的変数とし、既存ユーザのユーザ属性(契約速度、契約地域、契約サービス種別等)ならびにカレンダ属性を説明変数として、各ユーザのトラヒック特性を、前記3つの項目ごとにいずれかのカテゴリに分類するモデルの構築を考える。
【0038】
本実施形態では、前記トラヒック分析教師データテーブル104aに登録されている教師データを、Neural network、Naive Bayes、Decision Tree、Support Vector Machine等の適宜の分析手法に用して、ユーザ属性およびカレンダ属性からトラヒック特性を分析するトラヒック分析モデルを構築する。
【0039】
なお、上記した各分析手法への適用に際して、定量的に求められるトラヒックの平均値や標準偏差等に関しては、カテゴリ分類結果ではなく平均値や標準偏差の数値そのものが用いられるようにしても良い。
【0040】
ここで、Neural Networkを適用して分析モデルを構築するのであれば、教師データと出力との誤差を最小化するようにNetworkのパラメータ(結合荷重)が最適化される。他の分析手法を適用する場合も同様に、教師データと出力との誤差が最小化されるようにパラメータが最適化される。
【0041】
負荷判別教師データ生成部105は、トラヒック量が低負荷または通常負荷に分類された各単位期間に関して、そのユーザ属性、カレンダ属性および負荷特性(低負荷または通常負荷)の対応関係を、低負荷判別用の教師データとして教師データテーブル105aに登録する。
【0042】
図7は、前記教師データテーブル105aの一例を模式的に表現した図であり、ユーザ属性、カレンダ属性および負荷特性(低負荷または通常負荷)の対応関係が登録されている。
【0043】
低負荷判別モデル構築部107は、低負荷判別用の教師データテーブル105aに登録されている教師データを、Neural network、Naive Bayes、Decision Tree、Support Vector Machine等の適宜の分析手法に用して、任意のユーザのユーザ属性およびカレンダ属性から、当該ユーザの当該カレンダ属性で特性される単位期間が低負荷であるか否かを判別する低負荷判別モデルを構築する。
【0044】
図2へ戻り、トラヒック予測部2において、低負荷ポート予測部201は、前記低負荷判別モデル構築部107で構築された低負荷判別モデルに、新規ユーザのユーザ属性およびカレンダ属性を適用して、当該新規ユーザの前記カレンダ属性で特定される単位期間のトラヒックが低負荷であるか否かを判別する。判別結果は記憶部203に一次記憶された後に出力される。
【0045】
トラヒック特性予測部202は、前記低負荷ポート予測部201において低負荷以外と判別された通常負荷の単位期間のみを対象として、前記トラヒック分析モデル構築部106で構築されたトラヒック分析モデルに、新規ユーザのユーザ属性およびカレンダ属性を適用して、当該新規ユーザの前記カレンダ属性で特定される単位期間のトラヒック特性を予測する。予測結果は記憶部203に一次記憶された後に出力される。
【0046】
次いで、図8のフローチャートを参照して、前記トラヒック分析モデル構築部1の動作を詳細に説明する。
【0047】
ステップS1では、既存ユーザDB101から既存ユーザの一人が今回の注目ユーザとして選択され、当該注目ユーザのユーザ属性およびその実績トラヒックが負荷分析部102に取り込まれる。ステップS2では、前記負荷分析部102において、実績トラヒックがカレンダ属性で特定される単位期間ごとに抽出される。本実施形態では、実績トラヒックが通日および曜日をカレンダ属性として分析されるので、実績トラヒックが24時間分ずつ抽出される。
【0048】
ステップS3では、抽出された24時間分の実績トラヒックが分析され、そのトラヒック量の平均値が求められる。ステップS4では、トラヒック量の平均値が所定の基準値と比較され、この比較結果に基づいて、今回の単位期間のトラヒックが低負荷であるか否かが判定される。
【0049】
本実施形態では、ロジック判定が「平均トラヒック量が1Mbps以下」に設定されており、24時間の平均トラヒック量が1Mbps以下であれば、今回の単位期間が低負荷に分類されてステップS5へ進む。ステップS5では、前記負荷判別教師データ生成部105において、今回の単位期間に関して、そのユーザ属性、カレンダ属性および負荷特性(低負荷)が、低負荷判別用の教師データとして負荷判別教師データテーブル105aに登録される。カレンダ属性としては、今回の単位期間が[1日の月曜]であれば、通日として「1日」、曜日として「月曜日」が、カレンダ属性として登録される。
【0050】
ステップS11では、今回の注目ユーザに関して、全ての単位期間の分析が完了したか否かが判定され、未だ完了していなければステップS2へ戻り、次の単位期間として翌日の24時間分の実績トラヒックが抽出され、前記と同様にして分析が実行される。
【0051】
今回の単位期間に関して、前記ステップS4で「低負荷」と判定されなければステップS6へ進み、前記負荷分析部102において、今回の単位期間が、そのトラヒックがバースト的な「一時負荷」であるか否かが判定される。「一時負荷」と判定されれば、ステップS10へ進んで今回の単位期間に関する情報が破棄される。
【0052】
これに対して、「一時負荷」でなければ「通常負荷」に分類されてステップS7へ進み、今回の単位期間に関して、そのユーザ属性、カレンダ属性および負荷特性(通常負荷)が、負荷判別用の教師データとして負荷判別教師データテーブル105aに登録される。すなわち、本実施形態では負荷特性が低負荷である単位期間の対応関係も、負荷特性が通常負荷である単位期間の対応関係も、負荷判別用の教師データとして登録される。
【0053】
ステップS8では、前記トラヒック特性分析部103において、今回の単位期間のトラヒック特性が分析され、そのカテゴリ分類部103aにおいて、トラヒックの「平均値」、「標準偏差」および「多次元ベクトル」がカテゴリ化される。
【0054】
ステップS9では、前記トラヒック分析用の教師データ生成部104において、今回の単位期間に関して、そのユーザ属性、カレンダ属性およびトラヒック特性のカテゴリ分類結果が、トラヒック分析教師データテーブル104aに登録される。すなわち、本実施形態では負荷特性が通常負荷である単位期間の対応関係のみが、トラヒック分析用の教師データとしてトラヒック分析教師データテーブル104aに登録される。
【0055】
以上のようにして、今回の注目ユーザに関して、その実績トラヒックの分析が進み、ステップS11において、全ての単位期間に関して分析および教師データ登録が完了したと判定されるとステップS12へ進む。ステップS12では、既存ユーザの実績トラヒックが残っているか否かが判定される。実績トラヒックが残っていればステップS1へ戻り、注目ユーザを次の既存ユーザに切り換えて上記した各処理が繰り返される。
【0056】
全ての既存ユーザ、あるいは予定数の既存ユーザに関して、その実績トラヒックの分析および教師データの登録が完了するとステップS13へ進む。ステップS13では、前記トラヒック分析モデル構築部106において、前記トラヒック分析教師データテーブル104aに登録されている教師データが、Neural network等のアルゴリズムに適用され、前記教師データとアルゴリズム出力との誤差が最小となるように各種のパラメータを最適化することによりトラヒック分析モデルが構築される。
【0057】
ステップS14では、前記低負荷判別モデル構築部107において、前記負荷判別教師データテーブル105aに登録されている教師データが、Neural network等のアルゴリズムに適用され、前記教師データとアルゴリズム出力との誤差が最小となるように各種のパラメータを最適化することにより負荷判別モデルが構築される。
【0058】
図9は、前記トラヒック予測部2による予測動作を示したフローチャートであり、前記低負荷ポート予測部201には前記低負荷分析モデルが登録されており、前記トラヒック特性予測部202には前記トラヒック分析モデルが登録されている。ここでは、トラヒック特性予測部202の動作に着目して説明する。
【0059】
ステップS21では、新規ユーザのユーザ属性として、その契約条件(契約速度や契約サービス種別)、性別、年齢などが取り込まれ、さらに、トラヒック特性の予測期間を特定するカレンダ属性として、本実施形態では通日および曜日が取り込まれる。すなわち、「3日の月曜日」のトラヒック特性を予測したければ、月内通日として「3日」および曜日として「月曜日」が指定される。同様に、「20日の日曜日」のトラヒック特性を予測したければ、月内通日として「20日」および曜日として「日曜日」が指定される。
【0060】
なお、ここで指定できるカレンダ属性は、前記教師データ(すなわち、既存ユーザの対応関係)として登録されているカレンダ属性の組み合わせに限定されるものではなく、例えば、教師データとして月内通日の「20日」と曜日の「日曜日」との組み合わせに係る対応関係が未登録であっても、他の対応関係に基づいて「20日の日曜日」のトラヒック特性を予測できる。
【0061】
同様に、新規ユーザのユーザ属性に関しても、その組み合わせが教師データとして登録されているユーザ属性の組み合わせと一致している必要はなく、例えば、新規ユーザのユーザ属性が、「契約速度が10Mbps」、「サービス種別がA」,「契約地域が2」…であり、このような対応関係が教師データとして未登録であっても、他の対応関係に基づいてトラヒック特性を予測できる。
【0062】
さらには、新規ユーザの各ユーザ属性および各カレンダ属性の組み合わせが教師データとして未登録であっても、他の組み合わせに基づいてトラヒック特性を予測できる。
【0063】
ステップS22では、このユーザ属性およびカレンダ属性がトラヒック特性予測モデルに適用され、カレンダ属性で指定された単位期間のトラヒックの平均値、標準偏差および多次元ベクトルが、新規ユーザの当該期間のトラヒック特性として予測される。ステップS23では、前記予測結果が出力される。
【0064】
前記平均値、標準偏差および多次元ベクトルの予測結果は分析モデルの構築に利用したトラヒック特性の分類方式に依存するので、既存ユーザのトラヒック特性として、平均値が「小」、「中」、「大」にカテゴリ化され、標準偏差が「小」、「中」、「大」にカテゴリ化され、多次元ベクトルが「昼型」、「夜型」にカテゴリ化されていれば、新規ユーザのトラヒック特性も、単位期間(本実施形態では、24時間)の平均値が「小」、「中」、「大」のいずれのカテゴリに属し、標準偏差が「小」、「中」、「大」のいずれのカテゴリに属し、多次元ベクトルが「昼型」、「夜型」のいずれのカテゴリに属するかが、予測結果として与えられる。
【0065】
なお、予測結果の出力形態は、トラヒック特性の項目ごとに、そのカテゴリがテキストで提供されるようにしても良いし、あるいはトラヒック特性の各項目のカテゴリが反映されたモデル形状のパターンとして提供されるようにしても良い。
【0066】
なお、上記した実施形態では、通常負荷のトラヒック特性を、平均値、標準偏差および多次元ベクトルの3項目に注目してカテゴリ化するものとして説明したが、本発明はこれのみに限定されるものではなく、最頻度、最大値、最小値等の他の項目を含めて適宜の2ないし3項目以上に注目してカテゴリ化するようにしても良い。あるいは、トラヒック特性を定量化しやすい平均値、標準偏差、最大値および最小値等に関しては、カテゴリ化することなく、その数値が求められるようにしても良い。
【0067】
また、上記した実施形態では、カレンダ属性として「月内通日」および「曜日」を指定するものとして説明したが、本発明はこれのみに限定されるものではなく、祝祭日と平日との別を指定したり、「月内通週(月内で何番目の週に当たるか)」を指定したりしても良い。
【0068】
このとき、新規ユーザのトラヒックを祝祭日と平日とに分けて分析するのであれば、実績トラヒックは前記と同様に1日ごとに特性を分析し、教師データの「カレンダ属性」に、祝祭日/平日の別が登録される。新規ユーザのトラヒックを「通週」で分析するのであれば、実績トラヒックは一週間ごとに特性を分析し、教師データの「カレンダ属性」に「通週」が登録される。
【図面の簡単な説明】
【0069】
【図1】本発明のトラヒック分析モデル構築装置で構築されたトラヒック分析モデルを用いたトラヒック特性の予測結果が適用されるネットワークの図である。
【図2】本発明を適用したトラヒック分析システムの構成を示したブロック図である。
【図3】既存ユーザデータベースの構成を模式的に示した図である。
【図4】トラヒック特性の分析結果の一例を示した図である。
【図5】トラヒック特性の分析結果の他の一例を示した図である。
【図6】トラヒック分析教師データテーブルの一例を示した図である。
【図7】負荷判別教師データテーブルの一例を示した図である。
【図8】トラヒック分析モデル構築部の動作を示したフローチャートである。
【図9】トラヒック予測部の動作を示したフローチャートである。
【図10】低負荷/非低負荷ユーザの割合と契約速度との関係を示した図である。
【図11】低負荷/非低負荷ユーザの割合と契約地域との関係を示した図である。
【図12】低負荷/非低負荷ユーザの割合と契約サービス種別との関係を示した図である。
【図13】契約サービス種別とトラヒック特性の多次元ベクトルとの関係を示した図である。
【図14】カレンダ特性の曜日とトラヒック特性の多次元ベクトルとの関係を示した図である。
【符号の説明】
【0070】
1…トラヒック分析モデル構築部,2…トラヒック予測部,101…既存ユーザDB,101a…ユーザ属性記憶部,101b…実績トラヒック記憶部,102…負荷分析部,103…トラヒック特性分析部,103a…カテゴリ分類部,104…トラヒック分析教師データ生成部,104a…教師データテーブル,105…負荷判別教師データ生成部,105a…教師データテーブル,106…トラヒック分析モデル構築部,107…低負荷判別モデル構築部
【技術分野】
【0001】
本発明は、ネットワークに収容済の既存ユーザの属性情報および実績トラヒックに基づいて、任意のユーザのトラヒック特性を、その属性情報に基づいて分析するトラヒック分析モデルの構築方法、装置および構築プログラムならびにその記憶媒体に関する。
【背景技術】
【0002】
既設のネットワークに新規ユーザを収容するための収容設計、あるいは新規にネットワークを構築する際の設備設計では、ネットワークに新規に収容するユーザのトラヒック特性を正確に分析することが必要不可欠となる。
【0003】
非特許文献1には、各既存ユーザの日次トラヒック変動(解像度:30分)を、クラスタリング分析技術により、その変動の特徴に応じて分類(カテゴリ化)する技術が開示されている。
【0004】
非特許文献2には、上記した文献1の分類手法で得られたカテゴリと個々のトラヒック変動との対応関係を教師データとして、トラヒック変動データから、同トラヒックが属するカテゴリを予測する技術が開示されている。
【0005】
非特許文献3では、ダイヤルアップユーザおよびADSL回線ユーザのトラヒック特性を、アクセス回線の違いに着目して分析し、アクセス回線速度に殆ど影響を受けない特性(TCPセッション継続時間、TCPコネクションレートなど)と、影響を受ける特性(転送トラヒック量)とがあることが明らかにされている。
【0006】
特許文献1には、日毎に測定される通信トラヒックの統計量の時系列データと、月情報、曜日情報を含む通信トラヒック測定日の暦上の属性を示すカレンダー情報をニューラルネットワークの入力とし、日毎に測定される通信トラヒックのk日先までの通信トラヒックを予測する技術が開示されている。
【非特許文献1】M.R. de Oliveira et al, "Cluster Analysis of Internet Users Based on Hourly Traffic Utilization," In Proc. of the First International Working Conference on Performance Modeling and Evaluation of Heterogenious Networks (HET-NETs'03), July 2003.
【非特許文献2】A. Nogueira et al, "Using Neural Networks to Classify Internet Users," in Proc. of Advanced Industrial Conference on Telecommunications/Service Assurance with Partial and Intermittent Resources Conference/E-Learning on Telecommunicatrions Workshop (AICT/SAPIR/ELETE 2005), 2005.
【非特許文献3】N.Vicari et al, "The Dependence of Internet User Traffic Characteristics on Access Speed," in Proc. of the 25th Local Computer Networks (LCN) Conference, pp.670-677, Tampa, FL, USA, Nov.2000.
【特許文献1】特開2004−23114号公報
【発明の開示】
【発明が解決しようとする課題】
【0007】
上記した各文献に開示されている技術は、いずれもユーザのトラヒック特性を、その実績データに基づいて分類あるいは予測する技術であるが、ネットワークに新たに収容する新規ユーザのように、実績トラヒックが全く未知のユーザのトラヒック特性を予測することはできなかった。
【0008】
本発明の目的は、上記した従来技術の課題を解決し、ネットワークに収容済の既存ユーザの属性情報およびその実績トラヒックに基づいて、任意のユーザのトラヒック特性を、そのユーザ属性に基づいて分析するトラヒック分析モデルの構築方法、装置および構築プログラムならびにその記憶媒体を提供することにある。
【課題を解決するための手段】
【0009】
本発明の発明者等の調査によれば、各ユーザのトラヒック特性は、その契約条件(契約速度、契約サービス種別、契約地域など)、性別、年齢などの各ユーザに固有の属性情報(以下、ユーザ属性と表現する)に依存し、ユーザ属性が異なれば、そのトラヒック特性も大きく異なる一方、ユーザ属性が類似していれば、そのトラヒック特性も類似している場合が多い。
【0010】
図10,11,12は、ユーザ属性とトラヒック負荷との関係を示した図であり、ここでは、トラヒック量の少ない低負荷ユーザと、それ以外の非低負荷ユーザとの割合をユーザ属性ごとに示している。
【0011】
図10は、低負荷ユーザと非低負荷ユーザとの割合を契約速度ごとに求めた結果を示した図である。図11は、低負荷ユーザと非低負荷ユーザとの割合を各ユーザの契約地域ごとに求めた図である。図12は、低負荷ユーザと非低負荷ユーザとの割合を契約サービス種別ごとに求めた図である。
【0012】
いずれの図でも、実績トラヒックの特徴(トラヒック負荷)とユーザ属性との間に有意な関係が存在していることが判る。したがって、既存ユーザのユーザ属性と実績トラヒックとの対応関係を求め、この対応関係に任意のユーザのユーザ属性を適用すれば、任意のユーザのトラヒック特性を高い確度で分析できることが判る。
【0013】
同様に、図13は、ユーザ属性の一つである契約サービス種別と、トラヒック特性の一つであって、トラヒック変動の特性を表す多次元ベクトルとの関係を示した図であり、ここでは、多次元ベクトルをトラヒックが昼間に集中する「昼型」および夜間に集中する「夜型」にカテゴリ化している。同図によれば、トラヒック特性が「昼型」および「夜型」のいずれであるかが、契約サービス種別に依存していることが示されている。
【0014】
さらに、図14は、後述するカレンダ属性の一つである曜日と、トラヒック変動の特性を表す多次元ベクトルとの関係を示した図であり、トラヒック特性が昼間に集中する「昼型」および夜間に集中する「夜型」のいずれであるかが、カレンダ属性に依存していることが示されている。
【0015】
本発明は、上記した知見に基づいてなされたものであり、ネットワークに収容済の既存ユーザのユーザ属性および実績トラヒックに基づいて、任意のユーザのトラヒック特性を、その属性情報に基づいて分析するトラヒック分析モデルの構築装置において、既存ユーザの実績トラヒックを記憶する手段と、既存ユーザのユーザ属性を記憶する手段と、既存ユーザの実績トラヒックから、所定のカレンダ属性で特定される単位期間ごとに、複数のトラヒック特性を分析するトラヒック分析手段と、各単位期間のユーザ属性、カレンダ属性および各トラヒック特性の対応関係を収集してトラヒック分析用の教師データを生成する教師データ生成手段と、トラヒック特性をユーザ属性およびカレンダ属性に基づいて単位期間ごとに分析するトラヒック分析モデルを、前記トラヒック分析用の教師データに基づいて構築するトラヒック分析モデル構築手段とを含むことを特徴とする。
【発明の効果】
【0016】
本発明によれば、以下のような効果が達成される。
(1)既存ユーザのユーザ属性および実績トラヒックに基づいて、カレンダ属性で特定される単位期間ごとに、ユーザ属性、カレンダ属性およびトラヒック特性の対応関係が求められ、この対応関係を教師データとしてトラヒック分析モデルが構築される。したがって、任意のユーザに関して、そのユーザ属性と共に、トラヒック特性を分析したい単位期間をカレンダ属性として指定すれば、当該ユーザの所望のカレンダ属性に対応したトラヒック特性を分析できるようになる。
(2)ユーザ属性、カレンダ属性およびトラヒック特性の対応関係を教師データとして用いて分析モデルを構築したので、既存ユーザの情報が存在しないようなユーザ属性・カレンダ属性の組み合わせに対応したトラヒック特性も分析できるようになる。
【発明を実施するための最良の形態】
【0017】
以下、図面を参照して本発明の最良の実施の形態について詳細に説明する。図1は、本発明に係るトラヒック分析システムを用いて予測された予測結果が適用されるネットワークの一例を示した図であり、コアネットワークにNC(ネットワークセンタ)を介して複数のGC局(市内交換局)がリング型ネットワーク(GCリング)でつながれ、各GC局にはスイッチ/ルータ(S/R)を介して多数のユーザ端末が接続される。
【0018】
図2は、本発明に係るトラヒック分析システムの主要部の構成を示したブロック図であり、ここでは、本発明の説明に不用な構成は図示が省略されている。
【0019】
トラヒック分析モデル構築部1は、ネットワークに収容済みの既存ユーザのユーザ属性と、この既存ユーザの実績トラヒックを所定のカレンダ属性で特定される単位期間ごとに分析して得られるトラヒック特性との対応関係に基づいて、任意のユーザの任意のカレンダ属性に対応したトラヒック特性を、そのユーザ属性およびカレンダ属性のみから予測するトラヒック分析モデルを構築する。
【0020】
例えば、前記カレンダ属性として「月内通日」が指定されれば、既存ユーザごとに、「1日」のトラヒック特性、「2日」のトラヒック特性…「31日」のトラヒック特性がそれぞれ求められ、各トラヒック特性が当該既存ユーザのユーザ属性と対応付けられる。前記トラヒック特性としては、1日(24時間)のトラヒック平均値やトラヒック標準偏差などが求められる。
【0021】
同様に、前記カレンダ属性として「年内通月」が指定されれば、既存ユーザごとに、「1月」のトラヒック特性、「2月」のトラヒック特性…「12月」のトラヒック特性がそれぞれ求められ、各トラヒック特性が当該既存ユーザのユーザ属性と対応付けられる。前記トラヒック特性としては、1ヶ月のトラヒック平均値やトラヒック標準偏差などが求められる。
【0022】
同様に、前記カレンダ属性として「日内通時間」が指定されれば、既存ユーザごとに、「0時台」のトラヒック特性、「1時台」のトラヒック特性…「23時台」のトラヒック特性がそれぞれ求められ、各トラヒック特性が当該既存ユーザのユーザ属性と対応付けられる。前記トラヒック特性としては、1時間のトラヒック平均値やトラヒック標準偏差などが求められる。
【0023】
なお、カレンダ属性もユーザ属性と同様に同時の複数の指定が可能であり、例えば、「月内通日」と「曜日」との組み合わせであれば、「3日の月曜日」、「25日の金曜日」といった指定も可能である。また、「月内通週」と「年内通月」との組み合わせであれば、「1月の第2週」、「3月の第1週」といった指定も可能である。
【0024】
トラヒック予測部2は、前記トラヒック分析モデル構築部1で構築されたトラヒック分析モデルを用いて、新規ユーザの前記カレンダ属性で特定される単位期間のトラヒック特性を、そのユーザ属性のみから予測する。例えば、ユーザ属性と共にカレンダ属性として「25日」が入力されれば、このユーザ属性に対応した新規ユーザの「25日」のトラヒック特性が予測される。
【0025】
同様に、ユーザ属性と共にカレンダ属性として「25日」と「月曜日」とが入力されれば、このユーザ属性に対応した新規ユーザの「25日の月曜日」のトラヒック特性が予測される。
【0026】
このとき、本実施形態では「25日の月曜日」のトラヒック特性を分析する場合でも、「25日」と「月曜日」との組み合わせに対応した既存ユーザの情報が登録されている必要はなく、この組み合わせに対応した既存ユーザの情報が未登録であっても、他の通日および曜日の情報に基づいて分析できる。
【0027】
前記トラヒック分析モデル構築部1において、既存ユーザデータベース(DB)101は、多数の既存ユーザのユーザ属性を記憶するユーザ属性記憶部101aと、別途に計測された各既存ユーザの実績トラヒックを記憶する実績トラヒック記憶部101bとを含み、この既存ユーザDB101上では、既存ユーザごとに、そのユーザ属性と実績トラヒックとが相互に対応付けられている。図3は、既存ユーザDB1の構成を模式的に示した図であり、各ユーザ(ポート番号)を一意に識別するユーザIDごとに、ユーザ属性と実績トラヒックとが対応付けられている。
【0028】
本実施形態では、ユーザ属性として契約速度、契約サービス種別、契約地域などの契約条件、およびユーザの性別、年齢を含む各種の情報が登録されている。実績トラヒックは、例えば前記スイッチ/ルータにおいて各既存ユーザのアクセス回線を収容しているポート上の上り下りの各トラヒックを所定の期間(例えば、1ヶ月)にわたって周期的(例えば、1時間ごと)にタップして得られた時系列の計測データである。
【0029】
図2へ戻り、負荷分析部102は、各既存ユーザの実績トラヒックを所定のカレンダ属性で特定される単位期間ごとに分析し、負荷特性が特異的なトラヒックを識別する。本実施形態では、各単位期間のトラヒックを、トラヒックがほとんど流れない「低負荷」、データのバックアップなどを目的としてトラヒックが一時的に発生する「一時負荷」、および上記以外の「通常負荷」のいずれかに分類する。
【0030】
トラヒック特性分析部103は、通常負荷に分類された単位期間のトラヒック特性を分析する。本実施形態では、トラヒック特性分析部103がカテゴリ分類部103aを含み、通常負荷のトラヒック特性が、平均値の観点からは「小」、「中」、「大」の3つのカテゴリに分類され、標準偏差の観点からは「小」、「中」、「大」の3つのカテゴリに分類される。
【0031】
さらに、本実施形態では、例えば1時間ごとのトラヒック量で構成される多次元(本実施形態では、24次元)ベクトルもトラヒック特性の一つとして採用し、この多次元ベクトルが複数のカテゴリに分類される。
【0032】
例えば、この多次元ベクトルが24時間のトラヒック特性を示しているのであれば、トラヒックが昼または夜のいずれに集中しているか、すなわち、昼の時刻に対応するベクトル成分が他の成分に比して大きいか(昼型)、夜の時刻に対応するベクトル成分が他の成分に比して大きいか(夜型)に応じて「昼型」、「夜型」の2つのカテゴリに分類される。
【0033】
例えば、図4に示したように、トラヒック量が相対的に少なく、トラヒック量の変動が小さく、夜間のトラヒック量が昼間のトラヒック量よりも多い通常負荷のトラヒックは、平均値が「小」、標準偏差が「小」、形状が「夜間」の各カテゴリに分類される。また、図5に示したように、トラヒック量が相対的に多く、トラヒック量の変動が大きく、昼間のトラヒック量が夜間のトラヒック量よりも多い通常負荷のトラヒックは、平均値が「大」、標準偏差が「大」、形状が「昼間」の各カテゴリに分類される。
【0034】
図2へ戻り、トラヒック分析教師データ生成部104は、トラヒック量が通常負荷に分類された各単位期間に関して、そのユーザ属性、カレンダ属性およびトラヒック特性のカテゴリ分類結果の対応関係を、トラヒック分析用の教師データとして教師データテーブル104aに登録する。
【0035】
図6は、前記教師データテーブル104aの一例を模式的に表現した図であり、ユーザ属性、カレンダ属性および各トラヒック特性のカテゴリ分類結果の対応関係が登録されている。
【0036】
トラヒック分析モデル構築部106は、前記トラヒック分析教師データテーブル104aに登録されている教師データに基づいて、任意のユーザの任意のカレンダ属性に対応した複数のトラヒック特性を、ユーザ属性およびカレンダ属性から分析するトラヒック分析モデルを構築する。
【0037】
本実施形態では、トラヒック特性の各項目(平均、標準偏差、多次元ベクトル)のカテゴリ分類結果を目的変数とし、既存ユーザのユーザ属性(契約速度、契約地域、契約サービス種別等)ならびにカレンダ属性を説明変数として、各ユーザのトラヒック特性を、前記3つの項目ごとにいずれかのカテゴリに分類するモデルの構築を考える。
【0038】
本実施形態では、前記トラヒック分析教師データテーブル104aに登録されている教師データを、Neural network、Naive Bayes、Decision Tree、Support Vector Machine等の適宜の分析手法に用して、ユーザ属性およびカレンダ属性からトラヒック特性を分析するトラヒック分析モデルを構築する。
【0039】
なお、上記した各分析手法への適用に際して、定量的に求められるトラヒックの平均値や標準偏差等に関しては、カテゴリ分類結果ではなく平均値や標準偏差の数値そのものが用いられるようにしても良い。
【0040】
ここで、Neural Networkを適用して分析モデルを構築するのであれば、教師データと出力との誤差を最小化するようにNetworkのパラメータ(結合荷重)が最適化される。他の分析手法を適用する場合も同様に、教師データと出力との誤差が最小化されるようにパラメータが最適化される。
【0041】
負荷判別教師データ生成部105は、トラヒック量が低負荷または通常負荷に分類された各単位期間に関して、そのユーザ属性、カレンダ属性および負荷特性(低負荷または通常負荷)の対応関係を、低負荷判別用の教師データとして教師データテーブル105aに登録する。
【0042】
図7は、前記教師データテーブル105aの一例を模式的に表現した図であり、ユーザ属性、カレンダ属性および負荷特性(低負荷または通常負荷)の対応関係が登録されている。
【0043】
低負荷判別モデル構築部107は、低負荷判別用の教師データテーブル105aに登録されている教師データを、Neural network、Naive Bayes、Decision Tree、Support Vector Machine等の適宜の分析手法に用して、任意のユーザのユーザ属性およびカレンダ属性から、当該ユーザの当該カレンダ属性で特性される単位期間が低負荷であるか否かを判別する低負荷判別モデルを構築する。
【0044】
図2へ戻り、トラヒック予測部2において、低負荷ポート予測部201は、前記低負荷判別モデル構築部107で構築された低負荷判別モデルに、新規ユーザのユーザ属性およびカレンダ属性を適用して、当該新規ユーザの前記カレンダ属性で特定される単位期間のトラヒックが低負荷であるか否かを判別する。判別結果は記憶部203に一次記憶された後に出力される。
【0045】
トラヒック特性予測部202は、前記低負荷ポート予測部201において低負荷以外と判別された通常負荷の単位期間のみを対象として、前記トラヒック分析モデル構築部106で構築されたトラヒック分析モデルに、新規ユーザのユーザ属性およびカレンダ属性を適用して、当該新規ユーザの前記カレンダ属性で特定される単位期間のトラヒック特性を予測する。予測結果は記憶部203に一次記憶された後に出力される。
【0046】
次いで、図8のフローチャートを参照して、前記トラヒック分析モデル構築部1の動作を詳細に説明する。
【0047】
ステップS1では、既存ユーザDB101から既存ユーザの一人が今回の注目ユーザとして選択され、当該注目ユーザのユーザ属性およびその実績トラヒックが負荷分析部102に取り込まれる。ステップS2では、前記負荷分析部102において、実績トラヒックがカレンダ属性で特定される単位期間ごとに抽出される。本実施形態では、実績トラヒックが通日および曜日をカレンダ属性として分析されるので、実績トラヒックが24時間分ずつ抽出される。
【0048】
ステップS3では、抽出された24時間分の実績トラヒックが分析され、そのトラヒック量の平均値が求められる。ステップS4では、トラヒック量の平均値が所定の基準値と比較され、この比較結果に基づいて、今回の単位期間のトラヒックが低負荷であるか否かが判定される。
【0049】
本実施形態では、ロジック判定が「平均トラヒック量が1Mbps以下」に設定されており、24時間の平均トラヒック量が1Mbps以下であれば、今回の単位期間が低負荷に分類されてステップS5へ進む。ステップS5では、前記負荷判別教師データ生成部105において、今回の単位期間に関して、そのユーザ属性、カレンダ属性および負荷特性(低負荷)が、低負荷判別用の教師データとして負荷判別教師データテーブル105aに登録される。カレンダ属性としては、今回の単位期間が[1日の月曜]であれば、通日として「1日」、曜日として「月曜日」が、カレンダ属性として登録される。
【0050】
ステップS11では、今回の注目ユーザに関して、全ての単位期間の分析が完了したか否かが判定され、未だ完了していなければステップS2へ戻り、次の単位期間として翌日の24時間分の実績トラヒックが抽出され、前記と同様にして分析が実行される。
【0051】
今回の単位期間に関して、前記ステップS4で「低負荷」と判定されなければステップS6へ進み、前記負荷分析部102において、今回の単位期間が、そのトラヒックがバースト的な「一時負荷」であるか否かが判定される。「一時負荷」と判定されれば、ステップS10へ進んで今回の単位期間に関する情報が破棄される。
【0052】
これに対して、「一時負荷」でなければ「通常負荷」に分類されてステップS7へ進み、今回の単位期間に関して、そのユーザ属性、カレンダ属性および負荷特性(通常負荷)が、負荷判別用の教師データとして負荷判別教師データテーブル105aに登録される。すなわち、本実施形態では負荷特性が低負荷である単位期間の対応関係も、負荷特性が通常負荷である単位期間の対応関係も、負荷判別用の教師データとして登録される。
【0053】
ステップS8では、前記トラヒック特性分析部103において、今回の単位期間のトラヒック特性が分析され、そのカテゴリ分類部103aにおいて、トラヒックの「平均値」、「標準偏差」および「多次元ベクトル」がカテゴリ化される。
【0054】
ステップS9では、前記トラヒック分析用の教師データ生成部104において、今回の単位期間に関して、そのユーザ属性、カレンダ属性およびトラヒック特性のカテゴリ分類結果が、トラヒック分析教師データテーブル104aに登録される。すなわち、本実施形態では負荷特性が通常負荷である単位期間の対応関係のみが、トラヒック分析用の教師データとしてトラヒック分析教師データテーブル104aに登録される。
【0055】
以上のようにして、今回の注目ユーザに関して、その実績トラヒックの分析が進み、ステップS11において、全ての単位期間に関して分析および教師データ登録が完了したと判定されるとステップS12へ進む。ステップS12では、既存ユーザの実績トラヒックが残っているか否かが判定される。実績トラヒックが残っていればステップS1へ戻り、注目ユーザを次の既存ユーザに切り換えて上記した各処理が繰り返される。
【0056】
全ての既存ユーザ、あるいは予定数の既存ユーザに関して、その実績トラヒックの分析および教師データの登録が完了するとステップS13へ進む。ステップS13では、前記トラヒック分析モデル構築部106において、前記トラヒック分析教師データテーブル104aに登録されている教師データが、Neural network等のアルゴリズムに適用され、前記教師データとアルゴリズム出力との誤差が最小となるように各種のパラメータを最適化することによりトラヒック分析モデルが構築される。
【0057】
ステップS14では、前記低負荷判別モデル構築部107において、前記負荷判別教師データテーブル105aに登録されている教師データが、Neural network等のアルゴリズムに適用され、前記教師データとアルゴリズム出力との誤差が最小となるように各種のパラメータを最適化することにより負荷判別モデルが構築される。
【0058】
図9は、前記トラヒック予測部2による予測動作を示したフローチャートであり、前記低負荷ポート予測部201には前記低負荷分析モデルが登録されており、前記トラヒック特性予測部202には前記トラヒック分析モデルが登録されている。ここでは、トラヒック特性予測部202の動作に着目して説明する。
【0059】
ステップS21では、新規ユーザのユーザ属性として、その契約条件(契約速度や契約サービス種別)、性別、年齢などが取り込まれ、さらに、トラヒック特性の予測期間を特定するカレンダ属性として、本実施形態では通日および曜日が取り込まれる。すなわち、「3日の月曜日」のトラヒック特性を予測したければ、月内通日として「3日」および曜日として「月曜日」が指定される。同様に、「20日の日曜日」のトラヒック特性を予測したければ、月内通日として「20日」および曜日として「日曜日」が指定される。
【0060】
なお、ここで指定できるカレンダ属性は、前記教師データ(すなわち、既存ユーザの対応関係)として登録されているカレンダ属性の組み合わせに限定されるものではなく、例えば、教師データとして月内通日の「20日」と曜日の「日曜日」との組み合わせに係る対応関係が未登録であっても、他の対応関係に基づいて「20日の日曜日」のトラヒック特性を予測できる。
【0061】
同様に、新規ユーザのユーザ属性に関しても、その組み合わせが教師データとして登録されているユーザ属性の組み合わせと一致している必要はなく、例えば、新規ユーザのユーザ属性が、「契約速度が10Mbps」、「サービス種別がA」,「契約地域が2」…であり、このような対応関係が教師データとして未登録であっても、他の対応関係に基づいてトラヒック特性を予測できる。
【0062】
さらには、新規ユーザの各ユーザ属性および各カレンダ属性の組み合わせが教師データとして未登録であっても、他の組み合わせに基づいてトラヒック特性を予測できる。
【0063】
ステップS22では、このユーザ属性およびカレンダ属性がトラヒック特性予測モデルに適用され、カレンダ属性で指定された単位期間のトラヒックの平均値、標準偏差および多次元ベクトルが、新規ユーザの当該期間のトラヒック特性として予測される。ステップS23では、前記予測結果が出力される。
【0064】
前記平均値、標準偏差および多次元ベクトルの予測結果は分析モデルの構築に利用したトラヒック特性の分類方式に依存するので、既存ユーザのトラヒック特性として、平均値が「小」、「中」、「大」にカテゴリ化され、標準偏差が「小」、「中」、「大」にカテゴリ化され、多次元ベクトルが「昼型」、「夜型」にカテゴリ化されていれば、新規ユーザのトラヒック特性も、単位期間(本実施形態では、24時間)の平均値が「小」、「中」、「大」のいずれのカテゴリに属し、標準偏差が「小」、「中」、「大」のいずれのカテゴリに属し、多次元ベクトルが「昼型」、「夜型」のいずれのカテゴリに属するかが、予測結果として与えられる。
【0065】
なお、予測結果の出力形態は、トラヒック特性の項目ごとに、そのカテゴリがテキストで提供されるようにしても良いし、あるいはトラヒック特性の各項目のカテゴリが反映されたモデル形状のパターンとして提供されるようにしても良い。
【0066】
なお、上記した実施形態では、通常負荷のトラヒック特性を、平均値、標準偏差および多次元ベクトルの3項目に注目してカテゴリ化するものとして説明したが、本発明はこれのみに限定されるものではなく、最頻度、最大値、最小値等の他の項目を含めて適宜の2ないし3項目以上に注目してカテゴリ化するようにしても良い。あるいは、トラヒック特性を定量化しやすい平均値、標準偏差、最大値および最小値等に関しては、カテゴリ化することなく、その数値が求められるようにしても良い。
【0067】
また、上記した実施形態では、カレンダ属性として「月内通日」および「曜日」を指定するものとして説明したが、本発明はこれのみに限定されるものではなく、祝祭日と平日との別を指定したり、「月内通週(月内で何番目の週に当たるか)」を指定したりしても良い。
【0068】
このとき、新規ユーザのトラヒックを祝祭日と平日とに分けて分析するのであれば、実績トラヒックは前記と同様に1日ごとに特性を分析し、教師データの「カレンダ属性」に、祝祭日/平日の別が登録される。新規ユーザのトラヒックを「通週」で分析するのであれば、実績トラヒックは一週間ごとに特性を分析し、教師データの「カレンダ属性」に「通週」が登録される。
【図面の簡単な説明】
【0069】
【図1】本発明のトラヒック分析モデル構築装置で構築されたトラヒック分析モデルを用いたトラヒック特性の予測結果が適用されるネットワークの図である。
【図2】本発明を適用したトラヒック分析システムの構成を示したブロック図である。
【図3】既存ユーザデータベースの構成を模式的に示した図である。
【図4】トラヒック特性の分析結果の一例を示した図である。
【図5】トラヒック特性の分析結果の他の一例を示した図である。
【図6】トラヒック分析教師データテーブルの一例を示した図である。
【図7】負荷判別教師データテーブルの一例を示した図である。
【図8】トラヒック分析モデル構築部の動作を示したフローチャートである。
【図9】トラヒック予測部の動作を示したフローチャートである。
【図10】低負荷/非低負荷ユーザの割合と契約速度との関係を示した図である。
【図11】低負荷/非低負荷ユーザの割合と契約地域との関係を示した図である。
【図12】低負荷/非低負荷ユーザの割合と契約サービス種別との関係を示した図である。
【図13】契約サービス種別とトラヒック特性の多次元ベクトルとの関係を示した図である。
【図14】カレンダ特性の曜日とトラヒック特性の多次元ベクトルとの関係を示した図である。
【符号の説明】
【0070】
1…トラヒック分析モデル構築部,2…トラヒック予測部,101…既存ユーザDB,101a…ユーザ属性記憶部,101b…実績トラヒック記憶部,102…負荷分析部,103…トラヒック特性分析部,103a…カテゴリ分類部,104…トラヒック分析教師データ生成部,104a…教師データテーブル,105…負荷判別教師データ生成部,105a…教師データテーブル,106…トラヒック分析モデル構築部,107…低負荷判別モデル構築部
【特許請求の範囲】
【請求項1】
ネットワークに収容済の既存ユーザの属性情報および実績トラヒックに基づいて、任意のユーザのトラヒック特性を、その属性情報に基づいて分析するトラヒック分析モデルの構築装置において、
既存ユーザの実績トラヒックを記憶する手段と、
既存ユーザのユーザ属性を記憶する手段と、
既存ユーザの実績トラヒックから、所定のカレンダ属性で特定される単位期間ごとに、複数のトラヒック特性を分析するトラヒック分析手段と、
各単位期間のユーザ属性、カレンダ属性および各トラヒック特性の対応関係を収集してトラヒック分析用の教師データを生成する教師データ生成手段と、
トラヒック特性をユーザ属性およびカレンダ属性に基づいて単位期間ごとに分析するトラヒック分析モデルを、前記トラヒック分析用の教師データに基づいて構築するトラヒック分析モデル構築手段とを含むことを特徴とするトラヒック分析モデルの構築装置。
【請求項2】
前記トラヒック分析手段は、各トラヒック特性を複数のカテゴリに分類するカテゴリ化手段を含み、
前記教師データ生成手段が、トラヒック特性として、そのカテゴリ分類結果を収集することを特徴とする請求項1に記載のトラヒック分析モデルの構築装置。
【請求項3】
前記単位期間の負荷特性を識別する負荷分析手段を含み、
前記教師データ生成手段は、トラヒック負荷が特異的な単位期間の対応関係を教師データとして利用しないことを特徴とする請求項1または2に記載のトラヒック分析モデルの構築装置。
【請求項4】
前記負荷分析手段は、トラヒック利用が少ない低負荷の単位期間を識別することを特徴とする請求項3に記載のトラヒック分析モデルの構築装置。
【請求項5】
前記負荷分析手段は、トラヒック利用がバースト的な単位期間を識別することを特徴とする請求項3に記載のトラヒック分析モデルの構築装置。
【請求項6】
前記トラヒック分析手段が、トラヒックの平均値、標準偏差、およびトラヒック変動の特性を表す多次元ベクトルの少なくとも一つを含む複数のトラヒック特性を求めることを特徴とする請求項1ないし5のいずれかに記載のトラヒック分析モデルの構築装置。
【請求項7】
各既存ユーザのユーザ属性、カレンダ属性および負荷特性の対応関係を収集して負荷判別用の教師データを生成する第2の教師データ生成手段と、
負荷特性をユーザ属性およびカレンダ属性に基づいて単位期間ごとに判別する負荷特性判別モデルを、前記負荷判別用の教師データに基づいて構築する負荷特性判別モデル構築手段とを含むことを特徴とする請求項3ないし6のいずれかに記載のトラヒック分析モデルの構築装置。
【請求項8】
ネットワークに収容済の既存ユーザの属性情報および実績トラヒックに基づいて、任意のユーザのトラヒック特性を、その属性情報に基づいて分析するトラヒック分析モデルの構築方法において、
既存ユーザの実績トラヒックから、所定のカレンダ属性で特定される単位期間ごとに、複数のトラヒック特性を分析する手順と、
各単位期間のユーザ属性、カレンダ属性および各トラヒック特性の対応関係を収集してトラヒック分析用の教師データを生成する手順と、
トラヒック特性をユーザ属性およびカレンダ属性に基づいて単位期間ごとに分析するトラヒック分析モデルを、前記トラヒック分析用の教師データに基づいて構築する手順とを含むことを特徴とするトラヒック分析モデルの構築方法。
【請求項9】
前記トラヒック特性を分析する手順が、各トラヒック特性を複数のカテゴリに分類する手順を含み、
トラヒック特性として、そのカテゴリ分類結果が収集されることを特徴とする請求項8に記載のトラヒック分析モデルの構築方法。
【請求項10】
前記単位期間の負荷特性を識別する手順を含み、
トラヒック負荷が特異的な単位期間の対応関係を教師データとして利用しないことを特徴とする請求項8または9に記載のトラヒック分析モデルの構築方法。
【請求項11】
トラヒック利用が少ない低負荷の単位期間の対応関係を利用しないことを特徴とする請求項10に記載のトラヒック分析モデルの構築方法。
【請求項12】
トラヒック利用がバースト的な単位期間の対応関係を利用しないことを特徴とする請求項10に記載のトラヒック分析モデルの構築方法。
【請求項13】
前記トラヒック特性を分析する手順が、トラヒックの平均値、標準偏差、およびトラヒック変動の特性を表す多次元ベクトルの少なくとも一つを含む複数のトラヒック特性を求めることを特徴とする請求項8ないし12のいずれかに記載のトラヒック分析モデルの構築方法。
【請求項14】
前記請求項8ないし13のいずれかに記載のトラヒック分析モデルの構築方法をコンピュータに実行させるトラヒック分析モデルの構築プログラム。
【請求項15】
前記請求項14に記載のトラヒック分析モデルの構築プログラムをコンピュータによる読み出し可能に記憶した記憶媒体。
【請求項1】
ネットワークに収容済の既存ユーザの属性情報および実績トラヒックに基づいて、任意のユーザのトラヒック特性を、その属性情報に基づいて分析するトラヒック分析モデルの構築装置において、
既存ユーザの実績トラヒックを記憶する手段と、
既存ユーザのユーザ属性を記憶する手段と、
既存ユーザの実績トラヒックから、所定のカレンダ属性で特定される単位期間ごとに、複数のトラヒック特性を分析するトラヒック分析手段と、
各単位期間のユーザ属性、カレンダ属性および各トラヒック特性の対応関係を収集してトラヒック分析用の教師データを生成する教師データ生成手段と、
トラヒック特性をユーザ属性およびカレンダ属性に基づいて単位期間ごとに分析するトラヒック分析モデルを、前記トラヒック分析用の教師データに基づいて構築するトラヒック分析モデル構築手段とを含むことを特徴とするトラヒック分析モデルの構築装置。
【請求項2】
前記トラヒック分析手段は、各トラヒック特性を複数のカテゴリに分類するカテゴリ化手段を含み、
前記教師データ生成手段が、トラヒック特性として、そのカテゴリ分類結果を収集することを特徴とする請求項1に記載のトラヒック分析モデルの構築装置。
【請求項3】
前記単位期間の負荷特性を識別する負荷分析手段を含み、
前記教師データ生成手段は、トラヒック負荷が特異的な単位期間の対応関係を教師データとして利用しないことを特徴とする請求項1または2に記載のトラヒック分析モデルの構築装置。
【請求項4】
前記負荷分析手段は、トラヒック利用が少ない低負荷の単位期間を識別することを特徴とする請求項3に記載のトラヒック分析モデルの構築装置。
【請求項5】
前記負荷分析手段は、トラヒック利用がバースト的な単位期間を識別することを特徴とする請求項3に記載のトラヒック分析モデルの構築装置。
【請求項6】
前記トラヒック分析手段が、トラヒックの平均値、標準偏差、およびトラヒック変動の特性を表す多次元ベクトルの少なくとも一つを含む複数のトラヒック特性を求めることを特徴とする請求項1ないし5のいずれかに記載のトラヒック分析モデルの構築装置。
【請求項7】
各既存ユーザのユーザ属性、カレンダ属性および負荷特性の対応関係を収集して負荷判別用の教師データを生成する第2の教師データ生成手段と、
負荷特性をユーザ属性およびカレンダ属性に基づいて単位期間ごとに判別する負荷特性判別モデルを、前記負荷判別用の教師データに基づいて構築する負荷特性判別モデル構築手段とを含むことを特徴とする請求項3ないし6のいずれかに記載のトラヒック分析モデルの構築装置。
【請求項8】
ネットワークに収容済の既存ユーザの属性情報および実績トラヒックに基づいて、任意のユーザのトラヒック特性を、その属性情報に基づいて分析するトラヒック分析モデルの構築方法において、
既存ユーザの実績トラヒックから、所定のカレンダ属性で特定される単位期間ごとに、複数のトラヒック特性を分析する手順と、
各単位期間のユーザ属性、カレンダ属性および各トラヒック特性の対応関係を収集してトラヒック分析用の教師データを生成する手順と、
トラヒック特性をユーザ属性およびカレンダ属性に基づいて単位期間ごとに分析するトラヒック分析モデルを、前記トラヒック分析用の教師データに基づいて構築する手順とを含むことを特徴とするトラヒック分析モデルの構築方法。
【請求項9】
前記トラヒック特性を分析する手順が、各トラヒック特性を複数のカテゴリに分類する手順を含み、
トラヒック特性として、そのカテゴリ分類結果が収集されることを特徴とする請求項8に記載のトラヒック分析モデルの構築方法。
【請求項10】
前記単位期間の負荷特性を識別する手順を含み、
トラヒック負荷が特異的な単位期間の対応関係を教師データとして利用しないことを特徴とする請求項8または9に記載のトラヒック分析モデルの構築方法。
【請求項11】
トラヒック利用が少ない低負荷の単位期間の対応関係を利用しないことを特徴とする請求項10に記載のトラヒック分析モデルの構築方法。
【請求項12】
トラヒック利用がバースト的な単位期間の対応関係を利用しないことを特徴とする請求項10に記載のトラヒック分析モデルの構築方法。
【請求項13】
前記トラヒック特性を分析する手順が、トラヒックの平均値、標準偏差、およびトラヒック変動の特性を表す多次元ベクトルの少なくとも一つを含む複数のトラヒック特性を求めることを特徴とする請求項8ないし12のいずれかに記載のトラヒック分析モデルの構築方法。
【請求項14】
前記請求項8ないし13のいずれかに記載のトラヒック分析モデルの構築方法をコンピュータに実行させるトラヒック分析モデルの構築プログラム。
【請求項15】
前記請求項14に記載のトラヒック分析モデルの構築プログラムをコンピュータによる読み出し可能に記憶した記憶媒体。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【公開番号】特開2008−187612(P2008−187612A)
【公開日】平成20年8月14日(2008.8.14)
【国際特許分類】
【出願番号】特願2007−21117(P2007−21117)
【出願日】平成19年1月31日(2007.1.31)
【出願人】(000208891)KDDI株式会社 (2,700)
【Fターム(参考)】
【公開日】平成20年8月14日(2008.8.14)
【国際特許分類】
【出願日】平成19年1月31日(2007.1.31)
【出願人】(000208891)KDDI株式会社 (2,700)
【Fターム(参考)】
[ Back to top ]