注目対象予測装置
【課題】外部事象の状況をもとにシステムにかかる負荷を予測することが可能な注目対象予測装置を提供することにある。
【解決手段】頻度取得手段は、関係情報格納手段に格納されている関係情報からシステムの負荷を予測するために兆候となる情報群の頻度を取得する。相関関係分析手段は、頻度取得手段によって取得された頻度および当該頻度の変化とシステム情報格納手段に格納されているシステム情報との間の相関関係の有無に関する分析を行う。生成手段は、相関関係分析手段による分析結果に基づいて、頻度および当該頻度の変化とシステム情報との関係性を示す相関関係知識情報を生成する。対象値予測手段は、生成手段によって生成された相関関係知識情報をもとに、頻度、当該頻度の変化およびシステム情報を用い、システムにかかる負荷の予測値を出力する。
【解決手段】頻度取得手段は、関係情報格納手段に格納されている関係情報からシステムの負荷を予測するために兆候となる情報群の頻度を取得する。相関関係分析手段は、頻度取得手段によって取得された頻度および当該頻度の変化とシステム情報格納手段に格納されているシステム情報との間の相関関係の有無に関する分析を行う。生成手段は、相関関係分析手段による分析結果に基づいて、頻度および当該頻度の変化とシステム情報との関係性を示す相関関係知識情報を生成する。対象値予測手段は、生成手段によって生成された相関関係知識情報をもとに、頻度、当該頻度の変化およびシステム情報を用い、システムにかかる負荷の予測値を出力する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明の実施形態は、対象となるシステムにかかる負荷を予測するための注目対象予測装置に関する。
【背景技術】
【0002】
一般的に、例えば業務等で用いられるシステム(ITシステム)においては、当該業務の内容に応じて当該システムにかかる負荷が変動する。
【0003】
そこで、このようなシステムにかかる負荷を予め知ることができれば、業務をより効率的に行うことができると考えられる。
【0004】
したがって、業務をサポートする上で、対象となるシステムにかかる負荷(数値)を予測することが望まれている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2008−225579号公報
【特許文献2】特開2007−133805号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、例えば通常の業務で用いられるシステムにおいては、その負荷の予測をシステム内部の情報から行うことは困難である。実際の業務要件によりシステム負荷は変化するが、一般的に、企業の業務は、そのときに発生している業務要件に依存して負荷が変動する。
【0007】
そのため、例えばシステム上の「既存のログ」等による予測は正確なものではなく、当該システムが対象としている業務自体の負荷を予測するための手がかりの方が当該システムにかかる負荷の予測に役立つ。具体的には、経理業務であれば月末のシステムの負荷が高い、等である。
【0008】
主に業務の負荷予測は業務知識ベースで作成されるが、それも現在では例えば技術進展(サービス化等)に伴う利用ITの変化、規制・法制または国際化等に伴うビジネス環境の変化等により都度変動している。
【0009】
したがって、今稼動しているシステムからは把握できない業務上の兆候をもとに予測を行う必要が生じている。
【0010】
そこで、本発明が解決しようとする課題は、外部事象の状況をもとにシステムにかかる負荷を予測することが可能な注目対象予測装置を提供することにある。
【課題を解決するための手段】
【0011】
実施形態によれば、業務で用いられるシステムにかかる負荷を予測する注目対象予測装置が提供される。
【0012】
実施形態に係る注目対象予測装置は、関係情報格納手段と、システム情報格納手段と、頻度取得手段と、相関関係分析手段と、生成手段と、対象値予測手段とを具備する。
【0013】
関係情報格納手段は、前記業務に関係する関係情報を格納する。
【0014】
システム情報格納手段は、前記システムの出力値に関係するシステム情報を格納する。
【0015】
頻度取得手段は、前記関係情報格納手段に格納されている関係情報から前記システムの負荷を予測するために兆候となる情報群の頻度を取得する。
【0016】
相関関係分析手段は、前記取得された頻度および当該頻度の変化と前記システム情報格納手段に格納されているシステム情報との間の相関関係の有無に関する分析を行う。
【0017】
生成手段は、前記分析結果に基づいて、前記取得された頻度および当該頻度の変化と前記システム情報との関係性を示す相関関係知識情報を生成する。
【0018】
対象値予測手段は、前記生成された相関関係知識情報をもとに、前記取得された頻度、当該頻度の変化および前記システム情報を用い、前記システムにかかる負荷の予測値を出力する。
【図面の簡単な説明】
【0019】
【図1】実施形態に係る注目対象予測装置100の主として機能構成を示すブロック図。
【図2】外部事象ストリーム管理装置101の受け入れアルゴリズムについて説明するための図。
【図3】ストリーム変換された自由文情報の一例を示す図。
【図4】必要項目抽出フィルタ102によって抽出された兆候候補データの一例を示す図。
【図5】ストリーミング化された兆候情報の一例を示す図。
【図6】対象事象出力結果ストリーム管理装置104の受け入れアルゴリズムについて説明するための図。
【図7】システム監視ログの一例を示す図。
【図8】事象特定フィルタ106から頻度分析部107に渡される対象システム情報の一例を示す図。
【図9】頻度分析部107によって取得される頻度情報の一例を示す図。
【図10】相関関係分析部110の処理について具体的に説明するための図。
【図11】相関関係分析部110によって取得される時系列頻度変化情報の一例を示す図。
【図12】予測の実施処理における対象値予測部113の動作について説明するための図。
【発明を実施するための形態】
【0020】
以下、図面を参照して、実施形態について説明する。
【0021】
図1は、本実施形態に係る注目対象予測装置100の主として機能構成を示すブロック図である。この注目対象予測装置100は、例えば業務等で用いられるシステムにかかる負荷を予測するために用いられる。以下の説明においては、注目対象予測装置100において負荷が予測される対象となるシステムを対象システムと称する。
【0022】
なお、注目対象予測装置100は、当該装置の各機能を実現するためのハードウェア構成、またはハードウェアとソフトウェアとの組み合わせ構成として実現されている。ソフトウェアは、予め記憶媒体またはネットワークからインストールされ、注目対象予測装置100にその機能を実現させるためのプログラムからなる。
【0023】
図1に示すように、注目対象予測装置100は、外部事象ストリーム管理装置101、必要項目抽出フィルタ102、関係システム紐付け部103、対象事象出力結果ストリーム管理装置104、システム特定フィルタ105、事象特定フィルタ106、頻度分析部107、差分検知部108、統計情報履歴蓄積部109、相関関係分析部110、行動モデル分析部111、相関関係知識情報格納部112、対象値予測部113、アクション実施知識情報格納部114およびアクション実施部115を含む。
【0024】
外部事象ストリーム管理装置101は、業務に関係する関係情報を格納および管理する機能を有する。具体的には、外部事象ストリーム管理装置101は、例えば対象とする業務の関係者全体がやり取りしている文書またはメッセージ等を一定期間格納および管理し、必要な項目に対する十分な検索機能を有する。
【0025】
必要項目抽出フィルタ102は、外部事象ストリーム管理装置101において管理されている関係情報の中から、設定されたキー(当該関係情報に含まれる単語、発信元、発信先、時間等)をもとに必要と考えられる、兆候となりそうな情報を抽出する(フィルタリングする)。
【0026】
関係システム紐付け部103は、必要項目抽出フィルタ102の機能に対し、どのような情報を抽出するかを指示し、また、抽出された情報がどのような機能と関係するかを明確化する機能を有する。これにより、関係システム紐付け部103は、対象システムの負荷を予測するために兆候となる情報(以下、兆候情報と表記)を出力する。
【0027】
対象事象出力結果ストリーム管理装置104は、対象システムの出力値(システムセッション数、CPU平均/最大瞬間負荷等)に関係する情報(以下、システム情報と表記)を一定期間格納および管理し、必要な検索を行う機能を有する。通常、事象に付随する生データからは直接把握したい数値は出てこないため、対象事象出力結果ストリーム管理装置104においては、対象システムに関する情報以外に雑多の情報が格納および管理されている。
【0028】
システム特定フィルタ105は、対象事象出力結果ストリーム管理装置104において管理されている情報の中から、対象システムに関係する情報(システム情報)を抽出する。
【0029】
事象特定フィルタ106は、システム特定フィルタ105によって抽出された対象システムに関係するシステム情報のうち、例えば「ピーク発生している期間の情報」等の必要な情報を切り出す。以下、事象特定フィルタ106によって切り出された情報は、対象システム情報と称する。
【0030】
頻度分析部107は、関係システム紐付け部103によって出力された兆候情報から、兆候となる情報群の頻度を演算する。これにより、頻度分析部107は、兆候となる情報群の頻度を示す頻度情報を取得する。また、頻度分析部107は、事象特定フィルタ106によって出力された対象システム情報から必要とされる情報の条件(ピーク時として判断される期間、平常時の期間等)を明確化して切り出す。
【0031】
差分検知部108は、頻度分析部107によって取得された頻度情報(によって示される頻度)をもとに、当該頻度の変化を把握する。これにより、差分検知部108は、頻度分析部107によって取得された頻度情報によって示される頻度の変化を示す頻度変化情報を取得する。
【0032】
統計情報履歴蓄積部109には、頻度分析部107によって取得された頻度情報および差分検知部108によって取得された頻度変化情報が格納される。また、統計情報履歴蓄積部109には、当該統計情報履歴蓄積部109に格納される情報のスキーマが格納される。また、統計情報履歴蓄積部109には、事象特定フィルタ106によって出力された対象システム情報が格納される。
【0033】
相関関係分析部110は、統計情報履歴蓄積部109に格納された頻度情報(によって示される頻度)および頻度変化情報(によって示される頻度の変化)と対象システム情報との間の相関関係の有無に関する分析を行う。また、相関関係分析部110は、相関関係以外の一定のルールに沿って、この両者の指標の関係性の把握のための分析を行う。
【0034】
行動モデル分析部111は、統計情報履歴蓄積部109に格納された対象システム情報(事象特定フィルタ106によって出力された対象システム情報)が例えば複数のグルーピングに分けられる等の一定の状況にある場合、それらのグループを分離して個別の相関関係を算出し、当該個々のグループの条件を明確化する。例えば、経理システムにおける締め等では、売上指示が来てから実際に処理を行うまでのパターンは例えば「即座」、「計画的な遅延」、「締め切り間際まで実施を行わない」等の行動パターンに分けられる場合がある。それらはシステム自体、あるいはシステムに関与する人間の行動パターンに基づくものであるので、兆候情報に紐付けられるのではなく、対象システム情報に付随する「属性」に紐付けられるものであり、行動モデル分析部111は上記した相関関係分析部110とは異なる機能として扱う。
【0035】
相関関係知識情報格納部112には、相関関係分析部110および行動モデル分析部111の結果に基づき、統計情報履歴蓄積部109に格納された頻度情報や頻度変化情報、あるいはそれらの情報をもとに生成した統計情報や演算情報と、統計情報履歴蓄積部109に格納された対象システム情報との関係性を示す相関関係知識情報が格納される。
【0036】
対象値予測部113は、相関関係知識情報格納部112に格納された相関関係知識情報をもとに、統計情報履歴蓄積部112に格納された頻度情報、頻度変化情報(関係システム紐付け部103によって出力された兆候情報)および対象システム情報(事象特定フィルタ106によって出力された対象システム情報)、もしくはそれらの複数の情報を統計処理あるいは演算処理した結果を用い、必要な予測値(つまり、対象システムにかかる負荷の予測値)を出力する。
【0037】
アクション実施知識情報格納部114には、実施されるアクションに関するルールが格納されている。なお、アクション実施知識情報格納部114に格納されているルールは、対象値予測部113によって出力される予測値(予測結果)を判断するための情報の1つとして用いられる。
【0038】
アクション実施部115は、対象値予測部113によって出力された予測結果を参照し、アクション実施知識情報格納部114に格納されたルールをもとに必要なアクションを実施する。
【0039】
以下、本実施形態に係る注目対象予測装置100の具体的な動作について説明する。ここでは、注目対象予測装置100における個々の機能間のデータの流れと、そのロジックについて説明する。
【0040】
本実施形態に係る注目対象予測装置100における動作には、大きく分けて「データ収集」、「データ分析」および「データ予測」の3フェーズがある。以下の説明においては、「データ収集」のフェーズをデータ収集フェーズ、「データ分析」のフェーズをデータ分析フェーズ、「データ予測」のフェーズをデータ予測フェーズと称する。なお、データ収集フェーズは、データ分析フェーズおよびデータ予測フェーズの両者に対して共通的に稼動する。以下、データ収集フェーズ、データ分析フェーズおよびデータ予測フェーズの各々について詳細に説明する。
【0041】
まず、データ収集フェーズについて説明する。このデータ収集フェーズにおいては、兆候候補データの収集処理、兆候候補データの検索・抽出処理、情報のストリーミング化処理、対象事象出力データの把握処理、情報に対するシステムの特定処理が行われる。
【0042】
兆候候補データの収集処理においては、予め定義された範囲のデータが外部事象ストリーム管理装置101にて取得され、検索が可能なような形態に変更される。これにより、外部事象ストリーム管理装置101においては、兆候候補データが一定期間管理可能となる。
【0043】
なお、兆候候補データは、非定形文書等を想定しているため、その整形にはいくつかのプロセスが必要となる。
【0044】
ここで、図2を参照して、外部事象ストリーム管理装置101の受け入れアルゴリズムについて説明する。
【0045】
まず、対象とする情報をデータアダプタにより共通のコンテンツスキーマに変換する。データアダプタは、必要な情報源との通信I/F(HTTP、SOA/XML、ファイル渡し等)を持ち、コード変換(旧JIS、JIS2022、UTF−8等)を行い、外部の情報を対象機械の読み取り・処理可能な情報に変換する(ステップS1)。ここでは、自由文情報は、コード等の変更はあるが、当該自由文情報のまま保持され、それ以外にデータソース、アダプタ情報、受信日付等のデータ分析に必要な補助情報がそれに添付される。
【0046】
次に、データアダプタの種類、データのソース等の情報をもとに受信されたデータの種類を特定する(ステップS2)。例えばデータアダプタが週報管理システムからの情報抽出アダプタである場合には、データ種類は週報となる。また、例えばデータアダプタがメールサーバからの情報抽出アダプタである場合には、データ種類は社内メールとなる。これにより、データアダプタから得られた情報にデータ種類が付加される。
【0047】
次に、特定されたデータの種類に従って、どのようなストリーム情報に変換するかのルールを参照してストリーム変換を行う(ステップS3)。ここでは、例えば図3に示すように、日本語週報に対して「発信元」、「発信者役職」、「受信先」、「受信者役職」、「時間」、「特徴語」および「本文リンク先」を収納するデータ形式に変換される。ここで、特徴語とは、文字列検索、形態素解析等の分析手法によりデータソースから抽出された単語群のうち、特徴語辞書とのマッチングまたは文書群からのクラスタ分析、代表文抽出手法等の補助情報により抽出された、機能目的に対応する単語群のことである。
【0048】
なお、ストリーム変換された情報(自由文情報)は、外部事象ストリーム管理装置101内のストリーム蓄積装置に保管(収納)される(ステップS4)。
【0049】
兆候候補データの検索・抽出処理においては、外部事象ストリーム管理装置101に蓄積されている情報から、必要項目抽出フィルタ102により兆候分析の対象となる数値種類が引用される。なお、兆候候補データの検索・抽出処理における抽出条件は、関係システム紐付け部103による設定である。ここで、抽出条件が例えばメールに基づく売り上げに関するやり取りである場合には、営業管理職と営業担当とのやり取り、あるいは営業職間のやり取りが抽出される。なお、売上に関する情報を抽出したい場合には、例えば「検収」、「エビデンス」および「受注」等のキーワードが抽出される。なお、図4は、上記した図3に示す情報から必要項目抽出フィルタ102によって抽出された情報(兆候候補データ)の一例を示す。
【0050】
情報のストリーミング化処理において、関係システム紐付け部103は、必要項目抽出フィルタ102がどのような情報を集めるべきかを定め、情報の抽出を当該必要項目抽出フィルタ102に対して指示する。関係システム紐付け部103の内部で、必要項目抽出フィルタ102による抽出結果情報(兆候候補データ)が持つべき属性、付加情報等を添付し、また不在情報の補填、誤情報の削除等を行った上でストリーミング化する。なお、例えば図5に示すようなストリーミング化された情報(兆候情報)は、頻度分析部107に渡され、長期的な相関関係の分析・発見に用いられ、また直近の予測に用いられる。
【0051】
対象事象出力データの把握処理においては、予め定められたシステムの出力結果(出力値)等が対象事象出力結果ストリーム管理装置104において保持される。目標出力として取得されるものが明白でない場合があるため、対象事象出力結果ストリーム管理装置104において保持される情報は、上記した外部事象ストリーム管理装置101と同様に多くなるが、システム情報は数値ベースであるため、対象事象出力結果ストリーム管理装置104の受け入れアルゴリズムは、当該外部事象ストリーム管理装置101の受け入れアルゴリズムより単純となる。
【0052】
図6に示すように、対象事象出力結果ストリーム管理装置104の受け入れアルゴリズムにおいては、上述した図2に示すステップS1、S3及びS4の処理に相当するステップS11〜S13の処理が実行されるが、当該図2に示すステップS2の処理に相当する処理は実行されない。
【0053】
また、対象事象出力データの把握処理において、例えば計上システムの月末負荷を対象としたい場合は、月末におけるピーク負荷等が対象となる。この場合、対象となる情報には、非定形情報は含まれず、主にシステム監視ログ等が対象となる。ピーク負荷の定義は種々あるが、例えば5分間でのトランザクション数/秒の平均値のその日における最大値等とすることができる。なお、図7は、システム監視ログの一例を示す。
【0054】
情報に対するシステムの特定処理において、システム特定フィルタ105は、対象事象出力結果ストリーム管理装置104に蓄積されている情報から、どのシステムからのどのような情報を取得すべきかを明確化し、当該取得に必要とされる検索条件を生成するまたはローカルな記憶装置から取得することによって、必要な情報を得る。
【0055】
事象特定フィルタ106は、このようにシステム特定フィルタ105によって得られた情報(システム情報)から、システム負荷予測の場合はピーク発生等の分析に利用する範囲のデータを絞り込む。この場合、観測対象がある閾値を超える、または観測値変動幅がある閾値を超える等のイベントから分析に十分な量のデータを取得可能な時間間隔の中から取得していく。これにより、事象特定フィルタ106は、対象システム情報を取得する。事象特定フィルタ106は、取得された対象システム情報に対してターゲットとなったイベント、必要であればタイムスタンプの修正等を行って、当該情報を頻度分析部107に渡す。なお、図8は、事象特定フィルタ106から頻度分析部107に渡される対象システム情報の一例を示す。
【0056】
次に、データ分析フェーズについて説明する。このデータ分析フェーズにおいては、頻度分析処理、相関関係分析処理、グループ分析処理が行われる。
【0057】
頻度分析処理において、頻度分析部107は、関係システム紐付け部103から渡された兆候情報から、発生頻度、スタック数または発生間隔等の発生量に関する情報(頻度情報)を取り出し、当該頻度情報を差分検知部108および対象値予測部113に渡す。また、頻度分析部107は、頻度情報を統計情報履歴蓄積部109に蓄積する。
【0058】
更に、頻度分析部107は、事象特定フィルタ106から渡された対象システム情報に関しても、必要であれば頻度または分散等の統計的な処理を実行して統計情報履歴蓄積部109に蓄積する。
【0059】
例えば売上システムに関係する情報としてシステム利用ログ、事前活動ジョブ管理システム、週報情報、および関係する部隊が利用している電子メール等が挙げられる。この場合、これらの情報源をもととして、図5に示す兆候情報から例えば図9に示す頻度情報が取り出される(取得される)。なお、図9に示す頻度情報に含まれる兆候情報発生数は、例えば「受注」等の特徴語が含まれる日毎のメール数を示す。
【0060】
また、差分検知部108は、頻度分析部107から渡された頻度情報をもとに、発生量に関する情報から発生量の変動情報を把握してその結果(頻度変化情報)を対象値予測部113に渡す。なお、差分検知部108は、頻度変化情報を統計情報履歴蓄積部109に蓄積する。
【0061】
相関関係分析処理において、相関関係分析部110は、統計情報履歴蓄積部109に蓄積された情報をもとに、兆候情報(頻度情報および頻度変化情報)と対象システム情報(ピーク情報および時系列変動情報)との相関関係の有無について検討を行う。具体的には、計上システムのシステムピーク分析を行う場合には兆候情報として「売上処理マネージャと担当との間での「売り上げ」、「締め切り」および「エビデンス」等のキーワードの量」が考えられる。相関関係分析部110は、これらの兆候情報と実際のシステムの値(例えば、ピークの大きさ)等との関係性を明確化し、当該相関関係が有意にある、または設定された閾値を超えて相関関係を有するデータ関係を示す相関関係知識情報を生成し、当該相関関係知識情報を相関関係知識情報格納部112に格納する。
【0062】
ここで、図10を参照して、相関関係分析部110の処理について具体的に説明する。まず、相関関係分析部110は、関係システム紐付け部103を経由して非定型情報から生成される兆候情報ストリームを、時系列要素に分解する(ステップS21)。これにより、相関関係分析部110は、時系列頻度情報および時系列頻度変化情報を取得する。このとき、相関関係分析部110は、様々な情報の組み合わせで時間別の頻度および頻度変化が分かる形に分解し、時系列データマイニングができる形とする。具体的には、例えば図3に示す情報が図11に示すように変換される。ここでは、仮にテーブルが作成されているが、この情報は時間軸の詳細化、送信先等の「細分化できる属性」の「ドリルダウン」に対しても適用が可能なものとする。
【0063】
次に、相関関係分析部110は、時系列頻度変化情報と事象特定フィルタ106経由で取得されたシステムログ等の対象システム情報(対象事象発生情報)との相関関係を分析(計算)する(ステップS22)。例えば、システムの負荷がピーク値PeakAとなった場合、その時刻(ピーク時間)と「ピーク値」が相関関係の対象となる。ピーク時間と「兆候情報ストリーム頻度変化情報」の中である程度定まった時間(例えば、売上計上なら1日前まで)の中で、同じようにピークになるものはどれか、または売上計上システムのルーチンとして週毎・月毎・期毎にピークが発生するが以前もシステム負荷がピーク値になる前に同じようにピークを迎えることがあったか等を確認する(ステップS23)。これは、時系列情報における繰り返しのピークの時間帯TPeakA(n)と、対象とする非定型情報の頻度ピークの時間帯TPeakB(n)との両者の「発生間隔がある範囲に収まっているか」を確認していく、または両者を時系列情報とみなした際に「同じ周期のパターン波形となる要素が強く出ているか」等の判定を行うことで実現できる。
【0064】
相関係数が設定された数値より高い場合は、そのイベント発生順序に関する情報を相関関係知識情報に反映させる(ステップS24)。
【0065】
なお、相関関係があるパラメータに対しては、更に量的な部分の相関を調査する。対象事象発生情報から取得できるピーク値PeakA(n)と、図11に示す時系列頻度変化情報から取得できる非構造情報発生頻度のピーク値PeakB(n)との相関関係を分析する。複数の兆候事象が関係すると考えられる場合、この分析には重回帰分析等の統計手法が用いられる。
【0066】
相関係数が設定された数値より高い場合は、その定量化に関する情報を相関関係知識情報に反映させる。
【0067】
ここで、相関関係分析部110において可能なのは、兆候となり得る情報(つまり、兆候情報)とシステムアウトプットの情報(つまり、対象システム情報)とがシンプルに相関関係を保持する場合のみであるが、実際には複数の行動モデルで動く対象が同一出力を発行している場合がある。具体的には、経理情報のシステムピーク分析等では、例えば「売上指示を受けてすぐ経理入力をする人」、「計画に沿って適宜経理入力をする人」および「締め切り直前まで粘って経理入力する人」の3パターンある、等である。
【0068】
この場合、単なる相関関係の分析以外にクラスタ分析等を行い、個々のグループのパターン・モデルを明確にする必要がある。そこで、グループ分析処理において、行動モデル分析部111は、対象システム情報(事象特定フィルタ106の結果)を分析し、適切なグループに分けた上で、個々のグループと頻度情報(頻度分析部107の結果)または頻度変化情報(差分検知部108の結果)との照合をとり、相関関係を判断し、そのグループとの相関関係が有意にある、あるいは設定された閾値を超えて相関関係が見られるデータ関係を示す相関関係を示す相関関係知識情報を生成し、当該相関関係知識情報を相関関係知識情報格納部112に格納する。
【0069】
次に、データ予測フェーズについて説明する。このデータ予測フェーズにおいては、関係データの取得処理、予測の実施処理、兆候に対するアクションの実施処理が行われる。
【0070】
関係データの取得処理において、対象値予測部113は、兆候候補の情報の変動情報である頻度分析部107および差分検知部108の両者からの情報を随時監視する。
【0071】
ここで、図12を参照して、予測の実施処理における対象値予測部113の動作について説明する。予測の実施処理において、対象値予測部113は、頻度分析部107および差分検知部108からの情報(頻度情報および頻度変化情報)を取得する(ステップS31)。また、対象値予測部113は、相関関係知識情報格納部112に格納された相関関係知識情報から監視内容を検索する(ステップS32)。
【0072】
対象値予測部113は、取得された頻度分析部107および差分検知部108からの情報(監視対象ストリームデータ)と監視内容の検索結果(監視対象一覧)に基づいて、当該監視対象ストリームデータから常時一覧を取得し(ステップS33)、兆候情報およびその動きに基づき、対象と考える事象に対して予測値を計算する(ステップS34)。なお、対象値予測部113によって計算された予測値は、アクション実施部115に渡される(出力される)。
【0073】
具体的には、計上システムにおけるピーク時の負荷をメールまたは週報等の自然文から得られた兆候情報から予測する場合は、「1.兆候情報の最大発生数」、「2.兆候情報の平均発生数」、「3.兆候情報分布と正規分布の差異、あるいは既存分布情報との差異」等の数値との相関関係が考えられる。なお、これらの情報は、全て兆候として捉えられる。
【0074】
ここで、予測値の計算例について具体的に説明する。ある事象Aに対して複数の兆候情報SIiがあり、当該事象AのピークキャパシティPeakAとそれぞれの兆候情報事象iとの相関関係係数がai、オフセットがbiのとき、予測ピーク値PeakA_Preを
【数1】
【0075】
と表すことが考えられる。この式は、SIiを特定すれば、重回帰分析等で求めることが可能である。
【0076】
兆候に対するアクションの実施処理において、アクション実施部115は、対象値予測部113から渡された予測値に関係してどのようなアクションを行うかをアクション実施知識情報格納部114に格納されているルール(アクション実施知識情報)をもとに判別し、実施する。
【0077】
具体的には、計上管理システムのピーク時負荷予測PeakA_Preがアクション実施知識情報格納部114に設定されている閾値Thiより大きくなれば、当該ピーク時にレスポンス等の劣化・業務遅延等が起こりうる状態となり、対策を講じる必要がある。なお、対象値予測部113によって取得できる情報はあくまで非構造情報をもとにしたいくつかの数値の予測にすぎないため、どのような対策を講じるか(例えば、接続を予め絞る、サーバのCPUまたはメモリを増強する、サーバを追加する等)は、ビジネス要件、稼動システムの制約等が織り込まれたアクション実施知識情報格納部114における知識に依存する。アクション実施知識情報格納部114に収められる知識は、業務及びシステムの重要性に依存する。また、それらの知識の要件定義に関しては様々なものが存在するため、その詳しい説明は省略する。
【0078】
ここで、本実施形態に係る注目対象予測装置100においてシステムの負荷を予測する場合の概要について簡単に説明する。
【0079】
ここでは、ITシステムのピーク時予測のために、担当営業が受けるメールを用いる場合について説明する。システムで売上を立てる前に、通常、メール等の方法により何らかの指示が営業に対して入る。ここで、システムを操作する対象者および指示を出すべき者等のフィルタリングを行い、メールまたはメッセージシステムの中に売り上げに関する表現(例えば、「売り上げ」、「締め」等)が含まれているものを検索する。実システムピークと関係する用語の頻出度(あるいは発生頻度の変化)に相関関係が明確化していると確認された場合には、その知識が格納される。その情報を用いることによって、社内を飛び交うメッセージの情報からシステムピークを予測することが可能になる。
【0080】
上記したように本実施形態においては、業務に関係する関係情報(例えば、関係者等がやり取りしている文書またはメッセージ等)から対象システムの負荷を予測するために兆候となる情報群の頻度を取得し、当該取得された頻度および当該頻度の変化と対象システムの出力値に関係するシステム情報との間の相関関係の有無に関する分析を行い、当該分析結果に基づいて当該頻度および当該頻度の変化とシステム情報との関係性を示す相関関係知識情報を生成し、当該生成された相関関係知識情報をもとに当該頻度、当該頻度の変化およびシステム情報を用い、対象システムにかかる負荷の予測値を出力する構成により、システム性能予測に対する外部情報を活用し、外部事象の状況をもとにシステムにかかる負荷を予測することが可能となる。
【0081】
具体的には、本実施形態によれば、例えばITシステムのピーク予測に対して必要とされる外部情報を取り入れやすくなり、このように対象とする情報を拡大し、処理自体は単語抽出またはロール反映等の現行のシステムにおいて可能なものに限定して予測システムを構築することができ、実装面および保守性等の運用面を考慮した上で実現性が高く、機能向上または精度向上が可能となる。
【0082】
なお、本実施形態においては、システムにかかる負荷を予測するために用いられるとして説明したが、本実施形態に係る注目対象予測装置100は、例えば大量の情報をもとに統計的な動きをするシステムであれば適用することができる。具体的には、例えば「市況ニュース」を関係情報(兆候情報)として用い、「株価」をシステム情報として用いることによって、本実施形態に係る注目対象予測装置100において例えば株価変動の予測を行い、業務をサポートすることも可能である。
【0083】
また、本願発明は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組合せにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。
【符号の説明】
【0084】
100…注目対象予測装置、101…外部事象ストリーム管理装置(関係情報格納手段)、102…必要項目抽出フィルタ、103…関係システム紐付け部、104…対象事象出力結果ストリーム管理装置(システム情報格納手段)、105…システム特定フィルタ、106…事象特定フィルタ、107…頻度分析部(頻度取得手段)、108…差分検知部、109…統計情報履歴蓄積部、110…相関関係分析部、111…行動モデル分析部、112…相関関係知識情報格納部、113…対象値予測部、114…アクション実施知識情報格納部、115…アクション実施部。
【技術分野】
【0001】
本発明の実施形態は、対象となるシステムにかかる負荷を予測するための注目対象予測装置に関する。
【背景技術】
【0002】
一般的に、例えば業務等で用いられるシステム(ITシステム)においては、当該業務の内容に応じて当該システムにかかる負荷が変動する。
【0003】
そこで、このようなシステムにかかる負荷を予め知ることができれば、業務をより効率的に行うことができると考えられる。
【0004】
したがって、業務をサポートする上で、対象となるシステムにかかる負荷(数値)を予測することが望まれている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2008−225579号公報
【特許文献2】特開2007−133805号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、例えば通常の業務で用いられるシステムにおいては、その負荷の予測をシステム内部の情報から行うことは困難である。実際の業務要件によりシステム負荷は変化するが、一般的に、企業の業務は、そのときに発生している業務要件に依存して負荷が変動する。
【0007】
そのため、例えばシステム上の「既存のログ」等による予測は正確なものではなく、当該システムが対象としている業務自体の負荷を予測するための手がかりの方が当該システムにかかる負荷の予測に役立つ。具体的には、経理業務であれば月末のシステムの負荷が高い、等である。
【0008】
主に業務の負荷予測は業務知識ベースで作成されるが、それも現在では例えば技術進展(サービス化等)に伴う利用ITの変化、規制・法制または国際化等に伴うビジネス環境の変化等により都度変動している。
【0009】
したがって、今稼動しているシステムからは把握できない業務上の兆候をもとに予測を行う必要が生じている。
【0010】
そこで、本発明が解決しようとする課題は、外部事象の状況をもとにシステムにかかる負荷を予測することが可能な注目対象予測装置を提供することにある。
【課題を解決するための手段】
【0011】
実施形態によれば、業務で用いられるシステムにかかる負荷を予測する注目対象予測装置が提供される。
【0012】
実施形態に係る注目対象予測装置は、関係情報格納手段と、システム情報格納手段と、頻度取得手段と、相関関係分析手段と、生成手段と、対象値予測手段とを具備する。
【0013】
関係情報格納手段は、前記業務に関係する関係情報を格納する。
【0014】
システム情報格納手段は、前記システムの出力値に関係するシステム情報を格納する。
【0015】
頻度取得手段は、前記関係情報格納手段に格納されている関係情報から前記システムの負荷を予測するために兆候となる情報群の頻度を取得する。
【0016】
相関関係分析手段は、前記取得された頻度および当該頻度の変化と前記システム情報格納手段に格納されているシステム情報との間の相関関係の有無に関する分析を行う。
【0017】
生成手段は、前記分析結果に基づいて、前記取得された頻度および当該頻度の変化と前記システム情報との関係性を示す相関関係知識情報を生成する。
【0018】
対象値予測手段は、前記生成された相関関係知識情報をもとに、前記取得された頻度、当該頻度の変化および前記システム情報を用い、前記システムにかかる負荷の予測値を出力する。
【図面の簡単な説明】
【0019】
【図1】実施形態に係る注目対象予測装置100の主として機能構成を示すブロック図。
【図2】外部事象ストリーム管理装置101の受け入れアルゴリズムについて説明するための図。
【図3】ストリーム変換された自由文情報の一例を示す図。
【図4】必要項目抽出フィルタ102によって抽出された兆候候補データの一例を示す図。
【図5】ストリーミング化された兆候情報の一例を示す図。
【図6】対象事象出力結果ストリーム管理装置104の受け入れアルゴリズムについて説明するための図。
【図7】システム監視ログの一例を示す図。
【図8】事象特定フィルタ106から頻度分析部107に渡される対象システム情報の一例を示す図。
【図9】頻度分析部107によって取得される頻度情報の一例を示す図。
【図10】相関関係分析部110の処理について具体的に説明するための図。
【図11】相関関係分析部110によって取得される時系列頻度変化情報の一例を示す図。
【図12】予測の実施処理における対象値予測部113の動作について説明するための図。
【発明を実施するための形態】
【0020】
以下、図面を参照して、実施形態について説明する。
【0021】
図1は、本実施形態に係る注目対象予測装置100の主として機能構成を示すブロック図である。この注目対象予測装置100は、例えば業務等で用いられるシステムにかかる負荷を予測するために用いられる。以下の説明においては、注目対象予測装置100において負荷が予測される対象となるシステムを対象システムと称する。
【0022】
なお、注目対象予測装置100は、当該装置の各機能を実現するためのハードウェア構成、またはハードウェアとソフトウェアとの組み合わせ構成として実現されている。ソフトウェアは、予め記憶媒体またはネットワークからインストールされ、注目対象予測装置100にその機能を実現させるためのプログラムからなる。
【0023】
図1に示すように、注目対象予測装置100は、外部事象ストリーム管理装置101、必要項目抽出フィルタ102、関係システム紐付け部103、対象事象出力結果ストリーム管理装置104、システム特定フィルタ105、事象特定フィルタ106、頻度分析部107、差分検知部108、統計情報履歴蓄積部109、相関関係分析部110、行動モデル分析部111、相関関係知識情報格納部112、対象値予測部113、アクション実施知識情報格納部114およびアクション実施部115を含む。
【0024】
外部事象ストリーム管理装置101は、業務に関係する関係情報を格納および管理する機能を有する。具体的には、外部事象ストリーム管理装置101は、例えば対象とする業務の関係者全体がやり取りしている文書またはメッセージ等を一定期間格納および管理し、必要な項目に対する十分な検索機能を有する。
【0025】
必要項目抽出フィルタ102は、外部事象ストリーム管理装置101において管理されている関係情報の中から、設定されたキー(当該関係情報に含まれる単語、発信元、発信先、時間等)をもとに必要と考えられる、兆候となりそうな情報を抽出する(フィルタリングする)。
【0026】
関係システム紐付け部103は、必要項目抽出フィルタ102の機能に対し、どのような情報を抽出するかを指示し、また、抽出された情報がどのような機能と関係するかを明確化する機能を有する。これにより、関係システム紐付け部103は、対象システムの負荷を予測するために兆候となる情報(以下、兆候情報と表記)を出力する。
【0027】
対象事象出力結果ストリーム管理装置104は、対象システムの出力値(システムセッション数、CPU平均/最大瞬間負荷等)に関係する情報(以下、システム情報と表記)を一定期間格納および管理し、必要な検索を行う機能を有する。通常、事象に付随する生データからは直接把握したい数値は出てこないため、対象事象出力結果ストリーム管理装置104においては、対象システムに関する情報以外に雑多の情報が格納および管理されている。
【0028】
システム特定フィルタ105は、対象事象出力結果ストリーム管理装置104において管理されている情報の中から、対象システムに関係する情報(システム情報)を抽出する。
【0029】
事象特定フィルタ106は、システム特定フィルタ105によって抽出された対象システムに関係するシステム情報のうち、例えば「ピーク発生している期間の情報」等の必要な情報を切り出す。以下、事象特定フィルタ106によって切り出された情報は、対象システム情報と称する。
【0030】
頻度分析部107は、関係システム紐付け部103によって出力された兆候情報から、兆候となる情報群の頻度を演算する。これにより、頻度分析部107は、兆候となる情報群の頻度を示す頻度情報を取得する。また、頻度分析部107は、事象特定フィルタ106によって出力された対象システム情報から必要とされる情報の条件(ピーク時として判断される期間、平常時の期間等)を明確化して切り出す。
【0031】
差分検知部108は、頻度分析部107によって取得された頻度情報(によって示される頻度)をもとに、当該頻度の変化を把握する。これにより、差分検知部108は、頻度分析部107によって取得された頻度情報によって示される頻度の変化を示す頻度変化情報を取得する。
【0032】
統計情報履歴蓄積部109には、頻度分析部107によって取得された頻度情報および差分検知部108によって取得された頻度変化情報が格納される。また、統計情報履歴蓄積部109には、当該統計情報履歴蓄積部109に格納される情報のスキーマが格納される。また、統計情報履歴蓄積部109には、事象特定フィルタ106によって出力された対象システム情報が格納される。
【0033】
相関関係分析部110は、統計情報履歴蓄積部109に格納された頻度情報(によって示される頻度)および頻度変化情報(によって示される頻度の変化)と対象システム情報との間の相関関係の有無に関する分析を行う。また、相関関係分析部110は、相関関係以外の一定のルールに沿って、この両者の指標の関係性の把握のための分析を行う。
【0034】
行動モデル分析部111は、統計情報履歴蓄積部109に格納された対象システム情報(事象特定フィルタ106によって出力された対象システム情報)が例えば複数のグルーピングに分けられる等の一定の状況にある場合、それらのグループを分離して個別の相関関係を算出し、当該個々のグループの条件を明確化する。例えば、経理システムにおける締め等では、売上指示が来てから実際に処理を行うまでのパターンは例えば「即座」、「計画的な遅延」、「締め切り間際まで実施を行わない」等の行動パターンに分けられる場合がある。それらはシステム自体、あるいはシステムに関与する人間の行動パターンに基づくものであるので、兆候情報に紐付けられるのではなく、対象システム情報に付随する「属性」に紐付けられるものであり、行動モデル分析部111は上記した相関関係分析部110とは異なる機能として扱う。
【0035】
相関関係知識情報格納部112には、相関関係分析部110および行動モデル分析部111の結果に基づき、統計情報履歴蓄積部109に格納された頻度情報や頻度変化情報、あるいはそれらの情報をもとに生成した統計情報や演算情報と、統計情報履歴蓄積部109に格納された対象システム情報との関係性を示す相関関係知識情報が格納される。
【0036】
対象値予測部113は、相関関係知識情報格納部112に格納された相関関係知識情報をもとに、統計情報履歴蓄積部112に格納された頻度情報、頻度変化情報(関係システム紐付け部103によって出力された兆候情報)および対象システム情報(事象特定フィルタ106によって出力された対象システム情報)、もしくはそれらの複数の情報を統計処理あるいは演算処理した結果を用い、必要な予測値(つまり、対象システムにかかる負荷の予測値)を出力する。
【0037】
アクション実施知識情報格納部114には、実施されるアクションに関するルールが格納されている。なお、アクション実施知識情報格納部114に格納されているルールは、対象値予測部113によって出力される予測値(予測結果)を判断するための情報の1つとして用いられる。
【0038】
アクション実施部115は、対象値予測部113によって出力された予測結果を参照し、アクション実施知識情報格納部114に格納されたルールをもとに必要なアクションを実施する。
【0039】
以下、本実施形態に係る注目対象予測装置100の具体的な動作について説明する。ここでは、注目対象予測装置100における個々の機能間のデータの流れと、そのロジックについて説明する。
【0040】
本実施形態に係る注目対象予測装置100における動作には、大きく分けて「データ収集」、「データ分析」および「データ予測」の3フェーズがある。以下の説明においては、「データ収集」のフェーズをデータ収集フェーズ、「データ分析」のフェーズをデータ分析フェーズ、「データ予測」のフェーズをデータ予測フェーズと称する。なお、データ収集フェーズは、データ分析フェーズおよびデータ予測フェーズの両者に対して共通的に稼動する。以下、データ収集フェーズ、データ分析フェーズおよびデータ予測フェーズの各々について詳細に説明する。
【0041】
まず、データ収集フェーズについて説明する。このデータ収集フェーズにおいては、兆候候補データの収集処理、兆候候補データの検索・抽出処理、情報のストリーミング化処理、対象事象出力データの把握処理、情報に対するシステムの特定処理が行われる。
【0042】
兆候候補データの収集処理においては、予め定義された範囲のデータが外部事象ストリーム管理装置101にて取得され、検索が可能なような形態に変更される。これにより、外部事象ストリーム管理装置101においては、兆候候補データが一定期間管理可能となる。
【0043】
なお、兆候候補データは、非定形文書等を想定しているため、その整形にはいくつかのプロセスが必要となる。
【0044】
ここで、図2を参照して、外部事象ストリーム管理装置101の受け入れアルゴリズムについて説明する。
【0045】
まず、対象とする情報をデータアダプタにより共通のコンテンツスキーマに変換する。データアダプタは、必要な情報源との通信I/F(HTTP、SOA/XML、ファイル渡し等)を持ち、コード変換(旧JIS、JIS2022、UTF−8等)を行い、外部の情報を対象機械の読み取り・処理可能な情報に変換する(ステップS1)。ここでは、自由文情報は、コード等の変更はあるが、当該自由文情報のまま保持され、それ以外にデータソース、アダプタ情報、受信日付等のデータ分析に必要な補助情報がそれに添付される。
【0046】
次に、データアダプタの種類、データのソース等の情報をもとに受信されたデータの種類を特定する(ステップS2)。例えばデータアダプタが週報管理システムからの情報抽出アダプタである場合には、データ種類は週報となる。また、例えばデータアダプタがメールサーバからの情報抽出アダプタである場合には、データ種類は社内メールとなる。これにより、データアダプタから得られた情報にデータ種類が付加される。
【0047】
次に、特定されたデータの種類に従って、どのようなストリーム情報に変換するかのルールを参照してストリーム変換を行う(ステップS3)。ここでは、例えば図3に示すように、日本語週報に対して「発信元」、「発信者役職」、「受信先」、「受信者役職」、「時間」、「特徴語」および「本文リンク先」を収納するデータ形式に変換される。ここで、特徴語とは、文字列検索、形態素解析等の分析手法によりデータソースから抽出された単語群のうち、特徴語辞書とのマッチングまたは文書群からのクラスタ分析、代表文抽出手法等の補助情報により抽出された、機能目的に対応する単語群のことである。
【0048】
なお、ストリーム変換された情報(自由文情報)は、外部事象ストリーム管理装置101内のストリーム蓄積装置に保管(収納)される(ステップS4)。
【0049】
兆候候補データの検索・抽出処理においては、外部事象ストリーム管理装置101に蓄積されている情報から、必要項目抽出フィルタ102により兆候分析の対象となる数値種類が引用される。なお、兆候候補データの検索・抽出処理における抽出条件は、関係システム紐付け部103による設定である。ここで、抽出条件が例えばメールに基づく売り上げに関するやり取りである場合には、営業管理職と営業担当とのやり取り、あるいは営業職間のやり取りが抽出される。なお、売上に関する情報を抽出したい場合には、例えば「検収」、「エビデンス」および「受注」等のキーワードが抽出される。なお、図4は、上記した図3に示す情報から必要項目抽出フィルタ102によって抽出された情報(兆候候補データ)の一例を示す。
【0050】
情報のストリーミング化処理において、関係システム紐付け部103は、必要項目抽出フィルタ102がどのような情報を集めるべきかを定め、情報の抽出を当該必要項目抽出フィルタ102に対して指示する。関係システム紐付け部103の内部で、必要項目抽出フィルタ102による抽出結果情報(兆候候補データ)が持つべき属性、付加情報等を添付し、また不在情報の補填、誤情報の削除等を行った上でストリーミング化する。なお、例えば図5に示すようなストリーミング化された情報(兆候情報)は、頻度分析部107に渡され、長期的な相関関係の分析・発見に用いられ、また直近の予測に用いられる。
【0051】
対象事象出力データの把握処理においては、予め定められたシステムの出力結果(出力値)等が対象事象出力結果ストリーム管理装置104において保持される。目標出力として取得されるものが明白でない場合があるため、対象事象出力結果ストリーム管理装置104において保持される情報は、上記した外部事象ストリーム管理装置101と同様に多くなるが、システム情報は数値ベースであるため、対象事象出力結果ストリーム管理装置104の受け入れアルゴリズムは、当該外部事象ストリーム管理装置101の受け入れアルゴリズムより単純となる。
【0052】
図6に示すように、対象事象出力結果ストリーム管理装置104の受け入れアルゴリズムにおいては、上述した図2に示すステップS1、S3及びS4の処理に相当するステップS11〜S13の処理が実行されるが、当該図2に示すステップS2の処理に相当する処理は実行されない。
【0053】
また、対象事象出力データの把握処理において、例えば計上システムの月末負荷を対象としたい場合は、月末におけるピーク負荷等が対象となる。この場合、対象となる情報には、非定形情報は含まれず、主にシステム監視ログ等が対象となる。ピーク負荷の定義は種々あるが、例えば5分間でのトランザクション数/秒の平均値のその日における最大値等とすることができる。なお、図7は、システム監視ログの一例を示す。
【0054】
情報に対するシステムの特定処理において、システム特定フィルタ105は、対象事象出力結果ストリーム管理装置104に蓄積されている情報から、どのシステムからのどのような情報を取得すべきかを明確化し、当該取得に必要とされる検索条件を生成するまたはローカルな記憶装置から取得することによって、必要な情報を得る。
【0055】
事象特定フィルタ106は、このようにシステム特定フィルタ105によって得られた情報(システム情報)から、システム負荷予測の場合はピーク発生等の分析に利用する範囲のデータを絞り込む。この場合、観測対象がある閾値を超える、または観測値変動幅がある閾値を超える等のイベントから分析に十分な量のデータを取得可能な時間間隔の中から取得していく。これにより、事象特定フィルタ106は、対象システム情報を取得する。事象特定フィルタ106は、取得された対象システム情報に対してターゲットとなったイベント、必要であればタイムスタンプの修正等を行って、当該情報を頻度分析部107に渡す。なお、図8は、事象特定フィルタ106から頻度分析部107に渡される対象システム情報の一例を示す。
【0056】
次に、データ分析フェーズについて説明する。このデータ分析フェーズにおいては、頻度分析処理、相関関係分析処理、グループ分析処理が行われる。
【0057】
頻度分析処理において、頻度分析部107は、関係システム紐付け部103から渡された兆候情報から、発生頻度、スタック数または発生間隔等の発生量に関する情報(頻度情報)を取り出し、当該頻度情報を差分検知部108および対象値予測部113に渡す。また、頻度分析部107は、頻度情報を統計情報履歴蓄積部109に蓄積する。
【0058】
更に、頻度分析部107は、事象特定フィルタ106から渡された対象システム情報に関しても、必要であれば頻度または分散等の統計的な処理を実行して統計情報履歴蓄積部109に蓄積する。
【0059】
例えば売上システムに関係する情報としてシステム利用ログ、事前活動ジョブ管理システム、週報情報、および関係する部隊が利用している電子メール等が挙げられる。この場合、これらの情報源をもととして、図5に示す兆候情報から例えば図9に示す頻度情報が取り出される(取得される)。なお、図9に示す頻度情報に含まれる兆候情報発生数は、例えば「受注」等の特徴語が含まれる日毎のメール数を示す。
【0060】
また、差分検知部108は、頻度分析部107から渡された頻度情報をもとに、発生量に関する情報から発生量の変動情報を把握してその結果(頻度変化情報)を対象値予測部113に渡す。なお、差分検知部108は、頻度変化情報を統計情報履歴蓄積部109に蓄積する。
【0061】
相関関係分析処理において、相関関係分析部110は、統計情報履歴蓄積部109に蓄積された情報をもとに、兆候情報(頻度情報および頻度変化情報)と対象システム情報(ピーク情報および時系列変動情報)との相関関係の有無について検討を行う。具体的には、計上システムのシステムピーク分析を行う場合には兆候情報として「売上処理マネージャと担当との間での「売り上げ」、「締め切り」および「エビデンス」等のキーワードの量」が考えられる。相関関係分析部110は、これらの兆候情報と実際のシステムの値(例えば、ピークの大きさ)等との関係性を明確化し、当該相関関係が有意にある、または設定された閾値を超えて相関関係を有するデータ関係を示す相関関係知識情報を生成し、当該相関関係知識情報を相関関係知識情報格納部112に格納する。
【0062】
ここで、図10を参照して、相関関係分析部110の処理について具体的に説明する。まず、相関関係分析部110は、関係システム紐付け部103を経由して非定型情報から生成される兆候情報ストリームを、時系列要素に分解する(ステップS21)。これにより、相関関係分析部110は、時系列頻度情報および時系列頻度変化情報を取得する。このとき、相関関係分析部110は、様々な情報の組み合わせで時間別の頻度および頻度変化が分かる形に分解し、時系列データマイニングができる形とする。具体的には、例えば図3に示す情報が図11に示すように変換される。ここでは、仮にテーブルが作成されているが、この情報は時間軸の詳細化、送信先等の「細分化できる属性」の「ドリルダウン」に対しても適用が可能なものとする。
【0063】
次に、相関関係分析部110は、時系列頻度変化情報と事象特定フィルタ106経由で取得されたシステムログ等の対象システム情報(対象事象発生情報)との相関関係を分析(計算)する(ステップS22)。例えば、システムの負荷がピーク値PeakAとなった場合、その時刻(ピーク時間)と「ピーク値」が相関関係の対象となる。ピーク時間と「兆候情報ストリーム頻度変化情報」の中である程度定まった時間(例えば、売上計上なら1日前まで)の中で、同じようにピークになるものはどれか、または売上計上システムのルーチンとして週毎・月毎・期毎にピークが発生するが以前もシステム負荷がピーク値になる前に同じようにピークを迎えることがあったか等を確認する(ステップS23)。これは、時系列情報における繰り返しのピークの時間帯TPeakA(n)と、対象とする非定型情報の頻度ピークの時間帯TPeakB(n)との両者の「発生間隔がある範囲に収まっているか」を確認していく、または両者を時系列情報とみなした際に「同じ周期のパターン波形となる要素が強く出ているか」等の判定を行うことで実現できる。
【0064】
相関係数が設定された数値より高い場合は、そのイベント発生順序に関する情報を相関関係知識情報に反映させる(ステップS24)。
【0065】
なお、相関関係があるパラメータに対しては、更に量的な部分の相関を調査する。対象事象発生情報から取得できるピーク値PeakA(n)と、図11に示す時系列頻度変化情報から取得できる非構造情報発生頻度のピーク値PeakB(n)との相関関係を分析する。複数の兆候事象が関係すると考えられる場合、この分析には重回帰分析等の統計手法が用いられる。
【0066】
相関係数が設定された数値より高い場合は、その定量化に関する情報を相関関係知識情報に反映させる。
【0067】
ここで、相関関係分析部110において可能なのは、兆候となり得る情報(つまり、兆候情報)とシステムアウトプットの情報(つまり、対象システム情報)とがシンプルに相関関係を保持する場合のみであるが、実際には複数の行動モデルで動く対象が同一出力を発行している場合がある。具体的には、経理情報のシステムピーク分析等では、例えば「売上指示を受けてすぐ経理入力をする人」、「計画に沿って適宜経理入力をする人」および「締め切り直前まで粘って経理入力する人」の3パターンある、等である。
【0068】
この場合、単なる相関関係の分析以外にクラスタ分析等を行い、個々のグループのパターン・モデルを明確にする必要がある。そこで、グループ分析処理において、行動モデル分析部111は、対象システム情報(事象特定フィルタ106の結果)を分析し、適切なグループに分けた上で、個々のグループと頻度情報(頻度分析部107の結果)または頻度変化情報(差分検知部108の結果)との照合をとり、相関関係を判断し、そのグループとの相関関係が有意にある、あるいは設定された閾値を超えて相関関係が見られるデータ関係を示す相関関係を示す相関関係知識情報を生成し、当該相関関係知識情報を相関関係知識情報格納部112に格納する。
【0069】
次に、データ予測フェーズについて説明する。このデータ予測フェーズにおいては、関係データの取得処理、予測の実施処理、兆候に対するアクションの実施処理が行われる。
【0070】
関係データの取得処理において、対象値予測部113は、兆候候補の情報の変動情報である頻度分析部107および差分検知部108の両者からの情報を随時監視する。
【0071】
ここで、図12を参照して、予測の実施処理における対象値予測部113の動作について説明する。予測の実施処理において、対象値予測部113は、頻度分析部107および差分検知部108からの情報(頻度情報および頻度変化情報)を取得する(ステップS31)。また、対象値予測部113は、相関関係知識情報格納部112に格納された相関関係知識情報から監視内容を検索する(ステップS32)。
【0072】
対象値予測部113は、取得された頻度分析部107および差分検知部108からの情報(監視対象ストリームデータ)と監視内容の検索結果(監視対象一覧)に基づいて、当該監視対象ストリームデータから常時一覧を取得し(ステップS33)、兆候情報およびその動きに基づき、対象と考える事象に対して予測値を計算する(ステップS34)。なお、対象値予測部113によって計算された予測値は、アクション実施部115に渡される(出力される)。
【0073】
具体的には、計上システムにおけるピーク時の負荷をメールまたは週報等の自然文から得られた兆候情報から予測する場合は、「1.兆候情報の最大発生数」、「2.兆候情報の平均発生数」、「3.兆候情報分布と正規分布の差異、あるいは既存分布情報との差異」等の数値との相関関係が考えられる。なお、これらの情報は、全て兆候として捉えられる。
【0074】
ここで、予測値の計算例について具体的に説明する。ある事象Aに対して複数の兆候情報SIiがあり、当該事象AのピークキャパシティPeakAとそれぞれの兆候情報事象iとの相関関係係数がai、オフセットがbiのとき、予測ピーク値PeakA_Preを
【数1】
【0075】
と表すことが考えられる。この式は、SIiを特定すれば、重回帰分析等で求めることが可能である。
【0076】
兆候に対するアクションの実施処理において、アクション実施部115は、対象値予測部113から渡された予測値に関係してどのようなアクションを行うかをアクション実施知識情報格納部114に格納されているルール(アクション実施知識情報)をもとに判別し、実施する。
【0077】
具体的には、計上管理システムのピーク時負荷予測PeakA_Preがアクション実施知識情報格納部114に設定されている閾値Thiより大きくなれば、当該ピーク時にレスポンス等の劣化・業務遅延等が起こりうる状態となり、対策を講じる必要がある。なお、対象値予測部113によって取得できる情報はあくまで非構造情報をもとにしたいくつかの数値の予測にすぎないため、どのような対策を講じるか(例えば、接続を予め絞る、サーバのCPUまたはメモリを増強する、サーバを追加する等)は、ビジネス要件、稼動システムの制約等が織り込まれたアクション実施知識情報格納部114における知識に依存する。アクション実施知識情報格納部114に収められる知識は、業務及びシステムの重要性に依存する。また、それらの知識の要件定義に関しては様々なものが存在するため、その詳しい説明は省略する。
【0078】
ここで、本実施形態に係る注目対象予測装置100においてシステムの負荷を予測する場合の概要について簡単に説明する。
【0079】
ここでは、ITシステムのピーク時予測のために、担当営業が受けるメールを用いる場合について説明する。システムで売上を立てる前に、通常、メール等の方法により何らかの指示が営業に対して入る。ここで、システムを操作する対象者および指示を出すべき者等のフィルタリングを行い、メールまたはメッセージシステムの中に売り上げに関する表現(例えば、「売り上げ」、「締め」等)が含まれているものを検索する。実システムピークと関係する用語の頻出度(あるいは発生頻度の変化)に相関関係が明確化していると確認された場合には、その知識が格納される。その情報を用いることによって、社内を飛び交うメッセージの情報からシステムピークを予測することが可能になる。
【0080】
上記したように本実施形態においては、業務に関係する関係情報(例えば、関係者等がやり取りしている文書またはメッセージ等)から対象システムの負荷を予測するために兆候となる情報群の頻度を取得し、当該取得された頻度および当該頻度の変化と対象システムの出力値に関係するシステム情報との間の相関関係の有無に関する分析を行い、当該分析結果に基づいて当該頻度および当該頻度の変化とシステム情報との関係性を示す相関関係知識情報を生成し、当該生成された相関関係知識情報をもとに当該頻度、当該頻度の変化およびシステム情報を用い、対象システムにかかる負荷の予測値を出力する構成により、システム性能予測に対する外部情報を活用し、外部事象の状況をもとにシステムにかかる負荷を予測することが可能となる。
【0081】
具体的には、本実施形態によれば、例えばITシステムのピーク予測に対して必要とされる外部情報を取り入れやすくなり、このように対象とする情報を拡大し、処理自体は単語抽出またはロール反映等の現行のシステムにおいて可能なものに限定して予測システムを構築することができ、実装面および保守性等の運用面を考慮した上で実現性が高く、機能向上または精度向上が可能となる。
【0082】
なお、本実施形態においては、システムにかかる負荷を予測するために用いられるとして説明したが、本実施形態に係る注目対象予測装置100は、例えば大量の情報をもとに統計的な動きをするシステムであれば適用することができる。具体的には、例えば「市況ニュース」を関係情報(兆候情報)として用い、「株価」をシステム情報として用いることによって、本実施形態に係る注目対象予測装置100において例えば株価変動の予測を行い、業務をサポートすることも可能である。
【0083】
また、本願発明は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組合せにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。
【符号の説明】
【0084】
100…注目対象予測装置、101…外部事象ストリーム管理装置(関係情報格納手段)、102…必要項目抽出フィルタ、103…関係システム紐付け部、104…対象事象出力結果ストリーム管理装置(システム情報格納手段)、105…システム特定フィルタ、106…事象特定フィルタ、107…頻度分析部(頻度取得手段)、108…差分検知部、109…統計情報履歴蓄積部、110…相関関係分析部、111…行動モデル分析部、112…相関関係知識情報格納部、113…対象値予測部、114…アクション実施知識情報格納部、115…アクション実施部。
【特許請求の範囲】
【請求項1】
業務で用いられるシステムにかかる負荷を予測するための注目対象予測装置において、
前記業務に関係する関係情報を格納する関係情報格納手段と、
前記システムの出力値に関係するシステム情報を格納するシステム情報格納手段と、
前記関係情報格納手段に格納されている関係情報から前記システムの負荷を予測するために兆候となる情報群の頻度を取得する頻度取得手段と、
前記取得された頻度および当該頻度の変化と前記システム情報格納手段に格納されているシステム情報との間の相関関係の有無に関する分析を行う相関関係分析手段と、
前記分析結果に基づいて、前記取得された頻度および当該頻度の変化と前記システム情報との関係性を示す相関関係知識情報を生成する生成手段と、
前記生成された相関関係知識情報をもとに、前記取得された頻度、当該頻度の変化および前記システム情報を用い、前記システムにかかる負荷の予測値を出力する対象値予測手段と
を具備することを特徴とする注目対象予測装置。
【請求項2】
前記出力された予測値に基づいて、予め定められたアクションを実施するアクション実施手段を更に具備することを特徴とする請求項1記載の注目対象予測装置。
【請求項1】
業務で用いられるシステムにかかる負荷を予測するための注目対象予測装置において、
前記業務に関係する関係情報を格納する関係情報格納手段と、
前記システムの出力値に関係するシステム情報を格納するシステム情報格納手段と、
前記関係情報格納手段に格納されている関係情報から前記システムの負荷を予測するために兆候となる情報群の頻度を取得する頻度取得手段と、
前記取得された頻度および当該頻度の変化と前記システム情報格納手段に格納されているシステム情報との間の相関関係の有無に関する分析を行う相関関係分析手段と、
前記分析結果に基づいて、前記取得された頻度および当該頻度の変化と前記システム情報との関係性を示す相関関係知識情報を生成する生成手段と、
前記生成された相関関係知識情報をもとに、前記取得された頻度、当該頻度の変化および前記システム情報を用い、前記システムにかかる負荷の予測値を出力する対象値予測手段と
を具備することを特徴とする注目対象予測装置。
【請求項2】
前記出力された予測値に基づいて、予め定められたアクションを実施するアクション実施手段を更に具備することを特徴とする請求項1記載の注目対象予測装置。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【公開番号】特開2012−203471(P2012−203471A)
【公開日】平成24年10月22日(2012.10.22)
【国際特許分類】
【出願番号】特願2011−65005(P2011−65005)
【出願日】平成23年3月23日(2011.3.23)
【出願人】(000003078)株式会社東芝 (54,554)
【出願人】(301063496)東芝ソリューション株式会社 (1,478)
【Fターム(参考)】
【公開日】平成24年10月22日(2012.10.22)
【国際特許分類】
【出願日】平成23年3月23日(2011.3.23)
【出願人】(000003078)株式会社東芝 (54,554)
【出願人】(301063496)東芝ソリューション株式会社 (1,478)
【Fターム(参考)】
[ Back to top ]