説明

データ処理装置及びプログラム

【課題】複数のログ種別間で同じデータ処理方式を共用できるようにする。
【解決手段】ログエージェント装置100は、各々が異なる工程に対応し、対応する工程でのデータ処理を実行するログファイル読取り部102、レコード取出し部103、ワード取出し部104、ワード並び替え部106を有する。また、ログファイルのログ種別を判別するログ種別判別部と、ログ種別ごとに各工程で実行されるデータ処理の方式が定義される方式定義情報を記憶する方式定義情報記憶部107を有する。ログ種別判別部は、ログファイルのログ種別を判別するとともに、判別したログ種別と方式定義情報に基づき、ログファイルに対して各工程で実行されるデータ処理の方式を指定し、ログファイル読取り部102等は、複数種類の方式のデータ処理を実行可能であり、ログファイルに対して、ログ種別判別部により指定された方式のデータ処理を実行する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、複数の工程にてデータ処理を行う技術に関する。
より具体的には、コンピュータ上のOS(Operating System)、DB(Data Base)、アプリケーションなどが出力する様々なログを収集・変換して共通形式のデータベースに格納する技術に関する。
【背景技術】
【0002】
従来、OS、DB、アプリケーションなどのソフトウェア(以下、S/Wと表記する)が出力するログを共通形式のデータベースに格納する場合、そのS/Wに対応した機能を1つのモジュールとして実装していた。
この方式では、新たなS/Wのログに対応するために1つのモジュールを作成する必要があるため、既存の形式に似たS/Wログ形式であっても毎回多大な工数が掛かるという課題がある。
なお、本発明に関連する技術として、特許文献1と特許文献2に記載の技術がある。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2010−224705号公報
【特許文献2】特開2010−73118号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
上述のように、従来の方式では、新たなS/Wのログに対応するために1つのモジュールを作成する必要があるため、既存の形式に似たS/Wログ形式であっても毎回多大な工数が掛かるという課題がある。
【0005】
この発明は、このような課題を解決することを主な目的の一つとしており、複数のログ種別間で同じデータ処理方式を共用できるようにすることを主な目的とする。
【課題を解決するための手段】
【0006】
本発明に係るデータ処理装置は、
複数の工程にてデータ処理を行うデータ処理装置であって、
それぞれが異なる工程に対応し、対応する工程でのデータ処理を実行する複数の工程別データ処理実行部と、
各工程でのデータ処理の対象となる対象データのデータ種別を判別するデータ種別判別部と、
データ種別ごとに各工程で実行されるデータ処理の方式が定義される方式定義情報を記憶する方式定義情報記憶部とを有し、
前記データ種別判別部は、
前記対象データのデータ種別を判別するとともに、判別した前記対象データのデータ種別と前記方式定義情報での定義とに基づき、前記対象データに対して各工程で実行されるデータ処理の方式を指定し、
各工程別データ処理実行部は、
複数種類の方式のデータ処理を実行可能であり、前記対象データに対して、前記データ種別判別部により指定された方式のデータ処理を実行することを特徴とする。
【発明の効果】
【0007】
本発明によれば、工程ごとに、複数のデータ種別間で同じデータ処理方式を共用できるので、データ種別ごとの個別開発を行う必要がなく、開発期間、開発コスト全体を抑えることができる。
【図面の簡単な説明】
【0008】
【図1】実施の形態1に係るログエージェント装置の動作の概要を示す図。
【図2】実施の形態1に係るログエージェント装置の構成例を示す図。
【図3】実施の形態1に係るログファイル読取り部の構成例を示す図。
【図4】実施の形態1に係るレコード取出し部の構成例を示す図。
【図5】実施の形態1に係るワード取出し部の構成例を示す図。
【図6】実施の形態1に係るワード並び替え部の構成例を示す図。
【図7】実施の形態1に係るログファイル変換手順例を示すフローチャート図。
【図8】実施の形態1に係る方式定義情報の例を示す図。
【図9】実施の形態1に係るログファイル変換手順の具体例を示す図。
【図10】実施の形態1に係るモジュール選択例を示す図。
【図11】実施の形態1に係るログエージェント装置のハードウェア構成例を示す図。
【発明を実施するための形態】
【0009】
実施の形態1.
本実施の形態では、コンピュータ上のOS、DB、アプリケーションなどが出力する様々なログを収集・変換して共通形式のデータベースに格納する仕組みにおいて、収集・変換する機能を幾つかの細かいフェーズに分け、各フェーズを粒度の小さいモジュールで実現することによって、多様なログに効率よく対応する構成を説明する。
【0010】
図1は、本実施の形態に係るログエージェント装置100の動作の概要を示す。
図1に示すように、ログエージェント装置100は、ログ(O)201、ログ(P)202、ログ(Q)203からログデータを読み取り、各ログからのログデータを複数の工程にて処理して、最終的に共通形式の最終データ501にする。
図1の例では、ログエージェント装置100は、ログ(O)201のログデータ、ログ(P)202のログデータをファイル読み取り方式A1001aで読み取る。
ファイル読み取り方式A1001aで読み取られた後のログ(O)201のログデータは中間データ(O)301となり、ファイル読み取り方式A1001aで読み取られた後のログ(P)202のログデータは中間データ(P)302となる。
一方、ログエージェント装置100は、ログ(Q)203のログデータは、ファイル読み取り方式B1001bで読み取る。
ファイル読み取り方式B1001bで読み取られた後のログ(Q)203のログデータは中間データ(Q)303となる。
次に、ログエージェント装置100は、中間データ(O)301のレコードをレコード取出し方式C1002cで取り出す。
レコード取出し方式C1002cでレコードが取り出された後の中間データ(O)301は、中間データ(O)401となる。
また、ログエージェント装置100は、中間データ(P)302のレコードと中間データ(Q)303のレコードをレコード取出し方式B1002bで取り出す。
レコード取出し方式B1002bでレコードが取り出された後の中間データ(P)302と中間データ(Q)303は、中間データ(P)402と中間データ(Q)403となる。
このように、本実施の形態に係るログエージェント装置100では、各ログのログデータに対する処理を複数の工程に分け、工程ごとに共通のデータ処理方式を適用できるログデータに対しては共通の方式でデータ処理を行って、最終的に共通形式の最終データ501を得る。
なお、ログエージェント装置100は、データ処理装置の例である。
【0011】
次に、ログエージェント装置100の構成例を図2に示す。
【0012】
図2に示すように、ログエージェント装置100は、制御部101、ログファイル読取り部102、レコード取出し部103、ワード取出し部104、ワード登録部105、ワード並び替え部106、方式定義情報記憶部107から構成される。
【0013】
制御部101は、ログエージェント装置100の全体の制御を行う。
ログファイル読取り部102、レコード取出し部103、ワード取出し部104、ワード並び替え部106は、それぞれが異なる工程に対応し、対応する工程でのデータ処理を実行する。
ログファイル読取り部102、レコード取出し部103、ワード取出し部104、ワード並び替え部106は、それぞれ、工程別データ処理実行部の例に相当する。
【0014】
方式定義情報記憶部107は、方式定義情報を記憶する。
方式定義情報は、図8に示すように、ログ種別(データ種別)ごとに各工程で実行されるデータ処理の方式が定義される。
図8の例では、ログ(O)に対しては、ファイル読取り工程では方式Aでのファイル読取りが行われ、レコード取出し工程では方式Cでのレコード取出しが行われ、ワード取出し工程では方式Cでのワード取出しが行われ、ワード並び替え工程では方式Aでのワード並び替えが行われる。
ログ(P)、ログ(Q)についても同様の記述形式となっている。
【0015】
ログファイル読取り部102は、図3に示すように、ログ種別判別部1021、実行モジュール選択部1022、ログファイル読取りモジュールA1023a、ログファイル読取りモジュールB1023b、ログファイル読取りモジュールC1023c等に分かれる。
ログ種別判別部1021は、読み取り対象のログファイルのログ種別(データ種別)を判別する。
ログ種別判別部1021は、データ種別判別部の例である。
ログファイル読取りモジュールA1023a、ログファイル読取りモジュールB1023b、ログファイル読取りモジュールC1023c等は、それぞれ異なるログファイル読取り方式に対応している。
実行モジュール選択部1022は、ログ種別判別部1021により判別されたログ種別に対応するログファイル読取りモジュールを選択する。
【0016】
レコード取出し部103は、図4に示すように、ログ種別判別部1031、実行モジュール選択部1032、レコード取出しモジュールA1033a、レコード取出しモジュールB1033b、レコード取出しモジュールC1033c等に分かれる。
ログ種別判別部1031は、レコード取出し対象のログファイルのログ種別(データ種別)を判別する。
ログ種別判別部1031は、データ種別判別部の例である。
レコード取出しモジュールA1033a、レコード取出しモジュールB1033b、レコード取出しモジュールC1033c等は、それぞれ異なるレコード取出し方式に対応している。
実行モジュール選択部1032は、ログ種別判別部1031により判別されたログ種別に対応するレコード取出しモジュールを選択する。
【0017】
ワード取出し部104は、図5に示すように、ログ種別判別部1041、実行モジュール選択部1042、ワード取出しモジュールA1043a、ワード取出しモジュールB1043b、ワード取出しモジュールC1043c等に分かれる。
ログ種別判別部1041は、ワード取出し対象のログファイルのログ種別(データ種別)を判別する。
ログ種別判別部1041は、データ種別判別部の例である。
ワード取出しモジュールA1043a、ワード取出しモジュールB1043b、ワード取出しモジュールC1043c等は、それぞれ異なるワード取出し方式に対応している。
実行モジュール選択部1042は、ログ種別判別部1041により判別されたログ種別に対応するワード取出しモジュールを選択する。
【0018】
ワード並び替え部106は、図6に示すように、ログ種別判別部1061、実行モジュール選択部1062、ワード並び替えモジュールA1063a、ワード並び替えモジュールB1063b、ワード並び替えモジュールC1063c等に分かれる。
ログ種別判別部1061は、ワード並び替え対象のログファイルのログ種別(データ種別)を判別する。
ログ種別判別部1061は、データ種別判別部の例である。
ワード並び替えモジュールA1063a、ワード並び替えモジュールB1063b、ワード並び替えモジュールC1063c等は、それぞれ異なるワード並び替え方式に対応している。
実行モジュール選択部1062は、ログ種別判別部1061により判別されたログ種別に対応するワード並び替えモジュールを選択する。
【0019】
図3〜図6で示したログファイル読取りモジュールA〜C等、レコード取出しモジュールA〜C等、ワード取出しモジュールA〜C等、ワード並び替えモジュールA〜C等は、図8の方式定義情報の方式A〜C等に対応している。
【0020】
また、図3〜図6において、ログファイル読取りモジュールA〜C等、レコード取出しモジュールA〜C等、ワード取出しモジュールA〜C等、ワード並び替えモジュールA〜C等を例示しているが、同じアルファベットのモジュールが相互に関連するという意味ではない。
つまり、ログファイル読取りモジュールAとレコード取出しモジュールAとが関連するというものではなく、各モジュールは他のいずれのモジュールとも無関係である。
【0021】
また、図3〜図6では、ログファイル読取り部102のログ種別判別部1021、レコード取出し部103のログ種別判別部1031、ワード取出し部104のログ種別判別部1041、ワード並び替え部106のログ種別判別部1061が、ログ種別を判別する構成となっている。
これに代えて、制御部101が、各工程で処理の対象となるログファイルのログ種別を判別するようにしてもよい。
この場合は、制御部101がデータ種別判別部の例となる。
また、この場合は、ログファイル読取り部102からログ種別判別部1021を省略し、レコード取出し部103からログ種別判別部1031を省略し、ワード取出し部104からログ種別判別部1041を省略し、ワード並び替え部106からログ種別判別部1061を省略することができる。
【0022】
次に、本実施の形態に係るログエージェント装置100の処理の流れを図7に示す。
【0023】
まず、ログ種別毎に、ログファイルから前回読取り部分からの差分を読み取る(S701)。
この処理はログファイル読取り部102によって行われるが、図3に示すように、ログ種別判別部1021によって読み取り対象のログファイルのログ種別を判別した後、実行モジュール選択部1022によってログ種別に合致したログファイル読取りモジュールを、ログファイル読取りモジュールA1023a、ログファイル読取りモジュールB1023b、ログファイル読取りモジュールC1023c等から選択して実行する。
ログ種別判別部1021は、読み取り対象のログファイルのファイル名からログ種別を判別し、判別したログ種別に対応する方式を図8の方式定義情報から抽出する。
ファイル名からログ種別を判別する方法は、例えば、ファイル名とログ種別とを対応付けるテーブルを予め用意していてもよいし、同じログ種別のログファイルは共通性をもったファイル名とするようにし、ファイル名の特徴からログ種別を判別するようにしてもよい。また、ファイル名からではなく、ファイル名が置かれている場所(ディレクトリ)からログ種別を判別してもよい。
【0024】
ログファイルからの読取り(S701)の後は、制御部101が、レコード終わりかどうか判定し(S702)、レコード終わりでなければレコード取出しを行い(S703)、レコード終わりであれば全レコードにつきワード並び替えを行う(S706)。
レコード取出し(S703)は、レコード取出し部103によって行われるが、図4に示すように、ログ種別判別部1031によってログ種別を判別した後、実行モジュール選択部1032によってログ種別に合致したレコード取出しモジュールを、レコード取出しモジュールA1033a、レコード取出しモジュールB1033b、レコード取出しモジュールC1033c等から選択して実行する。
ログ種別判別部1031は、レコード取出し対象のログファイルのファイル名からログ種別を判別し、判別したログ種別に対応する方式を図8の方式定義情報から抽出する。
ファイル名からログ種別を判別する方法は、前述の通りである。
【0025】
レコード取出し(S703)の後は、ワード(複数)取出し(S704)が行われる。
この処理はワード取出し部104によって行われるが、図5に示すように、ログ種別判別部1041によってログ種別を判別した後、実行モジュール選択部1042によってログ種別に合致したワード取出しモジュールを、ワード取出しモジュールA1043a、ワード取出しモジュールB1043b、ワード取出しモジュールC1043c等から選択して実行する。
ログ種別判別部1041は、ワード取出し対象のログファイルのファイル名からログ種別を判別し、判別したログ種別に対応する方式を図8の方式定義情報から抽出する。
ファイル名からログ種別を判別する方法は、前述の通りである。
なお、ワードとは、レコードに含まれる各カラム値である。
【0026】
ワード取出し(S704)の後は、ワード登録部105によって、取り出されたワード(複数)を登録する(S705)。
ワードの登録とは、後続のワード並び替え処理(S706)のためのバッファメモリに、ワード取出し処理(S704)により得られた各ワードを格納することである。
【0027】
ログファイルからの読取り(S701)の後、制御部101がレコード終わりかどうか判定して(S702)、レコード終わりであれば(S702でYES)、全レコードにつきワード並び替えを行う(S706)。
この処理はワード並び替え部106によって行われるが、図6に示すように、ログ種別判別部1061によってログ種別を判別した後、実行モジュール選択部1062によってログ種別に合致したワード並び替えモジュールを、ワード並び替えモジュールA1063a、ワード並び替えモジュールB1063b、ワード並び替えモジュールC1063c等から選択して実行する。
ログ種別判別部1061は、ワード並び替え対象のログファイルのファイル名からログ種別を判別し、判別したログ種別に対応する方式を図8の方式定義情報から抽出する。
ファイル名からログ種別を判別する方法は、前述の通りである。
【0028】
これらの処理の流れにおいて、ログファイル読取り、レコード取出し、ワード取出し、ワード並び替えの各処理では、ログ種別に則して複数のモジュール(XXXモジュールA、B、C等)の中から適合するモジュールが選択されて実行されるが、複数のログ種別間で共通のモジュールがあるため、開発コスト全体を抑えることができる。
【0029】
次に、具体例を図9に示す。
ここでは、(ア)(イ)(ウ)の3種類のログ種別がある場合を想定する。
ログ(ア)はログファイルが一つのみで、ログ形式は一般的なCSV(Comma Separated Values)形式、ワードの並びは、日付、エラー番号、メッセージである。
ログ(ア)に分類されるログファイルのファイル名は、ここでは、「XXX.log」とする。
ログ(イ)はログファイルが日付ごとに別々に作られていくタイプで、ログ形式は一般的なCSV形式、ワードの並びは、エラー番号、メッセージ、日付である。
ログ(イ)に分類されるログファイルのファイル名は、ここでは、「YYY_2011_02_22.log」とする。
ログ(ウ)はログファイルが一つのみ、ログ形式は2行で1レコード(1行目に日付、2行目にエラー番号とメッセージ)であり、固定長形式で格納されている。
ログ(ウ)に分類されるログファイルのファイル名は、ここでは、「ZZZ.log」とする。
【0030】
ログファイル「XXX.log」(ログ(ア))についての処理を示す。
まずファイル読取り処理では、ログファイル読取り部102のログ種別判別部1021がログファイル「XXX.log」のログ種別をログ(ア)と判別し、ログ(ア)に対応するファイル読取り方式を特定し、この結果、実行モジュール選択部1022によって固定ファイル読取りモジュール(図3のログファイル読取りモジュールA、B、C等の具体例)が選択される。
そして、固定ファイル読取りモジュールにより前回読取り部分からの差分が読み取られる。
ここでは、以下の2つのレコードが差分データとして読み取られる。
2011/2/22,1,エラー1
2011/2/22,2,エラー2
次にレコード取出しでは、レコード取出し部103のログ種別判別部1031がログファイル「XXX.log」のログ種別をログ(ア)と判別し、ログ(ア)に対応するレコード取出し方式を特定し、この結果、実行モジュール選択部1032によって改行区切りモジュール(図4のレコード取出しモジュールA、B、C等の具体例)が選択される。
そして、改行区切りモジュールによって以下のように1レコードが取り出される。
2011/2/22,1,エラー1
次にワード取出しでは、ワード取出し部104のログ種別判別部1041がログファイル「XXX.log」のログ種別をログ(ア)と判別し、ログ(ア)に対応するワード取出し方式を特定し、この結果、実行モジュール選択部1042によってCSV取り込みモジュール(図4のワード取出しモジュールA、B、C等の具体例)が選択される。
そして、CSV取り込みモジュールによって以下のように複数のワードが取り出される。
2011/2/22|1|エラー1
このようにしてすべてのレコードデータが登録された後、最後にワード並び替えでは、ワード並び替え部106のログ種別判別部1061がログファイル「XXX.log」のログ種別をログ(ア)と判別し、ログ(ア)に対応するワード並び替え方式を特定し、この結果、実行モジュール選択部1042によってログ(ア)の並びに則した並び替えモジュール(図4のワード並び替えモジュールA、B、C等の具体例)が選択される。
そして、ログ(ア)の並びに則した並び替えモジュールによってワードが並び替えられる(ここでは、実際には並び替えが行われない)。
2011/2/22|1|エラー1
2011/2/22|2|エラー2
【0031】
次に、「YYY_2011_02_22.log」(ログ(イ))についての処理を示す。
なお、各工程におけるログ種別の判別、モジュールの選択についてはログ(ア)について説明したものと同様であり、以下では、モジュールの選択結果、モジュールによるデータ処理の結果のみを示す。
まずファイル読取り処理では、日付別ファイル読取りモジュールによって前回読取り部分からの差分が読み取られる。
ここでは、以下の2つのレコードが差分データとして読み取られる。
11,err1,2011/2/22
22,err2,2011/2/22
次にレコード取出しでは、改行区切りモジュールによって以下のように1レコードが取り出される。
11,err1,2011/2/22
次にワード取出しでは、CSV取り込みモジュールによって以下のように複数のワードが取り出される。
11|err1|2011/2/22
このようにしてすべてのレコードデータが登録された後、最後にワード並び替えでは、ログ(イ)の並びに則した並び替えモジュールによってワードが並び替えられる。
ワードの並び替えの結果、以下のレコードが得られる。
これらレコードは、ログ(ア)のレコードと共通の形式である。
2011/2/22|11|err1
2011/2/22|22|err2
【0032】
次に「ZZZ.log」(ログ(ウ))についての処理を示す。
ここでも、各工程におけるログ種別の判別、モジュールの選択についてはログ(ア)について説明したものと同様であり、以下では、モジュールの選択結果、モジュールによるデータ処理の結果のみを示す。
まずファイル読取り処理では、固定ファイル読取りモジュールによって前回読取り部分からの差分が読み取られる。
ここでは、以下の2つのレコード(4行)が差分データとして読み取られる。
2011/2/22
111 エラー1発生
2011/2/22
222 エラー2発生
次にレコード取出しでは、2改行区切りモジュールによって以下のように1レコードが取り出される。
2011/2/22111 エラー1発生
次にワード取出しでは、固定長取り込みモジュールによって以下のように複数のワードが取り出される。
2011/2/22|111|エラー1発生
このようにしてすべてのレコードデータが登録された後、最後にワード並び替えでは、ログ(ウ)の並びに則した並び替えモジュールによってワードが並び替えられる。
ワードの並び替えの結果、以下のレコードが得られる。
これらレコードは、ログ(ア)のレコードと共通の形式である。
2011/2/22|111|エラー1発生
2011/2/22|222|エラー2発生
【0033】
ログ(ア)、(イ)、(ウ)のログファイルに対して以上のように処理が行われるが、図10に示すように、ファイル読取りでは(ア)と(ウ)が共通、レコード取出しでは(ア)と(イ)が共通、ワード取出しでは(ア)と(イ)が共通のモジュールを使用するため、開発コストが抑えられる。
つまり、本実施の形態によれば、工程ごとに、複数のログ種別間で同じデータ処理方式を共用できるので、ログ種別ごとのモジュールを個別に開発する必要がなく、開発期間、開発コスト全体を抑えることができる。
このようなコスト抑制効果は、対応するログ種別が多くなるほど、モジュールの共通化が期待できるため、大きくなる。
【0034】
最後に、本実施の形態に示したログエージェント装置100のハードウェア構成例について説明する。
図11は、本実施の形態に示すログエージェント装置100のハードウェア資源の一例を示す図である。
なお、図11の構成は、あくまでもログエージェント装置100のハードウェア構成の一例を示すものであり、ログエージェント装置100のハードウェア構成は図11に記載の構成に限らず、他の構成であってもよい。
【0035】
図11において、ログエージェント装置100は、プログラムを実行するCPU911(Central Processing Unit、中央処理装置、処理装置、演算装置、マイクロプロセッサ、マイクロコンピュータ、プロセッサともいう)を備えている。
CPU911は、バス912を介して、例えば、ROM(Read Only Memory)913、RAM(Random Access Memory)914、通信ボード915、表示装置901、キーボード902、マウス903、磁気ディスク装置920と接続され、これらのハードウェアデバイスを制御する。
更に、CPU911は、FDD904(Flexible Disk Drive)、コンパクトディスク装置905(CDD)、プリンタ装置906、スキャナ装置907と接続していてもよい。また、磁気ディスク装置920の代わりに、光ディスク装置、メモリカード(登録商標)読み書き装置などの記憶装置でもよい。
RAM914は、揮発性メモリの一例である。ROM913、FDD904、CDD905、磁気ディスク装置920の記憶媒体は、不揮発性メモリの一例である。これらは、記憶装置の一例である。
本実施の形態で説明した「方式定義情報記憶部107」は、RAM914、磁気ディスク装置920等により実現される。
通信ボード915、キーボード902、マウス903、スキャナ装置907、FDD904などは、入力装置の一例である。
また、通信ボード915、表示装置901、プリンタ装置906などは、出力部、出力装置の一例である。
【0036】
通信ボード915は、ネットワークに接続されている。
例えば、通信ボード915は、LAN(ローカルエリアネットワーク)、インターネット、WAN(ワイドエリアネットワーク)、SAN(ストレージエリアネットワーク)などに接続されている。
【0037】
磁気ディスク装置920には、オペレーティングシステム921(OS)、ウィンドウシステム922、プログラム群923、ファイル群924が記憶されている。
プログラム群923のプログラムは、CPU911がオペレーティングシステム921、ウィンドウシステム922を利用しながら実行する。
【0038】
また、RAM914には、CPU911に実行させるオペレーティングシステム921のプログラムやアプリケーションプログラムの少なくとも一部が一時的に格納される。
また、RAM914には、CPU911による処理に必要な各種データが格納される。
【0039】
また、ROM913には、BIOS(Basic Input Output System)プログラムが格納され、磁気ディスク装置920にはブートプログラムが格納されている。
ログエージェント装置100の起動時には、ROM913のBIOSプログラム及び磁気ディスク装置920のブートプログラムが実行され、BIOSプログラム及びブートプログラムによりオペレーティングシステム921が起動される。
【0040】
上記プログラム群923には、本実施の形態の説明において「〜部」(「方式情報記憶部」以外、以下同様)として説明している機能を実行するプログラムが記憶されている。プログラムは、CPU911により読み出され実行される。
【0041】
ファイル群924には、本実施の形態の説明において、「〜の判断」、「〜の判別」、「〜の比較」、「〜の参照」、「〜の抽出」、「〜の指定」、「〜の特定」、「〜の選択」等として説明している処理の結果を示す情報やデータや信号値や変数値やパラメータが、「〜ファイル」や「〜データベース」の各項目として記憶されている。
「〜ファイル」や「〜データベース」は、ディスクやメモリなどの記録媒体に記憶される。ディスクやメモリなどの記憶媒体に記憶された情報やデータや信号値や変数値やパラメータは、読み書き回路を介してCPU911によりメインメモリやキャッシュメモリに読み出され、抽出・検索・参照・比較・演算・計算・処理・編集・出力・印刷・表示などのCPUの動作に用いられる。
抽出・検索・参照・比較・演算・計算・処理・編集・出力・印刷・表示のCPUの動作の間、情報やデータや信号値や変数値やパラメータは、メインメモリ、レジスタ、キャッシュメモリ、バッファメモリ等に一時的に記憶される。
また、本実施の形態で説明しているフローチャートの矢印の部分は主としてデータや信号の入出力を示し、データや信号値は、RAM914のメモリ、FDD904のフレキシブルディスク、CDD905のコンパクトディスク、磁気ディスク装置920の磁気ディスク、その他光ディスク、ミニディスク、DVD等の記録媒体に記録される。また、データや信号は、バス912や信号線やケーブルその他の伝送媒体によりオンライン伝送される。
【0042】
また、本実施の形態の説明において「〜部」として説明しているものは、「〜回路」、「〜装置」、「〜機器」であってもよく、また、「〜ステップ」、「〜手順」、「〜処理」であってもよい。
すなわち、本実施の形態で説明したフローチャートに示すステップ、手順、処理により、ログエージェント装置100の動作をデータ処理方法として捉えることができる。
また、「〜部」として説明しているものは、ROM913に記憶されたファームウェアで実現されていても構わない。或いは、ソフトウェアのみ、或いは、素子・デバイス・基板・配線などのハードウェアのみ、或いは、ソフトウェアとハードウェアとの組み合わせ、さらには、ファームウェアとの組み合わせで実施されても構わない。ファームウェアとソフトウェアは、プログラムとして、磁気ディスク、フレキシブルディスク、光ディスク、コンパクトディスク、ミニディスク、DVD等の記録媒体に記憶される。プログラムはCPU911により読み出され、CPU911により実行される。すなわち、プログラムは、本実施の形態の「〜部」としてコンピュータを機能させるものである。あるいは、本実施の形態の「〜部」の手順や方法をコンピュータに実行させるものである。
【0043】
このように、本実施の形態に示すログエージェント装置100は、処理装置たるCPU、記憶装置たるメモリ、磁気ディスク等、入力装置たるキーボード、マウス、通信ボード等、出力装置たる表示装置、通信ボード等を備えるコンピュータであり、上記したように「〜部」として示された機能をこれら処理装置、記憶装置、入力装置、出力装置を用いて実現するものである。
【符号の説明】
【0044】
100 ログエージェント装置、101 制御部、102 ログファイル読取り部、103 レコード取出し部、104 ワード取出し部、105 ワード登録部、106 ワード並び替え部、107 方式定義情報記憶部、1021 ログ種別判別部、1022 実行モジュール選択部、1023a ログファイル読取りモジュールA、1023b ログファイル読取りモジュールB、1023c ログファイル読取りモジュールC、1031 ログ種別判別部、1032 実行モジュール選択部、1033a レコード取出しモジュールA、1033b レコード取出しモジュールB、1033c レコード取出しモジュールC、1041 ログ種別判別部、1042 実行モジュール選択部、1043a ワード取出しモジュールA、1043b ワード取出しモジュールB、1043c ワード取出しモジュールC、1061 ログ種別判別部、1062 実行モジュール選択部、1063a ワード並び替えモジュールA、1063b ワード並び替えモジュールB、1063c ワード並び替えモジュールC。

【特許請求の範囲】
【請求項1】
複数の工程にてデータ処理を行うデータ処理装置であって、
それぞれが異なる工程に対応し、対応する工程でのデータ処理を実行する複数の工程別データ処理実行部と、
各工程でのデータ処理の対象となる対象データのデータ種別を判別するデータ種別判別部と、
データ種別ごとに各工程で実行されるデータ処理の方式が定義される方式定義情報を記憶する方式定義情報記憶部とを有し、
前記データ種別判別部は、
前記対象データのデータ種別を判別するとともに、判別した前記対象データのデータ種別と前記方式定義情報での定義とに基づき、前記対象データに対して各工程で実行されるデータ処理の方式を指定し、
各工程別データ処理実行部は、
複数種類の方式のデータ処理を実行可能であり、前記対象データに対して、前記データ種別判別部により指定された方式のデータ処理を実行することを特徴とするデータ処理装置。
【請求項2】
前記方式定義情報記憶部は、
特定の工程では、異なる2以上のデータ種別に対して同じ方式を定義する方式定義情報を記憶し、
前記データ種別判別部は、
前記方式定義情報において同じ方式が定義されている工程については、2以上の対象データのデータ種別が異なっていても、前記2以上の対象データに対して同じ方式を指定することを特徴とする請求項1に記載のデータ処理装置。
【請求項3】
前記データ種別判別部は、
前記対象データをログデータとし、
前記ログデータのデータ種別を判別するとともに、判別した前記ログデータのデータ種別と前記方式定義情報での定義とに基づき、前記ログデータに対して各工程で実行されるデータ処理の方式を指定し、
各工程別データ処理実行部は、
複数種類の方式のデータ処理を実行可能であり、前記ログデータに対して、前記データ種別判別部により指定された方式のデータ処理を実行することを特徴とする請求項1又は2に記載のデータ処理装置。
【請求項4】
複数の工程にてデータ処理を行うコンピュータに、
それぞれが異なる工程に対応し、対応する工程でのデータ処理を実行する複数の工程別データ処理実行ステップと、
各工程でのデータ処理の対象となる対象データのデータ種別を判別するデータ種別判別ステップと、
データ種別ごとに各工程で実行されるデータ処理の方式が定義される方式定義情報を参照する方式定義情報参照ステップとを実行させ、
前記データ種別判別ステップにおいて、
前記コンピュータに、
前記対象データのデータ種別を判別させるとともに、判別させた前記対象データのデータ種別と前記方式定義情報での定義とに基づき、前記対象データに対して各工程で実行されるデータ処理の方式を指定させ、
各工程別データ処理実行ステップにおいて、
前記コンピュータは、複数種類の方式のデータ処理を実行可能であり、
前記コンピュータに、
前記対象データに対して、前記データ種別判別ステップにおいて指定された方式のデータ処理を実行させることを特徴とするプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate