説明

データ処理システム

【課題】DBサーバにおけるレンジスキャンの頻度を低減し、検索処理の高速化を実現する。
【解決手段】DBサーバ14とAPサーバ12を備えたデータ処理システム10。APサーバ12は、メモリ26と、DBサーバ14に対しテーブルのキー項目に係るデータの読み出しを指令するデータ処理部22と、DBサーバ14から送信されたデータを圧縮し、メモリ26にインデックスとして格納するインデックス生成部24を備える。
【効果】テーブルのキー項目の内容がAPサーバ12のメモリ26上にキャッシュされているため、DBサーバ14に検索を指令する際にはキー項目の値の全てを特定し、対象となるレコードをピンポイントで絞り込んだSQL文の発行が可能となり、DBサーバ14におけるレンジスキャンの低減が可能。

【発明の詳細な説明】
【技術分野】
【0001】
この発明はデータ処理システムに係り、特に、APサーバ内にDBサーバのデータベースに含まれるレコードのキー項目の値をキャッシュしておき、DBサーバにSQL文を発行するに際しては全キー項目の値を特定することにより、検索処理等の高速化を実現する技術に関する。
【背景技術】
【0002】
クライアントサーバ型システムの進展に伴い、より大規模な情報処理の要求に応えるために、データの表示をするクライアントの他にデータの加工を行うAPサーバ及びデータの格納をするDBサーバを備えた、いわゆる三層構造のクライアントサーバシステムが普及してきている。
また、処理速度の向上を図るため、複数のAPサーバを並列配置させることで負荷を分散させることも行われている。
【特許文献1】特開2005−165610
【発明の開示】
【発明が解決しようとする課題】
【0003】
APサーバは廉価なPCサーバで構成することができるため、設置台数を増加させることで処理速度を向上させることは比較的容易であるが、DBサーバについてはデータの同期を維持する必要性があるため、APサーバのように簡単に分散処理に移行することはできない。
もちろん、データベースシステムのベンダ各社は、様々な技術を駆使してソフトウェア及びハードウェアの両面からDBサーバ自体の高速化を図ってきており、その結果一定の成果は上がっているが、その分システムの価格が上昇することは否めない。
また、今後ともクライアントサーバ型システムに担わされるデータベースの規模が増大を続ける限り、いずれはディスクI/O(データの読み書き)速度が壁となり、DBサーバの性能アップでは対応できない時期が来るものと予想される。
【0004】
ところで、DBサーバにおける検索処理に時間を要するのは、一般にレンジスキャン(範囲走査)と呼ばれる処理を実行する場合である。
すなわち、図2に示すテーブルを例に説明すると、APサーバがSQL文を発行する際に日付、店Cd(店コード)、商品Cd(商品コード)のキー項目の値を全て指定してやれば、目的のレコードが一意に決まるためDBサーバは即座に必要なデータにアクセス可能となる。
これに対し、SQL文中で日付、店Cdのみを指定してデータの抽出を命令した場合、DBサーバは指定された日付、商品Cdに係る全てのレコードを先頭レコードから走査して該当のレコードを抽出する必要が生じ、その分時間を要することとなる。
【0005】
データベースの検索速度を向上させるために、通常は各テーブル毎にインデックス(索引情報)が生成され、これを参照することでDBサーバは検索処理の高速化をある程度達成することができる。
しかしながら、キー項目の数が多くなり、その組合せパターンが複雑化する場合には一次インデックス、二次インデックス…というように予想される検索パターンに対応したインデックスファイルを多数準備する必要が生じ、かえってディスクI/Oが増加する結果となる。
【0006】
また、キー項目を細分化し、例えば商品Cdの上位キーとして「商品分類Cd」を設定しておき、検索条件を指定する際に商品分類コードまで特定するように促すことで、DBサーバ側でのレンジスキャンの幅を抑制することも行われているが、これはレンジスキャン自体を一掃するものではないし、レコード長の増大を招くという欠点もある。
【0007】
この発明は、従来のデータ処理システムが抱えていた上記の問題を解決するために案出されたものであり、DBサーバ自体の性能アップに依存するのではなく、また過度なインデックス情報の生成や上位キー項目の追加を行うことなく、APサーバ側の処理工程に改良を加えることによってDBサーバにおけるレンジスキャンの頻度を低減し、もって検索処理の高速化を実現することを目的としている。
【課題を解決するための手段】
【0008】
上記の目的を達成するため、請求項1に記載したデータ処理システムは、DBサーバとAPサーバを備えたデータ処理システムであって、上記DBサーバが、データベース管理システムと、テーブルを格納したデータベースを備え、上記APサーバが、上記DBサーバにSQL文を発行し、上記テーブルのキー項目に係るデータの読み出しを指令するデータ読み出し手段と、DBサーバから送信されたキー項目に係るデータを圧縮し、上記APサーバの記憶手段に上記テーブルのインデックスとして格納するインデックス生成手段と、クライアント端末から上位キー項目を検索条件として指定した検索リクエストが送信された場合に、上記APサーバのインデックスを参照し、上記検索条件に包含されるキー項目の値を取得するキー項目値取得手段と、各キー項目の値を特定したSQL文を生成し、上記DBサーバに発行する手段とを備えたことを特徴としている。
【0009】
請求項2に記載したデータ処理システムは、請求項1のシステムであって、さらに上記のデータ読み出し手段が、上記SQL文において一または複数のキー項目の値を指定することにより、上記DBサーバから上記テーブルをグループに分割して読み出す処理を実行し、上記のインデックス生成手段が、圧縮処理をグループ単位で実行することを特徴としている。
【0010】
請求項3に記載したデータ処理システムは、請求項1のシステムであって、さらに上記インデックス生成手段が、上記DBサーバから送信されたデータ中において値が相互に重複するものが存在する場合に、一つの値のみを実データとしてメモリ上に残し、他の値については上記実データを参照する型に変換する処理を実行し、参照型データを含む表形式のインデックスを生成することを特徴としている。
【0011】
請求項4に記載したデータ処理システムは、請求項1のシステムであって、さらに上記インデックス生成手段が、少なくとも最上位のキー項目毎に対応のフォルダをAPサーバのディスク上に生成する第1の処理と、各最上位のキー項目に包含される1または複数の中位キー項目に対応したファイルを生成し、対応のフォルダに格納する第2の処理と、各中位のキー項目に包含される1または複数の下位キー項目の値を対応のファイルに記述する第3の処理を実行することを特徴としている。
【0012】
請求項5に記載したデータ処理システムは、請求項1のシステムであって、さらに上記インデックス生成手段が、上記DBサーバから送信された各データの中で、少なくとも最上位のキー項目については、値が相互に重複する場合に一つのレコードのデータを残して他のレコードのデータを削除し、削除されたデータに従属していた下位データを残されたデータに関連付ける第1の処理と、残された最上位のキー項目を一つの根の元に結合させることにより、木構造のインデックスをAPサーバのメモリ上に生成する第2の処理を実行することを特徴としている。
【0013】
請求項6に記載したデータ処理システムは、請求項1のシステムであって、さらに上記インデックス生成手段が、上記DBサーバから送信された各データの中で、少なくとも最上位のキー項目については、値が相互に重複する場合に一つのレコードのデータを残して他のレコードのデータを削除し、削除されたデータに従属していた下位データを残されたデータに関連付ける第1の処理と、値が相互に重複する下位のキー項目については、一の値のみを実データとしてAPサーバのメモリ上に残し、他の値については上記実データを参照する型に変換する第2の処理と、残された最上位のキー項目を一つの根の元に結合させ、参照型データを含む木構造のインデックスをAPサーバのメモリ上に生成する第3の処理を実行することを特徴としている。
【0014】
請求項7に記載したデータ処理システムは、請求項1のシステムであって、さらに上記インデックス生成手段が、上記DBサーバから送信された各レコードの中で、少なくとも最上位のキー項目については、値が相互に重複する場合に一つのレコードのデータを残して他のレコードのデータを削除し、削除されたデータに従属していた下位データを残されたデータに関連付ける第1の処理と、各レコードの下位のキー項目の値と先行レコードの同キー項目の値とを順次比較し、先行レコードの値と重複する値を削除すると共に、先行レコードの値を参照する型に変換する第2の処理と、残された上位キー項目同士を一つの根の元に結合させ、参照型を含む木構造のデータを生成する第3の処理を実行することを特徴としている。
【0015】
請求項8に記載したデータ処理システムは、請求項1のシステムであって、さらに上記インデックス生成手段が、上記DBサーバから送信された各データの中で、少なくとも最上位のキー項目については、値が相互に重複する場合に一つのレコードのデータを残して他のレコードのデータを削除し、残されたデータを参照する型に変換する第1の処理と、各レコードを下位のキー項目の値に基づいて所定の順序で整列させ、下位のキー項目の値が相互に重複する場合に一つのレコードのデータを残して他のレコードのデータを削除し、残されたデータを参照する型に変換する第2の処理と、各レコードを少なくとも最上位のキー項目の値に基づいて所定の順序で整列させる第3の処理と、残された最上位のキー項目を一つの根の元に結合させ、参照型データを含む木構造のデータを生成する第4の処理を実行することを特徴としている。
【0016】
請求項9に記載したデータ処理システムは、請求項1のシステムであって、さらに上記インデックス生成手段が、上記DBサーバから送信された各データの中で、少なくとも最上位のキー項目については、値が相互に重複する場合に一つのレコードのデータを残して他のレコードのデータを削除し、削除されたデータに従属していた下位データを残されたデータに関連付ける第1の処理と、残された最上位のキー項目を一つの根の元に結合させて木構造のデータを生成する第2の処理と、上記木構造のデータに含まれる最下位のキー項目の類型を抽出し、これらを要素として充填させたディスティンクト・リストをメモリ上に生成する第3の処理と、上記ディスティンクト・リストに含まれる各要素と上記木構造のデータに含まれる最下位のキー項目の各値とをマッチングし、最下位のキー項目の各値をディスティンクト・リスト中の対応の要素を参照する型に変換する第4の処理を実行することを特徴としている。
【0017】
請求項10に記載したデータ処理システムは、請求項1のシステムであって、さらに上記インデックス生成手段が、上記DBサーバから送信された各データの中で、少なくとも最上位のキー項目については、値が相互に重複する場合に一つのレコードのデータを残して他のレコードのデータを削除し、削除された上位データに従属していた下位データを残された上位データに関連付ける第1の処理と、残された最上位のキー項目同士を一つの根の元に結合させ、木構造のデータを生成する第2の処理と、最下位のキー項目に含まれる値の類型を抽出し、これらを所定の順序で整列させたディスティンクト・リストを生成し、メモリに格納する第3の処理と、上記ディスティンクト・リストに含まれる各要素と最下位のキー項目の値とを、親のキー項目を共通にする兄弟単位で順にマッチングさせ、ディスティンクト・リストの要素が最下位のキー項目に存在する場合には、メモリ上に設けたディスティンクト・リストと同サイズのブーリアン配列における対応位置にブーリアン型のtrueをセットすると同時に実データを削除し、該当の値が最下位のキー項目に存在しない場合には上記ブーリアン配列の対応位置にブーリアン型のfalseをセットする第4の処理を実行し、上記キー項目値取得手段が、各ブーリアン配列及び上記ディスティンクト・リストを参照することにより、最下位のキー項目の値を特定することを特徴としている。
【0018】
請求項11に記載したデータ処理システムは、請求項1のシステムであって、さらに上記インデックス生成手段が、上記DBサーバから送信された各データの中で、少なくとも最上位のキー項目については、値が相互に重複する場合に一つのレコードのデータを残して他のレコードのデータを削除し、削除された上位データに従属していた下位データを残された上位データに関連付ける第1の処理と、残された最上位のキー項目同士を一つの根の元に結合させ、木構造のデータを生成する第2の処理と、最下位のキー項目に含まれる値の類型を抽出し、これらを所定の順序で整列させたディスティンクト・リストを生成し、メモリに格納する第3の処理と、上記ディスティンクト・リストに含まれる各要素と最下位のキー項目の値とを、親のキー項目を共通にする兄弟単位で順にマッチングさせ、ディスティンクト・リストの要素が最下位のキー項目に存在する場合には、メモリ上に設けたディスティンクト・リストと同サイズのブーリアン配列における対応位置にブーリアン型のtrueをセットすると同時に実データを削除し、該当の値が最下位のキー項目に存在しない場合には上記ブーリアン配列の対応位置にブーリアン型のfalseをセットする第4の処理と、上記のブーリアン配列をビット配列に変換する第5の処理を実行し、上記キー項目値取得手段が、各ビット配列をブーリアン配列に変換し、各ブーリアン配列及び上記ディスティンクト・リストを参照することにより、最下位のキー項目の値を特定することを特徴としている。
【0019】
請求項12に記載したデータ処理システムは、請求項1のシステムであって、さらに上記インデックス生成手段が、上記DBサーバから送信された各データの中で、少なくとも最上位のキー項目については、値が相互に重複する場合に一つのレコードのデータを残して他のレコードのデータを削除し、削除された上位データに従属していた下位データを残された上位データに関連付ける第1の処理と、残された最上位のキー項目同士を一つの根の元に結合させ、木構造のデータを生成する第2の処理と、最下位のキー項目に含まれる値の類型を抽出し、これらを所定の順序で整列させたディスティンクト・リストを生成し、メモリに格納する第3の処理と、上記ディスティンクト・リストに含まれる各要素と最下位のキー項目の値とを、親のキー項目を共通にする兄弟単位で順にマッチングさせ、ディスティンクト・リストの要素が最下位のキー項目に存在する場合には、メモリ上に設けたビット配列における対応位置に1をセットすると同時に実データを削除し、該当の値が最下位のキー項目に存在しない場合には上記ビット配列の対応位置に0をセットする第4の処理を実行し、上記キー項目値取得手段が、各ビット配列及び上記ディスティンクト・リストを参照することにより、最下位のキー項目の値を特定することを特徴としている。
【発明の効果】
【0020】
請求項1、3〜12に記載したデータ処理システムにあっては、DBサーバ内に格納されているテーブルのキー項目の内容が、APサーバのメモリやディスク上にキャッシュされるため、DBサーバに検索を指令する際にはキー項目の値の全てを特定し、対象となるレコードをピンポイントで絞り込んだ形のSQL文を発行することが可能となる。この結果、DBサーバにおいてレンジスキャンが発生することがなくなり、その分検索処理の高速化を実現できる。
【0021】
請求項2に記載したデータ処理システムの場合、APサーバがデータをDBサーバから取り出すに際し、全レコードに係るキー項目のデータ全体を一度に受け取るのではなく、特定のキー項目の値を指定することにより、グループ単位に分割して受け取り、当該グループについて圧縮処理が完了した時点で次のグループに係るレコードを受け取る方式を採用しているため、比較的大きなテーブルであってもAPサーバのメモリ上にキー項目をキャッシュできるようになる。
【発明を実施するための最良の形態】
【0022】
図1は、この発明に係るデータ処理システム10の全体構成図であり、このシステム10は、複数のAPサーバ12と、DBサーバ14と、ロードバランサ(負荷分散装置)16とを備えている。
ロードバランサ16と各APサーバ12間、及び各APサーバ12とDBサーバ14間はネットワークによって接続されている。
また、各APサーバ12に対しては、イントラネット18やインターネット等のネットワーク及びロードバランサ16を介して多数のクライアント端末20が接続されている。
【0023】
各APサーバ12は、データ処理部22と、インデックス生成部24と、メモリ26と、ハードディスク(HDD)27を備えている。
各APサーバ12のハードディスク27には、OS及びこのシステム専用のアプリケーションプログラムがセットアップされており、APサーバ12のCPUがこれらのプログラムに従って動作することにより、上記のデータ処理部22及びインデックス生成部24が実現される。
【0024】
DBサーバ14は、データベース管理システム(DBMS)28と、業務処理用の各種テーブルが格納されたデータベース30を備えている。
データベース管理システム28は、データベース30を管理し、データベース30に格納されたデータの入出力、更新、および所定の演算などを行う。
【0025】
図2は、データベース30に格納されたテーブルの一例を示すものであり、このテーブルは、日付、店Cd(店コード)、商品Cd(商品コード)、扱いフラグ、在庫数、売上数のデータ項目を備えている。
これらの中、日付、店Cd、商品Cdのデータ項目は、各レコードを特定するためのキー項目であり、扱いフラグ、在庫数、売上数のデータ項目は、各レコードの属性項目である。
また、日付は最上位のキー項目に相当し、店Cd、商品Cdは下位キー項目に相当する(商品コードは最下位のキー項目)。
【0026】
ロードバランサ16は、クライアント端末20から送信されたリクエストを、各APサーバ12にかかっている負荷に応じて分散する役割を果たす。
【0027】
クライアント端末20は、PC等のコンピュータよりなり、OSの他に、Webブラウザプログラムや専用のアプリケーションプログラムがセットアップされている。
【0028】
以下、図3及び図4のフローチャートに従い、このシステム10における基本的な処理手順を説明する。
まず、APサーバ12のデータ処理部22が起動すると(S10)、DBサーバ14に対してSQL文を発行し、テーブルのキー項目に係るデータの抽出をリクエストする(S11)。
この際データ処理部22は、例えば図2のテーブルに格納された各レコードを、日付×店コードで特定されるグループ単位で、かつ日付、店コード、商品コードの値に基づいて昇順に整列させた状態で送信することを指令するSQL文を生成し、DBサーバ14に送信する。
【0029】
DBサーバ14のデータベース管理システム28から対応のデータが日付×店コードのグループ単位で送信されると、データ処理部22はこれをインデックス生成部24に渡す(S12)。
インデックス生成部24は、各レコードの日付及び店コードの値を、先行するレコードの日付及び店コードの値と比較する(S13)。
ここで、先行レコードに係るデータとの重複が認められた場合(S14のYES)、インデックス生成部24は当該データを削除した後、先行レコードに係るデータを参照する型に置き換える(S16)。
これに対し、先行レコードに係るデータとの重複が認められない場合(S14のNO)、インデックス生成部24は当該日付及び店コードをそのまま(実データとして)メモリ26に格納する(S15)。
【0030】
図5は、メモリ26に格納されたデータグループのイメージを示すものであり、(a)は2006年3月15日の店コード:600店に係るグループのデータに対応している。
図示の通り、日付(20060315)及び店コード(600)のデータは先頭レコードについてのみ実データとして残されており、他のレコードの日付及び店コードはこれらの値を参照する形式で表現されている。
また、商品コードの「491234567890」、「491234567891」、「491234567892」及び「491234567893」に関しては、何れも先行データとの重複が存在しないため、そのまま実データとして残されている。
【0031】
一つのグループに関する上記の処理が完了すると、データ処理部22は次のグループ(日付×店コード)に属するレコードの抽出を指令するSQL文をDBサーバ14に発行し(S17、S11)、インデックス生成部24によるデータの圧縮及びメモリ26への格納が実行される(S12〜S16)。
【0032】
図5(b)は、2006年3月15日の店コード:601店に係るグループのデータに対応している。
この場合、日付「20060315」及び商品コードの「491234567891」、「491234567893」については重複するデータが先行のデータグループに存在するため(図5(a))、インデックス生成部24はこれらを削除すると共に、先行グループの実体データを参照する型に置き換える(S16)。
また、店コード「601」については重複するデータが先行グループに存在しないため、先頭レコードに係る店コードはそのまま実データとして維持されるのに対し(S15)、次のレコードの店コードはこれを参照する型に置き換えられる(S16)。
【0033】
図6は、インデックス生成部24によって生成されたインデックステーブルを示しており、図2のテーブルのキー項目値が、参照型を含む表形式で表現されている。
このように、重複するデータについては一の実データのみを残し、他はこれを参照する型に置き換えることにより、大幅なデータ量の削減効果が得られるため、比較的大規模なテーブルであっても、APサーバ12のメモリ26上にそのキー項目値の存在を示すデータをキャッシュすることが可能となる。
APサーバ12のデータ処理部22は、定期的にS11〜S18の処理を実行することにより、インデックスデータの内容をアップデートする。
【0034】
ここで、クライアント端末20からの検索リクエストを、ロードバランサ16経由でAPサーバ12が受信すると(図4のS19)、データ処理部22はメモリ26上に形成された参照型データを含む表形式のインデックスを参照し、検索条件に該当する全キー項目の値を取得する(S20)。
例えば、クライアント端末20から日付及び店コードのみを指定した検索リクエストが送信された場合であっても、APサーバ12のメモリ26上には「日付×店」配下の商品コードが全てキャッシュされているため、データ処理部22は当該「日付×店」に係る商品コードを全て取得可能となる。
【0035】
つぎにデータ処理部22は、日付、店コード、商品コードを特定したSQL文を生成し、DBサーバ14に発行する(S21)。
これに対しDBサーバ14は、該当のレコードをデータベース30から抽出し、APサーバ12に送信する。
これを受けたデータ処理部22は、所定の形式に加工した上で、クライアント端末20に送信する(S22)。
【0036】
このデータ処理システム10にあっては、上記のようにDBサーバ14のデータベース30内に格納されていたテーブルのキー項目の内容が、APサーバ12のメモリ26上にキャッシュされているため、DBサーバ14に検索を指令する際にはキー項目の値の全てを特定し、対象となるレコードをピンポイントで絞り込んだ形のSQL文を発行することが可能となる。
この結果、DBサーバ14においてレンジスキャンが発生することがなくなり、その分検索処理の高速化を実現できる。
【0037】
また、上記のように先行データと重複するデータについては参照型データに置き換えることにより、インデックステーブルのデータ量を低減できるため、比較的容量の小さいAPサーバ12のメモリ26(一般に2GB程度)でも効率的に必要データを収容することが可能となる。
【0038】
また、データをDBサーバ14から取り出すに際し、全レコードに係るキー項目のデータを一度に受け取るのではなく、日付及び店コードの値を指定することにより、グループ単位に分割して受け取り、当該グループについて圧縮処理が完了した時点で次のグループに係るデータを受け取る方式を採用しているため、登録件数の比較的多いテーブルであってもAPサーバ12のメモリ26上にキー項目をキャッシュできるようになる。
【0039】
ただし、APサーバ12が保持するインデックスデータの構造は上記に限定されるものではない。以下にその具体例を示す。
まず図7は、テーブルのインデックス情報を、APサーバ12のハードディスク27内にフォルダ−ファイル形式で表現した例を示している。
この場合、データ処理部22からテーブルのキー項目データを受け取ったインデックス生成部24は、ハードディスク27の「Cache」フォルダ配下に「Shohin tbl」フォルダを生成し、その中に上位キー項目である日付に対応した「20060315」、「20060316」、「20060317」のフォルダを順に生成し、各フォルダに下位キー項目である店コードに対応した「600」、「601」、「602」のファイル名を有するテキストファイルを格納する。
また、各テキストファイルには、インデックス生成部24によって日付×店コード配下の商品コードが記述されている。
【0040】
この場合、例えばクライアント端末20から「日付(20060316)×店コード(601)」が検索条件として送信されると、データ処理部22は20060316のフォルダに格納された601ファイルを参照し、「491234567891」及び「491234567893」の商品コードを取得し、上記と同様、商品コードまで特定したSQL文をDBサーバ14に発行する。
【0041】
つぎに、図8のフローチャートに従い、APサーバ12のメモリ26上に木構造のインデックスデータを生成する例を説明する。
まず、APサーバ12のデータ処理部22が起動すると(S30)、DBサーバ14に対してSQL文を発行し、テーブルのキー項目に係るデータの抽出をリクエストする(S31)。
この際データ処理部22は、上記と同様、図2のテーブルに格納された各レコードを日付×店コードで特定されるグループ単位で、かつ日付、店コード、商品コードの値に基づいて昇順に整列させた状態で送信することを指令するSQL文を生成し、DBサーバ14に送信する。
【0042】
DBサーバ14のデータベース管理システム28から対応のデータが日付×店コードのグループ単位で送信されると、データ処理部22はこれをインデックス生成部24に渡す(S32)。
インデックス生成部24は、各レコードの日付と店コードに重複する値が存在するか否かをチェックし、重複がある場合には一つの日付及び一つの店コードを残し、他のデータを除去した後、メモリ26に各データを格納する(S33)。
【0043】
一つのグループに関してデータの圧縮(重複データの削除及び参照型への置換)及びメモリ26への格納が完了すると、データ処理部22は次のグループ(日付×店コード)に属するレコードの抽出を指令するSQL文をDBサーバ14に発行し(S34、S31)、インデックス生成部24によるデータの圧縮及びメモリ26への格納が実行される(S32、S33)。
【0044】
APサーバ12のデータ処理部22及びインデックス生成部24は、対象となるテーブル上の全グループについて処理が完了するまで、S31〜S33のステップを繰り返す(S34)。
図9は、メモリ26に格納されたデータのイメージを示すものであり、(a)は2006年3月15日の店コード:600店に係るグループのデータに対応している。図示の通り、日付(20060315)及び店コード(600)のデータは先頭レコードについてのみ残されており、他のレコードからは削除されている。この時点で、日付及び店コードが削除されたレコードに係る商品コードは、先頭レコードの商品コードと共に配列として残された日付及び店コードに関連付けられている。
また、(g)は2006年3月17日の店コード:601店に係るグループのデータに対応している。
【0045】
つぎにインデックス生成部24は、各グループの中で日付を同じくするもの同士を一つの日付の下に集約し、それぞれを一つの根(root)の元に結合する(この時点で重複する日付は削除される)。
この結果、図10に示すように、DBサーバ14のデータベース30内に格納されていたテーブルのキー項目が、APサーバ12のメモリ26上に木構造のインデックスデータとして形成される(S35)。
【0046】
図2のテーブルにおいては、各レコード毎に日付及び店コードのデータを備えていたが、図10に示した木構造のデータの場合、上位キー項目である日付については一切の重複がない形で集約され、下位キー項目である店コードについても同一グループ内では重複が存在しない形で集約されているため、データ容量の大幅な圧縮が達成されている。
この結果、比較的容量の小さいAPサーバ12のメモリ26上に、より効率的にインデックスデータをキャッシュすることが可能となる。
【0047】
この場合も、クライアント端末20から検索リクエストが送信されると、データ処理部22はメモリ26上に形成された木構造のインデックスデータを参照し、検索条件に該当する全キー項目の値を取得した後、日付、店コード、商品コードを特定したSQL文を生成し、DBサーバ14に発行する。
【0048】
つぎに、図11のフローチャートに従い、APサーバ12のメモリ26上に参照型データを含む木構造のインデックスを生成する例を説明する。
まず、S40〜S43において、図8のS30〜33と同一の処理がAPサーバ12のデータ処理部22及びインデックス生成部24によって実行され、DBサーバ14が管理するテーブルのキー項目値が、日付×店コードのグループ単位でメモリ26に格納される。
図12は、インデックス生成部24によってメモリ26に格納されたデータグループのイメージを示すものであり、(a)は2006年3月15日の店コード:600店に係るグループのデータに対応している。図示の通り、日付(20060315)及び店コード(600)のデータは先頭レコードについてのみ残されており、他のレコードからは削除されている。この時点で、日付及び店コードが削除されたレコードに係る商品コードは、先頭レコードの商品コードと共に配列として残された日付及び店コードに関連付けられている。
【0049】
つぎにインデックス生成部24は、各レコードの店コード及び商品コードを先行するレコードの店コード及び商品コードと順次比較していき(S44)、同一の店コードまたは商品コードが存在するか否かを確認する(S45)。
図12(a)の場合には、店コード及び商品コードの双方について重複する先行データが存在しないため、メモリ26上のデータはそのまま維持される(S46)。
【0050】
一つのグループに関する上記の処理が完了すると、データ処理部22は次のグループ(日付×店コード)に属するレコードの抽出を指令するSQL文をDBサーバ14に発行し(S48、S41)、インデックス生成部24によるデータの圧縮(重複データの削除)及びメモリ26への格納が実行される(S42、S43)。
【0051】
つぎにインデックス生成部24は、各レコードの店コード及び商品コードを先行するレコードの店コード及び商品コードと順次比較していき(S44)、同一の店コードまたは商品コードが存在するか否かを確認する(S45)。
図12(b)は、2006年3月15日の店コード:601店に係るグループのデータに対応しており、この場合には商品コードの「491234567891」及び「491234567893」の双方について重複するデータが先行のデータグループ(図12(a))に存在するため、インデックス生成部24はこれらを削除すると共に、先行商品コードの実体データを参照する型に置き換える(S47)。
これに対し、店コード「601」については重複するデータが先行のデータグループに存在しないため、インデックス生成部24は当該店コードをそのまま維持する(S46)。
【0052】
APサーバ12のデータ処理部22及びインデックス生成部24は、対象となるテーブル上の全グループについて処理が完了するまで、S41〜S47のステップを繰り返す(S48)。
因みに、図12(c)は2006年3月16日の店コード:600店に係るグループのデータに対応しており、店コード及び商品コードの全データについて先行データが存在しているため、インデックス生成部24によって実データが削除されると共に、先行する実データの参照型に置き換えられている。
【0053】
つぎにインデックス生成部24は、各グループ間で日付を同じくするもの同士を一つの日付の下に集約し、それぞれを一つの根(root)の元に結合する(この時点で重複する日付は削除される)。
この結果、図13に示すように、DBサーバ14のデータベース30内に格納されていたテーブルのキー項目値が、APサーバ12のメモリ26上に参照型データを含む木構造のインデックスとしてキャッシュされる(S49)。
図2のテーブルにおいては、各レコード毎に日付及び店コードのデータを備えていたが、図13に示したデータ構造の場合、上位キー項目である日付については一切の重複がない形で集約され、また下位キー項目である店コード及び商品コードについても参照型を使うことで各グループを通じて一切の重複が存在しない形で表現されているため、データ容量の大幅な圧縮が達成されている。
【0054】
この場合も、クライアント端末20から検索リクエストが送信されると、データ処理部22はメモリ26上に形成された参照型データを含む木構造のインデックスを参照し、検索条件に該当する全キー項目の値を取得した後、日付、店コード、商品コードを特定したSQL文を生成し、DBサーバ14に発行する。
【0055】
上記においては、店コード及び商品コードを参照型のデータに変換する処理をデータグループ単位で実行する例を説明したが、変換手順はこれに限定されるものではない。
以下、図14のフローチャートに従い、参照型データへの他の変換手順を説明する。
まず、APサーバ12のデータ処理部22及びインデックス生成部24によって図8のS30〜S34と同一の処理が実行される結果、図9に示した通り、メモリ26上にはDBサーバ14のキー項目の値が、日付×店コードのグループ単位で、かつ重複する日付及び店コードが削除された形で格納される(S50〜S54)。
【0056】
つぎにインデックス生成部24は、図15に示すように、S53において一旦削除した日付及び店コードのデータを、残された実データを参照する型のデータで補充し、表形式のデータをメモリ26上に再編成する(S55)。
このように、重複データを削除した後に参照型のデータに置き換えることにより、データ量を低減しつつ各レコードのソートが可能な状態となる。
【0057】
つぎにインデックス生成部24は、図16に示すように、各レコードを商品コードの値に基づいて昇順にソートし(S56)、重複する商品コードについては先頭の商品コードのみを実データとしてメモリ26上に残し、それ以外のデータは削除した上で残された実データの参照型に置き換える(S57)。
【0058】
つぎにインデックス生成部24は、図17に示すように、各レコードを店コードの値に基づいて昇順にソートし(S58)、重複する店コードについては先頭の店コードのみを実データとしてメモリ26上に残し、それ以外のデータは削除した上で残された実データの参照型に置き換える(S59)。
【0059】
つぎにインデックス生成部24は、各レコードを日付×店コードに基づいて昇順にソートした後(S60)、日付×店コードを同じくするグループに分け、各グループ間で日付を同じくするもの同士を一つの日付の下に集約し、それぞれを一つの根(root)の元に結合する(この時点で重複する日付は削除される)。
この結果、図13に示したのと同様、DBサーバ14のデータベース30内に格納されていたテーブルの全キー項目値が、APサーバ12のメモリ26上に参照型データを含む木構造のインデックスとしてキャッシュされる(S61)。
【0060】
つぎに、図18のフローチャートに従い、参照型への第3の変換手順を説明する。
まず、APサーバ12のデータ処理部22及びインデックス生成部24によって図8のS30〜S34と同一の処理が実行される結果、図9に示した通り、メモリ26上にはDBサーバ14のキー項目の値が、日付×店コードのグループ単位で、かつ重複する日付及び店コードが削除された形で格納される(S70〜S74)。
【0061】
つぎにインデックス生成部24は、各グループ間で日付を同じくするもの同士を一つの日付の下に集約し、それぞれを一つの根(root)の元に結合する(この時点で重複する日付は削除される)。
この結果、図19に示すように、DBサーバ14のデータベース30内に格納されていたテーブルの全キー項目値が、APサーバ12のメモリ26上に参照型データを含まない木構造のデータとしてキャッシュされる(S75)。
【0062】
つぎにインデックス生成部24は、メモリ26上に空のディスティンクト(Distinct)配列32を設定すると共に(S76)、ここに木構造のデータ中に含まれる商品コードの値を、店コードを同じくするグループ単位で充填し(S77)、ディスティンクト配列32内の商品コードを昇順にソートした後、重複する商品コードを削除する(S78)処理を、商品コードの全グループについて繰り返す(S79)。
この結果、木構造に含まれる商品コードの全類型が重複することなく昇順に整列配置されたディスティンクト・リスト(DistinctList)が、メモリ26上に生成される。
【0063】
つぎにインデックス生成部24は、木構造のデータ中に含まれる各商品コードの値とディスティンクト・リストの各要素とのマッチングを行い、商品コードの実データを対応のディスティンクト要素を参照する型に変換する(S80)。
この結果、図20に示すように、木構造のデータ中に含まれる全ての商品コードが、ディスティンクト・リスト34の参照型データとして表現される。
【0064】
つぎにインデックス生成部24は、木構造のデータ中に含まれる店コード毎に、先行する店コードの値と比較し(S81)、重複する先行データが存在しない場合にはそのまま実データとしてメモリ26上に残し(S82、S83 )、重複する先行データが存在する場合には当該店コードを削除して先行データの参照型に置き換える(S82、S84)。
以上の結果、APサーバ12のメモリ26上に、参照型のデータを含む木構造のデータが形成される。
【0065】
なお、図示の便宜上図18のフローチャートにおいては店コードについてのみS81〜S84の処理を実行するように簡略化して記載したが、最上位のキー項目である日付と最下位のキー項目である商品コードとの間に複数の階層が存在する場合(例えば店コードの上位階層として「地域コード」が設定されている場合)には、各階層毎にS81〜S84の処理が繰り返される。
【0066】
つぎに、図21のフローチャートに従い、APサーバ12のメモリ26上に参照型データ及びブーリアン配列を含む木構造のインデックスを生成する例を説明する。
この実施形態においては、APサーバ12のデータ処理部22及びインデックス生成部24によって図11のS40〜S49の処理が実行され、メモリ26上に参照型データを含む木構造のインデックスが形成されることが前提となる。
ここでインデックス生成部24は、図22に示すように、上記と同様の手順に従い、商品コードのディスティンクト・リスト34をメモリ26上に生成する(S90)。
【0067】
つぎにインデックス生成部24は、ディスティンクト・リスト34の各要素と各商品コードの値を、商品コードの上位キー項目である店コードを共通にする兄弟単位で順番にマッチングさせていき(S91)、ディスティンクト・リストの要素と一致する場合には、当該商品コードを削除すると共に、ディスティンクト・リスト32と同サイズのブーリアン配列における対応位置にブーリアン型の「true」をセットし、ディスティンクト・リストの値が存在しない場合にはブーリアン型の「false」を対応位置にセットする処理を実行する(S92)。
【0068】
図23は、「20060315」−「600」に係る商品コードの配列36とディスティンクト・リスト34とのマッチングを示しており、この商品コードの配列36にはディスティンクト・リスト32と同じ位置に同じ商品コードが存在しているため、全商品コードが「true」に置き換えられる。
【0069】
また、図24は、「20060315」−「601」に係る商品コードの配列とディスティンクト・リスト32とのマッチングを示している。この場合、商品コードの「491234567891(参照型)」及び「491234567893(参照型)」のみがディスティンクト・リスト32中の2番目及び4番目の値と対応しており、ディスティンクト・リスト32中の1番目及び3番目の値である「491234567890」及び「491234567892」が欠落している。このため、インデックス生成部24は商品コードの「491234567891(参照型)」及び「491234567893(参照型)」を削除した後、ブーリアン型の「false」、「true」、「false」、「true」を商品コードを表すデータとしてブーリアン配列にセットする。
【0070】
図25は、実データ及び参照型を含む全ての商品コードが削除され、ディスティンクト・リスト34と同サイズのブーリアン配列に置き換えられた木構造のインデックスを示している。
商品コードを参照型で表現した場合、32ビットシステムでは1参照当たり4バイトのメモリを消費することになるが(64ビットシステムでは8バイト)、ブーリアン型の場合には1バイトで特定の商品コードの存在を表現できるため、データ容量の圧縮効果をより高めることが可能となる。
【0071】
この場合も、クライアント端末20から検索リクエストが送信されると、データ処理部22はメモリ26上に形成された参照型データ及びブーリアン配列を含む木構造のインデックス及びディスティンクト・リスト34を参照し、検索条件に該当する全キー項目の値を取得した後、日付、店コード、商品コードの値を特定したSQL文を生成し、DBサーバ14に発行する。
【0072】
つぎに、図26のフローチャートに従い、APサーバ12のメモリ26上に参照型データ及びビット配列を含む木構造のインデックスを生成する例を説明する。
この実施形態においては、APサーバ12のデータ処理部22及びインデックス生成部24によって図11のS40〜S49及び図21のS90〜S93の処理が実行され、メモリ26上に参照型及びブーリアン配列を含む木構造のインデックス(図25)が形成されることが前提となる。
【0073】
つぎにインデックス生成部24は、上記のブーリアン配列をビット配列に変換する処理を実行する(S94)。
このビット配列は、図27に示すように、8桁の二値データ(1または0)を備えており、各桁には下から1、2、4、8、16、32、64、−128の定数が割り当てられている。
ここでインデックス生成部24は、ブーリアン配列のある桁に「true」が格納されている場合には、ビット配列の対応の桁に「1」をセットし、「false」が格納されている場合には「0」をセットする。
【0074】
図27(a)の場合には、商品コードの存在がブーリアン値のtrue, true, true, trueで表現されているため、インデックス生成部24がビット配列の上4桁に「1」をセットすると共に、下4桁に「該当する値なし」ということで「0」をセットする様子を示している。この「11110000」のビット配列は、上記した各桁の定数を適用することにより、「−16」という数値を表していることになる。
図27(b)の場合には、商品コードの存在がブーリアン値のfalse, true, false, trueで表現されているため、インデックス生成部24がビット配列の上4桁に「0101」をセットすると共に、下4桁に「該当する値なし」ということで「0」をセットする様子を示している。この「01010000」のビット配列は、上記した各桁の定数を適用することにより、「80」という数値を表していることになる。
図27(c)の場合には、商品コードの存在がブーリアン値のtrue, false, true, trueで表現されているため、インデックス生成部24がビット配列の上4桁に「1011」をセットすると共に、下4桁に「該当する値なし」ということで「0」をセットする様子を示している。この「10110000」のビット配列は、上記した各桁の定数を適用することにより、「−80」という数値を表していることになる。
【0075】
また、図28(a)の場合には、商品コードの存在がブーリアン値のfalse, true, true, true, true, true, true, trueで表現されているため、インデックス生成部24がビット配列の最初の桁に「0」をセットすると共に、残りの桁に「1」をセットする様子を示している。この「01111111」のビット配列は、上記した各桁の定数を適用することにより、「127」という数値を表していることになる。
図28(b)の場合には、商品コードの存在がブーリアン値のtrue, false, false, false, false, false, false, falseで表現されているため、インデックス生成部24がビット配列の最初の桁に「1」をセットすると共に、残りの桁に「0」をセットする様子を示している。この「10000000」のビット配列は、上記した各桁の定数を適用することにより、「−127」という数値を表していることになる。
【0076】
上記のように、ブーリアン配列の代わりに8桁のビット配列を用いることにより、−127〜127までの256通りの数値を表現することが可能となり、これは即ち256パターンのブーリアン値の組合せを僅か8ビット(1バイト)で表現できることを意味している。
【0077】
以上の結果、図29に示すように、図25のブーリアン配列をビット配列に変換した木構造のインデックスがメモリ26上に形成される(S95)。
例えば、2006年3月15日の600店における商品コードとして「11110000」のビット配列が関連付けられていた場合、ここから「true, true,true, true, false, false, false, false」のブーリアン配列が導かれ、これをディスティンクト・リスト34と対比することにより、「491234567890」、「491234567891」、「491234567892」、「491234567893」の具体的な商品コードを特定することが可能となる(下4桁のfalseはディスティンクト・リスト34のサイズと合致しないため、無視される)。
【0078】
この場合も、クライアント端末20から検索リクエストが送信されると、データ処理部22はメモリ26上に形成された参照型及びビット配列を含む木構造のインデックスデータ及びディスティンクト・リスト34を参照し、検索条件に該当する全キー項目の値を取得した後、日付、店コード、商品コードを特定したSQL文を生成し、DBサーバ14に発行する。
【0079】
ブーリアン配列の場合には、1つの状態(true or false)を表現するのにメモリを1バイト消費し、4つの状態を表現するのであれば4バイトのメモリを消費することになる。
これに対し、8桁のビット配列を用いた場合には、上記の通り1バイトで8つの状態を表示可能となり、メモリの使用量を劇的に抑制可能となる。
【0080】
なお、ブーリアン配列のサイズが8桁を越えている場合には、別のビット配列がインデックス生成部24によって設けられ、そこにブーリアン値に応じた二値データがセットされる。
図30はその具体例を示すものであり、ブーリアン配列が12桁である場合には1〜8桁までを第1のビット配列によって表現し、9〜12桁までが第2のビット配列によって表現される。
この場合、データ処理部22は第1のビット配列を参照することによってブーリアン配列の上8桁を特定し、また第2のビット配列を参照することによってブーリアン配列の下4桁を特定する。
その後、データ処理部22はディスティンクト・リスト34を参照することにより、具体的な商品コードを特定する。
【0081】
上記にあっては、ブーリアン配列を経由してビット配列を生成する例を説明したが、図22に示した参照型データを含む木構造のインデックスから直接ビット配列を生成することもできる。
すなわち、インデックス生成部24は、ディスティンクト・リスト34の各要素と各商品コードの値を、商品コードの上位キー項目である店コードを共通にする兄弟単位で順番にマッチングさせていき、ディスティンクト・リスト34の要素と一致する場合には、当該商品コードを削除すると共に、メモリ26上に設けた所定桁数のビット配列における対応位置に1をセットし、ディスティンクト・リストの値が存在しない場合には0を対応位置にセットする。
この場合もデータ処理部22は、メモリ26上に形成されたビット配列の各桁の値(1または0)とディスティンクト・リスト34を参照することにより、商品コードの値を取得する。
【0082】
上記においては、最上位のキー項目である日付と最下位のキー項目である商品コードの間に、店コードのみが存在するテーブルを例に説明したが、最上位のキー項目と最下位のキー項目との間に複数階層のキー項目(例えば「日付−地域コード−店コード−商品コード」)が存在している場合にも適用可能であることはいうまでもない。
【図面の簡単な説明】
【0083】
【図1】この発明に係るデータ処理システムの全体構成図である。
【図2】DBサーバのデータベースに格納されたテーブルの一例を示す図である。
【図3】参照型データを含む表形式のインデックスをAPサーバのメモリ上に生成する手順を示すフローチャートである。
【図4】このシステムにおける検索処理の手順を示すフローチャートである。
【図5】APサーバのメモリに格納されたグループデータを示すイメージ図である。
【図6】APサーバのメモリにキャッシュされた参照型データを含む表形式のインデックスを示すイメージ図である。
【図7】APサーバのディスクにフォルダ−ファイル形式でキャッシュされたインデックスを示すイメージ図である。
【図8】木構造のインデックスをAPサーバのメモリ上に生成する手順を示すフローチャートである。
【図9】APサーバのメモリに格納されたグループデータを示すイメージ図である。
【図10】APサーバのメモリにキャッシュされた木構造のインデックスを示すイメージ図である。
【図11】参照型データを含む木構造のインデックスをAPサーバのメモリ上に生成する手順を示すフローチャートである。
【図12】APサーバのメモリに格納されたグループデータを示すイメージ図である。
【図13】APサーバのメモリにキャッシュされた参照型データを含む木構造のインデックスを示すイメージ図である。
【図14】参照型データを含む木構造のインデックスをAPサーバのメモリ上に生成する他の手順を示すフローチャートである。
【図15】参照型データを含む木構造のインデックスをAPサーバのメモリ上に生成する要領を示す説明図である。
【図16】参照型データを含む木構造のインデックスをAPサーバのメモリ上に生成する要領を示す説明図である。
【図17】参照型データを含む木構造のインデックスをAPサーバのメモリ上に生成する要領を示す説明図である。
【図18】参照型データを含む木構造のインデックスをAPサーバのメモリ上に生成する他の手順を示すフローチャートである。
【図19】参照型データを含む木構造のインデックスをAPサーバのメモリ上に生成する要領を示す説明図である。
【図20】APサーバのメモリにキャッシュされた参照型データを含む木構造のインデックスを示すイメージ図である。
【図21】参照型データ及びブーリアン配列を含む木構造のインデックスをAPサーバのメモリ上に生成する手順を示すフローチャートである。
【図22】APサーバのメモリに形成された参照型データを含む木構造のインデックスを示すイメージ図である。
【図23】参照型データ及びブーリアン配列を含む木構造のインデックスをAPサーバのメモリ上に生成する要領を示す説明図である。
【図24】参照型データ及びブーリアン配列を含む木構造のインデックスをAPサーバのメモリ上に生成する要領を示す説明図である。
【図25】APサーバのメモリにキャッシュされた参照型データ及びブーリアン配列を含む木構造のインデックスを示すイメージ図である。
【図26】参照型データ及びビット配列を含む木構造のインデックスをAPサーバのメモリ上に生成する手順を示すフローチャートである。
【図27】参照型データ及びビット配列を含む木構造のインデックスをAPサーバのメモリ上に生成する要領を示す説明図である。
【図28】参照型データ及びビット配列を含む木構造のインデックスをAPサーバのメモリ上に生成する要領を示す説明図である。
【図29】APサーバのメモリにキャッシュされた参照型データ及びビット配列を含む木構造のインデックスを示すイメージ図である。
【図30】参照型データ及びビット配列を含む木構造のインデックスをAPサーバのメモリ上に生成する要領を示す説明図である。
【符号の説明】
【0084】
10 データ処理システム
12 APサーバ
14 DBサーバ
16 ロードバランサ
18 イントラネット
20 クライアント端末
22 データ処理部
24 データ圧縮部
26 メモリ
28 データベース管理システム
30 データベース
32 ディスティンクト配列
34 ディスティンクト・リスト
36 商品コードの配列

【特許請求の範囲】
【請求項1】
DBサーバとAPサーバを備えたデータ処理システムであって、
上記DBサーバが、データベース管理システムと、テーブルを格納したデータベースを備え、
上記APサーバが、上記DBサーバにSQL文を発行し、上記テーブルのキー項目に係るデータの読み出しを指令するデータ読み出し手段と、
DBサーバから送信されたキー項目に係るデータを圧縮し、上記APサーバの記憶手段に上記テーブルのインデックスとして格納するインデックス生成手段と、
クライアント端末から上位キー項目を検索条件として指定した検索リクエストが送信された場合に、上記APサーバのインデックスを参照し、上記検索条件に包含されるキー項目の値を取得するキー項目値取得手段と、
各キー項目の値を特定したSQL文を生成し、上記DBサーバに発行する手段とを備えたことを特徴とするデータ処理システム。
【請求項2】
上記のデータ読み出し手段が、上記SQL文において一または複数のキー項目の値を指定することにより、上記DBサーバから上記テーブルをグループに分割して読み出す処理を実行し、
上記のインデックス生成手段が、圧縮処理をグループ単位で実行することを特徴とする請求項1に記載のデータ処理システム。
【請求項3】
上記インデックス生成手段が、上記DBサーバから送信されたデータ中において値が相互に重複するものが存在する場合に、一つの値のみを実データとしてメモリ上に残し、他の値については上記実データを参照する型に変換する処理を実行し、参照型データを含む表形式のインデックスを生成することを特徴とする請求項1に記載のデータ処理システム。
【請求項4】
上記インデックス生成手段が、少なくとも最上位のキー項目毎に対応のフォルダをAPサーバのディスク上に生成する第1の処理と、
各最上位のキー項目に包含される1または複数の中位キー項目に対応したファイルを生成し、対応のフォルダに格納する第2の処理と、
各中位のキー項目に包含される1または複数の下位キー項目の値を対応のファイルに記述する第3の処理を実行することを特徴とする請求項1に記載のデータ処理システム。
【請求項5】
上記インデックス生成手段が、上記DBサーバから送信された各データの中で、少なくとも最上位のキー項目については、値が相互に重複する場合に一つのレコードのデータを残して他のレコードのデータを削除し、削除されたデータに従属していた下位データを残されたデータに関連付ける第1の処理と、
残された最上位のキー項目を一つの根の元に結合させることにより、木構造のインデックスをAPサーバのメモリ上に生成する第2の処理を実行することを特徴とする請求項1に記載のデータ処理システム。
【請求項6】
上記インデックス生成手段が、上記DBサーバから送信された各データの中で、少なくとも最上位のキー項目については、値が相互に重複する場合に一つのレコードのデータを残して他のレコードのデータを削除し、削除されたデータに従属していた下位データを残されたデータに関連付ける第1の処理と、
値が相互に重複する下位のキー項目については、一の値のみを実データとしてAPサーバのメモリ上に残し、他の値については上記実データを参照する型に変換する第2の処理と、
残された最上位のキー項目を一つの根の元に結合させ、参照型データを含む木構造のインデックスをAPサーバのメモリ上に生成する第3の処理を実行することを特徴とする請求項1に記載のデータ処理システム。
【請求項7】
上記のデータ圧縮手段が、上記DBサーバから送信された各レコードの中で、少なくとも最上位のキー項目については、値が相互に重複する場合に一つのレコードのデータを残して他のレコードのデータを削除し、削除されたデータに従属していた下位データを残されたデータに関連付ける第1の処理と、
各レコードの下位のキー項目の値と先行レコードの同キー項目の値とを順次比較し、先行レコードの値と重複する値を削除すると共に、先行レコードの値を参照する型に変換する第2の処理と、
残された上位キー項目同士を一つの根の元に結合させ、参照型を含む木構造のデータを生成する第3の処理を実行することを特徴とする請求項1に記載のデータ処理システム。
【請求項8】
上記インデックス生成手段が、上記DBサーバから送信された各データの中で、少なくとも最上位のキー項目については、値が相互に重複する場合に一つのレコードのデータを残して他のレコードのデータを削除し、残されたデータを参照する型に変換する第1の処理と、
各レコードを下位のキー項目の値に基づいて所定の順序で整列させ、下位のキー項目の値が相互に重複する場合に一つのレコードのデータを残して他のレコードのデータを削除し、残されたデータを参照する型に変換する第2の処理と、
各レコードを少なくとも最上位のキー項目の値に基づいて所定の順序で整列させる第3の処理と、
最上位のキー項目を一つの根の元に結合させ、参照型データを含む木構造のデータを生成する第4の処理を実行することを特徴とする請求項1に記載のデータ処理システム。
【請求項9】
上記インデックス生成手段が、上記DBサーバから送信された各データの中で、少なくとも最上位のキー項目については、値が相互に重複する場合に一つのレコードのデータを残して他のレコードのデータを削除し、削除されたデータに従属していた下位データを残されたデータに関連付ける第1の処理と、
残された最上位のキー項目を一つの根の元に結合させて木構造のデータを生成する第2の処理と、
上記木構造のデータに含まれる最下位のキー項目の類型を抽出し、これらを要素として充填させたディスティンクト・リストをメモリ上に生成する第3の処理と、
上記ディスティンクト・リストに含まれる各要素と上記木構造のデータに含まれる最下位のキー項目の各値とをマッチングし、最下位のキー項目の各値をディスティンクト・リスト中の対応の要素を参照する型に変換する第4の処理を実行することを特徴とする請求項1に記載のデータ処理システム。
【請求項10】
上記インデックス生成手段が、上記DBサーバから送信された各データの中で、少なくとも最上位のキー項目については、値が相互に重複する場合に一つのレコードのデータを残して他のレコードのデータを削除し、削除された上位データに従属していた下位データを残された上位データに関連付ける第1の処理と、
残された最上位のキー項目同士を一つの根の元に結合させ、木構造のデータを生成する第2の処理と、
最下位のキー項目に含まれる値の類型を抽出し、これらを所定の順序で整列させたディスティンクト・リストを生成し、メモリに格納する第3の処理と、
上記ディスティンクト・リストに含まれる各要素と最下位のキー項目の値とを、親のキー項目を共通にする兄弟単位で順にマッチングさせ、ディスティンクト・リストの要素が最下位のキー項目に存在する場合には、メモリ上に設けたディスティンクト・リストと同サイズのブーリアン配列における対応位置にブーリアン型のtrueをセットすると同時に実データを削除し、該当の値が最下位のキー項目に存在しない場合には上記ブーリアン配列の対応位置にブーリアン型のfalseをセットする第4の処理を実行し、
上記キー項目値取得手段が、各ブーリアン配列及び上記ディスティンクト・リストを参照することにより、最下位のキー項目の値を特定することを特徴とする請求項1に記載のデータ処理システム。
【請求項11】
上記インデックス生成手段が、上記DBサーバから送信された各データの中で、少なくとも最上位のキー項目については、値が相互に重複する場合に一つのレコードのデータを残して他のレコードのデータを削除し、削除された上位データに従属していた下位データを残された上位データに関連付ける第1の処理と、
残された最上位のキー項目同士を一つの根の元に結合させ、木構造のデータを生成する第2の処理と、
最下位のキー項目に含まれる値の類型を抽出し、これらを所定の順序で整列させたディスティンクト・リストを生成し、メモリに格納する第3の処理と、
上記ディスティンクト・リストに含まれる各要素と最下位のキー項目の値とを、親のキー項目を共通にする兄弟単位で順にマッチングさせ、ディスティンクト・リストの要素が最下位のキー項目に存在する場合には、メモリ上に設けたディスティンクト・リストと同サイズのブーリアン配列における対応位置にブーリアン型のtrueをセットすると同時に実データを削除し、該当の値が最下位のキー項目に存在しない場合には上記ブーリアン配列の対応位置にブーリアン型のfalseをセットする第4の処理と、
上記のブーリアン配列をビット配列に変換する第5の処理を実行し、
上記キー項目値取得手段が、各ビット配列をブーリアン配列に変換し、各ブーリアン配列及び上記ディスティンクト・リストを参照することにより、最下位のキー項目の値を特定することを特徴とする請求項1に記載のデータ処理システム。
【請求項12】
上記インデックス生成手段が、上記DBサーバから送信された各データの中で、少なくとも最上位のキー項目については、値が相互に重複する場合に一つのレコードのデータを残して他のレコードのデータを削除し、削除された上位データに従属していた下位データを残された上位データに関連付ける第1の処理と、
残された最上位のキー項目同士を一つの根の元に結合させ、木構造のデータを生成する第2の処理と、
最下位のキー項目に含まれる値の類型を抽出し、これらを所定の順序で整列させたディスティンクト・リストを生成し、メモリに格納する第3の処理と、
上記ディスティンクト・リストに含まれる各要素と最下位のキー項目の値とを、親のキー項目を共通にする兄弟単位で順にマッチングさせ、ディスティンクト・リストの要素が最下位のキー項目に存在する場合には、メモリ上に設けたビット配列における対応位置に1をセットすると同時に実データを削除し、該当の値が最下位のキー項目に存在しない場合には上記ビット配列の対応位置に0をセットする第4の処理を実行し、
上記キー項目値取得手段が、各ビット配列及び上記ディスティンクト・リストを参照することにより、最下位のキー項目の値を特定することを特徴とする請求項1に記載のデータ処理システム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22】
image rotate

【図23】
image rotate

【図24】
image rotate

【図25】
image rotate

【図26】
image rotate

【図27】
image rotate

【図28】
image rotate

【図29】
image rotate

【図30】
image rotate