データ整形システム、方法、及びプログラム
【課題】利用者による多次元データ分析の際のデータの整形などに要する試行錯誤の削減等を実現できる技術を提供する。
【解決手段】本データ整形システムは、計算機システム101(分析管理サブシステム200、データ整形サブシステム300、分析対象DB400を含む)で構成され、主キー推薦分析部302などを備える。本システムは、利用者からの要求に従い、分析対象データの各々のデータ項目間の関連度を算出し、当該関連度に基づいて、利用者に推薦するための主キーとして適するデータ項目を分析・抽出して当該情報を利用者に対して出力し、当該出力された情報の中から利用者により主キーとするデータ項目を選択可能として、当該選択されたデータ項目に関して分析対象データの各々のデータ項目へのデータ整形を含む処理を実行可能とする。
【解決手段】本データ整形システムは、計算機システム101(分析管理サブシステム200、データ整形サブシステム300、分析対象DB400を含む)で構成され、主キー推薦分析部302などを備える。本システムは、利用者からの要求に従い、分析対象データの各々のデータ項目間の関連度を算出し、当該関連度に基づいて、利用者に推薦するための主キーとして適するデータ項目を分析・抽出して当該情報を利用者に対して出力し、当該出力された情報の中から利用者により主キーとするデータ項目を選択可能として、当該選択されたデータ項目に関して分析対象データの各々のデータ項目へのデータ整形を含む処理を実行可能とする。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、データ分析に係わる情報処理システム等の技術に関する。特に、多次元データを対象としたデータ分析に係わるデータ整形を支援する技術に関する。
【背景技術】
【0002】
データ分析を行う技術には様々なものがある。先行技術例として、特開平6−89305号公報(特許文献1)、特開2000−39999号公報(特許文献2)、特開2001−312573号公報(特許文献3)、特開2001−188796号公報(特許文献4)などがある。
【0003】
特許文献1では、データ項目の関連箇所を視覚的に明示し、相互に関連するデータ項目やプログラムの一括修正の自動化を行う。
【0004】
特許文献2では、データベースに格納された複数のデータ項目に基づいて、項目間の関係を特徴づけるIF−THENルールを生成する。
【0005】
特許文献3では、分析対象データを分析する際に、当該データと関連する幾つかのデータを用いることで、原因の解明や分析結果の裏付けを行う。
【0006】
特許文献4では、分析対象データに因子分析を適用し、因子ごとにデータ項目と因子負荷量の組合せを表示することで、データ分析結果をユーザが把握しやすい形式で表示する。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】特開平6−89305号公報
【特許文献2】特開2000−39999号公報
【特許文献3】特開2001−312573号公報
【特許文献4】特開2001−188796号公報
【発明の概要】
【発明が解決しようとする課題】
【0008】
利用者(分析担当者)により多次元データを分析する際には、入力の候補となるデータ項目が多いため、データ項目を様々に変更し、処理しながら、望む分析を実施できるデータ項目と処理の組を見つける。この作業はOLAP(Online Analytical Processing)ツールを利用して行われることが一般的である。OLAPツールは、高速処理・可視化という面でこの作業を支援することが可能である。
【0009】
OLAPツールなどを用いて多次元データ分析を行うためには、予め分析の目的に適した形式にデータを整形する必要がある。目的に応じて適切にデータを整形するためには、どのデータ項目が主キーとして適切か、また主キー以外のデータ項目に対してどのような処理を施すべきか、等を明確にしなればならない。従来は、利用者(分析担当者)の知識や経験で主キーおよび各データ項目への処理を決定するため、分析結果が利用者(分析担当者)の能力に依存する、また一般にデータ項目が増えるほどこの作業の負担が増大する、という問題がある。
【0010】
以上を鑑み、本発明の主な目的は、利用者(分析担当者)による多次元データ分析の際の分析対象となるデータの整形などに要する試行錯誤の削減、及び、利用者(分析担当者)の能力に依存しない主キー選定および主キーに対するデータ整形の処理作業の負担の軽減、等を実現することができる技術を提供することである。
【課題を解決するための手段】
【0011】
本発明のうち代表的な形態は、計算処理能力を有する一つ以上の計算機及びネットワークで構成される計算機システムを用いた利用者による多次元データの分析に係わるデータの整形を含む処理作業を支援する処理を行うシステム(データ整形システム)、方法、プログラム等であって、以下に示す構成を有することを特徴とする。
【0012】
本形態のシステムでは、多次元データである分析対象データの各々のデータ項目間の関連度に基づいて主キーに適するデータ項目を分析・抽出し、その主キーに対して分析対象データの各々のデータ項目へのデータ整形などの処理を支援する処理機能を有する構成である。本構成では、データの特徴、データ項目間の関係を抽出することにより、データ整形時の適切な主キーとなるデータ項目に関する情報を利用者に対して推薦し、当該情報に基づいて利用者によりキー列(主キーとなるデータ項目)を選択して変更可能であり、これにより様々な視点で多次元データを整形可能である。
【0013】
本形態のデータ整形システムは、例えば、主キー推薦分析などの処理機能を有し、前記利用者からの要求に従い、前記多次元データである分析対象データの各々のデータ項目間の関連度を算出する第1の処理と、当該関連度に基づいて、前記利用者に推薦するための主キーとして適するデータ項目を分析・抽出する第2の処理(主キー推薦分析)と、当該抽出した(利用者に推薦するための)主キーとして適するデータ項目(候補)を含む情報を前記利用者に対して出力(例えば画面表示)する第3の処理と、当該出力された情報の中から前記利用者により主キーとするデータ項目を選択/指定可能として、当該選択されたデータ項目に関して前記分析対象データの各々のデータ項目へのデータ整形を含む処理を前記利用者からの要求に従い実行可能とする第4の処理とを行う。当該実行された場合のデータ整形の処理結果の情報は前記利用者に対して出力されると共に記憶手段に格納される。
【0014】
本形態のデータ整形システムは、例えば、前記計算機システムは、分析管理サブシステムと、データ整形サブシステムと、分析対象データベースとを有する。前記分析管理サブシステムは、前記利用者により情報を入力する処理を行う入力部、及び前記利用者に対して画面で情報を表示する処理を行う表示部を有する。前記データ整形サブシステムは、データ抽出部、主キー推薦分析部、及びデータ整形処理部を有する。前記分析対象データベースは、前記分析対象データ、及び前記データ整形の処理結果のデータが格納される。
【0015】
前記分析管理サブシステムは、前記利用者によるデータ抽出要求を受けて前記データ整形サブシステムに送信し、前記データ抽出部は、前記分析対象データベースから当該要求に応じた分析対象データを抽出して、前記分析管理サブシステムに表示させる。前記分析管理サブシステムは、前記利用者による主キー推薦分析要求を受けて前記データ整形サブシステムに送信し、前記主キー推薦分析部は、当該要求に応じて主キー推薦分析の処理として前記第1、第2、第3の処理を実行し、当該処理結果の情報を前記分析管理サブシステムに表示させる。前記分析管理サブシステムは、前記表示された情報の中からの前記利用者による主キーとするデータ項目の選択に基づく前記分析対象データの各々のデータ項目へのデータ整形の要求を前記データ整形サブシステムに送信し、前記データ整形処理部は、前記第4の処理として、前記利用者により主キーとして選択されたデータ項目に関する前記分析対象データの各々のデータ項目へのデータ整形について、複数の種類のデータ整形の中から利用者により選択されたデータ整形の処理を実行可能とする情報を前記分析管理サブシステムに表示させ、また、前記分析管理サブシステムで利用者により入力されるデータ整形のパラメータに従い、前記選択されたデータ整形の処理を実行して、当該処理結果の情報を前記分析管理サブシステムに表示させると共に前記分析対象データベースに登録する。
【発明の効果】
【0016】
本発明のうち代表的な形態によれば、利用者(分析担当者)による多次元データ分析の際の分析対象となるデータの整形などに要する試行錯誤の削減、及び、利用者(分析担当者)の能力に依存しない主キー選定および主キーに対するデータ整形の処理作業の負担の軽減、等を実現することができる。
【図面の簡単な説明】
【0017】
【図1】本発明の一実施の形態のデータ整形方法及びシステムにおけるシステム構成例を示す図である。
【図2】本発明の実施の形態1のデータ整形方法及びシステムの全体の手順を示す図である。
【図3】実施の形態1での図2の主キー推薦分析の手順(S106)の処理零を示すフロー図である。
【図4】実施の形態1での主キー推薦分析結果の一例を示す図である。
【図5】(A)は、実施の形態1でのデータ整形処理選択ダイアログ(画面)の一例を示す図であり、(B)は、当該画面中の処理選択肢における整形処理一覧の例を示す図である。
【図6】実施の形態1での図2のデータ整形処理の手順(S113)の処理例を示すフロー図である。
【図7】分析対象データ(D)の内容例を示す図である。
【図8】実施の形態1でのデータ整形の処理例(その1)を示す図である。
【図9】実施の形態1でのデータ整形の処理例(その2)を示す図である。
【図10】本発明の実施の形態2のデータ整形方法及びシステムの全体の手順を示す図である。
【図11】(A)は、実施の形態2でのデータ整形処理選択ダイアログ(画面)の一例を示す図であり、(B)は、当該画面中の条件選択肢における条件一覧の例を示し、(C)は、当該画面中の表示方法選択肢における表示方法一覧の例を示す。
【図12】実施の形態2での図10のデータ整形処理の手順(S153)の処理例を示すフロー図である。
【図13】実施の形態2でのデータ整形の処理例(その1)を示す図である。
【図14】実施の形態2でのデータ整形の処理例(その2)を示す図である。
【図15】本発明の実施の形態3のデータ整形方法及びシステムの全体の手順を示す図である。
【図16】実施の形態3でのデータ項目追加ダイアログ(画面)の一例を示す図である。
【図17】実施の形態3での図15のデータ項目追加の手順(S173)の処理例を示すフロー図である。
【図18】実施の形態3でのデータ項目追加及びデータ整形の処理例(その1)を示す図である。
【図19】実施の形態3でのデータ項目追加及びデータ整形の処理例(その2)を示す図である。
【図20】実施の形態1でのR(AK)の算出方法(式)の例を示す図である。
【発明を実施するための形態】
【0018】
以下、本発明の実施の形態(データ整形システム等)を図面に基づいて詳細に説明する。なお、実施の形態を説明するための全図において、同一部には原則として同一符号を付し、その繰り返しの説明は省略する。また説明上、分析対象データ:D、データ項目:A、等の記号を適宜使用する。
【0019】
[システム構成]
図1には、本発明の一実施の形態のシステムの基本構成(各実施の形態で共通の構成)を示している。図1では、計算機システム101上に配置されている、分析管理サブシステム200、データ整形サブシステム300、及び分析対象DB400を有し、それらが相互に接続される関係を模式的に示している。計算機システム101は、中央演算処理装置などの計算処理能力を有する一つ以上の計算機及びネットワーク等で構成される。
【0020】
計算機システム101の具体例としては、プロセッサ、メモリ、ディスク、バス、通信インタフェース部、入力装置、出力装置などの要素を備えるPCやサーバ等の計算機においてソフトウェアプログラム(本実施の形態のプログラム)を実行することにより、各処理機能・サブシステム等を実現する。例えばプロセッサがディスク等からメモリに制御プログラム(本実施の形態のプログラム)等をロードして実行することにより、入力部201やデータ抽出部301等の各部の処理が実現される。各種データについては、メモリやディスク、あるいはネットワーク上のDBサーバなどに格納される。例えば、各サブシステム(200,300)が計算機で実現されそれらがネットワークで接続される構成である。利用者(分析担当者)100は、各計算機または当該計算機に接続される端末から当該計算機の処理機能を利用する。
【0021】
分析管理サブシステム200は、入力部201、表示部202等を有し、利用者100に対してデータ分析・管理に係わるユーザインタフェースを提供するシステムであり、これにより利用者100はデータ分析等の作業が可能である。分析管理サブシステム200は、入力部201を介して得た利用者100からの要求に応じて、必要なデータを分析対象DB400から抽出し、データ整形サブシステム300に様々な要求を送信し、表示部202に結果を表示する処理などを行う。
【0022】
入力部201は、例えば計算機によるキーボード、マウス、その他の入力装置の制御処理により構成できる。表示部202は、計算機によるディスプレイ、プリンタ等の出力装置の制御処理により構成できる。表示部202では、例えばディスプレイにユーザインタフェースの画面を表示する。画面では、例えば、分析対象データD等の情報や、データ整形処理の前後の情報や、後述の主キー推薦分析結果(図4)、データ整形処理選択ダイアログ(図5)、条件入力ダイアログ(図11)、データ項目追加ダイアログ(図16)、等が表示される。
【0023】
また分析管理サブシステム200は、図示しないが、データ分析・管理(支援)に係わる公知のアプリケーションプログラム(例えばOLAPツール)等を備えてもよい。またそのアプリケーションプログラム(例えばOLAPツール)等において、本実施の形態の処理機能を実装し提供してもよい。
【0024】
データ整形サブシステム300は、分析対象データを、主キーとするデータ項目に基づいてデータ整形する処理(データ整形処理)などを行うシステムである。データ整形サブシステム300は、データ抽出部301、主キー推薦分析部302、及びデータ整形処理部303を有する。
【0025】
データ抽出部301は、分析対象DB400から分析対象データ(D)などを抽出する処理機能を有する。主キー推薦分析部302は、分析対象データに含まれるデータ項目のうち主キーとして適するデータ項目の候補を分析・抽出し、利用者100に対して推薦する処理機能を有する。データ整形処理部303は、主キー及びその他の条件に従ってデータを整形する処理機能を有する。
【0026】
分析対象DB400は、データ整形サブシステム300のデータ抽出部301が参照する複数の分析対象データ(D)、及びデータ整形サブシステム300が整形したデータ(整形データ)、等が格納されるDB(データベース)である。分析対象DB400は、DBサーバなど各種記憶手段により実現可能である。
【0027】
<実施の形態1>
図2〜図9等を用いて、本発明の実施の形態1について説明する。実施の形態1のデータ整形システムは、図1の計算機システム101により構成される。実施の形態1のデータ整形方法は、本システム(101)で実行されるデータ整形の処理手順を含む。実施の形態1のプログラムは、本システム(101)の処理を実現するプログラムである。
【0028】
[手順(1)]
図2は、実施の形態1で計算機システム101(データ整形システム)がデータ整形処理などを実行する際のシステム全体の手順(処理シーケンス)を示す。S101等は手順を表す。
【0029】
分析管理サブシステム200は、入力部201を介して受け付けた利用者(100)のデータ抽出要求(S101)をデータ整形サブシステム300のデータ抽出部301に送付する。当該要求(S101)を受けたデータ抽出部301は、分析対象DB400から分析対象データ(D)を抽出し(S102)、分析管理サブシステム200の表示部202に返戻し(S103)、表示部202で分析対象データ(D)等の情報を利用者に対して表示する(S104)。
【0030】
利用者は、入力部201を介して主キー推薦分析要求を入力可能であり、分析管理サブシステム200は、入力された主キー推薦分析要求をデータ整形サブシステム300の主キー推薦分析処理部302に送付する(S105)。主キー推薦分析部302は、当該要求(S105)に対し、主キー推薦分析の処理を実行し(S106)、その処理結果の情報(主キーに適する候補として推薦するデータ項目などの情報を含む)を返戻し(S107)、表示部202で表示する(S108)。
【0031】
利用者は、上記表示部202に表示されている主キー候補などの情報から、入力部201を介して主キー(データ項目)を選択可能であり(S109)、また、当該主キーに関しデータ整形処理などを選択可能であり、分析管理サブシステム200は、選択された主キーに関するデータ整形要求を、データ整形サブシステム300のデータ整形処理部303に送付する(S110)。当該要求(S110)を受け取ったデータ整形処理部303は、データ整形処理選択ダイアログの画面(後述、図5)を表示部202に表示させる(S111)。
【0032】
利用者は、上記画面でデータ整形に関わるパラメータを入力可能であり(S112)、分析管理サブシステム200は、入力されたパラメータ等の情報をデータ整形処理部303へ送付する。当該情報(S112)を受け取ったデータ整形処理部303は、当該パラメータ等に従いデータ整形処理を実行し(S113)、その処理結果の情報を表示部202に表示させる(S114)。また、データ整形処理部303は、上記処理結果の情報(整形データ等)を分析対象DB400に登録要求(S115)することにより登録(格納)させる(S116)。
【0033】
[主キー推薦分析(S106)]
図3に、主キー推薦分析部302が図2の主キー推薦分析の手順S106を実行する際の処理例を示す(S301等は処理ステップを示す)(以下、主な処理主体は302)。
【0034】
(S301) まず、分析対象データDのデータ項目数M、及びレコード数N、等を抽出し、変数K=1とする。
【0035】
(S302) K番目(1≦K≦M)のデータ項目をAKとしたときのAKの関連度R(AK)を算出する。ここで、R(AK)は、算出方法として例えば図20に示す式(例1(310〜313)または例2(314〜318))によって算出する。これらの式では、主キーとしてデータ項目AKを選択した場合に、AKの各要素(312、aで示す)に対するその他のデータ項目のとり得る要素数が多いか少ないかを算出する。要素数が多い場合はR(AK)は小さくなり、要素数が少ない場合は大きくなる。
【0036】
図20の例1において、310の式で、Mは分析対象データDのデータ項目数、Nはレコード数、Pは311の式で算出する条件付確率である。311の式で、データ項目の要素データX,Y(X:amn,Y:akn)の条件付確率P(X|Y)=P(X∩Y)/P(Y)である。P(X∩Y)は同時確率、P(X)は周辺確率を表す(一般的な条件付確率の定義による)。312で、aはAKの要素、313で、|a|はaの出現頻度である。
【0037】
図20の例2において、318の式で、aは、データ項目Akの重複しない要素を示す。315,316で、Iはデータ項目Amの重複しない要素数、Jはデータ項目Akの重複しない要素数である。
【0038】
なお図20の310,311等の式は、データ項目間の関係(関連度)を求めるための一例(一実施の形態)であり、データ項目間の関係を求める目的やデータの特徴等によって様々に変化し得る。
【0039】
[主キー推薦分析結果表示(S108)]
図4に、図2の手順S108で表示する主キー推薦分析結果の一例を示す。図4の例では、複数のデータ項目が関連度(前述のR)の高い順にソートされて表示される。このように、利用者100に対し、主キーとして推薦するデータ項目を提示する。利用者100は、この中から主キーを選択(S109)することができる。
【0040】
[データ整形処理(S113)]
図6に、データ整形処理部303が図2のデータ整形処理の手順S113を実行する際の処理例を示す(以下、主な処理主体は303)。
【0041】
(S600,S601) まず、分析対象データDのデータ項目数M,レコード数N、等を抽出する。(利用者100により)主キーとして選択されたデータ項目をAKとし、データ項目Amに対して選択(図5等)された整形処理をPmとする(1≦m≦M)とする。また、空のリストをL、変数n=1とする。
【0042】
(S602,S603) S602で、データ項目AKのn番目のデータAK(n)がリストLに含まれているかどうかをみて、Lに含まれていない場合(Y)、S603で、リストLにデータの組(AK(n),{A1(n),A2(n),…,AM(n)})を追加する。
【0043】
(S604〜S608) S602で、AK(n)がLに含まれる場合(N)、S604で、リストLからデータの組(AK(n),{a1,…,aM})を抽出し、変数q=1とする。そして、S605で、整形処理Pqに従ってaqとAq(n)に処理を施し、その結果をaqに代入する。この処理をq=M(q≧M)になるまで繰り返し、リストLに、更新したデータの組(AK(n),{a1,…,aM})を代入する(S606〜S608)。
【0044】
(S609,S610) 以上の処理をn=N(n≧N)になるまで繰り返す。
【0045】
[データ整形処理選択ダイアログ(S111)]
図5(A)に、手順S111のデータ整形処理選択ダイアログ(画面)の表示の例を示す。このダイアログでは、表示情報として、データ項目名(501)、そのデータ項目に対する処理をユーザにより選択可能とする手段(リストボックス等)である処理選択肢(502)、及びパラメータ入力を終了/キャンセルするボタン(503)、等を有する。
【0046】
図5(B)に、処理選択肢(502)に表示される選択肢の例として整形処理一覧を示す。本例では、主に文字列データ及び数値データを対象とした、以下の9種類の整形処理(a〜i)を記載している:
(a)「要素を列挙(要素の重複を許す)」
(b)「要素を列挙(要素の重複を許さない)」
(c)「要素を数える(要素の重複を許す)」
(d)「要素を数える(要素の重複を許さない)」
(e)「要素を足す(要素の重複を許す)」
(f)「要素を足す(要素の重複を許さない)」
(g)「要素が数値の場合、平均を算出する(要素の重複を許す)」
(h)「要素が数値の場合、平均を算出する(要素の重複を許さない)」
(i)「要素の最大値と最小値を引く」。
【0047】
これらの整形処理(種類)は、データの種類、分析目的などにより様々に変化し得る。
【0048】
[分析対象データ(D)]
図7に、分析対象データDの内容例を示す。図示するテーブルのように、データ項目A〜Fによるレコード群を有する。
【0049】
[データ整形処理例(1−1)]
図8に、実施の形態1におけるデータ整形の処理例(その1)を示す。801はデータ整形前のデータ、802はデータ整形後のデータである。図8のデータ整形では、主キーAK=データ項目Aとし、データ項目B,C,D,Eへの各々の整形処理をPB,PC,PD,PEとしたときそれらPB,PC,PD,PEの処理選択(図5(B))で「要素を列挙(要素の重複を許さない)」(b)とした場合を示している。
【0050】
801で、上3行で、データ項目A,B,Cではそれぞれ要素が重複(同じ値)しており、データ項目Dでは要素が異なる値であり、データ項目Eでは、上2行で要素が重複している。データ整形処理(b)により、802では、上1行のように、データ項目A,B,Cでそれぞれ要素が1つにまとめられ、データ項目Dでは801の上3行の3つの要素が列挙され、データ項目Eでは、801の上3行の2つの要素が列挙されている。
【0051】
[データ整形処理例(1−2)]
図9に、実施の形態1におけるデータ整形の処理例(その2)を示す。901はデータ整形前、902はデータ整形後である。図9のデータ整形では、主キーAKに2つのデータ項目(A,C)を指定(選択)し、データ項目B,D,Eへの整形処理PB,PD,PEの処理選択(図5(B))で「要素を列挙(要素の重複を許さない)」(b)とした場合を示している。
【0052】
[効果等(1)]
以上のように、実施の形態1によれば、多次元データ分析の支援に係わり、分析対象データ(D)のデータ項目間の関連度(R)に基づく主キー(主キーとするデータ項目)の推薦、及び選択された主キーに基づくデータ整形処理を行うことができる。これにより利用者100による分析対象とするデータの整形に要する試行錯誤の削減、及び利用者100の能力に依存しない主キー選定、及び主キーに対するデータ整形の負担軽減などが実現される。データの特徴やデータ項目間の関係を抽出する仕組みにより、利用者100が多次元データの内容を詳しく知らなくても、データ整形に適する主キーとなる列(データ項目)を推薦可能であり、また当該キーを変更することにより様々な視点で多次元データを整形することができる。
【0053】
<実施の形態2>
図10〜図14等を用いて、本発明の実施の形態2のシステム等について説明する。前述の実施の形態1では、主キーに基づくデータ整形処理を行ったが、実施の形態2では、主キーと「条件」を適用するデータ項目とその「条件」によりデータを整形する処理について示す。
【0054】
[手順(2)]
図10は、実施の形態2の計算機システム101がデータ整形処理などを実行する際のシステム全体の手順を示す。なお図10のS109までは図2と同様である。手順S150以降は実施の形態2で特有である。
【0055】
S109で、利用者(100)は、分析管理サブシステム200の表示部202に表示されている主キー候補などの情報から、入力部201を介して主キーを選択し、条件付きのデータ整形処理(条件、条件適用データ項目など)を選択可能である。S150では、分析管理サブシステム200は、選択された主キーに関する条件付きデータ整形要求をデータ整形サブシステム300のデータ整形処理部303に送付する。
【0056】
条件付きデータ整形要求(S150)を受け取ったデータ整形処理部303は、条件入力ダイアログの画面(後述、図11)を表示部202に表示させる(S151)。利用者は、当該画面に、条件付きデータ整形に関わるパラメータを入力する(S152)。分析管理サブシステム200は、当該パラメータ等の情報をデータ整形処理部303へ送付する。当該パラメータ等の情報(S152)を受け取ったデータ整形処理部303は、当該パラメータ等に従いデータ整形の処理を実行し(S153)、その処理結果の情報を表示部202に表示させる(S154)。また、データ整形処理部303は、上記処理結果の情報を分析対象DB400に対して登録(格納)する(S155,S156)。
【0057】
[データ整形処理(S153)]
図12に、実施の形態2における、データ整形処理部303が図10のデータ整形処理の手順S153を実行する際の処理例を示す(以下、主な処理主体は303)。
【0058】
(S1200,S1201) 分析対象データDのデータ項目数M,レコード数N、等を抽出する。(利用者100により)主キーとして選択されたデータ項目をAKとし、条件適用データ項目(条件適用列)として選択されたデータ項目をACとし、条件適用データ項目(AC)に適用する条件数をSSとし、条件適用データ項目のデータAC(n)(1≦n≦N)に適用する条件をCS(1≦S≦SS)とし、表示方法をVとし、データ項目Amに対して選択された整形処理をPmとする(1≦m≦M)。また、空のリストをLとし、n=1とする。
【0059】
(S1202) AC(n)が満たす条件CSがあるかどうかをみて、ある場合(Y)はS1203以降に進み、無い場合(N)はS1210へ進む。
【0060】
(S1203) AK(n)とCSの組がリストLに含まれるかどうか調べる。含まれない場合(Y)は、S1204へ進み、含まれる場合(N)は、S1205へ進む。
【0061】
(S1204) リストLにデータの組(AK(n),CS,{A1(n),A2(n),…,AM(n)})を追加し、S1210に進む。
【0062】
(S1205〜S1209) S1205で、リストLからデータの組(AK(n),CS,{a1,…,aq,…,aM})を抽出し、q=1とする。S1206で、整形処理Pqに従ってaqとAq(n)に処理を施し、その結果をaqに代入する。この処理をq=M(q≧M)まで繰り返す(S1207,S1208)。そして、S1209で、リストLに更新したデータの組(AK(n),CS,{a1,…,aM})を代入する。
【0063】
(S1210,S1211) 以上の処理をn=Nまで繰り返す。
【0064】
[条件入力ダイアログ(S151)]
図11(A)に、手順S151の条件入力ダイアログ(画面)の表示の例を示す。このダイアログでは、表示情報として、主キー選択肢(1101)、条件適用データ項目選択肢(1102)、表示方法選択肢(1103)、条件数入力欄(1104)、条件入力欄表示部(1105)、処理選択肢表示部(1108)、パラメータ入力を終了/キャンセルするボタン(1111)等を有する。
【0065】
主キー選択肢(1101)は、主キー(主キーとするデータ項目)の選択肢を表示し利用者により選択可能とする手段(リストボックス等)である。条件適用データ項目選択肢(1102)は、条件を適用するデータ項目(その選択肢)を選択する手段である。表示方法選択肢(1103)は、データ整形後の表示方法を選択する手段である。条件数入力欄(1104)は、適用する条件数を入力する手段である。主キー選択肢(1101)、条件適用データ項目選択肢(1102)に表示される選択肢は、分析対象データDに含まれるデータ項目である。
【0066】
条件入力欄表示部(1105)は、適用する条件に関する条件入力欄を複数表示する。1105では、条件数入力欄(1104)に入力された値(条件数)に従った数の条件入力欄(1106)及び条件選択肢(1107)の組が表示されるようにしてもよい。条件入力欄(1106)は、適用する条件を利用者により入力可能とする手段(テキストフィールド等)である。条件選択肢(1107)は、適用する条件の選択肢を表示し利用者により選択可能とする手段である。
【0067】
処理選択肢表示部(1108)は、各データ項目に施す整形処理(種類)を利用者により選択するための処理選択肢を複数表示する(図5(A)と同様)。1108で、データ項目名(1109)と、そのデータ項目に対する処理選択肢(1110)とを有する。処理選択肢(1110)に表示される選択肢の例は図5(B)と同様である。
【0068】
図11(C)は、図11(A)の表示方法選択肢(1103)に表示される選択肢(表示方法一覧)の例を示す。本例において、「別ウィンドウ」とは、データ整形結果を条件別にウィンドウに表示することを意味し、「横に並べる」とは、データ整形結果を一つの表に表示し、条件別に横に並べて表示することを意味する。それぞれの表示例は図13,図14で示される。
【0069】
図11(B)は、図11(A)の条件入力欄表示部(1105)、条件選択肢(1107)に表示される選択肢(条件一覧)の例を示す。本例では、主に文字列データ及び数値データを対象とした、以下(a〜i)の9種類の条件を記載している:
(a)「一致する」(文字列の場合)
(b)「一致しない」(文字列の場合)
(c)「含む」(文字列の場合)
(d)「含まない」(文字列の場合)
(e)「等しい(=)」(数値の場合)
(f)「等しくない(≠)」(数値の場合)
(g)「小さい(<)」(数値の場合)
(h)「大きい(>)」(数値の場合)
(i)「A以上B以下」(数値の場合)。
【0070】
これらの条件の選択肢は、データの種類、分析目的等により様々に変化し得る。
【0071】
[データ整形処理例(2−1)]
図13に、実施の形態2におけるデータ整形の処理例(その1)を示す。1301は、データ整形前のデータ、1302,1303は、データ整形後のデータである。図13のデータ整形では、主キーAK=データ項目Aとし、条件適用データ項目AC=データ項目Dとし、条件数=2とし(条件1,条件2)、「条件1」を“「Z01」に一致する”(図11(B)の(a))とし、「条件2」を“「Z01」を含まない”(同(d))とし、表示方法を「別ウィンドウ」(図11(C))とし、データ項目B,C,Eへの整形処理PB,PC,PEとして、PB=「要素を数える(要素の重複を許さない)」(図5(B)の(d))、PC=「要素を列挙(要素の重複を許さない)」(同(b))、PE=「要素を足す(要素の重複を許さない)」(同(f))、とした場合を示している。1302は「条件1」に対する整形結果、1303は「条件2」に対する整形結果を表している。
【0072】
例えば、1301で、「Z01」に一致する行は1,3行目であり、1302で、データ項目Bでは、処理PBの(d)に対応して、1301のデータ項目Bの要素数である1が格納される。また、1301で、「Z01」を含まない行は、「Z02」を含む2,4,5行目であり、1303で、データ項目Bでは、処理PBの(d)に対応して、1301のデータ項目Bの要素数である2,1が格納され、データ項目Eでは、処理PEの(f)に対応して、1301のデータ項目Eの要素値の加算である1.8,0.99が格納される。
【0073】
[データ整形処理例(2−2)]
図14に、実施の形態2におけるデータ整形の処理例(その2)を示す。1401は、データ整形前、1402は、データ整形後である。図14のデータ整形では、主キーAK=データ項目Aとし、条件適用データ項目AC=データ項目Dとし、条件数=2とし(条件1,条件2)、「条件1」を“「Z01」に一致する”(図11(B)の(a))とし、「条件2」を“「Z01」を含まない”(同(d))とし、表示方法=「横に並べる」(図11(C))とし、データ項目B,Cへの整形処理PB,PCとして、PB=「要素を数える(要素の重複を許さない)」(図5の(B)の(d))とし、PC=「要素を列挙(要素の重複を許さない)」(同(b))とした場合を示している。
【0074】
1402で、2,3列目のデータ項目B(条件1),データ項目C(条件1)は、条件1(“「Z01」に一致する”)に対する整形結果、4,5列目のデータ項目B(条件2),データ項目C(条件2)は、条件2(“「Z01」を含まない”)に対する整形結果を示している。
【0075】
[効果等(2)]
以上のように、実施の形態2によれば、実施の形態1と同様の効果に加え、主キーと条件を適用するデータ項目とその条件によりデータを整形することが可能となり、より詳細に利用者100の支援を図れる。
【0076】
<実施の形態3>
図15〜図19等を用いて、本発明の実施の形態3のシステム等について説明する。実施の形態2では、主キー、条件適用データ項目、及び条件によりデータ整形を可能としたが、実施の形態3では、利用者100により指定された条件に従って追加したデータ項目を利用してデータ整形を行う処理について示す。
【0077】
[手順(3)]
図15に、実施の形態3の計算機システム101がデータ整形処理などを実行する際のシステム全体の手順を示す。図15で手順S101〜S104まで、及び手順S105以降は図2,図10等と同様である。手順S170〜S174は実施の形態3で特有である。
【0078】
(S170,S171) S170で、利用者(100)は、入力部201を介してデータ項目追加要求を入力可能であり、分析管理サブシステム200は、入力された要求をデータ整形サブシステム300のデータ整形処理部303に送付する。データ項目追加要求(S170)を受け取ったデータ整形処理部303は、データ項目追加ダイアログの画面(後述、図16)を表示部202に表示させる(S171)。
【0079】
(S172〜S174) S172で、利用者は、上記画面に、データ項目追加に関わるパラメータを入力する。分析管理サブシステム200は、当該入力パラメータ等の情報(S172)をデータ整形処理部303へ送付する。当該情報(S172)を受けとったデータ整形処理部303は、データ項目追加の処理を実行し(S173)、処理結果の情報を表示部202に表示させる(S174)。
【0080】
[データ項目追加処理(S173)]
図17に、データ整形処理部303が図15のデータ項目追加の手順S173を実行する際の処理例を示す(以下、主な処理主体は303)。
【0081】
(S1700,S1701) まず、分析対象データDのレコード数N等を抽出する。利用者(100)により画面(図16)で条件適用データ項目として選択されたデータ項目をACとし、条件入力欄に入力された条件をCとし、追加するデータ項目をAM+1とし、追加データをWとし、n=1とする。
【0082】
(S1702〜S1704) S1702では、データ項目ACのn番目のデータAC(n)が条件Cを満たすかどうかを判断し、満たす場合(Y)は、S1703で、AM+1(n)=Wとし、満たさない場合(N)は、S1704で、AM+1(n)=NULLとする。ここでは満たさない場合の値を「NULL」としているが、満たす場合の値Wと異なる値であれば何でも構わない。
【0083】
(S1705,S1706) 以上の処理をn=N(n≧N)となるまで繰り返す。
【0084】
[データ項目追加ダイアログ(S171)]
図16に、手順S171のデータ項目追加ダイアログ(画面)の表示の一例を示す。このダイアログは、表示情報として、条件適用データ項目選択肢(1601)、条件入力欄(1602)、条件選択肢(1603)、追加データ入力欄(1604)、追加データ項目名入力欄(1605)、及び、パラメータ入力を終了/キャンセルするボタン(1606)等を有する。
【0085】
条件適用データ項目選択肢(1601)は、データ項目を追加するための条件を適用するデータ項目を表示し利用者により選択可能とする手段である。条件適用データ項目選択肢(1601)に表示される選択肢は、分析対象データDに含まれるデータ項目である。条件入力欄(1602)及び条件選択肢(1603)は、条件適用データ項目に適用する条件を利用者により入力・選択する手段である。条件選択肢(1603)に表示される選択肢の例は、図11(B)と同様である。
【0086】
追加データ入力欄(1604)は、上記で入力された条件を満たす場合に追加データ項目に与えられる値を利用者により入力可能とする手段である。追加データ項目名入力欄(1605)は、追加するデータ項目名を利用者により入力可能とする手段である。
【0087】
[データ整形処理例(3−1)]
図18に、実施の形態3におけるデータ整形の処理例(その1)を示す。1801は、データ項目追加前のデータ、1802は、データ項目追加後でありデータ整形前のデータ、1803は、データ項目追加後でありデータ整形後のデータである。図18のデータ項目追加(1801→1802)では、条件適用データ項目AC=データ項目Eとし、条件C1を「0以上1以下」(図11(B)の(i))とし、C1該当の場合の追加データ項目値「0〜1.0」とし、条件C2を「1以上2以下」(同(i))とし、C2該当の場合の追加データ項目値「1.0〜2.0」とし、条件C3を「2以上3以下」(同(i))とし、C3該当の場合の追加データ項目値「2.0〜3.0」とし、追加データ項目名を「追加データ項目」として、条件C1,C2,C3をそれぞれ適用した場合を示している。
【0088】
例えば1801の1,2,4,5行目のデータ項目Eは要素値が条件C1に該当するため、1802の同行では「追加データ項目」に値「0〜1.0」が格納され、1801の3行目のデータ項目Eは要素値が条件C3に該当するため、1802の同行では「追加データ項目」に値「2.0〜3.0」が格納される。
【0089】
また、図18のデータ整形(1802→1803)では、主キーAK=「追加データ項目」とし、データ項目Aの整形処理PA=「要素を列挙(要素の重複を許さない)」(図5(B)の(b))とし、データ項目Bの整形処理PB=「要素を数える(要素の重複を許さない)」(同(d))とした場合を示している。
【0090】
[データ整形処理例(3−2)]
図19に、実施の形態3におけるデータ整形の処理例(その2)を示す。1901はデータ項目追加前、1902はデータ項目追加後でデータ整形前、1903はデータ項目追加後でデータ整形後である。図19のデータ項目追加(1901→1902)では、条件適用データ項目AC=データ項目Fとし、条件C1=“「2010/10」を含む”とし、C1該当の場合の追加データ項目「2010/10」とし、条件C2=“「2010/11」を含む”とし、C2該当の場合の追加データ項目「2010/11」とし、条件C3=“「2010/12」を含む”とし、C3該当の場合の追加データ項目「2010/12」とし、追加データ項目名を「追加データ項目」として、条件C1,C2,C3をそれぞれ適用した場合を示している。
【0091】
また図19のデータ整形(1902→1903)では、主キーAK=「追加データ項目」とし、データ項目Aの整形処理PA=「要素を列挙(要素の重複を許さない)」(図5(B)の(b))とし、データ項目Bの整形処理PB=「要素を数える(要素の重複を許さない)」(図5(B)の(d))とした場合を示している。
【0092】
[効果等(3)]
以上のように、実施の形態3によれば、実施の形態1,2と同様の効果に加え、(利用者100による)指定された条件に従って追加したデータ項目を利用してデータ整形を行うことが可能となり、より詳細に利用者100の支援を図れる。
【0093】
以上、本発明者によってなされた発明を実施の形態に基づき具体的に説明したが、本発明は前記実施の形態に限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能であることは言うまでもない。
【産業上の利用可能性】
【0094】
本発明は、多次元データ分析・支援システム、OLAPツール等に利用可能である。
【符号の説明】
【0095】
100:利用者、101:計算機システム、200:分析管理サブシステム、201:入力部、202:表示部、300:データ整形サブシステム、301:データ抽出部、302:主キー推薦分析部、303:データ整形処理部、400:分析対象DB。
【技術分野】
【0001】
本発明は、データ分析に係わる情報処理システム等の技術に関する。特に、多次元データを対象としたデータ分析に係わるデータ整形を支援する技術に関する。
【背景技術】
【0002】
データ分析を行う技術には様々なものがある。先行技術例として、特開平6−89305号公報(特許文献1)、特開2000−39999号公報(特許文献2)、特開2001−312573号公報(特許文献3)、特開2001−188796号公報(特許文献4)などがある。
【0003】
特許文献1では、データ項目の関連箇所を視覚的に明示し、相互に関連するデータ項目やプログラムの一括修正の自動化を行う。
【0004】
特許文献2では、データベースに格納された複数のデータ項目に基づいて、項目間の関係を特徴づけるIF−THENルールを生成する。
【0005】
特許文献3では、分析対象データを分析する際に、当該データと関連する幾つかのデータを用いることで、原因の解明や分析結果の裏付けを行う。
【0006】
特許文献4では、分析対象データに因子分析を適用し、因子ごとにデータ項目と因子負荷量の組合せを表示することで、データ分析結果をユーザが把握しやすい形式で表示する。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】特開平6−89305号公報
【特許文献2】特開2000−39999号公報
【特許文献3】特開2001−312573号公報
【特許文献4】特開2001−188796号公報
【発明の概要】
【発明が解決しようとする課題】
【0008】
利用者(分析担当者)により多次元データを分析する際には、入力の候補となるデータ項目が多いため、データ項目を様々に変更し、処理しながら、望む分析を実施できるデータ項目と処理の組を見つける。この作業はOLAP(Online Analytical Processing)ツールを利用して行われることが一般的である。OLAPツールは、高速処理・可視化という面でこの作業を支援することが可能である。
【0009】
OLAPツールなどを用いて多次元データ分析を行うためには、予め分析の目的に適した形式にデータを整形する必要がある。目的に応じて適切にデータを整形するためには、どのデータ項目が主キーとして適切か、また主キー以外のデータ項目に対してどのような処理を施すべきか、等を明確にしなればならない。従来は、利用者(分析担当者)の知識や経験で主キーおよび各データ項目への処理を決定するため、分析結果が利用者(分析担当者)の能力に依存する、また一般にデータ項目が増えるほどこの作業の負担が増大する、という問題がある。
【0010】
以上を鑑み、本発明の主な目的は、利用者(分析担当者)による多次元データ分析の際の分析対象となるデータの整形などに要する試行錯誤の削減、及び、利用者(分析担当者)の能力に依存しない主キー選定および主キーに対するデータ整形の処理作業の負担の軽減、等を実現することができる技術を提供することである。
【課題を解決するための手段】
【0011】
本発明のうち代表的な形態は、計算処理能力を有する一つ以上の計算機及びネットワークで構成される計算機システムを用いた利用者による多次元データの分析に係わるデータの整形を含む処理作業を支援する処理を行うシステム(データ整形システム)、方法、プログラム等であって、以下に示す構成を有することを特徴とする。
【0012】
本形態のシステムでは、多次元データである分析対象データの各々のデータ項目間の関連度に基づいて主キーに適するデータ項目を分析・抽出し、その主キーに対して分析対象データの各々のデータ項目へのデータ整形などの処理を支援する処理機能を有する構成である。本構成では、データの特徴、データ項目間の関係を抽出することにより、データ整形時の適切な主キーとなるデータ項目に関する情報を利用者に対して推薦し、当該情報に基づいて利用者によりキー列(主キーとなるデータ項目)を選択して変更可能であり、これにより様々な視点で多次元データを整形可能である。
【0013】
本形態のデータ整形システムは、例えば、主キー推薦分析などの処理機能を有し、前記利用者からの要求に従い、前記多次元データである分析対象データの各々のデータ項目間の関連度を算出する第1の処理と、当該関連度に基づいて、前記利用者に推薦するための主キーとして適するデータ項目を分析・抽出する第2の処理(主キー推薦分析)と、当該抽出した(利用者に推薦するための)主キーとして適するデータ項目(候補)を含む情報を前記利用者に対して出力(例えば画面表示)する第3の処理と、当該出力された情報の中から前記利用者により主キーとするデータ項目を選択/指定可能として、当該選択されたデータ項目に関して前記分析対象データの各々のデータ項目へのデータ整形を含む処理を前記利用者からの要求に従い実行可能とする第4の処理とを行う。当該実行された場合のデータ整形の処理結果の情報は前記利用者に対して出力されると共に記憶手段に格納される。
【0014】
本形態のデータ整形システムは、例えば、前記計算機システムは、分析管理サブシステムと、データ整形サブシステムと、分析対象データベースとを有する。前記分析管理サブシステムは、前記利用者により情報を入力する処理を行う入力部、及び前記利用者に対して画面で情報を表示する処理を行う表示部を有する。前記データ整形サブシステムは、データ抽出部、主キー推薦分析部、及びデータ整形処理部を有する。前記分析対象データベースは、前記分析対象データ、及び前記データ整形の処理結果のデータが格納される。
【0015】
前記分析管理サブシステムは、前記利用者によるデータ抽出要求を受けて前記データ整形サブシステムに送信し、前記データ抽出部は、前記分析対象データベースから当該要求に応じた分析対象データを抽出して、前記分析管理サブシステムに表示させる。前記分析管理サブシステムは、前記利用者による主キー推薦分析要求を受けて前記データ整形サブシステムに送信し、前記主キー推薦分析部は、当該要求に応じて主キー推薦分析の処理として前記第1、第2、第3の処理を実行し、当該処理結果の情報を前記分析管理サブシステムに表示させる。前記分析管理サブシステムは、前記表示された情報の中からの前記利用者による主キーとするデータ項目の選択に基づく前記分析対象データの各々のデータ項目へのデータ整形の要求を前記データ整形サブシステムに送信し、前記データ整形処理部は、前記第4の処理として、前記利用者により主キーとして選択されたデータ項目に関する前記分析対象データの各々のデータ項目へのデータ整形について、複数の種類のデータ整形の中から利用者により選択されたデータ整形の処理を実行可能とする情報を前記分析管理サブシステムに表示させ、また、前記分析管理サブシステムで利用者により入力されるデータ整形のパラメータに従い、前記選択されたデータ整形の処理を実行して、当該処理結果の情報を前記分析管理サブシステムに表示させると共に前記分析対象データベースに登録する。
【発明の効果】
【0016】
本発明のうち代表的な形態によれば、利用者(分析担当者)による多次元データ分析の際の分析対象となるデータの整形などに要する試行錯誤の削減、及び、利用者(分析担当者)の能力に依存しない主キー選定および主キーに対するデータ整形の処理作業の負担の軽減、等を実現することができる。
【図面の簡単な説明】
【0017】
【図1】本発明の一実施の形態のデータ整形方法及びシステムにおけるシステム構成例を示す図である。
【図2】本発明の実施の形態1のデータ整形方法及びシステムの全体の手順を示す図である。
【図3】実施の形態1での図2の主キー推薦分析の手順(S106)の処理零を示すフロー図である。
【図4】実施の形態1での主キー推薦分析結果の一例を示す図である。
【図5】(A)は、実施の形態1でのデータ整形処理選択ダイアログ(画面)の一例を示す図であり、(B)は、当該画面中の処理選択肢における整形処理一覧の例を示す図である。
【図6】実施の形態1での図2のデータ整形処理の手順(S113)の処理例を示すフロー図である。
【図7】分析対象データ(D)の内容例を示す図である。
【図8】実施の形態1でのデータ整形の処理例(その1)を示す図である。
【図9】実施の形態1でのデータ整形の処理例(その2)を示す図である。
【図10】本発明の実施の形態2のデータ整形方法及びシステムの全体の手順を示す図である。
【図11】(A)は、実施の形態2でのデータ整形処理選択ダイアログ(画面)の一例を示す図であり、(B)は、当該画面中の条件選択肢における条件一覧の例を示し、(C)は、当該画面中の表示方法選択肢における表示方法一覧の例を示す。
【図12】実施の形態2での図10のデータ整形処理の手順(S153)の処理例を示すフロー図である。
【図13】実施の形態2でのデータ整形の処理例(その1)を示す図である。
【図14】実施の形態2でのデータ整形の処理例(その2)を示す図である。
【図15】本発明の実施の形態3のデータ整形方法及びシステムの全体の手順を示す図である。
【図16】実施の形態3でのデータ項目追加ダイアログ(画面)の一例を示す図である。
【図17】実施の形態3での図15のデータ項目追加の手順(S173)の処理例を示すフロー図である。
【図18】実施の形態3でのデータ項目追加及びデータ整形の処理例(その1)を示す図である。
【図19】実施の形態3でのデータ項目追加及びデータ整形の処理例(その2)を示す図である。
【図20】実施の形態1でのR(AK)の算出方法(式)の例を示す図である。
【発明を実施するための形態】
【0018】
以下、本発明の実施の形態(データ整形システム等)を図面に基づいて詳細に説明する。なお、実施の形態を説明するための全図において、同一部には原則として同一符号を付し、その繰り返しの説明は省略する。また説明上、分析対象データ:D、データ項目:A、等の記号を適宜使用する。
【0019】
[システム構成]
図1には、本発明の一実施の形態のシステムの基本構成(各実施の形態で共通の構成)を示している。図1では、計算機システム101上に配置されている、分析管理サブシステム200、データ整形サブシステム300、及び分析対象DB400を有し、それらが相互に接続される関係を模式的に示している。計算機システム101は、中央演算処理装置などの計算処理能力を有する一つ以上の計算機及びネットワーク等で構成される。
【0020】
計算機システム101の具体例としては、プロセッサ、メモリ、ディスク、バス、通信インタフェース部、入力装置、出力装置などの要素を備えるPCやサーバ等の計算機においてソフトウェアプログラム(本実施の形態のプログラム)を実行することにより、各処理機能・サブシステム等を実現する。例えばプロセッサがディスク等からメモリに制御プログラム(本実施の形態のプログラム)等をロードして実行することにより、入力部201やデータ抽出部301等の各部の処理が実現される。各種データについては、メモリやディスク、あるいはネットワーク上のDBサーバなどに格納される。例えば、各サブシステム(200,300)が計算機で実現されそれらがネットワークで接続される構成である。利用者(分析担当者)100は、各計算機または当該計算機に接続される端末から当該計算機の処理機能を利用する。
【0021】
分析管理サブシステム200は、入力部201、表示部202等を有し、利用者100に対してデータ分析・管理に係わるユーザインタフェースを提供するシステムであり、これにより利用者100はデータ分析等の作業が可能である。分析管理サブシステム200は、入力部201を介して得た利用者100からの要求に応じて、必要なデータを分析対象DB400から抽出し、データ整形サブシステム300に様々な要求を送信し、表示部202に結果を表示する処理などを行う。
【0022】
入力部201は、例えば計算機によるキーボード、マウス、その他の入力装置の制御処理により構成できる。表示部202は、計算機によるディスプレイ、プリンタ等の出力装置の制御処理により構成できる。表示部202では、例えばディスプレイにユーザインタフェースの画面を表示する。画面では、例えば、分析対象データD等の情報や、データ整形処理の前後の情報や、後述の主キー推薦分析結果(図4)、データ整形処理選択ダイアログ(図5)、条件入力ダイアログ(図11)、データ項目追加ダイアログ(図16)、等が表示される。
【0023】
また分析管理サブシステム200は、図示しないが、データ分析・管理(支援)に係わる公知のアプリケーションプログラム(例えばOLAPツール)等を備えてもよい。またそのアプリケーションプログラム(例えばOLAPツール)等において、本実施の形態の処理機能を実装し提供してもよい。
【0024】
データ整形サブシステム300は、分析対象データを、主キーとするデータ項目に基づいてデータ整形する処理(データ整形処理)などを行うシステムである。データ整形サブシステム300は、データ抽出部301、主キー推薦分析部302、及びデータ整形処理部303を有する。
【0025】
データ抽出部301は、分析対象DB400から分析対象データ(D)などを抽出する処理機能を有する。主キー推薦分析部302は、分析対象データに含まれるデータ項目のうち主キーとして適するデータ項目の候補を分析・抽出し、利用者100に対して推薦する処理機能を有する。データ整形処理部303は、主キー及びその他の条件に従ってデータを整形する処理機能を有する。
【0026】
分析対象DB400は、データ整形サブシステム300のデータ抽出部301が参照する複数の分析対象データ(D)、及びデータ整形サブシステム300が整形したデータ(整形データ)、等が格納されるDB(データベース)である。分析対象DB400は、DBサーバなど各種記憶手段により実現可能である。
【0027】
<実施の形態1>
図2〜図9等を用いて、本発明の実施の形態1について説明する。実施の形態1のデータ整形システムは、図1の計算機システム101により構成される。実施の形態1のデータ整形方法は、本システム(101)で実行されるデータ整形の処理手順を含む。実施の形態1のプログラムは、本システム(101)の処理を実現するプログラムである。
【0028】
[手順(1)]
図2は、実施の形態1で計算機システム101(データ整形システム)がデータ整形処理などを実行する際のシステム全体の手順(処理シーケンス)を示す。S101等は手順を表す。
【0029】
分析管理サブシステム200は、入力部201を介して受け付けた利用者(100)のデータ抽出要求(S101)をデータ整形サブシステム300のデータ抽出部301に送付する。当該要求(S101)を受けたデータ抽出部301は、分析対象DB400から分析対象データ(D)を抽出し(S102)、分析管理サブシステム200の表示部202に返戻し(S103)、表示部202で分析対象データ(D)等の情報を利用者に対して表示する(S104)。
【0030】
利用者は、入力部201を介して主キー推薦分析要求を入力可能であり、分析管理サブシステム200は、入力された主キー推薦分析要求をデータ整形サブシステム300の主キー推薦分析処理部302に送付する(S105)。主キー推薦分析部302は、当該要求(S105)に対し、主キー推薦分析の処理を実行し(S106)、その処理結果の情報(主キーに適する候補として推薦するデータ項目などの情報を含む)を返戻し(S107)、表示部202で表示する(S108)。
【0031】
利用者は、上記表示部202に表示されている主キー候補などの情報から、入力部201を介して主キー(データ項目)を選択可能であり(S109)、また、当該主キーに関しデータ整形処理などを選択可能であり、分析管理サブシステム200は、選択された主キーに関するデータ整形要求を、データ整形サブシステム300のデータ整形処理部303に送付する(S110)。当該要求(S110)を受け取ったデータ整形処理部303は、データ整形処理選択ダイアログの画面(後述、図5)を表示部202に表示させる(S111)。
【0032】
利用者は、上記画面でデータ整形に関わるパラメータを入力可能であり(S112)、分析管理サブシステム200は、入力されたパラメータ等の情報をデータ整形処理部303へ送付する。当該情報(S112)を受け取ったデータ整形処理部303は、当該パラメータ等に従いデータ整形処理を実行し(S113)、その処理結果の情報を表示部202に表示させる(S114)。また、データ整形処理部303は、上記処理結果の情報(整形データ等)を分析対象DB400に登録要求(S115)することにより登録(格納)させる(S116)。
【0033】
[主キー推薦分析(S106)]
図3に、主キー推薦分析部302が図2の主キー推薦分析の手順S106を実行する際の処理例を示す(S301等は処理ステップを示す)(以下、主な処理主体は302)。
【0034】
(S301) まず、分析対象データDのデータ項目数M、及びレコード数N、等を抽出し、変数K=1とする。
【0035】
(S302) K番目(1≦K≦M)のデータ項目をAKとしたときのAKの関連度R(AK)を算出する。ここで、R(AK)は、算出方法として例えば図20に示す式(例1(310〜313)または例2(314〜318))によって算出する。これらの式では、主キーとしてデータ項目AKを選択した場合に、AKの各要素(312、aで示す)に対するその他のデータ項目のとり得る要素数が多いか少ないかを算出する。要素数が多い場合はR(AK)は小さくなり、要素数が少ない場合は大きくなる。
【0036】
図20の例1において、310の式で、Mは分析対象データDのデータ項目数、Nはレコード数、Pは311の式で算出する条件付確率である。311の式で、データ項目の要素データX,Y(X:amn,Y:akn)の条件付確率P(X|Y)=P(X∩Y)/P(Y)である。P(X∩Y)は同時確率、P(X)は周辺確率を表す(一般的な条件付確率の定義による)。312で、aはAKの要素、313で、|a|はaの出現頻度である。
【0037】
図20の例2において、318の式で、aは、データ項目Akの重複しない要素を示す。315,316で、Iはデータ項目Amの重複しない要素数、Jはデータ項目Akの重複しない要素数である。
【0038】
なお図20の310,311等の式は、データ項目間の関係(関連度)を求めるための一例(一実施の形態)であり、データ項目間の関係を求める目的やデータの特徴等によって様々に変化し得る。
【0039】
[主キー推薦分析結果表示(S108)]
図4に、図2の手順S108で表示する主キー推薦分析結果の一例を示す。図4の例では、複数のデータ項目が関連度(前述のR)の高い順にソートされて表示される。このように、利用者100に対し、主キーとして推薦するデータ項目を提示する。利用者100は、この中から主キーを選択(S109)することができる。
【0040】
[データ整形処理(S113)]
図6に、データ整形処理部303が図2のデータ整形処理の手順S113を実行する際の処理例を示す(以下、主な処理主体は303)。
【0041】
(S600,S601) まず、分析対象データDのデータ項目数M,レコード数N、等を抽出する。(利用者100により)主キーとして選択されたデータ項目をAKとし、データ項目Amに対して選択(図5等)された整形処理をPmとする(1≦m≦M)とする。また、空のリストをL、変数n=1とする。
【0042】
(S602,S603) S602で、データ項目AKのn番目のデータAK(n)がリストLに含まれているかどうかをみて、Lに含まれていない場合(Y)、S603で、リストLにデータの組(AK(n),{A1(n),A2(n),…,AM(n)})を追加する。
【0043】
(S604〜S608) S602で、AK(n)がLに含まれる場合(N)、S604で、リストLからデータの組(AK(n),{a1,…,aM})を抽出し、変数q=1とする。そして、S605で、整形処理Pqに従ってaqとAq(n)に処理を施し、その結果をaqに代入する。この処理をq=M(q≧M)になるまで繰り返し、リストLに、更新したデータの組(AK(n),{a1,…,aM})を代入する(S606〜S608)。
【0044】
(S609,S610) 以上の処理をn=N(n≧N)になるまで繰り返す。
【0045】
[データ整形処理選択ダイアログ(S111)]
図5(A)に、手順S111のデータ整形処理選択ダイアログ(画面)の表示の例を示す。このダイアログでは、表示情報として、データ項目名(501)、そのデータ項目に対する処理をユーザにより選択可能とする手段(リストボックス等)である処理選択肢(502)、及びパラメータ入力を終了/キャンセルするボタン(503)、等を有する。
【0046】
図5(B)に、処理選択肢(502)に表示される選択肢の例として整形処理一覧を示す。本例では、主に文字列データ及び数値データを対象とした、以下の9種類の整形処理(a〜i)を記載している:
(a)「要素を列挙(要素の重複を許す)」
(b)「要素を列挙(要素の重複を許さない)」
(c)「要素を数える(要素の重複を許す)」
(d)「要素を数える(要素の重複を許さない)」
(e)「要素を足す(要素の重複を許す)」
(f)「要素を足す(要素の重複を許さない)」
(g)「要素が数値の場合、平均を算出する(要素の重複を許す)」
(h)「要素が数値の場合、平均を算出する(要素の重複を許さない)」
(i)「要素の最大値と最小値を引く」。
【0047】
これらの整形処理(種類)は、データの種類、分析目的などにより様々に変化し得る。
【0048】
[分析対象データ(D)]
図7に、分析対象データDの内容例を示す。図示するテーブルのように、データ項目A〜Fによるレコード群を有する。
【0049】
[データ整形処理例(1−1)]
図8に、実施の形態1におけるデータ整形の処理例(その1)を示す。801はデータ整形前のデータ、802はデータ整形後のデータである。図8のデータ整形では、主キーAK=データ項目Aとし、データ項目B,C,D,Eへの各々の整形処理をPB,PC,PD,PEとしたときそれらPB,PC,PD,PEの処理選択(図5(B))で「要素を列挙(要素の重複を許さない)」(b)とした場合を示している。
【0050】
801で、上3行で、データ項目A,B,Cではそれぞれ要素が重複(同じ値)しており、データ項目Dでは要素が異なる値であり、データ項目Eでは、上2行で要素が重複している。データ整形処理(b)により、802では、上1行のように、データ項目A,B,Cでそれぞれ要素が1つにまとめられ、データ項目Dでは801の上3行の3つの要素が列挙され、データ項目Eでは、801の上3行の2つの要素が列挙されている。
【0051】
[データ整形処理例(1−2)]
図9に、実施の形態1におけるデータ整形の処理例(その2)を示す。901はデータ整形前、902はデータ整形後である。図9のデータ整形では、主キーAKに2つのデータ項目(A,C)を指定(選択)し、データ項目B,D,Eへの整形処理PB,PD,PEの処理選択(図5(B))で「要素を列挙(要素の重複を許さない)」(b)とした場合を示している。
【0052】
[効果等(1)]
以上のように、実施の形態1によれば、多次元データ分析の支援に係わり、分析対象データ(D)のデータ項目間の関連度(R)に基づく主キー(主キーとするデータ項目)の推薦、及び選択された主キーに基づくデータ整形処理を行うことができる。これにより利用者100による分析対象とするデータの整形に要する試行錯誤の削減、及び利用者100の能力に依存しない主キー選定、及び主キーに対するデータ整形の負担軽減などが実現される。データの特徴やデータ項目間の関係を抽出する仕組みにより、利用者100が多次元データの内容を詳しく知らなくても、データ整形に適する主キーとなる列(データ項目)を推薦可能であり、また当該キーを変更することにより様々な視点で多次元データを整形することができる。
【0053】
<実施の形態2>
図10〜図14等を用いて、本発明の実施の形態2のシステム等について説明する。前述の実施の形態1では、主キーに基づくデータ整形処理を行ったが、実施の形態2では、主キーと「条件」を適用するデータ項目とその「条件」によりデータを整形する処理について示す。
【0054】
[手順(2)]
図10は、実施の形態2の計算機システム101がデータ整形処理などを実行する際のシステム全体の手順を示す。なお図10のS109までは図2と同様である。手順S150以降は実施の形態2で特有である。
【0055】
S109で、利用者(100)は、分析管理サブシステム200の表示部202に表示されている主キー候補などの情報から、入力部201を介して主キーを選択し、条件付きのデータ整形処理(条件、条件適用データ項目など)を選択可能である。S150では、分析管理サブシステム200は、選択された主キーに関する条件付きデータ整形要求をデータ整形サブシステム300のデータ整形処理部303に送付する。
【0056】
条件付きデータ整形要求(S150)を受け取ったデータ整形処理部303は、条件入力ダイアログの画面(後述、図11)を表示部202に表示させる(S151)。利用者は、当該画面に、条件付きデータ整形に関わるパラメータを入力する(S152)。分析管理サブシステム200は、当該パラメータ等の情報をデータ整形処理部303へ送付する。当該パラメータ等の情報(S152)を受け取ったデータ整形処理部303は、当該パラメータ等に従いデータ整形の処理を実行し(S153)、その処理結果の情報を表示部202に表示させる(S154)。また、データ整形処理部303は、上記処理結果の情報を分析対象DB400に対して登録(格納)する(S155,S156)。
【0057】
[データ整形処理(S153)]
図12に、実施の形態2における、データ整形処理部303が図10のデータ整形処理の手順S153を実行する際の処理例を示す(以下、主な処理主体は303)。
【0058】
(S1200,S1201) 分析対象データDのデータ項目数M,レコード数N、等を抽出する。(利用者100により)主キーとして選択されたデータ項目をAKとし、条件適用データ項目(条件適用列)として選択されたデータ項目をACとし、条件適用データ項目(AC)に適用する条件数をSSとし、条件適用データ項目のデータAC(n)(1≦n≦N)に適用する条件をCS(1≦S≦SS)とし、表示方法をVとし、データ項目Amに対して選択された整形処理をPmとする(1≦m≦M)。また、空のリストをLとし、n=1とする。
【0059】
(S1202) AC(n)が満たす条件CSがあるかどうかをみて、ある場合(Y)はS1203以降に進み、無い場合(N)はS1210へ進む。
【0060】
(S1203) AK(n)とCSの組がリストLに含まれるかどうか調べる。含まれない場合(Y)は、S1204へ進み、含まれる場合(N)は、S1205へ進む。
【0061】
(S1204) リストLにデータの組(AK(n),CS,{A1(n),A2(n),…,AM(n)})を追加し、S1210に進む。
【0062】
(S1205〜S1209) S1205で、リストLからデータの組(AK(n),CS,{a1,…,aq,…,aM})を抽出し、q=1とする。S1206で、整形処理Pqに従ってaqとAq(n)に処理を施し、その結果をaqに代入する。この処理をq=M(q≧M)まで繰り返す(S1207,S1208)。そして、S1209で、リストLに更新したデータの組(AK(n),CS,{a1,…,aM})を代入する。
【0063】
(S1210,S1211) 以上の処理をn=Nまで繰り返す。
【0064】
[条件入力ダイアログ(S151)]
図11(A)に、手順S151の条件入力ダイアログ(画面)の表示の例を示す。このダイアログでは、表示情報として、主キー選択肢(1101)、条件適用データ項目選択肢(1102)、表示方法選択肢(1103)、条件数入力欄(1104)、条件入力欄表示部(1105)、処理選択肢表示部(1108)、パラメータ入力を終了/キャンセルするボタン(1111)等を有する。
【0065】
主キー選択肢(1101)は、主キー(主キーとするデータ項目)の選択肢を表示し利用者により選択可能とする手段(リストボックス等)である。条件適用データ項目選択肢(1102)は、条件を適用するデータ項目(その選択肢)を選択する手段である。表示方法選択肢(1103)は、データ整形後の表示方法を選択する手段である。条件数入力欄(1104)は、適用する条件数を入力する手段である。主キー選択肢(1101)、条件適用データ項目選択肢(1102)に表示される選択肢は、分析対象データDに含まれるデータ項目である。
【0066】
条件入力欄表示部(1105)は、適用する条件に関する条件入力欄を複数表示する。1105では、条件数入力欄(1104)に入力された値(条件数)に従った数の条件入力欄(1106)及び条件選択肢(1107)の組が表示されるようにしてもよい。条件入力欄(1106)は、適用する条件を利用者により入力可能とする手段(テキストフィールド等)である。条件選択肢(1107)は、適用する条件の選択肢を表示し利用者により選択可能とする手段である。
【0067】
処理選択肢表示部(1108)は、各データ項目に施す整形処理(種類)を利用者により選択するための処理選択肢を複数表示する(図5(A)と同様)。1108で、データ項目名(1109)と、そのデータ項目に対する処理選択肢(1110)とを有する。処理選択肢(1110)に表示される選択肢の例は図5(B)と同様である。
【0068】
図11(C)は、図11(A)の表示方法選択肢(1103)に表示される選択肢(表示方法一覧)の例を示す。本例において、「別ウィンドウ」とは、データ整形結果を条件別にウィンドウに表示することを意味し、「横に並べる」とは、データ整形結果を一つの表に表示し、条件別に横に並べて表示することを意味する。それぞれの表示例は図13,図14で示される。
【0069】
図11(B)は、図11(A)の条件入力欄表示部(1105)、条件選択肢(1107)に表示される選択肢(条件一覧)の例を示す。本例では、主に文字列データ及び数値データを対象とした、以下(a〜i)の9種類の条件を記載している:
(a)「一致する」(文字列の場合)
(b)「一致しない」(文字列の場合)
(c)「含む」(文字列の場合)
(d)「含まない」(文字列の場合)
(e)「等しい(=)」(数値の場合)
(f)「等しくない(≠)」(数値の場合)
(g)「小さい(<)」(数値の場合)
(h)「大きい(>)」(数値の場合)
(i)「A以上B以下」(数値の場合)。
【0070】
これらの条件の選択肢は、データの種類、分析目的等により様々に変化し得る。
【0071】
[データ整形処理例(2−1)]
図13に、実施の形態2におけるデータ整形の処理例(その1)を示す。1301は、データ整形前のデータ、1302,1303は、データ整形後のデータである。図13のデータ整形では、主キーAK=データ項目Aとし、条件適用データ項目AC=データ項目Dとし、条件数=2とし(条件1,条件2)、「条件1」を“「Z01」に一致する”(図11(B)の(a))とし、「条件2」を“「Z01」を含まない”(同(d))とし、表示方法を「別ウィンドウ」(図11(C))とし、データ項目B,C,Eへの整形処理PB,PC,PEとして、PB=「要素を数える(要素の重複を許さない)」(図5(B)の(d))、PC=「要素を列挙(要素の重複を許さない)」(同(b))、PE=「要素を足す(要素の重複を許さない)」(同(f))、とした場合を示している。1302は「条件1」に対する整形結果、1303は「条件2」に対する整形結果を表している。
【0072】
例えば、1301で、「Z01」に一致する行は1,3行目であり、1302で、データ項目Bでは、処理PBの(d)に対応して、1301のデータ項目Bの要素数である1が格納される。また、1301で、「Z01」を含まない行は、「Z02」を含む2,4,5行目であり、1303で、データ項目Bでは、処理PBの(d)に対応して、1301のデータ項目Bの要素数である2,1が格納され、データ項目Eでは、処理PEの(f)に対応して、1301のデータ項目Eの要素値の加算である1.8,0.99が格納される。
【0073】
[データ整形処理例(2−2)]
図14に、実施の形態2におけるデータ整形の処理例(その2)を示す。1401は、データ整形前、1402は、データ整形後である。図14のデータ整形では、主キーAK=データ項目Aとし、条件適用データ項目AC=データ項目Dとし、条件数=2とし(条件1,条件2)、「条件1」を“「Z01」に一致する”(図11(B)の(a))とし、「条件2」を“「Z01」を含まない”(同(d))とし、表示方法=「横に並べる」(図11(C))とし、データ項目B,Cへの整形処理PB,PCとして、PB=「要素を数える(要素の重複を許さない)」(図5の(B)の(d))とし、PC=「要素を列挙(要素の重複を許さない)」(同(b))とした場合を示している。
【0074】
1402で、2,3列目のデータ項目B(条件1),データ項目C(条件1)は、条件1(“「Z01」に一致する”)に対する整形結果、4,5列目のデータ項目B(条件2),データ項目C(条件2)は、条件2(“「Z01」を含まない”)に対する整形結果を示している。
【0075】
[効果等(2)]
以上のように、実施の形態2によれば、実施の形態1と同様の効果に加え、主キーと条件を適用するデータ項目とその条件によりデータを整形することが可能となり、より詳細に利用者100の支援を図れる。
【0076】
<実施の形態3>
図15〜図19等を用いて、本発明の実施の形態3のシステム等について説明する。実施の形態2では、主キー、条件適用データ項目、及び条件によりデータ整形を可能としたが、実施の形態3では、利用者100により指定された条件に従って追加したデータ項目を利用してデータ整形を行う処理について示す。
【0077】
[手順(3)]
図15に、実施の形態3の計算機システム101がデータ整形処理などを実行する際のシステム全体の手順を示す。図15で手順S101〜S104まで、及び手順S105以降は図2,図10等と同様である。手順S170〜S174は実施の形態3で特有である。
【0078】
(S170,S171) S170で、利用者(100)は、入力部201を介してデータ項目追加要求を入力可能であり、分析管理サブシステム200は、入力された要求をデータ整形サブシステム300のデータ整形処理部303に送付する。データ項目追加要求(S170)を受け取ったデータ整形処理部303は、データ項目追加ダイアログの画面(後述、図16)を表示部202に表示させる(S171)。
【0079】
(S172〜S174) S172で、利用者は、上記画面に、データ項目追加に関わるパラメータを入力する。分析管理サブシステム200は、当該入力パラメータ等の情報(S172)をデータ整形処理部303へ送付する。当該情報(S172)を受けとったデータ整形処理部303は、データ項目追加の処理を実行し(S173)、処理結果の情報を表示部202に表示させる(S174)。
【0080】
[データ項目追加処理(S173)]
図17に、データ整形処理部303が図15のデータ項目追加の手順S173を実行する際の処理例を示す(以下、主な処理主体は303)。
【0081】
(S1700,S1701) まず、分析対象データDのレコード数N等を抽出する。利用者(100)により画面(図16)で条件適用データ項目として選択されたデータ項目をACとし、条件入力欄に入力された条件をCとし、追加するデータ項目をAM+1とし、追加データをWとし、n=1とする。
【0082】
(S1702〜S1704) S1702では、データ項目ACのn番目のデータAC(n)が条件Cを満たすかどうかを判断し、満たす場合(Y)は、S1703で、AM+1(n)=Wとし、満たさない場合(N)は、S1704で、AM+1(n)=NULLとする。ここでは満たさない場合の値を「NULL」としているが、満たす場合の値Wと異なる値であれば何でも構わない。
【0083】
(S1705,S1706) 以上の処理をn=N(n≧N)となるまで繰り返す。
【0084】
[データ項目追加ダイアログ(S171)]
図16に、手順S171のデータ項目追加ダイアログ(画面)の表示の一例を示す。このダイアログは、表示情報として、条件適用データ項目選択肢(1601)、条件入力欄(1602)、条件選択肢(1603)、追加データ入力欄(1604)、追加データ項目名入力欄(1605)、及び、パラメータ入力を終了/キャンセルするボタン(1606)等を有する。
【0085】
条件適用データ項目選択肢(1601)は、データ項目を追加するための条件を適用するデータ項目を表示し利用者により選択可能とする手段である。条件適用データ項目選択肢(1601)に表示される選択肢は、分析対象データDに含まれるデータ項目である。条件入力欄(1602)及び条件選択肢(1603)は、条件適用データ項目に適用する条件を利用者により入力・選択する手段である。条件選択肢(1603)に表示される選択肢の例は、図11(B)と同様である。
【0086】
追加データ入力欄(1604)は、上記で入力された条件を満たす場合に追加データ項目に与えられる値を利用者により入力可能とする手段である。追加データ項目名入力欄(1605)は、追加するデータ項目名を利用者により入力可能とする手段である。
【0087】
[データ整形処理例(3−1)]
図18に、実施の形態3におけるデータ整形の処理例(その1)を示す。1801は、データ項目追加前のデータ、1802は、データ項目追加後でありデータ整形前のデータ、1803は、データ項目追加後でありデータ整形後のデータである。図18のデータ項目追加(1801→1802)では、条件適用データ項目AC=データ項目Eとし、条件C1を「0以上1以下」(図11(B)の(i))とし、C1該当の場合の追加データ項目値「0〜1.0」とし、条件C2を「1以上2以下」(同(i))とし、C2該当の場合の追加データ項目値「1.0〜2.0」とし、条件C3を「2以上3以下」(同(i))とし、C3該当の場合の追加データ項目値「2.0〜3.0」とし、追加データ項目名を「追加データ項目」として、条件C1,C2,C3をそれぞれ適用した場合を示している。
【0088】
例えば1801の1,2,4,5行目のデータ項目Eは要素値が条件C1に該当するため、1802の同行では「追加データ項目」に値「0〜1.0」が格納され、1801の3行目のデータ項目Eは要素値が条件C3に該当するため、1802の同行では「追加データ項目」に値「2.0〜3.0」が格納される。
【0089】
また、図18のデータ整形(1802→1803)では、主キーAK=「追加データ項目」とし、データ項目Aの整形処理PA=「要素を列挙(要素の重複を許さない)」(図5(B)の(b))とし、データ項目Bの整形処理PB=「要素を数える(要素の重複を許さない)」(同(d))とした場合を示している。
【0090】
[データ整形処理例(3−2)]
図19に、実施の形態3におけるデータ整形の処理例(その2)を示す。1901はデータ項目追加前、1902はデータ項目追加後でデータ整形前、1903はデータ項目追加後でデータ整形後である。図19のデータ項目追加(1901→1902)では、条件適用データ項目AC=データ項目Fとし、条件C1=“「2010/10」を含む”とし、C1該当の場合の追加データ項目「2010/10」とし、条件C2=“「2010/11」を含む”とし、C2該当の場合の追加データ項目「2010/11」とし、条件C3=“「2010/12」を含む”とし、C3該当の場合の追加データ項目「2010/12」とし、追加データ項目名を「追加データ項目」として、条件C1,C2,C3をそれぞれ適用した場合を示している。
【0091】
また図19のデータ整形(1902→1903)では、主キーAK=「追加データ項目」とし、データ項目Aの整形処理PA=「要素を列挙(要素の重複を許さない)」(図5(B)の(b))とし、データ項目Bの整形処理PB=「要素を数える(要素の重複を許さない)」(図5(B)の(d))とした場合を示している。
【0092】
[効果等(3)]
以上のように、実施の形態3によれば、実施の形態1,2と同様の効果に加え、(利用者100による)指定された条件に従って追加したデータ項目を利用してデータ整形を行うことが可能となり、より詳細に利用者100の支援を図れる。
【0093】
以上、本発明者によってなされた発明を実施の形態に基づき具体的に説明したが、本発明は前記実施の形態に限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能であることは言うまでもない。
【産業上の利用可能性】
【0094】
本発明は、多次元データ分析・支援システム、OLAPツール等に利用可能である。
【符号の説明】
【0095】
100:利用者、101:計算機システム、200:分析管理サブシステム、201:入力部、202:表示部、300:データ整形サブシステム、301:データ抽出部、302:主キー推薦分析部、303:データ整形処理部、400:分析対象DB。
【特許請求の範囲】
【請求項1】
計算機システムを用いて利用者による多次元データの分析に係わるデータ整形を含む処理作業を支援する処理を行うデータ整形システムであって、
前記データ整形システムは、
前記利用者からの要求に従い、前記多次元データである分析対象データの各々のデータ項目間の関連度を算出する第1の処理と、
当該関連度に基づいて、前記利用者に推薦するための主キーとして適するデータ項目を分析・抽出する第2の処理と、
当該抽出した主キーとして適するデータ項目を含む情報を前記利用者に対して出力する第3の処理と、
当該出力された情報の中から前記利用者により主キーとするデータ項目を選択可能として、当該選択されたデータ項目に関して前記分析対象データの各々のデータ項目へのデータ整形を含む処理を前記利用者からの要求に従い実行可能とする第4の処理と、を行うこと、を特徴とするデータ整形システム。
【請求項2】
請求項1記載のデータ整形システムにおいて、
前記計算機システムは、分析管理サブシステムと、データ整形サブシステムと、分析対象データベースとを有し、
前記分析管理サブシステムは、前記利用者により情報を入力する処理を行う入力部、及び前記利用者に対して画面で情報を表示する処理を行う表示部を有し、
前記データ整形サブシステムは、データ抽出部、主キー推薦分析部、及びデータ整形処理部を有し、
前記分析対象データベースは、前記分析対象データ、及び前記データ整形の処理結果のデータが格納され、
前記分析管理サブシステムは、前記利用者によるデータ抽出要求を受けて前記データ整形サブシステムに送信し、前記データ抽出部は、前記分析対象データベースから当該要求に応じた分析対象データを抽出して、前記分析管理サブシステムに表示させ、
前記分析管理サブシステムは、前記利用者による主キー推薦分析要求を受けて前記データ整形サブシステムに送信し、前記主キー推薦分析部は、当該要求に応じて主キー推薦分析の処理として前記第1、第2、第3の処理を実行し、当該処理結果の情報を前記分析管理サブシステムに表示させ、
前記分析管理サブシステムは、前記表示された情報の中からの前記利用者による主キーとするデータ項目の選択に基づく前記分析対象データの各々のデータ項目へのデータ整形の要求を前記データ整形サブシステムに送信し、
前記データ整形処理部は、前記第4の処理として、前記利用者により主キーとして選択されたデータ項目に関する前記分析対象データの各々のデータ項目へのデータ整形について、複数の種類のデータ整形の中から利用者により選択されたデータ整形の処理を実行可能とする情報を前記分析管理サブシステムに表示させ、また、前記分析管理サブシステムで利用者により入力されるデータ整形のパラメータに従い、前記選択されたデータ整形の処理を実行して、当該処理結果の情報を前記分析管理サブシステムに表示させると共に前記分析対象データベースに登録すること、を特徴とするデータ整形システム。
【請求項3】
請求項1記載のデータ整形システムにおいて、
前記第1の処理において、
前記分析対象データDのデータ項目数Mを抽出し、K番目(1≦K≦M)の各々のデータ項目AKの関連度R(AK)を算出する処理を行い、
上記関連度R(AK)は、主キーとしてデータ項目AKを選択した場合に当該データ項目AKの各要素に対する他のデータ項目のとり得る要素数が多いほど値が小さく、要素数が少ないほど値が大きくなる情報であること、を特徴とするデータ整形システム。
【請求項4】
請求項2記載のデータ整形システムにおいて、
前記データ整形処理部によるデータ整形の処理において、
前記分析対象データDのデータ項目数M,レコード数Nを抽出し、
前記主キーとして選択されたデータ項目をAKとし、データ項目Amに対して選択された整形処理をPm(1≦m≦M)とし、空のリストをLとし、変数n=1とし、
前記データ項目AKのn番目のデータAK(n)がリストLに含まれない場合、リストLにデータの組(AK(n),{A1(n),A2(n),…,AM(n)})を追加し、
前記データ項目AKのn番目のデータAK(n)がリストLに含まれる場合、リストLからデータの組(AK(n),{a1,…, aM})を抽出し、変数q=1とし、
整形処理Pqに従ってデータaqとデータAq(n)に処理を施し、当該処理結果をデータaqに代入し、
上記処理をq=Mになるまで繰り返し、
上記リストLに、更新したデータの組(AK(n),{a1,…, aM})を代入し、
上記処理をn=Nになるまで繰り返すこと、を特徴とするデータ整形システム。
【請求項5】
請求項1記載のデータ整形システムにおいて、
前記計算機システムは、分析管理サブシステムと、データ整形サブシステムと、分析対象データベースとを有し、
前記分析管理サブシステムは、前記利用者により情報を入力する処理を行う入力部、及び前記利用者に対して画面で情報を表示する処理を行う表示部を有し、
前記データ整形サブシステムは、データ抽出部、主キー推薦分析部、及びデータ整形処理部を有し、
前記分析対象データベースは、前記分析対象データ、及び前記データ整形の処理結果のデータが格納され、
前記分析管理サブシステムは、前記利用者によるデータ抽出要求を受けて前記データ整形サブシステムに送信し、前記データ抽出部は、前記分析対象データベースから分析対象データを抽出し、前記分析管理サブシステムに表示させ、
前記分析管理サブシステムは、前記利用者による主キー推薦分析要求を受けて前記データ整形サブシステムに送信し、前記主キー推薦分析部は、当該要求に応じて主キー推薦分析の処理として前記第1、第2、第3の処理を実行し、当該処理結果の情報を前記分析管理サブシステムに表示させ、
前記分析管理サブシステムは、前記表示された情報の中からの前記利用者による主キーとするデータ項目の選択に基づく、前記分析対象データの各々のデータ項目への条件付きデータ整形の要求を前記データ整形サブシステムに送信し、
前記データ整形処理部は、前記利用者による条件付きデータ整形に関わるパラメータの入力のための画面を前記分析管理サブシステムに表示させ、当該画面で利用者により入力された条件付きデータ整形に関わるパラメータに従いデータ整形処理を実行し、当該処理結果の情報を分析管理サブシステムに表示させると共に前記分析対象データベースに登録すること、を特徴とするデータ整形システム。
【請求項6】
請求項5記載のデータ整形システムにおいて、
前記データ整形処理部による条件付きデータ整形の処理において、
前記分析対象データDのデータ項目数M及びレコード数Nを抽出し、
前記主キーとして選択されたデータ項目をAKとし、条件適用データ項目として選択されたデータ項目をACとし、当該条件適用データ項目に適用する条件数をSSとし、当該条件適用データ項目のデータAC(n)(1≦n≦N)に適用する条件をCS(1≦S≦SS)とし、表示方法をVとし、データ項目Amに対して選択された整形処理をPm(1≦m≦M)とし、空のリストをLとし、変数n=1とし、
上記AC(n)が満たす条件CSがある場合は、AK(n)とCSの組がリストLに含まれるかどうか調べ、
上記含まれない場合は、リストLにデータの組(AK(n),CS,{A1(n),A2(n),…,AM(n)})を追加し、
上記含まれる場合は、リストLからデータの組(AK(n),CS,{a1,…,aM})を抽出し、変数q=1とし、
整形処理Pqに従ってデータaqとデータAq(n)に処理を施し、当該処理結果をデータaqに代入し、
上記処理をq=Mまで繰り返し、
上記リストLに、更新したデータの組(AK(n),CS,{a1,…,aM})を代入し、
上記処理をn=Nまで繰り返すこと、を特徴とするデータ整形システム。
【請求項7】
請求項1記載のデータ整形システムにおいて、
前記計算機システムは、分析管理サブシステムと、データ整形サブシステムと、分析対象データベースとを有し、
前記分析管理サブシステムは、前記利用者により情報を入力する処理を行う入力部、及び前記利用者に対して画面で情報を表示する処理を行う表示部を有し、
前記データ整形サブシステムは、データ抽出部、主キー推薦分析部、及びデータ整形処理部を有し、
前記分析対象データベースは、前記分析対象データ、及び前記データ整形の処理結果のデータが格納され、
前記分析管理サブシステムは、前記利用者によるデータ抽出要求を受けて前記データ整形サブシステムに送信し、前記データ抽出部は、前記分析対象データベースから当該要求に応じた分析対象データを抽出して、前記分析管理サブシステムに表示させ、
前記分析管理サブシステムは、前記利用者によるデータ項目追加要求を受けて前記データ整形サブシステムに送信し、前記データ整形処理部は、前記利用者によるデータ項目追加に係わるパラメータの入力を可能とする画面を前記分析管理サブシステムに表示させ、当該画面で利用者により入力されたパラメータに従い、データ項目追加の処理を実行し、当該処理結果の情報を前記分析管理サブシステムに表示させ、
次に、前記分析管理サブシステムは、前記利用者による主キー推薦分析要求を受けて前記データ整形サブシステムに送信し、前記主キー推薦分析部は、当該要求に応じて主キー推薦分析の処理として前記第1、第2、第3の処理を実行し、当該処理結果の情報を前記分析管理サブシステムに表示させ、
前記分析管理サブシステムは、前記表示された情報の中からの前記利用者による主キーとするデータ項目の選択に基づく前記分析対象データの各々のデータ項目へのデータ整形の要求を前記データ整形サブシステムに送信し、
前記データ整形処理部は、前記利用者により主キーとして選択されたデータ項目に関する前記分析対象データの各々のデータ項目へのデータ整形について、複数の種類のデータ整形の中から利用者により選択されたデータ整形の処理を実行可能とする情報を前記分析管理サブシステムに表示させ、また、前記分析管理サブシステムで利用者により入力されるデータ整形のパラメータに従い、前記選択されたデータ整形の処理を実行して、当該処理結果の情報を前記分析管理サブシステムに表示させると共に前記分析対象データベースに登録すること、を特徴とするデータ整形システム。
【請求項8】
請求項7記載のデータ整形システムにおいて、
前記データ整形処理部によるデータ項目追加の処理において、
前記分析対象データDのレコード数Nを抽出し、
前記データ項目を追加するための条件を適用するデータ項目である条件適用データ項目として選択されたデータ項目をACとし、入力された条件をCとし、追加するデータ項目である追加データ項目をAM+1とし、追加データをWとし、変数n=1とし、
上記ACのn番目のデータAC(n)が条件Cを満たす場合は、AM+1(n)=Wとし、満たさない場合は、AM+1(n)=NULLまたはWとは異なる値とし、
上記処理をn=Nとなるまで繰り返し、
前記分析管理サブシステムに表示させる前記データ項目追加に係わる画面において、
前記分析対象データに含まれるデータ項目に基づく、前記条件適用データ項目とするデータ項目を利用者により選択可能とする情報と、
前記条件適用データ項目に適用する条件を利用者により入力可能とする情報、及び当該条件を利用者により選択可能とする情報と、
前記条件を満たす場合に前記追加データ項目に与えられる値及び当該追加データ項目の名を利用者により入力可能とする情報と、を表示すること、を特徴とするデータ整形システム。
【請求項9】
計算機システムを用いて利用者による多次元データの分析に係わるデータ整形を含む処理作業を支援する処理を行うデータ整形方法であって、
前記計算機システムにより行うステップとして、
前記利用者からの要求に従い、前記多次元データである分析対象データの各々のデータ項目間の関連度を算出する第1の処理を行うステップと、
当該関連度に基づいて、前記利用者に推薦するための主キーとして適するデータ項目を分析・抽出する第2の処理を行うステップと、
当該抽出した主キーとして適するデータ項目を含む情報を前記利用者に対して出力する第3の処理を行うステップと、
当該出力された情報の中から前記利用者により主キーとするデータ項目を選択可能として、当該選択されたデータ項目に関して前記分析対象データの各々のデータ項目へのデータ整形を含む処理を前記利用者からの要求に従い実行可能とする第4の処理を行うステップと、を有すること、を特徴とするデータ整形方法。
【請求項10】
計算機システムを用いて利用者による多次元データの分析に係わるデータ整形を含む処理作業を支援する処理を行わせるデータ整形プログラムであって、
前記利用者からの要求に従い、前記多次元データである分析対象データの各々のデータ項目間の関連度を算出する第1の処理を行わせるプログラムと、
当該関連度に基づいて、前記利用者に推薦するための主キーとして適するデータ項目を分析・抽出する第2の処理を行わせるプログラムと、
当該抽出した主キーとして適するデータ項目を含む情報を前記利用者に対して出力する第3の処理を行わせるプログラムと、
当該出力された情報の中から前記利用者により主キーとするデータ項目を選択可能として、当該選択されたデータ項目に関して前記分析対象データの各々のデータ項目へのデータ整形を含む処理を前記利用者からの要求に従い実行可能とする第4の処理を行わせるプログラムと、を有すること、を特徴とするデータ整形プログラム。
【請求項1】
計算機システムを用いて利用者による多次元データの分析に係わるデータ整形を含む処理作業を支援する処理を行うデータ整形システムであって、
前記データ整形システムは、
前記利用者からの要求に従い、前記多次元データである分析対象データの各々のデータ項目間の関連度を算出する第1の処理と、
当該関連度に基づいて、前記利用者に推薦するための主キーとして適するデータ項目を分析・抽出する第2の処理と、
当該抽出した主キーとして適するデータ項目を含む情報を前記利用者に対して出力する第3の処理と、
当該出力された情報の中から前記利用者により主キーとするデータ項目を選択可能として、当該選択されたデータ項目に関して前記分析対象データの各々のデータ項目へのデータ整形を含む処理を前記利用者からの要求に従い実行可能とする第4の処理と、を行うこと、を特徴とするデータ整形システム。
【請求項2】
請求項1記載のデータ整形システムにおいて、
前記計算機システムは、分析管理サブシステムと、データ整形サブシステムと、分析対象データベースとを有し、
前記分析管理サブシステムは、前記利用者により情報を入力する処理を行う入力部、及び前記利用者に対して画面で情報を表示する処理を行う表示部を有し、
前記データ整形サブシステムは、データ抽出部、主キー推薦分析部、及びデータ整形処理部を有し、
前記分析対象データベースは、前記分析対象データ、及び前記データ整形の処理結果のデータが格納され、
前記分析管理サブシステムは、前記利用者によるデータ抽出要求を受けて前記データ整形サブシステムに送信し、前記データ抽出部は、前記分析対象データベースから当該要求に応じた分析対象データを抽出して、前記分析管理サブシステムに表示させ、
前記分析管理サブシステムは、前記利用者による主キー推薦分析要求を受けて前記データ整形サブシステムに送信し、前記主キー推薦分析部は、当該要求に応じて主キー推薦分析の処理として前記第1、第2、第3の処理を実行し、当該処理結果の情報を前記分析管理サブシステムに表示させ、
前記分析管理サブシステムは、前記表示された情報の中からの前記利用者による主キーとするデータ項目の選択に基づく前記分析対象データの各々のデータ項目へのデータ整形の要求を前記データ整形サブシステムに送信し、
前記データ整形処理部は、前記第4の処理として、前記利用者により主キーとして選択されたデータ項目に関する前記分析対象データの各々のデータ項目へのデータ整形について、複数の種類のデータ整形の中から利用者により選択されたデータ整形の処理を実行可能とする情報を前記分析管理サブシステムに表示させ、また、前記分析管理サブシステムで利用者により入力されるデータ整形のパラメータに従い、前記選択されたデータ整形の処理を実行して、当該処理結果の情報を前記分析管理サブシステムに表示させると共に前記分析対象データベースに登録すること、を特徴とするデータ整形システム。
【請求項3】
請求項1記載のデータ整形システムにおいて、
前記第1の処理において、
前記分析対象データDのデータ項目数Mを抽出し、K番目(1≦K≦M)の各々のデータ項目AKの関連度R(AK)を算出する処理を行い、
上記関連度R(AK)は、主キーとしてデータ項目AKを選択した場合に当該データ項目AKの各要素に対する他のデータ項目のとり得る要素数が多いほど値が小さく、要素数が少ないほど値が大きくなる情報であること、を特徴とするデータ整形システム。
【請求項4】
請求項2記載のデータ整形システムにおいて、
前記データ整形処理部によるデータ整形の処理において、
前記分析対象データDのデータ項目数M,レコード数Nを抽出し、
前記主キーとして選択されたデータ項目をAKとし、データ項目Amに対して選択された整形処理をPm(1≦m≦M)とし、空のリストをLとし、変数n=1とし、
前記データ項目AKのn番目のデータAK(n)がリストLに含まれない場合、リストLにデータの組(AK(n),{A1(n),A2(n),…,AM(n)})を追加し、
前記データ項目AKのn番目のデータAK(n)がリストLに含まれる場合、リストLからデータの組(AK(n),{a1,…, aM})を抽出し、変数q=1とし、
整形処理Pqに従ってデータaqとデータAq(n)に処理を施し、当該処理結果をデータaqに代入し、
上記処理をq=Mになるまで繰り返し、
上記リストLに、更新したデータの組(AK(n),{a1,…, aM})を代入し、
上記処理をn=Nになるまで繰り返すこと、を特徴とするデータ整形システム。
【請求項5】
請求項1記載のデータ整形システムにおいて、
前記計算機システムは、分析管理サブシステムと、データ整形サブシステムと、分析対象データベースとを有し、
前記分析管理サブシステムは、前記利用者により情報を入力する処理を行う入力部、及び前記利用者に対して画面で情報を表示する処理を行う表示部を有し、
前記データ整形サブシステムは、データ抽出部、主キー推薦分析部、及びデータ整形処理部を有し、
前記分析対象データベースは、前記分析対象データ、及び前記データ整形の処理結果のデータが格納され、
前記分析管理サブシステムは、前記利用者によるデータ抽出要求を受けて前記データ整形サブシステムに送信し、前記データ抽出部は、前記分析対象データベースから分析対象データを抽出し、前記分析管理サブシステムに表示させ、
前記分析管理サブシステムは、前記利用者による主キー推薦分析要求を受けて前記データ整形サブシステムに送信し、前記主キー推薦分析部は、当該要求に応じて主キー推薦分析の処理として前記第1、第2、第3の処理を実行し、当該処理結果の情報を前記分析管理サブシステムに表示させ、
前記分析管理サブシステムは、前記表示された情報の中からの前記利用者による主キーとするデータ項目の選択に基づく、前記分析対象データの各々のデータ項目への条件付きデータ整形の要求を前記データ整形サブシステムに送信し、
前記データ整形処理部は、前記利用者による条件付きデータ整形に関わるパラメータの入力のための画面を前記分析管理サブシステムに表示させ、当該画面で利用者により入力された条件付きデータ整形に関わるパラメータに従いデータ整形処理を実行し、当該処理結果の情報を分析管理サブシステムに表示させると共に前記分析対象データベースに登録すること、を特徴とするデータ整形システム。
【請求項6】
請求項5記載のデータ整形システムにおいて、
前記データ整形処理部による条件付きデータ整形の処理において、
前記分析対象データDのデータ項目数M及びレコード数Nを抽出し、
前記主キーとして選択されたデータ項目をAKとし、条件適用データ項目として選択されたデータ項目をACとし、当該条件適用データ項目に適用する条件数をSSとし、当該条件適用データ項目のデータAC(n)(1≦n≦N)に適用する条件をCS(1≦S≦SS)とし、表示方法をVとし、データ項目Amに対して選択された整形処理をPm(1≦m≦M)とし、空のリストをLとし、変数n=1とし、
上記AC(n)が満たす条件CSがある場合は、AK(n)とCSの組がリストLに含まれるかどうか調べ、
上記含まれない場合は、リストLにデータの組(AK(n),CS,{A1(n),A2(n),…,AM(n)})を追加し、
上記含まれる場合は、リストLからデータの組(AK(n),CS,{a1,…,aM})を抽出し、変数q=1とし、
整形処理Pqに従ってデータaqとデータAq(n)に処理を施し、当該処理結果をデータaqに代入し、
上記処理をq=Mまで繰り返し、
上記リストLに、更新したデータの組(AK(n),CS,{a1,…,aM})を代入し、
上記処理をn=Nまで繰り返すこと、を特徴とするデータ整形システム。
【請求項7】
請求項1記載のデータ整形システムにおいて、
前記計算機システムは、分析管理サブシステムと、データ整形サブシステムと、分析対象データベースとを有し、
前記分析管理サブシステムは、前記利用者により情報を入力する処理を行う入力部、及び前記利用者に対して画面で情報を表示する処理を行う表示部を有し、
前記データ整形サブシステムは、データ抽出部、主キー推薦分析部、及びデータ整形処理部を有し、
前記分析対象データベースは、前記分析対象データ、及び前記データ整形の処理結果のデータが格納され、
前記分析管理サブシステムは、前記利用者によるデータ抽出要求を受けて前記データ整形サブシステムに送信し、前記データ抽出部は、前記分析対象データベースから当該要求に応じた分析対象データを抽出して、前記分析管理サブシステムに表示させ、
前記分析管理サブシステムは、前記利用者によるデータ項目追加要求を受けて前記データ整形サブシステムに送信し、前記データ整形処理部は、前記利用者によるデータ項目追加に係わるパラメータの入力を可能とする画面を前記分析管理サブシステムに表示させ、当該画面で利用者により入力されたパラメータに従い、データ項目追加の処理を実行し、当該処理結果の情報を前記分析管理サブシステムに表示させ、
次に、前記分析管理サブシステムは、前記利用者による主キー推薦分析要求を受けて前記データ整形サブシステムに送信し、前記主キー推薦分析部は、当該要求に応じて主キー推薦分析の処理として前記第1、第2、第3の処理を実行し、当該処理結果の情報を前記分析管理サブシステムに表示させ、
前記分析管理サブシステムは、前記表示された情報の中からの前記利用者による主キーとするデータ項目の選択に基づく前記分析対象データの各々のデータ項目へのデータ整形の要求を前記データ整形サブシステムに送信し、
前記データ整形処理部は、前記利用者により主キーとして選択されたデータ項目に関する前記分析対象データの各々のデータ項目へのデータ整形について、複数の種類のデータ整形の中から利用者により選択されたデータ整形の処理を実行可能とする情報を前記分析管理サブシステムに表示させ、また、前記分析管理サブシステムで利用者により入力されるデータ整形のパラメータに従い、前記選択されたデータ整形の処理を実行して、当該処理結果の情報を前記分析管理サブシステムに表示させると共に前記分析対象データベースに登録すること、を特徴とするデータ整形システム。
【請求項8】
請求項7記載のデータ整形システムにおいて、
前記データ整形処理部によるデータ項目追加の処理において、
前記分析対象データDのレコード数Nを抽出し、
前記データ項目を追加するための条件を適用するデータ項目である条件適用データ項目として選択されたデータ項目をACとし、入力された条件をCとし、追加するデータ項目である追加データ項目をAM+1とし、追加データをWとし、変数n=1とし、
上記ACのn番目のデータAC(n)が条件Cを満たす場合は、AM+1(n)=Wとし、満たさない場合は、AM+1(n)=NULLまたはWとは異なる値とし、
上記処理をn=Nとなるまで繰り返し、
前記分析管理サブシステムに表示させる前記データ項目追加に係わる画面において、
前記分析対象データに含まれるデータ項目に基づく、前記条件適用データ項目とするデータ項目を利用者により選択可能とする情報と、
前記条件適用データ項目に適用する条件を利用者により入力可能とする情報、及び当該条件を利用者により選択可能とする情報と、
前記条件を満たす場合に前記追加データ項目に与えられる値及び当該追加データ項目の名を利用者により入力可能とする情報と、を表示すること、を特徴とするデータ整形システム。
【請求項9】
計算機システムを用いて利用者による多次元データの分析に係わるデータ整形を含む処理作業を支援する処理を行うデータ整形方法であって、
前記計算機システムにより行うステップとして、
前記利用者からの要求に従い、前記多次元データである分析対象データの各々のデータ項目間の関連度を算出する第1の処理を行うステップと、
当該関連度に基づいて、前記利用者に推薦するための主キーとして適するデータ項目を分析・抽出する第2の処理を行うステップと、
当該抽出した主キーとして適するデータ項目を含む情報を前記利用者に対して出力する第3の処理を行うステップと、
当該出力された情報の中から前記利用者により主キーとするデータ項目を選択可能として、当該選択されたデータ項目に関して前記分析対象データの各々のデータ項目へのデータ整形を含む処理を前記利用者からの要求に従い実行可能とする第4の処理を行うステップと、を有すること、を特徴とするデータ整形方法。
【請求項10】
計算機システムを用いて利用者による多次元データの分析に係わるデータ整形を含む処理作業を支援する処理を行わせるデータ整形プログラムであって、
前記利用者からの要求に従い、前記多次元データである分析対象データの各々のデータ項目間の関連度を算出する第1の処理を行わせるプログラムと、
当該関連度に基づいて、前記利用者に推薦するための主キーとして適するデータ項目を分析・抽出する第2の処理を行わせるプログラムと、
当該抽出した主キーとして適するデータ項目を含む情報を前記利用者に対して出力する第3の処理を行わせるプログラムと、
当該出力された情報の中から前記利用者により主キーとするデータ項目を選択可能として、当該選択されたデータ項目に関して前記分析対象データの各々のデータ項目へのデータ整形を含む処理を前記利用者からの要求に従い実行可能とする第4の処理を行わせるプログラムと、を有すること、を特徴とするデータ整形プログラム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【公開番号】特開2012−238153(P2012−238153A)
【公開日】平成24年12月6日(2012.12.6)
【国際特許分類】
【出願番号】特願2011−106284(P2011−106284)
【出願日】平成23年5月11日(2011.5.11)
【出願人】(000233491)株式会社日立システムズ (394)
【公開日】平成24年12月6日(2012.12.6)
【国際特許分類】
【出願日】平成23年5月11日(2011.5.11)
【出願人】(000233491)株式会社日立システムズ (394)
[ Back to top ]