データ分析支援装置、データ分析支援システム、データ分析支援方法、及びプログラム
【課題】 分析の専門知識や経験がなくても、目的とする分析を簡単にコンピュータ等の分析処理装置に行わせることが可能なデータ分析支援装置等を提供する。
【解決手段】 分析提供者は分析の設定情報(分析対象データの各データ項目そのものの属性を示すデータ項目情報、及び分析の手法等を定義した分析設定情報)を分析支援情報として支援情報DB6に登録しておく。分析提供者が新たな分析についての分析設定を行う際、分析支援サーバ2の制御部10は、支援情報DB6に登録されている分析支援情報の中から、類似するデータを抽出して分析支援情報として提示する。また、分析利用者から分析対象データやその目的が入力されると、分析支援サーバ2の制御部10は、支援情報DB6に登録されている分析支援情報の中から、最も類似するものを抽出し、そのデータに関連付けられている分析手法を用いた分析処理を実行する。
【解決手段】 分析提供者は分析の設定情報(分析対象データの各データ項目そのものの属性を示すデータ項目情報、及び分析の手法等を定義した分析設定情報)を分析支援情報として支援情報DB6に登録しておく。分析提供者が新たな分析についての分析設定を行う際、分析支援サーバ2の制御部10は、支援情報DB6に登録されている分析支援情報の中から、類似するデータを抽出して分析支援情報として提示する。また、分析利用者から分析対象データやその目的が入力されると、分析支援サーバ2の制御部10は、支援情報DB6に登録されている分析支援情報の中から、最も類似するものを抽出し、そのデータに関連付けられている分析手法を用いた分析処理を実行する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、データ分析を支援するデータ分析支援装置等に関する。
【背景技術】
【0002】
近年、情報技術の発達やインターネットの普及に伴い、情報源が多様化し、大量の情報が蓄積されている。また、これらの情報を分析するため、コンピュータ等を用いた種々の分析方法が提案されている。
一般に、データ分析の流れとしては、(1)分析対象とするデータの収集及び選定、(2)分析方法の選択、(3)選択された方法に基づく分析、(4)分析結果の閲覧、アクション検討といった手順でなされている。
【0003】
しかしながら、分析の対象データには、多くの情報が含まれるため、それらの中から分析に利用するデータを選別(上述の手順(1))することは難しいという問題があった。
また、分析は専門性が高い分野であり、専門の知識や経験がなければ、目的に適合した分析方法を選択(上述の手順(2))することも、難しいという問題があった。
【0004】
一方、従来の分析ツールでは、各操作のアイコン化による視覚化等、操作性に優れたツールが提供されたり、特許文献1のように、過去の分析履歴に基づいて、複数の分析を組み合わせた複合分析を行うデータ分析システム等が提供されたりしている。
特許文献1のデータ分析システムでは、分析手法(順位分析、推移分析、分布分析、相関分析等)の組み合わせパターンの履歴情報や、また推奨する分析パターンの情報を蓄積しておき、分析のためのガイド画面を表示して、ユーザに各種設定を促すことにより、過去の複合分析のパターンを継承して分析を行っている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2005−157896号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、特許文献1のデータ分析システムは、複数種の分析手法を組み合わせた複合分析を行う場合に有用であるが、複合分析でない分析について支援するものではなかった。
【0007】
本発明は、このような課題に鑑みてなされたもので、その目的とするところは、分析の専門知識や経験がなくても、目的とする分析を簡単にコンピュータ等の分析処理装置に行わせることが可能なデータ分析支援装置等を提供することである。
【課題を解決するための手段】
【0008】
前述した課題を解決するため第1の発明は、データ分析の支援に用いるデータを蓄積する支援情報データベースを備えたデータ分析支援装置であって、分析対象データに含まれる各データ項目について、データ項目そのものの属性を定義する項目情報の設定を受け付ける項目情報設定手段と、前記分析対象データの分析目的に応じた分析方法を定義する分析設定情報の設定を受け付ける分析設定手段と、前記項目情報及び前記分析設定情報を、分析支援情報として前記支援情報データベースに登録する分析支援情報登録手段と、新規に入力された分析対象データについて設定された項目情報または分析設定情報と、一致または類似する項目情報または分析設定情報を有する分析支援情報を、前記支援情報データベースから抽出し、提示する分析支援情報提示手段と、を備えることを特徴とするデータ分析支援装置である。
【0009】
第2の発明は、データ分析の支援に用いるデータを蓄積する支援情報データベースを備えたデータ分析支援装置であって、前記支援情報データベースには、過去に行った分析における分析対象データに含まれる各データ項目そのものの属性を定義する項目情報と、前記分析対象データの分析目的に応じた分析方法を定義する分析設定情報とが、分析支援情報として予め登録されており、新たに行う分析について、分析対象データ及び分析目的を入力する入力手段と、前記入力手段により入力された分析対象データ及び分析目的に適合した分析支援情報を前記支援情報データベースから抽出する抽出手段と、前記抽出手段によって抽出した分析支援情報に設定されている分析設定情報に基づいて、前記入力手段により入力された分析対象データについての分析処理を実行し、分析結果を閲覧可能に表示する表示手段と、を備えることを特徴とするデータ分析支援装置である。
【0010】
第3の発明は、データ分析の支援に用いるデータを蓄積する支援情報データベースを備えたデータ分析支援装置であって、分析対象データに含まれる各データ項目について、データ項目そのものの属性を定義する項目情報の設定を受け付ける項目情報設定手段と、前記分析対象データの分析目的に応じた分析方法を定義する分析設定情報の設定を受け付ける分析設定手段と、前記項目情報及び前記分析設定情報を、分析支援情報として前記支援情報データベースに登録する分析支援情報登録手段と、新規に入力された分析対象データについて設定された項目情報または分析設定情報と、一致または類似する項目情報または分析設定情報を有する分析支援情報を、前記支援情報データベースから抽出し、提示する分析支援情報提示手段と、前記分析支援情報提示手段によって提示された分析支援情報に設定されている分析設定情報に基づいて、前記新規に入力された分析対象データについての分析処理を実行し、分析結果を閲覧可能に表示する表示手段と、を備えることを特徴とするデータ分析支援装置である。
【0011】
上述の第1または第3の発明において、前記分析支援情報提示手段は、前記分析支援情報について複数の抽出結果を得た場合は、類似度の高い分析支援情報を優先的に提示することが望ましい。
【0012】
また、上述の第1または第3の発明において、前記分析支援情報提示手段は、抽出された分析支援情報を、分析設定情報の設定画面内に、並べて表示することが望ましい。
【0013】
また、上述の第1、第2、または第3の発明において、前記項目情報は、各データ項目の属性として、データ形式、データ種別、及びデータ内容を定義するものであることが望ましい。
【0014】
また、上述の第1、第2、または第3の発明において、前記分析設定情報は、少なくとも分析の目的、目的カテゴリ、分析手法、及び分析対象データを定義するものであることが望ましい。
【0015】
第4の発明は、分析提供者が利用する分析管理システムと連携し、データ分析の支援に用いるデータを蓄積する支援情報データベースを備えたデータ分析支援システムであって、前記分析管理システムは、分析対象データに含まれる各データ項目について、データ項目そのものの属性を定義する項目情報の設定を受け付ける項目情報設定手段と、前記分析対象データの分析目的に応じた分析方法を定義する分析設定情報の設定を受け付ける分析設定手段と、前記項目情報及び前記分析設定情報を、分析支援情報として前記支援情報データベースに登録する分析支援情報登録手段と、新規に入力された分析対象データについての分析支援情報を提示するよう要求する提示要求手段と、を備え、当該データ分析支援システムは、前記分析管理システムからの要求に応じて、前記新規に入力された分析対象データについて、設定された項目情報または分析設定情報と、一致または類似する項目情報または分析設定情報を有する分析支援情報を、前記支援情報データベースから抽出し、前記分析管理システムに提示する第1の分析支援情報提示手段を備えることを特徴とするデータ分析支援システムである。
【0016】
第5の発明は、分析利用者が利用する分析処理システムと連携し、データ分析の支援に用いるデータを蓄積する支援情報データベースを備えたデータ分析支援システムであって、前記支援情報データベースには、過去に行った分析における分析対象データに含まれる各データ項目そのものの属性を定義する項目情報と、前記分析対象データの分析目的に応じた分析方法を定義する分析設定情報とが、分析支援情報として予め登録されており、前記分析処理システムは、分析対象データ及び分析目的を入力する入力手段と、前記入力手段により入力された分析対象データ及び分析目的に適合した分析支援情報を抽出するよう当該データ分析支援システムに対して要求する抽出要求手段と、を備え、当該データ分析支援システムは、前記分析処理システムからの要求に応じて、前記入力手段により入力された分析対象データ及び分析目的に適合した分析支援情報を前記支援情報データベースから抽出して、前記分析処理システムに提示する第2の分析支援情報提示手段を備え、前記分析処理システムは、更に、前記第2の分析支援情報提示手段によって提示された分析支援情報に設定されている分析設定情報に基づいて、前記入力手段により入力された分析対象データについての分析処理を実行し、分析結果を閲覧可能に表示する表示手段を備えることを特徴とするデータ分析支援システムである。
【0017】
第6の発明は、分析提供者が利用する分析管理システムと、分析利用者が利用する分析処理システムと、を連携し、データ分析の支援に用いるデータを蓄積する支援情報データベースを備えたデータ分析支援システムであって、前記分析管理システムは、分析対象データに含まれる各データ項目について、データ項目そのものの属性を定義する項目情報の設定を受け付ける項目情報設定手段と、前記分析対象データの分析目的に応じた分析方法を定義する分析設定情報の設定を受け付ける分析設定手段と、前記項目情報及び前記分析設定情報を、分析支援情報として前記支援情報データベースに登録する分析支援情報登録手段と、新規に入力された分析対象データについての分析支援情報を提示するよう要求する提示要求手段と、を備え、前記分析処理システムは、新たに行う分析について、分析対象データ及び分析目的を入力する入力手段と、前記入力手段により入力された分析対象データ及び分析目的に適合した分析設定情報を抽出するよう当該データ分析支援システムに対して要求する抽出要求手段と、を備え、当該データ分析支援システムは、前記分析管理システムからの要求に応じて、新規に入力された分析対象データについて設定された項目情報または分析設定情報と、一致または類似する項目情報または分析設定情報を有する分析支援情報を、前記支援情報データベースから抽出し、前記分析管理システムに提示する第1の分析支援情報提示手段と、前記分析処理システムからの要求に応じて、前記入力手段により入力された分析対象データ及び分析目的に適合した分析支援情報を前記支援情報データベースから抽出して、前記分析処理システムに提示する第2の分析支援情報提示手段と、を備え、前記分析処理システムは、更に、前記第2の分析支援情報提示手段によって提示された分析支援情報に設定されている分析設定情報に基づいて、前記入力手段により入力された分析対象データについての分析処理を実行し、分析結果を閲覧可能に表示する表示手段を備えることを特徴とするデータ分析支援システムである。
【0018】
第7の発明は、分析対象データに含まれる各データ項目について、データ項目そのものの属性を定義する項目情報の設定を受け付ける項目情報設定ステップと、前記分析対象データの分析目的に応じた分析方法を定義する分析設定情報の設定を受け付ける分析設定ステップと、設定された項目情報及び分析設定情報を、分析支援情報として支援情報データベースに登録する分析支援情報登録ステップと、新規に入力された分析対象データについて、前記項目情報または前記分析設定情報と、一致または類似する項目情報または分析設定情報を有する分析支援情報を、前記支援情報データベースから抽出し、提示する分析支援情報提示ステップと、を含むことを特徴とするデータ分析支援方法である。
【0019】
第8の発明は、過去に行った分析における分析対象データについて、分析対象データに含まれる各データ項目そのものの属性を定義する項目情報と、前記分析対象データの分析目的に応じた分析方法を定義する分析設定情報とが、分析支援情報として予め登録された支援情報データベースを利用したデータ分析支援方法であって、新たに行う分析について、分析対象データ及び分析目的を入力する入力ステップと、入力された分析対象データ及び分析目的に適合した分析支援情報を前記支援情報データベースから抽出する抽出ステップと、抽出した分析支援情報に設定されている分析設定情報に基づいて、前記入力された分析対象データについての分析処理を実行し、分析結果を閲覧可能に表示する表示ステップと、を含むことを特徴とするデータ分析支援方法である
【0020】
第9の発明は、分析対象データに含まれる各データ項目について、データ項目そのものの属性を定義する項目情報の設定を受け付ける項目情報設定ステップと、前記分析対象データの分析目的に応じた分析方法を定義する分析設定情報の設定を受け付ける分析設定ステップと、設定された項目情報及び分析設定情報を、分析支援情報として支援情報データベースに登録する分析支援情報登録ステップと、新規に入力された分析対象データについて設定された項目情報または分析設定情報と、一致または類似する項目情報または分析設定情報を有する分析支援情報を、前記支援情報データベースから抽出し、提示する分析支援情報提示ステップと、提示された分析支援情報に設定されている分析設定情報に基づいて、前記新規に入力された分析対象データについての分析処理を実行し、分析結果を閲覧可能に表示する表示ステップと、を含むことを特徴とするデータ分析支援方法である。
【0021】
第10の発明は、コンピュータを第1の発明に記載のデータ分析支援装置として機能させるためのプログラムである。
第11の発明は、コンピュータを第2の発明に記載のデータ分析支援装置として機能させるためのプログラムである。
第12の発明は、コンピュータを第3の発明に記載のデータ分析支援装置として機能させるためのプログラムである。
【発明の効果】
【0022】
本発明によれば、分析の専門知識や経験がなくても、目的とする分析を簡単にコンピュータ等の分析処理装置に行わせることが可能なデータ分析支援装置等を提供できる。
【図面の簡単な説明】
【0023】
【図1】データ分析支援システム1のシステム構成例
【図2】分析支援サーバ2のハードウエア構成例
【図3】分析データ情報DB61について説明する図
【図4】分析設定情報DB62について説明する図
【図5】分析支援情報DB63について説明する図
【図6】分析支援サーバ2が実行する分析管理処理の流れを示すフローチャート
【図7】分析管理システム20側で利用されるデータインポート画面91の表示例
【図8】分析対象データ設定画面92の表示例
【図9】分析設定画面93の表示例
【図10】分析支援サーバ2が実行するデータ分析処理の流れを示すフローチャート
【図11】分析処理システム30側で利用される分析処理初期画面95の表示例
【図12】分析結果表示画面96の表示例
【図13】データ分析支援システム1を用いた分析設定例(実施例1)
【図14】データ分析支援システム1を用いた分析設定例(実施例2)
【発明を実施するための形態】
【0024】
以下、図面に基づいて本発明の好適な実施形態について詳細に説明する。
図1は、本発明に係るデータ分析支援システム1のシステム構成を示す図である。
【0025】
図1に示すように、データ分析支援システム1は、分析支援サーバ2、分析提供者が利用する分析提供者端末7,7,・・・、及び分析利用者が利用する分析利用者端末8,8,・・・によって構成され、各装置はネットワーク9を介して互いに通信接続される。
【0026】
分析支援サーバ2は、分析管理システム20のサーバとして機能する分析管理部3と、分析処理システム30のサーバとして機能する分析処理部4と、これら分析管理システム20及び分析処理システム30とを連携し、分析支援を行なう分析支援部5と、分析支援に関する情報を蓄積する支援情報データベース(DB)6と、を有する。
【0027】
分析管理システム20は、図1に示すように、分析支援サーバ2の分析管理部3、分析提供者端末7,7,・・・、及びネットワーク9により構成されており、分析提供者が、分析方法、分析ポイント、アクションポイント等を設定するために用いるものである。ここで分析提供者とは、分析サービスや分析に関するシステム等を利用者等に対して提供する者をいう。
【0028】
分析処理システム30は、図1に示すように、分析支援サーバ2の分析処理部4、分析利用者端末8,8,・・・、及びネットワーク9により構成されており、所望の分析を行いたい分析利用者が、分析に使用するデータ(ログ、属性データ等)をインポートしたり、分析結果の閲覧等を行うために利用するものである。ここで分析利用者とは、分析結果を得るために分析に関するシステム等を利用する者をいう。
【0029】
分析支援サーバ2の分析支援部5は、分析管理部3及び分析処理部4を連携し、分析提供者及び分析利用者にとって有用な支援を行うものである。
【0030】
具体的には、分析支援部5は、後述する分析管理処理(図6参照)を実行する。分析管理処理において、分析支援部5は、分析管理部3にて設定される分析対象データの項目情報や分析設定情報等を分析支援情報として支援情報データベース6に蓄積する。また分析支援部5は、分析管理部3にて設定された分析対象データの項目情報に応じて、支援情報データベース6から適切な分析支援情報を抽出し、参照データとして提示する。
【0031】
また、分析支援部5は、後述するデータ分析処理(図7参照)を実行する。データ分析処理において、分析支援部5は、分析処理部4に入力される分析対象データ及びその分析目的に応じた分析手法として適当なものを、支援情報データベース6に蓄積された分析支援情報の中から抽出し、抽出した分析手法を分析処理部4に提示する。分析処理部4では、提示された分析手法に基づいてデータ分析を実行し、分析結果を閲覧可能に表示する。
【0032】
支援情報データベース6は、分析データ情報DB(データベース)61、分析設定情報DB62、及び分析支援情報DB63を有する。分析データ情報DB61、分析設定情報DB62、及び分析支援情報DB63に格納される各データの具体的な内容については後述する(図3、図4、図5参照)。
【0033】
なお、以下の説明において、「データベース」は「DB」、「テーブル」は「TB」のように省略して記載することもある。
【0034】
次に、図2を参照して、分析支援サーバ2のハードウエア構成を説明する。
分析支援サーバ2は、図2に示すように、制御部10、記憶部11、メディア入出力部13、通信部15、入力部17、表示部19、周辺機器I/F部21等がバス23を介して接続されて構成される。
【0035】
制御部10は、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Accsess Memory)等により構成される。
CPUは、記憶部11、ROM、記録媒体等に格納されるプログラムをRAM上のワークメモリ領域に呼び出して実行し、バス23を介して接続された各部を駆動制御する。制御部10のCPUは後述する分析管理処理(図6参照)、データ分析処理(図10参照)を実行する。
また、制御部10は、図1の分析管理部3、分析処理部4、及び分析支援部5として機能する。
【0036】
ROMは、コンピュータのブートプログラムやBIOS等のプログラム、データ等を恒久的に保持する。RAMは、ロードしたプログラムやデータを一時的に保持するとともに、制御部10が各種処理を行うために使用するワークエリアを備える。
【0037】
記憶部11は、HDD(ハードディスクドライブ)であり、制御部10が実行するプログラムや、プログラム実行に必要なデータ、OS(オペレーティング・システム)等が格納されている。これらのプログラムコードは、制御部10により必要に応じて読み出されてRAMに移され、CPUに読み出されて実行される。
また、記憶部11は、図1に示す支援情報データベース6としても機能し、分析データ情報DB61、分析設定情報DB62、及び分析支援情報DB63等を記憶する。
【0038】
メディア入出力部13(ドライブ装置)は、例えば、フロッピー(登録商標)ディスクドライブ、PDドライブ、CDドライブ、DVDドライブ、MOドライブ等のメディア入出力装置であり、データの入出力を行う。
通信部15は、通信制御装置、通信ポート等を有し、ネットワーク9との通信を媒介する通信インタフェースであり、通信制御を行う。
【0039】
入力部17は、例えば、キーボード、マウス等のポインティング・デバイス、テンキー等の入力装置であり、入力されたデータを制御部10へ出力する。
表示部19は、例えば液晶パネル、CRTモニタ等のディスプレイ装置と、ディスプレイ装置と連携して表示処理を実行するための論理回路(ビデオアダプタ等)で構成され、制御部10の制御により入力された表示情報をディスプレイ装置上に表示させる。
【0040】
次に、データ分析支援システム1で扱われるデータの構成について図3〜図5を用いて説明する。
【0041】
図3(A)に示す分析データ情報DB61には、分析の対象とするデータ(以下、分析対象データという)に含まれる各データ項目についての属性を定義する情報(以下、データ項目情報という)を設定したデータ項目情報テーブル71と、分析対象データの実データテーブル72と、が格納される。
【0042】
ここで、データ項目情報テーブル71は、上述のように、分析対象データに含まれる各データ項目についての属性を定義する情報であり、「データ形式」、「データ種別」、及び「データ内容」によって表される。データ項目情報テーブル71は、分析管理部3(または分析提供者端末7からネットワーク9を介し分析管理部3)において分析提供者により設定される。
【0043】
「データ形式」は、データの形式に関する情報であり、その値は、以下の表1に示すように、「数量」または「カテゴリ」である。
【0044】
【表1】
【0045】
「データ種別」は、データの種別を表すものであり、その値は、以下の表2に示すように、「ID」、「目的変数」、「説明変数」、「時系列」、「属性」等である。
【0046】
【表2】
【0047】
「データ内容」は、データの意味を表すものであり、その値は、以下の表3に示すように、「キー情報」、「目的付随情報」、「位置情報」、「時間情報」、「属性」、等である。
【0048】
【表3】
【0049】
実データテーブル72は、インポートされたデータのカラム名(データ項目名)と、その実データ(データ)とを格納したものである。
【0050】
例えば、図3(B)に示すログデータ73及び属性データ74が分析対象データとしてインポートされた場合、図3(C)に示すようなデータ項目情報テーブル76が分析提供者によって設定されるものとする。
【0051】
図3(B)のログデータは「ユーザID」、「購買商品ID」、「店舗ID」、「価格」、「個数」等のデータ項目を含み、属性データは「ユーザID」、「性別cd(コード)」、「地域cd(コード)」等のデータ項目を含む。
この場合、図3(C)に示すように、データ項目「ユーザID」に対応するデータ項目情報は、データ形式が「数量」、データ種別が「ID」のように設定される。同様に、データ項目「購買商品ID」に対応するデータ項目情報は、データ形式が「カテゴリ」、データ種別が「目的変数」、データ内容は「キー情報」のように設定される。
【0052】
図4(A)に示す分析設定情報DB62には、分析設定情報テーブル77が格納される。分析設定情報テーブル77は、分析対象データの分析目的に応じた分析方法を定義する情報であり、「分析目的」、「目的カテゴリ」、「分析手法」が「分析対象データ」に関連付けて設定される。
分析設定情報テーブル77は、分析管理部3(または分析提供者端末7からネットワーク9を介し分析管理部3)において分析提供者により設定される。
【0053】
ここで、分析設定情報テーブル77の「目的カテゴリ」は、分析の目的に対し、カテゴリ分けしたものであり、その値として、以下の表4に示すように、「相関」、「予測」、「分類」等が格納される。
【0054】
【表4】
【0055】
「分析手法」には、分析に利用する手法が格納される。例えば、「アソシエーション分析」、「クラスタリング」、「デジジョンツリー」等といった各種分析手法を表す名称が格納される。
「分析対象データ」には、分析対象データ(実データ)のデータ名(カラム名)が格納される。例えば、キーとして「商品ID」、対象として「価格」、「性別」のように格納される。
【0056】
図4(B)は、図3(B)のログデータ73及び属性データ74を対象とする分析についての分析設定情報78の一例である。図4(B)に示すように、「分析目的」が「同時に買われているものを見つける」、「目的カテゴリ」が「相関」、「分析手法」が「アソシエーション分析」、「分析対象データ」が「キー:商品ID、対象:価格、性別」といった分析設定情報78が設定される。
【0057】
この分析設定情報78の設定には、分析の専門知識や経験が必要である。そのため、本実施の形態のデータ分析支援システム1では、分析設定情報78を設定する際に、参考データ(分析支援情報)を提示する。詳細については後述する。
【0058】
図5に示す分析支援情報DB63には、過去に提供された各分析についての分析支援情報79,80,・・・が格納される。分析支援情報79,80,・・・は、参照データ項目情報791,801,・・・、参照分析設定情報792,802,・・・を含む。
参照データ項目情報791,801,・・・は、図3のデータ項目情報テーブル71等として、分析データ情報DB61に格納されているものと同様のものであり、参照分析設定情報792,802,・・・は、図4の分析設定情報テーブル77等として、分析設定情報DB62に格納されているものと同様のものである。
【0059】
分析支援情報(参照データ項目情報テーブル71、及び参照分析設定情報77)は、分析管理部4において分析の設定等が行われる都度、或いは定期的に、分析支援部5によって分析支援情報DB63に登録される。
【0060】
次に、データ分析支援システム1において行われる分析支援に関する処理の流れについて、図6〜図14に沿って説明する。
【0061】
図6〜図9は、分析支援サーバ2及び分析提供者端末7を利用して実行される分析管理処理の流れを示すフローチャート、及び各段階における画面表示例である。
図10〜図14は、分析支援サーバ2及び分析利用者端末8を利用して実行されるデータ分析処理の流れを示すフローチャート、及び各段階における画面表示例である。
【0062】
まず、図6の分析管理処理の流れを説明する。
分析管理処理において、分析支援サーバ2の制御部10は、まず、ログデータ及び属性データの入力(インポート)を受け付ける(ステップS101)。ここで入力されるデータは実際の分析のサンプルとするデータである。
【0063】
ステップS101において、分析支援サーバ2の制御部10は、記憶部11から図7に示すデータインポート画面91に関するデータを読み出し、表示部19に表示する。或いは、データインポート画面91に関するデータをネットワーク9を介して分析提供者端末7に送信し、分析利用者端末7の表示部に表示させる。
【0064】
データインポート画面91において、分析提供者によりデータ名「Log1.csv」、「Attribute.csv」が指定され、「インポート」ボタンが押下されると、それらのデータが分析支援サーバ2に入力される。入力されたログデータ、属性データ等の実データは、支援情報データベース6の分析データ情報DB61に格納される。
【0065】
次に、分析支援サーバ2に制御部10は、入力されたログデータ及び属性データの各データ項目について、データ項目情報(データ形式、データ種別、データ内容)の設定を受け付ける(ステップS102)。
【0066】
ステップS102において、分析支援サーバ2の制御部10は、分析対象データ設定画面92に関する表示データを生成し、図8に示す分析対象データ設定画面92を表示部19に表示する。或いは、分析対象データ設定画面92に関する表示データをネットワーク9を介して分析提供者端末7に送信し、分析提供者端末7の表示部に表示させる。
【0067】
分析対象データ設定画面92には、ステップS101においてインポートされたログデータ及び属性データに含まれる各データ項目についての、データ形式、データ種別、データ内容をそれぞれ設定するための設定欄が設けられている。各設定欄には、設定可能な値がプルダウンメニュー925、926、927の形式で選択可能に示されるようにしてもよい。この場合、データ形式の設定欄におけるプルダウンメニュー925には、上述の表1に示す各項目(数量、カテゴリ)が含まれ、データ種別の設定欄におけるプルダウンメニュー926には、上述の表2に示す各項目(ID、目的変数、説明変数、時系列、属性、等)が含まれ、データ内容の設定欄におけるプルダウンメニュー927には、上述の表3に示す各項目(キー情報、目的付随情報、位置情報、時間情報、属性、等)が含まれる。
【0068】
ステップS102において、ログデータ及び属性データについてのデータ項目情報が設定されると、制御部10は設定されたデータ項目情報を支援情報データベース6の分析データ情報DB61に格納する。
例えば、図8に示すように、ログデータのデータ項目「ユーザID」は、データ形式が「数量」、データ種別が「ID」のように設定される。また、データ項目「商品ID」は、データ形式が「カテゴリ」、データ種別が「目的変数」、データ内容が「キー情報」のように設定される。同様に、属性データについてもデータ項目情報が設定される。
【0069】
データ項目情報の設定が完了すると、次に分析支援サーバ2の制御部10は、分析方法の設定(分析目的、目的カテゴリ、分析手法、対象データの選定)を受け付ける。このとき、他の分析を参照する指示が入力部17から入力されると(ステップS103;Yes)、制御部10は、図9に示す分析設定画面93に関する表示データを記憶部11から読み出し、表示部19に表示する。或いは、分析設定画面93に関する表示データをネットワーク9を介して分析提供者端末7に送信し、分析提供者端末7の表示部に表示させる。
【0070】
図9に示すように、分析設定画面93には、分析設定エリア931、参照エリア932、分析対象データ表示エリア933が設けられる。
【0071】
分析設定エリア931には、各設定項目(「分析目的」、「目的カテゴリ」、「分析手法」、「分析対象データ」)についての入力欄931a、931b、931c、931dが設けられている。「分析目的」の入力欄931aには、テキスト形式で入力可能であり、「目的カテゴリ」の入力欄931b、「分析手法」の入力欄931c、及び「分析対象データ」の入力欄931dには、それぞれプルダウン形式で値を選択入力できるようになっている。
【0072】
分析対象データ表示エリア933には、入力されたログデータ及び属性データ(分析対象データ)について、ステップS102において設定されたデータ項目情報が表示される。
【0073】
参照エリア932には、分析支援情報が表示される。ここで表示される分析支援情報は、次のステップS104以降の処理で抽出され、提示されるものである。
【0074】
ステップS104において、制御部10は支援情報DB6から、今回の分析設定に適した分析支援情報を抽出する。すなわち、支援情報データベース6の分析支援情報DB63に既に登録されている分析支援情報(参照データ項目情報または参照分析設定情報)の中から、今回の分析対象データのデータ項目情報または分析設定情報に一致または類似するものを抽出し、提示する(ステップS104、ステップS105)。
【0075】
ここで、類似の判断について説明する。
分析支援情報を抽出する際、制御部10は、例えば以下の<A>(1)〜(5)の優先順位で、登録されている分析支援情報と今回の分析との類似性を判定し、参照する分析支援情報を抽出するものとする。
【0076】
<A>分析対象データ(データ項目情報)のみが入力されている場合
(1)ログデータ及び属性データのデータ形式、データ種別、データ内容が同じ
(2)ログデータのデータ形式、データ種別、データ内容が同じ
(3)ログデータのデータ種別、データ内容が同じ
(4)ログデータのデータ内容が同じ
(5)ログデータのデータ種別が同じ
【0077】
また、分析支援情報を抽出する際、制御部10は、データ項目情報及び分析設定情報の一部(分析目的または目的カテゴリ)が入力されている場合は、これらの情報を参照して、登録されている分析支援情報から類似するものを抽出するようにしてもよい。
この場合は、例えば以下の<B>(1)〜(5)の優先順位で参照する分析支援情報を抽出するものとする。
【0078】
<B>分析対象データ(データ項目情報)及び分析設定情報の分析目的または目的カテゴリが入力されている場合
(1)ログデータ及び属性データのデータ形式、データ種別、データ内容が同じ
かつ、分析設定情報の分析目的、目的カテゴリが同じ
(2)ログデータのデータ形式、データ種別、データ内容が同じ
かつ、分析設定情報の目的カテゴリが同じ
(3)ログデータのデータ種別、データ内容が同じ
かつ、分析設定情報の目的カテゴリが同じ
(4)ログデータのデータ内容が同じ
かつ、分析設定情報の目的カテゴリが同じ
(5)ログデータのデータ種別が同じ
かつ、分析設定情報の目的カテゴリが同じ
【0079】
図9に示す分析設定画面93の例では、分析対象データ表示エリア933に表示されている分析対象データについて、分析支援情報が抽出される。なお、分析設定エリア931において、分析目的931aのみが入力され、目的カテゴリ931b、分析手法931c、分析対象データ931dについては、設定内容が確定していないものとする。
【0080】
制御部10は、分析対象データ表示エリア933のデータ項目情報(データ形式、データ種別、データ内容)の内容及び分析設定エリア931の分析目的「同時に買われているものを見つける」を検索キーとして、上述の優先順位<A>または<B>のいずれかに従って、分析支援情報DB63から参照する分析支援情報を抽出する。そして、抽出結果を参照エリア932に表示する。
【0081】
なお、図示しないが、分析データ表示エリア933に表示されるデータ項目情報と、参照エリア932に表示されるデータ項目情報とで、データ形式、データ種別、データ内容等が同一の部分は、それぞれ対応した色や対応した表示形式で表示されるようにしてもよい。
【0082】
また、複数の検索結果を得た場合は、類似度の高い分析支援情報のみを優先的に表示したり、図9に示すように、参照エリア932内に検索結果選択番号932aを表示し、選択番号に応じた検索結果(参照分析データ)を表示したりする。
【0083】
ここで、検索結果として、ログデータにデータ項目「ユーザID」、「購買商品ID」、「価格ID」を含み、属性データにデータ項目「性別cd」を含む参照データ項目情報932bが抽出されるとする(参照エリア932上段)。そして、この参照データ項目情報932bには、参照エリア932下段の参照分析設定情報932cが関連付けられているとする。
【0084】
分析提供者は、参照エリア932に提示された内容(特に、参照分析設定情報932cの「目的カテゴリ」、「分析手法」、「分析対象データ」)を参照しながら、分析設定エリア931の未設定の項目である目的カテゴリ931b、分析手法931c、分析対象データ931dを設定することが可能となる。
【0085】
以上のようにして、分析設定が行われると(ステップS106)、制御部10は、分析設定エリア931に設定された分析設定情報を、分析対象データのデータ項目情報と関連付けて、分析データ情報DB61、分析設定情報DB62に格納するとともに、分析支援情報DB63に分析支援情報として登録する(ステップS107)。
【0086】
なお、ステップS103において、他の分析を参照する指示が入力されない場合は(ステップS103;No)、ステップS104〜ステップS105の処理をスキップし、ステップS106へ移行する。この場合、分析設定画面93の参照エリア932には何も表示されず、分析設定エリア931の「分析目的」931a、「目的カテゴリ」931b、「分析手法」931c、「分析対象データ」931dには、分析提供者自らが判断して、所望の値を入力することとなる。
【0087】
以上のようにして、分析提供者による分析の設定、または分析支援情報の蓄積に関する一連の処理が終了する。
【0088】
次に、図10〜図12を参照してデータ分析処理の流れを説明する。
データ分析処理において、分析支援サーバ2の制御部10は、まず、ログデータ及び属性データの入力(インポート)、及び分析目的の入力を受け付ける(ステップS201、S202)。ここで入力するデータは実際に分析対象とするデータである。
【0089】
ステップS201、S202において、分析支援サーバ2の制御部10は、記憶部11から図11に示すような、入力画面95に関する表示データを読み出し、表示部19に表示する。或いは、入力画面95に関する表示データをネットワーク9を介して分析利用者端末8に送信し、分析利用者端末8の表示部に表示させる。
【0090】
入力画面95には、分析対象データ入力欄951、及び分析目的入力欄952が設けられる。入力画面95において、分析利用者により、例えばデータ名「Log1.csv」、「Attribute.csv」が指定され、また、分析の目的がプルダウンメニュー953から選択され、「分析実行」ボタン954が押下されると、それらのデータが分析支援サーバ2に入力される。
【0091】
次に、分析支援サーバ2の制御部10は、分析手法を決定する(ステップS203)。
ステップS203において、制御部10は、支援情報DB6からステップS201にて入力された分析対象データ及び分析の目的に適合した分析支援情報を抽出する。このとき、制御部10はステップS201において入力されたデータに含まれる各データ項目について、データ項目情報(データ形式、データ種別、データ内容)を決定し、決定されたデータ項目情報及び分析の目的に適合した分析支援情報を抽出する。
【0092】
分析支援情報の抽出は、図6のフローチャートのステップS104における処理と同様に行われる。ただし、本データ分析処理では、分析手法を決定するため、より優先順位の高い条件で、1件のみ分析支援情報を抽出すればよい。
【0093】
制御部10は、適切な分析支援情報を抽出すると、その分析支援情報に関連付けられている分析手法や選定される対象データを、入力された分析対象データについての分析手法、対象データとして設定する。
【0094】
その後、制御部10は、設定した分析手法に基づいて分析処理を行い(ステップS204)、分析結果を表示部19に表示したり、分析利用者端末8に送信して表示させたりする(ステップS205)。
図12に分析結果表示画面96の一例を示す。
【0095】
以上説明した一連のデータ分析処理によって、分析利用者は、分析対象とするログデータ及び属性データを入力し、分析目的を選択するという操作を行えば、分析支援サーバ2によって目的に最も適合した分析手法で分析が行われ、その分析結果が表示されるため、分析結果を簡単に閲覧できる。
【0096】
以上説明したように、本実施の形態のデータ分析支援システム1では、分析支援サーバ2は、分析提供者によって入力された分析対象データのデータ項目情報(データ形式、データ種別、データ内容等のデータ項目の属性を定義するもの)や分析設定情報(分析の目的、目的カテゴリ、分析手法、対象データ等の分析の方法を定義するもの)を分析支援情報として支援情報DB6に登録しておく。新たな分析対象データについて新たな分析設定を行う際は、分析支援サーバ2の制御部10は、支援情報データベース6に登録されている過去の設定情報(分析支援情報DB63)の中から、類似する設定情報(参照データ項目情報または参照分析設定情報)を抽出して分析支援情報として提示する。
【0097】
そのため、分析提供者は、分析支援情報を参照しながら、分析の手法等を設定できる。よって、分析の専門知識がない者でも容易に分析の設定を行うことが可能となり、初心者でも簡単に分析の設定を行うことが可能となる。
【0098】
また、複数の分析支援情報が抽出された場合には、類似度の高いものから優先的に提示するようにしたり、いくつかを選択可能に参照したりしているため、分析提供者にとって、より使用しやすい実用的なデータ分析支援システム等を提供できる。
また、分析支援サーバ2は、分析支援情報を提示する際、同一の表示画面内に分析設定を行うエリア(分析設定エリア931)と参照エリア932とを設けた表示画面を生成しているため、分析支援情報を参照しながら分析設定を行い易く、より使用しやすいデータ分析支援システム等を提供できる。
【0099】
更に、データ分析支援システム1では、分析利用者から分析対象データやその目的が入力されると、分析支援サーバ2の制御部10は、支援情報DB6に登録されている過去の設定情報(分析データ)の中から、最も類似する分析データ(参照項目情報または参照分析設定情報)を抽出し、この分析データに関連付けられている分析手法を用いて分析処理を実行し、分析結果を閲覧可能に提示する。
【0100】
そのため、分析利用者は、非常に簡易な操作で分析の結果を得ることが可能となる。
【0101】
更に、本データ分析支援システム1では、分析支援情報を抽出する際、検索対象をデータ項目情報(データ形式、データ種別、データ内容)または分析設定情報(分析目的、目的カテゴリ)としているため、他の分析提供者及び分析利用者に関する情報(個人情報)を一切用いる必要がない。そのため、本データ分析支援システム1では、過去において他人が行った分析を参照するにも関わらず、他の分析提供者及び分析利用者の個人情報が漏れる恐れがないという、副次的な効果を得ることができる。
【0102】
以下、本実施の形態のデータ分析支援システム1を利用したデータ分析支援の具体的な実施例について説明する。
【実施例1】
【0103】
図13は、分析支援サーバ2にて行われる分析設定の一例である。
(1)今回実施しようとする分析は、「金融(銀行等)の利用サービス状況の情報を使った分析」である。
(2)分析支援情報DBには類似する分析支援情報として「POS情報システムの分析データ」が登録されている。
【0104】
図13において、(A)は分析対象データを示し、(B)は分析管理処理によって抽出された分析支援情報を示し、(C)は今回設定する分析設定情報を示す。
【0105】
すなわち、図6に示す分析管理処理のステップS101〜S102において、図13(A)に示すように分析対象データのデータ項目情報が設定される。また、ステップS103において「他の分析を参照する」が選択されると、分析支援サーバ2の制御部は、設定されたデータ項目情報と類似するデータ項目情報を有する分析支援情報を抽出し、図13(B)に示すように提示する。
【0106】
図13(A)及び(B)のデータ項目情報を比較すると、図13(A)のログデータの「ユーザID」、「利用サービス」、「預金額」は、それぞれ図13(B)の「ユーザID」、「購買商品ID」、「価格」に対応し、それぞれデータ形式、データ種別、データ内容が一致している。また、図13(A)の属性データの「性別cd」は図13(B)の「性別cd」に対応し、データ形式、データ種別、データ内容が一致している。したがって、上述の優先順位<A>(1)「ログデータ及び属性データのデータ形式、データ種別、データ内容が同じ」に従って、類似するデータ項目情報を有する分析支援情報が抽出されたといえる。
【0107】
更に、図6のステップS105によって、このデータ項目情報に関連付けられた参照分析設定情報を分析支援情報DB63から抽出し、図13(B)に示すように提示する。図13(B)に示す分析設定情報は、「分析目的」が「同時に買われているものを見つける」であり、「目的カテゴリ」が「相関」であり、「分析手法」が「アソシエーション分析」であり、「分析対象データ」が「キー:商品ID、対象:価格、性別」である。
【0108】
分析提供者は、図13(B)に提示された分析支援情報(分析設定情報)を参照しながら、今回の分析設定情報についての設定を行うことが可能となる。具体的には、図13(C)に示すように「分析目的」を「同時に利用されているサービスを見つける」とし、「目的カテゴリ」を「相関」とし、「分析手法」を「アソシエーション分析」とし、「分析対象データ」を「キー:利用サービス、対象:預金額、年齢」として、図13(B)の分析支援情報の内容をほぼ踏襲しながら、今回の目的に合うような内容に設定できる。
【0109】
上述の実施例1で着目すべき点は、ログデータや属性データに含まれるデータ項目(カラム名)が、今回の分析対象データと過去の分析対象データとで異なるものであっても、データ項目情報(データ形式、データ種別、データ内容)が一致(類似)するものが優先的に抽出されている点である。すなわち、ログデータ等に含まれるカラム名に依存せずに、異なる分野(金融と購買商品POSデータ等)のデータ分析の設定内容を参照することが可能となる。
【実施例2】
【0110】
本実施の形態のデータ分析支援システム1を利用した別の具体例について説明する。
図14は、分析支援サーバ2にて行われる分析設定の他の例である。
(1)今回実施しようとする分析は、「医療に関する併発しやすい病気・症状の情報を使った分析」である。
(2)分析支援情報DBには類似する分析支援情報として「POS情報システムの分析データ」が登録されている。上述の実施例1にて参照されるものと同じものである。
【0111】
図14において、(A)は分析対象データを示し、(B)は分析管理処理によって抽出された分析支援情報を示し、(C)は今回設定する分析設定情報を示す。
【0112】
すなわち、図6に示す分析管理処理のステップS101〜S102において、図14(A)に示すように分析対象データのデータ項目情報が設定される。また、ステップS103において「他の分析を参照する」が選択されると、分析支援サーバ2の制御部10は、設定されたデータ項目情報と類似するデータ項目情報を有する分析支援情報を抽出し、図14(B)に示すように提示する。
【0113】
図14(A)及び(B)のデータ項目情報を比較すると、図14(A)のログデータの「ユーザID」、「病気・症状」は、それぞれ図14(B)の「ユーザID」、「購買商品ID」、に対応し、それぞれデータ形式、データ種別、データ内容が一致している。また、図14(A)のログデータの「地域」については、図14(B)の「価格」と、データ種別及びデータ内容が一致している。また、図14(A)の属性データの「性別cd」は図14(B)の「性別cd」に対応し、データ形式、データ種別、データ内容が一致している。したがって、上述の優先順位<A>(3)「ログデータのデータ種別、データ内容が同じ」に従って、類似するデータ項目情報を有する分析支援情報が抽出されたといえる。
【0114】
更に、図6のステップS105によって、このデータ項目情報に関連付けられた参照分析設定情報を分析支援情報DB63から抽出し、図14(B)に示すように提示する。図14(B)に示す分析設定情報は、「分析目的」が「同時に買われているものを見つける」であり、「目的カテゴリ」が「相関」であり、「分析手法」が「アソシエーション分析」であり、「分析対象データ」が「キー:商品ID、対象:価格、性別」である。
【0115】
分析提供者は、図14(B)に提示された分析支援情報(分析設定情報)を参照しながら、今回の分析設定情報についての設定を行うことが可能となる。具体的には、図14(C)に示すように「分析目的」を「併発しやすい病気、症状を探す」とし、「目的カテゴリ」を「相関」とし、「分析手法」を「アソシエーション分析」とし、「分析対象データ」を「キー:病気・症状、対象:地域、年齢、性別」として、図14(B)の分析支援情報の内容をほぼ踏襲しながら、今回の目的に合うような内容に設定できる。
【0116】
上述の実施例2も、実施例1と同様に、ログデータや属性データに含まれるデータ項目(カラム名)が、今回の分析対象データと過去の分析対象データとで異なるものであっても、データ項目情報(データ形式、データ種別、データ内容)が類似するものが優先的に抽出される。
【0117】
なお、上述の実施の形態では、システム構成例として、図1に示すように、(a)分析管理システム20及びデータ分析システム30の双方を、分析支援サーバ2にて連携したデータ分析支援システム1を説明したが、これに限定されるものではない。
例えば、システムの態様として、(b)分析管理システム20と分析支援サーバ2とを連携したデータ分析支援システム、或いは(c)データ分析システム30と分析支援サーバ2と連携したデータ分析支援システムとしてもよい。
【0118】
また、分析支援サーバ2は、分析管理システム20の分析提供者端末7やデータ分析システム30の分析利用者端末8と、ネットワーク9を介した通信接続を行わずに、分析支援装置としてローカルな処理を実行するようにしてもよい。
この場合も、(d)分析支援装置(分析支援サーバ2)にて分析管理処理のみを行うもの、(e)分析支援装置(分析支援サーバ2)にてデータ分析処理のみを行うもの、(f)分析支援装置(分析支援サーバ2)にて分析管理処理及びデータ分析処理の双方を行うもの、のいずれの態様をとるようにしてもよい。
【0119】
その他、当業者であれば、本願で開示した技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。
【符号の説明】
【0120】
1・・・データ分析支援システム
2・・・分析支援サーバ
3・・・分析管理部
4・・・分析処理部
5・・・分析支援部
6・・・支援情報データベース
61・・・分析データ情報DB
62・・・分析設定情報DB
63・・・分析支援情報DB
7・・・分析提供者端末
8・・・分析利用者端末
9・・・ネットワーク
【技術分野】
【0001】
本発明は、データ分析を支援するデータ分析支援装置等に関する。
【背景技術】
【0002】
近年、情報技術の発達やインターネットの普及に伴い、情報源が多様化し、大量の情報が蓄積されている。また、これらの情報を分析するため、コンピュータ等を用いた種々の分析方法が提案されている。
一般に、データ分析の流れとしては、(1)分析対象とするデータの収集及び選定、(2)分析方法の選択、(3)選択された方法に基づく分析、(4)分析結果の閲覧、アクション検討といった手順でなされている。
【0003】
しかしながら、分析の対象データには、多くの情報が含まれるため、それらの中から分析に利用するデータを選別(上述の手順(1))することは難しいという問題があった。
また、分析は専門性が高い分野であり、専門の知識や経験がなければ、目的に適合した分析方法を選択(上述の手順(2))することも、難しいという問題があった。
【0004】
一方、従来の分析ツールでは、各操作のアイコン化による視覚化等、操作性に優れたツールが提供されたり、特許文献1のように、過去の分析履歴に基づいて、複数の分析を組み合わせた複合分析を行うデータ分析システム等が提供されたりしている。
特許文献1のデータ分析システムでは、分析手法(順位分析、推移分析、分布分析、相関分析等)の組み合わせパターンの履歴情報や、また推奨する分析パターンの情報を蓄積しておき、分析のためのガイド画面を表示して、ユーザに各種設定を促すことにより、過去の複合分析のパターンを継承して分析を行っている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2005−157896号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、特許文献1のデータ分析システムは、複数種の分析手法を組み合わせた複合分析を行う場合に有用であるが、複合分析でない分析について支援するものではなかった。
【0007】
本発明は、このような課題に鑑みてなされたもので、その目的とするところは、分析の専門知識や経験がなくても、目的とする分析を簡単にコンピュータ等の分析処理装置に行わせることが可能なデータ分析支援装置等を提供することである。
【課題を解決するための手段】
【0008】
前述した課題を解決するため第1の発明は、データ分析の支援に用いるデータを蓄積する支援情報データベースを備えたデータ分析支援装置であって、分析対象データに含まれる各データ項目について、データ項目そのものの属性を定義する項目情報の設定を受け付ける項目情報設定手段と、前記分析対象データの分析目的に応じた分析方法を定義する分析設定情報の設定を受け付ける分析設定手段と、前記項目情報及び前記分析設定情報を、分析支援情報として前記支援情報データベースに登録する分析支援情報登録手段と、新規に入力された分析対象データについて設定された項目情報または分析設定情報と、一致または類似する項目情報または分析設定情報を有する分析支援情報を、前記支援情報データベースから抽出し、提示する分析支援情報提示手段と、を備えることを特徴とするデータ分析支援装置である。
【0009】
第2の発明は、データ分析の支援に用いるデータを蓄積する支援情報データベースを備えたデータ分析支援装置であって、前記支援情報データベースには、過去に行った分析における分析対象データに含まれる各データ項目そのものの属性を定義する項目情報と、前記分析対象データの分析目的に応じた分析方法を定義する分析設定情報とが、分析支援情報として予め登録されており、新たに行う分析について、分析対象データ及び分析目的を入力する入力手段と、前記入力手段により入力された分析対象データ及び分析目的に適合した分析支援情報を前記支援情報データベースから抽出する抽出手段と、前記抽出手段によって抽出した分析支援情報に設定されている分析設定情報に基づいて、前記入力手段により入力された分析対象データについての分析処理を実行し、分析結果を閲覧可能に表示する表示手段と、を備えることを特徴とするデータ分析支援装置である。
【0010】
第3の発明は、データ分析の支援に用いるデータを蓄積する支援情報データベースを備えたデータ分析支援装置であって、分析対象データに含まれる各データ項目について、データ項目そのものの属性を定義する項目情報の設定を受け付ける項目情報設定手段と、前記分析対象データの分析目的に応じた分析方法を定義する分析設定情報の設定を受け付ける分析設定手段と、前記項目情報及び前記分析設定情報を、分析支援情報として前記支援情報データベースに登録する分析支援情報登録手段と、新規に入力された分析対象データについて設定された項目情報または分析設定情報と、一致または類似する項目情報または分析設定情報を有する分析支援情報を、前記支援情報データベースから抽出し、提示する分析支援情報提示手段と、前記分析支援情報提示手段によって提示された分析支援情報に設定されている分析設定情報に基づいて、前記新規に入力された分析対象データについての分析処理を実行し、分析結果を閲覧可能に表示する表示手段と、を備えることを特徴とするデータ分析支援装置である。
【0011】
上述の第1または第3の発明において、前記分析支援情報提示手段は、前記分析支援情報について複数の抽出結果を得た場合は、類似度の高い分析支援情報を優先的に提示することが望ましい。
【0012】
また、上述の第1または第3の発明において、前記分析支援情報提示手段は、抽出された分析支援情報を、分析設定情報の設定画面内に、並べて表示することが望ましい。
【0013】
また、上述の第1、第2、または第3の発明において、前記項目情報は、各データ項目の属性として、データ形式、データ種別、及びデータ内容を定義するものであることが望ましい。
【0014】
また、上述の第1、第2、または第3の発明において、前記分析設定情報は、少なくとも分析の目的、目的カテゴリ、分析手法、及び分析対象データを定義するものであることが望ましい。
【0015】
第4の発明は、分析提供者が利用する分析管理システムと連携し、データ分析の支援に用いるデータを蓄積する支援情報データベースを備えたデータ分析支援システムであって、前記分析管理システムは、分析対象データに含まれる各データ項目について、データ項目そのものの属性を定義する項目情報の設定を受け付ける項目情報設定手段と、前記分析対象データの分析目的に応じた分析方法を定義する分析設定情報の設定を受け付ける分析設定手段と、前記項目情報及び前記分析設定情報を、分析支援情報として前記支援情報データベースに登録する分析支援情報登録手段と、新規に入力された分析対象データについての分析支援情報を提示するよう要求する提示要求手段と、を備え、当該データ分析支援システムは、前記分析管理システムからの要求に応じて、前記新規に入力された分析対象データについて、設定された項目情報または分析設定情報と、一致または類似する項目情報または分析設定情報を有する分析支援情報を、前記支援情報データベースから抽出し、前記分析管理システムに提示する第1の分析支援情報提示手段を備えることを特徴とするデータ分析支援システムである。
【0016】
第5の発明は、分析利用者が利用する分析処理システムと連携し、データ分析の支援に用いるデータを蓄積する支援情報データベースを備えたデータ分析支援システムであって、前記支援情報データベースには、過去に行った分析における分析対象データに含まれる各データ項目そのものの属性を定義する項目情報と、前記分析対象データの分析目的に応じた分析方法を定義する分析設定情報とが、分析支援情報として予め登録されており、前記分析処理システムは、分析対象データ及び分析目的を入力する入力手段と、前記入力手段により入力された分析対象データ及び分析目的に適合した分析支援情報を抽出するよう当該データ分析支援システムに対して要求する抽出要求手段と、を備え、当該データ分析支援システムは、前記分析処理システムからの要求に応じて、前記入力手段により入力された分析対象データ及び分析目的に適合した分析支援情報を前記支援情報データベースから抽出して、前記分析処理システムに提示する第2の分析支援情報提示手段を備え、前記分析処理システムは、更に、前記第2の分析支援情報提示手段によって提示された分析支援情報に設定されている分析設定情報に基づいて、前記入力手段により入力された分析対象データについての分析処理を実行し、分析結果を閲覧可能に表示する表示手段を備えることを特徴とするデータ分析支援システムである。
【0017】
第6の発明は、分析提供者が利用する分析管理システムと、分析利用者が利用する分析処理システムと、を連携し、データ分析の支援に用いるデータを蓄積する支援情報データベースを備えたデータ分析支援システムであって、前記分析管理システムは、分析対象データに含まれる各データ項目について、データ項目そのものの属性を定義する項目情報の設定を受け付ける項目情報設定手段と、前記分析対象データの分析目的に応じた分析方法を定義する分析設定情報の設定を受け付ける分析設定手段と、前記項目情報及び前記分析設定情報を、分析支援情報として前記支援情報データベースに登録する分析支援情報登録手段と、新規に入力された分析対象データについての分析支援情報を提示するよう要求する提示要求手段と、を備え、前記分析処理システムは、新たに行う分析について、分析対象データ及び分析目的を入力する入力手段と、前記入力手段により入力された分析対象データ及び分析目的に適合した分析設定情報を抽出するよう当該データ分析支援システムに対して要求する抽出要求手段と、を備え、当該データ分析支援システムは、前記分析管理システムからの要求に応じて、新規に入力された分析対象データについて設定された項目情報または分析設定情報と、一致または類似する項目情報または分析設定情報を有する分析支援情報を、前記支援情報データベースから抽出し、前記分析管理システムに提示する第1の分析支援情報提示手段と、前記分析処理システムからの要求に応じて、前記入力手段により入力された分析対象データ及び分析目的に適合した分析支援情報を前記支援情報データベースから抽出して、前記分析処理システムに提示する第2の分析支援情報提示手段と、を備え、前記分析処理システムは、更に、前記第2の分析支援情報提示手段によって提示された分析支援情報に設定されている分析設定情報に基づいて、前記入力手段により入力された分析対象データについての分析処理を実行し、分析結果を閲覧可能に表示する表示手段を備えることを特徴とするデータ分析支援システムである。
【0018】
第7の発明は、分析対象データに含まれる各データ項目について、データ項目そのものの属性を定義する項目情報の設定を受け付ける項目情報設定ステップと、前記分析対象データの分析目的に応じた分析方法を定義する分析設定情報の設定を受け付ける分析設定ステップと、設定された項目情報及び分析設定情報を、分析支援情報として支援情報データベースに登録する分析支援情報登録ステップと、新規に入力された分析対象データについて、前記項目情報または前記分析設定情報と、一致または類似する項目情報または分析設定情報を有する分析支援情報を、前記支援情報データベースから抽出し、提示する分析支援情報提示ステップと、を含むことを特徴とするデータ分析支援方法である。
【0019】
第8の発明は、過去に行った分析における分析対象データについて、分析対象データに含まれる各データ項目そのものの属性を定義する項目情報と、前記分析対象データの分析目的に応じた分析方法を定義する分析設定情報とが、分析支援情報として予め登録された支援情報データベースを利用したデータ分析支援方法であって、新たに行う分析について、分析対象データ及び分析目的を入力する入力ステップと、入力された分析対象データ及び分析目的に適合した分析支援情報を前記支援情報データベースから抽出する抽出ステップと、抽出した分析支援情報に設定されている分析設定情報に基づいて、前記入力された分析対象データについての分析処理を実行し、分析結果を閲覧可能に表示する表示ステップと、を含むことを特徴とするデータ分析支援方法である
【0020】
第9の発明は、分析対象データに含まれる各データ項目について、データ項目そのものの属性を定義する項目情報の設定を受け付ける項目情報設定ステップと、前記分析対象データの分析目的に応じた分析方法を定義する分析設定情報の設定を受け付ける分析設定ステップと、設定された項目情報及び分析設定情報を、分析支援情報として支援情報データベースに登録する分析支援情報登録ステップと、新規に入力された分析対象データについて設定された項目情報または分析設定情報と、一致または類似する項目情報または分析設定情報を有する分析支援情報を、前記支援情報データベースから抽出し、提示する分析支援情報提示ステップと、提示された分析支援情報に設定されている分析設定情報に基づいて、前記新規に入力された分析対象データについての分析処理を実行し、分析結果を閲覧可能に表示する表示ステップと、を含むことを特徴とするデータ分析支援方法である。
【0021】
第10の発明は、コンピュータを第1の発明に記載のデータ分析支援装置として機能させるためのプログラムである。
第11の発明は、コンピュータを第2の発明に記載のデータ分析支援装置として機能させるためのプログラムである。
第12の発明は、コンピュータを第3の発明に記載のデータ分析支援装置として機能させるためのプログラムである。
【発明の効果】
【0022】
本発明によれば、分析の専門知識や経験がなくても、目的とする分析を簡単にコンピュータ等の分析処理装置に行わせることが可能なデータ分析支援装置等を提供できる。
【図面の簡単な説明】
【0023】
【図1】データ分析支援システム1のシステム構成例
【図2】分析支援サーバ2のハードウエア構成例
【図3】分析データ情報DB61について説明する図
【図4】分析設定情報DB62について説明する図
【図5】分析支援情報DB63について説明する図
【図6】分析支援サーバ2が実行する分析管理処理の流れを示すフローチャート
【図7】分析管理システム20側で利用されるデータインポート画面91の表示例
【図8】分析対象データ設定画面92の表示例
【図9】分析設定画面93の表示例
【図10】分析支援サーバ2が実行するデータ分析処理の流れを示すフローチャート
【図11】分析処理システム30側で利用される分析処理初期画面95の表示例
【図12】分析結果表示画面96の表示例
【図13】データ分析支援システム1を用いた分析設定例(実施例1)
【図14】データ分析支援システム1を用いた分析設定例(実施例2)
【発明を実施するための形態】
【0024】
以下、図面に基づいて本発明の好適な実施形態について詳細に説明する。
図1は、本発明に係るデータ分析支援システム1のシステム構成を示す図である。
【0025】
図1に示すように、データ分析支援システム1は、分析支援サーバ2、分析提供者が利用する分析提供者端末7,7,・・・、及び分析利用者が利用する分析利用者端末8,8,・・・によって構成され、各装置はネットワーク9を介して互いに通信接続される。
【0026】
分析支援サーバ2は、分析管理システム20のサーバとして機能する分析管理部3と、分析処理システム30のサーバとして機能する分析処理部4と、これら分析管理システム20及び分析処理システム30とを連携し、分析支援を行なう分析支援部5と、分析支援に関する情報を蓄積する支援情報データベース(DB)6と、を有する。
【0027】
分析管理システム20は、図1に示すように、分析支援サーバ2の分析管理部3、分析提供者端末7,7,・・・、及びネットワーク9により構成されており、分析提供者が、分析方法、分析ポイント、アクションポイント等を設定するために用いるものである。ここで分析提供者とは、分析サービスや分析に関するシステム等を利用者等に対して提供する者をいう。
【0028】
分析処理システム30は、図1に示すように、分析支援サーバ2の分析処理部4、分析利用者端末8,8,・・・、及びネットワーク9により構成されており、所望の分析を行いたい分析利用者が、分析に使用するデータ(ログ、属性データ等)をインポートしたり、分析結果の閲覧等を行うために利用するものである。ここで分析利用者とは、分析結果を得るために分析に関するシステム等を利用する者をいう。
【0029】
分析支援サーバ2の分析支援部5は、分析管理部3及び分析処理部4を連携し、分析提供者及び分析利用者にとって有用な支援を行うものである。
【0030】
具体的には、分析支援部5は、後述する分析管理処理(図6参照)を実行する。分析管理処理において、分析支援部5は、分析管理部3にて設定される分析対象データの項目情報や分析設定情報等を分析支援情報として支援情報データベース6に蓄積する。また分析支援部5は、分析管理部3にて設定された分析対象データの項目情報に応じて、支援情報データベース6から適切な分析支援情報を抽出し、参照データとして提示する。
【0031】
また、分析支援部5は、後述するデータ分析処理(図7参照)を実行する。データ分析処理において、分析支援部5は、分析処理部4に入力される分析対象データ及びその分析目的に応じた分析手法として適当なものを、支援情報データベース6に蓄積された分析支援情報の中から抽出し、抽出した分析手法を分析処理部4に提示する。分析処理部4では、提示された分析手法に基づいてデータ分析を実行し、分析結果を閲覧可能に表示する。
【0032】
支援情報データベース6は、分析データ情報DB(データベース)61、分析設定情報DB62、及び分析支援情報DB63を有する。分析データ情報DB61、分析設定情報DB62、及び分析支援情報DB63に格納される各データの具体的な内容については後述する(図3、図4、図5参照)。
【0033】
なお、以下の説明において、「データベース」は「DB」、「テーブル」は「TB」のように省略して記載することもある。
【0034】
次に、図2を参照して、分析支援サーバ2のハードウエア構成を説明する。
分析支援サーバ2は、図2に示すように、制御部10、記憶部11、メディア入出力部13、通信部15、入力部17、表示部19、周辺機器I/F部21等がバス23を介して接続されて構成される。
【0035】
制御部10は、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Accsess Memory)等により構成される。
CPUは、記憶部11、ROM、記録媒体等に格納されるプログラムをRAM上のワークメモリ領域に呼び出して実行し、バス23を介して接続された各部を駆動制御する。制御部10のCPUは後述する分析管理処理(図6参照)、データ分析処理(図10参照)を実行する。
また、制御部10は、図1の分析管理部3、分析処理部4、及び分析支援部5として機能する。
【0036】
ROMは、コンピュータのブートプログラムやBIOS等のプログラム、データ等を恒久的に保持する。RAMは、ロードしたプログラムやデータを一時的に保持するとともに、制御部10が各種処理を行うために使用するワークエリアを備える。
【0037】
記憶部11は、HDD(ハードディスクドライブ)であり、制御部10が実行するプログラムや、プログラム実行に必要なデータ、OS(オペレーティング・システム)等が格納されている。これらのプログラムコードは、制御部10により必要に応じて読み出されてRAMに移され、CPUに読み出されて実行される。
また、記憶部11は、図1に示す支援情報データベース6としても機能し、分析データ情報DB61、分析設定情報DB62、及び分析支援情報DB63等を記憶する。
【0038】
メディア入出力部13(ドライブ装置)は、例えば、フロッピー(登録商標)ディスクドライブ、PDドライブ、CDドライブ、DVDドライブ、MOドライブ等のメディア入出力装置であり、データの入出力を行う。
通信部15は、通信制御装置、通信ポート等を有し、ネットワーク9との通信を媒介する通信インタフェースであり、通信制御を行う。
【0039】
入力部17は、例えば、キーボード、マウス等のポインティング・デバイス、テンキー等の入力装置であり、入力されたデータを制御部10へ出力する。
表示部19は、例えば液晶パネル、CRTモニタ等のディスプレイ装置と、ディスプレイ装置と連携して表示処理を実行するための論理回路(ビデオアダプタ等)で構成され、制御部10の制御により入力された表示情報をディスプレイ装置上に表示させる。
【0040】
次に、データ分析支援システム1で扱われるデータの構成について図3〜図5を用いて説明する。
【0041】
図3(A)に示す分析データ情報DB61には、分析の対象とするデータ(以下、分析対象データという)に含まれる各データ項目についての属性を定義する情報(以下、データ項目情報という)を設定したデータ項目情報テーブル71と、分析対象データの実データテーブル72と、が格納される。
【0042】
ここで、データ項目情報テーブル71は、上述のように、分析対象データに含まれる各データ項目についての属性を定義する情報であり、「データ形式」、「データ種別」、及び「データ内容」によって表される。データ項目情報テーブル71は、分析管理部3(または分析提供者端末7からネットワーク9を介し分析管理部3)において分析提供者により設定される。
【0043】
「データ形式」は、データの形式に関する情報であり、その値は、以下の表1に示すように、「数量」または「カテゴリ」である。
【0044】
【表1】
【0045】
「データ種別」は、データの種別を表すものであり、その値は、以下の表2に示すように、「ID」、「目的変数」、「説明変数」、「時系列」、「属性」等である。
【0046】
【表2】
【0047】
「データ内容」は、データの意味を表すものであり、その値は、以下の表3に示すように、「キー情報」、「目的付随情報」、「位置情報」、「時間情報」、「属性」、等である。
【0048】
【表3】
【0049】
実データテーブル72は、インポートされたデータのカラム名(データ項目名)と、その実データ(データ)とを格納したものである。
【0050】
例えば、図3(B)に示すログデータ73及び属性データ74が分析対象データとしてインポートされた場合、図3(C)に示すようなデータ項目情報テーブル76が分析提供者によって設定されるものとする。
【0051】
図3(B)のログデータは「ユーザID」、「購買商品ID」、「店舗ID」、「価格」、「個数」等のデータ項目を含み、属性データは「ユーザID」、「性別cd(コード)」、「地域cd(コード)」等のデータ項目を含む。
この場合、図3(C)に示すように、データ項目「ユーザID」に対応するデータ項目情報は、データ形式が「数量」、データ種別が「ID」のように設定される。同様に、データ項目「購買商品ID」に対応するデータ項目情報は、データ形式が「カテゴリ」、データ種別が「目的変数」、データ内容は「キー情報」のように設定される。
【0052】
図4(A)に示す分析設定情報DB62には、分析設定情報テーブル77が格納される。分析設定情報テーブル77は、分析対象データの分析目的に応じた分析方法を定義する情報であり、「分析目的」、「目的カテゴリ」、「分析手法」が「分析対象データ」に関連付けて設定される。
分析設定情報テーブル77は、分析管理部3(または分析提供者端末7からネットワーク9を介し分析管理部3)において分析提供者により設定される。
【0053】
ここで、分析設定情報テーブル77の「目的カテゴリ」は、分析の目的に対し、カテゴリ分けしたものであり、その値として、以下の表4に示すように、「相関」、「予測」、「分類」等が格納される。
【0054】
【表4】
【0055】
「分析手法」には、分析に利用する手法が格納される。例えば、「アソシエーション分析」、「クラスタリング」、「デジジョンツリー」等といった各種分析手法を表す名称が格納される。
「分析対象データ」には、分析対象データ(実データ)のデータ名(カラム名)が格納される。例えば、キーとして「商品ID」、対象として「価格」、「性別」のように格納される。
【0056】
図4(B)は、図3(B)のログデータ73及び属性データ74を対象とする分析についての分析設定情報78の一例である。図4(B)に示すように、「分析目的」が「同時に買われているものを見つける」、「目的カテゴリ」が「相関」、「分析手法」が「アソシエーション分析」、「分析対象データ」が「キー:商品ID、対象:価格、性別」といった分析設定情報78が設定される。
【0057】
この分析設定情報78の設定には、分析の専門知識や経験が必要である。そのため、本実施の形態のデータ分析支援システム1では、分析設定情報78を設定する際に、参考データ(分析支援情報)を提示する。詳細については後述する。
【0058】
図5に示す分析支援情報DB63には、過去に提供された各分析についての分析支援情報79,80,・・・が格納される。分析支援情報79,80,・・・は、参照データ項目情報791,801,・・・、参照分析設定情報792,802,・・・を含む。
参照データ項目情報791,801,・・・は、図3のデータ項目情報テーブル71等として、分析データ情報DB61に格納されているものと同様のものであり、参照分析設定情報792,802,・・・は、図4の分析設定情報テーブル77等として、分析設定情報DB62に格納されているものと同様のものである。
【0059】
分析支援情報(参照データ項目情報テーブル71、及び参照分析設定情報77)は、分析管理部4において分析の設定等が行われる都度、或いは定期的に、分析支援部5によって分析支援情報DB63に登録される。
【0060】
次に、データ分析支援システム1において行われる分析支援に関する処理の流れについて、図6〜図14に沿って説明する。
【0061】
図6〜図9は、分析支援サーバ2及び分析提供者端末7を利用して実行される分析管理処理の流れを示すフローチャート、及び各段階における画面表示例である。
図10〜図14は、分析支援サーバ2及び分析利用者端末8を利用して実行されるデータ分析処理の流れを示すフローチャート、及び各段階における画面表示例である。
【0062】
まず、図6の分析管理処理の流れを説明する。
分析管理処理において、分析支援サーバ2の制御部10は、まず、ログデータ及び属性データの入力(インポート)を受け付ける(ステップS101)。ここで入力されるデータは実際の分析のサンプルとするデータである。
【0063】
ステップS101において、分析支援サーバ2の制御部10は、記憶部11から図7に示すデータインポート画面91に関するデータを読み出し、表示部19に表示する。或いは、データインポート画面91に関するデータをネットワーク9を介して分析提供者端末7に送信し、分析利用者端末7の表示部に表示させる。
【0064】
データインポート画面91において、分析提供者によりデータ名「Log1.csv」、「Attribute.csv」が指定され、「インポート」ボタンが押下されると、それらのデータが分析支援サーバ2に入力される。入力されたログデータ、属性データ等の実データは、支援情報データベース6の分析データ情報DB61に格納される。
【0065】
次に、分析支援サーバ2に制御部10は、入力されたログデータ及び属性データの各データ項目について、データ項目情報(データ形式、データ種別、データ内容)の設定を受け付ける(ステップS102)。
【0066】
ステップS102において、分析支援サーバ2の制御部10は、分析対象データ設定画面92に関する表示データを生成し、図8に示す分析対象データ設定画面92を表示部19に表示する。或いは、分析対象データ設定画面92に関する表示データをネットワーク9を介して分析提供者端末7に送信し、分析提供者端末7の表示部に表示させる。
【0067】
分析対象データ設定画面92には、ステップS101においてインポートされたログデータ及び属性データに含まれる各データ項目についての、データ形式、データ種別、データ内容をそれぞれ設定するための設定欄が設けられている。各設定欄には、設定可能な値がプルダウンメニュー925、926、927の形式で選択可能に示されるようにしてもよい。この場合、データ形式の設定欄におけるプルダウンメニュー925には、上述の表1に示す各項目(数量、カテゴリ)が含まれ、データ種別の設定欄におけるプルダウンメニュー926には、上述の表2に示す各項目(ID、目的変数、説明変数、時系列、属性、等)が含まれ、データ内容の設定欄におけるプルダウンメニュー927には、上述の表3に示す各項目(キー情報、目的付随情報、位置情報、時間情報、属性、等)が含まれる。
【0068】
ステップS102において、ログデータ及び属性データについてのデータ項目情報が設定されると、制御部10は設定されたデータ項目情報を支援情報データベース6の分析データ情報DB61に格納する。
例えば、図8に示すように、ログデータのデータ項目「ユーザID」は、データ形式が「数量」、データ種別が「ID」のように設定される。また、データ項目「商品ID」は、データ形式が「カテゴリ」、データ種別が「目的変数」、データ内容が「キー情報」のように設定される。同様に、属性データについてもデータ項目情報が設定される。
【0069】
データ項目情報の設定が完了すると、次に分析支援サーバ2の制御部10は、分析方法の設定(分析目的、目的カテゴリ、分析手法、対象データの選定)を受け付ける。このとき、他の分析を参照する指示が入力部17から入力されると(ステップS103;Yes)、制御部10は、図9に示す分析設定画面93に関する表示データを記憶部11から読み出し、表示部19に表示する。或いは、分析設定画面93に関する表示データをネットワーク9を介して分析提供者端末7に送信し、分析提供者端末7の表示部に表示させる。
【0070】
図9に示すように、分析設定画面93には、分析設定エリア931、参照エリア932、分析対象データ表示エリア933が設けられる。
【0071】
分析設定エリア931には、各設定項目(「分析目的」、「目的カテゴリ」、「分析手法」、「分析対象データ」)についての入力欄931a、931b、931c、931dが設けられている。「分析目的」の入力欄931aには、テキスト形式で入力可能であり、「目的カテゴリ」の入力欄931b、「分析手法」の入力欄931c、及び「分析対象データ」の入力欄931dには、それぞれプルダウン形式で値を選択入力できるようになっている。
【0072】
分析対象データ表示エリア933には、入力されたログデータ及び属性データ(分析対象データ)について、ステップS102において設定されたデータ項目情報が表示される。
【0073】
参照エリア932には、分析支援情報が表示される。ここで表示される分析支援情報は、次のステップS104以降の処理で抽出され、提示されるものである。
【0074】
ステップS104において、制御部10は支援情報DB6から、今回の分析設定に適した分析支援情報を抽出する。すなわち、支援情報データベース6の分析支援情報DB63に既に登録されている分析支援情報(参照データ項目情報または参照分析設定情報)の中から、今回の分析対象データのデータ項目情報または分析設定情報に一致または類似するものを抽出し、提示する(ステップS104、ステップS105)。
【0075】
ここで、類似の判断について説明する。
分析支援情報を抽出する際、制御部10は、例えば以下の<A>(1)〜(5)の優先順位で、登録されている分析支援情報と今回の分析との類似性を判定し、参照する分析支援情報を抽出するものとする。
【0076】
<A>分析対象データ(データ項目情報)のみが入力されている場合
(1)ログデータ及び属性データのデータ形式、データ種別、データ内容が同じ
(2)ログデータのデータ形式、データ種別、データ内容が同じ
(3)ログデータのデータ種別、データ内容が同じ
(4)ログデータのデータ内容が同じ
(5)ログデータのデータ種別が同じ
【0077】
また、分析支援情報を抽出する際、制御部10は、データ項目情報及び分析設定情報の一部(分析目的または目的カテゴリ)が入力されている場合は、これらの情報を参照して、登録されている分析支援情報から類似するものを抽出するようにしてもよい。
この場合は、例えば以下の<B>(1)〜(5)の優先順位で参照する分析支援情報を抽出するものとする。
【0078】
<B>分析対象データ(データ項目情報)及び分析設定情報の分析目的または目的カテゴリが入力されている場合
(1)ログデータ及び属性データのデータ形式、データ種別、データ内容が同じ
かつ、分析設定情報の分析目的、目的カテゴリが同じ
(2)ログデータのデータ形式、データ種別、データ内容が同じ
かつ、分析設定情報の目的カテゴリが同じ
(3)ログデータのデータ種別、データ内容が同じ
かつ、分析設定情報の目的カテゴリが同じ
(4)ログデータのデータ内容が同じ
かつ、分析設定情報の目的カテゴリが同じ
(5)ログデータのデータ種別が同じ
かつ、分析設定情報の目的カテゴリが同じ
【0079】
図9に示す分析設定画面93の例では、分析対象データ表示エリア933に表示されている分析対象データについて、分析支援情報が抽出される。なお、分析設定エリア931において、分析目的931aのみが入力され、目的カテゴリ931b、分析手法931c、分析対象データ931dについては、設定内容が確定していないものとする。
【0080】
制御部10は、分析対象データ表示エリア933のデータ項目情報(データ形式、データ種別、データ内容)の内容及び分析設定エリア931の分析目的「同時に買われているものを見つける」を検索キーとして、上述の優先順位<A>または<B>のいずれかに従って、分析支援情報DB63から参照する分析支援情報を抽出する。そして、抽出結果を参照エリア932に表示する。
【0081】
なお、図示しないが、分析データ表示エリア933に表示されるデータ項目情報と、参照エリア932に表示されるデータ項目情報とで、データ形式、データ種別、データ内容等が同一の部分は、それぞれ対応した色や対応した表示形式で表示されるようにしてもよい。
【0082】
また、複数の検索結果を得た場合は、類似度の高い分析支援情報のみを優先的に表示したり、図9に示すように、参照エリア932内に検索結果選択番号932aを表示し、選択番号に応じた検索結果(参照分析データ)を表示したりする。
【0083】
ここで、検索結果として、ログデータにデータ項目「ユーザID」、「購買商品ID」、「価格ID」を含み、属性データにデータ項目「性別cd」を含む参照データ項目情報932bが抽出されるとする(参照エリア932上段)。そして、この参照データ項目情報932bには、参照エリア932下段の参照分析設定情報932cが関連付けられているとする。
【0084】
分析提供者は、参照エリア932に提示された内容(特に、参照分析設定情報932cの「目的カテゴリ」、「分析手法」、「分析対象データ」)を参照しながら、分析設定エリア931の未設定の項目である目的カテゴリ931b、分析手法931c、分析対象データ931dを設定することが可能となる。
【0085】
以上のようにして、分析設定が行われると(ステップS106)、制御部10は、分析設定エリア931に設定された分析設定情報を、分析対象データのデータ項目情報と関連付けて、分析データ情報DB61、分析設定情報DB62に格納するとともに、分析支援情報DB63に分析支援情報として登録する(ステップS107)。
【0086】
なお、ステップS103において、他の分析を参照する指示が入力されない場合は(ステップS103;No)、ステップS104〜ステップS105の処理をスキップし、ステップS106へ移行する。この場合、分析設定画面93の参照エリア932には何も表示されず、分析設定エリア931の「分析目的」931a、「目的カテゴリ」931b、「分析手法」931c、「分析対象データ」931dには、分析提供者自らが判断して、所望の値を入力することとなる。
【0087】
以上のようにして、分析提供者による分析の設定、または分析支援情報の蓄積に関する一連の処理が終了する。
【0088】
次に、図10〜図12を参照してデータ分析処理の流れを説明する。
データ分析処理において、分析支援サーバ2の制御部10は、まず、ログデータ及び属性データの入力(インポート)、及び分析目的の入力を受け付ける(ステップS201、S202)。ここで入力するデータは実際に分析対象とするデータである。
【0089】
ステップS201、S202において、分析支援サーバ2の制御部10は、記憶部11から図11に示すような、入力画面95に関する表示データを読み出し、表示部19に表示する。或いは、入力画面95に関する表示データをネットワーク9を介して分析利用者端末8に送信し、分析利用者端末8の表示部に表示させる。
【0090】
入力画面95には、分析対象データ入力欄951、及び分析目的入力欄952が設けられる。入力画面95において、分析利用者により、例えばデータ名「Log1.csv」、「Attribute.csv」が指定され、また、分析の目的がプルダウンメニュー953から選択され、「分析実行」ボタン954が押下されると、それらのデータが分析支援サーバ2に入力される。
【0091】
次に、分析支援サーバ2の制御部10は、分析手法を決定する(ステップS203)。
ステップS203において、制御部10は、支援情報DB6からステップS201にて入力された分析対象データ及び分析の目的に適合した分析支援情報を抽出する。このとき、制御部10はステップS201において入力されたデータに含まれる各データ項目について、データ項目情報(データ形式、データ種別、データ内容)を決定し、決定されたデータ項目情報及び分析の目的に適合した分析支援情報を抽出する。
【0092】
分析支援情報の抽出は、図6のフローチャートのステップS104における処理と同様に行われる。ただし、本データ分析処理では、分析手法を決定するため、より優先順位の高い条件で、1件のみ分析支援情報を抽出すればよい。
【0093】
制御部10は、適切な分析支援情報を抽出すると、その分析支援情報に関連付けられている分析手法や選定される対象データを、入力された分析対象データについての分析手法、対象データとして設定する。
【0094】
その後、制御部10は、設定した分析手法に基づいて分析処理を行い(ステップS204)、分析結果を表示部19に表示したり、分析利用者端末8に送信して表示させたりする(ステップS205)。
図12に分析結果表示画面96の一例を示す。
【0095】
以上説明した一連のデータ分析処理によって、分析利用者は、分析対象とするログデータ及び属性データを入力し、分析目的を選択するという操作を行えば、分析支援サーバ2によって目的に最も適合した分析手法で分析が行われ、その分析結果が表示されるため、分析結果を簡単に閲覧できる。
【0096】
以上説明したように、本実施の形態のデータ分析支援システム1では、分析支援サーバ2は、分析提供者によって入力された分析対象データのデータ項目情報(データ形式、データ種別、データ内容等のデータ項目の属性を定義するもの)や分析設定情報(分析の目的、目的カテゴリ、分析手法、対象データ等の分析の方法を定義するもの)を分析支援情報として支援情報DB6に登録しておく。新たな分析対象データについて新たな分析設定を行う際は、分析支援サーバ2の制御部10は、支援情報データベース6に登録されている過去の設定情報(分析支援情報DB63)の中から、類似する設定情報(参照データ項目情報または参照分析設定情報)を抽出して分析支援情報として提示する。
【0097】
そのため、分析提供者は、分析支援情報を参照しながら、分析の手法等を設定できる。よって、分析の専門知識がない者でも容易に分析の設定を行うことが可能となり、初心者でも簡単に分析の設定を行うことが可能となる。
【0098】
また、複数の分析支援情報が抽出された場合には、類似度の高いものから優先的に提示するようにしたり、いくつかを選択可能に参照したりしているため、分析提供者にとって、より使用しやすい実用的なデータ分析支援システム等を提供できる。
また、分析支援サーバ2は、分析支援情報を提示する際、同一の表示画面内に分析設定を行うエリア(分析設定エリア931)と参照エリア932とを設けた表示画面を生成しているため、分析支援情報を参照しながら分析設定を行い易く、より使用しやすいデータ分析支援システム等を提供できる。
【0099】
更に、データ分析支援システム1では、分析利用者から分析対象データやその目的が入力されると、分析支援サーバ2の制御部10は、支援情報DB6に登録されている過去の設定情報(分析データ)の中から、最も類似する分析データ(参照項目情報または参照分析設定情報)を抽出し、この分析データに関連付けられている分析手法を用いて分析処理を実行し、分析結果を閲覧可能に提示する。
【0100】
そのため、分析利用者は、非常に簡易な操作で分析の結果を得ることが可能となる。
【0101】
更に、本データ分析支援システム1では、分析支援情報を抽出する際、検索対象をデータ項目情報(データ形式、データ種別、データ内容)または分析設定情報(分析目的、目的カテゴリ)としているため、他の分析提供者及び分析利用者に関する情報(個人情報)を一切用いる必要がない。そのため、本データ分析支援システム1では、過去において他人が行った分析を参照するにも関わらず、他の分析提供者及び分析利用者の個人情報が漏れる恐れがないという、副次的な効果を得ることができる。
【0102】
以下、本実施の形態のデータ分析支援システム1を利用したデータ分析支援の具体的な実施例について説明する。
【実施例1】
【0103】
図13は、分析支援サーバ2にて行われる分析設定の一例である。
(1)今回実施しようとする分析は、「金融(銀行等)の利用サービス状況の情報を使った分析」である。
(2)分析支援情報DBには類似する分析支援情報として「POS情報システムの分析データ」が登録されている。
【0104】
図13において、(A)は分析対象データを示し、(B)は分析管理処理によって抽出された分析支援情報を示し、(C)は今回設定する分析設定情報を示す。
【0105】
すなわち、図6に示す分析管理処理のステップS101〜S102において、図13(A)に示すように分析対象データのデータ項目情報が設定される。また、ステップS103において「他の分析を参照する」が選択されると、分析支援サーバ2の制御部は、設定されたデータ項目情報と類似するデータ項目情報を有する分析支援情報を抽出し、図13(B)に示すように提示する。
【0106】
図13(A)及び(B)のデータ項目情報を比較すると、図13(A)のログデータの「ユーザID」、「利用サービス」、「預金額」は、それぞれ図13(B)の「ユーザID」、「購買商品ID」、「価格」に対応し、それぞれデータ形式、データ種別、データ内容が一致している。また、図13(A)の属性データの「性別cd」は図13(B)の「性別cd」に対応し、データ形式、データ種別、データ内容が一致している。したがって、上述の優先順位<A>(1)「ログデータ及び属性データのデータ形式、データ種別、データ内容が同じ」に従って、類似するデータ項目情報を有する分析支援情報が抽出されたといえる。
【0107】
更に、図6のステップS105によって、このデータ項目情報に関連付けられた参照分析設定情報を分析支援情報DB63から抽出し、図13(B)に示すように提示する。図13(B)に示す分析設定情報は、「分析目的」が「同時に買われているものを見つける」であり、「目的カテゴリ」が「相関」であり、「分析手法」が「アソシエーション分析」であり、「分析対象データ」が「キー:商品ID、対象:価格、性別」である。
【0108】
分析提供者は、図13(B)に提示された分析支援情報(分析設定情報)を参照しながら、今回の分析設定情報についての設定を行うことが可能となる。具体的には、図13(C)に示すように「分析目的」を「同時に利用されているサービスを見つける」とし、「目的カテゴリ」を「相関」とし、「分析手法」を「アソシエーション分析」とし、「分析対象データ」を「キー:利用サービス、対象:預金額、年齢」として、図13(B)の分析支援情報の内容をほぼ踏襲しながら、今回の目的に合うような内容に設定できる。
【0109】
上述の実施例1で着目すべき点は、ログデータや属性データに含まれるデータ項目(カラム名)が、今回の分析対象データと過去の分析対象データとで異なるものであっても、データ項目情報(データ形式、データ種別、データ内容)が一致(類似)するものが優先的に抽出されている点である。すなわち、ログデータ等に含まれるカラム名に依存せずに、異なる分野(金融と購買商品POSデータ等)のデータ分析の設定内容を参照することが可能となる。
【実施例2】
【0110】
本実施の形態のデータ分析支援システム1を利用した別の具体例について説明する。
図14は、分析支援サーバ2にて行われる分析設定の他の例である。
(1)今回実施しようとする分析は、「医療に関する併発しやすい病気・症状の情報を使った分析」である。
(2)分析支援情報DBには類似する分析支援情報として「POS情報システムの分析データ」が登録されている。上述の実施例1にて参照されるものと同じものである。
【0111】
図14において、(A)は分析対象データを示し、(B)は分析管理処理によって抽出された分析支援情報を示し、(C)は今回設定する分析設定情報を示す。
【0112】
すなわち、図6に示す分析管理処理のステップS101〜S102において、図14(A)に示すように分析対象データのデータ項目情報が設定される。また、ステップS103において「他の分析を参照する」が選択されると、分析支援サーバ2の制御部10は、設定されたデータ項目情報と類似するデータ項目情報を有する分析支援情報を抽出し、図14(B)に示すように提示する。
【0113】
図14(A)及び(B)のデータ項目情報を比較すると、図14(A)のログデータの「ユーザID」、「病気・症状」は、それぞれ図14(B)の「ユーザID」、「購買商品ID」、に対応し、それぞれデータ形式、データ種別、データ内容が一致している。また、図14(A)のログデータの「地域」については、図14(B)の「価格」と、データ種別及びデータ内容が一致している。また、図14(A)の属性データの「性別cd」は図14(B)の「性別cd」に対応し、データ形式、データ種別、データ内容が一致している。したがって、上述の優先順位<A>(3)「ログデータのデータ種別、データ内容が同じ」に従って、類似するデータ項目情報を有する分析支援情報が抽出されたといえる。
【0114】
更に、図6のステップS105によって、このデータ項目情報に関連付けられた参照分析設定情報を分析支援情報DB63から抽出し、図14(B)に示すように提示する。図14(B)に示す分析設定情報は、「分析目的」が「同時に買われているものを見つける」であり、「目的カテゴリ」が「相関」であり、「分析手法」が「アソシエーション分析」であり、「分析対象データ」が「キー:商品ID、対象:価格、性別」である。
【0115】
分析提供者は、図14(B)に提示された分析支援情報(分析設定情報)を参照しながら、今回の分析設定情報についての設定を行うことが可能となる。具体的には、図14(C)に示すように「分析目的」を「併発しやすい病気、症状を探す」とし、「目的カテゴリ」を「相関」とし、「分析手法」を「アソシエーション分析」とし、「分析対象データ」を「キー:病気・症状、対象:地域、年齢、性別」として、図14(B)の分析支援情報の内容をほぼ踏襲しながら、今回の目的に合うような内容に設定できる。
【0116】
上述の実施例2も、実施例1と同様に、ログデータや属性データに含まれるデータ項目(カラム名)が、今回の分析対象データと過去の分析対象データとで異なるものであっても、データ項目情報(データ形式、データ種別、データ内容)が類似するものが優先的に抽出される。
【0117】
なお、上述の実施の形態では、システム構成例として、図1に示すように、(a)分析管理システム20及びデータ分析システム30の双方を、分析支援サーバ2にて連携したデータ分析支援システム1を説明したが、これに限定されるものではない。
例えば、システムの態様として、(b)分析管理システム20と分析支援サーバ2とを連携したデータ分析支援システム、或いは(c)データ分析システム30と分析支援サーバ2と連携したデータ分析支援システムとしてもよい。
【0118】
また、分析支援サーバ2は、分析管理システム20の分析提供者端末7やデータ分析システム30の分析利用者端末8と、ネットワーク9を介した通信接続を行わずに、分析支援装置としてローカルな処理を実行するようにしてもよい。
この場合も、(d)分析支援装置(分析支援サーバ2)にて分析管理処理のみを行うもの、(e)分析支援装置(分析支援サーバ2)にてデータ分析処理のみを行うもの、(f)分析支援装置(分析支援サーバ2)にて分析管理処理及びデータ分析処理の双方を行うもの、のいずれの態様をとるようにしてもよい。
【0119】
その他、当業者であれば、本願で開示した技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。
【符号の説明】
【0120】
1・・・データ分析支援システム
2・・・分析支援サーバ
3・・・分析管理部
4・・・分析処理部
5・・・分析支援部
6・・・支援情報データベース
61・・・分析データ情報DB
62・・・分析設定情報DB
63・・・分析支援情報DB
7・・・分析提供者端末
8・・・分析利用者端末
9・・・ネットワーク
【特許請求の範囲】
【請求項1】
データ分析の支援に用いるデータを蓄積する支援情報データベースを備えたデータ分析支援装置であって、
分析対象データに含まれる各データ項目について、データ項目そのものの属性を定義する項目情報の設定を受け付ける項目情報設定手段と、
前記分析対象データの分析目的に応じた分析方法を定義する分析設定情報の設定を受け付ける分析設定手段と、
前記項目情報及び前記分析設定情報を、分析支援情報として前記支援情報データベースに登録する分析支援情報登録手段と、
新規に入力された分析対象データについて設定された項目情報または分析設定情報と、一致または類似する項目情報または分析設定情報を有する分析支援情報を、前記支援情報データベースから抽出し、提示する分析支援情報提示手段と、
を備えることを特徴とするデータ分析支援装置。
【請求項2】
データ分析の支援に用いるデータを蓄積する支援情報データベースを備えたデータ分析支援装置であって、
前記支援情報データベースには、過去に行った分析における分析対象データに含まれる各データ項目そのものの属性を定義する項目情報と、前記分析対象データの分析目的に応じた分析方法を定義する分析設定情報とが、分析支援情報として予め登録されており、
新たに行う分析について、分析対象データ及び分析目的を入力する入力手段と、
前記入力手段により入力された分析対象データ及び分析目的に適合した分析支援情報を前記支援情報データベースから抽出する抽出手段と、
前記抽出手段によって抽出した分析支援情報に設定されている分析設定情報に基づいて、前記入力手段により入力された分析対象データについての分析処理を実行し、分析結果を閲覧可能に表示する表示手段と、
を備えることを特徴とするデータ分析支援装置。
【請求項3】
データ分析の支援に用いるデータを蓄積する支援情報データベースを備えたデータ分析支援装置であって、
分析対象データに含まれる各データ項目について、データ項目そのものの属性を定義する項目情報の設定を受け付ける項目情報設定手段と、
前記分析対象データの分析目的に応じた分析方法を定義する分析設定情報の設定を受け付ける分析設定手段と、
前記項目情報及び前記分析設定情報を、分析支援情報として前記支援情報データベースに登録する分析支援情報登録手段と、
新規に入力された分析対象データについて設定された項目情報または分析設定情報と、一致または類似する項目情報または分析設定情報を有する分析支援情報を、前記支援情報データベースから抽出し、提示する分析支援情報提示手段と、
前記分析支援情報提示手段によって提示された分析支援情報に設定されている分析設定情報に基づいて、前記新規に入力された分析対象データについての分析処理を実行し、分析結果を閲覧可能に表示する表示手段と、
を備えることを特徴とするデータ分析支援装置。
【請求項4】
前記分析支援情報提示手段は、前記分析支援情報について複数の抽出結果を得た場合は、類似度の高い分析支援情報を優先的に提示することを特徴とする請求項1または請求項3に記載のデータ分析支援装置。
【請求項5】
前記分析支援情報提示手段は、抽出された分析支援情報を、分析設定情報の設定画面内に、並べて表示することを特徴とする請求項1または請求項3に記載のデータ分析支援装置。
【請求項6】
前記項目情報は、各データ項目の属性として、データ形式、データ種別、及びデータ内容を定義するものであることを特徴とする請求項1から請求項3のいずれかに記載のデータ分析支援装置。
【請求項7】
前記分析設定情報は、少なくとも分析の目的、目的カテゴリ、分析手法、及び分析対象データを定義するものであることを特徴とする請求項1から請求項3のいずれかに記載のデータ分析支援装置。
【請求項8】
分析提供者が利用する分析管理システムと連携し、データ分析の支援に用いるデータを蓄積する支援情報データベースを備えたデータ分析支援システムであって、
前記分析管理システムは、
分析対象データに含まれる各データ項目について、データ項目そのものの属性を定義する項目情報の設定を受け付ける項目情報設定手段と、
前記分析対象データの分析目的に応じた分析方法を定義する分析設定情報の設定を受け付ける分析設定手段と、
前記項目情報及び前記分析設定情報を、分析支援情報として前記支援情報データベースに登録する分析支援情報登録手段と、
新規に入力された分析対象データについての分析支援情報を提示するよう要求する提示要求手段と、を備え、
当該データ分析支援システムは、
前記分析管理システムからの要求に応じて、前記新規に入力された分析対象データについて、設定された項目情報または分析設定情報と、一致または類似する項目情報または分析設定情報を有する分析支援情報を、前記支援情報データベースから抽出し、前記分析管理システムに提示する第1の分析支援情報提示手段を備えることを特徴とするデータ分析支援システム。
【請求項9】
分析利用者が利用する分析処理システムと連携し、データ分析の支援に用いるデータを蓄積する支援情報データベースを備えたデータ分析支援システムであって、
前記支援情報データベースには、過去に行った分析における分析対象データに含まれる各データ項目そのものの属性を定義する項目情報と、前記分析対象データの分析目的に応じた分析方法を定義する分析設定情報とが、分析支援情報として予め登録されており、
前記分析処理システムは、
分析対象データ及び分析目的を入力する入力手段と、
前記入力手段により入力された分析対象データ及び分析目的に適合した分析支援情報を抽出するよう当該データ分析支援システムに対して要求する抽出要求手段と、を備え、
当該データ分析支援システムは、
前記分析処理システムからの要求に応じて、前記入力手段により入力された分析対象データ及び分析目的に適合した分析支援情報を前記支援情報データベースから抽出して、前記分析処理システムに提示する第2の分析支援情報提示手段を備え、
前記分析処理システムは、更に、前記第2の分析支援情報提示手段によって提示された分析支援情報に設定されている分析設定情報に基づいて、前記入力手段により入力された分析対象データについての分析処理を実行し、分析結果を閲覧可能に表示する表示手段を備えることを特徴とするデータ分析支援システム。
【請求項10】
分析提供者が利用する分析管理システムと、分析利用者が利用する分析処理システムと、を連携し、データ分析の支援に用いるデータを蓄積する支援情報データベースを備えたデータ分析支援システムであって、
前記分析管理システムは、
分析対象データに含まれる各データ項目について、データ項目そのものの属性を定義する項目情報の設定を受け付ける項目情報設定手段と、
前記分析対象データの分析目的に応じた分析方法を定義する分析設定情報の設定を受け付ける分析設定手段と、
前記項目情報及び前記分析設定情報を、分析支援情報として前記支援情報データベースに登録する分析支援情報登録手段と、
新規に入力された分析対象データについての分析支援情報を提示するよう要求する提示要求手段と、を備え、
前記分析処理システムは、
新たに行う分析について、分析対象データ及び分析目的を入力する入力手段と、
前記入力手段により入力された分析対象データ及び分析目的に適合した分析設定情報を抽出するよう当該データ分析支援システムに対して要求する抽出要求手段と、を備え、
当該データ分析支援システムは、
前記分析管理システムからの要求に応じて、新規に入力された分析対象データについて設定された項目情報または分析設定情報と、一致または類似する項目情報または分析設定情報を有する分析支援情報を、前記支援情報データベースから抽出し、前記分析管理システムに提示する第1の分析支援情報提示手段と、
前記分析処理システムからの要求に応じて、前記入力手段により入力された分析対象データ及び分析目的に適合した分析支援情報を前記支援情報データベースから抽出して、前記分析処理システムに提示する第2の分析支援情報提示手段と、
を備え、
前記分析処理システムは、更に、前記第2の分析支援情報提示手段によって提示された分析支援情報に設定されている分析設定情報に基づいて、前記入力手段により入力された分析対象データについての分析処理を実行し、分析結果を閲覧可能に表示する表示手段を備えることを特徴とするデータ分析支援システム。
【請求項11】
分析対象データに含まれる各データ項目について、データ項目そのものの属性を定義する項目情報の設定を受け付ける項目情報設定ステップと、
前記分析対象データの分析目的に応じた分析方法を定義する分析設定情報の設定を受け付ける分析設定ステップと、
設定された項目情報及び分析設定情報を、分析支援情報として支援情報データベースに登録する分析支援情報登録ステップと、
新規に入力された分析対象データについて、前記項目情報または前記分析設定情報と、一致または類似する項目情報または分析設定情報を有する分析支援情報を、前記支援情報データベースから抽出し、提示する分析支援情報提示ステップと、
を含むことを特徴とするデータ分析支援方法。
【請求項12】
過去に行った分析における分析対象データについて、分析対象データに含まれる各データ項目そのものの属性を定義する項目情報と、前記分析対象データの分析目的に応じた分析方法を定義する分析設定情報とが、分析支援情報として予め登録された支援情報データベースを利用したデータ分析支援方法であって、
新たに行う分析について、分析対象データ及び分析目的を入力する入力ステップと、
入力された分析対象データ及び分析目的に適合した分析支援情報を前記支援情報データベースから抽出する抽出ステップと、
抽出した分析支援情報に設定されている分析設定情報に基づいて、前記入力された分析対象データについての分析処理を実行し、分析結果を閲覧可能に表示する表示ステップと、
を含むことを特徴とするデータ分析支援方法。
【請求項13】
分析対象データに含まれる各データ項目について、データ項目そのものの属性を定義する項目情報の設定を受け付ける項目情報設定ステップと、
前記分析対象データの分析目的に応じた分析方法を定義する分析設定情報の設定を受け付ける分析設定ステップと、
設定された項目情報及び分析設定情報を、分析支援情報として支援情報データベースに登録する分析支援情報登録ステップと、
新規に入力された分析対象データについて設定された項目情報または分析設定情報と、一致または類似する項目情報または分析設定情報を有する分析支援情報を、前記支援情報データベースから抽出し、提示する分析支援情報提示ステップと、
提示された分析支援情報に設定されている分析設定情報に基づいて、前記新規に入力された分析対象データについての分析処理を実行し、分析結果を閲覧可能に表示する表示ステップと、
を含むことを特徴とするデータ分析支援方法。
【請求項14】
コンピュータを請求項1に記載のデータ分析支援装置として機能させるためのプログラム。
【請求項15】
コンピュータを請求項2に記載のデータ分析支援装置として機能させるためのプログラム。
【請求項16】
コンピュータを請求項3に記載のデータ分析支援装置として機能させるためのプログラム。
【請求項1】
データ分析の支援に用いるデータを蓄積する支援情報データベースを備えたデータ分析支援装置であって、
分析対象データに含まれる各データ項目について、データ項目そのものの属性を定義する項目情報の設定を受け付ける項目情報設定手段と、
前記分析対象データの分析目的に応じた分析方法を定義する分析設定情報の設定を受け付ける分析設定手段と、
前記項目情報及び前記分析設定情報を、分析支援情報として前記支援情報データベースに登録する分析支援情報登録手段と、
新規に入力された分析対象データについて設定された項目情報または分析設定情報と、一致または類似する項目情報または分析設定情報を有する分析支援情報を、前記支援情報データベースから抽出し、提示する分析支援情報提示手段と、
を備えることを特徴とするデータ分析支援装置。
【請求項2】
データ分析の支援に用いるデータを蓄積する支援情報データベースを備えたデータ分析支援装置であって、
前記支援情報データベースには、過去に行った分析における分析対象データに含まれる各データ項目そのものの属性を定義する項目情報と、前記分析対象データの分析目的に応じた分析方法を定義する分析設定情報とが、分析支援情報として予め登録されており、
新たに行う分析について、分析対象データ及び分析目的を入力する入力手段と、
前記入力手段により入力された分析対象データ及び分析目的に適合した分析支援情報を前記支援情報データベースから抽出する抽出手段と、
前記抽出手段によって抽出した分析支援情報に設定されている分析設定情報に基づいて、前記入力手段により入力された分析対象データについての分析処理を実行し、分析結果を閲覧可能に表示する表示手段と、
を備えることを特徴とするデータ分析支援装置。
【請求項3】
データ分析の支援に用いるデータを蓄積する支援情報データベースを備えたデータ分析支援装置であって、
分析対象データに含まれる各データ項目について、データ項目そのものの属性を定義する項目情報の設定を受け付ける項目情報設定手段と、
前記分析対象データの分析目的に応じた分析方法を定義する分析設定情報の設定を受け付ける分析設定手段と、
前記項目情報及び前記分析設定情報を、分析支援情報として前記支援情報データベースに登録する分析支援情報登録手段と、
新規に入力された分析対象データについて設定された項目情報または分析設定情報と、一致または類似する項目情報または分析設定情報を有する分析支援情報を、前記支援情報データベースから抽出し、提示する分析支援情報提示手段と、
前記分析支援情報提示手段によって提示された分析支援情報に設定されている分析設定情報に基づいて、前記新規に入力された分析対象データについての分析処理を実行し、分析結果を閲覧可能に表示する表示手段と、
を備えることを特徴とするデータ分析支援装置。
【請求項4】
前記分析支援情報提示手段は、前記分析支援情報について複数の抽出結果を得た場合は、類似度の高い分析支援情報を優先的に提示することを特徴とする請求項1または請求項3に記載のデータ分析支援装置。
【請求項5】
前記分析支援情報提示手段は、抽出された分析支援情報を、分析設定情報の設定画面内に、並べて表示することを特徴とする請求項1または請求項3に記載のデータ分析支援装置。
【請求項6】
前記項目情報は、各データ項目の属性として、データ形式、データ種別、及びデータ内容を定義するものであることを特徴とする請求項1から請求項3のいずれかに記載のデータ分析支援装置。
【請求項7】
前記分析設定情報は、少なくとも分析の目的、目的カテゴリ、分析手法、及び分析対象データを定義するものであることを特徴とする請求項1から請求項3のいずれかに記載のデータ分析支援装置。
【請求項8】
分析提供者が利用する分析管理システムと連携し、データ分析の支援に用いるデータを蓄積する支援情報データベースを備えたデータ分析支援システムであって、
前記分析管理システムは、
分析対象データに含まれる各データ項目について、データ項目そのものの属性を定義する項目情報の設定を受け付ける項目情報設定手段と、
前記分析対象データの分析目的に応じた分析方法を定義する分析設定情報の設定を受け付ける分析設定手段と、
前記項目情報及び前記分析設定情報を、分析支援情報として前記支援情報データベースに登録する分析支援情報登録手段と、
新規に入力された分析対象データについての分析支援情報を提示するよう要求する提示要求手段と、を備え、
当該データ分析支援システムは、
前記分析管理システムからの要求に応じて、前記新規に入力された分析対象データについて、設定された項目情報または分析設定情報と、一致または類似する項目情報または分析設定情報を有する分析支援情報を、前記支援情報データベースから抽出し、前記分析管理システムに提示する第1の分析支援情報提示手段を備えることを特徴とするデータ分析支援システム。
【請求項9】
分析利用者が利用する分析処理システムと連携し、データ分析の支援に用いるデータを蓄積する支援情報データベースを備えたデータ分析支援システムであって、
前記支援情報データベースには、過去に行った分析における分析対象データに含まれる各データ項目そのものの属性を定義する項目情報と、前記分析対象データの分析目的に応じた分析方法を定義する分析設定情報とが、分析支援情報として予め登録されており、
前記分析処理システムは、
分析対象データ及び分析目的を入力する入力手段と、
前記入力手段により入力された分析対象データ及び分析目的に適合した分析支援情報を抽出するよう当該データ分析支援システムに対して要求する抽出要求手段と、を備え、
当該データ分析支援システムは、
前記分析処理システムからの要求に応じて、前記入力手段により入力された分析対象データ及び分析目的に適合した分析支援情報を前記支援情報データベースから抽出して、前記分析処理システムに提示する第2の分析支援情報提示手段を備え、
前記分析処理システムは、更に、前記第2の分析支援情報提示手段によって提示された分析支援情報に設定されている分析設定情報に基づいて、前記入力手段により入力された分析対象データについての分析処理を実行し、分析結果を閲覧可能に表示する表示手段を備えることを特徴とするデータ分析支援システム。
【請求項10】
分析提供者が利用する分析管理システムと、分析利用者が利用する分析処理システムと、を連携し、データ分析の支援に用いるデータを蓄積する支援情報データベースを備えたデータ分析支援システムであって、
前記分析管理システムは、
分析対象データに含まれる各データ項目について、データ項目そのものの属性を定義する項目情報の設定を受け付ける項目情報設定手段と、
前記分析対象データの分析目的に応じた分析方法を定義する分析設定情報の設定を受け付ける分析設定手段と、
前記項目情報及び前記分析設定情報を、分析支援情報として前記支援情報データベースに登録する分析支援情報登録手段と、
新規に入力された分析対象データについての分析支援情報を提示するよう要求する提示要求手段と、を備え、
前記分析処理システムは、
新たに行う分析について、分析対象データ及び分析目的を入力する入力手段と、
前記入力手段により入力された分析対象データ及び分析目的に適合した分析設定情報を抽出するよう当該データ分析支援システムに対して要求する抽出要求手段と、を備え、
当該データ分析支援システムは、
前記分析管理システムからの要求に応じて、新規に入力された分析対象データについて設定された項目情報または分析設定情報と、一致または類似する項目情報または分析設定情報を有する分析支援情報を、前記支援情報データベースから抽出し、前記分析管理システムに提示する第1の分析支援情報提示手段と、
前記分析処理システムからの要求に応じて、前記入力手段により入力された分析対象データ及び分析目的に適合した分析支援情報を前記支援情報データベースから抽出して、前記分析処理システムに提示する第2の分析支援情報提示手段と、
を備え、
前記分析処理システムは、更に、前記第2の分析支援情報提示手段によって提示された分析支援情報に設定されている分析設定情報に基づいて、前記入力手段により入力された分析対象データについての分析処理を実行し、分析結果を閲覧可能に表示する表示手段を備えることを特徴とするデータ分析支援システム。
【請求項11】
分析対象データに含まれる各データ項目について、データ項目そのものの属性を定義する項目情報の設定を受け付ける項目情報設定ステップと、
前記分析対象データの分析目的に応じた分析方法を定義する分析設定情報の設定を受け付ける分析設定ステップと、
設定された項目情報及び分析設定情報を、分析支援情報として支援情報データベースに登録する分析支援情報登録ステップと、
新規に入力された分析対象データについて、前記項目情報または前記分析設定情報と、一致または類似する項目情報または分析設定情報を有する分析支援情報を、前記支援情報データベースから抽出し、提示する分析支援情報提示ステップと、
を含むことを特徴とするデータ分析支援方法。
【請求項12】
過去に行った分析における分析対象データについて、分析対象データに含まれる各データ項目そのものの属性を定義する項目情報と、前記分析対象データの分析目的に応じた分析方法を定義する分析設定情報とが、分析支援情報として予め登録された支援情報データベースを利用したデータ分析支援方法であって、
新たに行う分析について、分析対象データ及び分析目的を入力する入力ステップと、
入力された分析対象データ及び分析目的に適合した分析支援情報を前記支援情報データベースから抽出する抽出ステップと、
抽出した分析支援情報に設定されている分析設定情報に基づいて、前記入力された分析対象データについての分析処理を実行し、分析結果を閲覧可能に表示する表示ステップと、
を含むことを特徴とするデータ分析支援方法。
【請求項13】
分析対象データに含まれる各データ項目について、データ項目そのものの属性を定義する項目情報の設定を受け付ける項目情報設定ステップと、
前記分析対象データの分析目的に応じた分析方法を定義する分析設定情報の設定を受け付ける分析設定ステップと、
設定された項目情報及び分析設定情報を、分析支援情報として支援情報データベースに登録する分析支援情報登録ステップと、
新規に入力された分析対象データについて設定された項目情報または分析設定情報と、一致または類似する項目情報または分析設定情報を有する分析支援情報を、前記支援情報データベースから抽出し、提示する分析支援情報提示ステップと、
提示された分析支援情報に設定されている分析設定情報に基づいて、前記新規に入力された分析対象データについての分析処理を実行し、分析結果を閲覧可能に表示する表示ステップと、
を含むことを特徴とするデータ分析支援方法。
【請求項14】
コンピュータを請求項1に記載のデータ分析支援装置として機能させるためのプログラム。
【請求項15】
コンピュータを請求項2に記載のデータ分析支援装置として機能させるためのプログラム。
【請求項16】
コンピュータを請求項3に記載のデータ分析支援装置として機能させるためのプログラム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【公開番号】特開2010−205218(P2010−205218A)
【公開日】平成22年9月16日(2010.9.16)
【国際特許分類】
【出願番号】特願2009−52990(P2009−52990)
【出願日】平成21年3月6日(2009.3.6)
【出願人】(000002897)大日本印刷株式会社 (14,506)
【Fターム(参考)】
【公開日】平成22年9月16日(2010.9.16)
【国際特許分類】
【出願日】平成21年3月6日(2009.3.6)
【出願人】(000002897)大日本印刷株式会社 (14,506)
【Fターム(参考)】
[ Back to top ]