説明

データマージシステム

【課題】 クレジットカード等の信用照会において、複数の因子を座標軸としたマトリックス状のセルにサンプルデータを配置する場合に、処理速度向上のために膨大になったセルの件数を圧縮し、かつ結果の分散を防止するために圧縮されたセルに含まれる数値データを設定値の近似値に設定すべく、多次元のマトリックス状に配置されたセルに記録された数値データをマージするデータマージシステムを提供する。
【解決手段】 左に示したマトリックスは、それぞれのセルに該当する数値データが登録されたマージを行う前の状態である。ここで登録された数値データが基準値に達しないセルについては、隣接するセルとのマージが行われ、右に示したマトリックスのように圧縮される。その結果、セルの数が削減されるとともに、それぞれのセルに含まれる数値データが微少であるために結果の分散が生じる可能性を緩和することができる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、不正取引の可能性を示すスコアを算出するスコアリングシステムにおいて用いられるマトリックス状に配置されたセルに記録された数値データをマージするデータマージシステムに関するものである。
【背景技術】
【0002】
クレジットカードの利用時において、例えばカードを拾得した他人が本人になりすまして不正な取引を行うことを防止するために、カードの利用を受け付けた店舗等からは、カード会社に対して与信残高の確認と併せて不正利用についても信用照会を行うことが一般的となっている。このような信用照会のためのシステムにおいては、判定の迅速性と正確性が重要な課題となっている。
【0003】
現在カード会社において用いられているのは、オーソリデータ(オーソリゼーションデータ;クレジットカードの所有者や決済を要求する金額など店舗等から送信されたデータ)から不正利用の可能性についてのスコアを自動的に判定するシステムである。これらのシステムにおいては、ニューロ理論を用いたニューラルネットワークを利用したスコアリングシステムでスコアを判定することが一般的になっている(非特許文献1参照)。
【0004】
ニューラルネットワークとは、人間の脳の神経細胞の構造や情報処理機能をモデル化した先端的な技術によるものであり、システムの構築には専門的なノウハウと多額の投資が必要になる。従って、多くのカード会社では自らがスコア判定のための基礎的なシステムを構築するのではなく、ニューラルネットワークにかかる部分は汎用的に作成された外部システムを導入することが一般的である。
【0005】
【非特許文献1】浅野陽一朗、須田芳宣、「不正利用検知システムの導入とその効果」、月刊消費者信用、社団法人金融財政事情研究会、2000年5月号、p.16−19
【発明の開示】
【発明が解決しようとする課題】
【0006】
しかしながら、ニューラルネットワークを用いたスコアリングシステムは、判定のロジックがブラックボックスとなっているために利用するカード会社等には判定の根拠が明確でないこと、またカード会社等の利用者自らがニューラルネットワークを生成するわけではないので自社のオーソリデータから独自の傾向を反映させるのが容易でないこと、といった問題を有している。かかる課題への対応として、ニューラルネットワークに変えて、近年人工知能等の分野で使用されるようになっているベイズ理論を用いたベイジアンネットワークを用いてスコアリングシステムを構築することが考えられる。
【0007】
ベイジアンネットワークは、対象となる事象を因子別にパターン化し、それぞれのパターンにおける過去の実績値から統計的に確率を求める。例えば、クレジットカードの不正利用の判定にベイジアンネットワークを用いる場合には、オーソリデータに含まれる時刻、金額、購入商品などの因子を抽出し、例えば「15時〜18時に10,000円以下を購入する場合」「50,000円〜100,000円の電化製品を購入する場合」といったパターン別にデータを集計し、それぞれのパターン毎のサンプルの全体件数とその中の不正件数の割合から、不正利用である確率をスコアとして算出する。
【0008】
つまり、ベイジアンネットワークによるスコアリングにおいては、図14の例に示した通り、オーソリデータに含まれる因子を座標軸とするマトリックスを作成して、それぞれのパターンを該当するセルにサンプルの発生件数と不正件数を配置する。例えば、15時に20,000円のクレジットカードの利用についての判定を受け付けると、12時〜18時かつ10,000円〜50,000円のセルを参照して、120件中1件の不正があったという実績データを用いてスコアを算出する。このような方法を用いれば、カード会社にとっても判断の基準は明確であり、また自社の利用に関するオーソリデータをデータに反映していくことにより、自社の利用者の傾向にあったスコアリングシステムを構築することができる。
【0009】
オーソリデータに含まれる因子が「時間」「金額」のように2種類の場合は、上記の図14の例のような2次元のマトリックスを用いるが、さらに例えば「商品」の因子を加えて3種類となった場合、座標軸が追加されて図15のような3次元のマトリックスが用いられることになる。さらに「店舗」「利用者の属性」など因子の種類を追加すると、4次元、5次元と、多次元のマトリックスを構成することになる。
【0010】
ここで問題となるのが、多次元になればなるほどマトリックスに含まれるセルの数が膨大なものとなり、スコアリングにかかるシステムの処理負担が重くなり、迅速な判定が困難になるということである。より精緻な判定を行うためには、因子の数を増加させることが好ましいが、因子の増加は処理速度の遅延につながることとなってしまう。カード利用のスコアリングにおいては、問合せを行った店舗側で長時間顧客を待たせることは好ましくないため、迅速な判定を行うことが必要である。
【0011】
また、因子の増加に伴ってセルの数が増加すると、1つのセルに含まれる実績データのサンプル件数が減少することになる。その結果、セルに含まれるサンプル件数があまりに少ないと、スコアリングの算出結果を分散させてしまう恐れが生じる。例えばある因子の組み合わせでたまたま1件の不正利用が生じた場合、他に該当するサンプルが存在しなければ、不正の確率が100%としてスコアを返すこととなってしまう。このような現象を防止するためには、一つのセルに含まれるサンプル件数を、結果の分散を回避できる一定数以上に設定することが必要である。
【0012】
本発明は、これらの課題に対応して、主としてクレジットカード等の信用照会において、複数の因子を座標軸としたマトリックス状のセルにサンプルデータを配置する場合に、処理速度向上のために膨大になったセルの件数を圧縮し、かつ結果の分散を防止するために1つのセルに含まれるサンプル件数を一定以上に設定すべく、多次元のマトリックス状に配置されたセルに記録された数値データをマージするデータマージシステムを提供することを目的とする。
【課題を解決するための手段】
【0013】
本願にかかる課題を解決する第1の発明は、不正取引の可能性を示すスコアを算出するスコアリングシステムにおいて用いられるマトリックス状に配置されたセルに記録された数値データをマージするデータマージシステムであって、前記セルは、不正判定の基準となるそれぞれ異なる因子を座標軸とするマトリックス構造に配置され、各々のセルには各々の因子に該当するサンプル件数が数値データとして記録されており、マージの基点として第一のセルを選択する第一の選択手段と、前記第一のセルに記録された第一の数値データと予め設定された基準値とを比較する第一の比較手段と、前記第一の数値データが前記基準値に満たない場合には、前記第一の数値データと、前記第一のセルと同一の列に隣接する第二のセルに記録された第二の数値データの合計値を算出する算出手段と、前記基準値と前記合計値とを比較する第二の比較手段と、前記合計値が前記基準値を超える場合には、前記第二のセルを新たなマージの基点として選択し、前記合計値が前記基準値に満たない場合には、前記第一のセルと前記第二のセルをマージした第三のセルを設定して前記合計値を記録し、前記第三のセルを新たなマージの基点として選択する第二の選択手段と、前記第二の選択手段が前記新たなマージの基点として選択するセルが列の最端にあってマージの方向に隣接するセルが存在しない場合には、前記新たなマージの基点として選択するセルが存在する列に隣接する列の最端のセルを、新たなマージの基点として選択する第三の選択手段と、を備えることを特徴とするデータマージシステムである。
【0014】
この発明においては、マトリックス状に配置されたセルにおいて、まず基点となるセルが一定値を超えているかを判定し、その後に同一の列に隣接するセルに含まれる数値データが一定値を超えるまでは、順にセルをマージして数値データの合計値を記録していくことにより、セル内に記録されている数値が微少になることを回避し、かつセルをマージすることで全体のセル数を削減することができる。その結果、セル内の数値データの分散を防止するとともに、セル内の数値データを取得するための処理速度を速めることができる。また、特定の列についてのマージが終了すると隣接する次の列のマージを開始するため、一度の起動処理で全ての列についてのマージを実行することができる。
【0015】
ここでマトリックス状に配置されたセルは、二つの座標軸を持つ二次元のマトリックスであることが基本となるが、さらに座標軸を加えた多次元構造においても、任意の座標軸の行列について順に上記の処理を行うことにより、同様の効果を生じさせることができる。基準値に満たない場合には、合計値が基準値以下である場合、合計値が基準値未満である場合のいずれも含まれる。基準値を超える場合には、合計値が基準値以上である場合、合計値が基準値より大きな値である場合のいずれもが含まれる。
【0016】
本願にかかる課題を解決する第2の発明は、不正取引の可能性を示すスコアを算出するスコアリングシステムにおいて用いられるマトリックス状に配置されたセルに記録された数値データをマージするデータマージシステムであって、前記セルは、不正判定の基準となるそれぞれ異なる因子を座標軸とするマトリックス構造に配置され、各々のセルには各々の因子に該当するサンプル件数が数値データとして記録されており、マージの基点として第一のセルを選択する第一の選択手段と、前記第一のセルに記録された第一の数値データと予め設定された基準値とを比較する第一の比較手段と、前記第一の数値データが前記基準値に満たない場合には、前記第一の数値データと、前記第一のセルと同一の列に隣接する第二のセルに記録された第二の数値データの合計値を算出し、前記第一のセルと前記第二のセルをマージした第三のセルを設定して前記合計値を記録する記録手段と、前記基準値と前記合計値とを比較する第二の比較手段と、前記合計値が前記基準値を超える場合には、前記第三のセルのマージの方向に隣接する第四のセルを新たなマージの基点として選択し、前記合計値が前記基準値に満たない場合には、前記第三のセルを新たなマージの基点として選択する第二の選択手段と、前記第二の選択手段が新たなマージの基点として選択するセルが列の最端にあってマージの方向に隣接するセルが存在しない場合には、前記新たなマージの基点として選択するセルが存在する列に隣接する列の最端のセルを、新たなマージの基点として選択する第三の選択手段と、を備えることを特徴とするデータマージシステムである。
【0017】
セルのマージは、数値データの合計値が基準値に達する前の段階まで行うこととしてもよいが、このように基準値を超えた段階でマージを終了するよう設定することもできる。このように設定すると、全てのセルに記録された数値データが、基準値以上となることを保証することができる。
【0018】
さらに、第1の発明は、全ての列についてマージが終了すると、新たなマージの基点として第五のセルを選択する第四の選択手段と、前記第五のセルと前記第五のセルと同一の行に隣接する第六のセルとの接合面を比較する第三の比較手段と、前記第三の比較手段において接合面が一致する場合は、前記第五のセルに記録された第五の数値データと前記第六のセルに記録された第六の数値データの合計値を算出する第二の算出手段と、前記基準値と前記合計値とを比較する第四の比較手段と、前記合計値が前記基準値を超える場合には、前記第六のセルを新たなマージの基点として選択し、前記合計値が前記基準値に満たない場合には、前記第五のセルと前記第六のセルをマージした第七のセルを設定して前記合計値を記録し、前記第七のセルを新たなマージの基点として選択する第五の選択手段と、前記第三の比較手段において接合面が一致しない場合は、前記第五のセルと前記第六のセルのマージを行わずに前記第六のセルのマージの方向に隣接する第八のセルを新たなマージの基点として選択する第六の選択手段と、を備えることを特徴とすることもできる。
【0019】
このように設定すると、全ての列についてのマージが終了すると、続いて行を基準として同一の行に隣接するセルのマージを開始するため、一度の起動処理で列及び行についてのマージを連続して実行することができる。
【0020】
先に列を基準としたマージを行った後に行を基準としたマージを開始すると、2つ以上のセルが結合された部分においては、セルが複数の行に跨ることとなるため、行を基準としたマージにおいて隣接するセルの接合面が一致しないことが生じ得る。このような場合には、マージを行わず次のセルに進み、さらに行を基準とした後は列、列を基準とした後は行と処理を繰り返し、接合面の一致が生じた段階でマージを行うこととすればよい。
【0021】
第一の発明は、同一の列に隣接するセルからマージを開始することを特徴としているが、逆に同一の行に隣接するセルからマージを開始することとしても、同様にセル内に記録されている数値が微少になることを回避し、かつセルをマージすることで全体のセル数を削減する効果を生じさせることができる。
【0022】
つまり、本願にかかる課題を解決する第3の発明は、不正取引の可能性を示すスコアを算出するスコアリングシステムにおいて用いられるマトリックス状に配置されたセルに記録された数値データをマージするデータマージシステムであって、前記セルは、不正判定の基準となるそれぞれ異なる因子を座標軸とするマトリックス構造に配置され、各々のセルには各々の因子に該当するサンプル件数が数値データとして記録されており、マージの基点として第一のセルを選択する第一の選択手段と、前記第一のセルに記録された第一の数値データと予め設定された基準値とを比較する第一の比較手段と、前記第一の数値データが前記基準値に満たない場合には、前記第一の数値データと、前記第一のセルと同一の行に隣接する第二のセルに記録された第二の数値データの合計値を算出する算出手段と、前記基準値と前記合計値とを比較する第二の比較手段と、前記合計値が前記基準値を超える場合には、前記第二のセルを新たなマージの基点として選択し、前記合計値が前記基準値に満たない場合には、前記第一のセルと前記第二のセルをマージした第三のセルを設定して前記合計値を記録し、前記第三のセルを新たなマージの基点として選択する第二の選択手段と、前記第二の選択手段が新たなマージの基点として選択するセルが行の最端にあってマージの方向に隣接するセルが存在しない場合には、前記新たなマージの基点として選択するセルが存在する行に隣接する行の最端のセルを、新たなマージの基点として選択する第三の選択手段と、を備えることを特徴とするデータマージシステムである。
【0023】
本願にかかる課題を解決する第4の発明は、不正取引の可能性を示すスコアを算出するスコアリングシステムにおいて用いられるマトリックス状に配置されたセルに記録された数値データをマージするデータマージシステムであって、前記セルは、不正判定の基準となるそれぞれ異なる因子を座標軸とするマトリックス構造に配置され、各々のセルには各々の因子に該当するサンプル件数が数値データとして記録されており、マージの基点として第一のセルを選択する第一の選択手段と、前記第一のセルに記録された第一の数値データと予め設定された基準値とを比較する第一の比較手段と、前記第一の数値データが前記基準値に満たない場合には、前記第一の数値データと、前記第一のセルと同一の行に隣接する第二のセルに記録された第二の数値データの合計値を算出し、前記第一のセルと前記第二のセルをマージした第三のセルを設定して前記合計値を記録する記録手段と、前記基準値と前記合計値とを比較する第二の比較手段と、前記合計値が前記基準値を超える場合には、前記第三のセルのマージの方向に隣接する第四のセルを新たなマージの基点として選択し、前記合計値が前記基準値に満たない場合には、前記第三のセルを新たなマージの基点として選択する第二の選択手段と、前記第二の選択手段が新たなマージの基点として選択するセルが行の最端にあってマージの方向に隣接するセルが存在しない場合には、前記新たなマージの基点として選択するセルが存在する行に隣接する行の最端のセルを、新たなマージの基点として選択する第三の選択手段と、を備えることを特徴とするデータマージシステムである。
【0024】
さらに、第1の発明乃至第4の発明は、上記のそれぞれのデータマージプログラムを用いたデータマージの方法として構成することもできる。
【0025】
さらに、本願にかかる課題を解決する他の発明は、取引者の信用照会に対して不正取引の可能性にかかるスコアを算出するためのスコアリングシステムであって、過去に信用照会を受け付けた取引に関する取引者又は取引内容に関する取引データを受信する取引データ受信手段と、過去に前記取引のうち不正取引に関する取引者又は取引内容に関する不正取引データを受信する不正取引データ受信手段と、前記取引データ及び前記不正取引データにかかる取引者又は取引内容に含まれる因子を分類してパターン別に前記取引の発生件数及び前記不正取引の発生件数を記憶する発生件数記憶手段と、前記発生件数記憶手段に記憶されたパターン別の発生件数のデータを圧縮するデータ圧縮手段と、前記データ圧縮手段により圧縮されたパターン別の発生件数を不正検知モデルとして記憶する不正検知モデル記憶手段と、不正取引の可能性についての判定依頼を受け付けると前記不正検知モデルを参照して前記不正取引の可能性に関するスコアを算出するスコア算出手段と、を備えていて、前記発生件数記憶手段には、パターン別に分類されたマトリックス状に配置されたセルにパターン別の発生件数が数値データとして記録されており、前記データ圧縮手段は、前記セルに記録された数値データをマージするデータマージプログラムを備えることを特徴とするスコアリングシステムである。前記信用照会は前記取引者のクレジットカードによる代金支払能力に関する照会であって、前記取引データにはオーソリゼーションデータであることを特徴とすることもできる。
【0026】
この発明においては、複数のセルに記録された数値データをマージするプログラムを利用することにより、取引実績とその中に含まれる不正取引実績をパターン別に分類したデータから不正取引の可能性のスコアを算出する場合において、セル内に記録されている数値データが微少になることを回避し、かつセルをマージすることで全体のセル数を削減することが可能になる。その結果、セル内の数値データの分散を防止するとともに、セル内の数値データを取得するための処理速度を速めて、正確かつ迅速なスコアリングを行うことができる。
【0027】
ここで、取引者又は取引内容に含まれる因子とは、取引者の属性や取引の時間、金額など、取引のパターンを分類するための切り口となる要素のことをいう。これらの因子を座標軸として構成したマトリックスに含まれるセルが、取引の基本パターンの最小単位となる。
【0028】
また、前記他の発明は、前記データマージプログラムは、コンピュータに、マージの基点として第一のセルを選択するステップと、前記第一のセルに記録された第一の数値データと予め設定された基準値とを比較するステップと、前記第一の数値データが前記基準値に満たない場合には、前記第一の数値データと、前記第一のセルと同一の列に隣接する第二のセルに記録された第二の数値データの合計値を算出するステップと、前記基準値と前記合計値とを比較するステップと、前記合計値が前記基準値を超える場合には、前記第二のセルを新たなマージの基点として選択し、前記合計値が前記基準値に満たない場合には、前記第一のセルと前記第二のセルをマージした第三のセルを設定して前記合計値を記録し、前記第三のセルを新たなマージの基点として選択するステップと、を実行させるプログラムであって、前記新たなマージの基点として選択するセルが列の最端にあってマージの方向に隣接するセルが存在しない場合には、前記新たなマージの基点として選択するセルが存在する列に隣接する列の最端のセルを、新たなマージの基点として選択することを特徴とすることもできる。
【0029】
このように、前記他の発明においては、第1の発明乃至第4の発明におけるデータマージシステムで用いられるデータマージプログラムを用いることにより、効果的にデータのマージを行うことができる。
【発明の効果】
【0030】
この発明により、マトリックス状のセルに配置された数値データについて、セルの件数を圧縮するとともに、圧縮されたセルに含まれる数値データを設定値の近似値に取り得ることができる。又は、圧縮されたセルに含まれる数値データを一定値以上に設定することもできる。その結果、データの参照時等の処理速度の向上や、データの分散防止に資することができる。
【0031】
このデータマージプログラムをクレジットカード等の信用照会におけるスコアリングのためのサンプルデータのマージに活用することにより、従来は実用性の低かったベイジアンネットワークを用いて、迅速かつ正確なスコアリングが可能になる。ベイジアンネットワークの適用が可能になると、カード会社等は自社の傾向にあった独自のスコアリングシステムの構築が容易になるとともに、スコアリングの判定根拠も明確に理解することが可能になる。
【発明を実施するための最良の形態】
【0032】
本発明の実施の形態について、図面を用いて以下に詳細に説明する。尚、以下の説明では本発明にかかるデータマージプログラムを、クレジットカードの不正利用のスコアリングシステムに利用する場合について説明するが、本発明はかかる実施形態に限定されるものではなく、本発明にかかるデータマージプログラムはマトリックス状のデータをマージする全ての場合において用いることができる。
【0033】
図1は、本発明にかかるスコアリングシステムの概要を示す図である。図2は、本発明にかかるスコアリングシステムの構成の一例を示す図である。図3は、本発明にかかるデータマージプログラムによるデータ圧縮処理について、処理前後のマトリックスの相違の一例を示す図である。図4は、本発明にかかるデータマージプログラムにより圧縮されたデータについて、データ構造の一例を示す図である。図5は、本発明にかかるデータマージプログラムによるデータ圧縮処理において、NULLの埋め込みを行う例を示す図である。図6は、本発明にかかるデータマージプログラムによるデータ圧縮処理について、基本的な処理手順を示す図である。図7〜図11は、本発明にかかるデータマージプログラムによるデータ圧縮処理の一例について、第1〜第5の手順を示す図である。図12、図13は、本発明にかかるデータマージプログラムのフローを示す第1、第2のフローチャートである。
【0034】
図1において、本発明にかかるスコアリングシステム100は、スコアリングサブシステム110、学習サブシステム120、不正検知モデルデータベース130により構成されており、マニュアルスコア端末140より操作することができる。学習サブシステム120は、カード会社が管理するカード管理システム200のオーソリデータベース210からオーソリデータを取得する。スコアリングサブシステム110は、店舗端末300からカード利用に際しての照会があると、カード管理システム200を介して受け付けたオーソリデータから不正利用のスコアを判定してカード管理システム200に返信し、カード管理システム200はスコアから判断した照会結果を店舗端末300へ送信する。
【0035】
スコアリングサブシステム110におけるスコアの算出は、不正検知モデルデータベース130を参照して行われる。不正検知モデルデータベース130には、オーソリデータに含まれる時間や金額などの因子を座標軸としたマトリックスに、それぞれに該当するサンプル件数が登録されており、スコアリングサブシステム110では受け付けたオーソリデータに該当するパターンのサンプルデータを取得して、スコアを算出する。
【0036】
不正検知モデルデータベース130に登録されるサンプル件数は、オーソリデータベース210から取得したオーソリデータが用いられるが、これらのデータは学習サブシステム120により、正確かつ迅速なスコアリングが可能なように編集されて、不正検知モデルデータベース130に登録される。本発明にかかるデータマージプログラムも学習サブシステム120に設けられており、取得したオーソリデータから作成したマトリックスに含まれるデータをマージして、不正検知モデルデータベース130を作成する。
【0037】
図2は、本発明にかかるスコアリングシステムのさらに詳細な構成を示している。学習システム120には、オーソリデータ受信部121、CPT(Conditional Probability Table)データベース122、CPTデータマージ部123が備えられている。
【0038】
オーソリデータ受信部121は、カード管理システム200に備えられたオーソリデータベース210のオーソリデータテーブル211からオーソリデータを取得する。取得したオーソリデータについて、時間や金額等の因子別に該当するパターンを判定し、因子を座標軸としてマトリックス状のセルが設けられたCPTデータベース122の該当するセルに、サンプル件数として登録される。
【0039】
また、オーソリデータ受信部121は、カード管理システム200に備えられたオーソリデータベース210の不正利用データテーブル212から、不正利用の実績にかかるオーソリデータを取得する。取得したオーソリデータについて、時間や金額等の因子別に該当するパターンを判定し、因子を座標軸としてマトリックス状のセルが設けられたCPTデータベース122の該当するセルに、サンプル件数として登録される。
【0040】
このようにして作成されたCPTデータベース122では、各々のセルについて、該当するサンプル件数とその中での不正利用の件数が、数値データとして登録されている。しかしながら、CPTデータベース122をそのままに用いると、セルの数が膨大となるためオーソリの照会を受けた場合のスコアリングサブシステム110における演算処理が重くなるとともに、セルによってはサンプル件数が少なくて、判定結果が分散してしまうという問題が生じてしまう。そこで、CPTデータマージ部123では本発明にかかるデータマージプログラムによりセルに含まれる数値データをマージし、セルの数を削減するとともに、セルに含まれる数値データを一定値以上に保つことが可能になる。その結果生成された数値データのテーブルは、不正検知モデルとして不正検知モデルデータベース130に記憶される。
【0041】
次に、図3〜図11を用いて、本発明にかかるデータマージプログラムによる前段階の処理、マージ処理の基本的な手順、さらに二次元のマトリックス状に配置されたセルに記録された数値データをマージする具体例について説明する。
【0042】
図3の左に示したマトリックスは、それぞれのセルに該当する数値データが登録されたマージ処理を行う前の状態である。ここで登録された数値データが基準値に達しないセルについては、隣接するセルとのマージが行われ、右に示したマトリックスのように圧縮される。その結果、セルの数が削減されるとともに、それぞれのセルに含まれる数値データが微少であるために結果の分散が生じる可能性を緩和することができる。
【0043】
図4は、本発明にかかるデータマージプログラムにより圧縮されたデータについて、データ構造の一例を示したものである。マージ処理が行われると複数のセルが統合されたセルが生じることになるが、これらのセルでは列と行について複数の組合せを含むこととなるので、from−toの構造体を持ったデータとなる。
【0044】
例えば、マージが行われなかったA列1行のセルのデータは、from・A1−to・A1となるのに対し、マージが行われたC列3行を含むセルのデータは、from・C3−to・D4となる。このようなデータ構造となることにより、from−toの間に含まれる列と行、例えばC列4行についてデータの照会があると、C列4行のデータではなく「C3からD4で3」というデータが返されることになる。
【0045】
具体的なマージ処理は、以下の例のような手順で進められる。まずスタート時点でのデータは、図5の左のマトリックスに示したように、全てのセルにデータを含んでいるわけではなく、一部にデータを持たないセルが存在することもある。データが存在しないセルには、データが存在しないことを明確にするために「NULL」(図においては「N」で示す。)が埋め込まれる。埋め込みの時点でNULLが隣接する場合にはセルがマージされ、隣接する範囲では最大限の面積が確保され、図5の右のマトリックスのように処理される。
【0046】
図6は、マージ処理の基本的な手順を示している。1の行にAからEの列について5つのセルが存在していて、B1、C1、D1にはデータが存在していないとする。まず初めにB1、C1、D1にNULLが埋め込まれることとなるが、隣接するセルと統合されて最大限の面積であるB1からD1を占めるセルとなり、NULLはここに埋め込まれる。
【0047】
マージの条件を合計値が基準値である5以下であることとすると、A1を基点として、A1のセルに含まれるデータと、隣接するB1からD1のセルに含まれるデータの合計値が算出され、この場合は1となって基準値5以下であるため、これらのセルはマージされる。さらに隣接するE1のセルに含まれるデータの合計値が算出され、この場合は2となって基準値5以下であるため、さらにこれらのセルはマージされる。その結果、A1からE1のセルは1つのセルにマージされ、ここに該当する数値データとして2が記録される。
【0048】
次に、図7〜図11を用いて、本発明にかかるデータマージプログラムにより、二次元のマトリックス状に配置されたセルに記録された数値データをマージする具体例について説明する。尚、ここで説明する二次元マトリックスにおける処理を基本として、多次元マトリックスにおいても同様の処理を行うことができる。
【0049】
図7では、マトリックス状のセルにNULLを含む数値データが埋め込まれており、このデータを列方向から順にマージ処理を開始する。ここでは列優先でマージ処理を開始するため、A1、A2、A3、A4、次に隣接する列に移ってB1、B2の順にマージ処理が進行する。マージの条件として、隣接するセルに含まれる数値データの合計値が、基準値である5以下であることと設定されているとする。
【0050】
図8は、まずA列についてマージが終了した段階である。A1を基点に処理を開始し、A1のセルに含まれる数値データは15、隣接するA2のセルに含まれる数値データは1であり、合計値は16となって基準値5を上回っているためマージは行われない。次にA2を基点としてA3のセルに含まれる数値データは1と合計し、合計値は2となって基準値5を下回っているため、A2とA3のセルはマージされ、数値データ2が記録される。さらにマージされたセルを基点としてA4のセルに含まれる数値データ13と合計すると、合計値は15となって基準値5を上回っているためマージは行われない。
【0051】
尚、この例では隣接するセルとの合計値が基準値を上回るとマージがされないこととなっているが、例えば基準値を上回るところまでマージをするよう設定してもよい。例えば、図8の例であれば、A4のセルとの合計値13で初めて基準値5を上回ることとなるため、このA4までをマージして、次のセルに移るよう設定してもよい。
【0052】
こA4はA列の最端に位置するため、A列のマージ処理はここで終了し、B列の逆の最端にあるB1に基点が移される。尚、隣接する列の最端であれば、基点はB4であってもよい。このように隣接する列についてのマージ処理を順に繰り返し、E列までの処理が終了した状態が、図9のマトリックスである。
【0053】
次に、行優先でのマージ処理を行い、A1、B1の順に、さらに行の最端のE1まで進むと、隣接する行に移ってA2、B2の順にマージ処理が進行する。A1とB1の合計は16となってマージが行われないが、NULLをゼロとして計算するために、B1とC1の合計値は1となって基準値5を下回るためにマージが行われる。
【0054】
尚、行優先でマージ処理を行うに際しては、既に列優先の処理が行われているために、例えばA2とB2のように一方のセルがマージされているために、接続面が同一でないものも生じる。このように接続面が異なるものについては、マージ処理を行わないものとする。逆に、接続面が同一であるものについては順次マージが行われ、全ての行についてマージが終了したのが図10に示したマトリックスである。この例では、隣接するセルとのマージを行ったらマージされたセルを基点としては用いず、最大2個のセルについてマージを行うこととしていて、最終的にマージが終了するまでには、列優先、行優先の処理が交互にそれぞれ複数回行われることで、接続面の異なるものについても最終的にマージが進められた状態になる。
【0055】
マージの対象がなくなるまで列優先、行優先の処理が交互に行った結果が、図11に示したマトリックスである。列優先、行優先の処理それぞれで1度でもマージが行われた場合には、処理が繰り返される。列優先、行優先の1セットの処理でマージが行われなくなるまで、繰り返し処理が行われる。
【0056】
図11のマトリックスでは、当初の図7に比べてセルのマージにより、6個のセルが削減されており、当該マトリックスを参照する際の処理負担を軽減することができる。また、データがない、又はデータが1件であるというセルがなくなっており、セルに含まれる数値データの分散も軽減されている。
【0057】
続いて、図12、図13のフローチャートを用いて、本発明にかかるデータマージプログラムの処理フローを説明する。尚、以下に説明するフローは、本発明にかかるデータマージプログラムの処理フローの一例であって、例えば以下を未満にする、列優先ではなく行優先で開始する、列の上方向からではなく下方向から処理を行う、行の右からではなく左からの処理を行う、マージの上限を二個のセルとした処理を複数回繰り返すなど、様々な処理フローのパターンが存在する。
【0058】
図12は、列優先でのマージ処理のフローを示している。まず、二次元マトリックス上で基点となるセルを識別すると(S01)、同列の下にセルがあるかを確認する(S02)。セルが存在している場合には、基点となるセルと同列の下のセルとそれぞれに含まれる数値データの合計値が算出される(S03)。次に、算出した合計値が基準値として予め設定された値以下か否かを確認し(S04)、設定値を上回る場合には新たな基点となるセルが識別されて(S01)、処理が継続される。設定値を下回る場合には、セルがマージされて(S05)、さらに同列下にセルが存在するかの確認が行われる(S02)。
【0059】
尚、同列下にセルが存在するかの確認が行われて(S02)、セルが存在しない場合には、処理を行った列に隣接する次列があるかを確認し(S06)、次列が存在する場合には、次列の最端のセルを新たな基点として識別する(S01)。次列が存在しなければ、列優先のマージ処理を終了する。その後は、必要に応じて行優先のマージ処理が行われる。
【0060】
図13は、列優先に続いて行優先でのマージ処理のフローを示している。まず、二次元マトリックス上で基点となるセルを識別すると(S11)、同行の右にセルがあるかを確認する(S12)。セルが存在している場合には、右に隣接するセルとの接続面が同じか否かを確認する(S13)。接続面が異なる場合には、新たな基点となるセルが識別されて(S11)、処理が継続される。接続面が同じである場合は、基点となるセルと同行の右のセルとそれぞれに含まれる数値データの合計値が算出される(S14)。次に、算出した合計値が基準値として予め設定された値以下か否かを確認し(S15)、設定値を上回る場合には新たな基点となるセルが識別されて(S01)、処理が継続される。設定値を下回る場合には、セルがマージされて(S16)、さらに同行右にセルが存在するかの確認が行われる(S12)。
【0061】
尚、同行右にセルが存在するかの確認が行われて(S12)、セルが存在しない場合には、処理を行った列に隣接する次行があるかを確認し(S17)、次行が存在する場合には、次行の最端のセルを新たな基点として識別する(S11)。次行が存在しなければ、行優先のマージ処理を終了する。その後は、さらに必要に応じて列優先のマージ処理が行われる。
【図面の簡単な説明】
【0062】
【図1】本発明にかかるスコアリングシステムの概要を示す図である。
【図2】本発明にかかるスコアリングシステムの構成の一例を示す図である。
【図3】本発明にかかるデータマージプログラムによるデータ圧縮処理について、処理前後のマトリックスの相違の一例を示す図である。
【図4】本発明にかかるデータマージプログラムにより圧縮されたデータについて、データ構造の一例を示す図である。
【図5】本発明にかかるデータマージプログラムによるデータ圧縮処理において、NULLの埋め込みを行う例を示す図である。
【図6】本発明にかかるデータマージプログラムによるデータ圧縮処理について、基本的な処理手順を示す図である。
【図7】本発明にかかるデータマージプログラムによるデータ圧縮処理の一例について、第1の手順を示す図である。
【図8】本発明にかかるデータマージプログラムによるデータ圧縮処理の一例について、第2の手順を示す図である。
【図9】本発明にかかるデータマージプログラムによるデータ圧縮処理の一例について、第3の手順を示す図である。
【図10】本発明にかかるデータマージプログラムによるデータ圧縮処理の一例について、第4の手順を示す図である。
【図11】本発明にかかるデータマージプログラムによるデータ圧縮処理の一例について、第5の手順を示す図である。
【図12】本発明にかかるデータマージプログラムのフローを示す第1のフローチャートである。
【図13】本発明にかかるデータマージプログラムのフローを示す第2のフローチャートである。
【図14】ベイジアンネットワークによるスコアリングシステムで用いる二次元マトリックスの一例を示す図である。
【図15】ベイジアンネットワークによるスコアリングシステムで用いる三次元マトリックスの一例を示す図である。
【符号の説明】
【0063】
100 スコアリングシステム
110 スコアリングサブシステム
120 学習システム
121 オーソリデータ受信部
122 CPTデータベース
123 CPTデータマージ部
130 不正検知モデル
140 マニュアルスコア端末
200 カード管理システム
210 オーソリデータベース
211 オーソリデータテーブル
212 不正利用データテーブル
300 店舗端末


【特許請求の範囲】
【請求項1】
不正取引の可能性を示すスコアを算出するスコアリングシステムにおいて用いられるマトリックス状に配置されたセルに記録された数値データをマージするデータマージシステムであって、
前記セルは、不正判定の基準となるそれぞれ異なる因子を座標軸とするマトリックス構造に配置され、各々のセルには各々の因子に該当するサンプル件数が数値データとして記録されており、
マージの基点として第一のセルを選択する第一の選択手段と、
前記第一のセルに記録された第一の数値データと予め設定された基準値とを比較する第一の比較手段と、
前記第一の数値データが前記基準値に満たない場合には、前記第一の数値データと、前記第一のセルと同一の列に隣接する第二のセルに記録された第二の数値データの合計値を算出する算出手段と、
前記基準値と前記合計値とを比較する第二の比較手段と、
前記合計値が前記基準値を超える場合には、前記第二のセルを新たなマージの基点として選択し、前記合計値が前記基準値に満たない場合には、前記第一のセルと前記第二のセルをマージした第三のセルを設定して前記合計値を記録し、前記第三のセルを新たなマージの基点として選択する第二の選択手段と、
前記第二の選択手段が前記新たなマージの基点として選択するセルが列の最端にあってマージの方向に隣接するセルが存在しない場合には、前記新たなマージの基点として選択するセルが存在する列に隣接する列の最端のセルを、新たなマージの基点として選択する第三の選択手段と、
を備えることを特徴とするデータマージシステム。
【請求項2】
不正取引の可能性を示すスコアを算出するスコアリングシステムにおいて用いられるマトリックス状に配置されたセルに記録された数値データをマージするデータマージシステムであって、
前記セルは、不正判定の基準となるそれぞれ異なる因子を座標軸とするマトリックス構造に配置され、各々のセルには各々の因子に該当するサンプル件数が数値データとして記録されており、
マージの基点として第一のセルを選択する第一の選択手段と、
前記第一のセルに記録された第一の数値データと予め設定された基準値とを比較する第一の比較手段と、
前記第一の数値データが前記基準値に満たない場合には、前記第一の数値データと、前記第一のセルと同一の列に隣接する第二のセルに記録された第二の数値データの合計値を算出し、前記第一のセルと前記第二のセルをマージした第三のセルを設定して前記合計値を記録する記録手段と、
前記基準値と前記合計値とを比較する第二の比較手段と、
前記合計値が前記基準値を超える場合には、前記第三のセルのマージの方向に隣接する第四のセルを新たなマージの基点として選択し、前記合計値が前記基準値に満たない場合には、前記第三のセルを新たなマージの基点として選択する第二の選択手段と、
前記第二の選択手段が新たなマージの基点として選択するセルが列の最端にあってマージの方向に隣接するセルが存在しない場合には、前記新たなマージの基点として選択するセルが存在する列に隣接する列の最端のセルを、新たなマージの基点として選択する第三の選択手段と、
を備えることを特徴とするデータマージシステム。
【請求項3】
不正取引の可能性を示すスコアを算出するスコアリングシステムにおいて用いられるマトリックス状に配置されたセルに記録された数値データをマージするデータマージシステムであって、
前記セルは、不正判定の基準となるそれぞれ異なる因子を座標軸とするマトリックス構造に配置され、各々のセルには各々の因子に該当するサンプル件数が数値データとして記録されており、
マージの基点として第一のセルを選択する第一の選択手段と、
前記第一のセルに記録された第一の数値データと予め設定された基準値とを比較する第一の比較手段と、
前記第一の数値データが前記基準値に満たない場合には、前記第一の数値データと、前記第一のセルと同一の行に隣接する第二のセルに記録された第二の数値データの合計値を算出する算出手段と、
前記基準値と前記合計値とを比較する第二の比較手段と、
前記合計値が前記基準値を超える場合には、前記第二のセルを新たなマージの基点として選択し、前記合計値が前記基準値に満たない場合には、前記第一のセルと前記第二のセルをマージした第三のセルを設定して前記合計値を記録し、前記第三のセルを新たなマージの基点として選択する第二の選択手段と、
前記第二の選択手段が新たなマージの基点として選択するセルが行の最端にあってマージの方向に隣接するセルが存在しない場合には、前記新たなマージの基点として選択するセルが存在する行に隣接する行の最端のセルを、新たなマージの基点として選択する第三の選択手段と、
を備えることを特徴とするデータマージシステム。
【請求項4】
不正取引の可能性を示すスコアを算出するスコアリングシステムにおいて用いられるマトリックス状に配置されたセルに記録された数値データをマージするデータマージシステムであって、
前記セルは、不正判定の基準となるそれぞれ異なる因子を座標軸とするマトリックス構造に配置され、各々のセルには各々の因子に該当するサンプル件数が数値データとして記録されており、
マージの基点として第一のセルを選択する第一の選択手段と、
前記第一のセルに記録された第一の数値データと予め設定された基準値とを比較する第一の比較手段と、
前記第一の数値データが前記基準値に満たない場合には、前記第一の数値データと、前記第一のセルと同一の行に隣接する第二のセルに記録された第二の数値データの合計値を算出し、前記第一のセルと前記第二のセルをマージした第三のセルを設定して前記合計値を記録する記録手段と、
前記基準値と前記合計値とを比較する第二の比較手段と、
前記合計値が前記基準値を超える場合には、前記第三のセルのマージの方向に隣接する第四のセルを新たなマージの基点として選択し、前記合計値が前記基準値に満たない場合には、前記第三のセルを新たなマージの基点として選択する第二の選択手段と、
前記第二の選択手段が新たなマージの基点として選択するセルが行の最端にあってマージの方向に隣接するセルが存在しない場合には、前記新たなマージの基点として選択するセルが存在する行に隣接する行の最端のセルを、新たなマージの基点として選択する第三の選択手段と、
を備えることを特徴とするデータマージシステム。

【図2】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図1】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate


【公開番号】特開2006−12181(P2006−12181A)
【公開日】平成18年1月12日(2006.1.12)
【国際特許分類】
【出願番号】特願2005−215812(P2005−215812)
【出願日】平成17年7月26日(2005.7.26)
【分割の表示】特願2003−131377(P2003−131377)の分割
【原出願日】平成15年5月9日(2003.5.9)
【出願人】(397067853)株式会社インテリジェントウェイブ (20)