散布図におけるデータ点の分布領域描画方法及び散布図におけるデータ点の分布領域描画プログラム
【課題】対になった2つの変数をもつ複数のデータに対して、その散布図におけるデータ点の分布領域を確率楕円とは異なる方法で描画する。
【解決手段】対になった2つの変数をもつ複数のデータを選択する。そのデータの散布図上に複数の任意の方向を定義する。それらの任意の方向ごとにその方向のベクトル成分が最大であるデータ点をデータ点分布の代表点として選定する。得られた複数の代表点を結線して分布領域表示線を描画する。
【解決手段】対になった2つの変数をもつ複数のデータを選択する。そのデータの散布図上に複数の任意の方向を定義する。それらの任意の方向ごとにその方向のベクトル成分が最大であるデータ点をデータ点分布の代表点として選定する。得られた複数の代表点を結線して分布領域表示線を描画する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、散布図におけるデータ点の分布領域描画方法及びそれをコンピュータに実行させるためのプログラムに関するものである。
【背景技術】
【0002】
散布図は、2つの変数が対になった複数のデータの関係を表すことを目的としてよく用いられている。また、2つの変数が対になった複数のデータについて回帰直線や回帰曲線を求めてそれらのデータの関係を数値化することもできる。散布図におけるデータ点の特徴を表現する方法として、例えば特許文献1〜3に開示されているものがある。
また、散布図において、各データ点を層別する情報がある場合などは、データ点を表す印の色や形を変えて表現することで、1つの散布図に複数の層のデータ点の分布を表現することもできる。
【発明の概要】
【発明が解決しようとする課題】
【0003】
上述のように、散布図は2つの変数が対になった複数のデータの相関関係を表すのに適している。
しかし、1つの散布図に表示する層の数が多く、データ点も多い場合、データ点を表す印は重なり合い、各層における分布の特徴の認識が困難であった。
また、複数の層を表示した散布図ではなくても、図自体が小さくなるとデータ点を表す印も小さくなり、分布の特徴の認識が困難になる。
このような不具合を克服するために層ごとに確率楕円を描画する方法もあるが、確率楕円は実際の分布を精度よく表現するものではない。
【0004】
本発明の目的は、確率楕円とは異なる方法でデータ点の分布領域を描画できる散布図におけるデータ点の分布領域描画方法及び散布図におけるデータ点の分布領域描画プログラムを提供することである。
【課題を解決するための手段】
【0005】
本発明は、対になった2つの変数をもつ複数のデータに対して、その散布図上に少なくとも2方向以上の任意の方向を設定し、設定した任意の方向ごとに、その任意の方向に対して最も先頭の位置にあるデータ点をデータ点分布の代表点として選定する分布代表点選定ステップと、上記代表点を結線して分布領域表示線を描画する分布領域描画ステップと、を含んだ散布図におけるデータ点の分布領域描画方法である。
ここで、散布図とは、対になった2つの変数をもつデータを用い、2つの変数の値を平面上の座標の縦軸と横軸にとり、2つ以上のデータを点として表したものを言う。散布図は相関図とも呼ばれる。
【0006】
本発明の分布領域描画方法において、上記分布代表点選定ステップは、散布図上に基準点を定義し、上記任意の方向ごとにその方向における上記基準点を始点としたベクトル成分が最大であるデータ点を上記代表点とする例を挙げることができる。ここで、基準点は任意の方向ごとに設けられてもよいし、複数の任意の方向で共通のものが設けられてもよい。
【0007】
また、上記分布代表点選定ステップは、上記任意の方向ごとにその方向に直交する線を定義し、上記直交する線ごとに、上記直交する線に対して対応する任意の方向をプラス側としたときの上記直交する線からの距離値が最大であるデータ点を上記代表点として選定するようにしてもよい。ここで、直交する線は、データ点の分布領域に対してどの位置に配置されてもよい。直交する線の配置によっては、あるデータ点に対してマイナス値の距離値が算出されることもある。
【0008】
また、上記分布代表点選定ステップは、2方向以上の上記任意の方向のうち少なくとも1方向について、散布図の2つの座標軸に平行な方向でそれぞれプラス側の方向とマイナス側の方向の4方向のうちの1方向を上記任意の方向として用い、その任意の方向についてはデータ点の座標値に基づいて上記代表点を選定するようにしてもよい。
【0009】
また、上記分布代表点選定ステップは、2つの上記任意の方向を用いて上記代表点を2つ選定した後、その2つの代表点を通る直線で分割される領域ごとに、上記直線から最も遠いデータ点を代表点として追加するようにしてもよい。
また、上記分布代表点選定ステップは、3つ以上の上記方向を用いるようにする例を挙げることができる。
【0010】
本発明の分布領域描画方法において、上記分布領域描画ステップは、上記代表点を上記分布領域表示線が交差しない順番に結線して上記分布領域表示線を描画する例を挙げることができる。ただし、分布領域描画ステップは、各代表点から他のすべての代表点に線を結んで分布領域表示線を描画してもよい。
【0011】
本発明の散布図におけるデータ点の分布領域描画プログラムは、本発明の分布領域描画方法の各ステップをコンピュータに実行させるためのプログラムである。
【発明の効果】
【0012】
本発明の散布図におけるデータ点の分布領域描画方法は、対になった2つの変数をもつ複数のデータに対して、その散布図上に少なくとも2方向以上の任意の方向を設定し、設定した任意の方向ごとに、その任意の方向に対して最も先頭の位置にあるデータ点をデータ点分布の代表点として選定する分布代表点選定ステップと、代表点を結線して分布領域表示線を描画する分布領域描画ステップと、を含むようにしたので、対になった2つの変数をもつ複数のデータを散布図に表示した際にデータ点の分布領域の輪郭を分布領域表示線で表すことができ、その相関関係及び分布領域をひと目で判断できる。本発明の分布領域描画方法は2つ以上の層のデータ点を重ねて1つの散布図に表現する際に特に有効である。
【0013】
本発明の分布領域描画方法において、分布代表点選定ステップは、散布図上に基準点を定義し、任意の方向ごとにその方向における基準点を始点としたベクトル成分が最大であるデータ点を代表点とするようにすれば、方向を加味したベクトル成分によって任意の方向に対して最も先頭の位置にあるデータ点を代表点として選定できる。
【0014】
本発明の分布領域描画方法において、分布代表点選定ステップは、任意の方向ごとにその方向に直交する線を定義し、直交する線ごとに、直交する線に対して対応する任意の方向をプラス側としたときの直交する線からの距離値が最大であるデータ点を代表点として選定するようにすれば、基準点を設定しなくても任意の方向に対して最も先頭の位置にあるデータ点を代表点として選定することができる。
【0015】
また、上記分布代表点選定ステップは、2方向以上の任意の方向のうち少なくとも1方向について、散布図の2つの座標軸に平行な方向でそれぞれプラス側の方向とマイナス側の方向の4方向のうちの1方向を任意の方向として用い、その任意の方向についてはデータ点の座標値に基づいて上記代表点を選定するようにすれば、座標軸に平行な任意の方向について各データ点の座標値から容易に、任意の方向に対して最も先頭の位置にあるデータ点を代表点として選定することができる。
【0016】
また、分布代表点選定ステップは、2つの任意の方向を用いて代表点を2つ選定した後、その2つの代表点を通る直線で分割される領域ごとに、上記直線から最も遠いデータ点を代表点として追加するようにすれば、分布代表点選定ステップで4つの代表点を選定でき、分布領域描画ステップでデータ点の分布領域の輪郭を表す分布領域表示線を描画できるようになる。
【0017】
本発明の分布領域描画方法において、分布代表点選定ステップは、3つ以上の任意の方向を用いるようにすれば、分布代表点選定ステップで3つ以上の代表点を選定して分布領域描画ステップでデータ点の分布領域の輪郭を表す分布領域表示線を描画できるようになる。
【0018】
本発明の分布領域描画方法において、分布領域描画ステップは、代表点を分布領域表示線が交差しない順番に結線して分布領域表示線を描画するようにすれば、データ点の分布領域の輪郭のみを分布領域表示線として描画することができる。ただし、各代表点から他のすべての代表点に線を結んで分布領域表示線を描画した場合であっても、データ点の分布領域を表現することができる。
【0019】
本発明の散布図におけるデータ点の分布領域描画プログラムは、本発明の分布領域描画方法の各ステップをコンピュータに実行させるようにしたので、コンピュータを用いて本発明の分布領域描画方法を実施することができる。
【図面の簡単な説明】
【0020】
【図1】一実施例を説明するためのフローチャートである。
【図2】同実施例で用いたデータの一部を表す図表である。
【図3】図2のデータを点として表した散布図に、この実施例で用いる基準となる点(+印)と任意に定めた4方向を表す線を図示した図である。
【図4】図3に示した基準となる点(+印)と、図3に示したデータ点のうち1点を図示した図である。
【図5】図2のデータを点として表した散布図に、分布領域表示線を図示した図である。
【図6】分布領域表示線が交差しない代表点の通過順の求め方の一例を説明するための図である。
【図7】各データ点におけるベクトル成分を求める別の方法の例を説明するための図である。
【図8】2つの任意の方向を設定して分布領域表示線を描画した結果を示す図である。
【図9】3つの任意の方向を設定して分布領域表示線を描画した結果を示す図である。
【図10】任意の方向の設け方によっては不具合が生じることを説明するための図である。
【図11】基準点を設定せずに2つの代表点を求める方法を説明するための図である。
【図12】2つの代表点を用いてさらに2つの代表点を求める方法を説明するための図である。
【図13】図4に示した代表点に対して、各代表点から他のすべての代表点に線を結んで分布領域表示線を描画した結果を示す図である。
【図14】図2に示した数値データAと数値データBの散布図を属性Z1,Z2で層として表示した散布図である。
【図15】図14に示したデータ点に対して、図1から図6を参照して説明した実施例と同様の工程で属性Z1,Z2ごとに分布領域表示線を求めた結果を示す図である。
【図16】図2に示した数値データAに対する数値データBと数値データCの散布図を層として表示した散布図である。
【図17】図16に示したデータ点に対して、図1から図6を参照して説明した実施例と同様の工程で数値データB,Cごとに分布領域表示線を求めた結果を示す図である。
【発明を実施するための形態】
【0021】
図1は、本発明の一実施例を説明するためのフローチャートである。図2はこの実施例で用いたデータの一部を表す図表である。図3は、図2のデータを点として表した散布図に、この実施例で用いる基準となる点(+印)と任意に定めた4方向を表す線を図示した図である。図4は、図3に示した基準となる点(+印)と、図3に示したデータ点のうち1点を図示した図である。図5は、図2のデータを点として表した散布図に、分布領域表示線を図示した図である。図6は、分布領域表示線が交差しない代表点の通過順の求め方の一例を説明するための図である。図1から図6を参照してこの実施例を説明する。
【0022】
ステップS1:グラフ化の対象となる関連する2種類の数値データを選択する。ここでは、図2に示す表の数値データAと数値データBを選択するとして説明を進める。なお、ここではデータの属性は無視した。
【0023】
ステップS2:数値データAをX軸に数値データBをY軸に展開した各データ点におけるベクトル成分を求めるための基準点を設定する。この実施例ではデータ点分布の重心を基準点とした。ここで、データ点分布の重心とは、2つの変数が対になった複数のデータに対して変数ごとに平均値を求めた値の点を言う。
【0024】
ステップS3:基準点より放射線状に任意の方向を設定する。ここでは、4つの任意の方向B1〜B4を設定した(図3参照)。
【0025】
ステップS4:各方向においてそのベクトル成分の最も大きなデータ点を代表点として求める(分布代表点選定ステップ)。代表点は、複数のデータ点のうち、対応する任意の方向に対して最も先頭の位置にあるデータ点である。図3及び図5では、代表点となるデータ点を白抜きの丸印で図示し、代表点以外のデータ点を黒塗りの丸印で図示している。
上記ベクトル成分の算出に三角関数を用いる例を挙げることができる。図4は図3のデータ点のうち1点だけ示した図である。図4を用いて三角関数を用いた上記成分の算出方法を説明する。
【0026】
基準点を始点としデータ点を終点とするベクトルの、例えば方向B2についてのベクトル成分を求める場合、方向B2の成分は、基準点を始点とし、方向B2に伸びる線に垂線を引いたときの交点を終点とするベクトルに相当する。方向B2は予め定められたものであり、データ点と座標軸がなす角度はデータ点の座標情報から求まる。したがって、方向B2に伸びる線と、基準点を始点としデータ点を終点とするベクトルがなす角度θを求めることができる。よって、上記成分は、基準点とデータ点との距離と角度θを用いて三角関数を用いて求まる。
(上記成分の大きさ)=(基準点とデータ点との距離)×cosθ
【0027】
このように、方向B1〜B4について、各データの上記成分の大きさを求める。そして、方向B1〜B4ごとに、上記成分の大きさが最も大きいデータ点を代表点とする。この実施例では4つの代表点が得られる。
【0028】
各方向における代表点の求め方はこれに限定されるものではない。
例えば、上記の角度θが90度から270度の場合、cosθはマイナスの値となり、上記成分の大きさはマイナスの値となる。よって、重心を基準点をとして代表点を求める場合などのように上記成分の大きさがプラスの値をもつデータ点が必ず1点以上ある場合は、角度θが90度から270度のデータ点をあらかじめ代表点の候補から外すこともできる。
【0029】
ステップS5:各代表点を通過する線を描画することにより分布領域表示線を描画する(分布領域描画ステップ)。
【0030】
図6を用いて分布領域表示線が交差しない代表点の通過順の求め方の一例を説明する。
分布領域内に任意の点(+)を設定する。Y軸に平行で任意の点(+)を通過する線を線Aとし、任意の点(+)から各代表点を通過する線を線B1〜B4とした場合、線Aと線B1〜B4のなす角度を求め、代表点のうち対応する角度θ1〜4が小さいものから順に結線することで、分布領域表示線が交差しない代表点の通過順を求めることができる。
ただし、分布領域表示線が交差しない代表点の通過順の求め方はこれに限定されるものではない。
【0031】
分布領域表示線は代表点を直線で結線したものでもよいが、図5に示すように代表点を通る滑らかな曲線を描画することが好ましい。このような曲線は、例えば、Visual BasicのDrawClosedCurve関数等を用いることにより指定した点を通る滑らかな曲線を描画することができる。
このように本発明の分布領域描画方法はデータ点分布領域を線で囲んで表現することができる。
【0032】
なお、この実施例に係る発明で重要なのは、設定された任意の方向のベクトル成分が最大となるデータ点を求めることにある。各データ点についてベクトル成分を求めるための基準点の位置が異なると、求まるベクトル成分の大きさも異なるが、設定された方向のベクトル成分が最大となるデータ点は変わらないので、基準点はデータ点の分布領域内外にかかわらず、どこに設定しても構わない。
【0033】
また、この実施例では、任意の方向B1〜B4で共通の1つの基準点が設定されているが、基準点が設けられる数は任意である。例えば、任意の方向B1〜B4ごとに基準点が設けられてもよいし、任意の方向B1〜B4のうち1つ又は2つの方向に対応する第1基準点とその他の方向に対応する第2基準点が設けられてもよいし、任意の方向B1〜B4のうち2つの方向に対応する第1基準点とその他の方向それぞれに対応する第2基準点と第3基準点が設けられてもよい。
【0034】
また、任意の方向に対して最も先頭の位置にあるデータ点を求める別の方法としては、設定された任意の方向に直交する線、例えば図7に示すように任意の方向B1に直交する線C1からの距離値を求める方法もある。その距離値が最大のデータ点は、その任意の方向において最も先頭の位置にある代表点になる。
【0035】
図7では、すべてのデータ点が直交する線C1よりも任意の方向B1側に配置されているので、すべてのデータ点について、距離値はプラス値になる。しかし、この実施例に対応する発明において、距離値は必ずしもプラス値である必要はなく、マイナス値が算出されてもよい。例えば、直交する線C1がすべてのデータ点よりも任意の方向B1側に配置されれば、すべてのデータ点について、距離値はマイナス値になる。直交する線C1がデータ点の分布領域と交差して配置されれば、直交する線C1に対して任意の方向B1側に配置されているデータ点についてはプラス値の距離値が得られ、直交する線C1に対して任意の方向B1とは反対側に配置されているデータ点についてはマイナス値の距離値が得られ、直交する線C1上に配置されているデータ点については距離値としてゼロの値が得られる。
【0036】
また、設定する任意の方向は4つの方向に限定されるものではない。任意の方向の数は2つ以上あれば、4つより多くても少なくてもよい。
本発明を用いて、2つの任意の方向を設定して分布領域表示線を描画した結果を図8に示す。また、3つの任意の方向を設定して分布領域表示線を描画した結果を図9に示す。
【0037】
図8に示すように、2つの任意の方向を用いる場合には代表点が2つになるので、分布領域表示線は直線になる。
図9に示すように、3つの任意の方向を用いれば、代表点が3つになるので、領域を表す分布領域表示線を描画できる。
【0038】
図8、図9を参照して説明した実施例のように、任意の方向が4つよりも少なくなると、データ点の分布領域の表現力は劣るが、分布領域表示線は、データ点の分布領域が散布図中のどの辺りにどのように分布しているかは表現できている。
【0039】
任意の方向は散布図上のどの方向に設けても構わないが、例えば図10に示すよう設け方をすると、方向B1、方向B4の代表点はともに代表点1で同一のデータ点となり、設定した方向の数より求まる代表点の数が少なくなってしまう。そこで、設定する任意の方向は、360度に対し均等に設けられることが望ましい。
予め、360度に対し均等に方向を設けると設定するとコンピュータを用いてデータの処理を自動ですることができる。
【0040】
なお、任意の方向は、求まる代表点が重複しない方向に設定することが望ましい。
例えば、乱数を用い、散布図内の方向を無作為に選択して最初の代表点を求める。さらに乱数を用い散布図内の方向を無作為に選択して次の代表点を求める。その代表点が既に求めた代表点と重複していないかを確認する。重複していれば、さらに乱数を用い散布図内の方向を無作為に選択し、代表点を求める。この処理を繰り返して、あらかじめ必要とする数だけ代表点を求める方法もある。
【0041】
また、任意の方向の決め方として次のような方法もある。
例えば図11に示すように、Y軸に平行な2方向に任意の方向B1と任意の方向B2を設定する。ここでは、任意の方向B1ではY座標が最大の値を持つデータ点が代表点となり、任意の方向B2ではY座標が最小の値を持つデータ点が代表点となる。
【0042】
X軸又はY軸に平行な方向を設定した場合、任意の方向に対して先頭に位置するデータ点を各データ点のX座標又はY座標から容易に求めることができる利点がある。また、前述の基準点や直交する線を設ける必要もなくなる。
任意の方向B1及び方向B2より求まる代表点1及び代表点2を図11に示す。代表点1及び代表点2を結線すれば、分布領域表示線を描画できる。
【0043】
この実施例ではY軸に平行な方向でプラス側とマイナス側の2方向を任意の方向として設定しているが、任意の方向はY軸に平行な2方向に限定されない。
例えば、任意の方向の他の組み合わせとして、(1)X軸に平行な方向でプラス側とマイナス側のいずれか1方向と、Y軸に平行な方向でプラス側とマイナス側のいずれか1方向の2方向、(2)X軸に平行な方向でプラス側とマイナス側の2方向、(3)X軸に平行な方向でプラス側とマイナス側の2方向にY軸に平行な方向でプラス側又はマイナス側の1方向を加えた3方向、(4)Y軸に平行な方向でプラス側とマイナス側の2方向にX軸に平行な方向でプラス側又はマイナス側の1方向を加えた3方向、(5)X軸に平行な方向でプラス側とマイナス側及びY軸に平行な方向でプラス側とマイナス側の4方向を挙げることができる。
【0044】
また、設定する任意の方向は、散布図の座標軸に平行な方向のものと、平行でないものの組み合わせであってもよい。
例えば、図9において、任意の方向B1〜B3のうち、方向B1はY軸に平行な方向でプラス側の方向であるが、方向B2,B3はX軸及びY軸に平行な方向ではない。また、図10において、任意の方向B1〜B4のうち、方向B3はY軸に平行な方向でマイナス側の方向であり、方向B4はY軸に平行な方向でプラス側の方向であるが、方向B1,B2はX軸及びY軸に平行な方向ではない。
【0045】
このように、X軸又はY軸に平行な方向と、X軸及びY軸に平行でない方向の組み合わせを任意の方向と設定してもよい。
この場合、X軸又はY軸に平行な方向の任意の方向についてはデータ点の座標値を用いて代表点を選定することが好ましいが、X軸又はY軸に平行な任意の方向について、X軸及びY軸に平行でない方向の任意の方向に対する代表点の選定処理と同じ方法で代表点の選定を行なってもよい。
【0046】
図11に示した代表点1,2を用い、さらに代表点を追加で求める方法について図12を参照して説明する。
図12に示すように代表点1及び代表点2を通る直線Dに対して直交する方向に方向B3及び方向B4を設ける。方向B3及び方向B4より求まる代表点3及び代表点4を求める。代表点3及び代表点4を求めるにあたっては前述の基準点を設けてもよいし、直線Dからのそれぞれの方向への距離が最大となるデータ点を求めてもよい。
これにより、4つの代表点1〜4が得られる。
【0047】
なお、2つの代表点を求め、それらの代表点を通る直線に直交する2方向についてさらに代表点を求めて合計で4つの代表点を得る方法は、図11を参照して説明した方法により得られた代表点1,2を用いている方法に限定されるものではない。最初に求める2つの代表点は、図1〜5を参照して説明した方法と同様の方法により得られる2つの代表点であってもよいし、図7を参照して説明した方法と同様の方法により得られる2つの代表点であってもよい。
【0048】
上記の実施例では、代表点を分布領域表示線が交差しない順番に結線して分布領域表示線を描画しているが、本発明はこれに限定されるものではなく、各代表点から他のすべての代表点に線を結んで分布領域表示線を描画してもよい。
例えば、図3に示した代表点に対して、図13に示すように、各代表点から他のすべての代表点に線を結んで分布領域表示線を描画してもよい。この場合でも、データ点の分布領域の輪郭を適切に表現することができる。図13では代表点と代表点を直線で結んでいるが、分布領域表示線の輪郭を現す線は図5と同様に曲線であってもよい。
【0049】
図14は、図2に示した数値データAと数値データBの散布図を属性Z1,Z2で層として表示したものである。図14中で、属性Z1のデータ点は丸印で示され、属性Z2のデータ点は四角印で示されている。
図14に示すように、属性Z1,Z2のデータ点の分布領域が重なっている場合、属性Z1,Z2のデータ点の分布領域はわかりにくい。
【0050】
図15は、図14に示したデータ点に対して図1から図6を参照して説明した実施例を用いて属性Z1,Z2ごとに分布領域表示線を求めた結果を示す図である。実線は属性Z1のデータ点の分布領域表示線を示し、破線は属性Z2のデータ点の分布領域表示線を示している。
図15を見ると分かるように、属性Z1,Z2ごとに分布領域表示線を求めることにより、属性Z1,Z2のデータ点の分布領域が分かりやすくなる。
【0051】
図16は、図2に示した数値データAに対する数値データBと数値データCの散布図を層として表示したものである。図16中で、数値データBのデータ点は丸印で示され、数値データCのデータ点は四角印で示されている。
図16において、数値データB,Cのデータ点の分布領域が重なっているので、数値データB,Cのデータ点の分布領域はわかりにくい。
【0052】
図17は、図16に示したデータ点に対して図1から図6を参照して説明した実施例を用いて数値データB,Cごとに分布領域表示線を求めた結果を示す図である。実線は数値データBのデータ点の分布領域表示線を示し、破線は数値データCのデータ点の分布領域表示線を示している。
図17を見ると分かるように、数値データB,Cごとに分布領域表示線を求めることにより、数値データB,Cのデータ点の分布領域が分かりやすくなる。
このように、本発明の分布領域描画方法は2つ以上の層のデータ点を重ねて1つの散布図に表現する際に特に有効である。
【0053】
上記で説明した実施例の各ステップは、各ステップを処理するためのプログラムを作製し、コンピュータを用いてそのプログラムを実行させることによって実現できる。
【0054】
以上、本発明の実施例を説明したが、本発明はこれらに限定されるものではなく、特許請求の範囲に記載された本発明の範囲内で種々の変更が可能である。
【0055】
また、実施例の説明において描画された散布図を用いたが、本発明の各ステップにおいて描画済みの散布図が必要なわけではない。すなわち、対になった2つの変数をもつ複数のデータがあれば各ステップの処理を行なえる。
また、実施例の説明において、描画された散布図に、基準点や、方向を定義するための直線や矢印などを図示したが、本発明の各ステップにおいて、これらの基準点、直線、矢印の図示も必ずしも必要ではない。
また、本発明において、代表点を求めるのに用いる任意の方向は2方向以上でありその数に制限はない。
【産業上の利用可能性】
【0056】
本発明は、2つの変数が対になった複数のデータを散布図に表す際に適用できる。
【符号の説明】
【0057】
1〜4 代表点
A Y軸に平行で任意の点(+)を通過する線
B1〜B4 任意の方向
C1 任意の方向B1に直交する線
D 代表点1及び代表点2を通る直線
【先行技術文献】
【特許文献】
【0058】
【特許文献1】特許第3639636号公報
【特許文献2】特許第3944439号公報
【特許文献3】特開2007−248198号公報
【特許文献4】特許第3888938号公報
【技術分野】
【0001】
本発明は、散布図におけるデータ点の分布領域描画方法及びそれをコンピュータに実行させるためのプログラムに関するものである。
【背景技術】
【0002】
散布図は、2つの変数が対になった複数のデータの関係を表すことを目的としてよく用いられている。また、2つの変数が対になった複数のデータについて回帰直線や回帰曲線を求めてそれらのデータの関係を数値化することもできる。散布図におけるデータ点の特徴を表現する方法として、例えば特許文献1〜3に開示されているものがある。
また、散布図において、各データ点を層別する情報がある場合などは、データ点を表す印の色や形を変えて表現することで、1つの散布図に複数の層のデータ点の分布を表現することもできる。
【発明の概要】
【発明が解決しようとする課題】
【0003】
上述のように、散布図は2つの変数が対になった複数のデータの相関関係を表すのに適している。
しかし、1つの散布図に表示する層の数が多く、データ点も多い場合、データ点を表す印は重なり合い、各層における分布の特徴の認識が困難であった。
また、複数の層を表示した散布図ではなくても、図自体が小さくなるとデータ点を表す印も小さくなり、分布の特徴の認識が困難になる。
このような不具合を克服するために層ごとに確率楕円を描画する方法もあるが、確率楕円は実際の分布を精度よく表現するものではない。
【0004】
本発明の目的は、確率楕円とは異なる方法でデータ点の分布領域を描画できる散布図におけるデータ点の分布領域描画方法及び散布図におけるデータ点の分布領域描画プログラムを提供することである。
【課題を解決するための手段】
【0005】
本発明は、対になった2つの変数をもつ複数のデータに対して、その散布図上に少なくとも2方向以上の任意の方向を設定し、設定した任意の方向ごとに、その任意の方向に対して最も先頭の位置にあるデータ点をデータ点分布の代表点として選定する分布代表点選定ステップと、上記代表点を結線して分布領域表示線を描画する分布領域描画ステップと、を含んだ散布図におけるデータ点の分布領域描画方法である。
ここで、散布図とは、対になった2つの変数をもつデータを用い、2つの変数の値を平面上の座標の縦軸と横軸にとり、2つ以上のデータを点として表したものを言う。散布図は相関図とも呼ばれる。
【0006】
本発明の分布領域描画方法において、上記分布代表点選定ステップは、散布図上に基準点を定義し、上記任意の方向ごとにその方向における上記基準点を始点としたベクトル成分が最大であるデータ点を上記代表点とする例を挙げることができる。ここで、基準点は任意の方向ごとに設けられてもよいし、複数の任意の方向で共通のものが設けられてもよい。
【0007】
また、上記分布代表点選定ステップは、上記任意の方向ごとにその方向に直交する線を定義し、上記直交する線ごとに、上記直交する線に対して対応する任意の方向をプラス側としたときの上記直交する線からの距離値が最大であるデータ点を上記代表点として選定するようにしてもよい。ここで、直交する線は、データ点の分布領域に対してどの位置に配置されてもよい。直交する線の配置によっては、あるデータ点に対してマイナス値の距離値が算出されることもある。
【0008】
また、上記分布代表点選定ステップは、2方向以上の上記任意の方向のうち少なくとも1方向について、散布図の2つの座標軸に平行な方向でそれぞれプラス側の方向とマイナス側の方向の4方向のうちの1方向を上記任意の方向として用い、その任意の方向についてはデータ点の座標値に基づいて上記代表点を選定するようにしてもよい。
【0009】
また、上記分布代表点選定ステップは、2つの上記任意の方向を用いて上記代表点を2つ選定した後、その2つの代表点を通る直線で分割される領域ごとに、上記直線から最も遠いデータ点を代表点として追加するようにしてもよい。
また、上記分布代表点選定ステップは、3つ以上の上記方向を用いるようにする例を挙げることができる。
【0010】
本発明の分布領域描画方法において、上記分布領域描画ステップは、上記代表点を上記分布領域表示線が交差しない順番に結線して上記分布領域表示線を描画する例を挙げることができる。ただし、分布領域描画ステップは、各代表点から他のすべての代表点に線を結んで分布領域表示線を描画してもよい。
【0011】
本発明の散布図におけるデータ点の分布領域描画プログラムは、本発明の分布領域描画方法の各ステップをコンピュータに実行させるためのプログラムである。
【発明の効果】
【0012】
本発明の散布図におけるデータ点の分布領域描画方法は、対になった2つの変数をもつ複数のデータに対して、その散布図上に少なくとも2方向以上の任意の方向を設定し、設定した任意の方向ごとに、その任意の方向に対して最も先頭の位置にあるデータ点をデータ点分布の代表点として選定する分布代表点選定ステップと、代表点を結線して分布領域表示線を描画する分布領域描画ステップと、を含むようにしたので、対になった2つの変数をもつ複数のデータを散布図に表示した際にデータ点の分布領域の輪郭を分布領域表示線で表すことができ、その相関関係及び分布領域をひと目で判断できる。本発明の分布領域描画方法は2つ以上の層のデータ点を重ねて1つの散布図に表現する際に特に有効である。
【0013】
本発明の分布領域描画方法において、分布代表点選定ステップは、散布図上に基準点を定義し、任意の方向ごとにその方向における基準点を始点としたベクトル成分が最大であるデータ点を代表点とするようにすれば、方向を加味したベクトル成分によって任意の方向に対して最も先頭の位置にあるデータ点を代表点として選定できる。
【0014】
本発明の分布領域描画方法において、分布代表点選定ステップは、任意の方向ごとにその方向に直交する線を定義し、直交する線ごとに、直交する線に対して対応する任意の方向をプラス側としたときの直交する線からの距離値が最大であるデータ点を代表点として選定するようにすれば、基準点を設定しなくても任意の方向に対して最も先頭の位置にあるデータ点を代表点として選定することができる。
【0015】
また、上記分布代表点選定ステップは、2方向以上の任意の方向のうち少なくとも1方向について、散布図の2つの座標軸に平行な方向でそれぞれプラス側の方向とマイナス側の方向の4方向のうちの1方向を任意の方向として用い、その任意の方向についてはデータ点の座標値に基づいて上記代表点を選定するようにすれば、座標軸に平行な任意の方向について各データ点の座標値から容易に、任意の方向に対して最も先頭の位置にあるデータ点を代表点として選定することができる。
【0016】
また、分布代表点選定ステップは、2つの任意の方向を用いて代表点を2つ選定した後、その2つの代表点を通る直線で分割される領域ごとに、上記直線から最も遠いデータ点を代表点として追加するようにすれば、分布代表点選定ステップで4つの代表点を選定でき、分布領域描画ステップでデータ点の分布領域の輪郭を表す分布領域表示線を描画できるようになる。
【0017】
本発明の分布領域描画方法において、分布代表点選定ステップは、3つ以上の任意の方向を用いるようにすれば、分布代表点選定ステップで3つ以上の代表点を選定して分布領域描画ステップでデータ点の分布領域の輪郭を表す分布領域表示線を描画できるようになる。
【0018】
本発明の分布領域描画方法において、分布領域描画ステップは、代表点を分布領域表示線が交差しない順番に結線して分布領域表示線を描画するようにすれば、データ点の分布領域の輪郭のみを分布領域表示線として描画することができる。ただし、各代表点から他のすべての代表点に線を結んで分布領域表示線を描画した場合であっても、データ点の分布領域を表現することができる。
【0019】
本発明の散布図におけるデータ点の分布領域描画プログラムは、本発明の分布領域描画方法の各ステップをコンピュータに実行させるようにしたので、コンピュータを用いて本発明の分布領域描画方法を実施することができる。
【図面の簡単な説明】
【0020】
【図1】一実施例を説明するためのフローチャートである。
【図2】同実施例で用いたデータの一部を表す図表である。
【図3】図2のデータを点として表した散布図に、この実施例で用いる基準となる点(+印)と任意に定めた4方向を表す線を図示した図である。
【図4】図3に示した基準となる点(+印)と、図3に示したデータ点のうち1点を図示した図である。
【図5】図2のデータを点として表した散布図に、分布領域表示線を図示した図である。
【図6】分布領域表示線が交差しない代表点の通過順の求め方の一例を説明するための図である。
【図7】各データ点におけるベクトル成分を求める別の方法の例を説明するための図である。
【図8】2つの任意の方向を設定して分布領域表示線を描画した結果を示す図である。
【図9】3つの任意の方向を設定して分布領域表示線を描画した結果を示す図である。
【図10】任意の方向の設け方によっては不具合が生じることを説明するための図である。
【図11】基準点を設定せずに2つの代表点を求める方法を説明するための図である。
【図12】2つの代表点を用いてさらに2つの代表点を求める方法を説明するための図である。
【図13】図4に示した代表点に対して、各代表点から他のすべての代表点に線を結んで分布領域表示線を描画した結果を示す図である。
【図14】図2に示した数値データAと数値データBの散布図を属性Z1,Z2で層として表示した散布図である。
【図15】図14に示したデータ点に対して、図1から図6を参照して説明した実施例と同様の工程で属性Z1,Z2ごとに分布領域表示線を求めた結果を示す図である。
【図16】図2に示した数値データAに対する数値データBと数値データCの散布図を層として表示した散布図である。
【図17】図16に示したデータ点に対して、図1から図6を参照して説明した実施例と同様の工程で数値データB,Cごとに分布領域表示線を求めた結果を示す図である。
【発明を実施するための形態】
【0021】
図1は、本発明の一実施例を説明するためのフローチャートである。図2はこの実施例で用いたデータの一部を表す図表である。図3は、図2のデータを点として表した散布図に、この実施例で用いる基準となる点(+印)と任意に定めた4方向を表す線を図示した図である。図4は、図3に示した基準となる点(+印)と、図3に示したデータ点のうち1点を図示した図である。図5は、図2のデータを点として表した散布図に、分布領域表示線を図示した図である。図6は、分布領域表示線が交差しない代表点の通過順の求め方の一例を説明するための図である。図1から図6を参照してこの実施例を説明する。
【0022】
ステップS1:グラフ化の対象となる関連する2種類の数値データを選択する。ここでは、図2に示す表の数値データAと数値データBを選択するとして説明を進める。なお、ここではデータの属性は無視した。
【0023】
ステップS2:数値データAをX軸に数値データBをY軸に展開した各データ点におけるベクトル成分を求めるための基準点を設定する。この実施例ではデータ点分布の重心を基準点とした。ここで、データ点分布の重心とは、2つの変数が対になった複数のデータに対して変数ごとに平均値を求めた値の点を言う。
【0024】
ステップS3:基準点より放射線状に任意の方向を設定する。ここでは、4つの任意の方向B1〜B4を設定した(図3参照)。
【0025】
ステップS4:各方向においてそのベクトル成分の最も大きなデータ点を代表点として求める(分布代表点選定ステップ)。代表点は、複数のデータ点のうち、対応する任意の方向に対して最も先頭の位置にあるデータ点である。図3及び図5では、代表点となるデータ点を白抜きの丸印で図示し、代表点以外のデータ点を黒塗りの丸印で図示している。
上記ベクトル成分の算出に三角関数を用いる例を挙げることができる。図4は図3のデータ点のうち1点だけ示した図である。図4を用いて三角関数を用いた上記成分の算出方法を説明する。
【0026】
基準点を始点としデータ点を終点とするベクトルの、例えば方向B2についてのベクトル成分を求める場合、方向B2の成分は、基準点を始点とし、方向B2に伸びる線に垂線を引いたときの交点を終点とするベクトルに相当する。方向B2は予め定められたものであり、データ点と座標軸がなす角度はデータ点の座標情報から求まる。したがって、方向B2に伸びる線と、基準点を始点としデータ点を終点とするベクトルがなす角度θを求めることができる。よって、上記成分は、基準点とデータ点との距離と角度θを用いて三角関数を用いて求まる。
(上記成分の大きさ)=(基準点とデータ点との距離)×cosθ
【0027】
このように、方向B1〜B4について、各データの上記成分の大きさを求める。そして、方向B1〜B4ごとに、上記成分の大きさが最も大きいデータ点を代表点とする。この実施例では4つの代表点が得られる。
【0028】
各方向における代表点の求め方はこれに限定されるものではない。
例えば、上記の角度θが90度から270度の場合、cosθはマイナスの値となり、上記成分の大きさはマイナスの値となる。よって、重心を基準点をとして代表点を求める場合などのように上記成分の大きさがプラスの値をもつデータ点が必ず1点以上ある場合は、角度θが90度から270度のデータ点をあらかじめ代表点の候補から外すこともできる。
【0029】
ステップS5:各代表点を通過する線を描画することにより分布領域表示線を描画する(分布領域描画ステップ)。
【0030】
図6を用いて分布領域表示線が交差しない代表点の通過順の求め方の一例を説明する。
分布領域内に任意の点(+)を設定する。Y軸に平行で任意の点(+)を通過する線を線Aとし、任意の点(+)から各代表点を通過する線を線B1〜B4とした場合、線Aと線B1〜B4のなす角度を求め、代表点のうち対応する角度θ1〜4が小さいものから順に結線することで、分布領域表示線が交差しない代表点の通過順を求めることができる。
ただし、分布領域表示線が交差しない代表点の通過順の求め方はこれに限定されるものではない。
【0031】
分布領域表示線は代表点を直線で結線したものでもよいが、図5に示すように代表点を通る滑らかな曲線を描画することが好ましい。このような曲線は、例えば、Visual BasicのDrawClosedCurve関数等を用いることにより指定した点を通る滑らかな曲線を描画することができる。
このように本発明の分布領域描画方法はデータ点分布領域を線で囲んで表現することができる。
【0032】
なお、この実施例に係る発明で重要なのは、設定された任意の方向のベクトル成分が最大となるデータ点を求めることにある。各データ点についてベクトル成分を求めるための基準点の位置が異なると、求まるベクトル成分の大きさも異なるが、設定された方向のベクトル成分が最大となるデータ点は変わらないので、基準点はデータ点の分布領域内外にかかわらず、どこに設定しても構わない。
【0033】
また、この実施例では、任意の方向B1〜B4で共通の1つの基準点が設定されているが、基準点が設けられる数は任意である。例えば、任意の方向B1〜B4ごとに基準点が設けられてもよいし、任意の方向B1〜B4のうち1つ又は2つの方向に対応する第1基準点とその他の方向に対応する第2基準点が設けられてもよいし、任意の方向B1〜B4のうち2つの方向に対応する第1基準点とその他の方向それぞれに対応する第2基準点と第3基準点が設けられてもよい。
【0034】
また、任意の方向に対して最も先頭の位置にあるデータ点を求める別の方法としては、設定された任意の方向に直交する線、例えば図7に示すように任意の方向B1に直交する線C1からの距離値を求める方法もある。その距離値が最大のデータ点は、その任意の方向において最も先頭の位置にある代表点になる。
【0035】
図7では、すべてのデータ点が直交する線C1よりも任意の方向B1側に配置されているので、すべてのデータ点について、距離値はプラス値になる。しかし、この実施例に対応する発明において、距離値は必ずしもプラス値である必要はなく、マイナス値が算出されてもよい。例えば、直交する線C1がすべてのデータ点よりも任意の方向B1側に配置されれば、すべてのデータ点について、距離値はマイナス値になる。直交する線C1がデータ点の分布領域と交差して配置されれば、直交する線C1に対して任意の方向B1側に配置されているデータ点についてはプラス値の距離値が得られ、直交する線C1に対して任意の方向B1とは反対側に配置されているデータ点についてはマイナス値の距離値が得られ、直交する線C1上に配置されているデータ点については距離値としてゼロの値が得られる。
【0036】
また、設定する任意の方向は4つの方向に限定されるものではない。任意の方向の数は2つ以上あれば、4つより多くても少なくてもよい。
本発明を用いて、2つの任意の方向を設定して分布領域表示線を描画した結果を図8に示す。また、3つの任意の方向を設定して分布領域表示線を描画した結果を図9に示す。
【0037】
図8に示すように、2つの任意の方向を用いる場合には代表点が2つになるので、分布領域表示線は直線になる。
図9に示すように、3つの任意の方向を用いれば、代表点が3つになるので、領域を表す分布領域表示線を描画できる。
【0038】
図8、図9を参照して説明した実施例のように、任意の方向が4つよりも少なくなると、データ点の分布領域の表現力は劣るが、分布領域表示線は、データ点の分布領域が散布図中のどの辺りにどのように分布しているかは表現できている。
【0039】
任意の方向は散布図上のどの方向に設けても構わないが、例えば図10に示すよう設け方をすると、方向B1、方向B4の代表点はともに代表点1で同一のデータ点となり、設定した方向の数より求まる代表点の数が少なくなってしまう。そこで、設定する任意の方向は、360度に対し均等に設けられることが望ましい。
予め、360度に対し均等に方向を設けると設定するとコンピュータを用いてデータの処理を自動ですることができる。
【0040】
なお、任意の方向は、求まる代表点が重複しない方向に設定することが望ましい。
例えば、乱数を用い、散布図内の方向を無作為に選択して最初の代表点を求める。さらに乱数を用い散布図内の方向を無作為に選択して次の代表点を求める。その代表点が既に求めた代表点と重複していないかを確認する。重複していれば、さらに乱数を用い散布図内の方向を無作為に選択し、代表点を求める。この処理を繰り返して、あらかじめ必要とする数だけ代表点を求める方法もある。
【0041】
また、任意の方向の決め方として次のような方法もある。
例えば図11に示すように、Y軸に平行な2方向に任意の方向B1と任意の方向B2を設定する。ここでは、任意の方向B1ではY座標が最大の値を持つデータ点が代表点となり、任意の方向B2ではY座標が最小の値を持つデータ点が代表点となる。
【0042】
X軸又はY軸に平行な方向を設定した場合、任意の方向に対して先頭に位置するデータ点を各データ点のX座標又はY座標から容易に求めることができる利点がある。また、前述の基準点や直交する線を設ける必要もなくなる。
任意の方向B1及び方向B2より求まる代表点1及び代表点2を図11に示す。代表点1及び代表点2を結線すれば、分布領域表示線を描画できる。
【0043】
この実施例ではY軸に平行な方向でプラス側とマイナス側の2方向を任意の方向として設定しているが、任意の方向はY軸に平行な2方向に限定されない。
例えば、任意の方向の他の組み合わせとして、(1)X軸に平行な方向でプラス側とマイナス側のいずれか1方向と、Y軸に平行な方向でプラス側とマイナス側のいずれか1方向の2方向、(2)X軸に平行な方向でプラス側とマイナス側の2方向、(3)X軸に平行な方向でプラス側とマイナス側の2方向にY軸に平行な方向でプラス側又はマイナス側の1方向を加えた3方向、(4)Y軸に平行な方向でプラス側とマイナス側の2方向にX軸に平行な方向でプラス側又はマイナス側の1方向を加えた3方向、(5)X軸に平行な方向でプラス側とマイナス側及びY軸に平行な方向でプラス側とマイナス側の4方向を挙げることができる。
【0044】
また、設定する任意の方向は、散布図の座標軸に平行な方向のものと、平行でないものの組み合わせであってもよい。
例えば、図9において、任意の方向B1〜B3のうち、方向B1はY軸に平行な方向でプラス側の方向であるが、方向B2,B3はX軸及びY軸に平行な方向ではない。また、図10において、任意の方向B1〜B4のうち、方向B3はY軸に平行な方向でマイナス側の方向であり、方向B4はY軸に平行な方向でプラス側の方向であるが、方向B1,B2はX軸及びY軸に平行な方向ではない。
【0045】
このように、X軸又はY軸に平行な方向と、X軸及びY軸に平行でない方向の組み合わせを任意の方向と設定してもよい。
この場合、X軸又はY軸に平行な方向の任意の方向についてはデータ点の座標値を用いて代表点を選定することが好ましいが、X軸又はY軸に平行な任意の方向について、X軸及びY軸に平行でない方向の任意の方向に対する代表点の選定処理と同じ方法で代表点の選定を行なってもよい。
【0046】
図11に示した代表点1,2を用い、さらに代表点を追加で求める方法について図12を参照して説明する。
図12に示すように代表点1及び代表点2を通る直線Dに対して直交する方向に方向B3及び方向B4を設ける。方向B3及び方向B4より求まる代表点3及び代表点4を求める。代表点3及び代表点4を求めるにあたっては前述の基準点を設けてもよいし、直線Dからのそれぞれの方向への距離が最大となるデータ点を求めてもよい。
これにより、4つの代表点1〜4が得られる。
【0047】
なお、2つの代表点を求め、それらの代表点を通る直線に直交する2方向についてさらに代表点を求めて合計で4つの代表点を得る方法は、図11を参照して説明した方法により得られた代表点1,2を用いている方法に限定されるものではない。最初に求める2つの代表点は、図1〜5を参照して説明した方法と同様の方法により得られる2つの代表点であってもよいし、図7を参照して説明した方法と同様の方法により得られる2つの代表点であってもよい。
【0048】
上記の実施例では、代表点を分布領域表示線が交差しない順番に結線して分布領域表示線を描画しているが、本発明はこれに限定されるものではなく、各代表点から他のすべての代表点に線を結んで分布領域表示線を描画してもよい。
例えば、図3に示した代表点に対して、図13に示すように、各代表点から他のすべての代表点に線を結んで分布領域表示線を描画してもよい。この場合でも、データ点の分布領域の輪郭を適切に表現することができる。図13では代表点と代表点を直線で結んでいるが、分布領域表示線の輪郭を現す線は図5と同様に曲線であってもよい。
【0049】
図14は、図2に示した数値データAと数値データBの散布図を属性Z1,Z2で層として表示したものである。図14中で、属性Z1のデータ点は丸印で示され、属性Z2のデータ点は四角印で示されている。
図14に示すように、属性Z1,Z2のデータ点の分布領域が重なっている場合、属性Z1,Z2のデータ点の分布領域はわかりにくい。
【0050】
図15は、図14に示したデータ点に対して図1から図6を参照して説明した実施例を用いて属性Z1,Z2ごとに分布領域表示線を求めた結果を示す図である。実線は属性Z1のデータ点の分布領域表示線を示し、破線は属性Z2のデータ点の分布領域表示線を示している。
図15を見ると分かるように、属性Z1,Z2ごとに分布領域表示線を求めることにより、属性Z1,Z2のデータ点の分布領域が分かりやすくなる。
【0051】
図16は、図2に示した数値データAに対する数値データBと数値データCの散布図を層として表示したものである。図16中で、数値データBのデータ点は丸印で示され、数値データCのデータ点は四角印で示されている。
図16において、数値データB,Cのデータ点の分布領域が重なっているので、数値データB,Cのデータ点の分布領域はわかりにくい。
【0052】
図17は、図16に示したデータ点に対して図1から図6を参照して説明した実施例を用いて数値データB,Cごとに分布領域表示線を求めた結果を示す図である。実線は数値データBのデータ点の分布領域表示線を示し、破線は数値データCのデータ点の分布領域表示線を示している。
図17を見ると分かるように、数値データB,Cごとに分布領域表示線を求めることにより、数値データB,Cのデータ点の分布領域が分かりやすくなる。
このように、本発明の分布領域描画方法は2つ以上の層のデータ点を重ねて1つの散布図に表現する際に特に有効である。
【0053】
上記で説明した実施例の各ステップは、各ステップを処理するためのプログラムを作製し、コンピュータを用いてそのプログラムを実行させることによって実現できる。
【0054】
以上、本発明の実施例を説明したが、本発明はこれらに限定されるものではなく、特許請求の範囲に記載された本発明の範囲内で種々の変更が可能である。
【0055】
また、実施例の説明において描画された散布図を用いたが、本発明の各ステップにおいて描画済みの散布図が必要なわけではない。すなわち、対になった2つの変数をもつ複数のデータがあれば各ステップの処理を行なえる。
また、実施例の説明において、描画された散布図に、基準点や、方向を定義するための直線や矢印などを図示したが、本発明の各ステップにおいて、これらの基準点、直線、矢印の図示も必ずしも必要ではない。
また、本発明において、代表点を求めるのに用いる任意の方向は2方向以上でありその数に制限はない。
【産業上の利用可能性】
【0056】
本発明は、2つの変数が対になった複数のデータを散布図に表す際に適用できる。
【符号の説明】
【0057】
1〜4 代表点
A Y軸に平行で任意の点(+)を通過する線
B1〜B4 任意の方向
C1 任意の方向B1に直交する線
D 代表点1及び代表点2を通る直線
【先行技術文献】
【特許文献】
【0058】
【特許文献1】特許第3639636号公報
【特許文献2】特許第3944439号公報
【特許文献3】特開2007−248198号公報
【特許文献4】特許第3888938号公報
【特許請求の範囲】
【請求項1】
対になった2つの変数をもつ複数のデータに対して、その散布図上に2方向以上の任意の方向を定義し、それらの任意の方向ごとに、その任意の方向に対して最も先頭の位置にあるデータ点をデータ点分布の代表点として選定する分布代表点選定ステップと、
前記代表点を結線して分布領域表示線を描画する分布領域描画ステップと、を含んだ散布図におけるデータ点の分布領域描画方法。
【請求項2】
前記分布代表点選定ステップは、散布図上に基準点を定義し、前記任意の方向ごとにその方向における前記基準点を始点としたベクトル成分が最大であるデータ点を前記代表点とする請求項1に記載の分布領域描画方法。
【請求項3】
前記分布代表点選定ステップは、前記任意の方向ごとにその方向に直交する線を定義し、前記直交する線ごとに、前記直交する線に対して対応する任意の方向をプラス側としたときの前記直交する線からの距離値が最大であるデータ点を前記代表点として選定する請求項1に記載の分布領域描画方法。
【請求項4】
前記分布代表点選定ステップは、2方向以上の前記任意の方向のうち少なくとも1方向について、散布図の2つの座標軸に平行な方向でそれぞれプラス側の方向とマイナス側の方向の4方向のうちの1方向を前記任意の方向として用い、その任意の方向についてはデータ点の座標値に基づいて前記代表点を選定する請求項1から3に記載の分布領域描画方法。
【請求項5】
前記分布代表点選定ステップは、2つの前記任意の方向を用いて前記代表点を2つ選定した後、その2つの代表点を通る直線で分割される領域ごとに、前記直線から最も遠いデータ点を代表点として追加する請求項1から4のいずれか一項に記載の分布領域描画方法。
【請求項6】
前記分布代表点選定ステップは、3つ以上の前記任意の方向を用いる請求項1から4のいずれか一項に記載の分布領域描画方法。
【請求項7】
前記分布領域描画ステップは、前記代表点を前記分布領域表示線が交差しない順番に結線して前記分布領域表示線を描画する請求項1から6のいずれか一項に記載の分布領域描画方法。
【請求項8】
請求項1から7のいずれか一項に記載の各ステップをコンピュータに実行させるための、散布図におけるデータ点の分布領域描画プログラム。
【請求項1】
対になった2つの変数をもつ複数のデータに対して、その散布図上に2方向以上の任意の方向を定義し、それらの任意の方向ごとに、その任意の方向に対して最も先頭の位置にあるデータ点をデータ点分布の代表点として選定する分布代表点選定ステップと、
前記代表点を結線して分布領域表示線を描画する分布領域描画ステップと、を含んだ散布図におけるデータ点の分布領域描画方法。
【請求項2】
前記分布代表点選定ステップは、散布図上に基準点を定義し、前記任意の方向ごとにその方向における前記基準点を始点としたベクトル成分が最大であるデータ点を前記代表点とする請求項1に記載の分布領域描画方法。
【請求項3】
前記分布代表点選定ステップは、前記任意の方向ごとにその方向に直交する線を定義し、前記直交する線ごとに、前記直交する線に対して対応する任意の方向をプラス側としたときの前記直交する線からの距離値が最大であるデータ点を前記代表点として選定する請求項1に記載の分布領域描画方法。
【請求項4】
前記分布代表点選定ステップは、2方向以上の前記任意の方向のうち少なくとも1方向について、散布図の2つの座標軸に平行な方向でそれぞれプラス側の方向とマイナス側の方向の4方向のうちの1方向を前記任意の方向として用い、その任意の方向についてはデータ点の座標値に基づいて前記代表点を選定する請求項1から3に記載の分布領域描画方法。
【請求項5】
前記分布代表点選定ステップは、2つの前記任意の方向を用いて前記代表点を2つ選定した後、その2つの代表点を通る直線で分割される領域ごとに、前記直線から最も遠いデータ点を代表点として追加する請求項1から4のいずれか一項に記載の分布領域描画方法。
【請求項6】
前記分布代表点選定ステップは、3つ以上の前記任意の方向を用いる請求項1から4のいずれか一項に記載の分布領域描画方法。
【請求項7】
前記分布領域描画ステップは、前記代表点を前記分布領域表示線が交差しない順番に結線して前記分布領域表示線を描画する請求項1から6のいずれか一項に記載の分布領域描画方法。
【請求項8】
請求項1から7のいずれか一項に記載の各ステップをコンピュータに実行させるための、散布図におけるデータ点の分布領域描画プログラム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【公開番号】特開2011−108177(P2011−108177A)
【公開日】平成23年6月2日(2011.6.2)
【国際特許分類】
【出願番号】特願2009−265265(P2009−265265)
【出願日】平成21年11月20日(2009.11.20)
【出願人】(000006747)株式会社リコー (37,907)
【Fターム(参考)】
【公開日】平成23年6月2日(2011.6.2)
【国際特許分類】
【出願日】平成21年11月20日(2009.11.20)
【出願人】(000006747)株式会社リコー (37,907)
【Fターム(参考)】
[ Back to top ]