説明

社会ネットワーク情報を含む社会調査システム、標本抽出システム、社会調査方法および社会調査用プログラム

【課題】スノーボール・サンプリング調査手法に用いるスノーボール回答者を、主回答者の紹介を介した選択に寄らずに標本として抽出できる標本抽出システムを提供する。
【解決手段】既知の社会ネットワークデータを格納する社会ネットワークデータ保持手段と、前記社会ネットワークデータ保持手段に格納された社会ネットワークデータを参照しながらスノーボール・サンプリング調査手法に用いる主回答者と副回答者のペアを標本として抽出する標本抽出手段とを備え、主回答者への事前調査無しに標本のペアを抽出可能とする。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は社会調査(アンケート)を行うシステム、方法およびプログラムに関し、特に、スノーボール・サンプリングと呼ばれる特殊な標本抽出手法を用いて社会調査を実施する社会調査システム、およびスノーボール・サンプリング調査に用いる標本を抽出する標本抽出システム、社会調査方法もしくは社会調査用プログラムに関する。
【背景技術】
【0002】
人々の意識や行動などの実態をとらえるための方法として社会調査、特に、俗に「アンケート」とも呼ばれる、調査票(質問紙)を用いる社会調査(以下単に社会調査)は、様々な分野で広く用いられている。
社会調査は従来、調査票(質問紙)と呼ばれる「紙」を用いて回答を得たり電話により直接質問・回答を得たりすることが多かった。しかし、近年ではインターネットの普及に伴い、回答の収集に電子メールやウェブを用いるインターネット調査(例えば、非特許文献1、200ページ〜)も普及してきた。インターネット調査にはさまざまな形態があるが、調査手法上の観点から言えば、従来の社会調査における様々な作業プロセスにおいて、インターネット上の類似のサービスを利用するものして理解される。例えば、調査回答の依頼状を郵送する代わりに電子メールを用いる、紙面の調査票に回答を記述する代わりにウェブを用いて回答をする、などである。
【0003】
本願に係るスノーボール・サンプリング調査とは、スノーボール・サンプリングと呼ばれる標本抽出技法を用いた社会調査のことである。標本抽出とは社会調査において調査対象の母集団全体から質問の回答候補者を抽出することであり、通常では無作為抽出を行うために多段抽出法などを用いることが多い。このような通常の標本抽出手法は、母集団全体の中から標本一人一人を独立に取り出すため、通常抽出された標本は互いに全くの他人となる。
これに対してスノーボール・サンプリングは、通常の標本抽出とは異なり、ランダムに抽出した主回答者と呼ばれる標本と共にスノーボール回答者と呼ばれる標本を主回答者の「知り合い」の中から紹介してもらい、主回答者とスノーボール回答者とを組(ペア)として抽出し、データの収集・分析を行う。このように、回答者をお互いに知り合いのペアとして構成することで、調査者は、ペアの回答者同士、相互の認識に関する質問を盛り込むことが可能となる。これによって、主観(自己の)認識と客観(他者の)認識の差を測定する、といった通常の標本抽出では不可能な分析が可能となるとされる。この調査の応用例としては、例えば、特許文献1ではスノーボール・サンプリング調査に基づく調査データを元に購買意欲を算出する社会調査回答解析処理が提案されている。
【0004】
また、特定の社会ネットワーク内から、特定の対象を抽出する情報処理システムは、例えば特許文献2に記載されている。特許文献2に記載された情報処理システムでは、インターネット調査を用いて、社会集団の中で他人により強く影響を与える(ことが可能な)発言者(インフルエンサー)を評価するインフルエンサー選考コンポーネントを備え、情報処理システムとして、多くの対象の中から特定の人間を抽出している。
【0005】
上記スノーボール・サンプリング調査は、郵送による調査だけでなく、インターネット調査ともして実施されている。例えば、非特許文献2および非特許文献3では、郵送、あるいは、ウェブ上で実施したインターネット調査の形態のスノーボール・サンプリング調査の報告がなされている。しかし、調査手法上の観点からは、他のインターネット調査と同様、調査用紙を用いるスノーボール・サンプリング調査をインターネット上で実施したものと考えられる。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2008−217424号公報
【特許文献2】特開2008−146655号公報
【非特許文献】
【0007】
【非特許文献1】林知己夫編、「社会調査ハンドブック」、朝倉書店 pp.200−241
【非特許文献2】池田謙一著、「コミュニケーション」、東京大学出版会、2000年、p.209(付録:分析に用いた世論調査データ)
【非特許文献3】宮田加久子、池田謙一編著、「ネットが変える消費者行動」、NTT出版、2008年、pp.10−15
【発明の概要】
【発明が解決しようとする課題】
【0008】
社会調査にスノーボール・サンプリング手法を用いることは、通常の標本抽出とは大きく異なるため、より高度な分析が可能になる。また、非特許文献3に開示されているように、その有効性も実証されている。一方で、スノーボール・サンプリング調査手法には、多くの欠点もある。
【0009】
スノーボール・サンプリング手法を用いた社会調査のいくつかの問題点を例示すれば、一つ目の問題点は回答の回収に時間と手間がかかるということである。その理由は、主回答者の回答に基づいてスノーボール回答者への依頼を行う必要があるため、時間がかかるだけでなく、主回答者に依頼するスノーボール回答者(副回答者)の選択をさせるという心理的負荷をあたえることである。
【0010】
また別の問題点としては、主回答者とスノーボール回答者のペアが生まれにくいということである。その理由は、主回答者に対して数名程度のスノーボール回答者の紹介を依頼し、依頼されたスノーボール回答者が回答を承諾したペアのみが主回答者・副回答者のペアとして有効回答となるためである。換言すれば、主回答者がスノーボール回答者を選択する時点では、スノーボール回答者の回答意思の確認が無い為、有効回答となるペアが成立しにくい。また、多くの場合、ペアが成立しなくても、スノーボール回答者の再選択は行なわれない。
【0011】
同様に、ある個人(主回答者)に対する客観(他者の)認識を測定するための精度を高くできないことである。これは、主回答者の回答作業の負荷から主回答者に対するスノーボール回答者を通常2−3名程度以上に多くは出来ないからである。
【0012】
同様に、複数の回答者の組み合わせの形態が1対1のペアに限定されることである。これは、主回答者に対してスノーボール回答者の紹介を依頼するため、この形態以外の組み合わせの形態を想定して、主回答者にスノーボール回答者の紹介の依頼を行うことが難しいためである。
【0013】
このようにスノーボール・サンプリング調査手法の有する問題点について、これまで有効な対策は講じられてこなかった。
【0014】
本発明は、上記課題に鑑みて成されたものであり、スノーボール・サンプリング調査手法に用いるスノーボール回答者を、主回答者の紹介を介した選択に寄らずに標本として抽出できる標本抽出システムの提供を目的とする。
【0015】
また、本発明の別の目的は、スノーボール・サンプリング調査手法に用いるスノーボール回答者を、主回答者の紹介を介した選択に寄らずに標本として抽出し抽出した、主回答者とは直接の知人ではない、擬似スノーボール回答者と主回答者とを組としてスノーボール・サンプリング調査を行う社会調査システムを提供することにある。
【課題を解決するための手段】
【0016】
本発明に係る標本抽出システムは、既知の社会ネットワークデータを格納する社会ネットワークデータ保持手段と、前記社会ネットワークデータ保持手段に格納された社会ネットワークデータを参照しながらスノーボール・サンプリング調査手法に用いる主回答者と副回答者のペアを標本として抽出する標本抽出手段とを備え、主回答者への事前調査無しに標本のペアを抽出可能とすることを特徴とする。
【0017】
また、本発明に係る社会調査システムは、既知の社会ネットワークデータを格納する社会ネットワークデータ保持手段と、前記社会ネットワークデータ保持手段に格納された社会ネットワークデータを参照しながらスノーボール・サンプリング調査手法に用いる主回答者と副回答者のペアを標本として抽出する標本抽出手段とを備え、主回答者への事前調査無しに標本のペアを抽出してスノーボール・サンプリング調査を行うことを特徴とする。
【0018】
また、本発明に係る社会調査方法は、既知の社会ネットワークデータを取得し、主回答者への事前調査の代わりに、前記取得した社会ネットワークデータを参照して、主回答者と共に、前記主回答者に対する副回答者を自動的に抽出処理し、前記抽出した主回答者と副回答者との組をスノーボール・サンプリング調査手法の標本とすることを特徴とする。
【発明の効果】
【0019】
本発明によれば、スノーボール・サンプリング調査手法に用いるスノーボール回答者を、主回答者の紹介を介した選択に寄らずに標本として抽出できる標本抽出システムの提供を提供できる。
【0020】
本発明によれば、スノーボール・サンプリング調査手法に用いるスノーボール回答者を、主回答者の紹介を介した選択に寄らずに標本として抽出し、抽出した主回答者とは直接の知人ではない擬似スノーボール回答者と主回答者とを組としてスノーボール・サンプリング調査を行う社会調査システムを提供できる。
【図面の簡単な説明】
【0021】
【図1】本発明の実施の形態1の標本抽出装置を示すブロック図である。
【図2】本発明の実施の形態1のシステム全体を示すブロック図である。
【図3】本発明の実施の形態1のシステム全体の動作を示すフローチャートである。
【図4】本発明の実施の形態1の標本抽出システムに関する動作を示すフローチャートである。
【図5】本発明の実施の形態2の標本抽出装置を示すブロック図である。
【図6】本発明の実施の形態2の標本抽出システムに関する動作を示すフローチャートである。
【図7】本発明の実施の形態3のシステム全体を示すブロック図である。
【図8】本発明の実施例1で用いられる社会ネットワークデータを示す説明図である。
【図9】本発明の実施例1で用いられる社会ネットワークデータを示す説明図である。
【図10】本発明の実施例1で用いられる社会調査の案内の電子メールの文面例を示す説明図である。
【図11】本発明の他の実施例を説明する抽出する標本を示す説明図である。
【発明を実施するための形態】
【0022】
以下複数の実施の形態を示し、本発明を説明する。
【0023】
(発明の実施の形態1)
[構成の説明]
本発明の第1の発明を実施するための形態について図面を参照して詳細に説明する。
図1は、実施の形態1の標本抽出装置の構成を示すブロック図である。図2は、実施の形態1のシステム全体の構成を示す概略図である。
図2を参照すると、実施の形態1では、ウェブ画面生成手段201と、社会調査文面データ202と、メール送受信装置203と、標本抽出装置100と、社会調査回答データ205とから構成されるプログラム制御により動作するウェブサーバ200を含む。また、ウェブサーバ200は、SNS(ソーシャル・ネットワーキング・サービス)システム310の有する社会ネットワークデータ111と通信可能に接続されている。また、ウェブサーバ200には、社会調査の回答者がそれぞれ自身の回答者PC 220、230を用いて、インターネット等のネットワークを介して、ウェブサーバ200にアクセスする。
回答者PC220、230は、メールクライアント221、232、ウェブブラウザ222、232などを含む一般的なパーソナルコンピュータである。
【0024】
ウェブ画面生成装置201は、ウェブサーバ200上でプログラムに基づき動作し、社会調査文面データ202などに事前に定義、保持された質問分の表示や、それへの回答の入力受付処理をおこなうHTMLの生成を行う。通常は、CGIなどで実現される。
【0025】
メール送受信装置203は、標本抽出装置100から抽出されたサンプルに対して、社会調査の回答の依頼や回答を行うためのウェブサーバ200のURL等の通知を行う電子メールの発送を行う。
【0026】
標本抽出装置100は、SNS等によって別に得られた社会ネットワークデータ111から母集団の社会ネットワークの構造を勘案しながらサンプルの抽出を行う。社会ネットワークデータ111には、対象者のデモグラフィック属性(性別、年齢、居住地域など個人のプロフィールに関する属性)やサイコグラフィック属性(趣味や嗜好などの心理学的属性)に加え、誰と誰が知人や友人であるという社会ネットワークに関する情報(知人関係のつながりに関する情報)が含まれる。尚、本実施の形態では、SNSシステム210の有する社会ネットワークデータ111として記載するが、社会ネットワークデータ111は、何れのシステム内に有ってもよい。
【0027】
次に図1を参照すると、標本抽出装置100は、標本数保持部101と、主回答者抽出部102と、副回答者抽出部103と、副回答者数保持部104と、標本集計部105と、標本データ読み書き部106を具備する。
【0028】
各部はそれぞれ概略つぎのように動作する。
【0029】
まず、標本抽出装置100は、社会ネットワークデータ111に登録されている個人のリストをサンプリング台帳とみなして、当該台帳から調査対象者を抽出する。
この際、通常のサンプリング手法とは異なり、対象者のデモグラフィック属性やサイコグラフィック属性だけでなく、誰と誰が知人であるという社会ネットワークに関する情報(知人関係のつながりに関する情報)を勘案する。具体的には、各回答者を独立にサンプリングするのではなく、主回答者抽出部102がランダムに抽出した回答者(これを、本発明における主回答者、と呼ぶことにする。従来のスノーボール・サンプリング手法における主回答者に相当する。)に対して、副回答者抽出部103が、社会ネットワークデータ上でその知人となっている人も回答者(これを、本発明における副回答者、と呼ぶことにする。従来のスノーボール・サンプリング手法におけるスノーボール回答者に相当する。)として抽出する。この際、調査の性質に応じてデモグラフィック属性やサイコグラフィック属性を、ランダムに抽出した回答者と同様の基準で抽出する。抽出する基準を満たす知人が多数いる場合には、副回答者数保持部104に保持される数だけ抽出する。これは、回収率を基に事前に定義した係数を乗じた人数を上限の目安として定義すればよい。このような、サンプリングを行うことで、抽出した本発明における主回答者は、その知人たる本発明における副回答者と共に抽出され、標本集計部105および標本データ読み書き部106を介して標本データ112にペアとして保持される。尚、上記説明では、主回答者をランダムに抽出するとしたが、主回答者自体も、社会ネットワークデータ内から、特定の属性を有する回答者を、例えば他人により強く他人に影響を与える発言者や、特定の行動をとっている(とる確率の高い)人などを選択するように、アンケートに趣旨に則り標本抽出装置で抽出するようにしてもよい。
【0030】
メール送受信装置203は、標本抽出装置100によって抽出された標本データ112のデータを元に電子メールによって、調査の趣旨やウェブサーバ200のURLを含む、社会調査の案内を送付する。この案内をそれぞれのメールクライアント221又は231を介して受けたそれぞれの利用者は、自身のPC220又は230からウェブブラウザ222又は232を用いて、ウェブサーバ200上で動作する、本発明に係るウェブ社会調査システムにアクセスする。
【0031】
ウェブ画面生成装置201は、利用者からのアクセスに応じて事前に定義された社会調査文面データ202に基づき、社会調査の入力を行うウェブ画面を生成し、利用者のウェブブラウザ222・232に表示するように動作する。それぞれの利用者は、自身のPC220、230を用いて社会調査への回答をウェブ社会調査システム200に送信する。
【0032】
ウェブ社会調査システム200はこのようにして送付された社会調査回答のデータを社会調査回答データ205として保持する。このようにして回収されたデータが、本来の調査の目的に照らして、分析されることになる。
【0033】
[動作の説明]
次に、図3のフローチャートを参照して本実施の形態の全体の動作について詳細に説明する。
まず、標本抽出装置100は、社会ネットワークデータ111から後述する動作の説明に基づいて、主回答者と副回答者となる標本を抽出する(図3のステップA100)。次に、メール送受信装置203は、抽出された標本に対して調査の趣旨やウェブサーバ200のURLを含む、社会調査の案内を送付する(図3のステップA101)。最後に、利用者からのアクセスに応じてウェブ画面生成装置201は、社会調査の入力を行うウェブ画面を生成、利用者のウェブブラウザ222・232に表示する。ウェブ社会調査システム200にアクセスした回答者は、自身のPC220、230を用いてウェブ社会調査システム200に社会調査への回答を送信する。送信された社会調査は、社会調査回答データ206に記録される(図3のステップA102)。
【0034】
次に、図4のフローチャートを参照して本実施の形態の標本抽出装置100の動作について詳細に説明する。
まず、標本抽出装置100は、主回答者抽出部102が、社会ネットワークデータ111から、ランダムに調査対象者候補を主回答者として抽出する(図4のステップA110)。この際、調査内容に応じて、調査対象者候補は適宜フィルタリングする。例えば、社会ネットワークデータ111に含まれる、デモグラフィック属性等を参照しながら、調査対象者を「20代から30代の男女」のように制限しながら抽出する。
次に、副回答者抽出部103が、ステップA110で抽出した調査対象者(主回答者)の知人を調査対象候補者(副回答者)として抽出する(図4のステップA111)。この際、ステップA110と同様に、調査内容に応じて、調査対象者候補(副回答者)を適宜フィルタリングする。
次に、標本集計部105が、このようにして抽出した調査対象者のペアを、標本データ読み書き部106を介して、標本データ112に追加記録する(図4のステップ112)。
最後に、標本数保持部101に保持される事前に規定した人数に達していれば(図4のステップA113 Yes)抽出を終了し、達していなければ(図4のステップA113 No)ステップA110に戻って、抽出を繰り返す。
【0035】
次に、本実施の形態の効果について説明する。
実施の形態1では、標本抽出装置100が社会ネットワークデータ111を参照しながらサンプリングを行うことで、調査対象者間での知人関係である社会ネットワークを考慮しながら、標本の抽出を行うように構成されているため、事前に知人同士の関係にある調査対象者を選択的に抽出することができる。このため、従来のスノーボール・サンプリング調査が、『主回答者へ紹介可能なスノーボール回答者の有無の確認を行う事前調査 ⇒ 主回答者への聴取 ⇒ スノーボール回答者への聴取・集計』のように、段階を踏んで行わなければならないのに対して、事前調査を省略することができる。
また、従来のスノーボール・サンプリング調査のように主回答者・スノーボール回答者への聴取を区別せずに、同時に聴取することも可能となり、調査期間の短縮が期待できる。
また、主回答者に対してスノーボール回答者の紹介を依頼する必要がないため、主回答者に対してスノーボール回答者を紹介してもらうという負荷の高い依頼を、回避することもできる。
また、社会ネットワークのデータを用いて事前に条件に該当する知人である確率の高い人を推定し優先的に抽出することが可能となるため、従来のスノーボール・サンプリング手法を用いた社会調査に比べて有効回答率の向上が期待できることにある。
さらに、従来のスノーボール・サンプリング手法を用いた場合には、主回答者に対する紹介という形をとるため主回答者に対してスノーボール他者を2−3名程度しか取れないのに対して、本発明では主回答者の知人と推定される回答者をあらかじめ多数抽出することが可能なため、従来のスノーボール・サンプリング手法を用いた社会調査に比べて、ある個人(主回答者)に対する客観(他者の)認識を測定するための精度を高くできる。
【0036】
(発明の実施の形態2)
[構成の説明]
次に、本発明の第2の発明を実施するための形態について図面を参照して詳細に説明する。
図5を参照すると、本発明の第2の実施の形態は、本発明の第1の実施の形態と、主回答者および副回答者を抽出する手段が異なっている。即ち、副回答者抽出部103の代わりに、副回答者グラフ抽出部503を有する。副回答者グラフ抽出部503は、社会ネットワークデータ111から副回答者を抽出する際に、単に主回答者の知人を抽出するのではなく、主回答者の知人であり且つ副回答者同士が相互に知人であるものを抽出する。
【0037】
[動作の説明]
次に、図6のフローチャートを参照して本実施の形態の全体の動作について詳細に説明する。図6を参照すると、第2の実施の形態は、第1の実施の形態のステップA111の処理が異なり、また、抽出した調査対象者(副回答者)相互が知人である候補を抽出処理する点が異なっている。即ち、ステップA111のように、前ステップで抽出した調査対象者(主回答者)の知人をそのまま調査対象候補者(副回答者)として抽出するのではなく、抽出した調査対象者(主回答者)の知人であり、且つ知人相互に知っている人を調査対象者(副回答者)として抽出する(ステップB111)。この違いにより、抽出された主回答者と副回答者間は相互に知人同士の関係となる。
【0038】
次に、本発明の実施の形態の効果について説明する。発明の第2の実施の形態では、第1の実施の形態に加えて、標本抽出装置100が社会ネットワークデータ111を参照しながらサンプリングを行う際に、主回答者と副回答者、それぞれがめいめい知人であるような抽出を行うことができるため、回答者間の相互認識についてより正確な聴取が可能となる。例えば、主回答者と副回答者の一人の間の回答に矛盾が生じた場合に、他の副回答者も、主回答者と先の副回答者の一人と、相互に知人であるため、その他の副回答者の回答から、主回答者と先の副回答者の一人の回答どちらが正しいかを推測することが可能になる。
【0039】
(発明の実施の形態3)
[構成の説明]
次に、本発明の第3の発明を実施するための形態について図面を参照して詳細に説明する。
図7を参照すると、本発明の第3の実施の形態は、本発明の第1および第2の実施の形態に比べ、SNSシステムの有するデータを所望の形式の社会ネットワークデータに変換する社会ネットワーク構造データ変換手段と、主回答者および副回答者から得られた回答を解析する社会調査回答解析処理手段を有する点が異なる。即ち、ウェブ社会調査システム内に、社会調査回答解析処理装置301と、ネットワーク経由調査回答受付装置302と、ネットワーク経由調査依頼装置303と、社会ネットワーク構造データ変換装置304とを有し、実施の形態1および2で説明した標本抽出システムによって選択された回答者を介して、母数となる社会ネットワークに対する社会調査および回答解析を行う。
社会調査回答解析処理装置301は、例えば特許文献1に記載されている方法を用いて、社会ネットワークの購買意欲を算出するようにしても良い。また、回答を集計解析して所望のグラフ等で表示するようにしても良い。
ネットワーク経由調査回答受付装置302は、前述のウェブ画面生成装置と同様に、主回答者と副回答者からの調査の回答データを収集する。
ネットワーク経由調査依頼装置303は、前述のメール送受信装置と同様に、主回答者と副回答者への調査を依頼する。
社会ネットワーク構造データ変換装置304は、既存の多くの社会ネットワーク構造を含むデータベースから、所望の形式(標本を抽出できる形式:社会ネットワークデータ111の形式)に社会ネットワーク構造のデータを変換する。
【0040】
[動作の説明]
次に、図6のフローチャートを参照して本実施の形態の全体の動作について詳細に説明する。第3の実施の形態は、第1及び第2の実施の形態の動作に先んじて、インターネット上に存在するSNSシステムなどから、当該システムのデータベース中に日々蓄積格納されている利用者登録情報(デモグラフィック属性に相当)や、近況操作及びアクセスの履歴情報(サイコグラフィック属性に相当)、友人フラグ等で現されている社会ネットワークに関する情報を、社会ネットワーク構造データ変換装置304を動作させて、標本を抽出できる形式に変換し、社会ネットワークデータ111を生成する。
【0041】
その後、第1及び第2の実施の形態の動作と同様に、抽出した主回答者と副回答者とのペアから得た調査回答を社会調査回答データとして記録格納する共に、社会調査回答解析処理装置301を動作させて、社会調査結果データ305を生成する。
【0042】
次に、本発明の実施の形態の効果について説明する。発明の第3の実施の形態では、第1及び第2の実施の形態と同様の効果を得られる。加えて、第3の実施の形態では、既知の社会ネットワークシステムの有するデータベースのデータを直接的に標本抽出に使用できない場合であっても、そのデータ内からデモグラフィック属性やサイコグラフィック属性、社会ネットワークに関する情報などを自動的に抽出し、標本の抽出を可能とする。加えて、主回答者と副回答者から得られた回答を自動的に所望する結果を得られるように解析処理を可能とする。
【0043】
(他の発明の実施の形態)
第2の実施の形態では、副回答者グラフ抽出部503は、主回答者に対して知り合いであり、且つ、相互に知り合いである副回答者を抽出している。他方副回答者グラフ抽出部は、グラフ理論に基づき、その他にも社会調査に適するように副回答者を抽出可能である。以下では、いくつかを例示して説明する。
【0044】
標本抽装置の副回答者グラフ抽出部は、主回答者と副回答者がそれぞれお互いに知り合い(友人)であるように、社会ネットワークデータ111から対象を抽出しても良い。このように主回答者と副回答者を抽出することで、主回答者が一方的に副回答者を知っている又は友人としている場合に比べ、より良い回答を得られる。
【0045】
また、副回答者グラフ抽出部は、主回答者に対して、主回答者の知合いを基準に、主回答者と同様の属性を有する対象を、主回答者に近い対象と推定して副回答者として抽出しても良い。例えば、子どもに関する社会調査であった場合に、主回答者として3人の子供がいる男性を抽出した場合、副回答者グラフ抽出部は、友人を介して同一の属性である3人の子供がいる男性を副回答者として抽出する。このとき、主回答者と副回答者は知人とはならない。本願ではこのよう抽出方法をマッチングと呼ぶ。このようにマッチングすることで、主回答者とは他人となる副回答者を抽出することが可能となる。また、このように抽出された副回答者は、主回答者にとって他人であるものの、主回答者と同様の社会的位置を有したり、同様の行動を行なっていることが多く有用な回答者となりうる。例えば、マッチングを繰り返すことである特定の社会的地位を持つ人たちのグループを効率よく抽出できる。さらに、このようなグループを複数取り出し、それらの異なるグループ間、すなわち、社会的位置の異なるグループ間での特性の差を調べることも可能となる。
【0046】
また、副回答者グラフ抽出部は、主回答者に対して、主回答者に対して、主回答者の知合いを1次副回答者として抽出し、1次副回答者の共通の知り合いであって且つ主回答者の知り合いでない対象を2次副回答者として抽出するようにしても良い。このようにして得られた1次副回答者と2次副回答者の回答結果は、社会調査回答解析にそれぞれ用いることが可能である。例えば、2次副回答者の回答は、1次副回答者の回答の有効性検証に使用する様にしても良いし、主回答者と1次副回答者の回答の両方の有効性検証に使用する様にしても良い。こうすることで、主回答者と(1次)副回答者のペアという一段階の関係でなく、(1次)副回答者の知人である(2次)副回答者も含めた二段階の関係をとらえることで、例えばクチコミ情報の伝播速度を推定するといった調査が可能になる。
【実施例】
【0047】
次に、具体的な一例を示し本発明の実施の形態1の動作を説明する。
図8、図9に示すように、本実施例では、社会ネットワークデータ111は、SQLデータベースのような表形式で格納されているものとする。本発明は、社会ネットワークデータがSQLデータベースに格納されていることを前提とはしないが、SQLデータベースはウェブシステムで広く使われており、社会ネットワークデータとしてもっとも好適である。また、SNS(ソーシャル・ネットワーキング・サービス)の典型的な実装においても同様である。もちろん、本発明の社会ネットワークデータ111は、SNSでのデータに限定されず、社会調査の標本抽出に必要な属性を持つ個人毎の情報と、その個人間の知人関係を表現するデータであれば、形態を問わずに使用できる。図8は、社会ネットワークデータ111のうち、個人ごとの属性(デモグラフィック属性、サイコグラフィック属性)をまとめたものを表形式で表現している。また、図9は社会ネットワークデータ111のうち、個人同士の知人関係を表現している。
【0048】
まず本発明に係る標本抽出装置100は、主回答者抽出部102が、図8および図9に示す社会ネットワークデータ111を参照しながら、ランダム又は所定の調査対象者(主回答者)を抽出する。この際、調査の目的等に応じて、調査対象者を年齢・性別といったデモグラフィック属性、趣味や嗜好といったサイコグラフィック属性によって対象者を限定してもよい。この限定の方法は社会ネットワークデータ111の型式によって変わりうるが、どのような型式であっても、年齢・性別等で限定した母集団をまず抽出した上で、そこからランダムに標本を抽出すればよい。ここでは、図8でid=2のYさん501が調査対象者(主回答者)して抽出されたものとする。
次に、標本抽出装置100は、先に選んだYさん(id=2)の知人を調査対象者として抽出する。知人の表現方法には様々な方法が考えられるが、ここではSQLデータベースを用いた場合に、典型的と考えられる表現方法を図9に示す。図9のテーブル900では、列idと列friend_idの組で、知人関係を表現している。例えば、行901で『id=2』と『id=1』の二名、即ちXさんとYさんが知人(少なくともYさん側からはXさんは知人)であること、行902で『id=2』と『id=3』の二名、即ちYさんとZさんが知人(少なくともYさん側からはZさんは知人)であることを表している。すなわち、図9右のような関係を表現している。本発明においては、知人関係がどのような型式で表現されるのか、SQLデータベースに格納されるにせよ、他のどのようなテーブル型式で格納されるにしよ、本発明を限定するものではない。本質的には、ある個人の知人をすべて列挙できれば、どのような型式であっても、当業者は容易に実現可能である。さて、Yさんの知人を抽出する場合には、調査の目的に応じて、Yさんを抽出したのと同じ基準によって、その知人を抽出する。例えば、図9のテーブル900において、Yさんの知人は、XさんとZさんの二名であるが、サイコグラフィック属性として趣味を映画に持つ人と限定した場合、知人はZさんの一名だけになる。このようにして、Yさんの知人を副回答者数保持部104で事前に規定された人数だけ抽出する。この人数は如何様に定めても構わないが、好適な実施例においては、知人の組のうち何組が有効回答となるかを過去の経験などから決定することになるだろう。例えば、社会調査の趣旨や内容などによって、ある人とその知人の組のうち50%が有効回答となることが分かっている場合に、ある人に対する知人を一人選んで一組を作りたい場合には、知人を2名選出すればよい。知人が規定の人数よりも多い場合には、すべての知人の中からランダムに規定人数の知人を抽出すればよい。逆に、知人が規定の人数よりも少ない場合は、Yさんとその知人はすべて調査対象者候補から外す処理を加える。ここで、YさんとZさんとのペアが調査対象者候補に加えられたとするとその合計は2名1組となる。この一連の処理作業を、ウェブサーバ200が、調査対象者候補が事前に想定した人数・組数にいたるまで自動的に繰り返す。このように標本抽出装置100を動作させることによって、お互いに知人同士の二名を主回答者と副回答者の組とした複数組が抽出された調査対象者候補として抽出されたことになる。
【0049】
上記のように、標本抽出装置100により調査対象者候補を抽出したら、次にこの調査対象者候補に対して、メール送受信装置203で、社会調査の案内を送付する(ステップA101)。この案内には、図10のように、調査の趣旨や回答の入力を行うためのウェブサーバ200のURL等が含まれる社会調査の案内を送付する。この案内を受け取った調査対象者候補は、自身のPC220・230等からウェブブラウザ222・232等で指定したURLにアクセスする。このURLで指定されるウェブサーバ200には、事前に定義された社会調査文章データ102に基づいて質問文章の表示と回答の入力を行えるようになっている。ここで回答された結果は、必要に応じて分析に適した形式へのデータ処理加工がなされて社会調査データ回答データ205に記録される。このようにして回答されたデータは、通常のスノーボール・サンプリング手法におけるものと同様に回答を分析処理可能であり、必要に応じた改正処理がなされる。
【0050】
[他の実施例]
上記実施例は、実施の形態1の動作を説明したが、他の実施の形態も同様にコンピュータシステムを用いて実現できる。その抽出結果を例示すれば、図11のようになる。図11は、標本抽出装置が予め指定されたように、主回答者に対応する副回答者を抽出する例を示している。
【0051】
図11(a)は、標本抽出装置が、主回答者と副回答者がそれぞれお互いに知り合いと推定できる対象を主回答者および副回答者として抽出した例を示している。
図11(b)は、標本抽出装置が、一主回答者に対応付けられる複数の副回答者間で、それぞれお互いに知り合いと推定できる対象を主回答者および副回答者として抽出した例を示している。
図11(c)は、標本抽出装置が、主回答者と知合いに婚姻者がおり且つ婚姻者同士が知合いである対象の知り合いとその婚姻者の全てを副回答者として抽出した例を示している。
図11(d)は、標本抽出装置が、主回答者に対して、主回答者の知合いを1次副回答者として抽出し、1次副回答者の知り合いであって、且つ前記主回答者の知り合いでない対象を2次副回答者として抽出した例を示している。
図11(e)は、標本抽出装置が、主回答者に対して、主回答者の知合いを基準に、主回答者と同様の属性を有する対象を、主回答者に近い対象と推定して副回答者として抽出(マッチング)した例を示している。
【0052】
以上説明したように、本発明に係る社会調査システムおよび標本抽出システムは、標本抽出装置と社会ネットワークデータとを備え、標本抽出装置が社会ネットワークデータを参照しながら標本抽出を行うように動作する。このような構成を採用し、標本抽出装置はスノーボール調査のサンプルをその社会ネットワークが既知となっているデータから回答者のペアを作りやすい回答者を依頼に先立って選択・標本の抽出を行い、回答者への依頼に際してもペアとなりやすい知人を、社会ネットワークデータを用いて事前に推定し、一度に依頼を行うことで、本発明の目的を達成することができる。
また、社会ネットワークデータからある回答者に対してその知人と推定される回答者を多数選択し回答を依頼することで、ペアを構成することはなくとも、ある回答者に対する客観認識に関するデータをより多く回収し、これによってより正確な回答者の客観認識に関するデータを得ることが期待できる。さらに、社会ネットワークデータを用いることで、複数の回答者を、「1対1のペア」から、「相互に知り合いの三人組」というような、複数人からなる形態に拡張することもでき、より柔軟な形態の標本抽出が可能となる。
【0053】
即ち、本発明によれば、スノーボール・サンプリング調査手法に用いるスノーボール回答者を、主回答者の紹介を介した選択に寄らずに標本として抽出できる。
【0054】
限定的に効果を例示して説明すれば、従来のスノーボール・サンプリング手法を用いた社会調査に比べて短期間で実施できる。その理由は、あらかじめ社会ネットワークデータから主回答者と知人と推定される人に対して、回答の依頼を行うため、従来のスノーボール・サンプリング調査で行われていた、スノーボール回答者の紹介が可能かの確認を省略できるからである。
同様に、従来のスノーボール・サンプリング手法を用いた社会調査に比べて有効回答率の向上が期待できる。その理由は、社会ネットワークのデータを用いて事前に条件に該当する知人である確率の高い人を推定し優先的に抽出することが可能となるためである。
【0055】
同様に、従来のスノーボール・サンプリング手法を用いた社会調査に比べて、ある個人(主回答者)に対する客観(他者の)認識を測定するための精度を高くできる。その理由は、従来のスノーボール・サンプリング手法を用いた場合には、主回答者に対する紹介という形をとるため主回答者に対してスノーボール他者を2−3名程度しか取れないのに対して、本発明では主回答者の知人と推定される回答者をあらかじめ多数抽出することが可能なためである。
【0056】
同様に、従来のスノーボール・サンプリング手法を用いた社会調査における主回答者・スノーボール他者の「1対1のペア」という形以外での組も容易に抽出して標本に採用できる。その理由は、あらかじめ社会ネットワークのデータを用いて事前に知人と推定される人に対して回答の依頼を行う際に、「1対1のペア」以外の構成が可能となる回答者を選ぶことができるからである。このことによって、より大規模なネットワークデータの取得、大集団のネットワーク的特性の推定、ネットワーク内での情報伝播などをとらえることが可能になる。
【0057】
尚、本発明の具体的な構成は前述の実施の形態に限られるものではなく、この発明の要旨を逸脱しない範囲の変更があってもこの発明に含まれる。
【0058】
例えば、上記実施の形態の一例を別の表現で説明すれば、ウェブサーバに構築される社会調査システムは、調査者によるコンテンツへの選択操作を受け付ける入力部と、社会調査用プログラムを記憶する記憶部と、社会ネットワークデータを通信ネットワークを介して取得するネットワークインタフェースと、前記社会調査用プログラムに基づいて後述する各種手段を統括的に機能させるように動作する制御部とを備える。
【0059】
社会調査用プログラムは、RAM上に展開され、制御部を、スノーボール・サンプリング調査手法に用いる計画標本の組数を予め設定する標本数保持手段と、一主回答者に対するスノーボール回答者数にあたる擬似スノーボール回答者となる副回答者数を予め設定する副回答者数保持手段と、スノーボール・サンプリング調査手法に用いる主回答者を、ソーシャルネットワークサービスに登録されている個人の中から抽出する主回答者抽出手段と、スノーボール回答者とみなす副回答者を、SNSに登録されている主回答者に関連付けて記憶されている個人間のつながりに関する情報を参照して対象フラグの有る個人の中から副回答者数保持手段に設定されている数になるまで抽出を試みる副回答者抽出手段と、抽出された主回答者に対して副回答者を抽出できた場合に、当該主回答者と副回答者を一組の標本として標本データに集計記憶し、標本数保持手段に設定されている組数となるまで自動的に繰り返す標本集計手段と、集計された標本データに基づき、組として抽出された個人に対して、同時的にネットワークを介する調査を依頼すると共に、当該依頼に基づいて組を構成する主回答者および副回答者として抽出された両個人から調査に関する回答が得られた場合に、両個人の回答を関連付けて標本の組の有効回答としてみなして、スノーボール・サンプリング調査手法に基づく調査を実行する調査手段として機能させる。また、社会調査用プログラムは、必要に応じて、制御部を、社会調査回答解析処理を行う社会調査回答解析処理手段と、既知の社会ネットワーク構造を含むデータから、社会ネットワークデータに変換する社会ネットワーク構造変換手段として機能させるようにしても良い。
【産業上の利用可能性】
【0060】
本発明によれば、主に、電子メールやウェブといったインターネット上での社会調査実施装置や、社会調査実施装置をコンピュータに実現するためのプログラムといった用途に適用できる。とくに、クチコミを介するような、バズ・マーケティングやバイラル・マーケティングといった手法を革新することが可能である。これらは旧来のマス・マーケティングに代わるマーケティング手法であり、商品についてのコミュニケーションの多くがクチコミを介していることを実証的に分析する手法であり、インターネットの発達とともに注目されてきたが、安定し、予測精度の高い解析の手法を持っていなかった。この点において、本発明は、厳密な標本抽出と調査手法を提供する。
【符号の説明】
【0061】
100 標本抽出装置(標本抽出手段)
101 標本数保持部(標本数保持手段)
102 主回答者抽出部(主回答者抽出手段)
103 副回答者抽出部(副回答者抽出手段)
104 副回答者数保持部(副回答者数保持手段)
105 標本集計部(標本集計手段)
106 標本データ読み書き部
111 社会ネットワークデータ
112 標本データ
200 ウェブサーバ(ウェブ社会調査システム)
201 ウェブ画面生成装置(調査手段)
202 社会調査文面データ
203 メール送受信装置(調査手段)
205 社会調査回答データ
210 SNSシステム
220 回答者PC
221 メールクライアント
222 ウェブブラウザ
230 回答者PC
231 メールクライアント
232 ウェブブラウザ

【特許請求の範囲】
【請求項1】
既知の社会ネットワークデータを格納する社会ネットワークデータ保持手段と、
前記社会ネットワークデータ保持手段に格納された社会ネットワークデータを参照しながらスノーボール・サンプリング調査手法に用いる主回答者と副回答者のペアを標本として抽出する標本抽出手段と、
を備え、
主回答者への事前調査無しに標本のペアを抽出可能とすることを特徴とする 標本抽出システム。
【請求項2】
前記標本抽出手段は、主回答者と副回答者がそれぞれお互いに知り合いと推定する副回答者グラフ抽出部を含むことを特徴とする請求項1記載の標本抽出システム。
【請求項3】
前記標本抽出手段は、一主回答者に対応付けられる複数の副回答者間で、それぞれお互いに知り合いと推定する副回答者グラフ抽出部を含むことを特徴とする請求項1又は2に記載の標本抽出システム。
【請求項4】
前記標本抽出手段は、主回答者に対して、前記主回答者の知合いを基準に、前記主回答者と同様の属性を有する対象を、前記主回答者に近い対象と推定して副回答者として抽出する副回答者グラフ抽出部を含むことを特徴とする請求項1に記載の標本抽出システム。
【請求項5】
前記標本抽出手段は、主回答者に対して、前記主回答者の知合いを1次副回答者として抽出し、前記1次副回答者の共通の知り合いであって、且つ前記主回答者の知り合いでない対象を2次副回答者として抽出し、
前記2次副回答者の回答は、前記1次副回答者の回答の有効性検証に使用されることを特徴とする請求項1に記載の標本抽出システム。
【請求項6】
請求項1ないし5の何れか1項に記載の標本抽出システムを有することを特徴とするスノーボール・サンプリング調査を行う社会調査システム。
【請求項7】
スノーボール・サンプリング調査手法に用いる計画標本の組数を予め設定する標本数保持手段と、
一主回答者に対するスノーボール回答者数にあたる擬似スノーボール回答者となる副回答者数を予め設定する副回答者数保持手段と、
スノーボール・サンプリング調査手法に用いる主回答者を、ソーシャルネットワークサービスに登録されている個人の中から抽出する主回答者抽出手段と、
スノーボール回答者とみなす副回答者を、前記ソーシャルネットワークサービスに登録されている前記主回答者に関連付けて記憶されている個人間のつながりに関する情報を参照して対象フラグの有る個人の中から前記副回答者数保持手段に設定されている数になるまで抽出を試みる副回答者抽出手段と、
前記抽出された主回答者に対して副回答者を抽出できた場合に、当該主回答者と副回答者を一組の標本として標本データに集計記憶し、前記標本数保持手段に設定されている組数となるまで自動的に繰り返す標本集計手段と、
前記集計された標本データに基づき、前記組として抽出された個人に対して、同時的にネットワークを介する調査を依頼すると共に、当該依頼に基づいて組を構成する主回答者および副回答者として抽出された両個人から調査に関する回答が得られた場合に、両個人の回答を関連付けて標本の組の有効回答としてみなして、スノーボール・サンプリング調査手法に基づく調査を実行する調査手段と、
を具備することを特徴とするウェブサーバに構築される社会調査システム。
【請求項8】
社会調査回答解析処理を行う社会調査回答解析処理手段を有することを特徴とする請求項6又は7記載の社会調査システム。
【請求項9】
既知の社会ネットワーク構造を含むデータから、前記社会ネットワークデータに変換する社会ネットワーク構造変換手段を有することを特徴とする請求項6ないし8の何れか1項に記載の社会調査システム。
【請求項10】
既知の社会ネットワークデータを取得し、
主回答者への事前調査の代わりに、前記取得した社会ネットワークデータを参照して、主回答者と共に、前記主回答者に対する副回答者を自動的に抽出処理し、
前記抽出した主回答者と副回答者との組をスノーボール・サンプリング調査手法の標本とすることを特徴とする社会調査方法。
【請求項11】
前記標本の抽出処理は、社会ネットワークデータから、主回答者と副回答者がそれぞれお互いに知り合いと推定できる組を標本とすることを特徴とする請求項10記載の社会調査方法。
【請求項12】
前記標本の抽出処理は、一主回答者に対応付けられる複数の副回答者間で、それぞれお互いに知り合いと推定できる組を標本とすることを特徴とする請求項10記載の社会調査方法。
【請求項13】
前記標本の抽出処理は、主回答者に対して、前記主回答者の知合いを基準に、前記主回答者と同様の属性を有する対象を、前記主回答者に近い対象と推定して副回答者として抽出して標本とすることを特徴とする請求項10記載の社会調査方法。
【請求項14】
前記標本の抽出処理は、主回答者に対して、前記主回答者の知合いを1次副回答者として抽出し、前記1次副回答者の共通の知り合いであって、且つ前記主回答者の知り合いでない対象を2次副回答者として抽出して標本とし、
前記2次副回答者の回答は、前記1次副回答者の回答の有効性検証に使用されることを特徴とする請求項10記載の社会調査方法。
【請求項15】
スノーボール・サンプリング調査手法に用いる計画標本の組数を予め設定する工程と、
一主回答者に対するスノーボール回答者数にあたる擬似スノーボール回答者となる副回答者数を予め設定する工程と、
スノーボール・サンプリング調査手法に用いる主回答者を、ソーシャルネットワークサービスに登録されている個人の中から抽出する工程と、
スノーボール回答者とみなす副回答者を、前記ソーシャルネットワークサービスに登録されている前記主回答者につながりを有する個人の中から前記設定した副回答者数になるまで抽出を試みる工程と、
前記抽出された主回答者に対して副回答者を抽出できた場合に、当該主回答者と副回答者を一組の標本とし、設定した標本数組数となるまで繰り返す工程と、
前記集計された標本に基づき、前記組として抽出された個人に対して、同時的にネットワークを介する調査を依頼する工程と、
前記依頼に基づいて組を構成する主回答者および副回答者として抽出された両個人から調査に関する回答が得られた場合に、両個人の回答を関連付けて標本の組の有効回答としてみなして、スノーボール・サンプリング調査手法に基づく調査を実行する工程と
を有することを特徴とするウェブサーバに構築される社会調査方法。
【請求項16】
情報処理装置の制御部を、
記憶手段に記録された既知の社会ネットワークデータを参照しながらスノーボール・サンプリング調査手法に用いる主回答者と副回答者のペアを標本として抽出する標本抽出手段と
して機能させ、主回答者への事前調査無しに標本のペアを抽出可能とすることを特徴とする社会調査用プログラム。
【請求項17】
前記標本抽出手段は、主回答者と副回答者がそれぞれお互いに知り合いと推定する様に標本を抽出することを特徴とする請求項16記載の社会調査用プログラム。
【請求項18】
前記標本抽出手段は、一主回答者に対応付けられる複数の副回答者間で、それぞれお互いに知り合いと推定する様に標本を抽出することを特徴とする請求項16記載の社会調査用プログラム。
【請求項19】
前記標本抽出手段は、主回答者に対して、前記主回答者の知合いを基準に、前記主回答者と同様の属性を有する対象を、前記主回答者に近い対象と推定して副回答者として抽出して標本とすることを特徴とする請求項16記載の社会調査用プログラム。
【請求項20】
前記標本抽出手段は、主回答者に対して、前記主回答者の知合いを1次副回答者として抽出し、前記1次副回答者の共通の知り合いであって、且つ前記主回答者の知り合いでない対象を2次副回答者として抽出して標本とすることを特徴とする請求項16記載の社会調査用プログラム。
【請求項21】
情報処理装置の制御部を、
スノーボール・サンプリング調査手法に用いる計画標本の組数を予め設定する標本数保持手段と、
一主回答者に対するスノーボール回答者数にあたる擬似スノーボール回答者となる副回答者数を予め設定する副回答者数保持手段と、
スノーボール・サンプリング調査手法に用いる主回答者を、ソーシャルネットワークサービスに登録されている個人の中から抽出する主回答者抽出手段と、
スノーボール回答者とみなす副回答者を、前記ソーシャルネットワークサービスに登録されている前記主回答者に関連付けて記憶されている個人の中から前記副回答者数保持手段に設定されている数になるまで抽出を試みる副回答者抽出手段と、
主回答者と副回答者を一組の標本として集計記憶し、前記標本数保持手段に設定されている組数となるまで自動的に繰り返す標本集計手段と、
前記集計された標本データに基づき、前記組として抽出された個人に対して、同時的にネットワークを介する調査を依頼すると共に、当該依頼に基づいて組を構成する主回答者および副回答者として抽出された両個人から調査に関する回答が得られた場合に、両個人の回答を関連付けて標本の組の有効回答としてみなして、スノーボール・サンプリング調査手法に基づく調査を実行する調査手段と
して機能させることを特徴とする社会調査用プログラム。
【請求項22】
制御部を、更に、社会調査回答解析処理を行う社会調査回答解析処理手段として機能させることを特徴とする請求項21記載の社会調査用プログラム。
【請求項23】
制御部を、更に、インターネットに存在する社会ネットワーク構造を含むデータを、前記社会ネットワークデータに変換する社会ネットワーク構造変換手段として機能させることを特徴とする請求項21または22に記載の社会調査用プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate


【公開番号】特開2011−186782(P2011−186782A)
【公開日】平成23年9月22日(2011.9.22)
【国際特許分類】
【出願番号】特願2010−51367(P2010−51367)
【出願日】平成22年3月9日(2010.3.9)
【出願人】(000004237)日本電気株式会社 (19,353)
【出願人】(504137912)国立大学法人 東京大学 (1,942)