説明

アクティブユーザ抽出装置、アクティブユーザ抽出方法、およびプログラム

【課題】ソーシャル・メディアに情報を投稿したユーザの中から、ソーシャル・メディア分析に有意であるユーザを抽出することができるアクティブユーザ抽出装置を提供すること。
【解決手段】アクティブユーザ抽出装置20は、所定期間について、ソーシャル・メディアから、ユーザ間の再投稿関係を特定する再投稿関係情報を含む書き込み情報を取得する書き込み情報取得部21と、書き込み情報取得手段で取得された書き込み情報に含まれる再投稿関係情報に基づいて、ユーザ毎に、再投稿数を取得する再投稿数取得部22と、各ユーザについて、再投稿数取得部22で取得した再投稿情報に基づいて、ソーシャル・メディア分析における有意性を示す度合であるアクティブ度合を計算するアクティブ度合計算部23と、アクティブ度合計算部23で計算されたアクティブ度合に基づいて、アクティブユーザを抽出するアクティブユーザ抽出部24と、を備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ソーシャル・メディア分析に有意であるアクティブユーザを抽出するアクティブユーザ抽出装置、アクティブユーザ抽出方法、およびプログラムに関する。
【背景技術】
【0002】
ブログ、SNS、TWITTER(登録商標)等のソーシャル・メディアを介したユーザ間の情報発信やコミュニケーションが爆発的に増加し、ソーシャル・メディアに投稿された情報、いわゆる口コミ情報が、ユーザの購買行為に大きな影響を与えている。そこで、ソーシャル・メディアに投稿された情報を分析(以下、ソーシャル・メディア分析という)し、ユーザの購買動向や流行を把握することは、ソーシャル・メディア・マーケティングにおいて重要である。
【0003】
ソーシャル・メディア分析では、ソーシャル・メディアに投稿された情報を解析することによって、流行を分析したり、情報の伝搬を分析したりする。例えば、ブログ記事等の情報からキーワードを抽出し、このキーワードの使用状況を定量化し、定量化したキーワードの使用状況を時系列で監視することで、近い未来の流行を予測するトレンド予測装置が提案されている(例えば、特許文献1参照)。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2006−227965号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、ソーシャル・メディアには膨大な情報が投稿されているため、それらすべてを解析するには、解析装置に高スペックが要求されるという問題点があった。そのため、ソーシャル・メディア分析に有意なユーザが投稿した情報を抽出し、抽出した情報を解析するのが、ソーシャル・メディア分析において望ましい。また、ソーシャル・メディアから取得できる情報の件数が制限されている場合があり、ソーシャル・メディア分析に有意となるユーザの情報を優先して取得する必要があるという問題点があった。
【0006】
そこで、本発明は、上述の課題に鑑みてなされたものであり、ソーシャル・メディアに情報を投稿したユーザの中から、ソーシャル・メディア分析に有意であるユーザを抽出するアクティブユーザ抽出装置、アクティブユーザ抽出方法、およびプログラムを提供することを目的とする。
【課題を解決するための手段】
【0007】
本発明は、上記の課題を解決するために、以下の事項を提案している。なお、理解を容易にするために、本発明の実施形態に対応する符号を付して説明するが、これに限定されるものではない。
【0008】
(1) 本発明は、ソーシャル・メディアに投稿された情報の中から、ソーシャル・メディア分析に有意となるアクティブユーザを抽出するアクティブユーザ抽出装置において、所定期間について、前記ソーシャル・メディアから、ユーザ間の再投稿関係を特定する再投稿関係情報を含む書き込み情報を取得する書き込み情報取得手段(例えば、図1の書き込み情報取得部21)と、前記書き込み情報取得手段で取得された書き込み情報に含まれる再投稿関係情報に基づいて、ユーザ毎に、ユーザが投稿した書き込み情報を再掲した他のユーザの書き込み情報の数である再投稿数を取得する再投稿数取得手段(例えば、図1の再投稿数取得部22)と、各ユーザについて、前記再投稿数取得手段で取得した再投稿数に基づいて、前記ソーシャル・メディア分析における有意性を示す度合であるアクティブ度合を計算するアクティブ度合計算手段(例えば、図1のアクティブ度合計算部23)と、前記アクティブ度合計算手段で計算されたアクティブ度合に基づいて、前記アクティブユーザを抽出するアクティブユーザ抽出手段(例えば、図1のアクティブユーザ抽出部24)と、を備えることを特徴とするアクティブユーザ抽出装置を提案している。
【0009】
この発明によれば、書き込み情報取得手段は、所定期間について、ソーシャル・メディアから、ユーザ間の再投稿関係を特定する再投稿関係情報を含む書き込み情報を取得する。再投稿数取得手段は、書き込み情報取得手段で取得された書き込み情報に含まれる再投稿関係情報に基づいて、ユーザ毎に、ユーザが投稿した書き込み情報を再掲した他のユーザの書き込み情報の数である再投稿数を取得する。アクティブ度合計算手段は、各ユーザについて、再投稿数取得手段で取得した再投稿数に基づいて、ソーシャル・メディア分析における有意性を示す度合であるアクティブ度合を計算する。アクティブユーザ抽出手段は、アクティブ度合計算手段で計算されたアクティブ度合に基づいて、アクティブユーザを抽出する。したがって、ソーシャル・メディアにおけるユーザの影響力を示す再投稿数に基づいて、ソーシャル・メディア分析における有意性を示すアクティブ度合を各ユーザについて計算することによって、ソーシャル・メディアに情報を投稿したユーザの中から、ソーシャル・メディア分析に有意であるユーザを抽出することができる。
【0010】
(2) 本発明は、(1)のアクティブユーザ抽出装置において、前記ソーシャル・メディアにおいて、前記ユーザがリンクしたことによってリンク関係にあるリンクユーザ数を少なくとも含む、ユーザの投稿活動に関する数値情報をユーザ情報として取得するユーザ情報取得手段(例えば、図3のユーザ情報取得部35)を備え、前記アクティブ度合計算手段は、前記各ユーザについて、前記再投稿数取得手段で取得した再投稿数および前記ユーザ情報取得手段で取得されたユーザ情報に含まれるリンクユーザ数に基づいて、前記アクティブ度合を計算することを特徴とするアクティブユーザ抽出装置を提案している。
【0011】
この発明によれば、ユーザ情報取得手段は、ソーシャル・メディアにおいて、ユーザがリンクしたことによってリンク関係にあるリンクユーザ数を少なくとも含む、ユーザの投稿活動に関する数値情報をユーザ情報として取得する。アクティブ度合計算手段は、各ユーザについて、再投稿数取得手段で取得した再投稿数およびユーザ情報取得手段で取得されたユーザ情報に含まれるリンクユーザ数に基づいて、アクティブ度合を計算する。したがって、ユーザのソーシャル・メディアへの積極的な参加状況を示すリンクユーザ数を加味してアクティブ度合を計算することにより、ソーシャル・メディア分析に有意であるユーザをより精度よく抽出することができる。
【0012】
(3) 本発明は、(1)のアクティブユーザ抽出装置において、前記ソーシャル・メディアにおいて、前記ユーザが他のユーザからリンクされたことによってリンク関係にある被リンクユーザ数を少なくとも含む、ユーザの投稿活動に関する数値情報をユーザ情報として取得するユーザ情報取得手段(例えば、図3のユーザ情報取得部35)を備え、前記アクティブ度合計算手段は、前記各ユーザについて、前記再投稿数取得手段で取得した再投稿数および前記ユーザ情報取得手段で取得されたユーザ情報に含まれる被リンクユーザ数に基づいて、前記アクティブ度合を計算することを特徴とするアクティブユーザ抽出装置を提案している。
【0013】
この発明によれば、ユーザ情報取得手段は、ソーシャル・メディアにおいて、ユーザが他のユーザからリンクされたことによってリンク関係にある被リンクユーザ数を少なくとも含む、ユーザの投稿活動に関する数値情報をユーザ情報として取得する。アクティブ度合計算手段は、各ユーザについて、再投稿数取得手段で取得した再投稿数および被リンクユーザ数に基づいて、アクティブ度合を計算する。したがって、ソーシャル・メディアにおいて、ユーザが他のユーザから関心を寄せられている状況を示す被リンクユーザ数を加味してアクティブ度合を計算することにより、ソーシャル・メディア分析に有意であるユーザをより精度よく抽出することができる。
【0014】
(4) 本発明は、(3)のアクティブユーザ抽出装置において、前記ユーザの投稿活動に関する数値情報は、前記被リンクユーザ数とともに、前記ソーシャル・メディアにおいて、前記ユーザがリンクしたことによってリンク関係にあるリンクユーザ数を含み、前記アクティブ度合計算手段は、前記各ユーザについて、前記再投稿数取得手段で取得した再投稿数と、前記ユーザ情報取得手段で取得されたユーザ情報に含まれる前記リンクユーザ数および前記被リンクユーザ数と、に基づいて、前記アクティブ度合を計算することを特徴とするアクティブユーザ抽出装置を提案している。
【0015】
この発明によれば、ユーザの投稿活動に関する数値情報は、被リンクユーザ数とともに、ソーシャル・メディアにおいて、ユーザがリンクしたことによってリンク関係にあるリンクユーザ数を含む。アクティブ度合計算手段は、各ユーザについて、再投稿数取得手段で取得した再投稿数と、ユーザ情報取得手段で取得されたユーザ情報に含まれるリンクユーザ数および被リンクユーザ数とに基づいて、アクティブ度合を計算する。したがって、ユーザがソーシャル・メディアへの積極的な参加状況を示すリンクユーザ数、およびユーザが他のユーザから関心を寄せられている状況を示す被リンクユーザ数を加味してアクティブ度合を計算することにより、ソーシャル・メディア分析に有意であるユーザをより精度よく抽出することができる。
【0016】
(5) 本発明は、(4)のアクティブユーザ抽出装置において、前記アクティブ度合計算手段は、前記アクティブ度合をf、前記再投稿数をRt、前記リンクユーザ数をF、前記被リンクユーザ数をFd、所定期間における再投稿数の重みを決定するための係数をα、前記リンクユーザ数の重みを決定するための係数をβ、前記被リンクユーザ数の重みを決定するための係数をγとし、数1の式を用いて、前記アクティブ度合を計算することを特徴とするアクティブユーザ抽出装置を提案している。
【0017】
この発明によれば、アクティブ度合計算手段は、アクティブ度合をf、再投稿数をRt、リンクユーザ数をF、被リンクユーザ数をFd、所定期間における再投稿数の重みを決定するための係数をα、リンクユーザ数の重みを決定するための係数をβ、被リンクユーザ数の重みを決定するための係数をγとし、数1の式を用いて、アクティブ度合を計算する。したがって、所定期間における再投稿数、リンクユーザ数、被リンクユーザ数それぞれに重み付けをすることにより、重視する数値情報を、ソーシャル・メディア分析を行う分析者等が自由に設定することができる。
【0018】
(6) 本発明は、(2)から(5)のアクティブユーザ抽出装置において、前記ユーザ情報取得手段で取得したユーザ情報を記憶する記憶手段(例えば、図5のユーザ情報記憶部46)を備え、前記記憶手段は、一部の記憶領域を残し、残りの記憶領域に前記ユーザ情報取得手段で取得されたユーザ情報を記憶することを特徴とするアクティブユーザ抽出装置を提案している。
【0019】
この発明によれば、記憶手段は、ユーザ情報取得手段で取得したユーザ情報を記憶し、一部の記憶領域を残し、残りの記憶領域にユーザ情報取得手段で取得されたユーザ情報を記憶する。したがって、記憶手段が記憶領域の一部を残しておくことにより、ユーザ情報の増加を防ぎつつ、新規ユーザのユーザ情報を取得することができる。
【0020】
(7) 本発明は、(1)から(6)のアクティブユーザ抽出装置において、前記アクティブユーザ抽出手段は、前記アクティブユーザを抽出する条件として、しきい値を用いることを特徴とするアクティブユーザ抽出装置を提案している。
【0021】
この発明によれば、アクティブユーザ抽出手段は、アクティブユーザを抽出する条件として、しきい値を用いる。しきい値を用いることにより、ソーシャル・メディア分析を行う分析者の意向に沿ったアクティブユーザを抽出することができる。
【0022】
(8) 本発明は、ソーシャル・メディアに投稿された情報の中から、ソーシャル・メディア分析に有意となるアクティブユーザを抽出するアクティブユーザ抽出装置で実施されるアクティブユーザ抽出方法であって、所定期間について、前記ソーシャル・メディアから、ユーザ間の再投稿関係を特定する再投稿関係情報を含む書き込み情報を取得する第1のステップ(例えば、図2のステップS1)と、前記第1のステップで取得された書き込み情報に含まれる再投稿関係情報に基づいて、ユーザ毎に、ユーザが投稿した書き込み情報を再掲した他のユーザの書き込み情報の数である再投稿数を取得する第2のステップ(例えば、図2のステップS2)と、各ユーザについて、前記第2のステップで取得した再投稿数に基づいて、前記ソーシャル・メディア分析における有意性を示す度合であるアクティブ度合を計算する第3のステップ(例えば、図2のステップS3)と、前記第2のステップで計算されたアクティブ度合に基づいて、前記アクティブユーザを抽出する第4のステップ(例えば、図2のステップS4)と、を含むことを特徴とするアクティブユーザ抽出方法を提案している。
【0023】
この発明によれば、まず、第1のステップにおいて、所定期間について、ソーシャル・メディアから、ユーザ間の再投稿関係を特定する再投稿関係情報を含む書き込み情報を取得する。次に、第2のステップにおいて、第1のステップで取得された書き込み情報に含まれる再投稿関係情報に基づいて、ユーザ毎に、ユーザが投稿した書き込み情報を再掲した他のユーザの書き込み情報の数である再投稿数を取得する。次に、第3のステップにおいて、各ユーザについて、第2のステップで取得した再投稿数に基づいて、ソーシャル・メディア分析における有意性を示す度合であるアクティブ度合を計算する。次に、第4のステップにおいて、第3のステップで計算されたアクティブ度合に基づいて、アクティブユーザを抽出する。したがって、ソーシャル・メディアにおけるユーザの影響力を示す再投稿数に基づいて、ソーシャル・メディア分析における有意性を示すアクティブ度合を各ユーザについて計算することによって、ソーシャル・メディアに情報を投稿したユーザの中から、ソーシャル・メディア分析に有意であるユーザを抽出することができる。
【0024】
(9) 本発明は、ソーシャル・メディアに投稿された情報の中から、ソーシャル・メディア分析に有意となるアクティブユーザを抽出するアクティブユーザ抽出方法をコンピュータに実行させるためのプログラムであって、所定期間について、前記ソーシャル・メディアから、ユーザ間の再投稿関係を特定する再投稿関係情報を含む書き込み情報を取得する第1のステップ(例えば、図2のステップS1)と、前記第1のステップで取得された書き込み情報に含まれる再投稿関係情報に基づいて、ユーザ毎に、ユーザが投稿した書き込み情報を再掲した他のユーザの書き込み情報の数である再投稿数を取得する第2のステップ(例えば、図2のステップS2)と、各ユーザについて、前記第2のステップで取得した再投稿数に基づいて、前記ソーシャル・メディア分析における有意性を示す度合であるアクティブ度合を計算する第3のステップ(例えば、図2のステップS3)と、前記第2のステップで計算されたアクティブ度合に基づいて、前記アクティブユーザを抽出する第4のステップ(例えば、図2のステップS4)と、をコンピュータに実行させるためのプログラムを提案している。
【0025】
この発明によれば、まず、第1のステップにおいて、所定期間について、ソーシャル・メディアから、ユーザ間の再投稿関係を特定する再投稿関係情報を含む書き込み情報を取得する。次に、第2のステップにおいて、第1のステップで取得された書き込み情報に含まれる再投稿関係情報に基づいて、ユーザ毎に、ユーザが投稿した書き込み情報を再掲した他のユーザの書き込み情報の数である再投稿数を取得する。次に、第3のステップにおいて、各ユーザについて、第2のステップで取得した再投稿数に基づいて、ソーシャル・メディア分析における有意性を示す度合であるアクティブ度合を計算する。次に、第4のステップにおいて、第3のステップで計算されたアクティブ度合に基づいて、アクティブユーザを抽出する。したがって、ソーシャル・メディアにおけるユーザの影響力を示す再投稿数に基づいて、ソーシャル・メディア分析における有意性を示すアクティブ度合を各ユーザについて計算することによって、ソーシャル・メディアに情報を投稿したユーザの中から、ソーシャル・メディア分析に有意であるユーザを抽出することができる。
【発明の効果】
【0026】
本発明によれば、ソーシャル・メディアに情報を投稿したユーザの中から、ソーシャル・メディア分析に有意であるユーザを抽出することができる。
【図面の簡単な説明】
【0027】
【図1】本発明の第1の実施形態に係るアクティブユーザ抽出装置の構成図である。
【図2】本発明の第1の実施形態に係るアクティブユーザ抽出の処理フローを示す図である。
【図3】本発明の第2の実施形態に係るアクティブユーザ抽出装置の構成図である。
【図4】本発明の第2の実施形態に係るアクティブユーザ抽出の処理フローを示す図である。
【図5】本発明の第3の実施形態に係るアクティブユーザ抽出の処理フローを示す図である。
【発明を実施するための形態】
【0028】
以下、図面を用いて、本発明の実施形態について詳細に説明する。なお、本実施形態における構成要素は適宜、既存の構成要素等との置き換えが可能であり、また、他の既存の構成要素との組み合わせを含むさまざまなバリエーションが可能である。したがって、本実施形態の記載をもって、特許請求の範囲に記載された発明の内容を限定するものではない。
【0029】
<第1の実施形態>
図1および図2を用いて、本発明の第1の実施形態について説明する。
【0030】
<アクティブユーザ情報取得装置の構成>
図1は、本発明の実施形態に係るアクティブユーザ抽出装置20の構成図である。アクティブユーザ抽出装置20は、通信ネットワークを介してソーシャル・メディアサーバ10と接続される。
【0031】
ソーシャル・メディアサーバ10は、ブログ、SNS、TWITTER等のソーシャル・メディアを提供する事業者が管理するサーバであって、ソーシャル・メディアに投稿された情報や、ソーシャル・メディアに情報を投稿したユーザの情報等を記憶、管理する。
【0032】
アクティブユーザ抽出装置20は、図1に示すように、書き込み情報取得部21、再投稿数取得部22、アクティブ度合計算部23、およびアクティブユーザ抽出部24から構成される。
【0033】
書き込み情報取得部21は、所定期間について、ソーシャル・メディアサーバ10からユーザ間の再投稿関係情報を含む書き込み情報を取得する。ここで、所定期間は、ソーシャル・メディア分析を行う分析者が任意に設定することができ、直近の1カ月間や、昨年12カ月間等と設定することができる。また、再投稿関係とは、書き込み情報を投稿したユーザと、その書き込み情報を再投稿したユーザとの繋がり、および書き込み情報と、その書き込み情報の内容を再掲した新たな書き込み情報との繋がりであって、例えば、Twitterのリツイートで繋がっているユーザおよびツイートである。また、再投稿とは、あるユーザにより投稿された書き込み情報の内容を再掲した新たな書き込み情報を他のユーザが投稿することを意味する。
【0034】
再投稿関係情報は、あるユーザにより投稿された書き込み情報が他のユーザにより再投稿された際に、書き込み情報に付加される情報であって、例えば、再投稿の書き込み情報の情報ID、書き込み情報を再投稿したユーザのユーザID、再投稿の基となった書き込み情報の情報ID、および再投稿の基となった書き込み情報を投稿したユーザのユーザIDを含み、本実施形態において、再投稿関係情報にはこれらの情報が含まれるとして説明する。
【0035】
書き込み情報取得部21は、ソーシャル・メディアサーバ10から書き込み情報を取得する際に、書き込み情報の内容に含まれるキーワードを条件にソーシャル・メディアサーバ10の書き込み情報を検索し、検索された書き込み情報を取得してもよい。それにより、所定のキーワードについてのアクティブユーザを抽出することができる。
【0036】
再投稿数取得部22は、書き込み情報取得部21で取得された書き込み情報に含まれる再投稿関係情報に基づいて、ユーザ毎に、投稿した書き込み情報のうち他のユーザにより再投稿された書き込み情報の数である再投稿数を取得する。例えば、あるユーザの書き込み情報の再投稿数を取得する場合には、あるユーザの書き込み情報の情報IDを再投稿の基となった書き込み情報の情報IDとする書き込み情報を取得し、取得した書き込み情報の数を再投稿数として取得する。
【0037】
アクティブ度合計算部23は、再投稿数取得部22で取得したユーザ情報に基づいて、各ユーザのアクティブ度合を計算する。アクティブ度合をf、所定期間の再投稿数をRtとすると、アクティブ度合計算部23は、以下の(1)式を用いて、アクティブ度合fを計算する。なお、所定期間の再投稿数をRtに替わって、所定期間の平均再投稿数を用いてアクティブ度合を計算してもよい。
【0038】
【数1】

【0039】
(1)式を用いて計算されるアクティブ度合fは、所定期間における再投稿数Rtで表される。アクティブ度合fが大きい、すなわち再投稿数Rtが大きいユーザとは、書き込み情報に影響力および伝搬力があるユーザを意味し、言い換えると、ソーシャル・メディアにおける影響力のあるユーザであることを意味する。したがって、後述するアクティブユーザ抽出部24で、ソーシャル・メディアにおいて影響力のあるユーザを抽出したい場合には、アクティブ度合fが大きいユーザを抽出すればよい。
【0040】
アクティブユーザ抽出部24は、アクティブ度合計算部23で計算された各ユーザのアクティブ度合fに基づいて、アクティブユーザを抽出する。具体的には、アクティブユーザ抽出部24は、予め設定されたしきい値に基づいて、アクティブユーザを抽出する。なお、しきい値は、分析者が任意に設定することができる。それにより、アクティブ度合fが所定の値以上のユーザを抽出することや、アクティブ度合fが所定の値以下のユーザを抽出することや、それら両方を抽出することもできる。このように、しきい値を分析者が任意に設定することができることにより、分析者の意向にそったアクティブユーザを抽出することができる。
【0041】
図2は、本発明の実施形態に係るアクティブユーザ抽出の処理フローを示す図である。
【0042】
まず、ステップS1において、書き込み情報取得部21は、ユーザ間の再投稿関係を特定する再投稿関係情報を含む書き込み情報を、ソーシャル・メディアサーバ10から取得する。
【0043】
次に、ステップS2において、再投稿数取得部22は、ステップS1で取得した再投稿関係情報に基づいて、ユーザ毎に、投稿した書き込み情報のうち他のユーザにより再投稿された書き込み情報の数である再投稿数を取得する。
【0044】
次に、ステップS3において、アクティブ度合計算部23は、ステップS2で取得したユーザ情報に基づいて、上述した(1)式を用いて、各ユーザのアクティブ度合fを計算する。
【0045】
次に、ステップS4において、アクティブユーザ抽出部24は、ステップS3で計算されたアクティブ度合fに基づいて、アクティブユーザを抽出する。
【0046】
以上説明したように、本実施形態によれば、ソーシャル・メディアにおける影響力を示す再投稿数に基づいて、アクティブ度合を計算することにより、ソーシャル・メディアに情報を投稿したユーザの中から、ソーシャル・メディア分析に有意であるユーザを抽出することができる。
【0047】
<第2の実施形態>
図3および図4を用いて、本発明の第2の実施形態について説明する。なお、本実施形態におけるアクティブユーザ抽出装置は、所定期間の再投稿数とともに、ユーザの投稿活動に関する数値情報を用いて、アクティブユーザを抽出する。なお、第1の実施形態と同一の符号を付す構成要素については、同一の機能を有することから、その詳細な説明は省略する。
【0048】
アクティブユーザ抽出装置30は、図3に示すように、書き込み情報取得部21、再投稿数取得部22、アクティブ度合計算部33、アクティブユーザ抽出部34、およびユーザ情報取得部35から構成される。
【0049】
ユーザ情報取得部35は、ソーシャル・メディアサーバ10からユーザ情報を取得する。例えば、ソーシャル・メディアが提供しているREST−APIを利用して、ソーシャル・メディアサーバ10からユーザ情報を取得する。ユーザ情報を取得する際に、取得条件を設定してもよい。ここで、ユーザ情報は、リンクユーザ数および被リンクユーザ数の少なくとも1つを含む。
【0050】
リンクユーザ数とは、ユーザがリンクしてリンク関係にあるユーザの数であって、例えば、TWITTERでは、ユーザがフォローしているユーザの数、すなわち、フォロー数である。また、被リンクユーザ数とは、ユーザが他のユーザからリンクされてリンク関係にあるユーザの数であって、例えば、TWITTERでは、ユーザをフォローしている他のユーザの数、すなわち、フォロワー数である。
【0051】
アクティブ度合計算部33は、再投稿数取得部22で取得した再投稿数と、ユーザ情報取得部35で取得したユーザ情報とに基づいて、各ユーザのアクティブ度合を計算する。
【0052】
ユーザ情報として、リンクユーザ数が含まれる場合には、リンクユーザ数をFとすると、アクティブ度合計算部33は、以下の(2)式を用いて、アクティブ度合fを計算する。(2)式に示すように、再投稿数Rt、およびリンクユーザ数Fには、それぞれ係数α、βとして重み付けを行うことができる。それにより、分析者がアクティブユーザを抽出する際に、再投稿数Rt、およびリンクユーザ数Fのいずれに重きをおくかを設定することができる。
【0053】
【数2】

【0054】
(2)式を用いて計算されるアクティブ度合fは、ユーザの再投稿数Rtとリンクユーザ数Fとの和で表される。ソーシャル・メディアへの積極的な参加状況を示すリンクユーザ数Fを加味することにより、ソーシャル・メディアにおけるユーザの影響力をより正確に算出することができる。積極的にソーシャル・メディアに参加しているユーザは、ソーシャル・メディアにおいて重要な役割を果たしており、このようなユーザのリンクユーザ数Fは大きい。その結果、アクティブ度合fは大きくなり、このようなソーシャル・メディアにおける影響力の大きいユーザのアクティブ度合fを大きくすることができるからである。したがって、書き込み情報に影響力および伝搬力があり、さらに、ソーシャル・メディアへ積極的に参加しているユーザのアクティブ度合fは大きくなる。
【0055】
また、ユーザ情報として、被リンクユーザ数が含まれる場合には、被リンクユーザ数をFdとすると、アクティブ度合計算部33は、以下の(3)式を用いて、アクティブ度合fを計算する。(3)式に示すように、再投稿数Rt、および被リンクユーザ数をFdには、(2)式同様に、それぞれ係数α、γとして重み付けを行うことができる。それにより、分析者がアクティブユーザを抽出する際に、再投稿数Rt、および被リンクユーザ数をFdのいずれに重きをおくかを設定することができる。
【0056】
【数3】

【0057】
(3)式を用いて計算されるアクティブ度合fは、ユーザの再投稿数Rtと被リンクユーザ数Fdとの和で表される。ユーザが他のユーザから関心を寄せられている状況を示す被リンクユーザ数Fdを加味することにより、ソーシャル・メディアにおけるユーザの影響力をより正確に算出することができる。有害や無意味な書き込み情報の投稿を行っているユーザの被リンクユーザ数Fdは小さいので、アクティブ度合fは小さくなり、このようなソーシャル・メディアにおける影響力の小さいユーザのアクティブ度合fを小さくすることができるからである。したがって、書き込み情報に影響力および伝搬力があり、さらに、ソーシャル・メディアにおいて他のユーザの関心を集めているユーザのアクティブ度合fは大きくなる。
【0058】
さらに、ユーザ情報として、リンクユーザ数Fおよび被リンクユーザ数Fdが含まれる場合には、アクティブ度合計算部33は、以下の(4)式を用いて、アクティブ度合fを計算する。(4)式に示すように、再投稿数Rt、リンクユーザ数F、および被リンクユーザ数Fdには、(2)式および(3)式同様に、それぞれ係数α、β、γとして重み付けを行うことができる。それにより、分析者がアクティブユーザを抽出する際に、再投稿数Rt、リンクユーザ数F、および被リンクユーザ数Fdのいずれに重きをおくかを設定することができる。
【0059】
【数4】

【0060】
(4)式を用いて計算されるアクティブ度合fは、ユーザの再投稿数Rt、リンクユーザ数F、および被リンクユーザ数Fdの和で表される。ソーシャル・メディアへの積極的な参加状況を示すリンクユーザ数Fと、ユーザが他のユーザから関心を寄せられている状況を示す被リンクユーザ数Fdとを加味することにより、ソーシャル・メディアにおけるユーザの影響力をより正確に算出することができる。この場合、投稿した書き込み情報に影響力および伝搬力があり、ソーシャル・メディアへの積極的に参加するとともにソーシャル・メディアにおいて他のユーザの関心を集めているユーザのアクティブ度合fは大きくなる。
【0061】
図4は、本発明の実施形態に係るアクティブユーザ抽出の処理フローを示す図である。なお、本処理において、ステップS11およびS12は、ステップS13の後であってもよい。
【0062】
まず、ステップS11において、書き込み情報取得部21は、ユーザ間の再投稿関係を特定する再投稿関係情報を含む書き込み情報を、ソーシャル・メディアサーバ10から取得する。
【0063】
次に、ステップS12において、再投稿数取得部22は、ステップS11で取得した再投稿関係情報に基づいて、ユーザ毎に、投稿した書き込み情報のうち他のユーザにより再投稿された書き込み情報の数である再投稿数を取得する。
【0064】
次に、ステップS13において、ユーザ情報取得部35は、ソーシャル・メディアサーバ10からリンク数および被リンク数の少なくとも一方を含むユーザ情報を取得する。
【0065】
次に、ステップS14において、アクティブ度合計算部33は、ステップS12で取得したユーザ情報に基づいて、上述した(2)式から(4)式のいずれかを用いて、各ユーザのアクティブ度合fを計算する。
【0066】
次に、ステップS15において、アクティブユーザ抽出部34は、ステップS14で計算されたアクティブ度合fに基づいて、アクティブユーザを抽出する。
【0067】
以上説明したように、本実施形態によれば、ソーシャル・メディアにおける影響力を示す再投稿数、およびユーザの投稿活動に関する数値情報に基づいて、アクティブ度合を計算することにより、ソーシャル・メディアに情報を投稿したユーザの中から、ソーシャル・メディア分析に有意であるユーザを抽出することができる。
【0068】
<第3の実施形態>
図5を用いて、本発明の第3の実施形態について説明する。なお、本実施形態におけるアクティブユーザ抽出装置は、アクティブユーザ抽出部で抽出したアクティブユーザの情報、および書き込み情報取得部で取得した書き込み情報を記憶しておくものである。なお、第2の実施形態と同一の符号を付す構成要素については、同一の機能を有することから、その詳細な説明は省略する。
【0069】
<アクティブユーザ抽出装置の構成>
本実施形態に係るアクティブユーザ抽出装置40は、図5に示すように、通信ネットワークを介してソーシャル・メディアサーバ10と接続され、書き込み情報取得部41、再投稿数取得部22、アクティブ度合計算部33、アクティブユーザ抽出部34、ユーザ情報取得部45、ユーザ情報記憶部46、および書き込み情報記憶部47から構成される。ただし、アクティブユーザ抽出装置40に備えられるのは、ユーザ情報記憶部46、および書き込み情報記憶部47のいずれか一方であってもよい。
【0070】
ユーザ情報取得部45は、後述するユーザ情報記憶部46にユーザ情報が記憶されていないユーザ、およびユーザ情報が更新されているユーザについて、ソーシャル・メディアサーバ10からユーザ情報を取得する。例えば、ソーシャル・メディアが提供しているREST−APIを利用して、ソーシャル・メディアサーバ10からユーザ情報を取得する。なお、ユーザ情報を取得する際に、取得条件を設定してもよい。
【0071】
ユーザ情報記憶部46は、アクティブユーザ抽出部34で抽出されたユーザについて、ユーザ情報取得部45で取得したユーザ情報、および再投稿数取得部22で取得した再投稿数を記憶する。それにより、アクティブユーザの情報を記憶しておくことができ、次回以降、同一のユーザがアクティブユーザ抽出部34で抽出された場合には、新たに取得されたユーザ情報にてユーザ情報記憶部46を更新する。なお、ユーザ情報記憶部46は、記憶領域の一部を残しておく。それにより、新たなユーザがアクティブユーザとして抽出された際に、記憶部の容量を増やすことなく、新規ユーザのユーザ情報を取得することができる。
【0072】
書き込み情報記憶部47は、アクティブユーザ抽出部34で抽出されたユーザの書き込み情報を記憶する。それにより、次回以降、書き込み情報取得部41は、書き込み情報記憶部47にされていない書き込み情報のみを取得すればよい。
【0073】
以上説明したように、本実施形態によれば、アクティブユーザ抽出装置40に、ユーザ情報記憶部46、書き込み情報記憶部47を備えることにより、次回以降の処理を減らすことができ、効率よくアクティブユーザ抽出の処理を行うことができる。また、ユーザ情報記憶部46の記憶領域の一部を残しておくことにより、ユーザ情報の増加を防ぎつつ、新規ユーザのユーザ情報を取得することができる。
【0074】
なお、アクティブユーザ抽出装置の処理をコンピュータ読み取り可能な記録媒体に記録し、この記録媒体に記録されたプログラムを機器に読み込ませ、実行することによって本発明のアクティブユーザ抽出装置を実現することができる。ここでいうコンピュータシステムとは、OSや周辺装置等のハードウェアを含む。
【0075】
また、「コンピュータシステム」は、WWW(World Wide Web)システムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。
【0076】
また、上記プログラムは、前述した機能の一部を実現するためのものであってもよい。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であってもよい。
【0077】
以上、この発明の実施形態につき、図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
【符号の説明】
【0078】
10 ソーシャル・メディアサーバ
20 アクティブユーザ抽出装置
21 書き込み情報取得部
22 再投稿数取得部
23 アクティブ度合計算部
24 アクティブユーザ抽出部

【特許請求の範囲】
【請求項1】
ソーシャル・メディアに投稿された情報の中から、ソーシャル・メディア分析に有意となるアクティブユーザを抽出するアクティブユーザ抽出装置において、
所定期間について、前記ソーシャル・メディアから、ユーザ間の再投稿関係を特定する再投稿関係情報を含む書き込み情報を取得する書き込み情報取得手段と、
前記書き込み情報取得手段で取得された書き込み情報に含まれる再投稿関係情報に基づいて、ユーザ毎に、ユーザが投稿した書き込み情報を再掲した他のユーザの書き込み情報の数である再投稿数を取得する再投稿数取得手段と、
各ユーザについて、前記再投稿数取得手段で取得した再投稿数に基づいて、前記ソーシャル・メディア分析における有意性を示す度合であるアクティブ度合を計算するアクティブ度合計算手段と、
前記アクティブ度合計算手段で計算されたアクティブ度合に基づいて、前記アクティブユーザを抽出するアクティブユーザ抽出手段と、
を備えることを特徴とするアクティブユーザ抽出装置。
【請求項2】
前記ソーシャル・メディアにおいて、ユーザがリンクしたことによってリンク関係にあるリンクユーザ数を少なくとも含む、ユーザの投稿活動に関する数値情報をユーザ情報として取得するユーザ情報取得手段を備え、
前記アクティブ度合計算手段は、前記各ユーザについて、前記再投稿数取得手段で取得した再投稿数および前記ユーザ情報取得手段で取得されたユーザ情報に含まれるリンクユーザ数に基づいて、前記アクティブ度合を計算することを特徴とする請求項1に記載のアクティブユーザ抽出装置。
【請求項3】
前記ソーシャル・メディアにおいて、ユーザが他のユーザからリンクされたことによってリンク関係にある被リンクユーザ数を少なくとも含む、ユーザの投稿活動に関する数値情報をユーザ情報として取得するユーザ情報取得手段を備え、
前記アクティブ度合計算手段は、前記各ユーザについて、前記再投稿数取得手段で取得した再投稿数および前記ユーザ情報取得手段で取得されたユーザ情報に含まれる被リンクユーザ数に基づいて、前記アクティブ度合を計算することを特徴とする請求項1に記載のアクティブユーザ抽出装置。
【請求項4】
前記ユーザの投稿活動に関する数値情報は、被リンクユーザ数とともに、ソーシャル・メディアにおいて、前記ユーザがリンクしたことによってリンク関係にあるリンクユーザ数を含み、
前記アクティブ度合計算手段は、前記各ユーザについて、前記再投稿数取得手段で取得した再投稿数と、前記ユーザ情報取得手段で取得されたユーザ情報に含まれるリンクユーザ数および被リンクユーザ数と、に基づいて、前記アクティブ度合を計算することを特徴とする請求項3に記載のアクティブユーザ抽出装置。
【請求項5】
前記アクティブ度合計算手段は、前記アクティブ度合をf、前記再投稿数をRt、前記リンクユーザ数をF、前記被リンクユーザ数をFd、所定期間における再投稿数の重みを決定するための係数をα、前記リンクユーザ数の重みを決定するための係数をβ、前記被リンクユーザ数の重みを決定するための係数をγとし、数1の式を用いて、前記アクティブ度合を計算することを特徴とする請求項4に記載のアクティブユーザ抽出装置。
【数1】

【請求項6】
前記ユーザ情報取得手段で取得したユーザ情報を記憶する記憶手段を備え、
前記記憶手段は、一部の記憶領域を残し、残りの記憶領域に前記ユーザ情報取得手段で取得されたユーザ情報を記憶することを特徴とする請求項2から5のいずれかに記載のアクティブユーザ抽出装置。
【請求項7】
前記アクティブユーザ抽出手段は、前記アクティブユーザを抽出する条件として、しきい値を用いることを特徴とする請求項1から6のいずれかに記載のアクティブユーザ抽出装置。
【請求項8】
ソーシャル・メディアに投稿された情報の中から、ソーシャル・メディア分析に有意となるアクティブユーザを抽出するアクティブユーザ抽出装置で実施されるアクティブユーザ抽出方法であって、
所定期間について、前記ソーシャル・メディアから、ユーザ間の再投稿関係を特定する再投稿関係情報を含む書き込み情報を取得する第1のステップと、
前記第1のステップで取得された書き込み情報に含まれる再投稿関係情報に基づいて、ユーザ毎に、ユーザが投稿した書き込み情報を再掲した他のユーザの書き込み情報の数である再投稿数を取得する第2のステップと、
各ユーザについて、前記第2のステップで取得した再投稿数に基づいて、前記ソーシャル・メディア分析における有意性を示す度合であるアクティブ度合を計算する第3のステップと、
前記第2のステップで計算されたアクティブ度合に基づいて、前記アクティブユーザを抽出する第4のステップと、
を含むことを特徴とするアクティブユーザ抽出方法。
【請求項9】
ソーシャル・メディアに投稿された情報の中から、ソーシャル・メディア分析に有意となるアクティブユーザを抽出するアクティブユーザ抽出方法をコンピュータに実行させるためのプログラムであって、
所定期間について、前記ソーシャル・メディアから、ユーザ間の再投稿関係を特定する再投稿関係情報を含む書き込み情報を取得する第1のステップと、
前記第1のステップで取得された書き込み情報に含まれる再投稿関係情報に基づいて、ユーザ毎に、ユーザが投稿した書き込み情報を再掲した他のユーザの書き込み情報の数である再投稿数を取得する第2のステップと、
各ユーザについて、前記第2のステップで取得した再投稿数に基づいて、前記ソーシャル・メディア分析における有意性を示す度合であるアクティブ度合を計算する第3のステップと、
前記第2のステップで計算されたアクティブ度合に基づいて、前記アクティブユーザを抽出する第4のステップと、
をコンピュータに実行させるためのプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate


【公開番号】特開2013−45365(P2013−45365A)
【公開日】平成25年3月4日(2013.3.4)
【国際特許分類】
【出願番号】特願2011−184074(P2011−184074)
【出願日】平成23年8月25日(2011.8.25)
【出願人】(000208891)KDDI株式会社 (2,700)
【Fターム(参考)】