説明

影響度算出装置、影響度算出方法およびプログラム

【課題】書き込み情報の影響度を算出する影響度算出装置、影響度算出方法、およびプログラムを提供すること。
【解決手段】影響度算出装置100は、ソーシャル・メディアから、再発信関係情報および発信時間情報を含む書き込み情報を取得する情報取得部110と、ユーザのリンク数を取得するユーザ情報取得部120と、取得された再発信関係情報に基づいて、ユーザの拡散率を算出する拡散率算出部130と、書き込み情報に含まれる再発信関係情報および発信時間情報に基づいて、再発信数の時系列リストを作成する時系列リスト作成部140と、作成された時系列リストに基づいて、所定時間帯における再発信状況を示す反映度を算出する反映度算出部150と、書き込み情報が発信された所定時間帯の反映度、書き込み情報を発信したユーザの拡散率、および再発信関係にあるユーザのリンク数から、各書き込み情報の影響度を算出する影響度算出部160と、を備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ソーシャル・メディアに発信された書き込み情報の影響度を算出する影響度算出装置、影響度算出方法およびプログラムに関する。
【背景技術】
【0002】
近年、テレビCM等の広告に替わるマーケティング手法として、インフルエンサーを活用して商品情報を発信、および消費者の間にクチコミを促すインフルエンサー・マーケティングが注目されている。ここで、インフルエンサーとは、人々の消費行動に影響を与えるユーザを指し、ブログ、SNS(ソーシャル・ネットワーキング・サービス)、口コミサイト、Twitter(登録商標)等のソーシャル・メディアにおいては、他のユーザに対して強い影響力を持つ人がインフルエンサーに該当する。
【0003】
インフルエンサー・マーケティングにおいて、複数のユーザの中から、最適なインフルエンサーを抽出することが重要である。そこで、インフルエンサーの抽出方法として、共通の関心を共有するコミュニティのユーザの中から、ユーザ間のリンク関係と予め登録されているユーザ情報に基づいて、インフルエンサーを抽出する方法が開示されている(例えば、特許文献1参照)。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特表2010−515160号
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、特許文献1に開示されている方法では、ソーシャル・メディアに発信された書き込み情報が、どの程度拡散されているか、また、どの程度の時間で伝搬されているかを考慮していないため、ソーシャル・メディアへの書き込み情報の影響度を算出することはできないという問題点があった。
【0006】
そこで、本発明は、上述の課題に鑑みてなされたものであり、書き込み情報がどの程度拡散されたか、および書き込み情報がどの程度の時間で伝搬されたかを分析することにより、書き込み情報の影響度を算出する影響度算出装置、影響度算出方法、およびプログラムを提供することを目的とする。
【課題を解決するための手段】
【0007】
本発明は、上記の課題を解決するために、以下の事項を提案している。なお、理解を容易にするために、本発明の実施形態に対応する符号を付して説明するが、これに限定されるものではない。
【0008】
(1) 本発明は、ソーシャル・メディアに発信された書き込み情報の影響度を算出する影響度算出装置であって、ソーシャル・メディアから、ユーザ間の再発信関係を特定する再発信関係情報および発信時間情報を含む書き込み情報を取得する情報取得手段(例えば、図1の情報取得部110)と、前記ソーシャル・メディア内の各ユーザにおける他のユーザとのリンク数を、前記ソーシャル・メディアから取得するユーザ情報取得手段(例えば、図1のユーザ情報取得部120)と、前記情報取得手段で取得された書き込み情報に含まれる再発信関係情報に基づいて、前記各ユーザが発信する書き込み情報が再発信される確率である拡散率を算出する拡散率算出手段(例えば、図1の拡散率算出部130)と、前記情報取得手段で取得された書き込み情報に含まれる再発信関係情報および発信時間情報に基づいて、所定時間帯毎の再発信数をリスト化した時系列リストを作成する時系列リスト作成手段(例えば、図1の時系列リスト作成部140)と、前記時系列リスト作成手段で作成した時系列リストに基づいて、所定時間帯における再発信状況を示す反映度を算出する反映度算出手段(例えば、図1の反映度算出部150)と、前記情報取得手段で取得された書き込み情報に含まれる発信時間情報を含む所定時間帯について、前記反映度算出手段で算出された反映度、前記書き込み情報を発信したユーザについて、前記拡散率算出手段で算出された拡散率、および前記書き込み情報を発信したユーザおよび前記書き込み情報を再発信したユーザについて、前記ユーザ情報取得手段で取得されたリンク数に基づいて、各書き込み情報の影響度を算出する影響度算出手段(例えば、図1の影響度算出部160)と、を備えることを特徴とする影響度算出装置を提案している。
【0009】
この発明によれば、情報取得手段は、ソーシャル・メディアから、ユーザ間の再発信関係を特定する再発信関係情報および発信時間情報を含む書き込み情報を取得する。ユーザ情報取得手段は、ソーシャル・メディア内の各ユーザにおける他のユーザとのリンク数を、ソーシャル・メディアから取得する。拡散率算出手段は、情報取得手段で取得された書き込み情報に含まれる再発信関係情報に基づいて、ソーシャル・メディア内の各ユーザが発信する書き込み情報が再発信される確率である拡散率を算出する。時系列リスト作成手段は、情報取得手段で取得された書き込み情報に含まれる再発信関係情報に基づいて、所定時間帯毎の再発信数をリスト化した時系列リストを作成する。反映度算出手段は、時系列リスト作成手段で作成した時系列リストに基づいて、所定時間帯における再発信状況を示す反映度を算出する。影響度算出手段は、情報取得手段で取得された書き込み情報に含まれる発信時間情報を含む所定時間帯について、反映度算出手段で算出された反映度、書き込み情報を発信したユーザについて、拡散率算出手段で算出された拡散率、および書き込み情報を発信したユーザおよび書き込み情報を再発信したユーザについて、ユーザ情報取得手段で取得されたリンク数に基づいて、各書き込み情報の影響度を算出する。したがって、書き込み情報がどの程度の時間で伝搬されるかを示す時系列リストを作成し、時系列リストから算出された反映度と書き込み情報の拡散率とから、書き込み情報の影響度を算出することにより、書き込み情報がどの程度拡散されたか、および書き込み情報がどの程度の時間で伝搬されたかを加味した影響度を算出することができる。
【0010】
(2) 本発明は、(1)の影響度算出装置について、前記影響度算出手段で算出された各書き込み情報の影響度に基づいて、前記各ユーザの影響力を算出し、算出された影響力が高いユーザをインフルエンサーとして抽出する抽出手段を備えることを特徴とする影響度算出装置を提案している。
【0011】
この発明によれば、抽出手段は、影響度算出手段で算出された各書き込み情報の影響度に基づいて、各ユーザの影響力を算出し、算出された影響力が高いユーザをインフルエンサーとして抽出する。したがって、書き込み情報の影響度からユーザ間に広く伝搬されている書き込み情報を発信し、影響力があるユーザをインフルエンサーとして抽出することができる。
【0012】
(3) 本発明は、(1)または(2)の影響度算出装置について、前記反映度算出手段は、前記時系列リスト作成手段で作成した時系列リストに基づいて、前記所定時間帯毎の再発信数を、前記所定時間帯毎の再発信数の和で割ることによって、反映度を算出することを特徴とする影響度算出装置を提案している。
【0013】
この発明によれば、反映度算出手段は、時系列リスト作成手段で作成した時系列リストに基づいて、所定時間帯毎の再発信数を、所定時間帯毎の再発信数の和で割ることによって、反映度を算出する。したがって、所定時間帯毎の再発信数をリスト化した時系列リストを用いて、所定時間帯における書き込み情報の再発信度合として、反映度を算出することができる。
【0014】
(4) 本発明は、(1)から(3)の影響度算出装置について、前記拡散率算出手段は、前記各ユーザについて、前記情報取得手段で取得された書き込み情報に含まれる再発信関係情報に基づいて算出された書き込み情報の再発信数を、ユーザが発信した書き込み情報の全発信数で割ることによって、拡散率を算出することを特徴とする影響度算出装置を提案している。
【0015】
この発明によれば、拡散率算出手段は、各ユーザについて、情報取得手段で取得された書き込み情報に含まれる再発信関係情報に基づいて算出された書き込み情報の再発信数を、ユーザが発信した書き込み情報の全発信数で割ることによって、拡散率を算出する。したがって、ユーザ間の再発信関係を特定する再発信関係情報を用いて、各ユーザの書き込み情報が他のユーザにより再発信される確率である拡散率を算出することができる。
【0016】
(5) 本発明は、(1)から(4)の影響度算出装置について、前記時系列リスト作成手段は、前記情報取得手段で取得された書き込み情報に含まれる再発信関係情報に基づいて、前記書き込み情報が伝搬する伝搬経路を解析し、伝搬経路情報を作成する伝搬経路解析手段(例えば、図1の伝搬経路解析部141)と、前記情報取得手段で取得された書き込み情報に含まれる発信時間情報、および前記伝搬経路解析手段で解析された伝搬経路に基づいて、所定時間帯毎に各伝搬段階の再発信数をリスト化した時系列リストを作成するリスト作成手段(例えば、図1のリスト作成部142)と、を備え、前記反映度算出手段は、前記時系列リスト作成手段で作成した時系列リストに基づいて、所定時間帯における各伝搬段階の再発信状況を示す反映度を算出し、前記影響度算出手段は、前記伝搬経路解析手段で解析された伝搬経路に基づいて、前記反映度算出手段で算出された、前記情報取得手段で取得された書き込み情報に含まれる発信時間情報を含む所定時間帯の反映度、前記拡散率算出手段で算出された拡散率、および前記ユーザ情報取得手段で取得されたリンク数から影響度を算出することを特徴とする影響度算出装置を提案している。
【0017】
この発明によれば、伝搬経路解析手段は、情報取得手段で取得された書き込み情報に含まれる発信時間情報に基づいて、前記書き込み情報が伝搬する伝搬経路を解析し、伝搬経路情報を作成する。リスト作成手段は、情報取得手段で取得された書き込み情報に含まれる再発信関係情報、および伝搬経路解析手段で解析された伝搬経路に基づいて、所定時間帯毎に各伝搬段階の再発信数をリスト化した時系列リストを作成する。反映度算出手段は、時系列リスト作成手段で作成した時系列リストに基づいて、所定時間帯における各伝搬段階の再発信状況を示す反映度を算出する。影響度算出手段は、伝搬経路解析手段で解析された伝搬経路に基づいて、反映度算出手段で算出された、情報取得手段で取得された書き込み情報に含まれる発信時間情報を含む所定時間帯の反映度、拡散率算出手段で算出された拡散率、およびユーザ情報取得手段で取得されたリンク数から影響度を算出する。したがって、書き込み情報が伝搬する段階的な経路である伝搬経路を解析することにより、書き込み情報がユーザからユーザへと段階的に伝搬することを加味して書き込み情報の影響度を算出することができる。
【0018】
(6) 本発明は、(5)の影響度算出装置について、前記影響度算出手段は、前記伝搬経路のうち一経路のn段階における影響度をIn、前記一経路のn段階のユーザの拡散率をXn、前記一経路のn段階のユーザのリンク数をFn、前記一経路のn段階の反映度のうち、前記n段階のユーザが書き込み情報を発信した発信時刻を含む前記所定時間帯の反映度をRTnとしたとき、前記一経路のn段階における影響度Inは、数1の式を用いて求められることを特徴とする影響度算出装置を提案している。
【0019】
この発明によれば、一経路のn段階における影響度Inは、一経路のn段階のユーザの拡散率Xn、一経路のn段階のユーザのリンク数Fn、一経路のn段階の反映度のうち、n段階のユーザが書き込み情報を発信した発信時刻を含む所定時間帯の反映度RTnを用いて求められる。したがって、伝搬のn段階における書き込み情報の影響度Inを算出することができる。
【0020】
(7) 本発明は、(1)から(6)の影響度算出装置について、前記拡散率算出手段は、所定期間にされた書き込み情報に含まれる再発信関係情報に基づいて、前記拡散率を算出することを特徴とする影響度算出装置を提案している。
【0021】
この発明によれば、拡散率算出手段は、所定期間にされた書き込み情報に含まれる再発信関係情報に基づいて、拡散率を算出する。したがって、所定期間における書き込み情報の影響度を算出することができる。
【0022】
(8) 本発明は、(1)から(7)の影響度算出装置について、情報取得手段は、前記ソーシャル・メディアにおいて再発信された書き込み情報のうち、所定の条件に合致する書き込み情報を取得することを特徴とする影響度算出装置を提案している。
【0023】
この発明によれば、情報取得手段は、ソーシャル・メディアにおいて再発信された書き込み情報のうち、所定の条件に合致する書き込み情報を取得する。したがって、所定の条件に合致する書き込み情報の影響度を算出することができる。
【0024】
(9) 本発明は、ソーシャル・メディアに発信された書き込み情報の影響度を算出する影響度算出方法であって、ソーシャル・メディアから、ユーザ間の再発信関係を特定する再発信関係情報および発信時間情報を含む書き込み情報を取得する第1のステップ(例えば、図3のステップS1)と、前記ソーシャル・メディア内の各ユーザにおける他のユーザとのリンク数を、前記ソーシャル・メディアから取得する第2のステップ(例えば、図3のステップS2)と、前記第1のステップで取得された書き込み情報に含まれる再発信関係情報に基づいて、前記ソーシャル・メディア内の各ユーザが発信する書き込み情報が再発信される確率である拡散率を算出する第3のステップ(例えば、図3のステップS3)と、前記第1のステップで取得された書き込み情報に含まれる再発信関係情報および発信時間情報に基づいて、所定時間帯毎の再発信数をリスト化した時系列リストを作成する第4のステップ(例えば、図3のステップS4)と、前記第4のステップで作成した時系列リストに基づいて、所定時間帯における再発信状況を示す反映度を算出する第5のステップ(例えば、図3のステップS5)と、前記第1のステップで取得された書き込み情報に含まれる発信時間情報を含む所定時間帯について、前記第5のステップで算出された反映度、前記書き込み情報を発信したユーザおよび前記書き込み情報を再発信したユーザについて、前記第2のステップで取得されたリンク数、および前記書き込み情報を発信したユーザについて、前記第3のステップで算出された拡散率に基づいて、各書き込み情報の影響度を算出する(例えば、図3のステップS6、S7)と、を含むことを特徴とする影響度算出方法を提案している。
【0025】
この発明によれば、まず、第1のステップにおいて、ソーシャル・メディアから、ユーザ間の再発信関係を特定する再発信関係情報および発信時間情報を含む書き込み情報を取得する。次に、第2のステップにおいて、ソーシャル・メディア内の各ユーザにおける他のユーザとのリンク数を、ソーシャル・メディアから取得する。次に、第3のステップにおいて、第1のステップで取得された書き込み情報に含まれる再発信関係情報に基づいて、ソーシャル・メディア内の各ユーザが発信する書き込み情報が再発信される確率である拡散率を算出する。次に、第4のステップにおいて、第1のステップで取得された書き込み情報に含まれる再発信関係情報および発信時間情報に基づいて、所定時間帯毎の再発信数をリスト化した時系列リストを作成する。次に、第5のステップにおいて、第4のステップで作成した時系列リストに基づいて、所定時間帯における再発信状況を示す反映度を算出する。次に、第6のステップにおいて、次に、第6のステップにおいて、第1のステップで取得された書き込み情報に含まれる発信時間情報を含む所定時間帯について、第5のステップで算出された反映度、書き込み情報を発信したユーザおよび書き込み情報を再発信したユーザについて、第2のステップで取得されたリンク数、および書き込み情報を発信したユーザについて、第3のステップで算出された拡散率に基づいて、各書き込み情報の影響度を算出する。したがって、書き込み情報がどの程度の時間で伝搬されるかを示す時系列リストを作成し、時系列リストから算出された反映度と書き込み情報の拡散率とから、書き込み情報の影響度を算出することにより、書き込み情報がどの程度拡散されたか、および書き込み情報がどの程度の時間で伝搬されたかを加味した影響度を算出することができる。
【0026】
(10) 本発明は、ソーシャル・メディアに発信された書き込み情報の影響度を算出する影響度算出方法をコンピュータに実行させるためのプログラムであって、ソーシャル・メディアから、ユーザ間の再発信関係を特定する再発信関係情報および発信時間情報を含む書き込み情報を取得する第1のステップ(例えば、図3のステップS1)と、前記ソーシャル・メディア内の各ユーザにおける他のユーザとのリンク数を、前記ソーシャル・メディアから取得する第2のステップ(例えば、図3のステップS2)と、前記第1のステップで取得された書き込み情報に含まれる再発信関係情報に基づいて、前記ソーシャル・メディア内の各ユーザが発信する書き込み情報が再発信される確率である拡散率を算出する第3のステップ(例えば、図3のステップS3)と、前記第1のステップで取得された書き込み情報に含まれる再発信関係情報および発信時間情報に基づいて、所定時間帯毎の再発信数をリスト化した時系列リストを作成する第4のステップ(例えば、図3のステップS4)と、前記第4のステップで作成した時系列リストに基づいて、所定時間帯における再発信状況を示す反映度を算出する第5のステップ(例えば、図3のステップS5)と、前記第1のステップで取得された書き込み情報に含まれる発信時間情報を含む所定時間帯について、前記第5のステップで算出された反映度、前記書き込み情報を発信したユーザおよび前記書き込み情報を再発信したユーザについて、前記第2のステップで取得されたリンク数、および前記書き込み情報を発信したユーザについて、前記第3のステップで算出された拡散率に基づいて、各書き込み情報の影響度を算出する(例えば、図3のステップS6、S7)と、をコンピュータに実行させるためのプログラムを提案している。
【0027】
この発明によれば、まず、第1のステップにおいて、ソーシャル・メディアから、ユーザ間の再発信関係を特定する再発信関係情報および発信時間情報を含む書き込み情報を取得する。次に、第2のステップにおいて、ソーシャル・メディア内の各ユーザにおける他のユーザとのリンク数を、ソーシャル・メディアから取得する。次に、第3のステップにおいて、第1のステップで取得された書き込み情報に含まれる再発信関係情報に基づいて、ソーシャル・メディア内の各ユーザが発信する書き込み情報が再発信される確率である拡散率を算出する。次に、第4のステップにおいて、第1のステップで取得された書き込み情報に含まれる再発信関係情報および発信時間情報に基づいて、所定時間帯毎の再発信数をリスト化した時系列リストを作成する。次に、第5のステップにおいて、第4のステップで作成した時系列リストに基づいて、所定時間帯における再発信状況を示す反映度を算出する。次に、第6のステップにおいて、第1のステップで取得された書き込み情報に含まれる発信時間情報を含む所定時間帯について、第5のステップで算出された反映度、書き込み情報を発信したユーザおよび書き込み情報を再発信したユーザについて、第2のステップで取得されたリンク数、および書き込み情報を発信したユーザについて、第3のステップで算出された拡散率に基づいて、各書き込み情報の影響度を算出する。したがって、書き込み情報がどの程度の時間で伝搬されるかを示す時系列リストを作成し、時系列リストから算出された反映度と書き込み情報の拡散率とから、書き込み情報の影響度を算出することにより、書き込み情報がどの程度拡散されたか、および書き込み情報がどの程度の時間で伝搬されたかを加味した影響度を算出することができる。
【発明の効果】
【0028】
本発明によれば、書き込み情報がどの程度拡散されたか、および書き込み情報がどの程度の時間で伝搬されたかを分析することにより、書き込み情報の影響度を算出することができる。
【図面の簡単な説明】
【0029】
【図1】本発明の実施形態に係る影響度算出装置の構成図である。
【図2】本発明の実施形態に係る伝搬経路解析部により解析された伝搬経路および作成される伝搬経路情報の一例を示す図である。
【図3】本発明の実施形態に係る時系列リストの一例を示す図である。
【図4】本発明の実施形態に係る影響度算出処理のフローチャートである。
【図5】影響度解析事例を説明する図である。
【発明を実施するための形態】
【0030】
以下、図面を用いて、本発明の実施形態について詳細に説明する。なお、本実施形態における構成要素は適宜、既存の構成要素等との置き換えが可能であり、また、他の既存の構成要素との組み合わせを含むさまざまなバリエーションが可能である。したがって、本実施形態の記載をもって、特許請求の範囲に記載された発明の内容を限定するものではない。
【0031】
<影響度算出装置の構成>
図1は、本発明の実施形態に係る影響度算出装置100の構成図である。本実施形態に係る影響度算出装置100は、ソーシャル・メディア10にユーザが発信した書き込み情報の影響度を算出する装置である。ここで、ソーシャル・メディアとは、例えば、ブログ、SNS(ソーシャル・ネットワーキング・サービス)、口コミサイト、Twitter(登録商標)等である。影響度算出装置100は、図1に示すように、情報取得部110、ユーザ情報取得部120、拡散率算出部130、時系列リスト作成部140、反映度算出部150、および影響度算出部160を備える。
【0032】
情報取得部110は、ソーシャル・メディア10からユーザ間の再発信関係情報および発信時間情報を含む書き込み情報を取得する。ここで、再発信関係とは、書き込み情報を発信したユーザと、その書き込み情報を再発信したユーザとの繋がり、および書き込み情報と、その書き込み情報の内容を再掲した新たな書き込み情報との繋がりであって、例えば、Twitterのリツイートで繋がっているユーザおよびツイートである。また、再発信とは、あるユーザにより発信された書き込み情報の内容を再掲した新たな書き込み情報を発信することを意味する。
【0033】
再発信関係情報は、あるユーザにより発信された書き込み情報が他のユーザにより再発信された際に、書き込み情報に付加される情報であって、例えば、再発信の書き込み情報の情報ID、書き込み情報を再発信したユーザのユーザID、再発信の基となった書き込み情報の情報ID、および再発信の基となった書き込み情報を発信したユーザのユーザIDを含み、本実施形態において、再発信関係情報にはこれらの情報が含まれるとして説明する。また、発信時間情報とは、再発信の基となった書き込み情報が発信された時刻から書き込み情報が再発信されるまでの経過時間である。なお、発信時間情報として、書き込み情報が再発信された時刻、および再発信の基となった書き込み情報が発信された時刻とを含み、再発信の基となった書き込み情報が発信された時刻から書き込み情報が再発信されるまでの経過時間を必要な際に都度算出してもよい。
【0034】
情報取得部110は、ソーシャル・メディア10から書き込み情報を取得する際に、書き込み情報が発信された期間や書き込み情報の内容に含まれるキーワードを条件にソーシャル・メディア10の書き込み情報を検索し、検索された書き込み情報を取得してもよい。それにより、所定の期間におけるインフルエンサーや、所定のキーワードについてのインフルエンサーを抽出することができる。
【0035】
ユーザ情報取得部120は、ソーシャル・メディア10から、ソーシャル・メディア内の各ユーザについて、各ユーザとリンク関係にあるユーザの数(以下、リンク数という)を取得する。リンク関係にあるユーザとは、例えば、Twitterにおいては、フォロワーとなっているユーザである。なお、情報取得部110で取得した書き込み情報を発信または再発信したユーザのユーザIDに基づいて、情報取得部110で取得した書き込み情報を発信または再発信したユーザのリンク数のみを取得してもよい。
【0036】
拡散率算出部130は、情報取得部110で取得された書き込み情報に含まれる再発信関係情報に基づいて、ユーザ毎に、発信した書き込み情報の数(発信数)、および発信した書き込み情報のうち他のユーザにより再発信された書き込み情報の数(再発信数)を算出する。次に、拡散率算出部130は、拡散率Xを以下の(1)式を用いて算出する。なお、拡散率Xは、ソーシャル・メディア内の各ユーザが発信する書き込み情報が再発信される確率である。なお、拡散率算出部130は、情報取得部110で取得された書き込み情報のうち所定期間内の書き込み情報から拡散率Xを求めてもよい。それにより、所定期間内の拡散率の精度を上げることができる。
【0037】
【数1】

【0038】
時系列リスト作成部140は、情報取得部110で取得された書き込み情報に含まれる再発信関係情報および発信時間情報に基づいて、所定時間帯毎の再発信数をリスト化した時系列リストを作成する。時系列リスト作成部140は、伝搬経路解析部141、およびリスト作成部142を備える。
【0039】
伝搬経路解析部141は、情報取得部110で取得された書き込み情報に含まれる再発信関係情報に基づいて、各書き込み情報が伝搬する伝搬経路を解析する。なお、書き込み情報はユーザからユーザへと伝搬するので、伝播経路はユーザ間の繋がりにより段階的に構成される。次に、伝搬経路解析部141は、解析した伝搬経路に基づいて、伝搬経路情報を作成する。図2に示す具体例を用いて、伝搬経路の解析および伝搬経路から作成される伝搬経路情報について説明する。
【0040】
図2(a)には、情報取得部110で取得した再発信関係情報を示す。なお、説明の便宜上、ユーザIDの欄にはユーザ名を示す。まず、伝搬経路解析部141は、再発信により繋がっている書き込み情報群、すなわち、内容が共通する書き込み情報群を判断する。図2(a)に示した再発信関係情報からは、情報ID=info10,info100,Info110,Info120、および情報ID=info20,info200,Info210の2つのグループが判断される。
【0041】
次に、伝搬経路解析部141は、各書き込み情報群について、再発信で繋がっているユーザの関係に基づいて伝搬経路を解析する。情報ID=info10,info100,Info110,Info120を含む書き込み情報群については、ユーザAが発信した情報をユーザBが再発信し、ユーザBが発信した情報をユーザCおよびユーザDが再発信していることから、ユーザAが発信した書き込み情報info10の内容が伝搬する伝搬経路は、図2(b)(1)に示すような経路であると、伝搬経路解析部141により解析される。同様に、情報ID=info20,info200,Info210の書き込み情報群については、ユーザEが発信した書き込み情報info20の内容が伝搬する伝搬経路は、図2(b)(2)に示すような経路であると、伝搬経路解析部141により解析される。
【0042】
図2(c)に、伝搬経路情報の一例を示す。図2(c)に示す伝搬経路情報は、図2(b)(1)の伝搬経路に基づいて作成された伝搬経路情報である。図2(c)に示すように、ユーザAとユーザBとが対応付けられ、ユーザBとユーザCおよびユーザDとが対応付けられて記憶される。なお、伝搬経路情報は、内容が共通する書き込み情報群毎に作成される。
【0043】
リスト作成部142は、情報取得部110で取得された書き込み情報に含まれる発信時間情報、および伝搬経路解析部141で解析された伝搬経路に基づいて、所定時間帯毎に各伝搬段階の再発信数をリスト化した時系列リストを作成する。具体的には、伝搬経路の各段階について、書き込み情報を所定時間毎に統計処理し、伝搬経路の各段階について所定時間帯毎の再発信数を算出し、時系列リストを作成する。
【0044】
ここで、所定時間帯とは、書き込み情報が発信されてからの経過時間を、所定の時間長により区切った時間帯であって、例えば、所定の時間長を1時間とすると、書き込み情報が発信されてから1時間経過後までの時間帯、書き込み情報が発信されてから1時間経過後から2時間経過後までの時間帯というように時間帯が決まる。なお、書き込み情報が発信されてから何時間後まで再発信数からなる時系列リストを作成するかは、任意に設定することができる。
【0045】
図3は、本発明の実施形態に係る時系列リストの一例を示す図である。図3に示す時系列リストから、伝搬経路の1段階目においては、書き込み情報が最初に発信されてから1時間経過するまでがもっとも再発信される時間帯であることがわかる。このように、時系列リストにより、ソーシャル・メディアに発信された書き込み情報がもっとも影響力を持つ時間帯(発信されてからの経過時間帯)を把握することができる。また、伝搬経路の段階毎に、時間帯について平均を求めることにより、各段階における拡散時間を把握することもできる。
【0046】
反映度算出部150は、時系列リスト作成部140で作成した時系列リストに基づいて、所定時間帯における再発信状況を示す反映度を算出する。具体的には、反映度算出部150は、時系列リストに基づいて、各時間帯の再発信数の和をとることにより、全再発信数を算出する。次に、反映度算出部150は、反映度RTを以下の(2)式を用いて算出する。なお、反映度は、書き込み情報が伝搬される時間の分布率であって、所定時間帯における書き込み情報の再発信度合を示す。
【0047】
【数2】

【0048】
影響度算出部160は、反映度算出部150で算出された、情報取得部110で取得された書き込み情報に含まれる発信時間情報を含む所定時間帯の反映度と、再発信関係情報からわかる書き込み情報を再発信したユーザについて、拡散率算出部130で算出された拡散率、およびユーザ情報取得部120で取得されたリンク数と、に基づいて、各書き込み情報の影響度Iを算出する。これにより、書き込み情報が他のユーザに伝搬したことを加味して、影響度を算出することができる。
【0049】
ここで、影響度Iとは、書き込み情報がソーシャル・メディア10に及ぼす影響の度合いである。本実施形態においては、時系列リストから算出された反映度、書き込み情報の拡散率、およびユーザのリンク数から、書き込み情報の影響度を算出することにより、書き込み情報がどの程度拡散されたか、および書き込み情報がどの程度の時間で伝搬されたかを加味した影響度を算出することができる。
【0050】
伝搬経路解析部141で伝搬経路が解析された場合には、影響度算出部160は、伝搬経路解析部141で解析された伝搬経路に基づいて、反映度算出部150で算出された、情報取得部110で取得された書き込み情報に含まれる発信時間情報を含む所定時間帯の反映度、拡散率算出部130で算出された拡散率、ユーザ情報取得部120で取得されたリンク数から各書き込み情報の影響度Iを算出する。これにより、書き込み情報がユーザからユーザへと段階的に伝搬したことを加味して、影響度を算出することができる。また、各段階の影響度を算出することにより、ユーザ間の繋がりの深さを見ることができる。
【0051】
具体的には、まず、影響度算出部160は、伝搬経路のうち一経路のn段階における影響度Inを以下の(3)式を用いて算出する。(3)式に示すように、影響度In(nは2以上の場合)は、書き込み情報が発信された時間帯の反映度RTを重み付けした、ユーザのリンク数Fに、書き込み情報の拡散率Xをかけることにより算出される。
【0052】
【数3】

【0053】
次に、影響度算出部160は、上述した(3)を用いて算出された、伝播経路の各経路に対する書き込み情報の影響度を集計することにより、書き込み情報の影響度を算出する。
【0054】
<影響度算出処理>
図4は、本発明の実施形態に係る影響度算出処理のフローチャートである。
【0055】
まず、ステップS1において、情報取得部110は、ユーザ間の再発信関係を特定する再発信関係情報および発信時間情報を含む書き込み情報を、ソーシャル・メディア10から取得する。
【0056】
次に、ステップS2において、ユーザ情報取得部120は、ソーシャル・メディア10から、ソーシャル・メディア内の各ユーザについて、リンク数Fを取得する。
【0057】
次に、ステップS3において、拡散率算出部130は、ステップS1で取得した書き込み情報に含まれる再発信関係情報に基づいて、拡散率Xを算出する。
【0058】
次に、ステップS4において、時系列リスト作成部140は、ステップS1で取得された書き込み情報に含まれる再発信関係情報および発信時間情報に基づいて、所定時間帯毎の再発信数をリスト化した時系列リストを作成する。
【0059】
次に、ステップS5において、反映度算出部150は、ステップS4で作成した時系列リストに基づいて、所定時間帯毎の反映度RTを算出する。
【0060】
次に、ステップS6において、影響度算出部160は、ステップS5で算出された反映度のうち、ステップS1で取得された書き込み情報に含まれる発信時刻が含まれる時間帯の反映度RTと、ステップS1で取得した再発信関係情報からわかる書き込み情報を再発信したユーザについて、ステップS2で取得されたリンク数F、およびステップS3で算出された拡散率Xと、に基づいて、書き込み情報毎に影響度を算出する。
【0061】
次に、ステップS7において、影響度算出部160は、ステップS1で取得した全ての書き込み情報の影響度Iを算出したか否かを判断する。全ての書き込み情報の影響度Iを算出した(YES)場合には、処理を終了し、全ての書き込み情報の影響度Iを算出していない(NO)場合には、ステップS6へ処理を戻す。
【0062】
以上説明したように、本実施形態によれば、書き込み情報がどの程度拡散されたか、および書き込み情報がどの程度の時間で伝搬されたかを分析することにより、書き込み情報の影響度を算出することができる。また、時系列リストから、ソーシャル・メディアに発信された書き込み情報がもっとも影響力を持つ発信されてからの経過時間帯や書き込み情報の拡散時間を把握することができる。
【0063】
<影響度解析事例>
上述した影響度算出装置100により書き込み情報の影響力を算出した場合の一例を、図5を用いて説明する。なお、本事例において、図3に示した時系列リストを用いる。図5(a)には、ユーザHが発信した書き込み情報(情報ID=info001)について、伝搬経路解析部141で解析された伝搬経路を示す。なお、各ユーザの上部には、各ユーザが書き込み情報(情報ID=info001)を元の書き込み情報が発信されてから再掲するまでに経過した時間帯を示す。また、図5(b)には、図5(a)に示す伝搬経路に含まれる各ユーザの情報を示す。
【0064】
図5(a)に示すように、「ユーザH」が発信した書き込み情報(情報ID=info001)は、伝搬経路の第1段階では、「ユーザI」、「ユーザJ」、および「ユーザK」に、第2段階では、「ユーザL」、「ユーザM」、「ユーザN」、および「ユーザO」に、よって再発信されて、伝搬される。
【0065】
本実施形態に係る影響度算出装置100を用いて、図5における「ユーザH」が発信した書き込み情報(情報ID=info001)の影響度を算出する場合について説明する。
【0066】
まず、上述した(1)式に図5(b)に示す値を代入し、各ユーザの拡散率Xを算出する。拡散率Xの計算式および計算結果を以下の(4)式に示す。
【0067】
【数4】

【0068】
次に、図5(a)に示す各ユーザが書き込み情報を再発信した時間帯の反映度RTを、図3の示した時系列リストに示す値を上述した(2)式に代入して算出する。なお。n段階目のm時間帯の反映度をRTn−mと表記する
【数5】

【0069】
影響度は、上述した(4)式により算出した各ユーザの拡散率X、上述した(5)式により算出した反映度RT、および図5(b)に示すリンク数の値を、上述した(3)式に代入し、書き込み情報(情報ID=info001)の影響度Iを算出する。
【0070】
【数6】

【0071】
このようにして、「ユーザH」が発信した書き込み情報(情報ID=info001)の影響度Iを算出することができる。
【0072】
なお、影響度算出装置100の処理をコンピュータ読み取り可能な記録媒体に記録し、この記録媒体に記録されたプログラムを機器に読み込ませ、実行することによって本発明の影響度算出装置100を実現することができる。ここでいうコンピュータシステムとは、OSや周辺装置等のハードウェアを含む。
【0073】
また、「コンピュータシステム」は、WWW(World Wide Web)システムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。
【0074】
また、上記プログラムは、前述した機能の一部を実現するためのものであってもよい。更に、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であってもよい。
【0075】
以上、この発明の実施形態につき、図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
【0076】
(変形形態1)
上述した実施形態において、影響度算出装置100は、インフルエンサーを抽出する抽出部を備え、影響度算出部160で算出された影響度Iを用いて、インフルエンサーを抽出してもよい。具体的には、抽出部は、ユーザ毎に影響度算出部160で算出された各書き込み情報の影響度Iを集計することにより、各ユーザの影響力を算出する。そして、抽出部は、算出した影響力が高いユーザをインフルエンサーとして抽出する。なお、抽出部は、影響力が最も高いユーザをインフルエンサーとしてもよいし、影響力が所定の値以上のユーザをインフルエンサーとして抽出してもよい。このように、書き込み情報毎に算出した影響度を集計して、ユーザの影響力を算出することにより、精度良くインフルエンサーを抽出することができる。
【0077】
(変形形態2)
上述した実施形態において、ソーシャル・メディアから直接取得した、書き込み情報や、各ユーザのリンク数を用いているが、ソーシャル・メディアから取得した書き込み情報を記憶する書き込み情報記憶部や、各ユーザのリンク数を含むユーザ情報を記憶するユーザ情報記憶部を、影響度算出装置100に備え、書き込み情報記憶部およびユーザ情報記憶部に記憶されている情報を用いてもよい。また、書き込み情報記憶部およびユーザ情報記憶部から情報を取得する際に、所定の条件、例えばキーワードや期間により検索を行い、検索された情報を取得してもよい。
【0078】
なお、各実施形態および変形形態は、適宜組み合わせて用いることもできるが、詳細な説明は省略する。
【符号の説明】
【0079】
10 ソーシャル・メディア
100 影響度算出装置
110 情報取得部
120 ユーザ情報取得部
130 拡散率算出部
140 時系列リスト作成部
141 伝搬経路解析部
142 リスト作成部
150 反映度算出部
160 影響度算出部

【特許請求の範囲】
【請求項1】
ソーシャル・メディアに発信された書き込み情報の影響度を算出する影響度算出装置であって、
ソーシャル・メディアから、ユーザ間の再発信関係を特定する再発信関係情報および発信時間情報を含む書き込み情報を取得する情報取得手段と、
前記ソーシャル・メディア内の各ユーザにおける他のユーザとのリンク数を、前記ソーシャル・メディアから取得するユーザ情報取得手段と、
前記情報取得手段で取得された書き込み情報に含まれる再発信関係情報に基づいて、前記各ユーザが発信する書き込み情報が再発信される確率である拡散率を算出する拡散率算出手段と、
前記情報取得手段で取得された書き込み情報に含まれる再発信関係情報および発信時間情報に基づいて、所定時間帯毎の再発信数をリスト化した時系列リストを作成する時系列リスト作成手段と、
前記時系列リスト作成手段で作成した時系列リストに基づいて、所定時間帯における再発信状況を示す反映度を算出する反映度算出手段と、
前記情報取得手段で取得された書き込み情報に含まれる発信時間情報を含む所定時間帯について、前記反映度算出手段で算出された反映度、前記書き込み情報を発信したユーザについて、前記拡散率算出手段で算出された拡散率、および前記書き込み情報を発信したユーザおよび前記書き込み情報を再発信したユーザについて、前記ユーザ情報取得手段で取得されたリンク数に基づいて、各書き込み情報の影響度を算出する影響度算出手段と、
を備えることを特徴とする影響度算出装置。
【請求項2】
前記影響度算出手段で算出された各書き込み情報の影響度に基づいて、前記各ユーザの影響力を算出し、算出された影響力が高いユーザをインフルエンサーとして抽出する抽出手段を備えることを特徴とする請求項1に記載の影響度算出装置。
【請求項3】
前記反映度算出手段は、前記時系列リスト作成手段で作成した時系列リストに基づいて、前記所定時間帯毎の再発信数を、前記所定時間帯毎の再発信数の和で割ることによって、反映度を算出することを特徴とする請求項1または2に記載の影響度算出装置。
【請求項4】
前記拡散率算出手段は、前記各ユーザについて、前記情報取得手段で取得された書き込み情報に含まれる再発信関係情報に基づいて算出された書き込み情報の再発信数を、ユーザが発信した書き込み情報の全発信数で割ることによって、拡散率を算出することを特徴とする請求項1から3のいずれかに記載の影響度算出装置。
【請求項5】
前記時系列リスト作成手段は、
前記情報取得手段で取得された書き込み情報に含まれる再発信関係情報に基づいて、前記書き込み情報が伝搬する伝搬経路を解析し、伝搬経路情報を作成する伝搬経路解析手段と、
前記情報取得手段で取得された書き込み情報に含まれる発信時間情報、および前記伝搬経路解析手段で解析された伝搬経路に基づいて、所定時間帯毎に各伝搬段階の再発信数をリスト化した時系列リストを作成するリスト作成手段と、を備え、
前記反映度算出手段は、前記時系列リスト作成手段で作成した時系列リストに基づいて、所定時間帯における各伝搬段階の再発信状況を示す反映度を算出し、
前記影響度算出手段は、前記伝搬経路解析手段で解析された伝搬経路に基づいて、前記反映度算出手段で算出された、前記情報取得手段で取得された書き込み情報に含まれる発信時間情報を含む所定時間帯の反映度、前記拡散率算出手段で算出された拡散率、および前記ユーザ情報取得手段で取得されたリンク数から影響度を算出することを特徴とする請求項1から4のいずれかに記載の影響度算出装置。
【請求項6】
前記影響度算出手段は、前記伝搬経路のうち一経路のn段階における影響度をIn、前記一経路のn段階のユーザの拡散率をXn、前記一経路のn段階のユーザのリンク数をFn、前記一経路のn段階の反映度のうち、前記n段階のユーザが書き込み情報を発信した発信時刻を含む前記所定時間帯の反映度をRTnとしたとき、前記一経路のn段階における影響度Inは、数1の式を用いて求められることを特徴とする請求項5に記載の影響度算出装置。
【数1】

【請求項7】
前記拡散率算出手段は、所定期間にされた書き込み情報に含まれる再発信関係情報に基づいて、前記拡散率を算出することを特徴とする請求項1から6のいずれかに記載の影響度算出装置。
【請求項8】
前記情報取得手段は、前記ソーシャル・メディアにおいて再発信された書き込み情報のうち、所定の条件に合致する書き込み情報を取得することを特徴とする請求項1から7のいずれかに記載の影響度算出装置。
【請求項9】
ソーシャル・メディアに発信された書き込み情報の影響度を算出する影響度算出方法であって、
ソーシャル・メディアから、ユーザ間の再発信関係および発信時間情報を含む書き込み情報を取得する第1のステップと、
前記ソーシャル・メディア内の各ユーザにおける他のユーザとのリンク数を、前記ソーシャル・メディアから取得する第2のステップと、
前記第1のステップで取得された書き込み情報に含まれる再発信関係情報に基づいて、前記ソーシャル・メディア内の各ユーザが発信する書き込み情報が再発信される確率である拡散率を算出する第3のステップと、
前記第1のステップで取得された書き込み情報に含まれる再発信関係情報および発信時間情報に基づいて、所定時間帯毎の再発信数をリスト化した時系列リストを作成する第4のステップと、
前記第4のステップで作成した時系列リストに基づいて、所定時間帯における再発信状況を示す反映度を算出する第5のステップと、
前記第1のステップで取得された書き込み情報に含まれる発信時間情報を含む所定時間帯について、前記第5のステップで算出された反映度、前記書き込み情報を発信したユーザおよび前記書き込み情報を再発信したユーザについて、前記第2のステップで取得されたリンク数、および前記書き込み情報を発信したユーザについて、前記第3のステップで算出された拡散率に基づいて、各書き込み情報の影響度を算出する第6のステップと、
を含むことを特徴とする影響度算出方法。
【請求項10】
ソーシャル・メディアに発信された書き込み情報の影響度を算出する影響度算出方法をコンピュータに実行させるためのプログラムであって、
ソーシャル・メディアから、ユーザ間の再発信関係および発信時間情報を含む書き込み情報を取得する第1のステップと、
前記ソーシャル・メディア内の各ユーザにおける他のユーザとのリンク数を、前記ソーシャル・メディアから取得する第2のステップと、
前記第1のステップで取得された書き込み情報に含まれる再発信関係情報に基づいて、前記ソーシャル・メディア内の各ユーザが発信する書き込み情報が再発信される確率である拡散率を算出する第3のステップと、
前記第1のステップで取得された書き込み情報に含まれる再発信関係情報および発信時間情報に基づいて、所定時間帯毎の再発信数をリスト化した時系列リストを作成する第4のステップと、
前記第4のステップで作成した時系列リストに基づいて、所定時間帯における再発信状況を示す反映度を算出する第5のステップと、
前記第1のステップで取得された書き込み情報に含まれる発信時間情報を含む所定時間帯について、前記第5のステップで算出された反映度、前記書き込み情報を発信したユーザおよび前記書き込み情報を再発信したユーザについて、前記第2のステップで取得されたリンク数、および前記書き込み情報を発信したユーザについて、前記第3のステップで算出された拡散率に基づいて、各書き込み情報の影響度を算出する第6のステップと、
をコンピュータに実行させるためのプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate


【公開番号】特開2012−203499(P2012−203499A)
【公開日】平成24年10月22日(2012.10.22)
【国際特許分類】
【出願番号】特願2011−65450(P2011−65450)
【出願日】平成23年3月24日(2011.3.24)
【出願人】(000208891)KDDI株式会社 (2,700)
【Fターム(参考)】