説明

関係性作成装置及び方法

【課題】新たな観点からユーザ間の関係性を特定可能な関係性作成装置及び方法を提供すること。
【解決手段】関係性作成装置(1)は、ユーザ間でやり取りされるメッセージを管理するメッセージログデータベース(16)から所定のユーザを送信者とするメッセージを読み出すメッセージログ読出手段(11)と、読み出したメッセージから1又は複数の付属語を抽出し、夫々の付属語の使用頻度を、メッセージの受信者毎に集計する付属語集計手段(13)と、付属語の使用頻度とユーザ間の関係性とを対応付けて記憶する関係性データベース(17)を参照して、集計した受信者毎の付属語の使用頻度に基づいて、送信者と受信者との間の関係性を特定する関係性特定手段(14)と、を備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ソーシャルグラフを生成するためのユーザ間の関係性を特定する関係性作成装置及び方法に関する。
【背景技術】
【0002】
近年のネットワーク環境の発展に伴い、ネットワーク上には様々な情報が溢れかえっている。ネットワーク上に存在する膨大な情報量は、ユーザの多様化した趣味嗜好に対応することができる一方で、ユーザが所望する情報にアクセスすることを困難にしている。このような状況において、ネットワーク上でサービスを提供する事業者は、個人個人に適したサービスをユーザ毎に個別に提供するための様々な試みを行っている。
【0003】
一例としては、近年では、ユーザの傾向に併せた広告を表示する行動ターゲティング広告やショッピングサイトにおいて他のユーザが購入した商品を提案するリコメンドサービスといった試みが注目されている。
このような試みについて、特許文献1には、SNS(ソーシャル・ネットワーキング・サービス)において、グループ登録したユーザの一人が商品又はサービスを購入すると、当該グループにおける他のユーザに購入した商品又はサービスの情報を通知するネットワーク広告配信システムが開示されている。
【0004】
ところで、ユーザに対する個別の提案において、コンピュータによる機械的な提案は、専門バイヤーによる人的な提案に比べて精度が低く(一例によると人的な提案は、最大5倍程度の購買成果があると言われている)、更なる精度の向上が望まれている。
【0005】
この点、近年では、ユーザ間の関係性を示すソーシャルグラフを用いて、コンピュータによる機械的な提案の精度を向上させる試みもなされている。例えば、米国の映画SNSであるFlixster(http://www.flixster.com/)では、好きな映画に関するアンケートからユーザ間の同好関係を特定し、同好関係にある他のユーザの視聴した映画を提案するサービスを行っている。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2007−317177号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
このようなソーシャルグラフを用いて特定した関係性を利用した提案は、従来の機械的な提案に比べて精度の高い提案を実現することができるため、従来にはない新たな観点からユーザ間の関係性を特定する仕組みが求められている。
【0008】
本発明は、このような要求に鑑みてなされたものであり、新たな観点からユーザ間の関係性を特定可能な関係性作成装置及び方法を提供することを目的とする。
【課題を解決するための手段】
【0009】
(1) ユーザ間でやり取りされるメッセージに基づいて、当該ユーザ間の関係性を示すソーシャルグラフを生成する関係性作成装置であって、所定のメッセージログデータベースから、所定のユーザを送信者とするメッセージを読み出すメッセージログ読出手段と、読み出した前記メッセージから1又は複数の付属語を抽出し、夫々の付属語の使用頻度を、前記メッセージの受信者毎に集計する付属語集計手段と、前記メッセージに含まれる付属語の使用頻度と前記関係性とを対応付けて記憶する関係性判定データベースと、前記関係性データベースを参照して、集計した前記受信者毎の付属語の使用頻度に基づいて、前記送信者と前記受信者との関係性を特定する関係性特定手段と、を備える関係性作成装置。
【0010】
(1)の関係性作成装置によれば、関係性判定データベースに付属語の使用頻度とユーザ間の関係性とを対応付けて記憶しておき、ユーザ間でやり取りされるメッセージを形態素解析し抽出した付属語及びその使用頻度に基づいて、当該ユーザ間の関係性を特定する。ここで、「付属語」とは、単独では文節を構成しない助詞や助動詞に加え、「〜」「!」などの記号や絵文字、顔文字を含む。
これにより、ユーザ間でやり取りされているメッセージから、ユーザ間の人間関係の性質や距離感などの関係性を特定することができる。特に本発明によれば、メッセージのうちこれまで注目されていなかった付属語に着目してユーザ間の関係性を特定するため、従来にはない新たな観点からユーザ間の関係性を特定することができる。
【0011】
(2) 前記関係性判定データベースは、前記関係性毎に付属語のスコアを記憶し、前記関係性特定手段は、前記スコア及び前記使用頻度から前記関係性毎の関係性スコアを算出し、当該関係性スコアが所定の閾値以上の関係性を、前記送信者と前記受信者との関係性と特定する、(1)に記載の関係性作成装置。
【0012】
(2)の関係性作成装置によれば、算出した関係性スコアが所定の閾値以上である関係性を、ユーザ間の関係性と特定する。これにより、関係性スコアが所定の閾値以上である関係性が複数ある場合には、ユーザ間の関係性として複数の関係性を特定することができる。
【0013】
(3) 前記関係性特定手段は、前記関係性判定データベースが記憶する前記付属語のスコアを、前記メッセージログデータベース内の全メッセージにおける付属語の使用頻度に基づいて重み付けし補正した上で、前記関係性スコアを算出する、(2)記載の関係性作成装置。
【0014】
(3)の関係性作成装置によれば、付属語のスコアは、全メッセージにおける付属語の使用頻度に基づいて補正される。これにより、他のユーザがほとんど使用しない付属語を多く使用した場合、当該付属語を例えば強調するなどしてユーザ間の関係性を特定することができる。
【0015】
(4) 前記所定の閾値は、前記送信者及び前記受信者を同一とするメッセージに含まれる文字総数に基づいて決定される、(2)又は(3)に記載の関係性作成装置。
【0016】
(4)の関係性特定装置によれば、多くのメッセージのやり取りが行われるユーザ間では、所定の閾値を高くした状態で関係性を特定し、少ないメッセージのやり取りしか行われないユーザ間では、所定の閾値を低くした状態で関係性を特定することができる。これにより、ユーザ間のメッセージ数に関わらず、当該ユーザ間の関係性を特定することができる。
【0017】
(5) ユーザ間でやり取りされるメッセージに基づいて、当該ユーザ間の関係性を示すソーシャルグラフを生成する方法であって、コンピュータが実行する、所定のメッセージログデータベースから、所定のユーザを送信者とするメッセージを読み出すステップと、読み出した前記メッセージから1又は複数の付属語を抽出し、夫々の付属語の使用頻度を、前記メッセージの受信者毎に集計するステップと、前記メッセージに含まれる付属語の使用頻度と前記関係性とを対応付けて記憶する関係性判定データベースを参照して、集計した前記受信者毎の付属語の使用頻度に基づいて、前記送信者と前記受信者との関係性を特定するステップと、を含む方法。
【0018】
(5)の方法によれば、(1)の関係性作成装置と同様の効果を奏する。
【発明の効果】
【0019】
本発明によれば、新たな観点からユーザ間の関係性を特定可能な関係性作成装置及び方法を提供することができる。
【図面の簡単な説明】
【0020】
【図1】本発明の関係性作成装置を示す図である。
【図2】メッセージログデータベースを示す図である。
【図3】関係性判定データベースを示す図である。
【図4】関係性データベースを示す図である。
【図5】本発明の関係性作成装置の処理の流れを示すフローチャートである。
【図6】本発明の関係性作成装置の動作を示す図である。
【発明を実施するための形態】
【0021】
以下、本発明の実施形態について図面を参照して説明する。
【0022】
[関係性作成装置1の構成]
図1を参照して、本発明の関係性作成装置1の構成について説明する。
関係性作成装置1は、メッセージログ読出手段11と、形態素解析手段12と、付属語集計手段13と、関係性特定手段14と、ソーシャルグラフ生成手段15と、メッセージログデータベース16と、関係性判定データベース17と、関係性データベース18と、を含んで構成される。
【0023】
メッセージログ読出手段11は、メッセージログデータベース16からメッセージを読み出す。
ここで、メッセージログデータベース16は、ユーザ間でやり取りされたメッセージを管理するデータベースであり、図2に示すように、発信者と受信者とを特定したメッセージを記憶する。なお、メッセージログデータベース16に記憶するメッセージの種別は、特に規定するものではなく、任意の種別のメッセージを記憶することとしてよい。任意の種別のメッセージとしては、発信者と受信者とを特定可能であればよく、例えば、電子メール、チャット、ブログに対するコメント、ショートブログなどがあげられる。
メッセージログ読出手段11は、このような様々なメッセージを記憶するメッセージログデータベース16から、発信者及び受信者を特定したメッセージ、すなわち、発信者及び受信者を同一とする1又は複数のメッセージを読み出す。図2を参照して、メッセージログ読出手段11は、例えば、ユーザID「001」を発信者、ユーザID「002」を受信者とするメッセージ「いつもお世話になっております。・・・」及び「来週の○○の件ですが、・・・」をメッセージログデータベース16から読み出す。
【0024】
形態素解析手段12は、メッセージログ読出手段11が読み出したメッセージに対して形態素解析を行い、読み出したメッセージを形態素に分解する。このとき、形態素解析手段12は、複合語などを設定する所定の解析ルールに従い適宜形態素の結合を行った上で、形態素解析を行う。
【0025】
付属語集計手段13は、メッセージログ読出手段11が読み出したメッセージ、すなわち、形態素解析手段12が分解したメッセージの形態素から、1又は複数の付属語を抽出する。ここで、付属語とは、分解された形態素のうち、単独では文節を構成しない文字(又は文字列)に加え、「〜」「!」などの記号や絵文字、顔文字を含む。なお、単独では意味をなさない文字(文字列)とは、形態素のうちの例えば助詞や助動詞(解析ルールに従い適宜結合されたものも含む)、すなわち、名詞、動詞、形容詞、形容動詞以外の文字(文字列)をいう。
また、付属語集計手段13は、付属語を抽出すると、付属語の種別毎にその使用頻度(回数)を集計する。これにより、あるユーザ(発信者)がメッセージ中で使用した付属語の使用頻度が、受信者毎に集計される。
【0026】
関係性特定手段14は、関係性判定データベース17を参照して、付属語集計手段13が集計した付属語及びその使用頻度に基づいて、発信者と受信者との関係性(発信者から見た受信者の関係性)を特定する。
ここで、関係性判定データベース17は、メッセージに含まれる付属語及びその使用頻度からユーザ間の関係性を特定するための情報を記憶する。一例として、本実施形態の関係性判定データベース17は、図3に示すように、関係性毎に付属語スコア及び判定閾値を記憶する。
【0027】
付属語スコアは、付属語毎に規定され、対応する付属語が使用されると当該スコアが計数される。例えば、関係性ID「R001」では、付属語「ます」が1回使用される度にスコア「5」が計数され、付属語「だな」が1回使用される度にスコア「−5」が計数される。判定閾値は、対応する関係性に該当するか否かを判定するために用いられ、関係性特定手段14は、付属語スコアに基づいて算出された総スコア(関係性スコア)が関係性毎に規定された判定閾値を超える場合に、対応する関係性が成立すると判定する。
なお、ユーザ間でやり取りされるメッセージ中で使用される付属語の使用頻度は、メッセージに含まれる文字総数と比例する。すなわち、活発なやり取りが行われるユーザ間では、メッセージ中で使用される付属語の使用頻度が高くなる一方で、あまりやり取りを行わないユーザ間では、付属語の使用頻度が低くなる。そこで、本実施形態では、判定閾値を送信者及び前記受信者を同一とするメッセージに含まれる文字総数や形態素総数に基づいて決定することとしてもよい。
【0028】
図1に戻り、関係性特定手段14は、関係性判定データベース17に記憶された関係性毎に、集計した付属語の使用頻度及び付属語スコアに基づいて関係性スコアを算出し、算出した関係性スコアが判定閾値を超えるか否かを判定することで、ユーザ間の関係性を特定する。
なお、関係性特定手段14は、全メッセージ中の付属語の使用頻度に基づいて、付属語スコアを重み付けし補正することとしてもよい。すなわち、ほとんど使用されることのない付属語については、関係性判定データベース17に記憶された付属語スコアを補正することとしてもよい。使用頻度に基づく付属語スコアの補正は、TF・IDFを用いて行うことができ、TF(Term Frequency)として、所定の付属語が発信者及び受信者を同一とするメッセージ中で使用された回数を用い、IDF(Inverse Document Frequency)として、当該付属語がメッセージログデータベース16に含まれる全メッセージ中で使用された回数を用いることができる。このとき、関係性特定手段14は、全メッセージ中での使用頻度の低い付属語について、関係性の特定に影響を与える方向に重み付けを行うこととしてもよく、影響を与えない方向に重み付けを行うこととしてもよい。
【0029】
また、関係性特定手段14は、特定した関係性を関係性データベース18に記憶する。
その結果、関係性データベース18には、図4に示すように、メッセージの発信者から見た発信者と受信者との間の関係性が記憶される。このとき、本実施形態では、発信者と受信者との間の関係性について2以上の関係性が記憶されることを妨げるものではない。
【0030】
図1に戻り、ソーシャルグラフ生成手段15は、関係性データベース18に記憶されたユーザ間の関係性に基づいて、ソーシャルグラフを生成する。なお、ソーシャルグラフは、一例として、後述する図6(3)に示すノード(ユーザ)とエッジ(関係)とに基づいてユーザ間の関係性を表すグラフを用いることができる。
【0031】
[関係性作成装置1のハードウェア構成]
以上説明した関係性作成装置1のハードウェアは、1又は複数の一般的なコンピュータによって構成することができる。一般的なコンピュータは、例えば、制御部として、中央処理装置(CPU)を備える他、記憶部として、メモリ(RAM、ROM)、ハードディスク(HDD)及び光ディスク(CD、DVDなど)を、ネットワーク通信装置として、各種有線及び無線LAN装置を、表示装置として、例えば、液晶ディスプレイ、プラズマディスプレイなどの各種ディスプレイを、入力装置として、例えば、キーボード及びポインティング・デバイス(マウス、トラッキングボールなど)を適宜備え、これらは、バスラインにより接続されている。このような一般的なコンピュータにおいて、CPUは、関係性作成装置1を統括的に制御し、各種プログラムを適宜読み出して実行することにより、上述したハードウェアと協働し、本発明に係る各種機能を実現している。
【0032】
[関係性作成装置1の動作]
続いて、図5及び図6を参照して、本発明の関係性作成装置1の動作について説明する。図5は、関係性作成装置1の処理の流れを示すフローチャートであり、図6は、関係性作成装置1の動作を示す図である。
【0033】
S1:図5を参照して、関係性作成装置1は、関係性スコアを算出するユーザ(発信者)を決定する。
S2:続いて、メッセージログ読出手段11は、S1で決定したユーザを発信者とするメッセージをメッセージログデータベース16から読み出す。このとき、メッセージログ読出手段11は、発信者と受信者との間の関係性を特定するため、受信者毎にメッセージを読み出す。
S3:続いて、形態素解析手段12は、S2で読み出したメッセージを所定の解析ルールに従い形態素解析し、メッセージに含まれる文字列を形態素に分解する。
S4:続いて、付属語集計手段13は、S3で分解した形態素から付属語を抽出し、抽出した付属語毎にその使用頻度を集計する。
【0034】
その結果、図6(1)に示すように、発信者及び受信者を特定したユーザ間でやり取りされたメッセージに含まれる付属語及びその使用頻度が集計される。図6(1)では、ユーザID「001」を発信者、ユーザID「002」を受信者とするメッセージのやり取りでは、付属語「お」が12回使用され、付属語「おり」が8回使用され、付属語「ます」が10回使用されたことが集計されている。
【0035】
S5:図5に戻り、続いて、関係性特定手段14は、関係性判定データベース17に記憶された付属語スコア及びS4で集計した付属語毎の使用頻度に基づいて、所定の関係性毎に発信者と受信者との間の関係性スコアを算出する。
S6:このとき、関係性特定手段14は、算出した関係性スコアが関係性判定データベース17に記憶された判定閾値を超えるか否かを判定し、関係性スコアが判定閾値を超える関係性を、発信者と受信者との間の関係性として特定する。また、関係性特定手段14は、特定した関係性を関係性データベース18に記憶する。
【0036】
S7:続いて、関係性作成装置1は、S1で決定したユーザ(発信者)がS2で読み出したユーザ(受信者)以外のユーザに発信したメッセージがあるか否かを判定する。このとき、当該メッセージがある場合には、関係性作成装置1は、S2〜S6の処理を繰り返し、S1で決定したユーザと他のユーザとの間の関係性を特定する。
【0037】
その結果、図6(2)に示すように、S1で決定した発信者と当該発信者からメッセージを受信した複数の受信者との間の関係性が特定される。図6(2)では、ユーザID「001」とユーザID「002」との間の関係性として、関係性「社会人・丁寧」が特定され、ユーザID「001」とユーザID「024」との間の関係性として関係性「友人・先輩」が特定されている。
【0038】
ここで、メッセージのやり取りが多いユーザ間では、やり取りの少ないユーザ間に比べて、メッセージに含まれる付属語の使用頻度が高くなり、結果として、関係性スコアも高くなる。そこで、本実施形態では、S6の処理において関係性を特定するための判定閾値を、メッセージに含まれる文字総数(又は形態素数)に基づいて決定することとしている。その結果、図6(2)では、文字総数の多いユーザID「001」とユーザID「002」との間では、関係性スコアが「62」であるにも関わらず関係性「社会人・親密」が成立していないのに対して、文字総数の少ないユーザID「001」とユーザID「024」との間では、関係性スコアが「38」であるにも関わらず関係性「友人・先輩」が成立している。
【0039】
S8:図5に戻り、S7において他のユーザに発信したメッセージがない場合には、S1で決定したユーザ以外のユーザを発信者とするメッセージがあるか否かを判定する。このとき、当該メッセージがある場合には、関係性作成装置1は、S1〜S7の処理を繰り返し、他のユーザを発信者とするユーザ間の関係性を特定する。
【0040】
S9:その後、所定のタイミングでソーシャルグラフ生成手段15は、関係性データベース18に記憶された関係性に基づいて、所定のソーシャルグラフを生成し、処理を終了する。
【0041】
その結果、図6(3)に示すようにユーザをノード、関係性をエッジで示すソーシャルグラフを生成することができる。このとき、ユーザ間の関係性は、メッセージの送信者から見た関係性が特定される。ここで、ユーザ間のメッセージのやり取りは、双方のユーザが送信者及び受信者となることで実現される。そのため、メッセージに基づいて関係性を特定した場合には、互いのユーザから見た関係性を特定することができ、きめ細かな関係性を特定することができる。また、本発明の関係性作成装置1では、メッセージのうちこれまで注目されていなかった付属語に着目してユーザ間の関係性を特定するため、従来にはない新たな観点からユーザ間の関係性を特定することができる。
【0042】
以上、本発明の実施形態について説明したが、本発明は上述した実施形態に限るものではない。また、本発明の実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本発明の実施例に記載されたものに限定されるものではない。
【符号の説明】
【0043】
1 関係性作成装置
11 メッセージログ読出手段
12 形態素解析手段
13 付属語集計手段
14 関係性特定手段
15 ソーシャルグラフ生成手段
16 メッセージログデータベース
17 関係性判定データベース
18 関係性データベース

【特許請求の範囲】
【請求項1】
ユーザ間でやり取りされるメッセージに基づいて、当該ユーザ間の関係性を示すソーシャルグラフを生成する関係性作成装置であって、
所定のメッセージログデータベースから、所定のユーザを送信者とするメッセージを読み出すメッセージログ読出手段と、
読み出した前記メッセージから1又は複数の付属語を抽出し、夫々の付属語の使用頻度を、前記メッセージの受信者毎に集計する付属語集計手段と、
前記メッセージに含まれる付属語の使用頻度と前記関係性とを対応付けて記憶する関係性判定データベースと、
前記関係性判定データベースを参照して、集計した前記受信者毎の付属語の使用頻度に基づいて、前記送信者と前記受信者との関係性を特定する関係性特定手段と、
を備える関係性作成装置。
【請求項2】
前記関係性判定データベースは、前記関係性毎に付属語のスコアを記憶し、
前記関係性特定手段は、前記スコア及び前記使用頻度から前記関係性毎の関係性スコアを算出し、当該関係性スコアが所定の閾値以上の関係性を、前記送信者と前記受信者との関係性と特定する、
請求項1に記載の関係性作成装置。
【請求項3】
前記関係性特定手段は、前記関係性判定データベースが記憶する前記付属語のスコアを、前記メッセージログデータベース内の全メッセージにおける付属語の使用頻度に基づいて重み付けし補正した上で、前記関係性スコアを算出する、
請求項2に記載の関係性作成装置。
【請求項4】
前記所定の閾値は、前記送信者及び前記受信者を同一とするメッセージに含まれる文字総数に基づいて決定される、
請求項2又は3に記載の関係性作成装置。
【請求項5】
ユーザ間でやり取りされるメッセージに基づいて、当該ユーザ間の関係性を示すソーシャルグラフを生成する方法であって、
コンピュータが実行する、
所定のメッセージログデータベースから、所定のユーザを送信者とするメッセージを読み出すステップと、
読み出した前記メッセージから1又は複数の付属語を抽出し、夫々の付属語の使用頻度を、前記メッセージの受信者毎に集計するステップと、
前記メッセージに含まれる付属語の使用頻度と前記関係性とを対応付けて記憶する関係性判定データベースを参照して、集計した前記受信者毎の付属語の使用頻度に基づいて、前記送信者と前記受信者との関係性を特定するステップと、
を含む方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2013−8335(P2013−8335A)
【公開日】平成25年1月10日(2013.1.10)
【国際特許分類】
【出願番号】特願2011−142305(P2011−142305)
【出願日】平成23年6月27日(2011.6.27)
【出願人】(500257300)ヤフー株式会社 (1,128)
【Fターム(参考)】