説明

情報処理装置、情報処理方法、及びプログラム

【課題】検索頻度が急上昇したクエリを抽出するとともに、何故、検索頻度が急上昇したか、その理由をあわせて抽出し、提供できる情報処理装置。
【解決手段】バースト理由抽出装置100は、検索頻度が急上昇した検索クエリである過去バーストクエリの検索頻度が上昇した理由を示すイベント情報と、過去バーストクエリと共に入力されたクエリである第1共起クエリの組み合わせとを対応させて記憶するイベント情報DB1033と、検索ログから新たに検索頻度が上昇した検索クエリであるバーストクエリと、バーストクエリと共に入力された第2共起クエリの組み合わせとを抽出する共起クエリ抽出部107と、抽出された第2共起クエリの組み合わせと類似する第1共起クエリの組み合わせをイベント情報DB1033から判定する類似クエリ判定部109と、判定された第1共起クエリの組み合わせに対応するイベント情報をイベント情報DB1033から抽出するイベント情報抽出部113とを備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、検索頻度が所定の割合以上で上昇した検索クエリであるバーストクエリを抽出する情報処理装置、情報処理方法、及びプログラムに関する。
【背景技術】
【0002】
従来、ユーザから入力されたクエリを取得し、クエリを集計して出力する情報処理装置が知られている。
このような情報処理装置では、入力されたクエリに基づいて検索を行うだけでなく、他のユーザが入力するクエリを参考にするユーザのために、注目のクエリを出力することがしばしば要求されている。
そこで、このような注目のクエリを出力するために、例えば、一定期間において検索頻度が急上昇したクエリ、いわゆるバーストクエリ(以下、バーストクエリと示す)を取得し、バーストクエリの検索頻度順に出力する情報処理装置が知られている(例えば、特許文献1)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2004−206517
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかし、上記した従来の情報処理装置には、次のような問題があった。すなわち、情報処理装置では、バーストクエリを抽出できるものの、何故、当該バーストクエリの検索頻度が急上昇したのかを抽出できないという問題がある。
【0005】
そこで、本発明は、このような状況に鑑みてなされたものであり、検索頻度が急上昇したクエリを抽出するとともに、何故、検索頻度が急上昇したか、その理由をあわせて抽出できる情報処理装置、情報処理方法、及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
上述した問題を解決するため、本発明は、次のような特徴を有している。まず、本発明の第1の特徴は、検索頻度が所定の割合以上で上昇した検索クエリであるバーストクエリを抽出する情報処理装置であって、一定期間において検索頻度が所定の割合以上で上昇した検索クエリである過去バーストクエリの検索頻度が所定の割合以上で上昇した理由を示すイベント情報と、該過去バーストクエリと共に入力されたクエリである第1共起クエリの組み合わせとを対応させて記憶するイベント情報記憶手段と、ユーザ端末より送信された検索クエリの履歴である検索ログから、新たに検索頻度が所定の割合以上で上昇した検索クエリであるバーストクエリと、前記バーストクエリと共に入力された第2共起クエリの組み合わせとを抽出する共起クエリ抽出手段と、前記共起クエリ抽出手段により抽出された前記第2共起クエリの組み合わせと類似する前記第1共起クエリの組み合わせを前記イベント情報記憶手段から判定する類似クエリ判定手段と、前記類似クエリ判定手段により判定された前記第1共起クエリの組み合わせに対応する前記イベント情報を前記イベント情報記憶手段から抽出するイベント情報抽出手段と、を備えることを要旨とする。
【0007】
このような情報処理装置は、イベント情報記憶手段と、共起クエリ抽出手段と、類似クエリ判定手段と、イベント情報抽出手段とを備える。イベント情報記憶手段は、一定期間において検索頻度が所定の割合以上で上昇した検索クエリである過去バーストクエリの検索頻度が所定の割合以上で上昇した理由を示すイベント情報と、該過去バーストクエリと共に入力されたクエリである第1共起クエリの組み合わせとを対応させて記憶する。また、共起クエリ抽出手段は、ユーザ端末より送信された検索クエリの履歴である検索ログから、新たに検索頻度が所定の割合以上で上昇した検索クエリであるバーストクエリと、バーストクエリと共に入力された第2共起クエリの組み合わせとを抽出する。類似クエリ判定手段は、第2共起クエリの組み合わせに基づいて、バーストクエリと共に入力された第2共起クエリの組み合わせと類似する第1共起クエリの組み合わせを抽出する。イベント情報抽出手段は、類似クエリ判定手段により抽出された第1共起クエリの組み合わせに対応するイベント情報をイベント情報記憶手段から抽出する。
【0008】
このため、類似クエリ判定手段が、第2共起クエリの組み合わせと類似する第1共起クエリの組み合わせを抽出することにより、情報処理装置は、バーストクエリと同様の理由で検索頻度が急上昇したと思われる過去バーストクエリを抽出可能にする。また、イベント情報抽出手段が、第1共起クエリの組み合わせに基づいて、イベント情報を抽出することにより、情報処理装置は、バーストクエリと同様の理由で検索頻度が急上昇したと思われる過去バーストクエリのイベント情報を抽出する。
すなわち、情報処理装置は、検索頻度が所定の割合以上で上昇した理由を示すイベント情報をバーストクエリの検索頻度が急上昇した理由として抽出可能にする。
【0009】
従って、情報処理装置は、一定期間において検索頻度が所定の割合以上で上昇した検索クエリであるバーストクエリを抽出するとともに、何故、検索頻度が急上昇したか、その理由をイベント情報として、バーストクエリとともに、あわせて抽出し、提供できる。
【0010】
本発明の第2の特徴は、本発明の第1の特徴に係り、検索ログから、所定の検索クエリの検索頻度を算出し、前記検索クエリを前記バーストクエリとして判定するバーストクエリ判定手段を更に備えることを要旨とする。
【0011】
本発明の第3の特徴は、本発明の第2の特徴に係り、前記過去バーストクエリの属性を示す属性情報と、該過去バーストクエリに対応する前記第1共起クエリの組み合わせとを対応させて記憶する属性情報記憶手段を更に備え、前記イベント情報抽出手段は、前記類似クエリ判定手段の判定結果に基づいて、前記バーストクエリと類似する前記過去バーストクエリに対応する前記属性情報を前記属性情報記憶手段から抽出することを要旨とする。
【0012】
本発明の第4の特徴は、本発明の第1乃至3の特徴に係り、前記イベント情報抽出手段により抽出された前記イベント情報を前記バーストクエリに関連する関連検索ワードとして出力する出力手段を更に備えることを要旨とする。
【0013】
本発明の第5の特徴は、コンピュータが、検索頻度が所定の割合以上で上昇した検索クエリであるバーストクエリを抽出する情報処理方法であって、一定期間において検索頻度が所定の割合以上で上昇した検索クエリである過去バーストクエリの検索頻度が所定の割合以上で上昇した理由を示すイベント情報と、該過去バーストクエリと共に入力されたクエリである第1共起クエリの組み合わせとを対応させて記憶するイベント情報記憶手段をコンピュータが備え、ユーザ端末より送信された検索クエリの履歴である検索ログから、新たに検索頻度が所定の割合以上で上昇した検索クエリであるバーストクエリと、前記バーストクエリと共に入力された第2共起クエリの組み合わせとを抽出するステップと、前記抽出された抽出された前記第2共起クエリの組み合わせと類似する前記第1共起クエリの組み合わせを前記イベント情報記憶手段から判定するステップと、前記判定された前記第1共起クエリの組み合わせに対応する前記イベント情報を前記イベント情報記憶手段から抽出するステップと、を備えることを要旨とする。
【0014】
本発明の第6の特徴は、本発明の第5の特徴に記載の情報処理方法をコンピュータに実行させることを特徴とするプログラムであることを要旨とする。
【発明の効果】
【0015】
本発明によれば、検索頻度が所定の割合以上で上昇したクエリを抽出するとともに、何故、検索頻度が急上昇したか、その理由をあわせて抽出する情報処理装置、情報処理方法、及びプログラムを提供できる。
【図面の簡単な説明】
【0016】
【図1】本発明の実施形態に係る情報処理システム1の全体概略構成図である。
【図2】本発明の実施形態に係る本実施形態に係るバースト理由抽出装置100の機能ブロック図である。
【図3】本発明の実施形態に係るバースト理由抽出装置100のクエリDB1031に記憶される情報の一例を示す図である。
【図4】本発明の実施形態に係るバースト理由抽出装置100のイベント情報DB1033に記憶される情報の一例を示す図である。
【図5】本発明の実施形態に係るバースト理由抽出装置100の属性情報DB1035に記憶される情報の一例を示す図である。
【図6】本発明の実施形態に係るバースト理由抽出装置100のバーストクエリ判定部105において、所定の検索クエリの検索頻度を算出する処理を説明するための概念図である。
【図7】本発明の実施形態に係るバースト理由抽出装置100の共起クエリ抽出部107において検索ログから、新たに検索頻度が急上昇した検索クエリであるバーストクエリと、バーストクエリと共に入力された第2共起クエリの組み合わせとを抽出する処理を説明するための概念図を示す図である。
【図8】本発明の実施形態に係るバースト理由抽出装置100の出力部117によって出力される検索クエリの候補1171を含む検索ページの一部模式図である。
【図9】本発明の実施形態に係るバースト理由抽出装置100の出力部117によって出力される検索クエリの候補1173を含む検索ページの模式図である。
【図10】本発明の第実施形態に係る情報処理システム1の全体概略動作を示すシーケンス図である。
【図11】本発明の第実施形態に係るバースト理由抽出装置100によるバースト理由の抽出動作を示すフローチャートである。
【図12】本発明のその他の実施形態に係るバースト理由抽出装置100のバーストクエリ判定部105において、所定の検索クエリの検索頻度を算出する処理を説明するための概念図である。
【発明を実施するための形態】
【0017】
次に、図面を参照して、本発明の実施形態を説明する。
【0018】
なお、以下の図面の記載において、同一または類似の部分には、同一または類似の符号を付している。また、図面は模式的なものであり、各寸法の比率などは現実のものとは異なる。
【0019】
したがって、具体的な寸法などは以下の説明を参酌して判断すればよく、図面相互間においても互いの寸法の関係や比率が異なる部分が含まれている。
【0020】
以下の実施形態においては、(1)情報処理システム1の全体構成、(2)バースト理由抽出装置100の詳細構成、(3)情報処理システム1の動作、(4)作用・効果、(5)その他の実施形態について説明する。
【0021】
(1)情報処理システム1の全体構成
図1は、本実施形態に係る情報処理システム1の全体概略構成図である。
【0022】
図1に示す情報処理システム1は、ユーザ端末10、ユーザ端末20、バースト理由抽出装置100、情報検索装置200、検索ログDB250を含む。情報処理システム1では、ユーザ端末10、ユーザ端末20、バースト理由抽出装置100、情報検索装置200、検索ログDB250が、通信ネットワーク50(インターネットなど)を介して接続されている。
【0023】
情報処理システム1では、ユーザ端末10、ユーザ端末20により入力された検索クエリが、バースト理由抽出装置100、情報検索装置200、検索ログDB250に送信される。バースト理由抽出装置100は、情報処理装置を構成し、一定期間の検索頻度が所定の割合以上で上昇した検索クエリであるバーストクエリを抽出する。また、バースト理由抽出装置100は、所定のバーストクエリについて、検索頻度が所定の割合以上で上昇した理由を示すバースト理由を抽出する。バースト理由抽出装置100は、ユーザ端末からの要求等に応じて、バースト理由等をユーザ端末10、ユーザ端末20に送信する。
【0024】
なお、所定の割合以上とは、例えば、前日の検索頻度の3倍、1時間前の検索頻度の10倍など比べる期間や割合など、バースト理由抽出装置100、又は情報検索装置200の少なくともいずれかの管理者により、任意に設定されてよい。すなわち、所定の割合以上とは、いわゆる急上昇を特徴づけるための適切なものであればよい。なお、以下の本実施形態において、急上昇とは、所定の割合以上で上昇したことを示す。また、これらの処理は、連動して実行される必要は無く、適宜所定のタイミングで実行されればよい。
【0025】
本実施形態では、バースト理由抽出装置100において、「ぱんみ」というタレントが、結婚したことにより、「ぱんみ」という検索クエリがバーストクエリであると判定され、バースト理由として「結婚」がユーザ端末10、ユーザ端末20に送信される処理を以下に示す。
【0026】
情報検索装置200では、検索クエリに基づいた検索が実行され、検索結果ページが、ユーザ端末10、ユーザ端末20に送信される。検索ログDB250は、ユーザ端末10、ユーザ端末20より送信された検索クエリの履歴である検索ログを記憶する。具体的には、検索ログDB250は、ユーザ端末10、ユーザ端末20より送信された検索クエリ、送信された際の日時、送信した端末情報、送信したユーザ情報等を検索ログとして、対応させて記憶する。
【0027】
バースト理由抽出装置100、情報検索装置200、検索ログDB250は、CPU等の制御装置、メモリやHDD等の記憶装置、通信ネットワーク50と通信する通信I/F等の通信装置といったハードウェア資源を有するコンピュータ(単一或いは複数)により構成される。バースト理由抽出装置100が備える下記の各ブロックは、前述したコンピュータの制御装置等のハードウェア資源を用いてコンピュータプログラムを実行することによって実現されるものである。なお、これらの各ブロック、手段は、単一のコンピュータ上に配置される必要はなく、必要に応じて分散される構成を採用しても良い。
【0028】
ユーザ端末10は、携帯通信端末装置(携帯電話機やスマートフォン)、カーナビゲーションシステム等である。ユーザ端末20は、ユーザが使用するPC(Personal Computer)である。ユーザ端末10及びユーザ端末20は、無線LANや、近傍無線通信(Bluetooth(登録商標)や赤外線通信等)或いは有線通信(USB(Universal Serial Bus)ケーブル接続等)によって、通信ネットワーク50を介してバースト理由抽出装置100、情報検索装置200及び、検索ログDB250に接続されている。ユーザ端末10及びユーザ端末20は、バースト理由抽出装置100及び情報検索装置200等が有するハードウェア資源に加えて、キーボタンやタッチパネル等の入力装置、液晶ディスプレイ等の出力装置、一般的なブラウザを備える。ブラウザは、インターネットの標準プロトコルであるHTTP(Hyper Text Transfer Protocol)等に従い、HTML(Hyper Text Markup Language)等の言語で記述されたページデータの要求、取得及び表示、フォームデータの送信等を行う機能を有している。
【0029】
なお、ユーザ端末10及びユーザ端末20は、同一の機能を有しており、以下の記載においては、ユーザ端末20に関する記載は、適宜省略し、主にユーザ端末10との関連について、記載する。従って、ユーザ端末10と同様にユーザ端末20も同一の動作をするものとする。
【0030】
(2)バースト理由抽出装置100の詳細構成
図2は、本実施形態に係るバースト理由抽出装置100の機能ブロック図である。
バースト理由抽出装置100、取得部101と、急上昇ワード記憶部103と、バーストクエリ判定部105と、共起クエリ抽出部107と、類似クエリ判定部109と、説明文取得部111と、イベント情報抽出部113と、説明文作成部115と、出力部117とを備える。
【0031】
(2.1)取得部101
取得部101は、通信ネットワーク50と接続され、ユーザ端末10、ユーザ端末20、情報検索装置200及び、検索ログDB250との通信を行い、情報を取得する。具体的には、取得部101は、ユーザ端末10から検索クエリを取得する。また、取得部101は、検索ログDB250から検索ログを取得する。
【0032】
(2.2)急上昇ワード記憶部103
急上昇ワード記憶部103は、クエリDB1031、イベント情報DB1033、属性情報DB1035を含む。
【0033】
図3は、バースト理由抽出装置100のクエリDB1031に記憶される情報の一例を示す図である。図4は、バースト理由抽出装置100のイベント情報DB1033に記憶される情報の一例を示す図である。図5は、バースト理由抽出装置100の属性情報DB1035に記憶される情報の一例を示す図である。
【0034】
図3に示すように、クエリDB1031は、一定期間において検索頻度が急上昇した検索クエリである過去バーストクエリと、過去バーストクエリと共に入力されたクエリである第1共起クエリと、検索回数、相対比を対応させて記憶する。また、クエリDB1031は、過去バーストクエリの説明文と、バーストクエリに対応する第1共起クエリの組み合わせとを対応させて記憶する。例えば、クエリDB1031は、過去バーストクエリとして、「矢風」というタレント名を記憶している。また、クエリDB1031は、「矢風」という過去バーストクエリと共に入力された第1共起クエリとして、「婚約」、「結婚」、「挙式」を記憶している。すなわち、クエリDB1031は、「矢風 婚約」、「矢風 結婚」、「矢風 挙式」が一定期間において検索頻度が急上昇した検索クエリであることを示している。
【0035】
検索回数とは、過去バーストクエリと第1共起クエリとが所定期間においてユーザ端末10、ユーザ端末20等から入力された回数を示す。
【0036】
相対比とは、各第1共起クエリについて、全体の検索回数に対する比率を示す。すなわち、各第1共起クエリの相対比を合計すると、相対比は、100%となる。
【0037】
説明文とは、過去バーストクエリを説明するための文章である。説明文は、過去バーストクエリの属性を示す属性情報と、過去バーストクエリの検索頻度が上昇した理由を示すイベント情報とを少なくとも含む。
【0038】
図4に示すように、イベント情報DB1033は、過去バーストクエリの検索頻度が上昇した理由を示すイベント情報と、該過去バーストクエリに対応する第1共起クエリの組み合わせとを対応させて記憶する。また、イベント情報DB1033は、過去バーストクエリの全体の検索回数に対する各第1共起クエリの相対比を、各第1共起クエリに対応させて記憶する。例えば、イベント情報DB1033は、「結婚」というイベント情報と、「結婚」、「画像」、「婚約」、「入籍」、「挙式」等という第1共起クエリの組み合わせとを対応させて記憶する。すなわち、イベント情報DB1033は、過去バーストクエリに関して、「結婚」というイベントが発生した際に「結婚」、「画像」、「婚約」、「入籍」、「挙式」等という第1共起クエリが過去バーストクエリと共に入力されたことを示す。なお、上記のイベント情報は、第1共起クエリに含まれる単語である必要は無く、各第1共起クエリの特徴や、概念に対応する用語を任意に設定してもよい。
【0039】
図5に示すように、属性情報DB1035は、過去バーストクエリと、過去バーストクエリの属性を示す属性情報と、該過去バーストクエリに対応する第1共起クエリの組み合わせとを対応させて記憶する。属性情報DB1035は、属性情報として、「タレント」、「会社」、「建物」を記憶しているが、他の属性情報として、例えば、「女優」、「選手」、「俳優」、「モデル」、「アナウンサ」等の職業や、「サイト」、「映画」、「レストラン」等を記憶することができる。
【0040】
(2.3)バーストクエリ判定部105
図6は、バーストクエリ判定部105において、検索ログから、所定の検索クエリの検索頻度を算出する処理を説明するための概念図である。
【0041】
図6に示すように、バーストクエリ判定部105は、検索ログから、所定の検索クエリの検索頻度を算出し、検索クエリをバーストクエリとして判定する。具体的には、バーストクエリ判定部105は、検索ログから、所定の「単語」を含む検索クエリを抽出し、検索クエリの所定期間あたりの検索回数を算出する。次に、バーストクエリ判定部105は、検索クエリの所定期間あたりの検索回数が、1つ前の所定期間あたりの検索回数又は検索回数の偏差値等が、所定の値を超えた場合など、公知の手法で検索クエリをバーストクエリとして判定する。
【0042】
例えば、バーストクエリ判定部105は、偏差値が65を越えた場合を基準とした場合、検索ログから、「ぱんみ」を含む検索クエリを抽出し、検索クエリの一日あたりの検索回数を継続的に測定する。次に、バーストクエリ判定部105は、11月3日の検索クエリの検索回数が、10,000を超え、標準偏差値が65を越えたため、「ぱんみ」をバーストクエリとして判定する。
【0043】
(2.4)共起クエリ抽出部107
図7は、共起クエリ抽出部107において検索ログから、新たに検索頻度が急上昇した検索クエリであるバーストクエリと、バーストクエリと共に入力された第2共起クエリの組み合わせとを抽出する処理を説明するための概念図を示す図である。
図7に示すように、共起クエリ抽出部107は、バーストクエリ判定部105により判定されたバーストクエリと、バーストクエリと共に入力された第2共起クエリの組み合わせとを抽出し、各検索クエリの所定期間あたりの検索回数、相対比を算出する。
【0044】
例えば、共起クエリ抽出部107は、バーストクエリ判定部105により判定されたバーストクエリである「ぱんみ」と、「ぱんみ」と共に入力された第2共起クエリの組み合わせである「婚約」、「挙式」、「結婚」とを抽出し、検索回数、相対比を算出する。
【0045】
(2.5)類似クエリ判定部109
類似クエリ判定部109は、共起クエリ抽出部107により抽出された第2共起クエリの組み合わせと類似する第1共起クエリの組み合わせをクエリDB1031又はイベント情報DB1033から判定する。具体的には、類似クエリ判定部109は、共起クエリ抽出部107により抽出された各第2共起クエリの組み合わせに基づいて、マッチングする第1共起クエリの組み合わせをクエリDB1031又はイベント情報DB1033から判定する。
【0046】
具体的には、クエリDB1031から抽出して判定する場合、類似クエリ判定部109は、共起クエリ抽出部107により抽出された第2共起クエリの組み合わせと、クエリDB1031に記憶される第1共起クエリの組み合わせとに基づいて、バーストクエリに関連する、すなわち、同様の理由で検索頻度が急上昇したと思われる過去バーストクエリを判定する。例えば、類似クエリ判定部109は、共起クエリ抽出部107により抽出された第2共起クエリの組み合わせである「婚約」、「挙式」、「結婚」に基づいて、クエリDB1031に記憶される第1共起クエリの組み合わせとに基づいて、バーストクエリである「ぱんみ」に類似する過去バーストクエリである「矢風」を判定する。
【0047】
類似クエリ判定部109は、第2共起クエリの組み合わせに基づいて、マッチングする第1共起クエリの組み合わせをイベント情報DB1033から判定してもよい。この場合、例えば、類似クエリ判定部109は、第2共起クエリの組み合わせである「婚約」、「挙式」、「結婚」に基づいて、「婚約」、「挙式」、「結婚」を少なくとも含む第1共起クエリの組み合わせをイベント情報DB1033から判定する。これにより、類似クエリ判定部109は、イベント情報DB1033において、イベント情報として「結婚」を対応して記憶するとともに、「婚約」、「挙式」、「結婚」を含む第1共起クエリの組み合わせを類似クエリとして判定する。
【0048】
類似クエリ判定部109は、第2共起クエリの組み合わせを構成する「単語」が多数ある場合、類似クエリ判定部109は、相対比が所定値よりも大きい第2共起クエリの組み合わせのみを含む第1共起クエリの組み合わせを判定してもよい。また、類似クエリ判定部109は、相対比が所定値よりも大きい第2共起クエリの組み合わせの全てでは無く、一致する「単語」の数に基づいて、例えば、一致度の高い第2共起クエリと、第1共起クエリを判定してもよい。
【0049】
(2.6)説明文取得部111
説明文取得部111は、類似クエリ判定部109により類似と判定された第1共起クエリの組み合わせと対応する説明文をクエリDB1031から取得する。例えば、説明文取得部111は、類似クエリ判定部109により判定された「婚約」、「挙式」、「結婚」と対応する説明文である「タレント。ブログにより結婚することを発表。」をクエリDB1031から取得する。
【0050】
(2.7)イベント情報抽出部113
イベント情報抽出部113は、説明文取得部111によりクエリDB1031から抽出した説明文から過去バーストクエリの検索頻度が上昇した理由を示すイベント情報を抽出する。具体的には、イベント情報抽出部113は、説明文取得部111によりクエリDB1031から抽出した説明文を形態素解析し、過去バーストクエリの検索頻度が上昇した理由を示すイベント情報を抽出する。例えば、イベント情報抽出部113は、類似クエリ判定部109の判定結果に基づいて、抽出された説明文である「タレント。ブログにより結婚することを発表。」から、サ変動詞を取得することで過去バーストクエリである「矢風」の検索頻度が上昇した理由を示すイベント情報である「結婚」を抽出する。イベント情報抽出部113は、所定のルールに基づいて説明文を形態素解析すればよく、例えば、上記の説明文に含まれる「発表」のように説明文の文末に利用される単語を禁止ワードとして登録し、イベント情報として抽出されないようにすることもできる。
【0051】
イベント情報抽出部113は、イベント情報を説明文から抽出するだけでなく、イベント情報DB1033から対応するイベント情報を抽出してもよい。具体的には、イベント情報抽出部113は、類似クエリ判定部109の判定結果に基づいて、類似クエリとして判定された「婚約」、「挙式」、「結婚」に対応して記憶されるイベント情報として「結婚」をイベント情報DB1033から抽出する。
【0052】
また、イベント情報抽出部113は、類似クエリ判定部109の判定結果に基づいて、バーストクエリと関連する過去バーストクエリに対応する属性情報を属性情報DB1035から抽出する。具体的には、イベント情報抽出部113は、類似クエリ判定部109の判定結果に基づいて、バーストクエリである「ぱんみ」と類似する過去バーストクエリである「矢風」に対応する属性情報として、「タレント」を属性情報DB1035から抽出する。
【0053】
(2.8)説明文作成部115
説明文作成部115は、イベント情報抽出部113により抽出されたイベント情報に基づいて、バーストクエリを説明する説明文を作成する。具体的には、説明文作成部115は、イベント情報DB1033に記憶される過去バーストクエリの属性を示す属性情報と、過去バーストクエリの検索頻度が上昇した理由を示すイベント情報とを少なくとも含む説明文を作成する。例えば、説明文作成部115は、イベント情報抽出部113により抽出されたイベント情報である「結婚」と、属性情報である「タレント」とを含む説明文を作成する。
【0054】
(2.9)出力部117
図8は、バースト理由抽出装置100の出力部117によって出力される検索クエリの候補1171を含む検索ページの一部模式図である。図9は、バースト理由抽出装置100の出力部117によって出力される検索クエリの候補1173を含む検索ページの模式図である。
【0055】
出力部117は、イベント情報抽出部113により抽出されたイベント情報をバーストクエリのバースト理由として、出力する。例えば、出力部117は、イベント情報である「結婚」をバーストクエリである「ぱんみ」の検索頻度が急上昇したと思われる理由、すなわち、バースト理由として、出力する。
【0056】
なお、出力部117は、図8、9に示すように、イベント情報抽出部113により抽出されたイベント情報をバーストクエリに関連する関連検索ワードとして、例えば、バーストクエリとともに再検索をする際の検索クエリの候補1171、1173として出力してもよい。例えば、出力部117は、イベント情報である「結婚」をバーストクエリである「ぱんみ」に関連する関連検索ワードとして、バーストクエリとともに再検索をする際の検索クエリとして出力する。すなわち、この場合、出力部117は、「ぱんみ」と、「結婚」とを再検索をする際の検索クエリの候補として出力する。
【0057】
(3)情報処理システム1の動作
情報処理システム1の動作について、(3.1)全体概略動作(3.2)バースト理由抽出装置100によるバースト理由の抽出動作の順に説明する。
【0058】
(3.1)全体概略動作
図10は、情報処理システム1の全体概略動作を示すシーケンス図である。
情報処理システム1の動作は、バースト理由抽出装置100、情報検索装置200、検索ログDB250による動作を含む。
【0059】
具体的には、ステップS101において、バースト理由抽出装置100は、検索ログDB250から検索ログを抽出する。
【0060】
ステップS103において、バースト理由抽出装置100は、検索ログに含まれる所定の検索クエリについて、バースト理由を抽出する。
【0061】
ステップS105において、ユーザ端末10は、バースト理由抽出装置100、情報検索装置200、検索ログDB250に対して、検索クエリを送信する。
【0062】
ステップS107において、情報検索装置200は、検索クエリに基づいて、検索を実行する。
【0063】
ステップS109において、情報検索装置200は、検索結果をユーザ端末10へ送信する。
【0064】
ステップS111において、バースト理由抽出装置100は、ユーザ端末10により送信された検索クエリに対応するバースト理由をステップS109の検索結果と共にユーザ端末10へ送信する。
【0065】
ステップS113において、検索ログDB250は、検索クエリを検索ログとして新たに記録する。
【0066】
なお、これらのバースト理由抽出装置100、情報検索装置200、検索ログDB250の動作は、他の装置と独立して適宜処理されてもよい。すなわち、上記は、情報処理システム1の全体概略動作を説明する上で便宜上順次処理をしているように記載しているに過ぎない。
【0067】
(3.2)バースト理由抽出装置100によるバースト理由の抽出動作
図10は、バースト理由抽出装置100によるバースト理由の抽出動作を示すフローチャートである。
【0068】
ステップS201において、取得部101は、検索ログDB250から検索ログを取得する。
【0069】
ステップS203において、バーストクエリ判定部105は、検索ログから、所定の検索クエリの検索頻度を算出する。
【0070】
ステップS205において、バーストクエリ判定部105は、所定の検索クエリがバーストクエリであるか、否かを判定する。具体的には、バーストクエリ判定部105は、所定の検索クエリがバーストクエリでないと判定した場合、処理をステップS207へ進める。また、バーストクエリ判定部105は、所定の検索クエリがバーストクエリであると判定した場合、処理をステップS209へ進める。
【0071】
ステップS207において、バーストクエリ判定部105は、バーストクエリでないと判定された次ぎの所定の検索クエリを抽出し、処理をステップS203へ戻す。
【0072】
ステップS209において、共起クエリ抽出部107は、バーストクエリ判定部105により判定されたバーストクエリと、バーストクエリと共に入力された第2共起クエリの組み合わせとを抽出する。
【0073】
ステップS211において、類似クエリ判定部109は、共起クエリ抽出部107により抽出された第2共起クエリの組み合わせと、クエリDB1031に記憶される第1共起クエリの組み合わせとに基づいて、バーストクエリと同様の理由で検索頻度が急上昇したと思われる過去バーストクエリを判定する。
【0074】
ステップS213において、説明文取得部111は、類似クエリ判定部109により判定された第1共起クエリの組み合わせと対応する説明文をクエリDB1031から取得する。
【0075】
ステップS215において、イベント情報抽出部113は、説明文取得部111により取得され説明文から過去バーストクエリの検索頻度が上昇した理由を示すイベント情報を抽出する。
【0076】
ステップS217において、取得部101は、ユーザ端末10から検索クエリを取得する。
【0077】
ステップS219において、出力部117は、ユーザ端末10から取得した検索クエリに対応するイベント情報をバーストクエリのバースト理由として、出力する。
【0078】
(4)作用・効果
以上説明したように、本実施形態によれば、バースト理由抽出装置100は、イベント情報DB1033と、共起クエリ抽出部107と、類似クエリ判定部109と、イベント情報抽出部113とを備える。イベント情報DB1033は、一定期間において検索頻度が急上昇した検索クエリである過去バーストクエリの検索頻度が上昇した理由を示すイベント情報と、該過去バーストクエリと共に入力されたクエリである第1共起クエリの組み合わせとを対応させて記憶する。また、共起クエリ抽出部107は、ユーザ端末より送信された検索クエリの履歴である検索ログから、新たに検索頻度が急上昇した検索クエリであるバーストクエリと、バーストクエリと共に入力された第2共起クエリの組み合わせとを抽出し、類似クエリ判定部109は、第2共起クエリの組み合わせに基づいて、バーストクエリと共に入力された第2共起クエリの組み合わせと類似する第1共起クエリの組み合わせを抽出し、イベント情報抽出部113は、類似クエリ判定部109により抽出された第1共起クエリの組み合わせに基づいて、イベント情報をイベント情報DB1033から抽出する。
【0079】
このため、類似クエリ判定部109が、第2共起クエリの組み合わせと類似する第1共起クエリの組み合わせを抽出することにより、バースト理由抽出装置100は、バーストクエリと同様の理由で検索頻度が急上昇したと思われる過去バーストクエリを抽出できる。また、イベント情報抽出部113が、第1共起クエリの組み合わせに基づいて、イベント情報を抽出することにより、バースト理由抽出装置100は、バーストクエリと同様の理由で検索頻度が急上昇したと思われる過去バーストクエリのイベント情報を抽出する。
すなわち、バースト理由抽出装置100は、検索頻度が所定の割合以上で上昇した理由を示すイベント情報をバーストクエリの検索頻度が急上昇した理由として抽出できる。
【0080】
従って、バースト理由抽出装置100は、一定期間において検索頻度が急上昇した検索クエリであるバーストクエリを抽出するとともに、何故、検索頻度が急上昇したか、その理由をイベント情報として、バーストクエリとともに、あわせて抽出し、提供できる。
【0081】
実施形態では、検索ログから、所定の検索クエリの検索頻度を算出し、検索クエリをバーストクエリとして判定する。バーストクエリ判定部105を更に備える。すなわち、バーストクエリ判定部105は、所定の検索クエリの検索頻度に基づいて、バーストクエリを判定する。従って、バースト理由抽出装置100は、バーストクエリ判定部105により、過去に検索頻度が急上昇した過去バーストクエリと異なる第1共起クエリの組み合わせを含む検索クエリについても、漏れなくバーストクエリとして判定することができる。
【0082】
実施形態では、過去バーストクエリの属性を示す属性情報と、過去バーストクエリに対応する第1共起クエリの組み合わせとを対応させて記憶する属性情報DB1035を更に備え、イベント情報抽出部113は、類似クエリ判定部109の判定結果に基づいて、バーストクエリと同様の理由で検索頻度が急上昇したと思われる過去バーストクエリに対応する属性情報を属性情報DB1035から抽出する。
【0083】
すなわち、イベント情報抽出部113は、過去に検索頻度が急上昇した過去バーストクエリであり、バーストクエリと同様の理由で検索頻度が急上昇したと思われる過去バーストクエリの属性情報を抽出することにより、バーストクエリの属性情報を抽出できる。従って、バースト理由抽出装置100は、一定期間において検索頻度が急上昇した検索クエリである過去バーストクエリを抽出するとともに、バーストクエリの属性情報をあわせて抽出し、提供できる。
【0084】
実施形態では、イベント情報抽出部113により抽出されたイベント情報をバーストクエリに関連する関連検索ワードとして、バーストクエリとともに再検索をする際の検索クエリとして出力する出力部117を更に備える。すなわち、ユーザは、イベント情報をバーストクエリに関連する関連検索ワードとして、バーストクエリとともに再検索をすることができるため、バーストクエリの検索頻度が所定の割合以上で上昇するに至った理由を更に検索することができる。
【0085】
実施形態では、バーストクエリ判定部105は、検索ログから、所定の検索クエリと共に入力された第1共起クエリの検索頻度を算出し、第1共起クエリと共に入力された検索クエリをバーストクエリとして判定する。すなわち、バーストクエリ判定部105は、所定の検索クエリの検索頻度に基づいて、バーストクエリを判定する。従って、バースト理由抽出装置100は、バーストクエリ判定部105により、過去に検索頻度が急上昇した過去バーストクエリと異なる第1共起クエリの組み合わせを含む検索クエリについても、漏れなくバーストクエリとして判定することができる。
【0086】
実施形態では、イベント情報抽出部113により抽出されたイベント情報に基づいて、バーストクエリを説明する説明文を作成する説明文作成部115と、説明文作成部115により作成された説明文と、バーストクエリに対応する第1共起クエリの組み合わせとを対応させて記憶するクエリDB1031とを更に備える。すなわち、説明文作成部115は、過去に検索頻度が急上昇した過去バーストクエリであり、バーストクエリに類似する過去バーストクエリに対応するイベント情報に基づいて、説明文を作成することができる。
【0087】
従って、バースト理由抽出装置100は、バーストするに至った理由がわからない検索クエリについて、その理由をイベント情報として抽出するとともに、その説明文を作成し、提供することができる。
【0088】
(5)その他の実施形態
上述した実施形態では、共起クエリ抽出部107は、バーストクエリ判定部105により判定されたバーストクエリと、バーストクエリと共に入力された第2共起クエリの組み合わせとを抽出する。本発明は、これに限らず、共起クエリ抽出部107は、検索ログから、直接、新たに検索頻度が急上昇した検索クエリであるバーストクエリと、バーストクエリと共に入力された第2共起クエリの組み合わせとを抽出してもよい。
【0089】
上述した実施形態では、バースト理由抽出装置100が備える各ブロックについて記載しているが、本発明は、これに限られず、例えば、上記の各ブロックの機能を実行するコンピュータプログラムとしてもよく、また、このコンピュータプログラムを配信する情報処理装置であってもよい。また、上述したように、バースト理由を抽出する情報処理方法であってもよい。
【0090】
上述した実施形態では、バーストクエリ判定部105は、検索クエリの所定期間あたりの検索回数が、1つ前の所定期間あたりの検索回数の所定の比率を超えた場合、検索クエリをバーストクエリとして判定する。本発明は、これに限らず、バーストクエリ判定部105は、検索クエリの所定期間あたりの検索回数が、所定の値を超えた場合に検索クエリをバーストクエリとして判定してもよい。
【0091】
上述した実施形態では、バーストクエリ判定部105は、所定の検索クエリが含まれているか、否かに基づいて、検索回数を測定し、所定の条件を満たした場合に検索クエリをバーストクエリとして判定する。本発明は、これに限らず、例えば、図10に示すように、バーストクエリ判定部105は、検索ログから、所定のクエリと共に入力された第2共起クエリの検索頻度を算出し、第2共起クエリと共に入力されたクエリをバーストクエリとして判定してもよい。具体的には、バーストクエリ判定部105は、検索ログから、所定の「単語」と第2共起クエリとを含む検索クエリを抽出し、各検索クエリの所定期間あたりの検索回数を算出する。次に、バーストクエリ判定部105は、いずれかの検索クエリの所定期間あたりの検索回数が、所定の値を超えた場合、又は、いずれかの検索クエリの所定期間あたりの検索回数が、1つ前の所定期間あたりの検索回数の所定の比率を超えた場合、検索クエリをバーストクエリとして判定してもよい。
【0092】
この場合、例えばバーストクエリ判定部105は、検索ログから、「ぱんみ」と第2共起クエリとを含む検索クエリとして、「ぱんみ 婚約」、「ぱんみ 挙式」、「ぱんみ 結婚」等を抽出し、各検索クエリの一日あたりの検索回数を算出する。次に、バーストクエリ判定部105は、11月3日の「ぱんみ 結婚」の検索回数の偏差値が、65を超えたため、「ぱんみ」をバーストクエリとして判定することができる。
【0093】
上述した実施形態では、イベント情報DB1033は、過去バーストクエリの検索頻度が上昇した理由を示すイベント情報と、該過去バーストクエリに対応する第1共起クエリの組み合わせとを対応させて記憶することが前提になっている。このイベント情報は、事前にサーバ管理者等により過去バーストクエリに対応する第1共起クエリの組み合わせとともに、イベント情報DB1033に登録されてもよい。また、バーストクエリが検出された際に、それを含む当日のニュースサイト等から、バーストクエリをタイトルに含む物を探してきて、その記事のタイトルをバースト理由、すなわち、検索頻度が上昇した理由を示すイベント情報として登録するようにしてもよい。
【0094】
例えば、バーストクエリが検出された際に、それを含む当日のニュースサイト等へのリンクを含んでいる短文投稿ブログ等の書き込みを抽出し、文章が共通するものについてはその文章が何回起こったかをカウントして、カウントの高い物をバースト理由、すなわち、検索頻度が上昇した理由を示すイベント情報としてとして取得することができる。
【0095】
同様にして、例えば、バーストクエリが検出された際に、それを含む当日のニュースサイト等のうち、ソーシャルブックマークが多い物について、そのタイトルをバースト理由すなわち、検索頻度が上昇した理由を示すイベント情報として取得することができる。
【0096】
このように、本発明は、ここでは記載していない様々な実施の形態などを含むことは勿論である。したがって、本発明の技術的範囲は、上述の説明から妥当な特許請求の範囲に係る発明特定事項によってのみ定められるものである。
【0097】
例えば、各構成図、フローチャート、概念図の図などは例示に過ぎず、各要素の有無、その順序や具体的内容などは適宜変更可能である。一例として、手動によるブロックの指定は必須ではなく、また、本発明において、各手段などの要素は、コンピュータの演算制御部に限らず、ワイヤードロジック等に基づく電子回路で実現してもよい。
【符号の説明】
【0098】
1 情報処理システム
10 ユーザ端末
20 ユーザ端末
50 通信ネットワーク
100 バースト理由抽出装置
101 取得部
103 急上昇ワード記憶部
105 バーストクエリ判定部
107 共起クエリ抽出部
109 類似クエリ判定部
111 説明文取得部
113 イベント情報抽出部
115 説明文作成部
117 出力部
200 情報検索装置
250 検索ログDB
1031 クエリDB
1033 イベント情報DB
1035 属性情報DB

【特許請求の範囲】
【請求項1】
検索頻度が所定の割合以上で上昇した検索クエリであるバーストクエリを抽出する情報処理装置であって、
一定期間において検索頻度が所定の割合以上で上昇した検索クエリである過去バーストクエリの検索頻度が所定の割合以上で上昇した理由を示すイベント情報と、該過去バーストクエリと共に入力されたクエリである第1共起クエリの組み合わせとを対応させて記憶するイベント情報記憶手段と、
ユーザ端末より送信された検索クエリの履歴である検索ログから、新たに検索頻度が所定の割合以上で上昇した検索クエリであるバーストクエリと、前記バーストクエリと共に入力されたクエリである第2共起クエリの組み合わせとを抽出する共起クエリ抽出手段と、
前記共起クエリ抽出手段により抽出された前記第2共起クエリの組み合わせと類似する前記第1共起クエリの組み合わせを前記イベント情報記憶手段から判定する類似クエリ判定手段と、
前記類似クエリ判定手段により判定された前記第1共起クエリの組み合わせに対応する前記イベント情報を前記イベント情報記憶手段から抽出するイベント情報抽出手段と、
を備えることを特徴とする情報処理装置。
【請求項2】
前記検索ログから、所定の検索クエリの検索頻度を算出し、前記検索クエリを前記バーストクエリとして判定するバーストクエリ判定手段を更に備えることを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記過去バーストクエリの属性を示す属性情報と、該過去バーストクエリに対応する前記第1共起クエリの組み合わせとを対応させて記憶する属性情報記憶手段を更に備え、
前記イベント情報抽出手段は、
前記類似クエリ判定手段の判定結果に基づいて、前記バーストクエリと類似する前記過去バーストクエリに対応する前記属性情報を前記属性情報記憶手段から抽出することを特徴とする請求項1又は2に記載の情報処理装置。
【請求項4】
前記イベント情報抽出手段により抽出された前記イベント情報を前記バーストクエリに関連する関連検索ワードとして出力する出力手段を更に備えることを特徴とする請求項1乃至3のいずれか一項に記載の情報処理装置。
【請求項5】
コンピュータが、検索頻度が所定の割合以上で上昇した検索クエリであるバーストクエリを抽出する情報処理方法であって、
一定期間において検索頻度が所定の割合以上で上昇した検索クエリである過去バーストクエリの検索頻度が所定の割合以上で上昇した理由を示すイベント情報と、該過去バーストクエリと共に入力されたクエリである第1共起クエリの組み合わせとを対応させて記憶するイベント情報記憶手段をコンピュータが備え、
ユーザ端末より送信された検索クエリの履歴である検索ログから、新たに検索頻度が所定の割合以上で上昇した検索クエリであるバーストクエリと、前記バーストクエリと共に入力されたクエリである第2共起クエリの組み合わせとを抽出するステップと、
前記抽出された前記第2共起クエリの組み合わせと類似する前記第1共起クエリの組み合わせを前記イベント情報記憶手段から判定するステップと、
前記判定された前記第1共起クエリの組み合わせに対応する前記イベント情報を前記イベント情報記憶手段から抽出するステップと、
を備えることを特徴とする情報処理方法。
【請求項6】
請求項5に記載の情報処理方法をコンピュータに実行させることを特徴とするプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate


【公開番号】特開2013−37404(P2013−37404A)
【公開日】平成25年2月21日(2013.2.21)
【国際特許分類】
【出願番号】特願2011−170493(P2011−170493)
【出願日】平成23年8月3日(2011.8.3)
【出願人】(500257300)ヤフー株式会社 (1,128)