関連語登録装置、関連語登録方法、関連語登録装置用プログラム、記録媒体、および、関連語登録システム
【課題】精度の高い関連語を登録できる関連語登録装置等を提供する。
【解決手段】ユーザが入力した検索ワードを含む検索クエリを取得し(S4)、取得した検索クエリを、ユーザ識別情報、および、検索クエリの取得時刻に対応付けて記憶し(S5)、所定のユーザ操作を検出した場合に、ユーザ操作の操作対象のWebページに含まれる特徴ワードを取得し(S6)、ユーザ操作を行ったユーザのユーザ識別情報に対応する検索クエリを抽出し(S7)、抽出した検索クエリから、取得時刻に基づき候補検索クエリを特定し(S8)、抽出した特徴ワードと、特定された候補検索クエリに含まれる検索ワードとを、関連語として関連語DBに登録する(S9)。
【解決手段】ユーザが入力した検索ワードを含む検索クエリを取得し(S4)、取得した検索クエリを、ユーザ識別情報、および、検索クエリの取得時刻に対応付けて記憶し(S5)、所定のユーザ操作を検出した場合に、ユーザ操作の操作対象のWebページに含まれる特徴ワードを取得し(S6)、ユーザ操作を行ったユーザのユーザ識別情報に対応する検索クエリを抽出し(S7)、抽出した検索クエリから、取得時刻に基づき候補検索クエリを特定し(S8)、抽出した特徴ワードと、特定された候補検索クエリに含まれる検索ワードとを、関連語として関連語DBに登録する(S9)。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、検索キーワードを関連語として登録する関連語登録装置、関連語登録方法、関連語登録装置用プログラム、記録媒体、および、関連語登録システムの技術分野に関する。
【背景技術】
【0002】
同義語辞書のように関連性の高い単語を集めた単語のデータベースは、情報検索システムや、自然言語処理システムや、機械翻訳システム等において、検索キーワードの補完や、翻訳等の精度を高めるために利用されている。この関連性の高い単語を自動的に生成し、検索等に利用する装置が様々研究されている。例えば、特許文献1には、入力キーワードの文字列を取得し、キーワードを含むコメントを取り出し、形態素解析処理して単語の中から名詞だけを抽出し、日本語文章を単語毎に分割して品詞と共に取り出し、取り出した単語を使用回数の多い順に整理する単語ヒストグラムを作成し、使用回数の多い単語を関連キーワードとして確保し、この関連キーワードに基づき、再度コメントを検索するキーワード検索装置が開示されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2001−290840号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、特許文献1に記載の技術では、検索キーワードと、検索結果のページのコメントにおける使用回数の多い特徴ワードとを関連語として記憶しているため、当該検索結果に至る過程の途中で入力されている検索キーワード(未完成な検索キーワード)を考慮できなかった。従って、この関連語を使用しても、ユーザが目標とする検索対象に早くたどり着けず、ユーザが検索行動を断念する場合もあり、必ずしも関連語としての精度が高いとは言えなかった。
【0005】
本発明は、このような問題に鑑みてなされたものであり、その課題の一例は、精度の高い関連語を登録できる関連語登録装置等を提供することを目的とする。
【課題を解決するための手段】
【0006】
上記課題を解決するために、請求項1に記載の発明は、ユーザが入力した検索ワードを含む検索クエリを取得する検索クエリ取得手段と、前記取得した検索クエリを、ユーザ識別情報、および、前記検索クエリの取得時刻に対応付けて記憶する検索クエリ記憶手段と、所定のユーザ操作を検出した場合に、前記ユーザ操作の操作対象のWebページに含まれる特徴ワードを取得する特徴ワード取得手段と、前記ユーザ操作を行ったユーザのユーザ識別情報に対応する検索クエリを抽出する検索クエリ抽出手段と、前記抽出した検索クエリから、前記取得時刻に基づき候補検索クエリを特定する候補検索クエリ特定手段と、前記取得した特徴ワードと、前記特定された候補検索クエリに含まれる検索ワードとを、関連語データベースに関連語として登録する関連語登録手段と、を備える。
【0007】
請求項2に記載の発明は、請求項1に記載の関連語登録装置において、前記候補検索クエリ特定手段が、前記抽出された検索クエリのうち、前記取得時刻が最も遅い検索クエリを除いた検索クエリを、前記候補検索クエリとして特定することを特徴とする。
【0008】
請求項3に記載の発明は、請求項1または請求項2に記載の関連語登録装置において、前記候補検索クエリ特定手段が、前記抽出した検索クエリから、前記所定のユーザ操作を検出した操作時刻より取得時刻が前であり、かつ、前記取得時刻に基づく連続性がある検索クエリを前記候補検索クエリとして特定することを特徴とする。
【0009】
請求項4に記載の発明は、請求項2または請求項3に記載の関連語登録装置において、前記候補検索クエリ特定手段が、前記操作時刻から第1の所定時間内の検索クエリを候補検索クエリとして特定することを特徴とする。
【0010】
請求項5に記載の発明は、請求項2から請求項4のいずれか1項に記載の関連語登録装置において、前記候補検索クエリ特定手段が、互いの取得時刻の間隔が第2の所定時間内の検索クエリを候補検索クエリとして特定することを特徴とする。
【0011】
請求項6に記載の発明は、請求項2から請求項5のいずれか1項に記載の関連語登録装置において、前記候補検索クエリ取得手段が、検索において、前記検索クエリと共にカテゴリ情報を取得し、前記候補検索クエリ特定手段が、前記カテゴリ情報に一致し、前記操作時刻より取得時刻が前であり、かつ、前記取得時刻に基づく連続性がある検索クエリを候補検索クエリとして特定することを特徴とする。
【0012】
請求項7に記載の発明は、請求項2から請求項6のいずれか1項に記載の関連語登録装置において、前記候補検索クエリ特定手段が、前記操作時刻より取得時刻が前であり、かつ、前記取得時刻に基づく連続性がある検索クエリであって、検索結果数が所定値以下である検索クエリを候補検索クエリとして特定することを特徴とする。
【0013】
請求項8に記載の発明は、請求項1から請求項7のいずれか1項に記載の関連語登録装置において、前記特徴ワード取得手段が、前記Webページを形態素解析して前記特徴ワードを取得することを特徴とする。
【0014】
請求項9に記載の発明は、請求項8に記載の関連語登録装置において、前記特徴ワード取得手段が、前記Webページを構成している各コンテンツの出現頻度を計算し、前記出現頻度に基づいてコンテンツを特定し、当該特定されたコンテンツに対して形態素解析して特徴ワードを取得することを特徴とする。
【0015】
請求項10に記載の発明は、ユーザが入力した検索ワードを含む検索クエリを取得する検索クエリ取得手段と、前記取得した検索クエリを、ユーザ識別情報、および、前記検索クエリの取得時刻に対応付けて記憶する検索クエリ記憶手段と、所定のユーザ操作を検出した場合、操作対象のWebページに含まれる特徴ワードを取得する特徴ワード取得手段と、前記取得した検索クエリから、前記ユーザ操作を行ったユーザのユーザ識別情報に対応する候補検索クエリを抽出する候補検索クエリ抽出手段と、前記取得した特徴ワードと、前記抽出された候補検索クエリに含まれる検索ワードとを、関連語データベースに関連語として登録する関連語登録手段と、を備える。
【0016】
請求項11に記載の発明は、請求項10に記載の関連語登録装置において、前記候補検索クエリ抽出手段が、前記ユーザ操作を行ったユーザのユーザ識別情報に対応し、かつ、前記取得時刻に基づく連続性がある候補検索クエリを抽出することを特徴とする。
【0017】
請求項12に記載の発明は、請求項11に記載の関連語登録装置において、前記候補検索クエリ抽出手段が、前記取得時刻に基づく連続性がある検索クエリとして、前記検索クエリ記憶手段により記憶された検索クエリにおいて、前記取得時刻が最も遅い検索クエリの取得時刻から第1の所定時間内に取得した候補検索クエリを抽出することを特徴とする。
【0018】
請求項13に記載の発明は、請求項11または請求項12に記載の関連語登録装置において、前記候補検索クエリ抽出手段が、前記取得時刻に基づく連続性がある検索クエリとして、互いの取得時刻の間隔が第2の所定時間内の候補検索クエリを抽出することを特徴とする。
【0019】
請求項14に記載の発明は、請求項11から請求項13のいずれか1項に記載の関連語登録装置において、前記検索クエリ取得手段が、検索において、前記検索クエリと共にカテゴリ情報を取得し、前記候補検索クエリ抽出手段が、前記カテゴリ情報に一致し、前記ユーザの識別情報に対応し、かつ、前記取得時刻に基づく連続性がある候補検索クエリを抽出することを特徴とする。
【0020】
請求項15に記載の発明は、請求項11から請求項14のいずれか1項に記載の関連語登録装置において、前記候補検索クエリ抽出手段が、前記ユーザの識別情報に対応し、かつ、前記取得時刻に基づく連続性がある検索クエリであって、検索結果数が所定値以下である検索クエリを候補検索クエリとして抽出することを特徴とする。
【0021】
請求項16に記載の発明は、関連語を登録する関連語登録装置の関連語登録方法において、前記関連語登録装置が、ユーザが入力した検索ワードを含む検索クエリを取得する検索クエリ取得ステップと、前記関連語登録装置が、前記取得した検索クエリを、ユーザ識別情報、および、前記検索クエリの取得時刻に対応付けて記憶する検索クエリ記憶ステップと、前記関連語登録装置が、所定のユーザ操作を検出した場合に、前記ユーザ操作の操作対象のWebページに含まれる特徴ワードを取得する特徴ワード取得ステップと、前記関連語登録装置が、前記ユーザ操作を行ったユーザのユーザ識別情報に対応する検索クエリを抽出する検索クエリ抽出ステップと、前記関連語登録装置が、前記抽出した検索クエリから、前記取得時刻に基づき候補検索クエリを特定する候補検索クエリ特定ステップと、前記関連語登録装置が、前記取得した特徴ワードと、前記特定された候補検索クエリに含まれる検索ワードとを、関連語データベースに関連語として登録する関連語登録ステップと、を含む。
【0022】
請求項17に記載の発明は、コンピュータを、ユーザが入力した検索ワードの検索クエリを取得する検索クエリ取得手段、前記取得した検索クエリを、ユーザ識別情報、および、前記検索クエリの取得時刻に対応付けて記憶する検索クエリ記憶手段、所定のユーザ操作を検出した場合に、前記ユーザ操作の操作対象のWebページに含まれる特徴ワードを取得する特徴ワード取得手段、前記ユーザ操作を行ったユーザのユーザ識別情報に対応する検索クエリを抽出する検索クエリ抽出手段、前記抽出した検索クエリから、前記取得時刻に基づき候補検索クエリを特定する候補検索クエリ特定手段、および、前記取得した特徴ワードと、前記特定された候補検索クエリに含まれる検索ワードとを、関連語データベースに関連語として登録する関連語登録手段として機能させる。
【0023】
請求項18に記載の発明は、コンピュータを、ユーザが入力した検索ワードの検索クエリを取得する検索クエリ取得手段、前記取得した検索クエリを、ユーザ識別情報、および、前記検索クエリの取得時刻に対応付けて記憶する検索クエリ記憶手段、所定のユーザ操作を検出した場合に、前記ユーザ操作の操作対象のWebページに含まれる特徴ワードを取得する特徴ワード取得手段、前記ユーザ操作を行ったユーザのユーザ識別情報に対応する検索クエリを抽出する検索クエリ抽出手段、前記抽出した検索クエリから、前記取得時刻に基づき候補検索クエリを特定する候補検索クエリ特定手段、および、前記取得した特徴ワードと、前記特定された候補検索クエリに含まれる検索ワードとを、関連語データベースに関連語として登録する関連語登録手段として機能させる関連語登録装置用プログラムを記録する。
【0024】
請求項19に記載の発明は、端末と、前記端末とネットワークを介して接続され、前記端末からの関連語を受信する関連語登録装置と、前記関連語を登録する関連語データベースと、を備えた関連語登録システムにおいて、前記端末が、ユーザが入力した検索ワードの検索クエリを取得する検索クエリ取得手段と、前記取得した検索クエリを、ユーザ識別情報、および、前記検索クエリの取得時刻に対応付けて記憶する検索クエリ記憶手段と、所定のユーザ操作を検出した場合に、前記ユーザ操作の操作対象のWebページに含まれる特徴ワードを取得する特徴ワード取得手段と、前記ユーザ操作を行ったユーザのユーザ識別情報に対応する検索クエリを抽出する検索クエリ抽出手段と、前記抽出した検索クエリから、前記取得時刻に基づき候補検索クエリを特定する候補検索クエリ特定手段と、前記取得した特徴ワードと、前記特定された候補検索クエリに含まれる検索ワードとを、登録用の関連語として前記関連語登録装置に送信する関連語送信手段と、を備え、前記関連語登録装置が、前記受信した特徴ワードと候補検索クエリに含まれる検索ワードとを、前記関連語データベースに関連語として登録する関連語登録手段を備えたことを特徴とする。
【発明の効果】
【0025】
本発明によれば、ユーザが入力した検索ワードを含む検索クエリを取得し、取得した検索クエリを、ユーザ識別情報、および、検索クエリの取得時刻に対応付けて記憶し、所定のユーザ操作を検出した場合に、ユーザ操作の操作対象のWebページに含まれる特徴ワードを取得し、ユーザ操作を行ったユーザのユーザ識別情報に対応する検索クエリを抽出し、抽出した検索クエリから、取得時刻に基づき検索クエリを特定し、抽出した特徴ワードと、特定された検索クエリの検索ワードとを、関連語データベースに関連語として登録することにより、所定のユーザの操作を契機に、ユーザ操作と関連が深い特徴ワードと、ユーザの操作と時間的に関連して、ユーザ識別情報に対応する検索クエリの検索ワードとを関連ワードとして登録しているため、ユーザの関連性を担保しつつ、ユーザが目的とする検索対象にたどり着けたときのユーザの操作に対応した特徴ワード(完成された検索クエリの結果から取得した特徴ワード)と、検索結果に至る過程の途中である未完成の検索クエリに含まれる検索ワードとを精度の高い関連語として登録できる。
【図面の簡単な説明】
【0026】
【図1】本発明の1実施形態に係る関連語登録システムの概要構成例を示す模式図である。
【図2】図1の関連語登録サーバの概要構成の一例を示すブロック図である。
【図3】図1の情報提供サーバの概要構成の一例を示すブロック図である。
【図4】図1の端末の概要構成の一例を示すブロック図である。
【図5】図1の端末に表示されたウェブページの一例を示す模式図である。
【図6】図1の関連語登録サーバの動作例を示すフローチャートである。
【図7】図1の端末に表示されたウェブページの一例を示す模式図である。
【図8】図1の端末に表示されたウェブページの一例を示す模式図である。
【図9】図1の端末に表示されたウェブページの一例を示す模式図である。
【図10】図1の端末に表示されたウェブページの一例を示す模式図である。
【図11】ユーザ操作の検出時と、検索クエリの取得時間との関係の一例を示す模式図である。
【図12】HTML文書から生成されたDOMツリーの一例を示す模式図である。
【図13】特徴ワード用データベースに記録されるコンテンツ情報の内容の一例を示す模式図である。
【図14】特徴ワード抽出のサブルーチンを示すフローチャートである。
【図15】図1の関連語登録サーバの動作の変形例を示すフローチャートである。
【図16】ユーザ操作の検出時と、検索クエリの取得時間との関係の一例を示す模式図である。
【図17】ユーザ操作の検出時と、検索クエリの取得時間との関係の一例を示す模式図である。
【図18】ユーザ操作の検出時と、検索クエリの取得時間との関係の一例を示す模式図である。
【図19】ユーザ操作の検出時と、検索クエリの取得時間との関係の一例を示す模式図である。
【図20】ユーザ操作の検出時と、検索クエリの取得時間との関係の一例を示す模式図である。
【発明を実施するための形態】
【0027】
以下、図面を参照して本発明の実施形態について説明する。なお、以下に説明する実施の形態は、関連語登録システムに対して本発明を適用した場合の実施形態である。
【0028】
[1.関連語登録システムの構成および機能概要]
【0029】
まず、本発明の1実施形態に係る関連語登録システムの構成および概要機能について、図1を用いて説明する。
【0030】
図1は、本実施形態に係る関連語登録システム1の概要構成例を示す模式図である。
【0031】
図1に示すように、関連語登録システム1は、関連語を登録する関連語登録サーバ10(関連語登録装置の一例)と、ユーザが利用する情報提供サイトの一例であるショッピングサイト運営のために設置され、関連語登録サーバ10に登録されている情報や商品等の情報をユーザに提供するための情報提供サーバ20と、情報提供サーバ20においてユーザが商品等の検索を行う端末30と、を備えている。
【0032】
関連語登録サーバ10と、情報提供サーバ20とは、ローカルエリアネットワーク等により接続され、相互にデータの送受信が可能になっていて、サーバシステム5を構成している。そして、サーバシステム5と端末30とは、ネットワーク3により接続され、通信プロトコル(例えば、TCP/IP)により、データの送受信が可能になっている。なお、ネットワーク3は、例えば、インターネット、専用通信回線(例えば、CATV(Community Antenna Television)回線)、移動体通信網(基地局等を含む)、および、ゲートウェイ等により構築されている。
【0033】
また、関連語登録サーバ10は、端末30等におけるユーザの検索行動等から、関連語のデータベースを構築し、端末30等におけるユーザの検索行動を支援する。
【0034】
情報提供サーバ20は、端末30から検索クエリを受信して検索を行い、端末30に検索結果を送信する。また、情報提供サーバ20は、関連語のデータベースを構築するために、受信した検索クエリを関連語登録サーバ10に送信する。また、情報提供サーバ20は、ショッピングサイトとして、商品の検索、商品の情報の提供、広告の情報の提供、および、商品の購入の手続き等を行う。
【0035】
ユーザの端末30は、複数存在する。
【0036】
[2.各サーバの構成および機能]
(2.1 関連語登録サーバ10の構成および機能)
次に、関連語登録サーバ10の構成および機能について、図2を用いて説明する。
【0037】
図2は、関連語登録サーバ10の概要構成の一例を示すブロック図である。
【0038】
図2に示すように、コンピュータとして機能する関連語登録サーバ10は、通信部11と、記憶部12と、入出力インターフェース部13と、システム制御部14と、を備えている。そして、システム制御部14と入出力インターフェース部13とは、システムバス15を介して接続されている。
【0039】
通信部11は、ネットワーク3に接続して端末30等との通信状態を制御し、さらに、ローカルエリアネットワークに接続して、ローカルエリアネットワーク上の情報提供サーバ20等の他のサーバとデータの送受信を行う。
【0040】
記憶部12は、例えば、ハードディスクドライブ等により構成されており、オペレーティングシステムおよびサーバプログラム等の各種プログラムや、データ等を記憶する。なお、各種プログラムは、例えば、他のサーバ装置等からネットワーク3を介して取得されるようにしてもよいし、記録媒体に記録されてドライブ装置(図示せず)を介して読み込まれるようにしてもよい。
【0041】
また、記憶部12には、端末30から受信した検索クエリに関するログを記憶した検索クエリログ・データベース12a(以下「検索クエリログDB12a」とする。)と、Webページから特徴ワードを抽出する際に必要なデータを記憶した特徴ワード用データベース12b(以下「特徴ワード用DB12b」とする。)と、検索クエリから生成される関連語を記憶した関連語データベース12c(以下「関連語DB12c」とする。)等が構築されている。なお、検索クエリログDB12aや、特徴ワード用DB12b、関連語DB12cは、サーバシステム5内において、関連語登録サーバ10以外の他のサーバに構築されてもよいし、サーバシステム5外部に構築されてもよい。
【0042】
検索クエリログDB12a(検索クエリ記憶手段の一例)には、検索クエリを受信した受信時刻、ユーザID等のユーザを区別するためのユーザ識別情報と対応付けた検索クエリが記憶されている。なお、ユーザ識別情報として、ある程度ユーザを区別できるIPアドレスでもよい。さらに、情報提供サーバ20において、ユーザが商品検索を行っている場合、商品の属する商品カテゴリや、ユーザが開いているWebページが示している商品カテゴリ等のカテゴリ情報にも対応付けて、検索クエリが検索クエリログDB12aに記憶される。
【0043】
特徴ワード用DB12bには、特徴ワードの抽出に利用するため、情報提供サーバ20のデータベース等から抽出されたコンテンツ情報が記憶される。
【0044】
関連語DB12cには、関連語登録サーバ10により生成される関連語が記憶される。
【0045】
次に、入出力インターフェース部13は、通信部11および記憶部12とシステム制御部14との間のインターフェース処理を行う。
【0046】
システム制御部14は、CPU(Central Processing Unit)14a、ROM(Read Only Memory)14b、RAM(Random Access Memory)14c等により構成されている。システム制御部14は、CPU14aがROM14bや記憶部12に記憶された各種プログラムを読み出し実行することにより、関連語の登録処理等を行う。
【0047】
(2.2 情報提供サーバ20の構成および機能)
次に、情報提供サーバ20の構成および機能について、図3を用いて説明する。
図3は、情報提供サーバ20の概要構成の一例を示すブロック図である。
【0048】
図3に示すように、情報提供サーバ20は、通信部21と、記憶部22と、入出力インターフェース部23と、システム制御部24と、を備え、システム制御部24と入出力インターフェース部23とは、システムバス25を介して接続されている。なお、情報提供サーバ20の構成および機能は、関連語登録サーバ10の構成および機能とほぼ同じであるので、関連語登録サーバ10の各構成や各機能において、異なるところを中心に説明する。
【0049】
通信部21は、ネットワーク3やローカルエリアネットワーク等を通して、端末30や関連語登録サーバ10等との通信状態を制御等するようになっている。
【0050】
記憶部22には、商品データベース22a(以下「商品DB22a」とする。)や、会員データベース22b(以下「会員DB22b」とする。)等が構築されている。
【0051】
商品DB22aには、商品を識別するための識別子である商品IDに関連付けられ、商品名、種類、商品の画像、スペック、および、商品情報や、各商品に関する広告情報等が記憶されている。また、商品DB22aには、商品情報が商品のカテゴリ情報に基づき分類されている。また、商品DB22aには、HTML(HyperText Markup Language)、XML(Extensible Markup Language)等のマークアップ言語等により記述された商品ウェブページのファイル等が記憶されている。
【0052】
さらに、商品DB22aには、商品を検索するための検索データベースが構築されている。
【0053】
会員DB22bには、会員登録されたユーザ(ショッピングサイトの利用者)のユーザID、名称、住所、電話番号、メールアドレス、職業、趣味、購買履歴、ユーザの関心があるテーマやジャンル等のユーザ情報が登録されている。また、会員DB22bには、ユーザが端末30からショッピングサイトにログインする際に必要な、ユーザID、ログインID、および、パスワードが登録されている。ここで、ログインIDおよびパスワードは、ログイン処理(ユーザの認証処理)に使用されるログイン情報である。
【0054】
システム制御部24は、CPU24a、ROM24b、RAM24c等により構成されている。そして、システム制御部24は、CPU24aが、ROM24bや記憶部22に記憶された各種プログラムを読み出し実行することにより、商品検索処理や、ユーザによる商品購入処理等を行う。
【0055】
(2.3 端末30の構成および機能)
次に、端末30の構成および機能について、図4を用いて説明する。
図4は、端末30の概要構成の一例を示すブロック図である。
【0056】
図4に示すように、コンピュータとして機能する端末30は、例えば、パーソナルコンピュータやスマートフォンを含む携帯型無線電話機やPDA等の携帯端末であり、通信部31と、記憶部32と、表示部33と、操作部34と、入出力インターフェース部35と、システム制御部36とを備えている。そして、システム制御部36と入出力インターフェース部35とは、システムバス37を介して接続されている。
【0057】
通信部31は、ネットワーク3を通して、情報提供サーバ20等との通信を制御する。なお、端末30が携帯型端末装置の場合、ネットワーク3の移動体通信網に接続するために、通信部31は、無線通信機能を有する。
【0058】
記憶部32は、例えば、ハードディスクドライブ等からなり、オペレーティングシステム、ウェブブラウザのプログラムやウェブブラウザ用ツールバーのプログラム等を記憶する。
【0059】
表示部33は、例えば、液晶表示素子またはEL(Electro Luminescence)素子等によって構成されている。表示部33には、検索画面のウェブページや、情報提供サーバ20から提供された商品検索の結果のウェブページがウェブブラウザにより表示される。
【0060】
操作部34は、例えば、キーボードおよびマウス等によって構成されている。ユーザは、操作部34により応答を入力する。なお、表示部33がタッチパネルのようなタッチスイッチ方式の表示パネルの場合、操作部34は、ユーザが接触または近接した表示部33の位置情報を取得する。
【0061】
入出力インターフェース部35は、通信部31および記憶部32とシステム制御部36とのインターフェースである。
【0062】
システム制御部36は、例えば、CPU36aと、ROM36bと、RAM36cとを有する。システム制御部36は、CPU36aが、ROM36bや、RAM36cや、記憶部32に記憶された各種プログラムを読み出して実行する。例えば、システム制御部36は、ウェブブラウザのプログラムを実行しウェブブラウザとして機能する。
【0063】
[3.関連語登録システムの動作]
次に、本発明の1実施形態に係る関連語登録システム1の動作について図5から図11を用い説明する。
【0064】
図5、図7から図10は、端末30に表示されたウェブページの一例を示す模式図である。図6は、関連語登録サーバ10の動作例を示すフローチャートである。図11は、ユーザ操作の検出時と、検索クエリの取得時間との関係の一例を示す模式図である。
【0065】
(3.1 ユーザ操作の判定および検索クエリログの生成)
ユーザがショッピングサイトにログインして、商品の検索をしながら目的の商品を捜索し、当該捜索された商品を購入する手続きまでのユーザ行動において、ユーザ操作の判定および検索クエリログの生成について図5から図8を用いて説明する。
【0066】
まず、ユーザ(例えばユーザA)が、ユーザAの端末30で、ショッピングサイトにログインすると、図5に示すように、ショッピングサイトのトップページであるWebページ40の情報が情報提供サーバ20から、この端末30に送信される。そして、端末30の表示部33にWebページ40が表示される。このWebページ40には、ショッピングサイトのトップページであり、トップカテゴリ表示45が表示され、各商品カテゴリへのリンクが張られている。さらに、このショッピングサイトの関連グループ企業の商品やサービスのカテゴリ表示46が表示され、各商品カテゴリへのリンクが張られている。また、Webページ40には、ユーザAを示す情報“Aさん、こんにちは”が表示されている。
【0067】
次に、図5に示すように、Webページ40において、”家電”の商品カテゴリのリンクがクリックされ、端末30から情報提供サーバ20にリンク先のWebページの表示要求の信号が送信されたとする。なお、ショッピングサイトにログインしているユーザAのユーザIDと、表示されているWebページが属する商品カテゴリのカテゴリ情報も端末30から送信される。
【0068】
図6に示すように、関連語登録サーバ10は、ユーザ操作を検出する(ステップS1)。具体的には、関連語登録サーバ10のシステム制御部14は、端末30から情報提供サーバ20に対する要求や端末30から送信されるその他の信号を検出する。この要求の種類は、ユーザが入力した検索ワードの検索クエリや、詳細な商品の内容を示すリンク先のWebページの表示要求や、他のサービスへのWebページの表示要求や、商品購入手続きのWebページの表示要求や、商品購入確定の信号等である。これら要求等の内容が、情報提供サーバ20から関連語登録サーバ10に送信される。図5の場合は、関連語登録サーバ10のシステム制御部14は、ユーザ操作として”家電”の商品カテゴリのリンク先のWebページの表示要求を情報提供サーバ20から受信する。
【0069】
次に、関連語登録サーバ10は、検出したユーザ操作が検索か否かを判定する(ステップS2)。具体的には、関連語登録サーバ10のシステム制御部14は、端末30から情報提供サーバ20に対する要求が、検索クエリを含んでいるか否かを判定する。図5の場合は、リンク先のWebページの表示要求で検索要求ではないので(ステップS2;NO)、ステップS3に進む。
【0070】
検出したユーザ操作が検索で無い場合(ステップS2;NO)、関連語登録サーバ10は、検出したユーザ操作がユーザの商品に関する手続き(所定の操作の一例)か否かを判定する(ステップS3)。具体的には、関連語登録サーバ10のシステム制御部14は、検出したユーザ操作が、商品購入手続き確定(決済)か否かを判定する。なお、ユーザの商品に関する手続きとして、商品購入手続き確定(決済)の他に、商品予約登録、買い物カゴへの登録、お気に入り(ブックマーク)への登録などが挙げられる。なお、所定の操作として、検索の目的が達成されたことが分かる操作ならばよい。
【0071】
ユーザ操作がユーザの商品に関する手続きで無い場合(ステップS3;NO)、例えば、リンク先のWebページの表示要求等の場合、関連語登録サーバ10のシステム制御部14は、ステップS1に戻り、ユーザ操作の検出を待つ。図5の場合、リンク先のWebページの表示要求で商品購入手続き確定(決済)の信号では無いので、ステップS1に戻る。
【0072】
図5に示すように、Webページ40において、”家電”の商品カテゴリのリンクがクリックされると、図7に示すように、”家電”のWebページ50が表示部33に表示される。このWebページ50には、トップカテゴリ”家電”のカテゴリ表示55のサブカテゴリ表示56が表示される。
【0073】
次に、Webページ50の検索ワード記入欄51に、検索ワード”▼▼○”が入力され、検索ボタン52がクリックされると、端末30のシステム制御部36は、通信部31を通して、検索クエリを情報提供サーバ20に送信する。この検索クエリは、入力された検索ワードと、Webページ50のカテゴリ情報(トップカテゴリ”家電”のカテゴリ表示65を示すカテゴリ識別番号等)と、ユーザ識別情報の一例である(ユーザAの)ユーザID等を有する。
【0074】
次に、情報提供サーバ20は、この検索クエリを端末30から受信し、関連語登録サーバ10に送信すると共に、商品DB22aを参照して商品の検索を行う。また、この検索クエリの送信元のIPアドレスを特定し、このIPアドレスも関連語登録サーバ10に送信する。このIPアドレスは、ユーザ識別情報の一例であり、ユーザがログインしていない場合に、ユーザIDの代わりに使用される。IPアドレスでは、必ずしも完全にユーザを特定できないが、ある程度はユーザを区別できる。このIPアドレスは、ユーザA等の端末30から送信された検索クエリのヘッダ等から取得される。
【0075】
次に、関連語登録サーバ10は、検索ワードを含む検索クエリを情報提供サーバ20から受信し、ステップS1においてユーザ操作を検出し、ステップS2において検出したユーザ操作が検索か否かを判定する。図7の場合、端末30からの検索要求なので(ステップS2;YES)、図6に示すように、関連語登録サーバ10は、検索ワードを含む検索クエリを取得する(ステップS4)。具体的には、関連語登録サーバ10のシステム制御部14は、検索クエリを情報提供サーバ20から受信し、受信した検索クエリと検索クエリの受信時刻(取得時刻の一例)を対応付けて検索クエリログDB12aに記憶する。さらに、関連語登録サーバ10のシステム制御部14は、IPアドレスと対応付けて検索クエリを検索クエリログDB12aに記憶する。なお、関連語登録サーバ10のシステム制御部14は、検索クエリにIPアドレスを含ませてもよい。
【0076】
この受信時刻は、情報提供サーバ20が、端末30から検索クエリを受信した受信時刻や、関連語登録サーバ10が、この検索クエリを情報提供サーバ20から受信した受信時刻が挙げられる。端末から情報提供サーバ20が受信した時刻ならば、情報提供サーバ20は、検索クエリの受信時刻も関連語登録サーバ10に送信する。また、受信時刻は、検索クエリログDB12aに検索クエリが記憶されるときに付されるタイムスタンプでもよい。
【0077】
次に、関連語登録サーバ10は、ユーザIDおよび取得時刻と対応付けて検索クエリを記憶する(ステップS5)。具体的には、関連語登録サーバ10のシステム制御部14は、カテゴリ情報、ユーザID(IPアドレスでもよい)および受信時刻(取得時刻の一例)と対応付けて検索クエリを検索クエリログDB12aに記憶する。このように関連語登録サーバ10は、取得した検索クエリを、ユーザ識別情報、および、検索クエリの取得時刻に対応付けて記憶する検索クエリ記憶手段の一例として機能する。
【0078】
次に、関連語登録サーバ10は、ステップS3において検出したユーザ操作が所定の操作か否かを判定する。図7の場合、端末30からの検索要求なので(ステップS3;NO)、関連語登録サーバ10は、ステップS1に戻り、ユーザ操作の検出を待つ。
【0079】
一方、情報提供サーバ20が商品の検索を行った後、検索結果として、図8に示すように、Webページ60の情報を、端末30に送信する。端末30は、Webページ60の情報を情報提供サーバ20から受信し、表示部33に表示させる。
【0080】
ユーザAは、Webページ60の検索結果を見て、目的の商品がある場合は、商品表示欄63の商品をクリックするが、目的の商品がない場合は、さらに検索ワードを検索ワード入力欄61に入力し、検索ボタン62をクリックすると、端末30は、上述のように、検索ワード“▲▲ O■”とカテゴリ情報(”家電”)を含む検索クエリを情報提供サーバ20に送信する。そして、情報提供サーバ20は、この検索クエリを受信して、関連語登録サーバ10に送信し、検索を行う。関連語登録サーバ10は、上述のように、検索クエリを受信し(ステップS4)、カテゴリ情報、ユーザID等および受信時刻と対応付けて、次の検索クエリを検索クエリログDB12aに記憶する(ステップS5)。
【0081】
ユーザAは目的の商品が見つかるまで、検索を続け、関連語登録サーバ10はその都度、ステップS4からステップS5のように、検索クエリを検索クエリログDB12aに記憶する。
【0082】
(3.2 関連語の登録)
次に、関連語の登録について、図7および図9〜図11を用いて説明する。
【0083】
ユーザAが、検索を行って目的の商品を見つけ、図9に示すように、端末30の表示部33において、商品に関する詳細な情報がWebページ70に表示される。そして、購入手続きに進むためのボタン(図示せず)がクリックされ、情報提供サーバ20は、商品に関する手続き処理を開始し、図10に示すように、購入手続きの確定を確認するWebページ80の情報を端末30に送信し、Webページ80が端末30の表示部33に表示される。
【0084】
そして、購入手続きの確定のボタン81がクリックされ、商品購入確定の信号が端末30から情報提供サーバ20に送信される。そして、情報提供サーバ20から関連語登録サーバ10に商品購入確定の信号が送信される。なお、ショッピングサイトにログインしているユーザAのユーザIDと、購入した商品のカテゴリ情報も端末30から送信される。
【0085】
次に、関連語登録サーバ10は、ステップS1において、ユーザ操作を検出し、所定の操作の一例である商品購入確定の信号であるので(ステップS3;YES)、次のステップS6に進む。
【0086】
図7に示すように、関連語登録サーバ10は、ユーザ操作の操作対象のWebページに含まれる特徴ワードを抽出する(ステップS6)。具体的には、関連語登録サーバ10のシステム制御部14は、Webページ80購入手続きの確定のボタン81のクリックのようなユーザ操作の操作対象のWebページ70から特徴ワードを抽出し取得する。なお、特徴ワードを抽出の詳細は、特徴ワードのサブルーチンにおいて後述する。このように関連語登録サーバ10は、所定のユーザ操作を検出した場合に、ユーザ操作の操作対象のWebページに含まれる特徴ワードを取得する特徴ワード取得手段の一例として機能する。
【0087】
図7に示すように、関連語登録サーバ10は、ユーザ操作の前に取得した検索クエリのうち、ユーザIDに一致する検索クエリを抽出する(ステップS7)。具体的には、関連語登録サーバ10のシステム制御部14は、商品購入確定の信号の受信の際に取得したユーザIDに一致する検索クエリを、検索クエリログDB12aから抽出する。例えば、図11に示すように、関連語登録サーバ10のシステム制御部14は、検索クエリ群90を抽出する。図11では、検索クエリ群90は、検索クエリQa〜Qgまで、受信時刻順に示されている。また、検索クエリ91は、目的の検索対象にヒットした検索クエリである。
【0088】
なお、ユーザがログイン等していなくて、検索クエリのユーザIDが分からないときは、関連語登録サーバ10のシステム制御部14は、ユーザ識別情報の一例としてIPアドレスが一致する検索クエリを、検索クエリログDB12aから抽出する。
【0089】
このように関連語登録サーバ10は、ユーザ操作を行ったユーザのユーザ識別情報に対応する検索クエリを抽出する検索クエリ抽出手段の一例として機能する。
【0090】
次に、関連語登録サーバ10は、抽出した検索クエリのうち、取得時刻が一番早い検索クエリを検索クエリとして特定する(ステップS8)。具体的には、図11に示すように、関連語登録サーバ10のシステム制御部14は、検索クエリ群90の中から、取得時間の一例の受信時刻が一番早い検索クエリ93(候補検索クエリ)を特定する。
【0091】
このように関連語登録サーバ10は、抽出した検索クエリから、取得時刻に基づき候補検索クエリを特定する候補検索クエリ特定手段の一例として機能する。
【0092】
次に、関連語登録サーバ10は、抽出した特徴ワードを、特定した検索クエリに含まれる検索ワードの関連語として登録する(ステップS9)。具体的には、関連語登録サーバ10のシステム制御部14は、抽出した特徴ワードと、検索クエリ93に含まれる検索ワードとを、関連語として関連語DB12cに登録する。このように関連語登録サーバ10は、取得した特徴ワードと、特定された検索クエリの検索ワードとを、関連語DB12cに関連語として登録する関連語登録手段の一例として機能する。
【0093】
(3.3 特徴ワードの抽出)
次に特徴ワードのサブルーチンについて、図9、図12〜図14を用いて説明する。
【0094】
図12は、HTML文書から生成されたDOMツリーの一例を示す模式図である。図13は、特徴ワード用データベースに記録されるコンテンツ情報の内容の一例を示す模式図である。図15は、特徴ワード抽出のサブルーチンを示すフローチャートである。
【0095】
このサブルーチンでは、関連語登録サーバ10は、Webページ70等からHTMLファイルを取得して解析し、Web素材(テキストデータおよび画像データ等)であるコンテンツをコンテンツブロック単位で抽出し、複数のWebページを構成している各コンテンツブロックの出現頻度を計算し、出現頻度が最も小さい又は出現頻度が所定値(例えば5回)以下のコンテンツを当該Webページに特有なコンテンツブロックとして特定し、当該特定されたコンテンツに対して形態素解析して特徴ワードを抽出する。なお、関連語登録サーバ10は、出現頻度の算出対象のコンテンツブロックの数量に基づいて出現頻度の所定値を決定してもよい。
【0096】
具体的には、予め、情報提供サーバ20から商品DB22aに記憶されているHTML文書を取得して解析し、Web素材であるコンテンツをコンテンツブロック単位で抽出する。そして、その抽出結果として、抽出したコンテンツブロック毎にコンテンツブロック対応情報(コンテンツ情報の一例)を特徴ワード用DB12bに記憶する。基本的には、商品DB22aに記憶に登録されている商品に関する全HTML文書、すなわち、ショッピングサイトを構成する全ての商品説明ページについてコンテンツブロックの抽出が予め行われる。
【0097】
このコンテンツブロック対応情報を参照して、対象Webページのコンテンツブロックの出現頻度が算出され、特有なコンテンツブロックが特定される。
【0098】
ここで、コンテンツブロック、および、コンテンツブロック対応情報について図9、図12、および、図13を用いて説明する。
【0099】
図9に示すように、例えば、商品説明ページやブログページのようなWebページ70上において、Web素材としての各コンテンツは、それぞれ或るまとまり(かたまり)毎に表示されている。その各まとまりがコンテンツブロックに相当する。各コンテンツは、HTMLファイルに記述されているDIVタグおよびTABLEタグ(予め定められたタグの一例)により夫々コンテンツブロックに分けられる。つまり、各コンテンツは、DIVタグおよびTABLEタグ(以下、「ブロック化タグ」という)によりブロック化(グループ化)される。
【0100】
図9には、コンテンツブロック71〜76が表示されている。コンテンツブロック71は、例えば、ページのヘッダ部分のコンテンツブロックであり、テキストAおよび画像aにより構成されている。
【0101】
また、コンテンツブロック72は、例えば、各種カテゴリの商品に関するWebページに移動するためのナビゲーション部分のコンテンツブロックであり、例えば、他のWebページへのリンクを示すテキストB、テキストCおよびテキストDにより構成されている。
【0102】
また、コンテンツブロック73は、例えば、商品説明の表示領域に対応するコンテンツブロックであり、見出しを示すテキストE、コンテンツブロック74およびコンテンツブロック75により構成されている。このように、コンテンツブロックが入れ子状、つまり、階層構造になっている場合もある。この場合、コンテンツブロック73に含まれるコンテンツはテキストEのみとされ、コンテンツブロック74およびコンテンツブロック75は、コンテンツブロック73から独立しているものとされる。コンテンツブロック74および75は、夫々1件の商品の説明文である。コンテンツブロック74には、商品の説明文の表題や本文を示すテキストFおよびGにより構成されている。コンテンツブロック75には、商品の説明文の表題や本文を示すテキストH、IおよびJと、商品画像bおよびcとにより構成されている。コンテンツブロック76は、例えば、コピーライト表示等を示すコンテンツブロックであり、テキストIにより構成されている。
【0103】
これらのコンテンツブロックのうち、コンテンツブロック71、72、73および76は、図9に示すWebページ70以外のWebページ上でも比較的頻繁に現れる。一方、コンテンツブロック74およびコンテンツブロック75は、基本的にWebページ70にだけに用いられる。よって、コンテンツブロック74又はコンテンツブロック75が、Webページ70に特有のコンテンツブロックであると判断されることとなる。
【0104】
図9のWebページ70のHTML文書をDOM(Document Object Model)ツリー、すなわち、木構造で表したものが図12である。
【0105】
このDOMツリーにおいては、DIVタグを示すDIVノードおよびTABLEタグを示すTABLEノードが、各コンテンツをコンテンツブロックにブロック化するノードとされる(以下、「ブロック化ノード」という)。
【0106】
システム制御部14は、例えば、深さ優先探索によりDOMツリーを探索し、コンテンツブロックを確定していく。具体的に、システム制御部14は、ブロック化ノードを発見すると、当該ノードを頂点とする部分木の各ノードに規定されているコンテンツを一まとめにしてコンテンツブロックとする。
【0107】
ただし、コンテンツブロックが階層的に規定された結果、或るブロック化ノード(以下、「上位のブロック化ノード」という)を発見した後、当該ブロック化ノードの子孫のノードの中からさらにブロック化ノード(以下、「下位のブロック化ノード」という)を発見すると、コンテンツブロックが分割される。例えば、ルートノードからの距離が近いノードほど階層的により上位のノードであるとすると、上位のブロック化ノードを頂点とする部分木(以下、「上位部分木」という)に相当するコンテンツブロックを、下位のブロック化ノードを頂点とする部分木(以下、「下位部分木」という)に相当するコンテンツブロックと、上位部分木のうち下位部分木を除く部分に相当するコンテンツブロックとに分ける(例えば、コンテンツブロック74とコンテンツブロック73)。この場合においては、前者のコンテンツブロックを、後者のコンテンツブロックよりも階層的に下位にあるものとする。例えば、コンテンツブロック71、72、73および76の階層は1であり、コンテンツブロック74および75の階層は2である。つまり、階層の値が小さいほど階層的により上位となる。
【0108】
関連語登録サーバ10は、コンテンツブロックを抽出すると、抽出結果を示すコンテンツブロック対応情報を特徴ワード用DB12bに記憶する。図13に示すように、コンテンツブロック対応情報121は、コンテンツブロック毎に登録される。コンテンツブロック対応情報には、抽出元のHTML文書のURL設定部分122とブロック構成情報123とにより構成されている。ブロック構成情報には、抽出された各コンテンツが設定される。ここで、テキストデータについては、DOMツリーにおけるテキストノードの内容が設定される。一方、画像データについては、画像データそのものの代わりとして、DOMツリーにおいてIMGタグを示すIMGノードのsrc属性としての画像データのURLが設定される。
【0109】
次に、特徴ワードのサブルーチンの動作について図14を用いて説明する。
【0110】
図14に示すように、特徴ワードのサブルーチンが呼び出されると関連語登録サーバ10は、例えば、Webページ70のHTMLファイルを取得し、コンテンツブロックを抽出する(ステップS11)。具体的には、関連語登録サーバ10のシステム制御部14は、図12に示すように、Webページ70のHTMLファイル(HTML文書)のDOMツリーを生成する。そして、関連語登録サーバ10のシステム制御部14は、ブロック化ノードの種類や、ツリー構造における階層に基づき、DOMツリーを探索(ツリー探索処理)してコンテンツブロックを抽出する。
【0111】
次に、関連語登録サーバ10は、特徴ワード用DB12bを参照して、抽出した各コンテンツブロックの全商品詳細ページにおける出現頻度を計算する(ステップS12)。具体的には、関連語登録サーバ10のシステム制御部14は、ツリー探索処理において生成されたコンテンツブロックのブロック構成情報と、特徴ワード用DB12bに記憶されている各コンテンツブロック対応情報121のブロック構成情報123とを比較する。
【0112】
このとき、システム制御部14は、ブロック構成情報の内容が一致する場合には、出現回数1回としてカウントする。なお、システム制御部14は、ブロック構成情報中におけるコンテンツの規定順は無視してかまわない。
【0113】
さらに、システム制御部14は、ブロック構成情報中に規定されているテキストデータ同士を比較する場合には、テキストデータが示す文章等そのものが一致するか否かを判定するのではなく、その文章等により表現されている実質的な内容を比較してもよい。例えば、システム制御部14は、夫々のテキストデータの形態素解析等を行うことによりテキストデータから単語を抽出し、抽出した単語同士を比較してもよい。そして、システム制御部14は、全ての単語が一致した場合にテキストデータ同士が一致したと判断してもよいし、所定の割合以上で単語が一致した場合にテキストデータ同士が一致したと判断してもよい。
【0114】
システム制御部14は、このようにしてコンテンツブロックのブロック構成情報と、特徴ワード用DB12bに記憶されている全てのコンテンツブロック対応情報のブロック構成情報とを比較して、出現頻度を計算する。なお、計算される出現頻度としては、出現回数(度数)であってもよいし、全商品詳細ページの全コンテンツブロックに対する出現回数の割合(相対度数)であってもよい。
【0115】
次に、関連語登録サーバ10は、出現頻度に基づき、特有のコンテンツブロックの判定を行う(ステップS13)。具体的には、関連語登録サーバ10のシステム制御部14は、出現頻度の最も小さいコンテンツブロックを、特有のコンテンツブロックであると判定する。
【0116】
次に、関連語登録サーバ10のシステム制御部14は、特有のコンテンツブロックから特徴ワードを抽出する(ステップS14)。具体的には、関連語登録サーバ10のシステム制御部14は、特有のコンテンツブロックから、形態素解析して、出現頻度が高い単語を特徴ワードとして抽出する。
【0117】
このように関連語登録サーバ10は、Webページを形態素解析して特徴ワードを取得する特徴ワード取得手段の一例として機能する。また、関連語登録サーバ10は、Webページを構成している各コンテンツの出現頻度を計算し、出現頻度に基づいてコンテンツを特定し、当該特定されたコンテンツに対して形態素解析して特徴ワードを取得する特徴ワード取得手段の一例として機能する。
【0118】
以上、本実施形態によれば、ユーザが入力した検索ワードを含む検索クエリを取得し、取得した検索クエリを、ユーザ識別情報、および、検索クエリの取得時刻に対応付けて記憶し、所定のユーザ操作を検出した場合に、ユーザ操作の操作対象のWebページに含まれる特徴ワードを取得し、ユーザ操作を行ったユーザのユーザ識別情報に対応する検索クエリ(検索クエリ群90)を抽出し、抽出した検索クエリから、取得時刻に基づき検索クエリ93を特定し、抽出した特徴ワードと、特定された検索クエリの検索ワードとを、関連語DB12cに関連語として登録することにより、所定のユーザの操作を契機に、ユーザ操作と関連が深い特徴ワードと、ユーザの操作と時間的に関連して、ユーザ識別情報に対応する検索クエリの検索ワードとを関連ワードとして登録しているため、ユーザの関連性を担保しつつ、ユーザが目的とする検索対象にたどり着けたときのユーザの操作に対応した特徴ワード(完成された検索クエリの結果から取得した特徴ワード)と、検索結果に至る過程の途中である未完成の検索クエリに含まれる検索ワードとを精度の高い関連語として登録できる。
【0119】
なお、特徴ワードは、完成された検索クエリ91の検索ワードとは、関連が深い。ここで、完成された検索クエリは、ユーザが目的とする検索対象にたどり着けたときの検索クエリである。検索クエリ群90において、完成された検索クエリ91以外は、未完成な検索クエリであり、この検索クエリでは、ユーザが目的とする検索対象にたどり着けない検索クエリである。
【0120】
また、関連語に基づき、ユーザに検索ワードを提示すると、ユーザが目標とする検索対象に早くたどり着くことができる。
【0121】
また、Webページを形態素解析して特徴ワードを取得する場合、Webページに関連した特有な特徴ワードを精度よく抽出ができるので、精度が高い特徴ワードと検索ワードとを、精度の高い関連語として登録できる。
【0122】
また、指定されたWebページを構成しているコンテンツを抽出し、指定されたWebページ70を構成している各コンテンツの出現頻度を計算し、指定されたWebページを構成しているコンテンツのうち、出現頻度が最も小さい又は出現頻度が所定値(例えば、5回)以下のコンテンツをWebページ70に特有のコンテンツであると判定する場合や、出現頻度の算出対象のコンテンツブロックの数量に基づいて出現頻度の所定値を決定して特有のコンテンツであると判定する場合、出現頻度が小さいコンテンツであるほど、指定されたWebページ70以外にはあまり出現しないコンテンツであるので、最も出現頻度が小さい又は所定値以下のコンテンツを判断することで、指定されたWebページ70に特有のコンテンツが精度よく特定される。よって、Webページ70に特有のコンテンツを容易に抽出することができる。
【0123】
そして、この特有のコンテンツに対して形態素解析して特徴ワードを取得する場合も、Webページに関連した特有な特徴ワードを精度よく抽出ができるので、精度が高い特徴ワードと検索ワードとを、精度の高い関連語として登録できる。
【0124】
また、関連語登録サーバ10が、所定のユーザ操作として、当該ユーザの商品に関する決済手続きを検出した場合に、ユーザIDやIPアドレス等のユーザ識別情報に対応する検索クエリを抽出し、当該抽出した検索クエリから第1の検索クエリと、第2のクエリを特定して関連語として登録することによって、買い物カゴへのバスケット登録や、ブックマーク登録などを検索クエリ抽出処理の契機とする場合に比べて、当該決済に至った検索結果に対応する検索クエリがより精度の高い完成クエリであるため、検索クエリ抽出処理の開始条件を適切に設定できるので、最終的な結果として登録する関連語の精度を向上できる。
【0125】
次に、関連語登録システム1の動作の変形例について、図15および図16を用いて説明する。なお、ステップS21〜ステップS26、ステップS29は、ステップS1〜ステップS6、ステップS9にそれぞれ対応するので、説明を省略する。また、前記実施形態と同一または対応する部分には、同一の符号を用いて異なる構成および作用のみを説明する。その他の変形例も同様とする。
【0126】
図15に示すように、特徴ワードが抽出された後、関連語登録サーバ10は、ユーザ操作の前に取得した検索クエリのうち、ユーザIDに一致し、かつ、取得時刻が一番遅い検索クエリまでの各検索クエリ間の取得時刻間隔が所定時間内の検索クエリを抽出する(ステップS27)。具体的には、関連語登録サーバ10のシステム制御部14は、商品購入確定の信号の受信の際に取得したユーザIDに一致し、かつ、図16に示すように、互いの受信時刻(取得時刻)間隔が第2の所定時間内の一例として、取得時刻が一番遅い検索クエリ91(Qa)までの各検索クエリの内、一つ前の検索クエリとの取得時刻間隔が所定時間T2内(取得時刻に基づく連続性の一例)の検索クエリ92(Qb、Qc)を、検索クエリログDB12aから抽出する。これは、受信時刻(取得時刻)に基づく連続性の一例であり、第1の検索クエリ91(Qa)から、検索クエリの受信時刻順に連番になっている候補検索クエリ92(Qb、Qc)である。なお、関連語登録サーバ10のシステム制御部14は、受信時刻(取得時刻)に基づく連続性の一例として、互いの受信時刻間隔が所定時間T2内(取得時刻に基づく連続性の一例)の候補検索クエリ92(Qb、Qc、Qe、Qg)を抽出してもよい。
【0127】
次に、関連語登録サーバ10は、抽出した検索クエリのうち、取得時刻が一番早い検索クエリを検索クエリとして特定する(ステップS28)。具体的には、図16に示すように、関連語登録サーバ10のシステム制御部14は、検索クエリ92群の中から、取得時間の一例の受信時刻が一番早い検索クエリ93を特定する。
【0128】
次に、関連語登録サーバ10は、ステップS9のように、抽出した特徴ワードを、特定した検索クエリの関連語として登録する(ステップS29)。
【0129】
以上、本実施形態の変形例によれば、ユーザが入力した検索ワードを含む検索クエリを取得し、取得した検索クエリを、ユーザ識別情報、および、検索クエリの取得時刻に対応付けて記憶し、所定のユーザ操作を検出した場合に、操作対象のWebページに含まれる特徴ワードを取得し、取得した検索クエリからユーザ操作を行ったユーザのユーザ識別情報に対応する検索クエリを抽出し、取得した特徴ワードと、抽出された検索クエリに含まれる検索ワードとを、関連語として関連語DB12cに登録することにより、所定のユーザの操作を契機に、ユーザ操作と関連が深い特徴ワードと、ユーザ識別情報に対応する検索クエリの検索ワードを関連ワードとして登録しているため、ユーザの関連性を担保しつつ、ユーザの操作に対応した特徴ワードと、検索クエリの検索ワードとを精度の高い関連語として登録できる。
【0130】
また、関連語登録サーバ10が、抽出した検索クエリから、所定のユーザ操作を検出した操作時刻より取得時刻が前であり、かつ、取得時刻に基づく連続性がある検索クエリを特定または抽出する場合、特徴ワードの関連ワードとして登録する対象となる検索ワードを含む検索クエリを取得時刻に基づく連続性がある検索クエリに絞ることができ、検索クエリを特定または抽出する精度を向上させて関連語の精度を向上させることができる。
【0131】
また、関連語登録サーバ10が、取得時刻に基づく連続性がある検索クエリとして、互いの取得時刻の間隔が第2の所定時間T2内の検索クエリを特定または抽出する場合、取得時刻に基づく連続性として、互いの取得時刻の間隔が第2の所定時間T2内を容易に抽出でき、取得時刻に基づく連続性がある検索クエリに絞ることができるため、検索クエリを特定または抽出する精度を向上させて関連語の精度を向上させることができる。
【0132】
また、関連語登録サーバ10が、取得時刻が最も遅い検索クエリの取得時刻より取得時刻が前であり、かつ、取得時刻に基づく連続性がある検索クエリを特定または抽出する場合、取得時刻に基づく連続性がある検索クエリに絞ることができ、検索クエリを特定または抽出する精度を向上させて関連語の精度を向上させることができる。
【0133】
なお、関連語登録サーバ10が、抽出された検索クエリのうち、取得時刻が最も遅い検索クエリ(例えば検索クエリ91)を除いて、検索クエリを特定または抽出してもよい。この場合、関連語として利用される検索ワードの精度を向上させて、関連語の精度を向上させることができる。
【0134】
さらになお、関連語登録サーバ10は、図17に示すように、取得時刻に基づく連続性がある検索クエリとして、取得時刻が検索クエリ91の取得時刻から第1の所定時間T1内(取得時刻に基づく連続性の一例)の検索クエリ92、93を特定してもよい。また、関連語登録サーバ10は、取得時刻に基づく連続性がある検索クエリとして、検索クエリ記憶手段により記憶された検索クエリにおいて、取得時刻が最も遅い検索クエリ91の取得時刻から第1の所定時間T1内に取得した検索クエリ92、93を抽出してもよい。
【0135】
これらの場合、所定のユーザ操作の検出時刻に最も近い検索クエリ91の取得時刻から所定時間内に存在する検索クエリを検索クエリ92、93として特定するので、所定のユーザ操作との関連性が高くなり、検索クエリを特定または抽出する精度が向上し、関連語の精度を向上させることができる。
【0136】
また、関連語登録サーバ10が、第1の所定時間T1または第2の所定時間T2(取得時刻に基づく連続性の一例)を設定する場合、例えば、所定のユーザ操作の種類に合わせて、第1の所定時間T1または第2の所定時間T2を変動させることができるので、所定のユーザ操作の種類に応じた精度の高い検索クエリを特定または抽出することができ、関連語の精度を向上させることができる。さらに、図18に示すように、第1の所定時間T1および第2の所定時間T2を設定する場合、第1の所定時間T1および第2の所定時間T2の設定に応じた検索クエリ92を高精度に抽出することができ、関連語の精度を向上させることができる。
【0137】
また、関連語登録サーバ10が、関連語登録手段により登録された関連語の登録数に基づき、第1の所定時間T1または第2の所定時間T2を設定してもよい。例えば、関連語DB12cに登録された関連語が増加して、関連語を増加させる必要がない場合、所定時間T1、T2を短くして、第1の検索クエリに取得時間が近い検索クエリ92が減少し、新たに登録される関連語の件数を減少させることができる。さらに、取得時間が近いので時間的な関連性が強まり、関連語の精度も向上させることができる。また、関連語DB12cの初期状態や、関連語の登録数が少ない場合、所定時間T1、T2を長くして、登録数を増加させ、関連語DB12cを充実させることができる。
【0138】
また、関連語登録サーバ10が、商品DB22a等における検索において、検索クエリと共にカテゴリ情報も取得し、カテゴリ情報が一致し、検索クエリ91より取得時刻が前であり、かつ、取得時刻に基づく連続性がある検索クエリ92、93を特徴ワードの関連ワードとして登録する対象となる検索ワードを含む検索クエリとして特定してもよい。例えば、図19に示すように、関連語登録サーバ10が、検索クエリを検索クエリログDB12aに記憶する際、カテゴリ情報(カテゴリC1、C2)等と共に検索クエリを記憶する。そして、関連語登録サーバ10が、第1の検索クエリ91のカテゴリC1と一致し、検索クエリ91より取得時刻が前であり、かつ、取得時刻に基づく連続性(例えば第1の所定時間T1内にある場合)がある検索クエリ92を特徴ワードの関連ワードとして登録する対象となる検索ワードを含む検索クエリとして特定または抽出する。
【0139】
カテゴリ情報が一致する検索クエリに絞ることにより、検索クエリを高精度に特定または抽出しているので、関連語の精度を向上させることができる。なお、関連語登録サーバ10は、カテゴリ情報が一致し、ユーザの識別情報に対応し、かつ、取得時刻に基づく連続性がある検索クエリを抽出してもよい。
【0140】
また、関連語登録サーバ10が、検索クエリ91の取得時刻より前であり、かつ、取得時刻に基づく連続性がある検索クエリであって、検索結果数が所定値以下である検索クエリ92を特定してもよい。例えば、図19に示すように、検索件数が0件である検索クエリ92を特定する。なお、検索件数が0件である場合は、タイプミスや勘違いの検索ワードを入力した場合や複数の検索ワードをand条件で含んでいる検索クエリなどが挙げられる。前記検索クエリは、未完成な検索クエリであると考えることができ、この未完成の検索クエリと、完成した検索クエリと関連が深い特徴ワードが関連語として登録できるので、ユーザが目標とする検索対象に早くたどり着きやすい関連語の精度を向上させることができる。
【0141】
なお、この場合、検索クエリに基づき情報提供サーバ20が検索を行った場合の検索結果の件数を、関連語登録サーバ10は情報提供サーバ20から取得して、検索クエリログDB12aに検索クエリと共に記憶する。さらに、関連語登録サーバ10は、ユーザの識別情報に対応し、かつ、取得時刻に基づく連続性がある検索クエリであって、検索結果数が所定値以下である検索クエリを抽出してもよい。
【0142】
さらにまた、関連語登録サーバ10が、所定のユーザ操作から操作時間を算出し、当該操作時間に基づき、第1の所定時間T1または第2の所定時間T2を設定してもよい。動画の再生時間や、動画の一時停止し検索を始める場合、Webページの閲覧時間や検索時間等のユーザの操作パターンに合わせて、所定時間T1または第2の所定時間T2を設定でき、設定された所定時間T1または第2の所定時間T2に応じて、検索クエリを特定または抽出できるので、関連語の精度を向上させることができる。
【0143】
また、関連語登録サーバ10が、所定のユーザ操作として動画の再生情報を検出し、当該再生情報に基づき、動画の再生時間や再生回数又は動画再生時間経過後の操作開始までの経過時間等の動画再生特性値を算出し、動画再生特性値が閾値以上の場合に、ユーザ識別情報に対応する検索クエリを抽出してもよい。例えば、再生時間が長い動画や再生回数が多い動画は、ユーザが求めていた動画やユーザが飽きていない動画であることが多く、ユーザの目的に近い検索対象にたどり着けた場合と言えるので、検索クエリは精度の高い、より完成された検索クエリとなり、この完成された検索クエリと関連が深い特徴ワードを関連語として登録できるので、関連語の精度を向上させることができる。
【0144】
また、関連語登録サーバ10が、検索クエリに基づく検索結果に含まれるリンク情報の内、前記所定のユーザ操作によりクリックされたリンク情報の数が、所定数以上の場合に、ユーザ識別情報に対応する検索クエリを抽出してもよい。例えば、検索結果であるWebページにおいて、当該Webページに含まれるリンク情報の内、クリックされたリンク数が所定数以上の場合に、前記検索結果はユーザの関心がある情報を多く含んでいるため、(クリックされたリンク情報数が所定数未満の検索結果に対応する検索クエリに対して)前記検索結果に対応する検索クエリはよりユーザの意図にあった検索クエリであるので、検索クエリ91の精度がより向上し、この完成された検索クエリと関連が深い特徴ワードの精度も向上して、関連語の精度を向上させることができる。なお、関連語登録サーバ10は、ユーザID毎や、IPアドレスに対応するドメイン毎に、クリックされたリンク情報の数を集計する。
【0145】
また、ステップS6において、特徴ワードを抽出するユーザ操作の操作対象のWebページとして、検索クエリ91による検索結果のWebページでもよい。
【0146】
なお、本実施形態の以上の処理は、端末30で行ってもよい。端末30において、関連語が生成され、所定数の関連語が端末に蓄積したら、関連語登録サーバ10に送信する。なお、検索クエリログや、関連語データベースは、記憶部32に構築される。また、関連語登録用プログラムは、情報提供サーバ20等から提供されるウェブブラウザのプラグイン(例えばツールバー等)の中に組み込まれるように構成しても良い。また、ユーザの端末30で処理が行われるため、検索クエリの抽出等においてユーザIDの照合は不要である。また、特徴ワードは関連語登録サーバ10から取得する。
【0147】
具体的には、端末30のシステム制御部36は、ステップS1において、操作部34からユーザの操作を検出し、ステップS2において、検出したユーザ操作が検索か否かを判定する。例えば、図7において、Webページ50の検索ボタン52がクリックされた場合、端末30のシステム制御部36は、ステップS4において、検索ワード記入欄51に入力されている検索ワードを検索クエリログ構築用に取得する。
【0148】
次に、端末30のシステム制御部36は、ステップS5において、取得時刻に対応付けて検索クエリを記憶部12に記憶する。
【0149】
端末30のシステム制御部36が、ステップS3において、操作部34から所定のユーザ操作を検出すると、ステップS6において、特徴ワードを関連語登録サーバ10から取得するための信号をまず送信する。具体的には、端末30のシステム制御部36、検索クエリ91を特定してから、検索クエリ91の検索結果に対応したWebページ70のURL等と共に、関連語登録サーバ10に送信する。
【0150】
そして、端末30のシステム制御部36は、関連語登録サーバ10から特徴ワードを取得する。
【0151】
次に、端末30のシステム制御部36は、ステップS7において、検索クエリを抽出し、ステップS8において、検索クエリを特定する。
【0152】
次に、端末30のシステム制御部36は、ステップS8において、抽出した検索クエリのうち、第1の検索クエリまでの各検索クエリ間の取得時刻間隔が所定時間内の候補検索クエリを抽出する。
【0153】
次に、端末30のシステム制御部36は、ステップS9において、抽出した特徴ワードと、特定した検索クエリとを関連語として記憶部32やRAM36cに記憶する。
【0154】
次に、端末30のシステム制御部36は、関連語の登録数が、所定の閾値以上を超えた場合や、所定の時刻又は関連語登録サーバ10に関連語を送信してから所定の時間が経過した場合等に、関連語を関連語登録サーバ10に送信する。また、端末30のシステム制御部36は、関連語が生成される度に、関連語登録サーバ10に関連語を送信してもよい。このように端末30は、取得した特徴ワードと、特定された検索クエリの検索ワードとを、登録用の関連語として関連語登録装置に送信する関連語送信手段の一例として機能する。
【0155】
なお、ショッピングサイトは、ネットワーク3に接続した外部ECサイトでもよく、情報提供サーバ20は、商品検索に限らず、一般の検索サーバでもよい。
【0156】
さらに、本発明は、上記各実施形態に限定されるものではない。上記各実施形態は、例示であり、本発明の特許請求の範囲に記載された技術的思想と実質的に同一な構成を有し、同様な作用効果を奏するものは、いかなるものであっても本発明の技術的範囲に包含される。
【符号の説明】
【0157】
1:関連語登録システム
10:関連語登録サーバ(関連語登録装置)
12a:検索クエリログDB
12b:特徴ワード用DB
12c:関連語DB
20:情報提供サーバ
22a:商品DB
30:端末(関連語登録装置)
32:記憶部
【技術分野】
【0001】
本発明は、検索キーワードを関連語として登録する関連語登録装置、関連語登録方法、関連語登録装置用プログラム、記録媒体、および、関連語登録システムの技術分野に関する。
【背景技術】
【0002】
同義語辞書のように関連性の高い単語を集めた単語のデータベースは、情報検索システムや、自然言語処理システムや、機械翻訳システム等において、検索キーワードの補完や、翻訳等の精度を高めるために利用されている。この関連性の高い単語を自動的に生成し、検索等に利用する装置が様々研究されている。例えば、特許文献1には、入力キーワードの文字列を取得し、キーワードを含むコメントを取り出し、形態素解析処理して単語の中から名詞だけを抽出し、日本語文章を単語毎に分割して品詞と共に取り出し、取り出した単語を使用回数の多い順に整理する単語ヒストグラムを作成し、使用回数の多い単語を関連キーワードとして確保し、この関連キーワードに基づき、再度コメントを検索するキーワード検索装置が開示されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2001−290840号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、特許文献1に記載の技術では、検索キーワードと、検索結果のページのコメントにおける使用回数の多い特徴ワードとを関連語として記憶しているため、当該検索結果に至る過程の途中で入力されている検索キーワード(未完成な検索キーワード)を考慮できなかった。従って、この関連語を使用しても、ユーザが目標とする検索対象に早くたどり着けず、ユーザが検索行動を断念する場合もあり、必ずしも関連語としての精度が高いとは言えなかった。
【0005】
本発明は、このような問題に鑑みてなされたものであり、その課題の一例は、精度の高い関連語を登録できる関連語登録装置等を提供することを目的とする。
【課題を解決するための手段】
【0006】
上記課題を解決するために、請求項1に記載の発明は、ユーザが入力した検索ワードを含む検索クエリを取得する検索クエリ取得手段と、前記取得した検索クエリを、ユーザ識別情報、および、前記検索クエリの取得時刻に対応付けて記憶する検索クエリ記憶手段と、所定のユーザ操作を検出した場合に、前記ユーザ操作の操作対象のWebページに含まれる特徴ワードを取得する特徴ワード取得手段と、前記ユーザ操作を行ったユーザのユーザ識別情報に対応する検索クエリを抽出する検索クエリ抽出手段と、前記抽出した検索クエリから、前記取得時刻に基づき候補検索クエリを特定する候補検索クエリ特定手段と、前記取得した特徴ワードと、前記特定された候補検索クエリに含まれる検索ワードとを、関連語データベースに関連語として登録する関連語登録手段と、を備える。
【0007】
請求項2に記載の発明は、請求項1に記載の関連語登録装置において、前記候補検索クエリ特定手段が、前記抽出された検索クエリのうち、前記取得時刻が最も遅い検索クエリを除いた検索クエリを、前記候補検索クエリとして特定することを特徴とする。
【0008】
請求項3に記載の発明は、請求項1または請求項2に記載の関連語登録装置において、前記候補検索クエリ特定手段が、前記抽出した検索クエリから、前記所定のユーザ操作を検出した操作時刻より取得時刻が前であり、かつ、前記取得時刻に基づく連続性がある検索クエリを前記候補検索クエリとして特定することを特徴とする。
【0009】
請求項4に記載の発明は、請求項2または請求項3に記載の関連語登録装置において、前記候補検索クエリ特定手段が、前記操作時刻から第1の所定時間内の検索クエリを候補検索クエリとして特定することを特徴とする。
【0010】
請求項5に記載の発明は、請求項2から請求項4のいずれか1項に記載の関連語登録装置において、前記候補検索クエリ特定手段が、互いの取得時刻の間隔が第2の所定時間内の検索クエリを候補検索クエリとして特定することを特徴とする。
【0011】
請求項6に記載の発明は、請求項2から請求項5のいずれか1項に記載の関連語登録装置において、前記候補検索クエリ取得手段が、検索において、前記検索クエリと共にカテゴリ情報を取得し、前記候補検索クエリ特定手段が、前記カテゴリ情報に一致し、前記操作時刻より取得時刻が前であり、かつ、前記取得時刻に基づく連続性がある検索クエリを候補検索クエリとして特定することを特徴とする。
【0012】
請求項7に記載の発明は、請求項2から請求項6のいずれか1項に記載の関連語登録装置において、前記候補検索クエリ特定手段が、前記操作時刻より取得時刻が前であり、かつ、前記取得時刻に基づく連続性がある検索クエリであって、検索結果数が所定値以下である検索クエリを候補検索クエリとして特定することを特徴とする。
【0013】
請求項8に記載の発明は、請求項1から請求項7のいずれか1項に記載の関連語登録装置において、前記特徴ワード取得手段が、前記Webページを形態素解析して前記特徴ワードを取得することを特徴とする。
【0014】
請求項9に記載の発明は、請求項8に記載の関連語登録装置において、前記特徴ワード取得手段が、前記Webページを構成している各コンテンツの出現頻度を計算し、前記出現頻度に基づいてコンテンツを特定し、当該特定されたコンテンツに対して形態素解析して特徴ワードを取得することを特徴とする。
【0015】
請求項10に記載の発明は、ユーザが入力した検索ワードを含む検索クエリを取得する検索クエリ取得手段と、前記取得した検索クエリを、ユーザ識別情報、および、前記検索クエリの取得時刻に対応付けて記憶する検索クエリ記憶手段と、所定のユーザ操作を検出した場合、操作対象のWebページに含まれる特徴ワードを取得する特徴ワード取得手段と、前記取得した検索クエリから、前記ユーザ操作を行ったユーザのユーザ識別情報に対応する候補検索クエリを抽出する候補検索クエリ抽出手段と、前記取得した特徴ワードと、前記抽出された候補検索クエリに含まれる検索ワードとを、関連語データベースに関連語として登録する関連語登録手段と、を備える。
【0016】
請求項11に記載の発明は、請求項10に記載の関連語登録装置において、前記候補検索クエリ抽出手段が、前記ユーザ操作を行ったユーザのユーザ識別情報に対応し、かつ、前記取得時刻に基づく連続性がある候補検索クエリを抽出することを特徴とする。
【0017】
請求項12に記載の発明は、請求項11に記載の関連語登録装置において、前記候補検索クエリ抽出手段が、前記取得時刻に基づく連続性がある検索クエリとして、前記検索クエリ記憶手段により記憶された検索クエリにおいて、前記取得時刻が最も遅い検索クエリの取得時刻から第1の所定時間内に取得した候補検索クエリを抽出することを特徴とする。
【0018】
請求項13に記載の発明は、請求項11または請求項12に記載の関連語登録装置において、前記候補検索クエリ抽出手段が、前記取得時刻に基づく連続性がある検索クエリとして、互いの取得時刻の間隔が第2の所定時間内の候補検索クエリを抽出することを特徴とする。
【0019】
請求項14に記載の発明は、請求項11から請求項13のいずれか1項に記載の関連語登録装置において、前記検索クエリ取得手段が、検索において、前記検索クエリと共にカテゴリ情報を取得し、前記候補検索クエリ抽出手段が、前記カテゴリ情報に一致し、前記ユーザの識別情報に対応し、かつ、前記取得時刻に基づく連続性がある候補検索クエリを抽出することを特徴とする。
【0020】
請求項15に記載の発明は、請求項11から請求項14のいずれか1項に記載の関連語登録装置において、前記候補検索クエリ抽出手段が、前記ユーザの識別情報に対応し、かつ、前記取得時刻に基づく連続性がある検索クエリであって、検索結果数が所定値以下である検索クエリを候補検索クエリとして抽出することを特徴とする。
【0021】
請求項16に記載の発明は、関連語を登録する関連語登録装置の関連語登録方法において、前記関連語登録装置が、ユーザが入力した検索ワードを含む検索クエリを取得する検索クエリ取得ステップと、前記関連語登録装置が、前記取得した検索クエリを、ユーザ識別情報、および、前記検索クエリの取得時刻に対応付けて記憶する検索クエリ記憶ステップと、前記関連語登録装置が、所定のユーザ操作を検出した場合に、前記ユーザ操作の操作対象のWebページに含まれる特徴ワードを取得する特徴ワード取得ステップと、前記関連語登録装置が、前記ユーザ操作を行ったユーザのユーザ識別情報に対応する検索クエリを抽出する検索クエリ抽出ステップと、前記関連語登録装置が、前記抽出した検索クエリから、前記取得時刻に基づき候補検索クエリを特定する候補検索クエリ特定ステップと、前記関連語登録装置が、前記取得した特徴ワードと、前記特定された候補検索クエリに含まれる検索ワードとを、関連語データベースに関連語として登録する関連語登録ステップと、を含む。
【0022】
請求項17に記載の発明は、コンピュータを、ユーザが入力した検索ワードの検索クエリを取得する検索クエリ取得手段、前記取得した検索クエリを、ユーザ識別情報、および、前記検索クエリの取得時刻に対応付けて記憶する検索クエリ記憶手段、所定のユーザ操作を検出した場合に、前記ユーザ操作の操作対象のWebページに含まれる特徴ワードを取得する特徴ワード取得手段、前記ユーザ操作を行ったユーザのユーザ識別情報に対応する検索クエリを抽出する検索クエリ抽出手段、前記抽出した検索クエリから、前記取得時刻に基づき候補検索クエリを特定する候補検索クエリ特定手段、および、前記取得した特徴ワードと、前記特定された候補検索クエリに含まれる検索ワードとを、関連語データベースに関連語として登録する関連語登録手段として機能させる。
【0023】
請求項18に記載の発明は、コンピュータを、ユーザが入力した検索ワードの検索クエリを取得する検索クエリ取得手段、前記取得した検索クエリを、ユーザ識別情報、および、前記検索クエリの取得時刻に対応付けて記憶する検索クエリ記憶手段、所定のユーザ操作を検出した場合に、前記ユーザ操作の操作対象のWebページに含まれる特徴ワードを取得する特徴ワード取得手段、前記ユーザ操作を行ったユーザのユーザ識別情報に対応する検索クエリを抽出する検索クエリ抽出手段、前記抽出した検索クエリから、前記取得時刻に基づき候補検索クエリを特定する候補検索クエリ特定手段、および、前記取得した特徴ワードと、前記特定された候補検索クエリに含まれる検索ワードとを、関連語データベースに関連語として登録する関連語登録手段として機能させる関連語登録装置用プログラムを記録する。
【0024】
請求項19に記載の発明は、端末と、前記端末とネットワークを介して接続され、前記端末からの関連語を受信する関連語登録装置と、前記関連語を登録する関連語データベースと、を備えた関連語登録システムにおいて、前記端末が、ユーザが入力した検索ワードの検索クエリを取得する検索クエリ取得手段と、前記取得した検索クエリを、ユーザ識別情報、および、前記検索クエリの取得時刻に対応付けて記憶する検索クエリ記憶手段と、所定のユーザ操作を検出した場合に、前記ユーザ操作の操作対象のWebページに含まれる特徴ワードを取得する特徴ワード取得手段と、前記ユーザ操作を行ったユーザのユーザ識別情報に対応する検索クエリを抽出する検索クエリ抽出手段と、前記抽出した検索クエリから、前記取得時刻に基づき候補検索クエリを特定する候補検索クエリ特定手段と、前記取得した特徴ワードと、前記特定された候補検索クエリに含まれる検索ワードとを、登録用の関連語として前記関連語登録装置に送信する関連語送信手段と、を備え、前記関連語登録装置が、前記受信した特徴ワードと候補検索クエリに含まれる検索ワードとを、前記関連語データベースに関連語として登録する関連語登録手段を備えたことを特徴とする。
【発明の効果】
【0025】
本発明によれば、ユーザが入力した検索ワードを含む検索クエリを取得し、取得した検索クエリを、ユーザ識別情報、および、検索クエリの取得時刻に対応付けて記憶し、所定のユーザ操作を検出した場合に、ユーザ操作の操作対象のWebページに含まれる特徴ワードを取得し、ユーザ操作を行ったユーザのユーザ識別情報に対応する検索クエリを抽出し、抽出した検索クエリから、取得時刻に基づき検索クエリを特定し、抽出した特徴ワードと、特定された検索クエリの検索ワードとを、関連語データベースに関連語として登録することにより、所定のユーザの操作を契機に、ユーザ操作と関連が深い特徴ワードと、ユーザの操作と時間的に関連して、ユーザ識別情報に対応する検索クエリの検索ワードとを関連ワードとして登録しているため、ユーザの関連性を担保しつつ、ユーザが目的とする検索対象にたどり着けたときのユーザの操作に対応した特徴ワード(完成された検索クエリの結果から取得した特徴ワード)と、検索結果に至る過程の途中である未完成の検索クエリに含まれる検索ワードとを精度の高い関連語として登録できる。
【図面の簡単な説明】
【0026】
【図1】本発明の1実施形態に係る関連語登録システムの概要構成例を示す模式図である。
【図2】図1の関連語登録サーバの概要構成の一例を示すブロック図である。
【図3】図1の情報提供サーバの概要構成の一例を示すブロック図である。
【図4】図1の端末の概要構成の一例を示すブロック図である。
【図5】図1の端末に表示されたウェブページの一例を示す模式図である。
【図6】図1の関連語登録サーバの動作例を示すフローチャートである。
【図7】図1の端末に表示されたウェブページの一例を示す模式図である。
【図8】図1の端末に表示されたウェブページの一例を示す模式図である。
【図9】図1の端末に表示されたウェブページの一例を示す模式図である。
【図10】図1の端末に表示されたウェブページの一例を示す模式図である。
【図11】ユーザ操作の検出時と、検索クエリの取得時間との関係の一例を示す模式図である。
【図12】HTML文書から生成されたDOMツリーの一例を示す模式図である。
【図13】特徴ワード用データベースに記録されるコンテンツ情報の内容の一例を示す模式図である。
【図14】特徴ワード抽出のサブルーチンを示すフローチャートである。
【図15】図1の関連語登録サーバの動作の変形例を示すフローチャートである。
【図16】ユーザ操作の検出時と、検索クエリの取得時間との関係の一例を示す模式図である。
【図17】ユーザ操作の検出時と、検索クエリの取得時間との関係の一例を示す模式図である。
【図18】ユーザ操作の検出時と、検索クエリの取得時間との関係の一例を示す模式図である。
【図19】ユーザ操作の検出時と、検索クエリの取得時間との関係の一例を示す模式図である。
【図20】ユーザ操作の検出時と、検索クエリの取得時間との関係の一例を示す模式図である。
【発明を実施するための形態】
【0027】
以下、図面を参照して本発明の実施形態について説明する。なお、以下に説明する実施の形態は、関連語登録システムに対して本発明を適用した場合の実施形態である。
【0028】
[1.関連語登録システムの構成および機能概要]
【0029】
まず、本発明の1実施形態に係る関連語登録システムの構成および概要機能について、図1を用いて説明する。
【0030】
図1は、本実施形態に係る関連語登録システム1の概要構成例を示す模式図である。
【0031】
図1に示すように、関連語登録システム1は、関連語を登録する関連語登録サーバ10(関連語登録装置の一例)と、ユーザが利用する情報提供サイトの一例であるショッピングサイト運営のために設置され、関連語登録サーバ10に登録されている情報や商品等の情報をユーザに提供するための情報提供サーバ20と、情報提供サーバ20においてユーザが商品等の検索を行う端末30と、を備えている。
【0032】
関連語登録サーバ10と、情報提供サーバ20とは、ローカルエリアネットワーク等により接続され、相互にデータの送受信が可能になっていて、サーバシステム5を構成している。そして、サーバシステム5と端末30とは、ネットワーク3により接続され、通信プロトコル(例えば、TCP/IP)により、データの送受信が可能になっている。なお、ネットワーク3は、例えば、インターネット、専用通信回線(例えば、CATV(Community Antenna Television)回線)、移動体通信網(基地局等を含む)、および、ゲートウェイ等により構築されている。
【0033】
また、関連語登録サーバ10は、端末30等におけるユーザの検索行動等から、関連語のデータベースを構築し、端末30等におけるユーザの検索行動を支援する。
【0034】
情報提供サーバ20は、端末30から検索クエリを受信して検索を行い、端末30に検索結果を送信する。また、情報提供サーバ20は、関連語のデータベースを構築するために、受信した検索クエリを関連語登録サーバ10に送信する。また、情報提供サーバ20は、ショッピングサイトとして、商品の検索、商品の情報の提供、広告の情報の提供、および、商品の購入の手続き等を行う。
【0035】
ユーザの端末30は、複数存在する。
【0036】
[2.各サーバの構成および機能]
(2.1 関連語登録サーバ10の構成および機能)
次に、関連語登録サーバ10の構成および機能について、図2を用いて説明する。
【0037】
図2は、関連語登録サーバ10の概要構成の一例を示すブロック図である。
【0038】
図2に示すように、コンピュータとして機能する関連語登録サーバ10は、通信部11と、記憶部12と、入出力インターフェース部13と、システム制御部14と、を備えている。そして、システム制御部14と入出力インターフェース部13とは、システムバス15を介して接続されている。
【0039】
通信部11は、ネットワーク3に接続して端末30等との通信状態を制御し、さらに、ローカルエリアネットワークに接続して、ローカルエリアネットワーク上の情報提供サーバ20等の他のサーバとデータの送受信を行う。
【0040】
記憶部12は、例えば、ハードディスクドライブ等により構成されており、オペレーティングシステムおよびサーバプログラム等の各種プログラムや、データ等を記憶する。なお、各種プログラムは、例えば、他のサーバ装置等からネットワーク3を介して取得されるようにしてもよいし、記録媒体に記録されてドライブ装置(図示せず)を介して読み込まれるようにしてもよい。
【0041】
また、記憶部12には、端末30から受信した検索クエリに関するログを記憶した検索クエリログ・データベース12a(以下「検索クエリログDB12a」とする。)と、Webページから特徴ワードを抽出する際に必要なデータを記憶した特徴ワード用データベース12b(以下「特徴ワード用DB12b」とする。)と、検索クエリから生成される関連語を記憶した関連語データベース12c(以下「関連語DB12c」とする。)等が構築されている。なお、検索クエリログDB12aや、特徴ワード用DB12b、関連語DB12cは、サーバシステム5内において、関連語登録サーバ10以外の他のサーバに構築されてもよいし、サーバシステム5外部に構築されてもよい。
【0042】
検索クエリログDB12a(検索クエリ記憶手段の一例)には、検索クエリを受信した受信時刻、ユーザID等のユーザを区別するためのユーザ識別情報と対応付けた検索クエリが記憶されている。なお、ユーザ識別情報として、ある程度ユーザを区別できるIPアドレスでもよい。さらに、情報提供サーバ20において、ユーザが商品検索を行っている場合、商品の属する商品カテゴリや、ユーザが開いているWebページが示している商品カテゴリ等のカテゴリ情報にも対応付けて、検索クエリが検索クエリログDB12aに記憶される。
【0043】
特徴ワード用DB12bには、特徴ワードの抽出に利用するため、情報提供サーバ20のデータベース等から抽出されたコンテンツ情報が記憶される。
【0044】
関連語DB12cには、関連語登録サーバ10により生成される関連語が記憶される。
【0045】
次に、入出力インターフェース部13は、通信部11および記憶部12とシステム制御部14との間のインターフェース処理を行う。
【0046】
システム制御部14は、CPU(Central Processing Unit)14a、ROM(Read Only Memory)14b、RAM(Random Access Memory)14c等により構成されている。システム制御部14は、CPU14aがROM14bや記憶部12に記憶された各種プログラムを読み出し実行することにより、関連語の登録処理等を行う。
【0047】
(2.2 情報提供サーバ20の構成および機能)
次に、情報提供サーバ20の構成および機能について、図3を用いて説明する。
図3は、情報提供サーバ20の概要構成の一例を示すブロック図である。
【0048】
図3に示すように、情報提供サーバ20は、通信部21と、記憶部22と、入出力インターフェース部23と、システム制御部24と、を備え、システム制御部24と入出力インターフェース部23とは、システムバス25を介して接続されている。なお、情報提供サーバ20の構成および機能は、関連語登録サーバ10の構成および機能とほぼ同じであるので、関連語登録サーバ10の各構成や各機能において、異なるところを中心に説明する。
【0049】
通信部21は、ネットワーク3やローカルエリアネットワーク等を通して、端末30や関連語登録サーバ10等との通信状態を制御等するようになっている。
【0050】
記憶部22には、商品データベース22a(以下「商品DB22a」とする。)や、会員データベース22b(以下「会員DB22b」とする。)等が構築されている。
【0051】
商品DB22aには、商品を識別するための識別子である商品IDに関連付けられ、商品名、種類、商品の画像、スペック、および、商品情報や、各商品に関する広告情報等が記憶されている。また、商品DB22aには、商品情報が商品のカテゴリ情報に基づき分類されている。また、商品DB22aには、HTML(HyperText Markup Language)、XML(Extensible Markup Language)等のマークアップ言語等により記述された商品ウェブページのファイル等が記憶されている。
【0052】
さらに、商品DB22aには、商品を検索するための検索データベースが構築されている。
【0053】
会員DB22bには、会員登録されたユーザ(ショッピングサイトの利用者)のユーザID、名称、住所、電話番号、メールアドレス、職業、趣味、購買履歴、ユーザの関心があるテーマやジャンル等のユーザ情報が登録されている。また、会員DB22bには、ユーザが端末30からショッピングサイトにログインする際に必要な、ユーザID、ログインID、および、パスワードが登録されている。ここで、ログインIDおよびパスワードは、ログイン処理(ユーザの認証処理)に使用されるログイン情報である。
【0054】
システム制御部24は、CPU24a、ROM24b、RAM24c等により構成されている。そして、システム制御部24は、CPU24aが、ROM24bや記憶部22に記憶された各種プログラムを読み出し実行することにより、商品検索処理や、ユーザによる商品購入処理等を行う。
【0055】
(2.3 端末30の構成および機能)
次に、端末30の構成および機能について、図4を用いて説明する。
図4は、端末30の概要構成の一例を示すブロック図である。
【0056】
図4に示すように、コンピュータとして機能する端末30は、例えば、パーソナルコンピュータやスマートフォンを含む携帯型無線電話機やPDA等の携帯端末であり、通信部31と、記憶部32と、表示部33と、操作部34と、入出力インターフェース部35と、システム制御部36とを備えている。そして、システム制御部36と入出力インターフェース部35とは、システムバス37を介して接続されている。
【0057】
通信部31は、ネットワーク3を通して、情報提供サーバ20等との通信を制御する。なお、端末30が携帯型端末装置の場合、ネットワーク3の移動体通信網に接続するために、通信部31は、無線通信機能を有する。
【0058】
記憶部32は、例えば、ハードディスクドライブ等からなり、オペレーティングシステム、ウェブブラウザのプログラムやウェブブラウザ用ツールバーのプログラム等を記憶する。
【0059】
表示部33は、例えば、液晶表示素子またはEL(Electro Luminescence)素子等によって構成されている。表示部33には、検索画面のウェブページや、情報提供サーバ20から提供された商品検索の結果のウェブページがウェブブラウザにより表示される。
【0060】
操作部34は、例えば、キーボードおよびマウス等によって構成されている。ユーザは、操作部34により応答を入力する。なお、表示部33がタッチパネルのようなタッチスイッチ方式の表示パネルの場合、操作部34は、ユーザが接触または近接した表示部33の位置情報を取得する。
【0061】
入出力インターフェース部35は、通信部31および記憶部32とシステム制御部36とのインターフェースである。
【0062】
システム制御部36は、例えば、CPU36aと、ROM36bと、RAM36cとを有する。システム制御部36は、CPU36aが、ROM36bや、RAM36cや、記憶部32に記憶された各種プログラムを読み出して実行する。例えば、システム制御部36は、ウェブブラウザのプログラムを実行しウェブブラウザとして機能する。
【0063】
[3.関連語登録システムの動作]
次に、本発明の1実施形態に係る関連語登録システム1の動作について図5から図11を用い説明する。
【0064】
図5、図7から図10は、端末30に表示されたウェブページの一例を示す模式図である。図6は、関連語登録サーバ10の動作例を示すフローチャートである。図11は、ユーザ操作の検出時と、検索クエリの取得時間との関係の一例を示す模式図である。
【0065】
(3.1 ユーザ操作の判定および検索クエリログの生成)
ユーザがショッピングサイトにログインして、商品の検索をしながら目的の商品を捜索し、当該捜索された商品を購入する手続きまでのユーザ行動において、ユーザ操作の判定および検索クエリログの生成について図5から図8を用いて説明する。
【0066】
まず、ユーザ(例えばユーザA)が、ユーザAの端末30で、ショッピングサイトにログインすると、図5に示すように、ショッピングサイトのトップページであるWebページ40の情報が情報提供サーバ20から、この端末30に送信される。そして、端末30の表示部33にWebページ40が表示される。このWebページ40には、ショッピングサイトのトップページであり、トップカテゴリ表示45が表示され、各商品カテゴリへのリンクが張られている。さらに、このショッピングサイトの関連グループ企業の商品やサービスのカテゴリ表示46が表示され、各商品カテゴリへのリンクが張られている。また、Webページ40には、ユーザAを示す情報“Aさん、こんにちは”が表示されている。
【0067】
次に、図5に示すように、Webページ40において、”家電”の商品カテゴリのリンクがクリックされ、端末30から情報提供サーバ20にリンク先のWebページの表示要求の信号が送信されたとする。なお、ショッピングサイトにログインしているユーザAのユーザIDと、表示されているWebページが属する商品カテゴリのカテゴリ情報も端末30から送信される。
【0068】
図6に示すように、関連語登録サーバ10は、ユーザ操作を検出する(ステップS1)。具体的には、関連語登録サーバ10のシステム制御部14は、端末30から情報提供サーバ20に対する要求や端末30から送信されるその他の信号を検出する。この要求の種類は、ユーザが入力した検索ワードの検索クエリや、詳細な商品の内容を示すリンク先のWebページの表示要求や、他のサービスへのWebページの表示要求や、商品購入手続きのWebページの表示要求や、商品購入確定の信号等である。これら要求等の内容が、情報提供サーバ20から関連語登録サーバ10に送信される。図5の場合は、関連語登録サーバ10のシステム制御部14は、ユーザ操作として”家電”の商品カテゴリのリンク先のWebページの表示要求を情報提供サーバ20から受信する。
【0069】
次に、関連語登録サーバ10は、検出したユーザ操作が検索か否かを判定する(ステップS2)。具体的には、関連語登録サーバ10のシステム制御部14は、端末30から情報提供サーバ20に対する要求が、検索クエリを含んでいるか否かを判定する。図5の場合は、リンク先のWebページの表示要求で検索要求ではないので(ステップS2;NO)、ステップS3に進む。
【0070】
検出したユーザ操作が検索で無い場合(ステップS2;NO)、関連語登録サーバ10は、検出したユーザ操作がユーザの商品に関する手続き(所定の操作の一例)か否かを判定する(ステップS3)。具体的には、関連語登録サーバ10のシステム制御部14は、検出したユーザ操作が、商品購入手続き確定(決済)か否かを判定する。なお、ユーザの商品に関する手続きとして、商品購入手続き確定(決済)の他に、商品予約登録、買い物カゴへの登録、お気に入り(ブックマーク)への登録などが挙げられる。なお、所定の操作として、検索の目的が達成されたことが分かる操作ならばよい。
【0071】
ユーザ操作がユーザの商品に関する手続きで無い場合(ステップS3;NO)、例えば、リンク先のWebページの表示要求等の場合、関連語登録サーバ10のシステム制御部14は、ステップS1に戻り、ユーザ操作の検出を待つ。図5の場合、リンク先のWebページの表示要求で商品購入手続き確定(決済)の信号では無いので、ステップS1に戻る。
【0072】
図5に示すように、Webページ40において、”家電”の商品カテゴリのリンクがクリックされると、図7に示すように、”家電”のWebページ50が表示部33に表示される。このWebページ50には、トップカテゴリ”家電”のカテゴリ表示55のサブカテゴリ表示56が表示される。
【0073】
次に、Webページ50の検索ワード記入欄51に、検索ワード”▼▼○”が入力され、検索ボタン52がクリックされると、端末30のシステム制御部36は、通信部31を通して、検索クエリを情報提供サーバ20に送信する。この検索クエリは、入力された検索ワードと、Webページ50のカテゴリ情報(トップカテゴリ”家電”のカテゴリ表示65を示すカテゴリ識別番号等)と、ユーザ識別情報の一例である(ユーザAの)ユーザID等を有する。
【0074】
次に、情報提供サーバ20は、この検索クエリを端末30から受信し、関連語登録サーバ10に送信すると共に、商品DB22aを参照して商品の検索を行う。また、この検索クエリの送信元のIPアドレスを特定し、このIPアドレスも関連語登録サーバ10に送信する。このIPアドレスは、ユーザ識別情報の一例であり、ユーザがログインしていない場合に、ユーザIDの代わりに使用される。IPアドレスでは、必ずしも完全にユーザを特定できないが、ある程度はユーザを区別できる。このIPアドレスは、ユーザA等の端末30から送信された検索クエリのヘッダ等から取得される。
【0075】
次に、関連語登録サーバ10は、検索ワードを含む検索クエリを情報提供サーバ20から受信し、ステップS1においてユーザ操作を検出し、ステップS2において検出したユーザ操作が検索か否かを判定する。図7の場合、端末30からの検索要求なので(ステップS2;YES)、図6に示すように、関連語登録サーバ10は、検索ワードを含む検索クエリを取得する(ステップS4)。具体的には、関連語登録サーバ10のシステム制御部14は、検索クエリを情報提供サーバ20から受信し、受信した検索クエリと検索クエリの受信時刻(取得時刻の一例)を対応付けて検索クエリログDB12aに記憶する。さらに、関連語登録サーバ10のシステム制御部14は、IPアドレスと対応付けて検索クエリを検索クエリログDB12aに記憶する。なお、関連語登録サーバ10のシステム制御部14は、検索クエリにIPアドレスを含ませてもよい。
【0076】
この受信時刻は、情報提供サーバ20が、端末30から検索クエリを受信した受信時刻や、関連語登録サーバ10が、この検索クエリを情報提供サーバ20から受信した受信時刻が挙げられる。端末から情報提供サーバ20が受信した時刻ならば、情報提供サーバ20は、検索クエリの受信時刻も関連語登録サーバ10に送信する。また、受信時刻は、検索クエリログDB12aに検索クエリが記憶されるときに付されるタイムスタンプでもよい。
【0077】
次に、関連語登録サーバ10は、ユーザIDおよび取得時刻と対応付けて検索クエリを記憶する(ステップS5)。具体的には、関連語登録サーバ10のシステム制御部14は、カテゴリ情報、ユーザID(IPアドレスでもよい)および受信時刻(取得時刻の一例)と対応付けて検索クエリを検索クエリログDB12aに記憶する。このように関連語登録サーバ10は、取得した検索クエリを、ユーザ識別情報、および、検索クエリの取得時刻に対応付けて記憶する検索クエリ記憶手段の一例として機能する。
【0078】
次に、関連語登録サーバ10は、ステップS3において検出したユーザ操作が所定の操作か否かを判定する。図7の場合、端末30からの検索要求なので(ステップS3;NO)、関連語登録サーバ10は、ステップS1に戻り、ユーザ操作の検出を待つ。
【0079】
一方、情報提供サーバ20が商品の検索を行った後、検索結果として、図8に示すように、Webページ60の情報を、端末30に送信する。端末30は、Webページ60の情報を情報提供サーバ20から受信し、表示部33に表示させる。
【0080】
ユーザAは、Webページ60の検索結果を見て、目的の商品がある場合は、商品表示欄63の商品をクリックするが、目的の商品がない場合は、さらに検索ワードを検索ワード入力欄61に入力し、検索ボタン62をクリックすると、端末30は、上述のように、検索ワード“▲▲ O■”とカテゴリ情報(”家電”)を含む検索クエリを情報提供サーバ20に送信する。そして、情報提供サーバ20は、この検索クエリを受信して、関連語登録サーバ10に送信し、検索を行う。関連語登録サーバ10は、上述のように、検索クエリを受信し(ステップS4)、カテゴリ情報、ユーザID等および受信時刻と対応付けて、次の検索クエリを検索クエリログDB12aに記憶する(ステップS5)。
【0081】
ユーザAは目的の商品が見つかるまで、検索を続け、関連語登録サーバ10はその都度、ステップS4からステップS5のように、検索クエリを検索クエリログDB12aに記憶する。
【0082】
(3.2 関連語の登録)
次に、関連語の登録について、図7および図9〜図11を用いて説明する。
【0083】
ユーザAが、検索を行って目的の商品を見つけ、図9に示すように、端末30の表示部33において、商品に関する詳細な情報がWebページ70に表示される。そして、購入手続きに進むためのボタン(図示せず)がクリックされ、情報提供サーバ20は、商品に関する手続き処理を開始し、図10に示すように、購入手続きの確定を確認するWebページ80の情報を端末30に送信し、Webページ80が端末30の表示部33に表示される。
【0084】
そして、購入手続きの確定のボタン81がクリックされ、商品購入確定の信号が端末30から情報提供サーバ20に送信される。そして、情報提供サーバ20から関連語登録サーバ10に商品購入確定の信号が送信される。なお、ショッピングサイトにログインしているユーザAのユーザIDと、購入した商品のカテゴリ情報も端末30から送信される。
【0085】
次に、関連語登録サーバ10は、ステップS1において、ユーザ操作を検出し、所定の操作の一例である商品購入確定の信号であるので(ステップS3;YES)、次のステップS6に進む。
【0086】
図7に示すように、関連語登録サーバ10は、ユーザ操作の操作対象のWebページに含まれる特徴ワードを抽出する(ステップS6)。具体的には、関連語登録サーバ10のシステム制御部14は、Webページ80購入手続きの確定のボタン81のクリックのようなユーザ操作の操作対象のWebページ70から特徴ワードを抽出し取得する。なお、特徴ワードを抽出の詳細は、特徴ワードのサブルーチンにおいて後述する。このように関連語登録サーバ10は、所定のユーザ操作を検出した場合に、ユーザ操作の操作対象のWebページに含まれる特徴ワードを取得する特徴ワード取得手段の一例として機能する。
【0087】
図7に示すように、関連語登録サーバ10は、ユーザ操作の前に取得した検索クエリのうち、ユーザIDに一致する検索クエリを抽出する(ステップS7)。具体的には、関連語登録サーバ10のシステム制御部14は、商品購入確定の信号の受信の際に取得したユーザIDに一致する検索クエリを、検索クエリログDB12aから抽出する。例えば、図11に示すように、関連語登録サーバ10のシステム制御部14は、検索クエリ群90を抽出する。図11では、検索クエリ群90は、検索クエリQa〜Qgまで、受信時刻順に示されている。また、検索クエリ91は、目的の検索対象にヒットした検索クエリである。
【0088】
なお、ユーザがログイン等していなくて、検索クエリのユーザIDが分からないときは、関連語登録サーバ10のシステム制御部14は、ユーザ識別情報の一例としてIPアドレスが一致する検索クエリを、検索クエリログDB12aから抽出する。
【0089】
このように関連語登録サーバ10は、ユーザ操作を行ったユーザのユーザ識別情報に対応する検索クエリを抽出する検索クエリ抽出手段の一例として機能する。
【0090】
次に、関連語登録サーバ10は、抽出した検索クエリのうち、取得時刻が一番早い検索クエリを検索クエリとして特定する(ステップS8)。具体的には、図11に示すように、関連語登録サーバ10のシステム制御部14は、検索クエリ群90の中から、取得時間の一例の受信時刻が一番早い検索クエリ93(候補検索クエリ)を特定する。
【0091】
このように関連語登録サーバ10は、抽出した検索クエリから、取得時刻に基づき候補検索クエリを特定する候補検索クエリ特定手段の一例として機能する。
【0092】
次に、関連語登録サーバ10は、抽出した特徴ワードを、特定した検索クエリに含まれる検索ワードの関連語として登録する(ステップS9)。具体的には、関連語登録サーバ10のシステム制御部14は、抽出した特徴ワードと、検索クエリ93に含まれる検索ワードとを、関連語として関連語DB12cに登録する。このように関連語登録サーバ10は、取得した特徴ワードと、特定された検索クエリの検索ワードとを、関連語DB12cに関連語として登録する関連語登録手段の一例として機能する。
【0093】
(3.3 特徴ワードの抽出)
次に特徴ワードのサブルーチンについて、図9、図12〜図14を用いて説明する。
【0094】
図12は、HTML文書から生成されたDOMツリーの一例を示す模式図である。図13は、特徴ワード用データベースに記録されるコンテンツ情報の内容の一例を示す模式図である。図15は、特徴ワード抽出のサブルーチンを示すフローチャートである。
【0095】
このサブルーチンでは、関連語登録サーバ10は、Webページ70等からHTMLファイルを取得して解析し、Web素材(テキストデータおよび画像データ等)であるコンテンツをコンテンツブロック単位で抽出し、複数のWebページを構成している各コンテンツブロックの出現頻度を計算し、出現頻度が最も小さい又は出現頻度が所定値(例えば5回)以下のコンテンツを当該Webページに特有なコンテンツブロックとして特定し、当該特定されたコンテンツに対して形態素解析して特徴ワードを抽出する。なお、関連語登録サーバ10は、出現頻度の算出対象のコンテンツブロックの数量に基づいて出現頻度の所定値を決定してもよい。
【0096】
具体的には、予め、情報提供サーバ20から商品DB22aに記憶されているHTML文書を取得して解析し、Web素材であるコンテンツをコンテンツブロック単位で抽出する。そして、その抽出結果として、抽出したコンテンツブロック毎にコンテンツブロック対応情報(コンテンツ情報の一例)を特徴ワード用DB12bに記憶する。基本的には、商品DB22aに記憶に登録されている商品に関する全HTML文書、すなわち、ショッピングサイトを構成する全ての商品説明ページについてコンテンツブロックの抽出が予め行われる。
【0097】
このコンテンツブロック対応情報を参照して、対象Webページのコンテンツブロックの出現頻度が算出され、特有なコンテンツブロックが特定される。
【0098】
ここで、コンテンツブロック、および、コンテンツブロック対応情報について図9、図12、および、図13を用いて説明する。
【0099】
図9に示すように、例えば、商品説明ページやブログページのようなWebページ70上において、Web素材としての各コンテンツは、それぞれ或るまとまり(かたまり)毎に表示されている。その各まとまりがコンテンツブロックに相当する。各コンテンツは、HTMLファイルに記述されているDIVタグおよびTABLEタグ(予め定められたタグの一例)により夫々コンテンツブロックに分けられる。つまり、各コンテンツは、DIVタグおよびTABLEタグ(以下、「ブロック化タグ」という)によりブロック化(グループ化)される。
【0100】
図9には、コンテンツブロック71〜76が表示されている。コンテンツブロック71は、例えば、ページのヘッダ部分のコンテンツブロックであり、テキストAおよび画像aにより構成されている。
【0101】
また、コンテンツブロック72は、例えば、各種カテゴリの商品に関するWebページに移動するためのナビゲーション部分のコンテンツブロックであり、例えば、他のWebページへのリンクを示すテキストB、テキストCおよびテキストDにより構成されている。
【0102】
また、コンテンツブロック73は、例えば、商品説明の表示領域に対応するコンテンツブロックであり、見出しを示すテキストE、コンテンツブロック74およびコンテンツブロック75により構成されている。このように、コンテンツブロックが入れ子状、つまり、階層構造になっている場合もある。この場合、コンテンツブロック73に含まれるコンテンツはテキストEのみとされ、コンテンツブロック74およびコンテンツブロック75は、コンテンツブロック73から独立しているものとされる。コンテンツブロック74および75は、夫々1件の商品の説明文である。コンテンツブロック74には、商品の説明文の表題や本文を示すテキストFおよびGにより構成されている。コンテンツブロック75には、商品の説明文の表題や本文を示すテキストH、IおよびJと、商品画像bおよびcとにより構成されている。コンテンツブロック76は、例えば、コピーライト表示等を示すコンテンツブロックであり、テキストIにより構成されている。
【0103】
これらのコンテンツブロックのうち、コンテンツブロック71、72、73および76は、図9に示すWebページ70以外のWebページ上でも比較的頻繁に現れる。一方、コンテンツブロック74およびコンテンツブロック75は、基本的にWebページ70にだけに用いられる。よって、コンテンツブロック74又はコンテンツブロック75が、Webページ70に特有のコンテンツブロックであると判断されることとなる。
【0104】
図9のWebページ70のHTML文書をDOM(Document Object Model)ツリー、すなわち、木構造で表したものが図12である。
【0105】
このDOMツリーにおいては、DIVタグを示すDIVノードおよびTABLEタグを示すTABLEノードが、各コンテンツをコンテンツブロックにブロック化するノードとされる(以下、「ブロック化ノード」という)。
【0106】
システム制御部14は、例えば、深さ優先探索によりDOMツリーを探索し、コンテンツブロックを確定していく。具体的に、システム制御部14は、ブロック化ノードを発見すると、当該ノードを頂点とする部分木の各ノードに規定されているコンテンツを一まとめにしてコンテンツブロックとする。
【0107】
ただし、コンテンツブロックが階層的に規定された結果、或るブロック化ノード(以下、「上位のブロック化ノード」という)を発見した後、当該ブロック化ノードの子孫のノードの中からさらにブロック化ノード(以下、「下位のブロック化ノード」という)を発見すると、コンテンツブロックが分割される。例えば、ルートノードからの距離が近いノードほど階層的により上位のノードであるとすると、上位のブロック化ノードを頂点とする部分木(以下、「上位部分木」という)に相当するコンテンツブロックを、下位のブロック化ノードを頂点とする部分木(以下、「下位部分木」という)に相当するコンテンツブロックと、上位部分木のうち下位部分木を除く部分に相当するコンテンツブロックとに分ける(例えば、コンテンツブロック74とコンテンツブロック73)。この場合においては、前者のコンテンツブロックを、後者のコンテンツブロックよりも階層的に下位にあるものとする。例えば、コンテンツブロック71、72、73および76の階層は1であり、コンテンツブロック74および75の階層は2である。つまり、階層の値が小さいほど階層的により上位となる。
【0108】
関連語登録サーバ10は、コンテンツブロックを抽出すると、抽出結果を示すコンテンツブロック対応情報を特徴ワード用DB12bに記憶する。図13に示すように、コンテンツブロック対応情報121は、コンテンツブロック毎に登録される。コンテンツブロック対応情報には、抽出元のHTML文書のURL設定部分122とブロック構成情報123とにより構成されている。ブロック構成情報には、抽出された各コンテンツが設定される。ここで、テキストデータについては、DOMツリーにおけるテキストノードの内容が設定される。一方、画像データについては、画像データそのものの代わりとして、DOMツリーにおいてIMGタグを示すIMGノードのsrc属性としての画像データのURLが設定される。
【0109】
次に、特徴ワードのサブルーチンの動作について図14を用いて説明する。
【0110】
図14に示すように、特徴ワードのサブルーチンが呼び出されると関連語登録サーバ10は、例えば、Webページ70のHTMLファイルを取得し、コンテンツブロックを抽出する(ステップS11)。具体的には、関連語登録サーバ10のシステム制御部14は、図12に示すように、Webページ70のHTMLファイル(HTML文書)のDOMツリーを生成する。そして、関連語登録サーバ10のシステム制御部14は、ブロック化ノードの種類や、ツリー構造における階層に基づき、DOMツリーを探索(ツリー探索処理)してコンテンツブロックを抽出する。
【0111】
次に、関連語登録サーバ10は、特徴ワード用DB12bを参照して、抽出した各コンテンツブロックの全商品詳細ページにおける出現頻度を計算する(ステップS12)。具体的には、関連語登録サーバ10のシステム制御部14は、ツリー探索処理において生成されたコンテンツブロックのブロック構成情報と、特徴ワード用DB12bに記憶されている各コンテンツブロック対応情報121のブロック構成情報123とを比較する。
【0112】
このとき、システム制御部14は、ブロック構成情報の内容が一致する場合には、出現回数1回としてカウントする。なお、システム制御部14は、ブロック構成情報中におけるコンテンツの規定順は無視してかまわない。
【0113】
さらに、システム制御部14は、ブロック構成情報中に規定されているテキストデータ同士を比較する場合には、テキストデータが示す文章等そのものが一致するか否かを判定するのではなく、その文章等により表現されている実質的な内容を比較してもよい。例えば、システム制御部14は、夫々のテキストデータの形態素解析等を行うことによりテキストデータから単語を抽出し、抽出した単語同士を比較してもよい。そして、システム制御部14は、全ての単語が一致した場合にテキストデータ同士が一致したと判断してもよいし、所定の割合以上で単語が一致した場合にテキストデータ同士が一致したと判断してもよい。
【0114】
システム制御部14は、このようにしてコンテンツブロックのブロック構成情報と、特徴ワード用DB12bに記憶されている全てのコンテンツブロック対応情報のブロック構成情報とを比較して、出現頻度を計算する。なお、計算される出現頻度としては、出現回数(度数)であってもよいし、全商品詳細ページの全コンテンツブロックに対する出現回数の割合(相対度数)であってもよい。
【0115】
次に、関連語登録サーバ10は、出現頻度に基づき、特有のコンテンツブロックの判定を行う(ステップS13)。具体的には、関連語登録サーバ10のシステム制御部14は、出現頻度の最も小さいコンテンツブロックを、特有のコンテンツブロックであると判定する。
【0116】
次に、関連語登録サーバ10のシステム制御部14は、特有のコンテンツブロックから特徴ワードを抽出する(ステップS14)。具体的には、関連語登録サーバ10のシステム制御部14は、特有のコンテンツブロックから、形態素解析して、出現頻度が高い単語を特徴ワードとして抽出する。
【0117】
このように関連語登録サーバ10は、Webページを形態素解析して特徴ワードを取得する特徴ワード取得手段の一例として機能する。また、関連語登録サーバ10は、Webページを構成している各コンテンツの出現頻度を計算し、出現頻度に基づいてコンテンツを特定し、当該特定されたコンテンツに対して形態素解析して特徴ワードを取得する特徴ワード取得手段の一例として機能する。
【0118】
以上、本実施形態によれば、ユーザが入力した検索ワードを含む検索クエリを取得し、取得した検索クエリを、ユーザ識別情報、および、検索クエリの取得時刻に対応付けて記憶し、所定のユーザ操作を検出した場合に、ユーザ操作の操作対象のWebページに含まれる特徴ワードを取得し、ユーザ操作を行ったユーザのユーザ識別情報に対応する検索クエリ(検索クエリ群90)を抽出し、抽出した検索クエリから、取得時刻に基づき検索クエリ93を特定し、抽出した特徴ワードと、特定された検索クエリの検索ワードとを、関連語DB12cに関連語として登録することにより、所定のユーザの操作を契機に、ユーザ操作と関連が深い特徴ワードと、ユーザの操作と時間的に関連して、ユーザ識別情報に対応する検索クエリの検索ワードとを関連ワードとして登録しているため、ユーザの関連性を担保しつつ、ユーザが目的とする検索対象にたどり着けたときのユーザの操作に対応した特徴ワード(完成された検索クエリの結果から取得した特徴ワード)と、検索結果に至る過程の途中である未完成の検索クエリに含まれる検索ワードとを精度の高い関連語として登録できる。
【0119】
なお、特徴ワードは、完成された検索クエリ91の検索ワードとは、関連が深い。ここで、完成された検索クエリは、ユーザが目的とする検索対象にたどり着けたときの検索クエリである。検索クエリ群90において、完成された検索クエリ91以外は、未完成な検索クエリであり、この検索クエリでは、ユーザが目的とする検索対象にたどり着けない検索クエリである。
【0120】
また、関連語に基づき、ユーザに検索ワードを提示すると、ユーザが目標とする検索対象に早くたどり着くことができる。
【0121】
また、Webページを形態素解析して特徴ワードを取得する場合、Webページに関連した特有な特徴ワードを精度よく抽出ができるので、精度が高い特徴ワードと検索ワードとを、精度の高い関連語として登録できる。
【0122】
また、指定されたWebページを構成しているコンテンツを抽出し、指定されたWebページ70を構成している各コンテンツの出現頻度を計算し、指定されたWebページを構成しているコンテンツのうち、出現頻度が最も小さい又は出現頻度が所定値(例えば、5回)以下のコンテンツをWebページ70に特有のコンテンツであると判定する場合や、出現頻度の算出対象のコンテンツブロックの数量に基づいて出現頻度の所定値を決定して特有のコンテンツであると判定する場合、出現頻度が小さいコンテンツであるほど、指定されたWebページ70以外にはあまり出現しないコンテンツであるので、最も出現頻度が小さい又は所定値以下のコンテンツを判断することで、指定されたWebページ70に特有のコンテンツが精度よく特定される。よって、Webページ70に特有のコンテンツを容易に抽出することができる。
【0123】
そして、この特有のコンテンツに対して形態素解析して特徴ワードを取得する場合も、Webページに関連した特有な特徴ワードを精度よく抽出ができるので、精度が高い特徴ワードと検索ワードとを、精度の高い関連語として登録できる。
【0124】
また、関連語登録サーバ10が、所定のユーザ操作として、当該ユーザの商品に関する決済手続きを検出した場合に、ユーザIDやIPアドレス等のユーザ識別情報に対応する検索クエリを抽出し、当該抽出した検索クエリから第1の検索クエリと、第2のクエリを特定して関連語として登録することによって、買い物カゴへのバスケット登録や、ブックマーク登録などを検索クエリ抽出処理の契機とする場合に比べて、当該決済に至った検索結果に対応する検索クエリがより精度の高い完成クエリであるため、検索クエリ抽出処理の開始条件を適切に設定できるので、最終的な結果として登録する関連語の精度を向上できる。
【0125】
次に、関連語登録システム1の動作の変形例について、図15および図16を用いて説明する。なお、ステップS21〜ステップS26、ステップS29は、ステップS1〜ステップS6、ステップS9にそれぞれ対応するので、説明を省略する。また、前記実施形態と同一または対応する部分には、同一の符号を用いて異なる構成および作用のみを説明する。その他の変形例も同様とする。
【0126】
図15に示すように、特徴ワードが抽出された後、関連語登録サーバ10は、ユーザ操作の前に取得した検索クエリのうち、ユーザIDに一致し、かつ、取得時刻が一番遅い検索クエリまでの各検索クエリ間の取得時刻間隔が所定時間内の検索クエリを抽出する(ステップS27)。具体的には、関連語登録サーバ10のシステム制御部14は、商品購入確定の信号の受信の際に取得したユーザIDに一致し、かつ、図16に示すように、互いの受信時刻(取得時刻)間隔が第2の所定時間内の一例として、取得時刻が一番遅い検索クエリ91(Qa)までの各検索クエリの内、一つ前の検索クエリとの取得時刻間隔が所定時間T2内(取得時刻に基づく連続性の一例)の検索クエリ92(Qb、Qc)を、検索クエリログDB12aから抽出する。これは、受信時刻(取得時刻)に基づく連続性の一例であり、第1の検索クエリ91(Qa)から、検索クエリの受信時刻順に連番になっている候補検索クエリ92(Qb、Qc)である。なお、関連語登録サーバ10のシステム制御部14は、受信時刻(取得時刻)に基づく連続性の一例として、互いの受信時刻間隔が所定時間T2内(取得時刻に基づく連続性の一例)の候補検索クエリ92(Qb、Qc、Qe、Qg)を抽出してもよい。
【0127】
次に、関連語登録サーバ10は、抽出した検索クエリのうち、取得時刻が一番早い検索クエリを検索クエリとして特定する(ステップS28)。具体的には、図16に示すように、関連語登録サーバ10のシステム制御部14は、検索クエリ92群の中から、取得時間の一例の受信時刻が一番早い検索クエリ93を特定する。
【0128】
次に、関連語登録サーバ10は、ステップS9のように、抽出した特徴ワードを、特定した検索クエリの関連語として登録する(ステップS29)。
【0129】
以上、本実施形態の変形例によれば、ユーザが入力した検索ワードを含む検索クエリを取得し、取得した検索クエリを、ユーザ識別情報、および、検索クエリの取得時刻に対応付けて記憶し、所定のユーザ操作を検出した場合に、操作対象のWebページに含まれる特徴ワードを取得し、取得した検索クエリからユーザ操作を行ったユーザのユーザ識別情報に対応する検索クエリを抽出し、取得した特徴ワードと、抽出された検索クエリに含まれる検索ワードとを、関連語として関連語DB12cに登録することにより、所定のユーザの操作を契機に、ユーザ操作と関連が深い特徴ワードと、ユーザ識別情報に対応する検索クエリの検索ワードを関連ワードとして登録しているため、ユーザの関連性を担保しつつ、ユーザの操作に対応した特徴ワードと、検索クエリの検索ワードとを精度の高い関連語として登録できる。
【0130】
また、関連語登録サーバ10が、抽出した検索クエリから、所定のユーザ操作を検出した操作時刻より取得時刻が前であり、かつ、取得時刻に基づく連続性がある検索クエリを特定または抽出する場合、特徴ワードの関連ワードとして登録する対象となる検索ワードを含む検索クエリを取得時刻に基づく連続性がある検索クエリに絞ることができ、検索クエリを特定または抽出する精度を向上させて関連語の精度を向上させることができる。
【0131】
また、関連語登録サーバ10が、取得時刻に基づく連続性がある検索クエリとして、互いの取得時刻の間隔が第2の所定時間T2内の検索クエリを特定または抽出する場合、取得時刻に基づく連続性として、互いの取得時刻の間隔が第2の所定時間T2内を容易に抽出でき、取得時刻に基づく連続性がある検索クエリに絞ることができるため、検索クエリを特定または抽出する精度を向上させて関連語の精度を向上させることができる。
【0132】
また、関連語登録サーバ10が、取得時刻が最も遅い検索クエリの取得時刻より取得時刻が前であり、かつ、取得時刻に基づく連続性がある検索クエリを特定または抽出する場合、取得時刻に基づく連続性がある検索クエリに絞ることができ、検索クエリを特定または抽出する精度を向上させて関連語の精度を向上させることができる。
【0133】
なお、関連語登録サーバ10が、抽出された検索クエリのうち、取得時刻が最も遅い検索クエリ(例えば検索クエリ91)を除いて、検索クエリを特定または抽出してもよい。この場合、関連語として利用される検索ワードの精度を向上させて、関連語の精度を向上させることができる。
【0134】
さらになお、関連語登録サーバ10は、図17に示すように、取得時刻に基づく連続性がある検索クエリとして、取得時刻が検索クエリ91の取得時刻から第1の所定時間T1内(取得時刻に基づく連続性の一例)の検索クエリ92、93を特定してもよい。また、関連語登録サーバ10は、取得時刻に基づく連続性がある検索クエリとして、検索クエリ記憶手段により記憶された検索クエリにおいて、取得時刻が最も遅い検索クエリ91の取得時刻から第1の所定時間T1内に取得した検索クエリ92、93を抽出してもよい。
【0135】
これらの場合、所定のユーザ操作の検出時刻に最も近い検索クエリ91の取得時刻から所定時間内に存在する検索クエリを検索クエリ92、93として特定するので、所定のユーザ操作との関連性が高くなり、検索クエリを特定または抽出する精度が向上し、関連語の精度を向上させることができる。
【0136】
また、関連語登録サーバ10が、第1の所定時間T1または第2の所定時間T2(取得時刻に基づく連続性の一例)を設定する場合、例えば、所定のユーザ操作の種類に合わせて、第1の所定時間T1または第2の所定時間T2を変動させることができるので、所定のユーザ操作の種類に応じた精度の高い検索クエリを特定または抽出することができ、関連語の精度を向上させることができる。さらに、図18に示すように、第1の所定時間T1および第2の所定時間T2を設定する場合、第1の所定時間T1および第2の所定時間T2の設定に応じた検索クエリ92を高精度に抽出することができ、関連語の精度を向上させることができる。
【0137】
また、関連語登録サーバ10が、関連語登録手段により登録された関連語の登録数に基づき、第1の所定時間T1または第2の所定時間T2を設定してもよい。例えば、関連語DB12cに登録された関連語が増加して、関連語を増加させる必要がない場合、所定時間T1、T2を短くして、第1の検索クエリに取得時間が近い検索クエリ92が減少し、新たに登録される関連語の件数を減少させることができる。さらに、取得時間が近いので時間的な関連性が強まり、関連語の精度も向上させることができる。また、関連語DB12cの初期状態や、関連語の登録数が少ない場合、所定時間T1、T2を長くして、登録数を増加させ、関連語DB12cを充実させることができる。
【0138】
また、関連語登録サーバ10が、商品DB22a等における検索において、検索クエリと共にカテゴリ情報も取得し、カテゴリ情報が一致し、検索クエリ91より取得時刻が前であり、かつ、取得時刻に基づく連続性がある検索クエリ92、93を特徴ワードの関連ワードとして登録する対象となる検索ワードを含む検索クエリとして特定してもよい。例えば、図19に示すように、関連語登録サーバ10が、検索クエリを検索クエリログDB12aに記憶する際、カテゴリ情報(カテゴリC1、C2)等と共に検索クエリを記憶する。そして、関連語登録サーバ10が、第1の検索クエリ91のカテゴリC1と一致し、検索クエリ91より取得時刻が前であり、かつ、取得時刻に基づく連続性(例えば第1の所定時間T1内にある場合)がある検索クエリ92を特徴ワードの関連ワードとして登録する対象となる検索ワードを含む検索クエリとして特定または抽出する。
【0139】
カテゴリ情報が一致する検索クエリに絞ることにより、検索クエリを高精度に特定または抽出しているので、関連語の精度を向上させることができる。なお、関連語登録サーバ10は、カテゴリ情報が一致し、ユーザの識別情報に対応し、かつ、取得時刻に基づく連続性がある検索クエリを抽出してもよい。
【0140】
また、関連語登録サーバ10が、検索クエリ91の取得時刻より前であり、かつ、取得時刻に基づく連続性がある検索クエリであって、検索結果数が所定値以下である検索クエリ92を特定してもよい。例えば、図19に示すように、検索件数が0件である検索クエリ92を特定する。なお、検索件数が0件である場合は、タイプミスや勘違いの検索ワードを入力した場合や複数の検索ワードをand条件で含んでいる検索クエリなどが挙げられる。前記検索クエリは、未完成な検索クエリであると考えることができ、この未完成の検索クエリと、完成した検索クエリと関連が深い特徴ワードが関連語として登録できるので、ユーザが目標とする検索対象に早くたどり着きやすい関連語の精度を向上させることができる。
【0141】
なお、この場合、検索クエリに基づき情報提供サーバ20が検索を行った場合の検索結果の件数を、関連語登録サーバ10は情報提供サーバ20から取得して、検索クエリログDB12aに検索クエリと共に記憶する。さらに、関連語登録サーバ10は、ユーザの識別情報に対応し、かつ、取得時刻に基づく連続性がある検索クエリであって、検索結果数が所定値以下である検索クエリを抽出してもよい。
【0142】
さらにまた、関連語登録サーバ10が、所定のユーザ操作から操作時間を算出し、当該操作時間に基づき、第1の所定時間T1または第2の所定時間T2を設定してもよい。動画の再生時間や、動画の一時停止し検索を始める場合、Webページの閲覧時間や検索時間等のユーザの操作パターンに合わせて、所定時間T1または第2の所定時間T2を設定でき、設定された所定時間T1または第2の所定時間T2に応じて、検索クエリを特定または抽出できるので、関連語の精度を向上させることができる。
【0143】
また、関連語登録サーバ10が、所定のユーザ操作として動画の再生情報を検出し、当該再生情報に基づき、動画の再生時間や再生回数又は動画再生時間経過後の操作開始までの経過時間等の動画再生特性値を算出し、動画再生特性値が閾値以上の場合に、ユーザ識別情報に対応する検索クエリを抽出してもよい。例えば、再生時間が長い動画や再生回数が多い動画は、ユーザが求めていた動画やユーザが飽きていない動画であることが多く、ユーザの目的に近い検索対象にたどり着けた場合と言えるので、検索クエリは精度の高い、より完成された検索クエリとなり、この完成された検索クエリと関連が深い特徴ワードを関連語として登録できるので、関連語の精度を向上させることができる。
【0144】
また、関連語登録サーバ10が、検索クエリに基づく検索結果に含まれるリンク情報の内、前記所定のユーザ操作によりクリックされたリンク情報の数が、所定数以上の場合に、ユーザ識別情報に対応する検索クエリを抽出してもよい。例えば、検索結果であるWebページにおいて、当該Webページに含まれるリンク情報の内、クリックされたリンク数が所定数以上の場合に、前記検索結果はユーザの関心がある情報を多く含んでいるため、(クリックされたリンク情報数が所定数未満の検索結果に対応する検索クエリに対して)前記検索結果に対応する検索クエリはよりユーザの意図にあった検索クエリであるので、検索クエリ91の精度がより向上し、この完成された検索クエリと関連が深い特徴ワードの精度も向上して、関連語の精度を向上させることができる。なお、関連語登録サーバ10は、ユーザID毎や、IPアドレスに対応するドメイン毎に、クリックされたリンク情報の数を集計する。
【0145】
また、ステップS6において、特徴ワードを抽出するユーザ操作の操作対象のWebページとして、検索クエリ91による検索結果のWebページでもよい。
【0146】
なお、本実施形態の以上の処理は、端末30で行ってもよい。端末30において、関連語が生成され、所定数の関連語が端末に蓄積したら、関連語登録サーバ10に送信する。なお、検索クエリログや、関連語データベースは、記憶部32に構築される。また、関連語登録用プログラムは、情報提供サーバ20等から提供されるウェブブラウザのプラグイン(例えばツールバー等)の中に組み込まれるように構成しても良い。また、ユーザの端末30で処理が行われるため、検索クエリの抽出等においてユーザIDの照合は不要である。また、特徴ワードは関連語登録サーバ10から取得する。
【0147】
具体的には、端末30のシステム制御部36は、ステップS1において、操作部34からユーザの操作を検出し、ステップS2において、検出したユーザ操作が検索か否かを判定する。例えば、図7において、Webページ50の検索ボタン52がクリックされた場合、端末30のシステム制御部36は、ステップS4において、検索ワード記入欄51に入力されている検索ワードを検索クエリログ構築用に取得する。
【0148】
次に、端末30のシステム制御部36は、ステップS5において、取得時刻に対応付けて検索クエリを記憶部12に記憶する。
【0149】
端末30のシステム制御部36が、ステップS3において、操作部34から所定のユーザ操作を検出すると、ステップS6において、特徴ワードを関連語登録サーバ10から取得するための信号をまず送信する。具体的には、端末30のシステム制御部36、検索クエリ91を特定してから、検索クエリ91の検索結果に対応したWebページ70のURL等と共に、関連語登録サーバ10に送信する。
【0150】
そして、端末30のシステム制御部36は、関連語登録サーバ10から特徴ワードを取得する。
【0151】
次に、端末30のシステム制御部36は、ステップS7において、検索クエリを抽出し、ステップS8において、検索クエリを特定する。
【0152】
次に、端末30のシステム制御部36は、ステップS8において、抽出した検索クエリのうち、第1の検索クエリまでの各検索クエリ間の取得時刻間隔が所定時間内の候補検索クエリを抽出する。
【0153】
次に、端末30のシステム制御部36は、ステップS9において、抽出した特徴ワードと、特定した検索クエリとを関連語として記憶部32やRAM36cに記憶する。
【0154】
次に、端末30のシステム制御部36は、関連語の登録数が、所定の閾値以上を超えた場合や、所定の時刻又は関連語登録サーバ10に関連語を送信してから所定の時間が経過した場合等に、関連語を関連語登録サーバ10に送信する。また、端末30のシステム制御部36は、関連語が生成される度に、関連語登録サーバ10に関連語を送信してもよい。このように端末30は、取得した特徴ワードと、特定された検索クエリの検索ワードとを、登録用の関連語として関連語登録装置に送信する関連語送信手段の一例として機能する。
【0155】
なお、ショッピングサイトは、ネットワーク3に接続した外部ECサイトでもよく、情報提供サーバ20は、商品検索に限らず、一般の検索サーバでもよい。
【0156】
さらに、本発明は、上記各実施形態に限定されるものではない。上記各実施形態は、例示であり、本発明の特許請求の範囲に記載された技術的思想と実質的に同一な構成を有し、同様な作用効果を奏するものは、いかなるものであっても本発明の技術的範囲に包含される。
【符号の説明】
【0157】
1:関連語登録システム
10:関連語登録サーバ(関連語登録装置)
12a:検索クエリログDB
12b:特徴ワード用DB
12c:関連語DB
20:情報提供サーバ
22a:商品DB
30:端末(関連語登録装置)
32:記憶部
【特許請求の範囲】
【請求項1】
ユーザが入力した検索ワードを含む検索クエリを取得する検索クエリ取得手段と、
前記取得した検索クエリを、ユーザ識別情報、および、前記検索クエリの取得時刻に対応付けて記憶する検索クエリ記憶手段と、
所定のユーザ操作を検出した場合に、前記ユーザ操作の操作対象のWebページに含まれる特徴ワードを取得する特徴ワード取得手段と、
前記ユーザ操作を行ったユーザのユーザ識別情報に対応する検索クエリを抽出する検索クエリ抽出手段と、
前記抽出した検索クエリから、前記取得時刻に基づき候補検索クエリを特定する候補検索クエリ特定手段と、
前記取得した特徴ワードと、前記特定された候補検索クエリに含まれる検索ワードとを、関連語データベースに関連語として登録する関連語登録手段と、
を備えた関連語登録装置。
【請求項2】
請求項1に記載の関連語登録装置において、
前記候補検索クエリ特定手段が、前記抽出された検索クエリのうち、前記取得時刻が最も遅い検索クエリを除いた検索クエリを、前記候補検索クエリとして特定することを特徴とする関連語登録装置。
【請求項3】
請求項1または請求項2に記載の関連語登録装置において、
前記候補検索クエリ特定手段が、前記抽出した検索クエリから、前記所定のユーザ操作を検出した操作時刻より取得時刻が前であり、かつ、前記取得時刻に基づく連続性がある検索クエリを前記候補検索クエリとして特定することを特徴とする関連語登録装置。
【請求項4】
請求項2または請求項3に記載の関連語登録装置において、
前記候補検索クエリ特定手段が、前記操作時刻から第1の所定時間内の検索クエリを候補検索クエリとして特定することを特徴とする関連語登録装置。
【請求項5】
請求項2から請求項4のいずれか1項に記載の関連語登録装置において、
前記候補検索クエリ特定手段が、互いの取得時刻の間隔が第2の所定時間内の検索クエリを候補検索クエリとして特定することを特徴とする関連語登録装置。
【請求項6】
請求項2から請求項5のいずれか1項に記載の関連語登録装置において、
前記候補検索クエリ取得手段が、検索において、前記検索クエリと共にカテゴリ情報を取得し、
前記候補検索クエリ特定手段が、前記カテゴリ情報に一致し、前記操作時刻より取得時刻が前であり、かつ、前記取得時刻に基づく連続性がある検索クエリを候補検索クエリとして特定することを特徴とする関連語登録装置。
【請求項7】
請求項2から請求項6のいずれか1項に記載の関連語登録装置において、
前記候補検索クエリ特定手段が、前記操作時刻より取得時刻が前であり、かつ、前記取得時刻に基づく連続性がある検索クエリであって、検索結果数が所定値以下である検索クエリを候補検索クエリとして特定することを特徴とする関連語登録装置。
【請求項8】
請求項1から請求項7のいずれか1項に記載の関連語登録装置において、
前記特徴ワード取得手段が、前記Webページを形態素解析して前記特徴ワードを取得することを特徴とする関連語登録装置。
【請求項9】
請求項8に記載の関連語登録装置において、
前記特徴ワード取得手段が、前記Webページを構成している各コンテンツの出現頻度を計算し、前記出現頻度に基づいてコンテンツを特定し、当該特定されたコンテンツに対して形態素解析して特徴ワードを取得することを特徴とする関連語登録装置。
【請求項10】
ユーザが入力した検索ワードを含む検索クエリを取得する検索クエリ取得手段と、
前記取得した検索クエリを、ユーザ識別情報、および、前記検索クエリの取得時刻に対応付けて記憶する検索クエリ記憶手段と、
所定のユーザ操作を検出した場合、操作対象のWebページに含まれる特徴ワードを取得する特徴ワード取得手段と、
前記取得した検索クエリから、前記ユーザ操作を行ったユーザのユーザ識別情報に対応する候補検索クエリを抽出する候補検索クエリ抽出手段と、
前記取得した特徴ワードと、前記抽出された候補検索クエリに含まれる検索ワードとを、関連語データベースに関連語として登録する関連語登録手段と、
を備えた関連語登録装置。
【請求項11】
請求項10に記載の関連語登録装置において、
前記候補検索クエリ抽出手段が、前記ユーザ操作を行ったユーザのユーザ識別情報に対応し、かつ、前記取得時刻に基づく連続性がある候補検索クエリを抽出することを特徴とする関連語登録装置。
【請求項12】
請求項11に記載の関連語登録装置において、
前記候補検索クエリ抽出手段が、前記取得時刻に基づく連続性がある検索クエリとして、前記検索クエリ記憶手段により記憶された検索クエリにおいて、前記取得時刻が最も遅い検索クエリの取得時刻から第1の所定時間内に取得した候補検索クエリを抽出することを特徴とする関連語登録装置。
【請求項13】
請求項11または請求項12に記載の関連語登録装置において、
前記候補検索クエリ抽出手段が、前記取得時刻に基づく連続性がある検索クエリとして、互いの取得時刻の間隔が第2の所定時間内の候補検索クエリを抽出することを特徴とする関連語登録装置。
【請求項14】
請求項11から請求項13のいずれか1項に記載の関連語登録装置において、
前記検索クエリ取得手段が、検索において、前記検索クエリと共にカテゴリ情報を取得し、
前記候補検索クエリ抽出手段が、前記カテゴリ情報に一致し、前記ユーザの識別情報に対応し、かつ、前記取得時刻に基づく連続性がある候補検索クエリを抽出することを特徴とする関連語登録装置。
【請求項15】
請求項11から請求項14のいずれか1項に記載の関連語登録装置において、
前記候補検索クエリ抽出手段が、前記ユーザの識別情報に対応し、かつ、前記取得時刻に基づく連続性がある検索クエリであって、検索結果数が所定値以下である検索クエリを候補検索クエリとして抽出することを特徴とする関連語登録装置。
【請求項16】
関連語を登録する関連語登録装置の関連語登録方法において、
前記関連語登録装置が、ユーザが入力した検索ワードを含む検索クエリを取得する検索クエリ取得ステップと、
前記関連語登録装置が、前記取得した検索クエリを、ユーザ識別情報、および、前記検索クエリの取得時刻に対応付けて記憶する検索クエリ記憶ステップと、
前記関連語登録装置が、所定のユーザ操作を検出した場合に、前記ユーザ操作の操作対象のWebページに含まれる特徴ワードを取得する特徴ワード取得ステップと、
前記関連語登録装置が、前記ユーザ操作を行ったユーザのユーザ識別情報に対応する検索クエリを抽出する検索クエリ抽出ステップと、
前記関連語登録装置が、前記抽出した検索クエリから、前記取得時刻に基づき候補検索クエリを特定する候補検索クエリ特定ステップと、
前記関連語登録装置が、前記取得した特徴ワードと、前記特定された候補検索クエリに含まれる検索ワードとを、関連語データベースに関連語として登録する関連語登録ステップと、
を含む関連語登録方法。
【請求項17】
コンピュータを、
ユーザが入力した検索ワードの検索クエリを取得する検索クエリ取得手段、
前記取得した検索クエリを、ユーザ識別情報、および、前記検索クエリの取得時刻に対応付けて記憶する検索クエリ記憶手段、
所定のユーザ操作を検出した場合に、前記ユーザ操作の操作対象のWebページに含まれる特徴ワードを取得する特徴ワード取得手段、
前記ユーザ操作を行ったユーザのユーザ識別情報に対応する検索クエリを抽出する検索クエリ抽出手段、
前記抽出した検索クエリから、前記取得時刻に基づき候補検索クエリを特定する候補検索クエリ特定手段、および、
前記取得した特徴ワードと、前記特定された候補検索クエリに含まれる検索ワードとを、関連語データベースに関連語として登録する関連語登録手段として機能させる関連語登録装置用プログラム。
【請求項18】
コンピュータを、
ユーザが入力した検索ワードの検索クエリを取得する検索クエリ取得手段、
前記取得した検索クエリを、ユーザ識別情報、および、前記検索クエリの取得時刻に対応付けて記憶する検索クエリ記憶手段、
所定のユーザ操作を検出した場合に、前記ユーザ操作の操作対象のWebページに含まれる特徴ワードを取得する特徴ワード取得手段、
前記ユーザ操作を行ったユーザのユーザ識別情報に対応する検索クエリを抽出する検索クエリ抽出手段、
前記抽出した検索クエリから、前記取得時刻に基づき候補検索クエリを特定する候補検索クエリ特定手段、および、
前記取得した特徴ワードと、前記特定された候補検索クエリに含まれる検索ワードとを、関連語データベースに関連語として登録する関連語登録手段として機能させる関連語登録装置用プログラムを記録したコンピュータ読み取り可能な記録媒体。
【請求項19】
端末と、前記端末とネットワークを介して接続され、前記端末からの関連語を受信する関連語登録装置と、前記関連語を登録する関連語データベースと、を備えた関連語登録システムにおいて、
前記端末が、
ユーザが入力した検索ワードの検索クエリを取得する検索クエリ取得手段と、
前記取得した検索クエリを、ユーザ識別情報、および、前記検索クエリの取得時刻に対応付けて記憶する検索クエリ記憶手段と、
所定のユーザ操作を検出した場合に、前記ユーザ操作の操作対象のWebページに含まれる特徴ワードを取得する特徴ワード取得手段と、
前記ユーザ操作を行ったユーザのユーザ識別情報に対応する検索クエリを抽出する検索クエリ抽出手段と、
前記抽出した検索クエリから、前記取得時刻に基づき候補検索クエリを特定する候補検索クエリ特定手段と、
前記取得した特徴ワードと、前記特定された候補検索クエリに含まれる検索ワードとを、登録用の関連語として前記関連語登録装置に送信する関連語送信手段と、を備え、
前記関連語登録装置が、
前記受信した特徴ワードと候補検索クエリに含まれる検索ワードとを、前記関連語データベースに関連語として登録する関連語登録手段を備えたことを特徴とする関連語登録システム。
【請求項1】
ユーザが入力した検索ワードを含む検索クエリを取得する検索クエリ取得手段と、
前記取得した検索クエリを、ユーザ識別情報、および、前記検索クエリの取得時刻に対応付けて記憶する検索クエリ記憶手段と、
所定のユーザ操作を検出した場合に、前記ユーザ操作の操作対象のWebページに含まれる特徴ワードを取得する特徴ワード取得手段と、
前記ユーザ操作を行ったユーザのユーザ識別情報に対応する検索クエリを抽出する検索クエリ抽出手段と、
前記抽出した検索クエリから、前記取得時刻に基づき候補検索クエリを特定する候補検索クエリ特定手段と、
前記取得した特徴ワードと、前記特定された候補検索クエリに含まれる検索ワードとを、関連語データベースに関連語として登録する関連語登録手段と、
を備えた関連語登録装置。
【請求項2】
請求項1に記載の関連語登録装置において、
前記候補検索クエリ特定手段が、前記抽出された検索クエリのうち、前記取得時刻が最も遅い検索クエリを除いた検索クエリを、前記候補検索クエリとして特定することを特徴とする関連語登録装置。
【請求項3】
請求項1または請求項2に記載の関連語登録装置において、
前記候補検索クエリ特定手段が、前記抽出した検索クエリから、前記所定のユーザ操作を検出した操作時刻より取得時刻が前であり、かつ、前記取得時刻に基づく連続性がある検索クエリを前記候補検索クエリとして特定することを特徴とする関連語登録装置。
【請求項4】
請求項2または請求項3に記載の関連語登録装置において、
前記候補検索クエリ特定手段が、前記操作時刻から第1の所定時間内の検索クエリを候補検索クエリとして特定することを特徴とする関連語登録装置。
【請求項5】
請求項2から請求項4のいずれか1項に記載の関連語登録装置において、
前記候補検索クエリ特定手段が、互いの取得時刻の間隔が第2の所定時間内の検索クエリを候補検索クエリとして特定することを特徴とする関連語登録装置。
【請求項6】
請求項2から請求項5のいずれか1項に記載の関連語登録装置において、
前記候補検索クエリ取得手段が、検索において、前記検索クエリと共にカテゴリ情報を取得し、
前記候補検索クエリ特定手段が、前記カテゴリ情報に一致し、前記操作時刻より取得時刻が前であり、かつ、前記取得時刻に基づく連続性がある検索クエリを候補検索クエリとして特定することを特徴とする関連語登録装置。
【請求項7】
請求項2から請求項6のいずれか1項に記載の関連語登録装置において、
前記候補検索クエリ特定手段が、前記操作時刻より取得時刻が前であり、かつ、前記取得時刻に基づく連続性がある検索クエリであって、検索結果数が所定値以下である検索クエリを候補検索クエリとして特定することを特徴とする関連語登録装置。
【請求項8】
請求項1から請求項7のいずれか1項に記載の関連語登録装置において、
前記特徴ワード取得手段が、前記Webページを形態素解析して前記特徴ワードを取得することを特徴とする関連語登録装置。
【請求項9】
請求項8に記載の関連語登録装置において、
前記特徴ワード取得手段が、前記Webページを構成している各コンテンツの出現頻度を計算し、前記出現頻度に基づいてコンテンツを特定し、当該特定されたコンテンツに対して形態素解析して特徴ワードを取得することを特徴とする関連語登録装置。
【請求項10】
ユーザが入力した検索ワードを含む検索クエリを取得する検索クエリ取得手段と、
前記取得した検索クエリを、ユーザ識別情報、および、前記検索クエリの取得時刻に対応付けて記憶する検索クエリ記憶手段と、
所定のユーザ操作を検出した場合、操作対象のWebページに含まれる特徴ワードを取得する特徴ワード取得手段と、
前記取得した検索クエリから、前記ユーザ操作を行ったユーザのユーザ識別情報に対応する候補検索クエリを抽出する候補検索クエリ抽出手段と、
前記取得した特徴ワードと、前記抽出された候補検索クエリに含まれる検索ワードとを、関連語データベースに関連語として登録する関連語登録手段と、
を備えた関連語登録装置。
【請求項11】
請求項10に記載の関連語登録装置において、
前記候補検索クエリ抽出手段が、前記ユーザ操作を行ったユーザのユーザ識別情報に対応し、かつ、前記取得時刻に基づく連続性がある候補検索クエリを抽出することを特徴とする関連語登録装置。
【請求項12】
請求項11に記載の関連語登録装置において、
前記候補検索クエリ抽出手段が、前記取得時刻に基づく連続性がある検索クエリとして、前記検索クエリ記憶手段により記憶された検索クエリにおいて、前記取得時刻が最も遅い検索クエリの取得時刻から第1の所定時間内に取得した候補検索クエリを抽出することを特徴とする関連語登録装置。
【請求項13】
請求項11または請求項12に記載の関連語登録装置において、
前記候補検索クエリ抽出手段が、前記取得時刻に基づく連続性がある検索クエリとして、互いの取得時刻の間隔が第2の所定時間内の候補検索クエリを抽出することを特徴とする関連語登録装置。
【請求項14】
請求項11から請求項13のいずれか1項に記載の関連語登録装置において、
前記検索クエリ取得手段が、検索において、前記検索クエリと共にカテゴリ情報を取得し、
前記候補検索クエリ抽出手段が、前記カテゴリ情報に一致し、前記ユーザの識別情報に対応し、かつ、前記取得時刻に基づく連続性がある候補検索クエリを抽出することを特徴とする関連語登録装置。
【請求項15】
請求項11から請求項14のいずれか1項に記載の関連語登録装置において、
前記候補検索クエリ抽出手段が、前記ユーザの識別情報に対応し、かつ、前記取得時刻に基づく連続性がある検索クエリであって、検索結果数が所定値以下である検索クエリを候補検索クエリとして抽出することを特徴とする関連語登録装置。
【請求項16】
関連語を登録する関連語登録装置の関連語登録方法において、
前記関連語登録装置が、ユーザが入力した検索ワードを含む検索クエリを取得する検索クエリ取得ステップと、
前記関連語登録装置が、前記取得した検索クエリを、ユーザ識別情報、および、前記検索クエリの取得時刻に対応付けて記憶する検索クエリ記憶ステップと、
前記関連語登録装置が、所定のユーザ操作を検出した場合に、前記ユーザ操作の操作対象のWebページに含まれる特徴ワードを取得する特徴ワード取得ステップと、
前記関連語登録装置が、前記ユーザ操作を行ったユーザのユーザ識別情報に対応する検索クエリを抽出する検索クエリ抽出ステップと、
前記関連語登録装置が、前記抽出した検索クエリから、前記取得時刻に基づき候補検索クエリを特定する候補検索クエリ特定ステップと、
前記関連語登録装置が、前記取得した特徴ワードと、前記特定された候補検索クエリに含まれる検索ワードとを、関連語データベースに関連語として登録する関連語登録ステップと、
を含む関連語登録方法。
【請求項17】
コンピュータを、
ユーザが入力した検索ワードの検索クエリを取得する検索クエリ取得手段、
前記取得した検索クエリを、ユーザ識別情報、および、前記検索クエリの取得時刻に対応付けて記憶する検索クエリ記憶手段、
所定のユーザ操作を検出した場合に、前記ユーザ操作の操作対象のWebページに含まれる特徴ワードを取得する特徴ワード取得手段、
前記ユーザ操作を行ったユーザのユーザ識別情報に対応する検索クエリを抽出する検索クエリ抽出手段、
前記抽出した検索クエリから、前記取得時刻に基づき候補検索クエリを特定する候補検索クエリ特定手段、および、
前記取得した特徴ワードと、前記特定された候補検索クエリに含まれる検索ワードとを、関連語データベースに関連語として登録する関連語登録手段として機能させる関連語登録装置用プログラム。
【請求項18】
コンピュータを、
ユーザが入力した検索ワードの検索クエリを取得する検索クエリ取得手段、
前記取得した検索クエリを、ユーザ識別情報、および、前記検索クエリの取得時刻に対応付けて記憶する検索クエリ記憶手段、
所定のユーザ操作を検出した場合に、前記ユーザ操作の操作対象のWebページに含まれる特徴ワードを取得する特徴ワード取得手段、
前記ユーザ操作を行ったユーザのユーザ識別情報に対応する検索クエリを抽出する検索クエリ抽出手段、
前記抽出した検索クエリから、前記取得時刻に基づき候補検索クエリを特定する候補検索クエリ特定手段、および、
前記取得した特徴ワードと、前記特定された候補検索クエリに含まれる検索ワードとを、関連語データベースに関連語として登録する関連語登録手段として機能させる関連語登録装置用プログラムを記録したコンピュータ読み取り可能な記録媒体。
【請求項19】
端末と、前記端末とネットワークを介して接続され、前記端末からの関連語を受信する関連語登録装置と、前記関連語を登録する関連語データベースと、を備えた関連語登録システムにおいて、
前記端末が、
ユーザが入力した検索ワードの検索クエリを取得する検索クエリ取得手段と、
前記取得した検索クエリを、ユーザ識別情報、および、前記検索クエリの取得時刻に対応付けて記憶する検索クエリ記憶手段と、
所定のユーザ操作を検出した場合に、前記ユーザ操作の操作対象のWebページに含まれる特徴ワードを取得する特徴ワード取得手段と、
前記ユーザ操作を行ったユーザのユーザ識別情報に対応する検索クエリを抽出する検索クエリ抽出手段と、
前記抽出した検索クエリから、前記取得時刻に基づき候補検索クエリを特定する候補検索クエリ特定手段と、
前記取得した特徴ワードと、前記特定された候補検索クエリに含まれる検索ワードとを、登録用の関連語として前記関連語登録装置に送信する関連語送信手段と、を備え、
前記関連語登録装置が、
前記受信した特徴ワードと候補検索クエリに含まれる検索ワードとを、前記関連語データベースに関連語として登録する関連語登録手段を備えたことを特徴とする関連語登録システム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【公開番号】特開2012−103924(P2012−103924A)
【公開日】平成24年5月31日(2012.5.31)
【国際特許分類】
【出願番号】特願2010−252328(P2010−252328)
【出願日】平成22年11月10日(2010.11.10)
【出願人】(399037405)楽天株式会社 (416)
【Fターム(参考)】
【公開日】平成24年5月31日(2012.5.31)
【国際特許分類】
【出願日】平成22年11月10日(2010.11.10)
【出願人】(399037405)楽天株式会社 (416)
【Fターム(参考)】
[ Back to top ]