情報処理装置、情報処理システムおよび情報処理方法
【課題】ユーザからの明示的な指示入力を必要とせずに、ユーザが検索を行った際の状況や位置情報及びユーザが発行した検索クエリに応じて検索結果のローカライズを動的に行う。
【解決手段】ユーザが検索クエリを発行すると、状況情報生成部2100が状況情報を生成する。この状況情報に基づいて現在位置に応じた地域が特定される。標本データ生成部2300は、発行された検索クエリと特定された地域に基づいてサーバ側検索ログ記憶領域221に記憶された検索ログデータより標本データを生成する。スコア導出式生成部2400は、この標本データを入力として回帰分析を行いスコア導出式を生成する。スコア導出部2500は、このスコア導出式と状況情報とに基づいて、検索クエリが有する地域関連度を定量的に数値化した第1の地域関連度スコアを導出する。入出力部2000は、第1の地域関連度スコアに基づいて出力対象を制御した検索結果を出力する。
【解決手段】ユーザが検索クエリを発行すると、状況情報生成部2100が状況情報を生成する。この状況情報に基づいて現在位置に応じた地域が特定される。標本データ生成部2300は、発行された検索クエリと特定された地域に基づいてサーバ側検索ログ記憶領域221に記憶された検索ログデータより標本データを生成する。スコア導出式生成部2400は、この標本データを入力として回帰分析を行いスコア導出式を生成する。スコア導出部2500は、このスコア導出式と状況情報とに基づいて、検索クエリが有する地域関連度を定量的に数値化した第1の地域関連度スコアを導出する。入出力部2000は、第1の地域関連度スコアに基づいて出力対象を制御した検索結果を出力する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は情報検索の技術に関する。
【背景技術】
【0002】
携帯電話機を代表とする移動通信端末の高機能化および普及率の向上により、ユーザは、移動通信端末を用いてインターネット上の情報にアクセスしたり、インターネット上の検索エンジンを利用して必要な情報を検索することが可能となった。移動通信端末には、ユーザにより携帯可能であるという特徴があるため、この移動通信端末を用いた情報検索においては、自宅やオフィス等に設置されたパーソナルコンピュータを使用した情報検索とは異なり、例えばユーザの現在位置や現在時刻等の、ユーザが置かれている状況に即した検索結果の提示が行われることが望ましい。例えば、ユーザが昼食時に或るA駅に居て飲食店に関する情報を検索した場合、そのA駅周辺の飲食店の情報を検索結果として提示した方が、情報を取得するユーザにとっても、情報を提供するコンテンツプロパイダにとっても、より望ましいと言える。
【0003】
上記のように、ユーザが置かれている状況に応じた検索結果を提示するためには、コンテンツなどと呼ばれる様々な情報と、そのコンテンツが関連する位置や地域とを対応付けておく必要がある。例えば特許文献1には、位置情報とコンテンツとを対応づけておき、その位置情報に基づいてコンテンツのメタデータを階層的に整理したコンテンツ一覧リストをサーバから端末に配信することで、端末の位置に関連するコンテンツへのアクセスを容易にする技術が開示されている。また特許文献2には、コンテンツに含まれる位置情報とリンク情報を収集することで、位置に関連するコンテンツを探索・蓄積する技術が開示されている。さらに非特許文献1には、コンテンツに対する自然言語解析、話題解析及び閲覧ユーザ分析に基づき、各コンテンツがどの程度位置に関連するものであるかどうかを判定する技術が開示されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2005−301701号公報
【特許文献2】特開2002−189748号公報
【非特許文献】
【0005】
【非特許文献1】馬 強,松本 知弥子,田中 克己,“ページ内容と位置情報に基づくWebコンテンツのローカル度検出とその応用” 電子情報通信学会技術研究報告,DE,データ工学 102(209) pp.115−120 20020712
【発明の概要】
【発明が解決しようとする課題】
【0006】
上記のような従来の技術によって、ユーザは、自身の位置に関連する内容の検索結果を取得することが可能となる。しかしながら、そのユーザが検索を行うときにそのユーザの位置に関連する内容の検索結果を本当に望んでいるか否かを逐一確認しているわけではないから、ユーザが自身の位置に関連する内容の検索結果を望んでない場合には、都合が悪い。そこで、ユーザが自身の位置に関連する内容の検索結果を望んでいるか否かを検索時に逐一確認するようにしてもよいが、これでは、ユーザはその確認作業が煩わしいと感じることがある。また、ユーザが自身の位置に関連する検索結果を望むか望まないかというの2択でしかユーザの意図を反映することが出来ないから、例えば、自身の位置に関連したコンテンツも見たいが、同時に、自身の位置とは関係のない人気のあるコンテンツも見たい、といったことをユーザが意図していた場合に、そのようなユーザの意図に応えることが困難である。
【0007】
本発明は、上述の背景を鑑みてなされたものであり、ユーザの位置に関連する検索結果を提示するか否かをユーザが置かれた状況に応じて判断することを可能とする。
【課題を解決するための手段】
【0008】
上記課題を解決するため、本発明は、検索の内容を表す検索クエリがユーザによって指定されたときの、当該ユーザが置かれた状況を表す状況情報であって、少なくとも当該ユーザの位置を含む状況情報を生成する状況情報生成手段と、ユーザによって新たに指定された前記検索クエリと同一または予め決められた類似範囲に収まる内容であり、当該新たに指定された検索クエリよりも過去に指定された検索クエリである過去検索クエリと、当該過去検索クエリがユーザによって指定されたときの当該ユーザが置かれた状況を表す前記状況情報と、当該過去検索クエリがユーザによって指定されたときの当該ユーザの位置に当該過去検索クエリが関連性を有するか否かを特定する検索クエリ地域関連特定情報との組み合わせで構成される1組以上の標本データが与えられると、過去に蓄積された多次元の変数からなる標本データを分析して新たな多次元の変数に対して確率的に解を得る方法を用いることによって、ユーザが新たに指定した前記検索クエリが当該検索クエリを指定したときのユーザの位置にどの程度関連しているかの度合いを表す第1の地域関連度スコアを前記状況情報を入力して導出するための計算式であるスコア導出式を生成するスコア導出式生成手段と、前記スコア導出式生成手段により生成されたスコア導出式に、前記状況情報生成手段により生成された状況情報を入力して、ユーザが新たに指定した検索クエリに対する前記第1の地域関連度スコアを導出するスコア導出手段とを備えることを特徴とする情報処理装置を提供する。
【0009】
上記情報処理装置において、前記ユーザの位置と、前記ユーザの属性と、前記検索クエリが指定された時刻とを取得する取得手段を更に備え、前記状況情報生成手段は、前記取得手段が取得した位置、ユーザの属性、及び時刻に関する情報を含む前記状況情報を生成するようにしてもよい。
【0010】
また、ユーザによって指定された前記検索クエリに従って検索した結果得られたコンテンツである検索結果コンテンツを取得するコンテンツ取得手段と、前記コンテンツ取得手段により取得された各々の前記検索結果コンテンツが、当該検索結果コンテンツを検索するために用いられた前記検索クエリが指定されたときのユーザの位置に関連性を有するか否かを特定し、特定した結果を表すコンテンツ地域関連特定情報を、各々の当該検索結果コンテンツに付与するコンテンツ地域関連判別手段と、前記スコア導出手段により導出された第1の地域関連度スコアが閾値を超えていた場合に、前記ユーザの位置に関連性を有することを表す前記コンテンツ地域関連特定情報が付与された検索結果コンテンツのみを、前記ユーザの端末装置に送信する送信手段とを備えるようにしてもよい。
【0011】
さらに、前記コンテンツ取得手段は、前記検索結果コンテンツに加えて、各々の前記検索結果コンテンツが前記検索クエリと適合している度合いを表す元スコアを取得し、前記スコア導出手段は、前記元スコアと前記第1の地域関連度スコアと前記コンテンツ地域関連特定情報とを予め定められた計算式に入力して、前記各々の検索結果コンテンツが、当該検索結果コンテンツを検索するために用いられた前記検索クエリが指定されたときのユーザの位置に関連している度合いを表す第2の地域関連度スコアを導出し、前記送信手段は、前記第2の地域関連度スコアが高い順序から優先してユーザに提示されるように、前記検索結果コンテンツを前記端末装置に送信するようにしてもよい。
【0012】
また、本発明は、上述した情報処理装置に与える標本データを生成する情報処理装置であって、ユーザによって指定された検索の内容を表す検索クエリと、当該検索クエリが指定されたときに前記ユーザが置かれていた状況を表す状況情報であって、少なくとも当該ユーザの位置を含む状況情報との組み合わせで構成される1組以上の検索履歴データのうち、各々の当該検索履歴データについて、前記検索クエリが指定されたときのユーザの位置と関連性を有するか否かを表す検索クエリ地域関連特定情報を生成して付与する検索クエリ地域関連判別手段と、前記検索クエリ地域関連特定情報が付与された検索履歴データの中から、ユーザによって新たに指定された検索クエリと同一または予め決められた類似範囲に収まる内容であり、当該新たに指定された検索クエリよりも過去に指定された検索クエリである過去検索クエリと、当該過去検索クエリが指定されたときのユーザが置かれた状況を表す状況情報と、当該過去検索クエリが指定されたときのユーザの位置に当該過去検索クエリが関連性を有するか否かを特定する検索クエリ地域関連特定情報との組み合わせで構成される検索履歴データを抽出し、前記標本データとして生成する標本データ生成手段とを有することを特徴とする情報処理装置を提供する。
【0013】
さらに、前記検索クエリ地域関連判別手段は、ユーザによって指定された検索の内容を表す検索クエリと、当該検索クエリが指定されたときに前記ユーザが置かれていた状況を表す状況情報であって、少なくとも当該ユーザの位置を含む状況情報と、当該検索クエリに従って検索手段が検索した結果得られたコンテンツのうちユーザがアクセスしたコンテンツである検索結果コンテンツと、当該検索結果コンテンツに付与され、当該検索結果コンテンツを検索するために用いられた前記検索クエリが指定されたときのユーザの位置と当該検索結果コンテンツが関連性を有するか否かを特定する情報であるコンテンツ地域関連特定情報との組み合わせで構成される1組以上の検索履歴データのうち、各々の当該検索履歴データについて、前記検索クエリが指定されたときのユーザの位置と関連性を有することを表すコンテンツ地域関連特定情報が付与された検索結果コンテンツに前記ユーザがアクセスしていたか否かを判別し、当該検索結果コンテンツにユーザがアクセスしていた場合には、前記位置に関連性を有することを表す検索クエリ地域関連特定情報を生成して付与し、アクセスしていなかった場合には、前記位置に関連性を有しないことを表す検索クエリ地域関連特定情報を生成して付与するようにしてもよい。
【0014】
また、本発明は、検索の内容を表す検索クエリがユーザによって指定されたときの、当該ユーザが置かれた状況を表す状況情報であって、少なくとも当該ユーザの位置を含む状況情報を生成する状況情報生成手段と、ユーザによって新たに指定された前記検索クエリと同一または予め決められた類似範囲に収まる内容であり、当該新たに指定された検索クエリよりも過去に指定された検索クエリである過去検索クエリと、当該過去検索クエリがユーザによって指定されたときの当該ユーザが置かれた状況を表す前記状況情報と、当該過去検索クエリが指定されたときのユーザの位置に当該過去検索クエリが関連性を有するか否かを特定する検索クエリ地域関連特定情報との組み合わせで構成される1組以上の標本データが与えられると、過去に蓄積された多次元の変数からなる標本データを分析して新たな多次元の変数に対して確率的に解を得る方法を用いることによって、ユーザが新たに指定した前記検索クエリが当該検索クエリを指定したときのユーザの位置にどの程度関連しているかの度合いを表す第1の地域関連度スコアを前記状況情報を入力して導出するための計算式であるスコア導出式を生成するスコア導出式生成手段と、前記スコア導出式生成手段により生成されたスコア導出式に、前記状況情報生成手段により生成された状況情報を入力して、ユーザが新たに指定した検索クエリに対する前記第1の地域関連度スコアを導出するスコア導出手段と、前記検索クエリと、当該検索クエリが指定されたときに生成された前記状況情報との組み合わせで構成される1組以上の検索履歴データを記憶する検索履歴記憶手段とを有する第1の情報処理装置と、前記検索履歴記憶手段によって記憶されている検索履歴データの各々について、前記検索クエリが指定されたときのユーザの位置と関連性を有するか否かを表す検索クエリ地域関連特定情報を生成して付与する検索クエリ地域関連判別手段と、前記検索クエリ地域関連特定情報が付与された検索履歴データのうち、ユーザによって新たに指定された検索クエリと同一または予め決められた類似範囲に収まる内容であり、当該新たに指定された検索クエリよりも過去に指定された検索クエリである過去検索クエリと、当該過去検索クエリが指定されたときのユーザが置かれた状況を表す前記状況情報と、当該過去検索クエリが指定されたときのユーザの位置に当該過去検索クエリが関連性を有するか否かを特定する検索クエリ地域関連特定情報との組み合わせで構成される検索履歴データを抽出し、前記第1の情報処理装置に前記標本データとして与える標本データ生成手段とを有する第2の情報処理装置とを備えることを特徴とする情報処理システムを提供する。
【0015】
また、本発明は、情報処理装置又は情報処理システムが行う情報処理方法であって、検索手段によって行われる検索の内容を表す検索クエリがユーザによって指定されたときの当該ユーザが置かれた状況を表す状況情報であって、少なくとも当該ユーザの位置を含む状況情報を生成する状況情報生成ステップと、前記検索クエリと、当該検索クエリが指定されたときに生成された前記状況情報との組み合わせで構成される1組以上の検索履歴データを記憶する検索履歴記憶ステップと、前記検索履歴記憶ステップにおいて記憶された各々の検索履歴データについて、前記検索クエリが指定されたときのユーザの位置と関連性を有するか否かを表す検索クエリ地域関連特定情報を生成して付与する検索クエリ地域関連判別ステップと、前記検索履歴記憶ステップにおいて記憶された検索履歴データのうち、ユーザによって新たに指定された検索クエリと同一または予め決められた類似範囲に収まる内容であり、当該新たに指定された検索クエリよりも過去に指定された検索クエリである過去検索クエリと、当該過去検索クエリが指定されたときのユーザが置かれた状況を表す前記状況情報と、当該過去検索クエリが指定されたときのユーザの位置に当該過去検索クエリが関連性を有するか否かを特定する検索クエリ地域関連特定情報との組み合わせで構成される検索履歴データを抽出し、標本データとして生成する標本データ生成ステップと、1組以上の前記標本データに対し、過去に蓄積された多次元の変数からなる標本データを分析して新たな多次元の変数に対して確率的に解を得る方法を用いることによって、ユーザが新たに指定した前記検索クエリが当該検索クエリの指定されたときの当該ユーザの位置にどの程度関連しているかの度合いを表す第1の地域関連度スコアを前記状況情報を入力して導出するための計算式であるスコア導出式を生成するスコア導出式生成ステップと、前記スコア導出式生成ステップにおいて生成されたスコア導出式に、前記状況情報生成ステップにおいて生成された状況情報を入力して、ユーザが新たに指定した検索クエリに対する前記第1の地域関連度スコアを導出するスコア導出ステップとを備えることを特徴とする情報処理方法を提供する。
【発明の効果】
【0016】
本発明によれば、ユーザの位置に関連する検索結果を提示するか否かをユーザが置かれた状況に応じて判断するための仕組みを構築することができる。
【図面の簡単な説明】
【0017】
【図1】本発明の実施形態におけるシステムの構成を表した図である。
【図2】移動通信端末1のハードウェア構成を表したブロック図である。
【図3】検索ログデータの内容を示す図である。
【図4】サーバ装置2のハードウェア構成を表したブロック図である。
【図5】移動通信端末1およびサーバ装置2の機能構成を表したブロック図である。
【図6】状況情報の具体例を表した図である。
【図7】状況情報ビット列の具体例を表した図である。
【図8】標本データ生成部が標本データを生成する際の動作を表した図である。
【図9】標本データの具体例を表した図である。
【図10】第2の地域関連度スコアと検索結果コンテンツの関係を表した図である。
【図11】検索開始から検索終了までの処理フローである。
【図12】第1の地域関連度スコアを導出する際の処理フローである。
【図13】第2の地域関連度スコアを導出する際の処理フローである。
【発明を実施するための形態】
【0018】
次に、図面を参照して本発明の実施形態について説明する。
なお、これから述べる実施形態の説明においては、使用する用語の意味を適宜定義しているが、理解を容易にするため、まずは、代表的な用語の定義を以下に記しておく。
「検索クエリ」とは、検索手段である検索サーバ装置が行う検索の内容を表した検索条件であり、ユーザが指定した検索文字列及び検索式からなる。
「検索クエリに応じた地域」とは、ユーザが端末装置を用いて検索クエリを指定したときに、この端末装置(つまりユーザ)が所在する地域の地域名のことである。
「検索結果コンテンツ」とは、検索サーバ装置が検索クエリに基づいて検索した結果得たコンテンツのことである。
「検索クエリ地域関連特定情報」とは、或る検索クエリが、この検索クエリに応じた地域と関連を持っているか否かを特定する情報である。
「コンテンツ地域関連特定情報」は、或る検索結果コンテンツが、この検索結果コンテンツを検索したときに用いられた検索クエリに応じた地域と関連を持っているか否かを特定する情報である。
「元スコア」とは、検索結果コンテンツの各々に付与される、検索クエリとの適合度を表す数値である。
「ローカライズ」とは“地域に関連している”ことを言い、例えば「検索クエリがローカライズを意図している」とは、“検索クエリが地域に関連したコンテンツの検索を意図している”ということを意味する。また、「検索結果コンテンツがローカライズされている」とは、“検索結果コンテンツが地域に関連している”ということを意味する。
「第1の地域関連度スコア」とは、ユーザがどの程度ローカライズされた検索結果を望んでいるかの度合い、すなわちユーザが指定した検索クエリがこの検索クエリに応じた地域に対して有する地域関連度を定量的に数値化したものである。
「第2の地域関連度スコア」は、検索クエリに適合した検索結果コンテンツの各々が、この検索クエリに応じた地域にどの程度関係しているか、すなわち各検索結果コンテンツがこの検索クエリに応じた地域に対して有する地域関連度を定量的に数値化したものである。
【0019】
(1)実施形態の説明
(1−1)システム全体の構成
図1は、本発明の実施形態におけるシステムの構成を表した図である。
このシステムは、移動通信端末1と、サーバ装置2と、ネットワークNWとを備えている。移動通信端末1は、例えば携帯電話機、無線LAN(Local Area Network)端末、またはノートパソコンのような、ユーザが携帯可能かつ無線通信が可能な情報処理装置であり、図1では携帯電話機の例を挙げている。ネットワークNWは、例えば移動体通信網やゲートウェイ、インターネットを含む通信網である。サーバ装置2は、ネットワークNWを介して移動通信端末1と情報のやり取りを行い、その移動通信端末1のユーザの位置に関連する検索結果を提示するか否かを、そのユーザが置かれた状況に応じて判断する情報処理装置である。これらのうち、移動通信端末1は複数存在している。また、ネットワークNWには、図示しないサーバ装置群が接続されている。
【0020】
(1−2)移動通信端末1のハードウェア構成
図2は、移動通信端末1のハードウェア構成を表したブロック図である。
移動通信端末1は、制御部11、記憶部12、表示部13、操作部14、無線通信部15、位置特定部16および電源制御部17を備えており、これらの各部がバス18を介して互いに接続されている。制御部11は、CPU(Central Processing Unit)111、RAM(Random Access Memory)112およびROM(Read Only Memory)113を有する。CPU111は、ROM113や記憶部12に記憶されているコンピュータプログラムを読み出しRAM112にロードして実行することにより、移動通信端末1の各部を制御して、例えば表示機能、操作機能、通信機能などの各種機能を実現する。RAM112は、CPU111が処理を行う際のワークエリアとなる。
【0021】
表示部13は、液晶ディスプレイなどの表示体やVRAM(Video Random Access Memory)などのメモリを備えており、制御部11の制御の下で各種の画像を表示する。操作部14は、複数のキーを有しており、ユーザによってこれらのキーが操作されるとその操作内容に応じた信号を制御部11へ供給する。制御部11は、この信号に基づいて操作内容を判断して処理を行う。無線通信部15は、制御部11の制御の下で、図示しない移動体通信網の基地局と無線通信を行う。この無線通信によって、ネットワークNWに接続されたサーバ装置群と移動通信端末1との間で、各種情報の送受信が行われる。ネットワークNWに接続されたサーバ装置群には、コンテンツと呼ばれる情報を、指定された検索条件に従って検索する検索サーバ装置が含まれている。移動通信端末1は、この検索サーバ装置あるいはサーバ装置2に対してコンテンツの検索を要求することで、その検索結果を得る。位置特定部16は、GPS(Global Positioning System)方式によって測位を行うものであり、移動通信端末1の現在位置を特定し、これを緯度・経度で表した位置情報を生成する。電源制御部17は、バッテリーを備え、このバッテリーから供給された電力を移動通信端末1に供給する。
【0022】
記憶部12は、例えばEEPROM(Electrically Erasable and Programmable ROM)やフラッシュメモリなどの不揮発性の記憶手段であり、ユーザ属性121を記憶するほか、端末側検索ログ記憶領域122を有している。ユーザ属性121は、移動通信端末1の利用者であるユーザの性別、年齢、住所等の、ユーザの各種属性である。これらのユーザ属性121は、ユーザにより操作部14を介して移動通信端末1に入力され、この記憶部12に記憶される。
【0023】
前述したように、移動通信端末1は、無線通信部15の通信機能を用いて、ネットワークNWを介して検索サーバ装置に対して検索を要求し、その検索結果を取得することができる。このとき、検索サーバ装置に対する検索要求には、ユーザが検索を行う際に指定した検索文字列と、この検索文字列におけるand条件あるいはor条件等の検索式とが含まれる。これらの検索文字列及び検索式の組み合わせを「検索クエリ」と呼ぶ。そして、ユーザが検索クエリを指定して検索を指示した際に、移動通信端末1、つまりその端末装置を携帯するユーザが所在する地域の地域名のことを、「検索クエリに応じた地域」と呼ぶ。
【0024】
記憶部12の端末側検索ログ記憶領域122には、検索サーバ装置によって行われた検索に関連する各種情報が、その検索の履歴を表す検索ログデータとして記憶される。この検索ログデータは、図3に示すように、「検索クエリ」と、「検索クエリに応じた地域」と、「状況情報ビット列」と、「検索結果コンテンツ」と、「コンテンツ地域関連特定情報」とを含んでいる。これらの内容を以下に簡単に説明する。
【0025】
まず、検索クエリおよび検索クエリに応じた地域は、既に説明したとおりの内容である。状況情報ビット列は、ユーザにより検索クエリが指定された際に、そのユーザが置かれた状況を2値のビット列で表したものである。検索結果コンテンツは、この検索クエリに応じて検索された結果得られたコンテンツのうち、ユーザがアクセスしたコンテンツのことである。コンテンツ地域関連特定情報は、検索結果コンテンツが、検索クエリに応じた地域と関連を持っているか否かを特定する情報である。ユーザが、特定の検索に対して複数のコンテンツにアクセスしていた場合、アクセスしたコンテンツの数だけ検索クエリに紐づく検索ログデータが記憶される。これらの検索ログデータに付加される検索クエリ、検索クエリに応じた地域および状況情報ビット列は共通のものである。つまり、検索ログデータは、検索クエリと、この検索クエリに適合しユーザがアクセスした検索結果コンテンツの1つとの組み合わせを単位として記憶される。
【0026】
(1−3)サーバ装置2のハードウェア構成
図4は、サーバ装置2のハードウェア構成を表したブロック図である。
サーバ装置2は、制御部21、記憶部22、通信制御部23および電源制御部24を備えており、これらの各部がバス25を介して互いに接続されている。制御部21は、CPU211、RAM212およびROM213を有する。CPU211は、ROM213や記憶部22に記憶されているコンピュータプログラムを読み出しRAM212にロードして実行することにより、サーバ装置2の各部を制御して、例えば演算機能、通信機能などの各種機能を実現する。RAM212は、CPU211が処理を行う際のワークエリアとなる。記憶部22は、例えばEEPROMやフラッシュメモリなどの不揮発性の記憶手段であり、サーバ側検索ログ記憶領域221を有している。サーバ側検索ログ記憶領域221は、移動通信端末1から取得した検索ログデータを蓄積して記憶する。通信制御部23は、制御部21の制御の下で、図示しない通信網の基地局と通信を行う。この通信によって、サーバ装置2とネットワークNWに接続されたネットワーク上の検索サーバ装置や移動通信端末1との間で、各種情報の送受信が行われる。サーバ装置2は、この検索サーバ装置に対してコンテンツの検索を要求することで、その検索結果を得る。検索サーバ装置とは、インターネットに存在するウェブページ、ウェブサイト、画像ファイル、ネットニュースなどの情報を検索する機能を備えたサーバ装置であり、特定の文字列および検索式から構成される検索クエリを指定されると、この検索クエリに適合する検索結果を返すものである。電源制御部24は、バッテリーおよびコンセントに差し込まれる電源プラグを備え、このバッテリーあるいはコンセントに差し込まれた電源プラグを通じて供給された電力をサーバ装置2に供給する。
【0027】
(1−4)移動通信端末1およびサーバ装置2の機能構成
図5は、移動通信端末1およびサーバ装置2の機能構成を表したブロック図である。
サーバ装置2の制御部21は、RAM212をワークエリアとしてROM213又は記憶部22に記憶されたコンピュータプログラムを実行することにより、入出力部2000、状況情報生成部2100、コンテンツ処理部2200、標本データ生成部2300、スコア導出式生成部2400及びスコア導出部2500の各機能を実現する。以降においてサーバ装置2の制御部21が実現する各機能に関する説明では、これら各機能を動作の主体として表現するが、その主体の実体は、CPU211である。サーバ装置2は、入出力部2000を通じて移動通信端末1と情報のやり取りを行う。以降の説明において、移動通信端末1とサーバ装置2との間における情報のやりとりは、移動通信端末1の無線通信部15とサーバ装置2の通信制御部23とがネットワークNWを介して通信を行うことで実現される。また、サーバ装置2は、図示しない検索サーバ装置と通信を行うことで、検索サーバ装置へ検索要求を送信したり、検索サーバ装置から検索結果を受信するなど、互いに連携して動作する。
【0028】
移動通信端末1の制御部11は、RAM112をワークエリアとしてROM113又は記憶部12に記憶されたコンピュータプログラムを実行することにより、検索部19の機能を実現する。以降の検索部19に関する説明では、検索部19を動作の主体として表現するが、その主体の実体は、CPU111である。検索部19は、ユーザが操作部14を用いて入力した検索文字列および検索式に基づいて検索クエリを生成し、この検索クエリを含む検索要求を送信して入出力部2000に入力する。そして、検索部19は、検索クエリに基づいてサーバ装置2が出力した検索結果を入出力部2000より取得し、これを表示部13に表示してユーザに提示する。検索部19が生成し、入出力部2000が受け取った検索クエリは、コンテンツ取得部2210が検索サーバ装置を通じて検索結果を取得するとき及び標本データ生成部2300が標本データなるものを生成するときに用いられるため、入出力部2000からコンテンツ処理部2200及び標本データ生成部2300に入力される。
【0029】
検索部19は、検索クエリとともに、位置特定部16によって生成された移動通信端末1の現在位置に基づく緯度・経度で表した位置情報を入出力部2000に入力する。緯度・経度で表した位置情報は、状況情報生成部2100が検索クエリに応じた地域を特定するときに用いられるため、入出力部2000から状況情報生成部2100に入力される。また、検索部19は、端末側検索ログ記憶領域122に記憶された検索ログデータのうち、ユーザが指定した検索クエリに該当する検索ログデータを入出力部2000に入力する。さらに検索部19は、ユーザ属性121に記憶されたユーザの属性情報を入出力部2000に入力する。ユーザの属性情報は、状況情報生成部2100が状況情報なるものを生成するときに用いられるため、入出力部2000から状況情報生成部2100に入力される。つまり入出力部2000は、ユーザの位置と、ユーザの属性とを取得する取得手段の一例である。端末側検索ログ記憶領域122に記憶された検索ログデータは、入出力部2000からサーバ側検索ログ記憶領域221に入力され、記憶される。
【0030】
状況情報生成部2100は、ユーザが検索クエリを指定した時点における、そのユーザが置かれた状況を表す状況情報を生成する状況情報生成手段である。状況情報生成部2100は、入出力部2000より入力された移動通信端末1の位置情報およびユーザの属性情報に基づいて状況情報を生成する。状況情報は、図6に示すように、位置情報、属性情報および時刻情報を含んでいる。これらの位置情報、属性情報および時刻情報は、全て、ユーザが置かれている状況を表すものとして考える。以下、これらの内容をそれぞれ説明する。
まず、位置情報は、ユーザが検索クエリを指定した時点におけるそのユーザの位置に関する情報であり、緯度、経度、住所からの距離及び移動状況という項目の内容を含んでいる。緯度、経度は、位置特定部16によって生成された位置情報に含まれる緯度・経度である。住所からの距離は、入出力部2000より受け取ったユーザの属性情報に含まれるユーザの住所と、上記の緯度・経度とに基づいて生成されたものである。この住所からの距離は、例えば、ユーザの住所を中心として上記緯度、経度の位置が半径3km以内にあれば「近い」という内容になり、両者がそれ以上の距離離れていれば「遠い」という内容になる。この「近い」と「遠い」の判定基準である「半径3km」という閾値は、サーバ装置2が備える記憶部22が予め記憶してもよいし、移動通信端末1の記憶部12に記憶されユーザにより変更可能としてもよい。この閾値が移動通信端末1の記憶部12に記憶される場合、検索部19により検索クエリが入出力部2000に入力された後に、更にこの検索部19により閾値が入出力部2000に入力される。入出力部2000は受け取った閾値を状況情報生成部2100に入力する。なお、この閾値は、「半径3km」以外の値であってもよい。また、移動状況は、位置特定部16により定期的に特定されるユーザの位置が時間の経過とともに変化していないかまたは変化しているかに応じて、「留まっている」または「移動している」という内容になる。
【0031】
次に、属性情報は、検索クエリを指定したユーザの年齢が属する年代とその性別という項目の内容を含む。年代は、入出力部2000から受け取ったユーザの属性情報に含まれるユーザの年齢に基づいて、「若年層/青年層/中年層/高年層」の中から状況情報生成部2100が選択した内容となる。例えば0歳〜18歳であれば若年層、19歳〜35歳であれば青年層、36歳〜55歳であれば中年層、56歳以上であれば高年層、といった具合である。この年齢と年代の対応関係は、サーバ装置2の記憶部22が記憶する図示しない変換テーブルに記述されており、状況情報生成部2100はこれを参照して年代を選択する。性別は、入出力部2000から受け取ったユーザの属性情報に含まれているものである。
【0032】
そして、時刻情報は、ユーザが検索クエリを指定した時刻に関する情報であり、「朝/昼/夕/夜/深夜」という時間帯と、「平日/休前日/休日」という休日区分と、「1月〜12月」という月という項目の内容を含んでいる。時間帯は、状況情報生成部2100が有する計時機能によって計時される時刻に基づいて、朝/昼/夕/夜/深夜から選択された内容となる。休日区分や月は、状況情報生成部2100が有するカレンダー機能に基づいて特定される。つまり状況情報生成部2100は、検索クエリが指定された時刻を取得する取得手段の一例である。
【0033】
また、状況情報生成部2100は、地域変換テーブル2110を用いて、生成した位置情報に応じた地域名を特定する。例えば位置情報が北緯35.66、東経139.70である場合に、状況情報生成部2100は、地域変換テーブル2110を用いて、この位置情報から“渋谷駅周辺”といった地域名を特定し、これを状況情報に含まれる位置情報に対応付けて記憶する。検索クエリが指定されたときに状況情報生成部2100により特定された地域名が、前述した「検索クエリに応じた地域」である。この特定された地域名は、コンテンツ地域関連判別部2220が検索結果コンテンツにコンテンツ地域関連特定情報を付与するときと、標本データ生成部2300が標本データを生成するときに用いられるため、状況情報生成部2100からコンテンツ処理部2200及び標本データ生成部2300のそれぞれに出力される。
【0034】
また、状況情報生成部2100は、この状況情報を構成する各項目の内容を「0」もしくは「1」で表現した状況情報ビット列を生成する。具体的には、状況情報を構成する各項目に当てはまる場合は「1」、当てはまらない場合は「0」というルールに従って並べられた「1」または「0」からなる2値のデータ列が状況情報ビット列となる。
ここで、図7は、上述した状況情報において、住所からの距離が「近い」であり、性別が「女性」であり、時間帯が「朝」である場合の、その状況情報ビット列の一部の内容を例示したものである。この例では、住所からの距離が「近い」という項目に当てはまるため、この項目には「1」が割り当てられている。一方、住所からの距離が「遠い」という項目には当てはまらないため、この項目には「0」が割り当てられている。なお、図7に表されていない項目として、「移動速度/留まっている」、「移動速度/移動している」、「休日区分/平日」、「休日区分/休前日」、「休日区分/休日」といったものがある。なお、状況情報ビット列には、位置情報における緯度・経度は含まれない。このような状況情報ビット列は、スコア導出部2500が第1の地域関連度スコアを導出するときにもちいられるため、状況情報生成部2100からスコア導出部2500に出力される。また、ユーザによる一連の検索処理が終了した際に、状況情報ビット列は検索ログデータに付加されて端末側検索ログ記憶領域123に記憶されるため、生成された状況情報ビット列は、検索クエリに基づいてサーバ装置2が出力した検索結果と共に入出力部2000を通じて検索部19に出力される。
【0035】
再び、図5の説明に戻る。
コンテンツ処理部2200は、コンテンツ取得部2210およびコンテンツ地域関連判別部2220を有している。コンテンツ取得部2210は、入出力部2000より受け取った検索クエリを用いて図示しない検索サーバ装置と通信を行い、この検索クエリに適合する検索結果を取得する。コンテンツ取得部2210により取得された検索結果には、検索結果コンテンツと、各検索結果コンテンツに対する元スコアが含まれている。検索結果コンテンツとは、検索サーバ装置が検索クエリに基づいて検索した結果として得たコンテンツである。この検索結果コンテンツは、各コンテンツの格納場所を意味するURL(Uniform Resource Locator)と、この各コンテンツの見出しにより構成されており、コンテンツそのものを含んではいないが、上記URLと見出しによりコンテンツを入手可能であるから、コンテンツを実質的に含んでいると言える。元スコアとは、検索結果コンテンツの各々に付与される、検索クエリとの適合度を表す数値である。つまり、コンテンツ取得部2210は、検索の結果であるコンテンツおよび各々のコンテンツが検索クエリと適合している度合いを表す元スコアを取得するコンテンツ取得手段である。この元スコアは検索サーバ装置により算出され、元スコアの高い順に検索結果コンテンツが並べ替えられて表示部13に表示される。また、このように検索結果コンテンツが元スコアに応じて並び替えられて表示される場合のほか、入出力部2000がこの検索結果コンテンツの表示順序を、地域との関連度に応じて変更する等の処理を行ってから表示部13に表示される場合もある。この地域との関連度は、スコア導出部2500により第1の地域関連度スコア及び第2の地域関連度スコアとして導出され、入出力部2000に与えられる。第1の地域関連度スコアは、検索クエリに対する検索結果コンテンツの表示対象を絞り込むために用いられる。第2の地域関連度スコアは、この検索結果の表示順序を変更するために用いられる。
【0036】
コンテンツ地域関連判別部2220は、コンテンツ取得部2210によって取得された検索結果コンテンツと、状況情報生成部2100によって生成された状況情報に含まれる「検索クエリに応じた地域」とを用いて、その検索結果コンテンツがその地域にローカライズされたものであるか否かを判別するコンテンツ地域関連判別手段である。「検索結果コンテンツがローカライズされている」とは、“検索結果コンテンツが地域に関連している”ということを意味する。そしてコンテンツ地域関連判別部2220は、この判別の結果に従ってコンテンツ地域関連特定情報を生成し、各検索結果コンテンツに付与する。ここでコンテンツ地域関連特定情報とは、ある検索結果コンテンツが、検索クエリに応じた地域と関連を持っているか否かを特定する情報である。この検索結果コンテンツと、コンテンツ地域関連特定情報とは、スコア導出部2500が第2の地域関連度スコアを導出するときに用いられるため、コンテンツ地域関連判別部2220からスコア導出部2500に出力される。この時、各検索結果コンテンツに紐づく元スコアも、コンテンツ地域関連判別部2220からスコア導出部2500に出力される。
【0037】
サーバ側検索ログ記憶領域221は、入出力部2000が受け取った移動通信端末1の検索ログデータを蓄積して記憶する。サーバ側検索ログ記憶領域221が記憶する検索ログデータは、特定の移動通信端末から受け取る検索ログデータに限ったものではなく、異なる多数の移動通信端末からサーバ装置2に送信され入出力部2000が受け取った検索ログデータである。つまり、サーバ側検索ログ記憶領域221には、異なる多数のユーザによって行われた検索に関する履歴情報が検索ログデータとして記憶されている。このように、サーバ側検索ログ記憶領域221は、検索の履歴を記憶する検索履歴記憶手段として機能する。
【0038】
標本データ生成部2300は、検索クエリ地域関連判別部2310を有する。検索クエリ地域関連判別部2310は、ユーザが指定した検索クエリと、この検索クエリに応じた地域と、サーバ側検索ログ記憶領域221に記憶された検索ログデータとを入力情報として、各検索ログデータに対する検索クエリ地域関連特定情報を生成して付与する検索クエリ地域関連判別手段である。検索クエリ地域関連特定情報とは、前述したとおり、検索クエリが、この検索クエリに応じた地域と関連を持っているか、すなわち、検索クエリがローカライズを意図しているか否かを特定する情報である。検索ログデータにおいて、検索クエリに適合した検索結果コンテンツのうち、この検索クエリに応じた地域に関連を持っているコンテンツにユーザがアクセスしていた場合、ユーザはローカライズされた検索結果を望んでいたと可能性が考えられるため、この検索クエリについてもローカライズを意図しているとみなすことが可能である。よって、このような検索クエリに対しては、ローカライズを意図しているということを意味する検索クエリ地域関連特定情報が付与されることになる。また、標本データ生成部2300は、ユーザが指定した検索クエリと、この検索クエリに応じた地域と、サーバ側検索ログ記憶領域221に記憶され検索クエリ地域関連判別部2310により検索クエリ地域関連特定情報が付与された検索ログデータとを入力情報として、標本データを生成する標本データ生成手段としても機能する。標本データは、後述するスコア導出式生成部2400がスコア導出式を生成する際の入力情報として使用されるため、標本データ生成部2300は、生成した標本データをスコア導出式生成部2400に出力する。
【0039】
スコア導出式生成部2400は、標本データ生成部2300により生成された標本データを用いて、スコア導出式を生成するスコア導出式生成手段である。ここで、スコア導出式とは、スコア導出部2500が第1の地域関連度スコアを導出するための計算式であり、スコア導出式生成部2400から、スコア導出手段であるスコア導出部2500に出力される。スコア導出式生成部2400からスコア導出部2500にスコア導出式が入力されると、スコア導出部2500は、このスコア導出式に対し、検索クエリがユーザにより指定されたときに状況情報生成部2100により生成された状況情報ビット列を代入して、第1の地域関連度スコアを導出する。第1の地域関連度スコアは、ユーザが検索を望んだときにどの程度ローカライズされた検索結果を望んでいるかの度合い、すなわちユーザが指定した検索クエリが、この検索クエリに応じた地域に対して有する地域関連度を定量的に数値化したものである。この第1の地域関連度スコアは、前述したように、入出力部2000が検索クエリに適合する検索結果の表示対象を絞り込む際の判定基準に使用される。
【0040】
また、スコア導出部2500は、検索クエリに適合する検索結果コンテンツと、各検索結果コンテンツに付与された元スコアと、各検索結果コンテンツに付与されたコンテンツ地域関連特定情報と、第1の地域関連度スコアとを用いて、第2の地域関連度スコアを導出する。第2の地域関連度スコアは、検索クエリに適合した検索結果コンテンツの各々が、この検索クエリに応じた地域にどの程度関係しているか、すなわち各検索結果コンテンツが、この検索クエリに応じた地域に対して有する地域関連度を定量的に数値化したものである。この第2の地域関連度スコアは、前述したように、入出力部2000が検索クエリに適合する検索結果の表示順序を変更する際の判定基準に使用される。このようにスコア導出部2500は、第1の地域関連度スコアおよび第2の地域関連度スコアを導出するスコア導出手段として機能する。
【0041】
(1−5)コンテンツ地域関連特定情報の生成方法
ここで、前述したコンテンツ地域関連特定情報の生成方法について説明する。
入出力部2000よりユーザが指定した検索クエリを受け取ると、コンテンツ取得部2210は、ネットワーク上の検索サーバ装置を通じて、この検索クエリに適合する検索結果を取得する。この検索結果は、検索クエリの内容のみに基づいて検索サーバ装置が検索した結果であり、検索結果コンテンツと、各検索結果コンテンツが保持する元スコアとが含まれている。コンテンツ地域関連判別部2220は、この検索結果コンテンツと検索クエリに応じた地域とを用いて、この各検索結果コンテンツが、この地域と関連を持つコンテンツであるか否かを判別する。この判別は、各検索結果コンテンツが保持しているメタデータに含まれる、緯度・経度や住所等の位置に関する位置情報と、検索クエリに応じた地域とが合致するか否かに基づいて行われる。そして、コンテンツ地域関連判別部2220は、この判別の結果に従って各検索結果コンテンツにコンテンツ地域関連特定情報を付与する。すなわち、コンテンツ地域関連判別部2220は、メタデータに含まれる位置情報と検索クエリに応じた地域とが合致し、検索クエリに応じた地域と関連すると判別した検索結果コンテンツには、コンテンツ地域関連特定情報として「1」の値を付与する。一方、コンテンツ地域関連判別部2220は、メタデータに含まれる位置情報と検索クエリに応じた地域とが合致せず、検索クエリに応じた地域と関連しないと判別した検索結果コンテンツには、コンテンツ地域関連特定情報として「0」の値を付与する。
【0042】
(1−6)第1の地域関連度スコアの導出
次に、ユーザが検索クエリを指定した際に、このユーザがどの程度ローカライズされた検索結果を望んでいるかの度合いである第1の地域関連度スコアをどのような考え方に基づいて導出するかを説明する。
第1の地域関連度スコアは、ユーザが指定した検索クエリの内容と、ユーザが検索クエリを指定したときのそのユーザの位置(ユーザが所在する位置を含む地域)と、検索クエリが指定されたときのユーザが置かれている状況(ただし、ユーザの位置を除く)とに依存する。この理由を説明すると次のようになる。例えばユーザが、3月乃至4月の花見の季節(つまりユーザが置かれている状況)に「桜」という検索文字列(つまり検索クエリの内容)で検索した場合には、ユーザは花見の場所を検索している可能性が高いと考えられる。この場合、ユーザの位置に近くて花見ができるような場所に関するコンテンツが上位に表示された検索結果、すなわちローカライズされた検索結果をユーザは取得出来たほうが望ましいはずである。一方、例えばユーザが、一般的に花見の季節とは言えない秋(ユーザが置かれている状況)に「桜」という検索文字列(検索クエリの内容)で検索をした場合には、植物としての「桜」そのものの特性や、「桜」という名称を含んだ楽曲等のように、花見とは別の意味で「桜」に関連するコンテンツを調べたいという可能性が高い。もちろん、この場合には、ローカライズされていない検索結果コンテンツを取得出来たほうがユーザにとって望ましいと言える。
【0043】
また、ユーザが検索クエリを指定したときの位置が異なる場合には、ローカライズされた検索結果をユーザが望んでいるか否かも異なる。例えばユーザが、昼食の時間帯(ユーザが置かれている状況)に「カレー」という検索文字列(検索クエリの内容)で検索した場合、そのユーザの位置がレストラン街に属していれば(ユーザの位置)、近辺に存在するカレー屋に関するコンテンツが上位に表示された検索結果をユーザが望んでいる可能性が高い。一方、昼食の時間帯であっても、飲食店がまったく存在しない地域にユーザがいた場合(ユーザの位置)、ユーザが近辺に存在するカレー屋に関するコンテンツを調べたいという可能性よりも、カレーのレシピや由来等を調べたいという可能性が高い。このような場合には、ローカライズされていない検索結果コンテンツを取得出来たほうがユーザにとって望ましい。
【0044】
さらに、ユーザが置かれている状況が同一でユーザの位置も同一であるときに行われた検索であっても、ユーザが指定した検索クエリの内容によって、ローカライズされた検索結果をユーザがどの程度望んでいるかが異なってくる。例えば、上記に述べた「桜」や「カレー」といった検索文字列であれば、検索クエリがローカライズを意図している可能性があるが、例えば、特定の人物名や「内閣総理大臣」のような、人間に関連する意味を持つ検索文字列の場合、検索クエリがローカライズを意図している可能性は極めて低いと考えられる。
【0045】
このように、ユーザが指定した検索クエリがローカライズを意図している可能性、つまり、第1の地域関連度スコアは、ユーザが指定した検索クエリの内容と、ユーザが検索クエリを指定した時点のユーザの位置(つまり検索クエリに応じた地域)と、検索クエリが指定されたときのユーザが置かれている状況(つまり、検索クエリをユーザが指定したときのユーザが置かれている状況情報乃至状況情報ビット列、ただし、ユーザの位置については既に考慮しているので除く)に依存するのである。
【0046】
ところで、ユーザが検索を行うにあたって、検索クエリの内容およびこの検索クエリに応じた地域との組み合わせについて共通した検索が繰り返し行われることがある。例えばユーザの職場がA駅付近にあることから、A駅近辺において飲食店について頻繁に検索を行うというような場合などである。この各検索において検索クエリの内容および地域は共通することがあっても、検索を行った際のユーザが置かれている状況はその都度異なる。そこで、ユーザが或る検索クエリを或る地域において指定した際に、それと同じ地域および同じ検索クエリの組み合わせで行われた過去の検索に関する検索履歴データを学習データとして用い、現在ユーザが置かれている状況の下で、そのユーザがどの程度ローカライズされた検索結果コンテンツを望んでいるかを推測するのが、第1の地域関連度スコアを導出するにあたっての考え方である。
【0047】
(1−7)標本データの生成方法
このような第1の地域関連度スコアを導出するべく、標本データ生成部2300は、サーバ側検索ログ記憶領域221に記憶された全ての検索ログデータから、ユーザが指定した検索クエリ及びこの検索クエリに応じた地域に該当する検索ログデータを抽出し、この抽出後の検索ログデータに含まれる状況情報ビット列をもとに、標本データなるものを生成する。
図8は、標本データ生成部2300が標本データを生成する際の動作を説明する図である。この図8において、対象データ30〜35は、サーバ側検索ログ記憶領域221に記憶されている検索ログデータである。サーバ側検索ログ記憶領域221に記憶されているということは、異なる多数のユーザにより過去に指定された検索クエリに基づいてなされた検索に関する情報ということである。抽出条件40,41は、対象データを抽出して絞り込むための抽出条件として使用される内容を意味している。標本データ50は、対象データ35から生成された標本データである。
【0048】
さらに詳細に説明すると、対象データ30は、サーバ側検索ログ記憶領域221に記憶されている全ての検索ログデータである。対象データ30に対する抽出条件40は、検索クエリ及び地域という内容を含む。抽出条件40としての検索クエリは、ユーザが指定した検索クエリである。また、抽出条件40としての地域は、この検索クエリに応じた地域のことである。標本データ生成部2300が、対象データ30を抽出条件40に含まれる地域に基づいて抽出したものが対象データ31,32である。すなわち、対象データ30における各検索ログデータには、検索クエリに応じた地域が含まれているから(図3参照)、標本データ生成部2300は、この地域を参照し、対象データ30における検索ログデータから、抽出条件40に含まれる地域に該当する検索ログデータを抽出する。図8において、抽出条件40における地域は「地域A」であるから、標本データ生成部2300が、対象データ30の中から「地域A」をキーにして抽出したものが対象データ31である。この結果、対象データ30は、地域Aに関連する対象データ31と、地域A以外の地域に関連する対象データ32とに分類されることになる。
【0049】
次に、標本データ生成部2300が、対象データ31から、抽出条件41に含まれる検索クエリに基づいて抽出したものが対象データ33,34である。抽出条件41における検索クエリは、抽出条件40における検索クエリと同一のものである。対象データ31における各検索ログデータには検索クエリが含まれているから(図3参照)、標本データ生成部2300は、この検索クエリを参照し、対象データ31における検索ログデータから、抽出条件41における検索クエリに該当する検索ログデータを抽出する。図8において、抽出条件41における検索クエリの中身は「検索クエリ1」であり、標本データ生成部2300が、対象データ31を「検索クエリ1」で抽出したものが対象データ33である。従って、対象データ33に含まれる各検索ログデータは、地域として「地域A」、検索クエリとして「検索クエリ1」を共通して含んでいる。この結果、対象データ31は、検索クエリ1に関連する対象データ33と、検索クエリ1以外の検索クエリに関連する対象データ34とに分類されることになる。
【0050】
次に、検索クエリ地域関連判別部2310は、対象データ33である検索ログデータに対して、検索クエリ地域関連特定情報45を生成して付与する。より具体的には、検索クエリ地域関連判別部2310は、対象データ33である検索ログデータに含まれる、検索クエリと、この検索クエリに基づきユーザがアクセスした検索結果コンテンツと、この検索結果コンテンツにコンテンツ地域関連判別部2220が付与したコンテンツ地域関連特定情報との組み合わせに基づいて、検索クエリ地域関連特定情報を生成して各検索ログデータに付与する。例えば、ある検索ログデータにおいて、検索結果コンテンツにコンテンツ地域関連特定情報として「1」が付与されていた場合、検索クエリ地域関連判別部2310は、この検索ログデータに対しては、検索クエリ地域関連特定情報として、検索クエリが地域関連度を有していることを意味する「1」の値を付与する。一方、検索クエリ地域関連判別部2310は、ある検索ログデータにおいて検索結果コンテンツにコンテンツ地域関連特定情報として「0」が付与されていた場合、この検索ログデータに検索クエリ地域関連特定情報として、検索クエリが地域関連度を有していないことを意味する「0」の値を付与する。
【0051】
よって、この結果得られた対象データ35は、ユーザが指定した検索クエリおよびこの検索クエリに応じた地域をキーにして抽出され、さらに、検索クエリ地域関連特定情報が付与された検索ログデータの集合ということになる。標本データ生成部2300は、この対象データ35である検索ログデータから、標本データ50を生成する。より具体的には、標本データ生成部2300は、図8の対象データ35である検索ログデータから、各々の検索ログデータに付与された検索クエリ地域関連特定情報と、その検索ログデータに含まれる状況情報ビット列を抽出し、これらを組み合わせることで標本データ50を生成する。そして、標本データ生成部2300は、生成した標本データをスコア導出式生成部2400に出力する。
【0052】
図9は、標本データ50の具体例を表した図である。
図9における標本データA,B,Cは、同一の検索クエリと同一の地域をキーにして抽出された標本データのそれぞれである。各標本データA,B,Cは、「1」もしくは「0」の値を取る検索クエリ地域関連特定情報と、2値で表現された状況情報ビット列(図7参照)とで構成されている。各標本データを構成する状況情報ビット列における各項目の内容(位置情報1,2・・、属性情報1,2・・、時刻情報1,2・・・)は、例えば図7における「住所からの距離/近い」や、「性別/男」といった、状況情報に含まれる各項目のことである。
【0053】
(1−8)スコア導出式の生成と、第1の地域関連度スコア及び第2の地域関連度スコアの導出
スコア導出式生成部2400は、標本データ生成部2300から標本データを受け取ると、これを用いてスコア導出式を生成する。スコア導出式生成部2400によるスコア導出式の生成方法は、以下のとおりである。
ユーザが発行した検索クエリqが、この検索クエリに応じた地域aに対して地域関連度を有する確率を、p(q|a)とする。スコア導出式は、この確率p(q|a)を求めるための計算式である。この計算式は、特定の地域aにおける検索クエリqで定まり、状況情報Cを引数として持つ関数Faq(C)として定義することが可能である。よって、確率p(q|a)と関数Faq(C)の関係を以下のように表すことができる。
p(q|a)=Faq(C)・・・(a)
状況情報Cには、「1」もしくは「0」のいずれかの値をとる状況情報ビット列が代入される。ここで状況情報ビット列がn個の変数で構成されるn次元の情報であるとして、これらの変数を、x1,x2,・・・,xnとおくと、式(a)は以下のような式(b)で表される。
p(q|a)=Faq(C)=Faq(x1,x2,・・・,xn)・・・(b)
【0054】
このように、多次元の変数がそれぞれ2値で表現された標本データが十分なサンプル数だけ過去に蓄積されている場合、これらの標本データを学習データとして分析し、新たな多次元の変数に対して確率的に解を得る方法として、ロジスティック回帰分析、ニューラルネットワーク或いはSVM(Support Vector Machine)等がある。例えばロジスティック回帰分析における回帰式は、以下の式(c)のように表される。
logit(p)=log(p/1−p)=b0+b1x1+b2x2+…+bnxn・・・(c)
式(c)において、係数b0〜bnの値が確定したものが、確率P(q|a)を求めるための計算式、すなわちスコア導出式となる。スコア導出式生成部2400は、取得した標本データを入力として上述の回帰式における係数b0〜bnを求めるための計算を行う。
【0055】
式(c)の左辺における真数、つまりオッズ(p/1−p)を導出するために、標本データの各々に付与された検索クエリ地域関連特定情報が用いられる。ここでは、説明を簡略化するために、状況情報ビット列が1次元の入力値を持つとする。すなわち、式(c)が以下のように表されるものとする。
logit(p)=log(p/1−p)=b0+b1x1・・・(d)
式(d)において、検索クエリ地域関連特定情報は,x1にのみ依存するということを意味している。ここで、例えば標本データが6個あり、「x1」の値と「検索クエリ地域関連特定情報」の値との組み合わせが次のような6組である例を想定する。
(x1,検索クエリ地域関連特定情報)=(1,1),(1,1),(1,0),(0,1),(0,1),(0,1)
オッズは、各変数の組(この場合はx1=1 orx1=0)の数だけ導出される。従って、標本データを構成する状況情報ビット列がn次元の2値を持つ場合、オッズは最大で2のn乗個導出されることとなる。x1=1の場合のオッズは、以下のように算出したpに従って求められることになる。
p(x1=1)=(x1=1で、且つ、検索クエリ地域関連特定情報が1であった標本データの数)/(x1=1である全ての標本データの数)・・・(e)
上述した標本データが6個の例において、式(e)に従ってp(x1=1)を算出すると、
p(x1=1)=2/3
となる。
よって、オッズは、
p/(1−p)=(2/3)/(1−2/3)=2
となる。
このようにx1=1とした場合に得られた「2」という値は、検索クエリ地域関連特定情報が「1」になる確率が、「0」になる確率の2倍となる、という意味を持つ。
【0056】
このようにして、標本データを構成する状況情報ビット列における変数の組み合わせの数だけ、オッズ、すなわち式(c)における左辺の真数の値が求められる。そして、式(c)における右辺におけるx1〜xnと、それに応じた式(c)における左辺のオッズの値とが明らかになった関係式が、標本データを構成する状況情報ビット列における変数の組み合わせの数だけ求められる。スコア導出式生成部2400は、このようにして求めた関係式に対して、最小二乗法を適用することで、左辺の誤差分散を最小とするような係数b0〜bnの組を求める。
【0057】
ここで、例えば状況情報ビット列が5次元の変数からなる場合を仮定すると、式(c)で表される回帰式は以下のように表される。
logit(p)=log(p/1−p)=b0+b1x1+b2x2+b3x3+b4x4+b5x5・・・(f)
式(f)において、例えば変数の値がb0=1,b1=1,b2=−1,b3=−1,b4=0,b5=2のように求められたとすると、式(f)は以下のようになる。
logit(p)=log(p/1−p)=1+x1−x2−x3+2x5・・・(g)
このように、式(c)において係数b0〜bnが求められた式(g)が、第1の地域関連度スコアを導出するための計算式、すなわちスコア導出式となる。スコア導出式生成部2400は、生成したスコア導出式をスコア導出部2500に出力する。
【0058】
スコア導出部2500は、ユーザが検索クエリを指定した時点における状況情報ビット列と、スコア導出式とを用いて第1の地域関連度スコアを導出する。すなわち、スコア導出部2500は、スコア導出式における変数x1,x2,・・・,xnに、状況情報ビット列に含まれるx1,x2,・・・,xnの値を代入して、スコア導出式の左辺の値、すなわち、第1の地域関連度スコアを求める。第1の地域関連度スコアは、前述したように、ある検索クエリが、この検索クエリに応じた地域に対して有する地域関連度を定量的に数値化したものである。スコア導出部2500は、導出した第1の地域関連度スコアを入出力部2000に出力する。
【0059】
上述のように第1の地域関連度スコアを導出するためには、スコア導出式が必要であるが、このスコア導出式を生成するためには、標本データが必要である。しかし、ユーザが指定した検索クエリおよびこの検索クエリに応じた地域に該当する検索ログデータについて、回帰分析が可能なほど充分な数がサーバ側検索ログ記憶領域221に存在しなかった場合、標本データ生成部2300は標本データを生成できない場合がある。こうした場合に備え、次のようにして第1の地域関連度スコアに対する仮のスコアを導出する。すなわち、サーバ側検索ログ記憶領域221に上述の検索ログデータが充分な数だけ存在しなかった場合、標本データ生成部2300は、サーバ側検索ログ記憶領域221に存在する全検索ログデータのうち、検索クエリ地域関連特定情報が「1」の値を持つ検索ログデータの数を求めると、これを全検索ログデータ数で除算する。この除算により得られた値が仮のスコアである。つまり、指定された検索クエリや地域に関わらず、いずれかの地域に地域関連度を有する検索ログデータと全ての検索ログデータとから得られる平均値を仮のスコアとするものである。
【0060】
そして、ユーザが指定した検索クエリおよびこの検索クエリに応じた地域に該当する検索ログデータが、回帰分析が可能なほど充分な数だけサーバ側検索ログ記憶領域221に記憶された時点で、標本データ生成部2300は、標本データを生成し、仮のスコアは前述したような一連の処理によって導出された第1の地域関連度スコアで置き換えられる。この回帰分析が可能なほど充分な数の最低ラインは「1」であり、望ましくは例えば「1000」である。ただし、これは検索ログデータの数に関する条件であって、実質的には、標本データが最低「1」以上なければならない。これらの数は、回帰分析が可能か否かを判断するための閾値として、サーバ装置2が備える記憶部22に予め記憶されている。
【0061】
図10は、第2の地域関連度スコアと検索結果コンテンツの関係を表した図である。
図10においては、3つの検索結果コンテンツ1〜3のそれぞれについての、元スコア、コンテンツ地域関連特定情報及び第2の地域関連度スコアの内容を例示している。スコア導出部2500は、第1の地域関連度スコアを導出した後に、第2の地域関連度スコアを導出する。前述したように、コンテンツ地域関連判別部2220よりスコア導出部2500に入力された各検索結果コンテンツは、元スコアと、コンテンツ地域関連特定情報とを含んでいる。ここで、各検索結果コンテンツについて求める第2の地域関連度スコアをS2とすると、スコア導出部2500はS2を以下の式(h)に従って求める。
S2=S1*(1−p)+S1*p*r・・・(h)
ここで、S1は各検索結果コンテンツに対する元スコアであり、pは第1の地域関連度スコアであり、rは各検索結果コンテンツに対するコンテンツ地域関連特定情報である。図10に表された第2の地域関連度スコアは、p=0.7の場合である。スコア導出部2500が、各検索結果コンテンツについて式(h)にそれぞれの変数を代入し計算を行うことで、検索結果コンテンツの各々に対する第2の地域関連度スコアが求まる。式(h)によれば、ユーザが指定した検索クエリに応じた地域に対して地域関連度を有していない検索結果コンテンツは、第2の地域関連度スコアが、元スコアより低い値となる。スコア導出部2500は、各検索結果コンテンツに対して第2の地域関連度スコアを導出すると、これを検索結果コンテンツと共に入出力部2000に出力する。
【0062】
(1−9)検索結果の表示
入出力部2000は、第1の地域関連度スコアが、予め定められた閾値以上の値を取る場合、取得した検索結果コンテンツのうち、コンテンツ地域関連特定情報に「1」の値が付与された検索結果コンテンツのみを移動通信端末1への出力対象とする。すなわち、第1の地域関連度スコアが高い値を取るほど、ユーザが検索を行った際にローカライズされた検索結果を望んでいる確率が高いため、第1の地域関連度スコアが設定された閾値を越えた場合には、入出力部2000は、ユーザが発行した検索クエリに応じた地域と関連する検索結果コンテンツのみを出力するのである。ここで定められた閾値は例えば「0.8」であり、サーバ装置2が備える記憶部22に予め記憶されてもよいし、移動通信端末1が備える記憶部12に記憶されユーザにより変更可能としてもよい。この閾値が移動通信端末1の備える記憶部12に記憶される場合、検索部19により検索クエリが入出力部2000に入力された後に、移動通信端末1のCPU111によりこの閾値が入出力部2000に入力される。
【0063】
第1の地域関連度スコアが閾値以上の場合には、入出力部2000は、コンテンツ地域関連特定情報が「1」の値である検索結果コンテンツを、第2の地域関連度スコアが高い順に検索結果コンテンツの表示順序を並び替えて検索部19に出力する。よって、ユーザが発行した検索クエリに応じた地域と関係性の無い検索結果コンテンツは、表示部13における表示順序が下がることとなるから、ユーザは、検索結果を参照するときに、ユーザ自身の位置に関連性の高い検索結果コンテンツを優先してチェックすることが可能となる。一方、第1の地域関連度スコアが閾値未満の場合、入出力部2000は、コンテンツ地域関連特定情報の値に関わらず、検索結果コンテンツを第2の地域関連度スコアが高い順に出力順序を並び替えて検索部19に出力することになる。このように入出力部2000は、第1の地域関連度スコア及び第2の地域関連度スコアを用いて検索結果の出力対象および出力順序を変更し、変更後の検索結果をユーザの端末装置に送信する送信手段として機能する。
検索部19は受け取った検索結果を表示部13に表示する。
【0064】
(1−10)検索時の動作
図11は、検索開始から検索終了までの処理フローを表している。
まず、ユーザが検索文字列および検索式を入力して検索クエリを指定すると、検索部19は、この指定を受け付ける。そして、検索部19は、この検索クエリを含む検索要求をサーバ装置2に送信し、サーバ装置2はこれを受信する(ステップS1)。移動通信端末1のCPU111は、位置特定部16によって生成された緯度・経度で表した位置情報および端末側検索ログ記憶領域122に記憶された検索ログデータおよびユーザ属性121に記憶されたユーザの属性情報をサーバ装置2に送信し、サーバ装置2はこれらの入力情報を受信する(ステップS2)。状況情報生成部2100は、入力された位置情報およびユーザの属性情報に基づいて状況情報を生成する(ステップS3)。次に、状況情報生成部2100は、状況情報に含まれる位置情報と、地域変換テーブル2110とに基づいて、ユーザが発行した検索クエリに応じた地域を特定する(ステップS4)。次に、状況情報生成部2100は、生成した状況情報の内容に従って、さらに状況情報ビット列を生成する(ステップS5)。次に、標本データ生成部2300は、ユーザが指定した検索クエリおよびこの検索クエリに応じた地域に該当する検索ログデータが、回帰分析を行うことが可能な閾値を超える数だけサーバ側検索ログ記憶領域221に記憶されているかを判定する(ステップS6)。
【0065】
この閾値を超える数の検索ログデータがサーバ側検索ログ記憶領域221に記憶されていた場合(ステップS6;YES)、標本データ生成部2300は、ユーザが指定した検索クエリと、この検索クエリに応じた地域とに基づいて、サーバ側検索ログ記憶領域221に記憶された検索ログデータから、標本データを生成する(ステップS7)。次に、スコア導出式生成部2400は、標本データに対して上述したような回帰分析を行い、スコア導出式を生成する(ステップS8)。次に、スコア導出部2500は、状況情報ビット列とスコア導出式とを用いて第1の地域関連度スコアを導出する(ステップS9)。一方、コンテンツ取得部2210は、ユーザが指定した検索クエリに適合した検索結果コンテンツと、各検索結果コンテンツに対する元スコアを含む検索結果を検索サーバ装置から取得する(ステップS10)。なお、このステップS10の処理は、検索サーバ装置から検索結果が送信されてくる時期によっては、ステップS9以前になされることがある。
【0066】
次に、コンテンツ地域関連判別部2220は、取得された検索結果コンテンツの各々に対して、コンテンツ地域関連特定情報を判別して付与する(ステップS11)。次に、スコア導出部2500は、取得された検索結果コンテンツと、各検索結果コンテンツに対する元スコアと、各検索結果コンテンツに付与されたコンテンツ地域関連特定情報と、第1の地域関連度スコアとに基づいて、取得された検索結果コンテンツの各々に対して第2の地域関連度スコアを導出する(ステップS12)。
【0067】
入出力部2000は、第1の地域関連度スコアが閾値を超えていた場合、取得された検索結果コンテンツのうち、検索クエリに応じた地域と関連する意味のコンテンツ地域関連特定情報が付与されたコンテンツのみを出力対象とする。そして、入出力部2000は、取得された検索結果コンテンツ、あるいは第1の地域関連度スコアを用いて出力対象とされた検索結果コンテンツを、第2の地域関連度スコアが高い順序に並び替えて、検索部19に出力する(ステップS13)。そして、検索部19は、この順序に従って検索結果コンテンツを表示部13の上方から並べて表示する(ステップS14)。ユーザが検索を終了すると、検索部19は、検索に関連する情報を、端末側検索ログ記憶領域122に検索ログデータとして保存する(ステップS15)。なお、ステップS6において、サーバ側検索ログ記憶領域221に存在する該当の検索ログデータの数が閾値未満であった場合(ステップS6;NO)、標本データ生成部2300は、第1の地域関連度スコアに対して仮のスコアを導出し(ステップS16)、ステップS10へ進む。そして、ステップ10以降においては、第1の地域関連度スコアとしての仮のスコアが用いられて処理が進行する。
【0068】
図12は、ステップS9における第1の地域関連度スコアを導出する詳細な処理フローを表している。
スコア導出部2500は、スコア導出式生成部2400の出力結果であるスコア導出式を取得する(ステップS21)。次にスコア導出部2500は、状況情報生成部2100の出力結果である状況情報ビット列を取得する(ステップS22)。スコア導出部2500は、計算式であるスコア導出式におけるx1〜xnの変数に、取得した状況情報ビット列を代入して計算を行い、第1の地域関連度スコアを導出する(ステップS23)。
【0069】
図13は、ステップS12における第2の地域関連度スコアを導出する詳細な処理フローを表している。
スコア導出部2500は、コンテンツ地域関連判別部2220より、検索結果コンテンツと、各検索結果コンテンツに対する元スコアと、各検索結果コンテンツに付与されたコンテンツ地域関連特定情報とを取得する。(ステップS31)。次にスコア導出部2500は、自らが算出した第1の地域関連度スコアと、ステップS31で取得した各種情報に基づいて、前述の第2の地域関連度スコアを求める計算式における変数に適宜代入を行い、取得した検索結果コンテンツの各々に対して第2の地域関連度スコアを導出する(ステップS32)。
【0070】
以上説明したように、サーバ装置2は、ユーザが指定した検索クエリと、ユーザが所在する地域と、ユーザが置かれた状況とに応じて、ユーザがどの程度ローカライズされた検索結果を望んでいるかを定量的な数値で表した第1の地域関連度スコアを導出し、この第1の地域関連度スコアに基づいて、検索結果の表示対象を絞り込む。また、サーバ装置2は、検索結果コンテンツの各々についてユーザの存在する地域に関連する度合いを定量的な数値で表した第2の地域関連度スコアに基づいて、検索結果の表示順序を並び替える。サーバ装置2がこうした一連の処理を行うことにより、ユーザは、検索を行う際にローカライズされた検索結果を希望するか否かについて指示を与える必要もなく、ローカライズされた検索結果を自身の希望に沿って取得し得る可能性が高くなる。このとき、ユーザは特別なインターフェースを介することなく、普段使い慣れた一般的な検索サーバ装置を用いるので、使い勝手がよい。また、上記実施形態によれば、ユーザが置かれている状況に合わせて検索結果のローカライズを行うことで、ユーザに予想していなかった気付きを与えることも可能となる。
【0071】
(2)変形例
上記の実施形態を次のように変形してもよい。また、以下の変形例は適宜組み合わせて実施することも可能である。
(2−1)変形例1
上記の実施形態においては、サーバ側検索ログ記憶領域221に充分な数の検索ログデータが記憶されていても、ユーザが発行した検索クエリに含まれる検索文字列が、初めて指定される検索文字列であった場合、すなわちサーバ側検索ログ記憶領域221に記憶された検索ログデータに、この検索クエリに該当する検索ログデータが存在しなかった場合には、この検索クエリが有する地域関連度を推測することが難しい。こうした事態に備えて、検索文字列に対する定性的な推測手段を用意しておいてもよい。すなわち、特定の検索文字列を記憶した検索文字列辞書をサーバ装置2の備える記憶部22が記憶しておき、ユーザにより初めて指定された検索文字列がこの検索文字列辞書に記憶されていた場合、この検索クエリは地域関連度を有すると判別するようにしてもよい。例えばこの検索文字列辞書に「居酒屋」という検索文字列が記憶されており、ユーザにより初めて「居酒屋」という検索文字列を含む検索クエリが発行された場合、図11におけるステップS6において標本データ生成部2300が上述の判別を行い、判別の結果をスコア導出部2500に通知する。スコア導出部2500はこの通知の内容に従って、第1の地域関連度スコアについて、検索クエリが地域関連度を確実に有することを意味する「1」の値を導出したりする。ここで導出される第1の地域関連度スコアが持つ値は、これに限ったものではなく、設計において自由に設定してもよい。要するに、設定された閾値を超える値を有するように、第1の地域関連度スコアが導出されればよい。このようにすれば、ユーザが初めて指定する検索文字列を含む検索クエリを発行した場合にも、ローカライズされた検索結果をユーザは取得することが可能となる。
【0072】
(2−2)変形例2
上記の実施形態においては、第1の地域関連度スコアが設定された閾値を超えた場合には、地域関連度を有する検索結果コンテンツのみが表示対象となっていた。地域関連度を有していない検索結果コンテンツでも、人気の高いコンテンツをユーザが見たいと望む場合に備えて、次のようにしてもよい。すなわち、第1の地域関連度スコアに対する閾値が2段階で設定され、各検索結果コンテンツが保持する元スコアに対する閾値が別途設定される。より高く設定された閾値を超える第1の地域関連度スコアが導出された場合、上記実施形態と同様に、入出力部2000は地域関連度を有している検索結果コンテンツのみを出力対象とする。そして、より高く設定された閾値未満で、より低く設定された閾値を超える第1の地域関連度スコアが導出された場合、入出力部2000は、地域関連度を有する検索結果コンテンツに加えて、地域関連度を有していなくても設定された閾値を超える元スコアを保持する検索結果コンテンツを出力対象としてもよい。これらの各閾値は、サーバ装置2が備える記憶部22に予め記憶されてもよいし、移動通信端末1が備える記憶部12に記憶されユーザにより変更可能としてもよい。これらの閾値が移動通信端末1の備える記憶部12に記憶される場合、検索部19により検索クエリが入出力部2000に入力された後に、移動通信端末1のCPU111が、これらの閾値を入出力部2000に入力する。このようにすれば、入出力部2000は検索結果のうち出力対象となるものをより柔軟に決めることが可能となり、結果として、ユーザはローカライズされた検索結果に限らず、人気の高いコンテンツも検索結果として取得することが可能となる。
【0073】
(2−3)変形例3
状況情報は、ユーザが検索クエリを指定した時点におけるユーザが置かれている状況を表す情報であればよく、その内容は実施形態の例に限定されない。すなわち状況情報は、ユーザが検索クエリを指定した時点における状況に関して、地域関連度の有無に影響を及ぼすと考えられる情報であればどのようなものであってもよい。例えば位置情報、属性情報および時刻情報を構成する項目の種類や内容は上述の例に限ったものではなく、例えば時刻情報において、曜日として「月曜日〜日曜日」といった項目が含まれていてもよい。
【0074】
(2−4)変形例4
上記の実施形態においては、検索ログデータを、地域、検索クエリという抽出条件の順序で抽出しているが、この順序はこれに限らず、検索クエリ、地域の順序で抽出を行ってもよい。すなわち、抽出処理の順序に関わらず、地域および検索クエリを用いて検索ログデータの抽出が行われればよい。
【0075】
(2−5)変形例5
上記の実施形態の説明において、第1の地域関連度スコアは、ユーザが指定した検索クエリの内容と、ユーザが検索クエリを指定したときのそのユーザの位置(ユーザが所在する位置を含む地域)と、検索クエリが指定されたときのユーザが置かれている状況(ただし、ユーザの位置を除く)とに依存すると説明した。ユーザが検索クエリを指定したときのそのユーザの位置(ユーザが所在する位置を含む地域)は、検索クエリが指定されたときのユーザが置かれている状況に含まれる位置に基づいて特定されるものであるため、第1の地域関連度スコアは、実質的には、ユーザが指定した検索クエリの内容と、検索クエリが指定されたときのユーザが置かれている状況(ユーザの位置を含む)とに依存すると言ってもよい。
【0076】
(2−6)変形例6
上記の実施形態では、検索結果コンテンツを、第2の地域関連度スコアが高い順序に表示部13の上方から並べて表示していたが、検索結果コンテンツの提示については、第2の地域関連度スコアが高い順から優先的にユーザに提示するものであればよい。例えば、表示部13における表示順序ではなく、第2の地域関連度スコアが高いものは大きく表示し第2の地域関連度スコアが低いものは小さく表示したり、第2の地域関連度スコアが高いものは目立つ色で表示し第2の地域関連度スコアが低いものは目立たない色で表示するなど、第2の地域関連度スコアが高いほどユーザに目立つように提示すればよい。つまり、優先的な提示とは、ユーザにとってより目立つ態様で提示するということである。また、表示による提示に限らず、音声による提示であってもよい。
【0077】
(2−7)変形例7
図8において、抽出条件は検索クエリ及び地域という内容を含んでおり、この抽出条件と同一の検索クエリ及び地域に基づいて検索ログデータが抽出されていた。この抽出においては、抽出条件と完全一致するものだけを抽出するのではなく、抽出条件に対して予め決められた類似範囲に収まる内容の検索ログデータを抽出するようにしてもよい。例えば検索クエリに関しては、類義語辞書をサーバ装置2が備える記憶部22に記憶しておき、検索クエリに含まれる検索文字列の類義語の範囲に収まる内容の検索ログデータを抽出すればよい。また、地域に関しては、地図をサーバ装置2が備える記憶部22に記憶しておき、検索クエリに含まれる地域に隣接する地域を含む検索ログデータを抽出すればよい。
【0078】
(2−8)変形例8
図3において、検索ログデータに検索クエリ地域関連特定情報を含むようにしてもよい。すなわち、図8において検索ログデータに検索クエリ地域関連特定情報が付与された後、付与された検索クエリ地域関連特定情報を付加して検索ログデータをサーバ側検索ログ記憶領域221に上書き保存するようにしてもよい。このようにすれば、図8において検索ログデータに検索クエリ地域関連特定情報を付与する際に、既に検索クエリ地域関連特定情報が付与されている検索ログデータは付与処理を省略することが可能なため、処理速度の向上を図ることが可能となる。
【0079】
(2−9)変形例9
上記の実施形態では、過去に蓄積された多次元の変数からなる標本データを分析して新たな多次元の変数に対して確率的に解を得る方法として、ロジスティック回帰分析を用いていたが、これは一例に過ぎず、これ以外の方法を用いてもよいことはもちろんである。
【0080】
(2−10)変形例10
上記実施形態では、サーバ装置2がネットワーク上の検索サーバ装置に対して検索を要求するものであったが、サーバ装置2が多数のコンテンツを記憶するに足る記憶容量を備えている場合には、サーバ装置2自身がコンテンツの検索を行ってもよい。つまり、検索を行う検索装置は、サーバ装置2の外部にあっても内部にあってもよい。
【0081】
(2−11)変形例11
上記実施形態で説明したサーバ装置2において、状況情報生成部2100、コンテンツ処理部2200、サーバ側検索ログ記憶領域221、スコア導出式生成部2400及びスコア導出部2500からなる部分と、検索クエリ地域関連判別部2310を含む標本データ生成部2300からなる部分とを、第1の情報処理装置および第2の情報処理装置という別体の情報処理装置によってそれぞれ構成し、これらを通信線で接続して、上記実施形態で説明したサーバ装置2と同等の機能を実現する情報処理システムを構築してもよい。
【0082】
(2−12)変形例12
本発明は、サーバ装置であるコンピュータに本発明を実現させるためのプログラムや、かかるプログラムを記憶させた光ディスク等の記録媒体としても特定され得る。本発明に係るプログラムは、インターネット等のネットワークを介して、サーバ装置にダウンロードさせ、これをインストールして利用可能にするなどの形態でも提供され得る。
【符号の説明】
【0083】
1…端末装置、2…サーバ装置、11,21…制御部、111,211…CPU、112,212…RAM、113,213…ROM、12,22…記憶部、121…ユーザ属性、122…端末側検索ログ記憶領域、221…サーバ側検索ログ記憶領域、13…表示部、14…操作部、15…無線通信部、16…位置特定部、17,24…電源制御部、18,25…バス、19…検索部、23…通信制御部、2000…入出力部、2100…状況情報生成部、2110…地域変換テーブル、2200…コンテンツ処理部、2210…コンテンツ取得部、2220…コンテンツ地域関連判別部、2300…標本データ生成部、2310…検索クエリ地域関連判別部、2400…スコア導出式生成部、2500…スコア導出部
【技術分野】
【0001】
本発明は情報検索の技術に関する。
【背景技術】
【0002】
携帯電話機を代表とする移動通信端末の高機能化および普及率の向上により、ユーザは、移動通信端末を用いてインターネット上の情報にアクセスしたり、インターネット上の検索エンジンを利用して必要な情報を検索することが可能となった。移動通信端末には、ユーザにより携帯可能であるという特徴があるため、この移動通信端末を用いた情報検索においては、自宅やオフィス等に設置されたパーソナルコンピュータを使用した情報検索とは異なり、例えばユーザの現在位置や現在時刻等の、ユーザが置かれている状況に即した検索結果の提示が行われることが望ましい。例えば、ユーザが昼食時に或るA駅に居て飲食店に関する情報を検索した場合、そのA駅周辺の飲食店の情報を検索結果として提示した方が、情報を取得するユーザにとっても、情報を提供するコンテンツプロパイダにとっても、より望ましいと言える。
【0003】
上記のように、ユーザが置かれている状況に応じた検索結果を提示するためには、コンテンツなどと呼ばれる様々な情報と、そのコンテンツが関連する位置や地域とを対応付けておく必要がある。例えば特許文献1には、位置情報とコンテンツとを対応づけておき、その位置情報に基づいてコンテンツのメタデータを階層的に整理したコンテンツ一覧リストをサーバから端末に配信することで、端末の位置に関連するコンテンツへのアクセスを容易にする技術が開示されている。また特許文献2には、コンテンツに含まれる位置情報とリンク情報を収集することで、位置に関連するコンテンツを探索・蓄積する技術が開示されている。さらに非特許文献1には、コンテンツに対する自然言語解析、話題解析及び閲覧ユーザ分析に基づき、各コンテンツがどの程度位置に関連するものであるかどうかを判定する技術が開示されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2005−301701号公報
【特許文献2】特開2002−189748号公報
【非特許文献】
【0005】
【非特許文献1】馬 強,松本 知弥子,田中 克己,“ページ内容と位置情報に基づくWebコンテンツのローカル度検出とその応用” 電子情報通信学会技術研究報告,DE,データ工学 102(209) pp.115−120 20020712
【発明の概要】
【発明が解決しようとする課題】
【0006】
上記のような従来の技術によって、ユーザは、自身の位置に関連する内容の検索結果を取得することが可能となる。しかしながら、そのユーザが検索を行うときにそのユーザの位置に関連する内容の検索結果を本当に望んでいるか否かを逐一確認しているわけではないから、ユーザが自身の位置に関連する内容の検索結果を望んでない場合には、都合が悪い。そこで、ユーザが自身の位置に関連する内容の検索結果を望んでいるか否かを検索時に逐一確認するようにしてもよいが、これでは、ユーザはその確認作業が煩わしいと感じることがある。また、ユーザが自身の位置に関連する検索結果を望むか望まないかというの2択でしかユーザの意図を反映することが出来ないから、例えば、自身の位置に関連したコンテンツも見たいが、同時に、自身の位置とは関係のない人気のあるコンテンツも見たい、といったことをユーザが意図していた場合に、そのようなユーザの意図に応えることが困難である。
【0007】
本発明は、上述の背景を鑑みてなされたものであり、ユーザの位置に関連する検索結果を提示するか否かをユーザが置かれた状況に応じて判断することを可能とする。
【課題を解決するための手段】
【0008】
上記課題を解決するため、本発明は、検索の内容を表す検索クエリがユーザによって指定されたときの、当該ユーザが置かれた状況を表す状況情報であって、少なくとも当該ユーザの位置を含む状況情報を生成する状況情報生成手段と、ユーザによって新たに指定された前記検索クエリと同一または予め決められた類似範囲に収まる内容であり、当該新たに指定された検索クエリよりも過去に指定された検索クエリである過去検索クエリと、当該過去検索クエリがユーザによって指定されたときの当該ユーザが置かれた状況を表す前記状況情報と、当該過去検索クエリがユーザによって指定されたときの当該ユーザの位置に当該過去検索クエリが関連性を有するか否かを特定する検索クエリ地域関連特定情報との組み合わせで構成される1組以上の標本データが与えられると、過去に蓄積された多次元の変数からなる標本データを分析して新たな多次元の変数に対して確率的に解を得る方法を用いることによって、ユーザが新たに指定した前記検索クエリが当該検索クエリを指定したときのユーザの位置にどの程度関連しているかの度合いを表す第1の地域関連度スコアを前記状況情報を入力して導出するための計算式であるスコア導出式を生成するスコア導出式生成手段と、前記スコア導出式生成手段により生成されたスコア導出式に、前記状況情報生成手段により生成された状況情報を入力して、ユーザが新たに指定した検索クエリに対する前記第1の地域関連度スコアを導出するスコア導出手段とを備えることを特徴とする情報処理装置を提供する。
【0009】
上記情報処理装置において、前記ユーザの位置と、前記ユーザの属性と、前記検索クエリが指定された時刻とを取得する取得手段を更に備え、前記状況情報生成手段は、前記取得手段が取得した位置、ユーザの属性、及び時刻に関する情報を含む前記状況情報を生成するようにしてもよい。
【0010】
また、ユーザによって指定された前記検索クエリに従って検索した結果得られたコンテンツである検索結果コンテンツを取得するコンテンツ取得手段と、前記コンテンツ取得手段により取得された各々の前記検索結果コンテンツが、当該検索結果コンテンツを検索するために用いられた前記検索クエリが指定されたときのユーザの位置に関連性を有するか否かを特定し、特定した結果を表すコンテンツ地域関連特定情報を、各々の当該検索結果コンテンツに付与するコンテンツ地域関連判別手段と、前記スコア導出手段により導出された第1の地域関連度スコアが閾値を超えていた場合に、前記ユーザの位置に関連性を有することを表す前記コンテンツ地域関連特定情報が付与された検索結果コンテンツのみを、前記ユーザの端末装置に送信する送信手段とを備えるようにしてもよい。
【0011】
さらに、前記コンテンツ取得手段は、前記検索結果コンテンツに加えて、各々の前記検索結果コンテンツが前記検索クエリと適合している度合いを表す元スコアを取得し、前記スコア導出手段は、前記元スコアと前記第1の地域関連度スコアと前記コンテンツ地域関連特定情報とを予め定められた計算式に入力して、前記各々の検索結果コンテンツが、当該検索結果コンテンツを検索するために用いられた前記検索クエリが指定されたときのユーザの位置に関連している度合いを表す第2の地域関連度スコアを導出し、前記送信手段は、前記第2の地域関連度スコアが高い順序から優先してユーザに提示されるように、前記検索結果コンテンツを前記端末装置に送信するようにしてもよい。
【0012】
また、本発明は、上述した情報処理装置に与える標本データを生成する情報処理装置であって、ユーザによって指定された検索の内容を表す検索クエリと、当該検索クエリが指定されたときに前記ユーザが置かれていた状況を表す状況情報であって、少なくとも当該ユーザの位置を含む状況情報との組み合わせで構成される1組以上の検索履歴データのうち、各々の当該検索履歴データについて、前記検索クエリが指定されたときのユーザの位置と関連性を有するか否かを表す検索クエリ地域関連特定情報を生成して付与する検索クエリ地域関連判別手段と、前記検索クエリ地域関連特定情報が付与された検索履歴データの中から、ユーザによって新たに指定された検索クエリと同一または予め決められた類似範囲に収まる内容であり、当該新たに指定された検索クエリよりも過去に指定された検索クエリである過去検索クエリと、当該過去検索クエリが指定されたときのユーザが置かれた状況を表す状況情報と、当該過去検索クエリが指定されたときのユーザの位置に当該過去検索クエリが関連性を有するか否かを特定する検索クエリ地域関連特定情報との組み合わせで構成される検索履歴データを抽出し、前記標本データとして生成する標本データ生成手段とを有することを特徴とする情報処理装置を提供する。
【0013】
さらに、前記検索クエリ地域関連判別手段は、ユーザによって指定された検索の内容を表す検索クエリと、当該検索クエリが指定されたときに前記ユーザが置かれていた状況を表す状況情報であって、少なくとも当該ユーザの位置を含む状況情報と、当該検索クエリに従って検索手段が検索した結果得られたコンテンツのうちユーザがアクセスしたコンテンツである検索結果コンテンツと、当該検索結果コンテンツに付与され、当該検索結果コンテンツを検索するために用いられた前記検索クエリが指定されたときのユーザの位置と当該検索結果コンテンツが関連性を有するか否かを特定する情報であるコンテンツ地域関連特定情報との組み合わせで構成される1組以上の検索履歴データのうち、各々の当該検索履歴データについて、前記検索クエリが指定されたときのユーザの位置と関連性を有することを表すコンテンツ地域関連特定情報が付与された検索結果コンテンツに前記ユーザがアクセスしていたか否かを判別し、当該検索結果コンテンツにユーザがアクセスしていた場合には、前記位置に関連性を有することを表す検索クエリ地域関連特定情報を生成して付与し、アクセスしていなかった場合には、前記位置に関連性を有しないことを表す検索クエリ地域関連特定情報を生成して付与するようにしてもよい。
【0014】
また、本発明は、検索の内容を表す検索クエリがユーザによって指定されたときの、当該ユーザが置かれた状況を表す状況情報であって、少なくとも当該ユーザの位置を含む状況情報を生成する状況情報生成手段と、ユーザによって新たに指定された前記検索クエリと同一または予め決められた類似範囲に収まる内容であり、当該新たに指定された検索クエリよりも過去に指定された検索クエリである過去検索クエリと、当該過去検索クエリがユーザによって指定されたときの当該ユーザが置かれた状況を表す前記状況情報と、当該過去検索クエリが指定されたときのユーザの位置に当該過去検索クエリが関連性を有するか否かを特定する検索クエリ地域関連特定情報との組み合わせで構成される1組以上の標本データが与えられると、過去に蓄積された多次元の変数からなる標本データを分析して新たな多次元の変数に対して確率的に解を得る方法を用いることによって、ユーザが新たに指定した前記検索クエリが当該検索クエリを指定したときのユーザの位置にどの程度関連しているかの度合いを表す第1の地域関連度スコアを前記状況情報を入力して導出するための計算式であるスコア導出式を生成するスコア導出式生成手段と、前記スコア導出式生成手段により生成されたスコア導出式に、前記状況情報生成手段により生成された状況情報を入力して、ユーザが新たに指定した検索クエリに対する前記第1の地域関連度スコアを導出するスコア導出手段と、前記検索クエリと、当該検索クエリが指定されたときに生成された前記状況情報との組み合わせで構成される1組以上の検索履歴データを記憶する検索履歴記憶手段とを有する第1の情報処理装置と、前記検索履歴記憶手段によって記憶されている検索履歴データの各々について、前記検索クエリが指定されたときのユーザの位置と関連性を有するか否かを表す検索クエリ地域関連特定情報を生成して付与する検索クエリ地域関連判別手段と、前記検索クエリ地域関連特定情報が付与された検索履歴データのうち、ユーザによって新たに指定された検索クエリと同一または予め決められた類似範囲に収まる内容であり、当該新たに指定された検索クエリよりも過去に指定された検索クエリである過去検索クエリと、当該過去検索クエリが指定されたときのユーザが置かれた状況を表す前記状況情報と、当該過去検索クエリが指定されたときのユーザの位置に当該過去検索クエリが関連性を有するか否かを特定する検索クエリ地域関連特定情報との組み合わせで構成される検索履歴データを抽出し、前記第1の情報処理装置に前記標本データとして与える標本データ生成手段とを有する第2の情報処理装置とを備えることを特徴とする情報処理システムを提供する。
【0015】
また、本発明は、情報処理装置又は情報処理システムが行う情報処理方法であって、検索手段によって行われる検索の内容を表す検索クエリがユーザによって指定されたときの当該ユーザが置かれた状況を表す状況情報であって、少なくとも当該ユーザの位置を含む状況情報を生成する状況情報生成ステップと、前記検索クエリと、当該検索クエリが指定されたときに生成された前記状況情報との組み合わせで構成される1組以上の検索履歴データを記憶する検索履歴記憶ステップと、前記検索履歴記憶ステップにおいて記憶された各々の検索履歴データについて、前記検索クエリが指定されたときのユーザの位置と関連性を有するか否かを表す検索クエリ地域関連特定情報を生成して付与する検索クエリ地域関連判別ステップと、前記検索履歴記憶ステップにおいて記憶された検索履歴データのうち、ユーザによって新たに指定された検索クエリと同一または予め決められた類似範囲に収まる内容であり、当該新たに指定された検索クエリよりも過去に指定された検索クエリである過去検索クエリと、当該過去検索クエリが指定されたときのユーザが置かれた状況を表す前記状況情報と、当該過去検索クエリが指定されたときのユーザの位置に当該過去検索クエリが関連性を有するか否かを特定する検索クエリ地域関連特定情報との組み合わせで構成される検索履歴データを抽出し、標本データとして生成する標本データ生成ステップと、1組以上の前記標本データに対し、過去に蓄積された多次元の変数からなる標本データを分析して新たな多次元の変数に対して確率的に解を得る方法を用いることによって、ユーザが新たに指定した前記検索クエリが当該検索クエリの指定されたときの当該ユーザの位置にどの程度関連しているかの度合いを表す第1の地域関連度スコアを前記状況情報を入力して導出するための計算式であるスコア導出式を生成するスコア導出式生成ステップと、前記スコア導出式生成ステップにおいて生成されたスコア導出式に、前記状況情報生成ステップにおいて生成された状況情報を入力して、ユーザが新たに指定した検索クエリに対する前記第1の地域関連度スコアを導出するスコア導出ステップとを備えることを特徴とする情報処理方法を提供する。
【発明の効果】
【0016】
本発明によれば、ユーザの位置に関連する検索結果を提示するか否かをユーザが置かれた状況に応じて判断するための仕組みを構築することができる。
【図面の簡単な説明】
【0017】
【図1】本発明の実施形態におけるシステムの構成を表した図である。
【図2】移動通信端末1のハードウェア構成を表したブロック図である。
【図3】検索ログデータの内容を示す図である。
【図4】サーバ装置2のハードウェア構成を表したブロック図である。
【図5】移動通信端末1およびサーバ装置2の機能構成を表したブロック図である。
【図6】状況情報の具体例を表した図である。
【図7】状況情報ビット列の具体例を表した図である。
【図8】標本データ生成部が標本データを生成する際の動作を表した図である。
【図9】標本データの具体例を表した図である。
【図10】第2の地域関連度スコアと検索結果コンテンツの関係を表した図である。
【図11】検索開始から検索終了までの処理フローである。
【図12】第1の地域関連度スコアを導出する際の処理フローである。
【図13】第2の地域関連度スコアを導出する際の処理フローである。
【発明を実施するための形態】
【0018】
次に、図面を参照して本発明の実施形態について説明する。
なお、これから述べる実施形態の説明においては、使用する用語の意味を適宜定義しているが、理解を容易にするため、まずは、代表的な用語の定義を以下に記しておく。
「検索クエリ」とは、検索手段である検索サーバ装置が行う検索の内容を表した検索条件であり、ユーザが指定した検索文字列及び検索式からなる。
「検索クエリに応じた地域」とは、ユーザが端末装置を用いて検索クエリを指定したときに、この端末装置(つまりユーザ)が所在する地域の地域名のことである。
「検索結果コンテンツ」とは、検索サーバ装置が検索クエリに基づいて検索した結果得たコンテンツのことである。
「検索クエリ地域関連特定情報」とは、或る検索クエリが、この検索クエリに応じた地域と関連を持っているか否かを特定する情報である。
「コンテンツ地域関連特定情報」は、或る検索結果コンテンツが、この検索結果コンテンツを検索したときに用いられた検索クエリに応じた地域と関連を持っているか否かを特定する情報である。
「元スコア」とは、検索結果コンテンツの各々に付与される、検索クエリとの適合度を表す数値である。
「ローカライズ」とは“地域に関連している”ことを言い、例えば「検索クエリがローカライズを意図している」とは、“検索クエリが地域に関連したコンテンツの検索を意図している”ということを意味する。また、「検索結果コンテンツがローカライズされている」とは、“検索結果コンテンツが地域に関連している”ということを意味する。
「第1の地域関連度スコア」とは、ユーザがどの程度ローカライズされた検索結果を望んでいるかの度合い、すなわちユーザが指定した検索クエリがこの検索クエリに応じた地域に対して有する地域関連度を定量的に数値化したものである。
「第2の地域関連度スコア」は、検索クエリに適合した検索結果コンテンツの各々が、この検索クエリに応じた地域にどの程度関係しているか、すなわち各検索結果コンテンツがこの検索クエリに応じた地域に対して有する地域関連度を定量的に数値化したものである。
【0019】
(1)実施形態の説明
(1−1)システム全体の構成
図1は、本発明の実施形態におけるシステムの構成を表した図である。
このシステムは、移動通信端末1と、サーバ装置2と、ネットワークNWとを備えている。移動通信端末1は、例えば携帯電話機、無線LAN(Local Area Network)端末、またはノートパソコンのような、ユーザが携帯可能かつ無線通信が可能な情報処理装置であり、図1では携帯電話機の例を挙げている。ネットワークNWは、例えば移動体通信網やゲートウェイ、インターネットを含む通信網である。サーバ装置2は、ネットワークNWを介して移動通信端末1と情報のやり取りを行い、その移動通信端末1のユーザの位置に関連する検索結果を提示するか否かを、そのユーザが置かれた状況に応じて判断する情報処理装置である。これらのうち、移動通信端末1は複数存在している。また、ネットワークNWには、図示しないサーバ装置群が接続されている。
【0020】
(1−2)移動通信端末1のハードウェア構成
図2は、移動通信端末1のハードウェア構成を表したブロック図である。
移動通信端末1は、制御部11、記憶部12、表示部13、操作部14、無線通信部15、位置特定部16および電源制御部17を備えており、これらの各部がバス18を介して互いに接続されている。制御部11は、CPU(Central Processing Unit)111、RAM(Random Access Memory)112およびROM(Read Only Memory)113を有する。CPU111は、ROM113や記憶部12に記憶されているコンピュータプログラムを読み出しRAM112にロードして実行することにより、移動通信端末1の各部を制御して、例えば表示機能、操作機能、通信機能などの各種機能を実現する。RAM112は、CPU111が処理を行う際のワークエリアとなる。
【0021】
表示部13は、液晶ディスプレイなどの表示体やVRAM(Video Random Access Memory)などのメモリを備えており、制御部11の制御の下で各種の画像を表示する。操作部14は、複数のキーを有しており、ユーザによってこれらのキーが操作されるとその操作内容に応じた信号を制御部11へ供給する。制御部11は、この信号に基づいて操作内容を判断して処理を行う。無線通信部15は、制御部11の制御の下で、図示しない移動体通信網の基地局と無線通信を行う。この無線通信によって、ネットワークNWに接続されたサーバ装置群と移動通信端末1との間で、各種情報の送受信が行われる。ネットワークNWに接続されたサーバ装置群には、コンテンツと呼ばれる情報を、指定された検索条件に従って検索する検索サーバ装置が含まれている。移動通信端末1は、この検索サーバ装置あるいはサーバ装置2に対してコンテンツの検索を要求することで、その検索結果を得る。位置特定部16は、GPS(Global Positioning System)方式によって測位を行うものであり、移動通信端末1の現在位置を特定し、これを緯度・経度で表した位置情報を生成する。電源制御部17は、バッテリーを備え、このバッテリーから供給された電力を移動通信端末1に供給する。
【0022】
記憶部12は、例えばEEPROM(Electrically Erasable and Programmable ROM)やフラッシュメモリなどの不揮発性の記憶手段であり、ユーザ属性121を記憶するほか、端末側検索ログ記憶領域122を有している。ユーザ属性121は、移動通信端末1の利用者であるユーザの性別、年齢、住所等の、ユーザの各種属性である。これらのユーザ属性121は、ユーザにより操作部14を介して移動通信端末1に入力され、この記憶部12に記憶される。
【0023】
前述したように、移動通信端末1は、無線通信部15の通信機能を用いて、ネットワークNWを介して検索サーバ装置に対して検索を要求し、その検索結果を取得することができる。このとき、検索サーバ装置に対する検索要求には、ユーザが検索を行う際に指定した検索文字列と、この検索文字列におけるand条件あるいはor条件等の検索式とが含まれる。これらの検索文字列及び検索式の組み合わせを「検索クエリ」と呼ぶ。そして、ユーザが検索クエリを指定して検索を指示した際に、移動通信端末1、つまりその端末装置を携帯するユーザが所在する地域の地域名のことを、「検索クエリに応じた地域」と呼ぶ。
【0024】
記憶部12の端末側検索ログ記憶領域122には、検索サーバ装置によって行われた検索に関連する各種情報が、その検索の履歴を表す検索ログデータとして記憶される。この検索ログデータは、図3に示すように、「検索クエリ」と、「検索クエリに応じた地域」と、「状況情報ビット列」と、「検索結果コンテンツ」と、「コンテンツ地域関連特定情報」とを含んでいる。これらの内容を以下に簡単に説明する。
【0025】
まず、検索クエリおよび検索クエリに応じた地域は、既に説明したとおりの内容である。状況情報ビット列は、ユーザにより検索クエリが指定された際に、そのユーザが置かれた状況を2値のビット列で表したものである。検索結果コンテンツは、この検索クエリに応じて検索された結果得られたコンテンツのうち、ユーザがアクセスしたコンテンツのことである。コンテンツ地域関連特定情報は、検索結果コンテンツが、検索クエリに応じた地域と関連を持っているか否かを特定する情報である。ユーザが、特定の検索に対して複数のコンテンツにアクセスしていた場合、アクセスしたコンテンツの数だけ検索クエリに紐づく検索ログデータが記憶される。これらの検索ログデータに付加される検索クエリ、検索クエリに応じた地域および状況情報ビット列は共通のものである。つまり、検索ログデータは、検索クエリと、この検索クエリに適合しユーザがアクセスした検索結果コンテンツの1つとの組み合わせを単位として記憶される。
【0026】
(1−3)サーバ装置2のハードウェア構成
図4は、サーバ装置2のハードウェア構成を表したブロック図である。
サーバ装置2は、制御部21、記憶部22、通信制御部23および電源制御部24を備えており、これらの各部がバス25を介して互いに接続されている。制御部21は、CPU211、RAM212およびROM213を有する。CPU211は、ROM213や記憶部22に記憶されているコンピュータプログラムを読み出しRAM212にロードして実行することにより、サーバ装置2の各部を制御して、例えば演算機能、通信機能などの各種機能を実現する。RAM212は、CPU211が処理を行う際のワークエリアとなる。記憶部22は、例えばEEPROMやフラッシュメモリなどの不揮発性の記憶手段であり、サーバ側検索ログ記憶領域221を有している。サーバ側検索ログ記憶領域221は、移動通信端末1から取得した検索ログデータを蓄積して記憶する。通信制御部23は、制御部21の制御の下で、図示しない通信網の基地局と通信を行う。この通信によって、サーバ装置2とネットワークNWに接続されたネットワーク上の検索サーバ装置や移動通信端末1との間で、各種情報の送受信が行われる。サーバ装置2は、この検索サーバ装置に対してコンテンツの検索を要求することで、その検索結果を得る。検索サーバ装置とは、インターネットに存在するウェブページ、ウェブサイト、画像ファイル、ネットニュースなどの情報を検索する機能を備えたサーバ装置であり、特定の文字列および検索式から構成される検索クエリを指定されると、この検索クエリに適合する検索結果を返すものである。電源制御部24は、バッテリーおよびコンセントに差し込まれる電源プラグを備え、このバッテリーあるいはコンセントに差し込まれた電源プラグを通じて供給された電力をサーバ装置2に供給する。
【0027】
(1−4)移動通信端末1およびサーバ装置2の機能構成
図5は、移動通信端末1およびサーバ装置2の機能構成を表したブロック図である。
サーバ装置2の制御部21は、RAM212をワークエリアとしてROM213又は記憶部22に記憶されたコンピュータプログラムを実行することにより、入出力部2000、状況情報生成部2100、コンテンツ処理部2200、標本データ生成部2300、スコア導出式生成部2400及びスコア導出部2500の各機能を実現する。以降においてサーバ装置2の制御部21が実現する各機能に関する説明では、これら各機能を動作の主体として表現するが、その主体の実体は、CPU211である。サーバ装置2は、入出力部2000を通じて移動通信端末1と情報のやり取りを行う。以降の説明において、移動通信端末1とサーバ装置2との間における情報のやりとりは、移動通信端末1の無線通信部15とサーバ装置2の通信制御部23とがネットワークNWを介して通信を行うことで実現される。また、サーバ装置2は、図示しない検索サーバ装置と通信を行うことで、検索サーバ装置へ検索要求を送信したり、検索サーバ装置から検索結果を受信するなど、互いに連携して動作する。
【0028】
移動通信端末1の制御部11は、RAM112をワークエリアとしてROM113又は記憶部12に記憶されたコンピュータプログラムを実行することにより、検索部19の機能を実現する。以降の検索部19に関する説明では、検索部19を動作の主体として表現するが、その主体の実体は、CPU111である。検索部19は、ユーザが操作部14を用いて入力した検索文字列および検索式に基づいて検索クエリを生成し、この検索クエリを含む検索要求を送信して入出力部2000に入力する。そして、検索部19は、検索クエリに基づいてサーバ装置2が出力した検索結果を入出力部2000より取得し、これを表示部13に表示してユーザに提示する。検索部19が生成し、入出力部2000が受け取った検索クエリは、コンテンツ取得部2210が検索サーバ装置を通じて検索結果を取得するとき及び標本データ生成部2300が標本データなるものを生成するときに用いられるため、入出力部2000からコンテンツ処理部2200及び標本データ生成部2300に入力される。
【0029】
検索部19は、検索クエリとともに、位置特定部16によって生成された移動通信端末1の現在位置に基づく緯度・経度で表した位置情報を入出力部2000に入力する。緯度・経度で表した位置情報は、状況情報生成部2100が検索クエリに応じた地域を特定するときに用いられるため、入出力部2000から状況情報生成部2100に入力される。また、検索部19は、端末側検索ログ記憶領域122に記憶された検索ログデータのうち、ユーザが指定した検索クエリに該当する検索ログデータを入出力部2000に入力する。さらに検索部19は、ユーザ属性121に記憶されたユーザの属性情報を入出力部2000に入力する。ユーザの属性情報は、状況情報生成部2100が状況情報なるものを生成するときに用いられるため、入出力部2000から状況情報生成部2100に入力される。つまり入出力部2000は、ユーザの位置と、ユーザの属性とを取得する取得手段の一例である。端末側検索ログ記憶領域122に記憶された検索ログデータは、入出力部2000からサーバ側検索ログ記憶領域221に入力され、記憶される。
【0030】
状況情報生成部2100は、ユーザが検索クエリを指定した時点における、そのユーザが置かれた状況を表す状況情報を生成する状況情報生成手段である。状況情報生成部2100は、入出力部2000より入力された移動通信端末1の位置情報およびユーザの属性情報に基づいて状況情報を生成する。状況情報は、図6に示すように、位置情報、属性情報および時刻情報を含んでいる。これらの位置情報、属性情報および時刻情報は、全て、ユーザが置かれている状況を表すものとして考える。以下、これらの内容をそれぞれ説明する。
まず、位置情報は、ユーザが検索クエリを指定した時点におけるそのユーザの位置に関する情報であり、緯度、経度、住所からの距離及び移動状況という項目の内容を含んでいる。緯度、経度は、位置特定部16によって生成された位置情報に含まれる緯度・経度である。住所からの距離は、入出力部2000より受け取ったユーザの属性情報に含まれるユーザの住所と、上記の緯度・経度とに基づいて生成されたものである。この住所からの距離は、例えば、ユーザの住所を中心として上記緯度、経度の位置が半径3km以内にあれば「近い」という内容になり、両者がそれ以上の距離離れていれば「遠い」という内容になる。この「近い」と「遠い」の判定基準である「半径3km」という閾値は、サーバ装置2が備える記憶部22が予め記憶してもよいし、移動通信端末1の記憶部12に記憶されユーザにより変更可能としてもよい。この閾値が移動通信端末1の記憶部12に記憶される場合、検索部19により検索クエリが入出力部2000に入力された後に、更にこの検索部19により閾値が入出力部2000に入力される。入出力部2000は受け取った閾値を状況情報生成部2100に入力する。なお、この閾値は、「半径3km」以外の値であってもよい。また、移動状況は、位置特定部16により定期的に特定されるユーザの位置が時間の経過とともに変化していないかまたは変化しているかに応じて、「留まっている」または「移動している」という内容になる。
【0031】
次に、属性情報は、検索クエリを指定したユーザの年齢が属する年代とその性別という項目の内容を含む。年代は、入出力部2000から受け取ったユーザの属性情報に含まれるユーザの年齢に基づいて、「若年層/青年層/中年層/高年層」の中から状況情報生成部2100が選択した内容となる。例えば0歳〜18歳であれば若年層、19歳〜35歳であれば青年層、36歳〜55歳であれば中年層、56歳以上であれば高年層、といった具合である。この年齢と年代の対応関係は、サーバ装置2の記憶部22が記憶する図示しない変換テーブルに記述されており、状況情報生成部2100はこれを参照して年代を選択する。性別は、入出力部2000から受け取ったユーザの属性情報に含まれているものである。
【0032】
そして、時刻情報は、ユーザが検索クエリを指定した時刻に関する情報であり、「朝/昼/夕/夜/深夜」という時間帯と、「平日/休前日/休日」という休日区分と、「1月〜12月」という月という項目の内容を含んでいる。時間帯は、状況情報生成部2100が有する計時機能によって計時される時刻に基づいて、朝/昼/夕/夜/深夜から選択された内容となる。休日区分や月は、状況情報生成部2100が有するカレンダー機能に基づいて特定される。つまり状況情報生成部2100は、検索クエリが指定された時刻を取得する取得手段の一例である。
【0033】
また、状況情報生成部2100は、地域変換テーブル2110を用いて、生成した位置情報に応じた地域名を特定する。例えば位置情報が北緯35.66、東経139.70である場合に、状況情報生成部2100は、地域変換テーブル2110を用いて、この位置情報から“渋谷駅周辺”といった地域名を特定し、これを状況情報に含まれる位置情報に対応付けて記憶する。検索クエリが指定されたときに状況情報生成部2100により特定された地域名が、前述した「検索クエリに応じた地域」である。この特定された地域名は、コンテンツ地域関連判別部2220が検索結果コンテンツにコンテンツ地域関連特定情報を付与するときと、標本データ生成部2300が標本データを生成するときに用いられるため、状況情報生成部2100からコンテンツ処理部2200及び標本データ生成部2300のそれぞれに出力される。
【0034】
また、状況情報生成部2100は、この状況情報を構成する各項目の内容を「0」もしくは「1」で表現した状況情報ビット列を生成する。具体的には、状況情報を構成する各項目に当てはまる場合は「1」、当てはまらない場合は「0」というルールに従って並べられた「1」または「0」からなる2値のデータ列が状況情報ビット列となる。
ここで、図7は、上述した状況情報において、住所からの距離が「近い」であり、性別が「女性」であり、時間帯が「朝」である場合の、その状況情報ビット列の一部の内容を例示したものである。この例では、住所からの距離が「近い」という項目に当てはまるため、この項目には「1」が割り当てられている。一方、住所からの距離が「遠い」という項目には当てはまらないため、この項目には「0」が割り当てられている。なお、図7に表されていない項目として、「移動速度/留まっている」、「移動速度/移動している」、「休日区分/平日」、「休日区分/休前日」、「休日区分/休日」といったものがある。なお、状況情報ビット列には、位置情報における緯度・経度は含まれない。このような状況情報ビット列は、スコア導出部2500が第1の地域関連度スコアを導出するときにもちいられるため、状況情報生成部2100からスコア導出部2500に出力される。また、ユーザによる一連の検索処理が終了した際に、状況情報ビット列は検索ログデータに付加されて端末側検索ログ記憶領域123に記憶されるため、生成された状況情報ビット列は、検索クエリに基づいてサーバ装置2が出力した検索結果と共に入出力部2000を通じて検索部19に出力される。
【0035】
再び、図5の説明に戻る。
コンテンツ処理部2200は、コンテンツ取得部2210およびコンテンツ地域関連判別部2220を有している。コンテンツ取得部2210は、入出力部2000より受け取った検索クエリを用いて図示しない検索サーバ装置と通信を行い、この検索クエリに適合する検索結果を取得する。コンテンツ取得部2210により取得された検索結果には、検索結果コンテンツと、各検索結果コンテンツに対する元スコアが含まれている。検索結果コンテンツとは、検索サーバ装置が検索クエリに基づいて検索した結果として得たコンテンツである。この検索結果コンテンツは、各コンテンツの格納場所を意味するURL(Uniform Resource Locator)と、この各コンテンツの見出しにより構成されており、コンテンツそのものを含んではいないが、上記URLと見出しによりコンテンツを入手可能であるから、コンテンツを実質的に含んでいると言える。元スコアとは、検索結果コンテンツの各々に付与される、検索クエリとの適合度を表す数値である。つまり、コンテンツ取得部2210は、検索の結果であるコンテンツおよび各々のコンテンツが検索クエリと適合している度合いを表す元スコアを取得するコンテンツ取得手段である。この元スコアは検索サーバ装置により算出され、元スコアの高い順に検索結果コンテンツが並べ替えられて表示部13に表示される。また、このように検索結果コンテンツが元スコアに応じて並び替えられて表示される場合のほか、入出力部2000がこの検索結果コンテンツの表示順序を、地域との関連度に応じて変更する等の処理を行ってから表示部13に表示される場合もある。この地域との関連度は、スコア導出部2500により第1の地域関連度スコア及び第2の地域関連度スコアとして導出され、入出力部2000に与えられる。第1の地域関連度スコアは、検索クエリに対する検索結果コンテンツの表示対象を絞り込むために用いられる。第2の地域関連度スコアは、この検索結果の表示順序を変更するために用いられる。
【0036】
コンテンツ地域関連判別部2220は、コンテンツ取得部2210によって取得された検索結果コンテンツと、状況情報生成部2100によって生成された状況情報に含まれる「検索クエリに応じた地域」とを用いて、その検索結果コンテンツがその地域にローカライズされたものであるか否かを判別するコンテンツ地域関連判別手段である。「検索結果コンテンツがローカライズされている」とは、“検索結果コンテンツが地域に関連している”ということを意味する。そしてコンテンツ地域関連判別部2220は、この判別の結果に従ってコンテンツ地域関連特定情報を生成し、各検索結果コンテンツに付与する。ここでコンテンツ地域関連特定情報とは、ある検索結果コンテンツが、検索クエリに応じた地域と関連を持っているか否かを特定する情報である。この検索結果コンテンツと、コンテンツ地域関連特定情報とは、スコア導出部2500が第2の地域関連度スコアを導出するときに用いられるため、コンテンツ地域関連判別部2220からスコア導出部2500に出力される。この時、各検索結果コンテンツに紐づく元スコアも、コンテンツ地域関連判別部2220からスコア導出部2500に出力される。
【0037】
サーバ側検索ログ記憶領域221は、入出力部2000が受け取った移動通信端末1の検索ログデータを蓄積して記憶する。サーバ側検索ログ記憶領域221が記憶する検索ログデータは、特定の移動通信端末から受け取る検索ログデータに限ったものではなく、異なる多数の移動通信端末からサーバ装置2に送信され入出力部2000が受け取った検索ログデータである。つまり、サーバ側検索ログ記憶領域221には、異なる多数のユーザによって行われた検索に関する履歴情報が検索ログデータとして記憶されている。このように、サーバ側検索ログ記憶領域221は、検索の履歴を記憶する検索履歴記憶手段として機能する。
【0038】
標本データ生成部2300は、検索クエリ地域関連判別部2310を有する。検索クエリ地域関連判別部2310は、ユーザが指定した検索クエリと、この検索クエリに応じた地域と、サーバ側検索ログ記憶領域221に記憶された検索ログデータとを入力情報として、各検索ログデータに対する検索クエリ地域関連特定情報を生成して付与する検索クエリ地域関連判別手段である。検索クエリ地域関連特定情報とは、前述したとおり、検索クエリが、この検索クエリに応じた地域と関連を持っているか、すなわち、検索クエリがローカライズを意図しているか否かを特定する情報である。検索ログデータにおいて、検索クエリに適合した検索結果コンテンツのうち、この検索クエリに応じた地域に関連を持っているコンテンツにユーザがアクセスしていた場合、ユーザはローカライズされた検索結果を望んでいたと可能性が考えられるため、この検索クエリについてもローカライズを意図しているとみなすことが可能である。よって、このような検索クエリに対しては、ローカライズを意図しているということを意味する検索クエリ地域関連特定情報が付与されることになる。また、標本データ生成部2300は、ユーザが指定した検索クエリと、この検索クエリに応じた地域と、サーバ側検索ログ記憶領域221に記憶され検索クエリ地域関連判別部2310により検索クエリ地域関連特定情報が付与された検索ログデータとを入力情報として、標本データを生成する標本データ生成手段としても機能する。標本データは、後述するスコア導出式生成部2400がスコア導出式を生成する際の入力情報として使用されるため、標本データ生成部2300は、生成した標本データをスコア導出式生成部2400に出力する。
【0039】
スコア導出式生成部2400は、標本データ生成部2300により生成された標本データを用いて、スコア導出式を生成するスコア導出式生成手段である。ここで、スコア導出式とは、スコア導出部2500が第1の地域関連度スコアを導出するための計算式であり、スコア導出式生成部2400から、スコア導出手段であるスコア導出部2500に出力される。スコア導出式生成部2400からスコア導出部2500にスコア導出式が入力されると、スコア導出部2500は、このスコア導出式に対し、検索クエリがユーザにより指定されたときに状況情報生成部2100により生成された状況情報ビット列を代入して、第1の地域関連度スコアを導出する。第1の地域関連度スコアは、ユーザが検索を望んだときにどの程度ローカライズされた検索結果を望んでいるかの度合い、すなわちユーザが指定した検索クエリが、この検索クエリに応じた地域に対して有する地域関連度を定量的に数値化したものである。この第1の地域関連度スコアは、前述したように、入出力部2000が検索クエリに適合する検索結果の表示対象を絞り込む際の判定基準に使用される。
【0040】
また、スコア導出部2500は、検索クエリに適合する検索結果コンテンツと、各検索結果コンテンツに付与された元スコアと、各検索結果コンテンツに付与されたコンテンツ地域関連特定情報と、第1の地域関連度スコアとを用いて、第2の地域関連度スコアを導出する。第2の地域関連度スコアは、検索クエリに適合した検索結果コンテンツの各々が、この検索クエリに応じた地域にどの程度関係しているか、すなわち各検索結果コンテンツが、この検索クエリに応じた地域に対して有する地域関連度を定量的に数値化したものである。この第2の地域関連度スコアは、前述したように、入出力部2000が検索クエリに適合する検索結果の表示順序を変更する際の判定基準に使用される。このようにスコア導出部2500は、第1の地域関連度スコアおよび第2の地域関連度スコアを導出するスコア導出手段として機能する。
【0041】
(1−5)コンテンツ地域関連特定情報の生成方法
ここで、前述したコンテンツ地域関連特定情報の生成方法について説明する。
入出力部2000よりユーザが指定した検索クエリを受け取ると、コンテンツ取得部2210は、ネットワーク上の検索サーバ装置を通じて、この検索クエリに適合する検索結果を取得する。この検索結果は、検索クエリの内容のみに基づいて検索サーバ装置が検索した結果であり、検索結果コンテンツと、各検索結果コンテンツが保持する元スコアとが含まれている。コンテンツ地域関連判別部2220は、この検索結果コンテンツと検索クエリに応じた地域とを用いて、この各検索結果コンテンツが、この地域と関連を持つコンテンツであるか否かを判別する。この判別は、各検索結果コンテンツが保持しているメタデータに含まれる、緯度・経度や住所等の位置に関する位置情報と、検索クエリに応じた地域とが合致するか否かに基づいて行われる。そして、コンテンツ地域関連判別部2220は、この判別の結果に従って各検索結果コンテンツにコンテンツ地域関連特定情報を付与する。すなわち、コンテンツ地域関連判別部2220は、メタデータに含まれる位置情報と検索クエリに応じた地域とが合致し、検索クエリに応じた地域と関連すると判別した検索結果コンテンツには、コンテンツ地域関連特定情報として「1」の値を付与する。一方、コンテンツ地域関連判別部2220は、メタデータに含まれる位置情報と検索クエリに応じた地域とが合致せず、検索クエリに応じた地域と関連しないと判別した検索結果コンテンツには、コンテンツ地域関連特定情報として「0」の値を付与する。
【0042】
(1−6)第1の地域関連度スコアの導出
次に、ユーザが検索クエリを指定した際に、このユーザがどの程度ローカライズされた検索結果を望んでいるかの度合いである第1の地域関連度スコアをどのような考え方に基づいて導出するかを説明する。
第1の地域関連度スコアは、ユーザが指定した検索クエリの内容と、ユーザが検索クエリを指定したときのそのユーザの位置(ユーザが所在する位置を含む地域)と、検索クエリが指定されたときのユーザが置かれている状況(ただし、ユーザの位置を除く)とに依存する。この理由を説明すると次のようになる。例えばユーザが、3月乃至4月の花見の季節(つまりユーザが置かれている状況)に「桜」という検索文字列(つまり検索クエリの内容)で検索した場合には、ユーザは花見の場所を検索している可能性が高いと考えられる。この場合、ユーザの位置に近くて花見ができるような場所に関するコンテンツが上位に表示された検索結果、すなわちローカライズされた検索結果をユーザは取得出来たほうが望ましいはずである。一方、例えばユーザが、一般的に花見の季節とは言えない秋(ユーザが置かれている状況)に「桜」という検索文字列(検索クエリの内容)で検索をした場合には、植物としての「桜」そのものの特性や、「桜」という名称を含んだ楽曲等のように、花見とは別の意味で「桜」に関連するコンテンツを調べたいという可能性が高い。もちろん、この場合には、ローカライズされていない検索結果コンテンツを取得出来たほうがユーザにとって望ましいと言える。
【0043】
また、ユーザが検索クエリを指定したときの位置が異なる場合には、ローカライズされた検索結果をユーザが望んでいるか否かも異なる。例えばユーザが、昼食の時間帯(ユーザが置かれている状況)に「カレー」という検索文字列(検索クエリの内容)で検索した場合、そのユーザの位置がレストラン街に属していれば(ユーザの位置)、近辺に存在するカレー屋に関するコンテンツが上位に表示された検索結果をユーザが望んでいる可能性が高い。一方、昼食の時間帯であっても、飲食店がまったく存在しない地域にユーザがいた場合(ユーザの位置)、ユーザが近辺に存在するカレー屋に関するコンテンツを調べたいという可能性よりも、カレーのレシピや由来等を調べたいという可能性が高い。このような場合には、ローカライズされていない検索結果コンテンツを取得出来たほうがユーザにとって望ましい。
【0044】
さらに、ユーザが置かれている状況が同一でユーザの位置も同一であるときに行われた検索であっても、ユーザが指定した検索クエリの内容によって、ローカライズされた検索結果をユーザがどの程度望んでいるかが異なってくる。例えば、上記に述べた「桜」や「カレー」といった検索文字列であれば、検索クエリがローカライズを意図している可能性があるが、例えば、特定の人物名や「内閣総理大臣」のような、人間に関連する意味を持つ検索文字列の場合、検索クエリがローカライズを意図している可能性は極めて低いと考えられる。
【0045】
このように、ユーザが指定した検索クエリがローカライズを意図している可能性、つまり、第1の地域関連度スコアは、ユーザが指定した検索クエリの内容と、ユーザが検索クエリを指定した時点のユーザの位置(つまり検索クエリに応じた地域)と、検索クエリが指定されたときのユーザが置かれている状況(つまり、検索クエリをユーザが指定したときのユーザが置かれている状況情報乃至状況情報ビット列、ただし、ユーザの位置については既に考慮しているので除く)に依存するのである。
【0046】
ところで、ユーザが検索を行うにあたって、検索クエリの内容およびこの検索クエリに応じた地域との組み合わせについて共通した検索が繰り返し行われることがある。例えばユーザの職場がA駅付近にあることから、A駅近辺において飲食店について頻繁に検索を行うというような場合などである。この各検索において検索クエリの内容および地域は共通することがあっても、検索を行った際のユーザが置かれている状況はその都度異なる。そこで、ユーザが或る検索クエリを或る地域において指定した際に、それと同じ地域および同じ検索クエリの組み合わせで行われた過去の検索に関する検索履歴データを学習データとして用い、現在ユーザが置かれている状況の下で、そのユーザがどの程度ローカライズされた検索結果コンテンツを望んでいるかを推測するのが、第1の地域関連度スコアを導出するにあたっての考え方である。
【0047】
(1−7)標本データの生成方法
このような第1の地域関連度スコアを導出するべく、標本データ生成部2300は、サーバ側検索ログ記憶領域221に記憶された全ての検索ログデータから、ユーザが指定した検索クエリ及びこの検索クエリに応じた地域に該当する検索ログデータを抽出し、この抽出後の検索ログデータに含まれる状況情報ビット列をもとに、標本データなるものを生成する。
図8は、標本データ生成部2300が標本データを生成する際の動作を説明する図である。この図8において、対象データ30〜35は、サーバ側検索ログ記憶領域221に記憶されている検索ログデータである。サーバ側検索ログ記憶領域221に記憶されているということは、異なる多数のユーザにより過去に指定された検索クエリに基づいてなされた検索に関する情報ということである。抽出条件40,41は、対象データを抽出して絞り込むための抽出条件として使用される内容を意味している。標本データ50は、対象データ35から生成された標本データである。
【0048】
さらに詳細に説明すると、対象データ30は、サーバ側検索ログ記憶領域221に記憶されている全ての検索ログデータである。対象データ30に対する抽出条件40は、検索クエリ及び地域という内容を含む。抽出条件40としての検索クエリは、ユーザが指定した検索クエリである。また、抽出条件40としての地域は、この検索クエリに応じた地域のことである。標本データ生成部2300が、対象データ30を抽出条件40に含まれる地域に基づいて抽出したものが対象データ31,32である。すなわち、対象データ30における各検索ログデータには、検索クエリに応じた地域が含まれているから(図3参照)、標本データ生成部2300は、この地域を参照し、対象データ30における検索ログデータから、抽出条件40に含まれる地域に該当する検索ログデータを抽出する。図8において、抽出条件40における地域は「地域A」であるから、標本データ生成部2300が、対象データ30の中から「地域A」をキーにして抽出したものが対象データ31である。この結果、対象データ30は、地域Aに関連する対象データ31と、地域A以外の地域に関連する対象データ32とに分類されることになる。
【0049】
次に、標本データ生成部2300が、対象データ31から、抽出条件41に含まれる検索クエリに基づいて抽出したものが対象データ33,34である。抽出条件41における検索クエリは、抽出条件40における検索クエリと同一のものである。対象データ31における各検索ログデータには検索クエリが含まれているから(図3参照)、標本データ生成部2300は、この検索クエリを参照し、対象データ31における検索ログデータから、抽出条件41における検索クエリに該当する検索ログデータを抽出する。図8において、抽出条件41における検索クエリの中身は「検索クエリ1」であり、標本データ生成部2300が、対象データ31を「検索クエリ1」で抽出したものが対象データ33である。従って、対象データ33に含まれる各検索ログデータは、地域として「地域A」、検索クエリとして「検索クエリ1」を共通して含んでいる。この結果、対象データ31は、検索クエリ1に関連する対象データ33と、検索クエリ1以外の検索クエリに関連する対象データ34とに分類されることになる。
【0050】
次に、検索クエリ地域関連判別部2310は、対象データ33である検索ログデータに対して、検索クエリ地域関連特定情報45を生成して付与する。より具体的には、検索クエリ地域関連判別部2310は、対象データ33である検索ログデータに含まれる、検索クエリと、この検索クエリに基づきユーザがアクセスした検索結果コンテンツと、この検索結果コンテンツにコンテンツ地域関連判別部2220が付与したコンテンツ地域関連特定情報との組み合わせに基づいて、検索クエリ地域関連特定情報を生成して各検索ログデータに付与する。例えば、ある検索ログデータにおいて、検索結果コンテンツにコンテンツ地域関連特定情報として「1」が付与されていた場合、検索クエリ地域関連判別部2310は、この検索ログデータに対しては、検索クエリ地域関連特定情報として、検索クエリが地域関連度を有していることを意味する「1」の値を付与する。一方、検索クエリ地域関連判別部2310は、ある検索ログデータにおいて検索結果コンテンツにコンテンツ地域関連特定情報として「0」が付与されていた場合、この検索ログデータに検索クエリ地域関連特定情報として、検索クエリが地域関連度を有していないことを意味する「0」の値を付与する。
【0051】
よって、この結果得られた対象データ35は、ユーザが指定した検索クエリおよびこの検索クエリに応じた地域をキーにして抽出され、さらに、検索クエリ地域関連特定情報が付与された検索ログデータの集合ということになる。標本データ生成部2300は、この対象データ35である検索ログデータから、標本データ50を生成する。より具体的には、標本データ生成部2300は、図8の対象データ35である検索ログデータから、各々の検索ログデータに付与された検索クエリ地域関連特定情報と、その検索ログデータに含まれる状況情報ビット列を抽出し、これらを組み合わせることで標本データ50を生成する。そして、標本データ生成部2300は、生成した標本データをスコア導出式生成部2400に出力する。
【0052】
図9は、標本データ50の具体例を表した図である。
図9における標本データA,B,Cは、同一の検索クエリと同一の地域をキーにして抽出された標本データのそれぞれである。各標本データA,B,Cは、「1」もしくは「0」の値を取る検索クエリ地域関連特定情報と、2値で表現された状況情報ビット列(図7参照)とで構成されている。各標本データを構成する状況情報ビット列における各項目の内容(位置情報1,2・・、属性情報1,2・・、時刻情報1,2・・・)は、例えば図7における「住所からの距離/近い」や、「性別/男」といった、状況情報に含まれる各項目のことである。
【0053】
(1−8)スコア導出式の生成と、第1の地域関連度スコア及び第2の地域関連度スコアの導出
スコア導出式生成部2400は、標本データ生成部2300から標本データを受け取ると、これを用いてスコア導出式を生成する。スコア導出式生成部2400によるスコア導出式の生成方法は、以下のとおりである。
ユーザが発行した検索クエリqが、この検索クエリに応じた地域aに対して地域関連度を有する確率を、p(q|a)とする。スコア導出式は、この確率p(q|a)を求めるための計算式である。この計算式は、特定の地域aにおける検索クエリqで定まり、状況情報Cを引数として持つ関数Faq(C)として定義することが可能である。よって、確率p(q|a)と関数Faq(C)の関係を以下のように表すことができる。
p(q|a)=Faq(C)・・・(a)
状況情報Cには、「1」もしくは「0」のいずれかの値をとる状況情報ビット列が代入される。ここで状況情報ビット列がn個の変数で構成されるn次元の情報であるとして、これらの変数を、x1,x2,・・・,xnとおくと、式(a)は以下のような式(b)で表される。
p(q|a)=Faq(C)=Faq(x1,x2,・・・,xn)・・・(b)
【0054】
このように、多次元の変数がそれぞれ2値で表現された標本データが十分なサンプル数だけ過去に蓄積されている場合、これらの標本データを学習データとして分析し、新たな多次元の変数に対して確率的に解を得る方法として、ロジスティック回帰分析、ニューラルネットワーク或いはSVM(Support Vector Machine)等がある。例えばロジスティック回帰分析における回帰式は、以下の式(c)のように表される。
logit(p)=log(p/1−p)=b0+b1x1+b2x2+…+bnxn・・・(c)
式(c)において、係数b0〜bnの値が確定したものが、確率P(q|a)を求めるための計算式、すなわちスコア導出式となる。スコア導出式生成部2400は、取得した標本データを入力として上述の回帰式における係数b0〜bnを求めるための計算を行う。
【0055】
式(c)の左辺における真数、つまりオッズ(p/1−p)を導出するために、標本データの各々に付与された検索クエリ地域関連特定情報が用いられる。ここでは、説明を簡略化するために、状況情報ビット列が1次元の入力値を持つとする。すなわち、式(c)が以下のように表されるものとする。
logit(p)=log(p/1−p)=b0+b1x1・・・(d)
式(d)において、検索クエリ地域関連特定情報は,x1にのみ依存するということを意味している。ここで、例えば標本データが6個あり、「x1」の値と「検索クエリ地域関連特定情報」の値との組み合わせが次のような6組である例を想定する。
(x1,検索クエリ地域関連特定情報)=(1,1),(1,1),(1,0),(0,1),(0,1),(0,1)
オッズは、各変数の組(この場合はx1=1 orx1=0)の数だけ導出される。従って、標本データを構成する状況情報ビット列がn次元の2値を持つ場合、オッズは最大で2のn乗個導出されることとなる。x1=1の場合のオッズは、以下のように算出したpに従って求められることになる。
p(x1=1)=(x1=1で、且つ、検索クエリ地域関連特定情報が1であった標本データの数)/(x1=1である全ての標本データの数)・・・(e)
上述した標本データが6個の例において、式(e)に従ってp(x1=1)を算出すると、
p(x1=1)=2/3
となる。
よって、オッズは、
p/(1−p)=(2/3)/(1−2/3)=2
となる。
このようにx1=1とした場合に得られた「2」という値は、検索クエリ地域関連特定情報が「1」になる確率が、「0」になる確率の2倍となる、という意味を持つ。
【0056】
このようにして、標本データを構成する状況情報ビット列における変数の組み合わせの数だけ、オッズ、すなわち式(c)における左辺の真数の値が求められる。そして、式(c)における右辺におけるx1〜xnと、それに応じた式(c)における左辺のオッズの値とが明らかになった関係式が、標本データを構成する状況情報ビット列における変数の組み合わせの数だけ求められる。スコア導出式生成部2400は、このようにして求めた関係式に対して、最小二乗法を適用することで、左辺の誤差分散を最小とするような係数b0〜bnの組を求める。
【0057】
ここで、例えば状況情報ビット列が5次元の変数からなる場合を仮定すると、式(c)で表される回帰式は以下のように表される。
logit(p)=log(p/1−p)=b0+b1x1+b2x2+b3x3+b4x4+b5x5・・・(f)
式(f)において、例えば変数の値がb0=1,b1=1,b2=−1,b3=−1,b4=0,b5=2のように求められたとすると、式(f)は以下のようになる。
logit(p)=log(p/1−p)=1+x1−x2−x3+2x5・・・(g)
このように、式(c)において係数b0〜bnが求められた式(g)が、第1の地域関連度スコアを導出するための計算式、すなわちスコア導出式となる。スコア導出式生成部2400は、生成したスコア導出式をスコア導出部2500に出力する。
【0058】
スコア導出部2500は、ユーザが検索クエリを指定した時点における状況情報ビット列と、スコア導出式とを用いて第1の地域関連度スコアを導出する。すなわち、スコア導出部2500は、スコア導出式における変数x1,x2,・・・,xnに、状況情報ビット列に含まれるx1,x2,・・・,xnの値を代入して、スコア導出式の左辺の値、すなわち、第1の地域関連度スコアを求める。第1の地域関連度スコアは、前述したように、ある検索クエリが、この検索クエリに応じた地域に対して有する地域関連度を定量的に数値化したものである。スコア導出部2500は、導出した第1の地域関連度スコアを入出力部2000に出力する。
【0059】
上述のように第1の地域関連度スコアを導出するためには、スコア導出式が必要であるが、このスコア導出式を生成するためには、標本データが必要である。しかし、ユーザが指定した検索クエリおよびこの検索クエリに応じた地域に該当する検索ログデータについて、回帰分析が可能なほど充分な数がサーバ側検索ログ記憶領域221に存在しなかった場合、標本データ生成部2300は標本データを生成できない場合がある。こうした場合に備え、次のようにして第1の地域関連度スコアに対する仮のスコアを導出する。すなわち、サーバ側検索ログ記憶領域221に上述の検索ログデータが充分な数だけ存在しなかった場合、標本データ生成部2300は、サーバ側検索ログ記憶領域221に存在する全検索ログデータのうち、検索クエリ地域関連特定情報が「1」の値を持つ検索ログデータの数を求めると、これを全検索ログデータ数で除算する。この除算により得られた値が仮のスコアである。つまり、指定された検索クエリや地域に関わらず、いずれかの地域に地域関連度を有する検索ログデータと全ての検索ログデータとから得られる平均値を仮のスコアとするものである。
【0060】
そして、ユーザが指定した検索クエリおよびこの検索クエリに応じた地域に該当する検索ログデータが、回帰分析が可能なほど充分な数だけサーバ側検索ログ記憶領域221に記憶された時点で、標本データ生成部2300は、標本データを生成し、仮のスコアは前述したような一連の処理によって導出された第1の地域関連度スコアで置き換えられる。この回帰分析が可能なほど充分な数の最低ラインは「1」であり、望ましくは例えば「1000」である。ただし、これは検索ログデータの数に関する条件であって、実質的には、標本データが最低「1」以上なければならない。これらの数は、回帰分析が可能か否かを判断するための閾値として、サーバ装置2が備える記憶部22に予め記憶されている。
【0061】
図10は、第2の地域関連度スコアと検索結果コンテンツの関係を表した図である。
図10においては、3つの検索結果コンテンツ1〜3のそれぞれについての、元スコア、コンテンツ地域関連特定情報及び第2の地域関連度スコアの内容を例示している。スコア導出部2500は、第1の地域関連度スコアを導出した後に、第2の地域関連度スコアを導出する。前述したように、コンテンツ地域関連判別部2220よりスコア導出部2500に入力された各検索結果コンテンツは、元スコアと、コンテンツ地域関連特定情報とを含んでいる。ここで、各検索結果コンテンツについて求める第2の地域関連度スコアをS2とすると、スコア導出部2500はS2を以下の式(h)に従って求める。
S2=S1*(1−p)+S1*p*r・・・(h)
ここで、S1は各検索結果コンテンツに対する元スコアであり、pは第1の地域関連度スコアであり、rは各検索結果コンテンツに対するコンテンツ地域関連特定情報である。図10に表された第2の地域関連度スコアは、p=0.7の場合である。スコア導出部2500が、各検索結果コンテンツについて式(h)にそれぞれの変数を代入し計算を行うことで、検索結果コンテンツの各々に対する第2の地域関連度スコアが求まる。式(h)によれば、ユーザが指定した検索クエリに応じた地域に対して地域関連度を有していない検索結果コンテンツは、第2の地域関連度スコアが、元スコアより低い値となる。スコア導出部2500は、各検索結果コンテンツに対して第2の地域関連度スコアを導出すると、これを検索結果コンテンツと共に入出力部2000に出力する。
【0062】
(1−9)検索結果の表示
入出力部2000は、第1の地域関連度スコアが、予め定められた閾値以上の値を取る場合、取得した検索結果コンテンツのうち、コンテンツ地域関連特定情報に「1」の値が付与された検索結果コンテンツのみを移動通信端末1への出力対象とする。すなわち、第1の地域関連度スコアが高い値を取るほど、ユーザが検索を行った際にローカライズされた検索結果を望んでいる確率が高いため、第1の地域関連度スコアが設定された閾値を越えた場合には、入出力部2000は、ユーザが発行した検索クエリに応じた地域と関連する検索結果コンテンツのみを出力するのである。ここで定められた閾値は例えば「0.8」であり、サーバ装置2が備える記憶部22に予め記憶されてもよいし、移動通信端末1が備える記憶部12に記憶されユーザにより変更可能としてもよい。この閾値が移動通信端末1の備える記憶部12に記憶される場合、検索部19により検索クエリが入出力部2000に入力された後に、移動通信端末1のCPU111によりこの閾値が入出力部2000に入力される。
【0063】
第1の地域関連度スコアが閾値以上の場合には、入出力部2000は、コンテンツ地域関連特定情報が「1」の値である検索結果コンテンツを、第2の地域関連度スコアが高い順に検索結果コンテンツの表示順序を並び替えて検索部19に出力する。よって、ユーザが発行した検索クエリに応じた地域と関係性の無い検索結果コンテンツは、表示部13における表示順序が下がることとなるから、ユーザは、検索結果を参照するときに、ユーザ自身の位置に関連性の高い検索結果コンテンツを優先してチェックすることが可能となる。一方、第1の地域関連度スコアが閾値未満の場合、入出力部2000は、コンテンツ地域関連特定情報の値に関わらず、検索結果コンテンツを第2の地域関連度スコアが高い順に出力順序を並び替えて検索部19に出力することになる。このように入出力部2000は、第1の地域関連度スコア及び第2の地域関連度スコアを用いて検索結果の出力対象および出力順序を変更し、変更後の検索結果をユーザの端末装置に送信する送信手段として機能する。
検索部19は受け取った検索結果を表示部13に表示する。
【0064】
(1−10)検索時の動作
図11は、検索開始から検索終了までの処理フローを表している。
まず、ユーザが検索文字列および検索式を入力して検索クエリを指定すると、検索部19は、この指定を受け付ける。そして、検索部19は、この検索クエリを含む検索要求をサーバ装置2に送信し、サーバ装置2はこれを受信する(ステップS1)。移動通信端末1のCPU111は、位置特定部16によって生成された緯度・経度で表した位置情報および端末側検索ログ記憶領域122に記憶された検索ログデータおよびユーザ属性121に記憶されたユーザの属性情報をサーバ装置2に送信し、サーバ装置2はこれらの入力情報を受信する(ステップS2)。状況情報生成部2100は、入力された位置情報およびユーザの属性情報に基づいて状況情報を生成する(ステップS3)。次に、状況情報生成部2100は、状況情報に含まれる位置情報と、地域変換テーブル2110とに基づいて、ユーザが発行した検索クエリに応じた地域を特定する(ステップS4)。次に、状況情報生成部2100は、生成した状況情報の内容に従って、さらに状況情報ビット列を生成する(ステップS5)。次に、標本データ生成部2300は、ユーザが指定した検索クエリおよびこの検索クエリに応じた地域に該当する検索ログデータが、回帰分析を行うことが可能な閾値を超える数だけサーバ側検索ログ記憶領域221に記憶されているかを判定する(ステップS6)。
【0065】
この閾値を超える数の検索ログデータがサーバ側検索ログ記憶領域221に記憶されていた場合(ステップS6;YES)、標本データ生成部2300は、ユーザが指定した検索クエリと、この検索クエリに応じた地域とに基づいて、サーバ側検索ログ記憶領域221に記憶された検索ログデータから、標本データを生成する(ステップS7)。次に、スコア導出式生成部2400は、標本データに対して上述したような回帰分析を行い、スコア導出式を生成する(ステップS8)。次に、スコア導出部2500は、状況情報ビット列とスコア導出式とを用いて第1の地域関連度スコアを導出する(ステップS9)。一方、コンテンツ取得部2210は、ユーザが指定した検索クエリに適合した検索結果コンテンツと、各検索結果コンテンツに対する元スコアを含む検索結果を検索サーバ装置から取得する(ステップS10)。なお、このステップS10の処理は、検索サーバ装置から検索結果が送信されてくる時期によっては、ステップS9以前になされることがある。
【0066】
次に、コンテンツ地域関連判別部2220は、取得された検索結果コンテンツの各々に対して、コンテンツ地域関連特定情報を判別して付与する(ステップS11)。次に、スコア導出部2500は、取得された検索結果コンテンツと、各検索結果コンテンツに対する元スコアと、各検索結果コンテンツに付与されたコンテンツ地域関連特定情報と、第1の地域関連度スコアとに基づいて、取得された検索結果コンテンツの各々に対して第2の地域関連度スコアを導出する(ステップS12)。
【0067】
入出力部2000は、第1の地域関連度スコアが閾値を超えていた場合、取得された検索結果コンテンツのうち、検索クエリに応じた地域と関連する意味のコンテンツ地域関連特定情報が付与されたコンテンツのみを出力対象とする。そして、入出力部2000は、取得された検索結果コンテンツ、あるいは第1の地域関連度スコアを用いて出力対象とされた検索結果コンテンツを、第2の地域関連度スコアが高い順序に並び替えて、検索部19に出力する(ステップS13)。そして、検索部19は、この順序に従って検索結果コンテンツを表示部13の上方から並べて表示する(ステップS14)。ユーザが検索を終了すると、検索部19は、検索に関連する情報を、端末側検索ログ記憶領域122に検索ログデータとして保存する(ステップS15)。なお、ステップS6において、サーバ側検索ログ記憶領域221に存在する該当の検索ログデータの数が閾値未満であった場合(ステップS6;NO)、標本データ生成部2300は、第1の地域関連度スコアに対して仮のスコアを導出し(ステップS16)、ステップS10へ進む。そして、ステップ10以降においては、第1の地域関連度スコアとしての仮のスコアが用いられて処理が進行する。
【0068】
図12は、ステップS9における第1の地域関連度スコアを導出する詳細な処理フローを表している。
スコア導出部2500は、スコア導出式生成部2400の出力結果であるスコア導出式を取得する(ステップS21)。次にスコア導出部2500は、状況情報生成部2100の出力結果である状況情報ビット列を取得する(ステップS22)。スコア導出部2500は、計算式であるスコア導出式におけるx1〜xnの変数に、取得した状況情報ビット列を代入して計算を行い、第1の地域関連度スコアを導出する(ステップS23)。
【0069】
図13は、ステップS12における第2の地域関連度スコアを導出する詳細な処理フローを表している。
スコア導出部2500は、コンテンツ地域関連判別部2220より、検索結果コンテンツと、各検索結果コンテンツに対する元スコアと、各検索結果コンテンツに付与されたコンテンツ地域関連特定情報とを取得する。(ステップS31)。次にスコア導出部2500は、自らが算出した第1の地域関連度スコアと、ステップS31で取得した各種情報に基づいて、前述の第2の地域関連度スコアを求める計算式における変数に適宜代入を行い、取得した検索結果コンテンツの各々に対して第2の地域関連度スコアを導出する(ステップS32)。
【0070】
以上説明したように、サーバ装置2は、ユーザが指定した検索クエリと、ユーザが所在する地域と、ユーザが置かれた状況とに応じて、ユーザがどの程度ローカライズされた検索結果を望んでいるかを定量的な数値で表した第1の地域関連度スコアを導出し、この第1の地域関連度スコアに基づいて、検索結果の表示対象を絞り込む。また、サーバ装置2は、検索結果コンテンツの各々についてユーザの存在する地域に関連する度合いを定量的な数値で表した第2の地域関連度スコアに基づいて、検索結果の表示順序を並び替える。サーバ装置2がこうした一連の処理を行うことにより、ユーザは、検索を行う際にローカライズされた検索結果を希望するか否かについて指示を与える必要もなく、ローカライズされた検索結果を自身の希望に沿って取得し得る可能性が高くなる。このとき、ユーザは特別なインターフェースを介することなく、普段使い慣れた一般的な検索サーバ装置を用いるので、使い勝手がよい。また、上記実施形態によれば、ユーザが置かれている状況に合わせて検索結果のローカライズを行うことで、ユーザに予想していなかった気付きを与えることも可能となる。
【0071】
(2)変形例
上記の実施形態を次のように変形してもよい。また、以下の変形例は適宜組み合わせて実施することも可能である。
(2−1)変形例1
上記の実施形態においては、サーバ側検索ログ記憶領域221に充分な数の検索ログデータが記憶されていても、ユーザが発行した検索クエリに含まれる検索文字列が、初めて指定される検索文字列であった場合、すなわちサーバ側検索ログ記憶領域221に記憶された検索ログデータに、この検索クエリに該当する検索ログデータが存在しなかった場合には、この検索クエリが有する地域関連度を推測することが難しい。こうした事態に備えて、検索文字列に対する定性的な推測手段を用意しておいてもよい。すなわち、特定の検索文字列を記憶した検索文字列辞書をサーバ装置2の備える記憶部22が記憶しておき、ユーザにより初めて指定された検索文字列がこの検索文字列辞書に記憶されていた場合、この検索クエリは地域関連度を有すると判別するようにしてもよい。例えばこの検索文字列辞書に「居酒屋」という検索文字列が記憶されており、ユーザにより初めて「居酒屋」という検索文字列を含む検索クエリが発行された場合、図11におけるステップS6において標本データ生成部2300が上述の判別を行い、判別の結果をスコア導出部2500に通知する。スコア導出部2500はこの通知の内容に従って、第1の地域関連度スコアについて、検索クエリが地域関連度を確実に有することを意味する「1」の値を導出したりする。ここで導出される第1の地域関連度スコアが持つ値は、これに限ったものではなく、設計において自由に設定してもよい。要するに、設定された閾値を超える値を有するように、第1の地域関連度スコアが導出されればよい。このようにすれば、ユーザが初めて指定する検索文字列を含む検索クエリを発行した場合にも、ローカライズされた検索結果をユーザは取得することが可能となる。
【0072】
(2−2)変形例2
上記の実施形態においては、第1の地域関連度スコアが設定された閾値を超えた場合には、地域関連度を有する検索結果コンテンツのみが表示対象となっていた。地域関連度を有していない検索結果コンテンツでも、人気の高いコンテンツをユーザが見たいと望む場合に備えて、次のようにしてもよい。すなわち、第1の地域関連度スコアに対する閾値が2段階で設定され、各検索結果コンテンツが保持する元スコアに対する閾値が別途設定される。より高く設定された閾値を超える第1の地域関連度スコアが導出された場合、上記実施形態と同様に、入出力部2000は地域関連度を有している検索結果コンテンツのみを出力対象とする。そして、より高く設定された閾値未満で、より低く設定された閾値を超える第1の地域関連度スコアが導出された場合、入出力部2000は、地域関連度を有する検索結果コンテンツに加えて、地域関連度を有していなくても設定された閾値を超える元スコアを保持する検索結果コンテンツを出力対象としてもよい。これらの各閾値は、サーバ装置2が備える記憶部22に予め記憶されてもよいし、移動通信端末1が備える記憶部12に記憶されユーザにより変更可能としてもよい。これらの閾値が移動通信端末1の備える記憶部12に記憶される場合、検索部19により検索クエリが入出力部2000に入力された後に、移動通信端末1のCPU111が、これらの閾値を入出力部2000に入力する。このようにすれば、入出力部2000は検索結果のうち出力対象となるものをより柔軟に決めることが可能となり、結果として、ユーザはローカライズされた検索結果に限らず、人気の高いコンテンツも検索結果として取得することが可能となる。
【0073】
(2−3)変形例3
状況情報は、ユーザが検索クエリを指定した時点におけるユーザが置かれている状況を表す情報であればよく、その内容は実施形態の例に限定されない。すなわち状況情報は、ユーザが検索クエリを指定した時点における状況に関して、地域関連度の有無に影響を及ぼすと考えられる情報であればどのようなものであってもよい。例えば位置情報、属性情報および時刻情報を構成する項目の種類や内容は上述の例に限ったものではなく、例えば時刻情報において、曜日として「月曜日〜日曜日」といった項目が含まれていてもよい。
【0074】
(2−4)変形例4
上記の実施形態においては、検索ログデータを、地域、検索クエリという抽出条件の順序で抽出しているが、この順序はこれに限らず、検索クエリ、地域の順序で抽出を行ってもよい。すなわち、抽出処理の順序に関わらず、地域および検索クエリを用いて検索ログデータの抽出が行われればよい。
【0075】
(2−5)変形例5
上記の実施形態の説明において、第1の地域関連度スコアは、ユーザが指定した検索クエリの内容と、ユーザが検索クエリを指定したときのそのユーザの位置(ユーザが所在する位置を含む地域)と、検索クエリが指定されたときのユーザが置かれている状況(ただし、ユーザの位置を除く)とに依存すると説明した。ユーザが検索クエリを指定したときのそのユーザの位置(ユーザが所在する位置を含む地域)は、検索クエリが指定されたときのユーザが置かれている状況に含まれる位置に基づいて特定されるものであるため、第1の地域関連度スコアは、実質的には、ユーザが指定した検索クエリの内容と、検索クエリが指定されたときのユーザが置かれている状況(ユーザの位置を含む)とに依存すると言ってもよい。
【0076】
(2−6)変形例6
上記の実施形態では、検索結果コンテンツを、第2の地域関連度スコアが高い順序に表示部13の上方から並べて表示していたが、検索結果コンテンツの提示については、第2の地域関連度スコアが高い順から優先的にユーザに提示するものであればよい。例えば、表示部13における表示順序ではなく、第2の地域関連度スコアが高いものは大きく表示し第2の地域関連度スコアが低いものは小さく表示したり、第2の地域関連度スコアが高いものは目立つ色で表示し第2の地域関連度スコアが低いものは目立たない色で表示するなど、第2の地域関連度スコアが高いほどユーザに目立つように提示すればよい。つまり、優先的な提示とは、ユーザにとってより目立つ態様で提示するということである。また、表示による提示に限らず、音声による提示であってもよい。
【0077】
(2−7)変形例7
図8において、抽出条件は検索クエリ及び地域という内容を含んでおり、この抽出条件と同一の検索クエリ及び地域に基づいて検索ログデータが抽出されていた。この抽出においては、抽出条件と完全一致するものだけを抽出するのではなく、抽出条件に対して予め決められた類似範囲に収まる内容の検索ログデータを抽出するようにしてもよい。例えば検索クエリに関しては、類義語辞書をサーバ装置2が備える記憶部22に記憶しておき、検索クエリに含まれる検索文字列の類義語の範囲に収まる内容の検索ログデータを抽出すればよい。また、地域に関しては、地図をサーバ装置2が備える記憶部22に記憶しておき、検索クエリに含まれる地域に隣接する地域を含む検索ログデータを抽出すればよい。
【0078】
(2−8)変形例8
図3において、検索ログデータに検索クエリ地域関連特定情報を含むようにしてもよい。すなわち、図8において検索ログデータに検索クエリ地域関連特定情報が付与された後、付与された検索クエリ地域関連特定情報を付加して検索ログデータをサーバ側検索ログ記憶領域221に上書き保存するようにしてもよい。このようにすれば、図8において検索ログデータに検索クエリ地域関連特定情報を付与する際に、既に検索クエリ地域関連特定情報が付与されている検索ログデータは付与処理を省略することが可能なため、処理速度の向上を図ることが可能となる。
【0079】
(2−9)変形例9
上記の実施形態では、過去に蓄積された多次元の変数からなる標本データを分析して新たな多次元の変数に対して確率的に解を得る方法として、ロジスティック回帰分析を用いていたが、これは一例に過ぎず、これ以外の方法を用いてもよいことはもちろんである。
【0080】
(2−10)変形例10
上記実施形態では、サーバ装置2がネットワーク上の検索サーバ装置に対して検索を要求するものであったが、サーバ装置2が多数のコンテンツを記憶するに足る記憶容量を備えている場合には、サーバ装置2自身がコンテンツの検索を行ってもよい。つまり、検索を行う検索装置は、サーバ装置2の外部にあっても内部にあってもよい。
【0081】
(2−11)変形例11
上記実施形態で説明したサーバ装置2において、状況情報生成部2100、コンテンツ処理部2200、サーバ側検索ログ記憶領域221、スコア導出式生成部2400及びスコア導出部2500からなる部分と、検索クエリ地域関連判別部2310を含む標本データ生成部2300からなる部分とを、第1の情報処理装置および第2の情報処理装置という別体の情報処理装置によってそれぞれ構成し、これらを通信線で接続して、上記実施形態で説明したサーバ装置2と同等の機能を実現する情報処理システムを構築してもよい。
【0082】
(2−12)変形例12
本発明は、サーバ装置であるコンピュータに本発明を実現させるためのプログラムや、かかるプログラムを記憶させた光ディスク等の記録媒体としても特定され得る。本発明に係るプログラムは、インターネット等のネットワークを介して、サーバ装置にダウンロードさせ、これをインストールして利用可能にするなどの形態でも提供され得る。
【符号の説明】
【0083】
1…端末装置、2…サーバ装置、11,21…制御部、111,211…CPU、112,212…RAM、113,213…ROM、12,22…記憶部、121…ユーザ属性、122…端末側検索ログ記憶領域、221…サーバ側検索ログ記憶領域、13…表示部、14…操作部、15…無線通信部、16…位置特定部、17,24…電源制御部、18,25…バス、19…検索部、23…通信制御部、2000…入出力部、2100…状況情報生成部、2110…地域変換テーブル、2200…コンテンツ処理部、2210…コンテンツ取得部、2220…コンテンツ地域関連判別部、2300…標本データ生成部、2310…検索クエリ地域関連判別部、2400…スコア導出式生成部、2500…スコア導出部
【特許請求の範囲】
【請求項1】
検索の内容を表す検索クエリがユーザによって指定されたときの、当該ユーザが置かれた状況を表す状況情報であって、少なくとも当該ユーザの位置を含む状況情報を生成する状況情報生成手段と、
ユーザによって新たに指定された前記検索クエリと同一または予め決められた類似範囲に収まる内容であり、当該新たに指定された検索クエリよりも過去に指定された検索クエリである過去検索クエリと、当該過去検索クエリがユーザによって指定されたときの当該ユーザが置かれた状況を表す前記状況情報と、当該過去検索クエリがユーザによって指定されたときの当該ユーザの位置に当該過去検索クエリが関連性を有するか否かを特定する検索クエリ地域関連特定情報との組み合わせで構成される1組以上の標本データが与えられると、過去に蓄積された多次元の変数からなる標本データを分析して新たな多次元の変数に対して確率的に解を得る方法を用いることによって、ユーザが新たに指定した前記検索クエリが当該検索クエリを指定したときのユーザの位置にどの程度関連しているかの度合いを表す第1の地域関連度スコアを前記状況情報を入力して導出するための計算式であるスコア導出式を生成するスコア導出式生成手段と、
前記スコア導出式生成手段により生成されたスコア導出式に、前記状況情報生成手段により生成された状況情報を入力して、ユーザが新たに指定した検索クエリに対する前記第1の地域関連度スコアを導出するスコア導出手段と
を備えることを特徴とする情報処理装置。
【請求項2】
前記ユーザの位置と、前記ユーザの属性と、前記検索クエリが指定された時刻とを取得する取得手段を備え、
前記状況情報生成手段は、前記取得手段が取得した位置、ユーザの属性、及び時刻に関する情報を含む前記状況情報を生成する
ことを特徴とする請求項1に記載の情報処理装置。
【請求項3】
ユーザによって指定された前記検索クエリに従って検索した結果得られたコンテンツである検索結果コンテンツを取得するコンテンツ取得手段と、
前記コンテンツ取得手段により取得された各々の前記検索結果コンテンツが、当該検索結果コンテンツを検索するために用いられた前記検索クエリが指定されたときのユーザの位置に関連性を有するか否かを特定し、特定した結果を表すコンテンツ地域関連特定情報を、各々の当該検索結果コンテンツに付与するコンテンツ地域関連判別手段と、
前記スコア導出手段により導出された第1の地域関連度スコアが閾値を超えていた場合に、前記ユーザの位置に関連性を有することを表す前記コンテンツ地域関連特定情報が付与された検索結果コンテンツのみを、前記ユーザの端末装置に送信する送信手段と
を備えることを特徴とする請求項1または2に記載の情報処理装置。
【請求項4】
前記コンテンツ取得手段は、前記検索結果コンテンツに加えて、各々の前記検索結果コンテンツが前記検索クエリと適合している度合いを表す元スコアを取得し、
前記スコア導出手段は、前記元スコアと前記第1の地域関連度スコアと前記コンテンツ地域関連特定情報とを予め定められた計算式に入力して、前記各々の検索結果コンテンツが、当該検索結果コンテンツを検索するために用いられた前記検索クエリが指定されたときのユーザの位置に関連している度合いを表す第2の地域関連度スコアを導出し、
前記送信手段は、前記第2の地域関連度スコアが高い順序から優先してユーザに提示されるように、前記検索結果コンテンツを前記端末装置に送信する
ことを特徴とする請求項3に記載の情報処理装置。
【請求項5】
請求項1〜4のいずれか1項に記載の情報処理装置に与える標本データを生成する情報処理装置であって、
ユーザによって指定された検索の内容を表す検索クエリと、当該検索クエリが指定されたときに前記ユーザが置かれていた状況を表す状況情報であって、少なくとも当該ユーザの位置を含む状況情報との組み合わせで構成される1組以上の検索履歴データのうち、各々の当該検索履歴データについて、前記検索クエリが指定されたときのユーザの位置と関連性を有するか否かを表す検索クエリ地域関連特定情報を生成して付与する検索クエリ地域関連判別手段と、
前記検索クエリ地域関連特定情報が付与された検索履歴データの中から、ユーザによって新たに指定された検索クエリと同一または予め決められた類似範囲に収まる内容であり、当該新たに指定された検索クエリよりも過去に指定された検索クエリである過去検索クエリと、当該過去検索クエリが指定されたときのユーザが置かれた状況を表す状況情報と、当該過去検索クエリが指定されたときのユーザの位置に当該過去検索クエリが関連性を有するか否かを特定する検索クエリ地域関連特定情報との組み合わせで構成される検索履歴データを抽出し、前記標本データとして生成する標本データ生成手段と
を有することを特徴とする情報処理装置。
【請求項6】
前記検索クエリ地域関連判別手段は、
ユーザによって指定された検索の内容を表す検索クエリと、当該検索クエリが指定されたときに前記ユーザが置かれていた状況を表す状況情報であって、少なくとも当該ユーザの位置を含む状況情報と、当該検索クエリに従って検索手段が検索した結果得られたコンテンツのうちユーザがアクセスしたコンテンツである検索結果コンテンツと、当該検索結果コンテンツに付与され、当該検索結果コンテンツを検索するために用いられた前記検索クエリが指定されたときのユーザの位置と当該検索結果コンテンツが関連性を有するか否かを特定する情報であるコンテンツ地域関連特定情報との組み合わせで構成される1組以上の検索履歴データのうち、各々の当該検索履歴データについて、前記検索クエリが指定されたときのユーザの位置と関連性を有することを表すコンテンツ地域関連特定情報が付与された検索結果コンテンツに前記ユーザがアクセスしていたか否かを判別し、当該検索結果コンテンツにユーザがアクセスしていた場合には、前記位置に関連性を有することを表す検索クエリ地域関連特定情報を生成して付与し、アクセスしていなかった場合には、前記位置に関連性を有しないことを表す検索クエリ地域関連特定情報を生成して付与する
ことを特徴とする請求項5に記載の情報処理装置。
【請求項7】
検索の内容を表す検索クエリがユーザによって指定されたときの、当該ユーザが置かれた状況を表す状況情報であって、少なくとも当該ユーザの位置を含む状況情報を生成する状況情報生成手段と、
ユーザによって新たに指定された前記検索クエリと同一または予め決められた類似範囲に収まる内容であり、当該新たに指定された検索クエリよりも過去に指定された検索クエリである過去検索クエリと、当該過去検索クエリがユーザによって指定されたときの当該ユーザが置かれた状況を表す前記状況情報と、当該過去検索クエリが指定されたときのユーザの位置に当該過去検索クエリが関連性を有するか否かを特定する検索クエリ地域関連特定情報との組み合わせで構成される1組以上の標本データが与えられると、過去に蓄積された多次元の変数からなる標本データを分析して新たな多次元の変数に対して確率的に解を得る方法を用いることによって、ユーザが新たに指定した前記検索クエリが当該検索クエリを指定したときのユーザの位置にどの程度関連しているかの度合いを表す第1の地域関連度スコアを前記状況情報を入力して導出するための計算式であるスコア導出式を生成するスコア導出式生成手段と、
前記スコア導出式生成手段により生成されたスコア導出式に、前記状況情報生成手段により生成された状況情報を入力して、ユーザが新たに指定した検索クエリに対する前記第1の地域関連度スコアを導出するスコア導出手段と、
前記検索クエリと、当該検索クエリが指定されたときに生成された前記状況情報との組み合わせで構成される1組以上の検索履歴データを記憶する検索履歴記憶手段と
を有する第1の情報処理装置と、
前記検索履歴記憶手段によって記憶されている検索履歴データの各々について、前記検索クエリが指定されたときのユーザの位置と関連性を有するか否かを表す検索クエリ地域関連特定情報を生成して付与する検索クエリ地域関連判別手段と、
前記検索クエリ地域関連特定情報が付与された検索履歴データのうち、ユーザによって新たに指定された検索クエリと同一または予め決められた類似範囲に収まる内容であり、当該新たに指定された検索クエリよりも過去に指定された検索クエリである過去検索クエリと、当該過去検索クエリが指定されたときのユーザが置かれた状況を表す前記状況情報と、当該過去検索クエリが指定されたときのユーザの位置に当該過去検索クエリが関連性を有するか否かを特定する検索クエリ地域関連特定情報との組み合わせで構成される検索履歴データを抽出し、前記第1の情報処理装置に前記標本データとして与える標本データ生成手段と
を有する第2の情報処理装置と
を備えることを特徴とする情報処理システム。
【請求項8】
情報処理装置又は情報処理システムが行う情報処理方法であって、
検索手段によって行われる検索の内容を表す検索クエリがユーザによって指定されたときの当該ユーザが置かれた状況を表す状況情報であって、少なくとも当該ユーザの位置を含む状況情報を生成する状況情報生成ステップと、
前記検索クエリと、当該検索クエリが指定されたときに生成された前記状況情報との組み合わせで構成される1組以上の検索履歴データを記憶する検索履歴記憶ステップと、
前記検索履歴記憶ステップにおいて記憶された各々の検索履歴データについて、前記検索クエリが前記位置について関連性を有するか否かを表す検索クエリ地域関連特定情報を生成して付与する検索クエリ地域関連判別ステップと、
前記検索履歴記憶ステップにおいて記憶された検索履歴データのうち、ユーザによって新たに指定された検索クエリと同一または予め決められた類似範囲に収まる内容であり、当該新たに指定された検索クエリよりも過去に指定された検索クエリである過去検索クエリと、当該過去検索クエリが指定されたときのユーザが置かれた状況を表す前記状況情報と、当該過去検索クエリが指定されたときのユーザの位置に当該過去検索クエリが関連性を有するか否かを特定する検索クエリ地域関連特定情報との組み合わせで構成される検索履歴データを抽出し、標本データとして生成する標本データ生成ステップと、
1組以上の前記標本データに対し、過去に蓄積された多次元の変数からなる標本データを分析して新たな多次元の変数に対して確率的に解を得る方法を用いることによって、ユーザが新たに指定した前記検索クエリが当該検索クエリの指定されたときの当該ユーザの位置にどの程度関連しているかの度合いを表す第1の地域関連度スコアを前記状況情報を入力して導出するための計算式であるスコア導出式を生成するスコア導出式生成ステップと、
前記スコア導出式生成ステップにおいて生成されたスコア導出式に、前記状況情報生成ステップにおいて生成された状況情報を入力して、ユーザが新たに指定した検索クエリに対する前記第1の地域関連度スコアを導出するスコア導出ステップと
を備えることを特徴とする情報処理方法。
【請求項1】
検索の内容を表す検索クエリがユーザによって指定されたときの、当該ユーザが置かれた状況を表す状況情報であって、少なくとも当該ユーザの位置を含む状況情報を生成する状況情報生成手段と、
ユーザによって新たに指定された前記検索クエリと同一または予め決められた類似範囲に収まる内容であり、当該新たに指定された検索クエリよりも過去に指定された検索クエリである過去検索クエリと、当該過去検索クエリがユーザによって指定されたときの当該ユーザが置かれた状況を表す前記状況情報と、当該過去検索クエリがユーザによって指定されたときの当該ユーザの位置に当該過去検索クエリが関連性を有するか否かを特定する検索クエリ地域関連特定情報との組み合わせで構成される1組以上の標本データが与えられると、過去に蓄積された多次元の変数からなる標本データを分析して新たな多次元の変数に対して確率的に解を得る方法を用いることによって、ユーザが新たに指定した前記検索クエリが当該検索クエリを指定したときのユーザの位置にどの程度関連しているかの度合いを表す第1の地域関連度スコアを前記状況情報を入力して導出するための計算式であるスコア導出式を生成するスコア導出式生成手段と、
前記スコア導出式生成手段により生成されたスコア導出式に、前記状況情報生成手段により生成された状況情報を入力して、ユーザが新たに指定した検索クエリに対する前記第1の地域関連度スコアを導出するスコア導出手段と
を備えることを特徴とする情報処理装置。
【請求項2】
前記ユーザの位置と、前記ユーザの属性と、前記検索クエリが指定された時刻とを取得する取得手段を備え、
前記状況情報生成手段は、前記取得手段が取得した位置、ユーザの属性、及び時刻に関する情報を含む前記状況情報を生成する
ことを特徴とする請求項1に記載の情報処理装置。
【請求項3】
ユーザによって指定された前記検索クエリに従って検索した結果得られたコンテンツである検索結果コンテンツを取得するコンテンツ取得手段と、
前記コンテンツ取得手段により取得された各々の前記検索結果コンテンツが、当該検索結果コンテンツを検索するために用いられた前記検索クエリが指定されたときのユーザの位置に関連性を有するか否かを特定し、特定した結果を表すコンテンツ地域関連特定情報を、各々の当該検索結果コンテンツに付与するコンテンツ地域関連判別手段と、
前記スコア導出手段により導出された第1の地域関連度スコアが閾値を超えていた場合に、前記ユーザの位置に関連性を有することを表す前記コンテンツ地域関連特定情報が付与された検索結果コンテンツのみを、前記ユーザの端末装置に送信する送信手段と
を備えることを特徴とする請求項1または2に記載の情報処理装置。
【請求項4】
前記コンテンツ取得手段は、前記検索結果コンテンツに加えて、各々の前記検索結果コンテンツが前記検索クエリと適合している度合いを表す元スコアを取得し、
前記スコア導出手段は、前記元スコアと前記第1の地域関連度スコアと前記コンテンツ地域関連特定情報とを予め定められた計算式に入力して、前記各々の検索結果コンテンツが、当該検索結果コンテンツを検索するために用いられた前記検索クエリが指定されたときのユーザの位置に関連している度合いを表す第2の地域関連度スコアを導出し、
前記送信手段は、前記第2の地域関連度スコアが高い順序から優先してユーザに提示されるように、前記検索結果コンテンツを前記端末装置に送信する
ことを特徴とする請求項3に記載の情報処理装置。
【請求項5】
請求項1〜4のいずれか1項に記載の情報処理装置に与える標本データを生成する情報処理装置であって、
ユーザによって指定された検索の内容を表す検索クエリと、当該検索クエリが指定されたときに前記ユーザが置かれていた状況を表す状況情報であって、少なくとも当該ユーザの位置を含む状況情報との組み合わせで構成される1組以上の検索履歴データのうち、各々の当該検索履歴データについて、前記検索クエリが指定されたときのユーザの位置と関連性を有するか否かを表す検索クエリ地域関連特定情報を生成して付与する検索クエリ地域関連判別手段と、
前記検索クエリ地域関連特定情報が付与された検索履歴データの中から、ユーザによって新たに指定された検索クエリと同一または予め決められた類似範囲に収まる内容であり、当該新たに指定された検索クエリよりも過去に指定された検索クエリである過去検索クエリと、当該過去検索クエリが指定されたときのユーザが置かれた状況を表す状況情報と、当該過去検索クエリが指定されたときのユーザの位置に当該過去検索クエリが関連性を有するか否かを特定する検索クエリ地域関連特定情報との組み合わせで構成される検索履歴データを抽出し、前記標本データとして生成する標本データ生成手段と
を有することを特徴とする情報処理装置。
【請求項6】
前記検索クエリ地域関連判別手段は、
ユーザによって指定された検索の内容を表す検索クエリと、当該検索クエリが指定されたときに前記ユーザが置かれていた状況を表す状況情報であって、少なくとも当該ユーザの位置を含む状況情報と、当該検索クエリに従って検索手段が検索した結果得られたコンテンツのうちユーザがアクセスしたコンテンツである検索結果コンテンツと、当該検索結果コンテンツに付与され、当該検索結果コンテンツを検索するために用いられた前記検索クエリが指定されたときのユーザの位置と当該検索結果コンテンツが関連性を有するか否かを特定する情報であるコンテンツ地域関連特定情報との組み合わせで構成される1組以上の検索履歴データのうち、各々の当該検索履歴データについて、前記検索クエリが指定されたときのユーザの位置と関連性を有することを表すコンテンツ地域関連特定情報が付与された検索結果コンテンツに前記ユーザがアクセスしていたか否かを判別し、当該検索結果コンテンツにユーザがアクセスしていた場合には、前記位置に関連性を有することを表す検索クエリ地域関連特定情報を生成して付与し、アクセスしていなかった場合には、前記位置に関連性を有しないことを表す検索クエリ地域関連特定情報を生成して付与する
ことを特徴とする請求項5に記載の情報処理装置。
【請求項7】
検索の内容を表す検索クエリがユーザによって指定されたときの、当該ユーザが置かれた状況を表す状況情報であって、少なくとも当該ユーザの位置を含む状況情報を生成する状況情報生成手段と、
ユーザによって新たに指定された前記検索クエリと同一または予め決められた類似範囲に収まる内容であり、当該新たに指定された検索クエリよりも過去に指定された検索クエリである過去検索クエリと、当該過去検索クエリがユーザによって指定されたときの当該ユーザが置かれた状況を表す前記状況情報と、当該過去検索クエリが指定されたときのユーザの位置に当該過去検索クエリが関連性を有するか否かを特定する検索クエリ地域関連特定情報との組み合わせで構成される1組以上の標本データが与えられると、過去に蓄積された多次元の変数からなる標本データを分析して新たな多次元の変数に対して確率的に解を得る方法を用いることによって、ユーザが新たに指定した前記検索クエリが当該検索クエリを指定したときのユーザの位置にどの程度関連しているかの度合いを表す第1の地域関連度スコアを前記状況情報を入力して導出するための計算式であるスコア導出式を生成するスコア導出式生成手段と、
前記スコア導出式生成手段により生成されたスコア導出式に、前記状況情報生成手段により生成された状況情報を入力して、ユーザが新たに指定した検索クエリに対する前記第1の地域関連度スコアを導出するスコア導出手段と、
前記検索クエリと、当該検索クエリが指定されたときに生成された前記状況情報との組み合わせで構成される1組以上の検索履歴データを記憶する検索履歴記憶手段と
を有する第1の情報処理装置と、
前記検索履歴記憶手段によって記憶されている検索履歴データの各々について、前記検索クエリが指定されたときのユーザの位置と関連性を有するか否かを表す検索クエリ地域関連特定情報を生成して付与する検索クエリ地域関連判別手段と、
前記検索クエリ地域関連特定情報が付与された検索履歴データのうち、ユーザによって新たに指定された検索クエリと同一または予め決められた類似範囲に収まる内容であり、当該新たに指定された検索クエリよりも過去に指定された検索クエリである過去検索クエリと、当該過去検索クエリが指定されたときのユーザが置かれた状況を表す前記状況情報と、当該過去検索クエリが指定されたときのユーザの位置に当該過去検索クエリが関連性を有するか否かを特定する検索クエリ地域関連特定情報との組み合わせで構成される検索履歴データを抽出し、前記第1の情報処理装置に前記標本データとして与える標本データ生成手段と
を有する第2の情報処理装置と
を備えることを特徴とする情報処理システム。
【請求項8】
情報処理装置又は情報処理システムが行う情報処理方法であって、
検索手段によって行われる検索の内容を表す検索クエリがユーザによって指定されたときの当該ユーザが置かれた状況を表す状況情報であって、少なくとも当該ユーザの位置を含む状況情報を生成する状況情報生成ステップと、
前記検索クエリと、当該検索クエリが指定されたときに生成された前記状況情報との組み合わせで構成される1組以上の検索履歴データを記憶する検索履歴記憶ステップと、
前記検索履歴記憶ステップにおいて記憶された各々の検索履歴データについて、前記検索クエリが前記位置について関連性を有するか否かを表す検索クエリ地域関連特定情報を生成して付与する検索クエリ地域関連判別ステップと、
前記検索履歴記憶ステップにおいて記憶された検索履歴データのうち、ユーザによって新たに指定された検索クエリと同一または予め決められた類似範囲に収まる内容であり、当該新たに指定された検索クエリよりも過去に指定された検索クエリである過去検索クエリと、当該過去検索クエリが指定されたときのユーザが置かれた状況を表す前記状況情報と、当該過去検索クエリが指定されたときのユーザの位置に当該過去検索クエリが関連性を有するか否かを特定する検索クエリ地域関連特定情報との組み合わせで構成される検索履歴データを抽出し、標本データとして生成する標本データ生成ステップと、
1組以上の前記標本データに対し、過去に蓄積された多次元の変数からなる標本データを分析して新たな多次元の変数に対して確率的に解を得る方法を用いることによって、ユーザが新たに指定した前記検索クエリが当該検索クエリの指定されたときの当該ユーザの位置にどの程度関連しているかの度合いを表す第1の地域関連度スコアを前記状況情報を入力して導出するための計算式であるスコア導出式を生成するスコア導出式生成ステップと、
前記スコア導出式生成ステップにおいて生成されたスコア導出式に、前記状況情報生成ステップにおいて生成された状況情報を入力して、ユーザが新たに指定した検索クエリに対する前記第1の地域関連度スコアを導出するスコア導出ステップと
を備えることを特徴とする情報処理方法。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【公開番号】特開2011−123564(P2011−123564A)
【公開日】平成23年6月23日(2011.6.23)
【国際特許分類】
【出願番号】特願2009−278799(P2009−278799)
【出願日】平成21年12月8日(2009.12.8)
【出願人】(392026693)株式会社エヌ・ティ・ティ・ドコモ (5,876)
【Fターム(参考)】
【公開日】平成23年6月23日(2011.6.23)
【国際特許分類】
【出願日】平成21年12月8日(2009.12.8)
【出願人】(392026693)株式会社エヌ・ティ・ティ・ドコモ (5,876)
【Fターム(参考)】
[ Back to top ]