説明

地域スコアデータベースを作成する装置、方法及びプログラム

【課題】地域の名称の重要度を適切に表現できる地域スコアDBを作成する装置、方法及びプログラムを提供する。
【解決手段】地域スコアDB作成装置1は、スコアを付与する対象となる地域の名称が示す地理的範囲を特定する地理的範囲特定部12と、その特定した地理的範囲が狭いほど高いスコアを算出するスコア算出部13と、地理的範囲特定部12が特定した情報及びスコア算出部13が算出したスコアが地域の名称と関連付けて記憶される地域スコアDB22と、クエリの検索結果のクリック数が記憶されるクリックログDB42と、地域スコアDB22に記憶された地域の名称について、この地域の名称に関連付けられた地理的範囲とクリックログDB42に記憶された地理的範囲とが略一致するクエリに関連付けて記憶されたクリック数が多いほどスコアが高くなるようにスコアを補正し、補正後のスコアを地域スコアDB22に記憶させるスコア補正部15とを備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、地域スコアデータベースを作成する装置、方法及びプログラムに関する。
【背景技術】
【0002】
従来より、端末からクエリを受信したことに応じて、受信したクエリから地域の名称を抽出し、その地域についての情報を端末に返す検索サーバが知られている。このとき、検索サーバは、地域の名称を抽出する際、予め作成された地域スコアデータベースを参照することがある。例えば、検索サーバは、端末から「渋谷 レストラン」というクエリを受信したことに応じて、地域スコアデータベースを参照して「渋谷」を地域の名称として認識する。そして、検索サーバは、検索対象となるWebページのインデックスデータベースを参照し、「渋谷」を氏名や一般名詞としてではなく、地域の名称として検索する。そして、検索サーバは、例えば渋谷にある「レストラン」のページを優先的に検索したり、渋谷駅近辺の地図上にレストランの位置をマーキングした地図へのリンクを検索結果の上位に表示させたり、といったユーザの意図に応じた検索結果を端末に返す。
【0003】
このような検索サーバとして、地名が含意する広さを元に、地名の重要度を算出し、この重要度に基づいて端末に検索結果を返すものが知られている(例えば、特許文献1参照)。この検索サーバによると、地名の重要度を踏まえて検索結果を返すことができるので、検索の精度を高めることができる。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2009−134464号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかし、このような検索サーバであっても、地名が含意する広さに基づいて重要度を算出するだけでは、適切に応答できない可能性がある。例えば、地名が駅名やビル名等の施設名(ランドマーク)である場合、地名が含意する広さだけが重要とはいえないので、施設名(ランドマーク)の広さだけで重要度を決定するのは適切ではない。例えば、「日吉駅」という施設名(ランドマーク)は、神奈川県横浜市に位置する「日吉駅」と、京都府南丹市に位置する「日吉駅」との双方を示す。地名が含意する広さのみで重要度を決定すると、京都府南丹市の「日吉駅」の方が駅施設として狭いため、検索サーバは、京都府南丹市の「日吉駅」の方が重要度が高いと判断し得る。さらに、「川上村」という地名は、奈良県吉野郡に位置する「川上村」と、長野県南佐久郡に位置する「川上村」との双方を示す。このように、施設名(ランドマーク)や同一の名称を持つ行政区画名が複数ある場合の例を含め、広さのみに基づく地名の重要度の判定については改善の余地がある。
【0006】
本発明は、クエリから地域の名称を抽出するために参照される地域スコアデータベースであって、地域の名称の重要度を適切に表現し、検索の精度を高めることが可能な地域スコアデータベースを作成する装置、方法及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0007】
本発明では、以下のような解決手段を提供する。
【0008】
(1) 地域の名称のスコアが記憶される地域スコアデータベースを作成する装置であって、前記スコアを付与する対象となる前記地域の名称を受け付けたことに応じて、前記受け付けた地域の名称が示す地理的範囲を特定する地理的範囲特定手段と、前記地理的範囲特定手段が特定した前記地理的範囲が狭いほど高いスコアを算出するスコア算出手段と、前記地理的範囲特定手段によって特定された地理的範囲を示す情報及び前記スコア算出手段によって算出されたスコアを前記地域の名称と関連付けて前記地域スコアデータベースに記憶するスコア記憶手段と、前記地域の名称を含むクエリの検索結果がクリックされた数を示すクリック数を、前記クエリを特定する情報及び前記地域の名称が示す地理的範囲を示す情報に関連付けて記憶するクリックログ記憶手段と、前記地域スコアデータベースに記憶された地域の名称について、この地域の名称に関連付けられた地理的範囲と前記クリックログ記憶手段に記憶された地理的範囲とが略一致する前記クエリを特定する情報に関連付けて記憶されたクリック数が多いほどスコアが高くなるように前記スコアを補正し、その補正したスコアを前記地域スコアデータベースに記憶するスコア補正手段とを備える装置。
【0009】
(1)に記載の発明によれば、地域スコアデータベースには、クリック数に基づいて補正されたスコアが記憶される。コンピュータがこの地域スコアデータベースを用いて地域の名称を含むクエリを検索する際、その地域の名称の重要度を、その地域の名称が示す地理的範囲に基づいて付与した後に補正したスコア、具体的には、地理的範囲に基づいて付与した後、その地域の名称を含むクエリの検索結果のクリック数によって補正したスコアを用いて判定できる。これにより、その地域の名称の重要度を、地理的範囲のみでスコアを算出したときに比べて適切に表現し、検索の精度を高めることが可能な地域スコアデータベースを作成する装置を提供できる。
【0010】
(2) 地域の名称のスコアが記憶される地域スコアデータベースをコンピュータが作成する方法であって、前記コンピュータが、前記スコアを付与する対象となる前記地域の名称を受け付けたことに応じて、前記受け付けた地域の名称が示す地理的範囲を特定する地理的範囲特定工程と、前記コンピュータが、前記地理的範囲特定工程で特定した前記地理的範囲が狭いほど高いスコアを算出するスコア算出工程と、前記コンピュータが、前記地理的範囲特定工程で特定した地理的範囲を示す情報及び前記スコア算出工程で算出したスコアを前記地域の名称と関連付けて前記地域スコアデータベースに記憶するスコア記憶工程と、前記コンピュータが、前記地域の名称を含むクエリの検索結果がクリックされた数を示すクリック数を、前記クエリを特定する情報及び前記地域の名称が示す地理的範囲を示す情報に関連付けて記憶するクリックログ記憶工程と、前記コンピュータが、前記地域スコアデータベースに記憶された地域の名称について、この地域の名称に関連付けられた地理的範囲と前記クリックログ記憶工程で記憶した地理的範囲とが略一致する前記クエリを特定する情報に関連付けて記憶されたクリック数が多いほどスコアが高くなるように前記スコアを補正し、その補正したスコアを前記地域スコアデータベースに記憶するスコア補正工程とを含む方法。
【0011】
(3) 地域の名称のスコアが記憶される地域スコアデータベースをコンピュータに作成させるためのプログラムであって、前記スコアを付与する対象となる前記地域の名称を受け付けたことに応じて、前記受け付けた地域の名称が示す地理的範囲を特定する地理的範囲特定工程と、前記地理的範囲特定工程で特定した前記地理的範囲が狭いほど高いスコアを算出するスコア算出工程と、前記地理的範囲特定工程で特定した地理的範囲を示す情報及び前記スコア算出工程で算出したスコアを前記地域の名称と関連付けて前記地域スコアデータベースに記憶するスコア記憶工程と、前記地域の名称を含むクエリの検索結果がクリックされた数を示すクリック数を、前記クエリを特定する情報及び前記地域の名称が示す地理的範囲を示す情報と関連付けて記憶するクリックログ記憶工程と、前記地域スコアデータベースに記憶された地域の名称について、この地域の名称に関連付けられた地理的範囲と前記クリックログ記憶工程で記憶した地理的範囲とが略一致する前記クエリを特定する情報に関連付けて記憶されたクリック数が多いほどスコアが高くなるように前記スコアを補正し、その補正したスコアを前記地域スコアデータベースに記憶するスコア補正工程とを前記コンピュータに実行させるプログラム。
【0012】
(2)に記載の方法によれば、当該方法を実施することにより、(1)と同様の効果が期待できる。(3)に記載のプログラムによれば、当該プログラムをコンピュータで実行することにより、(1)と同様の効果が期待できる。
【発明の効果】
【0013】
本発明によれば、地域の名称の重要度を、その地域の名称が示す地理的範囲に基づいてスコアを付与した後、その地域の名称を含むクエリの検索結果のクリック数によって当該スコアを補正することにより適切に表現し、検索の精度を高めることが可能な地域スコアデータベースを作成する装置、方法及びプログラムを提供できる。
【図面の簡単な説明】
【0014】
【図1】本実施形態に係る地域スコアデータベース作成装置1を説明するための全体構成を示す図である。
【図2】本実施形態に係る地域スコアデータベース22,41の第1の例を示す図である。
【図3】本実施形態に係る地域スコアデータベース22,41の第2の例を示す図である。
【図4】本実施形態に係るクリックログデータベース42を示す図である。
【図5】本実施形態に係る地域スコアデータベース作成装置1における処理の流れを示すフローチャートである。
【図6】スコア付与処理を示すフローチャートである。
【図7】スコア補正処理を示すフローチャートである。
【図8】本実施形態に係る地域スコアデータベース作成装置1、方法及びプログラムを実施したときの端末3の画面50での表示例を示す図である。
【図9】図8に続く図である。
【発明を実施するための形態】
【0015】
以下、本発明の実施形態について図を参照しながら説明する。
【0016】
[全体構成]
図1は、本実施形態に係る地域スコアデータベース作成装置1を説明するための全体構成を示す図である。地域スコアデータベース作成装置1は、地域の名称のスコアが記憶される地域スコアデータベースを作成する装置であり、制御部10と、記憶部20とを備える。
【0017】
制御部10は、地域スコアデータベース作成装置1に係る各機能を統括的に制御する部分であり、スコアを付与する対象となる地域の名称を受け付ける地域名称受付部11と、その受け付けた地域の名称が示す地理的範囲を特定する地理的範囲特定部12とを備える。そして、記憶部20は、地域名称受付部11が地域の名称を受け付ける際に参照するスコア付与対象データベース21を備える。これら地域名称受付部11、地理的範囲特定部12及びスコア付与対象データベース21は、地理的範囲特定手段として機能する。
【0018】
「地域の名称」は、「東京」、「23区」、「港区」、「六本木」等のように行政が定めた名称に限らず、地域を特定できる名称であれば、「東京ミッドタウン」のようなランドマーク(地域を象徴する建造物)であってもよいし、「日吉駅」のような駅名であってもよい。
【0019】
「地理的範囲」は、行政区分で定めてもよいし、緯度・経度で定めてもよい。行政区分で定める場合、地域の名称「東京」に対応する地理的範囲は、「東京都」全体であり、地域の名称「六本木」に対応する地理的範囲は、「東京都港区六本木」である。また、地域の名称「日吉駅(神奈川県)」に対応する地理的範囲は、「神奈川県横浜市港北区日吉○丁目△番×号」であり、地域の名称「日吉駅(京都府)」に対応する地理的範囲は、「京都府南丹市日吉町□△×」である。緯度・経度で定める場合は、中心地点(実際の中心地点を中心地点としてもよいし、都道府県庁の地点等、象徴する地点を中心地点としてもよい)の緯度・経度を中心とした所定の半径の円(例えば、(N38°34′55″、E135°44′34″、48km))として定めてもよいし、行政区画境界線や施設・建物の敷地の境界線等にフィットする多角形の頂点の座標集合(例えば、(N38°34′55″、E135°44′34″)、(N38°34′24″、135°44′16″)・・・)として定めてもよい。
【0020】
また、制御部10は、地理的範囲特定部12が特定した地理的範囲が狭いほど高いスコアを算出するスコア算出部13を備える。このスコア算出部13は、スコア算出手段として機能する。
【0021】
スコアの算出にあたっては、地理的範囲特定部12が特定した地理的範囲の面積に基づいて算出する。面積の算出は、行政区分で定められた実際の面積から算出してもよいし、中心地点の緯度・経度を中心とした所定の半径の円の面積を算出してもよい。
【0022】
制御部10は、さらに、地理的範囲特定部12によって特定された地理的範囲を示す情報及びスコア算出部13によって算出されたスコアを地域の名称と関連付けて記憶させるスコア記憶部14を備える。そして、記憶部20は、スコア記憶部14が指令した情報を記憶する地域スコアデータベース22を備える。これらスコア記憶部14及び地域スコアデータベース22は、スコア記憶手段として機能する。
【0023】
図2及び図3は、地域スコアデータベース22の一例を示す図である。地域スコアデータベース22は、地域の名称についての「地域の名称」フィールドと、この地域の名称の地理的範囲を示す「地理的範囲」フィールドと、その地域の名称の重要度を示す「スコア」フィールドとを有する。この地域スコアデータベース22の情報は、クエリを検索するために用いられる検索サーバ2の記憶部40に設けられた地域スコアデータベース41に、随時更新される。
【0024】
「地理的範囲」フィールドには、図2で例示されるように、行政が定めた住所表記文字列を記憶させてもよいし、図3で例示されるように、地点の緯度・経度を記憶させてもよい。図3では、中心地点の緯度・経度を中心とした所定の半径の円として記憶させているが、行政区画境界線や施設・建物の敷地の境界線等にフィットする多角形の頂点の座標集合として記憶させてもよい。
【0025】
「スコア」フィールドには、スコア算出部13が算出したスコアが記憶される。スコアの算出は、任意に定めてよいが、例えば、面積が0.1平方キロメートル未満であれば100ポイント、0.1平方キロメートル以上0.5平方キロメートル未満であれば70ポイント、0.5平方キロメートル以上1平方キロメートル未満であれば50ポイント、1平方キロメートル以上5平方キロメートル未満であれば30ポイント、5平方キロメートル以上10平方キロメートル未満であれば20ポイント、10平方キロメートル以上50平方キロメートル未満であれば10ポイント、50平方キロメートル以上であれば5ポイントとすること等が考えられる。
【0026】
例えば、地域の名称「東京」に対応する地理的範囲の面積は、50平方キロメートル以上なので、「スコア」フィールドには、「5」が記憶される。また、地域の名称「日吉駅(神奈川県)」に対応する地理的範囲の面積は、0.1平方キロメートル以上0.5平方キロメートル未満なので、「スコア」フィールドには、「70」が記憶される。そして、地域の名称「日吉駅(京都府)」に対応する地理的範囲の面積は、0.1平方キロメートル未満なので、「スコア」フィールドには、「100」が記憶される。
【0027】
なお、「スコア」フィールドに記憶されるスコアは、後にスコア補正部15が補正したスコアに更新される。本実施形態では、地域の名称「東京」に対応する「スコア」フィールドに記憶されるスコアは、「5」から「4」に更新され、地域の名称「六本木」に対応する「スコア」フィールドに記憶されるスコアは、「10」から「7」に更新される。また、地域の名称「東京ミッドタウン」に対応する「スコア」フィールドに記憶されるスコアは、「30」から「23」に更新され、地域の名称「日吉駅(神奈川県)」に対応する「スコア」フィールドに記憶されるスコアは、「70」から「46」に更新され、地域の名称「日吉駅(京都府)」に対応する「スコア」フィールドに記憶されるスコアは、「100」から「38」に更新される。このことについては、後に詳しく説明する。
【0028】
図1に戻り、検索サーバ2の構成について説明する。検索サーバ2は、制御部30と、記憶部40とを備える。制御部30は、検索サーバ2に係る各機能を統括的に制御する部分であり、端末3からネットワークを介して送信されたクエリを受け付けるクエリ受付部31を備える。クエリ受付部31は、クエリ受付手段として機能する。
【0029】
また、制御部30は、クエリ受付部31が受け付けたクエリから地域の名称及びその地域の名称に対応する地理的範囲をスコアの高い順に抽出する抽出する地域抽出部32を備える。記憶部40には、地域スコアデータベース41が備えられ、地域抽出部32は、この地域スコアデータベース41を参照して地域の名称等を抽出する。地域抽出部32及び地域スコアデータベース41は、地域抽出手段として機能する。
【0030】
例えば、地域の名称が「東京」である場合や「六本木」である場合等は、「地域の名称」に対して一の「地理的範囲」を特定できる。このような場合、地域抽出部32は、地域スコアデータベース41を参照し、地域の名称及びこの地域の名称に対応する一の地理的範囲を抽出する。
【0031】
一方、「地域の名称」に対して一の「地理的範囲」が複数存在する場合がある。例えば、地域の名称が「日吉駅」である場合、この「日吉駅」に対応する地理的範囲は、「神奈川県横浜市港北区日吉」と「京都府南丹市日吉町」との両方がある。このように、「地域の名称」に対して複数の「地理的範囲」がある場合、地域抽出部32は、地域スコアデータベース41を参照し、地域の名称及びこの地域の名称に対応する複数の地理的範囲を抽出する。
【0032】
「スコア」は、地域の名称の重要度を数値化したものである。地域抽出部32は、クエリ受付部31が受け付けたクエリが複数の地域の名称を含む場合、地域スコアデータベース41を参照し、複数の地理的範囲をスコアが高いものを優先して抽出する。このようにして優先順位がつけられた地域の名称が検索結果送信部33に渡される。
【0033】
さらに、制御部30は、地域抽出部32によって抽出された地域の名称を含むクエリを検索し、その検索の結果及びクエリのサジェスチョンを端末3に送信する検索結果/クエリサジェスチョン送信部33を備える。この検索結果/クエリサジェスチョン送信部33は、検索結果/クエリサジェスチョン送信手段として機能する。
【0034】
「クエリ」に対して一の「地域の名称」が特定された場合、検索結果送信部33は、その一の地域の名称を地名として情報を検索し、その検索の結果或いはクエリサジェスチョンを端末3に送信する。一方、「クエリ」に対して複数の「地域の名称」が特定された場合、検索結果送信部33は、複数の当該複数の地域の名称について、地名としての重要度が高い(即ちスコアが高い)ものを優先的に地名として情報を検索し、その検索の結果或いはクエリサジェスチョンを端末3に送信する。
【0035】
制御部30は、端末3において検索結果がクリックされたことを受け付けるクリック受付部34を備える。このクリック受付部34は、クリック受付手段として機能する。また、制御部30は、地域の名称を含むクエリの検索結果がクリックされた数(以下、「クリック数」という。)を、クエリを特定する情報及び地域の名称が示す地理的範囲を示す情報に関連付けて記憶するクリックログ記憶部35をさらに備える。そして、記憶部40は、クリックログ記憶部35によって指令されたクリック数を地域の名称及びその地理的範囲と関連付けて記憶するクリックログデータベース42を備える。これらクリックログ記憶部35及びクリックログデータベース42は、クリックログ記憶手段として機能する。
【0036】
「地域の名称」に対して複数の「地理的範囲」が特定されていた場合、クリックログ記憶部34は、複数の地理的範囲のうち、端末3のユーザ等によって過去に検索結果がクリックされたクエリが含む地域の名称が示す地理的範囲だけをクリックログデータベース42に記憶させる。なお、本実施形態では、クリックログデータベース42を検索サーバ2に設けているが、検索サーバ2に設けられたクリックログデータベース42のデータが地域スコアデータベース作成装置1に設けられたクリックログデータベース(図示せず)に随時配信され、複製されるようにしてもよい。
【0037】
図4は、クリックログデータベース42の一例を示す図である。クリックログデータベース42は、端末3のユーザによってクリックされたクエリを示す「クエリ」フィールドと、そのクエリが地域の名称を含む場合に、その地域に対応する地理的範囲を示す「地理的範囲」フィールドと、そのクエリについて所定期間(例えば1ヶ月の間)にクリックされた回数を示す「クリック数」フィールドとを有する。
【0038】
図4においては、「地理的範囲」フィールドに、行政が定めた住所表記文字列を記憶させた場合について例示しているが、これに限るものではなく、地点の緯度・経度を記憶させてもよい。地点の緯度・経度を記憶させる場合、図3と同様に、中心地点の緯度・経度を中心とした所定の半径の円を記憶させてもよいし、行政区画境界線や施設・建物の敷地の境界線等にフィットする多角形の頂点の座標集合として記憶させてもよい。
【0039】
再び図1を参照し、地域スコアデータベース作成装置1の説明に戻る。制御部10は、地域名称受付部11、地理的範囲特定部12、スコア算出部13及びスコア記憶部14に加え、地域スコアデータベース22に記憶されたスコアを補正するスコア補正部15を備える。スコア補正部15は、地域スコアデータベース22に記憶された地域の名称について、この地域の名称に関連付けられた地理的範囲とクリックログデータベース42に記憶された地理的範囲とが略一致するクエリを特定する情報に関連付けて記憶されたクリック数が多いほどスコアが高くなるようにスコアを補正し、その補正したスコアを地域スコアデータベース22に記憶する。スコア補正部15及び地域スコアデータベース22は、スコア補正手段として機能する。
【0040】
スコアの補正は、「全体のクリック数の対数」に対する「その地域の名称についてのクエリのクリック数の対数」の割合を算出し、その算出した値を元のスコアと乗算することによって行われる。
【0041】
[本実施形態のハードウェア及びソフトウェアの構成]
本実施形態は、コンピュータ及びその周辺装置に適用される。本実施形態における各手段(各部)は、コンピュータ及びその周辺装置が備えるハードウェア並びに当該ハードウェアを制御するソフトウェアによって構成される。
【0042】
上記ハードウェアには、制御装置(制御部)としてのCPUの他、記憶装置(記憶部)、通信装置(通信部)、表示装置(表示部)及び入力装置(入力部)が含まれる。記憶装置(記憶部)としては、例えば、メモリ(RAM、ROM等)、ハードディスクドライブ(HDD)及び光ディスク(CD、DVD等)ドライブが挙げられる。通信装置(通信部)としては、例えば、各種有線及び無線インターフェース装置が挙げられる。表示装置(表示部)としては、例えば、液晶ディスプレイ及びプラズマディスプレイ等の各種ディスプレイが挙げられる。入力装置(入力部)としては、例えば、キーボード及びポインティング・デバイス(マウス等)が挙げられる。
【0043】
上記ソフトウェアには、上記ハードウェアを制御するコンピュータ・プログラムやデータが含まれる。コンピュータ・プログラムやデータは、記憶装置(記憶部)により記憶され、制御装置(制御部)により適宜実行、参照される。また、コンピュータ・プログラムやデータは、通信回線を介して配布することも可能であり、CD−ROM等のコンピュータ可読媒体に記録して配布することも可能である。
【0044】
[処理フロー]
図5〜図7は、本実施形態に係る地域スコアデータベース作成装置1における処理の流れを示すフローチャートである。
【0045】
まず、図5について説明する。ステップS1では、制御部10は、スコアを付与する対象となる地域の名称を受け付けるか否かを判別する。この判別は、スコアを付与する対象となる地域の名称を受け付ける指令を受けたか否かによって行う。地域の名称の受け付けは、検索サーバ2の管理者が所定のキー操作をすることによって指令してもよいし、地域スコアデータベース作成装置1の内部での処理により、例えば1ヶ月毎等、所定の期間毎に定期的に指令信号を送るようにしてもよい。この判別がYESのときはステップS2に移り、NOのときはステップS3に移る。ステップS2では、後に図6を参照して説明するスコア付与処理を行う。
【0046】
ステップS3では、制御部10は、スコアの補正を開始するか否かを判別する。この判別は、スコアの補正を開始する指令を受けたか否かによって行う。スコアの補正は、検索サーバ2の管理者が所定のキー操作をすることによって指令してもよいし、地域スコアデータベース作成装置1の内部での処理により、例えば1ヶ月毎等、所定の期間毎に定期的に指令信号を送るようにしてもよい。この判別がYESのときはステップS4に移り、NOのときは、地域スコアデータベース作成装置1における処理を終了する。ステップS4では、後に図7を参照して説明するスコア補正処理を行う。このスコア補正処理を終えると、地域スコアデータベース作成装置1における処理を終了する。
【0047】
次に、図6について説明する。図6は、スコア付与処理を示すフローチャートである。
【0048】
ステップS11では、地域名称受付部11は、スコア付与対象データベース21からスコアを付与する対象となる地域の名称を受け付ける。ステップS12では、地理的範囲特定部12は、地域名称受付部11が受け付けた地域の名称が示す地理的範囲を特定する。
【0049】
上述したように、地理的範囲の特定は、行政区分で特定してもよいし、緯度・経度で特定してもよい。行政区分で特定する場合、例えば、地域の名称「東京」に対応する地理的範囲は、「東京都」全体であり、地域の名称「六本木」に対応する地理的範囲は、「東京都港区六本木」である。また、地域の名称「日吉駅(神奈川県)」に対応する地理的範囲は、「神奈川県横浜市港北区日吉○丁目△番×号」であり、地域の名称「日吉駅(京都府)」に対応する地理的範囲は、「京都府南丹市日吉町□△×」である。緯度・経度で特定する場合は、中心地点(実際の中心地点を中心地点としてもよいし、都道府県庁の地点等、象徴する地点を中心地点としてもよい)の緯度・経度を中心とした所定の半径の円(例えば、地域の名称「日吉駅(神奈川県)」であれば、(N35°55′30″、E139°64′67″、0.8km))として定めてもよいし、行政区画境界線や施設・建物の敷地の境界線等にフィットする多角形の頂点の座標集合として定めてもよい。
【0050】
ステップS13では、スコア算出部13は、地理的範囲特定部12が特定した地理的範囲が狭いほど高いスコアを算出する。上述したように、スコアの算出は、任意に定めてよいが、例えば、面積が0.1平方キロメートル未満であれば100ポイント、0.1平方キロメートル以上0.5平方キロメートル未満であれば70ポイント、0.5平方キロメートル以上1平方キロメートル未満であれば50ポイント、1平方キロメートル以上5平方キロメートル未満であれば30ポイント、5平方キロメートル以上10平方キロメートル未満であれば20ポイント、10平方キロメートル以上50平方キロメートル未満であれば10ポイント、50平方キロメートル以上であれば5ポイントとすること等が考えられる。
【0051】
図2及び図3に示した地域の名称を例にすると、地域の名称が「東京」である場合、この地域の名称「東京」に対応する地理的範囲は「東京都」全体であり、面積は500平方キロメートル以上である。そのため、スコア算出部13は、地域の名称「東京」のスコアを1ポイントと算出する。また、地域の名称が「日吉駅(神奈川県)」である場合、この地域の名称「日吉駅(神奈川県)」に対応する地理的範囲は「神奈川県横浜市港北区日吉○丁目△番×号」であり、面積は0.5平方キロメートル以上1平方キロメートル未満である。そのため、スコア算出部13は、地域の名称「日吉駅(神奈川県)」のスコアを50ポイントと算出する。さらに、地域の名称が「日吉駅(京都府)」である場合、この地域の名称「日吉駅(京都府)」に対応する地理的範囲は「京都府南丹市日吉町□△×」であり、面積は0.1平方キロメートル未満である。そのため、スコア算出部13は、地域の名称「日吉駅(京都府)」のスコアを100ポイントと算出する。
【0052】
ステップS14では、スコア記憶部14は、地理的範囲特定部12によって特定された地理的範囲を示す情報及びスコア算出部13によって算出されたスコアを地域の名称と関連付けて地域スコアデータベース22に記憶させる。
【0053】
例えば、地理的範囲特定部12によって特定された地理的範囲を示す情報である「東京都」全体及びスコア算出部13によって算出されたスコア「1」を地域の名称「東京」と関連付けて地域スコアデータベース22に記憶させる。また、地理的範囲特定部12によって特定された地理的範囲を示す情報である「神奈川県横浜市港北区日吉○丁目△番×号」及びスコア算出部13によって算出されたスコア「70」を地域の名称「日吉駅(神奈川県)」と関連付けて地域スコアデータベース22に記憶させる。そして、地理的範囲特定部12によって特定された地理的範囲を示す情報である「京都府南丹市日吉町□△×」及びスコア算出部13によって算出されたスコア「100」を地域の名称「日吉駅(京都府)」と関連付けて地域スコアデータベース22に記憶させる。
【0054】
ステップS15では、制御部10は、スコア付与対象データベース21に記憶された全てのデータについてスコアの付与を完了したか否かを判別する。この判別がYESのときは、図4のステップS3に移り、NOのときは、ステップS12に移る。
【0055】
次に、図7について説明する。図7は、スコア補正処理を示すフローチャートである。
【0056】
ステップS21では、スコア補正部15は、地域スコアデータベース22に記憶された地域の名称について、この地域の名称に関連付けられた地理的範囲とクリックログデータベース42に記憶された地理的範囲とが略一致するクエリを特定する情報に関連付けて記憶されたクリック数が多いほどスコアが高くなるようにスコアを補正する。
【0057】
図2及び図4の例にならって検討すると、地域スコアデータベース22(図2)に記憶された地域の名称「東京」について、この地域の名称「東京」に関連付けられた地理的範囲は、「東京都」全体であり、クリックログデータベース42(図4)に記憶された地理的範囲「東京都」と略一致するクエリは、「東京」である。
【0058】
同様に、地域スコアデータベース22(図2)に記憶された地域の名称「六本木」に関連付けられた地理的範囲と、クリックログデータベース42(図4)に記憶された地理的範囲とが略一致するクエリは、「六本木」である。
【0059】
また、地域スコアデータベース22(図2)に記憶された地域の名称「東京ミッドタウン」に関連付けられた地理的範囲と、クリックログデータベース42(図4)に記憶された地理的範囲とが略一致するクエリは、「ミッドタウン」である。
【0060】
そして、また、地域スコアデータベース22(図2)に記憶された地域の名称「日吉駅(神奈川県)」に関連付けられた地理的範囲と、クリックログデータベース42(図4)に記憶された地理的範囲とが略一致するクエリは、「日吉駅」であり、地域スコアデータベース22(図2)に記憶された地域の名称「日吉駅(京都府)」に関連付けられた地理的範囲と、クリックログデータベース42(図4)に記憶された地理的範囲とが略一致するクエリは、「日吉駅」である。
【0061】
スコアの補正は、「全体のクリック数の対数」に対する「その地域の名称についてのクエリのクリック数の対数」の割合を算出し、その算出した値を元のスコアと乗算することによって行われる。
【0062】
図4の例にならい、1ヶ月間での全体のクリック数が500万であり、地域の名称「東京」のクリック数が213,498である場合を例にして説明する。なお、図2で例示されるように、地域スコアデータベース22に記憶されている地域の名称「東京」のスコアは5ポイントである。
【0063】
まず、地域の名称「東京」について検討すると、全体のクリック数の対数は、log105,000,000=約6.70であり、地域の名称「東京」についてのクエリのクリック数の対数は、log10213,498=約5.33である。よって、「全体のクリック数の対数」に対する「その地域の名称についてのクエリのクリック数の対数」の割合は、5.33/6.70=約0.80であり、その割合を元のスコアと乗算すると、0.80×5=約4である。よって、地域の名称「東京」の補正後のスコアは4である。
【0064】
同様に、地域の名称「六本木」の補正後のスコアは7であり、地域の名称「東京ミッドタウン」の補正後のスコアは23である。また、地域の名称「日吉駅(神奈川県)」の補正後のスコアは46であり、地域の名称「日吉駅(神奈川県)」の補正後のスコアは38である。
【0065】
ステップS22では、スコア補正部15は、このスコア補正部15によって算出された補正後のスコアを地域スコアデータベース22に記憶させる。
【0066】
例えば、地域の名称「日吉駅(神奈川県)」については、補正後のスコア「51」を地域スコアデータベース22に記憶させることにより、スコアを「50」から「51」に更新させる。また、地域の名称「日吉駅(京都府)」については、補正後のスコア「18」を地域スコアデータベース22に記憶させることにより、スコアを「100」から「18」に更新させる。
【0067】
ステップS23では、制御部10は、地域スコアデータベース22に記憶された全てのデータについてスコアの補正を完了したか否かを判別する。この判別がYESのときは、地域スコアデータベース作成装置1における処理を終了し、NOのときは、ステップS21に移る。
【0068】
[本実施形態に係る地域スコアデータベース作成装置1等の実施例]
図8及び図9は、本実施形態に係る地域スコアデータベースを作成する地域スコアデータベース作成装置1、方法及びプログラムを実施したときの端末3の画面50での表示例を示す図である。
【0069】
まず、図8について説明する。図8は、端末3のユーザに対し、クエリの入力を促す画像を示す。
【0070】
画面50には、「a!検索サイト」という文字と共に、検索条件を入力するための検索条件入力部51及びこの検索条件入力部51に入力した検索条件での検索を開始するための「検索」ボタン52とが表示されている。ここでは、ユーザは、端末3のキーボード(図示せず)を用いて検索条件入力部51に「日吉駅 レストラン」と入力し、端末3のマウスを用いてカーソル53を「検索」ボタン52にまで移動させている。
【0071】
次に、図9について説明する。図8で示された画像において、ユーザが端末3のマウスをクリックしたことにより、検索サーバ2のクエリ受付部31は、端末3からネットワークを介して送信されたクエリ「日吉駅 レストラン」を受け付け、地域抽出部32は、地域スコアデータベース41を参照して「日吉駅」を地域の名称として抽出する。「日吉駅」の地理的範囲は、「神奈川県港北区日吉○丁目△番×号」と、「京都府南丹市日吉町□△○」とがある。そのため、地域抽出部32は、両方の地理的範囲について、スコアと共に抽出する。
【0072】
そして、検索サーバ2の検索結果送信部33は、地域抽出部32によって抽出された地域の名称を含むクエリを検索し、その検索の結果を端末3に送信する。この検索及び送信は、スコアが高い地理的範囲を優先して行う。本実施形態では、地域スコアデータベース作成装置1によってスコアの算出だけでなく、1ヶ月間のクリック数に基づいた補正も行われている。「神奈川県港北区日吉○丁目△番×号」の「日吉駅」についての補正後のスコアは「51」であり、「京都府南丹市日吉町□△○」の「日吉駅」についての補正後のスコアは「18」である。そのため、検索結果送信部33は、「神奈川県港北区日吉○丁目△番×号」にある「日吉駅」の検索結果を優先して送信する。図9は、このときの画面50を示す。
【0073】
画面50には、検索条件が「日吉駅 レストラン」であること、この検索条件では約16万5千件の結果が得られたこと、現在表示しているWebページは約16万5千件のうち1件目〜10件目の情報であることが示されている。また、画面50には、「神奈川県港北区日吉○丁目△番×号」にある「日吉駅」近辺のレストランを検索するためのハイパーリンク54,55が表示されている。さらに、画面50には、「神奈川県港北区日吉○丁目△番×号」にある「日吉駅」近辺の地図56が表示され、この地図56には、レストランの位置がマーキングされている。
【0074】
本実施形態によると、地域スコアデータベース41には、クリック数に基づいて補正されたスコアが記憶される。検索サーバ2がこの地域スコアデータベース41を用いて地域の名称を含むクエリを検索する際、その地域の名称の重要度を、その地域の名称が示す地理的範囲に基づいて付与した後に補正したスコア、具体的には、地理的範囲に基づいて付与した後、その地域の名称を含むクエリの検索結果のクリック数によって補正したスコアを用いて判定できる。これにより、その地域の名称の重要度を、地理的範囲のみでスコアを算出したときに比べて適切に表現し、検索の精度を高めることが可能な地域スコアデータベース作成装置1を提供できる。
【0075】
なお、本実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本実施形態に記載されたものに限定されるものではない。
【符号の説明】
【0076】
1 地域スコアデータベース作成装置
10 制御部
11 地域名称受付部
12 地理的範囲特定部
13 スコア算出部
14 スコア記憶部
15 スコア補正部
20 記憶部
21 スコア付与対象データベース
22 地域スコアデータベース
42 クリックログデータベース

【特許請求の範囲】
【請求項1】
地域の名称のスコアが記憶される地域スコアデータベースを作成する装置であって、
前記スコアを付与する対象となる前記地域の名称を受け付けたことに応じて、前記受け付けた地域の名称が示す地理的範囲を特定する地理的範囲特定手段と、
前記地理的範囲特定手段が特定した前記地理的範囲が狭いほど高いスコアを算出するスコア算出手段と、
前記地理的範囲特定手段によって特定された地理的範囲を示す情報及び前記スコア算出手段によって算出されたスコアを前記地域の名称と関連付けて前記地域スコアデータベースに記憶するスコア記憶手段と、
前記地域の名称を含むクエリの検索結果がクリックされた数を示すクリック数を、前記クエリを特定する情報及び前記地域の名称が示す地理的範囲を示す情報に関連付けて記憶するクリックログ記憶手段と、
前記地域スコアデータベースに記憶された地域の名称について、この地域の名称に関連付けられた地理的範囲と前記クリックログ記憶手段に記憶された地理的範囲とが略一致する前記クエリを特定する情報に関連付けて記憶されたクリック数が多いほどスコアが高くなるように前記スコアを補正し、その補正したスコアを前記地域スコアデータベースに記憶するスコア補正手段とを備える装置。
【請求項2】
地域の名称のスコアが記憶される地域スコアデータベースをコンピュータが作成する方法であって、
前記コンピュータが、前記スコアを付与する対象となる前記地域の名称を受け付けたことに応じて、前記受け付けた地域の名称が示す地理的範囲を特定する地理的範囲特定工程と、
前記コンピュータが、前記地理的範囲特定工程で特定した前記地理的範囲が狭いほど高いスコアを算出するスコア算出工程と、
前記コンピュータが、前記地理的範囲特定工程で特定した地理的範囲を示す情報及び前記スコア算出工程で算出したスコアを前記地域の名称と関連付けて前記地域スコアデータベースに記憶するスコア記憶工程と、
前記コンピュータが、前記地域の名称を含むクエリの検索結果がクリックされた数を示すクリック数を、前記クエリを特定する情報及び前記地域の名称が示す地理的範囲を示す情報に関連付けて記憶するクリックログ記憶工程と、
前記コンピュータが、前記地域スコアデータベースに記憶された地域の名称について、この地域の名称に関連付けられた地理的範囲と前記クリックログ記憶工程で記憶した地理的範囲とが略一致する前記クエリを特定する情報に関連付けて記憶されたクリック数が多いほどスコアが高くなるように前記スコアを補正し、その補正したスコアを前記地域スコアデータベースに記憶するスコア補正工程とを含む方法。
【請求項3】
地域の名称のスコアが記憶される地域スコアデータベースをコンピュータに作成させるためのプログラムであって、
前記スコアを付与する対象となる前記地域の名称を受け付けたことに応じて、前記受け付けた地域の名称が示す地理的範囲を特定する地理的範囲特定工程と、
前記地理的範囲特定工程で特定した前記地理的範囲が狭いほど高いスコアを算出するスコア算出工程と、
前記地理的範囲特定工程で特定した地理的範囲を示す情報及び前記スコア算出工程で算出したスコアを前記地域の名称と関連付けて前記地域スコアデータベースに記憶するスコア記憶工程と、
前記地域の名称を含むクエリの検索結果がクリックされた数を示すクリック数を、前記クエリを特定する情報及び前記地域の名称が示す地理的範囲を示す情報に関連付けて記憶するクリックログ記憶工程と、
前記地域スコアデータベースに記憶された地域の名称について、この地域の名称に関連付けられた地理的範囲と前記クリックログ記憶工程で記憶した地理的範囲とが略一致する前記クエリを特定する情報に関連付けて記憶されたクリック数が多いほどスコアが高くなるように前記スコアを補正し、その補正したスコアを前記地域スコアデータベースに記憶するスコア補正工程とを前記コンピュータに実行させるプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公開番号】特開2011−134256(P2011−134256A)
【公開日】平成23年7月7日(2011.7.7)
【国際特許分類】
【出願番号】特願2009−295309(P2009−295309)
【出願日】平成21年12月25日(2009.12.25)
【出願人】(500257300)ヤフー株式会社 (1,128)
【Fターム(参考)】