情報処理システム、情報生成装置、情報提供装置、情報生成方法、情報提供方法、情報生成プログラム、および情報提供プログラム
【課題】場所に関連する情報とその場所を含む地域とを関係付けることができること。
【解決手段】場所地名生成部(10)は、地域を識別する地域識別情報と地域の包含関係に基づいた階層関係を示す階層情報とが対応付けられた地名階層情報と、解説文書の見出語が階層関係で関係付けられたカテゴリ情報と、に基づいて、地域識別情報に関するカテゴリ情報から場所に関連する場所関連情報を抽出し、抽出した場所関連情報と当該地域識別情報についての地名階層情報とを対応付けた場所地名情報を生成する。
【解決手段】場所地名生成部(10)は、地域を識別する地域識別情報と地域の包含関係に基づいた階層関係を示す階層情報とが対応付けられた地名階層情報と、解説文書の見出語が階層関係で関係付けられたカテゴリ情報と、に基づいて、地域識別情報に関するカテゴリ情報から場所に関連する場所関連情報を抽出し、抽出した場所関連情報と当該地域識別情報についての地名階層情報とを対応付けた場所地名情報を生成する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理システム、情報生成装置、情報提供装置、情報生成方法、情報提供方法、情報生成プログラム、および情報提供プログラムに関する。
【背景技術】
【0002】
近年、Wikipedia(登録商標)やWordNet(登録商標)などの百科事典情報(集合知)から、意味的な関連を見つけ出す試みが進められており、非特許文献1、2に挙げるような成果が出ている。また、文書などから語句の上下関係を抽出する方法 (例えば、特許文献1)が提案されている.
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2007−11772号公報
【非特許文献】
【0004】
【非特許文献1】“上位語階層データ”、[online]、[2011年2月14日検索]、インターネット(URL: http://alaginrc.nict.go.jp/images/documents/ALAGIN_typed−hierarchies−v1_README.pdf)
【非特許文献2】“Wikipediaシソーラス”、[online]、Wikipedia研究所、[2011年2月14日検索]、インターネット(URL: http://wikipedia−lab.org/ja/index.php/Wikipedia%E3%82%B7%E3%82%BD%E3%83%BC%E3%83%A9%E3%82%B9)
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、特許文献1記載の技術では、「場所がどの市区町村にあるか」といった特定の用途には不向きである、という問題があった。
また、Wikipediaなどで抽出できる階層構造は、場所に関連する語やカテゴリの配下には雑多なカテゴリや見出語(例えば、その場所の出身人物やその場所に存在する企業)が含まれている。そのため、上位カテゴリから下位カテゴリに階層を辿ったとしても、特に町域(例えば、六本木など)を表すカテゴリを何らかのルールを持って抽出することは困難であった。また、キーワードを起点にカテゴリを上に辿ったとしても、そのカテゴリが主に場所を含むカテゴリか否かを判別することは困難であった。
このように、従来技術では、場所に関連する情報とその場所を含む地域とを関係付けることができないという問題があった。
【0006】
本発明は上記の点に鑑みてなされたものであり、場所に関連する情報とその場所を含む地域とを関係付けることができる情報処理システム、情報生成装置、情報提供装置、情報生成方法、情報提供方法、情報生成プログラム、および情報提供プログラムを提供する。
【課題を解決するための手段】
【0007】
(1)本発明は上記の課題を解決するためになされたものであり、本発明の一態様は、情報生成装置と情報提供装置とを具備する情報処理システムおいて、前記情報生成装置は、地域を識別する地域識別情報が地域の包含関係に基づいた階層関係で関係付けられた地名階層情報と、解説文書の見出語が階層関係で関係付けられたカテゴリ情報と、に基づいて、前記地域識別情報に関するカテゴリ情報から場所に関連する場所関連情報を抽出し、抽出した場所関連情報と当該地域識別情報についての地名階層情報とを対応付けた場所地名情報を生成する場所地名生成部を備え、前記情報提供装置は、前記場所関連情報を取得する場所取得部と、前記場所取得部が取得した場所関連情報に対応付けられた第1の地域識別情報の階層関係に基づいて第2の地域識別情報を抽出し、抽出した第2の地域識別情報が表す地域に関する情報を要求する情報要求部と、前記情報要求部が要求した情報を取得して提供する情報提供部と、を備えることを特徴とする情報処理システムである。
【0008】
(2)また、本発明の一態様は、地域を識別する地域識別情報が地域の包含関係に基づいた階層関係で関係付けられた地名階層情報と、解説文書の見出語が階層関係で関係付けられたカテゴリ情報と、に基づいて、前記地域識別情報に関するカテゴリ情報から場所に関連する場所関連情報を抽出し、抽出した場所関連情報と当該地域識別情報についての地名階層情報とを対応付けた場所地名情報を生成する場所地名生成部を備えることを特徴とする情報生成装置である。
【0009】
(3)また、本発明の一態様は、場所に関連する場所関連情報と、当該場所関連情報に関する地域を識別する地域識別情報と、当該地域識別情報が地域の包含関係に基づいた階層関係で関係付けられた地名階層情報と、を対応付けた場所地名情報を記憶する場所・地名対情報記憶部と、前記場所関連情報を取得する場所取得部と、前記場所取得部が取得した場所関連情報に対応付けられた第1の地域識別情報の階層関係に基づいて第2の地域識別情報を抽出し、抽出した第2の地域識別情報が表す地域に関する情報を要求する情報要求部と、前記情報要求部が要求した情報を取得して提供する情報提供部と、を備えることを特徴とする情報提供装置である。
【0010】
(4)また、本発明の一態様は、情報生成装置が、地域を識別する地域識別情報が地域の包含関係に基づいた階層関係で関係付けられた地名階層情報と、解説文書の見出語が階層関係で関係付けられたカテゴリ情報と、に基づいて、前記地域識別情報に関するカテゴリ情報から場所に関連する場所関連情報を抽出する第1の過程と、情報生成装置が、前記第1の過程で抽出した場所関連情報と当該地域識別情報についての地名階層情報とを対応付けた場所地名情報を生成する第2の過程と、を有することを特徴とする情報生成方法である。
【0011】
(5)また、本発明の一態様は、場所に関連する場所関連情報と、当該場所関連情報に関する地域を識別する地域識別情報と、当該地域識別情報が地域の包含関係に基づいた階層関係で関係付けられた地名階層情報と、を対応付けた場所地名情報を記憶する場所・地名対情報記憶部を備える情報提供装置における情報提供方法であって、前記情報提供装置が、前記場所関連情報を取得する第1の過程と、情報提供装置が、前記第1の過程で取得した場所関連情報に対応付けられた第1の地域識別情報の階層関係に基づいて第2の地域識別情報を抽出し、抽出した第2の地域識別情報が表す地域に関する情報を要求する第2の過程と、情報提供装置が、前記第2の過程で要求した情報を取得して提供する第3の過程と、を有することを特徴とする情報提供方法である。
【0012】
(6)また、本発明の一態様は、情報生成装置のコンピュータに、地域を識別する地域識別情報が地域の包含関係に基づいた階層関係で関係付けられた地名階層情報と、解説文書の見出語が階層関係で関係付けられたカテゴリ情報と、に基づいて、前記地域識別情報に関するカテゴリ情報から場所に関連する場所関連情報を抽出する抽出手段、前記抽出手段で抽出した場所関連情報と当該地域識別情報についての地名階層情報とを対応付けた場所地名情報を生成する生成手段、を実行させるための情報生成プログラムである。
【0013】
(7)また、本発明の一態様は、場所に関連する場所関連情報と、当該場所関連情報に関する地域を識別する地域識別情報と、当該地域識別情報が地域の包含関係に基づいた階層関係で関係付けられた地名階層情報と、を対応付けた場所地名情報を記憶する場所・地名対情報記憶部を備える情報提供装置のコンピュータに、前記場所関連情報を取得する場所取得手段、前記場所取得手段で取得した場所関連情報に対応付けられた第1の地域識別情報の階層関係に基づいて第2の地域識別情報を抽出し、抽出した第2の地域識別情報が表す地域に関する情報を要求する情報要求手段、前記情報要求手段で要求した情報を取得して提供する情報提供手段、を実行させるための情報提供プログラムである。
【発明の効果】
【0014】
本発明によれば、場所に関連する情報とその場所を含む地域とを関係付けることができる。
【図面の簡単な説明】
【0015】
【図1】本発明の実施形態に係る情報処理システムを示す概略図である。
【図2】本実施形態に係る住所一覧情報の一例を示す概略図である。
【図3】本実施形態に係る百科事典情報の解説文書の一例を示す概略図である。
【図4】本実施形態に係る百科事典情報のカテゴリ情報の一例を示す概略図である。
【図5】本実施形態に係る情報生成サーバの構成を示す概略構成図である。
【図6】本実施形態に係る情報生成サーバの動作の一例を表すシーケンス図である。
【図7】本実施形態に係る住所一覧情報と地名階層情報との関係の一例を示す概略図である。
【図8】本実施形態に係る地名抽出処理を表す概略図である。
【図9】本実施形態に係る町域名連結処理を表す概略図である。
【図10】本実施形態に係る地名解釈部の処理の一例を示す概略図である。
【図11】本実施形態に係るリスト追加処理を説明する説明図である。
【図12】本実施形態に係る場所候補・地名対情報の生成処理の一例を示す概念図である。
【図13】本実施形態に係る場所・地名対情報の一部の一例を示す概略図である。
【図14】本実施形態に係る場所・地名対情報の別の一部の一例を示す概略図である。
【図15】本実施形態に係る情報提供サーバの構成を示す概略構成図である。
【図16】本実施形態に係るサービス地域対情報の一例を示す概略図である。
【発明を実施するための形態】
【0016】
以下、図面を参照しながら本発明の実施形態について詳しく説明する。
図1は、本発明の実施形態に係る情報処理システムを示す概略図である。
この図において、郵便番号辞書サーバY1、百科事典サービス(例えば、Wikipedia;登録商標)サーバW1、情報生成サーバ1、情報提供サーバ2、およびサービス提供サーバS1が、ネットワークN1を介して接続されている。
【0017】
郵便番号辞書(例えば、日本郵政(登録商標)の郵便番号辞書)サーバY1のデータベースD1には、住所一覧情報(図2)が記憶されている。この住所一覧情報は、管理者がコンピュータP1を用いて更新する情報であり、「郵便番号」、「都道府県名」、「市区町村名」、「町域名」が対応付けられた情報である。
【0018】
百科事典サービスサーバW1のデータベースD2には、百科事典情報(図3)が記憶されている。この百科事典情報は、ユーザが、ネットワークN1に接続されたコンピュータP2を用いて更新する情報であり、人類の知識の及ぶ分野の事柄について、辞書の形式に準じて項目(見出語)を立てて配列し、解説を加えた情報(集合知)である。具体的には、百科事典情報は、見出語(図3では「花見川区」)毎に、その見出語の解説文書が対応付けられた情報である。また、見出語の一部は、ユーザにより、カテゴリ情報として階層関係で関係付けられている(図4では、「千葉市」(上位カテゴリ)と「花見川区」(下位カテゴリ))。
【0019】
情報生成サーバ1は、データベースD1の住所一覧情報を取得し、地域名(例えば、町域名)とその地域名の地域が含まれる地域の地域名(例えば、市区町村名)を階層化する。つまり、情報生成サーバ1は、狭い地域を下位とし、その地域を含む広い地域を上位として階層化することで、地域の包含関係に基づいた階層化を行う。
情報生成サーバ1は、階層化した地域名の情報(地名階層情報)の地域名を選択し、選択した地域名が表す地域に対応するカテゴリのカテゴリ情報をデータベースD2から取得する。情報生成サーバ1は、取得したカテゴリ情報から下位カテゴリを表す情報(項目とも称す)を抽出し、抽出した項目から場所に関連する情報である場所関連情報を抽出する。情報生成サーバ1は、すべての地域名について場所関連情報の抽出を試みる。情報生成サーバ1は、場所関連情報を地名階層情報の地域名各々に対応付けた場所・地名対情報を生成する。
【0020】
これにより、情報生成サーバ1は、場所関連情報とその場所を含む地域とを関係付けることができ、さらに、場所を階層化された地域と関係付けることができる。また、情報生成サーバ1は、百科事典情報における雑多なカテゴリから、地域と場所に関する情報のみを抽出できる。つまり、情報生成サーバ1は、場所に関連する単語(ランドマークや駅など)と、単語が表すものがある都道府県市区町村または町域と、を容易に精度良く結びつけることができる。情報生成サーバ1は、生成した場所・地名対情報を情報提供サーバ2に送信する。
【0021】
情報提供サーバ2は、情報生成サーバ1から受信した場所・地名対情報をデータベースに記憶する。情報提供サーバ2は、ユーザ操作によってコンピュータP3が送信した情報に基づいて、通信メッセージ(例えば、検索キーワードや入力情報、またはメール文書)を取得する。情報提供サーバ2は、通信メッセージから場所関連情報を抽出し、抽出した場所関連情報と記憶する場所・地名対情報に基づいて、地域名を選択する。情報提供サーバ2は、選択した地域名に関するサービス情報を、サービス提供サーバS1から取得する。情報提供サーバ2は、取得したサービス情報を、コンピュータP3が送信した情報、または、その情報の応答情報に付加し、コンピュータP3に送信する。
例えば、情報提供サーバ2は、コンピュータP3が送信した検索キーワードから「六本木ヒルズ」という場所関連情報を抽出した場合、その場所関連情報を対応付けられた地域名「六本木」を抽出する。情報提供サーバ2は、「六本木」より上位の地域名の「港区」を選択し、サービス提供サーバS1から「港区」の天気予報情報を取得する。
【0022】
情報提供サーバ2は、検索結果情報に「港区」の天気予報情報を付加し、コンピュータP3に送信する。なお、サービス提供サーバS1は、「六本木」のような狭い地域単位での天気予報情報を提供せず、それより広い地域(「港区」)での天気予報を提供する。
つまり、情報提供サーバ2は、ユーザが関心のある場所関連情報について、その場所を含む地域、または、その地域の上位あるいは下位の地域の情報を提供できる。また、例えば、情報提供サーバ2は、場所関連情報を含むテキスト(例えば、Twitter(登録商標)、SNS、ブログ、電子メールなど)をトリガに、その場所に関連する情報(例えば、天気や周辺の飲食店など)を表示するサービスを提供できる。
【0023】
図2は、本実施形態に係る住所一覧情報の一例を示す概略図である。図示するように住所一覧情報は、各行に住所情報(レコード)を有する。住所情報は、郵便番号、都道府県名(カタカナ)、市区町村名(カタカナ)、町域名(カタカナ)、都道府県名、市区町村名、町域名の各項目(フィールド)を含んでいる。各項目は、「,」(コンマ)で区切られている。市区町村名のフィールドは、市名(政令指定都市を除く)、政令指定都市名+区名(政令指令都市名と区名が結合されたもの)、郡名+町村名(郡名と町村名が結合されたもの)、または区(東京23区)を表す文字列である。町域名のフィールドは丁目や大規模ビルが含まれることがある。
【0024】
例えば、図2の1行目の住所情報は、郵便番号が「262−0019」、都道府県名が「千葉県」、市区町村名が「千葉市花見川区」、町域名が「朝日ヶ丘」であることを表す。ここで、「千葉市」は政令指定都市であるので、市名「千葉市」と区名「花見川区」が結合されている。例えば、図2の2行目の住所情報は、郵便番号が「343−0114」、都道府県名が「埼玉県」、市区町村名が「北葛飾郡松伏町」、町域名が「ゆめみ野東」であることを表す。ここで、「北葛飾郡松伏町」は、郡名「北葛飾郡」と町村名「松伏町」が結合されている。
【0025】
図3は、本実施形態に係る百科事典情報の解説文書の一例を示す概略図である。この図は、見出語「花見川区」の解説文書を、HTML形式で表示したものを表している。符号m1を付した見出語「花見川区」は、図3の解説文書による解説対象の見出語である。符号m2を付した部分は、解説文書の目次である。この目次に例示されるように、地域名を見出語とする解説文書には、交通機関(駅、バス停、道名、インターチェンジ等)、施設、教育施設(学校)、史跡等が含まれている。なお、解説文書は、文書IDで識別される(例えば、花見川区の文書IDは「1126445」)。
解説文書において、下線を引いた単語は、他の解説文書による解説対象の見出語(文中見出語という)であり、ハイパーリンクが付されている。例えば、符号m2を付した文中見出語「大賀ハス」をユーザがクリックすると、「大賀ハス」を見出語とした解説文書が表示される。
【0026】
図4は、本実施形態に係る百科事典情報のカテゴリ情報の一例を示す概略図である。この図は、地域名「千葉市」が表す地域に対応するカテゴリのカテゴリ情報を、HTML形式で表示したものを表している。符号m3を付した見出語「Category:千葉市」は、地域名「千葉市」が表す地域に対応するカテゴリであることを示す。符号m4を付した「千葉県>千葉県の市区町村>千葉市」は、「千葉県」が「千葉県の市区町村」および「千葉市」の上位カテゴリであり、「千葉県の市区町村」が「千葉県」の下位カテゴリおよび「千葉市」の上位カテゴリであることを示す。
【0027】
符号m5を付した破線の四角で囲った領域内の情報は、「千葉市」の下位カテゴリの一覧情報である。この一覧情報の各単語が「千葉市」の下位カテゴリを表す情報(項目。例えば、「千葉市の区」やその下位カテゴリの「花見川区」)である。すなわち、カテゴリ情報は、ユーザが見出語について階層関係を付した情報である。図4に示すように、項目には、画像情報や市長、スポーツに関する情報等の雑多な情報が含まれている。
符号m6を付した破線の四角で囲った領域内の情報は、地域名「千葉市」が表す地域に対応するカテゴリに含まれる見出語(項目、場所候補情報)の一覧情報である。この見出語には、場所関連情報が含まれている。
【0028】
図5は、本実施形態に係る情報生成サーバ1の構成を示す概略構成図である。この図において、情報生成サーバ1は、制御部100、地名解釈部101、地名階層情報記憶部102、および、場所地名生成部10を含んで構成される。場所地名生成部10は、場所候補抽出部103、場所候補・地名対情報記憶部104、ノイズ除去フィルタ部105、および、場所・地名対情報記憶部106を含んで構成される。
【0029】
制御部100は、情報生成サーバ1の各部を制御する。
地名解釈部101は、データベースD1から取得した住所一覧情報の地域名を階層化することで地名階層情報を生成する。地名解釈部101は、生成した地名階層情報を、地名階層情報記憶部102に記憶させる。
【0030】
場所候補抽出部103は、データベースD2から取得した百科事典情報のカテゴリ情報と、地名階層情報記憶部102が記憶している地名階層情報と、に基づいて、場所候補・地名対情報を生成する。場所候補・地名対情報は、階層化された地域名各々に、カテゴリ情報中の場所関連情報の候補である場所候補情報が対応付けられた情報である。
場所候補抽出部103は、生成した場所候補・地名対情報を、場所候補・地名対情報記憶部104に記憶させる。
【0031】
ノイズ除去フィルタ部105は、場所候補・地名対情報記憶部104が記憶している場所候補・地名対情報の場所候補情報から、場所に関連する単語として不適当な場所候補情報を削除する。また、ノイズ除去フィルタ部105は、場所候補・地名対情報の場所候補情報に基づいて、場所に関連する単語として適当な単語を生成して、地名階層情報の地域名に対応付ける。ノイズ除去フィルタ部105は、これらの処理(ノイズ除去処理という)を施した後の情報(場所・地名対情報という)を、場所・地名対情報記憶部106に記憶させる。つまり、場所・地名対情報は、階層化された地域名各々に、場所に関連する単語として適当な単語(場所関連情報)が対応付けられた情報である。
【0032】
図6は、本実施形態に係る情報生成サーバ1の動作の一例を表すシーケンス図である。
(ステップS111)制御部100は、郵便番号辞書サーバY1と通信してデータベースD1の住所一覧情報を受信し、受信した住所一覧情報を地名解釈部101に出力する。その後、ステップS112に進む。
(ステップS112)地名解釈部101は、ステップS111で入力された住所一覧情報に基づいて、住所一覧情報の地域名を階層化することで地名階層情報を生成する。ここで、地名解釈部101は、上位層から下位層への順序(ノード1、2、2−1、3の順序)に、次に示すノードで階層化する。
【0033】
(ノード1)都道府県名
(ノード2)市区(東京23区の区)町村名
(ノード2−1)区(政令指令都市の区)名
(ノード3)町域名
【0034】
ここで、ノード2−1は、ノード2の市区町村名が政令指令都市名の場合にのみ生成されるノードである。また、最下位のノード(ノード3)以外の各ノード1、2、2−1は1または複数の子ノードを持ち、最上位のノード(ノード1)以外の各ノード2、3、4は1つの親ノードを持つ。
【0035】
図7は、本実施形態に係る住所一覧情報と地名階層情報との関係の一例を示す概略図である。この図において、符号I11を付した破線で囲まれた情報は、住所一覧情報I11である。例えば、住所一覧情報I11の5行目の住所情報は、都道府県名が「千葉県」、市区町村名が「千葉市花見川区」、町域名が「朝日ヶ丘」である。
符号I12、I13を付した破線で囲まれた情報は、それぞれ地名階層情報I12、I13である。地名階層情報I12はノード2の市区町村名が政令指令都市名である場合のものであり、地名階層情報I13はノード2の市区町村名が政令指令都市名でない場合のものである。例えば、地名階層情報I12は、ノード1が「東京都」、ノード2が「千代田区」、ノード3が「飯田橋」である。
【0036】
以下、ステップS112における地名解釈部101の処理の詳細について説明する。地名解釈部101は、次の手順(a)〜(e)の順に処理を行う。
【0037】
(a)地名解釈部101は、住所一覧情報から住所情報を1行ずつ読み込む。ここで、地名解釈部101は、住所情報から都道府県名、市区町村名、町域名のフィールドを抽出する(地名抽出処理という)。百科事典情報の見出語(一部は、カテゴリとして用いられる)は、(半角カタカナではなく)都道府県名、市区町村名、町域名の(漢字を含む)用語が用いられる。地名解釈部101は、このフィールドを抽出することで、百科事典情報の見出語と同じ用語を抽出できる。
図8は、本実施形態に係る地名抽出処理を表す概略図である。この図は、地名解釈部101が、住所一覧情報から都道府県名、市区町村名、町域名を抽出することを表す。例えば、地名解釈部101は、1行目の住所情報から都道府県名「東京都」、市区町村名「千代田区」、町域名「三崎町」を抽出することを表す。
【0038】
地名抽出処理において、地名解釈部101は、郵便番号が同じで町域名が異なる住所情報がある場合には、レコードの順序に従って町域名を連結する(町域名連結処理という)。
図9は、本実施形態に係る町域名連結処理を表す概略図である。この図の住所一覧情報では、町域名の文字数が一定数を越えるものが、複数行に跨って記述されている。例えば、実際の町域名「四町目(出水通油小路西入、出水通堀川東入、出水通堀川東入下る、出水通東堀川東入、下立売通堀川東入、下立売通堀川東入上る、下立売通堀川東入下る、東堀川通下立売上る、東堀川通出水下る)」が、1行目の「四町目(出水通油小路西入、出水通堀川東入、出水通堀川東入」、2行目の「下る、出水通東堀川東入、下立売通堀川東入、下立売通堀川東入上る、下立売通」、3行目の「堀川東入下る、東堀川通下立売上る、東堀川通出水下る)」に跨って記述されている。
この場合、地名解釈部101は、郵便番号「602−8045」が同じ住所情報を連結し、図9に示すように、町域名を「四町目(出水通油小路西入、出水通堀川東入、出水通堀川東入下る、出水通東堀川東入、下立売通堀川東入、下立売通堀川東入上る、下立売通堀川東入下る、東堀川通下立売上る、東堀川通出水下る)」を生成する。
【0039】
(b)地名解釈部101は、抽出したレコードの町域名が正規表現“次の.+を除く”にマッチしたとき、マッチした文字列を削除する(削除後の町域名を抽出町域名という)。なお、「.+」は、任意の文字(.)に1文字以上マッチ(+)することを示す。地名解釈部101は、文字列を削除したレコードより後に連続するレコードから、文字列を削除したレコードと都道府県名および市区町村名が一致するレコードを選択する。地名解釈部101は、選択したレコードの町域名が抽出町域名で始まる場合には、そのレコードを削除する。
【0040】
(c)地名解釈部101は、町域名が“以下に掲載がない場合”であるレコードを削除する。
(d)地名解釈部101は、町域名が正規表現“(.*)”にマッチするとき、マッチした文字列を取り除く。なお、「(.*)」は、全角括弧と全角括弧で囲まれた任意の文字列(文字列がない場合も含む)とにマッチすることを示す。
【0041】
図10は、本実施形態に係る地名解釈部101の処理の一例を示す概略図である。この図において、地名解釈部101は、符号r211を付したレコードの町域名「霞ヶ関(次のビルを除く)」の「次のビル除く」およびその文字列を削除した後の「()」(全角括弧)がマッチしたと判定し、これらの文字列を削除する。また、地名解釈部101は、符号r221、符号r231を付したレコードの町域名は、抽出町域名「霞ヶ関」と一致したと判定し、これらのレコードを削除する(無視する)。
これにより、地名解釈部101は、町域名の町域に含まれないビル等を削除することができる。なお、地名解釈部101は、レコードに削除フラグ(無視しない「0」、無視する「1」)の項目を設け、レコードを削除せずに、無視する「1」を設定してもよい。
また、例えば、地名解釈部101は、図10で符号r111を付したレコードを削除する。
【0042】
(e)地名解釈部101は、空のリストを用意し、都道府県名、市区町村名、町域名の順に次のリスト追加処理((I)〜(III))を行うことにより、都道府県−市−区−町村−町域のリストを生成する。ここで、地名解釈部101は、市区町村名について、政令指定都市を政令指定都市名と区名に分離し、また、町村名から郡名部分を除去する。
【0043】
(I)地名解釈部101は、市区町村名が正規表現“^(.+市)(.+区)$”にマッチするとき、“(.+市)”にマッチする部分文字列を市とし、(.+区)にマッチする部分文字列を区として、順にリストへ追加する。なお、「^」(ハット)は文字列の先頭でマッチすることを示し、「$」は文字列の最後でマッチすることを示す。また、「(.+市)(.+区)」は、任意の文字(.)に「市」が付加され、その後、任意の文字(.)に「区」が付加された文字にマッチすることを示す。例えば、図2の1行目の住所情報から抽出されたレコードでは、市区町村名「千葉市花見川区」のうち、「千葉市」が市として、また、「花見川区」が区としてリストへ追加される。
【0044】
(II)地名解釈部101は、市区町村名が正規表現“^(.+郡)(.+[町村])$”にマッチするときは、“(.+郡)”にマッチする部分文字列を削除し、“(.+[町村])”にマッチする部分文字列のみを、町村としてリストへ追加する。なお、「.+[町村]」は、任意の文字(.)に「町」または「村」のいずれかが付加された文字にマッチすることを示す。例えば、図2の2行目の住所情報から抽出されたレコードでは、市区町村名「北葛飾郡松伏町」のうち、「北葛飾郡」が削除されて「松伏町」が町村としてリストへ追加される。
(III)それ以外は、そのままリストへ追加する。
【0045】
図11は、本実施形態に係るリスト追加処理を説明する説明図である。この図において、1行目のレコードの市区町村名「千葉市中央区」は、リスト追加処理によって、「千葉市」と「中央区」に分けられている。また、2行目のレコードの市区町村名「北葛飾郡松伏町」は、リスト追加処理によって、「北葛飾郡」が削除されている。
また、リスト追加処理後のリスト(右図、地名階層情報)は、都道府県名、市区町村名、町域名の順に階層化されている。ここで、市区町村名が○○市××区(例えば、政令指定都市)の場合には、市区町村名が、市名、区名の順に階層化されている。すなわち、このリスト(地名階層情報)は、場所に関連する場所関連情報と、その場所関連情報に関する地域を識別する地域名と、その地域名が地域の包含関係に基づいた階層関係で関係付けられている。なお、地名解釈部101は、図13のように、地域名をIDに対応付け、地域名に対して上位(または下位)の地域名に対応するIDを対応付けた地名階層情報を生成してもよい。
【0046】
図6に戻って、上記ステップS112の後の処理について、説明をする。
(ステップS113)地名解釈部101は、上記(a)〜(e)の処理の結果、生成したリストを制御部100に出力する。なお、この地名階層情報は、RAM(地名階層情報記憶部102)に記憶される。その後、ステップS114に進む。
(ステップS114)制御部100は、ステップS113で入力された地名階層情報を場所候補抽出部103に出力する。場所候補抽出部103は、データベースD2から百科事典情報を取得する。
【0047】
場所候補抽出部103は、入力された地名階層情報から地域名(都道府県名、市区町村名(または、市名、区名)、町域名)を上位層から順に選択し、選択した地域名が表す地域に対応するカテゴリのカテゴリ情報を取得する。ここで、場所候補抽出部103は、地域名と上位の地域名と合わせた地域名(結合地域名)を生成し、生成した結合地域名が表す地域に対応するカテゴリのカテゴリ情報を取得する。例えば、場所候補抽出部103は、結合地域名として、「地域名」_(上位層の地域名)を生成する。具体的には、場所候補抽出部103は、市区町村名(または、区名)に対して、「区名」_(市名)、区名_(都道府県名)、区名の順に結合地域名を生成し、生成した結合地域名が表す地域に対応するカテゴリのカテゴリ情報を取得する。これにより、場所候補抽出部103は、地域名が重複し、百科事典情報のカテゴリ名に結合地域名が用いられる場合でも、対応するカテゴリが存在するすべての地域に対して、その地域に対応するカテゴリのカテゴリ情報を確実に取得できる。
場所候補抽出部103は、選択した地域名の文書IDを取得し、その文書IDと地域名とを対応付けて記憶する。場所候補抽出部103は、ノード2以下の地域名については、1つ上位の地域名の識別情報として、その地域名に対応する文書IDを対応付けて記憶する(図13参照)。
【0048】
場所候補抽出部103は、選択した地域名が表す地域に対応するカテゴリのカテゴリ情報からそのカテゴリに含まれる見出語(項目、場所候補情報)を抽出する。例えば、場所候補抽出部103は、地域に対応するカテゴリを含むすべてのカテゴリと、カテゴリ各々に含まれる見出語(項目)と、の対応情報を予め取得しておき、その対応情報に基づいて、選択した地域名が表す地域に対応する見出語を抽出する。ただし、本発明はこれに限らず、場所候補抽出部103は、図4のHTMLファイルを取得し、文書マッチングによって符号m6を付した破線の四角で囲った領域内の各単語(項目)を抽出してもよい。
場所候補抽出部103は、抽出した場所候補情報を文書IDに対応付けて記憶する(図14参照)。場所候補抽出部103は、これらの処理をすべての地域名に対して行うことで、場所候補・地名対情報(図13、14)を生成する。
【0049】
図12は、本実施形態に係る場所候補・地名対情報の生成処理の一例を示す概念図である。この図は、地名階層情報の地域名に対して、地域名が表す地域に対応するカテゴリを表す情報が対応付けられていることを示す。なお、項目は、矢印が示す先の情報が表すカテゴリの下位カテゴリを表す情報である。地域名の階層構造、地域名とカテゴリを表す情報、カテゴリを表す情報と項目は、それぞれ、文書IDでリンクされている。
【0050】
図6に戻って、上記ステップS116の後の処理について、説明をする。
(ステップS116)場所候補抽出部103は、ステップS115で生成した場所候補・地名対情報を制御部100に出力する。なお、この場所候補・地名対情報は、RAM(場所候補・地名対情報記憶部104)に記憶される。その後、ステップS117に進む。
(ステップS117)制御部100は、ステップS116で入力された場所候補・地名対情報をノイズ除去フィルタ部105に出力する。その後、ステップS118に進む。
【0051】
(ステップS118)ノイズ除去フィルタ部105は、次のノイズ除去処理((a)〜(f))を行うことにより、場所候補情報から場所を示すのに相応しくない情報を除去、また、場所を示すのに相応しい情報を追加する。
(a)ノイズ除去フィルタ部105は、見出語のうちsortkey(カテゴリに含まれる見出語を表示する際にソートするために使われる文字列)が「廃」、「未」、「旧」または「*」(アスタリスク)で始まっているものを除去する。これにより、ノイズ除去フィルタ部105は、現在の地域名とは異なる古い地域名などを除去することができる。
【0052】
(b)ノイズ除去フィルタ部105は、場所候補情報から、一文字でかつ曖昧なもの(正規表現“^._¥(.*¥)”にマッチするもの)を除去する(「¥」はエスケープ文字。以下、同じ)。ここで、「¥(.*¥)」は、「(」と「)」に囲まれた表現を後に呼び出すことができることを示す。
(c)ノイズ除去フィルタ部105は、場所候補情報から、ひらがなまたはカタカナのみの語でかつ曖昧なもの(正規表現“^[ぁ−んァ−ヶ−]+_¥(.*¥)$”にマッチするもの)を除去する。
【0053】
(d)ノイズ除去フィルタ部105は、場所候補情報から、「ひらがなおよびカタカナ以外の文字を2文字以上含む文字列」+“駅”で構成される文字列(駅名と言う)を選択し、抽出した駅名から末尾の“駅”を除いた文字列を抽出する。ノイズ除去フィルタ部105は、抽出した文字列に対して、駅名に対応する文書IDを対応付けて、場所・地名対情報に追加する。例えば、ノイズ除去フィルタ部105は、「東京駅」を選択して「東京」を抽出し、場所候補・地名対情報に「東京」を追加する。駅名には場所を表す単語に「駅」を付加したものが用いられることがあり、また、駅名の「駅」を省略した単語が場所を表す単語になることがある。ノイズ除去フィルタ部105は、駅名から「駅」を除いた単語を、場所を表す単語として慣用される単語を追加できる。
【0054】
(e)ノイズ除去フィルタ部105は、場所候補情報から、末尾が“都”、“府”、“県”または“市”で終わる文字列を選択する。ノイズ除去フィルタ部105は、選択した文字列から末尾の文字を除いた文字列であって、ひらがなまたはカタカナ2文字で構成されるもの以外の文字列抽出する。ノイズ除去フィルタ部105は、抽出した文字列に対して、選択した文字列に対応する文書IDを対応付けて、場所候補・地名対情報に追加する。都道府県名、市区町村名には、場所を表す単語に「都」、「府」、「県」または「市」を付加したものが用いられることがあり、また、文字列の「都」、「府」、「県」または「市」を省略した単語が場所を表す単語になることがある。ノイズ除去フィルタ部105は、「都」、「府」、「県」または「市」を除いた単語を、場所を表す単語として慣用される単語を追加できる。
なお、ノイズ除去フィルタ部105は、場所候補情報から、末尾が“道”、“区”、“町”または“村”で終わる文字列に対して、同様の処理を行ってもよい。ただし、ノイズ除去フィルタ部105が“都”、“府”、“県”または“市”に対してのみ処理を行うことで、ノイズを抑えることができる。
ノイズ除去フィルタ部105は、ノイズ除去処理後の場所候補・地名対情報を、場所・地名対情報として記憶する。
【0055】
図13、14は、本実施形態に係る場所・地名対情報の一例を示す概略図である。
図13では、文書IDと地域名が対応付けられ、地域名とその地域名の1つ上位の地域名に対応する文書IDが対応付けられている。例えば、地域名「花見川区」は文書ID「1126445」の解説文書の見出語であり、その1つ上位の地域名「千葉市」の文書ID「230178」と対応付けられている。
図14では、所在地(文書ID)と場所関連情報が対応付けられている。例えば、場所関連情報「犢橋貝塚」は、文書ID「1126445」に対応付けられている。つまり、場所関連情報「犢橋貝塚」は、図13の「花見川区」に対応付けられている。
【0056】
図15は、本実施形態に係る情報提供システムの構成を示す概略構成図である。この情報提供システムは、図1の情報処理システムの一部である。情報提供システムは、コンピュータP3(クライアント)、情報提供サーバ2、メッセージングサーバS2、および、サービス提供サーバS1を含んで構成される。
【0057】
クライアントP3は、メール等のメッセージの取得を要求するメッセージ取得要求を情報提供サーバ2へ送信する。情報提供サーバ2は、このメッセージ取得要求に基づいて、メールサーバ等のメッセージングサーバS2に代理アクセスすることで、メッセージ(または、Twitter、SNS、ブログの情報)を取得する。なお、情報提供サーバ2は、クライアントP3が送信したメッセージ(例えば、Twitter、SNS、ブログへの書き込み情報を含むメッセージ、送信メールのメッセージ)を取得してもよい。
情報提供サーバ2は、取得したメッセージから場所関連情報を抽出し、抽出した場所関連情報に対応付けられた地域名を選択する。情報提供サーバ2は、選択した地域名が表す地域に関するサービス情報を、サービス提供サーバS1から取得する。情報提供サーバ2は、取得したサービス情報を、メッセージングサーバS2から取得したメッセージに付加する。情報提供サーバ2は、サービス情報を付加したメッセージをクライアントP3へ送信する。
【0058】
情報提供サーバ2は、制御部200、場所取得部201、場所・地名対情報記憶部202、外部サービス呼出部203、および情報付加部204を含んで構成される。
制御部200は、クライアントP3から受信したメッセージ取得要求に基づいて、メッセージングサーバS2からメッセージを取得する。制御部200は、取得したメッセージを場所取得部201に出力する。制御部200は、取得したメッセージに、後述する情報取得部204から入力されたサービス情報を付加し、サービス情報を付加したメッセージをクライアントP3へ送信する。
【0059】
場所取得部201は、制御部200から入力されたメッセージから、場所・地名対情報記憶部202が記憶する場所・地名対情報(図13参照)の場所関連情報と一致する場所関連情報を抽出する。なお、場所・地名対情報記憶部202が記憶する場所・地名対情報は、情報生成サーバ1が生成して情報提供サーバ2へ送信した情報である。
場所取得部201は、抽出した場所関連情報を外部サービス呼出部203に出力する。
【0060】
外部サービス呼出部203は、サービス地域対情報を予め記憶する。
図16は、本実施形態に係るサービス地域対情報の一例を示す概略図である。図示するようにサービス地域対情報は、外部サービスの識別情報(図16の例では、サービス提供サーバS1の所在を示すアドレス)を識別するサービス識別情報、外部サービスの種別を表す種別、および地域名の各項目の列を有している。
図16では、例えば、サービス識別情報「http://XXX」には、種別「天気予報」が対応付けられ、また、地域名「東京都」、・・・「千葉県」、「千葉市」が対応付けられている。
【0061】
図15に戻って、外部サービス呼出部203は、サービス地域対情報に基づいて、サービス識別情報と種別の組合せ毎に、場所取得部201から入力された地域名(第1の地域識別情報)と一致する地域名があるか否かを判定する。外部サービス呼出部203は、地域名が一致する場合、一致した地域名および種別を含むサービス情報要求を、サービス識別情報が示すサービス提供サーバS1へ送信する。一方、一致する地域名がない場合、外部サービス呼出部203は、場所・地名対情報に基づいて、1つ上位の地域名(第2の地域識別情報)を抽出し、抽出した地域名と一致する地域名があるか否かを判定する。外部サービス呼出部203は、地域名が一致する場合、一致した地域名および種別を含むサービス情報要求を、サービス識別情報が示すサービス提供サーバS1へ送信する。すなわち、外部サービス呼出部203は、場所取得部201が取得した場所関連情報に対応付けられた地域名の階層関係に基づいて、1つ上位の地域名を抽出し、抽出した1つ上位の地域名が表す地域に関する情報を要求する。外部サービス呼出部203は、最上位(ノード1)の地域名まで、この処理を繰り返す。
【0062】
例えば、外部サービス呼出部203は、場所取得部201から「花見川区」が入力された場合に、サービス識別情報「http://XXX」の種別「天気予報」に「花見川区」があるか否かを判定する。外部サービス呼出部203は、「花見川区」がないと判定した場合、サービス識別情報「http://XXX」の種別「天気予報」に、その1つ上位の「千葉市」があるか否かを判定する。外部サービス呼出部203は、「千葉市」がある場合には、「千葉市」の「天気予報」についてのサービス情報を要求するサービス情報要求を「http://XXX」のサービス提供サーバS1へ送信する。つまり、外部サービス呼出部203は、下位の地域名(狭い地域)から上位の地域名(広い地域)の順に、サービス情報の提供が可能であるか否かを判定し、可能である場合にはサービス情報要求を送信する。これにより、情報提供サーバ2は、より狭い地域の情報から順に、その地域に関するサービス情報を取得できる。
【0063】
情報取得部204は、外部サービス呼出部203が送信したサービス情報要求の応答として、サービス情報をサービス提供サーバS1から受信する。情報取得部204は、取得したサービス情報を制御部200に出力する。
【0064】
このように、本実施形態によれば、情報生成サーバ1(情報生成装置)では、場所地名生成部10が、地域を識別する地域名が地域の包含関係に基づいた階層関係で関係付けられた地名階層情報と、解説文書の見出語が階層関係で関係付けられたカテゴリ情報と、に基づいて、地域名に関するカテゴリ情報から場所に関連する場所関連情報を抽出し、抽出した場所関連情報と当該地域名についての地名階層情報とを対応付けた場所地名情報を生成する。これにより、情報生成サーバ1は、場所関連情報とその場所を含む地域とを関係付けることができ、さらに、場所を階層化された地域と関係付けることができる。また、情報生成サーバ1は、百科事典情報における雑多なカテゴリから、地域と場所に関する情報のみを抽出できる。つまり、情報生成サーバ1は、場所に関連する単語(ランドマークや駅など)と、単語が表すものがある都道府県市区町村または町域と、を容易に精度良く結びつけることができる。
【0065】
また、本実施形態によれば、情報提供サーバ2(情報提供装置)では、場所・地名対情報記憶部202は、場所に関連する場所関連情報と、その場所関連情報に関する地域を識別する地域名と、その地域名が地域の包含関係に基づいた階層関係で関係付けられた地名階層情報と、を対応付けた場所地名情報を記憶する。場所取得部201は、場所関連情報を取得する。外部サービス呼出部203(情報要求部)は、場所取得部201が取得した場所関連情報に対応付けられた地域名の階層関係に基づいて上位の地域名を抽出し、抽出した上位の地域名が表す地域に関する情報を要求する。制御部200(情報提供部)は、外部サービス呼出部203が要求した情報を取得して提供する。これにより、情報提供サーバ2は、ユーザが関心のある場所関連情報について、その場所を含む地域、または、その地域の上位あるいは下位の地域の情報を提供できる。また、例えば、情報提供サーバ2は、場所関連情報を含むテキスト(例えば、Twitter、SNS、ブログ、電子メールなど)をトリガに、その場所に関連する情報(例えば、天気や周辺の飲食店など)を表示するサービスを提供できる。
【0066】
なお、上記実施形態において、外部サービス呼出部203は、サービス識別情報と種別の組合せ毎に、サービス情報要求に含む地域名の最大個数を記憶してもよい。この場合、外部サービス呼出部203は、地域名の最大個数になるまでまたは最上位(ノード1)の地域名まで、サービス識別情報と種別の組合せ毎に、上位の地域名と一致する地域名があるか否かを判定する。例えば、上記実施形態において最大個数が「2」個とした場合、外部サービス呼出部203は、「千葉市」が一致した場合でも、サービス識別情報「http://XXX」の種別「天気予報」に、その1つ上位の「千葉県」があるか否かを判定する。「千葉県」があると判定した場合、外部サービス呼出部203は、一致した地域名(「千葉市」、「千葉県」)が最大数「2」個と一致すると判定し、判定処理を終了する。この場合、外部サービス呼出部203は、一致した地域名(「千葉市」、「千葉県」)を含むサービス情報要求を送信する。
【0067】
なお、上記実施形態において、外部サービス呼出部203は、下位の地域名(狭い地域)から上位の地域名(広い地域)の順に、サービス情報の提供が可能であるか否かを判定したが、本発明はこれに限らず、上位の地域名(広い地域)から下位の地域名(狭い地域)の順に、サービス情報の提供が可能であるか否かを判定してもよい。この場合、下位の地域名の候補を、ユーザに選択させてもよい。
また、外部サービス呼出部203は、場所関連情報に対応する地域名が複数ある場合に、ユーザに地域名を選択させてもよい。または、この場合、外部サービス呼出部203は、メッセージ中の他の場所関連情報に対応する地域名あるいはその個数に基づいて、地域名を選択してもよい。例えば、場所関連情報「東京ミッドタウン」に地域名「六本木」と「赤坂」が対応する場合に、メッセージ中に場所関連情報「六本木ヒルズ」(地域名「六本木」に対応)がある場合、「六本木」を選択してもよい。この場合、外部サービス呼出部203は選択した地域名のみを含むサービス情報要求を送信し、制御部200はその地域名のサービス情報をメッセージに付与してもよい。または、外部サービス呼出部203は複数の地域名を含むサービス情報要求を送信し、制御部200がメッセージ中の他の場所関連情報に対応する地域名あるいはその個数に基づいて選択した地域名が表す地域のサービス情報のみをメッセージに付加してもよい。
【0068】
なお、上述した実施形態における情報生成サーバ1または情報提供サーバ2の一部をコンピュータで実現するようにしても良い。その場合、この制御機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現しても良い。なお、ここでいう「コンピュータシステム」とは、情報生成サーバ1または情報提供サーバ2に内蔵されたコンピュータシステムであって、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでも良い。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。
また、上述した実施形態における情報生成サーバ1および情報提供サーバ2の一部、または全部を、LSI(Large Scale Integration)等の集積回路として実現しても良い。情報生成サーバ1および情報提供サーバ2の各機能ブロックは個別にプロセッサ化してもよいし、一部、または全部を集積してプロセッサ化しても良い。また、集積回路化の手法はLSIに限らず専用回路、または汎用プロセッサで実現しても良い。また、半導体技術の進歩によりLSIに代替する集積回路化の技術が出現した場合、当該技術による集積回路を用いても良い。
【0069】
以上、図面を参照してこの発明の一実施形態について詳しく説明してきたが、具体的な構成は上述のものに限られることはなく、この発明の要旨を逸脱しない範囲内において様々な設計変更等をすることが可能である。
【符号の説明】
【0070】
Y1・・・郵便番号辞書サーバ、W1・・・百科事典サービスサーバ、1・・・情報生成サーバ、2・・・情報提供サーバ、S1・・・サービス提供サーバ、N1・・・ネットワーク、P1〜P3・・・コンピュータ、D1・・・データベース、D2・・・データベース、100・・・制御部、101・・・地名解釈部、102・・・地名階層情報記憶部、10・・・場所地名生成部、103・・・場所候補抽出部、104・・・場所候補・地名対情報記憶部、105・・・ノイズ除去フィルタ部、106・・・場所・地名対情報記憶部、200・・・制御部(情報提供部)、201・・・場所取得部、202・・・場所・地名対情報記憶部、203・・・外部サービス呼出部(情報要求部)、204・・・情報付加部
【技術分野】
【0001】
本発明は、情報処理システム、情報生成装置、情報提供装置、情報生成方法、情報提供方法、情報生成プログラム、および情報提供プログラムに関する。
【背景技術】
【0002】
近年、Wikipedia(登録商標)やWordNet(登録商標)などの百科事典情報(集合知)から、意味的な関連を見つけ出す試みが進められており、非特許文献1、2に挙げるような成果が出ている。また、文書などから語句の上下関係を抽出する方法 (例えば、特許文献1)が提案されている.
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2007−11772号公報
【非特許文献】
【0004】
【非特許文献1】“上位語階層データ”、[online]、[2011年2月14日検索]、インターネット(URL: http://alaginrc.nict.go.jp/images/documents/ALAGIN_typed−hierarchies−v1_README.pdf)
【非特許文献2】“Wikipediaシソーラス”、[online]、Wikipedia研究所、[2011年2月14日検索]、インターネット(URL: http://wikipedia−lab.org/ja/index.php/Wikipedia%E3%82%B7%E3%82%BD%E3%83%BC%E3%83%A9%E3%82%B9)
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、特許文献1記載の技術では、「場所がどの市区町村にあるか」といった特定の用途には不向きである、という問題があった。
また、Wikipediaなどで抽出できる階層構造は、場所に関連する語やカテゴリの配下には雑多なカテゴリや見出語(例えば、その場所の出身人物やその場所に存在する企業)が含まれている。そのため、上位カテゴリから下位カテゴリに階層を辿ったとしても、特に町域(例えば、六本木など)を表すカテゴリを何らかのルールを持って抽出することは困難であった。また、キーワードを起点にカテゴリを上に辿ったとしても、そのカテゴリが主に場所を含むカテゴリか否かを判別することは困難であった。
このように、従来技術では、場所に関連する情報とその場所を含む地域とを関係付けることができないという問題があった。
【0006】
本発明は上記の点に鑑みてなされたものであり、場所に関連する情報とその場所を含む地域とを関係付けることができる情報処理システム、情報生成装置、情報提供装置、情報生成方法、情報提供方法、情報生成プログラム、および情報提供プログラムを提供する。
【課題を解決するための手段】
【0007】
(1)本発明は上記の課題を解決するためになされたものであり、本発明の一態様は、情報生成装置と情報提供装置とを具備する情報処理システムおいて、前記情報生成装置は、地域を識別する地域識別情報が地域の包含関係に基づいた階層関係で関係付けられた地名階層情報と、解説文書の見出語が階層関係で関係付けられたカテゴリ情報と、に基づいて、前記地域識別情報に関するカテゴリ情報から場所に関連する場所関連情報を抽出し、抽出した場所関連情報と当該地域識別情報についての地名階層情報とを対応付けた場所地名情報を生成する場所地名生成部を備え、前記情報提供装置は、前記場所関連情報を取得する場所取得部と、前記場所取得部が取得した場所関連情報に対応付けられた第1の地域識別情報の階層関係に基づいて第2の地域識別情報を抽出し、抽出した第2の地域識別情報が表す地域に関する情報を要求する情報要求部と、前記情報要求部が要求した情報を取得して提供する情報提供部と、を備えることを特徴とする情報処理システムである。
【0008】
(2)また、本発明の一態様は、地域を識別する地域識別情報が地域の包含関係に基づいた階層関係で関係付けられた地名階層情報と、解説文書の見出語が階層関係で関係付けられたカテゴリ情報と、に基づいて、前記地域識別情報に関するカテゴリ情報から場所に関連する場所関連情報を抽出し、抽出した場所関連情報と当該地域識別情報についての地名階層情報とを対応付けた場所地名情報を生成する場所地名生成部を備えることを特徴とする情報生成装置である。
【0009】
(3)また、本発明の一態様は、場所に関連する場所関連情報と、当該場所関連情報に関する地域を識別する地域識別情報と、当該地域識別情報が地域の包含関係に基づいた階層関係で関係付けられた地名階層情報と、を対応付けた場所地名情報を記憶する場所・地名対情報記憶部と、前記場所関連情報を取得する場所取得部と、前記場所取得部が取得した場所関連情報に対応付けられた第1の地域識別情報の階層関係に基づいて第2の地域識別情報を抽出し、抽出した第2の地域識別情報が表す地域に関する情報を要求する情報要求部と、前記情報要求部が要求した情報を取得して提供する情報提供部と、を備えることを特徴とする情報提供装置である。
【0010】
(4)また、本発明の一態様は、情報生成装置が、地域を識別する地域識別情報が地域の包含関係に基づいた階層関係で関係付けられた地名階層情報と、解説文書の見出語が階層関係で関係付けられたカテゴリ情報と、に基づいて、前記地域識別情報に関するカテゴリ情報から場所に関連する場所関連情報を抽出する第1の過程と、情報生成装置が、前記第1の過程で抽出した場所関連情報と当該地域識別情報についての地名階層情報とを対応付けた場所地名情報を生成する第2の過程と、を有することを特徴とする情報生成方法である。
【0011】
(5)また、本発明の一態様は、場所に関連する場所関連情報と、当該場所関連情報に関する地域を識別する地域識別情報と、当該地域識別情報が地域の包含関係に基づいた階層関係で関係付けられた地名階層情報と、を対応付けた場所地名情報を記憶する場所・地名対情報記憶部を備える情報提供装置における情報提供方法であって、前記情報提供装置が、前記場所関連情報を取得する第1の過程と、情報提供装置が、前記第1の過程で取得した場所関連情報に対応付けられた第1の地域識別情報の階層関係に基づいて第2の地域識別情報を抽出し、抽出した第2の地域識別情報が表す地域に関する情報を要求する第2の過程と、情報提供装置が、前記第2の過程で要求した情報を取得して提供する第3の過程と、を有することを特徴とする情報提供方法である。
【0012】
(6)また、本発明の一態様は、情報生成装置のコンピュータに、地域を識別する地域識別情報が地域の包含関係に基づいた階層関係で関係付けられた地名階層情報と、解説文書の見出語が階層関係で関係付けられたカテゴリ情報と、に基づいて、前記地域識別情報に関するカテゴリ情報から場所に関連する場所関連情報を抽出する抽出手段、前記抽出手段で抽出した場所関連情報と当該地域識別情報についての地名階層情報とを対応付けた場所地名情報を生成する生成手段、を実行させるための情報生成プログラムである。
【0013】
(7)また、本発明の一態様は、場所に関連する場所関連情報と、当該場所関連情報に関する地域を識別する地域識別情報と、当該地域識別情報が地域の包含関係に基づいた階層関係で関係付けられた地名階層情報と、を対応付けた場所地名情報を記憶する場所・地名対情報記憶部を備える情報提供装置のコンピュータに、前記場所関連情報を取得する場所取得手段、前記場所取得手段で取得した場所関連情報に対応付けられた第1の地域識別情報の階層関係に基づいて第2の地域識別情報を抽出し、抽出した第2の地域識別情報が表す地域に関する情報を要求する情報要求手段、前記情報要求手段で要求した情報を取得して提供する情報提供手段、を実行させるための情報提供プログラムである。
【発明の効果】
【0014】
本発明によれば、場所に関連する情報とその場所を含む地域とを関係付けることができる。
【図面の簡単な説明】
【0015】
【図1】本発明の実施形態に係る情報処理システムを示す概略図である。
【図2】本実施形態に係る住所一覧情報の一例を示す概略図である。
【図3】本実施形態に係る百科事典情報の解説文書の一例を示す概略図である。
【図4】本実施形態に係る百科事典情報のカテゴリ情報の一例を示す概略図である。
【図5】本実施形態に係る情報生成サーバの構成を示す概略構成図である。
【図6】本実施形態に係る情報生成サーバの動作の一例を表すシーケンス図である。
【図7】本実施形態に係る住所一覧情報と地名階層情報との関係の一例を示す概略図である。
【図8】本実施形態に係る地名抽出処理を表す概略図である。
【図9】本実施形態に係る町域名連結処理を表す概略図である。
【図10】本実施形態に係る地名解釈部の処理の一例を示す概略図である。
【図11】本実施形態に係るリスト追加処理を説明する説明図である。
【図12】本実施形態に係る場所候補・地名対情報の生成処理の一例を示す概念図である。
【図13】本実施形態に係る場所・地名対情報の一部の一例を示す概略図である。
【図14】本実施形態に係る場所・地名対情報の別の一部の一例を示す概略図である。
【図15】本実施形態に係る情報提供サーバの構成を示す概略構成図である。
【図16】本実施形態に係るサービス地域対情報の一例を示す概略図である。
【発明を実施するための形態】
【0016】
以下、図面を参照しながら本発明の実施形態について詳しく説明する。
図1は、本発明の実施形態に係る情報処理システムを示す概略図である。
この図において、郵便番号辞書サーバY1、百科事典サービス(例えば、Wikipedia;登録商標)サーバW1、情報生成サーバ1、情報提供サーバ2、およびサービス提供サーバS1が、ネットワークN1を介して接続されている。
【0017】
郵便番号辞書(例えば、日本郵政(登録商標)の郵便番号辞書)サーバY1のデータベースD1には、住所一覧情報(図2)が記憶されている。この住所一覧情報は、管理者がコンピュータP1を用いて更新する情報であり、「郵便番号」、「都道府県名」、「市区町村名」、「町域名」が対応付けられた情報である。
【0018】
百科事典サービスサーバW1のデータベースD2には、百科事典情報(図3)が記憶されている。この百科事典情報は、ユーザが、ネットワークN1に接続されたコンピュータP2を用いて更新する情報であり、人類の知識の及ぶ分野の事柄について、辞書の形式に準じて項目(見出語)を立てて配列し、解説を加えた情報(集合知)である。具体的には、百科事典情報は、見出語(図3では「花見川区」)毎に、その見出語の解説文書が対応付けられた情報である。また、見出語の一部は、ユーザにより、カテゴリ情報として階層関係で関係付けられている(図4では、「千葉市」(上位カテゴリ)と「花見川区」(下位カテゴリ))。
【0019】
情報生成サーバ1は、データベースD1の住所一覧情報を取得し、地域名(例えば、町域名)とその地域名の地域が含まれる地域の地域名(例えば、市区町村名)を階層化する。つまり、情報生成サーバ1は、狭い地域を下位とし、その地域を含む広い地域を上位として階層化することで、地域の包含関係に基づいた階層化を行う。
情報生成サーバ1は、階層化した地域名の情報(地名階層情報)の地域名を選択し、選択した地域名が表す地域に対応するカテゴリのカテゴリ情報をデータベースD2から取得する。情報生成サーバ1は、取得したカテゴリ情報から下位カテゴリを表す情報(項目とも称す)を抽出し、抽出した項目から場所に関連する情報である場所関連情報を抽出する。情報生成サーバ1は、すべての地域名について場所関連情報の抽出を試みる。情報生成サーバ1は、場所関連情報を地名階層情報の地域名各々に対応付けた場所・地名対情報を生成する。
【0020】
これにより、情報生成サーバ1は、場所関連情報とその場所を含む地域とを関係付けることができ、さらに、場所を階層化された地域と関係付けることができる。また、情報生成サーバ1は、百科事典情報における雑多なカテゴリから、地域と場所に関する情報のみを抽出できる。つまり、情報生成サーバ1は、場所に関連する単語(ランドマークや駅など)と、単語が表すものがある都道府県市区町村または町域と、を容易に精度良く結びつけることができる。情報生成サーバ1は、生成した場所・地名対情報を情報提供サーバ2に送信する。
【0021】
情報提供サーバ2は、情報生成サーバ1から受信した場所・地名対情報をデータベースに記憶する。情報提供サーバ2は、ユーザ操作によってコンピュータP3が送信した情報に基づいて、通信メッセージ(例えば、検索キーワードや入力情報、またはメール文書)を取得する。情報提供サーバ2は、通信メッセージから場所関連情報を抽出し、抽出した場所関連情報と記憶する場所・地名対情報に基づいて、地域名を選択する。情報提供サーバ2は、選択した地域名に関するサービス情報を、サービス提供サーバS1から取得する。情報提供サーバ2は、取得したサービス情報を、コンピュータP3が送信した情報、または、その情報の応答情報に付加し、コンピュータP3に送信する。
例えば、情報提供サーバ2は、コンピュータP3が送信した検索キーワードから「六本木ヒルズ」という場所関連情報を抽出した場合、その場所関連情報を対応付けられた地域名「六本木」を抽出する。情報提供サーバ2は、「六本木」より上位の地域名の「港区」を選択し、サービス提供サーバS1から「港区」の天気予報情報を取得する。
【0022】
情報提供サーバ2は、検索結果情報に「港区」の天気予報情報を付加し、コンピュータP3に送信する。なお、サービス提供サーバS1は、「六本木」のような狭い地域単位での天気予報情報を提供せず、それより広い地域(「港区」)での天気予報を提供する。
つまり、情報提供サーバ2は、ユーザが関心のある場所関連情報について、その場所を含む地域、または、その地域の上位あるいは下位の地域の情報を提供できる。また、例えば、情報提供サーバ2は、場所関連情報を含むテキスト(例えば、Twitter(登録商標)、SNS、ブログ、電子メールなど)をトリガに、その場所に関連する情報(例えば、天気や周辺の飲食店など)を表示するサービスを提供できる。
【0023】
図2は、本実施形態に係る住所一覧情報の一例を示す概略図である。図示するように住所一覧情報は、各行に住所情報(レコード)を有する。住所情報は、郵便番号、都道府県名(カタカナ)、市区町村名(カタカナ)、町域名(カタカナ)、都道府県名、市区町村名、町域名の各項目(フィールド)を含んでいる。各項目は、「,」(コンマ)で区切られている。市区町村名のフィールドは、市名(政令指定都市を除く)、政令指定都市名+区名(政令指令都市名と区名が結合されたもの)、郡名+町村名(郡名と町村名が結合されたもの)、または区(東京23区)を表す文字列である。町域名のフィールドは丁目や大規模ビルが含まれることがある。
【0024】
例えば、図2の1行目の住所情報は、郵便番号が「262−0019」、都道府県名が「千葉県」、市区町村名が「千葉市花見川区」、町域名が「朝日ヶ丘」であることを表す。ここで、「千葉市」は政令指定都市であるので、市名「千葉市」と区名「花見川区」が結合されている。例えば、図2の2行目の住所情報は、郵便番号が「343−0114」、都道府県名が「埼玉県」、市区町村名が「北葛飾郡松伏町」、町域名が「ゆめみ野東」であることを表す。ここで、「北葛飾郡松伏町」は、郡名「北葛飾郡」と町村名「松伏町」が結合されている。
【0025】
図3は、本実施形態に係る百科事典情報の解説文書の一例を示す概略図である。この図は、見出語「花見川区」の解説文書を、HTML形式で表示したものを表している。符号m1を付した見出語「花見川区」は、図3の解説文書による解説対象の見出語である。符号m2を付した部分は、解説文書の目次である。この目次に例示されるように、地域名を見出語とする解説文書には、交通機関(駅、バス停、道名、インターチェンジ等)、施設、教育施設(学校)、史跡等が含まれている。なお、解説文書は、文書IDで識別される(例えば、花見川区の文書IDは「1126445」)。
解説文書において、下線を引いた単語は、他の解説文書による解説対象の見出語(文中見出語という)であり、ハイパーリンクが付されている。例えば、符号m2を付した文中見出語「大賀ハス」をユーザがクリックすると、「大賀ハス」を見出語とした解説文書が表示される。
【0026】
図4は、本実施形態に係る百科事典情報のカテゴリ情報の一例を示す概略図である。この図は、地域名「千葉市」が表す地域に対応するカテゴリのカテゴリ情報を、HTML形式で表示したものを表している。符号m3を付した見出語「Category:千葉市」は、地域名「千葉市」が表す地域に対応するカテゴリであることを示す。符号m4を付した「千葉県>千葉県の市区町村>千葉市」は、「千葉県」が「千葉県の市区町村」および「千葉市」の上位カテゴリであり、「千葉県の市区町村」が「千葉県」の下位カテゴリおよび「千葉市」の上位カテゴリであることを示す。
【0027】
符号m5を付した破線の四角で囲った領域内の情報は、「千葉市」の下位カテゴリの一覧情報である。この一覧情報の各単語が「千葉市」の下位カテゴリを表す情報(項目。例えば、「千葉市の区」やその下位カテゴリの「花見川区」)である。すなわち、カテゴリ情報は、ユーザが見出語について階層関係を付した情報である。図4に示すように、項目には、画像情報や市長、スポーツに関する情報等の雑多な情報が含まれている。
符号m6を付した破線の四角で囲った領域内の情報は、地域名「千葉市」が表す地域に対応するカテゴリに含まれる見出語(項目、場所候補情報)の一覧情報である。この見出語には、場所関連情報が含まれている。
【0028】
図5は、本実施形態に係る情報生成サーバ1の構成を示す概略構成図である。この図において、情報生成サーバ1は、制御部100、地名解釈部101、地名階層情報記憶部102、および、場所地名生成部10を含んで構成される。場所地名生成部10は、場所候補抽出部103、場所候補・地名対情報記憶部104、ノイズ除去フィルタ部105、および、場所・地名対情報記憶部106を含んで構成される。
【0029】
制御部100は、情報生成サーバ1の各部を制御する。
地名解釈部101は、データベースD1から取得した住所一覧情報の地域名を階層化することで地名階層情報を生成する。地名解釈部101は、生成した地名階層情報を、地名階層情報記憶部102に記憶させる。
【0030】
場所候補抽出部103は、データベースD2から取得した百科事典情報のカテゴリ情報と、地名階層情報記憶部102が記憶している地名階層情報と、に基づいて、場所候補・地名対情報を生成する。場所候補・地名対情報は、階層化された地域名各々に、カテゴリ情報中の場所関連情報の候補である場所候補情報が対応付けられた情報である。
場所候補抽出部103は、生成した場所候補・地名対情報を、場所候補・地名対情報記憶部104に記憶させる。
【0031】
ノイズ除去フィルタ部105は、場所候補・地名対情報記憶部104が記憶している場所候補・地名対情報の場所候補情報から、場所に関連する単語として不適当な場所候補情報を削除する。また、ノイズ除去フィルタ部105は、場所候補・地名対情報の場所候補情報に基づいて、場所に関連する単語として適当な単語を生成して、地名階層情報の地域名に対応付ける。ノイズ除去フィルタ部105は、これらの処理(ノイズ除去処理という)を施した後の情報(場所・地名対情報という)を、場所・地名対情報記憶部106に記憶させる。つまり、場所・地名対情報は、階層化された地域名各々に、場所に関連する単語として適当な単語(場所関連情報)が対応付けられた情報である。
【0032】
図6は、本実施形態に係る情報生成サーバ1の動作の一例を表すシーケンス図である。
(ステップS111)制御部100は、郵便番号辞書サーバY1と通信してデータベースD1の住所一覧情報を受信し、受信した住所一覧情報を地名解釈部101に出力する。その後、ステップS112に進む。
(ステップS112)地名解釈部101は、ステップS111で入力された住所一覧情報に基づいて、住所一覧情報の地域名を階層化することで地名階層情報を生成する。ここで、地名解釈部101は、上位層から下位層への順序(ノード1、2、2−1、3の順序)に、次に示すノードで階層化する。
【0033】
(ノード1)都道府県名
(ノード2)市区(東京23区の区)町村名
(ノード2−1)区(政令指令都市の区)名
(ノード3)町域名
【0034】
ここで、ノード2−1は、ノード2の市区町村名が政令指令都市名の場合にのみ生成されるノードである。また、最下位のノード(ノード3)以外の各ノード1、2、2−1は1または複数の子ノードを持ち、最上位のノード(ノード1)以外の各ノード2、3、4は1つの親ノードを持つ。
【0035】
図7は、本実施形態に係る住所一覧情報と地名階層情報との関係の一例を示す概略図である。この図において、符号I11を付した破線で囲まれた情報は、住所一覧情報I11である。例えば、住所一覧情報I11の5行目の住所情報は、都道府県名が「千葉県」、市区町村名が「千葉市花見川区」、町域名が「朝日ヶ丘」である。
符号I12、I13を付した破線で囲まれた情報は、それぞれ地名階層情報I12、I13である。地名階層情報I12はノード2の市区町村名が政令指令都市名である場合のものであり、地名階層情報I13はノード2の市区町村名が政令指令都市名でない場合のものである。例えば、地名階層情報I12は、ノード1が「東京都」、ノード2が「千代田区」、ノード3が「飯田橋」である。
【0036】
以下、ステップS112における地名解釈部101の処理の詳細について説明する。地名解釈部101は、次の手順(a)〜(e)の順に処理を行う。
【0037】
(a)地名解釈部101は、住所一覧情報から住所情報を1行ずつ読み込む。ここで、地名解釈部101は、住所情報から都道府県名、市区町村名、町域名のフィールドを抽出する(地名抽出処理という)。百科事典情報の見出語(一部は、カテゴリとして用いられる)は、(半角カタカナではなく)都道府県名、市区町村名、町域名の(漢字を含む)用語が用いられる。地名解釈部101は、このフィールドを抽出することで、百科事典情報の見出語と同じ用語を抽出できる。
図8は、本実施形態に係る地名抽出処理を表す概略図である。この図は、地名解釈部101が、住所一覧情報から都道府県名、市区町村名、町域名を抽出することを表す。例えば、地名解釈部101は、1行目の住所情報から都道府県名「東京都」、市区町村名「千代田区」、町域名「三崎町」を抽出することを表す。
【0038】
地名抽出処理において、地名解釈部101は、郵便番号が同じで町域名が異なる住所情報がある場合には、レコードの順序に従って町域名を連結する(町域名連結処理という)。
図9は、本実施形態に係る町域名連結処理を表す概略図である。この図の住所一覧情報では、町域名の文字数が一定数を越えるものが、複数行に跨って記述されている。例えば、実際の町域名「四町目(出水通油小路西入、出水通堀川東入、出水通堀川東入下る、出水通東堀川東入、下立売通堀川東入、下立売通堀川東入上る、下立売通堀川東入下る、東堀川通下立売上る、東堀川通出水下る)」が、1行目の「四町目(出水通油小路西入、出水通堀川東入、出水通堀川東入」、2行目の「下る、出水通東堀川東入、下立売通堀川東入、下立売通堀川東入上る、下立売通」、3行目の「堀川東入下る、東堀川通下立売上る、東堀川通出水下る)」に跨って記述されている。
この場合、地名解釈部101は、郵便番号「602−8045」が同じ住所情報を連結し、図9に示すように、町域名を「四町目(出水通油小路西入、出水通堀川東入、出水通堀川東入下る、出水通東堀川東入、下立売通堀川東入、下立売通堀川東入上る、下立売通堀川東入下る、東堀川通下立売上る、東堀川通出水下る)」を生成する。
【0039】
(b)地名解釈部101は、抽出したレコードの町域名が正規表現“次の.+を除く”にマッチしたとき、マッチした文字列を削除する(削除後の町域名を抽出町域名という)。なお、「.+」は、任意の文字(.)に1文字以上マッチ(+)することを示す。地名解釈部101は、文字列を削除したレコードより後に連続するレコードから、文字列を削除したレコードと都道府県名および市区町村名が一致するレコードを選択する。地名解釈部101は、選択したレコードの町域名が抽出町域名で始まる場合には、そのレコードを削除する。
【0040】
(c)地名解釈部101は、町域名が“以下に掲載がない場合”であるレコードを削除する。
(d)地名解釈部101は、町域名が正規表現“(.*)”にマッチするとき、マッチした文字列を取り除く。なお、「(.*)」は、全角括弧と全角括弧で囲まれた任意の文字列(文字列がない場合も含む)とにマッチすることを示す。
【0041】
図10は、本実施形態に係る地名解釈部101の処理の一例を示す概略図である。この図において、地名解釈部101は、符号r211を付したレコードの町域名「霞ヶ関(次のビルを除く)」の「次のビル除く」およびその文字列を削除した後の「()」(全角括弧)がマッチしたと判定し、これらの文字列を削除する。また、地名解釈部101は、符号r221、符号r231を付したレコードの町域名は、抽出町域名「霞ヶ関」と一致したと判定し、これらのレコードを削除する(無視する)。
これにより、地名解釈部101は、町域名の町域に含まれないビル等を削除することができる。なお、地名解釈部101は、レコードに削除フラグ(無視しない「0」、無視する「1」)の項目を設け、レコードを削除せずに、無視する「1」を設定してもよい。
また、例えば、地名解釈部101は、図10で符号r111を付したレコードを削除する。
【0042】
(e)地名解釈部101は、空のリストを用意し、都道府県名、市区町村名、町域名の順に次のリスト追加処理((I)〜(III))を行うことにより、都道府県−市−区−町村−町域のリストを生成する。ここで、地名解釈部101は、市区町村名について、政令指定都市を政令指定都市名と区名に分離し、また、町村名から郡名部分を除去する。
【0043】
(I)地名解釈部101は、市区町村名が正規表現“^(.+市)(.+区)$”にマッチするとき、“(.+市)”にマッチする部分文字列を市とし、(.+区)にマッチする部分文字列を区として、順にリストへ追加する。なお、「^」(ハット)は文字列の先頭でマッチすることを示し、「$」は文字列の最後でマッチすることを示す。また、「(.+市)(.+区)」は、任意の文字(.)に「市」が付加され、その後、任意の文字(.)に「区」が付加された文字にマッチすることを示す。例えば、図2の1行目の住所情報から抽出されたレコードでは、市区町村名「千葉市花見川区」のうち、「千葉市」が市として、また、「花見川区」が区としてリストへ追加される。
【0044】
(II)地名解釈部101は、市区町村名が正規表現“^(.+郡)(.+[町村])$”にマッチするときは、“(.+郡)”にマッチする部分文字列を削除し、“(.+[町村])”にマッチする部分文字列のみを、町村としてリストへ追加する。なお、「.+[町村]」は、任意の文字(.)に「町」または「村」のいずれかが付加された文字にマッチすることを示す。例えば、図2の2行目の住所情報から抽出されたレコードでは、市区町村名「北葛飾郡松伏町」のうち、「北葛飾郡」が削除されて「松伏町」が町村としてリストへ追加される。
(III)それ以外は、そのままリストへ追加する。
【0045】
図11は、本実施形態に係るリスト追加処理を説明する説明図である。この図において、1行目のレコードの市区町村名「千葉市中央区」は、リスト追加処理によって、「千葉市」と「中央区」に分けられている。また、2行目のレコードの市区町村名「北葛飾郡松伏町」は、リスト追加処理によって、「北葛飾郡」が削除されている。
また、リスト追加処理後のリスト(右図、地名階層情報)は、都道府県名、市区町村名、町域名の順に階層化されている。ここで、市区町村名が○○市××区(例えば、政令指定都市)の場合には、市区町村名が、市名、区名の順に階層化されている。すなわち、このリスト(地名階層情報)は、場所に関連する場所関連情報と、その場所関連情報に関する地域を識別する地域名と、その地域名が地域の包含関係に基づいた階層関係で関係付けられている。なお、地名解釈部101は、図13のように、地域名をIDに対応付け、地域名に対して上位(または下位)の地域名に対応するIDを対応付けた地名階層情報を生成してもよい。
【0046】
図6に戻って、上記ステップS112の後の処理について、説明をする。
(ステップS113)地名解釈部101は、上記(a)〜(e)の処理の結果、生成したリストを制御部100に出力する。なお、この地名階層情報は、RAM(地名階層情報記憶部102)に記憶される。その後、ステップS114に進む。
(ステップS114)制御部100は、ステップS113で入力された地名階層情報を場所候補抽出部103に出力する。場所候補抽出部103は、データベースD2から百科事典情報を取得する。
【0047】
場所候補抽出部103は、入力された地名階層情報から地域名(都道府県名、市区町村名(または、市名、区名)、町域名)を上位層から順に選択し、選択した地域名が表す地域に対応するカテゴリのカテゴリ情報を取得する。ここで、場所候補抽出部103は、地域名と上位の地域名と合わせた地域名(結合地域名)を生成し、生成した結合地域名が表す地域に対応するカテゴリのカテゴリ情報を取得する。例えば、場所候補抽出部103は、結合地域名として、「地域名」_(上位層の地域名)を生成する。具体的には、場所候補抽出部103は、市区町村名(または、区名)に対して、「区名」_(市名)、区名_(都道府県名)、区名の順に結合地域名を生成し、生成した結合地域名が表す地域に対応するカテゴリのカテゴリ情報を取得する。これにより、場所候補抽出部103は、地域名が重複し、百科事典情報のカテゴリ名に結合地域名が用いられる場合でも、対応するカテゴリが存在するすべての地域に対して、その地域に対応するカテゴリのカテゴリ情報を確実に取得できる。
場所候補抽出部103は、選択した地域名の文書IDを取得し、その文書IDと地域名とを対応付けて記憶する。場所候補抽出部103は、ノード2以下の地域名については、1つ上位の地域名の識別情報として、その地域名に対応する文書IDを対応付けて記憶する(図13参照)。
【0048】
場所候補抽出部103は、選択した地域名が表す地域に対応するカテゴリのカテゴリ情報からそのカテゴリに含まれる見出語(項目、場所候補情報)を抽出する。例えば、場所候補抽出部103は、地域に対応するカテゴリを含むすべてのカテゴリと、カテゴリ各々に含まれる見出語(項目)と、の対応情報を予め取得しておき、その対応情報に基づいて、選択した地域名が表す地域に対応する見出語を抽出する。ただし、本発明はこれに限らず、場所候補抽出部103は、図4のHTMLファイルを取得し、文書マッチングによって符号m6を付した破線の四角で囲った領域内の各単語(項目)を抽出してもよい。
場所候補抽出部103は、抽出した場所候補情報を文書IDに対応付けて記憶する(図14参照)。場所候補抽出部103は、これらの処理をすべての地域名に対して行うことで、場所候補・地名対情報(図13、14)を生成する。
【0049】
図12は、本実施形態に係る場所候補・地名対情報の生成処理の一例を示す概念図である。この図は、地名階層情報の地域名に対して、地域名が表す地域に対応するカテゴリを表す情報が対応付けられていることを示す。なお、項目は、矢印が示す先の情報が表すカテゴリの下位カテゴリを表す情報である。地域名の階層構造、地域名とカテゴリを表す情報、カテゴリを表す情報と項目は、それぞれ、文書IDでリンクされている。
【0050】
図6に戻って、上記ステップS116の後の処理について、説明をする。
(ステップS116)場所候補抽出部103は、ステップS115で生成した場所候補・地名対情報を制御部100に出力する。なお、この場所候補・地名対情報は、RAM(場所候補・地名対情報記憶部104)に記憶される。その後、ステップS117に進む。
(ステップS117)制御部100は、ステップS116で入力された場所候補・地名対情報をノイズ除去フィルタ部105に出力する。その後、ステップS118に進む。
【0051】
(ステップS118)ノイズ除去フィルタ部105は、次のノイズ除去処理((a)〜(f))を行うことにより、場所候補情報から場所を示すのに相応しくない情報を除去、また、場所を示すのに相応しい情報を追加する。
(a)ノイズ除去フィルタ部105は、見出語のうちsortkey(カテゴリに含まれる見出語を表示する際にソートするために使われる文字列)が「廃」、「未」、「旧」または「*」(アスタリスク)で始まっているものを除去する。これにより、ノイズ除去フィルタ部105は、現在の地域名とは異なる古い地域名などを除去することができる。
【0052】
(b)ノイズ除去フィルタ部105は、場所候補情報から、一文字でかつ曖昧なもの(正規表現“^._¥(.*¥)”にマッチするもの)を除去する(「¥」はエスケープ文字。以下、同じ)。ここで、「¥(.*¥)」は、「(」と「)」に囲まれた表現を後に呼び出すことができることを示す。
(c)ノイズ除去フィルタ部105は、場所候補情報から、ひらがなまたはカタカナのみの語でかつ曖昧なもの(正規表現“^[ぁ−んァ−ヶ−]+_¥(.*¥)$”にマッチするもの)を除去する。
【0053】
(d)ノイズ除去フィルタ部105は、場所候補情報から、「ひらがなおよびカタカナ以外の文字を2文字以上含む文字列」+“駅”で構成される文字列(駅名と言う)を選択し、抽出した駅名から末尾の“駅”を除いた文字列を抽出する。ノイズ除去フィルタ部105は、抽出した文字列に対して、駅名に対応する文書IDを対応付けて、場所・地名対情報に追加する。例えば、ノイズ除去フィルタ部105は、「東京駅」を選択して「東京」を抽出し、場所候補・地名対情報に「東京」を追加する。駅名には場所を表す単語に「駅」を付加したものが用いられることがあり、また、駅名の「駅」を省略した単語が場所を表す単語になることがある。ノイズ除去フィルタ部105は、駅名から「駅」を除いた単語を、場所を表す単語として慣用される単語を追加できる。
【0054】
(e)ノイズ除去フィルタ部105は、場所候補情報から、末尾が“都”、“府”、“県”または“市”で終わる文字列を選択する。ノイズ除去フィルタ部105は、選択した文字列から末尾の文字を除いた文字列であって、ひらがなまたはカタカナ2文字で構成されるもの以外の文字列抽出する。ノイズ除去フィルタ部105は、抽出した文字列に対して、選択した文字列に対応する文書IDを対応付けて、場所候補・地名対情報に追加する。都道府県名、市区町村名には、場所を表す単語に「都」、「府」、「県」または「市」を付加したものが用いられることがあり、また、文字列の「都」、「府」、「県」または「市」を省略した単語が場所を表す単語になることがある。ノイズ除去フィルタ部105は、「都」、「府」、「県」または「市」を除いた単語を、場所を表す単語として慣用される単語を追加できる。
なお、ノイズ除去フィルタ部105は、場所候補情報から、末尾が“道”、“区”、“町”または“村”で終わる文字列に対して、同様の処理を行ってもよい。ただし、ノイズ除去フィルタ部105が“都”、“府”、“県”または“市”に対してのみ処理を行うことで、ノイズを抑えることができる。
ノイズ除去フィルタ部105は、ノイズ除去処理後の場所候補・地名対情報を、場所・地名対情報として記憶する。
【0055】
図13、14は、本実施形態に係る場所・地名対情報の一例を示す概略図である。
図13では、文書IDと地域名が対応付けられ、地域名とその地域名の1つ上位の地域名に対応する文書IDが対応付けられている。例えば、地域名「花見川区」は文書ID「1126445」の解説文書の見出語であり、その1つ上位の地域名「千葉市」の文書ID「230178」と対応付けられている。
図14では、所在地(文書ID)と場所関連情報が対応付けられている。例えば、場所関連情報「犢橋貝塚」は、文書ID「1126445」に対応付けられている。つまり、場所関連情報「犢橋貝塚」は、図13の「花見川区」に対応付けられている。
【0056】
図15は、本実施形態に係る情報提供システムの構成を示す概略構成図である。この情報提供システムは、図1の情報処理システムの一部である。情報提供システムは、コンピュータP3(クライアント)、情報提供サーバ2、メッセージングサーバS2、および、サービス提供サーバS1を含んで構成される。
【0057】
クライアントP3は、メール等のメッセージの取得を要求するメッセージ取得要求を情報提供サーバ2へ送信する。情報提供サーバ2は、このメッセージ取得要求に基づいて、メールサーバ等のメッセージングサーバS2に代理アクセスすることで、メッセージ(または、Twitter、SNS、ブログの情報)を取得する。なお、情報提供サーバ2は、クライアントP3が送信したメッセージ(例えば、Twitter、SNS、ブログへの書き込み情報を含むメッセージ、送信メールのメッセージ)を取得してもよい。
情報提供サーバ2は、取得したメッセージから場所関連情報を抽出し、抽出した場所関連情報に対応付けられた地域名を選択する。情報提供サーバ2は、選択した地域名が表す地域に関するサービス情報を、サービス提供サーバS1から取得する。情報提供サーバ2は、取得したサービス情報を、メッセージングサーバS2から取得したメッセージに付加する。情報提供サーバ2は、サービス情報を付加したメッセージをクライアントP3へ送信する。
【0058】
情報提供サーバ2は、制御部200、場所取得部201、場所・地名対情報記憶部202、外部サービス呼出部203、および情報付加部204を含んで構成される。
制御部200は、クライアントP3から受信したメッセージ取得要求に基づいて、メッセージングサーバS2からメッセージを取得する。制御部200は、取得したメッセージを場所取得部201に出力する。制御部200は、取得したメッセージに、後述する情報取得部204から入力されたサービス情報を付加し、サービス情報を付加したメッセージをクライアントP3へ送信する。
【0059】
場所取得部201は、制御部200から入力されたメッセージから、場所・地名対情報記憶部202が記憶する場所・地名対情報(図13参照)の場所関連情報と一致する場所関連情報を抽出する。なお、場所・地名対情報記憶部202が記憶する場所・地名対情報は、情報生成サーバ1が生成して情報提供サーバ2へ送信した情報である。
場所取得部201は、抽出した場所関連情報を外部サービス呼出部203に出力する。
【0060】
外部サービス呼出部203は、サービス地域対情報を予め記憶する。
図16は、本実施形態に係るサービス地域対情報の一例を示す概略図である。図示するようにサービス地域対情報は、外部サービスの識別情報(図16の例では、サービス提供サーバS1の所在を示すアドレス)を識別するサービス識別情報、外部サービスの種別を表す種別、および地域名の各項目の列を有している。
図16では、例えば、サービス識別情報「http://XXX」には、種別「天気予報」が対応付けられ、また、地域名「東京都」、・・・「千葉県」、「千葉市」が対応付けられている。
【0061】
図15に戻って、外部サービス呼出部203は、サービス地域対情報に基づいて、サービス識別情報と種別の組合せ毎に、場所取得部201から入力された地域名(第1の地域識別情報)と一致する地域名があるか否かを判定する。外部サービス呼出部203は、地域名が一致する場合、一致した地域名および種別を含むサービス情報要求を、サービス識別情報が示すサービス提供サーバS1へ送信する。一方、一致する地域名がない場合、外部サービス呼出部203は、場所・地名対情報に基づいて、1つ上位の地域名(第2の地域識別情報)を抽出し、抽出した地域名と一致する地域名があるか否かを判定する。外部サービス呼出部203は、地域名が一致する場合、一致した地域名および種別を含むサービス情報要求を、サービス識別情報が示すサービス提供サーバS1へ送信する。すなわち、外部サービス呼出部203は、場所取得部201が取得した場所関連情報に対応付けられた地域名の階層関係に基づいて、1つ上位の地域名を抽出し、抽出した1つ上位の地域名が表す地域に関する情報を要求する。外部サービス呼出部203は、最上位(ノード1)の地域名まで、この処理を繰り返す。
【0062】
例えば、外部サービス呼出部203は、場所取得部201から「花見川区」が入力された場合に、サービス識別情報「http://XXX」の種別「天気予報」に「花見川区」があるか否かを判定する。外部サービス呼出部203は、「花見川区」がないと判定した場合、サービス識別情報「http://XXX」の種別「天気予報」に、その1つ上位の「千葉市」があるか否かを判定する。外部サービス呼出部203は、「千葉市」がある場合には、「千葉市」の「天気予報」についてのサービス情報を要求するサービス情報要求を「http://XXX」のサービス提供サーバS1へ送信する。つまり、外部サービス呼出部203は、下位の地域名(狭い地域)から上位の地域名(広い地域)の順に、サービス情報の提供が可能であるか否かを判定し、可能である場合にはサービス情報要求を送信する。これにより、情報提供サーバ2は、より狭い地域の情報から順に、その地域に関するサービス情報を取得できる。
【0063】
情報取得部204は、外部サービス呼出部203が送信したサービス情報要求の応答として、サービス情報をサービス提供サーバS1から受信する。情報取得部204は、取得したサービス情報を制御部200に出力する。
【0064】
このように、本実施形態によれば、情報生成サーバ1(情報生成装置)では、場所地名生成部10が、地域を識別する地域名が地域の包含関係に基づいた階層関係で関係付けられた地名階層情報と、解説文書の見出語が階層関係で関係付けられたカテゴリ情報と、に基づいて、地域名に関するカテゴリ情報から場所に関連する場所関連情報を抽出し、抽出した場所関連情報と当該地域名についての地名階層情報とを対応付けた場所地名情報を生成する。これにより、情報生成サーバ1は、場所関連情報とその場所を含む地域とを関係付けることができ、さらに、場所を階層化された地域と関係付けることができる。また、情報生成サーバ1は、百科事典情報における雑多なカテゴリから、地域と場所に関する情報のみを抽出できる。つまり、情報生成サーバ1は、場所に関連する単語(ランドマークや駅など)と、単語が表すものがある都道府県市区町村または町域と、を容易に精度良く結びつけることができる。
【0065】
また、本実施形態によれば、情報提供サーバ2(情報提供装置)では、場所・地名対情報記憶部202は、場所に関連する場所関連情報と、その場所関連情報に関する地域を識別する地域名と、その地域名が地域の包含関係に基づいた階層関係で関係付けられた地名階層情報と、を対応付けた場所地名情報を記憶する。場所取得部201は、場所関連情報を取得する。外部サービス呼出部203(情報要求部)は、場所取得部201が取得した場所関連情報に対応付けられた地域名の階層関係に基づいて上位の地域名を抽出し、抽出した上位の地域名が表す地域に関する情報を要求する。制御部200(情報提供部)は、外部サービス呼出部203が要求した情報を取得して提供する。これにより、情報提供サーバ2は、ユーザが関心のある場所関連情報について、その場所を含む地域、または、その地域の上位あるいは下位の地域の情報を提供できる。また、例えば、情報提供サーバ2は、場所関連情報を含むテキスト(例えば、Twitter、SNS、ブログ、電子メールなど)をトリガに、その場所に関連する情報(例えば、天気や周辺の飲食店など)を表示するサービスを提供できる。
【0066】
なお、上記実施形態において、外部サービス呼出部203は、サービス識別情報と種別の組合せ毎に、サービス情報要求に含む地域名の最大個数を記憶してもよい。この場合、外部サービス呼出部203は、地域名の最大個数になるまでまたは最上位(ノード1)の地域名まで、サービス識別情報と種別の組合せ毎に、上位の地域名と一致する地域名があるか否かを判定する。例えば、上記実施形態において最大個数が「2」個とした場合、外部サービス呼出部203は、「千葉市」が一致した場合でも、サービス識別情報「http://XXX」の種別「天気予報」に、その1つ上位の「千葉県」があるか否かを判定する。「千葉県」があると判定した場合、外部サービス呼出部203は、一致した地域名(「千葉市」、「千葉県」)が最大数「2」個と一致すると判定し、判定処理を終了する。この場合、外部サービス呼出部203は、一致した地域名(「千葉市」、「千葉県」)を含むサービス情報要求を送信する。
【0067】
なお、上記実施形態において、外部サービス呼出部203は、下位の地域名(狭い地域)から上位の地域名(広い地域)の順に、サービス情報の提供が可能であるか否かを判定したが、本発明はこれに限らず、上位の地域名(広い地域)から下位の地域名(狭い地域)の順に、サービス情報の提供が可能であるか否かを判定してもよい。この場合、下位の地域名の候補を、ユーザに選択させてもよい。
また、外部サービス呼出部203は、場所関連情報に対応する地域名が複数ある場合に、ユーザに地域名を選択させてもよい。または、この場合、外部サービス呼出部203は、メッセージ中の他の場所関連情報に対応する地域名あるいはその個数に基づいて、地域名を選択してもよい。例えば、場所関連情報「東京ミッドタウン」に地域名「六本木」と「赤坂」が対応する場合に、メッセージ中に場所関連情報「六本木ヒルズ」(地域名「六本木」に対応)がある場合、「六本木」を選択してもよい。この場合、外部サービス呼出部203は選択した地域名のみを含むサービス情報要求を送信し、制御部200はその地域名のサービス情報をメッセージに付与してもよい。または、外部サービス呼出部203は複数の地域名を含むサービス情報要求を送信し、制御部200がメッセージ中の他の場所関連情報に対応する地域名あるいはその個数に基づいて選択した地域名が表す地域のサービス情報のみをメッセージに付加してもよい。
【0068】
なお、上述した実施形態における情報生成サーバ1または情報提供サーバ2の一部をコンピュータで実現するようにしても良い。その場合、この制御機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現しても良い。なお、ここでいう「コンピュータシステム」とは、情報生成サーバ1または情報提供サーバ2に内蔵されたコンピュータシステムであって、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでも良い。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。
また、上述した実施形態における情報生成サーバ1および情報提供サーバ2の一部、または全部を、LSI(Large Scale Integration)等の集積回路として実現しても良い。情報生成サーバ1および情報提供サーバ2の各機能ブロックは個別にプロセッサ化してもよいし、一部、または全部を集積してプロセッサ化しても良い。また、集積回路化の手法はLSIに限らず専用回路、または汎用プロセッサで実現しても良い。また、半導体技術の進歩によりLSIに代替する集積回路化の技術が出現した場合、当該技術による集積回路を用いても良い。
【0069】
以上、図面を参照してこの発明の一実施形態について詳しく説明してきたが、具体的な構成は上述のものに限られることはなく、この発明の要旨を逸脱しない範囲内において様々な設計変更等をすることが可能である。
【符号の説明】
【0070】
Y1・・・郵便番号辞書サーバ、W1・・・百科事典サービスサーバ、1・・・情報生成サーバ、2・・・情報提供サーバ、S1・・・サービス提供サーバ、N1・・・ネットワーク、P1〜P3・・・コンピュータ、D1・・・データベース、D2・・・データベース、100・・・制御部、101・・・地名解釈部、102・・・地名階層情報記憶部、10・・・場所地名生成部、103・・・場所候補抽出部、104・・・場所候補・地名対情報記憶部、105・・・ノイズ除去フィルタ部、106・・・場所・地名対情報記憶部、200・・・制御部(情報提供部)、201・・・場所取得部、202・・・場所・地名対情報記憶部、203・・・外部サービス呼出部(情報要求部)、204・・・情報付加部
【特許請求の範囲】
【請求項1】
情報生成装置と情報提供装置とを具備する情報処理システムおいて、
前記情報生成装置は、
地域を識別する地域識別情報が地域の包含関係に基づいた階層関係で関係付けられた地名階層情報と、解説文書の見出語が階層関係で関係付けられたカテゴリ情報と、に基づいて、前記地域識別情報に関するカテゴリ情報から場所に関連する場所関連情報を抽出し、抽出した場所関連情報と当該地域識別情報についての地名階層情報とを対応付けた場所地名情報を生成する場所地名生成部を備え、
前記情報提供装置は、
前記場所関連情報を取得する場所取得部と、
前記場所取得部が取得した場所関連情報に対応付けられた第1の地域識別情報の階層関係に基づいて第2の地域識別情報を抽出し、抽出した第2の地域識別情報が表す地域に関する情報を要求する情報要求部と、
前記情報要求部が要求した情報を取得して提供する情報提供部と、
を備えることを特徴とする情報処理システム。
【請求項2】
地域を識別する地域識別情報が地域の包含関係に基づいた階層関係で関係付けられた地名階層情報と、解説文書の見出語が階層関係で関係付けられたカテゴリ情報と、に基づいて、前記地域識別情報に関するカテゴリ情報から場所に関連する場所関連情報を抽出し、抽出した場所関連情報と当該地域識別情報についての地名階層情報とを対応付けた場所地名情報を生成する場所地名生成部を備えることを特徴とする情報生成装置。
【請求項3】
場所に関連する場所関連情報と、当該場所関連情報に関する地域を識別する地域識別情報と、当該地域識別情報が地域の包含関係に基づいた階層関係で関係付けられた地名階層情報と、を対応付けた場所地名情報を記憶する場所・地名対情報記憶部と、
前記場所関連情報を取得する場所取得部と、
前記場所取得部が取得した場所関連情報に対応付けられた第1の地域識別情報の階層関係に基づいて第2の地域識別情報を抽出し、抽出した第2の地域識別情報が表す地域に関する情報を要求する情報要求部と、
前記情報要求部が要求した情報を取得して提供する情報提供部と、
を備えることを特徴とする情報提供装置。
【請求項4】
情報生成装置が、地域を識別する地域識別情報が地域の包含関係に基づいた階層関係で関係付けられた地名階層情報と、解説文書の見出語が階層関係で関係付けられたカテゴリ情報と、に基づいて、前記地域識別情報に関するカテゴリ情報から場所に関連する場所関連情報を抽出する第1の過程と、
情報生成装置が、前記第1の過程で抽出した場所関連情報と当該地域識別情報についての地名階層情報とを対応付けた場所地名情報を生成する第2の過程と、
を有することを特徴とする情報生成方法。
【請求項5】
場所に関連する場所関連情報と、当該場所関連情報に関する地域を識別する地域識別情報と、当該地域識別情報が地域の包含関係に基づいた階層関係で関係付けられた地名階層情報と、を対応付けた場所地名情報を記憶する場所・地名対情報記憶部を備える情報提供装置における情報提供方法であって、
前記情報提供装置が、前記場所関連情報を取得する第1の過程と、
情報提供装置が、前記第1の過程で取得した場所関連情報に対応付けられた第1の地域識別情報の階層関係に基づいて第2の地域識別情報を抽出し、抽出した第2の地域識別情報が表す地域に関する情報を要求する第2の過程と、
情報提供装置が、前記第2の過程で要求した情報を取得して提供する第3の過程と、
を有することを特徴とする情報提供方法。
【請求項6】
情報生成装置のコンピュータに、
地域を識別する地域識別情報が地域の包含関係に基づいた階層関係で関係付けられた地名階層情報と、解説文書の見出語が階層関係で関係付けられたカテゴリ情報と、に基づいて、前記地域識別情報に関するカテゴリ情報から場所に関連する場所関連情報を抽出する抽出手段、
前記抽出手段で抽出した場所関連情報と当該地域識別情報についての地名階層情報とを対応付けた場所地名情報を生成する生成手段、
を実行させるための情報生成プログラム。
【請求項7】
場所に関連する場所関連情報と、当該場所関連情報に関する地域を識別する地域識別情報と、当該地域識別情報が地域の包含関係に基づいた階層関係で関係付けられた地名階層情報と、を対応付けた場所地名情報を記憶する場所・地名対情報記憶部を備える情報提供装置のコンピュータに、
前記場所関連情報を取得する場所取得手段、
前記場所取得手段で取得した場所関連情報に対応付けられた第1の地域識別情報の階層関係に基づいて第2の地域識別情報を抽出し、抽出した第2の地域識別情報が表す地域に関する情報を要求する情報要求手段、
前記情報要求手段で要求した情報を取得して提供する情報提供手段、
を実行させるための情報提供プログラム。
【請求項1】
情報生成装置と情報提供装置とを具備する情報処理システムおいて、
前記情報生成装置は、
地域を識別する地域識別情報が地域の包含関係に基づいた階層関係で関係付けられた地名階層情報と、解説文書の見出語が階層関係で関係付けられたカテゴリ情報と、に基づいて、前記地域識別情報に関するカテゴリ情報から場所に関連する場所関連情報を抽出し、抽出した場所関連情報と当該地域識別情報についての地名階層情報とを対応付けた場所地名情報を生成する場所地名生成部を備え、
前記情報提供装置は、
前記場所関連情報を取得する場所取得部と、
前記場所取得部が取得した場所関連情報に対応付けられた第1の地域識別情報の階層関係に基づいて第2の地域識別情報を抽出し、抽出した第2の地域識別情報が表す地域に関する情報を要求する情報要求部と、
前記情報要求部が要求した情報を取得して提供する情報提供部と、
を備えることを特徴とする情報処理システム。
【請求項2】
地域を識別する地域識別情報が地域の包含関係に基づいた階層関係で関係付けられた地名階層情報と、解説文書の見出語が階層関係で関係付けられたカテゴリ情報と、に基づいて、前記地域識別情報に関するカテゴリ情報から場所に関連する場所関連情報を抽出し、抽出した場所関連情報と当該地域識別情報についての地名階層情報とを対応付けた場所地名情報を生成する場所地名生成部を備えることを特徴とする情報生成装置。
【請求項3】
場所に関連する場所関連情報と、当該場所関連情報に関する地域を識別する地域識別情報と、当該地域識別情報が地域の包含関係に基づいた階層関係で関係付けられた地名階層情報と、を対応付けた場所地名情報を記憶する場所・地名対情報記憶部と、
前記場所関連情報を取得する場所取得部と、
前記場所取得部が取得した場所関連情報に対応付けられた第1の地域識別情報の階層関係に基づいて第2の地域識別情報を抽出し、抽出した第2の地域識別情報が表す地域に関する情報を要求する情報要求部と、
前記情報要求部が要求した情報を取得して提供する情報提供部と、
を備えることを特徴とする情報提供装置。
【請求項4】
情報生成装置が、地域を識別する地域識別情報が地域の包含関係に基づいた階層関係で関係付けられた地名階層情報と、解説文書の見出語が階層関係で関係付けられたカテゴリ情報と、に基づいて、前記地域識別情報に関するカテゴリ情報から場所に関連する場所関連情報を抽出する第1の過程と、
情報生成装置が、前記第1の過程で抽出した場所関連情報と当該地域識別情報についての地名階層情報とを対応付けた場所地名情報を生成する第2の過程と、
を有することを特徴とする情報生成方法。
【請求項5】
場所に関連する場所関連情報と、当該場所関連情報に関する地域を識別する地域識別情報と、当該地域識別情報が地域の包含関係に基づいた階層関係で関係付けられた地名階層情報と、を対応付けた場所地名情報を記憶する場所・地名対情報記憶部を備える情報提供装置における情報提供方法であって、
前記情報提供装置が、前記場所関連情報を取得する第1の過程と、
情報提供装置が、前記第1の過程で取得した場所関連情報に対応付けられた第1の地域識別情報の階層関係に基づいて第2の地域識別情報を抽出し、抽出した第2の地域識別情報が表す地域に関する情報を要求する第2の過程と、
情報提供装置が、前記第2の過程で要求した情報を取得して提供する第3の過程と、
を有することを特徴とする情報提供方法。
【請求項6】
情報生成装置のコンピュータに、
地域を識別する地域識別情報が地域の包含関係に基づいた階層関係で関係付けられた地名階層情報と、解説文書の見出語が階層関係で関係付けられたカテゴリ情報と、に基づいて、前記地域識別情報に関するカテゴリ情報から場所に関連する場所関連情報を抽出する抽出手段、
前記抽出手段で抽出した場所関連情報と当該地域識別情報についての地名階層情報とを対応付けた場所地名情報を生成する生成手段、
を実行させるための情報生成プログラム。
【請求項7】
場所に関連する場所関連情報と、当該場所関連情報に関する地域を識別する地域識別情報と、当該地域識別情報が地域の包含関係に基づいた階層関係で関係付けられた地名階層情報と、を対応付けた場所地名情報を記憶する場所・地名対情報記憶部を備える情報提供装置のコンピュータに、
前記場所関連情報を取得する場所取得手段、
前記場所取得手段で取得した場所関連情報に対応付けられた第1の地域識別情報の階層関係に基づいて第2の地域識別情報を抽出し、抽出した第2の地域識別情報が表す地域に関する情報を要求する情報要求手段、
前記情報要求手段で要求した情報を取得して提供する情報提供手段、
を実行させるための情報提供プログラム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【公開番号】特開2012−194676(P2012−194676A)
【公開日】平成24年10月11日(2012.10.11)
【国際特許分類】
【出願番号】特願2011−56829(P2011−56829)
【出願日】平成23年3月15日(2011.3.15)
【出願人】(397065480)エヌ・ティ・ティ・コムウェア株式会社 (187)
【Fターム(参考)】
【公開日】平成24年10月11日(2012.10.11)
【国際特許分類】
【出願日】平成23年3月15日(2011.3.15)
【出願人】(397065480)エヌ・ティ・ティ・コムウェア株式会社 (187)
【Fターム(参考)】
[ Back to top ]