説明

施設関連情報検索方法および施設関連情報検索システム

【課題】様々な観点の検索条件に基づく情報の選択を可能にする施設関連情報検索方法と、自由文形式による検索条件に対応可能な施設関連情報検索システムを提供する。
【解決手段】施設関連情報を収集する情報収集装置12と、収集整理された施設関連情報を格納する施設情報データベース14と、入出力端末16を有する。検索ユーザのリクエスト入力に適合した施設及び施設関連情報を、施設情報データベース14から抽出して入出力端末16へ送る情報検索装置18と、情報検索装置18が施設情報データベース14を検索するときに、その施設に関連する情報が格納された施設情報インデックス20及び辞書データベース22を備える。情報収集装置12は、情報収集手段12aと、施設の内容や特徴のキーワードを抽出するキーワード抽出手段12bと、施設ID及び施設種別を付与するとともに各キーワードに対して施設IDを関連付ける情報整理手段12cを備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、インターネット上のWebサイトや市販の雑誌等に公開されている各種の施設関連情報を収集する施設関連情報検索方法、及び検索ユーザのリクエスト入力に適合した施設関連情報を提供する施設関連情報検索システムに関する。
【背景技術】
【0002】
近年、買い物、食事、観光旅行等する機会に、例えばパソコンからインターネット等のネットワークを通じて所定のデータベースにアクセスし、目的に合った施設(例えば、デパート、レストラン、遊園地、景勝地など)を検索することは一般的に行われている。この種の情報検索においては、検索ユーザの要求に適合した施設情報を的確に抽出することが求められ、それに応えるべく様々な形態の検索装置又は検索方法が提案されている。
【0003】
例えば、特許文献1に開示されているように、情報提供者端末から提供される施設識別情報と、施設や商品等及びそれらの価値よりなる内容情報とを個別情報としてデータベースに記憶させる記憶手段と、個別情報のうちの内容情報を、予め設定された基本分類に関連付けて識別コードを発生する関連付け手段と、消費者端末から入力されるキーワードによりデータベースを検索し、それに適合する識別コードを有する個別情報を読み出して消費者端末の表示装置に供給する手段とを備えた情報収集検索装置がある。これは、商品コード、特性・価値コード、行動コード等の識別コードを体系的に定義し、収集した施設情報ごとに適合する識別コードを付与した特定フォーマットによるデータの一つのセットである個別データセットを整備し、コード体系に従って施設情報を検索するものである。また、消費者による検索は、消費者端末の画面を用いて、対話形式の下に進められる。
【0004】
また、特許文献2に開示されているように、電話帳情報等の情報検索装置に係り、問合せ文を入力し、その入力情報に合致した情報を出力する入出力装置と、被検索情報として少なくとも名義、職業名、商品名を含む情報が格納されたデータベースと、データベース中の所定の単語と各単語の属性を対の形で記憶した単語辞書記憶装置と、問合せ文に現れる職業に関する文言を商品名と動詞に変換する変換テーブルが定義付けられた知識ベース記憶装置と、制御装置とを備え、問合せ文中の曖昧な職業情報から職業分類名を推定してデータベース検索を行うことができる情報検索装置がある。
【特許文献1】特開平11−328223号公報
【特許文献2】特許第2669827号公報
【発明の開示】
【発明が解決しようとする課題】
【0005】
しかし、特許文献1の情報収集検索装置は、施設情報は所定のコード体系によって識別され、検索ユーザ(消費者)が入力するキーワードに対応した識別コードを有する施設情報を抽出するものであり、施設情報が検索ユーザの要求に対してどの程度適合しているかを評価する機能を備えていない。従って、検索条件に適合するとして抽出された施設情報が多数あると、施設情報の適合度の高い低いに関係なく羅列して出力されるため、検索ユーザにとっては、その中から要求に近い施設情報を見つけ出すのが面倒であった。
【0006】
また、検索ユーザは、施設等を調査するときに「有名な」とか「人気の」といった施設利用者等の評価や口コミ等の評判情報を重視する場合が多い。しかし、特許文献1の情報収集検索装置では、施設利用者の評価等について考慮されておらず、検索ユーザの要求に適合した施設情報を抽出できない場合があった。
【0007】
さらに、特許文献1の情報収集検索装置は、検索は対話形式の下で行われるため、検索ユーザは事前に自己の要求を明確にしておく必要がある。従って、検索ユーザはいろいろな施設の情報を気楽に検索することができず、使い難い検索装置であった。
【0008】
一方、特許文献2の情報検索装置においても、検索ユーザの要求に対する出力情報の適合度について評価する機能を備えておらず、特許文献1と同様に、多数の出力結果から要求に近い情報を見つけ出すのが面倒であった。
【0009】
また、検索ユーザが自由文形式の問合せ文を入力しても、特定の名詞(商品名)と動詞のみが検索条件として採り上げられ、それ以外の語句については考慮されてない。従って、例えば、この情報検索装置を娯楽・観光施設等を検索する用途に用いた場合、「有名な」や「人気の」といった形容詞や副詞等の抽象的な語句を含んだ問合せ文が入力されても、適合する施設情報を抽出することができないことがあった。
【0010】
この発明は、上記背景技術に鑑みて成されたもので、多くの施設関連情報を収集し、様々な観点の検索条件に基づく情報の選択を可能にする施設関連情報検索方法と、抽象的な語句を含んだ自由文形式による検索条件にも対応でき、検索ユーザの要求に対する適合度の高い施設情報から優先的に出力することができる施設関連情報検索システムを提供することを目的とする。
【課題を解決するための手段】
【0011】
この発明は、施設に関する情報を収集してデータベースを作成し、検索サーバにより検索可能にする施設関連情報検索方法において、文書情報を有した施設関連情報を収集する情報収集工程と、前記情報収集工程で収集した施設関連情報ごとに、その設備関連情報の主体である施設を識別する施設ID及び施設の分類を示す施設種別を付与する施設ID等付与工程と、前記施設ID等が付与された施設関連情報のうち、少なくとも、個々の文書情報、施設ID及び施設種別を対応付けた施設情報を含む施設関連情報を検索サーバの記憶装置内に格納する施設情報格納工程と、施設関連情報に含まれる文書情報を単語に分割し、その単語の中から施設の内容や特徴を表現するキーワードを抽出するキーワード抽出工程と、抽出したキーワード対して、対応する施設IDごとに関連度を示すスコア値を付与するスコア付与工程と、キーワード、施設ID及びスコア値からなるインデックス情報を検索サーバの記憶装置内に格納するインデックス情報格納工程とを備え、前記スコア付与工程は、個々の施設関連情報が有する文書情報について、前記文書情報の先頭から後方までを所定数の単位文章に分割する文書情報分割工程と、前記キーワード抽出工程で抽出されたキーワードが各単位文章の中に出現する回数と、そのキーワードが出現する単位文章の位置と、各単位文章の中でそのキーワードに係り受けする修飾語の数を認識し、出現回数の多さと単位文章の位置がより前方であること、及び修飾語の多さのうちの少なくとも一つを基準として、対応する施設IDに対する前記抽出キーワードの関連度が高いとする重み付けがなされたスコア値を、各単位文章に算出するスコア値算出工程と、各単位文章に出現したキーワードを、その単位文章を含む各文書情報に取りまとめ、異なる単位文章に重複して出現するキーワードがあると、単位文章ごとに付与されたスコア値を合算して、その文書情報におけるそのキーワードのスコア値とするスコア値合算工程とを備えた施設関連情報検索方法である。
【0012】
前記スコア付与工程は、前記スコア値合算工程で各文書情報にスコア値が付与された各キーワードを、各施設IDに取りまとめ、異なる文書情報に重複して出現するキーワードがあると、文書情報ごとに付与されたスコア値のうち、最も関連度が高いとするスコア値を選択して、その施設IDにおけるそのキーワードのスコア値とするスコア値選択工程を備えたものである。
【0013】
文書情報を構成する文章数が、文章情報分割工程において予め設定されている分割数よりも少ないとき、前記文章情報分割工程は、文書情報の先頭から後方までを1つ単位文章として取り扱い、前記スコア値算出工程は、その単位文章に出現したキーワードに対して、文書情報を構成する文章数が予め設定された分割の数以上である場合よりも関連度が低いとする一律のスコア値を付与するものである。
【0014】
またこの発明は、コンピュータシステムにより構成され、検索ユーザが入力したリクエストに適合した施設を抽出し、その施設及び施設関連情報を提供する施設検索システムにおいて、文書情報を含む施設関連情報を収集して整理する情報収集装置と、収集整理された個々の前記施設関連情報を格納する施設情報データベースと、検索ユーザが操作する入出力端末と、前記検索ユーザのリクエスト入力に適合した前記施設及び前記施設関連情報を前記施設情報データベースから抽出して前記入出力端末へ送る情報検索装置と、前記情報検索装置が前記施設情報データベースを検索するときに参照されその施設に関連する情報が格納された施設情報インデックス及び辞書データベースとを備え、前記情報収集装置には、前記文書情報を含む前記施設関連情報を収集する情報収集手段と、収集した前記施設関連情報に含まれる前記文書情報の中から施設の内容や特徴を表現するキーワードを抽出するキーワード抽出手段と、個々の前記施設関連情報に対して、その施設関連情報の主体である施設を識別する施設ID及びその施設の分類を示す施設種別を付与するとともに、前記各キーワードに対して、前記文書情報に対応する施設の前記施設IDを関連付ける処理を行う情報整理手段とが設けられ、前記施設情報データベースには、前記情報整理手段で整理された情報のうち、少なくとも前記文書情報と、前記文書情報に付与された個々の前記施設IDと、前記施設種別とを含む個々の施設情報が対応付けて格納され、前記施設情報インデックスには、前記情報整理手段で整理された情報のうち、前記キーワードとそのキーワードに関連付けられた前記施設IDとが対応付けて格納され、前記辞書データベースには、前記施設の内容や特徴を表現する特徴語が予め設定され、前記情報整理手段により、各特徴語に関連する前記施設IDが定義された辞書、又は各特徴語に関連する前記施設種別が定義された辞書、又はその両方が設けられ、前記入出力端末は、自由文形式のリクエスト文が入力される入力手段と、前記情報検索装置から送られた検索結果を出力又は表示する出力手段とを備え、前記情報検索装置は、前記入出力端末から送られた前記リクエスト文を分割解析して単語情報を得る単語分割手段と、前記辞書データベースの辞書と前記施設情報インデックスを参照してその単語情報と一致する特徴語又はキーワードを抽出し、その特徴語又はキーワードに関連すると定義された前記施設ID又は前記施設種別を取得し、取得した前記施設ID又は施設種別が付与された施設情報を前記施設情報データベースの中から抽出して前記入出力端末へ送る検索手段とが設けられている施設関連情報検索システムである。
【0015】
前記施設情報インデックスに格納された前記キーワードには、前記情報整理手段によって、対応する施設IDごとに関連度を示すスコア値が付与され、前記検索手段は、前記施設情報データベースから抽出した前記施設情報について、前記施設IDごとに前記スコア値を集計して前記リクエスト文に対する適切性を示すマッチ度を算出し、前記出力手段は、前記マッチ度の高い前記施設IDが付与された前記施設情報を優先して出力又は表示するものである。
【0016】
前記情報整理手段によって前記キーワードに付与される前記スコア値は、そのキーワードが個々の前記文書情報の中に出現する回数と、前記文書情報の中の出現位置と、前記文書情報の中でそのキーワードに係り受けする修飾語の数とに基づいて決定され、出現回数が多く、その文章の位置が相対的に前記文章情報の前方位置に出現し、修飾語数が多い前記キーワードほど、関連度が高いとする重み付けがなされた前記スコア値が付与されるものである。
【0017】
前記辞書データベースは、前記施設の利用者の動作を表現する動詞からなる特徴語が予め設定され、前記情報整理手段によって各特徴語に関連する前記施設種別が個々に定義された動詞施設種別辞書を備え、前記検索手段は、少なくとも前記動詞施設種別辞書内を参照し、該当する前記施設種別を取得するものである。
【0018】
前記辞書データベースは、前記施設の住所や関係する地域等を表す地名からなる特徴語が予め設定され、前記情報整理手段によって各特徴語に関連する前記施設IDが個々に定義された地名辞書を備え、前記検索手段は、少なくとも前記地名辞書内を参照し、該当する前記施設IDを取得するものである。
【0019】
前記辞書データベースは、前記施設に関して利用者が興味を示す名詞からなる特徴語が予め設定され、前記情報整理手段によって前記各特徴語に関連する前記施設IDが個々に定義された外部知識語辞書を備え、前記検索手段は、少なくとも前記外部知識語辞書を参照し、該当する前記施設IDを取得するものである。
【0020】
前記辞書データベースは、前記施設の利用者の評価を表現する修飾語からなる特徴語が予め設定され、前記情報整理手段によって前記各特徴語に関連する前記施設IDが個々に定義された外部評価語辞書を備え、前記検索手段は、少なくとも前外部評価辞書内を参照し、該当する前記施設IDを取得するものである。
【0021】
前記辞書データベースは、前記施設の利用者の評価を表現する修飾語からなる特徴語が予め設定され、前記各特徴語には、前記情報処理手段によって関連する前記施設IDが個々に定義され、且つ、前記情報整理手段によって前記施設IDとの関連度を示す評価値が個々に付与された外部評価語辞書を備え、前記検索手段は、少なくとも前記外部評価辞書内を参照し、該当する前記施設IDを取得するとともに、前記施設情報データベースから抽出した前記施設情報について、前記施設IDごとに前記スコア値と前記評価値を集計して前記リクエスト文に対する適切性を示すマッチ度を算出し、前記出力手段は、前記マッチ度の高い前記施設IDに該当する前記施設関連情報を優先して出力又は表示するものである。
【発明の効果】
【0022】
この発明の施設関連情報検索方法は、Webサイト等に公開された膨大な量の施設関連情報を収集し、少なくとも施設ID、キーワード、スコア値からなるインデックス情報を付与して検索サーバ内に格納することによって、様々な観点の検索条件に基づき情報選択をすることができるよう整理格納することができる。
【0023】
また、この発明の施設情報検索システムは、上記の施設関連情報検索方法等によって施設関連情報を収集及び整理格納する情報収集装置、施設情報データベース、施設情報インデックスを備え、さらに、地名・動詞・修飾語等の特徴語と施設とを関連付けた辞書データベースを備えているので、検索ユーザの要求を様々な観点から解釈し、要求に適合した施設情報を的確に抽出することができる。
【0024】
さらに、情報検索装置は、抽象的な語句を含んだ自由文形式による検索条件にも対応できるので、検索ユーザは事前の準備等することなく、気軽に検索を行うことができる。また、情報検索装置は、施設の利用者等の評価を示す評価値や施設とキーワードとの関連度を示すスコア値などを用いて施設関連情報ごとに重み付けを行い、検索ユーザの要求に対する適合度の高い施設情報から優先的に出力することができるので、検索ユーザにとって非常に利便性が高い。
【発明を実施するための最良の形態】
【0025】
以下、本発明の施設関連情報検索システムの一実施形態について、図に基づいて説明する。施設関連情報検索システム10はコンピュータシステムにより構成され、図1に示すように、文書情報を含む施設関連情報を収集して整理する情報収集装置12と、収集整理された施設関連情報を格納する施設情報データベース14と、検索ユーザが操作する入出力端末16とを備えている。さらに、検索ユーザのリクエスト入力に該当する施設及び施設関連情報を施設情報データベース14から抽出して入出力端末16へ送る情報検索装置18と、情報検索装置18が施設情報データベース14を検索するときの検索効率を良くし、検索の的確性等を高める施設情報インデックス20及び辞書データベース22とを備えている。
【0026】
情報収集装置12には、インターネット上のWebサイトや市販の雑誌等に公開された文書情報を含む施設関連情報を自動収集又はシステム管理者による手動入力が可能な情報収集手段12aが設けられている。また、収集した施設関連情報に含まれる文書情報を形態素解析等を用いて単語に分割し、その単語の中から施設の内容や特徴を表現するキーワードを抽出するキーワード抽出手段12bが設けられている。さらに、個々の施設関連情報に対して、その施設関連情報の主体である施設を識別する施設ID及び施設の分類を示す施設種別を付与するとともに、各キーワードに対して、分割前の個々の文書情報に付与された施設IDを対応付ける処理を行う情報整理手段12cが設けられている。
【0027】
施設情報データベース14には、情報整理手段12cで整理された情報のうち、少なくとも、文書情報とそれに対応した施設ID及び施設種別との組み合わせで成る個々の施設情報が格納されている。
【0028】
施設情報インデックス20には、情報整理手段12cで整理された情報のうち、個々のキーワードとそのキーワードに対応付けられた施設IDに、そのキーワードと施設IDとの関連度を示すスコア値が付与されて格納されている。スコア値は、そのキーワードが個々の文書情報の中に出現する回数と、出現位置と、そのキーワードに係り受けする修飾語の数とに基づいて決定される。そして、出現回数が多く、文書の先頭から後方寄りの位置に出現し、修飾語数が多いキーワードほど関連度が高いとするスコア値が付与される。
【0029】
なお、情報収集装置12、施設情報データベース14及び施設情報インデックス20によって、本発明の施設関連情報検索方法の一実施形態に該当する動作が行われる。詳細については、後の施設情報検索システム10の動作説明の中で述べる。
【0030】
辞書データベース22は、図8に示すように、動詞施設種別辞書22a、地名辞書22b、外部知識語辞書22c及び外部評価語辞書22dを備えている。動詞施設種別辞書22aは、施設の利用者の動作を表現する動詞からなる特徴語が予め設定され、情報整理手段12cによって各特徴語に関連する施設種別が定義されている。地名辞書22bは、施設の住所や関係する地域等を現す名詞である地名からなる特徴語が予め設定され、情報整理手段12cによって各特徴語に関連する施設IDが個々に定義されている。外部知識語辞書22cは、施設に関し利用者が興味を示す名詞からなる特徴語が予め設定され、情報整理手段12cによって各特徴語に関連する施設IDが個々に定義されている。外部評価語辞書22dは、施設の利用者の評価を表現する形容詞または形容動詞である修飾語からなる特徴語が予め設定され、各特徴語には、前記情報整理手段12cによって関連する施設IDが個々に定義され、且つ、前記情報処理手段12cによって施設IDごと関連度を示す評価値が個々に付与されている。
【0031】
入出力端末16は、検索ユーザによって自由文形式のリクエスト文が入力される入力手段16aと、情報検索装置18から送られた検索結果を検索ユーザに対して出力又は表示する出力手段16bとを備えている。
【0032】
情報検索装置18には、入出力端末16に入力されたリクエスト文を形態素解析等の解析方法を用いて単語情報に分割する単語分割手段18aと、辞書データベース22が有する各辞書と施設情報インデックス20を参照し、その単語情報と一致する特徴語又はキーワードを抽出し、該当する特徴語又はキーワードに関連すると定義された施設ID又は施設種別を取得し、取得した施設ID及び施設種別が付与された施設情報を施設情報データベース14の中から抽出し、出力手段16bへ送る検索手段18bとが設けられている。
【0033】
なお、施設情報検索システム10は、入出力端末16を除く各装置によって構成される検索サーバに、インターネット等の通信回線を通じて入出力端末16が接続され、入出力端末16の操作によって、不特定多数の検索ユーザが検索サーバにアクセスすることができるよう構成されている。
【0034】
次に、施設関連情報検索システム10の動作について説明する。まず、情報収集装置12、施設情報データベース14及び施設情報インデックス20が行う、本発明の一実施形態の施設関連情報検索方法24に該当する動作を、図2の処理工程図に基づいて説明する。
【0035】
まず、情報収集工程S1で、インターネット上のWebサイトや市販の雑誌等に公開された施設関連情報であって、少なくとも文書情報を含み、その他画像や図表等が付加された施設関連情報を収集し、コンピュータ上に取り込む。次に、施設ID等付与工程S2で、収集した個々の施設関連情報に、その情報の主体である施設を識別する施設IDと、施設の分類を示す施設種別を付与する。そして、施設情報格納工程S3で、施設関連情報のうち、少なくとも、個々の文書情報、施設ID及び施設種別を対応付けた施設情報を含む施設関連情報を、施設情報データベース14に格納する。
【0036】
例えば、図3に示すように、イギリスの有名な教会であるウェストミンスター寺院に関する施設関連情報が2件あれば、1件目については、その文書情報「英国で最も美しい・・・」と文施設ID「1」と施設種別「寺社」とが対応付けられ、施設情報1として施設情報データベース14に格納される。同様に、2件目については、その文書情報「中世のゴシック建築で・・・」と文施設ID「1」と施設種別「寺社」とが対応付けられ、施設情報2として施設情報データベース14に格納される。
【0037】
一方、情報収集工程S1の後、施設ID等付与工程S2の処理とともに、キーワード抽出工程S4において、施設関連情報に含まれる文書情報を形態素解析等によって単語に分割し、その単語の中から施設の内容や特徴を表現するキーワードを抽出する。そして、スコア付与工程S5で、抽出したキーワード対して、対応する施設IDごとに関連度を示すスコア値を付与する。
【0038】
以下、スコア付与工程S5について、図4〜図6に基づいて詳しく説明する。スコア付与工程S5は、文章情報分割工程S51と、スコア値算出工程S52と、スコア値合算工程S53と、スコア値選択工程S54とで成る。まず、文書情報分割工程S51では、個々の施設関連情報が有する1または複数の文書から成る情報を、一つの文章を最小単位として、文書情報の先頭から後方までを単位文章に分割する。例えば、図4に示す例の場合、ウェストミンスター寺院に関する1件目の施設関連情報に含まれる文書情報1は、3つの文章で構成されている。ここでは、説明の便宜のため、文書情報を3つの単位文章に分割することとし、文書情報1は、第1,2,3文が個々に1つの単位文章を構成するものとする。
【0039】
なお、この文書情報1は、上記キーワード抽出工程S4によって、既にキーワードが抽出されている。図4に示す例では、第1文にあっては、「お勧め」「世界遺産」「ウェストミンスター寺院」がキーワードとして抽出され、助詞等である「の」「は」「である」は重要な語句ではないと判断して抽出されない。同様に、第2文にあっては、「ウェストミンスター寺院」「中世」「美しい」「建築物」がキーワードとして抽出されている。「ウェストミンスター寺院」は、第1文と重複するが、第2文においてもキーワードとして取り扱う。第3文についても同様である。
【0040】
次に、スコア値算出工程S52で、キーワードが各単位文章の中に出現する回数と、そのキーワードが出現する単位文章の位置と、各単位文章の中でそのキーワードに係り受けする修飾語の数を認識し、キーワードと施設IDとの関連度を算出する。一般に、施設を紹介する文書情報にあっては、文書長が短いものが多く、重要な語が繰り返し使用されるという傾向が当てはまらない場合がある。そこで、キーワードの出現回数以外の要素にも着眼するものである。
【0041】
まず、出現回数が多いキーワードほど重要な情報であり、関連度が高いと判断する。ただし、図4に示す例の場合、各キーワードが各文章群内で出現する回数は各々1回ずつと同じのため、ここでは、出現回数Aは全て「1」という値が付与される。
【0042】
次に、キーワードが出現した文章群が、文書情報の先頭に近いときほど重要度高く、後方寄りのときほど重要度が低いと判断する。これは、検索ユーザの興味を惹く内容や第三者の感想等の重要な情報は先頭寄りの単位文章に記載される傾向があるという経験則に基づいている。例えば、図4に示す例では、キーワードの出現位置による重み付けBは、先頭に近い第1文には「3」、中盤の第2文には「2」、後方の第3文には「1」という値が付与される。
【0043】
さらに、キーワードに係り受けする修飾語の数が多いほど重要度が高いと判断する。例えば、図4に示す例の場合、第1文の「お勧め」というキーワードには修飾語が係っていないので、修飾語の数Cには「0」が、「ウェストミンスター寺院」というキーワードに係る修飾語は「お勧め」と「世界遺産」の2つなので、修飾語の数Cには「2」が各々付与される。その他のキーワードについても、同じ要領で修飾語の数Cが付与される。
【0044】
そして、出現回数Aと重み付けBを積算し、さらに修飾語の数Cを加算することによって、単位文章ごとのキーワードのスコア値である小計(A×B+C)を算出する。
【0045】
次に、スコア値合算工程S53で、各単位文章に出現したキーワードを、各文書情報の単位で取りまとめ、異なる単位文章に重複して出現するキーワードがあると、単位文章ごとに付与されたスコア値を合算し、そのキーワードのスコア値とする。例えば、図4に示す例の場合、「ウェストミンスター寺院」というキーワードは、第1,2,3文に重複して出現し、各々「5」「5」「3」という小計(A×B+C)が算出されている。従って、文章情報1による「ウェストミンスター寺院」のスコア値D(1)は、それらを合算した「13」と決定する。なお、「ウェストミンスター寺院」以外のキーワードは重複していないので、スコア値を合算することなく、単位文章ごとに算出された小計(A×B+C)の値を、そのまま文章情報1によるスコア値D(1)と決定する。
【0046】
また、スコア付与工程S5の対象がウェストミンスター寺院に関する2件目の施設関連情報であって、図5に示すように、その文書情報2が1つの文章で構成されている場合の取り扱いについて説明する。ここでは文書情報の重み付けの分割数は3に設定してあるが、一つの文章を最小単位とするため、文書情報2を分割することができない。そこで、スコア値算出工程S52では、文書情報2全体を1つの単位文章として取り扱う。
【0047】
また、文章情報2の場合、各キーワードの出現回数Aは、文書情報1の場合と同様に、実際の出現回数である「1」が付与される。しかし、キーワードの出現位置による重み付けBは、一律「0.9」が付与される。文章情報の長さが短い文書情報は質の悪い情報であることが多いという経験則に基づき、文章の長さが長い文書情報よりも重要度が低いと判断するものである。さらに、修飾語の数Cは、スコア値に反映させない。そして、各キーワードのスコア値である小計(A×B)が算出される。なお、次のスコア値合算工程S53では、文章情報2の文章群の数が1つであるため、各キーワードについて算出された小計(A×B)の値を、そのまま文章情報2によるスコア値D(2)と決定する。
【0048】
次に、スコア値選択工程S54で、文書情報ごとにスコア値が決定された各キーワードを、各施設IDごとに取りまとめ、異なる文書情報に重複して出現するキーワードがあると、文書情報ごとに付与されたスコア値のうち、最も関連度が高いとするスコア値を選択してそのキーワードのスコア値とする。例えば、図6に示す例の場合、文書情報1,2は、共にウェストミンスター寺院を示す施設ID「1」が付与されている。そして、文書情報1,2において、キーワード「ウェストミンスター寺院」と「建築物」が各々重複している。重複する場合は、文書情報1によるスコア値D(1)と文書情報2によるスコア値D(2)を比較し、関連度が高い方のスコア値を選択して施設ID「1」のスコア値に決定する。また、重複しないキーワードについては、スコア値D(1),D(2)を施設ID「1」のスコア値と決定する。
【0049】
そして、上記スコア付与工程S5の後、インデックス情報格納工程S6で、キーワード、施設ID及びスコア値からなるインデックス情報を、データベースである施設情報インデックス20に格納する。その結果、施設情報インデックス20には、例えば図7に示すように、全ての施設IDに係るインデックス情報が格納される。
【0050】
以上説明したように、情報収集装置12、施設情報データベース14及び施設情報インデックス20は、情報収集工程S1、施設ID等付与工程S2、施設情報格納工程S3、キーワード抽出工程S4、スコア値付与工程S5及びインデックス情報格納工程S6からなる施設関連情報検索方法24に従って動作する。そして、施設関連情報検索方法24によれば、多くの施設関連情報を、様々な観点の検索条件に該当する情報選択を行うことができるように整理格納される。また、後述する施設関連情報検索システム10のように、検索ユーザの要求に適合した施設情報を的確に抽出することができる検索システムを容易に構築することができ、さらに、スコア値を利用すれば、関連度の高い施設関連情報から順番に提供することも可能になる。
【0051】
次に、情報検索装置18の検索効率を良くし検索の的確性等を高めるための辞書データベース22を整備する動作について、図2の処理工程図に戻って説明する。工程S7では、施設ID等付与工程S2の後、辞書データベース22の各辞書に設定された特徴語ごとに関連する施設を定義し、関連する施設に該当する施設ID又は施設種別を各特徴語に対応付けて格納する。
【0052】
辞書データベース22の動詞施設種別辞書22aは、「観る」「遊ぶ」のように、施設の利用者の動作を表現する動詞からなる特徴語があらかじめ設定されている(図8(a))。一般に、施設の管理者等が作成した施設紹介文には、施設の利用者を動作の主体とする動詞があまり使用されない。一方、検索ユーザが入力するリクエスト文は、施設の利用者の動作や行動を表す動詞を使用されることが多い。従って、検索ユーザが入力した動詞を用いて文字列一致による検索を行っても、必ずしも検索ユーザが目的とする施設関連情報を抽出することができないときある。そこで、利用者の動作を表現する動詞からなる特徴語を設定し、それに関連する施設種別を定義した動詞施設種別辞書22aを設けることによって、上記検索漏れ等が生じないようにすることができる。
【0053】
具体的には、施設ID等付与工程S2で、新規な施設関連情報に対して施設種別が付与され、その施設種別が新規である場合、工程S7で、動詞施設種別辞書22aに設定されている特徴語(動詞)の中のいずれかに、その新規の施設種別が対応する旨を定義する動作を行う。また、既存の特徴語(動詞)の中に適切なものがないときは、新たな特徴語を設定し、その新規の施設種別に対応する旨を定義する動作を行ってもよい。例えば、「観る」は「美術館」「博物館」等に、「遊ぶ」は「遊園地」等に対応する施設種別とする。
【0054】
辞書データベース22の地名辞書22bは、「ロンドン」「△△府××市」のように、施設の住所や関係する地域等を現す名詞である地名からなる特徴語があらかじめ設定されている(図8(b))。一般に、施設紹介文には、施設の住所等が記載されていない場合が少なくない。従って、例えば、検索ユーザがイタリアに在る施設を検索する目的で「イタリア」の語句を入力して文字列一致による検索を行っても、イタリアに住所を有する施設の情報を抽出することができず、目的に合致しない日本のイタリア料理店が多数抽出されることがある。そこで、施設の住所や関係する地域などを現す地名からなる特徴語を設定し、それに関連する施設IDを定義する地名辞書22bを設けることによって、上記検索漏れが生じないようにすることができる。
【0055】
具体的には、施設ID等付与工程S2で新規の施設関連情報に対して施設IDが付与されると、その施設IDが新規である場合に、工程S7で、地名辞書22bに設定されている特徴語(地名)の中のいずれかに、その新規の施設IDが対応する旨を定義する動作をする。また、既存の特徴語(地名)の中に適切なものがないときは、新たに特徴語(地名)を設定し、その新規の施設IDが対応する旨を定義する動作を行ってもよい。
【0056】
辞書データベース22の外部知識語辞書22cは、「世界遺産」「戯曲作家」「シェークスピア」のように、施設に関して利用者が興味を示す名詞からなる特徴語があらかじめ設定されている(図8(c))。一般に、施設の紹介文には、シェークスピアに縁のある施設である旨の記載があっても、シェークスピアが戯曲作家である旨が記載されていない場合がある。すると、検索ユーザが入力した「戯曲作家」用いた文字列一致による検索が行われても、シェークスピアに縁のある施設の情報を抽出できないという問題が生じる。そこで、利用者が興味を示す名詞からなる特徴語を設定し、その特徴語に関連する施設IDを定義する外部知識語辞書22cを設けることによって、上記検索漏れが生じないようにすることができる。
【0057】
具体的には、施設ID等付与工程S2で新規の施設関連情報に対して施設IDが付与されると、その施設IDが新規である場合に、工程S7で、外部知識語辞書22cに設定されている特徴語(名詞)の中のいずれかに、その新規の施設IDが対応する旨を定義する動作を行う。また、既存の特徴語(名詞)の中に適切なものがないときは、新たに特徴語を設定し、その新規の施設種別が対応する旨を定義する動作を行ってもよい。例えば、ウェストミンスター寺院の施設ID「1」は、「世界遺産」「史跡」等に関連する旨が定義される。
【0058】
辞書データベース22の外部評価語辞書22dは、「有名な」「楽しい」のように、施設の利用者の評価を表現する修飾語からなる特徴語があらかじめ設定されている(図8(d))。なお、この特徴語は形容詞や形容動詞等が該当する。一般に、施設の管理者等が作成した施設の紹介文には、施設の利用者の感想や評価、口コミで広がった評判を表す修飾語はほとんど使用されない。特に、悪い評判は皆無に等しい。従って、これらを適切に検索するには、各施設の知名度や、人気度に関する知識を検索システムに与える必要がある。そこで、利用者の評価等を表現する修飾語からなる特徴語を設定し、それに関連する施設IDを定義する外部評価辞書22dを設けることによって、適切な検索を行うことを可能にする。さらに、ここでは、特徴語(修飾語)と施設IDとの関連度を示す評価値も同時に付与する。
【0059】
具体的には、施設ID等付与工程S2で新規の施設関連情報に対して施設IDが付与されると、その施設IDが新規である場合に、工程S7で、外部評価語辞書22dに設定されている特徴語(修飾語)の中のいずれかに、その新規の施設IDが対応する旨を定義する動作を行う。また、既存の特徴語(修飾語)の中に適切なものがないときは、新たに特徴語を設定し、その新規の施設種別が対応する旨を定義する動作を行ってもよい。例えば、ウェストミンスター寺院を現す施設ID「1」は、修飾語「有名な」に関連し、その関連度は「5」と定義される。一方、○○動物園を現す施設ID「2」も修飾語「有名な」に関連するが、ウェストミンスター寺院ほど有名ではないので、関連度は「2」と定義されている。このように、評価値の定義方法は任意であり、例えば、文書情報を所定の方法で解析して知名度や人気度を自動的に算出したり、施設関連情報検索システム10の管理者等の独自の調査に基づいて決定し、手動で登録する方法等がある。
【0060】
なお、個々の施設IDに評価値を付与することによって、検索ユーザの要求に適合する施設関連情報を、関連度の高いものから順番に提供する動作が可能になる。この動作については、後で詳しく述べる。
【0061】
次に、検索ユーザが入出力端末16を操作して、所望の施設関連情報を検索する動作について、図9のフローチャートに基づいて説明する。まず、工程S10で、検索ユーザが、入出力端末16の入力手段16aにリクエスト文を入力する。ここでは、例えば「ロンドンで有名な教会の建築物を観たい。」のように、目的がやや曖昧に表現された自由文形式のリクエスト文でよい。
【0062】
次に、工程S11で、単語分割手段18aで形態素解析等を行い、リクエスト文を品詞ごとの単語情報に分割する。このとき、シソーラスを用いて同義語や類義語も合わせて単語情報としてもよい。また、リクエスト文に「国立公園」のような複合名詞が含まれるとき、「国立」「公園」「国立公園」について各々シソーラス検索を行い、各検索結果を集計して「国立公園」についての単語情報としてもよい。すなわち、単語分割手段18aによる単語情報の抽出方法は、検索ユーザの目的を適切に認識できるように適宜設定される。
【0063】
次に、工程S12で、検索手段18bが、辞書データベース22内の各辞書と施設情報インデックス20とを参照し、単語分割手段18で得られた単語情報に該当する施設ID、評価値、施設種別、スコア値を取得する。以下、この検索手段18bの動作について、図10のフローチャートに基づいて詳しく説明する。
【0064】
単語情報が動詞の場合、検索手段18bは、動詞施設種別辞書22aを参照してその単語情報と一致する特徴語(動詞)を調べ、該当する施設種別を所得する(工程S121)。例えば、単語分割手段18で「観る」という単語情報が得られた場合、図8(a)の動詞施設種別辞書22aを参照して、「美術館」「博物館」等の施設種別を取得する。
【0065】
単語情報が地名の場合、検索手段18bは、地名辞書22bを参照してその単語情報と一致する特徴語(地名)を調べ、該当する施設IDを所得する(工程S122)。例えば、単語分割手段18で「ロンドン」という単語情報が得られた場合、図8(b)の地名辞書22bを参照して、「1」等の施設IDを取得する。
【0066】
単語情報が名詞の場合、検索手段18bは、外部知識語辞書22cを参照してその単語情報と一致する特徴語(名詞)が在るか否かを判断する(S123)。そして、一致する特徴語(名詞)があれば、検索手段18bは、その単語情報に該当する施設IDを取得する(工程S124)。例えば、単語分割手段18で「世界遺産」という単語情報が得られた場合、図8(c)の外部知識語辞書22cを参照して、「1」等の施設IDを取得する。
【0067】
一方、一致する特徴語(名詞)がないとき、検索手段18bは、施設情報インデックス20を参照してその単語情報と一致するキーワードを調べ、該当する施設IDとそれに対応するスコア値を取得する(工程S125)。例えば、単語分割手段18で「教会」という単語情報が得られた場合、図7の施設情報インデックス20を参照して、施設ID「1」及びスコア値「2」を取得する。
【0068】
単語情報が修飾語の場合、検索手段18bは、外部評価語辞書22dを参照してその単語情報と一致する特徴語(修飾語)が在るか否かを判断する(S126)。そして、一致する特徴語(修飾語)があれば、検索手段18bは、その単語情報に該当する施設IDとそれに対応する評価値を取得する(工程S127)。例えば、単語分割手段18で「有名な」という単語情報が得られた場合、図8(d)の外部知識語辞書22dを参照して、施設ID「1」及び評価値「5」を取得する。
【0069】
一方、一致する特徴語(修飾語)がないとき、検索手段18bは、施設情報インデックス20を参照してその単語情報と一致するキーワードを調べ、該当する施設IDとそれに対応するスコア値を所得する(工程S128)。
【0070】
次に、検索手段18bは、工程S12を経て、施設ID又は施設種別を取得したかどうか判断する(工程13)。工程S12で、各辞書と施設情報インデックス20から施設IDと施設種別を全く取得することができなかったときには、検索手段18bは「リクエスト文に適合する施設関連情報が見当たらない」と判断し、その旨を出力手段16bから出力させ、検索動作が終了する(S14)。
【0071】
一方、施設ID又は施設種別を取得したときは、検索手段18bは、施設情報データベース14内を検索し、取得した施設IDや施設種別に該当する施設情報を抽出する(工程S15)。
【0072】
次に、検索手段18bが、工程S15で抽出された施設情報に付与されているスコア値や評価値に基づき、施設IDごとに、リクエスト文に対する適切性を表すマッチ度を算出する(S16)。例えば、図11に示すように、ウェストミンスター寺院の施設ID「1」が抽出された場合、施設ID「1」には、修飾語「有名な」に対する評価値「5」、キーワード「建築物」に対するスコア値「4」、キーワード「教会」に対するスコア値「2」が付与されている。ここでは、これらを加算して、施設ID「1」のマッチ度「11」を算出する。工程S15で抽出された他の施設ID「7」「12」等についても、同様の方法でマッチ度を算出する。
【0073】
そして、検索手段18bは、工程S15で抽出した施設情報を施設IDごとにマッチ度が高いものから順番に出力手段16bから出力させる(S17)。出力手段16bは、紙に印刷したり、ディスプレイ表示などによって検索結果を検索ユーザに提供する。そして、出力形式としては、例えば、図12に示すようなレイアウトでディスプレイに表示する方法等が考えられる。ただし施設関連情報に含まれる文書情報、施設ID、マッチ度等の情報のうち、いずれの情報を表示するかは、システム管理者が自由に設定すればよく、あるいは、検索ユーザが選択できるようにしてもよい。
【0074】
以上説明したように、施設関連情報検索システム10は、膨大な施設関連情報を収集、整理格納する情報収集装置12、施設情報データベース14、施設情報インデックス20を備え、さらに、地名・動詞・修飾語等の特徴語と施設とを関連付けた辞書データベース22を備えているので、検索ユーザの要求を様々な観点から解釈し、要求に適合した施設関連情報を的確に抽出することができる。
【0075】
さらに、情報検索装置18は、抽象的な語句を含んだ自由文形式によるリクエスト文の入力ができるので、検索ユーザは事前の準備等することなく、気軽に検索を行うことができる。また、情報検索装置18は、施設の利用者等の評価を示す評価値や施設とキーワードとの関連度を示すスコア値などを用いて施設関連情報ごとに重み付けを行い、検索ユーザの要求に対する適合度の高い施設情報から優先的に出力することができ、検索ユーザにとって非常に利便性が高い。
【0076】
なお、本発明は上記実施形態に限定されるものではなく、例えば、検索対象が一定の施設種別に限定されているなどの事情に応じて、辞書データベース22内に設ける辞書の種類を増減させることができる。
【0077】
また、各辞書に設定する特徴語や、特徴語に付与されるスコア値及び評価値については、時代の流れとともに適切性を失うことが考えられるので、必要に応じてメンテナンス(再登録又は修正)を行う必要がある。その場合、辞書データベース、施設情報インデックスなどの登録データを修正する作業は、図示しないシステム管理者用端末装置を操作することによって行われる。この場合、蓄積されたすべての施設関連情報に対して、施設ID、施設種別などのインデックス情報が付与されているため、例えば、特定の施設種別の情報を一括して修正する等の処理も容易に行うことができるので、手間がかからず、メンテナンス性にも優れている。
【0078】
また、例えば、施設関連情報の蓄積件数が少ない施設情報検索システムでは、必ずしもスコア値や評価値を用いたマッチ度計算を行う機能を設けずに、工程S15で抽出された施設関連情報が任意の順番で出力されるものであってもよい。
【0079】
また、上記の実施形態のような一連の処理動作をプログラムとして構築し、施設関連情報検索システムとして利用されるサーバーコンピュータにインストールし、CPUなどの制御手段によって実行させる他、そのプログラムをネットワークを介して流通させるようにしてもよい。また、構築されたプログラムを、施設関連情報検索システムとして利用される各種のコンピュータに接続されるハードディスク装置、DVD−ROM、CD−ROMなどの可搬記憶媒体に格納し、コンピュータにインストールして実行させるようにしてもよい。
【図面の簡単な説明】
【0080】
【図1】この発明の施設関連情報検索システムの一実施形態の構成を示すブロック図である。
【図2】本実施形態の情報収集装置が施設情報データベース、施設情報インデックス及び辞書データベースを整備する動作と、この発明の施設関連情報検索方法の一実施形態を説明する処理工程図である。
【図3】本実施形態の施設情報データベースの例を示す図である。
【図4】本実施形態の施設情報インデックスに格納されるスコア値を説明する第一の図である。
【図5】本実施形態の施設情報インデックスに格納されるスコア値を説明する第二の図である。
【図6】本実施形態の施設情報インデックスに格納されるスコア値を説明する第三の図である。
【図7】本実施形態の施設情報インデックスに格納されるスコア値を説明する第四の図である。
【図8】本実施形態の辞書データベースが備える辞書の例を示す図であって、動詞施設種別辞書(a)、地名辞書(b)、外部知識語辞書(c)、外部評価語辞書(d)である。
【図9】本実施形態の入出力端末を操作し、検索した施設情報を出力する動作を説明するフローチャートである。
【図10】本実施形態の検索手段が辞書等を参照し、単語情報に該当する所定の情報を取得する動作を説明するフローチャートである。
【図11】本実施形態の検索手段がマッチ度を算出する動作を説明する図である。
【図12】本実施形態の出力手段から出力される検索結果の例を説明する図である。
【符号の説明】
【0081】
10 施設関連情報検索システム
12 情報収集装置
12a 情報収集手段
12b キーワード抽出手段
12c 情報整理手段
14 施設情報データベース
16 入出力端末
18 情報検索装置
18a 単語分割手段
18b 検索手段
20 施設情報インデックス
22 辞書データベース
22a 動詞施設種別辞書
22b 地名辞書
22c 外部知識語辞書
22d 外部評価語辞書
24 施設関連情報検索方法
S1 情報収集工程
S2 施設ID等付与工程
S3 施設情報格納工程
S4 キーワード抽出工程
S5 スコア付与工程
S51 文章情報分割工程
S52 スコア値算出工程
S53 スコア値合算工程
S54 スコア値選択工程
S6 インデックス情報格納工程

【特許請求の範囲】
【請求項1】
施設に関する情報を収集してデータベースを作成し、検索サーバにより検索可能にする施設関連情報検索方法において、
文書情報を有した施設関連情報を収集する情報収集工程と、
前記情報収集工程で収集した施設関連情報ごとに、その設備関連情報の主体である施設を識別する施設ID及び施設の分類を示す施設種別を付与する施設ID等付与工程と、
前記施設ID等が付与された施設関連情報のうち、少なくとも、個々の文書情報、施設ID及び施設種別を対応付けた施設情報を含む施設関連情報を検索サーバの記憶装置内に格納する施設情報格納工程と、
施設関連情報に含まれる文書情報を単語に分割し、その単語の中から施設の内容や特徴を表現するキーワードを抽出するキーワード抽出工程と、
抽出したキーワード対して、対応する施設IDごとに関連度を示すスコア値を付与するスコア付与工程と、
キーワード、施設ID及びスコア値からなるインデックス情報を検索サーバの記憶装置内に格納するインデックス情報格納工程とを備え、
前記スコア付与工程は、個々の施設関連情報が有する文書情報について、前記文書情報の先頭から後方までを所定数の単位文章に分割する文書情報分割工程と、
前記キーワード抽出工程で抽出されたキーワードが各単位文章の中に出現する回数と、そのキーワードが出現する単位文章の位置と、各単位文章の中でそのキーワードに係り受けする修飾語の数を認識し、出現回数の多さと単位文章の位置がより前方であること、及び修飾語の多さのうちの少なくとも一つを基準として、対応する施設IDに対する前記抽出キーワードの関連度が高いとする重み付けがなされたスコア値を、各単位文章ごとに算出するスコア値算出工程と、
各単位文章に出現したキーワードを、その単位文章を含む各文書情報ごとに取りまとめ、異なる単位文章に重複して出現するキーワードがあると、単位文章ごとに付与されたスコア値を合算して、その文書情報におけるそのキーワードのスコア値とするスコア値合算工程とを備えたことを特徴とする施設関連情報検索方法。
【請求項2】
前記スコア付与工程は、前記スコア値合算工程で各文書情報にスコア値が付与された各キーワードを、各施設IDに取りまとめ、異なる文書情報に重複して出現するキーワードがあると、文書情報ごとに付与されたスコア値のうち、最も関連度が高いとするスコア値を選択して、その施設IDにおけるそのキーワードのスコア値とするスコア値選択工程を備えたことを特徴とする請求項1記載の施設関連情報検索方法。
【請求項3】
文書情報を構成する文章数が、文章情報分割工程において予め設定されている分割数よりも少ないとき、
前記文章情報分割工程は、文書情報の先頭から後方までを1つ単位文章として取り扱い、
前記スコア値算出工程は、その単位文章に出現したキーワードに対して、文書情報を構成する文章数が予め設定された分割の数以上である場合よりも関連度が低いとする一律のスコア値を付与することを特徴とする請求項1記載の施設関連情報検索方法。
【請求項4】
コンピュータシステムにより構成され、検索ユーザが入力したリクエストに適合した施設を抽出し、その施設及び施設関連情報を提供する施設検索システムにおいて、
文書情報を含む施設関連情報を収集して整理する情報収集装置と、収集整理された個々の前記施設関連情報を格納する施設情報データベースと、検索ユーザが操作する入出力端末と、前記検索ユーザのリクエスト入力に適合した前記施設及び前記施設関連情報を前記施設情報データベースから抽出して前記入出力端末へ送る情報検索装置と、前記情報検索装置が前記施設情報データベースを検索するときに参照されその施設に関連する情報が格納された施設情報インデックス及び辞書データベースとを備え、
前記情報収集装置には、前記文書情報を含む前記施設関連情報を収集する情報収集手段と、収集した前記施設関連情報に含まれる前記文書情報の中から施設の内容や特徴を表現するキーワードを抽出するキーワード抽出手段と、個々の前記施設関連情報に対して、その施設関連情報の主体である施設を識別する施設ID及びその施設の分類を示す施設種別を付与するとともに、前記各キーワードに対して、前記文書情報に対応する施設の前記施設IDを関連付ける処理を行う情報整理手段とが設けられ、
前記施設情報データベースには、前記情報整理手段で整理された情報のうち、少なくとも前記文書情報と、前記文書情報に付与された個々の前記施設IDと、前記施設種別とを含む個々の施設情報が対応付けて格納され、
前記施設情報インデックスには、前記情報整理手段で整理された情報のうち、前記キーワードとそのキーワードに関連付けられた前記施設IDとが対応付けて格納され、
前記辞書データベースには、前記施設の内容や特徴を表現する特徴語が予め設定され、前記情報整理手段により、各特徴語に関連する前記施設IDが定義された辞書、又は各特徴語に関連する前記施設種別が定義された辞書、又はその両方が設けられ、
前記入出力端末は、自由文形式のリクエスト文が入力される入力手段と、前記情報検索装置から送られた検索結果を出力又は表示する出力手段とを備え、
前記情報検索装置は、前記入出力端末から送られた前記リクエスト文を分割解析して単語情報を得る単語分割手段と、前記辞書データベースの辞書と前記施設情報インデックスを参照してその単語情報と一致する特徴語又はキーワードを抽出し、その特徴語又はキーワードに関連すると定義された前記施設ID又は前記施設種別を取得し、取得した前記施設ID又は前記施設種別が付与された前記施設情報を前記施設情報データベースの中から抽出して前記入出力端末へ送る検索手段とが設けられていることを特徴とする施設関連情報検索システム。
【請求項5】
前記施設情報インデックスに格納された前記キーワードには、前記情報整理手段によって、対応する施設IDごとに関連度を示すスコア値が付与され、
前記検索手段は、前記施設情報データベースから抽出した前記施設情報について、前記施設IDごとに前記スコア値を集計して前記リクエスト文に対する適切性を示すマッチ度を算出し、
前記出力手段は、前記マッチ度の高い前記施設IDが付与された前記施設情報を優先して出力又は表示することを特徴とする請求項4記載の施設関連情報検索システム。
【請求項6】
前記情報整理手段によって前記キーワードに付与される前記スコア値は、そのキーワードが個々の前記文書情報の中に出現する回数と、前記文書情報の中の出現位置と、前記文書情報の中でそのキーワードに係り受けする修飾語の数とに基づいて決定され、出現回数が多く、その文章の位置が相対的に前記文章情報の前方位置に出現し、修飾語数が多い前記キーワードほど、関連度が高いとする重み付けがなされた前記スコア値が付与されることを特徴とする請求項5記載の施設関連情報検索システム。
【請求項7】
前記辞書データベースは、前記施設の利用者の動作を表現する動詞からなる特徴語が予め設定され、前記情報整理手段によって各特徴語に関連する前記施設種別が個々に定義された動詞施設種別辞書を備え、
前記検索手段は、少なくとも前記動詞施設種別辞書内を参照し、該当する前記施設種別を取得することを特徴とする請求項4,5又は6記載の施設関連情報検索システム。
【請求項8】
前記辞書データベースは、前記施設の住所や関係する地域等を表す地名からなる特徴語が予め設定され、前記情報整理手段によって各特徴語に関連する前記施設IDが個々に定義された地名辞書を備え、
前記検索手段は、少なくとも前記地名辞書内を参照し、該当する前記施設IDを取得することを特徴とする請求項4,5又は6記載の施設関連情報検索システム。
【請求項9】
前記辞書データベースは、前記施設に関して利用者が興味を示す名詞からなる特徴語が予め設定され、前記情報整理手段によって前記各特徴語に関連する前記施設IDが個々に定義された外部知識語辞書を備え、
前記検索手段は、少なくとも前記外部知識語辞書内を参照し、該当する前記施設IDを取得することを特徴とする請求項4,5又は6記載の施設関連情報検索システム。
【請求項10】
前記辞書データベースは、前記施設の利用者の評価を表現する修飾語からなる特徴語が予め設定され、前記情報整理手段によって前記各特徴語に関連する前記施設IDが個々に定義された外部評価語辞書を備え、
前記検索手段は、少なくとも前外部評価辞書内を参照し、該当する前記施設IDを取得することを特徴とする請求項4,5又は6記載の施設関連情報検索システム。
【請求項11】
前記辞書データベースは、前記施設の利用者の評価を表現する修飾語からなる特徴語が予め設定され、前記各特徴語には、前記情報処理手段によって関連する前記施設IDが個々に定義され、且つ、前記情報整理手段によって前記施設IDとの関連度を示す評価値が個々に付与された外部評価語辞書を備え、
前記検索手段は、少なくとも前記外部評価辞書内を参照し、該当する前記施設IDを取得するとともに、前記施設情報データベースから抽出した前記施設情報について、前記施設IDごとに前記スコア値と前記評価値を集計して前記リクエスト文に対する適切性を示すマッチ度を算出し、
前記出力手段は、前記マッチ度の高い前記施設IDに該当する前記施設関連情報を優先して出力又は表示することを特徴とする請求項5又は6記載の施設関連情報検索システム。



【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate