説明

検索インデックス作成システム、文書検索システム、インデックス作成方法、文書検索方法及びプログラム

【課題】検索システムにおいて、地図画像入り文書に対して位置情報を検索キーに用いた検索を可能とする。
【解決手段】検索インデックス作成システムを、(1) 文書ファイルに含まれる1つ又は複数の地図画像又は写真画像の付属データから画像範囲を示す経度緯度情報を抽出する手段と、(2) 経度緯度情報と、当該経度緯度情報に対応する地図画像又は写真画像を特定する識別情報とを含む検索インデックスを作成する手段とで構成する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、文書ファイルに貼り付けられた又は埋め込まれた地図又は写真(例えば衛星写真)を検索する技術に関するものである。
【背景技術】
【0002】
近年、「ロケーションインテリジェンス」と呼ばれる技術が出現し、当該分野の拡大が見込まれている。ここで、「ロケーションインテリジェンス」とは、地理情報システム(GIS:Geographic Information System)を専門知識無しにビジネスに活用可能とする技術をいう。
【0003】
この種の分野では、システムの使い易さが非常に重視される。そこで、昨今、PDF(Portable Document Format)ファイル上で地理空間情報を取り扱い可能にした製品が提案されている。例えばAdobe社からはGeospatial PDFが、TerraGo社からはGeoPDF(登録商標)が提案されている。しかし、PDFファイルのように汎用的な文書ファイルに埋め込まれた地図そのものを、位置情報を検索キーに用いて検索できる製品は今のところ知られていない。
【0004】
なお、文書の本文情報と地理空間情報を組み合わせた検索技術は、既に提案されている。例えば特許文献1には、データベースを利用して文書情報と地図情報をリンクさせるものが提案されている。また、特許文献2には、文書の本文中に現われる位置に関する記述を位置情報に変換し、当該変換後の位置情報を検索対象とするやり方が提案されている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2001−167112号公報
【特許文献2】特開2010−128806号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
ところが、特許文献1のように、データベースを利用して文書情報と地図情報をリンクさせる場合、検索システムは非常に複雑になってしまう。また、特許文献2のように、文書中の位置に関する記述を位置情報に変換する手法では、文書の曖昧性から間違った場所を特定してしまう可能性がある。例えば「東京都北部」のように言葉の示す範囲が曖昧である場合、位置情報の範囲の特定自体が困難である。このため、検索結果がユーザの意図せぬものになる可能性がある。
【0007】
本発明は、かかる課題を考慮してなされたものであり、従来システムに比してシステム構成が簡便で済み、かつ、検索精度良く特定の位置情報を有する地図及び又は写真を検索可能とするシステムの提供を目的とする。
【課題を解決するための手段】
【0008】
そこで、本発明者は、以下に示すシステムを提案する。
【0009】
まず、文書ファイルから検索インデックスを作成するシステム(検索インデックス作成システム)として、(1) 文書ファイルに含まれる1つ又は複数の地図画像又は写真画像の付属データから画像範囲を示す経度緯度情報を抽出する手段と、(2) 経度緯度情報と、当該経度緯度情報に対応する地図画像又は写真画像を特定する識別情報とを含む検索インデックスを作成する手段とを有するものを提案する。
【0010】
また、文書検索システムとして、(1) 文書ファイルを格納するファイルサーバと、(2) 文書ファイルに含まれる1つ又は複数の地図画像又は写真画像の付属データから画像範囲を示す経度緯度情報を抽出する手段と、(3) 経度緯度情報と、当該経度緯度情報に対応する地図画像又は写真画像を特定する識別情報とを含む検索インデックスを作成する手段と、(4) 作成された検索インデックスを格納する検索インデックス格納部と、(5) 検索条件として、経度緯度の範囲の設定を、操作画面を通じて受付ける手段と、(6) 検索条件として受付けた経度緯度の範囲に経度緯度情報を含む前記検索インデックスを検索する手段と、(7) 検索結果を出力する手段とを有するものを提案する。
【発明の効果】
【0011】
本発明によれば、文書に含まれる地図画像又は写真画像そのものの経度緯度情報を検索インデックスに含めることができる。このため、従来システムに比して簡易かつ正確に、検索条件に合致する地図画像及び又は写真画像を含む文書を検索することができる。
【図面の簡単な説明】
【0012】
【図1】形態例に係る文書検索システムの構成例を説明する図。
【図2】地図情報入り文書の例を説明する図。
【図3】検索インデックスの構成例を示す図。
【図4】検索条件の入力に使用する操作画面例を示す図。
【図5】検索結果の表示に使用する操作画面例を示す図。
【図6】検索結果の表示に使用する他の操作画面例を示す図。
【図7】検索インデックスの作成手順例を示すフローチャート。
【図8】文書の検索手順例を示すフローチャート。
【発明を実施するための形態】
【0013】
以下、図面に基づいて、本発明に係る文書検索システム及び検索インデックス作成システムの形態例を説明する。なお、後述する形態例はいずれも一例であり、本発明には、本明細書に記載する任意の機能を組み合わせることで実現されるシステム、本明細書に記載する一部の構成や機能だけで実現されるシステムの他、一部の構成や機能だけを周知の技術で置換したシステムも含まれる。また、後述する形態例で実行される機能は、計算機(コンピュータ)上で実行されるプログラムとして実現されるものとして説明する。もっとも、プログラムの一部又は全部は、ハードウェアを通じて実現されても良い。
【0014】
(全体システム)
図1に、文書検索システムの構成例を示す。なお、検索インデックスシステムは、文書検索システムの一部として実現される。
【0015】
図1に示す文書検索システムは、検索ホストシステム100と、ネットワーク160を介して接続されたファイルサーバ150及び検索端末170とで構成される。
【0016】
検索ホストシステム100は、検索インデックスの作成と検索の実行とを分担するコンピュータである。検索ホストシステム100は、いわゆる検索サーバとして動作する。図1に示す検索ホストシステム100は、検索インデックス作成部110と、検索画面表示制御部120と、検索処理部130と、検索インデックス格納部140とで構成される。
【0017】
ここで、検索インデックス作成部110は、文書ファイルの本文から検索インデックスを作成するだけでなく、後述するように、文書ファイルに埋め込まれた又は貼り付けられた地図画像の付属データから位置情報(経度緯度情報)を抽出し、検索インデックスを作成する機能を実現する。
【0018】
検索画面表示制御部120は、ネットワーク160を介して接続された検索端末170の操作画面上に検索条件の入力画面や検索結果の表示画面を表示する機能を提供する。
【0019】
検索処理部130は、検索端末170から入力された検索条件に基づいて検索インデックス格納部140を検索し、検索条件を満たす検索インデックスを検索する機能を提供する。
【0020】
検索インデックス格納部140は、各文書ファイルについて作成された検索インデックスを格納する記憶装置である。この実施例の場合、記憶装置には、複数のハードディスク装置で構成されるストレージサーバを想定する。
【0021】
ファイルサーバ150は、文書ファイルが格納される記憶装置である。この形態例の場合、少なくとも1つのファイルサーバ150が、少なくとも1つは地図画像入りの文書ファイルを格納しているものとする。ファイルサーバ150も、複数のハードディスク装置で構成されるストレージサーバを想定する。
【0022】
ネットワーク160は、インターネットでも、イントラネットでも、LAN(local area network)でも良い。
【0023】
検索端末170は、文書ファイルの検索を実際に実行されるユーザ側のコンピュータ端末である。なお、検索端末170は、いわゆるコンピュータである必要はなく、ネットワーク通信機能を備える各種の機器、例えばテレビジョン受像機、ビデオレコーダでも良い。また、検索端末170は、携帯電話機や携帯情報端末その他の可搬型の端末装置でも良い。
【0024】
(地図情報入り文書)
図2に、本形態例において検索対象とする地図画像入り文書(以下「非構造化データ」ともいう。)の構造例を示す。地図画像入り文書は、基本的に、地図画像部200と本文210とで構成される。地図画像部200には、図中の「2ページ目」に示すように、文書を利用するユーザがアノテーション220又は230を追加的に記録することができる。アノテーション220は、地図上のある座標点に関する吹き出し形式でコメント(テキストデータ)を付加する場合に用いられる。アノテーション230は、地図上のある座標位置にランドマーク等を表す図形を付加する場合に用いられる。
【0025】
この形態例の場合、地図画像部200は矩形領域で与えられる。地図画像部200には、その画像範囲を経度緯度のような座標値によって特定する付属データが付されている。付属データには、例えば地図画像部200の左上隅と右下隅の2つの座標値が記録されている。なお、右上隅と左下隅の2つの座標値を記録しても良いし、4隅に対応する4つの座標値を記録しても良い。
【0026】
同じく、アノテーション220及び230の付属データには、その付着点又は付着範囲を経度緯度のような座標値によって特定する付属データが付されている。なお、アノテーションの座標値は、地図画像部200に対する付着時に、地図画像部200上における位置関係と地図画像部200の全体範囲を与える座標値とに基づいて算出される。なお、当該座標値の算出は、文書ファイルを操作するユーザのコンピュータ端末上で動作しているプログラムに基づいて実行される。
【0027】
ここで、地図画像部200は、いわゆるデジタル地図だけでなく衛星写真を含むものとする。いずれも、経度情報及び緯度情報を付属データに含むものとする。もっとも、付属データには、高度情報が含まれていても良い。
【0028】
(検索インデックスのデータ構造)
図3に、図2に示した地図情報入り文書について作成される検索インデックスのデータ構造例を示す。検索インデックスは、ファイルサーバ150をクローニングした検索インデックス作成部110により作成される。図3に示す検索インデックスは、3つの検索インデックスで構成される。すなわち、本文の検索インデックス300と、地図画像部範囲の検索インデックス310と、地図上アノテーションの検索インデックス320とから構成される。
【0029】
本文の検索インデックス300には、文書の本文210から抽出された検索対象ワードが格納される。図3の場合、「神奈川県」、「地図」、「マグニチュード4」等が抽出されて格納されている。
【0030】
地図画像部範囲の検索インデックス310には、文書内に埋め込まれた地図画像部200の識別番号(ID番号)と共に、当該範囲の左上隅座標値UL(経度緯度)と、右下隅座標値LR(経度緯度)が格納される。
【0031】
地図上アノテーションの検索インデックス320には、文書内の地図画像部200に付加されたアノテーションの識別番号(ID番号)と共に、追加されたテキスト情報(任意)と、アノテーションが付与された座標値(経度緯度)が格納される。
【0032】
(操作画面例)
図4〜図6に、検索端末170に表示される操作画面例を示す。これらの操作画面は、検索画面表示制御部120を通じて検索端末170に提供される。図4は、検索条件の入力に用いられる操作画面の一例である。図4に示す操作画面は、地図表示部400と、検索語入力部410と、検索結果のテキスト表示部440とで構成される。
【0033】
このうち、地図表示部400は、検索範囲の入力及び検索結果の表示に用いられる。この形態例の場合、地図表示部400に表示されている地図又は写真には、表示範囲の位置情報が付属データとして埋め込まれている。この形態例の場合、ユーザは、不図示のマウス等を操作し、検索範囲450を地図表示部400上に直接入力する。例えばマウスの左ボタンを押したままマウスを動かすことにより、地図表示部400上に検索範囲450を入力する。
【0034】
検索語入力部410は、本文中やアノテーションに含まれる検索語を入力するための検索語入力欄420と、検索語の検索範囲をアノテーションとするか本文とするかを選択するためのチェックボックス430とで構成される。図4の場合、検索語入力欄420には、検索語として「建物倒壊」が入力されている。テキストの入力には、検索端末170の不図示のキーボードが用いられる。また、図4の場合、チェックボックス430のチェック記号は外れている。従って、図4の操作画面の場合には、地図画像又は写真画像の検索インデックス310と本文のインデックス300が検索対象となる。
【0035】
図5に、検索結果の表示例の一つを示す。図5に示す操作画面も、地図表示部400と、検索語入力部410と、検索結果のテキスト表示部440とで構成される。当該表示例は、チェックボックス430にチェック記号が入っていない場合に表示される。図5の場合、本文中に検索語を含む4件の文書ファイルが発見されたことがテキスト表示部440に表示される。この例の場合、1つ目の文書中には、検索条件を満たす地図画像が2つ以上存在することが分かる。一方、2つ目の文書には、検索条件を満たす地図画像又は写真画像が1つだけ存在することが分かる。また、検索条件を満たした地図画像の座標値も表示される。
【0036】
図6に、検索条件の入力画面において、チェックボックス430にチェック記号が入れられ、検索語の検索範囲がアノテーションに設定された場合の検索結果例を示す。この場合、検索条件を満たしたアノテーション460が、地図表示部400に表示されている地図上の付着位置に重畳するように表示される。この例の場合、検索語を含むアノテーション460が4つ発見されたことがテキスト表示部440と地図表示部400に表示される。図6の場合、検索結果を満たす4つのアノテーション460が、地図表示部400のうち対応する座標点に表示される。また、この場合、1つ目の文書中には、検索条件を満たすアノテーション460が2つ以上存在することが分かる。
【0037】
(検索インデックスの作成手順)
図7に、検索インデックス作成部110において実行される検索インデックスの作成プログラムの処理手順例を示す。なお、ステップ500からステップ540までの処理は、ファイルサーバ150からクローニングした各文書について実行される。
【0038】
まず、検索インデックス作成部110は、処理対象とする文書が地図画像付き文書ファイルか否かを判定する(ステップ500)。否定結果(No)の場合、検索インデックス作成部110は、後続するステップ510から540をスキップし、次の文書ファイルを処理対象に変更する。
【0039】
一方、肯定結果(Yes)が得られた場合、検索インデックス作成部110は、文書内に含まれる全ての地図画像部200の範囲情報をインデックスに追加する(ステップ510)。すなわち、地図画像部範囲の検索インデックス310を生成する。
【0040】
次に、検索インデックス作成部110は、文書内の全ての地図画像上のアノテーション情報(テキスト情報と位置情報)をインデックスに追加する(ステップ520)。すなわち、地図上アノテーションの検索インデックスを生成する。
【0041】
次に、検索インデックス作成部110は、文書内の本文内のキーワードをインデックスに追加する(ステップ530)。すなわち、本文の検索インデックス300を生成する。
【0042】
この後、検索インデックス作成部110は、作成された各検索インデックス300、310及び320を検索インデックス格納部140に保存する(ステップ540)。
【0043】
(文書検索の実行手順)
図8に、検索処理部130において実行される文書検索プログラムの処理手順例を示す。図8に示すプログラムは、ユーザが検索端末170の画面上で検索条件を入力し、検索の実行を指示するボタンを操作した場合に実行される。
【0044】
まず、検索処理部130は、地図表示部400に対してユーザが検索範囲450を指定入力しているか否かを判定する(ステップ600)。
【0045】
当該判定において肯定結果(Yes)が得られた場合、検索処理部130は、検索インデックス格納部140に格納されている各検索インデックスの地図画像部範囲の検索インデックス310と地図上アノテーションの検索インデックス320のそれぞれが、ステップ600で指定された検索範囲450に含まれるか否かを調べ、検索範囲450内に含まれる文書を抽出する(ステップ610)。
【0046】
次に、検索処理部130は、検索語入力欄420に検索文字列が入力されているか否かを判定する(ステップ620)。なお、このステップ620は、ステップ600において否定結果が得られた場合にも実行される。
【0047】
否定結果(No)が得られた場合、検索処理部130は、この時点で抽出済みの文書を検索結果としてテキスト表示部440に表示する。
【0048】
一方、ステップ620で肯定結果(Yes)が得られた場合、検索処理部130は、アノテーション検索用のチェックボックス430にチェック記号が入っているか否かを判定する(ステップ630)。
【0049】
否定結果(No)が得られた場合(すなわち、チェック記号がチェックボックス430に入っていない場合)、検索処理部130は、ステップ610で抽出済みの文書の中で本文中に検索語が含まれている文書を絞り込み、検索結果としてテキスト表示部440に表示する(ステップ640)。
【0050】
一方、肯定結果(Yes)が得られた場合(すなわち、チェック記号がチェックボックス430に入っていた場合)、検索処理部130は、ステップ610で抽出済みの文書の中でアノテーション220のテキストに検索語が含まれている文書を絞り込み、検索結果としてテキスト表示部440に表示する(ステップ650)。
【0051】
(まとめ)
以上説明したように、本形態例に係る文書検索システムの場合には、特許文献1のようにデータベースを利用して文書情報と地図画像をリンクさせる必要がなく、簡易なシステム構成による地図検索を実現できる。
【0052】
また、本形態例に係る文書検索システムの場合には、文書に貼り付けられた地図画像が有する位置情報を用いて検索インデックスを生成しているため、検索条件に正確に一致する地図画像を検索することができる。
【0053】
また、本形態例に係る文書検索システムの場合には、文書に貼り付けられた地図画像だけでなく、当該地図画像上に貼り付けられたアノテーションの位置情報も含めて検索インデックスを作成するため、検索条件に関連する地図範囲とアノテーションを検索結果として出力することができる。
【0054】
また、本形態例に係る文書検索システムの場合には、地図検索の範囲を操作画面上に表示された地図画像上の範囲として直接指定できるため、座標範囲の簡易な入力が可能となる。
【0055】
(他の形態例)
前述の形態例の場合には、図3に示すように、検索インデックスを、本文の検索インデックス300と、地図画像部範囲の検索インデックス310と、地図上アノテーションの検索インデックス320で構成した。しかし、検索インデックスは、本文の検索インデックス300と地図画像部範囲の検索インデックス310だけで構成しても良いし、いずれか1つだけで構成しても良い。
【0056】
前述の形態例の場合には、地図検索の範囲を地図上の範囲として直接入力する場合について説明した。しかし、検索範囲はキーボード等を通じて数値として入力しても良い。
【0057】
前述の形態例の場合には、検索結果の絞込みの際、本文中に検索語が含まれる文書を絞り込み条件(ステップ640)とするか、アノテーションに検索語が含まれる文書を絞り込み条件(ステップ650)としたが、本文とアノテーションのいずれか一方に検索語が含まれることを絞り込み条件に用いても良い。
【符号の説明】
【0058】
100:検索ホストシステム
110:検索インデックス作成部
120:検索画面表示制御部
130:検索処理部
140:検索インデックス格納部
150:ファイルサーバ
160:ネットワーク
170:検索端末
200:地図画像部
210:本文
220:アノテーション
230:アノテーション
300:本文の検索インデックス
310:地図画像部範囲の検索インデックス
320:地図上アノテーションの検索インデックス
400:検索範囲入力及び検索結果の地図表示部
410:検索語入力部
420:検索語入力欄
430:チェックボックス
440:検索結果のテキスト表示部
450:検索範囲
460:地図画像部やアノテーションの位置

【特許請求の範囲】
【請求項1】
文書ファイルから検索インデックスを作成するシステムであって、
文書ファイルに含まれる1つ又は複数の地図画像又は写真画像の付属データから画像範囲を示す経度緯度情報を抽出する手段と、
前記経度緯度情報と、当該経度緯度情報に対応する地図画像又は写真画像を特定する識別情報とを含む検索インデックスを作成する手段と
を有する検索インデックス作成システム。
【請求項2】
請求項1に記載の検索インデックス作成システムは、
前記地図画像又は前記写真画像に貼り付けられたアノテーションの付属データから、当該アノテーションの前記地図画像又は前記写真画像上における貼り付け位置を特定する経度緯度情報を抽出する手段を更に有し、
前記検索インデックスを作成する手段は、前記検索インデックスとして、前記アノテーションの経度緯度情報を含める
ことを特徴とする検索インデックス作成システム。
【請求項3】
文書検索システムにおいて、
文書ファイルを格納するファイルサーバと、
前記文書ファイルに含まれる1つ又は複数の地図画像又は写真画像の付属データから画像範囲を示す経度緯度情報を抽出する手段と、
前記経度緯度情報と、当該経度緯度情報に対応する地図画像又は写真画像を特定する識別情報とを含む検索インデックスを作成する手段と、
作成された検索インデックスを格納する検索インデックス格納部と、
検索条件として、経度緯度の範囲の設定を、操作画面を通じて受付ける手段と、
検索条件として受付けた経度緯度範囲に経度緯度情報を含む前記検索インデックスを検索する手段と、
検索結果を出力する手段と
を有する文書検索システム。
【請求項4】
請求項3に記載の文書検索システムにおいて、
検索条件としての経度緯度の範囲は、画面上に表示された前記地図画像又は写真画像に対する範囲指定を通じて特定される
ことを特徴とする文書検索システム。
【請求項5】
請求項3に記載の文書検索システムは、
前記地図画像又は前記写真画像に貼り付けられたアノテーションの付属データから、当該アノテーションの前記地図画像又は前記写真画像上における貼り付け位置を特定する経度緯度情報を抽出する手段を更に有し、
前記検索インデックスを作成する手段は、前記検索インデックスとして、前記アノテーションの経度緯度情報を含める
ことを特徴とする文書検索システム。
【請求項6】
請求項5に記載の文書検索システムにおいて、
前記検索インデックスを用いた検索に際し、前記アノテーションの経度緯度情報を検索対象に含めるか否かを選択する画面を操作画面に表示させる手段を更に有する
ことを特徴とする文書検索システム。
【請求項7】
請求項5に記載の文書検索システムにおいて、
検索結果を出力する手段は、検索条件を満たすアノテーションを、検索条件としての経度緯度の範囲を含む地図画像又は写真画像上の各対応位置に重ねて表示する検索結果画面を出力する
ことを特徴とする文書検索システム。
【請求項8】
文書ファイルに含まれる1つ又は複数の地図画像又は写真画像の付属データから画像範囲を示す経度緯度情報を抽出する機能と、
前記経度緯度情報と、当該経度緯度情報に対応する地図画像又は写真画像を特定する識別情報とを含む検索インデックスを作成する機能と
をコンピュータに実行させるプログラム。
【請求項9】
請求項8に記載のプログラムは、
前記地図画像又は前記写真画像に貼り付けられたアノテーションの付属データから、当該アノテーションの前記地図画像又は前記写真画像上における貼り付け位置を特定する経度緯度情報を抽出する機能を更に有し、
前記検索インデックスを作成する機能は、前記検索インデックスとして、前記アノテーションの経度緯度情報を含める
ことを特徴とするプログラム。
【請求項10】
文書ファイルに含まれる1つ又は複数の地図画像又は写真画像の付属データから画像範囲を示す経度緯度情報を抽出する機能と、
前記経度緯度情報と、当該経度緯度情報に対応する地図画像又は写真画像を特定する識別情報とを含む検索インデックスを作成する機能と、
検索条件として、経度緯度の範囲の設定を、操作画面を通じて受付ける機能と、
検索条件として受付けた経度緯度の範囲に経度緯度情報を含む前記検索インデックスを検索する機能と、
検索結果を出力する機能と
をコンピュータに実行させるプログラム。
【請求項11】
請求項10に記載のプログラムにおいて、
検索条件としての経度緯度の範囲の設定を、画面上に表示された前記地図画像又は写真画像に対する範囲指定を通じて特定する
ことを特徴とするプログラム。
【請求項12】
請求項10に記載のプログラムは、
前記地図画像又は前記写真画像に貼り付けられたアノテーションの付属データから、当該アノテーションの前記地図画像又は前記写真画像上における貼り付け位置を特定する経度緯度情報を抽出する機能を更に有し、
前記検索インデックスを作成する機能が、前記検索インデックスとして、前記アノテーションの経度緯度情報を含める
ことを特徴とするプログラム。
【請求項13】
請求項12に記載のプログラムにおいて、
前記検索インデックスを用いた検索に際し、前記アノテーションの経度緯度情報を検索対象に含めるか否かを選択する画面を操作画面に表示させる機能を更に有する
ことを特徴とするプログラム。
【請求項14】
請求項12に記載のプログラムにおいて、
検索結果を出力する機能は、検索条件を満たすアノテーションを、検索条件としての経度緯度の範囲を含む地図画像又は写真画像上の各対応位置に重ねて表示する検索結果画面を出力する
ことを特徴とするプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate