情報検索装置、情報検索方法、制御プログラム及び記録媒体
【課題】情報の検索結果の可視化において、表示される検索結果の態様を、ユーザの理解を助けるより有効な態様とすること。
【解決手段】本発明の一態様は、指定条件情報取得部101と、適合情報抽出部102と、抽出結果処理部103と、座標記憶部143とを有し、抽出結果処理部103は、適合情報抽出部102が抽出して分類情報に基づいて集計された集計結果情報が、座標記憶部143に記憶されている情報においてその分類情報に関連付けられている座標によって特定される位置に表示されるように抽出結果表示情報を生成し、座標記憶部143に記憶されている情報は、内容の類似する分類情報が座標空間上において近傍乃至隣接して配置されるように生成された情報であることを特徴とする。
【解決手段】本発明の一態様は、指定条件情報取得部101と、適合情報抽出部102と、抽出結果処理部103と、座標記憶部143とを有し、抽出結果処理部103は、適合情報抽出部102が抽出して分類情報に基づいて集計された集計結果情報が、座標記憶部143に記憶されている情報においてその分類情報に関連付けられている座標によって特定される位置に表示されるように抽出結果表示情報を生成し、座標記憶部143に記憶されている情報は、内容の類似する分類情報が座標空間上において近傍乃至隣接して配置されるように生成された情報であることを特徴とする。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報検索装置、情報検索方法、制御プログラム及び記録媒体に関し、特に、情報検索による抽出結果の表示態様に関する。
【背景技術】
【0002】
電子データに対する検索技術、あるいは検索結果の表示技術は、検索対象の情報量の増大による検索結果数の増大のため、ますます重要な技術となっている。なぜなら、求める情報が大量の検索結果に埋もれてしまい、見つけることが困難になっているからである。このような検索技術として、例えば、検索結果をその内容に応じてクラスタリングし、2次元座標上に配置して表示する技術が提案されている(例えば、特許文献1参照)。
【0003】
特許文献1に開示された検索方法による検索結果表示は、文書データベースから取り出された2つの文書ユニットの集合に対し、夫々の要素間の関連度を計算し、その結果を2次元座標上に関連度の強さに応じて表示する。これにより、文書データベースから取り出された文書ユニットがどのような情報と関連性を有するかを可視化することが可能となる。
【特許文献1】特開2007−233752号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
しかしながら、特許文献1に開示された方法は、文書に含まれる文言を解析する必要があるため、処理に非常に長い時間を要する。従って、検索条件を変更しながら好適な検索結果を得るような検索処理に適用することが困難である。また、特許文献1に開示された方法においては、検索対象の文書群や検索結果に応じて動的に座標軸が決定されるため、異なる検索文書群や検索結果の2次元表示を重ね合わせて比較することが不可能である。
【0005】
尚、このような課題は、上述したように文字列によって情報が開示される文書情報の場合に限らず、画像情報等のその他の情報の場合においても同様に課題となり得る。本発明は、上記実情を考慮してなされたものであり、情報の検索結果の可視化において、表示される検索結果の態様を、ユーザの理解を助けるより有効な態様とすることを目的とする。
【課題を解決するための手段】
【0006】
上記課題を解決するために、請求項1に記載の発明は、予め格納されている複数の検索対象情報から指定された条件に適合する適合情報を抽出する情報検索装置であって、前記指定された条件に関する指定条件情報を取得する指定条件情報取得部と、前記取得した指定条件情報に基づいて前記適合情報を抽出する情報抽出部と、前記検索対象情報に付加されている情報であって前記検索対象情報が開示している内容を当該内容に基づいて分類した分類情報毎に前記抽出された適合情報を集計する抽出結果集計部と、前記分類情報毎に集計された適合情報の集計結果に関する集計結果情報をその分類情報に基づいて座標上に配置して表示させるための抽出結果表示情報を生成する抽出結果表示情報生成部と、前記座標上の位置を特定する座標と前記分類情報とが関連付けられた表示位置情報を記憶している表示位置情報記憶部とを含み、前記表示位置情報は、前記検索対象情報の前記分類情報毎の集計結果及び前記分類情報によって特定される内容に基づき、前記内容の類似する前記分類情報が前記座標上において近傍乃至隣接して配置されるように前記座標上における前記分類情報毎の表示位置が決定されて生成された情報であり、前記抽出結果表示情報生成部は、前記集計結果情報を、前記表示位置情報においてその分類情報に関連付けられている座標によって特定される位置に表示させるように前記抽出結果表示情報を生成することを特徴とする。
【0007】
また、請求項2に記載の発明は、請求項1に記載の情報検索装置において、前記表示位置情報は、異なる複数の分類情報の類似関係を示す情報に基づいて前記座標上における前記分類情報毎の表示位置が決定されて生成された情報であり、前記分類情報の類似関係を示す情報は、前記検索対象情報における前記分類情報の付加態様に基づいて生成された情報であることを特徴とする。
【0008】
また、請求項3に記載の発明は、請求項2に記載の情報検索装置において、前記検索対象情報には異なる複数の分類情報が付加されており、前記分類情報の類似関係を示す情報は、前記予め格納されている複数の検索対象情報の夫々に同時に付加されている複数の分類情報について類似関係を定義することにより生成された情報であることを特徴とする。
【0009】
また、請求項4に記載の発明は、請求項1乃至3いずれか1項に記載の情報検索装置において、前記抽出結果表示情報生成部は、所定の画像を背景として前記集計結果情報を表示させるように前記抽出結果表示情報を生成することを特徴とする。
【0010】
また、請求項5に記載の発明は、請求項4に記載の情報検索装置において、前記抽出結果表示情報生成部は、前記所定の画像として既知の画像を表示させるように前記抽出結果表示情報を生成することを特徴とする。
【0011】
また、請求項6に記載の発明は、請求項4または5に記載の情報検索装置において、前記抽出結果表示情報生成部は、前記所定の画像として地図に関する画像を表示させるように前記抽出結果表示情報を生成することを特徴とする。
【0012】
また、請求項7に記載の発明は、請求項1乃至6いずれか1項に記載の情報検索装置において、前記表示位置情報は、前記検索対象情報の前記分類情報毎の集計結果である分類情報毎の件数の比率に基づき、前記座標上における前記分類情報毎の表示範囲の比率が決定されて生成された情報であることを特徴とする。
【0013】
また、請求項8に記載の発明は、請求項1乃至7いずれか1項に記載の情報検索装置において、前記予め格納されている複数の検索対象情報を前記分類情報毎に集計する検索対象情報集計部と、前記分類情報毎に集計された前記検索対象情報の件数と前記分類情報によって特定される内容に基づいて前記表示位置情報を生成する表示位置情報生成部とを有することを特徴とする。
【0014】
また、請求項9に記載の発明は、請求項8に記載の情報検索装置において、前記表示位置情報生成部は、異なる複数の分類情報の類似関係を示す情報に基づいて前記表示位置情報を生成することを特徴とする。
【0015】
また、請求項10に記載の発明は、請求項9に記載の情報検索装置において、前記予め格納されている複数の検索対象情報の夫々に同時に付加されている複数の分類情報について類似関係を定義することにより前記分類情報の類似関係を示す情報を生成する類似関係情報生成部を有することを特徴とする。
【0016】
また、請求項11に記載の発明は、請求項10に記載の情報検索装置において、前記類似関係情報生成部は、前記異なる複数の分類情報の一である第1の分類情報が付加された前記検索対象情報を抽出し、前記抽出された検索対象情報に付加されている分類情報であって前記第1の分類情報とは異なる分類情報毎に前記抽出された検索対象情報を集計し、前記第1の分類情報とは異なる分類情報の一である第2の分類情報を前記集計結果に基づいて決定し、前記決定された第2の分類情報と前記第1の分類情報との間に類似関係を定義することを特徴とする。
【0017】
また、請求項12に記載の発明は、請求項1乃至11いずれか1項に記載の情報検索装置において、前記検索対象情報は、特許に関する情報を開示する情報であり、前記分類情報は、国際特許分類、ファイルインデックス、Fターム及びCurrent US Classificationのうち少なくともいずれか1つに関する情報であることを特徴とする。
【0018】
また、請求項13に記載の発明は、指定条件情報取得部と、情報抽出部と、抽出結果集計部と、抽出結果表示情報生成部と、表示位置情報生成部とを含み、予め格納されている複数の検索対象情報から指定された条件に適合する適合情報を抽出する情報検索方法であって、前記指定条件情報取得部が、前記指定された条件に関する指定条件情報を取得し、前記情報抽出部が、前記取得した指定条件情報に基づいて前記適合情報を抽出し、前記抽出結果集計部が、前記検索対象情報に付加されている情報であって前記検索対象情報が開示している内容を当該内容に基づいて分類した分類情報毎に前記抽出された適合情報を集計し、前記表示位置情報生成部が、座標上の位置を特定する座標と前記分類情報とが関連付けられた表示位置情報を、前記検索対象情報の前記分類情報毎の集計結果及び前記分類情報によって特定される内容に基づき、前記内容の類似する前記分類情報が前記座標上において近傍乃至隣接して配置されるように前記座標上における前記分類情報毎の表示位置が決定することにより生成し、前記分類情報毎に集計された適合情報の集計結果に関する集計結果情報をその分類情報に基づいて前記座標上に配置して表示するための抽出結果表示情報を生成する前記抽出結果表示情報生成部が、前記表示位置情報において各分類情報に関連付けられている座標によって特定される位置に各分類情報に基づいて集計された前記集計結果情報が表示されるように前記抽出結果表示情報を生成することを特徴とする。
【0019】
また、請求項14に記載の発明は、制御プログラムにおいて、請求項13に記載の制御方法を情報処理装置に実行させることを特徴とする。
【0020】
また、請求項15に記載の発明は、記録媒体であって、請求項14に記載の制御プログラムを情報処理装置が読み取り可能な形式で記録したことを特徴とする。
【発明の効果】
【0021】
本発明の一態様によれば、情報の検索結果の可視化において、表示される検索結果の態様を、ユーザの理解を助けるより有効な態様とすることができる。
【発明を実施するための最良の形態】
【0022】
以下、図面を参照して、本発明の実施形態を詳細に説明する。
本実施形態においては、文字列及び図面等の画像情報を含む特許文献を検索する文献検索装置を含む情報検索システムを例として説明する。尚、本発明は、以下に説明する実施例のように特許文献を検索する場合の他、図書館の蔵書や独自に管理されている資料並びに絵画等、情報を検索するシステムであれば適用可能であり、同様の効果を得ることができる。
【0023】
図1は、本実施の形態に係る情報検索システムの運用形態の例を示す図である。図1に示すように、本実施形態に係る情報検索システムは、情報検索装置1、クライアント装置2及び対象情報DB200を含む。クライアント装置2は、PC(Personal Computer)等の一般的な情報処理装置によって構成される。情報検索装置1は、ネットワークを介してクライアント装置2と接続されており、クライアント装置2からの検索要求を受けて対象情報DB200に格納されている対象情報を検索する。対象情報DB200は、検索対象の情報として特許文献の情報を記憶している。尚、図1に示すように、本実施形態においては、対象情報DB200が情報検索装置1とは別に設けられている例を説明するが、対象情報DB200を情報検索装置1内部に構成することも可能である。対象情報DB200は、HDD等の不揮発性記憶媒体によって構成される。
【0024】
次に、本実施形態に係る情報検索装置1のハードウェア構成について説明する。図2は、本実施形態に係る情報検索装置1のハードウェア構成を示すブロック図である。図2に示すように、本実施形態に係る情報検索装置1は、一般的なサーバやPC(Personal Computer)等の情報処理端末と同様の構成を有する。即ち、本実施形態に係る情報検索装置1は、CPU(Central Processing Unit)10、RAM(Random Access Memory)20、ROM(Read Only Memory)30、HDD(Hard Disk Drive)40及びI/F50がバス80を介して接続されている。また、I/F50にはLCD(Liquid Crystal Display)60及び操作部70が接続されている。
【0025】
CPU10は演算手段であり、情報検索装置1全体の動作を制御する。RAM20は、情報の高速な読み書きが可能な揮発性の記憶媒体であり、CPU10が情報を処理する際の作業領域として用いられる。ROM30は、読み出し専用の不揮発性記憶媒体であり、ファームウェア等のプログラムが格納されている。HDD40は、情報の読み書きが可能な不揮発性の記憶媒体であり、OS(Operating System)や各種の制御プログラム、アプリケーション・プログラム等が格納される。
【0026】
I/F50は、バス80と各種のハードウェアやネットワーク等を接続し制御する。LCD60は、ユーザが情報検索装置1の状態を確認するための視覚的ユーザインタフェースである。操作部70は、キーボードやマウス等、ユーザが情報検索装置1に情報を入力するためのユーザインタフェースである。尚、図1において説明したように、本実施形態に係る情報検索装置1は、サーバとして運用される。従って、LCD600及び操作部70等のユーザインタフェースは省略可能である。
【0027】
このようなハードウェア構成において、ROM30やHDD40若しくは図示しない光学ディスク等の記憶媒体に格納されたプログラムがRAM20に読み出され、CPU10の制御に従って動作することにより、ソフトウェア制御部が構成される。このようにして構成されたソフトウェア制御部と、ハードウェアとの組み合わせによって、本実施形態に係る情報検索装置1の機能を実現する機能ブロックが構成される。
【0028】
次に、本実施形態に係る情報検索装置1の機能ブロックについて、図3を参照して説明する。図3は、本実施形態に係る情報検索装置1の機能ブロック及び情報検索装置1が検索する対象の情報を格納している対象情報DB200を示すブロック図である。図3に示すように、本実施形態に係る情報検索装置1は、検索制御部100、情報入力部110、ネットワークI/F120、表示部130及び座標出力制御部140を有する。
【0029】
情報入力部110は、ユーザが情報検索装置1を操作して検索制御部100に情報を入力するための構成であり、図2に示すI/F50及び操作部70によって実現される。ネットワークI/F120は、情報検索装置1がネットワークを介して情報を取得し、若しくはネットワークを介して情報を送信するためのインタフェースであり、図2に示すI/F50によって実現される。具体的には、例えばEthernet(登録商標)接続のインタフェースや、USB(Universal Serial Bus)接続のインタフェースによって実現される。表示部130は、情報検索装置1の動作状態や、検索結果等が表示される構成であり、図2に示すI/F50及びLCD60によって実現される。
【0030】
検索制御部100は、本実施形態に係る情報検索装置1の検索機能を担う構成であり、指定条件情報取得部101、適合情報抽出部102及び抽出結果処理部103を有する。指定条件情報取得部101は、ユーザによって情報入力部110を介して入力された情報若しくはネットワークI/F120を介してネットワーク経由で入力された情報を指定条件情報として取得する。指定条件情報取得部101は、図2に示すRAM20にロードされたプログラムがCPU10の制御に従って動作することにより構成される。指定条件情報とは、対象情報DB200から所望の情報を抽出するための条件として、ユーザによって指定される条件である。
【0031】
適合情報抽出部102は、指定条件情報取得部101が取得した指定条件情報に基づき、対象情報DB200に格納されている情報を適合情報として抽出する。即ち、適合情報抽出部102は、指定条件情報によって指定されている条件に適合する情報を対象情報DB200から抽出する情報抽出部として機能する。情報抽出部は、図2に示すRAM20にロードされたプログラムがCPU10の制御に従って動作することにより構成される。
【0032】
抽出結果処理部103は、適合情報抽出部102による適合情報の抽出結果を表示部130若しくはクライアント装置2の表示部に表示するための抽出結果表示情報を生成して、出力する。即ち、抽出結果処理部103は、指定条件情報によって指定されている条件に適合する情報として抽出された適合情報を表示部130若しくはクライアント装置2の表示部に表示させるための抽出結果表示情報を生成する抽出結果表示情報生成部として機能する。抽出結果表示情報生成部は、図2に示すRAM20にロードされたプログラムがCPU10の制御に従って動作することにより構成される。また、本実施形態に係る抽出結果処理部103は、上記抽出結果表示情報の生成に際して、出力制御部140によって生成される情報を参照する。これについては、後に詳述する。
【0033】
座標出力制御部140は、本発明の要旨となる構成であり、対象情報DB200に格納された情報をIPC(International Patent Classification)等の分類情報に基づいて視覚的に分類して座標空間上に表示する際の座標を制御する。本実施形態に係る出力制御部140は、カウント部141、座標決定部142及び座標記憶部143を有する。尚、本実施形態においては、上記分類情報としてIPCを用いる場合を例とするが、FI(File Index)、Fターム(File Forming Term)、Current US Classification等を用いることも可能である。また、本実施形態において座標出力制御部140は、対象情報DB200に格納されている情報を2次元座表上に表示するための座標を制御するが、3次元の立体座標等、2次元以外の座標であっても良い。
【0034】
カウント部141は、対象情報DB200に格納されている情報の件数を夫々の分類情報毎にカウントする。カウント部141は、図2に示すRAM20にロードされたプログラムがCPU10の制御に従って動作することにより構成される。座標決定部142は、カウント部141のカウント結果及び分類情報の類似関係に基づき、抽出結果の座標上への表示における夫々の分類情報毎の表示範囲を決定する。即ち、座標決定部142は、出力する座標空間(本実施形態においては、2次元座標空間)における前記要素分類情報毎の表示範囲を決定する表示範囲決定部として機能する。表示範囲決定部142は、図2に示すRAM20にロードされたプログラムがCPU10の制御に従って動作することにより構成される。座標決定部142は、上記決定した表示範囲を座標情報として生成し、座標記憶部143に記憶させる。
【0035】
座標記憶部143は、座標決定部142が生成した座標情報を記憶する記憶部である。本実施形態に係る情報検索装置1において検索制御部100が対象情報DB200の検索を実行し、抽出結果処理部103が抽出結果表示情報を生成する際は、座標記憶部143に記憶されている座標情報に基づいて抽出された適合情報の表示範囲を決定する。
【0036】
このような情報検索装置1において、本実施形態は、座標出力制御部140による座標情報の制御及び検索制御部101による抽出結果表示情報の生成に特徴を有する。以下、本実施形態に係る情報検索装置1の動作について図を参照して説明する。図4は、本実施形態に係る情報検索システムにおいて、座標出力制御部140が、対象情報DB200に格納されている情報に付与されたIPCに基づき、座標情報を生成する際の動作を示すフローチャートである。図4に示すように、座標情報の生成に際して、座標出力制御部140は、先ずIPCに含まれる各項目のうち、対象とする項目を決定する(S401)。ここで、IPCに含まれる項目について、図5を参照して説明する。
【0037】
図5は、IPCの例として、“A61C 5/08”というIPCの構成を示す図である。図5に示すように、IPCは先頭から、“セクション”、“サブセクション”、“クラス”、“メイングループ”、“サブグループ”という項目に分けられている。図5の例においては、先頭から、“A”の部分がセクション、“61”の部分がサブセクション、“C”の部分がクラス、“5/”の部分がメイングループ、“08”の部分がサブグループを夫々示している。
【0038】
S401の処理においては、先頭から順番に項目を選択する。即ち、座標情報の生成を開始して最初のS401の処理においては、“セクション”を対象項目とする。対象項目が決定されると、次に、カウント部141が、対象項目毎に対象情報DB200に記憶されている文献の件数をカウントする(S402)。IPCにおけるセクションは“A”〜“H”のアルファベットに分類されている。従って、S402の処理においては、セクションが“A”〜“H”夫々であるIPCが付された文献数をカウントする。即ち、カウント部141が、検索対象情報集計部として機能する。検索対象情報集計部は、図2に示すRAM20にロードされたプログラムがCPU10の制御に従って動作することにより構成される。図6に、S402の処理の結果生成される情報を示す。図6に示すように、S402の処理の結果、セクション“A”〜“H”夫々のIPCが付された文献数の情報が生成される。
【0039】
ここで、特許文献には、複数のIPCが付されていることが多い。例えば、図7に示すように、一の文献に、“G06F 1/26”、“H02J 1/00”及び“H02J 9/06”という3つのIPCが付されている場合を考える。この場合、付されているIPCのセクションは“G”及び“H”である。ここで、本実施形態においては、セクション“G”の文献数をカウントする際、1件としてカウントするが、セクション“H”の文献数をカウントする際は、“H02J 1/00”のセクションとしての“H”と“H02J 9/06”のセクションとしての“H”について夫々別々にカウントする。即ち、図7に示すIPCが付された文献はセクション“G”のカウントにおいて1件としてカウントされ、セクション“H”のカウントにおいて2件としてカウントされる。
【0040】
本実施形態においては、座標上における各IPCの表示範囲の比率を、対象情報DB200に記憶されている文献に付された夫々のIPC毎の件数に基づいて決定する。即ち、図7の例においては、“H02J 1/00”のIPCが付された情報を表示する範囲と“H02J 9/06”のIPCが付された情報を表示する範囲との比率を夫々のIPCが付された文献の件数に基づいて決定する。従って、夫々のIPCが付された情報の件数に基づいて正確に座標上の範囲を区分けするために、図7において説明したようなカウント方法を用いる。
【0041】
S402の処理の結果、図6に示すように項目毎のカウント値の情報を生成すると、カウント部141は、そのカウント値の比率に基づき、夫々の項目(図6の場合、セクション)のIPCが付された文献を表示すべき座標上の範囲の面積比を決定する(S403)。図8に、S403の処理の結果生成される情報を示す。図8に示すように、S403の処理の結果、セクション“A”〜“H”夫々のIPCが付された文献を表示すべき座標上の範囲の面積比を示す情報が生成される。図8に示すように、セクション“A”〜“H”夫々の面積比はパーセンテージで示され、セクション“A”〜“H”全ての面積比を合計すると100%となる。
【0042】
S403の処理の結果、図8に示すように項目毎の面積比の情報が生成されると、座標決定部142は、その面積比に基づき、夫々の項目のIPCが付された文献を表示すべき座標空間上の範囲の座標を決定する(S404)。即ち、上記面積比の情報を生成するカウント部141と座標決定部142とが表示位置情報生成部として機能する。表示位置情報生成部は、図2に示すRAM20にロードされたプログラムがCPU10の制御に従って動作することにより構成される図9に、S404の処理の結果生成される情報を示す。図9に示すように、S403の処理の結果、セクション“A”〜“H”夫々のIPCが付された文献を表示すべき座標空間上の範囲の座標を示す情報が生成される。
【0043】
図10に、S404の処理の結果生成される座標情報によって区切られる座標空間上の範囲を示す。図10に示すように、座標決定部142は、座標空間上の範囲を夫々長方形に区切るように座標情報を生成する。また、図9に示すように、座標決定部142は、長方形の対角の頂点(例えば、右上と左下)の座標を特定することにより、夫々の範囲を特定する。
【0044】
更に、座標決定部142は、項目毎の座標空間上の範囲を決定する際、類似する内容の項目が隣接して配置され若しくは隣接しないまでも近傍に配置されるように範囲を決定し、座標情報を生成する。図10の例においては、セクション“A”は、セクション“B”、“D”、“C”及び“G”と類似すると判断されており、セクション“B”は、セクション“E”、“F”、“D”及び“A”と類似すると判断されている。セクション毎の類似関係は、対象情報DB200に格納されている検索対象の文献に付与されたIPCのセクションに基づいて定められる。これについては、後に詳述する。座標決定部142は、図9に示す座標情報を座標記憶部143に記憶させる。
【0045】
S404の座標情報の生成処理が完了すると、座標出力制御部140は、IPCの全項目、即ち、図5に示すサブグループまでS404までの処理が完了したかを判定する(S405)。ここでは、図5に示す“セクション”の項目について処理が完了した状態であるため、座標出力制御部140は、処理が未完了であると判断し(S405/NO)、図5に示す“セクション”の次の項目である“サブセクション”の項目を選択し(S401)、S402以降の処理を繰り返す。
【0046】
図4のS401に戻り、対象項目として図5に示す“サブセクション”をすると、“A”〜“H”夫々のセクションについて、サブセクション毎に対象情報DB200に記憶されている文献の件数をカウントする(S402)。図5に示すように、サブセクションは2桁の数値で示され、“01”〜“99”の数値が用いられる。尚、“01”〜“99”の数値のうちサブセクションとして用いられる数値は夫々のセクション毎に異なる。
【0047】
S401において“サブセクション”を対象項目とした場合においてS402〜S404の処理の結果生成される情報を図11に示す。図11に示すように、“サブセクション”を対象項目としてS402〜S404の処理を実行した結果、図8に示すセクション毎の座標情報が更にサブセクション毎に分割され、夫々のサブセクションについて座標情報が生成される。サブセクション毎の表示範囲を決定する場合においても、座標決定部143は、類似する内容の項目が隣接して配置され若しくは隣接しないまでも近傍に配置されるように範囲を決定し、座標情報を生成する。
【0048】
図11に示す座標情報に基づいて座標空間上の範囲を区切った図を図12に示す。図12に示すように、サブセクションに基づいて座標空間上の範囲を分割した結果、図10に示すセクション毎に分割された態様を更に細かく分割した状態となる。座標空間上の範囲をサブセクション毎に分割する座標情報の生成処理が完了すると、座標出力制御部140は再度S405の判断処理を実行し、図5に示す“クラス”、“メイングループ”及び“サブグループ”までの項目について、S402〜S404までの処理が完了するまで(S405/NO)処理を繰り返す。
【0049】
図5に示す“セクション”〜“サブグループ”までの全項目についてS402〜S404の処理が完了すると(S405/YES)、座標決定部142によって生成された座標情報、即ち、座標空間上の範囲を図5に示す“セクション”〜“サブグループ”までの全項目について分割する座標情報が座標記憶部143に記憶され、処理を終了する。
【0050】
このような処理により、座標空間上における夫々の範囲と夫々の分類情報とを関連付けて記憶したテーブルが生成され、座標記憶部143に記憶される。本実施形態において座標記憶部143に記憶される情報の例について、図13に示す。図4の動作の結果生成されて座標記憶部143に記憶される情報には、図13に示すように、図5に示すIPCの各項目毎に座標空間上における表示範囲を示す座標情報が含まれる。
【0051】
例えば、“A01B 1/00”のIPCが付されている文献は、座標空間上において、(A01B1/00X1,A01B1/00Y1)及び(A01B1/00X2,A01B1/00Y2)の座標を対角の頂点とする長方形の範囲に表示される。即ち、図13に示す情報は、座標空間上における位置を特定する座標の情報と分類情報であるIPCとが関連付けられて記憶された表示位置情報として用いられる。また、図13に示す情報を記憶している座標記憶部143は、表示位置情報記憶部として機能する。表示位置情報記憶部は、図2に示すRAM20にロードされたプログラムがCPU10の制御に従って動作することにより構成される。
【0052】
このように、本実施形態においては、座標空間上における検索結果の表示位置を、検索対象である文献に予め付与された分類情報の階層構造に基づいて決定する。換言すると、座標空間を分類情報の階層構造に基づいて分割する。これにより、大規模な文書群に対しても実用的な応答時間で処理を完了することが可能となる。
【0053】
本実施形態においては、ユーザによって指定された条件に基づいて検索を実行した結果を可視化して座標空間上に表示する際、夫々の検索結果を表示する位置を上記生成されたテーブルに基づいて決定する。以下に、本実施形態に係る検索及び検索結果の表示動作について説明する。
【0054】
図14は、本実施形態に係る情報検索システムにおける情報検索動作を示すシーケンス図である。図14に示すように、対象情報DB200に登録されている情報を検索する際、先ず、ユーザはクライアント装置2を操作して検索条件を指定するための検索条件指定画面を表示するための情報を情報検索装置1から取得し、検索条件指定画面を表示する(S1401)。以下、本実施形態の説明においては、ユーザがクライアント装置2を操作して情報検索装置1の機能を利用する場合を例として説明するが、情報検索装置1の情報入力部110を操作して検索を実行する場合も同様である。
【0055】
ユーザは、クライアント装置2の操作部を操作することにより、文章やキーワード及び文献の書誌的事項等を、対象情報DB200に格納されている情報を抽出するための条件として入力し、情報検索装置1に対して指定条件情報として送信する(S1402)。情報検索装置1に送信された指定条件情報は、ネットワークI/F120から情報検索装置1に入力され、検索制御部100の指定条件情報取得部101が取得する(S1403)。
【0056】
適合情報抽出部102は、指定条件情報取得部101が取得した指定条件情報に基づき、対象情報DB200からの適合情報の抽出を実行する(S1404)。尚、適合情報抽出部102は、指定条件情報としてキーワードを取得した場合はそのキーワードを含む文献を、文章を取得した場合は文章を構成する単語を含む文献を、書誌的事項を取得した場合はその書誌的事項に合致する文献を夫々適合情報として、対象情報DB200から抽出する。即ち、適合情報抽出部102は、予め格納されている検索対象情報から適合情報を抽出する情報抽出部として機能する。情報抽出部は、図2に示すRAM20にロードされたプログラムがCPU10の制御に従って動作することにより構成される。
【0057】
抽出結果処理部103は、S1404の処理により適合情報抽出部102が適合情報を抽出すると、適合情報として抽出された文献に付されているIPCを参照し、適合情報として抽出された文献のうち、夫々のIPCが付されている文献の件数をカウントしてテーブル(以降、適合文献カウント情報とする)を生成する(S1405)。ここで、S1405のカウント処理においては、一の文献に複数のIPCが付されている場合、夫々のIPC毎に1件としてカウントする。例えば、図7の場合、“G06F 1/26”として1件、“H02J 1/00”として1件、“H02J 9/06”として1件カウントし、合計3件分カウントする。即ち、抽出結果処理部103が、適合情報を分類情報毎に集計する抽出結果集計部として機能する。抽出結果集計部は、図2に示すRAM20にロードされたプログラムがCPU10の制御に従って動作することにより構成される。
【0058】
S1405の処理の結果生成される適合文献カウント情報を図15に示す。S1405の処理の結果生成される適合文献カウント情報には、適合情報として抽出された文献に付されたIPCとそのIPCにが付されている文献の件数との情報とが含まれる。例えば、図15に示す例において、適合情報のうち“A01B 1/14”のIPCが付された文献は25件である。
【0059】
次に、抽出結果処理部103は、座標記憶部143に記憶されている座標情報(図13に示す情報)を取得する(S1406)。図15に示す適合文献カウント情報の生成及び座標情報の取得が完了すると、抽出結果処理部103は、抽出結果を表示するための抽出結果表示情報を生成して、ネットワークI/F120を介してクライアント装置2に送信する(1407)。即ち、抽出結果処理部104が、抽出結果表示情報を生成する抽出結果表示情報生成部として機能する。抽出結果表示情報を受信したクライアント装置2は、その表示部に抽出結果を表示し(S1408)、処理を終了する。
【0060】
S1407における抽出結果表示情報の生成態様について、図16を参照して説明する。図16は、S1407においてクライアント装置2の表示部に表示される抽出結果表示画面300を示す図である。図16に示す抽出結果表示画面300の座標は、世界地図を背景とし、図13において説明した座標空間上の座標と対応している。そして、図16の抽出結果表示画面300においては、図15において説明した適合文献カウント情報に基づき、夫々のIPCが付された適合文献の件数に応じた大きさのドットが、夫々対応する座標の範囲に表示されている。
【0061】
換言すると、S1407の処理において、抽出結果処理部103は、適合文献カウント情報に基づき、夫々のIPCが付された適合情報の件数に応じた大きさのドットを、夫々のIPCに対応する座標(図13に示す座標情報において関連付けられている座標)の範囲に表示するように抽出結果表示情報を生成する。これにより、抽出された適合情報を、その内容に応じて座標空間上に配置して表示することが可能となる。即ち、抽出結果処理部103が、抽出結果表示情報生成部として機能する。抽出結果表示情報生成部は、図2に示すRAM20にロードされたプログラムがCPU10の制御に従って動作することにより構成される。
【0062】
ここで、本実施形態においては、座標空間上におけるセクション毎の範囲を決定する際に参照するセクション毎の類似関係を、対象情報DB200に格納されている検索対象の文献に付与されたIPCのセクションに基づいて定める。これについて、以下に説明する。
【0063】
図17は、セクション毎の類似関係を定める動作を示すフローチャートである。図17に示すように、セクション毎の類似関係を定める際、先ずカウント部141がセクションの組み合わせ毎に対象情報DB200に格納されている文献の件数をカウントする(S1701)。具体的には、セクションが“A”であるIPCと“B”であるIPCとが付されている文献の件数、セクションが“A”であるIPCと“C”であるIPCとが付されている文献の件数、というように、対象情報DB200に格納されている文献の件数をカウントする。
【0064】
S1701の処理の結果生成される情報を図18に示す。図18に示すように、S1701の処理の結果生成される情報は、セクションの組み合わせとその組み合わせのカウント結果とを含む。図18に示すような情報において文献数、即ちカウント結果が多い組み合わせのセクションは、類似関係が強いと判断することができる。従って、座標出力制御部141は、図18に示す情報に基づき、カウント結果が多いセクションの組み合わせを、互いに類似関係にあるセクションとして定義し(S1702)、処理を終了する。即ち、座標出力制御部141が、分類情報の類似関係を示す情報を生成する類似関係情報生成部として機能する。類似関係情報生成部は、図2に示すRAM20にロードされたプログラムがCPU10の制御に従って動作することにより構成される。
【0065】
このような処理により、対象情報DB200に既に格納されている情報の内容、より具体的には、文献情報における分類情報(本実施形態においてはIPC)の付加態様に基づき、セクション毎の類似関係を定義することができる。即ち、図17の処理の結果生成される情報が、分類情報の類似関係を示す情報として用いられる。図17に示す処理は、図4において説明した座標情報の生成処理におけるS404において実行しても良いし、図4に示すS404の前に予め実行してセクション毎の類似関係を定義し、座標出力制御部140内部若しくは他の記憶媒体に記憶しておいても良い。
【0066】
また、上述したように、図5に示す“サブセクション”以下の項目について、座標空間上における表示範囲の座標を図11、図12に示すように決定する際にも、“サブセクション”、“クラス”、“メイングループ”及び“サブグループ”夫々の項目毎の類似関係に基づいて隣接配置若しくは近傍配置が決定される。従って、上記項目の類似関係の定義についても、図17において説明した方法と同一若しくはそれに順ずる方法が用いられる。尚、セクション毎の類似関係を含め、上述したIPCの各項目毎の類似関係は、ユーザによって定義され、情報入力部110若しくはネットワークI/F120を介して座標出力制御部140に入力されるようにしても良い。
【0067】
以上説明したように、本実施形態に係る情報検索装置1においては、図4に示す動作によって予め生成され座標記憶部143に記憶されている座標情報に基づいて、各IPCに応じた座標空間上の表示範囲を決定する。従来の情報検索装置による図16のような表示は、夫々の検索結果に応じて動的に座標空間が定義されていた。従って、異なる検索条件に基づいて抽出された検索結果を重ね合わせて表示することにより比較することが無意味であった。これに対し、本実施形態に係る情報検索装置1は、抽出結果を座標空間上に可視化する際の座標情報が予め定義され、座標記憶部143に記憶されている。従って、異なる検索条件に基づいて生成された複数の抽出結果表示画面300を重ね合わせて表示することにより互いに比較し、その開示内容の分布の差異を視覚的に確認することが可能である。
【0068】
尚、異なる検索条件に基づいて生成された複数の抽出結果表示画面300を重ね合わせて表示することにより互いに比較し、その開示内容の分布の差異を視覚的に確認する場合、一の検索結果に係るドットの表示態様と他の検索結果に係るドットの表示態様とを異なる態様とすることにより、両者の差異を明確にし、ユーザによる比較を容易にすることができる。ドットの表示態様の変化としては、例えばドットの色を変化させる場合や、ドットではない他の形により表示する場合等が考えられる。
【0069】
また、本実施形態に係る抽出結果表示画面300においては、抽出結果を示すドットが固定された座標軸上に配置され表示される、これにより、IPC等の分類情報の定義に習熟したユーザが抽出結果表示画面300を確認する場合、夫々のドットが配置された位置が意味する内容を容易に把握することが可能となり、可読性に優れた検索結果の表示を行なうことができる。
【0070】
ここで、本実施形態に係る抽出結果表示画面300のように、予め定義された座標空間を用いて、夫々のIPCが付された文献の数に応じた大きさのドットを座標空間上に表示する場合、適正に座標を定義する必要がある。例えば、夫々のIPCに対応するドットを表示する範囲を、図19に示すように、全てのIPCで同一の面積とした場合を考える。この場合、図20に示すように、一のドット191の大きさが、一のIPCに対応する範囲として割り当てられた範囲よりも大きくなり、隣接する範囲のドット192や近傍に配置されたドット193を覆い隠してしまう場合がある。図20に示すような場合、抽出結果の内容に応じた分布を正確に確認することができない。
【0071】
また、図19に示す場合において、隣接する範囲のドットや近傍に配置されたドットを覆い隠すことがないように、ドットの大きさの限度を一のIPCについて割り当てられた範囲とする場合を考える。この場合、図21に示すように、一のIPCに対応する範囲として割り当てられた範囲に対して、ドットが視認困難な程度まで非常に小さくなることが考えられる。この場合も、抽出結果の内容に応じた分布を正確に確認することが困難となる。
【0072】
図20、図21に示すような問題に対して、本実施形態においては、各IPCが付された文献を表示すべき座標空間上の範囲の面積を、対象情報DB200に格納されている文献の件数であって、夫々のIPCが付されている文献の件数の比率に基づいて決定する。従って、図20において説明したように、各ドットの大きさが表示すべき範囲の広さを超えてしまい、隣接する範囲若しくは近傍の範囲のドットが表示不能となってしまうことを防ぐことができる。また、図21において説明したように、夫々のドットの大きさが非常に小さくなることを防ぐことができる。
【0073】
また、上述したように、本実施形態においては、各IPCが付された文献を表示すべき座標空間上の範囲の配置を図10や図12のように決定する際、類似する内容のIPCを隣接若しくは近傍に配置するように決定する。これにより、図16に示すような可視化表示の抽出結果表示画面300において、類似する内容を開示する文献のドットは隣接して若しくは近傍に配置される。従って、抽出結果表示画面300は、ユーザによって指定された条件に適合する文献の内容に応じた分布を示すこととなり、ユーザによる情報解析において有意義な情報となる。
【0074】
また、図16に示すように、本実施形態に係る抽出結果表示画面300においては、世界地図を背景とし、IPC毎のカウント結果に応じたドットを対応する座標位置に表示している。このように、抽出結果のドット分布を表示する際に、何らかのモチーフを背景として表示することにより、検索結果の表示内容の把握を容易化することができる。背景として選択するモチーフとしては、図16に示すような世界地図などの既知のモチーフが好ましい。特に、世界地図などの地図を背景とすることにより、ドットの分布位置を地図上の地名で表現することが可能であるため、更に好ましい。
【0075】
尚、上述したように、本実施形態においては、複数のIPCが付されている文献の場合、夫々のIPC毎に1件としてカウントする例を説明した。この他、例えば、図4のS402及び図14のS1405において、夫々の文献において先頭に付されているIPCのみを考慮してカウントするようにしても良い。
【0076】
尚、上記の説明においては、図16に示すように、IPC等の分類情報毎に集計された集計結果に関する情報としての文献の件数を、その件数に応じた大きさのドットで示す例を説明した。この場合、ドットの中心は夫々のIPCに関連付けられた座標範囲の中心とすることができる。また、ドットの大きさで示す場合の他、例えば夫々のIPCに関連付けられた座標範囲を塗りつぶす濃度で示すことができる。
【0077】
また、上記の説明においては、図13に示すように、夫々のIPCに対応するドットを表示する位置を2点の座標により範囲で特定する例を説明した。この他例えば、一の座標を表示すべきドットの中心の座標として特定し、座標記憶部143に記憶しても良い。
【0078】
また、上記の説明においては、図3に示すように、情報検索装置1にカウント部141及び座標決定部142を含む座標出力制御部140が含まれる例を説明した。しかしながら、上記カウント部141及び座標決定部142は、図13に示す座標情報を生成して座標記憶部143に記憶する場合に必要となる構成であり、実際に検索を実行する場合には不要な構成である。従って、対象情報DB200に格納されている文献情報の検索を実行する情報検索装置1としては、少なくとも座標情報を記憶している座標記憶部143を含み、カウント部141及び座標決定部142は省略することが可能である。
【0079】
他方、公開特許公報を検索対象とする場合等、対象情報DB200に格納される文献情報は、経時的に増加することが考えられる。これに伴い、分類情報毎の文献の件数も変化するため、座標記憶部143に記憶される座標情報は定期的に更新することが好ましい。情報検索装置1にカウント部141及ぶ座標決定部142を含めることにより、定期的な座標情報の更新が可能となる。
【0080】
また、上記の説明においては、図17において説明したように、セクションの全組み合わせについて対象情報DB200に格納されている文献の件数をカウントした上で、そのカウント結果に基づいてセクション毎の類似関係を定義する例を説明した。セクション毎の類似関係を定義する他の方法について、図22を参照して説明する。セクション毎の類似関係を定義する他の態様においては、図22に示すように、座標出力制御部140がまず“A”〜“H”のセクションのうち、対象とするセクションを1つ決定する(S2201)。ここでは、“A”のセクションを選択したものとして説明する。
【0081】
対象とするセクションが決定されると、カウント部141が、対象セクションのIPCが付された文献を対象情報DB200から抽出する(S2202)。そして、カウント部141は、抽出した文献に付されている他のセクションのIPCを参照し、夫々のセクション毎に件数を集計する(S2203)。S2203の集計処理によって生成される情報を図23に示す。図23に示すように、“A”以外のセクション毎に、夫々の件数がカウントされテーブルが生成される。
【0082】
図23に示すテーブルにおいて、カウント数の多いセクションは、セクション“A”との類似関係が強いと判断することができる。従って、座標出力制御部140は、図23に示すテーブルのうち、カウント数の最も多いセクションをセクション“A”との類似関係があると定義する(S2204)。“A”〜“H”すべてのセクションについて類似関係の定義が完了するまでS2201からの処理を繰り返し(S2205/NO)、“A”〜“H”すべてのセクションについて類似関係の定義が完了したら(S2205/YES)、処理を終了する。
【0083】
図22の処理の結果生成される類似関係を示す情報を図24に示す。図24に示すように、図22の処理の結果、“A”〜“H”夫々のセクションについて、最も類似関係の強いセクションが類似セクションとして定義される。尚、図22の説明においては、図23に示すカウント結果において、最も件数の多いセクションのみを類似セクションとして定義する例を説明したが、最も件数の多いセクションに限らず、例えばカウント数が所定数以上であるセクションを全て類似セクションとして定義しても良いし、カウント数が多い順に複数のセクションを類似セクションとして定義しても良い。
【0084】
尚、上記の説明においては、図14において説明したように、指定条件情報としてキーワード、文章及び書誌的事項を取得する例を説明した。この他、例えば、画像検索においても、検索対象(上記実施形態における文献情報)に含まれる画像情報を一次元記号列に変換すると共に、検索条件として入力された画像情報を一次元記号列に変換することにより文言検索と同様の手法で適合情報の抽出が可能である。これにより、文言検索のみでなく、画像検索等の他の検索態様においても、上記実施形態を適用し、同様の効果を得ることが可能となる。
【0085】
また、上記実施形態においては、特許文献を検索対象とする例を説明した。この他、例えば、図書館等の蔵書を検索する場合にも適用可能である。その場合、上記の説明におけるIPC等の分類情報は日本十進分類法の分類番号等、図書を分類する情報となる。
【図面の簡単な説明】
【0086】
【図1】本発明の実施形態に係る情報検索システムの運用形態を示す図である。
【図2】本発明の実施形態に係る情報検索装置のハードウェア構成を模式的に示すブロック図である。
【図3】本発明の実施形態に係る情報検索装置の機能構成を示すブロック図である。
【図4】本発明の実施形態に係る座標情報の生成動作を示すフローチャートである。
【図5】本発明の実施形態に係る分類情報の項目を示す図である。
【図6】本発明の実施形態に係る座標情報の生成動作において生成される情報の例を示す図である。
【図7】本発明の実施形態に係る検索対象の情報に付されている分類情報の例を示す図である。
【図8】本発明の実施形態に係る座標情報の生成動作において生成される情報の例を示す図である。
【図9】本発明の実施形態に係る座標情報の生成動作において生成される情報の例を示す図である。
【図10】本発明の実施形態に係る座標空間の分類情報毎の分割態様を示す図である。
【図11】本発明の実施形態に係る座標情報の生成動作において生成される情報の例を示す図である。
【図12】本発明の実施形態に係る座標空間の分類情報毎の分割態様を示す図である。
【図13】本発明の実施形態に係る座標情報の生成動作において生成される情報の例を示す図である。
【図14】本発明の実施形態に係る情報検索動作を示すシーケンス図である。
【図15】本発明の実施形態に係る適合文献カウント情報に含まれる情報の例を示す図である。
【図16】本発明の実施形態に係る抽出結果表示画面の例を示す図である。
【図17】本発明の実施形態に係るセクション毎の類似関係を定める動作を示すフローチャートである。
【図18】本発明の実施形態に係るセクション毎の類似関係を定める動作において生成される情報を示す図である。
【図19】本発明の比較例に係る座標空間の分割態様を示す図である。
【図20】本発明の比較例に係る座標空間上のドット表示例を示す図である。
【図21】本発明の比較例に係る座標空間上のドット表示例を示す図である。
【図22】本発明の他の実施形態に係るセクション毎の類似関係を定める動作を示すフローチャートである。
【図23】本発明の他の実施形態に係るセクション毎の類似関係を定める動作において生成される情報を示す図である。
【図24】本発明の他の実施形態に係るセクション毎の類似関係の情報に含まれる情報の例を示す図である。
【符号の説明】
【0087】
1 情報検索装置
2 クライアント装置
10 CPU
20 RAM
30 ROM
40 HDD
50 I/F
60 LCD
70 操作部
80 バス
100 検索制御部
101 指定条件情報取得部
102 適合情報抽出部
103 抽出結果処理部
110 情報入力部
120 ネットワークI/F
130 表示部
140 座標出力制御部
141 カウント部
142 座標決定部
143 座標記憶部
200 対象情報DB
191、192、193 ドット
300 抽出結果表示画面
【技術分野】
【0001】
本発明は、情報検索装置、情報検索方法、制御プログラム及び記録媒体に関し、特に、情報検索による抽出結果の表示態様に関する。
【背景技術】
【0002】
電子データに対する検索技術、あるいは検索結果の表示技術は、検索対象の情報量の増大による検索結果数の増大のため、ますます重要な技術となっている。なぜなら、求める情報が大量の検索結果に埋もれてしまい、見つけることが困難になっているからである。このような検索技術として、例えば、検索結果をその内容に応じてクラスタリングし、2次元座標上に配置して表示する技術が提案されている(例えば、特許文献1参照)。
【0003】
特許文献1に開示された検索方法による検索結果表示は、文書データベースから取り出された2つの文書ユニットの集合に対し、夫々の要素間の関連度を計算し、その結果を2次元座標上に関連度の強さに応じて表示する。これにより、文書データベースから取り出された文書ユニットがどのような情報と関連性を有するかを可視化することが可能となる。
【特許文献1】特開2007−233752号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
しかしながら、特許文献1に開示された方法は、文書に含まれる文言を解析する必要があるため、処理に非常に長い時間を要する。従って、検索条件を変更しながら好適な検索結果を得るような検索処理に適用することが困難である。また、特許文献1に開示された方法においては、検索対象の文書群や検索結果に応じて動的に座標軸が決定されるため、異なる検索文書群や検索結果の2次元表示を重ね合わせて比較することが不可能である。
【0005】
尚、このような課題は、上述したように文字列によって情報が開示される文書情報の場合に限らず、画像情報等のその他の情報の場合においても同様に課題となり得る。本発明は、上記実情を考慮してなされたものであり、情報の検索結果の可視化において、表示される検索結果の態様を、ユーザの理解を助けるより有効な態様とすることを目的とする。
【課題を解決するための手段】
【0006】
上記課題を解決するために、請求項1に記載の発明は、予め格納されている複数の検索対象情報から指定された条件に適合する適合情報を抽出する情報検索装置であって、前記指定された条件に関する指定条件情報を取得する指定条件情報取得部と、前記取得した指定条件情報に基づいて前記適合情報を抽出する情報抽出部と、前記検索対象情報に付加されている情報であって前記検索対象情報が開示している内容を当該内容に基づいて分類した分類情報毎に前記抽出された適合情報を集計する抽出結果集計部と、前記分類情報毎に集計された適合情報の集計結果に関する集計結果情報をその分類情報に基づいて座標上に配置して表示させるための抽出結果表示情報を生成する抽出結果表示情報生成部と、前記座標上の位置を特定する座標と前記分類情報とが関連付けられた表示位置情報を記憶している表示位置情報記憶部とを含み、前記表示位置情報は、前記検索対象情報の前記分類情報毎の集計結果及び前記分類情報によって特定される内容に基づき、前記内容の類似する前記分類情報が前記座標上において近傍乃至隣接して配置されるように前記座標上における前記分類情報毎の表示位置が決定されて生成された情報であり、前記抽出結果表示情報生成部は、前記集計結果情報を、前記表示位置情報においてその分類情報に関連付けられている座標によって特定される位置に表示させるように前記抽出結果表示情報を生成することを特徴とする。
【0007】
また、請求項2に記載の発明は、請求項1に記載の情報検索装置において、前記表示位置情報は、異なる複数の分類情報の類似関係を示す情報に基づいて前記座標上における前記分類情報毎の表示位置が決定されて生成された情報であり、前記分類情報の類似関係を示す情報は、前記検索対象情報における前記分類情報の付加態様に基づいて生成された情報であることを特徴とする。
【0008】
また、請求項3に記載の発明は、請求項2に記載の情報検索装置において、前記検索対象情報には異なる複数の分類情報が付加されており、前記分類情報の類似関係を示す情報は、前記予め格納されている複数の検索対象情報の夫々に同時に付加されている複数の分類情報について類似関係を定義することにより生成された情報であることを特徴とする。
【0009】
また、請求項4に記載の発明は、請求項1乃至3いずれか1項に記載の情報検索装置において、前記抽出結果表示情報生成部は、所定の画像を背景として前記集計結果情報を表示させるように前記抽出結果表示情報を生成することを特徴とする。
【0010】
また、請求項5に記載の発明は、請求項4に記載の情報検索装置において、前記抽出結果表示情報生成部は、前記所定の画像として既知の画像を表示させるように前記抽出結果表示情報を生成することを特徴とする。
【0011】
また、請求項6に記載の発明は、請求項4または5に記載の情報検索装置において、前記抽出結果表示情報生成部は、前記所定の画像として地図に関する画像を表示させるように前記抽出結果表示情報を生成することを特徴とする。
【0012】
また、請求項7に記載の発明は、請求項1乃至6いずれか1項に記載の情報検索装置において、前記表示位置情報は、前記検索対象情報の前記分類情報毎の集計結果である分類情報毎の件数の比率に基づき、前記座標上における前記分類情報毎の表示範囲の比率が決定されて生成された情報であることを特徴とする。
【0013】
また、請求項8に記載の発明は、請求項1乃至7いずれか1項に記載の情報検索装置において、前記予め格納されている複数の検索対象情報を前記分類情報毎に集計する検索対象情報集計部と、前記分類情報毎に集計された前記検索対象情報の件数と前記分類情報によって特定される内容に基づいて前記表示位置情報を生成する表示位置情報生成部とを有することを特徴とする。
【0014】
また、請求項9に記載の発明は、請求項8に記載の情報検索装置において、前記表示位置情報生成部は、異なる複数の分類情報の類似関係を示す情報に基づいて前記表示位置情報を生成することを特徴とする。
【0015】
また、請求項10に記載の発明は、請求項9に記載の情報検索装置において、前記予め格納されている複数の検索対象情報の夫々に同時に付加されている複数の分類情報について類似関係を定義することにより前記分類情報の類似関係を示す情報を生成する類似関係情報生成部を有することを特徴とする。
【0016】
また、請求項11に記載の発明は、請求項10に記載の情報検索装置において、前記類似関係情報生成部は、前記異なる複数の分類情報の一である第1の分類情報が付加された前記検索対象情報を抽出し、前記抽出された検索対象情報に付加されている分類情報であって前記第1の分類情報とは異なる分類情報毎に前記抽出された検索対象情報を集計し、前記第1の分類情報とは異なる分類情報の一である第2の分類情報を前記集計結果に基づいて決定し、前記決定された第2の分類情報と前記第1の分類情報との間に類似関係を定義することを特徴とする。
【0017】
また、請求項12に記載の発明は、請求項1乃至11いずれか1項に記載の情報検索装置において、前記検索対象情報は、特許に関する情報を開示する情報であり、前記分類情報は、国際特許分類、ファイルインデックス、Fターム及びCurrent US Classificationのうち少なくともいずれか1つに関する情報であることを特徴とする。
【0018】
また、請求項13に記載の発明は、指定条件情報取得部と、情報抽出部と、抽出結果集計部と、抽出結果表示情報生成部と、表示位置情報生成部とを含み、予め格納されている複数の検索対象情報から指定された条件に適合する適合情報を抽出する情報検索方法であって、前記指定条件情報取得部が、前記指定された条件に関する指定条件情報を取得し、前記情報抽出部が、前記取得した指定条件情報に基づいて前記適合情報を抽出し、前記抽出結果集計部が、前記検索対象情報に付加されている情報であって前記検索対象情報が開示している内容を当該内容に基づいて分類した分類情報毎に前記抽出された適合情報を集計し、前記表示位置情報生成部が、座標上の位置を特定する座標と前記分類情報とが関連付けられた表示位置情報を、前記検索対象情報の前記分類情報毎の集計結果及び前記分類情報によって特定される内容に基づき、前記内容の類似する前記分類情報が前記座標上において近傍乃至隣接して配置されるように前記座標上における前記分類情報毎の表示位置が決定することにより生成し、前記分類情報毎に集計された適合情報の集計結果に関する集計結果情報をその分類情報に基づいて前記座標上に配置して表示するための抽出結果表示情報を生成する前記抽出結果表示情報生成部が、前記表示位置情報において各分類情報に関連付けられている座標によって特定される位置に各分類情報に基づいて集計された前記集計結果情報が表示されるように前記抽出結果表示情報を生成することを特徴とする。
【0019】
また、請求項14に記載の発明は、制御プログラムにおいて、請求項13に記載の制御方法を情報処理装置に実行させることを特徴とする。
【0020】
また、請求項15に記載の発明は、記録媒体であって、請求項14に記載の制御プログラムを情報処理装置が読み取り可能な形式で記録したことを特徴とする。
【発明の効果】
【0021】
本発明の一態様によれば、情報の検索結果の可視化において、表示される検索結果の態様を、ユーザの理解を助けるより有効な態様とすることができる。
【発明を実施するための最良の形態】
【0022】
以下、図面を参照して、本発明の実施形態を詳細に説明する。
本実施形態においては、文字列及び図面等の画像情報を含む特許文献を検索する文献検索装置を含む情報検索システムを例として説明する。尚、本発明は、以下に説明する実施例のように特許文献を検索する場合の他、図書館の蔵書や独自に管理されている資料並びに絵画等、情報を検索するシステムであれば適用可能であり、同様の効果を得ることができる。
【0023】
図1は、本実施の形態に係る情報検索システムの運用形態の例を示す図である。図1に示すように、本実施形態に係る情報検索システムは、情報検索装置1、クライアント装置2及び対象情報DB200を含む。クライアント装置2は、PC(Personal Computer)等の一般的な情報処理装置によって構成される。情報検索装置1は、ネットワークを介してクライアント装置2と接続されており、クライアント装置2からの検索要求を受けて対象情報DB200に格納されている対象情報を検索する。対象情報DB200は、検索対象の情報として特許文献の情報を記憶している。尚、図1に示すように、本実施形態においては、対象情報DB200が情報検索装置1とは別に設けられている例を説明するが、対象情報DB200を情報検索装置1内部に構成することも可能である。対象情報DB200は、HDD等の不揮発性記憶媒体によって構成される。
【0024】
次に、本実施形態に係る情報検索装置1のハードウェア構成について説明する。図2は、本実施形態に係る情報検索装置1のハードウェア構成を示すブロック図である。図2に示すように、本実施形態に係る情報検索装置1は、一般的なサーバやPC(Personal Computer)等の情報処理端末と同様の構成を有する。即ち、本実施形態に係る情報検索装置1は、CPU(Central Processing Unit)10、RAM(Random Access Memory)20、ROM(Read Only Memory)30、HDD(Hard Disk Drive)40及びI/F50がバス80を介して接続されている。また、I/F50にはLCD(Liquid Crystal Display)60及び操作部70が接続されている。
【0025】
CPU10は演算手段であり、情報検索装置1全体の動作を制御する。RAM20は、情報の高速な読み書きが可能な揮発性の記憶媒体であり、CPU10が情報を処理する際の作業領域として用いられる。ROM30は、読み出し専用の不揮発性記憶媒体であり、ファームウェア等のプログラムが格納されている。HDD40は、情報の読み書きが可能な不揮発性の記憶媒体であり、OS(Operating System)や各種の制御プログラム、アプリケーション・プログラム等が格納される。
【0026】
I/F50は、バス80と各種のハードウェアやネットワーク等を接続し制御する。LCD60は、ユーザが情報検索装置1の状態を確認するための視覚的ユーザインタフェースである。操作部70は、キーボードやマウス等、ユーザが情報検索装置1に情報を入力するためのユーザインタフェースである。尚、図1において説明したように、本実施形態に係る情報検索装置1は、サーバとして運用される。従って、LCD600及び操作部70等のユーザインタフェースは省略可能である。
【0027】
このようなハードウェア構成において、ROM30やHDD40若しくは図示しない光学ディスク等の記憶媒体に格納されたプログラムがRAM20に読み出され、CPU10の制御に従って動作することにより、ソフトウェア制御部が構成される。このようにして構成されたソフトウェア制御部と、ハードウェアとの組み合わせによって、本実施形態に係る情報検索装置1の機能を実現する機能ブロックが構成される。
【0028】
次に、本実施形態に係る情報検索装置1の機能ブロックについて、図3を参照して説明する。図3は、本実施形態に係る情報検索装置1の機能ブロック及び情報検索装置1が検索する対象の情報を格納している対象情報DB200を示すブロック図である。図3に示すように、本実施形態に係る情報検索装置1は、検索制御部100、情報入力部110、ネットワークI/F120、表示部130及び座標出力制御部140を有する。
【0029】
情報入力部110は、ユーザが情報検索装置1を操作して検索制御部100に情報を入力するための構成であり、図2に示すI/F50及び操作部70によって実現される。ネットワークI/F120は、情報検索装置1がネットワークを介して情報を取得し、若しくはネットワークを介して情報を送信するためのインタフェースであり、図2に示すI/F50によって実現される。具体的には、例えばEthernet(登録商標)接続のインタフェースや、USB(Universal Serial Bus)接続のインタフェースによって実現される。表示部130は、情報検索装置1の動作状態や、検索結果等が表示される構成であり、図2に示すI/F50及びLCD60によって実現される。
【0030】
検索制御部100は、本実施形態に係る情報検索装置1の検索機能を担う構成であり、指定条件情報取得部101、適合情報抽出部102及び抽出結果処理部103を有する。指定条件情報取得部101は、ユーザによって情報入力部110を介して入力された情報若しくはネットワークI/F120を介してネットワーク経由で入力された情報を指定条件情報として取得する。指定条件情報取得部101は、図2に示すRAM20にロードされたプログラムがCPU10の制御に従って動作することにより構成される。指定条件情報とは、対象情報DB200から所望の情報を抽出するための条件として、ユーザによって指定される条件である。
【0031】
適合情報抽出部102は、指定条件情報取得部101が取得した指定条件情報に基づき、対象情報DB200に格納されている情報を適合情報として抽出する。即ち、適合情報抽出部102は、指定条件情報によって指定されている条件に適合する情報を対象情報DB200から抽出する情報抽出部として機能する。情報抽出部は、図2に示すRAM20にロードされたプログラムがCPU10の制御に従って動作することにより構成される。
【0032】
抽出結果処理部103は、適合情報抽出部102による適合情報の抽出結果を表示部130若しくはクライアント装置2の表示部に表示するための抽出結果表示情報を生成して、出力する。即ち、抽出結果処理部103は、指定条件情報によって指定されている条件に適合する情報として抽出された適合情報を表示部130若しくはクライアント装置2の表示部に表示させるための抽出結果表示情報を生成する抽出結果表示情報生成部として機能する。抽出結果表示情報生成部は、図2に示すRAM20にロードされたプログラムがCPU10の制御に従って動作することにより構成される。また、本実施形態に係る抽出結果処理部103は、上記抽出結果表示情報の生成に際して、出力制御部140によって生成される情報を参照する。これについては、後に詳述する。
【0033】
座標出力制御部140は、本発明の要旨となる構成であり、対象情報DB200に格納された情報をIPC(International Patent Classification)等の分類情報に基づいて視覚的に分類して座標空間上に表示する際の座標を制御する。本実施形態に係る出力制御部140は、カウント部141、座標決定部142及び座標記憶部143を有する。尚、本実施形態においては、上記分類情報としてIPCを用いる場合を例とするが、FI(File Index)、Fターム(File Forming Term)、Current US Classification等を用いることも可能である。また、本実施形態において座標出力制御部140は、対象情報DB200に格納されている情報を2次元座表上に表示するための座標を制御するが、3次元の立体座標等、2次元以外の座標であっても良い。
【0034】
カウント部141は、対象情報DB200に格納されている情報の件数を夫々の分類情報毎にカウントする。カウント部141は、図2に示すRAM20にロードされたプログラムがCPU10の制御に従って動作することにより構成される。座標決定部142は、カウント部141のカウント結果及び分類情報の類似関係に基づき、抽出結果の座標上への表示における夫々の分類情報毎の表示範囲を決定する。即ち、座標決定部142は、出力する座標空間(本実施形態においては、2次元座標空間)における前記要素分類情報毎の表示範囲を決定する表示範囲決定部として機能する。表示範囲決定部142は、図2に示すRAM20にロードされたプログラムがCPU10の制御に従って動作することにより構成される。座標決定部142は、上記決定した表示範囲を座標情報として生成し、座標記憶部143に記憶させる。
【0035】
座標記憶部143は、座標決定部142が生成した座標情報を記憶する記憶部である。本実施形態に係る情報検索装置1において検索制御部100が対象情報DB200の検索を実行し、抽出結果処理部103が抽出結果表示情報を生成する際は、座標記憶部143に記憶されている座標情報に基づいて抽出された適合情報の表示範囲を決定する。
【0036】
このような情報検索装置1において、本実施形態は、座標出力制御部140による座標情報の制御及び検索制御部101による抽出結果表示情報の生成に特徴を有する。以下、本実施形態に係る情報検索装置1の動作について図を参照して説明する。図4は、本実施形態に係る情報検索システムにおいて、座標出力制御部140が、対象情報DB200に格納されている情報に付与されたIPCに基づき、座標情報を生成する際の動作を示すフローチャートである。図4に示すように、座標情報の生成に際して、座標出力制御部140は、先ずIPCに含まれる各項目のうち、対象とする項目を決定する(S401)。ここで、IPCに含まれる項目について、図5を参照して説明する。
【0037】
図5は、IPCの例として、“A61C 5/08”というIPCの構成を示す図である。図5に示すように、IPCは先頭から、“セクション”、“サブセクション”、“クラス”、“メイングループ”、“サブグループ”という項目に分けられている。図5の例においては、先頭から、“A”の部分がセクション、“61”の部分がサブセクション、“C”の部分がクラス、“5/”の部分がメイングループ、“08”の部分がサブグループを夫々示している。
【0038】
S401の処理においては、先頭から順番に項目を選択する。即ち、座標情報の生成を開始して最初のS401の処理においては、“セクション”を対象項目とする。対象項目が決定されると、次に、カウント部141が、対象項目毎に対象情報DB200に記憶されている文献の件数をカウントする(S402)。IPCにおけるセクションは“A”〜“H”のアルファベットに分類されている。従って、S402の処理においては、セクションが“A”〜“H”夫々であるIPCが付された文献数をカウントする。即ち、カウント部141が、検索対象情報集計部として機能する。検索対象情報集計部は、図2に示すRAM20にロードされたプログラムがCPU10の制御に従って動作することにより構成される。図6に、S402の処理の結果生成される情報を示す。図6に示すように、S402の処理の結果、セクション“A”〜“H”夫々のIPCが付された文献数の情報が生成される。
【0039】
ここで、特許文献には、複数のIPCが付されていることが多い。例えば、図7に示すように、一の文献に、“G06F 1/26”、“H02J 1/00”及び“H02J 9/06”という3つのIPCが付されている場合を考える。この場合、付されているIPCのセクションは“G”及び“H”である。ここで、本実施形態においては、セクション“G”の文献数をカウントする際、1件としてカウントするが、セクション“H”の文献数をカウントする際は、“H02J 1/00”のセクションとしての“H”と“H02J 9/06”のセクションとしての“H”について夫々別々にカウントする。即ち、図7に示すIPCが付された文献はセクション“G”のカウントにおいて1件としてカウントされ、セクション“H”のカウントにおいて2件としてカウントされる。
【0040】
本実施形態においては、座標上における各IPCの表示範囲の比率を、対象情報DB200に記憶されている文献に付された夫々のIPC毎の件数に基づいて決定する。即ち、図7の例においては、“H02J 1/00”のIPCが付された情報を表示する範囲と“H02J 9/06”のIPCが付された情報を表示する範囲との比率を夫々のIPCが付された文献の件数に基づいて決定する。従って、夫々のIPCが付された情報の件数に基づいて正確に座標上の範囲を区分けするために、図7において説明したようなカウント方法を用いる。
【0041】
S402の処理の結果、図6に示すように項目毎のカウント値の情報を生成すると、カウント部141は、そのカウント値の比率に基づき、夫々の項目(図6の場合、セクション)のIPCが付された文献を表示すべき座標上の範囲の面積比を決定する(S403)。図8に、S403の処理の結果生成される情報を示す。図8に示すように、S403の処理の結果、セクション“A”〜“H”夫々のIPCが付された文献を表示すべき座標上の範囲の面積比を示す情報が生成される。図8に示すように、セクション“A”〜“H”夫々の面積比はパーセンテージで示され、セクション“A”〜“H”全ての面積比を合計すると100%となる。
【0042】
S403の処理の結果、図8に示すように項目毎の面積比の情報が生成されると、座標決定部142は、その面積比に基づき、夫々の項目のIPCが付された文献を表示すべき座標空間上の範囲の座標を決定する(S404)。即ち、上記面積比の情報を生成するカウント部141と座標決定部142とが表示位置情報生成部として機能する。表示位置情報生成部は、図2に示すRAM20にロードされたプログラムがCPU10の制御に従って動作することにより構成される図9に、S404の処理の結果生成される情報を示す。図9に示すように、S403の処理の結果、セクション“A”〜“H”夫々のIPCが付された文献を表示すべき座標空間上の範囲の座標を示す情報が生成される。
【0043】
図10に、S404の処理の結果生成される座標情報によって区切られる座標空間上の範囲を示す。図10に示すように、座標決定部142は、座標空間上の範囲を夫々長方形に区切るように座標情報を生成する。また、図9に示すように、座標決定部142は、長方形の対角の頂点(例えば、右上と左下)の座標を特定することにより、夫々の範囲を特定する。
【0044】
更に、座標決定部142は、項目毎の座標空間上の範囲を決定する際、類似する内容の項目が隣接して配置され若しくは隣接しないまでも近傍に配置されるように範囲を決定し、座標情報を生成する。図10の例においては、セクション“A”は、セクション“B”、“D”、“C”及び“G”と類似すると判断されており、セクション“B”は、セクション“E”、“F”、“D”及び“A”と類似すると判断されている。セクション毎の類似関係は、対象情報DB200に格納されている検索対象の文献に付与されたIPCのセクションに基づいて定められる。これについては、後に詳述する。座標決定部142は、図9に示す座標情報を座標記憶部143に記憶させる。
【0045】
S404の座標情報の生成処理が完了すると、座標出力制御部140は、IPCの全項目、即ち、図5に示すサブグループまでS404までの処理が完了したかを判定する(S405)。ここでは、図5に示す“セクション”の項目について処理が完了した状態であるため、座標出力制御部140は、処理が未完了であると判断し(S405/NO)、図5に示す“セクション”の次の項目である“サブセクション”の項目を選択し(S401)、S402以降の処理を繰り返す。
【0046】
図4のS401に戻り、対象項目として図5に示す“サブセクション”をすると、“A”〜“H”夫々のセクションについて、サブセクション毎に対象情報DB200に記憶されている文献の件数をカウントする(S402)。図5に示すように、サブセクションは2桁の数値で示され、“01”〜“99”の数値が用いられる。尚、“01”〜“99”の数値のうちサブセクションとして用いられる数値は夫々のセクション毎に異なる。
【0047】
S401において“サブセクション”を対象項目とした場合においてS402〜S404の処理の結果生成される情報を図11に示す。図11に示すように、“サブセクション”を対象項目としてS402〜S404の処理を実行した結果、図8に示すセクション毎の座標情報が更にサブセクション毎に分割され、夫々のサブセクションについて座標情報が生成される。サブセクション毎の表示範囲を決定する場合においても、座標決定部143は、類似する内容の項目が隣接して配置され若しくは隣接しないまでも近傍に配置されるように範囲を決定し、座標情報を生成する。
【0048】
図11に示す座標情報に基づいて座標空間上の範囲を区切った図を図12に示す。図12に示すように、サブセクションに基づいて座標空間上の範囲を分割した結果、図10に示すセクション毎に分割された態様を更に細かく分割した状態となる。座標空間上の範囲をサブセクション毎に分割する座標情報の生成処理が完了すると、座標出力制御部140は再度S405の判断処理を実行し、図5に示す“クラス”、“メイングループ”及び“サブグループ”までの項目について、S402〜S404までの処理が完了するまで(S405/NO)処理を繰り返す。
【0049】
図5に示す“セクション”〜“サブグループ”までの全項目についてS402〜S404の処理が完了すると(S405/YES)、座標決定部142によって生成された座標情報、即ち、座標空間上の範囲を図5に示す“セクション”〜“サブグループ”までの全項目について分割する座標情報が座標記憶部143に記憶され、処理を終了する。
【0050】
このような処理により、座標空間上における夫々の範囲と夫々の分類情報とを関連付けて記憶したテーブルが生成され、座標記憶部143に記憶される。本実施形態において座標記憶部143に記憶される情報の例について、図13に示す。図4の動作の結果生成されて座標記憶部143に記憶される情報には、図13に示すように、図5に示すIPCの各項目毎に座標空間上における表示範囲を示す座標情報が含まれる。
【0051】
例えば、“A01B 1/00”のIPCが付されている文献は、座標空間上において、(A01B1/00X1,A01B1/00Y1)及び(A01B1/00X2,A01B1/00Y2)の座標を対角の頂点とする長方形の範囲に表示される。即ち、図13に示す情報は、座標空間上における位置を特定する座標の情報と分類情報であるIPCとが関連付けられて記憶された表示位置情報として用いられる。また、図13に示す情報を記憶している座標記憶部143は、表示位置情報記憶部として機能する。表示位置情報記憶部は、図2に示すRAM20にロードされたプログラムがCPU10の制御に従って動作することにより構成される。
【0052】
このように、本実施形態においては、座標空間上における検索結果の表示位置を、検索対象である文献に予め付与された分類情報の階層構造に基づいて決定する。換言すると、座標空間を分類情報の階層構造に基づいて分割する。これにより、大規模な文書群に対しても実用的な応答時間で処理を完了することが可能となる。
【0053】
本実施形態においては、ユーザによって指定された条件に基づいて検索を実行した結果を可視化して座標空間上に表示する際、夫々の検索結果を表示する位置を上記生成されたテーブルに基づいて決定する。以下に、本実施形態に係る検索及び検索結果の表示動作について説明する。
【0054】
図14は、本実施形態に係る情報検索システムにおける情報検索動作を示すシーケンス図である。図14に示すように、対象情報DB200に登録されている情報を検索する際、先ず、ユーザはクライアント装置2を操作して検索条件を指定するための検索条件指定画面を表示するための情報を情報検索装置1から取得し、検索条件指定画面を表示する(S1401)。以下、本実施形態の説明においては、ユーザがクライアント装置2を操作して情報検索装置1の機能を利用する場合を例として説明するが、情報検索装置1の情報入力部110を操作して検索を実行する場合も同様である。
【0055】
ユーザは、クライアント装置2の操作部を操作することにより、文章やキーワード及び文献の書誌的事項等を、対象情報DB200に格納されている情報を抽出するための条件として入力し、情報検索装置1に対して指定条件情報として送信する(S1402)。情報検索装置1に送信された指定条件情報は、ネットワークI/F120から情報検索装置1に入力され、検索制御部100の指定条件情報取得部101が取得する(S1403)。
【0056】
適合情報抽出部102は、指定条件情報取得部101が取得した指定条件情報に基づき、対象情報DB200からの適合情報の抽出を実行する(S1404)。尚、適合情報抽出部102は、指定条件情報としてキーワードを取得した場合はそのキーワードを含む文献を、文章を取得した場合は文章を構成する単語を含む文献を、書誌的事項を取得した場合はその書誌的事項に合致する文献を夫々適合情報として、対象情報DB200から抽出する。即ち、適合情報抽出部102は、予め格納されている検索対象情報から適合情報を抽出する情報抽出部として機能する。情報抽出部は、図2に示すRAM20にロードされたプログラムがCPU10の制御に従って動作することにより構成される。
【0057】
抽出結果処理部103は、S1404の処理により適合情報抽出部102が適合情報を抽出すると、適合情報として抽出された文献に付されているIPCを参照し、適合情報として抽出された文献のうち、夫々のIPCが付されている文献の件数をカウントしてテーブル(以降、適合文献カウント情報とする)を生成する(S1405)。ここで、S1405のカウント処理においては、一の文献に複数のIPCが付されている場合、夫々のIPC毎に1件としてカウントする。例えば、図7の場合、“G06F 1/26”として1件、“H02J 1/00”として1件、“H02J 9/06”として1件カウントし、合計3件分カウントする。即ち、抽出結果処理部103が、適合情報を分類情報毎に集計する抽出結果集計部として機能する。抽出結果集計部は、図2に示すRAM20にロードされたプログラムがCPU10の制御に従って動作することにより構成される。
【0058】
S1405の処理の結果生成される適合文献カウント情報を図15に示す。S1405の処理の結果生成される適合文献カウント情報には、適合情報として抽出された文献に付されたIPCとそのIPCにが付されている文献の件数との情報とが含まれる。例えば、図15に示す例において、適合情報のうち“A01B 1/14”のIPCが付された文献は25件である。
【0059】
次に、抽出結果処理部103は、座標記憶部143に記憶されている座標情報(図13に示す情報)を取得する(S1406)。図15に示す適合文献カウント情報の生成及び座標情報の取得が完了すると、抽出結果処理部103は、抽出結果を表示するための抽出結果表示情報を生成して、ネットワークI/F120を介してクライアント装置2に送信する(1407)。即ち、抽出結果処理部104が、抽出結果表示情報を生成する抽出結果表示情報生成部として機能する。抽出結果表示情報を受信したクライアント装置2は、その表示部に抽出結果を表示し(S1408)、処理を終了する。
【0060】
S1407における抽出結果表示情報の生成態様について、図16を参照して説明する。図16は、S1407においてクライアント装置2の表示部に表示される抽出結果表示画面300を示す図である。図16に示す抽出結果表示画面300の座標は、世界地図を背景とし、図13において説明した座標空間上の座標と対応している。そして、図16の抽出結果表示画面300においては、図15において説明した適合文献カウント情報に基づき、夫々のIPCが付された適合文献の件数に応じた大きさのドットが、夫々対応する座標の範囲に表示されている。
【0061】
換言すると、S1407の処理において、抽出結果処理部103は、適合文献カウント情報に基づき、夫々のIPCが付された適合情報の件数に応じた大きさのドットを、夫々のIPCに対応する座標(図13に示す座標情報において関連付けられている座標)の範囲に表示するように抽出結果表示情報を生成する。これにより、抽出された適合情報を、その内容に応じて座標空間上に配置して表示することが可能となる。即ち、抽出結果処理部103が、抽出結果表示情報生成部として機能する。抽出結果表示情報生成部は、図2に示すRAM20にロードされたプログラムがCPU10の制御に従って動作することにより構成される。
【0062】
ここで、本実施形態においては、座標空間上におけるセクション毎の範囲を決定する際に参照するセクション毎の類似関係を、対象情報DB200に格納されている検索対象の文献に付与されたIPCのセクションに基づいて定める。これについて、以下に説明する。
【0063】
図17は、セクション毎の類似関係を定める動作を示すフローチャートである。図17に示すように、セクション毎の類似関係を定める際、先ずカウント部141がセクションの組み合わせ毎に対象情報DB200に格納されている文献の件数をカウントする(S1701)。具体的には、セクションが“A”であるIPCと“B”であるIPCとが付されている文献の件数、セクションが“A”であるIPCと“C”であるIPCとが付されている文献の件数、というように、対象情報DB200に格納されている文献の件数をカウントする。
【0064】
S1701の処理の結果生成される情報を図18に示す。図18に示すように、S1701の処理の結果生成される情報は、セクションの組み合わせとその組み合わせのカウント結果とを含む。図18に示すような情報において文献数、即ちカウント結果が多い組み合わせのセクションは、類似関係が強いと判断することができる。従って、座標出力制御部141は、図18に示す情報に基づき、カウント結果が多いセクションの組み合わせを、互いに類似関係にあるセクションとして定義し(S1702)、処理を終了する。即ち、座標出力制御部141が、分類情報の類似関係を示す情報を生成する類似関係情報生成部として機能する。類似関係情報生成部は、図2に示すRAM20にロードされたプログラムがCPU10の制御に従って動作することにより構成される。
【0065】
このような処理により、対象情報DB200に既に格納されている情報の内容、より具体的には、文献情報における分類情報(本実施形態においてはIPC)の付加態様に基づき、セクション毎の類似関係を定義することができる。即ち、図17の処理の結果生成される情報が、分類情報の類似関係を示す情報として用いられる。図17に示す処理は、図4において説明した座標情報の生成処理におけるS404において実行しても良いし、図4に示すS404の前に予め実行してセクション毎の類似関係を定義し、座標出力制御部140内部若しくは他の記憶媒体に記憶しておいても良い。
【0066】
また、上述したように、図5に示す“サブセクション”以下の項目について、座標空間上における表示範囲の座標を図11、図12に示すように決定する際にも、“サブセクション”、“クラス”、“メイングループ”及び“サブグループ”夫々の項目毎の類似関係に基づいて隣接配置若しくは近傍配置が決定される。従って、上記項目の類似関係の定義についても、図17において説明した方法と同一若しくはそれに順ずる方法が用いられる。尚、セクション毎の類似関係を含め、上述したIPCの各項目毎の類似関係は、ユーザによって定義され、情報入力部110若しくはネットワークI/F120を介して座標出力制御部140に入力されるようにしても良い。
【0067】
以上説明したように、本実施形態に係る情報検索装置1においては、図4に示す動作によって予め生成され座標記憶部143に記憶されている座標情報に基づいて、各IPCに応じた座標空間上の表示範囲を決定する。従来の情報検索装置による図16のような表示は、夫々の検索結果に応じて動的に座標空間が定義されていた。従って、異なる検索条件に基づいて抽出された検索結果を重ね合わせて表示することにより比較することが無意味であった。これに対し、本実施形態に係る情報検索装置1は、抽出結果を座標空間上に可視化する際の座標情報が予め定義され、座標記憶部143に記憶されている。従って、異なる検索条件に基づいて生成された複数の抽出結果表示画面300を重ね合わせて表示することにより互いに比較し、その開示内容の分布の差異を視覚的に確認することが可能である。
【0068】
尚、異なる検索条件に基づいて生成された複数の抽出結果表示画面300を重ね合わせて表示することにより互いに比較し、その開示内容の分布の差異を視覚的に確認する場合、一の検索結果に係るドットの表示態様と他の検索結果に係るドットの表示態様とを異なる態様とすることにより、両者の差異を明確にし、ユーザによる比較を容易にすることができる。ドットの表示態様の変化としては、例えばドットの色を変化させる場合や、ドットではない他の形により表示する場合等が考えられる。
【0069】
また、本実施形態に係る抽出結果表示画面300においては、抽出結果を示すドットが固定された座標軸上に配置され表示される、これにより、IPC等の分類情報の定義に習熟したユーザが抽出結果表示画面300を確認する場合、夫々のドットが配置された位置が意味する内容を容易に把握することが可能となり、可読性に優れた検索結果の表示を行なうことができる。
【0070】
ここで、本実施形態に係る抽出結果表示画面300のように、予め定義された座標空間を用いて、夫々のIPCが付された文献の数に応じた大きさのドットを座標空間上に表示する場合、適正に座標を定義する必要がある。例えば、夫々のIPCに対応するドットを表示する範囲を、図19に示すように、全てのIPCで同一の面積とした場合を考える。この場合、図20に示すように、一のドット191の大きさが、一のIPCに対応する範囲として割り当てられた範囲よりも大きくなり、隣接する範囲のドット192や近傍に配置されたドット193を覆い隠してしまう場合がある。図20に示すような場合、抽出結果の内容に応じた分布を正確に確認することができない。
【0071】
また、図19に示す場合において、隣接する範囲のドットや近傍に配置されたドットを覆い隠すことがないように、ドットの大きさの限度を一のIPCについて割り当てられた範囲とする場合を考える。この場合、図21に示すように、一のIPCに対応する範囲として割り当てられた範囲に対して、ドットが視認困難な程度まで非常に小さくなることが考えられる。この場合も、抽出結果の内容に応じた分布を正確に確認することが困難となる。
【0072】
図20、図21に示すような問題に対して、本実施形態においては、各IPCが付された文献を表示すべき座標空間上の範囲の面積を、対象情報DB200に格納されている文献の件数であって、夫々のIPCが付されている文献の件数の比率に基づいて決定する。従って、図20において説明したように、各ドットの大きさが表示すべき範囲の広さを超えてしまい、隣接する範囲若しくは近傍の範囲のドットが表示不能となってしまうことを防ぐことができる。また、図21において説明したように、夫々のドットの大きさが非常に小さくなることを防ぐことができる。
【0073】
また、上述したように、本実施形態においては、各IPCが付された文献を表示すべき座標空間上の範囲の配置を図10や図12のように決定する際、類似する内容のIPCを隣接若しくは近傍に配置するように決定する。これにより、図16に示すような可視化表示の抽出結果表示画面300において、類似する内容を開示する文献のドットは隣接して若しくは近傍に配置される。従って、抽出結果表示画面300は、ユーザによって指定された条件に適合する文献の内容に応じた分布を示すこととなり、ユーザによる情報解析において有意義な情報となる。
【0074】
また、図16に示すように、本実施形態に係る抽出結果表示画面300においては、世界地図を背景とし、IPC毎のカウント結果に応じたドットを対応する座標位置に表示している。このように、抽出結果のドット分布を表示する際に、何らかのモチーフを背景として表示することにより、検索結果の表示内容の把握を容易化することができる。背景として選択するモチーフとしては、図16に示すような世界地図などの既知のモチーフが好ましい。特に、世界地図などの地図を背景とすることにより、ドットの分布位置を地図上の地名で表現することが可能であるため、更に好ましい。
【0075】
尚、上述したように、本実施形態においては、複数のIPCが付されている文献の場合、夫々のIPC毎に1件としてカウントする例を説明した。この他、例えば、図4のS402及び図14のS1405において、夫々の文献において先頭に付されているIPCのみを考慮してカウントするようにしても良い。
【0076】
尚、上記の説明においては、図16に示すように、IPC等の分類情報毎に集計された集計結果に関する情報としての文献の件数を、その件数に応じた大きさのドットで示す例を説明した。この場合、ドットの中心は夫々のIPCに関連付けられた座標範囲の中心とすることができる。また、ドットの大きさで示す場合の他、例えば夫々のIPCに関連付けられた座標範囲を塗りつぶす濃度で示すことができる。
【0077】
また、上記の説明においては、図13に示すように、夫々のIPCに対応するドットを表示する位置を2点の座標により範囲で特定する例を説明した。この他例えば、一の座標を表示すべきドットの中心の座標として特定し、座標記憶部143に記憶しても良い。
【0078】
また、上記の説明においては、図3に示すように、情報検索装置1にカウント部141及び座標決定部142を含む座標出力制御部140が含まれる例を説明した。しかしながら、上記カウント部141及び座標決定部142は、図13に示す座標情報を生成して座標記憶部143に記憶する場合に必要となる構成であり、実際に検索を実行する場合には不要な構成である。従って、対象情報DB200に格納されている文献情報の検索を実行する情報検索装置1としては、少なくとも座標情報を記憶している座標記憶部143を含み、カウント部141及び座標決定部142は省略することが可能である。
【0079】
他方、公開特許公報を検索対象とする場合等、対象情報DB200に格納される文献情報は、経時的に増加することが考えられる。これに伴い、分類情報毎の文献の件数も変化するため、座標記憶部143に記憶される座標情報は定期的に更新することが好ましい。情報検索装置1にカウント部141及ぶ座標決定部142を含めることにより、定期的な座標情報の更新が可能となる。
【0080】
また、上記の説明においては、図17において説明したように、セクションの全組み合わせについて対象情報DB200に格納されている文献の件数をカウントした上で、そのカウント結果に基づいてセクション毎の類似関係を定義する例を説明した。セクション毎の類似関係を定義する他の方法について、図22を参照して説明する。セクション毎の類似関係を定義する他の態様においては、図22に示すように、座標出力制御部140がまず“A”〜“H”のセクションのうち、対象とするセクションを1つ決定する(S2201)。ここでは、“A”のセクションを選択したものとして説明する。
【0081】
対象とするセクションが決定されると、カウント部141が、対象セクションのIPCが付された文献を対象情報DB200から抽出する(S2202)。そして、カウント部141は、抽出した文献に付されている他のセクションのIPCを参照し、夫々のセクション毎に件数を集計する(S2203)。S2203の集計処理によって生成される情報を図23に示す。図23に示すように、“A”以外のセクション毎に、夫々の件数がカウントされテーブルが生成される。
【0082】
図23に示すテーブルにおいて、カウント数の多いセクションは、セクション“A”との類似関係が強いと判断することができる。従って、座標出力制御部140は、図23に示すテーブルのうち、カウント数の最も多いセクションをセクション“A”との類似関係があると定義する(S2204)。“A”〜“H”すべてのセクションについて類似関係の定義が完了するまでS2201からの処理を繰り返し(S2205/NO)、“A”〜“H”すべてのセクションについて類似関係の定義が完了したら(S2205/YES)、処理を終了する。
【0083】
図22の処理の結果生成される類似関係を示す情報を図24に示す。図24に示すように、図22の処理の結果、“A”〜“H”夫々のセクションについて、最も類似関係の強いセクションが類似セクションとして定義される。尚、図22の説明においては、図23に示すカウント結果において、最も件数の多いセクションのみを類似セクションとして定義する例を説明したが、最も件数の多いセクションに限らず、例えばカウント数が所定数以上であるセクションを全て類似セクションとして定義しても良いし、カウント数が多い順に複数のセクションを類似セクションとして定義しても良い。
【0084】
尚、上記の説明においては、図14において説明したように、指定条件情報としてキーワード、文章及び書誌的事項を取得する例を説明した。この他、例えば、画像検索においても、検索対象(上記実施形態における文献情報)に含まれる画像情報を一次元記号列に変換すると共に、検索条件として入力された画像情報を一次元記号列に変換することにより文言検索と同様の手法で適合情報の抽出が可能である。これにより、文言検索のみでなく、画像検索等の他の検索態様においても、上記実施形態を適用し、同様の効果を得ることが可能となる。
【0085】
また、上記実施形態においては、特許文献を検索対象とする例を説明した。この他、例えば、図書館等の蔵書を検索する場合にも適用可能である。その場合、上記の説明におけるIPC等の分類情報は日本十進分類法の分類番号等、図書を分類する情報となる。
【図面の簡単な説明】
【0086】
【図1】本発明の実施形態に係る情報検索システムの運用形態を示す図である。
【図2】本発明の実施形態に係る情報検索装置のハードウェア構成を模式的に示すブロック図である。
【図3】本発明の実施形態に係る情報検索装置の機能構成を示すブロック図である。
【図4】本発明の実施形態に係る座標情報の生成動作を示すフローチャートである。
【図5】本発明の実施形態に係る分類情報の項目を示す図である。
【図6】本発明の実施形態に係る座標情報の生成動作において生成される情報の例を示す図である。
【図7】本発明の実施形態に係る検索対象の情報に付されている分類情報の例を示す図である。
【図8】本発明の実施形態に係る座標情報の生成動作において生成される情報の例を示す図である。
【図9】本発明の実施形態に係る座標情報の生成動作において生成される情報の例を示す図である。
【図10】本発明の実施形態に係る座標空間の分類情報毎の分割態様を示す図である。
【図11】本発明の実施形態に係る座標情報の生成動作において生成される情報の例を示す図である。
【図12】本発明の実施形態に係る座標空間の分類情報毎の分割態様を示す図である。
【図13】本発明の実施形態に係る座標情報の生成動作において生成される情報の例を示す図である。
【図14】本発明の実施形態に係る情報検索動作を示すシーケンス図である。
【図15】本発明の実施形態に係る適合文献カウント情報に含まれる情報の例を示す図である。
【図16】本発明の実施形態に係る抽出結果表示画面の例を示す図である。
【図17】本発明の実施形態に係るセクション毎の類似関係を定める動作を示すフローチャートである。
【図18】本発明の実施形態に係るセクション毎の類似関係を定める動作において生成される情報を示す図である。
【図19】本発明の比較例に係る座標空間の分割態様を示す図である。
【図20】本発明の比較例に係る座標空間上のドット表示例を示す図である。
【図21】本発明の比較例に係る座標空間上のドット表示例を示す図である。
【図22】本発明の他の実施形態に係るセクション毎の類似関係を定める動作を示すフローチャートである。
【図23】本発明の他の実施形態に係るセクション毎の類似関係を定める動作において生成される情報を示す図である。
【図24】本発明の他の実施形態に係るセクション毎の類似関係の情報に含まれる情報の例を示す図である。
【符号の説明】
【0087】
1 情報検索装置
2 クライアント装置
10 CPU
20 RAM
30 ROM
40 HDD
50 I/F
60 LCD
70 操作部
80 バス
100 検索制御部
101 指定条件情報取得部
102 適合情報抽出部
103 抽出結果処理部
110 情報入力部
120 ネットワークI/F
130 表示部
140 座標出力制御部
141 カウント部
142 座標決定部
143 座標記憶部
200 対象情報DB
191、192、193 ドット
300 抽出結果表示画面
【特許請求の範囲】
【請求項1】
予め格納されている複数の検索対象情報から指定された条件に適合する適合情報を抽出する情報検索装置であって、
前記指定された条件に関する指定条件情報を取得する指定条件情報取得部と、
前記取得した指定条件情報に基づいて前記適合情報を抽出する情報抽出部と、
前記検索対象情報に付加されている情報であって前記検索対象情報が開示している内容を当該内容に基づいて分類した分類情報毎に前記抽出された適合情報を集計する抽出結果集計部と、
前記分類情報毎に集計された適合情報の集計結果に関する集計結果情報をその分類情報に基づいて座標上に配置して表示させるための抽出結果表示情報を生成する抽出結果表示情報生成部と、
前記座標上の位置を特定する座標と前記分類情報とが関連付けられた表示位置情報を記憶している表示位置情報記憶部とを含み、
前記表示位置情報は、前記検索対象情報の前記分類情報毎の集計結果及び前記分類情報によって特定される内容に基づき、前記内容の類似する前記分類情報が前記座標上において近傍乃至隣接して配置されるように前記座標上における前記分類情報毎の表示位置が決定されて生成された情報であり、
前記抽出結果表示情報生成部は、前記集計結果情報を、前記表示位置情報においてその分類情報に関連付けられている座標によって特定される位置に表示させるように前記抽出結果表示情報を生成することを特徴とする、情報検索装置。
【請求項2】
前記表示位置情報は、異なる複数の分類情報の類似関係を示す情報に基づいて前記座標上における前記分類情報毎の表示位置が決定されて生成された情報であり、
前記分類情報の類似関係を示す情報は、前記検索対象情報における前記分類情報の付加態様に基づいて生成された情報であることを特徴とする、請求項1に記載の情報検索装置。
【請求項3】
前記検索対象情報には異なる複数の分類情報が付加されており、
前記分類情報の類似関係を示す情報は、前記予め格納されている複数の検索対象情報の夫々に同時に付加されている複数の分類情報について類似関係を定義することにより生成された情報であることを特徴とする、請求項2に記載の情報検索装置。
【請求項4】
前記抽出結果表示情報生成部は、所定の画像を背景として前記集計結果情報を表示させるように前記抽出結果表示情報を生成することを特徴とする、請求項1乃至3いずれか1項に記載の情報検索装置。
【請求項5】
前記抽出結果表示情報生成部は、前記所定の画像として既知の画像を表示させるように前記抽出結果表示情報を生成することを特徴とする、請求項4に記載の情報検索装置。
【請求項6】
前記抽出結果表示情報生成部は、前記所定の画像として地図に関する画像を表示させるように前記抽出結果表示情報を生成することを特徴とする、請求項4または5に記載の情報検索装置。
【請求項7】
前記表示位置情報は、前記検索対象情報の前記分類情報毎の集計結果である分類情報毎の件数の比率に基づき、前記座標上における前記分類情報毎の表示範囲の比率が決定されて生成された情報であることを特徴とする、請求項1乃至6いずれか1項に記載の情報検索装置。
【請求項8】
前記予め格納されている複数の検索対象情報を前記分類情報毎に集計する検索対象情報集計部と、
前記分類情報毎に集計された前記検索対象情報の件数と前記分類情報によって特定される内容に基づいて前記表示位置情報を生成する表示位置情報生成部とを有することを特徴とする、請求項1乃至7いずれか1項に記載の情報検索装置。
【請求項9】
前記表示位置情報生成部は、異なる複数の分類情報の類似関係を示す情報に基づいて前記表示位置情報を生成することを特徴とする、請求項8に記載の情報検索装置。
【請求項10】
前記予め格納されている複数の検索対象情報の夫々に同時に付加されている複数の分類情報について類似関係を定義することにより前記分類情報の類似関係を示す情報を生成する類似関係情報生成部を有することを特徴とする、請求項9に記載の情報検索装置。
【請求項11】
前記類似関係情報生成部は、
前記異なる複数の分類情報の一である第1の分類情報が付加された前記検索対象情報を抽出し、
前記抽出された検索対象情報に付加されている分類情報であって前記第1の分類情報とは異なる分類情報毎に前記抽出された検索対象情報を集計し、
前記第1の分類情報とは異なる分類情報の一である第2の分類情報を前記集計結果に基づいて決定し、
前記決定された第2の分類情報と前記第1の分類情報との間に類似関係を定義することを特徴とする、請求項10に記載の情報検索装置。
【請求項12】
前記検索対象情報は、特許に関する情報を開示する情報であり、
前記分類情報は、国際特許分類、ファイルインデックス、Fターム及びCurrent US Classificationのうち少なくともいずれか1つに関する情報であることを特徴とする、請求項1乃至11いずれか1項に記載の情報検索装置。
【請求項13】
指定条件情報取得部と、情報抽出部と、抽出結果集計部と、抽出結果表示情報生成部と、表示位置情報生成部とを含み、予め格納されている複数の検索対象情報から指定された条件に適合する適合情報を抽出する情報検索方法であって、
前記指定条件情報取得部が、前記指定された条件に関する指定条件情報を取得し、
前記情報抽出部が、前記取得した指定条件情報に基づいて前記適合情報を抽出し、
前記抽出結果集計部が、前記検索対象情報に付加されている情報であって前記検索対象情報が開示している内容を当該内容に基づいて分類した分類情報毎に前記抽出された適合情報を集計し、
前記表示位置情報生成部が、座標上の位置を特定する座標と前記分類情報とが関連付けられた表示位置情報を、前記検索対象情報の前記分類情報毎の集計結果及び前記分類情報によって特定される内容に基づき、前記内容の類似する前記分類情報が前記座標上において近傍乃至隣接して配置されるように前記座標上における前記分類情報毎の表示位置が決定することにより生成し、
前記分類情報毎に集計された適合情報の集計結果に関する集計結果情報をその分類情報に基づいて前記座標上に配置して表示するための抽出結果表示情報を生成する前記抽出結果表示情報生成部が、前記表示位置情報において各分類情報に関連付けられている座標によって特定される位置に各分類情報に基づいて集計された前記集計結果情報が表示されるように前記抽出結果表示情報を生成することを特徴とする、情報検索方法。
【請求項14】
請求項13に記載の制御方法を情報処理装置に実行させることを特徴とする制御プログラム。
【請求項15】
請求項14に記載の制御プログラムを情報処理装置が読み取り可能な形式で記録したことを特徴とする記録媒体。
【請求項1】
予め格納されている複数の検索対象情報から指定された条件に適合する適合情報を抽出する情報検索装置であって、
前記指定された条件に関する指定条件情報を取得する指定条件情報取得部と、
前記取得した指定条件情報に基づいて前記適合情報を抽出する情報抽出部と、
前記検索対象情報に付加されている情報であって前記検索対象情報が開示している内容を当該内容に基づいて分類した分類情報毎に前記抽出された適合情報を集計する抽出結果集計部と、
前記分類情報毎に集計された適合情報の集計結果に関する集計結果情報をその分類情報に基づいて座標上に配置して表示させるための抽出結果表示情報を生成する抽出結果表示情報生成部と、
前記座標上の位置を特定する座標と前記分類情報とが関連付けられた表示位置情報を記憶している表示位置情報記憶部とを含み、
前記表示位置情報は、前記検索対象情報の前記分類情報毎の集計結果及び前記分類情報によって特定される内容に基づき、前記内容の類似する前記分類情報が前記座標上において近傍乃至隣接して配置されるように前記座標上における前記分類情報毎の表示位置が決定されて生成された情報であり、
前記抽出結果表示情報生成部は、前記集計結果情報を、前記表示位置情報においてその分類情報に関連付けられている座標によって特定される位置に表示させるように前記抽出結果表示情報を生成することを特徴とする、情報検索装置。
【請求項2】
前記表示位置情報は、異なる複数の分類情報の類似関係を示す情報に基づいて前記座標上における前記分類情報毎の表示位置が決定されて生成された情報であり、
前記分類情報の類似関係を示す情報は、前記検索対象情報における前記分類情報の付加態様に基づいて生成された情報であることを特徴とする、請求項1に記載の情報検索装置。
【請求項3】
前記検索対象情報には異なる複数の分類情報が付加されており、
前記分類情報の類似関係を示す情報は、前記予め格納されている複数の検索対象情報の夫々に同時に付加されている複数の分類情報について類似関係を定義することにより生成された情報であることを特徴とする、請求項2に記載の情報検索装置。
【請求項4】
前記抽出結果表示情報生成部は、所定の画像を背景として前記集計結果情報を表示させるように前記抽出結果表示情報を生成することを特徴とする、請求項1乃至3いずれか1項に記載の情報検索装置。
【請求項5】
前記抽出結果表示情報生成部は、前記所定の画像として既知の画像を表示させるように前記抽出結果表示情報を生成することを特徴とする、請求項4に記載の情報検索装置。
【請求項6】
前記抽出結果表示情報生成部は、前記所定の画像として地図に関する画像を表示させるように前記抽出結果表示情報を生成することを特徴とする、請求項4または5に記載の情報検索装置。
【請求項7】
前記表示位置情報は、前記検索対象情報の前記分類情報毎の集計結果である分類情報毎の件数の比率に基づき、前記座標上における前記分類情報毎の表示範囲の比率が決定されて生成された情報であることを特徴とする、請求項1乃至6いずれか1項に記載の情報検索装置。
【請求項8】
前記予め格納されている複数の検索対象情報を前記分類情報毎に集計する検索対象情報集計部と、
前記分類情報毎に集計された前記検索対象情報の件数と前記分類情報によって特定される内容に基づいて前記表示位置情報を生成する表示位置情報生成部とを有することを特徴とする、請求項1乃至7いずれか1項に記載の情報検索装置。
【請求項9】
前記表示位置情報生成部は、異なる複数の分類情報の類似関係を示す情報に基づいて前記表示位置情報を生成することを特徴とする、請求項8に記載の情報検索装置。
【請求項10】
前記予め格納されている複数の検索対象情報の夫々に同時に付加されている複数の分類情報について類似関係を定義することにより前記分類情報の類似関係を示す情報を生成する類似関係情報生成部を有することを特徴とする、請求項9に記載の情報検索装置。
【請求項11】
前記類似関係情報生成部は、
前記異なる複数の分類情報の一である第1の分類情報が付加された前記検索対象情報を抽出し、
前記抽出された検索対象情報に付加されている分類情報であって前記第1の分類情報とは異なる分類情報毎に前記抽出された検索対象情報を集計し、
前記第1の分類情報とは異なる分類情報の一である第2の分類情報を前記集計結果に基づいて決定し、
前記決定された第2の分類情報と前記第1の分類情報との間に類似関係を定義することを特徴とする、請求項10に記載の情報検索装置。
【請求項12】
前記検索対象情報は、特許に関する情報を開示する情報であり、
前記分類情報は、国際特許分類、ファイルインデックス、Fターム及びCurrent US Classificationのうち少なくともいずれか1つに関する情報であることを特徴とする、請求項1乃至11いずれか1項に記載の情報検索装置。
【請求項13】
指定条件情報取得部と、情報抽出部と、抽出結果集計部と、抽出結果表示情報生成部と、表示位置情報生成部とを含み、予め格納されている複数の検索対象情報から指定された条件に適合する適合情報を抽出する情報検索方法であって、
前記指定条件情報取得部が、前記指定された条件に関する指定条件情報を取得し、
前記情報抽出部が、前記取得した指定条件情報に基づいて前記適合情報を抽出し、
前記抽出結果集計部が、前記検索対象情報に付加されている情報であって前記検索対象情報が開示している内容を当該内容に基づいて分類した分類情報毎に前記抽出された適合情報を集計し、
前記表示位置情報生成部が、座標上の位置を特定する座標と前記分類情報とが関連付けられた表示位置情報を、前記検索対象情報の前記分類情報毎の集計結果及び前記分類情報によって特定される内容に基づき、前記内容の類似する前記分類情報が前記座標上において近傍乃至隣接して配置されるように前記座標上における前記分類情報毎の表示位置が決定することにより生成し、
前記分類情報毎に集計された適合情報の集計結果に関する集計結果情報をその分類情報に基づいて前記座標上に配置して表示するための抽出結果表示情報を生成する前記抽出結果表示情報生成部が、前記表示位置情報において各分類情報に関連付けられている座標によって特定される位置に各分類情報に基づいて集計された前記集計結果情報が表示されるように前記抽出結果表示情報を生成することを特徴とする、情報検索方法。
【請求項14】
請求項13に記載の制御方法を情報処理装置に実行させることを特徴とする制御プログラム。
【請求項15】
請求項14に記載の制御プログラムを情報処理装置が読み取り可能な形式で記録したことを特徴とする記録媒体。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【図21】
【図22】
【図23】
【図24】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【図21】
【図22】
【図23】
【図24】
【公開番号】特開2009−252185(P2009−252185A)
【公開日】平成21年10月29日(2009.10.29)
【国際特許分類】
【出願番号】特願2008−102923(P2008−102923)
【出願日】平成20年4月10日(2008.4.10)
【出願人】(000006747)株式会社リコー (37,907)
【Fターム(参考)】
【公開日】平成21年10月29日(2009.10.29)
【国際特許分類】
【出願日】平成20年4月10日(2008.4.10)
【出願人】(000006747)株式会社リコー (37,907)
【Fターム(参考)】
[ Back to top ]