検索処理方法及びプログラム
【課題】検索者が直感的に検索結果の分析を行うことができるようにする。
【解決手段】検索により抽出された複数の文献のデータが次の処理キー及び選択可能な表示項目として第1の表示形態にてユーザに提示されると共に、ユーザによる表示項目の選択に応じて、選択された表示項目に対応する文献のデータを、さらに次の処理キー及び選択可能な表示項目としてユーザにより指定された第2の表示形態にてユーザに提示されるようになる。従って、直感的なインターフェースにて分析対象及び表示形態を変更してゆき、分析を進めることができるようになる。
【解決手段】検索により抽出された複数の文献のデータが次の処理キー及び選択可能な表示項目として第1の表示形態にてユーザに提示されると共に、ユーザによる表示項目の選択に応じて、選択された表示項目に対応する文献のデータを、さらに次の処理キー及び選択可能な表示項目としてユーザにより指定された第2の表示形態にてユーザに提示されるようになる。従って、直感的なインターフェースにて分析対象及び表示形態を変更してゆき、分析を進めることができるようになる。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、文献データベースの検索技術に関し、より詳しくは、検索実行時におけるユーザインターフェースに関する。
【背景技術】
【0002】
従来、例えばある文書群に対して、含まれている文章の特徴や類似性などの分析を進める場合、テキストマイニング技術や、重み付け計算による検索技術を用いて文書群に対して処理を行い、その処理結果を表やグラフに変換して分析者に提示していた。従来技術では、元となる文書群のデータをベースに、それぞれ表、グラフ、又は図を個別に生成して表示していた。
【0003】
しかし分析を進める上で、ある分析結果から次の分析結果を得ようとする場合がある。従来技術においても検索結果の一部を単に参照したり、検索結果を絞り込むという単純な処理は可能であったが、該当部分を単に表示するだけでその意味合いに何らの変化を与えるものではなかった。さらに、例えばある表の中から関心のある部分だけを、新たな観点を含めて表示させたり、その部分を別の観点の図等に変換して表示させる場合には、一度元の文書群のデータに戻り、改めて検索条件を設定し、その文書群のデータ内の数値やテキストなどを用いて処理を行い、当該処理結果を所望の表示形態に変換するといったプロセスが必要となる。従って、このような場合には非常に手間がかかり、分析結果からすぐに次の分析へ思考を働かせたい時に、大きな障害となってしまうという問題点があった。
【0004】
また、特開2001−92851号公報には以下の技術が開示されている。すなわち、特許/技術資料検索システムより取得した検索ファイルのデータをコンピュータを利用して特許情報または技術情報分析用マスタテーブルに自動変換した後、必要な形態の特許マップ、或は、各種の通計グラフなどを出力するための方法が開示されている。しかしこの技術によっても、検索ファイルのデータを変更しなければならないような場合には、別途マスタテーブルに変換しなければならない。従って、前回の検索結果をさらに絞り込んだりする場合には、通常と同様に新たな検索ファイルを用意しなければならず、処理や手間が簡略化されることはない。
【特許文献1】特開2001−92851号公報
【発明の開示】
【発明が解決しようとする課題】
【0005】
従って、本発明の目的は、検索者が直感的に検索結果の分析を行うことができるようにするための検索処理技術を提供することである。
【課題を解決するための手段】
【0006】
本発明の第1の態様に係る検索処理方法は、ユーザにより指定された検索条件に従って所定の文献群を検索し、当該検索により抽出された複数の文献のデータを記憶装置に格納するステップと、検索により抽出された複数の文献のデータを、各表示項目を次の処理キーとして選択可能とし且つ第1の表示形態にて前記ユーザに提示するためのデータに処理し、当該処理結果を出力する第1処理ステップと、ユーザにより直接又は間接的に選択された表示項目に対応する、文献のデータを抽出し、記憶装置に格納するステップと、選択された表示項目に対応する、文献のデータを、各表示項目を次の処理キーとして選択可能とし且つユーザにより指定された第2の表示形態にてユーザに提示するためのデータに処理し、当該処理結果を出力する第2処理ステップとを含む。
【0007】
検索により抽出された複数の文献のデータが次の処理キー及び選択可能な表示項目として第1の表示形態にてユーザに提示されると共に、ユーザによる表示項目の選択に応じて、選択された表示項目に対応する文献のデータを、さらに次の処理キー及び選択可能な表示項目としてユーザにより指定された第2の表示形態にてユーザに提示されるようになる。従って、直感的なインターフェースにて分析対象及び表示形態を変更してゆき、分析を進めることができるようになる。
【0008】
また、上で述べた第1及び第2の表示形態が、少なくとも(a)処理すべき複数の文献を使用語句によりクラスタリングして予め規定されている表示事項でもって提示する形態と、(b)処理すべき複数の文献を予め規定されている表示事項と各文献の使用語句により算出される関連度を表す接続線とでもって表示する形態と、(c)処理すべき複数の文献を使用語句について分類且つ集計した結果をグラフによって表示する形態と、(d)処理すべき複数の文献の使用語句と当該使用語句間の関連度を表す接続線とを表示する形態と、(e)処理すべき複数の文献のうち特定の事項で関連付けられた文献群を特定の事項により、特定の事項で関連付けられた文献群と処理すべき文献のデータである使用語句との関連度を上記特定の事項と使用語句との間の接続線でもって表示する形態とのうちいずれかである場合もある。これらの表示形態を自由に遷移することにより、分析を進めることができるようになる。なお、これらの表示形態に限定されるものではなく、他の表示形態を含めるようにしても良い。また、別の組み合わせから任意に選択できるようにすることもある。
【0009】
また、上で述べた第1及び第2処理ステップにおいて、表示形態に対応する表示用プログラムを指定し、当該表示用プログラム用のデータを生成するようにしてもよい。ユーザ端末の環境に合わせて、必要に応じて表示用プログラムを切り替えるものである。また、スタンドアロン環境、クライアント・サーバ環境のいずれにおいても実現可能である。
【0010】
本発明の第2の態様に係る検索処理方法は、処理部と、記憶装置と、関連度データテーブル格納部と、所定の文献群を格納している文献データベースとを有するコンピュータにより実行される検索処理方法である。そして、本検索処理方法は、処理部により、ユーザにより指定された検索条件に従って文献データベースを検索し、当該検索により抽出された第1の複数の文献のデータを記憶装置に格納する第1文献抽出ステップと、処理部により、第1文献抽出ステップにより抽出され且つ記憶装置に格納された第1の複数の文献のデータを読み出し、第1の複数の文献に関する情報及び表示形態をユーザに選択させるための情報を含む検索結果画面のデータを生成し、出力するステップと、処理部により、第1文献抽出ステップにより抽出され且つ記憶装置に格納された第1の複数の文献のデータを読み出し、当該第1の複数の文献間の関連度及び当該第1の複数の文献のうちの一つと当該文献に使用されている語句との関連度の少なくともいずれかを算出し、関連度データテーブル格納部に格納する第1関連度算出ステップと、処理部により、第1関連度算出ステップにより算出され且つ関連度データテーブル格納部に格納されたデータに基づき、第1文献抽出ステップにより抽出され且つ記憶装置に格納された第1の複数の文献のデータを、各表示項目を次の処理キーとして選択可能とし且つ検索結果画面においてユーザにより指定された第1の表示形態にてユーザに提示する第1処理結果画面のデータを生成し、出力する第1処理ステップと、処理部により、第1処理結果画面においてユーザにより選択された表示項目に対応する、第2の複数の文献のデータを文献データベースから抽出し、記憶装置に格納する第2文献抽出ステップと、処理部により、第2文献抽出ステップにより抽出され且つ記憶装置に格納された第2の複数の文献のデータを読み出し、当該第2の複数の文献間の関連度及び当該第2の複数の文献のうちの一つと当該文献に使用されている語句との関連度の少なくともいずれかを算出し、関連度データテーブル格納部に格納する第2関連度算出ステップと、処理部により、第2関連度算出ステップにより算出され且つ関連度データテーブル格納部に格納されたデータに基づき、第2文献抽出ステップにより抽出され且つ記憶装置に格納された第2の複数の文献のデータを、検索結果画面のデータを生成及び出力することなく、各表示項目を次の処理キーとして選択可能とし且つ第1処理結果画面においてユーザにより指定された第2の表示形態にてユーザに提示する第2処理結果画面のデータを生成し、出力する第2処理ステップとを含む。
【0011】
なお、上述の方法はプログラム及びコンピュータにて実施することができ、当該コンピュータは検索処理装置となる。また、上記プログラムは、例えばフレキシブルディスク、CD−ROM、光磁気ディスク、半導体メモリ、ハードディスク等の記憶媒体又は記憶装置に格納される。また、ネットワークなどを介してデジタル信号として配信される場合もある。尚、中間的な処理結果はメモリに一時保管される。
【発明の効果】
【0012】
以上述べたように、本発明に拠れば、検索者が直感的に検索結果の分析を行うことができるようになる。
【発明を実施するための最良の形態】
【0013】
図1に本発明の一実施の形態に係るシステム概要図を示す。例えばインターネットやLAN(Local Area Network)であるネットワーク1には、例えばウェブ(Web)サーバ機能を有する検索サーバ5と、例えばパーソナルコンピュータであってWebブラウザ機能を有する1又は複数のクライアント端末3とが接続されている。
【0014】
検索サーバ5は、検索対象となる文献を蓄積した文献DB53と、検索等により抽出された文献の間の関連度のデータなどを格納する関連度データ格納部54と、検索等により抽出された文献における使用語句のデータを格納する関連語データ格納部55とを管理している。また、検索サーバ5は、文献DB53に対して検索処理を行う検索処理部51と、検索処理部51が抽出した文献のデータ等を所定のアルゴリズムにて処理するデータ操作部52とを含む。なお、検索サーバ5は、1台のコンピュータではなく複数台のコンピュータにより以下で説明する機能を実現する場合もある。また、検索サーバ5は、クライアント端末3の機能に適合させて、Webサーバ機能ではない別のインターフェースにてクライアント端末3とデータのやり取りを行う場合もある。
【0015】
クライアント端末3には、マウスやキーボードなどの入力装置32と、ディスプレイなどの表示装置31とが接続されており、検索サーバ5とのデータのやり取りを行うと共にクライアント端末3のユーザに対するユーザーインタフェースを提供するクライアント検索インターフェース部33と、検索結果の表、グラフ又はフロー図などの表示を行う際に表示のための処理を行い且つ当該表、グラフ又はフロー図などについてのユーザインターフェースを提供する1又は複数の表示処理部34とが設けられている。検索サーバ5とのデータのやり取りをWebベースで行う場合には、クライアント検索インターフェース部33は、Webブラウザとなる。但し、特別のクライアント・プログラムを用いるようにしても良い。
【0016】
次に図2乃至図26を用いて図1に示したシステムの処理内容について説明する。なお、以下の説明においては、特許文献の検索を例に用いる。最初に、ユーザはクライアント端末3の入力装置32を操作して、クライアント検索インターフェース部33に指示を与え、検索条件指定ページにアクセスさせる(ステップS1)。検索サーバ5は、クライアント端末3からのアクセスに応じて、検索条件指定ページのデータをクライアント端末3に送信する(ステップS3)。クライアント端末3のクライアント検索インターフェース部33は、検索サーバ5から検索条件指定ページのデータを受信し、表示装置31に表示する(ステップS5)。例えば、少なくともキーワード入力欄、検索するデータベースを指定する指定欄等を含む画面が表示される。場合によっては、キーワードの代わりに文章を入力して、当該文章を検索条件とする場合もある。この場合は文章から形態素解析などにより検索語句を抽出する。ユーザは、検索キーワード等を入力し、また検索対象データベースの指定を行う。
【0017】
クライアント端末3のクライアント検索インターフェース部33は、ユーザから検索キーワード等の検索条件入力を受け付け(ステップS7)、当該検索条件入力データを検索サーバ5に送信する(ステップS9)。検索サーバ5の検索処理部51は、クライアント端末3から検索条件入力データを受信し、一旦記憶装置に格納する(ステップS11)。そして、検索キーワード等の検索条件に従って文献DB53に対して検索を行い、該当する文献のデータ等を抽出する(ステップS13)。
【0018】
文献DB53には例えば図3に示すようなデータが格納されている。図3のテーブル例では、文献のレコード番号の列201と、出願番号の列202と、出願日の列203と、公開番号の列204と、公開日の列205と、登録番号の列206と、...出願人の列207と、名称の列208と、要約の列209等が設けられている。この他本文のデータについても保持されている。このようなデータを参照して検索を行う。
【0019】
そして、データ操作部52は、抽出データに対して所定の処理を実施する(ステップS14)。所定の処理は、例えば検索キーワード等に対して、抽出された各文献の関連度を計算し、当該抽出された文献を関連度に従って並べ替える処理である。また、抽出された文献と使用されている語句との関連度を計算し、当該関連度に従って関連の深い語句を順番に並べる処理である。なお、関連度を計算して並べ替える処理については従来と同じであって、文書内の単語を「TF・IDF」や「カルバックの情報量」を用いて重み付けし、次に単語の重みを用いて文書をベクトルとして表現し、文書の関連度をベクトルの内積で計算する方法などが良く知られている。また、例えば特開2000−315207号公報や特開2002−245061号公報にも開示されている。これらの処理結果は検索サーバ5のワークメモリ領域に保持される。
【0020】
なお、各文献において使用されている語句については、予め関連度が高い語句を関連単語として特定し、関連語データ格納部55に登録しておき、上で述べたような処理に用いるようにしても良い。例えば関連語データ格納部55には、図4に示すようなデータが登録されている。図4の例では、公開番号に対応して関連単語が列挙されるようになっている。
【0021】
そして検索サーバ5は、ステップS14の処理結果を含む検索結果表示ページのデータを生成し、クライアント端末3に送信する(ステップS15)。クライアント端末3のクライアント検索インターフェース部33は、検索サーバ5から検索結果表示ページのデータを受信し、表示装置に表示する(ステップS17)。
【0022】
例えば図5に示すような画面が表示装置31に表示される。図5の例では、キーワード入力欄301と、クリアボタン302と、検索再実行ボタン318と、入力キーワードに関連が深い単語をランキング表示するための関連単語表示欄303と、検索対象の文献を格納したデータベースを指定するための連想辞書指定欄304と、連想辞書指定欄304において指定されたデータベースの全体又はサブセットを指定するためのテキスト集合指定欄305と、(入力キーワードにヒットした文献群中の関連単語数/文献群全体の関連単語数)を表示する単語表示欄316と、(入力キーワードにヒットした文献の数/全文献数数)を表示するテキスト表示欄317と、表作成、グラフ作成、フロー作成などの表示形態の選択を行うためのコマンド指定欄307と、コマンド指定欄307において指定された表示形態を実行させるためのコマンドボタン306と、グラフの縦軸設定や関連単語種別の指定を行うための縦軸設定欄308と、グラフの横軸設定などを行うための横軸設定欄309と、縦軸設定欄をデフォルトに戻すためのボタン310と、横軸設定欄をデフォルトに戻すためのボタン311と、複合語の検索を行うための単語パターン入力欄312と、絞込検索を行う場合に選択するボタン群(オン/オフ/反転)313と、その絞込みの条件(AND/OR)のラジオボタン314と、検索の結果ヒットした文献の表示欄315とが設けられている。
【0023】
図5に示すようにステップS7において入力された検索キーワードは「ソフトウエア」及び「情報処理」であり、使用したデータベースは「特許公報抜粋」であって、検索はその全体に対して行われている。この際、入力キーワードにヒットした文献群中の関連単語数は1353であり、文献群全体の関連単語数は29220である。また、入力キーワードにヒットした文献数は60であり、全体の文献数は2752である。関連単語表示欄303には「ソフトウエア」及び「情報処理」を包含する文献群に関連する単語を関連度のランキングとして表示しており、文献の表示欄315には「ソフトウエア」及び「情報処理」を包含する文献群を関連度のランキングとして表示している。
【0024】
ユーザは、この画面において、コマンド指定欄307において検索結果の表示形態を指定し、コマンドボタン306をクリックする。例えば図5に示されているように「表作成」が選択されたとする。クライアント端末3のクライアント検索インターフェース部33は、ユーザによる表示形態についてのコマンド入力を受け付け、検索サーバ5に送信する(ステップS19)。検索サーバ5のデータ操作部52は、クライアント端末3から表示形態についてのコマンドを受信し(ステップS21)、ステップS13において抽出されたデータを用いて指示された表示形態を実現するための表示用データを生成し、ワークメモリ領域に格納する(ステップS23)。
【0025】
データ操作部52は、抽出されたデータ(ここでは60件の文献の要約、請求項、その他の本文及び書誌情報)を用いて、抽出された文献をクラスタリングする(図6:ステップS31)。このクラスタリングについては、抽出された文献の関連単語の各々について関連度を計算し、計算された関連度の高い単語毎にグループ分けを行う。さらに、各グループに分類された単語と各文献の関連度を計算し、各文献を関連度の高いグループ(クラスタ)に紐付ける。なお、このクラスタリング計算については、文書内の単語を「TF・IDF」や「カルバックの情報量」を用いて重み付けし、次に単語の重みを用いて文書をベクトルとして表現し、文書の関連度をベクトルの内積で計算した上、全文書間の関連度を計算して得られる関連度マトリックスに対してクラスタリングアルゴリズムを適用する方法などが一般的に知られている。例えば、上記列挙した特許文献を参照のこと。
【0026】
図5の例では、以下のようなクラスタリングが行われる。
クラスタリング1:形成 画像 制限 識別情報 品 配信 識別
クラスタリング2:名 版番号 版 参照関係情報 参照関係 変更 版管理
クラスタリング3:着脱可能 情報管理方法 情報管理 ID ユーザ ソウトウエア情報 ユーザID
クラスタリング4:命令 比較 アドレスレジスタ 実行 アドレス 領域 デバッグ
クラスタリング5:電子メール 電子 メール 送信 生成 受信 端末
クラスタリング6:バージョン バージョンアップ アップ 機器 バージョン情報 シリアル 日時
各クラスタに含まれる文献は、各クラスタに含まれる関連単語との関連が深い文献となる。
【0027】
なお、ある語句の特定の文献との関連度は、以下のように計算される。すなわち、(特定の文献における、ある語句の出現回数/データベース(上の例では特許公報群)においてある語句が出現する文献数)で計算される。これは、特定の文献に頻繁に現れる語句はその特定の文献の特徴的な語句であり、一方で多くの文献で出現する語句は特定の文献における特徴的な語句とは言えないという観点から定義されている。但し、他の方法にて関連度を計算するようにしても良い。
【0028】
次に、データ操作部52は、指定された表示形態についてのコマンドに基づき、各文献の表示データを特定する(ステップS33)。ここでは、公開番号と名称と出願人名とが表示データとして予め設定されており、これらのデータを各文献について特定する。そして、クラスタ毎に各文献の上記表示データを配置する(ステップS35)。なお、本実施の形態では、縦軸にはクラスタを、横軸には出願人をとるものとする。すなわち、クラスタと出願人との組にて各文献を分類するものである。但し、横軸については別のデータを用いても良い。最後に、クライアント端末3において、特定の表示処理部34により処理可能なデータ・フォーマットで表示用データを生成し、ワークメモリ領域に格納する(ステップS37)。特定の表示処理部34は、「表作成」というコマンドに対応して選択される。
【0029】
データ操作部52は以上のような処理を実施し、生成された表示用データをクライアント端末3に送信する(図2:ステップS25)。クライアント端末3のクライアント検索インターフェース部33は、検索サーバ5から表示用データを受信する(ステップS27)。そして、クライアント検索インターフェース部33は、受信した表示用データに対応する表示処理部34が起動されているか確認し、起動されていなければ、受信した表示データに対応する表示処理部34を起動する。表示処理部34は、受信した表示用データを用いて、ユーザにより指示された表示形態で、検索結果を表示装置31に表示する(ステップS29)。なお、処理は端子A及びBを介して図11に移行する。
【0030】
図7に画面例を示す。図7の例では、表示形態選択欄401と、テーブル410とが含まれる。表示形態選択欄401は、次の表示形態を選択するためのコンボボックスである。例えば、図8に示すように、特許マップ(図7)、特許フロー(図14)、グラフ(図19)、スケルトンマップ(図24)、アンカーマップ(図26)のいずれかを選択することができる。テーブル410は、各クラスタのデータを表示するための、クラスタの列402と、A社の該当文献(10件)をクラスタ別に表示するための列403と、B社の該当文献(8件)をクラスタ別に表示するための列404と、C社の該当文献(6件)をクラスタ別に表示するための列405と、D社の該当文献(5件)をクラスタ別に表示するための列406とが設けられている。上で述べたように横軸は出願人の軸になっている。一方テーブル410には、クラスタリング3の行407と、クラスタリング4の行408と、クラスタリング5の行409とが含まれる。なお、クラスタリング1及び2の行については、画面領域の関係から表示されていないが、スクロールバーなどを操作することにより表示させることができる。このようにユーザは、どの出願人の出願がどのクラスタに多く含まれるのかといったことを分析することができる。また、検索結果においてどの出願人の出願が多いのかということも把握することができる。
【0031】
なお、公開番号、名称及び出願人名のセットからなる表示項目の各々は、次の処理のために選択可能になっている。また、領域で指定することも可能になっており、当該領域に含まれる表示項目が選択される。例えば図9に示すように、クラスタリング4の行408に含まれ且つA社の列403とB社の列404とC社の列405に含まれる10件の表示項目(文献)を、領域415を指定することにより選択することができる。なお、表示項目(文献)を一つ一つ選択するようにしても良い。各表示項目は、例えばボタンのようになっており、クリックできるような表示形態であってもよい。
【0032】
図9の例では、領域415に含まれる表示項目(文献)を選択し、次の表示形態として表示形態選択欄401において「特許フロー」を選択したものとする。そして、ユーザが入力装置32のマウスの右ボタンを押すと、図10に示すメニューが表示されるようになっている。図10の例では、「外部コマンド起動」421、環境設定、コピー、貼り付け、形式を選択して貼り付け、挿入、削除、数式と値のクリア、コメントの挿入、セルの書式設定、リストから選択、ハイパーリンクなどのメニュー項目が含まれている。ここでは外部コマンド起動421を選択する。なお、本実施の形態においては、表示項目を選択しなければ、全表示項目が黙示的に選択されたものとみなす。
【0033】
そうすると、表示処理部34は、ユーザからの表示形態及び表示項目選択入力を受け付け(図11:ステップS41)、クライアント端末3のクライアント検索インターフェース部33に、選択された表示項目及び表示形態のデータを出力する。
【0034】
クライアント検索インターフェース部33は、選択された表示項目及び表示形態のデータを検索サーバ5に送信する(ステップS43)。検索サーバ5のデータ操作部52は、選択された表示項目及び表示形態のデータを受信し、一旦ワークメモリ領域に格納する(ステップS45)。そして、選択された表示項目に対応する文献のデータを例えば文献DB53から抽出する(ステップS47)。前の処理の結果がワークメモリ領域に保持されたままであればそのデータを用いることも可能である。ここでは、表示項目には少なくとも公開番号が含まれるため、公開番号から10件の文献のデータを特定することができる。そして、抽出されたデータを用いて、指定された表示形態(ここでは「特許フロー」)を実現するための表示用データを生成し、ワークメモリ領域に格納する(ステップS49)。
【0035】
データ操作部52は、選択された表示項目に対応する文献のデータを用いて、選択された文献間の関連度を計算する(図12:ステップS61)。文献間の関連度の計算についても周知の技術であるからここでは説明しない。なお、例えば図13に示すようなデータが生成され、例えば関連度データ格納部54に格納される。図13の例では、選択された10件の文献が縦及び横に同じように並べられ、1つの文献につき他の9件の文献との関連度が登録されている。但し、予め設けられている閾値以下の関連度の場合には「−」で表している。
【0036】
そして、各文献のデータから表示データを特定する(ステップS63)。ここでは公開番号、名称及び出願人が表示データとして予め設定されており、これらのデータを各文献について特定する。また、表示データを含む表示項目を文献のデータに含まれる出願日又は公開日に従って時系列に並べ、関連度に従った太さの線分で表示項目間を結んだ状態を表示するための表示用データを、特許フロー表示用の表示処理部34が処理可能なフォーマットで生成する(ステップS65)。
【0037】
そして検索サーバ5は、生成した表示用データをクライアント端末3に送信する(図11:ステップS51)。クライアント端末3のクライアント検索インターフェース部33は、検索サーバ5から表示用データを受信する(ステップS53)。そして、受信した表示用データに対応する表示処理部34が起動されているか確認し、起動されていなければ表示処理部34を起動する。そして、表示処理部34に表示用データを出力する。表示用データに対応する表示処理部34は、ユーザ指定の表示形態で表示用データを表示装置31に表示する(ステップS55)。なお、別途検索をやり直す場合には端子Cを介して図2に移行する。一方、以下で説明するように表示形態及び表示項目を選択して分析を進める場合にはステップS41に戻る(ステップS57)。
【0038】
例えば図14に示すような画面が表示される。図14の例では、10の表示項目501乃至510が公開日又は出願日に従って左から右へ時系列で並べられている。また、所定の閾値以上の関連度を有する表示項目間は線分で結ばれており、関連度が高い文献間の線分はより太く示されている。例えば表示項目502と表示項目503は、10の表示項目の中で最も関連度が高く、最も太い線分にて接続されている。また、表示項目502と表示項目510、表示項目505と表示項目506、表示項目505と表示項目509も比較的関連度が高く、中太線で結ばれている。なお、これらの表示項目は全て選択可能となっており、ボタン表示されている場合もある。また領域指定により1又は複数の表示項目を選択する場合もある。
【0039】
さらに表示項目間を結ぶ線分に、表示項目間の接続関係及び太さのデータだけを保持させるのではなく、実際の関連度を保持させるようにしても良い。この場合、例えば図14の表示部分に加え表示切替ボタンを設けて、当該表示切替ボタンをクリックすることにより例えば図15に示すような表示を行わせる場合もある。図15では、表示されている表示項目間の接続線に、当該接続線の関連度を表示させている。表示項目は、接続線に関連度の数値を表示するために位置をずらして表示される。図15のような表示においても、各表示項目は選択可能となっており、1又は複数の表示項目を選択することができる。
【0040】
例えば図16に示すように、ユーザが表示項目506乃至510を包含するように領域515を指定し、図16の表示部分外に設けられた表示項目指定欄(例えば図7)において再度「特許フロー」を選択したものとする。そしてさらに入力装置32のマウスの右ボタンを押して例えば図10のようなメニューを表示させ、「外部コマンド起動」421を選択するものとする。
【0041】
このようにクライアント端末3の表示処理部34は、ユーザからの表示形態及び表示項目の選択入力を受け付け(図11:ステップS41)、当該選択された表示形態及び表示項目のデータをクライアント検索インターフェース部33に出力する。クライアント検索インターフェース部33は、選択された表示形態及び表示項目のデータを受け取り、検索サーバ5に送信する(ステップS43)。
【0042】
検索サーバ5のデータ操作部52は、選択された表示項目及び表示形態のデータを受信し、一旦ワークメモリ領域に格納する(ステップS45)。そして、選択された表示項目に対応する文献のデータを例えば文献DB53から抽出する(ステップS47)。前の処理の結果がワークメモリ領域に保持されたままであればそのデータを用いることも可能である。ここでは、表示項目には少なくとも公開番号が含まれるため、公開番号から5件の文献のデータを特定することができる。そして、抽出されたデータを用いて、指定された表示形態(ここでは「特許フロー」)を実現するための表示用データを生成し、ワークメモリ領域に格納する(ステップS49)。すなわち図12に示したような処理を、5件の文献のデータに対して実行することになる。
【0043】
そして検索サーバ5は、生成した表示用データをクライアント端末3に送信する(ステップS51)。クライアント端末3のクライアント検索インターフェース部33は、検索サーバ5から表示用データを受信する(ステップS53)。そして、受信した表示用データに対応する表示処理部34が起動されているか確認し、起動されていなければ表示処理部34を起動する。そして、表示処理部34に表示用データを出力する。表示用データに対応する表示処理部34は、ユーザ指定の表示形態で表示用データを表示装置31に表示する(ステップS55)。
【0044】
例えば図17に示すような画面が表示される。図17では、5つの表示項目が公開日又は出願日に従って時系列に並べられている。各表示項目が選択可能であり、表示項目間は対応する文献間の関連度に従った太さを有する線分で接続されている。但し、図16における領域515における接続関係と、図17における接続関係は明らかに異なっている。これは、5の文献の関連度と10の文献の関連度では、その値が異なってくるためである。このように本実施の形態では、単に領域515の拡大表示を行うのではなく、再度選択された文献間において関連度の計算を行うため、選択された文献のみにおける関係を示すことができるようになる。図17において、さらに表示項目及び表示形態を指定して、分析を進めることも可能である。また、表示項目を指定しない場合には、全表示項目が選択されたものとしてみなされ処理が行われる。
【0045】
また、例えば図15の状態で、表示項目を選択せずに、図15の表示部分外に設けられた表示形態指定欄(例えば図7)において「グラフ」を選択したものとする。そしてさらに入力装置32のマウスの右ボタンを押して例えば図10のようなメニューを表示させ、「外部コマンド起動」421を選択するものとする。上でも述べたように、表示項目を選択しない場合には、全表示項目が選択されたものとみなす。
【0046】
このようにクライアント端末3の表示処理部34は、ユーザからの表示形態及び表示項目の選択入力(表示項目の選択については間接的な選択)を受け付け(図11:ステップS41)、当該選択された表示形態及び表示項目のデータをクライアント検索インターフェース部33に出力する。クライアント検索インターフェース部33は、選択された表示形態及び表示項目のデータを受け取り、検索サーバ5に送信する(ステップS43)。
【0047】
検索サーバ5のデータ操作部52は、選択された表示項目及び表示形態のデータを受信し、一旦ワークメモリ領域に格納する(ステップS45)。そして、選択された表示項目に対応する文献のデータを例えば文献DB53から抽出する(ステップS47)。前の処理の結果がワークメモリ領域に保持されたままであればそのデータを用いることも可能である。ここでは、表示項目には少なくとも公開番号が含まれるため、公開番号から10件の文献のデータを特定することができる。そして、抽出されたデータを用いて、指定された表示形態(ここでは「グラフ」)を実現するための表示用データを生成し、ワークメモリ領域に格納する(ステップS49)。
【0048】
データ操作部52は、選択された表示項目に対応する文献(以下「選択された文献」と記す)の関連単語のデータを関連語データ格納部55から読み出す(図18:ステップS71)。そして、選択された文献群に対する関連度の高い関連単語を所定個数選択する(ステップS73)。文献と語句との関連度については周知の技術であるから、ここでは説明を省略する。そして、選択された文献を関連単語にて分類し且つ特定の事項(ここでは出願年)に基づいて文献数を集計し、例えばワークメモリ領域に格納する(ステップS75)。ここでは、各出願年につき関連単語毎に当該関連単語を含む文献数をカウントする。そして、当該集計結果をグラフ表示するための表示用データをグラフ表示用の表示処理部34が処理可能なフォーマットで生成し、例えばワークメモリ領域に格納する(ステップS77)。
【0049】
そして検索サーバ5は、生成した表示用データをクライアント端末3に送信する(図11:ステップS51)。クライアント端末3のクライアント検索インターフェース部33は、検索サーバ5から表示用データを受信する(ステップS53)。そして、受信した表示用データに対応する表示処理部34が起動されているか確認し、起動されていなければ表示処理部34を起動する。そして、表示処理部34に表示用データを出力する。表示用データに対応する表示処理部34は、ユーザ指定の表示形態で表示用データを表示装置31に表示する(ステップS55)。
【0050】
例えば図19に示すような画面が表示される。図19の例では、表示形態指定欄601と、出願年又は出願人の選択を行うための選択欄602とが設けられており、縦軸は件数(文献数)、横軸は出願年であるグラフが表示されている。本例では、15の関連単語が表示項目として表示されており、1又は複数の関連単語を選択可能となっている。すなわち、「周辺機器」「自動」といった語句を出願年に関わらず選択する。
【0051】
また、選択欄602における選択を「出願年」から「出願人」に変更すると、図20に示すようなグラフに表示を変更することができる。図20の例では、表示項目である関連単語について変更はない。但し、横軸が出願年から出願人に変更されるため、各出願人について各関連単語を含む文献の数を集計して表示するようになる。図20においても表示項目である1又は複数の関連単語を選択することができる。
【0052】
例えば出願年を横軸にした場合のグラフにおいて、図21に示すように表示形態指定欄601において「スケルトンマップ」を選択し、さらに表示項目である関連単語の「周辺機器」615を選択するものとする。図21では太線等により選択されたことが表示される。さらに、入力装置32であるマウスの右ボタンを押すと、図22のようなメニューが表示される。図22におけるメニューでは、「系列選択」620、「環境設定」「元のデータ」「クリア」といった選択肢が設けられている。ここでは系列選択620を選択するものとする。
【0053】
このようにクライアント端末3の表示処理部34は、ユーザからの表示形態及び表示項目の選択入力を受け付け(図11:ステップS41)、当該選択された表示形態及び表示項目のデータをクライアント検索インターフェース部33に出力する。クライアント検索インターフェース部33は、選択された表示形態及び表示項目のデータを受け取り、検索サーバ5に送信する(ステップS43)。
【0054】
検索サーバ5のデータ操作部52は、選択された表示項目及び表示形態のデータを受信し、一旦ワークメモリ領域に格納する(ステップS45)。そして、選択された表示項目に対応する文献のデータを例えば文献DB53から抽出する(ステップS47)。前の処理の結果がワークメモリ領域に保持されたままであればそのデータを用いることも可能である。ここで表示項目は「周辺機器」であるから、関連語データ格納部55に格納されているデータに基づき「周辺機器」が関連単語として登録されている文献を例えば公開番号にて特定する。そして、当該公開番号から文献のデータを抽出する。そして、抽出されたデータを用いて、指定された表示形態(ここでは「スケルトンマップ」)を実現するための表示用データを生成し、ワークメモリ領域に格納する(ステップS49)。
【0055】
データ操作部52は、抽出された文献のデータである各関連単語(「周辺機器」以外の単語)について単語間の関連度を計算し、例えばワークメモリ領域に格納する(図23:ステップS81)。なお、所定の基準以下の関連度の場合には、関連度を0とみなす。このデータについても関連度データ格納部54に格納するようにしても良い。そして、各単語を表示項目とし、単語間をその関連度に従った太さの線分とする表示形態のための表示用データをスケルトンマップ表示を行う表示処理部34が処理可能なフォーマットで生成し、例えばワークメモリ領域に格納する(ステップS83)。
【0056】
そして検索サーバ5は、生成した表示用データをクライアント端末3に送信する(図11:ステップS51)。クライアント端末3のクライアント検索インターフェース部33は、検索サーバ5から表示用データを受信する(ステップS53)。そして、受信した表示用データに対応する表示処理部34が起動されているか確認し、起動されていなければ表示処理部34を起動する。そして、表示処理部34に表示用データを出力する。表示用データに対応する表示処理部34は、ユーザ指定の表示形態で表示用データを表示装置31に表示する(ステップS55)。
【0057】
例えば図24に示すような画面が表示される。図24では、各関連単語が表示項目となっており、1又は複数の表示項目を選択することが可能となっている。また、本実施の形態では、全く選択しない場合には全体が選択されていると判断されるようになっている。さらに、領域を指定することにより、当該領域に含まれる表示項目(関連単語)を指定することも可能である。図24の例では、太い線分によって接続されている関連単語は関連が深いものであり、中太の線分、細い線分と移行するにつれ関連度は下がる。なお、接続されていない単語間については関連度が所定の基準以下であることを示している。
【0058】
図24には示していないが、このスケルトンマップから次の表示形態に移行するために表示形態指定欄が設けられており、表示形態指定欄において次の表示形態を選択し、さらに表示項目を選択した後に、入力装置32であるマウスの右ボタンを押すと例えば図10のようなメニュー画面が表示される。ここで「外部コマンド起動」421を選択すると、表示形態及び表示項目の選択入力がなされる。ここでは、例えば全表示項目が選択され、表示形態として「アンカーマップ」が選択されたものとする。
【0059】
このようにクライアント端末3の表示処理部34は、ユーザからの表示形態及び表示項目の選択入力(表示項目の選択については間接的な選択)を受け付け(図11:ステップS41)、当該選択された表示形態及び表示項目のデータをクライアント検索インターフェース部33に出力する。クライアント検索インターフェース部33は、選択された表示形態及び表示項目のデータを受け取り、検索サーバ5に送信する(ステップS43)。
【0060】
検索サーバ5のデータ操作部52は、選択された表示項目及び表示形態のデータを受信し、一旦ワークメモリ領域に格納する(ステップS45)。そして、選択された表示項目に対応する文献のデータを例えば文献DB53から抽出する(ステップS47)。前の処理の結果がワークメモリ領域に保持されたままであればそのデータを用いることも可能である。ここで選択された表示項目は全関連単語(「周辺機器」を除く)であるから、関連語データ格納部55に格納されているデータに基づき図24に表示されている全関連単語のいずれかが関連単語として登録されている文献を例えば公開番号にて特定する。そして、公開番号から文献のデータを抽出する。なお、図24において全関連単語が選択された場合には、処理対象の文献には変更がないものとして、前回の処理で抽出された文献のデータに基づいて処理するようにしても良い。そして、抽出されたデータを用いて、指定された表示形態(ここでは「アンカーマップ」)を実現するための表示用データを生成し、ワークメモリ領域に格納する(ステップS49)。
【0061】
データ操作部52は、抽出された文献を特定の事項(ここでは出願人名)に基づきグループ分けする(図25:ステップS91)。すなわち、出願人毎に文献を分ける。次に、各グループに含まれる文献群と各関連単語との関連度を計算し、例えばワークメモリ領域に格納する(ステップS93)。また、関連度データ格納部54に格納するようにしても良い。そして、各グループをその特定の事項(出願人名)のデータ(「A社」「B社」「C社」)で表し、グループに含まれる文献群と各関連単語との関連度をそのグループの特定の事項のデータと関連単語との間の線分の太さにより表すための表示用データを対応する表示処理部34が処理可能なフォーマットで生成し、例えばワークメモリ領域に格納する(ステップS95)。
【0062】
そして検索サーバ5は、生成した表示用データをクライアント端末3に送信する(図11:ステップS51)。クライアント端末3のクライアント検索インターフェース部33は、検索サーバ5から表示用データを受信する(ステップS53)。そして、受信した表示用データに対応する表示処理部34が起動されているか確認し、起動されていなければ表示処理部34を起動する。そして、表示処理部34に表示用データを出力する。表示用データに対応する表示処理部34は、ユーザ指定の表示形態で表示用データを表示装置31に表示する(ステップS55)。
【0063】
例えば図26に示すような画面が表示される。図26では、選択可能な表示項目は、出願人名である「A社」701と、「B社」702と、「C社」703と、全関連単語である。但し、関連度が所定値以下の関連単語については出願人名とは接続されないため、表示が省略される。これらの表示項目は、ボタン化するなど、選択可能となっている。また、別途選択を示すためのボタンなどを用意しても良い。また、領域を指定して、当該領域に入っている表示項目を選択とみなす方式も可能である。図26では、「A社」701、「B社」702及び「C社」703の出願人名の位置が固定されており、これらの出願人名から放射状に関連単語との関連度を表す太さの線分が伸びており、関連単語と接続されている。関連単語によっては複数の文献群(複数の出願人の文献)と関連するものもあるため、複数の線分で複数の出願人名と接続されている関連単語もある。
【0064】
図26には示されていないが、表示形態指定欄が設けられており、図26から次の表示形態を指示することが可能となっている。すなわち、複数の表示項目と表示形態とを指定して、次の表示形態で表示させることが可能となっている。
【0065】
以上述べたように、グラフ、表、各種フローなど、ある表示形態から別の表示形態への移行を直接行うことで、分析者は思考を寸断することなく調査・分析することが可能となる。また、上記のように実現された表示形態は、それぞれ関連度による分類、文献の内容の特定事項に基づいた遷移、時系列に沿った関連度が示されるものであり、意味付けが異なるものであるから、分析者が様々な観点で調査・分析を進める支援となる。
【0066】
さらに、別の表示形態に移行する際、分析する範囲も指定できるため、連想的な調査・分析が可能となる。また、分析したい範囲を指定した場合、その範囲内の文献に閉じて新たに関連度の計算等を行い、結果を表示するため、より高い精度で分類表示され、分析者の思考を支援することができる。
【0067】
以上本発明の実施の形態を説明したが、本発明は上記実施の形態に限定されるものではない。例えば、表示形態の遷移の一例を図にて説明したが、このようなルートを取らなければならないわけではなく、どの段階でも任意の表示形態を選択することができる。但し、何らかの制限により遷移可能な表示形態が絞られる場合もあるが、原理的には任意の表示形態に移行することができる。
【0068】
また、図1で示した機能ブロックは一例であって、必ずしもプログラムモジュールに対応するものではない。また、クライアント・サーバ環境における実施を示したが、検索サーバ5とクライアント端末3の機能を併せ持った端末装置により上記のような処理を実施する場合もある。単に検索機能のみがサーバにおかれる場合もある。
【0069】
また画面表示例は一例であって、必ずしも上記のような画面構成でなければならないわけではない。
【0070】
さらに、関連度の計算方法は任意であり、さらに表示形態についても上で述べた態様に限定されるわけではない。他の処理アルゴリズムにより文献のデータを処理してユーザに提示するようにしても良い。
【0071】
(付記1)
ユーザにより指定された検索条件に従って所定の文献群を検索し、当該検索により抽出された複数の文献のデータを記憶装置に格納するステップと、
前記検索により抽出された複数の文献のデータを、各表示項目を次の処理キーとして選択可能とし且つ第1の表示形態にて前記ユーザに提示するためのデータに処理し、当該処理結果を出力する第1処理ステップと、
前記ユーザにより直接又は間接的に選択された表示項目に対応する、文献のデータを抽出し、記憶装置に格納するステップと、
前記選択された表示項目に対応する、文献のデータを、各表示項目を次の処理キーとして選択可能とし且つ前記ユーザにより指定された第2の表示形態にて前記ユーザに提示するためのデータに処理し、当該処理結果を出力する第2処理ステップと、
を含む、コンピュータによる検索処理方法。
【0072】
(付記2)
前記第1及び第2の表示形態が、少なくとも
処理すべき複数の文献を使用語句によりクラスタリングして予め規定されている表示事項でもって提示する形態と、
処理すべき複数の文献を予め規定されている表示事項と各文献の使用語句により算出される関連度を表す接続線とでもって表示する形態と、
処理すべき複数の文献を使用語句について分類且つ集計した結果をグラフによって表示する形態と、
処理すべき複数の文献の使用語句と当該使用語句間の関連度を表す接続線とを表示する形態と、
処理すべき複数の文献のうち特定の事項で関連付けられた文献群を前記特定の事項により、前記特定の事項で関連付けられた文献群と前記処理すべき文献のデータである使用語句との関連度を前記特定の事項と前記使用語句との間の接続線でもって表示する形態と、
のうちいずれかであることを特徴とする付記1記載の検索処理方法。
【0073】
(付記3)
前記第1処理ステップが、
前記検索により抽出された複数の文献のデータを用いて各文献をクラスタリングするステップと、
前記検索により抽出された複数の文献のデータから、前記第1の表示形態について予め規定されている表示事項に係るデータを抽出するステップと、
抽出された表示事項に係るデータを前記次の処理キーとして各クラスタについて表示するためのデータを生成するステップと、
を含む付記1記載の検索処理方法。
【0074】
(付記4)
前記第1処理ステップが、
前記検索により抽出された複数の文献のデータを用いて各文献の関連度を算出するステップと、
前記検索により抽出された複数の文献のデータから、前記第1の表示形態について予め規定されている表示事項に係るデータを抽出するステップと、
前記次の処理キーとなり且つ各文献につき抽出された表示事項に係るデータと、当該データ間を前記各文献の関連度を反映させて接続する線分とを表示するためのデータを生成するステップと、
を含む付記1記載の検索処理方法。
【0075】
(付記5)
前記第1処理ステップが、
前記検索により抽出された複数の文献のデータである使用語句に基づき前記検索により抽出された複数の文献を分類し、前記検索により抽出された複数の文献のデータのうち前記第1の表示形態について予め規定されている特定の事項に基づいて文献数を集計するステップと、
当該集計結果を表示するためのデータを生成するステップと、
を含む付記1記載の検索処理方法。
【0076】
(付記6)
前記第1処理ステップが、
前記検索により抽出された複数の文献のデータである使用語句の関連度を算出するステップと、
前記次の処理キーとなる前記使用語句と、当該使用語句間を前記関連度を反映させて接続する線分とを表示するためのデータを生成するステップと、
を含む付記1記載の検索処理方法。
【0077】
(付記7)
前記第1処理ステップが、
前記検索により抽出された複数の文献を前記第1の表示形態について予め規定されている特定の事項で関連付けるステップと、
関連付けられた文献群と前記検索により抽出された複数の文献のデータである使用語句との関連度を算出するステップと、
前記関連付けられた文献群を前記特定の事項のデータにより表し且つ前記関連付けられた文献群と前記使用語句との関連度を前記特定の事項と前記使用語句との接続線でもって表示するためのデータを生成するステップと、
を含む付記1記載の検索処理方法。
【0078】
(付記8)
前記第2処理ステップが、
前記選択された表示項目から特定された文献のデータを用いて各文献をクラスタリングするステップと、
前記特定された複数の文献のデータから、前記第2の表示形態について予め規定されている表示事項に係るデータを抽出するステップと、
抽出された表示事項に係るデータを前記次の処理キーとして各クラスタについて表示するためのデータを生成するステップと、
を含む付記1記載の検索処理方法。
【0079】
(付記9)
前記第2処理ステップが、
前記選択された表示項目から特定された文献のデータを用いて各文献の関連度を算出するステップと、
前記特定された文献のデータから、前記第2の表示形態について予め規定されている表示事項に係るデータを抽出するステップと、
前記次の処理キーであり且つ各文献につき抽出された表示事項に係るデータと、当該データ間を前記各文献の関連度を反映させて接続する線分とを表示するためのデータを生成するステップと、
を含む付記1記載の検索処理方法。
【0080】
(付記10)
前記第2処理ステップが、
前記選択された表示項目から特定された文献のデータである使用語句に基づき前記特定された文献を分類し、前記特定された文献のデータのうち前記第2の表示形態について予め規定されている特定の事項に基づいて文献数を集計するステップと、
当該集計結果を表示するためのデータを生成するステップと、
を含む付記1記載の検索処理方法。
【0081】
(付記11)
前記第2処理ステップが、
前記選択された表示項目から特定された、文献の使用語句の関連度を算出するステップと、
前記次の処理キーである前記使用語句と、当該使用語句間を前記関連度を反映させて接続する線分とを表示するためのデータを生成するステップと、
を含む付記1記載の検索処理方法。
【0082】
(付記12)
前記第2処理ステップが、
前記選択された表示項目から特定された文献を前記第2の表示形態について予め規定されている特定の事項で関連付けるステップと、
関連付けられた文献群と前記特定された文献のデータである使用語句との関連度を算出するステップと、
前記関連付けられた文献群を前記特定の事項により表し且つ前記関連付けられた文献群と前記使用語句との関連度を前記特定の事項と前記使用語句との接続線でもって表示するためのデータを生成するステップと、
を含む付記1記載の検索処理方法。
【0083】
(付記13)
前記文献が特許文献であり、
前記表示項目が、特許文献の書誌情報又は特許文献の使用語句である
ことを特徴とする付記1記載の検索処理方法。
【0084】
(付記14)
前記第1及び第2処理ステップにおいて、
表示形態に対応する表示用プログラムを指定し、当該表示用プログラム用のデータを生成する
ことを特徴とする付記1記載の検索処理方法。
【0085】
(付記15)
前記第1の表示形態と前記第2の表示形態とが、予め定められた表示形態のうち任意の組み合わせとなることを特徴とする付記1記載の検索処理方法。
【0086】
(付記16)
ユーザにより指定された検索条件に従って所定の文献群を検索し、当該検索により抽出された複数の文献のデータを記憶装置に格納するステップと、
前記検索により抽出された複数の文献のデータを、各表示項目を次の処理キーとして選択可能とし且つ第1の表示形態にて前記ユーザに提示するためのデータに処理し、当該処理結果を出力する第1処理ステップと、
前記ユーザにより直接又は間接的に選択された表示項目に対応する、文献のデータを抽出し、記憶装置に格納するステップと、
前記選択された表示項目に対応する、文献のデータを、各表示項目を次の処理キーとして選択可能とし且つ前記ユーザにより指定された第2の表示形態にて前記ユーザに提示するためのデータに処理し、当該処理結果を出力する第2処理ステップと、
をコンピュータにより実行させるプログラム。
【0087】
(付記17)
ユーザにより指定された検索条件に従って所定の文献群を検索し、当該検索により抽出された複数の文献のデータを記憶装置に格納する手段と、
前記検索により抽出された複数の文献のデータを、各表示項目を次の処理キーとして選択可能とし且つ第1の表示形態にて前記ユーザに提示するためのデータに処理し、当該処理結果を出力する手段と、
前記ユーザにより直接又は間接的に選択された表示項目に対応する、文献のデータを抽出し、記憶装置に格納する手段と、
前記選択された表示項目に対応する、文献のデータを、各表示項目を次の処理キーとして選択可能とし且つ前記ユーザにより指定された第2の表示形態にて前記ユーザに提示するためのデータに処理し、当該処理結果を出力する手段と、
を有する検索処理装置。
【図面の簡単な説明】
【0088】
【図1】本発明の一実施の形態における機能ブロックを示す図である。
【図2】本発明の実施の形態におけるメインの処理フローを示す図である。
【図3】文献DBに格納されるデータの一例を示す図である。
【図4】関連語データ格納部に格納されるデータの一例を示す図である。
【図5】最初の検索結果を提示する画面例を示す図である。
【図6】第1の表示形態を実現するための処理フローを示す図である。
【図7】第1の表示形態を示す図である。
【図8】第1の表示形態における表示形態指定欄の一例を示す図である。
【図9】第1の表示形態を示す図である。
【図10】第1の表示形態におけるメニューを示す図である。
【図11】本発明の実施の形態におけるメインの処理フローを示す図である。
【図12】第2の表示形態を実現するための処理フローを示す図である。
【図13】関連度データ格納部に格納されるデータの一例を示す図である。
【図14】第2の表示形態を示す図である。
【図15】第3の表示形態を示す図である。
【図16】第2の表示形態を示す図である。
【図17】第4の表示形態を示す図である。
【図18】第5の表示形態を実現するための処理フローを示す図である。
【図19】第5の表示形態を示す図である。
【図20】第6の表示形態を示す図である。
【図21】第5の表示形態を示す図である。
【図22】第5の表示形態におけるメニューを示す図である。
【図23】第7の表示形態を実現するための処理フローを示す図である。
【図24】第7の表示形態を示す図である。
【図25】第8の表示形態を実現するための処理フローを示す図である。
【図26】第8の表示形態を示す図である。
【符号の説明】
【0089】
1 ネットワーク 3 クライアント端末
5 検索サーバ
31 表示装置 32 入力装置
33 クライアント検索インターフェース部
34 表示処理部
51 検索処理部 52 データ操作部
53 文献DB 54 関連度データ格納部
55 関連語データ格納部
【技術分野】
【0001】
本発明は、文献データベースの検索技術に関し、より詳しくは、検索実行時におけるユーザインターフェースに関する。
【背景技術】
【0002】
従来、例えばある文書群に対して、含まれている文章の特徴や類似性などの分析を進める場合、テキストマイニング技術や、重み付け計算による検索技術を用いて文書群に対して処理を行い、その処理結果を表やグラフに変換して分析者に提示していた。従来技術では、元となる文書群のデータをベースに、それぞれ表、グラフ、又は図を個別に生成して表示していた。
【0003】
しかし分析を進める上で、ある分析結果から次の分析結果を得ようとする場合がある。従来技術においても検索結果の一部を単に参照したり、検索結果を絞り込むという単純な処理は可能であったが、該当部分を単に表示するだけでその意味合いに何らの変化を与えるものではなかった。さらに、例えばある表の中から関心のある部分だけを、新たな観点を含めて表示させたり、その部分を別の観点の図等に変換して表示させる場合には、一度元の文書群のデータに戻り、改めて検索条件を設定し、その文書群のデータ内の数値やテキストなどを用いて処理を行い、当該処理結果を所望の表示形態に変換するといったプロセスが必要となる。従って、このような場合には非常に手間がかかり、分析結果からすぐに次の分析へ思考を働かせたい時に、大きな障害となってしまうという問題点があった。
【0004】
また、特開2001−92851号公報には以下の技術が開示されている。すなわち、特許/技術資料検索システムより取得した検索ファイルのデータをコンピュータを利用して特許情報または技術情報分析用マスタテーブルに自動変換した後、必要な形態の特許マップ、或は、各種の通計グラフなどを出力するための方法が開示されている。しかしこの技術によっても、検索ファイルのデータを変更しなければならないような場合には、別途マスタテーブルに変換しなければならない。従って、前回の検索結果をさらに絞り込んだりする場合には、通常と同様に新たな検索ファイルを用意しなければならず、処理や手間が簡略化されることはない。
【特許文献1】特開2001−92851号公報
【発明の開示】
【発明が解決しようとする課題】
【0005】
従って、本発明の目的は、検索者が直感的に検索結果の分析を行うことができるようにするための検索処理技術を提供することである。
【課題を解決するための手段】
【0006】
本発明の第1の態様に係る検索処理方法は、ユーザにより指定された検索条件に従って所定の文献群を検索し、当該検索により抽出された複数の文献のデータを記憶装置に格納するステップと、検索により抽出された複数の文献のデータを、各表示項目を次の処理キーとして選択可能とし且つ第1の表示形態にて前記ユーザに提示するためのデータに処理し、当該処理結果を出力する第1処理ステップと、ユーザにより直接又は間接的に選択された表示項目に対応する、文献のデータを抽出し、記憶装置に格納するステップと、選択された表示項目に対応する、文献のデータを、各表示項目を次の処理キーとして選択可能とし且つユーザにより指定された第2の表示形態にてユーザに提示するためのデータに処理し、当該処理結果を出力する第2処理ステップとを含む。
【0007】
検索により抽出された複数の文献のデータが次の処理キー及び選択可能な表示項目として第1の表示形態にてユーザに提示されると共に、ユーザによる表示項目の選択に応じて、選択された表示項目に対応する文献のデータを、さらに次の処理キー及び選択可能な表示項目としてユーザにより指定された第2の表示形態にてユーザに提示されるようになる。従って、直感的なインターフェースにて分析対象及び表示形態を変更してゆき、分析を進めることができるようになる。
【0008】
また、上で述べた第1及び第2の表示形態が、少なくとも(a)処理すべき複数の文献を使用語句によりクラスタリングして予め規定されている表示事項でもって提示する形態と、(b)処理すべき複数の文献を予め規定されている表示事項と各文献の使用語句により算出される関連度を表す接続線とでもって表示する形態と、(c)処理すべき複数の文献を使用語句について分類且つ集計した結果をグラフによって表示する形態と、(d)処理すべき複数の文献の使用語句と当該使用語句間の関連度を表す接続線とを表示する形態と、(e)処理すべき複数の文献のうち特定の事項で関連付けられた文献群を特定の事項により、特定の事項で関連付けられた文献群と処理すべき文献のデータである使用語句との関連度を上記特定の事項と使用語句との間の接続線でもって表示する形態とのうちいずれかである場合もある。これらの表示形態を自由に遷移することにより、分析を進めることができるようになる。なお、これらの表示形態に限定されるものではなく、他の表示形態を含めるようにしても良い。また、別の組み合わせから任意に選択できるようにすることもある。
【0009】
また、上で述べた第1及び第2処理ステップにおいて、表示形態に対応する表示用プログラムを指定し、当該表示用プログラム用のデータを生成するようにしてもよい。ユーザ端末の環境に合わせて、必要に応じて表示用プログラムを切り替えるものである。また、スタンドアロン環境、クライアント・サーバ環境のいずれにおいても実現可能である。
【0010】
本発明の第2の態様に係る検索処理方法は、処理部と、記憶装置と、関連度データテーブル格納部と、所定の文献群を格納している文献データベースとを有するコンピュータにより実行される検索処理方法である。そして、本検索処理方法は、処理部により、ユーザにより指定された検索条件に従って文献データベースを検索し、当該検索により抽出された第1の複数の文献のデータを記憶装置に格納する第1文献抽出ステップと、処理部により、第1文献抽出ステップにより抽出され且つ記憶装置に格納された第1の複数の文献のデータを読み出し、第1の複数の文献に関する情報及び表示形態をユーザに選択させるための情報を含む検索結果画面のデータを生成し、出力するステップと、処理部により、第1文献抽出ステップにより抽出され且つ記憶装置に格納された第1の複数の文献のデータを読み出し、当該第1の複数の文献間の関連度及び当該第1の複数の文献のうちの一つと当該文献に使用されている語句との関連度の少なくともいずれかを算出し、関連度データテーブル格納部に格納する第1関連度算出ステップと、処理部により、第1関連度算出ステップにより算出され且つ関連度データテーブル格納部に格納されたデータに基づき、第1文献抽出ステップにより抽出され且つ記憶装置に格納された第1の複数の文献のデータを、各表示項目を次の処理キーとして選択可能とし且つ検索結果画面においてユーザにより指定された第1の表示形態にてユーザに提示する第1処理結果画面のデータを生成し、出力する第1処理ステップと、処理部により、第1処理結果画面においてユーザにより選択された表示項目に対応する、第2の複数の文献のデータを文献データベースから抽出し、記憶装置に格納する第2文献抽出ステップと、処理部により、第2文献抽出ステップにより抽出され且つ記憶装置に格納された第2の複数の文献のデータを読み出し、当該第2の複数の文献間の関連度及び当該第2の複数の文献のうちの一つと当該文献に使用されている語句との関連度の少なくともいずれかを算出し、関連度データテーブル格納部に格納する第2関連度算出ステップと、処理部により、第2関連度算出ステップにより算出され且つ関連度データテーブル格納部に格納されたデータに基づき、第2文献抽出ステップにより抽出され且つ記憶装置に格納された第2の複数の文献のデータを、検索結果画面のデータを生成及び出力することなく、各表示項目を次の処理キーとして選択可能とし且つ第1処理結果画面においてユーザにより指定された第2の表示形態にてユーザに提示する第2処理結果画面のデータを生成し、出力する第2処理ステップとを含む。
【0011】
なお、上述の方法はプログラム及びコンピュータにて実施することができ、当該コンピュータは検索処理装置となる。また、上記プログラムは、例えばフレキシブルディスク、CD−ROM、光磁気ディスク、半導体メモリ、ハードディスク等の記憶媒体又は記憶装置に格納される。また、ネットワークなどを介してデジタル信号として配信される場合もある。尚、中間的な処理結果はメモリに一時保管される。
【発明の効果】
【0012】
以上述べたように、本発明に拠れば、検索者が直感的に検索結果の分析を行うことができるようになる。
【発明を実施するための最良の形態】
【0013】
図1に本発明の一実施の形態に係るシステム概要図を示す。例えばインターネットやLAN(Local Area Network)であるネットワーク1には、例えばウェブ(Web)サーバ機能を有する検索サーバ5と、例えばパーソナルコンピュータであってWebブラウザ機能を有する1又は複数のクライアント端末3とが接続されている。
【0014】
検索サーバ5は、検索対象となる文献を蓄積した文献DB53と、検索等により抽出された文献の間の関連度のデータなどを格納する関連度データ格納部54と、検索等により抽出された文献における使用語句のデータを格納する関連語データ格納部55とを管理している。また、検索サーバ5は、文献DB53に対して検索処理を行う検索処理部51と、検索処理部51が抽出した文献のデータ等を所定のアルゴリズムにて処理するデータ操作部52とを含む。なお、検索サーバ5は、1台のコンピュータではなく複数台のコンピュータにより以下で説明する機能を実現する場合もある。また、検索サーバ5は、クライアント端末3の機能に適合させて、Webサーバ機能ではない別のインターフェースにてクライアント端末3とデータのやり取りを行う場合もある。
【0015】
クライアント端末3には、マウスやキーボードなどの入力装置32と、ディスプレイなどの表示装置31とが接続されており、検索サーバ5とのデータのやり取りを行うと共にクライアント端末3のユーザに対するユーザーインタフェースを提供するクライアント検索インターフェース部33と、検索結果の表、グラフ又はフロー図などの表示を行う際に表示のための処理を行い且つ当該表、グラフ又はフロー図などについてのユーザインターフェースを提供する1又は複数の表示処理部34とが設けられている。検索サーバ5とのデータのやり取りをWebベースで行う場合には、クライアント検索インターフェース部33は、Webブラウザとなる。但し、特別のクライアント・プログラムを用いるようにしても良い。
【0016】
次に図2乃至図26を用いて図1に示したシステムの処理内容について説明する。なお、以下の説明においては、特許文献の検索を例に用いる。最初に、ユーザはクライアント端末3の入力装置32を操作して、クライアント検索インターフェース部33に指示を与え、検索条件指定ページにアクセスさせる(ステップS1)。検索サーバ5は、クライアント端末3からのアクセスに応じて、検索条件指定ページのデータをクライアント端末3に送信する(ステップS3)。クライアント端末3のクライアント検索インターフェース部33は、検索サーバ5から検索条件指定ページのデータを受信し、表示装置31に表示する(ステップS5)。例えば、少なくともキーワード入力欄、検索するデータベースを指定する指定欄等を含む画面が表示される。場合によっては、キーワードの代わりに文章を入力して、当該文章を検索条件とする場合もある。この場合は文章から形態素解析などにより検索語句を抽出する。ユーザは、検索キーワード等を入力し、また検索対象データベースの指定を行う。
【0017】
クライアント端末3のクライアント検索インターフェース部33は、ユーザから検索キーワード等の検索条件入力を受け付け(ステップS7)、当該検索条件入力データを検索サーバ5に送信する(ステップS9)。検索サーバ5の検索処理部51は、クライアント端末3から検索条件入力データを受信し、一旦記憶装置に格納する(ステップS11)。そして、検索キーワード等の検索条件に従って文献DB53に対して検索を行い、該当する文献のデータ等を抽出する(ステップS13)。
【0018】
文献DB53には例えば図3に示すようなデータが格納されている。図3のテーブル例では、文献のレコード番号の列201と、出願番号の列202と、出願日の列203と、公開番号の列204と、公開日の列205と、登録番号の列206と、...出願人の列207と、名称の列208と、要約の列209等が設けられている。この他本文のデータについても保持されている。このようなデータを参照して検索を行う。
【0019】
そして、データ操作部52は、抽出データに対して所定の処理を実施する(ステップS14)。所定の処理は、例えば検索キーワード等に対して、抽出された各文献の関連度を計算し、当該抽出された文献を関連度に従って並べ替える処理である。また、抽出された文献と使用されている語句との関連度を計算し、当該関連度に従って関連の深い語句を順番に並べる処理である。なお、関連度を計算して並べ替える処理については従来と同じであって、文書内の単語を「TF・IDF」や「カルバックの情報量」を用いて重み付けし、次に単語の重みを用いて文書をベクトルとして表現し、文書の関連度をベクトルの内積で計算する方法などが良く知られている。また、例えば特開2000−315207号公報や特開2002−245061号公報にも開示されている。これらの処理結果は検索サーバ5のワークメモリ領域に保持される。
【0020】
なお、各文献において使用されている語句については、予め関連度が高い語句を関連単語として特定し、関連語データ格納部55に登録しておき、上で述べたような処理に用いるようにしても良い。例えば関連語データ格納部55には、図4に示すようなデータが登録されている。図4の例では、公開番号に対応して関連単語が列挙されるようになっている。
【0021】
そして検索サーバ5は、ステップS14の処理結果を含む検索結果表示ページのデータを生成し、クライアント端末3に送信する(ステップS15)。クライアント端末3のクライアント検索インターフェース部33は、検索サーバ5から検索結果表示ページのデータを受信し、表示装置に表示する(ステップS17)。
【0022】
例えば図5に示すような画面が表示装置31に表示される。図5の例では、キーワード入力欄301と、クリアボタン302と、検索再実行ボタン318と、入力キーワードに関連が深い単語をランキング表示するための関連単語表示欄303と、検索対象の文献を格納したデータベースを指定するための連想辞書指定欄304と、連想辞書指定欄304において指定されたデータベースの全体又はサブセットを指定するためのテキスト集合指定欄305と、(入力キーワードにヒットした文献群中の関連単語数/文献群全体の関連単語数)を表示する単語表示欄316と、(入力キーワードにヒットした文献の数/全文献数数)を表示するテキスト表示欄317と、表作成、グラフ作成、フロー作成などの表示形態の選択を行うためのコマンド指定欄307と、コマンド指定欄307において指定された表示形態を実行させるためのコマンドボタン306と、グラフの縦軸設定や関連単語種別の指定を行うための縦軸設定欄308と、グラフの横軸設定などを行うための横軸設定欄309と、縦軸設定欄をデフォルトに戻すためのボタン310と、横軸設定欄をデフォルトに戻すためのボタン311と、複合語の検索を行うための単語パターン入力欄312と、絞込検索を行う場合に選択するボタン群(オン/オフ/反転)313と、その絞込みの条件(AND/OR)のラジオボタン314と、検索の結果ヒットした文献の表示欄315とが設けられている。
【0023】
図5に示すようにステップS7において入力された検索キーワードは「ソフトウエア」及び「情報処理」であり、使用したデータベースは「特許公報抜粋」であって、検索はその全体に対して行われている。この際、入力キーワードにヒットした文献群中の関連単語数は1353であり、文献群全体の関連単語数は29220である。また、入力キーワードにヒットした文献数は60であり、全体の文献数は2752である。関連単語表示欄303には「ソフトウエア」及び「情報処理」を包含する文献群に関連する単語を関連度のランキングとして表示しており、文献の表示欄315には「ソフトウエア」及び「情報処理」を包含する文献群を関連度のランキングとして表示している。
【0024】
ユーザは、この画面において、コマンド指定欄307において検索結果の表示形態を指定し、コマンドボタン306をクリックする。例えば図5に示されているように「表作成」が選択されたとする。クライアント端末3のクライアント検索インターフェース部33は、ユーザによる表示形態についてのコマンド入力を受け付け、検索サーバ5に送信する(ステップS19)。検索サーバ5のデータ操作部52は、クライアント端末3から表示形態についてのコマンドを受信し(ステップS21)、ステップS13において抽出されたデータを用いて指示された表示形態を実現するための表示用データを生成し、ワークメモリ領域に格納する(ステップS23)。
【0025】
データ操作部52は、抽出されたデータ(ここでは60件の文献の要約、請求項、その他の本文及び書誌情報)を用いて、抽出された文献をクラスタリングする(図6:ステップS31)。このクラスタリングについては、抽出された文献の関連単語の各々について関連度を計算し、計算された関連度の高い単語毎にグループ分けを行う。さらに、各グループに分類された単語と各文献の関連度を計算し、各文献を関連度の高いグループ(クラスタ)に紐付ける。なお、このクラスタリング計算については、文書内の単語を「TF・IDF」や「カルバックの情報量」を用いて重み付けし、次に単語の重みを用いて文書をベクトルとして表現し、文書の関連度をベクトルの内積で計算した上、全文書間の関連度を計算して得られる関連度マトリックスに対してクラスタリングアルゴリズムを適用する方法などが一般的に知られている。例えば、上記列挙した特許文献を参照のこと。
【0026】
図5の例では、以下のようなクラスタリングが行われる。
クラスタリング1:形成 画像 制限 識別情報 品 配信 識別
クラスタリング2:名 版番号 版 参照関係情報 参照関係 変更 版管理
クラスタリング3:着脱可能 情報管理方法 情報管理 ID ユーザ ソウトウエア情報 ユーザID
クラスタリング4:命令 比較 アドレスレジスタ 実行 アドレス 領域 デバッグ
クラスタリング5:電子メール 電子 メール 送信 生成 受信 端末
クラスタリング6:バージョン バージョンアップ アップ 機器 バージョン情報 シリアル 日時
各クラスタに含まれる文献は、各クラスタに含まれる関連単語との関連が深い文献となる。
【0027】
なお、ある語句の特定の文献との関連度は、以下のように計算される。すなわち、(特定の文献における、ある語句の出現回数/データベース(上の例では特許公報群)においてある語句が出現する文献数)で計算される。これは、特定の文献に頻繁に現れる語句はその特定の文献の特徴的な語句であり、一方で多くの文献で出現する語句は特定の文献における特徴的な語句とは言えないという観点から定義されている。但し、他の方法にて関連度を計算するようにしても良い。
【0028】
次に、データ操作部52は、指定された表示形態についてのコマンドに基づき、各文献の表示データを特定する(ステップS33)。ここでは、公開番号と名称と出願人名とが表示データとして予め設定されており、これらのデータを各文献について特定する。そして、クラスタ毎に各文献の上記表示データを配置する(ステップS35)。なお、本実施の形態では、縦軸にはクラスタを、横軸には出願人をとるものとする。すなわち、クラスタと出願人との組にて各文献を分類するものである。但し、横軸については別のデータを用いても良い。最後に、クライアント端末3において、特定の表示処理部34により処理可能なデータ・フォーマットで表示用データを生成し、ワークメモリ領域に格納する(ステップS37)。特定の表示処理部34は、「表作成」というコマンドに対応して選択される。
【0029】
データ操作部52は以上のような処理を実施し、生成された表示用データをクライアント端末3に送信する(図2:ステップS25)。クライアント端末3のクライアント検索インターフェース部33は、検索サーバ5から表示用データを受信する(ステップS27)。そして、クライアント検索インターフェース部33は、受信した表示用データに対応する表示処理部34が起動されているか確認し、起動されていなければ、受信した表示データに対応する表示処理部34を起動する。表示処理部34は、受信した表示用データを用いて、ユーザにより指示された表示形態で、検索結果を表示装置31に表示する(ステップS29)。なお、処理は端子A及びBを介して図11に移行する。
【0030】
図7に画面例を示す。図7の例では、表示形態選択欄401と、テーブル410とが含まれる。表示形態選択欄401は、次の表示形態を選択するためのコンボボックスである。例えば、図8に示すように、特許マップ(図7)、特許フロー(図14)、グラフ(図19)、スケルトンマップ(図24)、アンカーマップ(図26)のいずれかを選択することができる。テーブル410は、各クラスタのデータを表示するための、クラスタの列402と、A社の該当文献(10件)をクラスタ別に表示するための列403と、B社の該当文献(8件)をクラスタ別に表示するための列404と、C社の該当文献(6件)をクラスタ別に表示するための列405と、D社の該当文献(5件)をクラスタ別に表示するための列406とが設けられている。上で述べたように横軸は出願人の軸になっている。一方テーブル410には、クラスタリング3の行407と、クラスタリング4の行408と、クラスタリング5の行409とが含まれる。なお、クラスタリング1及び2の行については、画面領域の関係から表示されていないが、スクロールバーなどを操作することにより表示させることができる。このようにユーザは、どの出願人の出願がどのクラスタに多く含まれるのかといったことを分析することができる。また、検索結果においてどの出願人の出願が多いのかということも把握することができる。
【0031】
なお、公開番号、名称及び出願人名のセットからなる表示項目の各々は、次の処理のために選択可能になっている。また、領域で指定することも可能になっており、当該領域に含まれる表示項目が選択される。例えば図9に示すように、クラスタリング4の行408に含まれ且つA社の列403とB社の列404とC社の列405に含まれる10件の表示項目(文献)を、領域415を指定することにより選択することができる。なお、表示項目(文献)を一つ一つ選択するようにしても良い。各表示項目は、例えばボタンのようになっており、クリックできるような表示形態であってもよい。
【0032】
図9の例では、領域415に含まれる表示項目(文献)を選択し、次の表示形態として表示形態選択欄401において「特許フロー」を選択したものとする。そして、ユーザが入力装置32のマウスの右ボタンを押すと、図10に示すメニューが表示されるようになっている。図10の例では、「外部コマンド起動」421、環境設定、コピー、貼り付け、形式を選択して貼り付け、挿入、削除、数式と値のクリア、コメントの挿入、セルの書式設定、リストから選択、ハイパーリンクなどのメニュー項目が含まれている。ここでは外部コマンド起動421を選択する。なお、本実施の形態においては、表示項目を選択しなければ、全表示項目が黙示的に選択されたものとみなす。
【0033】
そうすると、表示処理部34は、ユーザからの表示形態及び表示項目選択入力を受け付け(図11:ステップS41)、クライアント端末3のクライアント検索インターフェース部33に、選択された表示項目及び表示形態のデータを出力する。
【0034】
クライアント検索インターフェース部33は、選択された表示項目及び表示形態のデータを検索サーバ5に送信する(ステップS43)。検索サーバ5のデータ操作部52は、選択された表示項目及び表示形態のデータを受信し、一旦ワークメモリ領域に格納する(ステップS45)。そして、選択された表示項目に対応する文献のデータを例えば文献DB53から抽出する(ステップS47)。前の処理の結果がワークメモリ領域に保持されたままであればそのデータを用いることも可能である。ここでは、表示項目には少なくとも公開番号が含まれるため、公開番号から10件の文献のデータを特定することができる。そして、抽出されたデータを用いて、指定された表示形態(ここでは「特許フロー」)を実現するための表示用データを生成し、ワークメモリ領域に格納する(ステップS49)。
【0035】
データ操作部52は、選択された表示項目に対応する文献のデータを用いて、選択された文献間の関連度を計算する(図12:ステップS61)。文献間の関連度の計算についても周知の技術であるからここでは説明しない。なお、例えば図13に示すようなデータが生成され、例えば関連度データ格納部54に格納される。図13の例では、選択された10件の文献が縦及び横に同じように並べられ、1つの文献につき他の9件の文献との関連度が登録されている。但し、予め設けられている閾値以下の関連度の場合には「−」で表している。
【0036】
そして、各文献のデータから表示データを特定する(ステップS63)。ここでは公開番号、名称及び出願人が表示データとして予め設定されており、これらのデータを各文献について特定する。また、表示データを含む表示項目を文献のデータに含まれる出願日又は公開日に従って時系列に並べ、関連度に従った太さの線分で表示項目間を結んだ状態を表示するための表示用データを、特許フロー表示用の表示処理部34が処理可能なフォーマットで生成する(ステップS65)。
【0037】
そして検索サーバ5は、生成した表示用データをクライアント端末3に送信する(図11:ステップS51)。クライアント端末3のクライアント検索インターフェース部33は、検索サーバ5から表示用データを受信する(ステップS53)。そして、受信した表示用データに対応する表示処理部34が起動されているか確認し、起動されていなければ表示処理部34を起動する。そして、表示処理部34に表示用データを出力する。表示用データに対応する表示処理部34は、ユーザ指定の表示形態で表示用データを表示装置31に表示する(ステップS55)。なお、別途検索をやり直す場合には端子Cを介して図2に移行する。一方、以下で説明するように表示形態及び表示項目を選択して分析を進める場合にはステップS41に戻る(ステップS57)。
【0038】
例えば図14に示すような画面が表示される。図14の例では、10の表示項目501乃至510が公開日又は出願日に従って左から右へ時系列で並べられている。また、所定の閾値以上の関連度を有する表示項目間は線分で結ばれており、関連度が高い文献間の線分はより太く示されている。例えば表示項目502と表示項目503は、10の表示項目の中で最も関連度が高く、最も太い線分にて接続されている。また、表示項目502と表示項目510、表示項目505と表示項目506、表示項目505と表示項目509も比較的関連度が高く、中太線で結ばれている。なお、これらの表示項目は全て選択可能となっており、ボタン表示されている場合もある。また領域指定により1又は複数の表示項目を選択する場合もある。
【0039】
さらに表示項目間を結ぶ線分に、表示項目間の接続関係及び太さのデータだけを保持させるのではなく、実際の関連度を保持させるようにしても良い。この場合、例えば図14の表示部分に加え表示切替ボタンを設けて、当該表示切替ボタンをクリックすることにより例えば図15に示すような表示を行わせる場合もある。図15では、表示されている表示項目間の接続線に、当該接続線の関連度を表示させている。表示項目は、接続線に関連度の数値を表示するために位置をずらして表示される。図15のような表示においても、各表示項目は選択可能となっており、1又は複数の表示項目を選択することができる。
【0040】
例えば図16に示すように、ユーザが表示項目506乃至510を包含するように領域515を指定し、図16の表示部分外に設けられた表示項目指定欄(例えば図7)において再度「特許フロー」を選択したものとする。そしてさらに入力装置32のマウスの右ボタンを押して例えば図10のようなメニューを表示させ、「外部コマンド起動」421を選択するものとする。
【0041】
このようにクライアント端末3の表示処理部34は、ユーザからの表示形態及び表示項目の選択入力を受け付け(図11:ステップS41)、当該選択された表示形態及び表示項目のデータをクライアント検索インターフェース部33に出力する。クライアント検索インターフェース部33は、選択された表示形態及び表示項目のデータを受け取り、検索サーバ5に送信する(ステップS43)。
【0042】
検索サーバ5のデータ操作部52は、選択された表示項目及び表示形態のデータを受信し、一旦ワークメモリ領域に格納する(ステップS45)。そして、選択された表示項目に対応する文献のデータを例えば文献DB53から抽出する(ステップS47)。前の処理の結果がワークメモリ領域に保持されたままであればそのデータを用いることも可能である。ここでは、表示項目には少なくとも公開番号が含まれるため、公開番号から5件の文献のデータを特定することができる。そして、抽出されたデータを用いて、指定された表示形態(ここでは「特許フロー」)を実現するための表示用データを生成し、ワークメモリ領域に格納する(ステップS49)。すなわち図12に示したような処理を、5件の文献のデータに対して実行することになる。
【0043】
そして検索サーバ5は、生成した表示用データをクライアント端末3に送信する(ステップS51)。クライアント端末3のクライアント検索インターフェース部33は、検索サーバ5から表示用データを受信する(ステップS53)。そして、受信した表示用データに対応する表示処理部34が起動されているか確認し、起動されていなければ表示処理部34を起動する。そして、表示処理部34に表示用データを出力する。表示用データに対応する表示処理部34は、ユーザ指定の表示形態で表示用データを表示装置31に表示する(ステップS55)。
【0044】
例えば図17に示すような画面が表示される。図17では、5つの表示項目が公開日又は出願日に従って時系列に並べられている。各表示項目が選択可能であり、表示項目間は対応する文献間の関連度に従った太さを有する線分で接続されている。但し、図16における領域515における接続関係と、図17における接続関係は明らかに異なっている。これは、5の文献の関連度と10の文献の関連度では、その値が異なってくるためである。このように本実施の形態では、単に領域515の拡大表示を行うのではなく、再度選択された文献間において関連度の計算を行うため、選択された文献のみにおける関係を示すことができるようになる。図17において、さらに表示項目及び表示形態を指定して、分析を進めることも可能である。また、表示項目を指定しない場合には、全表示項目が選択されたものとしてみなされ処理が行われる。
【0045】
また、例えば図15の状態で、表示項目を選択せずに、図15の表示部分外に設けられた表示形態指定欄(例えば図7)において「グラフ」を選択したものとする。そしてさらに入力装置32のマウスの右ボタンを押して例えば図10のようなメニューを表示させ、「外部コマンド起動」421を選択するものとする。上でも述べたように、表示項目を選択しない場合には、全表示項目が選択されたものとみなす。
【0046】
このようにクライアント端末3の表示処理部34は、ユーザからの表示形態及び表示項目の選択入力(表示項目の選択については間接的な選択)を受け付け(図11:ステップS41)、当該選択された表示形態及び表示項目のデータをクライアント検索インターフェース部33に出力する。クライアント検索インターフェース部33は、選択された表示形態及び表示項目のデータを受け取り、検索サーバ5に送信する(ステップS43)。
【0047】
検索サーバ5のデータ操作部52は、選択された表示項目及び表示形態のデータを受信し、一旦ワークメモリ領域に格納する(ステップS45)。そして、選択された表示項目に対応する文献のデータを例えば文献DB53から抽出する(ステップS47)。前の処理の結果がワークメモリ領域に保持されたままであればそのデータを用いることも可能である。ここでは、表示項目には少なくとも公開番号が含まれるため、公開番号から10件の文献のデータを特定することができる。そして、抽出されたデータを用いて、指定された表示形態(ここでは「グラフ」)を実現するための表示用データを生成し、ワークメモリ領域に格納する(ステップS49)。
【0048】
データ操作部52は、選択された表示項目に対応する文献(以下「選択された文献」と記す)の関連単語のデータを関連語データ格納部55から読み出す(図18:ステップS71)。そして、選択された文献群に対する関連度の高い関連単語を所定個数選択する(ステップS73)。文献と語句との関連度については周知の技術であるから、ここでは説明を省略する。そして、選択された文献を関連単語にて分類し且つ特定の事項(ここでは出願年)に基づいて文献数を集計し、例えばワークメモリ領域に格納する(ステップS75)。ここでは、各出願年につき関連単語毎に当該関連単語を含む文献数をカウントする。そして、当該集計結果をグラフ表示するための表示用データをグラフ表示用の表示処理部34が処理可能なフォーマットで生成し、例えばワークメモリ領域に格納する(ステップS77)。
【0049】
そして検索サーバ5は、生成した表示用データをクライアント端末3に送信する(図11:ステップS51)。クライアント端末3のクライアント検索インターフェース部33は、検索サーバ5から表示用データを受信する(ステップS53)。そして、受信した表示用データに対応する表示処理部34が起動されているか確認し、起動されていなければ表示処理部34を起動する。そして、表示処理部34に表示用データを出力する。表示用データに対応する表示処理部34は、ユーザ指定の表示形態で表示用データを表示装置31に表示する(ステップS55)。
【0050】
例えば図19に示すような画面が表示される。図19の例では、表示形態指定欄601と、出願年又は出願人の選択を行うための選択欄602とが設けられており、縦軸は件数(文献数)、横軸は出願年であるグラフが表示されている。本例では、15の関連単語が表示項目として表示されており、1又は複数の関連単語を選択可能となっている。すなわち、「周辺機器」「自動」といった語句を出願年に関わらず選択する。
【0051】
また、選択欄602における選択を「出願年」から「出願人」に変更すると、図20に示すようなグラフに表示を変更することができる。図20の例では、表示項目である関連単語について変更はない。但し、横軸が出願年から出願人に変更されるため、各出願人について各関連単語を含む文献の数を集計して表示するようになる。図20においても表示項目である1又は複数の関連単語を選択することができる。
【0052】
例えば出願年を横軸にした場合のグラフにおいて、図21に示すように表示形態指定欄601において「スケルトンマップ」を選択し、さらに表示項目である関連単語の「周辺機器」615を選択するものとする。図21では太線等により選択されたことが表示される。さらに、入力装置32であるマウスの右ボタンを押すと、図22のようなメニューが表示される。図22におけるメニューでは、「系列選択」620、「環境設定」「元のデータ」「クリア」といった選択肢が設けられている。ここでは系列選択620を選択するものとする。
【0053】
このようにクライアント端末3の表示処理部34は、ユーザからの表示形態及び表示項目の選択入力を受け付け(図11:ステップS41)、当該選択された表示形態及び表示項目のデータをクライアント検索インターフェース部33に出力する。クライアント検索インターフェース部33は、選択された表示形態及び表示項目のデータを受け取り、検索サーバ5に送信する(ステップS43)。
【0054】
検索サーバ5のデータ操作部52は、選択された表示項目及び表示形態のデータを受信し、一旦ワークメモリ領域に格納する(ステップS45)。そして、選択された表示項目に対応する文献のデータを例えば文献DB53から抽出する(ステップS47)。前の処理の結果がワークメモリ領域に保持されたままであればそのデータを用いることも可能である。ここで表示項目は「周辺機器」であるから、関連語データ格納部55に格納されているデータに基づき「周辺機器」が関連単語として登録されている文献を例えば公開番号にて特定する。そして、当該公開番号から文献のデータを抽出する。そして、抽出されたデータを用いて、指定された表示形態(ここでは「スケルトンマップ」)を実現するための表示用データを生成し、ワークメモリ領域に格納する(ステップS49)。
【0055】
データ操作部52は、抽出された文献のデータである各関連単語(「周辺機器」以外の単語)について単語間の関連度を計算し、例えばワークメモリ領域に格納する(図23:ステップS81)。なお、所定の基準以下の関連度の場合には、関連度を0とみなす。このデータについても関連度データ格納部54に格納するようにしても良い。そして、各単語を表示項目とし、単語間をその関連度に従った太さの線分とする表示形態のための表示用データをスケルトンマップ表示を行う表示処理部34が処理可能なフォーマットで生成し、例えばワークメモリ領域に格納する(ステップS83)。
【0056】
そして検索サーバ5は、生成した表示用データをクライアント端末3に送信する(図11:ステップS51)。クライアント端末3のクライアント検索インターフェース部33は、検索サーバ5から表示用データを受信する(ステップS53)。そして、受信した表示用データに対応する表示処理部34が起動されているか確認し、起動されていなければ表示処理部34を起動する。そして、表示処理部34に表示用データを出力する。表示用データに対応する表示処理部34は、ユーザ指定の表示形態で表示用データを表示装置31に表示する(ステップS55)。
【0057】
例えば図24に示すような画面が表示される。図24では、各関連単語が表示項目となっており、1又は複数の表示項目を選択することが可能となっている。また、本実施の形態では、全く選択しない場合には全体が選択されていると判断されるようになっている。さらに、領域を指定することにより、当該領域に含まれる表示項目(関連単語)を指定することも可能である。図24の例では、太い線分によって接続されている関連単語は関連が深いものであり、中太の線分、細い線分と移行するにつれ関連度は下がる。なお、接続されていない単語間については関連度が所定の基準以下であることを示している。
【0058】
図24には示していないが、このスケルトンマップから次の表示形態に移行するために表示形態指定欄が設けられており、表示形態指定欄において次の表示形態を選択し、さらに表示項目を選択した後に、入力装置32であるマウスの右ボタンを押すと例えば図10のようなメニュー画面が表示される。ここで「外部コマンド起動」421を選択すると、表示形態及び表示項目の選択入力がなされる。ここでは、例えば全表示項目が選択され、表示形態として「アンカーマップ」が選択されたものとする。
【0059】
このようにクライアント端末3の表示処理部34は、ユーザからの表示形態及び表示項目の選択入力(表示項目の選択については間接的な選択)を受け付け(図11:ステップS41)、当該選択された表示形態及び表示項目のデータをクライアント検索インターフェース部33に出力する。クライアント検索インターフェース部33は、選択された表示形態及び表示項目のデータを受け取り、検索サーバ5に送信する(ステップS43)。
【0060】
検索サーバ5のデータ操作部52は、選択された表示項目及び表示形態のデータを受信し、一旦ワークメモリ領域に格納する(ステップS45)。そして、選択された表示項目に対応する文献のデータを例えば文献DB53から抽出する(ステップS47)。前の処理の結果がワークメモリ領域に保持されたままであればそのデータを用いることも可能である。ここで選択された表示項目は全関連単語(「周辺機器」を除く)であるから、関連語データ格納部55に格納されているデータに基づき図24に表示されている全関連単語のいずれかが関連単語として登録されている文献を例えば公開番号にて特定する。そして、公開番号から文献のデータを抽出する。なお、図24において全関連単語が選択された場合には、処理対象の文献には変更がないものとして、前回の処理で抽出された文献のデータに基づいて処理するようにしても良い。そして、抽出されたデータを用いて、指定された表示形態(ここでは「アンカーマップ」)を実現するための表示用データを生成し、ワークメモリ領域に格納する(ステップS49)。
【0061】
データ操作部52は、抽出された文献を特定の事項(ここでは出願人名)に基づきグループ分けする(図25:ステップS91)。すなわち、出願人毎に文献を分ける。次に、各グループに含まれる文献群と各関連単語との関連度を計算し、例えばワークメモリ領域に格納する(ステップS93)。また、関連度データ格納部54に格納するようにしても良い。そして、各グループをその特定の事項(出願人名)のデータ(「A社」「B社」「C社」)で表し、グループに含まれる文献群と各関連単語との関連度をそのグループの特定の事項のデータと関連単語との間の線分の太さにより表すための表示用データを対応する表示処理部34が処理可能なフォーマットで生成し、例えばワークメモリ領域に格納する(ステップS95)。
【0062】
そして検索サーバ5は、生成した表示用データをクライアント端末3に送信する(図11:ステップS51)。クライアント端末3のクライアント検索インターフェース部33は、検索サーバ5から表示用データを受信する(ステップS53)。そして、受信した表示用データに対応する表示処理部34が起動されているか確認し、起動されていなければ表示処理部34を起動する。そして、表示処理部34に表示用データを出力する。表示用データに対応する表示処理部34は、ユーザ指定の表示形態で表示用データを表示装置31に表示する(ステップS55)。
【0063】
例えば図26に示すような画面が表示される。図26では、選択可能な表示項目は、出願人名である「A社」701と、「B社」702と、「C社」703と、全関連単語である。但し、関連度が所定値以下の関連単語については出願人名とは接続されないため、表示が省略される。これらの表示項目は、ボタン化するなど、選択可能となっている。また、別途選択を示すためのボタンなどを用意しても良い。また、領域を指定して、当該領域に入っている表示項目を選択とみなす方式も可能である。図26では、「A社」701、「B社」702及び「C社」703の出願人名の位置が固定されており、これらの出願人名から放射状に関連単語との関連度を表す太さの線分が伸びており、関連単語と接続されている。関連単語によっては複数の文献群(複数の出願人の文献)と関連するものもあるため、複数の線分で複数の出願人名と接続されている関連単語もある。
【0064】
図26には示されていないが、表示形態指定欄が設けられており、図26から次の表示形態を指示することが可能となっている。すなわち、複数の表示項目と表示形態とを指定して、次の表示形態で表示させることが可能となっている。
【0065】
以上述べたように、グラフ、表、各種フローなど、ある表示形態から別の表示形態への移行を直接行うことで、分析者は思考を寸断することなく調査・分析することが可能となる。また、上記のように実現された表示形態は、それぞれ関連度による分類、文献の内容の特定事項に基づいた遷移、時系列に沿った関連度が示されるものであり、意味付けが異なるものであるから、分析者が様々な観点で調査・分析を進める支援となる。
【0066】
さらに、別の表示形態に移行する際、分析する範囲も指定できるため、連想的な調査・分析が可能となる。また、分析したい範囲を指定した場合、その範囲内の文献に閉じて新たに関連度の計算等を行い、結果を表示するため、より高い精度で分類表示され、分析者の思考を支援することができる。
【0067】
以上本発明の実施の形態を説明したが、本発明は上記実施の形態に限定されるものではない。例えば、表示形態の遷移の一例を図にて説明したが、このようなルートを取らなければならないわけではなく、どの段階でも任意の表示形態を選択することができる。但し、何らかの制限により遷移可能な表示形態が絞られる場合もあるが、原理的には任意の表示形態に移行することができる。
【0068】
また、図1で示した機能ブロックは一例であって、必ずしもプログラムモジュールに対応するものではない。また、クライアント・サーバ環境における実施を示したが、検索サーバ5とクライアント端末3の機能を併せ持った端末装置により上記のような処理を実施する場合もある。単に検索機能のみがサーバにおかれる場合もある。
【0069】
また画面表示例は一例であって、必ずしも上記のような画面構成でなければならないわけではない。
【0070】
さらに、関連度の計算方法は任意であり、さらに表示形態についても上で述べた態様に限定されるわけではない。他の処理アルゴリズムにより文献のデータを処理してユーザに提示するようにしても良い。
【0071】
(付記1)
ユーザにより指定された検索条件に従って所定の文献群を検索し、当該検索により抽出された複数の文献のデータを記憶装置に格納するステップと、
前記検索により抽出された複数の文献のデータを、各表示項目を次の処理キーとして選択可能とし且つ第1の表示形態にて前記ユーザに提示するためのデータに処理し、当該処理結果を出力する第1処理ステップと、
前記ユーザにより直接又は間接的に選択された表示項目に対応する、文献のデータを抽出し、記憶装置に格納するステップと、
前記選択された表示項目に対応する、文献のデータを、各表示項目を次の処理キーとして選択可能とし且つ前記ユーザにより指定された第2の表示形態にて前記ユーザに提示するためのデータに処理し、当該処理結果を出力する第2処理ステップと、
を含む、コンピュータによる検索処理方法。
【0072】
(付記2)
前記第1及び第2の表示形態が、少なくとも
処理すべき複数の文献を使用語句によりクラスタリングして予め規定されている表示事項でもって提示する形態と、
処理すべき複数の文献を予め規定されている表示事項と各文献の使用語句により算出される関連度を表す接続線とでもって表示する形態と、
処理すべき複数の文献を使用語句について分類且つ集計した結果をグラフによって表示する形態と、
処理すべき複数の文献の使用語句と当該使用語句間の関連度を表す接続線とを表示する形態と、
処理すべき複数の文献のうち特定の事項で関連付けられた文献群を前記特定の事項により、前記特定の事項で関連付けられた文献群と前記処理すべき文献のデータである使用語句との関連度を前記特定の事項と前記使用語句との間の接続線でもって表示する形態と、
のうちいずれかであることを特徴とする付記1記載の検索処理方法。
【0073】
(付記3)
前記第1処理ステップが、
前記検索により抽出された複数の文献のデータを用いて各文献をクラスタリングするステップと、
前記検索により抽出された複数の文献のデータから、前記第1の表示形態について予め規定されている表示事項に係るデータを抽出するステップと、
抽出された表示事項に係るデータを前記次の処理キーとして各クラスタについて表示するためのデータを生成するステップと、
を含む付記1記載の検索処理方法。
【0074】
(付記4)
前記第1処理ステップが、
前記検索により抽出された複数の文献のデータを用いて各文献の関連度を算出するステップと、
前記検索により抽出された複数の文献のデータから、前記第1の表示形態について予め規定されている表示事項に係るデータを抽出するステップと、
前記次の処理キーとなり且つ各文献につき抽出された表示事項に係るデータと、当該データ間を前記各文献の関連度を反映させて接続する線分とを表示するためのデータを生成するステップと、
を含む付記1記載の検索処理方法。
【0075】
(付記5)
前記第1処理ステップが、
前記検索により抽出された複数の文献のデータである使用語句に基づき前記検索により抽出された複数の文献を分類し、前記検索により抽出された複数の文献のデータのうち前記第1の表示形態について予め規定されている特定の事項に基づいて文献数を集計するステップと、
当該集計結果を表示するためのデータを生成するステップと、
を含む付記1記載の検索処理方法。
【0076】
(付記6)
前記第1処理ステップが、
前記検索により抽出された複数の文献のデータである使用語句の関連度を算出するステップと、
前記次の処理キーとなる前記使用語句と、当該使用語句間を前記関連度を反映させて接続する線分とを表示するためのデータを生成するステップと、
を含む付記1記載の検索処理方法。
【0077】
(付記7)
前記第1処理ステップが、
前記検索により抽出された複数の文献を前記第1の表示形態について予め規定されている特定の事項で関連付けるステップと、
関連付けられた文献群と前記検索により抽出された複数の文献のデータである使用語句との関連度を算出するステップと、
前記関連付けられた文献群を前記特定の事項のデータにより表し且つ前記関連付けられた文献群と前記使用語句との関連度を前記特定の事項と前記使用語句との接続線でもって表示するためのデータを生成するステップと、
を含む付記1記載の検索処理方法。
【0078】
(付記8)
前記第2処理ステップが、
前記選択された表示項目から特定された文献のデータを用いて各文献をクラスタリングするステップと、
前記特定された複数の文献のデータから、前記第2の表示形態について予め規定されている表示事項に係るデータを抽出するステップと、
抽出された表示事項に係るデータを前記次の処理キーとして各クラスタについて表示するためのデータを生成するステップと、
を含む付記1記載の検索処理方法。
【0079】
(付記9)
前記第2処理ステップが、
前記選択された表示項目から特定された文献のデータを用いて各文献の関連度を算出するステップと、
前記特定された文献のデータから、前記第2の表示形態について予め規定されている表示事項に係るデータを抽出するステップと、
前記次の処理キーであり且つ各文献につき抽出された表示事項に係るデータと、当該データ間を前記各文献の関連度を反映させて接続する線分とを表示するためのデータを生成するステップと、
を含む付記1記載の検索処理方法。
【0080】
(付記10)
前記第2処理ステップが、
前記選択された表示項目から特定された文献のデータである使用語句に基づき前記特定された文献を分類し、前記特定された文献のデータのうち前記第2の表示形態について予め規定されている特定の事項に基づいて文献数を集計するステップと、
当該集計結果を表示するためのデータを生成するステップと、
を含む付記1記載の検索処理方法。
【0081】
(付記11)
前記第2処理ステップが、
前記選択された表示項目から特定された、文献の使用語句の関連度を算出するステップと、
前記次の処理キーである前記使用語句と、当該使用語句間を前記関連度を反映させて接続する線分とを表示するためのデータを生成するステップと、
を含む付記1記載の検索処理方法。
【0082】
(付記12)
前記第2処理ステップが、
前記選択された表示項目から特定された文献を前記第2の表示形態について予め規定されている特定の事項で関連付けるステップと、
関連付けられた文献群と前記特定された文献のデータである使用語句との関連度を算出するステップと、
前記関連付けられた文献群を前記特定の事項により表し且つ前記関連付けられた文献群と前記使用語句との関連度を前記特定の事項と前記使用語句との接続線でもって表示するためのデータを生成するステップと、
を含む付記1記載の検索処理方法。
【0083】
(付記13)
前記文献が特許文献であり、
前記表示項目が、特許文献の書誌情報又は特許文献の使用語句である
ことを特徴とする付記1記載の検索処理方法。
【0084】
(付記14)
前記第1及び第2処理ステップにおいて、
表示形態に対応する表示用プログラムを指定し、当該表示用プログラム用のデータを生成する
ことを特徴とする付記1記載の検索処理方法。
【0085】
(付記15)
前記第1の表示形態と前記第2の表示形態とが、予め定められた表示形態のうち任意の組み合わせとなることを特徴とする付記1記載の検索処理方法。
【0086】
(付記16)
ユーザにより指定された検索条件に従って所定の文献群を検索し、当該検索により抽出された複数の文献のデータを記憶装置に格納するステップと、
前記検索により抽出された複数の文献のデータを、各表示項目を次の処理キーとして選択可能とし且つ第1の表示形態にて前記ユーザに提示するためのデータに処理し、当該処理結果を出力する第1処理ステップと、
前記ユーザにより直接又は間接的に選択された表示項目に対応する、文献のデータを抽出し、記憶装置に格納するステップと、
前記選択された表示項目に対応する、文献のデータを、各表示項目を次の処理キーとして選択可能とし且つ前記ユーザにより指定された第2の表示形態にて前記ユーザに提示するためのデータに処理し、当該処理結果を出力する第2処理ステップと、
をコンピュータにより実行させるプログラム。
【0087】
(付記17)
ユーザにより指定された検索条件に従って所定の文献群を検索し、当該検索により抽出された複数の文献のデータを記憶装置に格納する手段と、
前記検索により抽出された複数の文献のデータを、各表示項目を次の処理キーとして選択可能とし且つ第1の表示形態にて前記ユーザに提示するためのデータに処理し、当該処理結果を出力する手段と、
前記ユーザにより直接又は間接的に選択された表示項目に対応する、文献のデータを抽出し、記憶装置に格納する手段と、
前記選択された表示項目に対応する、文献のデータを、各表示項目を次の処理キーとして選択可能とし且つ前記ユーザにより指定された第2の表示形態にて前記ユーザに提示するためのデータに処理し、当該処理結果を出力する手段と、
を有する検索処理装置。
【図面の簡単な説明】
【0088】
【図1】本発明の一実施の形態における機能ブロックを示す図である。
【図2】本発明の実施の形態におけるメインの処理フローを示す図である。
【図3】文献DBに格納されるデータの一例を示す図である。
【図4】関連語データ格納部に格納されるデータの一例を示す図である。
【図5】最初の検索結果を提示する画面例を示す図である。
【図6】第1の表示形態を実現するための処理フローを示す図である。
【図7】第1の表示形態を示す図である。
【図8】第1の表示形態における表示形態指定欄の一例を示す図である。
【図9】第1の表示形態を示す図である。
【図10】第1の表示形態におけるメニューを示す図である。
【図11】本発明の実施の形態におけるメインの処理フローを示す図である。
【図12】第2の表示形態を実現するための処理フローを示す図である。
【図13】関連度データ格納部に格納されるデータの一例を示す図である。
【図14】第2の表示形態を示す図である。
【図15】第3の表示形態を示す図である。
【図16】第2の表示形態を示す図である。
【図17】第4の表示形態を示す図である。
【図18】第5の表示形態を実現するための処理フローを示す図である。
【図19】第5の表示形態を示す図である。
【図20】第6の表示形態を示す図である。
【図21】第5の表示形態を示す図である。
【図22】第5の表示形態におけるメニューを示す図である。
【図23】第7の表示形態を実現するための処理フローを示す図である。
【図24】第7の表示形態を示す図である。
【図25】第8の表示形態を実現するための処理フローを示す図である。
【図26】第8の表示形態を示す図である。
【符号の説明】
【0089】
1 ネットワーク 3 クライアント端末
5 検索サーバ
31 表示装置 32 入力装置
33 クライアント検索インターフェース部
34 表示処理部
51 検索処理部 52 データ操作部
53 文献DB 54 関連度データ格納部
55 関連語データ格納部
【特許請求の範囲】
【請求項1】
処理部と、記憶装置と、関連度データテーブル格納部と、所定の文献群を格納している文献データベースとを有するコンピュータにより実行される検索処理方法であって、
前記処理部により、ユーザにより指定された検索条件に従って前記文献データベースを検索し、当該検索により抽出された第1の複数の文献のデータを前記記憶装置に格納する第1文献抽出ステップと、
前記処理部により、前記第1文献抽出ステップにより抽出され且つ前記記憶装置に格納された前記第1の複数の文献のデータを読み出し、前記第1の複数の文献に関する情報及び表示形態をユーザに選択させるための情報を含む検索結果画面のデータを生成し、出力するステップと、
前記処理部により、前記第1文献抽出ステップにより抽出され且つ前記記憶装置に格納された前記第1の複数の文献のデータを読み出し、当該第1の複数の文献間の関連度及び当該第1の複数の文献のうちの一つと当該文献に使用されている語句との関連度の少なくともいずれかを算出し、前記関連度データテーブル格納部に格納する第1関連度算出ステップと、
前記処理部により、前記第1関連度算出ステップにより算出され且つ前記関連度データテーブル格納部に格納されたデータに基づき、前記第1文献抽出ステップにより抽出され且つ前記記憶装置に格納された前記第1の複数の文献のデータを、各表示項目を次の処理キーとして選択可能とし且つ前記検索結果画面において前記ユーザにより指定された第1の表示形態にて前記ユーザに提示する第1処理結果画面のデータを生成し、出力する第1処理ステップと、
前記処理部により、前記第1処理結果画面において前記ユーザにより選択された表示項目に対応する、第2の複数の文献のデータを前記文献データベースから抽出し、前記記憶装置に格納する第2文献抽出ステップと、
前記処理部により、前記第2文献抽出ステップにより抽出され且つ前記記憶装置に格納された前記第2の複数の文献のデータを読み出し、当該第2の複数の文献間の関連度及び当該第2の複数の文献のうちの一つと当該文献に使用されている語句との関連度の少なくともいずれかを算出し、前記関連度データテーブル格納部に格納する第2関連度算出ステップと、
前記処理部により、前記第2関連度算出ステップにより算出され且つ前記関連度データテーブル格納部に格納されたデータに基づき、前記第2文献抽出ステップにより抽出され且つ前記記憶装置に格納された前記第2の複数の文献のデータを、前記検索結果画面のデータを生成及び出力することなく、各表示項目を次の処理キーとして選択可能とし且つ前記第1処理結果画面において前記ユーザにより指定された第2の表示形態にて前記ユーザに提示する第2処理結果画面のデータを生成し、出力する第2処理ステップと、
を含む検索処理方法。
【請求項2】
前記第1及び第2の表示形態が、少なくとも
処理すべき複数の文献を使用語句によりクラスタリングして予め規定されている表示事項でもって提示する形態と、
処理すべき複数の文献を予め規定されている表示事項と各文献の使用語句により算出される関連度を表す接続線とでもって表示する形態と、
処理すべき複数の文献を使用語句について分類且つ集計した結果をグラフによって表示する形態と、
処理すべき複数の文献の使用語句と当該使用語句間の関連度を表す接続線とを表示する形態と、
処理すべき複数の文献のうち特定の事項で関連付けられた文献群を前記特定の事項により、前記特定の事項で関連付けられた文献群と前記処理すべき文献のデータである使用語句との関連度を前記特定の事項と前記使用語句との間の接続線でもって表示する形態と、
のうちいずれかであることを特徴とする請求項1記載の検索処理方法。
【請求項3】
前記第1及び第2処理ステップにおいて、
表示形態に対応する表示用プログラムを指定し、当該表示用プログラム用のデータを生成する
ことを特徴とする請求項1記載の検索処理方法。
【請求項4】
前記第1処理ステップが、
前記処理部により、前記関連度データテーブル格納部から読み出したデータを用いて各文献をクラスタリングするステップと、
前記処理部により、前記第1文献抽出ステップにより抽出され且つ前記記憶装置に格納された前記第1の複数の文献のデータから、前記第1の表示形態について予め規定されている表示事項に係るデータを抽出するステップと、
前記処理部により、抽出された表示事項に係るデータを前記次の処理キーとして各クラスタについて表示するためのデータを生成するステップと、
を含む請求項1記載の検索処理方法。
【請求項5】
ユーザにより指定された検索条件に従って所定の文献群を格納している文献データベースを検索し、当該検索により抽出された第1の複数の文献のデータを記憶装置に格納する第1文献抽出ステップと、
前記第1文献抽出ステップにより抽出され且つ前記記憶装置に格納された前記第1の複数の文献のデータを読み出し、前記第1の複数の文献に関する情報及び表示形態をユーザに選択させるための情報を含む検索結果画面のデータを生成し、出力するステップと、
前記第1文献抽出ステップにより抽出され且つ前記記憶装置に格納された前記第1の複数の文献のデータを読み出し、当該第1の複数の文献間の関連度及び当該第1の複数の文献のうちの一つと当該文献に使用されている語句との関連度の少なくともいずれかを算出し、関連度データテーブル格納部に格納する第1関連度算出ステップと、
前記第1関連度算出ステップにより算出され且つ前記関連度データテーブル格納部に格納されたデータに基づき、前記第1文献抽出ステップにより抽出され且つ前記記憶装置に格納された前記第1の複数の文献のデータを、各表示項目を次の処理キーとして選択可能とし且つ前記検索結果画面において前記ユーザにより指定された第1の表示形態にて前記ユーザに提示する第1処理結果画面のデータを生成し、出力する第1処理ステップと、
前記第1処理結果画面において前記ユーザにより選択された表示項目に対応する、第2の複数の文献のデータを前記文献データベースから抽出し、前記記憶装置に格納する第2文献抽出ステップと、
前記第2文献抽出ステップにより抽出され且つ前記記憶装置に格納された前記第2の複数の文献のデータを読み出し、当該第2の複数の文献間の関連度及び当該第2の複数の文献のうちの一つと当該文献に使用されている語句との関連度の少なくともいずれかを算出し、前記関連度データテーブル格納部に格納する第2関連度算出ステップと、
前記第2関連度算出ステップにより算出され且つ前記関連度データテーブル格納部に格納されたデータに基づき、前記第2文献抽出ステップにより抽出され且つ前記記憶装置に格納された前記第2の複数の文献のデータを、前記検索結果画面のデータを生成及び出力することなく、各表示項目を次の処理キーとして選択可能とし且つ前記第1処理結果画面において前記ユーザにより指定された第2の表示形態にて前記ユーザに提示する第2処理結果画面のデータを生成し、出力する第2処理ステップと、
をコンピュータに実行させるためのプログラム。
【請求項1】
処理部と、記憶装置と、関連度データテーブル格納部と、所定の文献群を格納している文献データベースとを有するコンピュータにより実行される検索処理方法であって、
前記処理部により、ユーザにより指定された検索条件に従って前記文献データベースを検索し、当該検索により抽出された第1の複数の文献のデータを前記記憶装置に格納する第1文献抽出ステップと、
前記処理部により、前記第1文献抽出ステップにより抽出され且つ前記記憶装置に格納された前記第1の複数の文献のデータを読み出し、前記第1の複数の文献に関する情報及び表示形態をユーザに選択させるための情報を含む検索結果画面のデータを生成し、出力するステップと、
前記処理部により、前記第1文献抽出ステップにより抽出され且つ前記記憶装置に格納された前記第1の複数の文献のデータを読み出し、当該第1の複数の文献間の関連度及び当該第1の複数の文献のうちの一つと当該文献に使用されている語句との関連度の少なくともいずれかを算出し、前記関連度データテーブル格納部に格納する第1関連度算出ステップと、
前記処理部により、前記第1関連度算出ステップにより算出され且つ前記関連度データテーブル格納部に格納されたデータに基づき、前記第1文献抽出ステップにより抽出され且つ前記記憶装置に格納された前記第1の複数の文献のデータを、各表示項目を次の処理キーとして選択可能とし且つ前記検索結果画面において前記ユーザにより指定された第1の表示形態にて前記ユーザに提示する第1処理結果画面のデータを生成し、出力する第1処理ステップと、
前記処理部により、前記第1処理結果画面において前記ユーザにより選択された表示項目に対応する、第2の複数の文献のデータを前記文献データベースから抽出し、前記記憶装置に格納する第2文献抽出ステップと、
前記処理部により、前記第2文献抽出ステップにより抽出され且つ前記記憶装置に格納された前記第2の複数の文献のデータを読み出し、当該第2の複数の文献間の関連度及び当該第2の複数の文献のうちの一つと当該文献に使用されている語句との関連度の少なくともいずれかを算出し、前記関連度データテーブル格納部に格納する第2関連度算出ステップと、
前記処理部により、前記第2関連度算出ステップにより算出され且つ前記関連度データテーブル格納部に格納されたデータに基づき、前記第2文献抽出ステップにより抽出され且つ前記記憶装置に格納された前記第2の複数の文献のデータを、前記検索結果画面のデータを生成及び出力することなく、各表示項目を次の処理キーとして選択可能とし且つ前記第1処理結果画面において前記ユーザにより指定された第2の表示形態にて前記ユーザに提示する第2処理結果画面のデータを生成し、出力する第2処理ステップと、
を含む検索処理方法。
【請求項2】
前記第1及び第2の表示形態が、少なくとも
処理すべき複数の文献を使用語句によりクラスタリングして予め規定されている表示事項でもって提示する形態と、
処理すべき複数の文献を予め規定されている表示事項と各文献の使用語句により算出される関連度を表す接続線とでもって表示する形態と、
処理すべき複数の文献を使用語句について分類且つ集計した結果をグラフによって表示する形態と、
処理すべき複数の文献の使用語句と当該使用語句間の関連度を表す接続線とを表示する形態と、
処理すべき複数の文献のうち特定の事項で関連付けられた文献群を前記特定の事項により、前記特定の事項で関連付けられた文献群と前記処理すべき文献のデータである使用語句との関連度を前記特定の事項と前記使用語句との間の接続線でもって表示する形態と、
のうちいずれかであることを特徴とする請求項1記載の検索処理方法。
【請求項3】
前記第1及び第2処理ステップにおいて、
表示形態に対応する表示用プログラムを指定し、当該表示用プログラム用のデータを生成する
ことを特徴とする請求項1記載の検索処理方法。
【請求項4】
前記第1処理ステップが、
前記処理部により、前記関連度データテーブル格納部から読み出したデータを用いて各文献をクラスタリングするステップと、
前記処理部により、前記第1文献抽出ステップにより抽出され且つ前記記憶装置に格納された前記第1の複数の文献のデータから、前記第1の表示形態について予め規定されている表示事項に係るデータを抽出するステップと、
前記処理部により、抽出された表示事項に係るデータを前記次の処理キーとして各クラスタについて表示するためのデータを生成するステップと、
を含む請求項1記載の検索処理方法。
【請求項5】
ユーザにより指定された検索条件に従って所定の文献群を格納している文献データベースを検索し、当該検索により抽出された第1の複数の文献のデータを記憶装置に格納する第1文献抽出ステップと、
前記第1文献抽出ステップにより抽出され且つ前記記憶装置に格納された前記第1の複数の文献のデータを読み出し、前記第1の複数の文献に関する情報及び表示形態をユーザに選択させるための情報を含む検索結果画面のデータを生成し、出力するステップと、
前記第1文献抽出ステップにより抽出され且つ前記記憶装置に格納された前記第1の複数の文献のデータを読み出し、当該第1の複数の文献間の関連度及び当該第1の複数の文献のうちの一つと当該文献に使用されている語句との関連度の少なくともいずれかを算出し、関連度データテーブル格納部に格納する第1関連度算出ステップと、
前記第1関連度算出ステップにより算出され且つ前記関連度データテーブル格納部に格納されたデータに基づき、前記第1文献抽出ステップにより抽出され且つ前記記憶装置に格納された前記第1の複数の文献のデータを、各表示項目を次の処理キーとして選択可能とし且つ前記検索結果画面において前記ユーザにより指定された第1の表示形態にて前記ユーザに提示する第1処理結果画面のデータを生成し、出力する第1処理ステップと、
前記第1処理結果画面において前記ユーザにより選択された表示項目に対応する、第2の複数の文献のデータを前記文献データベースから抽出し、前記記憶装置に格納する第2文献抽出ステップと、
前記第2文献抽出ステップにより抽出され且つ前記記憶装置に格納された前記第2の複数の文献のデータを読み出し、当該第2の複数の文献間の関連度及び当該第2の複数の文献のうちの一つと当該文献に使用されている語句との関連度の少なくともいずれかを算出し、前記関連度データテーブル格納部に格納する第2関連度算出ステップと、
前記第2関連度算出ステップにより算出され且つ前記関連度データテーブル格納部に格納されたデータに基づき、前記第2文献抽出ステップにより抽出され且つ前記記憶装置に格納された前記第2の複数の文献のデータを、前記検索結果画面のデータを生成及び出力することなく、各表示項目を次の処理キーとして選択可能とし且つ前記第1処理結果画面において前記ユーザにより指定された第2の表示形態にて前記ユーザに提示する第2処理結果画面のデータを生成し、出力する第2処理ステップと、
をコンピュータに実行させるためのプログラム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【図21】
【図22】
【図23】
【図24】
【図25】
【図26】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【図21】
【図22】
【図23】
【図24】
【図25】
【図26】
【公開番号】特開2008−135057(P2008−135057A)
【公開日】平成20年6月12日(2008.6.12)
【国際特許分類】
【出願番号】特願2008−20978(P2008−20978)
【出願日】平成20年1月31日(2008.1.31)
【分割の表示】特願2003−77724(P2003−77724)の分割
【原出願日】平成15年3月20日(2003.3.20)
【出願人】(000005223)富士通株式会社 (25,993)
【Fターム(参考)】
【公開日】平成20年6月12日(2008.6.12)
【国際特許分類】
【出願日】平成20年1月31日(2008.1.31)
【分割の表示】特願2003−77724(P2003−77724)の分割
【原出願日】平成15年3月20日(2003.3.20)
【出願人】(000005223)富士通株式会社 (25,993)
【Fターム(参考)】
[ Back to top ]