説明

文献情報分析装置及び文献情報分析方法

【課題】ユーザの使い勝手を向上させたマップを生成する。
【解決手段】ユーザは、文献番号等を指定して、情報蓄積部30に記憶されている多数の文献情報群の中から、少なくとも2つ以上の文献情報を選ぶ。選択される文献情報は、親出願と分割出願、国内優先権主張出願とその基礎出願のような関連性を有する。マップ制御部10は、第1文献情報を複数の第1ブロック111にそれぞれ分割し、第2文献情報を複数の第2ブロック112にそれぞれ分割する。分割されたブロック111,112は、それぞれの座標に配置される。関連するブロック同士は、接続線113を介して接続される。ユーザが接続線113を選択すると、各ブロックの内容が比較され、その比較結果がマップ100に表示される。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、例えば、特許文献や学術文献等の文献情報を分析する文献情報分析装置及び文献情報分析方法に関する。
【背景技術】
【0002】
例えば、文献情報としての特許文献を調査することにより、研究開発の方向性を探ったり、事業計画の立案等を行うことができる。ところで、特許公開公報のような特許文献の場合は、例えば、いわゆる親出願と分割出願、国内優先権主張出願と国内優先権主張の基礎となった出願等のように、複数の文献が密接に関係している場合がある。
【0003】
このような関係にある複数の特許文献を精査することにより、その分割や国内優先権主張の可否等を判断することができる。そこで、引用された文献及びそれを引用する文献の関連性を視覚的に表現させるものが提案されている(特許文献1)。
【特許文献1】特開2004−348771号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
前記文献に記載の技術によれば、文献単位での関連性はわかるが、各文献がどのように関連しているのかまでを知ることができない。ここで、文書作成ソフトウェアの中には、複数の文献間の相違を分析して、ユーザに知らせる機能を備えるものがある。しかし、このような文献比較機能を備えたソフトウェアは、単純に両文献のテキストコードの順番を解析するに過ぎず、文献間の実質的な相違を検出することはできない。
【0005】
例えば、2つの段落の順番を入れ替えただけに過ぎない場合でも、そのようなソフトウェアは、各段落が全て変更されたと判断する。従って、ユーザは、関連性のある文献を一頁ずつ確認しながら、一致部分及び相違部分を解析する必要があり、作業性が低く、精査に要する時間及びコストが増大するという問題がある。
【0006】
そこで、本発明の目的は、ユーザにより選択された第1文献情報及び第2文献情報を所定単位のブロックで比較することにより、両者の内容をより適切に対比することができる文献情報分析装置及び文献情報分析方法を提供することにある。本発明の他の目的は、関連性のあるブロック同士を関連を示す表示要素で接続して可視化し、この関連を示す表示要素をユーザが選択するだけで各ブロック間の対比結果を容易に確認することができる文献情報分析装置及び文献情報分析方法を提供することにある。本発明のさらなる目的は、後述する実施形態の記載から明らかになるであろう。
【課題を解決するための手段】
【0007】
上記課題を解決すべく、本発明の一つの観点に従う文献情報分析装置は、それぞれ電子化された複数の文献情報をそれぞれ記憶する文献情報記憶部と、記憶された各文献情報のうちユーザにより選択された第1文献情報及び第2文献情報を文献情報記憶部からそれぞれ取得し、第1文献情報及び前記第2文献情報をそれぞれ所定単位のブロックとして処理させる文献情報取得部と、少なくとも第1文献情報及び第2文献情報に含まれる単語群に基づいて決定される座標系において、各ブロックの座標をそれぞれ算出するブロック座標算出部と、各ブロックの座標に基づいて各ブロックを配置し、かつ、各ブロックのうち第1文献情報に由来する所定の第1ブロックと第2文献情報に由来する所定の第2ブロックとを、両者の関連を示す表示要素で接続することによりマップ情報を生成するマップ生成部と、生成された前記マップ情報を表示させるマップ表示部と、を備える。
第1文献情報の全体及び第2文献情報の全体をぞれぞれ一つずつの所定単位のブロックとして扱うこともできるし、または、第1文献情報を分割してなる複数の情報及び前記第2文献情報を分割してなる複数の情報を、それぞれ一つずつの所定単位のブロックとして扱うこともできる。なお、文献情報の全体を一つのブロックとして扱う場合、例えば、このブロックを「全体ブロック」と呼ぶことができ、文献情報を複数に分割してそれぞれを一つずつのブロックとして扱う場合は、これらのブロックを「部分ブロック」または「サブブロック」と呼ぶことができる。
【0008】
ここで、文献情報としては、技術文献情報、学術論文情報、特許文献情報等を挙げることができる。特許文献情報としては、例えば、特許公開公報や実用新案登録公報等のように、特許出願または実用新案登録出願に関する文献情報を挙げることができる。所定単位としては、段落単位または請求項単位のいずれか又は両方を使用可能である。
【0009】
ユーザは、第1文献情報及び第2文献情報をそれぞれ選択することができるが、いずれか一方または両方の選択に際して、支援を与えることもできる。例えば、各文献情報に含まれている書誌的事項(出願人名、発明者名、特記事項、出願番号、基礎出願番号、出願日、公開日等)や従来技術に関する事項(先行特許文献を特定する公報番号等)に基づいて、互いに関連する文献情報を自動的に抽出することができる。このような関連する文献情報を自動的に抽出する関連文献抽出手段を設けることにより、ユーザは、第1文献情報を指定するだけでよく、操作性が向上する。第1文献情報に関連する(対応する)第2文献情報は、関連文献抽出手段によって自動的に抽出される。
【0010】
このように、ユーザは、直接的にまたは間接的に、複数の文献情報を選択することができる。選択された各文献情報は、所定単位のブロックにそれぞれ分割される。ユーザが指定した範囲についてのみ、各文献情報をそれぞれブロックに分割してもよい。例えば、特許文献の場合、特許請求の範囲のみを請求項単位で分割したり、実施形態の記載のみを段落単位で分割することができる。
【0011】
そして、ブロック座標算出部は、所定の座標系における各ブロックの座標をそれぞれ算出する。所定の座標系は、例えば、選択された各文献情報にそれぞれ含まれる単語群の出現頻度等を解析することにより、決定可能である。あるいは、文献情報の全体を一つのブロックとして扱う場合、複数の文献情報から抽出されるキーワードの組合せ及び出現頻度を主成分分析することにより、座標系を決定することができる。座標軸を2つ設定すれば2次元の座標系を得ることができ、座標軸を3つ設定すれば3次元の座標系を得ることができる。ブロック座標算出部は、例えば、第1文献情報及び第2文献情報をそれぞれ分割してなるブロックを用いる場合において、各ブロックにそれぞれ含まれる各単語の座標の平均値を求め、この平均値をそのブロックの座標として決定する。
【0012】
以下、主として、第1文献情報及び第2文献情報をそれぞれ複数のブロックに分割する場合を例に挙げて説明する。マップ生成部は、各ブロックをそれぞれの座標に配置し、さらに、所定のブロック同士を、両者の関連を示す表示要素で接続することにより、マップ情報を生成する。両者の関連を示す表示要素としては、例えば、線や楕円、長方形、三角形等の各種表示要素を挙げることができる。関連するブロック同士を線で接続する場合、マップ情報の表示エリアを有効に利用することができる。これにより、所定の座標系に各ブロックがそれぞれの位置に配置され、かつ、所定のブロック同士が表示要素で接続されて関連性が可視化されたマップ情報が生成される。ここで、留意すべきは、第1文献情報に由来する第1ブロックと、第2文献情報に由来する第2ブロックとが接続される点である。即ち、第1ブロック同士、または第2ブロック同士が接続されることはない。
【0013】
本発明の実施形態では、マップ生成部は、第1ブロックと第2ブロックが所定距離以上離れている場合に、これら第1ブロック及び第2ブロック同士を、両者の関連を示す表示要素で接続する。第1ブロックと第2ブロックとが所定距離以上離れていない場合、即ち、両ブロックが近接している場合、両者の内容がほぼ同一であると判断することが可能である。従って、この場合は、各ブロックを接続せず、有意な相違が見られるブロック同士のみを接続する。
【0014】
本発明の実施形態では、マップ生成部は、所定距離以上離間している第1ブロックと第2ブロックとの少なくともいずれか一方が複数存在する場合、その中で最も近い第1ブロックと第2ブロックとを、両者の関連を示す表示要素で接続させる。そのブロックに最も近いブロックとの関連性が高いと考えられるためである。
【0015】
本発明の実施形態では、関連を示す表示要素がユーザによって選択された場合、この選択された関連を示す表示要素によって接続されている第1ブロックの内容と第2ブロックの内容とを予め設定された所定のレベルで対比し、この対比結果を出力させるブロック対比部を備える。
【0016】
ここで、所定のレベルとしては、例えば、単語レベル、句レベル、文レベルを挙げることができる。これらのレベルのうち、いずれを使用するかは、ユーザが自由に選択することができる。
【0017】
ブロック対比部は、関連を示す表示要素で接続された第1ブロックの内容と第2ブロックの内容との相違部分を対比結果として出力させることもできるし、両ブロックの共通部分を対比結果として出力させることもできる。
【0018】
本発明の他の観点に従うプログラムは、コンピュータを、文献情報記憶部に電子化されて記憶された複数の文献情報の中からユーザにより選択された第1文献情報及び第2文献情報をそれぞれ取得し、第1文献情報及び第2文献情報をそれぞれ所定単位のブロックに分割する文献情報分割手段と、第1文献情報及び第2文献情報に含まれる単語群に基づいて決定される座標系において、各ブロックの座標をそれぞれ算出するブロック座標算出手段と、各ブロックの座標に基づいて各ブロックを配置し、かつ、各ブロックのうち第1文献情報に由来する所定の第1ブロックと第2文献情報に由来する所定の第2ブロックとを、両者の関連を示す表示要素で接続することによりマップ情報を生成するマップ生成手段として、それぞれ機能させる。
【0019】
本発明のさらに別の観点に従う文献情報分析方法は、文献情報記憶部に記憶された複数の文献情報の中からユーザによって選択された第1文献情報及び第2文献情報をそれぞれ取得するステップと、第1文献情報及び第2文献情報をそれぞれ所定単位のブロックに分割するステップと、第1文献情報及び第2文献情報に含まれる単語群に基づいて決定される座標系において、各ブロックの座標をそれぞれ算出するステップと、各ブロックの座標に基づいて、各ブロックを座標系に従うマップ上にそれぞれ配置させるステップと、マップに配置された各ブロックのうち第1文献情報に由来する所定の第1ブロックと第2文献情報に由来する所定の第2ブロックとを、両者の関連を示す表示要素で接続させるすることによりマップ情報を生成するステップと、生成されたマップ情報を表示させるステップと、ユーザによって両者の関連を示す表示要素が選択された場合には、この選択された関連を示す表示要素によって接続されている第1ブロックの内容と第2ブロックの内容とを予め設定された所定のレベルで対比し、この対比結果を出力させるステップとを含む。
【0020】
なお、複数の文献情報をブロック単位で比較する前に、比較対象の各文献情報間の関連性を予め自動的に検出し、両文献情報を両者の関連性を示す接続線で接続しておくこともできる。例えば、ユーザによって選択された複数の文献情報間の関係(分割前と分割後の出願、変更前と変更後の出願、補正前と補正後の出願、引用・被引用等)を各文献情報に含まれる書誌事項等に基づいて自動的に判定し、この判定された関係に応じた線種(色彩や線の種類、線の太さ等)の接続線を自動的に選択し、各文献情報を接続線で接続して表示させることができる。そして、ユーザが手動操作で接続線を選択すると、この接続線で結ばれた各文献情報がブロック単位で比較されるようにしてもよい。
【発明を実施するための最良の形態】
【0021】
以下、図面に基づき、本発明の実施の形態を説明する。本実施形態に係る文献情報分析装置1は、マップ制御部10と、対比制御部20及び情報蓄積部30を備えたコンピュータ装置として構成可能である。そして、文献情報分析装置1は、例えば、インターネットやLAN(Local Area Network)等の通信ネットワークを介して、クライアント端末2と双方向通信可能に接続されている。クライアント端末2は、例えば、パーソナルコンピュータや携帯情報端末(携帯電話を含む)等として構成可能である。
【0022】
マップ制御部10は、情報蓄積部30に記憶されている多数の文献情報に基づいて、技術マップ100を生成し、出力する。生成されたマップ100は、通信ネットワークを介して、クライアント端末2に送信される。マップ100は、クライアント端末2内に保存可能としてもよいし、クライアント端末2内に保存不能としてもよい。マップ制御部10の詳細はさらに後述する。
【0023】
対比制御部20は、マップ100に表示されている接続線がユーザによって選択された場合に、その接続線で結ばれている各ブロック111,112の内容を比較し、その結果をマップ100上に表示させる。対比制御部20の詳細はさらに後述する。
【0024】
情報蓄積部30は、例えば、特許公開公報や登録公報、あるいは、科学技術論文等のような文献情報を多数記憶している。
【0025】
マップ100の構成を説明する。マップ100は、ユーザから指示された目的に添って生成されるものである。ユーザは、例えば、文献番号やサーチワード等を指定することにより、情報蓄積部30に記憶されている多数の文献情報群の中から、少なくとも2つ以上の文献情報を選ぶことができる。例えば、ユーザは、いわゆる親出願と分割出願、国内優先権主張出願と基礎出願、変更出願と変更前の出願、実用新案登録に基づく特許出願と実用新案登録出願、引用れた出願とこの出願を引用している出願等のように、互いに関連する複数の文献情報をそれぞれ選択することができる。
【0026】
後述のように、相互に関連する文献情報のうちいずれか一方がユーザによって選択された場合、この選択された文献情報に関連する他方の文献情報を自動的に選択する構成としてもよい。以下の説明では、ユーザによって選択された一方の文献情報を第1文献情報と、他方の文献情報を第2文献情報と呼ぶ。
【0027】
ユーザにより選択された互いに関連する複数の文献情報は、マップ制御部10によって解析され、マップ100が生成される。生成されたマップ100は、クライアント端末2に提供される。
【0028】
次に、マップ100の構成を説明する。等高線101A,101Bは、マップ100に含まれる単語の分布密度を示す表示要素である。また、マップ100には、複数のブロック111,112が表示されている。第1ブロック111は、第1文献情報を所定単位で分割することにより生成されたものである。第2ブロック112は、第2文献情報を所定単位で分割することにより生成されたものである。所定単位としては、特許文献の場合を例に挙げると、段落単位、請求項単位、実施例単位等を用いることができる。
【0029】
そして、各ブロック111,112のうち互いに関連するブロック同士は、接続線113によって接続されている。この接続線113により、ユーザは、そのブロック間に関連性が存在することを容易に把握することができる。ユーザが、接続線113をクリック等して選択すると、対比制御部20は、その接続線113で結ばれたブロックの内容を対比し、対比結果を表示させる。
【0030】
このように、本実施形態では、複数の文献情報の全体をそのまま対比するのではなく、各文献情報をブロック111,112に分割し、関連性のあるブロック同士のみを接続線113で接続してユーザに通知する。ユーザは、所望の接続線113を個別に選択することにより、特定のブロック間の対比結果を得ることができる。以下、本実施形態の詳細をさらに説明する。
【実施例1】
【0031】
図2は、文献情報分析装置1の機能構成を示すブロック図である。マップ制御部10は、例えば、マップ生成条件入力受付部11と、文献情報分割部12と、ブロック座標算出部13と、ブロック間類似度判定部14と、マップ生成部15及びマップ表示部16とを含んで構成することができる。
また、情報蓄積部30の一例として、文献データベース(図中、データベースを「DB」と略記)31と、単語データベース32と、インデックスデータベース33とを設けることができる。
文献データベース31は、複数の文献情報を記憶するものである。単語データベース32は、辞書として使用されるものである。インデックスデータベース33は、各文献にどのようなキーワードが含まれているかを管理するためのものである。
【0032】
マップ生成条件入力受付部11は、ユーザから指定されるマップ生成条件の入力を受け付けるためのものである。受け付けるとは、例えば、ユーザの指定するマップ生成条件を示す情報を通信インターフェースを介して電子情報として受信し、メモリ等に記憶させることを意味する。
【0033】
文献情報分割部12は、ユーザによって選択された第1文献情報及び第2文献情報を、ユーザから指定された条件に基づいて、それぞれ分割する。ユーザは、例えば、段落単位や請求項単位等の分割単位を指定することができる。なお、各文献情報は、同一レベル(単位)で分割される。
【0034】
ブロック座標算出部13は、文献データベース(図中、データベースを「DB」と略記)31及び単語データベース32を検索することにより、各ブロックに含まれている単語を抽出する。例えば、ブロック座標算出部13は、そのブロック内の各単語の座標の平均値を算出することにより、そのブロックの座標を算出する。
【0035】
ブロック間類似度判定部14は、各ブロック111,112の座標を比較し、両者の類似度を判別する。これにより、実質的に同一内容であると判定可能なブロック同士を接続の対象から排除し、実質的に同一ではないが関連するブロック同士のみを接続対象として抽出することができる。
【0036】
マップ生成部15は、各ブロック111,112をそれぞれの座標に配置すると共に、互いに関連するブロック同士を接続線113で接続することにより、マップ100の論理的構造を生成する。
【0037】
マップ表示部16は、生成されたマップ100の構造に応じて、所定の表示要素をそれぞれ割り当てることにより、ユーザが視認可能なマップ100を生成し、クライアント端末2に提供する。所定の表示要素としては、例えば、各ブロックを示すための図形要素、等高線101A等、マップ100に対する操作を行うためのメニュー表示部などを挙げることができる。
【0038】
ユーザは、クライアント端末2の端末画面に表示されたマップ100を閲覧することにより、選択した文献情報の記述内容(ブロック)がどのように分布しており、どの記述内容同士が互いに関連しているのか等を容易に読みとることができる。
【0039】
対比制御部20は、例えば、接続線指定情報入力受付部21と、ブロック対比部22と、対比結果出力部23とを含んで構成することができる。
【0040】
接続線指定情報入力受付部21は、ユーザから入力される接続線指定情報を電子的に受け付けて記憶する。例えば、ユーザによるマップ100上の操作は、イベントハンドラによってイベントとして検出することができる。
【0041】
ブロック対比部22は、ユーザの選択する接続線113によって接続されているブロック111,112の内容をテキストマイニング等の手法を用いて対比する。この対比結果は、対比結果出力部23によって、マップ100上に表示される。
【0042】
対比結果表示部24は、例えば、対比対象のブロック間の一致部分と不一致部分とが明確に区別できるような形態で、対比結果を表示する。例えば、下線や取消線、フォント種別、大きさ、色等を適宜変えることにより、どの部分が一致しており、どの部分が一致していないのかを区別して表示させることができる。
【0043】
図3は、文献情報分析装置1及びクライアント端末2のハードウェア構成の概略を示す構成説明図である。文献情報分析装置1は、上述のように、サーバコンピュータ等のように構成可能である。
【0044】
文献情報分析装置1は、例えば、通信インターフェース(図中、インターフェースを「I/F」と略記)1001と、CPU(Central Processing Unit)1002と、ROM(Read Only Memory)1003と、RAM(Random Access Memory)1004と、補助記憶装置1005を備えて構成することができる。
【0045】
補助記憶装置1005には、例えば、OS(Operating System)の他に、文献データベース31と、単語データベース32と、表示制御プログラム1110と、主成分分析プログラム1120と、構造解析プログラム1130と、検索プログラム1140及びウェブサーバプログラム1150を、それぞれ記憶させることができる。
【0046】
文献データベース31には、上述のように、特許公開公報等の文献情報が予め記憶されている。単語データベース32には、例えば、助詞や接続詞等のようなキーワードに不適切な単語、同義語、類義語等が予め記憶されている。インデックスデータベース33は、各文献に含まれているキーワードを管理する。表示制御プログラム1110は、マップ100の描画処理等を行うプログラムである。主成分分析プログラム1120は、主成分分析を行うプログラムである。構造解析プログラム1130は、例えば、テキストマイニング等の手法に基づいて、テキストデータの構造を解析するプログラムである。検索プログラム1140は、入力された検索条件に基づいて、文献データベース31等を検索するプログラムである。ウェブサーバプログラム1150は、ウェブサーバ機能を実現するプログラムである。
【0047】
クライアント端末2の構成を説明する。クライアント端末2は、インターネット等の通信ネットワークCNを介して文献情報分析装置1に接続されており、例えば、通信インターフェース2001と、CPU2002と、ROM2003と、RAM2004及び補助記憶装置2005を備えて構成可能である。
【0048】
なお、以上の構成は例示であって、本発明はこれに限定されない。例えば、プログラムに代えて、プログラマブル・ロジック・デバイス等のようなハードウェア回路を用いて、各機能の少なくとも一部を実現可能な場合もある。
【0049】
文献情報分析装置1(以下、分析装置1とも呼ぶ)を用いた文献情報分析方法について説明する。図4は、全体動作の概要を示すフローチャートである。なお、以下に述べる各フローチャートも同様であるが、各フローチャートは、処理の概要を示しており、実際のプログラムとは相違する。なお、後述のように、ユーザによって直接的または間接的に選択された複数の文献情報間の関係を自動的に判定し、判定された関係に応じた線種の接続線で両文献情報を接続して表示しておくこともできる。
【0050】
まず、ユーザは、クライアント端末2のユーザインターフェースを介して、比較対象となる文献情報を指定する(S10)。例えば、ユーザは、第1文献情報及び第2文献情報のそれぞれの文献番号等を指定することができる。あるいは、ユーザは、いずれか一方の文献番号のみを指定することもできる。
【0051】
分析装置1は、クライアント端末2から指定条件を取得すると(S11)、この指定条件に基づいて文献データベース31を検索し、指定条件に合致する文献情報をそれぞれ抽出する(S12)。
【0052】
抽出された文献情報の文献番号等は、分析装置1からクライアント端末2に送信され(S13)、クライアント端末2の画面に表示される(S14)。ユーザは、クライアント端末2の画面を介して、解析(対比)の実行を指示する(S15)。
【0053】
この指示を与える際に、ユーザは、対比条件を指定することもできる。対比条件としては、例えば、第1文献情報及び第2文献情報のどの部分をどの単位で対比するか等の条件を挙げることができる。
【0054】
分析装置1は、ユーザから指示を受信すると、抽出された第1文献情報及び第2文献情報に基づいて、マップ100を生成する。詳細は後述するが、分析装置1は、第1文献情報及び第2文献情報をそれぞれ複数のブロックに分割し、各ブロックをマップ上に配置すると共に、互いに関連するブロック同士を接続線113で接続させる。生成されたマップ100は、クライアント端末2に送信される(S17)。
【0055】
ユーザは、クライアント端末2の画面を介して、マップ100を閲覧し、ブロックの配置具合や接続線113の設定状態等を確認する。そして、ユーザは、詳細な対比を希望する場合、所望のブロック間を結ぶ接続線113を指定する(S19)。
【0056】
分析装置1は、ユーザによる接続線の指定を検出すると、ブロック間の内容を対比し(S20)、この対比結果をクライアント端末2に送信する(S21)。ユーザは、マップ100に表示された表示部24を閲覧することにより、所望のブロック111,112の内容がどの程度相違しているか(共通しているか)を確認することができる。
【0057】
図5は、各文献情報を複数のブロックに分割等してマップ100を生成するための処理を示すフローチャートである。この処理は、図4中のS16に対応する。まず、分析装置1は、第1文献情報及び第2文献情報にそれぞれ含まれる単語群に基づいて、各単語の出現頻度等から単語の座標軸を2つ決定する(S31)。
なお、S31における座標軸算出処理は、一般的な多変量解析の一手法である主成分分析を利用している。例えば、座標算出のために使用する基礎データとして、各文献(または各ブロック)のそれぞれについて、対象の単語が出現しているか否かを「1(出現)」「0(非出現)」のマトリックスを利用して算出し、この結果算出される「主成分負荷量」と呼ばれる指標を実際の座標とする。
【0058】
次に、分析装置1は、第1文献情報を予め設定された所定単位のブロックにそれぞれ分割する(S32)。上述のように、例えば、段落単位や請求項単位等のように、各文献情報をそれぞれ分割することができる。ここで、所定単位とは、意味内容上の単位であり、ブロックのデータサイズとは直接関係しない点に留意すべきである。各ブロックのデータサイズは、それぞれに含まれているデータ量によって相違する。
【0059】
次に、分析装置1は、第1文献情報を分割してなる第1ブロック群の各ブロックについて、以下のS34〜S37をそれぞれ実行する(S33)。分析装置1は、一つの第1ブロック111を選択して、この第1ブロック111の内容を構文解析し(S34)、その第1ブロック111に含まれている単語を全て抽出する(S35)。
【0060】
分析装置1は、そのブロック111に含まれている各単語の座標をそれぞれ求めて、その平均値を算出する。そして、分析装置1は、この算出された平均値を、そのブロック111の座標として使用する(S36)。分析装置1は、算出された座標位置に、そのブロック111を所定の表示形態で配置させる(S37)。所定の表示形態とは、例えば、そのブロック111を示す図形の形状や色彩等を意味する。以上の処理を第1ブロック群の全ブロック111について繰り返すことにより、第1文献情報はブロック単位で分割されて、マップ100に分散して表示される。
【0061】
次に、分析装置1は、第1ブロック111と同じ単位で、第2文献情報を複数のブロック112にそれぞれ分割する(S38)。分析装置1は、第2文献情報を分割してなる第2ブロック群の各ブロック112について、以下のS40〜S47をそれぞれ実行する(S39)。
【0062】
分析装置1は、一つの第2ブロック112を選択して、この第2ブロック112の内容を構文解析し(S40)、そこに含まれている単語を全て抽出する(S41)。分析装置1は、そのブロック112に含まれている各単語の座標の平均値を算出することにより、その第2ブロック112の座標を決定する(S42)。
【0063】
分析装置1は、算出された座標位置に、その第2ブロック112を所定の表示形態で配置させる(S43)。以上の処理を第2ブロック群の全ブロック112について繰り返すことにより、第2文献情報はブロック単位で分割されて、マップ100に分散して表示される。
【0064】
次に、接続線設定処理が実行される。分析装置1は、その第2ブロック112の座標から所定範囲内に第1ブロック111が存在するか否かを判定する(S44)。第2ブロック112から所定範囲内に第1ブロック111が存在する場合(S44:YES)、その第2ブロック112と第1ブロック111の内容はほぼ同一であると判断できる。従って、この場合は、接続線113を設定せずに、次の第2ブロック112の処理に移る。
【0065】
これに対し、その第2ブロック112の位置から所定範囲内に第1ブロック111が存在しない場合(S44:NO)、第2ブロック112と実質的に同一内容の第1ブロック111が、その第2ブロック112の近傍に位置しない場合である。即ち、その第2ブロック112とは内容の異なる第1ブロック111が、その第2ブロック112の周辺に存在すると判断可能な場合である(S45)。
【0066】
そこで、分析装置1は、その第2ブロック112から最も近い第1ブロック111を検索し(S46)、検索された最短距離の第1ブロック111と第2ブロック112とを接続線113で接続する(S47)。
【0067】
ここで、分析装置1は、各ブロック111,112間の距離に応じて、接続線113の表示形態を変更させることができる。例えば、接続線表示形態管理テーブルT1に、ブロック間の距離と線種との関係を予め登録しておけば、分析装置1は、各ブロック間の距離に応じた線種で、接続線113を表示させることができる。ここにいう「線種」とは、線の種類(実線、点線、一点鎖線等)、線の太さ、線の色のいずれか一つまたは複数を含む概念である。
【0068】
次に、図6は、ブロック間の内容を対比するブロック間対比処理を示すフローチャートである。この処理は、図5中のS20に対応する。分析装置1は、マップ100上の接続線113のいずれかがユーザによって指定されたか否かを判定する(S51)。
【0069】
接続線113がユーザによって指定されると(S51:YES)、分析装置1は、その指定された接続線113で結ばれている第1ブロック111と第2ブロック113とをそれぞれ特定する(S52)。分析装置1は、第1ブロック111の内容及び第2ブロック112の内容をそれぞれ取得する(S53,S54)。
【0070】
そして、分析装置1は、第1ブロック111の内容と第2ブロック112の内容とを比較し(S55)、その一致部分(共通部分)及び相違部分(差分)をそれぞれ抽出して一時的に記憶する(S56)。分析装置1は、抽出された一致部分及び相違部分をマップ100に表示させる(S57)。
【0071】
図7は、対比結果表示部24による表示例を示す説明図である。例えば、各ブロック111,112の原文を最上段に表示し、次の段に両ブロック111,112の一致部分を表示し、最後の段に両ブロック111,112の相違部分を表示することができる。
【0072】
なお、これに限らず、例えば、下線や取消線等を用いて、各ブロック111,112の原文中に一致部分及び相違部分を同時に表示させる構成でもよい。
【0073】
また、対比するレベルは、単語レベル、フレーズレベル、センテンスレベルのいずれかまたは複数をユーザが自由に設定することができる。
【0074】
次に、図8は、クライアント端末2の画面に表示されるマップ生成メニュー画面G1の一例を示す説明図である。例えば、メニュー画面G1には、文献指定部G2と、比較範囲指定部G3と、ブロック単位指定部G4と、関連文献検索ボタンB1と、実行指示ボタンB2及び取消ボタンB3とを含めることができる。
【0075】
文献指定部G2には、ユーザが第1文献情報及び第2文献情報の文献番号をそれぞれ直接入力することができる。あるいは、ユーザは、いずれか一方の文献番号のみを入力した後、関連文献検索ボタンB1を操作することにより、その入力済の文献番号に関連する文献番号を分析装置1に自動的に検索させてセットさせることもできる。
【0076】
比較範囲指定部G3では、各文献情報のどの部分について比較するかを指定する。例えば、文献の全体、特許請求の範囲、発明の詳細な説明、課題を解決するための手段、発明の効果、要約等のように、ユーザは所望の範囲を指定することができる。なお、比較範囲は複数指定することができる。
【0077】
ブロック単位指定部G4では、ブロックの生成単位を指定する。例えば、請求項単位、段落単位、ページ単位のように、ユーザは所望の単位をいずれか一つまたは複数選択することができる。
【0078】
そして、各文献情報を特定するための情報(文献番号)や比較範囲及びブロック単位を指定した後、ユーザが実行指示ボタンB2を操作すると、分析装置1は、上述した処理を実行してマップ100を生成する。
【0079】
本実施例は上述の構成を採用するため、以下の効果を奏する。本実施例では、第1文献情報及び第2文献情報をそれぞれ所定単位のブロックに分割し、互いに関連する第1ブロック111と第2ブロック112を接続線113で接続してマップ100に表示させる構成とした。従って、各文献情報の全体を単純に対比する場合に比べて、ブロック単位で各文献情報の構造を把握でき、かつ、各文献情報のどの部分がどのように関連しているのかを視覚を通じて直感的に把握することが可能となり、使い勝手が向上する。
【0080】
本実施例では、第1ブロック111と第2ブロック112が所定距離以上離れている場合に、これら第1ブロック111及び第2ブロック112同士を、接続線113で接続して表示させる構成とした。従って、互いに関連し、かつ、内容の相違するブロック同士だけを接続線113で対応付けることができ、使い勝手が向上する。
【0081】
本実施例では、第1ブロック111と第2ブロック112とが所定距離以上離間している場合に、最も近い第1ブロック111と第2ブロック112とを接続線113で接続して表示させる構成とした。従って、互いに関連する可能性が高いブロック同士を接続して可視化することができ、使い勝手が向上する。
【0082】
本実施例では、接続線113がユーザによって選択された場合、この接続線113で接続されている第1ブロック111の内容と第2ブロックの内容112とを予め設定された所定のレベルで対比し、この対比結果を出力させる構成とした。従って、ユーザは、接続線113を選択するだけで、所望のブロック間の類似度合を簡単に把握することができ、使い勝手が向上する。
【0083】
本実施例では、各ブロックの一致部分または相違部分のいずれかまたは両方を表示可能な構成とした。従って、各文献情報の共通部分や相違部分をブロック単位で個別に精査することができ、使い勝手が向上する。
【実施例2】
【0084】
図9〜図12に基づいて、本発明の第2実施例を説明する。前記第1実施例では、文献情報を複数のブロックに分割し、ブロック単位で比較する場合を説明したが、本実施例では、各文献情報をブロック単位で比較する前に、比較対象の文献情報間の関連性を区別して表示させる。
【0085】
図9は、本実施例の全体概要を示す説明図である。本実施例では、文献情報分析装置1の前処理として、ユーザにより選択された文献情報間の関連性を視覚化する。
関連性分析装置300は、文献情報の関連性を検出し、その関連性に応じた接続線で文献情報間を接続して表示させるものである。関連性分析装置300は、文献情報分析装置1と同一のコンピュータ装置に設けることもできるし、あるいは文献情報分析装置1とは別のコンピュータ装置に設けることもできる。
【0086】
「文献情報分析装置1の前処理装置」として表現可能な関連性分析装置300は、例えば、文献選択部310と、関連性検出部320と、接続線選択部330と、表示画面350を生成する表示出力部340と、選択操作検出部360とを備えて構成できる。
関連性分析装置300は、文献情報分析装置1と同様に、文献データベース31,単語データベース32及びインデックスデータベース33を使用可能である。即ち、これら各データベース31〜33は、両分析装置1,300間で共用されている。
【0087】
文献選択部310は、ユーザから指定された条件に基づいて、文献データベース31(または文献データベース31及びインデックスデータベース33)を検索することにより、ユーザの望む文献情報を抽出するものである。例えば、ユーザは、特許公開公報番号や特許出願番号等のような文献番号を指定することにより、複数の文献情報111A,112A,113Aを抽出させることができる。
【0088】
関連性検出部320は、抽出された各文献情報111A,112A,113Aの関係を判定する。例えば、関連性判定部320は、各文献情報111A,112A,113Aに含まれる書誌事項に基づいて、第1文献情報111Aに関連する第2文献情報112Aを抽出することができる。
【0089】
書誌事項には、例えば、特許分類、出願人氏名、発明者氏名、代理人氏名、出願番号、公開番号、登録番号、出願日、公開日、登録日、特別な出願の表示(優先権主張、分割変更の表示、新規性喪失の例外規定の適用等)、請求項の数、審査請求の有無、先行技術文献の番号等が含まれている。従って、関連性検出部320は、書誌事項を解析することにより、互いに関連する複数の文献情報111A,112Aを抽出可能である。
図9の表示画面350では、第1文献情報111Aを基準として、複数の第2文献情報112Aが第1文献情報111Aに関連している様子を示している。なお、第3文献情報113Aは、第1文献情報111Aと直接的な関連性(例えば、法的関係)はなく、共通するキーワード等を有するだけの文献である。
【0090】
接続線選択部330は、関連性検出部320によって検出された関連性に基づいて、接続線表示形態管理テーブルT1を参照することにより、文献情報間の関連性に応じた線種の接続線113Aを選択する。
【0091】
表示出力部340は、選択された接続線113Aを用いて、各文献情報111A,112Aを接続することにより、表示画面350を生成する。生成された表示画面350は、通信ネットワークを介してクライアント端末に提供される。
【0092】
ユーザがクライアント端末を介して、接続線113Aを選択操作すると、この選択操作は、選択操作検出部360によって検出される。選択操作検出部360は、ユーザの選択操作を検出すると、文献情報分析装置1に分析開始を指示する。これにより、文献情報分析装置1は、上述のように、各文献情報111A,112Aを複数のブロックに分割し、対応するブロック同士を接続し、その内容を対比する。
【0093】
図10は、接続線表示形態管理テーブルT1の一例を示す説明図である。このテーブルT1には、例えば、複数のテーブルT1A,T1Bの少なくともいずれか一方を含めることができる。
一方のテーブルT1Aは、文献情報111A,112A間の距離に応じた線種を選択するためのものである。例えば、ユーザによって抽出された多数の文献情報群に基づいて設定される座標系において、第1文献情報111A,第2文献情報112Aの座標をそれぞれ求め、各文献情報111A,112A間の距離を算出可能な場合に、テーブルT1Aを使用することができる。このテーブルT1Aでは、例えば、距離に応じて線の太さや種類が異なるように設定されている。
【0094】
他方のテーブルT1Bは、文献情報111A,112Aの関連性に応じた線種を選択するためのものである。関連性としては、上述のように、分割出願や変更出願等のような法的関係を挙げることができる。このテーブルT1Bでは、両文献情報の関連に応じて、異なる色彩の接続線113Aが設定されている。
【0095】
なお、線の太さ及び色彩に限らず、例えば、接続線113Aを点滅させたり、アニメーション表示させてもよい。また、どのような表示形態で接続線113Aを表示させるかは、ユーザがカスタマイズ可能としてもよい。
【0096】
次に、図11は、本実施例の全体動作を示すフローチャートである。
まず、ユーザは、クライアント端末2のユーザインターフェースを介して、検索条件を入力する(S60)。検索条件は、例えば、「光触媒」等のようなキーワードを指定することにより、あるいは特許分類コードや文献の公開日等を指定することにより、行うことができる。
【0097】
関連性分析装置300は、クライアント端末2から検索条件を取得すると(S61)、この検索条件に基づいてインデックスデータベース33及び文献データベース31を検索し、検索条件に合致する文献情報を全て抽出する(S62)。より具体的には、ユーザから指定されたキーワードを有する文献情報を抽出するために、インデックスデータベース33が使用される。そして、指定されたキーワードを有する文献情報が特定されると、その文献情報が文献データベース31から読み出される。そして、抽出された結果は、関連性分析装置300からクライアント端末2に送信され(S63)、クライアント端末2の画面に表示される(S64)。
【0098】
ユーザは、クライアント端末2の画面を介して、抽出された文献の総数や文献名称等を確認し、少なくとも一つの文献情報(第1文献情報111A)を選択する(S65)。
関連性分析装置300は、書誌事項を解析することにより、ユーザによって選択された第1文献情報111Aに関連する第2文献情報112Aを全て抽出する(S66)。
【0099】
関連性分析装置300は、抽出された各第2文献情報112Aと第1文献情報111Aとの関連性に応じた接続線113Aを選択し(S68)、各文献情報111A,112A同士を接続して(S69)、クライアント端末の画面に表示させる(S70)。
【0100】
ユーザがいずれかの接続線113Aをクリック操作等して選択すると(S71)、関連性分析装置300は、文献情報分析装置1に分析開始を指示する(S72)。これにより、第1実施例で述べた処理が開始され、マップ100が生成される。
【0101】
なお、S60〜S64は省略可能である。即ち、ユーザは、第1文献情報111A及び第2文献情報112Aの文献番号をそれぞれ明示して指定することもできる。また、ユーザは、接続線113Aの選択操作に代えて、表示画面350に表示されるメニューを操作することにより、第1実施例で述べた処理に移行させることもできる。
【0102】
このように構成される本実施例では、関連する文献情報111A,112A間の関連性を視覚を通じて直感的に判断することができる。そして、両文献情報111A,112A間の関係を把握した上で、各文献情報111A,112Aをブロック単位で比較し、詳細に一致点や相違点を検討することができ、使い勝手が向上する。
【0103】
なお、本発明は、上述した実施の形態に限定されない。当業者であれば、本発明の範囲内で、種々の追加や変更等を行うことができる。例えば、第1実施例では、第1文献情報及び第2文献情報に含まれる単語群から座標系を決定する場合を述べたが、これに限らず、より多数の文献情報に含まれる単語群に基づいて座標系を決定してもよい。
また、第1実施例では、文献情報を複数のブロックに分割して対比する場合を述べたが、これに限らず、文献情報の全体を一つのブロックとして扱い、文献全体同士を対比させることもできる。
【図面の簡単な説明】
【0104】
【図1】本発明の実施形態に係る文献情報分析装置の全体を示す説明図である。
【図2】文献情報分析装置の機能ブロック図である。
【図3】文献情報分析装置のハードウェア及びソフトウェアの構成概要を示す説明図である。
【図4】文献情報分析方法の全体動作を示すフローチャートである。
【図5】文献情報を複数のブロックに分割してマップを生成するための処理を示すフローチャートである。
【図6】ブロック間の内容を対比させるための処理を示すフローチャートである。
【図7】ブロック間の対比結果の一例を示す説明図である。
【図8】マップ生成条件を指定するためのメニュー画面の一例を示す説明図である。
【図9】本発明の第2実施例に係る関連性分析装置を備えた文献情報分析装置の全体を示す説明図である。
【図10】接続線表示形態管理テーブルを示す説明図である。
【図11】全体動作を示すフローチャートである。
【符号の説明】
【0105】
1…文献情報分析装置、2…クライアント端末、10…マップ制御部、11…マップ生成条件入力受付部、12…文献情報分割部、13…ブロック座標算出部、14…ブロック間類似度判定部、15…マップ生成部、16…マップ表示部、20…対比制御部、21…接続線指定情報入力受付部、22…ブロック対比部、23…対比結果出力部、24…対比結果表示部、30…情報蓄積部、31…文献データベース、32…単語データベース、100…マップ、101A,101B…等高線、111,112…ブロック、300…関連性分析装置、310…文献選択部、320…関連性検出部、330…接続線選択部、340…表示出力部、350…表示画面、360…選択操作検出部

【特許請求の範囲】
【請求項1】
それぞれ電子化された複数の文献情報をそれぞれ記憶する文献情報記憶部と、
前記記憶された各文献情報のうちユーザにより選択された第1文献情報及び第2文献情報を前記文献情報記憶部からそれぞれ取得し、前記第1文献情報及び前記第2文献情報をそれぞれ所定単位のブロックとして処理させる文献情報取得部と、
少なくとも前記第1文献情報及び前記第2文献情報に含まれる単語群に基づいて決定される座標系において、前記各ブロックの座標をそれぞれ算出するブロック座標算出部と、
前記各ブロックの座標に基づいて前記各ブロックを配置し、かつ、前記各ブロックのうち前記第1文献情報に由来する所定の第1ブロックと前記第2文献情報に由来する所定の第2ブロックとを、両者の関連を示す表示要素で接続することによりマップ情報を生成するマップ生成部と、
生成された前記マップ情報を表示させるマップ表示部と、
を備えた文献情報分析装置。
【請求項2】
前記第1文献情報及び前記第2文献情報の全体をそれぞれ一つのブロックとして、または、前記第1文献情報及び前記第2文献情報を分割してなる複数の情報をそれぞれ一つのブロックとして設定される請求項1に記載の文献情報分析装置。
【請求項3】
前記マップ生成部は、前記第1ブロックと前記第2ブロックが所定距離以上離れている場合に、これら第1ブロック及び第2ブロック同士を、前記両者の関連を示す表示要素で接続する請求項2に記載の文献情報分析装置。
【請求項4】
前記マップ生成部は、前記所定距離以上離間している前記第1ブロックと前記第2ブロックとの少なくともいずれか一方が複数存在する場合、その中で最も近い第1ブロックと第2ブロックとを、前記両者の関連を示す表示要素で接続させる請求項3に記載の文献情報分析装置。
【請求項5】
前記関連を示す表示要素がユーザによって選択された場合、この選択された関連を示す表示要素によって接続されている前記第1ブロックの内容と前記第2ブロックの内容とを予め設定された所定のレベルで対比し、この対比結果を出力させるブロック対比部を備えた請求項4に記載の文献情報分析装置。
【請求項6】
前記ブロック対比部は、前記関連を示す表示要素で接続された前記第1ブロックの内容と前記第2ブロックの内容との相違部分を前記対比結果として出力させる請求項5に記載の文献情報分析装置。
【請求項7】
前記ブロック対比部は、前記両者の関連を示す表示要素で接続された前記第1ブロックの内容と前記第2ブロックの内容との共通部分を前記対比結果として出力させる請求項5に記載の文献情報分析装置。
【請求項8】
前記ブロック対比部は、単語レベル、句レベル、文レベルのうち前記ユーザによって選択された少なくともいずれか一つのレベルを前記所定のレベルとして、前記両者の関連を示す表示要素で接続された前記第1ブロックの内容と前記第2ブロックの内容とを対比する請求項5に記載の文献情報分析装置。
【請求項9】
前記ユーザによってそれぞれ選択される前記第1文献情報及び前記第2文献情報は互いに関連性を有しており、
前記文献情報取得部は、これら選択された前記第1文献情報及び前記第2文献情報のうち、前記ユーザによって選択された範囲のみを前記所定単位のブロックに分割する請求項2に記載の文献情報分析装置。
【請求項10】
前記複数の文献情報は、特許出願または実用新案登録出願に関する特許文献情報である請求項1に記載の文献情報分析装置。
【請求項11】
前記所定単位は、段落単位または請求項単位のいずれか又は両方である請求項10に記載の文献情報分析装置。
【請求項12】
コンピュータを、
文献情報記憶部に電子化されて記憶された複数の文献情報の中からユーザにより選択された第1文献情報及び第2文献情報をそれぞれ取得し、前記第1文献情報及び前記第2文献情報をそれぞれ所定単位のブロックに分割する文献情報分割手段と、
前記第1文献情報及び前記第2文献情報に含まれる単語群に基づいて決定される座標系において、前記各ブロックの座標をそれぞれ算出するブロック座標算出手段と、
前記各ブロックの座標に基づいて前記各ブロックを配置し、かつ、前記各ブロックのうち前記第1文献情報に由来する所定の第1ブロックと前記第2文献情報に由来する所定の第2ブロックとを、両者の関連を示す表示要素で接続することによりマップ情報を生成するマップ生成手段として、
それぞれ機能させるプログラム。
【請求項13】
文献情報記憶部に記憶された複数の文献情報の中からユーザによって選択された第1文献情報及び第2文献情報をそれぞれ取得するステップと、
前記第1文献情報及び前記第2文献情報をそれぞれ所定単位のブロックに分割するステップと、
前記第1文献情報及び前記第2文献情報に含まれる単語群に基づいて決定される座標系において、前記各ブロックの座標をそれぞれ算出するステップと、
前記各ブロックの座標に基づいて、前記各ブロックを前記座標系に従うマップ上にそれぞれ配置させるステップと、
前記マップに配置された各ブロックのうち前記第1文献情報に由来する所定の第1ブロックと前記第2文献情報に由来する所定の第2ブロックとを、両者の関連を示す表示要素で接続させるすることによりマップ情報を生成するステップと、
生成された前記マップ情報を表示させるステップと、
前記ユーザによって前記両者の関連を示す表示要素が選択された場合には、この選択された関連を示す表示要素によって接続されている前記第1ブロックの内容と前記第2ブロックの内容とを予め設定された所定のレベルで対比し、この対比結果を出力させるステップと、を含む文献情報分析方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate


【公開番号】特開2007−133587(P2007−133587A)
【公開日】平成19年5月31日(2007.5.31)
【国際特許分類】
【出願番号】特願2005−325036(P2005−325036)
【出願日】平成17年11月9日(2005.11.9)
【出願人】(000155469)株式会社野村総合研究所 (1,067)
【Fターム(参考)】