説明

技術評価装置、技術評価方法、及びプログラム

【課題】技術を評価する新たな方法及び装置を提供する。
【解決手段】キーワード含有文書数算出部310は、複数の技術文書それぞれの文書データを処理し、複数のキーワードそれぞれごとに、当該キーワードを含む文書データの数であるキーワード含有文書数を、文書データが作成された期間又は公開された期間別に算出する。出現率算出部320は、キーワード含有文書数が属する期間に作成された文書データの数で当該キーワード含有文書数を除した値である出現率を、キーワード別かつ期間別に算出し、さらに出現率差分をキーワード別かつ期間別に算出する。キーワード流行度算出部330は、キーワードごとに、出現率差分の最大値と最小値の差の二乗値に比例していて正負が出現率差分に一致した値であるキーワード流行度を算出する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、技術を早い時期に評価することができる技術評価装置、技術評価方法、及びプログラムに関する。
【背景技術】
【0002】
近年は知的財産の重要性が増している。知的財産の内容は特許公報などの技術文書により定められるが、技術文書の数は膨大である。このため、知的財産の価値をコンピュータにより客観的に評価する技術の開発が望まれている。
【0003】
特許文献1には、ある技術の出願件数を横軸にとり、縦軸にその技術の出願件数の伸び率をとった図を描き、期間ごとの推移状況をその図の中に描き、図中の位置に基づいて、その技術の発達レベルを判定する方法が開示されている。また特許文献1には、上記した図を極座標変換した後に、前の期間からその期間までの移動の角度によってその技術の発達レベルを判定する方法も開示されている。
【0004】
また知的財産の価値を評価する技術ではないが、特許文献2には、検索語ランキング方法において、一定期間内における単語の入力頻度に加え、長期間出現し続ける単語よりも新しく出現したランキング評価値が高くなるように出現期間における重み付けを行い、さらに入力頻度が増加傾向にある単語ほどランキング評価値が高くなるように重み付けを行う方法が開示されている。
【特許文献1】特開2005−301389号公報
【特許文献2】特開2005−309760号公報
【発明の開示】
【発明が解決しようとする課題】
【0005】
技術の価値を早い時期で評価できるようになれば、企業の経営資源を重点的に投入すべき技術を早い時期で選択できるようになる。
【0006】
本発明は上記事情に鑑みてなされたものであり、その目的とするところは、技術を早い時期に評価することができる技術評価装置、技術評価方法、及びプログラムを提供することにある。
【課題を解決するための手段】
【0007】
本発明によれば、技術に関するキーワード別に、当該キーワードが技術トレンドに乗っているか否かを示すキーワード流行度を算出する技術評価装置であって、
複数の技術文書それぞれの文書データからキーワードを含む前記文書データを選択する処理を複数の前記キーワード別に行うことにより、前記複数のキーワードそれぞれごとに、前記キーワードを含む前記文書データの数であるキーワード含有文書数を、前記文書データが作成された期間別又は公開された期間別に算出するキーワード含有文書数算出部と、
前記キーワード含有文書数が属する前記期間に作成された前記文書データの数で当該キーワード含有文書数を除した値を示す出現率を、前記キーワード別かつ前記期間別に算出し、かつ当該期間の前記出現率から一つ前の前記期間の前記出現率を引いた値である出現率差分を前記キーワード別かつ前記期間別に算出する出現率算出部と、
いずれかの前記期間におけるいずれかの前記キーワードの前記キーワード流行度を算出するキーワード流行度算出部であって、当該期間及びこれ以前の前記期間それぞれに対応する複数の前記出現率差分のうち最大値と最小値を選択し、選択した前記最大値と前記最小値の差の二乗値に比例していて正負が前記出現率差分に一致した値を前記キーワード流行度として算出するキーワード流行度算出部と、
を備える技術評価装置が提供される。
【0008】
この発明によれば、前記キーワード流行度は、前記出現率差分の最大値と最小値を用いて算出される。このため、2つの前記期間における前記出現率差分があれば前記キーワード流行度を算出することができる。2つの前記期間における前記出現率差分を算出するためには、3つの前記期間における前記出現率を算出すればよい。このため、前記キーワード流行度を算出するためには3つの前記期間における前記出現率を算出すればよく、このため、新たな技術を示す新たなキーワードが出てきた場合に、そのキーワードに対応する前記キーワード流行度を3期間後に算出することができる。従って、技術を早い時期に評価することができる。
【0009】
上記技術評価装置において処理対象となる技術文書を示す処理対象文書データを取得し、前記処理対象文書データに含まれる前記キーワードをすべて選択し、選択した前記キーワードそれぞれの前記キーワード流行度を処理することにより、前記処理対象文書データのいずれかの前記期間における流行度である文書流行度を算出する文書流行度算出部を備えてもよい。この場合は、前記キーワード流行度が算出されていれば、処理対象となる技術文書が示す技術の価値を示す前記文書流行度を、処理対象となる技術文書が出た直後に算出することができる。このため、処理対象となる技術文書が示す技術の価値を早い時期に評価することができる。
【0010】
この場合、前記技術文書は、例えば公開特許公報、特許公報、公開実用新案公報、又は実用新案公報とすると、これら公報が示す知的財産の価値を早い時期に評価することができる。
【0011】
前記文書流行度算出部は、例えば、選択した前記キーワードの当該期間における前記キーワード流行度の平均値を算出することにより、前記処理対象文書データの前記文書流行度を算出する。前記平均値の算出に必要な演算処理は、例えば前記キーワード流行度を加算するための演算と、この加算値を前記キーワード数で割る演算のみである。このため、少ない演算量で前記文書流行度を算出することができる。
【0012】
前記文書流行度算出部を備える場合、前記技術評価装置は、前記処理対象文書データに含まれる単語を抽出することにより、前記複数のキーワードを生成するキーワード生成部を備えてもよい。この場合、前記文書流行度を算出するのに必要な単語を確実に前記キーワードと設定することができる。
【0013】
前記文書流行度を備える場合、前記技術評価装置は、前記処理対象文書データに含まれる全ての前記キーワードのいずれかの前記期間における前記出現率差分を取得し、前記出現率差分の分布を生成する差分分布生成部と、
前記期間別の前記出現率差分の分布を正規分布で近似し、当該近似における分散を、当該期間における前記処理対象文書データの変動度として算出する文書変動度算出部とを備えてもよい。
この場合、前記変動度と前記文書流行度を組み合わせて処理対象となる技術文書が示す技術の価値を判定することができるため、判定精度が高くなる。例えば文書変動度算出部は、正規分布としてマクセル・ボルツマン分布を用いた場合、分散として、温度を示す値であるTを用いる。
【0014】
前記文書流行度及び前記変動度を算出する場合、前記技術評価装置は、前記文書流行度及び前記変動度を2軸としたグラフを生成し、当該グラフ内における前記処理対象文書データの位置を、少なくとも一つの前記期間においてプロットするグラフ生成部を備えてもよい。この場合、処理対象となる技術文書が示す技術の価値を視覚的に把握することができる。
【0015】
前記文書流行度及び前記変動度を算出し、かつ前記技術文書はいずれも公開特許公報、特許公報、公開実用新案公報、又は実用新案公報である場合、前記技術評価装置は、前記文書流行度算出部及び前記文書変動度算出部は、同一の出願人による複数の公開特許公報をそれぞれ前記処理対象文書データとして処理し、
前記文書流行度及び前記変動度を2軸としたグラフを期間別に生成し、前記複数の処理対象文書データそれぞれの位置を前記期間別のグラフにプロットするグラフ生成部を備えてもよい。
この場合、前記期間別のグラフを比較することにより、前記出願人が開発した技術の価値を期間別に把握することができる。
【0016】
前記文書流行度及び前記変動度を算出する場合、前記技術評価装置は、当該期間の前記文書流行度から一つ前の前記期間の前記文書流行度を引いた値である文書流行度差分を第1の成分とし、当該期間の前記変動度から一つ前の前記期間の前記変動度を引いた値を第2の成分としたベクトルである移動ベクトルを生成する移動ベクトル算出部と、
前記移動ベクトルが属する象限に基づいて、前記処理対象文書データが示す技術文書の流行性を判定する流行性判定部と、
を備えてもよい。
この場合、前記移動ベクトルが属する象限に基づいて技術文書の流行性を判定することができる。前記移動ベクトルが属する象限は、前記第1の成分の正負と、前記第2の成分の正負によって判定することができる。従って、流行性の判定に必要な演算量が少なくてすむ。
【0017】
本発明によれば、技術に関する処理対象文書の流行性を示す変動度を算出する技術評価装置であって、
複数の技術文書それぞれの文書データを処理し、前記処理対象文書に含まれる複数のキーワードそれぞれごとに、当該キーワードを含む前記文書データの数であるキーワード含有文書数を、前記文書データが作成された期間別又は公開された期間別に算出するキーワード含有文書数算出部と、
前記キーワード含有文書数が属する前記期間に作成された前記文書データの数で当該キーワード含有文書数を除した値を示す出現率を、前記キーワード別かつ前記期間別に算出し、かつ当該期間の前記出現率から一つ前の前記期間の前記出現率を引いた値である出現率差分を前記キーワード別かつ前記期間別に算出する出現率算出部と、
いずれかの前記期間において前記複数のキーワードにおける前記出現率差分の分布を生成する差分分布生成部と、
前記出現率差分の分布を正規分布で近似し、当該近似における分散を、当該期間における前記処理対象文書の変動度として算出する文書変動度算出部と、
を備える技術評価装置が提供される。
【0018】
この技術評価装置によれば、前記変動度を算出するためには、一つの前記期間における前記出現率差分があればよい。一つの前記期間における前記出現率差分を算出するためには、2つの前記期間における前記出現率を算出すればよい。このため、前記キーワード流行度を算出するためには2つの前記期間における前記出現率を算出すればよく、このため、新たな技術を示す新たな技術文書が出てきた場合に、その技術文書の前記変動度を2期間後に算出することができる。従って、技術を早い時期に評価することができる。
【0019】
本発明によれば、技術に関するキーワードが技術トレンドに乗っているか否かを示すキーワード流行度を算出する技術評価方法であって、
コンピュータが、複数の技術文書それぞれの文書データを処理し、複数のキーワードそれぞれごとに、当該キーワードを含む前記文書データの数であるキーワード含有文書数を、前記文書データが作成された期間別に算出し、
コンピュータが、前記キーワード含有文書数が属する前記期間に作成された前記文書データの数で当該キーワード含有文書数を除した値を示す出現率を、前記キーワード別かつ前記期間別に算出し、
コンピュータが、当該期間の前記出現率から一つ前の前記期間の前記出現率を引いた値である出現率差分を前記キーワード別かつ前記期間別に算出し、
コンピュータが、いずれかの前記期間におけるいずれかの前記キーワードの前記キーワード流行度を算出する際に、当該期間及びこれ以前の前記期間それぞれに対応する複数の前記出現率差分のうち最大値と最小値を選択し、選択した前記最大値と前記最小値の差の二乗値に比例していて正負が前記出現率差分に一致した値を前記キーワード流行度として算出する技術評価方法が提供される。
【0020】
本発明によれば、技術に関する処理対象文書の流行性を示す変動度を算出する技術評価方法であって、
コンピュータが、複数の技術文書それぞれの文書データを処理し、前記処理対象文書に含まれる複数のキーワードそれぞれごとに、当該キーワードを含む前記文書データの数であるキーワード含有文書数を、前記文書データが作成された期間別又は公開された期間別に算出し、
コンピュータが、前記キーワード含有文書数が属する前記期間に作成された前記文書データの数で当該キーワード含有文書数を除した値を示す出現率を、前記キーワード別かつ前記期間別に算出し、
コンピュータが、当該期間の前記出現率から一つ前の前記期間の前記出現率を引いた値である出現率差分を前記キーワード別かつ前記期間別に算出し、
コンピュータが、いずれかの前記期間において前記複数のキーワードにおける前記出現率差分の分布を生成し、
コンピュータが、前記出現率差分の分布を正規分布で近似し、当該近似における分散を、当該期間における前記処理対象文書の変動度として算出する技術評価方法が提供される。
【0021】
本発明によれば、コンピュータを、技術に関するキーワードが技術トレンドに乗っているか否かを示すキーワード流行度を算出する装置として機能させるプログラムであって、
前記コンピュータに、
複数の技術文書それぞれの文書データを処理し、複数のキーワードそれぞれごとに、当該キーワードを含む前記文書データの数であるキーワード含有文書数を、前記文書データが作成された期間別に算出する機能と、
前記キーワード含有文書数が属する前記期間に作成された前記文書データの数で当該キーワード含有文書数を除した値を示す出現率を、前記キーワード別かつ前記期間別に算出する機能と、
当該期間の前記出現率から一つ前の前記期間の前記出現率を引いた値である出現率差分を前記キーワード別かつ前記期間別に算出する機能と、
いずれかの前記期間におけるいずれかの前記キーワードの前記キーワード流行度を算出する機能であって、当該期間及びこれ以前の前記期間それぞれに対応する複数の前記出現率差分のうち最大値と最小値を選択し、選択した前記最大値と前記最小値の差の二乗値に比例していて正負が前記出現率差分に一致した値を前記キーワード流行度として算出する機能と、
を実現させるプログラムが提供される。
【0022】
本発明によれば、コンピュータを、技術に関する処理対象文書の流行性を示す変動度を算出する装置として機能させるプログラムであって、
前記コンピュータに、
複数の技術文書それぞれの文書データを処理し、前記処理対象文書に含まれる複数のキーワードそれぞれごとに、当該キーワードを含む前記文書データの数であるキーワード含有文書数を、前記文書データが作成された期間別又は公開された期間別に算出する機能と、
前記キーワード含有文書数が属する前記期間に作成された前記文書データの数で当該キーワード含有文書数を除した値を示す出現率を、前記キーワード別かつ前記期間別に算出する機能と、
当該期間の前記出現率から一つ前の前記期間の前記出現率を引いた値である出現率差分を前記キーワード別かつ前記期間別に算出する機能と、
いずれかの前記期間において前記複数のキーワードにおける前記出現率差分の分布を生成する機能と、
前記出現率差分の分布を正規分布で近似し、当該近似における分散を、当該期間における前記処理対象文書の変動度として算出する機能と、
を実現させるプログラムが提供される。
【発明の効果】
【0023】
本発明によれば、キーワード又は文書が示す技術の価値を早い時期に評価することができる。
【発明を実施するための最良の形態】
【0024】
以下、本発明の実施の形態について、図面を用いて説明する。尚、すべての図面において、同様な構成要素には同様の符号を付し、適宜説明を省略する。
【0025】
図1は、実施形態にかかる技術評価装置の構成を示すブロック図である。この技術評価装置は、技術に関するキーワード別に、当該キーワードが技術トレンドに乗っているか否かを示すキーワード流行度を算出する技術評価装置である。この技術評価装置は、キーワード含有文書数算出部310、出現率算出部320、及びキーワード流行度算出部330を備える。キーワード含有文書数算出部310は、複数の技術文書それぞれの文書データからキーワードを含む文書データを選択する処理を複数のキーワード別に行うことにより、複数のキーワードそれぞれごとに、キーワードを含む文書データの数であるキーワード含有文書数を、文書データが作成された期間別又は公開された期間別に算出する。出現率算出部320は、キーワード含有文書数が属する期間に作成された文書データの数で当該キーワード含有文書数を除した値である出現率を、キーワード別かつ期間別に算出し、さらに当該期間の出現率から一つ前の期間の出現率を引いた値である出現率差分をキーワード別かつ期間別に算出する。キーワード流行度算出部330は、キーワードごとに、当該期間及びこれ以前の前記期間それぞれに対応する複数の出現率差分のうち最大値と最小値を選択し、この最大値と最小値の差の二乗値に比例していて正負が出現率差分に一致した値であるキーワード流行度を算出する。以下、技術文書を公開特許公報として詳細に説明するが、技術文書はこれに限定されず、例えば特許公報、公開実用新案公報、及び実用新案公報なども含まれる。また以下の説明においては、期間として年を用いるが、これは一例に過ぎず、2年以上を一つの期間としても良いし、月単位で期間を設定しても良い。
【0026】
図1に示した技術評価装置は、さらに、データ記憶部として文書データ記憶部110及びキーワード記憶部120を備えており、機能部として入力部210、処理対象文書データ選択部220、キーワード生成部230、文書流行度算出部340、差分分布生成部410、文書変動度算出部420、グラフ生成部430、移動ベクトル算出部440、及び流行性判定部450を備える。
【0027】
文書データ記憶部110は、文書データ及び文書データに関する複数種類の情報を記憶している。キーワード記憶部120は、キーワードそれぞれごとにそのキーワードに関する複数種類の情報を記憶している。これら記憶部が記憶しているデータの構成は、テーブルを用いて後述する。
【0028】
入力部210は、技術評価装置の操作者が技術評価装置にデータや命令を入力する機能を有する。処理対象文書データ選択部220は、文書データ記憶部110から処理対象公報の文書データを読み出す。キーワード生成部230は、文書データを処理することによりキーワードを生成する。文書流行度算出部340は、処理対象公報の流行度である文書流行度を算出する。差分分布生成部410は、複数のキーワードにおける出現率差分の分布を期間別に生成する。すなわち差分分布生成部410は、複数のキーワードそれぞれの出現率差分を取得し、これら複数の出現率差分の分布を示すデータを生成する処理を、期間別(本実施形態では年別)に行う。文書変動度算出部420は、期間別の出現率差分の分布それぞれを正規分布で近似し、当該近似における分散を、期間別の処理対象公報の変動度として算出する。グラフ生成部430は、文書流行度及び変動度を2軸としたグラフを生成する。移動ベクトル算出部440は、ある期間の文書流行度から一つ前の期間の文書流行度を引いた値である文書流行度差分を第1の成分とし、当該期間の文書流行度差分から一つ前の期間の文書流行度差分を引いた値を第2の成分としたベクトルである移動ベクトルを生成する。この移動ベクトルは、処理対象公報の流行性を示す指標となる。
【0029】
これら各機能部が行う処理は、フローチャートを用いて後述する。またこれら各機能部は、例えばCPU(Central Processing Unit)及びメモリ(ROM(Read Only Memory)、RAM(Random Access Memory)等)で実現される。詳細には、上記した各機能部は、例えばCPUがROMに格納されたプログラムを実行することにより実現される。
【0030】
図2は、文書データ記憶部110が記憶しているデータの構成をテーブル形式で示す図である。文書データ記憶部110は、公開特許公報それぞれごとに、その公開特許公報の文書データ、出願年月日(すなわち作成された期間)、及びIPCを記憶している。文書データ記憶部110は、公開特許公報の書誌的事項のすべてを記憶していても良い。また文書データ記憶部110は、技術評価装置で処理した公開特許公報については、流行度、変動度、流行度及び変動度の移動ベクトル、並びに突発性流行期であるか否かを示すフラグを、年別に記憶している。図2における流行度は、その文書データが示す技術文書の流行度であり、詳細を後述する。変動度は、図1に示した文書変動度算出部420が算出する値であり、詳細を後述する。移動ベクトルは、移動ベクトル算出部440が算出するベクトルであり、流行度及び変動度それぞれの前期間からの差分(正負を含む)を示している。変動度及び移動ベクトルの算出方法については後述する。突発性流行期であるとは、その年に急激に流行性が増大したことを示している。突発性流行期であるか否かの判定方法については後述する。
【0031】
図3は、キーワード記憶部120が記憶しているデータの構成をテーブル形式で示す図である。キーワード記憶部120は、キーワード番号別に、そのキーワードに対応するキーワード、キーワード含有文書数、出現率、出現率差分、出現率及びその差分の移動ベクトル、そのキーワードが流行しているか衰退しているかを示すデータ、並びにキーワード流行度を記憶している。そのキーワードが流行しているか衰退しているかを判定する方法は、後述する。
【0032】
図4は、図1に示した技術評価装置が行う処理を示すフローチャートである。この図に示す例において、文書データ記憶部110には、複数の特許公報の文書データ、出願年月日、及びIPCが予め記憶されている。まず技術評価装置の操作者は、入力部210に、処理対象文書としての処理対象公報を特定する情報(例えば出願番号又は公開番号)を入力する。入力部210は、入力された情報を処理対象文書データ選択部220に出力する。
【0033】
処理対象文書データ選択部220は、文書データ記憶部110に記憶されている文書データ、IPC、及び出願年月日のうち、処理対象文書データ選択部220から入力された処理対象公報を特定する情報に対応する文書データ、IPC、及び出願年月日を読み出し、読み出した文書データ、IPC、及び出願年月日を処理対象公報の各データとしてキーワード生成部230に出力する(S10)。次いでキーワード生成部230は、処理対象公報の文書データを解析することにより、処理対象公報に含まれるすべての単語をキーワードとして抽出し、抽出したキーワードにキーワード番号を付してキーワード記憶部120に記憶させる(S20)。ここで行う解析は、例えば分かち書きである。このように、本実施形態で処理対象公報の文書データに基づいてキーワードを選定している。このため、後述する文書流行度を算出する処理に必要な単語を、確実にキーワードと設定することができる。
【0034】
そしてキーワード生成部230は、処理対象文書データ選択部220から入力されたIPC及び出願年月日をキーワード含有文書数算出部310に出力する。
【0035】
次いでキーワード含有文書数算出部310は、文書データ記憶部110から、キーワード生成部230から入力されたIPCと同一のIPCに対応づけて文書データ記憶部110に記憶されている公開特許公報の文書データ及び出願年月日の組み合わせをすべて読み出し、母集団となる特許公報群を生成する(S30)。このときキーワード含有文書数算出部310は、特許公報群に含まれる文書データの出願年月日に含まれるすべての出願年を抽出することにより、出願年情報を生成する。例えば特許公報群に含まれる出願年月日が1996年〜2002年の各年を示していた場合、出願年情報は、1996年〜2002年の各年になる。なお本実施形態では母集団となる特許公報群をIPCに基づいて生成したが、Fタームや特定のキーワードなど、他の情報に基づいて生成しても良い。
【0036】
次いでキーワード含有文書数算出部310及び出現率算出部320は、キーワードごとに、出現率、及びその年の出現率から前年の出現率を引いた値である出現率差分を年別に算出し、算出した出現率差分をキーワード記憶部120に記憶させる(S40)。この処理の詳細はフローチャートを用いて後述する。
【0037】
次いでキーワード流行度算出部330は、キーワードごとに、出現率の変化ベクトルを年別に生成し、そのキーワードが流行しているか衰退しているかを年別に判定する。出現率の変化ベクトルは2次元ベクトルであり、設定された年の出現率差分を第1の成分としており、設定された年の出現率差分から前年の出現率差分を引いた値を第2の成分としている。そしてキーワード流行度算出部330は、変化ベクトル及び判定結果をキーワード記憶部120に記憶させる(S50)。この処理の詳細はフローチャートを用いて後述する。
【0038】
次いでキーワード流行度算出部330は、キーワードごとの流行度であるキーワード流行度を年別に算出し、算出したキーワード流行度をキーワード記憶部120に記憶させる(S60)。この処理の詳細はフローチャートを用いて後述する。
【0039】
次いで文書流行度算出部340は、処理対象公報の流行度である文書流行度を年別に算出し、算出した文書流行度を文書データ記憶部110に記憶させる(S70)。この処理の詳細はフローチャートを用いて後述する。
【0040】
また差分分布生成部410及び文書変動度算出部420は、処理対象公報の変動度を年別に算出し、算出した変動度を文書データ記憶部110に記憶させる(S80)。この処理の詳細はフローチャートを用いて後述する。S80の処理は、S40に示した処理が行われた後では、どのタイミングで行われても良いが、例えば入力部210に開始指令が入力されることをトリガーとして、処理が開始されても良い。
【0041】
次いでグラフ生成部430及び移動ベクトル算出部440は、処理対象公報の年別の文書流行度及び変動度を用いて、文書流行度及び変動度を成分としたグラフ及び移動ベクトルを生成する(S90)。この処理の詳細については、図を用いて後述する。
【0042】
次いで流行性判定部450は、S90で生成した移動ベクトルに基づいて、処理対象公報が示す技術のトレンドを年別に判定する。そしてトレンドが突発性流行期であった場合に、突発性流行期であることを示すフラグを文書データ記憶部110にたてる(S100)。この処理の詳細については、図を用いて後述する。
【0043】
図5は、図4のS40で行う処理の詳細を示すフローチャートである。まずキーワード含有文書数算出部310は、S30で生成した特許公報群を構成する文書データを、出願年月日が示す出願年別に分類し、出願年別特許公報群を生成する(S410)。次いでキーワード含有文書数算出部310は、キーワード番号の初期値としての1を指定する(S415)。次いでキーワード含有文書数算出部310は、キーワード記憶部120が記憶しているキーワードのうち指定されたキーワード番号に対応するキーワードを読み出し(S420)、出願年別特許公報群ごとに、選択したキーワードを含む特許公報の文書データの数をカウントする。そしてキーワード含有文書数算出部310は、出願年別特許公報群ごとのカウント結果(すなわちカウント数)を年別のキーワード含有文書数としてキーワード記憶部120に記憶させる(S430)。ここでキーワード含有文書数算出部310は、文書データの中に選択したキーワードが一つ以上含まれている場合、その文書データすなわち特許公報がそのキーワードを含むと判定する。このようにすると、後述するように、変動度の算出処理において、変動度がこれから上昇することを示すシグナルを検出することができる。ただし、必要に応じて、定数t(t≧2)を予め定めておき、文書データの中にt回以上そのキーワードが使用されている場合に、その文書データすなわち特許公報がそのキーワードを含むと判定するようにしても良い。
【0044】
次いで出現率算出部320は、出願年別特許公報群それぞれごとに、出願年別特許公報群に含まれる文書データの数(n0)をカウントする。次いで出現率算出部320は、キーワード含有文書数算出部310が生成した出願年情報に含まれる各年について、キーワード含有文書数(n)を、その年の出願年別特許公報群に含まれる文書データの数(n0)で除する処理を行う。これにより、出願年情報に含まれる年それぞれごとに出現率(すなわちn/n0)が算出される。具体的には、出現率算出部320は出願年情報に含まれる年のうち最も古い出願年を設定出願年の初期値として指定し、設定出願年に対応する出現率を算出する。その後、設定出願年が出願年情報に含まれる年のうちの最新年でない場合に、設定出願年を次の年に変更し、新たな設定出願年における出現率を算出する。この処理を、設定出願年が出願年の最新年になるまで繰り返す。ここで出現率算出部320は、Log(n/n0)を出現率として算出しても良い。
【0045】
そして出現率算出部320は、キーワード含有文書数算出部310が生成した出願年情報に含まれる各年について、当該年の出現率から前年の出現率を引いた値である出現率差分を算出し、算出した出現率差分及び出現率を年別にキーワード記憶部120に記憶させる(S440)。ここで、出現率差分は、出現率の差の大きさを示す絶対値に、出現率が前年に対して増大したか減少したかを示す正負を付したものである。キーワード含有文書数算出部310及び出現率算出部320は、指定されているキーワード番号がキーワード記憶部120に記憶されているキーワード番号の最大値より小さい場合、すなわちS420〜S440に示した処理を行っていないキーワードがある場合(S450:No)、キーワード番号を一つ増加させた(S455)上で、S420に戻る。また指定されているキーワード番号が最大値である場合、すなわちS420〜S440に示した処理を行っていないキーワードがない場合(S450:Yes)、出現率算出部320は、処理が終了した旨の信号をキーワード流行度算出部330に出力する。
【0046】
図6は、図4のS50に示した処理の詳細を示すフローチャートである。キーワード流行度算出部330は、出現率算出部320から処理を終了した旨の信号を受信すると、キーワード番号の初期値として1を指定する(S510)。次いでキーワード流行度算出部330は、キーワード記憶部120から、指定されたキーワード番号に対応して記憶されている年別の出現率及び出現率差分を読み出し、出現率と出現率差分それぞれの変化を示す移動ベクトルを年別に算出し、算出した移動ベクトルをキーワード記憶部120に記憶させる。この処理において、キーワード流行度算出部330は、まず出願年情報に含まれる出願年のうち最も古い出願年の次の年を設定出願年の初期値として指定し、設定出願年に対応する移動ベクトルを算出する。具体的には、移動ベクトルのx成分は、設定された年の出現率から前年の出現率を引いた値(絶対値のみではなく正負も含む)であり、移動ベクトルのy成分は、設定された年の出現率差分から前年の出現率差分を引いた値(絶対値のみではなく正負も含む)である。その後、設定出願年が出願年情報に含まれる年のうちの最新年でない場合に、設定出願年を次の年に変更する。これらの処理を、設定出願年が出願年の最新年になるまで繰り返す。(S520)。
【0047】
次いでキーワード流行度算出部330は、移動ベクトルが属する象限に基づいてキーワードの流行/衰退を年別に判定してキーワード記憶部120に記憶させる(S530)。この処理の詳細については図7(a)を用いて後述する。そしてキーワード流行度算出部330は、指定されているキーワード番号がキーワード記憶部120に記憶されているキーワード番号の最大値より小さい場合、すなわちS520〜S530に示した処理を行っていないキーワードがある場合(S540:No)、キーワード番号を一つ増加させた(S550)上で、S520に戻る。また指定されているキーワード番号が最大値である場合、すなわちS520〜S530に示した処理を行っていないキーワードがない場合(S540:Yes)、キーワード流行度算出部330は、S60に示した処理を行う。
【0048】
図7(a)は、キーワード流行度算出部330がキーワードの流行/衰退を判定する方法を説明する図である。本図に示すように、キーワード流行度算出部330は、そのキーワードを含む公報数が前年より増加して出現率差分が正となった場合、すなわちS520で算出した移動ベクトルが第1象限及び第4象限に属しているとき、そのキーワードは流行していると判定する。またキーワード流行度算出部330は、そのキーワードを含む公報数が前年より減少して出現率差分が負となった場合、すなわちS520で算出した移動ベクトルが第2象限及び第3象限に属しているとき、そのキーワードは衰退していると判定する。
【0049】
さらに詳細には、キーワード流行度算出部330は、移動ベクトルが第1象限に属しているとき、そのキーワードの流行が加速していると判定し、移動ベクトルが第4象限に属しているとき、そのキーワードの流行が鈍化していると判定する。またキーワード流行度算出部330は、移動ベクトルが第3象限に属しているとき、そのキーワードの衰退が加速していると判定し、移動ベクトルが第2象限に属しているとき、そのキーワードの衰退が解消に向かっていると判定する。
【0050】
図7(b)は、キーワード流行度算出部330が年別に算出した移動ベクトルをつなげたグラフであり、例えばキーワード流行度算出部330によって生成される。このグラフは、縦軸に出現率差分の差分を、横軸に出現率差分をとっている。本図において、出現率はLog(n/n0)として定義されている。このようなグラフを生成することにより、そのキーワードがどのように流行/衰退したかを視覚的に把握することができる。
【0051】
図8は、図4のS60に示した処理の詳細を示すフローチャートである。この処理において、キーワード流行度を算出すべき年の範囲は、入力部210から入力されても良いし、キーワード流行度算出部330が、出現率差分が格納されているすべての年を、キーワード流行度を算出すべき年の範囲として認識しても良い。
【0052】
まずキーワード流行度算出部330は、キーワード番号の初期値として1を指定し(S610)、また出願年情報に含まれる年のうち最も古い年の次の年を設定する(S620)。次いでキーワード流行度算出部330は、指定されたキーワード番号に対応してキーワード記憶部120に記憶されている出現率差分のうち、設定された年及びその年以前の各年の出現率差分を、キーワード記憶部120から読み出す。次いでキーワード流行度算出部330は、読み出した出現率差分の最大値及び最小値を選択する(S630)。
【0053】
次いでキーワード流行度算出部330は、選択した最大値と最小値の差分を算出し、さらにこの差分の二乗値の大きさを示す値(例えば二乗値/8)を算出する。次いでキーワード流行度算出部330は、算出した値に、設定された年の出現率差分の正負に一致させることにより、設定された年におけるそのキーワードのキーワード流行度を算出し、キーワード記憶部120に記憶させる(S640)。具体的には、キーワード流行度算出部330は、設定された年の出現率差分が正の場合は、二乗値の大きさを示す値をそのままキーワード流行度とする。またキーワード流行度算出部330は、設定された年の出現率差分が負の場合は、二乗値の大きさを示す値に−1を乗じた値をキーワード流行度とする。
【0054】
キーワード流行度算出部330は、設定された出願年が出願年情報に含まれる年のうちの最新年でない場合(S650:No)に、設定出願年を次の年に変更し(S660)、S630に戻る。またキーワード流行度算出部330は、設定出願年が出願年の最新年である場合(S650:Yes)、現在設定されているキーワード番号について処理を終了する。
【0055】
キーワード流行度算出部330は、指定されているキーワード番号がキーワード記憶部120に記憶されているキーワード番号の最大値より小さい場合、すなわちS620〜S660に示した処理を行っていないキーワードがある場合(S670:No)、キーワード番号を一つ増加させた(S680)上で、S620に戻る。また指定されているキーワード番号が最大値である場合、すなわちS620〜S660に示した処理を行っていないキーワードがない場合(S670:Yes)、キーワード流行度算出部330は、処理が終了した旨を示す信号を文書流行度算出部340に出力する。
【0056】
このように、キーワード流行度は、出現率差分の最大値と最小値を用いて算出される。このため、2つの年における出現率差分があればキーワード流行度を算出することができる。2つの年における出現率差分を算出するためには、3つの年における出現率を算出すればよい。このため、キーワード流行度を算出するためには3つの年における出現率を算出すればよく、このため、新たな技術を示す新たなキーワードが出てきた場合に、そのキーワードに対応するキーワード流行度を3年後に算出することができる。従って、技術を早い時期に評価することができる。
【0057】
図9の各図は、キーワード流行度算出部330が算出するキーワード流行度の妥当性を説明する図である。キーワード流行度算出部330が算出するキーワード流行度の大きさは、図9(a)に示すbの二乗値の大きさを示している。キーワードが技術のトレンドに乗っているか否かは、技術の流行や衰退などの一連の推移によるため、力学モデルで近似することが可能である。キーワード流行度算出部330は、力学モデルとしてばね型の調和振動子を適用している。
【0058】
図9(b)は、ばね型の調和振動子の速度及び位置の関係を示す図である。速度は位置の微分値であるが、上記した出現率を調和振動子における位置と仮定した場合、上記した出現率差分を調和振動子における速度と見なすことができる。このため、キーワード流行度算出部330が算出するキーワード流行度の大きさは、調和振動子における運動エネルギーに相当し、その大きさが大きいほどそのキーワードの流行の勢いが大きいと見なすことができる。また調和振動子において、過去に大きな速度を伴った運動が短い間でもあった場合は、調和振動子の運動エネルギーに反映される。このため、本実施形態のように力学モデルとしてばね型の調和振動子を適用すると、例えば短い期間(例えば1年)のみそのキーワードが多用されていた場合でも、キーワード流行度が大きくなるため、キーワード流行度に基づいてそのキーワードを検出することができる。
【0059】
図10は、図4のS70に示した処理の詳細を示すフローチャートである。文書流行度算出部340は、キーワード記憶部120からすべてのキーワード流行度を、出願年情報に含まれるすべての年について読み出す(S710)。次いで文書流行度算出部340は、読み出したキーワード流行度に基づいて、処理対象公報の年別の文書流行度を、出願年情報に含まれる年それぞれごとに算出し、文書データ記憶部110に記憶させる(S720)。具体的には、文書流行度算出部340は出願年情報に含まれる年のうち最も古い出願年の次の年を設定出願年の初期値として指定し、設定出願年に対応しているキーワード出現率の平均値を、設定出願年における文書流行度として算出する。その後、設定出願年が出願年情報に含まれる年のうちの最新年でない場合に、設定出願年を次の年に変更し、新たな設定出願年における文書流行度を算出する。これらの処理を、設定出願年が出願年の最新年になるまで繰り返す。
【0060】
上記したようにキーワード流行度は、3年分のデータがあれば算出することができる。この3年分のデータは、出願年以前のデータであっても良い。従って、処理対象公報が示す技術の価値を示す文書流行度を、処理対象公報が公開された直後に算出することができる。このため、処理対象公報が示す技術の価値を早い時期に評価することができる。また、文書流行度算出部340は、キーワード出現率の平均値を文書流行度として算出しているため、少ない演算量で文書流行度を算出することができる。
【0061】
図11は、図4のS80に示した処理の詳細を示すフローチャートであり、図12は、S80で示した処理を視覚的に示す図である。まず差分分布生成部410は、キーワード記憶部120からすべてのキーワードの出現率差分を、出願年情報に含まれるすべての年について読み出す(S810)。次いで差分分布生成部410は、出現率差分の値を複数の区間に分割し、各年においてキーワードの数を区間別に集計することにより、出現率差分別のキーワード数の分布図を年別に生成する(S820)。具体的には、差分分布生成部410は出願年情報に含まれる年のうち最も古い出願年の次の年を設定出願年の初期値として指定し、設定出願年に対応している出現率差分の数を区間別に集計することにより、その年における、出現率差分別のキーワード数の分布図を生成する。その後、設定出願年が出願年情報に含まれる年のうちの最新年でない場合に、設定出願年を次の年に変更し、新たな設定出願年における分布図の生成処理を行う。これらの処理を、設定出願年が出願年の最新年になるまで繰り返す。そして差分分布生成部410は、生成した年別の分布図を文書変動度算出部420に出力する。
【0062】
次いで文書変動度算出部420は、入力された年別の分布図それぞれを、正規分布で近似し、この近似における分散を、処理対象公報の変動度として算出する(S830)。例えば文書変動度算出部420は、図12に示すように、入力された年別の分布図それぞれを、気体分子運動論におけるマクセル・ボルツマン分布で近似する。
【0063】
分布図がヒストグラムである場合、正規分布への近似は、例えば以下に一例を示すように、最尤法を用いて行われる。以下、正規分布の一例としてマクセル・ボルツマン分布を用いる場合について説明する。
マクセル・ボルツマン分布は、下記の式(1)で示される。
【数1】

ここでx=出現率差分である
【0064】
次いで、ポアソン分布関数を確率分布関数としたときの尤度Lを用意する。そして、尤度Lが最大になるように、A、B、及びTを算出する。
【0065】
具体的には、以下の処理を行う。まず、ポアソン分布関数を、以下の式(2)のように定義する。
【数2】

ただしλ=変数であり、x=出現率差分である。また尤度Lは、λの具体値ごとに用意されている。
【0066】
次いで、λの初期値を設定して、このλに対する尤度Lを算出する。そして尤度Lに基づいてλの修正量であるδλを算出し、λをδλほど修整する。δλ/λが予め定められた値以下(たとえば10−3以下)になるまで、この処理を繰り返し行う。そして得られたλを式(2)に代入し、代入後の式(2)を式(1)に当てはめることにより、A、B、及びTを算出する。
【0067】
そして文書変動度算出部420は、各近似式におけるTの値を、処理対象公報の年別の変動度として算出して文書データ記憶部110に記憶させる(S830)。
【0068】
ここで、出現率差分の分布をマクセル・ボルツマン分布で近似し、この近似式におけるTの値を、指標の一つとして変動度と定義することの妥当性を説明する。気体分子運動論は統計力学の一種であり、ミクロな現象(気体を構成する個々の分子の速度)をマクロ的(統計的)に解析する学問である。そしてマクセル・ボルツマン分布におけるTは温度であり、分子の速度に直接影響を与える因子である。具体的には、Tが高いほど平均分子速度は速くなる。
【0069】
気体を処理対象公報に置き換えた場合、気体を構成する個々の分子は、処理対象公報に含まれる複数のキーワードになる。そして分子の速度は、キーワードの出現率になる。このため、出現率差分の分布をマクセル・ボルツマン分布で近似し、この近似式におけるTの値を変動度とすると、変動度は、処理対象公報に含まれる各キーワードの出現率の変動しやすさをマクロ的に示す指標となる。具体的には、変動度が高いほど、処理対象公報に含まれる各キーワードの出現率は変動しやすい。
【0070】
なお、キーワード含有文書数算出部310がキーワードを一つ以上含む場合にキーワード含有文書として選択する場合、今後流行すると予想されるキーワード群が処理対象公報に含まれていると、図12に示したマクセル・ボルツマン分布での近似において、近似後の分布の形状が左側(出現率差分が小さいほう)に傾いて左右非対称になり、かつ左側テール部分にこのキーワード群に対応した凸部が現れる。このような分布の形状を、処理対象公報の変動度がこれから上昇することを示すシグナルとすることができる。
【0071】
なお図12において、文書変動度算出部420は正規分布としてマクセル・ボルツマン分布を用いたが、他の正規分布を用いても良い。
【0072】
図13は、図4のS90で示した処理を説明するための図である。グラフ生成部430は、処理対象公報の年別の文書流行度及び変動度を文書データ記憶部110から読み出す。次いで、文書流行度及び変動度を2軸にした2次元グラフを生成し、このグラフに各年をプロットし、各年とその次の年を矢印で結ぶ。この矢印は移動ベクトルを意味している。そして移動ベクトル算出部440は、その年の文書流行度から前年の文書流行度を引いた値である文書流行度差分を算出し、算出した文書流行度差分を移動ベクトルのx成分とする。また移動ベクトル算出部440は、その年の変動度から前年の変動度を引いた値を算出し、算出した値を移動ベクトルのy成分とする。そして移動ベクトル算出部440は、算出した移動ベクトルのx成分及びy成分を文書データ記憶部110に記憶させる。
【0073】
図14は、図4のS100で示した処理の第1詳細例を説明するための図である。流行性判定部450は、処理対象公報の文書流行度が前年より増加した場合、すなわちS90で算出した移動ベクトルが第1象限及び第4象限に属しているとき、処理対象公報は流行していると判定する。また流行性判定部450は、処理対象公報の文書流行度が前年より減少した場合、すなわちS90で算出した移動ベクトルが第2象限及び第3象限に属しているとき、処理対象公報は衰退していると判定する。
【0074】
さらに詳細には、流行性判定部450は、S90で算出した移動ベクトルが第1象限に属しているとき、処理対象公報の流行が加速している(突発性流行期)と判定し、S90で算出した移動ベクトルが第4象限に属しているとき、処理対象公報の流行が鈍化していると判定する。また流行性判定部450は、S90で算出した移動ベクトルが第3象限に属しているとき、処理対象公報の衰退が加速していると判定し、S90で算出した移動ベクトルが第2象限に属しているとき、流行性が衰退した状態で安定していると判定する。
【0075】
図15は、図4のS100で示した処理の第2詳細例を説明するための図である。流行性判定部450は、図13に示した第1詳細例と同様に、処理対象公報の文書流行度が前年より増加した場合、処理対象公報は流行していると判定する。また流行性判定部450は、処理対象公報の文書流行度が前年より減少した場合、処理対象公報は衰退していると判定する。
【0076】
さらに詳細には、流行性判定部450は、処理対象公報のすべての年における変動度を文書データ記憶部110から読み出し、読み出した変動度の平均値を算出する。次いで流行性判定部450は、処理対象公報の文書流行度が前年より増加し、かつ変動度が平均値より高い場合に、処理対象公報の流行が加速していると判定する(突発性流行期)。また流行性判定部450は、処理対象公報の文書流行度が前年より増加し、かつ変動度が平均値より低い場合に、処理対象公報の流行が鈍化していると判定する。また流行性判定部450は、処理対象公報の文書流行度が前年より減少し、かつ変動度が平均値より高い場合に、処理対象公報の衰退が加速していると判定する。また流行性判定部450は、処理対象公報の文書流行度が前年より減少し、かつ変動度が平均値より低い場合に、処理対象公報の流行性が衰退した状態で安定していると判定する。なお、この例において、変動度の平均値の代わりに、予め定められた値を用いても良い。
【0077】
図16は、文書流行度及び変動度で特許公報が示す技術の価値を判定する方法、及びその妥当性を説明する図である。この図は、文書データ記憶部110に格納されている変動度と文書流行度の組み合わせのうち、突発性流行期であることを示すフラグが立てられているものを読み出し、文書流行度及び変動度を2軸としたグラフにプロットしたものである。このグラフの生成処理は、例えば入力部210から入力される指示をトリガーとして、グラフ生成部430が行う。
【0078】
このグラフにおいて、従来のマニュアル的な手法により高評価された公報、低評価された公報、及び中評価された公報をそれぞれ異なるマークで示している。この図から明らかなように、高評価された公報は、文書流行度及び変動度が相対的に高くなる。従って、例えば流行性判定部450が、図16に示した図においてある領域の範囲にある公報を選択することにより、価値が高い公報を自動で選択できる。
【0079】
また、技術評価装置が、同一の出願人による複数の公開特許公報をそれぞれ処理対象公報として処理した場合、グラフ生成部430は、文書流行度及び変動度を2軸としたグラフを年別に生成し、複数の公開特許公報それぞれの位置を年別のグラフにプロットしてもよい。
【0080】
図17(a)は、このようなグラフの一例を示す図である。このグラフにおいて、第1象限〜第4象限の定義は図15に示した例と同じである。そして、図17(a)に示すグラフを出願年別に作成し、これらのグラフを相互に比較することにより、当該出願人が開発した技術の現在価値を年ごとに評価できる。この効果は、例えば各グラフにおいて平均位置をプロットすると、顕著になる。なお、第1象限及び第2象限を第3象限及び第4象限から区別する基準値は、特定の年の平均値をすべての年について適用してもよい。
【0081】
図17(b)は、図17(a)に示したグラフにおいて第1象限〜第4象限それぞれに属する公報の数の、出願年による推移を示すグラフである。このグラフは、例えばグラフ生成部430が生成する。グラフ生成部430は、文書流行度が0以上かつ変動度が基準値以上である公報の数をカウントすることにより、第1象限に属する公報数を算出し、文書流行度が0未満かつ変動度が基準値以上である公報の数をカウントすることにより、第2象限に属する公報数を算出する。またグラフ生成部430は、文書流行度が0未満かつ変動度が基準値未満である公報の数をカウントすることにより、第3象限に属する公報数を算出し、文書流行度が0以上かつ変動度が基準値未満である公報の数をカウントすることにより、第4象限に属する公報数を算出する。
【0082】
図15の説明で記載したように、第1象限及び第4象限に属する公報は技術的に流行していると判断され、第2象限及び第3象限に属する公報は技術的に衰退していると判断される。従って、このグラフを見ることにより、その出願人において、いずれの年の技術開発が高価値であったかを判断することができる。
【0083】
以上、図面を参照して本発明の実施形態について述べたが、これらは本発明の例示であり、上記以外の様々な構成を採用することもできる。
【図面の簡単な説明】
【0084】
【図1】実施形態にかかる技術評価装置の構成を示すブロック図である。
【図2】文書データ記憶部が記憶しているデータの構成をテーブル形式で示す図である。
【図3】キーワード記憶部が記憶しているデータの構成をテーブル形式で示す図である。
【図4】図1に示した技術評価装置が行う処理を示すフローチャートである。
【図5】図4のS40で行う処理の詳細を示すフローチャートである。
【図6】図4のS50に示した処理の詳細を示すフローチャートである。
【図7】(a)はキーワード流行度算出部がキーワードの流行/衰退を判定する方法を説明する図であり、(b)はキーワード流行度算出部が年別に算出したベクトルをつなげたグラフである。
【図8】図4のS60に示した処理の詳細を示すフローチャートである。
【図9】各図はキーワード流行度算出部が算出する流行度の妥当性を説明する図である。
【図10】図4のS70に示した処理の詳細を示すフローチャートである。
【図11】図4のS80に示した処理の詳細を示すフローチャートである。
【図12】図4のS80で示した処理を視覚的に示す図である。
【図13】図4のS90で示した処理を説明するための図である。
【図14】図4のS100で示した処理の第1詳細例を説明するための図である。
【図15】図4のS100で示した処理の第2詳細例を説明するための図である。
【図16】流行度及び変動度で特許公報が示す技術の重要性を判定する方法、及びその妥当性を説明する図である。
【図17】(a)は同一の出願人による複数の公開特許公報の評価例を示すグラフであり、(b)は(a)に示したグラフにおいて第1象限〜第4象限それぞれに属する公報の数の、出願年による推移を示すグラフである。
【符号の説明】
【0085】
110 文書データ記憶部
120 キーワード記憶部
210 入力部
220 処理対象文書データ選択部
230 キーワード生成部
310 キーワード含有文書数算出部
320 出現率算出部
330 キーワード流行度算出部
340 文書流行度算出部
410 差分分布生成部
420 文書変動度算出部
430 グラフ生成部
440 移動ベクトル算出部
450 流行性判定部

【特許請求の範囲】
【請求項1】
技術に関するキーワード別に、当該キーワードが技術トレンドに乗っているか否かを示すキーワード流行度を算出する技術評価装置であって、
複数の技術文書それぞれの文書データからキーワードを含む前記文書データを選択する処理を複数の前記キーワード別に行うことにより、前記複数のキーワードそれぞれごとに、前記キーワードを含む前記文書データの数であるキーワード含有文書数を、前記文書データが作成された期間別又は公開された期間別に算出するキーワード含有文書数算出部と、
前記キーワード含有文書数が属する前記期間に作成された前記文書データの数で当該キーワード含有文書数を除した値を示す出現率を、前記キーワード別かつ前記期間別に算出し、かつ当該期間の前記出現率から一つ前の前記期間の前記出現率を引いた値である出現率差分を前記キーワード別かつ前記期間別に算出する出現率算出部と、
いずれかの前記期間におけるいずれかの前記キーワードの前記キーワード流行度を算出するキーワード流行度算出部であって、当該期間及びこれ以前の前記期間それぞれに対応する複数の前記出現率差分のうち最大値と最小値を選択し、選択した前記最大値と前記最小値の差の二乗値に比例していて正負が前記出現率差分に一致した値を前記キーワード流行度として算出するキーワード流行度算出部と、
を備える技術評価装置。
【請求項2】
請求項1に記載の技術評価装置において、処理対象となる技術文書を示す処理対象文書データを取得し、前記処理対象文書データに含まれる前記キーワードをすべて選択し、選択した前記キーワードそれぞれの前記キーワード流行度を処理することにより、前記処理対象文書データのいずれかの前記期間における流行度である文書流行度を算出する文書流行度算出部を備える技術評価装置。
【請求項3】
請求項2に記載の技術評価装置において、
前記技術文書は公開特許公報、特許公報、公開実用新案公報、又は実用新案公報である技術評価装置。
【請求項4】
請求項2に記載の技術評価装置において、
前記文書流行度算出部は、選択した前記キーワードの当該期間における前記キーワード流行度の平均値を算出することにより、前記処理対象文書データの前記文書流行度を算出する技術評価装置。
【請求項5】
請求項2に記載の技術評価装置において、
前記処理対象文書データに含まれる単語を抽出することにより、前記複数のキーワードを生成するキーワード生成部を備える技術評価装置。
【請求項6】
請求項2に記載の技術評価装置において、
前記処理対象文書データに含まれる全ての前記キーワードのいずれかの前記期間における前記出現率差分を取得し、前記出現率差分の分布を生成する差分分布生成部と、
前記期間別の前記出現率差分の分布を正規分布で近似し、当該近似における分散を、当該期間における前記処理対象文書データの変動度として算出する文書変動度算出部と、
を備える技術評価装置。
【請求項7】
請求項6に記載の技術評価装置において、
前記文書流行度及び前記変動度を2軸としたグラフを生成し、当該グラフ内における前記処理対象文書データの位置をプロットするグラフ生成部を備える技術評価装置。
【請求項8】
請求項6に記載の技術評価装置において、
前記技術文書はいずれも公開特許公報、特許公報、公開実用新案公報、又は実用新案公報であり、
前記文書流行度算出部及び前記文書変動度算出部は、同一の出願人による複数の公開特許公報をそれぞれ前記処理対象文書データとして処理し、
前記文書流行度及び前記変動度を2軸としたグラフを生成し、前記複数の処理対象文書データそれぞれの位置を前記グラフにプロットするグラフ生成部を備える技術評価装置。
【請求項9】
請求項6に記載の技術評価装置において、
当該期間の前記文書流行度から一つ前の前記期間の前記文書流行度を引いた値である文書流行度差分を第1の成分とし、当該期間の前記変動度から一つ前の前記期間の前記変動度を引いた値を第2の成分としたベクトルである移動ベクトルを生成する移動ベクトル算出部と、
前記移動ベクトルが属する象限に基づいて、前記処理対象文書データが示す技術文書の流行性を判定する流行性判定部と、
を備える技術評価装置。
【請求項10】
技術に関する処理対象文書の流行性を示す変動度を算出する技術評価装置であって、
複数の技術文書それぞれの文書データを処理し、前記処理対象文書に含まれる複数のキーワードそれぞれごとに、当該キーワードを含む前記文書データの数であるキーワード含有文書数を、前記文書データが作成された期間別又は公開された期間別に算出するキーワード含有文書数算出部と、
前記キーワード含有文書数が属する前記期間に作成された前記文書データの数で当該キーワード含有文書数を除した値を示す出現率を、前記キーワード別かつ前記期間別に算出し、かつ当該期間の前記出現率から一つ前の前記期間の前記出現率を引いた値である出現率差分を前記キーワード別かつ前記期間別に算出する出現率算出部と、
いずれかの前記期間において前記複数のキーワードにおける前記出現率差分の分布を生成する差分分布生成部と、
前記出現率差分の分布を正規分布で近似し、当該近似における分散を、当該期間における前記処理対象文書の変動度として算出する文書変動度算出部と、
を備える技術評価装置。
【請求項11】
技術に関するキーワードが技術トレンドに乗っているか否かを示すキーワード流行度を算出する技術評価方法であって、
コンピュータが、複数の技術文書それぞれの文書データを処理し、複数のキーワードそれぞれごとに、当該キーワードを含む前記文書データの数であるキーワード含有文書数を、前記文書データが作成された期間別に算出し、
コンピュータが、前記キーワード含有文書数が属する前記期間に作成された前記文書データの数で当該キーワード含有文書数を除した値を示す出現率を、前記キーワード別かつ前記期間別に算出し、
コンピュータが、当該期間の前記出現率から一つ前の前記期間の前記出現率を引いた値である出現率差分を前記キーワード別かつ前記期間別に算出し、
コンピュータが、いずれかの前記期間におけるいずれかの前記キーワードの前記キーワード流行度を算出する際に、当該期間及びこれ以前の前記期間それぞれに対応する複数の前記出現率差分のうち最大値と最小値を選択し、選択した前記最大値と前記最小値の差の二乗値に比例していて正負が前記出現率差分に一致した値を前記キーワード流行度として算出する技術評価方法。
【請求項12】
技術に関する処理対象文書の流行性を示す変動度を算出する技術評価方法であって、
コンピュータが、複数の技術文書それぞれの文書データを処理し、前記処理対象文書に含まれる複数のキーワードそれぞれごとに、当該キーワードを含む前記文書データの数であるキーワード含有文書数を、前記文書データが作成された期間別又は公開された期間別に算出し、
コンピュータが、前記キーワード含有文書数が属する前記期間に作成された前記文書データの数で当該キーワード含有文書数を除した値を示す出現率を、前記キーワード別かつ前記期間別に算出し、
コンピュータが、当該期間の前記出現率から一つ前の前記期間の前記出現率を引いた値である出現率差分を前記キーワード別かつ前記期間別に算出し、
コンピュータが、いずれかの前記期間において前記複数のキーワードにおける前記出現率差分の分布を生成し、
コンピュータが、前記出現率差分の分布を正規分布で近似し、当該近似における分散を、当該期間における前記処理対象文書の変動度として算出する技術評価方法。
【請求項13】
コンピュータを、技術に関するキーワードが技術トレンドに乗っているか否かを示すキーワード流行度を算出する装置として機能させるプログラムであって、
前記コンピュータに、
複数の技術文書それぞれの文書データを処理し、複数のキーワードそれぞれごとに、当該キーワードを含む前記文書データの数であるキーワード含有文書数を、前記文書データが作成された期間別に算出する機能と、
前記キーワード含有文書数が属する前記期間に作成された前記文書データの数で当該キーワード含有文書数を除した値を示す出現率を、前記キーワード別かつ前記期間別に算出する機能と、
当該期間の前記出現率から一つ前の前記期間の前記出現率を引いた値である出現率差分を前記キーワード別かつ前記期間別に算出する機能と、
いずれかの前記期間におけるいずれかの前記キーワードの前記キーワード流行度を算出する機能であって、当該期間及びこれ以前の前記期間それぞれに対応する複数の前記出現率差分のうち最大値と最小値を選択し、選択した前記最大値と前記最小値の差の二乗値に比例していて正負が前記出現率差分に一致した値を前記キーワード流行度として算出する機能と、
を実現させるプログラム。
【請求項14】
コンピュータを、技術に関する処理対象文書の流行性を示す変動度を算出する装置として機能させるプログラムであって、
前記コンピュータに、
複数の技術文書それぞれの文書データを処理し、前記処理対象文書に含まれる複数のキーワードそれぞれごとに、当該キーワードを含む前記文書データの数であるキーワード含有文書数を、前記文書データが作成された期間別又は公開された期間別に算出する機能と、
前記キーワード含有文書数が属する前記期間に作成された前記文書データの数で当該キーワード含有文書数を除した値を示す出現率を、前記キーワード別かつ前記期間別に算出する機能と、
当該期間の前記出現率から一つ前の前記期間の前記出現率を引いた値である出現率差分を前記キーワード別かつ前記期間別に算出する機能と、
いずれかの前記期間において前記複数のキーワードにおける前記出現率差分の分布を生成する機能と、
前記出現率差分の分布を正規分布で近似し、当該近似における分散を、当該期間における前記処理対象文書の変動度として算出する機能と、
を実現させるプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate


【公開番号】特開2010−9493(P2010−9493A)
【公開日】平成22年1月14日(2010.1.14)
【国際特許分類】
【出願番号】特願2008−170952(P2008−170952)
【出願日】平成20年6月30日(2008.6.30)
【出願人】(502037638)株式会社アイ・ピー・ビー (28)