説明

関係表現判別装置、その方法及びプログラム

【課題】一組の固有表現の関係を表す複数の関係表現間の同一性を高精度で判別可能な装置、その方法及びプログラムを提供する。
【解決手段】一組の固有表現間の関係をそれぞれ表す複数の関係表現の同一性を判別する装置であって、前記各関係表現が入力されると、該関係表現によって関係付けられた固有表現の組と、該固有表現の組及び該関係表現が表記された日時を表す時間情報とを、該各関係表現毎に所定のテキスト集合から抽出する固有表現抽出処理部10と、固有表現抽出処理部による抽出結果を取得すると、同一の固有表現の組にそれぞれ対応する各関係表現のうち一方の関係表現に対応する時間情報と他方の関係表現に対応する時間情報との時間差に基づき各関係表現の共通度を求めるとともに、該共通度に基づき各関係表現の同一性を判別する関係表現判別処理部20とを備えた。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、テキストを要約する要約システム等において重要な役割を果たす、一組の固有表現間の関係をそれぞれ表す複数の関係表現の同一性を判別する技術に関する。
【背景技術】
【0002】
従来、一組の固有表現(X,Y)間の関係をそれぞれ表す複数の関係表現(R1,R2)の同一性を判別する技術として、複数の関係表現が入力されると、該関係表現によって関係付けられた固有表現の組を所定のテキスト集合から抽出し、抽出された固有表現の組に基づき各関係表現の共通度を求めるとともに、該共通度に基づき各関係表現の同一性を判別するものが知られている(例えば非特許文献1参照)。
【0003】
このような関係表現判別装置は、図1に示すように、固有表現取得部1と、記憶部2と、相互情報量計算部3と、相互情報量記憶部4と、共通度計算部5と、同一性判別部6とを備えている。
【0004】
固有表現取得部1は、キーボード等の入力手段を用いて入力された2つの関係表現からなる関係表現の組を記憶部2から取得する。例えば、「母(R1)」と「お母さん(R2)」という関係表現の組が入力された場合には、固有表現取得部1は、「母」という関係表現によって関係付けられた「宇多田ヒカル(X),藤圭子(Y)」、「キリスト(X),マリア(Y)」及び「源実朝(X),北条政子(Y)」という固有表現の組を抽出するとともに、「お母さん」という関係表現によって関係付けられた「宇多田ヒカル(X),藤圭子(Y)」及び「キリスト(X),マリア(Y)」という固有表現の組を抽出する。
【0005】
相互情報量計算部3は各関係表現(R1,R2)毎に対応する固有表現の組からなるデータ((X,Y,R1)及び(X,Y,R2))を取得すると、該データのうち(R1,X)、(R2,X)、(R1,Y)及び(R2,Y)の組それぞれについて、出現頻度に基づく相互情報量を計算する。なお、相互情報量計算部3は、計算された相互情報量を相互情報量記憶部4に記憶する。
【0006】
次に、共通度計算部5は、相互情報量計算部3によって求められた相互情報量に基づき各関係表現間の共通度を計算する。
【0007】
同一性判別部6は、各関係表現間に同一性があるか否かを、共通度計算部5によって求められた共通度が所定の閾値(例えば0.8)以上であるか否かに基づき判別する。例えば「母」と「お母さん」という関係表現の組の共通度が0.8であった場合には、各関係表現間に同一性があると判別される。
【先行技術文献】
【特許文献】
【0008】
【非特許文献1】Dekang Lin and Patrick Pantel、“DIRT-Discovery of Inference Rules from Text”、[online]、Proceedings of ACM Conference on Knowledge Discovery and Data Mining (KDD-01)、pp. 323-328、San Francisco、CA、[平成21年5月18日検索]、インターネット<URL:http://www.patrickpantel.com/Download/Papers/2001/kdd01-1.pdf>
【発明の概要】
【発明が解決しようとする課題】
【0009】
しかしながら、従来の関係表現判別技術では、各関係表現間の共通度が、テキスト集合における固有表現の組及び関係表現の出現頻度に基づき求められるため、過去及び現在それぞれの所定期間における固有表現の組及び関係表現の出現頻度によっては互いに異なる意味を持つ各関係表現間に同一性があると判別されるおそれがある。具体的には、各固有表現間の関係を表す表現が経時的に変化する場合、例えば「NTT(X),和田紀夫(Y)」という固有表現の組に対して「社長(R1)」という関係表現が過去に用いられていたが、現在では「会長(R2)」という関係表現が用いられている場合には、「社長(R1)」と「会長(R2)」とが同一性を有するというように誤って判別されることがあった。
【0010】
本発明は前記問題点に鑑みてなされたものであり、その目的とするところは、一組の固有表現の関係を表す複数の関係表現間の同一性を高精度で判別可能な装置、その方法及びプログラムを提供することにある。
【課題を解決するための手段】
【0011】
本発明の関係表現判別装置は、前記目的を達成するために、一組の固有表現間の関係をそれぞれ表す複数の関係表現の同一性を判別する装置であって、前記各関係表現が入力されると、該関係表現によって関係付けられた固有表現の組と、該固有表現の組及び該関係表現が表記された日時を表す時間情報とを、該各関係表現毎に所定のテキスト集合から抽出する固有表現抽出処理部と、固有表現抽出処理部による抽出結果を取得すると、同一の固有表現の組にそれぞれ対応する各関係表現のうち一方の関係表現に対応する時間情報と他方の関係表現に対応する時間情報との時間差に基づき各関係表現の共通度を求めるとともに、該共通度に基づき各関係表現の同一性を判別する関係表現判別処理部とを備えている。
【0012】
また、本発明の関係表現判別方法は、前記目的を達成するために、一組の固有表現間の関係をそれぞれ表す複数の関係表現の同一性を、コンピュータを用いて判別する方法であって、前記コンピュータは、前記各関係表現が入力されると、該関係表現によって関係付けられた固有表現の組と、該固有表現の組及び該関係表現が表記された日時を表す時間情報とを、該各関係表現毎に所定のテキスト集合から抽出し、同一の固有表現の組にそれぞれ対応する各関係表現のうち一方の関係表現に対応する時間情報と他方の関係表現に対応する時間情報との時間差に基づき各関係表現の共通度を求めるとともに、該共通度に基づき各関係表現の同一性を判別している。
【0013】
さらに、本発明のプログラムは、コンピュータを、上記関係表現判別装置の各手段として機能させるためのものである。
【0014】
さらにまた、本発明のプログラムは、コンピュータに、上記関係表現判別方法の各処理を実行させるためのものである。
【0015】
これにより、複数の関係表現が入力されると、該関係表現によって関係付けられた固有表現の組と、該固有表現の組及び該関係表現が表記された日時を表す時間情報とが抽出され、同一の固有表現の組にそれぞれ対応する各関係表現のうち一方の関係表現に対応する時間情報と他方の関係表現に対応する時間情報との時間差に基づいて求められた共通度により各関係表現の同一性が判別されることから、各関係表現間の同一性を、各関係表現がそれぞれ用いられたときの時間差に基づき判別することが可能となる。
【発明の効果】
【0016】
本発明の関係表現判別装置、その方法及びプログラムによれば、各関係表現間の同一性を、各関係表現がそれぞれ用いられたときの時間差に基づき判別することができるので、例えば「NTT(X),和田紀夫(Y)」という固有表現の組に対して「社長(R1)」という関係表現が過去に用いられていたが、現在では「会長(R2)」という関係表現が用いられている場合でも、「社長(R1)」と「会長(R2)」の間に同一性が無いと正確に判別することができ、一組の固有表現の関係を表す複数の関係表現間の同一性を高精度で判別することができる。
【図面の簡単な説明】
【0017】
【図1】従来の関係表現判別装置の構成を示す図
【図2】本発明の一実施形態における関係表現判別装置の構成図
【図3】関係表現判別処理のフロー図
【図4】固有表現取得部による処理結果の概要を示す図
【図5】固有表現取得部による処理結果の概要を示す図
【図6】相互情報量計算部による処理結果の概要を示す図
【図7】相互情報量計算部による処理結果の概要を示す図
【図8】共通度計算部による処理結果の概要を示す図
【図9】共通度計算部による処理結果の概要を示す図
【符号の説明】
【0018】
10…固有表現抽出処理部、11…固有表現取得部、20…関係表現判別処理部、21…総合情報量計算部、22…共通度計算部、23…同一性判別部、30…固有表現記憶部、40…相互情報量記憶部
【発明を実施するための形態】
【0019】
図2乃至図9は本発明の一実施形態を示すもので、図2は本発明の一実施形態における関係表現判別装置の構成図、図3は関係表現判別処理のフロー図、図4及び図5は固有表現取得部による処理結果の概要を示す図、図6及び図7は相互情報量計算部による処理結果の概要を示す図、図8及び図9は共通度計算部による処理結果の概要を示す図である。
【0020】
以下、図面を参照して本発明の関係表現判別装置及びその方法の概要を説明する。
【0021】
本発明の関係表現判別装置は、周知のCPUを主体として構成されたコンピュータ装置からなり、モニタ等の表示手段、キーボード等の入力手段、ハードディスクやメモリ等の記憶手段及び外部ネットワークに接続可能な通信装置等(何れも図示省略)を備えている。また、図2に示すように、本発明の関係表現判別装置には、固有表現抽出処理部10と、関係表現判別処理部20と、固有表現記憶部30と、相互情報量記憶部40とが設けられている。
【0022】
固有表現抽出処理部10は、2つの関係表現からなる関係表現の組が入力手段を用いて入力されると、各関係表現によって関係付けられた固有表現の組と、該固有表現の組及び該関係表現が表記された日時(例えば新聞掲載年月日やブログの投稿年月日等)を表す時間情報とを、各関係表現毎に固有表現記憶部30から抽出するモジュールであり、図2に示すように固有表現取得部11から構成されている。固有表現記憶部30には、所定のテキスト集合から抽出された2つの固有表現の組(X,Y)と、該固有表現の組の関係表現(R)と、該固有表現の組及び該関係表現に対応する時間情報(T)とが事前に記憶されている。例えば、「藤圭子は、あの宇多田ヒカルの母であり、...(2004年8月1日作成)。」というテキストにおける上記各要素は、(X=宇多田ヒカル,Y=藤圭子,R=母,T=2004.08.01)というように表される。
【0023】
固有表現取得部11は、関係表現の組を取得すると(図3のステップS1)、各関係表現によって関係付けられた固有表現の組及び時間情報を固有表現記憶部30から取得する(図3のステップS2)。例えば、2つの関係表現(R1=母、R2=お母さん)からなる関係表現の組が入力された場合には、固有表現取得部11は、図4に示すように、「母」という関係表現によって関係付けられた複数の固有表現の組(X=宇多田ヒカル,Y=藤圭子)、(X=キリスト,Y=マリア)及び(X=源実朝,Y=北条政子)と、時間情報(T)とを抽出するとともに、「お母さん」という関係表現によって関係付けられた複数の固有表現の組(X=宇多田ヒカル,Y=藤圭子)及び(X=キリスト,Y=マリア)と、時間情報(T)とを抽出する。
【0024】
また、(R1=社長,R2=会長)という関係表現の組が入力された場合には、固有表現取得部11は、図5に示すように、「社長」という関係表現によって関係付けられた複数の固有表現の組(X=NTT,Y=和田紀夫)、(X=ライブドア,Y=堀江貴文)及び(X=ソフトバンク,Y=孫正義)と、時間情報(T)とを抽出するとともに、「会長」という関係表現によって関係付けられた複数の固有表現の組(X=NTT,Y=和田紀夫)及び(X=ライブドア,Y=堀江貴文)と、時間情報(T)とを抽出する。
【0025】
次に、関係表現判別処理部20の概要を説明する。関係表現判別処理部20は、固有表現抽出処理部10による抽出結果を取得すると、同一の固有表現の組にそれぞれ対応する各関係表現のうち一方の関係表現に対応する時間情報と他方の関係表現に対応する時間情報との時間差に基づき各関係表現の共通度を求めるとともに、該共通度に基づき各関係表現の同一性を判別するモジュールであり、相互情報量計算部21と、共通度計算部22と、同一性判別部23とから構成されている。
【0026】
相互情報量計算部21は、固有表現抽出処理部10の抽出結果、即ち各関係表現(R1,R2)毎に対応する固有表現の組及び時間情報からなるデータ((X,Y,R1,T)及び(X,Y,R2,T))を取得すると、該データのうち(R1,X)、(R2,X)、(R1,Y)及び(R2,Y)の組それぞれについて、出現頻度に基づく相互情報量を計算する(図3のステップS3)。具体的には、前記テキスト集合における固有表現Xの出現頻度をcount(X)、前記テキスト集合における関係表現Rの出現頻度をcount(R)、前記テキスト集合における固有表現X及び関係表現Rの同時出現頻度をcount(R,X)及び前記テキスト集合における(R,X)及び(R,Y)の総出現数をNとすると、(R,X)についての相互情報量pmi(R,X)は、以下の式(1)でもとめられる。

【0027】
また、前記テキスト集合における固有表現Yの出現頻度をcount(Y)及び前記テキスト集合における固有表現Y及び関係表現Rの同時出現頻度をcount(R,Y)とすると、(R,Y)についての相互情報量pmi(R,Y)は、以下の式(2)でもとめられる。

【0028】
ここで、図4に示されたデータのうち、(R=母,X=宇多田ヒカル)についての相互情報量pmi(R=母,X=宇多田ヒカル)は、count(X)=100、count(R)=75、count(R,X)=50及びN=100,000とすると、以下の式(3)でもとめられる。

【0029】
また、図5に示されたデータのうち、(R=社長,Y=和田紀夫)についての相互情報量pmi(R=社長,X=和田紀夫)は、count(Y)=580、count(R)=85、count(R,Y)=40及びN=100,000とすると、以下の式(4)でもとめられる。

【0030】
なお、図4に示した各(R,X)及び各(R,Y)についての相互情報量を図6に示すとともに、図5に示した各(R,X)及び各(R,Y)についての相互情報量を図7に示す。また、相互情報量計算部21は、計算された各相互情報量を相互情報量記憶部40に記憶する。
【0031】
次に、共通度計算部22は、固有表現抽出処理部10の抽出結果を取得すると、相互情報量計算部21によって求められた相互情報量と、同一の固有表現の組にそれぞれ対応する各関係表現のうち一方の関係表現に対応する時間情報と他方の関係表現に対応する時間情報との時間差とに基づき各関係表現(R1,R2)の共通度を計算する(図3のステップS4)。具体的には、関係表現R1に対応するXの集合をXR1、関係表現R2に対応するXの集合をXR2、関係表現R1に対応するYの集合をYR1及び関係表現R2に対応するYの集合をYR2とすると、各関係表現(R1,R2)についての共通度SIM(R1,R2)は、以下の式(5)でもとめられる。

【0032】
また、式(5)において、sim(XR1,XR2)及びsim(YR1,YR2)は、それぞれ以下の式(6)及び(7)で求められる。

【0033】

【0034】
なお、式(6)及び(7)におけるWtimeは、同一の固有表現の組にそれぞれ対応する各関係表現のうち一方の関係表現に対応する時間情報と他方の関係表現に対応する時間情報との時間差に基づき定められる値である。
【0035】
ここで、図4に示されたデータを取得した場合の共通度計算部22の動作を、図8を参照して説明する。まず、共通度計算部22は、図4に示されたデータを取得すると、各集合XR1、XR2、YR1及びYR2を抽出する。この場合、XR1=(宇多田ヒカル,キリスト,源実朝)、XR2=(宇多田ヒカル,キリスト)、YR1=(藤圭子,マリア,北条政子)及びYR2=(藤圭子,マリア)となる。
【0036】
次に、共通度計算部22は、Wtimeの値を求める。ここで、Wtimeの値は、同一の固有表現の組にそれぞれ対応する各関係表現のうち一方の関係表現に対応する時間情報と他方の関係表現に対応する時間情報との時間差の最大値、最小値及び平均値の何れか一つに基づき求められる。例えば、同一の固有表現の組(X=宇多田ヒカル,Y=藤圭子)にそれぞれ対応する各関係表現(R1=母,R2=お母さん)のうち一方の関係表現R1に対応する時間情報(2004.08.01,2005.02.04,2007.12.31)と他方の関係表現R2に対応する時間情報(2004.08.02,2005.12.28)との時間差の最小値(Nearest)は、1日(2004.08.01〜2004.08.02)となる。また、最大値(Furthest)は1246日(2004.08.02〜2007.12.31)、平均値(Average)は366日(2005.04.15〜2006.04.16)となる。なお、時間差が所定値n(本実施形態ではn=20)より大きい場合には、時間差からnを減算した値を新たな時間差とする。従って、上記時間差の最大値及び平均値は、それぞれ1226日及び346日となる。そして、Wtimeの値は、時間差の最小値、最大値及び平均値の何れか一つの逆数から得られる。また、Wtimeの値を、時間差の最小値、最大値及び平均値の何れか一つに1を加算したものの対数の逆数から得てもよい。このようにして得られた固有表現の組(X=宇多田ヒカル,Y=藤圭子)についてのWtimeの値を、図8(a)に示す。
【0037】
また、上記と同様に求められた、他の同一の固有表現の組(X=キリスト,Y=マリア)についてのWtimeの値を、図8(b)に示す。
【0038】
次いで、共通度計算部22は、相互情報量記憶部40に記憶された相互情報量とWtimeの値に基づき各関係表現(R1=母,R2=お母さん)についての共通度SIM(R1,R2)を求める。なお、この場合についての計算内容を図8(c)に示す。ここでは、上記時間差の最小値をWtimeの値として用いている。
【0039】
また、他の例として、図5に示されたデータを取得した場合の共通度計算部22の動作を、図9を参照して説明する。まず、共通度計算部22は、図5に示されたデータを取得すると、各集合XR1、XR2、YR1及びYR2を抽出する。この場合、XR1=(NTT,ライブドア,ソフトバンク)、XR2=(NTT,ライブドア)、YR1=(和田紀夫,堀江貴文,孫正義)及びYR2=(和田紀夫,堀江貴文)となる。
【0040】
次に、共通度計算部22は、上記と同様にWtimeの値を求める。なお、固有表現の組(X=NTT,Y=和田紀夫)についてのWtimeの値を図9(a)に示し、固有表現の組(X=ライブドア,Y=堀江貴文)についてのWtimeの値を図9(b)に示す。
【0041】
次いで、共通度計算部22は、相互情報量記憶部40に記憶された相互情報量とWtimeの値に基づき各関係表現(R1=社長,R2=会長)についての共通度SIM(R1,R2)を求める。なお、この場合についての計算内容を図9(c)に示す。ここでは、上記時間差の最小値をWtimeの値として用いている。
【0042】
そして、同一性判別部23は、共通度計算部22によって求められた各関係表現の共通度に基づき各関係表現の同一性を判別する(図3のステップS5)。ここで、同一性判別部23は、各関係表現の共通度が所定の閾値(本実施形態では0.8)以上であれば各関係表現に同一性があると判別し、該閾値未満であれば各関係表現に同一性が無いと判別する。従って、上記の入力例のうち(R1=母,R2=お母さん)という各関係表現については同一性があると判別され、(R1=社長,R2=会長)という各関係表現については同一性が無いと判別される。
【0043】
このようにして、「母(R1),お母さん(R2)」という関係表現の組には同一性があると判別される一方で、「社長(R1),会長(R2)」という関係表現の組には同一性が無いと判別される。
【0044】
前述したように上記実施形態では、複数の関係表現(R1,R2)が入力されると、該関係表現によって関係付けられた固有表現の組(X,Y)と、該固有表現の組及び該関係表現が表記された日時を表す時間情報(T)とが抽出され、同一の固有表現の組にそれぞれ対応する各関係表現のうち一方の関係表現に対応する時間情報と他方の関係表現に対応する時間情報との時間差に基づいて求められた共通度により各関係表現の同一性が判別されることから、各関係表現間の同一性を、各関係表現がそれぞれ用いられたときの時間差に基づき判別することが可能となる。従って、例えば「NTT(X),和田紀夫(Y)」という固有表現の組に対して「社長(R1)」という関係表現が過去に用いられていたが、現在では「会長(R2)」という関係表現が用いられている場合でも、「社長(R1)」と「会長(R2)」の間に同一性が無いと正確に判別することができ、一組の固有表現の関係を表す複数の関係表現間の同一性を高精度で判別することができる。
【0045】
また、所定のテキスト集合から抽出された固有表現の組(X,Y)と、該固有表現の組を関係付ける関係表現(R1,R2)と、該固有表現の組及び該関係表現に対応する時間情報(T)とを事前に記憶する固有表現記憶部30を備え、固有表現抽出処理部10は、入力された関係表現によって関係付けられた固有表現の組(X,Y)と、該固有表現の組(X,Y)及び該関係表現(R1,R2)に対応する時間情報(T)とを、各関係表現毎に固有表現記憶部30から取得するので、固有表現の組(X,Y)及び時間情報(T)を容易に取得することができ、各関係表現(R1,R2)の同一性を判別する際の処理効率を向上させることができる。
【0046】
さらに、関係表現判別処理部20は、同一の固有表現の組(X,Y)にそれぞれ対応する各関係表現(R1,R2)のうち一方の関係表現(R1)に対応する時間情報(T)と他方の関係表現(R2)に対応する時間情報(T)との時間差の最大値(Furthest)に基づき各関係表現(R1,R2)の共通度を求めるので、例えば過去に用いられていた一方の関係表現(R1)が最初に用いられたときの時間(T)と、現在用いられている他方の関係表現(R2)が最後に用いられたときの時間(T)との時間差に基づき各関係表現(R1,R2)間の同一性を判別することができ、各関係表現(R1,R2)間の同一性の判別精度を向上させることができる。
【0047】
さらにまた、関係情報抽出処理部20は、同一の固有表現の組(X,Y)にそれぞれ対応する各関係表現(R1,R2)のうち一方の関係表現(R1)に対応する時間情報(T)と他方の関係表現(R2)に対応する時間情報(T)との時間差の最小値(Nearest)に基づき各関係表現(R1,R2)の共通度を求めるので、例えば過去に用いられていた一方の関係表現(R1)が最後に用いられたときの時間(T)と、現在用いられている他方の関係表現(R2)が最初に用いられたときの時間(T)との時間差に基づき各関係表現(R1,R2)間の同一性を判別することができ、各関係表現(R1,R2)間の同一性の判別精度を向上させることができる。
【0048】
さらに、関係情報抽出処理部20は、同一の固有表現の組(X,Y)にそれぞれ対応する各関係表現(R1,R2)のうち一方の関係表現(R1)に対応する時間情報(T)と他方の関係表現(R2)に対応する時間情報(T)との時間差の平均値(Average)に基づき各関係表現(R1,R2)の共通度を求めるので、各関係表現(R1,R2)がそれぞれ用いられたときの時間差の平均に基づき各関係表現(R1,R2)間の同一性を判別することができ、各関係表現(R1,R2)間の同一性の判別精度を向上させることができる。
【0049】
なお、上記実施形態は本発明の具体例に過ぎず、本発明が上記実施形態のみに限定されることはない。例えば、本発明は、周知のコンピュータに記録媒体もしくは通信回線を介して、図2の構成図に示された機能を実現するプログラムあるいは図3のフローに示された手順を備えるプログラムをインストールすることによっても実現可能である。

【特許請求の範囲】
【請求項1】
一組の固有表現間の関係をそれぞれ表す複数の関係表現の同一性を判別する装置であって、
前記各関係表現が入力されると、該関係表現によって関係付けられた固有表現の組と、該固有表現の組及び該関係表現が表記された日時を表す時間情報とを、該各関係表現毎に所定のテキスト集合から抽出する固有表現抽出処理部と、
固有表現抽出処理部による抽出結果を取得すると、同一の固有表現の組にそれぞれ対応する各関係表現のうち一方の関係表現に対応する時間情報と他方の関係表現に対応する時間情報との時間差に基づき各関係表現の共通度を求めるとともに、該共通度に基づき各関係表現の同一性を判別する関係表現判別処理部とを備えた
ことを特徴とする関係表現判別装置。
【請求項2】
前記所定のテキスト集合から抽出された固有表現の組と、該固有表現の組を関係付ける関係表現と、該固有表現の組及び該関係表現に対応する時間情報とを事前に記憶する記憶部を備え、
固有表現抽出処理部は、入力された関係表現によって関係付けられた固有表現の組と、該固有表現の組及び該関係表現に対応する時間情報とを、各関係表現毎に記憶部から取得する
ことを特徴とする請求項1記載の関係表現判別装置。
【請求項3】
前記関係表現判別処理部は、同一の固有表現の組にそれぞれ対応する各関係表現のうち一方の関係表現に対応する時間情報と他方の関係表現に対応する時間情報との時間差の最大値に基づき各関係表現の共通度を求める
ことを特徴とする請求項1または2記載の関係表現判別装置。
【請求項4】
前記関係表現判別処理部は、同一の固有表現の組にそれぞれ対応する各関係表現のうち一方の関係表現に対応する時間情報と他方の関係表現に対応する時間情報との時間差の最小値に基づき各関係表現の共通度を求める
ことを特徴とする請求項1または2記載の関係表現判別装置。
【請求項5】
前記関係表現判別処理部は、同一の固有表現の組にそれぞれ対応する各関係表現のうち一方の関係表現に対応する時間情報と他方の関係表現に対応する時間情報との時間差の平均値に基づき各関係表現の共通度を求める
ことを特徴とする請求項1または2記載の関係表現判別装置。
【請求項6】
一組の固有表現間の関係をそれぞれ表す複数の関係表現の同一性を、コンピュータを用いて判別する方法であって、
前記コンピュータは、
前記各関係表現が入力されると、該関係表現によって関係付けられた固有表現の組と、該固有表現の組及び該関係表現が表記された日時を表す時間情報とを、該各関係表現毎に所定のテキスト集合から抽出し、
同一の固有表現の組にそれぞれ対応する各関係表現のうち一方の関係表現に対応する時間情報と他方の関係表現に対応する時間情報との時間差に基づき各関係表現の共通度を求めるとともに、該共通度に基づき各関係表現の同一性を判別する
ことを特徴とする関係表現判別方法。
【請求項7】
コンピュータを、請求項1乃至5何れか1項記載の関係表現判別装置の各手段として機能させるためのプログラム。
【請求項8】
コンピュータに、請求項6記載の関係表現判別方法の各処理を実行させるためのプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公開番号】特開2010−282555(P2010−282555A)
【公開日】平成22年12月16日(2010.12.16)
【国際特許分類】
【出願番号】特願2009−137315(P2009−137315)
【出願日】平成21年6月8日(2009.6.8)
【出願人】(000004226)日本電信電話株式会社 (13,992)
【Fターム(参考)】