説明

請求項構造情報生成装置、請求項構造情報生成方法、及びプログラム

【課題】深い階層を有する特許請求項の構造解析を行う請求項構造情報生成装置を提供する。
【解決手段】記憶部11で記憶される請求項を形態素解析する形態素解析部12、請求項の文節を特定する文節特定部13、記述断片の区切であり記述断片間の関係を示す表層の手がかり情報とトークンとを有する表層区切情報が記憶される表層区切情報記憶部14、請求項の表層の手かがり情報に該当する位置にトークンを付与するトークン付与部15、記述断片の区切となる文節の品詞の手がかり情報と区切文節タイプとを有する文節タイプ対応情報が記憶される文節タイプ対応情報記憶部16、請求項の品詞の手がかり情報に該当する文節に区切文節タイプを付与する区切文節タイプ付与部17、付与されたトークン・区切文節タイプを用いて記述断片の構造を示す請求項構造情報を生成する生成部19、請求項構造情報を出力する出力部20を備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、特許請求項の構造に関する情報である請求項構造情報を生成する請求項構造情報生成装置等に関する。
【背景技術】
【0002】
特許出願の対象書類である「特許請求の範囲」に記述される特許請求項は、通常、長文かつ独特の記述スタイルで記述されるため、専門家以外の人にとっては極めて読みにくいものになっている。これに対して、実際の特許請求項の記述で多用される、いくつかの定型的表現を手がかりとして構造解析を行う手法が提案されている(例えば、特許文献1、特許文献2、非特許文献1参照)。また、特許請求項に記述されている内容を簡易に把握して記憶しやすくするための縮約表現手法も提案されている(例えば、特許文献3参照)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特許第3908261号公報
【特許文献2】特許第4289871号公報
【特許文献3】特開2004−240604号公報
【非特許文献】
【0004】
【非特許文献1】新森昭宏,奥村学,丸川雄三,岩山真,「手がかり句を用いた特許請求項の構造解析」,情報処理学会論文誌,Vol.45,No.3,p.891−905,2004年
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、前述の特許文献1,2、非特許文献1は、特許請求項のトップレベルの構造を解析するものであり、より深い構造を持つ特許請求項については、構造解析がなされなかった。例えば、次のような特許請求項について、それらの提案手法を用いた場合には、図16で示されるように構造解析が行われ、「外部に接続されるダクトと、エアを排出する送風手段と、エアを清浄化する清浄化手段と、を備え、」の部分については、何ら解析が行われていなかった。
【0006】
[請求項]
画像形成装置において、
外部に接続されるダクトと、
エアを排出する送風手段と、
エアを清浄化する清浄化手段と、を備え、
前記ダクトは内部ダクトを有し、
前記清浄化手段は、前記内部ダクト内に設置されている、
ことを特徴とする画像形成装置。
【0007】
また、前述の特許文献3は、「発明を構成する要素」を抽出し、その説明部分を削除するものであり、特許請求項の構造を解析するものではない。
【0008】
本発明は、上記のような状況に応じてなされたものであり、より深い構造を持つ特許請求項についても、構造解析を行うことができる請求項構造情報生成装置等を提供することを目的とする。
【課題を解決するための手段】
【0009】
上記目的を達成するため、本発明による請求項構造情報生成装置は、特許請求項のテキストが区切られた記述断片と当該記述断片の構造とを示す請求項構造情報を生成する請求項構造情報生成装置であって、特許請求項のテキストである特許請求項情報が記憶される記憶部と、特許請求項情報を形態素解析する形態素解析部と、特許請求項情報の文節の区切位置を特定する文節特定部と、記述断片の区切となると共に記述断片間の関係を示す表層の手がかり情報と、表層の手がかり情報に対応するトークンとを有する表層区切情報が2以上記憶される表層区切情報記憶部と、特許請求項情報において、表層の手かがり情報に該当する位置に、表層の手がかり情報に対応するトークンを付与するトークン付与部と、記述断片の区切となる文節の品詞の手がかり情報と、品詞の手がかり情報に対応する区切文節タイプとを有する文節タイプ対応情報が2以上記憶される文節タイプ対応情報記憶部と、特許請求項情報において、品詞の手がかり情報に該当する文節に、品詞の手がかり情報に対応する区切文節タイプを付与する区切文節タイプ付与部と、特許請求項情報に付与されたトークンと区切文節タイプとを用い、あらかじめ規定されている特許請求項の構造を示す規則に応じて、特許請求項情報の記述断片の構造を示す請求項構造情報を生成する生成部と、生成部が生成した請求項構造情報を出力する出力部と、を備えたものである。
【0010】
このような構成により、表層及び品詞の手がかり情報と特許請求項の構造を示す規則とを用いることによって、特許請求項に含まれる記述断片の構造を検出することができる。また、文節単位で解析を行うことにより、従来例のように形態素ごとに解析を行っていた場合よりもより詳細なレベルで解析を行うことができるようになる。その結果、深い階層の構造をも解析することができるようになる。
【0011】
また、本発明による請求項構造情報生成装置では、記述断片の区切の並びに応じて、記述断片の区切でない位置に存在する区切文節タイプを削除する区切文節タイプ変更部をさらに備え、生成部は、区切文節タイプ変更部が区切文節タイプを削除した後に請求項構造情報を生成してもよい。
【0012】
このような構成により、記述断片の区切の並びに応じて、区切文節タイプを変更することができ、より適切な構造解析を行うことができるようになる。例えば、表層や品詞の手がかり情報を用いた区切位置の検出のみでは、形式的な区切位置をも検出してしまうことになりうるが、この区切文節タイプ変更部による区切文節タイプの削除を行うことによって、不適切な区切位置を削除することができ、より高精度な解析を実現することができる。
【0013】
また、本発明による請求項構造情報生成装置では、区切文節タイプ変更部は、並列する記述断片の終端の区切文節タイプである終端区切文節タイプと、終端区切文節タイプより以前の、並列する記述断片が継続しうる区切文節タイプである継続区切文節タイプとの間に終端区切文節タイプが存在する場合に、両区切文節タイプの間に存在する終端区切文節タイプを削除してもよい。
【0014】
このような構成により、一つの記述断片に含まれる小休止的な終端区切文節タイプを削除することができ、区切位置を適切にすることができる。例えば、特許請求項に「……し、……し、……し、……することを特徴とする」という記述や、「……と、……と、……と、……を備え、」という記述が存在した場合に、その「……」の部分に「する」が含まれたとしても、それは「……し、」や「……と、」等の中の小休止的な区切であって、記述断片の区切ではないと考えられるため、その「する」に対応する終端区切文節タイプを削除することになる。
【0015】
また、本発明による請求項構造情報生成装置では、区切文節タイプ変更部は、改行が存在する場合であって、改行が後続しない動詞に関する区切文節タイプが存在する場合に、区切文節タイプを削除してもよい。
このような構成により、強力な区切である改行が後続しない動詞に関する区切文節タイプを削除することができ、区切位置を適切にすることができる。
【0016】
また、本発明による請求項構造情報生成装置では、生成部は、文脈自由文法で記述されたトークン及び区切文節タイプに関する規則と、規則に対応する構造を特許請求項情報に付与するアクションとを有する文法ファイルを用いて生成された構文解析器を用いて、特許請求項情報に対応する請求項構造情報を生成してもよい。
【0017】
このような構成により、文法ファイルを用いて生成された構文解析器を用いることによって、トークンや区切文節タイプの付与された特許請求項情報から、特許請求項の構造を解析した請求項構造情報を生成することができる。
【0018】
また、本発明による請求項構造情報生成装置では、特許請求項の構造の文脈自由文法による記述が特許請求項の終端から先頭への方向で記述されており、生成部は、トークン及び区切文節タイプの付与された特許請求項情報を終端から先頭への方向で取り込むことによって請求項構造情報を生成してもよい。
【0019】
特許請求項では、終端に定型的な表現が存在し、その終端から先頭の方向で構造が確定するため、このような構成により、文法のあいまいさに起因する問題の発生を回避することができうる。例えば、shift/reduce conflictや、reduce/reduce conflictといった曖昧性を回避することができる。
【0020】
また、本発明による請求項構造情報生成装置では、生成部は、特許請求項情報に、文法ファイルに含まれる規則に対応した構造を示すマークを付与することによって、マークアップ言語を用いて記述された請求項構造情報を生成してもよい。
このような構成により、請求項構造情報を、例えば、XMLなどのマークアップ言語を用いて記述することができる。
【0021】
また、本発明による請求項構造情報生成装置では、生成部は、あらかじめ規定されているトークンの付与された記述断片及び区切文節タイプの付与された記述断片の係り受け関係に応じて、トークン付与部が付与したトークン及び区切文節タイプ付与部が付与した区切文節タイプで区切の示される記述断片間の係り受け関係を特定し、記述断片間の係り受け関係を示す請求項構造情報を生成してもよい。
このような構成により、トークンや区切文節タイプによって区切位置が示される記述断片の間の係り受け関係を示す請求項構造情報を得ることができる。
【0022】
また、本発明による請求項構造情報生成装置では、出力部は、生成部が生成した請求項構造情報を、記述断片間の関係が分かるように表示してもよい。
このような構成により、その表示された請求項構造情報を見ることによって、特許の専門家でなくても、特許請求項の構造を容易に把握することができるようになる。
【0023】
また、本発明による請求項構造情報生成装置では、トークンには、構成要素の包含関係に応じたトークンが存在し、区切文節タイプには、構成要素の包含関係を示すトークンに対して、親の構成要素に応じた区切文節タイプである親区切文節タイプと、構成要素の包含関係を示すトークンに対して、子の構成要素に応じた区切文節タイプである子区切文節タイプと、が存在し、出力部は、親区切文節タイプに対応する記述断片と、子区切文節タイプに対応する記述断片との親子関係が分かるように両記述断片を表示してもよい。
このような構成により、特許請求項に含まれる構成要素の親子関係をより明確に示すことができるようになる。
【0024】
また、本発明による請求項構造情報生成装置では、親区切文節タイプと子区切文節タイプとの付与された特許請求項情報を用いて、構成要素の親子関係を取得する親子関係取得部と、親子関係取得部が取得した構成要素の親子関係を用いて、構成要素の階層レベルを取得する階層レベル取得部と、を備え、出力部は、階層レベル取得部が取得した階層レベルに応じて、親区切文節タイプ及び子区切文節タイプに対応する記述断片を表示してもよい。
このような構成により、階層レベルに応じた表示が可能となり、例えば、ある構成要素がどの階層に存在するのかを容易に把握することができるようになる。
【発明の効果】
【0025】
本発明による請求項構造情報生成装置等によれば、より深い構造を持つ特許請求項についても、構造解析を行うことができる。
【図面の簡単な説明】
【0026】
【図1】本発明の実施の形態1による請求項構造情報生成装置の構成を示すブロック図
【図2】同実施の形態による請求項構造情報生成装置の動作を示すフローチャート
【図3】同実施の形態における表層区切情報の一例を示す図
【図4】同実施の形態における文節タイプ対応情報の一例を示す図
【図5A】同実施の形態における状態遷移表の一例を示す図
【図5B】同実施の形態における状態遷移表の一例を示す図
【図6A】同実施の形態における文法ファイルの一例を示す図
【図6B】同実施の形態における文法ファイルの一例を示す図
【図6C】同実施の形態における文法ファイルの一例を示す図
【図6D】同実施の形態における文法ファイルの一例を示す図
【図6E】同実施の形態における文法ファイルの一例を示す図
【図6F】同実施の形態における文法ファイルの一例を示す図
【図6G】同実施の形態における文法ファイルの一例を示す図
【図6H】同実施の形態における文法ファイルの一例を示す図
【図6I】同実施の形態における文法ファイルの一例を示す図
【図6J】同実施の形態における文法ファイルの一例を示す図
【図6K】同実施の形態における文法ファイルの一例を示す図
【図6L】同実施の形態における文法ファイルの一例を示す図
【図7A】同実施の形態における請求項構造情報の一例を示す図
【図7B】同実施の形態における請求項構造情報の一例を示す図
【図8】同実施の形態における請求項構造情報の表示の一例を示す図
【図9】同実施の形態における請求項構造情報の表示の一例を示す図
【図10】同実施の形態における請求項構造情報の表示の一例を示す図
【図11】同実施の形態による請求項構造情報生成装置の他の構成を示すブロック図
【図12】同実施の形態における構成要素の親子関係の一例を示す図
【図13】同実施の形態における請求項構造情報の表示の一例を示す図
【図14】上記実施の形態におけるコンピュータシステムの外観一例を示す模式図
【図15】上記実施の形態におけるコンピュータシステムの構成の一例を示す図
【図16】従来例における特許請求項の解析結果の一例を示す図
【発明を実施するための形態】
【0027】
以下、本発明による請求項構造情報生成装置について、実施の形態を用いて説明する。なお、以下の実施の形態において、同じ符号を付した構成要素及びステップは同一または相当するものであり、再度の説明を省略することがある。
【0028】
(実施の形態1)
本発明の実施の形態1による請求項構造情報生成装置について、図面を参照しながら説明する。本実施の形態による請求項構造情報生成装置は、表層及び品詞の手がかり情報を用いることによって、より深い構造を持つ特許請求項についても、構造解析を行うものである。
【0029】
図1は、本実施の形態による請求項構造情報生成装置1の構成を示すブロック図である。本実施の形態による請求項構造情報生成装置1は、特許請求項のテキストが区切られた記述断片とその記述断片の構造とを示す請求項構造情報を生成するものであって、記憶部11と、形態素解析部12と、文節特定部13と、表層区切情報記憶部14と、トークン付与部15と、文節タイプ対応情報記憶部16と、区切文節タイプ付与部17と、区切文節タイプ変更部18と、生成部19と、出力部20とを備える。なお、記述断片とは、特許請求項において、係り受け関係を解析する単位であり、隣接する複数の文字から構成されるものである。記述断片は、例えば、構成要素を含む文節であってもよく、構成要素に関する説明であってもよく、特許請求項に独特な表現(例えば、構成要素の包含関係を示す表現や、ジェプソン形式であることを示す表現、引用関係を示す表現等)であってもよく、その他のものであってもよい。
【0030】
記憶部11では、特許請求項のテキストである特許請求項情報が記憶される。その特許請求項情報は、例えば、一の請求項の情報であってもよく、あるいは、複数の請求項の情報であってもよい。後者の場合には、複数の請求項は、従属関係を有するものであってもよく、あるいは、そうでなくてもよい。また、その特許請求項情報は、例えば、特許公報や特許公開公報における[特許請求の範囲]の情報であってもよく、あるいは、そうでなくてもよい。この記憶部11で記憶される特許請求項情報が、構造解析の対象となるものである。
【0031】
記憶部11に特許請求項情報が記憶される過程は問わない。例えば、記録媒体を介して情報が記憶部11で記憶されるようになってもよく、通信回線等を介して送信された特許請求項情報が記憶部11で記憶されるようになってもよく、あるいは、入力デバイスを介して入力された特許請求項情報が記憶部11で記憶されるようになってもよい。記憶部11での記憶は、RAM等における一時的な記憶でもよく、あるいは、長期的な記憶でもよい。記憶部11は、所定の記録媒体(例えば、半導体メモリや磁気ディスク、光ディスクなど)によって実現されうる。なお、記憶部11において、特許請求項情報以外の情報が記憶されてもよいことは言うまでもない。例えば、後述する各構成要素による処理の結果の情報(具体的には、形態素解析の結果や、付与されたトークン、文節タイプ等)が記憶部11で記憶されてもよい。
【0032】
形態素解析部12は、記憶部11で記憶されている特許請求項情報を形態素解析する。その形態素解析によって、特許請求項情報のテキストを形態素に分けることができ、また形態素ごとの品詞の情報を得ることができる。その形態素解析のシステムとしては、例えば、京都大学情報学研究科−日本電信電話株式会社コミュニケーション科学基礎研究所共同研究ユニットプロジェクトを通じて開発された「MeCab」や、奈良先端科学技術大学院大学で開発された「ChaSen(茶筌)」(http://chasen.naist.jp)等が知られている。例えば、「MeCab」の場合には、出力フォーマットのパラメータを指定することで、各形態素を1行で表示し、かつ、「見出し」、「品詞文字列」、「活用形」、「見出し(基本形)」、「2階層目の品詞」の5つの情報をタブ区切りで出力させることができる。なお、「MeCab」は1行ごとに解析を行う仕様となっているため、特許請求項情報のテキストにおいて改行が存在する場合には、行ごとに形態素解析を行い、行の区切りを示す品詞文字列(例えば、「NEWLINE」等)を挿入した上で、結果を連結させてもよい。この形態素解析部12による形態素解析の結果は、記憶部11で記憶されてもよく、あるいは、他の図示しない記録媒体で記憶されてもよい。
【0033】
文節特定部13は、特許請求項情報の文節の区切位置を特定する。この文節の区切位置を特定する方法は問わない。例えば、形態素解析の結果である形態素を文節単位にまとめ上げることによって、文節の区切位置を特定してもよく、あるいは、手がかり句やその他の情報を用いることによって、特許請求項情報そのものから文節の区切位置を特定してもよい。本実施の形態では、前者の場合について説明する。その前者の場合には、文節特定部13は、例えば、図5で示される状態遷移表と、形態素解析の結果である「品詞文字列」、「活用形」、「2階層目の品詞」とを用いて、形態素を文節にまとめ上げてもよい。例えば、形態素A,Bがこの順番で並んでいた場合に、図5の状態遷移表における形態素Aに対応する「現在」の行と、形態素Bに対応する「次」の列との交わるところの数値が「1」であれば、形態素A,Bの間に文節の区切位置が存在しないことになり(すなわち、形態素A,Bは同じ文節に含まれることになる)、その数値が「0」であれば、形態素A,Bの間に文節の区切位置が存在することになる(すなわち、形態素A,Bは異なる文節に含まれることになる)。この処理をすべての隣接する2個の形態素について行うことによって、文節特定部13は、文節の区切位置を特定することができる。なお、これ以外の方法によって、文節の区切位置の特定を行ってもよいことは言うまでもない。例えば、連続する2個の形態素について、両者が同一の文節に含まれるべきかどうかを記述するルールを列挙し、それを順次適用することで文節まとめ上げをしてもよい。また、文節の区切位置を特定するとは、例えば、文節の区切位置を示す情報(例えば、文節の区切位置に応じた先頭からの文字数や、バイト数等)を記憶部11や図示しない記録媒体に蓄積することであってもよく、形態素間の文節の区切位置に対応する箇所に、区切位置であることを示す情報を挿入することであってもよく、形態素解析の結果である各形態素を、文節単位にまとめ上げることであってもよく、あるいは、文節の区切位置を知ることができるその他の方法であってもよい。また、文節特定部13が文節の区切位置の特定を行うタイミングは、その特定を形態素解析の結果を用いて行う場合には、形態素解析部12による形態素解析の後となる。また、その特定を、後述する表層の手がかり情報に対応するトークンをも用いて行う場合には、文節特定部13は、後述するトークン付与部15によるトークンの付与後に文節の区切位置の特定を行ってもよい。また、その特定を、特許請求項情報そのものから行う場合には、文節特定部13は、形態素解析やトークンの付与と関係のないタイミングで文節の区切位置の特定を行ってもよい。
【0034】
表層区切情報記憶部14では、2以上の表層区切情報が記憶される。ここで、表層区切情報は、記述断片の区切となると共に記述断片間の関係を示す表層の手がかり情報と、その表層の手がかり情報に対応するトークンとを有する情報である。表層とは、文字列そのものの意味である。前述のMeCabの説明における「見出し」が表層である。表層の手がかり情報は、いわゆる手がかり句のことである。その表層の手がかり情報は、通常、正規表現を用いて記述される。トークンは、その表層の手がかり情報を識別する情報である。
【0035】
その表層の手がかり情報には、例えば、ジェプソン形式の記載(例えば、「において、」等)に応じたものが存在してもよく、特徴記載(例えば、「を特徴とする、」等)に応じたものが存在してもよく、構成要素の包含関係の記載(例えば、「を備えた」「を備えており、」等)に応じたものが存在してもよく、引用関係の記載(例えば、「請求項…に」等)に応じたものが存在してもよい。また、それらの表層の手がかり情報に対応して、ジェプソン形式のトークンや、特徴記載のトークン、構成要素の包含関係のトークン、引用関係のトークン等が存在してもよい。この表層の手がかり情報は、記述断片の区切となるものである。すなわち、表層の手がかり情報に該当する位置の直前及び/または直後が、通常、記述断片の区切位置となる。また、表層の手がかり情報によって、記述断片の間の関係が検出されることになる。すなわち、表層の手がかり情報は、その表層の手がかり情報を用いることによって記述断片間の関係を検出できる、という意味において、記述断片間の関係を示すものである。その記述断片間の関係は、例えば、記述断片の係り受けの関係であり、その係り受けの詳細については後述する。
【0036】
表層区切情報記憶部14に2以上の表層区切情報が記憶される過程は問わない。例えば、記録媒体を介して2以上の表層区切情報が表層区切情報記憶部14で記憶されるようになってもよく、通信回線等を介して送信された2以上の表層区切情報が表層区切情報記憶部14で記憶されるようになってもよく、あるいは、入力デバイスを介して入力された2以上の表層区切情報が表層区切情報記憶部14で記憶されるようになってもよい。表層区切情報記憶部14での記憶は、RAM等における一時的な記憶でもよく、あるいは、長期的な記憶でもよい。表層区切情報記憶部14は、所定の記録媒体(例えば、半導体メモリや磁気ディスク、光ディスクなど)によって実現されうる。
【0037】
また、表層区切情報に含まれる各情報、例えば、表層の手がかり情報やトークンは、それらの情報そのものであってもよく、あるいは、それらの情報を特定可能な情報であってもよい。後者の場合には、表層区切情報に含まれる表層の手がかり情報等は、例えば、表層の手がかり情報等が格納されている領域を示すポインタやアドレスであってもよい。このことは、他の情報についても同様であるとする。
【0038】
トークン付与部15は、特許請求項情報において、表層の手かがり情報に該当する位置に、その表層の手がかり情報に対応するトークンを付与する。トークンを付与するとは、特許請求項情報において、結果としてトークンに対応する位置を特定することができるのであれば、その手法は問わない。トークン付与部15は、例えば、特許請求項情報の文字列そのものに対して、トークンを追記してもよく、あるいは、トークンと、そのトークンに対応する特許請求項情報の範囲とを対応付ける情報を記憶部11や他の図示しない記録媒体に蓄積してもよい。本実施の形態では、前者の場合について説明する。トークン付与部15は、例えば、表層区切情報に含まれる表層の手がかり情報を検索キーとして特許請求項情報を検索し、ヒットした箇所に、その表層の手がかり情報に対応するトークンを付与してもよい。トークン付与部15は、そのような処理を、表層区切情報に含まれるすべての表層の手がかり情報について行ってもよい。なお、第1の表層の手がかり情報(例えば、「ことを特徴とする」)が、第2の表層の手がかり情報(例えば、「を特徴とする」)を含む場合には、トークン付与部15は、例えば、第1の表層の手がかり情報から先に検索を行ってトークンを付与し、トークンの付与されている箇所は、それ以降の検索時に検索を行わないようにしてもよい。または、トークン付与部15は、例えば、第2の表層の手がかり情報から先に検索を行ってトークンを付与し、第1の表層の手がかり情報を用いた検索を行う際に、すでにトークンの付与されている箇所についても検索を行って、すでにトークンの付与されている箇所がヒットした際には、上書きでトークンを付与してもよい。
【0039】
文節タイプ対応情報記憶部16では、2以上の文節タイプ対応情報が記憶される。ここで、文節タイプ対応情報は、記述断片の区切となる文節の品詞の手がかり情報と、その品詞の手がかり情報に対応する区切文節タイプとを有する情報である。品詞の手がかり情報は、表層の手がかり句の品詞版と言いうるものである。すなわち、品詞の手がかり情報は、品詞に関する条件を少なくとも含む手がかり情報である。品詞の手がかり情報は、品詞のみを特定する情報であってもよく、品詞と活用形とを特定する情報であってもよく、品詞や、品詞と活用形以外に、表層の情報をも特定する情報であってもよく、その他の品詞に関係する情報であってもよい。なお、品詞の手がかり情報には、記述断片の区切とは関係のない文節の品詞の手がかり情報が存在してもよい。その場合には、そのような区切と関係のない文節の品詞の手がかり情報に対応する文節のタイプと、区切文節タイプとを含めて、単に文節タイプと呼ぶことにする。すなわち、文節タイプには、その文節が記述断片の区切となる区切文節タイプと、区切とは関係のないものとが存在することになる。
【0040】
その品詞の手がかり情報には、例えば、並列する記述断片の終端の区切文節タイプ(以下、これを「終端区切文節タイプ」と呼ぶこともある)に応じたもの(例えば、「動詞や助動詞の終止形」等)が存在してもよく、並列する記述断片が継続しうる(すなわち、終端とは言えない)区切文節タイプ(以下、これを「継続区切文節タイプ」と呼ぶこともある)に応じたもの(例えば、「動詞や助動詞の連用形」「名詞+と」等)が存在してもよい。また、その他の品詞の手かがり情報が存在してもよい。
【0041】
文節タイプ対応情報記憶部16に2以上の文節タイプ対応情報が記憶される過程は問わない。例えば、記録媒体を介して2以上の文節タイプ対応情報が文節タイプ対応情報記憶部16で記憶されるようになってもよく、通信回線等を介して送信された2以上の文節タイプ対応情報が文節タイプ対応情報記憶部16で記憶されるようになってもよく、あるいは、入力デバイスを介して入力された2以上の文節タイプ対応情報が文節タイプ対応情報記憶部16で記憶されるようになってもよい。文節タイプ対応情報記憶部16での記憶は、RAM等における一時的な記憶でもよく、あるいは、長期的な記憶でもよい。文節タイプ対応情報記憶部16は、所定の記録媒体(例えば、半導体メモリや磁気ディスク、光ディスクなど)によって実現されうる。
【0042】
区切文節タイプ付与部17は、特許請求項情報において、品詞の手がかり情報に該当する文節に、品詞の手がかり情報に対応する区切文節タイプを付与する。区切文節タイプ付与部17は、区切文節タイプではない文節タイプを付与してもよい。また、区切文節タイプ付与部17は、形態素解析部12による形態素解析の結果を用いて、この付与の処理を行うものとする。文節タイプの付与は、前述したトークンの付与と同様に、特許請求項情報において、結果として文節タイプに対応する位置を特定することができるのであれば、その手法は問わない。例えば、特許請求項情報の文字列そのものに対して、文節タイプを追記してもよく、あるいは、文節タイプと、その文節タイプに対応する特許請求項情報の範囲とを対応付ける情報を記憶部11や他の図示しない記録媒体に蓄積してもよい。本実施の形態では、前者の場合について説明する。区切文節タイプ付与部17は、例えば、文節タイプ対応情報に含まれる品詞の手がかり情報を検索キーとして形態素解析の結果を検索し、ヒットした箇所に、その品詞の手がかり情報に対応する文節タイプを付与してもよい。区切文節タイプ付与部17は、そのような処理を、文節タイプ対応情報に含まれるすべての品詞の手がかり情報について行ってもよい。なお、第1の品詞の手がかり情報が、第2の品詞の手がかり情報を含む場合には、トークンの付与の場合と同様に、例えば、第1の品詞の手がかり情報から先に文節タイプの付与を行い、すでに文節タイプの付与されている箇所は、それ以降の文節タイプの付与を行わないようにしてもよく、または、第2の品詞の手がかり情報から先に文節タイプの付与を行い、第1の品詞の手がかり情報を用いた文節タイプの付与を行う際に、すでに文節タイプの付与されている箇所については、上書きで文節タイプを付与してもよい。この区切文節タイプ付与部17による文節タイプの付与の結果、一の文節に一の文節タイプが付与されることになる。なお、文節タイプの付与されない文節が存在してもよい。また、今後の説明において、文節タイプAの付与された文節のことを、単にAと呼ぶこともある。
【0043】
区切文節タイプ変更部18は、記述断片の区切の並びに応じて、記述断片の区切でない位置に存在する区切文節タイプを削除する。「記述断片の区切の並びに応じて」とは、特許請求項情報に付与されたトークンや区切文節タイプの並びに応じて、ということである。すなわち、付与されたトークンや区切文節タイプの並びが所定の条件を満たした場合に、区切文節タイプ変更部18は、その条件を満たした並びにおける特定の区切文節タイプを削除する。具体的には、区切文節タイプ変更部18は、終端区切文節タイプと、その終端区切文節タイプより以前の(すなわち、それよりも先頭に近い位置に存在する)継続区切文節タイプとの間に終端区切文節タイプが存在する場合に、その終端区切文節タイプと継続区切文節タイプとの間に存在する終端区切文節タイプを削除してもよい。また、区切文節タイプ変更部18は、改行が存在する場合であって、改行が後続しない、動詞に関する区切文節タイプ(この区切文節タイプは、例えば、動詞に関する終端区切文節タイプであってもよく、動詞に関する継続区切文節タイプであってもよい)が存在する場合に、その区切文節タイプを削除してもよい。なお、「改行が後続しない」区切文節タイプとは、その区切文節タイプの付与された文節の直後に改行が存在しない区切文節タイプのことである。また、「動詞に関する区切文節タイプ」とは、動詞または助動詞に関する品詞の手がかり情報に対応する区切文節タイプのことである。また、区切文節タイプ変更部18は、注目している範囲内において、その処理を行ってもよい。例えば、区切文節タイプ変更部18は、ジェプソン形式のトークンの付与されている位置よりも先頭に近い部分(この部分を「前半部」と呼ぶこともある)について、この処理を行い、また、ジェプソン形式のトークンの付与されている位置よりも終端に近い部分(この部分を「後半部」と呼ぶこともある)について、この処理を行ってもよい。また、例えば、区切文節タイプ変更部18は、一つの請求項の全体に対してこの処理を行ってもよい。また、区切文節タイプ変更部18は、区切文節タイプの削除以外に、文節タイプの付け替え(変更)を行ってもよい。区切文節タイプ変更部18は、区切文節タイプではない文節タイプを、区切文節タイプに変更してもよく、あるいは、区切文節タイプを区切文節タイプではない文節タイプに変更してもよい。後者は、区切文節タイプがなくなるという意味において、区切文節タイプの削除であると言うこともできる。
【0044】
また、区切文節タイプ変更部18は、トークンや文節タイプの並びに応じて、区切文節タイプではない文節タイプを区切文節タイプに変更してもよい。この場合には、新たな区切文節タイプが生成されることになる。例えば、区切文節タイプ変更部18は、改行が存在する場合であって、改行が後続する、動詞に関する文節タイプ(この文節タイプは区切文節タイプではないものとする)が存在する場合に、その文節タイプを区切文節タイプに変更してもよい。また、例えば、区切文節タイプ変更部18は、構成要素の包含関係のトークンの直前の名詞に関する文節タイプ(この文節タイプは区切文節タイプではないものとする)が存在する場合に、その文節タイプを区切文節タイプに変更してもよい。名詞に関する文節タイプとは、名詞に関する品詞の手がかり情報に対応する文節タイプのことである。また、区切文節タイプ変更部18による文節タイプの変更には、後述する生成部19において、構文解析器を用いた解析が行われる場合に、その解析に合致する記述とするための変更が含まれてもよい。
【0045】
ここで、トークンの付与と、文節タイプの付与、及び文節タイプの変更について簡単に説明する。特許請求項情報にトークンや文節タイプが付与されることによって、特許請求項情報における記述断片の区切位置を特定することができるようになる。トークンは、表層の手がかり句を用いて付与されるものであり、文節タイプは、品詞に関する条件を用いて付与されるものである。また、文節タイプが変更されることによって、その区切位置がより適切なものとなることになる。なお、本実施の形態による請求項構造情報生成装置1では、文節を単位として記述断片の区切位置を検出するため、従来例のように形態素を単位として記述断片の区切位置の検出を行う場合よりも、より詳細な構造に関するルールを設定することができる。従来例の場合には、文節よりも細かい形態素を単位としていたため、より詳細な構造に関するルールを設定しようとした場合に、そのルールが非常に細かいものとなってしまい、実質的にルールを作り上げることができなかった。一方、本実施の形態による請求項構造情報生成装置1では、文節を単位としているため、より詳細な構造に関するルールを妥当な範囲で設定することができ、より詳細な構造に関する解析が可能となった。
【0046】
生成部19は、特許請求項情報に付与されたトークンと区切文節タイプとを用い、あらかじめ規定されている特許請求項の構造を示す規則に応じて、特許請求項情報の記述断片の構造を示す請求項構造情報を生成する。なお、区切文節タイプ変更部18による区切文節タイプの削除や文節タイプの変更が行われた場合には、生成部19は、区切文節タイプ変更部18が区切文節タイプを削除したり、文節タイプを変更したりした後に、請求項構造情報を生成する。すなわち、その削除や変更の行われた後の、特許請求項情報に付与されたトークンと区切文節タイプとを用いて、生成部19は、請求項構造情報を生成する。請求項構造情報は、記述断片の区切と、その記述断片の属性とを少なくとも示す情報である。記述断片の属性とは、例えば、記述断片が構成要素名を含むことを示すものであってもよく、記述断片が、構成要素名を含む記述断片に対する説明であることを示すものであってもよく、記述断片がジェプソン形式の記載であることを示すものであってもよく、記述断片が構成要素の包含関係の記載であることを示すものであってもよく、記述断片間の係り受け関係を示すものであってもよい。生成部19は、特許請求項情報に付与されたトークンや区切文節タイプの種類に応じて、記述断片の区切位置を特定することができる。例えば、トークンや区切文節タイプと、そのトークンや区切文節タイプに対応する区切位置とを有する情報を用いて、生成部19は、記述断片の区切位置を特定できる。また、生成部19は、特許請求項情報に付与されたトークンや区切文節タイプそのもの、あるいは、それらの並びに応じて、記述断片の属性を特定することができる。例えば、トークンや区切文節タイプと、そのトークンや区切文節タイプに対応する属性とを有する情報を用いて、生成部19は、記述断片の属性を特定できる。また、例えば、トークンや区切文節タイプの並びを示す情報と、そのトークンや区切文節タイプに対応する属性とを有する情報を用いて、生成部19は、記述断片の属性を特定できる。
【0047】
生成部19は、例えば、構文解析器を用いて、トークン及び区切文節タイプの付与された特許請求項情報に対応する請求項構造情報を生成してもよい。その構文解析器(パーサ)は、文脈自由文法で記述されたトークン及び区切文節タイプに関する規則と、規則に対応する構造を特許請求項情報に付与するアクションとを有する文法ファイルを用いて生成されたものである。すなわち、その構文解析器によって、トークン及び区切文節タイプの付与された特許請求項情報を解析することによって、請求項構造情報が得られる。この場合には、生成部19は、あらかじめ規定されている特許請求項の構造を示す規則である文法ファイルに応じて、請求項構造情報を生成することになる。生成部19は、その特許請求項情報に、文法ファイルに含まれる規則に対応した構造を示すマーク(例えば、タグなど)を付与することによって、マークアップ言語を用いて記述された請求項構造情報を生成してもよい。その規則は、例えば、トークンや区切文節タイプの並びに関する規則であってもよい。また、アクションは、記述断片の属性に応じたものであってもよい。マークアップ言語は、例えば、XML(Extensible Markup Language)であってもよく、その他のものであってもよい。そのXMLの構造としては、谷川英和らが提案しているPML(Patent Markup Language)を使用してもよい(http://www.ird−pat.com/pml.html)。また、その構文解析器を用いて請求項構造情報を生成する際に、生成部19は、トークン及び区切文節タイプの付与された特許請求項情報を終端から先頭への方向で取り込むことによって請求項構造情報を生成してもよい。特許請求項では、終端に定型的な表現が存在し、その終端から先頭の方向で構造が確定するため、このような構成により、文法のあいまいさに起因する問題の発生を回避することができうる。例えば、shift/reduce conflictや、reduce/reduce conflictといった曖昧性を回避することができる。なお、この場合には、特許請求項の構造の文脈自由文法による記述が特許請求項の終端から先頭への方向で記述されているものとする。
【0048】
また、生成部19は、例えば、あらかじめ規定されているトークンの付与された記述断片及び区切文節タイプの付与された記述断片の係り受け関係に応じて、トークン付与部15が付与したトークン及び区切文節タイプ付与部17が付与した区切文節タイプで区切の示される記述断片間の係り受け関係を特定し、記述断片間の係り受け関係を示す請求項構造情報を生成してもよい。この場合には、あらかじめ規定されているトークンの付与された記述断片及び区切文節タイプの付与された記述断片の係り受け関係が、あらかじめ規定されている特許請求項の構造を示す規則である。あらかじめ規定されているトークンの付与された記述断片及び区切文節タイプの付与された記述断片の係り受け関係には、例えば、トークンの付与された記述断片同士の係り受け関係が含まれてもよく、区切文節タイプの付与された記述断片同士の係り受け関係が含まれてもよく、トークンの付与された記述断片と区切文節タイプの付与された記述断片との間の係り受け関係が含まれてもよい。例えば、区切文節タイプAの付与された記述断片は、トークンBの付与された記述断片に係ることがあらかじめ規定されている場合には、生成部19は、区切文節タイプAの付与された記述断片が、トークンBの付与された記述断片に係る、という係り受け関係を示す請求項構造情報を生成してもよい。その請求項構造情報は、例えば、記述断片と、その記述断片が係る記述断片を識別する情報とを対応付けた情報であってもよい。
【0049】
出力部20は、生成部19が生成した請求項構造情報を出力する。ここで、この出力は、例えば、表示デバイス(例えば、CRTや液晶ディスプレイなど)への表示でもよく、所定の機器への通信回線を介した送信でもよく、プリンタによる印刷でもよく、記録媒体への蓄積でもよく、他の構成要素への引き渡しでもよい。その出力が表示である場合に、出力部20は、生成部19が生成した請求項構造情報を、記述断片間の関係が分かるように表示してもよい。例えば、請求項構造情報が、記述断片間の係り受け関係を示すものである場合には、出力部20は、記述断片と、その記述断片間の係り受けに対応する図形とを表示してもよい。その係り受けに対応する図形は、例えば、係り受け関係のある2個の記述断片をつなぐ線の図形であってもよく、係り受け関係のある2個の記述断片の双方に付与された同じマークの図形であってもよく、その他の係り受け関係を示す図形であってもよい。また、例えば、請求項構造情報が、記述断片の区切と、その記述断片の属性とを少なくとも示す情報である場合には、出力部20は、あらかじめ規定されている属性の係り受け関係に応じて、記述断片間の係り受け関係が分かるように表示してもよい。その表示は、例えば、前述のように、記述断片と、その記述断片間の係り受けに対応する図形とを表示するものであってもよい。
【0050】
なお、出力部20は、出力を行うデバイス(例えば、表示デバイスやプリンタなど)を含んでもよく、あるいは含まなくてもよい。また、出力部20は、ハードウェアによって実現されてもよく、あるいは、それらのデバイスを駆動するドライバ等のソフトウェアによって実現されてもよい。
【0051】
なお、記憶部11と、表層区切情報記憶部14と、文節タイプ対応情報記憶部16との任意の2以上の記憶部は、同一の記録媒体によって実現されてもよく、あるいは、別々の記録媒体で実現されてもよい。前者の場合には、例えば、特許請求項情報を記憶している領域が記憶部11となり、表層区切情報を記憶している領域が表層区切情報記憶部14となる。
【0052】
次に、本実施の形態による請求項構造情報生成装置1の動作について、図2のフローチャートを用いて説明する。なお、このフローチャートにおいて、形態素解析やトークンの付与等の行われた特許請求項情報が、すべて記憶部11で記憶される場合について説明する。
【0053】
(ステップS101)形態素解析部12は、記憶部11で記憶されている特許請求項情報を形態素解析する。そして、形態素解析部12は、その結果を記憶部11に蓄積する。その形態素解析の結果は、例えば、一つの形態素の情報が一行となるテキストファイルであってもよい。
【0054】
(ステップS102)トークン付与部15は、記憶部11で記憶されている特許請求項情報に対して、表層区切情報記憶部14で記憶されている表層区切情報を用いて、トークンの付与を行う。付与されたトークンは、記憶部11において、特許請求項情報の該当箇所に対応付けられて記憶されるものとする。トークンは、例えば、形態素解析の結果のテキストファイルにおいて、表層の手がかり情報に該当する箇所と同じ行に追記されてもよい。なお、表層の手がかり情報に該当する箇所が複数の形態素にまたがる場合には、トークン付与部15は、例えば、その複数の形態素を一つにまとめてもよい。
【0055】
(ステップS103)文節特定部13は、記憶部11で記憶されている形態素解析後の各形態素をまとめ上げることによって、文節の区切を特定する。文節特定部13は、例えば、特定した文節の区切位置である形態素の間に、文節の区切位置であることを示す情報を追記してもよい。
【0056】
(ステップS104)区切文節タイプ付与部17は、記憶部11で記憶されている特許請求項情報の文節に対して、文節タイプ対応情報記憶部16で記憶されている文節タイプ対応情報を用いて、文節タイプを付与する。その付与する文節タイプには、区切文節タイプが含まれていることは前述の通りである。付与された文節タイプは、記憶部11において、特許請求項情報の該当する文節に対応付けられて記憶されるものとする。文節タイプは、例えば、文節の区切位置の特定後のテキストファイルにおいて、品詞の手がかり情報に該当する箇所と同じ行に追記されてもよい。なお、一つの文節が複数の形態素から構成されている場合には、区切文節タイプ付与部17は、例えば、この文節タイプの付与後に、文節ごとに一行となるように、その複数の形態素をまとめてもよい。
【0057】
(ステップS105)区切文節タイプ変更部18は、付与された文節タイプを、トークンや文節タイプの並びに応じて変更する。その変更には、記述断片の区切でない位置に存在する区切文節タイプを削除することが含まれることは、前述の通りである。また、区切文節タイプ変更部18は、前述のように、区切文節タイプでない文節タイプを区切文節タイプに変更してもよく、その他の文節タイプの変更を行ってもよい。
【0058】
(ステップS106)生成部19は、トークンや文節タイプの付与された特許請求項情報から、請求項構造情報を生成する。
【0059】
(ステップS107)出力部20は、生成部19が生成した請求項構造情報を出力する。そして、請求項構造情報を生成し、出力する一連の処理が終了となる。
【0060】
なお、特許請求項情報に複数の請求項が含まれる場合には、図2のフローチャートにおいて、ステップS101〜S107の処理を、請求項ごとに繰り返して実行してもよく、あるいは、複数の請求項の全体に対して、ステップS101〜S107の処理を行ってもよい。また、文節の区切位置の特定において付与されたトークンを用いない場合には、トークンの付与の処理を行うタイミングは、文節タイプの変更の処理(ステップS105)よりも以前であればいつでもよい。
【0061】
次に、本実施の形態による請求項構造情報生成装置1の動作について、具体例を用いて説明する。この具体例では、一の請求項に関する処理について説明するが、特許請求項情報に複数の請求項が含まれていた場合には、その処理を繰り返して実行することによって、複数の請求項についても、解析を行うことができる。また、ここでも、従来例の説明と同様に、次の特許請求項情報が記憶部11で記憶されているものとする。
【0062】
[特許請求項情報]
画像形成装置において、
外部に接続されるダクトと、
エアを排出する送風手段と、
エアを清浄化する清浄化手段と、を備え、
前記ダクトは内部ダクトを有し、
前記清浄化手段は、前記内部ダクト内に設置されている、
ことを特徴とする画像形成装置。
【0063】
また、この具体例において、表層区切情報記憶部14では、図3で示される6種類の表層区切情報が記憶されているものとする。なお、図3における表層の手がかり情報の表現、及びこれ以降の説明において、Perl言語の正規表現の表記を用いている。なお、そのPerl言語については、次の文献を参照されたい。
文献:Larry Wall,Tom Christiansen,Randal L.Shcwartz、「プログラミングPerl 改訂版」、オライリージャパン、1997年
【0064】
図3の表層区切情報の表層の手がかり情報において、複数行で記述している手がかり情報は、いずれか一つに該当した場合に、対応するトークンを付与することを意味している。トークン「JEPSON_CUE」は、ジェプソン形式の特許請求項に特徴的な手がかり句に対応するものである。トークン「FEATURE_CUE」、「FEATURE_K_CUE」は、特許請求項で使用される特徴記載の手がかり句に対応するものである。トークン「COMPOSE_K_CUE」は、「〜と、〜と、〜とを備えた○○」という構成要素列挙型の特許請求項で使われる手がかり句に対応するものであり、トークン「COMPOSE_R_CUE」は、「〜と、〜と、〜とを備え、〜し、〜し、〜する○○」という変形構成要素列挙型の特許請求項で使われる手がかり句に対応するものである。トークン「QUOTE_CUE」は、特許請求項の従属関係を示す記載の手がかり句に対応するものである。
【0065】
また、この具体例において、文節タイプ対応情報記憶部16では、図4で示される文節タイプ対応情報が記憶されているものとする。なお、図4の品詞の手がかり情報において、「X」は、名詞または記号である。記号は、句読点を含むものである。また、「Y」は、「体言接続特殊2」の動詞、または接頭詞である。また、図4の文節タイプ対応情報の品詞の手がかり情報において、複数行で記述している手がかり情報は、いずれか一つに該当した場合に、対応する文節タイプを付与することを意味している。例えば、動詞もしくは助動詞の連用形で終わる文節、または、動詞もしくは助動詞の基本形と、それに続く助詞「と共に」もしくは「とともに」で終わる文節には、文節タイプ「VPR」が付与されることを示している。また、図4の文節タイプには、区切文節タイプと、そうでないものとの両方が含まれるが、VPR_P,VPK_P,NPT_Pが、記述断片の区切を示す区切文節タイプである。また、VPK_Pは、終端区切文節タイプであり、VPR_P,NPT_Pは、継続区切文節タイプである。
【0066】
まず、形態素解析部12は、記憶部11で記憶されている特許請求項情報に対して、行ごとに形態素解析を行い(すなわち、7回形態素解析を行うことになる)、行区切りの位置に「NEWLINE」を挿入した(ステップS101)。ここでは、形態素解析システム「MeCab」を用いた。その結果は、次の通りである。なお、形態素解析部12による形態素解析の結果は、記憶部11で記憶されることになる。次の結果において、前述のように、形態素ごとに、「見出し(表層)」、「品詞文字列」、「活用形」、「見出し(基本形)」、「2階層目の品詞」の5つの情報が得られる。
【0067】
[形態素解析の結果]
画像 名詞 画像 一般
形成 名詞 形成 サ変接続
装置 名詞 装置 サ変接続
において 助詞 において 格助詞
、 記号 、 読点
NEWLINE
外部 名詞 外部 一般
に 助詞 に 格助詞
接続 名詞 接続 サ変接続
さ 動詞 未然レル接続 する 自立
れる 動詞 基本形 れる 接尾
ダクト 名詞 ダクト 一般
と 助詞 と 並立助詞
、 記号 、 読点
NEWLINE
エア 名詞 エア 一般
を 助詞 を 格助詞
排出 名詞 排出 サ変接続
する 動詞 基本形 する 自立
送風 名詞 送風 サ変接続
手段 名詞 手段 一般
と 助詞 と 並立助詞
、 記号 、 読点
NEWLINE
エア 名詞 エア 一般
を 助詞 を 格助詞
清浄 名詞 清浄 サ変接続
化 名詞 化 接尾
する 動詞 基本形 する 自立
清浄 名詞 清浄 サ変接続
化 名詞 化 接尾
手段 名詞 手段 一般
と 助詞 と 並立助詞
、 記号 、 読点
を 助詞 を 格助詞
備え 動詞 連用形 備える 自立
、 記号 、 読点
NEWLINE
前記 名詞 前記 サ変接続
ダクト 名詞 ダクト 一般
は 助詞 は 係助詞
内部 名詞 内部 一般
ダクト 名詞 ダクト 一般
を 助詞 を 格助詞
有し 動詞 連用形 有す 自立
、 記号 、 読点
NEWLINE
前記 名詞 前記 サ変接続
清浄 名詞 清浄 サ変接続
化 名詞 化 接尾
手段 名詞 手段 一般
は 助詞 は 係助詞
、 記号 、 読点
前記 名詞 前記 サ変接続
内部 名詞 内部 一般
ダクト 名詞 ダクト 一般
内 名詞 内 接尾
に 助詞 に 格助詞
設置 名詞 設置 サ変接続
さ 動詞 未然レル接続 する 自立
れ 動詞 連用形 れる 接尾
て 助詞 て 接続助詞
いる 動詞 基本形 いる 非自立
、 記号 、 読点
NEWLINE
こと 名詞 こと 非自立
を 助詞 を 格助詞
特徴 名詞 特徴 一般
と 助詞 と 格助詞
する 動詞 基本形 する 自立
画像 名詞 画像 一般
形成 名詞 形成 サ変接続
装置 名詞 装置 サ変接続
。 記号 。 句点
【0068】
次に、トークン付与部15は、表層区切情報記憶部14で記憶されている図3で示される表層区切情報を用いて、形態素解析の結果に対して、トークンを付与する(ステップS102)。具体的には、トークン付与部15は、表層の手がかり情報を検索キーとして形態素解析の結果における見出し(表層)における検索を行い、ヒットしたところに、その表層の手がかり情報に対応するトークンを付与する。なお、トークンの付与の対象が2以上の形態素である場合には、その2以上の形態素を一つの集合(チャンク)として、それにトークンを付与する。また、トークン付与部15が付与したトークンも、記憶部11で記憶されることになる。この場合には、トークン「JEPSON_CUE」、「COMPOSE_R_CUE」、「FEATURE_K_CUE」が付与されている。
【0069】
[トークンの付与の結果]
画像 名詞 画像 一般
形成 名詞 形成 サ変接続
装置 名詞 装置 サ変接続
において、 JEPSON_CUE
NEWLINE
外部 名詞 外部 一般
に 助詞 に 格助詞
接続 名詞 接続 サ変接続
さ 動詞 未然レル接続 する 自立
れる 動詞 基本形 れる 接尾
ダクト 名詞 ダクト 一般
と 助詞 と 並立助詞
、 記号 、 読点
NEWLINE
エア 名詞 エア 一般
を 助詞 を 格助詞
排出 名詞 排出 サ変接続
する 動詞 基本形 する 自立
送風 名詞 送風 サ変接続
手段 名詞 手段 一般
と 助詞 と 並立助詞
、 記号 、 読点
NEWLINE
エア 名詞 エア 一般
を 助詞 を 格助詞
清浄 名詞 清浄 サ変接続
化 名詞 化 接尾
する 動詞 基本形 する 自立
清浄 名詞 清浄 サ変接続
化 名詞 化 接尾
手段 名詞 手段 一般
と 助詞 と 並立助詞
、 記号 、 読点
を備え、 COMPOSE_R_CUE
NEWLINE
前記 名詞 前記 サ変接続
ダクト 名詞 ダクト 一般
は 助詞 は 係助詞
内部 名詞 内部 一般
ダクト 名詞 ダクト 一般
を有し、 COMPOSE_R_CUE
NEWLINE
前記 名詞 前記 サ変接続
清浄 名詞 清浄 サ変接続
化 名詞 化 接尾
手段 名詞 手段 一般
は 助詞 は 係助詞
、 記号 、 読点
前記 名詞 前記 サ変接続
内部 名詞 内部 一般
ダクト 名詞 ダクト 一般
内 名詞 内 接尾
に 助詞 に 格助詞
設置 名詞 設置 サ変接続
さ 動詞 未然レル接続 する 自立
れ 動詞 連用形 れる 接尾
て 助詞 て 接続助詞
いる 動詞 基本形 いる 非自立
、 記号 、 読点
ことを特徴とする FEATURE_K_CUE
画像 名詞 画像 一般
形成 名詞 形成 サ変接続
装置 名詞 装置 サ変接続
。 記号 。 句点
【0070】
その後、文節特定部13は、各形態素の「品詞文字列」、「活用形」、「2階層目の品詞」の情報と、図示しない記録媒体で記憶されている図5A,図5Bで示される状態遷移表を用いて、文節の区切位置を特定する(ステップS103)。なお、その際に、文節特定部13は、トークンの付与されている箇所については、その文節の区切位置の特定を行わないものとする。したがって、トークンの付与された箇所、及びそれに隣接する箇所については、文法上の文節の区切とは異なる場合もありうる。なお、この具体例では、文節特定部13は、文節の区切位置の直前の形態素に対して、区切の前であることを示す情報を付与するものとする。文節特定部13による文節の区切位置の特定の結果は、次の通りである。その結果において、文節の区切位置の直前の形態素には、区切の前であることを示す情報「◎」が付与されている。また、文節特定部13が特定した文節の区切位置を示す情報も、記憶部11で記憶されることになる。
【0071】
[文節の区切位置の特定結果]
画像 名詞 画像 一般
形成 名詞 形成 サ変接続
装置 名詞 装置 サ変接続 ◎
において、 JEPSON_CUE ◎
NEWLINE
外部 名詞 外部 一般
に 助詞 に 格助詞 ◎
接続 名詞 接続 サ変接続
さ 動詞 未然レル接続 する 自立
れる 動詞 基本形 れる 接尾 ◎
ダクト 名詞 ダクト 一般
と 助詞 と 並立助詞
、 記号 、 読点 ◎
NEWLINE
エア 名詞 エア 一般
を 助詞 を 格助詞 ◎
排出 名詞 排出 サ変接続
する 動詞 基本形 する 自立 ◎
送風 名詞 送風 サ変接続
手段 名詞 手段 一般
と 助詞 と 並立助詞
、 記号 、 読点 ◎
NEWLINE
エア 名詞 エア 一般
を 助詞 を 格助詞 ◎
清浄 名詞 清浄 サ変接続
化 名詞 化 接尾 ◎
する 動詞 基本形 する 自立 ◎
清浄 名詞 清浄 サ変接続
化 名詞 化 接尾
手段 名詞 手段 一般
と 助詞 と 並立助詞
、 記号 、 読点 ◎
を備え、 COMPOSE_R_CUE ◎
NEWLINE
前記 名詞 前記 サ変接続
ダクト 名詞 ダクト 一般
は 助詞 は 係助詞 ◎
内部 名詞 内部 一般
ダクト 名詞 ダクト 一般 ◎
を有し、 COMPOSE_R_CUE ◎
NEWLINE
前記 名詞 前記 サ変接続
清浄 名詞 清浄 サ変接続
化 名詞 化 接尾
手段 名詞 手段 一般
は 助詞 は 係助詞
、 記号 、 読点 ◎
前記 名詞 前記 サ変接続
内部 名詞 内部 一般
ダクト 名詞 ダクト 一般
内 名詞 内 接尾
に 助詞 に 格助詞 ◎
設置 名詞 設置 サ変接続
さ 動詞 未然レル接続 する 自立
れ 動詞 連用形 れる 接尾
て 助詞 て 接続助詞
いる 動詞 基本形 いる 非自立
、 記号 、 読点 ◎
ことを特徴とする FEATURE_K_CUE ◎
画像 名詞 画像 一般
形成 名詞 形成 サ変接続
装置 名詞 装置 サ変接続
。 記号 。 句点 ◎
【0072】
次に、区切文節タイプ付与部17は、文節タイプ対応情報記憶部16で記憶されている図4で示される文節タイプ対応情報を用いて、文節の区切位置の特定結果に対して、文節タイプを付与する(ステップS104)。その際に、区切文節タイプ付与部17は、文節の末尾の形態素から1個以上の形態素を用いて、文節タイプの付与を行う。具体的には、区切文節タイプ付与部17は、品詞の手がかり情報に該当する文節を検索し、ヒットした文節に対して、その品詞の手がかり情報に対応する文節タイプを付与する。なお、この文節タイプの付与の後は、形態素解析の結果を用いないため、形態素解析の結果のうち、見出し(表層)以外の情報を消去してもよい。また、この文節タイプの付与の結果も、記憶部11で記憶されることになる。この場合には、文節タイプ「NP」や「PP」、「VPK」等が付与されている。
【0073】
[文節タイプの付与の結果]
画像形成装置 NP
において、 JEPSON_CUE
NEWLINE
外部に PP
接続される VPK
ダクトと、 NPT_P
NEWLINE
エアを NPO
排出する VPK
送風手段と、 NPT_P
NEWLINE
エアを NPO
清浄化 NP
する VPK
清浄化手段と、 NPT_P
を備え、 COMPOSE_R_CUE
NEWLINE
前記ダクトは PP
内部ダクト NP
を有し、 COMPOSE_R_CUE
NEWLINE
前記清浄化手段は、 PP
前記内部ダクト内に PP
設置されている、 VPK_P
ことを特徴とする FEATURE_K_CUE
画像形成装置。 NP
【0074】
この後、区切文節タイプ変更部18は、文節タイプの変更を行う(ステップS105)。その変更の具体的な方法は、次の通りである。なお、その方法の説明において、「名詞まとまり」とは名詞の連続である。その「名詞まとまり」は、文節タイプ「NP」の付与された文節であってもよく、文節タイプ「NPT」、「NPT_P」等の付与された文節に含まれる名詞の連続であってもよい。また、以下の説明において、トークンや文節タイプの付与された文節を、説明の便宜上、そのトークンや文節タイプそのもので表している。例えば、「VPR_P」は、厳密には、「VPR_Pの付与された文節」の意味である。
【0075】
[文節タイプの変更の説明]
1.JEPSON_CUEが存在する場合は、以下の処理を行う。
(1)前半部(すなわち、特許請求項の先頭からJEPSON_CUEの直前までの部分)にFEATURE_CUE,FEATURE_K_CUE,COMPOSE_K_CUEのいずれかが存在する場合には、次の処理A、処理B、処理Cを行う。
(処理A)最後に出現したFEATURE_CUE,FEATURE_K_CUE,またはCOMPOSE_K_CUE以降の文節タイプをすべてHPに置き換える。
(処理B)COMPOSE_K_CUE,FEATURE_CUEの直前の「名詞まとまり」より前の部分、またはFEATURE_K_CUEより前の部分で、VPR_P,NPT_P,COMPOSE_R_CUE,または処理範囲(例えば、前半部の処理を行っている場合には前半部、後半部の処理を行っている場合には後半部、全体の処理を行っている場合には全体)の先頭のいずれかに遭遇するまでの間において、「名詞まとまり」の直前にVPKもしくはVPK_Pが存在していた場合、またはFEATURE_K_CUE直前にVPKもしくはVPK_Pが存在していた場合には、「名詞まとまり」の直前のVPKもしくはVPK_P以外と、FEATURE_K_CUEの直前のVPKもしくはVPK_P以外について、VPK*と、NP*をすべてPPに置き換える。
(処理C)処理Bにおいて、VPR_Pに遭遇した場合は、この処理を繰り返す。処理Bにおいて、NPT_Pに遭遇した場合は、それを含む「名詞まとまり」より前の部分で、この処理を繰り返す。処理Bにおいて、COMPOSE_R_CUEに遭遇した場合は、その直前の「名詞まとまり」より前の部分でこの処理を繰り返す。処理Bにおいて、処理範囲の先頭に遭遇した場合は、この処理を終了する。
(2)前半部に、FEATURE_CUE,FEATURE_K_CUE,COMPOSE_K_CUEのいずれも存在しない場合には、次の処理D、処理E、処理Fを行う。
(処理D)JEPSON_CUEの直前の「名詞まとまり」を認識し、それを構成する文節タイプをすべてHPに変更する。
(処理E)HPより前の部分で、VPR_P,NPT_P,COMPOSE_R_CUE,または処理範囲の先頭のいずれかに遭遇するまでの間において、HPの直前にVPKもしくはVPK_Pが存在していた場合には、HPの直前のVPKもしくはVPK_P以外について、VPK*と、NP*をすべてPPに置き換える。
(処理F)処理Eにおいて、VPR_Pに遭遇した場合は、この処理を繰り返す。処理Eにおいて、NPT_Pに遭遇した場合は、それを含む「名詞まとまり」より前の部分で、この処理を繰り返す。処理Eにおいて、COMPOSE_R_CUEに遭遇した場合は、その直前の「名詞まとまり」より前の部分でこの処理を繰り返す。処理Eにおいて、処理範囲の先頭に遭遇した場合は、この処理を終了する。
(3)前半部にNEWLINEが存在する場合には、次の処理Gを行う。
(処理G)NEWLINEが後続するVPKをVPK_Pに変更し、NEWLINEが後続するVPRをVPR_Pに変更し、NEWLINEが後続しないVPR_PをVPRに変更し、NEWLINEが後続しないVPK_PをVPKに変更する。
(4)後半部(すなわち、JEPSON_CUEの直後から特許請求項の終端までの部分)にFEATURE_CUE,FEATURE_K_CUE,COMPOSE_K_CUEのいずれかが存在する場合には、次の処理H,処理I、処理Jを行う。
(処理H)最後に出現したもの以降の文節タイプをすべてBPに置き換える。いずれも存在しない場合は、末尾の「名詞まとまり」を認識し、それを構成する文節タイプをすべてBPに置き換える。
(処理I)上記処理Bと同じ処理である。
(処理J)上記処理Cと同じ処理である。
(5)後半部に、FEATURE_CUE,FEATURE_K_CUE,COMPOSE_K_CUEのいずれも存在しない場合には、次の処理K、処理L、処理Mを行う。
(処理K)末尾の「名詞まとまり」を認識し、それを構成する文節タイプをすべてBPに変更する。
(処理L)上記処理Eにおいて、HPをBPに置き換えた処理を行う。
(処理M)上記処理Fにおいて、HPをBPに置き換えた処理を行う。
(6)後半部にNEWLINEが存在する場合には、上記処理Gを行う。
2.JEPSON_CUEが存在しない場合は、上記(4)〜(6)において後半部において行った処理を、特許請求項の全体に対して1回行う。
3.COMPOSE_K_CUE、COMPOSE_R_CUEの直前のNPTをNPT_Pに変更し、COMPOSE_K_CUE、COMPOSE_R_CUEの直前のNPをNPT_Pに変更する。
4.NEWLINEを除去する。
【0076】
なお、上記の文節タイプの変更の説明において、処理Bや処理Eにおいて、VPK_P(終端区切文節タイプ)を、PPに置き換える処理が、終端区切文節タイプ(VPK_P)と、継続区切文節タイプ(VPR_P,NPT_P)との間に存在する終端区切文節タイプ(VPK_P)を削除する処理に対応する。また、処理Gにおいて、NEWLINEが後続しないVPR_PをVPRに変更し、NEWLINEが後続しないVPK_PをVPKに変更する処理が、改行が存在する場合であって、改行が後続しない動詞に関する区切文節タイプ(VPR_P,VPK_P)が存在する場合に、その区切文節タイプを削除する処理に対応する。
上記のようにして区切文節タイプ変更部18が変更した後の文節タイプは、次のようになる。
【0077】
[文節タイプの変更の結果]
画像形成装置 HP
において、 JEPSON_CUE
外部に PP
接続される VPK
ダクトと、 NPT_P
エアを PP
排出する VPK
送風手段と、 NPT_P
エアを PP
清浄化 PP
する VPK
清浄化手段と、 NPT_P
を備え、 COMPOSE_R_CUE
前記ダクトは PP
内部ダクト NPT_P
を有し、 COMPOSE_R_CUE
前記清浄化手段は、 PP
前記内部ダクト内に PP
設置されている、 VPK_P
ことを特徴とする FEATURE_K_CUE
画像形成装置。 BP
【0078】
その後、生成部19は、トークンと文節タイプとの付与された特許請求項情報から、請求項構造情報を生成する(ステップS106)。その生成において、この具体例では、その生成において、図6で示される文法ファイルを用いて、パーサジェネレータによって生成されたパーサ(構文解析器)を用いて、請求項構造情報を生成するものとする。なお、その図6の文法ファイルは、パーサジェネレータであるBison互換のPerl用ツールであるParse::Yapp(Francois Desarmenien,Parse−Yapp−1.05、http://search.cpan.org/dist/Parse−Yapp/)用の記述例である。特許請求項の記述は、通常、終端に定型的な表現が存在し、終端から先頭への方向で構造が確定することを考慮し、その文脈自由文法で記述した規則は、終端から先頭への方向で記述した。図6では、$retvalという変数に、生成されたXMLが文字列として格納される。図6で示される文法ファイルから生成されたパーサに、上記文節タイプの変更の結果を取り込むと、図7のXMLファイルで示される請求項構造情報が生成される。なお、その際、文脈自由文法から生成されたパーサには、文節タイプの変更の結果を、終端から先頭への方向に変換して入力する。また、XMLの構造としては、前述したPMLを使用した。
【0079】
出力部20は、図7の請求項構造情報を読み込んでディスプレイに表示する。その結果、図8で示される、請求項構造情報に応じた記述断片の関係を示す表示が行われる(ステップS107)。この表示を見ることによって、ユーザは、特許請求項の構造を容易に把握することができるようになる。なお、図7で示されるXMLファイルから、図8で示される表示を生成する際にも、構文解析器(パーサ)が用いられてもよい。このパーサは、マークアップ言語で記述された構造を表示する公知のパーサである。
【0080】
ここで、上記の文節タイプの変更の結果から、記述断片の間の係り受けを示す請求項構造情報を生成する別の処理の具体例について、簡単に説明する。文節タイプの変更の結果において、JEPSON_CUE以外の各トークンと、NPT_Pと、BPとは、それだけで一つの記述断片となる。すなわち、JEPSON_CUE以外の各トークンと、NPT_Pと、BPとについては、その前後に記述断片の区切位置が来ることになる。また、VPR_Pと、VPK_Pとは、それらの直前に連続する0個以上のPPやVPR,VPKを含んで一つの記述断片となる。すなわち、VPR_Pと、VPK_Pとについては、その後に記述断片の区切位置が来ることになる。また、HPとJEPSON_CUEとは、両方で一つの記述断片となる。すなわち、「HP+JEPSON_CUE」については、その前後に記述断片の区切位置が来ることになる。残った連続する1以上のPPやVPR,VPKも、一つの記述断片となる。このような、トークン及び区切文節タイプに対応した記述断片の区切位置を示す情報を用いることによって、生成部19は、記述断片の区切位置を特定することができることになる。そのようにして、文節タイプの変更の結果を記述断片ごとに示し、その記述断片に対して、最後の文節に対応する文節タイプを対応付けた結果は、次のようになる。
【0081】
画像形成装置において、 JEPSON_CUE
外部に接続される VPK
ダクトと、 NPT_P
エアを排出する VPK
送風手段と、 NPT_P
エアを清浄化する VPK
清浄化手段と、 NPT_P
を備え、 COMPOSE_R_CUE
前記ダクトは PP
内部ダクト NPT_P
を有し、 COMPOSE_R_CUE
前記清浄化手段は、前記内部ダクト内に設置されている、 VPK_P
ことを特徴とする FEATURE_K_CUE
画像形成装置。 BP
【0082】
また、トークンの付与された記述断片及び区切文節タイプの付与された記述断片の係り受け関係が次のように定められているものとする。前半部と、後半部または全体とに分けて説明する。なお、以下の説明において、トークンの付与された記述断片や、文節タイプの付与された記述断片を、説明の便宜上、そのトークンや文節タイプそのもので表している。例えば、「COMPOSE_K_CUE」は、厳密には、「COMPOSE_K_CUEの付与された記述断片」の意味である。
【0083】
(前半部)
COMPOSE_K_CUEは、それよりも後に存在する、それに最も近い、JEPSON_CUE、FEATURE_CUE、または、FEATURE_K_CUEに係る。
COMPOSE_R_CUEは、それよりも後に存在する、それに最も近い、JEPSON_CUE、FEATURE_CUE、または、FEATURE_K_CUEに係る。
FEATURE_CUEは、JEPSON_CUEに係る。
FEATURE_K_CUEは、JEPSON_CUEに係る。
NPT_Pは、それよりも後に存在する、それに最も近い、COMPOSE_K_CUEまたはCOMPOSE_R_CUEに係る。
VPKは、直後の記述断片に係る。
VPK_Pは、直後の記述断片に係る。
VPRは、それよりも後に存在する、それに最も近い、VPK(またはVPK_P)の直後の記述断片に係る。
VPR_Pは、それよりも後に存在する、それに最も近い、VPK(またはVPK_P)の直後の記述断片に係る。
PPは、直後の記述断片に係る。
(後半部、または全体)
JEPSON_CUEは、BPに係る。
COMPOSE_K_CUEは、それよりも後に存在する、それに最も近い、BP、FEATURE_CUE、または、FEATURE_K_CUEに係る。
COMPOSE_R_CUEは、それよりも後に存在する、それに最も近い、BP、FEATURE_CUE、または、FEATURE_K_CUEに係る。
FEATURE_CUEは、BPに係る。
FEATURE_K_CUEは、BPに係る。
NPT_Pは、それよりも後に存在する、それに最も近い、COMPOSE_K_CUEまたはCOMPOSE_R_CUEに係る。
VPKは、直後の記述断片に係る。
VPK_Pは、直後の記述断片に係る。
VPRは、それよりも後に存在する、それに最も近い、VPK(またはVPK_P)の直後の記述断片に係る。
VPR_Pは、それよりも後に存在する、それに最も近い、VPK(またはVPK_P)の直後の記述断片に係る。
PPは、直後の記述断片に係る。
【0084】
生成部19は、あらかじめ規定されているトークンの付与された記述断片及び区切文節タイプの付与された記述断片の係り受け関係の情報(図示しない記録媒体で記憶されていてもよい)を用いることによって、各記述断片の係り受け関係を特定することができる。この例の場合には、各記述断片の係り先を特定することができることになる。これが次で示される請求項構造情報となる。なお、その請求項構造情報において、「記述断片ID」、「記述断片の文字列」、「記述断片に対応するトークンまたは文節タイプ」、「係り先の記述断片ID」の順で表示している。
【0085】
[請求項構造情報]
1 画像形成装置において、 JEPSON_CUE 14
2 外部に接続される VPK 3
3 ダクトと、 NPT_P 8
4 エアを排出する VPK 5
5 送風手段と、 NPT_P 8
6 エアを清浄化する VPK 7
7 清浄化手段と、 NPT_P 8
8 を備え、 COMPOSE_R_CUE 13
9 前記ダクトは PP 10
10 内部ダクト NPT_P 11
11 を有し、 COMPOSE_R_CUE 13
12 前記清浄化手段は、前記内部ダクト内に設置されている、 VPK_P 13
13 ことを特徴とする FEATURE_K_CUE 14
14 画像形成装置。 BP
【0086】
出力部20が、この請求項構造情報を記述断片の係り受けを示すように表示すると、図8の表示となる。なお、係り受け関係を有する複数の情報を表示する方法としては、例えば、自然言語処理における係り受け関係を表示するソフトウェアや、クレームツリーの表示ソフトウェア等としてすでに知られており、その詳細な説明を省略する。
【0087】
なお、QUOTE_CUEについては特に言及しなかったが、QUOTE_CUEが存在する場合には、その直前の位置で記述断片の区切位置が存在することになる。また、そのQUOTE_CUEを先頭に含む記述断片は、前半部においてはJEPSON_CUEの記述断片に係り、後半部においては、BPに係ることになる。このようにして、QUOTE_CUEが含まれる場合にも、記述断片への分割と、その係り受け関係の特定とを行うことができるようになる。
【0088】
以上のように、本実施の形態による請求項構造情報生成装置1によれば、表層の手がかり情報と、品詞の手がかり情報とを用いて、文節単位で記述断片の区切位置を検出するため、より深い構造を持つ特許請求項についても構造解析を適切に行うことができるようになる。特に、品詞の手がかり情報を用いることによって、区切位置となりうるすべての箇所を見つけることができるようになる。なお、そのようにして見つけた区切位置には、本来は区切位置とすべきでない箇所も含まれてしまう場合もある。したがって、区切文節タイプ変更部18による文節タイプの変更、特に区切文節タイプの削除を行うことによって、そのような適切でない区切位置を削除することによって、本来の記述断片を取得することができるようになる。なお、従来例では、文節よりも細かい形態素単位で記述断片の区切位置の検出等を行っていたため、大まかな解析しかすることができなかった。扱う単位が細かいため、細かい解析を行うことは非常に困難だからである。一方、本実施の形態では、文節単位で記述断片の区切位置の検出等を行うため、従来例よりも細かい解析を行うことができるようになり、その結果、より深い構造を持った請求項についても、適切な解析を行うことができるようになった。このようにして、従来例では図16の程度にしか解析することができなかったものを、本実施の形態では、図8のように細かく解析することができるようになった。
【0089】
また、本実施の形態において、従属関係に対応する表層の手がかり情報をも用いることによって、他の請求項に従属する請求項についても、その構造を適切に解析することができ、その請求項に対応した請求項構造情報を生成することができる。
【0090】
なお、本実施の形態による請求項構造情報生成装置1において、構成要素の親子関係に関する構造の解析をさらに行ってもよい。この場合には、区切文節タイプに、前述の構成要素の包含関係を示すトークンに対して、親の構成要素に応じた区切文節タイプである親区切文節タイプと、構成要素の包含関係を示すトークンに対して、子の構成要素に応じた区切文節タイプである子区切文節タイプと、が存在するものとする。構成要素の包含関係を示すトークンは、例えば、既出のCOMPOSE_K_CUEやCOMPOSE_R_CUEである。また、親区切文節タイプは、例えば、既出のHPやBP、ここで定義するNPH、NPH_P等である。また、子区切文節タイプは、例えば、既出のNPT_Pである。
【0091】
文節タイプ対応情報において、区切文節タイプNPH、NPH_Pに対応する品詞の手がかり情報は、例えば、次のようになる。
NPH:X+助詞「は」
NPH_P:X+助詞「は」+「記号−読点(「、」または「,」)」
すなわち、例えば、前述の具体例の場合には、「前記ダクトは」がNPHとなる。
【0092】
このような場合において、出力部20は、親区切文節タイプに対応する記述断片と、子区切文節タイプに対応する記述断片との親子関係が分かるように両記述断片を表示してもよい。例えば、出力部20は、親区切文節タイプに対応する記述断片と、子区切文節タイプに対応する記述断片とを線で結んで表示してもよい。なお、その親区切文節タイプに対応する記述断片と、子区切文節タイプに対応する記述断片との間に、構成要素の包含関係に関する記述断片が存在してもよい。すなわち、親区切文節タイプに対応する記述断片と、子区切文節タイプに対応する記述断片とは、構成要素の包含関係に関する記述断片を介して線で結ばれてもよい。また、出力部20は、結果としてそのような表示を行えばよく、例えば、親区切文節タイプに対応する記述断片と、子区切文節タイプに対応する記述断片とが直接的にまたは間接的に係り受け関係にあることを示す請求項構造情報が生成されている場合には、それを本実施の形態で説明したように表示するだけであってもよい。
【0093】
ここで、具体例を用いて説明する。
(α)文節タイプの変更の際には、前述の具体例の変更を行うと共に、その変更の後に、次の処理を行うものとする。
(β)NPHの後に、COMPOSE_K_CUEまたはCOMPOSE_R_CUEが存在しない場合には、NPHをPPに変更する。
(γ)NPHと、それよりも後に存在する、それに最も近い、COMPOSE_K_CUEまたはCOMPOSE_R_CUEとの間に、NPT_Pが存在しない場合には、NPHをPPに変更する。
(δ)NPHと、それよりも後に存在する、それに最も近い、NPT_Pとの間に、VPR_Pが存在する場合には、NPHを、PPに変更する。
(ε)NPH_Pについても、NPHをNPH_Pに置き換えて、上記(β)〜(δ)の処理を行う。
【0094】
上記(α)〜(δ)の処理を行うことによって、文節タイプの変更の結果は次のようになる。
[文節タイプの変更の結果]
画像形成装置 HP
において、 JEPSON_CUE
外部に PP
接続される VPK
ダクトと、 NPT_P
エアを PP
排出する VPK
送風手段と、 NPT_P
エアを PP
清浄化 PP
する VPK
清浄化手段と、 NPT_P
を備え、 COMPOSE_R_CUE
前記ダクトは NPH
内部ダクト NPT_P
を有し、 COMPOSE_R_CUE
前記清浄化手段は、 PP
前記内部ダクト内に PP
設置されている、 VPK_P
ことを特徴とする FEATURE_K_CUE
画像形成装置。 BP
【0095】
次に、記述断片の区切位置の特定の際には、NPH、NPH_Pも一つの記述断片になるとする。すなわち、NPHと、NPH_Pとについては、その前後に記述断片の区切位置が来ることになる。また、あらかじめ規定されている係り受け関係に、次のNPH、NPH_Pの係り先の関係を追加し、COMPOSE_K_CUEまたはCOMPOSE_R_CUEの係り先の関係を次のように変更する。
【0096】
(前半部)
(追加)NPHは、それよりも後に存在する、それに最も近い、JEPSON_CUE、FEATURE_CUE、または、FEATURE_K_CUEに係る。
(追加)NPH_Pは、それよりも後に存在する、それに最も近い、JEPSON_CUE、FEATURE_CUE、または、FEATURE_K_CUEに係る。
(変更)COMPOSE_K_CUEは、それよりも前にNPHまたはNPH_Pが存在する場合には、そのCOMPOSE_K_CUEよりも前に存在する、それに最も近いNPHまたはNPH_Pに係り、そのCOMPOSE_K_CUEよりも前にNPH及びNPH_Pが存在しない場合には、そのCOMPOSE_K_CUEよりも後に存在する、それに最も近い、JEPSON_CUE、FEATURE_CUE、または、FEATURE_K_CUEに係る。
(変更)COMPOSE_R_CUEは、それよりも前にNPHまたはNPH_Pが存在する場合には、そのCOMPOSE_R_CUEよりも前に存在する、それに最も近いNPHまたはNPH_Pに係り、そのCOMPOSE_R_CUEよりも前にNPH及びNPH_Pが存在しない場合には、そのCOMPOSE_R_CUEよりも後に存在する、それに最も近い、JEPSON_CUE、FEATURE_CUE、または、FEATURE_K_CUEに係る。
(後半部、または全体)
(追加)NPHは、それよりも後に存在する、それに最も近い、BP、FEATURE_CUE、または、FEATURE_K_CUEに係る。
(追加)NPH_Pは、それよりも後に存在する、それに最も近い、BP、FEATURE_CUE、または、FEATURE_K_CUEに係る。
(変更)COMPOSE_K_CUEは、それよりも前にNPHまたはNPH_Pが存在する場合には、そのCOMPOSE_K_CUEよりも前に存在する、それに最も近いNPHまたはNPH_Pに係り、そのCOMPOSE_K_CUEよりも前にNPH及びNPH_Pが存在しない場合には、そのCOMPOSE_K_CUEよりも後に存在する、それに最も近い、BP、FEATURE_CUE、または、FEATURE_K_CUEに係る。
(変更)COMPOSE_R_CUEは、それよりも前にNPHまたはNPH_Pが存在する場合には、そのCOMPOSE_R_CUEよりも前に存在する、それに最も近いNPHまたはNPH_Pに係り、そのCOMPOSE_R_CUEよりも前にNPH及びNPH_Pが存在しない場合には、そのCOMPOSE_R_CUEよりも後に存在する、それに最も近い、BP、FEATURE_CUE、または、FEATURE_K_CUEに係る。
【0097】
このような係り受け関係に応じて請求項構造情報を生成すると、次のようになる。
[請求項構造情報]
1 画像形成装置において、 JEPSON_CUE 14
2 外部に接続される VPK 3
3 ダクトと、 NPT_P 8
4 エアを排出する VPK 5
5 送風手段と、 NPT_P 8
6 エアを清浄化する VPK 7
7 清浄化手段と、 NPT_P 8
8 を備え、 COMPOSE_R_CUE 13
9 前記ダクトは NPH 13
10 内部ダクト NPT_P 11
11 を有し、 COMPOSE_R_CUE 9
12 前記清浄化手段は、前記内部ダクト内に設置されている、 VPK_P 13
13 ことを特徴とする FEATURE_K_CUE 14
14 画像形成装置。 BP
【0098】
また、出力部20が、この請求項構造情報を表示すると、例えば、図9で示されるようになる。図9では、親子関係のある構成要素の記述断片が、「を備え、」や「ことを特徴とする」、または、「を有し、」を介して、接続されることになる。例えば、「ダクトと、」、「送風手段と、」、「清浄化手段と、」が、「を備え、」等を介して「画像形成装置。」に接続されていることによって、「画像形成装置。」が、「ダクトと、」、「送風手段と、」、「清浄化手段と、」を構成要素として有することが分かる。また、「内部ダクト」が、「を有し、」を介して「前記ダクトは」に接続されていることによって、「前記ダクトは」が、「内部ダクト」を構成要素として有することが分かる。
【0099】
なお、出力部20は、構成要素に関する複数の記述断片のうち、語幹が同じものを共通化して表示してもよい。記述断片の語幹とは、末尾の句読点や助詞、または、先頭の「前記」、「上記」、「当該」、「該」、「その」等の、既出のものを示す接頭語を記述断片から除去した部分である。したがって、「前記ダクトは」と、「ダクトと、」とは、語幹「ダクト」が共通することになる。その共通化する場合に、語幹が共通する複数の記述断片のうち、先頭の記述断片に他の記述断片を統合してもよく、または、COMPOSE_K_CUEもしくはCOMPOSE_R_CUEに係る記述断片に他の記述断片を統合してもよい。その結果、例えば、図10で示される表示がなされる。ここでは、出力部20がそのような出力を行う場合について説明したが、生成部19が、そのような請求項構造情報を生成してもよい。例えば、前述の例の場合には、請求項構造情報において、構成要素に関する記述断片は、NPT_P、NPH、NPH_Pであるため、それらの語幹が共通するかどうか判断する。この場合には、「ダクトと、」、「前記ダクトは」の語幹が共通すると判断される。その結果、2番目以降の記述断片「前記ダクトは」に係る記述断片「を有し、」の係り先を、1番目の記述断片「ダクトと、」に変更すると共に、2番目以降の記述断片「前記ダクトは」を削除すればよいことになる。その結果、請求項構造情報が、次のようになる。
【0100】
[請求項構造情報]
1 画像形成装置において、 JEPSON_CUE 14
2 外部に接続される VPK 3
3 ダクトと、 NPT_P 8
4 エアを排出する VPK 5
5 送風手段と、 NPT_P 8
6 エアを清浄化する VPK 7
7 清浄化手段と、 NPT_P 8
8 を備え、 COMPOSE_R_CUE 13
10 内部ダクト NPT_P 11
11 を有し、 COMPOSE_R_CUE 3
12 前記清浄化手段は、前記内部ダクト内に設置されている、 VPK_P 13
13 ことを特徴とする FEATURE_K_CUE 14
14 画像形成装置。 BP
【0101】
この例では、一つの請求項において、語幹の共通する、構成要素に関する記述断片をまとめる場合について説明したが、従属関係にある請求項において、そのことを行ってもよい。例えば、上記例の請求項に従属する請求項において、「……前記送風手段は、羽根と、前記羽根を回転させるモータとを備え、……」という記載があった場合に、上記例の請求項における記述断片「送風手段と、」に対して、記述断片「羽根と、」、「モータと」が係るように表示してもよい。
【0102】
なお、本実施の形態による請求項構造情報生成装置1において、親区切文節タイプや、子区切文節タイプを用いて、構成要素の親子関係を取得するようにしてもよい。その場合には、請求項構造情報生成装置1は、図11で示されるように、親子関係取得部21と、階層レベル取得部22とをさらに備えてもよい。
【0103】
親子関係取得部21は、親区切文節タイプと子区切文節タイプとの付与された特許請求項情報を用いて、構成要素の親子関係を取得する。具体的には、ある構成要素の包含関係を示すトークンに対する親区切文節タイプに対応する文節の構成要素は、親の構成要素であり、その同じトークンに対する子区切文節タイプに対応する文節の構成要素は、子の構成要素である。したがって、その構成要素の包含関係を示すトークンを介在させることによって、構成要素の親子関係を取得することができる。その親子関係は、例えば、親である画像形成装置に対応する子が、ダクト、送風手段、清浄化手段であることを示す情報であってもよい。この例のように、説明の便宜上、装置なども構成要素と呼ぶことにする。また、記述断片から構成要素を特定する方法は、前述の語幹を特定する方法と同様であり、その説明を省略する。その親子関係を示す情報は、図示しない記録媒体において記憶されてもよい。
【0104】
階層レベル取得部22は、親子関係取得部21が取得した構成要素の親子関係を用いて、構成要素の階層レベルを取得する。親子関係から階層レベルを取得する方法は公知であるが、その一例を簡単に説明しておく。なお、ここでは、最も高い階層レベル(それに対する親の存在しない階層レベル)を「1」として、階層が深くなるほど、階層レベルの値が大きくなるものとする。まず、親子関係から、すべての構成要素を取得し、ユニーク処理を行う。そして、各構成要素のうち、親のない構成要素に対して、階層レベル1を付与する。その階層レベル1の構成要素を親に持つすべての構成要素に対して、階層レベル2を付与する。このように、階層レベルNの構成要素を親に持つすべての構成要素に対して、階層レベル(N+1)を付与する処理を、階層レベルの付与されていない構成要素がなくなるまで継続する。その結果、すべての構成要素の階層レベルを知ることができるようになる。その構成要素ごとの階層レベルを示す情報は、図示しない記録媒体において記憶されてもよい。
【0105】
また、出力部20は、階層レベル取得部22が取得した階層レベルに応じて、親区切文節タイプ及び子区切文節タイプに対応する記述断片を表示してもよい。「階層レベルに応じて記述断片を表示する」とは、例えば、階層レベルを示す数値等を、記述断片に対応付けて表示することであってもよく、あるいは、階層レベルに応じた表示位置(例えば、階層レベルが高いほど左(または上)に表示され、階層レベルが低いほど右(または下)に表示されてもよい)となるように記述断片を表示することであってもよい。
【0106】
ここで、具体例を用いて説明する。
なお、請求項構造情報が生成されるまでの処理は、前述の処理と同様であり、その説明を省略する。その請求項構造情報は、次の通りであるとする。
【0107】
[請求項構造情報]
1 画像形成装置において、 JEPSON_CUE 14
2 外部に接続される VPK 3
3 ダクトと、 NPT_P 8
4 エアを排出する VPK 5
5 送風手段と、 NPT_P 8
6 エアを清浄化する VPK 7
7 清浄化手段と、 NPT_P 8
8 を備え、 COMPOSE_R_CUE 13
9 前記ダクトは NPH 13
10 内部ダクト NPT_P 11
11 を有し、 COMPOSE_R_CUE 9
12 前記清浄化手段は、前記内部ダクト内に設置されている、 VPK_P 13
13 ことを特徴とする FEATURE_K_CUE 14
14 画像形成装置。 BP
【0108】
親子関係取得部21は、COMPOSE_K_CUEまたはCOMPOSE_R_CUEごとに、親子関係を取得するものとする。COMPOSE_K_CUEまたはCOMPOSE_R_CUEよりも前に、NPHまたはNPH_Pが存在する場合には、そのCOMPOSE_K_CUEまたはCOMPOSE_R_CUEに対する親の構成要素として、最も近いNPHまたはNPH_Pの語幹を取得する。また、そのCOMPOSE_K_CUEまたはCOMPOSE_R_CUEに係るNPT_Pの語幹を、子の構成要素として取得する。このようにして、親子関係を取得することができる。
【0109】
また、COMPOSE_K_CUEまたはCOMPOSE_R_CUEよりも前に、NPHまたはNPH_Pが存在しない場合には、親子関係取得部21は、そのCOMPOSE_K_CUEまたはCOMPOSE_R_CUEに対する親の構成要素として、そのCOMPOSE_K_CUEまたはCOMPOSE_R_CUEの係り先の記述断片(他の記述断片を介した係り先の記述断片であってもよい)のうち、最も近いHPを含む記述断片(すなわち、そのHPを含むJEPSON_CUEの記述断片)またはBPの語幹を取得する。また、親子関係取得部21は、そのCOMPOSE_K_CUEまたはCOMPOSE_R_CUEに係るNPT_Pの語幹を、子の構成要素として取得する。このようにして、親子関係を取得することができる。
【0110】
前述の請求項構造情報の場合には、親子関係取得部21は、例えば、記述断片「8 を備え、 COMPOSE_R_CUE 13」に対して、親の構成要素「画像形成装置」と、子の構成要素「ダクト」、「送風手段」、「清浄化手段」とを取得することができる。また、親子関係取得部21は、例えば、記述断片「11 を有し、 COMPOSE_R_CUE 9」に対して、親の構成要素「ダクト」と、子の構成要素「内部ダクト」とを取得することができる。したがって、その取得した親子関係を示す情報は、図12で示されるようになる。
【0111】
階層レベル取得部22は、図12で示される親子関係から、例えば、前述の方法によって、各構成要素の階層レベルを次のように取得する。
構成要素 階層レベル
画像形成装置 1
ダクト 2
送風手段 2
清浄化手段 2
内部ダクト 3
【0112】
出力部20は、その構成要素と階層レベルとの対応を用いて、記述断片を表示する際に、その記述断片の語幹が、いずれかの構成要素と一致する場合には、その構成要素に対応する階層レベルの数値を記述断片の位置に表示する。その結果、図13の表示がなされることになる。このようにして、各構成要素の階層レベルをも表示することができ、それを見たユーザは、構成要素の階層レベルを容易に把握することができるようになる。なお、この例では、階層のレベルが深いほど数値が大きくなる階層レベルとしたが、逆であってもよい。すなわち、階層のレベルが深いほど数値が小さくなる階層レベルを採用してもよい。
【0113】
また、本実施の形態において、構成要素を含む記述断片(例えば、BP、NPT_P、NPH、NPH_P等の付与された記述断片)を表示する際には、その記述断片の語幹のみを表示するようにしてもよい。例えば、記述断片「画像形成装置。」に代えて、その語幹「画像形成装置」を表示してもよく、記述断片「前記ダクトは」に代えて、その語幹「ダクト」を表示してもよい。
【0114】
また、本実施の形態では、区切文節タイプの削除等のように、文節タイプの変更を行う場合について説明したが、そうでなくてもよい。文節タイプの変更を行わない場合には、請求項構造情報生成装置1は、区切文節タイプ変更部18を備えていなくてもよい。なお、文節タイプの変更を行わない場合であっても、あらかじめ規定されている特許請求項の構造を示す規則(例えば、文脈自由文法で記述された規則や、トークンや区切文節タイプの付与された記述断片の係り受け関係等)を適切なものにすることによって、文節タイプの変更を行った場合と同様の結果を得ることも可能である。
【0115】
また、上記実施の形態において用いた具体的なルールや条件、情報等は、それらに限定されないことは言うまでもない。目的を実現できる範囲において、適宜、それらを変更してもよい。
また、上記実施の形態では、請求項構造情報生成装置1がスタンドアロンである場合について説明したが、請求項構造情報生成装置1は、スタンドアロンの装置であってもよく、サーバ・クライアントシステムにおけるサーバ装置であってもよい。後者の場合には、出力部は、通信回線を介して情報を出力してもよい。
【0116】
また、上記実施の形態において、各処理または各機能は、単一の装置または単一のシステムによって集中処理されることによって実現されてもよく、あるいは、複数の装置または複数のシステムによって分散処理されることによって実現されてもよい。
【0117】
また、上記実施の形態において、各構成要素が実行する処理に関係する情報、例えば、各構成要素が受け付けたり、取得したり、選択したり、生成したり、送信したり、受信したりした情報や、各構成要素が処理で用いるしきい値や数式、アドレス等の情報等は、上記説明で明記していない場合であっても、図示しない記録媒体において、一時的に、あるいは長期にわたって保持されていてもよい。また、その図示しない記録媒体への情報の蓄積を、各構成要素、あるいは、図示しない蓄積部が行ってもよい。また、その図示しない記録媒体からの情報の読み出しを、各構成要素、あるいは、図示しない読み出し部が行ってもよい。
【0118】
また、上記実施の形態において、各構成要素等で用いられる情報、例えば、各構成要素が処理で用いるしきい値やアドレス、各種の設定値等の情報がユーザによって変更されてもよい場合には、上記説明で明記していない場合であっても、ユーザが適宜、それらの情報を変更できるようにしてもよく、あるいは、そうでなくてもよい。それらの情報をユーザが変更可能な場合には、その変更は、例えば、ユーザからの変更指示を受け付ける図示しない受付部と、その変更指示に応じて情報を変更する図示しない変更部とによって実現されてもよい。その図示しない受付部による変更指示の受け付けは、例えば、入力デバイスからの受け付けでもよく、通信回線を介して送信された情報の受信でもよく、所定の記録媒体から読み出された情報の受け付けでもよい。
【0119】
また、上記実施の形態において、請求項構造情報生成装置1に含まれる2以上の構成要素が通信デバイスや入力デバイス等を有する場合に、2以上の構成要素が物理的に単一のデバイスを有してもよく、あるいは、別々のデバイスを有してもよい。
【0120】
また、上記実施の形態において、各構成要素は専用のハードウェアにより構成されてもよく、あるいは、ソフトウェアにより実現可能な構成要素については、プログラムを実行することによって実現されてもよい。例えば、ハードディスクや半導体メモリ等の記録媒体に記録されたソフトウェア・プログラムをCPU等のプログラム実行部が読み出して実行することによって、各構成要素が実現され得る。なお、上記実施の形態における請求項構造情報生成装置1を実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、コンピュータを、特許請求項のテキストが区切られた記述断片と当該記述断片の構造とを示す請求項構造情報を生成する請求項構造情報生成装置として機能させるためのプログラムであって、特許請求項のテキストである特許請求項情報が記憶される記憶部で記憶されている特許請求項情報を形態素解析する形態素解析部、特許請求項情報の文節の区切位置を特定する文節特定部、特許請求項情報において、記述断片の区切となると共に記述断片間の関係を示す表層の手がかり情報と、表層の手がかり情報に対応するトークンとを有する表層区切情報が2以上記憶される表層区切情報記憶部で記憶されている表層の手かがり情報に該当する位置に、表層の手がかり情報に対応するトークンを付与するトークン付与部、特許請求項情報において、記述断片の区切となる文節の品詞の手がかり情報と、品詞の手がかり情報に対応する区切文節タイプとを有する文節タイプ対応情報が2以上記憶される文節タイプ対応情報記憶部で記憶されている品詞の手がかり情報に該当する文節に、品詞の手がかり情報に対応する区切文節タイプを付与する区切文節タイプ付与部、特許請求項情報に付与されたトークンと区切文節タイプとを用い、あらかじめ規定されている特許請求項の構造を示す規則に応じて、特許請求項情報の記述断片の構造を示す請求項構造情報を生成する生成部、生成部が生成した請求項構造情報を出力する出力部として機能させるためのものである。
【0121】
なお、上記プログラムにおいて、上記プログラムが実現する機能には、ハードウェアでしか実現できない機能は含まれない。例えば、情報を出力する出力部などにおけるモデムやインターフェースカードなどのハードウェアでしか実現できない機能は、上記プログラムが実現する機能には少なくとも含まれない。
【0122】
また、このプログラムは、サーバなどからダウンロードされることによって実行されてもよく、所定の記録媒体(例えば、CD−ROMなどの光ディスクや磁気ディスク、半導体メモリなど)に記録されたプログラムが読み出されることによって実行されてもよい。また、このプログラムは、プログラムプロダクトを構成するプログラムとして用いられてもよい。
【0123】
また、このプログラムを実行するコンピュータは、単数であってもよく、複数であってもよい。すなわち、集中処理を行ってもよく、あるいは分散処理を行ってもよい。
【0124】
図14は、上記プログラムを実行して、上記実施の形態による請求項構造情報生成装置1を実現するコンピュータの外観の一例を示す模式図である。上記実施の形態は、コンピュータハードウェア及びその上で実行されるコンピュータプログラムによって実現されうる。
【0125】
図14において、コンピュータシステム900は、CD−ROM(Compact Disk Read Only Memory)ドライブ905、FD(Floppy(登録商標) Disk)ドライブ906を含むコンピュータ901と、キーボード902と、マウス903と、モニタ904とを備える。
【0126】
図15は、コンピュータシステム900の内部構成を示す図である。図15において、コンピュータ901は、CD−ROMドライブ905、FDドライブ906に加えて、MPU(Micro Processing Unit)911と、ブートアッププログラム等のプログラムを記憶するためのROM912と、MPU911に接続され、アプリケーションプログラムの命令を一時的に記憶すると共に、一時記憶空間を提供するRAM(Random Access Memory)913と、アプリケーションプログラム、システムプログラム、及びデータを記憶するハードディスク914と、MPU911、ROM912等を相互に接続するバス915とを備える。なお、コンピュータ901は、LANへの接続を提供する図示しないネットワークカードを含んでいてもよい。
【0127】
コンピュータシステム900に、上記実施の形態による請求項構造情報生成装置1の機能を実行させるプログラムは、CD−ROM921、またはFD922に記憶されて、CD−ROMドライブ905、またはFDドライブ906に挿入され、ハードディスク914に転送されてもよい。これに代えて、そのプログラムは、図示しないネットワークを介してコンピュータ901に送信され、ハードディスク914に記憶されてもよい。プログラムは実行の際にRAM913にロードされる。なお、プログラムは、CD−ROM921やFD922、またはネットワークから直接、ロードされてもよい。
【0128】
プログラムは、コンピュータ901に、上記実施の形態による請求項構造情報生成装置1の機能を実行させるオペレーティングシステム(OS)、またはサードパーティプログラム等を必ずしも含んでいなくてもよい。プログラムは、制御された態様で適切な機能(モジュール)を呼び出し、所望の結果が得られるようにする命令の部分のみを含んでいてもよい。コンピュータシステム900がどのように動作するのかについては周知であり、詳細な説明は省略する。
【0129】
また、本発明は、以上の実施の形態に限定されることなく、種々の変更が可能であり、それらも本発明の範囲内に包含されるものであることは言うまでもない。
【産業上の利用可能性】
【0130】
以上より、本発明による請求項構造情報生成装置等によれば、より深い構造を持つ特許請求項についても、構造解析を行うことができるという効果が得られ、特許請求項を解析する装置等として有用である。
【符号の説明】
【0131】
1 請求項構造情報生成装置
11 記憶部
12 形態素解析部
13 文節特定部
14 表層区切情報記憶部
15 トークン付与部
16 文節タイプ対応情報記憶部
17 区切文節タイプ付与部
18 区切文節タイプ変更部
19 生成部
20 出力部
21 親子関係取得部
22 階層レベル取得部

【特許請求の範囲】
【請求項1】
特許請求項のテキストが区切られた記述断片と当該記述断片の構造とを示す請求項構造情報を生成する請求項構造情報生成装置であって、
特許請求項のテキストである特許請求項情報が記憶される記憶部と、
前記特許請求項情報を形態素解析する形態素解析部と、
前記特許請求項情報の文節の区切位置を特定する文節特定部と、
記述断片の区切となると共に記述断片間の関係を示す表層の手がかり情報と、当該表層の手がかり情報に対応するトークンとを有する表層区切情報が2以上記憶される表層区切情報記憶部と、
前記特許請求項情報において、表層の手かがり情報に該当する位置に、当該表層の手がかり情報に対応するトークンを付与するトークン付与部と、
記述断片の区切となる文節の品詞の手がかり情報と、当該品詞の手がかり情報に対応する区切文節タイプとを有する文節タイプ対応情報が2以上記憶される文節タイプ対応情報記憶部と、
前記特許請求項情報において、品詞の手がかり情報に該当する文節に、当該品詞の手がかり情報に対応する区切文節タイプを付与する区切文節タイプ付与部と、
前記特許請求項情報に付与されたトークンと区切文節タイプとを用い、あらかじめ規定されている特許請求項の構造を示す規則に応じて、前記特許請求項情報の記述断片の構造を示す請求項構造情報を生成する生成部と、
前記生成部が生成した請求項構造情報を出力する出力部と、を備えた請求項構造情報生成装置。
【請求項2】
記述断片の区切の並びに応じて、記述断片の区切でない位置に存在する区切文節タイプを削除する区切文節タイプ変更部をさらに備え、
前記生成部は、前記区切文節タイプ変更部が区切文節タイプを削除した後に請求項構造情報を生成する、請求項1記載の請求項構造情報生成装置。
【請求項3】
前記区切文節タイプ変更部は、
並列する記述断片の終端の区切文節タイプである終端区切文節タイプと、当該終端区切文節タイプより以前の、並列する記述断片が継続しうる区切文節タイプである継続区切文節タイプとの間に終端区切文節タイプが存在する場合に、両区切文節タイプの間に存在する当該終端区切文節タイプを削除する、請求項2記載の請求項構造情報生成装置。
【請求項4】
前記区切文節タイプ変更部は、
改行が存在する場合であって、改行が後続しない動詞に関する区切文節タイプが存在する場合に、当該区切文節タイプを削除する、請求項2または請求項3記載の請求項構造情報生成装置。
【請求項5】
前記生成部は、
文脈自由文法で記述されたトークン及び区切文節タイプに関する規則と、当該規則に対応する構造を前記特許請求項情報に付与するアクションとを有する文法ファイルを用いて生成された構文解析器を用いて、前記特許請求項情報に対応する請求項構造情報を生成する、請求項1から請求項4のいずれか記載の請求項構造情報生成装置。
【請求項6】
特許請求項の構造の文脈自由文法による記述が特許請求項の終端から先頭への方向で記述されており、
前記生成部は、
トークン及び区切文節タイプの付与された前記特許請求項情報を終端から先頭への方向で取り込むことによって請求項構造情報を生成する、請求項5記載の請求項構造情報生成装置。
【請求項7】
前記生成部は、
前記特許請求項情報に、前記文法ファイルに含まれる規則に対応した構造を示すマークを付与することによって、マークアップ言語を用いて記述された請求項構造情報を生成する、請求項5または請求項6記載の請求項構造情報生成装置。
【請求項8】
前記生成部は、
あらかじめ規定されているトークンの付与された記述断片及び区切文節タイプの付与された記述断片の係り受け関係に応じて、前記トークン付与部が付与したトークン及び前記区切文節タイプ付与部が付与した区切文節タイプで区切の示される記述断片間の係り受け関係を特定し、当該記述断片間の係り受け関係を示す請求項構造情報を生成する、請求項1から請求項4のいずれか記載の請求項構造情報生成装置。
【請求項9】
前記出力部は、
前記生成部が生成した請求項構造情報を、記述断片間の関係が分かるように表示する、請求項1から請求項8のいずれか記載の請求項構造情報生成装置。
【請求項10】
トークンには、構成要素の包含関係に応じたトークンが存在し、
区切文節タイプには、
構成要素の包含関係を示すトークンに対して、親の構成要素に応じた区切文節タイプである親区切文節タイプと、
構成要素の包含関係を示すトークンに対して、子の構成要素に応じた区切文節タイプである子区切文節タイプと、が存在し、
前記出力部は、親区切文節タイプに対応する記述断片と、子区切文節タイプに対応する記述断片との親子関係が分かるように両記述断片を表示する、請求項9記載の請求項構造情報生成装置。
【請求項11】
親区切文節タイプと子区切文節タイプとの付与された前記特許請求項情報を用いて、構成要素の親子関係を取得する親子関係取得部と、
前記親子関係取得部が取得した構成要素の親子関係を用いて、構成要素の階層レベルを取得する階層レベル取得部と、を備え、
前記出力部は、前記階層レベル取得部が取得した階層レベルに応じて、親区切文節タイプ及び子区切文節タイプに対応する記述断片を表示する、請求項10記載の請求項構造情報生成装置。
【請求項12】
特許請求項のテキストである特許請求項情報が記憶される記憶部と、形態素解析部と、文節特定部と、特許請求項のテキストにおける記述断片の区切となると共に記述断片間の関係を示す表層の手がかり情報と、当該表層の手がかり情報に対応するトークンとを有する表層区切情報が2以上記憶される表層区切情報記憶部と、トークン付与部と、記述断片の区切となる文節の品詞の手がかり情報と、当該品詞の手がかり情報に対応する区切文節タイプとを有する文節タイプ対応情報が2以上記憶される文節タイプ対応情報記憶部と、区切文節タイプ付与部と、生成部と、出力部とを用いて処理される、特許請求項のテキストが区切られた記述断片と当該記述断片の構造とを示す請求項構造情報を生成する請求項構造情報生成方法であって、
前記形態素解析部が、前記特許請求項情報を形態素解析する形態素解析ステップと、
前記文節特定部が、前記特許請求項情報の文節の区切位置を特定する文節特定ステップと、
前記トークン付与部が、前記特許請求項情報において、表層の手かがり情報に該当する位置に、当該表層の手がかり情報に対応するトークンを付与するトークン付与ステップと、
前記区切文節タイプ付与部が、前記特許請求項情報において、品詞の手がかり情報に該当する文節に、当該品詞の手がかり情報に対応する区切文節タイプを付与する区切文節タイプ付与ステップと、
前記生成部が、前記特許請求項情報に付与されたトークンと区切文節タイプとを用い、あらかじめ規定されている特許請求項の構造を示す規則に応じて、前記特許請求項情報の記述断片の構造を示す請求項構造情報を生成する生成ステップと、
前記出力部が、前記生成ステップで生成した請求項構造情報を出力する出力ステップと、を備えた請求項構造情報生成方法。
【請求項13】
コンピュータを、
特許請求項のテキストが区切られた記述断片と当該記述断片の構造とを示す請求項構造情報を生成する請求項構造情報生成装置として機能させるためのプログラムであって、
特許請求項のテキストである特許請求項情報が記憶される記憶部で記憶されている特許請求項情報を形態素解析する形態素解析部、
前記特許請求項情報の文節の区切位置を特定する文節特定部、
前記特許請求項情報において、記述断片の区切となると共に記述断片間の関係を示す表層の手がかり情報と、当該表層の手がかり情報に対応するトークンとを有する表層区切情報が2以上記憶される表層区切情報記憶部で記憶されている表層の手かがり情報に該当する位置に、当該表層の手がかり情報に対応するトークンを付与するトークン付与部、
前記特許請求項情報において、記述断片の区切となる文節の品詞の手がかり情報と、当該品詞の手がかり情報に対応する区切文節タイプとを有する文節タイプ対応情報が2以上記憶される文節タイプ対応情報記憶部で記憶されている品詞の手がかり情報に該当する文節に、当該品詞の手がかり情報に対応する区切文節タイプを付与する区切文節タイプ付与部、
前記特許請求項情報に付与されたトークンと区切文節タイプとを用い、あらかじめ規定されている特許請求項の構造を示す規則に応じて、前記特許請求項情報の記述断片の構造を示す請求項構造情報を生成する生成部、
前記生成部が生成した請求項構造情報を出力する出力部として機能させるためのプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5A】
image rotate

【図5B】
image rotate

【図6A】
image rotate

【図6B】
image rotate

【図6C】
image rotate

【図6D】
image rotate

【図6E】
image rotate

【図6F】
image rotate

【図6G】
image rotate

【図6H】
image rotate

【図6I】
image rotate

【図6J】
image rotate

【図6K】
image rotate

【図6L】
image rotate

【図7A】
image rotate

【図7B】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate


【公開番号】特開2012−3517(P2012−3517A)
【公開日】平成24年1月5日(2012.1.5)
【国際特許分類】
【出願番号】特願2010−137876(P2010−137876)
【出願日】平成22年6月17日(2010.6.17)
【国等の委託研究の成果に係る記載事項】(出願人による申告)平成22年度独立行政法人情報通信研究機構「民間基盤技術研究促進制度/知的財産(特許・商標)構築・活用のための情報通信基盤技術の研究開発」、産業技術力強化法第19条の適用を受ける特許出願
【出願人】(391021710)株式会社インテック (11)
【Fターム(参考)】