説明

3要素モデルに基づく検索情報加工方法

【課題】複雑な検索要求も解決可能とする3要素モデルに基づく検索情報加工方法を提供する。
【解決手段】本発明は3要素モデルに基づく検索情報加工方法に関するものであり、そのステップは、ソースファイル情報に入力されるキーワードを使用し、キーワードがファイル中の位置に出現する辞書を製作し、3要素関係モデルを構築し、上記3要素関係モデル中の関係(Kaはキーワードaを表し、Kbはキーワードbを表し、Krはキーワードaとキーワードbとの関係情報を表している。Kr’はKrのKrを根拠として導き出した関係を表し、これからKa’キーワードとKb’キーワードは新たな関係Kr’をもつ)の入力に対し、これらの関係情報を検索データベースに登録し、登録したキーワードと関係に基づいてキーワード間の新たな関係を自動的に導き出すとともに、キーワードと関係を辞書に記録する。即ち、Ka’のキーワードとKb’のキーワードの新たな関係Kr’を自動的に導き出すとともに、キーワードと関係を対応付けて辞書に記録する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、検索情報加工方法、特に3要素モデルに基づく検索情報加工方法に関するものである。
【背景技術】
【0002】
従来、データ情報とテキストファイルの効果的な検索及び加工は、データベースの応用分野において中心及び重要事項であり、各種電子データ、文献、商業用データベースソースとインターネットにおける情報検索に広汎に応用されている。
【0003】
現在、この分野におけるデータ情報検索技術は、キーワードによる統計方法が一般的であり、キーワードのブーリアン演算式を用いて語句検索を行っている。ファイルデータベースについては、キーワードを使用してキーワードがファイル中の所定位置に出現するように構成された辞書であり、検索語句のキーワードとファイルデータベース中のキーワードとを比較する辞書を用いて、対応するファイルを探し出すようになされている。また他のものは、ファジィ論理モデル、ベクトル空間モデル及び確率検索モデル等を採用するように改良したものも知られている。
【0004】
インテリジェント処理においては、現在、操作はすべてテーマインデックス、個別のキーワード注釈、テキストファイルのアブストラクト方式によって、テキストファイル全体に対し属性表示を行って検索過程の検索キーワードとしており、このような方式ではテキストファイル全体の情報内容を完全に反映させることはできず、最終的な検索結果中に該当するテキストファイルが欠落する虞れがある。
【0005】
特許文献1には、関連ある属性同士を属性階層ツリーとして更新・追加・削除して管理すると共に、属性の選択の場合には、単一階層属性ツリーからユーザが任意の順序で属性を選択して絞り込み、情報に任意の個数だけ属性値を直接付与した属性階層ツリーの任意の階層から属性を選択し、上位、同位、下位、いずれの階層の属性も選択、展開してユーザ本位の検索を行うものが示されている。
【特許文献1】2004-94634号公報
【発明の開示】
【発明が解決しようとする課題】
【0006】
上記の問題を解決するために、本発明は“隠れた代替・指示”などの複雑な検索要求も解決可能とする3要素モデルに基づく検索情報加工方法を提供する。
【課題を解決するための手段】
【0007】
本発明は以下の処理によって実現される。
3要素モデルに基づく検索情報加工方法であって、次のステップを含んでいる
(1) ソースファイル情報に入力されるキーワードを使用してキーワードが上記ファイル中の所定位置に出現するように構成された辞書を作製する。
(2) 3要素関係モデルを構築して、3要素グループKa、Kr、Kb形式を採用する。ここでKaはキーワードaを表し、Kbはキーワードbを表し、Krはキーワードaとキーワードbとの関係情報を表す。前記3要素グループの形式はキーワード間の3種類のタイプの関連関係を表示並びに対応付けを実行する。Krは関係情報間の関係を示す情報、例えば逆関係、二段反復、同一主語、対称などを表し、Kr’はKrのKrを根拠として導き出した関係を表し、これからKa’のキーワードとKb’のキーワードは新たな関係Kr’をもつことになる。
(3) 上記3要素関係モデル中のKr、Kr、Kr’を対応付けた入力に対し、Kr、Kr、Kr’を対応付けた情報を検索データベースに登録する。
(4) ステップ(1)中のキーワードとステップ(3)中の関係に基づいて、キーワード間の新たな関係、即ち、Ka’のキーワードとKb’のキーワードの新たな関係Kr’を自動的に導き出すとともに、キーワードと関係を対応付けて辞書に記録する。
【0008】
上記3要素の関係は、構成要素の主従関係、等価別名関係及び背景参考関係を含む。上記3要素の関係モデルの方法は複数回応用、組み合わせて応用することで、より多くの論理的な結果を生み出すことができる。
【0009】
上記検索情報加工方法により作成されたデータベースの検索過程では、検索キーワードを入力した後、従来の方法でキーワード辞書を用いて探し出す内容を検索できるばかりでなく、上記3要素の関係に基づいてソースファイルには記録がないが実際には存在するもの、即ち“隠れた代替・指示”を検索することもできる。
【発明の効果】
【0010】
上記検索情報加工方法により作成された索システムは、既存の検索システムと比較して、上記方法には次のような効果を有する。
1. 基礎データ量を大幅に削減することができる。現在存在する検索システムは、様々な検索要求を満足するために基礎データを完備しなければならず、推論される全ての結論を基礎データとしてシステムに加える必要があるが、本願の方法では基礎データは少なくて済み、大量のデータの結果を推論して検索に供することができる。
【0011】
2. 検索データを大幅に増加できる。ユーザが検索できるデータは、基礎データ量だけに依存するわけではなく、関係3要素グループの数に関係する。関係3要素グループは高い汎用性をもつため、関係3要素グループが一つ増えると、それに伴う検索可能データは、倍、または幾何級数的に倍増する。
【0012】
3. データの関係一致性がより強まる。大量の結論はシステムが論理的推論を行って得られるものであるため、厳密な論理性を有している。現在存在する検索システムでは、基礎データは独立してデータベースに加わるため、データの一致性を保障できない。
【0013】
4. 関係の拡張性を有する。論理的な関係3要素グループに適合さえすればシステム中で定義することができ、その意義としては、このシステムによって、生活経験及び現有のテクノロジーの発展情況に基づいて総括された関係を実現することができ、また、社会、テクノロジーのとどまることのない進歩にともなって新たな関係も次々に生まれるが、このような新たな関係も同様にシステムにおいて実現可能であることであり、さらに、新たに定義された関連3要素グループに対しても、以前の全てのデータは対応するグループを即時に得て検索に用いることができる。
【発明を実施するための最良の形態】
【0014】
以下、図面と具体的な実施例を組み合わせて本発明を更に詳細に説明する。本発明では、高い融通性と知能をもつインデックスの仕組みを構成するために、自己包括、自己構成の3要素関係モデルを構築した。一般的に各種言語には主要な文法構造があり(主語、述語、目的語)、本発明はこのような3要素関係を比較し、3要素関係モデルに基づくデータの表現、記憶及び検索を実現する。本発明に関わるシステム及び方法は、コンピュータの単体、局域のインターネット、企業内部のイントラネット(Intranet)、インターネット(Internet)等多くの環境の下に応用することができ、システムユーザは情報内容検索を求める任意の人達に広く発展できる。
【0015】
図1に示すように、本発明の3要素関係モデルは3要素グループKa、Kr、Kb形式を採用している。ここで、Kaはキーワードaを表し、Kbはキーワードbを表し、Krはキーワードaとキーワードbとの関係情報を表している。前記3要素グループの形式は、キーワード間の主従関係、等価別名関係及び背景参考関係を含む3種類のタイプの関連関係を表示並びに対応付けを実行する。システムは、ソースファイル情報に入力されるキーワードを使用してキーワードがファイル中の所定位置に出現するように構成された辞書を作製する。
【0016】
どのタイプも更に細かに分類することができ、また各種の関係の間であっても3種類のタイプの関連関係として対応付けを実現することができる。このような3要素関係モデルを基礎として検索を行うことで、単純な個々のキーワードの組合せの検索方法とは異なり、論理的な含みもカバーする検索を行うことができる。
【0017】
Krは関係キーワード間の関係、例えば逆関係、二段反復、同一主語、対称等を表し、Kr’はKrのKrを根拠として導き出した関係を表し、これからKa’キーワードとKb’キーワードは新たな関係Kr’をもつことになる。上記3要素関係モデル中のKr、Kr、Kr’を対応付けた入力に対し、システムは、Kr、Kr、Kr’を対応付けた情報を検索データベースに登録する。システムは、登録された上記関係に基づいて、キーワード間の新たな関係、即ち、Ka’のキーワードとKb’のキーワードの新たな関係Kr’を自動的に導き出すとともに、キーワードと関係を対応付けて辞書に記録する。
【0018】
図2は人物インデックスキーワード間の関係について、本発明の実施例に係る検索情報加工方法を用いて検索システムを実現した一例である。システム中の人物キーワードには以下の3つの3要素グループが含まれる。
(田中祖父、息子、田中父);(田中父、息子、田中子1);(田中父、息子、田中子2)
【0019】
更に、図3に示すように、システムには以下の関係キーワードに対する3要素グループも定義されている。
(息子、逆関係、父親);(息子、二段反復、孫);(息子、同一主語、兄弟);(兄弟、対称、兄弟)
【0020】
このようにすると、作成されたシステムはその他の情報を追加しなくとも以下の結論を自動的に導き出すことができる。
図4に示すようにシステムは、“逆関係”を根拠として(田中父、父親、田中祖父);(田中子1、父親、田中父);(田中子2、父親、田中父)を推論する。
【0021】
図5に示すようにシステムは、“二段反復”関係を根拠として(田中祖父、孫、田中子1);(田中祖父、孫、田中子2)を推論する。
図6、図7に示すようにシステムは、“同一主語”関係を根拠として(田中子1、兄弟、田中子2)を推論するとともに、これを基礎とし“対称”関係を根拠として(田中子2、兄弟、田中子1)を推論する。注意すべきは、推論する順序の前後は実際の情況に応じて異なることもある点である。
【0022】
以上の結果は、関係キーワード3要素グループを一度だけ応用した場合の結論であり、複数回応用、組合せて応用した場合にはより多くの論理的結果が得られる。
【0023】
本発明はキーワードの3要素モデルに類似するインデックス方法を採用し、次のような検索システムを実現可能である。インデックスは(C、R、K)グループと(Ca、R、Cb)3要素グループを採り入れて表示並びに対応付けられて実現されており、それにおけるCはファイルの内容を表し、Kはキーワードを表し、Rはファイルとキーワードとの関係を表している。Caはファイルaの内容を表し、Cbはファイルbの内容を表し、Rはファイルaとファイルbとの関係を表している。ここではファイル中のキーワードの位置、長さ、関係の程度等およびファイル間の相互引用等の関連知識を表示可能に検索システムに記録するものとする。このように構築されたインデックスによって、ファイルを構造的に示してユーザの関連情報への要求を満たすことができるほか、知識のリソースの初期モードに従って示すこともできる。
【0024】
また、(C、R、K)の3要素グループによるインデックス方法は、ファイル中の“代替・指示”関係を有効に解決することができ、例えば一つのファイルに存在する代名詞“彼”に対して、3要素グループ中で実際の代替・指示の対象を確定することにより、システムは、文字の異同や類似だけでなく、代替・指示の対象に対する検索結果をユーザに提供することができる。
【0025】
本発明の上記実施例によって発明内容をすでに詳細に説明している。この分野の技術者が本発明の原理を逸脱しない前提で為す容易に想到し得る各種の変更は、本出願が請求する権利の保護範囲内であることは言うまでもない。
【図面の簡単な説明】
【0026】
【図1】本発明の3要素関係モデルを示す図。
【図2】本発明の実施例中の人物インデックスキーワード間の関係を示す図。
【図3】本発明の実施例中の関係キーワード間の関係を示す図。
【図4】本発明の実施例中の“逆関係”の推論ルートを示す図。
【図5】本発明の実施例中の“二段反復”の推論ルートを示す図。
【図6】本発明の実施例中の“同一主語”の推論ルートを示す図。
【図7】本発明の実施例中の“対称”の推論ルートを示す図。
【符号の説明】
【0027】
Ka、Kb キーワード
Kr キーワードとキーワードとの関係情報
Ka’、Kb’ キーワード
Kr’ キーワードとキーワードとの関係情報
Kr 関係情報間の関係を示す情報

【特許請求の範囲】
【請求項1】
3要素モデルに基づく検索情報加工方法であって、
ソースファイル情報に入力されるキーワードを使用してキーワードが前記ファイル中の所定位置に出現するように構成された辞書を作製する第1のステップと、
Kaはキーワードaを表し、Kbはキーワードbを表し、Krはキーワードaとキーワードbとの関係を表す3要素関係モデルを構築して、前記3要素グループの形式によりキーワード間の3種類のタイプの関連関係を表示並びに対応付けを行う第2のステップと、
上記3要素関係モデル中のKr、Kr、Kr’を対応付けた入力に対し、Kr、Kr、Kr’を対応付けた情報を検索データベースに登録する第3のステップと、
第1のステップ中のキーワードと第3のステップにより設定された関係に基づいて、キーワード間の新たな関係、即ち、Ka’のキーワードとKb’のキーワードの新たな関係Kr’を自動的に導き出すとともに、キーワードと関係を対応付けて辞書に記録する第4のステップと
を具備することを特徴とする検索情報加工方法。
【請求項2】
上記3要素の関係は、構成要素の主従関係、等価別名関係及び背景参考関係を含むことを特徴とする請求項1に記載の3要素モデルに基づく検索情報加工方法。
【請求項3】
上記3要素関係モデルを複数回応用、組み合わせて応用することを特徴とする請求項1又は2に記載の3要素関係モデルに基づく検索情報加工方法。
【請求項4】
Cはファイルの内容を表し、Kはキーワードを表し、Rはファイルとキーワードとの関係を表し、Caはファイルaの内容を表し、Cbはファイルbの内容を表し、Rはファイルaとファイルbとの関係を表す場合に、(C、R、K)グループと(Ca、R、Cb)の3要素グループにより表示並びに対応付けを実現させたインデックス方法を採り入れ、ファイル中のキーワードの位置、長さ、関係の程度等およびファイル間の相互引用等の関連知識を表示可能に記録することを特徴とする請求項1乃至3のいずれか1項に記載の3要素関係モデルに基づく検索情報加工方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2007−317189(P2007−317189A)
【公開日】平成19年12月6日(2007.12.6)
【国際特許分類】
【出願番号】特願2007−132175(P2007−132175)
【出願日】平成19年5月17日(2007.5.17)
【出願人】(507162175)
【出願人】(507162212)
【Fターム(参考)】