情報提供装置および情報提供方法
【課題】 所望の情報に簡単に辿り着くことのできる、利用者の負担の少ない情報提供装置を提供する。
【解決手段】
内容から利用目的を推定可能な複数の情報が格納される記憶部A2と、上記複数の情報のそれぞれについて、該情報の内容を解析して利用目的を推定するとともに、該推定した利用目的を該情報と関連付けて記憶部B1に格納する利用目的推定部A11と、検索すべき情報の内容および利用目的をそれぞれ推定可能な検索要求が提示されると、該提示された検索要求に関連する内容および利用目的を持つ情報を記憶部A2から検索する情報検索・分類部A12とを有する。
【解決手段】
内容から利用目的を推定可能な複数の情報が格納される記憶部A2と、上記複数の情報のそれぞれについて、該情報の内容を解析して利用目的を推定するとともに、該推定した利用目的を該情報と関連付けて記憶部B1に格納する利用目的推定部A11と、検索すべき情報の内容および利用目的をそれぞれ推定可能な検索要求が提示されると、該提示された検索要求に関連する内容および利用目的を持つ情報を記憶部A2から検索する情報検索・分類部A12とを有する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報の検索や分類を行う装置及び方法に関する。
【背景技術】
【0002】
近年、大量の情報が供給される中で、所望の情報を簡単に検索や分類するといった要求が高まっている。また、情報を簡単に利用したいという利用者側の要求がある一方で、利用者が利用する情報、例えば文書、メール、画像、音声などの情報も電子化されるようになってきた。こうした現状から、情報の検索や分類を簡単に行うおとが可能なシステムとして、検索や分類の対象である情報の内容と、その情報の提供者(作者)、時間(作成時刻)、ファイル長などの属性とを用いて、必要な情報を検索・分類するシステムが提案されている。情報内容を細かい単位に分割して情報を分析するシステムもある。このようなシステムにおいては、情報の内容が言語的なものである場合は、一般的な自然言語処理手法である形態素解析処理を行って、各単語にインデックスを付与し、情報に含まれる各単語をキーにして情報の内容を検索・分類するようになっている。
【0003】
しかし、蓄積される情報は、雑多にまたは一方的な観点で分類されてデータベース化されることが多く、上記のシステムでは、このようなデータベース化された情報において所望の情報に簡単に辿り着けない場合がある。例えば、「ゲートウェイ・サーバーを購入したい」と思っている利用者が、「ゲートウェイ・サーバー」、「購入」といった検索語を入力して、その検索語に関連する文書や情報を検索する場合で、各社のゲートウェイ・サーバーのラインナップや価格表、使用レポートなど、ゲートウェイ・サーバーを購入する上で参考になる情報が、その情報内に「購入」といった語句を含まない場合は、それらの情報に辿り着くことは困難である。また、「ゲートウェイ・サーバー」といった検索語のみを入力した場合は、「ネットワーク上で媒体やプロトコルが異なるデータを相互に変換して各利用者のコンピュータであるクライアント間の通信を可能にするコンピュータ。」といったゲートウェイ・サーバーに関する一般的な説明など、ゲートウェイ・サーバーを購入する上ではあまり参考にならない多くの情報が検索結果に含まれることになる。
【0004】
そこで、検索対象である情報に第三者のコメントを付記してもらい、情報の内容だけでなく、付記したコメントの内容についても情報検索に利用する方法が提案されている(特許文献1参照)。この方法では、情報を利用した二次利用者が、その情報に関するコメントや評価を付記する。付記したコメントや評価は利用した情報と関連付けて登録されて、情報の検索・分類に利用される。
【0005】
また、目的情報を用いて画像データが記録される記憶領域の位置を管理する方法が提案されている(特許文献2参照)。この方法では、利用者が指定した利用目的毎に、画像データが登録される。
【特許文献1】特開2004-310676号公報(第1頁、図1)
【特許文献2】特開平11-98454号公報(第3頁〜第4頁)
【発明の開示】
【発明が解決しようとする課題】
【0006】
しかしながら、上述した従来の方法には、以下のような問題がある。
【0007】
特許文献1に記載の方法においては、第三者のコメントや評価を情報の検索・分類に利用することができるので、詳細な情報の検索・分類を行うことが可能となる。しかし、コメントや評価の付記は時間や労力を要することから、第三者(利用者)に対する負担が大きい。また、第三者(利用者)によるコメントや評価が付記されない場合もある。この場合には、詳細な情報の検索・分類を行うことができないため、所望の情報に簡単に辿り着けない、といった前述の問題を解決することはできない。
【0008】
特許文献2に記載の方法においては、利用目的を用いて情報を分類することにより、所望の情報に簡単に辿り着くことが可能となっている。しかし、利用目的は、情報を蓄積する際に利用者がその都度入力するようになっている。このため、利用目的を入力するための操作が煩わしい。加えて、すでにデータベース化されている大量の情報について、そのような利用目的の入力操作を行う場合は、作業が膨大となり、現実的ではない。
【0009】
本発明の目的は、上記の問題を解決し、所望の情報に簡単に辿り着くことのできる、利用者の負担の少ない情報提供装置を提供することにある。
【課題を解決するための手段】
【0010】
上記目的を達成するため、本発明は、内容から利用目的を推定可能な複数の情報が格納される記憶部と、前記複数の情報のそれぞれについて、該情報の内容を解析して利用目的を推定するとともに、該推定した利用目的を該情報と関連付けて前記記憶部に格納する利用目的推定部と、検索すべき情報の内容および利用目的をそれぞれ推定可能な検索要求が提示されると、該提示された検索要求に関連する内容および利用目的を持つ情報を前記記憶部から検索する検索部とを有する。
【0011】
上記の構成によれば、情報の内容だけでなく、利用目的を用いた情報の検索が可能とされている。利用者が所望する情報は、基本的には、その情報の利用目的と合致するので、利用目的に応じた検索により、利用者が所望する情報をより正確かつ詳細に検索することが可能である。従来は、単に「ゲートウェイ・サーバー」といった検索語を入力するだけであったので、利用者が所望する情報とは関係のない情報までも検索されてしまっていたが、本発明では、情報をどのように利用したいかといった利用者の使用目的を加味した検索が可能であるので、利用者の所望する情報を確実に提供することが可能である。
【0012】
また、利用目的推定部が情報の利用目的を自動的に推定して記憶部に格納するようになっているので、利用者が情報の利用目的を設定する必要はない。
【発明の効果】
【0013】
上述のとおり、本発明によれば、利用者が所望する情報を、その利用目的に応じて提供することができるので、従来に比べて、利用者は、簡単に目的の情報に辿り着くことができ、その結果、利便性も向上する。
【発明を実施するための最良の形態】
【0014】
次に、本発明の実施形態について図面を参照して説明する。
【0015】
(第1の実施形態)
図1は、本発明の第1の実施形態である情報検索・分類方法の原理を説明するための図である。本実施形態の情報検索・分類方法は、情報の内容および属性を関連付けて蓄積し、該蓄積した情報から検索・分類要求に基づいて該当する情報を検索・分類する情報検索・分類方法であって、図1に示すように、利用目的推定処理11、情報管理処理12、情報検索・分類処理13の3つの処理を含む。
【0016】
利用目的推定処理11は、既に蓄積された情報(既にデータベース化された情報)またはこれから蓄積される情報について、その情報の利用目的を推定する処理である。情報の利用目的は、その情報を利用する際の、目的、目標、ゴール、意図などに関する情報や、利用時の行動を表す情報である。具体的には、「その情報を何に使ったか」、「その情報を何のために使ったか」といった目的に関する情報や、「その情報を使って何をしたか」といった行動に関する情報が、利用目的である。この他、「〜に向けた(情報A)」、「(情報Aを)〜用に」、「(情報Aを)〜に使ってください」、「ご参考までに(情報Aを)〜にお役立てください」といった、文書中に現われる表現の「〜」の部分を利用目的としてもよい。また、利用時の行動を示す情報Aを利用する際に用いられる「〜をしました」、「〜の申請をお願いします」、「発注書」等の表現において現われる「〜をする」、「申請する」、「発注する」といった用言表現を利用目的としてもよい。利用目的の推定方法としては、情報の内容を分析することで利用目的を推定する方法(品詞情報などの属性情報を用いた分析を含む)や、情報にあらかじめ付与されている作者、作成時期、書式などの属性情報から利用目的を推定する方法など、種々の推定方法を適用することができる。
【0017】
情報管理処理12は、利用目的推定処理11にて推定された利用目的を利用目的属性として情報の内容とともに保持して管理する処理である。各情報の内容や各情報の内容にリンクの貼られたファイル名と、その利用目的属性とが関連付けられて記憶部に格納される。複数の情報に対して同一の利用目的属性を付与することができる。また、一つの情報に対して、複数の異なる利用目的属性を付与したり、複数の同一の利用目的属性を付与したりすることができる。ここでは、利用目的属性が付与された情報を、利用目的属性付き情報と呼ぶ。
【0018】
情報検索・分類処理13は、情報管理処理12によって管理されている利用目的属性付き情報を、その情報の内容および利用目的属性の少なくとも一方を検索・分類条件として検索・分類する処理である。
【0019】
本実施形態の情報検索・分類方法では、利用目的推定処理11および情報管理処理12により、利用目的属性付き情報のデータベース化が行われる。そして、情報検索・分類処理13により、そのデータベース化された利用目的属性付き情報についての検索・分類が行われる。
【0020】
以下、本実施形態の情報検索・分類方法を適用した情報検索・分類装置について説明する。
【0021】
図2は、本発明の第1の実施形態である情報検索・分類方法を適用した情報検索・分類装置の主要な構成を示すブロック図である。図2に示すように、情報検索・分類装置は、データ処理部A1および記憶部A2からなる。
【0022】
データ処理部A1は、外部端末との間で情報の入出力が行われる入出力処理部A10と、図1に示した利用目的推定処理11が行われる利用目的推定部A11と、図1に示した情報検索・分類処理13が行われる情報検索・分類部A12とを有する。記憶部A2は、入出力処理部A10を通じて供給された情報(検索・分類の対象となる種々の情報)が蓄積されるものであって、図1に示した情報管理処理12を通じて利用目的属性付き情報が格納される利用目的属性付き情報記憶部A21を有する。データ処理部A1と記憶部A2は、同じ装置上にあってもよいし、別々の装置上にあってもよい。
【0023】
利用目的推定部A11は、入出力処理部A10を通じて情報蓄積部21に蓄積される各情報(この情報は、外部端末やネットワークを通じて提供される情報であっても、外部記憶装置に蓄積されてデータベース化された情報であってもよい。)について、情報の内容を解析して利用目的を推定し、該推定した利用目的を示す利用目的属性を情報の内容に付与した利用目的属性付き情報を利用目的属性付き情報記憶部A21に格納する。
【0024】
情報検索・分類部A12は、利用者が外部端末から入出力処理部A10を通じて提示した検索・分類要求を受け付け、該受け付けた検索・分類要求に基づいて、利用目的属性付き情報記憶部A21に格納されている利用目的属性付き情報の検索・分類を行う。具体的には、情報検索・分類部A12は、検索・分類要求から検索・分類すべき情報の利用目的および内容を判断し、その判断した利用目的および内容に基づいて利用目的属性付き情報の検索・分類を行う。利用者は、検索・分類要求として、検索・分類すべき情報の内容とともに、その情報の利用目的を明示的に提示してもよい。この場合は、情報検索・分類部A12は、提示された利用目的に対応する利用目的属性が付され、かつ、提示された内容と合致する、利用目的属性付き情報がある否かの判断を行う。また、利用者は、検索・分類要求として、利用目的を表す語を含む複数の検索・分類語を提示してもよい。この場合は、情報検索・分類部A12は、提示された検索・分類語について利用目的を表す語と内容を表す語とを判別し、その利用目的を表す語に対応する利用目的属性が付され、かつ、内容を表す語と合致する、利用目的属性付き情報がある否かの判断を行う。情報検索・分類部A12にて検索・分類された情報は、入出力処理部A10を通じて検索・分類要求を行った利用者の端末に返される。
【0025】
次に、本実施形態の情報検索・分類装置の動作について具体的に説明する。本実施形態の情報検索・分類装置では、利用目的推定部A11が、利用目的属性付き情報を記憶部A2の利用目的属性付き情報記憶部A21に格納する処理(データベース化)と、情報検索・分類部A12が、利用目的属性付き情報記憶部A21に格納された利用目的属性付き情報を検索・分類する処理とが行われる。
【0026】
図3に、利用目的属性付き情報の格納処理の一手順を示す。まず、ステップS11で、入出力処理部A10を通じて情報蓄積部21に蓄積される情報について、その利用目的を推定する。そして、ステップS11で、情報の内容に推定した利用目的を利用目的属性として付与した利用目的属性付き情報を利用目的属性付き情報記憶部A21に格納する。ここで、利用目的は、情報の内容を分析した結果から付与してもよいし、情報にあらかじめ付与されている作者、作成時期、書式などの属性情報から利用目的を推定しても良い。
【0027】
図4に、利用目的属性付き情報の検索・分類処理の一手順を示す。この処理は、情報検索・分類部A12が、利用目的属性付き情報の格納処理(データベース化)と同時進行で行うことができる。まず、ステップS21で、入出力処理部A10を通じて利用者からの検索・分類要求を受け付ける。続いて、ステップS22で、検索・分類要求の内容を分析して、検索・分類すべき情報の利用目的および内容を取得する。続いて、ステップS23で、その取得した検索・分類すべき情報の利用目的および内容に基づいて、利用目的属性付き情報記憶部A21に格納されている利用目的属性付き情報を検索・分類する。そして、ステップS24で、検索・分類要求をした利用者に対して、その検索・分類結果を入出力処理部A10を通じて返す。
【0028】
[第1の実施形態の実施例]
以下、上述した第1の実施形態における利用目的属性付き情報の格納処理および検索・分類処理を含む情報検索・分類処理の具体例として、利用者が、各社のゲートウェイ・サーバーを比較するために情報の検索を行う場合の動作を説明する。
【0029】
図5(a)に、利用目的属性付き情報記憶部A21に格納される利用目的属性付き情報の一例を示す。図5(a)を参照すると、利用目的属性付き情報記憶部A21は、ファイル名の欄と利用目的の欄の2つの欄から構成されている。ファイル名の欄には、「情報A」、「情報B」、「情報C」といったファイル名が格納されている。「情報A」は、各社のゲートウェイ・サーバーのラインナップや価格比較に関する情報が格納されたファイルである。「情報B」は、ゲートウェイ・サーバーの購入要求書に関する情報が格納されたファイルである。「情報C」は、ゲートウェイ・サーバーの賃借契約書に関する情報が格納されたファイルである。「情報A」の利用目的の欄には「比較」といった用言表現が、「情報B」の利用目的の欄には「購入」といった用言表現が、「情報C」の利用目的の欄には「賃借」といった用言表現がそれぞれ利用目的属性として付与されている。このように、複数の情報A〜Cのそれぞれに対して利用目的属性が付与されている。なお、図示はしていないが、1つの情報に対して複数の利用目的属性が付与されてもよい。例えば、情報Aに対して、「比較」および「購入」といった2つの利用目的属性が付与されてもよい。また、同じ属性で利用される場合、もしくは利用されると判断される場合は、1つの情報に対して複数の同じ属性を付与しても良い。例えば、「情報A」のファイル内の文章中の異なる箇所で、「比較」といった用言表現が現われる場合は、その箇所の数だけ、「情報A」の利用目的の欄に「比較」といった利用目的属性を付与してもよい。
【0030】
ここでは、利用者が、検索したい情報の検索要求として、例えば「ゲートウェイ・サーバー」という検索語と、「比較」という利用目的を提示した場合の、情報検索・分類部A12による検索動作を説明する。
【0031】
情報検索・分類部A12は、利用者が提示した検索要求を受け付けると、その受け付けた検索要求の内容を分析する。この分析では、情報検索・分類部A12は、体言である「ゲートウェイ・サーバー」を検索したい内容と判断し、用言である「比較」を検索したい情報の利用目的であると判断する。次に、情報検索・分類部A12は、利用目的属性付き情報記憶部A21に格納されている利用目的属性付き情報から、検索語「ゲートウェイ」を含む情報(ファイル)で、利用目的属性が「比較」である情報を、検索すべき対象として判断する。図5(a)に示した例では、「情報A」は、各社のゲートウェイ・サーバーのラインナップや価格比較に関する情報が格納されたファイルであり、その利用目的の欄には、「比較」という用言表現が利用目的として付与されているので、情報検索・分類部A12は、この「情報A」が検索すべき対象であると判断する。図5(b)には、「情報A」が検索すべき対象としてヒットした状態が示されている。最後に、情報検索・分類部A12は、検索結果として、検索すべき対象であると判断した情報Aの内容を出力する。
【0032】
上記の情報の検索に加えて、情報検索・分類部A12は、利用目的属性付き情報を分類する処理も行う。具体的には、情報検索・分類部A12は、利用目的属性付き情報記憶部A21内に格納されている利用目的属性付き情報について、その内容が類似し、かつ、利用目的属性が類似している情報をまとめて分類する。図5(c)に、分類状態の一例を示す。
【0033】
図5(c)に示す例では、「情報A」、「情報B」および「情報C」の各情報の内容には、「ゲートウェイ・サーバー」という単語が共通に存在するので、情報検索・分類部A12は、これら「情報A」、「情報B」および「情報C」は情報の内容が類似すると判断する。また、情報検索・分類部A12は、「情報B」の利用目的属性である「購入」および「情報C」の利用目的属性である「賃借」は類似性が高いと判断し、「情報A」の利用目的属性である「比較」は「情報B」および「情報C」の各利用目的属性との類似性が低いと判断する。これら情報の内容および利用目的属性の類似性の判断結果に基づいて、情報検索・分類部A12は、利用目的属性付き情報記憶部A21内に格納されている利用目的属性付き情報を、「情報A」よりなる類似情報D1と「情報B」および「情報C」からなる類似情報D2とに分類する。
【0034】
利用目的属性の類似性の判定方法は、特に限定されるものではない。例えば、各利用目的属性の定義情報が格納された辞書データベースを予め用意しておき、この辞書データベースを用いて、各利用目的属性の定義情報を調べ、定義情報中に同じ単語が出現する場合に、類似すると判定してもよい。また、利用目的属性に関する類似用語情報を予め用意し、その類似用語情報を用いて利用目的属性の類似性を判定してもよい。
【0035】
以上の検索・分類の処理において、利用者は、検索・分類要求として、例えば、検索したい情報の内容と、その情報の利用目的のどちらか一方または両方を明示的に提示してもよい。例えば、利用者は、検索したい情報の内容である「ゲートウェイ・サーバー」とその利用目的である「比較」を検索要求として提示してもよい。また、利用者は、検索要求として、「各社」、「ゲートウェイ・サーバー」、「比較」といった複数の語を提示してもよい。いずれの場合も、情報検索・分類部A12は、利用者が提示した検索語が体言か用言かを調べ、体言であれば検索したい情報の内容と判断し、用言であれば利用目的であると判断する。例えば、「各社」や「ゲートウェィ・サーバー」は体言であるので、これらの検索語は、検索したい情報の内容であると判断される。「比較」は用言であるので、この検索語は、検索したい情報の利用目的であると判断される。
【0036】
また、利用者は、検索要求として、「各社のゲートウェイ・サーバーを比較したい」といった自由文を入力してもよい。この場合は、情報検索・分類部A12は、入力文について一般的な自然言語処理の一方法である形態素解析処理を行う。形態素解析処理は、文を形態素という文字列単位に分割し品詞情報を付与する処理である。情報検索・分類部A12は、形態素解析により、入力文を意味のある単語のかたまりに区分する。具体的には、「各社/の/ゲートウェイ・サーバー/を/比較し/たい/」といった区分が行われる。そして、情報検索・分類部A12は、区分した各単語について、品詞情報に基づいて体言と用言の判別を行い、体言であれば、検索したい情報の内容であると判定し、用言であれば、検索した情報の利用目的であると判定する。この例の場合も、体言である「各社」や「ゲートウェイ・サーバー」は、検索したい情報の内容と判断され、用言である「比較」は、検索したい情報の利用目的であると判断される。
【0037】
(第2の実施形態)
図6は、本発明の第2の実施形態である情報検索・分類方法の原理を説明するための図である。この情報検索・分類方法は、図6に示すように、入出力情報管理処理20、利用目的推定処理21、利用目的管理処理22、情報検索・分類処理23および入出力情報管理処理24の5つの処理を含む。
【0038】
入出力情報管理処理20は、利用者が入出力した情報の参照関係を推定するための処理である。ここで、入力情報は、例えば、外部情報源(例えば、サーバなどの外部情報処理装置)からコピーや閲覧などをすることにより取得した情報である。出力情報は、例えば、利用者が作成・編集した新たな情報であって、外部装置へ出力した情報である。出力情報は、入力情報の少なくとも一部の情報を含んでいてもよく、その場合は、出力情報に入力情報に関する注釈文を付与してもよい。
【0039】
入出力情報管理処理20では、利用者が取り扱った情報の内容について、入力情報(参照情報)であるか否か、出力情報であるか否か、入出力情報の間に参照関係がある否か、といった判定が行われる。参照関係の判定では、入力情報と出力情報の間において、同じ単語の出現の程度や時間情報(入出力の時刻情報)を用いて参照関係を判定する。入出力情報管理処理20により、入力情報、出力情報、これら入出力情報に対する入出力の判別情報、および入出力情報間の参照関係を示す情報が記憶部に格納される。
【0040】
利用目的推定処理21は、語彙情報を格納した語彙辞書データベースおよびどのような語彙がどのような利用目的にあたるかの概念情報を格納した概念辞書である利用目的辞書データベースを用いて、情報の内容を解析して利用目的を推定する処理である。この利用目的推定処理21は、2つの推定処理を含む。第1の利用目的推定処理は、出力情報中に記述された入力情報の参照文の内容と、該出力情報に付与された注釈文(入力情報の参照文に関する説明文)の内容とから、入力情報の利用目的を推定する処理である。この第1の利用目的推定処理により、入力情報に関する利用目的(目的、目標、意図、使用例)を推定することができる。第2の利用目的推定処理は、出力情報の内容から利用目的を推定する処理である。この第2の利用目的推定処理により、出力情報に関する利用目的(目的、目標、意図、使用例)を推定することができる。この第2の利用目的推定処理よれば、入力情報を参照した出力情報の利用目的を入力情報の利用目的とみなして利用することが可能である。このように、利用目的推定処理21では、入出力情報の利用目的属性が解析結果として得られる。利用目的は、利用時の行動をもとに推定してもよい。利用時の行動とは、第1の利用目的推定処理の場合は、出力情報に付与された入力情報の参照文および注釈文にあらわれる用言表現であり、第2の利用目的推定処理の場合は、出力情報に含まれる用言表現である。
【0041】
利用目的管理処理22は、入出力情報管理処理20で管理されている、入力情報、出力情報、これら入出力情報に対する入出力の判別情報、および入出力情報間の参照関係を示す情報と、利用目的推定処理21で得られた情報の利用目的属性とを対応付けて保存する処理である。この利用目的管理処理22によって、入出力情報に利用目的属性を付与した利用目的属性付き情報のデータベース化が行われる。
【0042】
情報検索・分類処理23は、利用目的管理処理22によりデータベース化された利用目的属性付き情報を、該情報の内容と該情報の使われ方である利用目的属性とに基づいて検索・分類し、検索・分類された利用目的属性付き情報を出力する処理である。
【0043】
入出力情報管理処理24は、利用者が情報検索・分類処理23によって検索および分類された情報を参照した場合は、その参照情報を入力情報として管理し、また、利用者が情報検索・分類処理23によって検索および分類された情報を用いて作成・編集した場合は、その情報を出力情報として管理する処理である。
【0044】
本実施形態の情報検索・分類方法では、入出力情報管理処理20、利用目的推定処理21、利用目的管理処理22、情報検索・分類処理23、入出力情報管理処理24の各処理が一連の処理として順次実行される。この一連の処理の繰り返しにより、利用目的属性つき情報記憶部の内容を拡充しつつ、情報の検索や分類といった処理が同時に行われる。なお、入出力情報管理処理20と利用目的推定処理21は、その順序が逆であっても、また同時に行われてもよい。
【0045】
以下、本実施形態の情報検索・分類方法を適用した情報検索・分類装置について説明する。
【0046】
図7は、本発明の第2の実施形態である情報検索・分類方法を適用した情報検索・分類装置の主要な構成を示すブロック図である。図7に示すように、本実施形態の情報検索・分類装置は、データ処理部B1および記憶部B2からなる。データ処理部B1と記憶部B2は、同じ装置上にあってもよいし、別々の装置上にあってもよい。また、記憶部B2は、複数の利用者間で共有しても良い。
【0047】
記憶部B2は、語彙情報を格納した語彙辞書データベースB21、どのような語彙がどのような利用目的にあたるかの概念情報を格納した概念辞書である利用目的辞書データベースB22および利用目的属性付き情報が格納される利用目的属性付き情報記憶部B23を有する。語彙辞書データベースB21には、例えば、自然言語処理技術に一般に用いられるような語彙情報が格納されている。目的・行動辞書データベースB22には、利用目的をあらわす利用目的表現や利用行動をあらわす行動表現といった二種類の情報が格納されている。利用目的表現は、例えば「〜に向け」、「〜用に」、「〜に使ってください」、「ご参考までに〜にお役立てください」といった利用目的、目標、ゴール、意図を示した表層表現の集合で、具体的な利用目的、目標、ゴール、意図である「〜」の個所を指し示す表現である。行動表現は、「〜をしました」、「〜の申請をお願いします」、「発注」等の情報にあらわれる利用の行動を表した用言表現である。利用目的属性は、利用目的表現に付随する「〜」の部分にあらわれる情報である。
【0048】
データ処理部B1は、入出力情報管理部B11、利用目的推定部B12および情報検索・分類部B13を有する。
【0049】
入出力情報管理部B11は、利用者が入出力した情報(文書、図、音楽、音声などの情報であって、情報の二次利用者が作成した情報を含む)の内容を管理するとともに、入出力情報間に一部の内容を参照したなどの参照関係があるか否かを判定する。
【0050】
利用目的推定部B12は、入出力情報管理部B11から情報(入出力情報および参照関係判定結果)を受け取り、該受け取った入出力情報の内容を語彙辞書データベースB21および利用目的辞書データベースB22を参照して解析して利用目的を推定する。この利用目的の推定では、出力情報中に記述された入力情報の参照文の内容と、該出力情報に付与された注釈文(入力情報の参照文に関する説明文)の内容とから、入力情報の利用目的を推定する第1の利用目的推定処理と、入力情報を参照した出力情報の内容から入出力情報の利用目的を推定する第2の利用目的推定処理とがそれぞれ実行される。利用目的推定部B12は、第1および第2の利用目的推定処理で推定された利用目的を利用目的属性として入出力情報と対応付け、これを利用目的属性付き情報として利用目的属性付き情報記憶部B23に格納する。具体的には、第1の利用目的推定処理の場合は、該処理により取得した入力情報の利用目的を対応する入力情報と対応付けて格納する。また、第2の利用目的推定処理の場合は、該処理により取得した出力情報の利用目的を、入力情報の利用目的と見なして、対応する入出力情報と対応付けて格納する。
【0051】
情報検索・分類部B13は、利用目的属性付き情報記憶部B23に格納された利用目的属性付き情報を、情報の内容と利用目的属性の双方もしくはどちらか一方を用いて検索・分類する。
【0052】
次に、本実施形態の情報検索・分類装置の動作について具体的に説明する。本実施形態の情報検索・分類装置では、入出力情報管理部B11および利用目的推定部B12によって、利用目的属性付き情報が記憶部B2の利用目的属性付き情報B23に格納され(データベース化)、入出力情報管理部B11および情報検索・分類部B13によって、利用目的属性付き情報B23に格納された利用目的属性付き情報の検索・分類が行われる。
【0053】
図8に、利用目的属性付き情報の格納処理の一手順を示す。まず、ステップS31で、入出力情報管理部B11が、利用者が外部端末を通じて記憶部B2に対して情報の入出力を行ったか否かを判定する。記憶部B2への情報の入出力が行われる間、入出力情報管理部B11は、随時、各情報に対して、入力であるか、出力であるかの判定が可能な入出力情報IDを付与する。
【0054】
次に、ステップS32で、入出力情報管理部B11が、入出力情報間の参照関係を判定する。この参照関係の判定では、例えば、入出力情報に含まれている語などの情報の重なり程度や時間情報(入出力の時刻情報)を用いて参照関係を判定する。例えば、入出力の時刻の差(時間差)が所定の差である場合で、入出力情報の間に類似した内容の情報が紫存在する場合に、その入出力情報の間には参照関係があると判定する。
【0055】
次に、ステップS33で、利用目的推定部B12が、語彙辞書データベースB21および利用目的辞書データベースB22を用いて入出力情報の内容を解析し利用目的を推定する。この利用目的推定部B12による利用目的の推定では、上述の第1および第2の利用目的推定処理が行われる。具体的には、第1の利用目的推定処理では、出力情報に含まれる入力情報の参照文(または注釈文)の内容を解析して、入力情報の利用目的を推定する。例えば「『入力情報』を見たので、〜した」、「『入力情報』は〜に使うとよい」といった参照文について「〜」の部分を解析して入力情報の利用目的を推定する。この場合、推定した入力情報の利用目的は、参照文自体の利用目的や出力情報の利用目的と異なっていてもよい。第2の利用目的推定処理では、特に文書の重要個所、例えばタイトルやそれに続くリード文(文書の冒頭の説明文であり、その文書が何について書かれているかの概要を説明することが多い)に現われる表現を解析することで利用目的を推定することが望ましい。また、利用目的を推定する場合、「〜」の部分を意味・係り受け解析し、概念を抽出してそれを利用目的として利用してもよい。また、「〜」の部分の簡易解析を行い、内容語のみを取り出してそれを利用目的として用いても良い。また、「〜」の中に含まれる利用目的表現内の用言表現のみを抽出してそれを利用目的として用いてもよい。また、行動表現の用言表現を行動情報として推定し、これを利用目的として用いてもよい。
【0056】
次に、ステップS34で、利用目的推定部B12が、上述のステップS31およびステップS32で得られた、入出力情報の内容および入出力情報間の参照関係と、上述のステップS33で推定された利用目的とを対応付けることで利用目的属性付き情報を作成する。
【0057】
最後に、ステップS35で、利用目的推定部B12が、上記のステップS34で作成された利用目的属性付き情報を利用目的属性つき情報記憶部B23に格納する。
【0058】
以上の処理を繰り返すことにより、利用目的属性つき情報のデータベースが作成される。なお、ステップS31およびステップS32の処理(情報の入出力の判別および入出力情報間の参照関係の判定)と、ステップS33の処理(情報の利用目的属性の判定)は、その順序が逆であっても、また同時に行われてもよい。
【0059】
図9に、利用目的属性付き情報B23に格納された利用目的属性付き情報を検索・分類する処理の一手順を示す。まず、ステップS41で、情報検索・分類部B13が、利用者から検索・分類要求を受け付ける。次に、ステップS42で、情報検索・分類部B13が、検索・分類要求の内容を分析する。次に、ステップS43で、情報検索・分類部B13が、その分析した検索・分類要求の内容に基づいて、利用目的属性つき情報記憶部B23に格納された利用目的属性付き情報を検索・分類する。最後に、ステップS44で、情報検索・分類部B13が、検索・分類した結果を出力する。
【0060】
以上の検索・分類処理によれば、利用者からの検索・分類要求から取得した利用目的に基づいて、出力情報だけでなく、その出力情報内で参照している入力情報についても検索・分類することができる。
【0061】
[第2の実施形態の第1の実施例]
以下、第2の実施形態の情報検索・分類方法の第1の実施例について説明する。ここでは、第一の利用者が作成した情報A、具体的には、各社のゲートウェイ・サーバーの価格比較をまとめた情報A(文書、図、音楽、音声などの情報を含むものであってもよい。)を、第二の利用者がダウンロードし、その情報Aの一部の内容を引用して情報Bを作成して外部端末(第三の利用者)に送信する場合の動作を説明する。情報Bは、情報Aの一部の内容を参照して作成した文書に、「平成17年度のゲートウェイ・サーバーの購入に参考になるかと思います。宜しくお願い致します。」といった注釈文を加えたメールである。第一の利用者と第二の利用者は、同一人物であってもよい。注釈文は、文書、図、音楽、音声などの情報であってもよい。
【0062】
まず、入出力情報管理部B11が、利用者が入出力した情報を随時、記憶部B2に保存するとともに、保存した各情報に、入力および出力のいずれであるかを示す入出力情報IDを付与する。ここでは、入力情報IDを「i」、出力情報IDを「o」とする。第二の利用者がダウンロードした情報Aを入力情報とし、第二の利用者がメールとして第三者に送信した文書(情報B)を出力情報として扱い、入力情報に「i」を、出力情報に「o」をそれぞれ付与して記憶部B2に保存する。また、入出力情報管理部B11は、入力情報(情報A)と出力情報(情報B)の間に、一部の内容を参照したなどの参照関係があるか否かを判定し、参照関係がある場合は、その判定結果に基づき、記憶部B2に保存した入力情報(情報A)および出力情報(情報B)の対応付けを行う。このときの記憶部B2に格納される入出力情報を図10(a)に示す。
【0063】
図10(a)を参照すると、入出力情報は、ファイル名の欄、参照先の欄、入出力情報IDの欄を含む。ファイル名の欄には、「情報A」、「情報B」といったファイル名が格納されている。「情報A」は、第二の利用者がダウンロードした情報Aである。「情報B」は、第二の利用者がメールとして第三者に送信した文書(情報B)である。「情報B」の参照先の欄には、「情報A」のファイル名が格納されている。「情報A」の入出力情報IDの欄には、入力情報であることを示すID「i」が格納されており、「情報B」の入出力情報IDの欄には、出力情報であることを示すID「o」が格納されている。
【0064】
次に、利用目的推定部B12が、情報Bの内容を解析してその表現から情報の利用目的を推定する。情報Bには、情報Aの内容と「平成17年度のゲートウェイ・サーバーの購入に参考になるかと思います。宜しくお願い致します。」といった注釈が書かれている。利用目的推定部B12は、記憶部B2内の語彙辞書データベースB21および利用目的辞書データベースB22を用いて、情報Bの文書の解析を行って利用目的を推定する。語彙辞書データベースB21には、自然言語処理技術に一般に用いられるような語彙情報が格納されている。利用目的辞書データベースB22には、利用の目的や行動の情報をあらわす利用目的表現と行動表現といった二種類の情報が格納されている。利用目的表現とは、例えば「〜に向け」、「〜用に」、「〜に使ってください」、「ご参考までに〜にお役立てください」といった利用目的、目標、ゴール、意図を示した表層表現の集合で、具体的な利用目的、目標、ゴール、意図である「〜」の個所を指し示す表現である。また、行動表現とは「〜をしました」、「〜の申請をお願いします」、「発注」等の情報にあらわれる利用の行動を表した用言表現である。
【0065】
上記の文書解析では、まず、語彙辞書データベースB21を用いて、一般的な自然言語処理技術である形態素解析処理を行う。この形態素解析処理により、例えば、「平成17年度/の/ゲートウェイ・サーバー/の/購入/に/参考になる/か/と/思い/ます/。宜しく/お願い致します/。」といった形態素解析結果が得られる。次に、利用目的辞書データベースB22を用いて、形態素解析により区分された形態素を解析する。この解析では、「/に/参考になる/」といった表層表現が利用目的表現であると判定され、その利用目的を詳しく説明する個所である「平成17年度のゲートウェイ・サーバーの購入」の部分を利用目的属性として利用する。利用目的属性の利用方法は任意でよい。例えば、「/平成17年度/の/ゲートウェイ・サーバー/の/購入」について意味・係り受け解析を行い、「期間:((平成17年度)に)」、「対象:((ゲートウェイ・サーバー)を)」、「行動:(購入する)」といった利用目的の概念を導出してもよい。また、別の例としては、「平成17年度のゲートウェイ・サーバーの購入」に簡易解析を行い、内容語である「平成17年度」、「ゲートウェイ・サーバー」、「購入」を抽出し、それら内容語を利用目的として利用しても良い。さらに、別の例としては、「/平成17年度/の/ゲートウェイ・サーバー/の/購入」の中から用言表現である「購入」を抽出し、それを利用目的属性として利用しても良い。ここでは、「購入」を抽出する例を用いる。
【0066】
上述のようにして、利用目的属性推定部B12は、情報B内で引用された情報Aに関する「平成17年度のゲートウェイ・サーバーの購入に参考になるかと思います。宜しくお願い致します。」といった注釈文を解析することで、情報Aの利用目的属性(ここでは「購入」)を取得する。そして、利用目的属性推定部B12は、情報Aを参照した情報Bにその取得した利用目的属性を付与した利用目的属性付き情報を利用目的属性付き情報記憶部B23に格納する。なお、参照情報を用いて、元の情報Aそのものに利用目的属性を付与してもよい。このようにして、情報Aを引用した情報Bに情報Aに関する利用目的属性「購入」を付与した利用目的属性付き情報、または、参照先である情報Aにその情報Aに関する利用目的属性「購入」を付与した利用目的属性付き情報に関するデータベースが作成される。
【0067】
データベースが作成された後、「ゲートウェィ・サーバーを購入したいので参考となる情報」を希望する利用者(第二の利用者または別の利用者)が、情報検索・分類要求を提示すると、情報検索・分類部B13が、その要求内容を解析して、利用目的属性付き情報記憶部B23に格納されている利用目的属性付き情報の検索・分類を行う。この利用目的属性付き情報の検索・分類は、前述の第2の実施形態の動作で説明したとおりである。
【0068】
[第2の実施形態の第2の実施例]
以下、第2の実施形態の情報検索・分類方法の第2の実施例について説明する。ここでは、第一の利用者が作成した情報A、具体的には、各社のゲートウェイ・サーバーの価格比較をまとめた情報A(文書、図、音楽、音声などの情報を含むものであってもよい。)を第二の利用者が参照して情報Bを作成して外部端末(第三の利用者)に送信する場合の動作を説明する。情報Bは、情報Aの説明文として「平成17年度のゲートウェイ・サーバーの購入に参考になるかと思います。宜しくお願い致します。」といった注釈文を加えたメールである。第一の利用者と第二の利用者は、同一人物であってもよい。注釈文は、文書、図、音楽、音声などの情報であってもよい。
【0069】
まず、入出力情報管理部B11が、上述した第1の実施例の場合と同様にして、利用者が入出力した情報(情報Aおよび情報B)を随時、記憶部B2に保存するとともに、保存した各情報に、入力および出力のいずれであるかを示す入出力情報IDを付与する。また、入出力情報管理部B11は、入力情報(情報A)と出力情報(情報B)の間に、一部の内容を参照したなどの参照関係があるか否かを判定し、参照関係がある場合は、その判定結果に基づき、記憶部B2に保存した入力情報(情報A)および出力情報(情報B)の対応付けを行う。
【0070】
次に、利用目的推定部B12が、情報Bの内容を解析してその表現から情報の利用目的を推定する。情報Bには、情報Aに関する説明文として「平成17年度のゲートウェイ・サーバーの購入に参考になるかと思います。宜しくお願い致します。」といった注釈が書かれている。利用目的推定部B12は、記憶部B2内の語彙辞書データベースB21および利用目的辞書データベースB22を用いて、情報Bの文書の解析を行って利用目的を推定する。この文書解析は、上述した第1の実施例の場合と同様である。こうして、利用目的属性推定部B12は、情報B内の情報Aに関する注釈文を解析することで、情報Aの利用目的属性(ここでは「購入」)を取得する。そして、利用目的属性推定部B12は、情報Bに、その取得した利用目的属性を付与した利用目的属性付き情報を利用目的属性付き情報記憶部B23に格納する。このときの利用目的属性付き情報記憶部B23に格納された利用目的属性付き情報の内容を図10(b)に示す。
【0071】
図10(b)を参照すると、利用目的属性付き情報は、ファイル名の欄、利用目的の欄を含む。ファイル名の欄には、「情報A」、「情報B」といったファイル名が格納されている。「情報A」は、第一の利用者が作成した情報Aである。「情報B」は、第二の利用者が情報Aを参照して作成した情報Bである。「情報B」の利用目的の欄には「購入」が格納されている。
【0072】
次に、利用目的属性推定部B12は、情報Aを入力情報、情報Bを出力情報として扱い、これら入出力情報間の参照関係を調べるとともに、参照関係がある場合に、情報Bの利用目的属性を情報Aに対応付ける。このときの利用目的属性付き情報記憶部B23に格納された利用目的属性付き情報の内容を図10(c)に示す。
【0073】
図10(c)を参照すると、利用目的属性付き情報は、図10(b)に示した内容に、参照先の欄、入出力情報IDの欄を加えたものになっている。「情報A」の入出力情報IDの欄には、「i」が格納されている。「情報B」の参照先の欄および入出力情報IDの欄には、「情報A」および「i」が格納されている。こうして、入力情報である情報Aと出力情報である情報Bがリンクされ、これら入出力情報に利用目的属性である「購入」を付与した利用目的属性つき情報のデータベースが作成される。
【0074】
以上のようにして利用目的属性つき情報が作成された後、「ゲートウェィ・サーバーを購入したいので参考となる情報」を希望する利用者が、「ゲートウェィ・サーバーを購入したいので参考となる情報」といった自由文からなる検索要求を提示する。情報検索・分類部B13は、提示された検索要求から、検索すべき情報の内容を示す「ゲートウェイ・サーバー」という単語と検索すべき情報の利用目的を示す「購入」という利用目的属性をそれぞれ取得する。そして、情報検索・分類部B13は、その取得した単語および利用目的属性の少なくとも一方を用いて利用目的属性付き情報記憶部B23を検索する。図10(c)に示した例では、「情報A」は、各社のゲートウェイ・サーバーのラインナップや価格比較に関する情報が格納されたファイルであり、「情報A」を参照する「情報B」の利用目的の欄には「購入」という属性が格納されているので、情報検索・分類部B13は、「購入」という属性に基づいて「情報B」を検索対象として判断するとともに、その判断した「情報B」の参照先である「情報A」も検索対象として判断する。図10(d)には、「情報B」の利用目的の欄の「購入」がヒットした状態が示されている。
【0075】
以上の処理によれば、ゲートウェィ・サーバーを購入する上で参考になる情報Aは、その情報内に購入といった表現が含まれていなくても、情報Aを参照した他の情報B内の説明から、情報Aが購入を目的として利用されていることが特定される。
【0076】
なお、上述の処理では、利用者が、自由文よりなる検索要求を提示した例を挙げたが、これに代えて、検索したい情報の内容や主題をあらわす「ゲートウェイ・サーバー」とその情報を得たい理由を示す利用目的「購入」を別々に入力してもよい。
【0077】
次に、上述の検索処理によって検索された情報Aを参照してさらに情報Cを作成した場合の動作を説明する。ここでは、利用者が、各社のゲートウェイ・サーバーの価格比較をまとめた情報Aの内容をみて、価格が高すぎると判断し、あるゲートウェイ・サーバーを選択し、その本体価格の2%を月々支払う賃借契約書を作成したとする。賃借契約書には、「xx社のゲートウェイ・サーバーを本体価格2,000,000円の2%で御社より賃借いたします。」といった記述があるものとする。
【0078】
まず、入出力情報管理部B11が、参照した情報Aを入力情報、作成した賃借契約書を出力情報(情報C)としてそれぞれ扱い、入力情報に「i」、出力情報に「o」をそれぞれ付与する(図10(e)参照)。次に、入出力情報管理部B11は、入力情報Aと出力情報Cの間に一部の内容を参照したなどの参照関係があるか否かを判定する。ここでは、出力情報Cは、入力情報Aを参照した内容を含むので、入出力情報管理部B11は、入力情報Aと出力情報Cの間に参照関係があると判断し、情報Cの参照先の欄に「情報A」というファイル名を格納する(図10(f)参照)。
【0079】
次に、利用目的推定部B12が、出力情報C内の表現から参照した入力情報の利用目的を推定する。この利用目的の推定は、具体的には、次のようにして行う。まず、語彙辞書データベースB21を用いて、出力情報Cの内容を形態素解析処理する。形態素解析では、「xx社/の/ゲートウェイ・サーバー/を/本体/価格/2,000,000円/の/2%/で/御社/より/賃借/いたし/ます/。」といった単語に区分される。次に、目的・行動辞書データベースB22を用いて各単語を解析する。この解析では、「賃借/いたし/ます」といった表層表現が利用行動表現であると判定される。また、その利用行動である「xx社/の/ゲートウェイ・サーバー/を/本体/価格/2,000,000円/の/2%/で/御社/より/賃借/いたし/ます/」の部分が利用目的属性として利用される。利用目的属性の利用では、例えば、「xx社/の/ゲートウェイ・サーバー/を/本体/価格/2,000,000円/の/2%/で/御社/より/賃借/いたし/ます/」に意味・係り受け解析を行い、「対象:((xx社のゲートウェイ・サーバー)を)」、「手段:((本体価格 2,000,000円の2%)で)」、「源泉:((御社)より)」、「行動:(賃借する)」といった利用目的といった概念を導出する。また、別の利用例では、「xx社/の/ゲートウェイ・サーバー/を/本体/価格/2,000,000円/の/2%/で/御社/より/賃借/いたし/ます/」に簡易解析を行い、内容語である「xx社」、「ゲートウェイ・サーバー」、「本体」、「価格」、「2,000,000円」、「2%」、「賃借」を抽出し、それら内容語を利用しても良い。さらに、別の利用例では、「xx社/の/ゲートウェイ・サーバー/を/本体/価格/2,000,000円/の/2%/で/御社/より/賃借/いたし/ます/」の中から、用言表現である「賃借」を抽出し、それを利用目的属性として利用しても良い。ここでは、用言表現である「賃借」を抽出する例が採用されるものとする。
【0080】
次に、利用目的推定部B12は、上述の処理で推定した利用目的属性(ここでは「賃借」)を情報Cの利用目的の欄に格納する(図10(g)参照)。次に、利用目的推定部B12は、各情報A、Cの内容とその参照関係、情報の利用目的属性の対応付けを行う(図10(h)参照)。こうして、情報Aを参照して作成した情報Cの内容とその利用目的属性である「賃借」が追加された利用目的属性付き情報データベースが作成される。このデータベースでは、各社のゲートウェイ・サーバーの価格比較をまとめた情報Aに関する利用目的属性として、情報Cの利用目的の欄に「購入」という属性が格納されるとともに、情報Cの利用目的の欄に「賃借」という属性が格納されている。
【0081】
上述の処理によれば、利用目的属性付き情報のデータベース化を図りながら、情報の検索・分類を行うことができる。また、同じ利用目的で使用した情報を収集したり、同じ情報に様々な利用目的を設定したりすることができる。また、参照先および利用目的の各欄に格納された情報から、どの情報が、どのような目的で、どれだけ回数利用されたかを判断することもできることから、この判断結果に基づいて、検索結果である情報の内容に優先順位を付与してもよい。また、同様に、様々な利用目的で利用できる情報は、汎用性の高い情報である可能性が高いと判断し、この判断結果に基づいて、検索結果である情報の内容に優先順位を付与してもよい。
【0082】
以上説明した各実施形態の情報検索・分類装置によれば、以下のような効果を奏する。
【0083】
第1の効果は、所望の情報Aを簡便に検索・分類できることである。その理由は、情報Aを、その情報Aの内容だけで検索・分類するのではなく、その情報Aの使い道などの利用目的で検索・分類できるようにしたためである。情報の検索・分類などの情報提供には、その情報の内容そのものだけでなく、データの属性情報や注釈情報を用いることが有効である。特に、第2の実施形態においては、二次利用者の便宜のために、ある情報をある利用者が利用した際の利用目的を、利用者の残した情報の内容および利用者の情報の入出力記録を用いて自動推定し、情報の新しい価値ある属性として管理するようになっており、これにより、簡便な情報の提供および情報の再利用の処理を実行することが可能である。例えば、これまでの検索技術では、何に関する文書かの検索は可能だったが、本発明では、情報の使い道、利用目的属性がついているために、その文書をどのように利用したいかといった利用者の使用目的を加味した情報検索が可能である。例えば、「ゲートウェイ・サーバー」に関する文書であって、かつ、他の利用者が「購入する」際に利用した文書を検索することが可能で、「購入」の文字がその文書内にあらわれていなくても、例えば、ゲートウェイ・サーバーの各社のラインナップや価格情報、使用感レポートなど、購入目的に有用な情報を入手することができる。
【0084】
第2の効果は、利用者に対する情報の記入などの負担を強いることなく、情報Aを検索するために有用な情報を入手できることである。その理由は、二次利用者が新たに情報を作成する必要がないからである。二次利用者による情報Aの利用の結果から、情報Aを検索するために有用な情報を自動的に入手するようになっている。
【0085】
第3の効果は、情報Aを検索・分類するために有用な情報が、情報Aを利用するたびに増えることである。その理由は、情報Aを検索・分類するために有用な情報を、情報Aを利用した過去の情報から抽出することができるためである。二次利用者が情報を利用する場合に、その元となる情報を編集したり、元の情報から新たな情報を作成したりするといった、情報利用の繰り返しを行う度に、有用な情報が自動的に蓄積される。
【0086】
第4の効果は、情報Aの利用者の操作を逐一記録し、その記録された操作情報群から利用者の意図・行動を推定するなどの膨大な処理を行うことなく、情報Aを検索するために有用な、同等の情報を入手できることである。その理由は、入手した情報や出力した情報を解析することで、情報利用の目的を推定する機構を設けたためである。
【0087】
以上説明した第1および第2の実施形態である情報検索・分類方法を適用した情報検索・分類装置は、いずれもプログラムに従って動作するコンピュータシステムにより構成することができる。
【0088】
図11に、第1の実施形態である情報検索・分類方法を適用した情報検索・分類装置を実現するコンピュータシステムの概略構成を示す。このコンピュータシステムは、図2に示したデータ処理装置A1を、中央演算処理装置(CPU)C10とメモリC11からなるコンピュータC1で構成したものである。コンピュータC1は、情報検索・分類用プログラムC2に従って動作するものである。
【0089】
情報検索・分類用プログラムC2は、前述の第1の実施形態で説明した情報検索・分類に関する各処理を実行するためのプログラムである。この情報検索・分類用プログラムC2は、CD−ROMやDVDなどの記録媒体によって提供されてもよく、また、メモリC11内に予め格納されていてもよい。
【0090】
コンピュータC1では、中央演算処理装置C10が情報検索・分類用プログラムC2に従って情報検索・分類に関する各処理を実行することで、前述の第1の実施形態で説明した情報検索・分類の動作が実現される。なお、図11に示した例では、記憶装置A2とコンピュータC1は、別々の装置とされているが、記憶装置A2をコンピュータC1内に設けることもできる。
【0091】
図12に、第2の実施形態である情報検索・分類方法を適用した情報検索・分類装置を実現するコンピュータシステムの概略構成を示す。このコンピュータシステムは、図7に示したデータ処理装置B1を、中央演算処理装置(CPU)D10とメモリD11からなるコンピュータD1で構成したものである。コンピュータD1は、情報検索・分類用プログラムD2に従って動作するものである。
【0092】
情報検索・分類用プログラムD2は、前述の第2の実施形態で説明した情報検索・分類に関する各処理を実行するためのプログラムである。この情報検索・分類用プログラムD2は、CD−ROMやDVDなどの記録媒体によって提供されてもよく、また、メモリD11内に予め格納されていてもよい。
【0093】
コンピュータD1では、中央演算処理装置D10が情報検索・分類用プログラムD2に従って情報検索・分類に関する各処理を実行することで、前述の第2の実施形態で説明した情報検索・分類の動作が実現される。なお、図12に示した例では、記憶装置B2とコンピュータD1は、別々の装置とされているが、記憶装置B2をコンピュータD1内に設けることもできる。
【0094】
以上説明した各実施形態において、入出力情報の参照先特定と利用目的推定は、その順序が逆であっても、また同時に行われてもよい。
【0095】
また、利用目的推定をするための情報は、同じ言語で表現されている必要はない。例えば、多言語対応の語彙辞書を用いれば、利用目的推定をするための情報として日本語や英語など異なる言語の情報を用いることができる。
【0096】
また、各実施形態の情報検索・分類装置は、知識共有・情報配信・暗黙知(Know-how)検索支援、業務支援を目的とする情報システムにも適用することができる。
【0097】
[ネットワークシステム]
図13は、本発明の情報検索・分類装置を含むネットワークシステム全体の構成を示すブロック図である。図13を参照すると、このネットワークシステムは、複数のユーザ端末1−1〜1−nと、これらユーザ端末がネットワーク3を介して接続される情報検索・分類装置2とからなる。情報検索・分類装置2は、前述した第1および第2の実施形態の情報検索・分類方法が適用された情報検索・分類装置である。複数のユーザ端末1−1〜1−nは、いずれも通信機能を備えたコンピュータシステム(例えば、モデムを備えたパーソナルコンピュータ)である。情報検索・分類装置2では、入出力処理部や入出力情報管理部において、各ユーザ端末1−1〜1−nを通じて行われる検索・分類要求の受け付け処理や入出力情報の管理処理を行う。また、検索・分類結果は、入出力処理部を通じて、検索・分類要求をした利用者の端末に返される。
【図面の簡単な説明】
【0098】
【図1】本発明の第1の実施形態である情報検索・分類方法の原理を説明するための図である。
【図2】本発明の第1の実施形態である情報検索・分類方法を適用した情報検索・分類装置の主要な構成を示すブロック図である。
【図3】図2に示す情報検索・分類装置において行われる利用目的属性付き情報の格納処理の一手順を示すフローチャート図である。
【図4】図2に示す情報検索・分類装置において行われる利用目的属性付き情報の検索・分類処理の一手順を示すフローチャート図である。
【図5】(a)から(c)は、図2に示す情報検索・分類装置の利用目的属性付き情報記憶部に格納される利用目的属性付き情報の状態を説明するための図である。
【図6】本発明の第2の実施形態である情報検索・分類方法の原理を説明するための図である。
【図7】本発明の第2の実施形態である情報検索・分類方法を適用した情報検索・分類装置の主要な構成を示すブロック図である。
【図8】図7に示す情報検索・分類装置において行われる利用目的属性付き情報の格納処理の一手順を示すフローチャート図である。
【図9】図7に示す情報検索・分類装置において行われる利用目的属性付き情報の検索・分類処理の一手順を示すフローチャート図である。
【図10】(a)から(h)は、図7に示す情報検索・分類装置の利用目的属性付き情報記憶部に格納される利用目的属性付き情報の状態を説明するための図である。
【図11】第1の実施形態である情報検索・分類方法を適用した情報検索・分類装置を実現するコンピュータシステムの概略構成を示すブロック図である。
【図12】第2の実施形態である情報検索・分類方法を適用した情報検索・分類装置を実現するコンピュータシステムの概略構成を示すブロック図である。
【図13】本発明の情報検索・分類装置を含むネットワークシステム全体の構成を示すブロック図である。
【符号の説明】
【0099】
A1 データ処理部
A2 記憶部
A10 入出力処理部
A11 利用目的推定部
A11 情報検索・分類部
A21 利用目的属性付き情報記憶部
【技術分野】
【0001】
本発明は、情報の検索や分類を行う装置及び方法に関する。
【背景技術】
【0002】
近年、大量の情報が供給される中で、所望の情報を簡単に検索や分類するといった要求が高まっている。また、情報を簡単に利用したいという利用者側の要求がある一方で、利用者が利用する情報、例えば文書、メール、画像、音声などの情報も電子化されるようになってきた。こうした現状から、情報の検索や分類を簡単に行うおとが可能なシステムとして、検索や分類の対象である情報の内容と、その情報の提供者(作者)、時間(作成時刻)、ファイル長などの属性とを用いて、必要な情報を検索・分類するシステムが提案されている。情報内容を細かい単位に分割して情報を分析するシステムもある。このようなシステムにおいては、情報の内容が言語的なものである場合は、一般的な自然言語処理手法である形態素解析処理を行って、各単語にインデックスを付与し、情報に含まれる各単語をキーにして情報の内容を検索・分類するようになっている。
【0003】
しかし、蓄積される情報は、雑多にまたは一方的な観点で分類されてデータベース化されることが多く、上記のシステムでは、このようなデータベース化された情報において所望の情報に簡単に辿り着けない場合がある。例えば、「ゲートウェイ・サーバーを購入したい」と思っている利用者が、「ゲートウェイ・サーバー」、「購入」といった検索語を入力して、その検索語に関連する文書や情報を検索する場合で、各社のゲートウェイ・サーバーのラインナップや価格表、使用レポートなど、ゲートウェイ・サーバーを購入する上で参考になる情報が、その情報内に「購入」といった語句を含まない場合は、それらの情報に辿り着くことは困難である。また、「ゲートウェイ・サーバー」といった検索語のみを入力した場合は、「ネットワーク上で媒体やプロトコルが異なるデータを相互に変換して各利用者のコンピュータであるクライアント間の通信を可能にするコンピュータ。」といったゲートウェイ・サーバーに関する一般的な説明など、ゲートウェイ・サーバーを購入する上ではあまり参考にならない多くの情報が検索結果に含まれることになる。
【0004】
そこで、検索対象である情報に第三者のコメントを付記してもらい、情報の内容だけでなく、付記したコメントの内容についても情報検索に利用する方法が提案されている(特許文献1参照)。この方法では、情報を利用した二次利用者が、その情報に関するコメントや評価を付記する。付記したコメントや評価は利用した情報と関連付けて登録されて、情報の検索・分類に利用される。
【0005】
また、目的情報を用いて画像データが記録される記憶領域の位置を管理する方法が提案されている(特許文献2参照)。この方法では、利用者が指定した利用目的毎に、画像データが登録される。
【特許文献1】特開2004-310676号公報(第1頁、図1)
【特許文献2】特開平11-98454号公報(第3頁〜第4頁)
【発明の開示】
【発明が解決しようとする課題】
【0006】
しかしながら、上述した従来の方法には、以下のような問題がある。
【0007】
特許文献1に記載の方法においては、第三者のコメントや評価を情報の検索・分類に利用することができるので、詳細な情報の検索・分類を行うことが可能となる。しかし、コメントや評価の付記は時間や労力を要することから、第三者(利用者)に対する負担が大きい。また、第三者(利用者)によるコメントや評価が付記されない場合もある。この場合には、詳細な情報の検索・分類を行うことができないため、所望の情報に簡単に辿り着けない、といった前述の問題を解決することはできない。
【0008】
特許文献2に記載の方法においては、利用目的を用いて情報を分類することにより、所望の情報に簡単に辿り着くことが可能となっている。しかし、利用目的は、情報を蓄積する際に利用者がその都度入力するようになっている。このため、利用目的を入力するための操作が煩わしい。加えて、すでにデータベース化されている大量の情報について、そのような利用目的の入力操作を行う場合は、作業が膨大となり、現実的ではない。
【0009】
本発明の目的は、上記の問題を解決し、所望の情報に簡単に辿り着くことのできる、利用者の負担の少ない情報提供装置を提供することにある。
【課題を解決するための手段】
【0010】
上記目的を達成するため、本発明は、内容から利用目的を推定可能な複数の情報が格納される記憶部と、前記複数の情報のそれぞれについて、該情報の内容を解析して利用目的を推定するとともに、該推定した利用目的を該情報と関連付けて前記記憶部に格納する利用目的推定部と、検索すべき情報の内容および利用目的をそれぞれ推定可能な検索要求が提示されると、該提示された検索要求に関連する内容および利用目的を持つ情報を前記記憶部から検索する検索部とを有する。
【0011】
上記の構成によれば、情報の内容だけでなく、利用目的を用いた情報の検索が可能とされている。利用者が所望する情報は、基本的には、その情報の利用目的と合致するので、利用目的に応じた検索により、利用者が所望する情報をより正確かつ詳細に検索することが可能である。従来は、単に「ゲートウェイ・サーバー」といった検索語を入力するだけであったので、利用者が所望する情報とは関係のない情報までも検索されてしまっていたが、本発明では、情報をどのように利用したいかといった利用者の使用目的を加味した検索が可能であるので、利用者の所望する情報を確実に提供することが可能である。
【0012】
また、利用目的推定部が情報の利用目的を自動的に推定して記憶部に格納するようになっているので、利用者が情報の利用目的を設定する必要はない。
【発明の効果】
【0013】
上述のとおり、本発明によれば、利用者が所望する情報を、その利用目的に応じて提供することができるので、従来に比べて、利用者は、簡単に目的の情報に辿り着くことができ、その結果、利便性も向上する。
【発明を実施するための最良の形態】
【0014】
次に、本発明の実施形態について図面を参照して説明する。
【0015】
(第1の実施形態)
図1は、本発明の第1の実施形態である情報検索・分類方法の原理を説明するための図である。本実施形態の情報検索・分類方法は、情報の内容および属性を関連付けて蓄積し、該蓄積した情報から検索・分類要求に基づいて該当する情報を検索・分類する情報検索・分類方法であって、図1に示すように、利用目的推定処理11、情報管理処理12、情報検索・分類処理13の3つの処理を含む。
【0016】
利用目的推定処理11は、既に蓄積された情報(既にデータベース化された情報)またはこれから蓄積される情報について、その情報の利用目的を推定する処理である。情報の利用目的は、その情報を利用する際の、目的、目標、ゴール、意図などに関する情報や、利用時の行動を表す情報である。具体的には、「その情報を何に使ったか」、「その情報を何のために使ったか」といった目的に関する情報や、「その情報を使って何をしたか」といった行動に関する情報が、利用目的である。この他、「〜に向けた(情報A)」、「(情報Aを)〜用に」、「(情報Aを)〜に使ってください」、「ご参考までに(情報Aを)〜にお役立てください」といった、文書中に現われる表現の「〜」の部分を利用目的としてもよい。また、利用時の行動を示す情報Aを利用する際に用いられる「〜をしました」、「〜の申請をお願いします」、「発注書」等の表現において現われる「〜をする」、「申請する」、「発注する」といった用言表現を利用目的としてもよい。利用目的の推定方法としては、情報の内容を分析することで利用目的を推定する方法(品詞情報などの属性情報を用いた分析を含む)や、情報にあらかじめ付与されている作者、作成時期、書式などの属性情報から利用目的を推定する方法など、種々の推定方法を適用することができる。
【0017】
情報管理処理12は、利用目的推定処理11にて推定された利用目的を利用目的属性として情報の内容とともに保持して管理する処理である。各情報の内容や各情報の内容にリンクの貼られたファイル名と、その利用目的属性とが関連付けられて記憶部に格納される。複数の情報に対して同一の利用目的属性を付与することができる。また、一つの情報に対して、複数の異なる利用目的属性を付与したり、複数の同一の利用目的属性を付与したりすることができる。ここでは、利用目的属性が付与された情報を、利用目的属性付き情報と呼ぶ。
【0018】
情報検索・分類処理13は、情報管理処理12によって管理されている利用目的属性付き情報を、その情報の内容および利用目的属性の少なくとも一方を検索・分類条件として検索・分類する処理である。
【0019】
本実施形態の情報検索・分類方法では、利用目的推定処理11および情報管理処理12により、利用目的属性付き情報のデータベース化が行われる。そして、情報検索・分類処理13により、そのデータベース化された利用目的属性付き情報についての検索・分類が行われる。
【0020】
以下、本実施形態の情報検索・分類方法を適用した情報検索・分類装置について説明する。
【0021】
図2は、本発明の第1の実施形態である情報検索・分類方法を適用した情報検索・分類装置の主要な構成を示すブロック図である。図2に示すように、情報検索・分類装置は、データ処理部A1および記憶部A2からなる。
【0022】
データ処理部A1は、外部端末との間で情報の入出力が行われる入出力処理部A10と、図1に示した利用目的推定処理11が行われる利用目的推定部A11と、図1に示した情報検索・分類処理13が行われる情報検索・分類部A12とを有する。記憶部A2は、入出力処理部A10を通じて供給された情報(検索・分類の対象となる種々の情報)が蓄積されるものであって、図1に示した情報管理処理12を通じて利用目的属性付き情報が格納される利用目的属性付き情報記憶部A21を有する。データ処理部A1と記憶部A2は、同じ装置上にあってもよいし、別々の装置上にあってもよい。
【0023】
利用目的推定部A11は、入出力処理部A10を通じて情報蓄積部21に蓄積される各情報(この情報は、外部端末やネットワークを通じて提供される情報であっても、外部記憶装置に蓄積されてデータベース化された情報であってもよい。)について、情報の内容を解析して利用目的を推定し、該推定した利用目的を示す利用目的属性を情報の内容に付与した利用目的属性付き情報を利用目的属性付き情報記憶部A21に格納する。
【0024】
情報検索・分類部A12は、利用者が外部端末から入出力処理部A10を通じて提示した検索・分類要求を受け付け、該受け付けた検索・分類要求に基づいて、利用目的属性付き情報記憶部A21に格納されている利用目的属性付き情報の検索・分類を行う。具体的には、情報検索・分類部A12は、検索・分類要求から検索・分類すべき情報の利用目的および内容を判断し、その判断した利用目的および内容に基づいて利用目的属性付き情報の検索・分類を行う。利用者は、検索・分類要求として、検索・分類すべき情報の内容とともに、その情報の利用目的を明示的に提示してもよい。この場合は、情報検索・分類部A12は、提示された利用目的に対応する利用目的属性が付され、かつ、提示された内容と合致する、利用目的属性付き情報がある否かの判断を行う。また、利用者は、検索・分類要求として、利用目的を表す語を含む複数の検索・分類語を提示してもよい。この場合は、情報検索・分類部A12は、提示された検索・分類語について利用目的を表す語と内容を表す語とを判別し、その利用目的を表す語に対応する利用目的属性が付され、かつ、内容を表す語と合致する、利用目的属性付き情報がある否かの判断を行う。情報検索・分類部A12にて検索・分類された情報は、入出力処理部A10を通じて検索・分類要求を行った利用者の端末に返される。
【0025】
次に、本実施形態の情報検索・分類装置の動作について具体的に説明する。本実施形態の情報検索・分類装置では、利用目的推定部A11が、利用目的属性付き情報を記憶部A2の利用目的属性付き情報記憶部A21に格納する処理(データベース化)と、情報検索・分類部A12が、利用目的属性付き情報記憶部A21に格納された利用目的属性付き情報を検索・分類する処理とが行われる。
【0026】
図3に、利用目的属性付き情報の格納処理の一手順を示す。まず、ステップS11で、入出力処理部A10を通じて情報蓄積部21に蓄積される情報について、その利用目的を推定する。そして、ステップS11で、情報の内容に推定した利用目的を利用目的属性として付与した利用目的属性付き情報を利用目的属性付き情報記憶部A21に格納する。ここで、利用目的は、情報の内容を分析した結果から付与してもよいし、情報にあらかじめ付与されている作者、作成時期、書式などの属性情報から利用目的を推定しても良い。
【0027】
図4に、利用目的属性付き情報の検索・分類処理の一手順を示す。この処理は、情報検索・分類部A12が、利用目的属性付き情報の格納処理(データベース化)と同時進行で行うことができる。まず、ステップS21で、入出力処理部A10を通じて利用者からの検索・分類要求を受け付ける。続いて、ステップS22で、検索・分類要求の内容を分析して、検索・分類すべき情報の利用目的および内容を取得する。続いて、ステップS23で、その取得した検索・分類すべき情報の利用目的および内容に基づいて、利用目的属性付き情報記憶部A21に格納されている利用目的属性付き情報を検索・分類する。そして、ステップS24で、検索・分類要求をした利用者に対して、その検索・分類結果を入出力処理部A10を通じて返す。
【0028】
[第1の実施形態の実施例]
以下、上述した第1の実施形態における利用目的属性付き情報の格納処理および検索・分類処理を含む情報検索・分類処理の具体例として、利用者が、各社のゲートウェイ・サーバーを比較するために情報の検索を行う場合の動作を説明する。
【0029】
図5(a)に、利用目的属性付き情報記憶部A21に格納される利用目的属性付き情報の一例を示す。図5(a)を参照すると、利用目的属性付き情報記憶部A21は、ファイル名の欄と利用目的の欄の2つの欄から構成されている。ファイル名の欄には、「情報A」、「情報B」、「情報C」といったファイル名が格納されている。「情報A」は、各社のゲートウェイ・サーバーのラインナップや価格比較に関する情報が格納されたファイルである。「情報B」は、ゲートウェイ・サーバーの購入要求書に関する情報が格納されたファイルである。「情報C」は、ゲートウェイ・サーバーの賃借契約書に関する情報が格納されたファイルである。「情報A」の利用目的の欄には「比較」といった用言表現が、「情報B」の利用目的の欄には「購入」といった用言表現が、「情報C」の利用目的の欄には「賃借」といった用言表現がそれぞれ利用目的属性として付与されている。このように、複数の情報A〜Cのそれぞれに対して利用目的属性が付与されている。なお、図示はしていないが、1つの情報に対して複数の利用目的属性が付与されてもよい。例えば、情報Aに対して、「比較」および「購入」といった2つの利用目的属性が付与されてもよい。また、同じ属性で利用される場合、もしくは利用されると判断される場合は、1つの情報に対して複数の同じ属性を付与しても良い。例えば、「情報A」のファイル内の文章中の異なる箇所で、「比較」といった用言表現が現われる場合は、その箇所の数だけ、「情報A」の利用目的の欄に「比較」といった利用目的属性を付与してもよい。
【0030】
ここでは、利用者が、検索したい情報の検索要求として、例えば「ゲートウェイ・サーバー」という検索語と、「比較」という利用目的を提示した場合の、情報検索・分類部A12による検索動作を説明する。
【0031】
情報検索・分類部A12は、利用者が提示した検索要求を受け付けると、その受け付けた検索要求の内容を分析する。この分析では、情報検索・分類部A12は、体言である「ゲートウェイ・サーバー」を検索したい内容と判断し、用言である「比較」を検索したい情報の利用目的であると判断する。次に、情報検索・分類部A12は、利用目的属性付き情報記憶部A21に格納されている利用目的属性付き情報から、検索語「ゲートウェイ」を含む情報(ファイル)で、利用目的属性が「比較」である情報を、検索すべき対象として判断する。図5(a)に示した例では、「情報A」は、各社のゲートウェイ・サーバーのラインナップや価格比較に関する情報が格納されたファイルであり、その利用目的の欄には、「比較」という用言表現が利用目的として付与されているので、情報検索・分類部A12は、この「情報A」が検索すべき対象であると判断する。図5(b)には、「情報A」が検索すべき対象としてヒットした状態が示されている。最後に、情報検索・分類部A12は、検索結果として、検索すべき対象であると判断した情報Aの内容を出力する。
【0032】
上記の情報の検索に加えて、情報検索・分類部A12は、利用目的属性付き情報を分類する処理も行う。具体的には、情報検索・分類部A12は、利用目的属性付き情報記憶部A21内に格納されている利用目的属性付き情報について、その内容が類似し、かつ、利用目的属性が類似している情報をまとめて分類する。図5(c)に、分類状態の一例を示す。
【0033】
図5(c)に示す例では、「情報A」、「情報B」および「情報C」の各情報の内容には、「ゲートウェイ・サーバー」という単語が共通に存在するので、情報検索・分類部A12は、これら「情報A」、「情報B」および「情報C」は情報の内容が類似すると判断する。また、情報検索・分類部A12は、「情報B」の利用目的属性である「購入」および「情報C」の利用目的属性である「賃借」は類似性が高いと判断し、「情報A」の利用目的属性である「比較」は「情報B」および「情報C」の各利用目的属性との類似性が低いと判断する。これら情報の内容および利用目的属性の類似性の判断結果に基づいて、情報検索・分類部A12は、利用目的属性付き情報記憶部A21内に格納されている利用目的属性付き情報を、「情報A」よりなる類似情報D1と「情報B」および「情報C」からなる類似情報D2とに分類する。
【0034】
利用目的属性の類似性の判定方法は、特に限定されるものではない。例えば、各利用目的属性の定義情報が格納された辞書データベースを予め用意しておき、この辞書データベースを用いて、各利用目的属性の定義情報を調べ、定義情報中に同じ単語が出現する場合に、類似すると判定してもよい。また、利用目的属性に関する類似用語情報を予め用意し、その類似用語情報を用いて利用目的属性の類似性を判定してもよい。
【0035】
以上の検索・分類の処理において、利用者は、検索・分類要求として、例えば、検索したい情報の内容と、その情報の利用目的のどちらか一方または両方を明示的に提示してもよい。例えば、利用者は、検索したい情報の内容である「ゲートウェイ・サーバー」とその利用目的である「比較」を検索要求として提示してもよい。また、利用者は、検索要求として、「各社」、「ゲートウェイ・サーバー」、「比較」といった複数の語を提示してもよい。いずれの場合も、情報検索・分類部A12は、利用者が提示した検索語が体言か用言かを調べ、体言であれば検索したい情報の内容と判断し、用言であれば利用目的であると判断する。例えば、「各社」や「ゲートウェィ・サーバー」は体言であるので、これらの検索語は、検索したい情報の内容であると判断される。「比較」は用言であるので、この検索語は、検索したい情報の利用目的であると判断される。
【0036】
また、利用者は、検索要求として、「各社のゲートウェイ・サーバーを比較したい」といった自由文を入力してもよい。この場合は、情報検索・分類部A12は、入力文について一般的な自然言語処理の一方法である形態素解析処理を行う。形態素解析処理は、文を形態素という文字列単位に分割し品詞情報を付与する処理である。情報検索・分類部A12は、形態素解析により、入力文を意味のある単語のかたまりに区分する。具体的には、「各社/の/ゲートウェイ・サーバー/を/比較し/たい/」といった区分が行われる。そして、情報検索・分類部A12は、区分した各単語について、品詞情報に基づいて体言と用言の判別を行い、体言であれば、検索したい情報の内容であると判定し、用言であれば、検索した情報の利用目的であると判定する。この例の場合も、体言である「各社」や「ゲートウェイ・サーバー」は、検索したい情報の内容と判断され、用言である「比較」は、検索したい情報の利用目的であると判断される。
【0037】
(第2の実施形態)
図6は、本発明の第2の実施形態である情報検索・分類方法の原理を説明するための図である。この情報検索・分類方法は、図6に示すように、入出力情報管理処理20、利用目的推定処理21、利用目的管理処理22、情報検索・分類処理23および入出力情報管理処理24の5つの処理を含む。
【0038】
入出力情報管理処理20は、利用者が入出力した情報の参照関係を推定するための処理である。ここで、入力情報は、例えば、外部情報源(例えば、サーバなどの外部情報処理装置)からコピーや閲覧などをすることにより取得した情報である。出力情報は、例えば、利用者が作成・編集した新たな情報であって、外部装置へ出力した情報である。出力情報は、入力情報の少なくとも一部の情報を含んでいてもよく、その場合は、出力情報に入力情報に関する注釈文を付与してもよい。
【0039】
入出力情報管理処理20では、利用者が取り扱った情報の内容について、入力情報(参照情報)であるか否か、出力情報であるか否か、入出力情報の間に参照関係がある否か、といった判定が行われる。参照関係の判定では、入力情報と出力情報の間において、同じ単語の出現の程度や時間情報(入出力の時刻情報)を用いて参照関係を判定する。入出力情報管理処理20により、入力情報、出力情報、これら入出力情報に対する入出力の判別情報、および入出力情報間の参照関係を示す情報が記憶部に格納される。
【0040】
利用目的推定処理21は、語彙情報を格納した語彙辞書データベースおよびどのような語彙がどのような利用目的にあたるかの概念情報を格納した概念辞書である利用目的辞書データベースを用いて、情報の内容を解析して利用目的を推定する処理である。この利用目的推定処理21は、2つの推定処理を含む。第1の利用目的推定処理は、出力情報中に記述された入力情報の参照文の内容と、該出力情報に付与された注釈文(入力情報の参照文に関する説明文)の内容とから、入力情報の利用目的を推定する処理である。この第1の利用目的推定処理により、入力情報に関する利用目的(目的、目標、意図、使用例)を推定することができる。第2の利用目的推定処理は、出力情報の内容から利用目的を推定する処理である。この第2の利用目的推定処理により、出力情報に関する利用目的(目的、目標、意図、使用例)を推定することができる。この第2の利用目的推定処理よれば、入力情報を参照した出力情報の利用目的を入力情報の利用目的とみなして利用することが可能である。このように、利用目的推定処理21では、入出力情報の利用目的属性が解析結果として得られる。利用目的は、利用時の行動をもとに推定してもよい。利用時の行動とは、第1の利用目的推定処理の場合は、出力情報に付与された入力情報の参照文および注釈文にあらわれる用言表現であり、第2の利用目的推定処理の場合は、出力情報に含まれる用言表現である。
【0041】
利用目的管理処理22は、入出力情報管理処理20で管理されている、入力情報、出力情報、これら入出力情報に対する入出力の判別情報、および入出力情報間の参照関係を示す情報と、利用目的推定処理21で得られた情報の利用目的属性とを対応付けて保存する処理である。この利用目的管理処理22によって、入出力情報に利用目的属性を付与した利用目的属性付き情報のデータベース化が行われる。
【0042】
情報検索・分類処理23は、利用目的管理処理22によりデータベース化された利用目的属性付き情報を、該情報の内容と該情報の使われ方である利用目的属性とに基づいて検索・分類し、検索・分類された利用目的属性付き情報を出力する処理である。
【0043】
入出力情報管理処理24は、利用者が情報検索・分類処理23によって検索および分類された情報を参照した場合は、その参照情報を入力情報として管理し、また、利用者が情報検索・分類処理23によって検索および分類された情報を用いて作成・編集した場合は、その情報を出力情報として管理する処理である。
【0044】
本実施形態の情報検索・分類方法では、入出力情報管理処理20、利用目的推定処理21、利用目的管理処理22、情報検索・分類処理23、入出力情報管理処理24の各処理が一連の処理として順次実行される。この一連の処理の繰り返しにより、利用目的属性つき情報記憶部の内容を拡充しつつ、情報の検索や分類といった処理が同時に行われる。なお、入出力情報管理処理20と利用目的推定処理21は、その順序が逆であっても、また同時に行われてもよい。
【0045】
以下、本実施形態の情報検索・分類方法を適用した情報検索・分類装置について説明する。
【0046】
図7は、本発明の第2の実施形態である情報検索・分類方法を適用した情報検索・分類装置の主要な構成を示すブロック図である。図7に示すように、本実施形態の情報検索・分類装置は、データ処理部B1および記憶部B2からなる。データ処理部B1と記憶部B2は、同じ装置上にあってもよいし、別々の装置上にあってもよい。また、記憶部B2は、複数の利用者間で共有しても良い。
【0047】
記憶部B2は、語彙情報を格納した語彙辞書データベースB21、どのような語彙がどのような利用目的にあたるかの概念情報を格納した概念辞書である利用目的辞書データベースB22および利用目的属性付き情報が格納される利用目的属性付き情報記憶部B23を有する。語彙辞書データベースB21には、例えば、自然言語処理技術に一般に用いられるような語彙情報が格納されている。目的・行動辞書データベースB22には、利用目的をあらわす利用目的表現や利用行動をあらわす行動表現といった二種類の情報が格納されている。利用目的表現は、例えば「〜に向け」、「〜用に」、「〜に使ってください」、「ご参考までに〜にお役立てください」といった利用目的、目標、ゴール、意図を示した表層表現の集合で、具体的な利用目的、目標、ゴール、意図である「〜」の個所を指し示す表現である。行動表現は、「〜をしました」、「〜の申請をお願いします」、「発注」等の情報にあらわれる利用の行動を表した用言表現である。利用目的属性は、利用目的表現に付随する「〜」の部分にあらわれる情報である。
【0048】
データ処理部B1は、入出力情報管理部B11、利用目的推定部B12および情報検索・分類部B13を有する。
【0049】
入出力情報管理部B11は、利用者が入出力した情報(文書、図、音楽、音声などの情報であって、情報の二次利用者が作成した情報を含む)の内容を管理するとともに、入出力情報間に一部の内容を参照したなどの参照関係があるか否かを判定する。
【0050】
利用目的推定部B12は、入出力情報管理部B11から情報(入出力情報および参照関係判定結果)を受け取り、該受け取った入出力情報の内容を語彙辞書データベースB21および利用目的辞書データベースB22を参照して解析して利用目的を推定する。この利用目的の推定では、出力情報中に記述された入力情報の参照文の内容と、該出力情報に付与された注釈文(入力情報の参照文に関する説明文)の内容とから、入力情報の利用目的を推定する第1の利用目的推定処理と、入力情報を参照した出力情報の内容から入出力情報の利用目的を推定する第2の利用目的推定処理とがそれぞれ実行される。利用目的推定部B12は、第1および第2の利用目的推定処理で推定された利用目的を利用目的属性として入出力情報と対応付け、これを利用目的属性付き情報として利用目的属性付き情報記憶部B23に格納する。具体的には、第1の利用目的推定処理の場合は、該処理により取得した入力情報の利用目的を対応する入力情報と対応付けて格納する。また、第2の利用目的推定処理の場合は、該処理により取得した出力情報の利用目的を、入力情報の利用目的と見なして、対応する入出力情報と対応付けて格納する。
【0051】
情報検索・分類部B13は、利用目的属性付き情報記憶部B23に格納された利用目的属性付き情報を、情報の内容と利用目的属性の双方もしくはどちらか一方を用いて検索・分類する。
【0052】
次に、本実施形態の情報検索・分類装置の動作について具体的に説明する。本実施形態の情報検索・分類装置では、入出力情報管理部B11および利用目的推定部B12によって、利用目的属性付き情報が記憶部B2の利用目的属性付き情報B23に格納され(データベース化)、入出力情報管理部B11および情報検索・分類部B13によって、利用目的属性付き情報B23に格納された利用目的属性付き情報の検索・分類が行われる。
【0053】
図8に、利用目的属性付き情報の格納処理の一手順を示す。まず、ステップS31で、入出力情報管理部B11が、利用者が外部端末を通じて記憶部B2に対して情報の入出力を行ったか否かを判定する。記憶部B2への情報の入出力が行われる間、入出力情報管理部B11は、随時、各情報に対して、入力であるか、出力であるかの判定が可能な入出力情報IDを付与する。
【0054】
次に、ステップS32で、入出力情報管理部B11が、入出力情報間の参照関係を判定する。この参照関係の判定では、例えば、入出力情報に含まれている語などの情報の重なり程度や時間情報(入出力の時刻情報)を用いて参照関係を判定する。例えば、入出力の時刻の差(時間差)が所定の差である場合で、入出力情報の間に類似した内容の情報が紫存在する場合に、その入出力情報の間には参照関係があると判定する。
【0055】
次に、ステップS33で、利用目的推定部B12が、語彙辞書データベースB21および利用目的辞書データベースB22を用いて入出力情報の内容を解析し利用目的を推定する。この利用目的推定部B12による利用目的の推定では、上述の第1および第2の利用目的推定処理が行われる。具体的には、第1の利用目的推定処理では、出力情報に含まれる入力情報の参照文(または注釈文)の内容を解析して、入力情報の利用目的を推定する。例えば「『入力情報』を見たので、〜した」、「『入力情報』は〜に使うとよい」といった参照文について「〜」の部分を解析して入力情報の利用目的を推定する。この場合、推定した入力情報の利用目的は、参照文自体の利用目的や出力情報の利用目的と異なっていてもよい。第2の利用目的推定処理では、特に文書の重要個所、例えばタイトルやそれに続くリード文(文書の冒頭の説明文であり、その文書が何について書かれているかの概要を説明することが多い)に現われる表現を解析することで利用目的を推定することが望ましい。また、利用目的を推定する場合、「〜」の部分を意味・係り受け解析し、概念を抽出してそれを利用目的として利用してもよい。また、「〜」の部分の簡易解析を行い、内容語のみを取り出してそれを利用目的として用いても良い。また、「〜」の中に含まれる利用目的表現内の用言表現のみを抽出してそれを利用目的として用いてもよい。また、行動表現の用言表現を行動情報として推定し、これを利用目的として用いてもよい。
【0056】
次に、ステップS34で、利用目的推定部B12が、上述のステップS31およびステップS32で得られた、入出力情報の内容および入出力情報間の参照関係と、上述のステップS33で推定された利用目的とを対応付けることで利用目的属性付き情報を作成する。
【0057】
最後に、ステップS35で、利用目的推定部B12が、上記のステップS34で作成された利用目的属性付き情報を利用目的属性つき情報記憶部B23に格納する。
【0058】
以上の処理を繰り返すことにより、利用目的属性つき情報のデータベースが作成される。なお、ステップS31およびステップS32の処理(情報の入出力の判別および入出力情報間の参照関係の判定)と、ステップS33の処理(情報の利用目的属性の判定)は、その順序が逆であっても、また同時に行われてもよい。
【0059】
図9に、利用目的属性付き情報B23に格納された利用目的属性付き情報を検索・分類する処理の一手順を示す。まず、ステップS41で、情報検索・分類部B13が、利用者から検索・分類要求を受け付ける。次に、ステップS42で、情報検索・分類部B13が、検索・分類要求の内容を分析する。次に、ステップS43で、情報検索・分類部B13が、その分析した検索・分類要求の内容に基づいて、利用目的属性つき情報記憶部B23に格納された利用目的属性付き情報を検索・分類する。最後に、ステップS44で、情報検索・分類部B13が、検索・分類した結果を出力する。
【0060】
以上の検索・分類処理によれば、利用者からの検索・分類要求から取得した利用目的に基づいて、出力情報だけでなく、その出力情報内で参照している入力情報についても検索・分類することができる。
【0061】
[第2の実施形態の第1の実施例]
以下、第2の実施形態の情報検索・分類方法の第1の実施例について説明する。ここでは、第一の利用者が作成した情報A、具体的には、各社のゲートウェイ・サーバーの価格比較をまとめた情報A(文書、図、音楽、音声などの情報を含むものであってもよい。)を、第二の利用者がダウンロードし、その情報Aの一部の内容を引用して情報Bを作成して外部端末(第三の利用者)に送信する場合の動作を説明する。情報Bは、情報Aの一部の内容を参照して作成した文書に、「平成17年度のゲートウェイ・サーバーの購入に参考になるかと思います。宜しくお願い致します。」といった注釈文を加えたメールである。第一の利用者と第二の利用者は、同一人物であってもよい。注釈文は、文書、図、音楽、音声などの情報であってもよい。
【0062】
まず、入出力情報管理部B11が、利用者が入出力した情報を随時、記憶部B2に保存するとともに、保存した各情報に、入力および出力のいずれであるかを示す入出力情報IDを付与する。ここでは、入力情報IDを「i」、出力情報IDを「o」とする。第二の利用者がダウンロードした情報Aを入力情報とし、第二の利用者がメールとして第三者に送信した文書(情報B)を出力情報として扱い、入力情報に「i」を、出力情報に「o」をそれぞれ付与して記憶部B2に保存する。また、入出力情報管理部B11は、入力情報(情報A)と出力情報(情報B)の間に、一部の内容を参照したなどの参照関係があるか否かを判定し、参照関係がある場合は、その判定結果に基づき、記憶部B2に保存した入力情報(情報A)および出力情報(情報B)の対応付けを行う。このときの記憶部B2に格納される入出力情報を図10(a)に示す。
【0063】
図10(a)を参照すると、入出力情報は、ファイル名の欄、参照先の欄、入出力情報IDの欄を含む。ファイル名の欄には、「情報A」、「情報B」といったファイル名が格納されている。「情報A」は、第二の利用者がダウンロードした情報Aである。「情報B」は、第二の利用者がメールとして第三者に送信した文書(情報B)である。「情報B」の参照先の欄には、「情報A」のファイル名が格納されている。「情報A」の入出力情報IDの欄には、入力情報であることを示すID「i」が格納されており、「情報B」の入出力情報IDの欄には、出力情報であることを示すID「o」が格納されている。
【0064】
次に、利用目的推定部B12が、情報Bの内容を解析してその表現から情報の利用目的を推定する。情報Bには、情報Aの内容と「平成17年度のゲートウェイ・サーバーの購入に参考になるかと思います。宜しくお願い致します。」といった注釈が書かれている。利用目的推定部B12は、記憶部B2内の語彙辞書データベースB21および利用目的辞書データベースB22を用いて、情報Bの文書の解析を行って利用目的を推定する。語彙辞書データベースB21には、自然言語処理技術に一般に用いられるような語彙情報が格納されている。利用目的辞書データベースB22には、利用の目的や行動の情報をあらわす利用目的表現と行動表現といった二種類の情報が格納されている。利用目的表現とは、例えば「〜に向け」、「〜用に」、「〜に使ってください」、「ご参考までに〜にお役立てください」といった利用目的、目標、ゴール、意図を示した表層表現の集合で、具体的な利用目的、目標、ゴール、意図である「〜」の個所を指し示す表現である。また、行動表現とは「〜をしました」、「〜の申請をお願いします」、「発注」等の情報にあらわれる利用の行動を表した用言表現である。
【0065】
上記の文書解析では、まず、語彙辞書データベースB21を用いて、一般的な自然言語処理技術である形態素解析処理を行う。この形態素解析処理により、例えば、「平成17年度/の/ゲートウェイ・サーバー/の/購入/に/参考になる/か/と/思い/ます/。宜しく/お願い致します/。」といった形態素解析結果が得られる。次に、利用目的辞書データベースB22を用いて、形態素解析により区分された形態素を解析する。この解析では、「/に/参考になる/」といった表層表現が利用目的表現であると判定され、その利用目的を詳しく説明する個所である「平成17年度のゲートウェイ・サーバーの購入」の部分を利用目的属性として利用する。利用目的属性の利用方法は任意でよい。例えば、「/平成17年度/の/ゲートウェイ・サーバー/の/購入」について意味・係り受け解析を行い、「期間:((平成17年度)に)」、「対象:((ゲートウェイ・サーバー)を)」、「行動:(購入する)」といった利用目的の概念を導出してもよい。また、別の例としては、「平成17年度のゲートウェイ・サーバーの購入」に簡易解析を行い、内容語である「平成17年度」、「ゲートウェイ・サーバー」、「購入」を抽出し、それら内容語を利用目的として利用しても良い。さらに、別の例としては、「/平成17年度/の/ゲートウェイ・サーバー/の/購入」の中から用言表現である「購入」を抽出し、それを利用目的属性として利用しても良い。ここでは、「購入」を抽出する例を用いる。
【0066】
上述のようにして、利用目的属性推定部B12は、情報B内で引用された情報Aに関する「平成17年度のゲートウェイ・サーバーの購入に参考になるかと思います。宜しくお願い致します。」といった注釈文を解析することで、情報Aの利用目的属性(ここでは「購入」)を取得する。そして、利用目的属性推定部B12は、情報Aを参照した情報Bにその取得した利用目的属性を付与した利用目的属性付き情報を利用目的属性付き情報記憶部B23に格納する。なお、参照情報を用いて、元の情報Aそのものに利用目的属性を付与してもよい。このようにして、情報Aを引用した情報Bに情報Aに関する利用目的属性「購入」を付与した利用目的属性付き情報、または、参照先である情報Aにその情報Aに関する利用目的属性「購入」を付与した利用目的属性付き情報に関するデータベースが作成される。
【0067】
データベースが作成された後、「ゲートウェィ・サーバーを購入したいので参考となる情報」を希望する利用者(第二の利用者または別の利用者)が、情報検索・分類要求を提示すると、情報検索・分類部B13が、その要求内容を解析して、利用目的属性付き情報記憶部B23に格納されている利用目的属性付き情報の検索・分類を行う。この利用目的属性付き情報の検索・分類は、前述の第2の実施形態の動作で説明したとおりである。
【0068】
[第2の実施形態の第2の実施例]
以下、第2の実施形態の情報検索・分類方法の第2の実施例について説明する。ここでは、第一の利用者が作成した情報A、具体的には、各社のゲートウェイ・サーバーの価格比較をまとめた情報A(文書、図、音楽、音声などの情報を含むものであってもよい。)を第二の利用者が参照して情報Bを作成して外部端末(第三の利用者)に送信する場合の動作を説明する。情報Bは、情報Aの説明文として「平成17年度のゲートウェイ・サーバーの購入に参考になるかと思います。宜しくお願い致します。」といった注釈文を加えたメールである。第一の利用者と第二の利用者は、同一人物であってもよい。注釈文は、文書、図、音楽、音声などの情報であってもよい。
【0069】
まず、入出力情報管理部B11が、上述した第1の実施例の場合と同様にして、利用者が入出力した情報(情報Aおよび情報B)を随時、記憶部B2に保存するとともに、保存した各情報に、入力および出力のいずれであるかを示す入出力情報IDを付与する。また、入出力情報管理部B11は、入力情報(情報A)と出力情報(情報B)の間に、一部の内容を参照したなどの参照関係があるか否かを判定し、参照関係がある場合は、その判定結果に基づき、記憶部B2に保存した入力情報(情報A)および出力情報(情報B)の対応付けを行う。
【0070】
次に、利用目的推定部B12が、情報Bの内容を解析してその表現から情報の利用目的を推定する。情報Bには、情報Aに関する説明文として「平成17年度のゲートウェイ・サーバーの購入に参考になるかと思います。宜しくお願い致します。」といった注釈が書かれている。利用目的推定部B12は、記憶部B2内の語彙辞書データベースB21および利用目的辞書データベースB22を用いて、情報Bの文書の解析を行って利用目的を推定する。この文書解析は、上述した第1の実施例の場合と同様である。こうして、利用目的属性推定部B12は、情報B内の情報Aに関する注釈文を解析することで、情報Aの利用目的属性(ここでは「購入」)を取得する。そして、利用目的属性推定部B12は、情報Bに、その取得した利用目的属性を付与した利用目的属性付き情報を利用目的属性付き情報記憶部B23に格納する。このときの利用目的属性付き情報記憶部B23に格納された利用目的属性付き情報の内容を図10(b)に示す。
【0071】
図10(b)を参照すると、利用目的属性付き情報は、ファイル名の欄、利用目的の欄を含む。ファイル名の欄には、「情報A」、「情報B」といったファイル名が格納されている。「情報A」は、第一の利用者が作成した情報Aである。「情報B」は、第二の利用者が情報Aを参照して作成した情報Bである。「情報B」の利用目的の欄には「購入」が格納されている。
【0072】
次に、利用目的属性推定部B12は、情報Aを入力情報、情報Bを出力情報として扱い、これら入出力情報間の参照関係を調べるとともに、参照関係がある場合に、情報Bの利用目的属性を情報Aに対応付ける。このときの利用目的属性付き情報記憶部B23に格納された利用目的属性付き情報の内容を図10(c)に示す。
【0073】
図10(c)を参照すると、利用目的属性付き情報は、図10(b)に示した内容に、参照先の欄、入出力情報IDの欄を加えたものになっている。「情報A」の入出力情報IDの欄には、「i」が格納されている。「情報B」の参照先の欄および入出力情報IDの欄には、「情報A」および「i」が格納されている。こうして、入力情報である情報Aと出力情報である情報Bがリンクされ、これら入出力情報に利用目的属性である「購入」を付与した利用目的属性つき情報のデータベースが作成される。
【0074】
以上のようにして利用目的属性つき情報が作成された後、「ゲートウェィ・サーバーを購入したいので参考となる情報」を希望する利用者が、「ゲートウェィ・サーバーを購入したいので参考となる情報」といった自由文からなる検索要求を提示する。情報検索・分類部B13は、提示された検索要求から、検索すべき情報の内容を示す「ゲートウェイ・サーバー」という単語と検索すべき情報の利用目的を示す「購入」という利用目的属性をそれぞれ取得する。そして、情報検索・分類部B13は、その取得した単語および利用目的属性の少なくとも一方を用いて利用目的属性付き情報記憶部B23を検索する。図10(c)に示した例では、「情報A」は、各社のゲートウェイ・サーバーのラインナップや価格比較に関する情報が格納されたファイルであり、「情報A」を参照する「情報B」の利用目的の欄には「購入」という属性が格納されているので、情報検索・分類部B13は、「購入」という属性に基づいて「情報B」を検索対象として判断するとともに、その判断した「情報B」の参照先である「情報A」も検索対象として判断する。図10(d)には、「情報B」の利用目的の欄の「購入」がヒットした状態が示されている。
【0075】
以上の処理によれば、ゲートウェィ・サーバーを購入する上で参考になる情報Aは、その情報内に購入といった表現が含まれていなくても、情報Aを参照した他の情報B内の説明から、情報Aが購入を目的として利用されていることが特定される。
【0076】
なお、上述の処理では、利用者が、自由文よりなる検索要求を提示した例を挙げたが、これに代えて、検索したい情報の内容や主題をあらわす「ゲートウェイ・サーバー」とその情報を得たい理由を示す利用目的「購入」を別々に入力してもよい。
【0077】
次に、上述の検索処理によって検索された情報Aを参照してさらに情報Cを作成した場合の動作を説明する。ここでは、利用者が、各社のゲートウェイ・サーバーの価格比較をまとめた情報Aの内容をみて、価格が高すぎると判断し、あるゲートウェイ・サーバーを選択し、その本体価格の2%を月々支払う賃借契約書を作成したとする。賃借契約書には、「xx社のゲートウェイ・サーバーを本体価格2,000,000円の2%で御社より賃借いたします。」といった記述があるものとする。
【0078】
まず、入出力情報管理部B11が、参照した情報Aを入力情報、作成した賃借契約書を出力情報(情報C)としてそれぞれ扱い、入力情報に「i」、出力情報に「o」をそれぞれ付与する(図10(e)参照)。次に、入出力情報管理部B11は、入力情報Aと出力情報Cの間に一部の内容を参照したなどの参照関係があるか否かを判定する。ここでは、出力情報Cは、入力情報Aを参照した内容を含むので、入出力情報管理部B11は、入力情報Aと出力情報Cの間に参照関係があると判断し、情報Cの参照先の欄に「情報A」というファイル名を格納する(図10(f)参照)。
【0079】
次に、利用目的推定部B12が、出力情報C内の表現から参照した入力情報の利用目的を推定する。この利用目的の推定は、具体的には、次のようにして行う。まず、語彙辞書データベースB21を用いて、出力情報Cの内容を形態素解析処理する。形態素解析では、「xx社/の/ゲートウェイ・サーバー/を/本体/価格/2,000,000円/の/2%/で/御社/より/賃借/いたし/ます/。」といった単語に区分される。次に、目的・行動辞書データベースB22を用いて各単語を解析する。この解析では、「賃借/いたし/ます」といった表層表現が利用行動表現であると判定される。また、その利用行動である「xx社/の/ゲートウェイ・サーバー/を/本体/価格/2,000,000円/の/2%/で/御社/より/賃借/いたし/ます/」の部分が利用目的属性として利用される。利用目的属性の利用では、例えば、「xx社/の/ゲートウェイ・サーバー/を/本体/価格/2,000,000円/の/2%/で/御社/より/賃借/いたし/ます/」に意味・係り受け解析を行い、「対象:((xx社のゲートウェイ・サーバー)を)」、「手段:((本体価格 2,000,000円の2%)で)」、「源泉:((御社)より)」、「行動:(賃借する)」といった利用目的といった概念を導出する。また、別の利用例では、「xx社/の/ゲートウェイ・サーバー/を/本体/価格/2,000,000円/の/2%/で/御社/より/賃借/いたし/ます/」に簡易解析を行い、内容語である「xx社」、「ゲートウェイ・サーバー」、「本体」、「価格」、「2,000,000円」、「2%」、「賃借」を抽出し、それら内容語を利用しても良い。さらに、別の利用例では、「xx社/の/ゲートウェイ・サーバー/を/本体/価格/2,000,000円/の/2%/で/御社/より/賃借/いたし/ます/」の中から、用言表現である「賃借」を抽出し、それを利用目的属性として利用しても良い。ここでは、用言表現である「賃借」を抽出する例が採用されるものとする。
【0080】
次に、利用目的推定部B12は、上述の処理で推定した利用目的属性(ここでは「賃借」)を情報Cの利用目的の欄に格納する(図10(g)参照)。次に、利用目的推定部B12は、各情報A、Cの内容とその参照関係、情報の利用目的属性の対応付けを行う(図10(h)参照)。こうして、情報Aを参照して作成した情報Cの内容とその利用目的属性である「賃借」が追加された利用目的属性付き情報データベースが作成される。このデータベースでは、各社のゲートウェイ・サーバーの価格比較をまとめた情報Aに関する利用目的属性として、情報Cの利用目的の欄に「購入」という属性が格納されるとともに、情報Cの利用目的の欄に「賃借」という属性が格納されている。
【0081】
上述の処理によれば、利用目的属性付き情報のデータベース化を図りながら、情報の検索・分類を行うことができる。また、同じ利用目的で使用した情報を収集したり、同じ情報に様々な利用目的を設定したりすることができる。また、参照先および利用目的の各欄に格納された情報から、どの情報が、どのような目的で、どれだけ回数利用されたかを判断することもできることから、この判断結果に基づいて、検索結果である情報の内容に優先順位を付与してもよい。また、同様に、様々な利用目的で利用できる情報は、汎用性の高い情報である可能性が高いと判断し、この判断結果に基づいて、検索結果である情報の内容に優先順位を付与してもよい。
【0082】
以上説明した各実施形態の情報検索・分類装置によれば、以下のような効果を奏する。
【0083】
第1の効果は、所望の情報Aを簡便に検索・分類できることである。その理由は、情報Aを、その情報Aの内容だけで検索・分類するのではなく、その情報Aの使い道などの利用目的で検索・分類できるようにしたためである。情報の検索・分類などの情報提供には、その情報の内容そのものだけでなく、データの属性情報や注釈情報を用いることが有効である。特に、第2の実施形態においては、二次利用者の便宜のために、ある情報をある利用者が利用した際の利用目的を、利用者の残した情報の内容および利用者の情報の入出力記録を用いて自動推定し、情報の新しい価値ある属性として管理するようになっており、これにより、簡便な情報の提供および情報の再利用の処理を実行することが可能である。例えば、これまでの検索技術では、何に関する文書かの検索は可能だったが、本発明では、情報の使い道、利用目的属性がついているために、その文書をどのように利用したいかといった利用者の使用目的を加味した情報検索が可能である。例えば、「ゲートウェイ・サーバー」に関する文書であって、かつ、他の利用者が「購入する」際に利用した文書を検索することが可能で、「購入」の文字がその文書内にあらわれていなくても、例えば、ゲートウェイ・サーバーの各社のラインナップや価格情報、使用感レポートなど、購入目的に有用な情報を入手することができる。
【0084】
第2の効果は、利用者に対する情報の記入などの負担を強いることなく、情報Aを検索するために有用な情報を入手できることである。その理由は、二次利用者が新たに情報を作成する必要がないからである。二次利用者による情報Aの利用の結果から、情報Aを検索するために有用な情報を自動的に入手するようになっている。
【0085】
第3の効果は、情報Aを検索・分類するために有用な情報が、情報Aを利用するたびに増えることである。その理由は、情報Aを検索・分類するために有用な情報を、情報Aを利用した過去の情報から抽出することができるためである。二次利用者が情報を利用する場合に、その元となる情報を編集したり、元の情報から新たな情報を作成したりするといった、情報利用の繰り返しを行う度に、有用な情報が自動的に蓄積される。
【0086】
第4の効果は、情報Aの利用者の操作を逐一記録し、その記録された操作情報群から利用者の意図・行動を推定するなどの膨大な処理を行うことなく、情報Aを検索するために有用な、同等の情報を入手できることである。その理由は、入手した情報や出力した情報を解析することで、情報利用の目的を推定する機構を設けたためである。
【0087】
以上説明した第1および第2の実施形態である情報検索・分類方法を適用した情報検索・分類装置は、いずれもプログラムに従って動作するコンピュータシステムにより構成することができる。
【0088】
図11に、第1の実施形態である情報検索・分類方法を適用した情報検索・分類装置を実現するコンピュータシステムの概略構成を示す。このコンピュータシステムは、図2に示したデータ処理装置A1を、中央演算処理装置(CPU)C10とメモリC11からなるコンピュータC1で構成したものである。コンピュータC1は、情報検索・分類用プログラムC2に従って動作するものである。
【0089】
情報検索・分類用プログラムC2は、前述の第1の実施形態で説明した情報検索・分類に関する各処理を実行するためのプログラムである。この情報検索・分類用プログラムC2は、CD−ROMやDVDなどの記録媒体によって提供されてもよく、また、メモリC11内に予め格納されていてもよい。
【0090】
コンピュータC1では、中央演算処理装置C10が情報検索・分類用プログラムC2に従って情報検索・分類に関する各処理を実行することで、前述の第1の実施形態で説明した情報検索・分類の動作が実現される。なお、図11に示した例では、記憶装置A2とコンピュータC1は、別々の装置とされているが、記憶装置A2をコンピュータC1内に設けることもできる。
【0091】
図12に、第2の実施形態である情報検索・分類方法を適用した情報検索・分類装置を実現するコンピュータシステムの概略構成を示す。このコンピュータシステムは、図7に示したデータ処理装置B1を、中央演算処理装置(CPU)D10とメモリD11からなるコンピュータD1で構成したものである。コンピュータD1は、情報検索・分類用プログラムD2に従って動作するものである。
【0092】
情報検索・分類用プログラムD2は、前述の第2の実施形態で説明した情報検索・分類に関する各処理を実行するためのプログラムである。この情報検索・分類用プログラムD2は、CD−ROMやDVDなどの記録媒体によって提供されてもよく、また、メモリD11内に予め格納されていてもよい。
【0093】
コンピュータD1では、中央演算処理装置D10が情報検索・分類用プログラムD2に従って情報検索・分類に関する各処理を実行することで、前述の第2の実施形態で説明した情報検索・分類の動作が実現される。なお、図12に示した例では、記憶装置B2とコンピュータD1は、別々の装置とされているが、記憶装置B2をコンピュータD1内に設けることもできる。
【0094】
以上説明した各実施形態において、入出力情報の参照先特定と利用目的推定は、その順序が逆であっても、また同時に行われてもよい。
【0095】
また、利用目的推定をするための情報は、同じ言語で表現されている必要はない。例えば、多言語対応の語彙辞書を用いれば、利用目的推定をするための情報として日本語や英語など異なる言語の情報を用いることができる。
【0096】
また、各実施形態の情報検索・分類装置は、知識共有・情報配信・暗黙知(Know-how)検索支援、業務支援を目的とする情報システムにも適用することができる。
【0097】
[ネットワークシステム]
図13は、本発明の情報検索・分類装置を含むネットワークシステム全体の構成を示すブロック図である。図13を参照すると、このネットワークシステムは、複数のユーザ端末1−1〜1−nと、これらユーザ端末がネットワーク3を介して接続される情報検索・分類装置2とからなる。情報検索・分類装置2は、前述した第1および第2の実施形態の情報検索・分類方法が適用された情報検索・分類装置である。複数のユーザ端末1−1〜1−nは、いずれも通信機能を備えたコンピュータシステム(例えば、モデムを備えたパーソナルコンピュータ)である。情報検索・分類装置2では、入出力処理部や入出力情報管理部において、各ユーザ端末1−1〜1−nを通じて行われる検索・分類要求の受け付け処理や入出力情報の管理処理を行う。また、検索・分類結果は、入出力処理部を通じて、検索・分類要求をした利用者の端末に返される。
【図面の簡単な説明】
【0098】
【図1】本発明の第1の実施形態である情報検索・分類方法の原理を説明するための図である。
【図2】本発明の第1の実施形態である情報検索・分類方法を適用した情報検索・分類装置の主要な構成を示すブロック図である。
【図3】図2に示す情報検索・分類装置において行われる利用目的属性付き情報の格納処理の一手順を示すフローチャート図である。
【図4】図2に示す情報検索・分類装置において行われる利用目的属性付き情報の検索・分類処理の一手順を示すフローチャート図である。
【図5】(a)から(c)は、図2に示す情報検索・分類装置の利用目的属性付き情報記憶部に格納される利用目的属性付き情報の状態を説明するための図である。
【図6】本発明の第2の実施形態である情報検索・分類方法の原理を説明するための図である。
【図7】本発明の第2の実施形態である情報検索・分類方法を適用した情報検索・分類装置の主要な構成を示すブロック図である。
【図8】図7に示す情報検索・分類装置において行われる利用目的属性付き情報の格納処理の一手順を示すフローチャート図である。
【図9】図7に示す情報検索・分類装置において行われる利用目的属性付き情報の検索・分類処理の一手順を示すフローチャート図である。
【図10】(a)から(h)は、図7に示す情報検索・分類装置の利用目的属性付き情報記憶部に格納される利用目的属性付き情報の状態を説明するための図である。
【図11】第1の実施形態である情報検索・分類方法を適用した情報検索・分類装置を実現するコンピュータシステムの概略構成を示すブロック図である。
【図12】第2の実施形態である情報検索・分類方法を適用した情報検索・分類装置を実現するコンピュータシステムの概略構成を示すブロック図である。
【図13】本発明の情報検索・分類装置を含むネットワークシステム全体の構成を示すブロック図である。
【符号の説明】
【0099】
A1 データ処理部
A2 記憶部
A10 入出力処理部
A11 利用目的推定部
A11 情報検索・分類部
A21 利用目的属性付き情報記憶部
【特許請求の範囲】
【請求項1】
内容から利用目的を推定可能な複数の情報が格納される記憶部と、
前記複数の情報のそれぞれについて、該情報の内容を解析して利用目的を推定するとともに、該推定した利用目的を該情報と関連付けて前記記憶部に格納する利用目的推定部と、
検索すべき情報の内容および利用目的をそれぞれ推定可能な検索要求が提示されると、該提示された検索要求に関連する内容および利用目的を持つ情報を前記記憶部から検索する検索部とを有する情報提供装置。
【請求項2】
前記利用目的推定部は、用言表現に基づいて利用目的を判断する、請求項1に記載の情報提供装置。
【請求項3】
語彙に関する情報が格納された語彙辞書データベースと、
前記語彙辞書データベースに格納された語彙がどのような利用目的にあたるかの概念情報が格納された利用目的辞書データベースとをさらに有し、
前記利用目的推定部は、前記語彙辞書データベースを用いて情報の内容に含まれる単語を判断するとともに、該単語に基づいて前記利用目的辞書データベースから利用目的を推定する、請求項1に記載の情報提供装置。
【請求項4】
前記複数の情報は、第1の情報と、該第1の情報の少なくとも一部の内容を参照した参照文を含む第2の情報とを有し、
前記利用目的推定部は、前記第2の情報に含まれる参照文の内容を解析して前記第1の情報の利用目的を推定し、該推定した利用目的を示す属性を前記第1の情報と関連付けて前記記憶部に格納する、請求項1に記載の情報提供装置。
【請求項5】
前記複数の情報は、第1の情報と、該第1の情報の少なくとも一部の内容を参照した第2の情報とを有し、
前記利用目的推定部は、前記第2の情報の内容を解析して該第2の情報の利用目的を推定し、該推定した利用目的を示す属性を前記第1および第2の情報と関連付けて前記記憶部に格納する、請求項1に記載の情報提供装置。
【請求項6】
前記第1の情報が、外部から入力された入力情報であり、前記第2の情報が、外部へ出力された出力情報である、請求項4または5に記載の情報提供装置。
【請求項7】
前記検索部は、前記検索要求の内容から、情報の内容を検索するための第1の検索語と、利用目的を検索するための第2の検索語とをそれぞれ取得し、該取得した第1および第2の検索語に基づいて前記記憶部内から該当する情報を検索する、請求項1から6のいずれか1項に記載の情報提供装置。
【請求項8】
少なくとも前記利用目的に基づいて前記記憶部に格納された情報を分類する分類部をさらに有する、請求項1から7のいずれか1項に記載の情報提供装置。
【請求項9】
前記分類部は、分類すべき情報の内容および利用目的をそれぞれ推定可能な検索要求が提示されると、該提示された検索要求から推定される内容および利用目的に基づいて前記記憶部に格納された情報を分類し、該分類結果を外部に出力する、請求項8に記載の情報提供装置。
【請求項10】
内容から利用目的を推定可能な複数の情報が格納される記憶部を備えるコンピュータシステムにおいて行われる情報提供方法であって、
コンピュータが行うステップとして、
前記複数の情報のそれぞれについて、該情報の内容を解析して利用目的を推定するとともに、該推定した利用目的を該情報と関連付けて前記記憶部に格納する第1のステップと、
検索すべき情報の内容および利用目的をそれぞれ推定可能な検索要求が提示されると、該提示された検索要求に関連する内容および利用目的を持つ情報を前記記憶部から検索する第2のステップとを含む情報提供方法。
【請求項11】
前第1のステップは、用言表現に基づいて利用目的を判断するステップを含む、請求項10に記載の情報提供方法。
【請求項12】
前記第1のステップは、語彙に関する情報が格納された語彙辞書データベースを用いて情報の内容に含まれる単語を判断するとともに、前記語彙辞書データベースに格納された語彙がどのような利用目的にあたるかの概念情報が格納された利用目的辞書データベースを参照して前記単語の利用目的を推定するステップを含む、請求項10に記載の情報提供方法。
【請求項13】
前記第1のステップは、前記複数の情報の中に、第1の情報の少なくとも一部の内容を参照した参照文を含む第2の情報がある場合に、該第2の情報に含まれる参照文の内容を解析して前記第1の情報の利用目的を推定し、該推定した利用目的を示す属性を前記第1の情報と関連付けて前記記憶部に格納するステップを含む、請求項10に記載の情報提供方法。
【請求項14】
前記第1のステップは、前記複数の情報の中に、第1の情報の少なくとも一部の内容を参照した第2の情報がある場合に、該第2の情報の内容を解析して該第2の情報の利用目的を推定し、該推定した利用目的を示す属性を前記第1および第2の情報と関連付けて前記記憶部に格納するステップを含む、請求項10に記載の情報提供方法。
【請求項15】
前記第1の情報が、外部から入力された入力情報であり、前記第2の情報が、外部へ出力された出力情報である、請求項13または14に記載の情報提供方法。
【請求項16】
前記第2のステップは、前記検索要求の内容から、情報の内容を検索するための第1の検索語と、利用目的を検索するための第2の検索語をそれぞれ取得し、該取得した第1および第2の検索語に基づいて前記記憶部内から該当する情報を検索するステップを含む、請求項10から15のいずれか1項に記載の情報提供方法。
【請求項17】
少なくとも前記利用目的に基づいて前記記憶部に格納された情報を分類する第3のステップをさらに含む、請求項10から16のいずれか1項に記載の情報提供方法。
【請求項18】
前記第3のステップは、分類すべき情報の内容および利用目的をそれぞれ推定可能な検索要求が提示されると、該提示された検索要求から推定される内容および利用目的に基づいて前記記憶部に格納された情報を分類するステップを含む、請求項17に記載の情報提供方法。
【請求項19】
内容から利用目的を推定可能な複数の情報が格納される記憶部を備えるコンピュータシステムにおいて用いられるプログラムであって、
前記複数の情報のそれぞれについて、該情報の内容を解析して利用目的を推定するとともに、該推定した利用目的を該情報と関連付けて前記記憶部に格納する第1の処理と、
検索すべき情報の内容および利用目的をそれぞれ推定可能な検索要求が提示されると、該提示された検索要求に関連する内容および利用目的を持つ情報を前記記憶部から検索する第2の処理とをコンピュータに実行させるプログラム。
【請求項20】
前第1の処理は、用言表現に基づいて利用目的を判断する処理を含む、請求項19に記載のプログラム。
【請求項21】
前記第1の処理は、語彙に関する情報が格納された語彙辞書データベースを用いて情報の内容に含まれる単語を判断するとともに、前記語彙辞書データベースに格納された語彙がどのような利用目的にあたるかの概念情報が格納された利用目的辞書データベースを参照して前記単語の利用目的を推定する処理を含む、請求項19に記載のプログラム。
【請求項22】
前記第1の処理は、前記複数の情報の中に、第1の情報の少なくとも一部の内容を参照した参照文を含む第2の情報がある場合に、該第2の情報に含まれる参照文の内容を解析して前記第1の情報の利用目的を推定し、該推定した利用目的を示す属性を前記第1の情報と関連付けて前記記憶部に格納する処理を含む、請求項19に記載のプログラム。
【請求項23】
前記第1の処理は、前記複数の情報の中に、第1の情報の少なくとも一部の内容を参照した第2の情報がある場合に、該第2の情報の内容を解析して該第2の情報の利用目的を推定し、該推定した利用目的を示す属性を前記第1および第2の情報と関連付けて前記記憶部に格納する処理を含む、請求項19に記載のプログラム。
【請求項24】
前記第1の情報が、外部から入力された入力情報であり、前記第2の情報が、外部へ出力された出力情報である、請求項22または23に記載のプログラム。
【請求項25】
前記第2の処理は、前記検索要求の内容から、情報の内容を検索するための第1の検索語と、利用目的を検索するための第2の検索語をそれぞれ取得し、該取得した第1および第2の検索語に基づいて前記記憶部内から該当する情報を検索する処理を含む、請求項19から24のいずれか1項に記載のプログラム。
【請求項26】
少なくとも前記利用目的に基づいて前記記憶部に格納された情報を分類する第3の処理を前記コンピュータにさらに実行させる、請求項19から25のいずれか1項に記載のプログラム。
【請求項27】
前記第3の処理は、分類すべき情報の内容および利用目的をそれぞれ推定可能な検索要求が提示されると、該提示された検索要求から推定される内容および利用目的に基づいて前記記憶部に格納された情報を分類する処理を含む、請求項26に記載のプログラム。
【請求項1】
内容から利用目的を推定可能な複数の情報が格納される記憶部と、
前記複数の情報のそれぞれについて、該情報の内容を解析して利用目的を推定するとともに、該推定した利用目的を該情報と関連付けて前記記憶部に格納する利用目的推定部と、
検索すべき情報の内容および利用目的をそれぞれ推定可能な検索要求が提示されると、該提示された検索要求に関連する内容および利用目的を持つ情報を前記記憶部から検索する検索部とを有する情報提供装置。
【請求項2】
前記利用目的推定部は、用言表現に基づいて利用目的を判断する、請求項1に記載の情報提供装置。
【請求項3】
語彙に関する情報が格納された語彙辞書データベースと、
前記語彙辞書データベースに格納された語彙がどのような利用目的にあたるかの概念情報が格納された利用目的辞書データベースとをさらに有し、
前記利用目的推定部は、前記語彙辞書データベースを用いて情報の内容に含まれる単語を判断するとともに、該単語に基づいて前記利用目的辞書データベースから利用目的を推定する、請求項1に記載の情報提供装置。
【請求項4】
前記複数の情報は、第1の情報と、該第1の情報の少なくとも一部の内容を参照した参照文を含む第2の情報とを有し、
前記利用目的推定部は、前記第2の情報に含まれる参照文の内容を解析して前記第1の情報の利用目的を推定し、該推定した利用目的を示す属性を前記第1の情報と関連付けて前記記憶部に格納する、請求項1に記載の情報提供装置。
【請求項5】
前記複数の情報は、第1の情報と、該第1の情報の少なくとも一部の内容を参照した第2の情報とを有し、
前記利用目的推定部は、前記第2の情報の内容を解析して該第2の情報の利用目的を推定し、該推定した利用目的を示す属性を前記第1および第2の情報と関連付けて前記記憶部に格納する、請求項1に記載の情報提供装置。
【請求項6】
前記第1の情報が、外部から入力された入力情報であり、前記第2の情報が、外部へ出力された出力情報である、請求項4または5に記載の情報提供装置。
【請求項7】
前記検索部は、前記検索要求の内容から、情報の内容を検索するための第1の検索語と、利用目的を検索するための第2の検索語とをそれぞれ取得し、該取得した第1および第2の検索語に基づいて前記記憶部内から該当する情報を検索する、請求項1から6のいずれか1項に記載の情報提供装置。
【請求項8】
少なくとも前記利用目的に基づいて前記記憶部に格納された情報を分類する分類部をさらに有する、請求項1から7のいずれか1項に記載の情報提供装置。
【請求項9】
前記分類部は、分類すべき情報の内容および利用目的をそれぞれ推定可能な検索要求が提示されると、該提示された検索要求から推定される内容および利用目的に基づいて前記記憶部に格納された情報を分類し、該分類結果を外部に出力する、請求項8に記載の情報提供装置。
【請求項10】
内容から利用目的を推定可能な複数の情報が格納される記憶部を備えるコンピュータシステムにおいて行われる情報提供方法であって、
コンピュータが行うステップとして、
前記複数の情報のそれぞれについて、該情報の内容を解析して利用目的を推定するとともに、該推定した利用目的を該情報と関連付けて前記記憶部に格納する第1のステップと、
検索すべき情報の内容および利用目的をそれぞれ推定可能な検索要求が提示されると、該提示された検索要求に関連する内容および利用目的を持つ情報を前記記憶部から検索する第2のステップとを含む情報提供方法。
【請求項11】
前第1のステップは、用言表現に基づいて利用目的を判断するステップを含む、請求項10に記載の情報提供方法。
【請求項12】
前記第1のステップは、語彙に関する情報が格納された語彙辞書データベースを用いて情報の内容に含まれる単語を判断するとともに、前記語彙辞書データベースに格納された語彙がどのような利用目的にあたるかの概念情報が格納された利用目的辞書データベースを参照して前記単語の利用目的を推定するステップを含む、請求項10に記載の情報提供方法。
【請求項13】
前記第1のステップは、前記複数の情報の中に、第1の情報の少なくとも一部の内容を参照した参照文を含む第2の情報がある場合に、該第2の情報に含まれる参照文の内容を解析して前記第1の情報の利用目的を推定し、該推定した利用目的を示す属性を前記第1の情報と関連付けて前記記憶部に格納するステップを含む、請求項10に記載の情報提供方法。
【請求項14】
前記第1のステップは、前記複数の情報の中に、第1の情報の少なくとも一部の内容を参照した第2の情報がある場合に、該第2の情報の内容を解析して該第2の情報の利用目的を推定し、該推定した利用目的を示す属性を前記第1および第2の情報と関連付けて前記記憶部に格納するステップを含む、請求項10に記載の情報提供方法。
【請求項15】
前記第1の情報が、外部から入力された入力情報であり、前記第2の情報が、外部へ出力された出力情報である、請求項13または14に記載の情報提供方法。
【請求項16】
前記第2のステップは、前記検索要求の内容から、情報の内容を検索するための第1の検索語と、利用目的を検索するための第2の検索語をそれぞれ取得し、該取得した第1および第2の検索語に基づいて前記記憶部内から該当する情報を検索するステップを含む、請求項10から15のいずれか1項に記載の情報提供方法。
【請求項17】
少なくとも前記利用目的に基づいて前記記憶部に格納された情報を分類する第3のステップをさらに含む、請求項10から16のいずれか1項に記載の情報提供方法。
【請求項18】
前記第3のステップは、分類すべき情報の内容および利用目的をそれぞれ推定可能な検索要求が提示されると、該提示された検索要求から推定される内容および利用目的に基づいて前記記憶部に格納された情報を分類するステップを含む、請求項17に記載の情報提供方法。
【請求項19】
内容から利用目的を推定可能な複数の情報が格納される記憶部を備えるコンピュータシステムにおいて用いられるプログラムであって、
前記複数の情報のそれぞれについて、該情報の内容を解析して利用目的を推定するとともに、該推定した利用目的を該情報と関連付けて前記記憶部に格納する第1の処理と、
検索すべき情報の内容および利用目的をそれぞれ推定可能な検索要求が提示されると、該提示された検索要求に関連する内容および利用目的を持つ情報を前記記憶部から検索する第2の処理とをコンピュータに実行させるプログラム。
【請求項20】
前第1の処理は、用言表現に基づいて利用目的を判断する処理を含む、請求項19に記載のプログラム。
【請求項21】
前記第1の処理は、語彙に関する情報が格納された語彙辞書データベースを用いて情報の内容に含まれる単語を判断するとともに、前記語彙辞書データベースに格納された語彙がどのような利用目的にあたるかの概念情報が格納された利用目的辞書データベースを参照して前記単語の利用目的を推定する処理を含む、請求項19に記載のプログラム。
【請求項22】
前記第1の処理は、前記複数の情報の中に、第1の情報の少なくとも一部の内容を参照した参照文を含む第2の情報がある場合に、該第2の情報に含まれる参照文の内容を解析して前記第1の情報の利用目的を推定し、該推定した利用目的を示す属性を前記第1の情報と関連付けて前記記憶部に格納する処理を含む、請求項19に記載のプログラム。
【請求項23】
前記第1の処理は、前記複数の情報の中に、第1の情報の少なくとも一部の内容を参照した第2の情報がある場合に、該第2の情報の内容を解析して該第2の情報の利用目的を推定し、該推定した利用目的を示す属性を前記第1および第2の情報と関連付けて前記記憶部に格納する処理を含む、請求項19に記載のプログラム。
【請求項24】
前記第1の情報が、外部から入力された入力情報であり、前記第2の情報が、外部へ出力された出力情報である、請求項22または23に記載のプログラム。
【請求項25】
前記第2の処理は、前記検索要求の内容から、情報の内容を検索するための第1の検索語と、利用目的を検索するための第2の検索語をそれぞれ取得し、該取得した第1および第2の検索語に基づいて前記記憶部内から該当する情報を検索する処理を含む、請求項19から24のいずれか1項に記載のプログラム。
【請求項26】
少なくとも前記利用目的に基づいて前記記憶部に格納された情報を分類する第3の処理を前記コンピュータにさらに実行させる、請求項19から25のいずれか1項に記載のプログラム。
【請求項27】
前記第3の処理は、分類すべき情報の内容および利用目的をそれぞれ推定可能な検索要求が提示されると、該提示された検索要求から推定される内容および利用目的に基づいて前記記憶部に格納された情報を分類する処理を含む、請求項26に記載のプログラム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【公開番号】特開2007−18342(P2007−18342A)
【公開日】平成19年1月25日(2007.1.25)
【国際特許分類】
【出願番号】特願2005−200214(P2005−200214)
【出願日】平成17年7月8日(2005.7.8)
【出願人】(000004237)日本電気株式会社 (19,353)
【Fターム(参考)】
【公開日】平成19年1月25日(2007.1.25)
【国際特許分類】
【出願日】平成17年7月8日(2005.7.8)
【出願人】(000004237)日本電気株式会社 (19,353)
【Fターム(参考)】
[ Back to top ]