説明

情報システム

【課題】データを登録する際の操作員の作業量を低減しつつ、データの質を考慮した的確な検索を実現する、情報システムを提供する。
【解決手段】情報システム1は、データを登録するための情報管理登録システム80〜85を備える。情報管理登録システム80〜85は、内容データ26bの登録時に、その内容データ26bの質を表す情報源属性データ26aを自動的に付加する。情報源属性データ26aは、情報源の種類、承認の有無、作成部門、社内/社外、作成日時、メールの発信者、発信サイト、および、内容の信頼度レベルの各項目について指定されるデータを含む。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報システムに関し、とくにデータの質を決定して記憶する情報システムに関する。
【背景技術】
【0002】
コンテンツ管理、ドキュメント管理などの情報管理/検索システムでは、複数のさまざまな情報源から、質の異なる情報が登録され格納される。例えば、登録される文書が承認されたものであるかどうか、社内で作成されたものか社外で作成されたものか、文書として作成されたものか、メールデータか、あるいはWebサーバからの情報か、といったようなものである。
【0003】
従来の情報システムでは、情報検索を行なう時、これらの質の異なるデータが一様に検索対象となって検索処理が実行され、単に指定したキーワードに対するヒット率が高い順に検索結果が表示されるものが知られている。これらの検索結果には、個々のデータの出所、すなわち情報源に関する情報や、データの質が反映されていないため、これらを考慮するには、検索実行者が目視で判断する必要がある。この結果、求める情報を見落としたり、求める情報の質とは異なる質のデータしか得られなかったりし、的確な検索が実現できない可能性があった。
【0004】
このため、データを検索システムに登録する際に、データに関連付けて登録者がデータの質を決定して登録する方法が知られている。たとえば特許文献1においては、データの提供者が、そのデータの質を、情報空間上の重み付き領域として設定する方法が記載されている。
【0005】
【特許文献1】特開平9−305624号公報
【発明の開示】
【発明が解決しようとする課題】
【0006】
しかしながら、従来の情報システムでは、データの質を考慮した検索を実現するために、データを登録する際に操作員の作業量が大きくなってしまうという問題があった。たとえば特許文献1に記載される方法では、情報流通システムには重みを決定する機能がなく、情報提供者が入力する値を受け取って記憶するだけである。このため、情報提供者が重み付き領域の各単位格子について逐一重みを設定する必要があり、情報提供者の作業量が増大する。
【0007】
この発明は、このような問題点を解決するためになされたものであり、データを登録する際の操作員の作業量を低減しつつ、データの質を考慮した的確な検索を実現する、情報システムを提供することを目的とする。
【課題を解決するための手段】
【0008】
上述の問題点を解決するため、この発明に係る情報システムは、情報を格納する記憶手段と、外部のコンピュータによって提供されるデータを受け取るとともに、データの質を表す複数の項目の少なくとも1つについて、外部のコンピュータに応じて値を決定する入力部と、データおよび決定された値を互いに関連付けて、記憶手段に格納する登録部と
を有するものである。
【0009】
少なくとも1つのデータは、組織によって作成されるものであり、入力部は、複数の項目の少なくとも1つについて、組織に応じて値を決定してもよい。
入力部は、複数の項目の少なくとも1つについて、データの作成日時に応じて値を決定してもよい。
少なくとも1つのデータは、電子メールであり、入力部は、複数の項目の少なくとも1つについて、電子メールの発信元であるメールアドレスに応じて値を決定してもよい。
少なくとも1つのデータは、HTMLファイルであり、入力部は、複数の項目の少なくとも1つについて、ネットワーク上においてHTMLファイルが格納される場所に応じて値を決定してもよい。
【0010】
情報システムは、外部から入力される条件に基づいて、複数のデータを検索する内容検索部を有し、さらに、検索について、検索に関連する環境を表す検索属性を生成するログイン処理部と、属性類似度計算部であって、属性類似度計算部は、1つのデータを表す数値の組である属性ベクトルを生成し、属性ベクトルは、複数の項目について決定された値と、検索属性とに基づいて、複数のデータのそれぞれについて生成されるものであり、属性類似度計算部は、外部から入力される条件に基づいて、条件ベクトルを生成し、属性類似度計算部は、複数のデータのそれぞれについて、属性ベクトルと、条件ベクトルとの類似度を算出する属性類似度計算部とを有してもよい。
環境を表す検索属性は、検索の実行者に関連する値と、検索が実行される日時に関連する値とを含んでもよい。
類似度は、属性ベクトルと条件ベクトルとの内積であってもよい。
【0011】
外部から入力される条件は、文字列に関する条件を含み、内容検索部は、データのうち文字列に関する条件に合致するものを判別し、内容検索部は、文字列と、文字列に関する条件に合致するデータとの一致度を算出し、情報システムは、さらに、文字列に関する条件に合致する各データについて、一致度と類似度とに基づいてスコアを算出する、検索結果出力部を有してもよい。
外部から入力される条件は、文字列に関する条件を含み、内容検索部は、データのうち文字列に関する条件に合致するものを判別し、内容検索部は、文字列と、文字列に関する条件に合致するデータとの一致度を算出し、情報システムは、さらに、一致度を1つの軸とし、類似度を別の1つの軸とする座標空間において、文字列に関する条件に合致する各データについて、そのデータに関する一致度および類似度に対応する位置を示す検索結果出力部を有してもよい。
【発明の効果】
【0012】
この発明によれば、情報システムは、外部の情報源であるコンピュータによって提供されるデータを登録する際に、そのデータの質を表す項目に指定される値を、データの情報源に応じて自動的に決定し、この値とデータとを関連付けて格納するので、データを登録する際の操作員の作業量を低減しつつ、データの質を考慮した的確な検索を実現することができる。
【発明を実施するための最良の形態】
【0013】
以下、この発明の実施の形態を添付図面に基づいて説明する。
実施の形態1.
図1は、本発明に係る情報システム1を含む構成を示す。情報システム1は、様々なデータを格納するために使用されるデータベースシステムである統合情報管理データベースシステム20と、統合情報管理データベースシステム20に格納されるデータの検索を、外部から入力される条件に基づいて行うために使用される情報管理検索システム40と、統合情報管理データベースシステム20に格納されるデータのメンテナンスを行うために使用されるシステムである情報源属性修正サブシステム60および重み定義修正サブシステム70と、統合情報管理データベースシステム20にデータを登録するために使用される情報管理登録システム80〜85とを備える。
ここで、情報源属性修正サブシステム60および重み定義修正サブシステム70は、情報管理メンテナンスシステム2を構成する。
【0014】
情報システム1は、様々な外部の情報源と通信可能に接続されている。外部の情報源は、情報システム1が設置される会社の社内の情報源と、社外の情報源とを含む。
社内の情報源は、社員が文書を作成するために使用する文書作成システム102、文書作成システム102で作成された文書に対して管理職の社員が承認を与えるために使用する文書承認システム104、社員が共有するデータを管理する共有ファイルサーバ106、社員の電子メールを管理するメールサーバ108、および、社内イントラネットを管理するイントラネットWebサーバ110を含む。また、社外の情報源は複数の社外情報源112を含む。社外情報源112は、たとえばインターネット上のWebサーバである。
ここで、メールサーバ108は、例えばSMTPプロトコルおよびPOP3プロトコルに従うデータの送受信、すなわち電子メールの送受信を行うものである。または、その他のプロトコルに従うデータの送受信であってもよい。また、イントラネットWebサーバ110および社外情報源112は、例えばHTTPプロトコルに従うデータの送受信、すなわちHTMLファイルをはじめとした、様々な形式のファイルの送受信を行うものである。または、その他のプロトコルに従うデータの送受信であってもよい。
【0015】
統合情報管理データベースシステム20、情報管理検索システム40、情報源属性修正サブシステム60、重み定義修正サブシステム70、情報管理登録システム80〜85、文書作成システム102、文書承認システム104、共有ファイルサーバ106、メールサーバ108、イントラネットWebサーバ110、および社外情報源112はそれぞれ、周知の構成を有するコンピュータであり、演算手段であるCPU、情報を格納する記憶手段であるメモリおよびHDD(ハードディスクドライブ)、入力装置であるキーボードおよびマウス、出力装置であるディスプレイおよびプリンタ、通信ネットワークに対する入力装置と出力装置とを兼ねるネットワークインタフェースを備える。なお、本明細書において、これらの入力装置および出力装置をまとめて入出力装置と称することがある。
【0016】
これらのコンピュータは互いに通信可能に接続される。統合情報管理データベースシステム20と、情報管理検索システム40、情報源属性修正サブシステム60、重み定義修正サブシステム70、および情報管理登録システム80〜85とは、LAN(ローカルエリアネットワーク)を介して互いに通信可能である。共有ファイルサーバ106、メールサーバ108、およびイントラネットWebサーバ110は、LANを介して、それぞれ対応する情報管理登録システム82、83、および84と通信可能である。
【0017】
2台の文書作成システム102のうち1台は、対応する情報管理登録システム81と通信可能である。また、他の1台は、文書承認システム104と通信可能であり、文書承認システム104は、対応する情報管理登録システム80と通信可能である。
また、社外情報源112は、公衆通信ネットワークを介して、複数の社外情報源112すべてに一台で対応する情報管理登録システム85と通信可能である。
【0018】
図2は、統合情報管理データベースシステム20の記憶手段の構成を示す図である。統合情報管理データベースシステム20の記憶手段は、データ記憶部22および重み定義記憶部24を含む。
データ記憶部22には、情報システム1において検索される対象となるデータである、データの組26が複数格納される。データの組26は、上記の様々な外部の情報源から得られる内容データ26bと、内容データ26bの質、すなわち本文に含まれる情報以外の情報を表す複数の項目についての値を含む情報源属性データ26aとからなる。
内容データ26bはテキストデータを含むものであり、内容データ26bのうち任意の文字列が含まれるものを判別する、いわゆるキーワード検索を行うことができる。また、内容データ26bは、テキストデータ以外のデータ、たとえば画像・音声等のデータを含んでもよい。
重み定義記憶部24には、情報源属性データ26aに含まれる複数の属性のそれぞれについて重みを定義するためのデータを含む、重み定義テーブル28が格納される。
【0019】
図3に、情報源属性データ26aの内容を示す。情報源属性データ26aは、関連する内容データ26bに対して、情報源の種類、承認の有無、作成部門、社内/社外、作成日時、メールの発信者、発信サイト、および、内容の信頼度レベルの各項目について指定されるデータを含む。
【0020】
情報源の種類を表す項目は、すべての内容データ26bについて指定され、その内容データ26bが図1のどの情報源から得られたものかが指定される。すなわち、この項目について指定される値は、内容データ26bに本文またはその他の情報として含まれる、テキストデータまたはその他の形式のデータとは無関係である。文書作成システム102、共有ファイルサーバ106、メールサーバ108、イントラネットWebサーバ110、および社外情報源112から得られた内容データ26bに対して、それぞれ、「作成文書」、「共有ファイル」、「メール」、「イントラネット」、および「社外」を表す値が指定される。なお、文書作成システム102から得られた内容データ26bについては、文書承認システム104を経由して得られたものも、これを経由せずに得られたものも、すべて「作成文書」を表す値が指定される。
【0021】
承認の有無を表す項目は、文書作成システム102から得られた内容データ26bについてのみ指定され、その内容データ26bが文書承認システム104を経由して得られたもの、すなわち管理職の社員の承認を得たものである場合には「承認済み」を表す値が指定され、文書承認システム104を経由せずに得られたもの、すなわち管理職の社員の承認を得ていないものである場合には「承認なし」を表す値が指定される。すなわち、この項目について指定される値は、内容データ26bに本文またはその他の情報として含まれる、テキストデータまたはその他の形式のデータとは無関係である。
【0022】
作成部門を表す項目は、文書作成システム102から得られた内容データ26bについてのみ指定され、その内容データ26bを作成した組織である部門の名称が指定される。 この項目に指定される値は、内容データ26bに本文として含まれるテキストデータとは独立して、付帯情報としてあらかじめ指定されている、その内容データ26bを作成した部門を表すデータによって決定される。
【0023】
社内/社外を表す項目は、すべての内容データ26bについて指定され、その内容データ26bが社内あるいは社外いずれの情報源から得られたものかが指定される。すなわち、この項目について指定される値は、内容データ26bに本文またはその他の情報として含まれる、テキストデータまたはその他の形式のデータとは無関係である。文書作成システム102、文書承認システム104、共有ファイルサーバ106、メールサーバ108、またはイントラネットWebサーバ110から得られたものである場合には「社内」を表す値が指定され、社外情報源112から得られたものである場合には「社外」を表す値が指定される。
【0024】
作成日時を表す項目は、すべての内容データ26bについて指定され、その内容データ26bが作成されたか、最後に更新されたか、または電子メールとして発信された日時が指定される。
この項目に指定される値は、内容データ26bに本文として含まれるテキストデータとは独立して、付帯情報としてあらかじめ指定されている、日時を表すデータによって決定される。
この日時を表すデータは、内容データ26bがメールサーバ108から得られたものである場合は、その電子メールの「Date:」フィールドに含まれる日時が自動的に指定されるものである。
また、内容データ26bがメールサーバ108以外の情報源から得られたものである場合は、たとえば内容データ26bが作成または更新された際に、その作成または更新の作業に使用されたコンピュータが、その作業が行われた日時として指定した値を使用するものである。ただし、この日時は内容データ26bの作成者が任意に指定するものであってもよい。
【0025】
メールの発信者を表す項目は、電子メールとしてのデータ、すなわちメールサーバ108から得られた内容データ26bについてのみ指定され、その電子メールの発信元であるメールアドレスが指定される。
この項目に指定される値は、内容データ26bに本文(いわゆるBody)として含まれるテキストデータとは独立して、付帯情報として「From:」フィールドに指定されている、その電子メールの発信者によって決定される。
【0026】
発信サイトを表す項目は、HTMLファイルとしてのデータ、すなわちイントラネットWebサーバ110または社外情報源112から得られた内容データ26bについてのみ指定され、ネットワーク上において該当のHTMLファイルが格納される場所を示す情報、たとえばURLが指定される。すなわち、この項目について指定される値は、内容データ26bに本文またはその他の情報として含まれる、テキストデータまたはその他の形式のデータとは無関係である。
【0027】
内容の信頼度レベルを表す項目は、すべての内容データ26bについて指定され、その内容データ26bに含まれる情報の信頼度を示す数値が、−1.0〜1.0の範囲から指定される。この信頼度は、後述するように、その内容データ26bが情報管理登録システム80〜85において処理される際に、操作員によって任意に指定されるものであるが、たとえば、内容データ26bが法律である場合にはその信頼度は高く、新聞記事である場合にはその信頼度はそれよりも低く、個人Webサイトの記載内容である場合にはその信頼度はさらに低い、という基準に従って指定される。
このように、この項目について指定される値は、内容データ26bに本文またはその他の情報として含まれる、テキストデータおよびその他の形式のデータに基づいて自動的に決定されるものではなく、操作員によって任意に入力されるものである。
【0028】
図4に、重み定義テーブル28の内容の例を示す。重み定義テーブル28は、情報源属性データ26aの各項目について、その指定内容に対して、信頼性ポイント、距離ポイント、および新鮮度ポイントのそれぞれについて付与される重みを定義するものである。
たとえば、ある内容データ26bに関連する情報源属性データ26aについて、情報源の種類を表す項目に「共有ファイル」を表す値が指定されているとする。この場合には、その情報源属性データ26aのこの項目に、信頼性ポイントとして0.5が、また距離ポイントとして0.5が、重みとして付与される。
なお、この項目について、新鮮度ポイントの欄には「−」のみが表記されている。この「−」表記は、その項目については該当のポイントが定義されていない(すなわち、NULL値が指定されている)ことを意味する。
承認の有無を表す項目、および、社内/社外を表す項目については、情報源の種類を表す項目と同様である。
【0029】
作成部門を表す項目については、指定された値、すなわち関連する内容データ26bを作成した部門の名称が、検索者が属する部門の名称と一致した場合には1.0の距離ポイントが、そうでない場合には−1.0の距離ポイントが、重みとして付与される。なお、検索者が属する部門(検索者部門)は、検索が実行される際に得られるものであるが、これについては図6の説明において後述する。
【0030】
作成日時を表す項目については、指定された値に含まれる日付と、検索が実行された日付との隔たりが基準日数以内かどうかによって、付与される重みが異なる。この隔たりが、基準N1、たとえば3日以内である場合には1.0が付与される。また、基準N1超基準N2以内、すなわち基準N1を超えるが基準N2以内である場合、たとえば3日超5日以内、すなわち3日を超えるが5日以内である場合には0.8が付与される。これは隔たりが4日または5日である場合に相当する。以下同様にして、基準N10超までの重みが定義される。なお簡明のため基準N3〜基準N9については図示を省略する。
【0031】
メールの発信者を表す項目については、指定された値であるメールアドレスが定義されたメールアドレスのいずれかと一致するかどうか、および、指定されたメールアドレスが定義されたドメインのいずれかに属するものであるかどうかによって、付与される重みが異なる。それぞれ、該当するものが定義されていない場合には、「該当なし」の行に定義される重み、すなわちこの例では0が付与される。
【0032】
発信サイトを表す項目については、指定された値であるURLが、定義されたURL、定義されたIPアドレス、および定義されたドメインのいずれかと一致するか、またはいずれかに属するものであるかどうかによって、付与される重みが異なる。
内容の信頼度レベルを表す項目については、指定された値である−1.0〜1.0の範囲の数値が、そのまま信頼性ポイントの重みとして付与される。
【0033】
図5〜図7を用いて、情報管理登録システム80〜85、情報管理検索システム40、情報源属性修正サブシステム60、および重み定義修正サブシステム70の構成を説明する。
【0034】
図5は、情報管理登録システム80の構成を示す図である。情報管理登録システム80のCPUは、記憶手段に格納されるプログラム(図示せず)を実行することによって、入力部80a、登録部91、および修正部92として機能する。
入力部80aは、外部の情報源、すなわち図1における文書承認システム104から、統合情報管理データベースシステム20に登録するためのデータを取得する機能を有する。また、入力部80aは、取得したデータから、図2の内容データ26bに対応する登録前内容データ94と、図2の情報源属性データ26aに対応する登録前情報源属性データ95とを作成し、互いに関連付けて情報管理登録システム80の記憶手段に格納する機能を有する。
登録部91は、記憶手段から、関連付けられた登録前内容データ94と登録前情報源属性データ95とを読み込み、これを互いに関連付けられたものとして統合情報管理データベースシステム20に登録するために送信する機能を有する。
修正部92は、登録前情報源属性データ95を記憶手段から読み込んで入出力装置93への出力(画面表示等)として提供する機能と、入出力装置93からの入力を受け取り、その内容を登録前情報源属性データ95に反映する機能とを有する。
【0035】
情報管理登録システム81〜85も、図5の情報管理登録システム80と同様の構成を有する。ただし、外部の情報源からのデータを受け取る入力部は、文書承認システム104に対応する入力部80aとは異なり、それぞれ対応する外部の情報源からデータを受け取るように適合した入力部81a〜85a(後の説明のために参照番号を付するが、図示はされない)である。
【0036】
図6は、情報管理検索システム40の構成を示す図である。情報管理検索システム40のCPUは、記憶手段に格納されるプログラム(図示せず)を実行することによって、ログイン処理部41、検索条件入力部42、内容検索部43、属性類似度計算部44、および検索結果出力部45として機能する。
【0037】
ログイン処理部41は、入出力装置47から入力される検索者のログイン操作に応じて、検索に関連する環境を表す検索属性50を生成し、記憶手段に格納する機能を有する。検索属性50には、検索に関連する環境として、検索実行者のログイン名である検索者名50a、検索者部門50b、および、検索が実行される日時である検索実行日50cが含まれる。なお、図示しないが、すべての検索者名50aについて、対応する検索者部門50bが関連付けられて記憶手段に格納されており、ログイン処理部41はこれを使用して検索者部門50bを決定するものである。
【0038】
検索条件入力部42は、入出力装置47から入力される検索条件を受け取り、この検索条件に含まれる文字列に関する条件、たとえばキーワード等を内容条件51として、また、検索条件に含まれる情報源属性データ26aに関する条件を情報源属性条件52として、それぞれ記憶手段に格納する機能を有する。ここで、内容条件51は、キーワードの他に、周知の検索条件を含んでもよい。
【0039】
内容検索部43は、内容条件51を読み込み、これに基づいて内容データ26bをデータ記憶部22内で検索するために、統合情報管理データベースシステム20と通信を行う機能を有する。
また、内容検索部43は、統合情報管理データベースシステム20との通信によって得られた内容検索の結果を、内容検索結果53として記憶手段に格納する機能を有する。この内容検索結果53には、検索の結果、内容条件51に合致するものとして判別され抽出された内容データ26bのそれぞれに対応する、情報源属性データ26aを含む検索結果53aが含まれる。また、内容検索結果53には、抽出された内容データ26bのそれぞれと内容条件51との内容の一致状況を表す内容一致度53bも含まれる。内容一致度53bは、たとえば0〜100の範囲の整数からなる。この内容一致度53bは、たとえば、内容条件51に含まれるキーワードが内容データ26bに現れる回数に基づいて算出されるが、他の規則によって算出されてもよい。
たとえば、内容一致度53bは、内容データ26bがOCRにより取得したデータである場合に、内容データ26bのOCRによる文字認識結果から評価されたポイントに基づいて算出されてもよい。
たとえば、内容一致度53bは、内容条件51に含まれるキーワードと内容データ26bとの、概念的な意味合いによる一致度であってもよい。
【0040】
属性類似度計算部44は、重み定義記憶部24に格納される重み定義テーブル28を読み込むために、統合情報管理データベースシステム20と通信する機能を有する。また、統合情報管理データベースシステム20との通信によって得られた重み定義テーブル28と、検索結果53aに含まれる情報源属性データ26aと、検索者部門50bと、検索実行日50cと、情報源属性条件52とに基づき、属性類似度54を計算し、これを記憶手段に格納する機能を有する。属性類似度54は、後述されるように、−3.0〜3.0の範囲の数値である。
【0041】
検索結果出力部45は、内容検索結果53に含まれる内容一致度53bと、属性類似度54とを読み込み、これらを出力装置48に出力する機能を有する。
【0042】
図7は、情報管理メンテナンスシステム2に含まれる、情報源属性修正サブシステム60および重み定義修正サブシステム70の構成を示す図である。
情報源属性修正サブシステム60のCPUは、記憶手段に格納されるプログラム(図示せず)を実行することによって、データ識別情報入力部61、情報源属性入力部62、情報源属性登録部63、および情報源属性修正部64として機能する。
【0043】
データ識別情報入力部61は、統合情報管理データベースシステム20のデータ記憶部22に格納される情報源属性データ26aのうち1つを特定するために操作員が入力するデータを、入出力装置66から受け取り、データ識別情報67として記憶手段に格納する機能を有する。この、情報源属性データ26aを特定するためのデータは、たとえば情報源属性データ26aに固有のID、内容データ26bに固有のID、または内容データ26bに含まれるタイトルである。
【0044】
情報源属性入力部62は、データ識別情報67を読み込み、これと合致する情報源属性データ26aを特定するとともにこれを読み込むために、統合情報管理データベースシステム20と通信する機能を有する。また、情報源属性入力部62は、読み込んだ情報源属性データ26aのうちデータ識別情報67と合致するものを、記憶手段に修正中情報源属性データ68として格納する機能を有する。
【0045】
情報源属性登録部63は、修正中情報源属性データ68を読み込み、これによって統合情報管理データベースシステム20のデータ記憶部22に格納される、該当する情報源属性データ26aを更新登録するために、統合情報管理データベースシステム20と通信する機能を有する。
【0046】
情報源属性修正部64は、入出力装置66からの入力を受け取り、その内容に応じて、修正中情報源属性データ68の読み込み、内容の変更、および入出力装置66への出力(画面表示等)を行う機能を有する。
【0047】
重み定義修正サブシステム70のCPUは、記憶手段に格納されるプログラム(図示せず)を実行することによって、重み定義入力部72、重み定義登録部73、および重み定義修正部74として機能する。
【0048】
重み定義入力部72は、重み定義記憶部24に格納される重み定義テーブル28を読み込むために、統合情報管理データベースシステム20と通信する機能を有する。また、重み定義入力部72は、読み込んだ重み定義テーブル28を、記憶手段に修正中重み定義テーブル78として格納する機能を有する。
重み定義登録部73は、修正中重み定義テーブル78を読み込み、これによって統合情報管理データベースシステム20の重み定義記憶部24に格納される重み定義テーブル28を更新登録するために、統合情報管理データベースシステム20と通信する機能を有する。
重み定義修正部74は、入出力装置76からの入力を受け取り、その内容に応じて、修正中重み定義テーブル78の読み込み、内容の変更、および入出力装置76への出力(画面表示等)を行う機能を有する。
【0049】
以上のように構成される情報システム1における処理の流れを、図8〜図11のフローチャートおよび図12〜16を用いて説明する。
図8は、図5に示す構成を有する情報管理登録システム80の処理の流れを示す。
まず情報管理登録システム80の入力部80aは、外部の情報源である文書承認システム104から、登録用のデータを取得し、これを登録前内容データ94として記憶手段に格納する(ステップS10)。
【0050】
次に入力部80aは、取得した登録用のデータに基づいて、統合情報管理データベースシステム20の情報源属性データ26aに対応する登録前情報源属性データ95を生成し、これを記憶手段に格納する(ステップS11)。
図12は、ステップS11における登録前情報源属性データ95の生成方式を示す。入力部80aは、登録前情報源属性データ95の内容を、図12に示す表の「入力部80a」の列に従って決定し、生成する。情報源の種類を表す項目には「作成文書」を表す値が指定され、承認の有無を表す項目には「承認済み」を表す値が指定され、社内/社外を表す項目には「社内」を表す値が指定される。これらはそれぞれ、情報管理登録システム80の受け取る登録用データが、文書作成システム102において作成された作成文書であり、文書承認システム104において承認を受けた文書であり、社内の情報源から得られたものであるということを意味する。
作成部門を表す項目には、データの作成者の属する部門である作成部門の名称が指定され、作成日時を表す項目には、内容データが作成された日時である作成日が指定される。なお、上記の作成部門の名称は、たとえば、まずデータの作成者のログイン名を取得し、そのログイン名を有する使用者が属する部門を検索することによって得られる。
また、情報管理登録システム80はメールまたはWebサーバを情報源とするものではないので、メールの発信者を表す項目および発信サイトを表す項目には値が指定されない(すなわち、NULL値が指定される)。これは図12において「−」という表記で示される。
なお、内容の信頼度レベルを表す項目については、入力部80aによるステップS11の処理において値は指定されない。
【0051】
上記は情報管理登録システム80における入力部80aの処理の流れであるが、情報管理登録システム81〜85においても、それぞれ対応する入力部81a〜85aが同様の処理を行う。ただし、ステップS11における登録前情報源属性データ95の生成方式は、図12に示すように、処理を行う入力部81a〜85aによって異なり、それぞれ指定される項目も異なる。とくに、情報源の種類、承認の有無、社内/社外を表す項目については、異なる外部の情報源に対しては指定される値が異なる。
【0052】
具体的には、情報源の種類を表す項目について、入力部80aおよび81aは「作成文書」を表す値を、入力部82aは「共有ファイル」を表す値を、入力部83aは「メール」を表す値を、入力部84aは「イントラネット」を表す値を、そして入力部85aは「社外」を表す値を、それぞれ指定する。
承認の有無を表す項目については、入力部80aは「承認済み」を表す値を、入力部81aは「承認なし」を表す値をそれぞれ指定するが、入力部82a〜85aは値を指定しない。
作成部門を表す項目については、入力部80aおよび81aは、その内容データ26bを作成した組織である部門の名称を指定するが、入力部82a〜85aは値を指定しない。
社内/社外を表す項目については、入力部80a〜84aは「社内」を表す値を、入力部85aは「社外」を表す値をそれぞれ指定する。
作成日時を表す項目については、入力部80aおよび81aはその内容データ26bが作成された日時を表す値を、入力部82a、84a、および85aはその内容データ26bが最後に更新された日時を表す値を、そして入力部83aはその内容データ26bに関連する電子メールが発信された日時を表す値を、それぞれ指定する。すなわち、作成後に更新されているデータについては、その更新日をもって作成日とみなし、メールについてはその発信日をもって作成日とみなす。
メールの発信者を表す項目については、入力部83aはその内容データ26bに関連する電子メールの発信元であるメールアドレスを指定するが、入力部80a〜82a、84a、および85aは値を指定しない。
発信サイトを表す項目については、入力部84aおよび85aは、その内容データ26bがネットワーク上において格納される場所を示す情報、たとえばURLを指定するが、入力部80a〜83aは値を指定しない。
内容の信頼度レベルを表す項目については、入力部80a〜85aのいずれも値を指定しない。
【0053】
次に、修正部92が、ステップS11において一部指定された登録前情報源属性データ95の修正を受け付け、これを登録前情報源属性データ95に反映する(ステップS12)これは、修正部92が、入出力装置93に修正画面として出力するとともに、この修正画面を使用して入出力装置93から入力される修正を受け付けることによってなされる。この修正は、該当の登録前内容データ94に対する、内容の信頼度レベルの指定を含む。この内容の信頼度レベルは、上述のように、−1.0〜1.0の範囲で操作員によって指定されるものである。
また、修正部92は、内容の信頼度レベルの指定以外にも、入出力装置93からの入力に応じて、入力部80aによって自動設定された登録前情報源属性データ95の内容を変更する。
【0054】
次に、登録部91が、登録前内容データ94および登録前情報源属性データ95を、互いに関連付けられたものとして統合情報管理データベースシステム20に向けて送信し、これらの登録を行う(ステップS13)。ステップS13において、統合情報管理データベースシステム20は、登録前内容データ94および登録前情報源属性データ95を受信し、それぞれを内容データ26bおよび情報源属性データ26aとして関連付けてデータの組26を生成し、これを記憶手段に格納する。
【0055】
図9は、図6に示す構成を有する情報管理検索システム40の処理の流れを示す。
まず、ログイン処理部41が検索属性50を生成して記憶手段に格納する(ステップS20)。ここで、ログイン処理部41は、入出力装置47から入力される検索実行者のログイン名を受け付けてこれを検索者名50aとし、該当の検索実行者が属する部門を取得して検索者部門50bとする。さらに、ログイン処理部41は、ステップS20中の一時点における時刻を取得し、その日付を検索実行日50cとする。
【0056】
次に、検索条件入力部42が、入出力装置47から入力される検索条件を取得し、内容条件51および情報源属性条件52として記憶手段に格納する(ステップS21)。
ここで、入出力装置47から入力される検索条件のうち、従来の検索において指定される条件、たとえば全文検索用のキーワード等に関する条件は内容条件51として、情報源属性データ26aに関する条件は情報源属性条件52として格納される。
図13は、情報源属性データ26aに関する条件を指定する処理のために入出力装置47に出力される、情報源属性条件の入力画面の例を示す。操作員は、この情報源属性入力画面において、信頼性ポイント、距離ポイント、新鮮度ポイントのそれぞれについて、どういった条件のデータを重視するかを、情報源属性条件52として指定する。情報源属性条件52は、信頼性ポイント、距離ポイント、新鮮度ポイントのそれぞれについて、たとえば−5〜5の範囲の整数として指定され、図13の例では、信頼性ポイントについて1、距離ポイントについて−1、新鮮度ポイントについて3がそれぞれ指定されている。なお、いずれかのポイントの条件について0が指定された場合は、その条件は検索の条件として加味されないことを意味する。
【0057】
次に、内容検索部43が、内容条件51に基づいて検索を実行する(ステップS22)。ここで、内容検索部43は、内容条件51を読み込んで統合情報管理データベースシステム20に送信するとともに、内容条件51に基づく情報源属性データ26aおよび内容データ26bの検索を統合情報管理データベースシステム20に依頼する。統合情報管理データベースシステム20は、その記憶手段に格納される周知の検索用プログラム(図示せず)を実行することにより、内容条件51を受信し、これに基づいて情報源属性データ26aおよび内容データ26bを検索し、さらにその結果を情報管理検索システム40の内容検索部43に送信する機能を有する。統合情報管理データベースシステム20から送信された検索結果は、内容検索部43によって受信され、内容検索結果53として記憶手段に格納される。内容検索結果53には、情報源属性データ26aを含むデータ一覧である検索結果53aと、内容条件51と内容データ26bとの内容の一致状況を0〜100の範囲で表す内容一致度53bとが含まれる。
【0058】
次に、属性類似度計算部44が、(信頼度ポイント,距離ポイント,新鮮度ポイント)として表される3次元ベクトルである、属性ベクトルを算出して生成する(ステップS23)。ステップS23は、検索結果53aに含まれる情報源属性データ26aのすべてに対し、繰り返し実行される。
ステップS23において、属性類似度計算部44は、統合情報管理データベースシステム20と通信して、図4に示す内容の重み定義テーブル28を取得する。さらに、属性類似度計算部44は、検索結果53aに含まれる情報源属性データ26aと、検索属性50に含まれる検索者部門50bおよび検索実行日50cとを取得する。
【0059】
信頼性ポイントの値は、該当の情報源属性データ26aにおいて各項目について指定された値に対応して、重み定義テーブル28で指定された重みを、相加平均したものである。ここで、重みが定義されていない項目(すなわちNULL値が指定されている項目)、たとえば信頼性ポイントに対する作成日時の項目は、相加平均には含めない。ただし、0の値が定義されている場合、たとえば距離ポイントに対して該当するドメインが定義されていない場合は、相加平均に含める。
たとえば、該当の情報源属性データ26aにおいて、情報源の種類は「作成文書」であり、承認の有無は「承認済み」であり、内容の信頼度レベルは「0.7」であり、その他の項目については値が指定されていないとする。この場合、情報源の種類の重みは1.0であり、承認の有無の重みは1.0であり、内容の信頼度レベルの重みは0.7であり、その他の項目については計算に含めないので、これらの相加平均は(1.0+1.0+0.7)/3=0.9となり、この値が属性ベクトルの成分としての信頼度ポイントとなる。
【0060】
なお、この例では、情報源の種類は「作成文書」である。このため、図3に関して上述したように、メールの発信者を表す項目および発信サイトを表す項目については値が定義されない。
同様にして距離ポイントおよび新鮮度ポイントが算出され、これによって(信頼度ポイント,距離ポイント,新鮮度ポイント)で表される属性ベクトルが算出される。
【0061】
なお、属性ベクトルの算出において、作成部門の重みを求める際には、該当の情報源属性データ26aにおける作成部門と、ステップS20で得られた検索者部門50bとが比較される。これらが一致していれば1.0が、一致していなければ−1.0が作成部門の重みとして与えられる。作成日時の重みについても、同様にして、該当の情報源属性データ26aにおける作成日と、ステップS20で得られた検索実行日50cとが比較され、その差に応じて作成日時の重みが与えられる。
【0062】
このように、ステップS23では、属性類似度計算部44が、情報源属性データ26aおよび対応する内容データ26bを表す数値の組である属性ベクトルを、情報源属性データ26aおよび検索属性50に基づいて生成する。
【0063】
次に、属性類似度計算部44が、属性ベクトルと同様の(信頼度ポイント,距離ポイント,新鮮度ポイント)として表される3次元ベクトルである、条件ベクトルを算出して生成する(ステップS24)。
ステップS24において、属性類似度計算部44は、情報源属性条件52を取得し、これに含まれる信頼度ポイント、距離ポイント、新鮮度ポイントの値をそれぞれ5で割ったものを、それぞれ条件ベクトルの成分とする。たとえば図13に示すように情報源属性条件52が指定されている場合、条件ベクトルの成分としての信頼度ポイントは1/5=0.2であり、距離ポイントは−1/5=−0.2であり、新鮮度ポイントは3/5=0.6であるので、条件ベクトルは(0.2,−0.2,0.6)となる。
なお、実施の形態1では各ポイントに関する入力値をそれぞれ5で割ったものを条件ベクトルの成分とするが、これは入力値をそのまま条件ベクトルの成分として使用するものであってもよいし、他の方法を用いて成分を算出してもよい。
【0064】
次に、属性類似度計算部44は、属性ベクトルと条件ベクトルとの類似度として、これらの内積である属性類似度54を算出し、これを記憶手段に格納する(ステップS25)。ステップS25は、ステップS23と同様に、検索結果53aに含まれる情報源属性データ26aのすべてに対し、繰り返し実行される。
たとえば、属性ベクトルが(0.9,0.8,0.2)であり、条件ベクトルが(0.2,−0.2,0.6)である場合、属性類似度54は0.9×0.2+0.8×(−0.2)+0.2×0.6=0.14となる。
検索結果53aに含まれる情報源属性データ26aのうち、対応する属性類似度54が大きいものは、その対応する内容データ26bを検索実行者が求める度合いが大きいものに相当すると解釈することができる。
【0065】
図14は、上記の属性ベクトル、条件ベクトル、および属性類似度54の関係を概念的に説明する図である。信頼性ポイント、距離ポイント、および新鮮度ポイントを軸とする3次元直交座標で表される空間に、太線で条件ベクトルが、細線で属性ベクトルA〜Cが、それぞれ示されている。
属性ベクトルAについては、その向きが条件ベクトルの向きに比較的近く、またその大きさも大きいので、条件ベクトルとの内積である属性類似度54が比較的大きくなる。これは、検索実行者が属性ベクトルAに対応する内容データ26bを求める度合いが大きいことを意味する。
属性ベクトルBおよびCについては、その向きが条件ベクトルの向きと比較的大きく異なるので、属性類似度54が比較的小さくなる。これは、検索実行者が属性ベクトルBおよびCにそれぞれ対応する内容データ26bを求める度合いがそれほど大きくないことを意味する。
【0066】
上記ステップS23〜S25において説明されるように、属性ベクトルの各成分は、−1.0〜1.0の範囲で与えられる重みの相加平均として算出されるので、それぞれ−1.0〜1.0の範囲に正規化された値となる。
また、条件ベクトルの成分は、−5〜5の範囲で与えられる値を5で割ったものとして算出されるので、それぞれ−1.0〜1.0の範囲に正規化された値となる。
さらに、属性類似度は、各成分が−1.0〜1.0の範囲の値をとる2つの3次元ベクトルの内積であるので、その値は−3〜3の範囲となる。
【0067】
ステップS25の次に、検索結果出力部45が、内容検索結果53に含まれる内容一致度53bと、属性類似度54とに基づいて総合検索結果を作成し、これを出力装置48に出力する(ステップS26)。この総合検索結果は、たとえば、情報源属性データ26aのそれぞれについて、内容一致度53bと属性類似度54とを同一の範囲に正規化し、その相加平均としてスコアを求めることによって作成される。
例として、本実施の形態では内容一致度53bが0〜100の範囲の数値であるので、−3〜3の範囲の数値である属性類似度54を0〜100の範囲に線形写像し、これと内容一致度53bとの相加平均を算出する。これが該当する情報源属性データ26aに対応するスコアとなる。
図15は、このスコアが出力される出力画面の例1である。スコアの高い順に、情報源属性データ26aに対応する内容データ26bのタイトルが表示される。
このように、検索結果出力部45は、内容条件51に合致する各内容データ26bについて、内容一致度53bと属性類似度54とに基づいてスコアを算出する。
【0068】
また、総合検索結果は、内容一致度53bと属性類似度54との相加平均を求めるのではなく、これらを軸とした2次元のグラフ上に、情報源属性データ26aのそれぞれに対応する点をプロットすることによって作成されてもよい。
図16は、このようにプロットを含む出力画面の例2である。縦軸が内容一致度53bを、横軸が属性類似度54を、それぞれ0〜100の範囲で表し、1つの情報源属性データ26aに対応して1つの点がプロットされる。
このように、検索結果出力部45は、内容一致度53bを1つの軸とし、属性類似度54を別の1つの軸とする座標空間において、内容条件51に合致する各内容データ26bについて、その内容データ26bに関する内容一致度53bおよび属性類似度54に対応する位置を出力によって示す。
【0069】
図10は、図7に示す構成を有する情報源属性修正サブシステム60の処理の流れを示す。
まず、情報源属性修正サブシステム60のデータ識別情報入力部61は、入出力装置66から入力されるデータ識別情報を受け取り、データ識別情報67として記憶手段に格納する(ステップS30)。
【0070】
次に、情報源属性入力部62が、データ識別情報67に基づいて、これに対応する情報源属性データ26aを統合情報管理データベースシステム20から取得し、修正中情報源属性データ68として記憶手段に格納する(ステップS31)。
ステップS31において、情報源属性入力部62は、データ識別情報67を読み込んでこれを統合情報管理データベースシステム20に送信する。統合情報管理データベースシステム20は、データ識別情報67を受信するとともにこれに基づいてデータ記憶部22を検索し、該当する情報源属性データ26aを特定してこれを情報源属性入力部62に送信する。情報源属性入力部62は、該当する情報源属性データ26aを受信し、修正中情報源属性データ68として格納する。
【0071】
次に、情報源属性修正部64が、修正中情報源属性データ68に修正を加える(ステップS32)。これは、情報源属性修正部64が、入出力装置66に修正画面を出力するとともに、この修正画面を使用して操作員が入出力装置66から入力する修正を受け付け、これを修正中情報源属性データ68に反映することによってなされる。
【0072】
次に、情報源属性登録部63が、修正中情報源属性データ68を統合情報管理データベースシステム20に登録する(ステップS33)。ステップS33において、情報源属性登録部63は、修正中情報源属性データ68を読み込んでこれを統合情報管理データベースシステム20に送信する。統合情報管理データベースシステム20は、修正中情報源属性データ68を受信し、データ記憶部22に格納されている該当の情報源属性データ26aを、修正中情報源属性データ68によって置き換える。こうして修正中情報源属性データ68が新たに情報源属性データ26aとして登録される。
【0073】
図11は、図7に示す構成を有する重み定義修正サブシステム70の処理の流れを示す。
まず、重み定義入力部72が、重み定義テーブル28を統合情報管理データベースシステム20から取得し、修正中重み定義テーブル78として記憶手段に格納する(ステップS40)。ここで、統合情報管理データベースシステム20は、重み定義入力部72の要求に応じて重み定義テーブル28を送信し、重み定義入力部72はこれを受信する。
【0074】
次に、重み定義修正部74が、修正中重み定義テーブル78に修正を加える(ステップS41)。これは、重み定義修正部74が、入出力装置76に修正画面を出力するとともに、この修正画面を使用して操作員が入出力装置76から入力する修正を受け付け、これを修正中重み定義テーブル78に反映することによってなされる。
なお、図4に示す重み定義テーブル28の例において、背景をグレーで示した部分が修正の対象となる。すなわち、作成日時を表す項目におけるN1〜N10に相当する基準日数、メールの発信者を表す項目におけるメールアドレスおよびドメイン、発信サイトを表す項目におけるURLまたはドメイン、ならびに、各ポイントについて付与される重みが変更可能である。
【0075】
次に、重み定義登録部73が、修正中重み定義テーブル78を統合情報管理データベースシステム20に登録する(ステップS42)。ステップS42において、重み定義登録部73は、修正中重み定義テーブル78を読み込んでこれを統合情報管理データベースシステム20に送信する。統合情報管理データベースシステム20は、修正中重み定義テーブル78を受信し、重み定義記憶部24に格納されている重み定義テーブル28を、修正中重み定義テーブル78によって置き換える。こうして修正中重み定義テーブル78が新たに重み定義テーブル28として登録される。
【0076】
このように、本実施の形態に係る情報システム1によれば、情報の検索時に、従来の検索作業において使用されていたキーワードなどの検索条件に加えて、情報源や情報の質を表す情報源属性データ26aに関する条件を指定することができる。また、検索処理において、従来のキーワードの一致度を表す内容一致度53bだけでなく、指定した情報源や情報の質に関する条件と、検索される内容データ26bの情報源属性データ26aとの類似度を、属性類似度54として得ることができる。この属性類似度54は、利用者すなわち検索実行者が求めている情報と、各内容データ26bとが、どの程度一致しているかを表す。したがって、利用者は、内容データ26bの質を考慮して、求める情報をより的確に入手できるようになり、情報活用効率、作業効率が向上する。
【0077】
情報源属性データ26aの大部分(すなわち、内容の信頼度レベルを表す項目以外の項目)は、情報源に応じて、対応する情報管理登録システム80〜85によって登録時に自動的に決定され、付加される。このため、内容データ26bを登録する際の操作員の作業量を低減しつつ、上記のようにより的確な検索を実現することができる。
とくに、情報源の種類を表す項目は、対応する内容データ26bが外部の情報源のうちいずれから得られたか、すなわち情報管理登録システム80〜85または入力部80a〜85aのいずれがその内容データ26bを受け取ったかに応じて決定されるので、その決定の際に内容データ26bに含まれる情報の内容を参照する必要がなく、処理を単純なものとすることができる。
また、情報源属性データ26aは、登録の際に情報管理登録システム80を使用して、また必要に応じて情報源属性修正サブシステム60を使用して、操作員が修正することができる。このため、各項目の値を指定する際に自由度の高い対応が可能となる。
【0078】
さらに、属性類似度54の算出においては、情報源属性データ26aをどのように数値化するかが影響を与える。これについて、情報源属性データ26aに基づいて属性ベクトルを算出する際に使用される重み定義テーブル28は、重み定義修正サブシステム70を使用して、操作員が修正することができる。このため、使用状況に合わせて重み定義を修正する等、自由度の高い対応が可能となる。
【0079】
検索結果を検索者に対して出力する際、図15に示す総合検索結果の出力画面例1に係る出力方法では、内容一致度53bおよび属性類似度54をそれぞれ100点満点に換算し、その相加平均をスコアとして、スコア順に出力している。これにより、キーワードの一致度を表す内容一致度53bだけでなく、情報源や情報の質を表す情報源属性データ26aに関する類似度も加味されるため、検索者の求めている情報がより的確に入手できるようになる。
また、図16に示す総合検索結果の出力画面例2に係る出力方法では、内容一致度53bおよび属性類似度54をそれぞれ縦軸、横軸とした2次元のグラフ上に、個々の検索結果のデータをプロットする。これにより、キーワードの一致度を重視したい場合、情報源や情報の質を重視したい場合、それぞれの状況にあった検索結果を得ることができる。
【0080】
上述の実施の形態1では、情報システム1に、統合情報管理データベースシステム20と、情報管理検索システム40と、情報源属性修正サブシステム60および重み定義修正サブシステム70と、情報管理登録システム80〜85とがそれぞれ独立したハードウエアであるコンピュータとして含まれる構成となっている。しかしながら、情報システム1が全体として同じ機能を有するものであれば、ハードウエア構成はこれと異なっていてもよい。
【0081】
たとえば、情報源属性修正サブシステム60および重み定義修正サブシステム70を含む情報管理メンテナンスシステム2が単一のコンピュータであってもよい。
さらに、情報システム1全体が単一のコンピュータで実現されてもよい。その場合は、各入出力装置がすべて情報システム1に含まれてもよいし、入出力装置の一部またはすべてがそれぞれ使用者用端末として独立したコンピュータであってもよい。
【0082】
また、情報管理登録システム80〜85は、単一のコンピュータによって実現されてもよい。こうすることによりコンピュータの台数を少なくし、コストを削減することができる。
この場合、この単一のコンピュータは、それぞれ異なるプログラムを実行することによって実現される、複数の異なる入力部80a〜85aを有してもよい。この際、外部の情報源に応じて、入力部80a〜85aのうち対応するものが登録前情報源属性データ95を生成するように機能すればよい。
この際、入力部80a〜85aに対応するネットワークインタフェースとしてのハードウエア(ネットワークアダプタカード等)がそれぞれ個別に備えられてもよい。この場合は、どのネットワークインタフェースを経由して内容データ26bが得られたか、すなわち、入力部80a〜85aのいずれがその内容データ26bを受け取ったかに応じて、自動的に情報源の種類を表す項目の値が決定されるので、実施の形態1と同様に、処理を単純なものとすることができる。
また、入力部80a〜85aは、同一のネットワークインタフェースを共有してもよい。こうすることによりハードウエアとしてのネットワークインタフェースの数を少なくし、コストをさらに削減することができる。
【0083】
あるいは、この単一のコンピュータによって実現される情報管理登録システム80〜85は、1つの入力部を有し、この1つの入力部がすべての外部の情報源に対応してもよい。この際、入力部は、外部の情報源に応じて異なる登録前情報源属性データ95を生成するように機能すればよい。
【0084】
また、実施の形態1では、属性ベクトルおよび条件ベクトルはそれぞれ(信頼度ポイント,距離ポイント,新鮮度ポイント)を成分とする3次元ベクトルであるが、これは他の成分からなるものであってもよく、また次元の数(成分の数)が3でなくともよい。とくに、信頼度ポイントを含まないものであってもよい。
信頼度ポイントを含まないものとした場合は、実施の形態1において信頼度ポイントを指定する処理、すなわち図8のステップS12が省略されてもよい。この場合、図8に示す登録処理の流れにおいて操作員の介入が不要となるので、登録処理にかかる工数をさらに削減しつつ、距離ポイントおよび新鮮度ポイントに基づいて、上記と同様により的確な検索処理を実現することができる。
【0085】
また、実施の形態1では、属性類似度54は属性ベクトルと条件ベクトルとの内積として算出されるが、これは、属性ベクトルおよび条件ベクトルそれぞれの成分に基づいて算出されるものであれば、他の計算方法が用いられてもよい。
たとえば、それぞれ対応する成分の差の絶対値の総和、対応する成分の平方の総和、対応する成分の平方の総和の平方根、等として算出されてもよい。
【図面の簡単な説明】
【0086】
【図1】本発明の実施の形態1に係る情報システム1を含む構成を示す図である。
【図2】本発明の実施の形態1に係る統合情報管理データベースシステム20の記憶手段の構成を示す図である。
【図3】本発明の実施の形態1に係る情報源属性データ26aの内容を示す図である。
【図4】本発明の実施の形態1に係る重み定義テーブル28の内容の例を示す図である。
【図5】本発明の実施の形態1に係る情報管理登録システム80の構成を示す図である。
【図6】本発明の実施の形態1に係る情報管理検索システム40の構成を示す図である。
【図7】本発明の実施の形態1に係る情報源属性修正サブシステム60および重み定義修正サブシステム70の構成を示す図である。
【図8】情報管理登録システム80の処理の流れを示すフローチャートである。
【図9】情報管理検索システム40の処理の流れを示すフローチャートである。
【図10】情報源属性修正サブシステム60の処理の流れを示すフローチャートである。
【図11】重み定義修正サブシステム70の処理の流れを示すフローチャートである。
【図12】本発明の実施の形態1に係る登録前情報源属性データ95の生成方式を示す図である。
【図13】本発明の実施の形態1に係る情報源属性入力画面の例を示す図である。
【図14】本発明の実施の形態1に係る属性ベクトル、条件ベクトル、および属性類似度の関係を概念的に説明する図である。
【図15】本発明の実施の形態1に係る表示画面の例1である。
【図16】本発明の実施の形態1に係る表示画面の例2である。
【符号の説明】
【0087】
1 情報システム、41 ログイン処理部、43 内容検索部、44 属性類似度計算部、45 検索結果出力部、50 検索属性、50b 検索の実行者に関連する値(検索者部門)、50c 検索が実行される日時に関連する値(検索実行日)、53b 一致度(内容一致度)、54 類似度(属性類似度)、80a〜85a 入力部、91 登録部、94 データ(登録前内容データ)、102 外部のコンピュータ(文書作成システム)、104 外部のコンピュータ(文書承認システム)、106 外部のコンピュータ(共有ファイルサーバ)、108 外部のコンピュータ(メールサーバ)、110 外部のコンピュータ(イントラネットWebサーバ)、112 外部のコンピュータ(社外情報源)。

【特許請求の範囲】
【請求項1】
情報を格納する記憶手段と、
外部のコンピュータによって提供されるデータを受け取るとともに、前記データの質を表す複数の項目の少なくとも1つについて、前記外部のコンピュータに応じて値を決定する入力部と、
前記データおよび前記決定された値を互いに関連付けて、前記記憶手段に格納する登録部と
を有する、情報システム。
【請求項2】
少なくとも1つの前記データは、組織によって作成されるものであり、
前記入力部は、前記複数の項目の少なくとも1つについて、前記組織に応じて値を決定する
請求項1に記載の情報システム。
【請求項3】
前記入力部は、前記複数の項目の少なくとも1つについて、前記データの作成日時に応じて値を決定する、請求項1または2に記載の情報システム。
【請求項4】
少なくとも1つの前記データは、電子メールであり、
前記入力部は、前記複数の項目の少なくとも1つについて、前記電子メールの発信元であるメールアドレスに応じて値を決定する
請求項1〜3のいずれか一項に記載の情報システム。
【請求項5】
少なくとも1つの前記データは、HTMLファイルであり、
前記入力部は、前記複数の項目の少なくとも1つについて、ネットワーク上において前記HTMLファイルが格納される場所に応じて値を決定する
請求項1〜4のいずれか一項に記載の情報システム。
【請求項6】
前記情報システムは、外部から入力される条件に基づいて、複数の前記データを検索する内容検索部を有し、さらに、前記検索について、
前記検索に関連する環境を表す検索属性を生成するログイン処理部と、
属性類似度計算部であって、
前記属性類似度計算部は、1つの前記データを表す数値の組である属性ベクトルを生成し、前記属性ベクトルは、前記複数の項目について決定された値と、前記検索属性とに基づいて、複数の前記データのそれぞれについて生成されるものであり、
前記属性類似度計算部は、前記外部から入力される条件に基づいて、条件ベクトルを生成し、
前記属性類似度計算部は、複数の前記データのそれぞれについて、前記属性ベクトルと、前記条件ベクトルとの類似度を算出する
属性類似度計算部と
を有する、請求項1〜5のいずれか一項に記載の情報システム。
【請求項7】
前記環境を表す検索属性は、
前記検索の実行者に関連する値と、
前記検索が実行される日時に関連する値と
を含む、請求項6に記載の情報システム。
【請求項8】
前記類似度は、前記属性ベクトルと前記条件ベクトルとの内積である、請求項6または7に記載の情報システム。
【請求項9】
前記外部から入力される条件は、文字列に関する条件を含み、
前記内容検索部は、前記データのうち前記文字列に関する条件に合致するものを判別し、
前記内容検索部は、前記文字列と、前記文字列に関する条件に合致する前記データとの一致度を算出し、
前記情報システムは、さらに、前記文字列に関する条件に合致する各前記データについて、前記一致度と前記類似度とに基づいてスコアを算出する、検索結果出力部を有する
請求項6〜8のいずれか一項に記載の情報システム。
【請求項10】
前記外部から入力される条件は、文字列に関する条件を含み、
前記内容検索部は、前記データのうち前記文字列に関する条件に合致するものを判別し、
前記内容検索部は、前記文字列と、前記文字列に関する条件に合致する前記データとの一致度を算出し、
前記情報システムは、さらに、前記一致度を1つの軸とし、前記類似度を別の1つの軸とする座標空間において、前記文字列に関する条件に合致する各前記データについて、その前記データに関する一致度および類似度に対応する位置を示す検索結果出力部を有する
請求項6〜8のいずれか一項に記載の情報システム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate


【公開番号】特開2007−122350(P2007−122350A)
【公開日】平成19年5月17日(2007.5.17)
【国際特許分類】
【出願番号】特願2005−312859(P2005−312859)
【出願日】平成17年10月27日(2005.10.27)
【出願人】(394013002)三菱電機インフォメーションシステムズ株式会社 (251)
【Fターム(参考)】