説明

情報共有システム及びプログラム

【課題】新規の記事を作成した際に参考にした記事の候補となる記事を、関係のない記事を減らし且つできるだけ漏れも少なく自動的に見つけ出すことを可能とする。
【解決手段】クラスタリング実行部55は、新規記事が投稿される際に、新規記事と記事データベース42に格納されている記事とを複数のクラスタに分類する。第1の候補選出部は、分類された複数のクラスタのうち、新規記事が含まれるクラスタ内の当該新規記事以外の記事を選出する。第2の候補選出部は、記事データベース41に格納されている参考記事情報に基づいて、第1の候補選出部によって選出された記事の各々が作成される際に、当該記事の各々を作成したユーザが参考にした記事を最も多く含むクラスタ内の記事を選出する。候補選定部は、第1及び第2の候補選出部によって選出された記事を、新規記事を作成したユーザが参考にした記事の候補として選定する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、複数のユーザによる記事の作成、投稿、閲覧が可能な情報共有システム及びプログラムに関する。
【背景技術】
【0002】
従来から、文書等のデータ(文書データ)を管理するために、例えば複数の文書内に含まれるキーワードの出現頻度と共起関係とに基づいて文書の類似度を算出し、類似度の高い文書同士をグループ化すると共に、同一グループ内の各文書の階層関係を生成し、文書を分類する技術が知られている。
【0003】
例えば、特許文献1には、ユーザの意図に即した分類分けを実行する技術(以下、先行技術と称する)が開示されている。この先行技術によれば、複数の文書間の複数の形態素からなる合成語であっても、同一の合成語として取り扱うことができるため、より精度の高い分類分けが可能となる。
【特許文献1】特開2005−85112号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
上記したように、先行技術では、複数の文書(記事)間の複数の形態素からなる合成語に対して、ユーザの意図に即した精度の高い分類分けを行うことができる。
【0005】
しかしながら、この先行技術は、分類をまたがった記事等のつながりについては考慮されていない。
【0006】
ところで、複数の利用者(ユーザ)が例えば記事を作成し、投稿し、閲覧することができるグループウェア、電子掲示板または文書管理システム等のシステムにおいて、新規に投稿する記事と、その記事を作成するときに参考にした既存の記事の結びつきを保存するシステムがある。このシステムでは、
1.文書を投稿する際に、投稿者が参考にした記事を手動で検索し、例えばボタンを押すことによって参考にした記事を1つずつ指定する
2.記事の投稿者の閲覧履歴等の中から、日付的に近いものをシステムが自動的に選出し結びつける、または候補を提示し、投稿者が選択する
3.投稿記事と類似記事(単語の出現傾向が似ている記事)とをシステムが自動的に結びつける、または候補を提示し、投稿者が選択する
のいずれかの方法が用いられている。上記した類似記事を特定するために、例えば上記した先行技術が用いられる。
【0007】
このようなシステムにおいては、
1.参考にした記事を手動で検索し、例えばボタンを押すことによって参考にした記事を指定する場合は、指定を忘れたり、意図的に指定しなかったりというように参考にした記事が残らないことがある
2.履歴中の最近のものを選択する場合は、全く関係のない記事が候補中に多く存在することがある
3.類似文書の場合は、例えば「システム設計書」と「設計規定」のように、内容が類似しない記事の場合、実際には関係のある記事であるにも拘らず漏れが生じる可能性がある
という課題がある。
【0008】
本発明は上記事情を考慮してなされたものでありその目的は、新規の記事を投稿する際、投稿記事の作成時に参考にした記事の候補となる記事を、関係のない記事を減らし且つできるだけ漏れも少なく自動的に見つけ出すことが可能な情報共有システム及びプログラ
ムを提供することにある。
【課題を解決するための手段】
【0009】
本発明の1つの態様によれば、複数のユーザによって既に投稿された複数の記事と、当該複数の記事のうちの任意の記事を作成する際に当該任意の記事を作成したユーザが参考にした記事を示す参考記事情報とを格納する記事格納手段を備える情報共有システムが提供される。この情報共有システムは、新規記事が投稿される際に、当該新規記事と前記記事格納手段に格納されている記事の群とを複数のクラスタに分類するクラスタリング手段と、前記クラスタリング手段によって分類された複数のクラスタのうち、前記新規記事が含まれるクラスタ内の当該新規記事以外の記事の群を選出する第1の候補選出手段と、前記記事格納手段に格納されている参考記事情報に基づいて、前記第1の候補選出手段によって選出された各記事が作成される際に、当該記事を作成したユーザが参考にした記事を最も多く含むクラスタ内の記事の群を選出する第2の候補選出手段と、前記第1の候補選出手段及び前記第2の候補選出手段によって選出された記事の群を、前記新規記事を作成したユーザが参考にした記事の候補として選定する候補選定手段とを具備する。
【発明の効果】
【0010】
本発明によれば、新規の記事を投稿する際、投稿記事作成時に参考にした記事の候補となる記事を、関係のない記事を減らし且つできるだけ漏れも少なく自動的に見つけ出すことができる。
【発明を実施するための最良の形態】
【0011】
以下、本発明の実施形態について図面を参照して説明する。
図1は、本発明の一実施形態に係る情報共有システムを含むクライアント−サーバシステムのハードウェア構成を示すブロック図である。
【0012】
図1のクライアント−サーバシステムは、主として、コンピュータ(サーバコンピュータ)10と、複数のクライアント端末とから構成される。複数のクライアント端末はクライアント端末20を含む。クライアント端末20上では、コンピュータ10を利用するクライアントソフトウェアが動作する。クライアントソフトウェアは例えばブラウザである。クライアント端末20を含む複数のクライアント端末は、ローカルエリアネットワーク(LAN)のようなネットワーク30を介してコンピュータ10と接続されている。なお、図1にはクライアント端末20以外のクライアント端末は省略されている。
【0013】
コンピュータ10は、ハードディスクドライブのような外部記憶装置40と接続されている。この外部記憶装置40は、コンピュータ10によって実行されるプログラム41を格納する。コンピュータ10及び外部記憶装置40は、情報共有システム50を構成する。
【0014】
図2は、図1に示される情報共有システム50の主として機能構成を示すブロック図である。情報共有システム50は、インタフェース51、サーバ52、形態素解析部53、閲覧履歴記録部54、クラスタリング実行部55及び関連評価選出部56を含む。本実施形態において、これらの各部51乃至56は、図1に示されるコンピュータ10が外部記憶装置40に格納されているプログラム41を実行することにより実現されるものとする。このプログラム41は、コンピュータ読み取り可能な記憶媒体に予め格納して頒布可能である。また、このプログラム41が、ネットワーク30を介してコンピュータ10にダウンロードされても構わない。
【0015】
また、情報共有システム50は、記事データベース42、形態素インデックス格納部43、クラスタ情報インデックス格納部44及び評価パラメータ設定情報ファイル45を含む。本実施形態において、これらは、外部記憶装置40に格納される。
【0016】
インタフェース51は、クライアント端末20を含むクライアント端末と情報共有システム50との間のデータの入出力を行う。インタフェース51は、記事入力インタフェース511、記事表示インタフェース512及び候補表示インタフェース513を含む。
【0017】
記事入力インタフェース511は、ユーザ(利用者)がクライアント端末を操作して新たに作成した記事を示す情報(以下、単に記事と称する)を入力する。記事表示インタフェース512は、クライアント端末の例えばブラウザに記事を表示する。候補表示インタフェース513は、ユーザによって新たな記事(以下、新規記事と称する)が作成された際に、当該ユーザによって参考にされた記事(関連記事)の候補となる記事(関連候補記事)を、クライアント端末のブラウザに表示する。また、候補表示インタフェース513は、ブラウザに表示された関連候補記事の中からユーザによって例えば選択された記事あるいは破棄された記事をサーバ52に通知する。
【0018】
サーバ52は、記事入力インタフェース511によって入力された新規記事を受取る。サーバ52は、受取られた新規記事を記事データベース42に格納(保管)する。サーバ52は、入力された新規記事を形態素解析部53に送信する。また、サーバ52は、入力された新規記事及び閲覧履歴記録部54によって記事データベース42に記録されている履歴を示す情報をクラスタリング実行部55に送信する。サーバ52は、入力された新規記事を関連評価選出部56に送信する。また、サーバ52は、記事データベース42に格納されている記事を記事表示インタフェース512に送信する。サーバ52は、関連評価選出部56によって選出された記事を候補表示インタフェース513に送信する。
【0019】
記事データベース42には、複数のユーザによって投稿された記事を示す記事データが格納されている。また記事データベース42には、記事データ以外に、記事データベース42に格納されている記事を作成する際に当該記事を作成したユーザが参考にした記事を示す情報である参考記事情報(関連記事情報)が格納されている。
【0020】
形態素解析部53は、サーバ52によって送信された記事を形態素解析する。形態素解析部53は、形態素解析した結果を形態素インデックス格納部43に格納する。
【0021】
閲覧履歴記録部54は、クライアント端末(を操作するユーザ)毎に、記事データベース42に格納されている記事のうち、当該クライアント端末を操作してユーザが閲覧した記事の履歴を示す情報(以下、履歴情報と称する)を記事データベース42に記録する処理を行う。
【0022】
クラスタリング実行部55は、サーバ52によって送信された新規記事と記事データベース42に記録されている履歴情報によって示される記事とを対象に、形態素解析インデックス格納部43に格納される形態素解析の結果に基づいて、クラスタリング(分類)処理を実行する。クラスタリング実行部55は、クラスタリング処理の結果をクラスタ情報として、クラスタ情報インデックス格納部44に格納する。
【0023】
このクラスタリング処理は、例えば複数の文書内に含まれる単語の出現頻度に基づいて、文書の類似度を算出し、類似度の高い文書同士をグループ化することによって実行される。
【0024】
評価パラメータ設定情報ファイル45には、新規記事の関連候補記事を選出する際に適用される条件を示す評価パラメータ情報が予め格納されている。この評価パラメータ情報は、例えばクライアント端末を操作するユーザによって予め設定されている。この条件についての詳細は、後述する。
【0025】
関連評価選出部56は、サーバ52によって送信された新規記事の関連候補記事を選出する。関連評価選出部56は、クラスタ情報インデックス格納部44に格納されているクラスタ情報及び評価パラメータ設定情報ファイル45に格納されている評価パラメータ情報に設定されている条件に基づいて、処理を実行する。関連評価選出部56は、選出された関連候補記事をサーバ52に出力する。
【0026】
図3は、関連評価選出部56の構成を示すブロック図である。関連評価選出部56は、第1のクラスタ特定部561、第1の候補選出部562、第2のクラスタ特定部563、第2の候補選出部564及び候補選定部565を有する。
【0027】
第1のクラスタ特定部561は、クラスタ情報インデックス格納部44に格納されているクラスタ情報によって示される複数のクラスタのうち、新規記事が含まれているクラスタを特定する。
【0028】
第1の候補選出部562は、第1のクラスタ特定部561によって特定されたクラスタ内の新規記事以外の記事のうち、評価パラメータ情報ファイル45に格納されている評価パラメータ情報に設定されている条件を満たす記事を選出する。
【0029】
第2のクラスタ特定部563は、第1の候補選出部562によって選出された記事の各々の関連記事を、記事データベース42に格納されている関連記事情報に基づいて特定する。第2のクラスタ特定部563は、クラスタ情報インデックス格納部44に格納されるクラスタ情報に基づいて、第1の候補選出部562によって選出された記事の各々の関連記事が最も多く含まれるクラスタを特定する。
【0030】
第2の候補選出部564は、第2のクラスタ特定部563によって特定されたクラスタ内の記事のうち、評価パラメータ設定情報ファイル45に格納されている評価パラメータ情報に設定されている条件を満たす記事を選出する。
【0031】
候補選定部565は、第1の候補選出部562及び第2の候補選出部603によって選出された記事を、新規記事の関連候補記事として選定する。
【0032】
図4は、図2に示される記事データベース42に格納されている関連記事情報のデータ構造の一例を表形式で示す。図4に示すように、各行は、記事データベース42に格納されている記事(を示す情報)と、当該記事の関連記事(を示す情報)とを含む。図4に示す例では、行421は、記事(A1)の関連記事は記事(A41)であることを示す。行421以外の行についても同様に、記事及び当該記事の関連記事が示されている。
【0033】
次に、図5のフローチャートを参照して、関連評価選出部56の処理手順について説明する。ここでは、図1のクライアント端末20を操作するユーザによって新規記事として記事(Ax)が投稿されたものとして説明する。
【0034】
まず、第1のクラスタ特定部561は、クラスタ情報インデックス格納部44に格納されているクラスタ情報、つまりクラスタリング実行部55によるクラスタリング処理の結果を取得する(ステップS1)。
【0035】
ここで、図6は、クラスタ情報インデックス格納部44に格納されているクラスタ情報のデータ構造の一例を示す図である。図6に示すように、クラスタ情報は、クラスタの各々に対応付けて、当該クラスタに含まれる記事(を示す情報)及び当該クラスタに含まれる記事の数(記事数)が格納されている。図6に示す例では、クラスタリング実行部55によってクラスタC1乃至C10のクラスタに分類されている。このクラスタC1乃至C10のうち例えばクラスタC1に対応付けて、クラスタC1に含まれる記事である記事(A1),記事(A2),記事(A3),記事(A4),…,記事(Ax)を示す情報及びクラスタ内の記事数として「11」が格納されている。クラスタC2からC10までについても同様に、クラスタに含まれる記事及びその記事数が格納されている。なお、クラスタリング処理された記事の各々は、クラスタC1乃至C10いずれか1つに含まれる。
【0036】
図6に示すクラスタ情報は、閲覧履歴記録部54によって記事データベース42に記録された履歴情報によって示される記事のうち例えば最新の記事100件に新規記事(Ax)を加えた101件の記事について、クラスタリング実行部55によってクラスタリング処理が実行された結果を示す。
【0037】
以下、第1のクラスタ特定部561によって図6に示すクラスタ情報が、取得されたものとして説明する。
【0038】
再び図5を参照すると、第1のクラスタ特定部561は、取得されたクラスタ情報によって示されるクラスタC1からC10のうち、クラスタを1つ取り出す(ステップS2)。
【0039】
取り出されたクラスタに投稿された記事(Ax)が含まれる場合(ステップS3のYES)、第1のクラスタ特定部561は、当該記事(Ax)を含むクラスタを投稿記事含有クラスタとして特定する(ステップS4)。なお、図6に示すクラスタ情報では、クラスタC1に記事(Ax)が含まれているため、第1のクラスタ特定部561は、クラスタC1を投稿記事含有クラスタとして特定する。
【0040】
一方、ステップS3において、取り出されたクラスタに記事(Ax)が含まれていない場合、ステップS2に戻って処理が繰り返される(ステップS3のNO)。
【0041】
次に、第1の候補選出部562は、第1のクラスタ特定部561によって特定されたクラスタC1に含まれる記事から記事(Ax)を除いた記事のうち、評価パラメータ情報に設定されている条件を満たす記事を関連候補記事群(G1)として選出する(ステップS5)。ここでは、n件の記事が関連記事候補群(G1)として選出されたものとする。
【0042】
ここで、評価パラメータ設定情報ファイル45に格納されている評価パラメータ情報に設定されている条件の一例について述べる。
【0043】
投稿された記事(Ax)が含まれるクラスタ(ここでは、クラスタC1)に関する条件(投稿記事含有クラスタ条件)として、例えば以下に示す第1乃至第3の条件を含む複数の条件がある。
【0044】
第1の条件は、記事が投稿された日を基準に、最新の参照日が「X」日以内の記事であること、第2の条件は、投稿された記事との類似度が「Y」以上の記事であること、第3の条件は、改訂版の新版、旧版がある場合、最新版の記事であること、である。ここで、第2の条件の類似度は、例えば複数の文書内に含まれる単語の出現頻度に基づいて算出される。
【0045】
なお、第1の条件または第2の条件の「X」または「Y」の値については、例えばクライアント端末20を操作するユーザによって設定可能である。また、第1乃至第3の条件は、クライアント端末20を操作するユーザによって、それぞれ有効または無効に設定可能である。第1乃至第3の条件が、無効に設定されている場合においては、クラスタC1に含まれる記事から記事(Ax)を除いた記事の全てが関連候補記事群(G1)として選出される。また、第1乃至第3の条件のうち1つ以上が有効に設定されている場合においては、当該有効に設定されている条件のいずれか1つを満たせば関連候補記事群(G1)として選出される。なお、第1乃至第3の条件のうち有効に設定されている条件の全てを満たした場合のみ、関連候補記事群(G1)として選出される構成としても構わない。
【0046】
再び図5を参照すると、第2のクラスタ特定部563は、第1の候補選出部562によって選出された関連候補記事群(G1)の記事のうち、記事(Ai)(i=1,2,…,n)を取り出す(ステップS6)。ここでは、図6のクラスタC1に含まれる記事(A1)が関連記事候補群(G1)に含まれるものとし、第2のクラスタ特定部563は、記事(A1)を取り出したものとする。
【0047】
取り出された記事(A1)の関連記事が例えばm件存在するものとする。このm件の関連記事を記事(Air1),記事(Air2),…、記事(Airm)と表現する。第2のクラスタ特定部563は、当該m件の記事のうち、記事(Airj)(j=1,2,…,m)を、記事データベース42に格納されている関連記事情報に基づいて取り出す(ステップS7)。
【0048】
図7は、第1の候補選出部562によって選出された関連候補記事群(G1)に含まれる記事の関連記事を示す。図7に示すように、記事(A1)の関連記事は、記事(A41)、(A51)、(A61)である。記事(A41)が含まれるクラスタは、クラスタC6である。記事(A51)が含まれるクラスタは、クラスタC5である。記事(A61)が含まれるクラスタは、クラスタC7である。以下、同様に、記事(A2)の関連記事は記事(A52)及び記事(A62)であり、当該記事(A52)及び記事(A62)は、それぞれクラスタC5,C6に含まれる。また、記事(A3)の関連記事は記事(A53)であり、当該記事(A53)は、クラスタC5に含まれる。また、記事(A4)の関連記事は記事(A44)であり、当該記事(A44)は、クラスタC5に含まれる。
【0049】
第2のクラスタ特定部563は、図5のステップ7において取り出された記事(Airj)が含まれるクラスタCk(kは、1,2,…,10のいずれか)を決定する(ステップS8)。取り出された記事(Airj)が例えば記事(A41)であるとすると、第2のクラスタ特定部563は、図6に示すクラスタ情報によって示されるように記事(A41)を含むクラスタC6を、クラスタCkとして決定する。
【0050】
第2のクラスタ特定部563は、決定されたクラスタC6の被参照記事カウンタに1を加える(ステップS9)。この被参照記事カウンタは、第2のクラスタ特定部563がクラスタを特定する際に用いられる。
【0051】
記事(A1)の関連記事の残りの記事(A51)、(A61)についても上記したステップS8及びS9の処理が実行されると(ステップS10のYES)、第1の候補選出部601によって選出された関連候補記事群(G1)の記事のうち、記事(A1)以外の記事についても上記したステップS7乃至S10の処理が実行される。図8に、ステップS10が終了した段階での被参照記事カウンタの値の一例を示す。
【0052】
第2のクラスタ特定部563は、関連候補記事群(G1)に含まれる記事の全てについてステップS7乃至S10の処理を実行すると(ステップS11のYES)、被参照記事カウンタによって示される値が最大のクラスタCl(lは1,2,…,10のいずれか)を特定する(ステップS12)。
【0053】
図9は、ステップS12における被参照記事カウンタによって示される値の一例を示す図である。図9に示すように、クラスタ4の被参照記事カウンタによって示される値は1である。同様に、クラスタC5,C6,C7の被参照記事カウンタによって示される値はそれぞれ6,3,2である。また、クラスタC4,C5,C6,C7以外のクラスタについては、被参照記事カウンタによって示される値は0である。したがって、第2のクラスタ特定部563は、被参照記事カウンタによって示される値が最大のクラスタC5を特定する。
【0054】
図5のステップS12において、図9の例のようにクラスタC5が特定された場合、第2の候補選出部564は、クラスタC5に含まれる記事のうち、評価パラメータ情報に設定されている条件を満たす記事を関連候補記事群(G2)として選出する(ステップS13)。
【0055】
ここで、評価パラメータ設定情報ファイル45に格納されている評価パラメータ情報に設定されている条件の一例について述べる。
【0056】
関連クラスタに関する条件(関連クラスタ条件)として、例えば以下に示す第4及び第5の条件を含む複数の条件がある。第4の条件は、記事が投稿された日を基準に、最新の参照日が「X」日以内である記事であること、第5の条件は、改訂版の新版、旧版がある場合、最新版の記事であること、である。
【0057】
なお、上述した投稿記事含有クラスタ条件の場合と同様に、第4の条件の「X」については、例えばクライアント端末20を操作するユーザによって設定可能である。また、第4及び第5の条件は、クライアント端末20を操作するユーザによって、それぞれ有効または無効に設定可能である。第4及び第5の条件が、無効に設定されている場合においては、クラスタC5に含まれる記事の全てが関連候補記事群(G2)として選出される。また、第4及び第5の条件のうち1つ以上が有効に設定されている場合においては、当該有効に設定されている条件のいずれか1つを満たせば関連候補記事群(G2)として選出される。なお、第4及び第5の条件の両方が有効に設定されている場合、両方の条件を満たした場合のみ、関連候補記事群(G2)として選出される構成としても構わない。
【0058】
候補選定部565は、第1の候補選出部562によって選出された関連候補記事(G1)及び第2の候補選出部564によって選出された関連候補記事(G2)を、記事(Ax)の関連候補記事として選定する。候補選定部565は、選定された記事(Ax)の関連候補記事をサーバ52に出力する。サーバ52は、候補選定部565から出力された関連候補記事を、候補表示インタフェース513に送信する。候補表示インタフェース513は、サーバ52によって送信された関連候補記事を、例えばクライアント端末20のブラウザに表示する。
【0059】
クライアント端末20を操作して記事(Ax)を作成したユーザが、ブラウザに表示される関連候補記事の中から当該記事(Ax)を作成した際に参考にした記事を選択し例えばボタンを押すことによって、当該選択された記事は、記事(Ax)の関連記事として確定する。この場合、記事データベース42に当該記事(Ax)の関連記事として当該選択された記事を示す情報(関連記事情報)が格納される。
【0060】
上述したように本実施形態においては、記事(Ax)の関連候補記事を自動的に見つけ出し、記事(Ax)を作成したユーザに対して当該関連候補記事を提示することが可能となる。この記事(Ax)の関連候補記事は、記事(Ax)を作成したユーザの閲覧履歴を利用し、クラスタリング実行部55によってクラスタリングされた結果を用いることによって見つけ出されるため、記事(Ax)に関係のない記事が少なく、且つ関連記事の候補となる記事の漏れも少なくなる。
【0061】
なお、上記実施形態では、クライアント端末20を操作してユーザが閲覧した記事の履歴に含まれる記事に限定してクラスタリング処理が実行される。しかし、情報共有システム50が例えばグループウェアシステム場合、ユーザが属するグループ内のユーザから投稿された記事に限定する構成としても構わない。また、情報共有システム50が例えば電子掲示板システムの場合、ユーザが係わるテーマに含まれる記事に限定してクラスタリング処理が実行される構成としても構わない。
【0062】
また、クラスタリング実行部55は、記事データベース42に格納されている全ての記事についてクラスタリング処理を実行する構成としてもよい。この場合でも、記事(Ax)の関連候補記事には、記事(Ax)との類似度が低い記事は含まれず、且つ記事(Ax)と同じクラスタに含まれる記事の関連記事が多く含まれるクラスタ内の記事が含まれる。このため、記事(Ax)の関連候補記事は、記事(Ax)に関係ない記事が少なく且つ関連記事の候補となる記事の漏れも少なくなる。
【0063】
なお、本発明は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより種々の発明を形成できる。例えば、実施形態に示される全構成要素からいくつかの構成要素を削除してもよい。
【図面の簡単な説明】
【0064】
【図1】本発明の一実施形態に係る情報共有システムを含むクライアント−サーバシステムのハードウェア構成を示すブロック図。
【図2】図1の情報共有システムの機能構成を示すブロック図。
【図3】図2の関連評価選出部56の構成を示すブロック図。
【図4】関連記事情報のデータ構造の一例を示す図。
【図5】同実施形態における関連評価選出部56の処理手順を示すフローチャート。
【図6】クラスタ情報のデータ構造の一例を示す図。
【図7】関連候補記事群(G1)に含まれる記事の関連記事を示す図。
【図8】図5のステップS10の処理が終了した場合における被参照記事カウンタの値の一例を示す図。
【図9】図5のステップS12の処理時における被参照記事カウンタの値の一例を示す図。
【符号の説明】
【0065】
10…コンピュータ、20…クライアント端末、30…ネットワーク、40…外部記憶装置、41…記事データベース、43…形態素インデックス格納部、44…クラスタ情報インデックス格納部、45…評価パラメータ設定情報ファイル、50…情報共有システム、51…インタフェース、52…サーバ、53…形態素解析部、54…閲覧履歴記録部、55…クラスタリング実行部、56…関連評価選出部、561…第1のクラスタ特定部、562…第1の候補選出部、563…第2のクラスタ特定部、564…第2の候補選出部、565…候補選定部。

【特許請求の範囲】
【請求項1】
複数のユーザによって投稿された複数の記事と、当該複数の記事のうちの任意の記事を作成する際に当該任意の記事を作成したユーザが参考にした記事を示す参考記事情報とを格納する記事格納手段を備える情報共有システムにおいて、
新規記事が投稿される際に、当該新規記事と前記記事格納手段に格納されている記事の群とを複数のクラスタに分類するクラスタリング手段と、
前記クラスタリング手段によって分類された複数のクラスタのうち、前記新規記事が含まれるクラスタ内の当該新規記事以外の記事の群を選出する第1の候補選出手段と、
前記記事格納手段に格納されている参考記事情報に基づいて、前記第1の候補選出手段によって選出された各記事が作成される際に、当該記事を作成したユーザが参考にした記事を最も多く含むクラスタ内の記事の群を選出する第2の候補選出手段と、
前記第1の候補選出手段及び前記第2の候補選出手段によって選出された記事の群を、前記新規記事を作成したユーザが参考にした記事の候補として選定する候補選定手段と
を具備することを特徴とする情報共有システム。
【請求項2】
前記記事格納手段は、前記複数のユーザ毎に、当該ユーザが係わる記事の情報を格納し、
前記クラスタリング手段は、前記新規記事と前記記事格納手段に格納されている前記新規記事を作成したユーザが係わる記事の情報によって示される記事の群とを複数のクラスタに分類することを特徴とする請求項1記載の情報共有システム。
【請求項3】
前記記事格納手段に格納されるユーザが係わる記事の情報は、前記新規記事を作成したユーザの閲覧履歴を示す情報を含むことを特徴とする請求項2記載の情報共有システム。
【請求項4】
前記記事格納手段は、前記複数のユーザのうち、任意のユーザが係わるグループ毎の記事の情報を格納し、
前記クラスタリング手段は、前記新規記事と前記記事格納手段に格納されている前記新規記事を作成したユーザが係わるグループの記事の情報によって示される記事の群とを複数のクラスタに分類することを特徴とする請求項1記載の情報共有システム。
【請求項5】
前記新規記事を作成したユーザが参考にした記事を特定するための条件を示す評価パラメータ情報を格納する評価パラメータ設定情報格納手段を更に具備し、
前記第1の候補選出手段及び前記第2の候補選出手段の少なくとも一方は、前記評価パラメータ設定情報格納手段に格納される評価パラメータ情報によって示される条件に合致する記事を選出することを特徴とする請求項1記載の情報共有システム。
【請求項6】
前記評価パラメータ情報によって示される条件は、前記新規記事の作成日より予め設定された日以内に、前記新規記事を作成したユーザが参照している記事であることを含むことを特徴とする請求項5記載の情報共有システム。
【請求項7】
前記評価パラメータ情報によって示される条件は、前記新規記事及び他の記事内に含まれる単語の出現頻度に基づいて前記新規記事及び他の記事の類似度を算出し、当該類似度が一定の値以上の記事であることを含むことを特徴とする請求項5記載の情報共有システム。
【請求項8】
前記評価パラメータ情報によって示される条件は、特定の記事が連鎖的に改訂されて作成された複数の記事が存在する場合、それらの記事のうち最新の記事のみが当該条件を満たす記事であることを含むことを特徴とする請求項5記載の情報共有システム。
【請求項9】
複数のユーザによって既に投稿された複数の記事と、当該複数の記事のうちの任意の記事及び当該任意の記事を作成する際に当該記事を作成したユーザが参考にした記事を示す参考記事情報とを格納する記事データベースを有する外部記憶装置と当該外部記憶装置を利用するコンピュータとから構成される情報共有システムにおいて、前記コンピュータによって実行されるプログラムであって、
前記コンピュータに、
新規記事が投稿される際に、当該新規記事と前記記事データベースに格納されている記事とを複数のクラスタに分類するステップと、
前記分類された複数のクラスタのうち、前記新規記事が含まれるクラスタ内の当該新規記事以外の記事を選出するステップと、
前記記事データベースに格納されている参考記事情報に基づいて、前記選出された記事の各々が作成される際に参考にした記事を最も多く含むクラスタ内の記事を選出するステップと、
前記選出された記事を、前記新規記事を作成したユーザによって参考にされた記事の候補として選定するステップと
を実行させるためのプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公開番号】特開2008−21256(P2008−21256A)
【公開日】平成20年1月31日(2008.1.31)
【国際特許分類】
【出願番号】特願2006−194721(P2006−194721)
【出願日】平成18年7月14日(2006.7.14)
【出願人】(000003078)株式会社東芝 (54,554)
【出願人】(301063496)東芝ソリューション株式会社 (1,478)
【Fターム(参考)】