説明

情報処理装置、および情報処理方法、並びにコンピュータ・プログラム

【課題】 省力化したランキング情報の取得によるデータのランキング処理を可能とする情報処理装置および方法を提供する。
【解決手段】 クライアントの送受信メールから、ドキュメント(文書)のランキング情報として適用可能なデータを取得し、取得データをインデックス格納部に格納し、これらのランキング情報に従って、クライアントに提供する文書情報、例えば、クライアントからの検索要求に応じて生成した検索結果データに対して、ランキング情報を適用した提供データ生成処理を実行してユーザに提示する。本構成により、ユーザによる文書の推薦処理といった手間をかけることなく、ユーザに対応した最適なランキングを行った情報提供が可能となる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、および情報処理方法、並びにコンピュータ・プログラムに関する。さらに、詳細には、クライアントの送受信するメールから、ドキュメント(文書)のランキング情報として適用可能なデータを取得して、このランキング情報に従って、クライアントに提供する文書情報、例えば、クライアントからの検索要求に応じて生成した検索結果データのランキング設定処理を実行してユーザに提供することを可能とした情報処理装置、および情報処理方法、並びにコンピュータ・プログラムに関する。
【背景技術】
【0002】
多数の文書情報などの情報から、特定の情報を抽出するデータ検索において、ユーザの興味や嗜好を反映したフィルタリング処理を実行して検索結果を提示する処理を行なうものがある。インターネットあるいはイントラネットなどのネットワーク通信が盛んになり、このようなネットワークを介したニュース配信、メール配信などが盛んに行われているが、このようなデータ配信では、ユーザの興味に応じたデータ配信を可能とするためのフィルタリング処理が行われる。
【0003】
ユーザの推薦情報や、興味情報などに基づいてデータをフィルタリングする処理をソーシャルフィルタリング(Social filtering)と呼ぶ。このようなデータフィルタリングを行なうことで、ユーザ各々に対応した個別のユーザ適応情報を、各ユーザに提供することが可能となる。
【0004】
データ検索システムにおいてこのようなフィルタリング処理を適用することにより、多数のデータの中から、ユーザの興味の高いと判定されるデータを順番に提示したリストを生成してユーザに検索結果として提供する構成が可能となる。すなわち、検索を実行するシステム側に、各ユーザのプロファイリング情報を格納し、格納したプロファイリング情報を参照して、各ユーザの興味レベルの高い順にデータをリスト化して提示するものである。特許文献1には、同じグループに所属するユーザ同士がドキュメントを推薦し、ユーザが推薦情報の入力を検索システムに対して実行することで、推薦情報に基づくドキュメントのランキングを行なうシステムが開示されている。
【0005】
しかし、上述した従来技術では、ユーザが検索システムに対して推薦情報を通知しなければならないという処理負荷が発生する。
【特許文献1】特開平11−282875号公報
【発明の開示】
【発明が解決しようとする課題】
【0006】
本発明は、上述の問題点に鑑みてなされたものであり、データ検索、あるいはデータフィルタリングシステムなど、多数の情報の中から例えばユーザの興味の高いと判断される特定データを抽出する構成において、ユーザからの推薦情報を通知する処理など、ユーザの負荷を発生させることなく、ユーザの興味がどのような情報に対して高いか等を判定することを可能として、データソートなどのデータ加工を実行し、ユーザの興味の高い情報を優先してユーザに提示することを可能とした情報処理装置、および情報処理方法、並びにコンピュータ・プログラムを提供することを目的とする。
【0007】
さらに、具体的には、本発明は、クライアントの送受信するメールから、ドキュメント(文書)のランキング情報として適用可能なデータを取得して、このランキング情報に従って、クライアントに提供する文書情報、例えば、クライアントからの検索要求に応じて生成した検索結果データのランキング設定処理を実行してユーザに提供することを可能とした情報処理装置、および情報処理方法、並びにコンピュータ・プログラムを提供することを目的とする。
【課題を解決するための手段】
【0008】
本発明の第1の側面は、
情報処理装置であり、
クライアントに提供するドキュメント情報を含むインデックスデータを格納したインデックス格納部と、
前記インデックス格納部の格納情報に基づいて検索処理を実行する検索部と、
ネットワークを介して転送されるメールデータから、前記ドキュメント情報のランキング処理に適用するランキング情報を取得し、各ドキュメント対応のランキング情報として、前記インデックス格納部に格納する処理を実行するランキング情報決定部と、
前記検索部の検索により生成された第1の検索結果に対して、前記ランキング情報を適用した提供データ生成処理を実行し、ランキング情報を反映した第2の検索結果を生成するランキング処理部と、
を有することを特徴とする情報処理装置にある。
【0009】
さらに、本発明の情報処理装置の一実施態様において、前記ランキング情報決定部は、ネットワークを介して転送されるメールデータから、
(a)メール本文中に記述されているドキュメント情報、
(b)メール宛先情報(To)、
(c)メールコピー先情報(CC)、
(d)メール送信者情報(FROM)、
(e)メール送信日時情報(DATE)、
上記(a)〜(e)の情報中、少なくとも(a)ドキュメント情報と、その他の(b)〜(e)中、取得可能なデータをランキング情報として取得する処理を実行する構成であることを特徴とする。
【0010】
さらに、本発明の情報処理装置の一実施態様において、前記ランキング情報決定部は、ランキング情報として取得するメールアドレスデータに複数のメールアドレスの集合として設定されたメーリングリストを、各ユーザ対応のメールアドレスに変換する処理を実行する構成であることを特徴とする。
【0011】
さらに、本発明の情報処理装置の一実施態様において、前記情報処理装置は、さらに、メールアドレス情報とユーザ名とを対応付けたユーザ情報データを格納したユーザ情報格納部を有し、前記ランキング情報決定部は、ランキング情報として取得するメールアドレスデータを、前記ユーザ情報に従って、ユーザ名に変換し、ランキング情報を生成する処理を実行する構成であることを特徴とする。
【0012】
さらに、本発明の情報処理装置の一実施態様において、前記ランキング情報決定部は、ネットワークを介して転送されるメールデータから、前記ドキュメント情報のランキング処理に適用するランキング情報を取得した場合、前記インデックス格納部に格納済みのインデックスデータに、取得ランキング情報を追加する更新処理を実行する構成であることを特徴とする。
【0013】
さらに、本発明の情報処理装置の一実施態様において、前記ランキング処理部は、前記ランキング情報の構成データに対して重み(W)または係数(N)を設定し、前記検索部の検索により生成された第1の検索結果に含まれるドキュメントに対応して設定されたランキング情報に基づいて、前記重み(W)および係数(N)と、該ランキング情報の構成データに検索実行ユーザが含まれるか否かによって異なる値とした変数とに基づいて、ドキュメント対応のランク値[R]を算出し、該算出したランク値[R]に基づいて、前記第1の検索結果に含まれるドキュメントのソート処理を実行し、ランキング情報を反映した第2の検索結果を生成する構成であることを特徴とする。
【0014】
さらに、本発明の情報処理装置の一実施態様において、前記ランキング処理部は、ランキング情報を構成するメール宛先情報(To)、メールコピー先情報(CC)、メール送信者情報(FROM)の各々について、重み(W)を決定し、さらに、ランキング情報を構成する文書の有無を示すデータについて文書有無に応じて異なる値とした係数(N)を設定する構成であることを特徴とする。
【0015】
さらに、本発明の情報処理装置の一実施態様において、前記ランキング処理部は、前記検索部の検索により生成された第1の検索結果に含まれるドキュメントに対応して設定されたランキング情報に含まれるメール送信日時情報としての日付データについて、同一ドキュメントについて最新のデータを取得する日付代表値[T]算出処理を実行し、該算出した日付代表値[T]に基づいて、前記第1の検索結果に含まれるドキュメントのソート処理を実行し、ランキング情報を反映した第2の検索結果を生成する構成であることを特徴とする。
【0016】
さらに、本発明の情報処理装置の一実施態様において、前記ランキング処理部は、前記検索部の検索により生成された第1の検索結果に対して、前記ランキング情報を適用したソート処理を実行し、ランキング情報を反映した第2の検索結果を生成する構成であることを特徴とする。
【0017】
さらに、本発明の第2の側面は、
ランキング情報に基づくデータ処理をコンピュータ上で実行させるコンピュータ・プログラムであり、
ネットワークを介して転送されるメールデータから、ドキュメント情報のランキング処理に適用するランキング情報を取得し、各ドキュメント対応のランキング情報として、インデックス格納部に格納する処理を実行するランキング情報決定ステップと、
前記インデックス格納部の格納情報に基づいて検索処理を実行する検索ステップと、
前記検索ステップにおける検索により生成された第1の検索結果に対して、前記ランキング情報を適用した提供データ生成処理を実行し、ランキング情報を反映した第2の検索結果を生成するランキング処理ステップと、
を有することを特徴とするコンピュータ・プログラムにある。
【0018】
さらに、本発明のコンピュータ・プログラムの一実施態様において、前記ランキング情報決定ステップは、ネットワークを介して転送されるメールデータから、
(a)メール本文中に記述されているドキュメント情報、
(b)メール宛先情報(To)、
(c)メールコピー先情報(CC)、
(d)メール送信者情報(FROM)、
(e)メール送信日時情報(DATE)、
上記(a)〜(e)の情報中、少なくとも(a)ドキュメント情報と、その他の(b)〜(e)中、取得可能なデータをランキング情報として取得する処理を実行するステップを含むことを特徴とする。
【0019】
さらに、本発明のコンピュータ・プログラムの一実施態様において、前記ランキング情報決定ステップは、ランキング情報として取得するメールアドレスデータに複数のメールアドレスの集合として設定されたメーリングリストを、各ユーザ対応のメールアドレスに変換する処理を実行するステップを含むことを特徴とする。
【0020】
さらに、本発明のコンピュータ・プログラムの一実施態様において、前記ランキング情報決定ステップは、ランキング情報として取得するメールアドレスデータを、メールアドレス情報とユーザ名とを対応付けたユーザ情報データを格納したユーザ情報格納部から取得するユーザ情報に従って、ユーザ名に変換し、ランキング情報を生成する処理を実行するステップを含むことを特徴とする。
【0021】
さらに、本発明のコンピュータ・プログラムの一実施態様において、前記ランキング情報決定ステップは、ネットワークを介して転送されるメールデータから、前記ドキュメント情報のランキング処理に適用するランキング情報を取得した場合、前記インデックス格納部に格納済みのインデックスデータに、取得ランキング情報を追加する更新処理を実行することを特徴とする。
【0022】
さらに、本発明のコンピュータ・プログラムの一実施態様において、前記ランキング処理ステップは、前記ランキング情報の構成データに対して重み(W)または係数(N)を設定し、前記第1の検索結果に含まれるドキュメントに対応して設定されたランキング情報に基づいて、前記重み(W)および係数(N)と、該ランキング情報の構成データに検索実行ユーザが含まれるか否かによって異なる値とした変数とに基づいて、ドキュメント対応のランク値[R]を算出し、該算出したランク値[R]に基づいて、前記第1の検索結果に含まれるドキュメントのソート処理を実行し、ランキング情報を反映した第2の検索結果を生成するステップを含むことを特徴とする。
【0023】
さらに、本発明のコンピュータ・プログラムの一実施態様において、前記ランキング処理ステップは、ランキング情報を構成するメール宛先情報(To)、メールコピー先情報(CC)、メール送信者情報(FROM)の各々について、重み(W)を決定し、さらに、ランキング情報を構成する文書の有無を示すデータについて文書有無に応じて異なる値とした係数(N)を設定するステップを含むことを特徴とする。
【0024】
さらに、本発明のコンピュータ・プログラムの一実施態様において、前記ランキング処理ステップは、前記第1の検索結果に含まれるドキュメントに対応して設定されたランキング情報に含まれるメール送信日時情報としての日付データについて、同一ドキュメントについて最新のデータを取得する日付代表値[T]算出処理を実行し、該算出した日付代表値[T]に基づいて、前記第1の検索結果に含まれるドキュメントのソート処理を実行し、ランキング情報を反映した第2の検索結果を生成するステップを含むことを特徴とする。
【0025】
さらに、本発明のコンピュータ・プログラムの一実施態様において、前記ランキング処理ステップは、前記検索部の検索により生成された第1の検索結果に対して、前記ランキング情報を適用したソート処理を実行し、ランキング情報を反映した第2の検索結果を生成するステップであることを特徴とする。
【0026】
さらに、本発明の第3の側面は、
ランキング情報に基づくデータ処理を実行する情報処理方法であり、
ランキング情報決定部における処理であり、ネットワークを介して転送されるメールデータから、ドキュメント情報のランキング処理に適用するランキング情報を取得し、各ドキュメント対応のランキング情報として、インデックス格納部に格納する処理を実行するランキング情報決定ステップと、
検索部における処理であり、前記インデックス格納部の格納情報に基づいて検索処理を実行する検索ステップと、
ランキング処理部における処理であり、前記検索ステップにおける検索により生成された第1の検索結果に対して、前記ランキング情報を適用した提供データ生成処理を実行し、ランキング情報を反映した第2の検索結果を生成するランキング処理ステップと、
を有することを特徴とする情報処理方法にある。
【0027】
なお、本発明のコンピュータ・プログラムは、例えば、様々なプログラム・コードを実行可能なコンピュータシステムに対して、コンピュータ可読な形式で提供する記憶媒体、通信媒体、例えば、CDやFD、MOなどの記録媒体、あるいは、ネットワークなどの通信媒体によって提供可能なコンピュータ・プログラムである。このようなプログラムをコンピュータ可読な形式で提供することにより、コンピュータシステム上でプログラムに応じた処理が実現される。
【0028】
本発明のさらに他の目的、特徴や利点は、後述する本発明の実施例や添付する図面に基づくより詳細な説明によって明らかになるであろう。なお、本明細書においてシステムとは、複数の装置の論理的集合構成であり、各構成の装置が同一筐体内にあるものには限らない。
【発明の効果】
【0029】
本発明の構成によれば、日常的にクライアントの送受信するメールから、ドキュメント(文書)のランキング情報として適用可能なデータを取得して、取得したデータをドキュメント情報格納部としてのインデックス格納部に格納し、これらのランキング情報に従って、クライアントに提供する文書情報、例えば、クライアントからの検索要求に応じて生成した検索結果データに対して、ランキング処理を実行してユーザに提示する構成としたので、ユーザによる文書の推薦処理といった手間をかけることなく、ユーザに対応した最適なランキングを行った情報提供が可能となる。
【発明を実施するための最良の形態】
【0030】
以下、図面を参照しながら本発明の情報処理装置、および情報処理方法、並びにコンピュータ・プログラムの詳細について説明する。
【0031】
図1は本発明の適用可能な情報検索システムの全体構成を示す図である。情報検索システムは、検索処理を実行する検索実行装置としての情報処理装置110、情報処理装置110に対してネットワーク150を介して検索の依頼を行い、検索結果を受領するクライアント131−1〜n、情報処理装置110における検索対象のデータファイルを格納したファイルサーバ121、クライアントの送受信するメールを格納するメールサーバ122によって構成される。
【0032】
クライアント131、検索実行装置としての情報処理装置110、ファイルサーバ121、メールサーバ122は、ネットワーク150を介して接続されている。ネットワークは、インターネット、イントラネット、LAN等の通信ネットワークである。
【0033】
ファイルサーバ121は、例えば、業務で利用されるドキュメントが格納された種々の文書管理システムを統括的に管理するサーバである。なお、ドキュメントとは、クライアントに提示される情報、すなわち検索対象となりえるドキュメントである。ファイルサーバ121は、クライアント131の検索対象のドキュメント実体を格納したデータベースを管理している。
【0034】
検索実行装置としての情報処理装置110は、ドキュメント実体は格納しておらず、ドキュメントの検索に適用可能なドキュメントID(文書ID)、要約、キーワードなど書誌事項、さらに、ランキング処理に適用するための様々なインデックス情報をインデックス格納部113に格納している。検索部112は、インデックス格納部113に格納されたインデックス情報に基づいて、例えばクライアントからの検索要求に応じた検索処理を実行し、ランキング処理を行ってユーザの興味の高いと判断されたドキュメント情報(インデックス格納部113に格納された情報)をリスト化して検索結果としてクライアントに提示する。
【0035】
検索実行装置としての情報処理装置110は、ランキング情報決定部111、検索部112、インデックス格納部113、データ収集・登録処理部114、ユーザ情報格納部115、ランキング処理部116を有する。
【0036】
情報処理装置110のデータ収集・登録処理部114は、ファイルサーバ121からドキュメント対応のインデックス情報を取得してインデックス格納部113に格納する処理を実行する。例えば、ドキュメントの検索に適用可能なドキュメントID(文書ID)、要約、キーワードなどの様々なインデックス情報である。
【0037】
ランキング情報決定部111は、クライアント131において送受信されているメールデータをメールサーバ122から取得し、取得したメールデータの属性情報、すなわち、メールの送受信ユーザ情報やメールの送信日付情報などの属性情報と、メール本文中に記述されているドキュメントの格納場所情報を抽出し、インデックス格納部113に、ドキュメントのインデックス情報を構成するランキング情報として格納する。
【0038】
検索部112は、例えばクライアントからの検索要求、例えばキーワードに基づく検索式や、特定のカテゴリを指定したデータ検索要求などに応じて、インデックス格納部113に格納されたインデックス情報に基づく検索処理を実行して検索結果をクライアント131に提供する。なお、前述したように、ドキュメント本体は、ファイルサーバ121に格納されており、ドキュメント対応の書誌情報、キーワード、文書IDなどの各種インデックス情報がインデックス格納部113に格納されている。
【0039】
ランキング情報決定部111は、メールサーバ122から、クライアント131の送受信するメールデータを取得し、メールの属性情報、メール本文中に記述されているドキュメントの格納場所情報などを抽出して、これらをインデックス情報としてインデックス格納部113に格納する。ランキング処理部116は、このインデックス情報を、例えば検索結果としてユーザに提供するドキュメント情報リストのランキングに適用する。
【0040】
ユーザ情報格納部115には、ユーザ名と、ユーザのメールアドレス、ユーザの所属などのユーザ情報が格納される。ランキング情報決定部111は、メールサーバ122から、クライアント131の送受信するメールデータを取得し、メール中に含まれるメールアドレスに基づいてユーザ情報格納部115からユーザ情報を取得し、取得したユーザ情報を適用してインデックス情報としてのランキング情報を生成し、インデックス格納部113に格納する。
【0041】
ランキング処理部116は、インデックス格納部113に格納したランキング情報に基づいて、検索部112の実行した検索処理結果としての検索結果リストのランキング処理を実行する。これらの処理の詳細については後述する。ランキング処理部116は、インデックス格納部に格納されたインデックス情報、具体的には、ランキング情報を適用して、ユーザにとって価値の高いドキュメントを抽出して価値の高い順にランキングしたランキングリストを生成する。検索部112は、このランキングリストを検索結果としてクライアント131に提供する。
【0042】
例えば、ユーザが検索を実行した際、検索結果として含まれるドキュメントのうち、ユーザ宛(またはCCにユーザアドレスが記述されていた)メールに、例えばドキュメント格納場所情報などドキュメント関連情報が記述されていたドキュメントについてリストの提示順序の優先度を上げた検索結果リストを生成してクライアントに提供する。本構成により、ユーザにとって価値が高いドキュメント、例えば、業務で参照することが要求されているドキュメント(文書)が検索結果リストにおいて優先的に提示されることとなる。この処理について、以下、詳細に説明する。
【0043】
図2以下を参照して、検索実行装置としての情報処理装置110の実行する処理の詳細について説明する。
【0044】
図2は、情報処理装置110のランキング情報決定部111、ランキング処理部116の実行する処理について、各処理機能毎に、順次説明する図である。図2に示すように、ランキング情報決定部111は、メール取得部201、ランキング情報抽出部202、メーリングリスト(ML)メンバー抽出部203、ユーザ情報抽出部204、更新文書決定部205、ランキング情報更新部206を有する。
【0045】
以下、これらの各処理部の実行する処理について、順次説明する。メール取得部201は、メールサーバ122からメール211を取得する。メール211は図1におけるクライアント131がネットワーク150を介して送受信するメールである。メール211のデータ構成例を図3に示す。
【0046】
図3には2つのメール構成例(a),(b)を示している。いずれも、属性データ部301と、本文データ部302から構成されており、
属性データ部301には、
送信日時情報[DATE]
送信者情報[FROM]
主題[Subject]
宛先[To]
の各データが含まれ、さらに、(b)には、
コピー送付先[cc]
のデータを含む構成となっている。
【0047】
また、本文データ部302には、
ランキング情報抽出部202(図2参照)の抽出対象データとしてのドキュメント情報311〜313が含まれる。なお、ドキュメント情報311〜313は、ドキュメントの格納場所情報、ドキュメント名情報など、ドキュメントに関する各種情報を含む。
【0048】
図2に示すランキング情報抽出部202は、メール取得部201がメールサーバ122から取得したメール211から、インデックス格納部113に格納すべきランキング情報(1)212の抽出処理を行なう。
【0049】
図4を参照して、ランキング情報抽出部202がメール211から抽出するランキング情報(1)212について説明する。ランキング情報抽出部202がメールから抽出するランキング情報には、図4に示すように、以下のデータが含まれる。
(1)メール本文中に記述されているドキュメント情報
(1a)ドキュメント格納場所情報(パス)
(1b)ドキュメント格納場所情報(文書名)
(2)メール宛先情報(To)
(3)メールコピー先情報(CC)
(4)メール送信者情報(FROM)
(5)メール送信日時情報(DATE)
少なくとも、上記(1)〜(5)中、(1)のドキュメント情報は必須情報であり、ドキュメント情報を含むメールについてのみ、その他の書誌情報として、上記(2)〜(5)について、メールから取得可能な情報を取得する。ドキュメント情報が含まれないメールデータについては、ランキング情報として適用しないので情報取得の必要はない。
【0050】
次に、図2に示すメーリングリスト(ML)抽出部203が、メールサーバ122に問い合わせを実行して、メーリングリスト(ML)と、メーリングリストの構成メンバーの対応データを記述したMLメンバーデータ217を取得し、取得した情報に基づいて、ランキング情報抽出部202が生成したランキング情報(1)212の更新を実行し、ランキング情報(2)213を生成する。
【0051】
図2に示すメーリングリスト(ML)抽出部203が、メールサーバ122から取得するMLメンバーデータ217の構成例を図5に示す。ML(メーリングリスト)メンバーデータ217は、図5に示すように、メーリングリスト(ML)と、メーリングリストの構成メンバーの対応データからなるテーブルデータである。図に示す例では、例えば、
ML:ProjectA・・・
は、メンバーとして、
fuji.hanako@xyz・・・
asama.taro@xyz・・・
hakuba.ichiro@xyz・・・
の各メンバーを含むことを示している。
【0052】
図2に示すメーリングリスト(ML)メンバー抽出部203は、これらの情報をメールサーバ122から取得し、これらの情報に基づいて、ランキング情報抽出部202が生成したランキング情報(1)212の更新を実行し、ランキング情報(2)213を生成する。
【0053】
メーリングリスト(ML)メンバー抽出部203の生成するランキング情報(2)213のデータ構成例を図6に示す。図6に示すランキング情報(2)は、先に図4を参照して説明したランキング情報(1)の更新情報であり、メール宛先情報(To)の項目に対応するデータが、更新されている。
【0054】
すなわち、図4に示したメール宛先情報(To)の項目に対応するデータに含まれるML(メーリングリスト)について、図5に示すMLメンバーデータに基づいて、メンバーに対応するアドレスデータに置き換えられている。具体的には、たとえば図4に示すパス¥PC1¥dataのメール宛先情報(To)の項目には、
ML:ProjectA・・・
のメーリングリストデータが格納されているが、
図6の対応データ格納部には、ML:ProjectA・・・のメーリングリストデータを図5に示すMLメンバーデータに基づいて、メンバーに対応するアドレスデータ、すなわち、
fuji.hanako@xyz・・・
asama.taro@xyz・・・
hakuba.ichiro@xyz・・・
の各メンバーのアドレスデータに置き換えられてる。
【0055】
このように、メーリングリスト(ML)メンバー抽出部203は、ランキング情報抽出部202の生成するランキング情報(1)212にメーリングリスト(ML)に相当するアドレス情報が含まれる場合、これらのMLデータを各個人のユーザアドレスに変更する処理を実行する。なお、上述の例では、宛先(To)データのみを対象とした処理例を示したが、その他、(CC)などのアドレスデータがMLデータによって記述されている場合も、同様のメンバーアドレスへの展開処理を実行する。
【0056】
次に、図2に示すユーザ情報抽出部204は、メーリングリスト(ML)メンバー抽出部203の生成したランキング情報(2)(図6参照)に、含まれるメールアドレスをキーとして、ユーザ情報格納部115から、メールアドレス対応のユーザ情報218を取得し、ランキング情報(2)(図6参照)に記録されたアドレスデータをユーザ情報に置き換えたランキング情報(3)214を生成する。
【0057】
図2に示すユーザ情報抽出部204が、メーリングリスト(ML)メンバー抽出部203の生成したランキング情報(2)(図6参照)に、含まれるメールアドレスをキーとして、ユーザ情報格納部115から取得するユーザ情報218の例を図7に示し、ランキング情報(2)(図6参照)に記録されたアドレスデータをユーザ情報に置き換えたランキング情報(3)214の例を図8に示す。
【0058】
図7に示すように、ユーザ情報格納部115から取得するユーザ情報218は、ユーザのメールアドレスと、ユーザ名、ユーザ所属先情報などを対応付けたデータとして構成される。図2に示すユーザ情報抽出部204は、メーリングリスト(ML)メンバー抽出部203の生成したランキング情報(2)(図6参照)に、含まれるメールアドレスに対応するユーザ情報を取得し、取得情報に基づいてランキング情報(2)(図6参照)を更新し、図8に示すランキング情報(3)を生成する。
【0059】
図8に示すランキング情報(3)は、図6に示したランキング情報(2)のアドレス情報がユーザ名に変更されたデータ構成を持つ。すなわち、メール宛先情報(To)、メールコピー先情報(CC)、メール送信者情報(FROM)の各欄に記録されていたアドレス情報がユーザ名として置き換えられている。なお、ここでは、ユーザ名のみをユーザ情報として設定した例を示しているが、所属などのユーザ情報を設定する構成としてもよい。
【0060】
次に、図2に示す更新文書決定部205は、ユーザ情報抽出部204が生成したランキング情報(3)214(図8参照)に基づいて、ランキング情報(3)214(図8参照)に含まれるドキュメント情報に対応するドキュメント(文書)に関するインデックス情報を更新リスト215としてインデックス格納部113から取得する。
【0061】
更新文書決定部205は、ユーザ情報抽出部204が生成したランキング情報(3)214(図8参照)に設定されているドキュメント(文書)情報に対応するドキュメント(文書)情報を持つインデックス情報を更新リスト215としてインデックス格納部113から取得する。
【0062】
図9に、インデックス格納部113から取得する更新リスト215の例を示す。図9に示す更新リストは、図8に示すランキング情報(3)に記録されたドキュメント(文書)情報に基づいて、インデックス格納部113から対応するドキュメント(文書)情報を持つインデックス情報(ランキング情報を含む)を取得した結果である。すなわち、図8に示すランキング情報(3)に記録されたドキュメント(文書)情報は、
パス:¥¥PC1¥data,文書:doc.txt
パス:http://ww.・・・,文書:download.html
パス:¥¥PCN¥data¥ProjectA・・・
の3つあり、これらの3ドキュメントについて、既にインデックス格納部113に格納されたインデックス情報が、ランキングデータの更新対象データ、すなわち更新リスト215としてインデックス格納部113から取得される。
【0063】
図9に示すデータが、インデックス格納部113から取得されるインデックス格納部113に格納済みのインデックスデータであり、
パス:¥¥PC1¥data,文書:doc.txt
パス:http://ww.・・・,文書:download.html
パス:¥¥PCN¥data¥ProjectA・・・
の3ドキュメントについてのインデックスデータである。
【0064】
インデックス格納部113に格納されるインデックスデータは、図9に示すように、ドキュメント(文書)情報と、ランキング情報によって構成される。ドキュメント情報には、ドキュメントの格納場所データとして、パス名、文書名などが格納される。また、ランキング情報は、後述するランキング処理に適用可能な情報であり、
(a)メール宛先情報(To)
(b)メールコピー先情報(CC)
(c)メール送信者情報(FROM)
(d)メール送信日時情報(DATE)
(e)文書名有無
の各データが格納される。
上記(a)〜(e)の各データは、ランキング情報決定部111が取得したメールに基づくランキングデータであり、メールに設定された、メール宛先情報(To)、メールコピー先情報(CC)、メール送信者情報(FROM)、メール送信日時情報(DATE)を記録したデータである。文書名の有無は、ランキング情報決定部111が取得したメールに文書名が含まれていた(True)か否(False)かのデータである。
【0065】
図2に示すランキング情報更新部206は、インデックス格納部113から取得した更新リスト215(図9参照)を、ユーザ情報抽出部204の生成したランキング情報(3)(図8参照)に従って更新処理を実行し、更新インデックス216を生成して、インデックス格納部113に格納する。
【0066】
図2に示すランキング情報更新部206の生成する更新インデックス216の例を図10に示す。図10において、ランキング情報部の太線枠内データ部351〜354が、ユーザ情報抽出部204の生成したランキング情報(3)(図8参照)に従って更新されたデータ部である。これらのデータは、更新リスト215(図9参照)には含まれていないデータである。
【0067】
更新リスト215(図9参照)は、図10に示す太線枠内データ部351〜354以外のデータのみからなり、ランキング情報更新部206は、新たに、ユーザ情報抽出部204の生成したランキング情報(3)(図8参照)のデータ、すなわち、太線枠内データ部351〜354を追加して更新インデックス216を生成して、インデックス格納部113に格納する。
【0068】
次に、ランキング処理部116の処理について説明する。前述したように、ランキング処理部116は、インデックス格納部113に格納したランキング情報に基づいて、検索部112の実行した検索処理結果としての検索結果リストのランキング処理を実行する。すなわち、インデックス格納部113に格納されたインデックス情報、具体的には、ランキング情報を適用して、ユーザにとって価値の高いドキュメントを抽出して価値の高い順にランキングしたランキングリストを生成する。検索部112は、このランキングリストを検索結果としてクライアント131に提供する。
【0069】
ランキング処理部116は、検索部112の検索結果に含まれるドキュメントのランキングを実行するため、まず、ランキング情報ごとの重みと係数を設定する。この処理について、図11を参照して説明する。
【0070】
ランキング情報は、インデックス格納部113に格納されたインデックス情報に含まれるデータであり、図10を参照して説明したように、ドキュメント情報に対応付けられた以下のデータ項目によって構成される。すなわち、
(a)メール宛先情報(To)
(b)メールコピー先情報(CC)
(c)メール送信者情報(FROM)
(d)メール送信日時情報(DATE)
(e)文書名有無
【0071】
ランキング処理部116は、これらのランキング情報各々について重み(W)と係数(N)を定める。重み(W)と係数(N)の決定態様は、様々な設定が可能である。ここで示す例は、メール送信日時情報としての日付データは、ソート処理に適用するデータ項目とし、
(a)メール宛先情報(To)
(b)メールコピー先情報(CC)
(c)メール送信者情報(FROM)
に、それぞれ重み(W)を設定し、
(e)文書名有無
のデータに係数(N)を設定した処理例を説明する。
【0072】
ランキング処理部116は、図11に示すように、
(a)メール宛先情報(To)の重みをWTO
(b)メールコピー先情報(CC)の重みをWCC
(c)メール送信者情報(FROM)の重みをWFROM
とし、
(e)文書名有無
のデータに係数を、
Trueの場合の係数:N=NTRUE
Falseの場合の係数:N=NFALSE
とする。
【0073】
ランキング処理部116は、これらの重み(W)、係数(N)に基づいて、検索部112の実行した検索結果に対してランキング処理を実行する。検索部112の実行した検索に基づく検索結果を図2に示す検索結果(1)221とし、ランキング処理部116におけるランキング処理を実行した検索結果を検索結果(2)222とする。
【0074】
図12のフローチャートを参照して、検索部112の実行した検索に基づく検索結果(1)から、ランキング処理部116におけるランキング処理を実行し、検索結果(2)を取得する処理手順について説明する。
【0075】
ランキング処理部116は、まず、検索部112の実行した検索に基づく検索結果(1)を入力すると、ステップS101〜ステップS105において、検索結果(1)に含まれるドキュメント(文書)各々について、
ランク値[R]、
日付代表値[T]、
を定める。
【0076】
まず、ステップS101において、検索結果(1)から処理対象のドキュメント(文書)を選択し、ステップS102において、選択ドキュメント(文書)に含まれる各ランキング情報(ロー(行))についてランク値[r]を、下記式、
r=(isTO×WTO+isCC×WCC+isFROM×WFROM)×N
にしたがって、算出する。
上記式において、
isTOは、ランキング情報におけるメール宛先情報(To)のデータ欄に検索実行者のユーザ名が存在する場合は[1]、存在しない場合は[0]となる値をとる。
isCCは、ランキング情報におけるメールコピー先情報(CC)のデータ欄に検索実行者のユーザ名が存在する場合は[1]、存在しない場合は[0]となる値をとる。
isFROMは、ランキング情報におけるメール送信者情報(FROM)のデータ欄に検索実行者のユーザ名が存在する場合は[1]、存在しない場合は[0]となる値をとる。
【0077】
上記式に従って、選択ドキュメント(文書)に含まれる各ランキング情報(ロー(行))についてのランク値[r]を算出し、ステップS103において、選択文書に対する全てのランキング情報のランク値算出処理の終了を判定し、終了していない場合は、ステップS102戻り、選択文書に対する未処理のランキング情報のランク値算出を実行する。
【0078】
選択文書に対する全てのランキング情報のランク値算出処理が終了した場合は、ステップS104に進み、各ランキング情報(ロー(行))についてのランク値[r]を積算:ΣR+して、選択ドキュメント(文書)のランク値[R]を求める。
【0079】
なお、日付代表値[T]は、ステップS101において算出される値であり、処理対象の1つの文書に対して、複数のランキング情報が存在する場合は、最新の日付を日付代表値[T]とする。
【0080】
このように、ランク値[R]は、処理対象の1つの文書に対して、複数のランキング情報が存在する場合は、各ランキング情報単位で算出し、全ての算出値の積算値を、そのドキュメント(文書)のランキング値[R]とする。また、日付代表値[T]は、処理対象の1つの文書に対して、複数のランキング情報が存在する場合は、最新の日付を日付代表値[T]とする。
【0081】
図12に示すステップS101〜S105において、検索結果(1)に含まれるドキュメント(文書)各々について、
ランク値[R]、
日付代表値[T]、
が算出された後、ステップS106において、検索結果(1)に含まれるドキュメント(文書)のリストを、ドキュメント(文書)各々についてのランク値[R]と、日付代表値[T]とを適用してソート処理を実行して、検索結果(2)222(図2参照)を生成する。
【0082】
具体的な処理例について、図13を参照して説明する。図13(a)は、検索部112の検索結果(1)を示している。例えばクライアントが示したキーワードなどに基づく検索条件に従って、検索部112がインデックス格納部113に格納されたインデックスに基づいて抽出した検索結果データである。前述したように、インデックス情報は、ドキュメント(文書)情報と、ランキング情報とによって構成されている。ランキング情報は、それぞれメールに基づいて取得されたデータである。
【0083】
例えば、検索結果ID[1]に対応する文書、すなわち、
パス:¥¥PC1¥data、文書名:doc.txt
の文書は、それぞれ異なるメールに基づいて取得された3つのランキング情報421〜423を有することを意味している。
【0084】
図13を参照して、図13(a)の検索結果(1)に含まれるドキュメント(文書)として、検索結果ID[1]に対応する文書、すなわち、
パス:¥¥PC1¥data、文書名:doc.txt
についてのランク値[R]と、日付代表値[T]の算出処理例について説明する。
【0085】
ここで、検索実施ユーザは、図13(c)に示すように、
ユーザ名:asama
であるとする。
また、前述した重み[W]と、係数[T]は、図13(c)に示すように、
(a)メール宛先情報(To)の重みをWTO=100
(b)メールコピー先情報(CC)の重みをWCC=50
(c)メール送信者情報(FROM)の重みをWFROM=70
として設定され、また、
(e)文書名有無
のデータに対する係数が、
Trueの場合の係数:NTRUE=1、
Falseの場合の係数:NFALSE=0.5
として設定されているものとする。
【0086】
このとき、図13(a)に示す
パス:¥¥PC1¥data、文書名:doc.txt
についてのランク値[R]と、日付代表値[T]は、
図13(b)に示す算出式によって求められる。すなわち、
R=(1×100+0×50+0×70)×1
+(1×100+0×50+0×70)×1
+(1×100+0×50+0×70)×0.5
=250
となる。
【0087】
上記式において、
(1×100+0×50+0×70)×1
は、パス:¥¥PC1¥data、文書名:doc.txtのランキング情報中の最上段のロー(行)421のランキング情報データに基づく算出式であり、
最初の[1×100]は、メール宛先情報(To)のデータ、すなわち、図13のデータ401に基づいており、データ401に、
検索ユーザ名:asama
が含まれていることで[1]が設定され、さらに、メール宛先情報(To)の重み:WTO=100を乗算している。
次の[0×50]は、メールコピー先情報(CC)のデータ、すなわち、図13のデータ402に基づいており、データ402に、
検索ユーザ名:asama
が含まれていないことで[0]が設定され、さらに、メールコピー先情報(CC)の重み:WCC=50を乗算している。
次の[0×70]は、メール送信者情報(FROM)のデータ、すなわち、図13のデータ403に基づいており、データ403に、
検索ユーザ名:asama
が含まれていないことで[0]が設定され、さらに、メール送信者情報(FROM)の重み:WFROM=70を乗算している。
最後の[×1]は、文書名ありのデータ、すなわち、図13のデータ404に基づいており、データ404に設定された情報が、文書名あり[True]を示していることから、文書名有無のデータに対する係数としての、Trueの場合の係数:NTRUE=1、
を乗算している。
【0088】
図13(b)に示すランク値[R]の算出式中の第2行の式、すなわち、
(1×100+0×50+0×70)×1
は、図13に示すパス:¥¥PC1¥data、文書名:doc.txtのランキング情報中の中段のロー(行)422のランキング情報に対応する算出式であり、
図13(b)に示すランク値[R]の算出式中の第3行の式、すなわち、
(1×100+0×50+0×70)×0.5
は、図13に示すパス:¥¥PC1¥data、文書名:doc.txtのランキング情報中の下段のロー(行)423のランキング情報に対応する算出式である。
【0089】
各ロー(行)421〜423は、いずれも、パス:¥¥PC1¥data、文書名:doc.txtのランキング情報として、それぞれ個別のメールにもとづいて取得されたランキング情報である。結果として、パス:¥¥PC1¥data、文書名:doc.txtに対応するランク値[R]は、これら3つのランキング情報に対応する算出ランク値の積算値として算出される。すなわち、
R=(1×100+0×50+0×70)×1
+(1×100+0×50+0×70)×1
+(1×100+0×50+0×70)×0.5
=250
となる。
【0090】
一方、パス:¥¥PC1¥data、文書名:doc.txtの日付代表値[T]は、前述したように、処理対象の1つの文書に対して、複数のランキング情報が存在する場合は、最新の日付を日付代表値[T]とするという規則に基づいて、図13(b)に示すように、
T=max(2004/03/12,2004/03/08,2004/03/05)
=2004/03/12
として、求められる。
【0091】
このように、図12のステップS101、S102では、検索結果(1)に含まれるドキュメント(文書)について、ランク値[R]と、日付代表値[T]とが求められる。ランク値[R]と、日付代表値[T]は、検索結果(1)に含まれるドキュメント(文書)各々について算出される。
【0092】
上述した処理を検索結果(1)に含まれるドキュメント(文書)各々について実行して、検索結果(1)に含まれるドキュメント(文書)について、ランク値[R]と、日付代表値[T]が求められた後、図12のフローのステップS106に進む。
【0093】
ステップS106では、検索結果(1)に含まれるドキュメント(文書)のリストを、ドキュメント(文書)各々についてのランク値[R]と、日付代表値[T]とを適用してソート処理を実行して、検索結果(2)222(図2参照)を生成する。
【0094】
ソート結果として取得されるリスト、すなわち検索結果(2)の例を図14に示す。図14の検索結果(2)は、図12(a)に示す検索結果(1)に基づいて生成されたデータであり、検索結果(1)に示す各文書、すなわち、
(ID1)¥¥PC1¥data,doc.txt
(ID2)http://www・・・download.htm
(ID3)¥¥PCN¥data・・・Info.doc
の3文書について、ランク値[R]と、日付代表値[T]とを適用してソート処理を実行した結果が、図14に示す検索結果(2)である。
【0095】
各文書のランク値[R]と、日付代表値[T]は、図14に示すように、
ID1の文書:ランク値R=250、日付代表値T=2004/03/12
ID2の文書:ランク値R=100、日付代表値T=2004/03/12
ID3の文書:ランク値R=220、日付代表値T=2004/03/08
として算出されている。
【0096】
本例において、ソート処理は、図12のステップS106に記述しているように、ランク値[R]を第1キーとして、日付代表値[T]を第2キーとしてソート処理を実行する。結果として、図14に示すように、リスト順は、
(リスト1)ID1の文書:ランク値R=250、日付代表値T=2,004/03/1
(リスト2)ID3の文書:ランク値R=220、日付代表値T=2004/03/08
(リスト3)ID2の文書:ランク値R=100、日付代表値T=2004/03/12
として、検索結果(2)が生成される。
【0097】
なお、上述のソート処理におけるソートキーの設定は一例であり、この他のソートキーの設定を適用してソートを行うことは可能である。
【0098】
このように、本発明の構成では、日常的にクライアントの送受信するメールから、ドキュメント(文書)のランキング情報を取得して、取得したランキング情報に従って、クライアントに提供する文書情報、例えば、クライアントからの検索要求に応じて生成した検索結果データに対して、ランキング処理を実行してユーザに提示することが可能となり、ユーザによる文書の推薦処理といった手間をかけることなく、ユーザに対応した最適なランキングを行った情報提供が可能となる。
【0099】
最後に、上述した処理を実行する情報処理装置110のハードウェア構成例について、図15を参照して説明する。
【0100】
CPU(Central Processing Unit)501は、OS(Operating System)、上述の実施例において説明した検索処理、ランキング情報決定処理、ランキング処理等の各処理の実行シーケンスを記述した各種コンピュータ・プログラムに従った処理を実行する制御部である。
【0101】
ROM(Read Only Memory)502は、CPU501が使用するプログラムや演算パラメータ等を格納する。RAM(Random Access Memory)503は、CPU501の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはCPUバスなどから構成されるホストバス504により相互に接続されている。
【0102】
ホストバス504は、ブリッジ505を介して、PCI(Peripheral Component Interconnect/Interface)バスなどの外部バス506に接続されている。
【0103】
キーボード508、ポインティングデバイス509は、ユーザにより操作される入力デバイスである。ディスプレイ510は、液晶表示装置またはCRT(Cathode Ray Tube)などから成り、各種情報をテキストやイメージで表示する。
【0104】
HDD(Hard Disk Drive)511は、ハードディスクを内蔵し、ハードディスクを駆動し、CPU501によって実行するプログラムや情報を記録または再生させる。ハードディスクは、図1に示すインデックス格納部113としての役割、および各種のデータ処理プログラム等、各種コンピュータ・プログラムが格納される。
【0105】
ドライブ512は、装着されている磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリ等のリムーバブル記録媒体521に記録されているデータまたはプログラムを読み出して、そのデータまたはプログラムを、インタフェース507、外部バス506、ブリッジ505、およびホストバス504を介して接続されているRAM503に供給する。
【0106】
接続ポート514は、外部接続機器522を接続するポートであり、USB,IEEE1394等の接続部を持つ。接続ポート514は、インタフェース507、および外部バス506、ブリッジ505、ホストバス504等を介してCPU501等に接続されている。通信部515は、ネットワークに接続され、CPU501、またはHDD511等からの供給データの送信、データ受信を実行する。
【0107】
なお、図15に示す情報処理装置のハードウェア構成例は、PCを適用して構成した装置の一例であり、本発明の情報処理装置は、図15に示す構成に限らず、上述した実施例において説明した処理を実行可能な構成であればよい。
【0108】
以上、特定の実施例を参照しながら、本発明について詳解してきた。しかしながら、本発明の要旨を逸脱しない範囲で当業者が該実施例の修正や代用を成し得ることは自明である。すなわち、例示という形態で本発明を開示してきたのであり、限定的に解釈されるべきではない。本発明の要旨を判断するためには、特許請求の範囲の欄を参酌すべきである。
【0109】
なお、明細書中において説明した一連の処理はハードウェア、またはソフトウェア、あるいは両者の複合構成によって実行することが可能である。ソフトウェアによる処理を実行する場合は、処理シーケンスを記録したプログラムを、専用のハードウェアに組み込まれたコンピュータ内のメモリにインストールして実行させるか、あるいは、各種処理が実行可能な汎用コンピュータにプログラムをインストールして実行させることが可能である。
【0110】
例えば、プログラムは記録媒体としてのハードディスクやROM(Read Only Memory)に予め記録しておくことができる。あるいは、プログラムはフレキシブルディスク、CD−ROM(Compact Disc Read Only Memory),MO(Magneto optical)ディスク,DVD(Digital Versatile Disc)、磁気ディスク、半導体メモリなどのリムーバブル記録媒体に、一時的あるいは永続的に格納(記録)しておくことができる。このようなリムーバブル記録媒体は、いわゆるパッケージソフトウエアとして提供することができる。
【0111】
なお、プログラムは、上述したようなリムーバブル記録媒体からコンピュータにインストールする他、ダウンロードサイトから、コンピュータに無線転送したり、LAN(Local Area Network)、インターネットといったネットワークを介して、コンピュータに有線で転送し、コンピュータでは、そのようにして転送されてくるプログラムを受信し、内蔵するハードディスク等の記録媒体にインストールすることができる。
【0112】
なお、明細書に記載された各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。また、本明細書においてシステムとは、複数の装置の論理的集合構成であり、各構成の装置が同一筐体内にあるものには限らない。
【産業上の利用可能性】
【0113】
以上、説明したように、本発明の構成によれば、日常的にクライアントの送受信するメールから、ドキュメント(文書)のランキング情報として適用可能なデータを取得して、取得したデータをドキュメント情報格納部としてのインデックス格納部に格納し、これらのランキング情報に従って、クライアントに提供する文書情報、例えば、クライアントからの検索要求に応じて生成した検索結果データに対して、ランキング処理を実行してユーザに提示する構成としたので、ユーザによる文書の推薦処理といった手間をかけることなく、ユーザに対応した最適なランキングを行った情報提供が可能となり、ユーザに適応したデータリストなど、検索結果を効率的に提供可能な検索システム、情報提供システムが構築可能となる。
【図面の簡単な説明】
【0114】
【図1】本発明の適用可能な情報検索システムの全体構成を示す図である。
【図2】検索実行装置としての情報処理装置110の実行する処理の詳細について説明する図である。
【図3】クライアントがネットワークを介して送受信するメールのデータ構成例を示す図である。
【図4】ランキング情報抽出部202がメールから抽出するランキング情報(1)について説明する図である。
【図5】メーリングリスト(ML)抽出部203が、メールサーバ122から取得するMLメンバーデータの構成例を示す図である。
【図6】メーリングリスト(ML)メンバー抽出部203の生成するランキング情報(2)のデータ構成例を説明する図である。
【図7】ユーザ情報抽出部204が、メーリングリスト(ML)メンバー抽出部203の生成したランキング情報(2)(図6)に、含まれるメールアドレスをキーとして、ユーザ情報格納部115から取得するユーザ情報の例を説明する図である。
【図8】ランキング情報(2)(図6)に記録されたアドレスデータをユーザ情報に置き換えたランキング情報(3)の例を示す図である。
【図9】インデックス格納部113から取得する更新リストの例を示す図である。
【図10】ランキング情報更新部206の生成する更新インデックスの例を示す図である。
【図11】ランキング処理部におけるランキングを実行するためのランキング情報ごとの重みと係数を設定する処理について説明する図である。
【図12】検索部112の実行した検索に基づく検索結果(1)から、ランキング処理部116におけるランキング処理を実行し、検索結果(2)を取得する処理手順について説明するフロー図である。
【図13】ランク値[R]の算出、日付代表値の算出処理の具体例について説明する図である。
【図14】ソート結果として取得されるリストである検索結果(2)のデータ例を示す図である。
【図15】検索処理及び検索結果の生成、提示処理を実行する情報処理装置のハードウェア構成例について説明する図である。
【符号の説明】
【0115】
110 情報処理装置
111 ランキング情報決定部
112 検索部
113 インデックス格納部
114 データ収集・登録処理部
115 ユーザ情報格納部
116 ランキング処理部
121 ファイルサーバ
122 メールサーバ
131 クライアント
150 ネットワーク
201 メール取得部
202 ランキング情報抽出部
203 メーリングリスト(ML)メンバー抽出部
204 ユーザ情報抽出部
205 更新文書決定部
206 ランキング情報更新部
211 メール
212 ランキング情報(1)
213 ランキング情報(2)
214 ランキング情報(3)
215 更新リスト
216 更新インデックス
217 MLメンバーデータ
218 ユーザ情報
221 検索結果(1)
222 検索結果(2)
301 属性データ部
302 本文データ部
311〜313 ドキュメント情報
351〜354 データ部
401〜404 データ
421〜423 ランキング情報
501 CPU(Central Processing Unit)
502 ROM(Read-Only-Memory)
503 RAM(Random Access Memory)
504 ホストバス
505 ブリッジ
506 外部バス
507 インタフェース
508 キーボード
509 ポインティングデバイス
510 ディスプレイ
511 HDD(Hard Disk Drive)
512 ドライブ
514 接続ポート
515 通信部
521 リムーバブル記録媒体
522 外部接続機器

【特許請求の範囲】
【請求項1】
情報処理装置であり、
クライアントに提供するドキュメント情報を含むインデックスデータを格納したインデックス格納部と、
前記インデックス格納部の格納情報に基づいて検索処理を実行する検索部と、
ネットワークを介して転送されるメールデータから、前記ドキュメント情報のランキング処理に適用するランキング情報を取得し、各ドキュメント対応のランキング情報として、前記インデックス格納部に格納する処理を実行するランキング情報決定部と、
前記検索部の検索により生成された第1の検索結果に対して、前記ランキング情報を適用した提供データ生成処理を実行し、ランキング情報を反映した第2の検索結果を生成するランキング処理部と、
を有することを特徴とする情報処理装置。
【請求項2】
前記ランキング情報決定部は、
ネットワークを介して転送されるメールデータから、
(a)メール本文中に記述されているドキュメント情報、
(b)メール宛先情報(To)、
(c)メールコピー先情報(CC)、
(d)メール送信者情報(FROM)、
(e)メール送信日時情報(DATE)、
上記(a)〜(e)の情報中、少なくとも(a)ドキュメント情報と、その他の(b)〜(e)中、取得可能なデータをランキング情報として取得する処理を実行する構成であることを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記ランキング情報決定部は、
ランキング情報として取得するメールアドレスデータに複数のメールアドレスの集合として設定されたメーリングリストを、各ユーザ対応のメールアドレスに変換する処理を実行する構成であることを特徴とする請求項1に記載の情報処理装置。
【請求項4】
前記情報処理装置は、さらに、
メールアドレス情報とユーザ名とを対応付けたユーザ情報データを格納したユーザ情報格納部を有し、
前記ランキング情報決定部は、
ランキング情報として取得するメールアドレスデータを、前記ユーザ情報に従って、ユーザ名に変換し、ランキング情報を生成する処理を実行する構成であることを特徴とする請求項1に記載の情報処理装置。
【請求項5】
前記ランキング情報決定部は、
ネットワークを介して転送されるメールデータから、前記ドキュメント情報のランキング処理に適用するランキング情報を取得した場合、
前記インデックス格納部に格納済みのインデックスデータに、取得ランキング情報を追加する更新処理を実行する構成であることを特徴とする請求項1に記載の情報処理装置。
【請求項6】
前記ランキング処理部は、
前記ランキング情報の構成データに対して重み(W)または係数(N)を設定し、
前記検索部の検索により生成された第1の検索結果に含まれるドキュメントに対応して設定されたランキング情報に基づいて、前記重み(W)および係数(N)と、該ランキング情報の構成データに検索実行ユーザが含まれるか否かによって異なる値とした変数とに基づいて、ドキュメント対応のランク値[R]を算出し、該算出したランク値[R]に基づいて、前記第1の検索結果に含まれるドキュメントのソート処理を実行し、ランキング情報を反映した第2の検索結果を生成する構成であることを特徴とする請求項1に記載の情報処理装置。
【請求項7】
前記ランキング処理部は、
ランキング情報を構成するメール宛先情報(To)、メールコピー先情報(CC)、メール送信者情報(FROM)の各々について、重み(W)を決定し、さらに、ランキング情報を構成する文書の有無を示すデータについて文書有無に応じて異なる値とした係数(N)を設定する構成であることを特徴とする請求項1に記載の情報処理装置。
【請求項8】
前記ランキング処理部は、
前記検索部の検索により生成された第1の検索結果に含まれるドキュメントに対応して設定されたランキング情報に含まれるメール送信日時情報としての日付データについて、同一ドキュメントについて最新のデータを取得する日付代表値[T]算出処理を実行し、該算出した日付代表値[T]に基づいて、前記第1の検索結果に含まれるドキュメントのソート処理を実行し、ランキング情報を反映した第2の検索結果を生成する構成であることを特徴とする請求項1に記載の情報処理装置。
【請求項9】
前記ランキング処理部は、
前記検索部の検索により生成された第1の検索結果に対して、前記ランキング情報を適用したソート処理を実行し、ランキング情報を反映した第2の検索結果を生成する構成であることを特徴とする請求項1に記載の情報処理装置。
【請求項10】
ランキング情報に基づくデータ処理をコンピュータ上で実行させるコンピュータ・プログラムであり、
ネットワークを介して転送されるメールデータから、ドキュメント情報のランキング処理に適用するランキング情報を取得し、各ドキュメント対応のランキング情報として、インデックス格納部に格納する処理を実行するランキング情報決定ステップと、
前記インデックス格納部の格納情報に基づいて検索処理を実行する検索ステップと、
前記検索ステップにおける検索により生成された第1の検索結果に対して、前記ランキング情報を適用したソート処理を実行し、ランキング情報を反映した第2の検索結果を生成するランキング処理ステップと、
を有することを特徴とするコンピュータ・プログラム。
【請求項11】
前記ランキング情報決定ステップは、
ネットワークを介して転送されるメールデータから、
(a)メール本文中に記述されているドキュメント情報、
(b)メール宛先情報(To)、
(c)メールコピー先情報(CC)、
(d)メール送信者情報(FROM)、
(e)メール送信日時情報(DATE)、
上記(a)〜(e)の情報中、少なくとも(a)ドキュメント情報と、その他の(b)〜(e)中、取得可能なデータをランキング情報として取得する処理を実行するステップを含むことを特徴とする請求項10に記載のコンピュータ・プログラム。
【請求項12】
前記ランキング情報決定ステップは、
ランキング情報として取得するメールアドレスデータに複数のメールアドレスの集合として設定されたメーリングリストを、各ユーザ対応のメールアドレスに変換する処理を実行するステップを含むことを特徴とする請求項10に記載のコンピュータ・プログラム。
【請求項13】
前記ランキング情報決定ステップは、
ランキング情報として取得するメールアドレスデータを、メールアドレス情報とユーザ名とを対応付けたユーザ情報データを格納したユーザ情報格納部から取得するユーザ情報に従って、ユーザ名に変換し、ランキング情報を生成する処理を実行するステップを含むことを特徴とする請求項10に記載のコンピュータ・プログラム。
【請求項14】
前記ランキング情報決定ステップは、
ネットワークを介して転送されるメールデータから、前記ドキュメント情報のランキング処理に適用するランキング情報を取得した場合、
前記インデックス格納部に格納済みのインデックスデータに、取得ランキング情報を追加する更新処理を実行することを特徴とする請求項10に記載のコンピュータ・プログラム。
【請求項15】
前記ランキング処理ステップは、
前記ランキング情報の構成データに対して重み(W)または係数(N)を設定し、
前記第1の検索結果に含まれるドキュメントに対応して設定されたランキング情報に基づいて、前記重み(W)および係数(N)と、該ランキング情報の構成データに検索実行ユーザが含まれるか否かによって異なる値とした変数とに基づいて、ドキュメント対応のランク値[R]を算出し、該算出したランク値[R]に基づいて、前記第1の検索結果に含まれるドキュメントのソート処理を実行し、ランキング情報を反映した第2の検索結果を生成するステップを含むことを特徴とする請求項10に記載のコンピュータ・プログラム。
【請求項16】
前記ランキング処理ステップは、
ランキング情報を構成するメール宛先情報(To)、メールコピー先情報(CC)、メール送信者情報(FROM)の各々について、重み(W)を決定し、さらに、ランキング情報を構成する文書の有無を示すデータについて文書有無に応じて異なる値とした係数(N)を設定するステップを含むことを特徴とする請求項10に記載のコンピュータ・プログラム。
【請求項17】
前記ランキング処理ステップは、
前記第1の検索結果に含まれるドキュメントに対応して設定されたランキング情報に含まれるメール送信日時情報としての日付データについて、同一ドキュメントについて最新のデータを取得する日付代表値[T]算出処理を実行し、該算出した日付代表値[T]に基づいて、前記第1の検索結果に含まれるドキュメントのソート処理を実行し、ランキング情報を反映した第2の検索結果を生成するステップを含むことを特徴とする請求項10に記載のコンピュータ・プログラム。
【請求項18】
前記ランキング処理ステップは、
前記第1の検索結果に対して、前記ランキング情報を適用したソート処理を実行し、ランキング情報を反映した第2の検索結果を生成するステップを含むことを特徴とする請求項10に記載のコンピュータ・プログラム。
【請求項19】
ランキング情報に基づくデータ処理を実行する情報処理方法であり、
ランキング情報決定部における処理であり、ネットワークを介して転送されるメールデータから、ドキュメント情報のランキング処理に適用するランキング情報を取得し、各ドキュメント対応のランキング情報として、インデックス格納部に格納する処理を実行するランキング情報決定ステップと、
検索部における処理であり、前記インデックス格納部の格納情報に基づいて検索処理を実行する検索ステップと、
ランキング処理部における処理であり、前記検索ステップにおける検索により生成された第1の検索結果に対して、前記ランキング情報を適用した提供データ生成処理を実行し、ランキング情報を反映した第2の検索結果を生成するランキング処理ステップと、
を有することを特徴とする情報処理方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate


【公開番号】特開2006−85564(P2006−85564A)
【公開日】平成18年3月30日(2006.3.30)
【国際特許分類】
【出願番号】特願2004−271457(P2004−271457)
【出願日】平成16年9月17日(2004.9.17)
【出願人】(000005496)富士ゼロックス株式会社 (21,908)
【Fターム(参考)】