説明

関連文書表示システム、関連文書表示方法およびプログラム

【課題】電子データである文書の集合を用いた調査業務等において、ユーザによる文書の閲覧時に、関連する文書を適切に表示することを課題とする。
【解決手段】本発明の関連文書表示システム1000は、文書の集合における過去の文書の作成に基づく関連する文書同士を有効な関連リンクとして関連リンク記憶部(関連リンク管理情報530)に記憶する関連学習制御部223と、その後、ユーザによって文書の集合におけるいずれかの文書が閲覧された場合、関連リンク記憶部を参照して、閲覧された文書と有効な関連リンクを有する文書を抽出し、当該抽出した文書を、閲覧された文書に関連する文書として表示部に表示するレコメンド制御部(proxy部228)と、を有する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、電子データである文書の集合からユーザが文書を閲覧する際に、関連する文書を推薦(表示)するレコメンデーション機能に関する。
【背景技術】
【0002】
あいまいな既存情報から調査をすすめて、所望する情報を得る業務がある。例えば、顧客からの問合せ内容に対してユーザ(調査者)が社内システムやインターネット等を利用して文書を調査し、調査結果を顧客に回答するテクニカルサポートセンタやヘルプデスクといった調査業務である。
【0003】
前記調査業務において、ユーザは社内システムやインターネットでの検索やリンクを辿るなど試行錯誤して多くの参考文書を参照する。この方法では、一般に、情報提供者(Webページ提供者等)の観点でしか情報検索できないため、作業効率が悪い。
【0004】
一方、利用者の観点で情報をレコメンドする技術には以下のものがある。例えば、ブラウザの検索キーワード入力欄に検索キーワードを入力すると、統計的に学習した関連のある検索キーワードを提示する技術である(特許文献1参照)。その他には、インターネット書籍販売サイトにてユーザが書籍を参照した際に、過去のユーザの購入履歴に基づき前記参照する書籍を購入した人が別途購入した書籍を提示する技術である(特許文献2参照。「書籍」が本発明における「文書」と対応)。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】米国特許出願公開第2005/0198068号明細書
【特許文献2】米国特許第6266649号明細書
【発明の概要】
【発明が解決しようとする課題】
【0006】
前記した従来技術においては、以下の課題がある。
まず、特許文献1の技術では、インターネットにおける膨大な情報から適切な情報を選別することを目的にしている。つまり、扱う情報量が膨大であるため、一般に、少数の検索キーワードで検索しただけでは検索結果集合も大きなものとなり、一覧から適切な情報を選別することが困難となる。
【0007】
これを解決するために、特許文献1の技術では、検索結果をより小さく絞り込むために、同一キーワードを多数含む膨大な検索ログを対象にキーワードの共起に着目した統計処理を行い、論理積(AND)条件となる検索キーワード候補を抽出する。例えば、「不況」というキーワードで検索すると、「原因」や「節約」といった検索キーワードが同時検索の候補としてレコメンド(推薦)される。
【0008】
一方、企業内のLAN(Local Area Network)システム等を利用した業務(以下、単に「業務」という。)では、インターネットに比べて対象とする情報量および検索トラフィック密度が少ないため、論理積(AND)条件となる検索キーワードによる絞込検索よりも、現在の検索結果集合には必ずしも存在しないが、業務上関連の深い情報を効率良く提示することがより重要である。検索でいえば検索キーワード入力欄を一度クリアした後に入力するようなキーワード候補を提示することが重要である。しかし、特許文献1の技術では、結果集合が論理和(OR)となるような関連キーワードを提示することができない。なお、論理積(AND)を求めるための絞り込むキーワードの場合、検索ログを大量に得ることが困難な業務においては適切にレコメンドすることができない。
【0009】
また、特許文献2の技術では、複数のユーザが過去に参照した情報から関連を統計的に学習し、ユーザの嗜好をパターンとして抽出して、類似の嗜好を持つ人に興味のあると思われる情報を提示する。すなわち、個人を特定しないまま人の嗜好をパターン化している。つまり、特許文献2の技術では、大量の購買履歴を商品の共起に着目して統計的に処理することで、人の嗜好のパターンを抽出している。
【0010】
一方、業務(例えば、サポートセンタ等)は、担当する人ではなく、受け付けた問い合わせ等の業務案件によって参照すべき情報が大きく異なることが特徴である。また、業務では同時に参照すべき関連性の高い情報が存在するが、一方で同一情報の利用頻度はB to C(Business to Consumer)における同一商品の購入頻度ほど高くないと考えられる。そして、特許文献2の技術では、現在の業務に関連が強いが、他の業務とは異なる可能性のある情報を業務毎にレコメンドすることができない。また、特許文献2の技術では、統計処理に向かない程度に参照回数が少ない情報同士の関連を提示することができない。
【0011】
そこで、本発明は、前記課題に鑑みてなされたものであり、電子データである文書の集合を用いた調査業務等において、ユーザによる文書の閲覧時に、関連する文書を適切に表示することを課題とする。
【課題を解決するための手段】
【0012】
前記課題を解決するために、本発明の関連文書表示システムは、文書の集合における過去の文書の作成に基づく関連する文書同士を有効な関連リンクとして関連リンク記憶部に記憶する関連学習制御部と、その後、ユーザによって文書の集合におけるいずれかの文書が閲覧された場合、関連リンク記憶部を参照して、閲覧された文書と有効な関連リンクを有する文書を抽出し、当該抽出した文書を、閲覧された文書に関連する文書として表示部に表示するレコメンド制御部と、を有する。その他の手段については後記する。
【発明の効果】
【0013】
本発明によれば、電子データである文書の集合を用いた調査業務等において、ユーザによる文書の閲覧時に、関連する文書を適切に表示することができる。
【図面の簡単な説明】
【0014】
【図1】第1の実施形態の関連文書表示システムのハードウェア構成の一例を示す図である。
【図2】第1の実施形態の関連文書表示システムのソフトウェアおよびハードウェアの構成の一例を示す図である。
【図3】第1の実施形態の関連文書表示システムの原理の一例を示す図である。
【図4】第1の実施形態の関連イベントテーブルの一例を示す図である。
【図5】第1の実施形態の案件セッション別有効文書一覧テーブルの一例を示す図である。
【図6】第1の実施形態の関連リンク管理情報の一例を示す図である。
【図7】第1の実施形態のキーワードテーブルの一例を示す図である。
【図8】第1の実施形態の案件セッションID用Cookieの一例を示す図である。
【図9】第1の実施形態の文書用Cookieの一例を示す図である。
【図10】第1の実施形態の作成文書テーブルの一例を示す図である。
【図11】第1の実施形態の有効文書巡回用スタックの一例を示す図である。
【図12】第1の実施形態の関連文書表示システムで実行される処理の全体フローの一例を示すフローチャートである。
【図13】第1の実施形態の各構成間の関係の一例を示す図である。
【図14a】第1の実施形態のクライアントで実行される案件セッション開始処理の一例を示すフローチャートである。
【図14b】第1の実施形態のコンテンツ体系化サーバで実行される案件セッションID取得処理の一例を示すフローチャートである。
【図15】第1の実施形態のコンテンツ体系化サーバで実行されるproxy部の処理の一例を示すフローチャートである。
【図16a】第1の実施形態のクライアントで実行される文書作成処理の一例を示すフローチャートである。
【図16b】第1の実施形態のクライアントで実行されるテキスト挿入処理の一例を示すフローチャートである。
【図16c】第1の実施形態のクライアントで実行されるペースト処理の一例を示すフローチャートである。
【図16d】第1の実施形態のコンテンツ体系化サーバで実行されるコピーペースト捕捉処理の一例を示すフローチャートである。
【図17】第1の実施形態のコンテンツ体系化サーバで実行される関連リンクの生成処理の全体フローの一例を示すフローチャートである。
【図18】第1の実施形態の案件セッション別有効文書一覧の作成処理の一例を示すフローチャートである。
【図19】第1の実施形態の関連リンク生成処理の一例を示すフローチャートである。
【図20a】第1の実施形態のクライアントで実行される検索実行時のブラウザでの処理の一例を示すフローチャートである。
【図20b】第1の実施形態のコンテンツ体系化サーバで実行される検索キーワードのレコメンド処理の一例を示すフローチャートである。
【図21a】第1の実施形態の関連リンク学習時の具体事例を示す図である。
【図21b】第1の実施形態のレコメンド実行時の具体事例を示す図である。
【図22】第2の実施形態の関連文書表示システムのソフトウェアおよびハードウェアの構成の一例を示す図である。
【図23】第2の実施形態の関連リンクノードの一例を示す図である。
【図24】第2の実施形態の文書ノードの一例を示す図である。
【図25】第2の実施形態のURI−文書ノード対応管理テーブルの一例を示す図である。
【図26】第2の実施形態のグラフ構造の概念図の一例を示す図である。
【図27】第2の実施形態の案件セッション別有効文書一覧テーブルおよび探索の訪問済み文書管理テーブルの一例を示す図である。
【図28】第2の実施形態の関連リンク生成用スタックの一例を示す図である。
【図29】第2の実施形態の関連文書表示システムで実行される処理の全体フローの一例を示す図である。
【図30】第2の実施形態の各構成間の関係の一例を示す図である。
【図31a】第2の実施形態の関連リンクの生成の処理フローの一例を示す図である。
【図31b】第2の実施形態の第1の探索の処理の一例を示す図である。
【図31c】第2の実施形態の第2の探索の処理の一例を示す図である。
【図31d】第2の実施形態の関連度の算出の処理の一例を示す図である。
【図32】第2の実施形態のコンテンツ体系化サーバで実行される検索キーワードのレコメンド処理の一例を示すフローチャートである。
【発明を実施するための形態】
【0015】
以下、本発明を実施するための形態(以下、「実施形態」という。)について、図面を参照(言及図以外も適宜参照)しながら、本実施形態(第1、第2の実施形態)の概要、第1の実施形態、第2の実施形態の順で説明する。
【0016】
<本実施形態の概要>
最初に、図3に示した事例を用いて本実施形態の概要を説明する。本実施形態は、(a)関連リンク学習時と、(b)レコメンド実行時とに大別できる。なお、本実施形態では、検索キーワードも一種の文書と考える。つまり、特許請求の範囲における「文書」には「検索キーワード」も含まれ、また、特許請求の範囲における「閲覧された文書」には、「(ユーザによって)入力された検索キーワード」も含まれる。さらに、以下に説明する概要では、文書−文書、検索キーワード−文書、検索キーワード−検索キーワード等の関係のうち、特に、ユーザが検索キーワードを入力した際に関連する検索キーワードを提示する場合を具体例にして説明する。
【0017】
≪関連リンク学習時≫
まず、(a)関連リンク学習時について説明する。図3(a)に示すように、ここでは、ユーザがさまざまな検索キーワード(k1〜k3)を用いて文書の検索を実行し、文書(p0〜p3)を参照し、得た情報をまとめて文書(c1。所定の文書)を作成する状況を想定する。また、一連の文書閲覧、検索キーワード入力を行って、少なくとも一つの文書を作成する一連の作業を案件セッションと定義する。
【0018】
まず、最初に、ユーザが案件セッションの開始操作を行い、この操作をシステム(後記する関連文書表示システム1000)が認識する。その際、案件セッションID(IDentification)を採番する。図3の例では、案件セッションIDとしてs2を採番したとする。
【0019】
次に、ユーザは検索キーワードk1を入力して、検索結果ページを閲覧し、その中から案件に関連のありそうな文書p1を参照したとする。案件セッションID(s2)、参照した文書p1を関連元(後記する探索時の探索元)および検索キーワードk1を関連先(後記する探索時の探索先)とする関連イベントを関連イベントテーブル510(関連イベント記憶部)に格納する。また、前記関連イベントの種別は、関連元のp1はp、また関連先のk1はkとする。この種別とは、kは検索キーワード、pは文書を表す。また後に登場する種別のcは作成文書を表す。
【0020】
同様に、ユーザは、検索キーワードk2にて検索して文書p2を参照し、検索キーワードk3にて検索して文書p3を参照したので、これらも関連イベントテーブル510に同様に格納する。
【0021】
また、ユーザが文書p1を参照し、文書p1中のリンクにより文書p0を参照したとする。この文書間の遷移として関連イベントテーブル510の関連元にp0、関連先にp1を格納する。
【0022】
また、ユーザが文書c1を作成する。ここで、ユーザは文書p0の一部のテキストをコピーして、文書c1にペーストしたとする。このコピーペースト(コピー&ペースト)の関係として、関連元としてc1を、関連先としてp0を関連イベントテーブル510に格納する。また、文書p2の一部のテキストを作成文書c1にコピーペーストしたので、同様に関連イベントテーブル510に格納する。また、ユーザは、文書p3を参照はしたが、文書c1の作成には利用しなかったとする。
【0023】
次に、ユーザが文書c1の作成を終えて、コンテンツ体系化サーバ200(後記)に作成文書c1を格納したとする。コンテンツ体系化サーバ200は、この作成文書c1の格納を受けて、当該案件セッションs2で文書の作成に関係した文書の一覧を作成し、案件セッション別有効文書一覧テーブル520に格納する。具体的には、関連イベントテーブル510を参照することで、関連イベントによる木構造を図3中の矢印の様にs2の範囲で探索し、文書作成に関連を持った文書の一覧(案件セッション別有効文書一覧テーブル520)を作成する。ここで、k3およびp3はc1から到達できる関連イベントによる木構造の一部になっていないので案件セッション別有効文書一覧テーブル520には格納されず、この時点で有用な関連リンクの生成の対象から除外される。
【0024】
次に、案件セッション別有効文書一覧テーブル520の案件セッションIDのカラムの値が当該案件セッションID(s2)であるものから任意の2つの文書間に関連リンクを生成し、この関連リンクの情報を関連リンク管理情報530(関連リンク記憶部)に格納する。このとき、関連リンク管理情報530に格納済みの内容であれば、カウンタを1つ繰り上げる。関連リンクの情報が格納されていなければ、カウンタを1として格納する。これによって、文書作成に関連した関連性の高い文書や一種の文書である検索キーワード間の関連が学習される。
【0025】
次に、(b)レコメンド実行時について説明する。図3(b)に示すように、ここでは、ユーザが検索キーワードを入力したときに、関連がある検索キーワードを提示する場合を例に説明する。ユーザが検索キーワードとしてk1を入力したとする。ユーザが検索キーワードk1を入力すると、関連リンク管理情報530から関連元がk1であり、関連先として種別がkであるものをサーチする。図3の例では、k2がヒットする。この検索キーワードk2を含むサーチ結果をカウンタで降順にソートして上位からユーザに提示する。これによって、k1と関連があるが異なる検索キーワードk2による新たな観点でユーザは検索を行って、関連情報を参照できる。
【0026】
<第1の実施形態>
(構成)
次に、第1の実施形態の関連文書表示システムのハードウェア構成について説明する。図1に示すように、第1の実施形態の関連文書表示システム1000は、1台以上のクライアント計算機(以下、「クライアント」という。)100(「100」は「100a」と「100b」の総称であり、以下、他の構成についても同様である。)およびコンテンツ体系化サーバ200を備え、それらはLAN300によって繋がって(接続されて)いる。また、LAN300は、検索サーバ301およびWebサーバ302(ウェブサーバ)とWAN(Wide Area Network)303によって繋がっている。
【0027】
クライアント100は、CPU(Central Processing Unit)110、メモリ120、記憶装置130、入力装置140、出力装置150およびIF(ネットワークインターフェース制御部)160を備える計算機(コンピュータ装置)である。
【0028】
CPU110は、メモリ120に格納されたソフトウェアを読み出して実行するプロセッサである。CPU110がオペレーティングシステムおよびアプリケーションプログラム等のソフトウェアを実行することによって、所定の機能が達成(実現)される。
【0029】
メモリ120には、記憶装置130から読み出されたオペレーティングシステムやアプリケーションプログラム等のソフトウェアや各種データが格納される。
記憶装置130は、例えば、ディスクドライブ又は光磁気ディスクドライブであり、オペレーティングシステムやアプリケーションプログラム等のソフトウェアや各種データを格納する。
【0030】
入力装置140は、例えば、キーボードやマウス等である。入力装置140は、ユーザからの入力を受け付ける。
出力装置150はディスプレイ等であり、CPU110から指示された情報を出力する。
IF160は、LAN300と接続される。クライアント100は、複数のIF160を備えても良い。
【0031】
コンテンツ体系化サーバ200は、CPU210、メモリ220、記憶装置230およびIF(ネットワークインターフェース制御部)260を備える計算機である。
CPU210は、メモリ220に格納されたソフトウェアを読み出して実行するプロセッサである。CPU210がソフトウェア等を実行することによって、関連の生成および関連情報の提示等の所定の機能が達成(実現)される。
【0032】
メモリ220には、記憶装置230から読み出されたソフトウェア等が格納される。
記憶装置230は、例えば、ディスクドライブ又は光磁気ディスクドライブであり、ソフトウェア等を格納する。
IF260は、LAN300と接続される。なお、コンテンツ体系化サーバ200は、複数のIF260を備えても良い。
【0033】
次に、第1の実施形態のコンテンツ体系化サーバ200のメモリ220に格納される、関連生成及び関連提示処理のためのプログラム及び関連情報の一例を示すソフトウェアおよびハードウェアの構成について説明する。
【0034】
図2に示すように、メモリ220には、案件セッションID採番部221、文書URI(Uniform Resource Identifier)採番部222、関連学習制御部223、コピーペースト受付部226、キーワードレコメンド生成部227およびproxy部228(レコメンド制御部)が格納される。さらに、関連学習制御部223は、有効文書一覧生成部224、関連生成部225および有効文書巡回用スタック580を持つ。メモリ220内の各部は処理プログラムであり、図1のCPU210によって実行されるプログラムである。これらの処理については、後記する。
【0035】
さらに、記憶装置230には、作成文書格納部216、関連情報格納部217が格納される。作成文書格納部216には、キーワードテーブル540および作成文書テーブル570が格納される。関連情報格納部217には、関連イベントテーブル510、案件セッション別有効文書一覧テーブル520および関連リンク管理情報530が格納される。
【0036】
次に、クライアント100のメモリ120に格納されるソフトウェア構成の一例を説明する。クライアント100のメモリ120には、ブラウザ121が格納される。ブラウザ121内には、案件セッションID取得部122、案件セッションID格納部123、エディタ部124、HTML(Hyper Text Markup Language)レンダリング部129およびレコメンド表示部1291(表示部)が格納される。エディタ部124内には、文書URI取得部125、文書URI格納部126、作成文書保存部127およびコピーペースト捕捉部128が格納される。これらの処理については、後で詳細に説明する。
【0037】
なお、第1の実施形態では、クライアント100のブラウザ121の拡張機能としてこれらの各部を実装することを想定しているが、クライアント100とWebサーバ302との通信を中継するproxy部228にて、Webサーバ302から受信したWebコンテンツに例えばJava(登録商標)Scriptのようなスクリプトを追記して、ブラウザ121上でスクリプトを実行して機能を提供する形態であっても良い。
【0038】
次に、各データ構造について説明する。まず、関連イベントテーブル510について説明する。図4に示すように、関連イベントテーブル510は、案件セッションID511、関連元のURI512、関連元の種別513、関連先のURI514および関連先の種別515の情報の組を保持する。
【0039】
次に、案件セッション別有効文書一覧テーブル520について説明する。図5に示すように、案件セッション別有効文書一覧テーブル520は、案件セッションID521、URI522および種別523の情報の組を保持する。
【0040】
次に、関連リンク管理情報530について説明する。図6に示すように、関連リンク管理情報530は、関連元のURI531、関連元の種別532、関連先のURI533、関連先の種別534およびカウンタ535の情報の組を保持する。
【0041】
次に、キーワードテーブル540について説明する。図7に示すように、キーワードテーブル540は、URI541およびキーワード542の情報の組を保持する。
【0042】
次に、案件セッションID用Cookie550について説明する。図8に示すように、案件セッションID用Cookie550は、案件セッションID551の情報を保持する。図2も参照してさらに説明すると、案件セッションID格納部123に格納している案件セッションIDをもとにブラウザ121が案件セッションID用Cookie550を生成し、ブラウザ121がコンテンツ体系化サーバ200と通信する際にこの案件セッションID用Cookie550を併せて送信する。これにより、コンテンツ体系化サーバ200は、クライアント100からの各種操作がどの案件セッションでの操作かを捕捉して、関連イベントテーブル510の案件セッションID511にその情報を格納することができる。
【0043】
次に、文書用Cookie560について説明する。図9に示すように、文書用Cookie560は、文書URI561の情報を保持する。図2も参照してさらに説明すると、文書URI格納部126に格納している文書URIをもとにブラウザ121が文書用Cookie560を生成し、作成文書保存部127が作成文書をコンテンツ体系化サーバ200に送付する際にこの文書用Cookie560を併せて送信する。これにより、コンテンツ体系化サーバ200は、当該作成文書の文書URIを捕捉して、作成文書テーブル570にその情報を格納できる。
【0044】
次に、作成文書テーブル570について説明する。図10に示すように、作成文書テーブル570は、URI571および文書本体572の情報の組を保持する。
【0045】
次に、有効文書巡回用スタック580について説明する。図11に示すように、有効文書巡回用スタック580は、有効文書URI581の情報を保持する。
【0046】
(処理)
以下に、関連リンク学習の処理の詳細を説明する。まず、図12および図13を用いて、全体フローの動作イメージ、および、クライアント100とコンテンツ体系化サーバ200における各構成の関係を説明する。実際には、コンテンツ体系化サーバ200は、一般的なサーバと同じように、クライアント100から各種要求を受けてイベントドリブンで動作する。そのため、実際には、図12にある一連の動作は手続きとしてはこのままでは存在せず断片的に実行されるが、クライアント100との相互作用によって関連リンク学習の処理はこの順で実行される。
【0047】
図12および図13に示すように、案件セッションID取得部122は、案件セッションID採番部221から案件セッションIDを取得して案件セッションID格納部123に格納する(ステップ1001)。
【0048】
その後、コンテンツ体系化サーバ200は、クライアント100との相互作用によってユーザの操作で作り出される関連を関連イベントとして保存する(ステップ1002)。ステップ1002は、実際には複数の関連イベント捕捉手段に依存する処理が互いに非同期に繰り返して実行される。具体的には、関連イベントには、検索キーワード−参照ページ、リンクの遷移(リンク参照によるページ遷移)、および、コピーペーストがある。
【0049】
まず、検索キーワード−参照ページの関連イベントは、ブラウザ121からの検索要求および参照をproxy部228へ送信し、proxy部228がキーワードテーブル540を参照したのち関連イベントテーブル510に関連イベントを格納する。リンクの遷移については、ブラウザ121からのリンクの遷移の要求を、proxy部228が受信し、proxy部228がこの関連イベントを関連イベントテーブル510に格納する。コピーペーストは、コピーペースト捕捉部128が捕捉した内容をコピーペースト受付部226に送信し、コピーペースト受付部226がその内容を関連イベントテーブル510に格納する。これらの関連イベントに関する処理の詳細は、図15、図16cおよび図16dを用いて後記する。
【0050】
次に、作成文書保存部127は、作成文書、案件セッションIDおよび文書URIを関連学習制御部223に送信し、関連学習制御部223はこれを受け付ける(ステップ1003)。このステップ1003の処理をもって当該案件セッションが終了したとする。関連学習制御部223は、作成文書および文書URIを作成文書テーブル570に保存する(ステップ1004)。これによって、作成した文書は登録(保存)され、文書間の関連リンク生成の契機となる。
【0051】
作成文書の登録(ステップ1004)後に、有効文書一覧生成部224は、案件セッション別有効文書一覧の作成を行う(ステップ1005)。つまり、関連イベントテーブル510から、登録された作成文書を起点として現在の案件セッションの範囲で関連イベントを順に辿って文書を抽出し、有効文書巡回用スタック580を用いてアクセスした文書のうち当該案件セッションにおいて有効な文書の一覧を作成して案件セッション別有効文書一覧テーブル520に格納する。
【0052】
続いて、関連生成部225は、関連リンクの生成を行う(ステップ1006)。つまり、案件セッション別有効文書一覧テーブル520を参照して案件セッション別有効文書の任意の二者間に関連リンクを生成し、関連リンク管理情報530に格納する。これによって案件セッション毎の有効文書として、関連リンクが学習される。
【0053】
以下、各ステップを詳細に説明する。まず、図12のステップ1001の案件セッションIDの取得処理の詳細について、図14aおよび図14bを用いて、それぞれクライアント100側の動作とコンテンツ体系化サーバ200側の動作を説明する。
【0054】
図14aは、第1の実施形態のクライアント100で実行される案件セッションID取得部122による処理フローの一例を示す図である。
案件セッションID取得部122は、図14aに示すように、まず、コンテンツ体系化サーバ200の案件セッションID採番部221に要求し、案件セッションIDを取得する(ステップ1101)。次に、案件セッションID取得部122は、ステップ1101で取得した案件セッションIDを案件セッションID格納部123に格納する(ステップ1102)。
【0055】
図14bは、第1の実施形態のコンテンツ体系化サーバ200で実行される案件セッションID採番部221による処理フローの一例を示す図である。
案件セッションID採番部221は、図14bに示すように、まず、図14aのステップ1101における案件セッションID取得部122からの要求を受け、案件セッションIDを採番する(ステップ1201)。次に、案件セッションID採番部221は、ステップ1201で採番した案件セッションIDを、要求元であるクライアント100の案件セッションID取得部122に送信する(ステップ1202)。
【0056】
次に、図12のステップ1002の関連イベントを関連イベントテーブル510に格納する処理の詳細を説明する。前記したように、関連イベントには、検索キーワード−参照ページ、リンクの遷移およびコピーペーストがある。
【0057】
まず、検索キーワード−参照ページの関連イベント捕捉および格納ついて、図15および図2を用いて説明する。検索キーワード−参照ページおよびリンクの遷移の関連イベントは、proxy部228の処理の一部にて取得し格納する。
【0058】
(他Webページからの遷移がない場合の処理)
まず、ブラウザ121が、アドレスバーへの直接URL(Uniform Resource Locator)の入力もしくはブックマークの選択などによってWebページを参照するという、他Webページからの遷移がない場合の処理の流れを説明する。この処理の流れの場合、関連イベントの捕捉はないが、捕捉すべき関連イベントであるリンク遷移(リンク参照によるページ遷移)のうち初期ページ遷移の前提として最初に説明する。また、以下の説明に出てくるGET要求とは、一般的なプロトコルであるHTTP(Hyper Text Transfer Protocol)における一般的なリクエストの一つで、ブラウザ121からWebサーバ302に対してWebページの取得を要求するものである。
【0059】
proxy部228は、ブラウザ121からの要求内容がGET要求であり、かつ、参照先が検索結果ページ以外かを判定する(ステップ1301)。ここでは、Webページ参照要求はGET要求であり、かつ、参照先が検索結果ページ以外であるので(ステップ1301でYes)、ステップ1302に進む。
【0060】
ステップ1302で、proxy部228は、ブラウザ121からの要求にリファラ(リンク元のページ)が存在するか判定する。ここで、ブラウザ121からの参照は他のWebページからの遷移ではないためリファラがないので(ステップ1302でNo)、ステップ1312に進む。
【0061】
次に、proxy部228は、前記GET要求をWebサーバ302に転送する(ステップ1312)。
【0062】
続いて、proxy部228は、Webサーバ302から前記GET要求のレスポンスを受け取り(ステップ1313)、これをブラウザ121に送信し(ステップ1314)、処理を終了する。
【0063】
(他Webページからの遷移がある場合の処理)
次に、関連イベントが捕捉されるページ間の遷移がある場合の処理の流れを説明する。これは、ブラウザ121がページ内のリンクを辿って他のページを参照した場合である。
【0064】
この場合は、前記他Webページからの遷移がない場合の処理の流れと同様にステップ1302まで進む。ステップ1302で、proxy部228は、ブラウザ121からの要求にリファラが存在すると判定し(Yes)、ステップ1303に進む。
【0065】
ステップ1303で、proxy部228は、ブラウザ121のリファラが検索結果ページを示しているか判定する。ここで、ブラウザ121からの参照は他のWebページからの遷移なので、ステップ1303の判定はNoとなり、ステップ1304に進む。
【0066】
次に、proxy部228は、リファラを関連先として取得する(ステップ1304)。
次に、proxy部228は、ブラウザ121からの要求がいずれの案件セッションからの要求かを捕捉するために、ブラウザ121からの要求に含まれる案件セッションID用Cookie550の値を取得する(ステップ1310)。
【0067】
次に、proxy部228は、案件セッションID、参照先のURLを関連元、前記ステップ1304で取得した関連先を関連先とする関連イベントを関連イベントテーブル510に格納する(ステップ1311)。また、前記関連イベントの関連元および関連先の種別はそれぞれpとする。
【0068】
そして、proxy部228は、ステップ1312に進む。以下、ステップ1312からステップ1314の処理は前述の動作と同じなので、説明を省略する。
【0069】
なお、本実施形態では、リファラを用いてコンテンツ体系化サーバ200にてページ間の遷移を取得することを想定しているが、ユーザがWebページのハイパーリンクをクリックした情報をクライアント100のブラウザ121で取得する形態であっても良い。
【0070】
(検索結果から任意のWebページを選択してページを遷移した場合の処理)
次に、ブラウザ121から検索サーバ301にて検索を実施し、前記検索の結果から任意のWebページを選択してページを遷移した場合の検索キーワード−参照文書間の関連イベントの捕捉方法について、図15および図2を用いて説明する。
【0071】
まず、proxy部228は、ステップ1301に進む。ここで、ブラウザ121は、ユーザによる検索キーワードの入力を受け付けて検索を実行する。ブラウザ121は、検索キーワードをURLのパラメータに含んでGET要求を検索ページに対して要求しているので(つまり、参照先が検索結果ページであるので)、proxy部228のステップ1301の判定はNoとなり、ステップ1312に進む。
【0072】
proxy部228は、検索要求を検索サーバ301に転送し(ステップ1312)、検索サーバ301からレスポンスを受信する(ステップ1313)。このとき、検索サーバ301のレスポンスのURLは、検索キーワードをパラメータに含んでいる。次に、proxy部228は、前記レスポンスをブラウザ121に送信する(ステップ1314)。この処理フローがブラウザ121の検索実行時の動作である。この時点でブラウザ121は検索結果ページを取得し、ユーザはそれを閲覧できる。この検索結果ページとは、一般的な検索ページにて検索を実行した際に、その検索結果を一覧として表示しているWebページである(不図示)。
【0073】
(検索結果ページから任意のWebページを選択した場合の処理)
次に、ユーザがブラウザ121によって検索結果ページから任意のWebページを選択し、proxy部228に参照要求を出したとする。proxy部228は、再び図15に示す処理を実行し、前述のとおりステップ1301に進む。ここで、ブラウザ121は検索結果ページから任意のWebページを選択しているので、ブラウザ121は検索結果ページ以外のWebページのGET要求をしており(ステップ1301でYes)、proxy部228はステップ1302に進む。
【0074】
ここで、リファラは検索結果ページを示しているので、ステップ1302およびステップ1303の判定はYesとなり、proxy部228はステップ1305に進む。proxy部228は、前記リファラのパラメータ部から検索キーワードを取得して関連先とする(ステップ1305)。
【0075】
次に、proxy部228は、前記取得した検索キーワードがキーワードテーブル540(図7参照)のキーワード542のいずれかに格納済みか判定する(ステップ1306)。前記検索キーワードがキーワード542に格納済みでなかった場合には(ステップ1306でNo)、proxy部228は、ステップ1307に進み、前記検索キーワードに対するURIを生成する。
【0076】
ステップ1307の後、proxy部228は、前記検索キーワードと前記生成したURIの組をキーワードテーブル540に格納する(ステップ1308)。一方、ステップ1306で、proxy部228が当該検索キーワードは格納済みと判定した場合には(ステップ1306でYes)、キーワードテーブル540を参照して前記検索キーワードに対応するURIを取得する(ステップ1309)。
【0077】
ステップ1308あるいはステップ1309の後、proxy部228は、ブラウザ121からの要求がいずれの案件セッションからの要求かを捕捉するために、ブラウザ121からの要求に含まれる案件セッションID用Cookie550の値を取得し(ステップ1310)、ステップ1311に進む。
【0078】
ステップ1311において、proxy部228は、案件セッションID、ユーザが参照要求を出している前記参照先URLを関連元、および前記検索キーワードのURIを関連先とする関連イベントを関連イベントテーブル510に格納する。また、前記関連イベントの関連先の種別はk、関連元はpとする。以下、ステップ1312からステップ1314の処理は前記と同じなので説明を省略する。
【0079】
(コピーペーストした場合の処理)
コピーペーストの関連イベントは、エディタ部124のコピーペースト捕捉部128が捕捉した当該関連イベントをコピーペースト受付部226で受信し、関連イベントテーブル510に格納する。このコピーペーストの関連イベントを捕捉し格納する処理の詳細を図16a、16b、図16cおよび図16dを用いて説明する。
【0080】
図16aは、クライアント100のエディタ部124で文書を作成する処理フローの一例を示す図である。
まず、エディタにおける新規文書の作成、編集および格納について、コピーペーストの説明の前提として説明する。
【0081】
最初に、エディタ部124は、エディタ(編集用ソフトウェア)を起動する(ステップ1401)。
次に、エディタ部124は、文書URI取得部125からコンテンツ体系化サーバ200の文書URI採番部222に要求して、作成する文書のURIを新たに取得する(ステップ1402)。
【0082】
続いて、エディタ部124は、文書を入力する(ステップ1403)。このステップ1403の文書の入力の処理内容の詳細は、図16bおよび図16cで説明する。このステップ1403の文書の入力の処理は、図16bおよび図16cで示す処理を1つもしくは複数実行する。そして、エディタ部124は、作成文書および文書URIを作成文書保存部127からコンテンツ体系化サーバ200へ送信し(ステップ1404)、処理を終了する。
【0083】
次に、コピーペーストによる編集と関連イベントの捕捉や格納について説明する。
図16cは、図16aのステップ1403の処理フローの一例を示す図である。エディタ部124は、ユーザからのペースト要求を受け付け(ステップ1411)、コピー元文書のURIとペーストの内容である選択済みテキストの内容を取得する(ステップ1412)。ここで、コピー元テキストの選択はマウスのドラッグ操作によって行われているものとするが、一般的なブラウザの機能なのでここでは詳細に説明しない。
【0084】
次に、エディタ部124は、ユーザの指示により作成中文書に前記取得したテキストを挿入する(ステップ1413)。次に、エディタ部124は、コンテンツ体系化サーバ200のコピーペースト受付部226へコピー元文書のURIと作成文書URIを送信し(ステップ1414)、コピーペーストによる編集を終了する。
【0085】
次に、図16dを用いて、前記ステップ1414にてエディタ部124からコピー元文書のURIと作成文書URIを受信したコピーペースト受付部226での動作を説明する。コピーペースト受付部226は、受信したコピー元文書のURIと作成文書URIをそれぞれ関連イベントテーブル510に格納する。
【0086】
まず、ステップ1417で、コピーペースト受付部226は、コピー元文書のURIと作成文書のURIを受信する(ステップ1417)。次に、コピーペースト受付部226は、コピー元文書のURIを関連先、また作成文書のURIを関連元とする関連イベントを関連イベントテーブル510格納する(ステップ1418)。また、前記関連イベントの関連先の種別はp、関連元はcとする。
【0087】
次に、取得する関連イベントは無いが、エディタ部124の基本的な動作であるユーザのタイプインによる文書の編集の処理内容を以下に説明する。
【0088】
図16bは、図16aのステップ1403の処理フローの一例を示す図である。エディタ部124は、ユーザからのタイプインを受け付け(ステップ1407)、作成している文書に当該タイプインの内容のテキストを挿入する(ステップ1408)。
【0089】
また、ここまでに説明した関連イベントの取得方法以外に、次のように作成文書中の記載内容から関連イベントを取得しても良い。例えば、作成文書中のWebページのURLや文書URI番号などの明示的なリンク情報をパターン認識により抽出し、作成文書を関連元、リンク先の文書を関連先とする関連イベントとして捕捉や格納をしても良い。
【0090】
以下に、ステップ1404の処理を受けて動作する図12のステップ1003以降の関連リンクを生成する処理の詳細を説明する。
【0091】
(関連リンクの生成処理)
まず、関連リンクの生成の処理の全体処理フローを、図17を用いて説明する。
関連学習制御部223は、作成文書保存部127から作成文書、案件セッションIDおよび文書URIを受け付ける(ステップ1003)。
【0092】
次に、関連学習制御部223は、作成文書および文書URIを作成文書テーブル570に保存する(ステップ1004)。これによって、作成した文書は登録され、文書間の関連リンク生成の契機となる。
【0093】
次に、関連学習制御部223は有効文書一覧生成部224を起動し、有効文書一覧生成部224は、登録された作成文書を起点として現案件セッションの範囲で関連イベントを辿って文書を抽出することで、アクセスした文書のうち当該案件セッションにおいて有効な文書の一覧を作成する(ステップ1005)。このステップ1005の処理内容の詳細は、図18を用いて後記する。
【0094】
続いて、関連学習制御部223は関連生成部225を起動し、関連生成部225は、案件セッション別有効文書の任意の二者間に関連リンクを生成し(ステップ1006)、処理を終了する。これによって、案件セッション毎の有効文書として、関連リンクが学習される。このステップ1006の処理内容の詳細は、図19を用いて後記する。
【0095】
(ステップ1005の処理)
有効文書一覧生成部224により実現される、案件セッション別の有効文書一覧を作成する処理(ステップ1005の処理)について説明する。
【0096】
図18に示すように、まず、有効文書一覧生成部224は、受け付けた作成文書のURIを有効文書巡回用スタック580にPUSHする(入れる)(ステップ1501)。
【0097】
次に、有効文書一覧生成部224は、有効文書巡回用スタック580からURIをPOPし(出そうと試み)(ステップ1502)、POPが成功したか判定する(ステップ1503)。ステップ1503でPOPが成功した場合には(Yes)、有効文書一覧生成部224は、案件セッション別有効文書一覧テーブル520にステップ1502でPOPしたURIが存在するか判定する(ステップ1504)。
【0098】
ステップ1504で「存在しない」と判定した場合、有効文書一覧生成部224は、案件セッション別有効文書一覧テーブル520に前記URIを挿入し(ステップ1505)、ステップ1506に進む。一方、ステップ1504で「存在する」と判定した場合には、ステップ1502に戻る。
【0099】
ステップ1506で、有効文書一覧生成部224は、関連イベントテーブル510を前記案件セッションIDで絞り込み、関連イベントテーブル510の関連元URI512に対して前記ステップ1502でPOPしたURIをサーチする。サーチでヒットするごとにステップ1507で当該ヒットした関連イベントテーブル510のレコードの関連先URI514の値を有効文書巡回用スタック580にPUSHする。前記サーチが完了したならばステップ1508からステップ1502に戻る。これらの処理を繰り返し、ステップ1503で有効文書巡回用スタック580からURI581をPOPができなった場合(No)、つまり、有効文書巡回用スタック580が空になれば処理を終了する。
【0100】
(ステップ1006の処理)
関連生成部225により実現される、案件セッション別有効文書の任意の二者間に関連リンクを生成する処理について説明する。図19に示すように、関連生成部225は、ステップ1601で案件セッション別有効文書一覧テーブル520を案件セッションIDで絞り込み、関連元としてURIおよび種別を取得する。
【0101】
次に、ステップ1602で、関連生成部225は、ステップ1601で案件セッション別有効文書一覧テーブル520を案件セッションIDで絞り込み、関連先としてURIおよび種別を取得する。次に、関連生成部225は、ステップ1601とステップ1602で取得した関連元と関連先の内容(値)が等しいかを判定する(ステップ1603)。
【0102】
次に、関連生成部225は、ステップ1603でNoと判定した場合にはステップ1604に進み、関連リンク管理情報530に前記関連元および関連先の情報が格納済みであるか判定する。ステップ1604で格納済みでないと判定した場合には(No)、ステップ1605に進む。ステップ1605で関連生成部225は、関連リンク管理情報530に関連元および関連先の情報をカウンタ「1」で挿入する。一方、ステップ1604で格納済みと判定した場合には(Yes)、ステップ1606に進む。ステップ1606で関連生成部225は、関連リンク管理情報530の関連元および関連先と等しいレコードのカウンタの値に「1」加えて更新する。関連生成部225は、ステップ1601〜1608とステップ1602〜1607による2重ループで案件セッション別有効文書一覧テーブル520の全ての任意の二者間に関連リンクを生成する。以上が、関連リンク学習の処理詳細である。
【0103】
≪レコメンド実行時の処理≫
次に、本実施形態におけるレコメンド実行時の処理詳細を説明する。ここでは、クライアント100のブラウザ121が検索するための検索キーワードの入力を受け付けた場合に、コンテンツ体系化サーバ200から前記検索キーワードに関連する検索キーワードを提示する場面を想定する。
【0104】
(検索キーワードのレコメンドを受けるときの処理)
まず、検索キーワードのレコメンドを受けるときのクライアント100のブラウザ121による処理フローを説明する。図20aに示すように、ブラウザ121は、検索サーバのURLを指定してGETを要求し(ステップ1701)、検索用のページを表示する(ステップ1702)。
【0105】
次に、ブラウザ121は、ユーザからの検索キーワードを受け付け(ステップ1703)、前記検索キーワードをURLのパラメータに含めてコンテンツ体系化サーバ200に対してGET要求を送信する(ステップ1704)。
【0106】
次に、ブラウザ121は、コンテンツ体系化サーバ200から検索結果を受信し(ステップ1705)、ブラウザ121内のHTMLレンダリング部129が検索結果をレンダリング(データの可視化)する(ステップ1706)。
【0107】
次に、ブラウザ121は、コンテンツ体系化サーバ200から検索キーワードのレコメンド内容を受信する(ステップ1707)。そして、ブラウザ121内のHTMLレンダリング部129は、ポップアップしたウインドウに検索キーワードのレコメンドを表示する(ステップ1708)。
【0108】
(レコメンドを実行する場合の処理)
次に、レコメンドを実行する場合のコンテンツ体系化サーバ200の処理フローを説明する。概要を説明すると、コンテンツ体系化サーバ200は、proxy部228がクライアント100から検索キーワードを受信し、当該検索キーワードに関連がある検索キーワードを関連リンク管理情報530から抽出してクライアント100に送信する。
【0109】
具体的には、図20bに示すように、まず、コンテンツ体系化サーバ200のproxy部228がクライアント100から検索キーワードを受信する(ステップ1801)。次に、proxy部228は、キーワードレコメンド生成部227を起動し、キーワードレコメンド生成部227がキーワードテーブル540をサーチして前記検索キーワードのURIを取得できるか判定する(ステップ1802)。検索キーワードのURIを取得できると判定した場合には(ステップ1802でYes)、キーワードレコメンド生成部227は、関連リンク管理情報530の関連元が検索キーワードのURIであり、関連先の種別がkであるレコードをサーチする(ステップ1803)。
【0110】
次に、キーワードレコメンド生成部227は、サーチ結果を関連リンク管理情報530のカウンタ535(図6参照)の値でソートする(ステップ1804)。
【0111】
次に、キーワードレコメンド生成部227は前記ソートしたサーチ結果をproxy部228に受け渡し、proxy部228はブラウザ121に前記ソートしたサーチ結果を送信する(ステップ1805)。こうすることでブラウザ121は、入力した検索キーワードに関連する検索キーワードのレコメンドを受けることができる。
【0112】
(具体事例)
以下に、図21aおよび図21bを用いて、第1の実施形態の具体事例について説明する。この具体事例では、調査内容としてファイルシステムのバックアップを高速に取得する方法を調査し、調査の結果としてバックアップコマンドを使うのではなく、代替策としてスナップショットおよびRAID(Redundant Arrays of Inexpensive Disks)構成にするという方法をとることが適していると分かったとする。この調査の結果からそれぞれの文書間に関連リンクを学習する。これによって他のユーザが類似案件を調査する際に、検索キーワード「バックアップ」で検索するとそれぞれのマニュアルページに素早く到達する検索キーワード「スナップショット」「RAID」がユーザに提示されることを想定する。以下にこの具体事例の詳細を説明する。
【0113】
まず、関連リンク学習時の具体事例について、図21aを用いて説明する。図21aは、(a)が検索キーワードとWebページと作成文書との関係を示す概念図であり、(b)がキーワードテーブル、関連イベントテーブルおよび関連リンク管理情報の例を示す図である。
【0114】
ここで、クライアント100を操作するユーザは、ファイルシステムのバックアップの高速化について調査していたとする。想定する状況としては、ファイルシステムのバックアップに時間がかかりすぎて業務に支障があり、より短時間でバックアップを完了させたいという状況であったとする。
【0115】
ユーザは、まず、「バックアップ(k1-a)」および「高速化(k1-b)」を検索キーワードに指定して検索したとする。そして、検索結果から、「バックアップ方法のマニュアル(p1-a)」を参照したとする。この参照から、バックアップコマンドの使用方法の工夫にて、バックアップの所要時間を短縮するのは不可能だと判明したとする。
【0116】
次に、「バックアップ(k1-a)」および「高速化(k1-b)」にて検索した結果の一覧から「ホットスタンバイに関する断片的な解説(p1-b)」を参照し、断片的な情報ではあるがホットスタンバイによりバックアップの高速化ができるかもしれないという情報を得たとする。ユーザは、ホットスタンバイの詳細ついて調査するために「ホットスタンバイ(k2)」を検索キーワードに検索し、「ホットスタンバイ設定のマニュアル(p2)」を参照したとする。ここで、ユーザは、ホットスタンバイは可用性を高め、またプロセスを多重化する方法であるという情報を得たとする。バックアップは、耐久性を高め、またデータを多重化する方法であるため、ホットスタンバイは、バックアップの代替案に成り得ないとユーザは判断した。
【0117】
さらに、先ほどの「バックアップ(k1-a)」および「高速化(k1-b)」にて検索した結果の一覧から「スナップショットに関する断片的な解説(p1-c)」を参照し、以下の情報を得たとする。スナップショットは、ある時点での仮想的なバックアップを取りその時点からの変更部分のみを記憶することで、ユーザの操作誤りに対する障害に対応する技術である。ただし、スナップショットの適用時に、メディア障害に対応するためには併せて冗長化が必要だと判明したとする。
【0118】
次に、前記ユーザは、スナップショットに関する詳細を調査するため「スナップショット(k3)」を検索キーワードに検索し、「スナップショット設定のマニュアル(p3)」を参照したとする。ここで、前記ユーザはスナップショットの取り方を理解したとする。また、冗長化について調査するために「冗長化(k4)」を検索キーワードに検索し、その検索結果から「冗長化の解説文書(p4)」を参照したとする。この参照により、RAID構成をとることで、本調査における冗長化に対応できると判明したとする。よって、前記ユーザは次にRAIDの詳細について調査を進めることとしたとする。次に、ユーザは「RAID(k5)」を検索キーワードに検索し、「RAID構成のマニュアル(p5)」を参照して、手順を理解したとする。
【0119】
ユーザは以上の調査の結果として、次のようにまとめた文書(c1)を作成したとする。つまり、「バックアップコマンドの工夫によりバックアップを高速化することはできないが(p1-aの文書を参照)、代替策として、スナップショット(p3の文書を参照)およびRAID(p5の文書を参照)を使うことでバックアップの高速化と同等のことができる」とまとめた文書(c1)を作成した。
【0120】
文書(c1)の作成には、「バックアップ方法のマニュアル(p1-a)」、「スナップショット設定のマニュアル(p3)」、「RAID構成のマニュアル(p5)」を参照および引用している。また、「バックアップ方法のマニュアル(p1-a)」、「スナップショット設定のマニュアル(p3)」、「RAID構成のマニュアル(p5)」を検索するにあたっては、それぞれ「バックアップ(k1-a)」および「高速化(k1-b)」、「スナップショット(k3)」、「RAID(k5)」を検索キーワードとして検索した。
【0121】
これらの関連イベントは、関連イベントテーブル510aに格納されている。そして、関連リンク管理情報530aに示すように(一部図示を省略)、文書c1、「バックアップ方法のマニュアル(p1-a)」、「スナップショット設定のマニュアル(p3)」、「RAID構成のマニュアル(p5)」、「バックアップ(k1-a)」、「高速化(k1-b)」、「スナップショット(k3)」、「RAID(k5)」の任意の二文書間に関連リンクを生成する。
【0122】
次に、レコメンド実行時の動作の具体事例について、図21bを用いて説明する。前記関連リンク学習時のユーザとは別のユーザが、類似案件の調査において「バックアップ」という言葉を検索キーワードとして検索を実行したとする。キーワードテーブル540aに示すように、検索キーワード「バックアップ」は前記関連リンクの学習においてk1-aとしたものである。また、関連リンク管理情報530aに示すように、検索キーワード「バックアップ(k1-a)」と関連リンクが存在する検索キーワードとしては、k3とした「スナップショット」、およびk5とした「RAID」がある。ここでは、検索キーワードの入力時に、関連する検索キーワードを提示する状況を想定しているので、関連先の種別がkであるものを開示している。
【0123】
よって、関連リンク管理情報530aからわかるように、「バックアップ」という検索キーワードにて検索するときには、「スナップショット」および「RAID」という検索キーワードをユーザに提示することができる。このように、関連リンクが存在する検索キーワードの提示を受けることで、ユーザはより素早く有効な検索キーワードに到達することができる。そして、有効な検索キーワードに素早く到達することで、結果として有効な文書により素早く到達することができる。このように、ユーザが試行錯誤的に様々に検索キーワードを入力して、文書を閲覧する回数を減らすことができる。つまり、先人の検索履歴を有効に活用し、先人のノウハウを活用することができる。
【0124】
なお、この例の場合、従来のキーワードの共起に着目した統計処理(特許文献1参照)等を用いる技術では、「バックアップ」という検索キーワードに基づいて「スナップショット」や「RAID」という検索キーワードをレコメンドできない可能性が少なからずあるが、本実施形態の手法によれば、そのようなレコメンドを確実に実現することができる。
【0125】
<第2の実施形態>
【0126】
次に、第2の実施形態について説明する。第2の実施形態は、関連リンクの生成およびその保存の方法が第1の実施形態とは異なる。第1の実施形態では、関連イベントテーブル510から一度、案件セッション別有効文書の一覧を求めた後に、これを利用して関連リンクを作成する。一方、第2の実施形態では、関連イベントテーブル510を用いて案件セッション別有効文書一覧テーブル520aを作成するステップの中で関連リンクを作成する。また、関連リンクは第1の実施形態では関連イベントテーブル510の形式で関連リンクの情報を保持していたが、第2の実施形態ではオブジェクトのグラフ形式で生成する。
【0127】
まず、ソフトウェアの構成に関して、第1の実施形態と異なる箇所を説明する。第2の実施形態におけるソフトウェアおよびハードウェアの構成を図22に示す。第1の実施形態と異なる箇所は、関連生成部225a、キーワードレコメンド生成部227a、関連リンク管理情報530a、案件セッション別有効文書一覧テーブル520a、探索の訪問済み文書管理テーブル640および関連リンク生成用スタック650であり、また、有効文書一覧生成部224がない。関連生成部225aおよびキーワードレコメンド生成部227aの処理内容は後記する。
【0128】
まず、関連リンク管理情報530aに関して説明する。関連リンク管理情報530aは、複数の関連リンクノード610(図23参照)、複数の文書ノード620(図24参照)およびURI−文書ノード対応管理テーブル630(図25参照)により構成し、これらにより関連リンクの情報を示す。
【0129】
関連リンクノード610の一例を図23に示す。関連リンクノード610は、関連度611および文書ノード620へのポインタ612からなる情報の組を持つ。関連度611は、どの程度に当該関連リンクが関連付ける文書間の関連が強いかを示す指標値であり、第1の実施形態における関連リンク管理情報530のカウンタ535(図6参照)に相当(対応)するものである。
【0130】
文書ノード620の一例を図24に示す。文書ノード620は、当該文書を表すURI621、文書の種別622、および、1つもしくは複数の関連リンクノード610へのポインタを格納するポインタ623のリストからなる情報の組を持つ。ポインタ623のリストは配列、リンクトリスト等で実装されるが、プログラミング言語の実行環境における標準ライブラリが提供するものとして、本実施形態では詳細な説明を省略する。
【0131】
URI−文書ノード対応管理テーブル630の一例を図25に示す。URI−文書ノード対応管理テーブル630は、文書のURI631と文書ノードへのポインタ632の情報の組を保持する。
【0132】
次に、関連リンクノード610および文書ノード620で表す関連リンクのグラフ構造およびURI−文書ノード対応管理テーブル630の一部の一例を図26に示す。
図26では、各文書ノードから関連リンクノード610をポイントして(指して)いる。また、各関連リンクノード610から、文書ノードをポイントしている。また、図26において、関連リンクノード610中に示す値は関連度611を示している。このように、第2の実施形態ではグラフ構造で関連リンクの情報を持つ。
【0133】
案件セッション別有効文書一覧テーブル520aおよび探索の訪問済み文書管理テーブル640の一例を図27に示す。案件セッション別有効文書一覧テーブル520aは、URI522aの情報を持つ。探索の訪問済み文書管理テーブル640は、URI641の情報を持つ。この案件セッション別有効文書一覧テーブル520aと探索の訪問済み文書管理テーブル640は、後記する探索において文書を訪問したか否かを管理するために用いる。
【0134】
第2の実施形態では、関連リンクノード610の関連度611の算出のために関連リンク生成用スタック650を用いる。関連リンク生成用スタック650の一例を図28に示す。関連リンク生成用スタック650は、文書のURI651をスタックしている。また、関連リンク生成用スタック650の要素の数を示す要素数652を持つ。関連リンク生成用スタックに要素をPUSHする際には要素数652の値を「1」加え、また、POPする際には要素数652の値を「1」減らす。なお、この関連リンク生成用スタック650は、第1の実施形態における有効文書巡回用スタック580のような、関連イベントによるツリー構造を探索するためのものではない。
【0135】
次に、図29および図30を用いて、全体フローの動作イメージおよび各構成の関係を説明する。ステップ1001〜ステップ1004の処理内容は第1の実施形態と同じである。そして、第1の実施形態(図12参照)では関連イベントテーブル510から案件セッション別有効文書一覧テーブル520を生成(ステップ1005)して関連リンクの生成(ステップ1006)をしていたが、第2の実施形態では関連イベントテーブル510から案件セッション別有効文書一覧テーブル520aを作成するステップの中で関連リンクを生成する(ステップ1006a)。その概要を説明すると、関連生成部225aは、関連イベントテーブル510を参照し、案件セッション別有効文書一覧テーブル520a、探索の訪問済み文書管理テーブル640および関連リンク生成用スタック650を用いて関連リンクを生成する。そして、関連生成部225aは、生成した関連リンクの情報を関連リンク管理情報530aに格納する。
【0136】
関連リンクを生成するステップ1006aの処理の詳細を説明する。以下ではステップ1004までの処理で、関連イベントテーブル510には関連イベントの各情報が第1の実施形態と同様に格納され、かつ、クライアント100からコンテンツ体系化サーバ200に作成文書が登録されたとして、それ以降の処理を説明する。
【0137】
関連イベントテーブル510の情報から関連リンクを生成する処理(ステップ1006a)の詳細を、図31a〜図31dおよび図22を用いて説明する。図31a〜図31dの処理では、関連イベントテーブル510に格納している情報に基づいて、作成文書を起点とする探索を2重にループすることにより、有効文書の任意の二文書間の関連リンクを生成する。
【0138】
図31aにおける関連リンクの生成の処理フローで、まず、関連生成部225aは作成文書のURIを引数として第1の探索を行う(ステップ1901)。このステップ1901でいう作成文書とは、ステップ1003(図29参照)で関連学習制御部223がクライアント100から受け付けた作成文書のことである。
【0139】
(第1の探索の処理)
次に、ステップ1901の第1の探索の処理内容の詳細を、図31bおよび図22を用いて説明する。
第1の探索(ステップ1901)は、文書のURIを引数として呼び出される。まず、関連生成部225aは、引数で指定された文書のURIを第1の関連リンク生成用スタック650aにPUSHする(ステップ1903)。なお、関連リンク生成用スタック650として、第1の関連リンク生成用スタック650aと、第2の関連リンク生成用スタック650bとがあるものとする。
【0140】
次に、関連生成部225aは、第1の探索の引数であるURIを案件セッション別有効文書一覧テーブル520aに格納する(ステップ1904)。
次に、関連生成部225aは、探索の訪問済み文書管理テーブル640の内容をクリアする(ステップ1905)。
【0141】
そして、関連生成部225aは、第1の探索を呼び出したときの引数のURIを引数に第2の探索を呼び出す(ステップ1906)。この第2の探索の処理内容の詳細は後記する。
【0142】
関連生成部225aは、引数である文書のURIを関連イベントテーブル510の関連元のURI512(図4参照)に持つレコードに対してステップ1907〜1910の処理を繰り返す。ただし、この繰り返し処理は、前記作成文書と同じ案件セッションIDを関連イベントテーブル510の案件セッションID511に持つレコードに対して実施する。
【0143】
関連生成部225aは、前記レコードにおける関連先のURI514が案件セッション別有効文書一覧テーブル520a(図27参照)に存在するか判定する(ステップ1908)。ステップ1908で「存在しない」と判定した場合、ステップ1909に進む。一方、ステップ1908で「存在する」と判定した場合、ステップ1910に進む。
ステップ1909で、関連生成部225aは、前記関連先のURIを引数にして第1の探索を再帰的に呼び出す。
【0144】
ステップ1907〜1910の処理の終了後、関連生成部225aは、ステップ1911で第1の関連リンク生成用スタック650aから要素をPOPし、処理を終了する(ステップ1912)。
【0145】
(第2の探索の処理)
次に、第2の探索(図31bのステップ1906)の処理の内容を、図31cを用いて説明する。
まず、関連生成部225aは、第2の関連リンク生成用スタック650bに、第2の探索の呼び出し時に引数で指定された文書のURIをPUSHする(ステップ1921)。
【0146】
次に、関連生成部225aは、第2の探索の引数であるURIを探索の訪問済み文書管理テーブル640に格納する(ステップ1922)。
次に、関連生成部225aは、第2の探索の引数のURIと第2の探索を呼び出した第1の探索の引数のURIが等しいか判定する(ステップ1923)。同一文書への関連リンクを生成する必要はないため、このステップ1923の判定は、第1の探索および第2の探索で同一文書を見ているか否かを判定するための処理である。
【0147】
ステップ1923で関連生成部225aがNoと判定した場合には、ステップ1924に進む。ステップ1924で、関連生成部225aは文書間の関連度611を算出する。ステップ1924の処理の詳細は、後に図31dを用いて説明する。
【0148】
次に、関連生成部225aは、URI−文書ノード対応管理テーブル630をサーチして、第2の探索呼び出し時の引数のURIが示す文書ノードを取得する。(ステップ1925)。
【0149】
次に、関連生成部225aは、第2の探索呼び出し時の第1の探索の引数のURIから第2の探索の引数のURIへの関連リンクノードが存在するか判定する(ステップ1926)。
関連リンクノード610は存在しないと判定した場合(ステップ1926でNo)、関連生成部225aは、ステップ1927に進む。
一方、関連リンクノード610は存在すると判定した場合(ステップ1926でYes)、関連生成部225aは、ステップ1928に進む。
【0150】
ステップ1927で、関連生成部225aは、新たに関連リンクノード610を生成し、前記生成した関連リンクノード610に第2の探索の引数である文書のURIを持つ文書ノードへのポインタおよびステップ1924で算出した関連度611の値を格納する。また、併せて、第2の探索を呼び出した第1の探索の引数の文書のURIをURI621に持つ文書ノード620における関連リンクノード610へのポインタに前記生成した関連リンクノード610へのポインタを追加する。
【0151】
一方、ステップ1928では、関連生成部225aは、既存の関連リンクノード610に前記算出した関連度611の値を加えて更新する。
【0152】
次に、関連生成部225aは、引数である文書のURIを関連イベントテーブル510の関連元のURI512に持つレコードに対してステップ1929〜1932の処理を繰り返す。ただし、この繰り返し処理は、前記作成文書と同じ案件セッションIDを関連イベントテーブル510の案件セッションID511に持つレコードに対して実施する。
【0153】
関連生成部225aは、前記レコードにおける関連先のURI514が探索の訪問済み文書管理テーブル640に存在するか判定する(ステップ1930)。ステップ1930で「存在しない」と判定した場合、ステップ1931に進む。一方、ステップ1930で「存在する」と判定した場合、ステップ1932に進む。
【0154】
ステップ1931で、関連生成部225aは、前記関連先のURIを引数にして第2の探索を再帰的に呼び出す。
【0155】
ステップ1929〜1932の処理の終了後、関連生成部225aは、ステップ1933で第2の関連リンク生成用スタック650bから要素をPOPし、処理を終了する。
【0156】
(関連度の算出処理)
次に、ステップ1924の関連度611の算出処理の詳細を、図31dおよび図22を用いて説明する。
【0157】
関連度611の算出には、まず文書間の距離を算出する。文書間の距離とは、2つの有効文書間がいくつの関連イベントで辿り着けるかというホップ数である。距離の算出は、第1の関連リンク生成用スタック650aと第2の関連リンク生成用スタック650bとを比較して求める。
【0158】
まず、関連生成部225aは、ステップ1941で第1の関連リンク生成用スタック650aの要素の最大数になるまでの間、ステップ1942の処理を繰り返す。このステップ1942を繰り返し実行する回数をiとしたとき、関連生成部225aは第1および第2の関連リンク生成用スタック650a、650bのそれぞれ下からi番目の値が等しいか判定する。ただし、このiの値は「0」からはじまるものとする。関連生成部225aはステップ1942でYesと判定した場合には、ステップ1941〜ステップ1943の繰り返し処理を抜けてステップ1944に進む。
【0159】
次に、ステップ1944で、関連生成部225aは、第1の関連リンク生成用スタック650aの要素数652aとiの値の差を算出する。
次にステップ1945で、関連生成部225aは、第2の関連リンク生成用スタック650bの要素数652bとiの値の差を算出する。
【0160】
次にステップ1946で、関連生成部225aは、ステップ1944とステップ1945で算出した値の和を求める。この和の値が、距離の値である。
【0161】
次に、ステップ1947で、関連生成部225aは、ステップ1946で算出した距離の値の逆数を求め、この値を関連度611の値とする。ただし、関連度611の値はこのように逆数により算出する方法に限るわけでなく、他の方法により関連度611を算出し設定してもかまわない。
【0162】
第2の実施形態における関連リンクの生成に関する具体事例を、図26を用いて説明する。図26に示すように、k1からk2に新たに関連リンクノード610を生成する場合、k2を示す文書ノードへのポインタを持つ関連リンクノード610aを生成する。そして、この生成した関連リンクノード610aへのポインタを、k1の文書ノードに加える。ここで、k1からk2への距離は「5」だったすると、その逆数である「0.2」を関連度611として、前記生成した関連リンクノード610aは持つ。
【0163】
一方、既存の関連リンクノード610に前記算出した関連度611の値を加えて更新する場合の具体事例も、同様に図26を用いて説明する。p1からk1に関連リンクノード610bは存在し、その関連度611はあるとき「2.0」だったとする。そして、新たに、p1からk1への距離が「1」であり、距離の逆数である関連度611が「1」となる場合があったとする。このとき、p1からk1への関連リンクを示す関連リンクノード610の関連度611は「3.0」となり、図26に示すように、p1からk1への関連リンクを示す関連リンクノード610bが更新される。ここまでが、関連リンク学習の処理詳細である。
【0164】
次に、第2の実施形態におけるレコメンド実行時の処理詳細を説明する。第1の実施形態におけるレコメンド実行時と同様に、クライアント100のブラウザ121が検索するために検索キーワードの入力を受け付けた場合に、コンテンツ体系化サーバ200から前記検索キーワードに関連する検索キーワードをユーザに提示する場面を想定する。また、クライアント100側のブラウザ121の動作は第1の実施形態と同様なので、説明を省略する。ここでは、第1の実施形態と異なるキーワードレコメンド生成部227aの処理内容を、図32を用いて説明する。
【0165】
図32は、第2の実施形態におけるレコメンド実行時のコンテンツ体系化サーバ200の処理内容を示すフローの一例である。また、図32のステップ1801およびステップ1802の処理内容は、それぞれ図20bにおけるステップ1801およびステップ1802の処理内容と同様である。
【0166】
次に、キーワードレコメンド生成部227aは、ステップ1802で取得した検索キーワードのURIを持つ文書ノード620をサーチする(ステップ2001)。次に、キーワードレコメンド生成部227aは、ステップ2001で取得した文書ノード620における関連リンクノードへのポインタ623をサーチして、関連リンクノード610を取得する(ステップ2002)。
【0167】
次に、キーワードレコメンド生成部227aは、ここまでの処理で取得した関連リンクを、それぞれの関連リンクノード610の関連度611(図23参照)の値でソートする(ステップ2003)。次に、キーワードレコメンド生成部227aは、前記ソートしたサーチ結果をproxy部228に受け渡し、proxy部228はブラウザ121に前記ソートしたサーチ結果を送信し(ステップ1805)、処理を終了する。このようにして、ブラウザ121は、入力した検索キーワードに関連する検索キーワードのレコメンドを受けることができる。
【0168】
このように、本実施形態の関連文書表示システム1000によれば、電子データである文書の集合を用いた調査業務等において、文書の検索時に、例えば、前記した例では、「バックアップ」という検索キーワードに基づいて「スナップショット」や「RAID」という適切な検索キーワードを確実にレコメンドすることができる。
【0169】
つまり、従来技術とは異なり、結果集合が論理和(OR)となるような関連キーワードを提示することができる。この場合、現在の検索結果集合には必ずしも存在しないが、業務上関連の深い情報を効率良く提示できることが重要である。
また、過去の検索履歴データを案件セッションごとに解析して利用するので、一般的に統計処理に向かない程度に参照回数が少ない業務においても情報同士の関連を提示することができる。
【0170】
以上で本実施形態の説明を終えるが、本発明の態様はこれらに限定されるものではない。
例えば、本実施形態では、クライアント100、コンテンツ体系化サーバ200、検索サーバ301およびWebサーバ302を、それぞれ別々のハードウェア構成として説明したが、それらの任意の2つ以上がハードウェア的に1つのものとして構成されていても良い。
【0171】
また、案件セッションの開始は、ユーザが明示的に指示することによって認識しても、あるいは、ユーザによる検索キーワードの入力があったときに自動的に認識するようにしても、いずれでも良い。
また、案件セッションの開始を認識しなくても、ユーザによる検索の操作内容を常時記憶しておき、所定の文書(c1)が作成されたときに、その対応する案件セッションについて、常時記憶した操作内容に基づき、関連イベントがあった任意の二者を関連イベントテーブル510に記憶するようにしても良い。
【0172】
また、本実施形態では、レコメンド実行時の処理に関して、ユーザが検索キーワードを入力したときに関連する検索キーワードを提示する場合について説明したが、ユーザが文書を閲覧したときに関連する文書を提示する場合など、他の場面にも適用することができる。
【0173】
なお、関連文書表示システム1000を構成する各コンピュータに実行させるためのプログラムを作成し、コンピュータにインストールすることにより、各コンピュータは、そのプログラムに基づいた各機能を実現することができる。
その他、ハードウェア、プログラム等の具体的な構成について、本発明の主旨を逸脱しない範囲で適宜変更が可能である。
【符号の説明】
【0174】
100 クライアント
121 ブラウザ
124 エディタ部
129 HTMLレンダリング部
200 コンテンツ体系化サーバ
223 関連学習制御部
228 proxy部(レコメンド制御部)
300 LAN
301 検索サーバ
302 Webサーバ
510 関連イベントテーブル(関連イベント記憶部)
520 案件セッション別有効文書一覧テーブル
530 関連リンク管理情報(関連リンク記憶部)
1000 関連文書表示システム


【特許請求の範囲】
【請求項1】
電子データである文書の集合の中から、ユーザによって閲覧された文書に関連する文書を前記ユーザに対して表示する関連文書表示システムであって、
前記文書の集合を使用するユーザによって新たな文書が作成されるとき、前記新たな文書の作成の開始から終了までのユーザによる一連の前記文書の集合へのアクセスをひとまとまりの案件セッションとして管理し、
前記案件セッションごとに、ユーザによる前記文書の集合へのアクセス時の操作内容を捕捉し、前記操作内容に基づいて、前記文書の集合における関連のある文書同士を、関連イベントがあったものとして、関連イベント記憶部に記憶し、
前記関連イベント記憶部を参照し、前記文書の集合において、前記作成した文書を始点として、前記関連イベントに基づいて、関連のある文書を順に辿り、辿ったうちの任意の2つの文書を有効な関連リンクとして関連リンク記憶部に記憶する関連学習制御部と、
その後、ユーザによって前記文書の集合におけるいずれかの文書が閲覧された場合、
前記関連リンク記憶部を参照して、前記閲覧された文書と有効な関連リンクを有する文書を抽出し、
当該抽出した文書を、前記閲覧された文書に関連する文書として表示部に表示するレコメンド制御部と、
を有することを特徴とする関連文書表示システム。
【請求項2】
前記関連学習制御部は、前記案件セッションの開始を、ユーザによる文書の作成を開始する旨の入力によって認識する
ことを特徴とする請求項1に記載の関連文書表示システム。
【請求項3】
前記関連学習制御部は、前記案件セッションの開始を、ユーザによる文書の作成のための操作の入力によって認識する
ことを特徴とする請求項1に記載の関連文書表示システム。
【請求項4】
前記関連学習制御部は、ユーザによる前記操作内容を常時記憶しておき、前記文書の作成が行われたとき、その対応する案件セッションについて、前記常時記憶した操作内容に基づき、関連イベントがあった任意の2つの文書を前記関連イベント記憶部に記憶する
ことを特徴とする請求項1に記載の関連文書表示システム。
【請求項5】
前記関連学習制御部は、ユーザによって、文書であるウェブページのハイパーリンクが辿られ、別の文書であるウェブページに遷移したことを、関連イベントがあったものとして認識し、当該2つの文書を有効な関連リンクとして前記関連イベント記憶部に記憶する
ことを特徴とする請求項1に記載の関連文書表示システム。
【請求項6】
前記関連学習制御部は、文書の少なくとも一部のテキストデータがコピーされて前記作成される文書にペーストされたことを、関連イベントがあったものとして認識し、当該コピーされた文書と当該ペーストされた文書とを有効な関連リンクとして前記関連イベント記憶部に記憶する
ことを特徴とする請求項1に記載の関連文書表示システム。
【請求項7】
前記関連学習制御部は、検索キーワードを用いた検索により得られた文書を参照したことを、関連イベントがあったものとして認識し、当該検索キーワードと当該参照された文書とを有効な関連リンクとして前記関連イベント記憶部に記憶する
ことを特徴とする請求項1に記載の関連文書表示システム。
【請求項8】
前記関連学習制御部は、
前記任意の2つの文書を有効な関連リンクとして関連リンク記憶部に記憶するとき、前記関連リンクごとに、当該任意の2つの文書の間に辿るべく介在する検索キーワードおよび文書の数が少ないほど大きな関連度の情報を併せて前記関連リンク記憶部に記憶し、
前記レコメンド制御部は、
前記抽出した文書を、前記閲覧された文書に関連する文書として表示部に表示するとき、前記関連度に応じてソートして表示する
ことを特徴とする請求項1に記載の関連文書表示システム。
【請求項9】
電子データである文書の集合の中から、ユーザによって閲覧された文書に関連する文書を前記ユーザに対して表示する関連文書表示システムによる関連文書表示方法であって、
前記関連文書表示システムは、関連イベント記憶部と、関連リンク記憶部と、関連学習制御部と、レコメンド制御部と、を備えており、
前記関連学習制御部は、
前記文書の集合を使用するユーザによって新たな文書が作成されるとき、前記新たな文書の作成の開始から終了までのユーザによる一連の前記文書の集合へのアクセスをひとまとまりの案件セッションとして管理し、
前記案件セッションごとに、ユーザによる前記文書の集合へのアクセス時の操作内容を捕捉し、前記操作内容に基づいて、前記文書の集合における関連のある文書同士を、関連イベントがあったものとして、関連イベント記憶部に記憶し、
前記関連イベント記憶部を参照し、前記文書の集合において、前記作成した文書を始点として、前記関連イベントに基づいて、関連のある文書を順に辿り、辿ったうちの任意の2つの文書を有効な関連リンクとして関連リンク記憶部に記憶し、
その後、ユーザによって前記文書の集合におけるいずれかの文書が閲覧された場合、
前記レコメンド制御部は、
前記関連リンク記憶部を参照して、前記閲覧された文書と有効な関連リンクを有する文書を抽出し、
当該抽出した文書を、前記閲覧された文書に関連する文書として表示部に表示する
ことを特徴とする関連文書表示方法。
【請求項10】
前記関連学習制御部は、前記案件セッションの開始を、ユーザによる文書の作成を開始する旨の入力によって認識する
ことを特徴とする請求項9に記載の関連文書表示方法。
【請求項11】
前記関連学習制御部は、前記案件セッションの開始を、ユーザによる文書の作成のための操作の入力によって認識する
ことを特徴とする請求項9に記載の関連文書表示方法。
【請求項12】
前記関連学習制御部は、ユーザによる前記操作内容を常時記憶しておき、前記文書の作成が行われたとき、その対応する案件セッションについて、前記常時記憶した操作内容に基づき、関連イベントがあった任意の2つの文書を前記関連イベント記憶部に記憶する
ことを特徴とする請求項9に記載の関連文書表示方法。
【請求項13】
前記関連学習制御部は、ユーザによって、文書であるウェブページのハイパーリンクが辿られ、別の文書であるウェブページに遷移したことを、関連イベントがあったものとして認識し、当該2つの文書を有効な関連リンクとして前記関連イベント記憶部に記憶する
ことを特徴とする請求項9に記載の関連文書表示方法。
【請求項14】
前記関連学習制御部は、文書の少なくとも一部のテキストデータがコピーされて前記作成される文書にペーストされたことを、関連イベントがあったものとして認識し、当該コピーされた文書と当該ペーストされた文書とを有効な関連リンクとして前記関連イベント記憶部に記憶する
ことを特徴とする請求項9に記載の関連文書表示方法。
【請求項15】
前記関連学習制御部は、検索キーワードを用いた検索により得られた文書を参照したことを、関連イベントがあったものとして認識し、当該検索キーワードと当該参照された文書とを有効な関連リンクとして前記関連イベント記憶部に記憶する
ことを特徴とする請求項9に記載の関連文書表示方法。
【請求項16】
前記関連学習制御部は、
前記任意の2つの文書を有効な関連リンクとして関連リンク記憶部に記憶するとき、前記関連リンクごとに、当該任意の2つの文書の間に辿るべく介在する検索キーワードおよび文書の数が少ないほど大きな関連度の情報を併せて前記関連リンク記憶部に記憶し、
前記レコメンド制御部は、
前記抽出した文書を、前記閲覧された文書に関連する文書として表示部に表示するとき、前記関連度に応じてソートして表示する
ことを特徴とする請求項9に記載の関連文書表示方法。
【請求項17】
請求項1から請求項8のいずれか1項に記載の関連文書表示システムとしてコンピュータを機能させるためのプログラム。


【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14a】
image rotate

【図14b】
image rotate

【図15】
image rotate

【図16a】
image rotate

【図16b】
image rotate

【図16c】
image rotate

【図16d】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20a】
image rotate

【図20b】
image rotate

【図21a】
image rotate

【図21b】
image rotate

【図22】
image rotate

【図23】
image rotate

【図24】
image rotate

【図25】
image rotate

【図26】
image rotate

【図27】
image rotate

【図28】
image rotate

【図29】
image rotate

【図30】
image rotate

【図31a】
image rotate

【図31b】
image rotate

【図31c】
image rotate

【図31d】
image rotate

【図32】
image rotate


【公開番号】特開2011−28447(P2011−28447A)
【公開日】平成23年2月10日(2011.2.10)
【国際特許分類】
【出願番号】特願2009−172387(P2009−172387)
【出願日】平成21年7月23日(2009.7.23)
【出願人】(000005108)株式会社日立製作所 (27,607)
【Fターム(参考)】