情報検索システム、情報提供装置、情報検索方法、並びに、プログラムおよび記録媒体
【課題】ユーザは1個のキーワードを指定するだけで、ユーザが関心のある情報を取得でき、ユーザにプライバシに関する損害を与える可能性が低く、しかも検索精度の良い、あるいはまた、より高いクリック率を実現する情報検索システムを提供する。
【解決手段】この情報検索システムは、表示された文書や情報に関するキーワードを入力する入力手段と、表示された文書や情報からキーワードを抽出するキーワード抽出手段と、前記入力手段によって入力されたキーワードと前記キーワード抽出手段で抽出したキーワードに基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段と、前記検索手段で検索された検索結果の文書や情報を表示する表示手段を備えている。
【解決手段】この情報検索システムは、表示された文書や情報に関するキーワードを入力する入力手段と、表示された文書や情報からキーワードを抽出するキーワード抽出手段と、前記入力手段によって入力されたキーワードと前記キーワード抽出手段で抽出したキーワードに基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段と、前記検索手段で検索された検索結果の文書や情報を表示する表示手段を備えている。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報検索システム、情報提供装置、情報検索方法、並びに、プログラムおよび記録媒体に関し、具体的には、ユーザからのキーワード検索要求に対して、その検索結果の提供や指定されたキーワードに関連した広告の提供に関する。
【背景技術】
【0002】
近年、インターネットの普及によって、ネットワークに接続された世界中のコンピュータから様々な情報を取り出すことが可能となっている。この場合、提供しようとする情報を収めたコンピュータをWebサーバに設定することによって、その情報を欲する世界中の人々が持つ情報端末装置にインターネットを介して容易に提供することができ、人々は欲しいと思う情報をすばやく手に入れることができる。
【0003】
そのために、世界中のWebサーバがどのような情報を提供しているかを予め収集して目次情報を保持しておき、人々が欲しいと思う情報を表すキーワード(単語)を入力すると、そのキーワードを含む情報を目次情報の中からすべて検索し、その結果リストアップして表示してくれるサーチエンジンが提供されている。
【0004】
一般に、欲しいと思う情報を得るためには、1個のキーワードを指定して、適切な検索結果が得られるのが理想である。
しかしながら、同じ単語が分野や状況によって異なる意味で用いられており、特に、固有名詞や略称(略語)の場合には顕著である。
例えば、「Smart Taggs」という用語は、情報処理ソフトウェア分野においてはMicrosoft社のユーザインタフェース技術の名称であり、同じ情報処理のメディア分野においてはRF-ID技術の名称でもある。また、「ATM」は、銀行のATM(現金自動預入払出機)や金融関連では「At the Money」の略語であり、通信分野ではスイッチング方式の名称「Asynchronous Transfer Mode」の略語である。
【0005】
このように、一般的なサーチエンジンにおいては、1個のキーワードでは不足であり、不要情報を排除するために3個程度のキーワードでAND検索を行わないと適切な検索結果を得られないと言われている。
【0006】
一方、目的のWebページにアクセスした場合に表示されるバナー広告は、興味あるものや探しているものなどを偶然見つけるのに便利なものであるが、適切なバナー広告を見つけることは比較的少なく、近年バナー広告の広告効果が低下している。そのためバナー広告の広告主は、お客の気を引く内容のものを表示しようとしているが、お客の心理や嗜好を適確に把握しきれているとは限らない。また、リアルタイム性がなく、お客にするインパクトに欠けている。
【0007】
このような状態を打開するために、最近では広告型検索サービスが利用されるようになってきた。この広告型検索サービスは、広告主に関連があるキーワードに1クリック当りの価格を付けさせて、高い単価を支払った順に広告を表示し、クリックされた回数と単価を掛けた金額が広告主に請求され、広告を表示した提携サイトにはこの請求金額の一部が支払われというサービスであり、PPC(Pay Per Click)またはPFP(Pay For Performance)と呼ばれる広告のことで、最近は日本でも多くのサーチエンジンが利益確保のために導入している。
広告の表示のされ方は、一般の検索結果と同じように、サーチエンジンの検索結果の上部に一般の検索結果とは別にキーワードを入札した企業の広告をテキストによるリンク形式で表示する。
【0008】
この広告型検索サービスは、検索を行ったユーザが指定した特定のキーワードだけに反応してリンクするようにしたので、ユーザの意思と関係なくリンクしていた従来のバナー広告に比べて、広告のクリック率はかなり高くなっている。
【0009】
しかし、ユーザが入力したキーワードがそのユーザにとって関心の高いキーワードとは限らない。例えば、ユーザの興味ある文書を読んでいたときに、その文書中に訳語が分からないため検索サービスを利用したということが考えられる。
このような、ユーザにとって興味のある情報を提供する技術として、特許文献1に開示された技術がある。
【0010】
特許文献1の技術は、ユーザが情報検索に普段利用している端末装置に蓄えられている、情報検索とは直接関係のない文書ファイルなどの情報からユーザの嗜好を反映する単語を自動的に抽出して単語の関係種別ごとに分類して嗜好情報記憶手段に記憶させておく。
その上で、ユーザが情報検索を行うときには、入力した検索キーワードと、この検索キーワードに関連する補助キーワードを嗜好情報記憶手段から取り出して、この検索キーワードにより検索された結果を、動作関係の補助キーワードを用いてユーザの日常の行動様式を推定し、その推定した行動様式に応じて分類して表示するようにしている。
これにより、ユーザがキーワードの設定に不慣れであっても、ユーザの嗜好を反映して効率的な情報検索を行うことができる。
【0011】
しかしながら、特許文献1では、指定された検索キーワードがそのユーザにとって関心の高いキーワードとは限らないため、嗜好を反映した検索結果とはいえない。また、特許文献1では、広告検索型サービスの場合には、広告主の意思を反映し、しかもユーザの関心の高い広告コンテンツを提供できるとは限らない。
【0012】
また、広告型検索サービスにおいては、ユーザの関心事や嗜好を反映するために、ユーザが閲覧したWebページのURLを取得する場合があり、このときには、取得されたURLによりそのWebページの全ての情報が見られてしまい、プライバシへの損害を与える可能性が高い。
【特許文献1】特開平11−296537号公報
【発明の開示】
【発明が解決しようとする課題】
【0013】
本発明は、上述のような実情を考慮してなされたものであって、ユーザは1個のキーワードを指定するだけで、ユーザが関心のある情報を取得できる情報検索システム、情報提供装置、情報検索方法、並びに、プログラムおよび記録媒体を提供することを目的とする。
さらに、本発明は、ユーザにプライバシに関する損害を与える可能性が低く、しかも検索精度の良い、あるいはまた、より高いクリック率を実現する情報検索システム、情報提供装置、情報検索方法、並びに、プログラムおよび記録媒体を提供することを目的とする。
【課題を解決するための手段】
【0014】
上記課題を解決するために、請求項1に記載の発明は、表示された文書や情報(以下、閲覧文書という)に関するキーワードを入力する入力手段と、前記閲覧文書からキーワードを抽出するキーワード抽出手段と、前記入力手段によって入力されたキーワード(以下、入力キーワードという)と前記キーワード抽出手段で抽出したキーワード(以下、補助キーワードという)に基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段と、前記検索手段で検索された検索結果の文書や情報を表示する表示手段を備えることを特徴とする。
【0015】
請求項2に記載の発明は、表示された文書や情報(以下、閲覧文書という)に関するキーワードを入力する入力手段と、前記閲覧文書からキーワードを抽出するキーワード抽出手段と、前記入力手段によって入力されたキーワード(以下、入力キーワードという)と前記キーワード抽出手段で抽出したキーワード(以下、補助キーワードという)に基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段と、前記入力キーワードと前記補助キーワードに基づいて、広告情報記憶手段に記憶された広告コンテンツを検索する広告検索手段と、前記検索手段で検索された検索結果の文書や情報、および前記広告検索手段で検索された広告コンテンツを表示する表示手段を備えることを特徴とする。
【0016】
請求項3に記載の発明は、請求項2に記載の情報検索システムにおいて、前記広告検索手段は、前記閲覧文書から抽出した補助キーワードのみ、または入力キーワードと重複するキーワードを除いた補助キーワードのみに基づいて検索するようにしたことを特徴とする。
【0017】
請求項4に記載の発明は、表示された文書や情報(以下、閲覧文書という)に関するキーワードを入力する入力手段と、前記閲覧文書からキーワードを抽出するキーワード抽出手段と、ユーザの関心情報であるキーワードとその出現頻度を保管するユーザキーワードDBと、前記ユーザキーワードDBの出現頻度の高いキーワードを選択して補助キーワードとして出力するとともに、前記キーワード抽出手段により抽出されたキーワードと前記入力手段によって入力されたキーワード(以下、入力キーワードという)に基づいて前記ユーザキーワードDBの更新を行うユーザキーワード管理手段と、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段と、前記検索手段で検索された検索結果の文書や情報を表示する表示手段を備えることを特徴とする。
【0018】
請求項5に記載の発明は、表示された文書や情報(以下、閲覧文書という)に関するキーワードを入力する入力手段と、前記閲覧文書からキーワードを抽出するキーワード抽出手段と、ユーザの関心情報であるキーワードとその出現頻度を保管するユーザキーワードDBと、前記ユーザキーワードDBの出現頻度の高いキーワードを選択して補助キーワードとして出力するとともに、前記キーワード抽出手段により抽出されたキーワードと前記入力手段によって入力されたキーワード(以下、入力キーワードという)に基づいて前記ユーザキーワードDBの更新を行うユーザキーワード管理手段と、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段と、前記入力キーワードと前記補助キーワードに基づいて、広告情報記憶手段に記憶された広告コンテンツを検索する広告検索手段と、前記検索手段で検索された検索結果の文書や情報、および前記広告検索手段で検索された広告コンテンツを表示する表示手段を備えることを特徴とする。
【0019】
請求項6に記載の発明は、表示された文書や情報に関するキーワードを入力する入力手段と、ユーザの関心情報であるキーワードとその出現頻度を保管するユーザキーワードDBと、前記ユーザキーワードDBの出現頻度の高いキーワードを選択して補助キーワードとして出力するとともに、前記入力手段によって入力されたキーワード(以下、入力キーワードという)に基づいて前記ユーザキーワードDBの更新を行うユーザキーワード管理手段と、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段と、前記検索手段で検索された検索結果の文書や情報を表示する表示手段を備えることを特徴とする。
【0020】
請求項7に記載の発明は、表示された文書や情報に関するキーワードを入力する入力手段と、ユーザの関心情報であるキーワードとその出現頻度を保管するユーザキーワードDBと、前記ユーザキーワードDBの出現頻度の高いキーワードを選択して補助キーワードとして出力するとともに、前記入力手段によって入力されたキーワード(以下、入力キーワードという)に基づいて前記ユーザキーワードDBの更新を行うユーザキーワード管理手段と、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段と、前記入力キーワードと前記補助キーワードに基づいて、広告情報記憶手段に記憶された広告コンテンツを検索する広告検索手段と、前記検索手段で検索された検索結果の文書や情報、および前記広告検索手段で検索された広告コンテンツを表示する表示手段を備えることを特徴とする。
【0021】
請求項8に記載の発明は、請求項4、5、6または7に記載の情報検索システムにおいて、前記ユーザキーワードDBは、共起出現率ユーザキーワードDBであって、前記ユーザキーワード管理手段は、前記入力キーワードと前記閲覧文書から抽出されたキーワードに基づいて共起出現率の高いキーワードを選択して補助キーワードとして出力するとともに、前記入力キーワードと前記閲覧文書から抽出されたキーワードに基づいて前記共起出現率ユーザキーワードDBを更新するようにした。
【0022】
請求項9に記載の発明は、請求項5または7に記載の情報検索システムにおいて、前記広告検索手段は、前記ユーザキーワード管理手段で選択された補助キーワードのみ、または入力キーワードと重複するキーワードを除いた補助キーワードのみに基づいて検索するようにしたことを特徴とする。
【0023】
請求項10に記載の発明は、情報検索の指示と検索結果を表示するユーザサイトと、情報検索サービスを提供するサービスサイトとをネットワークで接続した情報検索システムにおいて、請求項1乃至3のいずれかに記載の情報検索システムのうち、前記キーワード抽出手段を前記ユーザサイトに備え、前記キーワード抽出手段から抽出されたキーワードを補助キーワードとして前記サービスサイトへ転送することを特徴とする。
【0024】
請求項11に記載の発明は、情報検索の指示と検索結果を表示するユーザサイトと、情報検索サービスを提供するサービスサイトとをネットワークで接続した情報検索システムにおいて、請求項4乃至9のいずれかに記載の情報検索システムのうち、前記ユーザキーワードDBと前記ユーザキーワード管理手段を前記サービスサイトに備えることを特徴とする。
【0025】
請求項12に記載の発明は、情報検索の指示と検索結果を表示するユーザサイトと、情報検索サービスを提供するサービスサイトとをネットワークで接続した情報検索システムにおいて、請求項4乃至9のいずれかに記載の情報検索システムのうち、前記ユーザキーワードDBと前記ユーザキーワードDB管理手段を前記ユーザサイトに備えることを特徴とする。
【0026】
請求項13に記載の発明は、請求項10、11または12に記載の情報検索システムにおいて、文書や情報に対する転送可否を記憶した文書IDテーブルを参照して、ユーザの表示した文書や情報の転送可否を決定する転送フィルタ手段を前記ユーザサイトに備え、転送可の文書や情報から抽出したキーワードのみを前記サービスサイトへ転送するようにしたことを特徴とする。
【0027】
請求項14に記載の発明は、請求項13に記載の情報検索システムにおいて、前記転送フィルタ手段は、転送可否を決定した文書の転送許可確認を求めるとともに、転送可否状態で文書IDテーブルを更新することを特徴とする。
【0028】
請求項15に記載の発明は、請求項10乃至14のいずれかに記載の情報検索システムにおいて、キーワードの転送可否を記憶したワードテーブルを参照して、キーワードの転送可否を決定する転送フィルタ手段を前記ユーザサイトに備え、転送可のキーワードのみを前記サービスサイトへ転送するようにしたことを特徴とする。
【0029】
請求項16に記載の発明は、請求項15に記載の情報検索システムにおいて、前記転送フィルタ手段は、転送可否を決定したキーワードの転送許可確認を求めるとともに、転送可否状態でワードテーブルを更新することを特徴とする。
【0030】
請求項17に記載の発明は、請求項10乃至16のいずれかに記載の情報検索システムにおいて、転送しようとするキーワードあるいは文書IDの転送許可を求める転送フィルタ手段を前記ユーザサイトに備え、転送許可されたキーワードまたは文書IDで指示される文書から抽出されるキーワードを前記サービスサイトへ転送するようにしたことを特徴とする。
【0031】
請求項18に記載の発明は、ネットワークで接続したユーザ端末からの情報検索の指示で、情報検索を行って検索結果を返信する情報提供装置において、ユーザが閲覧中の文書や情報(以下、閲覧文書という)に関して入力したキーワード(以下、入力キーワードという)と、前記閲覧文書から抽出されたキーワード(以下、補助キーワードという)を前記ユーザ端末から受信する受信手段と、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段とを備え、前記検索手段で検索された検索結果の文書や情報を前記ユーザ端末へ返信することを特徴とする。
【0032】
請求項19に記載の発明は、ネットワークで接続したユーザ端末からの情報検索の指示で、情報検索を行って検索結果を返信する情報提供装置において、ユーザが閲覧中の文書や情報(以下、閲覧文書という)に関して入力したキーワード(以下、入力キーワードという)と、前記閲覧文書から抽出されたキーワード(以下、補助キーワードという)を前記ユーザ端末から受信する受信手段と、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段と、前記入力キーワードと前記補助キーワードに基づいて、広告情報記憶手段に記憶された広告コンテンツを検索する広告検索手段とを備え、前記検索手段で検索された検索結果の文書や情報、および前記広告検索手段で検索された広告コンテンツを前記ユーザ端末へ返信することを特徴とする。
【0033】
請求項20に記載の発明は、ネットワークで接続したユーザ端末からの情報検索の指示で、情報検索を行って検索結果を返信する情報提供装置において、ユーザが閲覧中の文書や情報(以下、閲覧文書という)に関して入力したキーワード(以下、入力キーワードという)と、前記閲覧文書から抽出されたキーワードを前記ユーザ端末から受信する受信手段と、ユーザの関心情報であるキーワードとその出現頻度を保管するユーザキーワードDBと、前記ユーザキーワードDBの出現頻度の高いキーワードを選択して補助キーワードとして出力するとともに、前記キーワード抽出手段により抽出されたキーワードと前記入力キーワードに基づいて前記ユーザキーワードDBの更新を行うユーザキーワード管理手段と、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段とを備え、前記検索手段で検索された検索結果の文書や情報を前記ユーザ端末へ返信することを特徴とする。
【0034】
請求項21に記載の発明は、ネットワークで接続したユーザ端末からの情報検索の指示で、情報検索を行って検索結果を返信する情報提供装置において、ユーザが閲覧中の文書や情報(以下、閲覧文書という)に関して入力したキーワード(以下、入力キーワードという)と、前記閲覧文書から抽出されたキーワードを前記ユーザ端末から受信する受信手段と、ユーザの関心情報であるキーワードとその出現頻度を保管するユーザキーワードDBと、前記ユーザキーワードDBの出現頻度の高いキーワードを選択して補助キーワードとして出力するとともに、前記キーワード抽出手段により抽出されたキーワードと前記入力キーワードに基づいて前記ユーザキーワードDBの更新を行うユーザキーワード管理手段と、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段と、前記入力キーワードと前記補助キーワードに基づいて、広告情報記憶手段に記憶された広告コンテンツを検索する広告検索手段とを備え、前記検索手段で検索された検索結果の文書や情報、および前記広告検索手段で検索された広告コンテンツを前記ユーザ端末へ返信することを特徴とする。
【0035】
請求項22に記載の発明は、ネットワークで接続したユーザ端末からの情報検索の指示で、情報検索を行って検索結果を返信する情報提供装置において、ユーザが閲覧中の文書や情報(以下、閲覧文書という)に関して入力したキーワード(以下、入力キーワードという)を前記ユーザ端末から受信する受信手段と、ユーザの関心情報であるキーワードとその出現頻度を保管するユーザキーワードDBと、前記ユーザキーワードDBの出現頻度の高いキーワードを選択して補助キーワードとして出力するとともに、前記入力キーワードに基づいて前記ユーザキーワードDBの更新を行うユーザキーワード管理手段と、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段とを備え、前記検索手段で検索された検索結果の文書や情報を前記ユーザ端末へ返信することを特徴とする。
【0036】
請求項23に記載の発明は、ネットワークで接続したユーザ端末からの情報検索の指示で、情報検索を行って検索結果を返信する情報提供装置において、ユーザが閲覧中の文書や情報(以下、閲覧文書という)に関して入力したキーワード(以下、入力キーワードという)を前記ユーザ端末から受信する受信手段と、ユーザの関心情報であるキーワードとその出現頻度を保管するユーザキーワードDBと、前記ユーザキーワードDBの出現頻度の高いキーワードを選択して補助キーワードとして出力するとともに、前記入力キーワードに基づいて前記ユーザキーワードDBの更新を行うユーザキーワード管理手段と、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段と、前記入力キーワードと前記補助キーワードに基づいて、広告情報記憶手段に記憶された広告コンテンツを検索する広告検索手段とを備え、前記検索手段で検索された検索結果の文書や情報、および前記広告検索手段で検索された広告コンテンツを前記ユーザ端末へ返信することを特徴とする。
【0037】
請求項24に記載の発明は、ネットワークで接続したユーザ端末からの情報検索の指示で、情報検索を行って検索結果を返信する情報提供装置において、ユーザが閲覧中の文書や情報(以下、閲覧文書という)に関して入力したキーワード(以下、入力キーワードという)と、ユーザの関心情報であるキーワード(以下、補助キーワードという)を前記ユーザ端末から受信する受信手段と、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段とを備え、前記検索手段で検索された検索結果の文書や情報を前記ユーザ端末へ返信することを特徴とする。
【0038】
請求項25に記載の発明は、ネットワークで接続したユーザ端末からの情報検索の指示で、情報検索を行って検索結果を返信する情報提供装置において、ユーザが閲覧中の文書や情報(以下、閲覧文書という)に関して入力したキーワード(以下、入力キーワードという)と、ユーザの関心情報であるキーワード(以下、補助キーワードという)を前記ユーザ端末から受信する受信手段と、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段と、前記入力キーワードと前記補助キーワードに基づいて、広告情報記憶手段に記憶された広告コンテンツを検索する広告検索手段とを備え、前記検索手段で検索された検索結果の文書や情報、および前記広告検索手段で検索された広告コンテンツを前記ユーザ端末へ返信することを特徴とする。
【0039】
請求項26に記載の発明は、表示された文書や情報(以下、閲覧文書という)に関するキーワードを入力し、前記閲覧文書からキーワードを抽出し、前記入力されたキーワード(以下、入力キーワードという)と前記閲覧文書から抽出したキーワード(以下、補助キーワードという)に基づいて、情報記憶手段に記憶された文書や情報を検索し、前記検索結果の文書や情報を表示することを特徴とする。
【0040】
請求項27に記載の発明は、表示された文書や情報(以下、閲覧文書という)に関するキーワードを入力し、前記閲覧文書からキーワードを抽出し、前記入力されたキーワード(以下、入力キーワードという)と前記閲覧文書から抽出したキーワード(以下、補助キーワードという)に基づいて、情報記憶手段に記憶された文書や情報を検索し、前記入力キーワードと前記補助キーワードに基づいて、広告情報記憶手段に記憶された広告コンテンツを検索し、前記検索結果の文書や情報、および前記広告コンテンツを表示することを特徴とする。
【0041】
請求項28に記載の発明は、表示された文書や情報(以下、閲覧文書という)に関するキーワードを入力し、前記閲覧文書からキーワードを抽出し、ユーザの関心情報であるキーワードとその出現頻度を保管するユーザキーワードDBを参照して、出現頻度の高いキーワードを選択して補助キーワードとして出力するとともに、前記閲覧文書から抽出されたキーワードと前記入力キーワードに基づいて前記ユーザキーワードDBを更新し、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索し、前記検索結果の文書や情報を表示することを特徴とする。
【0042】
請求項29に記載の発明は、表示された文書や情報(以下、閲覧文書という)に関するキーワードを入力し、前記閲覧文書からキーワードを抽出し、ユーザの関心情報であるキーワードとその出現頻度を保管するユーザキーワードDBを参照して、出現頻度の高いキーワードを選択して補助キーワードとして出力するとともに、前記閲覧文書から抽出されたキーワードと前記入力キーワードに基づいて前記ユーザキーワードDBを更新し、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索し、前記入力キーワードと前記補助キーワードに基づいて、広告情報記憶手段に記憶された広告コンテンツを検索し、前記検索結果の文書や情報、および前記広告コンテンツを表示することを特徴とする。
【0043】
請求項30に記載の発明は、表示された文書や情報に関するキーワードを入力し、ユーザの関心情報であるキーワードとその出現頻度を保管するユーザキーワードDBを参照して、出現頻度の高いキーワードを選択して補助キーワードとして出力するとともに、前記入力キーワードに基づいて前記ユーザキーワードDBを更新し、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段と、前記検索結果の文書や情報を表示することを特徴とする。
【0044】
請求項31に記載の発明は、表示された文書や情報に関するキーワードを入力し、ユーザの関心情報であるキーワードとその出現頻度を保管するユーザキーワードDBを参照して、出現頻度の高いキーワードを選択して補助キーワードとして出力するとともに、前記入力キーワードに基づいて前記ユーザキーワードDBを更新し、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索し、前記入力キーワードと前記補助キーワードに基づいて、広告情報記憶手段に記憶された広告コンテンツを検索し、前記検索結果の文書や情報、および前記広告コンテンツを表示することを特徴とする。
【0045】
請求項32に記載の発明は、コンピュータに、請求項1乃至17のいずれかに記載の情報検索システムの機能、または請求項18乃至25のいずれかに記載の情報提示装置の機能を実行させるためのプログラムである。
請求項33に記載の発明は、請求項32に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体である。
【発明の効果】
【0046】
本発明によれば、ユーザの入力したキーワードに加えて、閲覧している文書あるいは閲覧文書の履歴から得られたコンテキスト情報を用いるようにしたことにより、1個の入力キーワードでもユーザの意図した検索結果を得ることができる。
同様に、広告型検索サービスにおいては、ユーザが1個のキーワードを入力したときにユーザの関心事に、より合致した広告を提供できるので、広告コンテンツのクリック率を向上させることができる。
【0047】
また、情報の提供者は、ユーザが閲覧した文書の内容を受信するのではなく、この文書に関するコンテキスト情報の取得に限定されるので、そのようなコンテキスト情報からユーザが閲覧した文書を特定することは困難であり、プライバシへの損害を与える可能性が低い。
さらに、コンテキスト情報のうち、プライバシに関連する特定の語句(例えば、個人名、プロジェクト名等の固有名詞)が含まれないようにフィルタをかけ、問題があるキーワードであるかを確認できるようにしたので、多様なレベルのフィルタリングが可能となり、一層プライバシへ損害を与える可能性が低くなる。
【発明を実施するための最良の形態】
【0048】
以下、図面を参照して、本発明に係る好適な実施形態について詳細に説明する。
【0049】
(A)情報検索システム:
以下の説明では、情報検索システムの例として、ユーザの指定した1個のキーワードに関連した文書を検索し、検索結果をユーザに提供する情報検索サービスについて説明する。しかし、本発明は、情報検索サービスに限らず、例えば、ユーザが閲覧中の文書に出現した単語に対して、文中での用法にあった訳語や用例の提供だけではなく、当該単語を含むような文書を検索して提供するような辞書サービスやユーザが閲覧中の文書の一部分の翻訳サービス等にも容易に適用することができる。
【0050】
<実施形態1>
図1は、本発明の実施形態1に係る情報検索システムの機能構成を示すブロック図であり、同図において、情報検索システムは、ユーザインタフェース(以下、ユーザI/Fと記す)手段10、キーワード抽出手段11、検索要求手段12、検索手段20、情報記憶手段21、結果通知手段22とを含んでなっている。
【0051】
ユーザI/F手段10は、ユーザが文書を閲覧中にキーワードを入力し、検索サービスの選択を行うと、入力したキーワード(以下、入力キーワードという)を検索要求手段12へ渡すとともに、閲覧中の文書(以下、閲覧文書という)と入力キーワードをキーワード抽出手段11へ渡す。ここで、キーワードの入力は、キーワード入力のためのダイアログから入力するようにしても良いし、または、閲覧文書中の語を選択するようにしても良い。
また、ユーザI/F手段10は、結果通知手段22から検索結果を渡されると、表示装置や出力装置等へ受け取った検索結果を表示/出力する。
【0052】
キーワード抽出手段11は、ユーザI/F手段10から渡された閲覧文書から抽出したキーワードを補助キーワードとして検索要求手段12へ渡す。
図2は、キーワード抽出手段11の機能構成を示すブロック図である。同図において、キーワード抽出手段11は、形態素解析手段111、単語評価手段112、基本キーワードデータベース(以下、データベースをDBと略記する)113を含んでなっている。
まず、キーワード抽出手段11は、キーワードを抽出する範囲を次のいずれかに設定する。また、これらのいずれを抽出範囲として使用するかは予め決めておいてもよい。
【0053】
(1)入力キーワードを閲覧文書中の語で選択して指定した場合には、この語の近傍範囲にある文章を対象とする。
(2)ウィンドウに表示された範囲内の閲覧文書中の文章を対象とする。
(3)閲覧文書全体を対象とする。
【0054】
閲覧文書中の上述のいずれかの範囲内の文章を、公知の技術である形態素解析手段111によって、品詞付きの単語列に分割する。
基本キーワードDB113には、単語ごとに、品詞および重要度を保持している。この重要度は、名詞等の単語がキーワードとして用いる場合には値を大きくし、名詞以外の品詞の単語やキーワードとして有用でない単語の場合には小さな(例えば、ゼロ)値を設定する。
【0055】
単語評価手段112は、形態素解析手段111によって分割された単語列を、基本キーワードDB113を参照して、各単語の重要度を取り出し、重要度を大きい順に整列させる。この整列された重要度の大きい方から所定の数(例えば、3個程度)の単語を取り出してキーワードとする。
キーワード抽出手段11は、この取り出されたキーワードを補助キーワードとして出力する。また、この補助キーワードには、重要度から算出される評価点を属性情報として付加することも可能である。この評価点は、単に重要度の大きさ順序を表すものであってもよいし、重要度に応じた重みであっても良い。
【0056】
検索要求手段12は、ユーザI/F手段10から渡された入力キーワードと、キーワード抽出手段11から渡された補助キーワードとからなる検索要求を検索手段20へ渡す。
【0057】
検索手段20は、検索要求手段12から渡された入力キーワードと補助キーワードのAND検索によって情報記憶手段21を検索し、その検索結果を結果通知手段22へ渡す。
ここで、情報記憶手段21は、予めHTMLやXML等で記述されたWeb文書あるいはワードプロセッサ等のアプリケーションで記述された文書からなる複数の文書ファイルを記憶した少なくとも一つの文書データベースまたはファイルである。
【0058】
このAND検索では、通常、補助キーワードより入力キーワードを重視した検索を行うが、評価点を属性情報として付加された補助キーワードの場合には、この評価点を重み付けに反映した検索を行う。(この検索手段20の処理は、通常のサーチエンジンと呼ばれる検索サービスで行われているものである。)
【0059】
結果通知手段22は、検索手段20から渡された検索結果の各文書に対して、タイトル、アブストラクトやこの文書の存在する場所や関連文書の存在場所を示すURL等の属性情報が付加され、次のいずれかの表示方式で表示できるWebページを作成して、ユーザI/F手段10に渡す。また、表示順は入力キーワード、補助キーワード等の検索条件からユーザが欲している情報としてのランキング順としてもよい。
【0060】
(1)第1の表示方式:
タブブラウザのように複数のページを切替えて表示可能なように、検索結果の文書や情報を各タブへ直接表示するWebページを作成する。
(2)第2の表示方式:
通常のブラウザ表示や専用の結果表示ダイアログで表示可能なように、検索結果のURLリストを表示するWebページを作成する。
【0061】
次に、図3のフローチャートを用いて、本実施形態1の処理手順を説明する。
ユーザが文書を閲覧中にキーワードを入力し(ステップS10)、検索サービスの選択を行う(ステップS11)。ここで、キーワードの入力は、キーワード入力のためのダイアログから入力するようにしても良いし、または、閲覧文書中の語を選択するようにしても良い。
【0062】
閲覧文書からキーワードを抽出し、このキーワードを補助キーワードとする(ステップS12)。キーワードの抽出は、まず、キーワードを抽出する範囲を、閲覧文書中の選択した入力キーワードの近傍範囲、ウィンドウに表示された範囲内、あるいは閲覧文書全体を対象とし、形態素解析によって、品詞付きの単語列に分割する。次に、分割された単語列を、基本キーワードDB113を参照して、各単語の重要度を取り出し、重要度を大きい順に整列させる。この整列された重要度の大きい方から所定の数(例えば、3個程度)の単語を取り出して補助キーワードとする。
【0063】
入力キーワードと補助キーワードのAND検索によって、Web文書あるいはアプリケーションで作成された文書からなる複数の文書ファイルを検索する(ステップS13)。
このAND検索では、通常、補助キーワードより入力キーワードを重視した検索を行うが、評価点を属性情報として付加された補助キーワードの場合には、この評価点を重み付けに反映した検索を行う。
【0064】
検索結果の各文書に対して、タイトル、アブストラクトやこの文書の存在する場所や関連文書の存在場所を示すURL等の属性情報が付加されたWebページを作成し、表示装置や出力装置等へ表示/出力する(ステップS14)。この表示順は、入力キーワード、補助キーワード等の検索条件からユーザが欲している情報としてのランキング順としてもよい。
【0065】
以上の構成により、ユーザの入力したキーワードに加えて、閲覧している文書の内容を用いるようにしたことにより、1個の入力キーワードでもユーザの意図した検索結果を得ることができる。
【0066】
<実施形態2>
上述した実施形態1における問題点は、現時点の閲覧文書に限定して補助キーワードを求めているので、情報が少なく、ユーザの関心事を的確に取り出しえていない恐れがある点である。
本実施形態2では、コンテキスト情報として、閲覧中の文書だけでなく、この閲覧中の文書を得るに至る過程の入力キーワードや閲覧文書の情報を含むようにした。
【0067】
図4は、キーワード抽出手段11から抽出されたキーワードを使って、補助キーワードを改良する本実施形態2の機能構成を示すブロック図である。同図において、実施形態2の機能構成は、ユーザI/F手段10、キーワード抽出手段11、ユーザキーワード管理手段13、ユーザキーワードDB14、検索要求手段12、検索手段20、情報記憶手段21、結果通知手段22とを含んでなっている。ここで、実施形態1と同じ機能については同じ符号を付してあり、以下、相違点についてのみ説明する。
【0068】
ユーザキーワードDB14は、ユーザが閲覧した文書から抽出したキーワードの使用履歴を保持するデータファイルであり、キーワードごとに、キーワードと評価点の累計またはキーワードの出現回数の累計とを維持管理している。
【0069】
ユーザキーワード管理手段13は、ユーザキーワードDB14に登録されたキーワードに対応した評価点(または出現回数)を取り出し、このキーワードの評価点を大きい順に整列させ、評価点の大きいキーワードを所定の数(例えば、3個程度)取り出して補助キーワードとする。
【0070】
次に、ユーザキーワード管理手段13は、ユーザキーワードDB14を参照して、キーワード抽出手段11から渡されたキーワードが存在しない場合には、このキーワードを新規登録する。新規登録する場合、キーワードに評価点が付加していれば、この評価点を初期値として設定する。評価点が付加されていない場合には、出現回数として「1」を設定する。
【0071】
また、ユーザキーワード管理手段13は、キーワード抽出手段11から渡されたキーワードがユーザキーワードDB14に存在する場合には、キーワードに評価点が付加していれば、同じキーワードに評価点を加算して、ユーザキーワードDB14を更新する。キーワードに評価点が付加されていないときには、出現回数を1つカウントアップして、ユーザキーワードDB14を更新する。
【0072】
ここで、補助キーワードを検索要求手段12へ渡した後に、ユーザキーワードDB14を更新するようにしたのは、今回の閲覧文書から抽出したキーワードによる評価点や出現回数への影響をなくし、これまでの履歴情報によって補助キーワードを決定することにある。
【0073】
また、ユーザキーワードDB14は、過去に頻繁に利用されたキーワードであっても、最近頻繁に利用されない場合には、補助キーワードとして選択されないように例えば毎月一回程度の保守が行われる。この場合は、ユーザキーワードDB14の各キーワードに評価点の更新最終日時を保持しておき、この更新最終日時と現在の日時との間隔が増大するとともに評価点を減少させるように保守する。
【0074】
さらに、キーワードの更新だけでなく、このキーワードの類似語に対しても評価点を加算するようにしても良い。このときの類似語に対する評価点は、例えば、キーワードの評価点に重み付けを行って累算するようにしても良い。
【0075】
また、ユーザキーワードDB14に累積するキーワードは、閲覧文書から抽出したキーワードだけでなく、入力キーワードをも登録するようにしても良い。しかし、閲覧文書から抽出したキーワードには入力キーワードが含まれることが多いため、入力キーワードを登録することによるメリットは少ないが、入力キーワードと閲覧文書から抽出したキーワードで評価点の累算に重み付けを行うときには、この方式は有用である。
【0076】
次に、図5のフローチャートを用いて、本実施形態2の処理手順を説明する。
ユーザが文書を閲覧中にキーワードを入力し(ステップS20)、検索サービスの選択を行う(ステップS21)。ここで、キーワードの入力は、キーワード入力のためのダイアログから入力するようにしても良いし、または、閲覧文書中の語を選択するようにしても良い。
【0077】
閲覧文書からキーワードを抽出する(ステップS22)。キーワードの抽出は、まず、キーワードを抽出する範囲を、閲覧文書中の選択した入力キーワードの近傍範囲、ウィンドウに表示された範囲内、あるいは閲覧文書全体を対象とし、形態素解析によって、品詞付きの単語列に分割する。次に、分割された単語列を、基本キーワードDB113を参照して、各単語の重要度を取り出し、重要度を大きい順に整列させる。この整列された重要度の大きい方から所定の数(例えば、3個程度)の単語を取り出してキーワードとする。
【0078】
ユーザキーワードDB14に登録されたキーワードに対応した評価点(または出現回数)を取り出し、このキーワードの評価点を大きい順に整列させ、評価点の大きいキーワードを所定の数(例えば、3個程度)取り出して補助キーワードとする(ステップS23)。
【0079】
抽出されたキーワードを用いてユーザキーワードDB14を更新する(ステップS24)。
抽出されたキーワードがユーザキーワードDB14に存在しない場合には、このキーワードを新規登録する。新規登録する場合、キーワードに評価点が付加していれば、この評価点を初期値として設定する。評価点が付加されていない場合には、出現回数として「1」を設定する。
また、抽出されたキーワードがユーザキーワードDB14に存在する場合には、キーワードに評価点が付加していれば、同じキーワードに評価点を加算して、ユーザキーワードDB14を更新する。キーワードに評価点が付加されていないときには、出現回数を1つカウントアップして、ユーザキーワードDB14を更新する。
さらに、キーワードの更新だけでなく、このキーワードの類似語に対しても評価点を加算するようにしても良い。このときの類似語に対する評価点は、例えば、キーワードの評価点に重み付けを行って累算するようにしても良い。
【0080】
次に、入力キーワードと補助キーワードのAND検索によって、Web文書あるいはアプリケーションで作成された文書からなる複数の文書ファイルを検索する(ステップS25)。
このAND検索では、通常、補助キーワードより入力キーワードを重視した検索を行うが、評価点を属性情報として付加された補助キーワードの場合には、この評価点を重み付けに反映した検索を行う。
【0081】
検索結果の各文書に対して、タイトル、アブストラクトやこの文書の存在する場所や関連文書の存在場所を示すURL等の属性情報が付加されたWebページを作成し、表示装置や出力装置等へ表示/出力する(ステップS26)。この表示順は、入力キーワード、補助キーワード等の検索条件からユーザが欲している情報としてのランキング順としてもよい。
【0082】
以上の構成により、ユーザの入力したキーワードに加えて、閲覧している文書の内容を用いるようにしたことにより、1個の入力キーワードでもユーザの意図した検索結果を得ることができる。
【0083】
<実施形態3>
上述の実施形態2のようにユーザキーワードDB14を使用することの問題は、個人が仕事と趣味のように複数の独立した関心を持つ場合に、それを一つのユーザ関心情報として扱うことは好ましくない。
例えば、仕事の関心事としてIT関連、社会的関心事として福祉やNGO活動、趣味の関心事として音楽と美術と料理がある場合に、一つの均質なユーザキーワードDB14を用いると高い検索精度が得られない。
これを解決する次のような3つの方法がある。
【0084】
第1の方法は、関心情報を分類して、ユーザが検索するたびに今の関心事はどの分類であるかを入力する方法であるが、ユーザの負担が大きく、本発明の目的である「ユーザが1個のキーワードを指定して精度のよい検索を行う」に合致しない。
【0085】
第2の方法は、まず、閲覧文書の分類を自動的に決定しておき、この分類と同じ分類をもつキーワードのうち評価点の大きいものをユーザキーワードDB14から取り出す。次に、閲覧文書から抽出したキーワードを、この閲覧文書の分類によってユーザキーワードDB14を更新する。
この方法は、実施形態2のユーザキーワード管理手段13およびユーザキーワードDB14とを上述の機能に置き換えることによって実現できる。
【0086】
第3の方法は、本実施形態3に関する方法であり、ユーザキーワードDB14の代わりに、共起出現率ユーザキーワードDB15を用いる方法である。
図6は、キーワード抽出手段11から抽出されたキーワードを使って、補助キーワードを改良する本実施形態3の機能構成を示すブロック図である。同図において、実施形態3の機能構成は、ユーザI/F手段10、キーワード抽出手段11、ユーザキーワード管理手段13、共起出現率ユーザキーワードDB15、検索要求手段12、検索手段20、情報記憶手段21、結果通知手段22とを含んでなっている。ここで、実施形態1および実施形態2と同じ機能については同じ符号を付してあり、以下、相違点についてのみ説明する。
【0087】
本発明では、ユーザが入力したキーワードに対して、閲覧文書中に出現するキーワードを「入力キーワードに対して共起する抽出キーワード」と定義し、このような共起関係の強さを表すために、共起出現評価点あるいは同時に出現した回数(以下、共起出現回数という)を用いる。
本実施形態3では、共起関係にあるキーワードと共起出現評価点あるいは共起出現回数を、図7に例示した共起出現率ユーザキーワードDB15に記録していく。
図7において、列方向のキーワードは入力キーワードを示し、行方向のキーワードは閲覧文書から抽出されたキーワードを示し、列方向と行方向とのキーワードが共起して出現することを表している。列方向と行方向のキーワードで指定されるセルには、列方向の入力キーワードが指定されたときに、閲覧していた文書から抽出したときのキーワードの共起出現評価点あるいは共起出現回数を累積して設定される。
【0088】
ユーザキーワード管理手段13は、共起出現率ユーザキーワードDB15を参照して、入力キーワードと共起して出現するキーワードの共起出現評価点あるいは共起出現回数を取り出し、取り出した共起出現評価点あるいは共起出現回数を大きい順に整列させ、大きい方から所定の数(例えば、3個程度)のキーワードを取り出して補助キーワードとする。
【0089】
次に、ユーザキーワード管理手段13は、共起出現率ユーザキーワードDB15を参照して、入力キーワードおよび抽出されたキーワードに対する項目が登録されていない場合には、登録されていないキーワードを新規登録する。新規登録する場合、抽出されたキーワードに評価点が付加していれば、この評価点を共起出現評価点の初期値として設定する。評価点が付加されていない場合には、共起出現回数として「1」を設定する。
【0090】
また、ユーザキーワード管理手段13は、共起出現率ユーザキーワードDB15を参照して、入力キーワードおよび抽出されたキーワードが存在する場合には、抽出されたキーワードに評価点が付加していれば、評価点を加算して、共起出現率ユーザキーワードDB15を更新する。抽出されたキーワードに評価点が付加されていないときには、出現回数を1つカウントアップして、共起出現率ユーザキーワードDB15を更新する。
【0091】
ここで、補助キーワードを検索要求手段12へ渡した後に、共起出現率ユーザキーワードDB15を更新するようにしたのは、今回の閲覧文書から抽出したキーワードによる評価点や出現回数への影響をなくし、これまでの履歴情報によって補助キーワードを決定することにある。
【0092】
また、共起出現率ユーザキーワードDB15は、過去に頻繁に利用されたキーワードであっても、最近頻繁に利用されない場合には、補助キーワードとして選択されないように、例えば毎月一回程度の保守を行う。この場合は、共起出現率ユーザキーワードDB15の各キーワードに評価点の更新最終日時を保持しておき、この更新最終日時と現在の日時との間隔が増大するとともに評価点を減少させるように保守する。
【0093】
さらに、抽出されたキーワードの更新だけでなく、このキーワードの類似語に対しても評価点を加算するようにしても良い。このときの類似語に対する評価点は、例えば、キーワードの評価点に重み付けを行って累算するようにしても良い。
【0094】
次に、図8のフローチャートを用いて、本実施形態3の処理手順を説明する。
ユーザが文書を閲覧中にキーワードを入力し(ステップS30)、検索サービスの選択を行う(ステップS31)。ここで、キーワードの入力は、キーワード入力のためのダイアログから入力するようにしても良いし、または、閲覧文書中の語を選択するようにしても良い。
【0095】
閲覧文書からキーワードを抽出する(ステップS32)。キーワードの抽出は、まず、キーワードを抽出する範囲を、閲覧文書中の選択した入力キーワードの近傍範囲、ウィンドウに表示された範囲内、あるいは閲覧文書全体を対象とし、形態素解析によって、品詞付きの単語列に分割する。次に、分割された単語列を、基本キーワードDB113を参照して、各単語の重要度を取り出し、重要度を大きい順に整列させる。この整列された重要度の大きい方から所定の数(例えば、3個程度)の単語を取り出してキーワードとする。
【0096】
共起出現率ユーザキーワードDB15を参照して、入力キーワードと共起して出現するキーワードの共起出現評価点あるいは共起出現回数を取り出し、取り出した共起出現評価点あるいは共起出現回数を大きい順に整列させ、大きい方から所定の数(例えば、3個程度)のキーワードを取り出して補助キーワードとする(ステップS33)。
【0097】
入力キーワードと抽出されたキーワードを用いて共起出現率ユーザキーワードDB15を更新する(ステップS34)。
共起出現率ユーザキーワードDB15を参照して、入力キーワードおよび抽出されたキーワードに対する項目が登録されていない場合には、登録されていないキーワードを新規登録する。新規登録する場合、抽出されたキーワードに評価点が付加していれば、この評価点を共起出現評価点の初期値として設定する。評価点が付加されていない場合には、共起出現回数として「1」を設定する。
【0098】
また、共起出現率ユーザキーワードDB15を参照して、入力キーワードおよび抽出されたキーワードが存在する場合には、抽出されたキーワードに評価点が付加していれば、評価点を加算して、共起出現率ユーザキーワードDB15を更新する。抽出されたキーワードに評価点が付加されていないときには、出現回数を1つカウントアップして、共起出現率ユーザキーワードDB15を更新する。
【0099】
さらに、抽出されたキーワードの更新だけでなく、このキーワードの類似語に対しても評価点を加算するようにしても良い。このときの類似語に対する評価点は、例えば、キーワードの評価点に重み付けを行って累算するようにしても良い。
【0100】
次に、入力キーワードと補助キーワードのAND検索によって、Web文書あるいはアプリケーションで作成された文書からなる複数の文書ファイルを検索する(ステップS35)。このAND検索では、通常、補助キーワードより入力キーワードを重視した検索を行うが、評価点を属性情報として付加された補助キーワードの場合には、この評価点を重み付けに反映した検索を行う。
【0101】
検索結果の各文書に対して、タイトル、アブストラクトやこの文書の存在する場所や関連文書の存在場所を示すURL等の属性情報が付加されたWebページを作成し、表示装置や出力装置等へ表示/出力する(ステップS36)。この表示順は、入力キーワード、補助キーワード等の検索条件からユーザが欲している情報としてのランキング順としてもよい。
【0102】
以上の構成により、ユーザの入力したキーワードに加えて、閲覧している文書の内容を用いるようにしたことにより、1個の入力キーワードでもユーザの意図した検索結果を得ることができる。
【0103】
<実施形態4>
上述の各実施形態では、キーワード抽出手段を必須の構成要素としてきたが、ユーザキーワードDBを用いる場合には入力キーワードのみを用いた更新であってもコンテクスト情報として有効である。
本実施形態4は、上記実施形態2においてキーワード抽出手段11を省いた構成を考える。
【0104】
図9は、本実施形態4の機能構成を示すブロック図である。同図において、実施形態4の機能構成は、ユーザI/F手段10、ユーザキーワード管理手段13、ユーザキーワードDB14、検索要求手段12、検索手段20、情報記憶手段21、結果通知手段22とを含んでなっている。ここで、実施形態2と同じ機能については同じ符号を付してあり、以下、相違点についてのみ説明する。
【0105】
ユーザI/F手段10は、ユーザからキーワードの入力と検索指示が入力されると、ユーザキーワード管理手段13へ入力キーワードを付加した検索要求を渡す。
ユーザキーワードDB14は、ユーザが入力したキーワードの使用履歴を保持するデータファイルであり、入力キーワードごとに、キーワードと指定回数の累計とを維持管理している。
ユーザキーワード管理手段13は、ユーザキーワードDB14から取り出したキーワードの指定回数を大きい順に整列させ、大きい方から所定の数(例えば、3個程度)のキーワードを取り出して補助キーワードとする。
【0106】
次に、ユーザキーワード管理手段13は、ユーザキーワードDB14を参照して、入力キーワードが存在しない場合には、この入力キーワードを新規登録する。新規登録する場合、指定回数の累積値として「1」を設定する。
また、ユーザキーワード管理手段13は、入力キーワードがユーザキーワードDB14に存在する場合には、使用回数を1つカウントアップして、ユーザキーワードDB14を更新する。
【0107】
ここで、補助キーワードを検索要求手段12へ渡した後に、ユーザキーワードDB14を更新するようにしたのは、今回の閲覧文書から抽出したキーワードによる評価点や出現回数への影響をなくし、これまでの履歴情報によって補助キーワードを決定することにある。
【0108】
また、ユーザキーワードDB14は、過去に頻繁に利用されたキーワードであっても、最近頻繁に利用されない場合には、補助キーワードとして選択されないように例えば毎月一回程度の保守が行われる。この場合は、ユーザキーワードDB14の各キーワードに使用回数の累積値の更新最終日時を保持しておき、この更新最終日時と現在の日時との間隔が増大するとともに評価点を減少させるように保守する。
【0109】
さらに、キーワードの更新だけでなく、このキーワードの類似語に対しても評価点を加算するようにしても良い。このときの類似語に対する評価点は、例えば、キーワードの使用回数に重み付けを行って累算するようにしても良い。
【0110】
次に、図10のフローチャートを用いて、本実施形態4の処理手順を説明する。
ユーザが文書を閲覧中にキーワードを入力し(ステップS40)、検索サービスの選択を行う(ステップS41)。ここで、キーワードの入力は、キーワード入力のためのダイアログから入力するようにしても良いし、または、閲覧文書中の語を選択するようにしても良い。
【0111】
ユーザキーワードDB14から取り出したキーワードの指定回数を大きい順に整列させ、大きい方から所定の数(例えば、3個程度)のキーワードを取り出して補助キーワードとする(ステップS42)。
【0112】
入力キーワードを用いてユーザキーワードDB14を更新する(ステップS43)。
入力キーワードがユーザキーワードDB14に存在しない場合には、この入力キーワードを新規登録する。新規登録する場合、使用回数の累積値の初期値として「1」を設定する。また、入力キーワードがユーザキーワードDB14に存在する場合には、使用回数を1つカウントアップして、ユーザキーワードDB14を更新する。
さらに、キーワードの更新だけでなく、この入力キーワードの類似語に対しても評価点を加算するようにしても良い。このときの類似語に対する評価点は、例えば、キーワードの使用回数に重み付けを行って累算するようにしても良い。
【0113】
次に、入力キーワードと補助キーワードのAND検索によって、Web文書あるいはアプリケーションで作成された文書からなる複数の文書ファイルを検索する(ステップS44)。このAND検索では、通常、補助キーワードより入力キーワードを重視した検索を行うが、評価点を属性情報として付加された補助キーワードの場合には、この評価点を重み付けに反映した検索を行う。
【0114】
検索結果の各文書に対して、タイトル、アブストラクトやこの文書の存在する場所や関連文書の存在場所を示すURL等の属性情報が付加されたWebページを作成し、表示装置や出力装置等へ表示/出力する(ステップS45)。この表示順は、入力キーワード、補助キーワード等の検索条件からユーザが欲している情報としてのランキング順としてもよい。
【0115】
以上の構成により、ユーザの入力したキーワードに加えて、閲覧している文書の内容を用いるようにしたことにより、1個の入力キーワードでもユーザの意図した検索結果を得ることができる。
【0116】
(B)広告型検索システム:
以下の説明では、広告型検索システムの例として、ユーザの指定した1個のキーワードに関連した文書を検索し、検索結果をユーザに提供するという快適な操作環境を提供する見返りとして、ユーザの関心事により近い広告情報を提供し、より高いクリック率を実現する広告検索サービスについて説明する。この情報検索サービスとしては、上述した情報検索システムをもとにして説明するが、ユーザの入力したキーワードや閲覧した文書から取り出した補助キーワードをもとに広告型検索サービスだけを行う構成としてもよい。
また、本発明の広告型検索システムは、情報検索サービスを対象とした広告型検索サービスに限らず、辞書サービスや翻訳サービス等を対象とした広告型検索サービスにも容易に適用することができる。
【0117】
<実施形態5>
図11は、本発明の実施形態5に係る広告型検索システムの機能構成を示すブロック図であり、同図において、広告型検索システムは、ユーザインタフェース(以下、ユーザI/Fと記す)手段10、キーワード抽出手段11、検索要求手段12、検索手段20、情報記憶手段21、結果通知手段22、広告検索手段30、広告情報記憶手段31とを含んでなっている。ここで、実施形態1と同じ機能については同じ符号を付してあり、以下、相違点についてのみ説明する。
【0118】
検索要求手段12は、キーワード抽出手段11で抽出した補助キーワードとユーザが入力した入力キーワードを付加した検索要求を検索手段20と広告検索手段30へ渡す。
広告検索手段30は、検索要求手段12から渡された入力キーワードと補助キーワードのAND検索によって広告情報記憶手段31を検索し、その検索された広告の広告コンテンツを結果通知手段22へ渡す。ここで、広告情報記憶手段31は、予め広告主から提供された広告コンテンツおよびこの広告を検索するためのキーワードからなる広告情報を複数記憶した少なくとも一つの広告コンテンツデータベースまたはファイルである。
【0119】
このAND検索では、通常、補助キーワードより入力キーワードを重視した検索を行うが、評価点を属性情報として付加された補助キーワードの場合には、この評価点を重み付けに反映した検索を行う。また、広告検索手段30では、入力キーワードと補助キーワードの重み付けを検索手段20とは異なるようにしても良い。
【0120】
結果通知手段22は、検索手段20から渡された検索結果と広告検索手段30から渡された検索結果の広告コンテンツを次のいずれかの表示方式で変換して、ユーザI/F手段10に渡す。
【0121】
(1)第1の表示方式:
タブブラウザのように複数のページを切替えて表示可能な場合、検索手段20から渡された検索結果に対しては、検索された文書ごとに、タイトル、アブストラクトやこの文書の存在する場所や関連文書の存在場所を示すURL等の属性情報が付加されたリストとして直接表示するWebページを作成する。
また、広告検索手段30から渡された検索結果の広告コンテンツに対しては、広告コンテンツ用のダイアログに表示する指示をユーザI/F手段10へ出す(図12参照)。
(2)第2の表示方式:
通常のブラウザで表示可能なように、検索手段20から渡された検索結果に対しては、検索された文書ごとに、タイトル、アブストラクトやこの文書の存在する場所や関連文書の存在場所を示すURL等の属性情報が付加されたリストとしたWebページを作成し、広告検索手段30から渡された検索結果の広告コンテンツに対しては、広告コンテンツがこのWebページで表示されるようにしたWebページを作成する。
【0122】
次に、図13のフローチャートを用いて、本実施形態5の処理手順を説明する。
ユーザが文書を閲覧中にキーワードを入力し(ステップS50)、検索サービスの選択を行う(ステップS51)。ここで、キーワードの入力は、キーワード入力のためのダイアログから入力するようにしても良いし、または、閲覧文書中の語を選択するようにしても良い。
【0123】
閲覧文書からキーワードを抽出し、このキーワードを補助キーワードとする(ステップS52)。キーワードの抽出は、まず、キーワードを抽出する範囲を、閲覧文書中の選択した入力キーワードの近傍範囲、ウィンドウに表示された範囲内、あるいは閲覧文書全体を対象とし、形態素解析によって、品詞付きの単語列に分割する。次に、分割された単語列の各単語の重要度を大きい順に整列させる。この整列された重要度の大きい方から所定の数(例えば、3個程度)の単語を取り出して補助キーワードとする。
【0124】
入力キーワードと補助キーワードのAND検索によって、Web文書あるいはアプリケーションで作成された文書からなる複数の文書ファイルを検索する(ステップS53)。
このAND検索では、通常、補助キーワードより入力キーワードを重視した検索を行うが、評価点を属性情報として付加された補助キーワードの場合には、この評価点を重み付けに反映した検索を行う。
【0125】
また、入力キーワードと補助キーワードのAND検索によって、広告主から提供された広告コンテンツを検索する(ステップS54)。
このAND検索では、通常、補助キーワードより入力キーワードを重視した検索を行うが、評価点を属性情報として付加された補助キーワードの場合には、この評価点を重み付けに反映した検索を行う。この広告検索では、入力キーワードと補助キーワードの重み付けを情報検索とは異なるようにしても良い。
【0126】
検索結果の各文書に対して、タイトル、アブストラクトやこの文書の存在する場所や関連文書の存在場所を示すURL等の属性情報が付加されたWebページを作成し、表示装置や出力装置等へ表示/出力するとともに、検索された広告コンテンツは広告コンテンツ用のダイアログ画面に表示する(ステップS55)。この表示順は、入力キーワード、補助キーワード等の検索条件からユーザが欲している情報としてのランキング順としてもよい。
【0127】
以上の構成により、ユーザが1個のキーワードを入力したときにユーザの関心事に、より合致した広告を提供できるので、広告コンテンツのクリック率を向上させることができる。
【0128】
<実施形態6>
ところで、広告型検索サービスの一つの課題として、検索結果の公平性が問われる場合がある。広告型検索サービスのクリック率が高いのは、入力キーワードすなわちユーザ関心情報に対応した広告コンテンツのみを表示できることによるが、従来の広告型検索システムにおいては、ユーザの指定した情報検索結果と広告に関する情報とが渾然として表示されており、ユーザは自分の欲している情報であるか広告であるのか区別がつきにくいという問題点があった。
【0129】
これを避けるために、本実施形態6の広告型検索システムでは、次のいずれかの方法でユーザの指定した情報検索結果と広告を分けて提示することによって、この公平性の問題を解決する。
【0130】
(1)第1の方法:
広告の検索には、補助キーワードのみで検索する方法である。この方法は、入力キーワードを使用していないと言う意味で論理的には公平であるが、入力キーワードがユーザ閲覧文書において重要なキーワードである場合、補助キーワードに入力キーワードを含むことがあるため、第2の方法に比べて公平性は低い。
【0131】
(2)第2の方法:
広告の検索には、補助キーワードから入力キーワードを除外し、この補助キーワードのみで検索する方法である。この方法は、ユーザの直接関心のない情報に関する広告コンテンツを削除できるので、検索結果の十分な公平性を提供できる。
【0132】
本実施形態6の機能構成は、実施形態5と同様であるが、広告検索手段30を上述の2つのいずれかにより補助キーワードに補正を加えて検索を実施する点のみが相違する。
即ち、広告検索手段30は、検索要求手段12から入力キーワードと補助キーワードを渡されると、予め定められた上述2つの方法のいずれかによって補助キーワードを補正し、広告情報記憶手段31を参照して、この補正した補助キーワードのみのAND検索により広告コンテンツを取り出す。
【0133】
以上の構成により、検索結果から入力キーワードに関係する広告コンテンツを排除することができるので、入力キーワードがユーザ関心情報でない場合でも公平性を維持した広告を提供することができる。
【0134】
<実施形態5および6の変形例>
実施形態5および実施形態6の補助キーワードの取得方法は、実施形態1と同様に閲覧中の文書からキーワードを抽出して、補助キーワードとしていた。本変形例では、この補助キーワードの取得手段を、上記の実施形態2乃至実施形態4における補助キーワードの取得方法と置き換えて構成するようにしても良い。
このように置き換えた変形例では、よりユーザのユーザ関心事に合致した広告コンテンツを提供することができる。
【0135】
(C)サービスをユーザサイトとサービスサイトに分けた構成の実施例:
<実施形態7>
図14は、情報検索あるいは広告型検索サービスを提供するサービスサイトと、サービスを受けるユーザサイトによる本発明の実施形態の構成図である。この実施形態は、任意個のユーザサイト100、検索サービスを提供するサービスサイト200、ネットワーク300とで構成される。
【0136】
ユーザサイト100は、文書を閲覧中にキーワードを入力し、このキーワードに対するサービス提供業者から受けた情報を表示するための端末装置であり、パーソナルコンピュータやPDA(Personal Digital Assistant)等のいずれであってもよく、Webブラウザを実行可能な端末装置であればよい。
【0137】
サービスサイト200は、ユーザサイト100からのサービス要求に応じて、情報検索サービス・辞書サービス・翻訳サービスを提供したり、広告コンテンツの提供を行うためのコンピュータシステムである。以下の説明では、サービスサイト200では、同一サービス提供者が情報検索サービスと広告型検索サービスの2つのサービスを行うように説明するが、同様に、別のサービス提供者がそれぞれのサービスサイトを有してそれぞれのサービスを提供できるように構成することもできる。
【0138】
これらのユーザサイト100とサービスサイト200は、それぞれネットワーク通信インタフェースを備えており、ネットワーク300を介して接続するようになっている。
このネットワーク300は、ユーザサイト100およびサービスサイト200を結合するための伝送路であって、それらの間の通信プロトコルが一致するものであれば無線および有線のいずれであってもよく、例えば、LAN(Local Area Network)やインターネットなどを用いることができる。
【0139】
次に、このようなユーザサイトとサービスサイトにおける機能分担について説明する。
以下の説明では、上記実施形態における各機能をユーザサイト100とサービスサイト200のいずれかで実施するものとするので、同じ機能の説明は省略し、追加機能および相違する機能についてだけ説明することにする。
【0140】
(1)実施形態1、5および6に対応した構成:
実施形態1のようなキーワード抽出手段で補助キーワードを選定する構成の場合には、図15に示すような構成となり、各サイトの動作は実施形態1、5および6に記述したものと同じである。
ユーザサイト100では、ユーザI/F手段10、キーワード抽出手段11、検索要求手段12とから構成される。
サービスサイト200では、情報検索サービスのみの提供の場合には、検索手段20、情報記憶手段21、結果通知手段22とから構成される。
また、情報検索サービスと広告型検索サービスをともに提供する場合には、検索手段20、情報記憶手段21、広告検索手段30、広告情報記憶手段31、結果通知手段22とから構成される。
【0141】
ただし、上記の検索要求手段12、ユーザI/F手段10、結果通知手段22、検索手段20、広告検索手段30は、それぞれネットワーク300を介して、通信相手に情報を提供する点が、上記実施形態1、5および6とは相違している。
【0142】
(2)実施形態2および3に対応した構成:
実施形態2のようなユーザキーワード管理手段で補助キーワードの選定を行う構成の場合には、図16に示すような構成となり、各サイトの動作は実施形態2に記述したものと同じである。
ユーザサイト100では、ユーザI/F手段10、キーワード抽出手段11、ユーザキーワード管理手段13、ユーザキーワードDB14、検索要求手段12とから構成される。
サービスサイト200では、情報検索サービスのみの提供の場合には、検索手段20、情報記憶手段21、結果通知手段22とから構成される。
また、情報検索サービスと広告型検索サービスをともに提供する場合には、検索手段20、情報記憶手段21、広告検索手段30、広告情報記憶手段31、結果通知手段22とから構成される。
【0143】
ただし、上記の検索要求手段12、ユーザI/F手段10、結果通知手段22、検索手段20、広告検索手段30は、それぞれネットワーク300を介して、通信相手に情報を提供する点が、上記実施形態2とは相違している。
【0144】
さらに、実施形態2のようなユーザキーワード管理手段で補助キーワードを選定する構成の場合には、図17に示すような構成もとり得る。
ユーザサイト100では、ユーザI/F手段10、キーワード抽出手段11、キーワード転送手段16とから構成される。
このキーワード転送手段16は、ユーザI/F手段10で入力されたキーワードを、サービスサイト200のユーザキーワード管理手段13へネットワーク300を介して転送する。
【0145】
サービスサイト200では、情報検索サービスのみの提供の場合には、ユーザキーワード管理手段13、ユーザキーワードDB14、検索要求手段12、検索手段20、情報記憶手段21、結果通知手段22とから構成される。
また、情報検索サービスと広告型検索サービスをともに提供する場合には、ユーザキーワード管理手段13、ユーザキーワードDB14、検索要求手段12、検索手段20、情報記憶手段21、広告検索手段30、広告情報記憶手段31、結果通知手段22とから構成される。
【0146】
また、上記の検索要求手段12、ユーザI/F手段10、結果通知手段22は、それぞれネットワーク300を介して、通信相手に情報を提供する点が、上記実施形態2とは相違している。
【0147】
さらに、上記の図16および図17のユーザキーワード管理手段13およびユーザキーワードDB14を実施形態3のユーザキーワード管理手段13および共起出現率ユーザキーワードDB15に交換した構成としてもよい。
【0148】
(3)実施形態4に対応した構成:
実施形態4のような入力キーワードを使ってユーザキーワード管理手段で補助キーワードを選定する構成の場合には、図18に示すような構成となり、各サイトの動作は実施形態4に記述したものと同じである。
ユーザサイト100では、ユーザI/F手段10、ユーザキーワード管理手段13、ユーザキーワードDB14、検索要求手段12とから構成される。
サービスサイト200では、情報検索サービスのみの提供の場合には、検索手段20、情報記憶手段21、結果通知手段22とから構成される。
また、情報検索サービスと広告型検索サービスをともに提供する場合には、検索手段20、情報記憶手段21、広告検索手段30、広告情報記憶手段31、結果通知手段22とから構成される。
【0149】
ただし、上記の検索要求手段12、ユーザI/F手段10、結果通知手段22、検索手段20、広告検索手段30は、それぞれネットワーク300を介して、通信相手に情報を提供する点が、上記実施形態4とは相違している。
【0150】
さらに、実施形態4のような入力キーワードを使ってユーザキーワード管理手段で補助キーワードを選定する構成の場合には、図19に示すような構成もとり得る。
ユーザサイト100では、ユーザI/F手段10、キーワード抽出手段11、キーワード転送手段16とから構成される。このキーワード転送手段16は、ユーザI/F手段10で入力されたキーワードを、サービスサイト200のユーザキーワード管理手段13へネットワーク300を介して転送する。
【0151】
サービスサイト200では、情報検索サービスのみの提供の場合には、ユーザキーワード管理手段13、ユーザキーワードDB14、検索要求手段12、検索手段20、情報記憶手段21、結果通知手段22とから構成される。
また、情報検索サービスと広告型検索サービスをともに提供する場合には、ユーザキーワード管理手段13、ユーザキーワードDB14、検索要求手段12、検索手段20、情報記憶手段21、広告検索手段30、広告情報記憶手段31、結果通知手段22とから構成される。
上記のキーワード転送手段16、ユーザI/F手段10、結果通知手段22は、それぞれネットワーク300を介して、通信相手に情報を提供する点が、上記実施形態4とは相違している。
【0152】
上記実施形態1乃至6における各機能を本実施形態7の、ユーザサイトとサービスサイトのような構成にすることにより、以下のような効果を提供できる。
従来の検索システムでは、ユーザの入力したキーワードに関連した広告を提示することにより高いクリック率を実現しているが、この高いクリック率を実現するには、入力キーワード以外にユーザ関心情報を取得することが効果的である。しかし、ユーザ関心情報はユーザプライバシに関わる情報であり、ユーザにとってのメリットがなければその取得を許諾してもらいにくい。
さらに、ユーザが閲覧している文書のURLを取得するサーチエンジン方式では、ユーザがどの文書を閲覧したかの情報が取得され、しかもURLによりその文書のすべての情報が取得できるのでプライバシへの損害を与える可能性が高い。
【0153】
しかし、本実施形態7のように、ユーザサイト100からサービスサイト200へ渡されるのは、入力されたキーワードおよびユーザの閲覧した文書にから抽出したキーワード等のコンテキスト情報の取得に限定されるので、そのようなキーワードからユーザが閲覧していた文書を特定することは困難であり、プライバシへの損害を与える可能性が低くなる。
【0154】
<実施形態8>
しかしながら、実施形態7のように構成しても、次のような問題点がある。
(1)サービスサイトへ転送されるのが補助キーワードだけであっても、サービスサイトでそれを蓄積してしまえば、ユーザのプライバシに問題が生じる可能性がある。
(2)サービスサイトでユーザキーワード管理手段によりユーザキーワードDBや共起出現率ユーザキーワードDBを維持管理する場合には、サービス提供者がこれらのデータベースに任意の時にアクセス可能なので、ユーザ関心情報についての分析や多くのユーザを対象とした統計処理が可能となってくる。したがって、サービス提供者はこの分析結果に基づいて検索精度や広告コンテンツクリック率の更なる向上が実現できるが、ユーザ関心情報についての分析結果がユーザのプライバシに関わるものになる可能性があり、もし情報が流出した場合ユーザに被害を与える可能性がある。
【0155】
以上のような問題点に対して、上述した各実施形態において、入力キーワード以外の閲覧文書から抽出したキーワードや補助キーワードをサービスサイトへ渡す場合に、ユーザサイトでフィルタをかけるようにして、プライバシやセキュリティの情報を除外するようにした。
このフィルタをかける場所としては、次のような3つのパターンがある。
【0156】
(1)第1のパターン:
キーワード抽出手段11で閲覧文書から補助キーワードを抽出し、転送フィルタ手段17でこの補助キーワードをフィルタし、フィルタされた補助キーワードを検索要求手段12でサービスサイトの検索手段や広告検索手段へ渡すパターンである(図20参照)。
(2)第2のパターン:
キーワード抽出手段11で閲覧文書からキーワードを抽出し、転送フィルタ手段17でこのキーワードをフィルタし、フィルタされたキーワードを検索要求手段12でサービスサイトのユーザキーワード管理手段へ渡すパターンである(図21参照)。
【0157】
(3)第3のパターン:
ユーザキーワード管理手段13で得た補助キーワードに、転送フィルタ手段17でフィルタをかけ、このフィルタをかけられた補助キーワードを検索要求手段12でサービスサイトの検索手段や広告検索手段へ渡すパターンである(図22参照)。
このユーザキーワード管理手段が管理するデータベースは、ユーザキーワードDBであっても共起出現率ユーザキーワードDBに対しても適用可能である。
【0158】
次に、転送フィルタ手段17の機能について詳細に説明する。
【0159】
(1)ユーザに確認する方法:
第1のパターンの場合には、キーワード抽出手段11で閲覧文書から抽出された補助キーワードを対象とし、例えば、図23に例示したようなダイアログにて、この補助キーワードの一覧をユーザに提示する。
ユーザは、表示された補助キーワードの一覧から転送を禁止したい補助キーワードを選択して、削除ボタンをクリックする。転送を禁止したい補助キーワードがなくなった時点で、転送ボタンをクリックする。
転送フィルタ手段17は、転送ボタンをクリックしたときに残っていた補助キーワード(転送を許可された補助キーワード)を、検索要求手段12を介してサービスサイトの検索手段や広告検索手段へ渡す。
【0160】
この方法によると、サービスサイトに送信するキーワードを予め確認することができ、問題のある場合には特定のキーワードを削除することができる。
しかし、この方法では、ユーザは毎回転送可否の判断をしなければならないが、転送禁止の確率の小さい場合や転送フィルタ手段17に渡される補助キーワードの数が少ない場合には有効である。
【0161】
同様に、第2のパターンの場合には、キーワード抽出手段11で閲覧文書から抽出されたキーワードを対象とし、転送禁止キーワードを削除して、残ったキーワードをキーワード転送手段16を介してサービスサイトのユーザキーワード管理手段へ渡す。
また、第3のパターンのときには、ユーザキーワード管理手段13で選定された補助キーワードを対象とし、転送禁止キーワードを削除して、残った補助キーワードを検索要求手段12を介してサービスサイトの検索手段や広告検索手段へ渡す。
【0162】
この方法は、以下に説明する(2)および(3)の方法と組み合わせると、自動的に転送否または転送可と決定されたキーワードでもユーザの判断で転送可または転送否とすることができる。
【0163】
(2)キーワードに対する転送可否テーブルを参照する方法:
まず、開発コードネーム等の社外秘のキーワードは転送禁止のキーワードとして予めワードテーブルに記憶させておく。
この登録の場合には、ユーザの要求に応じてワードテーブルのキーワードの状態を一覧表示する(図24参照)。キーワードの種類には、セキュリティポリシにより組織で共通に設定され一般ユーザには編集できない「共通」と、一般ユーザが設定できる「ユーザ設定」とがある。
ユーザは、その権限に応じて、転送禁止のキーワードの追加・削除・編集を行ってワードテーブルを更新する。
上記のワードテーブルは、転送禁止のキーワードを記憶させるようにしたが、転送許可のキーワードのみを記憶させるようにしてもよいし、あるいは、登録してあるキーワードに対して転送の可否の区別を対応させて記憶させるようにしてもよい。
【0164】
第1のパターンの場合には、キーワード抽出手段11で閲覧文書から抽出された補助キーワードを対象とし、ワードテーブルに記憶されているキーワードと比較して転送可否を判断し、転送可の補助キーワードのみを、検索要求手段12を介してサービスサイトの検索手段や広告検索手段へ渡す。
この方法では、ユーザが閲覧した文書のキーワードに特定の語句(プロジェクト名等)が含まれないように自動的にフィルタをかけることができる。
【0165】
同様に、第2のパターンの場合には、キーワード抽出手段11で閲覧文書から抽出されたキーワードを対象とし、ワードテーブルに記憶されているキーワードと比較して転送可否を判断し、転送可のキーワードのみを、キーワード転送手段16を介してサービスサイトのユーザキーワード管理手段へ渡す。この場合、転送可のキーワードのみがユーザキーワードDBあるいは共起出現率ユーザキーワードDBに登録されることになる。
また、第3のパターンのときには、ユーザキーワード管理手段13で選定された補助キーワードを対象とし、ワードテーブルに記憶されているキーワードと比較して転送可否を判断し、転送可の補助キーワードを検索要求手段12を介してサービスサイトの検索手段や広告検索手段へ渡す。
【0166】
(3)文書IDに対する可否テーブルを参照する方法:
閲覧文書にはその文書に関わるすべての情報を送信禁止することが求められることがある。例えばプライベートなレターや企業のセキュリティに関わる機密文書等があり、そのような場合は文書単位で転送可否を扱う方が便利である。
このために、まず、転送禁止文書IDテーブルと転送禁止属性テーブルからなる文書IDテーブルを予めに記憶しておく。
【0167】
この登録には、図25に例示したダイアログを表示させ、サービスサイトへ転送対象となる文書名とその属性(属性としては、「通常」、「極秘」、「社外秘」等がある)を入力し、登録ボタンをクリックすると、転送禁止文書一覧へ登録される。属性が「通常」であっても、ここで登録された文書は、すべて自動的に転送禁止文書として扱われる。
また、転送禁止文書一覧に表示されている文書を転送可の文書に変更するときには、その文書を転送禁止文書一覧で選択し、「登録削除ボタン」で削除することができる。
文書IDテーブルに登録された文書は、図26に例示するように登録される。
【0168】
また、この文書IDテーブルは、転送可の文書IDのみを登録しておき、対象となる文書が文書IDテーブルに登録されていない場合には、転送禁止と判断するようにしてもよいし、あるいは、文書IDに対して転送の可否を登録するようにしてもよい。
【0169】
第1のパターンあるいは第2のパターンの場合、閲覧文書の属性情報を転送禁止属性テーブルで比較し、転送禁止属性として登録されていれば、抽出したキーワードの転送を行わない。しかし、閲覧文書の属性情報が転送禁止属性として登録されていないか、あるいは転送可属性として登録されていれば、次に閲覧文書IDを転送禁止文書IDテーブルで比較し、転送禁止文書として登録されていれば抽出したキーワードの転送を行わない。
この方法によると、文書IDテーブルを参照して閲覧対象の文書から抽出したキーワードの転送可否を自動的に決定することができる。
【0170】
さらに、検索指示が行われたときの閲覧文書に対して転送フィルタ手段を適用すれば、転送禁止の文書に対してキーワードを抽出する必要がなくなる。
【0171】
また、文書IDテーブルで閲覧文書を評価した結果をユーザに確認するようにしてもよい。例えば、図27に示したダイアログへ表示し、ユーザは表示されたコメントを参照して、不適切であれば転送可か転送禁止への変更ボタンをクリックし、確認ボタンをクリックする。転送可か転送禁止への変更があった場合は、文書IDテーブルに登録更新する。
【0172】
(4)(2)と(3)のフィルタとを組み合わせた場合:
第1の用例としては、(3)の方法で転送可の文書から抽出されたキーワードに対して、(2)のワードテーブルを適用して、転送禁止のキーワードを決定することができる。
第2の用例としては、逆に、(3)の方法で転送禁止の文書から抽出されたキーワードに対して、(2)のワードテーブルを適用して、転送可のキーワードを決定することができる。
この場合には、転送の可否が決定されたキーワードに対して、さらに個々のキーワードに転送の可否を決定できるので、プライバシの安全性がより強化される。
【0173】
(5)(2)と(1)のフィルタとを組み合わせた場合:
抽出されたキーワードに対して(2)のワードテーブルを適用して、転送可のキーワードと転送禁止のキーワードに分けする。これを例えば、図28のようなダイアログへそれぞれの一覧を表示する。ユーザは、表示された転送可あるいは転送禁止のキーワードが不適切であれば変更する。変更するときには、変更したいキーワードを選択し、転送可へのあるいは転送禁止への移動ボタンをクリックして移動を行う。変更が無くなれば、確認ボタンをクリックする。確認ボタンがクリックされると、転送可および転送禁止に設定されたキーワードをワードテーブルに登録更新する。
この場合には、一旦自動的に転送の可否が決定されたキーワードに対して、転送の可否を最終確認することができ、プライバシの安全性がより強化される。
【0174】
(6)(3)と(1)のフィルタとを組み合わせた場合:
抽出されたキーワードに対して(3)の文書IDテーブルを適用して、転送可のキーワードと転送禁止のキーワードに評価分けする。例えば、図27のようなダイアログへそれぞれの一覧を表示する。ユーザは、表示された転送可あるいは転送禁止のキーワードが不適切であれば変更する。変更するときには、変更したいキーワードを選択し、転送可へのあるいは転送禁止への移動ボタンをクリックして移動を行う。変更が無くなれば、確認ボタンをクリックする。
この場合には、一旦自動的に転送の可否が決定されたキーワードに対して、転送の可否を最終確認することができ、プライバシの安全性がより強化される。
【0175】
(7)(3)と(2)と(1)のフィルタとを組み合わせた場合:
閲覧文書から抽出されたキーワードとその転送可否を(3)の方法で決定し、それらのキーワードに対して(2)のワードテーブルを適用して、キーワードの転送可否を修正し、さらに、例えば、図27のようなダイアログへそれぞれのキーワード一覧を表示する。ユーザは、表示された転送可あるいは転送禁止のキーワードが不適切であれば変更する。変更するときには、変更したいキーワードを選択し、転送可へのあるいは転送禁止への移動ボタンをクリックして移動を行う。変更が無くなれば、確認ボタンをクリックする。
この場合には、一旦自動的に転送の可否が決定されたキーワードに対して、転送の可否を最終確認することができ、プライバシの安全性がより強化される。
【0176】
以上のように転送フィルタ手段を構成することにより、従来のURLを取得する方式においては取得するかしないかの選択しかできなかったが、本発明では多様なレベルのフィルタリングを行うことができる。
【0177】
<実施形態9>
本発明は、上述した実施形態のみに限定されたものではない。上述した実施形態を構成する各機能をそれぞれプログラム化して予め記録媒体に書き込んでおき、コンピュータにこの記録媒体を装着して、記録媒体からこれらのプログラムをコンピュータのメモリあるいは記憶装置に格納して実行することによって、本発明の目的が達成されることは言うまでもない。
この場合、記録媒体から読み出されたプログラム自体が上述した実施形態の機能を実現することになり、そのプログラムおよびそのプログラムを記録した記録媒体も本発明を構成することになる。
【0178】
なお、プログラムを格納する記録媒体としては半導体媒体(例えば、ROM、不揮発性メモリカード等)、光媒体(例えば、DVD、MO、MD、CD等)、磁気媒体(例えば、磁気テープ、フレキシブルディスク等)等のいずれであってもよい。
【0179】
また、ロードしたプログラムを実行することにより上述した実施形態の機能が実現されるだけでなく、そのプログラムの指示に基づき、オペレーティングシステムあるいは他のアプリケーションプログラム等と共同して処理することによって上述した実施形態の機能が実現される場合も含まれる。
【0180】
市場に流通させる場合には、可搬型の記録媒体にプログラムを格納して流通させたり、インターネット等の通信網を介して接続されたサーバコンピュータの記憶装置に格納しておき、通信網を通じて他のコンピュータに転送することもできる。この場合、このサーバコンピュータの記憶装置も本発明の記録媒体に含まれる。
なお、コンピュータでは、可搬型の記録媒体上のプログラム、または転送されてくるプログラムを、コンピュータに接続した記録媒体にインストールし、そのインストールされたプログラムを実行することによって上述した実施形態の機能が実現される。
【0181】
このように、上述した実施形態の機能をプログラム化して流通させることによって、コストの低廉化、および可搬性や汎用性を向上させることができる。
【図面の簡単な説明】
【0182】
【図1】本発明の実施形態1に係る情報検索システムの機能構成を示すブロック図である。
【図2】キーワード抽出手段の機能構成を示すブロック図である。
【図3】実施形態1の処理手順を説明するフローチャートである。
【図4】本発明の実施形態2に係る情報検索システムの機能構成を示すブロック図である。
【図5】実施形態2の処理手順を説明するフローチャートである。
【図6】本発明の実施形態3に係る情報検索システムの機能構成を示すブロック図である。
【図7】共起出現率ユーザキーワードDBのデータ構造例である。
【図8】実施形態3の処理手順を説明するフローチャートである。
【図9】本発明の実施形態4に係る情報検索システムの機能構成を示すブロック図である。
【図10】実施形態4の処理手順を説明するフローチャートである。
【図11】本発明の実施形態5に係る広告型検索システムの機能構成を示すブロック図である。
【図12】広告型検索の結果を表示する広告コンテンツ用のダイアログ例である。
【図13】実施形態5の処理手順を説明するフローチャートである。
【図14】情報検索あるいは広告型検索サービスを提供するサービスサイトと、サービスを受けるユーザサイトによる本発明の実施形態の構成図である。
【図15】キーワード抽出手段で補助キーワードを抽出するまでをユーザサイトで行い、その補助キーワードをサービスサイトへ転送する構成の広告型検索システムの機能構成を示すブロック図である。
【図16】閲覧文書から抽出したキーワードを使って、ユーザキーワード管理手段で補助キーワードを選択するまでをユーザサイトで行い、その補助キーワードをサービスサイトへ転送する構成の広告型検索システムの機能構成を示すブロック図である。
【図17】キーワード抽出手段でキーワードを抽出するまでをユーザサイトで行い、そのキーワードをサービスサイトのユーザキーワード管理手段へ転送する構成の広告型検索システムの機能構成を示すブロック図である。
【図18】入力キーワードを使って、ユーザキーワード管理手段で補助キーワードを選択するまでをユーザサイトで行い、その補助キーワードをサービスサイトへ転送する構成の広告型検索システムの機能構成を示すブロック図である。
【図19】キーワードの入力までをユーザサイトで行い、その入力キーワードをサービスサイトのユーザキーワード管理手段へ転送する構成の広告型検索システムの機能構成を示すブロック図である。
【図20】キーワード抽出手段で抽出したキーワードに対して転送フィルタ手段を適用し、そのフィルタリングされたキーワードをサービスサイトへ転送する場合の機能構成を示すブロック図である(第1のパターン)。
【図21】キーワード抽出手段で抽出したキーワードに対して転送フィルタ手段を適用し、そのフィルタリングされたキーワードをユーザキーワード管理手段へ転送する場合の機能構成を示すブロック図である(第2のパターン)。
【図22】ユーザキーワード管理手段で得た補助キーワードに対して転送フィルタ手段を適用し、そのフィルタリングされた補助キーワードをサービスサイトへ転送する場合の機能構成を示すブロック図である(第3のパターン)。
【図23】フィルタリング対象となるキーワードの一覧を表示し、転送可能かを確認するためのダイアログ例である。
【図24】ワードテーブルに登録されているキーワードの状態を一覧表示するダイアログ例である。
【図25】転送禁止文書を文書IDテーブルに登録するとき、あるいは編集するときのダイアログ例である。
【図26】文書IDテーブル(転送禁止文書IDテーブルおよび転送禁止属性テーブル)に登録された内容の表示例である。
【図27】閲覧文書を文書IDテーブルで転送可否を評価した結果を確認するときのダイアログ例である。
【図28】キーワードの転送可否を最終確認する時のダイアログ例である。
【符号の説明】
【0183】
10…ユーザインタフェース(I/F)手段、11…キーワード抽出手段、111…形態素解析手段、112…単語評価手段、113…基本キーワードDB、12…検索要求手段、13…ユーザキーワード管理手段、14…ユーザキーワードDB、15…共起出現率ユーザキーワードDB、16…キーワード転送手段、17…転送フィルタ手段、20…検索手段、21…情報記憶手段、22…結果通知手段、30…広告検索手段、31…広告情報記憶手段、100…ユーザサイト、200…サービスサイト、300…ネットワーク。
【技術分野】
【0001】
本発明は、情報検索システム、情報提供装置、情報検索方法、並びに、プログラムおよび記録媒体に関し、具体的には、ユーザからのキーワード検索要求に対して、その検索結果の提供や指定されたキーワードに関連した広告の提供に関する。
【背景技術】
【0002】
近年、インターネットの普及によって、ネットワークに接続された世界中のコンピュータから様々な情報を取り出すことが可能となっている。この場合、提供しようとする情報を収めたコンピュータをWebサーバに設定することによって、その情報を欲する世界中の人々が持つ情報端末装置にインターネットを介して容易に提供することができ、人々は欲しいと思う情報をすばやく手に入れることができる。
【0003】
そのために、世界中のWebサーバがどのような情報を提供しているかを予め収集して目次情報を保持しておき、人々が欲しいと思う情報を表すキーワード(単語)を入力すると、そのキーワードを含む情報を目次情報の中からすべて検索し、その結果リストアップして表示してくれるサーチエンジンが提供されている。
【0004】
一般に、欲しいと思う情報を得るためには、1個のキーワードを指定して、適切な検索結果が得られるのが理想である。
しかしながら、同じ単語が分野や状況によって異なる意味で用いられており、特に、固有名詞や略称(略語)の場合には顕著である。
例えば、「Smart Taggs」という用語は、情報処理ソフトウェア分野においてはMicrosoft社のユーザインタフェース技術の名称であり、同じ情報処理のメディア分野においてはRF-ID技術の名称でもある。また、「ATM」は、銀行のATM(現金自動預入払出機)や金融関連では「At the Money」の略語であり、通信分野ではスイッチング方式の名称「Asynchronous Transfer Mode」の略語である。
【0005】
このように、一般的なサーチエンジンにおいては、1個のキーワードでは不足であり、不要情報を排除するために3個程度のキーワードでAND検索を行わないと適切な検索結果を得られないと言われている。
【0006】
一方、目的のWebページにアクセスした場合に表示されるバナー広告は、興味あるものや探しているものなどを偶然見つけるのに便利なものであるが、適切なバナー広告を見つけることは比較的少なく、近年バナー広告の広告効果が低下している。そのためバナー広告の広告主は、お客の気を引く内容のものを表示しようとしているが、お客の心理や嗜好を適確に把握しきれているとは限らない。また、リアルタイム性がなく、お客にするインパクトに欠けている。
【0007】
このような状態を打開するために、最近では広告型検索サービスが利用されるようになってきた。この広告型検索サービスは、広告主に関連があるキーワードに1クリック当りの価格を付けさせて、高い単価を支払った順に広告を表示し、クリックされた回数と単価を掛けた金額が広告主に請求され、広告を表示した提携サイトにはこの請求金額の一部が支払われというサービスであり、PPC(Pay Per Click)またはPFP(Pay For Performance)と呼ばれる広告のことで、最近は日本でも多くのサーチエンジンが利益確保のために導入している。
広告の表示のされ方は、一般の検索結果と同じように、サーチエンジンの検索結果の上部に一般の検索結果とは別にキーワードを入札した企業の広告をテキストによるリンク形式で表示する。
【0008】
この広告型検索サービスは、検索を行ったユーザが指定した特定のキーワードだけに反応してリンクするようにしたので、ユーザの意思と関係なくリンクしていた従来のバナー広告に比べて、広告のクリック率はかなり高くなっている。
【0009】
しかし、ユーザが入力したキーワードがそのユーザにとって関心の高いキーワードとは限らない。例えば、ユーザの興味ある文書を読んでいたときに、その文書中に訳語が分からないため検索サービスを利用したということが考えられる。
このような、ユーザにとって興味のある情報を提供する技術として、特許文献1に開示された技術がある。
【0010】
特許文献1の技術は、ユーザが情報検索に普段利用している端末装置に蓄えられている、情報検索とは直接関係のない文書ファイルなどの情報からユーザの嗜好を反映する単語を自動的に抽出して単語の関係種別ごとに分類して嗜好情報記憶手段に記憶させておく。
その上で、ユーザが情報検索を行うときには、入力した検索キーワードと、この検索キーワードに関連する補助キーワードを嗜好情報記憶手段から取り出して、この検索キーワードにより検索された結果を、動作関係の補助キーワードを用いてユーザの日常の行動様式を推定し、その推定した行動様式に応じて分類して表示するようにしている。
これにより、ユーザがキーワードの設定に不慣れであっても、ユーザの嗜好を反映して効率的な情報検索を行うことができる。
【0011】
しかしながら、特許文献1では、指定された検索キーワードがそのユーザにとって関心の高いキーワードとは限らないため、嗜好を反映した検索結果とはいえない。また、特許文献1では、広告検索型サービスの場合には、広告主の意思を反映し、しかもユーザの関心の高い広告コンテンツを提供できるとは限らない。
【0012】
また、広告型検索サービスにおいては、ユーザの関心事や嗜好を反映するために、ユーザが閲覧したWebページのURLを取得する場合があり、このときには、取得されたURLによりそのWebページの全ての情報が見られてしまい、プライバシへの損害を与える可能性が高い。
【特許文献1】特開平11−296537号公報
【発明の開示】
【発明が解決しようとする課題】
【0013】
本発明は、上述のような実情を考慮してなされたものであって、ユーザは1個のキーワードを指定するだけで、ユーザが関心のある情報を取得できる情報検索システム、情報提供装置、情報検索方法、並びに、プログラムおよび記録媒体を提供することを目的とする。
さらに、本発明は、ユーザにプライバシに関する損害を与える可能性が低く、しかも検索精度の良い、あるいはまた、より高いクリック率を実現する情報検索システム、情報提供装置、情報検索方法、並びに、プログラムおよび記録媒体を提供することを目的とする。
【課題を解決するための手段】
【0014】
上記課題を解決するために、請求項1に記載の発明は、表示された文書や情報(以下、閲覧文書という)に関するキーワードを入力する入力手段と、前記閲覧文書からキーワードを抽出するキーワード抽出手段と、前記入力手段によって入力されたキーワード(以下、入力キーワードという)と前記キーワード抽出手段で抽出したキーワード(以下、補助キーワードという)に基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段と、前記検索手段で検索された検索結果の文書や情報を表示する表示手段を備えることを特徴とする。
【0015】
請求項2に記載の発明は、表示された文書や情報(以下、閲覧文書という)に関するキーワードを入力する入力手段と、前記閲覧文書からキーワードを抽出するキーワード抽出手段と、前記入力手段によって入力されたキーワード(以下、入力キーワードという)と前記キーワード抽出手段で抽出したキーワード(以下、補助キーワードという)に基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段と、前記入力キーワードと前記補助キーワードに基づいて、広告情報記憶手段に記憶された広告コンテンツを検索する広告検索手段と、前記検索手段で検索された検索結果の文書や情報、および前記広告検索手段で検索された広告コンテンツを表示する表示手段を備えることを特徴とする。
【0016】
請求項3に記載の発明は、請求項2に記載の情報検索システムにおいて、前記広告検索手段は、前記閲覧文書から抽出した補助キーワードのみ、または入力キーワードと重複するキーワードを除いた補助キーワードのみに基づいて検索するようにしたことを特徴とする。
【0017】
請求項4に記載の発明は、表示された文書や情報(以下、閲覧文書という)に関するキーワードを入力する入力手段と、前記閲覧文書からキーワードを抽出するキーワード抽出手段と、ユーザの関心情報であるキーワードとその出現頻度を保管するユーザキーワードDBと、前記ユーザキーワードDBの出現頻度の高いキーワードを選択して補助キーワードとして出力するとともに、前記キーワード抽出手段により抽出されたキーワードと前記入力手段によって入力されたキーワード(以下、入力キーワードという)に基づいて前記ユーザキーワードDBの更新を行うユーザキーワード管理手段と、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段と、前記検索手段で検索された検索結果の文書や情報を表示する表示手段を備えることを特徴とする。
【0018】
請求項5に記載の発明は、表示された文書や情報(以下、閲覧文書という)に関するキーワードを入力する入力手段と、前記閲覧文書からキーワードを抽出するキーワード抽出手段と、ユーザの関心情報であるキーワードとその出現頻度を保管するユーザキーワードDBと、前記ユーザキーワードDBの出現頻度の高いキーワードを選択して補助キーワードとして出力するとともに、前記キーワード抽出手段により抽出されたキーワードと前記入力手段によって入力されたキーワード(以下、入力キーワードという)に基づいて前記ユーザキーワードDBの更新を行うユーザキーワード管理手段と、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段と、前記入力キーワードと前記補助キーワードに基づいて、広告情報記憶手段に記憶された広告コンテンツを検索する広告検索手段と、前記検索手段で検索された検索結果の文書や情報、および前記広告検索手段で検索された広告コンテンツを表示する表示手段を備えることを特徴とする。
【0019】
請求項6に記載の発明は、表示された文書や情報に関するキーワードを入力する入力手段と、ユーザの関心情報であるキーワードとその出現頻度を保管するユーザキーワードDBと、前記ユーザキーワードDBの出現頻度の高いキーワードを選択して補助キーワードとして出力するとともに、前記入力手段によって入力されたキーワード(以下、入力キーワードという)に基づいて前記ユーザキーワードDBの更新を行うユーザキーワード管理手段と、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段と、前記検索手段で検索された検索結果の文書や情報を表示する表示手段を備えることを特徴とする。
【0020】
請求項7に記載の発明は、表示された文書や情報に関するキーワードを入力する入力手段と、ユーザの関心情報であるキーワードとその出現頻度を保管するユーザキーワードDBと、前記ユーザキーワードDBの出現頻度の高いキーワードを選択して補助キーワードとして出力するとともに、前記入力手段によって入力されたキーワード(以下、入力キーワードという)に基づいて前記ユーザキーワードDBの更新を行うユーザキーワード管理手段と、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段と、前記入力キーワードと前記補助キーワードに基づいて、広告情報記憶手段に記憶された広告コンテンツを検索する広告検索手段と、前記検索手段で検索された検索結果の文書や情報、および前記広告検索手段で検索された広告コンテンツを表示する表示手段を備えることを特徴とする。
【0021】
請求項8に記載の発明は、請求項4、5、6または7に記載の情報検索システムにおいて、前記ユーザキーワードDBは、共起出現率ユーザキーワードDBであって、前記ユーザキーワード管理手段は、前記入力キーワードと前記閲覧文書から抽出されたキーワードに基づいて共起出現率の高いキーワードを選択して補助キーワードとして出力するとともに、前記入力キーワードと前記閲覧文書から抽出されたキーワードに基づいて前記共起出現率ユーザキーワードDBを更新するようにした。
【0022】
請求項9に記載の発明は、請求項5または7に記載の情報検索システムにおいて、前記広告検索手段は、前記ユーザキーワード管理手段で選択された補助キーワードのみ、または入力キーワードと重複するキーワードを除いた補助キーワードのみに基づいて検索するようにしたことを特徴とする。
【0023】
請求項10に記載の発明は、情報検索の指示と検索結果を表示するユーザサイトと、情報検索サービスを提供するサービスサイトとをネットワークで接続した情報検索システムにおいて、請求項1乃至3のいずれかに記載の情報検索システムのうち、前記キーワード抽出手段を前記ユーザサイトに備え、前記キーワード抽出手段から抽出されたキーワードを補助キーワードとして前記サービスサイトへ転送することを特徴とする。
【0024】
請求項11に記載の発明は、情報検索の指示と検索結果を表示するユーザサイトと、情報検索サービスを提供するサービスサイトとをネットワークで接続した情報検索システムにおいて、請求項4乃至9のいずれかに記載の情報検索システムのうち、前記ユーザキーワードDBと前記ユーザキーワード管理手段を前記サービスサイトに備えることを特徴とする。
【0025】
請求項12に記載の発明は、情報検索の指示と検索結果を表示するユーザサイトと、情報検索サービスを提供するサービスサイトとをネットワークで接続した情報検索システムにおいて、請求項4乃至9のいずれかに記載の情報検索システムのうち、前記ユーザキーワードDBと前記ユーザキーワードDB管理手段を前記ユーザサイトに備えることを特徴とする。
【0026】
請求項13に記載の発明は、請求項10、11または12に記載の情報検索システムにおいて、文書や情報に対する転送可否を記憶した文書IDテーブルを参照して、ユーザの表示した文書や情報の転送可否を決定する転送フィルタ手段を前記ユーザサイトに備え、転送可の文書や情報から抽出したキーワードのみを前記サービスサイトへ転送するようにしたことを特徴とする。
【0027】
請求項14に記載の発明は、請求項13に記載の情報検索システムにおいて、前記転送フィルタ手段は、転送可否を決定した文書の転送許可確認を求めるとともに、転送可否状態で文書IDテーブルを更新することを特徴とする。
【0028】
請求項15に記載の発明は、請求項10乃至14のいずれかに記載の情報検索システムにおいて、キーワードの転送可否を記憶したワードテーブルを参照して、キーワードの転送可否を決定する転送フィルタ手段を前記ユーザサイトに備え、転送可のキーワードのみを前記サービスサイトへ転送するようにしたことを特徴とする。
【0029】
請求項16に記載の発明は、請求項15に記載の情報検索システムにおいて、前記転送フィルタ手段は、転送可否を決定したキーワードの転送許可確認を求めるとともに、転送可否状態でワードテーブルを更新することを特徴とする。
【0030】
請求項17に記載の発明は、請求項10乃至16のいずれかに記載の情報検索システムにおいて、転送しようとするキーワードあるいは文書IDの転送許可を求める転送フィルタ手段を前記ユーザサイトに備え、転送許可されたキーワードまたは文書IDで指示される文書から抽出されるキーワードを前記サービスサイトへ転送するようにしたことを特徴とする。
【0031】
請求項18に記載の発明は、ネットワークで接続したユーザ端末からの情報検索の指示で、情報検索を行って検索結果を返信する情報提供装置において、ユーザが閲覧中の文書や情報(以下、閲覧文書という)に関して入力したキーワード(以下、入力キーワードという)と、前記閲覧文書から抽出されたキーワード(以下、補助キーワードという)を前記ユーザ端末から受信する受信手段と、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段とを備え、前記検索手段で検索された検索結果の文書や情報を前記ユーザ端末へ返信することを特徴とする。
【0032】
請求項19に記載の発明は、ネットワークで接続したユーザ端末からの情報検索の指示で、情報検索を行って検索結果を返信する情報提供装置において、ユーザが閲覧中の文書や情報(以下、閲覧文書という)に関して入力したキーワード(以下、入力キーワードという)と、前記閲覧文書から抽出されたキーワード(以下、補助キーワードという)を前記ユーザ端末から受信する受信手段と、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段と、前記入力キーワードと前記補助キーワードに基づいて、広告情報記憶手段に記憶された広告コンテンツを検索する広告検索手段とを備え、前記検索手段で検索された検索結果の文書や情報、および前記広告検索手段で検索された広告コンテンツを前記ユーザ端末へ返信することを特徴とする。
【0033】
請求項20に記載の発明は、ネットワークで接続したユーザ端末からの情報検索の指示で、情報検索を行って検索結果を返信する情報提供装置において、ユーザが閲覧中の文書や情報(以下、閲覧文書という)に関して入力したキーワード(以下、入力キーワードという)と、前記閲覧文書から抽出されたキーワードを前記ユーザ端末から受信する受信手段と、ユーザの関心情報であるキーワードとその出現頻度を保管するユーザキーワードDBと、前記ユーザキーワードDBの出現頻度の高いキーワードを選択して補助キーワードとして出力するとともに、前記キーワード抽出手段により抽出されたキーワードと前記入力キーワードに基づいて前記ユーザキーワードDBの更新を行うユーザキーワード管理手段と、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段とを備え、前記検索手段で検索された検索結果の文書や情報を前記ユーザ端末へ返信することを特徴とする。
【0034】
請求項21に記載の発明は、ネットワークで接続したユーザ端末からの情報検索の指示で、情報検索を行って検索結果を返信する情報提供装置において、ユーザが閲覧中の文書や情報(以下、閲覧文書という)に関して入力したキーワード(以下、入力キーワードという)と、前記閲覧文書から抽出されたキーワードを前記ユーザ端末から受信する受信手段と、ユーザの関心情報であるキーワードとその出現頻度を保管するユーザキーワードDBと、前記ユーザキーワードDBの出現頻度の高いキーワードを選択して補助キーワードとして出力するとともに、前記キーワード抽出手段により抽出されたキーワードと前記入力キーワードに基づいて前記ユーザキーワードDBの更新を行うユーザキーワード管理手段と、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段と、前記入力キーワードと前記補助キーワードに基づいて、広告情報記憶手段に記憶された広告コンテンツを検索する広告検索手段とを備え、前記検索手段で検索された検索結果の文書や情報、および前記広告検索手段で検索された広告コンテンツを前記ユーザ端末へ返信することを特徴とする。
【0035】
請求項22に記載の発明は、ネットワークで接続したユーザ端末からの情報検索の指示で、情報検索を行って検索結果を返信する情報提供装置において、ユーザが閲覧中の文書や情報(以下、閲覧文書という)に関して入力したキーワード(以下、入力キーワードという)を前記ユーザ端末から受信する受信手段と、ユーザの関心情報であるキーワードとその出現頻度を保管するユーザキーワードDBと、前記ユーザキーワードDBの出現頻度の高いキーワードを選択して補助キーワードとして出力するとともに、前記入力キーワードに基づいて前記ユーザキーワードDBの更新を行うユーザキーワード管理手段と、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段とを備え、前記検索手段で検索された検索結果の文書や情報を前記ユーザ端末へ返信することを特徴とする。
【0036】
請求項23に記載の発明は、ネットワークで接続したユーザ端末からの情報検索の指示で、情報検索を行って検索結果を返信する情報提供装置において、ユーザが閲覧中の文書や情報(以下、閲覧文書という)に関して入力したキーワード(以下、入力キーワードという)を前記ユーザ端末から受信する受信手段と、ユーザの関心情報であるキーワードとその出現頻度を保管するユーザキーワードDBと、前記ユーザキーワードDBの出現頻度の高いキーワードを選択して補助キーワードとして出力するとともに、前記入力キーワードに基づいて前記ユーザキーワードDBの更新を行うユーザキーワード管理手段と、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段と、前記入力キーワードと前記補助キーワードに基づいて、広告情報記憶手段に記憶された広告コンテンツを検索する広告検索手段とを備え、前記検索手段で検索された検索結果の文書や情報、および前記広告検索手段で検索された広告コンテンツを前記ユーザ端末へ返信することを特徴とする。
【0037】
請求項24に記載の発明は、ネットワークで接続したユーザ端末からの情報検索の指示で、情報検索を行って検索結果を返信する情報提供装置において、ユーザが閲覧中の文書や情報(以下、閲覧文書という)に関して入力したキーワード(以下、入力キーワードという)と、ユーザの関心情報であるキーワード(以下、補助キーワードという)を前記ユーザ端末から受信する受信手段と、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段とを備え、前記検索手段で検索された検索結果の文書や情報を前記ユーザ端末へ返信することを特徴とする。
【0038】
請求項25に記載の発明は、ネットワークで接続したユーザ端末からの情報検索の指示で、情報検索を行って検索結果を返信する情報提供装置において、ユーザが閲覧中の文書や情報(以下、閲覧文書という)に関して入力したキーワード(以下、入力キーワードという)と、ユーザの関心情報であるキーワード(以下、補助キーワードという)を前記ユーザ端末から受信する受信手段と、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段と、前記入力キーワードと前記補助キーワードに基づいて、広告情報記憶手段に記憶された広告コンテンツを検索する広告検索手段とを備え、前記検索手段で検索された検索結果の文書や情報、および前記広告検索手段で検索された広告コンテンツを前記ユーザ端末へ返信することを特徴とする。
【0039】
請求項26に記載の発明は、表示された文書や情報(以下、閲覧文書という)に関するキーワードを入力し、前記閲覧文書からキーワードを抽出し、前記入力されたキーワード(以下、入力キーワードという)と前記閲覧文書から抽出したキーワード(以下、補助キーワードという)に基づいて、情報記憶手段に記憶された文書や情報を検索し、前記検索結果の文書や情報を表示することを特徴とする。
【0040】
請求項27に記載の発明は、表示された文書や情報(以下、閲覧文書という)に関するキーワードを入力し、前記閲覧文書からキーワードを抽出し、前記入力されたキーワード(以下、入力キーワードという)と前記閲覧文書から抽出したキーワード(以下、補助キーワードという)に基づいて、情報記憶手段に記憶された文書や情報を検索し、前記入力キーワードと前記補助キーワードに基づいて、広告情報記憶手段に記憶された広告コンテンツを検索し、前記検索結果の文書や情報、および前記広告コンテンツを表示することを特徴とする。
【0041】
請求項28に記載の発明は、表示された文書や情報(以下、閲覧文書という)に関するキーワードを入力し、前記閲覧文書からキーワードを抽出し、ユーザの関心情報であるキーワードとその出現頻度を保管するユーザキーワードDBを参照して、出現頻度の高いキーワードを選択して補助キーワードとして出力するとともに、前記閲覧文書から抽出されたキーワードと前記入力キーワードに基づいて前記ユーザキーワードDBを更新し、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索し、前記検索結果の文書や情報を表示することを特徴とする。
【0042】
請求項29に記載の発明は、表示された文書や情報(以下、閲覧文書という)に関するキーワードを入力し、前記閲覧文書からキーワードを抽出し、ユーザの関心情報であるキーワードとその出現頻度を保管するユーザキーワードDBを参照して、出現頻度の高いキーワードを選択して補助キーワードとして出力するとともに、前記閲覧文書から抽出されたキーワードと前記入力キーワードに基づいて前記ユーザキーワードDBを更新し、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索し、前記入力キーワードと前記補助キーワードに基づいて、広告情報記憶手段に記憶された広告コンテンツを検索し、前記検索結果の文書や情報、および前記広告コンテンツを表示することを特徴とする。
【0043】
請求項30に記載の発明は、表示された文書や情報に関するキーワードを入力し、ユーザの関心情報であるキーワードとその出現頻度を保管するユーザキーワードDBを参照して、出現頻度の高いキーワードを選択して補助キーワードとして出力するとともに、前記入力キーワードに基づいて前記ユーザキーワードDBを更新し、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段と、前記検索結果の文書や情報を表示することを特徴とする。
【0044】
請求項31に記載の発明は、表示された文書や情報に関するキーワードを入力し、ユーザの関心情報であるキーワードとその出現頻度を保管するユーザキーワードDBを参照して、出現頻度の高いキーワードを選択して補助キーワードとして出力するとともに、前記入力キーワードに基づいて前記ユーザキーワードDBを更新し、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索し、前記入力キーワードと前記補助キーワードに基づいて、広告情報記憶手段に記憶された広告コンテンツを検索し、前記検索結果の文書や情報、および前記広告コンテンツを表示することを特徴とする。
【0045】
請求項32に記載の発明は、コンピュータに、請求項1乃至17のいずれかに記載の情報検索システムの機能、または請求項18乃至25のいずれかに記載の情報提示装置の機能を実行させるためのプログラムである。
請求項33に記載の発明は、請求項32に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体である。
【発明の効果】
【0046】
本発明によれば、ユーザの入力したキーワードに加えて、閲覧している文書あるいは閲覧文書の履歴から得られたコンテキスト情報を用いるようにしたことにより、1個の入力キーワードでもユーザの意図した検索結果を得ることができる。
同様に、広告型検索サービスにおいては、ユーザが1個のキーワードを入力したときにユーザの関心事に、より合致した広告を提供できるので、広告コンテンツのクリック率を向上させることができる。
【0047】
また、情報の提供者は、ユーザが閲覧した文書の内容を受信するのではなく、この文書に関するコンテキスト情報の取得に限定されるので、そのようなコンテキスト情報からユーザが閲覧した文書を特定することは困難であり、プライバシへの損害を与える可能性が低い。
さらに、コンテキスト情報のうち、プライバシに関連する特定の語句(例えば、個人名、プロジェクト名等の固有名詞)が含まれないようにフィルタをかけ、問題があるキーワードであるかを確認できるようにしたので、多様なレベルのフィルタリングが可能となり、一層プライバシへ損害を与える可能性が低くなる。
【発明を実施するための最良の形態】
【0048】
以下、図面を参照して、本発明に係る好適な実施形態について詳細に説明する。
【0049】
(A)情報検索システム:
以下の説明では、情報検索システムの例として、ユーザの指定した1個のキーワードに関連した文書を検索し、検索結果をユーザに提供する情報検索サービスについて説明する。しかし、本発明は、情報検索サービスに限らず、例えば、ユーザが閲覧中の文書に出現した単語に対して、文中での用法にあった訳語や用例の提供だけではなく、当該単語を含むような文書を検索して提供するような辞書サービスやユーザが閲覧中の文書の一部分の翻訳サービス等にも容易に適用することができる。
【0050】
<実施形態1>
図1は、本発明の実施形態1に係る情報検索システムの機能構成を示すブロック図であり、同図において、情報検索システムは、ユーザインタフェース(以下、ユーザI/Fと記す)手段10、キーワード抽出手段11、検索要求手段12、検索手段20、情報記憶手段21、結果通知手段22とを含んでなっている。
【0051】
ユーザI/F手段10は、ユーザが文書を閲覧中にキーワードを入力し、検索サービスの選択を行うと、入力したキーワード(以下、入力キーワードという)を検索要求手段12へ渡すとともに、閲覧中の文書(以下、閲覧文書という)と入力キーワードをキーワード抽出手段11へ渡す。ここで、キーワードの入力は、キーワード入力のためのダイアログから入力するようにしても良いし、または、閲覧文書中の語を選択するようにしても良い。
また、ユーザI/F手段10は、結果通知手段22から検索結果を渡されると、表示装置や出力装置等へ受け取った検索結果を表示/出力する。
【0052】
キーワード抽出手段11は、ユーザI/F手段10から渡された閲覧文書から抽出したキーワードを補助キーワードとして検索要求手段12へ渡す。
図2は、キーワード抽出手段11の機能構成を示すブロック図である。同図において、キーワード抽出手段11は、形態素解析手段111、単語評価手段112、基本キーワードデータベース(以下、データベースをDBと略記する)113を含んでなっている。
まず、キーワード抽出手段11は、キーワードを抽出する範囲を次のいずれかに設定する。また、これらのいずれを抽出範囲として使用するかは予め決めておいてもよい。
【0053】
(1)入力キーワードを閲覧文書中の語で選択して指定した場合には、この語の近傍範囲にある文章を対象とする。
(2)ウィンドウに表示された範囲内の閲覧文書中の文章を対象とする。
(3)閲覧文書全体を対象とする。
【0054】
閲覧文書中の上述のいずれかの範囲内の文章を、公知の技術である形態素解析手段111によって、品詞付きの単語列に分割する。
基本キーワードDB113には、単語ごとに、品詞および重要度を保持している。この重要度は、名詞等の単語がキーワードとして用いる場合には値を大きくし、名詞以外の品詞の単語やキーワードとして有用でない単語の場合には小さな(例えば、ゼロ)値を設定する。
【0055】
単語評価手段112は、形態素解析手段111によって分割された単語列を、基本キーワードDB113を参照して、各単語の重要度を取り出し、重要度を大きい順に整列させる。この整列された重要度の大きい方から所定の数(例えば、3個程度)の単語を取り出してキーワードとする。
キーワード抽出手段11は、この取り出されたキーワードを補助キーワードとして出力する。また、この補助キーワードには、重要度から算出される評価点を属性情報として付加することも可能である。この評価点は、単に重要度の大きさ順序を表すものであってもよいし、重要度に応じた重みであっても良い。
【0056】
検索要求手段12は、ユーザI/F手段10から渡された入力キーワードと、キーワード抽出手段11から渡された補助キーワードとからなる検索要求を検索手段20へ渡す。
【0057】
検索手段20は、検索要求手段12から渡された入力キーワードと補助キーワードのAND検索によって情報記憶手段21を検索し、その検索結果を結果通知手段22へ渡す。
ここで、情報記憶手段21は、予めHTMLやXML等で記述されたWeb文書あるいはワードプロセッサ等のアプリケーションで記述された文書からなる複数の文書ファイルを記憶した少なくとも一つの文書データベースまたはファイルである。
【0058】
このAND検索では、通常、補助キーワードより入力キーワードを重視した検索を行うが、評価点を属性情報として付加された補助キーワードの場合には、この評価点を重み付けに反映した検索を行う。(この検索手段20の処理は、通常のサーチエンジンと呼ばれる検索サービスで行われているものである。)
【0059】
結果通知手段22は、検索手段20から渡された検索結果の各文書に対して、タイトル、アブストラクトやこの文書の存在する場所や関連文書の存在場所を示すURL等の属性情報が付加され、次のいずれかの表示方式で表示できるWebページを作成して、ユーザI/F手段10に渡す。また、表示順は入力キーワード、補助キーワード等の検索条件からユーザが欲している情報としてのランキング順としてもよい。
【0060】
(1)第1の表示方式:
タブブラウザのように複数のページを切替えて表示可能なように、検索結果の文書や情報を各タブへ直接表示するWebページを作成する。
(2)第2の表示方式:
通常のブラウザ表示や専用の結果表示ダイアログで表示可能なように、検索結果のURLリストを表示するWebページを作成する。
【0061】
次に、図3のフローチャートを用いて、本実施形態1の処理手順を説明する。
ユーザが文書を閲覧中にキーワードを入力し(ステップS10)、検索サービスの選択を行う(ステップS11)。ここで、キーワードの入力は、キーワード入力のためのダイアログから入力するようにしても良いし、または、閲覧文書中の語を選択するようにしても良い。
【0062】
閲覧文書からキーワードを抽出し、このキーワードを補助キーワードとする(ステップS12)。キーワードの抽出は、まず、キーワードを抽出する範囲を、閲覧文書中の選択した入力キーワードの近傍範囲、ウィンドウに表示された範囲内、あるいは閲覧文書全体を対象とし、形態素解析によって、品詞付きの単語列に分割する。次に、分割された単語列を、基本キーワードDB113を参照して、各単語の重要度を取り出し、重要度を大きい順に整列させる。この整列された重要度の大きい方から所定の数(例えば、3個程度)の単語を取り出して補助キーワードとする。
【0063】
入力キーワードと補助キーワードのAND検索によって、Web文書あるいはアプリケーションで作成された文書からなる複数の文書ファイルを検索する(ステップS13)。
このAND検索では、通常、補助キーワードより入力キーワードを重視した検索を行うが、評価点を属性情報として付加された補助キーワードの場合には、この評価点を重み付けに反映した検索を行う。
【0064】
検索結果の各文書に対して、タイトル、アブストラクトやこの文書の存在する場所や関連文書の存在場所を示すURL等の属性情報が付加されたWebページを作成し、表示装置や出力装置等へ表示/出力する(ステップS14)。この表示順は、入力キーワード、補助キーワード等の検索条件からユーザが欲している情報としてのランキング順としてもよい。
【0065】
以上の構成により、ユーザの入力したキーワードに加えて、閲覧している文書の内容を用いるようにしたことにより、1個の入力キーワードでもユーザの意図した検索結果を得ることができる。
【0066】
<実施形態2>
上述した実施形態1における問題点は、現時点の閲覧文書に限定して補助キーワードを求めているので、情報が少なく、ユーザの関心事を的確に取り出しえていない恐れがある点である。
本実施形態2では、コンテキスト情報として、閲覧中の文書だけでなく、この閲覧中の文書を得るに至る過程の入力キーワードや閲覧文書の情報を含むようにした。
【0067】
図4は、キーワード抽出手段11から抽出されたキーワードを使って、補助キーワードを改良する本実施形態2の機能構成を示すブロック図である。同図において、実施形態2の機能構成は、ユーザI/F手段10、キーワード抽出手段11、ユーザキーワード管理手段13、ユーザキーワードDB14、検索要求手段12、検索手段20、情報記憶手段21、結果通知手段22とを含んでなっている。ここで、実施形態1と同じ機能については同じ符号を付してあり、以下、相違点についてのみ説明する。
【0068】
ユーザキーワードDB14は、ユーザが閲覧した文書から抽出したキーワードの使用履歴を保持するデータファイルであり、キーワードごとに、キーワードと評価点の累計またはキーワードの出現回数の累計とを維持管理している。
【0069】
ユーザキーワード管理手段13は、ユーザキーワードDB14に登録されたキーワードに対応した評価点(または出現回数)を取り出し、このキーワードの評価点を大きい順に整列させ、評価点の大きいキーワードを所定の数(例えば、3個程度)取り出して補助キーワードとする。
【0070】
次に、ユーザキーワード管理手段13は、ユーザキーワードDB14を参照して、キーワード抽出手段11から渡されたキーワードが存在しない場合には、このキーワードを新規登録する。新規登録する場合、キーワードに評価点が付加していれば、この評価点を初期値として設定する。評価点が付加されていない場合には、出現回数として「1」を設定する。
【0071】
また、ユーザキーワード管理手段13は、キーワード抽出手段11から渡されたキーワードがユーザキーワードDB14に存在する場合には、キーワードに評価点が付加していれば、同じキーワードに評価点を加算して、ユーザキーワードDB14を更新する。キーワードに評価点が付加されていないときには、出現回数を1つカウントアップして、ユーザキーワードDB14を更新する。
【0072】
ここで、補助キーワードを検索要求手段12へ渡した後に、ユーザキーワードDB14を更新するようにしたのは、今回の閲覧文書から抽出したキーワードによる評価点や出現回数への影響をなくし、これまでの履歴情報によって補助キーワードを決定することにある。
【0073】
また、ユーザキーワードDB14は、過去に頻繁に利用されたキーワードであっても、最近頻繁に利用されない場合には、補助キーワードとして選択されないように例えば毎月一回程度の保守が行われる。この場合は、ユーザキーワードDB14の各キーワードに評価点の更新最終日時を保持しておき、この更新最終日時と現在の日時との間隔が増大するとともに評価点を減少させるように保守する。
【0074】
さらに、キーワードの更新だけでなく、このキーワードの類似語に対しても評価点を加算するようにしても良い。このときの類似語に対する評価点は、例えば、キーワードの評価点に重み付けを行って累算するようにしても良い。
【0075】
また、ユーザキーワードDB14に累積するキーワードは、閲覧文書から抽出したキーワードだけでなく、入力キーワードをも登録するようにしても良い。しかし、閲覧文書から抽出したキーワードには入力キーワードが含まれることが多いため、入力キーワードを登録することによるメリットは少ないが、入力キーワードと閲覧文書から抽出したキーワードで評価点の累算に重み付けを行うときには、この方式は有用である。
【0076】
次に、図5のフローチャートを用いて、本実施形態2の処理手順を説明する。
ユーザが文書を閲覧中にキーワードを入力し(ステップS20)、検索サービスの選択を行う(ステップS21)。ここで、キーワードの入力は、キーワード入力のためのダイアログから入力するようにしても良いし、または、閲覧文書中の語を選択するようにしても良い。
【0077】
閲覧文書からキーワードを抽出する(ステップS22)。キーワードの抽出は、まず、キーワードを抽出する範囲を、閲覧文書中の選択した入力キーワードの近傍範囲、ウィンドウに表示された範囲内、あるいは閲覧文書全体を対象とし、形態素解析によって、品詞付きの単語列に分割する。次に、分割された単語列を、基本キーワードDB113を参照して、各単語の重要度を取り出し、重要度を大きい順に整列させる。この整列された重要度の大きい方から所定の数(例えば、3個程度)の単語を取り出してキーワードとする。
【0078】
ユーザキーワードDB14に登録されたキーワードに対応した評価点(または出現回数)を取り出し、このキーワードの評価点を大きい順に整列させ、評価点の大きいキーワードを所定の数(例えば、3個程度)取り出して補助キーワードとする(ステップS23)。
【0079】
抽出されたキーワードを用いてユーザキーワードDB14を更新する(ステップS24)。
抽出されたキーワードがユーザキーワードDB14に存在しない場合には、このキーワードを新規登録する。新規登録する場合、キーワードに評価点が付加していれば、この評価点を初期値として設定する。評価点が付加されていない場合には、出現回数として「1」を設定する。
また、抽出されたキーワードがユーザキーワードDB14に存在する場合には、キーワードに評価点が付加していれば、同じキーワードに評価点を加算して、ユーザキーワードDB14を更新する。キーワードに評価点が付加されていないときには、出現回数を1つカウントアップして、ユーザキーワードDB14を更新する。
さらに、キーワードの更新だけでなく、このキーワードの類似語に対しても評価点を加算するようにしても良い。このときの類似語に対する評価点は、例えば、キーワードの評価点に重み付けを行って累算するようにしても良い。
【0080】
次に、入力キーワードと補助キーワードのAND検索によって、Web文書あるいはアプリケーションで作成された文書からなる複数の文書ファイルを検索する(ステップS25)。
このAND検索では、通常、補助キーワードより入力キーワードを重視した検索を行うが、評価点を属性情報として付加された補助キーワードの場合には、この評価点を重み付けに反映した検索を行う。
【0081】
検索結果の各文書に対して、タイトル、アブストラクトやこの文書の存在する場所や関連文書の存在場所を示すURL等の属性情報が付加されたWebページを作成し、表示装置や出力装置等へ表示/出力する(ステップS26)。この表示順は、入力キーワード、補助キーワード等の検索条件からユーザが欲している情報としてのランキング順としてもよい。
【0082】
以上の構成により、ユーザの入力したキーワードに加えて、閲覧している文書の内容を用いるようにしたことにより、1個の入力キーワードでもユーザの意図した検索結果を得ることができる。
【0083】
<実施形態3>
上述の実施形態2のようにユーザキーワードDB14を使用することの問題は、個人が仕事と趣味のように複数の独立した関心を持つ場合に、それを一つのユーザ関心情報として扱うことは好ましくない。
例えば、仕事の関心事としてIT関連、社会的関心事として福祉やNGO活動、趣味の関心事として音楽と美術と料理がある場合に、一つの均質なユーザキーワードDB14を用いると高い検索精度が得られない。
これを解決する次のような3つの方法がある。
【0084】
第1の方法は、関心情報を分類して、ユーザが検索するたびに今の関心事はどの分類であるかを入力する方法であるが、ユーザの負担が大きく、本発明の目的である「ユーザが1個のキーワードを指定して精度のよい検索を行う」に合致しない。
【0085】
第2の方法は、まず、閲覧文書の分類を自動的に決定しておき、この分類と同じ分類をもつキーワードのうち評価点の大きいものをユーザキーワードDB14から取り出す。次に、閲覧文書から抽出したキーワードを、この閲覧文書の分類によってユーザキーワードDB14を更新する。
この方法は、実施形態2のユーザキーワード管理手段13およびユーザキーワードDB14とを上述の機能に置き換えることによって実現できる。
【0086】
第3の方法は、本実施形態3に関する方法であり、ユーザキーワードDB14の代わりに、共起出現率ユーザキーワードDB15を用いる方法である。
図6は、キーワード抽出手段11から抽出されたキーワードを使って、補助キーワードを改良する本実施形態3の機能構成を示すブロック図である。同図において、実施形態3の機能構成は、ユーザI/F手段10、キーワード抽出手段11、ユーザキーワード管理手段13、共起出現率ユーザキーワードDB15、検索要求手段12、検索手段20、情報記憶手段21、結果通知手段22とを含んでなっている。ここで、実施形態1および実施形態2と同じ機能については同じ符号を付してあり、以下、相違点についてのみ説明する。
【0087】
本発明では、ユーザが入力したキーワードに対して、閲覧文書中に出現するキーワードを「入力キーワードに対して共起する抽出キーワード」と定義し、このような共起関係の強さを表すために、共起出現評価点あるいは同時に出現した回数(以下、共起出現回数という)を用いる。
本実施形態3では、共起関係にあるキーワードと共起出現評価点あるいは共起出現回数を、図7に例示した共起出現率ユーザキーワードDB15に記録していく。
図7において、列方向のキーワードは入力キーワードを示し、行方向のキーワードは閲覧文書から抽出されたキーワードを示し、列方向と行方向とのキーワードが共起して出現することを表している。列方向と行方向のキーワードで指定されるセルには、列方向の入力キーワードが指定されたときに、閲覧していた文書から抽出したときのキーワードの共起出現評価点あるいは共起出現回数を累積して設定される。
【0088】
ユーザキーワード管理手段13は、共起出現率ユーザキーワードDB15を参照して、入力キーワードと共起して出現するキーワードの共起出現評価点あるいは共起出現回数を取り出し、取り出した共起出現評価点あるいは共起出現回数を大きい順に整列させ、大きい方から所定の数(例えば、3個程度)のキーワードを取り出して補助キーワードとする。
【0089】
次に、ユーザキーワード管理手段13は、共起出現率ユーザキーワードDB15を参照して、入力キーワードおよび抽出されたキーワードに対する項目が登録されていない場合には、登録されていないキーワードを新規登録する。新規登録する場合、抽出されたキーワードに評価点が付加していれば、この評価点を共起出現評価点の初期値として設定する。評価点が付加されていない場合には、共起出現回数として「1」を設定する。
【0090】
また、ユーザキーワード管理手段13は、共起出現率ユーザキーワードDB15を参照して、入力キーワードおよび抽出されたキーワードが存在する場合には、抽出されたキーワードに評価点が付加していれば、評価点を加算して、共起出現率ユーザキーワードDB15を更新する。抽出されたキーワードに評価点が付加されていないときには、出現回数を1つカウントアップして、共起出現率ユーザキーワードDB15を更新する。
【0091】
ここで、補助キーワードを検索要求手段12へ渡した後に、共起出現率ユーザキーワードDB15を更新するようにしたのは、今回の閲覧文書から抽出したキーワードによる評価点や出現回数への影響をなくし、これまでの履歴情報によって補助キーワードを決定することにある。
【0092】
また、共起出現率ユーザキーワードDB15は、過去に頻繁に利用されたキーワードであっても、最近頻繁に利用されない場合には、補助キーワードとして選択されないように、例えば毎月一回程度の保守を行う。この場合は、共起出現率ユーザキーワードDB15の各キーワードに評価点の更新最終日時を保持しておき、この更新最終日時と現在の日時との間隔が増大するとともに評価点を減少させるように保守する。
【0093】
さらに、抽出されたキーワードの更新だけでなく、このキーワードの類似語に対しても評価点を加算するようにしても良い。このときの類似語に対する評価点は、例えば、キーワードの評価点に重み付けを行って累算するようにしても良い。
【0094】
次に、図8のフローチャートを用いて、本実施形態3の処理手順を説明する。
ユーザが文書を閲覧中にキーワードを入力し(ステップS30)、検索サービスの選択を行う(ステップS31)。ここで、キーワードの入力は、キーワード入力のためのダイアログから入力するようにしても良いし、または、閲覧文書中の語を選択するようにしても良い。
【0095】
閲覧文書からキーワードを抽出する(ステップS32)。キーワードの抽出は、まず、キーワードを抽出する範囲を、閲覧文書中の選択した入力キーワードの近傍範囲、ウィンドウに表示された範囲内、あるいは閲覧文書全体を対象とし、形態素解析によって、品詞付きの単語列に分割する。次に、分割された単語列を、基本キーワードDB113を参照して、各単語の重要度を取り出し、重要度を大きい順に整列させる。この整列された重要度の大きい方から所定の数(例えば、3個程度)の単語を取り出してキーワードとする。
【0096】
共起出現率ユーザキーワードDB15を参照して、入力キーワードと共起して出現するキーワードの共起出現評価点あるいは共起出現回数を取り出し、取り出した共起出現評価点あるいは共起出現回数を大きい順に整列させ、大きい方から所定の数(例えば、3個程度)のキーワードを取り出して補助キーワードとする(ステップS33)。
【0097】
入力キーワードと抽出されたキーワードを用いて共起出現率ユーザキーワードDB15を更新する(ステップS34)。
共起出現率ユーザキーワードDB15を参照して、入力キーワードおよび抽出されたキーワードに対する項目が登録されていない場合には、登録されていないキーワードを新規登録する。新規登録する場合、抽出されたキーワードに評価点が付加していれば、この評価点を共起出現評価点の初期値として設定する。評価点が付加されていない場合には、共起出現回数として「1」を設定する。
【0098】
また、共起出現率ユーザキーワードDB15を参照して、入力キーワードおよび抽出されたキーワードが存在する場合には、抽出されたキーワードに評価点が付加していれば、評価点を加算して、共起出現率ユーザキーワードDB15を更新する。抽出されたキーワードに評価点が付加されていないときには、出現回数を1つカウントアップして、共起出現率ユーザキーワードDB15を更新する。
【0099】
さらに、抽出されたキーワードの更新だけでなく、このキーワードの類似語に対しても評価点を加算するようにしても良い。このときの類似語に対する評価点は、例えば、キーワードの評価点に重み付けを行って累算するようにしても良い。
【0100】
次に、入力キーワードと補助キーワードのAND検索によって、Web文書あるいはアプリケーションで作成された文書からなる複数の文書ファイルを検索する(ステップS35)。このAND検索では、通常、補助キーワードより入力キーワードを重視した検索を行うが、評価点を属性情報として付加された補助キーワードの場合には、この評価点を重み付けに反映した検索を行う。
【0101】
検索結果の各文書に対して、タイトル、アブストラクトやこの文書の存在する場所や関連文書の存在場所を示すURL等の属性情報が付加されたWebページを作成し、表示装置や出力装置等へ表示/出力する(ステップS36)。この表示順は、入力キーワード、補助キーワード等の検索条件からユーザが欲している情報としてのランキング順としてもよい。
【0102】
以上の構成により、ユーザの入力したキーワードに加えて、閲覧している文書の内容を用いるようにしたことにより、1個の入力キーワードでもユーザの意図した検索結果を得ることができる。
【0103】
<実施形態4>
上述の各実施形態では、キーワード抽出手段を必須の構成要素としてきたが、ユーザキーワードDBを用いる場合には入力キーワードのみを用いた更新であってもコンテクスト情報として有効である。
本実施形態4は、上記実施形態2においてキーワード抽出手段11を省いた構成を考える。
【0104】
図9は、本実施形態4の機能構成を示すブロック図である。同図において、実施形態4の機能構成は、ユーザI/F手段10、ユーザキーワード管理手段13、ユーザキーワードDB14、検索要求手段12、検索手段20、情報記憶手段21、結果通知手段22とを含んでなっている。ここで、実施形態2と同じ機能については同じ符号を付してあり、以下、相違点についてのみ説明する。
【0105】
ユーザI/F手段10は、ユーザからキーワードの入力と検索指示が入力されると、ユーザキーワード管理手段13へ入力キーワードを付加した検索要求を渡す。
ユーザキーワードDB14は、ユーザが入力したキーワードの使用履歴を保持するデータファイルであり、入力キーワードごとに、キーワードと指定回数の累計とを維持管理している。
ユーザキーワード管理手段13は、ユーザキーワードDB14から取り出したキーワードの指定回数を大きい順に整列させ、大きい方から所定の数(例えば、3個程度)のキーワードを取り出して補助キーワードとする。
【0106】
次に、ユーザキーワード管理手段13は、ユーザキーワードDB14を参照して、入力キーワードが存在しない場合には、この入力キーワードを新規登録する。新規登録する場合、指定回数の累積値として「1」を設定する。
また、ユーザキーワード管理手段13は、入力キーワードがユーザキーワードDB14に存在する場合には、使用回数を1つカウントアップして、ユーザキーワードDB14を更新する。
【0107】
ここで、補助キーワードを検索要求手段12へ渡した後に、ユーザキーワードDB14を更新するようにしたのは、今回の閲覧文書から抽出したキーワードによる評価点や出現回数への影響をなくし、これまでの履歴情報によって補助キーワードを決定することにある。
【0108】
また、ユーザキーワードDB14は、過去に頻繁に利用されたキーワードであっても、最近頻繁に利用されない場合には、補助キーワードとして選択されないように例えば毎月一回程度の保守が行われる。この場合は、ユーザキーワードDB14の各キーワードに使用回数の累積値の更新最終日時を保持しておき、この更新最終日時と現在の日時との間隔が増大するとともに評価点を減少させるように保守する。
【0109】
さらに、キーワードの更新だけでなく、このキーワードの類似語に対しても評価点を加算するようにしても良い。このときの類似語に対する評価点は、例えば、キーワードの使用回数に重み付けを行って累算するようにしても良い。
【0110】
次に、図10のフローチャートを用いて、本実施形態4の処理手順を説明する。
ユーザが文書を閲覧中にキーワードを入力し(ステップS40)、検索サービスの選択を行う(ステップS41)。ここで、キーワードの入力は、キーワード入力のためのダイアログから入力するようにしても良いし、または、閲覧文書中の語を選択するようにしても良い。
【0111】
ユーザキーワードDB14から取り出したキーワードの指定回数を大きい順に整列させ、大きい方から所定の数(例えば、3個程度)のキーワードを取り出して補助キーワードとする(ステップS42)。
【0112】
入力キーワードを用いてユーザキーワードDB14を更新する(ステップS43)。
入力キーワードがユーザキーワードDB14に存在しない場合には、この入力キーワードを新規登録する。新規登録する場合、使用回数の累積値の初期値として「1」を設定する。また、入力キーワードがユーザキーワードDB14に存在する場合には、使用回数を1つカウントアップして、ユーザキーワードDB14を更新する。
さらに、キーワードの更新だけでなく、この入力キーワードの類似語に対しても評価点を加算するようにしても良い。このときの類似語に対する評価点は、例えば、キーワードの使用回数に重み付けを行って累算するようにしても良い。
【0113】
次に、入力キーワードと補助キーワードのAND検索によって、Web文書あるいはアプリケーションで作成された文書からなる複数の文書ファイルを検索する(ステップS44)。このAND検索では、通常、補助キーワードより入力キーワードを重視した検索を行うが、評価点を属性情報として付加された補助キーワードの場合には、この評価点を重み付けに反映した検索を行う。
【0114】
検索結果の各文書に対して、タイトル、アブストラクトやこの文書の存在する場所や関連文書の存在場所を示すURL等の属性情報が付加されたWebページを作成し、表示装置や出力装置等へ表示/出力する(ステップS45)。この表示順は、入力キーワード、補助キーワード等の検索条件からユーザが欲している情報としてのランキング順としてもよい。
【0115】
以上の構成により、ユーザの入力したキーワードに加えて、閲覧している文書の内容を用いるようにしたことにより、1個の入力キーワードでもユーザの意図した検索結果を得ることができる。
【0116】
(B)広告型検索システム:
以下の説明では、広告型検索システムの例として、ユーザの指定した1個のキーワードに関連した文書を検索し、検索結果をユーザに提供するという快適な操作環境を提供する見返りとして、ユーザの関心事により近い広告情報を提供し、より高いクリック率を実現する広告検索サービスについて説明する。この情報検索サービスとしては、上述した情報検索システムをもとにして説明するが、ユーザの入力したキーワードや閲覧した文書から取り出した補助キーワードをもとに広告型検索サービスだけを行う構成としてもよい。
また、本発明の広告型検索システムは、情報検索サービスを対象とした広告型検索サービスに限らず、辞書サービスや翻訳サービス等を対象とした広告型検索サービスにも容易に適用することができる。
【0117】
<実施形態5>
図11は、本発明の実施形態5に係る広告型検索システムの機能構成を示すブロック図であり、同図において、広告型検索システムは、ユーザインタフェース(以下、ユーザI/Fと記す)手段10、キーワード抽出手段11、検索要求手段12、検索手段20、情報記憶手段21、結果通知手段22、広告検索手段30、広告情報記憶手段31とを含んでなっている。ここで、実施形態1と同じ機能については同じ符号を付してあり、以下、相違点についてのみ説明する。
【0118】
検索要求手段12は、キーワード抽出手段11で抽出した補助キーワードとユーザが入力した入力キーワードを付加した検索要求を検索手段20と広告検索手段30へ渡す。
広告検索手段30は、検索要求手段12から渡された入力キーワードと補助キーワードのAND検索によって広告情報記憶手段31を検索し、その検索された広告の広告コンテンツを結果通知手段22へ渡す。ここで、広告情報記憶手段31は、予め広告主から提供された広告コンテンツおよびこの広告を検索するためのキーワードからなる広告情報を複数記憶した少なくとも一つの広告コンテンツデータベースまたはファイルである。
【0119】
このAND検索では、通常、補助キーワードより入力キーワードを重視した検索を行うが、評価点を属性情報として付加された補助キーワードの場合には、この評価点を重み付けに反映した検索を行う。また、広告検索手段30では、入力キーワードと補助キーワードの重み付けを検索手段20とは異なるようにしても良い。
【0120】
結果通知手段22は、検索手段20から渡された検索結果と広告検索手段30から渡された検索結果の広告コンテンツを次のいずれかの表示方式で変換して、ユーザI/F手段10に渡す。
【0121】
(1)第1の表示方式:
タブブラウザのように複数のページを切替えて表示可能な場合、検索手段20から渡された検索結果に対しては、検索された文書ごとに、タイトル、アブストラクトやこの文書の存在する場所や関連文書の存在場所を示すURL等の属性情報が付加されたリストとして直接表示するWebページを作成する。
また、広告検索手段30から渡された検索結果の広告コンテンツに対しては、広告コンテンツ用のダイアログに表示する指示をユーザI/F手段10へ出す(図12参照)。
(2)第2の表示方式:
通常のブラウザで表示可能なように、検索手段20から渡された検索結果に対しては、検索された文書ごとに、タイトル、アブストラクトやこの文書の存在する場所や関連文書の存在場所を示すURL等の属性情報が付加されたリストとしたWebページを作成し、広告検索手段30から渡された検索結果の広告コンテンツに対しては、広告コンテンツがこのWebページで表示されるようにしたWebページを作成する。
【0122】
次に、図13のフローチャートを用いて、本実施形態5の処理手順を説明する。
ユーザが文書を閲覧中にキーワードを入力し(ステップS50)、検索サービスの選択を行う(ステップS51)。ここで、キーワードの入力は、キーワード入力のためのダイアログから入力するようにしても良いし、または、閲覧文書中の語を選択するようにしても良い。
【0123】
閲覧文書からキーワードを抽出し、このキーワードを補助キーワードとする(ステップS52)。キーワードの抽出は、まず、キーワードを抽出する範囲を、閲覧文書中の選択した入力キーワードの近傍範囲、ウィンドウに表示された範囲内、あるいは閲覧文書全体を対象とし、形態素解析によって、品詞付きの単語列に分割する。次に、分割された単語列の各単語の重要度を大きい順に整列させる。この整列された重要度の大きい方から所定の数(例えば、3個程度)の単語を取り出して補助キーワードとする。
【0124】
入力キーワードと補助キーワードのAND検索によって、Web文書あるいはアプリケーションで作成された文書からなる複数の文書ファイルを検索する(ステップS53)。
このAND検索では、通常、補助キーワードより入力キーワードを重視した検索を行うが、評価点を属性情報として付加された補助キーワードの場合には、この評価点を重み付けに反映した検索を行う。
【0125】
また、入力キーワードと補助キーワードのAND検索によって、広告主から提供された広告コンテンツを検索する(ステップS54)。
このAND検索では、通常、補助キーワードより入力キーワードを重視した検索を行うが、評価点を属性情報として付加された補助キーワードの場合には、この評価点を重み付けに反映した検索を行う。この広告検索では、入力キーワードと補助キーワードの重み付けを情報検索とは異なるようにしても良い。
【0126】
検索結果の各文書に対して、タイトル、アブストラクトやこの文書の存在する場所や関連文書の存在場所を示すURL等の属性情報が付加されたWebページを作成し、表示装置や出力装置等へ表示/出力するとともに、検索された広告コンテンツは広告コンテンツ用のダイアログ画面に表示する(ステップS55)。この表示順は、入力キーワード、補助キーワード等の検索条件からユーザが欲している情報としてのランキング順としてもよい。
【0127】
以上の構成により、ユーザが1個のキーワードを入力したときにユーザの関心事に、より合致した広告を提供できるので、広告コンテンツのクリック率を向上させることができる。
【0128】
<実施形態6>
ところで、広告型検索サービスの一つの課題として、検索結果の公平性が問われる場合がある。広告型検索サービスのクリック率が高いのは、入力キーワードすなわちユーザ関心情報に対応した広告コンテンツのみを表示できることによるが、従来の広告型検索システムにおいては、ユーザの指定した情報検索結果と広告に関する情報とが渾然として表示されており、ユーザは自分の欲している情報であるか広告であるのか区別がつきにくいという問題点があった。
【0129】
これを避けるために、本実施形態6の広告型検索システムでは、次のいずれかの方法でユーザの指定した情報検索結果と広告を分けて提示することによって、この公平性の問題を解決する。
【0130】
(1)第1の方法:
広告の検索には、補助キーワードのみで検索する方法である。この方法は、入力キーワードを使用していないと言う意味で論理的には公平であるが、入力キーワードがユーザ閲覧文書において重要なキーワードである場合、補助キーワードに入力キーワードを含むことがあるため、第2の方法に比べて公平性は低い。
【0131】
(2)第2の方法:
広告の検索には、補助キーワードから入力キーワードを除外し、この補助キーワードのみで検索する方法である。この方法は、ユーザの直接関心のない情報に関する広告コンテンツを削除できるので、検索結果の十分な公平性を提供できる。
【0132】
本実施形態6の機能構成は、実施形態5と同様であるが、広告検索手段30を上述の2つのいずれかにより補助キーワードに補正を加えて検索を実施する点のみが相違する。
即ち、広告検索手段30は、検索要求手段12から入力キーワードと補助キーワードを渡されると、予め定められた上述2つの方法のいずれかによって補助キーワードを補正し、広告情報記憶手段31を参照して、この補正した補助キーワードのみのAND検索により広告コンテンツを取り出す。
【0133】
以上の構成により、検索結果から入力キーワードに関係する広告コンテンツを排除することができるので、入力キーワードがユーザ関心情報でない場合でも公平性を維持した広告を提供することができる。
【0134】
<実施形態5および6の変形例>
実施形態5および実施形態6の補助キーワードの取得方法は、実施形態1と同様に閲覧中の文書からキーワードを抽出して、補助キーワードとしていた。本変形例では、この補助キーワードの取得手段を、上記の実施形態2乃至実施形態4における補助キーワードの取得方法と置き換えて構成するようにしても良い。
このように置き換えた変形例では、よりユーザのユーザ関心事に合致した広告コンテンツを提供することができる。
【0135】
(C)サービスをユーザサイトとサービスサイトに分けた構成の実施例:
<実施形態7>
図14は、情報検索あるいは広告型検索サービスを提供するサービスサイトと、サービスを受けるユーザサイトによる本発明の実施形態の構成図である。この実施形態は、任意個のユーザサイト100、検索サービスを提供するサービスサイト200、ネットワーク300とで構成される。
【0136】
ユーザサイト100は、文書を閲覧中にキーワードを入力し、このキーワードに対するサービス提供業者から受けた情報を表示するための端末装置であり、パーソナルコンピュータやPDA(Personal Digital Assistant)等のいずれであってもよく、Webブラウザを実行可能な端末装置であればよい。
【0137】
サービスサイト200は、ユーザサイト100からのサービス要求に応じて、情報検索サービス・辞書サービス・翻訳サービスを提供したり、広告コンテンツの提供を行うためのコンピュータシステムである。以下の説明では、サービスサイト200では、同一サービス提供者が情報検索サービスと広告型検索サービスの2つのサービスを行うように説明するが、同様に、別のサービス提供者がそれぞれのサービスサイトを有してそれぞれのサービスを提供できるように構成することもできる。
【0138】
これらのユーザサイト100とサービスサイト200は、それぞれネットワーク通信インタフェースを備えており、ネットワーク300を介して接続するようになっている。
このネットワーク300は、ユーザサイト100およびサービスサイト200を結合するための伝送路であって、それらの間の通信プロトコルが一致するものであれば無線および有線のいずれであってもよく、例えば、LAN(Local Area Network)やインターネットなどを用いることができる。
【0139】
次に、このようなユーザサイトとサービスサイトにおける機能分担について説明する。
以下の説明では、上記実施形態における各機能をユーザサイト100とサービスサイト200のいずれかで実施するものとするので、同じ機能の説明は省略し、追加機能および相違する機能についてだけ説明することにする。
【0140】
(1)実施形態1、5および6に対応した構成:
実施形態1のようなキーワード抽出手段で補助キーワードを選定する構成の場合には、図15に示すような構成となり、各サイトの動作は実施形態1、5および6に記述したものと同じである。
ユーザサイト100では、ユーザI/F手段10、キーワード抽出手段11、検索要求手段12とから構成される。
サービスサイト200では、情報検索サービスのみの提供の場合には、検索手段20、情報記憶手段21、結果通知手段22とから構成される。
また、情報検索サービスと広告型検索サービスをともに提供する場合には、検索手段20、情報記憶手段21、広告検索手段30、広告情報記憶手段31、結果通知手段22とから構成される。
【0141】
ただし、上記の検索要求手段12、ユーザI/F手段10、結果通知手段22、検索手段20、広告検索手段30は、それぞれネットワーク300を介して、通信相手に情報を提供する点が、上記実施形態1、5および6とは相違している。
【0142】
(2)実施形態2および3に対応した構成:
実施形態2のようなユーザキーワード管理手段で補助キーワードの選定を行う構成の場合には、図16に示すような構成となり、各サイトの動作は実施形態2に記述したものと同じである。
ユーザサイト100では、ユーザI/F手段10、キーワード抽出手段11、ユーザキーワード管理手段13、ユーザキーワードDB14、検索要求手段12とから構成される。
サービスサイト200では、情報検索サービスのみの提供の場合には、検索手段20、情報記憶手段21、結果通知手段22とから構成される。
また、情報検索サービスと広告型検索サービスをともに提供する場合には、検索手段20、情報記憶手段21、広告検索手段30、広告情報記憶手段31、結果通知手段22とから構成される。
【0143】
ただし、上記の検索要求手段12、ユーザI/F手段10、結果通知手段22、検索手段20、広告検索手段30は、それぞれネットワーク300を介して、通信相手に情報を提供する点が、上記実施形態2とは相違している。
【0144】
さらに、実施形態2のようなユーザキーワード管理手段で補助キーワードを選定する構成の場合には、図17に示すような構成もとり得る。
ユーザサイト100では、ユーザI/F手段10、キーワード抽出手段11、キーワード転送手段16とから構成される。
このキーワード転送手段16は、ユーザI/F手段10で入力されたキーワードを、サービスサイト200のユーザキーワード管理手段13へネットワーク300を介して転送する。
【0145】
サービスサイト200では、情報検索サービスのみの提供の場合には、ユーザキーワード管理手段13、ユーザキーワードDB14、検索要求手段12、検索手段20、情報記憶手段21、結果通知手段22とから構成される。
また、情報検索サービスと広告型検索サービスをともに提供する場合には、ユーザキーワード管理手段13、ユーザキーワードDB14、検索要求手段12、検索手段20、情報記憶手段21、広告検索手段30、広告情報記憶手段31、結果通知手段22とから構成される。
【0146】
また、上記の検索要求手段12、ユーザI/F手段10、結果通知手段22は、それぞれネットワーク300を介して、通信相手に情報を提供する点が、上記実施形態2とは相違している。
【0147】
さらに、上記の図16および図17のユーザキーワード管理手段13およびユーザキーワードDB14を実施形態3のユーザキーワード管理手段13および共起出現率ユーザキーワードDB15に交換した構成としてもよい。
【0148】
(3)実施形態4に対応した構成:
実施形態4のような入力キーワードを使ってユーザキーワード管理手段で補助キーワードを選定する構成の場合には、図18に示すような構成となり、各サイトの動作は実施形態4に記述したものと同じである。
ユーザサイト100では、ユーザI/F手段10、ユーザキーワード管理手段13、ユーザキーワードDB14、検索要求手段12とから構成される。
サービスサイト200では、情報検索サービスのみの提供の場合には、検索手段20、情報記憶手段21、結果通知手段22とから構成される。
また、情報検索サービスと広告型検索サービスをともに提供する場合には、検索手段20、情報記憶手段21、広告検索手段30、広告情報記憶手段31、結果通知手段22とから構成される。
【0149】
ただし、上記の検索要求手段12、ユーザI/F手段10、結果通知手段22、検索手段20、広告検索手段30は、それぞれネットワーク300を介して、通信相手に情報を提供する点が、上記実施形態4とは相違している。
【0150】
さらに、実施形態4のような入力キーワードを使ってユーザキーワード管理手段で補助キーワードを選定する構成の場合には、図19に示すような構成もとり得る。
ユーザサイト100では、ユーザI/F手段10、キーワード抽出手段11、キーワード転送手段16とから構成される。このキーワード転送手段16は、ユーザI/F手段10で入力されたキーワードを、サービスサイト200のユーザキーワード管理手段13へネットワーク300を介して転送する。
【0151】
サービスサイト200では、情報検索サービスのみの提供の場合には、ユーザキーワード管理手段13、ユーザキーワードDB14、検索要求手段12、検索手段20、情報記憶手段21、結果通知手段22とから構成される。
また、情報検索サービスと広告型検索サービスをともに提供する場合には、ユーザキーワード管理手段13、ユーザキーワードDB14、検索要求手段12、検索手段20、情報記憶手段21、広告検索手段30、広告情報記憶手段31、結果通知手段22とから構成される。
上記のキーワード転送手段16、ユーザI/F手段10、結果通知手段22は、それぞれネットワーク300を介して、通信相手に情報を提供する点が、上記実施形態4とは相違している。
【0152】
上記実施形態1乃至6における各機能を本実施形態7の、ユーザサイトとサービスサイトのような構成にすることにより、以下のような効果を提供できる。
従来の検索システムでは、ユーザの入力したキーワードに関連した広告を提示することにより高いクリック率を実現しているが、この高いクリック率を実現するには、入力キーワード以外にユーザ関心情報を取得することが効果的である。しかし、ユーザ関心情報はユーザプライバシに関わる情報であり、ユーザにとってのメリットがなければその取得を許諾してもらいにくい。
さらに、ユーザが閲覧している文書のURLを取得するサーチエンジン方式では、ユーザがどの文書を閲覧したかの情報が取得され、しかもURLによりその文書のすべての情報が取得できるのでプライバシへの損害を与える可能性が高い。
【0153】
しかし、本実施形態7のように、ユーザサイト100からサービスサイト200へ渡されるのは、入力されたキーワードおよびユーザの閲覧した文書にから抽出したキーワード等のコンテキスト情報の取得に限定されるので、そのようなキーワードからユーザが閲覧していた文書を特定することは困難であり、プライバシへの損害を与える可能性が低くなる。
【0154】
<実施形態8>
しかしながら、実施形態7のように構成しても、次のような問題点がある。
(1)サービスサイトへ転送されるのが補助キーワードだけであっても、サービスサイトでそれを蓄積してしまえば、ユーザのプライバシに問題が生じる可能性がある。
(2)サービスサイトでユーザキーワード管理手段によりユーザキーワードDBや共起出現率ユーザキーワードDBを維持管理する場合には、サービス提供者がこれらのデータベースに任意の時にアクセス可能なので、ユーザ関心情報についての分析や多くのユーザを対象とした統計処理が可能となってくる。したがって、サービス提供者はこの分析結果に基づいて検索精度や広告コンテンツクリック率の更なる向上が実現できるが、ユーザ関心情報についての分析結果がユーザのプライバシに関わるものになる可能性があり、もし情報が流出した場合ユーザに被害を与える可能性がある。
【0155】
以上のような問題点に対して、上述した各実施形態において、入力キーワード以外の閲覧文書から抽出したキーワードや補助キーワードをサービスサイトへ渡す場合に、ユーザサイトでフィルタをかけるようにして、プライバシやセキュリティの情報を除外するようにした。
このフィルタをかける場所としては、次のような3つのパターンがある。
【0156】
(1)第1のパターン:
キーワード抽出手段11で閲覧文書から補助キーワードを抽出し、転送フィルタ手段17でこの補助キーワードをフィルタし、フィルタされた補助キーワードを検索要求手段12でサービスサイトの検索手段や広告検索手段へ渡すパターンである(図20参照)。
(2)第2のパターン:
キーワード抽出手段11で閲覧文書からキーワードを抽出し、転送フィルタ手段17でこのキーワードをフィルタし、フィルタされたキーワードを検索要求手段12でサービスサイトのユーザキーワード管理手段へ渡すパターンである(図21参照)。
【0157】
(3)第3のパターン:
ユーザキーワード管理手段13で得た補助キーワードに、転送フィルタ手段17でフィルタをかけ、このフィルタをかけられた補助キーワードを検索要求手段12でサービスサイトの検索手段や広告検索手段へ渡すパターンである(図22参照)。
このユーザキーワード管理手段が管理するデータベースは、ユーザキーワードDBであっても共起出現率ユーザキーワードDBに対しても適用可能である。
【0158】
次に、転送フィルタ手段17の機能について詳細に説明する。
【0159】
(1)ユーザに確認する方法:
第1のパターンの場合には、キーワード抽出手段11で閲覧文書から抽出された補助キーワードを対象とし、例えば、図23に例示したようなダイアログにて、この補助キーワードの一覧をユーザに提示する。
ユーザは、表示された補助キーワードの一覧から転送を禁止したい補助キーワードを選択して、削除ボタンをクリックする。転送を禁止したい補助キーワードがなくなった時点で、転送ボタンをクリックする。
転送フィルタ手段17は、転送ボタンをクリックしたときに残っていた補助キーワード(転送を許可された補助キーワード)を、検索要求手段12を介してサービスサイトの検索手段や広告検索手段へ渡す。
【0160】
この方法によると、サービスサイトに送信するキーワードを予め確認することができ、問題のある場合には特定のキーワードを削除することができる。
しかし、この方法では、ユーザは毎回転送可否の判断をしなければならないが、転送禁止の確率の小さい場合や転送フィルタ手段17に渡される補助キーワードの数が少ない場合には有効である。
【0161】
同様に、第2のパターンの場合には、キーワード抽出手段11で閲覧文書から抽出されたキーワードを対象とし、転送禁止キーワードを削除して、残ったキーワードをキーワード転送手段16を介してサービスサイトのユーザキーワード管理手段へ渡す。
また、第3のパターンのときには、ユーザキーワード管理手段13で選定された補助キーワードを対象とし、転送禁止キーワードを削除して、残った補助キーワードを検索要求手段12を介してサービスサイトの検索手段や広告検索手段へ渡す。
【0162】
この方法は、以下に説明する(2)および(3)の方法と組み合わせると、自動的に転送否または転送可と決定されたキーワードでもユーザの判断で転送可または転送否とすることができる。
【0163】
(2)キーワードに対する転送可否テーブルを参照する方法:
まず、開発コードネーム等の社外秘のキーワードは転送禁止のキーワードとして予めワードテーブルに記憶させておく。
この登録の場合には、ユーザの要求に応じてワードテーブルのキーワードの状態を一覧表示する(図24参照)。キーワードの種類には、セキュリティポリシにより組織で共通に設定され一般ユーザには編集できない「共通」と、一般ユーザが設定できる「ユーザ設定」とがある。
ユーザは、その権限に応じて、転送禁止のキーワードの追加・削除・編集を行ってワードテーブルを更新する。
上記のワードテーブルは、転送禁止のキーワードを記憶させるようにしたが、転送許可のキーワードのみを記憶させるようにしてもよいし、あるいは、登録してあるキーワードに対して転送の可否の区別を対応させて記憶させるようにしてもよい。
【0164】
第1のパターンの場合には、キーワード抽出手段11で閲覧文書から抽出された補助キーワードを対象とし、ワードテーブルに記憶されているキーワードと比較して転送可否を判断し、転送可の補助キーワードのみを、検索要求手段12を介してサービスサイトの検索手段や広告検索手段へ渡す。
この方法では、ユーザが閲覧した文書のキーワードに特定の語句(プロジェクト名等)が含まれないように自動的にフィルタをかけることができる。
【0165】
同様に、第2のパターンの場合には、キーワード抽出手段11で閲覧文書から抽出されたキーワードを対象とし、ワードテーブルに記憶されているキーワードと比較して転送可否を判断し、転送可のキーワードのみを、キーワード転送手段16を介してサービスサイトのユーザキーワード管理手段へ渡す。この場合、転送可のキーワードのみがユーザキーワードDBあるいは共起出現率ユーザキーワードDBに登録されることになる。
また、第3のパターンのときには、ユーザキーワード管理手段13で選定された補助キーワードを対象とし、ワードテーブルに記憶されているキーワードと比較して転送可否を判断し、転送可の補助キーワードを検索要求手段12を介してサービスサイトの検索手段や広告検索手段へ渡す。
【0166】
(3)文書IDに対する可否テーブルを参照する方法:
閲覧文書にはその文書に関わるすべての情報を送信禁止することが求められることがある。例えばプライベートなレターや企業のセキュリティに関わる機密文書等があり、そのような場合は文書単位で転送可否を扱う方が便利である。
このために、まず、転送禁止文書IDテーブルと転送禁止属性テーブルからなる文書IDテーブルを予めに記憶しておく。
【0167】
この登録には、図25に例示したダイアログを表示させ、サービスサイトへ転送対象となる文書名とその属性(属性としては、「通常」、「極秘」、「社外秘」等がある)を入力し、登録ボタンをクリックすると、転送禁止文書一覧へ登録される。属性が「通常」であっても、ここで登録された文書は、すべて自動的に転送禁止文書として扱われる。
また、転送禁止文書一覧に表示されている文書を転送可の文書に変更するときには、その文書を転送禁止文書一覧で選択し、「登録削除ボタン」で削除することができる。
文書IDテーブルに登録された文書は、図26に例示するように登録される。
【0168】
また、この文書IDテーブルは、転送可の文書IDのみを登録しておき、対象となる文書が文書IDテーブルに登録されていない場合には、転送禁止と判断するようにしてもよいし、あるいは、文書IDに対して転送の可否を登録するようにしてもよい。
【0169】
第1のパターンあるいは第2のパターンの場合、閲覧文書の属性情報を転送禁止属性テーブルで比較し、転送禁止属性として登録されていれば、抽出したキーワードの転送を行わない。しかし、閲覧文書の属性情報が転送禁止属性として登録されていないか、あるいは転送可属性として登録されていれば、次に閲覧文書IDを転送禁止文書IDテーブルで比較し、転送禁止文書として登録されていれば抽出したキーワードの転送を行わない。
この方法によると、文書IDテーブルを参照して閲覧対象の文書から抽出したキーワードの転送可否を自動的に決定することができる。
【0170】
さらに、検索指示が行われたときの閲覧文書に対して転送フィルタ手段を適用すれば、転送禁止の文書に対してキーワードを抽出する必要がなくなる。
【0171】
また、文書IDテーブルで閲覧文書を評価した結果をユーザに確認するようにしてもよい。例えば、図27に示したダイアログへ表示し、ユーザは表示されたコメントを参照して、不適切であれば転送可か転送禁止への変更ボタンをクリックし、確認ボタンをクリックする。転送可か転送禁止への変更があった場合は、文書IDテーブルに登録更新する。
【0172】
(4)(2)と(3)のフィルタとを組み合わせた場合:
第1の用例としては、(3)の方法で転送可の文書から抽出されたキーワードに対して、(2)のワードテーブルを適用して、転送禁止のキーワードを決定することができる。
第2の用例としては、逆に、(3)の方法で転送禁止の文書から抽出されたキーワードに対して、(2)のワードテーブルを適用して、転送可のキーワードを決定することができる。
この場合には、転送の可否が決定されたキーワードに対して、さらに個々のキーワードに転送の可否を決定できるので、プライバシの安全性がより強化される。
【0173】
(5)(2)と(1)のフィルタとを組み合わせた場合:
抽出されたキーワードに対して(2)のワードテーブルを適用して、転送可のキーワードと転送禁止のキーワードに分けする。これを例えば、図28のようなダイアログへそれぞれの一覧を表示する。ユーザは、表示された転送可あるいは転送禁止のキーワードが不適切であれば変更する。変更するときには、変更したいキーワードを選択し、転送可へのあるいは転送禁止への移動ボタンをクリックして移動を行う。変更が無くなれば、確認ボタンをクリックする。確認ボタンがクリックされると、転送可および転送禁止に設定されたキーワードをワードテーブルに登録更新する。
この場合には、一旦自動的に転送の可否が決定されたキーワードに対して、転送の可否を最終確認することができ、プライバシの安全性がより強化される。
【0174】
(6)(3)と(1)のフィルタとを組み合わせた場合:
抽出されたキーワードに対して(3)の文書IDテーブルを適用して、転送可のキーワードと転送禁止のキーワードに評価分けする。例えば、図27のようなダイアログへそれぞれの一覧を表示する。ユーザは、表示された転送可あるいは転送禁止のキーワードが不適切であれば変更する。変更するときには、変更したいキーワードを選択し、転送可へのあるいは転送禁止への移動ボタンをクリックして移動を行う。変更が無くなれば、確認ボタンをクリックする。
この場合には、一旦自動的に転送の可否が決定されたキーワードに対して、転送の可否を最終確認することができ、プライバシの安全性がより強化される。
【0175】
(7)(3)と(2)と(1)のフィルタとを組み合わせた場合:
閲覧文書から抽出されたキーワードとその転送可否を(3)の方法で決定し、それらのキーワードに対して(2)のワードテーブルを適用して、キーワードの転送可否を修正し、さらに、例えば、図27のようなダイアログへそれぞれのキーワード一覧を表示する。ユーザは、表示された転送可あるいは転送禁止のキーワードが不適切であれば変更する。変更するときには、変更したいキーワードを選択し、転送可へのあるいは転送禁止への移動ボタンをクリックして移動を行う。変更が無くなれば、確認ボタンをクリックする。
この場合には、一旦自動的に転送の可否が決定されたキーワードに対して、転送の可否を最終確認することができ、プライバシの安全性がより強化される。
【0176】
以上のように転送フィルタ手段を構成することにより、従来のURLを取得する方式においては取得するかしないかの選択しかできなかったが、本発明では多様なレベルのフィルタリングを行うことができる。
【0177】
<実施形態9>
本発明は、上述した実施形態のみに限定されたものではない。上述した実施形態を構成する各機能をそれぞれプログラム化して予め記録媒体に書き込んでおき、コンピュータにこの記録媒体を装着して、記録媒体からこれらのプログラムをコンピュータのメモリあるいは記憶装置に格納して実行することによって、本発明の目的が達成されることは言うまでもない。
この場合、記録媒体から読み出されたプログラム自体が上述した実施形態の機能を実現することになり、そのプログラムおよびそのプログラムを記録した記録媒体も本発明を構成することになる。
【0178】
なお、プログラムを格納する記録媒体としては半導体媒体(例えば、ROM、不揮発性メモリカード等)、光媒体(例えば、DVD、MO、MD、CD等)、磁気媒体(例えば、磁気テープ、フレキシブルディスク等)等のいずれであってもよい。
【0179】
また、ロードしたプログラムを実行することにより上述した実施形態の機能が実現されるだけでなく、そのプログラムの指示に基づき、オペレーティングシステムあるいは他のアプリケーションプログラム等と共同して処理することによって上述した実施形態の機能が実現される場合も含まれる。
【0180】
市場に流通させる場合には、可搬型の記録媒体にプログラムを格納して流通させたり、インターネット等の通信網を介して接続されたサーバコンピュータの記憶装置に格納しておき、通信網を通じて他のコンピュータに転送することもできる。この場合、このサーバコンピュータの記憶装置も本発明の記録媒体に含まれる。
なお、コンピュータでは、可搬型の記録媒体上のプログラム、または転送されてくるプログラムを、コンピュータに接続した記録媒体にインストールし、そのインストールされたプログラムを実行することによって上述した実施形態の機能が実現される。
【0181】
このように、上述した実施形態の機能をプログラム化して流通させることによって、コストの低廉化、および可搬性や汎用性を向上させることができる。
【図面の簡単な説明】
【0182】
【図1】本発明の実施形態1に係る情報検索システムの機能構成を示すブロック図である。
【図2】キーワード抽出手段の機能構成を示すブロック図である。
【図3】実施形態1の処理手順を説明するフローチャートである。
【図4】本発明の実施形態2に係る情報検索システムの機能構成を示すブロック図である。
【図5】実施形態2の処理手順を説明するフローチャートである。
【図6】本発明の実施形態3に係る情報検索システムの機能構成を示すブロック図である。
【図7】共起出現率ユーザキーワードDBのデータ構造例である。
【図8】実施形態3の処理手順を説明するフローチャートである。
【図9】本発明の実施形態4に係る情報検索システムの機能構成を示すブロック図である。
【図10】実施形態4の処理手順を説明するフローチャートである。
【図11】本発明の実施形態5に係る広告型検索システムの機能構成を示すブロック図である。
【図12】広告型検索の結果を表示する広告コンテンツ用のダイアログ例である。
【図13】実施形態5の処理手順を説明するフローチャートである。
【図14】情報検索あるいは広告型検索サービスを提供するサービスサイトと、サービスを受けるユーザサイトによる本発明の実施形態の構成図である。
【図15】キーワード抽出手段で補助キーワードを抽出するまでをユーザサイトで行い、その補助キーワードをサービスサイトへ転送する構成の広告型検索システムの機能構成を示すブロック図である。
【図16】閲覧文書から抽出したキーワードを使って、ユーザキーワード管理手段で補助キーワードを選択するまでをユーザサイトで行い、その補助キーワードをサービスサイトへ転送する構成の広告型検索システムの機能構成を示すブロック図である。
【図17】キーワード抽出手段でキーワードを抽出するまでをユーザサイトで行い、そのキーワードをサービスサイトのユーザキーワード管理手段へ転送する構成の広告型検索システムの機能構成を示すブロック図である。
【図18】入力キーワードを使って、ユーザキーワード管理手段で補助キーワードを選択するまでをユーザサイトで行い、その補助キーワードをサービスサイトへ転送する構成の広告型検索システムの機能構成を示すブロック図である。
【図19】キーワードの入力までをユーザサイトで行い、その入力キーワードをサービスサイトのユーザキーワード管理手段へ転送する構成の広告型検索システムの機能構成を示すブロック図である。
【図20】キーワード抽出手段で抽出したキーワードに対して転送フィルタ手段を適用し、そのフィルタリングされたキーワードをサービスサイトへ転送する場合の機能構成を示すブロック図である(第1のパターン)。
【図21】キーワード抽出手段で抽出したキーワードに対して転送フィルタ手段を適用し、そのフィルタリングされたキーワードをユーザキーワード管理手段へ転送する場合の機能構成を示すブロック図である(第2のパターン)。
【図22】ユーザキーワード管理手段で得た補助キーワードに対して転送フィルタ手段を適用し、そのフィルタリングされた補助キーワードをサービスサイトへ転送する場合の機能構成を示すブロック図である(第3のパターン)。
【図23】フィルタリング対象となるキーワードの一覧を表示し、転送可能かを確認するためのダイアログ例である。
【図24】ワードテーブルに登録されているキーワードの状態を一覧表示するダイアログ例である。
【図25】転送禁止文書を文書IDテーブルに登録するとき、あるいは編集するときのダイアログ例である。
【図26】文書IDテーブル(転送禁止文書IDテーブルおよび転送禁止属性テーブル)に登録された内容の表示例である。
【図27】閲覧文書を文書IDテーブルで転送可否を評価した結果を確認するときのダイアログ例である。
【図28】キーワードの転送可否を最終確認する時のダイアログ例である。
【符号の説明】
【0183】
10…ユーザインタフェース(I/F)手段、11…キーワード抽出手段、111…形態素解析手段、112…単語評価手段、113…基本キーワードDB、12…検索要求手段、13…ユーザキーワード管理手段、14…ユーザキーワードDB、15…共起出現率ユーザキーワードDB、16…キーワード転送手段、17…転送フィルタ手段、20…検索手段、21…情報記憶手段、22…結果通知手段、30…広告検索手段、31…広告情報記憶手段、100…ユーザサイト、200…サービスサイト、300…ネットワーク。
【特許請求の範囲】
【請求項1】
表示された文書や情報(以下、閲覧文書という)に関するキーワードを入力する入力手段と、前記閲覧文書からキーワードを抽出するキーワード抽出手段と、前記入力手段によって入力されたキーワード(以下、入力キーワードという)と前記キーワード抽出手段で抽出したキーワード(以下、補助キーワードという)に基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段と、前記検索手段で検索された検索結果の文書や情報を表示する表示手段を備えることを特徴とする情報検索システム。
【請求項2】
表示された文書や情報(以下、閲覧文書という)に関するキーワードを入力する入力手段と、前記閲覧文書からキーワードを抽出するキーワード抽出手段と、前記入力手段によって入力されたキーワード(以下、入力キーワードという)と前記キーワード抽出手段で抽出したキーワード(以下、補助キーワードという)に基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段と、前記入力キーワードと前記補助キーワードに基づいて、広告情報記憶手段に記憶された広告コンテンツを検索する広告検索手段と、前記検索手段で検索された検索結果の文書や情報、および前記広告検索手段で検索された広告コンテンツを表示する表示手段を備えることを特徴とする情報検索システム。
【請求項3】
請求項2に記載の情報検索システムにおいて、前記広告検索手段は、前記閲覧文書から抽出した補助キーワードのみ、または入力キーワードと重複するキーワードを除いた補助キーワードのみに基づいて検索するようにしたことを特徴とする情報検索システム。
【請求項4】
表示された文書や情報(以下、閲覧文書という)に関するキーワードを入力する入力手段と、前記閲覧文書からキーワードを抽出するキーワード抽出手段と、ユーザの関心情報であるキーワードとその出現頻度を保管するユーザキーワードDBと、前記ユーザキーワードDBの出現頻度の高いキーワードを選択して補助キーワードとして出力するとともに、前記キーワード抽出手段により抽出されたキーワードと前記入力手段によって入力されたキーワード(以下、入力キーワードという)に基づいて前記ユーザキーワードDBの更新を行うユーザキーワード管理手段と、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段と、前記検索手段で検索された検索結果の文書や情報を表示する表示手段を備えることを特徴とする情報検索システム。
【請求項5】
表示された文書や情報(以下、閲覧文書という)に関するキーワードを入力する入力手段と、前記閲覧文書からキーワードを抽出するキーワード抽出手段と、ユーザの関心情報であるキーワードとその出現頻度を保管するユーザキーワードDBと、前記ユーザキーワードDBの出現頻度の高いキーワードを選択して補助キーワードとして出力するとともに、前記キーワード抽出手段により抽出されたキーワードと前記入力手段によって入力されたキーワード(以下、入力キーワードという)に基づいて前記ユーザキーワードDBの更新を行うユーザキーワード管理手段と、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段と、前記入力キーワードと前記補助キーワードに基づいて、広告情報記憶手段に記憶された広告コンテンツを検索する広告検索手段と、前記検索手段で検索された検索結果の文書や情報、および前記広告検索手段で検索された広告コンテンツを表示する表示手段を備えることを特徴とする情報検索システム。
【請求項6】
表示された文書や情報に関するキーワードを入力する入力手段と、ユーザの関心情報であるキーワードとその出現頻度を保管するユーザキーワードDBと、前記ユーザキーワードDBの出現頻度の高いキーワードを選択して補助キーワードとして出力するとともに、前記入力手段によって入力されたキーワード(以下、入力キーワードという)に基づいて前記ユーザキーワードDBの更新を行うユーザキーワード管理手段と、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段と、前記検索手段で検索された検索結果の文書や情報を表示する表示手段を備えることを特徴とする情報検索システム。
【請求項7】
表示された文書や情報に関するキーワードを入力する入力手段と、ユーザの関心情報であるキーワードとその出現頻度を保管するユーザキーワードDBと、前記ユーザキーワードDBの出現頻度の高いキーワードを選択して補助キーワードとして出力するとともに、前記入力手段によって入力されたキーワード(以下、入力キーワードという)に基づいて前記ユーザキーワードDBの更新を行うユーザキーワード管理手段と、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段と、前記入力キーワードと前記補助キーワードに基づいて、広告情報記憶手段に記憶された広告コンテンツを検索する広告検索手段と、前記検索手段で検索された検索結果の文書や情報、および前記広告検索手段で検索された広告コンテンツを表示する表示手段を備えることを特徴とする情報検索システム。
【請求項8】
請求項4、5、6または7に記載の情報検索システムにおいて、前記ユーザキーワードDBは、共起出現率ユーザキーワードDBであって、前記ユーザキーワード管理手段は、前記入力キーワードと前記閲覧文書から抽出されたキーワードに基づいて共起出現率の高いキーワードを選択して補助キーワードとして出力するとともに、前記入力キーワードと前記閲覧文書から抽出されたキーワードに基づいて前記共起出現率ユーザキーワードDBを更新するようにした情報検索システム。
【請求項9】
請求項5または7に記載の情報検索システムにおいて、前記広告検索手段は、前記ユーザキーワード管理手段で選択された補助キーワードのみ、または入力キーワードと重複するキーワードを除いた補助キーワードのみに基づいて検索するようにしたことを特徴とする情報検索システム。
【請求項10】
情報検索の指示と検索結果を表示するユーザサイトと、情報検索サービスを提供するサービスサイトとをネットワークで接続した情報検索システムにおいて、請求項1乃至3のいずれかに記載の情報検索システムのうち、前記キーワード抽出手段を前記ユーザサイトに備え、前記キーワード抽出手段から抽出されたキーワードを補助キーワードとして前記サービスサイトへ転送することを特徴とする情報検索システム。
【請求項11】
情報検索の指示と検索結果を表示するユーザサイトと、情報検索サービスを提供するサービスサイトとをネットワークで接続した情報検索システムにおいて、請求項4乃至9のいずれかに記載の情報検索システムのうち、前記ユーザキーワードDBと前記ユーザキーワード管理手段を前記サービスサイトに備えることを特徴とする情報検索システム。
【請求項12】
情報検索の指示と検索結果を表示するユーザサイトと、情報検索サービスを提供するサービスサイトとをネットワークで接続した情報検索システムにおいて、請求項4乃至9のいずれかに記載の情報検索システムのうち、前記ユーザキーワードDBと前記ユーザキーワードDB管理手段を前記ユーザサイトに備えることを特徴とする情報検索システム。
【請求項13】
請求項10、11または12に記載の情報検索システムにおいて、文書や情報に対する転送可否を記憶した文書IDテーブルを参照して、ユーザの表示した文書や情報の転送可否を決定する転送フィルタ手段を前記ユーザサイトに備え、転送可の文書や情報から抽出したキーワードのみを前記サービスサイトへ転送するようにしたことを特徴とする情報検索システム。
【請求項14】
請求項13に記載の情報検索システムにおいて、前記転送フィルタ手段は、転送可否を決定した文書の転送許可確認を求めるとともに、転送可否状態で文書IDテーブルを更新することを特徴とする情報検索システム。
【請求項15】
請求項10乃至14のいずれかに記載の情報検索システムにおいて、キーワードの転送可否を記憶したワードテーブルを参照して、キーワードの転送可否を決定する転送フィルタ手段を前記ユーザサイトに備え、転送可のキーワードのみを前記サービスサイトへ転送するようにしたことを特徴とする情報検索システム。
【請求項16】
請求項15に記載の情報検索システムにおいて、前記転送フィルタ手段は、転送可否を決定したキーワードの転送許可確認を求めるとともに、転送可否状態でワードテーブルを更新することを特徴とする情報検索システム。
【請求項17】
請求項10乃至16のいずれかに記載の情報検索システムにおいて、転送しようとするキーワードあるいは文書IDの転送許可を求める転送フィルタ手段を前記ユーザサイトに備え、転送許可されたキーワードまたは文書IDで指示される文書から抽出されるキーワードを前記サービスサイトへ転送するようにしたことを特徴とする情報検索システム。
【請求項18】
ネットワークで接続したユーザ端末からの情報検索の指示で、情報検索を行って検索結果を返信する情報提供装置において、ユーザが閲覧中の文書や情報(以下、閲覧文書という)に関して入力したキーワード(以下、入力キーワードという)と、前記閲覧文書から抽出されたキーワード(以下、補助キーワードという)を前記ユーザ端末から受信する受信手段と、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段とを備え、前記検索手段で検索された検索結果の文書や情報を前記ユーザ端末へ返信することを特徴とする情報提供装置。
【請求項19】
ネットワークで接続したユーザ端末からの情報検索の指示で、情報検索を行って検索結果を返信する情報提供装置において、ユーザが閲覧中の文書や情報(以下、閲覧文書という)に関して入力したキーワード(以下、入力キーワードという)と、前記閲覧文書から抽出されたキーワード(以下、補助キーワードという)を前記ユーザ端末から受信する受信手段と、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段と、前記入力キーワードと前記補助キーワードに基づいて、広告情報記憶手段に記憶された広告コンテンツを検索する広告検索手段とを備え、前記検索手段で検索された検索結果の文書や情報、および前記広告検索手段で検索された広告コンテンツを前記ユーザ端末へ返信することを特徴とする情報提供装置。
【請求項20】
ネットワークで接続したユーザ端末からの情報検索の指示で、情報検索を行って検索結果を返信する情報提供装置において、ユーザが閲覧中の文書や情報(以下、閲覧文書という)に関して入力したキーワード(以下、入力キーワードという)と、前記閲覧文書から抽出されたキーワードを前記ユーザ端末から受信する受信手段と、ユーザの関心情報であるキーワードとその出現頻度を保管するユーザキーワードDBと、前記ユーザキーワードDBの出現頻度の高いキーワードを選択して補助キーワードとして出力するとともに、前記キーワード抽出手段により抽出されたキーワードと前記入力キーワードに基づいて前記ユーザキーワードDBの更新を行うユーザキーワード管理手段と、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段とを備え、前記検索手段で検索された検索結果の文書や情報を前記ユーザ端末へ返信することを特徴とする情報提供装置。
【請求項21】
ネットワークで接続したユーザ端末からの情報検索の指示で、情報検索を行って検索結果を返信する情報提供装置において、ユーザが閲覧中の文書や情報(以下、閲覧文書という)に関して入力したキーワード(以下、入力キーワードという)と、前記閲覧文書から抽出されたキーワードを前記ユーザ端末から受信する受信手段と、ユーザの関心情報であるキーワードとその出現頻度を保管するユーザキーワードDBと、前記ユーザキーワードDBの出現頻度の高いキーワードを選択して補助キーワードとして出力するとともに、前記キーワード抽出手段により抽出されたキーワードと前記入力キーワードに基づいて前記ユーザキーワードDBの更新を行うユーザキーワード管理手段と、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段と、前記入力キーワードと前記補助キーワードに基づいて、広告情報記憶手段に記憶された広告コンテンツを検索する広告検索手段とを備え、前記検索手段で検索された検索結果の文書や情報、および前記広告検索手段で検索された広告コンテンツを前記ユーザ端末へ返信することを特徴とする情報提供装置。
【請求項22】
ネットワークで接続したユーザ端末からの情報検索の指示で、情報検索を行って検索結果を返信する情報提供装置において、ユーザが閲覧中の文書や情報(以下、閲覧文書という)に関して入力したキーワード(以下、入力キーワードという)を前記ユーザ端末から受信する受信手段と、ユーザの関心情報であるキーワードとその出現頻度を保管するユーザキーワードDBと、前記ユーザキーワードDBの出現頻度の高いキーワードを選択して補助キーワードとして出力するとともに、前記入力キーワードに基づいて前記ユーザキーワードDBの更新を行うユーザキーワード管理手段と、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段とを備え、前記検索手段で検索された検索結果の文書や情報を前記ユーザ端末へ返信することを特徴とする情報提供装置。
【請求項23】
ネットワークで接続したユーザ端末からの情報検索の指示で、情報検索を行って検索結果を返信する情報提供装置において、ユーザが閲覧中の文書や情報(以下、閲覧文書という)に関して入力したキーワード(以下、入力キーワードという)を前記ユーザ端末から受信する受信手段と、ユーザの関心情報であるキーワードとその出現頻度を保管するユーザキーワードDBと、前記ユーザキーワードDBの出現頻度の高いキーワードを選択して補助キーワードとして出力するとともに、前記入力キーワードに基づいて前記ユーザキーワードDBの更新を行うユーザキーワード管理手段と、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段と、前記入力キーワードと前記補助キーワードに基づいて、広告情報記憶手段に記憶された広告コンテンツを検索する広告検索手段とを備え、前記検索手段で検索された検索結果の文書や情報、および前記広告検索手段で検索された広告コンテンツを前記ユーザ端末へ返信することを特徴とする情報提供装置。
【請求項24】
ネットワークで接続したユーザ端末からの情報検索の指示で、情報検索を行って検索結果を返信する情報提供装置において、ユーザが閲覧中の文書や情報(以下、閲覧文書という)に関して入力したキーワード(以下、入力キーワードという)と、ユーザの関心情報であるキーワード(以下、補助キーワードという)を前記ユーザ端末から受信する受信手段と、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段とを備え、前記検索手段で検索された検索結果の文書や情報を前記ユーザ端末へ返信することを特徴とする情報提供装置。
【請求項25】
ネットワークで接続したユーザ端末からの情報検索の指示で、情報検索を行って検索結果を返信する情報提供装置において、ユーザが閲覧中の文書や情報(以下、閲覧文書という)に関して入力したキーワード(以下、入力キーワードという)と、ユーザの関心情報であるキーワード(以下、補助キーワードという)を前記ユーザ端末から受信する受信手段と、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段と、前記入力キーワードと前記補助キーワードに基づいて、広告情報記憶手段に記憶された広告コンテンツを検索する広告検索手段とを備え、前記検索手段で検索された検索結果の文書や情報、および前記広告検索手段で検索された広告コンテンツを前記ユーザ端末へ返信することを特徴とする情報提供装置。
【請求項26】
表示された文書や情報(以下、閲覧文書という)に関するキーワードを入力し、前記閲覧文書からキーワードを抽出し、前記入力されたキーワード(以下、入力キーワードという)と前記閲覧文書から抽出したキーワード(以下、補助キーワードという)に基づいて、情報記憶手段に記憶された文書や情報を検索し、前記検索結果の文書や情報を表示することを特徴とする情報検索方法。
【請求項27】
表示された文書や情報(以下、閲覧文書という)に関するキーワードを入力し、前記閲覧文書からキーワードを抽出し、前記入力されたキーワード(以下、入力キーワードという)と前記閲覧文書から抽出したキーワード(以下、補助キーワードという)に基づいて、情報記憶手段に記憶された文書や情報を検索し、前記入力キーワードと前記補助キーワードに基づいて、広告情報記憶手段に記憶された広告コンテンツを検索し、前記検索結果の文書や情報、および前記広告コンテンツを表示することを特徴とする情報検索方法。
【請求項28】
表示された文書や情報(以下、閲覧文書という)に関するキーワードを入力し、前記閲覧文書からキーワードを抽出し、ユーザの関心情報であるキーワードとその出現頻度を保管するユーザキーワードDBを参照して、出現頻度の高いキーワードを選択して補助キーワードとして出力するとともに、前記閲覧文書から抽出されたキーワードと前記入力キーワードに基づいて前記ユーザキーワードDBを更新し、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索し、前記検索結果の文書や情報を表示することを特徴とする情報検索方法。
【請求項29】
表示された文書や情報(以下、閲覧文書という)に関するキーワードを入力し、前記閲覧文書からキーワードを抽出し、ユーザの関心情報であるキーワードとその出現頻度を保管するユーザキーワードDBを参照して、出現頻度の高いキーワードを選択して補助キーワードとして出力するとともに、前記閲覧文書から抽出されたキーワードと前記入力キーワードに基づいて前記ユーザキーワードDBを更新し、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索し、前記入力キーワードと前記補助キーワードに基づいて、広告情報記憶手段に記憶された広告コンテンツを検索し、前記検索結果の文書や情報、および前記広告コンテンツを表示することを特徴とする情報検索方法。
【請求項30】
表示された文書や情報に関するキーワードを入力し、ユーザの関心情報であるキーワードとその出現頻度を保管するユーザキーワードDBを参照して、出現頻度の高いキーワードを選択して補助キーワードとして出力するとともに、前記入力キーワードに基づいて前記ユーザキーワードDBを更新し、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段と、前記検索結果の文書や情報を表示することを特徴とする情報検索方法。
【請求項31】
表示された文書や情報に関するキーワードを入力し、ユーザの関心情報であるキーワードとその出現頻度を保管するユーザキーワードDBを参照して、出現頻度の高いキーワードを選択して補助キーワードとして出力するとともに、前記入力キーワードに基づいて前記ユーザキーワードDBを更新し、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索し、前記入力キーワードと前記補助キーワードに基づいて、広告情報記憶手段に記憶された広告コンテンツを検索し、前記検索結果の文書や情報、および前記広告コンテンツを表示することを特徴とする情報検索方法。
【請求項32】
コンピュータに、請求項1乃至17のいずれかに記載の情報検索システムの機能、または請求項18乃至25のいずれかに記載の情報提示装置の機能を実行させるためのプログラム。
【請求項33】
請求項32に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
【請求項1】
表示された文書や情報(以下、閲覧文書という)に関するキーワードを入力する入力手段と、前記閲覧文書からキーワードを抽出するキーワード抽出手段と、前記入力手段によって入力されたキーワード(以下、入力キーワードという)と前記キーワード抽出手段で抽出したキーワード(以下、補助キーワードという)に基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段と、前記検索手段で検索された検索結果の文書や情報を表示する表示手段を備えることを特徴とする情報検索システム。
【請求項2】
表示された文書や情報(以下、閲覧文書という)に関するキーワードを入力する入力手段と、前記閲覧文書からキーワードを抽出するキーワード抽出手段と、前記入力手段によって入力されたキーワード(以下、入力キーワードという)と前記キーワード抽出手段で抽出したキーワード(以下、補助キーワードという)に基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段と、前記入力キーワードと前記補助キーワードに基づいて、広告情報記憶手段に記憶された広告コンテンツを検索する広告検索手段と、前記検索手段で検索された検索結果の文書や情報、および前記広告検索手段で検索された広告コンテンツを表示する表示手段を備えることを特徴とする情報検索システム。
【請求項3】
請求項2に記載の情報検索システムにおいて、前記広告検索手段は、前記閲覧文書から抽出した補助キーワードのみ、または入力キーワードと重複するキーワードを除いた補助キーワードのみに基づいて検索するようにしたことを特徴とする情報検索システム。
【請求項4】
表示された文書や情報(以下、閲覧文書という)に関するキーワードを入力する入力手段と、前記閲覧文書からキーワードを抽出するキーワード抽出手段と、ユーザの関心情報であるキーワードとその出現頻度を保管するユーザキーワードDBと、前記ユーザキーワードDBの出現頻度の高いキーワードを選択して補助キーワードとして出力するとともに、前記キーワード抽出手段により抽出されたキーワードと前記入力手段によって入力されたキーワード(以下、入力キーワードという)に基づいて前記ユーザキーワードDBの更新を行うユーザキーワード管理手段と、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段と、前記検索手段で検索された検索結果の文書や情報を表示する表示手段を備えることを特徴とする情報検索システム。
【請求項5】
表示された文書や情報(以下、閲覧文書という)に関するキーワードを入力する入力手段と、前記閲覧文書からキーワードを抽出するキーワード抽出手段と、ユーザの関心情報であるキーワードとその出現頻度を保管するユーザキーワードDBと、前記ユーザキーワードDBの出現頻度の高いキーワードを選択して補助キーワードとして出力するとともに、前記キーワード抽出手段により抽出されたキーワードと前記入力手段によって入力されたキーワード(以下、入力キーワードという)に基づいて前記ユーザキーワードDBの更新を行うユーザキーワード管理手段と、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段と、前記入力キーワードと前記補助キーワードに基づいて、広告情報記憶手段に記憶された広告コンテンツを検索する広告検索手段と、前記検索手段で検索された検索結果の文書や情報、および前記広告検索手段で検索された広告コンテンツを表示する表示手段を備えることを特徴とする情報検索システム。
【請求項6】
表示された文書や情報に関するキーワードを入力する入力手段と、ユーザの関心情報であるキーワードとその出現頻度を保管するユーザキーワードDBと、前記ユーザキーワードDBの出現頻度の高いキーワードを選択して補助キーワードとして出力するとともに、前記入力手段によって入力されたキーワード(以下、入力キーワードという)に基づいて前記ユーザキーワードDBの更新を行うユーザキーワード管理手段と、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段と、前記検索手段で検索された検索結果の文書や情報を表示する表示手段を備えることを特徴とする情報検索システム。
【請求項7】
表示された文書や情報に関するキーワードを入力する入力手段と、ユーザの関心情報であるキーワードとその出現頻度を保管するユーザキーワードDBと、前記ユーザキーワードDBの出現頻度の高いキーワードを選択して補助キーワードとして出力するとともに、前記入力手段によって入力されたキーワード(以下、入力キーワードという)に基づいて前記ユーザキーワードDBの更新を行うユーザキーワード管理手段と、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段と、前記入力キーワードと前記補助キーワードに基づいて、広告情報記憶手段に記憶された広告コンテンツを検索する広告検索手段と、前記検索手段で検索された検索結果の文書や情報、および前記広告検索手段で検索された広告コンテンツを表示する表示手段を備えることを特徴とする情報検索システム。
【請求項8】
請求項4、5、6または7に記載の情報検索システムにおいて、前記ユーザキーワードDBは、共起出現率ユーザキーワードDBであって、前記ユーザキーワード管理手段は、前記入力キーワードと前記閲覧文書から抽出されたキーワードに基づいて共起出現率の高いキーワードを選択して補助キーワードとして出力するとともに、前記入力キーワードと前記閲覧文書から抽出されたキーワードに基づいて前記共起出現率ユーザキーワードDBを更新するようにした情報検索システム。
【請求項9】
請求項5または7に記載の情報検索システムにおいて、前記広告検索手段は、前記ユーザキーワード管理手段で選択された補助キーワードのみ、または入力キーワードと重複するキーワードを除いた補助キーワードのみに基づいて検索するようにしたことを特徴とする情報検索システム。
【請求項10】
情報検索の指示と検索結果を表示するユーザサイトと、情報検索サービスを提供するサービスサイトとをネットワークで接続した情報検索システムにおいて、請求項1乃至3のいずれかに記載の情報検索システムのうち、前記キーワード抽出手段を前記ユーザサイトに備え、前記キーワード抽出手段から抽出されたキーワードを補助キーワードとして前記サービスサイトへ転送することを特徴とする情報検索システム。
【請求項11】
情報検索の指示と検索結果を表示するユーザサイトと、情報検索サービスを提供するサービスサイトとをネットワークで接続した情報検索システムにおいて、請求項4乃至9のいずれかに記載の情報検索システムのうち、前記ユーザキーワードDBと前記ユーザキーワード管理手段を前記サービスサイトに備えることを特徴とする情報検索システム。
【請求項12】
情報検索の指示と検索結果を表示するユーザサイトと、情報検索サービスを提供するサービスサイトとをネットワークで接続した情報検索システムにおいて、請求項4乃至9のいずれかに記載の情報検索システムのうち、前記ユーザキーワードDBと前記ユーザキーワードDB管理手段を前記ユーザサイトに備えることを特徴とする情報検索システム。
【請求項13】
請求項10、11または12に記載の情報検索システムにおいて、文書や情報に対する転送可否を記憶した文書IDテーブルを参照して、ユーザの表示した文書や情報の転送可否を決定する転送フィルタ手段を前記ユーザサイトに備え、転送可の文書や情報から抽出したキーワードのみを前記サービスサイトへ転送するようにしたことを特徴とする情報検索システム。
【請求項14】
請求項13に記載の情報検索システムにおいて、前記転送フィルタ手段は、転送可否を決定した文書の転送許可確認を求めるとともに、転送可否状態で文書IDテーブルを更新することを特徴とする情報検索システム。
【請求項15】
請求項10乃至14のいずれかに記載の情報検索システムにおいて、キーワードの転送可否を記憶したワードテーブルを参照して、キーワードの転送可否を決定する転送フィルタ手段を前記ユーザサイトに備え、転送可のキーワードのみを前記サービスサイトへ転送するようにしたことを特徴とする情報検索システム。
【請求項16】
請求項15に記載の情報検索システムにおいて、前記転送フィルタ手段は、転送可否を決定したキーワードの転送許可確認を求めるとともに、転送可否状態でワードテーブルを更新することを特徴とする情報検索システム。
【請求項17】
請求項10乃至16のいずれかに記載の情報検索システムにおいて、転送しようとするキーワードあるいは文書IDの転送許可を求める転送フィルタ手段を前記ユーザサイトに備え、転送許可されたキーワードまたは文書IDで指示される文書から抽出されるキーワードを前記サービスサイトへ転送するようにしたことを特徴とする情報検索システム。
【請求項18】
ネットワークで接続したユーザ端末からの情報検索の指示で、情報検索を行って検索結果を返信する情報提供装置において、ユーザが閲覧中の文書や情報(以下、閲覧文書という)に関して入力したキーワード(以下、入力キーワードという)と、前記閲覧文書から抽出されたキーワード(以下、補助キーワードという)を前記ユーザ端末から受信する受信手段と、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段とを備え、前記検索手段で検索された検索結果の文書や情報を前記ユーザ端末へ返信することを特徴とする情報提供装置。
【請求項19】
ネットワークで接続したユーザ端末からの情報検索の指示で、情報検索を行って検索結果を返信する情報提供装置において、ユーザが閲覧中の文書や情報(以下、閲覧文書という)に関して入力したキーワード(以下、入力キーワードという)と、前記閲覧文書から抽出されたキーワード(以下、補助キーワードという)を前記ユーザ端末から受信する受信手段と、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段と、前記入力キーワードと前記補助キーワードに基づいて、広告情報記憶手段に記憶された広告コンテンツを検索する広告検索手段とを備え、前記検索手段で検索された検索結果の文書や情報、および前記広告検索手段で検索された広告コンテンツを前記ユーザ端末へ返信することを特徴とする情報提供装置。
【請求項20】
ネットワークで接続したユーザ端末からの情報検索の指示で、情報検索を行って検索結果を返信する情報提供装置において、ユーザが閲覧中の文書や情報(以下、閲覧文書という)に関して入力したキーワード(以下、入力キーワードという)と、前記閲覧文書から抽出されたキーワードを前記ユーザ端末から受信する受信手段と、ユーザの関心情報であるキーワードとその出現頻度を保管するユーザキーワードDBと、前記ユーザキーワードDBの出現頻度の高いキーワードを選択して補助キーワードとして出力するとともに、前記キーワード抽出手段により抽出されたキーワードと前記入力キーワードに基づいて前記ユーザキーワードDBの更新を行うユーザキーワード管理手段と、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段とを備え、前記検索手段で検索された検索結果の文書や情報を前記ユーザ端末へ返信することを特徴とする情報提供装置。
【請求項21】
ネットワークで接続したユーザ端末からの情報検索の指示で、情報検索を行って検索結果を返信する情報提供装置において、ユーザが閲覧中の文書や情報(以下、閲覧文書という)に関して入力したキーワード(以下、入力キーワードという)と、前記閲覧文書から抽出されたキーワードを前記ユーザ端末から受信する受信手段と、ユーザの関心情報であるキーワードとその出現頻度を保管するユーザキーワードDBと、前記ユーザキーワードDBの出現頻度の高いキーワードを選択して補助キーワードとして出力するとともに、前記キーワード抽出手段により抽出されたキーワードと前記入力キーワードに基づいて前記ユーザキーワードDBの更新を行うユーザキーワード管理手段と、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段と、前記入力キーワードと前記補助キーワードに基づいて、広告情報記憶手段に記憶された広告コンテンツを検索する広告検索手段とを備え、前記検索手段で検索された検索結果の文書や情報、および前記広告検索手段で検索された広告コンテンツを前記ユーザ端末へ返信することを特徴とする情報提供装置。
【請求項22】
ネットワークで接続したユーザ端末からの情報検索の指示で、情報検索を行って検索結果を返信する情報提供装置において、ユーザが閲覧中の文書や情報(以下、閲覧文書という)に関して入力したキーワード(以下、入力キーワードという)を前記ユーザ端末から受信する受信手段と、ユーザの関心情報であるキーワードとその出現頻度を保管するユーザキーワードDBと、前記ユーザキーワードDBの出現頻度の高いキーワードを選択して補助キーワードとして出力するとともに、前記入力キーワードに基づいて前記ユーザキーワードDBの更新を行うユーザキーワード管理手段と、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段とを備え、前記検索手段で検索された検索結果の文書や情報を前記ユーザ端末へ返信することを特徴とする情報提供装置。
【請求項23】
ネットワークで接続したユーザ端末からの情報検索の指示で、情報検索を行って検索結果を返信する情報提供装置において、ユーザが閲覧中の文書や情報(以下、閲覧文書という)に関して入力したキーワード(以下、入力キーワードという)を前記ユーザ端末から受信する受信手段と、ユーザの関心情報であるキーワードとその出現頻度を保管するユーザキーワードDBと、前記ユーザキーワードDBの出現頻度の高いキーワードを選択して補助キーワードとして出力するとともに、前記入力キーワードに基づいて前記ユーザキーワードDBの更新を行うユーザキーワード管理手段と、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段と、前記入力キーワードと前記補助キーワードに基づいて、広告情報記憶手段に記憶された広告コンテンツを検索する広告検索手段とを備え、前記検索手段で検索された検索結果の文書や情報、および前記広告検索手段で検索された広告コンテンツを前記ユーザ端末へ返信することを特徴とする情報提供装置。
【請求項24】
ネットワークで接続したユーザ端末からの情報検索の指示で、情報検索を行って検索結果を返信する情報提供装置において、ユーザが閲覧中の文書や情報(以下、閲覧文書という)に関して入力したキーワード(以下、入力キーワードという)と、ユーザの関心情報であるキーワード(以下、補助キーワードという)を前記ユーザ端末から受信する受信手段と、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段とを備え、前記検索手段で検索された検索結果の文書や情報を前記ユーザ端末へ返信することを特徴とする情報提供装置。
【請求項25】
ネットワークで接続したユーザ端末からの情報検索の指示で、情報検索を行って検索結果を返信する情報提供装置において、ユーザが閲覧中の文書や情報(以下、閲覧文書という)に関して入力したキーワード(以下、入力キーワードという)と、ユーザの関心情報であるキーワード(以下、補助キーワードという)を前記ユーザ端末から受信する受信手段と、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段と、前記入力キーワードと前記補助キーワードに基づいて、広告情報記憶手段に記憶された広告コンテンツを検索する広告検索手段とを備え、前記検索手段で検索された検索結果の文書や情報、および前記広告検索手段で検索された広告コンテンツを前記ユーザ端末へ返信することを特徴とする情報提供装置。
【請求項26】
表示された文書や情報(以下、閲覧文書という)に関するキーワードを入力し、前記閲覧文書からキーワードを抽出し、前記入力されたキーワード(以下、入力キーワードという)と前記閲覧文書から抽出したキーワード(以下、補助キーワードという)に基づいて、情報記憶手段に記憶された文書や情報を検索し、前記検索結果の文書や情報を表示することを特徴とする情報検索方法。
【請求項27】
表示された文書や情報(以下、閲覧文書という)に関するキーワードを入力し、前記閲覧文書からキーワードを抽出し、前記入力されたキーワード(以下、入力キーワードという)と前記閲覧文書から抽出したキーワード(以下、補助キーワードという)に基づいて、情報記憶手段に記憶された文書や情報を検索し、前記入力キーワードと前記補助キーワードに基づいて、広告情報記憶手段に記憶された広告コンテンツを検索し、前記検索結果の文書や情報、および前記広告コンテンツを表示することを特徴とする情報検索方法。
【請求項28】
表示された文書や情報(以下、閲覧文書という)に関するキーワードを入力し、前記閲覧文書からキーワードを抽出し、ユーザの関心情報であるキーワードとその出現頻度を保管するユーザキーワードDBを参照して、出現頻度の高いキーワードを選択して補助キーワードとして出力するとともに、前記閲覧文書から抽出されたキーワードと前記入力キーワードに基づいて前記ユーザキーワードDBを更新し、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索し、前記検索結果の文書や情報を表示することを特徴とする情報検索方法。
【請求項29】
表示された文書や情報(以下、閲覧文書という)に関するキーワードを入力し、前記閲覧文書からキーワードを抽出し、ユーザの関心情報であるキーワードとその出現頻度を保管するユーザキーワードDBを参照して、出現頻度の高いキーワードを選択して補助キーワードとして出力するとともに、前記閲覧文書から抽出されたキーワードと前記入力キーワードに基づいて前記ユーザキーワードDBを更新し、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索し、前記入力キーワードと前記補助キーワードに基づいて、広告情報記憶手段に記憶された広告コンテンツを検索し、前記検索結果の文書や情報、および前記広告コンテンツを表示することを特徴とする情報検索方法。
【請求項30】
表示された文書や情報に関するキーワードを入力し、ユーザの関心情報であるキーワードとその出現頻度を保管するユーザキーワードDBを参照して、出現頻度の高いキーワードを選択して補助キーワードとして出力するとともに、前記入力キーワードに基づいて前記ユーザキーワードDBを更新し、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索する検索手段と、前記検索結果の文書や情報を表示することを特徴とする情報検索方法。
【請求項31】
表示された文書や情報に関するキーワードを入力し、ユーザの関心情報であるキーワードとその出現頻度を保管するユーザキーワードDBを参照して、出現頻度の高いキーワードを選択して補助キーワードとして出力するとともに、前記入力キーワードに基づいて前記ユーザキーワードDBを更新し、前記入力キーワードと前記補助キーワードに基づいて、情報記憶手段に記憶された文書や情報を検索し、前記入力キーワードと前記補助キーワードに基づいて、広告情報記憶手段に記憶された広告コンテンツを検索し、前記検索結果の文書や情報、および前記広告コンテンツを表示することを特徴とする情報検索方法。
【請求項32】
コンピュータに、請求項1乃至17のいずれかに記載の情報検索システムの機能、または請求項18乃至25のいずれかに記載の情報提示装置の機能を実行させるためのプログラム。
【請求項33】
請求項32に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【図21】
【図22】
【図23】
【図24】
【図25】
【図26】
【図27】
【図28】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【図21】
【図22】
【図23】
【図24】
【図25】
【図26】
【図27】
【図28】
【公開番号】特開2006−79365(P2006−79365A)
【公開日】平成18年3月23日(2006.3.23)
【国際特許分類】
【出願番号】特願2004−262911(P2004−262911)
【出願日】平成16年9月9日(2004.9.9)
【出願人】(000006747)株式会社リコー (37,907)
【Fターム(参考)】
【公開日】平成18年3月23日(2006.3.23)
【国際特許分類】
【出願日】平成16年9月9日(2004.9.9)
【出願人】(000006747)株式会社リコー (37,907)
【Fターム(参考)】
[ Back to top ]