説明

情報検索装置およびコンピュータプログラム

【課題】ユーザの検索キーワード指定操作を簡単にすると共に検索精度の向上を図る。
【解決手段】Webページが表示された表示画面上の表示位置の指定に基づいて、該表示画面に表示されているWebページから、注目語彙を検出し、さらに該注目語彙の周辺にある周辺語彙を検出する語彙抽出部12と、注目語彙及び周辺語彙を用いてWebページ検索を行う検索部22とを備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ウェブ(Web)サーバなどに格納されているファイル(Webページ)の検索に係る情報検索装置およびコンピュータプログラムに関する。
【背景技術】
【0002】
近年、インターネットを用いて広く情報を公開するWebシステムが充実し、非常に多くの情報が閲覧できるようになっている。そのため、有用な情報を簡便に検索する技術が重要となっている。例えば、特許文献1記載の従来技術1では、Webページ全体の文字情報に基づいて類似するWebページを検索する手法を開示している。非特許文献1記載の従来技術2では、ユーザがタッチパネルとペンによる入力インタフェースを利用して、タッチパネル上に表示されている検索キーワードをペンのドラッグ操作でなぞるように選択すると、検索システムがその選択キーワードと周辺にある語彙の種別(企業、施設など)に応じた検索意図メニュー(地図を見たい、ニュースリリースが見たいなど)をユーザに提示している。
【特許文献1】特開2006−236221号公報
【非特許文献1】石谷康人、鈴木優、布目光生,“連鎖検索と近傍検索に基づくWebコンテンツへの効率的なアクセス方法”,第6回Webインテリジェンスとインタラクション研究会(SIG-WI2),pp.31-36,2006
【発明の開示】
【発明が解決しようとする課題】
【0003】
しかし、上述した従来技術1では、ユーザが指定できる最小単位はWebページ全体であり、ユーザはWebページの中のどのキーワードに注目したのかを指定することができない。
【0004】
従来技術2では、ユーザはキーワードを指定することはできるが、キーワード指定時のタッチパネル上をペンでなぞるという操作が煩わしいという問題がある。又、携帯電話機などのようにテンキーやカーソルキー等、限られた入力デバイスしか持たない端末では、キーワード指定する操作が簡単ではない。特に、近年、インターネットアクセス及びWebブラウザ機能を有するテレビ受像機等の家電製品やカーナビゲーションシステムなどが実現されているが、それらの機器では小型のリモートコントロール装置(リモコン)で入力操作を行うことが一般的である。一般にリモコンはテンキーや方向キー等、限られた入力インタフェースしか持たないので、表示画面上のキーワードを指定する操作は煩雑となる。
【0005】
本発明は、このような事情を考慮してなされたもので、その目的は、ユーザの検索キーワード指定操作を簡単にすると共に検索精度の向上を図ることのできる情報検索装置およびコンピュータプログラムを提供することにある。
【課題を解決するための手段】
【0006】
上記の課題を解決するために、本発明に係る情報検索装置は、検索キーワードを用いてWebページ検索を行う情報検索装置において、Webページが表示された表示画面上の表示位置の指定に基づいて、該表示画面に表示されているWebページから、注目語彙を検出し、さらに該注目語彙の周辺にある周辺語彙を検出する語彙抽出手段と、注目語彙及び周辺語彙を用いてWebページ検索を行う検索手段とを備えたことを特徴とする。
【0007】
本発明に係る情報検索装置においては、周辺語彙自体の重要度と注目語彙に関係する重要度とに基づいて、周辺語彙の重要度を算出する語彙重要度算出手段を備え、周辺語彙の重要度に基づいて、注目語彙と共にWebページ検索に用いる周辺語彙を選択することを特徴とする。
【0008】
本発明に係る情報検索装置においては、周辺語彙が固有名詞又は記号で囲まれた語彙である場合に、周辺語彙自体の重要度を有効にすることを特徴とする。
【0009】
本発明に係る情報検索装置においては、注目語彙に関係する重要度は、注目語彙との共起の度合いと、注目語彙との間の表示上の距離との関係から算出されることを特徴とする。
【0010】
本発明に係る情報検索装置においては、ユーザに提示したWebページに対するユーザ評価を蓄積する評価結果データベース手段を備え、該蓄積した評価に基づいて、キーワード検索結果をユーザに提示することを特徴とする。
【0011】
本発明に係る情報検索装置においては、特定ジャンルの情報に誘導するための語彙を蓄積するデータベース手段を備え、注目語彙及び周辺語彙に対して該データベース手段から語彙を追加することを特徴とする。
【0012】
本発明に係る情報検索装置においては、特定ジャンルの情報にアクセスしないように語彙を制限する情報フィルタを備え、注目語彙及び周辺語彙に対してフィルタリングを行うことを特徴とする。
【0013】
本発明に係るコンピュータプログラムは、検索キーワードを用いてWebページ検索を行うためのコンピュータプログラムであって、Webページが表示された表示画面上の表示位置の指定に基づいて、該表示画面に表示されているWebページから、注目語彙を検出し、さらに該注目語彙の周辺にある周辺語彙を検出する語彙抽出機能と、注目語彙及び周辺語彙を用いてWebページ検索を行う検索機能とをコンピュータに実現させることを特徴とする。
これにより、前述の情報検索装置がコンピュータを利用して実現できるようになる。
【発明の効果】
【0014】
本発明によれば、ユーザの検索キーワード指定操作を簡単にすると共に検索精度の向上を図ることができるという効果が得られる。
【発明を実施するための最良の形態】
【0015】
以下、図面を参照し、本発明の実施形態について説明する。
図1は、本発明の一実施形態に係る情報検索システムの全体構成を示すブロック図である。図1において、情報検索システムは、情報家電端末10とワンクリック検索サーバ20とから構成される。情報家電端末10とワンクリック検索サーバ20は、インターネット等の通信回線を介して接続される。
【0016】
情報家電端末10は、インターネットアクセス及びWebブラウザ機能を有する。情報家電端末10としては、例えば、テレビ受像機、テレビゲーム機、セットトップボックス(STB)などが挙げられる。又は、車載されるカーナビゲーションシステム、携帯電話機やPDA(Personal Digital Assistants)等の携帯端末などであってもよい。
【0017】
ワンクリック検索サーバ20は、インターネット30上のWebサイト40にアクセスし、Webページ検索を行う。Webページ検索は、Webページを公開する一般サイトに直接アクセスして行ってもよく、或いは、Webページ検索サービスを提供する検索サイトにアクセスして行ってもよい。
【0018】
情報家電端末10は、Web表示ユーザインタフェース(UI:User Interface)11、語彙抽出部12、データベース13、評価入力部14、表示部15及び操作部16を有する。
Web表示UI11は、Webページの検索及び表示を行う際のユーザインタフェースを提供する。語彙抽出部12は、ユーザのキーワード指定に基づいて、Webページから検索キーワード用の語彙を抽出する。語彙抽出部12は、ユーザが直接的に選択した注目語彙と、注目語彙の周辺にある周辺語彙とを抽出する。データベース13は、Webページ検索に対する付加的情報を格納している。評価入力部14は、検索結果のWebページに対するユーザ評価の入力を行う。
【0019】
表示部15は、液晶表示装置等の表示デバイスを有し、Webページを表示する。表示部15は、Webページ以外の情報(例えばテレビ番組の映像など)を表示するものと共用であってもよい。操作部16は、Webページの検索及び評価を行う際の入力インタフェースである。操作部16は、Webページの検索及び評価以外の機能(例えばテレビのチャネル操作など)を作動させるものと共用であってもよい。操作部16は、情報家電端末10の本体に設けられていてもよく、或いは、リモコンであってもよい。
【0020】
操作部16は、少なくとも、表示部15の表示画面上の表示位置を指定する入力デバイス(以下、ポインティング・デバイスと称する)を有する。ポインティング・デバイスとしては、例えば、マウス、トラックボール、スティック型ポインティング・デバイス、タッチパッド、カーソルキーなどが挙げられる。なお、テンキーやアルファベット等の文字を入力するための入力キーを有していてもよい。
【0021】
図2は、本実施形態に係る入力インタフェースを説明するための概念図である。図2において、情報家電端末10(例えばテレビ受像機)の表示画面110には、Webページが表示されている。操作部15はリモコンである。このリモコン15は、ポインティング・デバイスを有し、ユーザが表示画面110上の任意の表示位置を指定することができるようになっている。図2の例では、表示画面110において、指定の表示位置は十字形状のポインタ120で示されており、その十字形状の中心(十字の交差部)が指定位置である。これにより、ユーザは、表示画面110に表示されているWebページのテキストにおいて、注目する語彙の表示位置を簡単に指定することができる。
【0022】
説明を図1に戻す。
ワンクリック検索サーバ20は、語彙重要度算出部21、検索部22及び評価結果データベース(評価結果DB)23を有する。
語彙重要度算出部21は、検索キーワード用の語彙(注目語彙および周辺語彙)のうち周辺語彙の重要度を算出し、注目語彙と共に検索キーワードに利用する周辺語彙を決定する。検索部22は、検索キーワードを用いてWebページ検索を行う。評価結果DB23は、検索結果のWebページに対するユーザ評価を格納する。
【0023】
次に、図3を参照して、本実施形態に係る情報検索システム全体の動作を説明する。図3は、図1に示す情報検索システムが行う情報検索処理のフローチャートである。
【0024】
まず、情報家電端末10はあるWebページを表示しているとする。この表示Webページとしては、例えば、Webブラウザ起動直後に表示されるデフォルトのWebページ、デフォルトのWebページに含まれるリンクに基づいてユーザがアクセスしたWebページ、ユーザがURL(Uniform Resource Locator)を保存しておいたWebページなどが挙げられる。ユーザはその表示Webページのテキストから注目語彙を選択してWebページ検索を行う。以下、このWebページ検索処理を説明する。
【0025】
ユーザは、情報家電端末10の操作部16を操作してWebページ検索を指示した後、注目語彙の選択を行う。注目語彙の選択の際、ユーザは、操作部16のポインティング・デバイスを操作し、表示部15の表示画面に表示されているWebページのテキストにおいて注目する語彙の表示位置にポインタを移動させて指定する。この指定操作は、例えばマウスボタンの1回のクリック(ワンクリック)のみで可能である。このため、注目語彙の選択操作は、ポインタの移動操作とワンクリックのみで済み、大変簡単である。この注目語彙表示位置の指定操作によって図3の処理が開始される。
【0026】
図3において、ステップS1では、まず、Web表示UI11が、指定操作時点のポインタの位置に最も近く表示されている文字を、表示Webページのテキストから検出する。次いで、語彙抽出部12が、その検出文字の前後各N個の文字を、表示Webページのテキストから抽出する。これにより、検出文字及び検出文字の前後各N個の文字から成る抽出文字列が取得される。なお、Nは、所定の文字数である。又、ユーザが任意にNを設定できるようにしておけば、ユーザは検索キーワードの抽出範囲を指定できるようになる。
【0027】
ステップS2では、語彙抽出部12が、抽出文字列から語彙を検出する。語彙としては自立語及び複合語を検出する。この検出には、一般の形態素解析ツールを用いることができる。ここで、自立語及び複合語の検出方法の一例を説明する。まず、形態素解析ツールを用いて名詞に属する語彙を検出する。そして、その検出した名詞の中から、複合語を検出する。複合語の検出規則としては、連続する名詞は複合語とし、サ変接続、形容動詞語幹、助数詞等の、特定の接尾辞の前で区切ることとする。
【0028】
ステップS3では、語彙抽出部12が、抽出文字列から検出した語彙の中から、注目語彙と周辺語彙を抽出する。注目語彙は、ステップS1でWeb表示UI11がポインタ位置に基づいて検出した検出文字を含む語彙である。周辺語彙は、注目語彙以外の語彙である。語彙抽出部12は、注目語彙と周辺語彙をワンクリック検索サーバ20へ送る。
【0029】
なお、語彙抽出部12が、データベース13を参照し、Webページ検索における付加的処理を行うようにしてもよい。
例えば、特定ジャンルの情報に誘導するための語彙を周辺語彙として追加することが挙げられる。この場合、データベース13に誘導情報を格納しておく。誘導情報は、特定ジャンルの情報に誘導するための語彙の集合である。語彙抽出部12は、誘導情報に含まれる語彙を周辺語彙として追加してから、注目語彙と周辺語彙をワンクリック検索サーバ20へ送る。
或いは、特定ジャンルの情報にアクセスしないように語彙を制限することが挙げられる。この場合、データベース13にアクセス制限情報を格納しておく。アクセス制限情報は、注目語彙及び周辺語彙から除外する語彙の集合である。語彙抽出部12は、注目語彙及び周辺語彙からアクセス制限情報に含まれる語彙を検出するフィルタリングを行う。語彙抽出部12は、フィルタリングの結果をユーザに通知する。語彙抽出部12は、注目語彙及び周辺語彙からアクセス制限情報に含まれる語彙を削除してから、注目語彙と周辺語彙をワンクリック検索サーバ20へ送る。又、注目語彙がフィルタリングにより削除された場合には、Webページ検索を中止する。これにより、有害情報へのアクセス等、不適切な情報へのアクセスを未然に防止することができる。
【0030】
ステップS4では、ワンクリック検索サーバ20の語彙重要度算出部21が、情報家電端末10から受け取った注目語彙と周辺語彙のうち周辺語彙の重要度を算出し、注目語彙と共に検索キーワードに利用する周辺語彙を決定する。周辺語彙の重要度は、注目語彙と組み合わせて検索することで検索結果の絞り込みができる可能性の度合いを表すものとする。周辺語彙の重要度の算出方法については後述する。検索キーワードに利用する周辺語彙としては、重要度の高いものから順番に、所定個数を選ぶ。
【0031】
ステップS5では、検索部22が、注目語彙と検索キーワード用の周辺語彙を用いて、Webページ検索を行う。
【0032】
ステップS6では、検索部22が、Webページ検索結果と評価結果DB23とに基づいて、検索結果のWebページをユーザに提示する。この検索結果提示処理については後述する。検索部22は、検索結果のWebページを情報家電端末10へ送る。情報家電端末10のWeb表示UI11は、検索結果のWebページを表示部15により表示する。これにより、ユーザは検索結果のWebページを参照することができる。
【0033】
ステップS7では、情報家電端末10のWeb表示UI11が、検索結果のWebページに対する評価を入力するよう促す評価入力画面を表示部15により表示する。ユーザは、操作部16を操作し、評価入力画面の内容に従って検索結果のWebページに対する評価を入力する。評価入力画面としては、メニュー形式で評価内容を選択可能に構成することにより、ユーザは操作部16のポインティング・デバイスを操作して評価内容を選択するのみでよくなり、評価入力操作が簡単になる。例えば、検索結果のWebページに対する満足度を多段階(例えば5段階)で表す評価値を選択できるようにする。これにより、ユーザは、検索結果のWebページにどのくらい満足したかどうかを多段階評価し、その評価結果を簡単に入力することができる。評価入力部14は、Web表示UI11を介して評価入力データを受け取り、ワンクリック検索サーバ20へ送る。評価入力データには、評価対象のWebページのURL、評価値及び注目語彙を含める。注目語彙については、語彙抽出部12で保存しておくようにする。
【0034】
又、ユーザが他の検索結果を要求するメニューを設ける。ユーザが、他の検索結果を要求するメニューを選択した場合、Web表示UI11は検索部22に他の検索結果を要求する。これにより、検索部22が他の検索結果のWebページを情報家電端末10へ送り、Web表示UI11が該検索結果のWebページを表示部15により表示する。
又、ユーザの評価結果が規定値以下である場合に(例えば5段階評価の3段階以下である場合に)、自動的に、Web表示UI11が検索部22に他の検索結果を要求するようにしてもよい。
【0035】
ステップS8では、ワンクリック検索サーバ20の評価結果DB23は、評価入力データを情報家電端末10から受け取り、データベース内容を更新する。評価結果DB23は、評価対象のWebページのURL、評価値及び注目語彙の組を格納する。注目語彙と評価対象のWebページのURLの組に含める評価値としては、過去の評価値や他のユーザの評価値との平均値等、過去の評価値や他のユーザの評価値を反映させた統計値とする。
【0036】
次に、図4を参照して、本実施形態に係る検索結果提示処理を説明する。図4は、図1に示す検索部22の処理フロー図である。
図4において、ステップS21では、語彙重要度算出部21から注目語彙と検索キーワード用の周辺語彙を受け取る。
【0037】
ステップS22では、その注目語彙と周辺語彙を用いてWebページ検索を行う。Webページ検索に用いる検索キーワードとしては、注目語彙単体、注目語彙と周辺語彙の組み合わせがある。注目語彙と周辺語彙の組み合わせとしては、注目語彙と1つの周辺語彙から成る組、注目語彙と複数の周辺語彙から成る組がある。注目語彙と複数の周辺語彙の組としては、注目語彙と重要度の高い順で選択した周辺語彙から成る組などがある。次いで、検索結果のWebページのURLを検索結果の上位から順番にリスト化し、URLリストを生成する。
【0038】
ステップS23では、評価結果DB23から、注目語彙に対応するURLの評価結果を取得する。ステップS24では、評価結果DB23から取得したURLの評価結果に基づいて、URLリスト中の高評価のURLから順番に抽出する。ここでは、まずユーザ評価ありのURLのみを評価の高い順にURLリストから抽出する。このとき、同じ評価値を有する複数のURLがURLリスト中にある場合には、検索結果の上位のURLから順番に抽出する。なお、規定の評価値以上のURLのみを抽出対象としてもよい。
また、ユーザ評価ありにもかかわらずURLリストにないURLについては、該当Webページがなくなっている可能性が高いので、該URLの組を評価結果DB23から削除する。
【0039】
ステップS25では、その抽出したURLの個数が所定件数を満たすか判断する。この結果、既に所定件数を満たしている場合にはステップS27に進む。一方、まだ所定件数に満たない場合にはステップS26に進む。ステップS26では、所定件数になるまで、URLリスト中の残りのURLの上位から順番に抽出し、既に抽出済みのURLの後ろに追加する。
【0040】
ステップS27では、抽出されたURLの上位から順次、ユーザに提示する。具体的には、初めに、最上位のURLのWebページを情報家電端末10へ送り、以降、ユーザからの他のWebページの要求がある度に、順次、下位のURLのWebページを情報家電端末10へ送る。
【0041】
次に、本実施形態に係る周辺語彙の重要度の算出方法を説明する。
【0042】
注目語彙に対してある周辺語彙を組み合わせてWebページ検索することで、検索結果の絞り込みができる可能性の度合いを該周辺語彙の“重要度”と定義する。従って、周辺語彙は、注目語彙の意味を補完することのできる関連性の高い語彙であるものが好ましい。本実施形態では、
(1)語彙自体の重要度:周辺語彙が単独で重要な意味を持つこと、
(2)注目語彙に関係する重要度:注目語彙との関連性が高いこと、
の2つの指標を設け、双方の指標を総合して周辺語彙の重要度を算出する。この重要度の算出式を(1)式に示す。
【0043】
【数1】

【0044】
(1)式の値「E(w,wa)」は、注目語彙「wa」に対する周辺語彙「w」の重要度であり、値が大きいほど重要度は高くなる。(1)式において、第1項は周辺語彙「w」自体の重要度「Eo(w)」に関する項、第2項は周辺語彙「w」の注目語彙「wa」に関係する重要度「Er(w|wa)」に関する項、である。周辺語彙「w」の重要度「E(w,wa)」は、周辺語彙「w」自体の重要度「Eo(w)」と周辺語彙「w」の注目語彙「wa」に関係する重要度「Er(w|wa)」との重み和である。αは、その加算比率を表す重み係数である。なお、重み係数αは、ユーザにより任意に設定可能とする。これにより、ユーザは検索結果の傾向を調整することができる。
【0045】
図5に、周辺語彙「w」自体の重要度「Eo(w)」、周辺語彙「w」の注目語彙「wa」に関係する重要度「Er(w|wa)」のそれぞれの要素例を示す。周辺語彙「w」自体の重要度「Eo(w)」の要素としては、地名や人名など、文書の内容を限定しやすい固有名詞であることを表す変数「Fm(w)」と、強調表現など、Webページの著者が意図的に重要であると表現した語彙であることを表す変数「Fv(w)」と、の2つを用いる。周辺語彙「w」の注目語彙「wa」に関係する重要度「Er(w|wa)」の要素としては、注目語彙「wa」との共起の度合い「Fc(w,wa)」と、注目語彙「wa」との間にある文字の個数として算出するの距離「Fd(w,wa)」と、の2つを用いる。
【0046】
[Eo(w)の算出方法]
周辺語彙「w」自体の重要度「Eo(w)」の算出式を(2)式に示す。
【0047】
【数2】

【0048】
(2)式に示されるように、周辺語彙「w」自体の重要度「Eo(w)」は、変数「Fm(w)」と変数「Fv(w)」の和である。変数「Fm(w)」は(3)式、変数「Fv(w)」は(4)式でそれぞれ表される。(3)式において、DMは固有名詞辞書である。(4)式において、DBは記号辞書である。記号辞書DBは、Webページの著者が意図的に重要であると表現する際によく用いる記号、例えば括弧、HTML(HyperText Markup Language)タグによる強調表現(<b>など)を含む。固有名詞辞書及び記号辞書は、語彙重要度算出部21が利用できるように準備しておく。
【0049】
【数3】

【0050】
【数4】

【0051】
(3)式により、周辺語彙「w」が固有名詞辞書にある場合に変数「Fm(w)」は1になり、固有名詞辞書にない場合に変数「Fm(w)」は0になる。(4)式により、周辺語彙「w」が記号辞書にある記号に囲まれた語彙である場合に変数「Fv(w)」は1になり、記号辞書にある記号に囲まれた語彙ではない場合に変数「Fv(w)」は0になる。
【0052】
[Er(w|wa)の算出方法]
周辺語彙「w」の注目語彙「wa」に関係する重要度「Er(w|wa)」の算出式を(5)式に示す。
【0053】
【数5】

【0054】
(5)式に示されるように、周辺語彙「w」の注目語彙「wa」に関係する重要度「Er(w|wa)」は、変数「Fc(w,wa)」を変数「Fd(w,wa)」で割った値である。変数「Fc(w,wa)」は(6)式、変数「Fd(w,wa)」は(7)式でそれぞれ表される。
【0055】
【数6】

【0056】
(6)式の分母は、ユーザが注目語彙「wa」を選択したWebページ「Doc」において、周辺語彙「w」が出現する総回数である。(6)式の分子は、Webページ「Doc」において、文字数「k」の範囲内で周辺語彙「w」が注目語彙「wa」と共に現れた回数である。文字数「k」は、周辺語彙「w」と注目語彙「wa」が共起すると判定するための範囲である。
【0057】
【数7】

【0058】
(7)式において、dist(w,wa)は、周辺語彙「w」と注目語彙「wa」の間にある文字の個数であり、周辺語彙「w」と注目語彙「wa」の間の表示上の距離を表す。
【0059】
上述したように本実施形態によれば、ユーザは、操作部16のポインティング・デバイスを操作し、Webページが表示された表示画面上の表示位置を指定するだけで、簡単に表示Webページから注目語彙を指定することができる。さらに、その注目語彙の周辺にある語彙(周辺語彙)を抽出し、注目語彙を補完するものとして注目語彙と共にWebページ検索に用いる。これにより、ユーザの検索キーワード指定操作を簡略化したために検索キーワードが注目語彙のみとなって検索キーワード不足に陥ることを防止することができる。この結果として、ユーザの検索キーワード指定操作の簡略化と共にWebページ検索の精度向上を図ることができるという優れた効果が得られる。
【0060】
さらに、本実施形態によれば、周辺語彙の重要度に基づいて、注目語彙と共にWebページ検索に用いる周辺語彙を選択する。これにより、周辺語彙を取捨選択し、有効な周辺語彙を用いたWebページ検索を行い、Webページ検索の更なる精度向上を図ることができる。
【0061】
また、ユーザに提示したWebページに対するユーザ評価を蓄積し、該蓄積した評価に基づいてキーワード検索結果をユーザに提示する。これにより、ユーザに対してより有意義なWebページを提示することに寄与することができる。
【0062】
また、注目語彙及び周辺語彙に対して、特定ジャンルの情報に誘導するための語彙を追加することにより、検索結果の拡張を行うことができる。
【0063】
また、注目語彙及び周辺語彙に対して、特定ジャンルの情報にアクセスしないように語彙を制限する情報フィルタを設けることにより、有害情報へのアクセス等、不適切な情報へのアクセスを未然に防止することができ、ペアレンタルコントロールに寄与することができる。
【0064】
なお、本実施形態に係るワンクリック検索サーバ20は、専用のハードウェアにより実現されるものであってもよく、あるいはパーソナルコンピュータ等のコンピュータシステムにより構成され、図1に示されるワンクリック検索サーバ20の各部の機能を実現するためのプログラムを実行することによりその機能を実現させるものであってもよい。
【0065】
また、そのワンクリック検索サーバ20には、周辺機器として入力装置、表示装置等(いずれも図示せず)が接続されるものとする。ここで、入力装置とはキーボード、マウス等の入力デバイスのことをいう。表示装置とはCRT(Cathode Ray Tube)や液晶表示装置等のことをいう。
また、上記周辺機器については、ワンクリック検索サーバ20に直接接続するものであってもよく、あるいは通信回線を介して接続するようにしてもよい。
【0066】
また、図3、図4に示す各ステップを実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより、情報検索処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものであってもよい。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、フラッシュメモリ等の書き込み可能な不揮発性メモリ、DVD(Digital Versatile Disk)等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。
【0067】
さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(例えばDRAM(Dynamic Random Access Memory))のように、一定時間プログラムを保持しているものも含むものとする。
また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。
また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
【0068】
以上、本発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、本発明の要旨を逸脱しない範囲の設計変更等も含まれる。
例えば、上述した実施形態では、情報家電端末10とワンクリック検索サーバ20とを設けたが、それぞれの機能配備については適宜、変更することができる。また、情報家電端末10とワンクリック検索サーバ20の機能を一つの装置として実現するようにしてもよい。
【図面の簡単な説明】
【0069】
【図1】本発明の一実施形態に係る情報検索システムの全体構成を示すブロック図である。
【図2】同実施形態に係る入力インタフェースを説明するための概念図である。
【図3】図1に示す情報検索システムが行う情報検索処理のフローチャートである。
【図4】図1に示す検索部22の処理フロー図である。
【図5】本発明の一実施形態に係る周辺語彙の重要度を構成する要素の説明である。
【符号の説明】
【0070】
10…情報家電端末、11…Web表示ユーザインタフェース、12…語彙抽出部、13…データベース、14…評価入力部、15…表示部、16…操作部、20…ワンクリック検索サーバ、21…語彙重要度算出部、22…検索部、23…評価結果データベース、120…ポインタ

【特許請求の範囲】
【請求項1】
検索キーワードを用いてWebページ検索を行う情報検索装置において、
Webページが表示された表示画面上の表示位置の指定に基づいて、該表示画面に表示されているWebページから、注目語彙を検出し、さらに該注目語彙の周辺にある周辺語彙を検出する語彙抽出手段と、
注目語彙及び周辺語彙を用いてWebページ検索を行う検索手段と、
を備えたことを特徴とする情報検索装置。
【請求項2】
周辺語彙自体の重要度と注目語彙に関係する重要度とに基づいて、周辺語彙の重要度を算出する語彙重要度算出手段を備え、
周辺語彙の重要度に基づいて、注目語彙と共にWebページ検索に用いる周辺語彙を選択することを特徴とする請求項1に記載の情報検索装置。
【請求項3】
周辺語彙が固有名詞又は記号で囲まれた語彙である場合に、周辺語彙自体の重要度を有効にすることを特徴とする請求項2に記載の情報検索装置。
【請求項4】
注目語彙に関係する重要度は、注目語彙との共起の度合いと、注目語彙との間の表示上の距離との関係から算出されることを特徴とする請求項2に記載の情報検索装置。
【請求項5】
ユーザに提示したWebページに対するユーザ評価を蓄積する評価結果データベース手段を備え、
該蓄積した評価に基づいて、キーワード検索結果をユーザに提示することを特徴とする請求項1に記載の情報検索装置。
【請求項6】
特定ジャンルの情報に誘導するための語彙を蓄積するデータベース手段を備え、
注目語彙及び周辺語彙に対して該データベース手段から語彙を追加することを特徴とする請求項1に記載の情報検索装置。
【請求項7】
特定ジャンルの情報にアクセスしないように語彙を制限する情報フィルタを備え、
注目語彙及び周辺語彙に対してフィルタリングを行うことを特徴とする請求項1に記載の情報検索装置。
【請求項8】
検索キーワードを用いてWebページ検索を行うためのコンピュータプログラムであって、
Webページが表示された表示画面上の表示位置の指定に基づいて、該表示画面に表示されているWebページから、注目語彙を検出し、さらに該注目語彙の周辺にある周辺語彙を検出する語彙抽出機能と、
注目語彙及び周辺語彙を用いてWebページ検索を行う検索機能と、
をコンピュータに実現させることを特徴とするコンピュータプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate


【公開番号】特開2009−129098(P2009−129098A)
【公開日】平成21年6月11日(2009.6.11)
【国際特許分類】
【出願番号】特願2007−301984(P2007−301984)
【出願日】平成19年11月21日(2007.11.21)
【出願人】(000208891)KDDI株式会社 (2,700)
【Fターム(参考)】