説明

インターネット検索システムおよび情報処理装置

【課題】インターネット上の文字列検索の際に、利用者の入力する文字列に加え、利用者の端末装置に既に記憶されている文書情報などから文字列を自動的に抽出し、表示の優先順位を変更することで、目的とする情報を効率的に検索するシステムを提供する。
【解決手段】インターネット上の情報をサーバから取得する情報処理装置PC100であって、前記情報処理装置は、文書ファイルを記憶する記憶装置5と、前記文書ファイルから頻出文字列を抽出する関連文字列抽出処理部2を有し、前記インターネット上の情報検索により取得した前記情報を、前記頻出文字列を用いて表示する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、インターネット上の情報検索を行う情報処理装置および情報処理システムに関する。
【背景技術】
【0002】
情報処理装置(以下、PC)などからインターネット上の情報を探し出すために、情報の候補をリスト表示させるインターネット上の情報検索サービスがある。このサービスは広く一般に普及しており、利用者は、閲覧したい情報に関連する文字列から、目的とする情報を探し出す事ができる。具体的には、PCに文字列を入力する。文字列はインターネットを通じて検索サーバに伝送される。検索サーバでは、この文字列を受け、インターネット上の情報を検索し、検索結果をPCへ返す。検索結果を受け取ったPCは画面上に検索結果をリスト表示し、目的とする情報の候補が利用者に提供される。
【0003】
ところが、このサービスによって得られる情報の候補リストは、膨大な件数が表示される場合や、利用者の目的とかけ離れたものが含まれている場合も多く、情報の候補を検索する際の妨げとなる。
【0004】
これに対し、従来技術では、検索サーバに検索するための関連文字列を複数入力する事で、その複数の文字列に共通する情報を持つ候補だけを検索結果としてPCへ伝える手段や、検索サーバにおいて、検索の結果、抽出された情報候補について、その情報の参照回数により順位の並べ替えを行った上で検索結果をPCへ伝える手段などが存在した。
【0005】
特許文献1は、検索結果によって得られる多くの候補から、情報の種類に応じて分類表示する手段について開示されている。
【0006】
図4は、特許文献1の実施例に係る検索操作画面と検索結果表示画面である。図4の(a)、(b)、(c)、(d)は、利用者の携帯端末の画面を表示したものである。(a)の画面で文字列を入力し、検索対象となる情報源を選択した上で検索が実行される事が示されている。(b)、(c)、(d)の画面は、検索結果を示したものであり、検索対象となった情報源によってインターネットやメール、スケジュールなどのカテゴリ別に分類し、それぞれの検索結果としてリスト表示している。この手段によって、例え検索結果が膨大な候補件数となる場合であっても、利用者は、最も関連性の深いと思われる情報源の候補リストを選んで確認することができ、効率が良い。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】特開2006−190114(平成18年7月20日公開)
【発明の概要】
【発明が解決しようとする課題】
【0008】
しかしながら、特許文献1は、検索結果を情報源のカテゴリに分類して表示しているもので、必ずしも利用者の求める情報を優先的に上位表示する手段について開示したものではないため、利用者は求める情報を容易に視認できないという問題があった。
【0009】
そこで、本発明は、上記の問題に鑑みてなされたものであり、その目的は、インターネット上の情報を文字列検索の際に、利用者の入力する文字列に加え、利用者の端末装置に既に記憶されている文書情報などから文字列を自動的に抽出し、それを用いて表示の優先順位を変更することで、目的とする情報を効率的に検索することが出来るシステムを提供するものである。
【課題を解決するための手段】
【0010】
上述の課題を解決するために、本発明の情報処理装置は、インターネット上の情報をサーバから取得する情報処理装置であって、前記情報処理装置は、文書ファイルを記憶する記憶部と、前記文書ファイルから頻出文字列を抽出する関連文字列抽出処理部を有し、前記インターネット上の情報検索により取得した前記情報を、前記頻出文字列を用いて表示する事を特徴とする。
【0011】
更に、インターネット上の情報を取得するサーバと前記情報をリスト表示する情報処理装置で構成された情報検索システムであって、前記情報処理装置は、文書ファイルを記憶する記憶部と、前記文書ファイルから頻出文字列を抽出する関連文字列抽出処理部を有し、前記サーバは、前記情報を、前記頻出文字列を用いて並び替え、前記情報処理装置にて表示する事を特徴とする。
【発明の効果】
【0012】
インターネット上の情報を文字列検索の際に、利用者の入力する文字列に加え、利用者の端末装置に既に記憶されている文書情報などから文字列を自動的に抽出し、表示の優先順位を変更することで、目的とする情報を効率的に検索することが出来る。
【図面の簡単な説明】
【0013】
【図1】本発明の一実施形態に係るインターネット情報検索システムのブロック図である。
【図2】本実施例に係る検索前から検索完了まで関する表示例である。
【図3】本発明の一実施形態に係るインターネット情報検索システムのブロック図である。
【図4】特許文献1の実施例に係る検索操作画面と検索結果表示画面である。
【発明を実施するための形態】
【0014】
本発明の実施例について以下に説明する。一般的に、PCには利用者が日頃作業した、あるいは収集した文書ファイルなどが記憶されている。これらのファイルなどは、何らかの形で利用者が関心を持つファイルであり、そのファイルの中には利用者の関心に関連付けられる文字列を含んでいる事が多い。本発明は、この文字列を用いる事で利用者の目的に合った順位でインターネットの情報検索結果を表示するものである。なお、本発明は以下の実施例に限定されるものではない。
【実施例1】
【0015】
本発明の第1の実施例について以下に述べる。
【0016】
図1は、本発明の一実施形態に係るインターネット情報検索システムのブロック図である。該システムは、情報処理装置であるPC100と、検索文字列入力装置1、記憶装置5、検索結果表示部7によって構成されており、PC100は、関連文字列抽出処理部2、検索エンジン4、並び替え処理部6を備えている。なお、該システムの外に、サーバ200とサーバ情報データベース7、を備えている。また、PC100とサーバ200の間は通信回線で接続されており、サーバ200はインターネットに接続されている。
【0017】
図1を用いて、各部の機能を説明する。検索文字列入力装置1は、利用者が目的とする情報に関連する検索文字列をPC100へ入力する部分である。図示しないが、具体的には、PCに接続されたキーボードと表示画面を用い、表示画面には検索文字列入力の為の文字列入力枠と検索開始ボタンを描画し、キーボードから入力された検索文字列を文字列入力枠内に描画する。続いて、検索開始ボタンをキーボードなどで操作し、文字列入力枠に表示されている文字列を、検索文字列として、関連文字列抽出処理部2に送る処理が行われる。
【0018】
関連文字列抽出処理部2は、検索文字列入力装置1で入力された検索文字列を用いて複数の文書ファイルなどを記憶している記憶装置5を検索する。そして、関連文字列抽出処理部2は、検索文字列の存在するファイルを抽出する。続いて、検索文字列抽出装置2は、抽出されたファイルから頻出する文字列や題名またはファイル名に使われている文字列など、検索文字列に関連性を持つ文字列を関連文字列として抽出する。なお、接尾語や接続詞、動詞などは抽出対象から除くようにしてもよい。また、関連文字列の抽出方法は上記手段に限定されず、検索文字列に関連性を持つ文字列を抽出できればどの様な方法であっても良い。その後、関連文字列抽出処理部2は、抽出された関連文字列を並び替え処理部6に送り、検索文字列をサーバ200の検索エンジン4に伝送する。
【0019】
検索エンジン4は、インターネット上の多くの情報を対象に、PC100より伝送された検索文字列の存在する情報を検索するための処理部である。インターネット上の多くの情報を蓄えた情報データベース7の中から、検索文字列を含む情報を検索する。そして、検索エンジン4は、検索結果として得られたインターネット上の情報の候補をPC100の並び替え処理部6へ伝送する。なお、情報データベース7は、自動情報巡回エンジン(図示せず)を使用して常にインターネット上の最新の情報が蓄積されている。
【0020】
並び替え処理部6は、検索エンジン4から出力された情報の候補と、関連文字列抽出処理部2から抽出された関連文字列を用いて情報の候補より関連文字列の頻出順に並び替えて情報の候補を利用者が閲覧できるリスト形式に変換し、検索結果表示部7にてインターネット上の情報の候補リストを表示する。
【0021】
本実施例における検索結果の表示について図2を用いて説明する。
【0022】
図2は、本実施例に係る検索前から検索完了まで関する表示の例である。図2には、検索前のPC100の状態、検索中のサーバ200の状態、検索完了のPC100の状態が示されている。3は表示装置、5は記憶装置、7は情報データベース、20は検索入力画面、21は文字列入力枠、22は文書ファイル(「ガーデニングのノウハウ」という題名の文書を例示している)、23は情報の候補、24は「温室効果対策」情報、25「二酸化炭素削減に向けて」情報、26は「ガーデニング用品販売」情報、27は検索結果画面、100はPC、200はサーバである。
【0023】
検索前のPC100では、表示装置3に検索入力画面20が表示されており、利用者は文字列入力枠21へ検索したい情報に関連する文字列を入力する。本実施例では、文字列入力枠21へ「温室」を入力する例を示している。この状態から検索指示を与えると、記憶装置5に記憶された複数の文書ファイルから文字列「温室」が記載された文書ファイル22が検索される。ここでは、「ガーデニングのノウハウ」という文書ファイル22が示されている。検索の結果抽出された「ガーデニングのノウハウ」という文書ファイル22に頻出する文字列が、関連文字列として抽出される。ここでは、頻出文字列は文章中に2回記載がある「果樹」である。関連文字列として「果樹」が抽出される。
【0024】
一方で、検索中のサーバ200では、文字列「温室」が伝送され、情報データベース7より「温室」に関係する情報の検索が行われる。検索の結果、得られた情報は情報の参照回数などにより順位付けが行われ、情報の候補23が作成される。本実施例では、「温室効果対策」情報24が1位であり、「二酸化炭素削減に向けて」情報25が2位、「ガーデニング用品販売」情報26が最下位である事を示している。
【0025】
さらに、検索完了のPC100では、情報の候補23を受け取り、これに関連文字列「果樹」の存在する情報を上位に並び替え表示装置3で検索結果画面27を表示する。本実施例では、検索結果画面27に、「ガーデニング用品販売」情報26が1位であり、「温室効果対策」情報24が2位、「二酸化炭素削減に向けて」情報25が3位で表示されている。すなわち、関連文字列「果樹」により並び替えが行われ、「果樹」が記載されている「ガーデニング用品販売」情報26が、それまでの最下位から1位に変更し表示された事を示している。これにより、利用者は、関心のある可能性の高いインターネット上の情報を効率よく確認する事ができる。
【0026】
なお、本実施例では、検索エンジン4から出力される情報の候補は、該情報のタイトルや内容の一部を引用したものなどであり、該情報の持つ全ての内容に比してごく限られた内容となる。該情報の持つ内容全てに対して関連文字列による情報候補の並べ替えを行うには、PC100は情報の候補リストを基に、情報1件ずつサーバ200より全での内容を取得した上で、全件の全ての内容に対して関連文字列により並び替えを実施する事で実現できる。以上が、本発明の第1の実施例に係るインターネット検索システムである。
【実施例2】
【0027】
本発明の第2の実施例について以下に述べる。
【0028】
図3は、本発明の一実施形態に係るインターネット情報検索システムのブロック図である。該システムは、情報処理装置であるPC100とサーバ200、および周辺機器によって構成される。PC100には、関連文字列抽出処理部2が備えられ、検索文字列入力装置1、記憶装置5、検索結果表示部7によって構成されている。一方、サーバ200には、検索エンジン4、並び替え処理部6を備え、情報データベース7で構成されている。なお、PC100とサーバ200の間は通信回線で接続されており、サーバ200はインターネットに接続されている。
【0029】
図3をもとに、各部の機能を説明する。検索文字列入力装置1は、利用者が目的とする情報に関連する検索文字列をPC100へ入力する部分である。図示しないが、具体的には、PCに接続されたキーボードと表示画面を用い、表示画面には検索文字列入力の為の文字列入力枠と検索開始ボタンを描画し、キーボードから入力された検索文字列を文字列入力枠内に描画する。続いて、検索開始ボタンをキーボードなどの操作で押下し、文字列入力枠に表示されている文字列を、検索文字列として、関連文字列抽出処理部2に送る処理が行われる。
【0030】
関連文字列抽出処理部2は、検索文字列入力装置1で入力された検索文字列を用いて複数の文書ファイルなどを記憶している記憶装置5を検索する。そして、関連文字列抽出処理部2は、検索文字列の存在するファイルを抽出する。続いて、検索文字列抽出装置2は、抽出されたファイルから頻出する文字列や題名またはファイル名に使われている文字列など、検索文字列に関連性を持つ文字列を関連文字列として抽出する。なお、接尾語や接続詞、動詞などは抽出対象から除くようにしてもよい。また、なお、関連文字列の抽出方法は上記手段に限定されず、検索文字列に関連性を持つ文字列を抽出出来ればどの様な方法であっても良い。その後、関連文字列抽出処理部2は、抽出された関連文字列をサーバ200の並び替え処理部6に送り、検索文字列をサーバ200の検索エンジン4に伝送する。
【0031】
検索エンジン4は、インターネット上の多くの情報を対象にPC100より伝送された検索文字列の存在する情報を検索するための処理部である。インターネット上の多くの情報を蓄えた情報データベース7の中から、検索文字列を含む情報を検索する。そして、検索エンジン4は、検索文字列の含まれる数、対象となる他の情報へのリンク数、参照回数など、検索文字列と情報の関連性の評価を計算処理し、高いものから順に並び替え処理部6出力する。なお、検索文字列と情報の関連性を評価出来れば、上記の方法以外の方法であっても良い、また関連性の評価は、各評価項目均一の加点でも、評価項目によって重み付けを行う方法であっても良い。また、情報データベース7は、自動情報巡回エンジン(図示せず)を使用して常にインターネット上の最新の情報が蓄積されている。
【0032】
並び替え処理部6は、検索エンジン4から出力された情報の候補と、PC100から伝送された関連文字列を用いて情報の候補より関連文字列の頻出順に並び替えて情報の候補としてPC100へ伝送する。
【0033】
情報の候補を伝送されたPC100は利用者が閲覧できるリスト形式に変換し、検索結果表示部7にて情報の候補リストを表示する。
【0034】
本実施例における検索結果の表示については、関連文字列による並び替え処理をサーバ200で実施する点を除き、第1の実施例で解説した図2と同じであるため、説明は省略する。
【産業上の利用可能性】
【0035】
本発明に係るインターネット検索システムは、PC、サーバー、携帯電話、携帯端末などに広く適用することができる。
【符号の説明】
【0036】
1 検索文字列入力装置
2 関連文字列抽出処理部
3 表示装置
4 検索エンジン
5 記憶装置
6 並び替え処理部
7 情報データベース
20 検索入力画面
21 文字列入力枠
22 文書ファイル
23 情報の候補
24 「温室効果対策」情報
25 「二酸化炭素削減に向けて」情報
26 「ガーデニング用品販売」情報
27 検索結果画面
100 PC
200 サーバ

【特許請求の範囲】
【請求項1】
インターネット上の情報をサーバから取得する情報処理装置であって、
前記情報処理装置は、文書ファイルを記憶する記憶部と、
前記文書ファイルから頻出文字列を抽出する関連文字列抽出処理部を有し、
前記インターネット上の情報検索により取得した前記情報を、前記頻出文字列を用いて表示する事を特徴とする情報処理装置。
【請求項2】
インターネット上の情報を取得するサーバと前記情報をリスト表示する情報処理装置で構成された情報検索システムであって、
前記情報処理装置は、文書ファイルを記憶する記憶部と、
前記文書ファイルから頻出文字列を抽出する関連文字列抽出処理部を有し、
前記サーバは、前記情報を、前記頻出文字列を用いて並び替え、前記情報処理装置にて表示する事を特徴とする情報検索システム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate