説明

検索装置及び検索方法

【課題】ユーザに対して良好な検索結果を提示することが可能な検索装置を提供する。
【解決手段】検索装置20の検索結果生成部22は、検索要求に含まれる検索語を検索語解析装置30に出力するとともに、検索語解析アルゴリズム31による解析結果としての検索語群を取得する検索語群取得部22aと、検索語群に基づいて、インデックスデータベース52を参照し、検索語群が含まれるWebページ情報を取得するWebページ情報取得部22bと、取得されたWebページ情報を表示順決定装置60に出力するとともに、表示順決定アルゴリズム61によって生成された配列済み検索結果を取得する配列済み検索結果取得部22cと、を備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、検索要求に応じて検索結果を出力する検索装置及び検索方法に関する。
【背景技術】
【0002】
インターネット上の多くの検索サービスサイトを介して使用可能な検索エンジンは、Webページのクロール、クロールによって収集された各Webページの情報の格納、ユーザによる検索語の入力補助、検索結果におけるWebページの表示順の決定等、複数の機能を一体的に用いて検索サービスを提供している。
【0003】
非特許文献1には、検索サービスごとに検索結果におけるWebページの表示順が異なることによって生じる不公平性(ランキングバイアス)についての研究が開示されている。また、非特許文献2には、2社の検索エンジンの違いについて紹介されている。
【先行技術文献】
【非特許文献】
【0004】
【非特許文献1】平手 勇宇、吉田 泰明、山名 早人、“Web検索エンジンのランキングバイアスに関する研究動向”、[online]、第18回データ工学ワークショップ、[平成21年2月12日検索]、インターネット<URL : http://www.ieice.org/~de/DEWS/DEWS2007/pdf/c7-7.pdf>
【非特許文献2】渡辺 隆広、“SEO担当者が知っておくべきGoogleとYahoo!の6つの違い(前編)”、[online]、[平成21年2月12日検索]、インターネット<URL : http://www.alphaseo.jp/seo-column/071019_101432.html>
【発明の概要】
【発明が解決しようとする課題】
【0005】
このように、従来の検索エンジンは、それぞれの機能において独自のアルゴリズムを使用しているため、ユーザがどの検索エンジンを利用するかによって、得られる検索結果は異なってしまう。ここで、ユーザは、嗜好又は目的に応じて検索エンジンを選択することはできるが、予め提供された検索エンジンで組み合わされた機能以外の検索サービスを受けることはできない。そのため、ユーザは必ずしも良好な検索結果を得ることができないという問題があった。
【0006】
本発明は、前記した問題を解決すべく創案されたものであり、ユーザに対して良好な検索結果を提示することが可能な検索装置及び検索方法を提供することを課題とする。
【課題を解決するための手段】
【0007】
前記課題を解決するため、本発明の検索装置は、クライアント装置からの検索要求を取得する検索要求取得部と、取得された検索要求に基づいて、複数の検索アルゴリズム及びインデックスデータベースを組み合わせて検索結果を生成する検索結果生成部と、生成された前記検索結果を前記クライアント装置へ出力する検索結果出力部と、を備え、前記インデックスデータベースは、検索用インデックスと当該検索用インデックスが含まれるWebページに関するWebページ情報とを関連付けたデータベースであり、前記複数の検索アルゴリズムは、前記検索要求に含まれる検索語を解析する検索語解析アルゴリズムと、Webページ情報の表示順を決定して当該Webページ情報を当該表示順に基づいて配列することによって配列済み検索結果を生成する表示順決定アルゴリズムと、を備えており、前記検索結果生成部は、前記検索要求に含まれる検索語を前記検索語解析アルゴリズムが格納された検索語解析部へ出力するとともに、前記検索語解析部から前記検索語解析アルゴリズムによる解析結果としての検索語群を取得する検索語群取得部と、前記検索語群に基づいて、前記インデックスデータベースを参照し、前記検索語群が含まれるWebページ情報を取得するWebページ情報取得部と、取得されたWebページ情報を前記表示順決定アルゴリズムが格納された表示順決定部へ出力するとともに、前記表示順決定部から前記表示順決定アルゴリズムによって生成された配列済み検索結果を取得する配列済み検索結果取得部と、を備え、前記検索結果出力部は、前記配列済み検索結果を前記クライアント装置へ出力することを特徴とする。
【0008】
ここで、検索語解析部、インデックスデータベース及び表示順決定部は、検索装置に一体的に設けられていてもよく、検索装置に対して通信可能に接続されて別体に設けられていてもよい。かかる構成によると、従来は複数の検索機能を一体化した検索サービスしか受けられなかったクライアント装置のユーザに対して良好な検索結果を提示することができる。
【0009】
また、前記検索装置は、複数の検索語解析アルゴリズムの特性と、複数の表示順決定アルゴリズムの特性と、を記憶する特性記憶部をさらに備え、前記検索語群取得部は、前記検索要求及び前記複数の検索語解析アルゴリズムの特性に基づいて、一の検索語解析アルゴリズムを選択し、選択された検索語解析アルゴリズムが格納された前記検索語解析部に前記検索要求を出力し、前記配列済み検索結果取得部は、前記検索要求及び前記複数の表示順決定アルゴリズムの特性に基づいて、一の表示順決定アルゴリズムを選択し、選択された表示順決定アルゴリズムが格納された前記表示順決定部に前記Webページ情報を出力する。
【0010】
かかる構成によると、複数の検索語解析アルゴリズム及び複数の表示順決定アルゴリズムの中から、検索に適した一の検索語解析アルゴリズム及び一の表示順決定アルゴリズムを選択して使用するので、好適な検索結果を生成してクライアント装置へ出力することができる。
【0011】
また、前記検索装置は、前記Webページ情報に基づいて前記検索語に関するトレンド分析を行うトレンド分析部をさらに備え、前記検索結果出力部は、前記トレンド分析の結果を前記配列済み検索結果とともに前記クライアント装置へ出力する構成であってもよい。
【0012】
また、前記検索装置は、前記Webページ情報に基づいて前記検索語に関するニュース記事又は商品に関するレコメンド情報を生成するレコメンド情報生成部をさらに備え、前記検索結果出力部は、前記レコメンド情報を前記配列済み検索結果とともに前記クライアント装置へ出力する構成であってもよい。
【0013】
また、前記検索要求は、ユーザの閲覧履歴を含んでおり、前記検索語群取得部は、前記閲覧履歴に基づいて追加検索語を生成し、生成された追加検索語を前記検索語とともに前記検索語解析部へ出力する構成であってもよい。
【0014】
また、前記検索語群取得部は、予め定義されたWebAPIを用いて前記検索語解析部とデータの送受信を行い、前記Webページ取得部は、予め定義されたWebAPIを用いて前記インデックスデータベースとデータの送受信を行い、前記配列済み検索結果取得部は、予め定義されたWebAPIを用いて前記表示順決定部とデータの送受信を行う構成であってもよい。
【0015】
また、前記課題を解決するため、本発明の検索方法は、クライアント装置からの検索要求を取得する検索要求取得部と、取得された検索要求に基づいて、複数の検索アルゴリズム及びインデックスデータベースを組み合わせて検索結果を生成する検索結果生成部と、生成された前記検索結果を前記クライアント装置へ出力する検索結果出力部と、を備えた検索装置による検索方法であって、前記インデックスデータベースは、検索用インデックスと当該検索用インデックスが含まれるWebページに関するWebページ情報とを関連付けたデータベースであり、前記複数の検索アルゴリズムは、前記検索要求に含まれる検索語を解析する検索語解析アルゴリズムと、検索結果の表示順を決定する表示順決定アルゴリズムと、を備えており、前記検索要求取得部が、前記クライアント装置からの前記検索要求を取得する検索要求取得ステップと、前記検索結果生成部が、前記検索要求に含まれる検索語を前記検索語解析アルゴリズムが格納された検索語解析部へ出力するとともに、前記検索語解析アルゴリズムによる解析結果としての検索語群を取得する検索語群取得ステップと、前記検索結果生成部が、前記検索語群に基づいて、前記インデックスデータベースを参照し、前記検索語群が含まれるWebページ情報を取得するWebページ情報取得ステップと、前記検索結果生成部が、取得されたWebページ情報を前記表示順決定アルゴリズムが格納された表示順決定部へ出力するとともに、前記表示順決定アルゴリズムによる表示順を取得する表示順取得ステップと、前記検索結果生成部が、取得された表示順に基づいて前記Webページ情報を配列することによって、配列済み検索結果を生成する配列済み検索結果生成ステップと、前記検索結果出力部が、生成された配列済み検索結果を前記クライアント装置へ出力する検索結果出力ステップと、を含むことを特徴とする。
【発明の効果】
【0016】
本発明によれば、ユーザに対して良好な検索結果を提示することができる。
【図面の簡単な説明】
【0017】
【図1】本発明の実施形態に係る検索装置を備える検索システムを模式的に示す図である。
【図2】本発明の実施形態に係る検索装置による検索方法を説明するためのフローチャートである。
【発明を実施するための形態】
【0018】
以下、本発明の実施形態について、適宜図面を参照しながら説明する。同様の部分には同一符号を付し、重複する説明を省略する。図1は、本発明の実施形態に係る検索装置を備える検索システムを模式的に示す図である。
【0019】
本発明の実施形態に係る検索システム1は、クライアント装置10からの検索要求に基づいて複数の検索機能をマッシュアップによって組み合わせてカスタマイズされた検索サービスを提供するシステムであり、検索装置20と、複数の検索語解析装置30(30A,30B)と、クロール装置40と、インデックス生成装置50と、複数の表示順決定装置60(60A,60B)と、を備えている。
【0020】
<クライアント装置10>
クライアント装置10は、例えば、パーソナルコンピュータ、ワークステーション、携帯情報端末、携帯電話等といったコンピュータ装置であり、キーボード、マウス等からなる入力部11と、ディスプレイ、プリンタ等からなる出力部12と、入力部11及び出力部12を制御する制御部13と、を備えている。制御部13は、ユーザが入力部11を操作することによって入力された検索要求を検索装置20へ送信するとともに、検索装置20から送信された検索結果を受信し、出力部12に表示させる。検索要求は、検索語と、検索に用いられる補助情報と、を含むデータである。補助情報は、ユーザの嗜好又は目的に関する情報であり、過去の検索履歴、閲覧履歴(直前に閲覧していたWebページに関する情報)等である。検索要求は、検索語の検索条件(AND、OR、NOT条件)、検索対象Webページの言語、地域、ドメイン等の指定、最終更新日時、Webページ内の検索対象箇所、検索対象Webページのファイル形式、サイト形式等の情報を含んでいてもよい。制御部13は、クッキー等を利用することによって検索履歴、閲覧履歴等といった補助情報を記憶しておき、記憶された補助情報と、入力された検索語と、から検索要求を生成して検索装置20へ出力することができる。
【0021】
<検索装置20>
検索装置20は、CPU(Central Processing Unit)、RAM(Random Access Memory)、ROM(Read-Only Memory)及び入出力回路から構成されており、機能部として、検索要求取得部21と、検索結果生成部22と、検索結果出力部23と、特性記憶部24と、を備えている。
【0022】
検索要求取得部21は、クライアント装置10から送信された検索要求を取得し、取得された検索要求を検索結果生成部22へ出力する。
【0023】
検索結果生成部22は、検索要求取得部21によって取得された検索結果に基づいて、複数の検索機能を組み合わせて検索結果を生成するものであり、検索語群取得部22aと、Webページ情報取得部22bと、配列済み検索結果取得部22cと、を備えている。検索語群取得部22a、Webページ情報取得部22b及び配列済み検索結果取得部22cについては、後に説明する。
【0024】
検索結果出力部23は、検索結果生成部22によって生成された検索結果、すなわち配列済み検索結果をクライアント装置10へ出力する。
【0025】
特性記憶部24には、後記する検索語解析アルゴリズム31A,31Bのそれぞれの特性と、後記する表示順決定アルゴリズム61A,61Bのそれぞれの特性と、が記憶されている。
【0026】
検索語解析アルゴリズム31は、検索語を解析して検索語群を生成するアルゴリズムである。検索語解析アルゴリズム31の特性としては、例えば以下の機能特性が挙げられる。
(1)表記の揺らぎへの対応
外来語の片仮名表記の揺らぎへの対応:検索語が「コンピュータ」の場合、「コンピュータ コンピューター」という検索語群を生成する。また、検索語が「コンピューター」の場合、「コンピューター コンピュータ」という検索語群を生成する。
平仮名表記/片仮名表記/漢字表記/ローマ字表記/英語表記への対応:検索語が「たまご」の場合、「たまご タマゴ 卵 tamago egg」という検索語群を生成する。また、検索語が「egg」の場合、「egg たまご タマゴ 卵 tamago」という検索語群を生成することができる。同様に、検索語が片仮名表記、漢字表記又はローマ字表記の場合にも、かかる検索語に対応する他の表記を含む検索語群を生成することができる。ローマ字表記及び英語表記に関しては、全角文字/半角文字の違いや大文字/小文字の違いに対応した検索語群を生成することも可能である。
送り仮名の揺らぎへの対応:検索語が「行う」の場合、「行う 行なう」という検索語群を生成する。また、検索語が「行なう」の場合、「行なう 行う」という検索語群を生成する。
(2)タイプミスへの対応
検索語が「シミュレーション」の場合、「シミュレーション シュミレーション」という検索語群を生成する。また、検索語が「シュミレーション」の場合、「シュミレーション シミュレーション」という検索語群を生成する。
(3)同義語への対応
検索語が「下取」の場合、「下取 買取」という検索語群を生成する。また、検索語が「買取」の場合、「買取 下取」という検索語群を生成する。
(4)ネット特有の遊び混じりの表記への対応
検索語が「糸冬」の場合、「糸冬 終」という検索語群を生成する。また、検索語が「終」の場合、「終 糸冬」という検索語群を生成する。
特性記憶部24には、検索語解析アルゴリズム31A,31Bがそれぞれ(1)〜(4)のどの機能特性を有しているか、及び、当該検索語解析アルゴリズム31A,31Bがどの検索語解析部31,32に格納されているか、が記憶されている。
【0027】
表示順決定アルゴリズム61は、Webページの表示順を決定するアルゴリズムである。表示順決定アルゴリズム61の特性としては、例えば以下の機能特性が挙げられる。
(11)Webページの被リンク数に基づいてページランキングを生成し、かかるページランキングに基づいて機械的に表示順を決定する。
(12)Webページの被リンク数に加えて当該Webページのカテゴリー登録情報に基づいてWebページの重要度を生成し、かかる重要度に基づいて表示順を決定する。
(13)Webページの被リンク数に加えて当該Webページの最終更新日に基づいてWebページの重要度を生成し、新しいWebページが上位に表示されるように表示順を決定する。
(14)口コミサイト、BBSサイトが上位に表示されるように表示順を決定する。
(15)Webページの閲覧頻度に基づいてWebページの重要度を生成し、閲覧頻度が多いWebページが上位に表示されるように表示順を決定する(閲覧頻度が不明なWebページは下位に表示されるようにする)。
【0028】
<検索語解析装置30及び検索語群取得部22a>
検索語解析装置30Aは、検索語解析アルゴリズム31Aを格納しており、かかる検索語解析アルゴリズム31Aを用いて検索語を解析し、解析結果として検索語群を生成し、生成された検索語群を検索語群取得部22aへ出力する。ここでは、検索語解析アルゴリズム31Aは、前記した(1)〜(3)の機能特性を有するアルゴリズムとする。
【0029】
検索語解析装置30Bは、前記検索語解析アルゴリズム31Aとは異なる検索語解析アルゴリズム31Bを格納しており、かかる検索語解析アルゴリズム31Bを用いて検索語を解析し、解析結果として検索語群を生成し、生成された検索語群を検索語群取得部22aへ出力する。ここでは、検索語解析アルゴリズム31Bは、前記した(1)〜(4)の機能特性を有するアルゴリズムとする。
【0030】
検索語群取得部22aは、特性記憶部24に記憶された各検索語解析アルゴリズム31A,31Bの特性を参照し、これらの特性と検索要求に含まれた情報(補助情報)とに基づいて、使用する検索語解析アルゴリズム31を選択し、選択された検索語解析アルゴリズム31が格納された検索語解析装置30へ検索語を出力する。検索語群取得部22aは、どの検索語解析アルゴリズム31がどの検索語解析装置30に格納されているかを記憶しており、かかる記憶内容に基づいて、使用する検索語解析アルゴリズム31が格納された検索語解析装置30へ検索語を出力することができる。なお、検索要求において検索語解析アルゴリズム31が指定されている場合には、検索語群取得部22aは、特性記憶部24を参照せずに、指定された検索語解析アルゴリズム31が格納された検索語解析装置30へ検索語を出力することができる。検索語解析アルゴリズム31A,31BのWebAPI(Web Application Programming Interface)は予め公開されており、検索語群取得部22aは、予め公開されたWebAPIを用いて検索語及び検索語群の送受信を行うことができる。検索語群取得部22aは、取得された検索語群と、検索語以外の検索要求(補助情報)と、をWebページ情報取得部22bへ出力する。
【0031】
より詳細には、検索語群取得部22aは、検索要求に使用すべき検索語解析アルゴリズム31を指定する情報が検索要求に含まれている場合には、かかる検索語解析アルゴリズム31を格納している検索語解析装置30へ検索語を出力する構成であってもよい。この場合には、クライアント装置10のユーザは、入力部11を操作して検索語を入力する際に、補助情報として使用すべき検索語解析アルゴリズム31を入力する構成とすることができる。また、クライアント装置10のユーザは、予め入力部11を操作してデフォルトとして使用すべき検索語解析アルゴリズム31を入力しておく構成とすることもできる。これらの場合には、制御部13は、検索要求として、検索語と、使用すべき検索語解析アルゴリズム31を指定する情報と、を検索要求取得部21へ出力する。
【0032】
また、検索語群取得部22aは、ユーザの検索履歴、すなわち、ユーザがどの検索語解析アルゴリズム31を使用したかを示す履歴が検索要求に含まれている場合には、かかる検索履歴に基づいてどの検索語解析アルゴリズム31を使用するかを決定し、決定された検索語解析アルゴリズム31を格納している検索語解析装置30へ検索語を出力する構成であってもよい。この場合には、検索語群取得部22aは、ユーザが直近に使用した検索語解析アルゴリズム31を使用すると決定することができ、また、ユーザが最も多く使用した検索語解析アルゴリズム31を使用すると決定することもできる。
【0033】
また、検索語群取得部22aは、ユーザの閲覧履歴、すなわち、ユーザがどのWebページを閲覧したかを示す履歴が検索要求に含まれている場合には、かかる閲覧履歴に基づいてどの検索語解析アルゴリズム31を使用するかを決定し、決定された検索語解析アルゴリズム31を格納している検索語解析装置30へ検索語を出力する構成であってもよい。この場合には、検索語群取得部22aは、閲覧履歴に基づいて、ユーザが仕事中であるかプライベート中であるかを判定する。例えば、閲覧履歴において直近の所定回数内に閲覧されたWebページにおいて会社HP、辞書HP等が多い場合には仕事中、BBS、ブログ等が多い場合にはプライベート中であると判定することができる。ユーザが仕事中であると判定された場合には、前記した(1)〜(3)の機能特性を有する検索語解析アルゴリズム31Aを使用すると決定し、ユーザがプライベート中であると判定された場合には、前記した(1)〜(4)の機能特性を有する検索語解析アルゴリズム31Bを使用すると決定することができる。
【0034】
また、検索語群取得部22aは、検索要求に含まれるユーザの閲覧履歴に基づいて追加検索語を生成し、生成された追加検索語を検索語とともに検索語解析措置30へ出力することもできる。
【0035】
ここで、検索語群取得部22aが閲覧履歴に基づいて追加検索要求を生成する場合について説明する。検索語群取得部22aは、閲覧履歴に基づいてインデックスデータベース52を参照することによって、ユーザが閲覧したWebページからキーワードを抽出する。続いて、検索語群取得部22aは、検索要求に含まれるWebページの閲覧時間(Webページを閲覧し続けた時間、直近に閲覧したWebページはどれか)等に基づいて、キーワードの重要度を算出し、重要度の高いキーワードを、追加検索語として検索語とともに検索語解析装置30へ出力する。この場合には、検索語が増えることにより、検索結果(後記するWebページ情報取得部22bによって取得されるWebページ情報)が絞り込まれることになり、ユーザに対してより良好な検索結果を提示することができるようになる。
【0036】
<クロール装置40、インデックス生成装置50及びWebページ情報取得部22b>
クロール装置40は、定期的にインターネット内のWebページ100をクロールするクロール部41と、クロール部41によって取得されたWebページをキャッシュとして記憶するWebページ記憶部42と、を備えている。
【0037】
インデックス生成装置50は、Webページ記憶部42に記憶されたWebページを参照して、このWebページの検索用インデックスを生成するインデックス生成部51と、生成されたインデックスと対応するWebページのWebページ情報とを関連付けて記憶するインデックスデータベース52と、を備えている。ここで、Webページ情報は、検索用インデックスが含まれるWebページのURL(Uniform Resource Locator)である。また、インデックスデータベース52には、Webページの表示順を決定するための参考情報として、Webページの被リンク数、カテゴリー登録情報、最終更新日、閲覧頻度、種類(口コミサイト、BBSサイト等)等といったWebページ参考情報がWebページ情報と関連付けて記憶されている。ここで、Webページの閲覧頻度は、Webページに仕掛けられたカウンタ、アクセス解析等から取得可能である。
【0038】
Webページ情報取得部22bは、検索語群取得部22aから出力された検索語群及び検索語以外の検索要求に基づいてインデックスデータベース52を参照し、検索語群に対応する検索用インデックスが含まれるWebページのWebページ情報を取得し、取得されたWebページ情報を表示順取得部22cへ出力する。インデックスデータベース52のWebAPIは予め公開されており、Webページ情報取得部22bは、予め公開されたWebAPIを用いてWebページ情報を受信することができる。Webページ情報取得部22bは、取得されたWebページ及び検索語以外の検索要求を表示順取得部22c並びに後記するトレンド分析部25及びレコメンド情報生成部26へ出力する。
【0039】
<表示順決定装置60及び配列済み検索結果取得部22c>
表示順決定装置60Aは、表示順決定アルゴリズム61Aを格納しており、かかる表示順決定アルゴリズム61Aを用いてWebページ情報の表示順を決定して当該Webページ情報を当該表示順に基づいて配列することによって配列済み検索結果を生成し、生成された配列済み検索結果を配列済み検索結果取得部22cへ出力する。ここでは、表示順決定アルゴリズム61Aは、前記した(11)の特性を有するアルゴリズムとする。
【0040】
表示順決定装置60Bは、前記表示順決定アルゴリズム61Aとは異なる表示順決定アルゴリズム61Bを用いてWebページ情報の表示順を決定して当該Webページを当該表示順に基づいて配列することによって配列済み検索結果を生成し、生成された配列済み検索結果を配列済み検索結果取得部22cへ出力する。ここでは、表示順決定アルゴリズム61Bは、前記した(14)の特性を有するアルゴリズムとする。
【0041】
配列済み検索結果取得部22cは、特性記憶部24に記憶された各表示順決定アルゴリズム61A,61Bの特性を参照し、これらの特性と検索要求に含まれた情報とに基づいて、使用する表示順決定アルゴリズム61を選択し、選択された表示順決定アルゴリズム61が格納された表示順決定装置60へWebページ情報を出力する。配列済み検索結果取得部22cは、どの表示順決定アルゴリズム61がどの表示順決定装置61に格納されているかを記憶しており、かかる記憶内容に基づいて、使用する表示順決定アルゴリズム61が格納された表示順決定装置60へWebページ情報を出力することができる。なお、検索要求において表示順決定アルゴリズム61が指定されている場合には、表示順取得部22cは、特性記憶部24を参照せずに、指定された表示順決定アルゴリズム61が格納された表示順決定装置60へWebページ情報を出力することができる。表示順決定アルゴリズム61A,61BのWebAPIは予め公開されており、表示順取得部22cは、予め公開されたWebAPIを用いてWebページ情報及び配列済み検索結果の送受信を行うことができる。配列済み検索結果取得部22cは、取得された配列済み検索結果を検索結果出力部23へ出力する。
【0042】
より詳細には、配列済み検索結果取得部22cは、検索要求に使用すべき表示順決定アルゴリズム61を指定する情報が検索要求に含まれている場合には、かかる表示順決定アルゴリズム61を格納している表示順決定装置60へWebページ情報を出力する構成であってもよい。この場合には、クライアント装置10のユーザは、入力部11を操作して検索語を入力する際に、補助情報として使用すべき表示順決定アルゴリズム61を入力する構成とすることができる。また、クライアント装置10のユーザは、予め入力部11を操作してデフォルトとして使用すべき表示順決定アルゴリズム61を入力しておく構成とすることもできる。これらの場合には、制御部13は、検索要求として、検索語と、使用すべき表示順決定アルゴリズム61を指定する情報と、を検索要求取得部21へ出力する。
【0043】
また、配列済み検索結果取得部22cは、ユーザの検索履歴、すなわち、ユーザがどの表示順決定アルゴリズム61を使用したかを示す履歴が検索要求に含まれている場合には、かかる検索履歴に基づいてどの表示順決定アルゴリズム61を使用するかを決定し、決定された表示順決定アルゴリズム61を格納している表示順決定装置60へWebページ情報を出力する構成であってもよい。この場合には、配列済み検索結果取得部22cは、ユーザが直近に使用した表示順決定アルゴリズム61を使用すると決定することができ、また、ユーザが最も多く使用した表示順決定アルゴリズム61を使用すると決定することもできる。
【0044】
また、配列済み検索結果取得部22cは、ユーザの閲覧履歴、すなわち、ユーザがどのWebページを閲覧したかを示す履歴が検索要求に含まれている場合には、かかる閲覧履歴に基づいてどの表示順決定アルゴリズム61を使用するかを決定し、決定された検索語解析アルゴリズム61を格納している表示順決定装置60へ検索語を出力する構成であってもよい。この場合には、配列済み検索結果取得部22cは、閲覧履歴に基づいて、ユーザが仕事中であるかプライベート中であるかを判定する。ユーザが仕事中であると判定された場合には、前記した(11)の機能特性を有する表示順決定アルゴリズム61Aを使用すると決定し、ユーザがプライベート中であると判定された場合には、前記した(14)の機能特性を有する表示順決定アルゴリズム61Bを使用すると決定することができる。
【0045】
<トレンド分析部25及びレコメンド情報生成部26>
また、検索装置20は、トレンド分析部25と、レコメンド情報生成部26と、をさらに備えている。トレンド分析部25は、Webページ情報に基づいて検索語群に関するトレンド分析を行い、トレンド分析の結果を検索結果出力部23へ出力する。レコメンド情報生成部26は、Webページ情報に基づいて検索語群に関するニュース記事又は商品に関するレコメンド情報を生成し、レコメンド情報を検索結果出力部23へ出力する。検索結果出力部23は、トレンド分析の結果及びレコメンド情報を配列済み検索結果とともにクライアント装置10へ出力する。
【0046】
より詳細には、トレンド分析部25は、インデックスデータベース52に記憶されたWebページ情報に基づいてWebページを参照して、Webページにて用いられている単語(話題)のランキングをWebページの最終更新日と合わせて分析することによって、トレンド分析の結果(ランキング)を週間ランキング、月間ランキング等として生成する。
【0047】
また、レコメンド情報生成部26は、トレンド分析部25による分析結果である話題から、人気の高い映画、本、製品等を抽出し、抽出された映画、本、製品等をレコメンド情報として生成する。ここで、レコメンド情報生成部26は、検索要求に含まれるユーザの検索履歴に基づいてユーザの嗜好を分析し、かかる分析結果と抽出された映画、本、製品等をマッチングさせることによって、ユーザの嗜好に合ったレコメンド情報を生成する構成であってもよい。
【0048】
<動作例>
続いて、本発明の実施形態に係る検索装置20による検索方法について説明する。図2は、本発明の実施形態に係る検索装置による検索方法を説明するためのフローチャートである。
【0049】
まず、検索要求取得部21が、クライアント装置10からの検索要求を取得する(ステップS1:検索要求取得ステップ)。
【0050】
続いて、検索結果生成部22の検索語群取得部22aが、検索要求に含まれる検索語を検索語解析アルゴリズム31が格納された検索語解析装置30へ出力する(ステップS2)。ステップS2において、検索語群取得部22aは、検索要求及び特性記憶部24に記憶された検索語解析アルゴリズム31A,31Bの特性に基づいて、検索語を解析するのに適した検索語アルゴリズム31を決定し、決定された検索語解析アルゴリズム31を格納した検索語解析装置30へ検索語を出力する。検索語の入力を受けた検索語解析装置30は、検索語解析アルゴリズム31を用いて検索語を解析することによって検索語群を生成し、生成された検索語群を検索語群取得部22aへ出力する。
【0051】
続いて、検索語群取得部22aが、検索語解析装置から出力された検索語群を取得する(ステップS3)。なお、ステップS2,S3の組み合わせが、特許請求の範囲における検索語群取得ステップに相当する。
【0052】
続いて、検索結果生成部22のWebページ情報取得部22bが、検索語群に基づいて、インデックスデータベース52を参照し、検索語群が含まれるWebページ情報を取得する(ステップS4:Webページ情報取得ステップ)。
【0053】
続いて、検索結果生成部22の配列済み検索結果取得部22cが、Webページ情報を表示順決定装置60へ出力する(ステップS5)。ステップS5において、表配列済み検索結果取得部22cは、検索要求及び特性記憶部24に記憶された表示順決定アルゴリズム61A,61Bの特性に基づいて、Webページの表示順を決定するのに適した表示順決定アルゴリズム61を決定し、決定された表示順決定アルゴリズム61を格納した表示順決定装置60へWebページ情報を出力する。Webページ情報の入力を受けた表示順決定装置60は、表示順決定アルゴリズム61を用いて表示順を決定して当該Webページを当該表示順に基づいて配列することによって配列済み検索結果を生成し、生成された配列済み検索結果を配列済み検索結果取得部22cへ出力する。
【0054】
続いて、配列済み検索結果取得部22cが、表示順決定装置60から出力された配列済み検索結果を取得する(ステップS6)。なお、ステップS5,S6の組み合わせが、特許請求の範囲における配列済み検索結果取得ステップに相当する。
【0055】
続いて、検索結果出力部23が、配列済み検索結果をクライアント装置10へ出力する(ステップS7:検索結果出力ステップ)。
【0056】
本発明の実施形態に係る検索装置20は、検索語解析アルゴリズム31、インデックスデータベース52、表示順決定アルゴリズム61といった複数の検索機能を適宜組み合わせた検索サービスを具現化し、かかる検索サービスによる検索結果をクライアント装置10へ出力するので、ユーザに対して良好な検索結果を提示することができる。
また、検索装置20は、複数の検索語解析アルゴリズム31A,31B及び複数の表示順決定アルゴリズム61A,61Bの中から、検索に適した一の検索語解析アルゴリズム31及び一の表示順決定アルゴリズム61を選択して使用するので、好適な検索結果を生成してクライアント装置10へ出力することができる。
また、検索装置20は、インデックスデータベース52を用いてトレンド分析の結果及びレコメンド情報を生成して出力するので、従来は特定のWebページのみを対象としていたトレンド分析の結果やレコメンド情報をWeb全体を対象として生成することができ、より好適な情報をクライアント装置10へ出力することができる。
【0057】
また、検索装置20は、検索要求に含まれるユーザの閲覧履歴に基づいて追加検索語を生成し、生成された追加検索語を検索に使用するので、ユーザによる検索要求の入力を好適に支援することができる。
【0058】
以上、本発明の実施形態について説明したが、本発明は前記実施形態に限定されず、本発明の要旨を逸脱しない範囲で適宜設計変更可能である。例えば、検索語解析装置30A,30B、クロール装置40、インデックス生成装置50及び表示順決定装置60A,60Bの少なくとも一つが、検索装置20と一体的に構成されてもよい。また、検索装置20は、検索語の翻訳、検索結果のWebページの翻訳を行う翻訳アルゴリズムに関しても、前記した検索語解析アルゴリズム31及び表示順決定アルゴリズム61と同様に選択して翻訳結果を検索又は検索結果の表示に用いることもできる。
【0059】
また、ユーザがクライアント装置10の入力部11を操作することによって検索装置20へログインする構成を採用することにより、検索履歴、閲覧履歴等といった補助情報が、予め検索装置20の記憶部にユーザIDごとに記憶されている構成であってもよい。この場合には、検索履歴、閲覧履歴等といった補助情報とユーザIDとを含む第一の部分的検索要求は、検索語よりも先にクライアント装置10の制御部13から検索装置20へ出力されていることとなり、クライアント装置10の制御部13が検索語とユーザIDとを含む第二の部分的検索要求を検索装置20へ出力すると、検索装置20の検索要求取得部21は、第二の部分的検索要求に含まれるユーザIDを用いて記憶部を参照することによって、当該ユーザの検索履歴、閲覧履歴等といった補助情報を読み出し、検索語と読み出された補助情報とを含む検索要求を生成して取得することができる。
【0060】
また、表示順決定アルゴリズム61がユーザの閲覧頻度に基づいてWebページの表示順を決定するものである場合には、クライアント装置10の制御部13は、クッキー等を利用することによってユーザの閲覧頻度を記憶しておき、記憶された閲覧頻度と、入力された検索語と、から検索要求を生成して検索装置20へ出力することができる。また、制御部13は、ユーザの閲覧頻度とユーザIDとを含む第一の部分的検索要求を検索語よりも先に検索装置20へ出力する構成であってもよい。この場合には、クライアント装置10の制御部13が検索語とユーザIDとを含む第二の部分的検索要求を検索装置20へ出力すると、検索装置20の検索要求取得部21は、第二の部分的検索要求に含まれるユーザIDを用いて記憶部を参照することによって、当該ユーザの閲覧頻度を読み出し、検索語と読み出された閲覧頻度とを含む検索要求を生成して取得することができる。
【0061】
また、複数の検索語解析装置30が一体的に構成されており、検索語群取得部22aは、検索語とともに使用すべき検索語解析アルゴリズム31を指定する情報を一体的に構成された検索語解析装置30へ出力し、一体的に構成された検索語解析装置30は、格納された複数の検索語解析アルゴリズム31から使用すべき検索語解析アルゴリズム31を選択して検索語群を生成するために使用する構成であってもよい。同様に、複数の表示順決定装置60が一体的に構成されており、配列済み検索結果取得部22cは、Webページ情報とともに使用すべき表示順決定アルゴリズム61を指定する情報を一体的に構成された表示順決定装置60へ出力し、一体的に構成された検索語解析装置60は、格納された複数の表示順決定アルゴリズム61から使用すべき検索語解析アルゴリズム61を選択して配列済み検索結果を生成するために使用する構成であってもよい。
【符号の説明】
【0062】
1 検索システム
10 クライアント装置
20 検索装置
21 検索要求取得部
22 検索結果生成部
22a 検索語群取得部
22b Webページ情報取得部
22c 配列済み検索結果取得部
23 検索結果出力部
24 特性記憶部
25 トレンド生成部
26 レコメンド情報生成部
30,30A,30B 検索語解析装置(検索語解析部)
31,31A,31B 検索語解析アルゴリズム
52 インデックスデータベース
60,60A,60B 表示順決定装置(表示順決定部)
61,61A,61B 表示順決定アルゴリズム

【特許請求の範囲】
【請求項1】
クライアント装置からの検索要求を取得する検索要求取得部と、
取得された検索要求に基づいて、複数の検索アルゴリズム及びインデックスデータベースを組み合わせて検索結果を生成する検索結果生成部と、
生成された前記検索結果を前記クライアント装置へ出力する検索結果出力部と、
を備え、
前記インデックスデータベースは、検索用インデックスと当該検索用インデックスが含まれるWebページに関するWebページ情報とを関連付けたデータベースであり、
前記複数の検索アルゴリズムは、前記検索要求に含まれる検索語を解析する検索語解析アルゴリズムと、Webページ情報の表示順を決定して当該Webページ情報を当該表示順に基づいて配列することによって配列済み検索結果を生成する表示順決定アルゴリズムと、を備えており、
前記検索結果生成部は、
前記検索要求に含まれる検索語を前記検索語解析アルゴリズムが格納された検索語解析部へ出力するとともに、前記検索語解析部から前記検索語解析アルゴリズムによる解析結果としての検索語群を取得する検索語群取得部と、
前記検索語群に基づいて、前記インデックスデータベースを参照し、前記検索語群が含まれるWebページ情報を取得するWebページ情報取得部と、
取得されたWebページ情報を前記表示順決定アルゴリズムが格納された表示順決定部へ出力するとともに、前記表示順決定部から前記表示順決定アルゴリズムによって生成された配列済み検索結果を取得する配列済み検索結果取得部と、
を備え、
前記検索結果出力部は、前記配列済み検索結果を前記クライアント装置へ出力する
ことを特徴とする検索装置。
【請求項2】
複数の検索語解析アルゴリズムの特性と、複数の表示順決定アルゴリズムの特性と、を記憶する特性記憶部をさらに備え、
前記検索語群取得部は、前記検索要求及び前記複数の検索語解析アルゴリズムの特性に基づいて、一の検索語解析アルゴリズムを選択し、選択された検索語解析アルゴリズムが格納された前記検索語解析部に前記検索要求を出力し、
前記配列済み検索結果取得部は、前記検索要求及び前記複数の表示順決定アルゴリズムの特性に基づいて、一の表示順決定アルゴリズムを選択し、選択された表示順決定アルゴリズムが格納された前記表示順決定部に前記Webページ情報を出力する
ことを特徴とする請求項1に記載の検索装置。
【請求項3】
前記Webページ情報に基づいて前記検索語に関するトレンド分析を行うトレンド分析部をさらに備え、
前記検索結果出力部は、前記トレンド分析の結果を前記配列済み検索結果とともに前記クライアント装置へ出力する
ことを特徴とする請求項1に記載の検索装置。
【請求項4】
前記Webページ情報に基づいて前記検索語に関するニュース記事又は商品に関するレコメンド情報を生成するレコメンド情報生成部をさらに備え、
前記検索結果出力部は、前記レコメンド情報を前記配列済み検索結果とともに前記クライアント装置へ出力する
ことを特徴とする請求項1に記載の検索装置。
【請求項5】
前記検索要求は、ユーザの閲覧履歴を含んでおり、
前記検索語群取得部は、前記閲覧履歴に基づいて追加検索語を生成し、生成された追加検索語を前記検索語とともに前記検索語解析部へ出力する
ことを特徴とする請求項1に記載の検索装置。
【請求項6】
前記検索語群取得部は、予め定義されたWebAPIを用いて前記検索語解析部とデータの送受信を行い、
前記Webページ取得部は、予め定義されたWebAPIを用いて前記インデックスデータベースとデータの送受信を行い、
前記配列済み検索結果取得部は、予め定義されたWebAPIを用いて前記表示順決定部とデータの送受信を行う
ことを特徴とする請求項1に記載の検索装置。
【請求項7】
クライアント装置からの検索要求を取得する検索要求取得部と、
取得された検索要求に基づいて、複数の検索アルゴリズム及びインデックスデータベースを組み合わせて検索結果を生成する検索結果生成部と、
生成された前記検索結果を前記クライアント装置へ出力する検索結果出力部と、
を備えた検索装置による検索方法であって、
前記インデックスデータベースは、検索用インデックスと当該検索用インデックスが含まれるWebページに関するWebページ情報とを関連付けたデータベースであり、
前記複数の検索アルゴリズムは、前記検索要求に含まれる検索語を解析する検索語解析アルゴリズムと、Webページ情報の表示順を決定して当該Webページ情報を当該表示順に基づいて配列することによって配列済み検索結果を生成する表示順決定アルゴリズムと、を備えており、
前記検索要求取得部が、前記クライアント装置からの前記検索要求を取得する検索要求取得ステップと、
前記検索結果生成部が、前記検索要求に含まれる検索語を前記検索語解析アルゴリズムが格納された検索語解析部へ出力するとともに、前記検索語解析部から前記検索語解析アルゴリズムによる解析結果としての検索語群を取得する検索語群取得ステップと、
前記検索結果生成部が、前記検索語群に基づいて、前記インデックスデータベースを参照し、前記検索語群が含まれるWebページ情報を取得するWebページ情報取得ステップと、
前記検索結果生成部が、取得されたWebページ情報を前記表示順決定アルゴリズムが格納された表示順決定部へ出力するとともに、前記表示順決定部から前記表示順決定アルゴリズムによって生成された配列済み検索結果を取得する配列済み検索結果取得ステップと、
前記検索結果出力部が、前記配列済み検索結果を前記クライアント装置へ出力する検索結果出力ステップと、
を含むことを特徴とする検索方法。

【図1】
image rotate

【図2】
image rotate


【公開番号】特開2010−198350(P2010−198350A)
【公開日】平成22年9月9日(2010.9.9)
【国際特許分類】
【出願番号】特願2009−42728(P2009−42728)
【出願日】平成21年2月25日(2009.2.25)
【出願人】(000004226)日本電信電話株式会社 (13,992)
【Fターム(参考)】