説明

検索装置

【課題】検索者の所属する部門にとって重要でないサーバに記憶されたコンテンツが上位にランキングされてしまうことがある。
【解決手段】この検索装置100は、検索手段101とランキング補正手段102とを有する。検索手段101は、検索者からの検索要求に従って複数のサーバからコンテンツを検索し、検索したコンテンツごとに第1のスコアを算出し、算出した第1のスコアでランキング付けした一次検索結果を作成する。ランキング補正手段102は、検索されたコンテンツについて、第1のスコアと、検索者の所属するグループに対応する各サーバグループの重要度のうち当該コンテンツを記憶するサーバが属するサーバグループの重要度とを考慮して第2のスコアを算出し、算出した第2のスコアでランキング付けした二次検索結果を出力する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、検索結果をランキング付けする機能を有する検索装置に関する。
【背景技術】
【0002】
ユーザから入力された検索条件に合致するコンテンツを検索する検索装置において、検索結果の一覧を表示する際のランキング手法が各種提案ないし実用化されている。例えば、検索者が入力したキーワードがそのコンテンツにどれくらい含まれているかによってランキングするtf−idf法や、多くのユーザに何度も閲覧されているコンテンツは重要性が高いと考えて上位にランキングするクリックフィードバック法などが、一般的なランキング手法として知られている。
【0003】
他方、特許文献1には、複数のファイルサーバに格納されている全ファイルに対して重要度による重み付けを行い、検索されたファイルをその重み付けによってランキングする手法が提案されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2009−116413号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
企業内の検索装置においては、企業内に存在する多数のWebサーバやファイルサーバ(以下、単にサーバと言う)から、インデックスを作成し、検索者が入力したキーワードに従って、上述した一般的なランキング手法を使用して、検索結果を提供している。企業内のサーバは、企業内の多数の部門(例えば、スタッフ部門、営業部門、開発部門、研究部門など)に存在しており、同じキーワードで検索されるコンテンツがいろいろな部門のサーバに存在する場合がある。しかし、それらのサーバに蓄積されているコンテンツは、一部の部門(例えば、スタッフ部門)を除けば、その部門内に向けて提供されていることが多い。従って、一般的なランキング手法では、検索者が所属する部門と全く関係のない部門のサーバに蓄積されているコンテンツが上位にランキングされる場合がある。
【0006】
特許文献1に記載される検索装置によれば、複数のサーバに事前に重要度を設定しておくことにより、サーバの重要度を考慮したランキングが可能である。しかし、特許文献1に記載の検索装置は、サーバの重要度が全部門の検索者にとって一律である場合には有効であるが、検索者の所属する部門によってサーバの重要度が異なる場合には、検索者にとって重要でないサーバに記憶されたコンテンツが上位にランキングされてしまう場合がある。
【0007】
本発明の目的は、検索者の所属する部門にとって重要でないサーバに記憶されたコンテンツが上位にランキングされてしまうことがある、という課題を解決する検索装置を提供することにある。
【課題を解決するための手段】
【0008】
本発明の一形態にかかる検索装置は、検索者からの検索要求に従って複数のサーバからコンテンツを検索し、この検索したコンテンツごとに第1のスコアを算出し、この算出した第1のスコアでランキング付けした一次検索結果を作成する検索手段と、上記検索されたコンテンツについて、上記第1のスコアと、上記検索者の所属するグループに対応する各サーバグループの重要度のうち当該コンテンツを記憶するサーバが属するサーバグループの重要度とを考慮して第2のスコアを算出し、この算出した第2のスコアでランキング付けした二次検索結果を出力するランキング補正手段とを備える。
【発明の効果】
【0009】
本発明は上述したような構成を有するため、検索者の所属する部門にとって重要でないサーバに記憶されたコンテンツが上位にランキングされてしまうことを防止することができる。
【図面の簡単な説明】
【0010】
【図1】本発明の第1の実施形態のブロック図である。
【図2】本発明の第2の実施形態のブロック図である。
【図3】本発明の第2の実施形態で使用するサーバグループ重み付け情報の構成例を示す図である。
【図4】本発明の第2の実施形態の処理例を示すフローチャートである。
【図5】本発明の第3の実施形態のブロック図である。
【図6】本発明の第4の実施形態のブロック図である。
【図7】本発明の第5の実施形態のブロック図である。
【発明を実施するための形態】
【0011】
[第1の実施形態]
図1を参照すると、本発明の第1の実施形態にかかる検索装置100は、一般的には検索サーバから構成され、検索者から入力される検索要求で与えられる検索条件に合致するコンテンツを検索し、検索結果をランキング付けして検索者に返却する機能を有している。この検索装置100は、検索手段101とランキング補正手段102とを備えている。
【0012】
検索手段101は、検索者からの検索要求に従ってコンテンツを検索する機能と、検索したコンテンツごとに上記した一般的なランキング手法を用いて第1のスコアを算出する機能と、算出した第1のスコアでランキング付けした一次検索結果を作成する機能とを有する。
【0013】
検索手段101が検索の対象とするコンテンツ或いはそのインデックスは、検索装置100からアクセス可能な外部のサーバに記憶されている。検索装置100が企業内検索(Enterprise Search)を行う装置である場合、検索の対象となるコンテンツは、データベース内のデータ、ファイルサーバ内のデータや、業務アプリケーションなど、様々な形態の構造データ、非構造データが含まれる。また検索装置100がインターネット検索を行う装置である場合、検索の対象となるコンテンツは、ウェブサイトのページなどが含まれる。検索の対象となるコンテンツを記憶する複数のサーバは、所定の基準(部門や役職など)に従って幾つかのサーバグループにグルーピングされている。
【0014】
ランキング補正手段102は、検索手段101で検索されたコンテンツについて、上記第1のスコアと、検索者の所属するグループに対応する各サーバグループの重要度のうち当該コンテンツを記憶するサーバが属するサーバグループの重要度とを考慮して第2のスコアを算出する機能と、算出した第2のスコアでランキング付けした二次検索結果を作成する機能と、作成した二次検索結果を検索者に出力する機能とを有する。
【0015】
次に本実施形態の動作を説明する。
【0016】
検索者から図示しない検索端末などの端末を通じて、検索キーワードなどの検索条件を指定した検索要求が入力されると、検索装置100の検索手段101は、検索条件に合致するコンテンツを検索する。次に検索手段101は、検索したコンテンツごとに、一般的なランキング手法を用いて第1のスコアを算出する。そして、検索手段101は、算出した第1のスコアでランキング付けした一次検索結果を作成し、ランキング補正手段102に出力する。
【0017】
ランキング補正手段102は、一次検索結果中の各コンテンツごとに、第1のスコアと、検索者の所属するグループに対応する各サーバグループの重要度のうち当該コンテンツを記憶するサーバが属するサーバグループの重要度とを考慮して第2のスコアを算出する。ランキング補正手段102は、第1のスコアが同じであれば、重要度がより高いほど、第2のスコアがより高くなる方法で、第2のスコアを計算する。あるいは、ランキング補正手段102は、第1のスコアが同じであれば、重要度がより低いほど、第2のスコアがより低くなる方法で、第2のスコアを計算する。
【0018】
次にランキング補正手段102は、算出した第2のスコアでランキング付けした二次検索結果を作成し、検索者に出力する。
【0019】
このように本実施形態によれば、検索者の所属するグループにとって重要でないサーバのコンテンツが上位にランキングされてしまうことを防止することができる。その理由は、ランキング補正手段102が、一次検索結果のコンテンツのスコアを、検索者の所属するグループに対応する各サーバグループの重要度のうち当該コンテンツを記憶するサーバが属するサーバグループの重要度を考慮して補正しているためである。
【0020】
[第2の実施形態]
図2を参照すると、本発明の第2の実施形態は、企業内検索装置であり、検索端末1と、検索サーバ2と、サーバグループ群3と、これらを接続するネットワーク4とから構成されている。
【0021】
検索端末1は、従業員が使用する端末、例えばパーソナルコンピュータや携帯電話機などである。検索端末1は、検索者である従業員が入力した検索キーワードを検索サーバ2に送信し、検索サーバ2から検索結果リストを受け取り表示する機能を有する。また、検索端末1は、検索者が閲覧したいコンテンツを選択すると、サーバグループ群3の中の当該コンテンツを格納しているサーバから当該コンテンツを取得し表示する機能を有する。
【0022】
サーバグループ群3は、複数のWebサーバやファイルサーバから構成されている。また、サーバグループ群3は、複数のグループにグルーピングされている。本実施形態では、サーバグループ群3は、スタッフ部門のサーバグループ3−1と、営業部門のサーバグループ3−2と、開発部門のサーバグループ3−3と、研究部門のサーバグループ3−4とにグルーピングされている。
【0023】
スタッフ部門のサーバグループ3−1には、1以上のサーバが含まれる。スタッフ部門のサーバグループ3−1に含まれる各サーバには、全部門に属する従業員向けのコンテンツが記憶されている。
【0024】
営業部門のサーバグループ3−2には、1以上のサーバが含まれる。営業部門のサーバグループ3−2に含まれる各サーバには、主に営業部門に属する従業員向けのコンテンツが記憶されている。
【0025】
開発部門のサーバグループ3−3には、1以上のサーバが含まれる。開発部門のサーバグループ3−3に含まれる各サーバには、主に開発部門に属する従業員向けのコンテンツが記憶されている。
【0026】
研究部門のサーバグループ3−4には、1以上のサーバが含まれる。研究部門のサーバグループ3−4に含まれる各サーバには、主に研究部門に属する従業員向けのコンテンツが記憶されている。
【0027】
各サーバは、検索端末1から要求されたコンテンツを検索端末1へ送信する機能を有している。
【0028】
検索サーバ2は、検索要求受付部21と、検索結果リスト返却部22と、ランキングスコア計算部23と、ランキングスコア補正部24と、サーバグループ重み付け情報25とを含む。
【0029】
検索要求受付部21は、検索端末1から検索キーワードを含む検索要求を受付ける機能を有する。ランキングスコア計算部23は、検索キーワードを含むコンテンツを検索し、検索した全コンテンツのランキングスコアを計算する機能を有する。サーバグループ重み付け情報25は、従業員の所属するグループごとに各サーバグループの重要度を記憶する機能を有する。ランキングスコア補正部24は、ランキングスコア計算部23で計算されたランキングスコアをサーバグループ重み付け情報25により補正する機能を有する。検索結果リスト返却部22は、補正後のランキングスコアによってランキング付けされた検索結果のリストを検索端末1へ返却する機能を有する。
【0030】
図3は、サーバグループ重み付け情報25の構成例である。この例では、スタッフ部門に対して、スタッフ部門サーバグループの重要度は1、営業部門サーバグループの重要度は0.5、開発部門サーバグループの重要度は0.3、研究部門サーバグループの重要度は0にそれぞれ設定されている。また、営業部門に対して、スタッフ部門サーバグループの重要度は1、営業部門サーバグループの重要度は1、開発部門サーバグループの重要度は0.5、研究部門サーバグループの重要度は0にそれぞれ設定されている。また、開発部門に対して、スタッフ部門サーバグループの重要度は1、営業部門サーバグループの重要度は0.3、開発部門サーバグループの重要度は1、研究部門サーバグループの重要度は0.8にそれぞれ設定されている。また、研究部門に対して、スタッフ部門サーバグループの重要度は1、営業部門サーバグループの重要度は0、開発部門サーバグループの重要度は0.8、研究部門サーバグループの重要度は1にそれぞれ設定されている。
【0031】
本実施形態では、重要度の値が1に近いほど、より重要度が高いことを示す。また、重要度の最小値は0としている。なお、重要度の値域は0〜1に限定されるものではなく、任意に設定可能である。
【0032】
次に、図2〜図4を参照して本実施形態の動作について詳細に説明する。
【0033】
検索者が、検索端末1を使って、検索キーワードを入力したとする(図4のS1)。すると、入力されたキーワードを含む検索要求は、検索端末1から検索サーバ2に送信される。検索要求受付部21は、検索端末1から送信されたキーワードを含む検索要求を受け取り、ランキングスコア計算部23に渡す(S2)。
【0034】
ランキングスコア計算部23は、各サーバグループ別あるいはサーバ別に予め作成されたインデックスを検索することにより、検索要求中のキーワードを含むコンテンツを検索し、検索されたコンテンツのランキングスコアを一般的なランキングアルゴリズムを使って計算する(S3)。次に、ランキングスコア補正部24は、サーバグループ重み付け情報25により、ランキングスコア計算部23で計算されたランキングスコアを補正する(S4)。具体的には、ランキングスコア補正部24は、以下のような処理を実行する。
【0035】
最初にランキングスコア補正部24は、検索者の所属するグループを判別する。この判別は、例えば、従業員IDとその従業員の所属グループとの対応関係を記載した従業員属性情報を事前に記憶しておき、検索要求に含まれる従業員IDに対応する所属グループを従業員属性情報から取得することで可能である。また、所属グループの情報が検索要求に含まれている場合には、検索要求から取得するようにしても良い。
【0036】
次にランキングスコア補正部24は、検索されたコンテンツごとに、以下の処理を繰り返す。
【0037】
まずランキングスコア補正部24は、当該コンテンツがどのサーバに記憶されているコンテンツであるかを認識する。この認識は、例えばコンテンツのURI情報と各サーバグループ3−1〜3−4に含まれるサーバのURI情報とを比較することにより可能である。次に、サーバグループ重み付け情報25を参照して、検索者の所属するグループにおいて上記認識したサーバに設定された重要度を取得する。例えば、検索者がスタッフ部門に属しており、当該コンテンツが研究部門サーバグループ3−4のサーバに記憶されている場合には、重要度として0を取得する。次に、当該コンテンツのスコアを重要度により補正する。この補正の方法は任意である。例えば、スコアに重要度の値を乗算した結果を、補正後のスコアとすることができる。
【0038】
ランキングスコア補正部24は、補正後のランキングスコアを付与した検索結果のリストを検索結果リスト返却部22に返却する(S5)。
【0039】
検索結果リスト返却部22は、補正されたランキングスコアで検索結果を降順に並べ替えて、検索端末1へ送信する(S6)。
【0040】
検索者が返却された検索結果リストより閲覧したいコンテンツを選択すると(S7)、検索端末1は、サーバグループ群3中の当該コンテンツが格納されているサーバより、当該コンテンツを取得し、端末画面に表示する(S8)。
【0041】
このように本実施形態によれば、検索者と関係のない部門のコンテンツのランキングを下げることができる。
【0042】
[第3の実施形態]
図5を参照すると、本発明の第3の実施形態は、図2に示した第2の実施形態と比較して、ランキングスコア計算部23の代わりに、ランキングスコア計算部23Aを有する点でのみ相違する。
【0043】
ランキングスコア計算部23Aは、ランキングスコア補正部24と同様な方法により、検索者の所属するグループを判別し、この判別したグループに対応する各サーバグループの重要度をサーバグループ重み付け情報25から取得する。そして、最低の重要度になっているサーバグループが存在すれば、そのサーバグループに属するサーバを検索対象から除外し、残りのサーバを対象として検索を行う。
【0044】
例えば、ランキングスコア計算部23Aは、検索者がスタッフ部門に所属している場合、図3のサーバグループ重み付け情報25から、スタッフ部門に対応する重要度として、スタッフ部門サーバグループの重要度=1、営業部門サーバグループの重要度=0.5、開発部門サーバグループの重要度=0.3、研究部門サーバグループの重要度=0を取得する。そして、研究部門サーバグループの重要度が0なので、研究部門サーバグループに属するサーバを検索対象から除外し、スタッフ部門サーバグループに属するサーバ、営業部門サーバグループに属するサーバ、開発部門サーバグループに属するサーバを対象として、検索キーワードを含むコンテンツを検索する。
【0045】
このように本実施形態によれば、補正後のランキングが充分に低くなることが推測されるコンテンツを無駄に検索することがなくなるため、効率的な検索が可能になる。
【0046】
[第4の実施形態]
図6を参照すると、本発明の第4の実施形態は、図2に示した第2の実施形態と比較して、サーバグループ重み付け情報25が省略されていること、ランキングスコア補正部24の代わりに、ランキングスコア補正部24Aを有すること、検索端末1から検索サーバ2に送られる検索要求に、検索対象サーバグループ情報11が含まれることでのみ相違する。
【0047】
検索対象サーバグループ情報11は、検索者の所属するグループに対応する各サーバグループの重要度を含む情報である。
【0048】
ランキングスコア補正部24Aは、ランキングスコア補正部24と比較して、補正に使用する重要度を、検索要求に含まれる検索対象サーバグループ情報11から取得する点で相違する。
【0049】
次に本実施形態の動作を第2の実施形態との相違点を中心に説明する。
【0050】
検索者が、検索端末1を使って、検索キーワードおよび検索対象サーバグループ情報11を入力したとすると、入力されたキーワードおよび検索対象サーバグループ情報11を含む検索要求は、検索端末1から検索サーバ2に送信される。検索要求受付部21は、検索端末1から送信されたキーワードを含む検索要求を受け取り、ランキングスコア計算部23に渡す。ランキングスコア計算部23は、検索要求中のキーワードを含むコンテンツを検索し、検索されたコンテンツのランキングスコアを一般的なランキングアルゴリズムを使って計算する。
【0051】
次に、ランキングスコア補正部24Aは、検索要求中から検索対象サーバグループ情報11を取得し、ランキングスコア補正部24と同様の方法によりランキングスコア計算部23で計算されたランキングスコアを補正する。次に、検索結果リスト返却部22は、補正されたランキングスコアで検索結果を降順に並べ替えて、検索端末1へ送信する。
【0052】
このように本実施形態によれば、検索者と関係のない部門のコンテンツのランキングを下げることができる。また、検索サーバ2でサーバグループ重み付け情報25を記憶しておく必要がなくなる。
【0053】
[第5の実施形態]
図7を参照すると、本発明の第5の実施形態は、図6に示した第4の実施形態と比較して、ランキングスコア計算部23の代わりに、ランキングスコア計算部23Bを有する点でのみ相違する。
【0054】
ランキングスコア計算部23Bは、検索要求中から検索対象サーバグループ情報11を取得する。そして、最低の重要度になっているサーバグループが存在すれば、そのサーバグループに属するサーバを検索対象から除外し、残りのサーバを対象として検索を行う。また、検索対象サーバグループ情報11中に重要度が指定されていないサーバグループが存在すれば、そのサーバグループに属するサーバを検索対象から除外し、残りのサーバを対象として検索を行う。
【0055】
例えば、ランキングスコア計算部23Bは、スタッフ部門サーバグループの重要度=1、営業部門サーバグループの重要度=0.5、開発部門サーバグループの重要度=0.3、研究部門サーバグループの重要度=0を記述した検索対象サーバグループ情報11を取得した場合、研究部門サーバグループの重要度が0なので、検索対象から研究部門サーバグループに属するサーバを除外し、スタッフ部門サーバグループに属するサーバ、営業部門サーバグループに属するサーバ、開発部門サーバグループに属するサーバを対象として、検索キーワードを含むコンテンツを検索する。
【0056】
またランキングスコア計算部23Bは、例えば、スタッフ部門サーバグループの重要度=1、営業部門サーバグループの重要度=0.5、開発部門サーバグループの重要度=0.3を記述した検索対象サーバグループ情報11を取得した場合、研究部門サーバグループの重要度が記述されていないので、検索対象から研究部門サーバグループに属するサーバを除外し、スタッフ部門サーバグループに属するサーバ、営業部門サーバグループに属するサーバ、開発部門サーバグループに属するサーバを対象として、検索キーワードを含むコンテンツを検索する。
【0057】
このように本実施形態によれば、補正後のランキングが充分に低くなることが推測されるコンテンツを無駄に検索することがなくなるため、効率的な検索が可能になる。
【0058】
以上本発明の実施の形態について説明したが、本発明は以上の実施の形態にのみ限定されず、その他各種の付加変更が可能である。また、本発明の検索装置は、その有する機能をハードウェア的に実現することは勿論、コンピュータとプログラムとで実現することができる。プログラムは、磁気ディスクや半導体メモリ等のコンピュータ可読記録媒体に記録されて提供され、コンピュータの立ち上げ時などにコンピュータに読み取られ、そのコンピュータの動作を制御することにより、そのコンピュータを前述した各実施の形態における検索装置として機能させる。
【符号の説明】
【0059】
1 検索端末
2 検索サーバ
3 サーバグループ群
4 ネットワーク
11 検索対象サーバグループ情報
21 検索要求受付部
22 検索結果リスト返却部
23 ランキングスコア計算部
23A ランキングスコア計算部
23B ランキングスコア計算部
24 ランキングスコア補正部
24A ランキングスコア補正部
100 検索装置
101 検索手段
102 ランキング補正手段

【特許請求の範囲】
【請求項1】
検索者からの検索要求に従って複数のサーバからコンテンツを検索し、該検索したコンテンツごとに第1のスコアを算出し、該算出した第1のスコアでランキング付けした一次検索結果を作成する検索手段と、
前記検索されたコンテンツについて、前記第1のスコアと、前記検索者の所属するグループに対応する各サーバグループの重要度のうち当該コンテンツを記憶するサーバが属するサーバグループの重要度とを考慮して第2のスコアを算出し、該算出した第2のスコアでランキング付けした二次検索結果を出力するランキング補正手段と
を備えることを特徴とする検索装置。
【請求項2】
検索者の所属するグループごとに各サーバグループの重要度を記憶する重要度記憶手段を備え、
前記ランキング補正手段は、前記重要度記憶手段から前記算出に使用する前記重要度を取得する
ことを特徴とする請求項1に記載の検索装置。
【請求項3】
前記検索手段は、前記検索者の所属するグループに対応する各サーバグループの重要度を前記重要度記憶手段から取得し、該取得した重要度が予め定められた最低の重要度であるサーバグループについては、検索対象から除外する
ことを特徴とする請求項2に記載の検索装置。
【請求項4】
前記検索要求は、前記検索者の所属するグループに対応する各サーバグループの重要度を含み、
前記ランキング補正手段は、前記検索要求から前記算出に使用する前記重要度を取得する
ことを特徴とする請求項1に記載の検索装置。
【請求項5】
前記検索手段は、前記検索要求から前記検索者の所属するグループに対応する各サーバグループの重要度を取得し、該取得した重要度が予め定められた最低の重要度であるサーバグループについては、検索対象から除外する
ことを特徴とする請求項4に記載の検索装置。
【請求項6】
検索手段とランキング補正手段とを有する検索装置で実行される検索方法であって、
前記検索手段が、検索者からの検索要求に従って複数のサーバからコンテンツを検索し、該検索したコンテンツごとに第1のスコアを算出し、該算出した第1のスコアでランキング付けした一次検索結果を作成し、
前記ランキング補正手段が、前記検索されたコンテンツについて、前記第1のスコアと、前記検索者の所属するグループに対応する各サーバグループの重要度のうち当該コンテンツを記憶するサーバが属するサーバグループの重要度とを考慮して第2のスコアを算出し、該算出した第2のスコアでランキング付けした二次検索結果を出力する
ことを特徴とする検索方法。
【請求項7】
コンピュータを、
検索者からの検索要求に従って複数のサーバからコンテンツを検索し、該検索したコンテンツごとに第1のスコアを算出し、該算出した第1のスコアでランキング付けした一次検索結果を作成する検索手段と、
前記検索されたコンテンツについて、前記第1のスコアと、前記検索者の所属するグループに対応する各サーバグループの重要度のうち当該コンテンツを記憶するサーバが属するサーバグループの重要度とを考慮して第2のスコアを算出し、該算出した第2のスコアでランキング付けした二次検索結果を出力するランキング補正手段と
して機能させるためのプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2011−198319(P2011−198319A)
【公開日】平成23年10月6日(2011.10.6)
【国際特許分類】
【出願番号】特願2010−67245(P2010−67245)
【出願日】平成22年3月24日(2010.3.24)
【出願人】(000004237)日本電気株式会社 (19,353)
【Fターム(参考)】