説明

代表者の信頼度を用いた検索結果順位化装置および方法

【課題】代表者の信頼度を用いた検索結果順位化装置および方法を提供する。
【解決手段】代表者の信頼度を用いた検索結果順位化装置は、検索クエリに対する検索結果文書を抽出する検索部と、前記検索結果文書に対する代表者を抽出する代表者抽出部と、前記代表者に対する信頼度を算出する信頼度算出部と、前記信頼度を考慮して前記検索結果文書を順位化する順位化部と、を含む。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、検索クエリに対応した検索結果文書の代表者を抽出して代表者の信頼度を考慮して検索結果文書を順位化する装置および方法に関する。
【背景技術】
【0002】
検索キーワードに対応して検索結果として示されるページには、検索キーワードを主題とするサイト、検索キーワードを内容に含むブログ、カフェ、掲示板、ニュース、ウェブ文書などが掲載される。
【発明の概要】
【発明が解決しようとする課題】
【0003】
このような検索結果を順位化する過程において、該当文書のキーワードとの類似度または該当文書のページランクなどだけを考慮して見たところ、信頼性が不足する文書が検索結果の上段に表示される場合が発生する。これによって、検索キーワードを含んでいたとしても検索意図に適合しない文書が検索結果として表示されるようになり、検索結果の信頼度が保障されない場合が発生する。
【0004】
これは、検索キーワードを含むそれぞれの文書自体の関連度または人気度だけを考慮して順位化を行うためである。
【0005】
したがって、ユーザの検索意図により適合し、検索の信頼性を向上させることができる検索結果順位化装置および方法が求められる。
【課題を解決するための手段】
【0006】
本発明は、検索結果文書に対する代表者を抽出し、前記代表者の信頼度を考慮して前記検索結果文書を順位化することにより、ユーザの検索意図に適合して信頼性の高い検索結果文書を優先順位で提供できる検索結果順位化装置および方法を提供する。
【0007】
本発明は、検索結果文書の代表者に対する信頼度を抽出するために前記代表者が運営するサイトのページランク、訪問者数、および下位文書の品質値などのさまざまな要素を考慮することによって、代表者に対する信頼度をより正確に抽出する検索結果順位化装置および方法を提供する。
【0008】
本発明は、検索クエリに代表者名が含まれる場合、代表者名と関連する文書に重みを付与して検索結果文書を順位化することにより、ユーザの意図により適合した検索結果に対して優先順位を付けて提供できる検索結果順位化装置および方法を提供する。
【0009】
本発明の一実施形態に係る検索結果順位化装置は、検索クエリに対する検索結果文書を抽出する検索部と、前記検索結果文書に対する代表者を抽出する代表者抽出部と、前記代表者に対する信頼度を算出する信頼度算出部と、前記信頼度を考慮して前記検索結果文書を順位化する順位化部と、を含む。
【0010】
また、本発明の一実施形態に係る検索結果順位化装置は、前記代表者抽出部は、前記検索結果文書がブログポスト(blog post)である場合、ブログ所有者を代表者として抽出し、前記検索結果文書がカフェの投稿メッセージである場合、前記カフェを代表者として抽出し、前記検索結果文書がウェブページである場合、ウェブサイトを代表者として抽出し、前記検索結果文書がニュースである場合、前記ニュースを提供する報道機関を代表者として抽出してもよい。
【0011】
また、本発明の一実施形態に係る検索結果順位化装置は、前記信頼度算出部は、前記代表者が運営するサイトのページランク、訪問者数、および下位文書の品質値のうち少なくとも1つを用いて信頼度を算出してもよい。
【0012】
また、本発明の一実施形態に係る検索結果順位化装置は、前記信頼度算出部は、それぞれの検索クエリに対応して前記代表者の信頼度を算出してもよい。
【0013】
また、本発明の一実施形態に係る検索結果順位化装置は、前記順位化部は、前記検索結果文書の前記検索クエリとの類似度、前記検索結果文書のページランク、および前記信頼度のうち少なくとも1つを用いて前記検索結果文書を順位化してもよい。
【0014】
また、本発明の一実施形態に係る検索結果順位化装置は、前記検索クエリは代表者名を含み、前記順位化部は、前記代表者名と関連する代表者サイトの下位文書に重みを付与して順位化してもよい。
【0015】
本発明の一実施形態に係る検索結果順位化方法は、検索クエリに対する検索結果文書を抽出し、前記検索結果文書に対する代表者を抽出し、前記代表者に対する信頼度を算出し、前記信頼度を考慮して前記検索結果文書を順位化する、ことを含んでもよい。
【0016】
また、本発明の一実施形態に係る検索結果順位化方法は、前記代表者を抽出することは、前記検索結果文書のURLパターンを分析して、前記URLパターンを用いて代表者を抽出してもよい。
【0017】
また、本発明の一実施形態に係る検索結果順位化方法は、前記代表者を抽出することは、予め選定された代表者プール(pool)から前記検索結果文書に対応する代表者を抽出してもよい。
【発明の効果】
【0018】
本発明の一実施形態によれば、検索結果文書に対する代表者を抽出して、代表者の信頼度を考慮して検索結果文書を順位化することにより、ユーザの検索意図に適合して信頼性の高い検索結果文書に対して優先順位を付けて提供できる検索結果順位化装置および方法が提供される。
【0019】
本発明の一実施形態によれば、検索結果文書の代表者に対する信頼度を抽出するために代表者が運営するサイトのページランク、訪問者数、および下位文書の品質値などのさまざまな要素を考慮することによって、代表者に対する信頼度をより正確に抽出する検索結果順位化装置および方法が提供される。
【0020】
本発明の一実施形態によれば、検索クエリに代表者名が含まれる場合、代表者名と関連する文書に重みを付与して検索結果文書を順位化することにより、ユーザの意図により適合した検索結果に対して優先順位を付けて提供できる検索結果順位化装置および方法が提供される。
【図面の簡単な説明】
【0021】
【図1】本発明の一実施形態において、検索結果順位化装置を示すブロック図である。
【図2】本発明の一実施形態において、検索結果文書の代表者を抽出する過程を示す図である。
【図3】本発明の一実施形態において、信頼度を考慮しない検索結果文書リストの出力を説明するための図である。
【図4】本発明の一実施形態において、信頼度を考慮した検索結果文書リストの出力を説明するための図である。
【図5】本発明の一実施形態において、代表者名に重みを付与せずに検索結果文書リストを出力した結果を説明するための図である。
【図6】本発明の一実施形態において、代表者名に重みを付与して検索結果文書を順位化する方法を説明するための図である。
【図7】本発明の一実施形態において、検索結果順位化方法を示すフローチャートである。
【発明を実施するための形態】
【0022】
以下、添付する図面に記載された内容を参照しながら本発明の実施形態を詳細に説明する。ただし、本発明が実施形態によって制限され、限定されることはない。各図面に提示する同一の参照符号は、同一の部材を示す。検索結果順位化方法は、検索結果順位化装置を構成する構成要素によってなされる。
【0023】
図1は、本発明の一実施形態において、検索結果順位化装置を示すブロック図である。
【0024】
図1を参照すれば、検索結果順位化装置100は、検索部110と、代表者抽出部120と、信頼度算出部130と、順位化部140と、を含んでもよい。
【0025】
検索部110は、検索クエリに対する検索結果文書を抽出してもよい。すなわち、検索部110は、ユーザから入力された検索クエリに対応して1つ以上の検索結果文書を抽出してもよい。ここで、検索クエリは、代表者名を含んでもよい。
【0026】
代表者抽出部120は、検索結果文書に対する代表者を抽出してもよい。ここで、代表者は、検索結果文書の代表サイトと、検索結果文書の情報の出所のうち少なくとも1つであってもよい。一方、代表者抽出は、予め選定された計算方式によって、自動的に抽出されるようにしてもよい。この時、すべての検索結果文書に対して代表者を選定せずに、一定の条件を満足する検索結果文書に対してのみ代表者を抽出するようにしてもよい。例えば、サイトのページランク、ブログランク、訪問者数、下位文書の品質値などを考慮して代表者を抽出する基準を設定し、検索結果文書が含まれるサイトが代表者を抽出する基準以上の値を有する場合にだけ検索結果文書に対する代表者を抽出するようにしてもよい。一例として、ブログランキング300位内のブログに対してのみ代表者を抽出しようとする時、検索結果文書が掲載されたブログが500位のブログランキングを有するのであれば、検索結果文書に対しては代表者を抽出しないようにしてもよい。
【0027】
代表者抽出の一実施形態について図2を参考にしながら、以下に詳しく説明する。
【0028】
図2は、本発明の一実施形態において、検索結果文書の代表者を抽出する過程を示す図である。
【0029】
図2を参照すれば、検索結果文書210の種類によって代表者がさまざまに選択される。例えば、検索結果文書210がブログポストである場合、ブログ所有者211を代表者として抽出し、検索結果文書210がカフェの投稿メッセージである場合、カフェ212を代表者として抽出し、検索結果文書210がウェブページの場合、ウェブサイト213を代表者として抽出し、検索結果文書210がニュースである場合、ニュースを提供する報道機関214を代表者として抽出してもよい。すなわち、代表者は、検索結果文書の出所と認識される代表サイト、人、会社などを意味してもよい。
【0030】
再び図1を参照すれば、代表者は、検索結果文書のURLパターンを分析し、分析したURLパターンを用いて抽出してもよい。例えば、「スポーツ朝鮮」の下位文書は「http://sports.chosun.com」を含むため、「http://sports.chosun.com」を代表者抽出のためのURLとして決定してもよい。したがって、URLの前部が「http://sports.chosun.com」で始まる文書に対しては、すべて「スポーツ朝鮮」を代表者として抽出することができる。すなわち、URL「http://sports.chosun.com」で始まる文書に対しては「スポーツ朝鮮」に対する信頼度に基づいて順位化することができる。
【0031】
信頼度算出部130は、代表者に対する信頼度を算出してもよい。すなわち、抽出された代表者に対する信頼度を予め選定された方法によって算出して検索結果文書に対する信頼度を推定してもよい。信頼度算出の一例として、代表者が運営するサイトのページランク、訪問者数、および下位文書の品質値のうち少なくとも1つを用いて信頼度を算出してもよい。したがって、代表者が運営するサイトのページランクが高いほど、訪問者数が多いほど、下位文書の品質値が高いほど代表者の信頼度が高くなり得る。
【0032】
また、信頼度算出部130は、予め選定された代表者プール(pool)に含まれた代表者に対してのみ信頼度を算出してもよい。例えば、すべての検索結果文書の代表者に対して信頼度を算出するのではなく、代表者プールに含まれる代表者に対してのみ信頼度を算出してもよい。すなわち、代表者プールに含まれる代表者に対してのみ信頼度を算出することによって、信頼度算出に過度な負荷がかからないようにできる。
【0033】
順位化部140は、信頼度を考慮して検索結果文書を順位化してもよい。例えば、検索結果文書の代表者に対する信頼度が高いほど、高い順位の検索結果から出力される。この時、信頼度だけでなく、検索結果文書の検索クエリとの類似度、検索結果文書のページランクなどを共に考慮して検索結果文書を順位化してもよい。
【0034】
一方、検索クエリが代表者名を含む場合、代表者名に対応する代表者を抽出して、代表者と関連する検索結果文書には重みを付与して順位化してもよい。
【0035】
例えば、ユーザが「KTX釜山」を検索語で入力する場合にKTXが代表者名に分類されて代表者名と関連するサイトである「http://www.korail.com」(以下「コレイル」という)を代表者としてもよい。したがって、代表者名と関連するサイトの下位ページの中に「釜山」というキーワードを有する文書が検索される場合、「釜山」というキーワードを有する文書には、重みが付与されて検索結果の上段に位置するようにしてもよい。
【0036】
上記のように、検索結果文書に対する代表者を抽出し、代表者の信頼度を考慮して検索結果文書を順位化することにより、ユーザの検索意図に適合して信頼性の高い検索結果文書に対して優先順位を付けて提供することができる。
【0037】
図3は、本発明の一実施形態において、信頼度を考慮しない検索結果文書リストの出力を説明するための図である。
【0038】
図3を参照すれば、ユーザが検索クエリで「旅行情報」を入力した場合、複数の検索結果文書に対するリストをウェブブラウザウィンドウ310を介してユーザに提供することができる。この時、各検索結果文書は、検索結果文書に対する信頼度は考慮せずに、検索クエリとの類似度、検索結果文書のページランクのうち少なくとも1つを用いて順位化して提供するものであってもよい。図3の場合、ユーザの検索クエリ「旅行情報」に対応する検索結果文書として「韓国観光公社」311、「Tour123」312、「ジオトラベル」313、「ネイバー旅行」314などを順に提供してもよい。この場合、検索クエリと関連する内容が含まれているが、ユーザの所望する情報とは関係が少ない検索結果文書が上位順位に表示されてユーザに提供されることもある。
【0039】
図4は、本発明の一実施形態において、信頼度を考慮した検索結果文書リストの出力を説明するための図である。
【0040】
図4を参照すれば、図3のようにユーザが検索クエリで「旅行情報」を入力した場合、複数の検索結果文書に対するリストをウェブブラウザウィンドウ410を介してユーザに提供することができる。ここで、複数の検索結果文書は、各検索結果文書の代表者に対する信頼度を考慮して順位化して提供してもよい。図4の場合、検索結果文書として「韓国観光公社」411、「ネイバー旅行」412、「ジオトラベル」413、「Tour123」414などを抽出してもよい。
【0041】
この時、「韓国観光公社」411に対する代表者は、韓国観光公社自体または韓国観光公社の代表サイトとしてもよい。したがって、韓国観光公社自体または韓国観光公社の代表サイトの信頼度を抽出することができる。ここで、信頼度は数値化して格納してもよく、韓国観光公社411の場合、一例として信頼度「90」を有することもある。
【0042】
また、「Tour123」412の場合、「Tour123」412の代表サイトまたはサイト運営者を代表者として抽出してもよく、「Tour123」412の代表サイトまたはサイト運営者に対する信頼度を抽出してもよい。この時、「Tour123」412の場合、一例として、信頼度「30」を有することもある。
【0043】
また、「ジオトラベル」413の場合、「ジオトラベル」413の代表サイトまたはサイト運営者を代表者として抽出してもよく、「ジオトラベル」413の代表サイトまたはサイト運営者に対する信頼度が抽出されてもよい。この時、「ジオトラベル」413の場合、一例として、信頼度「50」を有することもある。
【0044】
また、「ネイバー旅行」414の場合、ネイバーの代表サイトなどが代表者として抽出されてもよく、ネイバーの代表サイトに対する信頼度が抽出されてもよい。この時、「ネイバー」414の場合、一例として、信頼度「80」を有することもある。
【0045】
したがって、各検索結果文書の信頼度を考慮して検索結果文書を順位化する場合、図4に示すように、「韓国観光公社」411、「ネイバー旅行」412、「ジオトラベル」413、「Tour123」414などの順序で検索結果を提供してもよい。すなわち、図3の場合のように、信頼度が低い「Tour123」312などが上位ランクに提供されず、「ネイバー旅行」412のような信頼度の高い代表者の下位文書を高い順位で提供してもよい。
【0046】
図5は、本発明の一実施形態において、代表者名に重みを付与せずに検索結果文書リストを出力した結果を説明するための図である。
【0047】
図5を参照すれば、ユーザが検索クエリで「KTX釜山」を入力した場合、複数の検索結果文書に対するリストをウェブブラウザウィンドウ510を介してユーザに提供することができる。この時、複数の検索結果文書は、「KTX」と「釜山」をすべて含む検索結果文書を抽出してユーザに提供してもよい。この場合、代表者名に重みを付与せずにユーザに検索結果文書を提供する場合、地球ツアーの第1下位文書511、地球ツアーの第2下位文書512、oktourの下位文書513、およびユーアンドアイ(UNI)旅行社514の下位文書などを順次提供してもよい。
【0048】
図6は、本発明の一実施形態において、代表者名に重みを付与して検索結果文書を順位化する方法を説明するための図である。
【0049】
図6を参照すれば、ユーザが検索クエリで「KTX釜山」を入力した場合、複数の検索結果文書に対するリストをウェブブラウザウィンドウ610を介してユーザに提供することができる。この時、検索クエリ中「KTX」を代表者名に分類し、代表者名に重みを付与して検索結果文書を順位化してもよい。ここで、代表者名は、代表者が運営するサイト名および代表者が運営するサイトと関連するキーワードのうち少なくとも1つを含むものであってもよい。ここで、代表者名「KTX」に対応する代表者を検出すれば、代表者名「KTX」と関連するサイトのうち代表サイトの「コレイル」を代表者として検出してもよい。したがって、「コレイル」の下位ページのうち「釜山」というキーワードを有する文書が検索される場合、「釜山」というキーワードを有する文書に重みを付与して検索結果の上段に表示してもよい。図6の場合、代表者「コレイル」の下位ページのうち「釜山」というキーワードを有する「コレイル」の第1下位文書611および「コレイル」の第2下位文書612が第1順位および第2順位として表示され、代表者が「コレイル」でない地球ツアーの第1下位文書613および地球ツアーの第2下位文書613は、第3順位および第4順位として表示してもよい。
【0050】
上記のように、検索クエリに代表者名が含まれる場合、代表者名に重みを付与して検索結果文書を順位化することにより、ユーザの意図により適合した検索結果に対して優先順位を付けて提供してもよい。
【0051】
図7は、本発明の一実施形態において、検索結果順位化方法を示すフローチャートである。
【0052】
図7を参照すれば、ステップ710では検索クエリに対する検索結果文書を抽出してもよい。ここで、検索クエリには代表者名を含んでもよい。ここで、代表者名は、代表者が運営するサイト名および代表者が運営するサイトと関連するキーワードのうち少なくとも1つを含んでもよい。この場合、代表者名と関連する代表者を抽出して代表者の下位文書が検索結果文書に含まれる場合には、代表者の下位文書は検索結果の上位ランクに表示してユーザに提供してもよい。
【0053】
ステップ720では、検索結果文書に対する代表者を抽出してもよい。ここで、代表者は予め選定された代表者プール(pool)から抽出してもよい。代表者抽出の一例として、検索結果文書がブログポスト(blog post)である場合、ブログ所有者を代表者として抽出し、検索結果文書がカフェの投稿メッセージである場合、カフェを代表者として抽出し、検索結果文書がウェブページである場合、ウェブサイトを代表者として抽出し、検索結果文書がニュースである場合、ニュースを提供する報道機関を代表者として抽出してもよい。また、ステップ720は、検索結果文書のURLパターンを分析して代表者を抽出するための最小URLを決定するステップと、検索結果文書中最小URLを含む文書を分類するステップと、分類された文書に対する代表者を抽出するステップと、を含んでもよい。例えば、検索結果文書のURLパターンを分析して、「http://blog.naver.com/idxxxx」を代表者分類のための最小URLとして決定してもよい。以降、検索結果文書中URLの前部に「http://blog.naver.com/idxxxx」を含む文書を分類して、分類された文書に対してはURLをアドレスとして用いるブログの所有者を代表者として抽出してもよい。以降、「http://blog.naver.com/idxxxx」を含む文書は、ブログ所有者に対する信頼度を考慮して順位化してもよい。
【0054】
ステップ730では、代表者に対する信頼度を算出してもよい。ここで、信頼度は、一例として、代表者が運営するサイトのページランク、訪問者数、および下位文書の品質値のうち少なくとも1つを用いて算出してもよい。したがって、代表者が運営するサイトのページランクが高いほど、訪問者数が多いほど、下位文書の品質値が高いほど代表者の信頼度が高まり、代表者の下位文書には検索結果出力時に高い順位を付けて提供してもよい。
【0055】
ステップ740では、信頼度を考慮して検索結果文書を順位化してもよい。すなわち、信頼度の高い代表者を有する検索結果文書は、高い順位に表示してもよい。また、信頼度を考慮して検索結果文書を順位化する場合、信頼度だけでなく検索クエリとの類似度、検索結果文書のページランクなどを共に考慮してもよい。
【0056】
一方、図7で説明していない部分は、図1〜図6の説明を参考にすることができる。
【0057】
上記のように、検索結果文書を順位化して提供するために、検索結果文書に対する代表者を抽出し、代表者の信頼度を考慮して検索結果文書を順位化することにより、ユーザの検索意図に適合して信頼性の高い検索結果文書に対して優先順位を付けて提供できる装置および方法を提供することができる。この時、信頼度だけでなく検索クエリとの類似度、ページランクなどを総合的に考慮することによって、ユーザの検索意図により適合する文書を上位ランクに表示することができる。
【0058】
また、検索結果文書の代表者に対する信頼度を抽出するために代表者が運営するサイトのページランク、訪問者数、および下位文書の品質値などのさまざまな要素を考慮することによって、代表者に対する信頼度をより正確に抽出することができる。
【0059】
なお、本発明の実施形態は、コンピュータにより実現されるさまざまな動作を実行するためのプログラム命令を含むコンピュータ読取可能な記録媒体を含む。当該記録媒体は、プログラム命令、データファイル、データ構造などを単独または組み合わせて含むものであってもよく、記録媒体およびプログラム命令は、本発明の目的のために特別に設計されて構成されたものでもよく、コンピュータソフトウェア分野の技術を有する当業者にとって公知であり使用可能なものであってもよい。コンピュータ読取可能な記録媒体の例としては、ハードディスク、フロッピー(登録商標)ディスク及び磁気テープのような磁気媒体、CD−ROM、DVDのような光記録媒体、フロプティカルディスクのような磁気−光媒体、およびROM、RAM、フラッシュメモリなどのようなプログラム命令を保存して実行するように特別に構成されたハードウェア装置が含まれる。また、記録媒体は、プログラム命令、データ構造などを保存する信号を送信する搬送波を含む光または金属線、導波管などの送信媒体でもある。プログラム命令の例としては、コンパイラによって生成されるような機械語コードだけでなく、インタプリタなどを用いてコンピュータによって実行され得る高級言語コードを含む。
【0060】
上述したように、本発明の好ましい実施形態を参照して説明したが、該当の技術分野において熟練した当業者にとっては、特許請求の範囲に記載された本発明の思想および領域から逸脱しない範囲内で、本発明をさまざまに修正および変更することができることを理解することができる。すなわち、本発明の技術的範囲は、特許請求の範囲に基づいて定められ、発明を実施するための最良の形態により制限されるものではない。
【符号の説明】
【0061】
100:検索結果順位化装置
110:検索部
120:代表者抽出部
130:信頼度算出部
140:順位化部



【特許請求の範囲】
【請求項1】
検索クエリに対する検索結果文書を抽出する検索部と、
前記検索結果文書に対する代表者を抽出する代表者抽出部と、
前記代表者に対する信頼度を算出する信頼度算出部と、
前記信頼度を用いて前記検索結果文書を順位化する順位化部と、
を含む、ことを特徴とする検索結果順位化装置。
【請求項2】
前記代表者抽出部は、
前記検索結果文書がブログポストである場合、ブログ所有者を代表者として抽出し、
前記検索結果文書がカフェの投稿メッセージである場合、前記カフェを代表者として抽出し、
前記検索結果文書がウェブページである場合、前記ウェブページの代表ウェブサイトを代表者として抽出し、
前記検索結果文書がニュースである場合、前記ニュースを提供する報道機関を代表者として抽出することを特徴とする請求項1に記載の検索結果順位化装置。
【請求項3】
前記代表者抽出部は、
前記検索結果文書のURLパターンを分析して、前記URLパターンを用いて代表者を抽出することを特徴とする請求項1に記載の検索結果順位化装置。
【請求項4】
前記代表者抽出部は、
前記検索結果文書が含まれるサイトのページランク、ブログランク、訪問者数、および下位文書の品質値のうち少なくとも1つが予め選定されたそれぞれの閾値以上である場合、前記検索結果文書の代表者を抽出することを特徴とする請求項1に記載の検索結果順位化装置。
【請求項5】
前記信頼度算出部は、
予め選定された代表者プールに含まれる代表者に対して信頼度を算出することを特徴とする請求項1に記載の検索結果順位化装置。
【請求項6】
前記信頼度算出部は、
前記代表者が運営するサイトのページランク、訪問者数、および下位文書の品質値のうち少なくとも1つを用いて信頼度を算出することを特徴とする請求項1に記載の検索結果順位化装置。
【請求項7】
前記信頼度算出部は、
それぞれの検索クエリに対応して前記代表者の信頼度を算出することを特徴とする請求項1に記載の検索結果順位化装置。
【請求項8】
前記順位化部は、
前記検索結果文書の前記検索クエリとの類似度、前記検索結果文書のページランク、および前記信頼度のうち少なくとも1つを用いて前記検索結果文書を順位化することを特徴とする請求項1に記載の検索結果順位化装置。
【請求項9】
前記検索クエリは、代表者名を含み、
前記順位化部は、
前記代表者名と関連する代表者サイトの下位文書に重みを付与して順位化することを特徴とする請求項1に記載の検索結果順位化装置。
【請求項10】
前記代表者名は、
前記代表者が運営するサイト名および前記代表者が運営するサイトと関連するキーワードのうち少なくとも1つを含むことを特徴とする請求項9に記載の検索結果順位化装置。
【請求項11】
検索クエリに対する検索結果文書を抽出し、
前記検索結果文書に対する代表者を抽出し、
前記代表者に対する信頼度を算出し、
前記信頼度を用いて前記検索結果文書を順位化する、
ことを含むことを特徴とする検索結果順位化方法。
【請求項12】
前記代表者を抽出することは、
前記検索結果文書がブログポストである場合、ブログ所有者を代表者として抽出し、
前記検索結果文書がカフェの投稿メッセージである場合、前記カフェを代表者として抽出し、
前記検索結果文書がウェブページである場合、前記ウェブページの代表ウェブサイトを代表者として抽出し、
前記検索結果文書がニュースである場合、前記ニュースを提供する報道機関を代表者として抽出することを特徴とする請求項11に記載の検索結果順位化方法。
【請求項13】
前記代表者を抽出することは、
前記検索結果文書のURLパターンを分析して前記代表者を抽出するための最小URLを決定し、
前記検索結果文書中前記最小URLを含む文書を分類し、
前記分類された文書に対する代表者を抽出する、
ことを含むことを特徴とする請求項11に記載の検索結果順位化方法。
【請求項14】
前記代表者を抽出することは、
前記検索結果文書が含まれるサイトのページランク、ブログランク、訪問者数、および下位文書の品質値のうち少なくとも1つが予め選定されたそれぞれの閾値以上である場合、前記検索結果文書の代表者を抽出することを特徴とする請求項11に記載の検索結果順位化方法。
【請求項15】
前記信頼度を算出することは、
予め選定された代表者プールに含まれる代表者に対して信頼度を抽出することを特徴とする請求項11に記載の検索結果順位化方法。
【請求項16】
前記信頼度を算出することは、
前記代表者が運営するサイトのページランク、訪問者数、および下位文書の品質値のうち少なくとも1つを用いて信頼度を算出することを特徴とする請求項11に記載の検索結果順位化方法。
【請求項17】
前記信頼度を算出することは、
前記検索クエリに対応する前記代表者の信頼度を算出することを特徴とする請求項11に記載の検索結果順位化方法。
【請求項18】
前記順位化することは、
前記検索結果文書の前記検索クエリとの類似度、前記検索結果文書のページランク、および前記信頼度のうち少なくとも1つを用いて前記検索結果文書を順位化することを特徴とする請求項11に記載の検索結果順位化方法。
【請求項19】
前記検索結果文書を抽出することは、
代表者名を含む前記検索クエリに対する検索結果文書を抽出し、
前記順位化することは、
前記代表者名と関連する代表者サイトの下位文書に重みを付与して順位化することを特徴とする請求項11に記載の検索結果順位化方法。
【請求項20】
前記代表者名は、
前記代表者が運営するサイト名および前記代表者が運営するサイトと関連するキーワードのうち少なくとも1つを含むことを特徴とする請求項19に記載の検索結果順位化方法。
【請求項21】
請求項11乃至請求項20のうちいずれか一項の方法を実行するためのプログラムが記録されていることを特徴とするコンピュータで読み取り可能な記録媒体。



【図1】
image rotate

【図2】
image rotate

【図7】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate