説明

検索装置、検索方法、検索プログラムおよび記録媒体

【課題】検索サービスの検索結果において、有用度が高いウェブページのURLのうち、モバイル端末において表示可能なウェブページのURLをより上位に表示させる。
【解決手段】モバイル端末から受信する検索キーワードを受信し、定められた検索インデックスに基づいて、検索キーワードが含まれるウェブページを示すURLの一覧である検索結果を送信する検索装置が、ウェブサーバが送信するウェブページのURL毎に、そのウェブページがモバイル端末において表示可能なフォーマットに変換される際の変換量を示す変換特徴量と、そのウェブページの有用度を示すページ特徴量とが対応付けられた検索インデックスを記憶し、検索インデックスに基づいて、検索キーワードが含まれるウェブページを示すURLの一覧である検索結果を送信する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、本発明は、検索キーワードに応じたウェブページを検索する技術に関する。
【背景技術】
【0002】
インターネット等のネットワークにおいて、ユーザ端末から入力された検索キーワードが含まれるウェブページのURL(Uniform Resource Locator)を検索する検索サービスが提供されている。このような検索サービスを提供する検索装置は、ウェブページの所在を示すURL毎に、そのURLが示すウェブページの更新日付、被リンク数、ウェブページに含まれる単語やその単語の出現数などを対応付けた検索インデックスを予め生成して記憶しておくことがある。検索装置は、ユーザ端末から検索キーワードを受信すると、検索インデックスを参照して、検索キーワードが含まれるウェブページの有用度を示すポイントを算出する。そして、算出したポイントに基づいてURLの表示順位を判定し、判定した表示順位に応じたURLの一覧を検索結果としてユーザ端末に送信する。これにより、ユーザ端末に表示される検索結果において、検索キーワードに応じた有用度の高いウェブページのURLを、より上位に表示させることができる(例えば、特許文献1)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2006−107200号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、このような検索サービスでは、ユーザ端末がいわゆるPC(Personal Computer)のようなコンピュータ端末であっても、携帯電話などのモバイル端末であっても同様の検索結果が送信される。ここで、モバイル端末は、いわゆるPC等のコンピュータ端末に比べて画像に関する演算能力や表示能力等が劣っており、PCにおいて表示可能なウェブページが表示できない場合がある。モバイル端末にとって、検索結果に含まれているこのような表示不可能なウェブページのURLはノイズである。すなわち、検索装置は、モバイル端末からの検索要求に応じて検索を行う場合、モバイル端末によって表示可能か否かを考慮した検索結果を生成して送信することが望ましい。このような検索結果は上述のように予め生成された検索インデックスを参照して行われるため、モバイル端末によって表示可能か否かを考慮した検索インデックスを生成し、記憶しておくことが望ましい。
【0005】
本発明は、このような状況に鑑みてなされたもので、モバイル端末によって表示可能か否かが考慮された検索インデックスを生成し、生成した検索インデックスに基づいた検索結果を送信する検索装置、検索方法、検索プログラムおよび記録媒体を提供する。
【課題を解決するための手段】
【0006】
上述した課題を解決するために、本発明は、送信されるウェブページ取得要求に応じて定められたウェブページを送信する複数のウェブサーバと、ウェブサーバから送信されるウェブページを受信して表示するモバイル端末とにネットワークを介して接続された検索装置であって、複数のURL毎に、URLによって示されるウェブページに含まれるキーワードと、URLによって示されるウェブページがモバイル端末において表示可能なフォーマットに変換される際の変換量を示す変換特徴量と、ウェブページの有用度を示すページ特徴量とが対応付けられた検索インデックスが記憶される検索インデックス記憶部と、ウェブサーバから、定められたURLに対応するウェブページを取得するウェブページ取得部と、ウェブページ取得部によって取得されたウェブページをモバイル端末において表示可能なフォーマットに変換する変換処理を行い、変換特徴量を算出するウェブページ変換部と、ウェブページ取得部によって取得されたウェブページに対応するページ特徴量を算出するウェブページ解析部と、ウェブページ変換部によって算出された変換特徴量と、ウェブページ解析部によって算出されたページ特徴量とに基づいて検索インデックスを生成して検索インデックス記憶部に記憶させる検索インデックス生成部と、モバイル端末から送信される検索キーワードを受信し、検索インデックス記憶部に記憶された検索インデックスに基づいて、複数のウェブページのうち検索キーワードが含まれるウェブページを示すURLの一覧である検索結果を生成してモバイル端末に送信する検索処理部と、を備えることを特徴とする。
【0007】
また、本発明は、ウェブページ変換部が、ウェブページ取得部によって取得されたウェブページに含まれる画像を縮小した場合にはその縮小率と、ウェブページを複数ページに分割した場合にはその分割したページ数と、ウェブページに画像が含まれる場合にはその画像の枚数と、ウェブページのデータサイズとのうちいずれかまたは複数の情報に基づいて変換特徴量を算出することを特徴とする。
【0008】
また、本発明は、ウェブページ解析部が、ウェブページ取得部によって取得されたウェブページに含まれる単語およびその出現数と、ウェブページの被リンク数と、そのウェブページを示すURLの文字数とのうちいずれかまたは複数の情報に基づいてページ特徴量を算出することを特徴とする。
【0009】
また、本発明は、定められた一定期間毎に、ウェブページ取得部を介して、定められた複数のURLに対応するウェブページを収集するウェブページ収集部を備えることを特徴とする。
【0010】
また、本発明は、ウェブページ変換部が、モバイル端末から送信されるウェブページ取得要求を受信し、ウェブページ取得部を介して、ウェブページ取得要求に対応するウェブページをウェブサーバから取得し、取得したウェブページについて変換処理を行ない、変換後のウェブページをモバイル端末に送信することを特徴とする。
【0011】
また、本発明は、送信されるウェブページ取得要求に応じて定められたウェブページを送信する複数のウェブサーバと、ウェブサーバから送信されるウェブページを受信して表示するモバイル端末とにネットワークを介して接続され、ウェブページを示すURL毎に、URLによって示されるウェブページに含まれるキーワードと、URLによって示されるウェブページがモバイル端末において表示可能なフォーマットに変換される際の変換量を示す変換特徴量と、ウェブページの有用度を示すページ特徴量とが対応付けられた検索インデックスが記憶される検索インデックス記憶部を備えた検索装置の検索方法であって、ウェブサーバから、定められたURLに対応するウェブページを取得するステップと、取得したウェブページをモバイル端末において表示可能なフォーマットに変換する変換処理を行い、変換特徴量を算出するステップと、取得したウェブページに対応するページ特徴量を算出するステップと、算出した変換特徴量と、算出したページ特徴量とに基づいて検索インデックスを生成して検索インデックス記憶部に記憶させるステップと、モバイル端末から検索キーワードを受信し、検索インデックスに基づいて、複数のウェブページのうち検索キーワードが含まれるウェブページを示すURLの一覧である検索結果を送信するステップと、を備えることを特徴とする。
【0012】
また、本発明は、送信されるウェブページ取得要求に応じて定められたウェブページを送信する複数のウェブサーバと、ウェブサーバから送信されるウェブページを受信して表示するモバイル端末とにネットワークを介して接続され、ウェブページを示すURL毎に、URLによって示されるウェブページに含まれるキーワードと、URLによって示されるウェブページがモバイル端末において表示可能なフォーマットに変換される際の変換量を示す変換特徴量と、ウェブページの有用度を示すページ特徴量とが対応付けられた検索インデックスが記憶される検索インデックス記憶部を備えた検索装置のコンピュータに、ウェブサーバから、定められたURLに対応するウェブページを取得するステップと、取得したウェブページをモバイル端末において表示可能なフォーマットに変換する変換処理を行い、変換特徴量を算出するステップと、取得したウェブページに対応するページ特徴量を算出するステップと、算出した変換特徴量と、算出したページ特徴量とに基づいて検索インデックスを生成して検索インデックス記憶部に記憶させるステップと、モバイル端末から検索キーワードを受信し、検索インデックスに基づいて、複数のウェブページのうち検索キーワードが含まれるウェブページを示すURLの一覧である検索結果を送信するステップと、を実行させる検索プログラムである。
【0013】
また、本発明は、送信されるウェブページ取得要求に応じて定められたウェブページを送信する複数のウェブサーバと、ウェブサーバから送信されるウェブページを受信して表示するモバイル端末とにネットワークを介して接続され、ウェブページを示すURL毎に、URLによって示されるウェブページに含まれるキーワードと、URLによって示されるウェブページがモバイル端末において表示可能なフォーマットに変換される際の変換量を示す変換特徴量と、ウェブページの有用度を示すページ特徴量とが対応付けられた検索インデックスが記憶される検索インデックス記憶部を備えた検索装置のコンピュータに、ウェブサーバから、定められたURLに対応するウェブページを取得するステップと、取得したウェブページをモバイル端末において表示可能なフォーマットに変換する変換処理を行い、変換特徴量を算出するステップと、取得したウェブページに対応するページ特徴量を算出するステップと、算出した変換特徴量と、算出したページ特徴量とに基づいて検索インデックスを生成して検索インデックス記憶部に記憶させるステップと、モバイル端末から検索キーワードを受信し、検索インデックスに基づいて、複数のウェブページのうち検索キーワードが含まれるウェブページを示すURLの一覧である検索結果を送信するステップと、を実行させる検索プログラムを記録したコンピュータ読み取り可能な記録媒体である。
【発明の効果】
【0014】
以上説明したように、本発明によれば、モバイル端末から受信する検索キーワードを受信し、定められた検索インデックスに基づいて、検索キーワードが含まれるウェブページを示すURLの一覧である検索結果を送信する検索装置が、ウェブサーバが送信するウェブページのURL毎に、そのウェブページがモバイル端末において表示可能なフォーマットに変換される際の変換量を示す変換特徴量と、そのウェブページの有用度を示すページ特徴量とが対応付けられた検索インデックスを記憶し、検索インデックスに基づいて、検索キーワードが含まれるウェブページを示すURLの一覧である検索結果を送信するようにしたので、モバイル端末によって表示可能か否かが考慮された検索インデックスに基づく検索結果を提供することができる。これにより、例えば、有用度が高いウェブページのURLのうち、モバイル端末において表示可能なウェブページのURLを、検索結果における上位に表示させることができる。
【図面の簡単な説明】
【0015】
【図1】本発明の一実施形態による検索システムの構成例を示すブロック図である。
【図2】本発明の一実施形態による検索インデックス記憶部に記憶される検索インデックスのデータ例を示す図である。
【図3】本発明の一実施形態による検索システムの動作例を示すフローチャートである。
【発明を実施するための形態】
【0016】
図1は、本実施形態による検索システムの構成を示すブロック図である。検索システム1は、複数台のウェブサーバ10(ウェブサーバ10−1、ウェブサーバ10−2、・・・)と、モバイル端末20とのコンピュータ装置と、これらのコンピュータ装置に接続された検索装置30とを備えている。ここで、複数のウェブサーバ10は、それぞれが異なるウェブページを送信するコンピュータ装置であって良いが、同様の機能を有するため、特に区別する必要がない場合にはウェブサーバ10として説明する。また、ここでは一台の検索装置30を図示して説明するが、必ずしも検索装置30が備える各機能部を一台のコンピュータ装置により構成する必要はなく、ネットワーク構成や処理負荷などに応じて複数のコンピュータ装置によって構成されるようにしても良い。また、ここでは一台のモバイル端末20を図示して説明するが、検索システム1には複数のユーザによって利用される複数のモバイル端末20が接続されて良い。
【0017】
ウェブサーバ10は、モバイル端末20や検索装置30から送信されるウェブページ取得要求に応じて、定められたウェブページを送信するコンピュータ装置である。ここで、ウェブサーバ10が受信するウェブページ取得要求は、特定のURLが示すウェブページに対する取得要求である。ウェブサーバ10は、受信したウェブページ取得要求に対応するウェブページを送信する。ウェブサーバ10が送信するウェブページは、いわゆるHTML(HyperText Markup Language)ページなどが想定される。ウェブサーバ10が送信するウェブページは、予め記憶される静的なデータでも良いし、ウェブページ取得要求に含まれるパラメータ等に応じて動的に生成するデータであっても良い。また、ウェブサーバ10が送信するウェブページには、画像データ、音声データ、動画データ等が含まれていても良い。
【0018】
モバイル端末20は、ウェブサーバ10に送信したウェブページ取得要求に応じて送信されるウェブページを受信して表示するコンピュータ端末である。モバイル端末20は、ウェブサーバ10や検索装置30と無線通信を行う機能や、ユーザによる情報の入力を受付けるボタンなどの入力部、ユーザから入力された情報とウェブサーバ10や検索装置30などから送信される情報などとを表示するディスプレイである表示部等を備えている。ここで、モバイル端末20は、いわゆるPC等のコンピュータ端末に比べて画像に関する演算能力や表示能力等が劣っており、PCにおいて表示可能なウェブページが表示できないことがある携帯電話端末を想定する。すなわち、モバイル端末20は、PC向けに送信されるHTMLデータをレンダリングするいわゆるフルブラウザの機能によらず、携帯電話用に機能が縮小されたモバイルブラウザによりウェブページを解析し、表示する。
【0019】
また、モバイル端末20は、ユーザからの検索キーワードの入力を受付け、入力された検索キーワードの検索要求を検索装置30に送信する。モバイル端末20は、送信した検索要求に応じて検索装置30から送信される検索結果であるURL一覧を受信すると、受信した検索結果を表示部に表示する。また、ユーザからの操作入力に応じて検索結果に含まれるURLのうちいずれかのURLが選択されると、選択されたURLに対するウェブページ取得要求を送信する。
【0020】
検索装置30は、ウェブサーバ10およびモバイル端末20にネットワークを介して接続され、検索サービスを提供するコンピュータ装置である。検索装置30は、モバイル端末20から送信される検索要求を受信し、受信した検索要求に応じた検索キーワードが含まれるウェブページを示すURLの一覧である検索結果を生成し、モバイル端末20に送信する。検索装置30は、検索インデックス記憶部31と、検索エンジン32と、ウェブページ取得部33と、ウェブページ収集部34と、ウェブページ変換部35と、ウェブページ解析部36と、検索インデックス生成部37とを備えている。
【0021】
検索インデックス記憶部31には、ウェブサーバ10が送信するウェブページを示すURL毎に、そのURLによって示されるウェブページに含まれるキーワードと、そのウェブページがモバイル端末20のブラウザにおいて表示可能なフォーマットに変換される際の変換量を示す変換特徴量と、ウェブページの有用度を示すページ特徴量とが対応付けられた検索インデックスが記憶される。図2は、検索インデックス記憶部31に記憶される検索インデックスに含まれるデータ例を示す図である。変換特徴量は、PC向けに設計されたウェブページを、携帯電話やPDAなどの携帯機器におけるモバイルブラウザ向けのウェブページに変換する際の変換の度合いを示す値である。例えば、ウェブページに含まれる画像が縮小された場合にはその縮小率、ウェブページが複数ページに分割された場合にはその分割されたページ数、ウェブページに画像が含まれる場合にはその画像の枚数、ウェブページのデータサイズなどの情報である。ページ特徴量は、ウェブページの有用度を示す情報であり、より具体的には、ウェブページに含まれる単語(キーワード)およびその出現数と、ウェブページの被リンク数と、そのウェブページを示すURLの文字数などの情報である。
【0022】
検索エンジン32は、モバイル端末20から送信される検索キーワードを受信し、検索インデックス記憶部31に記憶された検索インデックスに含まれる変換特徴量とページ特徴量との情報を予め定められた式に適用して、検索キーワード(kw)に応じたURL毎のポイントを算出し、算出したポイント順にURLを並べた検索結果を生成し、生成した検索結果をモバイル端末20に送信する検索処理部である。ここで、ポイントを算出する式とは、例えば、以下式f(URL、kw)のように、式g(URL、kw)と、式h(URL)と、式i(URL)とに基づいて算出されるポイントの合計によって表される。
【0023】
f(URL、kw)=g(URL、kw)+h(URL)+i(URL)
【0024】
ここで、式g(URL、kw)は、URLに対応するウェブページがkwに対してどの程度適合しているかを示すページ適合度を算出する式である。例えば、式g(URL、kw)は、以下のように表される。
【0025】
g(URL、kw)=w1111(URL、kw)+w1212(URL、kw)+w1313(URL、kw)+・・・
【0026】
ここでは、w1111(URL、kw)と、w1212(URL、kw)と、w1313(URL、kw)との要素を示して説明するが、他の要素を加えるようにしても良い。また、これらの要素ごとの値は、加算しても良いし、乗算しても良いし、ページ適合度にとって否定的な要素の値は減算等するようにしても良い。w11、w12、w13、・・・は、算出される値に対する重みを示す情報である。P11(URL、kw)、P12(URL、kw)、P13(URL、kw)、・・・は、それぞれキーワードに依存するページの特徴を示す値である。例えば、P11(URL、kw)は、URLに対応するウェブページに含まれるkwの数を示す。P12(URL、kw)は、URLに対応するウェブページのタイトル部に含まれるkwの数を示す。P13(URL、kw)は、URLに対応するウェブページのアンカー部に含まれるkwの数を示す。
【0027】
式h(URL)は、キーワードに依存せず、URLに対応するウェブページがどの程度重要であるかを示す指標値を算出する式である。例えば、式h(URL)は、以下のように表される。
【0028】
h(URL)=w21(R(URL))+w22(URL長)+・・・
【0029】
ここでは、w21(R(URL))とw22(URL長)との要素を示して説明するが、他の要素を加えるようにしても良い。また、これらの要素ごとの値は、加算しても良いし、乗算しても良いし、ウェブページがどの程度重要であるかを示す指標値にとって否定的な要素の値は減算等するようにしても良い。w21、w22は、算出される値に対する重みを示す情報である。R(URL)は、URLに対応するウェブページの人気度を示す値である。人気度は、例えば、そのウェブページの被リンク数などに基づいて予め算出される。URL長は、URLの文字数を示す。
【0030】
式i(URL)は、PC用のウェブページがモバイル端末用のウェブページに変換された後のウェブページが、モバイル端末において閲覧可能に表示される度合いを示すモバイル端末表示適合度を算出する式である。例えば、式i(URL)は、具体的には以下のように表される。
【0031】
i(URL)=w3131(URL)+w3232(URL)+w3333(URL)+・・・
【0032】
ここでは、w3131(URL)と、w3232(URL)と、w3333(URL)との要素を示して説明するが、他の要素を加えるようにしても良い。また、これらの要素ごとの値は、加算しても良いし、乗算しても良いし、モバイル端末表示適合度にとって否定的な要素の値は減算等するようにしても良い。w31、w32、w33は、算出される値に対する重みを示す情報である。ここで、P31(URL)、P32(URL)、P33(URL)、・・・は、それぞれウェブページの変換特徴量を示す値である。例えば、P31(URL)は、URLに対応するウェブページを分割したページ数を示す。P32(URL)は、URLに対応するウェブページに含まれる画像枚数を示す。P33(URL)は、URLに対応するウェブページのページサイズを示す。
【0033】
ここで、w11、w12、w13、w21、w22、w31、w32、w33・・・などの重みの値は、予め定められる値を用いても良いし、例えばサンプルページに対してモバイル端末表示適合度を付与した事例に基づいて、SVM(Support Vector Machine)などの機械学習によって算出される値を用いるようにしても良い。検索エンジン32は、このように算出したポイントに基づいて、検索キーワードが含まれるURLの表示順位を判定し、判定した表示順位に応じて複数のURLを並べた検索結果を生成し、モバイル端末20に送信する。ここでは、例えば算出したポイントの降順に、URL一覧を生成する。
【0034】
ウェブページ取得部33は、ウェブページ収集部34やウェブページ変換部35によって入力されるURLに応じたウェブページ取得要求をウェブサーバ10に送信し、送信したウェブページ取得要求に応じてウェブサーバ10から送信されるウェブページを取得する。
【0035】
ウェブページ収集部34は、定められた一定期間毎に、ウェブページ取得部33を介して、定められた複数のURLに対応するウェブページを収集する。例えば、ウェブページ収集部34は、収集対象となる複数のウェブページのURLを予め自身の記憶領域に記憶しておき、一定期間毎に収集対象のURLをウェブページ取得部33に入力する。ウェブページ収集部34は、いわゆるクローラの機能を有し、ウェブページ取得部33を介して取得したウェブページに含まれるリンクを辿って別のウェブページを取得する。
【0036】
ウェブページ変換部35は、ウェブページ取得部33によって取得されたウェブページを、モバイル端末用のウェブページに変換する変換処理を行い、変換特徴量を算出する。ウェブページ変換部35による変換処理は、以下のような処理を含む。例えば、ウェブページに含まれる画像のサイズが定められた閾値を超える場合には、その画像を定められたサイズに縮小する。また、ウェブページのサイズが予め定められたサイズを超える場合には、定められたサイズ以下の複数のページに分割する。また、ウェブページに、クライアントにおいて動作するスクリプト要素やスタイルシート要素などが含まれる場合には、その要素を削除する。また、ウェブページに含まれる文字コードがモバイルブラウザにおいて表示できない文字コードである場合には、文字コードを変換する。
【0037】
また、ウェブページ変換部35は、このような変換処理に伴うウェブページの変換量を算出する。ウェブページ変換部35は、例えば、ウェブページ取得部33によって取得されたウェブページに含まれる画像を縮小した場合にはその縮小率と、ウェブページを複数ページに分割した場合にはその分割したページ数と、ウェブページに画像が含まれる場合にはその画像の枚数と、ウェブページのデータサイズとのうちいずれかまたは複数の情報等に基づいて変換特徴量を算出する。また、ウェブページ変換部35は、モバイル端末20から送信されるウェブページ取得要求に応じて、ウェブページ取得部33を介してウェブサーバ10からウェブページを取得し、上述の変換処理を行って変換後のウェブページをウェブページ変換部35に送信する。
【0038】
ウェブページ解析部36は、ウェブページ取得部33によって取得されたウェブページに対応するページ特徴量を算出する。ここでは、例えば、ウェブページ取得部33によって取得されたウェブページに含まれる単語およびその出現数と、ウェブページの被リンク数と、そのウェブページに対応するURLの文字数とのうちいずれかまたは複数の情報等に基づいてページ特徴量を算出する。
検索インデックス生成部37は、ウェブページ取得部33によって取得されたウェブページを示すURL毎に、ウェブページ変換部によって算出された変換特徴量と、ウェブページ解析部によって算出されたページ特徴量とに基づいて検索インデックスを生成し、検索インデックス記憶部31に記憶させる。
【0039】
次に、本実施形態による検索システム1の動作例を説明する。図3は、本実施形態による検索システム1が検索インデックスを生成する動作例を示すフローチャートである。
まず、ウェブページ収集部34は、定められた一定時間毎に、収集対象のウェブページを示すURLをウェブページ取得部33に入力する。ウェブページ取得部33は、ウェブページ収集部34によって入力されるURLに応じてウェブサーバ10にアクセスし、ウェブページ取得要求を送信する。ウェブサーバ10は、ウェブページ収集部34から送信されたウェブページ収集要求に応じたウェブページを、検索装置30に送信する。ウェブページ取得部33は、ウェブサーバ10から送信されたウェブページを受信する(ステップS1)。
【0040】
ウェブページ変換部35は、ウェブページ取得部33が取得したウェブページを、モバイル端末用のウェブページに変換し、変換特徴量を算出する(ステップS2)。一方、ウェブページ解析部36は、ウェブページ取得部33が取得したウェブページのページ特徴量を算出する(ステップS3)。そして、検索インデックス生成部37は、ウェブページ取得部33によって取得されたウェブページのURLと、ウェブページ変換部35が算出した変換特徴量と、ウェブページ解析部36が算出したページ特徴量とを対応付ける検索インデックスを生成し、生成した検索インデックスを検索インデックス記憶部31に記憶させる(ステップS4)。この後、検索エンジン32が、モバイル端末20から検索キーワードが含まれる検索要求を受信すると、検索インデックス記憶部31に記憶された検索インデックスを参照して、検索キーワードに応じた検索結果を生成し、生成した検索結果をモバイル端末20に送信する。
【0041】
なお、ウェブページ収集部34が、一定期間毎にウェブページ取得部33を介してウェブページを取得する際には、その都度、ウェブページ変換部35が、ウェブページ収集部34によって収集されたウェブページに対して変換処理と変換特徴量算出処理とを行なっても良い。あるいは、ウェブページ収集部34が、一定期間内に収集したウェブページを記憶しておき、ウェブページ変換部35は、ウェブページ収集部34に記憶されたウェブページを一定期間毎に読み出して、変換処理と変換特徴量算出処理とを行なっても良い。
【0042】
また、本実施形態では、検索インデックス記憶部31に記憶されるページ特徴量として、ウェブページに含まれる単語(キーワード)およびその出現数が含まれる例を示したが、ページ特徴量とは別に、ウェブページに含まれるキーワードが対応付けられるように構成しても良い。
【0043】
また、上記説明では、ウェブページ収集部34によって収集されたウェブページをウェブページ変換部35が変換し、変換特徴量を算出することとしたが、ウェブページ変換部35が、モバイル端末20から送信されるウェブページ取得要求を受信して、ウェブページ取得要求に対応するウェブページをウェブサーバ10から取得し、変換処理と変換特徴量の算出処理とを行ない、変換したウェブページをモバイル端末20に送信するようにしても良い。この場合、例えば、検索エンジン32が検索結果であるURL一覧を生成する際、検索結果のそれぞれのURLを、検索装置30を中継するURLリンクに書き換えるようにしても良い。例えば、検索装置30は、ウェブページ変換部35を接続先として示すURLに検索結果であるウェブページのURLをパラメータとして付加したURLの一覧を、検索結果としてモバイル端末20に送信する。このようにすれば、検索結果のリンクに基づいて検索装置30から送信されるウェブページ取得要求を、検索装置30のウェブページ変換部35が受信し、ウェブページをモバイル端末用に変換した後にモバイル端末20に送信することができる。このようにすれば、ウェブページ収集部34が可能な限り全てのURLからウェブページを取得することに対し、実際にモバイル端末20からアクセスのあったウェブページのみの情報を蓄積することができるため、有用かつ効率的な検索インデックスを生成することが期待できる。
【0044】
このように、本実施形態によれば、モバイル端末20からのウェブページ検索において、ウェブページの情報の有用度を示すページ特徴量のみならず、ウェブページがモバイル端末20において表示可能である度合いを示す変換特徴量に基づいて、検索キーワードに応じた検索結果一覧を生成することができる。これにより、よりページの有用度が高く、かつモバイル端末20にとってより見やすいウェブページがより上位の検索結果に表示されることとなる。すなわち、モバイル端末20が、ウェブ検索サービスを用いて表示された検索結果において上位に表示されたURLに対応するウェブページを参照しようとする際、そのウェブページがPC用に作成されたものであるため表示できないといった事態を低減させることが可能となる。
【0045】
なお、本発明における処理部の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより検索インデックスの生成を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータシステム」は、ホームページ提供環境(あるいは表示環境)を備えたWWWシステムも含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(RAM)のように、一定時間プログラムを保持しているものも含むものとする。
【0046】
また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
【符号の説明】
【0047】
1 検索システム
10 ウェブサーバ
20 モバイル端末
30 検索装置
31 検索インデックス記憶部
32 検索エンジン
33 ウェブページ取得部
34 ウェブページ収集部
35 ウェブページ変換部
36 ウェブページ解析部
37 検索インデックス生成部

【特許請求の範囲】
【請求項1】
送信されるウェブページ取得要求に応じて定められたウェブページを送信する複数のウェブサーバと、当該ウェブサーバから送信される前記ウェブページを受信して表示するモバイル端末とにネットワークを介して接続された検索装置であって、
複数の前記URL毎に、当該URLによって示される前記ウェブページに含まれるキーワードと、当該URLによって示される前記ウェブページが前記モバイル端末において表示可能なフォーマットに変換される際の変換量を示す変換特徴量と、当該ウェブページの有用度を示すページ特徴量とが対応付けられた検索インデックスが記憶される検索インデックス記憶部と、
前記ウェブサーバから、定められたURLに対応するウェブページを取得するウェブページ取得部と、
前記ウェブページ取得部によって取得された前記ウェブページを前記モバイル端末において表示可能なフォーマットに変換する変換処理を行い、前記変換特徴量を算出するウェブページ変換部と、
前記ウェブページ取得部によって取得された前記ウェブページに対応する前記ページ特徴量を算出するウェブページ解析部と、
前記ウェブページ変換部によって算出された前記変換特徴量と、前記ウェブページ解析部によって算出された前記ページ特徴量とに基づいて前記検索インデックスを生成して前記検索インデックス記憶部に記憶させる検索インデックス生成部と、
前記モバイル端末から送信される検索キーワードを受信し、前記検索インデックス記憶部に記憶された前記検索インデックスに基づいて、複数の前記ウェブページのうち前記検索キーワードが含まれるウェブページを示すURLの一覧である検索結果を生成して前記モバイル端末に送信する検索処理部と、
を備えることを特徴とする検索装置。
【請求項2】
前記ウェブページ変換部は、前記ウェブページ取得部によって取得された前記ウェブページに含まれる画像を縮小した場合にはその縮小率と、前記ウェブページを複数ページに分割した場合にはその分割したページ数と、前記ウェブページに画像が含まれる場合にはその画像の枚数と、前記ウェブページのデータサイズとのうちいずれかまたは複数の情報に基づいて前記変換特徴量を算出する
ことを特徴とする請求項1に記載の検索装置。
【請求項3】
前記ウェブページ解析部は、前記ウェブページ取得部によって取得された前記ウェブページに含まれる単語およびその出現数と、前記ウェブページの被リンク数と、そのウェブページを示すURLの文字数とのうちいずれかまたは複数の情報に基づいて前記ページ特徴量を算出する
ことを特徴とする請求項1または請求項2に記載の検索装置。
【請求項4】
定められた一定期間毎に、前記ウェブページ取得部を介して、定められた複数のURLに対応するウェブページを収集するウェブページ収集部
を備えることを特徴とする請求項1から請求項3までのいずれか1項に記載の検索装置。
【請求項5】
前記ウェブページ変換部は、前記モバイル端末から送信される前記ウェブページ取得要求を受信し、前記ウェブページ取得部を介して、前記ウェブページ取得要求に対応する前記ウェブページを前記ウェブサーバから取得し、取得した当該ウェブページについて前記変換処理を行ない、変換後のウェブページを前記モバイル端末に送信する
ことを特徴とする請求項1から請求項4までのいずれか1項に記載の検索装置。
【請求項6】
送信されるウェブページ取得要求に応じて定められたウェブページを送信する複数のウェブサーバと、当該ウェブサーバから送信される前記ウェブページを受信して表示するモバイル端末とにネットワークを介して接続され、前記ウェブページを示す前記URL毎に、当該URLによって示される前記ウェブページに含まれるキーワードと、当該URLによって示される前記ウェブページが前記モバイル端末において表示可能なフォーマットに変換される際の変換量を示す変換特徴量と、当該ウェブページの有用度を示すページ特徴量とが対応付けられた検索インデックスが記憶される検索インデックス記憶部を備えた検索装置の検索方法であって、
前記ウェブサーバから、定められたURLに対応するウェブページを取得するステップと、
取得した前記ウェブページを前記モバイル端末において表示可能なフォーマットに変換する変換処理を行い、前記変換特徴量を算出するステップと、
取得した前記ウェブページに対応する前記ページ特徴量を算出するステップと、
算出した前記変換特徴量と、算出した前記ページ特徴量とに基づいて前記検索インデックスを生成して前記検索インデックス記憶部に記憶させるステップと、
前記モバイル端末から検索キーワードを受信し、前記検索インデックスに基づいて、複数の前記ウェブページのうち前記検索キーワードが含まれるウェブページを示すURLの一覧である検索結果を送信するステップと、
を備えることを特徴とする検索方法。
【請求項7】
送信されるウェブページ取得要求に応じて定められたウェブページを送信する複数のウェブサーバと、当該ウェブサーバから送信される前記ウェブページを受信して表示するモバイル端末とにネットワークを介して接続され、前記ウェブページを示す前記URL毎に、当該URLによって示される前記ウェブページに含まれるキーワードと、当該URLによって示される前記ウェブページが前記モバイル端末において表示可能なフォーマットに変換される際の変換量を示す変換特徴量と、当該ウェブページの有用度を示すページ特徴量とが対応付けられた検索インデックスが記憶される検索インデックス記憶部を備えた検索装置のコンピュータに、
前記ウェブサーバから、定められたURLに対応するウェブページを取得するステップと、
取得した前記ウェブページを前記モバイル端末において表示可能なフォーマットに変換する変換処理を行い、前記変換特徴量を算出するステップと、
取得した前記ウェブページに対応する前記ページ特徴量を算出するステップと、
算出した前記変換特徴量と、算出した前記ページ特徴量とに基づいて前記検索インデックスを生成して前記検索インデックス記憶部に記憶させるステップと、
前記モバイル端末から検索キーワードを受信し、前記検索インデックスに基づいて、複数の前記ウェブページのうち前記検索キーワードが含まれるウェブページを示すURLの一覧である検索結果を送信するステップと、
を実行させる検索プログラム。
【請求項8】
送信されるウェブページ取得要求に応じて定められたウェブページを送信する複数のウェブサーバと、当該ウェブサーバから送信される前記ウェブページを受信して表示するモバイル端末とにネットワークを介して接続され、前記ウェブページを示す前記URL毎に、当該URLによって示される前記ウェブページに含まれるキーワードと、当該URLによって示される前記ウェブページが前記モバイル端末において表示可能なフォーマットに変換される際の変換量を示す変換特徴量と、当該ウェブページの有用度を示すページ特徴量とが対応付けられた検索インデックスが記憶される検索インデックス記憶部を備えた検索装置のコンピュータに、
前記ウェブサーバから、定められたURLに対応するウェブページを取得するステップと、
取得した前記ウェブページを前記モバイル端末において表示可能なフォーマットに変換する変換処理を行い、前記変換特徴量を算出するステップと、
取得した前記ウェブページに対応する前記ページ特徴量を算出するステップと、
算出した前記変換特徴量と、算出した前記ページ特徴量とに基づいて前記検索インデックスを生成して前記検索インデックス記憶部に記憶させるステップと、
前記モバイル端末から検索キーワードを受信し、前記検索インデックスに基づいて、複数の前記ウェブページのうち前記検索キーワードが含まれるウェブページを示すURLの一覧である検索結果を送信するステップと、
を実行させる検索プログラムを記録したコンピュータ読み取り可能な記録媒体。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate


【公開番号】特開2011−118824(P2011−118824A)
【公開日】平成23年6月16日(2011.6.16)
【国際特許分類】
【出願番号】特願2009−277695(P2009−277695)
【出願日】平成21年12月7日(2009.12.7)
【出願人】(504126835)エヌ・ティ・ティ レゾナント株式会社 (60)
【Fターム(参考)】