説明

語句又は文章分析方法、サーバ

【課題】語句又は文章分析方法、サーバにおいて、通信回線から受信した語句又は文章データに含まれるクエリを活用して、当該語句又は文章を分析する方法、サーバを提供する。
【解決手段】検索サーバと通信可能に接続されたクエリ分析サーバであって、検索サーバから検索に対するクエリを受信するクエリ受信部110と、当該クエリの検索件数を算出するクエリ算出部115と、クエリ受信部110が受信したクエリと、クエリ算出部115により算出されたクエリの検索件数とを関係づけて記憶するクエリ記憶部150と、クエリに関連した語句又は文章からなる関連クエリを受信したことに応じて、クエリ記憶部150に記憶されたクエリと当該クエリの検索件数に応じて、当該関連クエリの語句又は文章の構造を判断するクエリ判断部130と、を備えるクエリ分析サーバ。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、例えば、語句又は文章分析方法、サーバに関する。
【背景技術】
【0002】
従来より、語句又は文章データと、データベースとを照合し、語句又は文章分析を行う方法、サーバが知られている(例えば、特許文献1)。当該検索方法、サーバは、検索処理部と、類義語検索処理部と、データベースとで構成されている。当該検索方法、サーバは、通信回線から受信した語句又は文章データに含まれる語句と、当該語句の類義語との双方でデータベースを照合し、はじめに受信した語句または文章データとデータベースに含まれる意味説明に関係がない可能性を低くする。
【特許文献1】特開2005−222188号公報
【発明の開示】
【発明が解決しようとする課題】
【0003】
しかしながら、上述した特許文献1では、サーバは、通信回線から受信した語句又は文章データに含まれる語句から当該語句の類義語を、既定のデータベースから検索するため、当該語句がデータベースに含まれていない語句の場合は、検索することができない。
【0004】
また、特許文献1では、サーバは、通信回線から受信した語句又は文章データに含まれる語句と、既定のデータベースとを語句のマッチングのみで照合している。当該受信した語句又は文章データに含まれるクエリのデータを活用したり、語句の検索件数や、二語以上のクエリデータを使用して同時に検索する場合の検索件数といった情報は、マッチングにおいて活用していない。
【0005】
本発明は、語句又は文章分析方法、サーバにおいて、通信回線から受信した語句又は文章データに含まれるクエリを活用して、当該語句又は文章を分析する方法、サーバを提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明者らは、語句又は文章分析方法、サーバにおいて、通信回線から受信した語句又は文章データに含まれるクエリを活用して、当該語句又は文章を分析する方法、サーバを見出し、本発明を完成するに至った。
【0007】
(1) 検索サーバと通信可能に接続されたクエリ分析サーバであって、
前記検索サーバから検索に対するクエリを受信するクエリ受信部と、
当該クエリの検索件数を算出するクエリ算出部と、
前記クエリ受信部が受信したクエリと、前記クエリ算出部により算出されたクエリの検索件数とを関係づけて記憶するクエリ記憶部と、
前記クエリに関連した語句又は文章からなる関連クエリを受信したことに応じて、前記クエリ記憶部に記憶されたクエリと当該クエリの検索件数に応じて、当該関連クエリの語句又は文章の構造を判断するクエリ判断部と、
を備えるクエリ分析サーバ。
【0008】
(1)の構成は、クエリ分析サーバが、検索サーバから検索に対するクエリを受信し、
クエリの検索件数を算出し、受信したクエリと、検索件数とを関係づけて記憶し、クエリに関連した語句又は文章からなる関連クエリを受信したことに応じて、クエリ記憶部に記憶されたクエリと当該クエリの検索件数に応じて、当該関連クエリの語句又は文章の構造を判断することができる。
【0009】
よって、クエリ分析サーバは、外部から受信した語句、文章を含む関連クエリを、記憶されたクエリと当該クエリの検索件数に基づいて、語句又は文章の構造を、判断することが可能である。したがって、例えば、クエリ分析サーバが、外部から受信した、World Wide Webの検索エンジンにユーザが入力した語句、文章を含む関連クエリと、それまでに記憶されたクエリと当該クエリの検索件数に応じて、当該関連クエリの語句又は文章の構造を判断することが可能である。ここで、検索件数とは、クエリとして検索された回数(クエリ受信部がクエリを受信した回数)であってもよいし、検索サーバが当該クエリを検索した結果として出力される文章、リンクの数であってもよい。
【0010】
(2) (1)に記載のクエリ分析サーバであって、
前記関連クエリが、一以上の語句が複合された語句であって、当該複合語を一文字ずつ分割し、当該関連クエリの文字順で、分割した関連クエリと分割位置とを関係づけた分割文字データを分割位置及び分割数の全ての組み合わせで生成することで、複数の分割文字データからなる分割文字テーブルを生成するクエリ分割部を備え、
前記クエリ判断部は、前記分割文字データの分割された各々の語句が、前記クエリ記憶部にクエリとして記憶されているかを判断し、前記分割文字データの分割された各々の語句がクエリとして記憶されている場合には、当該クエリと当該クエリの検索件数に応じて、当該関連クエリの語句の構造を判断するクエリ分析サーバ。
【0011】
(2)の構成は、クエリ分析サーバが受信した関連クエリが、一以上の語句が複合された語句であって、当該複合語を一文字ずつ分割し、当該関連クエリの文字順で、分割した関連クエリと分割位置とを関係づけた分割文字データを分割位置及び分割数の全ての組み合わせで生成することで、複数の分割文字データからなる分割文字テーブルを生成し、クエリ判断部は、分割文字データの分割された各々の語句が、クエリ記憶部にクエリとして記憶されているかを判断し、分割文字データの分割された各々の語句がクエリとして記憶されている場合には、当該クエリと当該クエリの検索件数に応じて、当該関連クエリの語句の構造を判断することができる。
【0012】
よって、クエリ分析サーバは、外部から受信した関連クエリを、分割文字データの分割された各々の語句のクエリと当該クエリの検索件数に基づいて、語句の構造を判断することが可能である。したがって、例えば、クエリ分析サーバが受信した関連クエリとして、複合的な熟語である「遺伝子配列」という語句から、「遺・伝子配列」、「遺伝・子配列」、「遺伝子・配列」、「遺伝子配・列」、「遺・伝・子配列」等、可能なすべての組み合わせで分割し、クエリと当該クエリの検索件数に応じて、「遺伝子配列」のような複合語の構造を判断することが可能である。
【0013】
(3) (2)に記載のクエリ分析サーバであって、
前記クエリ判断部は、当該クエリと当該クエリの検索件数に応じて、当該関連クエリの語句の構造を判断する際に、当該分割文字テーブルのうち、所定の分割文字データを抽出し、当該抽出した分割文字データにより、当該関連クエリの分割位置を特定することで、当該関連クエリの語句の構造を判断するクエリ分析サーバ。
【0014】
(3)の構成は、(2)に記載のクエリ分析サーバが、クエリと当該クエリの検索件数に応じて、当該関連クエリの語句の構造を判断する際に、当該分割文字テーブルのうち、所定の分割文字データを抽出し、当該抽出した分割文字データにより、当該関連クエリの分割位置を特定し、当該関連クエリの語句の構造を判断することができる。
【0015】
よって、クエリ分析サーバは、当該関連クエリを、抽出した分割文字データに基づいて、分割位置を特定することで、語句の構造を判断することが可能である。したがって、例えば、クエリと当該クエリの検索件数に応じて、クエリ分析サーバが受信した、「遺伝子配列」という語句を含む関連クエリの分割位置を特定して「遺伝子」「配列」という構造を判断することが可能である。
【0016】
(4) (3)に記載のクエリ分析サーバであって、
前記クエリ判断部は、当該関連クエリの分割位置を特定したことに応じて、前記分割位置から分割された二以上の語句に対して、検索式を付加して前記検索サーバに送信する更新クエリ送信部を、備えたクエリ分析サーバ。
【0017】
(4)の構成は、(3)に記載のクエリ分析サーバが、当該関連クエリの分割位置を特定したことに応じて、分割位置から分割された二以上の語句に対して、検索式を付加して検索サーバに送信することができる。
【0018】
よって、(3)に記載のクエリ分析サーバは、分割された二以上の語句に対して、検索式を付加して検索サーバに送信することが可能である。したがって、例えば、クエリ分析サーバは、関連クエリが含む語句「遺伝子配列」の分割位置を特定し、分割された「遺伝子」「配列」の語句に対して「遺伝子配列 OR 遺伝子 AND 配列」の検索式を検索サーバに送信することができる。さらに、「遺伝子配列」というクエリで検索結果数が少ない場合、「遺伝子」AND「配列」での検索結果も追加することにより、再現率をあげることができる。
【0019】
(5) (1)に記載のクエリ分析サーバであって、
前記クエリ受信部は、当該検索サーバに対して検索要求を行ったユーザ端末から検索要求を受け付けた二語以上のクエリを、前記検索サーバから受信し、
前記クエリ算出部は、当該二語以上のクエリの検索件数を算出し、
前記クエリ記憶部は、前記クエリ受信部が受信した二語以上のクエリと、前記クエリ算出部により算出された検索件数とを各々に関係づけて記憶し、
前記クエリ判断部は、前記クエリに関連した文章からなる関連クエリを受信したことに応じて、前記クエリ記憶部に記憶されたクエリと当該クエリの検索件数に応じて、当該関連クエリの文章の係り受けを判断するクエリ分析サーバ。
【0020】
(5)の構成は、(1)に記載のクエリ分析サーバが、当該検索サーバに対して検索要求を行ったユーザ端末から検索要求を受け付けた二語以上のクエリを、検索サーバから受信し、クエリ算出部は、当該二語以上のクエリの検索件数を算出し、クエリ記憶部は、クエリ受信部が受信した二語以上のクエリと、クエリ算出部により算出された検索件数とを各々に関係づけて記憶し、クエリ判断部は、クエリに関連した文章からなる関連クエリを受信したことに応じて、クエリ記憶部に記憶されたクエリと当該クエリの検索件数に応じて、当該関連クエリの文章の係り受けから、互いの用語の意味的な関係が強いことを判断することができる。
【0021】
よって、(5)に記載のクエリ分析サーバは、クエリに関連した文章からなる関連クエリを受信したことに応じて、クエリ記憶部に記憶されたクエリと当該クエリの検索件数に応じて、当該関連クエリの文章の係り受けから、互いの用語の意味的な関係が強いことを判断することが可能である。したがって、例えば、クエリ分析サーバのクエリ記憶部に記憶された2語以上のクエリが「YYY携帯電話」と「カナ漢字変換」との場合の、当該クエリの検索件数が、1000件であり、クエリ分析サーバのクエリ記憶部に記憶された2語以上のクエリが「WWWモバイル」と「カナ漢字変換」との場合の、当該クエリの検索件数が、50件であり、クエリ分析サーバが受信した文章が「YYY携帯電話は、カナ漢字変換と音楽再生に優れているが、一方、WWWモバイルの小型キーボードも見逃せない。」という場合に、「カナ漢字変換」は「WWWモバイル」とではなく、「YYY携帯電話」と、意味的な関係が強いと判断することが可能である。
【0022】
(6) 検索サーバと通信可能に接続されたクエリ分析サーバであって、
当該検索サーバに対して検索要求を行ったユーザ端末から検索要求を受け付けた二語以上のクエリを、前記検索サーバから受信するクエリ受信部と、
前記クエリのうち評価の対象となる語句が記憶された評価対象語データベースと、
前記二語以上のクエリのうち一のクエリが、前記評価対象語データベースに記憶されているかを判断する評価対象語検索部と、
当該二語以上のクエリの検索件数を算出するクエリ算出部と、
前記クエリ受信部が受信した二語以上のクエリと、前記クエリ算出部により算出されたクエリの検索件数とを関係づけて記憶するクエリ記憶部と、
前記二語以上のクエリのうち前記評価対象語データベースに記憶された語句が一致した場合で、かつ、前記クエリ記憶部に記憶された前記二語以上のクエリの検索件数を参照して、当該検索件数が所定以上の場合には、前記二語以上のクエリのうち、前記評価対象語データベースに記憶された語句ではない他のクエリについて、当該他のクエリを評価観点語として記憶するかを判断するクエリ判断部とを備えるクエリ分析サーバ。
【0023】
(6)の構成は、クエリ分析サーバが、検索サーバに対して検索要求を行ったユーザ端末から検索要求を受け付けた二語以上のクエリを、検索サーバから受信し、クエリのうち評価の対象となる語句を評価対象語データベースに記憶し、二語以上のクエリのうち一のクエリが、評価対象語データベースに記憶されているかを判断し、当該二語以上のクエリの検索件数を算出し、クエリ受信部が受信した二語以上のクエリと、クエリ算出部により算出されたクエリの検索件数とを関係づけて記憶し、二語以上のクエリのうち評価対象語データベースに記憶された語句が一致した場合で、かつ、クエリ記憶部に記憶された二語以上のクエリの検索件数を参照し、当該検索件数が所定以上の場合には、二語以上のクエリのうち、評価対象語データベースに記憶された語句ではない他のクエリについて、当該他のクエリを評価観点語として記憶するかを判断することができる。
【0024】
よって、クエリ分析サーバは、受信した二語以上のクエリのうち評価対象語データベースに記憶された語句が一致した場合で、かつ、クエリ記憶部に記憶された二語以上のクエリの検索件数を参照し、当該検索件数が所定以上の場合には、二語以上のクエリのうち、評価対象語データベースに記憶された語句ではない他のクエリについて、当該他のクエリを評価観点語として記憶するかを判断することが可能である。
【0025】
(7) (6)に記載のクエリ分析サーバのクエリ判断部が判断した評価観点語が記憶された評価観点語データベース。
【0026】
(7)の構成は、クエリ分析サーバが、判断した、評価観点語が記憶された、評価観点語データベースを、提供することができる。
【0027】
(8) 検索サーバと通信可能に接続された語句データベースの生成方法であって、
クエリのうち評価の対象となる語句を記憶するステップと、
当該検索サーバに対して検索要求を行ったユーザ端末から検索要求を受け付けた二語以上のクエリを、前記検索サーバから受信するステップと、
前記二語以上のクエリのうち一のクエリが、所定のデータベースに記憶されているかを判断するステップと、
当該二語以上のクエリの検索件数を算出するステップと、
前記受信した二語以上のクエリと、前記算出されたクエリの検索件数とを関係づけて記憶するステップと、
前記二語以上のクエリのうち所定のデータベースに記憶された語句が一致した場合には、前記二語以上のクエリの検索件数を参照するステップと、
当該参照した検索件数が所定以上の場合には、当該他のクエリを評価観点語として記憶するステップと、を備える語句データベース生成方法。
【0028】
(8)の方法は、検索サーバと通信可能に接続された語句データベースの生成方法であって、クエリのうち評価の対象となる語句を記憶し、当該検索サーバに対して検索要求を行ったユーザ端末から検索要求を受け付けた二語以上のクエリを、検索サーバから受信し、二語以上のクエリのうち一のクエリが、評価対象語データベースに記憶されているかを判断し、当該二語以上のクエリの検索件数を算出し、受信した二語以上のクエリと、算出されたクエリの検索件数とを関係づけて記憶し、二語以上のクエリのうち評価対象語データベースに記憶された語句が一致した場合には、二語以上のクエリの検索件数を参照し、当該参照した検索件数が所定以上の場合には、当該他のクエリを評価観点語として記憶して、語句データベースを生成することができる。
【0029】
よって、データベースは、受信した二語以上のクエリのうち評価対象語データベースに記憶された語句が一致した場合には、二語以上のクエリの検索件数を参照し、当該参照した検索件数が所定以上の場合には、当該他のクエリを評価観点語として記憶して、語句データベースを生成することが可能である。したがって、例えば、データベースは、評価対象語データベースに、語句「WWWモバイル」が記憶されており、二語のクエリ「WWWモバイル」と「小型キーボード」の検索件数が600件であり、二語のクエリ「WWWモバイル」と「小型キーボード」の検索件数が20件である場合に、語句「小型キーボード」を、評価観点語として記憶して、語句データベースを生成することが可能である。
【発明の効果】
【0030】
本発明によれば、クエリ分析サーバは、外部から受信した語句、文章を含む関連クエリを、記憶されたクエリと当該クエリの検索件数に基づいて、語句又は文章の構造を、判断することが可能である。
【発明を実施するための最良の形態】
【0031】
以下、発明の実施の形態を通じて本発明を説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではなく、又実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。
【0032】
図1は、本発明の実施形態に係るクエリ分析システム1の構成の一例を示す。すなわち、クエリ分析システム1は、一以上のユーザ端末50と、検索サーバ200と、クエリ分析サーバ100とが互いに通信回線ネットワーク30により通信可能に接続されている。通信回線ネットワーク30は、インターネットであってよいし、LAN(Local Area Network)、専用回線もしくはこれらの組み合わせにより構成されるネットワークである。
【0033】
ユーザ端末50は、検索サーバ200に対して検索要求を行う情報処理装置である。ユーザ端末50は、このユーザ端末50が処理する情報、データを制御する制御部と、通信回線ネットワーク30と接続されて通信を実現する通信部と、このユーザ端末50が処理する情報、データを記録する記憶部と、このユーザ端末50が処理する情報、データを表示する表示部と、このユーザ端末50の入力を受け付ける入力部とから構成される。なお、ユーザ端末50は、コンピュータであってよいし、携帯電話等の携帯情報端末であってもよい。
【0034】
制御部は、ユーザ端末50を制御する中央処理演算装置であり、CPU(Central Processing Unit)であってよい(図11にて後述する)。ユーザ端末50は、記憶部に記録されたプログラムを読み出すことで、Webブラウザを実現する。Webブラウザは、ユーザ端末50を操作するユーザが検索機能を利用するためのインターフェースを提供する機能であり、Webサーバ、検索サーバ200から送信されたWebページを受信して、これを所定の書式で表示し、この表示したページに対して、入力部から検索等の入力を受け付ける機能を備える。
【0035】
検索サーバ200は、ユーザ端末50から受信した検索要求に応じて、検索処理を行う情報処理装置である。検索サーバ200は、この検索サーバ200が処理する情報、データを制御する制御部と、通信回線ネットワーク30と接続されて通信を実現する通信部と、この検索サーバ200が処理する情報、データを記録する記憶部と、この検索サーバ200が処理する情報、データを表示する表示部と、この検索サーバ200の入力を受け付ける入力部とから構成されてよい。なお、検索サーバ200は、コンピュータであってよいし、携帯電話等の携帯情報端末であってもよい。
【0036】
検索サーバ200は、クエリ受付部210と検索処理部220を少なくとも備える。通常、ユーザ端末50からクエリ受付部210を介して、クエリが入力される。ここで、クエリとは、検索サーバ200に対して、Webページの情報(リンク情報)を求める(検索要求)を行う際に、このWebページの選択基準となるキーワードである。入力されたクエリは、クエリ受付部210から検索処理部220により、当該クエリに関連したWebページの検索が行われ、検索処理が行われる。
【0037】
ここで、検索サーバ200は、クエリ受付部210にて受付けたクエリを、クエリ分析サーバ100に送信する(ステップS01)。
【0038】
クエリ分析サーバ100は、検索サーバ200から受信したクエリに対して、クエリの記憶と、クエリに関連した語句又は文章(関連クエリ)の判断を行う情報処理装置である。クエリ分析サーバ100は、このクエリ分析サーバ100が処理する情報、データを制御する制御部と、検索サーバ200、或いは通信回線ネットワーク30と接続されて通信を実現する通信部と、このクエリ分析サーバ100が処理する情報、データを記録する記憶部と、このクエリ分析サーバ100が処理する情報、データを表示する表示部と、このクエリ分析サーバ100の入力を受け付ける入力部とから構成されてよい。なお、クエリ分析サーバ100は、コンピュータであってよいし、携帯電話等の携帯情報端末であってもよい。
【0039】
クエリ分析サーバ100は、検索サーバ200から送信されるクエリを受信するクエリ受信部110と、受信したクエリの検索件数を算出するクエリ算出部115とを備え、クエリ及び検索件数を関係づけて記憶するクエリ記憶部150と、関連クエリを判断するクエリ判断部130とを備える。
【0040】
最初に、クエリ受信部110は、検索サーバ200から、クエリを受信する(ステップS01)。次に、クエリ算出部が受信したクエリの検索件数を算出する。すなわち、当該クエリを1回受信するごとに、1ずつ検索件数をカウントアップすることで、クエリの検索件数を算出してもよい。例えば、「携帯電話」というクエリは、20回クエリを検索サーバ200から受信したので、検索件数は20件であるとしてよい。
【0041】
また、検索件数の他の態様としては、検索サーバ200が検索結果として得た文章数(リンク数)が、検索件数であってもよい。この場合には、検索処理後の当該文章数を検索サーバ200又はクエリ分析サーバ100に記憶する。クエリ分析サーバ100は、記憶された文章数を(場合によっては、検索サーバ200から文章数を受信して)検索件数とする。
【0042】
クエリ記憶部150は、制御部からの命令に応じて、クエリ算出部115が算出した検索件数と、当該クエリを関係づけて自らの記憶領域に記憶する(ステップS02)。
【0043】
次に、クエリ判断部130は、クエリに関連した語句又は文章からなる関連クエリを受信したことに応じて、クエリ記憶部150に記憶されたクエリと当該クエリの検索件数に応じて、当該関連クエリの語句又は文章の構造を判断する(ステップS03)。ここで、関連クエリは、クエリ受付部210が受信した新たなクエリの語句を関連クエリとしてもよいし(図2参照)、外部から受信した文章を関連クエリとしてもよい(図5参照)。
【0044】
図2は、本発明の実施形態に係るクエリ分析システム1aの構成の一例を示す。クエリ分析システム1aは、クエリ分析システム1における構成及び処理をさらに、具体的に示したシステムである。クエリ分析システム1aにおけるクエリ分析サーバ100aは、クエリ分割部120と、更新クエリ送信部140とを含む点が、クエリ分析システム1aと異なる。
【0045】
クエリ分析システム1aは、一以上の語句が複合された語句で構成される関連クエリを分析する。例えば、関連クエリとは、熟語の複合語、カタカナの複合語、アルファベットの複合語等であってよい。すなわち、「遺伝子配列」という語句は、「遺伝子」という語句と「配列」という語句が合わさった複合語であり、本実施例の関連クエリに該当する。その他、「コンピュータインターフェース」や「JET式PRINTER」等が本実施例の関連クエリに該当する。すなわち、前者は「コンピュータ」、「インターフェース」の複合語であり、後者は「JET」、「式」、「PRINTER」の複合語であるからである。
【0046】
クエリ分析サーバ100aのクエリ受信部110は、上述のクエリ分析サーバ100と同様に、クエリ受付部210よりクエリを受信し(ステップS10)、クエリ算出部115が、当該クエリの検索件数を算出し(ステップS11)、クエリ記憶部150が、制御部からの命令に応じて、クエリ算出部115が算出した検索件数と、当該クエリを関係づけて自らの記憶領域に記憶する(ステップS12)。ここで処理されるクエリは、複合語を構成するそれぞれの語句(例えば、上述の「コンピュータ」、「インターフェース」の各々)である。図4は、クエリ算出部115が算出した検索件数と、当該クエリを関係づけたテーブルを示す。
【0047】
次に、検索サーバ200aは、クエリ受付部210が受付けた複合語である新たなクエリを、関連クエリとして、クエリ受信部110に送信する(ステップS13)。これを受信したクエリ受信部110は、関連クエリをクエリ分割部120に送信する(ステップS14)。
【0048】
クエリ分割部120は、複合語である関連クエリを一文字ずつ分割し、関連クエリの文字順で、分割した関連クエリと分割位置とを関係づけた分割文字データを、分割位置及び分割数の全ての組み合わせで生成することで、複数の分割文字データからなる分割文字テーブル(例えば、図3)を生成する。
【0049】
図3は、クエリ分割部120に分割文字テーブルを示す。関連クエリ(例えば、「遺伝子配列」)を一文字ずつ分割(「遺」、「伝」、「子」、「配」、「列」)し、関連クエリの文字順(「遺」→「伝」→「子」→「配」→「列」)で、分割した関連クエリと分割位置(2、3行目の分割位置など)とを関係づけた分割文字データ(例えば、2行目で分割すると「遺」、「伝子配列」が一の分割文字データであり、3行目で分割すると「遺伝」、「子配列」が一の分割文字データである)を、分割位置及び分割数の全ての組み合わせで生成することで、複数の分割文字データからなる分割文字テーブル(図3)を生成する。クエリ分割部120は、クエリ判断部に処理を移す(ステップS15)。
【0050】
クエリ判断部130は、分割文字データの分割された各々の語句が、クエリ記憶部150にクエリとして記憶されているかを判断し、分割文字データの分割された各々の語句がクエリとして記憶されている場合には、当該クエリと当該クエリの検索件数に応じて、当該関連クエリの語句の構造を判断する。
【0051】
ここで、クエリ判断部130は、当該クエリと当該クエリの検索件数に応じて、当該関連クエリの語句の構造を判断する際に、当該分割文字テーブルのうち、所定の分割文字データを抽出し、当該抽出した分割文字データにより、当該関連クエリの分割位置を特定することで、当該関連クエリの語句の構造を判断する。
【0052】
例えば、関連クエリが「遺伝子配列」である場合を例とすると、クエリ判断部130は、分割文字データの分割された各々の語句(例えば、「遺伝子」、「配列」)が、クエリ記憶部150にクエリとして記憶されているか(例えば、「遺伝子」、「配列」がそれぞれ記憶されているか)を判断する。上述のように、「遺伝子」、「配列」という語句は、クエリ記憶部150が、検索件数とともに関係づけて記憶している。したがって、図3の4行目を分割位置とした「遺伝子」、「配列」の分割文字データは、分割された各々の語句がクエリとして記憶されている場合に該当する。
【0053】
したがって、クエリ判断部130は、当該クエリと当該クエリの検索件数を参照する。例えば、関連クエリが「遺伝子配列」であるとすると、2行目に分割位置を設けた分割文字データ(「遺」、「伝子配列」)を抽出すると、当該分割文字データは、図4のテーブルによれば、「遺」が検索件数80件、「伝子配列」が15件である。これに対して、4行目に分割位置を設けた分割文字データ(「遺伝子」、「配列」)を抽出すると、当該分割文字データは、図4のテーブルによれば、「遺伝子」が検索件数6000件、「伝子配列」が47000件である。よって、前者の検索件数の和は、95件であるのに対して、後者の検索件数の和は、53000件である。
【0054】
これにより、クエリ判断部130は、「遺伝子配列」の語句は、「遺」、「伝子配列」よりも、検索件数の和が多い語句であることから「遺伝子」、「配列」の複合語ではないかと判断する。クエリ判断部130は、このように分割文字テーブルの全ての分割文字データに対して、本処理を実行することで、関連クエリである「遺伝子配列」の分割位置を特定することで、語句の構造を判断する。
【0055】
なお、クエリ判断部130が、上記処理を実行する際に、クエリが一語(例えば、「列」等)の場合は、検索件数が多すぎてしまい、クエリ判断部130の関連クエリの語句の構造を判断する際に、妥当ではない場合がある。この場合には、クエリ判断部130は、クエリが一語の場合を除外して、判断してもよい。
【0056】
さらに、クエリ判断部130が、上記処理を実行する際に、例えば、「遺伝」、「子配列」の分割文字データは、「遺伝」という語句を含むため、検索件数が、「遺伝子」、「配列」よりも多くなってしまう場合がある。この場合は、検索件数が多い分割文字データのみを列挙して、管理者等からの関連クエリの分割位置を判断させるために、選択を受け付ける態様であってもよい。
【0057】
次に、クエリ判断部130は、更新クエリ送信部140に処理を移す(ステップS16)。更新クエリ送信部140は、クエリ判断部130が、関連クエリの分割位置を特定したことに応じて、分割位置から分割された二以上の語句に対して、検索式を付加して検索サーバ200aの検索処理部220に送信する(ステップS17)。
【0058】
ここで、検索式とは、2語以上の語句に対して検索処理を行うための(AND、OR、NOT)等の論理式である。すなわち、クエリ判断部130が分割位置を特定した2語以上のクエリに対して、上記の検索式を付加する。例えば、検索式は、単に分割位置を特定したクエリに対して、「AND」の検索式を付与するのみであってよい。
【0059】
この場合に、更新クエリ送信部140が送信した、検索式が付加された2語以上のクエリを、検索サーバ200aが受信して(ステップS17)、検索処理部220が検索処理を行う。検索サーバ200aは、当該検索処理の結果を、最初に関連クエリ(分割が特定された元の関連クエリ)を入力した、ユーザ端末50に送信してもよい。
【0060】
図5は、本発明の実施形態に係るクエリ分析システム1bの構成の一例を示す。クエリ分析システム1bは、クエリ分析システム1における構成及び処理をさらに、具体的に示したシステムである。なお、図示しないが、クエリ分析サーバ100bは、クエリ分析サーバ100と同様に、検索サーバ200bから送信されるクエリを受信し、受信したクエリの検索件数を算出し、クエリ及び検索件数を関係づけて記憶する。
【0061】
検索サーバ200bは、ユーザ端末50からクエリの受信を受付けるクエリ受付部210と、受付けたクエリのログを記憶するクエリログ記憶部240(ステップS20)と、クエリログ記憶部240に記憶されたクエリをクエリ分析サーバ100bに送信する(ステップS21、S22)クエリログ送信部230と、を備える。ここで、クエリログとは、ユーザ端末50から入力されたクエリの履歴や、当該クエリとユーザ端末50のユーザ情報が関係づけられたデータであってよく、クエリの履歴は、当該クエリと同時に検索要求された語句(クエリ)に関する情報を含んでいてよい。
【0062】
検索サーバ200bは、クエリログをクエリ分析サーバ100bに送信する(ステップS22)。クエリ分析サーバ100bは、クエリログを受信し、併用語検出部180が、クエリログから併用語を検出する。
【0063】
併用語検出部180は、クエリログから、一のユーザ端末50から同時に複数のクエリを使用して検索要求のあった入力キーワードを抽出し、この入力キーワードのうち、入力されたクエリの1語目、2語目、3語目・・・を抽出する。図6は、入力キーワードと入力されたクエリの1語目、2語目、3語目・・・の関係を例示した図である。入力キーワードとして、1語目に「AAA携帯電話」、2語目に「カナ漢字変換」、3語目に「音楽再生」が入力された場合、及び、他のユーザ端末50から、1語目に「YYYモバイル」、2語目に「小型キーボード」が入力された場合を示す。
【0064】
併用語検出部180は、併用語算出部185に処理を移す(ステップS23)。ここで、クエリ分析サーバ100bの併用語算出部185は、クエリ分析サーバ100と同様に、クエリごとの検索件数を算出するとともに、一のユーザ端末50から同時に併用して入力された複数のクエリ(併用語)の検索件数も算出し、併用語記憶部190が、算出したこれらの検索件数を記憶する(ステップS24)。
【0065】
図7は、一のクエリ(キーワード)と、同時に検索要求のあったクエリ(併用語1、併用語2)及び、キーワードと併用語とが同時に検索要求があった検索件数を示すテーブル図である。例えば、クエリとして、「YYY携帯電話」と「カナ漢字変換」とが同時にクエリとして併用された場合に、この両者が同時に検索された検索件数が1000件であることを示す。すなわち、クエリ分析サーバ100bは、一のクエリ(キーワード)と、同時に検索要求のあったクエリ(併用語1、併用語2)との検索件数を図7のテーブルのように、記憶しておく。
【0066】
ここで、検索要求のあったクエリのうち、どの語句が図7のキーワードであり、併用語であるとするかは、所定の辞書を参照して、辞書に登録されている語句であれば、キーワードとして判断して、その他のクエリを併用語とする態様であってよい。
【0067】
次に、クエリ分析サーバ100bの文章受信部160は、ユーザ端末50等の外部の情報通信端末から、関連クエリとして所定の文章の入力を受信し(ステップS25)、係り受け判断部170に処理を移す(ステップS26)。ここで、所定の文章とは、係り受けを一以上含む文章である。さらに、係り受けとは、語句(又は文節)と語句(又は文節)との関係を示すために文章中に使われる記載である。係り受け判断部170は、併用語記憶部190に記憶されたクエリと当該クエリの検索件数に応じて、関連クエリの文章の係り受けを判断する(ステップS27)。
【0068】
図8は、クエリ分析サーバ100bに入力された文章の一例を示す。このように係り受けを有する文章のうち、「YYY携帯電話」、「カナ漢字変換」、「音楽再生」、「WWWモバイル」、「小型キーボード」という語句が、どのような関係であるかを判断したいとする。すなわち、「カナ漢字変換」は、「YYY携帯電話」に関係するのか、「WWWモバイル」に関係するのかといった関係を判断する。
【0069】
そこで、図7のテーブルに基づけば、「YYY携帯電話」は、「カナ漢字変換」と同時に検索要求されている件数が、1000件であるのにかかわらず、「WWWモバイル」は、「カナ漢字変換」と同時に検索要求されている件数が、50件である。したがって、クエリ分析サーバ100bの係り受け判断部170は、「YYY携帯電話」は、「カナ漢字変換」と関係があると判断することが可能である。
【0070】
[評価観点語データベース]
次に、図9に基づいて、評価観点語データベース195について説明する。最初に、クエリ分析サーバ100cは、検索サーバ200等の外部から送信された二語以上のクエリを、クエリ受信部110にて受信する(ステップS30)。そして、クエリ分析サーバ100cは、対象語検索部172に処理を移し、対象語検索部172は、二語以上のクエリが、評価対象語データベース175に記憶されているかを判断する(ステップS32)。
【0071】
評価対象語データベース175は、クエリ分析サーバ100cを管理する管理者等から入力された評価の対象となる語句が記憶されたデータベースである。評価の対象となる語句とは、例えば、「YYY携帯電話」等の商品の名称であったり、芸能人や著名人の名称、店舗やサービスの名称等であってよい。
【0072】
次に、クエリ分析サーバ100cは、評価観点語算出部182に処理を移し(ステップS33)、評価観点語算出部182は、当該二語以上のクエリが同時に検索された件数を示す検索件数を加算する。そして、クエリ記憶部150が、二語以上のクエリと、評価観点語算出部182により算出されたクエリの検索件数とを関係づけて記憶する(ステップS34)。
【0073】
例えば、クエリ分析サーバ100cは、ユーザ端末50から二語以上のクエリとして、「YYY携帯電話」、「カナ漢字変換」であったとすると、これらの二語以上のクエリが同時に検索された場合に、今回の検索件数として一だけ、先に記憶された検索件数に加算し、二語以上のクエリと検索件数とを関係づけて、図10に示すテーブルのように関係づけて記憶する。
【0074】
次に、評価観点語判断部192は、クエリ記憶部150に記憶されたテーブルを参照して、二語以上のクエリのうち評価対象語データベース175に記憶された語句が一致したものに対して、二語以上のクエリのうち、評価対象語データベース175に記憶された語句ではない他のクエリについて、当該他のクエリを評価観点語として、評価観点語データベース195に記憶するかを判断する(ステップS35、S36)。ここでの判断基準は、クエリ記憶部150に記憶された検索件数を参照し、当該検索件数が所定以上の場合には、評価観点語判断部192は、評価観点語データベース195に記憶すると判断する。
【0075】
例えば、検索サーバ200から、「WWWモバイル」、「小型キーボード」を二語以上のクエリとして、クエリ受信部110が受信した場合について説明する。評価対象語データベース175には、予め「WWWモバイル」が、評価対象語として記憶されているとする。この場合には、クエリ分析サーバ100cは、「WWWモバイル」という語句が評価対象語として記憶されていると判断して、当該「WWWモバイル」と「小型キーボード」との検索件数を加算し、図10のテーブルに示すように関係づけて、記憶する。
【0076】
次に、所定のタイミングで、評価観点語判断部192は、クエリ記憶部150に記憶された検索件数を参照し、当該検索件数が所定以上の場合には、クエリ記憶部150に記憶すると判断する。図10の例で、所定の値が300であるとすると、「WWWモバイル」の評価対象語に対して、「小型キーボード」という語は、同時検索件数が600であるため、所定の値を上回っている。そこで、評価観点語判断部192は、「小型キーワード」を評価観点語データベース195に記憶すると判断する。このような処理で、クエリ分析サーバ100cは、評価観点語データベースを生成することが可能である。
【0077】
[クエリ分析サーバ100のハードウェア構成]
図11は、図1で説明した本発明の好適な実施形態に係るクエリ分析サーバ100のハードウェア構成の一例を示す図である。下記の説明では、クエリ分析サーバ100により説明を行うが、検索サーバ200、ユーザ端末50におけるハードウェア構成もほぼ同様に構成される。
【0078】
クエリ分析サーバ100は、制御部101を構成するCPU(Central Processing Unit)1010(マルチプロセッサ構成ではCPU1012等複数のCPUが追加されてもよい)、バスライン1005、通信I/F1040、メインメモリ1050、BIOS(Basic Input Output System)1060、USBポート1090、I/Oコントローラ1070、並びにキーボード及びマウス1100等の入力手段や表示装置1022を備えるコンピュータであってよい。
【0079】
I/Oコントローラ1070には、テープドライブ1072、ハードディスク1074、光ディスクドライブ1076、半導体メモリ1078、等の記憶手段を接続することができる。
【0080】
BIOS1060は、クエリ分析サーバ100の起動時にCPU1010が実行するブートプログラムや、クエリ分析サーバ100のハードウェアに依存するプログラム等を格納する。
【0081】
データ記憶部107を構成するハードディスク1074は、クエリ分析サーバ100がサーバとして機能するための各種プログラム及び本発明の機能を実行するプログラムを記憶しており、さらに必要に応じて各種データベースを構成可能である。
【0082】
光ディスクドライブ1076としては、例えば、DVD−ROMドライブ、CD−ROMドライブ、DVD−RAMドライブ、CD−RAMドライブを使用することができる。この場合は各ドライブに対応した光ディスク1077を使用する。光ディスク1077から光ディスクドライブ1076によりプログラム又はデータを読み取り、I/Oコントローラ1070を介してメインメモリ1050又はハードディスク1074に提供することもできる。また、同様にテープドライブ1072に対応したテープメディア1071を主としてバックアップのために使用することもできる。
【0083】
クエリ分析サーバ100に提供されるプログラムは、ハードディスク1074、光ディスク1077、又はメモリーカード等の記録媒体に格納されて提供される。このプログラムは、I/Oコントローラ1070を介して、記録媒体から読み出され、又は通信I/F1040を介してダウンロードされることによって、クエリ分析サーバ100にインストールされ実行されてもよい。
【0084】
前述のプログラムは、内部又は外部の記憶媒体に格納されてもよい。ここで、データ記憶部107を構成する記憶媒体としては、ハードディスク1074、光ディスク1077、又はメモリーカードの他に、MD等の光磁気記録媒体、テープ媒体を用いることができる。また、専用通信回線やインターネットに接続されたサーバシステムに設けたハードディスク1074又は光ディスクライブラリー等の記憶装置を記録媒体として使用し、通信回線を介してプログラムをクエリ分析サーバ100に提供してもよい。
【0085】
ここで、表示装置1022は、ユーザにデータの入力を受付ける画面を表示したり、クエリ分析サーバ100による演算処理結果の画面を表示したりするものであり、ブラウン管表示装置(CRT)、液晶表示装置(LCD)等のディスプレイ装置を含む。
【0086】
ここで、入力手段は、ユーザによる入力の受付を行うものであり、キーボード及びマウス1100等により構成してよい。
【0087】
また、通信I/F1040は、クエリ分析サーバ100を専用ネットワーク又は公共ネットワークを介して端末と接続できるようにするためのネットワーク・アダプタである。通信I/F1040は、モデム、ケーブル・モデム及びイーサネット(登録商標)・アダプタを含んでよい。
【0088】
以上の例は、クエリ分析サーバ100について主に説明したが、装置に、プログラムをインストールして、その装置をサーバ装置として動作させることにより上記で説明した機能を実現することもできる。したがって、本発明において一実施形態として説明したサーバにより実現される機能は、上述の方法を当該装置により実行することにより、或いは、上述のプログラムを当該装置に導入して実行することによっても実現可能である。
【図面の簡単な説明】
【0089】
【図1】本発明の好適な実施形態に係るクエリ分析システム1の構成及び処理のフローを示す図である。
【図2】本発明の好適な実施形態に係るクエリ分析システム1aの構成及び処理のフローを示す図である。
【図3】クエリ分析システム1aによる関連クエリの分割において、分割文字テーブルについて説明する図である。
【図4】クエリ分析システム1aによる関連クエリの分割において、クエリと当該クエリの検索件数のテーブルについて説明する図である。
【図5】本発明の好適な実施形態に係るクエリ分析システム1bの構成及び処理のフローを示す図である。
【図6】クエリ分析システム1bによる係り受けの判断において、入力キーワードと入力されたクエリの1語目、2語目、3語目等の関係について説明する図である。
【図7】クエリ分析システム1bによる係り受けの判断において、一のクエリ(キーワード)と、同時に検索要求のあったクエリ(併用語1、併用語2)及び、キーワードと併用語とが同時に検索要求があった検索件数を示すテーブル図である。
【図8】クエリ分析システム1bによる係り受けの判断において、図8は、クエリ分析サーバ100bに入力された文章の一例を示す図である。
【図9】本発明の好適な実施形態に係るクエリ分析システム1cの構成及び処理のフローを示す図である。
【図10】クエリ分析システム1cにおいて、一のクエリ(キーワード)と、同時に検索要求のあったクエリ(併用語1、併用語2)及び、キーワードと併用語とが同時に検索要求があった検索件数を示すテーブル図である。
【図11】本発明の好適な実施形態に係るクエリ分析サーバ100、検索サーバ200、ユーザ端末50のハードウェア構成を示す図である。
【符号の説明】
【0090】
1 クエリ分析システム
30 通信回線ネットワーク
50 ユーザ端末
100 クエリ分析サーバ
110 クエリ受信部
115 クエリ算出部
130 クエリ判断部
150 クエリ記憶部
172 対象語検索部
175 評価対象語データベース
182 評価観点語算出部
192 評価観点語判断部
195 評価観点語データベース
200 検索サーバ
210 クエリ受付部
220 検索処理部
1005 バスライン
1010、1012 CPU
1022 表示装置
1050 メインメモリ
1070 コントローラ
1071 テープメディア
1072 テープドライブ
1074 ハードディスク
1076 光ディスクドライブ
1077 光ディスク
1078 半導体メモリ
1090 USBポート
1100 キーボード及びマウス

【特許請求の範囲】
【請求項1】
検索サーバと通信可能に接続されたクエリ分析サーバであって、
前記検索サーバから検索に対するクエリを受信するクエリ受信部と、
当該クエリの検索件数を算出するクエリ算出部と、
前記クエリ受信部が受信したクエリと、前記クエリ算出部により算出されたクエリの検索件数とを関係づけて記憶するクエリ記憶部と、
前記クエリに関連した語句又は文章からなる関連クエリを受信したことに応じて、前記クエリ記憶部に記憶されたクエリと当該クエリの検索件数に応じて、当該関連クエリの語句又は文章の構造を判断するクエリ判断部と、
を備えるクエリ分析サーバ。
【請求項2】
請求項1に記載のクエリ分析サーバであって、
前記関連クエリが、一以上の語句が複合された語句であって、当該複合語を一文字ずつ分割し、当該関連クエリの文字順で、分割した関連クエリと分割位置とを関係づけた分割文字データを分割位置及び分割数の全ての組み合わせで生成することで、複数の分割文字データからなる分割文字テーブルを生成するクエリ分割部を備え、
前記クエリ判断部は、前記分割文字データの分割された各々の語句が、前記クエリ記憶部にクエリとして記憶されているかを判断し、前記分割文字データの分割された各々の語句がクエリとして記憶されている場合には、当該クエリと当該クエリの検索件数に応じて、当該関連クエリの語句の構造を判断するクエリ分析サーバ。
【請求項3】
請求項2に記載のクエリ分析サーバであって、
前記クエリ判断部は、当該クエリと当該クエリの検索件数に応じて、当該関連クエリの語句の構造を判断する際に、当該分割文字テーブルのうち、所定の分割文字データを抽出し、当該抽出した分割文字データにより、当該関連クエリの分割位置を特定することで、当該関連クエリの語句の構造を判断するクエリ分析サーバ。
【請求項4】
請求項3に記載のクエリ分析サーバであって、
前記クエリ判断部は、当該関連クエリの分割位置を特定したことに応じて、前記分割位置から分割された二以上の語句に対して、検索式を付加して前記検索サーバに送信する更新クエリ送信部を、備えたクエリ分析サーバ。
【請求項5】
請求項1に記載のクエリ分析サーバであって、
前記クエリ受信部は、当該検索サーバに対して検索要求を行ったユーザ端末から検索要求を受け付けた二語以上のクエリを、前記検索サーバから受信し、
前記クエリ算出部は、当該二語以上のクエリの検索件数を算出し、
前記クエリ記憶部は、前記クエリ受信部が受信した二語以上のクエリと、前記クエリ算出部により算出された検索件数とを各々に関係づけて記憶し、
前記クエリ判断部は、前記クエリに関連した文章からなる関連クエリを受信したことに応じて、前記クエリ記憶部に記憶されたクエリと当該クエリの検索件数に応じて、当該関連クエリの文章の係り受けを判断するクエリ分析サーバ。
【請求項6】
検索サーバと通信可能に接続されたクエリ分析サーバであって、
当該検索サーバに対して検索要求を行ったユーザ端末から検索要求を受け付けた二語以上のクエリを、前記検索サーバから受信するクエリ受信部と、
前記クエリのうち評価の対象となる語句が記憶された評価対象語データベースと、
前記二語以上のクエリのうち一のクエリが、前記評価対象語データベースに記憶されているかを判断する評価対象語検索部と、
当該二語以上のクエリの検索件数を算出するクエリ算出部と、
前記クエリ受信部が受信した二語以上のクエリと、前記クエリ算出部により算出されたクエリの検索件数とを関係づけて記憶するクエリ記憶部と、
前記二語以上のクエリのうち前記評価対象語データベースに記憶された語句が一致した場合で、かつ、前記クエリ記憶部に記憶された前記二語以上のクエリの検索件数を参照して、当該検索件数が所定以上の場合には、前記二語以上のクエリのうち、前記評価対象語データベースに記憶された語句ではない他のクエリについて、当該他のクエリを評価観点語として記憶するかを判断するクエリ判断部とを備えるクエリ分析サーバ。
【請求項7】
請求項6に記載のクエリ分析サーバのクエリ判断部が判断した評価観点語が記憶された評価観点語データベース。
【請求項8】
検索サーバと通信可能に接続された語句データベースの生成方法であって、
クエリのうち評価の対象となる語句を記憶するステップと、
当該検索サーバに対して検索要求を行ったユーザ端末から検索要求を受け付けた二語以上のクエリを、前記検索サーバから受信するステップと、
前記二語以上のクエリのうち一のクエリが、所定のデータベースに記憶されているかを判断するステップと、
当該二語以上のクエリの検索件数を算出するステップと、
前記受信した二語以上のクエリと、前記算出されたクエリの検索件数とを関係づけて記憶するステップと、
前記二語以上のクエリのうち所定のデータベースに記憶された語句が一致した場合には、前記二語以上のクエリの検索件数を参照するステップと、
当該参照した検索件数が所定以上の場合には、当該他のクエリを評価観点語として記憶するステップと、を備える語句データベース生成方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate


【公開番号】特開2008−158998(P2008−158998A)
【公開日】平成20年7月10日(2008.7.10)
【国際特許分類】
【出願番号】特願2006−350301(P2006−350301)
【出願日】平成18年12月26日(2006.12.26)
【出願人】(500257300)ヤフー株式会社 (1,128)
【Fターム(参考)】