説明

外来語の発音検索サービスを提供する検索結果提供システム及び検索結果提供方法

【課題】外来語の発音検索サービスを提供する検索結果提供システム及び検索結果提供方法
【解決手段】検索結果提供システムは、外来語に対して、外来語の原語と原語に対する外来語の異形態の集合とを発音関係で互いに関連づけてデータベースに格納及び維持する原語−異形態維持部と、ユーザ端末を介して送信される検索語に原語及び異形態のうちの少なくとも1つの単語が含まれる場合、データベースで単語と発音関係で互いに関連づけられて格納された原語及び異形態のうち少なくとも1つの関連外来語を検索する関連外来語検索部と、検索された少なくとも1つの関連外来語をユーザ端末に提供する関連外来語提供部とを備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明の実施形態は外来語の発音検索サービスを提供する検索結果提供システム及び検索結果提供方法に関する。
【背景技術】
【0002】
一般的に情報を検索するためにユーザから入力されるクエリは日本語の在来語と外来語とに区分される。ここでいう外来語とは、広義の外来語であって、外国から入った言語として国語のように用いられる単語を意味し、英文アルファベットと英文アルファベットの発音をカタカナに記載したカタカナ異形態のように定義される。このような外来語のクエリは「標準語」の概念がないため、特性上様々な方式で表記されて用いられている。例えば、英文アルファベット「bonjour」は英文アルファベット発音をカタカナで記載したカタカナ異形態として、「ボンジュル」、「ボンジュール」及び「ボンシュール」のように様々な方式で表記されて用いられる。
【0003】
このように「ボンジュール」という単語1つをみてもその発音方法によって様々に表記することがあるが、従来技術においては、クエリの入力を受けた検索結果の提供において、ユーザから入力された1つの単語について検索を行った検索結果のみが提供される。したがって、ユーザはユーザ本人が入力したクエリに限定された情報のみを習得し、同じ外来語で、関連する追加情報を取得するためには当該外来語を何度も変形して再検索しなければならないという不便があった。
【発明の概要】
【発明が解決しようとする課題】
【0004】
本明細書では、外来語クエリによる検索の検索結果をより効果的に提供することのできるシステム及び方法が提供される。
【0005】
本発明の目的は、外来語クエリを入力するユーザに対して当該外来語クエリと関連した様々な発音形態の外来語及びその発音形態の外来語に基づいた検索結果を提供することのできる検索結果提供システム及び方法を提供することである。
【0006】
本発明の他の目的は、英文アルファベット形態の原語とカタカナ外来語である異形態に区分される外来語について、原語に対する異形態の集合をその発音関係で互いに関連づけて格納及び維持し、ユーザから原語または異形態を含むクエリが入力される場合、当該クエリの発音に関連する原語または異形態をユーザに提供することによって、様々な発音形態の外来語及びその発音形態の外来語に基づいた検索結果をユーザに提供することのできる検索結果提供システム及び方法を提供することである。
【0007】
本発明の他の目的は、検索回数(Query Count、QC)、原語または異形態のソース、及び検索結果の数のうち少なくとも1つに基づいて原語または異形態の露出有無や露出優先順位を決定することのできる検索結果提供システム及び方法を提供することである。
【0008】
本発明の他の目的は、原語または異形態のソースに関する情報を維持することによって、どのようなソースのキーワードでクリックが多く発生したかというサービスの現在状況を把握することができ、ソースごとのクリック発生頻度を参考してサービス品質を制御することのできる検索結果提供システム及び方法を提供することである。
【課題を解決するための手段】
【0009】
本発明の一実施形態として、外来語に対して、外来語の原語と原語に対する外来語の異形態の集合とを発音関係で互いに関連づけてデータベースに格納及び維持する原語−異形態維持部と、ユーザ端末を介して送信される検索語に原語及び異形態のうちの少なくとも1つの単語が含まれる場合、データベースで当該単語と発音関係で互いに関連づけられて格納された原語及び異形態のうちから少なくとも1つの関連外来語を検索する関連外来語検索部と、検索された少なくとも1つの関連外来語をユーザ端末に提供する関連外来語提供部とを備える検索結果提供システムが提供される。
【0010】
本発明の一実施形態において、関連外来語検索部は単語が原語である場合、データベースで当該単語と発音関係で関連づけられて格納された異形態を少なくとも1つの関連外来語として検索してもよい。
【0011】
本発明の他の実施形態において、関連外来語検索部は単語が異形態である場合、データベースで当該単語と発音関係で関連づけられて格納された原語及び格納された原語と発音関係で関連づけられて格納された異形態のうち少なくとも1つを関連外来語として検索してもよい。
【0012】
本発明の他の実施形態において、検索される少なくとも1つの関連外来語の露出優先順位を決定する露出優先順位決定部をさらに備えてもよい。この場合、関連外来語提供部は、露出優先順位に応じた順で少なくとも1つの関連外来語を提供してもよい。
【0013】
本発明の他の実施形態において、露出優先順位決定部は、原語または異形態が検索語として入力された回数である検索回数及び原語または異形態のソースのうち少なくとも1つに基づいて露出優先順位を決定してもよい。ここで、ソースは、原語または異形態が抽出されたデータベースに基づいて決定されてもよい。
【0014】
本発明の他の実施形態において、露出優先順位決定部は、検索回数にソースによる加重値を付与し、加重値が付与された検索回数に基づいて露出優先順位を決定してもよい。
【0015】
本発明の他の実施形態において、露出優先順位決定部は、ソースごとに露出優先順位を決定し、同一ソースの原語または異形態に対しては検索回数を用いて露出優先順位を決定してもよい。
【0016】
本発明の他の実施形態において、検索結果提供システムは、検索語に対する関連検索語を提供する関連検索語提供部をさらに備えてもよい。ここで、検索結果提供システムは、検索語に対する関連検索語と関連外来語とが互いに重複する場合、重複する関連検索語を除外して提供してもよい。
【0017】
本発明の他の実施形態において、検索結果提供システムは、検索語が広告キーワードとして既に設定されたキーワードである場合、広告キーワードに対する関連キーワードであるビジネスキーワードを提供するビジネスキーワード提供部をさらに備えてもよい。ここで、検索結果提供システムは、検索語に対するビジネスキーワードと関連外来語とが互いに重複する場合、重複する関連外来語を除外して提供してもよい。
【0018】
本発明の他の実施形態において、関連外来語検索部は、原語または異形態が検索語として入力された回数である検索回数及び原語と異形態とを同時に含む文書の数を意味する検索結果の数のうち少なくとも1つを用いて、少なくとも1つの原語または異形態をデータベースから削除してもよい。
【0019】
本発明の他の実施形態において、関連外来語検索部は、検索回数及び検索結果の数に応じて原語または異形態を分類し、少なくとも1つの分類に属する原語または異形態を削除してもよい。
【0020】
本発明の他の実施形態において、原語または異形態のソースにおける固有番号を合算した値を用いて原語または異形態のソースを表示してもよく、ソースは、原語または異形態が抽出されたデータベースに応じて決定されてもよい。
【0021】
本発明の他の実施形態において、固有番号それぞれは、1つの特定ケタ数に1の値を有する2進数の形式で表現されてもよい。
【0022】
本発明の他の実施形態において、関連外来語提供部は、検索される少なくとも1つの関連外来語を検索語に対する検索結果を提供するウェブページに追加し、検索される少なくとも1つの関連外来語が追加されたウェブページをユーザ端末に提供することにより検索される少なくとも1つの関連外来語を提供してもよい。
【0023】
本発明の他の実施形態において、ウェブページ上で関連外来語が追加された領域においてユーザイベントが発生する場合に、関連外来語の「意味を解釈する」機能及び関連外来語の「発音を聞く」機能のうち少なくとも1つの機能をユーザ端末に提供してもよい。
【0024】
また、本発明の一実施形態として、外来語に対して、外来語の原語と原語に対する外来語の異形態との集合を発音関係で互いに関連づけてデータベースに格納及び維持するステップと、ユーザ端末を介して送信される検索語に原語及び異形態のうち少なくとも1つの単語が含まれる場合、データベースで当該単語と発音関係で互いに関連づけられて格納された原語及び異形態のうちから少なくとも1つの関連外来語を検索するステップと、検索された少なくとも1つの関連外来語をユーザ端末に提供するステップとを含む検索結果提供方法が提供される。
【発明の効果】
【0025】
本発明によると、外来語クエリを入力するユーザに対して当該外来語クエリと関連した様々な発音形態の外来語及びその発音形態の外来語に基づいた検索結果を提供することができる。
【0026】
本発明によると、英文アルファベット形態の原語とカタカナ外来語である異形態に区分される外来語について、原語に対する異形態の集合をその発音関係で互いに関連づけて格納及び維持し、ユーザから原語または異形態を含むクエリが入力される場合、当該クエリの発音に関連する原語または異形態をユーザに提供することによって、様々な発音形態の外来語及びその発音形態の外来語に基づいた検索結果をユーザに提供することができる。
【0027】
本発明によると、検索回数、原語または異形態のソース及び検索結果の数のうち少なくとも1つに基づいて原語または異形態の露出有無や露出優先順位を決定することができる。
【0028】
本発明によると、原語または異形態のソースに関する情報を維持することによって、どのようなソースのキーワードでクリックが多く発生したかというサービスの現在状況を把握することができ、ソースごとのクリック発生頻度を参考してサービス品質を制御することができる。
【図面の簡単な説明】
【0029】
【図1】本発明の一実施形態に係る検索サービスを提供する方法を説明するための図である。
【図2】本発明の一実施形態に係る原語に対する検索結果が原語と異形態とをいずれも含む場合の一例を示す図である。
【図3】本発明の一実施形態に係る複数のソースを維持する方法を説明するための図である。
【図4】本発明の一実施形態に係る検索結果を表示するウェブページで外来語の発音サービスが提供されるウェブページの一例を示す図である。
【図5】本発明の一実施形態に係る検索結果提供システムの内部構成を説明するためのブロック図である。
【図6】本発明の一実施形態に係る検索結果提供方法を示すフローチャートである。
【発明を実施するための形態】
【0030】
以下、本発明の実施形態を図面を参照しながら詳細に説明する。
【0031】
図1は、本発明の一実施形態に係る検索サービスを提供する方法を説明するための図である。まず、図1は、ユーザ端末110及び検索結果提供システム120を示している。ここで、ユーザ端末110は、ユーザから検索語(クエリ)130が入力されると検索結果提供システム120に送信し、検索結果提供システム120が検索語130の検索結果140を提供すると、検索結果140を受信してユーザに提供するという一連の機能を実行する装置やモジュールを意味する。すなわち、ユーザ端末110は、有線/無線ネットワークを介して検索結果提供システム120に接続して検索語130を送信し、検索結果140を受信するPCやスマートフォンのような機器を意味し、また、検索結果提供システム120に含まれたモジュールとして、検索語130が入力されるための入力インタフェース及び検索結果140をユーザに提供するための出力インタフェースを意味する。
【0032】
検索結果提供システム120は、ユーザ端末110によって送信される検索語130に対する検索結果140を生成してユーザ端末110に送信する。ここで、ユーザ端末110によって検索結果140が出力され、ユーザには検索語130に対応する検索結果140が提供される。
【0033】
ここで、検索結果提供システム120は、外来語の発音サービスを提供してもよい。すなわち、検索語130は外来語を含んでもよく、このような外来語が含まれた検索語130を入力するユーザに検索結果提供システム120は外来語の発音サービスとして様々な発音形態で外来語をユーザに提供してもよい。ここで、外来語とは、英文アルファベット形態の原語とカタカナ外来語である異形態に区分され、1つの原語に対してn個の異形態が存在する場合もある。
【0034】
ここで、検索結果提供システム120は、原語に対する異形態の集合を発音関係で互いに関連づけて格納及び維持し、ユーザ端末110から原語または異形態を含むクエリが入力されて送信される場合、当該クエリに含まれる原語または異形態と発音が関連する原語または異形態をユーザ端末110に提供することにより、様々な発音の形態で、外来語をユーザに提供することができる。すなわち、検索結果提供システム120は、ユーザが原語を含むクエリで検索する場合にはその原語と「発音」で関連する様々な異形態を提供してもよく、また、ユーザが異形態を含むクエリで検索する場合にも、その異形態と「発音」で関連する原語や異なる異形態を提供してもよい。
【0035】
原語と異形態との間の「発音」関係を形成するためには原語ごとに、原語の実際の発音を生成する方法が必要である。このために、検索結果提供システム120は、原語に対する異形態の集合を発音関係で互いに関連づけて格納及び維持した「発音検索ライブラリー」を用いて、1つの原語に対して1つ以上の異形態を構築する。下記の表1は1つの原語にn個以上の異形態を構築した一例である。
【表1】

【0036】
すなわち、日本語の場合に、原語は英文アルファベット形態で表し、異形態はカタカナ外来語の形態で表してもよい。もっとも、本発明の適用分野は日本語や英語だけに限定されることはない。すなわち、外来語が存在する他の言語の場合にも、本発明は外来語に対する原語と該当言語の異形態について同一に適用される。
【0037】
このような外来語の発音データベースを用いて外来語が含まれた検索語130を入力するユーザに当該検索語130に含まれる外来語の原語または異形態を提供するため、ユーザが入力したクエリに応じて原語と異形態との集合を合せて露出することのできるデータの統合環境が求められる。
【0038】
上述したように、検索結果提供システム120は、少なくとも1つの原語または異形態をユーザに検索結果として提供してもよい。このとき、データを統合してサービスを露出するための基準が必要な場合がある。例えば、複数の原語または複数の異形態がユーザに提供される場合、異形態の間、または原語の間の露出優先順位が存在することがある。
【0039】
すなわち、検索結果提供システム120は、基本的に検索回数(Query Count、QC)に基づいて、原語または異形態を相対的に正確度の高い原語または異形態を決定してユーザに提供してもよい。すなわち、ユーザから検索語として相対的に多く入力された原語や異形態がユーザに優先的に露出されるように、検索結果において原語または異形態を提供してもよい。
【0040】
また、検索結果提供システム120は異形態のソースによって検索回数に加重値を付与したり、異形態のソースによって優先順位を付与したり、同一ソースである異形態の間では検索回数に応じて優先順位を決定したりしてもよい。
【0041】
例えば、検索結果提供システム120は、国立国語研究所で規定された外来語正字に対応する異形態を正確度の最も高い異形態に決定してもよい。この場合、検索結果提供システム120は、国立国語研究所で規定された外来語正字がユーザへ優先的に露出されるように原語または異形態を提供してもよい。また、検索結果提供システム120は、基本的には検索回数に基づいて原語または異形態をユーザに提供し、さらに国立国語研究所で規定された外来語正字に対応する異形態には加重値を付加してもよい。
【0042】
次の表2は「Stephen Covey」という原語に対する異形態の露出優先順位を決定した一例を示す。
【表2】

【0043】
すなわち、表2では検索結果提供システム120が国立国語研究所で規定された外来語正字に対応する異形態を上位の露出優先順位に決定するが、同一ソースの異形態については検索回数に基づいて露出優先順位を決定できることを表す。
【0044】
このような表2では、国立国語研究所で規定された外来語正字に対応する異形態が最も上位の露出優先順位を有するように決定したが、このような露出優先の順位決定方法は1つの一例に過ぎず、本発明がこのような露出優先順位決定方法に限定されることはない。上記したように、検索結果提供システム120は基本的に検索回数に基づいて露出優先順位を決定し、さらにソースによる加重値を検索回数に付与して露出優先順位を決定してもよく、この場合に、あるソースの異形態よりも他のソースの異形態がさらに上位の露出優先順位を有するように決定してもよい。
【0045】
また、検索結果提供システム120は、上述した外来語の発音サービスだけでなく、ユーザが入力する検索語の関連検索語を提供する関連検索語サービスを提供してもよい。また、検索結果提供システム120は、広告キーワードに関連するビジネスキーワードを提供するビジネスキーワード提供サービスを提供してもよい。ここで、関連検索語やビジネスキーワードを提供する方法は公知であるため、本明細書では詳細な説明は省略する。なお、本実施形態に係る検索結果提供システム120では関連検索語サービスによって提供される関連検索語と外来語の発音サービスによって提供される原語や異形態とが互いに重複する場合には、外来語の発音サービスにおいて、当該原語や異形態にさらに高い優先順位を付与してもよく、重複する関連検索語が除外されるように制御してもよい。また、外来語の発音サービスによって提供される原語または異形態がビジネスキーワード提供サービスによって提供されるビジネスキーワードと重複する場合、ビジネスキーワード提供サービスにおいて、当該ビジネスキーワードにさらに高い優先順位を付与してもよく、重複する原語または異形態が除外されるように制御してもよい。このような重複したキーワードに対する高い優先順位の付与や削除といった処理はサービスの露出過程においてリアルタイムで行ってもよい。
【0046】
外来語の発音データベースが発音検索ライブラリーによって構築された後、検索結果提供システム120は正確度を向上するためにキーワードの検索回数(QC)に関する情報と検索結果の数を用いて構築されたデータを洗練する。
【0047】
検索回数は、外来語の発音データベースに格納及び維持される異形態に該当するキーワードを対象にして、所定期間の間に統合検索で検索された回数を意味する。ここで、検索回数の数値が小さければ、その分ユーザのキーワードの使用率が低いものと判断する。
【0048】
また、検索結果の数は原語と異形態が共に登場する文書の数を意味する。すなわち、原語と異形態との間の関連度が高いほど原語と異形態とが文書内で共に存在する確率が高いため、原語と異形態とが共に登場する文書の数である検索結果の数が大きいほど該当原語と異形態との間の関連度が高いと判断する。
【0049】
図2は、本発明の一実施形態に係る原語に対する検索結果が原語と異形態とをいずれも含む場合の一例を示す図である。ここで、画面200は原語「garnett」に対して原語「garnett」と異形態「ガーネット」とがいずれも含まれた文書の例を示している。ここで、画面200は原語「garnett」と異形態「ガーネット」が同時に含まれた文書が「2」である一例を示している。
【0050】
他の例として、例えば、原語「cyaan」と原語「cyaan」に対する異形態「サイアン」が同時に含まれた文書が存在しければ、検索結果の数を「0」に決定する。
【0051】
次の表3は原語及び異形態に応じた検索回数及び検索結果の数の例をそれぞれ示している。
【表3】

【0052】
再び図1を参照すると、検索結果提供システム120は検索回数及び検索結果の数を組み合わせてデータを洗練してもよい。洗練のための検索回数及び検索結果の数の間の組合結果は下記のように分類され得る。
【0053】
(1)検索回数が0であり、検索結果の数も0である場合:キーワードの使用率が極めて低く、原語と異形態との間の関連度が低い。
【0054】
(2)検索回数が0であり、検索結果が存在する場合:キーワードの使用率は低いが、原語と異形態との間での関連度は高い。
【0055】
(3)検索回数が存在し(1以上)、検索結果の数が0である場合:キーワードの使用率は高いが、原語と異形態との間の関連度は低い。
【0056】
(4)検索回数が存在し(1以上)、検索結果の数も存在(1以上の)する場合:キーワードの使用率も高くて原語と異形態との間の関連度が高い。
【0057】
この場合、検索結果提供システム120は、上述の(1)〜(4)の場合に係る分類によって異形態を自動洗練(例えば、削除)してもよい。例えば、検索結果提供システム120は(1)と(3)のケースに該当する異形態を正しい原語−異形態の対ではないものと判断して削除してもよい。また、検索結果提供システム120は(4)のケースに該当する異形態が正しい原語−異形態の対である可能性が高いため(4)のケースに該当する異形態をサービス対象として用いてもよい。また、(2)のケースに該当する異形態も正しい原語−異形態の対である可能性が存在するため、サービス対象として用いてもよい。すなわち、検索回数と検索結果の数に基づくと、該当の異形態が正しい異形態である可能性は(4)、(2)、(3)、(1)の順に高い。
【0058】
また、1つのキーワードは数個のソースによって重複的に抽出されてもよい。例えば、同一のキーワードが上述した国立国語研究所で規定された正字としてキーワードが抽出されるとともに、人物辞書によって抽出されてもよい。この場合、検索結果提供システム120はキーワードのソースを1つに制限することなく、関連する全てのソースを許容してもよい。ここで、検索結果提供システム120はソースごとに固有番号を付与し、キーワードに該当するソースの固有番号を合算して格納する方式を選択してもよい。次の表4はソースごとの固有番号を示している。次の表4におけるソースはそれぞれ該当のソース名で識別されるデータベースに対応してもよい。
【表4】

【0059】
図3は、本発明の一実施形態に係る複数のソースを維持する方法を説明するための図である。原語「Godfrey」310と異形態「ゴッドフリー」の集合は「人物」のソースから引入れられるが、原語「Godfrey」310のみを考慮すると、下の表5のように「人物」ソース、「飼い犬」ソース、及び「英語辞書」ソースから引入れられると仮定する。
【表5】

【0060】
この場合、原語「Godfrey」310に対する3つのソースを維持するために図1を参照して説明した検索結果提供システム120は各ソースごとの表4で示される固有番号(2、2及び2)を合算した値である「138」320を算出してもよい。すなわち、検索結果提供システム120のみならず、検索結果提供システム120に関連する異なるシステムまたは管理者がこのような固有番号の合算値「138」320を用いて原語「Godfrey」310に対する3つのソースの全てに関する情報が取得される。例えば、値「138」320は2進数「00010001010」に対応し、「1」に対応する値が上述した3つのソースであることが容易に把握できる。したがって、1つのキーワードに対して、複数のソースから、データの削除なく原ソース情報を確認することができる。
【0061】
上述した「ソース」は上位ソースと下位ソースに分類されてもよい。例えば、ソースの「人物」は、第1詳細ソースとしてソース「主題ごと」を上位ソースとして有してもよく、第2詳細ソースの「映画俳優」を下位ソースとして有してもよい。ここで、上述した表4は、第1詳細ソースを基準にして固有番号を提示しているが、上述したソースとソースによる固有番号とはソースの分類方式に応じて必要な方式を定めて用いてもよい。例えば、第1詳細ソースの上位ソースについてのみ固有番号を用いたり、第1詳細ソースの下位ソースについてのみ固有番号を用いたりしてもよい。または、全てのソースについて固有番号を決定して用いてもよい。
【0062】
このようなソースに関する情報を保有する目的は2つある。第1に、どのようなソースのキーワードでクリックが多く発生したかのサービスの現況把握の側面、第2に、ソースごとのクリック発生頻度を参照してサービス品質を制御するという目的がある。すなわち、クリック発生頻度が低いソースのキーワードは品質が低いとみなし、該当ソースのデータの露出を制限してもよい。反対に、クリック発生頻度が高いソースである場合、上位に露出されるロジックを適用してユーザ満足度の高いデータの露出優先順位を高めることができる。
【0063】
再び図1を参照すると、検索結果提供システム120は、検索語130に対する検索結果140をユーザ端末110を介してユーザに提供してもよい。例えば、検索結果提供システム120がインターネット検索結果を提供するシステムとして、検索結果提供システム120とユーザ端末110とがそれぞれ別のシステムとして有線/無線ネットワークを介して接続された場合、検索結果提供システム120は、検索結果140を含む検索結果ページを生成してユーザ端末110に提供することで、ユーザ端末110を介してユーザに検索結果140を提供してもよい。
【0064】
図4は本発明の一実施形態に係る検索結果として、外来語の発音サービスが提供されるウェブページを示す図である。すなわち、検索結果ページ400は、図1に示す検索語130に対する検索結果140が提供されるウェブページの一部を示している。図4に示されるように、検索結果提供システム120は、異形態「キャリア」に対する原語および異形態をユーザに提供することによって、外来語クエリを入力するユーザに様々な形態の外来語の発音を提供してもよい。
【0065】
また、外来語の発音中にはユーザが既に知っている異形態と他のユーザの検索によって認知される異形態があり得る。特に、原語および異形態が意味によって関連づけられるのではなく発音関係によって関連づけられるため、検索したクエリと同じ意味をも持っているか、あるいは、どのような意味の検索語であるかが気になるユーザも発生する。したがって、検索結果提供システム120は、外来語の発音キーワードごとに「意味を解釈」サービスと「発音を聞く」サービスを提供してもよい。「意味を解釈する」機能410及び「発音を聞く」機能420は、外来語の発音キーワードにマウスオーバーするときに表示ないし実施されるレイヤ形態で提供されてもよい。
【0066】
図5は、本発明の一実施形態に係る検索結果提供システムの内部構成を説明するためのブロック図である。本実施形態に係る検索結果提供システム500は、図1を参照して説明した検索結果提供システム120に対応し、図5に示すように原語−異形態維持部510、関連外来語検索部520、及び関連外来語提供部540を備えている。また、検索結果提供システム500は、図5に示す露出優先順位決定部530を必要に応じて選択的に備えてもよい。
【0067】
原語−異形態維持部510は、外来語に対して外来語の原語と原語に対する外来語の異形態の集合とを発音関係で互いに関連づけてデータベースに格納及び維持する。例えば、原語−異形態維持部510は、上述した表1のように原語「present」と原語「present」に対する異形態の集合である「プレゼント、プリゼント、プレジェント、プリジェント」を互いに関連づけてデータベースに格納及び維持する。すなわち、上述した例のように、日本語の場合には、原語は英文アルファベット形態に、異形態はカタカナ外来語の形態で表してもよい。
【0068】
関連外来語検索部520は、ユーザ端末を介して送信される検索語に、原語及び異形態のうち少なくとも1つの単語が含まれた場合、データベースから当該単語と発音関係で互いに関連づけられて格納された原語及び異形態のうち少なくとも1つの関連外来語を検索する。
【0069】
ここで、関連外来語検索部520は検索語に含まれる単語が原語である場合、データベースから単語と発音関係で関連づけられて格納された異形態を少なくとも1つの関連外来語として検索してもよい。例えば、原語「present」がユーザ端末を介して送信される検索語に含まれた場合、関連外来語検索部520は異形態の集合である「プレゼント、プリゼント、プレジェント、プリジェント」に含まれる異形態を関連外来語として検索してもよい。
【0070】
また、関連外来語検索部520は検索語に含まれる単語が異形態である場合、データベースから単語と発音関係で関連づけられて格納された原語及び格納された原語と発音関係で関連づけられて格納された異形態とを少なくとも1つの関連外来語として検索してもよい。
【0071】
また、関連外来語検索部520は、原語または異形態が検索語として入力された回数である検索回数(QC)及び原語と異形態とを同時に含む文書の数を意味する検索結果の数のうち、少なくとも1つを用いて、少なくとも1つの原語または異形態をデータベースから削除することで格納されたデータを洗練してもよい。ここで、関連外来語検索部520は、検索回数及び検索結果の数に応じて、例えば検索回数がゼロであるか否か、及び検索結果の数がゼロであるか否かに応じて、原語または異形態を分類し、少なくとも1つの分類に属する原語または異形態を削除してもよい。このようなデータの洗練については、上述した表3及び(1)〜(4)の場合を通して既に詳しく説明したため、反復的な説明は省略する。
【0072】
関連外来語提供部540は、検索される少なくとも1つの関連外来語をユーザ端末に提供する。本発明の一実施形態において、関連外来語提供部540は、既に説明したようにユーザ端末が検索結果提供システム500に含まれ、入出力インタフェースを有するモジュールから構成された場合、ユーザ端末の出力インタフェースを介して検索結果と共に関連外来語を露出させることで、ユーザ端末の入力インタフェースを介して検索語を入力するユーザに関連外来語を提供してもよい。また、本発明の他の実施形態として、ユーザ端末が検索結果提供システム500とは別のシステムであり、有線/無線ネットワークを介して検索語を検索結果提供システム500に送信する場合、関連外来語提供部540は有線/無線ネットワークを介して検索語に対する検索結果とともに関連外来語をユーザ端末へと送信してもよい。例えば、関連外来語提供部540は、検索される少なくとも1つの関連外来語を検索語に対する検索結果を提供するウェブページに追加し、検索される少なくとも1つの関連外来語が追加されたウェブページをユーザ端末に提供することにより、検索される少なくとも1つの関連外来語を提供してもよい。ここで、ウェブページ上で関連外来語が追加された領域にユーザイベントが発生する場合、関連外来語に対する「意味を解釈する」機能及び「発音を聞く」機能のうち少なくとも1つの機能がユーザ端末に提供されてもよい。
【0073】
露出優先順位決定部530は、検索される少なくとも1つの関連外来語の露出優先順位を決定する。ここで、露出優先順位決定部530は、原語または異形態が検索語として入力された回数である検索回数(QC)及び原語または異形態のソースのうち少なくとも1つに基づいて露出優先順位を決定してもよい。ここで、ソースは、既に説明したように原語または異形態が抽出されたデータベースに応じて決定される。例えば、露出優先順位決定部530は、検索回数にソースによる加重値を付与し、加重値が付与された検索回数に基づいて露出優先順位を決定してもよい。他の例として、露出優先順位決定部530はソースごとに露出優先順位を決定し、同一ソースの原語または異形態に対しては検索回数を用いて露出優先順位を決定してもよい。
【0074】
このように、露出優先順位を用いる場合、関連外来語提供部540は露出優先順位に応じた順に少なくとも1つの関連外来語を提供してもよい。例えば、関連外来語提供部540は、検索結果を提供するウェブページ上に関連外来語が露出優先順位に応じる順に列挙されるよう配置してもよい。
【0075】
また、検索結果提供システム500は、検索語に対する関連検索語を提供する関連検索語提供部(図示せず)をさらに備えてもよい。ここで、検索語に対する関連検索語と関連外来語とが互いに重複する場合、関連検索語のうち、重複する関連検索語を除外して提供する。それだけではなく、検索結果提供システム500は、検索語が広告キーワードにおいて既に設定されたキーワードである場合、広告キーワードに対する関連キーワードのビジネスキーワードを提供するビジネスキーワード提供部(図示せず)をさらに備えてもよい。ここで、検索語に対するビジネスキーワードと関連外来語とが互いに重複する場合、関連外来語から、重複する関連外来語を除外して提供する。重複を除く方法については既に図1を参照して詳しく説明したため、反復的な説明は省略する。
【0076】
また、原語または異形態のソースによる固有番号を合算した値を用いて原語または異形態のソースを表示してもよい。この場合にも、ソースは上述したように、原語または異形態の抽出されたデータベースに応じて決定されてもよい。ここで、固有番号それぞれは1つの特定ケタ数に1の値を有する2進数の形式で表してもよい。ソースを表示する方法については表4及び図3を参照して既に詳しく説明したため、反復的な説明は省略する。
【0077】
図6は、本発明の一実施形態に係る検索結果提供方法を示すフローチャートである。本実施形態に係る検索結果提供方法は、図5を参照して説明した検索結果提供システム500によって行われてもよい。図6では検索結果提供システム500によって各ステップが行われる過程を説明することによって、検索結果提供方法を説明する。ここで、検索結果提供システム500において、露出優先順位決定部530が選択的に存在するのと対応して、図6に示すステップS630は選択的に行なってもよい。
【0078】
ステップS610において、検索結果提供システム500は、外来語に対して外来語の原語と原語に対する外来語の異形態の集合とを発音関係で互いに関連づけてデータベースに格納及び維持する。例えば、検索結果提供システム500は、上述した表1のように原語「present」と原語「present」に対する異形態の集合である「プレゼント、プリゼント、プレジェント、プリジェント」とを互いに関連づけてデータベースに格納及び維持する。すなわち、上述した例のように日本語の場合には、原語は英文アルファベット形態に、異形態はカタカナ外来語の形態のように表してもよい。
【0079】
ステップS620において、検索結果提供システム500は、ユーザ端末を介して送信される検索語に原語及び異形態のうち少なくとも1つの単語が含まれる場合、データベースにおいて当該単語と発音関係で互いに関連づけられて格納された原語及び異形態のうちから少なくとも1つの関連外来語を検索する。
【0080】
ここで、検索結果提供システム500は単語が原語である場合、データベースから当該単語と発音関係で関連づけられて格納された異形態を少なくとも1つの関連外来語として検索してもよい。例えば、原語「present」がユーザ端末を介して送信される検索語に含まれた場合、検索結果提供システム500は異形態の集合である「プレゼント、プリゼント、プレジェント、プリジェント」に含まれる異形態を関連外来語として検索してもよい。
【0081】
また、検索結果提供システム500は単語が異形態である場合、データベースで当該単語と発音関係で関連づけられて格納された原語及び格納された原語と発音関係で関連づけられて格納された異形態とを少なくとも1つの関連外来語として検索してもよい。
【0082】
また、検索結果提供システム500は、原語または異形態が検索語として入力された回数である検索回数(QC)及び原語と異形態とを同時に含む文書の数を意味する検索結果の数のうち少なくとも1つを用いて、少なくとも1つの原語または異形態をデータベースから削除することで格納されたデータを洗練してもよい。ここで、検索結果提供システム500は、検索回数及び検索結果の数に応じて、例えば検索回数がゼロであるか否か、及び検索結果の数がゼロであるか否かに応じて、原語または異形態を分類し、少なくとも1つの分類に属する原語または異形態を削除してもよい。このようなデータの洗練については、上述した表3及び(1)〜(4)の場合によって既に詳しく説明したため、反復的な説明は省略する。
【0083】
ステップS640において、検索結果提供システム500は検索される少なくとも1つの関連外来語をユーザ端末に提供する。本発明の一実施形態として、検索結果提供システム500は、既に説明したようにユーザ端末が検索結果提供システム500に含まれ、入出力インタフェースを有するモジュールから構成された場合、ユーザ端末の出力インタフェースを介して検索結果と共に関連外来語を露出させることで、ユーザ端末の入力インタフェースを介して検索語を入力するユーザに関連外来語を提供してもよい。また、本発明の他の実施形態として、ユーザ端末が検索結果提供システム500とは別のシステムであり、有線/無線ネットワークを介して検索語を送信する場合、検索結果提供システム500は、有線/無線ネットワークを介して検索語に対する検索結果とともに関連外来語を送信してもよい。例えば、検索結果提供システム500は、検索される少なくとも1つの関連外来語を検索語に対する検索結果を提供するウェブページに追加し、検索される少なくとも1つの関連外来語が追加されたウェブページをユーザ端末に提供することにより、検索される少なくとも1つの関連外来語を提供してもよい。ここで、ウェブページ上で関連外来語が追加された領域にユーザイベントが発生する場合、関連外来語に対する「意味を解釈する」機能及び「発音を聞く」機能のうち少なくとも1つの機能がユーザ端末に提供されてもよい。
【0084】
ステップS630において、検索結果提供システム500は、検索される少なくとも1つの関連外来語の露出優先順位を決定する。ここで、検索結果提供システム500は、原語または異形態が検索語として入力された回数である検索回数(QC)及び原語または異形態のソースのうち少なくとも1つに基づいて露出優先順位を決定してもよい。ここで、ソースは、既に説明したように原語または異形態が抽出されたデータベースに応じて決定されてもよい。例えば、検索結果提供システム500は、検索回数にソースによる加重値を付与し、加重値の付与された検索回数に基づいて露出優先順位を決定してもよい。他の例として、検索結果提供システム500はソースごとに露出優先順位を決定し、同一ソースの原語または異形態に対しては検索回数を用いて露出優先順位を決定してもよい。
【0085】
このように露出優先順位を用いる場合、検索結果提供システム500は、ステップS640において露出優先順位に応じた順に少なくとも1つの関連外来語を提供してもよい。例えば、検索結果提供システム500は、検索結果を提供するウェブページ上に関連外来語が露出優先順位に応じる順に列挙されるように配置されてもよい。
【0086】
また、検索結果提供システム500は検索語に対する関連検索語を提供するステップ(図示せず)をさらに行なってもよい。ここで、検索語に対する関連検索語と関連外来語とが互いに重複する場合、関連検索語のうち、重複する関連検索語を除外して提供する。それだけではなく、検索結果提供システム500は、検索語が広告キーワードで既に設定されたキーワードである場合、広告キーワードに対する関連キーワードのビジネスキーワードを提供するステップ(図示せず)をさらに行なってもよい。ここで、検索語に対するビジネスキーワードと関連外来語とが互いに重複する場合、関連外来語から、重複する関連外来語を除外して提供する。重複を除く方法については既に図1を参照して詳しく説明したため、反復的な説明は省略する。
【0087】
また、原語または異形態のソースによる固有番号を合算した値を用いて原語または異形態のソースを表示してもよい。この場合にも、ソースは上述したように原語または異形態の抽出されたデータベースに応じて決定されてもよい。ここで、固有番号それぞれは1つの特定ケタ数に1の値を有する2進数の形式で表してもよい。ソースを表示する方法については、表4及び図3を参照して既に詳しく説明したため、反復的な説明は省略する。
【0088】
図5及び図6で省略された内容は図1〜図4を参照してもよい。
【0089】
このように、本発明の実施形態によって、外来語クエリを入力するユーザに様々な発音の形態で外来語を提供してもよい。より詳しくは、英文アルファベット形態の原語とカタカナ外来語である異形態に区分される外来語について、原語と原語に対する異形態の集合とを発音関係で互いに関連づけて格納及び維持し、ユーザから原語または異形態を含むクエリが入力される場合、発音が関連する原語または異形態をユーザに提供することによって、ユーザに様々な発音形態で外来語を提供することができる。また、検索回数(QC)、原語または異形態のソース、及び検索結果の数のうち少なくとも1つに基づいて原語または異形態の露出有無や露出優先順位を決定することができ、原語または異形態のソースに関する情報を維持することで、どのようなソースのキーワードでクリックが多く発生したかのサービス現況を把握することができ、ソースごとのクリック発生頻度を参考してサービス品質を制御することができる。
【0090】
本発明の実施形態に係る方法は、多様なコンピュータ手段を介して様々な処理を実行することができるプログラム命令の形態で実現され、コンピュータで読取可能な記録媒体に記録されてもよい。コンピュータで読取可能な媒体は、プログラム命令、データファイル、データ構造などのうちの1つまたはその組合せを含んでもよい。媒体に記録されるプログラム命令は、本発明の目的のために特別に設計されて構成されたものでもよく、コンピュータソフトウェア分野の技術を有する当業者にとって公知のものであり、使用可能なものであってもよい。
【0091】
上述したように、本発明を限定された実施形態と図面とによって説明したが、本発明は、上述の実施形態に限定されることなく、本発明が属する分野における通常の知識を有する者であれば、このような実施形態から多様な修正及び変形が可能である。
【0092】
したがって、本発明の範囲は、開示された実施形態に限定されるものではなく、特許請求の範囲だけではなく特許請求の範囲と均等なものなどによって定められるものである。
【符号の説明】
【0093】
500 検索結果提供システム
510 原語−異形態維持部
520 関連外来語検索部
530 露出優先順位決定部
540 関連外来語提供部

【特許請求の範囲】
【請求項1】
外来語に対して、前記外来語の原語と前記原語に対する前記外来語の異形態の集合とを発音関係で互いに関連づけてデータベースに格納及び維持する原語−異形態維持部と、
ユーザ端末を介して送信される検索語に前記原語及び前記異形態のうちの少なくとも1つの単語が含まれる場合、前記データベースで前記単語と発音関係で互いに関連づけられて格納された原語及び異形態のうちから少なくとも1つの関連外来語を検索する関連外来語検索部と、
前記検索された少なくとも1つの関連外来語を前記ユーザ端末に提供する関連外来語提供部と、
を備えることを特徴とする検索結果提供システム。
【請求項2】
前記関連外来語検索部は、前記単語が原語である場合、前記データベースで前記単語と発音関係で関連づけられて格納された異形態を前記関連外来語として検索することを特徴とする請求項1に記載の検索結果提供システム。
【請求項3】
前記関連外来語検索部は、前記単語が異形態である場合、前記データベースで前記単語と発音関係で関連づけられて格納された原語及び前記格納された原語と発音関係で関連づけられて格納された異形態のうち少なくとも1つを前記関連外来語として検索することを特徴とする請求項1または請求項2に記載の検索結果提供システム。
【請求項4】
前記検索される少なくとも1つの関連外来語の露出優先順位を決定する露出優先順位決定部をさらに備え、
前記関連外来語提供部は、前記露出優先順位に応じた順で前記少なくとも1つの関連外来語を提供することを特徴とする請求項1から請求項3のいずれかに記載の検索結果提供システム。
【請求項5】
前記露出優先順位決定部は、前記原語または前記異形態が検索語として入力された回数である検索回数及び前記原語または前記異形態のソースのうち少なくとも1つに基づいて前記露出優先順位を決定し、
前記ソースは、前記原語または前記異形態が抽出されたデータベースに応じて決定されることを特徴とする請求項4に記載の検索結果提供システム。
【請求項6】
前記露出優先順位決定部は、前記検索回数に前記ソースによる加重値を付与し、前記加重値が付与された検索回数に基づいて前記露出優先順位を決定することを特徴とする請求項5に記載の検索結果提供システム。
【請求項7】
前記露出優先順位決定部は、前記ソースごとに前記露出優先順位を決定し、同一ソースの原語または異形態に対しては前記検索回数を用いて露出優先順位を決定することを特徴とする請求項5に記載の検索結果提供システム。
【請求項8】
前記検索語に対する関連検索語を提供する関連検索語提供部をさらに備え、
前記検索語に対する前記関連検索語と前記関連外来語とが互いに重複する場合、前記重複する関連検索語を除外して提供することを特徴とする請求項1から請求項7のいずれかに記載の検索結果提供システム。
【請求項9】
前記検索語が広告キーワードとして既に設定されたキーワードである場合、前記広告キーワードに対する関連キーワードであるビジネスキーワードを提供するビジネスキーワード提供部をさらに備え、
前記検索語に対する前記ビジネスキーワードと前記関連外来語とが互いに重複する場合、重複する前記関連外来語を除外して提供することを特徴とする請求項1から請求項7のいずれかに記載の検索結果提供システム。
【請求項10】
前記関連外来語検索部は、前記原語または前記異形態が検索語として入力された回数である検索回数及び前記原語と前記異形態を同時に含む文書の数を意味する検索結果の数のうち少なくとも1つを用いて、少なくとも1つの原語または異形態を前記データベースから削除することを特徴とする請求項1から請求項9のいずれかに記載の検索結果提供システム。
【請求項11】
前記関連外来語検索部は、前記検索回数及び前記検索結果の数に応じて前記原語または前記異形態を分類し、少なくとも1つの分類に属する原語または異形態を削除することを特徴とする請求項10に記載の検索結果提供システム。
【請求項12】
前記原語または前記異形態のソースによる固有番号を合算した値を用いて前記原語または前記異形態のソースを表示し、
前記ソースは、前記原語または前記異形態が抽出されたデータベースに応じて決定されることを特徴とする請求項1から請求項11のいずれかに記載の検索結果提供システム。
【請求項13】
前記固有番号それぞれは、1つの特定ケタ数に1の値を有する2進数の形式で表現されることを特徴とする請求項12に記載の検索結果提供システム。
【請求項14】
前記関連外来語提供部は、前記検索される少なくとも1つの関連外来語を前記検索語に対する検索結果を提供するウェブページに追加し、前記検索される少なくとも1つの関連外来語が追加されたウェブページを前記ユーザ端末に提供することにより前記検索される少なくとも1つの関連外来語を提供することを特徴とする請求項1から請求項13のいずれかに記載の検索結果提供システム。
【請求項15】
前記ウェブページ上で前記関連外来語が追加された領域においてユーザイベントが発生する場合に、前記関連外来語の「意味を解釈する」機能及び「発音を聞く」機能のうち少なくとも1つの機能を前記ユーザ端末に提供することを特徴とする請求項14に記載の検索結果提供システム。
【請求項16】
外来語に対して、前記外来語の原語と前記原語に対する前記外来語の異形態との集合を発音関係で互いに関連づけてデータベースに格納及び維持するステップと、
ユーザ端末を介して送信される検索語に前記原語及び前記異形態のうち少なくとも1つの単語が含まれる場合、前記データベースで前記単語と発音関係で互いに関連づけられて格納された原語及び異形態のうち少なくとも1つの関連外来語を検索するステップと、
前記検索された少なくとも1つの関連外来語を前記ユーザ端末に提供するステップと、
を含むことを特徴とする検索結果提供方法。
【請求項17】
前記検索される少なくとも1つの関連外来語を前記ユーザ端末に提供するステップは、前記単語が原語である場合、前記データベースで前記単語と発音関係で関連づけられて格納された異形態のうち少なくとも1つを前記関連外来語として検索することを特徴とする請求項16に記載の検索結果提供方法。
【請求項18】
前記検索される少なくとも1つの関連外来語を前記ユーザ端末に提供するステップは、前記単語が異形態である場合、前記データベースで前記単語と発音関係で関連づけられて格納された原語及び前記格納された原語と発音関係で関連づけられて格納された異形態のうち少なくとも1つを前記関連外来語として検索することを特徴とする請求項16または請求項17に記載の検索結果提供方法。
【請求項19】
前記検索される少なくとも1つの関連外来語の露出優先順位を決定するステップをさらに含み、
前記検索される少なくとも1つの関連外来語を前記ユーザ端末に提供するステップは、前記露出優先順位に応じた順で前記少なくとも1つの関連外来語を提供することを特徴とする請求項16から請求項18のいずれかに記載の検索結果提供方法。
【請求項20】
請求項16から請求項19のいずれかに記載の方法を行うプログラムを記録したコンピュータで読取可能な記録媒体。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2012−248187(P2012−248187A)
【公開日】平成24年12月13日(2012.12.13)
【国際特許分類】
【出願番号】特願2012−117736(P2012−117736)
【出願日】平成24年5月23日(2012.5.23)
【出願人】(505205812)エヌエイチエヌ コーポレーション (408)