説明

オンライン辞書サービス提供装置及びオンライン辞書サービス提供方法

【課題】多様な種類の言語に対して母国語解釈を動的に提供することができるオンライン辞書サービス提供装置及び方法を提供する。
【解決手段】ユーザ端末からユーザ母国語情報、ローディングされたウェブページのエンコーディング言語情報及びウェブページに含まれた検索語情報を含むクエリを受信し、ユーザ母国語情報、ウェブページのエンコーディング言語情報及び検索語情報を抽出するクエリ分析部と、原本言語の各単語に対する対象言語による各解釈データを含む少なくとも一つの辞書データを含む辞書データ格納部と、ユーザ母国語情報及びウェブページエンコーディング言語情報に基づいて辞書データを選択する辞書選択部と、選択された辞書データから検索語情報に対応する解釈データを検索する検索部と、解釈データをユーザ端末に伝送する検索結果伝送部とを含むオンライン辞書サービス提供装置を構成する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、オンライン辞書サービスの提供装置及びオンライン辞書サービス提供方法に関するものである。
【背景技術】
【0002】
最近、インターネットを使用する人の人口の増加及びインターネットを介した情報検索の活性化により、母国語で作成されたウェブページのみならず、他の国の言語で作成されたウェブページを表示や実行などさせることが多くなった。他の国の言語で作成されたウェブページを解読するためには該当言語に堪能でなければならないが、このような言語駆使能力を有するユーザは小数に過ぎない。したがって、インターネットユーザの便宜を図るために、言語の障壁を解消するための翻訳サービス又は辞書サービスが提供されている。
【0003】
通常の翻訳サービスの場合、ウェブページに含まれた文章又は翻訳しようとするウェブページのURLをコピーして翻訳サービス提供ウェブページなどに入力すれば、翻訳サーバに前記入力された原文が送られ、原文に対する翻訳結果をユーザ端末に伝送する方式が使用される。しかしながら、このような翻訳サービスの翻訳品質は、満足できる水準でなく、原文又はURLをコピーして入力する煩雑な手順を経るようになる。
【0004】
また、通常の辞書サービスの場合、検索しようとする単語をマウスなどのポインティング装置で指示すれば、該当単語がウェブサーバに伝送され、それに対する解釈結果が表示される。すなわち、単語単位で解釈が提供される。
【0005】
図1は、通常提供されるオンライン辞書サービスを説明するための図である。
【0006】
ネイバー(www.naver.com)又はダウム(www.daum.net)のようなポータルサイトなどでは、ユーザの便宜のため、種々の簡単なアプリケーションが含まれるツールバーサービスが提供されている。前記ツールバーサービスに含まれた一つのサービスとしてオンライン辞書サービスが提供されている。図示したように、マウスなどのポインティング装置の指示子10がウェブページに含まれた単語「research」を指示すれば、該当単語「research」に対する解釈20がツールチップ形態で提供される。このとき、指示子10が単語の周辺に位置することを示しているが、ほとんどの実施例の場合、指示子10は単語の直上に位置する。
【0007】
一方、従来技術は、指定された第1の言語(例えば、英語)に対する指定された第2の言語(例えば、韓国語)への解釈のみを提供しており、その他の言語に対する解釈を動的に提供できずにいる。したがって、多様なユーザのニーズに合うオンライン辞書サービスを提供する必要がある。
【発明の概要】
【発明が解決しようとする課題】
【0008】
本発明の一実施例に係る課題の一つは、多様な種類の言語に対して母国語解釈を動的に提供することができるオンライン辞書サービス提供装置及びオンライン辞書サービス提供方法を提供することである。
【課題を解決するための手段】
【0009】
上述した技術的課題を達成するための技術的手段として、本発明の第1の側面として、ユーザ端末からユーザ母国語情報、ローディングされたウェブページのエンコーディング言語情報及び前記ウェブページに含まれた検索語情報を含むクエリを受信し、前記ユーザ母国語情報、ウェブページのエンコーディング言語情報及び検索語情報を抽出するクエリ分析部と、原本言語の各単語に対する対象言語による各解釈データを含む少なくとも一つの辞書データを含む辞書データ格納部と、前記ユーザ母国語情報及びウェブページエンコーディング言語情報に基づいて前記辞書データを選択する辞書選択部と、前記選択された辞書データから前記検索語情報に対応する前記解釈データを検索する検索部と、前記解釈データを前記ユーザ端末に伝送する検索結果伝送部とを含むオンライン辞書サービス提供装置を提供する。
【0010】
また、本発明の第2の側面として、ユーザ端末からユーザ母国語情報、ローディングされたウェブページのエンコーディング言語情報及び前記ウェブページに含まれた検索語情報を含むクエリを受信し、前記クエリから前記ユーザ母国語情報、ウェブページのエンコーディング言語情報及び検索語情報を抽出し、原本言語の各単語に対する対象言語による各解釈データを含む少なくとも一つの辞書データから、前記ユーザ母国語情報及びウェブページエンコーディング言語情報に基づいて辞書データを選択し、前記選択された辞書データから前記検索語情報に対応する前記解釈データを検索し、前記解釈データを前記ユーザ端末に伝送することを含むオンライン辞書サービス提供装置を提供する。
【0011】
また、本発明の第3の側面として、ユーザ端末からユーザの母国語情報を確認し、前記ユーザ端末にローディングされたウェブページのエンコーディング言語情報を確認し、前記ウェブページ上でポインティング装置を介してポインティングされた単語を抽出して検索語情報を生成し、前記ユーザ母国語情報、前記ウェブページのエンコーディング言語情報及び前記検索語情報を含むクエリを生成し、前記クエリに基づいた辞書サーバの検索結果を受信して前記ユーザ端末に表示することを含むオンライン辞書サービス提供方法を提供する。
【0012】
また、本発明の第4の側面として、前記オンライン辞書サービス提供方法に記載された段階を行うプログラムが記録されたコンピュータ読取可能な記録媒体を提供する。
【発明の効果】
【0013】
上述した本発明の課題解決手段によれば、ユーザの母国語によって、ウェブページに表示された多様な国の言語に対して自動に解釈サービスを提供することができる。特に、ユーザの母国語に基づいて解釈サービスを提供するので、ユーザに最適化したサービスを提供することができる。
【0014】
また、ユーザの母国語をユーザ端末の設定に基づいて自動に確認するので、便利性がより増加する。
【図面の簡単な説明】
【0015】
【図1】通常提供されるオンライン辞書サービスを説明するための図である。
【図2】本発明の一実施例に係るオンライン辞書サービス提供装置を示した図である。
【図3】ウェブページのエンコーディング情報を含むヘッダ部分の一例を示した図である。
【図4】本発明の一実施例に係る検索語生成部の詳細構成を示した図である。
【図5】本発明の一実施例に係るオンライン辞書サービス提供方法を示したフローチャートである。
【発明を実施するための形態】
【0016】
以下、本発明の属する技術分野における通常の知識を有する者が容易に実施できるように、添付の図面を参照して本発明の実施例を詳細に説明する。本発明は、多様な異なる形態で具現可能であり、ここで説明する実施例によって限定されるものでない。そして、図面では、本発明を明確に説明するために、説明と関係のない部分は省略し、明細書全体にわたって類似した部分には類似した図面符号を付した。
【0017】
明細書全体で、一つの部分が他の部分と「連結」または「接続」されているというとき、これは、「直接的に連結または接続」されている場合だけでなく、その中間に他の素子を挟んで「電気的に連結または接続」されている場合も含む。また、一つの部分が一つの構成要素を「含む」というとき、これは、特別に反対の記載がない限り、他の構成要素を除外するのでなく、他の構成要素をさらに含むことができることを意味する。
【0018】
以下、図面を参照して本発明の内容を説明する。
【0019】
図2は、本発明の一実施例に係るオンライン辞書サービス提供装置を示した図である。
【0020】
オンライン辞書サービス提供装置100は、クライアント200及び辞書サーバ300を含む。クライアント200は、ユーザ端末にインストール(設置)され、各種情報を収集し、これを、ネットワークを介して辞書サーバ300に伝達する。ネットワークは、近距離通信網(Local Area Network;LAN)、広域通信網(Wide Area Network;WAN)又は付加価値通信網(Value Added Network;VAN)などのような有線ネットワークや、移動通信網又は衛星通信網などのようなあらゆる種類の無線ネットワークで具現される。
【0021】
クライアント200は、ユーザの母国語情報、ウェブページのエンコーディング情報及び検索語情報を含むクエリを生成して辞書サーバ300に伝送する。クライアント200は、ユーザ母国語確認部210、ウェブページ言語確認部220、検索語生成部230、クエリ生成部240、検索結果表示部250及び環境設定部260を含む。
【0022】
クライアント200は、ネットワークを介してダウンロードされ、コンピュータや携帯用端末などのユーザ端末にインストール(設置)される。ここで、コンピュータは、例えば、ウェブブラウザが搭載されたノートブック、デスクトップ、ラップトップなどを含み、携帯用端末は、例えば、携帯性と移動性が保障される無線通信装置であって、PCS(Personal Communication System)、GSM(Global System for Mobile communications)、PDC(Personal Digital Cellular)、PHS(Personal Handyphone System)、PDA(Personal Digital Assistant)、IMT(International Mobile Telecommunication)―2000、CDMA(Code Division Multiple Access)―2000、W―CDMA(W―Code Division Multiple Access)、Wibro(Wireless Broadband Internet)端末などのようなあらゆる種類のハンドヘルド(Handheld)ベースの無線通信装置を含むことができる。
【0023】
ユーザ母国語確認部210は、ユーザ端末の設定状態からユーザの母国語を確認する。例えば、コンピュータや携帯用端末にインストール(設置)されたオペレーティングシステム(OS)又はアプリケーションプログラムの情報からユーザの母国語を確認する。通常使用されるオペレーティングシステム(OS)としては、マイクロソフト社のウィンドウズ(登録商標)(WINDOWS(登録商標))シリーズを例に挙げることができる。前記ウィンドウズ(登録商標)OSの場合、英語の他に、各国の国語をメーン言語として表示する各製品に分類される。例えば、韓国語、中国語、日本語などをメーン言語として使用するウィンドウズ(登録商標)OSがユーザ端末にインストール(設置)される。したがって、ユーザ端末にインストール(設置)されたOSに基づいてユーザの母国語を判断することができる。すなわち、ユーザ端末にインストール(設置)されたオペレーティングシステムのメーン言語が英語である場合、ユーザの母国語は英語であると判断する。
【0024】
また、ユーザ端末のオペレーティングシステム(OS)の他に、各種アプリケーションプログラムの情報からユーザの母国語を確認することができる。アプリケーションプログラムには、オフィスプログラム及びウェブブラウザなどの多様なソフトウェアが含まれる。このようなアプリケーションプログラムも、オペレーティングシステムと同様に、各国の国語をメーン言語として表示する各製品に分類される。したがって、ユーザ端末にインストール(設置)されたアプリケーションプログラムのメーン言語に基づいてユーザの母国語を確認することができる。
【0025】
一方、相当数のユーザ端末においては、オペレーティングシステムのメーン言語とアプリケーションプログラムのメーン言語とが一致するので、二つの基準のうち何れか一つのみを使用してユーザの母国語を確認することができる。オペレーティングシステムのメーン言語とアプリケーションプログラムのメーン言語とが異なる場合は、オペレーティングシステムのメーン言語に基づいてユーザの母国語を決定したり、アプリケーションプログラムのメーン言語に基づいてユーザの母国語を決定したりする。
【0026】
ウェブページ言語確認部220は、ユーザ端末のウェブブラウザにローディングされたウェブページのエンコーディング言語を確認する。通常のウェブページはHTML言語により作成され、ウェブページのプログラミング文書のヘッダ領域には、該当ウェブページがどの言語を基準にしてエンコーディングされたかに関する情報が格納される。
【0027】
図3は、ウェブページのエンコーディング情報を含むヘッダの一例を示した図である。
【0028】
ウェブページのエンコーディング情報は、「charset」の設定値によって決定される。図示したように、「charset」が「euc―kr」に設定された場合、該当ウェブページは、「euc―kr」コードによってエンコーディングされたと判断する。「euc―kr」コードは、韓国語をベースにするエンコーディング方法であるので、該当ウェブページは、韓国語に基づいて作成されたと判断する。
【0029】
このようなエンコーディング方法は、言語の種類及び開発主体などによって多様な種類に区分される。日本語を基盤にするエンコーディング方法としてはShift_JIS、EUC―JP、ISO―2022―JPなどがあり、中国語を基盤にするエンコーディング方法としてはGB 2312、GBK、GB 18030、Big5などがあり、韓国語を基盤にするエンコーディング方法としてはEUC―KR、ISO―2022―KRなどがある。その他に、アラビア語、バルト語、中央ヨーロッパ語、ギリシャ語、ヘブライ語、タイ語、トルコ語、ベトナム語、西ヨーロッパ語などの各言語を基盤にする多様なエンコーディング方法が知られている。
【0030】
したがって、各ウェブページのエンコーディング情報を確認すれば、該当ウェブページに記述された言語がどの言語で作成されているかを確認することができる。
【0031】
ウェブページ言語確認部220は、各ウェブページのプログラミング文書のヘッダ部分の「charset」に設定された値を抽出し、エンコーディング情報を確認することができる。また、BHO(Browser Helper Objects)モジュールを用いてウェブページのエンコーディング情報を確認することができる。
【0032】
検索語生成部230は、マウスなどのポインティング装置を介して指示される位置にある単語を抽出し、検索語情報を生成する。以下、図面を参照して詳細構成を説明することにする。
【0033】
図4は、本発明の一実施例に係る検索語生成部の詳細構成を示した図である。
【0034】
検索語生成部230は、単語認識部232、トリミング処理部234、単語インデックス検索部236及び単語インデックス格納部238を含む。
【0035】
単語認識部232は、ポインティング装置の指示子が単語の上に位置することを示すイベントを感知し、イベントが発生した地点の単語を認識してトリミング処理部234に伝達する。このとき、ポインティング装置は、マウス、タブレット、タッチパッド又はタッチスクリーンなどのような多様な形態の入力装置である。タッチスクリーンの場合、別途の装置の他に、指によって指示子の移動が制御される。
【0036】
単語認識部232は、ポインティング装置の移動有無を持続的に感知し、指示子が単語の上に位置する時間が基準値以上である場合、指示子が位置する地点の単語を認識する。このとき、前記基準値をユーザの設定によって調節することによって、単語認識の敏感度を調節することができる。すなわち、指示子が単語の上に位置する時間の基準値を増加させれば、単語認識の敏感度が減少し、逆に、指示子が単語の上に位置する時間の基準値を減少させれば、単語認識の敏感度が増加する。
【0037】
トリミング処理部234は、単語認識部232が認識した単語からノイズ文字を除去する。ノイズ文字は、単語の解釈と関係のない多様な文字や各種特殊文字を含む。すなわち、認識された単語の前、後、中間部分などに位置した「''」、「""」、「!」、「?」などの各種文章符号などがノイズ文字に含まれ、トリミング処理部234は、このようなノイズ文字を除去するトリミング動作を行う。
【0038】
単語インデックス検索部236は、単語認識部232によって認識された単語、又は単語認識部232によって認識されてトリミング処理部234によってトリミング処理された単語のインデックスを単語インデックス格納部238から検索する。また、検索された単語のインデックスを検索語情報に設定し、これをクエリ生成部240に伝送する。検索された単語のインデックスがない場合は、該当単語に対する解釈が辞書サーバ300にもないと判断し、該当単語に対するクエリが生成されないようにする。
【0039】
単語インデックス格納部238は、辞書サーバ300に登録された各単語に対して固有のインデックスを指定して格納する。単語認識部232で認識された単語には、辞書サーバ300に登録されていない単語があり得る。このような単語がクエリに含まれる場合、辞書サーバ300は、該当単語に対する検索値を返すことができないので、不必要な演算を行うようになるという問題が発生する。そのため、本発明では、辞書サーバ300に登録された各単語のインデックス情報をクライアント200に格納し、辞書サーバ300に登録された各単語のみに対してクエリが生成されるようにする。
【0040】
一方、単語インデックス格納部238は、言語別に区別されるインデックステーブルを有することができる。すなわち、韓国語、英語、日本語、中国語などの各種言語別に互いに異なるインデックステーブルを含むようにする。
【0041】
再び図2を参照すれば、クエリ生成部240は、ユーザ母国語情報、ウェブページエンコーディング言語情報及び検索語情報を含むクエリを生成する。ユーザ母国語情報はユーザ母国語確認部210から受信し、ウェブページエンコーディング言語情報はウェブページ言語確認部220から受信し、検索語情報は検索語生成部230から受信する。このとき、検索語情報は、検索語生成部230から出力される単語のインデックスとしての形態になり得る。これは、辞書サーバ300に伝送され、辞書サーバ300は、クエリに含まれたユーザ母国語情報及びウェブページエンコーディング言語情報から適切な辞書データを選択し、選択された辞書データから検索語情報に該当する解釈データを検索するようになる。このとき、クエリ生成部240は、検索語情報によって識別される単語が辞書データに登録された場合に限って前記クエリを生成する。すなわち、単語インデックス格納部238にインデックスが登録されていない単語に対してはクエリを生成しない。
【0042】
検索結果表示部250は、辞書サーバから受信される解釈データをユーザ端末の各種表示手段に表示する。望ましくは、解釈データは、ポインティング装置が指示する検索対象単語と隣接した位置にツールチップ形態で表示する。
【0043】
環境設定部260は、ユーザが選択する各設定事項の入力を受け、これを格納し、それによってオンライン辞書サービスが提供されるようにする。上述したユーザ母国語を確認する基準をユーザ端末のオペレーティングシステム又はアプリケーションプログラムのうち何れか一つに固定したり、ユーザ母国語自体をユーザが直接設定したりするようにする。また、検索語生成部230の単語認識部232で、ポインティング装置の指示子が単語の上に位置する時間の基準値をユーザが直接設定できるようにする。
【0044】
以下、辞書サーバ300の構成を説明することにする。
【0045】
辞書サーバ300は、クライアント200からクエリを受信し、ユーザの母国語情報及びウェブページのエンコーディング言語に基づいて最適の辞書データを選択し、選択された辞書データから検索対象単語に対する解釈を検索してクライアント200に伝送する。辞書サーバ300は、クエリ分析部310、辞書選択部320、検索部330、検索結果伝送部340及び辞書データ格納部350を含む。
【0046】
辞書サーバ300のクエリ分析部310は、クライアント200から受信したクエリを分析し、ユーザ母国語情報、ウェブページエンコーディング言語情報及び検索語情報を抽出する。また、ユーザ母国語情報及びウェブページエンコーディング言語情報を辞書選択部320に伝達し、検索語情報は検索部330に伝達する。
【0047】
辞書選択部320は、ユーザ母国語情報及びウェブページエンコーディング言語情報に基づいて最適の辞書データを辞書データ格納部350から選択する。
【0048】
まず、辞書データ格納部350について説明すれば、辞書データ格納部350は、複数の辞書データ352、354、356を含む。辞書データは、原本言語の各単語に対する対象言語への解釈を含む。このとき、原本言語は、解釈を必要とする単語の言語種類を意味する。また、対象言語は、解釈を行う言語を意味する。すなわち、原本言語の各単語を、対象言語を用いて翻訳する。このとき、原本言語と対象言語とは同一の言語になり得る。例えば、韓国語、日本語、中国語、英語のうち何れか一つの言語を原本言語にし、韓国語、日本語、中国語、英語のうち何れか一つの言語を対象言語にする計16種類の辞書データを考慮することができる。すなわち、英単語を英語で解釈する辞書データ、英単語を中国語で解釈する辞書データ、英単語を日本語で解釈する辞書データ、英単語を韓国語で解釈する辞書データ、中国語単語を英語で解釈する辞書データ、中国語単語を中国語で解釈する辞書データ、中国語単語を日本語で解釈する辞書データ、中国語単語を韓国語で解釈する辞書データ、日本語単語を英語で解釈する辞書データ、日本語単語を中国語で解釈する辞書データ、日本語単語を日本語で解釈する辞書データ、日本語単語を韓国語で解釈する辞書データ、韓国語単語を英語で解釈する辞書データ、韓国語単語を中国語で解釈する辞書データ、韓国語単語を日本語で解釈する辞書データ又は韓国語単語を韓国語で解釈する辞書データを考慮することができる。
【0049】
すなわち、n個の言語のうち何れか一つの言語を原本言語にし、m個の言語のうち何れか一つの言語を対象言語にすると、計n*m種類の辞書データが含まれる。
【0050】
一方、辞書データの原本言語の各単語は、単語のインデックスとマッチングされて格納される。すなわち、クライアント200から受信した検索語情報が単語のインデックスを含む実施例の場合、単語のインデックスに基づいて検索が行われるので、辞書データは、単語のインデックス情報を含むように構成される。
【0051】
一方、本発明の辞書データは、通常の辞書に比べて簡略な解釈を含ませることができる。すなわち、ツールチップ形態の解釈を提供するので、検索対象になる単語に対する代表的な解釈のみが含まれるように辞書データを構成することができる。
【0052】
再び辞書選択部320を説明すれば、辞書選択部320は、原本言語がウェブページのエンコーディング言語情報に該当し、対象言語がユーザ母国語情報に該当する辞書データを選択する。例えば、ユーザ母国語情報が英語で、ウェブページエンコーディング言語情報が日本語である場合、原本言語が日本語で、対象言語が英語である辞書データを選択する。すなわち、ウェブページに含まれた各種日本語単語を英語で解釈する辞書データが選択される。また、ユーザ母国語情報が韓国語で、ウェブページエンコーディング言語情報が中国語である場合、原本言語が中国語で、対象言語が韓国語である辞書データを選択する。すなわち、ウェブページに含まれた各種中国語単語を韓国語で解釈する辞書データが選択される。
【0053】
検索部330は、辞書選択部320によって選択された辞書データから検索語情報に該当する解釈データを検索する。このとき、検索語情報が単語のインデックスの形態である場合、単語のインデックスに基づいて解釈データを検索する。検索された解釈データは検索結果伝送部340に伝送される。
【0054】
検索結果伝送部340は、検索された解釈データを、ネットワークを介してクライアント200に伝送する。
【0055】
参考として、本発明の実施例に係る図2と図4に示した各構成要素は、ソフトウェア、FPGA(Field Programmable Gate Array)又はASIC(Application Specific Integrated Circuit)のようなハードウェア構成要素を意味し、所定の役割を行う。
【0056】
しかし、「各構成要素」は、ソフトウェア又はハードウェアに限定される意味でなく、各構成要素は、アドレッシングできる格納媒体に含まれるように構成されたり、一つ又はそれ以上のプロセッサを再生するように構成されたりすることも可能である。
【0057】
したがって、一例として、構成要素は、各ソフトウェア構成要素、各客体指向ソフトウェア構成要素、各クラス構成要素及び各タスク構成要素のような各構成要素と、各プロセス、各関数、各属性、各プロシージャ、各サブルーチン、プログラムコードの各セグメント、各ドライバー、ファームウェア、マイクロコード、回路、データ、データベース、各データ構造、各テーブル、各アレイ及び各変数を含む。
【0058】
各構成要素と該当構成要素内で提供される機能は、より少ない数の構成要素に結合されたり、追加の構成要素にさらに分離されたりする。
【0059】
以下、本発明に係るオンライン辞書サービス提供方法について説明する。
【0060】
図5は、本発明の一実施例に係るオンライン辞書サービス提供方法を示したフローチャートである。
【0061】
まず、ユーザ端末の設定状態からユーザの母国語情報を確認する(S510)。例えば、ユーザ端末のオペレーティングシステムの設定言語又はアプリケーションプログラムの設定言語からユーザの母国語を確認することができる。
【0062】
次に、ユーザ端末にローディングされたウェブページのエンコーディング言語情報を確認する(S520)。ウェブページのエンコーディング言語は、ウェブページヘッダ部分の「charset」の設定値から確認することができる。
【0063】
次に、ウェブページからポインティング装置の指示子を通して識別された単語を抽出し、検索語情報を生成する(S530)。
【0064】
以下、検索語情報を生成する方法を詳細に説明する。
【0065】
まず、ポインティング装置の指示子が前記ウェブページの単語上に基準値以上の時間の間位置する場合、該当単語を認識する。次に、認識された単語に含まれた特殊文字をトリミングする段階を行う。次に、辞書サーバに登録された各単語に対して付与された固有の各インデックスから前記認識された単語又は前記トリミングされた単語に対するインデックスを検索する段階を行う。
【0066】
次に、ユーザ母国語情報、ウェブページのエンコーディング言語情報及び検索語情報を含むクエリを生成し(S540)、これを辞書サーバ300に伝送する。ユーザ端末にインストール(設置)されたクライアント200でクエリを生成し、ユーザ端末と辞書サーバ300との間を接続させるネットワーク手段を介してクエリが伝送される。
【0067】
辞書サーバ300は、受信したクエリを分析し、ユーザ母国語情報、ウェブページのエンコーディング言語情報及び検索語情報を抽出する(S550)。抽出されたユーザ母国語情報及びウェブページのエンコーディング言語情報は、辞書選択部320に伝達され、検索語情報は検索部330に伝達される。
【0068】
次に、ユーザ母国語情報及びウェブページのエンコーディング言語情報に基づいて適切な辞書データを選択する(S560)。このとき、ウェブページのエンコーディング言語情報が辞書データの原本言語として使用され、ユーザ母国語情報が辞書データの対象言語として使用される。すなわち、ウェブページのエンコーディング言語をユーザ母国語に解釈する辞書データが選択される。
【0069】
次に、選択された辞書データから検索語情報に該当する解釈データを検索する(S570)。実施例によって、検索語情報に含まれた単語のインデックス情報を利用し、それに該当する解釈データを検索する。
【0070】
次に、検索された解釈データを含む検索結果がクライアント200に伝送され、伝送された解釈データがクライアント200を介してユーザ端末に表示される(S580)。望ましくは、解釈データは、ポインティング装置が指示する検索対象単語と隣接した位置にツールチップ形態で表示する。
【0071】
本発明の一実施例は、コンピュータによって実行されるプログラムモジュールのようなコンピュータによって実行可能な命令語を含む記録媒体の形態でも具現される。コンピュータ読取可能な媒体は、コンピュータによってアクセスされる任意の媒体(可用媒体)であって、揮発性及び非揮発性媒体、分離型及び非分離型媒体を全て含む。また、コンピュータ読取可能な媒体は、コンピュータ格納媒体及び通信媒体を全て含むことができる。コンピュータ格納媒体は、コンピュータ読取可能な命令語、データ構造、プログラムモジュール又はその他データのような情報の格納のための任意の方法又は技術で具現された揮発性及び非揮発性、分離型及び非分離型媒体を全て含む。通信媒体は、典型的にコンピュータ読取可能な命令語、データ構造、プログラムモジュール、搬送波のような変調されたデータ信号のその他データ、又はその他伝送メカニズムを含み、任意の情報伝達媒体を含む。
【0072】
本発明の方法及びシステムを特定の実施例と関連して説明したが、これらの構成要素、動作の一部又は全部は、汎用ハードウェアアーキテクチャを有するコンピュータシステムを使用して具現される。
【0073】
上述した本発明の説明は、例示のためのものであり、本発明の属する技術分野における通常の知識を有する者であれば、本発明の技術的思想や必須の特徴を変更しない範囲で他の具体的な形態に容易に変形可能であることを理解することができる。したがって、上述した各実施例は、全ての面で例示的なものであり、限定的なものでないことを理解しなければならない。例えば、単一型として説明されている各構成要素は、分散されて実施されることも可能であり、これと同様に、分散されたものとして説明されている各構成要素も結合形態で実施されることが可能である。
【0074】
本発明の範囲は、上述した詳細な説明よりも後述する特許請求の範囲によって定められる。特許請求の範囲の意味及び範囲、そして、その均等概念から導出される全ての変更又は変形された形態は、本発明の範囲に含まれるものと解釈されなければならない。
【符号の説明】
【0075】
100:オンライン辞書サービス提供装置、200:クライアント、210:ユーザ母国語確認部、220:ウェブページ言語確認部、230:検索語生成部、240:クエリ生成部、250:検索結果表示部、260:環境設定部、300:辞書サーバ、310:クエリ分析部、320:辞書選択部、330:検索部、340:検索結果伝送部、350:辞書データ格納部

【特許請求の範囲】
【請求項1】
ユーザ端末から、ユーザ母国語情報、ローディングされたウェブページのエンコーディング言語情報及び前記ウェブページに含まれた検索語情報を含むクエリを、受信し、前記ユーザ母国語情報、ウェブページのエンコーディング言語情報及び検索語情報を抽出するクエリ分析部と、
原本言語の各単語に対する対象言語による各解釈データを含む少なくとも一つの辞書データを含む辞書データ格納部と、
前記ユーザ母国語情報及びウェブページエンコーディング言語情報に基づいて前記辞書データを選択する辞書選択部と、
前記選択された辞書データから前記検索語情報に対応する前記解釈データを検索する検索部と、
前記解釈データを前記ユーザ端末に伝送する検索結果伝送部と、を含むオンライン辞書サービス提供装置。
【請求項2】
前記ユーザ母国語情報は、前記ユーザ端末にインストールされたオペレーティングシステム又はアプリケーションプログラムに基づいて確認されることを特徴とする、請求項1に記載のオンライン辞書サービス提供装置。
【請求項3】
前記ウェブページのエンコーディング言語情報は、前記ウェブページのプログラミング文書のヘッダに含まれたキャラクタセット(charset)に基づいて確認されることを特徴とする、請求項1に記載のオンライン辞書サービス提供装置。
【請求項4】
前記検索語情報は、前記辞書データに登録された各単語に対して付与された固有の単語のインデックス情報を含むことを特徴とする、請求項1に記載のオンライン辞書サービス提供装置。
【請求項5】
前記辞書データ格納部は、n個の言語のうち何れか一つの言語を前記原本言語にし、m個の言語のうち何れか一つの言語を前記対象言語にする計n*m個の辞書データを含むことを特徴とする、請求項1に記載のオンライン辞書サービス提供装置。
【請求項6】
前記辞書データ格納部は、前記原本言語の単語を単語のインデックスとマッチングさせて格納する辞書データを含むことを特徴とする、請求項1に記載のオンライン辞書サービス提供装置。
【請求項7】
前記辞書選択部は、前記原本言語が前記ウェブページのエンコーディング言語情報に該当し、前記対象言語が前記ユーザ母国語情報に該当する辞書データを選択することを特徴とする、請求項1に記載のオンライン辞書サービス提供装置。
【請求項8】
前記クエリは、前記ユーザ端末にインストールされたクライアントが生成し、
前記クライアントは、
前記ユーザ端末にインストールされたオペレーティングシステム又はアプリケーションプログラムに基づいて前記ユーザ母国語情報を確認するユーザ母国語確認部と、
前記ユーザ端末にローディングされたウェブページのエンコーディング言語情報を確認するウェブページ言語確認部と、
前記ウェブページ上でポインティング装置を介してポインティングされた単語を抽出し、検索語情報を生成する検索語生成部と、
前記クエリを生成するクエリ生成部と、
前記解釈データを受信して前記ユーザ端末に表示する検索結果表示部と、を含むことを特徴とする、請求項1に記載のオンライン辞書サービス提供装置。
【請求項9】
ユーザ端末から、ユーザ母国語情報、ローディングされたウェブページのエンコーディング言語情報及び前記ウェブページに含まれた検索語情報を含むクエリを、受信し、
前記クエリから、前記ユーザ母国語情報、ウェブページのエンコーディング言語情報及び検索語情報を、抽出し、
原本言語の各単語に対する対象言語による各解釈データを含む少なくとも一つの辞書データから、前記ユーザ母国語情報及びウェブページエンコーディング言語情報に基づいて辞書データを、選択し、
前記選択された辞書データから、前記検索語情報に対応する前記解釈データを、検索し、
前記解釈データを前記ユーザ端末に伝送することを含むオンライン辞書サービス提供方法。
【請求項10】
前記ユーザ母国語情報は、前記ユーザ端末にインストールされたオペレーティイングシステム又はアプリケーションプログラムに基づいて確認されることを特徴とする、請求項9に記載のオンライン辞書サービス提供方法。
【請求項11】
前記ウェブページのエンコーディング言語情報は、前記ウェブページのプログラミング文書のヘッダに含まれたキャラクタセット(charset)に基づいて確認されることを特徴とする、請求項9に記載のオンライン辞書サービス提供方法。
【請求項12】
前記検索語情報は、前記辞書データに登録された各単語に対して付与された固有の単語のインデックス情報を含むことを特徴とする、請求項9に記載のオンライン辞書サービス提供方法。
【請求項13】
ユーザ端末からユーザの母国語情報を確認し、
前記ユーザ端末にローディングされたウェブページのエンコーディング言語情報を確認し、
前記ウェブページ上でポインティング装置を介してポインティングされた単語を抽出して検索語情報を生成し、
前記ユーザ母国語情報、前記ウェブページのエンコーディング言語情報及び前記検索語情報を含むクエリを生成し、
前記クエリに基づいた辞書サーバの検索結果を受信して前記ユーザ端末に表示することを含むオンライン辞書サービス提供方法。
【請求項14】
前記ユーザの母国語情報の確認として、
前記ユーザ端末にインストールされたオペレーティングシステム又はアプリケーションプログラムに基づいて前記ユーザ母国語情報を確認することを特徴とする、請求項13に記載のオンライン辞書サービス提供方法。
【請求項15】
前記ウェブページのエンコーディング言語情報を確認するのは、
前記ウェブページのプログラミング文書のヘッダに含まれたキャラクタセット(charset)に基づいて前記ウェブページのエンコーディング言語情報を確認することを特徴とする、請求項13に記載のオンライン辞書サービス提供方法。
【請求項16】
前記検索語情報を生成するのは、
前記ポインティング装置の指示子が前記ウェブページの単語の上に基準値以上の時間の間位置する場合、該当単語を認識し、
前記認識された単語から特殊文字を含むノイズ文字をトリミングし、
前記辞書サーバに登録された各単語に対して付与された固有の各インデックスから前記認識された単語又は前記トリミングされた単語に対するインデックスを検索し、
前記検索された単語のインデックスを前記検索語情報として設定することを含むことを特徴とする、請求項13に記載のオンライン辞書サービス提供方法。
【請求項17】
請求項9から請求項16のうち何れか一つの項に記載された段階を行うプログラムが記録されたコンピュータ読取可能な記録媒体。

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図1】
image rotate


【公開番号】特開2010−272114(P2010−272114A)
【公開日】平成22年12月2日(2010.12.2)
【国際特許分類】
【出願番号】特願2010−116530(P2010−116530)
【出願日】平成22年5月20日(2010.5.20)
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.GSM
【出願人】(505205812)エヌエイチエヌ コーポレーション (408)
【Fターム(参考)】