情報提供方法、情報提供装置、情報提供システム及びコンピュータプログラム
【課題】情報資源の所在を示す文字列が誤入力された場合であっても、正しい文字列を推定し、使用者所望の情報資源を提供することができる情報提供装置を提供する。
【解決手段】情報資源の所在を示す文字列を受信する受信手段と、該受信手段が受信した文字列に基づいて情報資源を検索する検索手段とを備え、該検索手段にて検索された情報資源を前記文字列の送信元に提供する情報提供装置1に、誤入力文字列及び正入力文字列を対応付けた誤入力文字列辞書を記憶する辞書サーバ2と、前記検索手段が情報資源の検索に失敗した場合、前記受信手段が受信した文字列及び辞書サーバ2が記憶している誤入力文字列辞書に基づいて、前記文字列の一部又は全部を変更した文字列を生成する生成手段とを備え、前記生成手段が生成した文字列に基づいて情報資源を再検索するように構成する。
【解決手段】情報資源の所在を示す文字列を受信する受信手段と、該受信手段が受信した文字列に基づいて情報資源を検索する検索手段とを備え、該検索手段にて検索された情報資源を前記文字列の送信元に提供する情報提供装置1に、誤入力文字列及び正入力文字列を対応付けた誤入力文字列辞書を記憶する辞書サーバ2と、前記検索手段が情報資源の検索に失敗した場合、前記受信手段が受信した文字列及び辞書サーバ2が記憶している誤入力文字列辞書に基づいて、前記文字列の一部又は全部を変更した文字列を生成する生成手段とを備え、前記生成手段が生成した文字列に基づいて情報資源を再検索するように構成する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、通信端末装置の求めに応じて情報資源を提供する情報提供方法、情報提供装置、情報提供システム及びコンピュータプログラムに関し、特に情報資源の所在を示す文字列が誤入力された場合であっても、情報資源の所在を正しく示した文字列候補の生成及び情報資源の再検索を行い、使用者所望の情報資源を提供することができる情報提供方法、該情報提供方法を実施する情報提供装置、該情報提供装置を備える情報提供システム及びコンピュータに情報提供方法を実施させるコンピュータプログラムに関する。
【背景技術】
【0002】
インターネット技術の普及によって、通信端末装置からインターネット上の各種情報資源、例えばハイパーテキスト文書、画像情報等にアクセスすることが可能になった。具体的には、インターネット上の情報資源は、通信網に接続された情報提供装置に格納されている。通信端末装置は、情報資源の所在を示すURL(Uniform Resource Locator)をブラウザにて受け付ける。URLは例えば「http://host.co.jp/bokujou/teto.htm」と表記され、インターネット上の情報提供装置を特定するドメイン名「host.co.jp」、情報提供装置における情報資源の所在を示すパス名「bokujou/teto.htm」等を含む。通信端末装置は、URLのドメイン名「host.co.jp」で示された情報提供装置にアクセスし、パス名「bokujou/teto.htm」で示される情報資源の提供を要求する。情報提供装置は、情報資源の所在を示す文字列「bokujou/teto.htm」に基づいて、情報資源を検索し、検索された情報資源を通信端末装置に送信する。通信端末装置は、情報提供装置から送信された情報資源を受信し、該情報資源に係る文書、画像等をブラウザにて出力する。
【0003】
一方、長く複雑なURLを使用者に意識させることなく、情報資源にアクセスすることを可能にした通信システムが提案されている(例えば、特許文献1,2)。特許文献1,2に係る通信システムは、使用者にとって分かり易い所定の文字列とURLとの対応関係を記憶したURL検索サーバを備えている。通信端末装置は、入力された文字列で目的の情報資源にアクセスできない場合、該文字列をURL検索サーバに送信する。URL検索サーバは前記文字列を、該文字列に対応するURLに変換し、変換したURLを通信端末装置に送信する。通信端末装置は変換されたURLを用いて特定の情報資源にアクセスする。
【0004】
特許文献1,2に係る通信システムにあっては、長く複雑なURLを使用者に意識させることなく、使用者所望の情報資源を提供することができる。
【特許文献1】特開2001−243143号公報
【特許文献2】特開2002−163177号公報
【発明の開示】
【発明が解決しようとする課題】
【0005】
しかしながら、従来の情報提供装置においては、URLを誤入力した場合、通信端末装置側のブラウザにエラーメッセージが表示されるのみで情報資源にアクセスすることができないという問題があった。この場合、使用者は文字列の誤入力箇所を確認し、正しい文字列を再入力する必要があった。
【0006】
また、特許文献1,2においては、情報資源へのアクセスが容易になったものの、情報の所在を示す文字列が誤入力された場合、ブラウザにエラーメッセージが表示されるのみで情報資源にアクセスすることができない点は同様である。
【0007】
本発明は斯かる事情に鑑みてなされたものであり、情報資源の検索に失敗した場合、誤入力された文字列と、使用者の誤入力傾向を記憶した誤入力文字列辞書とに基づいて、情報資源の所在を正しく示した文字列候補の生成及び情報資源の再検索を行うことにより、情報資源の所在を示す文字列が誤入力された場合であっても、使用者所望の情報資源を提供することができる情報提供方法、情報提供装置、情報提供システム及びコンピュータプログラムを提供することを目的とする。
【0008】
本発明の他の目的は、情報資源の検索に失敗した場合、情報資源の所在を正しく示した文字列の再送信を要求し、文字列の誤入力傾向を誤入力文字列辞書に登録させるように構成することにより、情報資源の所在を正しく示した文字列の生成精度を向上させ、使用者所望の情報資源をより的確に提供することができる情報提供装置及び情報提供システムを提供することにある。
【0009】
本発明の他の目的は、誤入力された文字列及び誤入力文字列辞書に基づいて生成された文字列を含むハイパーリンクを送信するように構成することにより、情報資源の所在を示す文字列が誤入力された場合であっても、使用者所望の情報資源をハイパーリンクにて提供することができ、また情報資源の所在を正しく示した文字列の再送信を要求する際、手間のかかる手入力で文字列の再送信を要求する場合に比べて使用者の誤入力傾向に係る情報を効果的に収集することができる情報提供装置及び情報提供システムを提供することにある。
【0010】
本発明の他の目的は、誤入力された回数に係る誤入力回数情報を誤入力文字列辞書に記憶させ、使用者所望の情報資源が複数検索された場合、誤入力回数情報に基づいて、一の情報資源を選択するように構成することにより、使用者所望の可能性が高い一の情報資源を選択して提供することができる情報提供装置及び情報提供システムを提供することにある。
【0011】
本発明の他の目的は、複数の拡張子夫々の文字列を記憶しておき、情報資源の検索に失敗した文字列に拡張子の文字列を付加し又は置換することにより、拡張子が誤入力された場合又は拡張子が入力されていない場合であっても、使用者所望の情報資源を提供することができる情報提供装置及び情報提供システムを提供することにある。
【0012】
本発明の他の目的は、非表音文字にて表記された文字列と、該文字列を表音文字にて表記した文字列とを対応付けた表音文字辞書を記憶しておき、情報資源の検索に失敗した場合、誤入力された文字列及び表音文字辞書に基づいて、情報資源の所在を正しく示した文字列候補の生成及び再検索を行うよう構成することにより、非表音文字で表記されるべき部分が表音文字で表記された文字列を受信した場合であっても、使用者所望の情報資源を提供することができる情報提供装置及び情報提供システムを提供することにある。
【課題を解決するための手段】
【0013】
第1発明に係る情報提供方法は、情報資源の所在を示す文字列を受信し、受信した文字列に基づいて情報資源を検索し、検索された情報資源を前記文字列の送信元に提供する情報提供方法において、受信した文字列の一部又は全部であって、情報資源の検索に失敗した誤入力文字列と、前記文字列の受信後に受信した文字列の一部又は全部であって、情報資源の検索に成功した正入力文字列とを対応付けた誤入力文字列辞書を作成し、情報資源の検索に失敗した場合、受信した文字列及び前記誤入力文字列辞書に基づいて、前記文字列の一部又は全部を変更した文字列を生成し、生成された文字列に基づいて情報資源を再検索することを特徴とする。
【0014】
第2発明に係る情報提供装置は、情報資源の所在を示す文字列を受信する受信手段と、該受信手段が受信した文字列に基づいて情報資源を検索する検索手段とを備え、該検索手段にて検索された情報資源を前記文字列の送信元に提供する情報提供装置において、前記受信手段が受信した文字列の一部又は全部であって、情報資源の検索に失敗した誤入力文字列と、前記文字列の受信後に前記受信手段が受信した文字列の一部又は全部であって、情報資源の検索に成功した正入力文字列とを対応付けた誤入力文字列辞書を記憶する記憶手段と、前記検索手段が情報資源の検索に失敗した場合、前記受信手段が受信した文字列及び前記記憶手段が記憶している誤入力文字列辞書に基づいて、前記文字列の一部又は全部を変更した文字列を生成する生成手段とを備え、前記検索手段は、前記生成手段が生成した文字列に基づいて情報資源を再検索するようにしてあることを特徴とする。
【0015】
第3発明に係る情報提供装置は、前記検索手段が情報資源の検索に失敗した場合、前記送信元に、情報資源の所在を示す文字列の再送信を要求する要求手段と、該要求手段の要求に対して前記送信元から送信された文字列を前記受信手段が受信し、受信した文字列に基づく情報資源の検索に成功した場合、前記文字列に係る誤入力文字列及び正入力文字列を対応付けて前記誤入力文字列辞書に登録する手段とを備えることを特徴とする。
【0016】
第4発明に係る情報提供装置は、前記生成手段が生成した文字列を含むハイパーリンクを前記送信元に送信する手段を備えることを特徴とする。
【0017】
第5発明に係る情報提供装置は、前記誤入力文字列辞書は、誤入力された回数に係る誤入力回数情報を前記正入力文字列及び誤入力文字列に対応付けて記憶しており、前記生成手段が複数の文字列を生成し、前記検索手段にて複数の情報資源が再検索された場合、前記文字列の生成に用いた正入力文字列及び誤入力文字列に対応する誤入力回数情報に基づいて一の情報資源を選択する選択手段と、該選択手段にて選択された情報資源を前記送信元に送信する手段とを備えることを特徴とする。
【0018】
第6発明に係る情報提供装置は、前記記憶手段は、情報資源のデータ形式を示す複数の拡張子夫々の文字列を記憶しており、前記生成手段は、前記検索手段が情報資源の検索に失敗した場合、前記受信手段が受信した文字列に前記記憶手段が記憶している拡張子の文字列を付加し又は前記受信手段が受信した文字列の一部を拡張子の文字列に置換する手段を備えることを特徴とする。
【0019】
第7発明に係る情報提供装置は、前記記憶手段は、非表音文字にて表記された文字列と、該文字列を表音文字にて表記した文字列とを対応付けた表音文字辞書を記憶しており、前記生成手段は、前記検索手段が情報資源の検索に失敗した場合、前記受信手段が受信した文字列及び前記記憶手段が記憶している表音文字辞書に基づいて、前記文字列の一部又は全部を変更した文字列を生成する手段を備えることを特徴とする。
【0020】
第8発明に係る情報提供システムは、通信網を介して接続された通信装置と、第2乃至第7発明に係る情報提供装置のいずれか一つとを備える情報提供システムにおいて、前記通信装置は、情報資源の所在を示す文字列を前記情報提供装置に送信する手段を備え、前記情報提供装置は、前記通信装置から送信された文字列を受信し、該文字列に係る情報資源を前記通信装置に提供するようにしてあることを特徴とする。
【0021】
第9発明に係るコンピュータプログラムは、情報資源の所在を示す文字列を受信し、情報資源を前記文字列の送信元に提供するコンピュータに、前記文字列に基づいて情報資源を検索させるコンピュータプログラムにおいて、コンピュータに、受信した文字列の一部又は全部であって、情報資源の検索に失敗した誤入力文字列と、前記文字列の受信後に受信した文字列の一部又は全部であって、情報資源の検索に成功した正入力文字列とを対応付けた誤入力文字列辞書を作成させ、コンピュータに、情報資源の検索に失敗した場合、受信した文字列及び前記誤入力文字列辞書に基づいて、前記文字列の一部又は全部を変更した文字列を生成させ、コンピュータに、生成された文字列に基づいて情報資源を再検索させることを特徴とする。
【0022】
第1、2、8及び第9発明にあっては、受信した文字列に基づく情報資源の検索に失敗した場合、受信した文字列と、誤入力文字列辞書とに基づいて、前記文字列の一部又は全部を変更した文字列、つまり情報資源の所在を正しく示した文字列を生成する。誤入力文字列辞書は、受信した文字列の一部又は全部であって、情報資源の検索に失敗した誤入力文字列と、前記文字列の受信後に受信した文字列の一部又は全部であって、情報資源の検索に成功した正入力文字列とを対応付けたものである。誤入力文字列辞書は、文字列の誤入力傾向を示しているため、誤入力された文字列から、情報資源の所在を正しく示した文字列を生成することが可能になる。そして、生成された文字列に基づいて情報資源を再検索し、情報資源が再検索された場合、該情報資源を送信元に送信する。
【0023】
従って、情報資源の所在を示す文字列が誤入力された場合であっても、情報資源の所在を正しく示した文字列を推定し、使用者所望の情報資源を提供することが可能になる。
【0024】
第3及び第8発明にあっては、要求手段は、受信した文字列に基づく情報資源の検索に失敗した場合、前記文字列の送信元に、情報資源の所在を示す文字列の再送信を要求する。そして、要求手段の要求に対して送信元から送信された文字列を受信手段が受信し、受信した文字列に基づく情報資源の検索に成功した場合、前記文字列に係る誤入力文字列及び正入力文字列を対応付けて誤入力文字列辞書に登録する。つまり、文字列が誤入力される度に該文字列に係る誤入力文字列及び正入力文字列に関する情報が誤入力文字列辞書に蓄積される。
【0025】
従って、情報資源の所在を正しく示した文字列の生成精度を向上させ、より的確に使用者所望の情報資源を提供することが可能になる。
【0026】
第4及び第8発明にあっては、生成手段が生成した文字列を含むハイパーリンクを前記送信元に送信する。
【0027】
従って、使用者所望の情報資源をハイパーリンクにて提供することができる。送信側においては、ブラウザを用いて前記ハイパーリンクを選択するのみで、所望の情報資源を取得することが可能である。特に、生成手段にて複数の文字列が生成された場合、効果的である。
【0028】
また、送信元においては、ブラウザを用いて前記ハイパーリンクを選択するのみで、使用者が意図した正しい文字列を情報提供装置に送信することができるため、手間がかかる手入力で文字列の再送信を要求する場合に比べて情報提供装置はより効果的に文字列の誤入力傾向に係る情報を収集し、誤入力文字列辞書に登録することが可能になる。
【0029】
第5及び第8発明にあっては、誤入力文字列辞書は、誤入力された回数に係る誤入力回数情報を前記正入力文字列及び誤入力文字列に対応付けて記憶している。使用者所望の情報資源が複数検索された場合、選択手段は、誤入力回数情報に基づいて、一の情報資源を選択する。例えば、誤入力の可能性が一番高い情報資源を選択する。
【0030】
従って、使用者所望の可能性が高い一の情報資源を選択して提供することが可能になる。
【0031】
第6及び第8発明にあっては、拡張子が入力されていない場合であっても、受信手段が受信した文字列に記憶手段が記憶している拡張子の文字列を付加することによって、生成手段は情報資源の所在を正しく示した文字列を生成することが可能になる。
【0032】
また、拡張子が誤入力された場合であっても、受信手段が受信した文字列の一部を前記記憶手段が記憶している拡張子の文字列に置換することによって、生成手段は情報資源の所在を正しく示した文字列を生成することが可能になる。
【0033】
第7及び第8発明にあっては、非表音文字にて表記されるべき文字列が表音文字にて表記されている場合であっても、生成手段は情報資源の所在を正しく示した文字列を生成することができる。
【0034】
従って、非表音文字で表記されるべき部分が表音文字で表記された文字列を受信した場合であっても、情報資源の所在を正しく示した文字列を推定し、使用者所望の情報資源を提供することが可能になる。つまり、送信元においては誤入力され易い非表音文字部分を表音文字にて表記された文字列を用いて、情報資源を要求することが可能になる。
【発明の効果】
【0035】
第1、2、8及び第9発明によれば、情報資源の所在を示す文字列が誤入力された場合であっても、情報資源の所在を正しく示した文字列を推定し、使用者所望の情報資源を提供することができる。
【0036】
第3及び第8発明によれば、情報資源の所在を正しく示した文字列の生成精度を向上させ、使用者所望の情報資源をより的確に提供することができる。
【0037】
第4及び第8発明によれば、使用者所望の情報資源をハイパーリンクにて提供することができる。
【0038】
また情報資源の所在を示す文字列の再送信を要求する際、手間がかかる手入力で文字列の再送信を要求する場合に比べて使用者の誤入力傾向に係る情報を効果的に収集することができる。
【0039】
第5及び第8発明によれば、使用者が所望している可能性が高い一の情報資源を選択して提供することができる。
【0040】
第6及び第8発明によれば、拡張子が入力されていない場合又は拡張子が誤入力された場合であっても、情報資源の所在を正しく示した文字列を推定し、使用者所望の情報資源を提供することができる。
【0041】
第7及び第8発明によれば、非表音文字で表記されるべき部分が表音文字で表記された文字列を受信した場合であっても、情報資源の所在を正しく示した文字列を推定し、使用者所望の情報資源を提供することができる。
【発明を実施するための最良の形態】
【0042】
以下、本発明をその実施の形態を示す図面に基づいて詳述する。
【0043】
図1は、本発明の実施の形態に係る情報提供システムの構成を示す模式図である。本発明の実施の形態に係る情報提供システムは、ウェブサーバ機能を有する情報提供装置1と、ウェブクライアント機能を有し、通信網Nを介して情報提供装置1に接続された通信端末装置3とを備えている。通信端末装置3は、使用者から受け付けたURLに基づいて情報資源の送信を情報提供装置1に要求し、情報提供装置1は、通信端末装置3の要求に応じて情報資源を通信端末装置3に送信する。本発明に係る情報提供装置1は、使用者がURLを誤入力した場合であっても、正しいURLを推定して使用者所望の情報資源を提供することを可能にするものである。
【0044】
図2は、情報提供装置1の構成を模式的に示すブロック図である。情報提供装置1は、装置全体を制御するCPU10を備えたコンピュータである。CPU10には、ROM11、RAM12、外部記憶装置13、内部記憶装置15、マウス、キーボード等の入力装置14、液晶ディスプレイ、CRT等の出力装置16、第1通信部17及び第2通信部18がバス19を介して接続されている。
【0045】
ROM11は、コンピュータの動作に必要な制御プログラムを記憶したマスクROM、EEPROM等の不揮発性メモリである。
【0046】
RAM12は、CPU10の演算処理を実行する際に生ずる各種データを一時記憶するDRAM、SRAM等の揮発性メモリである。
【0047】
外部記憶装置13は、本発明の実施の形態に係るコンピュータプログラム40をコンピュータ読み取り可能に記録したCD−ROM、DVD−ROM等の記録媒体4から情報を読み取る光ディスクドライブである。
【0048】
内部記憶装置15は、例えばハードディスクであり、外部記憶装置13が記録媒体4から読み取ったコンピュータプログラム40を記録する。また、内部記憶装置15は、ハイパーテキスト文書、画像情報、音声情報等の各種情報資源を格納している。
【0049】
第1通信部17は、通信端末装置3との間で情報資源、該情報資源の所在を示す文字列、その他各種情報を送受信するためのインタフェースである。
【0050】
第2通信部18には、辞書サーバ2が接続されている。第2通信部18は、辞書サーバ2との間で各種情報の送受信を行うインタフェースである。
【0051】
CPU10は、内部記憶装置15が記憶しているコンピュータプログラム40をRAM12に読み出して実行することにより、本発明に係る情報提供方法を実施し、ウェブサーバ機能を実現する。ウェブサーバ機能は、ハイパーテキスト転送プロトコルにて通信端末装置3から情報資源の送信要求を受け付け、情報資源を通信端末装置3に送信する機能を有する。
【0052】
辞書サーバ2は、誤入力文字列辞書2a、ローマ字表記辞書2b及び拡張子辞書2cを記憶した記憶手段を備えたコンピュータである。
【0053】
図3は、誤入力文字列辞書2aの一例を概念的に示す説明図である。誤入力文字列辞書2aの表(ファイル)は、複数の列(フィールド)、例えば「誤入力文字列ID」、「誤入力文字列」、「正入力文字列」及び「誤入力回数」から構成されており、各行(レコード)は、各列に格納された情報を有する。
【0054】
「誤入力文字列ID」列は、誤入力パターン毎に割り当てられた固有の数値である。「誤入力文字列」列は、過去に受信した文字列の一部であって、情報資源の検索に失敗した文字列、つまり誤入力された文字列を、誤入力文字列IDに対応付けて格納している。「正入力文字列」列は、誤入力された文字列に対応しており、前記文字列の受信後に受信した文字列の一部又は全部であって、情報資源の検索に成功した文字列、即ち正しく入力された文字列を格納している。「誤入力回数」列は、上述の文字列が誤入力された誤入力回数を格納している。
【0055】
図4は、ローマ字表記辞書2bの一例を概念的に示す説明図である。ローマ字表記辞書26の表は、複数の列、例えば「ローマ字表記ID」、「ローマ字表記文字列」、及び「英語表記文字列」から構成されており、各行は、各列に格納された情報を有する。
【0056】
「ローマ字表記ID」列は、ローマ字表記毎に割り当てられた固有の数値である。「ローマ字表記文字列」列は、日本人が誤り易い外来語をローマ字表記して得られる文字列を、ローマ字表記IDに対応付けて格納している。「英語表記文字列」列は、各ローマ字表記の文字に対応する英語表記の文字列を格納している。
【0057】
図5は、拡張子辞書2cの一例を概念的に示す説明図である。拡張子辞書2cの表は、複数の列、例えば「拡張子ID」及び「拡張子文字列」から構成されており、各行は、各列に格納された情報を有する。
【0058】
「拡張子ID」列は、拡張子毎に割り当てられた固有の数値である。「拡張子文字列」列は、拡張子IDに対応付けて複数の拡張子夫々の文字列を格納している。
【0059】
図6は、通信端末装置3の構成を模式的に示すブロック図である。通信端末装置3は、装置全体を制御するCPU30を備えたコンピュータである。CPU30には、ROM31、RAM32、外部記憶装置33、内部記憶装置35、マウス、キーボード等の入力装置34、液晶ディスプレイ、CRT等の出力装置36、情報提供装置1との間で各種情報の通信を行う通信部37がバス38を介して接続されている。
【0060】
ROM31及び内部記憶装置35は、CPU30の動作に必要なプログラムを記憶しており、CPU30は、ROM31及び内部記憶装置35が記憶しているプログラムをRAM32に読み出して実行することにより、ハイパーテキスト転送プロトコルにて情報資源の送信を情報提供装置1に要求し、情報提供装置1から送信された情報資源を受信し、受信した情報資源に係る画像情報、文字情報、音声情報等を出力するブラウザ機能を実現する。
【0061】
図7及び図8は、情報提供に係るCPU10の処理手順を示すフローチャートである。情報提供装置1のCPU10は、情報資源の所在を示す文字列を第1通信部17にて受信する(ステップS11)。
【0062】
具体的には、通信端末装置3側においてCPU30は、出力装置36にブラウザ画面5を表示し(図9参照)、該ブラウザ画面5から入力装置34にてURLを受け付ける。URLは、例えば「http://host.co.jp/bokujou/teto.htm」等と表記される。URLは、スキーム名「http」と、ホスト名「host.co.jp」と、パス名「bokujou/teto.htm」とを含み、情報資源の所在を示している。パス名は、情報提供装置1における情報資源の所在を示しており、フォルダ名及びファイル名を含む。なお、言うまでもなく、ファイル名のみでパス名が構成されることもある。
【0063】
図9は、ブラウザ画面5の一例を示す模式図である。ブラウザ画面5は、URLが入力されるURL入力部50と、情報資源に係るハイパーテキスト文書、画像等が表示される情報資源表示部51とを有する。CPU30は、URL入力部50にURLが入力された場合、例えばURL「http://host.co.jp/bokujo/te」が入力された場合、ホスト名「host.co.jp」に対応するIPアドレス、例えば情報提供装置1のIPアドレスを図示しないDNS(Domain Name System)に問い合わせる。そして、CPU30は、DNSから返答されたIPアドレスにて情報提供装置1との接続を確立する。次いで、CPU30は、情報提供装置1における情報資源の所在を示す文字列、つまりパス名「bokujo/te」、及び情報資源の送信を要求する情報を通信部37にて情報提供装置1に送信する。そして、情報提供装置1のCPU10は、第1通信部17にて前記文字列を受信する。
【0064】
ステップS11の処理を終えた場合、CPU10は、受信した文字列に基づいて、内部記憶装置15に格納された特定の情報資源を検索する(ステップS12)。そして、CPU10は、ステップS11で受信した文字列に基づく情報資源の検索に成功したか否かを判定する(ステップS13)。
【0065】
情報資源の検索に成功したと判定した場合(ステップS13:YES)、CPU10は、検索された情報資源を第1通信部17にて通信端末装置3に送信し(ステップS14)、情報提供に係る処理を終える。
【0066】
情報資源の検索に失敗したと判定した場合(ステップS13:NO)、CPU10は、情報資源の検索に失敗した文字列、つまり通信端末装置3側で誤入力された文字列をRAM12に記憶させる(ステップS15)。RAM12は、例えば文字列「bokujo/te」を一時記憶する。
【0067】
次いで、CPU10は、サブルーチンを呼び出して実行することにより、情報資源の所在を正しく示した文字列の候補(以下、正入力文字列候補という)を生成する(ステップS16)。
【0068】
図10は、正入力文字列候補の生成に係るサブルーチンの処理手順を示すフローチャートである。CPU10は、ステップS11で受信した文字列の文字種を統一する(ステップS31)。例えば、全角文字を半角文字に統一する。
【0069】
次いで、CPU10は、文字列からローマ字表記部分の文字列を抽出する(ステップS32)。そして、CPU10は、抽出したローマ字表記部分の文字列を辞書サーバ2に送信し、該文字列に対応する英語表記の文字列を取得し、ローマ字表記部分の文字列を英語表記の文字列に置換する(ステップS33)。例えば、文字列「biiru.html」を受信していた場合、ローマ字表記部分の文字列「biiru」は、「beer」に変更される。
【0070】
次いで、CPU10は、ステップS31〜33で処理された文字列からフォルダ名部分の文字列を抽出する(ステップS34)。そして、CPU10は、抽出したフォルダ名部分の文字列を辞書サーバ2に送信し、該文字列に係る正入力文字列及び誤入力回数を取得する(ステップS35)。つまり、抽出した文字列と同一又は該文字列を含む誤入力文字列に対応付けられた一又は複数の正入力文字列と、該誤入力文字列及び正入力文字列に対応付けられた誤入力回数とを取得する。例えば、文字列「bokujo/te」を受信していた場合、フォルダ名部分として「bokujo」が抽出される。そして、「bokujo」に係る正入力文字列「bokujou」及び誤入力回数55と、正入力文字列「bokujyou」及び誤入力回数10とを取得する。
【0071】
次いで、CPU10は、ステップS31〜33で処理された文字列からファイル名部分の文字列を抽出する(ステップS36)。そして、CPU10は、抽出したファイル名部分の文字列を辞書サーバ2に送信し、該ファイル名部分の文字列に係る正入力文字列及び誤入力回数を取得する(ステップS37)。つまり、抽出した文字列と同一又は該文字列を含む誤入力文字列に対応付けられた一又は複数の正入力文字列と、該誤入力文字列及び正入力文字列に対応付けられた誤入力文字列とを取得する。例えば、文字列「bokujo/te」を受信していた場合、ファイル名部分として「te」が抽出される。そして、「te」に対応する正入力文字列「tes」及び誤入力回数8と、正入力文字列「teto」及び誤入力回数66を取得する。
【0072】
次いで、CPU10は、文字列のフォルダ名及びファイル名部分を、ステップS35及びステップS37で取得した正入力文字列に置換した文字列を生成する(ステップS38)。例えば、文字列「bokujo/te」を受信していた場合、文字列「bokujou/tes」、「bokujou/teto」、「bokujyou/tes」、「bokujyou/teto」が生成される。
【0073】
そして、CPU10は、ステップS38で生成した各文字列から拡張子部分の文字列を抽出し(ステップS39)、文字列の拡張子部分を拡張子辞書2cに登録されている複数の拡張子夫々の文字列に置換し、又は拡張子部分が抽出されなかった場合、拡張子の文字列を付加し(ステップS40)、処理を終える。例えば、文字列「bokujo/te」を受信していた場合、各種拡張子の文字列が付加された文字列、例えば、「bokujou/tes.html」、「bokujou/tes.htm」、「bokujou/tes.shtml」、…「bokujyou/teto.php」、「bokujyou.pl」等が生成される。
【0074】
ステップS16の処理を終えた場合、CPU10は、ステップS16で生成された正入力文字列候補の文字列に基づいて情報資源を再検索する(ステップS17)。例えば、内部記憶装置15に、文字列「bokujou/teto.htm」で指定される情報資源と、文字列「bokujou/tes.html」で指定される情報資源とが格納されている場合、2つの前記情報資源が再検索される。
【0075】
そして、CPU10は、情報資源の再検索に成功したか否かを判定する(ステップS18)。
【0076】
情報資源の再検索に成功したと判定した場合(ステップS18:YES)、CPU10は、誤入力回数情報に基づいて一の情報資源、例えば誤入力確率が最大となる情報資源を選択する(ステップS19)。例えば、文字列「bokujou/teto.htm」の場合、「bokujou」の誤入力回数が55、「teto」の誤入力回数が66であるため、誤入力確率は55×66と評価することができる。同様に、文字列「bokujou/tes.html」の場合、「bokujou」の誤入力回数が55、「tes」の誤入力回数が8であるため、誤入力確率は55×8と評価することができる。従って、「bokujou/teto.htm」で指定される情報資源が誤入力確率可能性の高い一の情報資源として選択される。
【0077】
そして、CPU10は、ステップS17で情報資源の再検索に成功した文字列を含むハイパーリンク、ステップS19で選択された一の情報資源を表示し、情報資源の所在を示す文字列の再送信を要求するための情報資源を生成する(ステップS20)。ハイパーリンクは、生成された文字列「bokujou/teto.htm」の先頭に、スキーム名及び情報提供装置1のホスト名を示す文字列「http://host.co.jp」の文字列を付加したものである。該文字列「http://host.co.jp」は、情報提供装置1の内部記憶装置15が記憶している。
【0078】
情報資源の再検索に失敗したと判定した場合(ステップS18:NO)、CPU10は、トップページの情報資源、例えばパス名「index.html」で指定される情報資源を表示し、情報資源の所在を示す文字列の再送信を要求するための情報資源を生成する(ステップS21)。
【0079】
ステップS20又はステップS21の処理を終えた場合、CPU10は、ステップS20又はステップS21で生成された情報資源を第1通信部17にて通信端末装置3に送信する(ステップS22)。
【0080】
図11は、使用者が所望していると推定されるハイパーリンク及び一の情報資源を表示したブラウザ画面5の一例を示す模式図である。通信端末装置3のCPU30は、ステップS20で生成された情報資源を通信部37にて受信した場合、該情報資源に基づいて図11に示すようなブラウザ画面5を出力装置36に表示する。ブラウザ画面5の情報資源表示部51は、上フレーム51a及び下フレーム51bに区分けされ、上フレーム51aには、ハイパーリンクが表示され、下フレーム51bには使用者が所望していると推定される一の情報資源が表示される。また、上フレーム51aには、「このページは入力されたhttp://host.co.jp/bokujo/teというページが存在しないため、あなたが意図したと思われるページを自動検索し、表示しています。※このURLでは以下の候補ページが存在します。」の説明文が表示される。ハイパーリンクは、該説明文の下方に表示される。また、情報資源表示部51に表示されている情報資源のハイパーリンクの横方向一端側には、「(現在表示中)」の説明文が表示される。更に、ハイパーリンクの下方には、「これらのページが意図したページだった場合は、リンクをクリックしてページを参照してください。」の説明文が表示される。
【0081】
次いで、CPU10は、情報資源の所在を示す文字列の再送信要求に対して、通信端末装置3から送信された文字列を受信したか否かを判定する(ステップS23)。
【0082】
具体的には、通信端末装置3側において、CPU30は、入力装置34にて文字列の再入力を受け付ける。ブラウザ画面5に使用者が意図していた情報資源の所在を示すハイパーリンクが表示されている場合、使用者は該当するハイパーリンクを選択するのみで、情報資源の所在を示す文字列を情報提供装置1に再送信することができる。ブラウザ画面5に使用者が意図していた情報資源の所在を示すハイパーリンクが表示されていない場合、使用者はURL入力部50に情報資源の所在を示す文字列を入力することによって、情報資源の所在を示す文字列を情報提供装置1に再送信する。そして、情報提供装置1のCPU10は、第1通信部17にて前記文字列を受信する。
【0083】
再送信要求に対する文字列を受信していないと判定した場合(ステップS23:NO)、CPU10は、ステップS22で情報資源を送信してから所定時間が経過したか否かを判定する(ステップS25)。所定時間が経過していないと判定した場合(ステップS25:NO)、CPU10は処理をステップS23に戻す。所定時間が経過したと判定した場合(ステップS25:YES)、CPU10は情報提供に係る処理を終える。
【0084】
再送信要求に対する文字列を受信したと判定した場合(ステップS23:YES)、CPU10は、受信した文字列に基づいて情報資源を検索し(ステップS24)、情報資源の検索に成功したか否かを判定する(ステップS26)。
【0085】
情報資源の検索に失敗したと判定した場合(ステップS26:NO)、CPU10は処理をステップS15に戻す。情報資源の検索に成功したと判定した場合(ステップS26:YES)、CPU10は、ステップS24で検索された情報資源を第1通信部17にて通信端末装置3に送信する(ステップS27)。
【0086】
図12及び図13は、情報資源を表示したブラウザ画面5の一例を示す模式図である。例えば、通信端末装置3側でURL「http://host.co.jp/bokujou/teto.htm」のハイパーリンクが選択された場合、図12に示すように「bokujou/teto.htm」の文字列で検索された情報資源が情報資源表示部51に表示される。より詳細には、情報提供装置1は、通信端末装置3から送信された文字列「bokujou/teto.htm」を受信し、該文字列に基づいて情報資源を検索し、検索された情報資源を通信端末装置3に送信する。通信端末装置3は、情報提供装置1から送信された前記情報資源を受信し、受信した情報資源に基づいて該情報資源を情報資源表示部51に表示させる。
【0087】
同様に、URL「http://host.co.jp/bokujou/tes.html」のハイパーリンクが選択された場合、図12に示すように「bokujou/tes.html」の文字列で検索された情報資源が情報資源表示部51に表示される。
【0088】
次いで、CPU10は、サブルーチンを呼び出して誤入力文字列辞書2aの登録を行い(ステップS28)、情報提供に係る処理を終える。
【0089】
図14は、誤入力文字列及び正入力文字列の登録に係るCPU10の処理手順を示すフローチャートである。CPU10は、情報資源の検索に成功した文字列のフォルダ名部分及びファイル名部分の文字列を抽出する(ステップS51)。例えば、文字列「bokujou/teto.htm」を受信した場合、フォルダ名「bokujou」と、ファイル名「teto」とを抽出する。
【0090】
次いで、CPU10は、誤入力文字列及び正入力文字列を特定する(ステップS52)。例えば、情報資源の検索に失敗した文字列「bokujo/te」のフォルダ名部分「bokujo」と、情報資源の検索に成功した文字列のフォルダ名部分「bokujou」とを比較し、両者が異なっている場合、誤入力文字列として「bokujo」を特定し、正入力文字列として「bokujou」を特定する。同様に、情報資源の検索に失敗した文字列「bokujo/te」のファイル名部分「te」と、情報資源の検索に成功した文字列のファイル名部分「teto」とを比較し、誤入力文字列として「te」を特定し、正入力文字列として「teto」を特定する。
【0091】
次いで、CPU10は、ステップS52で特定した誤入力文字列及び正入力文字列を辞書サーバ2に送信し、同一の誤入力文字列及び正入力文字列があるか否かを判定させる(ステップS53)。同一の誤入力文字列及び正入力文字列があると判定した場合(ステップS53:YES)、該当する誤入力回数を増加させ(ステップS54)、処理を終える。例えば、誤入力文字列「te」及び正入力文字列「teto」を辞書サーバ2に送信した場合、該当する誤入力回数「66」を「67」に増加させる。
【0092】
同一の誤入力文字列がないと判定した場合(ステップS53:NO)、CPU10は、誤入力文字列及び正入力文字列を誤入力文字列辞書2aに新規登録し(ステップS55)、処理を終える。
【0093】
このように構成された実施の形態に係る情報資源提供システム、情報提供装置1、情報提供方法及びコンピュータプログラムにあっては、通信端末装置3側で情報資源の所在を示す文字列が誤入力された場合であっても、使用者所望の情報資源にアクセスすることが可能な正しい文字列を推定し、使用者所望の情報資源を通信端末装置3に提供することができる。
【0094】
また、情報資源の所在を示す文字列が誤入力された場合、誤入力文字列及び正入力文字列を特定して誤入力文字列辞書2aに登録するように構成されているため、使用者の誤入力傾向を学習し、情報資源の所在を正しく示した文字列の生成精度を向上させ、使用者所望の情報資源をより的確に提供することができる。
【0095】
更に、使用者所望の情報資源にアクセスすることが可能な正しい文字列を推定し、該文字列を含むハイパーリンクを提供することができる。使用者は、ハイパーリンクを選択するのみで所望の情報資源を得ることができる。
【0096】
また、情報資源の所在を正しく示した文字列の再送信を要求する際、手間がかかる手入力で文字列の再送信を要求する場合に比べて使用者の誤入力傾向に係る情報を効果的に収集し、誤入力文字列辞書2aを学習させることができる。
【0097】
更にまた、誤入力確率が最も高い文字列に基づいて選択された一の情報資源を提供するように構成されているため、使用者が所望している可能性が高い一の情報資源を選択して提供することができる。
【0098】
更にまた、拡張子が入力されていない場合又は拡張子が誤入力された場合であっても、情報資源の所在を正しく示した文字列を推定し、使用者所望の情報資源を提供することができる。
【0099】
更にまた、非表音文字で表記されるべき部分が表音文字で表記された文字列を受信した場合であっても、情報資源の所在を正しく示した文字列を推定し、使用者所望の情報資源を提供することができる。
【0100】
なお、実施の形態にあっては、情報資源としてハイパーテキスト文書、画像情報等を説明したが、情報資源の内容はこれに限定されず、文字列に基づいて検索が可能な各種情報が含まれる。例えば、情報資源は通信網に接続された通信装置のIPアドレスであっても良く、本発明に係る情報提供方法をDNSに適用しても良い。情報提供方法を実施するDNSによれば、ドメイン名が誤入力された場合、例えば「hos.co.jp」と誤入力された場合であっても、正しい文字列「host.co.jp」を推定し、該文字列「host.co.jp」に基づいて情報資源としてのIPアドレスを検索し、検索されたIPアドレスをIPアドレス要求元の通信端末装置に送信することができる。
【0101】
また、情報提供装置のCPUが本発明に係る情報提供方法を実施しているが、言うまでもなく情報提供方法に係る処理を複数のコンピュータを用いて分散処理させても良い。例えば、情報提供装置のCPUが実行している処理の一部を辞書サーバに実行させるように構成しても良い。
【0102】
更に、誤入力文字列辞書、ローマ字表記辞書及び拡張子辞書を格納した辞書サーバを一例として説明したが、日本語辞書のような他の辞書と連携させても良い。
【0103】
更にまた、今回開示された実施の形態はすべての点で例示であって、制限的なものではない。本発明の範囲は、特許請求の範囲によって示され、特許請求の範囲と均等の意味及び範囲内でのすべての変更が含まれる。
【図面の簡単な説明】
【0104】
【図1】本発明の実施の形態に係る情報提供システムの構成を示す模式図である。
【図2】情報提供装置の構成を模式的に示すブロック図である。
【図3】誤入力文字列辞書の一例を概念的に示す説明図である。
【図4】ローマ字表記辞書の一例を概念的に示す説明図である。
【図5】拡張子辞書の一例を概念的に示す説明図である。
【図6】通信端末装置の構成を模式的に示すブロック図である。
【図7】情報提供に係るCPUの処理手順を示すフローチャートである。
【図8】情報提供に係るCPUの処理手順を示すフローチャートである。
【図9】ブラウザ画面の一例を示す模式図である。
【図10】正入力文字列候補の生成に係るサブルーチンの処理手順を示すフローチャートである。
【図11】使用者が所望していると推定されるハイパーリンク及び一の情報資源を表示したブラウザ画面の一例を示す模式図である。
【図12】情報資源を表示したブラウザ画面の一例を示す模式図である。
【図13】情報資源を表示したブラウザ画面の一例を示す模式図である。
【図14】誤入力文字列及び正入力文字列の登録に係るCPUの処理手順を示すフローチャートである。
【符号の説明】
【0105】
1 情報提供装置
2 辞書サーバ
2a 誤入力文字列辞書
2b ローマ字表記辞書
2c 拡張子辞書
3 通信端末装置
4 記録媒体
5 ブラウザ画面
10 CPU
30 CPU
50 URL入力部
51 情報資源表示部
N 通信網
【技術分野】
【0001】
本発明は、通信端末装置の求めに応じて情報資源を提供する情報提供方法、情報提供装置、情報提供システム及びコンピュータプログラムに関し、特に情報資源の所在を示す文字列が誤入力された場合であっても、情報資源の所在を正しく示した文字列候補の生成及び情報資源の再検索を行い、使用者所望の情報資源を提供することができる情報提供方法、該情報提供方法を実施する情報提供装置、該情報提供装置を備える情報提供システム及びコンピュータに情報提供方法を実施させるコンピュータプログラムに関する。
【背景技術】
【0002】
インターネット技術の普及によって、通信端末装置からインターネット上の各種情報資源、例えばハイパーテキスト文書、画像情報等にアクセスすることが可能になった。具体的には、インターネット上の情報資源は、通信網に接続された情報提供装置に格納されている。通信端末装置は、情報資源の所在を示すURL(Uniform Resource Locator)をブラウザにて受け付ける。URLは例えば「http://host.co.jp/bokujou/teto.htm」と表記され、インターネット上の情報提供装置を特定するドメイン名「host.co.jp」、情報提供装置における情報資源の所在を示すパス名「bokujou/teto.htm」等を含む。通信端末装置は、URLのドメイン名「host.co.jp」で示された情報提供装置にアクセスし、パス名「bokujou/teto.htm」で示される情報資源の提供を要求する。情報提供装置は、情報資源の所在を示す文字列「bokujou/teto.htm」に基づいて、情報資源を検索し、検索された情報資源を通信端末装置に送信する。通信端末装置は、情報提供装置から送信された情報資源を受信し、該情報資源に係る文書、画像等をブラウザにて出力する。
【0003】
一方、長く複雑なURLを使用者に意識させることなく、情報資源にアクセスすることを可能にした通信システムが提案されている(例えば、特許文献1,2)。特許文献1,2に係る通信システムは、使用者にとって分かり易い所定の文字列とURLとの対応関係を記憶したURL検索サーバを備えている。通信端末装置は、入力された文字列で目的の情報資源にアクセスできない場合、該文字列をURL検索サーバに送信する。URL検索サーバは前記文字列を、該文字列に対応するURLに変換し、変換したURLを通信端末装置に送信する。通信端末装置は変換されたURLを用いて特定の情報資源にアクセスする。
【0004】
特許文献1,2に係る通信システムにあっては、長く複雑なURLを使用者に意識させることなく、使用者所望の情報資源を提供することができる。
【特許文献1】特開2001−243143号公報
【特許文献2】特開2002−163177号公報
【発明の開示】
【発明が解決しようとする課題】
【0005】
しかしながら、従来の情報提供装置においては、URLを誤入力した場合、通信端末装置側のブラウザにエラーメッセージが表示されるのみで情報資源にアクセスすることができないという問題があった。この場合、使用者は文字列の誤入力箇所を確認し、正しい文字列を再入力する必要があった。
【0006】
また、特許文献1,2においては、情報資源へのアクセスが容易になったものの、情報の所在を示す文字列が誤入力された場合、ブラウザにエラーメッセージが表示されるのみで情報資源にアクセスすることができない点は同様である。
【0007】
本発明は斯かる事情に鑑みてなされたものであり、情報資源の検索に失敗した場合、誤入力された文字列と、使用者の誤入力傾向を記憶した誤入力文字列辞書とに基づいて、情報資源の所在を正しく示した文字列候補の生成及び情報資源の再検索を行うことにより、情報資源の所在を示す文字列が誤入力された場合であっても、使用者所望の情報資源を提供することができる情報提供方法、情報提供装置、情報提供システム及びコンピュータプログラムを提供することを目的とする。
【0008】
本発明の他の目的は、情報資源の検索に失敗した場合、情報資源の所在を正しく示した文字列の再送信を要求し、文字列の誤入力傾向を誤入力文字列辞書に登録させるように構成することにより、情報資源の所在を正しく示した文字列の生成精度を向上させ、使用者所望の情報資源をより的確に提供することができる情報提供装置及び情報提供システムを提供することにある。
【0009】
本発明の他の目的は、誤入力された文字列及び誤入力文字列辞書に基づいて生成された文字列を含むハイパーリンクを送信するように構成することにより、情報資源の所在を示す文字列が誤入力された場合であっても、使用者所望の情報資源をハイパーリンクにて提供することができ、また情報資源の所在を正しく示した文字列の再送信を要求する際、手間のかかる手入力で文字列の再送信を要求する場合に比べて使用者の誤入力傾向に係る情報を効果的に収集することができる情報提供装置及び情報提供システムを提供することにある。
【0010】
本発明の他の目的は、誤入力された回数に係る誤入力回数情報を誤入力文字列辞書に記憶させ、使用者所望の情報資源が複数検索された場合、誤入力回数情報に基づいて、一の情報資源を選択するように構成することにより、使用者所望の可能性が高い一の情報資源を選択して提供することができる情報提供装置及び情報提供システムを提供することにある。
【0011】
本発明の他の目的は、複数の拡張子夫々の文字列を記憶しておき、情報資源の検索に失敗した文字列に拡張子の文字列を付加し又は置換することにより、拡張子が誤入力された場合又は拡張子が入力されていない場合であっても、使用者所望の情報資源を提供することができる情報提供装置及び情報提供システムを提供することにある。
【0012】
本発明の他の目的は、非表音文字にて表記された文字列と、該文字列を表音文字にて表記した文字列とを対応付けた表音文字辞書を記憶しておき、情報資源の検索に失敗した場合、誤入力された文字列及び表音文字辞書に基づいて、情報資源の所在を正しく示した文字列候補の生成及び再検索を行うよう構成することにより、非表音文字で表記されるべき部分が表音文字で表記された文字列を受信した場合であっても、使用者所望の情報資源を提供することができる情報提供装置及び情報提供システムを提供することにある。
【課題を解決するための手段】
【0013】
第1発明に係る情報提供方法は、情報資源の所在を示す文字列を受信し、受信した文字列に基づいて情報資源を検索し、検索された情報資源を前記文字列の送信元に提供する情報提供方法において、受信した文字列の一部又は全部であって、情報資源の検索に失敗した誤入力文字列と、前記文字列の受信後に受信した文字列の一部又は全部であって、情報資源の検索に成功した正入力文字列とを対応付けた誤入力文字列辞書を作成し、情報資源の検索に失敗した場合、受信した文字列及び前記誤入力文字列辞書に基づいて、前記文字列の一部又は全部を変更した文字列を生成し、生成された文字列に基づいて情報資源を再検索することを特徴とする。
【0014】
第2発明に係る情報提供装置は、情報資源の所在を示す文字列を受信する受信手段と、該受信手段が受信した文字列に基づいて情報資源を検索する検索手段とを備え、該検索手段にて検索された情報資源を前記文字列の送信元に提供する情報提供装置において、前記受信手段が受信した文字列の一部又は全部であって、情報資源の検索に失敗した誤入力文字列と、前記文字列の受信後に前記受信手段が受信した文字列の一部又は全部であって、情報資源の検索に成功した正入力文字列とを対応付けた誤入力文字列辞書を記憶する記憶手段と、前記検索手段が情報資源の検索に失敗した場合、前記受信手段が受信した文字列及び前記記憶手段が記憶している誤入力文字列辞書に基づいて、前記文字列の一部又は全部を変更した文字列を生成する生成手段とを備え、前記検索手段は、前記生成手段が生成した文字列に基づいて情報資源を再検索するようにしてあることを特徴とする。
【0015】
第3発明に係る情報提供装置は、前記検索手段が情報資源の検索に失敗した場合、前記送信元に、情報資源の所在を示す文字列の再送信を要求する要求手段と、該要求手段の要求に対して前記送信元から送信された文字列を前記受信手段が受信し、受信した文字列に基づく情報資源の検索に成功した場合、前記文字列に係る誤入力文字列及び正入力文字列を対応付けて前記誤入力文字列辞書に登録する手段とを備えることを特徴とする。
【0016】
第4発明に係る情報提供装置は、前記生成手段が生成した文字列を含むハイパーリンクを前記送信元に送信する手段を備えることを特徴とする。
【0017】
第5発明に係る情報提供装置は、前記誤入力文字列辞書は、誤入力された回数に係る誤入力回数情報を前記正入力文字列及び誤入力文字列に対応付けて記憶しており、前記生成手段が複数の文字列を生成し、前記検索手段にて複数の情報資源が再検索された場合、前記文字列の生成に用いた正入力文字列及び誤入力文字列に対応する誤入力回数情報に基づいて一の情報資源を選択する選択手段と、該選択手段にて選択された情報資源を前記送信元に送信する手段とを備えることを特徴とする。
【0018】
第6発明に係る情報提供装置は、前記記憶手段は、情報資源のデータ形式を示す複数の拡張子夫々の文字列を記憶しており、前記生成手段は、前記検索手段が情報資源の検索に失敗した場合、前記受信手段が受信した文字列に前記記憶手段が記憶している拡張子の文字列を付加し又は前記受信手段が受信した文字列の一部を拡張子の文字列に置換する手段を備えることを特徴とする。
【0019】
第7発明に係る情報提供装置は、前記記憶手段は、非表音文字にて表記された文字列と、該文字列を表音文字にて表記した文字列とを対応付けた表音文字辞書を記憶しており、前記生成手段は、前記検索手段が情報資源の検索に失敗した場合、前記受信手段が受信した文字列及び前記記憶手段が記憶している表音文字辞書に基づいて、前記文字列の一部又は全部を変更した文字列を生成する手段を備えることを特徴とする。
【0020】
第8発明に係る情報提供システムは、通信網を介して接続された通信装置と、第2乃至第7発明に係る情報提供装置のいずれか一つとを備える情報提供システムにおいて、前記通信装置は、情報資源の所在を示す文字列を前記情報提供装置に送信する手段を備え、前記情報提供装置は、前記通信装置から送信された文字列を受信し、該文字列に係る情報資源を前記通信装置に提供するようにしてあることを特徴とする。
【0021】
第9発明に係るコンピュータプログラムは、情報資源の所在を示す文字列を受信し、情報資源を前記文字列の送信元に提供するコンピュータに、前記文字列に基づいて情報資源を検索させるコンピュータプログラムにおいて、コンピュータに、受信した文字列の一部又は全部であって、情報資源の検索に失敗した誤入力文字列と、前記文字列の受信後に受信した文字列の一部又は全部であって、情報資源の検索に成功した正入力文字列とを対応付けた誤入力文字列辞書を作成させ、コンピュータに、情報資源の検索に失敗した場合、受信した文字列及び前記誤入力文字列辞書に基づいて、前記文字列の一部又は全部を変更した文字列を生成させ、コンピュータに、生成された文字列に基づいて情報資源を再検索させることを特徴とする。
【0022】
第1、2、8及び第9発明にあっては、受信した文字列に基づく情報資源の検索に失敗した場合、受信した文字列と、誤入力文字列辞書とに基づいて、前記文字列の一部又は全部を変更した文字列、つまり情報資源の所在を正しく示した文字列を生成する。誤入力文字列辞書は、受信した文字列の一部又は全部であって、情報資源の検索に失敗した誤入力文字列と、前記文字列の受信後に受信した文字列の一部又は全部であって、情報資源の検索に成功した正入力文字列とを対応付けたものである。誤入力文字列辞書は、文字列の誤入力傾向を示しているため、誤入力された文字列から、情報資源の所在を正しく示した文字列を生成することが可能になる。そして、生成された文字列に基づいて情報資源を再検索し、情報資源が再検索された場合、該情報資源を送信元に送信する。
【0023】
従って、情報資源の所在を示す文字列が誤入力された場合であっても、情報資源の所在を正しく示した文字列を推定し、使用者所望の情報資源を提供することが可能になる。
【0024】
第3及び第8発明にあっては、要求手段は、受信した文字列に基づく情報資源の検索に失敗した場合、前記文字列の送信元に、情報資源の所在を示す文字列の再送信を要求する。そして、要求手段の要求に対して送信元から送信された文字列を受信手段が受信し、受信した文字列に基づく情報資源の検索に成功した場合、前記文字列に係る誤入力文字列及び正入力文字列を対応付けて誤入力文字列辞書に登録する。つまり、文字列が誤入力される度に該文字列に係る誤入力文字列及び正入力文字列に関する情報が誤入力文字列辞書に蓄積される。
【0025】
従って、情報資源の所在を正しく示した文字列の生成精度を向上させ、より的確に使用者所望の情報資源を提供することが可能になる。
【0026】
第4及び第8発明にあっては、生成手段が生成した文字列を含むハイパーリンクを前記送信元に送信する。
【0027】
従って、使用者所望の情報資源をハイパーリンクにて提供することができる。送信側においては、ブラウザを用いて前記ハイパーリンクを選択するのみで、所望の情報資源を取得することが可能である。特に、生成手段にて複数の文字列が生成された場合、効果的である。
【0028】
また、送信元においては、ブラウザを用いて前記ハイパーリンクを選択するのみで、使用者が意図した正しい文字列を情報提供装置に送信することができるため、手間がかかる手入力で文字列の再送信を要求する場合に比べて情報提供装置はより効果的に文字列の誤入力傾向に係る情報を収集し、誤入力文字列辞書に登録することが可能になる。
【0029】
第5及び第8発明にあっては、誤入力文字列辞書は、誤入力された回数に係る誤入力回数情報を前記正入力文字列及び誤入力文字列に対応付けて記憶している。使用者所望の情報資源が複数検索された場合、選択手段は、誤入力回数情報に基づいて、一の情報資源を選択する。例えば、誤入力の可能性が一番高い情報資源を選択する。
【0030】
従って、使用者所望の可能性が高い一の情報資源を選択して提供することが可能になる。
【0031】
第6及び第8発明にあっては、拡張子が入力されていない場合であっても、受信手段が受信した文字列に記憶手段が記憶している拡張子の文字列を付加することによって、生成手段は情報資源の所在を正しく示した文字列を生成することが可能になる。
【0032】
また、拡張子が誤入力された場合であっても、受信手段が受信した文字列の一部を前記記憶手段が記憶している拡張子の文字列に置換することによって、生成手段は情報資源の所在を正しく示した文字列を生成することが可能になる。
【0033】
第7及び第8発明にあっては、非表音文字にて表記されるべき文字列が表音文字にて表記されている場合であっても、生成手段は情報資源の所在を正しく示した文字列を生成することができる。
【0034】
従って、非表音文字で表記されるべき部分が表音文字で表記された文字列を受信した場合であっても、情報資源の所在を正しく示した文字列を推定し、使用者所望の情報資源を提供することが可能になる。つまり、送信元においては誤入力され易い非表音文字部分を表音文字にて表記された文字列を用いて、情報資源を要求することが可能になる。
【発明の効果】
【0035】
第1、2、8及び第9発明によれば、情報資源の所在を示す文字列が誤入力された場合であっても、情報資源の所在を正しく示した文字列を推定し、使用者所望の情報資源を提供することができる。
【0036】
第3及び第8発明によれば、情報資源の所在を正しく示した文字列の生成精度を向上させ、使用者所望の情報資源をより的確に提供することができる。
【0037】
第4及び第8発明によれば、使用者所望の情報資源をハイパーリンクにて提供することができる。
【0038】
また情報資源の所在を示す文字列の再送信を要求する際、手間がかかる手入力で文字列の再送信を要求する場合に比べて使用者の誤入力傾向に係る情報を効果的に収集することができる。
【0039】
第5及び第8発明によれば、使用者が所望している可能性が高い一の情報資源を選択して提供することができる。
【0040】
第6及び第8発明によれば、拡張子が入力されていない場合又は拡張子が誤入力された場合であっても、情報資源の所在を正しく示した文字列を推定し、使用者所望の情報資源を提供することができる。
【0041】
第7及び第8発明によれば、非表音文字で表記されるべき部分が表音文字で表記された文字列を受信した場合であっても、情報資源の所在を正しく示した文字列を推定し、使用者所望の情報資源を提供することができる。
【発明を実施するための最良の形態】
【0042】
以下、本発明をその実施の形態を示す図面に基づいて詳述する。
【0043】
図1は、本発明の実施の形態に係る情報提供システムの構成を示す模式図である。本発明の実施の形態に係る情報提供システムは、ウェブサーバ機能を有する情報提供装置1と、ウェブクライアント機能を有し、通信網Nを介して情報提供装置1に接続された通信端末装置3とを備えている。通信端末装置3は、使用者から受け付けたURLに基づいて情報資源の送信を情報提供装置1に要求し、情報提供装置1は、通信端末装置3の要求に応じて情報資源を通信端末装置3に送信する。本発明に係る情報提供装置1は、使用者がURLを誤入力した場合であっても、正しいURLを推定して使用者所望の情報資源を提供することを可能にするものである。
【0044】
図2は、情報提供装置1の構成を模式的に示すブロック図である。情報提供装置1は、装置全体を制御するCPU10を備えたコンピュータである。CPU10には、ROM11、RAM12、外部記憶装置13、内部記憶装置15、マウス、キーボード等の入力装置14、液晶ディスプレイ、CRT等の出力装置16、第1通信部17及び第2通信部18がバス19を介して接続されている。
【0045】
ROM11は、コンピュータの動作に必要な制御プログラムを記憶したマスクROM、EEPROM等の不揮発性メモリである。
【0046】
RAM12は、CPU10の演算処理を実行する際に生ずる各種データを一時記憶するDRAM、SRAM等の揮発性メモリである。
【0047】
外部記憶装置13は、本発明の実施の形態に係るコンピュータプログラム40をコンピュータ読み取り可能に記録したCD−ROM、DVD−ROM等の記録媒体4から情報を読み取る光ディスクドライブである。
【0048】
内部記憶装置15は、例えばハードディスクであり、外部記憶装置13が記録媒体4から読み取ったコンピュータプログラム40を記録する。また、内部記憶装置15は、ハイパーテキスト文書、画像情報、音声情報等の各種情報資源を格納している。
【0049】
第1通信部17は、通信端末装置3との間で情報資源、該情報資源の所在を示す文字列、その他各種情報を送受信するためのインタフェースである。
【0050】
第2通信部18には、辞書サーバ2が接続されている。第2通信部18は、辞書サーバ2との間で各種情報の送受信を行うインタフェースである。
【0051】
CPU10は、内部記憶装置15が記憶しているコンピュータプログラム40をRAM12に読み出して実行することにより、本発明に係る情報提供方法を実施し、ウェブサーバ機能を実現する。ウェブサーバ機能は、ハイパーテキスト転送プロトコルにて通信端末装置3から情報資源の送信要求を受け付け、情報資源を通信端末装置3に送信する機能を有する。
【0052】
辞書サーバ2は、誤入力文字列辞書2a、ローマ字表記辞書2b及び拡張子辞書2cを記憶した記憶手段を備えたコンピュータである。
【0053】
図3は、誤入力文字列辞書2aの一例を概念的に示す説明図である。誤入力文字列辞書2aの表(ファイル)は、複数の列(フィールド)、例えば「誤入力文字列ID」、「誤入力文字列」、「正入力文字列」及び「誤入力回数」から構成されており、各行(レコード)は、各列に格納された情報を有する。
【0054】
「誤入力文字列ID」列は、誤入力パターン毎に割り当てられた固有の数値である。「誤入力文字列」列は、過去に受信した文字列の一部であって、情報資源の検索に失敗した文字列、つまり誤入力された文字列を、誤入力文字列IDに対応付けて格納している。「正入力文字列」列は、誤入力された文字列に対応しており、前記文字列の受信後に受信した文字列の一部又は全部であって、情報資源の検索に成功した文字列、即ち正しく入力された文字列を格納している。「誤入力回数」列は、上述の文字列が誤入力された誤入力回数を格納している。
【0055】
図4は、ローマ字表記辞書2bの一例を概念的に示す説明図である。ローマ字表記辞書26の表は、複数の列、例えば「ローマ字表記ID」、「ローマ字表記文字列」、及び「英語表記文字列」から構成されており、各行は、各列に格納された情報を有する。
【0056】
「ローマ字表記ID」列は、ローマ字表記毎に割り当てられた固有の数値である。「ローマ字表記文字列」列は、日本人が誤り易い外来語をローマ字表記して得られる文字列を、ローマ字表記IDに対応付けて格納している。「英語表記文字列」列は、各ローマ字表記の文字に対応する英語表記の文字列を格納している。
【0057】
図5は、拡張子辞書2cの一例を概念的に示す説明図である。拡張子辞書2cの表は、複数の列、例えば「拡張子ID」及び「拡張子文字列」から構成されており、各行は、各列に格納された情報を有する。
【0058】
「拡張子ID」列は、拡張子毎に割り当てられた固有の数値である。「拡張子文字列」列は、拡張子IDに対応付けて複数の拡張子夫々の文字列を格納している。
【0059】
図6は、通信端末装置3の構成を模式的に示すブロック図である。通信端末装置3は、装置全体を制御するCPU30を備えたコンピュータである。CPU30には、ROM31、RAM32、外部記憶装置33、内部記憶装置35、マウス、キーボード等の入力装置34、液晶ディスプレイ、CRT等の出力装置36、情報提供装置1との間で各種情報の通信を行う通信部37がバス38を介して接続されている。
【0060】
ROM31及び内部記憶装置35は、CPU30の動作に必要なプログラムを記憶しており、CPU30は、ROM31及び内部記憶装置35が記憶しているプログラムをRAM32に読み出して実行することにより、ハイパーテキスト転送プロトコルにて情報資源の送信を情報提供装置1に要求し、情報提供装置1から送信された情報資源を受信し、受信した情報資源に係る画像情報、文字情報、音声情報等を出力するブラウザ機能を実現する。
【0061】
図7及び図8は、情報提供に係るCPU10の処理手順を示すフローチャートである。情報提供装置1のCPU10は、情報資源の所在を示す文字列を第1通信部17にて受信する(ステップS11)。
【0062】
具体的には、通信端末装置3側においてCPU30は、出力装置36にブラウザ画面5を表示し(図9参照)、該ブラウザ画面5から入力装置34にてURLを受け付ける。URLは、例えば「http://host.co.jp/bokujou/teto.htm」等と表記される。URLは、スキーム名「http」と、ホスト名「host.co.jp」と、パス名「bokujou/teto.htm」とを含み、情報資源の所在を示している。パス名は、情報提供装置1における情報資源の所在を示しており、フォルダ名及びファイル名を含む。なお、言うまでもなく、ファイル名のみでパス名が構成されることもある。
【0063】
図9は、ブラウザ画面5の一例を示す模式図である。ブラウザ画面5は、URLが入力されるURL入力部50と、情報資源に係るハイパーテキスト文書、画像等が表示される情報資源表示部51とを有する。CPU30は、URL入力部50にURLが入力された場合、例えばURL「http://host.co.jp/bokujo/te」が入力された場合、ホスト名「host.co.jp」に対応するIPアドレス、例えば情報提供装置1のIPアドレスを図示しないDNS(Domain Name System)に問い合わせる。そして、CPU30は、DNSから返答されたIPアドレスにて情報提供装置1との接続を確立する。次いで、CPU30は、情報提供装置1における情報資源の所在を示す文字列、つまりパス名「bokujo/te」、及び情報資源の送信を要求する情報を通信部37にて情報提供装置1に送信する。そして、情報提供装置1のCPU10は、第1通信部17にて前記文字列を受信する。
【0064】
ステップS11の処理を終えた場合、CPU10は、受信した文字列に基づいて、内部記憶装置15に格納された特定の情報資源を検索する(ステップS12)。そして、CPU10は、ステップS11で受信した文字列に基づく情報資源の検索に成功したか否かを判定する(ステップS13)。
【0065】
情報資源の検索に成功したと判定した場合(ステップS13:YES)、CPU10は、検索された情報資源を第1通信部17にて通信端末装置3に送信し(ステップS14)、情報提供に係る処理を終える。
【0066】
情報資源の検索に失敗したと判定した場合(ステップS13:NO)、CPU10は、情報資源の検索に失敗した文字列、つまり通信端末装置3側で誤入力された文字列をRAM12に記憶させる(ステップS15)。RAM12は、例えば文字列「bokujo/te」を一時記憶する。
【0067】
次いで、CPU10は、サブルーチンを呼び出して実行することにより、情報資源の所在を正しく示した文字列の候補(以下、正入力文字列候補という)を生成する(ステップS16)。
【0068】
図10は、正入力文字列候補の生成に係るサブルーチンの処理手順を示すフローチャートである。CPU10は、ステップS11で受信した文字列の文字種を統一する(ステップS31)。例えば、全角文字を半角文字に統一する。
【0069】
次いで、CPU10は、文字列からローマ字表記部分の文字列を抽出する(ステップS32)。そして、CPU10は、抽出したローマ字表記部分の文字列を辞書サーバ2に送信し、該文字列に対応する英語表記の文字列を取得し、ローマ字表記部分の文字列を英語表記の文字列に置換する(ステップS33)。例えば、文字列「biiru.html」を受信していた場合、ローマ字表記部分の文字列「biiru」は、「beer」に変更される。
【0070】
次いで、CPU10は、ステップS31〜33で処理された文字列からフォルダ名部分の文字列を抽出する(ステップS34)。そして、CPU10は、抽出したフォルダ名部分の文字列を辞書サーバ2に送信し、該文字列に係る正入力文字列及び誤入力回数を取得する(ステップS35)。つまり、抽出した文字列と同一又は該文字列を含む誤入力文字列に対応付けられた一又は複数の正入力文字列と、該誤入力文字列及び正入力文字列に対応付けられた誤入力回数とを取得する。例えば、文字列「bokujo/te」を受信していた場合、フォルダ名部分として「bokujo」が抽出される。そして、「bokujo」に係る正入力文字列「bokujou」及び誤入力回数55と、正入力文字列「bokujyou」及び誤入力回数10とを取得する。
【0071】
次いで、CPU10は、ステップS31〜33で処理された文字列からファイル名部分の文字列を抽出する(ステップS36)。そして、CPU10は、抽出したファイル名部分の文字列を辞書サーバ2に送信し、該ファイル名部分の文字列に係る正入力文字列及び誤入力回数を取得する(ステップS37)。つまり、抽出した文字列と同一又は該文字列を含む誤入力文字列に対応付けられた一又は複数の正入力文字列と、該誤入力文字列及び正入力文字列に対応付けられた誤入力文字列とを取得する。例えば、文字列「bokujo/te」を受信していた場合、ファイル名部分として「te」が抽出される。そして、「te」に対応する正入力文字列「tes」及び誤入力回数8と、正入力文字列「teto」及び誤入力回数66を取得する。
【0072】
次いで、CPU10は、文字列のフォルダ名及びファイル名部分を、ステップS35及びステップS37で取得した正入力文字列に置換した文字列を生成する(ステップS38)。例えば、文字列「bokujo/te」を受信していた場合、文字列「bokujou/tes」、「bokujou/teto」、「bokujyou/tes」、「bokujyou/teto」が生成される。
【0073】
そして、CPU10は、ステップS38で生成した各文字列から拡張子部分の文字列を抽出し(ステップS39)、文字列の拡張子部分を拡張子辞書2cに登録されている複数の拡張子夫々の文字列に置換し、又は拡張子部分が抽出されなかった場合、拡張子の文字列を付加し(ステップS40)、処理を終える。例えば、文字列「bokujo/te」を受信していた場合、各種拡張子の文字列が付加された文字列、例えば、「bokujou/tes.html」、「bokujou/tes.htm」、「bokujou/tes.shtml」、…「bokujyou/teto.php」、「bokujyou.pl」等が生成される。
【0074】
ステップS16の処理を終えた場合、CPU10は、ステップS16で生成された正入力文字列候補の文字列に基づいて情報資源を再検索する(ステップS17)。例えば、内部記憶装置15に、文字列「bokujou/teto.htm」で指定される情報資源と、文字列「bokujou/tes.html」で指定される情報資源とが格納されている場合、2つの前記情報資源が再検索される。
【0075】
そして、CPU10は、情報資源の再検索に成功したか否かを判定する(ステップS18)。
【0076】
情報資源の再検索に成功したと判定した場合(ステップS18:YES)、CPU10は、誤入力回数情報に基づいて一の情報資源、例えば誤入力確率が最大となる情報資源を選択する(ステップS19)。例えば、文字列「bokujou/teto.htm」の場合、「bokujou」の誤入力回数が55、「teto」の誤入力回数が66であるため、誤入力確率は55×66と評価することができる。同様に、文字列「bokujou/tes.html」の場合、「bokujou」の誤入力回数が55、「tes」の誤入力回数が8であるため、誤入力確率は55×8と評価することができる。従って、「bokujou/teto.htm」で指定される情報資源が誤入力確率可能性の高い一の情報資源として選択される。
【0077】
そして、CPU10は、ステップS17で情報資源の再検索に成功した文字列を含むハイパーリンク、ステップS19で選択された一の情報資源を表示し、情報資源の所在を示す文字列の再送信を要求するための情報資源を生成する(ステップS20)。ハイパーリンクは、生成された文字列「bokujou/teto.htm」の先頭に、スキーム名及び情報提供装置1のホスト名を示す文字列「http://host.co.jp」の文字列を付加したものである。該文字列「http://host.co.jp」は、情報提供装置1の内部記憶装置15が記憶している。
【0078】
情報資源の再検索に失敗したと判定した場合(ステップS18:NO)、CPU10は、トップページの情報資源、例えばパス名「index.html」で指定される情報資源を表示し、情報資源の所在を示す文字列の再送信を要求するための情報資源を生成する(ステップS21)。
【0079】
ステップS20又はステップS21の処理を終えた場合、CPU10は、ステップS20又はステップS21で生成された情報資源を第1通信部17にて通信端末装置3に送信する(ステップS22)。
【0080】
図11は、使用者が所望していると推定されるハイパーリンク及び一の情報資源を表示したブラウザ画面5の一例を示す模式図である。通信端末装置3のCPU30は、ステップS20で生成された情報資源を通信部37にて受信した場合、該情報資源に基づいて図11に示すようなブラウザ画面5を出力装置36に表示する。ブラウザ画面5の情報資源表示部51は、上フレーム51a及び下フレーム51bに区分けされ、上フレーム51aには、ハイパーリンクが表示され、下フレーム51bには使用者が所望していると推定される一の情報資源が表示される。また、上フレーム51aには、「このページは入力されたhttp://host.co.jp/bokujo/teというページが存在しないため、あなたが意図したと思われるページを自動検索し、表示しています。※このURLでは以下の候補ページが存在します。」の説明文が表示される。ハイパーリンクは、該説明文の下方に表示される。また、情報資源表示部51に表示されている情報資源のハイパーリンクの横方向一端側には、「(現在表示中)」の説明文が表示される。更に、ハイパーリンクの下方には、「これらのページが意図したページだった場合は、リンクをクリックしてページを参照してください。」の説明文が表示される。
【0081】
次いで、CPU10は、情報資源の所在を示す文字列の再送信要求に対して、通信端末装置3から送信された文字列を受信したか否かを判定する(ステップS23)。
【0082】
具体的には、通信端末装置3側において、CPU30は、入力装置34にて文字列の再入力を受け付ける。ブラウザ画面5に使用者が意図していた情報資源の所在を示すハイパーリンクが表示されている場合、使用者は該当するハイパーリンクを選択するのみで、情報資源の所在を示す文字列を情報提供装置1に再送信することができる。ブラウザ画面5に使用者が意図していた情報資源の所在を示すハイパーリンクが表示されていない場合、使用者はURL入力部50に情報資源の所在を示す文字列を入力することによって、情報資源の所在を示す文字列を情報提供装置1に再送信する。そして、情報提供装置1のCPU10は、第1通信部17にて前記文字列を受信する。
【0083】
再送信要求に対する文字列を受信していないと判定した場合(ステップS23:NO)、CPU10は、ステップS22で情報資源を送信してから所定時間が経過したか否かを判定する(ステップS25)。所定時間が経過していないと判定した場合(ステップS25:NO)、CPU10は処理をステップS23に戻す。所定時間が経過したと判定した場合(ステップS25:YES)、CPU10は情報提供に係る処理を終える。
【0084】
再送信要求に対する文字列を受信したと判定した場合(ステップS23:YES)、CPU10は、受信した文字列に基づいて情報資源を検索し(ステップS24)、情報資源の検索に成功したか否かを判定する(ステップS26)。
【0085】
情報資源の検索に失敗したと判定した場合(ステップS26:NO)、CPU10は処理をステップS15に戻す。情報資源の検索に成功したと判定した場合(ステップS26:YES)、CPU10は、ステップS24で検索された情報資源を第1通信部17にて通信端末装置3に送信する(ステップS27)。
【0086】
図12及び図13は、情報資源を表示したブラウザ画面5の一例を示す模式図である。例えば、通信端末装置3側でURL「http://host.co.jp/bokujou/teto.htm」のハイパーリンクが選択された場合、図12に示すように「bokujou/teto.htm」の文字列で検索された情報資源が情報資源表示部51に表示される。より詳細には、情報提供装置1は、通信端末装置3から送信された文字列「bokujou/teto.htm」を受信し、該文字列に基づいて情報資源を検索し、検索された情報資源を通信端末装置3に送信する。通信端末装置3は、情報提供装置1から送信された前記情報資源を受信し、受信した情報資源に基づいて該情報資源を情報資源表示部51に表示させる。
【0087】
同様に、URL「http://host.co.jp/bokujou/tes.html」のハイパーリンクが選択された場合、図12に示すように「bokujou/tes.html」の文字列で検索された情報資源が情報資源表示部51に表示される。
【0088】
次いで、CPU10は、サブルーチンを呼び出して誤入力文字列辞書2aの登録を行い(ステップS28)、情報提供に係る処理を終える。
【0089】
図14は、誤入力文字列及び正入力文字列の登録に係るCPU10の処理手順を示すフローチャートである。CPU10は、情報資源の検索に成功した文字列のフォルダ名部分及びファイル名部分の文字列を抽出する(ステップS51)。例えば、文字列「bokujou/teto.htm」を受信した場合、フォルダ名「bokujou」と、ファイル名「teto」とを抽出する。
【0090】
次いで、CPU10は、誤入力文字列及び正入力文字列を特定する(ステップS52)。例えば、情報資源の検索に失敗した文字列「bokujo/te」のフォルダ名部分「bokujo」と、情報資源の検索に成功した文字列のフォルダ名部分「bokujou」とを比較し、両者が異なっている場合、誤入力文字列として「bokujo」を特定し、正入力文字列として「bokujou」を特定する。同様に、情報資源の検索に失敗した文字列「bokujo/te」のファイル名部分「te」と、情報資源の検索に成功した文字列のファイル名部分「teto」とを比較し、誤入力文字列として「te」を特定し、正入力文字列として「teto」を特定する。
【0091】
次いで、CPU10は、ステップS52で特定した誤入力文字列及び正入力文字列を辞書サーバ2に送信し、同一の誤入力文字列及び正入力文字列があるか否かを判定させる(ステップS53)。同一の誤入力文字列及び正入力文字列があると判定した場合(ステップS53:YES)、該当する誤入力回数を増加させ(ステップS54)、処理を終える。例えば、誤入力文字列「te」及び正入力文字列「teto」を辞書サーバ2に送信した場合、該当する誤入力回数「66」を「67」に増加させる。
【0092】
同一の誤入力文字列がないと判定した場合(ステップS53:NO)、CPU10は、誤入力文字列及び正入力文字列を誤入力文字列辞書2aに新規登録し(ステップS55)、処理を終える。
【0093】
このように構成された実施の形態に係る情報資源提供システム、情報提供装置1、情報提供方法及びコンピュータプログラムにあっては、通信端末装置3側で情報資源の所在を示す文字列が誤入力された場合であっても、使用者所望の情報資源にアクセスすることが可能な正しい文字列を推定し、使用者所望の情報資源を通信端末装置3に提供することができる。
【0094】
また、情報資源の所在を示す文字列が誤入力された場合、誤入力文字列及び正入力文字列を特定して誤入力文字列辞書2aに登録するように構成されているため、使用者の誤入力傾向を学習し、情報資源の所在を正しく示した文字列の生成精度を向上させ、使用者所望の情報資源をより的確に提供することができる。
【0095】
更に、使用者所望の情報資源にアクセスすることが可能な正しい文字列を推定し、該文字列を含むハイパーリンクを提供することができる。使用者は、ハイパーリンクを選択するのみで所望の情報資源を得ることができる。
【0096】
また、情報資源の所在を正しく示した文字列の再送信を要求する際、手間がかかる手入力で文字列の再送信を要求する場合に比べて使用者の誤入力傾向に係る情報を効果的に収集し、誤入力文字列辞書2aを学習させることができる。
【0097】
更にまた、誤入力確率が最も高い文字列に基づいて選択された一の情報資源を提供するように構成されているため、使用者が所望している可能性が高い一の情報資源を選択して提供することができる。
【0098】
更にまた、拡張子が入力されていない場合又は拡張子が誤入力された場合であっても、情報資源の所在を正しく示した文字列を推定し、使用者所望の情報資源を提供することができる。
【0099】
更にまた、非表音文字で表記されるべき部分が表音文字で表記された文字列を受信した場合であっても、情報資源の所在を正しく示した文字列を推定し、使用者所望の情報資源を提供することができる。
【0100】
なお、実施の形態にあっては、情報資源としてハイパーテキスト文書、画像情報等を説明したが、情報資源の内容はこれに限定されず、文字列に基づいて検索が可能な各種情報が含まれる。例えば、情報資源は通信網に接続された通信装置のIPアドレスであっても良く、本発明に係る情報提供方法をDNSに適用しても良い。情報提供方法を実施するDNSによれば、ドメイン名が誤入力された場合、例えば「hos.co.jp」と誤入力された場合であっても、正しい文字列「host.co.jp」を推定し、該文字列「host.co.jp」に基づいて情報資源としてのIPアドレスを検索し、検索されたIPアドレスをIPアドレス要求元の通信端末装置に送信することができる。
【0101】
また、情報提供装置のCPUが本発明に係る情報提供方法を実施しているが、言うまでもなく情報提供方法に係る処理を複数のコンピュータを用いて分散処理させても良い。例えば、情報提供装置のCPUが実行している処理の一部を辞書サーバに実行させるように構成しても良い。
【0102】
更に、誤入力文字列辞書、ローマ字表記辞書及び拡張子辞書を格納した辞書サーバを一例として説明したが、日本語辞書のような他の辞書と連携させても良い。
【0103】
更にまた、今回開示された実施の形態はすべての点で例示であって、制限的なものではない。本発明の範囲は、特許請求の範囲によって示され、特許請求の範囲と均等の意味及び範囲内でのすべての変更が含まれる。
【図面の簡単な説明】
【0104】
【図1】本発明の実施の形態に係る情報提供システムの構成を示す模式図である。
【図2】情報提供装置の構成を模式的に示すブロック図である。
【図3】誤入力文字列辞書の一例を概念的に示す説明図である。
【図4】ローマ字表記辞書の一例を概念的に示す説明図である。
【図5】拡張子辞書の一例を概念的に示す説明図である。
【図6】通信端末装置の構成を模式的に示すブロック図である。
【図7】情報提供に係るCPUの処理手順を示すフローチャートである。
【図8】情報提供に係るCPUの処理手順を示すフローチャートである。
【図9】ブラウザ画面の一例を示す模式図である。
【図10】正入力文字列候補の生成に係るサブルーチンの処理手順を示すフローチャートである。
【図11】使用者が所望していると推定されるハイパーリンク及び一の情報資源を表示したブラウザ画面の一例を示す模式図である。
【図12】情報資源を表示したブラウザ画面の一例を示す模式図である。
【図13】情報資源を表示したブラウザ画面の一例を示す模式図である。
【図14】誤入力文字列及び正入力文字列の登録に係るCPUの処理手順を示すフローチャートである。
【符号の説明】
【0105】
1 情報提供装置
2 辞書サーバ
2a 誤入力文字列辞書
2b ローマ字表記辞書
2c 拡張子辞書
3 通信端末装置
4 記録媒体
5 ブラウザ画面
10 CPU
30 CPU
50 URL入力部
51 情報資源表示部
N 通信網
【特許請求の範囲】
【請求項1】
情報資源の所在を示す文字列を受信し、受信した文字列に基づいて情報資源を検索し、検索された情報資源を前記文字列の送信元に提供する情報提供方法において、
受信した文字列の一部又は全部であって、情報資源の検索に失敗した誤入力文字列と、前記文字列の受信後に受信した文字列の一部又は全部であって、情報資源の検索に成功した正入力文字列とを対応付けた誤入力文字列辞書を作成し、
情報資源の検索に失敗した場合、受信した文字列及び前記誤入力文字列辞書に基づいて、前記文字列の一部又は全部を変更した文字列を生成し、
生成された文字列に基づいて情報資源を再検索する
ことを特徴とする情報提供方法。
【請求項2】
情報資源の所在を示す文字列を受信する受信手段と、該受信手段が受信した文字列に基づいて情報資源を検索する検索手段とを備え、該検索手段にて検索された情報資源を前記文字列の送信元に提供する情報提供装置において、
前記受信手段が受信した文字列の一部又は全部であって、情報資源の検索に失敗した誤入力文字列と、前記文字列の受信後に前記受信手段が受信した文字列の一部又は全部であって、情報資源の検索に成功した正入力文字列とを対応付けた誤入力文字列辞書を記憶する記憶手段と、
前記検索手段が情報資源の検索に失敗した場合、前記受信手段が受信した文字列及び前記記憶手段が記憶している誤入力文字列辞書に基づいて、前記文字列の一部又は全部を変更した文字列を生成する生成手段と
を備え、
前記検索手段は、
前記生成手段が生成した文字列に基づいて情報資源を再検索するようにしてある
ことを特徴とする情報提供装置。
【請求項3】
前記検索手段が情報資源の検索に失敗した場合、前記送信元に、情報資源の所在を示す文字列の再送信を要求する要求手段と、
該要求手段の要求に対して前記送信元から送信された文字列を前記受信手段が受信し、受信した文字列に基づく情報資源の検索に成功した場合、前記文字列に係る誤入力文字列及び正入力文字列を対応付けて前記誤入力文字列辞書に登録する手段と
を備えることを特徴とする請求項2に記載の情報提供装置。
【請求項4】
前記生成手段が生成した文字列を含むハイパーリンクを前記送信元に送信する手段を備える
ことを特徴とする請求項2又は請求項3に記載の情報提供装置。
【請求項5】
前記誤入力文字列辞書は、
誤入力された回数に係る誤入力回数情報を前記正入力文字列及び誤入力文字列に対応付けて記憶しており、
前記生成手段が複数の文字列を生成し、前記検索手段にて複数の情報資源が再検索された場合、前記文字列の生成に用いた正入力文字列及び誤入力文字列に対応する誤入力回数情報に基づいて一の情報資源を選択する選択手段と、
該選択手段にて選択された情報資源を前記送信元に送信する手段と
を備えることを特徴とする請求項2乃至請求項4のいずれか一つに記載の情報提供装置。
【請求項6】
前記記憶手段は、
情報資源のデータ形式を示す複数の拡張子夫々の文字列を記憶しており、
前記生成手段は、
前記検索手段が情報資源の検索に失敗した場合、前記受信手段が受信した文字列に前記記憶手段が記憶している拡張子の文字列を付加し又は前記受信手段が受信した文字列の一部を拡張子の文字列に置換する手段を備える
ことを特徴とする請求項2乃至請求項5のいずれか一つに記載の情報提供装置。
【請求項7】
前記記憶手段は、
非表音文字にて表記された文字列と、該文字列を表音文字にて表記した文字列とを対応付けた表音文字辞書を記憶しており、
前記生成手段は、
前記検索手段が情報資源の検索に失敗した場合、前記受信手段が受信した文字列及び前記記憶手段が記憶している表音文字辞書に基づいて、前記文字列の一部又は全部を変更した文字列を生成する手段を備える
ことを特徴とする請求項2乃至請求項6のいずれか一つに記載の情報提供装置。
【請求項8】
通信網を介して接続された通信装置と、請求項2乃至請求項7のいずれか一つに記載の情報提供装置とを備える情報提供システムにおいて、
前記通信装置は、
情報資源の所在を示す文字列を前記情報提供装置に送信する手段を備え、
前記情報提供装置は、
前記通信装置から送信された文字列を受信し、該文字列に係る情報資源を前記通信装置に提供するようにしてある
ことを特徴とする情報提供システム。
【請求項9】
情報資源の所在を示す文字列を受信し、情報資源を前記文字列の送信元に提供するコンピュータに、前記文字列に基づいて情報資源を検索させるコンピュータプログラムにおいて、
コンピュータに、受信した文字列の一部又は全部であって、情報資源の検索に失敗した誤入力文字列と、前記文字列の受信後に受信した文字列の一部又は全部であって、情報資源の検索に成功した正入力文字列とを対応付けた誤入力文字列辞書を作成させ、
コンピュータに、情報資源の検索に失敗した場合、受信した文字列及び前記誤入力文字列辞書に基づいて、前記文字列の一部又は全部を変更した文字列を生成させ、
コンピュータに、生成された文字列に基づいて情報資源を再検索させる
ことを特徴とするコンピュータプログラム。
【請求項1】
情報資源の所在を示す文字列を受信し、受信した文字列に基づいて情報資源を検索し、検索された情報資源を前記文字列の送信元に提供する情報提供方法において、
受信した文字列の一部又は全部であって、情報資源の検索に失敗した誤入力文字列と、前記文字列の受信後に受信した文字列の一部又は全部であって、情報資源の検索に成功した正入力文字列とを対応付けた誤入力文字列辞書を作成し、
情報資源の検索に失敗した場合、受信した文字列及び前記誤入力文字列辞書に基づいて、前記文字列の一部又は全部を変更した文字列を生成し、
生成された文字列に基づいて情報資源を再検索する
ことを特徴とする情報提供方法。
【請求項2】
情報資源の所在を示す文字列を受信する受信手段と、該受信手段が受信した文字列に基づいて情報資源を検索する検索手段とを備え、該検索手段にて検索された情報資源を前記文字列の送信元に提供する情報提供装置において、
前記受信手段が受信した文字列の一部又は全部であって、情報資源の検索に失敗した誤入力文字列と、前記文字列の受信後に前記受信手段が受信した文字列の一部又は全部であって、情報資源の検索に成功した正入力文字列とを対応付けた誤入力文字列辞書を記憶する記憶手段と、
前記検索手段が情報資源の検索に失敗した場合、前記受信手段が受信した文字列及び前記記憶手段が記憶している誤入力文字列辞書に基づいて、前記文字列の一部又は全部を変更した文字列を生成する生成手段と
を備え、
前記検索手段は、
前記生成手段が生成した文字列に基づいて情報資源を再検索するようにしてある
ことを特徴とする情報提供装置。
【請求項3】
前記検索手段が情報資源の検索に失敗した場合、前記送信元に、情報資源の所在を示す文字列の再送信を要求する要求手段と、
該要求手段の要求に対して前記送信元から送信された文字列を前記受信手段が受信し、受信した文字列に基づく情報資源の検索に成功した場合、前記文字列に係る誤入力文字列及び正入力文字列を対応付けて前記誤入力文字列辞書に登録する手段と
を備えることを特徴とする請求項2に記載の情報提供装置。
【請求項4】
前記生成手段が生成した文字列を含むハイパーリンクを前記送信元に送信する手段を備える
ことを特徴とする請求項2又は請求項3に記載の情報提供装置。
【請求項5】
前記誤入力文字列辞書は、
誤入力された回数に係る誤入力回数情報を前記正入力文字列及び誤入力文字列に対応付けて記憶しており、
前記生成手段が複数の文字列を生成し、前記検索手段にて複数の情報資源が再検索された場合、前記文字列の生成に用いた正入力文字列及び誤入力文字列に対応する誤入力回数情報に基づいて一の情報資源を選択する選択手段と、
該選択手段にて選択された情報資源を前記送信元に送信する手段と
を備えることを特徴とする請求項2乃至請求項4のいずれか一つに記載の情報提供装置。
【請求項6】
前記記憶手段は、
情報資源のデータ形式を示す複数の拡張子夫々の文字列を記憶しており、
前記生成手段は、
前記検索手段が情報資源の検索に失敗した場合、前記受信手段が受信した文字列に前記記憶手段が記憶している拡張子の文字列を付加し又は前記受信手段が受信した文字列の一部を拡張子の文字列に置換する手段を備える
ことを特徴とする請求項2乃至請求項5のいずれか一つに記載の情報提供装置。
【請求項7】
前記記憶手段は、
非表音文字にて表記された文字列と、該文字列を表音文字にて表記した文字列とを対応付けた表音文字辞書を記憶しており、
前記生成手段は、
前記検索手段が情報資源の検索に失敗した場合、前記受信手段が受信した文字列及び前記記憶手段が記憶している表音文字辞書に基づいて、前記文字列の一部又は全部を変更した文字列を生成する手段を備える
ことを特徴とする請求項2乃至請求項6のいずれか一つに記載の情報提供装置。
【請求項8】
通信網を介して接続された通信装置と、請求項2乃至請求項7のいずれか一つに記載の情報提供装置とを備える情報提供システムにおいて、
前記通信装置は、
情報資源の所在を示す文字列を前記情報提供装置に送信する手段を備え、
前記情報提供装置は、
前記通信装置から送信された文字列を受信し、該文字列に係る情報資源を前記通信装置に提供するようにしてある
ことを特徴とする情報提供システム。
【請求項9】
情報資源の所在を示す文字列を受信し、情報資源を前記文字列の送信元に提供するコンピュータに、前記文字列に基づいて情報資源を検索させるコンピュータプログラムにおいて、
コンピュータに、受信した文字列の一部又は全部であって、情報資源の検索に失敗した誤入力文字列と、前記文字列の受信後に受信した文字列の一部又は全部であって、情報資源の検索に成功した正入力文字列とを対応付けた誤入力文字列辞書を作成させ、
コンピュータに、情報資源の検索に失敗した場合、受信した文字列及び前記誤入力文字列辞書に基づいて、前記文字列の一部又は全部を変更した文字列を生成させ、
コンピュータに、生成された文字列に基づいて情報資源を再検索させる
ことを特徴とするコンピュータプログラム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【公開番号】特開2009−223538(P2009−223538A)
【公開日】平成21年10月1日(2009.10.1)
【国際特許分類】
【出願番号】特願2008−66301(P2008−66301)
【出願日】平成20年3月14日(2008.3.14)
【出願人】(396004833)株式会社エクシング (394)
【Fターム(参考)】
【公開日】平成21年10月1日(2009.10.1)
【国際特許分類】
【出願日】平成20年3月14日(2008.3.14)
【出願人】(396004833)株式会社エクシング (394)
【Fターム(参考)】
[ Back to top ]