説明

情報検索装置、情報検索方法、及びコンピュータプログラム

【課題】文字情報の適宜分割において、連続した文字列が途中で分割されてしまう不都合を解消し、所望のサービス情報を効率良く円滑に探し出す検索を行う。
【解決手段】本装置10では、文字情報を適宜分割すると、1文字からなる1文字情報を特定し、その文字情報中での位置を判定する。次いで、文字情報の先頭であると判定したとき後方の文字情報と連結して複合語とし、文字情報の途中であると判定したとき前方の文字情報と連結して複合語とする。そして、複合語とした文字情報と、2文字以上の文字情報とを索引用の文字列として特定し、この文字列を含むサービス情報を特定すると共に、サービス情報の記憶位置を特定する検索位置特定情報を特定し、互いに関連付けて記憶するサービス検索情報記憶部F2を作成する。そして、サービス情報を検索するための文字列の入力を受け付けたとき、このサービス検索情報記憶部を参照してサービス情報を検索する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、所望のサービス情報を探し出す検索技術に係り、詳しくは、検索対象となる所定の情報群より、指定(入力)された文字列に対応するサービス情報を、効率良く円滑に探し出すことのできる検索を行う情報検索装置、情報検索方法、及び情報検索用のコンピュータプログラムに関する。
【背景技術】
【0002】
従来、ガソリンスタントやコンビニエンスストア、ラーメン店、ホテル・旅館といった店舗や、有名な施設、行楽地といったPOI(Point Of Interest)を検索対象物とし、その属性となり得る名称や住所、紹介記事等の文字情報に含まれる文字列からPOIを探し出し、POIに関する情報をサービス情報として表示する情報検索装置が知られている。また、この情報検索装置機能を備え、電子地図と共にその情報を表示するカーナビゲーション装置(以下、「カーナビ」という。)も知られている。
【0003】
このような情報検索装置では、検索データより所望のサービス情報を探し出す場合、サービス情報に含まれる文字情報を適宜分割して得られた文字列を検索用の索引(インデックス)としている。この場合、日本語の文字情報を適宜分割する解析手法として、形態素解析というものが用いられている。この形態素解析とは、コンピュータ等の計算機を用いた自然言語処理の基礎技術のひとつであり、自然言語で書かれた文を、言語で意味を持つ最小単位、すなわち形態素の列に分割し、それぞれの品詞を判別する作業をいう。
【0004】
ところが、形態素解析において文字情報を適宜分割すると、連続した文字列(単語)であっても途中で分割され、1文字で区切られてしまうことがある。そのため、得られた結果の形態素を検索用の索引文字列として用いると、サービス情報を検索するために検索システムなどでユーザが入力すると思われる文字列とは異なるものとなってしまい、所望のサービス情報を探し出すことができないことがある。
特に、たとえば固有名詞であることが多いPOI名称の場合、連続した文字列が途中で分割されてしまうと、部分一致での検索を行なうことが非常に困難なものとなる。
したがって、サービス情報に含まれる文字情報を適宜分割して得られた文字列を、適切な検索用の索引文字列としてそのまま採用することができない。
【0005】
また、形態素解析等によって適宜分割された結果の形態素を索引用の索引文字列としてそのまま用いると、上述のように1文字で区切られた文字情報といった索引とはなり得ない文字列の存在が多くなる虞が多分にあり、データサイズが非常に大きなものとなってしまうと共に、所望の情報を素早く探し出すことが困難となってしまうといった問題がある。
【0006】
そこで、索引として用いる文字列の登録を制限し、所望のサービス情報を素早く探し出すことができるようにした手段が提案されている。
たとえば、施設の正式名称を入力し、入力された施設の正式名称を形態素に分割し、分割された形態素から地域名称及び施設の正式名称の一部を抽出し、抽出された地域名称と抽出された施設の正式名称の一部とを連結単語で連結した単語を辞書用単語として生成するようにした手段がある(特許文献1を参照)。
【特許文献1】特開2005−202198号公報
【発明の開示】
【発明が解決しようとする課題】
【0007】
しかしながら、上記特許文献1に記載の技術は、サービス情報に含まれる文字情報を適宜分割して得られた文字列を、適切な索引用の索引文字列として採用することができるように工夫を施したものではない。
【0008】
また、Webを利用して情報検索サービスを行うWebアプリでは、データベース等を使用することにより、入力された文字列に応じて適切に検索を行うようにするものもある。しかしながら、カーナビのような限られた環境ではデータサイズの制約によりデータベースを導入することが困難である。
このように、形態素解析等による文字情報の適宜分割において、連続した文字列が途中で分割されてしまうことの不都合を解消し、得られた索引用の索引文字列から所望のサービス情報を効率良く円滑に探し出すことを可能とした検索手段は、現在のところ提案されていない。
【0009】
本発明は、上記事情に鑑みて成されたものであり、形態素解析等による文字情報の適宜分割において、連続した文字列が途中で分割されてしまうことの不都合を解消し、得られた索引用の索引文字列から所望のサービス情報を効率良く円滑に探し出す検索を行うことが可能な仕組みを提供することを目的とする。
【課題を解決するための手段】
【0010】
本発明の情報検索装置は、検索対象となる所定の情報群より、指定された文字列に対応するサービス情報を効率良く円滑に探し出す検索を行う情報検索装置であって、前記サービス情報を記憶し、その記憶位置を特定する検索位置特定情報と、前記サービス情報と、を互いに関連付けて記憶する第1記憶手段と、前記サービス情報に含まれる文字情報を適宜分割する文字情報分割手段と、前記文字情報分割手段において分割した後の各文字情報(以下、「分割文字情報」という。)の文字数を算出し、1文字からなる分割文字情報(以下、「1文字情報」という。)を特定すると共に、特定した1文字情報の文字情報中での位置を判定する1文字情報位置判定手段と、前記1文字情報位置判定手段において、1文字情報が文字情報の先頭であると判定したとき、この1文字情報と後方の分割文字情報と連結して複合語とし、1文字情報が文字情報の途中であると判定したとき、この1文字情報は前方の分割文字情報と連結して複合語とする文字情報連結手段と、前記文字情報連結手段で複合語とした分割文字情報を含み、前記文字情報分割手段において分割した2文字以上の分割文字情報を索引用の文字列として特定する文字列特定手段と、前記文字情報分割手段で分割した前記サービス情報の前記第1記憶手段での記憶位置を特定する検索位置特定情報を特定し、前記文字列特定手段で特定した文字列と、特定したこの検索位置特定情報と、を互いに関連付けて記憶する第2記憶手段を作成する索引情報作成手段と、前記サービス情報を検索するための文字列の入力を受け付ける文字列情報受付手段と、前記文字列情報受付手段で受け付けた文字列に基づき、前記索引情報作成手段で作成した前記第2記憶手段を参照して検索位置特定情報を特定する検索位置情報特定手段と、前記検索位置情報特定手段で特定した検索位置特定情報に基づき、前記第1記憶手段を参照してサービス情報を特定し、抽出するサービス情報検索手段と、前記サービス情報検索手段で抽出したサービス情報を出力するサービス情報出力手段と、を備えることを特徴とする。
【0011】
また、本発明の情報検索装置は、文字情報連結手段が、前記文字情報分割手段において分割した文字情報の前記サービス情報内での属性区分を判定し、この属性区分が名称であるとき、前記1文字情報の文字情報中での位置に基づいた連結を行うものとしても良い。
【0012】
また、本発明の情報検索方法は、サービス情報を記憶し、その記憶位置を特定する検索位置特定情報と、前記サービス情報と、を互いに関連付けて記憶する第1記憶手段、を備え、情報検索装置において、検索対象となる所定の情報群より、指定された文字列に対応するサービス情報を効率良く円滑に探し出す検索を行う情報検索方法であって、前記情報検索装置が、前記サービス情報に含まれる文字情報を適宜分割する第1ステップと、前記情報検索装置において、前記第1ステップで分割した後の各文字情報(以下、「分割文字情報」という。)の文字数を算出し、1文字からなる分割文字情報(以下、「1文字情報」という。)を特定すると共に、特定した1文字情報の文字情報中での位置を判定する第2ステップと、前記情報検索装置において、前記第2ステップにおいて、1文字情報が文字情報の先頭であると判定したとき、この1文字情報と後方の分割文字情報と連結して複合語とし、1文字情報が文字情報の途中であると判定したとき、この1文字情報は前方の分割文字情報と連結して複合語とする3ステップと、前記情報検索装置において、前記第3ステップで複合語とした分割文字情報を含み、前記第1ステップにおいて分割した2文字以上の分割文字情報を索引用の文字列として特定する第4ステップと、前記情報検索装置において、前記第1ステップで分割した前記サービス情報の前記第1記憶手段での記憶位置を特定する検索位置特定情報を特定し、前記第4ステップで特定した文字列と、特定したこの検索位置特定情報と、を互いに関連付けて記憶する第2記憶手段を作成する第5ステップと、前記情報検索装置において、前記サービス情報を検索するための文字列の入力を受け付ける第6ステップと、前記情報検索装置において、前記第6ステップで受け付けた文字列に基づき、前記第5ステップで作成した前記第2記憶手段を参照して検索位置特定情報を特定する第7ステップと、前記情報検索装置において、前記第7ステップで特定した検索位置特定情報に基づき、前記第1記憶手段を参照してサービス情報を特定し、抽出する第8ステップと、前記第8ステップで抽出したサービス情報を前記情報検索装置より出力する第9ステップと、を含むことを特徴とする。
【0013】
また、本発明の情報検索方法は、前記情報検索装置において、前記第3ステップが、前記第1ステップにおいて分割した文字情報の前記サービス情報内での属性区分を判定し、この属性区分が名称であるとき、前記1文字情報の文字情報中での位置に基づいた連結を行うものとしても良い。
【0014】
また、本発明のコンピュータプログラムは、サービス情報を記憶し、その記憶位置を特定する検索位置特定情報と、前記サービス情報と、を互いに関連付けて記憶する第1記憶手段、を備え、検索対象となる所定の情報群より、指定された文字列に対応するサービス情報を効率良く円滑に探し出す検索を行うことを実行させるためにコンピュータを、前記サービス情報に含まれる文字情報を適宜分割する手段、分割した後の前記各文字情報(以下、「分割文字情報」という。)の文字数を算出し、1文字からなる分割文字情報(以下、「1文字情報」という。)を特定すると共に、特定した1文字情報の文字情報中での位置を判定する手段、前記1文字情報が文字情報の先頭であると判定したとき、この1文字情報と後方の分割文字情報と連結して複合語とし、前記1文字情報が文字情報の途中であると判定したとき、この1文字情報は前方の分割文字情報と連結して複合語とする手段、前記複合語とした分割文字情報を含み、前記分割した2文字以上の分割文字情報を索引用の文字列として特定する手段、分割した前記サービス情報の前記第1記憶手段での記憶位置を特定する検索位置特定情報を特定し、特定した前記文字列と、特定したこの検索位置特定情報と、を互いに関連付けて記憶する第2記憶手段を作成する手段、前記サービス情報を検索するための文字列の入力を受け付ける手段、受け付けた前記文字列に基づき、作成した前記第2記憶手段を参照して検索位置特定情報を特定する手段、特定した前記検索位置特定情報に基づき、前記第1記憶手段を参照してサービス情報を特定し、抽出する手段、抽出した前記サービス情報を出力する手段、として機能させることを特徴とする。
【0015】
また、本発明のコンピュータプログラムは、前記コンピュータを、分割した前記文字情報の前記サービス情報内での属性区分を判定し、この属性区分が名称であるとき、前記1文字情報の文字情報中での位置に基づいた連結を行う手段、としてさらに機能させるものとしても良い。
【発明の効果】
【0016】
本発明の情報検索装置は、サービス情報に含まれる文字情報を適宜分割し、分割した文字情報の文字数を算出し、1文字からなる文字情報である1文字情報を特定すると共に、特定した1文字情報の文字情報中での位置を判定する。次いで、1文字情報が文字情報の先頭であると判定したとき、この1文字情報と後方の文字情報と連結して複合語とし、1文字情報が文字情報の途中であると判定したとき、この1文字情報は前方の文字情報と連結して複合語とする。そして、複合語とした文字情報と、2文字以上の文字情報を索引用の文字列として特定すると共に、この文字列を含むサービス情報の前記第1記憶手段での記憶位置を特定する検索位置特定情報を特定し、文字列と検索位置特定情報とを互いに関連付けて記憶する索引手段を作成する。ゆえに、サービス情報を検索するための文字列の入力を受け付けると、この索引手段を参照して検索位置特定情報を特定し、サービス情報を特定・抽出し、抽出したサービス情報を出力することができる。
したがって、形態素解析等による文字情報の適宜分割において、連続した文字列が途中で分割されてしまうことの不都合を解消し、得られた索引用の索引文字列から所望のサービス情報を効率良く円滑に探し出す検索を行うことが可能となる。
【発明を実施するための最良の形態】
【0017】
以下、図面を参照しながら、本発明に係る情報検索装置、情報検索方法、情報検索用のコンピュータプログラムの一例について説明する。
本発明に係る情報検索装置(以下、「本装置」という)は、検索対象となる所定の情報群より、指定された文字列に対応するサービス情報を効率良く円滑に探し出す検索を行う
【0018】
図1は、本装置10を用いた情報検索システム(以下、「本システム」という)の一例を示す概略図である。
本システムは、図1に示すように、本装置10と、表示部20と、入力部30と、によって構成することができる。
表示部20は、本装置10に対して検索を指示する文字列や、本装置10による検索結果を出力・表示するディスプレイ(モニタ)である。
入力部30は、本装置10に対して各種指示を行うコマンドの入力用ボタンである。
【0019】
また、図2は、本システムを用いることにより実現されるナビゲーション装置1を示す概略図である。
図2において、表示部20のスクリーン上に、入力部30が積層されたものとなっている。
入力部30を構成する入力用ボタンは、図2に示すように、文字入力ボタン31、片仮名入力又は変換するための「カタカナ」ボタン32、アルファベット入力又は変換するための「ABC」ボタン33、小文字入力に切り替えたり、濁点「゛」や半濁点「゜」を入力したりするための「小゛゜」ボタン34、数字を入力するための「123」ボタン35、入力された仮名文字を漢字へ変換する「変換」ボタン36、入力文字列の確定や、受け付けた文字情報により構成された文字列に基づく検索実行を指示する「OK」ボタン37等より構成されている。
【0020】
文字入力ボタン31は、該当情報を検索するための文字の入力情報を発信する処理を行う。文字入力ボタン31としては、たとえば平仮名のキーボードを模したGUI(Graphical User Interface)画面を表示部20に表示し、ユーザがGUI画面上で平仮名を1文字ずつカーソルあるいは指で選択していくことで、所望の文字列の入力を行なうものとすることができる。
図2において、文字入力ボタン31は、あ行、か行、さ行・・・わ行の各種文字ボタン、句点「。」を入力するためのボタン、読点「、」を入力するためのボタン、「−」を入力するためのボタンにより構成されている。
【0021】
また、表示部20には、文字入力ボタン31より入力された文字情報を出力・表示する表示欄21が表示されたものとなっている。
図2において、表示欄21には、「アイダホフライドポテト新宿東口店」といった検索のための文字列が表示されている。
【0022】
図3は、本装置10の一例を示すブロック構成図である。
本装置10は、図3に示すように、サービス情報記憶部F1と、サービス索引情報記憶部F2と、文字情報分割部11と、1文字情報位置判定部12と、文字情報連結部13と、文字列特定部14と、索引情報作成部15と、文字列情報受付部16と、検索位置情報特定部17と、サービス情報検索部18と、サービス情報出力部19と、制御部Cと、を少なくとも有している。なお、図中の符号Bは、本装置10において制御信号、データ等を伝送するバスである。
【0023】
本装置10は、情報処理装置であればよく、たとえば、モバイルタイプのパーソナルコンピュータをはじめ、PND(Portable Navigation Device)や専用デバイス、携帯電話機などで実現される。また、本装置10は、図示しないが、CPU(中央処理装置)、プログラム記憶部、補助記憶装置、OS(オペレーティング・システム)、等を有する。
CPUは、プログラム記憶部に記憶されたコンピュータプログラムに従い、本装置10の各構成要素を統制制御し、プログラム処理を実行する手段である。プログラム記憶部は、ROM(Read Only Memory)やRAM(Random Access Memory)等で構成され、本装置10が使用する各種コンピュータプログラムを記憶している手段である。
【0024】
サービス情報記憶部F1は、サービス情報を記憶し、その記憶位置を特定する検索位置特定情報と、前記サービス情報と、を互いに関連付けて記憶する手段である。サービス情報は、ガソリンスタントやコンビニエンスストア、ラーメン店、ホテル・旅館といった店舗や、有名な施設、行楽地といったPOI(Point Of Interest)に関する情報をいう。また、このサービス情報は、POIの名称や住所、ジャンル、紹介文といった属性区分ごとに分けられている。なお、ジャンルとは、ラーメンや和食、喫茶、ショーパブ、カラオケ、ディスコ、ゴルフ練習場、旅館、ビジネスホテル、水族館、ペット・ペット用品、工芸品・民芸品、といった施設の種類や目的等によってPOIを分類する区分をいう。また、検索位置特定情報は、いわゆるオフセット情報である。
したがって、本装置10では、この検索位置特定情報に基づきサービス情報を特定する検索を行うことができる。
【0025】
図4は、サービス情報記憶部F1に記憶されている情報の例を示す図である。
たとえば、図4に示すサービス情報ファイルでは、検索位置特定情報と、POIの名称や住所、電話番号、ジャンル、紹介文(テキスト記事)、といった属性情報と、を関連付けてファイルを構成することを示している。なお、ここでの紹介文には、web上の口コミ情報等を含めることもできる。
したがって、本装置10では、このサービス情報記憶部F1により、検索位置特定情報から検索対象物のサービス情報が分かるものとなる。
【0026】
サービス索引情報記憶部F2は、文字列特定部14で特定した文字列と、文字情報分割部11で分割したサービス情報のサービス情報記憶部F1での記憶位置を特定する検索位置特定情報と、を互いに関連付けて記憶する手段である。ここで、文字列特定部14で特定した文字列は、たとえば文字情報連結部13において、文字情報分割部11において分割した文字情報のサービス情報内での属性区分を判定し、この属性区分が名称であるとき、1文字情報の文字情報中での位置に基づいた連結を行って複合語とした文字情報とする。
【0027】
図5は、サービス索引情報記憶部F2に記憶されている情報の例を示す図である。
たとえば、図5に示すサービス索引情報ファイルでは、文字列情報と検索位置特定情報(オフセット情報)とを関連付けてファイルを構成することを示している。
したがって、本装置10では、このサービス索引情報記憶部F2により、サービス情報を検索するために入力した文字列から、サービス情報の記憶位置を特定する検索位置特定情報が分かるものとなる。具体的には、たとえばサービス情報の名称に含まれるPOIの特徴を示す単語を検索用の文字列とし、この単語を含む名称に該当するサービス情報の記憶位置を特定する検索位置特定情報が分かるものとなる。
【0028】
文字情報分割部11は、サービス情報に含まれる文字情報を適宜分割する処理を行う。文字情報を適宜分割する解析手法としては、たとえば形態素解析を挙げることができる。
文字情報分割部11は、分割した文字情報を1文字情報位置判定部12、文字列特定部14及び索引情報作成部15へ送信する。
【0029】
1文字情報位置判定部12は、文字情報分割部11において分割した後の各文字情報である分割文字情報の文字数を算出し、1文字からなる分割文字情報として1文字情報を特定すると共に、特定した1文字情報の文字情報中での位置を判定する処理を行う。
文字情報位置判定部12での処理は、たとえばサービス情報の名称を文字情報分割部11において適宜分割した後の各文字情報を対象とすると望ましい。
1文字情報位置判定部12は、判定した1文字情報の文字情報中での位置情報を文字情報連結部13へ送信する。
【0030】
文字情報連結部13は、1文字情報位置判定部12において、1文字情報が文字情報の先頭であると判定したとき、この1文字情報と後方の分割文字情報と連結して複合語とし、1文字情報が文字情報の途中であると判定したとき、この1文字情報は前方の分割文字情報と連結して複合語とする処理を行う。
文字情報連結部13は、複合語とした文字情報を文字列特定部14へ送信する。
【0031】
また、文字情報連結部13は、文字情報分割部11において分割した文字情報のサービス情報内での属性区分を判定し、この属性区分が名称であるとき、1文字情報の文字情報中での位置に基づいた連結を行う機能を備える。
【0032】
文字列特定部14は、文字情報連結部13で複合語とした分割文字情報を含み、文字情報分割部11において分割した2文字以上の分割文字情報を索引用の文字列として特定する処理を行う。
文字列特定部14は、特定した文字列情報を索引情報作成部15へ送信する。
【0033】
索引情報作成部15は、文字情報分割部11で分割したサービス情報のサービス情報記憶部F1での記憶位置を特定する検索位置特定情報を特定し、文字列特定部14で特定した文字列と、特定したこの検索位置特定情報と、を互いに関連付けて記憶するサービス索引情報記憶部F2を作成する処理を行う。
【0034】
文字列情報受付部16は、サービス情報を検索するための文字列の入力を受け付ける処理を行う。なお、文字列情報受付部16では、片仮名、アルファベット、数字についての揺らぎを排除するため、事前に、半角文字を全角文字に変換、小文字を大文字に変換する処理を行なった文字列を取得するようにすると良い。
文字列情報受付部16は、受け付けた文字列情報を検索位置情報特定部17へ送信する。
【0035】
検索位置情報特定部17は、文字列情報受付部16で受け付けた文字列に基づき、索引情報作成部15で作成したサービス索引情報記憶部F2を参照して検索位置特定情報を特定する処理を行う。
検索位置情報特定部17は、特定した検索位置特定情報をサービス情報検索部18へ送信する。
【0036】
サービス情報検索部18は、検索位置情報特定部17で特定した検索位置特定情報に基づき、サービス情報記憶部F1を参照してサービス情報を特定し、抽出する処理を行う。
サービス情報検索部18は、抽出したサービス情報をサービス情報出力部19へ送信する。
【0037】
サービス情報出力部19は、サービス情報検索部18で抽出したサービス情報を表示部30へ出力する処理を行う。
【0038】
制御部Cは、CPU、ROM、RAM等を具備し、プログラム記憶部に記憶されたプログラムに従い、本装置10の各構成要素を統制制御し、プログラム処理を実行する。
【0039】
次に、上述した本装置10により実行される情報検索方法を実施する本装置10の動作の一例を、図6を参照しながら説明する。図6は、本装置10での情報検索処理の一例を示すフローチャートである。
まず、文字情報分割部11が、サービス情報に含まれる文字情報を適宜分割する(S10)。
次いで、1文字情報位置判定部12が、文字情報分割部11において分割した後の各文字情報である分割文字情報の文字数を算出する(S20)。
引き続き、1文字情報位置判定部12が、1文字からなる分割文字情報として1文字情報を特定する(S30)。
さらに、1文字情報位置判定部12が、特定した1文字情報の文字情報中での位置が先頭であるか否かを判定する(S40)。
【0040】
その結果、1文字情報位置判定部12が、特定した1文字情報は文字情報の先頭に位置すると判定した場合(Y)、引き続き、文字情報連結部13が、この1文字情報と後方の分割文字情報と連結して複合語を生成する(S50)。
一方、1文字情報位置判定部12が、特定した1文字情報は文字情報の先頭に位置しない、すなわち特定した1文字情報は文字情報の途中であると判定した場合(N)、文字情報連結部13が、この1文字情報は前方の分割文字情報と連結して複合語を生成する(S60)。
ここで、文字情報連結部13は、文字情報分割部11において分割した文字情報のサービス情報内での属性区分を判定し、この属性区分が名称であるとき、1文字情報の文字情報中での位置に基づいた各種連結を行って複合語を生成すると良い。
【0041】
また、文字列特定部14が、文字情報連結部13で複合語とした分割文字情報と、文字情報分割部11において分割した2文字以上の分割文字情報を索引用の文字列として特定する(S70)。
【0042】
ここで、適宜分割して得られた文字情報を索引用の文字列とする一例は、図7に示すことができる。図7は、検索対象物としてPOIの名称を形態素解析し、複合語とした場合の索引用文字列を示す模式図である。
図7(A)において、文字情報としてPOI名称である「在本邦東ティモール民主共和国大使館」があり、これを文字情報分割部11において形態素解析した場合は、「在」「本邦」「東ティモール」「民主」「共和」「国」「大使館」といった7つの形態素に分割されるものとなる。次いで、1文字情報位置判定部12において分割した文字情報の文字数を算出し、1文字からなる文字情報である「在」と「国」を1文字情報として特定する。さらに、1文字情報位置判定部12において特定した1文字情報の文字情報中での位置を判定すると、「在」が文字情報の先頭であり、「国」が文字情報の途中であると判定できる。そうすると、文字情報連結部13は、文字情報の先頭である1文字情報の「在」を後方の文字情報である「本邦」と連結して「在本邦」といった複合語を生成し、また、文字情報の途中である1文字情報の「国」を前方の文字情報「共和」と連結して「共和国」といった複合語を生成する。
したがって、「在本邦」「東ティモール」「民主」「共和国」「大使館」といった7つの形態素が検索用の文字列として採用されるものとなる。そして、これらの文字列からは何れも、「在本邦東ティモール民主共和国大使館」のサービス情報を検索するための検索位置特定情報を特定することができることになる。
【0043】
また、図7(B)において、文字情報としてPOI名称である「アイダホフライドポテト新宿東口店」があり、これを文字情報分割部11において形態素解析した場合は、「アイダホ」「フライ」「ド」「ポテト」「新宿」「東」「口」「店」といった8つの形態素に分割されるものとなる。次いで、1文字情報位置判定部12において分割した文字情報の文字数を算出し、1文字からなる文字情報である「ド」と「東」と「口」と「店」を1文字情報として特定する。さらに、1文字情報位置判定部12において特定した1文字情報の文字情報中での位置を判定すると、「ド」「東」「口」「店」のいずれも文字情報の途中であると判定できる。そうすると、文字情報連結部13は、文字情報の途中である1文字情報の「ド」を前方の文字情報「フライ」と連結して「フライド」といった複合語を生成する。また、文字情報の途中である1文字情報の「東」を前方の文字情報「新宿」と連結して「新宿東」といった複合語を生成し、また、文字情報の途中である1文字情報の「口」を前方の文字情報とした複合語「新宿東」と連結して「新宿東口」といった複合語を生成し、さらに、文字情報の途中である1文字情報の「店」を前方の文字情報とした複合語「新宿東口」と連結して「新宿東口店」といった複合語を生成する。
したがって、「アイダホ」「フライド」「ポテト」「新宿東口店」といった4つの形態素が検索用の文字列として採用されるものとなる。そして、これらの文字列からは何れも、「アイダホフライドポテト新宿東口店」のサービス情報を検索するための検索位置特定情報を特定することができることになる。
【0044】
そして、索引情報作成部15が、文字情報分割部11で分割したサービス情報のサービス情報記憶部F1での記憶位置を特定する検索位置特定情報を特定する(S80)。
さらに、索引情報作成部15が、文字列特定部14で特定した文字列と、先に特定したこの検索位置特定情報と、を互いに関連付けて記憶するサービス索引情報記憶部F2を作成する(S90)。
【0045】
また、文字列情報受付部16が、サービス情報を検索するための文字列の入力を受け付ける(S100)。
次いで、検索位置情報特定部17が、文字列情報受付部16で受け付けた文字列に基づき、索引情報作成部15において作成したサービス索引情報記憶部F2を参照して検索位置特定情報を特定する検索を行なう(S110)。
引き続き、サービス情報検索部18が、検索位置情報特定部17で特定した検索位置特定情報に基づき、サービス情報記憶部F1を参照してサービス情報を特定し、抽出する(S120)。
そして、サービス情報出力部19が、サービス情報検索部18で抽出したサービス情報を表示部30へ出力する(S130)。
これにより、本装置10での一連の動作が終了する。
なお、これら一連の処理は、制御部Cでの統制制御により実行される。
【0046】
以上のように本実施の形態では、事前に、文字情報を適宜分割して1文字からなる1文字情報を特定し、この1文字情報の文字情報全体の中での位置を判定して、その後方の文字情報又は前方の文字情報と連結して複合語を生成する。そして、この複合語を含めて2文字以上の文字情報を、サービス情報を検索するための文字列として採用した索引を作成し、この索引を用いてサービス情報の検索を行なう。これにより、形態素解析等による文字情報の適宜分割において、連続した文字列(単語)が途中で分割され1文字で区切られてしまうことによるキーワードの雑音の低減を行い、なおかつ容量の削減を行うことができる。
【0047】
したがって、サイズや操作性に制約が多いカーナビ等においてデータサイズが大きくなってしまうことがなく、ユーザインタフェースの向上を図ることが可能となると共に、ユーザの満足度を高めることができる。しかも、所望のサービス情報を効率良く円滑に探し出すことができるので、表示部が小さくても検索結果を効果的に表示することができる。
【0048】
また、本装置10は、ナビゲーション機能を兼ね備えた装置としても良い。この場合、本装置10は、図示しないが、地図情報を記憶する手段や、この地図上の領域若しくはPOIを特定する位置情報と、POIのサービス情報とを互いに関連付けて記憶する手段をさらに備える。また、地図情報は、CD−ROMやDVD−ROM等の記憶媒体に格納されたものすることができる。
【0049】
これにより、POI情報に基づき位置情報を特定し、さらに、特定した位置情報に基づき該当する道路地図情報を特定、抽出し、この道路地図上にサービス情報が表示されるように、サービス情報と道路地図情報とを重ね合わせて出力することができる。
【産業上の利用可能性】
【0050】
本発明は、所定の情報群より、ユーザが求めているサービス情報の検索が可能なデバイスを扱う業種において産業上有用であり、検索によって電子地図上に所望のPOI情報の表示を可能とするカーナビゲーション装置等の電化製品市場においても有用である。
【図面の簡単な説明】
【0051】
【図1】本発明に係る情報検索装置を用いた情報検索システムの一例を示す概略図である。
【図2】本発明に係る情報検索装置を情報検索システムに用いることにより実現されるナビゲーション装置を示す概略図である。
【図3】本発明に係る情報検索装置の実施形態の一例を示すブロック構成図である。
【図4】本発明に係る情報検索装置が備える記憶部に記憶されているサービス情報ファイルの構造を示す一例である。
【図5】本発明に係る情報検索装置が備える記憶部に記憶されているサービス索引情報ファイルの構造を示す一例である。
【図6】本発明に係る情報検索装置での情報検索処理の一例を示すフローチャートである。
【図7】本発明に係る情報検索装置において、検索対象物としてPOIの名称を形態素解析し、複合語とした場合の文字列を示す模式図である。
【符号の説明】
【0052】
F1 サービス情報記憶部(第1記憶部)、F2 サービス索引情報記憶部(第2記憶部)、10 情報検索装置、11 文字情報分割部、12 1文字情報位置判定部、13 文字情報連結部、14 文字列特定部、15 索引情報作成部、16 文字列情報受付部、17 検索位置情報特定部、18 サービス情報検索部、19 サービス情報出力部、20 表示部、30 入力部。

【特許請求の範囲】
【請求項1】
検索対象となる所定の情報群より、指定された文字列に対応するサービス情報を効率良く円滑に探し出す検索を行う情報検索装置であって、
前記サービス情報を記憶し、その記憶位置を特定する検索位置特定情報と、前記サービス情報と、を互いに関連付けて記憶する第1記憶手段と、
前記サービス情報に含まれる文字情報を適宜分割する文字情報分割手段と、
前記文字情報分割手段において分割した後の各文字情報(以下、「分割文字情報」という。)の文字数を算出し、1文字からなる分割文字情報(以下、「1文字情報」という。)を特定すると共に、特定した1文字情報の文字情報中での位置を判定する1文字情報位置判定手段と、
前記1文字情報位置判定手段において、1文字情報が文字情報の先頭であると判定したとき、この1文字情報と後方の分割文字情報と連結して複合語とし、1文字情報が文字情報の途中であると判定したとき、この1文字情報は前方の分割文字情報と連結して複合語とする文字情報連結手段と、
前記文字情報連結手段で複合語とした分割文字情報を含み、前記文字情報分割手段において分割した2文字以上の分割文字情報を索引用の文字列として特定する文字列特定手段と、
前記文字情報分割手段で分割した前記サービス情報の前記第1記憶手段での記憶位置を特定する検索位置特定情報を特定し、前記文字列特定手段で特定した文字列と、特定したこの検索位置特定情報と、を互いに関連付けて記憶する第2記憶手段を作成する索引情報作成手段と、
前記サービス情報を検索するための文字列の入力を受け付ける文字列情報受付手段と、
前記文字列情報受付手段で受け付けた文字列に基づき、前記索引情報作成手段で作成した前記第2記憶手段を参照して検索位置特定情報を特定する検索位置情報特定手段と、
前記検索位置情報特定手段で特定した検索位置特定情報に基づき、前記第1記憶手段を参照してサービス情報を特定し、抽出するサービス情報検索手段と、
前記サービス情報検索手段で抽出したサービス情報を出力するサービス情報出力手段と、
を備えることを特徴とする情報検索装置。
【請求項2】
前記文字情報連結手段は、前記文字情報分割手段において分割した文字情報の前記サービス情報内での属性区分を判定し、この属性区分が名称であるとき、前記1文字情報の文字情報中での位置に基づいた連結を行う、
ことを特徴とする請求項1に記載の情報検索装置。
【請求項3】
サービス情報を記憶し、その記憶位置を特定する検索位置特定情報と、前記サービス情報と、を互いに関連付けて記憶する第1記憶手段、を備え、情報検索装置において、検索対象となる所定の情報群より、指定された文字列に対応するサービス情報を効率良く円滑に探し出す検索を行う情報検索方法であって、
前記情報検索装置が、前記サービス情報に含まれる文字情報を適宜分割する第1ステップと、
前記情報検索装置において、前記第1ステップで分割した後の各文字情報(以下、「分割文字情報」という。)の文字数を算出し、1文字からなる分割文字情報(以下、「1文字情報」という。)を特定すると共に、特定した1文字情報の文字情報中での位置を判定する第2ステップと、
前記情報検索装置において、前記第2ステップにおいて、1文字情報が文字情報の先頭であると判定したとき、この1文字情報と後方の分割文字情報と連結して複合語とし、1文字情報が文字情報の途中であると判定したとき、この1文字情報は前方の分割文字情報と連結して複合語とする3ステップと、
前記情報検索装置において、前記第3ステップで複合語とした分割文字情報を含み、前記第1ステップにおいて分割した2文字以上の分割文字情報を索引用の文字列として特定する第4ステップと、
前記情報検索装置において、前記第1ステップで分割した前記サービス情報の前記第1記憶手段での記憶位置を特定する検索位置特定情報を特定し、前記第4ステップで特定した文字列と、特定したこの検索位置特定情報と、を互いに関連付けて記憶する第2記憶手段を作成する第5ステップと、
前記情報検索装置において、前記サービス情報を検索するための文字列の入力を受け付ける第6ステップと、
前記情報検索装置において、前記第6ステップで受け付けた文字列に基づき、前記第5ステップで作成した前記第2記憶手段を参照して検索位置特定情報を特定する第7ステップと、
前記情報検索装置において、前記第7ステップで特定した検索位置特定情報に基づき、前記第1記憶手段を参照してサービス情報を特定し、抽出する第8ステップと、
前記第8ステップで抽出したサービス情報を前記情報検索装置より出力する第9ステップと、
を含むことを特徴とする情報検索方法。
【請求項4】
前記第3ステップは、前記第1ステップにおいて分割した文字情報の前記サービス情報内での属性区分を判定し、この属性区分が名称であるとき、前記1文字情報の文字情報中での位置に基づいた連結を行う、
ことを特徴とする請求項3に記載の情報検索方法。
【請求項5】
サービス情報を記憶し、その記憶位置を特定する検索位置特定情報と、前記サービス情報と、を互いに関連付けて記憶する第1記憶手段、を備え、検索対象となる所定の情報群より、指定された文字列に対応するサービス情報を効率良く円滑に探し出す検索を行うことを実行させるためにコンピュータを、
前記サービス情報に含まれる文字情報を適宜分割する手段、
分割した後の前記各文字情報(以下、「分割文字情報」という。)の文字数を算出し、1文字からなる分割文字情報(以下、「1文字情報」という。)を特定すると共に、特定した1文字情報の文字情報中での位置を判定する手段、
前記1文字情報が文字情報の先頭であると判定したとき、この1文字情報と後方の分割文字情報と連結して複合語とし、前記1文字情報が文字情報の途中であると判定したとき、この1文字情報は前方の分割文字情報と連結して複合語とする手段、
前記複合語とした分割文字情報を含み、前記分割した2文字以上の分割文字情報を索引用の文字列として特定する手段、
分割した前記サービス情報の前記第1記憶手段での記憶位置を特定する検索位置特定情報を特定し、特定した前記文字列と、特定したこの検索位置特定情報と、を互いに関連付けて記憶する第2記憶手段を作成する手段、
前記サービス情報を検索するための文字列の入力を受け付ける手段、
受け付けた前記文字列に基づき、作成した前記第2記憶手段を参照して検索位置特定情報を特定する手段、
特定した前記検索位置特定情報に基づき、前記第1記憶手段を参照してサービス情報を特定し、抽出する手段、
抽出した前記サービス情報を出力する手段、
として機能させることを特徴とするコンピュータプログラム。
【請求項6】
前記コンピュータを、
分割した前記文字情報の前記サービス情報内での属性区分を判定し、この属性区分が名称であるとき、前記1文字情報の文字情報中での位置に基づいた連結を行う手段、
としてさらに機能させることを特徴とする請求項5に記載のコンピュータプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2009−271868(P2009−271868A)
【公開日】平成21年11月19日(2009.11.19)
【国際特許分類】
【出願番号】特願2008−124047(P2008−124047)
【出願日】平成20年5月9日(2008.5.9)
【出願人】(507052430)キャンバスマップル株式会社 (77)
【Fターム(参考)】