説明

情報案内システムおよびその認識辞書データベース更新方法

【課題】音声認識による検索で認識辞書データベースに記録された名称を知らなくても所望の検索ができるように関連する語彙を効率よく蓄積する。
【解決手段】音声検索部17が音声信号より認識辞書データベース13に記憶された施設名称等のキーワードを認識し、その認識結果に基づいてナビゲーション機能部19が当該施設への経路案内情報を生成してスピーカ・ディスプレイ16で提示する。情報センター2の関連語彙収集部21は認識辞書データベースに予め記憶された初期キーワードに意味的な関連性をもつ関連キーワードをWEB情報から収集する。ナビゲーション装置の起動時にその辞書更新部18が、関連語彙収集部で収集した関連キーワードを認識辞書データベースに追加することにより、音声検索部は初期キーワードと関連キーワードとを認識対象とするので、ユーザがその正式な名称を知らない場合でも、所望の施設を検索することができる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声認識により認識辞書データベースに記憶されたキーワードを認識して、案内情報を提供する情報案内システムおよびこれに用いる認識辞書データベースの更新方法に関する。
【背景技術】
【0002】
従来から、ユーザの発話を音声認識技術によって認識し、認識結果に応じて情報提供や機器操作を行うような音声インタフェースが知られており、このような音声インタフェースは、例えば自動車のナビゲーションシステムや電話応答システムであるIVR(Interactive Voice Response:音声自動応答装置)等に適用されている。
こうしたシステムでよく利用されるサービスに、施設の検索がある。
これは、ユーザが施設名称、あるいは施設のある都道府県、施設の種別などを発話し、これをシステムが認識・検索することで、所望の施設の場所へのナビゲーション、電話接続などのサービスを提供するものである。
こうした施設の検索では、各施設に関連する情報が多く、また更新頻度も早いことから、情報の鮮度が保てないという課題がある。
【0003】
そこで、例えば特開2001−289661号公報には、常に最新の情報で施設を検索できるよう、インターネットの情報を伴う音声検索によって、最新の情報で施設を検索するようにしたものが提案されている。
これは、ユーザが検索したい施設の条件を指定すると、ホームページなどインターネットコンテンツからの施設のイベントや料金、天候情報などを加味して、合致する施設を抽出して案内するものである。
これにより、所望の目的はおおよそ決まっているが、施設名称は確定していない場合に、適切な施設が推薦されるので、利便性が高まる。
【特許文献1】特開2001−289661号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
一方、検索したい施設がユーザの中では既に確定しており、このユーザが欲する施設を検索する場合には、認識辞書データベースに記載された認識語彙、すなわち施設名称を発話することが前提となる。
ところがこの認識辞書データベースは、各施設主が公的機関等に申請した名称を使用して作成されている。したがってユーザが所望の検索結果を得るためには、認識辞書データベース上に記録された施設名称をユーザが正しく発話する必要がある。
【0005】
このため、施設の略称やその施設の特徴的なキーワードをユーザが覚えていたとしても、正確な語彙(正しい施設名称)を覚えていない場合には、ユーザが所望する施設の検索を行うことができない。
たとえば鎌倉にある寺社「名月院」は、「あじさいで有名な寺」として広く知られており、別名「あじさい寺」とも呼ばれているので、ユーザが「鎌倉にあじさいで有名な寺」があることは知っていても、その寺社の正式名が「名月院」であることを知らない場合には、施設の検索ができないこととなる。
【0006】
したがって本発明は、上記の問題点に鑑み、認識辞書データベースに記録された名称を知らない場合でも、効率よく認識辞書データベースの更新を行って関連する語彙を蓄積し、ユーザが所望する検索を行うことができる情報案内システムおよびその認識辞書データベースの更新方法を提供することを目的とする。
【課題を解決するための手段】
【0007】
本発明は、認識辞書データベースにあらかじめ記憶された初期キーワードに意味的な関連性をもつ関連キーワードをWEB情報から収集し、収集した関連キーワードを所定のタイミングで認識辞書データベースに追加して、音声認識対象を増すものとした。
【発明の効果】
【0008】
本発明によれば、正確な語彙を知らないユーザであっても、認識辞書データベースが初期キーワードに関連する関連キーワードで自動的に更新されるから、認識辞書データベースに含まれる初期キーワードおよび関連キーワードを認識対象として、ユーザが所望する目的の情報検索が可能となる。
【発明を実施するための最良の形態】
【0009】
次に本発明の実施の形態を実施例により説明する。
図1は本発明をナビゲーションシステムに適用した実施例の全体構成を示す。
不図示の車両に搭載されたクライアント側のナビゲーション装置1と、ナビゲーション装置1からアクセス可能な情報センター2と、情報センター2が通信を行いWEB情報(インターネット上のドキュメント情報)の取得を行うためのインターネット3とよりナビゲーションシステム5が構成される。
本実施例ではナビゲーション装置1によりナビゲーション情報として施設の案内を行う場合を例に説明する。
【0010】
まず、ナビゲーション装置1は、マイクロフォン10と、AD変換部11と、演算部12と、認識辞書データベース(認識辞書DB)13と、通信部14と、DA変換部15と、スピーカ・ディスプレイ16と、現在位置取得部50とより構成されている。
マイクロフォン10は、ユーザが検索のために発話した音声を取得するためのものである。
現在位置取得部50は、不図示のGPS(Global Positioning System)信号受信アンテナによって受信したGPS信号などより、自車両の現在位置を取得するものである。
【0011】
AD変換部11は、マイクロフォン10で取得された信号をアナログ信号からデジタル信号に変換し、演算部12に出力する。
なお、マイクロフォン10はユーザからの音声信号の他、車両内外で発生している雑音やオーディオ、ナビゲーションシステム等から出力される音信号も拾う可能性があるので、雑音等を排して音声信号を精度よく取得するための手段を併設するのが好ましい。
【0012】
その例としては、(1)マイクロフォン10とAD変換部11、もしくはAD変換部11と演算部12との間に、音信号中の非目的成分を弱めるためのフィルタを設ける、(2)ゲイン調整機構を設けて入力信号のパワー(ゲイン)が適切となるよう増幅量を調整する、(3)入力信号のパワー変化等に基づき入力信号中で音声の含まれる区間を正確に切り出す音声抽出(VAD:Voice Activity Detection)機構を設ける、(4)オーディオシステムやナビゲーションシステムから出力される音信号を打ち消すエコーキャンセリング機構を設ける、(5)指向性の強いマイクロフォンを用いたりマイクロフォンを複数用いたマイクロフォンアレーなどを用いて、音信号の種類や方向に応じた信号強調・減衰処理を設けるなどがある。これらにより、音声認識の対象でない雑音や入力音を排除し、目的の音声信号を優先的に取得できる。
【0013】
演算部12は、CPU、MPU、DSP、FPGA等の一般的な動作回路を組み合わせて、音声検索部17と、辞書更新部18と、ナビゲーション機能部19とより構成されている。
音声検索部17は、マイクロフォン10を介してユーザから取得した発話音声の一部、あるいは全てについて、認識辞書データベース13に記憶された語彙(キーワード)との比較・照合を行い、一致度の高い尤もらしい語彙の一つあるいは複数を認識結果として取得する。
【0014】
なお、音声検索部17による、音声認識処理における発話音声と認識辞書データベース13に記憶された情報との比較には、特徴量を用いることができる。特徴量としては、LPCケプストラム、LPCデルタケプストラム、メルケプストラム、対数パワー等を組み合わせた時系列ベクトルデータが知られている。
音声検索部17はまた、ユーザの音声および手操作による施設検索利用履歴を監視し、地域別に利用頻度を記録する機能を備えている。
【0015】
辞書更新部18は、認識辞書データベース13に記憶された関連キーワード(詳しくは後述する)の更新タイミングの判断、更新内容・更新範囲の制御、通信部14を用いた更新情報の取得、そして認識辞書データベース13の更新処理を行うものである。
通信部14が扱う通信網としては、携帯電話網、UWB、DSRC、無線LAN、地上波データ放送、衛星放送波等があり、通信を行うために適切なものを選択すればよい。
【0016】
ナビゲーション機能部19は、基本機能として、走行履歴等を蓄積・解析する機能を有する。そして、音声検索部17によって認識された音声を目的地として受け付け、さらに目的地の履歴を記憶したり、例えば経由地として入力された登録位置を受け付け、また認識辞書データベース13に記憶された施設名などを目的地や登録位置として受け付けて、現在位置取得部50によって取得された自車両の現在位置などにもとづいて、自車両の経路を案内する案内情報を生成する。
【0017】
認識辞書データベース13は、音声検索部17による音声認識処理において、認識対象となる初期キーワードおよび該初期キーワードと関連性の高い語彙である関連キーワードを、その関連度と共に記憶するものである。
認識辞書データベース13としては、キャッシュメモリ、メインメモリ、HDD、CD、MD、DVD、光ディスク、FDD等、一般的な記憶媒体が使用される。
【0018】
認識辞書データベース13には、図2に示すように、初期キーワードとしての施設名称に付随する形で、その施設種別、経度・緯度の位置情報、郵便番号、住所、電話番号が記録され、更に、関連キーワードが記録される。
なお、図2の関連キーワードの欄は、追加されていない状態を示してあり、全てNULLとなっている。
また本実施例において、認識辞書データベース13は関連キーワードが更新されるたびに記憶内容が変更されるため、更新毎にデータベースのバージョンを示す辞書バージョンIDが記録される。
【0019】
音声認識処理では、音響辞書と言語辞書とから構成される認識辞書を用いて音声の比較・照合処理が行われる。
音響辞書は、音響モデルとも呼ばれ、言語の音響的特徴量を、例えば隠れマルコフモデル(HMM:Hidden Markov Model)等の形式で記録したものである。
一方の言語辞書は、言語モデルとも呼ばれ、認識させるキーワードを、単語の列記、あるいは単語の接続の定義として記録したものである。
【0020】
さらに言語辞書としては、認識させるキーワードおよびその接続関係をネットワークとして明示的に記述するネットワーク型言語モデルと、個々の単語の出現確率および単語同士の接続確率を膨大なテキストデータ(テキストコーパス)の解析から自動的に決定する統計確率型言語モデル(統計モデル、n−gram)が知られている。
本実施例では、言語モデルの形式に制限されるものではないが、認識させたいキーワードは案内可能な施設に限定するため、ネットワーク型言語モデルが比較的に適している。ネットワーク型言語モデルに用いられる認識語彙は、目的地を含む地域名あるいは目的施設のジャンル等から最終の目的地に至る階層構造で表現される。
【0021】
ここで、言語モデルの一例を図3に示す。
この例では、ネットワーク型の言語モデルとして、図2の認識辞書データベースのうち、住所の都道府県、市区町村、初期キーワード、関連キーワードの項目を自由に組み合わせた発話が認識可能なように構成されている。なお、ガベージモデル(Garbage)と組み合わせられて、発話中の間投詞や言い直しなどはスキップされる。
本言語モデルによって、例えば、「神奈川県の○○」のように、複合検索条件を認識することが可能であり、その認識結果を「検索キー」として、認識辞書データベースから候補を抽出することで、所望の検索結果すなわち施設名称を得ることが可能である。
なお、同様にして、電話番号や郵便番号を組み合わせた発話を認識する言語モデルを生成することも可能である。
【0022】
また本実施例では、関連キーワードを更新することを特徴とし、具体的には図2の関連キーワード(図2では全てNULLとなっている)を更新することに相当する。また、認識辞書データベースが更新を受けた場合には、図3に示した言語モデルの関連キーワード(図3では全て空値(NULL)となっている)も自動的に更新される。
【0023】
スピーカ・ディスプレイ16は、音声検索部17による検索結果をユーザに対し音声または映像によって提示するものである。
また検索結果の提示後は、ナビゲーション機能部19は提示した内容に応じてさらにユーザからの入力を促し、入力に応じた制御に遷移できる構成となっている。
例えば音声検索部17による検索の結果、複数の施設が候補として得られ、該候補をスピーカ・ディスプレイ16を通じて提示してユーザに選択を促したあと、ユーザの選択によって一意の施設に絞られた場合には、ナビゲーション機能部19は選択された施設の詳細説明情報の提示、地図の表示、ルート案内、電話機能などの制御を行う。
【0024】
情報センター2は、通信部20と、関連語彙収集部21と、関連キーワードデータベース22とを備える。
通信部20は、ナビゲーション装置1の通信部14と通信を行うためのものである。
関連語彙収集部21は、インターネット3と接続可能であり、インターネット3上に存在するWEB情報30を取得可能となっている。
具体的には関連語彙収集部21は、WEB情報30から、初期キーワードをキーとしたテキスト解析を行い、初期キーワードに関連性の高い関連キーワードを抽出する。
【0025】
また関連語彙収集部21は、ナビゲーション装置1から送信された辞書更新部18からの更新要求を通信部20を通じて受付け、更新要求に対して抽出した関連キーワードを通信部20、通信部14を通じて辞書更新部18へ返信する。
なお、関連語彙収集部21は、情報センターにおいて手入力によりインターネット検索が行われた際の検索キーワードと到達したWEBページの記録を蓄積するようになっている。
この関連語彙収集部21の詳細な関連語彙収集方法については後述する。
【0026】
関連キーワードデータベース22は、初期キーワードと、それに付随する関連キーワードなどが記録される。この初期キーワードは、上述の認識辞書データベース13が保持する初期キーワードと同一である。
関連キーワードデータベース22が記録するデータの具体例を図4に示す。図4の例では、初期キーワード、関連キーワードのほか、施設種別および住所、関連キーワードの関連度、バージョンID等が記録されている。
これらのデータは関連キーワードの新たな収集および更新処理を効率的に行うために用いることができる。
【0027】
次に、関連語彙収集部21における具体的な関連キーワード収集処理として、WEBページそのものに含まれるテキスト情報を用いて収集する例について説明する。
ここでは、図4に示した関連キーワードデータベース22に登録された初期キーワードを検索キーとして、インターネット3上のWEB情報30の検索を行う。
検索結果として取得されたWEB情報30のWEBページのうち、上位所定のページ(例えば上位20ページなど)を解析対象とし、WEBページ内のテキスト情報の解析処理を行う。
なお初回の関連語彙収集時点では、図4における関連キーワード、関連度、およびバージョンID(タイムスタンプ)のデータはNULLとなっている。
【0028】
ここで、WEB情報30のWEBページから解析したいものは、初期キーワードである施設名称についての関連キーワードである。
したがって、解析すべきWEBページは、該施設について言及しているページであることが望ましい。
しかしながら、検索結果のWEB情報中には対象とすべきではないWEBページが含まれていることがある。
例えば、「A寺」という寺社についての関連キーワードを抽出するために、「A寺」をキーとしてWEB検索を行った場合、「A寺駅」、「A寺高校」のような、初期キーワードを包含する別の施設のWEBページが該当してしまうことがある。また、「A寺」と同名の地域名称「X県Y市A寺」が存在する場合も考えられる。
【0029】
こうしたWEBページを「A寺」用の関連キーワード解析対象としてしまうと、「A寺」にはふさわしくない関連キーワードが抽出されてしまう可能性がある。
そこでこれを避けるために関連語彙収集部21は、施設種別や住所といった情報を付随して収集し、これらの施設種別や住所などの情報を用いて、検索で得られたWEBページについてフィルタリング(ふさわしくないWEBページを解析対象から除外する処理)を施す。
【0030】
具体的には「A寺」の例で言えば、「寺」以外の施設種別である「学校」や「駅」といったテキストが所定値以上の頻度で出現するWEBページは、「A寺」について言及するページではない可能性が高いため、解析から排除する。
同様に、住所情報でチェックすることにより、「X県Y市A寺」のようなテキストが所定値以上の頻度で出現するページは「A寺」について言及するページではない可能性が高いと見て排除する。
【0031】
上記フィルタリング処理により、解析対象となるWEBページが決定したら、関連語彙収集部21はさらに、該WEBページ内に含まれるテキスト情報の解析処理を行って、関連キーワードを抽出する。解析方法としては、一般的な形態素解析、構文解析で用いられる方法が適用できる。
関連キーワードの抽出にはいくつかの方法がある。
第1の方法は、テキスト解析で得た単語の出現頻度によるものである。
すなわち、単語分割処理により、文章を単語に分割、品詞を振り分け、間投詞、助詞、接続詞のような不要語を消去して、名詞、動詞、形容詞など施設の別名や施設へのイメージに繋がるキーワードとなりうる品詞のみを抽出し、単語(語彙)毎の頻度を算出する。
そして、解析対象となる全てのWEBページについて、単語の頻度を積算した結果、頻度が所定以上となった単語、あるいは全てのページのテキスト量から相対値として見た出現頻度が所定以上となった単語を関連キーワードとして抽出する。
ここで、検索キーとして用いた初期キーワードはもちろん除外される。
【0032】
なお、単純に出現頻度をカウントすると、時として関連キーワードとしてはふさわしくない単語が高頻度に出現していることが考えられる。このため、以下の種々の処理を組み合わせて、抽出精度を高めることができる。
例えば、施設の営業時間などがWEBページに記載されていることが多く、「営業時間」、「拝観時間」、「○○時〜○○時」といったキーワードが高頻度に計上され、関連キーワードになってしまう場合がある。
そこで、こうした例外語彙を予め用意しておき、定期的に検査して例外語彙をメンテナンスすることで、これらを排除するようにすることが好ましい。
【0033】
第2の方法としては、抽出精度を高めるため、初めから「特定の言い回しを伴って出現した単語」のみをカウントするものである。
特定の言い回しとしては、「〜と言えば」、「〜で(が)(として)有名」、「〜で(が)(として)著名」、「〜で(が)(として)名高い」、「〜の代名詞」、「〜で(として)親しまれる」、「〜で(として)知られる」、「〜と(とも)呼ばれる」、「別名〜」、「別称〜」、「愛称〜」、「略称〜」、「通称〜」、「略して〜」等が考えられる。
これらの言い回しと共に出現した単語(上記の“〜”に相当する単語)のみをカウントすることで、別名や施設のイメージとなる関連キーワードを精度よく絞ることができる。
【0034】
さらに、第3の方法として、初期キーワードに対する関連キーワードの関連性を「関連度」として算出し、その積算値によって関連キーワードの選択を行うことができる。
関連度は、「ある施設を探す時に連想する言葉」を反映した数値であり、関連度が高い単語とは「検索時に発話しやすいキーワード」と言える。この関連度は、上記の出現頻度に加え、上述の特定の言い回しを伴っての出現や、後述する各種情報を加味して算出される値であり、抽出された関連キーワードの優先順位を決める「重み係数」と捉えることができる。
例えば関連キーワードデータベース22の記憶容量は有限のため、関連キーワードを無数に登録することはできない。そこで、関連度が高いものから採用(記憶)することによって、ユーザの利便性と記憶容量の両立が可能となる。
【0035】
関連度の算出の具体例としては、(1)WEB情報30上で、特定の言い回しを伴い出現したキーワードを、それ以外のキーワードより関連度を高く設定する、(2)WEBページ中の出現位置の情報を加味し、ページ上段に位置するキーワードほど関連度を高く設定する、(3)WEBページ全体の文章レイアウト、段落構成から見出し部分を判別し関連度を高く設定するなどがある。
さらに、(4)テキスト中に対象の初期キーワードそのものが存在した場合に、該初期キーワードからの距離、すなわち、初期キーワードと対象キーワードとの間に含まれる単語数、あるいは文字数が少ない程、関連度を高く設定する、(5)大きなフォントサイズ、ボールド体フォント、下線、文字色が周囲と異なる等、強調表現がなされているキーワードに対して、関連度を高く設定するなどもある。
【0036】
上記の関連度設定方法を反映した関連度の算出式を以下に示す。
キーワード“KW”のカウント値をCount(KW)、i番目に現れたキーワード“KW”をKW(i)で表すと、
Count(KW)=Σi=1(1+IFα(KW(i))*α+IFβ(KW(i))*β+IFγ(KW(i))*γ+・・・)
となる。
ただし、IFα(KW(i))、IFβ(KW(i))、IFγ(KW(i))・・・は、上述したキーワード(KW(i))について関連度を高く設定する際の条件とする。
関連度を高く設定する際の条件が成立している場合には、成立している条件(IFα(KW(i))、IFβ(KW(i))、IFγ(KW(i))・・・)を1とする。
したがって、ある条件が成立した場合には、そのキーワード(KW)のカウント値(Count(KW))にはボーナスα、β、γ・・・が加算される。
一方、どの条件にも当てはまらず、単純にキーワード“KW”が出現していた時には、ボーナス部分は全て0となるため、1がカウント値(Count(KW))として算出される。
【0037】
こうして得られたキーワード“KW”のカウント値(Count(KW))を、次式のように全てのキーワード(KW=1〜n)に対するカウント値で割ることで、キーワード“KW”の関連度を算出する。
Cor(KW)=Count(KW)/ΣKW=1(Count(KW))
なお、ボーナスα、β、γ・・・はWEBテキスト解析を行いながら実験的に算出することで、条件(関連度を高く設定するための条件)毎に調整するのが望ましい。
図4および後述する図5の関連キーワードデータベース22のデータは上記の関連度によって抽出した例を示している。
関連度はまた、音声検索部17がマイクロフォン10を通じて入力されたユーザの音声を認識する際に、この関連度を加味し、関連度の高い関連キーワードが、関連度の低いキーワードよりも認識されやすくするといった利用も可能である。
【0038】
次に、関連語彙収集部21が、関連キーワードを収集するタイミングについて説明する。
本実施例においては、関連語彙収集部21が情報センター2に配置され、車載のナビゲーション装置1とは分離された構成であるため、関連キーワードの収集処理を常時実行することが可能であり、また任意のタイミングでも可能である。
【0039】
一例として、関連語彙収集部21は、上述したWEB情報の検索結果自体に変化がないか、そしてWEBページのテキスト情報に変化がないかを、例えば1日一回等、定期的に実行し監視するようにしてもよい。そして、変化があった場合には、変化のあったWEBページについてのみ、テキスト解析を行う。
前回の検索で抽出されたWEBページのアドレスおよびそのページ内容をキャッシュしておいて、新規検索の結果と前回までの検索結果の差分をとることにより、差分となったWEBページについて解析処理を行い、新規収集の関連キーワードとして更新することができる。
【0040】
なお、WEBページのテキスト内容自体をキャッシュして比較するには大きな記憶容量が必要となるが、インターネットで活用されているWEBページの更新情報の表現形式であるRSS(Rich Site Summery)等を使えば、当該WEBページの更新部分のみを知ることが可能である。
【0041】
さらに他の収集タイミングとしては、情報センター2の十分に計算速度の速いサーバ機能および十分に早い通信環境を前提として、ナビゲーション装置1側から辞書更新命令を受けたタイミングで関連語彙収集部21がWEB検索を行って関連キーワード抽出処理までを実行し、その結果をナビゲーション装置1側に返答するようにしてもよい。
【0042】
次に、ナビゲーション装置1の辞書更新部18における辞書更新方法について説明する。
ここでは、更新する情報の受け渡しを通信部14、20を介して行うので、通信量削減の観点から、差分更新を行う。
図4に示す関連キーワードデータベース22に記憶された情報では、関連キーワードごとに、バージョンIDとしてタイムスタンプ情報が記録されており、図2に示す認識辞書データベース13には現在の辞書バージョンIDが記録されているので、関連キーワードのそれぞれのバージョンを比較することで、差分のみを通信することができる。
【0043】
このため、辞書更新部18は、辞書更新の命令とともに、認識辞書データベース13の辞書バージョンIDを情報センター2の関連語彙収集部21へ送信する。
関連語彙収集部21では、関連キーワードデータベース22を参照し、受信した認識辞書データベース13の辞書バージョンIDと、関連キーワードデータベース22の各関連キーワードのバージョンIDとを比較し、関連キーワードデータベース22内の認識辞書データベース13の辞書バージョンIDよりも新規に更新された関連キーワードを抽出する。
【0044】
図2に示した認識辞書データベース13の例では辞書バージョンIDが20071201000000であるため、図4に示した関連キーワードデータベース22からはバージョンIDが斜線を付した20071201000000以上の関連キーワードを更新対象として抽出する。
対象となる関連キーワードを抽出すると、関連語彙収集部21は当該関連キーワードを関連語彙更新情報としてナビゲーション装置1の辞書更新部18へ送信する。
辞書更新部18は、受信した関連キーワードを認識辞書データベース13に登録する。
【0045】
この結果、例えば図5に示すように、辞書バージョンIDが最新となり、新たな関連キーワード(図5中で太字で示す関連キーワード)が追加される。
追加された関連キーワードを用いた言語モデルの例を図6に示す。図3の言語モデルではNULLであった関連キーワードの登録語彙に、新たな関連キーワード(あじさい寺、横浜マリノス・・・)が追加されており、該キーワードを認識語彙とした音声検索部17による音声検索が可能になる。
【0046】
なお辞書更新の頻度、あるいはタイミングであるが、全国の施設は無数にあるため、全ての施設に対して関連キーワードを取得するためには、記憶容量、通信速度、データ更新処理速度等、全ての条件が高次元で達成されていなければならない。
しかしながら、カーナビゲーション装置での利用の場合には、ある特定のユーザによって全国の施設が目的地に設定される可能性は高くない。
また、解析された関連キーワードも、1日のうちに何度も更新する必要性はない。
そこで、住む地域やユーザの個人性によって、検索される地域をある程度限定でき、更新の頻度も、ナビゲーション装置1が利用される1トリップについて1回程度で十分と考えられる。
【0047】
したがって、車両のエンジン始動のためイグニションスイッチがONされ、ナビゲーション装置1が起動した時点を通常の更新タイミングとする。
なお、情報センター2は常時作動しているため、ナビゲーション装置1の起動がナビゲーションシステムとしての起動となる。
1日のうちに複数回イグニションスイッチのON、OFFを繰り返すケースでは、日付が同じであれば更新しないようにしてもよい。
【0048】
また、更新地域を、現在認識辞書データベース13に保持している関連キーワードの地域範囲の一部であるユーザの住む地域やよく利用する地域に限定し、該地域を越えた時を更新タイミングとする。
例えば、図7に示すように、エンジンが始動されてナビゲーション装置1が起動した地点(あるいは自宅として登録してある地点)をP00、過去に検索した施設あるいは登録してある地点をP01、P02、P03であるとするとき、起動時点P00では、各地点P00〜P03から所定距離の地域を更新範囲A00、A01、A02、A03とする。
さらには、地点P00から地点P01、P02、P03までのルートをR01、R02、R03とし、この地域についても更新範囲としてもよい。
【0049】
このように、ナビゲーション装置起動時に辞書更新部18は、情報センター2の関連語彙収集部21と通信を行うことによって、更新範囲A00、A01、A02、A03やルートR01、R02、R03を対象範囲として、認識辞書データベース13における関連キーワードの更新を行う。
なお図7の例では、各地点P00〜P03から所定距離地域、すなわち円状の領域を更新範A00〜A03としているが、各地点が所属する都道府県やその近隣県といった行政区域も更新範囲としてもよい。
そのほか、地点が登録されていなくとも、走行履歴にもとづいて利用地域を解析し、該地域を更新対象地域とすることも可能である。
【0050】
次に、辞書更新について、とくに辞書更新部18と関連語彙収集部21間における具体的な処理を図8のフローチャートを用いて説明する。
ここでは、現在位置、登録位置、履歴位置情報に基づいて、関連キーワードの更新処理を行うものとする。
前述のように、この更新処理はイグニションスイッチがONされてナビゲーション装置1が起動すると開始される。
まずステップ100において、辞書更新部18は、現在位置取得部50より自車両の現在位置を取得する。
【0051】
ステップ101において辞書更新部18は、起動後にすでに辞書更新を実行したかどうかをチェックする。これは辞書更新の有無を示すフラグを用いるなどにより判断できる。今回が初めての辞書更新処理であれば、ステップ103へ進み、すでに辞書更新処理を1回行っていればステップ102へ進む。
ステップ103では、辞書更新部18は、ナビゲーション機能部19より登録位置、目的地の履歴位置情報を取得する。
そしてステップ104において、辞書更新部18は、取得した登録位置、履歴位置を、音声検索部17が施設検索利用履歴に基づいて記録している地域別の利用頻度を参照して、利用頻度が所定値以上のものに絞る。
【0052】
ステップ105において辞書更新部18は、認識辞書データベース13に記録された辞書バージョンIDを取得する。
このあと、ステップ106において、辞書更新部18は、取得した現在位置、認識辞書データベース13の辞書バージョンID、および利用頻度が所定値以上のものに絞った登録位置、履歴位置情報の各データを情報センター2の関連語彙収集部21へ送信する。
【0053】
ステップ107において関連語彙収集部21は、辞書更新部18から受信した現在位置、登録位置、履歴位置情報にもとづき、関連キーワードデータベース22を参照して更新対象となるデータ範囲を選択する。
例えば、送信された情報に含まれた施設名称、緯度・経度情報や都道府県情報などの初期キーワードが、関連キーワードデータベース22に記憶された情報に含まれていれば、当該初期キーワードを含む情報を更新対象データ範囲として選択する。
ステップ108において関連語彙収集部21は、ステップ107で選択した更新対象データ範囲に該当する関連キーワードのバージョンIDを読み出す。
【0054】
ステップ109において関連語彙収集部21は、関連キーワードのバージョンIDと、受信した認識辞書データベース13の辞書バージョンIDとを比較し、差分データが存在するかどうかを判断する。
具体的には、認識辞書データベース13の辞書バージョンIDよりも新しい関連キーワードのバージョンIDが存在する場合にはステップ110へ進み、存在しないときはステップ100へ戻る。
ステップ110において関連語彙収集部21は、認識辞書データベース13の辞書バージョンIDよりも新しいバージョンIDを有する関連キーワードを更新対象の関連キーワードとして抽出する。
【0055】
ステップ111において関連語彙収集部21は、ステップ110で抽出した関連キーワードをナビゲーション装置1の辞書更新部18へ送信する。
ステップ112において辞書更新部18は、関連語彙収集部21から受信した更新対象の関連キーワードを認識辞書データベース13に新規の関連キーワードとして追加する。同時に、認識辞書データベース13の辞書バージョンIDを、受信した関連キーワードの最新のバージョンIDで更新する。
ここで、ナビゲーション装置1は音声検索部17による音声検索の待機状態となる。
ステップ112のあと、ステップ100へ戻る。
【0056】
次回のフローにおいては、すでに辞書更新を実行しているので、ステップ101からステップ102へ進む。
ステップ102において、辞書更新部18は、ステップ100で取得した自車両の現在位置が、予め設定してある所定の領域を超えたかどうかをチェックする。
自車両の現在位置が当該所定の領域を超えていないときはステップ100へ戻り、所定の領域を超えたときはステップ103へ進む。
以上の流れにより、ナビゲーション装置1が起動するとまず1回だけ認識辞書データベース13における関連キーワードの更新が実行され、その後ナビゲーション装置1が作動中の間は自車両の現在位置が所定の領域を超えたときにあらためて関連キーワードの更新が実行されることになる。
【0057】
なお、関連キーワードが更新され増加するに伴い、ある関連キーワードに対して複数の初期キーワードすなわち施設名称が該当する、いわゆる関連キーワードの重複が起こる可能性が出てくる。
この場合には、音声検索部17は認識された関連キーワードでデータベースを検索した際に、重複した初期キーワード、すなわち複数の施設名称をスピーカ・ディスプレイ16により提示して、対話形式でユーザが選択できるようにする。
【0058】
本実施例においては、マイクロフォン10およびAD変換部11が発明における音声入力部を構成し、ナビゲーション機能部19が案内情報生成手段に該当し、DA変換部15およびスピーカ・ディスプレイ16が出力部を構成している。
【0059】
本実施例は以上のように構成され、音声認識を行なってユーザの求める情報を提供するナビゲーションシステムにおいて、WEB情報30から初期キーワードに関連する関連キーワードを収集する関連語彙収集部21と、その収集結果を認識辞書データベース13に反映する辞書更新部18を持つ構成となっているため、音声検索部17によって認識辞書データベース13に記憶された初期キーワードおよび関連キーワードを用いた音声検索が可能になり、正式な語彙を知らないユーザであっても、所望の検索結果を得ることができる。
また、あらかじめ関連キーワードを登録する必要が無く、ユーザにとって必要度合いが高いと思われるものに関して、自動で認識辞書データベースの生成、更新を行うことができる。
初期キーワードが施設の名称であるときに、ユーザがその正式な名称を知らない場合であっても、所望の施設を検索することができ、当該施設への経路案内にとくに有効である。
【0060】
とくに、関連語彙収集部21が関連キーワードを収集する際に、WEB検索において出現頻度が所定以上のものを抽出し、または特定の言い回しを伴って出現したキーワードを抽出することにより信頼性の高い関連キーワードを収集することができる。
【0061】
また、初期キーワードの施設名称Aに対して、該施設名称Aを包含する別の施設名称Bあるいは該施設名称Aを包含する地域名称Cが存在する場合には、施設名称Bあるいは地域名称Cを用いて検索されたWEBページを解析対象から除外するものとしたので、施設名が類似の別施設のWEBページや、例えば「国分寺」という寺社に対する「国分寺市」のように施設名と同名の地域のWEBページが存在する場合に、本来の施設のWEBページ以外のページが分析対象外となり、より信頼性が高い関連キーワードを収集することができる。
【0062】
さらに、初期キーワードの施設名称に対応する施設種別以外の施設種別名が所定頻度以上含まれるページを解析対象から除外するものとしたので、施設種別が異なる同名の施設名称が存在しても、それぞれ該当する施設種別以外のWEBページが分析対象外となり、信頼性を向上させることができる。
【0063】
また、関連語彙収集部21が、関連キーワードを収集する際に、その表示位置および表示形式に基づく重み付けを施して算出された関連度を用いることにより、より信頼性の高い関連キーワードを収集することができる。
より具体的には、関連度算出時の重み付けの値について、出現する語彙の表示位置がページ内のタイトル、見出し、およびページ先頭に近い位置にある程大きい値とすることにより、WEBページに含まれる情報のうち、重要な情報を優先的に抽出することができ、関連キーワードの信頼性を向上させることができる。
【0064】
また、関連度算出時の重み付けの値について、出現する語彙の表示位置が初期キーワードの出現位置からの距離が小さいほど大きい値とすることにより、初期キーワードに近接する関連キーワード程優先的に収集され、関連キーワードの信頼性を向上させることができる。
出現位置からの距離として、少なくとも初期キーワードから対象の語彙までに含まれる文字数、形態素数、句数、文数、段落数のいずれかとすることにより、テキスト情報中において、初期キーワードに近接する関連キーワード程優先的に収集することができ、関連キーワードの信頼性を向上させることができる。
【0065】
また、出現する語彙の書式、すなわち文字サイズ、下線の有無、書体等が通常と異なる強調書式であるとき、重み付けを大きく設定することにより、テキスト情報中において、強調された関連キーワードを優先的に収集でき、関連キーワードの信頼性を向上させることができる。
【0066】
さらに、他の関連度の重み付けとして、特定の言い回しに伴って出現した語彙について重み付けを大きく設定することにより、特定の言い回しに伴って出現するような、定型表現的な関連キーワードを効率よく収集することができる。
とくに、特定の言い回しとして、「〜と言えば」、「〜で(が)(として)有名」・・・などは、施設名称等の初期キーワードの別称等を述べるのに典型的に用いられる表現形式であることから、こうした定型句として現れる語彙の重み付けを大きくすることにより、関連キーワードを効率よく収集することができる。
【0067】
また辞書更新部18は、ナビゲーション装置1の起動時あるいはナビゲーション装置1を搭載した車両の現在地が所定の領域を超えた時に、認識辞書データベース13を更新するものとしたので、認識辞書データベースのメモリ容量を抑え、更新回数の不要な増大を抑えながら、最新の関連キーワードを認識辞書データベース13に追加することができる。
【0068】
また、認識辞書データベース13の更新は、認識辞書データベース13に記憶された関連キーワードと関連語彙収集部21が収集した関連キーワードを比較し、変化があった場合に関連語彙収集部21が収集した関連キーワードを用いて認識辞書データベース13を更新するものとしたので、最新の関連キーワードがある場合にのみ更新すれば済む。
とくに、辞書更新部18からは認識辞書データベース13の辞書バージョンIDを関連語彙収集部21へ送信し、関連語彙収集部21は受信した辞書バージョンIDと関連語彙収集部21が収集した関連キーワードのバージョンIDを比較して、辞書バージョンIDより新しいバージョンIDの関連キーワードを抽出して辞書更新部18へ送信するので、辞書更新部18と関連語彙収集部21間の通信量も低減することができる。
【0069】
さらに、更新のため比較する関連キーワードは、登録されまたは過去に検索した地点から所定範囲内に存在する施設名称とすることにより、ユーザが検索する可能性の大きい地域の関連キーワードに限定して認識辞書データベース13を更新することができ、最新の関連キーワードによる音声検索を、低い更新コストで提供することが可能になる。
【0070】
また音声検索部17がユーザの施設検索利用履歴を監視して地域別の利用頻度を記録しているため、辞書更新部18は利用頻度の高い地域についてのみ関連キーワードを更新することにより、ユーザの施設検索の利用実態に合わせ、最新の関連キーワードによる音声検索を提供することができる。
【0071】
また、音声検索部17による音声検索時に、同一の関連キーワードを持つ初期キーワードが存在する場合に、該複数の初期キーワードを選択提示するものとしているので、ユーザは関連キーワードで検索した結果が複数ある場合でも、提示された選択肢から選択することで、所望の検索結果を得ることができる。
【0072】
また、関連語彙収集部21をナビゲーション装置1から離隔した情報センター2に置くことにより、関連語彙収集部21では常時など任意のタイミングで最新の関連キーワードを収集、保持しつつ、クライアントのナビゲーション装置1は利用開始時あるいは必要時のみ認識辞書データベース13更新処理を行うので、低い更新コストで、最新の音声検索用の認識辞書データベースを保持することができる。
【0073】
なお、実施例ではナビゲーション装置1側からの要求で更新処理を開始するが、例えば情報センター2側の関連語彙収集部21から、放送波等に更新情報を含ませるなどして、任意のタイミングでナビゲーション装置1へ関連キーワードの更新情報を送信する構成としてもよい。
【0074】
次に変形例について説明する。
上記実施例は、クライアント側のナビゲーション装置1に音声検索機能を持たせ、情報センター2に関連キーワードの収集および蓄積処理を持たせたクライアントサーバ型の構成としたが、この変形例は、情報センターの機能をナビゲーション装置に統合してスタンドアローン型としたものである。
図9は変形例にかかるナビゲーション装置の全体構成を示す。
図1の実施例に対して、関連キーワードデータベース22を削除し、ナビゲーション装置1Aに関連語彙収集部21を持たせて、ナビゲーション装置1Aでナビゲーションシステムを構成している。
【0075】
辞書更新時には、ナビゲーション装置1A自身の関連語彙収集部21がインターネット3のWEB情報30に接続して関連キーワードを収集し、その結果を用いて直接認識辞書データベース13を更新して音声認識を行うように構成される。
ナビゲーション装置と情報センター間の通信も不要なため、通信部14、20も削除される。
その他の構成は実施例と同じであり、図1と同じ構成については、同一番号を付して説明を省略する。図8のフローチャートのステップ106、111における送信は、通信部14、20を介さない直接の送信と読み替える。
【0076】
本変形例においても、実施例と同様に、音声検索部17によって認識辞書データベース13に記憶された初期キーワードとその関連キーワードを用いた音声検索が可能になり、正式な語彙を知らないユーザであっても、所望の検索結果を得ることができる。
その他、実施例と同じく、段落[0059]〜[0071]に記載した効果を奏する。
また、本変形例はスタンドアローン型の構成のため、収集した関連キーワード等の通信に伴う制約から解放されるという利点を有している。
【0077】
なお、上記実施例および変形例における図8のフローチャートでは、辞書更新のタイミングをナビゲーション装置1の起動時あるいは認識辞書データベース13が保持している関連キーワードの地域範囲の一部に設定した所定の領域を自車両が超えた時としたが、それ以外の更新タイミングとして、認識辞書データベース13が現在保持している関連キーワードの地域範囲を越えた時、音声検索が起動された時、音声検索の結果に十分な認識スコア(一般的な音声認識で用いられる、尤度、対数尤度、事後確率、信頼度といった数値)を持つ候補がなかった時、音声検索の結果がユーザから訂正、否定された時、ユーザから明示的な更新要求があった場合、所定時間経過時(定期更新)など、適宜に設定することができる。
【0078】
とくに、ナビゲーション装置が交通情報や、差分地図情報、各種インターネット情報等を適宜ダウンロード可能で、さらには自車両の走行履歴を定期的にアップロード可能となっている場合には、そのネットワーク接続のタイミングを利用して、例えば通信量の剰余分を認識辞書データベースの更新に利用すれば、認識辞書データベース13内の情報をより効率的に最新の状態に保つことができる。
【0079】
また実施例および変形例では、初期キーワード自体の更新については説明していないが、一般のナビゲーション装置の地図情報更新の方法に準じて初期キーワードも更新可能である。
ナビゲーション装置では地点データ、施設データ、道路データを差分更新するが、認識辞書データベースに関しても、同様に差分更新することができる。
これにより、新規施設等が音声で検索できるようになり、ナビゲーション装置が案内できる施設が増えることになる。
【0080】
上記実施例および変形例においては、辞書更新部18が現在位置、登録位置、履歴位置情報等で特定される利用地域に存在する施設について関連キーワードの更新処理を行うものとしたが、一旦関連キーワードが更新された場合でも、音声検索部17が監視する施設検索利用履歴を参照して、所定期間利用されない地域が存在した場合には、辞書更新部18は当該関連キーワードを初期化することが望ましい。
これにより、利用されない地域の関連キーワードを検索対象から除外することができるので、利用実態の変化に合わせて認識辞書データベース13を更新しつつ、音声検索部17による認識精度が向上するとともに、キーワードの照合に必要なメモリ領域を節約することが可能である。
【0081】
なお、実施例および変形例の関連語彙収集部21における関連キーワード収集処理では、検索結果上位のWEBページ内に含まれているテキストを解析対象としたが、そのほか、第2の方法として、ユーザがインターネットの検索サイトでWEBページを検索する際には、複数の検索キーを組み合わせて検索することも多いので、WEBページを検索する際のユーザの検索キーワードの情報を解析してもよい。
例えば、あじさいで有名な「A公園」があった場合に、検索キーとして、「A公園 あじさい」で検索したとすると、この情報はユーザが「A公園」と「あじさい」を関連するキーワードとして認識していることの表れであり、関連キーワードを抽出するのに非常に適した情報といえる。
【0082】
そこで、初期キーワード(この場合は「A公園」)と共に利用された検索キー(共起キーワード)を蓄積し、その頻度上位を関連キーワードとして抽出するものとする。抽出基準の頻度値は検索キーの数に応じたパーセンテージなどで設定しておく。
これにより、ユーザが特定の施設を調べようとしたときに、同時に入力されたキーワードのうち、高頻度のものを音声検索に利用できるため、ユーザにとって親和性の高い音声検索機能を提供することができる。
【0083】
関連語彙収集部21における関連キーワード収集処理のさらに第3の方法として、第1の実施例のように初期キーワードを検索キーとしてWEB検索を実行し、検索結果の上位所定数のWEBページに対して、上記第2の方法に準じてインターネットの検索サイトから到達した際に用いた検索キーを蓄積して、その頻度の高いものを上記初期キーワードに対する関連キーワードとしてもよい。
前述の第2の方法では、初期キーワードとともに用いられたキーワードが関連キーワードの候補となったが、第3の方法では、単独の検索キーであっても、当該WEBページに到達する際に用いられた検索キーは全て関連キーワードの候補となる。
【0084】
例えば「A公園」のページに到達する際に用いた検索キーが「あじさい」であれば、これが関連キーワード候補となる。候補となった検索キーの頻度を解析し、その上位を関連キーワードとして抽出することが可能となる。
これにより、ユーザが初期キーワードのWEBページすなわち所望の施設のWEBページに到達する際に検索エンジンで使用したキーワードのうち、高頻度のものを音声検索に利用できるため、ユーザにとって親和性の高い音声検索機能を提供することができる。
【0085】
なお上記実施例および変形例では、認識辞書データベース13の関連キーワード更新に際して、処理量や通信量削減の観点から差分更新を行うものとしたが、これらに制限がなければ認識辞書データベース13内の全データを上書き更新してもよいことはもちろんである。
【0086】
また、実施例および変形例では、ナビゲーション装置における認識辞書データベースの更新について説明したが、ナビゲーション装置に限定されず、本発明は例えば電話回線を用いた施設案内や、WEBにおける音声検索のための認識辞書データベースの更新等にも適用可能である。
【図面の簡単な説明】
【0087】
【図1】実施例の全体構成を示すブロック図である。
【図2】認識辞書データベースの例を示す図である。
【図3】言語モデルの例を示す図である。
【図4】関連キーワードデータベースの例を示す図である。
【図5】認識辞書データベースの例を示す図である。
【図6】言語モデルの例を示す図である。
【図7】辞書更新対象範囲の例を示す図である。
【図8】実施例における辞書更新処理の流れを示す図である。
【図9】変形例の全体構成を示すブロック図である。
【符号の説明】
【0088】
1、1A ナビゲーション装置
2 情報センター
3 インターネット
5 ナビゲーションシステム
10 マイクロフォン
11 AD変換部
12 演算部
13 認識辞書データベース
14、20 通信部
15 DA変換部
16 スピーカ・ディスプレイ
17 音声検索部
18 辞書更新部
19 ナビゲーション機能部(案内情報生成手段)
21 関連語彙収集部
22 関連キーワードデータベース
30 WEB情報
50 現在位置取得部

【特許請求の範囲】
【請求項1】
音声信号を取得する音声入力部と、
あらかじめ初期キーワードを記憶させた認識辞書データベースと、
音声入力部で取得された音声信号より、認識辞書データベースに記憶されたキーワードを認識する音声検索部と、
音声検索部による認識結果に基づいて案内情報を生成する案内情報生成手段と、
案内情報を提示する出力部とを備える情報案内システムにおいて、
前記初期キーワードに意味的な関連性をもつ語彙を関連キーワードとしてWEB情報から収集する関連語彙収集部と、
該関連語彙収集部が収集した前記関連キーワードを所定のタイミングで前記認識辞書データベースに追加する辞書更新部とを有して、
前記音声検索部は前記初期キーワードと関連キーワードとを認識対象のキーワードとすることを特徴とする情報案内システム。
【請求項2】
前記初期キーワードは、ナビゲーションによる経路案内が可能な施設名称であり、
前記案内機能は、前記施設名称で特定される所定の地点までの経路案内であることを特徴とする請求項1に記載の情報案内システム。
【請求項3】
前記関連語彙収集部は、前記初期キーワードを用いてWEB検索を実行し、検索されたWEBページに含まれるテキスト情報を解析して、出現頻度が所定値以上の語彙を前記関連キーワードとして収集することを特徴とする請求項1または2に記載の情報案内システム。
【請求項4】
前記関連語彙収集部は、前記初期キーワードを用いてWEB検索を実行し、検索されたWEBページに含まれるテキスト情報を解析して、前記初期キーワードの別称あるいは初期キーワードを代表する事象を表現するための特定の言い回しを伴って出現頻度が所定値以上の語彙を前記関連キーワードとして収集することを特徴とする請求項1または2に記載の情報案内システム。
【請求項5】
前記関連語彙収集部は、前記出現頻度に加えて、さらに語彙毎に重み付けを施した関連度を算出し、該関連度の積算値が所定値以上の語彙に絞って前記関連キーワードを抽出することを特徴とする請求項3または4に記載の情報案内システム。
【請求項6】
前記関連度を算出する重み付けは、語彙毎にその表示位置および表示形式にもとづいて設定されることを特徴とする請求項5に記載の情報案内システム。
【請求項7】
前記関連度を算出する重み付けは、語彙の表示位置がWEBページ内のタイトル、見出し、およびページ先頭に近い位置にある程大きい値とすることを特徴とする請求項6に記載の情報案内システム。
【請求項8】
前記関連度を算出する重み付けは、語彙の表示位置が前記初期キーワードの出現位置からの距離が近いほど大きい値とすることを特徴とする請求項6または7に記載の情報案内システム。
【請求項9】
前記出現位置からの距離は、少なくとも前記初期キーワードから対象の語彙までに含まれる文字数、形態素数、句数、文数、段落数の何れかで測ることを特徴とする請求項8に記載の情報案内システム。
【請求項10】
前記関連度を算出する重み付けは、語彙の文字サイズ、下線の有無および書体のいずれかで表わされる書式がWEBページ内で最も多く使われる通常書式と異なる場合に、通常書式よりも大きい値とすることを特徴とする請求項6から9のいずれか1に記載の情報案内システム。
【請求項11】
前記関連度を算出する重み付けは、前記初期キーワードの別称あるいは初期キーワードを代表する事象を表現するための特定の言い回しに伴って出現した語彙について、大きい値とすることを特徴とする請求項5に記載の情報案内システム。
【請求項12】
前記特定の言い回しには、少なくとも、「〜と言えば」、「〜で有名」、「〜が有名」、「〜として有名」、「〜で知られる」、「〜が知られる」、「〜として知られる」、「〜で著名」、「〜が著名」、「〜として著名」、「〜で名高い」、「〜が名高い」、「〜として名高い」、「〜の代名詞」、「〜で親しまれる」、「〜として親しまれる」、「〜と呼ばれる」、「〜とも呼ばれる」、「別名〜」、「別称〜」、「愛称〜」、「略称〜」、「通称〜」、および「略して〜」のいずれかが含まれることを特徴とする請求項4または11に記載の情報案内システム。
【請求項13】
前記関連語彙収集部は、前記関連キーワードを収集する際に、前記初期キーワードとしての施設名称Aを包含する別の施設名称Bあるいは施設名称Aを包含する地域名称Cが存在する場合に、該施設名称Bまたは地域名称Cを用いてWEB検索を実行して検索されたWEBページを解析対象から除外することを特徴とする請求項2から12のいずれか1に記載の情報案内システム。
【請求項14】
前記認識辞書データベースは、前記初期キーワードとしての施設名称とその施設種別を対応させて記憶し、
前記関連語彙収集部は、前記関連キーワードを収集する際に、前記施設名称に対応する施設種別以外の施設種別名の語彙が所定値以上の頻度で含まれるWEBページを解析対象から除外することを特徴とする請求項2から13のいずれか1に記載の情報案内システム。
【請求項15】
前記関連語彙収集部は、インターネット上の検索サービスにおいて、前記初期キーワードと共に入力された語彙を共起キーワードとして蓄積し、該共起キーワードの頻度が高い語彙を前記初期キーワードに対する関連キーワードとして抽出することを特徴とする請求項1または2に記載の情報案内システム。
【請求項16】
前記関連語彙収集部は、前記初期キーワードを用いて検索された所定数のWEBページについて、該ページに対してインターネットの検索サイトから到達した際の検索キーワードを蓄積し、該検索キーワードの頻度が高い語彙を、前記初期キーワードに対する関連キーワードとして抽出することを特徴とする請求項1または2に記載の情報案内システム。
【請求項17】
前記辞書更新部は、起動時あるいは現在地が所定の領域を超えた時に、前記関連語彙収集部に対して前記初期キーワードについて関連キーワードの収集を要求し、該関連語彙収集部が収集し返信した関連キーワードを用いて、前記認識辞書データベースを更新することを特徴とする請求項1から16のいずれか1に記載の情報案内システム。
【請求項18】
前記関連語彙収集部は、前記認識辞書データベースに記憶されている関連キーワードと、関連語彙収集部が収集した関連キーワードとに差異がある場合に、収集した関連キーワードのうち差異がある関連キーワードを前記辞書更新部へ返信することを特徴とする請求項17に記載の情報案内システム。
【請求項19】
前記音声検索部は、施設検索利用履歴を監視し、地域別に利用頻度を記録する機能を備え、
前記辞書更新部は、前記利用頻度が所定値以上の地域について、前記認識辞書データベースを更新することを特徴とする請求項17または18に記載の情報案内システム。
【請求項20】
前記音声検索部は、施設検索利用履歴を監視し、地域別に利用頻度を記録する機能を備え、
前記辞書更新部は、前記利用頻度が所定値より低い地域について、前記認識辞書データベースの関連キーワードを消去することを特徴とする請求項17から19のいずれか1に記載の情報案内システム。
【請求項21】
前記音声検索部は、認識した関連キーワードについて重複する複数の初期キーワードがある場合、前記出力部を通じて該複数の初期キーワードを選択可能にユーザへ提示することを特徴とする請求項1から20のいずれか1に記載の情報案内システム。
【請求項22】
前記認識辞書データベース、音声入力部、音声検索部、辞書更新部および出力部をクライアント側に配置し、前記関連語彙収集部をサーバ側に配置して、クライアント・サーバ型に構成したことを特徴とする請求項1から21のいずれか1に記載の情報案内システム。
【請求項23】
前記認識辞書データベース、音声入力部、音声検索部、辞書更新部、関連語彙収集部および出力部を統合してスタンドアローン型に構成したことを特徴とする請求項1から21のいずれか1に記載の情報案内システム。
【請求項24】
音声認識により認識辞書データベースに記憶されたキーワードを認識して、案内情報を提供する情報案内システムにおいて、
認識辞書データベースにあらかじめ記憶された初期キーワードに意味的な関連性をもつ関連キーワードをWEB情報から収集し、
収集した関連キーワードを前記認識辞書データベースに追加して、前記キーワードを更新することを特徴とする認識辞書データベース更新方法。
【請求項25】
前記初期キーワードが施設名称であり、
前記認識辞書データベースはクライアント側に配置し、
前記関連キーワードの収集はサーバ側で任意のタイミングで実行し、
収集した関連キーワードの前記認識辞書データベースへの追加は、クライアント側の起動時またはクライアント側の現在地が所定の領域を超えた時に実行することを特徴とする請求項24に記載の認識辞書データベース更新方法。
【請求項26】
前記関連キーワードの収集は、WEBページに含まれるテキスト情報を解析して、所定値以上の出現頻度をもつ語彙を抽出して行うことを特徴とする請求項24または25に記載の認識辞書データベース更新方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公開番号】特開2009−169470(P2009−169470A)
【公開日】平成21年7月30日(2009.7.30)
【国際特許分類】
【出願番号】特願2008−3576(P2008−3576)
【出願日】平成20年1月10日(2008.1.10)
【出願人】(000003997)日産自動車株式会社 (16,386)
【Fターム(参考)】