情報検索装置、情報検索システム及び情報検索方法
【課題】検索結果の絞り込みに関するユーザの労力を低減することを。
【解決手段】入力された文字を含む名称を、前記名称と当該名称に関連する属性語と前記名称と属性語の関連の度合いを示す関連度とを格納するデータベースから計算機が検索し、検索した名称を名称候補として出力し、名称候補に関連する属性語をデータベースから抽出する際に、抽出された属性語間の異なり度合いを表す独立度と、抽出された属性語の組合せによる名称候補の網羅性を表す網羅度と、属性語ごとに関連する名称候補の件数の均一さを表す均一度を演算し、独立度と網羅度と均一度のうちの1つに基づいて属性語の組合せの得点を計算して、得点が高い順に前記属性語の組み合わせを出力部へ出力する。
【解決手段】入力された文字を含む名称を、前記名称と当該名称に関連する属性語と前記名称と属性語の関連の度合いを示す関連度とを格納するデータベースから計算機が検索し、検索した名称を名称候補として出力し、名称候補に関連する属性語をデータベースから抽出する際に、抽出された属性語間の異なり度合いを表す独立度と、抽出された属性語の組合せによる名称候補の網羅性を表す網羅度と、属性語ごとに関連する名称候補の件数の均一さを表す均一度を演算し、独立度と網羅度と均一度のうちの1つに基づいて属性語の組合せの得点を計算して、得点が高い順に前記属性語の組み合わせを出力部へ出力する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、本発明は、データベースからユーザの所望のデータを取り出す情報検索装置に関する。
【背景技術】
【0002】
データベースからユーザが所望するデータを取り出すために、ユーザが対象となる名称の一部を文字入力し、入力された文字に一致するデータをユーザに提示し、ユーザが選択することによりタスクが完了する情報検索装置が知られている。
【0003】
代表的なものといて、カーナビゲーション装置における目的地設定のタスクがある。
【0004】
カーナビゲーション装置では、全国に膨大にある施設名や地名を検索して、目的地を設定するために、上記のような情報検索インタフェースが使用される。この情報検索では、最初、カーナビゲーション装置のタッチパネルやリモコンを介して、ユーザが施設名の一部を入力する。この後、検索ボタンを押すことにより、ユーザが入力した文字列を含む施設名の一覧が表示され、この一覧から1つを選ぶことにより、目的地を設定できる。
【0005】
しかし、施設の数は全国に膨大にあるため、ユーザが入力した施設名の一部では、該当する施設名の件数が膨大となることが多い。そのため、施設名の一覧を表示しても、すべての候補を見るためには、スクロールなどの操作が必要となる。よって、ユーザが所望の施設を見つけるまでに、時間がかかる。
【0006】
この問題を解決するため、特許文献1では、施設名を文字で入力する手段のほかに、地名または施設ジャンルを入力する手段を設けることで、候補の施設数を減らす技術が開示されている。また、特許文献2では、データベースのコンテンツ検索において、コンテンツの候補を絞り込ませるための属性を、検索戦略に基づいて変更する技術が開示されている。
【0007】
特許文献3では、ウェブサイトの検索装置において、検索結果が所定の数を超えて画面に入りきらない場合に、検索結果のウェブサイトに含まれるキーワードをユーザに提示し、ユーザが選択したキーワードを含むウェブサイトに絞り込む技術が開示されている。
【特許文献1】特開2002−107173号
【特許文献2】特開2006−202159号
【特許文献2】特開2004−234421号
【発明の開示】
【発明が解決しようとする課題】
【0008】
しかしながら、上記特許文献1、特許文献2で挙げた技術では、施設ジャンルまたはコンテンツのジャンルの種類が多くある場合には、ユーザは多くのジャンルから候補を選定する必要があるため、ジャンル選定することがユーザにとって困難となる場合があった。また、絞り込み手段として提示された属性を、ユーザが知らない場合は、絞り込むことができなかった。たとえば、「○○郵便局」という施設を目的地に設定したい場合、この施設が「金融機関」に属するか、「公共機関」に属するかについては、ユーザの意識によって区別しづらいことがあり、混同してしまうという問題があった。
【0009】
特許文献3で挙げた技術では、ユーザに提示されたキーワードが、ユーザにとって分かりづらい場合があった。また、ユーザ自身が所望するデータの中に、キーワードが含まれているか否かを知らない可能性がある。また、キーワードの数が多すぎる場合、画面に多数表示されるため、ユーザがキーワードを選定する作業が困難であった。
【0010】
そこで本発明は、上記問題点に鑑みてなされたもので、検索結果に多数の候補がある場合であっても、ユーザにとって容易に理解することができる属性語を絞り込み属性としてユーザに提示することで、絞り込みに関するユーザの労力を低減することを目的とする。
【課題を解決するための手段】
【0011】
本発明は、文字を入力する入力部と、名称と、当該名称に関連する属性語と、前記名称と属性語の関連の度合いを示す関連度と、を格納するデータベースと、前記入力された文字を含む名称をデータベースから検索して、前記検索した名称を名称候補として出力する名称検索部と、前記名称検索部から出力された前記名称候補に関連する属性語を前記データベースから抽出する提示属性作成部と、前記提示属性作成部で抽出された属性語と、前記名称検索部からの名称候補と、を提示する出力部と、を備え、前記提示属性作成部は、前記抽出した属性語の組合せについて、当該属性語に関連付けられた前記名称候補の前記関連度を前記データベースから取得して、前記抽出した属性語間の異なり度合いを表す独立度を演算し、前記抽出した属性語の組合せによる名称候補の網羅性を表す網羅度を演算し、前記属性語ごとに関連する名称候補の件数の均一さを表す均一度を演算し、前記演算した独立度と網羅度と均一度のうち少なくとも1つに基づいて属性語の組合せの得点を計算する第1の得点計算部を有し、前記得点が高い順に前記属性語の組み合わせを前記出力部に出力する。
【0012】
また、前記提示属性作成部は、前記属性語の組合せによる関連度の総合的な高さを表す理解容易度を計算し、前記演算した独立度と網羅度と均一度と理解容易度のうち少なくとも1つに基づいて属性語の組合せの得点を計算する。
【発明の効果】
【0013】
本発明によれば、情報検索装置は、検索結果に施設名などの名称候補が多数ある場合においても、ユーザにとって分かりやすい属性語を絞り込み属性としてユーザに提示することができ、ユーザが容易に絞り込むことが可能となる。よって、施設名などの名称のデータを選択する時間と労力を軽減することが可能となる。
【発明を実施するための最良の形態】
【0014】
以下、本発明の一実施形態を添付図面に基づいて説明する。
【0015】
<第1実施形態>
図1は、第1の実施形態を示し、本発明を適用するカーナビゲーション装置の一例を示すブロック図である。カーナビゲーション装置100は、演算処理を行うCPU(プロセッサ)103と、データやプログラムを一時的に格納するメモリ102と、データやプログラムを格納するストレージ装置105と、演算結果などを表示する表示装置104と、ユーザからの入力を受け付ける入力装置106と、GPS(Global Positioning System)衛星からの信号を受信するレシーバ110と、音声ガイダンスなどを出力する音声出力装置111を含む計算機で構成される。なお、本実施形態では、表示装置104の表示面上に、ユーザからの入力を受け付ける入力装置106としてのタッチパネルを設けた例を示す。また、入力装置106としては、タッチパネルの他にマイクなどの音声入力装置を備えても良い。
【0016】
ストレージ装置105には、地図を構成する地物を点、線、面などの図形要素と、地物の内容を示す文字や数値などの属性要素を含む空間データベース120が格納される。なお、空間データベース120には、現在地や目的地などひとつの地点の情報を格納する地点データベース81と、地点に対応する施設の名称や属性を格納した施設名データベース8が含まれる。
【0017】
メモリ102には、空間データベース120を管理するDBMS(データベース管理システム)108と、DBMS108を介して空間データベース120を利用するアプリケーション109と、DBMS8とアプリケーション109を管理するOS(オペレーションシステム)107がロードされ、CPU103により実行される。アプリケーション109は、レシーバ110で受信したGPS衛星の信号から現在の位置を演算し、現在の地点データを空間データベース120から検索し、地図情報を取得して表示装置4へ出力する。また、カーナビゲーション装置100では、入力装置106からユーザが検索の指令を受け付けると、アプリケーション109はDBMS8を介して空間データベース120を後述するように探索し、要求された検索結果を表示装置104に出力する。なお、OS107、DBMS108、アプリケーション109は記録媒体としてのストレージ装置105に格納され、カーナビゲーション装置100の起動時にメモリ102へロードされ、CPU103によって実行される。
【0018】
(実施の概要)
図2は、カーナビゲーション装置100で実行されるアプリケーション109及びDBMS108の機能要素を示すブロック図である。
【0019】
入力部1は、図1に示した入力装置106であり、ユーザからの入力を受け付け、入力受付部2へ出力する。ここでは、カーナビゲーション装置100の表示装置104の画面に装着されたタッチパネルによる入力を想定する。また、ユーザが入力するものとしては、50音表による施設名の入力と、画面上に表示された属性語に対するユーザの選択と、施設名一覧からの施設選択を想定する。
【0020】
カーナビゲーション装置100の表示装置104に出力される画面の例を図3に示す。画面上に表示した50音表2010から、タッチパネルによって文字列を入力する。この画面はタッチパネルとなっている。タッチパネル2010には50音表と、文字列の修正を行うための後退ボタンが付与されている。また、アルファベットや数字を入力することができる。このタッチパネル2010の上をユーザが押すことにより、1文字ずつ文字列を入力することができる。入力された文字列は、表示部2020に表示される。
【0021】
また、ボタン2030を押すことによって、現在入力されていた文字列に部分一致する施設名の一覧を表示することができる。この一覧表示は、画面上の所定の領域に設定された表示領域2050の領域に行われるが、この様子は後に説明する。
【0022】
また、表示領域2040には、施設名を絞り込むための属性語が表示され、ユーザは表示された属性語を押下することで選択することができるものとする。この表示は、後の実施形態にて説明する。
【0023】
図2の入力受付部2は、入力部1からの出力を得て、入力された結果を入力内容記憶部3に保存する。入力内容記憶部3は、例えばメモリ102に設定される記憶領域である。入力内容記憶部3では、入力部1から送られるさまざまな入力内容を保存するが、ここでは、本発明の特徴となる施設名記憶部31と属性語記憶部32のみを説明する。施設名記憶部31は、ユーザが50音入力によって入力した文字列を記憶する。属性語記憶部32は、ユーザが選択した属性語を記憶する。
【0024】
施設名検索部6は、入力された文字列(すなわち、施設名記憶部31に保存されている文字列)と施設名データベース8に格納されている施設名の読み仮名と比較し、施設名が部分一致する施設名を検索する。この検索においては、高速化を図るために、あらかじめ施設名の読み仮名を形態素のような単位で分割しておき、あらかじめ探索用のインディクスを作成しておく方法を採用しても良い。
【0025】
さらに、施設名検索部6は、部分一致の結果から得られた施設名から、ユーザが指定した属性語(すなわち、属性語記憶部32に保存されている属性語)によって関連付けられている施設名を検索し、その施設名の一覧を得て、提示属性作成部7へ出力する。この「属性語によって関連付けられている施設名」という定義については、後に説明する。
【0026】
施設名データベース8は、カーナビゲーション装置100に登録されている施設名の各種情報を保存する。施設名の各種情報の保存の形態を図4に示す。
【0027】
図4(a)は、施設名データベース8を構成する施設名テーブル8aを示し、図4(b)は施設名データベース8を構成する属性語テーブル8bを示す。図4(a)の施設名テーブル8aに示す3010は、各施設名を一意に決定するID番号である。3020は、施設名称である。3030は、各施設の読み仮名である。3040〜3060は、各施設の住所、電話番号、緯度経度である。3070、3080は、各施設が属するジャンルであり、大ジャンルは大まかな施設のジャンル、小ジャンルはより詳細なジャンルを示す。これらの大ジャンル・小ジャンルは、カーナビゲーション装置100に一般に装備されているジャンルで施設を検索する機能において使われ、ユーザが選択したジャンルと3070、3080にあるジャンルが一致する施設名をユーザに提示する用途で使われる。
【0028】
さらに、施設名データベース8には、各施設名と、それを特徴付ける属性語の対応を保存する属性語テーブル8bを備える。図4(b)の属性語テーブル8bに示す3090は、属性語を表す。3100は、各施設名3020が、各属性語3090とどの程度の関係があるかを表す値である関連度を示し、関連度3100は0から1の範囲で値が付与されている。この関連度3100は、各施設名3020について、各属性語3090がユーザにとってどの程度結び付けられているかを調査することで決定できる。たとえば、ユーザビリティテスティングで行われるカードソートといった方法を用いて決定することができる。なお、前述した「属性語によって関連付けられている施設名」の定義は、属性語3090との関連度3100が0より大きい値に付与されて施設名3010(または3020)のこととして定義する。
【0029】
たとえば、図4(b)において、施設名3020が「札幌市役所」の場合では、カーナビゲーション装置1を使用する全員のユーザが「市役所」であることを認識しているという調査結果があったとする。この調査結果をもとに、施設名「札幌市役所」と属性語「市役所」との関連度3100は、全員のユーザが関連付けを認識していることを反映し、最大値である「1」が付与される。また、施設名「札幌市役所」と属性語「公共機関」との関連度3100については、たとえばユーザのうち95%が公共機関であると認識しているという調査結果があれば、この値を反映して、関連度として0.95を付与する。
【0030】
また、図4(b)において、「東西でんでんランドホテル」は宿泊施設であるが、「東西でんでんランド」という遊園地が存在することが影響し、ユーザのうち、属性語「遊園地」と関連付けることが自然と感じるユーザが7割程度であったという調査結果があったとする。この結果に基づき、施設名「東西でんでんランドホテル」と属性語「遊園地」の関連度は0.7に付与されている。
【0031】
この関連度3100は、必ずしも大規模なユーザ調査を必要とするわけではなく、開発者等が一意に決定してもよい。
【0032】
また、この関連度3100は、施設名3020の1つ1つに別個の値を付与する形態でも良い。しかし、すべての施設名に別個に関連度を付与することは記憶容量の消費につながる。また、同じような施設については、同じ関連度3100の組が付与されていることも予測される。よって、同じ関連度3100の組を持つ施設をグループ化し、各グループに1つの関連度3100の組を付与する実装方法でもよい。また、このグループとしては、図4(a)に示した施設ジャンル1(3070)、施設ジャンル2(3080)をそのまま採用しても良い。
【0033】
また、この関連度3100は、0から1までの連続量である必要はなく、関連度3100の値を少数の代表的な値で量子化することによって、記憶容量を削減と処理速度の高速化を図ることができる。たとえば、関連度3100を4種類に限定し、各種類に対応する値を0、0.3、0.7、1.0とすれば、1つの関連度3100を2ビットの記憶容量で実装することが可能である。極端な例では、関連度3100を0と1の2値によって表現しても良い。この場合は、1つの関連度3100を1ビットで実装できる。
【0034】
図2に示す提示属性作成部7は、属性語テーブル8bの中から、ユーザにとって区別しやすい属性語3090を選んでユーザに提示する。この提示属性作成部7の処理方法は後に説明するが、属性語3090のバリーエーションとしては、属性語テーブル8b内にさまざまなものが用意されていることが望ましい。そのため、属性語間の関係はとくに階層になっている必要もなく、またさまざまな粒度のものがあっても良い。また、各属性語が被覆する施設が重複していても良い。また、属性語3090は、施設の種別を表すものだけでなく、たとえば地名(東京都、千葉県、○○市、など)、営業時間(24時間営業、夜閉店、土日閉店)、立地(国道○○号線沿い、市道沿い)といったさまざまな観点のものが混在していても良い。
【0035】
図2に示す出力部9は、提示属性作成部7から得られた属性語を表示装置104の画面あるいは音声出力装置111のスピーカから出力する。
【0036】
(提示属性作成部の処理)
つぎに、提示属性作成部7で行われる処理の一例を説明する。また、提示属性作成部7で行われる処理のフローチャートを図6に示す。
【0037】
前提として、ユーザが施設名の文字として「みさつ」と入力したとする(図3)。この結果、施設名記憶部31には文字列「みさつ」が保存されている。また、属性語記憶部32は初期状態では空である。
【0038】
施設名検索部6は、文字列「みさつ」と部分一致する施設名を検索し、13件の施設名候補が得られたとする。また、属性語のうち、施設名候補との関連度3100が0より大きい値であった属性語のみを抽出したところ、16個の属性語が抽出され、施設名候補と属性語の関連度3100は図5に示す値であったとする。なお、図5は施設名検索部6の検索結果を示し、施設名候補4010と、属性語3090及び関連度3100の関係を示す。
【0039】
提示属性作成部7は、上記16個の属性語3090から、絞り込み属性として3個の属性語3090を選定することを想定する。
【0040】
各記号を以下のように定義する。
【0041】
属性語の総数:M (本実施形態ではM=16)
表示する属性語の数:m (本実施形態ではm=3)
候補施設数:n (本実施形態ではn=13)
施設名:Li (i=1,2,…,n)
提示属性作成部7の処理のフローチャートを図6に示す。
【0042】
最初に図6のステップ5010では、表示する属性の数を設定する。ここでは、予め設定した属性の数(M)を3に設定する。
【0043】
ステップ5020では、得点最大値をリセットし、また表示する属性組合せを格納する変数をリセットする。
【0044】
ステップ5030は、ループを開始する。1回のループでは、M個ある属性語から、任意の個数を取り出す。このループを、すべてのm個の属性語の組合せについて行う。よって、ループの回数は、
【0045】
【数1】
【0046】
となる。
【0047】
ステップ5040は、M個ある属性語から、任意のm個を取り出す。ここで取り出した属性語は、ai(i=1,2,…,m)と表すこととする。また、施設名Lと属性aに対する関連度3100を、r(L,a)で表す。また、後の得点計算に使用するため、階段関数Hcを次式で定義する。
【0048】
【数2】
【0049】
(独立度の計算)
ステップ5050では、属性語の組合せに対する独立度を計算する。独立度とは、ある属性語によって施設を絞り込んだ場合に、他の属性語によって絞り込まれる施設名の内訳とどのくらい異なるものとなるかを示す指標である。つまり、独立度は属性語が重ならないように選択する指標となり、独立度が高ければ、施設名の候補に対する属性語の重複が低減される。一方、独立度が低い場合には、施設名の候補に対する属性語の重複が増大する。
【0050】
まず、各施設名に対して、関連度3100が0より大きい値に付与されている属性語の個数を数える。そして、数えた結果が1以上であったときにのみ、この値より1を引く。この属性語の独立度の計算結果をCIND(Li)で表す。具体的な計算式は下記のとおりである。
【0051】
【数3】
【0052】
このCIND(Li)を、すべての施設名候補で合計する。この合計値が大きいということは、複数の属性語が同一の施設名に関連付けられていることを意味する。よって、1つの属性語をユーザが選定して絞り込みを行ったとしても、絞り込まれた結果の施設件数はあまり小さくなく、絞り込み効率が低いということとなる。よって、この合計値は小さいほど、絞り込み効率の高い属性語の組み合わせと捉えることができる。
【0053】
そこで、この合計値を施設件数で正規化し、さらに1から引くことにより、独立度PINDとして定義する。
【0054】
【数4】
【0055】
独立度PINDの計算例を図7に示す。図7(a)は、属性語として「買い物」、「レジャー」、「公共機関」の3個を組み合わせている。この場合、 2個以上の属性語が同一施設名と関連度3100を持つものは、6010に示す「美佐津市立温泉保養所」のみである。一方、図7(b)に示す「病院」、「歯科」、「総合病院」の属性語の組合せでは、13個の施設のうち6030、6031に示す施設において、複数の属性語が対応付けられている。この結果、独立度を比較すると、図7(a)の独立度(6020)のほうが図7(a)の独立度(6040)より高い値となっている。
【0056】
図7(b)に示す「病院」、「歯科」、「総合病院」という属性語を絞り込みのための属性語としてユーザに提示した場合、互いに混同しやすく、かつ重複件数も多いため、絞り込みにあまり寄与しないことが予測される。上記の計算により、この寄与度合いを独立度PINDとして定量的に評価することが可能となる。
【0057】
(網羅度の計算)
次に、図6のステップ5060では、属性語の組合せに対する網羅度を計算する。網羅度とは、属性語の組合せによって、施設名候補のうちどの程度の割合が選択可能となるかを示す指標である。すなわち、網羅度が高い場合には、施設名の候補に対応する属性語の候補が表示される。一方、網羅度が低い場合には、施設名の候補に対応する属性語の候補が表示されない。
【0058】
各施設名に対して、関連度3100が1個以上の属性で0より大きい値に付与されている施設の個数を数える。この施設の個数を数えた結果をCEXH(Li)とすると、下記の式で計算される。
【0059】
【数5】
【0060】
これをすべての施設名候補で合計する。この合計値が大きいということは、属性語の組合せによって多くの施設がカバーされ、属性語を選択することによって絞込みから漏れる施設数が少ないことを意味する。この合計値を施設の数で正規化し、網羅度pEXHとして定義する。
【0061】
【数6】
【0062】
網羅度pEXHの計算例を図8に示す。図8(a)は、属性語として「病院」、「宿泊施設」、「公共機関」の3個を組み合わせている。この場合、1つ以上の属性語との間に0より大きい関連度3100が付与されている施設の数は、7010に示すとおり9個であった。一方、図8(b)に示す「組合」、「スーパー」、「郵便局」の属性の場合には、1つ以上の属性語との間に0より大きい関連度3100が付与されている施設の数は、7030に示すとおり3個であった。この結果、図8(a)の属性語の組合せのほうがたくさんの施設をカバーしているため、図8(a)の網羅度(7020)のほうが図8(b)に示した網羅度(7040)より大きくなる。
【0063】
(均一度の計算)
図6のステップ5070では、属性語の組合せに対する均一度を計算する。均一度とは、ある属性語の組合せにおいて、各属性語を選択して絞り込みを行った場合、残る施設件数が各属性語によってどの程度同じ数であるかを示す指標である。すなわち、均一度は、提示する属性語に対応する候補の数の均一さの度合いを示す。均一度が高い場合は、各属性語に対応する候補の数がほぼ等しい。一方、均一度が低い場合には、各属性語に対応する候補の数が乖離する。
【0064】
まず、各属性語について、関連度3100が0より大きい値に付与されている施設の数を数える。この値をDEQU(ai)とすると、下記の式で計算される。
【0065】
【数7】
【0066】
つぎに、関連度3100が0を超える施設数DEQU(ai)の標準偏差を計算する。標準偏差が大きいということは、各属性語を選定した場合に、絞り込まれる施設数が属性語によって多すぎるたり少なすぎたりして、ばらつき、絞り込みにとって非効率な属性語が提示される可能性がある。そこで、この標準偏差を施設数で正規化し、1から引くことで均一度pEQUを計算する。
【0067】
【数8】
【0068】
均一度pEQUの計算例を図9に示す。図9(a)は、属性語として「ペット」、「自動車」、「歯科」の3個を組み合わせている。それぞれの属性語との間に関連度3100が付与されている施設の数は、DEQU8010に示すとおり、3個、2個、2個となる。一方、図9(b)は、属性語として「宿泊施設」、「温泉」、「郵便局」の3個を組み合わせている。このとき、各属性語との間に関連度3100が付与されている施設の数は、DEQU8030に示すとおり、4個、1個、1個となる。
【0069】
図9(b)の属性語は、図9(a)に比べて、各属性語に関連付けられる施設数のばらつきが大きい。そのため、たとえば絞込みのために、ユーザに「宿泊施設」、「温泉」、「郵便局」という属性語を提示した場合、ユーザが温泉または郵便局に行きたければ、「温泉」、「郵便局」を選択することで1個に絞り込めるため良いが、宿泊施設に行きたい場合には、「宿泊施設」を選択しても残り施設数が多いため、あまり効率的ではない。一方、図9(a)の場合には、どの属性語を選んでもおよそ3個程度の施設が残るため、どの施設にユーザが行きたい場合でも残り件数を同程度に減らすことが可能である。このことを踏まえて、均一度を比較すると、図9(a)の値(8020)のほうが図9(b)の値(8040)より大きく計算されており、より均一になる属性語組合せを選択することができる。
【0070】
(理解容易度の計算)
図6のステップ5080では、属性語の組合せに対する理解容易度を計算する。理解容易度とは、ある属性語の組合せが、ユーザにとってどの程度理解しやすいかを示す指標である。
【0071】
まず、各属性語に、関連度3100が0より大きい値に付与されている施設だけを対象として、関連度3100の平均値を計算する。この関連度3100の平均値をDEAS(ai)とすると、下記の式で計算される。
【0072】
【数9】
【0073】
この関連度の平均値DEAS(ai)が高い属性語は、関連度3100が総じて高いことを意味する。関連度3100とは、施設名に対する属性語の想起のしやすさを示す値であった。よって、関連度の平均値DEAS(ai)が高い属性語は、ユーザにとって、1つの施設がその属性語に属するか否かを判断しやすいということになる。一方、関連度の平均値DEAS(ai)が低いと、ユーザが希望する施設を選ぶ際に、その属性語を選んでよいかどうかがユーザにとって分かりづらいことを示す。
【0074】
そこで、この関連度の平均値DEAS(ai)を属性語の数で正規化し、理解容易度PEASを定義する。
【0075】
【数10】
【0076】
理解容易度は、属性語と施設名の対応関係の分かりやすさを示す指標である。理解容易度が高い場合は、施設名に対応する属性語が直感的に分かりやすい。一方、理解容易度が低い場合は、施設名に対応する属性語に違和感を与えやすい。
【0077】
理解容易度の計算例を図10に示す。図10(a)は、属性語として「スーパー」、「レジャー」、「郵便局」の3個を組み合わせている。関連度3100が0より大きい値だけを抽出し、その平均値を算出するとDEAS(9010)のように、各属性語について、1.0、0.863、1.0となり、どれも1に近い値となる。一方、図10(b)は、属性語として「自動車」、「宿泊施設」、「公共機関」の3個を組み合わせている。この例では、低い関連度3100が散見される。たとえば施設「ペットホテル美佐津」において、「宿泊施設」に対する関連度3100が0.4と低くなっている。これは、ペットホテルについて、それを宿泊施設とみなすかどうかが、ユーザにとって判断しづらいことを示している。このようなことを反映し、関連度3100が0より大きい値だけを抽出した平均値を算出すると(9030)、各属性語について、0.875、0.6、0.575となり、図10(a)と比べて低い値となっている。
【0078】
さらに、理解容易度を計算すると、図10(a)の値(9020)のほうが図10(b)の値(9040)より高い値となっている。この結果、理解容易度がより高い属性語の組合せを選定することによって、よりユーザにとって区別しやすい属性語の組合せを選定することができる。
【0079】
(得点の計算)
図6のステップ5090では、これまで算出した各指標を総合的に判断して、1つの属性語の組合せに対する得点を計算する。ここでは、各指標を重み付け加算して得点を求めることとする。1つの属性語組合せに対する得点Sは下記で計算される。
【0080】
【数11】
【0081】
wIND、wEXH、wEQU、wEASは、それぞれ、独立度、網羅度、均一度、理解容易度に対する重み付け係数である。
【0082】
図6のステップ5100、5110では、得点計算の結果、これまでの計算で最大得点を超える場合には、最大得点を更新し、かつ提示する属性語組合せとして保存していた属性語組合せも更新する。
【0083】
ステップ5120は、ループ終端である。すべての属性語組合せに対して、得点を計算し、最大得点となる属性語組合せが求められるまで、ステップ5040〜5110までの処理を繰り返す。
【0084】
(最大得点となる属性語の出力)
ステップ5130では、最大得点となった属性語の組合せを、出力部9に出力する。これにより、表示装置104の画面に絞り込みのための属性語が提示され、ユーザは絞り込みを行うことが可能となる。
【0085】
図11は、図5の施設名候補に対して、各属性語の組合せに対する得点計算を行い、得点が高かったものから順に属性の組み合わせを並べた図である。なお、重み付け係数は図中10020に示す値に従って計算した。
【0086】
図11において、得点がもっとも高かった属性語の組合せは、10010に示す「病院」、「買い物」、「レジャー」であった。そこで、提示属性作成部7は、この3つの属性語を出力部9へ出力する。
【0087】
これを受けて、出力部9は、表示装置104の画面に属性語を表示する。これと同時に、音声出力装置111のスピーカから「病院、買い物、レジャーのいずれかから絞り込めます」といった音声ガイダンスを流しても良い。
【0088】
表示が更新された画面を図12に示す。図中の領域2040に示すように、「病院」、「買い物」、「レジャー」という提示属性作成部7によって選定された3つの属性語を表示している。また、各属性語に対して関連度3100が0より大きい値に付与されている施設数も併せてカッコ内に表示している。
【0089】
(絞込み属性を選択した場合)
ここから、ユーザは、「美佐津にあって、市がやっている宿泊施設に行きたい」と考えているが、その施設の正式名称が「美佐津市立温泉保養所」であることは知らないと仮定する。そして、3つの属性語から、もっともユーザの目的に近い「レジャー」を選択し、画面上のボタン11020を押下したとする。
【0090】
この押下は、入力部1によって受理され、入力受付部2によって属性語記憶部32に保存される。
【0091】
つぎに、施設名検索部6は、文字列「みさつ」と部分一致し、属性語「レジャー」との関連度3100が0より大きい施設名の一覧を作成する。この一覧は図13で示すようになり、施設名候補12010に示した4件の施設が候補として残る。また、属性語12020には、施設名候補との間に1つ以上、0より大きい関連度3100が付与されているものを示している。また、すでに選択された「レジャー」は除いてある。
【0092】
提示属性作成部7は、図13に示した施設名候補と属性語間の関連度3100から、図6の処理手順にしたがい、表示装置104に提示する属性語を選定する。この手順はすでに説明した手順と重複するため省略する。この処理の結果、「ペット」、「宿泊施設」、「温泉」という3つの属性語が選定される。そこで、提示属性作成部7は、この3つの属性語を出力部9へ出力する。
【0093】
これを受けて、出力部9は、表示装置104の画面上の表示の更新と、音声出力装置111からの音声ガイダンスの出力を行う。更新された表示装置104の画面を図14(a)に示す。表示領域2040には、選定された属性語である「ペット」、「宿泊施設」、「温泉」が表示され、かつ施設数もカッコ内に表示される。また、表示領域13020に示すように、すでにユーザが選定した属性語を表示しても良い。
【0094】
さらに、ユーザは「宿泊施設」を選択する。すると、残りの施設は2件となる。そこで、カーナビゲーション装置100は、残りの施設数が十分少ないと判断し、図14(b)の表示に切り替える。ここでは、表示領域13100に施設名候補をすべて一覧表示している。この画面から、ユーザが「美佐津市立温泉保養所」を選択することで、施設を決定することができる。
【0095】
以上説明したように、本実施形態では、絞り込みに使用する属性語を、たくさんの属性語のなかから、施設名候補に応じて動的に作成する。これにより、常にユーザにとって分かりやすく、かつ絞り込み効率が高い属性語を提示することができる。
【0096】
(文字の継続入力)
上記に説明した実施形態では、属性語が表示された状態(図12)から、ユーザが属性語を選定する場合を説明した。一方、本発明では、属性語がすでに表示されている状態においても、ユーザは継続して文字列を入力することが可能となる。
【0097】
この例として、図12の状態から、ユーザが「し」を追加して入力したとする。この押下は、入力部1によって受理され、入力受付部2によって施設名記憶部31が「みさつし」に更新される。一方、属性語記憶部32は空のままである。
【0098】
つぎに、施設名検索部6は、文字列「みさつし」と部分一致する施設名の一覧を作成する。この一覧は図15となり、施設名候補14010に示した9件の施設が候補として残る。また、属性語14020には、施設名候補との間に1つ以上、0より大きい関連度3100が付与されているものを示している。
【0099】
提示属性作成部7は、図15に示した施設名候補14010と属性語間の関連度3100から、図6の処理手順にしたがい、提示する属性語を選定する。この手順はすでに説明した手順と重複するため省略する。この処理の結果、「病院」、「金融機関」、「レジャー」という3つの属性が選定される。そこで、提示属性作成部7は、この3つの属性を出力部9へ出力する。
【0100】
これを受けて、出力部9は、表示装置104の画面上の表示の更新と、音声出力装置111からの音声ガイダンスの出力を行う。更新された表示装置104の画面を図16に示す。表示領域2040には、選定された属性語である「ペット」、「宿泊施設」、「温泉」が表示され、かつ施設数も表示される。
【0101】
このように、ユーザに提示する属性語は、施設名の候補が変化するたびに、もっとも得点が高い組合せに変化する。これにより、常にユーザにとって分かりやすく、かつ絞り込みに効率的な属性語を提示することができる。
【0102】
(閾値の導入)
以上説明した実施形態では、ある属性語を選択したとき候補に残す施設として、関連度3100が0より大きいものをすべて選定していた。これは、関連度3100が0より大きければ、何らかの関連があり、その施設を選ぶためにその属性語を選ぶユーザが少なからず存在するためである。
【0103】
しかしながら、極端に小さい関連度3100については、ユーザのうちごく少数のユーザだけが、施設と属性語の間に関連があると捉えており、その調査結果を反映して、極端に小さい関連度3100が付与されている場合もありうる。たとえば、図5の例では、施設「美薩動物病院」に対して、「総合病院」との関連度3100が0.05だけ付与されている。これは、「美薩動物病院」を「総合病院」に対応付けるユーザが極少数いる調査結果を受けて付与したとする。しかしながら、多くのユーザにとっては、動物病院は総合病院とは考えていない。そのため、属性語「総合病院」を選んだときに、施設名候補に「美薩動物病院」が残っていると、かえって混乱を招く可能性がある。
【0104】
このような現象に対処するため、低い関連度3100については、その関連は無いとみなして、属性語の選定を行う方法を取ることができる。この方法は、関連度3100に対する閾値を設けることで実装できる。すなわち、関連が無いとみなす関連度3100の閾値をTignoreとすると、施設名データベース8に元から記憶されている関連度3100に対して、再定義した関連度3100r’(L,a)を下記のように計算する。
【0105】
【数12】
【0106】
すなわち、関連度3100のうち、閾値を越えるものだけを残し、それ以外は0とみなす。このように再定義した関連度3100を用いて、属性語の選定を行うことにより、極端に低い関連度3100に起因するユーザの混乱を防ぐことができる。
【0107】
以上のように本発明によれば、検索結果に施設名などの候補が多数ある場合においても、ユーザにとって分かりやすい属性語を絞り込み属性としてユーザに提示するため、ユーザが容易に絞り込むことが可能となる。すなわち、従来例では、施設名称に対する属性語があらかじめ決まっており,その中から,絞込みに使う属性を選択するのに対し、本発明では,属性語と施設名候補の関連度によって提示する施設名候補を動的に変化させることができる。これにより、ユーザにとって分かりやすい属性語を絞り込み属性として優先的に提示できるのである。
【0108】
<第2実施形態>
(形態素)
本発明の第2の実施形態を説明する。本実施形態では、第1の実施例における属性語として、施設名を分割した形態素を用いるものである。
【0109】
一般に施設名は、複数の単語が複合された形で表現されることが多い。そこで、施設名をこの単語単位に分割し、属性語としてそのまま使用することを考える。以降で述べる形態素とは、この「施設名を単語単位に分割した結果」を表すものとする。
【0110】
この形態素への分割では、ユーザにとって自然でと感じる位置で分割するものとする。
【0111】
たとえば、「美佐津市立美佐津商業高等学校」という施設名を形態素に分割する場合、「美佐津市・立」といった分割方法は、「立」という単独で意味を成さない部分が出力されているため、ユーザにとって不自然に感じる。この場合には、「美佐津・市立・美佐津・商業・高等・学校」(中点が分割位置)といった分割を行えば、ユーザにとって自然な形態素に分割される。
【0112】
(施設名−形態素間のデータの持ち方/静的テーブル)
図17には、前記第1実施形態の図4に記載した施設名3020に関する形態素との関連度を定義した表を示す。図中16020は、形態素の一覧である。図中16030は、各施設名16010と、各形態素の間の関連度を示す。この関連度16030の決定方法としては、もっとも単純なものとしては、施設名の中に形態素が含まれる場合には1、含まれない場合には0とする。しかし、この図では、0から1までの連続値を付与している。この値は、施設名の中に、その形態素が含まれていることが、より多くのユーザに想起されるほど、大きい値を付与している。
【0113】
たとえば、施設「美佐津市立病院」に対して、名称に「病院」が含まれることは、全員のユーザによって知られているとする。このことを反映し、関連度16030は最大の1を付与している。一方、施設「東西でんでんランド」については、1割のユーザは、「東西」が名称についていないと考えていて、「でんでんランド」などと思っているとする。すなわち、「東西」が施設名に付くことを知っているのが9割であったとする。このことを反映し、関連度16030は0.9を付与している。
【0114】
また、形態素の中には、最初からユーザが想起しづらい形態素がある。たとえば、「財団法人」、「株式会社」といった形態素は、多くの施設名に含まれるものの、実際にユーザが想起する施設名には含まれていないことが多い。そこで、これらのユーザが想起しづらい形態素は、施設名データベース8に最初から保存しないことでもよい。
【0115】
(施設名−形態素間のデータの持ち方/動的な形態素分割)
また、施設名を形態素分割する方法は、図17のようにあらかじめテーブルを保持する方法に限らず、動的に形態素分割を行ってもよい。形態素分割の方法は、公知の手法を用いればよく、例えば、「http://chasen.naist.jp/」などを採用すればよい。
【0116】
たとえば、形態素と、各形態素の品詞を辞書としてもっておき、最長一致法、分割数最小法、接続コスト最小法といった手法を用いることで、施設名を形態素単位に分割することができる。また品詞としては、施設名に特有の品詞の分類を行うことができる。公知の文献(岩瀬成人: 自然言語処理を用いた企業名解析方式、 電子情報通信学会論文誌、 vol.J82-DII、 no.8、 pp.1305-1314、 1999)では、施設名を分割したときの意味カテゴリを調査している。
【0117】
この文献で記載されている意味カテゴリを品詞として用いるとすれば、たとえば、品詞「固有名」はユーザにとってより施設を想起しやすいと考えられるため、高い関連度を付与し、また、品詞「職業語尾」はユーザにとってより施設を想起しづらいことが推測されるため、低い関連度を付与するといったことができる。
【0118】
(具体的な処理の流れ)
つぎに、ユーザが「東西電力病院」を目的地に設定したい場面を想定し、カーナビゲーション装置100のタッチパネルから「とうざいで」までの文字を入力したと仮定し、処理について説明する。
【0119】
実施するカーナビゲーション装置100は、図2と同様である。この図2に関しては、第1の実施形態にて説明したため、ここでは説明を省略する。
【0120】
ユーザは、表示装置104の画面上に表示した50音表から、タッチパネルによって文字列「とうざいで」を入力する。この文字列は、前記第1実施形態の図3に示した入力部1、入力受付部2の動作により、入力内容記憶部3のなかの施設名記憶部31に保存される。なお、属性語はとくに選択されていないため、属性語記憶部32は空である。
【0121】
施設名検索部6は、入力された文字列「とうざいで」と施設名データベース8に格納されている施設名の読み仮名と比較し、施設名が部分一致する施設名を検索する。
【0122】
提示属性作成部7の処理の方法を説明する。処理の手順は、第1の実施形態と同様である。処理のフローチャートも図6で同様である。
【0123】
施設名検索部6は、文字列「とうざいで」と部分一致する施設を検索し、31件の施設名候補が得られたとする。また、形態素のうち、施設名候補との関連度が0より大きい値であった形態素のみを抽出したところ、施設と形態素の関連度は図18に示す値であったとする。なお、この図における施設名17010では、形態素の区切り位置を図中「・」(中点)で示している。
【0124】
提示属性作成部7は、この形態素から、絞り込みのための属性語として3個の形態素17020を選定することを想定する。そして、各形態素の組合せに対して、第1の実施形態と同様の方法で、得点を計算し、その最大となる形態素の組合せを出力する。この得点の計算方法は、第1の実施例と同じであるため、ここでは説明を省略する。
【0125】
図19は、図18の施設名候補に対して、各形態素の組合せに対する得点計算を行い、得点が高かったものから順に並べた図である。なお、重み付け係数は18020に示す値に従って計算した。得点がもっとも高かった形態素の組合せは、18010に示す「出島」、「電力」、「デザイン」であった。そこで、提示属性作成部7は、この3つの形態素を出力部9へ出力する。
【0126】
これを受けて、出力部9は、表示装置104の画面に形態素を表示する。これと同時に、音声出力装置111はスピーカから「出島、電力、デザインのいずれかから絞り込めます」といった音声ガイダンスを流しても良い。更新された表示装置104の画面を図20に示す。表示領域2040に示すように、「出島」、「電力」、「デザイン」という提示属性作成部7によって選定された3つの形態素を表示している。また、各形態素に対して関連度が0より大きい値に付与されている施設数も合わせてカッコ内に表示している。
【0127】
この状態から、ユーザは、3つの形態素から、「電力」を選択し、図20に示す画面上のボタン19020を押下したとする。
【0128】
この押下は、入力部1によって受理され、入力受付部2によって属性語記憶部32に保存される。
【0129】
つぎに、施設名検索部6は、文字列「とうざいで」と部分一致し、形態素「電力」との関連度が0より大きい施設名の一覧を作成する。この一覧は図21となり、20010に示した7件の施設名が候補として残る。また、属性語20020には、施設名候補との間に1つ以上、0より大きい関連度が付与されているものを示している。また、すでに選択された「電力」と、すべての施設名に含まれる「東西」は除いてある。
【0130】
提示属性作成部7は、図21に示した施設名候補と属性語間の関連度から、第1の実施形態にしたがい、提示する形態素を選定する。この手順はすでに説明した手順と重複するため省略する。この処理の結果、「保養所」、「展示」、「病院」という3つの形態素が選定される。そこで、提示属性作成部7は、この3つの属性を出力部9へ出力する。
【0131】
これを受けて、出力部9は、表示装置104の画面上の表示の更新と、音声ガイダンスの出力を行う。更新された表示装置104の画面を図22(a)に示す。表示領域2040には、選定された属性語である「保養所」、「展示」、「病院」が表示され、かつ施設数も表示される。また、表示領域21020に示すように、すでにユーザが選定した形態素を表示しても良い。
【0132】
さらに、ユーザは「病院」を選択する。すると、残りの施設は1件となり、施設名候補の一覧表示に切り替える(図22(b))ここから、ユーザが「東西電力病院」を選択することで、施設を決定することができる。
【0133】
また、図20の画面から、継続してユーザが施設名を入力した場合(たとえば、「ん」を入力した場合)には、その都度、絞込みのために表示する形態素を変更する。この方法は、第1の実施形態でも説明したため、省略する。
【0134】
以上説明したように、絞り込みに使用する属性語として、施設名の一部分である形態素を使用することで、ユーザにとって分かりやすく、かつ効率的に施設を絞り込むことが可能となる。
【0135】
(省略、言い換えの記載)
なお、図17に記載した施設名と形態素の関係としては、必ずしも施設名に含まれない形態素に対して、関連度を付与しても良い。たとえば、施設名に「東西電力」がつくものに関して、ユーザの多くが「東電」と略することが受け入れられるのであれば、形態素として「東電」を用意し、関連度を付与しても良い。また、施設名「東西でんでんランド」に対して、ユーザの多くが「TDL」と称することが受け入れられるのであれば、形態素として「TDL」を用意し、関連度を付与しても良い。
【0136】
以上のように、施設名中の形態素のうち、形態素の出現位置に応じて、ユーザに提示する属性語(形態素)を動的に変化させることで、前記第1実施形態と同様に、ユーザにとって分かりやすい属性語を絞り込み属性として優先的に提示できるのである。
【0137】
<第3の実施形態>
(「その他」属性の利用)
本発明の第3の実施形態を説明する。この実施形態では、ユーザに提示する絞り込みのための属性語として、いずれの属性語にも属さないものことを表す「その他属性」も合わせて提示することで、ユーザがより絞り込みを容易に行えるようにするものである。
【0138】
この実施形態は、第1の実施形態の構成図2において、提示属性作成部7における提示属性の選定方法に違いがある。そこで、提示属性作成部7の処理の方法を説明する。
【0139】
前提として、ユーザが施設名の文字として「みさつ」と入力したとする(図3)。この結果、施設名記憶部31には文字列「みさつ」が保存されている。また、属性語記憶部32は空であったとする。
【0140】
施設名検索部6は、文字列「みさつ」と部分一致する施設を検索し、13件の施設名候補が得られたとする。また、属性語のうち、施設名候補との関連度3100が0より大きい値であった属性語のみを抽出したところ、16個の属性語が抽出され、施設と属性語の関連度3100は図5に示す値であったとする。
【0141】
提示属性作成部7は、この16個の属性語から、絞り込み属性として2個を選定することを想定する。
【0142】
記号の定義は、第1の実施形態と同様、下記のとおりとする。
【0143】
属性語の総数:M (本実施形態では16)
表示する属性語の数:m (本実施形態では2)
候補施設数:n (本実施形態では13)
施設名:Li (i=1,2,…,n)
提示属性作成部7の処理のフローチャートを図23に示す。
【0144】
最初に図23のステップ22010では、表示する属性の数を設定する。ここでは、属性の数(m)を2に設定する。
【0145】
ステップ22020では、得点最大値をリセットし、また表示する属性組合せを格納する変数をリセットする。
【0146】
ステップ22030は、ループを開始する。1回のループでは、M個ある属性語から、任意のn個を取り出す。このループを、すべての個の属性語の組合せについて行う。よって、ループの回数は、
【0147】
【数13】
【0148】
となる。
【0149】
ステップ22040は、M個ある属性語から、任意のm個を取り出す。ここで取り出した属性語は、ai (i=1,2,…,m)と表すこととする。また、施設名Lと属性aに対する関連度をr(L、a)、で表す。
【0150】
(その他属性の関連度の計算)
ステップ22045は、上記ステップ22040で取り出したm個の属性語の組合せに該当しない施設を検索し、この施設に対してその他属性との関連度を付与する。
【0151】
まず、その他属性をaotherwiseという記号で表す。施設名Li、その他属性aotherwiseとの関連度3100r(Li、aotherwise)は、下記の式で計算する。
【0152】
【数14】
【0153】
すなわち、ある施設を特徴づける属性語のなかでの最大の関連度を求める。そして、その最大の関連度を1から引いた値を求める。この値が、閾値(T)より大きければ、その値を「その他属性の関連度」とする。一方、閾値より低ければ、その他属性の関連度を付与せず、0とする。
【0154】
関連度が0.9であった場合に、閾値を設けなければ、その他属性との関連度が0.1となる。これは、施設が「ホテル」でもあるし、いずれの属性語にも属さない「その他」でもあるということを意味している。このような場合に、もしユーザに「ホテル」と「その他」という2つの属性語を提示すると、ユーザが混乱する恐れがある。そこで、閾値を設け、すでに属性語との関連度がある程度の大きさを持っている場合には、その他属性との関連度を付与しないようにした。
【0155】
その他属性の計算をした例を図24に示す。ここでは、属性語の組み合わせとして、「宿泊施設」、「公共機関」を選定した場合のその他属性の関連度を表している(図中23010)。なお、閾値は予め設定された0.5の条件で計算を行っている。
【0156】
(独立度の計算)
ステップ22050では、属性語の組合せに対する独立度を計算する。独立度の意味合いは、第1の実施形態と同様であるが、その他属性も1つの属性語であるとみなした形で計算を行う。
【0157】
まず、各施設名に対して、その他属性も含めて、関連度が付与されている属性語の個数を数える。そして、その数が1以上であったときにのみ、1を引く。この計算結果をC’IND(Li)で表す。具体的な計算式は下記のとおりである。
【0158】
【数15】
【0159】
このC’IND(Li)を、すべての施設名候補で合計する。この合計値を施設件数で正規化し、さらに1から引くことにより、独立度PINDとして定義する。
【0160】
【数16】
【0161】
属性語として「宿泊施設」、「公共機関」と「その他属性」を組み合わせた場合の独立度PINDの計算例を図25に示す。
【0162】
(網羅度の計算)
図23のステップ22060では、属性語の組合せに対する網羅度を計算する。網羅度の意味合いは、第1の実施形態と同様である
各施設名Liに対して、関連度3100が1個以上の属性で0より大きい値に付与されている施設の個数を数える。この数えた結果をC’EXH(Li)とすると、下記の式で計算される。
【0163】
【数17】
【0164】
これをすべての施設名候補で合計する。この合計値が大きいということは、属性語の組合せによって多くの施設がカバーされ、いずれかの属性語を選択することによって絞込みから漏れる施設数が少ないことを意味する。この合計値を施設数で正規化し、網羅度pEXHとして定義する。
【0165】
【数18】
【0166】
属性語として「宿泊施設」、「公共機関」を組み合わせた場合の網羅度の計算例を図26に示す。
【0167】
(均一度の計算)
図23のステップ22070では、属性語の組合せに対する均一度を計算する。独立度の意味合いは、第1の実施形態と同様であるが、その他属性も1つの属性語であるとみなした形で計算を行う。
【0168】
まず、各属性語aiについて、関連度が0より大きい値に付与されている施設の数を数える。その他属性aotherwiseについても、0より大きい値に付与されている施設の数を数える。それぞれの値をD’EQU(ai)、D’EQU(aotherwise)とすると、下記の式で計算される。
【0169】
【数19】
【0170】
つぎに、D’EQU(ai)、D’EQU(aotherwise)の標準偏差を計算する。さらに、標準偏差を施設数で正規化し、1より引くことで均一度pEQUを計算する。
【0171】
【数20】
【0172】
ただし、
【0173】
【数21】
【0174】
属性語として「宿泊施設」、「公共機関」と「その他属性」を組み合わせた場合の均一度の計算例を図27に示す。
【0175】
(理解容易度の計算)
図23のステップ22080では、属性語の組合せに対する理解容易度を計算する。理解容易度の意味合いは、第1の実施形態と同様であるが、その他属性も1つの属性語であるとみなした形で計算を行う。
【0176】
まず、各属性語に、関連度が0より大きい値に付与されている施設だけを対象として、関連度の平均値を計算する。また、その他属性aotherwiseとの間に0より大きい関連度が付与されている施設を対象として、関連度の平均値を計算する。それぞれの平均値をD’EAS(ai)とすると、下記の式で計算される。
【0177】
【数22】
【0178】
この平均値を属性数で正規化し、理解容易度pEASを定義する。
【0179】
【数23】
【0180】
属性語として「宿泊施設」、「公共機関」と「その他属性」を組み合わせた場合の理解容易度の計算例を図28に示す。
【0181】
(得点の計算)
図23のステップの22090では、これまで算出した各指標を総合的に判断して、1つの属性組合せに対する得点を計算する。ここでは、各指標を重み付け加算して得点を求めることとする。1つの属性組合せに対する得点は下記で計算される。
【0182】
【数24】
【0183】
wIND、wEXH、wEQU、wEASは、それぞれ、独立度、網羅度、均一度、理解容易度に対する重み付け係数である。
【0184】
ステップ22100、22110では、得点計算の結果、これまでの計算で最大得点を超える場合には、最大得点を更新し、かつ提示する属性語組合せとして保存していた属性語組合せも更新する。
【0185】
ステップ22120は、ループ終端である。すべての属性語組合せに対して、得点Sを計算し、最大得点となる属性語組合せが求められるまで、22040〜22110までの処理を繰り返す。
【0186】
(最大得点となる属性の出力)
ステップ22130では、最大得点となった属性語の組合せを、出力部9に出力する。これにより、画面に絞り込みのための属性語が提示され、ユーザは絞り込みを行うことが可能となる。
【0187】
図29は、図5の施設名候補に対して、2つの属性語とその他属性の組合せに対する得点計算を行い、得点が高かったものから順に並べた図である。なお、重み付け係数wEXHは重み付け係数28020に示す値に従って計算した。その他属性を用いた場合には、属性語のいずれでも網羅されない施設に関しても、その他属性によって網羅される。よって、網羅度はあまり重要では無い。これを反映して、重み付け係数28020における網羅度の重み付け係数は、第1の実施形態の値(図11の重み付け係数10020)よりも小さな値にしている。
【0188】
得点がもっとも高かった属性語の組合せは、属性組合せ28010に示す「病院」、「レジャー」とその他属性の組合せであった。そこで、提示属性作成部7は、この3つの属性語を出力部9へ出力する。
【0189】
これを受けて、出力部9は、表示装置104の画面に属性語を表示する。これと同時に、音声出力装置111はスピーカから「病院、レジャー、その他のいずれかから絞り込めます」といった音声ガイダンスを流しても良い。
【0190】
更新された表示装置104の画面を図30に示す。表示領域2040に示すように、「病院」、「レジャー」のほかに「その他」という表示を行っている。「その他」を選択すれば、施設名候補として「病院」にも「レジャー」にも属さない施設が候補として残る。
【0191】
(絞込み属性を選択した場合)
もしユーザが「その他」を選択した場合(すなわち、図30のボタン29020を押した場合)についての処理を説明する。
【0192】
この押下は、入力部1によって受理され、入力受付部2によって属性語記憶部32に「その他」が保存される。
【0193】
つぎに、施設名検索部6は、先に選定された施設名候補において、その他属性に対して値が付与されていた施設の一覧を作成し、新たな施設名候補とする。
【0194】
提示属性作成部7は、施設名候補と属性語間の関連度から、図23の処理手順にしたがい、提示する属性語を選定する。この手順はすでに説明した手順と重複するため省略する。この処理の結果、属性語が選定される。
【0195】
以下、画面更新、ユーザの選択という処理へ続く。これは、すでに説明した前記第1実施形態の処理手順と同じであるため、省略する。
【0196】
以上説明したように、その他の属性も1つの属性語であるとみなした形で計算を行うことにより、絞り込みに使用する属性語を、ユーザに分かりやすい組合せで提示し、さらにいずれの属性語にも属さない施設を選択できるようにその他属性を選択できるようにすることで、ユーザにとって分かりやすく、かつ絞り込み効率が高い機能を提供することができる。
【0197】
<第4の実施形態>
(「その他」使用、未使用の選定)
第4の実施形態について説明する。この実施形態は、前記第1の実施形態で説明した属性語の選定と、前記第3の実施形態で説明したその他属性を用いた属性語の選定を併用し、両者のうちどちらの得点が高いかを評価して、表示する属性語を選定する実施形態である。
【0198】
この実施形態は、第1の実施形態で説明した提示属性作成部7の処理を変更したカーナビゲーション装置100として説明できるため、それ以外の部分の説明は省略する。
【0199】
図31に、提示属性作成部7のフローチャートを示す。図31のフローチャートを実施する前提として、ユーザはすでに文字入力を行っており、施設名検索部6は複数の施設名候補を提示属性作成部7へ出力しているものとする。
【0200】
ステップ30010は、施設名候補から、個の属性語の組合せで得点が最大となる属性語の組合せを計算する。この計算は、第1の実施形態で示した図6の処理をサブルーチンとして呼び出すことにより実行する。この計算で得られた属性組合せをAnormal、最大得点をSnormalとする。
【0201】
ステップ30020は、施設名候補から、m−1個の属性語の組合せとその他属性によって、得点が最大となる属性語の組合せを計算する。この計算は、第3の実施形態で示した図23の処理をサブルーチンとして呼び出すことにより実行する。この計算で得られた属性組合せをAnormal、最大得点をSnormalとする。
【0202】
ステップ30030では、両方の得点を比較する。
【0203】
ステップ30040では、得点がSnormalのほうが大きかった場合の処理である。この場合は、Anormalを出力部9に出力する。
【0204】
ステップ30050では、得点がSotherwiseのほうが大きかった場合の処理である。この場合は、Aotherwiseを出力部9に出力する。
【0205】
以上説明したように、この第4実施形態では、その他属性を使用する場合と使用しない場合の得点を比較し、より高い得点の属性語をユーザに提示する。これにより、よりユーザにとって分かりやすく、かつ絞り込み効率が高い属性語を提示することができる。
【0206】
なお、ここで述べたステップ30010、30020の得点計算では、互いに得点の大きさが異なることが予想されるため、得点計算の際に使用する重み付け係数をあらかじめ適するように調整しておいても良い。
【0207】
<第5の実施形態>
(異なる属性セットの併用)
第5の実施形態について説明する。この実施形態は、属性語があらかじめいくつかの種類に分類されている場合に、それぞれの種類の属性語組合せに対する最大得点を計算して比較し、得点の大きかった種類の属性語組合せをユーザに提示する実施形態である。
【0208】
この実施形態は、第1の実施形態で説明したカーナビゲーション装置100において、提示属性作成部7の処理を変更し、また施設名データベース8のデータを追加した形として説明できるため、それ以外の部分の説明は省略する。
【0209】
図32に属性の種類と属性語の対応表を示す。ここでは、属性の種類として属性セットという呼称を用いている(31010)。それぞれの属性セット31010に対応する属性語を31020に登録している。ここでは一例として、施設のジャンルに関連する属性セット31010である"genre"と、施設名の形態素の属性セット31010である"morpheme"の2種類があったとする。この対応表は、施設名データベース8において、属性語と合わせて保存されている。なお、お互いの属性セットには、同一の属性語も含まれる可能性もあるため、実際にはID番号などで一意の属性語として識別できるように管理しておく。
【0210】
図33に、提示属性作成部7のフローチャートを示す。このフローチャートを実施する前提として、ユーザはすでに文字入力を行っており、施設名検索部6は複数の施設名候補を提示属性作成部7へ出力しているものとする。
【0211】
ステップ32010は、施設名候補から、属性セットgenreに属する属性語だけを用い、個の属性語の組合せで得点が最大となる属性語の組合せを計算する。この計算は、第1の実施形態で示した図6の処理をサブルーチンとして呼び出すことにより実行する。この計算で得られた属性組合せをAgenre、最大得点をSgenreとする。
【0212】
ステップ32020は、施設名候補から、属性セットmorphemeに属する属性語だけを用い、個の属性語の組合せで得点が最大となる属性語の組合せを計算する。この計算についても、第1の実施形態で示した図6の処理をサブルーチンとして呼び出すことにより実行する。この計算で得られた属性組合せをAmorpheme、最大得点をSmorphemeとする。
【0213】
ステップ32030では、両方の得点を比較する。
【0214】
ステップ32040では、得点がSnormalのほうが大きかった場合の処理である。この場合は、属性組合せAnormalを出力部9に出力する。
【0215】
30050では、得点がSmorphemeのほうが大きかった場合の処理である。この場合は、属性組合せAmorphemeを出力部9に出力する。
【0216】
以上説明したように、この第5の実施形態では、複数の属性語の種類において、得点を比較し、より高い得点の種類である属性語をユーザに提示する。これにより、よりユーザにとって分かりやすく、かつ絞り込み効率が高い属性語を提示することができる。
【0217】
なお、ここで述べたステップ32010、32020の得点計算では、互いに得点の大きさが異なることが予想されるため、得点計算の際に使用する重み付け係数をあらかじめ適するように調整しておいても良い。
【0218】
また、表示装置104の表示領域に余白がある場合には、2つ以上の属性セットから得られた属性語を同時に表示しても良い。これにより、ユーザは、たとえば形態素は知らないが、ジャンルは知っているといった場面でも、知っているジャンルから絞込みを行うことができる。
【0219】
<第6の実施形態>
(関連度の強化学習)
第6の実施形態を説明する。本実施形態は、施設名と属性語間の関連度を、実際にユーザが使用(または選択)した履歴に基づいて変更していき、よりユーザ個人にとって施設名選択を行いやすくするものである。
【0220】
図34は、実施するカーナビゲーション装置100の構成である。このカーナビゲーション装置100は、第1の実施形態でのカーナビゲーション装置100の構成である図2から、確定済施設名記憶部5、関連度更新部10が追加された形である。
【0221】
また、本実施形態では、第1の実施形態において、施設名が確定された後の処理のみが変更される。よって、第1の実施形態と重複する部分は説明を省略する。
【0222】
前提を説明する。ユーザは、「美佐津にあって、市がやっている宿泊施設に行きたい」と考えているが、その施設の正式名称が「美佐津市立温泉保養所」であることは知らないとする。
【0223】
最初に、ユーザは文字を「みさつ」と入力したとする。この結果、表示装置104の画面に提示された「病院」、「買い物」、「レジャー」という3つの属性語のうち、「レジャー」を選択したとする。
【0224】
つぎに、属性語として新たに更新表示された「ペット」、「宿泊施設」、「温泉」から、「宿泊施設」を選択したとする。
【0225】
この結果、画面には「美佐津市キャンプ場」、「美佐津市立温泉保養所」という2つの施設名の一覧が表示される。ここから、ユーザは「美佐津市立温泉保養所」を選択し、施設を確定したとする。
【0226】
以上の処理は、第1の実施形態に記載した処理と同様である。以下からが本実施形態に特徴となる処理となる。
【0227】
施設名を確定すると、入力受付部3は、確定済である施設名「美佐津市立温泉保養所」と、確定するまでにユーザが選択した属性語である「レジャー」、「宿泊施設」と、画面に表示されたがユーザが選択しなかった属性語である「病院」、「買い物」、「ペット」、「温泉」を確定済施設名記憶部5に対して出力し、記憶する。この記憶の形態を図35に示す。
【0228】
つぎに、関連度更新部10は、確定済施設名記憶部5に記憶されている内容に基づき、施設名データベース8に記憶されている関連度を更新する。この更新の方法を図36に示す。
【0229】
まず、関連度更新部10は、確定済施設名に対して、関連度が付与されている属性語を抽出する。このうち、ユーザが選択した属性語は、実際にユーザに選択されたことから、ユーザ自身が施設との関連がより高いと捉えている属性語と推測される。よって、確定済施設と属性語間の関連度を大きくする。一方、ユーザが選択しなかった属性語は、ユーザ自身が施設との関連が低いと捉えている属性語と推測される。よって、確定済施設と属性語間の関連度を小さくする。
【0230】
具体的には、確定済施設Lconfirmedを、選ばれた属性語aselectを、選ばれなかった属性語anon-selectを、更新前の関連度rold(L,a)を、更新後の関連度をrnew(L,a)とすると、下記の式に従い、関連度の更新を行う。
【0231】
【数25】
【0232】
【数26】
【0233】
ただし、wselectとwnon-selectは係数であり、wselectは1より大きい値、wnon-selectは1より小さい値を用いる。
【0234】
図36では、wselectとwnon-selectにそれぞれ、ユーザが選定した「レジャー」、「宿泊施設」については、関連度を高く(値を増大)し、ユーザが選定しなかった「温泉」については、関連度を低く(値を減少)する。また、表示装置104の画面上に属性語として表示されなかった「公共機関」については、そのままの値を保持する。
【0235】
以上説明したように、本第5の実施形態では、実際のユーザの選定行為に基づいて関連度3100を更新することで、よりユーザにとって使いやすい施設名の絞込みが可能となる。
【0236】
<第6の実施形態の変形例>
(ユーザがよく行く施設の関連度を加算)
また、関連度の更新方法については、ユーザがある期間に実際に行った施設の選択の頻度に基づいて更新する方法もある。
【0237】
図37(a)には、ユーザが所定の期間(例えば、半年間)に目的地に設定した施設と、この施設と属性語との関連度36010を記載している。この図37(a)において、施設との関連度36010が0より大きいものについては、図中網掛けで表示する。
【0238】
つぎに、それぞれの属性語について、半年間に行った施設の中で各属性語との間に0より大きい関連度が付与されていた件数を数える(E(a))。この計算結果を降順に並べたものを図37(b)に示す。この例では、過去半年の間に、ユーザは「自動車」に関連する施設に10回行き、「レジャー」に関連する施設に8回行ったことがわかる。
【0239】
この結果から、ユーザは、上位に表れている属性語である「自動車」や「レジャー」に関連する施設によく行っていることが分かる。よって、これらよく行く施設に関連する属性語は、優先して絞込み属性語として提示することにより、ユーザの使い勝手が向上することが予測される。
【0240】
そこで、この回数に応じて、施設名データベース8に記憶されている関連度に対する加算を行う。具体的には、それぞれの属性語aに対する加算値をe(a)とすると、この値を、回数を目的地設定を行った全回数で正規化し、重み付け係数をかけたものとして算出する。
【0241】
【数27】
【0242】
なお、Eallは、目的地設定を行った全回数、Weは重み付け係数である。この計算結果を図37(b)の36120に示す。ただし、各変数の値は重み付け係数36130のように仮定した。
【0243】
この算出した加算値を用い、施設名データベース8に保存されている関連度に対して加算を行う。
【0244】
【数28】
【0245】
すなわち、もともとデータベース8に設定された関連度のうち、0より大きい値の関連度だけを対象に、加算値e(a)を加算する。このようにして算出されたre(L,a)を使用して、提示属性作成部7はユーザに提示する属性語の選定を行う。
【0246】
図38(a)に、加算前の関連度を示し、(b)に加算後の関連度を示す。図38(b)では、図37(b)で算出された加算値が加算されている。そして、加算後の関連度をもとに、ユーザに提示する絞り込み属性語を選定する。
【0247】
以上説明したように、本実施形態では、実際にユーザが高頻度で行く施設に関連する属性語を優先的に提示することで、ユーザにとって使いやすい施設名の絞込みが可能となる。
【0248】
<第7の実施形態>
(一般的によく設定される施設の優先)
第7の実施形態を説明する。本実施形態は、施設名と属性語間の関連度3100を、一般的にカーナビゲーション装置100で設定される施設ジャンルごとの頻度に従い、関連度3100を重み付けするものである。
【0249】
この実施形態は、第1の実施形態で説明したカーナビゲーション装置100において、施設名データベース8のデータを追加した形として説明できるため、それ以外の部分の説明は省略する。
【0250】
図39には、本実施形態で特徴となる施設ジャンル(群)ごとの重み付け係数を記録したテーブルである。このテーブルは、施設名データベース8に記憶されている。
【0251】
図39の小ジャンル38010は、図5の3080に示す各施設名に付与された小ジャンル(群)に対応する。また、38020には、小ジャンルごとに、一般的に目的地に設定される頻度に応じて、重み付け係数が設定されている。たとえば、「温泉」や「総合病院」は、カーナビゲーション装置100でよく目的地に設定されるため、高い値が付与されている。一方、「呉服店」は、あまり目的地に設定されないため、低い値が付与されている。提示属性作成部7は、施設名データベースにもとから保存されている関連度に、38020に記述した重み付け係数を乗じたものを、新たな関連度として用い、属性語の選定を行う。こうすることにより、カーナビゲーション装置100でよく目的地に設定される施設に関連した属性語がユーザに提示されやすくなる。
【0252】
なお、本実施形態では、小ジャンルに対して重み付け係数を1つ付与する方法を説明したが、各施設に別の重み付け係数を設定する方法をとってもよい。
【0253】
以上説明したように、本実施形態では、一般的にカーナビゲーション装置100で高頻度に目的地に設定される施設に関連する属性語を優先的に提示することで、ユーザにとって使いやすい施設名の絞込みが可能となる。
【0254】
<第8の実施形態>
(属性語と関連度のダウンロード)
第8の実施形態を説明する。本実施形態は、施設名とそれを選択するまでに選択された属性語とのデータをサーバに送信し、サーバ側で新しい関連度データを作成し、それを各カーナビゲーション装置100に送信して、更新を行うものである。
【0255】
図40は、実施する計算機システムの構成である。この計算機システムは、第1の実施形態での構成である図2のカーナビゲーション装置100に、確定済施設名記憶部5、関連度更新部10、通信部11を追加し、さらに、カーナビゲーション装置100の通信部11と通信を行う基地局40040と、カーナビゲーション装置100からの要求を処理するサーバ40030を加えたものである。
【0256】
図41は、本実施形態で必要となるカーナビゲーション装置100とサーバ40030の通信における関係である。自動車に搭載されたカーナビゲーション装置100は複数存在し、各カーナビゲーション装置100に備わっている通信部11は、通信網40020を介してサーバ40030と通信を行う。
【0257】
図40のシステム構成において、確定済施設名記憶部5には、実際にユーザが目的地に設定した施設と、その施設を選ぶまでに、絞り込み属性として、ユーザが選択した属性語と、ユーザが選択しなかった属性語を記憶するものである。たとえば、ユーザが 施設名「美佐津市立温泉保養所」を確定するまでに、「レジャー」、「宿泊施設」という属性語を選択し、「病院」、「買い物」、「ペット」、「温泉」を選択しなかったとすると、図35のような記憶形態となる。通信部11は、確定済施設名記憶部5の内容をサーバ40030に送信する。
【0258】
各カーナビゲーション装置100が同様にサーバ40030に送信を行うと、サーバ40030では、各施設名と、各施設が選定される過程において、選択された属性語とその回数が集計される。集計結果の例を図42に示す。41010には、全ユーザが目的地に設定した総回数、41020には、各施設名が目的地に設定されたときに各属性語が選択された総回数を示す。
【0259】
サーバ40030は、この集計結果に基づいて、関連度の更新情報を各カーナビゲーション装置100に送信する。そして、各カーナビゲーション装置100の通信部11は、更新情報を受信し、関連度更新部10へ送る。関連度更新部10は、更新情報に基づいて、施設名データベース8に記載された関連度を更新する。
【0260】
なお、この更新の形態についてはとくに規定しないが、たとえば、目的地設定回数に対する各属性語が選択された割合を計算し、この割合がある値以上であれば施設名データベース8に格納される関連度を大きくし、ある値以下であれば施設名データベース8に格納される関連度を小さくするといった方法がある。たとえば、図42にいては、施設「美薩動物病院」に対して、属性語「総合病院」が選択された回数が0回である。これを反映して、図5に示した施設名データベース8に保存される関連どのうち、「美薩動物病院」と「総合病院」の間の関連度を0にする操作を行う。
【0261】
以上、説明したように、実際に多くのユーザが選定する属性語の頻度に基づき、関連度を更新することで、より多くのユーザに使いやすい属性語の提示が可能となる。
【0262】
また、上記に説明した、ユーザが選定する属性語の頻度に基づいた関連度の更新だけではなく、新しく設立された施設に対して、その施設名と属性語の関連度を合わせてカーナビゲーション装置100がサーバ40030からダウンロードしても良い。または、既存の施設の業種が変更された場合において、変更された業種に沿った属性語と関連度の値を
<第9の実施形態>
(形態素のつなぎ合わせ)
第9の実施形態を説明する。本実施形態は、属性語として形態素を用いる前記第2の実施形態において、形態素の表示方法を変更するものである。第2の実施形態との違いは、提示属性作成部7の処理において、図6のステップ5130の部分のみであるため、この部分だけを説明する。
【0263】
以下の説明の前提として、ユーザが文字入力にて「とうざいで」と入力し、施設名候補として図43(a)に示した18件が施設名の候補として挙がっているとする。さらに、この施設名の候補から2つの形態素を絞り込み属性語として選ぶ処理を行い、「出島」、「でんでん」という2つの形態素の組み合わせにおいて、得点が最大であったとする。
【0264】
この場合、前記第2の実施形態では、「出島」、「でんでん」という2つの形態素が、画面に絞り込み属性として提示されていた。しかし、上記のような短い形態素では、ユーザは、その形態素が施設名に含まれていることを認識できない可能性がある。そこで、より長い文字列を絞り込み属性語として提示したほうが、ユーザに形態素が認識されないという事態を防げる可能性がある。
【0265】
そこで本実施形態では、ステップ5130において、最初に、選ばれた2つの形態素と一致する施設名を抽出する。すると、形態素「出島」と一致するものは図43(b)の5件、「でんでん」と一致するものは図43(c)の2件である。
【0266】
つぎに、各形態素の前後の施設名を探索し、すべての施設名で共通して一致する部分が最長となるように文字列を抽出する。この結果、図43(b)では「東西出島」、図43(c)では「東西でんでんランド」が抽出される。
【0267】
つぎに、上記選定した文字列を、出力部に対して絞り込み属性として出力する。この結果、図44で示すように、表示領域2040には「東西出島」と「東西でんでんランド」という2つの絞り込み属性語が提示される。
【0268】
以上のように、より長い施設名部分を絞り込み属性語として提示することにより、ユーザにとって絞込みができないという現象を防ぐことができる。
【0269】
<第10の実施形態>
(形態素の位置の利用)
第10の実施形態を説明する。本実施形態は、属性語として形態素を用いる第2の実施形態において、形態素の位置に応じて表示方法を変更するものである。第2の実施形態との違いは、施設名データベース8におけるデータの保持方法であるため、この部分を説明する。
【0270】
以下の説明の前提として、ユーザが文字入力にて「みさ」と入力し、施設名候補として図45の44010に示した施設名が抽出されたとする。
【0271】
図45には、本実施形態における施設名データベース8における関連度の付与の形態を示している。施設名候補44020に示すように、形態素として「ホテル」であることは第2の実施形態と同様であるが、その形態素が施設名のなかでどの位置に表れるかを併せて情報として持つことが本実施形態の特徴である。たとえば、「ホテル美佐津クレセント」に対しては、形態素「ホテル」は施設名の先頭に付くため、属性語としては「ホテル(前方)」という項目を設けて、関連度を付与している。同様に、「ホテル(中間)」、「ホテル(後方)」という属性語も別途設けている。
【0272】
さらに、提示属性選定部7が、提示する属性語として「ホテル(前方)」、「ホテル(中間)」、「ホテル(後方)」という3属性語を選定したとする。この結果を受けて、画面にはそのまま「ホテル(前方)」のように表示しても良いが、たとえば図46の2040に示すように、「ホテル○○」、「○○ホテル」のようによりユーザにとって「ホテル」が施設名のどこにあるかを直感的に分かるようにしてもよい。なお、ここでユーザが「ホテル○○」を選択すれば、図45の施設名候補44010に挙げた施設名のうち、「ホテル」が先頭に付く「ホテル美佐津クレセント」、「ホテルオーヤマ美佐津」が表示され、「ホテル」が前方に付かない施設名は表示されなくなる。
【0273】
以上説明したように、属性語において、形態素と位置情報を合わせて提示することにより、ユーザにとって絞込みが容易に行えるようになる。
【0274】
<第11の実施形態>
(音声入力)
第11の実施形態を説明する。本実施形態は、前記第1〜第10の実施形態において、ユーザの入力を音声で行い、音声認識の結果を入力に使用する実施形態である。カーナビゲーション装置100としては、前記第1〜第10の実施形態に示したカーナビゲーション装置100における入力部1の前段に、音声入力と音声認識装置を追加することで実装される。
【0275】
なお、音声認識の実装方法については、公知の技術(例えば、鹿野、伊藤、河原、武田、山本共著:「音声認識システム」、オーム社刊、2001年発行)を用いればよい。
【0276】
図47に、入力部1の前段に装着される音声入力に必要となる構成を示す。
【0277】
音声取込部46010は、ユーザからの音声信号をデジタル信号に変換し、音声データとして取り込む。
【0278】
分析部46020は、ユーザが発話した音声データを、特徴ベクトル列に変換する。特徴ベクトル列とは、音声の各時刻の特徴量を多次元ベクトル量で表し、それを時系列に並べたものである。たとえば、入力音声データを10ms程度ごとに分割し、各時刻の音声データをMFCC(Mel Frequency Cepstrum Coefficient)パラメータ(特徴パラメータ)と呼ばれる多次元ベクトル量に変換し、これを時系列に並べたものが使用される。
【0279】
音響モデル記憶部46030には、特徴パラメータから抽出した各音素に対応するモデルを保存しておく。このモデルの表現形態としては、各音素を3状態で定義したHMM(Hidden Marcov Model)が使われる。
【0280】
言語モデル記憶部46040には、辞書46042と文法46044を登録する。音声認識における言語モデルには、規則ベースの言語モデルと統計的言語モデルの2種類があるが、本実施形態では、統計的言語モデルの使用を想定する。統計的言語モデルによる音声認識の実装方法についても、上記の鹿野らの文献に記載されている。
【0281】
辞書46042には、音声認識が認識対象とする単語と、その音素列を登録する。本実施形態では、施設名データベース8に保存されている施設名を形態素分割したものを単語として登録するものとする。辞書の例を図48に示す。また、全国の施設名に現れるすべての形態素を辞書に登録すると、その数は膨大となるため、音声認識に必要となる演算量、メモリ量の増加につながる。さらに、認識率の低下が起こると予想される。そこで、この辞書には、全国の施設名に高頻度で現れる形態素のみを登録するものとする。
【0282】
文法46044には、辞書46042に登録した各単語間の遷移確率が記憶される。この遷移確率は、統計的言語モデルの作成で一般的に使われる単語N−gramモデルを作成する方法によって算出することができる。この単語N−gramモデルを作成するための学習コーパスとしては、たとえば、施設名データベース8に登録されている施設名をそのまま使用することができる。
【0283】
音声認識部46050は、入力音声の特徴ベクトル列と言語モデルに記憶された単語列を比較し、その一致の度合いを表すスコアを計算し、スコアが高かった単語列を出力する。ここでは、スコアがもっとも高かった単語列だけを出力しても良いし、スコアが高かった上位複数個の単語列を出力しても良い。
【0284】
単語列出力部46060は、音声認識部から得られた単語列から、入力部1に送る単語列を選定する。ここでは、音声認識部から得られた単語列のうち、スコアに基づいて信頼度を計算し、信頼度が高かったものだけを出力するものとする。
【0285】
以降の処理は、前記第1〜第10の実施形態における処理と同等である。すなわち、施設名検索部6は、単語列出力部から入力された単語列に一致する施設名の一覧を作成する。提示属性作成部は、各実施形態での方法に従い、ユーザに提示する絞り込み属性語の組合せを作成する。出力部9は、属性語の組合せを画面に出力する。また、出力部9は、スピーカを通じて属性語を提示し、「○○、××、△△のいずれかから絞り込めます」といった音声ガイダンスを流してよい。
【0286】
これを受けて、ユーザは、タッチパネルで属性語を指定しても良いし、また音声にて属性語を指定しても良い。音声で属性語を指定する場合には、単語列出力部46060は、ユーザ発話から認識された属性語を入力部1に対して出力し、各実施形態の方法に沿った絞り込みの処理を行う。
【0287】
しかしながら、音声による入力の場合、入力される単語列が複数である場合や、複数の単語列候補がある場合がある。以下、この場合について説明する。たとえば、ユーザが「東西でんでんランド」と発話し、音声認識処理の結果、信頼度が高かった「東西/ランド」という2単語だけを、単語列出力部46060から入力部1に送る場合を考える。このとき、施設名検索部6では、「東西」、「ランド」という2つの形態素がある施設名を検索して、一覧を得る方法で実装できる。また、ユーザが「東西でんでんランド」と発話し、音声認識処理の結果、信頼度が高かった「東海/ランド」、「東西/ランド」という、各2つの単語からなる2つの単語列が得られたとする。単語列出力部46060から入力部1に対して、この2つの単語列を送る場合を考える。このとき、施設名検索部6では、「東西」、「ランド」という2つの形態素がある施設名と、「東西」、「ランド」という2つの形態素がある施設名の両方を検索して、一覧を得る方法で実装できる。
【0288】
また、単語列出力部46060が出力する単語列は、形態素単位に分かれているため、図17に記載した各施設名16010に関連付けられた形態素のいずれかに一致する。そこで、たとえば単語列出力部46060は、認識単語列と各認識単語の確からしさを表す信頼度も合わせて入力し、図17に記載の表から、認識単語と一致する形態素を探し、その形態素と施設名の関連度と、認識単語の信頼度を掛け合わせ、1つの施設名についてこれの和を取ることにより、各施設名の信頼度を計算できる。この方法によって、施設名の一覧を信頼度付きで得ることも可能である。
【0289】
以上説明したように、音声入力を行うことによって、ユーザの多様な入力を受け付けることができるようになり、より使い勝手を高めることができる。
【産業上の利用可能性】
【0290】
以上のように、本発明は、文字情報で検索を行うカーナビゲーション装置やデータベースシステムに適用することができる。
【図面の簡単な説明】
【0291】
【図1】第1の実施形態を示し、本発明を適用するカーナビゲーション装置の一例を示すブロック図である。
【図2】第1の実施形態を示し、カーナビゲーション装置の機能要素を示すブロック図である。
【図3】第1の実施形態を示し、カーナビゲーション装置の表示装置に出力される画面イメージ。
【図4】第1の実施形態を示し、施設名データベース8の一例の説明図であり、(a)は施設名テーブルを、(b)は属性語テーブルを示す。
【図5】第1の実施形態を示し、施設名検索部で行った検索結果の一例の説明図。
【図6】第1の実施形態を示し、カーナビゲーション装置の提示属性作成部で行われる処理の一例を示すフローチャート。
【図7】第1の実施形態を示し、提示属性作成部で行われる独立度PINDの計算結果の一例を示す説明図で、(a)は独立度が高い例を示し、(b)は独立度が低い例を示す。
【図8】第1の実施形態を示し、提示属性作成部で行われる網羅度pEXHの計算結果の一例を示す説明図で、(a)は網羅度が高い例を示し、(b)は網羅度が低い例を示す。
【図9】第1の実施形態を示し、提示属性作成部で行われる均一度pEQUの計算結果の一例を示す説明図で、(a)は均一度が高い例を示し、(b)は均一度が低い例を示す。
【図10】第1の実施形態を示し、提示属性作成部で行われる理解容易度PEASの計算結果の一例を示す説明図で、(a)は理解容易度が高い例を示し、(b)は理解容易度が低い例を示す。
【図11】第1の実施形態を示し、提示属性作成部で抽出された属性の組み合わせの一例を示す説明図。
【図12】第1の実施形態を示し、カーナビゲーション装置の表示装置に出力される属性語の画面イメージ。
【図13】第1の実施形態を示し、施設名検索部が作成した施設名候補と属性語及び関連度の一覧を示す。
【図14】第1の実施形態を示し、カーナビゲーション装置の表示装置に出力される属性語の画面イメージで、(a)は属性語が更新された状態を示し、(b)は施設名候補を一覧表示した状態を示す。
【図15】第1の実施形態を示し、施設名検索部が作成する施設名候補と属性語及び関連度の関係を示す説明図。
【図16】第1の実施形態を示し、カーナビゲーション装置の表示装置に出力される属性語の画面イメージで、属性語が更新された状態を示す。
【図17】第2の実施形態を示し、施設名と形態素(属性語)及び関連度の関係を示す説明図。
【図18】第2の実施形態を示し、施設名の形態素と形態素及び関連度の関係を示す説明図。
【図19】第2の実施形態を示し、施設名候補に対して、各形態素の組合せに対する得点が高かいのから順に並べた説明図。
【図20】第2の実施形態を示し、カーナビゲーション装置の表示装置に出力される属性語の画面イメージで、属性語が更新された状態を示す。
【図21】第2の実施形態を示し、施設名候補と形態素及び関連度の関係を示す説明図。
【図22】第2の実施形態を示し、カーナビゲーション装置の表示装置に出力される属性語の画面イメージで、(a)は属性語が更新された状態を示し、(b)施設名候補の一覧表示の例を示す。
【図23】第3の実施形態を示し、提示属性作成部で行われる処理の一例を示すフローチャート。
【図24】第3の実施形態を示し、施設名候補と属性語及び関連度の計算結果を示す説明図。
【図25】第3の実施形態を示し、施設名候補と属性語及び独立度の関係を示し、属性語として「宿泊施設」、「公共機関」と「その他属性」を組み合わせた場合の独立度PINDの計算結果の一例を示す。
【図26】第3の実施形態を示し、施設名候補と属性語及び網羅度の関係を示し、属性語として「宿泊施設」、「公共機関」を組み合わせた場合の網羅度の計算結果の一例を示す。
【図27】第3の実施形態を示し、施設名候補と属性語及び均一度の関係を示し、属性語として「宿泊施設」、「公共機関」及び「その他属性」を組み合わせた場合の均一度の計算結果の一例を示す。
【図28】第3の実施形態を示し、施設名候補と属性語及び理解容易度の関係を示し、属性語として「宿泊施設」、「公共機関」及び「その他属性」を組み合わせた場合の理解容易度の計算結果の一例を示す。
【図29】第3の実施形態を示し、2つの属性語と「その他属性」の組合せに対する得点計算で、得点が高いものから順に並べた例を示す説明図。
【図30】第3の実施形態を示し、カーナビゲーション装置の表示装置に出力される属性語の画面イメージで、属性語が更新された状態を示す。
【図31】第4の実施形態を示し、提示属性作成部で行われる処理の一例を示すフローチャート。
【図32】第4の実施形態を示し、属性セットと属性語の関係を示す説明図。
【図33】第5の実施形態を示し、提示属性作成部で行われる処理の一例を示すフローチャート。
【図34】第6の実施形態を示し、カーナビゲーション装置の機能要素を示すブロック図である。
【図35】第6の実施形態を示し、確定済施設名記憶部の記憶内容の一例を示す説明図。
【図36】第6の実施形態を示し、施設名と属性語に対する関連度の更新の一例を示す説明図。
【図37】第6の実施形態を示し、学習の様子を示す説明図で、(a)は半年以内に目的地として設定した施設と属性語との関連度を示し、(b)は属性と施設の件数と加算値の関係を示す。
【図38】第6の実施形態を示し、施設名と属性語及び関連度の関係を示し、(a)は加算値の加算前の値を示し、(b)は加算前の加算語の値を示す。
【図39】第7の実施形態を示し、施設ジャンルごとの重み付け係数を記録したテーブルの説明図。
【図40】第8の実施形態を示し、カーナビゲーション装置の機能要素を示すブロック図である。
【図41】第8の実施形態を示し、カーナビゲーション装置とサーバの関係を示すブロック図。
【図42】第8の実施形態を示し、施設名と各施設名が選択された属性語と選択回数の集計結果を示す説明図。
【図43】第9の実施形態を示し、形態素による属性語の提示の様子を示す説明図で、(a)は抽出された施設名候補を示し、(b)は形態素が「出島」に対応する施設名候補を示し、(c)は形態素が「でんでん」に対応する施設名候補を示す。
【図44】第9の実施形態を示し、カーナビゲーション装置の表示装置に出力される属性語の画面イメージ。
【図45】第10の実施形態を示し、施設名候補と形態素及び関連度の関係を示す説明図。
【図46】第10の実施形態を示し、カーナビゲーション装置の表示装置に出力される属性語の画面イメージ。
【図47】第11の実施形態を示し、カーナビゲーション装置の機能要素を示すブロック図である。
【図48】第11の実施形態を示し、辞書の一例を示し、単語と音素列の関係を示す説明図。
【符号の説明】
【0292】
1 入力部
2 入力受付部
3 入力内容記憶部
6 施設名検索部
7 提示属性作成部
8 施設名データベース
9 出力部
100 カーナビゲーション装置
102 メモリ
103 CPU
104 表示装置
105 ストレージ装置
106 入力装置
110 レシーバ
【技術分野】
【0001】
本発明は、本発明は、データベースからユーザの所望のデータを取り出す情報検索装置に関する。
【背景技術】
【0002】
データベースからユーザが所望するデータを取り出すために、ユーザが対象となる名称の一部を文字入力し、入力された文字に一致するデータをユーザに提示し、ユーザが選択することによりタスクが完了する情報検索装置が知られている。
【0003】
代表的なものといて、カーナビゲーション装置における目的地設定のタスクがある。
【0004】
カーナビゲーション装置では、全国に膨大にある施設名や地名を検索して、目的地を設定するために、上記のような情報検索インタフェースが使用される。この情報検索では、最初、カーナビゲーション装置のタッチパネルやリモコンを介して、ユーザが施設名の一部を入力する。この後、検索ボタンを押すことにより、ユーザが入力した文字列を含む施設名の一覧が表示され、この一覧から1つを選ぶことにより、目的地を設定できる。
【0005】
しかし、施設の数は全国に膨大にあるため、ユーザが入力した施設名の一部では、該当する施設名の件数が膨大となることが多い。そのため、施設名の一覧を表示しても、すべての候補を見るためには、スクロールなどの操作が必要となる。よって、ユーザが所望の施設を見つけるまでに、時間がかかる。
【0006】
この問題を解決するため、特許文献1では、施設名を文字で入力する手段のほかに、地名または施設ジャンルを入力する手段を設けることで、候補の施設数を減らす技術が開示されている。また、特許文献2では、データベースのコンテンツ検索において、コンテンツの候補を絞り込ませるための属性を、検索戦略に基づいて変更する技術が開示されている。
【0007】
特許文献3では、ウェブサイトの検索装置において、検索結果が所定の数を超えて画面に入りきらない場合に、検索結果のウェブサイトに含まれるキーワードをユーザに提示し、ユーザが選択したキーワードを含むウェブサイトに絞り込む技術が開示されている。
【特許文献1】特開2002−107173号
【特許文献2】特開2006−202159号
【特許文献2】特開2004−234421号
【発明の開示】
【発明が解決しようとする課題】
【0008】
しかしながら、上記特許文献1、特許文献2で挙げた技術では、施設ジャンルまたはコンテンツのジャンルの種類が多くある場合には、ユーザは多くのジャンルから候補を選定する必要があるため、ジャンル選定することがユーザにとって困難となる場合があった。また、絞り込み手段として提示された属性を、ユーザが知らない場合は、絞り込むことができなかった。たとえば、「○○郵便局」という施設を目的地に設定したい場合、この施設が「金融機関」に属するか、「公共機関」に属するかについては、ユーザの意識によって区別しづらいことがあり、混同してしまうという問題があった。
【0009】
特許文献3で挙げた技術では、ユーザに提示されたキーワードが、ユーザにとって分かりづらい場合があった。また、ユーザ自身が所望するデータの中に、キーワードが含まれているか否かを知らない可能性がある。また、キーワードの数が多すぎる場合、画面に多数表示されるため、ユーザがキーワードを選定する作業が困難であった。
【0010】
そこで本発明は、上記問題点に鑑みてなされたもので、検索結果に多数の候補がある場合であっても、ユーザにとって容易に理解することができる属性語を絞り込み属性としてユーザに提示することで、絞り込みに関するユーザの労力を低減することを目的とする。
【課題を解決するための手段】
【0011】
本発明は、文字を入力する入力部と、名称と、当該名称に関連する属性語と、前記名称と属性語の関連の度合いを示す関連度と、を格納するデータベースと、前記入力された文字を含む名称をデータベースから検索して、前記検索した名称を名称候補として出力する名称検索部と、前記名称検索部から出力された前記名称候補に関連する属性語を前記データベースから抽出する提示属性作成部と、前記提示属性作成部で抽出された属性語と、前記名称検索部からの名称候補と、を提示する出力部と、を備え、前記提示属性作成部は、前記抽出した属性語の組合せについて、当該属性語に関連付けられた前記名称候補の前記関連度を前記データベースから取得して、前記抽出した属性語間の異なり度合いを表す独立度を演算し、前記抽出した属性語の組合せによる名称候補の網羅性を表す網羅度を演算し、前記属性語ごとに関連する名称候補の件数の均一さを表す均一度を演算し、前記演算した独立度と網羅度と均一度のうち少なくとも1つに基づいて属性語の組合せの得点を計算する第1の得点計算部を有し、前記得点が高い順に前記属性語の組み合わせを前記出力部に出力する。
【0012】
また、前記提示属性作成部は、前記属性語の組合せによる関連度の総合的な高さを表す理解容易度を計算し、前記演算した独立度と網羅度と均一度と理解容易度のうち少なくとも1つに基づいて属性語の組合せの得点を計算する。
【発明の効果】
【0013】
本発明によれば、情報検索装置は、検索結果に施設名などの名称候補が多数ある場合においても、ユーザにとって分かりやすい属性語を絞り込み属性としてユーザに提示することができ、ユーザが容易に絞り込むことが可能となる。よって、施設名などの名称のデータを選択する時間と労力を軽減することが可能となる。
【発明を実施するための最良の形態】
【0014】
以下、本発明の一実施形態を添付図面に基づいて説明する。
【0015】
<第1実施形態>
図1は、第1の実施形態を示し、本発明を適用するカーナビゲーション装置の一例を示すブロック図である。カーナビゲーション装置100は、演算処理を行うCPU(プロセッサ)103と、データやプログラムを一時的に格納するメモリ102と、データやプログラムを格納するストレージ装置105と、演算結果などを表示する表示装置104と、ユーザからの入力を受け付ける入力装置106と、GPS(Global Positioning System)衛星からの信号を受信するレシーバ110と、音声ガイダンスなどを出力する音声出力装置111を含む計算機で構成される。なお、本実施形態では、表示装置104の表示面上に、ユーザからの入力を受け付ける入力装置106としてのタッチパネルを設けた例を示す。また、入力装置106としては、タッチパネルの他にマイクなどの音声入力装置を備えても良い。
【0016】
ストレージ装置105には、地図を構成する地物を点、線、面などの図形要素と、地物の内容を示す文字や数値などの属性要素を含む空間データベース120が格納される。なお、空間データベース120には、現在地や目的地などひとつの地点の情報を格納する地点データベース81と、地点に対応する施設の名称や属性を格納した施設名データベース8が含まれる。
【0017】
メモリ102には、空間データベース120を管理するDBMS(データベース管理システム)108と、DBMS108を介して空間データベース120を利用するアプリケーション109と、DBMS8とアプリケーション109を管理するOS(オペレーションシステム)107がロードされ、CPU103により実行される。アプリケーション109は、レシーバ110で受信したGPS衛星の信号から現在の位置を演算し、現在の地点データを空間データベース120から検索し、地図情報を取得して表示装置4へ出力する。また、カーナビゲーション装置100では、入力装置106からユーザが検索の指令を受け付けると、アプリケーション109はDBMS8を介して空間データベース120を後述するように探索し、要求された検索結果を表示装置104に出力する。なお、OS107、DBMS108、アプリケーション109は記録媒体としてのストレージ装置105に格納され、カーナビゲーション装置100の起動時にメモリ102へロードされ、CPU103によって実行される。
【0018】
(実施の概要)
図2は、カーナビゲーション装置100で実行されるアプリケーション109及びDBMS108の機能要素を示すブロック図である。
【0019】
入力部1は、図1に示した入力装置106であり、ユーザからの入力を受け付け、入力受付部2へ出力する。ここでは、カーナビゲーション装置100の表示装置104の画面に装着されたタッチパネルによる入力を想定する。また、ユーザが入力するものとしては、50音表による施設名の入力と、画面上に表示された属性語に対するユーザの選択と、施設名一覧からの施設選択を想定する。
【0020】
カーナビゲーション装置100の表示装置104に出力される画面の例を図3に示す。画面上に表示した50音表2010から、タッチパネルによって文字列を入力する。この画面はタッチパネルとなっている。タッチパネル2010には50音表と、文字列の修正を行うための後退ボタンが付与されている。また、アルファベットや数字を入力することができる。このタッチパネル2010の上をユーザが押すことにより、1文字ずつ文字列を入力することができる。入力された文字列は、表示部2020に表示される。
【0021】
また、ボタン2030を押すことによって、現在入力されていた文字列に部分一致する施設名の一覧を表示することができる。この一覧表示は、画面上の所定の領域に設定された表示領域2050の領域に行われるが、この様子は後に説明する。
【0022】
また、表示領域2040には、施設名を絞り込むための属性語が表示され、ユーザは表示された属性語を押下することで選択することができるものとする。この表示は、後の実施形態にて説明する。
【0023】
図2の入力受付部2は、入力部1からの出力を得て、入力された結果を入力内容記憶部3に保存する。入力内容記憶部3は、例えばメモリ102に設定される記憶領域である。入力内容記憶部3では、入力部1から送られるさまざまな入力内容を保存するが、ここでは、本発明の特徴となる施設名記憶部31と属性語記憶部32のみを説明する。施設名記憶部31は、ユーザが50音入力によって入力した文字列を記憶する。属性語記憶部32は、ユーザが選択した属性語を記憶する。
【0024】
施設名検索部6は、入力された文字列(すなわち、施設名記憶部31に保存されている文字列)と施設名データベース8に格納されている施設名の読み仮名と比較し、施設名が部分一致する施設名を検索する。この検索においては、高速化を図るために、あらかじめ施設名の読み仮名を形態素のような単位で分割しておき、あらかじめ探索用のインディクスを作成しておく方法を採用しても良い。
【0025】
さらに、施設名検索部6は、部分一致の結果から得られた施設名から、ユーザが指定した属性語(すなわち、属性語記憶部32に保存されている属性語)によって関連付けられている施設名を検索し、その施設名の一覧を得て、提示属性作成部7へ出力する。この「属性語によって関連付けられている施設名」という定義については、後に説明する。
【0026】
施設名データベース8は、カーナビゲーション装置100に登録されている施設名の各種情報を保存する。施設名の各種情報の保存の形態を図4に示す。
【0027】
図4(a)は、施設名データベース8を構成する施設名テーブル8aを示し、図4(b)は施設名データベース8を構成する属性語テーブル8bを示す。図4(a)の施設名テーブル8aに示す3010は、各施設名を一意に決定するID番号である。3020は、施設名称である。3030は、各施設の読み仮名である。3040〜3060は、各施設の住所、電話番号、緯度経度である。3070、3080は、各施設が属するジャンルであり、大ジャンルは大まかな施設のジャンル、小ジャンルはより詳細なジャンルを示す。これらの大ジャンル・小ジャンルは、カーナビゲーション装置100に一般に装備されているジャンルで施設を検索する機能において使われ、ユーザが選択したジャンルと3070、3080にあるジャンルが一致する施設名をユーザに提示する用途で使われる。
【0028】
さらに、施設名データベース8には、各施設名と、それを特徴付ける属性語の対応を保存する属性語テーブル8bを備える。図4(b)の属性語テーブル8bに示す3090は、属性語を表す。3100は、各施設名3020が、各属性語3090とどの程度の関係があるかを表す値である関連度を示し、関連度3100は0から1の範囲で値が付与されている。この関連度3100は、各施設名3020について、各属性語3090がユーザにとってどの程度結び付けられているかを調査することで決定できる。たとえば、ユーザビリティテスティングで行われるカードソートといった方法を用いて決定することができる。なお、前述した「属性語によって関連付けられている施設名」の定義は、属性語3090との関連度3100が0より大きい値に付与されて施設名3010(または3020)のこととして定義する。
【0029】
たとえば、図4(b)において、施設名3020が「札幌市役所」の場合では、カーナビゲーション装置1を使用する全員のユーザが「市役所」であることを認識しているという調査結果があったとする。この調査結果をもとに、施設名「札幌市役所」と属性語「市役所」との関連度3100は、全員のユーザが関連付けを認識していることを反映し、最大値である「1」が付与される。また、施設名「札幌市役所」と属性語「公共機関」との関連度3100については、たとえばユーザのうち95%が公共機関であると認識しているという調査結果があれば、この値を反映して、関連度として0.95を付与する。
【0030】
また、図4(b)において、「東西でんでんランドホテル」は宿泊施設であるが、「東西でんでんランド」という遊園地が存在することが影響し、ユーザのうち、属性語「遊園地」と関連付けることが自然と感じるユーザが7割程度であったという調査結果があったとする。この結果に基づき、施設名「東西でんでんランドホテル」と属性語「遊園地」の関連度は0.7に付与されている。
【0031】
この関連度3100は、必ずしも大規模なユーザ調査を必要とするわけではなく、開発者等が一意に決定してもよい。
【0032】
また、この関連度3100は、施設名3020の1つ1つに別個の値を付与する形態でも良い。しかし、すべての施設名に別個に関連度を付与することは記憶容量の消費につながる。また、同じような施設については、同じ関連度3100の組が付与されていることも予測される。よって、同じ関連度3100の組を持つ施設をグループ化し、各グループに1つの関連度3100の組を付与する実装方法でもよい。また、このグループとしては、図4(a)に示した施設ジャンル1(3070)、施設ジャンル2(3080)をそのまま採用しても良い。
【0033】
また、この関連度3100は、0から1までの連続量である必要はなく、関連度3100の値を少数の代表的な値で量子化することによって、記憶容量を削減と処理速度の高速化を図ることができる。たとえば、関連度3100を4種類に限定し、各種類に対応する値を0、0.3、0.7、1.0とすれば、1つの関連度3100を2ビットの記憶容量で実装することが可能である。極端な例では、関連度3100を0と1の2値によって表現しても良い。この場合は、1つの関連度3100を1ビットで実装できる。
【0034】
図2に示す提示属性作成部7は、属性語テーブル8bの中から、ユーザにとって区別しやすい属性語3090を選んでユーザに提示する。この提示属性作成部7の処理方法は後に説明するが、属性語3090のバリーエーションとしては、属性語テーブル8b内にさまざまなものが用意されていることが望ましい。そのため、属性語間の関係はとくに階層になっている必要もなく、またさまざまな粒度のものがあっても良い。また、各属性語が被覆する施設が重複していても良い。また、属性語3090は、施設の種別を表すものだけでなく、たとえば地名(東京都、千葉県、○○市、など)、営業時間(24時間営業、夜閉店、土日閉店)、立地(国道○○号線沿い、市道沿い)といったさまざまな観点のものが混在していても良い。
【0035】
図2に示す出力部9は、提示属性作成部7から得られた属性語を表示装置104の画面あるいは音声出力装置111のスピーカから出力する。
【0036】
(提示属性作成部の処理)
つぎに、提示属性作成部7で行われる処理の一例を説明する。また、提示属性作成部7で行われる処理のフローチャートを図6に示す。
【0037】
前提として、ユーザが施設名の文字として「みさつ」と入力したとする(図3)。この結果、施設名記憶部31には文字列「みさつ」が保存されている。また、属性語記憶部32は初期状態では空である。
【0038】
施設名検索部6は、文字列「みさつ」と部分一致する施設名を検索し、13件の施設名候補が得られたとする。また、属性語のうち、施設名候補との関連度3100が0より大きい値であった属性語のみを抽出したところ、16個の属性語が抽出され、施設名候補と属性語の関連度3100は図5に示す値であったとする。なお、図5は施設名検索部6の検索結果を示し、施設名候補4010と、属性語3090及び関連度3100の関係を示す。
【0039】
提示属性作成部7は、上記16個の属性語3090から、絞り込み属性として3個の属性語3090を選定することを想定する。
【0040】
各記号を以下のように定義する。
【0041】
属性語の総数:M (本実施形態ではM=16)
表示する属性語の数:m (本実施形態ではm=3)
候補施設数:n (本実施形態ではn=13)
施設名:Li (i=1,2,…,n)
提示属性作成部7の処理のフローチャートを図6に示す。
【0042】
最初に図6のステップ5010では、表示する属性の数を設定する。ここでは、予め設定した属性の数(M)を3に設定する。
【0043】
ステップ5020では、得点最大値をリセットし、また表示する属性組合せを格納する変数をリセットする。
【0044】
ステップ5030は、ループを開始する。1回のループでは、M個ある属性語から、任意の個数を取り出す。このループを、すべてのm個の属性語の組合せについて行う。よって、ループの回数は、
【0045】
【数1】
【0046】
となる。
【0047】
ステップ5040は、M個ある属性語から、任意のm個を取り出す。ここで取り出した属性語は、ai(i=1,2,…,m)と表すこととする。また、施設名Lと属性aに対する関連度3100を、r(L,a)で表す。また、後の得点計算に使用するため、階段関数Hcを次式で定義する。
【0048】
【数2】
【0049】
(独立度の計算)
ステップ5050では、属性語の組合せに対する独立度を計算する。独立度とは、ある属性語によって施設を絞り込んだ場合に、他の属性語によって絞り込まれる施設名の内訳とどのくらい異なるものとなるかを示す指標である。つまり、独立度は属性語が重ならないように選択する指標となり、独立度が高ければ、施設名の候補に対する属性語の重複が低減される。一方、独立度が低い場合には、施設名の候補に対する属性語の重複が増大する。
【0050】
まず、各施設名に対して、関連度3100が0より大きい値に付与されている属性語の個数を数える。そして、数えた結果が1以上であったときにのみ、この値より1を引く。この属性語の独立度の計算結果をCIND(Li)で表す。具体的な計算式は下記のとおりである。
【0051】
【数3】
【0052】
このCIND(Li)を、すべての施設名候補で合計する。この合計値が大きいということは、複数の属性語が同一の施設名に関連付けられていることを意味する。よって、1つの属性語をユーザが選定して絞り込みを行ったとしても、絞り込まれた結果の施設件数はあまり小さくなく、絞り込み効率が低いということとなる。よって、この合計値は小さいほど、絞り込み効率の高い属性語の組み合わせと捉えることができる。
【0053】
そこで、この合計値を施設件数で正規化し、さらに1から引くことにより、独立度PINDとして定義する。
【0054】
【数4】
【0055】
独立度PINDの計算例を図7に示す。図7(a)は、属性語として「買い物」、「レジャー」、「公共機関」の3個を組み合わせている。この場合、 2個以上の属性語が同一施設名と関連度3100を持つものは、6010に示す「美佐津市立温泉保養所」のみである。一方、図7(b)に示す「病院」、「歯科」、「総合病院」の属性語の組合せでは、13個の施設のうち6030、6031に示す施設において、複数の属性語が対応付けられている。この結果、独立度を比較すると、図7(a)の独立度(6020)のほうが図7(a)の独立度(6040)より高い値となっている。
【0056】
図7(b)に示す「病院」、「歯科」、「総合病院」という属性語を絞り込みのための属性語としてユーザに提示した場合、互いに混同しやすく、かつ重複件数も多いため、絞り込みにあまり寄与しないことが予測される。上記の計算により、この寄与度合いを独立度PINDとして定量的に評価することが可能となる。
【0057】
(網羅度の計算)
次に、図6のステップ5060では、属性語の組合せに対する網羅度を計算する。網羅度とは、属性語の組合せによって、施設名候補のうちどの程度の割合が選択可能となるかを示す指標である。すなわち、網羅度が高い場合には、施設名の候補に対応する属性語の候補が表示される。一方、網羅度が低い場合には、施設名の候補に対応する属性語の候補が表示されない。
【0058】
各施設名に対して、関連度3100が1個以上の属性で0より大きい値に付与されている施設の個数を数える。この施設の個数を数えた結果をCEXH(Li)とすると、下記の式で計算される。
【0059】
【数5】
【0060】
これをすべての施設名候補で合計する。この合計値が大きいということは、属性語の組合せによって多くの施設がカバーされ、属性語を選択することによって絞込みから漏れる施設数が少ないことを意味する。この合計値を施設の数で正規化し、網羅度pEXHとして定義する。
【0061】
【数6】
【0062】
網羅度pEXHの計算例を図8に示す。図8(a)は、属性語として「病院」、「宿泊施設」、「公共機関」の3個を組み合わせている。この場合、1つ以上の属性語との間に0より大きい関連度3100が付与されている施設の数は、7010に示すとおり9個であった。一方、図8(b)に示す「組合」、「スーパー」、「郵便局」の属性の場合には、1つ以上の属性語との間に0より大きい関連度3100が付与されている施設の数は、7030に示すとおり3個であった。この結果、図8(a)の属性語の組合せのほうがたくさんの施設をカバーしているため、図8(a)の網羅度(7020)のほうが図8(b)に示した網羅度(7040)より大きくなる。
【0063】
(均一度の計算)
図6のステップ5070では、属性語の組合せに対する均一度を計算する。均一度とは、ある属性語の組合せにおいて、各属性語を選択して絞り込みを行った場合、残る施設件数が各属性語によってどの程度同じ数であるかを示す指標である。すなわち、均一度は、提示する属性語に対応する候補の数の均一さの度合いを示す。均一度が高い場合は、各属性語に対応する候補の数がほぼ等しい。一方、均一度が低い場合には、各属性語に対応する候補の数が乖離する。
【0064】
まず、各属性語について、関連度3100が0より大きい値に付与されている施設の数を数える。この値をDEQU(ai)とすると、下記の式で計算される。
【0065】
【数7】
【0066】
つぎに、関連度3100が0を超える施設数DEQU(ai)の標準偏差を計算する。標準偏差が大きいということは、各属性語を選定した場合に、絞り込まれる施設数が属性語によって多すぎるたり少なすぎたりして、ばらつき、絞り込みにとって非効率な属性語が提示される可能性がある。そこで、この標準偏差を施設数で正規化し、1から引くことで均一度pEQUを計算する。
【0067】
【数8】
【0068】
均一度pEQUの計算例を図9に示す。図9(a)は、属性語として「ペット」、「自動車」、「歯科」の3個を組み合わせている。それぞれの属性語との間に関連度3100が付与されている施設の数は、DEQU8010に示すとおり、3個、2個、2個となる。一方、図9(b)は、属性語として「宿泊施設」、「温泉」、「郵便局」の3個を組み合わせている。このとき、各属性語との間に関連度3100が付与されている施設の数は、DEQU8030に示すとおり、4個、1個、1個となる。
【0069】
図9(b)の属性語は、図9(a)に比べて、各属性語に関連付けられる施設数のばらつきが大きい。そのため、たとえば絞込みのために、ユーザに「宿泊施設」、「温泉」、「郵便局」という属性語を提示した場合、ユーザが温泉または郵便局に行きたければ、「温泉」、「郵便局」を選択することで1個に絞り込めるため良いが、宿泊施設に行きたい場合には、「宿泊施設」を選択しても残り施設数が多いため、あまり効率的ではない。一方、図9(a)の場合には、どの属性語を選んでもおよそ3個程度の施設が残るため、どの施設にユーザが行きたい場合でも残り件数を同程度に減らすことが可能である。このことを踏まえて、均一度を比較すると、図9(a)の値(8020)のほうが図9(b)の値(8040)より大きく計算されており、より均一になる属性語組合せを選択することができる。
【0070】
(理解容易度の計算)
図6のステップ5080では、属性語の組合せに対する理解容易度を計算する。理解容易度とは、ある属性語の組合せが、ユーザにとってどの程度理解しやすいかを示す指標である。
【0071】
まず、各属性語に、関連度3100が0より大きい値に付与されている施設だけを対象として、関連度3100の平均値を計算する。この関連度3100の平均値をDEAS(ai)とすると、下記の式で計算される。
【0072】
【数9】
【0073】
この関連度の平均値DEAS(ai)が高い属性語は、関連度3100が総じて高いことを意味する。関連度3100とは、施設名に対する属性語の想起のしやすさを示す値であった。よって、関連度の平均値DEAS(ai)が高い属性語は、ユーザにとって、1つの施設がその属性語に属するか否かを判断しやすいということになる。一方、関連度の平均値DEAS(ai)が低いと、ユーザが希望する施設を選ぶ際に、その属性語を選んでよいかどうかがユーザにとって分かりづらいことを示す。
【0074】
そこで、この関連度の平均値DEAS(ai)を属性語の数で正規化し、理解容易度PEASを定義する。
【0075】
【数10】
【0076】
理解容易度は、属性語と施設名の対応関係の分かりやすさを示す指標である。理解容易度が高い場合は、施設名に対応する属性語が直感的に分かりやすい。一方、理解容易度が低い場合は、施設名に対応する属性語に違和感を与えやすい。
【0077】
理解容易度の計算例を図10に示す。図10(a)は、属性語として「スーパー」、「レジャー」、「郵便局」の3個を組み合わせている。関連度3100が0より大きい値だけを抽出し、その平均値を算出するとDEAS(9010)のように、各属性語について、1.0、0.863、1.0となり、どれも1に近い値となる。一方、図10(b)は、属性語として「自動車」、「宿泊施設」、「公共機関」の3個を組み合わせている。この例では、低い関連度3100が散見される。たとえば施設「ペットホテル美佐津」において、「宿泊施設」に対する関連度3100が0.4と低くなっている。これは、ペットホテルについて、それを宿泊施設とみなすかどうかが、ユーザにとって判断しづらいことを示している。このようなことを反映し、関連度3100が0より大きい値だけを抽出した平均値を算出すると(9030)、各属性語について、0.875、0.6、0.575となり、図10(a)と比べて低い値となっている。
【0078】
さらに、理解容易度を計算すると、図10(a)の値(9020)のほうが図10(b)の値(9040)より高い値となっている。この結果、理解容易度がより高い属性語の組合せを選定することによって、よりユーザにとって区別しやすい属性語の組合せを選定することができる。
【0079】
(得点の計算)
図6のステップ5090では、これまで算出した各指標を総合的に判断して、1つの属性語の組合せに対する得点を計算する。ここでは、各指標を重み付け加算して得点を求めることとする。1つの属性語組合せに対する得点Sは下記で計算される。
【0080】
【数11】
【0081】
wIND、wEXH、wEQU、wEASは、それぞれ、独立度、網羅度、均一度、理解容易度に対する重み付け係数である。
【0082】
図6のステップ5100、5110では、得点計算の結果、これまでの計算で最大得点を超える場合には、最大得点を更新し、かつ提示する属性語組合せとして保存していた属性語組合せも更新する。
【0083】
ステップ5120は、ループ終端である。すべての属性語組合せに対して、得点を計算し、最大得点となる属性語組合せが求められるまで、ステップ5040〜5110までの処理を繰り返す。
【0084】
(最大得点となる属性語の出力)
ステップ5130では、最大得点となった属性語の組合せを、出力部9に出力する。これにより、表示装置104の画面に絞り込みのための属性語が提示され、ユーザは絞り込みを行うことが可能となる。
【0085】
図11は、図5の施設名候補に対して、各属性語の組合せに対する得点計算を行い、得点が高かったものから順に属性の組み合わせを並べた図である。なお、重み付け係数は図中10020に示す値に従って計算した。
【0086】
図11において、得点がもっとも高かった属性語の組合せは、10010に示す「病院」、「買い物」、「レジャー」であった。そこで、提示属性作成部7は、この3つの属性語を出力部9へ出力する。
【0087】
これを受けて、出力部9は、表示装置104の画面に属性語を表示する。これと同時に、音声出力装置111のスピーカから「病院、買い物、レジャーのいずれかから絞り込めます」といった音声ガイダンスを流しても良い。
【0088】
表示が更新された画面を図12に示す。図中の領域2040に示すように、「病院」、「買い物」、「レジャー」という提示属性作成部7によって選定された3つの属性語を表示している。また、各属性語に対して関連度3100が0より大きい値に付与されている施設数も併せてカッコ内に表示している。
【0089】
(絞込み属性を選択した場合)
ここから、ユーザは、「美佐津にあって、市がやっている宿泊施設に行きたい」と考えているが、その施設の正式名称が「美佐津市立温泉保養所」であることは知らないと仮定する。そして、3つの属性語から、もっともユーザの目的に近い「レジャー」を選択し、画面上のボタン11020を押下したとする。
【0090】
この押下は、入力部1によって受理され、入力受付部2によって属性語記憶部32に保存される。
【0091】
つぎに、施設名検索部6は、文字列「みさつ」と部分一致し、属性語「レジャー」との関連度3100が0より大きい施設名の一覧を作成する。この一覧は図13で示すようになり、施設名候補12010に示した4件の施設が候補として残る。また、属性語12020には、施設名候補との間に1つ以上、0より大きい関連度3100が付与されているものを示している。また、すでに選択された「レジャー」は除いてある。
【0092】
提示属性作成部7は、図13に示した施設名候補と属性語間の関連度3100から、図6の処理手順にしたがい、表示装置104に提示する属性語を選定する。この手順はすでに説明した手順と重複するため省略する。この処理の結果、「ペット」、「宿泊施設」、「温泉」という3つの属性語が選定される。そこで、提示属性作成部7は、この3つの属性語を出力部9へ出力する。
【0093】
これを受けて、出力部9は、表示装置104の画面上の表示の更新と、音声出力装置111からの音声ガイダンスの出力を行う。更新された表示装置104の画面を図14(a)に示す。表示領域2040には、選定された属性語である「ペット」、「宿泊施設」、「温泉」が表示され、かつ施設数もカッコ内に表示される。また、表示領域13020に示すように、すでにユーザが選定した属性語を表示しても良い。
【0094】
さらに、ユーザは「宿泊施設」を選択する。すると、残りの施設は2件となる。そこで、カーナビゲーション装置100は、残りの施設数が十分少ないと判断し、図14(b)の表示に切り替える。ここでは、表示領域13100に施設名候補をすべて一覧表示している。この画面から、ユーザが「美佐津市立温泉保養所」を選択することで、施設を決定することができる。
【0095】
以上説明したように、本実施形態では、絞り込みに使用する属性語を、たくさんの属性語のなかから、施設名候補に応じて動的に作成する。これにより、常にユーザにとって分かりやすく、かつ絞り込み効率が高い属性語を提示することができる。
【0096】
(文字の継続入力)
上記に説明した実施形態では、属性語が表示された状態(図12)から、ユーザが属性語を選定する場合を説明した。一方、本発明では、属性語がすでに表示されている状態においても、ユーザは継続して文字列を入力することが可能となる。
【0097】
この例として、図12の状態から、ユーザが「し」を追加して入力したとする。この押下は、入力部1によって受理され、入力受付部2によって施設名記憶部31が「みさつし」に更新される。一方、属性語記憶部32は空のままである。
【0098】
つぎに、施設名検索部6は、文字列「みさつし」と部分一致する施設名の一覧を作成する。この一覧は図15となり、施設名候補14010に示した9件の施設が候補として残る。また、属性語14020には、施設名候補との間に1つ以上、0より大きい関連度3100が付与されているものを示している。
【0099】
提示属性作成部7は、図15に示した施設名候補14010と属性語間の関連度3100から、図6の処理手順にしたがい、提示する属性語を選定する。この手順はすでに説明した手順と重複するため省略する。この処理の結果、「病院」、「金融機関」、「レジャー」という3つの属性が選定される。そこで、提示属性作成部7は、この3つの属性を出力部9へ出力する。
【0100】
これを受けて、出力部9は、表示装置104の画面上の表示の更新と、音声出力装置111からの音声ガイダンスの出力を行う。更新された表示装置104の画面を図16に示す。表示領域2040には、選定された属性語である「ペット」、「宿泊施設」、「温泉」が表示され、かつ施設数も表示される。
【0101】
このように、ユーザに提示する属性語は、施設名の候補が変化するたびに、もっとも得点が高い組合せに変化する。これにより、常にユーザにとって分かりやすく、かつ絞り込みに効率的な属性語を提示することができる。
【0102】
(閾値の導入)
以上説明した実施形態では、ある属性語を選択したとき候補に残す施設として、関連度3100が0より大きいものをすべて選定していた。これは、関連度3100が0より大きければ、何らかの関連があり、その施設を選ぶためにその属性語を選ぶユーザが少なからず存在するためである。
【0103】
しかしながら、極端に小さい関連度3100については、ユーザのうちごく少数のユーザだけが、施設と属性語の間に関連があると捉えており、その調査結果を反映して、極端に小さい関連度3100が付与されている場合もありうる。たとえば、図5の例では、施設「美薩動物病院」に対して、「総合病院」との関連度3100が0.05だけ付与されている。これは、「美薩動物病院」を「総合病院」に対応付けるユーザが極少数いる調査結果を受けて付与したとする。しかしながら、多くのユーザにとっては、動物病院は総合病院とは考えていない。そのため、属性語「総合病院」を選んだときに、施設名候補に「美薩動物病院」が残っていると、かえって混乱を招く可能性がある。
【0104】
このような現象に対処するため、低い関連度3100については、その関連は無いとみなして、属性語の選定を行う方法を取ることができる。この方法は、関連度3100に対する閾値を設けることで実装できる。すなわち、関連が無いとみなす関連度3100の閾値をTignoreとすると、施設名データベース8に元から記憶されている関連度3100に対して、再定義した関連度3100r’(L,a)を下記のように計算する。
【0105】
【数12】
【0106】
すなわち、関連度3100のうち、閾値を越えるものだけを残し、それ以外は0とみなす。このように再定義した関連度3100を用いて、属性語の選定を行うことにより、極端に低い関連度3100に起因するユーザの混乱を防ぐことができる。
【0107】
以上のように本発明によれば、検索結果に施設名などの候補が多数ある場合においても、ユーザにとって分かりやすい属性語を絞り込み属性としてユーザに提示するため、ユーザが容易に絞り込むことが可能となる。すなわち、従来例では、施設名称に対する属性語があらかじめ決まっており,その中から,絞込みに使う属性を選択するのに対し、本発明では,属性語と施設名候補の関連度によって提示する施設名候補を動的に変化させることができる。これにより、ユーザにとって分かりやすい属性語を絞り込み属性として優先的に提示できるのである。
【0108】
<第2実施形態>
(形態素)
本発明の第2の実施形態を説明する。本実施形態では、第1の実施例における属性語として、施設名を分割した形態素を用いるものである。
【0109】
一般に施設名は、複数の単語が複合された形で表現されることが多い。そこで、施設名をこの単語単位に分割し、属性語としてそのまま使用することを考える。以降で述べる形態素とは、この「施設名を単語単位に分割した結果」を表すものとする。
【0110】
この形態素への分割では、ユーザにとって自然でと感じる位置で分割するものとする。
【0111】
たとえば、「美佐津市立美佐津商業高等学校」という施設名を形態素に分割する場合、「美佐津市・立」といった分割方法は、「立」という単独で意味を成さない部分が出力されているため、ユーザにとって不自然に感じる。この場合には、「美佐津・市立・美佐津・商業・高等・学校」(中点が分割位置)といった分割を行えば、ユーザにとって自然な形態素に分割される。
【0112】
(施設名−形態素間のデータの持ち方/静的テーブル)
図17には、前記第1実施形態の図4に記載した施設名3020に関する形態素との関連度を定義した表を示す。図中16020は、形態素の一覧である。図中16030は、各施設名16010と、各形態素の間の関連度を示す。この関連度16030の決定方法としては、もっとも単純なものとしては、施設名の中に形態素が含まれる場合には1、含まれない場合には0とする。しかし、この図では、0から1までの連続値を付与している。この値は、施設名の中に、その形態素が含まれていることが、より多くのユーザに想起されるほど、大きい値を付与している。
【0113】
たとえば、施設「美佐津市立病院」に対して、名称に「病院」が含まれることは、全員のユーザによって知られているとする。このことを反映し、関連度16030は最大の1を付与している。一方、施設「東西でんでんランド」については、1割のユーザは、「東西」が名称についていないと考えていて、「でんでんランド」などと思っているとする。すなわち、「東西」が施設名に付くことを知っているのが9割であったとする。このことを反映し、関連度16030は0.9を付与している。
【0114】
また、形態素の中には、最初からユーザが想起しづらい形態素がある。たとえば、「財団法人」、「株式会社」といった形態素は、多くの施設名に含まれるものの、実際にユーザが想起する施設名には含まれていないことが多い。そこで、これらのユーザが想起しづらい形態素は、施設名データベース8に最初から保存しないことでもよい。
【0115】
(施設名−形態素間のデータの持ち方/動的な形態素分割)
また、施設名を形態素分割する方法は、図17のようにあらかじめテーブルを保持する方法に限らず、動的に形態素分割を行ってもよい。形態素分割の方法は、公知の手法を用いればよく、例えば、「http://chasen.naist.jp/」などを採用すればよい。
【0116】
たとえば、形態素と、各形態素の品詞を辞書としてもっておき、最長一致法、分割数最小法、接続コスト最小法といった手法を用いることで、施設名を形態素単位に分割することができる。また品詞としては、施設名に特有の品詞の分類を行うことができる。公知の文献(岩瀬成人: 自然言語処理を用いた企業名解析方式、 電子情報通信学会論文誌、 vol.J82-DII、 no.8、 pp.1305-1314、 1999)では、施設名を分割したときの意味カテゴリを調査している。
【0117】
この文献で記載されている意味カテゴリを品詞として用いるとすれば、たとえば、品詞「固有名」はユーザにとってより施設を想起しやすいと考えられるため、高い関連度を付与し、また、品詞「職業語尾」はユーザにとってより施設を想起しづらいことが推測されるため、低い関連度を付与するといったことができる。
【0118】
(具体的な処理の流れ)
つぎに、ユーザが「東西電力病院」を目的地に設定したい場面を想定し、カーナビゲーション装置100のタッチパネルから「とうざいで」までの文字を入力したと仮定し、処理について説明する。
【0119】
実施するカーナビゲーション装置100は、図2と同様である。この図2に関しては、第1の実施形態にて説明したため、ここでは説明を省略する。
【0120】
ユーザは、表示装置104の画面上に表示した50音表から、タッチパネルによって文字列「とうざいで」を入力する。この文字列は、前記第1実施形態の図3に示した入力部1、入力受付部2の動作により、入力内容記憶部3のなかの施設名記憶部31に保存される。なお、属性語はとくに選択されていないため、属性語記憶部32は空である。
【0121】
施設名検索部6は、入力された文字列「とうざいで」と施設名データベース8に格納されている施設名の読み仮名と比較し、施設名が部分一致する施設名を検索する。
【0122】
提示属性作成部7の処理の方法を説明する。処理の手順は、第1の実施形態と同様である。処理のフローチャートも図6で同様である。
【0123】
施設名検索部6は、文字列「とうざいで」と部分一致する施設を検索し、31件の施設名候補が得られたとする。また、形態素のうち、施設名候補との関連度が0より大きい値であった形態素のみを抽出したところ、施設と形態素の関連度は図18に示す値であったとする。なお、この図における施設名17010では、形態素の区切り位置を図中「・」(中点)で示している。
【0124】
提示属性作成部7は、この形態素から、絞り込みのための属性語として3個の形態素17020を選定することを想定する。そして、各形態素の組合せに対して、第1の実施形態と同様の方法で、得点を計算し、その最大となる形態素の組合せを出力する。この得点の計算方法は、第1の実施例と同じであるため、ここでは説明を省略する。
【0125】
図19は、図18の施設名候補に対して、各形態素の組合せに対する得点計算を行い、得点が高かったものから順に並べた図である。なお、重み付け係数は18020に示す値に従って計算した。得点がもっとも高かった形態素の組合せは、18010に示す「出島」、「電力」、「デザイン」であった。そこで、提示属性作成部7は、この3つの形態素を出力部9へ出力する。
【0126】
これを受けて、出力部9は、表示装置104の画面に形態素を表示する。これと同時に、音声出力装置111はスピーカから「出島、電力、デザインのいずれかから絞り込めます」といった音声ガイダンスを流しても良い。更新された表示装置104の画面を図20に示す。表示領域2040に示すように、「出島」、「電力」、「デザイン」という提示属性作成部7によって選定された3つの形態素を表示している。また、各形態素に対して関連度が0より大きい値に付与されている施設数も合わせてカッコ内に表示している。
【0127】
この状態から、ユーザは、3つの形態素から、「電力」を選択し、図20に示す画面上のボタン19020を押下したとする。
【0128】
この押下は、入力部1によって受理され、入力受付部2によって属性語記憶部32に保存される。
【0129】
つぎに、施設名検索部6は、文字列「とうざいで」と部分一致し、形態素「電力」との関連度が0より大きい施設名の一覧を作成する。この一覧は図21となり、20010に示した7件の施設名が候補として残る。また、属性語20020には、施設名候補との間に1つ以上、0より大きい関連度が付与されているものを示している。また、すでに選択された「電力」と、すべての施設名に含まれる「東西」は除いてある。
【0130】
提示属性作成部7は、図21に示した施設名候補と属性語間の関連度から、第1の実施形態にしたがい、提示する形態素を選定する。この手順はすでに説明した手順と重複するため省略する。この処理の結果、「保養所」、「展示」、「病院」という3つの形態素が選定される。そこで、提示属性作成部7は、この3つの属性を出力部9へ出力する。
【0131】
これを受けて、出力部9は、表示装置104の画面上の表示の更新と、音声ガイダンスの出力を行う。更新された表示装置104の画面を図22(a)に示す。表示領域2040には、選定された属性語である「保養所」、「展示」、「病院」が表示され、かつ施設数も表示される。また、表示領域21020に示すように、すでにユーザが選定した形態素を表示しても良い。
【0132】
さらに、ユーザは「病院」を選択する。すると、残りの施設は1件となり、施設名候補の一覧表示に切り替える(図22(b))ここから、ユーザが「東西電力病院」を選択することで、施設を決定することができる。
【0133】
また、図20の画面から、継続してユーザが施設名を入力した場合(たとえば、「ん」を入力した場合)には、その都度、絞込みのために表示する形態素を変更する。この方法は、第1の実施形態でも説明したため、省略する。
【0134】
以上説明したように、絞り込みに使用する属性語として、施設名の一部分である形態素を使用することで、ユーザにとって分かりやすく、かつ効率的に施設を絞り込むことが可能となる。
【0135】
(省略、言い換えの記載)
なお、図17に記載した施設名と形態素の関係としては、必ずしも施設名に含まれない形態素に対して、関連度を付与しても良い。たとえば、施設名に「東西電力」がつくものに関して、ユーザの多くが「東電」と略することが受け入れられるのであれば、形態素として「東電」を用意し、関連度を付与しても良い。また、施設名「東西でんでんランド」に対して、ユーザの多くが「TDL」と称することが受け入れられるのであれば、形態素として「TDL」を用意し、関連度を付与しても良い。
【0136】
以上のように、施設名中の形態素のうち、形態素の出現位置に応じて、ユーザに提示する属性語(形態素)を動的に変化させることで、前記第1実施形態と同様に、ユーザにとって分かりやすい属性語を絞り込み属性として優先的に提示できるのである。
【0137】
<第3の実施形態>
(「その他」属性の利用)
本発明の第3の実施形態を説明する。この実施形態では、ユーザに提示する絞り込みのための属性語として、いずれの属性語にも属さないものことを表す「その他属性」も合わせて提示することで、ユーザがより絞り込みを容易に行えるようにするものである。
【0138】
この実施形態は、第1の実施形態の構成図2において、提示属性作成部7における提示属性の選定方法に違いがある。そこで、提示属性作成部7の処理の方法を説明する。
【0139】
前提として、ユーザが施設名の文字として「みさつ」と入力したとする(図3)。この結果、施設名記憶部31には文字列「みさつ」が保存されている。また、属性語記憶部32は空であったとする。
【0140】
施設名検索部6は、文字列「みさつ」と部分一致する施設を検索し、13件の施設名候補が得られたとする。また、属性語のうち、施設名候補との関連度3100が0より大きい値であった属性語のみを抽出したところ、16個の属性語が抽出され、施設と属性語の関連度3100は図5に示す値であったとする。
【0141】
提示属性作成部7は、この16個の属性語から、絞り込み属性として2個を選定することを想定する。
【0142】
記号の定義は、第1の実施形態と同様、下記のとおりとする。
【0143】
属性語の総数:M (本実施形態では16)
表示する属性語の数:m (本実施形態では2)
候補施設数:n (本実施形態では13)
施設名:Li (i=1,2,…,n)
提示属性作成部7の処理のフローチャートを図23に示す。
【0144】
最初に図23のステップ22010では、表示する属性の数を設定する。ここでは、属性の数(m)を2に設定する。
【0145】
ステップ22020では、得点最大値をリセットし、また表示する属性組合せを格納する変数をリセットする。
【0146】
ステップ22030は、ループを開始する。1回のループでは、M個ある属性語から、任意のn個を取り出す。このループを、すべての個の属性語の組合せについて行う。よって、ループの回数は、
【0147】
【数13】
【0148】
となる。
【0149】
ステップ22040は、M個ある属性語から、任意のm個を取り出す。ここで取り出した属性語は、ai (i=1,2,…,m)と表すこととする。また、施設名Lと属性aに対する関連度をr(L、a)、で表す。
【0150】
(その他属性の関連度の計算)
ステップ22045は、上記ステップ22040で取り出したm個の属性語の組合せに該当しない施設を検索し、この施設に対してその他属性との関連度を付与する。
【0151】
まず、その他属性をaotherwiseという記号で表す。施設名Li、その他属性aotherwiseとの関連度3100r(Li、aotherwise)は、下記の式で計算する。
【0152】
【数14】
【0153】
すなわち、ある施設を特徴づける属性語のなかでの最大の関連度を求める。そして、その最大の関連度を1から引いた値を求める。この値が、閾値(T)より大きければ、その値を「その他属性の関連度」とする。一方、閾値より低ければ、その他属性の関連度を付与せず、0とする。
【0154】
関連度が0.9であった場合に、閾値を設けなければ、その他属性との関連度が0.1となる。これは、施設が「ホテル」でもあるし、いずれの属性語にも属さない「その他」でもあるということを意味している。このような場合に、もしユーザに「ホテル」と「その他」という2つの属性語を提示すると、ユーザが混乱する恐れがある。そこで、閾値を設け、すでに属性語との関連度がある程度の大きさを持っている場合には、その他属性との関連度を付与しないようにした。
【0155】
その他属性の計算をした例を図24に示す。ここでは、属性語の組み合わせとして、「宿泊施設」、「公共機関」を選定した場合のその他属性の関連度を表している(図中23010)。なお、閾値は予め設定された0.5の条件で計算を行っている。
【0156】
(独立度の計算)
ステップ22050では、属性語の組合せに対する独立度を計算する。独立度の意味合いは、第1の実施形態と同様であるが、その他属性も1つの属性語であるとみなした形で計算を行う。
【0157】
まず、各施設名に対して、その他属性も含めて、関連度が付与されている属性語の個数を数える。そして、その数が1以上であったときにのみ、1を引く。この計算結果をC’IND(Li)で表す。具体的な計算式は下記のとおりである。
【0158】
【数15】
【0159】
このC’IND(Li)を、すべての施設名候補で合計する。この合計値を施設件数で正規化し、さらに1から引くことにより、独立度PINDとして定義する。
【0160】
【数16】
【0161】
属性語として「宿泊施設」、「公共機関」と「その他属性」を組み合わせた場合の独立度PINDの計算例を図25に示す。
【0162】
(網羅度の計算)
図23のステップ22060では、属性語の組合せに対する網羅度を計算する。網羅度の意味合いは、第1の実施形態と同様である
各施設名Liに対して、関連度3100が1個以上の属性で0より大きい値に付与されている施設の個数を数える。この数えた結果をC’EXH(Li)とすると、下記の式で計算される。
【0163】
【数17】
【0164】
これをすべての施設名候補で合計する。この合計値が大きいということは、属性語の組合せによって多くの施設がカバーされ、いずれかの属性語を選択することによって絞込みから漏れる施設数が少ないことを意味する。この合計値を施設数で正規化し、網羅度pEXHとして定義する。
【0165】
【数18】
【0166】
属性語として「宿泊施設」、「公共機関」を組み合わせた場合の網羅度の計算例を図26に示す。
【0167】
(均一度の計算)
図23のステップ22070では、属性語の組合せに対する均一度を計算する。独立度の意味合いは、第1の実施形態と同様であるが、その他属性も1つの属性語であるとみなした形で計算を行う。
【0168】
まず、各属性語aiについて、関連度が0より大きい値に付与されている施設の数を数える。その他属性aotherwiseについても、0より大きい値に付与されている施設の数を数える。それぞれの値をD’EQU(ai)、D’EQU(aotherwise)とすると、下記の式で計算される。
【0169】
【数19】
【0170】
つぎに、D’EQU(ai)、D’EQU(aotherwise)の標準偏差を計算する。さらに、標準偏差を施設数で正規化し、1より引くことで均一度pEQUを計算する。
【0171】
【数20】
【0172】
ただし、
【0173】
【数21】
【0174】
属性語として「宿泊施設」、「公共機関」と「その他属性」を組み合わせた場合の均一度の計算例を図27に示す。
【0175】
(理解容易度の計算)
図23のステップ22080では、属性語の組合せに対する理解容易度を計算する。理解容易度の意味合いは、第1の実施形態と同様であるが、その他属性も1つの属性語であるとみなした形で計算を行う。
【0176】
まず、各属性語に、関連度が0より大きい値に付与されている施設だけを対象として、関連度の平均値を計算する。また、その他属性aotherwiseとの間に0より大きい関連度が付与されている施設を対象として、関連度の平均値を計算する。それぞれの平均値をD’EAS(ai)とすると、下記の式で計算される。
【0177】
【数22】
【0178】
この平均値を属性数で正規化し、理解容易度pEASを定義する。
【0179】
【数23】
【0180】
属性語として「宿泊施設」、「公共機関」と「その他属性」を組み合わせた場合の理解容易度の計算例を図28に示す。
【0181】
(得点の計算)
図23のステップの22090では、これまで算出した各指標を総合的に判断して、1つの属性組合せに対する得点を計算する。ここでは、各指標を重み付け加算して得点を求めることとする。1つの属性組合せに対する得点は下記で計算される。
【0182】
【数24】
【0183】
wIND、wEXH、wEQU、wEASは、それぞれ、独立度、網羅度、均一度、理解容易度に対する重み付け係数である。
【0184】
ステップ22100、22110では、得点計算の結果、これまでの計算で最大得点を超える場合には、最大得点を更新し、かつ提示する属性語組合せとして保存していた属性語組合せも更新する。
【0185】
ステップ22120は、ループ終端である。すべての属性語組合せに対して、得点Sを計算し、最大得点となる属性語組合せが求められるまで、22040〜22110までの処理を繰り返す。
【0186】
(最大得点となる属性の出力)
ステップ22130では、最大得点となった属性語の組合せを、出力部9に出力する。これにより、画面に絞り込みのための属性語が提示され、ユーザは絞り込みを行うことが可能となる。
【0187】
図29は、図5の施設名候補に対して、2つの属性語とその他属性の組合せに対する得点計算を行い、得点が高かったものから順に並べた図である。なお、重み付け係数wEXHは重み付け係数28020に示す値に従って計算した。その他属性を用いた場合には、属性語のいずれでも網羅されない施設に関しても、その他属性によって網羅される。よって、網羅度はあまり重要では無い。これを反映して、重み付け係数28020における網羅度の重み付け係数は、第1の実施形態の値(図11の重み付け係数10020)よりも小さな値にしている。
【0188】
得点がもっとも高かった属性語の組合せは、属性組合せ28010に示す「病院」、「レジャー」とその他属性の組合せであった。そこで、提示属性作成部7は、この3つの属性語を出力部9へ出力する。
【0189】
これを受けて、出力部9は、表示装置104の画面に属性語を表示する。これと同時に、音声出力装置111はスピーカから「病院、レジャー、その他のいずれかから絞り込めます」といった音声ガイダンスを流しても良い。
【0190】
更新された表示装置104の画面を図30に示す。表示領域2040に示すように、「病院」、「レジャー」のほかに「その他」という表示を行っている。「その他」を選択すれば、施設名候補として「病院」にも「レジャー」にも属さない施設が候補として残る。
【0191】
(絞込み属性を選択した場合)
もしユーザが「その他」を選択した場合(すなわち、図30のボタン29020を押した場合)についての処理を説明する。
【0192】
この押下は、入力部1によって受理され、入力受付部2によって属性語記憶部32に「その他」が保存される。
【0193】
つぎに、施設名検索部6は、先に選定された施設名候補において、その他属性に対して値が付与されていた施設の一覧を作成し、新たな施設名候補とする。
【0194】
提示属性作成部7は、施設名候補と属性語間の関連度から、図23の処理手順にしたがい、提示する属性語を選定する。この手順はすでに説明した手順と重複するため省略する。この処理の結果、属性語が選定される。
【0195】
以下、画面更新、ユーザの選択という処理へ続く。これは、すでに説明した前記第1実施形態の処理手順と同じであるため、省略する。
【0196】
以上説明したように、その他の属性も1つの属性語であるとみなした形で計算を行うことにより、絞り込みに使用する属性語を、ユーザに分かりやすい組合せで提示し、さらにいずれの属性語にも属さない施設を選択できるようにその他属性を選択できるようにすることで、ユーザにとって分かりやすく、かつ絞り込み効率が高い機能を提供することができる。
【0197】
<第4の実施形態>
(「その他」使用、未使用の選定)
第4の実施形態について説明する。この実施形態は、前記第1の実施形態で説明した属性語の選定と、前記第3の実施形態で説明したその他属性を用いた属性語の選定を併用し、両者のうちどちらの得点が高いかを評価して、表示する属性語を選定する実施形態である。
【0198】
この実施形態は、第1の実施形態で説明した提示属性作成部7の処理を変更したカーナビゲーション装置100として説明できるため、それ以外の部分の説明は省略する。
【0199】
図31に、提示属性作成部7のフローチャートを示す。図31のフローチャートを実施する前提として、ユーザはすでに文字入力を行っており、施設名検索部6は複数の施設名候補を提示属性作成部7へ出力しているものとする。
【0200】
ステップ30010は、施設名候補から、個の属性語の組合せで得点が最大となる属性語の組合せを計算する。この計算は、第1の実施形態で示した図6の処理をサブルーチンとして呼び出すことにより実行する。この計算で得られた属性組合せをAnormal、最大得点をSnormalとする。
【0201】
ステップ30020は、施設名候補から、m−1個の属性語の組合せとその他属性によって、得点が最大となる属性語の組合せを計算する。この計算は、第3の実施形態で示した図23の処理をサブルーチンとして呼び出すことにより実行する。この計算で得られた属性組合せをAnormal、最大得点をSnormalとする。
【0202】
ステップ30030では、両方の得点を比較する。
【0203】
ステップ30040では、得点がSnormalのほうが大きかった場合の処理である。この場合は、Anormalを出力部9に出力する。
【0204】
ステップ30050では、得点がSotherwiseのほうが大きかった場合の処理である。この場合は、Aotherwiseを出力部9に出力する。
【0205】
以上説明したように、この第4実施形態では、その他属性を使用する場合と使用しない場合の得点を比較し、より高い得点の属性語をユーザに提示する。これにより、よりユーザにとって分かりやすく、かつ絞り込み効率が高い属性語を提示することができる。
【0206】
なお、ここで述べたステップ30010、30020の得点計算では、互いに得点の大きさが異なることが予想されるため、得点計算の際に使用する重み付け係数をあらかじめ適するように調整しておいても良い。
【0207】
<第5の実施形態>
(異なる属性セットの併用)
第5の実施形態について説明する。この実施形態は、属性語があらかじめいくつかの種類に分類されている場合に、それぞれの種類の属性語組合せに対する最大得点を計算して比較し、得点の大きかった種類の属性語組合せをユーザに提示する実施形態である。
【0208】
この実施形態は、第1の実施形態で説明したカーナビゲーション装置100において、提示属性作成部7の処理を変更し、また施設名データベース8のデータを追加した形として説明できるため、それ以外の部分の説明は省略する。
【0209】
図32に属性の種類と属性語の対応表を示す。ここでは、属性の種類として属性セットという呼称を用いている(31010)。それぞれの属性セット31010に対応する属性語を31020に登録している。ここでは一例として、施設のジャンルに関連する属性セット31010である"genre"と、施設名の形態素の属性セット31010である"morpheme"の2種類があったとする。この対応表は、施設名データベース8において、属性語と合わせて保存されている。なお、お互いの属性セットには、同一の属性語も含まれる可能性もあるため、実際にはID番号などで一意の属性語として識別できるように管理しておく。
【0210】
図33に、提示属性作成部7のフローチャートを示す。このフローチャートを実施する前提として、ユーザはすでに文字入力を行っており、施設名検索部6は複数の施設名候補を提示属性作成部7へ出力しているものとする。
【0211】
ステップ32010は、施設名候補から、属性セットgenreに属する属性語だけを用い、個の属性語の組合せで得点が最大となる属性語の組合せを計算する。この計算は、第1の実施形態で示した図6の処理をサブルーチンとして呼び出すことにより実行する。この計算で得られた属性組合せをAgenre、最大得点をSgenreとする。
【0212】
ステップ32020は、施設名候補から、属性セットmorphemeに属する属性語だけを用い、個の属性語の組合せで得点が最大となる属性語の組合せを計算する。この計算についても、第1の実施形態で示した図6の処理をサブルーチンとして呼び出すことにより実行する。この計算で得られた属性組合せをAmorpheme、最大得点をSmorphemeとする。
【0213】
ステップ32030では、両方の得点を比較する。
【0214】
ステップ32040では、得点がSnormalのほうが大きかった場合の処理である。この場合は、属性組合せAnormalを出力部9に出力する。
【0215】
30050では、得点がSmorphemeのほうが大きかった場合の処理である。この場合は、属性組合せAmorphemeを出力部9に出力する。
【0216】
以上説明したように、この第5の実施形態では、複数の属性語の種類において、得点を比較し、より高い得点の種類である属性語をユーザに提示する。これにより、よりユーザにとって分かりやすく、かつ絞り込み効率が高い属性語を提示することができる。
【0217】
なお、ここで述べたステップ32010、32020の得点計算では、互いに得点の大きさが異なることが予想されるため、得点計算の際に使用する重み付け係数をあらかじめ適するように調整しておいても良い。
【0218】
また、表示装置104の表示領域に余白がある場合には、2つ以上の属性セットから得られた属性語を同時に表示しても良い。これにより、ユーザは、たとえば形態素は知らないが、ジャンルは知っているといった場面でも、知っているジャンルから絞込みを行うことができる。
【0219】
<第6の実施形態>
(関連度の強化学習)
第6の実施形態を説明する。本実施形態は、施設名と属性語間の関連度を、実際にユーザが使用(または選択)した履歴に基づいて変更していき、よりユーザ個人にとって施設名選択を行いやすくするものである。
【0220】
図34は、実施するカーナビゲーション装置100の構成である。このカーナビゲーション装置100は、第1の実施形態でのカーナビゲーション装置100の構成である図2から、確定済施設名記憶部5、関連度更新部10が追加された形である。
【0221】
また、本実施形態では、第1の実施形態において、施設名が確定された後の処理のみが変更される。よって、第1の実施形態と重複する部分は説明を省略する。
【0222】
前提を説明する。ユーザは、「美佐津にあって、市がやっている宿泊施設に行きたい」と考えているが、その施設の正式名称が「美佐津市立温泉保養所」であることは知らないとする。
【0223】
最初に、ユーザは文字を「みさつ」と入力したとする。この結果、表示装置104の画面に提示された「病院」、「買い物」、「レジャー」という3つの属性語のうち、「レジャー」を選択したとする。
【0224】
つぎに、属性語として新たに更新表示された「ペット」、「宿泊施設」、「温泉」から、「宿泊施設」を選択したとする。
【0225】
この結果、画面には「美佐津市キャンプ場」、「美佐津市立温泉保養所」という2つの施設名の一覧が表示される。ここから、ユーザは「美佐津市立温泉保養所」を選択し、施設を確定したとする。
【0226】
以上の処理は、第1の実施形態に記載した処理と同様である。以下からが本実施形態に特徴となる処理となる。
【0227】
施設名を確定すると、入力受付部3は、確定済である施設名「美佐津市立温泉保養所」と、確定するまでにユーザが選択した属性語である「レジャー」、「宿泊施設」と、画面に表示されたがユーザが選択しなかった属性語である「病院」、「買い物」、「ペット」、「温泉」を確定済施設名記憶部5に対して出力し、記憶する。この記憶の形態を図35に示す。
【0228】
つぎに、関連度更新部10は、確定済施設名記憶部5に記憶されている内容に基づき、施設名データベース8に記憶されている関連度を更新する。この更新の方法を図36に示す。
【0229】
まず、関連度更新部10は、確定済施設名に対して、関連度が付与されている属性語を抽出する。このうち、ユーザが選択した属性語は、実際にユーザに選択されたことから、ユーザ自身が施設との関連がより高いと捉えている属性語と推測される。よって、確定済施設と属性語間の関連度を大きくする。一方、ユーザが選択しなかった属性語は、ユーザ自身が施設との関連が低いと捉えている属性語と推測される。よって、確定済施設と属性語間の関連度を小さくする。
【0230】
具体的には、確定済施設Lconfirmedを、選ばれた属性語aselectを、選ばれなかった属性語anon-selectを、更新前の関連度rold(L,a)を、更新後の関連度をrnew(L,a)とすると、下記の式に従い、関連度の更新を行う。
【0231】
【数25】
【0232】
【数26】
【0233】
ただし、wselectとwnon-selectは係数であり、wselectは1より大きい値、wnon-selectは1より小さい値を用いる。
【0234】
図36では、wselectとwnon-selectにそれぞれ、ユーザが選定した「レジャー」、「宿泊施設」については、関連度を高く(値を増大)し、ユーザが選定しなかった「温泉」については、関連度を低く(値を減少)する。また、表示装置104の画面上に属性語として表示されなかった「公共機関」については、そのままの値を保持する。
【0235】
以上説明したように、本第5の実施形態では、実際のユーザの選定行為に基づいて関連度3100を更新することで、よりユーザにとって使いやすい施設名の絞込みが可能となる。
【0236】
<第6の実施形態の変形例>
(ユーザがよく行く施設の関連度を加算)
また、関連度の更新方法については、ユーザがある期間に実際に行った施設の選択の頻度に基づいて更新する方法もある。
【0237】
図37(a)には、ユーザが所定の期間(例えば、半年間)に目的地に設定した施設と、この施設と属性語との関連度36010を記載している。この図37(a)において、施設との関連度36010が0より大きいものについては、図中網掛けで表示する。
【0238】
つぎに、それぞれの属性語について、半年間に行った施設の中で各属性語との間に0より大きい関連度が付与されていた件数を数える(E(a))。この計算結果を降順に並べたものを図37(b)に示す。この例では、過去半年の間に、ユーザは「自動車」に関連する施設に10回行き、「レジャー」に関連する施設に8回行ったことがわかる。
【0239】
この結果から、ユーザは、上位に表れている属性語である「自動車」や「レジャー」に関連する施設によく行っていることが分かる。よって、これらよく行く施設に関連する属性語は、優先して絞込み属性語として提示することにより、ユーザの使い勝手が向上することが予測される。
【0240】
そこで、この回数に応じて、施設名データベース8に記憶されている関連度に対する加算を行う。具体的には、それぞれの属性語aに対する加算値をe(a)とすると、この値を、回数を目的地設定を行った全回数で正規化し、重み付け係数をかけたものとして算出する。
【0241】
【数27】
【0242】
なお、Eallは、目的地設定を行った全回数、Weは重み付け係数である。この計算結果を図37(b)の36120に示す。ただし、各変数の値は重み付け係数36130のように仮定した。
【0243】
この算出した加算値を用い、施設名データベース8に保存されている関連度に対して加算を行う。
【0244】
【数28】
【0245】
すなわち、もともとデータベース8に設定された関連度のうち、0より大きい値の関連度だけを対象に、加算値e(a)を加算する。このようにして算出されたre(L,a)を使用して、提示属性作成部7はユーザに提示する属性語の選定を行う。
【0246】
図38(a)に、加算前の関連度を示し、(b)に加算後の関連度を示す。図38(b)では、図37(b)で算出された加算値が加算されている。そして、加算後の関連度をもとに、ユーザに提示する絞り込み属性語を選定する。
【0247】
以上説明したように、本実施形態では、実際にユーザが高頻度で行く施設に関連する属性語を優先的に提示することで、ユーザにとって使いやすい施設名の絞込みが可能となる。
【0248】
<第7の実施形態>
(一般的によく設定される施設の優先)
第7の実施形態を説明する。本実施形態は、施設名と属性語間の関連度3100を、一般的にカーナビゲーション装置100で設定される施設ジャンルごとの頻度に従い、関連度3100を重み付けするものである。
【0249】
この実施形態は、第1の実施形態で説明したカーナビゲーション装置100において、施設名データベース8のデータを追加した形として説明できるため、それ以外の部分の説明は省略する。
【0250】
図39には、本実施形態で特徴となる施設ジャンル(群)ごとの重み付け係数を記録したテーブルである。このテーブルは、施設名データベース8に記憶されている。
【0251】
図39の小ジャンル38010は、図5の3080に示す各施設名に付与された小ジャンル(群)に対応する。また、38020には、小ジャンルごとに、一般的に目的地に設定される頻度に応じて、重み付け係数が設定されている。たとえば、「温泉」や「総合病院」は、カーナビゲーション装置100でよく目的地に設定されるため、高い値が付与されている。一方、「呉服店」は、あまり目的地に設定されないため、低い値が付与されている。提示属性作成部7は、施設名データベースにもとから保存されている関連度に、38020に記述した重み付け係数を乗じたものを、新たな関連度として用い、属性語の選定を行う。こうすることにより、カーナビゲーション装置100でよく目的地に設定される施設に関連した属性語がユーザに提示されやすくなる。
【0252】
なお、本実施形態では、小ジャンルに対して重み付け係数を1つ付与する方法を説明したが、各施設に別の重み付け係数を設定する方法をとってもよい。
【0253】
以上説明したように、本実施形態では、一般的にカーナビゲーション装置100で高頻度に目的地に設定される施設に関連する属性語を優先的に提示することで、ユーザにとって使いやすい施設名の絞込みが可能となる。
【0254】
<第8の実施形態>
(属性語と関連度のダウンロード)
第8の実施形態を説明する。本実施形態は、施設名とそれを選択するまでに選択された属性語とのデータをサーバに送信し、サーバ側で新しい関連度データを作成し、それを各カーナビゲーション装置100に送信して、更新を行うものである。
【0255】
図40は、実施する計算機システムの構成である。この計算機システムは、第1の実施形態での構成である図2のカーナビゲーション装置100に、確定済施設名記憶部5、関連度更新部10、通信部11を追加し、さらに、カーナビゲーション装置100の通信部11と通信を行う基地局40040と、カーナビゲーション装置100からの要求を処理するサーバ40030を加えたものである。
【0256】
図41は、本実施形態で必要となるカーナビゲーション装置100とサーバ40030の通信における関係である。自動車に搭載されたカーナビゲーション装置100は複数存在し、各カーナビゲーション装置100に備わっている通信部11は、通信網40020を介してサーバ40030と通信を行う。
【0257】
図40のシステム構成において、確定済施設名記憶部5には、実際にユーザが目的地に設定した施設と、その施設を選ぶまでに、絞り込み属性として、ユーザが選択した属性語と、ユーザが選択しなかった属性語を記憶するものである。たとえば、ユーザが 施設名「美佐津市立温泉保養所」を確定するまでに、「レジャー」、「宿泊施設」という属性語を選択し、「病院」、「買い物」、「ペット」、「温泉」を選択しなかったとすると、図35のような記憶形態となる。通信部11は、確定済施設名記憶部5の内容をサーバ40030に送信する。
【0258】
各カーナビゲーション装置100が同様にサーバ40030に送信を行うと、サーバ40030では、各施設名と、各施設が選定される過程において、選択された属性語とその回数が集計される。集計結果の例を図42に示す。41010には、全ユーザが目的地に設定した総回数、41020には、各施設名が目的地に設定されたときに各属性語が選択された総回数を示す。
【0259】
サーバ40030は、この集計結果に基づいて、関連度の更新情報を各カーナビゲーション装置100に送信する。そして、各カーナビゲーション装置100の通信部11は、更新情報を受信し、関連度更新部10へ送る。関連度更新部10は、更新情報に基づいて、施設名データベース8に記載された関連度を更新する。
【0260】
なお、この更新の形態についてはとくに規定しないが、たとえば、目的地設定回数に対する各属性語が選択された割合を計算し、この割合がある値以上であれば施設名データベース8に格納される関連度を大きくし、ある値以下であれば施設名データベース8に格納される関連度を小さくするといった方法がある。たとえば、図42にいては、施設「美薩動物病院」に対して、属性語「総合病院」が選択された回数が0回である。これを反映して、図5に示した施設名データベース8に保存される関連どのうち、「美薩動物病院」と「総合病院」の間の関連度を0にする操作を行う。
【0261】
以上、説明したように、実際に多くのユーザが選定する属性語の頻度に基づき、関連度を更新することで、より多くのユーザに使いやすい属性語の提示が可能となる。
【0262】
また、上記に説明した、ユーザが選定する属性語の頻度に基づいた関連度の更新だけではなく、新しく設立された施設に対して、その施設名と属性語の関連度を合わせてカーナビゲーション装置100がサーバ40030からダウンロードしても良い。または、既存の施設の業種が変更された場合において、変更された業種に沿った属性語と関連度の値を
<第9の実施形態>
(形態素のつなぎ合わせ)
第9の実施形態を説明する。本実施形態は、属性語として形態素を用いる前記第2の実施形態において、形態素の表示方法を変更するものである。第2の実施形態との違いは、提示属性作成部7の処理において、図6のステップ5130の部分のみであるため、この部分だけを説明する。
【0263】
以下の説明の前提として、ユーザが文字入力にて「とうざいで」と入力し、施設名候補として図43(a)に示した18件が施設名の候補として挙がっているとする。さらに、この施設名の候補から2つの形態素を絞り込み属性語として選ぶ処理を行い、「出島」、「でんでん」という2つの形態素の組み合わせにおいて、得点が最大であったとする。
【0264】
この場合、前記第2の実施形態では、「出島」、「でんでん」という2つの形態素が、画面に絞り込み属性として提示されていた。しかし、上記のような短い形態素では、ユーザは、その形態素が施設名に含まれていることを認識できない可能性がある。そこで、より長い文字列を絞り込み属性語として提示したほうが、ユーザに形態素が認識されないという事態を防げる可能性がある。
【0265】
そこで本実施形態では、ステップ5130において、最初に、選ばれた2つの形態素と一致する施設名を抽出する。すると、形態素「出島」と一致するものは図43(b)の5件、「でんでん」と一致するものは図43(c)の2件である。
【0266】
つぎに、各形態素の前後の施設名を探索し、すべての施設名で共通して一致する部分が最長となるように文字列を抽出する。この結果、図43(b)では「東西出島」、図43(c)では「東西でんでんランド」が抽出される。
【0267】
つぎに、上記選定した文字列を、出力部に対して絞り込み属性として出力する。この結果、図44で示すように、表示領域2040には「東西出島」と「東西でんでんランド」という2つの絞り込み属性語が提示される。
【0268】
以上のように、より長い施設名部分を絞り込み属性語として提示することにより、ユーザにとって絞込みができないという現象を防ぐことができる。
【0269】
<第10の実施形態>
(形態素の位置の利用)
第10の実施形態を説明する。本実施形態は、属性語として形態素を用いる第2の実施形態において、形態素の位置に応じて表示方法を変更するものである。第2の実施形態との違いは、施設名データベース8におけるデータの保持方法であるため、この部分を説明する。
【0270】
以下の説明の前提として、ユーザが文字入力にて「みさ」と入力し、施設名候補として図45の44010に示した施設名が抽出されたとする。
【0271】
図45には、本実施形態における施設名データベース8における関連度の付与の形態を示している。施設名候補44020に示すように、形態素として「ホテル」であることは第2の実施形態と同様であるが、その形態素が施設名のなかでどの位置に表れるかを併せて情報として持つことが本実施形態の特徴である。たとえば、「ホテル美佐津クレセント」に対しては、形態素「ホテル」は施設名の先頭に付くため、属性語としては「ホテル(前方)」という項目を設けて、関連度を付与している。同様に、「ホテル(中間)」、「ホテル(後方)」という属性語も別途設けている。
【0272】
さらに、提示属性選定部7が、提示する属性語として「ホテル(前方)」、「ホテル(中間)」、「ホテル(後方)」という3属性語を選定したとする。この結果を受けて、画面にはそのまま「ホテル(前方)」のように表示しても良いが、たとえば図46の2040に示すように、「ホテル○○」、「○○ホテル」のようによりユーザにとって「ホテル」が施設名のどこにあるかを直感的に分かるようにしてもよい。なお、ここでユーザが「ホテル○○」を選択すれば、図45の施設名候補44010に挙げた施設名のうち、「ホテル」が先頭に付く「ホテル美佐津クレセント」、「ホテルオーヤマ美佐津」が表示され、「ホテル」が前方に付かない施設名は表示されなくなる。
【0273】
以上説明したように、属性語において、形態素と位置情報を合わせて提示することにより、ユーザにとって絞込みが容易に行えるようになる。
【0274】
<第11の実施形態>
(音声入力)
第11の実施形態を説明する。本実施形態は、前記第1〜第10の実施形態において、ユーザの入力を音声で行い、音声認識の結果を入力に使用する実施形態である。カーナビゲーション装置100としては、前記第1〜第10の実施形態に示したカーナビゲーション装置100における入力部1の前段に、音声入力と音声認識装置を追加することで実装される。
【0275】
なお、音声認識の実装方法については、公知の技術(例えば、鹿野、伊藤、河原、武田、山本共著:「音声認識システム」、オーム社刊、2001年発行)を用いればよい。
【0276】
図47に、入力部1の前段に装着される音声入力に必要となる構成を示す。
【0277】
音声取込部46010は、ユーザからの音声信号をデジタル信号に変換し、音声データとして取り込む。
【0278】
分析部46020は、ユーザが発話した音声データを、特徴ベクトル列に変換する。特徴ベクトル列とは、音声の各時刻の特徴量を多次元ベクトル量で表し、それを時系列に並べたものである。たとえば、入力音声データを10ms程度ごとに分割し、各時刻の音声データをMFCC(Mel Frequency Cepstrum Coefficient)パラメータ(特徴パラメータ)と呼ばれる多次元ベクトル量に変換し、これを時系列に並べたものが使用される。
【0279】
音響モデル記憶部46030には、特徴パラメータから抽出した各音素に対応するモデルを保存しておく。このモデルの表現形態としては、各音素を3状態で定義したHMM(Hidden Marcov Model)が使われる。
【0280】
言語モデル記憶部46040には、辞書46042と文法46044を登録する。音声認識における言語モデルには、規則ベースの言語モデルと統計的言語モデルの2種類があるが、本実施形態では、統計的言語モデルの使用を想定する。統計的言語モデルによる音声認識の実装方法についても、上記の鹿野らの文献に記載されている。
【0281】
辞書46042には、音声認識が認識対象とする単語と、その音素列を登録する。本実施形態では、施設名データベース8に保存されている施設名を形態素分割したものを単語として登録するものとする。辞書の例を図48に示す。また、全国の施設名に現れるすべての形態素を辞書に登録すると、その数は膨大となるため、音声認識に必要となる演算量、メモリ量の増加につながる。さらに、認識率の低下が起こると予想される。そこで、この辞書には、全国の施設名に高頻度で現れる形態素のみを登録するものとする。
【0282】
文法46044には、辞書46042に登録した各単語間の遷移確率が記憶される。この遷移確率は、統計的言語モデルの作成で一般的に使われる単語N−gramモデルを作成する方法によって算出することができる。この単語N−gramモデルを作成するための学習コーパスとしては、たとえば、施設名データベース8に登録されている施設名をそのまま使用することができる。
【0283】
音声認識部46050は、入力音声の特徴ベクトル列と言語モデルに記憶された単語列を比較し、その一致の度合いを表すスコアを計算し、スコアが高かった単語列を出力する。ここでは、スコアがもっとも高かった単語列だけを出力しても良いし、スコアが高かった上位複数個の単語列を出力しても良い。
【0284】
単語列出力部46060は、音声認識部から得られた単語列から、入力部1に送る単語列を選定する。ここでは、音声認識部から得られた単語列のうち、スコアに基づいて信頼度を計算し、信頼度が高かったものだけを出力するものとする。
【0285】
以降の処理は、前記第1〜第10の実施形態における処理と同等である。すなわち、施設名検索部6は、単語列出力部から入力された単語列に一致する施設名の一覧を作成する。提示属性作成部は、各実施形態での方法に従い、ユーザに提示する絞り込み属性語の組合せを作成する。出力部9は、属性語の組合せを画面に出力する。また、出力部9は、スピーカを通じて属性語を提示し、「○○、××、△△のいずれかから絞り込めます」といった音声ガイダンスを流してよい。
【0286】
これを受けて、ユーザは、タッチパネルで属性語を指定しても良いし、また音声にて属性語を指定しても良い。音声で属性語を指定する場合には、単語列出力部46060は、ユーザ発話から認識された属性語を入力部1に対して出力し、各実施形態の方法に沿った絞り込みの処理を行う。
【0287】
しかしながら、音声による入力の場合、入力される単語列が複数である場合や、複数の単語列候補がある場合がある。以下、この場合について説明する。たとえば、ユーザが「東西でんでんランド」と発話し、音声認識処理の結果、信頼度が高かった「東西/ランド」という2単語だけを、単語列出力部46060から入力部1に送る場合を考える。このとき、施設名検索部6では、「東西」、「ランド」という2つの形態素がある施設名を検索して、一覧を得る方法で実装できる。また、ユーザが「東西でんでんランド」と発話し、音声認識処理の結果、信頼度が高かった「東海/ランド」、「東西/ランド」という、各2つの単語からなる2つの単語列が得られたとする。単語列出力部46060から入力部1に対して、この2つの単語列を送る場合を考える。このとき、施設名検索部6では、「東西」、「ランド」という2つの形態素がある施設名と、「東西」、「ランド」という2つの形態素がある施設名の両方を検索して、一覧を得る方法で実装できる。
【0288】
また、単語列出力部46060が出力する単語列は、形態素単位に分かれているため、図17に記載した各施設名16010に関連付けられた形態素のいずれかに一致する。そこで、たとえば単語列出力部46060は、認識単語列と各認識単語の確からしさを表す信頼度も合わせて入力し、図17に記載の表から、認識単語と一致する形態素を探し、その形態素と施設名の関連度と、認識単語の信頼度を掛け合わせ、1つの施設名についてこれの和を取ることにより、各施設名の信頼度を計算できる。この方法によって、施設名の一覧を信頼度付きで得ることも可能である。
【0289】
以上説明したように、音声入力を行うことによって、ユーザの多様な入力を受け付けることができるようになり、より使い勝手を高めることができる。
【産業上の利用可能性】
【0290】
以上のように、本発明は、文字情報で検索を行うカーナビゲーション装置やデータベースシステムに適用することができる。
【図面の簡単な説明】
【0291】
【図1】第1の実施形態を示し、本発明を適用するカーナビゲーション装置の一例を示すブロック図である。
【図2】第1の実施形態を示し、カーナビゲーション装置の機能要素を示すブロック図である。
【図3】第1の実施形態を示し、カーナビゲーション装置の表示装置に出力される画面イメージ。
【図4】第1の実施形態を示し、施設名データベース8の一例の説明図であり、(a)は施設名テーブルを、(b)は属性語テーブルを示す。
【図5】第1の実施形態を示し、施設名検索部で行った検索結果の一例の説明図。
【図6】第1の実施形態を示し、カーナビゲーション装置の提示属性作成部で行われる処理の一例を示すフローチャート。
【図7】第1の実施形態を示し、提示属性作成部で行われる独立度PINDの計算結果の一例を示す説明図で、(a)は独立度が高い例を示し、(b)は独立度が低い例を示す。
【図8】第1の実施形態を示し、提示属性作成部で行われる網羅度pEXHの計算結果の一例を示す説明図で、(a)は網羅度が高い例を示し、(b)は網羅度が低い例を示す。
【図9】第1の実施形態を示し、提示属性作成部で行われる均一度pEQUの計算結果の一例を示す説明図で、(a)は均一度が高い例を示し、(b)は均一度が低い例を示す。
【図10】第1の実施形態を示し、提示属性作成部で行われる理解容易度PEASの計算結果の一例を示す説明図で、(a)は理解容易度が高い例を示し、(b)は理解容易度が低い例を示す。
【図11】第1の実施形態を示し、提示属性作成部で抽出された属性の組み合わせの一例を示す説明図。
【図12】第1の実施形態を示し、カーナビゲーション装置の表示装置に出力される属性語の画面イメージ。
【図13】第1の実施形態を示し、施設名検索部が作成した施設名候補と属性語及び関連度の一覧を示す。
【図14】第1の実施形態を示し、カーナビゲーション装置の表示装置に出力される属性語の画面イメージで、(a)は属性語が更新された状態を示し、(b)は施設名候補を一覧表示した状態を示す。
【図15】第1の実施形態を示し、施設名検索部が作成する施設名候補と属性語及び関連度の関係を示す説明図。
【図16】第1の実施形態を示し、カーナビゲーション装置の表示装置に出力される属性語の画面イメージで、属性語が更新された状態を示す。
【図17】第2の実施形態を示し、施設名と形態素(属性語)及び関連度の関係を示す説明図。
【図18】第2の実施形態を示し、施設名の形態素と形態素及び関連度の関係を示す説明図。
【図19】第2の実施形態を示し、施設名候補に対して、各形態素の組合せに対する得点が高かいのから順に並べた説明図。
【図20】第2の実施形態を示し、カーナビゲーション装置の表示装置に出力される属性語の画面イメージで、属性語が更新された状態を示す。
【図21】第2の実施形態を示し、施設名候補と形態素及び関連度の関係を示す説明図。
【図22】第2の実施形態を示し、カーナビゲーション装置の表示装置に出力される属性語の画面イメージで、(a)は属性語が更新された状態を示し、(b)施設名候補の一覧表示の例を示す。
【図23】第3の実施形態を示し、提示属性作成部で行われる処理の一例を示すフローチャート。
【図24】第3の実施形態を示し、施設名候補と属性語及び関連度の計算結果を示す説明図。
【図25】第3の実施形態を示し、施設名候補と属性語及び独立度の関係を示し、属性語として「宿泊施設」、「公共機関」と「その他属性」を組み合わせた場合の独立度PINDの計算結果の一例を示す。
【図26】第3の実施形態を示し、施設名候補と属性語及び網羅度の関係を示し、属性語として「宿泊施設」、「公共機関」を組み合わせた場合の網羅度の計算結果の一例を示す。
【図27】第3の実施形態を示し、施設名候補と属性語及び均一度の関係を示し、属性語として「宿泊施設」、「公共機関」及び「その他属性」を組み合わせた場合の均一度の計算結果の一例を示す。
【図28】第3の実施形態を示し、施設名候補と属性語及び理解容易度の関係を示し、属性語として「宿泊施設」、「公共機関」及び「その他属性」を組み合わせた場合の理解容易度の計算結果の一例を示す。
【図29】第3の実施形態を示し、2つの属性語と「その他属性」の組合せに対する得点計算で、得点が高いものから順に並べた例を示す説明図。
【図30】第3の実施形態を示し、カーナビゲーション装置の表示装置に出力される属性語の画面イメージで、属性語が更新された状態を示す。
【図31】第4の実施形態を示し、提示属性作成部で行われる処理の一例を示すフローチャート。
【図32】第4の実施形態を示し、属性セットと属性語の関係を示す説明図。
【図33】第5の実施形態を示し、提示属性作成部で行われる処理の一例を示すフローチャート。
【図34】第6の実施形態を示し、カーナビゲーション装置の機能要素を示すブロック図である。
【図35】第6の実施形態を示し、確定済施設名記憶部の記憶内容の一例を示す説明図。
【図36】第6の実施形態を示し、施設名と属性語に対する関連度の更新の一例を示す説明図。
【図37】第6の実施形態を示し、学習の様子を示す説明図で、(a)は半年以内に目的地として設定した施設と属性語との関連度を示し、(b)は属性と施設の件数と加算値の関係を示す。
【図38】第6の実施形態を示し、施設名と属性語及び関連度の関係を示し、(a)は加算値の加算前の値を示し、(b)は加算前の加算語の値を示す。
【図39】第7の実施形態を示し、施設ジャンルごとの重み付け係数を記録したテーブルの説明図。
【図40】第8の実施形態を示し、カーナビゲーション装置の機能要素を示すブロック図である。
【図41】第8の実施形態を示し、カーナビゲーション装置とサーバの関係を示すブロック図。
【図42】第8の実施形態を示し、施設名と各施設名が選択された属性語と選択回数の集計結果を示す説明図。
【図43】第9の実施形態を示し、形態素による属性語の提示の様子を示す説明図で、(a)は抽出された施設名候補を示し、(b)は形態素が「出島」に対応する施設名候補を示し、(c)は形態素が「でんでん」に対応する施設名候補を示す。
【図44】第9の実施形態を示し、カーナビゲーション装置の表示装置に出力される属性語の画面イメージ。
【図45】第10の実施形態を示し、施設名候補と形態素及び関連度の関係を示す説明図。
【図46】第10の実施形態を示し、カーナビゲーション装置の表示装置に出力される属性語の画面イメージ。
【図47】第11の実施形態を示し、カーナビゲーション装置の機能要素を示すブロック図である。
【図48】第11の実施形態を示し、辞書の一例を示し、単語と音素列の関係を示す説明図。
【符号の説明】
【0292】
1 入力部
2 入力受付部
3 入力内容記憶部
6 施設名検索部
7 提示属性作成部
8 施設名データベース
9 出力部
100 カーナビゲーション装置
102 メモリ
103 CPU
104 表示装置
105 ストレージ装置
106 入力装置
110 レシーバ
【特許請求の範囲】
【請求項1】
文字を入力する入力部と、
名称と、当該名称に関連する属性語と、前記名称と属性語の関連の度合いを示す関連度と、を格納するデータベースと、
前記入力された文字を含む名称をデータベースから検索して、前記検索した名称を名称候補として出力する名称検索部と、
前記名称検索部から出力された前記名称候補に関連する属性語を前記データベースから抽出する提示属性作成部と、
前記提示属性作成部で抽出された属性語と、前記名称検索部からの名称候補と、を提示する出力部と、を備え、
前記提示属性作成部は、
前記抽出した属性語の組合せについて、当該属性語に関連付けられた前記名称候補の前記関連度を前記データベースから取得して、
前記抽出した属性語間の異なり度合いを表す独立度を演算し、
前記抽出した属性語の組合せによる名称候補の網羅性を表す網羅度を演算し、
前記属性語ごとに関連する名称候補の件数の均一さを表す均一度を演算し、
前記演算した独立度と網羅度と均一度のうち少なくとも1つに基づいて属性語の組合せの得点を計算する第1の得点計算部を有し、
前記得点が高い順に前記属性語の組み合わせを前記出力部に出力することを特徴とする情報検索装置。
【請求項2】
請求項1に記載の情報検索装置において、
前記データベースに格納される属性語は、前記名称候補の名称の一部分を構成する形態素であることを特徴とする情報検索装置。
【請求項3】
請求項1に記載の情報検索装置において、
前記提示属性作成部は、
前記抽出した属性語の組合せと関連が無いことを表す属性を第2の属性語として生成し、当該第2の属性語と名称候補の関連度を演算し、
前記抽出した属性語の組合せと前記名称候補との関連度と、前記第2の属性語と前記名称候補との関連度に基づいて、前記抽出した属性語間の名称候補の異なり度合いを表す独立度を演算し、
前記抽出した属性語の組合せと前記名称候補との関連度と、前記第2の属性語と前記名称候補との関連度に基づいて、前記抽出した属性語の組合せによる名称候補の網羅性を表す網羅度を演算し、
前記抽出した属性語の組合せと前記名称候補との関連度と、前記第2の属性語と前記名称候補との関連度に基づいて、前記属性語間で関連する名称候補の件数の均一さを表す均一度を演算し、
前記演算した独立度と網羅度と均一度のうち少なくとも1つに基づいて前記属性語の組合せの得点を計算する第2の得点計算部を有し、
前記第2の得点計算部で求めた得点が高い順に前記属性語の組み合わせを前記出力部に出力することを特徴とする情報検索装置。
【請求項4】
請求項3に記載の情報検索装置において、
前記提示属性作成部は、前記第1の得点計算部で求めた得点と、前記第2の得点計算部で求めた得点とを比較して、得点の高い方の属性語の組合せを前記出力部に出力することを特徴とする情報検索装置。
【請求項5】
請求項1に記載の情報検索装置において、
前記データベースに記憶される属性語は、属性語の種類に応じて分類されおり、
前記提示属性作成部は、前記属性語の種類ごとに、前記属性語の組合せについての得点を計算し、最大の得点であった属性語の組合せを出力部に出力することを特徴とする情報検索装置。
【請求項6】
請求項1に記載の情報検索装置において、
前記出力部に出力された前記名称候補と属性語を選択する第2の入力部と、
前記第2の入力部で選択された名称候補と属性語と、前記第2の入力部で選択されなかった属性語と、を記憶する確定済名称記憶部と、
前記確定済名称記憶部に記憶された名称候補と属性語に基づいて前記データベースに格納された関連度を更新する関連度更新部と、をさらに備え、
前記関連度更新部は、
前記確定済名称記憶部に記憶された名称候補と属性語のうち、前記第2の入力部で選択された名称候補の名称と属性語の関連度を増大し、前記第2の入力部で選択されなかった属性語と名称候補の名称の関連度を減少し、前記データベースに格納された前記関連度の値を更新することを特徴とする情報検索装置。
【請求項7】
請求項1に記載の情報検索装置において、
前記データベースは、前記名称ごと、または複数の名称をまとめて分類した群に対して数値を付与した表を備え、
前記提示属性作成部は、前記名称候補に対応する関連度と前記数値を掛け合わせた値を新たな関連度として使用することを特徴とする情報検索装置。
【請求項8】
請求項1に記載の情報検索装置において、
前記関連度を受信する通信部をさらに備え、
前記受信した関連度で前記データベースに格納された関連度を更新することを特徴とする情報検索装置。
【請求項9】
請求項2に記載の情報検索装置において、
前記提示属性作成部は、
前記得点が高い属性語を算出し、
前記名称候補を前記属性語の前後の文字列で検索し、
前記名称候補で前記属性語がより長く一致する文字列を生成し、
前記生成された文字列を、属性語として出力部に出力することを特徴とする情報検索装置。
【請求項10】
請求項2に記載の情報検索装置において、
前記データベースに格納される属性語は、前記名称の一部分である形態素と、前記名称中の前記形態素の位置情報とを含んで保持することを特徴とする情報検索装置。
【請求項11】
請求項1ないし請求項10のいずれかひとつに記載の情報検索装置において、
音声信号を取得する音声取込部と、
前記取得した音声信号から認識した語彙を出力する音声認識部と、
前記音声認識部から出力された前記語彙を、前記入力部に入力することを特徴とする情報検索装置。
【請求項12】
請求項1に記載の情報検索装置において、
前記提示属性作成部は、
前記属性語の組合せによる関連度の総合的な高さを表す理解容易度を計算し、
前記演算した独立度と網羅度と均一度と理解容易度のうち少なくとも1つに基づいて属性語の組合せの得点を計算することを特徴とする情報検索装置。
【請求項13】
請求項12に記載の情報検索装置において、
前記理解容易度は、前記属性語と前記名称の対応関係の分かりやすさを示す指標であることを特徴とする情報検索装置。
【請求項14】
請求項1に記載の情報検索装置において、
前記独立度は、前記抽出した属性語同士で属性語が異なる指標であることを特徴とする情報検索装置。
【請求項15】
請求項1に記載の情報検索装置において、
前記網羅度は、前記抽出した属性語の組合せによって、前記名称候補のうちどの程度の割合が選択可能となるかを示す指標であることを特徴とする情報検索装置。
【請求項16】
請求項1に記載の情報検索装置において、
前記均一度は、前記抽出した属性語に対応する名称候補の数の均一さの度合いを示す指標であることを特徴とする情報検索装置。
【請求項17】
入力された文字を含む名称をデータベースから検索する情報検索装置と、
ネットワークを介して前記情報検索装置に接続されたサーバと、を備えた情報検索システムにおいて、
前記情報検索装置は、
文字を入力する入力部と、
前記名称と、当該名称に関連する属性語と、前記名称と属性語の関連の度合いを示す関連度と、を格納するデータベースと、
前記入力された文字を含む名称をデータベースから検索して、前記検索した名称を名称候補として出力する名称検索部と、
前記名称検索部から出力された前記名称候補に関連する属性語を前記データベースから抽出する提示属性作成部と、
前記提示属性作成部で抽出された属性語と、前記名称検索部からの名称候補と、を提示する出力部と、
前記サーバと通信を行う通信部と、
前記データベースに格納された関連度を前記サーバから受信した関連度で更新する関連度更新部と、を備え、
前記提示属性作成部は、
前記抽出した属性語の組合せについて、当該属性語に関連付けられた前記名称候補の前記関連度を前記データベースから取得して、
前記抽出した属性語間の異なり度合いを表す独立度を演算し、
前記抽出した属性語の組合せによる名称候補の網羅性を表す網羅度を演算し、
前記属性語ごとに関連する名称候補の件数の均一さを表す均一度を演算し、
前記演算した独立度と網羅度と均一度のうち少なくとも1つに基づいて属性語の組合せの得点を計算する第1の得点計算部を有し、
前記得点が高い順に前記属性語の組み合わせを前記出力部に出力することを特徴とする情報検索システム。
【請求項18】
請求項17に記載の情報検索システムにおいて、
前記データベースに格納される属性語は、前記名称候補の名称の一部分を構成する形態素であることを特徴とする情報検索システム。
【請求項19】
計算機に入力された文字を含む名称をデータベースから検索する情報検索方法であって、
前記入力された文字を含む名称を、前記名称と当該名称に関連する属性語と前記名称と属性語の関連の度合いを示す関連度とを格納するデータベースから前記計算機が検索するステップと、
前記検索した名称を名称候補として出力するステップと、
前記名称候補に関連する属性語を前記データベースから抽出するステップと、
前記抽出された属性語と前記名称候補とを前記計算機の出力部に出力するステップと、を含み、
前記名称候補に関連する属性語を前記データベースから抽出するステップは、
前記抽出された属性語の組合せについて、当該属性語に関連付けられた前記名称候補の前記関連度を前記データベースから取得するステップと、
前記抽出された属性語間の異なり度合いを表す独立度を演算するステップと、
前記抽出された属性語の組合せによる名称候補の網羅性を表す網羅度を演算するステップと、
前記属性語ごとに関連する名称候補の件数の均一さを表す均一度を演算するステップと、
前記演算した独立度と網羅度と均一度のうち少なくとも1つに基づいて属性語の組合せの得点を計算するステップと、
前記得点が高い順に前記属性語の組み合わせを前記出力部へ出力するステップと、を有することを特徴とする情報検索方法
【請求項20】
請求項19に記載の情報検索方法において、
前記データベースに格納される属性語は、前記名称候補の名称の一部分を構成する形態素であることを特徴とする情報検索方法。
【請求項1】
文字を入力する入力部と、
名称と、当該名称に関連する属性語と、前記名称と属性語の関連の度合いを示す関連度と、を格納するデータベースと、
前記入力された文字を含む名称をデータベースから検索して、前記検索した名称を名称候補として出力する名称検索部と、
前記名称検索部から出力された前記名称候補に関連する属性語を前記データベースから抽出する提示属性作成部と、
前記提示属性作成部で抽出された属性語と、前記名称検索部からの名称候補と、を提示する出力部と、を備え、
前記提示属性作成部は、
前記抽出した属性語の組合せについて、当該属性語に関連付けられた前記名称候補の前記関連度を前記データベースから取得して、
前記抽出した属性語間の異なり度合いを表す独立度を演算し、
前記抽出した属性語の組合せによる名称候補の網羅性を表す網羅度を演算し、
前記属性語ごとに関連する名称候補の件数の均一さを表す均一度を演算し、
前記演算した独立度と網羅度と均一度のうち少なくとも1つに基づいて属性語の組合せの得点を計算する第1の得点計算部を有し、
前記得点が高い順に前記属性語の組み合わせを前記出力部に出力することを特徴とする情報検索装置。
【請求項2】
請求項1に記載の情報検索装置において、
前記データベースに格納される属性語は、前記名称候補の名称の一部分を構成する形態素であることを特徴とする情報検索装置。
【請求項3】
請求項1に記載の情報検索装置において、
前記提示属性作成部は、
前記抽出した属性語の組合せと関連が無いことを表す属性を第2の属性語として生成し、当該第2の属性語と名称候補の関連度を演算し、
前記抽出した属性語の組合せと前記名称候補との関連度と、前記第2の属性語と前記名称候補との関連度に基づいて、前記抽出した属性語間の名称候補の異なり度合いを表す独立度を演算し、
前記抽出した属性語の組合せと前記名称候補との関連度と、前記第2の属性語と前記名称候補との関連度に基づいて、前記抽出した属性語の組合せによる名称候補の網羅性を表す網羅度を演算し、
前記抽出した属性語の組合せと前記名称候補との関連度と、前記第2の属性語と前記名称候補との関連度に基づいて、前記属性語間で関連する名称候補の件数の均一さを表す均一度を演算し、
前記演算した独立度と網羅度と均一度のうち少なくとも1つに基づいて前記属性語の組合せの得点を計算する第2の得点計算部を有し、
前記第2の得点計算部で求めた得点が高い順に前記属性語の組み合わせを前記出力部に出力することを特徴とする情報検索装置。
【請求項4】
請求項3に記載の情報検索装置において、
前記提示属性作成部は、前記第1の得点計算部で求めた得点と、前記第2の得点計算部で求めた得点とを比較して、得点の高い方の属性語の組合せを前記出力部に出力することを特徴とする情報検索装置。
【請求項5】
請求項1に記載の情報検索装置において、
前記データベースに記憶される属性語は、属性語の種類に応じて分類されおり、
前記提示属性作成部は、前記属性語の種類ごとに、前記属性語の組合せについての得点を計算し、最大の得点であった属性語の組合せを出力部に出力することを特徴とする情報検索装置。
【請求項6】
請求項1に記載の情報検索装置において、
前記出力部に出力された前記名称候補と属性語を選択する第2の入力部と、
前記第2の入力部で選択された名称候補と属性語と、前記第2の入力部で選択されなかった属性語と、を記憶する確定済名称記憶部と、
前記確定済名称記憶部に記憶された名称候補と属性語に基づいて前記データベースに格納された関連度を更新する関連度更新部と、をさらに備え、
前記関連度更新部は、
前記確定済名称記憶部に記憶された名称候補と属性語のうち、前記第2の入力部で選択された名称候補の名称と属性語の関連度を増大し、前記第2の入力部で選択されなかった属性語と名称候補の名称の関連度を減少し、前記データベースに格納された前記関連度の値を更新することを特徴とする情報検索装置。
【請求項7】
請求項1に記載の情報検索装置において、
前記データベースは、前記名称ごと、または複数の名称をまとめて分類した群に対して数値を付与した表を備え、
前記提示属性作成部は、前記名称候補に対応する関連度と前記数値を掛け合わせた値を新たな関連度として使用することを特徴とする情報検索装置。
【請求項8】
請求項1に記載の情報検索装置において、
前記関連度を受信する通信部をさらに備え、
前記受信した関連度で前記データベースに格納された関連度を更新することを特徴とする情報検索装置。
【請求項9】
請求項2に記載の情報検索装置において、
前記提示属性作成部は、
前記得点が高い属性語を算出し、
前記名称候補を前記属性語の前後の文字列で検索し、
前記名称候補で前記属性語がより長く一致する文字列を生成し、
前記生成された文字列を、属性語として出力部に出力することを特徴とする情報検索装置。
【請求項10】
請求項2に記載の情報検索装置において、
前記データベースに格納される属性語は、前記名称の一部分である形態素と、前記名称中の前記形態素の位置情報とを含んで保持することを特徴とする情報検索装置。
【請求項11】
請求項1ないし請求項10のいずれかひとつに記載の情報検索装置において、
音声信号を取得する音声取込部と、
前記取得した音声信号から認識した語彙を出力する音声認識部と、
前記音声認識部から出力された前記語彙を、前記入力部に入力することを特徴とする情報検索装置。
【請求項12】
請求項1に記載の情報検索装置において、
前記提示属性作成部は、
前記属性語の組合せによる関連度の総合的な高さを表す理解容易度を計算し、
前記演算した独立度と網羅度と均一度と理解容易度のうち少なくとも1つに基づいて属性語の組合せの得点を計算することを特徴とする情報検索装置。
【請求項13】
請求項12に記載の情報検索装置において、
前記理解容易度は、前記属性語と前記名称の対応関係の分かりやすさを示す指標であることを特徴とする情報検索装置。
【請求項14】
請求項1に記載の情報検索装置において、
前記独立度は、前記抽出した属性語同士で属性語が異なる指標であることを特徴とする情報検索装置。
【請求項15】
請求項1に記載の情報検索装置において、
前記網羅度は、前記抽出した属性語の組合せによって、前記名称候補のうちどの程度の割合が選択可能となるかを示す指標であることを特徴とする情報検索装置。
【請求項16】
請求項1に記載の情報検索装置において、
前記均一度は、前記抽出した属性語に対応する名称候補の数の均一さの度合いを示す指標であることを特徴とする情報検索装置。
【請求項17】
入力された文字を含む名称をデータベースから検索する情報検索装置と、
ネットワークを介して前記情報検索装置に接続されたサーバと、を備えた情報検索システムにおいて、
前記情報検索装置は、
文字を入力する入力部と、
前記名称と、当該名称に関連する属性語と、前記名称と属性語の関連の度合いを示す関連度と、を格納するデータベースと、
前記入力された文字を含む名称をデータベースから検索して、前記検索した名称を名称候補として出力する名称検索部と、
前記名称検索部から出力された前記名称候補に関連する属性語を前記データベースから抽出する提示属性作成部と、
前記提示属性作成部で抽出された属性語と、前記名称検索部からの名称候補と、を提示する出力部と、
前記サーバと通信を行う通信部と、
前記データベースに格納された関連度を前記サーバから受信した関連度で更新する関連度更新部と、を備え、
前記提示属性作成部は、
前記抽出した属性語の組合せについて、当該属性語に関連付けられた前記名称候補の前記関連度を前記データベースから取得して、
前記抽出した属性語間の異なり度合いを表す独立度を演算し、
前記抽出した属性語の組合せによる名称候補の網羅性を表す網羅度を演算し、
前記属性語ごとに関連する名称候補の件数の均一さを表す均一度を演算し、
前記演算した独立度と網羅度と均一度のうち少なくとも1つに基づいて属性語の組合せの得点を計算する第1の得点計算部を有し、
前記得点が高い順に前記属性語の組み合わせを前記出力部に出力することを特徴とする情報検索システム。
【請求項18】
請求項17に記載の情報検索システムにおいて、
前記データベースに格納される属性語は、前記名称候補の名称の一部分を構成する形態素であることを特徴とする情報検索システム。
【請求項19】
計算機に入力された文字を含む名称をデータベースから検索する情報検索方法であって、
前記入力された文字を含む名称を、前記名称と当該名称に関連する属性語と前記名称と属性語の関連の度合いを示す関連度とを格納するデータベースから前記計算機が検索するステップと、
前記検索した名称を名称候補として出力するステップと、
前記名称候補に関連する属性語を前記データベースから抽出するステップと、
前記抽出された属性語と前記名称候補とを前記計算機の出力部に出力するステップと、を含み、
前記名称候補に関連する属性語を前記データベースから抽出するステップは、
前記抽出された属性語の組合せについて、当該属性語に関連付けられた前記名称候補の前記関連度を前記データベースから取得するステップと、
前記抽出された属性語間の異なり度合いを表す独立度を演算するステップと、
前記抽出された属性語の組合せによる名称候補の網羅性を表す網羅度を演算するステップと、
前記属性語ごとに関連する名称候補の件数の均一さを表す均一度を演算するステップと、
前記演算した独立度と網羅度と均一度のうち少なくとも1つに基づいて属性語の組合せの得点を計算するステップと、
前記得点が高い順に前記属性語の組み合わせを前記出力部へ出力するステップと、を有することを特徴とする情報検索方法
【請求項20】
請求項19に記載の情報検索方法において、
前記データベースに格納される属性語は、前記名称候補の名称の一部分を構成する形態素であることを特徴とする情報検索方法。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【図21】
【図22】
【図23】
【図24】
【図25】
【図26】
【図27】
【図28】
【図29】
【図30】
【図31】
【図32】
【図33】
【図34】
【図35】
【図36】
【図38】
【図39】
【図40】
【図42】
【図43】
【図44】
【図45】
【図46】
【図47】
【図48】
【図37】
【図41】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【図21】
【図22】
【図23】
【図24】
【図25】
【図26】
【図27】
【図28】
【図29】
【図30】
【図31】
【図32】
【図33】
【図34】
【図35】
【図36】
【図38】
【図39】
【図40】
【図42】
【図43】
【図44】
【図45】
【図46】
【図47】
【図48】
【図37】
【図41】
【公開番号】特開2009−217585(P2009−217585A)
【公開日】平成21年9月24日(2009.9.24)
【国際特許分類】
【出願番号】特願2008−61013(P2008−61013)
【出願日】平成20年3月11日(2008.3.11)
【出願人】(591132335)株式会社ザナヴィ・インフォマティクス (745)
【Fターム(参考)】
【公開日】平成21年9月24日(2009.9.24)
【国際特許分類】
【出願日】平成20年3月11日(2008.3.11)
【出願人】(591132335)株式会社ザナヴィ・インフォマティクス (745)
【Fターム(参考)】
[ Back to top ]