辞書検索装置、辞書検索方法及び辞書検索プログラム
【課題】入力した文字列が辞書データにない場合でも、意味を類推できる電子辞書を提供する。
【解決手段】文字入力を受け付ける入力手段と、見出しと対応する訳説明情報とからなる辞書データを記憶した記憶手段と、前記入力手段から入力された文字列で前記記憶手段に記憶された見出しを検索する検索手段と、前記入力手段から入力された文字列に含まれる部分文字列に従い、前記辞書データと完全一致する部分を検索する分割検索手段と、前記検索手段および前記分割検索手段のうち少なくとも一方の検索結果を表示する表示手段と、を備えることを特徴とする。
【解決手段】文字入力を受け付ける入力手段と、見出しと対応する訳説明情報とからなる辞書データを記憶した記憶手段と、前記入力手段から入力された文字列で前記記憶手段に記憶された見出しを検索する検索手段と、前記入力手段から入力された文字列に含まれる部分文字列に従い、前記辞書データと完全一致する部分を検索する分割検索手段と、前記検索手段および前記分割検索手段のうち少なくとも一方の検索結果を表示する表示手段と、を備えることを特徴とする。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、辞書検索装置、辞書検索方法及び辞書検索プログラムに関し、例えば電子辞書の検索技術に関する。
【背景技術】
【0002】
複数の見出しと、これらの見出しに対応する説明情報とが格納された、国語辞典、英和辞典、和英辞典などの辞書データが内蔵された電子辞書が普及している。電子辞書を使用することにより、紙の辞書に比べて高速な見出しの検索が可能となる。
従来、このような電子辞書では、一般的な検索方法として、見出しの前方一致検索を行い、検索結果としてリストを表示する。辞書データとして存在しない見出しを入力すると、前方一致で近い見出しを表示する。
【0003】
例えば、図3のように、辞書データに見出しとして「電子辞書」が存在しない場合、「でんしじしょ」と入力すると、前方一致検索により濁点を無視すると「でんしし」までが一致している「電磁石」という見出しが検索されてしまう。
「電子」という見出しは見出しのデータ順で「電磁石」の上方に位置するため、スクロールすることにより表示することは出来るが、「辞書」という意味は入力しなおさなければ検索できない。この場合は、「電子」と「辞書」それぞれは辞書データに見出しとして存在しているので、分割してそれぞれ検索すれば意味を調べる事ができるが、「電子辞書」と一度に入力すると検索できなくなってしまう。
【0004】
使用者が入力した文字列と、検索候補に表示される見出しの不一致を避けるために、入力時の補助手段として辞書データとして存在する見出しのみを入力できるように、入力可能な文字を表示するものもある(例えば、特許文献1参照)。
【特許文献1】特開2007−219896号公報
【発明の開示】
【発明が解決しようとする課題】
【0005】
しかしながら、上述したような従来の電子辞書では、辞書データとして記憶されている見出しのみしか検索できず、複合語などを入力した場合でも前方一致で近い見出しが一つのみしか検索できないという問題があった。
【0006】
そこで、本発明は、上述の事情に鑑みてなされたものであり、複合語や成句など辞書データの見出しとして存在しない語句を入力した場合でも、ユーザが複合語や成句の意味を推測できるように検索結果を得ることを目的とする。
【課題を解決するための手段】
【0007】
(1)上記の課題を解決するために、請求項1記載の発明では、文字入力を受け付ける入力手段と、見出しと、各見出しに対応する説明情報を有する辞書データを記憶した記憶手段と、前記入力手段から入力された文字列で、前記記憶手段に記憶された前記辞書データの見出しを検索する検索手段と、前記入力手段から入力された文字列に含まれる部分文字列で、前記記憶手段に記憶された前記辞書データの見出しと完全一致する見出しを検索する分割検索手段と、前記検索手段および前記分割検索手段のうち少なくとも一方の検索結果を表示する表示手段と、を備えることを特徴とする辞書検索装置を提供する。
(2)請求項2記載の発明では、前記分割検索手段は、前記検索手段で見出しが検索されなかったときに、検索することを特徴とする請求項1記載の辞書検索装置を提供する。
(3)請求項3に記載の発明では、前記入力手段から入力された文字列から接続語を検索する接続語検索手段と、前記接続語検索手段により検索された接続語を除き、当該接続語位置で分割して部分文字列を生成する部分文字列生成手段を備え、前記分割検索手段は、前記部分文字列生成手段で生成された部分文字列で、検索を行う、ことを特徴とする請求項1記載の辞書検索装置を提供する。
(4)請求項4に記載の発明では、前記接続語検索手段は、検索した接続語のうち、当該接続語を含有する見出しが、前記入力手段から入力された文字列に存在する場合、当該接続語を検索結果から除外する、ことを特徴とする請求項3記載の辞書検索装置を提供する。
(5)請求項5に記載の発明では、前記記憶手段は、更に、接続語からなる接続語辞書と、接続語を一部に含む接続語含有見出しからなる接続語含有見出し辞書とを記憶し、前記接続語検索手段は、前記記憶手段に記憶された接続語辞書と接続語含有見出し辞書とを参照して、接続語の検出と、検索した接続語の検索結果からの除外を行う、ことを特徴とする請求項3記載の辞書検索装置を提供する。
(6)請求項6に記載の発明では、見出しと対応する説明情報を有する辞書データから見出しを検索する辞書検索方法であって、文字入力を受け付ける入力ステップと、入力された文字列で、前記辞書データから見出しを検索する検索ステップと、入力ステップで入力された文字列に含まれる部分文字列で、前記辞書データの見出しと完全一致する見出しを検索する分割検索ステップと、前記検索ステップおよび前記分割検索ステップのうち少なくとも一方のステップによる検索結果を表示する表示ステップと、を備えることを特徴とする辞書検索方法を提供する。
(7)請求項7見出しと対応する説明情報を有する辞書データから見出しを検索する辞書検索プログラムであって、文字入力を受け付ける入力機能と、入力された文字列で、前記辞書データから見出しを検索する検索機能と、入力機能で入力された文字列に含まれる部分文字列で、前記辞書データの見出しと完全一致する見出しを検索する分割検索機能と、前記検索機能および前記分割検索機能のうち少なくとも一方の機能による検索結果を表示する表示機能と、をコンピュータに実行させることを特徴とする辞書検索プログラムを提供する。
【発明の効果】
【0008】
各請求項に記載した本発明によれば、分割検索手段が、入力手段から入力された文字列に含まれる部分文字列で、辞書データの見出しと完全一致する見出しを検索するため、入力した文字列全体が辞書データの見出しにない場合でも、使用者は文字列の一部が一致する見出しをすべて知ることが出来る。
また、請求項3から請求項5の発明によれば、部分文字列生成手段が、接続語検索手段により検索された接続語を除き、当該接続語位置で分割して部分文字列を生成するため、より適切な部分文字列による分割検索を行うことが可能となる。
【発明を実施するための最良の形態】
【0009】
以下、本発明の情報表示装置における好適な実施の形態について、図1から図11を参照して詳細に説明する。
なお、本実施形態では、情報表示装置の一例として、携帯型の電子辞書1を用いて説明する。
(1)実施形態の概要
本実施形態の電子辞書には、国語辞典や和英辞典、英和辞典をはじめ、種々の辞書データが内蔵されている。
いずれかの辞書モードにおいて、キーボードを介して検索対象となる見出し語に対応する文字列が入力されると、電子辞書のCPUは、入力された文字列キーとして、辞書データ内の見出し語の検索を実行する。
検索は完全一致検索と前方一致検索を行い、検索結果である見出し語を検索候補リストとして表示する。そして選択された見出し語に対応する解説情報を辞書データから読み出し、その解説情報のプレビュー画面を見出し語と共にメイン画面に表示する。
【0010】
ここで前方一致検索で入力文字列に対応する見出し語が見つからなかった場合、入力文字列を部分文字列に分割(入力文字列に含まれる見出し語を部分文字列として抽出)し、部分文字列で見出し語を検索し、検索候補リストとして見出し語を表示する。
このような検索処理を行うことで、入力された見出し語が辞書データ内に存在しない場合でも、入力文字列の一部に該当する見出し語に分割して検索結果を表示させることができる。
このような検索結果を表示することで、接続語を含む文字列が辞書データに存在するかどうか意識せずに入力し、使用者は単語の組み合わせとして文字列の意味を類推することが可能となる。
【0011】
(2)実施形態の詳細
図1は、電子辞書1の概略構成を示すブロック図である。
図1に示すように電子辞書1は、CPU(Central Processing Unit)11、入力部12、出力部13、ROM(Read Only Memory)14、RAM(Random Access Memory)15を備えている。
CPU11は、ROM14に記憶されている各種プログラムに従って、情報処理を行う中央演算処理装置である。本実施形態では、CPU11は、例えば、見出し語の検索処理、分割文字列の生成を含む検索部分指定処理、表示処理等の各種情報処理を行う。
入力部12は、電子辞書1に対して情報をデータとして与える入力装置から構成されて
いる。
【0012】
図2は、電子辞書1の外観を示した図である。
本実施形態では、入力部12は、図2に示すキーボード20によって構成されているが、マイクを用いた音声入力装置やマウスなどによって構成するようにしてもよい。
本実施形態において入力部12を構成するキーボード20は、図2に示すように、電子辞書1における電源の入/切を行う入/切キー21、電子辞書1の有する所定機能を選択するためのファンクションキー22、検索する見出し語などの文字情報を入力するための文字入力キー23、検索した候補を選択するための決定/訳キー24、カーソルを移動させるカーソルキー(十字キー)25、本実施形態の分割検索を実行するための分割検索実行キー26を備えている。分割検索実行キー26は後述するように、分割検索を自動的に実行する場合はなくてもよい。
【0013】
本実施形態では、カーソルキー25は、表示部13に表示された画面のスクロール(画面送り)手段としても機能する。
図1の説明に戻り、表示部13は、本実施形態では、図2に示す液晶のディスプレイ30によって構成されている。
本実施形態では、ディスプレイ30の画面が複数の領域に分割されることによって、メイン画面領域に表示された検索リスト中で選択された見出し語に関する情報が、プレビュー画面領域(サブ画面領域)に表示される。なお、メイン画面領域は、第1の領域として機能し、プレビュー画面領域は第2の領域として機能する。
【0014】
ディスプレイ30におけるプレビュー画面領域の表示の有無、画面の分割数、表示文字サイズ、メイン画面領域のなどの設定は、任意に行うことができるように構成されている。例えば、見出し候補の表示方法を図8のようにタブ形式で表示したり、図9のように一覧表示するように設定する事ができる。
【0015】
ROM14は、読み出し専用の記憶装置であって、CPU11を駆動するための基本的なプログラムや各種パラメータなどを格納している。
詳しくは、辞書本体データ、見出し一覧データ、表示制御プログラム、見出し語検索プログラム、接続語検索プログラム、検索部分指定プログラムなどが格納されている。
辞書本体データには、見出し語とその見出し語に対応する説明情報(解説や訳文など)とが記録されている。
【0016】
本実施形態では、辞書本体データ記憶部141に、国語辞典、漢字字典、英和辞典、英英辞典、和英辞典、カタカナ語辞典、百科事典、ことわざ辞典などの辞書のデータが格納されている。
見出し一覧データ記憶部142は、辞書本体データ記憶部141に記憶された辞書データに対応する見出しIDと検索用読み、及び見出しが記憶されている。
【0017】
本実施形態の見出し一覧データ記憶部142の構成例を図7に示す。
見出しID、見出し読み、見出しデータは従来の見出し一覧データにも含まれているが、本実施形態では、これらに加えて、接続語見出しIDと接続語含有見出しIDのデータを記憶している。
接続語見出しIDは、辞書に含まれる見出しで接続語として使われる見出しに対しIDを付与したものである。接続語とは具体的には「が」「を」「に」など、名詞や動詞を接続するために用いる言葉である。
接続語含有見出しIDとは、上述する接続語が見出しの一部分に含まれるが、それ自身は接続語としては機能しない見出しに対しIDを付与したものである。具体的には「が」を含む見出しとして、「てがみ」、「かがみ」、「がーる」などである。
接続語見出しID、及び接続語含有見出しIDは独立したテーブルを用いずに、それぞれに該当する見出しIDのみを記憶しているため、ROM14の使用容量を削減することができる。それぞれの利用方法は処理フローに沿って後述する。
【0018】
図1に戻り、表示制御プログラム記憶部145は検索結果などを出力部13に表示出力するための表示制御プログラムが記憶されている。
見出し検索プログラム記憶部146は、入力部12から使用者が文字列を入力した場合、この見出し語に対応する説明情報を、辞書本体データ記憶部141から検索する(探し出す)処理を行うプログラムが記憶されている。
【0019】
次に本実施形態の見出し検索処理を説明する。
見出し検索処理は、CPU11が見出し検索プログラム記憶部146に記憶されたプログラムを実行することで実現する。見出し検索処理の処理フローを図4に沿って説明する。
使用者が文字入力キー23を用いて文字入力を行うと(S401)、CPU11は、見出し検索プログラム記憶部146に記憶された見出し検索プログラムを実行し(S402)、S401で入力された文字列と見出し一覧データ記憶部142に記憶された見出し読みと比較して、完全一致する見出しがあるか判断する(S403)。
ここでは使用者が入力する文字列が仮名である場合を想定しているため、完全一致の判断に見出し読みを用いているが、英語やドイツ語などの場合は、入力文字列と見出しを直接比較して判断することも可能である。
【0020】
完全一致する見出しが見つかった場合(S403;Y)、CPU11は、完全一致した見出しとその周辺の見出しを検索結果として、表示制御プログラムを介してリスト表示する(S404)。
一方、完全一致する見出しがなかった場合(S403;N)、CPU11は、部分一致した見出しとその周辺の見出しを検索結果として、表示制御プログラムを介してリスト表示する(S405)。
【0021】
ここまでは従来技術の検索処理と同様であるが、本実施形態の検索処理において、CPU11は、引き続き分割検索を実行するか判断する(S406)。この判断はある条件により自動で行ってもよいし、使用者が分割検索実行キー26(図2参照)を押下したか否かにより判断してもよい。
自動で実行するための判断基準としては、S405で部分一致した文字列の長さに閾値を設け、使用者が入力した文字列のうち、部分一致しなかった文字列の長さが一定値に達したら実行するようにするなどが考えられる。
【0022】
分割検索は、S403で完全一致した見出しが見つかり、S404で完全一致した見出しを表示している場合であっても、S404の分割検索を実行してもよい。あらかじめ設定した状態により、必ず分割検索を実行するようにしてもよいし、使用者が分割検索実行キー26を押下したことで分割検索を実行してもよい。
画面の領域を分けて、S404の検索結果と共に、後述する分割検索の結果を並べて表示することで、その見出しを構成している言葉を知る事が出来るという効果もある。
【0023】
S406で分割検索を実行する場合、CPU11は、次に接続語検索プログラムをサブルーチンとして実行する(S407)。処理の流れの詳細は図5の説明で後述するが、接続語検索プログラムでは、入力された文字列に接続語が含まれるか判断し、接続語の除去を行う。
例えば、「きずがつく」という文字列が入力された場合は「が」が接続語であると判断して、接続語に代えて分割箇所識別子を挿入する。分割箇所識別子とは、「きずがつく」という文字列を「きず」と「つく」に分割して検索するための目印として機能するものである。
【0024】
次に、CPU11は、S407で挿入された分割箇所識別子があるかどうかを判断する(S408)。
分割箇所識別子が存在しない場合(S408;N)、CPU11は、S411に移行し、検索部分指定プログラムをサブルーチンとして実行する。
【0025】
一方、分割箇所識別子が存在する場合(S408;Y)、CPU11は、分割箇所識別子で文字列を分割して、分割後の文字列の各々と見出しが完全一致するか判断する(S409)。
分割後の文字列と見出しが完全一致しなかった場合(S409;N)、CPU11は、完全一致しなかった文字列を読み出し(S410)、検索部分指定プログラムをサブルーチンとして実行する(S411)。
【0026】
S411の検索部分指定プログラムの処理の流れの詳細は図6の説明で後述するが、検索部分指定プログラムでは、入力された文字列を分割した部分文字列と見出しを比較し、完全一致する見出しを検索する処理を行う。例えば「でんしじしょ」という文字列を分割した部分文字列のうち、「でんし」、「でん」、「で」、「ん」、「しじし」、「しじ」、「し」、「じしょ」、「じ」、「しょ」という各部分文字列と見出しが完全一致するという検索を行う。
【0027】
S411のサブルーチン(後述)で完全一致した見出しが見つかった場合、およびS409で分割後の文字列と見出しが完全一致した場合は、完全一致した見出しを検索結果とする。
そして表示制御プログラムが検索結果をディスプレイ30に表示する(S412)。以上が見出し検索処理の流れである。
【0028】
次に図5を用いて接続語検索処理のフローを説明する。接続語検索処理は、CPU11が接続語検索プログラム記憶部147に記憶されたプログラムを実行することで実現する。
接続語検索プログラムによりCPU11は、接続語見出しIDから、接続語候補一覧を読み出す(S501)。具体的にはROM14内の接続語見出しID記憶部143より、接続語見出しID、つまり接続語として用いられる見出しを読み出してRAM15上に確保した領域に保持しておく。
【0029】
次にCPU11は、接続語見出しIDの見出しと入力文字列を比較し(S502)、接続語と入力文字の一部分と完全一致するか判断する(S503)。これは入力文字の一部分に接続語が含まれるかどうかについての判断である。
【0030】
接続語と入力文字の一部分とが一致する場合(S503;Y)、入力文字列に接続語と同じ文字列が含まれているということなので、その文字列が本当に接続語かどうかを次のように判断する。
まずCPU11は、接続語含有見出しIDより、見出し候補一覧を読み出す(S504)。具体的にはROM14内の接続語含有見出しID記憶部144より、接続語含有見出しIDを読み出してRAM15上に確保した領域に保持しておく。接続語含有見出しとは接続語と同じ文字列を含むが、それ自身は接続語として機能しない見出しである。
【0031】
次にCPU11は、S504で読み出した接続語含有見出しの中で、S503で完全一致した接続語を含む接続語含有見出しを検索する(S505)。
CPU11は、S505で検索された接続語含有見出しが入力文字の一部分と完全一致するか判断し(S506)、完全一致する場合は、その文字列は表記は一致するが実際には見出し語中に含まれる文字であって接続語ではないと判定し、接続語の検索結果から除外する。
そして、CPU11は、入力文字列のうち見出しと一致した部分文字列の前後に分割箇所識別子を挿入する(S507)。
【0032】
一方、完全一致しない場合(S506N;)は、S503で検索された検索語は本当の接続語とみなし、接続語と一致した文字にの代わりに分割箇所識別子を挿入する(S508)。
以上で接続語検索処理を終了する。
なお、接続語が複数含まれている場合は、すべての候補に対して検索するため、このフローを繰り返して実行する。
【0033】
次に図6を用いて検索部分指定処理のフローを説明する。検索部分指定処理は、CPU11が検索部分指定プログラム記憶部148に記憶されたプログラムを実行することで実現する。
検索部分指定プログラムによりCPU11は、入力文字列の末尾の1文字を無視したもの(末尾の1文字を除いた文字列)を入力文字列とする(S601)。
そしてCPU11は、入力文字列がNULL(空)か判断し(S602)、文字列が残っている(NULLではない)場合は見出しと完全一致しているか判断する(S603)。
【0034】
ここで完全一致した場合(S603;Y)CPU11は、完全一致した見出しを検索結果としてRAM15上に確保した領域に保存し、分割箇所識別子を完全一致した文字列の末尾に挿入し(S604)、S601へ戻る。S603で見出しと完全一致しない場合はそのままS601へ戻る。
【0035】
S602で検索文字列がNULL(空)の場合(S602;Y)CPU11は、新規の(未判断の)分割箇所識別子があるか否かを判断する(S605)。新規の分割箇所識別子とは、この検索部分指定プログラムで分割箇所識別子が挿入されたことを意味する。
CPU11は、新規の識別子が挿入されていなければ(S605;N)、処理を終了する。
【0036】
新規の識別子が挿入されている場合CPU11は、最後に挿入された分割箇所識別子以降の、つまり検索文字列中でもっとも前方の分割箇所識別子以降の文字列を新たに検索文字列とする(S606)。その後S602へ戻り、処理を繰り返すことで、分割可能なパターン全ての文字列の検索を行う。
【0037】
次に具体的な検索例について、図5〜図7のフローと図8〜図11の表示画面例を用いて説明する。
まず、「でんしじしょ」という見出しが辞書に存在しない場合、S401で使用者が「でんしじしょ」と入力する場合を考える。
S403では完全一致する見出しが存在しないので、S405で従来例と同様、図8(a)のように前方一致で「でんじしゃく」が検索される。S406で分割検索を実行するとS407で接続語検索プログラムが実行される。
【0038】
接続語検索プログラムでは、「でんしじしょ」には接続語が含まれないため、S503で完全一致する接続語がないので、接続語検索プログラムを終了する。
接続語検索プログラムでは分割箇所識別子が挿入されなかったので、S408ではNoになり、S411に進み、検索部分指定プログラムを実行する。
【0039】
検索部分指定プログラムでは、入力文字列「でんしじしょ」の後方から一文字ずつ削除して行き、見出しと一致した順に分割箇所識別子を挿入していく。S601で末尾の1文字を削除すると検索文字列は「でんしじし」となり、S602で検索文字列はNULLではないので、S603で完全一致する見出しを検索する。
「でんしじし」は見出しとして存在しないので、Noになり、S601に戻り、さらに末尾の一文字を削除すると検索文字列は「でんしじ」となるが、これもS603で完全一致する見出しはないので、S601に戻り末尾の一文字を削除して「でんし」となる。
S603で完全一致する見出しが見つかるのでYesになりS604に行き、入力文字列の「でんし」と「じしょ」の間に分割箇所識別子を挿入する。さらに繰り返し、「でん」と「しじしょ」の間と、「で」と「んしじしょ」の間に分割箇所識別子を挿入する。
【0040】
検索文字列が「で」の時に末尾の一文字を削除すると検索文字列がNULLとなるので、S605に進み、新規の分割箇所識別子があるので、S606で最後に挿入された分割箇所識別子より後方の入力文字列「んしじしょ」を新たに検索文字列とする。
同様に「んしじしょ」では見出しと完全一致しないので、「んしじし」、「んしじ」、「んし」、「ん」と削除して行き、「ん」で見出しと完全一致するので、「ん」と「しじしょ」の間に分割箇所識別子を挿入する。
【0041】
検索文字列が「ん」の時に末尾の一文字を削除すると検索文字列がNULLとなるので、S605に進み、新規の分割箇所識別子があるので、S606で最後に挿入された分割箇所識別子より後方の入力文字列「しじしょ」を新たに検索文字列とする。
ここでは「しじしょ」が見出しにないとすると、「しじし」、「しじ」、「し」と末尾から削除して行き、「しじし」、「しじ」、「し」が見出しと完全一致するので検索結果として一時保存する。
【0042】
次の検索文字列は「じしょ」となり、「じし」「じ」と末尾から削除して行き、「じ」が見出しと完全一致するので検索結果として保存される。
次の検索文字列は「しょ」となり、「し」と末尾から削除して行き、「し」が見出しと完全一致するので検索結果として保存される。
次の検索文字列は「ょ」となるが、見出しと完全一致しないので、ここで検索部分指定プログラムを終了する。
【0043】
検索部分指定プログラムで検索結果として一時保存された「でんし」、「でん」、「で」、「ん」、「しじし」、「しじ」、「し」、「じしょ」、「じ」、「しょ」に該当する見出しを表示制御プログラムで表示する。
【0044】
図8(b)および(c)は本実施形態における検索処理結果を表示する場合の表示例である。
805は使用者が入力した文字列を表示する。806は抽出された見出し文字列それぞれに対応する見出し語をタブで分類して、807はそれぞれのタブ内に候補リストを表示している。808はプレビュー領域である。
カーソルキー25を操作することによりタブが切り替わり、別の文字列に対応する見出し候補を見る事ができる。図8(c)は右カーソルキーを1回押下した場合の表示例であり、810で「じしょ」のタブが反転表示され、811の候補リストには「じしょ」に該当する見出し候補が表示される。
【0045】
図9は検索処理結果を表示する場合、タブ表示を用いない場合の表示例である。従来の見出しリストと同様に、一つの画面で順番に候補を表示している。
図8、図9では、検索された見出しをすべて表示しているが、図10のように、あらかじめ分割検索で見出しと完全一致した部分文字列をリスト表示し、使用者が選択した箇所で分割した場合に該当する見出しのみを表示するようにしてもよい。
【0046】
もう一つの入力例として「きずがつく」という見出しが辞書にない場合、S401で使用者が「きずがつく」と入力する場合を考える。S403では完全一致する見出しがないので、S405で、図11(a)のように前方一致で「キスカ島」が検索される。S406で分割検索を実行するとS407で接続語検索プログラムが実行される。
【0047】
接続語検索プログラムでは、S501で接続語見出しIDとして「が」読み出され、S502で「が」と「きずがつく」を比較すると、S503「きずがつく」の「が」が接続語に完全一致する。S504では「が」を含む接続語含有見出しIDが読み出されるが、S506で「きずがつく」との一部と完全一致する接続語含有見出しがないので、S508で「が」に代えて分割箇所識別子を挿入し、接続語検索プログラムを終了する。
【0048】
接続語検索プログラムでは分割箇所識別子が挿入されたので、S408ではYesになり、S409に進むと、分割箇所識別子で分割した文字列「きず」と「つく」に関して、それぞれ完全一致する見出しがあるか検索する。「きず」と「つく」両方に完全一致する見出しが見つかり、S412に進み、「きず」と「つく」に該当する見出しを検索結果として表示する。
【0049】
図11は接続語を含む文字列「きずがつく」と入力した場合の表示例である。図11(a)は通常の検索結果であり、前方一致検索により「キスカ島」という見出しが検索されている。図11(b)は本発明の検索方法で接続語「が」を省略して「きず」及び「つく」に分割して検索された画面の表示例である。図8と同様に、タブに分けて検索結果を表示している。また、入力フィールド1101で「きずがつく」と表示しているが、本発明の接続語検索プログラムで不要な接続語を除去すると、1104の様に「きず」と「つく」の間の接続語「が」が「/」に置き換えて表示される。
【0050】
以上、図面を参照してこの発明の一実施形態について詳しく説明してきたが、具体的な構成は上述のものに限られることはなく、この発明の要旨を逸脱しない範囲内において様々な設計変更等をすることが可能である。
本実施形態では日本語の見出し語について分割して検索を行う例を説明したが、日本語以外でも適応可能である。特に二つの単語をつなぎ合わせて1単語とする場合が多く存在するドイツ語の検索処理にも有効である。例えばドイツ語でtaktfrequenzという単語は、taktとfrequenzという二つの単語を繋ぎ合わせた単語であるが、本実施形態によればtaktfrequenzという見出しがない場合に、taktfrequenzと入力した場合でもtaktとfrequenzという二つの単語の意味を同時に調べる事が可能となる。
【0051】
上述した実施形態において、CPU11による各ステップを実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、また、CPU11における処理部の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより、符号化処理、及び復号化処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものであってもよい。また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、フラッシュメモリ等の書き込み可能な不揮発性メモリ、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。
【0052】
さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(例えばDRAM(Dynamic Random Access Memory))のように、一定時間プログラムを保持しているものも含むものとする。また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
【図面の簡単な説明】
【0053】
【図1】本実施形態の電子辞書の概略構成を示すブロック図である。
【図2】本実施形態の電子辞書の外観構成を示した図である。
【図3】従来の電子辞書における検索画面の表示例である。
【図4】本実施形態の電子辞書における検索処理の流れを示すフローチャートである。
【図5】本実施形態の電子辞書における接続語検索処理の流れを示すフローチャートである。
【図6】本実施形態の電子辞書における検索部分指定処理の流れを示すフローチャートである。
【図7】本実施形態の電子辞書における見出し一覧データの構成例である。
【図8】本実施形態の電子辞書における検索画面の表示例である。
【図9】本実施形態の電子辞書における検索画面の別の表示例である。
【図10】本実施形態の電子辞書における検索画面の表示例である。
【図11】本実施形態の電子辞書における検索画面の表示例である。
【符号の説明】
【0054】
1 電子辞書
11 CPU
12 入力部
13 出力部
14 ROM
141 辞書本体データ記憶部
142 見出し一覧データ記憶部
143 接続語見出しID記憶部
144 接続語含有見出しID記憶部
145 表示制御プログラム記憶部
146 見出し検索プログラム記憶部
147 接続語検索プログラム記憶部
148 検索部分指定プログラム記憶部
15 RAM
20 キーボード
21 入/切キー
22 ファンクションキー
23 文字入力キー
24 決定/訳キー
25 カーソルキー
26 分割検索実行キー
30 ディスプレイ
【技術分野】
【0001】
本発明は、辞書検索装置、辞書検索方法及び辞書検索プログラムに関し、例えば電子辞書の検索技術に関する。
【背景技術】
【0002】
複数の見出しと、これらの見出しに対応する説明情報とが格納された、国語辞典、英和辞典、和英辞典などの辞書データが内蔵された電子辞書が普及している。電子辞書を使用することにより、紙の辞書に比べて高速な見出しの検索が可能となる。
従来、このような電子辞書では、一般的な検索方法として、見出しの前方一致検索を行い、検索結果としてリストを表示する。辞書データとして存在しない見出しを入力すると、前方一致で近い見出しを表示する。
【0003】
例えば、図3のように、辞書データに見出しとして「電子辞書」が存在しない場合、「でんしじしょ」と入力すると、前方一致検索により濁点を無視すると「でんしし」までが一致している「電磁石」という見出しが検索されてしまう。
「電子」という見出しは見出しのデータ順で「電磁石」の上方に位置するため、スクロールすることにより表示することは出来るが、「辞書」という意味は入力しなおさなければ検索できない。この場合は、「電子」と「辞書」それぞれは辞書データに見出しとして存在しているので、分割してそれぞれ検索すれば意味を調べる事ができるが、「電子辞書」と一度に入力すると検索できなくなってしまう。
【0004】
使用者が入力した文字列と、検索候補に表示される見出しの不一致を避けるために、入力時の補助手段として辞書データとして存在する見出しのみを入力できるように、入力可能な文字を表示するものもある(例えば、特許文献1参照)。
【特許文献1】特開2007−219896号公報
【発明の開示】
【発明が解決しようとする課題】
【0005】
しかしながら、上述したような従来の電子辞書では、辞書データとして記憶されている見出しのみしか検索できず、複合語などを入力した場合でも前方一致で近い見出しが一つのみしか検索できないという問題があった。
【0006】
そこで、本発明は、上述の事情に鑑みてなされたものであり、複合語や成句など辞書データの見出しとして存在しない語句を入力した場合でも、ユーザが複合語や成句の意味を推測できるように検索結果を得ることを目的とする。
【課題を解決するための手段】
【0007】
(1)上記の課題を解決するために、請求項1記載の発明では、文字入力を受け付ける入力手段と、見出しと、各見出しに対応する説明情報を有する辞書データを記憶した記憶手段と、前記入力手段から入力された文字列で、前記記憶手段に記憶された前記辞書データの見出しを検索する検索手段と、前記入力手段から入力された文字列に含まれる部分文字列で、前記記憶手段に記憶された前記辞書データの見出しと完全一致する見出しを検索する分割検索手段と、前記検索手段および前記分割検索手段のうち少なくとも一方の検索結果を表示する表示手段と、を備えることを特徴とする辞書検索装置を提供する。
(2)請求項2記載の発明では、前記分割検索手段は、前記検索手段で見出しが検索されなかったときに、検索することを特徴とする請求項1記載の辞書検索装置を提供する。
(3)請求項3に記載の発明では、前記入力手段から入力された文字列から接続語を検索する接続語検索手段と、前記接続語検索手段により検索された接続語を除き、当該接続語位置で分割して部分文字列を生成する部分文字列生成手段を備え、前記分割検索手段は、前記部分文字列生成手段で生成された部分文字列で、検索を行う、ことを特徴とする請求項1記載の辞書検索装置を提供する。
(4)請求項4に記載の発明では、前記接続語検索手段は、検索した接続語のうち、当該接続語を含有する見出しが、前記入力手段から入力された文字列に存在する場合、当該接続語を検索結果から除外する、ことを特徴とする請求項3記載の辞書検索装置を提供する。
(5)請求項5に記載の発明では、前記記憶手段は、更に、接続語からなる接続語辞書と、接続語を一部に含む接続語含有見出しからなる接続語含有見出し辞書とを記憶し、前記接続語検索手段は、前記記憶手段に記憶された接続語辞書と接続語含有見出し辞書とを参照して、接続語の検出と、検索した接続語の検索結果からの除外を行う、ことを特徴とする請求項3記載の辞書検索装置を提供する。
(6)請求項6に記載の発明では、見出しと対応する説明情報を有する辞書データから見出しを検索する辞書検索方法であって、文字入力を受け付ける入力ステップと、入力された文字列で、前記辞書データから見出しを検索する検索ステップと、入力ステップで入力された文字列に含まれる部分文字列で、前記辞書データの見出しと完全一致する見出しを検索する分割検索ステップと、前記検索ステップおよび前記分割検索ステップのうち少なくとも一方のステップによる検索結果を表示する表示ステップと、を備えることを特徴とする辞書検索方法を提供する。
(7)請求項7見出しと対応する説明情報を有する辞書データから見出しを検索する辞書検索プログラムであって、文字入力を受け付ける入力機能と、入力された文字列で、前記辞書データから見出しを検索する検索機能と、入力機能で入力された文字列に含まれる部分文字列で、前記辞書データの見出しと完全一致する見出しを検索する分割検索機能と、前記検索機能および前記分割検索機能のうち少なくとも一方の機能による検索結果を表示する表示機能と、をコンピュータに実行させることを特徴とする辞書検索プログラムを提供する。
【発明の効果】
【0008】
各請求項に記載した本発明によれば、分割検索手段が、入力手段から入力された文字列に含まれる部分文字列で、辞書データの見出しと完全一致する見出しを検索するため、入力した文字列全体が辞書データの見出しにない場合でも、使用者は文字列の一部が一致する見出しをすべて知ることが出来る。
また、請求項3から請求項5の発明によれば、部分文字列生成手段が、接続語検索手段により検索された接続語を除き、当該接続語位置で分割して部分文字列を生成するため、より適切な部分文字列による分割検索を行うことが可能となる。
【発明を実施するための最良の形態】
【0009】
以下、本発明の情報表示装置における好適な実施の形態について、図1から図11を参照して詳細に説明する。
なお、本実施形態では、情報表示装置の一例として、携帯型の電子辞書1を用いて説明する。
(1)実施形態の概要
本実施形態の電子辞書には、国語辞典や和英辞典、英和辞典をはじめ、種々の辞書データが内蔵されている。
いずれかの辞書モードにおいて、キーボードを介して検索対象となる見出し語に対応する文字列が入力されると、電子辞書のCPUは、入力された文字列キーとして、辞書データ内の見出し語の検索を実行する。
検索は完全一致検索と前方一致検索を行い、検索結果である見出し語を検索候補リストとして表示する。そして選択された見出し語に対応する解説情報を辞書データから読み出し、その解説情報のプレビュー画面を見出し語と共にメイン画面に表示する。
【0010】
ここで前方一致検索で入力文字列に対応する見出し語が見つからなかった場合、入力文字列を部分文字列に分割(入力文字列に含まれる見出し語を部分文字列として抽出)し、部分文字列で見出し語を検索し、検索候補リストとして見出し語を表示する。
このような検索処理を行うことで、入力された見出し語が辞書データ内に存在しない場合でも、入力文字列の一部に該当する見出し語に分割して検索結果を表示させることができる。
このような検索結果を表示することで、接続語を含む文字列が辞書データに存在するかどうか意識せずに入力し、使用者は単語の組み合わせとして文字列の意味を類推することが可能となる。
【0011】
(2)実施形態の詳細
図1は、電子辞書1の概略構成を示すブロック図である。
図1に示すように電子辞書1は、CPU(Central Processing Unit)11、入力部12、出力部13、ROM(Read Only Memory)14、RAM(Random Access Memory)15を備えている。
CPU11は、ROM14に記憶されている各種プログラムに従って、情報処理を行う中央演算処理装置である。本実施形態では、CPU11は、例えば、見出し語の検索処理、分割文字列の生成を含む検索部分指定処理、表示処理等の各種情報処理を行う。
入力部12は、電子辞書1に対して情報をデータとして与える入力装置から構成されて
いる。
【0012】
図2は、電子辞書1の外観を示した図である。
本実施形態では、入力部12は、図2に示すキーボード20によって構成されているが、マイクを用いた音声入力装置やマウスなどによって構成するようにしてもよい。
本実施形態において入力部12を構成するキーボード20は、図2に示すように、電子辞書1における電源の入/切を行う入/切キー21、電子辞書1の有する所定機能を選択するためのファンクションキー22、検索する見出し語などの文字情報を入力するための文字入力キー23、検索した候補を選択するための決定/訳キー24、カーソルを移動させるカーソルキー(十字キー)25、本実施形態の分割検索を実行するための分割検索実行キー26を備えている。分割検索実行キー26は後述するように、分割検索を自動的に実行する場合はなくてもよい。
【0013】
本実施形態では、カーソルキー25は、表示部13に表示された画面のスクロール(画面送り)手段としても機能する。
図1の説明に戻り、表示部13は、本実施形態では、図2に示す液晶のディスプレイ30によって構成されている。
本実施形態では、ディスプレイ30の画面が複数の領域に分割されることによって、メイン画面領域に表示された検索リスト中で選択された見出し語に関する情報が、プレビュー画面領域(サブ画面領域)に表示される。なお、メイン画面領域は、第1の領域として機能し、プレビュー画面領域は第2の領域として機能する。
【0014】
ディスプレイ30におけるプレビュー画面領域の表示の有無、画面の分割数、表示文字サイズ、メイン画面領域のなどの設定は、任意に行うことができるように構成されている。例えば、見出し候補の表示方法を図8のようにタブ形式で表示したり、図9のように一覧表示するように設定する事ができる。
【0015】
ROM14は、読み出し専用の記憶装置であって、CPU11を駆動するための基本的なプログラムや各種パラメータなどを格納している。
詳しくは、辞書本体データ、見出し一覧データ、表示制御プログラム、見出し語検索プログラム、接続語検索プログラム、検索部分指定プログラムなどが格納されている。
辞書本体データには、見出し語とその見出し語に対応する説明情報(解説や訳文など)とが記録されている。
【0016】
本実施形態では、辞書本体データ記憶部141に、国語辞典、漢字字典、英和辞典、英英辞典、和英辞典、カタカナ語辞典、百科事典、ことわざ辞典などの辞書のデータが格納されている。
見出し一覧データ記憶部142は、辞書本体データ記憶部141に記憶された辞書データに対応する見出しIDと検索用読み、及び見出しが記憶されている。
【0017】
本実施形態の見出し一覧データ記憶部142の構成例を図7に示す。
見出しID、見出し読み、見出しデータは従来の見出し一覧データにも含まれているが、本実施形態では、これらに加えて、接続語見出しIDと接続語含有見出しIDのデータを記憶している。
接続語見出しIDは、辞書に含まれる見出しで接続語として使われる見出しに対しIDを付与したものである。接続語とは具体的には「が」「を」「に」など、名詞や動詞を接続するために用いる言葉である。
接続語含有見出しIDとは、上述する接続語が見出しの一部分に含まれるが、それ自身は接続語としては機能しない見出しに対しIDを付与したものである。具体的には「が」を含む見出しとして、「てがみ」、「かがみ」、「がーる」などである。
接続語見出しID、及び接続語含有見出しIDは独立したテーブルを用いずに、それぞれに該当する見出しIDのみを記憶しているため、ROM14の使用容量を削減することができる。それぞれの利用方法は処理フローに沿って後述する。
【0018】
図1に戻り、表示制御プログラム記憶部145は検索結果などを出力部13に表示出力するための表示制御プログラムが記憶されている。
見出し検索プログラム記憶部146は、入力部12から使用者が文字列を入力した場合、この見出し語に対応する説明情報を、辞書本体データ記憶部141から検索する(探し出す)処理を行うプログラムが記憶されている。
【0019】
次に本実施形態の見出し検索処理を説明する。
見出し検索処理は、CPU11が見出し検索プログラム記憶部146に記憶されたプログラムを実行することで実現する。見出し検索処理の処理フローを図4に沿って説明する。
使用者が文字入力キー23を用いて文字入力を行うと(S401)、CPU11は、見出し検索プログラム記憶部146に記憶された見出し検索プログラムを実行し(S402)、S401で入力された文字列と見出し一覧データ記憶部142に記憶された見出し読みと比較して、完全一致する見出しがあるか判断する(S403)。
ここでは使用者が入力する文字列が仮名である場合を想定しているため、完全一致の判断に見出し読みを用いているが、英語やドイツ語などの場合は、入力文字列と見出しを直接比較して判断することも可能である。
【0020】
完全一致する見出しが見つかった場合(S403;Y)、CPU11は、完全一致した見出しとその周辺の見出しを検索結果として、表示制御プログラムを介してリスト表示する(S404)。
一方、完全一致する見出しがなかった場合(S403;N)、CPU11は、部分一致した見出しとその周辺の見出しを検索結果として、表示制御プログラムを介してリスト表示する(S405)。
【0021】
ここまでは従来技術の検索処理と同様であるが、本実施形態の検索処理において、CPU11は、引き続き分割検索を実行するか判断する(S406)。この判断はある条件により自動で行ってもよいし、使用者が分割検索実行キー26(図2参照)を押下したか否かにより判断してもよい。
自動で実行するための判断基準としては、S405で部分一致した文字列の長さに閾値を設け、使用者が入力した文字列のうち、部分一致しなかった文字列の長さが一定値に達したら実行するようにするなどが考えられる。
【0022】
分割検索は、S403で完全一致した見出しが見つかり、S404で完全一致した見出しを表示している場合であっても、S404の分割検索を実行してもよい。あらかじめ設定した状態により、必ず分割検索を実行するようにしてもよいし、使用者が分割検索実行キー26を押下したことで分割検索を実行してもよい。
画面の領域を分けて、S404の検索結果と共に、後述する分割検索の結果を並べて表示することで、その見出しを構成している言葉を知る事が出来るという効果もある。
【0023】
S406で分割検索を実行する場合、CPU11は、次に接続語検索プログラムをサブルーチンとして実行する(S407)。処理の流れの詳細は図5の説明で後述するが、接続語検索プログラムでは、入力された文字列に接続語が含まれるか判断し、接続語の除去を行う。
例えば、「きずがつく」という文字列が入力された場合は「が」が接続語であると判断して、接続語に代えて分割箇所識別子を挿入する。分割箇所識別子とは、「きずがつく」という文字列を「きず」と「つく」に分割して検索するための目印として機能するものである。
【0024】
次に、CPU11は、S407で挿入された分割箇所識別子があるかどうかを判断する(S408)。
分割箇所識別子が存在しない場合(S408;N)、CPU11は、S411に移行し、検索部分指定プログラムをサブルーチンとして実行する。
【0025】
一方、分割箇所識別子が存在する場合(S408;Y)、CPU11は、分割箇所識別子で文字列を分割して、分割後の文字列の各々と見出しが完全一致するか判断する(S409)。
分割後の文字列と見出しが完全一致しなかった場合(S409;N)、CPU11は、完全一致しなかった文字列を読み出し(S410)、検索部分指定プログラムをサブルーチンとして実行する(S411)。
【0026】
S411の検索部分指定プログラムの処理の流れの詳細は図6の説明で後述するが、検索部分指定プログラムでは、入力された文字列を分割した部分文字列と見出しを比較し、完全一致する見出しを検索する処理を行う。例えば「でんしじしょ」という文字列を分割した部分文字列のうち、「でんし」、「でん」、「で」、「ん」、「しじし」、「しじ」、「し」、「じしょ」、「じ」、「しょ」という各部分文字列と見出しが完全一致するという検索を行う。
【0027】
S411のサブルーチン(後述)で完全一致した見出しが見つかった場合、およびS409で分割後の文字列と見出しが完全一致した場合は、完全一致した見出しを検索結果とする。
そして表示制御プログラムが検索結果をディスプレイ30に表示する(S412)。以上が見出し検索処理の流れである。
【0028】
次に図5を用いて接続語検索処理のフローを説明する。接続語検索処理は、CPU11が接続語検索プログラム記憶部147に記憶されたプログラムを実行することで実現する。
接続語検索プログラムによりCPU11は、接続語見出しIDから、接続語候補一覧を読み出す(S501)。具体的にはROM14内の接続語見出しID記憶部143より、接続語見出しID、つまり接続語として用いられる見出しを読み出してRAM15上に確保した領域に保持しておく。
【0029】
次にCPU11は、接続語見出しIDの見出しと入力文字列を比較し(S502)、接続語と入力文字の一部分と完全一致するか判断する(S503)。これは入力文字の一部分に接続語が含まれるかどうかについての判断である。
【0030】
接続語と入力文字の一部分とが一致する場合(S503;Y)、入力文字列に接続語と同じ文字列が含まれているということなので、その文字列が本当に接続語かどうかを次のように判断する。
まずCPU11は、接続語含有見出しIDより、見出し候補一覧を読み出す(S504)。具体的にはROM14内の接続語含有見出しID記憶部144より、接続語含有見出しIDを読み出してRAM15上に確保した領域に保持しておく。接続語含有見出しとは接続語と同じ文字列を含むが、それ自身は接続語として機能しない見出しである。
【0031】
次にCPU11は、S504で読み出した接続語含有見出しの中で、S503で完全一致した接続語を含む接続語含有見出しを検索する(S505)。
CPU11は、S505で検索された接続語含有見出しが入力文字の一部分と完全一致するか判断し(S506)、完全一致する場合は、その文字列は表記は一致するが実際には見出し語中に含まれる文字であって接続語ではないと判定し、接続語の検索結果から除外する。
そして、CPU11は、入力文字列のうち見出しと一致した部分文字列の前後に分割箇所識別子を挿入する(S507)。
【0032】
一方、完全一致しない場合(S506N;)は、S503で検索された検索語は本当の接続語とみなし、接続語と一致した文字にの代わりに分割箇所識別子を挿入する(S508)。
以上で接続語検索処理を終了する。
なお、接続語が複数含まれている場合は、すべての候補に対して検索するため、このフローを繰り返して実行する。
【0033】
次に図6を用いて検索部分指定処理のフローを説明する。検索部分指定処理は、CPU11が検索部分指定プログラム記憶部148に記憶されたプログラムを実行することで実現する。
検索部分指定プログラムによりCPU11は、入力文字列の末尾の1文字を無視したもの(末尾の1文字を除いた文字列)を入力文字列とする(S601)。
そしてCPU11は、入力文字列がNULL(空)か判断し(S602)、文字列が残っている(NULLではない)場合は見出しと完全一致しているか判断する(S603)。
【0034】
ここで完全一致した場合(S603;Y)CPU11は、完全一致した見出しを検索結果としてRAM15上に確保した領域に保存し、分割箇所識別子を完全一致した文字列の末尾に挿入し(S604)、S601へ戻る。S603で見出しと完全一致しない場合はそのままS601へ戻る。
【0035】
S602で検索文字列がNULL(空)の場合(S602;Y)CPU11は、新規の(未判断の)分割箇所識別子があるか否かを判断する(S605)。新規の分割箇所識別子とは、この検索部分指定プログラムで分割箇所識別子が挿入されたことを意味する。
CPU11は、新規の識別子が挿入されていなければ(S605;N)、処理を終了する。
【0036】
新規の識別子が挿入されている場合CPU11は、最後に挿入された分割箇所識別子以降の、つまり検索文字列中でもっとも前方の分割箇所識別子以降の文字列を新たに検索文字列とする(S606)。その後S602へ戻り、処理を繰り返すことで、分割可能なパターン全ての文字列の検索を行う。
【0037】
次に具体的な検索例について、図5〜図7のフローと図8〜図11の表示画面例を用いて説明する。
まず、「でんしじしょ」という見出しが辞書に存在しない場合、S401で使用者が「でんしじしょ」と入力する場合を考える。
S403では完全一致する見出しが存在しないので、S405で従来例と同様、図8(a)のように前方一致で「でんじしゃく」が検索される。S406で分割検索を実行するとS407で接続語検索プログラムが実行される。
【0038】
接続語検索プログラムでは、「でんしじしょ」には接続語が含まれないため、S503で完全一致する接続語がないので、接続語検索プログラムを終了する。
接続語検索プログラムでは分割箇所識別子が挿入されなかったので、S408ではNoになり、S411に進み、検索部分指定プログラムを実行する。
【0039】
検索部分指定プログラムでは、入力文字列「でんしじしょ」の後方から一文字ずつ削除して行き、見出しと一致した順に分割箇所識別子を挿入していく。S601で末尾の1文字を削除すると検索文字列は「でんしじし」となり、S602で検索文字列はNULLではないので、S603で完全一致する見出しを検索する。
「でんしじし」は見出しとして存在しないので、Noになり、S601に戻り、さらに末尾の一文字を削除すると検索文字列は「でんしじ」となるが、これもS603で完全一致する見出しはないので、S601に戻り末尾の一文字を削除して「でんし」となる。
S603で完全一致する見出しが見つかるのでYesになりS604に行き、入力文字列の「でんし」と「じしょ」の間に分割箇所識別子を挿入する。さらに繰り返し、「でん」と「しじしょ」の間と、「で」と「んしじしょ」の間に分割箇所識別子を挿入する。
【0040】
検索文字列が「で」の時に末尾の一文字を削除すると検索文字列がNULLとなるので、S605に進み、新規の分割箇所識別子があるので、S606で最後に挿入された分割箇所識別子より後方の入力文字列「んしじしょ」を新たに検索文字列とする。
同様に「んしじしょ」では見出しと完全一致しないので、「んしじし」、「んしじ」、「んし」、「ん」と削除して行き、「ん」で見出しと完全一致するので、「ん」と「しじしょ」の間に分割箇所識別子を挿入する。
【0041】
検索文字列が「ん」の時に末尾の一文字を削除すると検索文字列がNULLとなるので、S605に進み、新規の分割箇所識別子があるので、S606で最後に挿入された分割箇所識別子より後方の入力文字列「しじしょ」を新たに検索文字列とする。
ここでは「しじしょ」が見出しにないとすると、「しじし」、「しじ」、「し」と末尾から削除して行き、「しじし」、「しじ」、「し」が見出しと完全一致するので検索結果として一時保存する。
【0042】
次の検索文字列は「じしょ」となり、「じし」「じ」と末尾から削除して行き、「じ」が見出しと完全一致するので検索結果として保存される。
次の検索文字列は「しょ」となり、「し」と末尾から削除して行き、「し」が見出しと完全一致するので検索結果として保存される。
次の検索文字列は「ょ」となるが、見出しと完全一致しないので、ここで検索部分指定プログラムを終了する。
【0043】
検索部分指定プログラムで検索結果として一時保存された「でんし」、「でん」、「で」、「ん」、「しじし」、「しじ」、「し」、「じしょ」、「じ」、「しょ」に該当する見出しを表示制御プログラムで表示する。
【0044】
図8(b)および(c)は本実施形態における検索処理結果を表示する場合の表示例である。
805は使用者が入力した文字列を表示する。806は抽出された見出し文字列それぞれに対応する見出し語をタブで分類して、807はそれぞれのタブ内に候補リストを表示している。808はプレビュー領域である。
カーソルキー25を操作することによりタブが切り替わり、別の文字列に対応する見出し候補を見る事ができる。図8(c)は右カーソルキーを1回押下した場合の表示例であり、810で「じしょ」のタブが反転表示され、811の候補リストには「じしょ」に該当する見出し候補が表示される。
【0045】
図9は検索処理結果を表示する場合、タブ表示を用いない場合の表示例である。従来の見出しリストと同様に、一つの画面で順番に候補を表示している。
図8、図9では、検索された見出しをすべて表示しているが、図10のように、あらかじめ分割検索で見出しと完全一致した部分文字列をリスト表示し、使用者が選択した箇所で分割した場合に該当する見出しのみを表示するようにしてもよい。
【0046】
もう一つの入力例として「きずがつく」という見出しが辞書にない場合、S401で使用者が「きずがつく」と入力する場合を考える。S403では完全一致する見出しがないので、S405で、図11(a)のように前方一致で「キスカ島」が検索される。S406で分割検索を実行するとS407で接続語検索プログラムが実行される。
【0047】
接続語検索プログラムでは、S501で接続語見出しIDとして「が」読み出され、S502で「が」と「きずがつく」を比較すると、S503「きずがつく」の「が」が接続語に完全一致する。S504では「が」を含む接続語含有見出しIDが読み出されるが、S506で「きずがつく」との一部と完全一致する接続語含有見出しがないので、S508で「が」に代えて分割箇所識別子を挿入し、接続語検索プログラムを終了する。
【0048】
接続語検索プログラムでは分割箇所識別子が挿入されたので、S408ではYesになり、S409に進むと、分割箇所識別子で分割した文字列「きず」と「つく」に関して、それぞれ完全一致する見出しがあるか検索する。「きず」と「つく」両方に完全一致する見出しが見つかり、S412に進み、「きず」と「つく」に該当する見出しを検索結果として表示する。
【0049】
図11は接続語を含む文字列「きずがつく」と入力した場合の表示例である。図11(a)は通常の検索結果であり、前方一致検索により「キスカ島」という見出しが検索されている。図11(b)は本発明の検索方法で接続語「が」を省略して「きず」及び「つく」に分割して検索された画面の表示例である。図8と同様に、タブに分けて検索結果を表示している。また、入力フィールド1101で「きずがつく」と表示しているが、本発明の接続語検索プログラムで不要な接続語を除去すると、1104の様に「きず」と「つく」の間の接続語「が」が「/」に置き換えて表示される。
【0050】
以上、図面を参照してこの発明の一実施形態について詳しく説明してきたが、具体的な構成は上述のものに限られることはなく、この発明の要旨を逸脱しない範囲内において様々な設計変更等をすることが可能である。
本実施形態では日本語の見出し語について分割して検索を行う例を説明したが、日本語以外でも適応可能である。特に二つの単語をつなぎ合わせて1単語とする場合が多く存在するドイツ語の検索処理にも有効である。例えばドイツ語でtaktfrequenzという単語は、taktとfrequenzという二つの単語を繋ぎ合わせた単語であるが、本実施形態によればtaktfrequenzという見出しがない場合に、taktfrequenzと入力した場合でもtaktとfrequenzという二つの単語の意味を同時に調べる事が可能となる。
【0051】
上述した実施形態において、CPU11による各ステップを実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、また、CPU11における処理部の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより、符号化処理、及び復号化処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものであってもよい。また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、フラッシュメモリ等の書き込み可能な不揮発性メモリ、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。
【0052】
さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(例えばDRAM(Dynamic Random Access Memory))のように、一定時間プログラムを保持しているものも含むものとする。また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
【図面の簡単な説明】
【0053】
【図1】本実施形態の電子辞書の概略構成を示すブロック図である。
【図2】本実施形態の電子辞書の外観構成を示した図である。
【図3】従来の電子辞書における検索画面の表示例である。
【図4】本実施形態の電子辞書における検索処理の流れを示すフローチャートである。
【図5】本実施形態の電子辞書における接続語検索処理の流れを示すフローチャートである。
【図6】本実施形態の電子辞書における検索部分指定処理の流れを示すフローチャートである。
【図7】本実施形態の電子辞書における見出し一覧データの構成例である。
【図8】本実施形態の電子辞書における検索画面の表示例である。
【図9】本実施形態の電子辞書における検索画面の別の表示例である。
【図10】本実施形態の電子辞書における検索画面の表示例である。
【図11】本実施形態の電子辞書における検索画面の表示例である。
【符号の説明】
【0054】
1 電子辞書
11 CPU
12 入力部
13 出力部
14 ROM
141 辞書本体データ記憶部
142 見出し一覧データ記憶部
143 接続語見出しID記憶部
144 接続語含有見出しID記憶部
145 表示制御プログラム記憶部
146 見出し検索プログラム記憶部
147 接続語検索プログラム記憶部
148 検索部分指定プログラム記憶部
15 RAM
20 キーボード
21 入/切キー
22 ファンクションキー
23 文字入力キー
24 決定/訳キー
25 カーソルキー
26 分割検索実行キー
30 ディスプレイ
【特許請求の範囲】
【請求項1】
文字入力を受け付ける入力手段と、
見出しと、各見出しに対応する説明情報を有する辞書データを記憶した記憶手段と、
前記入力手段から入力された文字列で、前記記憶手段に記憶された前記辞書データの見出しを検索する検索手段と、
前記入力手段から入力された文字列に含まれる部分文字列で、前記記憶手段に記憶された前記辞書データの見出しと完全一致する見出しを検索する分割検索手段と、
前記検索手段および前記分割検索手段のうち少なくとも一方の検索結果を表示する表示手段と、
を備えることを特徴とする辞書検索装置。
【請求項2】
前記分割検索手段は、前記検索手段で見出しが検索されなかったときに、検索することを特徴とする請求項1記載の辞書検索装置。
【請求項3】
前記入力手段から入力された文字列から接続語を検索する接続語検索手段と、
前記接続語検索手段により検索された接続語を除き、当該接続語位置で分割して部分文字列を生成する部分文字列生成手段を備え、
前記分割検索手段は、前記部分文字列生成手段で生成された部分文字列で、検索を行う、ことを特徴とする請求項1記載の辞書検索装置。
【請求項4】
前記接続語検索手段は、検索した接続語のうち、当該接続語を含有する見出しが、前記入力手段から入力された文字列に存在する場合、当該接続語を検索結果から除外する、
ことを特徴とする請求項3記載の辞書検索装置。
【請求項5】
前記記憶手段は、更に、接続語からなる接続語辞書と、接続語を一部に含む接続語含有見出しからなる接続語含有見出し辞書とを記憶し、
前記接続語検索手段は、前記記憶手段に記憶された接続語辞書と接続語含有見出し辞書とを参照して、接続語の検出と、検索した接続語の検索結果からの除外を行う、ことを特徴とする請求項3記載の辞書検索装置。
【請求項6】
見出しと対応する説明情報を有する辞書データから見出しを検索する辞書検索方法であって、
文字入力を受け付ける入力ステップと、
入力された文字列で、前記辞書データから見出しを検索する検索ステップと、
入力ステップで入力された文字列に含まれる部分文字列で、前記辞書データの見出しと完全一致する見出しを検索する分割検索ステップと、
前記検索ステップおよび前記分割検索ステップのうち少なくとも一方のステップによる検索結果を表示する表示ステップと、
を備えることを特徴とする辞書検索方法。
【請求項7】
見出しと対応する説明情報を有する辞書データから見出しを検索する辞書検索プログラムであって、
文字入力を受け付ける入力機能と、
入力された文字列で、前記辞書データから見出しを検索する検索機能と、
入力機能で入力された文字列に含まれる部分文字列で、前記辞書データの見出しと完全一致する見出しを検索する分割検索機能と、
前記検索機能および前記分割検索機能のうち少なくとも一方の機能による検索結果を表示する表示機能と、
をコンピュータに実行させることを特徴とする辞書検索プログラム。
【請求項1】
文字入力を受け付ける入力手段と、
見出しと、各見出しに対応する説明情報を有する辞書データを記憶した記憶手段と、
前記入力手段から入力された文字列で、前記記憶手段に記憶された前記辞書データの見出しを検索する検索手段と、
前記入力手段から入力された文字列に含まれる部分文字列で、前記記憶手段に記憶された前記辞書データの見出しと完全一致する見出しを検索する分割検索手段と、
前記検索手段および前記分割検索手段のうち少なくとも一方の検索結果を表示する表示手段と、
を備えることを特徴とする辞書検索装置。
【請求項2】
前記分割検索手段は、前記検索手段で見出しが検索されなかったときに、検索することを特徴とする請求項1記載の辞書検索装置。
【請求項3】
前記入力手段から入力された文字列から接続語を検索する接続語検索手段と、
前記接続語検索手段により検索された接続語を除き、当該接続語位置で分割して部分文字列を生成する部分文字列生成手段を備え、
前記分割検索手段は、前記部分文字列生成手段で生成された部分文字列で、検索を行う、ことを特徴とする請求項1記載の辞書検索装置。
【請求項4】
前記接続語検索手段は、検索した接続語のうち、当該接続語を含有する見出しが、前記入力手段から入力された文字列に存在する場合、当該接続語を検索結果から除外する、
ことを特徴とする請求項3記載の辞書検索装置。
【請求項5】
前記記憶手段は、更に、接続語からなる接続語辞書と、接続語を一部に含む接続語含有見出しからなる接続語含有見出し辞書とを記憶し、
前記接続語検索手段は、前記記憶手段に記憶された接続語辞書と接続語含有見出し辞書とを参照して、接続語の検出と、検索した接続語の検索結果からの除外を行う、ことを特徴とする請求項3記載の辞書検索装置。
【請求項6】
見出しと対応する説明情報を有する辞書データから見出しを検索する辞書検索方法であって、
文字入力を受け付ける入力ステップと、
入力された文字列で、前記辞書データから見出しを検索する検索ステップと、
入力ステップで入力された文字列に含まれる部分文字列で、前記辞書データの見出しと完全一致する見出しを検索する分割検索ステップと、
前記検索ステップおよび前記分割検索ステップのうち少なくとも一方のステップによる検索結果を表示する表示ステップと、
を備えることを特徴とする辞書検索方法。
【請求項7】
見出しと対応する説明情報を有する辞書データから見出しを検索する辞書検索プログラムであって、
文字入力を受け付ける入力機能と、
入力された文字列で、前記辞書データから見出しを検索する検索機能と、
入力機能で入力された文字列に含まれる部分文字列で、前記辞書データの見出しと完全一致する見出しを検索する分割検索機能と、
前記検索機能および前記分割検索機能のうち少なくとも一方の機能による検索結果を表示する表示機能と、
をコンピュータに実行させることを特徴とする辞書検索プログラム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【公開番号】特開2010−122721(P2010−122721A)
【公開日】平成22年6月3日(2010.6.3)
【国際特許分類】
【出願番号】特願2008−293180(P2008−293180)
【出願日】平成20年11月17日(2008.11.17)
【出願人】(000002325)セイコーインスツル株式会社 (3,629)
【Fターム(参考)】
【公開日】平成22年6月3日(2010.6.3)
【国際特許分類】
【出願日】平成20年11月17日(2008.11.17)
【出願人】(000002325)セイコーインスツル株式会社 (3,629)
【Fターム(参考)】
[ Back to top ]