説明

文字列変換装置及び文字列変換方法

【課題】現在の位置情報を加味して文字列の予測変換を行うことが可能となり、従来の文字列変換装置及び文字列変換方法に比べて、より利用者の満足度が高く、効率の良い文字列の変換を行う移動体端末の文字列変換装置及び方法を提供する。
【解決手段】入力された読みに対して文字列の予測変換を行う、移動体端末の文字列変換装置で100であって、前記文字列の変換候補を格納する辞書データベース群130と、読みが入力されたとき、少なくとも該読み及び予め取得した前記移動体端末10の位置情報をキーとして、前記辞書データベース群130から前記文字列の変換候補を取得することで、文字列の予測変換を行う予測変換手段110とを備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、携帯電話やノートパソコン等の移動体端末の日本語入力システムにおいて用いられ、予測変換機能により、文字列の変換候補を表示する文字列変換装置に関する。
【背景技術】
【0002】
近年、移動体通信に用いられる端末には、種々の機能を有する文字列変換装置が組み込まれている。その機能の1つとして、入力者によって入力された読みに対して、予測した文字列の変換候補を表示する予測変換機能が挙げられる。
【0003】
日本語を入力する場合、基本的には、読み方に対応した文字(以下、「読み」という。)を入力し、変換するというプロセスが必須となる。例えば、「あらかわ」と入力した後、変換することにより、「荒川」「新川」「阿良川」といった変換候補が提示され、ユーザは所望の漢字(文字列)を選択し確定する。これを基本とした日本語入力システムにおいて、例えば非特許文献1に開示されているような予測変換手法が提案されている。この方法を用いれば、より少ない操作で変換候補を検索することが可能となることから、現在、一般的な文字列予測変換機能として、ほとんどの日本語入力システムに搭載されている。
【0004】
ここで、文字列の予測変換の方法としては、辞書内から、入力された読みと、前方一致する単語を抽出し、一致度、一般度又は過去の変換履歴等の情報に基づいてソートし提示するのが一般的である。
【0005】
前記一致度とは、変換候補の文字列に対して含まれる、実際に入力した読みに対応する部分の割合である。例えば、「あら」という読みに対する「荒」と「荒川」という文字列については、「荒」の一致度が100%、「荒川」の一致度が50%となる。
前記一般度とは、その変換候補の文字列がどの程度利用されるかという度合である。例えば、「きのう」に対して「昨日」と「帰納」とでは、前者の一般度が高いといえる。
前記過去の変換履歴とは、変換された頻度及びどれだけ直近に変換されたかという2つの要素からなる。つまり、利用頻度が高く、かつ最近に変換された文字列が上位に推薦されることになる。
【0006】
さらに、近年のATOKなどのような、商用の日本語変換システムにおいては、助詞や助動詞、文脈に基づいて、より適切と思われる単語を推薦するエンジンを搭載している。
【先行技術文献】
【非特許文献】
【0007】
【非特許文献1】Masui T、「POBox: An Efficient Text Input Method for Handheld and Ubiquitous Computers」、Lecture Notes in Computer Science、Vol.1707/1999、p289-300、Springer Berlin / Heidelberg、1999年
【発明の概要】
【発明が解決しようとする課題】
【0008】
しかしながら、上述した文字列の予測変換方法では、一般的な単語で利用頻度が高いあるいは最近使った単語が上位に示される傾向が強いため、例えば以下のような場合には、十分に予測効果を発揮することができないという問題がある。
●初めて行った場所で、乗り換え案内アプリケーションを使用する場合、初めて入力する(使用履歴がない)変わった名前の(一般度が低い)駅名は、文字列の変換候補として表示されない。
●カタカナや英語と漢字が混じった名称などを入力すると、一般度が低く、利用頻度が低い場合には変換候補が表示されない(例:キャナルシティ博多)。
●久しぶりに訪れた地名を入力する場合、使用履歴に残っておらず初期状態と同じ状態であるため、一般度や一致度が高くなければ変換候補が表示されない。
【0009】
そこで、本発明の目的は、現在の位置情報を加味して文字列の予測変換を行うことができる、移動体端末の文字列変換装置及び文字列変換方法を提供することにある。
【課題を解決するための手段】
【0010】
本発明は、入力された読みに対して、文字列の予測変換を行う移動体端末の文字列変換装置及び文字列変換装置について、予め端末にGPSセンサー等を内蔵させて、自身の位置を定期的に測定、把握することで位置情報(位置座標等)を取得し、取得した位置情報に基づいて、文字列の変換候補を格納する辞書データベース群から前記文字列の変換候補を取得して、文字列の予測変換を行うことで、従来の文字列の一般度や利用頻度に加えて、位置情報にも基づいた形で文字列の変換候補を提供できる結果、上述の(A)〜(C)の課題を解決することが可能となる。
【0011】
そして、本発明の要旨は以下の通りである。
(1)入力された読みに対して文字列の予測変換を行う、移動体端末の文字列変換装置であって、
前記文字列の変換候補を格納する辞書データベース群と、
読みが入力されたとき、少なくとも該読み及び予め取得した前記移動体端末の位置情報をキーとして、前記辞書データベース群から前記文字列の変換候補を取得することで、文字列の予測変換を行う予測変換手段とを備えることを特徴とする移動体端末の文字列変換装置。
【0012】
(2)前記辞書データベース群から取得した前記変換候補を出力する出力手段をさらに備えることを特徴とする上記(1)に記載の移動体端末の文字列変換装置。
【0013】
(3)前記予測変換手段は、前記変換候補を、最終利用日、利用頻度、及び最終利用位置に基づいてソートすることを特徴とする上記(1)に記載の移動体端末の文字列変換装置。
【0014】
(4)前記変換候補のソートは、前記最終利用位置が近い順番にソートするNU(Nearest Used)方式を含んだ方法によって行われることを特徴とする上記(3)に記載の移動体端末の文字列変換装置。
【0015】
(5)前記辞書データベース群は、前記読みに対応した文字列を格納するための基本辞書データベースと、過去の位置情報及び文字列変換の履歴を格納するための学習データベースとを有することを特徴とする上記(1)に記載の移動体端末の文字列変換装置。
【0016】
(6)入力された読みに対して文字列の予測変換を行う、移動体端末の文字列変換方法であって、
予め前記移動体端末の位置情報を取得するステップと、読みが入力されたとき、少なくとも該読み及び予め取得した前記移動体端末の位置情報をキーとして、辞書データベース群から前記文字列の変換候補を取得することで、文字列の予測変換を行うステップとを含むことを特徴とする移動体端末の文字列変換方法。
【0017】
(7)前記文字列の予測変換ステップの後、前記辞書データベース群から取得した前記変換候補を出力するステップをさらに含むことを特徴とする上記(6)に記載の移動体端末の文字列変換方法。
【0018】
(8)前記文字列の予測変換ステップは、最終利用日、利用頻度、及び最終利用位置に基づいてソートされるステップを含むことを特徴とする上記(6)に記載の移動体端末の文字列変換方法。
【0019】
(9)前記変換候補のソートは、前記最終利用位置が近い順番にソートされるNU(Nearest Used)方式を含んだ方法によって行われることを特徴とする上記(8)に記載の移動体端末の文字列変換方法。
【0020】
(10)前記辞書データベース群は、前記読みに対応した文字列を格納するための基本辞書データベースと、過去の位置情報及び文字列変換の履歴を格納するための学習データベースとを有することを特徴とする上記(6)に記載の移動体端末の文字列変換方法。
【発明の効果】
【0021】
本発明によれば、現在の位置情報を加味して文字列の予測変換を行うことが可能となり、従来の文字列変換装置及び文字列変換方法に比べて、より利用者の満足度が高く、効率の良い文字列の変換を行うことができる。
【0022】
具体的には、例えば以下のような効果を奏することができる。
●駅の近くにいる場合には、駅名が優先して変換される。
●「し」という読み入力に対して、「渋谷」、「新橋」、「汐留」といった変換候補の表示順序が、ユーザの現在位置に応じて適宜変更する。つまり、渋谷の近くにいる場合や、「渋谷」への変換が優先され、新橋の近くにいる場合には、「新橋」への変換が優先されることとなる。
●「か」という読み入力に対して、いつも車を止めている駐車場などでは、「帰る」という変換候補が優先して表示され、職場では、「課長」という変換候補が優先して表示される
●特殊な単語の頻度が高い場合であっても、その単語を入力している場所から移動すると、文字列の変換時、その特殊な単語が優先的に表示されて通常の変換を阻害するということがない。
●久しぶりに訪れた場所であっても、以前に変換した文字列が重要単語として優先的に推薦される。
●カタカナや漢字が交じった長い文字列も、場所と関連付けて適切な変換候補が提示される。
【図面の簡単な説明】
【0023】
【図1】本発明による移動体端末が位置情報を取得する際の状況を説明するための概略図である。
【図2】本発明による文字列変換装置の一実施例についての構成を示す図である。
【図3】本発明による文字列変換装置を用いて、一例として「し」で始まる読みを入力したときの変換候補を示した図である。
【図4】本発明による予測変換の一例についてのフローを示した図である。
【図5】各種のアルゴリズムによって変換候補をソートした状態を示す図であり、(a)がMRU方式、(b)がMFU方式、(c)がNU方式によるソートである。
【図6】NU方式によるアルゴリズムを説明するための図である。
【発明を実施するための形態】
【0024】
以下、本発明の構成と限定理由について、図面を用いて説明する。
【0025】
図1は、本発明による移動体端末が位置情報を取得する際の状況を説明するための概略図を示したものである。また、図2は、本発明による文字列変換装置の一実施例についての構成を示したものである。
【0026】
本発明にかかる文字列変換装置は、図1に示すように、入力された読みに対して文字列の予測変換を行う、移動体端末の文字列変換装置で100であって、前記文字列の変換候補を格納する辞書データベース群130と、読みが入力されたとき、少なくとも該読み及び予め取得した前記移動体端末10の位置情報をキーとして、前記辞書データベース群130から前記文字列の変換候補を取得することで、文字列の予測変換を行う予測変換手段110とを備える。上記構成を備えることによって、現在の位置情報を加味して文字列の予測変換を行うことが可能となり、従来の文字列変換装置及び文字列変換方法に比べて、より利用者の満足度が高く、効率の良い文字列の変換を行うことができる。
【0027】
ここで、前記文字列の予測変換とは、文字入力支援機能の1つであり、「ユーザがこれから入力する」と思われる文字列を予測し、変換候補として出力・表示することで、より少ないキータッチで読みを入力させることを可能にする機能のことである。
【0028】
(装置構成)
以下に、本発明にかかる文字列変換装置100の各構成要素について説明する。
本発明にかかる移動体端末の文字列変換装置100は、図2に示すように、予測変換手段110と、インタフェース部120と、辞書データベース群130と、出力手段140とを備える。
本発明にかかる文字列変換装置100は、定期的若しくは位置の変更がある度に、前記移動体端末10がGPS20から得られた現在の位置情報21を取得する。そして、入力者30が読みを入力した際、入力された読み31は、インタフェース部122を通じて入力情報122として予測変換手段110へと送られる。その後、予測変換手段110は、取得した位置情報21及び入力情報122からなるデータ111、112をキーとして、複数のデータベース131、132からなるデータベース群130へ渡し、渡されたキーとなるデータ111、112を元に、前記データベース群130は変換候補の情報114を抽出し、抽出した情報114を前記予測変換手段110へと送る。前記予測変換手段110が受けとった文字変換候補114は、出力手段140を通じて入力者30へ表示141される。
【0029】
本発明に用いられる移動体端末10とは、移動体通信を行うことができる端末のことであり、例えば、携帯電話や、携帯情報端末(PDA)、ノートパソコン等が挙げられる。
上記移動体端末10はGPSセンサーを搭載し、図1に示すように、GPS(Global Positioning System)20によって、その位置情報を定期的に又は常時更新する。
【0030】
前記位置情報は、図1に示すように、GPS(Global Positioning System)20によって得られた前記移動体端末10の現在位置の情報である。ただし、正確な位置を定期的又は移動する度に取得できる方法であれば、GPS以外の方法によって位置情報を取得しても構わない。ここで、前記位置情報とは、位置座標のことをいう。さらに、前記位置座標は、一定期間、前記移動体端末10の記憶部(図示せず)に記録されるが、位置情報の整理の観点から、座標の桁数でクラスタリングされることが好ましい。例えば、北緯35度41分13秒27東経139度46分29秒59の場合、秒以下1桁であれば3m四方、秒以下2桁であれば30cm四方という具合にクラスタリングが可能である。
【0031】
また、読みの入力31については、前記移動体端末10で指定されている方法によって任意に入力すればよく、特に限定はされない。例えば、携帯電話ではプッシュボタンによって読みの入力を行うことができ、ノートパソコンでは、所定のキーボードを用いて読みの入力を行うことができる。さらに、手書き入力機能がある場合には、手書きによる入力でもよく、音声入力機能がある場合には、音声による入力であっても構わない。
【0032】
本発明にかかる文字列変換装置100の前記データベース群130については、図2に示すように、基本辞書データベース131を有する。該基本辞書データベース131は、読みの他、前記読みに対応した、漢字やカタカナ、英語等で表記された文字列が格納されおり、前記予測変換手段110から送られた前記位置情報21及び入力情報からなるデータ111を受けて、変換候補の文字列を抽出し、抽出した変換候補を、その他のデータベースから抽出された情報(最終変換日、頻度、最終利用位置など)と組み合わせ、前記文字列の変換候補として前記予測変換手段110へと送る。
【0033】
また、前記データベース群130は、図2に示すように、学習データベース132を有することが好ましい。ここで、学習データベース132とは、前記変換候補がユーザ(入力者30)に提示された後、ユーザの選択により確定した文字列やそのときの位置情報を利用履歴113としてフィードバックし、過去の位置情報及び文字列変換の履歴が格納されたデータベースのことである。その格納された情報(位置情報及び文字列変換の履歴)に基づいて、前記基本辞書データベースとともに前記文字列の変換候補114を作成し、前記予測変換手段110へと送る機能を有する。ユーザによる利用履歴を次回の文字列変換に生かせるように、装置100に学習機能を持たせることができるため、装置100を使用するに従って、より適した文字列の変換候補の推薦が可能となる。
【0034】
ここで、図3は、本発明にかかる文字列変換装置100を用いて、一例として「し」で始まる読みを入力したとき、前記辞書データベース群130から抽出され、前記予測変換手段110へと送られた変換候補のレコードを示したものである。従来の変換候補は、「読み」とそれに対応する「文字列」、「最終変換日」及び「頻度」から構成される。それに対して、本発明にかかる変換装置100によって抽出された変換は、位置情報に基づいて作成された「最終利用位置」という列が新たに追加されていることがわかる。この最終利用位置は、GPSセンサー等から得られた位置座標そのものを保持する。「最終変換日」については、図3のように具体的な日付や時間を保持する方式もあれば、追加された順に追記して行く方式も考えられる。頻度に関しては、正規化する方式や上限値を設ける方式なども考えられる。
なお、代表的な地名や、ランドマーク名などについては、予め該当する座標を初期座標として、「最終利用位置」に登録しておくことが好ましい。前記学習DBに利用履歴が格納されていない初期段階において、位置情報に基づく文字列の変換を行うことができるようにするためである。
【0035】
本発明にかかる文字列変換装置100の予測変換手段110は、前記置情報21及び前記読み31の入力情報122を取得し、前記辞書データベース群130へと送る。そして、前記辞書データベース群130から送られてきた変換候補114を、必要に応じて加工し、出力手段140を通じて、入力者30へ表示する。
【0036】
また、前記変換候補については、最終変換日、利用頻度、及び最終利用位置に基づいてソートされることが好ましい。前記変換候補が、位置情報(最終利用位置)を含んだ形で適切にソートされることで、より利用者の満足度が高く、効率の良い文字列の変換を行うことができる。
前記変換候補のソートについては、例えば、前記予測変換手段110が前記辞書データベース群130から変換候補のデータを受け取った後、前記予測変換手段110によってソートを行うことができる。ただし、前記辞書データベース群130によって予め変換候補をソートして前記予測変換手段110へとデータを送ることも可能である。また、前記変換候補のソートは、最終変換日、利用頻度、及び最終利用位置に加えて、その他の情報(例えば、文字列の一般度や、現在位置との関連度など)もソートの基準として用いることができる。
【0037】
また、前記変換候補のソートについては、種々のアルゴリズムを用いて行うことができる。ここで、図5(a)〜(c)は、各種アルゴリズムによって、「し」で始まる読みを入力した際に抽出された幾つかの変換候補をソートしたときの状態を示したものである。
例えば、MRU(Most Recently Used)方式のアルゴリズムを用いた場合(図5(a))、最終利用日が新しい順、つまり、「新天町」→「新橋」→「新宿」・・・という順番にソートされる。また、MFU(Most Frequently Used)方式を用いた場合(図5(b))、利用頻度(変換された頻度)が多い順、つまり、「渋谷」→「新天町」→「新橋」・・・という順番にソートされる。そして、本発明では、NU(Nearest Used)方式(図5(c))を提案し、最終利用位置が最も現在地に近い順、つまり、「新橋」→「新宿」→「渋谷」・・・という順番にソートされることが好ましい。そして、前記変換候補のソートについては、NU方式と、MRU方式及びMFU方式とを組み合わせたアルゴリズムを使用することがより好ましい。例えば、利用頻度の優先度を最も高くして、利用頻度が同じ場合に、最終利用位置によって前記変換候補のソートを行うことができる。
【0038】
なお、前記NU(Nearest Used)方式のアルゴリズムについてさらに詳細に説明する。図6は、NU方式によるアルゴリズムを説明するための図であるが、アルゴリズム(A)は、最長一致法を示したものである。最長一致法とは、現在位置の座標と各文字列の最終利用位置について上位ビットから比較し、一致長が長いものを上位とするアルゴリズムである。アルゴリズム(B)は、実際の座標間の距離を計算し、距離の近いものほど上位とするアルゴリズムである。座標間距離の導出については、国土地理院に掲載されている正確な計算式を用いて算出することも可能であるが、計算量・計算速度の観点から、三平方の定理による単純計算によって座標間位置を算出してもよい。
【0039】
(文字列変換方法)
次に、本発明にかかる文字列変換方法について、図面を用いて説明する。図4は、本発明による移動体端末の文字列変換方法の一実施例について、「し」という読みを入力した場合の文字列の予測変換ステップのフローを示したものである。
【0040】
本発明にかかる文字列変換方法は、入力された読みに対して文字列の予測変換を行う、移動体端末の文字列変換方法であって、図4に示すように、予め前記移動体端末の位置情報を取得するステップと(図示せず)、読みが入力(位置座標:36.422,134.723)されたとき(図4(a))、少なくとも該読み及び予め取得した前記移動体端末の位置情報をキーとして、辞書データベース群130から前記文字列の変換候補を取得する(図4(b))ことで、文字列の予測変換を行うステップとを含む。上記構成を備えることによって、現在の位置情報を加味して文字列の予測変換を行うことが可能となり、従来の文字列変換装置及び文字列変換方法に比べて、より利用者の満足度が高く、効率の良い文字列の変換を行うことができる。
【0041】
また、本発明にかかる文字列変換方法は、図4に示すように、前記辞書データベース群130から得られた前記変換候補を、前記位置情報、利用頻度又は最終利用日に基づいてソートするステップ(図4(c))と、ソートされた変換候補を入力者へと出力するステップ(図4(d))とをさらに含むことが好ましい。
【0042】
上述したところは、この発明の実施形態の一例を示したにすぎず、請求の範囲において種々の変更を加えることができる。
【産業上の利用可能性】
【0043】
本発明によれば、現在の位置情報を加味して文字列の予測変換を行うことが可能となり、従来の文字列変換装置及び文字列変換方法に比べて、より利用者の満足度が高く、効率の良い文字列の変換を行うことができる。
【符号の説明】
【0044】
10 移動体端末
20 GPS
21 位置情報
30 入力者
31 読み
100 文字列変換装置
110 予測変換手段
111、112 データ
113 利用履歴
114 文字列の変換候補
120 インタフェース部
130 辞書データベース群
131 基本辞書データベース
132 学習データベース
140 出力手段
141 変換候補の表示

【特許請求の範囲】
【請求項1】
入力された読みに対して文字列の予測変換を行う、移動体端末の文字列変換装置であって、
前記文字列の変換候補を格納する辞書データベース群と、
読みが入力されたとき、少なくとも該読み及び予め取得した前記移動体端末の位置情報をキーとして、前記辞書データベース群から前記文字列の変換候補を取得することで、文字列の予測変換を行う予測変換手段とを備えることを特徴とする移動体端末の文字列変換装置。
【請求項2】
前記辞書データベース群から取得した前記変換候補を出力する出力手段をさらに備えることを特徴とする請求項1に記載の移動体端末の文字列変換装置。
【請求項3】
前記予測変換手段は、前記変換候補を、最終利用日、利用頻度、及び最終利用位置に基づいてソートすることを特徴とする請求項1に記載の移動体端末の文字列変換装置。
【請求項4】
前記変換候補のソートは、前記最終利用位置が近い順番にソートするNU(Nearest Used)方式を含んだ方法によって行われることを特徴とする請求項3に記載の移動体端末の文字列変換装置。
【請求項5】
前記辞書データベース群は、前記読みに対応した文字列を格納するための基本辞書データベースと、過去の位置情報及び文字列変換の履歴を格納するための学習データベースとを有することを特徴とする請求項1に記載の移動体端末の文字列変換装置。
【請求項6】
入力された読みに対して文字列の予測変換を行う、移動体端末の文字列変換方法であって、
予め前記移動体端末の位置情報を取得するステップと、読みが入力されたとき、少なくとも該読み及び予め取得した前記移動体端末の位置情報をキーとして、辞書データベース群から前記文字列の変換候補を取得することで、文字列の予測変換を行うステップとを含むことを特徴とする移動体端末の文字列変換方法。
【請求項7】
前記文字列の予測変換ステップの後、前記辞書データベース群から取得した前記変換候補を出力するステップをさらに含むことを特徴とする請求項6に記載の移動体端末の文字列変換方法。
【請求項8】
前記文字列の予測変換ステップは、最終利用日、利用頻度、及び最終利用位置に基づいてソートされるステップを含むことを特徴とする請求項6に記載の移動体端末の文字列変換方法。
【請求項9】
前記変換候補のソートは、前記最終利用位置が近い順番にソートされるNU(Nearest Used)方式を含んだ方法によって行われることを特徴とする請求項8に記載の移動体端末の文字列変換方法。
【請求項10】
前記辞書データベース群は、前記読みに対応した文字列を格納するための基本辞書データベースと、過去の位置情報及び文字列変換の履歴を格納するための学習データベースとを有することを特徴とする請求項6に記載の移動体端末の文字列変換方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2012−63895(P2012−63895A)
【公開日】平成24年3月29日(2012.3.29)
【国際特許分類】
【出願番号】特願2010−206334(P2010−206334)
【出願日】平成22年9月15日(2010.9.15)
【出願人】(000004226)日本電信電話株式会社 (13,992)
【出願人】(504145342)国立大学法人九州大学 (960)
【Fターム(参考)】