説明

日本語入力装置

【課題】漢字変換候補の字形を知らなくても所望の漢字変換候補を迅速に選択することが可能な日本語入力装置を提供する。
【解決手段】音韻列データを作成する入力手段と、複数の見出語データ、該複数の見出語データに対応した複数の漢字変換候補データ、該複数の漢字変換候補データに対応した複数の意味情報データ、を格納してなる辞書部と、入力手段が作成した音韻列データに対応する見出語データを、辞書部の複数の見出語データから抽出し、該抽出された見出語データに対応した漢字変換候補データを辞書部の複数の漢字変換候補データから抽出し、更に、該抽出された漢字変換候補データに対応する意味情報データを抽出する抽出手段と、抽出手段が抽出した漢字変換候補データに対し選択/非選択の情報を付与した漢字選択データ、意味情報データに対し選択/非選択の情報を付与した意味選択データ、を作成する選択手段と、を有することを特徴とする。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は日本語入力装置に関する。
【背景技術】
【0002】
従来の日本語入力プログラムは、かな情報を入力するとそのかな情報に対応する漢字変換候補の字形が出力され、ユーザーはその字形に基づいて所望の変換候補を選択する。
【0003】
従来技術としてマイクロソフト社のIME2000という日本語入力システムがある。このシステムでは、入力されたかな情報に対応する漢字変換候補と、漢字変換候補の意味内容が説明語として出力され、それらの情報に基づいてユーザーは所望の変換候補を選択することができる。
【0004】
一方で、詳細読みという日本語入力システムもあり、この日本語入力システムでは、入力されたかな情報に対応する漢字変換候補の漢字の一文字が別の単語の漢字で置き換えて出力され、それらの情報に基づいてユーザーは所望の漢字変換候補を選択することができる。なお詳細読みについては、下記非特許文献1に記載がある。
【特許文献1】渡辺哲也、渡辺文治ら、“視覚障害者用スクリーンリーダの詳細読みに関する検討−漢字書き取り調査−”、ヒューマンインタフェースシンポジウム2003、pp697−700
【発明の開示】
【発明が解決しようとする課題】
【0005】
上記詳細読みという日本語入力システムでは、漢字変換候補の字形が分かれば容易に所望の漢字変換候補を選択することができる。しかしながら、詳細読みという日本語入力システムでは、漢字変換候補と説明語の漢字の字形を知っていないと、適切な漢字を選択することができないという問題がある。
【0006】
また、上記IME2000という日本語入力システムでは、漢字の字形を知らなくても所望の変換候補を選択することができる。しかしながら、この日本語入力システムでは説明語は複数用意されておりしかもそれらが一度に出力されることで漢字変換候補の説明語が長くなってしまう場合があり、漢字変換候補を選択するのに時間がかかるという問題がある。
【0007】
本発明は、以上の問題点を鑑み、漢字変換候補の字形を知らなくても所望の漢字変換候補を迅速に選択することが可能な日本語入力装置に関する。
【課題を解決するための手段】
【0008】
上記目的を達成するために本発明は、音韻列データを作成する入力手段と、複数の見出語データ、この複数の見出語データに対応した複数の漢字変換候補データ、この複数の漢字変換候補データに対応した複数の意味情報データ、を格納してなる辞書部と、入力手段が作成した音韻列データに対応する見出語データを、辞書部の前記複数の見出語データから抽出し、抽出された見出語データに対応した漢字変換候補データを辞書部の複数の漢字変換候補データから抽出し、更に、抽出された漢字変換候補データに対応する意味情報データを、辞書部の複数の意味情報データから抽出する抽出手段と、抽出手段が抽出した漢字変換候補データに対し選択/非選択の情報を付与した漢字選択データ、意味情報データに対し選択/非選択の情報を付与した意味選択データ、を作成する選択手段と、を有することを特徴とする。
【0009】
またこの場合において選択手段は、入力デバイスを介して入力される指示データに基づいて前記漢字変換候補データを作成することも望ましく、また、選択手段は、入力デバイスを介して入力される指示データに基づいて前記意味情報データを作成することも望ましい。
【0010】
またこの場合において、選択手段が作成する漢字選択データは一度に一の漢字変換候補データのみを選択とすることも望ましく、また、選択手段が作成する意味選択データは一度に一の意味情報データのみを選択とすることも望ましい。このようにすることで一度に多数の漢字変換候補、意味候補を表示させることがなくなり、ユーザーの負担が軽減されるとともに作業の迅速化を図ることができるようになる。
【0011】
またこの場合において意味情報データは、類義語、反義語、上位概念語、説明文、用例、関係する外国語、関係する画像、のうちの少なくともいずれかであることも望ましい。
【0012】
またこの場合において、入力手段は、音声入力装置から入力される入力音声データに基づいて前記音韻列データを作成することも望ましい。
【発明の効果】
【0013】
以上により、漢字変換候補の字形を知らなくても所望の漢字変換候補を迅速に選択することが可能な日本語入力プログラム及び日本語入力装置を提供することができる。
【発明を実施するための最良の形態】
【0014】
以下、本発明の実施の形態について、図面を用いて説明する。
【0015】
(実施形態)
図1は、本実施形態の日本語入力装置の機能ブロック図である。
【0016】
図1に記載の日本語入力装置1は、入力手段101、辞書部102、抽出手段103、選択手段104、出力手段105、を少なくとも有して構成されている。なお日本語入力装置1には表示部106が接続されており、出力手段105からのデータ送信を受けて情報をモニターなどの表示装置に表示する。
【0017】
入力手段101は、ユーザーから入力された入力データに基づき音韻列データを作成するものである。なお本明細書にいう「入力データ」とは、日本語入力装置外部から入力される信号データをいい、例えばユーザーがキーボード等の入力デバイスを用いて入力を行った場合にそのキーボード等の入力デバイスから送られてくる信号データをいう。また、「音韻列データ」とは、入力された信号データに基づいて作成されたかな列のデータをいう。
【0018】
辞書部102は、複数の見出語データ、複数の漢字変換候補データ、複数の意味情報データを有して構成されている。ここで「見出語データ」とは、上述の音韻列データと照合するために必要なかな列のデータをいい、「漢字変換候補データ」とは、所定の見出語データに対応した漢字の字形に関するデータをいい、「意味情報データ」とは、所定の漢字変換候補データに対応した意味のデータをいう。なお「漢字変換候補データに対応した意味」の例としては限定されるわけではないが例えば、類義語、反義語、上位概念語、説明文、用例、関係する外国語、関係する画像が該当する。また、漢字変換候補データは一つの見出語データに対して少なくとも一以上対応付けられており、意味情報データについても一つの漢字変換候補データに対して少なくとも一以上対応付けられている。また限定されるわけではないが具体的な例として、見出語データが「かんかく」のかな列を現すデータの場合、「間隔」、「感覚」などの漢字の字形に対応するデータがそれぞれ漢字変換候補データとしてあげられ、更に「感覚」には説明文として「物事を感じとらえること」という意味情報のデータが、「間隔」には説明文として「物と物との距離」という意味情報のデータがそれぞれの意味情報データとして該当する。
【0019】
抽出手段103は、上述の辞書部102に格納された複数の見出語データから、入力された音韻列データに対応する見出語データを抽出する手段である。また抽出手段103は更に、その抽出した見出語データに対応する意味情報データ及び漢字変換候補データを辞書部102から抽出する。
【0020】
選択手段104は、漢字変換候補データ、意味情報データ、ユーザーが操作する入力デバイスからの指示データに基づいて漢字選択データ及び意味選択データを作成し、出力手段105へ送信する。なおここで「漢字選択データ」とは、抽出手段103により抽出された漢字変換候補データに選択/非選択の情報が付与したデータであり、選択の情報が付与された漢字変換候補データは出力手段105によって表示部106に表示され選択対象となる。また「意味選択データ」とは、抽出手段103により抽出された意味情報データに選択/非選択の情報が付与したデータであり、選択の情報が付与された意味情報データは出力手段105によって表示部106に表示され選択対象となる。
【0021】
ユーザーは、表示部106に表示された漢字変換候補データ、意味情報データに基づいて所望の漢字を選択する。より具体的には、ユーザーは表示部106に表示される漢字候補、それに対応する意味情報を参照し、その漢字候補が所望の漢字候補である場合等はその漢字候補を選択し、漢字候補に対応する意味情報を参照してもその漢字候補が正しいか否か判断できない場合、他の意味情報を参照したい場合等において他の意味情報を選択する。なおこの選択は入力デバイスを介したユーザーの操作により指示データとして選択手段104へと入力される。
【0022】
出力手段105は、上記選択手段104の漢字選択データ、意味選択データに基づき表示部106に表示を行うための手段であり、図2は本実施形態に係る日本語入力装置の処理の結果、表示部に表示される情報の状態の例を示すものである。
【0023】
図2(A)は漢字変換候補として漢字Aが表示され、その類義語として類義語a1が表示された例であり、図2(B)は漢字変換候補として漢字Aが表示され、その類義語として類義語a2が表示された例であり、図2(C)は漢字変換候補として漢字Bが表示され、その類義語として類義語b1が表示された例をそれぞれ示す。なおここで「類義語」とは、当該漢字変換候補と同一又は類似の意味を持つ語をいい、ユーザーはこの類義語を基にして漢字変換候補を選択することができるようになる。このような意味情報を用いることで漢字の字形を知らない場合であっても適切な漢字を選択することができるようになる。
【0024】
図2で示す例においては、選択対象となる漢字及び類義語は一つずつ表示されており(図2中太字部分)、他の抽出された漢字変換候補、類義語は非表示となっている。ユーザーは、この選択対象となる漢字及び類義語を参照して、この漢字を選択する、他の漢字を選択の対象とする、又は他の類義語を表示させる、の少なくともいずれかを行うことができる。例えば図2(A)の例のように漢字A及び類義語a1が表示されているがユーザーが類義語a1を参照しても漢字Aが所望の漢字であるか否か判別できない場合、ユーザーは入力デバイスを用いて他の類義語を表示させるための操作を行い、他の類義語a2を表示させることができる(図2(B))。そして類義語a2を参照した結果、その漢字Aが所望の漢字でないと判断した場合、他の漢字Bを表示させるための操作を行い、他の漢字B及びその漢字Bに対応した類義語の一つ(類義語b1)を表示させることができる(図2(C))。ユーザーは、漢字B、類義語b1を参照し、この漢字Bがユーザーの所望した漢字であればユーザーはこの漢字の選択を行い、漢字変換候補を変換対象として確定させる。ユーザーのこの選択による操作は入力デバイスを通じて上述の指示データとなり、選択手段104に入力され、選択手段104は漢字選択データ及び意味選択データを作成する。
【0025】
なおここでは意味情報データとして類義語を用いた例を示しているが、反義語であっても良く、また上位概念語、説明文、用例、関係する外国語、関係する画像、又はこれらの組み合わせであってもよい。
【0026】
以上、本実施形態の日本語入力装置では、漢字変換候補データとその漢字変換候補データに対応した意味情報データを別々に格納し、しかも選択対象となる漢字変換候補、意味情報を表示部において別々に一つずつ表示させることで制御することにより、複数の漢字変換候補を一度に出力してしまうことを防止することができ、所望の漢字変換候補を迅速に選択することが可能となる。
【0027】
なお本実施形態において入力手段101、抽出手段103、選択手段104、出力手段105等はハードディスク等の記録媒体に格納され、上記手段が機能するように組まれたプログラムなどで実現可能であり、辞書部102は、例えば複数の見出語データ、複数の漢字変換候補データ、複数の意味情報データをハードディスク等の記録媒体に格納しておくことにより実現できる。もちろん他の構成を採用することも可能である。
【0028】
(入力デバイス例1)
入力デバイスとしては種々採用できるが、ここでは入力デバイスとして、音声入力装置2を用いた場合を説明する。それ以外は以下で述べるものを除き、上述した構成とほぼ同じである。
【0029】
図3は本実施例に係る音声入力装置2を示す図であり、図4はこの音声入力装置2を用いた場合に加えられる入力手段101の機能ブロック図である。
【0030】
図3に係る音声入力装置2はスピーカー201と、マイクロフォン202と、マイクロフォンを固定する顎部固定部材203と、これらを頭部に固定する頭部固定部材204と、を有して構成されており、マイクロフォン202は顎部固定部材によりユーザーの口元近傍に固定されている。またこの音声入力装置2は日本語入力装置の入力手段101に接続されており、ユーザーの発する音声を音韻列データに変換して抽出手段103に出力する。
【0031】
図4における入力手段101は、特徴抽出手段1011、音声認識手段1012、音響モデル部1013、単語辞書部1014、を有して構成されている。
【0032】
特徴抽出手段1011は、音声入力装置2のマイクロフォン202に対する発声などにより入力された入力音声のデータから音声の特徴を表すデータ(以下「音声特徴データ」という)を抽出する。なお限定されるわけではないが音声特徴データの具体例としては、入力音声の強度を短い時間間隔ごとに取得し、フーリエ変換等の周波数変換を行うことで各周波数帯域に対する入力音声の強度の音声特徴データ(パワースペクトル)とすることが挙げられる。
【0033】
音響モデル部1013には音響モデルデータが格納されている。「音響モデルデータ」とは、特徴抽出手部1011が抽出する音声特徴データとかなとの関係を定めたデータであって、音声特徴データが分かればそれに対応するかな(かなデータ)を抽出することができる。

【0034】
単語辞書部1014には複数の単語データが格納されている。「単語データ」は、複数の連続するかな列のデータであって、連続するかなを単語としてまとめて処理することができるよう設けられるものである。
【0035】
音声認識手段1012は、入力される音声特徴データに基づいて音響モデル部1013に格納された音響モデルデータを参照し、入力された音声特徴データに対応するかなデータを抽出する。そして同様の処理を入力された音声特徴データの数とほぼ同じ数だけ複数のかなデータを抽出して並べた後、このかなデータの列に対応する単語データを単語辞書部1014から抽出する。そして、単語辞書部1014から単語データを抽出した後、必要に応じて単語データを組み合わせて音韻列データとして抽出手段103へと出力する。
【0036】
以上により本実施例では入力音声から音韻列データを作成することができる。
なお、ここにおいて音声入力装置は、「鹿野清宏、伊藤克亘ら“音声認識システム”オーム社、pp93〜110」に記載されている構成を採用することができる。
【0037】
また特に、本実施例では漢字変換候補データとそれに対応する意味情報データとをそれぞれ関連付けて表示することが可能となっているため、音声入力装置2の利便性をより高めることができる。すなわち図2で示すように、本日本語入力装置は、一部の漢字変換候補に関連する意味情報をまず非表示としておき、選択対象となる漢字変換候補及びその意味情報を順次表示させることが可能となるため、漢字変換候補、意味情報の選択若しくは非選択を行うことで足り、音声入力装置の利便性をより高めることができる。
【0038】
なお、入力デバイスの他のものとして、例えば指点字入力装置3を用いることもできる(図5参照)。指点字入力装置の例としては種々のものを採用することができるが、例えば「福田慧人、西田昌史ら、“指点字を利用した盲聾者用エディタの開発”、電子情報通信学会技術研究報告、WIT2004−32、pp25−30」に記載のものが好適である。本日本語入力装置も上記のとおり、複数の漢字変換候補各々に対し、更には複数の意味情報各々に対しその採否を決定することができるため、より入力デバイスの利便性を向上させることができる。なお、その他入力装置としては、「浅野史郎編著“障害者の可能性を広げるコンピュータ”中央法規出版、pp170−180」に記載の点字キーボード、特開平7−311545号公報に記載の手話通訳装置があげられる。
【図面の簡単な説明】
【0039】
【図1】日本語入力装置の機能ブロック図
【図2】表示部における表示の例を示す図
【図3】音声入力装置の概略を示す図。
【図4】入力手段の機能ブロック図
【図5】指点字入力装置の概略を示す図。
【符号の説明】
【0040】
1…日本語入力装置、101…入力手段、102…辞書部、103…抽出手段、104…選択手段、105…出力手段、2…音声入力装置、201…スピーカー、202…マイクロフォン、203…顎部固定部材、204…頭部固定部材、3…指点字入力装置

【特許請求の範囲】
【請求項1】
音韻列データを作成する入力手段と、
複数の見出語データ、該複数の見出語データに対応した複数の漢字変換候補データ、該複数の漢字変換候補データに対応した複数の意味情報データ、を格納してなる辞書部と、
前記入力手段が作成した前記音韻列データに対応する見出語データを、前記辞書部の前記複数の見出語データから抽出し、該抽出された見出語データに対応した前記漢字変換候補データを前記辞書部の前記複数の漢字変換候補データから抽出し、更に、該抽出された漢字変換候補データに対応する意味情報データを、前記辞書部の前記複数の意味情報データから抽出する抽出手段と、
前記抽出手段が抽出した漢字変換候補データに対し選択/非選択の情報を付与した漢字選択データ、意味情報データに対し選択/非選択の情報を付与した意味選択データ、を作成する選択手段と、を有することを特徴とする日本語入力装置。
【請求項2】
前記選択手段は、入力デバイスを介して入力される指示データに基づいて前記漢字変換候補データを作成することを特徴とする請求項1記載の日本語入力装置。
【請求項3】
前記選択手段は、入力デバイスを介して入力される指示データに基づいて前記意味情報データを作成することを特徴とする請求項1記載の日本語入力装置。
【請求項4】
前記選択手段が作成する漢字選択データは一度に一の漢字変換候補データのみ選択することを特徴とする請求項1記載の日本語入力装置。
【請求項5】
前記選択手段が作成する意味選択データは一度に一の意味情報データのみを選択とすることを特徴とする請求項1記載の日本語入力装置。
【請求項6】
前記意味情報データは、類義語、反義語、上位概念語、説明文、用例、関係する外国語、関係する画像、のうちの少なくともいずれかである請求項1記載の日本語入力装置。
【請求項7】
前記入力手段は、音声入力装置から入力される入力音声データに基づいて前記音韻列データを作成することを特徴とする請求項1記載の日本語入力装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate


【公開番号】特開2006−302149(P2006−302149A)
【公開日】平成18年11月2日(2006.11.2)
【国際特許分類】
【出願番号】特願2005−125764(P2005−125764)
【出願日】平成17年4月22日(2005.4.22)
【出願人】(304021831)国立大学法人 千葉大学 (601)
【Fターム(参考)】