説明

仮名漢字変換装置

【発明の詳細な説明】
〔産業上の利用分野〕
本発明は、日本語文章を入力する為に入力された仮名文字列を、仮名漢字混じり文章に変換する仮名漢字変換装置に関する。
〔従来の技術〕
従来の仮名漢字変換装置においては、分ち書き不定語・単文節不定語・平仮名化文節・片仮名化文節に対して、平仮名不定句・片仮名不定句の両者を発生させず、さらにその候補へ選択し確定したとしても、その不定句の不定自立語を単語辞書に登録していなかった。本明細書では、不定語とは、仮名漢字変換のための解析では、辞書に登録してある単語が見いだせなかった部分で単語と見なした文字列を言い、不定句とは、この不定語に付属語を加えた文節を言う。
〔発明が解決しようとする課題〕
従来技術によれば、平仮名不定句・片仮名不定句の両者を発生および、その登録を行わないため、辞書にない片仮名の外来語や口語の平仮名表現を入力のつど片仮名変換・平仮名変換して入力するしかなく不便であった。
分ち書き不定語を例にとれば「タップ」という文字列が辞書にないとき、「たっぷをふむ。」と入力すると「たっ」「ぷ」「を」は辞書にないため「たっぷを」が不定語になる。この場合従来技術では文節長変更して「たっぷ」を片仮名変換するしかなく、さらにこれが自動的に登録されないため、入力・変換の都度同様の事を行うか、単語辞書に「タップ」を登録するか以外に方法はなかった。
また単文節不定語の場合は、「ペンタゴン」という文字列が辞書にないとき、「ペンタゴンでかくにんする。」と入力すると「ペン他言で確認する。」といった文節分ち書きされる。この場合、従来技術では文節長変換して「ぺんたごん」片仮名変換し「で」を平仮名変換するしかなく、さらにこれが自動的に登録されないため、入力・変換の集同様の事を行うか、単語辞書に「ペンタゴン」を登録するか以外に方法はなかった。
本発明は、上記問題点を解決し、不定語を自動的に登録する装置を提供することを目的とする。
[課題を解決するための手段]
これらの問題を解決するため、本発明は次の構成を採った。即ち、本発明の仮名漢字変換装置は、 入力された仮名文字列を仮名漢字混じり文に変換する仮名漢字変換装置であって、 自立語と付属語に関する情報を、少なくともその読みと共に記憶した仮名漢字変換辞書と、 入力した仮名文字列を該仮名漢字変換辞書を参照して解析し、該仮名文字列を、辞書に記憶された単語もしくは不定語を含む文節の組合せとして構成する分かち書き手段と、 該分かち書き手段により前記仮名文字列を構成するとされた文節の一つの長さを変更する文節長変更手段と、 該文節長が変更された部分に対応する仮名文字列について、前記仮名漢字変換辞書を参照して解析し、該辞書に登録された単語の組合せに構成できない場合には、該仮名文字列全体をひらがなとした文字列からなる文節候補と、該仮名文字列全体をカタカナとした文字列からなる文節候補と、該仮名文字列全体をその末尾に存在する付属語以外をカタカナとした文字列からなる文節候補とを生成する生成手段と、 前記文節長が変更された部分が、前記生成手段により発生された文節候補のまま確定された場合には、前記生成手段が生成した前記3種の文節候補のうちの確定された一つの文節候補について、 その確定された文節候補が、仮名文字列全体を、ひらがな文字列またはカタカナ文字列とした文節候補である場合には、該ひらがな文字列またはカタカナ文字列を自立語として、 その確定された文節候補が、仮名文字列全体を、その末尾に存在する付属語以外をカタカナ文字列とした文節候補である場合には、付属語に相当する部分を除いたカタカナ文字列を自立語として、 前記仮名漢字変換辞書の一部に登録する登録手段とを備えたことを要旨とする。
[作用]
本発明の仮名漢字変換装置は、仮名漢字変換辞書を参照して、入力した仮名文字列を解析し、辞書に記憶された単語もしくは不定語を含む文節の組合せとして構成する。こうした文節の一つについてその文節長が変更されたとき、文節長が変更された部分に対応する仮名文字列について、仮名漢字変換辞書を参照して解析する。この解析により、仮名漢字変換辞書に登録された単語の組合せに構成できない場合には、該仮名文字列全体をひらがなとした文字列からなる文節候補と、該仮名文字列全体をカタカナとした文字列からなる文節候補と、該仮名文字列全体をその末尾に存在する付属語と該付属語以外をカタカナとした文字列とからなる文節候補とを生成する。文節長が変更された部分が確定されたとき、これらの文節候補のうち、少なくとも該確定された文節候補の各文字列は、仮名漢字変換辞書の一部に登録される。
[実施例]
以下、本発明の一実施例としての仮名漢字変換装置について説明する。第1図は、実施例としての仮名漢字変換装置の概略構成を示すブロック図である。
第1図は、本発明の仮名漢字変換装置を示す図である。図中符号1は入力部2より入力されたデータに基づきシステム全体の制御を行う中央処理装置(CPU)である。このCPUにより総ての装置の制御がおこなわれる。
入力部2で入力された仮名文字列は、仮名漢字変換装置8に送られ仮名漢字変換が行われ、文節候補を文節候補表示部3により表示しながら、文節候補選択部4により文節単位に文節候補を表示選択し、文節単位に文節長変更部により文節長を変更し、必要ならばかな指定部7により文節単位に片仮名・平仮名のどちらかに変更し、文節候補確定部5により所望の文節候補を確定する。
仮名漢字変換部8内では、仮名文字獲得部9により仮名文字が受け取られ、文節分ち書き部10において単語辞書11を検索し、単語結合検討部14により単語間の連接の可否を検定しながら文節分ち書き処理がなされるが、この際不定語文字列が存在したならば、不定句発生部13により不定句を文節候補として発生せしめ、文節候補を文節候補格納部16に格納する。
文節候補が格納されたならば、文節候補出力部15により文節候補が文節単位に出力され、前記選択・変更・確定処理がなされる。
また、ここで文節長変更部6で文節長変更がなされたならば文節再解析部12により当該文節の再解析がなされ、この際単文節候補がない場合は不定句発生部13により不定句が発生され、残りは文節分ち書き部10により文節分ち書き処理がなされる。
さらにかな指定部7で平仮名・片仮名の指定がなされた場合は文節再解析部12において、平仮名指定の場合は平仮名候補を片仮名候補より優先度を高くし、片仮名指定の場合はその逆として不定句発生部13により不定句を発生する。
文節候補確定部5により確定された文節候補は、確定文節情報受取部17により受け取られ、単語学習部18において、自立語情報と付属語情報に分解され自立語情報を単語辞書11に学習させる。(学習方式には、最新に使用した単語を同音異字語の先頭に記憶する様順序を変える手段と、使用頻度を1プラスする方法とがある。)この時、不定句は片仮名あるいは平仮名の単語として現実に存在するものが考えられるため、不定句の自立語部分は単語辞書11に新たに登録されることになり、2回目からの変換では単語として処理され、所望の仮名漢字変換が行われることになる。
例えば「ぺんたごんでかくにんする。」は1度目は「ペン他言で確認する。」と変換されるが、「ぺんたごんで」を1文節とするよう文節長変更・再解析し「ペンタゴンで」という文節候補で確定すると、次に同様な入力を行った場合、「ペンタゴンで確認する。」と所望の仮名漢字文字列に変換できる。
第2図は、本発明の仮名漢字変換装置の動作を説明するフローチャートである。
前記した通り、本発明の仮名漢字変換装置は〈201〉で仮名文字列を受け取り文節分ち書き処理が成される。ここで〈202〉で文節が形成できず分ち書き不定語が作成されたか検定され、不定語があれば〈203〉で不定句を文節候補として、作成し文節候補を出力する。
次に文節分ち書き表示された文章に対し,〈204〉で文節単位に同音異字語を選択するか、〈205〉で修正する文節を変更するか、〈206〉でかな変換するか、〈207〉でカナ変換するか〈208〉で文節長変更する。
〈206〉のかな変換と〈207〉のカナ変換では〈209〉で不定句を発生し、これを候補とする。〈208〉の文節長変更では、当該文節は単文節として解析され単文節不定語があるならば〈209〉で不定句を発生し、当該文節より後ろの文節は再度分ち書き処理がなされ、文節が形成できず分ち書き不定語が作成された場合も〈209〉で不定句を発生する。
〈211〉で確定処理かなされなければ〈204〉〈205〉〈206〉〈207〉〈208〉の処理を連続して行い、確定したならば〈212〉により通常の単語学習ならびに不定句の自立語の登録がなされる。
〔発明の効果〕
本発明は、次のような効果がある。
(1)外来語や副詞の様な片仮名単語が増加するもので単語辞書に登録されていないものが文節単位で、付属語付きで生成され、簡単に得られる。
(2)外来語や副詞の様な片仮名単語が増加するもので単語辞書に登録されていないものに対し、単語登録を意識せず自動的に登録されるため操作者の操作を軽減する。
(3)不定句を自立語の部分と付属語の部分にわけて自立語のみを登録するため、不定句全体を登録するよりも辞書領域を圧迫せず、汎用性も高い。
(4)不定句で確定したものに対してのみ登録するため辞書への圧迫を軽減できる。
以上説明したように、本発明の仮名漢字変換装置によれば、文節長を変更しなければならないような不定語が存在した場合に、仮名漢字変換の文節候補を容易に生成できるだけでなく、その文節候補のうち、該当する部分を全てひらがなとした文字列、カタカナとした文字列、末尾に存在する付属語以外をカタカナとした文字列うち、確定された一つの文節候補が、全体をひらがな文字列またはカタカナ文字列とした場合にはこの文字列全体を、末尾に存在する付属語以外をカタカナ文字列とした場合には付属語に相当する部分を除いたカタカナ文字列を、自立語として、仮名漢字変換辞書の一部に登録するから、次の変換時にこの語を、容易に変換することができる。
【図面の簡単な説明】
第1図は、本発明の一実施例の仮名漢字変換装置の概略構成を示すブロック図である。
第2図は、本発明の一実施例の仮名漢字変換装置の動作を示すフローチャートである。
13……不定句発生部

【特許請求の範囲】
【請求項1】入力された仮名文字列を仮名漢字混じり文に変換する仮名漢字変換装置であって、自立語と付属語に関する情報を、少なくともその読みと共に記憶した仮名漢字変換辞書と、入力した仮名文字列を該仮名漢字変換辞書を参照して解析し、該仮名文字列を、辞書に記憶された単語もしくは不定語を含む文節の組合せとして構成する分かち書き手段と、該分かち書き手段により前記仮名文字列を構成するとされた文節の一つの長さを変更する文節長変更手段と、該文節長が変更された部分に対応する仮名文字列について、前記仮名漢字変換辞書を参照して解析し、該辞書に登録された単語の組合せに構成できない場合には、該仮名文字列全体をひらがなとした文字列からなる文節候補と、該仮名文字列全体をカタカナとした文字列からなる文節候補と、該仮名文字列全体をその末尾に存在する付属語以外をカタカナとした文字列からなる文節候補とを生成する生成手段と、前記文節長が変更された部分が、前記生成手段により発生された文節候補のまま確定された場合には、前記生成手段が生成した前記3種の文節候補のうちの確定された一つの文節候補について、その確定された文節候補が、仮名文字列全体を、ひらがな文字列またはカタカナ文字列とした文節候補である場合には、該ひらがな文字列またはカタカナ文字列を自立語として、その確定された文節候補が、仮名文字列全体を、その末尾に存在する付属語以外をカタカナ文字列とした文節候補である場合には、付属語に相当する部分を除いたカタカナ文字列を自立語として、前記仮名漢字変換辞書の一部に登録する登録手段とを備えた仮名漢字変換装置。

【第1図】
image rotate


【第2図】
image rotate


【特許番号】特許第3220133号(P3220133)
【登録日】平成13年8月10日(2001.8.10)
【発行日】平成13年10月22日(2001.10.22)
【国際特許分類】
【出願番号】特願昭63−30261
【出願日】昭和63年2月12日(1988.2.12)
【公開番号】特開平1−205371
【公開日】平成1年8月17日(1989.8.17)
【審査請求日】平成7年2月13日(1995.2.13)
【審判番号】平11−4517
【審判請求日】平成11年3月25日(1999.3.25)
【出願人】(999999999)セイコーエプソン株式会社
【合議体】
【参考文献】
【文献】特開 昭61−240363(JP,A)
【文献】特開 昭61−147366(JP,A)
【文献】特開 昭62−130458(JP,A)
【文献】特開 昭62−145463(JP,A)
【文献】特開 昭62−82458(JP,A)
【文献】特開 昭61−120276(JP,A)