中国語入力装置
【課題】キー入力されたピンインの誤り箇所を学習して正しいピンインに修正する中国語入力装置を提供する。
【解決手段】中国語のピンインが登録された言語辞書(40)と、キー入力されたピンインに対応した言語候補を言語辞書から探索する言語候補探索部(702)と、誤りやすいピンインの正誤関係が登録された誤りパターン辞書(50)と、キー入力された熟語のピンインが言語辞書に未登録であると、当該熟語のピンインを誤りピンインと判定する言語判定部(603)と、熟語の誤りピンインを漢字単位に分解し、各漢字のピンインと誤りやすい正しいピンイン候補を前記誤りパターン辞書から探索する誤りパターン探索部(704)と、探索された正しいピンイン候補を一覧表示して選択させる学習支援部(801)と、選択されたピンイン候補に基づいて誤りピンインを修正する入力修正部(802)とを具備した。
【解決手段】中国語のピンインが登録された言語辞書(40)と、キー入力されたピンインに対応した言語候補を言語辞書から探索する言語候補探索部(702)と、誤りやすいピンインの正誤関係が登録された誤りパターン辞書(50)と、キー入力された熟語のピンインが言語辞書に未登録であると、当該熟語のピンインを誤りピンインと判定する言語判定部(603)と、熟語の誤りピンインを漢字単位に分解し、各漢字のピンインと誤りやすい正しいピンイン候補を前記誤りパターン辞書から探索する誤りパターン探索部(704)と、探索された正しいピンイン候補を一覧表示して選択させる学習支援部(801)と、選択されたピンイン候補に基づいて誤りピンインを修正する入力修正部(802)とを具備した。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、中国語入力装置に係り、特に、音節と声調との組み合わせ(ピンイン)の正しさを学習しながら中国語を入力できる中国語入力装置に関する。
【背景技術】
【0002】
企業の進出先や貿易対象国として中国が話題になることが多くなり、中国語を話す必要性が高くなっている。それと同時に、日本の大学や企業では、第二外国語として中国語への興味や関心が他の外国語に比べて高く、中国語を習得したい、勉強したいというニーズが増えつつある。
【0003】
中国語の殆どは、一つの中国語文字すなわち漢字に対して一つの発音を有しており、発音を表記する方法として、中国政府が1958年に発布したピンイン法と称されるものがある。このピンイン法では、中国語の音節が、日本語の子音に相当する「声母」、日本語の母音に相当する「韻母」、および抑揚を示す「声調」に分けられており、声母と韻母とは併せて「音節」と表現される。音節の表記にはローマ字アルファベットが用いられ、声調の表記には発音抑揚を表す記号が用いられる。声調には以下の4種類があり、音節の上に表示される。なお、漢字の発音の中には抑揚のない「軽声」も存在しているが、ここでは省略する。
【0004】
一声(平声):高音でフラット。「−」で示す。
二声(上声):低温から高音に上がる。「/」で示す。
三声(去声):高音から低音になり、再び高音になる。「v」で示す。
四声(入声):高音から低音に下がる。「\」で示す。
【0005】
中国語の学習者にとって障害となりやすいのは発音であり、特に同じ漢字圏である日本人にとっては、文法や表記は日本語の知識を活用すれば、それを受け入れるのはそれほど困難ではないが、中国語特有の「音節」および「声調」は学習者を悩ます難点である。教室での一斉学習では、教師が学習者と直接交流しながら、解らない発音や間違っている発音を口頭で説明し、学習者は読み書きを繰り返さなければならない。
【0006】
しかしながら、学習の後半になると「ピンイン忘れ」という現象が発生しやすく、学習者が漢字を読めるようになっていくにつれ、ピンインを正確に読めなくなっていく傾向がある。これは、多くの中国人が小学校低学年ではピンインを読めるが、漢字を読めるようになるにつれ、徐々にその表記法を忘れていく過程に非常に似ている。このような問題の解決は、母語話者はともかく、外国語修得を目的にしている学習者には必須である。
【0007】
特許文献1には、入力された発音が誤入力の場合に、正しい発音に自動修正して漢字変換する方式が開示されている。この方式では、漢字変換装置は、間違いやすい発音の対応関係に基づき作成され、入力された発音とそれが誤入力の場合に、入力された発音に対して発音等価表に基づいて等価変換発音候補を抽出する。その結果、多少の入力ミスがあったとしても所望の正しい漢字に変換することができる。
【0008】
特許文献2には、入力ピンインの誤りを検出し、その旨をユーザに警告する方式が開示されている。この方式では、ピンイン誤り検出手段は、ピンイン表記の全パターンを記述したテーブルを備え、このテーブルを参照して入力ピンインの表記をチェックし、その表記が上記テーブルに存在しない場合に誤りであると判断する。
【先行技術文献】
【特許文献】
【0009】
【特許文献1】特開平5−108647号公報
【特許文献2】特開平11−96141号公報
【発明の概要】
【発明が解決しようとする課題】
【0010】
例えば、熟語「思考」を入力しようとする際、その正しいピンインは「si1kao3」であるが、これを誤って「su1kao3」と入力してしまうと、対応する熟語が存在しないために出力が得られない。このとき、ピンイン「su1」が中国語として無効なピンインであれば、当該部分に誤りがあることは比較的容易に判断できる。しかしながら、ピンイン「su1」は、単独では中国語として有効なピンインなので、「su1kao3」から誤り箇所を推定したり、誤り部分を正しいピンインに修正したりすることは困難であった。
【0011】
本発明の目的は、上記した従来技術の課題を解決し、入力した熟語のピンインが中国語として無効なピンインであるが、熟語を漢字単位に分解したときの各ピンインは中国語として有効なピンインであるような場合でも、熟語のピンインの誤り箇所を学習して正しいピンインに簡単に修正できる中国語入力装置を提供することにある。
【課題を解決するための手段】
【0012】
上記の目的を達成するために、本発明は、中国語を音節および声調の組み合わせからなるピンイン入力により学習する中国語入力装置において、中国語のピンインが登録された言語辞書と、キー入力されたピンインに対応した言語候補を前記言語辞書から探索する言語候補探索手段と、誤りやすいピンインの正誤関係が登録された誤りパターン辞書と、キー入力された熟語のピンインが前記言語辞書に未登録であると、当該熟語のピンインを誤りピンインと判定する言語判定手段と、前記熟語の誤りピンインを漢字単位に分解し、各漢字のピンインと誤りやすい正しいピンイン候補を前記誤りパターン辞書から探索する誤りパターン探索手段と、前記探索された正しいピンイン候補を一覧表示して選択させる学習支援手段と、前記選択されたピンイン候補に基づいて前記キー入力された誤りピンインを修正する入力修正手段とを具備したことを特徴とする。
【発明の効果】
【0013】
本発明によれば、入力された熟語のピンインが中国語として無効なピンインであるが、熟語を漢字単位に分解したときの各ピンインは中国語として有効なピンインであるような場合でも、過去の中国語授業や試験の結果から中国語発音学習の際に間違いが発生しやすいパターンとして収集した誤りパターンに基づいて、熟語のピンインの誤り箇所を学習して正しいピンインに修正できるようになる。
【図面の簡単な説明】
【0014】
【図1】本発明が適用される小型情報端末の斜視図である。
【図2】本発明が適用される小型情報端末のブロック図である。
【図3】中国語入力装置としての使用例を示した図である。
【図4】本発明の一実施形態の機能ブロック図である。
【図5】本発明の一実施形態の動作を概略説明するためのフローチャートである。
【図6】本発明の一実施形態の動作を示したフローチャート(その1)である。
【図7】本発明の一実施形態の動作を示したフローチャート(その2)である。
【図8】漢字「黄」を入力する際の学習プロセスを示した図である。
【図9】漢字「横」を入力する際の学習プロセスを示した図である。
【図10】熟語「思考」を入力する際の学習プロセスを示した図である。
【図11】熟語「禁止」を入力する際の学習プロセスを示した図である。
【図12】全音節パターン辞書の一例を示した図である。
【図13】ピンインパターン辞書の一例を示した図である。
【図14】言語辞書の一例を示した図である。
【図15】誤りパターン辞書の一例を示した図である。
【発明を実施するための形態】
【0015】
以下、図面を参照して本発明の実施の形態について詳細に説明する。図1は、本発明が適用される小型情報端末1の斜視図であり、全体に薄板状で主面に液晶表示パネル2が設けられ、その全面にタッチスクリーン3が設けられている。電源スイッチ等のメカニカルなスイッチ4は液晶表示パネル2の下方に設けられている。
【0016】
図2は、前記小型情報端末1の主要部の構成を示したブロック図であり、図1と同一の符号は同一または同等部分を表している。
【0017】
MPU5は、小型情報端末1の主要な動作を制御する。RAM6は、MPU5にワークエリアを提供すると共に、制御プログラムやデータを一時記憶する。ROM7には、制御プログラムやデータが不揮発に記憶される。EEPROM8は、ユーザにワークエリアを提供し、プログラムやデータが書込および消去可能かつ不揮発に記憶される。セルラ通信部9は、携帯電話網を経由する通信を制御する。無線通信部10は、無線LAN、赤外線通信、Bluetoothなどのインターフェースを備え、これらの無線通信を制御する。
【0018】
なお、前記小型情報端末1は、上記の構成以外に通常の携帯端末が備える構成として、スピーカ、マイクロフォン、デジタルカメラ機能、ジャイロセンサ、バイブレータなどを同様に備えるが、本発明の説明には不要なので、ここでは図示が省略されている。
【0019】
前記小型情報端末1は、中国語の学習装置として使用できる他、学習機能を備えた中国語入力装置としても使用できる。例えば、中国語学習装置として決められた練習文を入力する以外にも、チャットやメール等のコミュニケーションを行いながら中国語を学習する際のタイピング装置として使用することにより、学習の機会を増やすとともに、学習意欲や学習効果を一層高めることができるようになる。
【0020】
図3は、中国語入力装置としての使用例を示した図であり、例えば検索サイトにおいて検索窓21のカーソル位置に検索キーを入力する際に、液晶表示パネル2の下方に表示されるソフトウェアキーボード31を操作することで中国語を入力、確定すると、確定漢字や確定熟語が前記検索窓21のカーソル位置に出力される。同様に、ワードプロセッサを用いた文字入力の際にも、画面下方に前記ソフトウェアキーボード31を常駐させ、このソフトウェアキーボード31を操作して中国語を入力、確定すると、確定漢字や確定熟語がカーソル位置に入力される。
【0021】
図4は、本発明の一実施形態の機能ブロック図であり、図1,2,3と同一の符号は同一または同等部分を表している。
【0022】
タッチスクリーン3には、図3に一例を示したように、アルファベットの組み合わせで表記される音節(母音+子音)が入力される音節入力キー301、および4種類の声調が入力される声調入力キー302が設けられている。前記音節入力キー301は、QWERTY配列のソフトウェアキーボードであり、声調入力キー302は、「一声(平声)」,「二声(上声)」,「三声(去声)」,「四声(入声)」をそれぞれ入力する4つのソフトウェアキーである。
【0023】
全音節パターン辞書20には、中国語として使用される全ての音節が登録されている。したがって、全音節パターン辞書20に未登録の音節は誤った音節と判断できる。図12は、全音節パターン辞書20の元となる全音節パターンの一部を示した図である。中国語は「子音+母音」によって構成され、子音の数は約23個、母音の数は約37個であり、良く使われる6763種類の漢字に413通りの音節が存在する。これにより、中国語には音節が同じで声調の異なる漢字が存在する。
【0024】
図12の全音節パターンでは、縦方向に子音が列挙され、横方向に母音が列挙され、中国語で発音される有効な組み合わせに関してのみ音節が表されている。本実施形態では、中国語で発音される子音および母音の有効な組み合わせのみが正しい音節として全音節パターン辞書20に登録されている。
【0025】
ピンインパターン辞書30には、音節ごとに全てのピンインが登録されている。図13は、ピンインパターン辞書30の一部を示した図であり、音節「heng」については3つのピンイン「heng1」,「heng2」,「heng4」が登録されている。したがって、ピンイン「heng3」は誤ったピンインと判断できる。言語辞書40には、図14に示したように、中国語の文字コードごとに、その音節、声調および汎用度が登録されている。
【0026】
誤りパターン辞書50には、誤りやすいピンインの正誤関係が登録されている。本実施形態では、図15に一例を示したように、正しい音節および声調ごとに、これと誤りやすい誤り音節および誤り声調が、解説文および誤り回数履歴と共に紐付けられて登録されている。
【0027】
中国語の発音には、日本語やほかの言語にはない発音が多数存在し、特に中国語特有の「前鼻音・後鼻音」や「捲舌音」など特殊な音節に対して聞き分けが難しくなり、入力に戸惑う場合が非常に多い。そこで、本発明では過去の中国語授業や試験の結果から、中国語発音学習の際に間違いが発生しやすい誤りパターンを収集し、これらのデータとユーザによる入力シーケンスとを照合することで誤りパターンによる誤入力を認識する。上記の各辞書20,30,40,50は、前記ROM6またはEEPROM8に記憶され、前記MPU5により適宜に参照される。
【0028】
判定部60において、音節判定部601は、キー入力された音節の正しさを、当該音節が全音節パターン辞書20に登録されているか否かに基づいて判定する。ピンイン判定部602は、キー入力されたピンインの正しさを、当該ピンインがピンインパターン辞書30に登録されているか否かに基づいて判定する。言語判定部603は、キー入力された漢字および熟語のピンインの正しさを、当該ピンインが言語辞書40に登録されているか否かに基づいて判定する。
【0029】
探索部70において、音節候補探索部701は、キー入力された音節が誤りであるときに、当該誤り音節との類似度が高い正しい音節を前記全音節パターン辞書20から探索する。言語候補探索部702は、キー入力されたピンインに対応した言語を前記言語辞書40から探索する。ピンイン候補探索部703は、キー入力されたピンインと音節が同一のピンイン候補を前記ピンインパターン辞書30から探索する。誤りパターン探索部704は、誤った音節またはピンインと対応付けられている正しい音節またはピンインを前記誤りパターン辞書50から探索する。
【0030】
学習部80において、学習支援部801は、前記探索部70により探索された正しいピンイン候補を液晶表示パネル2に一覧表示し、その一つを学習者に選択させることで正しいピンインを学習させる。入力修正部802は、前記選択されたピンイン候補に基づいて前記誤りピンインを修正する。
【0031】
前記判定部60、探索部70および学習部80の各機能は、プログラムとして前記EEPROM8に記憶することができ、この場合、前記各機能は前記MPU5が各プログラムを実行することにより発揮される。
【0032】
次いで、本発明の一実施形態の動作を、初めに図5のフローチャートを参照して概略説明し、次いで、図6,7のフローチャートを参照して詳細に説明する。
【0033】
図5において、ステップS101では熟語のピンインが入力され、ステップS102では、入力された熟語のピンインが漢字単位のピンインに分解される。ステップS103では、各漢字のピンインが全音節パターン辞書20およびピンインパターン辞書30に登録されているか否かに基づいて、その正しさが判定される。正しくなと判定されるとステップS104へ進み、熟語の各ピンインを漢字単位で正しいピンインに修正する学習処理が実行される。
【0034】
ステップS105では、前記修正された、または入力された熟語のピンインが言語辞書40に既登録であるか否かに基づいて、その正しさが判定される。熟語として正しくないピンインと判定されればステップS106へ進み、前記熟語のピンインが漢字単位に分解され、誤りパターン辞書50を参照することで正しいピンインに修正される。ステップS107では、修正後の熟語のピンインに基づいて言語辞書40が探索され、対応する熟語が確定熟語として出力される。
【0035】
図6、7は、本発明の一実施形態の動作を示したフローチャートであり、ここでは、様々な学習プロセスを例にして本実施形態の動作を詳細に説明する。
【0036】
初めに、図8に示したように、学習者が漢字「黄」を入力する際の学習プロセスを例にして本実施形態の動作を説明する。なお、漢字「黄」の正しいピンイン(音節および声調)は「huang2」である。
【0037】
ステップS1では、音節入力キー301からのキー入力、およびこれに続く声調入力キー302からのキー入力が受け付けられる。図8(a)に示したように、学習者が音節入力キー301から音節を誤って「hueng」と入力し、次いで声調入力キー302から声調として「2(二声)」を入力すると、この声調入力がステップS2で検知されてステップS3へ進む。ステップS3では、音節「hueng」および声調「2」のペアがピンイン「hueng2」として識別される。ステップS4では、ピンインが一組だけ入力される「漢字入力」および複数のピンインが連続して入力される「熟語入力」のいずれであるかが判定され、ここでは漢字入力と判定されてステップS5へ進む。
【0038】
ステップS5では、前記音節判定部601により、入力された音節「hueng」が全音節パターン辞書20に登録されているか否かに基づいて、その正しさが判定される。前記音節「hueng」は全音節パターン辞書20に未登録なので、ここでは誤り音節と判定されてステップS6へ進む。ステップS6では、前記音節候補探索部701により、当該誤り音節「hueng」と誤りやすい正しい音節が、当該誤り音節「hueng」との類似度に基づいて前記全音節パターン辞書20から探索される。
【0039】
本実施形態では、音節の類似度を表す指標としてLevenshtein Distance (レーベンシュタイン距離、以下LDと略する) が用いられる。LDによる探索では、比較対照の2つの文字列の一方に文字の挿入、削除、置換を何回行えば全く同じ文字列になるかがLDとして求められる。つまり、ソースとなる文字列sとターゲットとなる文字列tがあるとして、sをtに変換する過程で必要な文字の削除、挿入、置換の回数の総和がLDとなる。たとえば、sおよびtのLDをLD(s,t)と表現すれば、LD(test,tent) =1,LD(test,past)=2となり、全く同じ文字列の比較ではLD=0となる。
【0040】
本実施形態では、以上のようにして求められたLDが小さい複数の音節候補が探索され、ステップS7において、前記学習支援部801により、LDの小さい順に液晶表示パネル2に一覧表示される。ここでは3つの音節候補「huang」,「cheng」,「guang」が探索されたものとし、図8(b)に示したように、前記ステップS2で検知された声調「2」と組み合わされ、3つのピンイン「huang2」,「cheng2」,「guang2」が液晶表示パネル2に一覧表示され、学習者に選択操作が促される。
【0041】
ここで、学習者がピンイン候補として「huang2」を選択すると、これがステップS8で検知されてステップS9へ進む。ステップS9では、前記入力修正部802により、前記キー入力されたピンイン「hueng2」が、前記選択されたピンイン候補「huang2」に修正され、同図(c)に示したように、当該修正後のピンイン「huang2」に対応した漢字候補「黄」,「皇」…が、前記言語候補探索部702により前記言語辞書40から探索されて液晶表示パネル2に一覧表示される。学習者がいずれかの漢字を選択すると、これがステップS10で検知されてステップS11へ進み、当該選択された漢字が確定漢字として文字入力等のアプリケーションへ提供される。
【0042】
次いで、図9に示したように、学習者が漢字「横」を入力する際の学習プロセスを例にして本実施形態の動作を説明する。なお、漢字「横」の正規のピンインは「heng4」である。
【0043】
ステップS1において、図9(a)に示したように、学習者が音節「heng」を正しく入力したものの、声調を誤って「3(三声)」と入力してしまうと、ステップS3では、ピンインが「heng3」と識別される。ステップS5では、前記音節判定部601により、前記音節「heng」が全音節パターン辞書20に登録されていると判定されるので、当該音節「heng」が正しいものとしてステップS21へ進む。
【0044】
ステップS21では、前記ピンイン「heng3」がピンインパターン辞書30に登録されているか否かに基づいて、その正しさが前記ピンイン判定部602により判定される。ここではピンイン「heng3」が未登録なので、声調「3」が誤りと判定されてステップS22へ進む。ステップS22では、ピンインパターン辞書30において前記音節「heng」と紐付けられている全てのピンイン「heng1」,「heng2」、「heng4」が、前記ピンイン候補探索部703により今回のピンイン候補として探索される。ステップS23では、図9(b)に示したように、前記探索された全てのピンイン候補が、前記学習支援部801により液晶表示パネル2に一覧表示され、学習者に選択操作が促される。
【0045】
ここで、学習者が正しい「heng4」を選択すると、これがステップS24で検知され、前記入力修正部802により、前記キー入力されたピンイン「heng3」が、前記選択された正しいピンイン「heng4」に修正される。ステップS25では、当該ピンイン「heng4」に対応した漢字候補が、前記言語候補探索部702により言語辞書40から探索されて液晶表示パネル2に一覧表示される。本実施形態では、図9(c)に示したように、漢字「横」が表示される。ここで、学習者が漢字「横」を選択すると、これがステップS26で検知されてステップS27へ進み、当該選択された漢字が確定漢字として文字入力等のアプリケーションへ提供される。
【0046】
次いで、図10に示したように、学習者が2つの漢字から構成される熟語「思考」を入力する際の学習プロセスを例にして本実施形態の動作を説明する。なお、熟語「思考」の正規のピンインは「si1kao3」である。
【0047】
ステップS1において、学習者が最初の音節を誤って「su」と入力し、さらに声調「1」を入力すると、当該処理はステップS2,3,4を経てステップS5以降へ進むが、図10(a)に示したように、続けて次のピンイン「kao3」が入力されると、熟語入力と判別されてステップS5から図7のステップS40へ進む。
【0048】
ステップS40では、前記熟語のピンイン「su1kao3」が2つの漢字のピンイン「su1」,「kao3」に分解される。ステップS41では、分解されたピンインごとに前記と同様に学習処理が実行されて正規のピンインに修正される。なお、本実施形態では2つのピンイン「su1」,「kao3」は、いずれも漢字のピンインとしては正当なので修正は行われない。
【0049】
ステップS42では、前記言語判定部603により、熟語のピンイン「su1kao3」が言語辞書に登録されているか否かに基づいて、その正しさが判定される。ここでは未登録(すなわち、ピンインが誤り)と判定されるのでステップS43へ進み、漢字単位のピンイン「su1」、「kao3」ごとに、前記誤りパターン探索部703により、誤りパターン辞書50から正しいピンイン候補が探索される。
【0050】
ステップS44では、探索された正しいピンイン候補が、前記学習支援部801により液晶表示パネル2に一覧表示され、学習者に選択操作が促される。本実施形態では、図10(b)に示したように、ピンイン「su1」についてのみ、間違えやすいピンイン候補「si1」(「si1」は正しいピンイン)が表示される。このとき、誤りパターン辞書50に登録されている対応する解説文が同時に表示されるようにしても良い。
【0051】
ここで、学習者により前記ピンイン候補「si1」が選択されると、これがステップS45で検知されてステップS46へ進む。ステップS46では、前記入力修正部802により、前記キー入力されたピンイン「su1」が、前記選択されたピンイン「si1」に修正され、修正後のピンイン「si1kao3」に対応した熟語候補が、前記言語候補探索部702により言語辞書40から探索される。ステップS47では、前記探索結果が、前記学習支援部801により液晶表示パネル2に一覧表される。本実施形態では図10(c)に示したように、唯一の熟語候補「思考」が表示される。ここで、学習者が当該熟語候補「思考」を選択すると、これがステップS48で検知されてステップS49へ進み、当該熟語候補「思考」が確定熟語として文字入力等のアプリケーションへ提供される。
【0052】
次いで、図11に示したように、学習者が熟語「禁止」を入力する際の学習プロセスを例にして本実施形態の動作を説明する。なお、熟語「禁止」の正しいピンインは「jin4zhi3」である。
【0053】
ステップS1において、学習者がピンイン「jing4zhi3」を続けて入力すると、これが熟語入力と判別されてステップS5から図7のステップS40へ進む。ステップS40では、前記熟語のピンイン「jing4zhi3」が2つの漢字のピンイン「jing4」,「zhi3」に分解される。ステップS41では、分解されたピンインごとに前記と同様に学習処理が実行されて正規のピンインに修正される。なお、本実施形態では2つのピンイン「jing4」,「zhi3」は、いずれも漢字のピンインとしては正しいので修正は行われない。
【0054】
ステップS42では、前記ピンイン「jing4zhi3」が言語辞書50に登録されているか否かに基づいて、その正しさが前記言語判定部603により判定される。前記ピンイン「jing4zhi3」は熟語「静止」と対応付けられて言語辞書50に登録されているのでステップS51へ進む。ステップS51では、図11(a)に示したように、前記ピンイン「jing4zhi3」に対応する熟語「静止」が液晶表示パネル2に表示される。
【0055】
学習者は、ここで誤入力に気付き、当該熟語「静止」を選択することなくDELキーを操作すると、これがステップS53で検知されてステップS54へ進む。ステップS54において、学習者がDELキーによる修正操作を行い、図11(b)に示したように、2番目のピンイン「zhi3」を全て削除して1番目のピンイン「jing4」のみを残すと、このピンイン「jing4」に対して、前記と同様に誤りパターンの探索が行われ、図11(c)に示したようにピンイン候補「jin4」が表示される。このとき、誤りパターン辞書50に登録されている対応する解説文が同時に表示されるようにしても良い。
【0056】
ここで、学習者が当該ピンイン候補「jin4」を選択すると、これがステップS52で検知されて前記ステップS46へ進む。ステップS46では、「jing4」を「jin4」に修正された新たなピンイン「jing4zhi3」に対応した熟語候補が言語辞書40から探索され、ステップS47では、その探索結果が一覧表される。本実施形態では図11(d)に示したように、唯一の熟語候補「禁止」が液晶表示パネル2に表示される。ここで、学習者が当該熟語候補「禁止」を選択すると、これがステップS48で検知されてステップS49へ進み、当該熟語候補「禁止」が確定熟語として文字入力等のアプリケーションへ提供される。
【符号の説明】
【0057】
1…小型情報端末,2…液晶表示パネル,3…タッチスクリーン,4…スイッチ,5…MPU,6…RAM,7…ROM,8…EEPROM,9…セルラ通信部,10…無線通信部,20…全音節パターン辞書,21…検索窓,30…ピンインパターン辞書,31…ソフトウェアキーボード,40…言語辞書,50…誤りパターン辞書,60…判定部,70…探索部,80…学習部,301…音節入力キー,302…声調入力キー,601…音節判定部,602…ピンイン判定部,701…音節候補探索部,702…言語候補探索部,703…ピンイン候補探索部,704…誤りパターン探索部,801…学習支援部,802…入力修正部
【技術分野】
【0001】
本発明は、中国語入力装置に係り、特に、音節と声調との組み合わせ(ピンイン)の正しさを学習しながら中国語を入力できる中国語入力装置に関する。
【背景技術】
【0002】
企業の進出先や貿易対象国として中国が話題になることが多くなり、中国語を話す必要性が高くなっている。それと同時に、日本の大学や企業では、第二外国語として中国語への興味や関心が他の外国語に比べて高く、中国語を習得したい、勉強したいというニーズが増えつつある。
【0003】
中国語の殆どは、一つの中国語文字すなわち漢字に対して一つの発音を有しており、発音を表記する方法として、中国政府が1958年に発布したピンイン法と称されるものがある。このピンイン法では、中国語の音節が、日本語の子音に相当する「声母」、日本語の母音に相当する「韻母」、および抑揚を示す「声調」に分けられており、声母と韻母とは併せて「音節」と表現される。音節の表記にはローマ字アルファベットが用いられ、声調の表記には発音抑揚を表す記号が用いられる。声調には以下の4種類があり、音節の上に表示される。なお、漢字の発音の中には抑揚のない「軽声」も存在しているが、ここでは省略する。
【0004】
一声(平声):高音でフラット。「−」で示す。
二声(上声):低温から高音に上がる。「/」で示す。
三声(去声):高音から低音になり、再び高音になる。「v」で示す。
四声(入声):高音から低音に下がる。「\」で示す。
【0005】
中国語の学習者にとって障害となりやすいのは発音であり、特に同じ漢字圏である日本人にとっては、文法や表記は日本語の知識を活用すれば、それを受け入れるのはそれほど困難ではないが、中国語特有の「音節」および「声調」は学習者を悩ます難点である。教室での一斉学習では、教師が学習者と直接交流しながら、解らない発音や間違っている発音を口頭で説明し、学習者は読み書きを繰り返さなければならない。
【0006】
しかしながら、学習の後半になると「ピンイン忘れ」という現象が発生しやすく、学習者が漢字を読めるようになっていくにつれ、ピンインを正確に読めなくなっていく傾向がある。これは、多くの中国人が小学校低学年ではピンインを読めるが、漢字を読めるようになるにつれ、徐々にその表記法を忘れていく過程に非常に似ている。このような問題の解決は、母語話者はともかく、外国語修得を目的にしている学習者には必須である。
【0007】
特許文献1には、入力された発音が誤入力の場合に、正しい発音に自動修正して漢字変換する方式が開示されている。この方式では、漢字変換装置は、間違いやすい発音の対応関係に基づき作成され、入力された発音とそれが誤入力の場合に、入力された発音に対して発音等価表に基づいて等価変換発音候補を抽出する。その結果、多少の入力ミスがあったとしても所望の正しい漢字に変換することができる。
【0008】
特許文献2には、入力ピンインの誤りを検出し、その旨をユーザに警告する方式が開示されている。この方式では、ピンイン誤り検出手段は、ピンイン表記の全パターンを記述したテーブルを備え、このテーブルを参照して入力ピンインの表記をチェックし、その表記が上記テーブルに存在しない場合に誤りであると判断する。
【先行技術文献】
【特許文献】
【0009】
【特許文献1】特開平5−108647号公報
【特許文献2】特開平11−96141号公報
【発明の概要】
【発明が解決しようとする課題】
【0010】
例えば、熟語「思考」を入力しようとする際、その正しいピンインは「si1kao3」であるが、これを誤って「su1kao3」と入力してしまうと、対応する熟語が存在しないために出力が得られない。このとき、ピンイン「su1」が中国語として無効なピンインであれば、当該部分に誤りがあることは比較的容易に判断できる。しかしながら、ピンイン「su1」は、単独では中国語として有効なピンインなので、「su1kao3」から誤り箇所を推定したり、誤り部分を正しいピンインに修正したりすることは困難であった。
【0011】
本発明の目的は、上記した従来技術の課題を解決し、入力した熟語のピンインが中国語として無効なピンインであるが、熟語を漢字単位に分解したときの各ピンインは中国語として有効なピンインであるような場合でも、熟語のピンインの誤り箇所を学習して正しいピンインに簡単に修正できる中国語入力装置を提供することにある。
【課題を解決するための手段】
【0012】
上記の目的を達成するために、本発明は、中国語を音節および声調の組み合わせからなるピンイン入力により学習する中国語入力装置において、中国語のピンインが登録された言語辞書と、キー入力されたピンインに対応した言語候補を前記言語辞書から探索する言語候補探索手段と、誤りやすいピンインの正誤関係が登録された誤りパターン辞書と、キー入力された熟語のピンインが前記言語辞書に未登録であると、当該熟語のピンインを誤りピンインと判定する言語判定手段と、前記熟語の誤りピンインを漢字単位に分解し、各漢字のピンインと誤りやすい正しいピンイン候補を前記誤りパターン辞書から探索する誤りパターン探索手段と、前記探索された正しいピンイン候補を一覧表示して選択させる学習支援手段と、前記選択されたピンイン候補に基づいて前記キー入力された誤りピンインを修正する入力修正手段とを具備したことを特徴とする。
【発明の効果】
【0013】
本発明によれば、入力された熟語のピンインが中国語として無効なピンインであるが、熟語を漢字単位に分解したときの各ピンインは中国語として有効なピンインであるような場合でも、過去の中国語授業や試験の結果から中国語発音学習の際に間違いが発生しやすいパターンとして収集した誤りパターンに基づいて、熟語のピンインの誤り箇所を学習して正しいピンインに修正できるようになる。
【図面の簡単な説明】
【0014】
【図1】本発明が適用される小型情報端末の斜視図である。
【図2】本発明が適用される小型情報端末のブロック図である。
【図3】中国語入力装置としての使用例を示した図である。
【図4】本発明の一実施形態の機能ブロック図である。
【図5】本発明の一実施形態の動作を概略説明するためのフローチャートである。
【図6】本発明の一実施形態の動作を示したフローチャート(その1)である。
【図7】本発明の一実施形態の動作を示したフローチャート(その2)である。
【図8】漢字「黄」を入力する際の学習プロセスを示した図である。
【図9】漢字「横」を入力する際の学習プロセスを示した図である。
【図10】熟語「思考」を入力する際の学習プロセスを示した図である。
【図11】熟語「禁止」を入力する際の学習プロセスを示した図である。
【図12】全音節パターン辞書の一例を示した図である。
【図13】ピンインパターン辞書の一例を示した図である。
【図14】言語辞書の一例を示した図である。
【図15】誤りパターン辞書の一例を示した図である。
【発明を実施するための形態】
【0015】
以下、図面を参照して本発明の実施の形態について詳細に説明する。図1は、本発明が適用される小型情報端末1の斜視図であり、全体に薄板状で主面に液晶表示パネル2が設けられ、その全面にタッチスクリーン3が設けられている。電源スイッチ等のメカニカルなスイッチ4は液晶表示パネル2の下方に設けられている。
【0016】
図2は、前記小型情報端末1の主要部の構成を示したブロック図であり、図1と同一の符号は同一または同等部分を表している。
【0017】
MPU5は、小型情報端末1の主要な動作を制御する。RAM6は、MPU5にワークエリアを提供すると共に、制御プログラムやデータを一時記憶する。ROM7には、制御プログラムやデータが不揮発に記憶される。EEPROM8は、ユーザにワークエリアを提供し、プログラムやデータが書込および消去可能かつ不揮発に記憶される。セルラ通信部9は、携帯電話網を経由する通信を制御する。無線通信部10は、無線LAN、赤外線通信、Bluetoothなどのインターフェースを備え、これらの無線通信を制御する。
【0018】
なお、前記小型情報端末1は、上記の構成以外に通常の携帯端末が備える構成として、スピーカ、マイクロフォン、デジタルカメラ機能、ジャイロセンサ、バイブレータなどを同様に備えるが、本発明の説明には不要なので、ここでは図示が省略されている。
【0019】
前記小型情報端末1は、中国語の学習装置として使用できる他、学習機能を備えた中国語入力装置としても使用できる。例えば、中国語学習装置として決められた練習文を入力する以外にも、チャットやメール等のコミュニケーションを行いながら中国語を学習する際のタイピング装置として使用することにより、学習の機会を増やすとともに、学習意欲や学習効果を一層高めることができるようになる。
【0020】
図3は、中国語入力装置としての使用例を示した図であり、例えば検索サイトにおいて検索窓21のカーソル位置に検索キーを入力する際に、液晶表示パネル2の下方に表示されるソフトウェアキーボード31を操作することで中国語を入力、確定すると、確定漢字や確定熟語が前記検索窓21のカーソル位置に出力される。同様に、ワードプロセッサを用いた文字入力の際にも、画面下方に前記ソフトウェアキーボード31を常駐させ、このソフトウェアキーボード31を操作して中国語を入力、確定すると、確定漢字や確定熟語がカーソル位置に入力される。
【0021】
図4は、本発明の一実施形態の機能ブロック図であり、図1,2,3と同一の符号は同一または同等部分を表している。
【0022】
タッチスクリーン3には、図3に一例を示したように、アルファベットの組み合わせで表記される音節(母音+子音)が入力される音節入力キー301、および4種類の声調が入力される声調入力キー302が設けられている。前記音節入力キー301は、QWERTY配列のソフトウェアキーボードであり、声調入力キー302は、「一声(平声)」,「二声(上声)」,「三声(去声)」,「四声(入声)」をそれぞれ入力する4つのソフトウェアキーである。
【0023】
全音節パターン辞書20には、中国語として使用される全ての音節が登録されている。したがって、全音節パターン辞書20に未登録の音節は誤った音節と判断できる。図12は、全音節パターン辞書20の元となる全音節パターンの一部を示した図である。中国語は「子音+母音」によって構成され、子音の数は約23個、母音の数は約37個であり、良く使われる6763種類の漢字に413通りの音節が存在する。これにより、中国語には音節が同じで声調の異なる漢字が存在する。
【0024】
図12の全音節パターンでは、縦方向に子音が列挙され、横方向に母音が列挙され、中国語で発音される有効な組み合わせに関してのみ音節が表されている。本実施形態では、中国語で発音される子音および母音の有効な組み合わせのみが正しい音節として全音節パターン辞書20に登録されている。
【0025】
ピンインパターン辞書30には、音節ごとに全てのピンインが登録されている。図13は、ピンインパターン辞書30の一部を示した図であり、音節「heng」については3つのピンイン「heng1」,「heng2」,「heng4」が登録されている。したがって、ピンイン「heng3」は誤ったピンインと判断できる。言語辞書40には、図14に示したように、中国語の文字コードごとに、その音節、声調および汎用度が登録されている。
【0026】
誤りパターン辞書50には、誤りやすいピンインの正誤関係が登録されている。本実施形態では、図15に一例を示したように、正しい音節および声調ごとに、これと誤りやすい誤り音節および誤り声調が、解説文および誤り回数履歴と共に紐付けられて登録されている。
【0027】
中国語の発音には、日本語やほかの言語にはない発音が多数存在し、特に中国語特有の「前鼻音・後鼻音」や「捲舌音」など特殊な音節に対して聞き分けが難しくなり、入力に戸惑う場合が非常に多い。そこで、本発明では過去の中国語授業や試験の結果から、中国語発音学習の際に間違いが発生しやすい誤りパターンを収集し、これらのデータとユーザによる入力シーケンスとを照合することで誤りパターンによる誤入力を認識する。上記の各辞書20,30,40,50は、前記ROM6またはEEPROM8に記憶され、前記MPU5により適宜に参照される。
【0028】
判定部60において、音節判定部601は、キー入力された音節の正しさを、当該音節が全音節パターン辞書20に登録されているか否かに基づいて判定する。ピンイン判定部602は、キー入力されたピンインの正しさを、当該ピンインがピンインパターン辞書30に登録されているか否かに基づいて判定する。言語判定部603は、キー入力された漢字および熟語のピンインの正しさを、当該ピンインが言語辞書40に登録されているか否かに基づいて判定する。
【0029】
探索部70において、音節候補探索部701は、キー入力された音節が誤りであるときに、当該誤り音節との類似度が高い正しい音節を前記全音節パターン辞書20から探索する。言語候補探索部702は、キー入力されたピンインに対応した言語を前記言語辞書40から探索する。ピンイン候補探索部703は、キー入力されたピンインと音節が同一のピンイン候補を前記ピンインパターン辞書30から探索する。誤りパターン探索部704は、誤った音節またはピンインと対応付けられている正しい音節またはピンインを前記誤りパターン辞書50から探索する。
【0030】
学習部80において、学習支援部801は、前記探索部70により探索された正しいピンイン候補を液晶表示パネル2に一覧表示し、その一つを学習者に選択させることで正しいピンインを学習させる。入力修正部802は、前記選択されたピンイン候補に基づいて前記誤りピンインを修正する。
【0031】
前記判定部60、探索部70および学習部80の各機能は、プログラムとして前記EEPROM8に記憶することができ、この場合、前記各機能は前記MPU5が各プログラムを実行することにより発揮される。
【0032】
次いで、本発明の一実施形態の動作を、初めに図5のフローチャートを参照して概略説明し、次いで、図6,7のフローチャートを参照して詳細に説明する。
【0033】
図5において、ステップS101では熟語のピンインが入力され、ステップS102では、入力された熟語のピンインが漢字単位のピンインに分解される。ステップS103では、各漢字のピンインが全音節パターン辞書20およびピンインパターン辞書30に登録されているか否かに基づいて、その正しさが判定される。正しくなと判定されるとステップS104へ進み、熟語の各ピンインを漢字単位で正しいピンインに修正する学習処理が実行される。
【0034】
ステップS105では、前記修正された、または入力された熟語のピンインが言語辞書40に既登録であるか否かに基づいて、その正しさが判定される。熟語として正しくないピンインと判定されればステップS106へ進み、前記熟語のピンインが漢字単位に分解され、誤りパターン辞書50を参照することで正しいピンインに修正される。ステップS107では、修正後の熟語のピンインに基づいて言語辞書40が探索され、対応する熟語が確定熟語として出力される。
【0035】
図6、7は、本発明の一実施形態の動作を示したフローチャートであり、ここでは、様々な学習プロセスを例にして本実施形態の動作を詳細に説明する。
【0036】
初めに、図8に示したように、学習者が漢字「黄」を入力する際の学習プロセスを例にして本実施形態の動作を説明する。なお、漢字「黄」の正しいピンイン(音節および声調)は「huang2」である。
【0037】
ステップS1では、音節入力キー301からのキー入力、およびこれに続く声調入力キー302からのキー入力が受け付けられる。図8(a)に示したように、学習者が音節入力キー301から音節を誤って「hueng」と入力し、次いで声調入力キー302から声調として「2(二声)」を入力すると、この声調入力がステップS2で検知されてステップS3へ進む。ステップS3では、音節「hueng」および声調「2」のペアがピンイン「hueng2」として識別される。ステップS4では、ピンインが一組だけ入力される「漢字入力」および複数のピンインが連続して入力される「熟語入力」のいずれであるかが判定され、ここでは漢字入力と判定されてステップS5へ進む。
【0038】
ステップS5では、前記音節判定部601により、入力された音節「hueng」が全音節パターン辞書20に登録されているか否かに基づいて、その正しさが判定される。前記音節「hueng」は全音節パターン辞書20に未登録なので、ここでは誤り音節と判定されてステップS6へ進む。ステップS6では、前記音節候補探索部701により、当該誤り音節「hueng」と誤りやすい正しい音節が、当該誤り音節「hueng」との類似度に基づいて前記全音節パターン辞書20から探索される。
【0039】
本実施形態では、音節の類似度を表す指標としてLevenshtein Distance (レーベンシュタイン距離、以下LDと略する) が用いられる。LDによる探索では、比較対照の2つの文字列の一方に文字の挿入、削除、置換を何回行えば全く同じ文字列になるかがLDとして求められる。つまり、ソースとなる文字列sとターゲットとなる文字列tがあるとして、sをtに変換する過程で必要な文字の削除、挿入、置換の回数の総和がLDとなる。たとえば、sおよびtのLDをLD(s,t)と表現すれば、LD(test,tent) =1,LD(test,past)=2となり、全く同じ文字列の比較ではLD=0となる。
【0040】
本実施形態では、以上のようにして求められたLDが小さい複数の音節候補が探索され、ステップS7において、前記学習支援部801により、LDの小さい順に液晶表示パネル2に一覧表示される。ここでは3つの音節候補「huang」,「cheng」,「guang」が探索されたものとし、図8(b)に示したように、前記ステップS2で検知された声調「2」と組み合わされ、3つのピンイン「huang2」,「cheng2」,「guang2」が液晶表示パネル2に一覧表示され、学習者に選択操作が促される。
【0041】
ここで、学習者がピンイン候補として「huang2」を選択すると、これがステップS8で検知されてステップS9へ進む。ステップS9では、前記入力修正部802により、前記キー入力されたピンイン「hueng2」が、前記選択されたピンイン候補「huang2」に修正され、同図(c)に示したように、当該修正後のピンイン「huang2」に対応した漢字候補「黄」,「皇」…が、前記言語候補探索部702により前記言語辞書40から探索されて液晶表示パネル2に一覧表示される。学習者がいずれかの漢字を選択すると、これがステップS10で検知されてステップS11へ進み、当該選択された漢字が確定漢字として文字入力等のアプリケーションへ提供される。
【0042】
次いで、図9に示したように、学習者が漢字「横」を入力する際の学習プロセスを例にして本実施形態の動作を説明する。なお、漢字「横」の正規のピンインは「heng4」である。
【0043】
ステップS1において、図9(a)に示したように、学習者が音節「heng」を正しく入力したものの、声調を誤って「3(三声)」と入力してしまうと、ステップS3では、ピンインが「heng3」と識別される。ステップS5では、前記音節判定部601により、前記音節「heng」が全音節パターン辞書20に登録されていると判定されるので、当該音節「heng」が正しいものとしてステップS21へ進む。
【0044】
ステップS21では、前記ピンイン「heng3」がピンインパターン辞書30に登録されているか否かに基づいて、その正しさが前記ピンイン判定部602により判定される。ここではピンイン「heng3」が未登録なので、声調「3」が誤りと判定されてステップS22へ進む。ステップS22では、ピンインパターン辞書30において前記音節「heng」と紐付けられている全てのピンイン「heng1」,「heng2」、「heng4」が、前記ピンイン候補探索部703により今回のピンイン候補として探索される。ステップS23では、図9(b)に示したように、前記探索された全てのピンイン候補が、前記学習支援部801により液晶表示パネル2に一覧表示され、学習者に選択操作が促される。
【0045】
ここで、学習者が正しい「heng4」を選択すると、これがステップS24で検知され、前記入力修正部802により、前記キー入力されたピンイン「heng3」が、前記選択された正しいピンイン「heng4」に修正される。ステップS25では、当該ピンイン「heng4」に対応した漢字候補が、前記言語候補探索部702により言語辞書40から探索されて液晶表示パネル2に一覧表示される。本実施形態では、図9(c)に示したように、漢字「横」が表示される。ここで、学習者が漢字「横」を選択すると、これがステップS26で検知されてステップS27へ進み、当該選択された漢字が確定漢字として文字入力等のアプリケーションへ提供される。
【0046】
次いで、図10に示したように、学習者が2つの漢字から構成される熟語「思考」を入力する際の学習プロセスを例にして本実施形態の動作を説明する。なお、熟語「思考」の正規のピンインは「si1kao3」である。
【0047】
ステップS1において、学習者が最初の音節を誤って「su」と入力し、さらに声調「1」を入力すると、当該処理はステップS2,3,4を経てステップS5以降へ進むが、図10(a)に示したように、続けて次のピンイン「kao3」が入力されると、熟語入力と判別されてステップS5から図7のステップS40へ進む。
【0048】
ステップS40では、前記熟語のピンイン「su1kao3」が2つの漢字のピンイン「su1」,「kao3」に分解される。ステップS41では、分解されたピンインごとに前記と同様に学習処理が実行されて正規のピンインに修正される。なお、本実施形態では2つのピンイン「su1」,「kao3」は、いずれも漢字のピンインとしては正当なので修正は行われない。
【0049】
ステップS42では、前記言語判定部603により、熟語のピンイン「su1kao3」が言語辞書に登録されているか否かに基づいて、その正しさが判定される。ここでは未登録(すなわち、ピンインが誤り)と判定されるのでステップS43へ進み、漢字単位のピンイン「su1」、「kao3」ごとに、前記誤りパターン探索部703により、誤りパターン辞書50から正しいピンイン候補が探索される。
【0050】
ステップS44では、探索された正しいピンイン候補が、前記学習支援部801により液晶表示パネル2に一覧表示され、学習者に選択操作が促される。本実施形態では、図10(b)に示したように、ピンイン「su1」についてのみ、間違えやすいピンイン候補「si1」(「si1」は正しいピンイン)が表示される。このとき、誤りパターン辞書50に登録されている対応する解説文が同時に表示されるようにしても良い。
【0051】
ここで、学習者により前記ピンイン候補「si1」が選択されると、これがステップS45で検知されてステップS46へ進む。ステップS46では、前記入力修正部802により、前記キー入力されたピンイン「su1」が、前記選択されたピンイン「si1」に修正され、修正後のピンイン「si1kao3」に対応した熟語候補が、前記言語候補探索部702により言語辞書40から探索される。ステップS47では、前記探索結果が、前記学習支援部801により液晶表示パネル2に一覧表される。本実施形態では図10(c)に示したように、唯一の熟語候補「思考」が表示される。ここで、学習者が当該熟語候補「思考」を選択すると、これがステップS48で検知されてステップS49へ進み、当該熟語候補「思考」が確定熟語として文字入力等のアプリケーションへ提供される。
【0052】
次いで、図11に示したように、学習者が熟語「禁止」を入力する際の学習プロセスを例にして本実施形態の動作を説明する。なお、熟語「禁止」の正しいピンインは「jin4zhi3」である。
【0053】
ステップS1において、学習者がピンイン「jing4zhi3」を続けて入力すると、これが熟語入力と判別されてステップS5から図7のステップS40へ進む。ステップS40では、前記熟語のピンイン「jing4zhi3」が2つの漢字のピンイン「jing4」,「zhi3」に分解される。ステップS41では、分解されたピンインごとに前記と同様に学習処理が実行されて正規のピンインに修正される。なお、本実施形態では2つのピンイン「jing4」,「zhi3」は、いずれも漢字のピンインとしては正しいので修正は行われない。
【0054】
ステップS42では、前記ピンイン「jing4zhi3」が言語辞書50に登録されているか否かに基づいて、その正しさが前記言語判定部603により判定される。前記ピンイン「jing4zhi3」は熟語「静止」と対応付けられて言語辞書50に登録されているのでステップS51へ進む。ステップS51では、図11(a)に示したように、前記ピンイン「jing4zhi3」に対応する熟語「静止」が液晶表示パネル2に表示される。
【0055】
学習者は、ここで誤入力に気付き、当該熟語「静止」を選択することなくDELキーを操作すると、これがステップS53で検知されてステップS54へ進む。ステップS54において、学習者がDELキーによる修正操作を行い、図11(b)に示したように、2番目のピンイン「zhi3」を全て削除して1番目のピンイン「jing4」のみを残すと、このピンイン「jing4」に対して、前記と同様に誤りパターンの探索が行われ、図11(c)に示したようにピンイン候補「jin4」が表示される。このとき、誤りパターン辞書50に登録されている対応する解説文が同時に表示されるようにしても良い。
【0056】
ここで、学習者が当該ピンイン候補「jin4」を選択すると、これがステップS52で検知されて前記ステップS46へ進む。ステップS46では、「jing4」を「jin4」に修正された新たなピンイン「jing4zhi3」に対応した熟語候補が言語辞書40から探索され、ステップS47では、その探索結果が一覧表される。本実施形態では図11(d)に示したように、唯一の熟語候補「禁止」が液晶表示パネル2に表示される。ここで、学習者が当該熟語候補「禁止」を選択すると、これがステップS48で検知されてステップS49へ進み、当該熟語候補「禁止」が確定熟語として文字入力等のアプリケーションへ提供される。
【符号の説明】
【0057】
1…小型情報端末,2…液晶表示パネル,3…タッチスクリーン,4…スイッチ,5…MPU,6…RAM,7…ROM,8…EEPROM,9…セルラ通信部,10…無線通信部,20…全音節パターン辞書,21…検索窓,30…ピンインパターン辞書,31…ソフトウェアキーボード,40…言語辞書,50…誤りパターン辞書,60…判定部,70…探索部,80…学習部,301…音節入力キー,302…声調入力キー,601…音節判定部,602…ピンイン判定部,701…音節候補探索部,702…言語候補探索部,703…ピンイン候補探索部,704…誤りパターン探索部,801…学習支援部,802…入力修正部
【特許請求の範囲】
【請求項1】
中国語を音節および声調の組み合わせからなるピンイン入力により学習する中国語入力装置において、
音節が入力される音節入力キーと、
声調が入力される声調入力キーと、
中国語のピンインが登録された言語辞書と、
キー入力されたピンインに対応した言語候補を前記言語辞書から探索する言語候補探索手段と、
誤りやすいピンインの正誤関係が登録された誤りパターン辞書と、
キー入力された熟語のピンインが前記言語辞書に未登録であると、当該熟語のピンインを誤りピンインと判定する言語判定手段と、
前記熟語の誤りピンインを漢字単位に分解し、各漢字のピンインと誤りやすい正しいピンイン候補を前記誤りパターン辞書から探索する誤りパターン探索手段と、
前記探索された正しいピンイン候補を一覧表示して選択させる学習支援手段と、
前記選択されたピンイン候補に基づいて前記キー入力された誤りピンインを修正する入力修正手段とを具備したことを特徴とする中国語入力装置。
【請求項2】
前記キー入力された正しいピンインまたは修正されたピンインに対応した言語候補を前記言語辞書から探索して一覧表示し、選択された言語候補を確定熟語とすることを特徴とする請求項1に記載の中国語入力装置。
【請求項3】
中国語の全ての音節が登録された全音節パターン辞書と、
キー入力された音節が前記全音節パターン辞書に未登録であると、当該音節を誤り音節と判定する音節判定手段と、
前記全音節パターン辞書上で、前記誤り音節とのレーベンシュタイン距離が短い音節候補を探索する音節候補探索手段とを具備し、
前記学習支援手段は、前記音節候補を一覧表示して選択させ、前記キー入力された音節を前記選択された音節候補に置換することを特徴とする請求項1または2に記載の中国語入力装置。
【請求項4】
音節ごとに正しいピンインが登録されたピンインパターン辞書と、
キー入力されたピンインが前記ピンインパターン辞書に未登録であると、当該ピンインを誤りピンインと判定するピンイン判定手段と、
前記誤りピンインと音節が一致するピンイン候補を前記ピンインパターン辞書から探索するピンイン候補探索手段とを具備し、
前記学習支援手段は、前記ピンイン候補を一覧表示して選択させ、前記キー入力されたピンインを前記選択されたピンイン候補に置換することを特徴とする請求項1または2に記載の中国語入力装置。
【請求項1】
中国語を音節および声調の組み合わせからなるピンイン入力により学習する中国語入力装置において、
音節が入力される音節入力キーと、
声調が入力される声調入力キーと、
中国語のピンインが登録された言語辞書と、
キー入力されたピンインに対応した言語候補を前記言語辞書から探索する言語候補探索手段と、
誤りやすいピンインの正誤関係が登録された誤りパターン辞書と、
キー入力された熟語のピンインが前記言語辞書に未登録であると、当該熟語のピンインを誤りピンインと判定する言語判定手段と、
前記熟語の誤りピンインを漢字単位に分解し、各漢字のピンインと誤りやすい正しいピンイン候補を前記誤りパターン辞書から探索する誤りパターン探索手段と、
前記探索された正しいピンイン候補を一覧表示して選択させる学習支援手段と、
前記選択されたピンイン候補に基づいて前記キー入力された誤りピンインを修正する入力修正手段とを具備したことを特徴とする中国語入力装置。
【請求項2】
前記キー入力された正しいピンインまたは修正されたピンインに対応した言語候補を前記言語辞書から探索して一覧表示し、選択された言語候補を確定熟語とすることを特徴とする請求項1に記載の中国語入力装置。
【請求項3】
中国語の全ての音節が登録された全音節パターン辞書と、
キー入力された音節が前記全音節パターン辞書に未登録であると、当該音節を誤り音節と判定する音節判定手段と、
前記全音節パターン辞書上で、前記誤り音節とのレーベンシュタイン距離が短い音節候補を探索する音節候補探索手段とを具備し、
前記学習支援手段は、前記音節候補を一覧表示して選択させ、前記キー入力された音節を前記選択された音節候補に置換することを特徴とする請求項1または2に記載の中国語入力装置。
【請求項4】
音節ごとに正しいピンインが登録されたピンインパターン辞書と、
キー入力されたピンインが前記ピンインパターン辞書に未登録であると、当該ピンインを誤りピンインと判定するピンイン判定手段と、
前記誤りピンインと音節が一致するピンイン候補を前記ピンインパターン辞書から探索するピンイン候補探索手段とを具備し、
前記学習支援手段は、前記ピンイン候補を一覧表示して選択させ、前記キー入力されたピンインを前記選択されたピンイン候補に置換することを特徴とする請求項1または2に記載の中国語入力装置。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【公開番号】特開2012−203822(P2012−203822A)
【公開日】平成24年10月22日(2012.10.22)
【国際特許分類】
【出願番号】特願2011−70222(P2011−70222)
【出願日】平成23年3月28日(2011.3.28)
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.Bluetooth
【出願人】(000208891)KDDI株式会社 (2,700)
【Fターム(参考)】
【公開日】平成24年10月22日(2012.10.22)
【国際特許分類】
【出願日】平成23年3月28日(2011.3.28)
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.Bluetooth
【出願人】(000208891)KDDI株式会社 (2,700)
【Fターム(参考)】
[ Back to top ]