説明

オンライン文字認識装置

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、手書き入力文字をストロークの情報を利用して認識するオンライン文字認識装置に関するものである。
【0002】
【従来の技術】図2は、従来のオンライン文字認識装置の概略構成を示すものである(特開昭62−229383号公報には図2以上に詳細に記載されている)。図2において、従来のオンライン文字認識装置は、タブレット(座標入力手段)1と、特徴点抽出手段2と、ストローク抽出手段3と、認識手段4と、辞書5とから構成されている。
【0003】タブレット1から時系列的に出力された例えばxy直交座標系に従う座標データは、特徴点抽出手段2に入力され、特徴点抽出手段2によってストロークの始点、終点、屈曲点等の特徴を表す極点座標データが抽出される。
【0004】ここで、極点とは、タブレット1から送出された座標系列をxy直交座標上の曲線とみなし、x軸、y軸に対する極大値及び極小値をとる点、座標系列を45度回転したときのx軸、y軸に対する極大値及び極小値をとる点、並びに、1ストロークの座標系列の始点及び終点を言う。
【0005】抽出された1ストローク分の極点座標データ(以下、単に座標データと呼ぶ)は、ストローク抽出手段3に入力され、ストローク抽出手段3は、この座標データに基づいて、各ストロークを分類して予め決められているストロークコードを付与する。
【0006】特徴点抽出手段2が抽出した1ストローク分の座標データ、及び、ストローク抽出手段3が得たストロークコードが認識手段4に入力される。
【0007】認識手段4は、筆記者が手書きした文字を認識するものであり、以下、この認識手段4の機能について詳述する。
【0008】認識手段4は、まず、筆記された文字のストローク数(画数)を検出し、辞書5内のその画数に応じた画数辞書部を選択する。例えば、入力文字「沖」が筆記された場合には画数が7画であるので、7画で構成されている文字情報を格納している画数辞書部が選択される。
【0009】なお、辞書(以下、本発明との関係から固定辞書と呼ぶ)5には、標準文字について予め得た後述するようなパラメータの値が、文字の画数毎に固定的に格納されている。
【0010】認識手段4は、筆記文字に対する部分パターン間ベクトルを算出し、算出した部分パターン間ベクトルと、選択された画数辞書部に格納されている各文字の部分パターン間ベクトルとを照合する。そして、部分パターン間ベクトルの照合結果(マッチング距離)Vが閾値TH1より小さい文字に候補を絞り込む。同様に、認識手段4は、筆記文字に対するQ値を算出し、算出されたQ値と、候補としてまだ残っている各文字のQ値とを照合し、照合結果(マッチング距離)Qが閾値TH2より小さい文字に候補をさらに絞り込む。このような照合結果と閾値TH3との大小比較による絞り込みを、ストロークコード値の分布(照合結果をSとする)の面からも行なう。
【0011】そして、認識手段4は、残った候補文字に対してそれぞれ、(1) 式に従う総合マッチング距離値Dを求め、この値Dによって、残った候補文字の順位付けを行なう(候補を1個にすることも含む)。総合マッチング距離値Dが小さいものほど候補順位は高い。
【0012】
D=V+aQ+bS …(1) (但し、a及びbはそれぞれ画数によって定まる定数)ここで、部分パターン間ベクトルとは、筆記文字(例えば漢字)を、それを構成するブロックとして部首を基本とした部分パターンに分け、各部分パターンの重心をその筆記順序に従って結んだベクトルである。例えば、文字「沖」は、「さんずい」部分と「中」の部分とに分けられ、最初に筆記された「さいずい」部分の重心から次に筆記された「中」部分の重心を結ぶベクトルが部分パターン間ベクトルである。部分パターン間ベクトルは、文字「沖」について図3に示すように、x方向及びy方向の成分Xv及びYv(明細書においては図面と異なり、vを付与して表す)に分けて考えられる。
【0013】図4は、固定辞書5内の10画の画数辞書部の構成例を示したものである。この画数辞書部は、10画の各文字を構成する部分パターンのコードと、部分パターンに分けるための情報であるカット位置と、部分パターン間ベクトルとを格納している。カット位置は、筆記された入力文字をどのように部分パターンに分けるかを規定したものであり、例えば、カット位置の情報が(3,7)であるものは、筆記文字の3番目のストロークまでで1個の部分パターンとし、残りの7個のストロークの部分を他の部分パターンとすることを意味する。
【0014】入力文字の部分パターン間ベクトルをXv,Yvとし、固定辞書5に登録されている文字の標準部分パターン間ベクトルをXvd,Yvdとすると、マッチング距離は、|Xv−Xvd|+|Yv−Yvd|となる。一般に、筆記した文字の部分パターン数が複数の場合は、部分パターン数bで正規化を行ない、マッチング距離Vは、 V={Σ|Xvi−Xvdi|+|Yvi−Yvdi|}/(b−1)
…(2) となる(但し、総和Σはiが1〜b−1について)。
【0015】また、Q値は、筆記方向の変化分布を例えば部分パターンを単位に総合化した値であり、例えば各部分パターンについては16個の値Q1 〜Q16の組(部分パターンQ値;実施例の説明における部分パターンQ値も同じものを表している)で与えられる。例えば、漢数字「一」を筆記する場合、→方向に筆記し、←方向に筆記することはほとんどない。x方向の+方向成分が、x方向のどの位置に分布しているかをイメージ的な特徴で表した値がQ1 であり、各極点間のX,Y成分の長さと中心値の積和として定義されている。
【0016】ここで、図5(a)に示すように、左下部Oを原点とし、特徴点抽出手段2によって得られた各極点の座標をXj ,Yj (jは1〜n;jが1は始点、jがnは終点)とし、x方向及びy方向の文字幅をそれぞれHx ,Hy とすると、値Q1 〜Q8 は、次の(3) 式で表される。
【0017】
x(+)方向成分のx方向位置の加算値Q1 =Σ(Xj+1 −Xj )(Xj +Xj+1 )/2Hx x(−)方向成分のx方向位置の加算値Q2 =Σ(Xj −Xj+1 )(Xj +Xj+1 )/2Hx y(+)方向成分のy方向位置の加算値Q3 =Σ(Yj+1 −Yj )(Yj +Yj+1 )/2Hy y(−)方向成分のy方向位置の加算値Q4 =Σ(Yj −Yj+1 )(Yj +Yj+1 )/2Hy x(+)方向成分のy方向位置の加算値Q5 =Σ(Xj+1 −Xj )(Yj +Yj+1 )/2Hx Hy x(−)方向成分のy方向位置の加算値Q6 =Σ(Xj −Xj+1 )(Yj +Yj+1 )/2Hx Hy y(+)方向成分のx方向位置の加算値Q7 =Σ(Yj+1 −Yj )(Xj +Xj+1 )/2Hx Hy y(−)方向成分のx方向位置の加算値Q8 =Σ(Yj −Yj+1 )(Xj +Xj+1 )/2Hx Hy …(3) (但し、総和Σはjが1〜n−1について)また、図5(b)に示すような、右上部Oを原点とした座標系で同様な演算で求めた値がQ9 〜Q16である。
【0018】Q値の照合結果(マッチング距離値)Qは、各部分パターンの画数Kで重み付けを行ない、次の(4) 式で与えられる。
【0019】
Q=ΣΣ|Qdik −Qik|・Ki /N …(4) ここで、Qdik は、固定辞書5に格納されている文字のi(iは1〜b)番目の部分パターンの値Qk (kは1〜16)であり、Qikは、筆記文字のi番目の部分パターンの値Qk であり、Ki はi番目の部分パターンの画数であり、Nは総画数である。また、総和ΣΣは、部分パターンiと、Q値成分kとについてである。
【0020】図6は、固定辞書5内の部分パターン辞書部の構成例を示すものである。この図6に示すように、部分パターン辞書部は、部分パターン毎にQ値(部分パターンQ値)Q1 〜Q16が格納されている。どの部分パターンQ値Q1 〜Q16を取出すかは、上述した画数辞書部(図4参照)の部分パターンコードによる。なお、部分パターン辞書部には、ストロークコード値の照合結果Sを得る際に必要なストロークコード分布も格納されている。
【0021】ストロークコード値Sは、部分パターン毎にストロークコードの本数分布を求め、各部分パターンのマッチング結果を足し合わせたものである。例えば、ある入力文字の部分パターンの1個が3画であって、入力文字の部分パターンと辞書5の部分パターンのストロークコードが図7に示すような場合には、この部分パターンについてのマッチング結果Sは0+1+1+0で2となる。
【0022】以上詳述したようにして求められた部分パターン間ベクトルの照合結果V、Q値の照合結果Q、及び、ストロークコード値の照合結果Sを利用して、認識手段4は、上述のように候補文字を絞り込む。
【0023】
【発明が解決しようとする課題】以上のように、従来のオンライン文字認識装置においては、種々の観点からの値を総合的に考慮して認識率を高めるようにしている。
【0024】しかし、オンライン文字認識装置は手書き文字を対象としているため、筆記者の癖や、筆記者が誤って記憶している筆順等によっては認識率が低下する恐れがある。例えば、筆記者が筆順を誤って記憶している文字が筆記された場合にも、上述したカット位置の情報(図4参照)によって部分パターンに分けられる。すなわち、当該オンライン文字認識装置が意図している部分パターンと異なる部分パターンに分けられることがある。上述のように、認識の基本的パラメータである部分パターン間ベクル、Q値、ストロークコード値は、部分パターン毎の値を利用するものであるので、部分パターンへの分割が誤っていると、正しく文字認識を行なうことができない。
【0025】そのため、認識率の優れたオンライン文字認識装置を実現するためには、筆記者の癖による字形の違いや筆順誤りを緩和するような装置にしなければならない。筆記者の癖や筆順誤りを緩和する方法としては、筆記者が筆記した文字の情報を辞書に登録できるようにすることが考えられる。
【0026】ところで、従来のオンライン文字認識装置では、固定辞書5を図4及び図6に示すように、文字を構成するブロックとして部首を基本とした部分パターンに分けて各種情報を格納している。登録しようとして筆記された文字については、当然に固定辞書5を利用できないので、筆記された文字を部首を基本とした部分パターンに分けることができず、そのため、従来のオンライン文字認識装置では文字の登録機能を備えていない。
【0027】本発明は、以上の点を考慮してなされたものであり、辞書登録機能を備えたオンライン文字認識装置を提供しようとするものである。
【0028】
【課題を解決するための手段】かかる課題を解決するため、本発明のオンライン文字認識装置は、照合用情報を格納する固定辞書と、認識のために筆記された文字のストローク情報を筆記文字の部分パターン毎のパラメータに変換して、固定辞書の照合用情報と類似度判定を行い、筆記文字の固定辞書候補文字を認識し、認識した固定辞書候補文字を固定辞書から抽出する認識手段と、筆記文字を、固定辞書の格納情報を用いずに、下記に示した所定ルールRで分割部分パターンに分割する部分パターン自動分割手段と、登録のために筆記された文字のストローク情報と、部分パターン自動分割手段による分割部分パターンの情報とから、認識時に必要となる類似度判定用の分割部分パターン毎のパラメータを得る文字登録手段と、この文字登録手段で得られた分割部分パターン毎のパラメータを格納する登録辞書と、認識のために筆記された文字のストローク情報と、部分パターン自動分割手段による分割部分パターンの情報とから、分割部分パターン毎にパラメータを得て、登録辞書に格納されている対応情報との類似度判定を行い筆記文字の登録辞書候補文字を認識し、認識した登録辞書候補文字を抽出する登録文字認識手段と、認識手段が抽出した固定辞書候補文字と登録文字認識手段が抽出した登録辞書候補文字の中から1又は複数の候補文字を出力する出力手段とを有する。
【0029】なお、部分パターン自動分割手段が適用する所定ルールRは、以下の(1)〜(3)の分割方法を総画数に使い分けるものである
(1)低画数の文字に対しては1個のストロークをm個に分割する。
(2)中画数の文字に対しては総画数を筆順に従ってm個に分割する。
(3)高画数の文字に対しては総画数を筆順に従ってm画ずつ分割する。
ここで、部分パターン自動分割手段により固定辞書に情報を設定する文字を複数の分割部分パターンに分割し、文字のストローク情報と、部分パターン自動分割手段による分割部分パターンの情報とから、認識時に必要となる類似度判定用の部分パターン毎のパラメータを得て、固定辞書は作成されたものであり、認識手段は、認識のために筆記された文字のストローク情報と、部分パターン自動分割手段による分割部分パターンの情報とから、部分パターン毎のパラメータを得て、固定辞書に格納されている対応情報との類似度判定を行い筆記文字の固定辞書候補文字を認識し、認識した固定辞書候補文字を固定辞書から抽出することは好ましい。また、文字登録手段が、登録のために筆記された文字のストローク情報と、部分パターン自動分割手段による分割部分パターンの情報とから、認識手段が抽出した固定辞書候補文字と登録文字認識手段が抽出した登録辞書候補文字との優先順位を決定するための登録文字優先判定用閾値をも求めて、登録辞書に格納させると共に、登録辞書に格納されている対応情報に基づいて登録文字認識手段が得た筆記文字と登録文字との類似度と、登録文字優先判定用閾値とを比較して、認識手段が求めた固定辞書候補文字と登録文字認識手段が求めた登録辞書候補文字との優先順位を決定する優先順位判定手段を設け、出力手段が、上記優先順位調整手段が得た優先順位に従って候補文字を1又は複数出力することは好ましい。
【0030】この場合において、文字登録手段が、登録のために筆記された文字のストローク情報について得た分割部分パターン毎のパラメータと、その筆記された文字を所定角度だけ回転させた際のストローク情報について得た分割部分パターン毎のパラメータとの類似度を、登録文字優先判定用閾値とすることは好ましい。
【0031】
【作用】筆記文字のストローク情報を認識手段が筆記文字の部分パターン毎のパラメータに変換して、固定辞書の照合用格納内容と類似度判定することで筆記文字を認識するオンライン文字認識装置において、従来、文字登録機能を持たせることができなかった一番の理由は、登録のために筆記された文字を部分パターンにどのように分割すれば良いかが提案されていないためである。すなわち、固定辞書が不満足であるために登録が望まれているので、登録時には、固定辞書を利用できず、部分パターンへの分割が問題になっていた。
【0032】そこで、本発明では、筆記文字を、固定辞書の格納情報を用いずに、上述した所定ルールRで部分パターンに分割する部分パターン自動分割手段を設けた。このように、部分パターン自動分割手段を設けたことによって、部分パターンへの分割の問題が解決されると、文字登録手段、登録辞書、登録文字認識手段を設けることによって、文字登録機能を有するオンライン文字認識装置を容易に実現できる。
【0033】すなわち、文字登録手段は、登録のために筆記された文字のストローク情報と、部分パターン自動分割手段による分割部分パターンの情報とから、認識時に必要となる類似度判定用の分割部分パターン毎のパラメータを得て登録辞書に登録する。また、登録文字認識手段は、認識のために筆記された文字のストローク情報と、部分パターン自動分割手段による分割部分パターンの情報とから、分割部分パターン毎のパラメータを得て、登録辞書に格納されている対応情報との類似度判定を行なって筆記文字を認識する。
【0034】認識のために筆記された文字に対しては、認識手段が固定辞書を用いて求めた固定辞書候補文字と、登録文字認識手段が登録辞書を用いて求めた登録辞書候補文字とが得られ、出力手段はこれら候補文字の1又は複数を出力する。なお、従来は、固定辞書は、部首等で分割された部分パターンの情報を格納していたが、登録辞書との整合を考慮すると、登録辞書に格納する情報を得たと同じ方法で得た情報を固定辞書に格納し、認識手段も、登録文字認識手段と同じ方法で認識することが好ましい。オンライン文字認識装置に文字登録機能を持たせた場合、認識手段が固定辞書を用いて求めた固定辞書候補文字と、登録文字認識手段が登録辞書を用いて求めた登録辞書候補文字との間の優先順位が問題となる。
【0035】そこで、文字登録手段が、分割部分パターンのパラメータを求めて登録辞書に登録させる際に、認識手段が求めた固定辞書候補文字と登録文字認識手段が求めた登録辞書候補文字との優先順位を決定するための登録文字優先判定用閾値をも求めて、登録辞書に格納させるようにし、優先順位判定手段が、登録辞書に格納されている対応情報に基づいて登録文字認識手段が得た筆記文字と登録文字との類似度と、登録文字優先判定用閾値とを比較して、認識手段が抽出した固定辞書候補文字と登録文字認識手段が抽出した登録辞書候補文字との優先順位を決定するようにすることが好ましい。
【0036】登録文字の筆跡の特徴を活かしつつ筆跡の変動を予測、吸収できることに鑑みると、文字登録手段が、登録のために筆記された文字のストローク情報について得た分割部分パターン毎のパラメータと、その筆記された文字を所定角度だけ回転させた際のストローク情報について得た分割部分パターン毎のパラメータとの類似度を、登録文字優先判定用閾値とすることは好ましい。
【0037】
【実施例】(A)第1実施例以下、本発明によるオンライン文字認識装置の第1実施例を図面を参照しながら詳述する。ここで、図1がこの第1実施例のオンライン文字認識装置の機能ブロック構成を示すものであり、図2との同一、対応部分には同一符号を付して示している。
【0038】図1において、この第1実施例のオンライン文字認識装置も、タブレット(座標入力手段)1、特徴点抽出手段2及びストローク抽出手段3を備えている。また、第1実施例のオンライン文字認識装置は、認識手段4に代えて認識・登録手段4aを備え、固定辞書5(図4及び図6参照)に代えて別構成の辞書5aを備えている。さらに、第1実施例のオンライン文字認識装置は部分パターン自動分割手段7を備えている。
【0039】第1実施例のオンライン文字認識装置は、筆記文字の認識機能だけではなく、筆記文字の登録機能をも備えており、この登録機能を実現できるように、図2R>2に示した従来の構成とは異なるようになされている。
【0040】なお、実際上、特徴点抽出手段2、ストローク抽出手段3、認識・登録手段4a及び部分パターン自動分割手段7は、ソフトウェアによって構成されることが多い。
【0041】ストローク抽出手段3に至るまでの接続構成及び各部での処理は、従来と同様である。
【0042】すなわち、この第1実施例においても、タブレット1から時系列的に出力された座標データから、特徴点抽出手段2はストロークの始点、終点、屈曲点等の特徴を表す座標データ(極点座標データ)を抽出し、このようにして抽出された1ストローク分の座標データから、ストローク抽出手段3は各ストロークを分類して予め決められているストロークコードを付与するようになされている。
【0043】タブレット1、特徴点抽出手段2及びストローク抽出手段3は、当該オンライン文字認識装置が登録モードでも認識モードでも機能するものであり、上述の処理を行なう。なお、図示は省略するが、登録モードか認識モードかは、例えばメニューボタンによって選択できるようになされている。
【0044】部分パターン自動分割手段7は、登録モードでも認識モードでも機能するものであり、筆記文字を部分パターンに自動的に分割するものである。なお、特許請求の範囲では、部分パターン自動分割手段が分割して得た部分パターンを分割部分パターンと表現している(他の実施例に関しても同様)。部分パターン自動分割手段7は、まず筆記された文字の画数を検出し、その画数に応じて、以下のような所定ルールに従って部分パターンに分割する。すなわち、筆記文字の部首を考慮することなく分割を行なう。
【0045】部分パターン自動分割手段7が採用する分割ルールは、以下に例示したいずれであっても良い。
【0046】(1)低画数の文字に対しては1個のストロークをm個に分割する。
【0047】(2)総画数を筆順に従ってm個に分割する。
【0048】(3)総画数を筆順に従ってm画ずつ分割する。
【0049】(4)上記(1)〜(3)の分割方法を総画数に応じて使い分ける。
【0050】ここで、分割ルール(4)について、具体的な例を挙げれば、(i) 総画数が1画の文字に対しては1個のストロークを始点から終点への座標列の中間の座標点で2分割し、(ii)総画数が2〜6画の場合には総画数を筆順に従って3分割し(なお、2画の場合は座標列に基づいて3分割し、3画以上の場合にはストローク単位に3分割する)、(iii) 総画数が7画以上の場合には総画数を筆順に従って3画ずつ分割する。
【0051】但し、このようにストロークの途中で分割を行なう場合は、極点座標データではなく、元のXY座標データを用いる。
【0052】このような分割ルールに従う場合において、筆記文字が1画の「2」であれば、図8(a)に示すように中間座標点に基づいて2分割され、筆記文字が5画の「本」であれば、図8(b)に示すように2画、2画、1画に3分割され、筆記文字が10画の「株」であれば、図8(c)に示すように、基本的には3画ずつで3画より少ない残った画数部分はその画数で、すなわち3画、3画、3画、1画に4分割される。このような各分割パターンが部分パターンとなる。
【0053】認識・登録手段4aは、登録モードでも認識モードでも機能するものである。まず、認識・登録手段4aの登録モードでの動作を説明する。
【0054】当該オンライン文字認識装置が登録モードのときには、部分パターン自動分割手段7が分割して得た部分パターンの情報が、特徴点抽出手段2が抽出した各ストロークの座標データやストローク抽出手段3が分類したストロークコードの情報と共に、認識・登録手段4aに与えられる。
【0055】認識・登録手段4aは、入力された情報を処理し、認識処理で必要となる部分パターン毎のパラメータを得て辞書5a内の登録辞書部5a2に格納させる。この第1実施例の場合、求める部分パターン毎のパラメータを、部分パターン間ベクトル、部分パターンQ値(Q1 〜Q16)及び部分パターンストロークコード分布とする。これらパラメータは、部分パターン自動分割手段7が分割して得た部分パターン毎に求められるという点では従来とは異なるが、従来のオンライン文字認識装置が認識時に求めると同様な処理によって求められる。
【0056】登録文字に対しては、部分パターンが部首等に無関係に決定されるので、辞書5aの登録辞書5a2を従来装置の固定辞書5(図4及び図6参照)と同様な構成にすることはできない。そのため、図9に例示するように、各文字毎に、部分パターン間ベクトル、部分パターンQ値(Q1 〜Q16)及び部分パターンストロークコード分布を持たせる構成となる。この他、検索が容易になるように総画数等の情報を持たせる。
【0057】なお、登録時には、登録モードを指示し、登録しようとする文字の情報(例えばJISコード)を入力し、その後、タブレット1に筆記することを行なうように、ユーザに予め指示しておく。
【0058】この第1実施例の場合、辞書5aの固定辞書部5a1も、従来装置の辞書5(図4及び図6参照)と異なる構成を有する(なお、同じでも良いが)。辞書5aの固定辞書部5a1は、画数毎に分けられている点は従来装置の辞書5と同様であるが、各文字毎に、部分パターン間ベクトル、部分パターンQ値(Q1 〜Q16)及び部分パターンストロークコード分布を持たせる構成を有し、この点では、登録辞書部5a2と同様な構成を有する。
【0059】すなわち、この第1実施例においては、固定辞書部5a1を形成する際にも、部分パターン自動分割手段7が行なう部分パターンへの分割方法を採用して、格納する各種パラメータを得るようにしている。
【0060】認識・登録手段4aは、当該オンライン文字認識装置が認識モードでは、従来の認識手段4とほぼ同様な動作を行なう。すなわち、辞書の情報を利用した部分パターンの分割を行なわず、部分パターン自動分割手段7が分割した部分パターンの情報を利用する点を除き、従来の認識手段4とほぼ同様な動作を行なう。
【0061】認識・登録手段4aは、特徴点抽出手段2が抽出した各ストロークの座標データと、ストローク抽出手段3が分類したストロークコードの情報と、部分パターン自動分割手段7が分割した部分パターンの情報と、辞書5aの格納内容とから、従来と同様な方法により認識を行なう。このようにして得られた筆記文字に対する候補文字の情報は、出力端子6を介して外部装置(例えば表示装置)に与えられる。
【0062】より具体的に説明すると、認識・登録手段4aは、筆記文字の総画数に基づいて、固定辞書部5a1及び登録辞書部5a2に格納されている文字のうち候補にできるものを絞り込んだ後、部分パターン自動分割手段7が分割して得た部分パターンの情報、特徴点抽出手段2が抽出した各ストロークの座標データ、ストローク抽出手段3が分類したストロークコードの情報に基づいて、筆記文字についての部分パターン間ベクトル、部分パターンQ値(Q1 〜Q16)及び部分パターンストロークコード分布を求めながら、従来の認識手段4が実行すると同様にして、固定辞書部5a1及び登録辞書部5a2に格納されている文字とのマッチングを行ない(上記(1) 式参照)、総合マッチング距離値Dが小さいものほど高い候補順位を付与する。
【0063】従って、上記第1実施例によれば、部分パターン自動分割手段7を設けて、辞書(固定辞書)を参照しないでも筆記文字を部分パターンに分割できるようにしたので、登録機能をオンライン文字認識装置に持たせることができるようになった。その結果、固定辞書だけでは認識率が低くなるような筆記者の癖や筆順の記憶違いの文字をも、登録機能を使うことで高い認識率にし得る。
【0064】(B)第2実施例次に、本発明によるオンライン文字認識装置の第2実施例を図面を参照しながら詳述する。ここで、図10がこの第2実施例のオンライン文字認識装置の機能ブロック構成を示すものであり、図1、図2との同一、対応部分には同一符号を付して示している。
【0065】図10において、この第2実施例のオンライン文字認識装置も、従来装置と同様に、タブレット(座標入力手段)1、特徴点抽出手段2、ストローク抽出手段3、認識手段4及び固定辞書5を備えている。これに加えて、第2実施例のオンライン文字認識装置は、部分パターン自動分割手段7、文字登録手段8、登録辞書9及び登録文字認識・優先順位調整手段10を備えている。
【0066】なお、実際上、特徴点抽出手段2、ストローク抽出手段3、認識手段4、部分パターン自動分割手段7、文字登録手段8及び登録文字認識・優先順位調整手段10は、ソフトウェアによって構成されることが多い。
【0067】第1実施例では、固定辞書部5a1をも新たに構成したものであるが、固定辞書を新たに形成することは大変であるので、この第2実施例では、従来装置の固定辞書5をそのまま用いている。
【0068】ストローク抽出手段3に至るまでの接続構成及び各部での処理は、従来と同様である。
【0069】すなわち、この第2実施例においても、タブレット1から時系列的に出力された座標データから、特徴点抽出手段2はストロークの始点、終点、屈曲点等の特徴を表す座標データ(極点座標データ)を抽出し、このようにして抽出された1ストローク分の座標データから、ストローク抽出手段3は各ストロークを分類して予め決められているストロークコードを付与するようになされている。タブレット1、特徴点抽出手段2及びストローク抽出手段3は、当該オンライン文字認識装置が登録モードでも認識モードでも機能するものであり、上述の処理を行なう。
【0070】また、この第2実施例の部分パターン自動分割手段7も、第1実施例の部分パターン自動分割手段7と同一の動作を行なう。
【0071】当該オンライン文字認識装置が登録モードのときには、部分パターン自動分割手段7が分割して得た部分パターンの情報が、特徴点抽出手段2が抽出した各ストロークの座標データやストローク抽出手段3が分類したストロークコードの情報と共に、文字登録手段8に与えられる。
【0072】文字登録手段8は、入力された情報を処理し、認識処理で必要となる部分パターン毎のパラメータを得て登録辞書9に格納させる。この第2実施例の場合も、求める部分パターン毎のパラメータを、部分パターン間ベクトル、部分パターンQ値(Q1 〜Q16)及び部分パターンストロークコード分布である。これらパラメータは、部分パターン自動分割手段7が分割して得た部分パターン毎に求められるという点では従来とは異なるが、従来のオンライン文字認識装置が認識時に求めると同様な処理によって求められる。
【0073】第1実施例と同様に、登録文字に対しては、部分パターンが部首等に無関係に決定されるので、登録辞書9を固定辞書5(図4及び図6参照)と同様な構成にすることはできず、この第2実施例の登録辞書9も、上述した図9に例示するように、各文字(JISコード)毎に、部分パターン間ベクトル、部分パターンQ値(Q1 〜Q16)及び部分パターンストロークコード分布を持たせる構成を有し、この他、検索が容易になるように総画数等の情報を有する。
【0074】なお、登録時には、登録モードを指示し、登録しようとする文字の情報(例えばJISコード)を入力し、その後、タブレット1に筆記することを行なうように、ユーザに予め指示しておく。
【0075】認識手段4は、当該オンライン文字認識装置が認識モードで機能するものであり、従来と同様な動作を行なうものである。すなわち、部分パターン自動分割手段7が分割した部分パターンの情報は利用しないで、認識手段4は、特徴点抽出手段2が抽出した各ストロークの座標データと、ストローク抽出手段3が分類したストロークコードの情報と、辞書5の格納内容とから、従来と同様な方法により認識を行なう。このようにして得られた筆記文字に対する候補文字の情報は、登録文字認識・優先順位調整手段10に与えられる。
【0076】登録文字認識・優先順位調整手段10も、当該オンライン文字認識装置が認識モードで機能するものである。
【0077】登録文字認識・優先順位調整手段10には、部分パターン自動分割手段7が分割して得た部分パターンの情報、特徴点抽出手段2が抽出した各ストロークの座標データ、ストローク抽出手段3が分類したストロークコードの情報が与えられる。登録文字認識・優先順位調整手段10は、総画数に基づいて、登録辞書9に格納されている文字を絞り込んだ後、部分パターン自動分割手段7が分割して得た部分パターンの情報、特徴点抽出手段2が抽出した各ストロークの座標データ、ストローク抽出手段3が分類したストロークコードの情報に基づいて、筆記文字についての部分パターン間ベクトル、部分パターンQ値(Q1 〜Q16)及び部分パターンストロークコード分布を求めながら、認識手段4が実行すると同様にして、登録辞書9に格納されている文字とのマッチングを行ない(上記(1) 式参照)、登録辞書9に筆記文字が登録されているか否か、登録されていると捕えられる文字が複数あればその候補順位を決定する。
【0078】そして、登録文字認識・優先順位調整手段10は、認識手段4が得た1以上の候補文字と、登録辞書9に登録されていた1以上の候補文字との出力順序を決定して出力端子6から次の装置(例えば表示装置)に出力する。
【0079】ここで、常に、認識手段4が得た候補文字を登録辞書9とのマッチングで得た候補文字より優先させても良く、また、登録辞書9とのマッチングで得た候補文字を認識手段4が得た候補文字より優先させても良い。さらに、この第2実施例の場合には、登録文字についても総合マッチング距離値D(上記(1) 式参照)が得られるので、両者の候補文字を、総合マッチング距離値Dで順位付けを行なうようにしても良い。
【0080】従って、この第2実施例によっても、部分パターン自動分割手段7を設けて、辞書を参照しないでも筆記文字を部分パターンに分割できるようにしたので、登録機能をオンライン文字認識装置に持たせることができるようになった。しかも、第2実施例によれば、既存の固定辞書5は、そのまま用いることができる。
【0081】(C)第3実施例次に、本発明によるオンライン文字認識装置の第3実施例を図面を参照しながら詳述する。ここで、図11がこの第3実施例のオンライン文字認識装置の機能ブロック構成を示すものであり、図10との同一、対応部分には同一符号を付して示している。
【0082】この第3実施例は、第2実施例と比較して、文字登録手段8に代えて文字登録・閾値設定手段8aが設けられている点、及び、登録辞書9a及び登録文字認識・優先順位調整手段10aの処理が異なっている。
【0083】この第3実施例においては、文字登録・閾値設定手段8aに、少なくとも部分パターン自動分割手段7が分割して得た部分パターンの情報と特徴点抽出手段2が抽出した各ストロークの座標データが与えられる。
【0084】文字登録・閾値設定手段8aは、部分パターンの情報と各ストロークの座標データとから、筆記文字の総画数、部分パターン毎のQ値(Q1 〜Q16)、及び、登録文字優先判定用閾値を求めて登録辞書9aに、文字情報(登録モードの指示と併せて入力されたJISコード)に対応させて格納させる。図12は、この第3実施例での登録辞書9aの構成を示すものである。
【0085】文字登録・閾値設定手段8aが、筆記文字の総画数及び部分パターン毎のQ値(Q1 〜Q16)を求める方法は、従来と同様であり、その説明は省略する(Q値成分については(3) 式参照)。
【0086】この第3実施例においては、登録文字に対する認識処理は、総画数を除けば、部分パターン毎のQ値(Q1 〜Q16)だけで行なうようにしている。これは、固定辞書5は不特定多数の筆記者を対象としているので、多くの観点(パラメータ)から認識する必要があるが、登録文字に対しては登録した筆記者だけを対象にすれば良いので、認識のためのパラメータが少なくても高い認識率で認識できること、及び、このようにすると、登録辞書9aの必要容量を削減できると共に、文字登録・閾値設定手段8a及び登録文字認識・優先順位調整手段10aの処理量を削減できることに鑑みてなされている。
【0087】登録文字優先判定用閾値は、登録辞書9aに格納されていた候補文字を固定辞書5に格納されていた候補文字より高い順位で出力させるのか、固定辞書5に格納されていた候補文字を登録辞書9aに格納されていた候補文字より高い順位で出力させるのかを判定させるための情報であり、登録文字認識・優先順位調整手段10aが利用するものである。
【0088】文字登録・閾値設定手段8aは、入力された座標データXj ,Yj から部分パターンQ値(これは登録辞書9aに登録されるものであり、Qd1〜Qd16 で表す)を求め、また、登録文字の筆跡の特徴を活かしつつ筆跡の変動を予測、吸収するために、各座標データXj ,Yj を角度θだけ回転させて得られた座標データXθj ,Yθj から部分パターンQ値(以下、q1 〜q16で表す)を求め、もとの座標データXj ,Yj から求められた部分パターンQ値Qd1〜Qd16 と、回転させた座標データXθj ,Yθj から求められた部分パターンQ値q1 〜q16とのマッチング距離値を登録文字優先判定用閾値kとする。
【0089】図13は、各座標データXj ,Yj を角度θだけ回転させても、登録文字の筆跡の特徴を残って筆跡の変動を予測、吸収できることの説明図である。
【0090】回転前後の座標データXj ,Yj 及びXθj ,Yθj には、周知のように(5)式に示す関係がある。また、上述のように求められる登録文字優先判定用閾値kは、式で表すと(6) 式の通りである。
【0091】
Xθj =Xj ・cos θ−Yj ・sin θ Yθj =Xj ・sin θ+Yj ・cos θ …(5) k=ΣΣ|Qdik −qik| …(6) (総和ΣΣは、部分パターンi(1〜b)と、部分パターンQ値k(1〜16)とについてである)なお、低画数の文字では筆跡の変動が大きいので、閾値kを大きくして良く、例えば、1画の文字に対してはθを30度、2画以上の文字に対してはθを20度にするようにしても良い。また、筆記者がθを任意に選定できるようにしても良い。
【0092】従って、この第3実施例の登録文字認識・優先順位調整手段10aは、以下のように動作する。
【0093】登録文字認識・優先順位調整手段10aには、部分パターン自動分割手段7が分割して得た部分パターンの情報、及び、特徴点抽出手段2が抽出した各ストロークの座標データが与えられる。登録文字認識・優先順位調整手段10aは、総画数に基づいて、登録辞書9aに格納されている文字を絞り込んだ後、部分パターン自動分割手段7が分割して得た部分パターンの情報、及び、特徴点抽出手段2が抽出した各ストロークの座標データに基づいて、筆記文字についての部分パターンQ値(Q1 〜Q16)を求め、その後、登録辞書9aに格納されている文字の部分パターンQ値(Qd1〜Qd16 )とのマッチング距離値Qを求め、このマッチング距離値Qを候補にできるか否かの閾値TH2と比較し、候補文字になり得るものに対してはさらに登録文字優先判定用閾値kと比較する。勿論、マッチング距離値Qが小さいものほど優先順位を高くする。
【0094】そして、登録文字認識・優先順位調整手段10aは、認識手段4が得た1以上の候補文字と、登録辞書9に登録されていた1以上の候補文字との出力順序を決定して出力端子6から次の装置(例えば表示装置)に出力する。この際、登録文字優先判定用閾値kより小さい登録文字に対しては、認識手段4が得た候補文字より高い優先順位で出力し、登録文字優先判定用閾値kより大きい登録文字に対しては、認識手段4が得た候補文字より低い優先順位で出力する。
【0095】従って、この第3実施例によっても、第2実施例と同様な効果を得ることができる。これに加えて、第3実施例によれば、登録辞書9aには、Q値と総画数とを登録して候補文字を得るようにしたので、登録文字に対する認識処理を第2実施例より高速に実行できる。また、第3実施例によれば、登録辞書9aに、登録文字優先判定用閾値kも格納し、登録文字の優先性を判定できるようにしたので、文字登録機能を持たせても出力順位を適切にできる。
【0096】(D)他の実施例認識処理に供するパラメータとして、第1及び第2実施例では、部分パターン間ベクトル、部分パターンQ値及び部分パターンストロークコード分布のものを示し、第3実施例では、部分パターンQ値だけのものを示したが、部分パターン間ベクトル及び部分パターンQ値や、部分パターンQ値及び部分パターンストロークコード分布のような2個のパラメータ等であっても良い。
【0097】上記第3実施例においては、登録文字優先判定用閾値kを座標データの回転処理を利用して求めるものを示したが、他の方法で求めるようにしても良い。例えば、総画数によって固定的に決定するようにしても良い。また、例えば、登録辞書(登録辞書部)に格納する部分パターン毎のパラメータが、部分パターン間ベクトル、部分パターンQ値及び部分パターンストロークコード分布である装置であれば、登録文字優先判定用閾値kを、回転座標データと元の座標データとの総合マッチング距離値で求めるようにしても良い。さらに、登録用に筆記された文字の座標データ等から求めた部分パターンQ値と、その登録用筆記文字に対して固定辞書を用いた認識処理を実行させて得た第1候補の文字について固定辞書に格納されている部分パターンQ値とのマッチング距離値を、登録文字優先判定用閾値kとしても良い。請求項の表現は、このような種々の場合をも含むものとする。
【0098】
【発明の効果】以上のように、本発明によれば、筆記文字を、固定辞書の格納情報を用いずに、筆順に対する所定ルールで分割部分パターンに分割する部分パターン自動分割手段と、登録のために筆記された文字のストローク情報と、部分パターン自動分割手段による分割部分パターンの情報とから、認識時に必要となる類似度判定用の分割部分パターン毎のパラメータを得る文字登録手段と、この文字登録手段で得られた分割部分パターン毎のパラメータを格納する登録辞書と、認識のために筆記された文字のストローク情報と、部分パターン自動分割手段による分割部分パターンの情報とから、分割部分パターン毎のパラメータを得て、登録辞書に格納されている対応情報との類似度判定を行い筆記文字の登録辞書候補文字を認識し、認識した登録辞書候補文字を登録辞書から抽出する登録文字認識手段とを設けたので、文字登録機能を有するオンライン文字認識装置を実現できる。
【図面の簡単な説明】
【図1】第1実施例の構成を示すブロック図である。
【図2】従来の構成を示すブロック図である。
【図3】部分パターン間ベクトルの説明図である。
【図4】固定辞書の画数辞書部の説明図である。
【図5】部分パターンQ値の算出方法の説明図である。
【図6】固定辞書の部分パターン辞書部の説明図である。
【図7】ストロークコードマッチングの説明図である。
【図8】第1実施例の部分パターンへの分割方法の説明図である。
【図9】第1実施例の登録辞書の説明図である。
【図10】第2実施例の構成を示すブロック図である。
【図11】第3実施例の構成を示すブロック図である。
【図12】第3実施例の登録辞書の説明図である。
【図13】第3実施例の登録文字優先判定用閾値の算出方法の説明図である。
【符号の説明】
1…タブレット、2…特徴点抽出手段、3…ストローク抽出手段、4…認識手段、5…固定辞書、5a1…固定辞書部、5a2…登録辞書部、7…部分パターン自動分割手段、8…文字登録手段、8a…文字登録・閾値設定手段、9、9a…登録辞書、10、10a…登録文字認識・優先順位調整手段。

【特許請求の範囲】
【請求項1】 照合用情報を格納する固定辞書と、認識のために筆記された文字のストローク情報を筆記文字の部分パターン毎のパラメータに変換して、上記固定辞書の照合用情報と類似度判定を行い、筆記文字の固定辞書候補文字を認識し、認識した固定辞書候補文字を固定辞書から抽出する認識手段と、筆記文字を、上記固定辞書の格納情報を用いずに、下記に示した所定ルールRで分割部分パターンに分割する部分パターン自動分割手段と、登録のために筆記された文字のストローク情報と、上記部分パターン自動分割手段による分割部分パターンの情報とから、認識時に必要となる類似度判定用の分割部分パターン毎のパラメータを得る文字登録手段と、上記文字登録手段で得られた分割部分パターン毎のパラメータを格納する登録辞書と、認識のために筆記された文字のストローク情報と、上記部分パターン自動分割手段による分割部分パターンの情報とから、分割部分パターン毎のパラメータを得て、上記登録辞書に格納されている対応情報との類似度判定を行い筆記文字の登録辞書候補文字を認識し、認識した登録辞書候補文字を登録辞書から抽出する登録文字認識手段と、上記認識手段が抽出した固定辞書候補文字と上記登録文字認識手段が抽出した登録辞書候補文字の中から1又は複数の候補文字を出力する出力手段とを有することを特徴とするオンライン文字認識装置。所定ルールRは、以下の(1)〜(3)の分割方法を総画数に使い分けるものである。(1)低画数の文字に対しては1個のストロークをm個に分割する。
(2)中画数の文字に対しては総画数を筆順に従ってm個に分割する。
(3)高画数の文字に対しては総画数を筆順に従ってm画ずつ分割する。
【請求項2】 上記部分パターン自動分割手段により上記固定辞書に情報を設定する文字を複数の分割部分パターンに分割し、文字のストローク情報と、上記部分パターン自動分割手段による分割部分パターンの情報とから、認識時に必要となる類似度判定用の部分パターン毎のパラメータを得て、上記固定辞書は作成されたものであり、上記認識手段は、認識のために筆記された文字のストローク情報と、上記部分パターン自動分割手段による分割部分パターンの情報とから、部分パターン毎のパラメータを得て、上記固定辞書に格納されている対応情報との類似度判定を行い筆記文字の固定辞書候補文字を認識し、認識した固定辞書候補文字を固定辞書から抽出することを特徴とする請求項1に記載のオンライン文字認識装置。
【請求項3】 上記文字登録手段が、登録のために筆記された文字のストローク情報と、上記部分パターン自動分割手段による分割部分パターンの情報とから、上記認識手段が抽出した固定辞書候補文字と上記登録文字認識手段が抽出した登録辞書候補文字との優先順位を決定するための登録文字優先判定用閾値をも求めて、上記登録辞書に格納させると共に、上記登録辞書に格納されている対応情報に基づいて上記登録文字認識手段が得た筆記文字と登録文字との類似度と、上記登録文字優先判定用閾値とを比較して、上記認識手段が抽出した固定辞書候補文字と上記登録文字認識手段が抽出した登録辞書候補文字との優先順位を決定する優先順位調整手段を設け、上記出力手段が、上記優先順位調整手段が得た優先順位に従って候補文字を1又は複数出力することを特徴とする請求項1又は2に記載のオンライン文字認識装置。
【請求項4】 上記文字登録手段が、登録のために筆記された文字のストローク情報について得た分割部分パターン毎のパラメータと、その筆記された文字を所定角度だけ回転させた際のストローク情報について得た分割部分パターン毎のパラメータとの類似度を、上記登録文字優先判定用閾値としたことを特徴とする請求項3に記載のオンライン文字認識装置。

【図1】
image rotate


【図2】
image rotate


【図3】
image rotate


【図4】
image rotate


【図5】
image rotate


【図7】
image rotate


【図6】
image rotate


【図12】
image rotate


【図13】
image rotate


【図8】
image rotate


【図9】
image rotate


【図10】
image rotate


【図11】
image rotate


【特許番号】特許第3095599号(P3095599)
【登録日】平成12年8月4日(2000.8.4)
【発行日】平成12年10月3日(2000.10.3)
【国際特許分類】
【出願番号】特願平5−319565
【出願日】平成5年12月20日(1993.12.20)
【公開番号】特開平7−175889
【公開日】平成7年7月14日(1995.7.14)
【審査請求日】平成9年1月20日(1997.1.20)
【出願人】(000000295)沖電気工業株式会社 (6,645)
【参考文献】
【文献】特開 平3−62186(JP,A)