手書き文字認識装置

【発明の詳細な説明】
【０００１】
【産業上の利用分野】本発明は手書き文字を動的計画法を用いて認識させる手書き文字認識装置に関する。
【０００２】
【従来の技術】従来から文字認識装置において、入力文字パターンを認識するための手法として比較的簡単で有効な方法であるパターンマッチング法が用いられていた。このパターンマッチング法では、入力文字パターンと予め登録された複数の標準文字パターンとの間の累積距離（相違度）を求め、最も累積距離の小さい標準パターンの属するカテゴリを認識結果とする方法である。文字認識装置の一般的なパターンマッチング方法としては、動的計画法が用いられてきた。動的計画法では手書きによりストローク単位に入力した文字を、ある定められたデータ列に変換し、その変換されたデータ列と予め登録されている複数の標準パターン文字のデータ列とを比較する。そしてそのうち最も累積距離（相違度）の小さいパターンを認識結果として出力していた。詳しい内容については例として、文一総合出版社から出版されている「パターン認識と学習のアルゴリズム（Ｐ９１〜Ｐ１０８）」を参照されたい。
【０００３】動的計画法の計算には以下の漸化式を用いる。
【０００４】
g(i,j) = d(i,j) + min{g(i-1,j),g(i,j-1),g(i-1,j-1)} (1) g(i,0) = d(0,0) + d(1,0) + ・・・+ d(imax,0) (2) g(0,j) = d(0,0) + d(0,1) + ・・・+ d(0,jmax) (3)ここで、入力パターンＡと標準パターンＢをベクトルの部分列で表わす。
【０００５】
A = a0,a1,a2,a3,・・・ai,・・・,aimax (4)B = b0,b1,b2,b3,・・・bj,・・・,bjmax (5)aiは入力パターンＡを構成するi番目の部分ベクトルであり、同様にbjは標準パターンＢを構成するj番目の部分ベクトルである。(1)式のg(i,j)は、図４（ａ）に示すように、iを横軸、jを縦軸にとった場合の各格子点における入力パターンＡと標準パターンＢとのパターンマッチングの演算結果を意味している。d(i,j)はaiとbjとの距離‖ai-bj‖である。g(i,j)は(1)式からわかるように、g(i-1,j)とg(i,j-1)とg(i-1,j-1)の中で最小値を求めた値とd(i,j)との関係から成り立っており、距離d(i,j)の累積距離を表わしている。(2)(3)式は、(1)式の初期値を求める式である。これら漸化式から最小値を求めることは、図４（ｂ）における３方向から逐次計算をすることを意味している。また、図４（ｂ）の■はg(i-1,j)、■はg(i-1,j-1)、■はg(i,j-1)の漸化式に相当する。これら■■■の最小値を選択して(1)式のg(i,j)を求め、パターンの最終ベクトルにたどり着くまでの経路をグラフに表わすことができる。例として図４（ａ）にg(i,j)のパターンマッチングの最小累積距離となる経路を示す。この経路は、パターンマッチングする入力パターンＡと標準パターンＢの部分ベクトル列の内容により変化する。
【０００６】次に、図面を用いて従来の文字認識装置を説明する。図３はその原理を示すブロック図である。タブレット等から書き込まれた手書き文字のイメージデータがストローク単位で手書き文字入力部１０に入力される。入力した手書き文字のストロークは、データ列変換部２０においてストロークの特徴を抽出し、ある定められたベクトル列データに変換される。そしてこのベクトル列はパターン距離演算部７０に送られ、動的計画法を用いて標準パターン文字辞書４０との間で累積距離が求められる。その結果標準パターン文字辞書４０の中で最も累積距離の小さい標準パターン文字を、認識結果とした。パターン距離演算部７０では、上記(1)の漸化式が用いられ、累積距離が計算される。
【０００７】
【発明が解決しようとする課題】ところで、従来の文字認識装置には以下の問題点がある。タブレット等で書き込まれた手書き文字のイメージデータの中には、ノイズ成分が含まれている場合が多く、イメージデータの書き始めの部分に乗ることが多い。このノイズの発生原因としては、タブレット等のハードウエアの性能に依存することが多い。また、手書き文字は書き込む人各々によって異なり癖がある。そのため、ノイズ以外にハネ、おさえや同一文字でも書き込む人により大小様々な文字の部分的な変形が発生する。そしてそれらは特に手書き文字の書き始めや書き終わりの部分に発生しやすい。その結果、データ列変換部２０においてノイズ成分やハネ、おさえや大小様々な文字の部分的な変形が手書き文字のストロークの特徴点として抽出され、ベクトル列として変換されていた。また、標準パターン文字辞書４０には、手書き文字は楷書で書き込まれることを前提とした標準的なパターンが予め登録されていた。そしてパターン距離演算部７０では、ノイズ成分やハネ、おさえや大小様々な文字の部分変形の部分ベクトルを含んだ部分ベクトル列と、それらを含まない標準的なパターンを予め登録してある標準パターン文字辞書４０との間で累積距離演算を行なっていた。そのため楷書で書き込まれた入力パターンの部分ベクトル列の累積距離よりも部分変形した入力パターンの部分ベクトルが加えられただけ累積距離が大きくなり、手書き文字入力者の意図しない別の標準パターン文字との累積距離が最小となってしまった。その結果、誤認識の割合が増加してしまったと言う問題を含んでいた。また、この誤認識を減らすために標準パターン文字辞書４０内に部分的に変形した標準パターン文字を新たに追加登録する方法で対処することができる。しかし、パターン距離演算部７０では標準パターン文字辞書４０内の全ての標準パターン文字との間の累積距離を計算するため、標準パターン文字を登録すればするほど計算時間が長くなってしまう。その結果文字認識速度が遅くなり装置全体の使い勝手が低下してしまうことと、標準パターン文字辞書４０のメモリ容量が増加してハードウエアのコストを増加させてしまうと言う問題を含んでいた。
【０００８】
【課題を解決するための手段】上記課題を解決するために、第１の手書き文字認識装置は、手書き文字のイメージデータをストローク単位に入力する手書き文字入力部と、前記手書き文字入力部に入力した前記ストロークの特徴をある定められたデータ列に変換するデータ列変換部と、ある定められたデータ列を標準パターンとして複数登録してある標準パターン文字辞書と、前記データ列変換部で変換された前記データ列と複数の前記標準パターンとを演算処理によりマッチングをとるパターンマッチング部とを有し、前記パターンマッチング部は前記データ列と複数の前記標準パターンとの距離を動的計画法を用いて演算し累積距離を求める累積距離演算手段と、前記データ列変換部で変換された前記データ列と前記標準パターン文字辞書のパターンとから始点近傍パターンに存在してもしなくてもよいパターンである不確定パターン領域を検出する始点不確定パターン領域検出手段と、前記累積距離を累積せず固定とする距離固定手段とを有し、前記始点不確定パターン領域検出手段で不確定パターン領域であることが検出されると、前記不確定パターン領域の前記累積距離を前記距離固定手段を用いて固定とし、前記不確定パターン領域の周辺から前記累積距離演算手段を用いて前記累積距離を求めることを特徴とする。また、第２の発明の手書き文字認識装置は、手書き文字のイメージデータをストローク単位に入力する手書き文字入力部と、前記手書き文字入力部に入力した前記ストロークの特徴をある定められたデータ列に変換するデータ列変換部と、ある定められたデータ列を標準パターンとして複数登録してある標準パターン文字辞書と、前記データ列変換部で変換された前記データ列と複数の前記標準パターンとを演算処理によりマッチングをとるパターンマッチング部とを有し、前記パターンマッチング部は前記データ列と複数の前記標準パターンとの距離を動的計画法を用いて演算し累積距離を求める累積距離演算手段と、前記データ列変換部で変換された前記データ列と前記標準パターン文字辞書のパターンとから終点近傍パターンに存在してもしなくてもよいパターンである不確定パターン領域を検出する終点不確定パターン領域検出手段と、前記距離の前記累積距離への寄与を減少させる減衰手段とを有し、前記終点不確定パターン領域検出手段で不確定パターン領域であることが検出されると、前記減衰手段を用いて前記累積距離を求めることを特徴とする。
【０００９】また、第１および第２の手書き文字認識装置は、手書き文字のストロークの特徴をある定められたデータ列に変換したデータ列と複数の標準パターンとの距離を動的計画法を用いて演算し、前記データ列の始点不確定パターン領域では距離固定手段を用いて累積距離を０とし、終点不確定パターン領域では減衰手段を用いて前記距離を０とすることを特徴とする。
【００１０】
【作用】第１の発明の手書き文字認識装置によれば、入力部に手書き文字のイメージがストローク単位に入力される。入力されたストロークデータはデータ列変換部である定められたデータ列に変換される。その後ある定められたデータ列に変換された入力ストロークのデータ列と全ての標準パターンとの間で、累積距離演算手段を用いて累積距離を求める。その際、始点不確定パターン領域検出手段で不確定パターン領域が検出されると、不確定パターン領域の累積距離を、距離固定手段で累積せず固定する。そして、全ての標準パターン文字の中で累積距離が最小となる標準パターン文字を認識文字とする。
【００１１】第２の発明の手書き文字認識装置によれば、入力部に手書き文字のイメージがストローク単位に入力される。入力されたストロークデータはデータ列変換部である定められたデータ列に変換される。その後ある定められたデータ列に変換された入力ストロークのデータ列と全ての標準パターンとの間で、累積距離演算手段を用いて累積距離を求める。その際、終点不確定パターン領域検出手段で不確定パターン領域が検出されると、不確定パターン領域の入力ストロークデータ列と標準パターンとの距離の累積距離への寄与を減衰手段で減少させる。そして、全ての標準パターン文字の中で累積距離の最小となる標準パターン文字を認識文字とする。
【００１２】また、第１および第２の手書き文字認識装置は、始点不確定パターン領域検出手段または終点不確定パターン領域検出手段により不確定パターン領域が検出されると、始点不確定パターン領域内では距離固定手段により累積距離を０とし、終点不確定パターン領域内では減衰手段により距離を０として累積距離を求める。
【００１３】
【実施例】以下、第１の発明の手書き文字認識装置および第２の発明の手書き文字認識装置の実施例について添付図面を参照して説明する。
【００１４】本実施例では不確定パターン領域として、標準パターンを構成する部分ベクトル列のｂｉｔ６またはｂｉｔ７がセットされた部分ベクトルと、入力パターンの最初または最後の部分ベクトルとの間で距離を求める場合の領域とする。また不確定パターン領域での距離は０とした。
【００１５】図１は、第１および第２の発明の手書き文字認識装置の実施例の構成を示すブロック図である。同図より、手書き文字認識装置には、手書き文字を書き込むためのタブレット１１およびぺン１２、タブレット１１から送られてくる手書き文字のイメージをストローク単位に取り込み、取り込んだストロークを部分ベクトル列に変換し認識結果を出力するまでを制御するプログラムが組み込まれた読み出し専用の認識プログラムメモリ１００、認識プログラムメモリ１００にはタブレット１１から時系列的に順次入力される手書き文字の座標データをストローク単位にサンプリングする処理や、サンプリングしたストロークの位置及び大きさを縮小したり拡大して正規化する処理等を行なう前処理２１、前処理２１で得られたストロークデータは、ストロークの始点、終点、そしてストロークの屈曲している点等を演算処理により算出し取り出し、取り出した点をストロークの特徴点とするストローク特徴点抽出２２、ストローク特徴点抽出２２で取り出された特徴点を図５（ａ）に示す１６方向ベクトルで直線近似化するベクトル化２３、後述する標準パターン文字辞書４０に予め登録してある全ての標準パターンとベクトル化２３で１６方向ベクトル列化されたストロークの特徴点との間で累積距離を求める累積距離演算手段３１と、標準パターン文字辞書４０に予め登録してある標準パターンの部分ベクトル中に存在してもしなくてもよい不確定パターンがあり、かつ入力した１６方向ベクトル列の最初または最後の部分ベクトルでの距離計算であるのかを検出する始点不確定パターン領域検出手段３２および終点不確定パターン領域検出手段３３と、始点不確定パターン領域検出手段３２で不確定パターン領域が検出されると、不確定パターン領域での距離を累積せずに固定する距離固定手段３４と、終点不確定パターン領域検出手段３３で不確定パターン領域が検出されると、不確定パターン領域内の距離の累積距離への寄与を減少させる減衰手段３５とからなるプログラムである。そしてこれらの手段を用いて全ての標準パターンとの間の累積距離を求め、累積距離の最小となった標準パターン文字辞書４０内の標準パターンを認識結果とする。バッファメモリ８０は、タブレット１１で取り込んだ手書き文字の座標データや、認識プログラムメモリ１００等で一時的にデータを記憶させておくときのためのメモリである。標準パターン文字辞書４０は、複数の標準パターン文字のシフトＪＩＳコードと、そのパターンを構成する１６方向部分ベクトル列で構成され、読みだし専用メモリ内に納められている。ＣＰＵ９０は、文字認識装置全体を制御する。ディスプレイ５０は、手書き文字のイメージデータや書き込むための複数の情報を表示したり、認識プログラムメモリ１００で認識された認識文字等を表示する。なお、ディスプレイ５０とタブレット１１は、一体化された構造になっている。
【００１６】次に第１および第２の実施例の処理の流れについて、図２の（ａ）（ｂ）を用いて説明する。
【００１７】まず、図２の（ａ）の概念図を用いて、第１の実施例の処理の流れを説明する。手書き文字入力部１０に入力された手書き文字のイメージデータが座標データとしてデータ列変換部２０に送られ、座標データのサンプリング、特徴抽出、１６方向部分ベクトル列化等の処理が行なわれる。そしてデータ列変換部２０で部分ベクトル列化された手書き文字のイメージデータがパターンマッチング部３０に送られる。パターンマッチング部３０では、入力した１６方向部分ベクトル列と全ての標準パターン文字辞書４０内の標準パターンとの間の累積距離を累積距離演算手段３１で計算する。ここで始点不確定パターン領域検出手段３２において、標準パターン文字辞書４０内の標準パターンの部分ベクトル列中に、存在してもしなくてもよい不確定パターンがあり、かつ入力した部分ベクトル列の最初の部分ベクトルとの間の距離計算であることが検出されると、距離固定手段３４から距離を０とする指令が出される。そしてその距離の値０を累積距離とする。このようにして全ての標準パターン文字辞書４０内の標準パターンとの累積距離を求める。そして一番累積距離の小さい標準パターンのシフトＪＩＳコードが手書き文字のイメージデータの認識結果となり、そのシフトＪＩＳコードが文字に変換されディスプレイ５０に表示される。
【００１８】次に、図２の（ｂ）の概念図を用いて、第２の実施例の処理の流れを説明する。手書き文字入力部１０に入力された手書き文字のイメージデータが座標データとしてデータ列変換部２０に送られ、座標データのサンプリング、特徴抽出、１６方向部分ベクトル列化等の処理が行なわれる。そしてデータ列変換部２０で部分ベクトル列化された手書き文字のイメージデータがパターンマッチング部３０に送られる。パターンマッチング部３０では、入力した１６方向部分ベクトル列と標準パターン文字辞書４０内の標準パターンとの間の累積距離を累積距離演算手段３１で計算する。ここで終点不確定パターン領域検出手段３３において、標準パターン文字辞書４０内の標準パターンの部分ベクトル列中に、存在してもしなくてもよい不確定パターンがあり、かつ入力した部分ベクトル列の最後の部分ベクトルとの間の距離計算であることが検出されると、減衰手段３５から距離を０とする指令が出される。そしてその距離の値０を累積距離とする。このようにして全ての標準パターン文字辞書４０内の標準パターンとの累積距離を求める。そして一番累積距離の小さい標準パターンのシフトＪＩＳコードが手書き文字のイメージデータの認識結果となり、そのシフトＪＩＳコードが文字に変換されされディスプレイ５０に表示される。
【００１９】次に、各処理ごとの動作について図８および図９の全体の処理の流れと対応させながら説明する。図８および図９は認識プログラムメモリ１００内の処理の流れを示したフロチャートである。この処理は装置に電源が投入されると処理がスタートし、電源が切られるまでこの処理を続ける。まず、手書き文字入力部１０では、手書き文字のイメージデータをぺン１２を用いてタブレット１１に書き込むと、書き込まれた手書き文字のイメージデータの軌跡が、タブレット１１上の座標データに変換される。この座標データには、タブレット１１に書き込まれた手書き文字イメージデータの他に、ぺン１２がタブレット１１に接したこと（以下ペンダウンと呼ぶ）および離れたこと（以下ペンアップと呼ぶ）を示す監視データが含まれている。そしてイメージデータと監視データは、お互いに区別することができるデータの構成になっている。
【００２０】データ列変換部２０では、タブレット１１の座標データを前処理２１でサンプリングし（ステップ１１１）、サンプリングした座標データからペンダウンしたのかを判断する（ステップ１１２）。ペンダウンでない場合にはステップ１１１に戻りたタブレット１１の座標データを再びサンプリングする。ペンダウンした場合には、ペンアップするまでタブレット１１に書き込まれた手書き文字の座標データをサンプリングする（ステップ１１２、１１３）。ステップ１１１とステップ１１３でサンプリングされた座標データはバッファメモリ８０に転送され、後の処理で再び読み込まれ使用される。ペンアップになるとストローク数がカウントアップされ、サンプリングした座標データと対応させた状態でバッファメモリ８０に転送される（ステップ１１５）。その後タブレット１１に再び手書き文字が書き込まれるのかを判断するためにディレイタイマーが働き、ここで設定された時間を経過してもタブレット１１に書き込みが無い場合は、手書き文字の入力が終了したと判断する（ステップ１１６、１１７、１１８、１２０）。ディレイ時間を経過する前にペンダウンが確認されると、ディレイタイマーをストップさせ（ステップ１１９）、再びタブレット１１の座標データのサンプリングを開始する（ステップ１１１に戻る）。ディレイ時間を経過してペンダウンでないことが確認されると、タブレット１１に書き込まれた手書き文字の大きさを一定にするために、サンプリングしてバッファメモリ８０に記憶させておいた座標データを正規化する（ステップ１２１）。正規化された座標データは、ストローク特徴点抽出２２において、ストロークごとにデータ列の中から特徴点となる始終点や屈曲点を演算処理により抽出される（ステップ１２２、図６）。そして抽出した特徴点をベクトル化２３において、１６方向のベクトル（図５（ａ））で直線近似する（ステップ１２３）。ストロークの特徴点および１６方向でベクトル化された部分ベクトル列は、バッファメモリ８０に転送され記憶されている。
【００２１】次にパターンマッチング部３０では、バッファメモリ８０に記憶されている１６方向部分ベクトル列と標準パターン文字辞書４０との間で、動的計画法を用いて距離を計算する。パターンマッチング部３０は、距離を計算し累積距離を求める累積距離演算手段３１と、標準パターンの中に存在してもしなくてもよい不確定パターンがあるのかを確認し、かつ入力した１６方向部分ベクトル列の最初または最後の部分ベクトルに対して距離を計算するのかを確認する始点不確定パターン領域検出手段３２および終点不確定パターン領域検出手段３３と、始点不確定パターン領域検出手段３２で不確定パターン領域を検出すると、不確定パターン領域内の距離を０として累積距離を求める距離固定手段３４と、終点不確定パターン領域検出手段３３で不確定パターン領域を検出すると、不確定パターン領域内の距離を０として累積距離を求める減衰手段３５とによって構成されている（ステップ１２４）。これらパターンマッチング部３０の処理の流れについて図１０〜図１２のフロチャートを用いて説明する。累積距離演算手段３１では前述の漸化式(1)を用いて計算する。まず累積距離演算手段３１では、入力パターンＡと標準パターンＢの累積距離g(i,j)の初期値として、g(0,0)を求める（ステップ１３０、１３１）。次に、g(1,0)から入力パターンＡの最終部分ベクトル（aimax）までの標準パターンＢの部分ベクトルb0との累積距離を求める（ステップ１３２、１３３、１３４、１３５）。同様に、g(0,1)から標準パターンＢの最終部分ベクトル（bjmax）までの入力パターンＡの部分ベクトルa0との累積距離を求める（ステップ１３６、１３７、１３８、１３９）。そして、g(1,1)から入力パターンＡの最終部分ベクトル（aimax）および標準パターンＢの最終部分ベクトル（bjmax）までの各々の部分ベクトルの格子点における累積距離を求める（ステップ１４０、１４１、１４２、１４３、１４４、１４５）。
【００２２】また、各々の格子点における累積距離を求めるときに始点不確定パターン領域検出手段３２、終点不確定パターン領域検出手段３３、距離固定手段３４および減衰手段３５を用いており、その処理内容を図１２のフロチャートに示す。これは、図１０および図１１のフロチャートにおいてサブルーチン化されている「距離計算」（ステップ１３１、１３３、１３７、１４１）に相当する。図１２では、始点不確定パターン領域検出手段３２および終点不確定パターン領域検出手段３３がステップ１４６および１４８に相当し、距離固定手段３４および減衰手段３５がステップ１４９および１５１に相当し、累積距離演算手段３１がステップ１４７、１５２に相当する。ステップ１５０は累積距離の初期値であるg(0,0)を演算するときの判断に用いる。まず、標準パターンＢの部分ベクトルのｂｉｔ６またはｂｉｔ７がセットされているのかを確認する。セットされている場合には入力パターンＡの部分ベクトルがa0またはaimaxとの間での距離計算を実行しようとしているのかを確認する（ステップ１４６、１４８）。ｂｉｔ６は標準パターンＢの部分ベクトルが終点不確定パターン領域を示すビットで、ｂｉｔ７は始点不確定パターン領域を示すビットで、入力パターンＡの部分ベクトル列中に存在してもしなくてもよい不確定なパターンであることを表わしている。ｂｉｔ６またはｂｉｔ７が標準パターンＢの部分ベクトルにセットされていて、かつ入力パターンＡの部分ベクトルがa0またはaimaxで距離を計算する場合は、距離d(i,j)の値をを０にセットする（ステップ１４９）。そして更にその距離d(i,j)を累積距離g(i,j)としてセットする（ステップ１５１）。ｂｉｔ６またはｂｉｔ７がセットされていない場合、またはセットされていても入力パターンＡの部分ベクトルがa0またはaimax以外では、距離d(i,j)に‖ai-bj‖をセットする（ステップ１４７）。そして累積距離の初期値g(0,0)を求める計算であるのかを確認する（ステップ１５０）。初期値g(0,0)を求める場合はステップ１５１に進み、それ以外はステップ１５２に進み累積距離を計算する。このようにして求められた累積距離g(i,j)の最短距離を示す経路の例を図１３に示す。横軸は入力パターンＡ、縦軸は標準パターンＢで、標準パターンＢの部分ベクトルb0、b1およびbjmax-1、bjmaxは不確定パターンとして登録されている。図１３で太線で囲った領域は、始点不確定パターン領域検出手段３２および終点不確定パターン領域検出手段３３でそれぞれ始点領域または終点領域で不確定パターンであることが検出され、距離固定手段３４または減衰手段３５により距離d(i,j)の値を０として累積距離を求めた領域である。すなわちこの太線で囲った領域内では累積距離が０となる。従って、入力パターンＡの部分ベクトルa0またはaimaxが如何なるベクトルであっても標準パターンＢの部分ベクトルb0,b1またはbjmax-1,bjmaxと一致していることとなる。その結果、太線で囲った不確定パターン領域内における標準パターンＢの部分ベクトルb0,b1またはbjmax-1,bjmaxが入力パターンＡの最初または最後の部分ベクトルに存在してもしなくても、距離d(i,j)は０で固定される。よって、入力パターンＡと標準パターンＢとの累積距離演算を開始する際において、始点不確定パターン領域の周辺である(a0,b2),(a1,b0),(a1,b1),(a1,b2)の何れかの格子点から累積距離演算を開始しても、始点不確定パターン領域内のg(0,0)から計算を開始した場合と等価になる。また、終点不確定パターン領域内では距離が全て０となり累積距離も０となる。従って累積距離演算を終了させる際において、終点不確定パターン領域の周辺である(aimax,bjmax-2),(aimax-1,bjmax-2),(aimax-1,bjmax-1),(aimax-1,bjmax)の何れかの格子点で終了しても、累積距離演算の最終であるg(imax,jmax)で終了した場合と等価になる。
【００２３】では、図６の手書き文字入力部１０に入力したサンプルを用い、パターンマッチング部３０について説明する。図６は手書き文字「て、ｈ、ｂ」を入力し、データ列変換部２０で１６方向部分ベクトル列に変換されるまでを示した図である。パターンマッチング部３０に部分ベクトル列が引き渡されるときには、１６方向の部分ベクトル列（１６進表示）の数値で引き渡される。各々のデータが１６方向化された１本の部分ベクトルを表わしている。また、図６の（ａ）は手書き文字の始点と終点にハネやおさえの含まれたサンプルの一例である。また、図６の（ｂ）（ｃ）は「ｈ」を筆記体とブロック体で書き込んだ手書き文字、（ｄ）は「ｂ」をブロック体で書き込んだ手書き文字のサンプルの一例である。図７の（ｃ）は標準パターン文字辞書４０を構成する辞書の一部を示した図で、標準パターン文字のシフトＪＩＳコード（１６進表示）と１６方向ベクトル列で表現された部分ベクトル列（１６進表示）からなる。ここで、例として図６の（ｂ）（ｃ）の「ｈ」をパターンマッチング部３０で累積距離を計算することとする。標準パターン文字辞書４０の「ｈ」には、図６（ｃ）のブロック体で書かれた「ｈ」の形をした文字のみが標準パターンとして登録されているものとして累積距離を計算してみる。その結果、筆記体「ｈ」は始点付近と終点付近の部分ベクトル列の中に、ブロック体「ｈ」には存在しない部分ベクトルがあるため、その存在しない部分ベクトルの距離だけ筆記体「ｈ」の累積距離が大きくなる。従って、同じ小文字の「ｈ」ではあるが累積距離が異なる。よって、ブロック体の「ｈ」は標準パターン文字の「ｈ」との累積距離が０となり最小となるが、筆記体「ｈ」は「ｈ」以外の標準パターン文字との累積距離が最小となる可能性が高くなる。しかし、図６（ｂ）（ｃ）の「ｈ」文字の形に着目すると、文字全体としては形は異なるが、図６（ｂ）の筆記体文字の書き始めの部分と書き終わりの部分を取り去るとブロック体で書かれた図６（ｃ）と類似した形となる。図７（ａ）にその過程を示す。筆記体で書かれた手書き文字「ｈ」は、図７R>７（ａ）の点線で示す部分を削除することで、ブロック体で書かれた手書き文字「ｈ」と類似した形にすることができる。このことから筆記体で書かれた「ｈ」は、ブロック体で書かれた「ｈ」の形を基本として、始点付近と終点付近の形が部分的に変形した文字として扱うことができる。よって図６の（ｂ）（ｃ）の文字は、図７（ａ）の書き始めの点線部分の部分ベクトルを始点不確定パターンとし、書き終わりの点線部分の部分ベクトルを終点不確定パターンとして標準パターン文字辞書４０に登録することで、始点不確定パターン領域検出手段３２または終点不確定パターン領域検出手段３３により不確定パターン領域として検出することが可能となる。そして、標準パターンとの距離は始点不確定パターン領域では距離固定手段３４で０となり、終点不確定パターン領域では減衰手段３５で０となるため、図７（ａ）の点線部分の入力パターンは存在してもしなくても筆記体およびブロック体「ｈ」の累積距離は同じになる。従って、図６（ｂ）（ｃ）の文字は不確定パターンを登録した標準パターン文字「ｈ」を介することで、１つの同じ標準パターン文字を最小累積距離として計算することができる。図７（ｃ）に不確定パターンを登録した標準パターン文字辞書４０の構成を示す。「ｈ」では、１６方向部分ベクトル列の中で「８１、８１、８１、８７、８８（１６進データ）」が始点不確定パターンとして登録したパターンで、「４１、４２（１６進データ）」が終点不確定パターンとして登録したパターンである。「て」においては「８７（１６進データ）」と「４４（１６進データ）」とがそれぞれ始点不確定パターンと終点不確定パターンである。また、図１４（ａ）に図６（ｂ）の筆記体で書かれた「ｈ」と、不確定パターンを登録した標準パターンである図７（ｃ）の「ｈ」との累積距離である漸化式(1)のg(i,j)の演算結果の経路を示す。図１４（ｂ）も同様に、図６（ｃ）と図７（ｃ）の「ｈ」とのg(i,j)の演算結果の経路を示した図である。図１４（ａ）と（ｂ）において、太線で囲った領域は始点または終点不確定パターン領域を示す。始点不確定パターン領域では、距離固定手段３４により各格子点の距離d(i,j)が０となるため、累積距離g(i,j)は０で固定される。また、終点不確定パターン領域では減衰手段３５により入力パターンと標準パターンの部分ベクトル間の距離d(i,j)が如何なる値であっても距離d(i,j)は０となる。その結果、図１４（ｂ）の終点不確定パターン領域内の距離のように、実際に求められた標準パターンと入力パターンの部分ベクトル間の距離より小さい距離となる。最終的な累積距離g(i,j)は、図１４（ａ）では入力パターン「２」と標準パターン「４２」とのg(i,j)であり、図１４（ｂ）では入力パターン「ｂ」と標準パターン「４２」との累積距離g(i,j)を求めることである。そしてそれら累積距離を求めると０となる。従って、図７（ｃ）の「ｈ」の標準パターンを登録することで、図６（ｂ）（ｃ）の筆記体およびブロック体「ｈ」は同じ文字としてマッチングすることができる。
【００２４】次に、入力パターンにブロック体の「ｈ」と類似した形の図６（ｄ）のブロック体「ｂ」を入力し、不確定パターンを登録した標準パターンに図７（ｃ）「ｈ」との間の累積距離を求めてみる。図１５が漸化式(1)のg(i,j)の演算結果の経路を示した図である。パターンマッチング部３０の累積距離演算手段３１において、始点不確定パターン領域と終点不確定パターン領域の距離d(i,j)は距離固定手段３４または減衰手段３５により０となる。しかし、入力パターン「ｂ」の中の最後から２番目の部分ベクトル「９」が標準パターンの中に存在しないため、入力パターン「９」と標準パターン「４１」との累積距離g(i,j)の演算結果は「８」となる。その結果、最終的な累積距離g(i,j)の演算結果である入力パターン「８」と標準パターン４２」との累積距離は「２」となる。従って、不確定パターンを登録した「ｈ」の標準パターンと入力パターン「ｂ」との間で累積距離を求めると、図７（ｂ）のブロック体「ｂ」の文字における点線部分が不確定パターンとして登録したパターンと異なる。よって、前述のように不確定パターンとして登録した筆記体の「ｈ」を入力したときよりも累積距離が大きくなる。従って、「ｈ」と「ｂ」のように形の類似している文字に対しては同じ累積距離にならず、「ｈ」と「ｂ」を区別することができる。
【００２５】次に、ハネとおさえを含んだ文字例である図６（ａ）の「て」についてパターンマッチング部３０で累積距離を求めてみる。ハネやおさえは入力パターンの最初の部分ベクトルまたは最後の部分ベクトルに含まれることが多い。ハネやおさえが含まれた部分ベクトル列で累積距離を計算すると、ハネやおさえの部分ベクトルだけ累積距離が増加してしまう。そこで、標準パターンの最初の部分ベクトルおよび最後の部分ベクトルを不確定パターンとして登録しておくことで、ハネやおさえの部分ベクトルを削除することができる。これは、パターンマッチング部３０では入力パターンの最初または最後の部分ベクトルは不確定パターン領域では、距離固定手段３４または減衰手段３５により距離が０となるからである。従って、ハネやおさえに影響されない標準パターンとの間の累積距離を求めることができる。
【００２６】このようにしてパターンマッチング部３０では、標準パターン文字辞書４０に予め登録してある全ての標準パターンとの間で累積距離を求め、その結果をバッファメモリ８０に転送する。
【００２７】その後バッファメモリ８０に記憶させてあった累積距離値の中から、最小となる累積距離を示した標準パターン文字辞書４０内の標準パターンのシフトＪＩＳコードを文字に変換する（ステップ１２５）。そして、変換した文字を認識結果としてディスプレイ５０上に表示する（ステップ１２６）。
【００２８】なお、図１２ステップ１４９、１５１の距離固定手段３４が実行される条件として、標準パターンの部分ベクトルのｂｉｔ６またはｂｉｔ７がセットされていて、かつ入力パターンＡの部分ベクトルの範囲をa0またはaimaxの時の距離d(i,j)を求める場合に限定したが（ステップ１４８）、入力パターンＡの部分ベクトルの範囲を１つに限定することなく複数の部分ベクトルにまで範囲を拡大することができ、入力パターンＡの部分ベクトルの範囲を可変することができる。
【００２９】また、本実施例では不確定パターン領域が検出されると距離固定手段３４で距離d(i,j)を０としたが（図１２のステップ１４９）、入力パターンＡと標準パターンＢとの部分ベクトル間の距離‖ai-bj‖を用いてもよい。
【００３０】また、上記のように距離d(i,j)に部分ベクトル間の距離‖ai-bj‖の値を用いる場合、終点不確定パターン領域内では減衰手段３５において、距離‖ai-bj‖の値に０より大きく１より小さい範囲での定数を掛け合わせ、距離‖ai-bj‖を減少させた値を用いてもよい。
【００３１】また、データ列変換部２０においてストロークの特徴点を１６方向でベクトル化したが、図５（ｂ）に示す８方向ベクトルを用いてもよい。
【００３２】
【発明の効果】以上のように本発明によれば、手書き文字の部分的に変形した文字の大小に関わらず、変形していない文字として扱うことができ、精度の高い認識を行なうことができる。また、標準パターンに部分変形していない文字の他に部分変形している文字までを登録する必要が無く、１または数個の標準パターンで累積距離演算をすることができることで累積距離演算時間が短くなり、スピーディーで快適な認識環境が実現でき、更に標準パターンのメモリサイズをコンパクトな容量にすることができる。
【図面の簡単な説明】
【図１】本発明の手書き文字認識装置の構成を示すブロック図。
【図２】本発明の手書き文字の処理の流れを示す概略図。
【図３】従来の手書き文字認識装置の処理の流れを示す概略図。
【図４】動的計画法によるパターンマッチングの原理を説明するための図。
【図５】手書き文字をベクトル列化するための方向図。
【図６】手書き文字入力部とデータ列変換部の処理結果を示す図。
【図７】部分変形した手書き文字と不確定パターンを登録した標準パターン文字辞書内の構成を説明する図。
【図８】認識プログラムメモリの処理の流れを示すフロチャート。
【図９】認識プログラムメモリの処理の流れを示すフロチャート（図８のつづき）。
【図１０】パターンマッチング部の処理の流れを示すフロチャート。
【図１１】パターンマッチング部の処理の流れを示すフロチャート（図１０のつづき）。
【図１２】始点不確定パターン領域検出手段、終点不確定パターン領域検出手段、距離固定手段および減衰手段の処理の流れを示すフロチャート。
【図１３】パターンマッチング部の動的計画法によるパターンマッチングを説明するための図。
【図１４】部分変形した文字と部分変形していない文字の累積距離演算経路を説明するための図。
【図１５】類似文字の累積距離演算経路を説明するための図。
【符号の説明】
１０手書き文字入力部
２０データ列変換部
３０パターンマッチング部
３１累積距離演算手段
３２始点不確定パターン領域検出手段
３３終点不確定パターン領域検出手段
３４距離固定手段
３５減衰手段
４０標準パターン文字辞書

【特許請求の範囲】
【請求項１】手書き文字のイメージデータをストローク単位に入力する手書き文字入力部と、前記手書き文字入力部に入力した前記ストロークの特徴をある定められたデータ列に変換するデータ列変換部と、ある定められたデータ列を標準パターンとして複数登録してある標準パターン文字辞書と、前記データ列変換部で変換された前記データ列と複数の前記標準パターンとを演算処理によりマッチングをとるパターンマッチング部とを有し、前記パターンマッチング部は前記データ列と複数の前記標準パターンとの距離を動的計画法を用いて演算し累積距離を求める累積距離演算手段と、前記データ列変換部で変換された前記データ列と前記標準パターン文字辞書のパターンとから始点近傍パターンに存在してもしなくてもよいパターンである不確定パターン領域を検出する始点不確定パターン領域検出手段と、前記累積距離を累積せず固定とする距離固定手段とを有し、前記始点不確定パターン領域検出手段で不確定パターン領域であることが検出されると、前記不確定パターン領域の前記累積距離を前記距離固定手段を用いて固定とし、前記不確定パターン領域の周辺から前記累積距離演算手段を用いて前記累積距離を求めることを特徴とする手書き文字認識装置。
【請求項２】手書き文字のイメージデータをストローク単位に入力する手書き文字入力部と、前記手書き文字入力部に入力した前記ストロークの特徴をある定められたデータ列に変換するデータ列変換部と、ある定められたデータ列を標準パターンとして複数登録してある標準パターン文字辞書と、前記データ列変換部で変換された前記データ列と複数の前記標準パターンとを演算処理によりマッチングをとるパターンマッチング部とを有し、前記パターンマッチング部は前記データ列と複数の前記標準パターンとの距離を動的計画法を用いて演算し累積距離を求める累積距離演算手段と、前記データ列変換部で変換された前記データ列と前記標準パターン文字辞書のパターンとから終点近傍パターンに存在してもしなくてもよいパターンである不確定パターン領域を検出する終点不確定パターン領域検出手段と、前記距離の前記累積距離への寄与を減少させる減衰手段とを有し、前記終点不確定パターン領域検出手段で不確定パターン領域であることが検出されると、前記減衰手段を用いて前記累積距離を求めることを特徴とする手書き文字認識装置。
【請求項３】手書き文字のストロークの特徴をある定められたデータ列に変換したデータ列と複数の標準パターンとの距離を動的計画法を用いて演算し、前記データ列の始点不確定パターン領域では距離固定手段を用いて累積距離を０とし、終点不確定パターン領域では減衰手段を用いて前記距離を０とすることを特徴とする、請求項１および請求項２記載の手書き文字認識装置。

【図３】

【図１】

【図５】

【図１３】

【図２】

【図４】

【図６】

【図７】

【図８】

【図９】

【図１０】

【図１１】

【図１５】

【図１２】

【図１４】

【特許番号】特許第３１２５４３２号（Ｐ３１２５４３２）
【登録日】平成１２年１１月２日（２０００．１１．２）
【発行日】平成１３年１月１５日（２００１．１．１５）
【国際特許分類】

物理学 (1,541,580)
- 計算；計数 (381,677)
  - データの認識；データの表示；記録担体；記録担体の取扱い (36,900)
    - 印刷文字，手書き文字または幾何学図形の読取りまたは認識のための... (2,623)
      - 電子的手段を用いる認識のための方法または装置 (781)

【出願番号】特願平４−１０６９０２
【出願日】平成４年４月２４日（１９９２．４．２４）
【公開番号】特開平５−３０３６６６
【公開日】平成５年１１月１６日（１９９３．１１．１６）
【審査請求日】平成１１年４月２２日（１９９９．４．２２）
【出願人】（０００００２３６９）セイコーエプソン株式会社 (51,324)
【参考文献】
【文献】特開昭６０−２４３７８２（ＪＰ，Ａ）
【文献】特開昭６４−６５６７９（ＪＰ，Ａ）
【文献】特開平３−４８９８５（ＪＰ，Ａ）
【文献】特開平１−２５３０７８（ＪＰ，Ａ）

[ Back to top ]

手書き文字認識装置

メニュー

スポンサーリンク

次の公報 »

« 前の公報

手書き文字認識装置

メニュー

スポンサー リンク

次の公報 »

« 前の公報

スポンサーリンク