説明

パターン選択装置、パターン選択方法、およびプログラム

【課題】候補パターンの偏りを防ぎ、効率的でバランスの良い候補パターンの選択を可能とする
【解決方法】本実施形態のパターン選択装置は、第1のパターン群と第1のパターンの評価に用いられる第2のパターン群とを格納した記憶部と、第2のパターンを参照して、第1のパターンの複数の評価値として、第1のパターンが第2のパターンをパターン認識する際の貢献度である第1の評価値と、第1のパターンが、第1のパターンが所属するクラスにおける標準的なパターンであるかを評価する第2の評価値、および第1のパターンがクラスの境界付近のパターンであるかを評価する第3の評価値を算出する評価値算出部と、算出された評価値と評価値ごとの重み付け情報とを用いて、第1のパターンごとのスコアを算出するスコア算出部と、算出されたスコアに基づいて第1のパターンからパターンを選択するパターン選択部と、を備える。

【発明の詳細な説明】
【技術分野】
【0001】
本実施形態は、パターン選択装置、パターン選択方法、およびプログラムに関する
【背景技術】
【0002】
光学式文字認識装置(OCR)に代表される文字認識処理など、認識システムに入力された文字、画像、音声などの未知パターンの所属クラスを特定するパターン認識技術がある。このパターン認識技術では、認識辞書を用いて未知のパターンの所属クラスを識別する。なお、クラスとは認識対象を分類した場合につけられるラベルのことであり、例えば文字認識であれば字種となるし、一般物体認識であればその物体の名称となる。
【0003】
認識辞書は、あらかじめクラス毎に辞書に使用するパターン(以下、辞書パターンという)を用意して作成する。パターン認識技術において認識精度を上げたい場合、一般的にクラスごとに用意される辞書パターンの数を増加させることが行われる。
【0004】
しかしながら、この方法には辞書パターンが大量になるため認識辞書の作成に時間がかかること、辞書パターンに認識精度の向上にさほど有効でないパターンが含まれてしまう場合があること、などの問題がある。また、例えばknn法のような辞書パターン、あるいはその一部を認識辞書とする手法を用いた場合には認識辞書の容量が大きくなりやすく、認識処理の速度が低下するという問題もある。
【0005】
効率的なパターン認識を実現できる認識辞書に用いる辞書パターンを選択する方法として、例えばサポートベクターマシン(Support Vector Machine:SVM)がある。この手法においては、クラス境界付近の辞書パターンのみが選択されて認識辞書となり、それ以外のパターンは削除される。言い換えれば、クラス境界の表現に必要な辞書パターンのみ認識辞書に登録することで必要な辞書パターン数を削減している。
【0006】
しかしながら、上述の方法では、クラス境界から離れた部分について考慮されていないため、標準的なパターンに対して必ずしも高い確信度が得られないなどの問題が生じることが知られている。また、例えば手書き文字認識などのばらつきの多い問題に適用した場合、クラス境界付近のパターンの比率が高いために削減率が低くなることが多い。
【0007】
また、例えばベクトル量子化などを行い、各クラスを少数の代表パターンで表現することにより辞書パターン数を削減する方法も知られている。
【0008】
この方法では辞書パターン数を大きく削減できるが、文字認識であれば例えば癖字や異体字など少数の例外的なパターンが削減されやすいため、このような入力に対して脆弱であるという問題がある。
【0009】
また、辞書パターンから有効ではないと思われるパターンを人手で削除することも行われているが、特に辞書パターン数が膨大な場合に作業時間が長くなる、選別基準が明確でないため作成される認識辞書にばらつきが出る、などといった点が問題となる。
【先行技術文献】
【特許文献】
【0010】
【特許文献1】特開2000−99723号公報
【発明の概要】
【発明が解決しようとする課題】
【0011】
本発明が解決しようとする課題は、効率的にパターンを選択することができるパターン選択装置、パターン選択方法、およびパターン選択プログラムの提供をすることである。
【課題を解決するための手段】
【0012】
本実施形態のパターン選択装置は、第1のパターン群と第1のパターンの評価に用いられる第2のパターン群とを格納した記憶部と、第2のパターンを参照して、第1のパターンの複数の評価値として、第1のパターンが第2のパターンをパターン認識する際の貢献度である第1の評価値と、第1のパターンが、第1のパターンが所属するクラスにおける標準的なパターンであるかを評価する第2の評価値、および第1のパターンがクラスの境界付近のパターンであるかを評価する第3の評価値を算出する評価値算出部と、算出された評価値と評価値ごとの重み付け情報とを用いて、第1のパターンごとのスコアを算出するスコア算出部と、算出されたスコアに基づいて第1のパターンからパターンを選択するパターン選択部と、を備える。
【図面の簡単な説明】
【0013】
【図1】第1の実施形態に係るパターン選択装置の全体構成を示すブロック図。
【図2】第1の実施形態に係る候補パターン情報の一例を示す図。
【図3】第1の実施形態に係るパターン選択装置の動作の一例を示すフローチャート。
【図4】第1の実施形態に係る評価値算出部における評価値の算出手順の一例を示すフローチャート。
【図5】第1の実施形態に係る評価用パターン情報の一例を示す図。
【図6】第1の実施形態に係る評価値の計算式の一例を示す図。
【図7】第1の実施形態に係る評価値算出部における評価値の算出手順の一例を示すフローチャート。
【図8】第1の実施形態に係る評価値算出部における評価値の算出手順の一例を示すフローチャート。
【図9】第1の実施形態に係る情報記憶部で記憶されている評価値情報格納部のテーブルの一例を示す図。
【図10】第1の実施形態に係るスコア算出部におけるスコアの算出手順の一例を示すフローチャート。
【図11】第1の実施形態に係る情報記憶部で記憶されている評価値ごとの重み付け情報記憶部45のテーブルの一例を示す図。
【図12】第1の実施形態に係るスコア情報格納部のテーブルの一例を示す図。
【図13】第1の実施形態に係るパターン選択基準情報のテーブルの一例を示す図。
【図14】第2の実施形態に係るパターン選択装置の全体構成の一例を示すブロック図。
【図15】第2の実施形態に係るパターン選択装置における情報更新手順を示すフローチャート。
【図16】第2の実施形態に係る更新条件の一例を示す図。
【図17】第2の実施形態に係る更新情報の一例を示す図。
【発明を実施するための形態】
【0014】
以下、本発明のパターン選択装置の実施形態について図面を参照しながら説明する。なお、本実施形態では一例として、文字認識装置の認識辞書を作成するために用いるパターンを選択するパターン選択装置について説明する。
【0015】
(第1の実施形態)
図1は、第1の実施形態のパターン選択装置の全体構成を示すブロック図である。
【0016】
図1に示すように、本実施形態のパターン選択装置は、評価値算出部10、スコア作成部20、パターン選択部30、および情報記憶部40を含んで構成される。
【0017】
なお、本実施形態のパターン選択装置は、ハードウェアとしてCPU、メインメモリ、外部記憶装置などを備える。外部記憶装置に格納された例えばパターン選択プログラムがCPUによりメインメモリ上にロードされることによって、上記した評価値算出部10、スコア作成部20、およびパターン選択部30が実現される。また、これらの構成要素は、ソフトウェアに代えて、各種の電子部品を組み合わせて構成したハードウェアにより実現されるものであっても良い。
【0018】
情報記憶部40は、候補パターン記憶部41と、評価用パターン記憶部42と、評価値情報記憶部43と、スコア情報記憶部44と、評価値ごとの重み付け情報記憶部45と、パターン選択基準情報記憶部46とを有する。
【0019】
候補パターン記憶部41は、辞書パターンの候補である候補パターン(第1のパターン)情報として、候補パターンそのものと、候補パターンに関する情報(以下、情報タグという)とを記憶する。本実施形態ではあらかじめ候補パターンとしてさまざまなパターンが用意されて、情報タグと対応付けて候補パターン記憶部41に記憶されているとする。これらの候補パターンから認識辞書に使用するパターン(以下、辞書パターンという)が選択される。
【0020】
例えば文字認識においては候補パターンは文字画像データであり、候補パターンのタグ情報は候補パターンの識別子、所属するクラス、フォント、傾き、および画像サイズなどを含む。なお、候補パターン記憶部41は後述するパターン選択処理を行う際に外部から入力するようにしても良い。また、識別子は、例えば情報記憶部40への登録順でも良いし、候補パターンをクラスに分類した際のクラスごとの登録順でも良い。
【0021】
ここで、図2を参照して、本実施形態の候補パターン記憶部41に記憶された候補パターン情報について説明する。
【0022】
図2は、本実施形態に係る候補パターン記憶部41に記憶された候補パターン情報の一例を示す図である。文字認識の際は、候補パターンは例えば文字の画像データを有する。なお、文字認識装置の候補パターンとしては、漢字、数字、ひらがな、カタカナ、アルファベットなど、あらゆる属性の文字パターンを対象とすることが可能であるが、本実施形態では、候補パターンとしてアルファベットを適用する。
【0023】
図2に示すように、本実施形態の候補パターン記憶部41には、クラス「A」に所属している候補パターン1乃至候補パターン3と、クラス「B」に所属している候補パターン4乃至候補パターン6が格納されている。各候補パターンは候補パターンの画像データ(以下、候補パターン画像という)とこの候補パターン画像に対応する情報タグとを有する。情報タグには、パターンの識別子であるパターンID416と、所属クラス417と、フォント418と、傾き419とが含まれる。なお、傾きは反時計回りの傾きが「−」で示され、時計回りの傾きが「+」で示される。例えば、字形が時計回りに10度傾いている場合は傾き情報は+10であり、字形が反時計回りに20度傾いている場合は傾き情報は−20である。
【0024】
候補パターン1は、候補パターン画像410を有し、パターンIDが「A101」であり、所属クラスが「A」であり、フォントが「フォント1」であり、傾きが「±0」である。候補パターン2は、候補パターン画像411を有し、パターンIDが「A102」であり、所属クラスが「A」であり、フォントが「フォント2」であり、傾きが「+20」である。候補パターン3は、候補パターン画像412を有し、パターンIDが「A103」であり、所属クラスが「A」であり、フォントが「フォント3」であり、傾きが「−30」である。
【0025】
候補パターン4は、候補パターン画像413を有し、パターンIDが「B101」であり、所属クラスが「B」であり、フォントが「フォント4」であり、傾きが「±0」である。候補パターン5は、候補パターン画像414を有し、パターンIDが「B102」であり、所属クラスが「B」であり、フォントが「フォント5」であり、傾きが「+20」である。候補パターン6は、候補パターン画像415を有し、パターンIDが「B103」であり、所属クラスが「B」であり、フォントが「フォント2」であり、傾きが「−30」である。
【0026】
なお、本実施形態では、説明を簡略化するために、図2に示す候補パターン1乃至候補パターン6はすべて、あらかじめ幅100画素、高さ100画素に正規化した画像データであるとする。
【0027】
また、クラスとはパターンを分類するものであり、対象の候補パターンが上記のようにアルファベットの場合、例えば、アルファベットに含まれる文字種「A〜Z」それぞれに対応するクラス「A〜Z」が用意されていることになる。すなわち、文字種「A」の候補パターン「A」はクラス「A」に所属している。また、文字種だけではなくフォント毎にクラスを分類しても良い。そのため、候補パターンは文字種クラスとフォントクラスに同時に所属するといったように、複数のクラスに同時に所属してもよい。
【0028】
評価用パターン記憶部42は、後述する評価値算出部10が候補パターンを評価するために用いる評価用パターン(第2のパターン)の画像データと評価用パターンに関するタグ情報とを対応付けた情報を記憶する。本実施形態では評価用パターンは候補パターン記憶部41に格納された候補パターンからあらかじめ選択され、評価用パターン記憶部42に格納されている。
【0029】
すなわち本実施形態では、候補パターン記憶部41に格納された候補パターン1乃至候補パターン6から、文字認識を行いたい対象の文字と同じ所属クラス、同じフォント情報を持つ候補パターンを選択し、評価用パターンとする。すなわち、評価用パターンは、パターン認識を行う対象の属性に基づいて候補パターン群から選択される。なお、評価用パターン記憶部42は候補パターン記憶部41と同様に、後述するパターン選択処理を行う際に外部から入力するようにしても良い。また、評価用パターンとして選択されたパターンは候補パターン群から削除することにしてもよい。
【0030】
ここで、図3を参照して、本実施形態の評価用パターン記憶部42に記憶された評価用パターン情報について説明する。評価用パターン情報は候補パターン情報と同様に、評価用パターンそのものと、この評価用パターンに対応する情報タグとを有する。
【0031】
図3は、本実施形態の評価用パターン記憶部42の一例を示す図である。図3に示すように、本実施形態の評価用パターン記憶部42には、クラス「A」に所属している評価用パターン1と、クラス「B」に所属している評価用パターン2とが記憶されている。なお、本実施形態では、説明を簡略化するために図3に示す評価用パターン1乃至評価用パターン24はすべて、幅100画素、高さ100画素であり、図2の候補パターンと同じサイズであるとする。本実施形態の評価用パターンの所属するクラスは、候補パターンの所属するクラスに対応している。すなわち、候補パターン記憶部41に格納された候補パターンのクラスと評価用パターンのクラスは対応関係にある。
【0032】
評価用パターン1は、パターンIDが「A201」であり、所属クラスが「A」であり、フォントが「フォント1」であり、傾きが「±0」である。評価用パターン2は、パターンIDが「B201」であり、所属クラスが「B」であり、フォントが「フォント5」であり、傾きが「+20」である。すなわち、評価用パターン1は候補パターン記憶部41に記憶された候補パターン1であり、評価用パターン2は候補パターン記憶部41に記憶された候補パターン5である。
【0033】
評価値情報記憶部43は、評価値算出部10によって算出された候補パターンごとの評価値を格納する。
【0034】
スコア情報記憶部44は、スコア作成部20によって算出された候補パターンごとのスコアを格納する。
【0035】
評価値ごとの重み付け情報記憶部45は、後述する評価値算出部10が評価値を算出する際に用いる評価値ごとの重み付けを行うための重み付け情報を記憶している。この評価値ごとの重み付け情報はあらかじめユーザもしくはシステム設計者などによって設定される。
【0036】
パターン選択基準情報記憶部46は、後述するパターン選択部30によるパターン選択処理の際に候補パターン記憶部41から辞書パターンを選択するための選択基準である。本実施形態ではパターン選択基準情報はあらかじめシステム設計者などによって設定される。
【0037】
なお、情報記憶部40は、1つ又は複数の記憶ユニットを適宜用いて、1つの記憶ユニットに領域を分けて構成してもよく、別々な記憶ユニットに記憶しても良い。または、それらを組み合わせても良い。情報記憶部40としては、例えば磁気ディスク装置、半導体メモリ、光ディスクメモリなどが用いられる。
【0038】
評価値算出部10は、スコア作成部20および情報記憶部40に接続される。評価値算出部10は、候補パターン記憶部41に格納されている候補パターン情報と、評価用パターン記憶部42に格納されている評価用パターン情報とを用いて、候補パターンごとの評価値を算出する。
【0039】
本実施形態における評価値は、候補パターンごとの、貢献度(第1の評価値)、字形の整い具合(第2の評価値)、および距離スコア(第3の評価値)である。貢献度、字形の整い具合、および距離スコアのそれぞれの算出方法については後述する。評価値算出部10で算出されたそれぞれの評価値は、候補パターンごとに評価値情報記憶部43に格納される。
【0040】
スコア作成部20は、評価値算出部10とパターン選択部30と情報記憶部40とに接続されている。スコア作成部20は、評価値情報記憶部43に格納された評価値と、評価値ごとの重み付け情報記憶部45に格納された評価値ごとの重み付け情報とを用いて、候補パターンごとにスコアを算出する。なお、本実施形態のスコアの算出方法は、評価値と評価値ごとの重み付け情報とを掛け合わせたものを合計する方法で算出する。ただし、スコアとしては、この結果を例えば5段階に量子化するなどしたものを用いてもよい。スコア作成部20で算出されたスコアは、スコア情報として情報記憶部40のスコア情報記憶部44にスコア順に格納される。
【0041】
パターン選択部30は、スコア作成部20と情報記憶部40とに接続されている。パターン選択部30は、上述のスコア作成部20によって算出されたスコアに基づいて、例えばパターン認識装置の認識辞書として用いられるパターン(以下、辞書パターンという)を候補パターン記憶部41に格納された候補パターンから選択する。情報記憶部40の評価用パターン記憶部42とスコア情報記憶部44を用いて、後述する候補パターン選択処理を行う。
【0042】
以下、本実施形態のパターン選択装置において、図2に示した6つの候補パターンから、辞書パターンを選択する処理の一例について図4乃至図13を参照して説明する。
【0043】
図4は本実施形態のパターン選択装置の動作の一例を示すフローチャートである。図4に示すように本実施形態のパターン選択装置は、まず評価値算出部10が候補パターン記憶部41に含まれる候補パターンそれぞれの評価値を算出する評価値算出処理を行う。
【0044】
具体的には、評価値算出部はまず貢献度算出処理を行う(ステップS1)。次に、評価値算出部10は字形の整い具合算出処理を行う(ステップS2)。続いて、評価値算出部10は距離スコア算出処理を行う(ステップS3)。ステップS1乃至ステップS3において算出された各評価値は、評価値算出部10によって候補パターン毎に評価値記憶部43に格納される。
【0045】
スコア作成部20は、算出された評価値と、評価値ごとの重み付け情報記憶部45に格納された評価値ごとの重み付け情報とを用いて、スコア算出処理を行う(ステップS4)。パターン選択部30は、ステップS4で算出されたスコアとパターン選択基準情報記憶部46に格納されたパターン選択基準情報とを用いて、候補パターン記憶部41から辞書パターンを選択する(ステップS5)。これにより、パターン選択装置は動作を終了する。
【0046】
ここで、図5乃至図8を参照して、図4のステップS1乃至ステップS3における評価値算出処理について説明する。
【0047】
図5は、図4のステップS1における貢献度算出処理の手順の一例を示すフローチャートである。
【0048】
まず、評価値算出部10は、評価用パターン記憶部42に記憶された評価用パターンから特定の評価用パターンを標本として選択し、図2の候補パターンを用いてk近傍法(k−nearest neighbor algorithm:knn法)によるパターン認識を行う(ステップS11)。すなわち、全ての候補パターンを認識辞書として用いて選択した評価用パターンを認識する。なお、knn法は、パターン認識においてよく用いられる技術である。
【0049】
評価値算出部10は、候補パターンごとに出現回数と正解回数を算出する(ステップS12)。出現回数は、対象の候補パターンが標本である評価用パターンの近傍に現れた回数であり、正解回数は対象の候補パターンが同じクラスの評価用パターンの近傍に現れた回数である。
【0050】
評価用パターン記憶部42に登録されたすべての評価用パターンについてパターン認識を行った場合(ステップS13がYes)、評価値算出部10は、候補パターンごとの出現回数と正解回数それぞれの累積値を算出する(ステップS14)。すなわち、対象の候補パターンについて、ステップS12で算出した候補パターンごとの出現回数と正解回数とをそれぞれ合計する。
【0051】
評価値算出部10は、候補パターンごとの出現回数の累積値と正解回数の累積値を用いて、図6の式(イ)によって貢献度を算出し(ステップS15)、貢献度算出処理を終了する。
【0052】
なお、すべての評価用パターンをパターン認識してない場合、すなわち、評価用パターン記憶部42に登録された評価用パターン情報にステップS11を行っていない評価用パターンが存在する場合(ステップS13がNo)、評価値算出部10はパターン認識を行っていない次の評価用パターンを標本とし(ステップS16)、ステップS11にもどりパターン認識を行う。ただし、評価値算出部10で用いる評価用パターンは評価用パターン記憶部42に記憶された評価用パターンから任意に選択した一部に限ってもよい。この場合、対象としない評価用パターンに対しては上記の処理を行わない。
【0053】
式(イ)から明らかであるように、貢献度は、該当する候補パターンが評価用パターンの近傍として選択された場合に、評価用パターンと候補パターンとが同じクラスである比率である。言い換えれば、ある候補パターンの近傍にある評価用パターンのうち、該候補パターンと同じクラスであるパターンの比率である。すなわち、貢献度が高い候補パターンの近傍には該候補パターンと同じクラスが多く分布していると考えることができ、結果として入力されたパターンを候補パターンと同じクラスに識別することが妥当だと考えられる。
【0054】
すなわち、貢献度が高い候補パターンは、入力されたパターンの正しいクラスを決定するのに貢献する。
【0055】
なお、本実施例では評価値の算出基準として出現回数・正解回数の累積値を用いたが、入力されたパターンと近傍として選択された候補パターンとの距離が近いほどそれらが同じクラスである可能性が高いことを考慮し、例えば該候補パターンと入力されたパターンとの距離の逆数の合計などのように距離に基づいて貢献度を算出してもよい。なお、ここでいう距離とはKnn法に用いられる距離のことである。
【0056】
この場合の計算は、例えば以下のように行う。ある候補パターンxが評価用パターンyの近傍として選択された場合、xとyの距離Dx,yiを、候補パターンxと評価用パターンyの同じ位置の画素それぞれに対して、画素値の差の二乗を求めて合計し、その平方根をとったものとする。
【0057】
ここで、前記の距離の逆数を候補パターンxが近傍に出現した全ての評価用パターンy,y,y,・・・,yについて合計した値であるDに対する、上記の評価用パターンのうちクラスがxと同じである評価用パターンy,y,y,・・・,yについてのみ合計した値であるDの割合を貢献度としてもよい。
【0058】
なお、Dx,yiがあらかじめ定めた閾値Thよりも小さい場合、Dx,yiの値をThとするようにしてもよい。また、評価用パターンとの距離が0の候補パターンが存在した場合、すなわち評価用パターンがある候補パターンと完全に一致する場合、該評価用パターンを上記の計算から除外して貢献度を求めてもよいし、貢献度を100としてもよい。上記のような計算によれば、評価用パターンと候補パターンとの距離が近いほど貢献度の算出に大きく影響するようにできる。次に、図7を参照して、図4のステップS2における字形の整い具合算出処理について説明する。図7は、評価値算出部10による字形の整い具合算出処理の手順の一例を示すフローチャートである。
【0059】
まず、評価値算出部10は、候補パターンの画像サイズと画素階調とを正規化する(ステップS21)。これらの正規化はあらかじめ定められた基準にしたがって行われる。本実施例の場合、画素階調は文字のある画素が黒、ない画素が白の2階調に正規化される。
【0060】
次に、正規化された候補パターンとテンプレートのパターンにおいて同じ位置の画素を比較し、両方に黒画素が出現している画素位置の数を算出する(ステップS22)。
【0061】
なお、本実施形態のテンプレートは、本実施形態の候補パターンの所属するクラスにおける標準的なパターンであり、あらかじめ候補パターン記憶部41の候補パターン情報から作成される。例えば、候補パターン情報からクラスごと、またはフォントごとに傾きが0のパターンを選択する。選択した候補パターンの平均をとったものをテンプレートとする。選択されたパターンが複数ある場合、それらのうちの一つを選択してテンプレートとしてもよい。その場合、例えば全ての選択されたパターンの平均をとったパターンとの距離が最も近い選択されたパターンを選択するなどすればよい。すなわち、ユーザがパターン認識を行いたい対象として最も標準的であると定めた候補パターンをテンプレートに設定する。
【0062】
なお、テンプレートは上述した作成方法のほかにも、図3に示した評価用パターン群の中からあらかじめ設定してもいいし、評価用パターン群とは別のパターンをあらかじめテンプレートとして登録しても良い。例えば、あらかじめ、クラスごと、またはフォントごとに傾きがない候補パターンを1つ用意し、テンプレートタグをつけ、テンプレートが必要な場合には、このテンプレートタグのついた候補パターンをテンプレートとしてもよい。
【0063】
ここでは、図2に示した候補パターンのうち、クラスAのテンプレートを候補パターン1とし、クラスBのテンプレートを候補パターン4とする。
【0064】
次に、評価値算出部10は、正規化された候補パターンと上記テンプレートパターンのそれぞれの同じ位置の画素において、両方に黒画素が出現している画素位置の数を算出する(図7のステップS22)。
【0065】
次に、評価値算出部10は、正規化された候補パターンと上記テンプレートパターンのそれぞれの同じ位置の画素において、少なくとも一方に黒画素が出現している画素位置の数を算出する(図7のステップS23)。
【0066】
評価値算出部10は、図7のステップS22で算出した、同じ画素位置に黒画素が出現している画素位置の数をXとし、図7のステップS23で算出した、どちらか一方にでも黒画素が出現している画素位置の数をYとし、図6の式(ロ)によって字形の整い具合を求める(ステップS24)。これにより、評価値算出部10は字形の整い具合算出処理を終了する。
【0067】
すなわち字形の整い具合とは、ユーザがパターン認識を行う対象として標準的であると定めたパターンにどれだけ類似しているかを示す評価値である。
【0068】
続いて、図8を参照して、評価値算出部10による距離スコア算出処理について説明する。図8は距離スコア算出処理の一例を示すフローチャートである。
【0069】
まず、評価値算出部10は候補パターンをの画像サイズと画素階調とを正規化する(ステップS31)。これらの正規化はあらかじめ定められた基準にしたがって行われる。なお、ステップS31の処理は、字形の整い具合算出処理におけるステップS21の処理と同じである。このため、ステップS31の処理を行わず、ステップS21の正規化後のデータを使用しても良い。
【0070】
評価値算出部10は、正規化された候補パターンを用いて、クラス内の平均パターンを作成する(ステップS32)。平均パターンとは、同一位置における同一クラス内の候補パターンの画素値の平均値を求めることで作成される。
【0071】
次に、評価値算出部10は候補パターンごとに、ステップS32で作成した平均パターンとの距離を算出する(ステップS33)。ここでの距離とは、候補パターンと平均パターンの同じ位置の画素それぞれに対して、画素値の差の二乗を求めて合計し、その合計値の平方根をとったものである。
【0072】
評価値算出部10は、算出した距離をlogで変換し(ステップS34)、変換した値を正規化して0から100の範囲にし(ステップS35)、距離スコア算出処理を終了する。この正規化後の値を同クラス内での距離スコアとする。
【0073】
平均パターンとは、与えられた候補パターン内における当該クラスの分布の中心である。言い換えると、当該クラスは平均パターンを中心に分布していると考えることができる。すなわち、距離スコアの小さい候補パターンは、平均パターンとの距離が近い、つまり当該クラスの分布の中心付近に位置する、言い換えれば候補パターンからはそのクラスらしいと考えられるパターンである。逆に、距離スコアが大きい候補パターンは、当該クラスの分布の中心から外れた場所に位置する、言い換えればそのクラスにおいて例外的であると考えられる候補パターンである。
【0074】
距離スコア算出処理終了後、評価値算出部10は、これらの各評価値を評価値テーブルとして評価値情報記憶部43に登録する。図9に評価値テーブルの一例を示す。図9に示すように、評価値テーブルは、パターンID431、貢献度432、字形の整い具合433、および距離スコア434の項目を有し、候補パターンごとの評価値が格納される。パターンID431には、図2に示した候補パターンのIDが格納される。
【0075】
なお、貢献度、字形の整い具合、距離スコアは順次算出しても良いし、同時に算出しても良い。また、貢献度、字形の整い具合、距離スコアのそれぞれの算出方法は、前述した方法のほかどのような方法を用いても良い。
【0076】
図10乃至図12を参照して、図4のステップS4におけるスコア作成処理について説明する。図10は、スコア作成部20によるスコア作成処理の一例を示すフローチャートである。
【0077】
スコア作成部20は、評価値情報記憶部43に格納された評価値と、評価値ごとの重み付け情報記憶部45とを参照してスコアを算出する(ステップS41)。なお、ここでは、各評価値と評価値ごとの重み付け情報とをかけ合わせた値の合計値を候補パターンのスコアとして扱う。
【0078】
ここで、図11を参照して評価値ごとの重み付け情報について説明する。評価値ごとの重み付け情報は、あらかじめユーザ、もしくは本実施形態のパターン選択装置作成者によって設定され、テーブルとして重み付け情報記憶部45に格納されている。図11に示すように、本実施形態の評価値ごとの重み付け情報は、貢献度、字形の整い具合、および距離スコアのそれぞれに対して0から1の間の値であって、合計値が「1」になるように設定されている。この評価値ごとの重み付け情報を設定することで、本実施形態のパターン選択装置はユーザの要望に沿った候補パターンの選択を可能とする。
【0079】
パターン認識においては、辞書作成用パターンとして選択された候補パターンに類似したパターンの認識率が高くなるため、このスコアの算出の際の重み付けによってどのようなパターンを高い認識率で認識するのかが決定する。例えば、貢献度の重み付けを高くすると、周辺に他のクラスの候補パターンが少ない候補パターンが優先され、そのクラスである可能性の高い、言い換えれば他のクラスである可能性の低いパターンに対する認識率が高くなる。字形の整い具合を高くすると、ユーザが当該クラスにおいて標準的であると定めたパターンに似たパターンの割合が高くなるため、認識対象が活字のように字形のばらつきが少ない場合、効率的に認識率を向上させることが期待できる。距離スコアの重み付けを高くすると、クラス内における例外的な辞書パターンの割合が高くなるため、手書き文字のようにクラス内のばらつきが大きい場合や、画像にノイズが混入してる場合等に対する効率的に認識率を向上させることが期待できる。
【0080】
図10の説明に戻る。スコア作成部20は、ステップS41で求めたスコアを数値の高い順に登録してスコアテーブルを作成し(ステップS42)、作成したスコアテーブルをスコア情報記憶部44に登録する(ステップS43)。
【0081】
例えば、図2の候補パターン1のスコアを算出する場合を説明する。図2の候補パターン1は、図9に示すように、貢献度が75、字形の整い具合が100、距離スコアが80である。図11に示すように、貢献度の重み付け情報は、貢献度が0.5、字形の整い具合の重み付け情報が0.25、距離スコアの重み付け情報が0.25である。スコアはそれぞれをかけ合わせた合計であるため、この候補パターン411のスコアは「82.5」となる。その他の候補パターンに関しても同様にスコアを求める。
【0082】
図12に、本実施形態に係るスコアテーブルの一例を示す。図12に示すように、スコアテーブルはパターンNo、パターンID、スコアの項目を有する。Noは、スコアの登録順序が登録される。パターンIDは登録された候補パターンのIDが登録される。スコアは、スコア作成部20が算出したスコアがパターンIDに対応して登録される。
【0083】
スコア作成部20がスコアテーブルを作成すると、本実施形態のパターン選択部30は、パターン選択基準46を参照してスコアテーブルの上位から順番に辞書パターンを選択する。図13にパターン選択基準の一例を示す。
【0084】
図13に示すように、パターン選択基準には、辞書パターンを選択する数が登録されている。本実施形態では「3」であるため、パターン選択部30によって、図2のスコアテーブルのNo1乃至No3の候補パターンが認識辞書を作成するのに用いる辞書パターンとして選択される。
【0085】
本実施形態では、辞書は選択された辞書作成用パターンの集合である。なお、辞書の作成方法については、部分空間法等の異なる認識手法に合わせた辞書の作成用法を選択しても良い。
【0086】
このように本実施形態によれば、候補パターンそれぞれに対して算出したスコアに基づいて候補パターンからパターンを選択することにより、効率的にパターンを選択することができる。さらに、パターンを選択する際の基準を明確にすることができる。
【0087】
例えば、本実施形態によれば、重み付け情報によって指定されたバランスに適合したクラス境界付近のパターンと標準的なパターンとを選択することが可能である。したがって、クラス間境界付近パターンとクラス内の標準的なパターンとがバランスよく含まれ構成された認識辞書を作成することが可能である。また、本実施形態によると。パターン認識の認識精度を低減せずに、認識辞書に使用するパターンを減少することが可能である。
【0088】
なお、評価用パターン、評価値ごとの重み付け情報、およびパターン選択基準はそれぞれ、ユーザが認識したい対象に合わせて変更が可能である。
【0089】
(第2の実施形態)
以下、図14乃至図17を参照して、第2の実施形態のパターン選択装置について説明する。なお、第1の実施形態と同一の構成には同一の符号を付し、説明は省略する。
【0090】
図14は、第2の実施形態のパターン選択装置の全体構成を示すブロック図である。
【0091】
図14に示すように、本実施形態のパターン選択装置は、図1に示したパターン選択装置の構成に再選択判定部31、認識辞書作成部32、更新条件記憶部47、更新情報記憶部48、情報入力部50、および情報更新部60をさらに有する構成である。なお、本実施形態の再選択判定部31および認識辞書作成部32はパターン選択部30が有する。
【0092】
情報入力部50は、ユーザが更新情報を入力するために用いる。情報入力部50は、例えばキーボードやマウスである。
【0093】
更新条件記憶部47には後述するパターン選択条件の更新条件が格納される。この更新条件は後述するパターン更新処理において用いられる。
【0094】
更新情報記憶部48には後述する更新情報が格納される。更新情報は、更新対象となる情報の項目名と変更後の情報とを含む。なお、本実施形態では、更新情報および更新条件はパターン選択基準情報記憶部46のパターン選択基準を更新するための情報である。また、パターン選択基準情報以外に、選択条件情報、評価値の数や種類、評価値ごとの重み付け情報、スコアの算出方法等を更新しても良い。
【0095】
再選択判定部31は、更新条件に基づいてパターン選択を再度行うかどうかを判定する。
【0096】
認識辞書作成部32はパターン選択部30が選択したパターンに基づいてパターン認識装置によるパターン認識において用いられる認識辞書を作成する。
【0097】
情報更新部60は更新情報記憶部48の更新情報に基づいてパターン選択基準を更新する。
【0098】
以下、図15を参照して、本実施形態のパターン選択装置を用いてパターン認識装置の認識辞書を作成する際のパターン選択基準更新処理手順について説明する。
【0099】
図15は、本実施形態のパターン選択装置に係る認識辞書を作成する場合のパターン選択条件更新手順の一例を示すフローチャートである。
【0100】
まず、ユーザは情報入力部50を用いて、パターン選択基準の更新情報と更新条件とを入力する(ステップS51)。
【0101】
ここで、図16および図17に、パターン選択の更新条件471とパターン選択基準の更新情報481の一例を示す。図16に示すように、パターン選択の更新条件471は、最大パターン数472と最低認識率473とを有する。最大パターン数472は、パターン選択部30によって候補パターン群から選択されるパターンの最大数示す。最低認識率473は、パターン選択部30によって選択されたパターンに基づいて作成された認識辞書を用いて、評価用パターン群を認識した場合に最低限必要とされる認識率を定めたものである。なお、認識率とは、例えばパターンを認識した回数に対する、パターン認識の正解数である。
【0102】
図17に示すように、パターン選択基準の更新情報481は、パターン選択数変更単位482を有する。パターン選択数変更単位482はパターン選択部30が再度パターンを選択する際のパターン数の増減値を定めたものである。
【0103】
入力されたパターン選択の更新条件471は、情報記憶部40の選択条件情報記憶部47に記憶され、更新情報481は、情報記憶部40の更新情報記憶部48に記憶される(ステップS52)。
【0104】
続いて、本実施形態のパターン選択装置は、図4に示したパターン選択処理を行い、候補パターン群から辞書パターンを選択する(ステップS53)。パターン選択部30の認識辞書作成部32はは、選択されたた辞書パターンを用いて認識辞書を作成する(ステップS54)。
【0105】
パターン選択部30が認識辞書を作成すると、再選択判定部31は作成された認識辞書を用いて評価用パターン記憶部42に格納された評価用パターンのパターン認識を行う。このパターン認識は、例えばknn法を用いて行われる(ステップS55)。なお、ステップS55で用いる評価用パターンは、ステップS53のパターン選択処理で用いられる評価用パターンでも良いし、あらかじめパターン選択条件更新処理用に登録されていても良い。また、再選択判定部31がパターン認識を行うのではなく、外部のパターン認識装置を用いてパターン認識を行い、再選択判定部31は認識結果を用いるようにしても良い。
【0106】
再選択判定部31は、認識辞書作成部32が作成した認識辞書によってパターン認識を行った場合の認識率を算出する(ステップS56)。算出した認識率がステップS51で入力されたパターン選択の更新条件471を満たす場合(ステップS57がYes)、再選択判定部31は、パターン再選択を行わず、パターン選択基準更新処理を終了する。すなわち、算出された認識率が更新条件471の最低認識率473を超える場合に、パターン選択条件更新処理を終了する。
【0107】
算出した認識率がステップS51で入力されたパターン選択の更新条件471を満たさない場合(ステップS57がNo)、再選択判定部31はパターン選択基準を更新すると判定し、この判定結果に基づいて、パターン選択部30は更新情報481を用いてパターン選択基準記憶部46に格納されたパターン選択基準を更新する(ステップS58)。具体的には、パターン選択基準の更新情報481のパターン選択数変更単位482に基づいて、パターン選択基準のパターン選択数を追加する。その後、本実施形態のパターン選択装置は、更新されたパターン選択基準を用いて、ステップS53から処理を繰り返す。
【0108】
このように本実施形態によれば、パターン選択部30がパターン選択基準に基づいて候補パターンから選択したパターンを、パターン選択基準の更新条件に基づいて判定し、判定結果に基づいて、追加するパターンを算出したスコアを参照して選択することを可能とする。すなわち、認識対象をパターン認識する際に、ユーザの求める認識率を満たす認識辞書を作成可能な最小数の辞書作成用パターンを候補パターンから選択することが可能である。
【0109】
以上、本発明のいくつかの実施形態を説明したが、これら実施形態は例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
【0110】
また、第1のおよび第2の実施形態では評価用パターンは候補パターン群から選択するとしたが、その場合に情報タグを用いて評価用パターンの絞りこみを行うことも可能である。例えば傾き±10以上のものは削除しても良い。または、候補パターン群から選択する評価用パターンの数に上限を設定し、クラスごとにランダムにパターンを削除しても良い。これは、第2の実施形態のパターン選択装置において辞書パターンと評価用パターンに同一のパターンが含まれないようにするためである。なお、この場合にはクラスやフォントごとに、パターン数に偏りがないように選択するようにしても良い。
【0111】
また、第1および第2の実施形態は文字認識装置に用いるパターンを例に挙げて説明したが、文字以外にも、顔や指紋などの画像や音声などのパターンにも用いることが可能である。
【0112】
第1および第2の実施形態ではパターン認識に用いる認識辞書の作成を例としてあげたが、例えばパターン認識装置のテストに用いるテストパターンのスコアを算出することで、どのテストパターンを重要視するかを判断するようなことを行ってもよい。
【0113】
この例の場合、例えば認識されなかったテストパターンが存在した場合、そのテストパターンのスコアを算出する。
【0114】
例えばスコアの算出において距離スコアの重み付けを大きくしている場合、スコアが大きいということは非常に例外的なパターンであるということであり、そのようなパターンを正しく認識できるようにした場合、いままで正常に認識できていたテストパターンが誤認識されるなどの弊害が起きることがある。このため、スコアがあらかじめ設定された閾値を超えた場合、そのテストパターンをテストパターン集合から削除する。これにより、極端に例外的なパターンが存在するために認識率が実際以上に低く評価されることを避けることができる。
【0115】
また、認識されなかったテストパターンに限定する必要はなく、全てのテストパターンに対してスコアを求めて、スコアに従ってどのテストパターンを重要視するかを決定することもできる。この場合、例えば認識率を図る際に認識したパターン数、正解したパターン数を用いるところを、それぞれ認識したパターンのスコアの合計、正解したパターンのスコアの合計を用いるなどとしてもよい。
【0116】
なお、テストパターンのスコアを算出する際には、候補パターンとは異なり貢献度が算出できない。そのため、代わりにテストパターンの近傍10パターン中の、テストパターンと同じクラスに所属する候補パターンの割合を算出する等の、別の評価値の算出方法を用いることで代用が可能である。あるいは、貢献度として規定の値、例えば0を用いることとしてもよい。
【符号の説明】
【0117】
1…パターン選択装置、10…評価値算出部、20…スコア作成部、30…パターン選択部、40…情報記憶部、41…候補パターン情報、42…評価用パターン情報、43…評価値情報記憶部44…スコア情報記憶部45…重み付け情報、46…パターン選択基準情報

【特許請求の範囲】
【請求項1】
第1のパターン群と前記第1のパターンの評価に用いられる第2のパターン群とを格納した記憶部と、
前記第2のパターンを参照して、前記第1のパターンの複数の評価値として、前記第1のパターンが前記第2のパターンをパターン認識する際の貢献度である第1の評価値、前記第1のパターンが、前記第1のパターンが所属するクラスにおける標準的なパターンであるかを評価する第2の評価値、および前記第1のパターンが前記クラス間境界付近のパターンであるかを評価する第3の評価値を算出する評価値算出部と、
算出された前記評価値と前記評価値ごとの重み付け情報とを用いて、前記第1のパターンごとのスコアを算出するスコア算出部と、
算出された前記スコアに基づいて前記第1のパターンからパターンを選択するパターン選択部と、
を備えるパターン選択装置。
【請求項2】
前記第2のパターン群は、前記第1のパターン群の中から、パターン認識の対象に基づいて選択されたパターンである請求項1に記載のパターン選択装置。
【請求項3】
前記パターン選択部は、前記スコア算出部が算出したスコアの高い順から規定数の前記第1のパターンを選択する請求項1乃至請求項2に記載のパターン選択装置。
【請求項4】
前記パターン選択部で選択されたパターンからパターン認識辞書を作成する認識辞書作成部をさらに備える請求項1乃至請求項3に記載のパターン選択装置。
【請求項5】
第1のパターン群と前記第1のパターンの評価に用いられる第2のパターン群とを格納した記憶部を備えるパターン選択装置において、
前記第2のパターンを参照して、前記第1のパターンの複数の評価値として、前記第1のパターンが前記第2のパターンをパターン認識する際の貢献度である第1の評価値と、前記第1のパターンが、前記第1のパターンが所属するクラスにおける標準的なパターンであるかを評価する第2の評価値、および前記第1のパターンが前記クラス境界付近のパターンであるかを評価する第3の評価値を算出するステップと、
算出された前記評価値と前記評価値ごとの重み付け情報とを用いて、前記第1のパターンごとのスコアを算出するステップと、
算出された前記スコアに基づいて前記第1のパターンからパターンを選択するステップと、
を備えるパターン選択方法。
【請求項6】
第1のパターン群と前記第1のパターンの評価に用いられる第2のパターン群とを格納した記憶部を備えるパターン選択装置におけるプログラムであって、
コンピュータに、
前記第2のパターンを参照して前記第1のパターンの複数の評価値して、前記第1のパターンが前記第2のパターンをパターン認識する際の貢献度である第1の評価値と、前記第1のパターンが、前記第1のパターンが所属するクラスにおける標準的なパターンであるかを評価する第2の評価値、および前記第1のパターンが前記クラス間境界付近のパターンであるかを評価する第3の評価値を算出する機能と、
算出された前記評価値と前記評価値ごとの重み付け情報とを用いて、前記第1のパターンごとのスコアを算出する機能と、
算出された前記スコアに基づいて前記第1のパターンからパターンを選択する機能と、
を実現させるプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate


【公開番号】特開2012−221476(P2012−221476A)
【公開日】平成24年11月12日(2012.11.12)
【国際特許分類】
【出願番号】特願2011−90230(P2011−90230)
【出願日】平成23年4月14日(2011.4.14)
【出願人】(000003078)株式会社東芝 (54,554)
【出願人】(301063496)東芝ソリューション株式会社 (1,478)
【Fターム(参考)】