説明

文字チェック装置、方法及びプログラム

【課題】図面等に表示された文字を、より高精度且つ低コストでチェックする
【解決手段】文字チェック装置(10)を構成する認識手段(100)は、チェック対象物の画像データを光学的に取得すると共に、前記画像データに含まれる文字を認識する。チェック部(200)は、認識手段(100)によって認識され得る字種各々と、その類似文字とを対応付けて記憶する。また、チェック部(200)は、認識手段(100)によって認識された文字をチェックする。このチェックの結果として、チェック部(200)は、表示手段(300)に、前記認識された文字に対応する類似文字に関する情報を表示させる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、文字チェック装置、方法及びプログラムに関し、特に図面等に表示された文字をチェックする技術に関する。
【背景技術】
【0002】
ものづくりにおいては、設計図面がベースになっている。近年、設計図面は、CAD(Computer Aimed Design)を利用して作成されるようになっている。CADを利用するメリットとしては、例えば、寸法の入力ミスがあっても、CADが図面の矛盾をチェックして指摘し、以て図面の再作成や製品の作り直しを低減できる点等が挙げられる。
【0003】
一方、製品に印刷する文字やロゴについては、その誤りを自動的に検出することは困難である。これは、製品に印刷する文字やロゴに関する情報がCADには入力されておらず、CADでは文字やロゴの正誤を判定できないためである。文字やロゴに関する情報は、図面を作成するための仕様として、別の文書上に存在するのが一般的である。CADによる自動チェックができないため、文字やロゴは、設計者或いは責任者自身の目視作業によってチェックされている。
【0004】
図面上の文字やロゴのチェックを人手で行うため、万一、文字やロゴに誤りがあり且つそれを発見できない場合、図面は、誤りを含んだ状態で製造プロセスに渡ってしまう。この結果、文字の誤りやロゴの誤りを含んだ製品が生産されてしまうことになる。例えば、キーボードの「ひらがな」キーを「ひながな」として製作してしまうこと等がある。このような問題は、チェック者が母国語の文字をチェックしても発生するので、チェック者或いは図面設計者が母国語でない文字をチェックする場合にはさらに顕著に現れる。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開平5−314305号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
人手による文字チェックを行う場合、チェックミスを完全に防ぐためには、非常に多くのコストを必要とする。具体的には、チェック者を複数にしてチェックを多重化する方法が考えられるが、その分、チェックに要するコストが単純増大してしまう。
【0007】
この問題に対処するため、前述の別文書をコンピュータで編集可能なデータとして作成し、CAD内の文字データと電子的に照合する対策が考えられる。しかしながら、この対策は得策で無い。その理由は、例え電子的な照合で文字コードが一致しても、CADデータを図面としてプリンタなどで印刷する際に、意図していない文字が印刷される「文字化け」や印字位置のずれが発生する虞があるためである。
【0008】
そこで、誌面等の文字を自動的に読み取る光学的文字読み取り装置(OCR:Optical Character Reader)を活用する対策が考えられる。具体的には、OCRにCADデータを印刷した図面上の文字記載箇所を読み取らせ、前述の別文書の記載事項と照合することで誤植を検出する。このようにOCRを利用して文字チェックを行う方法は、例えば特許文献1に記載されている。
【0009】
しかしながら、本願発明者は、OCRを用いた文字チェックには、その精度が低いという課題があることを発見した。
【0010】
具体的には、OCRでは、入力画像に含まれる文字を100%の精度で認識することが困難である。例えば、数字の「1」を英字の「I」と誤って認識するケースや、漢字の「網」を「綱」と誤って認識するケース等が存在する。このため、照合結果が"一致"を示す場合であっても、これを必ずしも信用できない。より詳細には、或る文字列の1番目が数字の「1」であると前述の別文書に登録され、且つOCRによる当該文字の認識結果が「1」である場合であっても、実際の図面上には英字の「I」が印字されている可能性がある。この場合、誤植を何ら検出できないことから、前述のような文字チェックにはOCRは適さないと考えられる。
【0011】
本発明は、上記の課題に鑑みてなされたものであり、その目的は、図面等に表示された文字を、より高精度且つ低コストでチェックすることにある。
【課題を解決するための手段】
【0012】
上記の目的を達成するため、本発明の第1の態様に係る文字チェック装置は、チェック対象物の画像データを光学的に取得すると共に、前記画像データに含まれる文字を認識する認識手段と、前記認識された文字をチェックするチェック手段と、前記チェックの結果を表示する表示手段とを備える。前記チェック手段は、前記認識手段によって認識され得る字種各々と、その類似文字とを対応付けて記憶し、前記表示手段に、前記認識された文字に対応する類似文字に関する情報を、前記チェックの結果として表示させる。
【0013】
また、本発明の第2の態様に係る文字チェック方法は、チェック対象物の画像データを光学的に取得すると共に、前記画像データに含まれる文字を認識可能な装置における文字チェック方法を提供する。この方法は、認識され得る字種各々と、その類似文字とを対応付けて記憶し、前記認識された文字に対応する類似文字に関する情報を表示することを含む。
【0014】
さらに、本発明の第3の態様に係る文字チェックプログラムは、チェック対象物の画像データを光学的に取得すると共に、前記画像データに含まれる文字を認識可能なコンピュータに、認識され得る字種各々と、その類似文字とを対応付けて記憶する処理と、前記認識された文字に対応する類似文字に関する情報を表示する処理とを実行させる。
【発明の効果】
【0015】
本発明によれば、図面等に表示された文字を、より高精度且つ低コストでチェックすることが可能である。
【図面の簡単な説明】
【0016】
【図1】本発明の実施の形態1に係る文字チェック装置の構成例を示したブロック図である。
【図2】本発明の実施の形態1に係る文字チェック装置の動作例を示したフローチャート図である。
【図3】本発明の実施の形態1に係る文字チェック装置による、チェック対象物の第1の例を示した図である。
【図4】本発明の実施の形態1に係る文字チェック装置に用いる、類似文字情報の構成例を示した図である。
【図5】図4に示す類似文字情報の作成に用いる、類似度マトリクスの構成例を示した図である。
【図6】本発明の実施の形態1に係る文字チェック装置による、チェック対象物の第2の例を示した図である。
【図7】本発明の実施の形態1に係る文字チェック装置による、チェック対象物の第3の例を示した図である。
【図8】本発明の実施の形態2に係る文字チェック装置の構成例を示したブロック図である。
【図9】本発明の実施の形態2に係る文字チェック装置に用いる、正解データの構成例を示した図である。
【図10】本発明の実施の形態2に係る文字チェック装置の動作例を示したフローチャート図である。
【図11】本発明の実施の形態2に係る文字チェック装置による、チェック対象物の一例を示した図である。
【発明を実施するための形態】
【0017】
以下、本発明に係る文字チェック装置の実施の形態1及び2を、図1〜図11を参照して説明する。なお、各図面において、同一要素には同一の符号が付されており、説明の明確化のため、必要に応じて重複説明は省略される。
【0018】
[実施の形態1]
図1に示すように、本実施の形態に係る文字チェック装置10は、認識部100と、チェック部200と、表示部300とを含む。
【0019】
この内、認識部100は、入力モジュール101と、抽出モジュール102と、認識モジュール103と、認識辞書モジュール104とを含む。入力モジュール101は、印刷された図面をスキャンして画像データへ変換する。抽出モジュール102は、画像データから文字列領域を抽出する。認識モジュール103は、抽出された文字列領域に相当する画像に対して文字認識を行う。認識辞書モジュール104は、認識モジュール103によって認識され得る字種各々に対する標準を記憶する。この標準は、認識モジュール103での文字認識に際して参照される。
【0020】
また、チェック部200は、評価モジュール201と、類似文字情報モジュール202とを含む。評価モジュール201は、認識モジュール103によって認識された文字をチェックすると共に、その結果を表示部300に表示させる。類似文字情報モジュール202は、認識モジュール103によって認識され得る字種各々と、その類似文字とを対応付けて記憶する。認識モジュール103によって認識された文字に対応する類似文字は、表示部300での表示に供される。
【0021】
なお、表示部300は、例えば、ディスプレイ及びそのコントローラによって構成できる。また、文字チェック装置10は、スキャナが接続され、且つ入力部、処理部、記憶部、及び出力部を有する一般的なコンピュータで実現可能である。
【0022】
次に、本実施の形態の動作を、図2〜図7を参照して詳細に説明する。
【0023】
図2に示すように、まず文字チェック装置10には、チェックすべき文字列の数"n"(nは任意の自然数)が入力される(ステップS1)。今、図3に示す図面1001がチェック対象物であるとする。この場合、図面1001上には3行の文字列が存在するため、チェック数n="3"が入力される。
【0024】
この時、文字チェック装置10は、文字列のチェックに用いるローカル変数iを"1"に初期化する(ステップS2)。ここで、変数iの値は、"i"番目("i"行目)の文字列がチェックされることを意味する。
【0025】
変数i≠チェック数n(図3の例では"3")が成立する間(ステップS3)、文字チェック装置10は、以降のステップS4〜S7を繰り返し実行する。
【0026】
具体的には、認識部100内の入力モジュール101は、図面1001をスキャンして画像データを取得し、抽出モジュール102へ出力する。抽出モジュール102は、画像データから文字列に相当する領域を切り出す。より詳細には、抽出モジュール102は、画像データに対して、Y軸(図面1001の左上を原点とする垂直方向)に対する投影プロファイルより、各文字列のY方向分離を行う。続いて、抽出モジュール102は、各文字列のY軸方向の存在範囲に対し、X軸(図面1001の左上を原点とする水平方向)に対する投影プロファイルを用いて文字列の終点を求め、以て各文字列に対応する画像を切り出す。
【0027】
この結果、図3に示す座標(X1、Y1)を開始座標として、1番目の文字列401(1)="ABCDEF"を囲む外接矩形に対応する画像が切り出される。同様に、座標(X2、Y2)を開始座標として、2番目の文字列401(2)="XYZ"を囲む外接矩形に対応する画像が切り出され、座標(X3、Y3)を開始座標として、3番目の文字列401(3)="□□株式会社"を囲む外接矩形に対応する画像が切り出される。抽出モジュール102は、切り出した画像を、認識モジュール103へ順次出力する。
【0028】
認識モジュール103は、まず文字列401(1)="ABCDEF"に対応する画像に対して、文字認識を行う(ステップS4)。より詳細には、認識モジュール103は、認識辞書モジュール104に記憶されている各字種の特徴データを参照して認識を行う。設計図面の場合は使用されるフォントが既知であるので、各字種の画像そのものを認識辞書モジュール104へ格納し、パタンの重ね合わせにより類似度若しくは距離値を計算し、どの字種であるかを判定すれば良い。或いは、「澤他:こう配特徴ベクトルと変動吸収共分散行列による手書き漢字認識の高精度化、電子情報通信学会論文誌D ,Vol.J84−D2,No.11,pp.2387−2397, 2001」に記載される特徴量を用いても良い。この場合、認識辞書モジュール104には、各字種のパタンに代えて特徴量を格納しておく。なお、文字列画像を1文字毎に分離するには、よく知られているように、文字列方向への投影プロファイルの谷を用いれば良い。
【0029】
そして、認識モジュール103は、文字認識によって得た文字列402(i)を、チェック部200内の評価モジュール201へ出力する。なお、以降の説明においては、文字認識によって得た文字列402を、"認識文字列"と呼称し、認識対象の文字列401と区別する。
【0030】
評価モジュール201は、類似文字情報モジュール202を参照し、認識文字列402(1)中に認識モジュール103が認識を誤る可能性のある類似文字が存在するか否かを判定する(ステップS5)。
【0031】
今、認識文字列402(1)="ABCDEF"が入力され、且つ類似文字情報モジュール202に、文字"C"の類似文字として文字"G"が登録されているとする。この場合、評価モジュール201は、表示部300に、『"C"を確認せよ』とのメッセージを認識文字列402(1)と共に表示させる(ステップS6)。
【0032】
この後、文字チェック装置10は、変数iをインクリメントして(ステップS7)、上記のステップS3へ戻り、以て変数i=チェック数nが成立する迄、上記のステップS4〜S6を繰り返し実行する。これにより、文字列401(2)="XYZ"及び文字列401(3)="□□株式会社"に対する文字認識、並びに類似文字に関するメッセージの表示が行われることとなる。
【0033】
このように、本実施の形態においては、OCRによって誤認識されている可能性のある文字を表示し(換言すると、誤植であり得る文字を検出し)、以て上述したOCRを用いた文字チェックにおける欠点を改善している。また、文字チェック自体は機械的に行われるため、複数のチェック者による作業は不要である。従って、本実施の形態によれば、図面に表示された文字を、従来と比して高精度且つ低コストでチェックすることができる。
【0034】
次に、類似文字情報モジュール202に記憶される情報(以下、類似文字情報)の具体的な構成例及びその作成手順例を、図4及び図5を参照して説明する。
【0035】
図4に示すように、類似文字情報501には、認識対象となる"K"個の字種p1〜pKの各々に対して、各字種に類似している文字が類似性の高い順に対応付けて記憶されている。各字種の類似文字は最大で"K−1"字種存在し得るが、各字種の形状に応じて記憶すべき類似文字の数は変わってくる。類似文字情報モジュール202は、類似文字情報501の作成に際して類似度を類似性の尺度として用いる場合、所定の類似度以上の文字を類似度の降順に記憶すれば良く、距離値を類似性の尺度として用いる場合には、所定の距離値以下の文字を距離値の昇順に記憶すれば良い。
【0036】
類似度を類似性の尺度として用いる場合、類似文字情報モジュール202は、図5に示す類似度マトリクス502を作成し、この類似度マトリクス502を用いて類似文字情報501を作成すれば良い。類似度マトリクス502には、字種p1〜pK同士間の類似度s11〜sKKが示されている。類似文字情報モジュール202は、縦、横K字種の組み合わせそれぞれに対して類似度を算出し、以て類似度マトリクス502を作成する。そして、類似文字情報モジュール202は、各字種に対して類似度が一定以上となる字種を類似度マトリクス502から検索すると共に、検索した字種を類似度の高い順に選択して各字種と対応付けて記憶し、以て類似文字情報501を作成する。
【0037】
一方、距離値が類似性の尺度として用いる場合、類似文字情報モジュール202は、各字種に対して距離値が一定以下となる字種を検索し、検索した字種を距離値の低い順に選択して各字種と対応付けて記憶すれば良い。
【0038】
また、認識対象となる字種が複数種類の書体(複数のフォントや手書文字等)によって表現される場合、類似文字情報モジュール202は、字種間の類似度又は距離値の算出に際し、或る書体を代表パタンとして用いても良いし、字種毎に代表パタンを作成して用いても良い。或る書体を代表パタンとする場合、類似文字情報モジュール202は、類似度を類似性の尺度とするのであれば、比較している字種との類似度が最も高くなるパタンを用いれば良く、距離値を類似性の尺度とするのであれば、比較している字種との距離値が最も低くなるパタンを用いれば良い。一方、代表パタンを作成する場合、類似文字情報モジュール202は、各書体に属する同一字種同士間の平均パタンを作成する。この場合、認識対象となる字種の書体に依存せず、類似文字の表示を行うことができる。
【0039】
さらに、図4に示す如く類似文字情報501を構成した場合、評価モジュール201は、上記のステップS6にて、認識文字列402中の各文字に対応する複数の類似文字を表示対象として扱うと好適である。この場合、誤植が発見される確率を向上させることができる。
【0040】
なお、類似文字情報501は、静的に作成されるに限らず、文字チェック装置10の外部からの指示(例えば、文字チェック装置10に対するユーザ操作)に応じて動的に更新しても良い。この場合、類似文字の表示精度を調整すること等が可能となる。
【0041】
また、文字チェック装置10は、図3に示したような印字された図面に限らず、文字が直接印刷又は刻印された部品や製品等、他の種々の物品のチェックに適用可能である。
【0042】
例えば、文字チェック装置10は、図6に示す銘板シール2001に表示される文字をチェックすることができる。ここで、銘板シール2001は、図3に示した図面1001を元に製作したものである。
【0043】
この場合、文字チェック装置10内の入力モジュール101が、銘板シール2001の画像データを取得する。この時、入力モジュール101としては、スキャナを用いても良いし、カメラを用いても良い。取得された画像データは、抽出モジュール102及び認識モジュール130を経由して認識文字列402に変換され、評価モジュール201でのチェックに供されることとなる。
【0044】
また、文字チェック装置10は、図7に示す部品3001に表示される文字をチェックすることもできる。ここで、部品3001には、図6に示した銘板シール200が貼り付けられている。
【0045】
部品3001の画像データの取得に際しては、入力モジュール101としてカメラを用い、カメラを部品3001の上面にセットすれば良い。取得された画像データは、抽出モジュール102及び認識モジュール130を経由して認識文字列402に変換され、評価モジュール201でのチェックに供されることとなる。
【0046】
但し、銘板シール2001と部品3001とでは原点が異なるので、文字列の開始座標(抽出モジュール102において文字列領域の切り出しを開始する座標)を適宜変更すると良い。原点は、銘板シール2001の左上、及び部品3001の左上の各々に設定する。
【0047】
[実施の形態2]
図8に示すように、本実施の形態に係る文字チェック装置10aは、チェック部200が正解データモジュール203を更に含み、評価モジュール201がこの正解データモジュール203に記憶されるデータ(以下、正解データ)も参照して文字チェックを行う点で、上記の実施の形態1と異なる。
【0048】
ここで、図9に示すように、正解データ601には、文字列401(i)の開始座標(Xi、Yi)と、チェック対象物に表示されているべき正解の文字列cij(j=1〜m)とがセットとして記憶される。この内、開始座標(Xi、Yi)は、図8に点線で示す如く、抽出モジュール102での文字列領域の切り出しに用いると好適である。この場合、抽出モジュール102は、チェック対象物のどこにチェックすべき文字列が存在するかを容易に特定でき、以て切り出しに係る処理の効率化を図ることができる。一方、文字列cijは、評価モジュール201によって、認識文字列402(i)との比較に供される。
【0049】
なお、文字列cij中の各文字は、図4に示した字種pk(k=1,K)のいずれかであり、下記の式に示す条件を満たすものとする。
cij∈{pk|k=1,K}
【0050】
図10に示すように、本実施の形態の動作は、図2に示した上記のステップS1〜S7に加えて、ステップS8〜S10の処理が実行される点で、上記の実施の形態1と異なる。
【0051】
具体的には、文字チェック装置10a内の評価モジュール201は、上記のステップS4で認識モジュール103から入力された認識文字列402(i)を、正解データ601中の文字列cijと比較する(ステップS8)。
【0052】
この結果、認識文字列402(i)と文字列cijとが一致していない場合(ステップS9)、評価モジュール201は、表示部300に、一致していない文字を表示させる(ステップS10)。そして、評価モジュール201は、上記のステップS5へ進む。なお、認識文字列402(i)と文字列cijとが一致した場合、評価モジュール201は、上記のステップS10をスキップして、上記のステップS5へ進む。
【0053】
今、図3に示した第1版図面1001の認識結果を用いて、正解データ601を作成したとする。また、図11に示す改版後の第2版図面1002を、文字チェック装置10aによるチェック対象物とする。ここで、図11に示すように、第2版図面1002においては、部品の高さが"○○○"から"○○●"へ変更されている。さらに、第2版図面1002では、2行目の文字列として"XY2"が印刷され、誤植が発生しているとする。
【0054】
認識モジュール103での正常認識によって認識文字列402(2)="XY2"が得られた場合、評価モジュール201は、この認識文字列402(2)と正解データ601中の文字列"XYZ"との不一致を検出する。よって、評価モジュール201は、不一致文字"2"の表示を行う。
【0055】
一方、認識モジュール103での誤認識によって認識文字列402(2)="XYZ"が得られた場合、評価モジュール201は、この認識文字列402(2)と正解データ601中の文字列"XYZ"との一致を検出する。しかしながら、類似文字情報モジュール202に文字"Z"の類似文字として文字"2"が登録されていれば、評価モジュール201は、『"Z"を確認せよ』とのメッセージの表示を行い、以てチェック者へ確認を促すことができる。
【0056】
このように、本実施の形態においては、上記の実施の形態1に示した効果に加え、チェック者に対しチェック対象物に表示された文字の正誤を報告できるという更なる効果が得られる。
【0057】
なお、上記の実施の形態によって本発明は限定されるものではなく、特許請求の範囲の記載に基づき、当業者によって種々の変更が可能なことは明らかである。
【0058】
例えば、上記の実施の形態に示した文字チェック装置の各処理を、コンピュータに実行させるためのプログラムとして提供することもできる。この場合、プログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non−transitory computer readable medium)を用いて格納され、コンピュータに供給することができる。ここで、非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体(tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えば、フレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば、光磁気ディスク)、CD−ROM(Read Only Memory)、CD−R、CD−R/W、半導体メモリ(例えば、マスクROM、PROM(Programmable ROM)、EPROM(Erasable PROM)、フラッシュROM、RAM(Random Access Memory))を含む。プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によってコンピュータに供給されても良い。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。
【産業上の利用可能性】
【0059】
本発明は、文字チェック装置、方法及びプログラムに適用でき、特にCADによる図面作成時に入力する文字データの誤りを低コストで検出する用途に適用できる。また、本発明は、図面に限らず、製品に印字又は刻印された文字の誤植の検出や、図面の改版前後での文字列情報の比較等の種々の用途に適用できる。
【0060】
上記の実施の形態の一部又は全部は、以下の付記のようにも記載され得るが、以下には限られない。
【0061】
(付記1)
チェック対象物の画像データを光学的に取得すると共に、前記画像データに含まれる文字を認識する認識手段と、
前記認識された文字をチェックするチェック手段と、
前記チェックの結果を表示する表示手段と、を備え、
前記チェック手段は、
前記認識手段によって認識され得る字種各々と、その類似文字とを対応付けて記憶し、
前記表示手段に、前記認識された文字に対応する類似文字に関する情報を、前記チェックの結果として表示させる、
文字チェック装置。
【0062】
(付記2)
付記1において、
前記チェック手段は、
字種毎に、類似性の異なる複数の類似文字を記憶し、
前記表示手段に、前記認識された文字に対応する複数の類似文字に関する情報を表示させる、
ことを特徴とした文字チェック装置。
【0063】
(付記3)
付記1又は2において、
前記チェック手段は、前記記憶に際し、各類似文字を、複数種類の書体に属する同一字種間の平均パタンを用いて決定する、
ことを特徴とした文字チェック装置。
【0064】
(付記4)
付記1〜3のいずれか一つにおいて、
前記チェック手段は、
前記チェック対象物に表示された文字に関する情報を参照して、前記認識された文字の正誤を判定し、
前記判定の結果、誤りと判定した文字を、前記表示手段に更に表示させる、
ことを特徴とした文字チェック装置。
【0065】
(付記5)
付記1〜4のいずれか一つにおいて、
前記チェック手段は、自装置外部からの指示に応じて、各類似文字を更新する、
ことを特徴とした文字チェック装置。
【0066】
(付記6)
付記1〜5のいずれか一つにおいて、
前記チェック対象物は、印刷された図面、又は前記図面に則して製造された物品である、
ことを特徴とした文字チェック装置。
【0067】
(付記7)
チェック対象物の画像データを光学的に取得すると共に、前記画像データに含まれる文字を認識可能な装置における文字チェック方法であって、
認識され得る字種各々と、その類似文字とを対応付けて記憶し、
前記認識された文字に対応する類似文字に関する情報を表示する、
ことを含む文字チェック方法。
【0068】
(付記8)
付記7において、
字種毎に、類似性の異なる複数の類似文字を記憶し、
前記認識された文字に対応する複数の類似文字に関する情報を表示する、
ことを特徴とした文字チェック方法。
【0069】
(付記9)
付記7又は8において、
前記記憶に際し、各類似文字を、複数種類の書体に属する同一字種間の平均パタンを用いて決定する、
ことを特徴とした文字チェック方法。
【0070】
(付記10)
付記7〜9のいずれか一つにおいて、
前記チェック対象物に表示された文字に関する情報を参照して、前記認識された文字の正誤を判定し、
前記判定の結果、誤りと判定した文字を表示する、
ことを更に含む文字チェック方法。
【0071】
(付記11)
付記7〜10のいずれか一つにおいて、
前記装置の外部からの指示に応じて、各類似文字を更新する、
ことを特徴とした文字チェック方法。
【0072】
(付記12)
付記7〜11のいずれか一つにおいて、
前記チェック対象物として、印刷された図面、又は前記図面に則して製造された物品を用いる、
ことを特徴とした文字チェック方法。
【0073】
(付記13)
チェック対象物の画像データを光学的に取得すると共に、前記画像データに含まれる文字を認識可能なコンピュータに、
認識され得る字種各々と、その類似文字とを対応付けて記憶する処理と、
前記認識された文字に対応する類似文字に関する情報を表示する処理と、
を実行させるための文字チェックプログラム。
【符号の説明】
【0074】
10, 10a 文字チェック装置
100 認識部
101 入力モジュール
102 抽出モジュール
103 認識モジュール
104 認識辞書モジュール
200 チェック部
201 評価モジュール
202 類似文字情報モジュール
203 正解データモジュール
300 表示部
401 文字列
402 認識文字列
501 類似文字情報
502 類似度マトリクス
601 正解データ
1001, 1002 図面
2001 銘板シール
3001 部品

【特許請求の範囲】
【請求項1】
チェック対象物の画像データを光学的に取得すると共に、前記画像データに含まれる文字を認識する認識手段と、
前記認識された文字をチェックするチェック手段と、
前記チェックの結果を表示する表示手段と、を備え、
前記チェック手段は、
前記認識手段によって認識され得る字種各々と、その類似文字とを対応付けて記憶し、
前記表示手段に、前記認識された文字に対応する類似文字に関する情報を、前記チェックの結果として表示させる、
文字チェック装置。
【請求項2】
請求項1において、
前記チェック手段は、
字種毎に、類似性の異なる複数の類似文字を記憶し、
前記表示手段に、前記認識された文字に対応する複数の類似文字に関する情報を表示させる、
ことを特徴とした文字チェック装置。
【請求項3】
請求項1又は2において、
前記チェック手段は、前記記憶に際し、各類似文字を、複数種類の書体に属する同一字種間の平均パタンを用いて決定する、
ことを特徴とした文字チェック装置。
【請求項4】
請求項1〜3のいずれか一項において、
前記チェック手段は、
前記チェック対象物に表示された文字に関する情報を参照して、前記認識された文字の正誤を判定し、
前記判定の結果、誤りと判定した文字を、前記表示手段に更に表示させる、
ことを特徴とした文字チェック装置。
【請求項5】
請求項1〜4のいずれか一項において、
前記チェック手段は、自装置外部からの指示に応じて、各類似文字を更新する、
ことを特徴とした文字チェック装置。
【請求項6】
請求項1〜5のいずれか一項において、
前記チェック対象物は、印刷された図面、又は前記図面に則して製造された物品である、
ことを特徴とした文字チェック装置。
【請求項7】
チェック対象物の画像データを光学的に取得すると共に、前記画像データに含まれる文字を認識可能な装置における文字チェック方法であって、
認識され得る字種各々と、その類似文字とを対応付けて記憶し、
前記認識された文字に対応する類似文字に関する情報を表示する、
ことを含む文字チェック方法。
【請求項8】
請求項7において、
前記記憶に際し、各類似文字を、複数種類の書体に属する同一字種間の平均パタンを用いて決定する、
ことを特徴とした文字チェック方法。
【請求項9】
請求項7又は8において、
前記チェック対象物に表示された文字に関する情報を参照して、前記認識された文字の正誤を判定し、
前記判定の結果、誤りと判定した文字を表示する、
ことを更に含む文字チェック方法。
【請求項10】
チェック対象物の画像データを光学的に取得すると共に、前記画像データに含まれる文字を認識可能なコンピュータに、
認識され得る字種各々と、その類似文字とを対応付けて記憶する処理と、
前記認識された文字に対応する類似文字に関する情報を表示する処理と、
を実行させるための文字チェックプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate