説明

情報処理装置、情報処理方法、コンピュータプログラム、記録媒体

【課題】梯子枠の特性を利用してテンプレートの位置ずれ補正を行う。
【解決手段】文字認識処理の対象となる画像データを取得する取得手段と、前記取得手段により取得した画像データに対して、当該画像データに対応するテンプレート情報であって、当該画像データ上において文字認識処理の対象となる文字が記入される梯子枠を含む矩形領域の位置情報と、当該梯子枠の形状情報とを少なくとも含むテンプレート情報を用いて、文字認識処理を行う文字認識手段と、前記文字認識手段により梯子枠の認識ができない矩形領域が存在したかを判定する判定手段と、前記判定手段による判定の結果、梯子枠の認識ができない矩形領域が存在した場合、当該矩形領域の位置を補正する補正手段とを備え、前記文字認識手段は、前記補正手段により補正された矩形領域の位置情報を用いて、文字認識処理を行うことを特徴とする。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置及び情報処理方法及びコンピュータプログラム及びコンピュータ読取可能な記憶媒体に関する。
【背景技術】
【0002】
所定のフォーマットを有する帳票をスキャナ等により入力し、その入力画像に対して文字認識等を行う帳票認識処理装置が提案されている。このような帳票認識処理装置においては、一般に、入力画像のうち、文字認識を行うべき処理対象の領域(例えば梯子枠)に関する情報を予めテンプレート情報(以下、テンプレート)として記憶しておき、帳票処理に際しては、そのテンプレートを入力画像に重ね合わせるとともに、そのテンプレート内の囲まれた当該入力画像の部分画像に対して文字認識等の処理が行われる。
【0003】
しかしながら、実際の運用面においては、スキャナの読み取り精度の関係により、入力画像上の処理対象領域と、テンプレートとがずれてしまうことが多い。
【0004】
このため、特許文献1では、入力画像から複数の構造物(文字、表等)の領域を抽出し、その抽出した各領域の中から、予めテンプレートに記憶された領域に対応する領域を検索し、座標値を利用してずれ量を算出し、その算出したずれ量に応じて、テンプレートを入力画像にあてはめることにより、テンプレートに対する入力画像の位置ずれを補正している。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2000−339407号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、上記の従来技術では、入力画像から複数の構造物の領域を抽出する必要があり、構造物の抽出精度によっては、位置ずれを補正することができない。また、入力画像全体の構造物の領域を抽出する必要があるので、処理に時間がかかるという問題が生じる。
【0007】
そもそも、上記従来技術は、入力画像全体の構造物を対象としているものであり、特定の構造物に特化した技術ではない。そのため、梯子枠の特性を利用してテンプレートの位置ずれを補正するという技術的思想は何ら開示されていない。
【0008】
本発明は、上記課題を解決するものであり、梯子枠の特性を利用してテンプレートの位置ずれ補正を行うこと目的とする。
【課題を解決するための手段】
【0009】
本発明は、梯子枠を含む画像データに対して文字認識処理を行う情報処理装置であって、文字認識処理の対象となる画像データを取得する取得手段と、前記取得手段により取得した画像データに対して、当該画像データに対応するテンプレート情報であって、当該画像データ上において文字認識処理の対象となる文字が記入される梯子枠を含む矩形領域の位置情報と、当該梯子枠の形状情報とを少なくとも含むテンプレート情報を用いて、文字認識処理を行う文字認識手段と、前記文字認識手段により梯子枠の認識ができない矩形領域が存在したかを判定する判定手段と、前記判定手段による判定の結果、梯子枠の認識ができない矩形領域が存在した場合、当該矩形領域の位置を補正する補正手段とを備え、前記文字認識手段は、前記補正手段により補正された矩形領域の位置情報を用いて、文字認識処理を行うことを特徴とする。
【発明の効果】
【0010】
本発明によれば、梯子枠の特性を用いて、梯子枠の特性を利用してテンプレートの位置ずれ補正を行うことができる。
【図面の簡単な説明】
【0011】
【図1】画像処理装置の概略構成を示すシステム図である。
【図2】画像処理装置の概略構成を示すブロック図である。
【図3】画像処理を示すフローチャートである。
【図4】位置ずれ補正処理を示すフローチャートである。
【図5】ずれ方向判定処理を示す表である。
【図6】テンプレートと処理対象画像の例を示す図である(1)。
【図7】テンプレートと処理対象画像の例を示す図である(2)。
【図8】テンプレートと処理対象画像の例を示す図である(3)。
【図9】黒画素情報取得処理を示すフローチャートである。
【発明を実施するための形態】
【0012】
以下、図面を参照して、本発明の実施形態を詳細に説明する。
【0013】
図1は、本発明の実施形態における画像処理システムの構成例を示す図である。
【0014】
101は、コンピュータ装置(情報処理装置)であり、スキャナ102により読み取られた画像データを取得して、画像処理を実行する。なお、処理対象となる画像データは、スキャナ102以外のスキャナにより読み取られた画像データであってもよい。その場合、コンピュータ装置はネットワークを介して画像データを取得する。
【0015】
次に、画像処理システムにおける画像処理装置のハードウェア構成図を説明する。
【0016】
図2は画像処理装置(情報処理装置)のハードウェア構成を示すブロック図である。
【0017】
101は、CPUであり、ROM102に格納されている制御プログラムを実行することにより、本装置全体の制御を行う。102はROMであり、CPU101が実行するコンピュータプログラムや各種パラメータデータを格納する。コンピュータプログラムは、CPU101で実行されることにより、後述するフローチャートに示す各処理を実行するための各種手段として、当該装置(コンピュータ)を機能させる。なお、本実施例1では、後述するフローチャートの各ステップに対応する処理を、コンピュータ(CPU)を用いてソフトウェアで実現することとするが、その処理の一部または全部を電子回路などのハードウェアで実現するようにしても構わない。また、本発明の画像処理装置は、汎用パソコンを用いて実現してもよいし、画像処理専用の装置として実現するようにしても構わない。
【0018】
103は、RAMであり、画像や各種情報を記憶する。また、RAM103は、CPUのワークエリアやデータの一時待避領域として機能する。
【0019】
104は、外部記憶装置であり、例えば、ハードディスクやCD−ROM等で構成される。なお、本発明の装置をコンピュータに実現させるためのコンピュータプログラムは、このコンピュータ読取可能な外部記憶媒体に格納されていても構わないし、ネットワークを介して供給されるようにしても構わない。
【0020】
105は、ディスプレイであり、例えば、LCDやCRTで構成される。
【0021】
106は、入力装置である。例えば、デジタルカメラやスキャナ等の画像入力装置を接続するためのインターフェースであってもよいし、デジタルカメラやスキャナ等の画像入力装置そのものであっても構わない。また、デジタルカメラやスキャナの機能の1つとして実現するために、デジタルカメラやスキャナ内部に本発明の装置構成を組み込んで実現しても構わない。
【0022】
107は、ネットワークインターフェース(I/F)であり、ネットワーク上に接続されている外部装置(例えば、サーバ、外部記憶装置、画像入力装置等)と通信し、プログラムやデータを読み込んだり、書き込んだりする。尚、ネットワークは、典型的にはインターネットやLANやWANや電話回線などのいわゆる通信ネットワークであり、データの送受信が可能であれば良い。また、ディスプレイ105や入力装置106は、ネットワークインターフェース107を介して接続されていても良い。
【0023】
次に、画像処理について図3〜図7を用いて説明する。
【0024】
本発明の実施の形態では、スキャナで入力した入力画像データに対して、テンプレートを利用して文字認識処理を行う。
【0025】
入力画像データは、梯子枠を含む帳票を読み取ることで得られる画像データである。例えば、保険の申込用紙や試験の解答用紙などの帳票が該当する。
【0026】
また、読み取られた画像データ上に配置される矩形内に記入された文字に対してOCR処理を行うため、読み取りを行う前に、一または複数の矩形領域の位置(座標情報)や当該矩形領域の大きさ及び読み取り処理(文字認識処理)を制御する情報をテンプレートとして予め設定しておく。ここで、読み取り処理の制御方法には、文字認識やバーコード等の読み取り方法が含まれており、特に記憶されている読み取り方法が文字認識の場合には、文字を取り囲む枠の形状情報、手書き文字や活字文字の字種情報等が含まれている。更に枠の形状が梯子枠の場合、文字及び数字の行数や列数の情報を記憶しておく。文字認識処理実行時に、スキャナの読み取り精度等の関係により、テンプレート情報と文字認識すべき入力画像の対象領域にずれが生じた場合、認識エラーとなることがある。例えば、梯子枠に書かれた文字を文字認識しようとした場合、テンプレートに記憶している領域の位置情報と実際の入力画像における対象領域にずれが生じた場合、テンプレートに記憶している梯子枠の文字及び数字の行数や列数の情報と実際に文字認識しようとしている領域の範囲内に存在する文字及び数字の行数や列数が不一致であることから、認識エラーとなることがある。
【0027】
設定したテンプレートは外部記憶装置等に保存される。
【0028】
図3は、画像処理装置における画像処理を示すフローチャートである。
【0029】
ステップS301において、画像処理装置は、スキャナ等により読み取られた入力画像データの読み込みを行う。
【0030】
ステップS302において、画像処理装置は、入力画像データに対応する予め設定されたテンプレートを特定し、特定したテンプレートに設定される情報を用いて文字認識処理を開始する。
【0031】
ステップS303において、画像処理装置は、梯子枠で認識エラーが存在するかを判定する。Yesの場合、S304へ進み、Noの場合、処理を終了する。ここでの認識エラーは、梯子枠自体を認識することができないというエラーである。例えば、入力画像データの読み取り時にずれが生じてしまうと、テンプレートに記憶されている矩形領域の座標位置とずれることとなり、梯子枠を検出することができず、認識エラーとなる。なお、認識エラーは、複数の梯子枠に対して発生することがある。また、梯子枠の認識方法は、既存の技術を用いることにより実現可能である。
【0032】
ステップS304において、画像処理装置は、ステップS303において、認識エラーと判定された梯子枠に対し、位置ずれ補正処理を行う。
【0033】
位置ずれ補正処理は、図4を用いて詳細に説明する。
【0034】
図4は、位置ずれ補正処理を示すフローチャートである。
【0035】
ステップS401において、画像処理装置は、テンプレートの矩形領域の位置情報を基に、テンプレートの4辺(上辺、下辺、左辺、右辺)上の黒画素情報を取得する。4辺それぞれにおいて黒画素が存在した場合を1とし、黒画素が存在しない場合を0とする。このとき、黒画素が存在するかしないかをある一定の閾値に基づいて、1か0を判断してもよい。また、4辺上だけでなく、ある一定の幅を持たせて4辺近隣領域の黒画素情報を取得するようにしてもよい。これらを取得情報として、一時的に記憶する(例えば、上辺=t、下辺=b、左辺=l、右辺=r)。なお、本ステップは、第二の実施形態において、より詳細なフローチャートを用いて、後に説明する。
【0036】
ステップS402において、画像処理装置は、ずれ方向を判定する。この梯子枠のずれ方向の判定については、図5を用いて詳細に説明する。
【0037】
図5は、ずれ方向判定処理で用いる判定テーブルである。
【0038】
S401において取得した4辺上の黒画素情報が、図5に示す表のどのパターン(501〜517)に該当するかを特定し、その特定したパターンに対して定められている方向により、ずれ方向を判定している。
【0039】
まず、S401において取得した4辺上の黒画素情報(t(上辺)、b(下辺)、l(左辺)、r(右辺)情報)がすべて0であった場合について説明する(501、502)。
【0040】
テンプレートの矩形領域は、通常、入力画像データの梯子枠を包含する大きさで定義されていることから、入力画像データにずれが生じなければ(もしくは軽微なずれであれば)、入力画像データの梯子枠は、テンプレートの矩形領域の中に収まる。そのため、図6の601に示す通り、4辺上の黒画素情報がすべて0であった場合は、正しく読み取られた可能性が高い。この場合、テンプレートの矩形領域を移動させる必要がないとして、固定と判定する(501)。
【0041】
一方、ずれの量が大きい場合、テンプレートの矩形領域の中に、入力画像データの梯子枠がはみ出すことがある。特にテンプレートの矩形領域の中に黒画素が存在しないときは、少なくとも入力画像データの梯子枠が含まれていないことが分かるため、エラーと判定することができる(502)。なお、入力画像データは、読み取り時のごみが黒画素として取り込まれることがある。そのため、ごみを梯子枠と誤認識しないために、黒画素の量は任意に定めることができる。
【0042】
また、ステップS401において取得した黒画素が、t(上辺)のみ1の場合(503)、画像処理装置は、ずれ方向を上と判定する。図6の602がテンプレートの矩形領域と文字認識すべき梯子枠のずれを示す図である。
【0043】
また、ステップS401において取得した黒画素が、b(下辺)のみ1の場合(504)、画像処理装置は、ずれ方向を下と判定する。図6の603がテンプレートの矩形領域と文字認識すべき梯子枠のずれを示す図である。
【0044】
また、ステップS401において取得した黒画素が、l(左辺)のみ1の場合(505)、画像処理装置は、ずれ方向を左と判定する。図6の604がテンプレートの矩形領域と文字認識すべき梯子枠のずれを示す図である。
【0045】
また、ステップS401において取得した黒画素が、r(右辺)のみ1の場合(506)、画像処理装置は、ずれ方向を右と判定する。図6の605がテンプレートの矩形領域と文字認識すべき梯子枠のずれを示す図である。
【0046】
また、ステップS401において取得した黒画素が、t(上辺)とb(下辺)が1の場合(507)、画像処理装置は、ずれ方向をエラーと判定する。図6の606がテンプレートの矩形領域と文字認識すべき梯子枠のずれを示す図である。この場合、元々テンプレートのサイズの設定に誤りがあるため、エラーと判定する。
【0047】
また、ステップS401において取得した黒画素が、t(上辺)とl(左辺)が1の場合(508)、画像処理装置は、ずれ方向を左上と判定する。図6の607がテンプレートの矩形領域と文字認識すべき梯子枠のずれを示す図である。
【0048】
また、ステップS401において取得した黒画素が、t(上辺)とr(右辺)が1の場合(509)、画像処理装置は、ずれ方向を右上と判定する。図6の608がテンプレートの矩形領域と文字認識すべき梯子枠のずれを示す図である。
【0049】
また、ステップS401において取得した黒画素が、b(下辺)とl(左辺)が1の場合(510)、画像処理装置は、ずれ方向を左下と判定する。図7の609がテンプレートの矩形領域と文字認識すべき梯子枠のずれを示す図である。
【0050】
また、ステップS401において取得した黒画素が、b(下辺)とr(右辺)が1の場合(511)、画像処理装置は、ずれ方向を右下と判定する。図7の610がテンプレートの矩形領域と文字認識すべき梯子枠のずれを示す図である。
【0051】
また、ステップS401において取得した黒画素が、l(左辺)とr(右辺)が1の場合(512)、画像処理装置は、ずれ方向をエラーと判定する。76の611がテンプレートの矩形領域と文字認識すべき梯子枠のずれを示す図である。この場合、元々テンプレートのサイズの設定に誤りがあるため、エラーと判定する。
【0052】
また、ステップS401において取得した黒画素が、t(上辺)とb(下辺)とl(左辺)が1の場合(513)、画像処理装置は、ずれ方向をエラーと判定する。図7の612がテンプレートの矩形領域と文字認識すべき梯子枠のずれを示す図である。この場合、元々テンプレートのサイズの設定に誤りがあるため、エラーと判定する。
【0053】
また、ステップS401において取得した黒画素が、t(上辺)とb(下辺)とr(右辺)が1の場合(514)、画像処理装置は、ずれ方向をエラーと判定する。図7の613がテンプレートの矩形領域と文字認識すべき梯子枠のずれを示す図である。この場合、元々テンプレートのサイズの設定に誤りがあるため、エラーと判定する。
【0054】
また、ステップS401において取得した黒画素が、t(上辺)とl(左辺)とr(右辺)が1の場合(515)、画像処理装置は、ずれ方向をエラーと判定する。図7の614がテンプレートの矩形領域と文字認識すべき梯子枠のずれを示す図である。この場合、元々テンプレートのサイズの設定に誤りがあるため、エラーと判定する。
【0055】
また、ステップS401において取得した黒画素が、b(下辺)とl(左辺)とr(右辺)が1の場合(516)、画像処理装置は、ずれ方向をエラーと判定する。図7の615がテンプレートの矩形領域と文字認識すべき梯子枠のずれを示す図である。この場合、元々テンプレートのサイズの設定に誤りがあるため、エラーと判定する。
【0056】
また、ステップS401において取得した黒画素が、4辺すべて0の場合(517)、画像処理装置は、ずれ方向をエラーと判定する。図7の616がテンプレートの矩形領域と文字認識すべき梯子枠のずれを示す図である。この場合、元々テンプレートのサイズの設定に誤りがあるため、エラーと判定する。
【0057】
以上、図5を用いて、ステップS402における、ずれ方向の判定方法について説明をした。本実施の形態のように、予めパターンテーブルを用意しておくことで、ずれ方向の判定を行うことができる。このパターンテーブルは、梯子枠の性質を利用することで作成することができるものである。なお、ここでのずれ方向は、テンプレートの矩形領域が梯子枠に対してずれた方向を示すものであり、実際に補正する補正方向は、ずれ方向と反対となる。
【0058】
次に、図4の説明に戻る。
【0059】
ステップS403において、画像処理装置は、判定結果がエラーであるかを判定する。Yesの場合、処理を終了し、Noの場合、S404へ進む。ここでは、ステップS402による判定結果が、エラーか否かを判定している。
【0060】
ステップS404において、画像処理装置は、位置ずれ量(補正量)を算出する。位置ずれ量の算出方法は、どのようは方法であってもよく、例えば、上下にずれを補正する場合は、テンプレートの高さ以下のずれ量(例えばテンプレートの高さの5分の1)を設定し、左右にずれを補正する場合は、テンプレートの幅以下のずれ量(例えばテンプレートの幅の10分の1)を設定するといった方法がある。また、ずれ量は、入力画像データの解像度を用いて、算出することもできる。どのような条件であっても、S402における判定の結果に応じて、最適な位置ずれ量を算出することができればよい。なお、S402において、固定と判定された場合は、テンプレートの矩形領域をずらす必要がないため、ずれ量の算出は行わない。
【0061】
ステップS405において、画像処理装置は、ステップS402とステップS404で判定されたずれ方向とずれ量に従って、テンプレートにおける処理対象となっている梯子枠の位置情報(座標位置)を変更して処理を終了する。
【0062】
以上、図4の説明を終了し、図3の説明を続ける。
【0063】
ステップS305において、画像処理装置は、梯子枠で認識エラーが存在するかをS303と同じく再び判定する。Yesの場合、S307へ進み、Noの場合、S306へ進む。ここでは、S304において、位置ずれ補正処理後のテンプレートを用いて、梯子枠で認識エラーが生じるかを判定している。なお、S403において、認識結果がエラーとなった場合は、位置ずれ補正処理が行われないため、ここでは、認識エラーとなる。
【0064】
ステップS306において、画像処理装置は、位置ずれ補正処理後のテンプレートを用いて、文字認識処理を行う。
【0065】
本実施の形態では、ステップS304〜ステップS306を、1つの梯子枠での認識エラーに対し、1度だけ処理を行うようにしたが、繰り返し複数回処理を行うようにしてもよい。
【0066】
ステップS307において、画像処理装置は、全ての梯子枠の認識エラーの検索が終了したかを判定する。Yesの場合、処理を終了し、Noの場合、S303へ戻る。
【0067】
図3による処理が終了した後、処理結果をユーザが認識可能な形式で表示装置へ表示する。
【0068】
上述した通り、本発明によれば、梯子枠の特性を利用してテンプレートの位置ずれ補正を行うことができる。
【0069】
これにより、入力画像全体の構造物の領域を抽出することなく、より高速に、テンプレートに対する入力画像の位置ずれを補正することが可能となる。
【0070】
次に、本発明の実施例2として、梯子枠の近隣に文字等の構造物が存在している場合に、テンプレートの位置ずれ補正をより正確に行うための実施例を説明する。
【0071】
以下、図面を参照して、本発明の実施例2を詳細に説明する。なお、図1〜図7は実施例1と同様であるため、説明は省略する。
【0072】
図8は、本発明の実施例2におけるテンプレートの矩形領域と文字認識すべき梯子枠と梯子枠近隣に存在する構造物(文字列)の位置関係を示す図である。
【0073】
図8の例では、801や802のように、梯子枠近隣に存在する構造物とテンプレートの矩形領域が重なっている場合が存在する。
【0074】
ここで、実施例1では、このような場合、位置ずれ補正を実施しようとするが、実施例2では、テンプレートの矩形領域が梯子枠と重なっているのか、梯子枠近隣に記載された文字のような構造物と重なっているのかを判断し、より正確に位置ずれ補正を行うものである。
【0075】
処理の流れを、図9を用いて説明する。
【0076】
図9は、テンプレートの矩形領域近隣の黒画素情報を取得する際のフローチャートを示す図である。
【0077】
具体的には、図9は、図3のステップS304の位置ずれ補正処理における、図4のステップS401のテンプレートの4辺近隣の黒画素情報の取得処理をより詳細に示したものである。
【0078】
ステップS901において、画像処理装置は、テンプレートの矩形領域の位置情報を基に、テンプレートの4辺(上辺、下辺、左辺、右辺)上の黒画素情報を取得する。
【0079】
ステップS902において、画像処理装置は、4辺それぞれにおいて、黒画素が存在するかどうかを判断する。黒画素が存在する辺が存在する場合、ステップS903へ進み、黒画素が存在する辺が存在しない場合、処理を終了する。
【0080】
なお、4辺それぞれにおいて黒画素が存在した場合を1、黒画素が存在しない場合を0とし、ノイズ等の影響を考慮して、黒画素が存在するかしないかをある一定の閾値に基づいて、1か0を判断してもよい。また、4辺上だけでなく、ある一定の幅を持たせて4辺近隣領域の黒画素情報を取得するようにしてもよい。
【0081】
ステップS903において、画像処理装置は、ステップS902における判断結果を基に、4辺それぞれにおいて黒画素が存在した場合を1とし、黒画素が存在しない場合を0とする。
【0082】
ステップS904において、画像処理装置は、黒画素取得情報が1である辺の黒画素間の連続した白画素の平均幅を算出する。
【0083】
梯子枠と重なっている場合、梯子枠内の水平方向(もしくは垂直方向)の連続した白画素、つまり梯子枠内の1文字分のセルの幅の平均値を算出することになる。
【0084】
ステップS905において、画像処理装置は、黒画素取得情報が1である辺の黒画素間の連続した白画素の分散値を算出する。
【0085】
梯子枠と重なった辺であれば、1文字分のセルの大きさにばらつきが少ないため、分散値は限りなくゼロに近くなるが、図8のように梯子枠近隣に記載された文字列と重なった辺であれば、平均幅からのズレが大きくなり、分散値が大きくなる。そのため、テンプレートと重なっている対象物が梯子枠なのか、それ以外の構造物なのかが判断可能となる。
【0086】
ステップS906において、画像処理装置は、黒画素取得情報が1である辺の分散値が、予め設定した分散値より大きいかどうかを判定する。Yesの場合、ステップS907へ進み、Noの場合、処理を終了する。
【0087】
この判定により、対象の辺が梯子枠と重なっているのか、それ以外の構造物と重なっているのかが明らかとなる。
【0088】
ステップS907において、画像処理装置は、ステップS906における判断結果を基に、それぞれの辺の黒画素取得情報を0とする。
【0089】
これにより、梯子枠の近隣に文字等の構造物が存在し、テンプレートの矩形領域と重なっていても、該当する辺においては、位置ずれ補正を実施せず、それ以外の辺で位置ずれ補正を実施することが可能となる。
【0090】
例えば、図8の801の場合、黒画素情報取得処理により、すべての辺において、黒画素取得情報が0となるため、図5において、ずれ方向が固定と判断され、ずれ補正を実施しない。また、図8の802の場合、黒画素情報取得処理により、下辺のみの黒画素取得情報が1となるため、図5において、ずれ方向が下と判断され、ずれ補正を実施する。
【0091】
黒画素情報取得処理以降の処理においては、実施例1に示す処理と同じであるため、説明は省略する。
【0092】
以上、説明した通り、第二の実施例によれば、テンプレートの矩形領域が梯子枠と重なっているのか、梯子枠近隣に記載された文字のような構造物と重なっているのかを判断し、より正確に位置ずれ補正を行うことが可能となる。
【0093】
以上、本発明の好ましい実施形態について詳述したが、本発明は係る特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。
【0094】
また、本発明の目的は、以下のようにすることによって達成される。即ち、上述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体(又は記録媒体)を、システム或いは装置に供給する。そして、そのシステム或いは装置の中央演算処理手段(CPUやMPU)が記憶媒体に格納されたプログラムコードを読み出し実行する。この場合、記憶媒体から読み出されたプログラムコード自体が上述した実施形態の機能を実現することになり、そのプログラムコードを記録した記憶媒体は本発明を構成することになる。
【0095】
また、システム或いは装置の前記中央演算処理手段が読み出したプログラムコードを実行することにより、そのプログラムコードの指示に基づき、システム或いは装置上で稼働しているオペレーティングシステム(OS)等が実際の処理の一部又は全部を行う。その処理によって上述した実施形態の機能が実現される場合も含まれる。
【0096】
更に、記憶媒体から読み出されたプログラムコードが、前記システム或いは装置に挿入された機能拡張カードや、接続された機能拡張ユニットに備わるメモリに書込まれたとする。その後、そのプログラムコードの指示に基づき、その機能拡張カードや機能拡張ユニットに備わるCPU等が実際の処理の一部又は全部を行い、その処理によって上述した実施形態の機能が実現される場合も含まれる。
【0097】
本発明を前記記憶媒体に適用する場合、その記憶媒体(コンピュータ読み取り可能な記憶媒体)には、先に説明したフローチャートに対応するプログラムコードが格納されることになる。
【符号の説明】
【0098】
101 コンピュータ装置
102 スキャナ
201 CPU
202 ROM
203 RAM
204 外部記憶装置
205 ディスプレイ
206 入力装置
207 ネットワークインターフェース

【特許請求の範囲】
【請求項1】
梯子枠を含む画像データに対して文字認識処理を行う情報処理装置であって、
文字認識処理の対象となる画像データを取得する取得手段と、
前記取得手段により取得した画像データに対して、当該画像データに対応するテンプレート情報であって、当該画像データ上において文字認識処理の対象となる文字が記入される梯子枠を含む矩形領域の位置情報と、当該梯子枠の形状情報とを少なくとも含むテンプレート情報を用いて、文字認識処理を行う文字認識手段と、
前記文字認識手段により梯子枠の認識ができない矩形領域が存在したかを判定する判定手段と、
前記判定手段による判定の結果、梯子枠の認識ができない矩形領域が存在した場合、当該矩形領域の位置を補正する補正手段と
を備え、
前記文字認識手段は、前記補正手段により補正された矩形領域の位置情報を用いて、文字認識処理を行うことを特徴とする情報処理装置。
【請求項2】
前記補正手段は、梯子枠の認識ができない矩形領域における4辺上の黒画素情報と補正方向を判定する判定テーブルとを用いて補正する方向を特定し、当該特定された方向への補正量を予め定められる条件に従って算出して補正することを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記補正手段は、梯子枠の認識ができない矩形領域における4辺上の黒画素情報のうち、構造物に基づく黒画素情報を除き、当該除いた後の4辺上の黒画素情報と補正方向を判定する判定テーブルとを用いて補正する方向を特定することを特徴とする請求項2に記載の情報処理装置。
【請求項4】
前記判定テーブルは、4辺上における黒画素が存在する辺のパターンから補正の方向が判定可能な情報が定義されていることを特徴とする請求項2または3に記載の情報処理装置。
【請求項5】
梯子枠を含む画像データに対して文字認識処理を行う情報処理装置における情報処理方法であって、
文字認識処理の対象となる画像データを取得する取得ステップと、
前記取得ステップにより取得した画像データに対して、当該画像データに対応するテンプレート情報であって、当該画像データ上において文字認識処理の対象となる文字が記入される梯子枠を含む矩形領域の位置情報と、当該梯子枠の形状情報とを少なくとも含むテンプレート情報を用いて、文字認識処理を行う文字認識ステップと、
前記文字認識ステップにより梯子枠の認識ができない矩形領域が存在したかを判定する判定ステップと、
前記判定ステップによる判定の結果、梯子枠の認識ができない矩形領域が存在した場合、当該矩形領域の位置を補正する補正ステップと
を備え、
前記文字認識ステップは、前記補正ステップにより補正された矩形領域の位置情報を用いて、文字認識処理を行うことを特徴とする情報処理方法。
【請求項6】
梯子枠を含む画像データに対して文字認識処理を行う情報処理装置において実行可能なプログラムであって、
文字認識処理の対象となる画像データを取得する取得手段、
前記取得手段により取得した画像データに対して、当該画像データに対応するテンプレート情報であって、当該画像データ上において文字認識処理の対象となる文字が記入される梯子枠を含む矩形領域の位置情報と、当該梯子枠の形状情報とを少なくとも含むテンプレート情報を用いて、文字認識処理を行う文字認識手段、
前記文字認識手段により梯子枠の認識ができない矩形領域が存在したかを判定する判定手段、
前記判定手段による判定の結果、梯子枠の認識ができない矩形領域が存在した場合、当該矩形領域の位置を補正する補正手段
として前記情報処理装置を機能させ、
前記文字認識手段は、前記補正手段により補正された矩形領域の位置情報を用いて、文字認識処理を行うことを特徴とするプログラム。
【請求項7】
請求項6に記載のプログラムをコンピュータ読み取り可能に記憶した記録媒体。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公開番号】特開2011−146031(P2011−146031A)
【公開日】平成23年7月28日(2011.7.28)
【国際特許分類】
【出願番号】特願2010−251186(P2010−251186)
【出願日】平成22年11月9日(2010.11.9)
【出願人】(301015956)キヤノンソフトウェア株式会社 (364)
【Fターム(参考)】