説明

文字認識装置

【課題】帳票を読取ってから文字の読取り領域を特定するまでに必要な処理の時間を短縮する。
【解決手段】帳票のバーコードの大きさおよび帳票におけるバーコードの位置が共通する帳票の種類を同一の帳票群になるように分類し、その帳票群毎にバーコードの大きさ並びに帳票におけるバーコードの位置を示す情報および帳票の種類を示す帳票種別からなる帳票分類情報(レイアウトグループテーブル60)を予め記憶部3に記憶しておき、帳票読取部2が読み取った帳票の画像情報から算出したバーコードの大きさおよび帳票における位置に基づいて帳票分類情報を検索して帳票種別を抽出し、その帳票種別の中から帳票の種類を特定して文字が存在する領域を検出するようにした。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、公共料金や各種税金の払込用紙等の複数の書式が混在する帳票の文字を認識する文字認識装置に関する。
【背景技術】
【0002】
従来の文字認識装置は、複数の書式が混在する帳票を処理する場合、予め人手で帳票を種類毎に分類する時間と労力を削減するため、帳票を画像入力手段で読取り、読取った画像から水平および垂直方向の罫線やその罫線の交点等を抽出し、さらに抽出した罫線やその罫線の交点等から枠構造の特徴を抽出し、予め各帳票の枠構造の特徴を登録した枠構造参照テーブルを参照して帳票を識別し、文字の読取り領域を検出するようにしている(例えば、特許文献1参照)。
【特許文献1】特開平9−138837号公報(段落「0012」〜段落「0013」、図1)
【発明の開示】
【発明が解決しようとする課題】
【0003】
しかしながら、近年、電気料金、ガス料金、電話料金等の公共料金や各種税金等を支払うための払込用紙等のように多数の書式の帳票が存在するようになってきている状況下において、上述した従来の技術では、抽出した帳票の枠構造の特徴と予め各帳票の枠構造の特徴を登録した枠構造参照テーブルとを照合して帳票を識別する処理を行い、文字の読取り領域を検出するようにしているため、その枠構造参照テーブルには多数の書式の帳票の枠構造の特徴が登録され、登録された多数の枠構造の特徴と照合する必要があり、帳票を読取ってから文字の読取り領域を検出するまでに必要な処理の時間が長くなってしまうという問題がある。
【0004】
本発明は、このような問題を解決することを課題とする。
【課題を解決するための手段】
【0005】
そのため、本発明は、帳票読取部で読取った帳票の画像情報から抽出した特徴に基づいて帳票の種類を特定し、その帳票の種類に応じて決定される領域の文字を認識する文字認識装置において、帳票のバーコードの大きさおよび帳票におけるバーコードの位置が共通する帳票の種類を同一の帳票群になるように分類し、その帳票群毎にバーコードの大きさ並びに帳票におけるバーコードの位置を示す情報および帳票の種類を示す帳票種別からなる帳票分類情報を予め記憶する記憶部と、読み取った帳票の画像情報からバーコードの大きさおよび帳票における位置を算出するバーコード検出手段と、前記バーコード検出手段が算出したバーコードの大きさおよび帳票における位置に基づいて前記記憶部に記憶された帳票分類情報を検索して帳票種別を抽出する帳票識別手段と、読み取った帳票の画像情報から抽出した特徴を前記帳票識別手段が抽出した帳票種別毎の特徴と照合し、帳票の種類を特定して文字が存在する領域を検出する認識領域抽出手段とを設け、帳票のバーコードの大きさおよび帳票における位置に基づいて抽出した帳票種別の中から帳票の種類を特定して文字が存在する領域を検出するようにしたことを特徴とする。
【発明の効果】
【0006】
このようにした本発明は、帳票の枠構造の特徴に基づいて検索する対象となる帳票種別を少なくすることができ、帳票を読取ってから文字の読取り領域を特定するまでに必要な処理の時間を短縮することができるという効果が得られる。
【発明を実施するための最良の形態】
【0007】
以下、図面を参照して本発明による文字認識装置の実施例を説明する。
【実施例】
【0008】
まず、第1の実施例について説明する。
図1は実施例における文字認識装置の構成を示すブロック図である。
図1において、1は文字認識装置であり、公共料金や各種税金の払込用紙等のバーコードが印刷された帳票の画像を読取り、その帳票に印刷された文字を認識するOCR(Optical Character Reader)装置等である。
【0009】
2は帳票読取部であり、CCD(Charge Coupled Device)カメラ等で構成され、一次元に配置されたイメージセンサである。この帳票読取部2は、所定の線密度で帳票に印刷された個々のバーコードに直交する方向(帳票の横方向)に走査し、帳票に印刷されたバーコードや文字を「1」、背景を「0」に2値化された画像情報を出力するものである。
【0010】
したがって出力された画像情報は、帳票の縦方向および横方向が所定の画素数で構成されている。
3は記憶部であり、メモリ素子や磁気ディスク等で構成され、情報を記憶し、また記憶した情報を読み出すことができるものである。
31は帳票イメージメモリであり、帳票読取部2で読み取った帳票の画像情報を記憶するためのものである。
【0011】
32は帳票辞書であり、帳票の種類を識別するための情報を記憶するものである。この帳票辞書32は、帳票のバーコードの大きさおよび帳票におけるバーコードの位置が共通する帳票の種類を同一のグループ(帳票群)になるように分類し、そのグループ(帳票群)毎にバーコードの大きさ並びに帳票におけるバーコードの位置を示す情報および帳票の種類を示す帳票種別からなり、帳票のバーコードの位置や大きさからその帳票が属するグループを抽出するためのレイアウトグループテーブル(帳票分類情報)、および帳票の枠構造から帳票の種類を識別するための枠構造参照テーブル等を予め記憶する。
【0012】
ここで、レイアウトグループテーブルを図6の実施例におけるレイアウトグループテーブルの説明図に基づいて説明する。
図6(a)は帳票例の説明図であり、51は帳票A、52は帳票B、53は帳票Cを表し、いずれの帳票もバーコード501が印刷等されているものとする。なお、バーコードとは、2次元コードを含む概念である。
【0013】
図6(a)において、帳票A51および帳票C53のバーコード501の幅xw_1および高さyw_1、帳票A51および帳票C53の左端からバーコード501の左端までの距離xl_1、帳票A51および帳票C53の右端からバーコード501の右端までの距離xr_1、帳票A51および帳票C53の下端からバーコード501の下端までの距離yb_1、および帳票A51および帳票C53の上端からバーコード501の上端までの距離yt_1であることを示している。
【0014】
また、帳票B52のバーコード501の幅xw_2および高さyw_2、帳票B52の左端からバーコード501の左端までの距離xl_2、帳票B52の右端からバーコード501の右端までの距離xr_2、帳票B52の下端からバーコード501の下端までの距離yb_2、および帳票B52の上端からバーコード501の上端までの距離yt_2であることを示している。
【0015】
ここで、バーコード501の大きさと位置が共通する帳票を同一のグループとなるように分類するものとし、本実施例では、帳票A51および帳票C53をレイアウトグループ1、帳票B52をレイアウトグループ2とする。
図6(b)はレイアウトグループテーブルの構成を示す説明図であり、レイアウトグループテーブル60はレイアウトグループ61、バーコード501の幅XW62、バーコード501の高さYW63、帳票50の左端からバーコード501の左端までの距離XL64、帳票50の右端からバーコード501の右端までの距離XR65、帳票50の上端からバーコード501の上端までの距離YT66、帳票50の下端からバーコード501の下端までの距離YB67、および帳票種別68で構成されている。
【0016】
本実施例では、レイアウトグループ61の「1」に、バーコード501の幅XW62がxw_1、高さYW63がyw_1、帳票50の左端からバーコード501の左端までの距離XL64がxl_1、帳票50の右端からバーコード501の右端までの距離XR65がxr_1、帳票50の上端からバーコード501の上端までの距離YT66がyt_1、帳票50の下端からバーコード501の下端までの距離YB67がyb_1、帳票種別68が「帳票A」、「帳票C」となるように対応付けられ、またレイアウトグループ61の「2」に、バーコード501の幅XW62がxw_2、高さYW63がyw_2、帳票50の左端からバーコード501の左端までの距離XL64がxl_2、帳票50の右端からバーコード501の右端までの距離XR65がxr_2、帳票50の上端からバーコード501の上端までの距離YT66がyt_2、帳票50の下端からバーコード501の下端までの距離YB67がyb_2、帳票種別68が「帳票B」となるように対応付けられているものとする。
【0017】
このようにレイアウトグループテーブル60は、多数ある帳票の種類をバーコード501の大きさと位置が共通する帳票を同一のグループとなるように分類して記憶するものであり、このレイアウトグループテーブル60を参照し、帳票のバーコードの位置や大きさからその帳票が属するグループを抽出することができる。
また、枠構造参照テーブルは、予め各帳票の枠構造の特徴を示す枠構造特徴情報(例えば、表を構成する罫線の始点や終点、交点の座標情報)を登録したものであり、帳票読取部2で読取った帳票の画像情報から画像から水平および垂直方向の罫線やその罫線の交点等を抽出し、さらに抽出した罫線やその罫線の交点等から枠構造の特徴情報を抽出し、その枠構造の特徴情報と枠構造参照テーブルの枠構造特徴情報とを照合して帳票の種類を識別することができるものである。
【0018】
図1に戻り、33は認識領域データメモリであり、文字認識の処理が必要な帳票の領域の画像情報を記憶するためのものである。
このように記憶部3は、帳票イメージメモリ31、帳票辞書32、および認識領域データメモリ33等で構成されている。
なお、記憶部3は帳票イメージメモリ31、帳票辞書32、および認識領域データメモリ33の他、文字認識装置1を制御するために必要な制御プログラム(ソフトウェア)や各種情報を記憶するものとする。
【0019】
4は制御部であり、CPU(Central Processing Unit)等の演算および制御手段等で構成され、帳票読取部2、記憶部3を含めて文字認識装置1全体の動作を記憶部3に格納された制御プログラム(ソフトウェア)に基づいて制御する。
また、制御部4は帳票イメージメモリ31に記憶された帳票の画像情報からバーコードを検出し、さらにそのバーコードの大きさや帳票における位置を検出するバーコード検出手段41、検出したバーコードの大きさや位置の情報に基づいて帳票辞書32のレイアウトグループテーブル60を検索して帳票種別を抽出する帳票識別手段42、帳票の画像情報から枠構造の特徴を抽出し、その枠構造の特徴と帳票識別手段42が抽出した帳票種別毎の枠構造の特徴(枠構造参照テーブルに記憶された枠構造の特徴)とを照合し、帳票の種類を特定して文字が存在する領域を検出する認識領域抽出手段43、抽出した文字が存在する領域の文字を認識する文字認識手段44等で構成されている。
【0020】
このように構成された文字認識装置1は、帳票読取部2で帳票を読み取り、その帳票の画像情報から文字認識が必要な領域を抽出し、その領域の画像情報に基づいて文字認識を行う。

上述した構成の作用について説明する。
【0021】
図2は実施例における文字認識装置の処理の流れを示すフローチャートであり、図中Sで表すステップにしたがって説明する。
なお、以下に説明する各部の動作は、図示しないメモリや磁気ディスク等の記憶手段に格納されたプログラム(ソフトウェア)に基づいて図示しない中央処理装置等の制御手段により制御される。
【0022】
S1:文字認識装置1の制御部4の指示により帳票読取部2は帳票を読み取り、読み取った帳票の画像情報を帳票イメージメモリ31に記憶させる。
S2:読み取った帳票の画像情報を帳票イメージメモリ31に記憶させるとバーコード検出手段41は帳票に印刷されたバーコードを検出する処理を行う。
ここで、バーコードを検出する処理を説明する。
【0023】
まず、バーコード検出手段41は、図3に示すように帳票50を図中の矢印が示す方向、すなわち帳票50に印刷された個々のバーコードに直交する方向(帳票の横方向)に走査して読み取った帳票50の画像情報を帳票イメージメモリ31から読み出し、その画像情報から数値「1」で表される黒いバーおよび数値「0」で表される白いバーが交互に出現する部分をバーコード501として検出する。
【0024】
このように帳票50に印刷された個々のバーコードに直交する方向(帳票の横方向)に走査して読み取るようにすることでバーコード501を検出する処理の期間を短くすることができる。
なお、バーコード501以外の文字が印刷された部分も解析の対象となるがその部分は公知の解析処理によりバーコードでないと判定されるものとする。
【0025】
また、上記以外のバーコード501を検出する方法として、読み取った帳票の画像情報を帳票イメージメモリ31に記憶させる際に、低解像度の画像(1次画像)を取得し、バーコード検出手段41は1次画像に対してバーコード候補の検出を行う。
検出したバーコード候補の領域を、帳票イメージメモリ31において高解像度の画像(2次画像)に変換し、バーコード検出手段41がバーコード候補の領域内からバーコードを検出する方法としてもよい。
【0026】
このように、低解像度(1次画像)で大まかにバーコード候補領域を特定してから、通常の解像度(2次画像)でバーコードを検出するため、処理時間を短縮することが出来る。
バーコード501として検出するとバーコード検出手段41は、帳票の画像情報の画素数から図4に示すようにバーコード501の幅XWおよび高さYWを算出する。すなわち、バーコード501の大きさを算出する。
【0027】
次に、バーコード検出手段41は、帳票の画像情報の画素数から図5に示すように帳票50の左端からバーコード501の左端までの距離XL、帳票50の右端からバーコード501の右端までの距離XR、帳票50の下端からバーコード501の下端までの距離YB、および帳票50の上端からバーコード501の上端までの距離YTを算出する。すなわち、帳票50におけるバーコード501の位置を算出する。
【0028】
S3:バーコード501の大きさ、位置を算出すると帳票識別手段42は算出したバーコード501の幅XWおよび高さYW、帳票50の左端からバーコード501の左端までの距離XL、帳票50の右端からバーコード501の右端までの距離XR、帳票50の下端からバーコード501の下端までの距離YB、および帳票50の上端からバーコード501の上端までの距離YTに基づいて帳票辞書32に記憶されたレイアウトグループテーブル60のバーコード501の幅XW62、高さYW63、帳票50の左端からバーコード501の左端までの距離XL64、帳票50の右端からバーコード501の右端までの距離XR65、帳票50の上端からバーコード501の上端までの距離YT66、帳票50の下端からバーコード501の下端までの距離YB67を検索して帳票種別68を抽出する。
【0029】
すなわち、読取ったバーコード501の大きさ、位置から帳票種別68を抽出する。
なお、算出したバーコード501の大きさおよび位置を示す各数値は、レイアウトグループテーブル60に記憶されている各数値と完全に一致する必要はなく、所定の範囲内にあればよいものとする。
例えば、読取ったバーコード501の幅XW62がxw_1、高さYW63がyw_1、帳票50の左端からバーコード501の左端までの距離XL64がxl_1、帳票50の右端からバーコード501の右端までの距離XR65がxr_1、帳票50の上端からバーコード501の上端までの距離YT66がyt_1、帳票50の下端からバーコード501の下端までの距離YB67がyb_1であった場合、帳票種別68は「帳票A」および「帳票C」が抽出される。
【0030】
S4:認識領域抽出手段43は、帳票の画像情報から水平および垂直方向の罫線やその罫線の交点等を抽出し、さらに抽出した罫線やその罫線の交点等から枠構造の特徴を抽出し、予め各帳票の枠構造の特徴を記憶部3に記憶された枠構造参照テーブルを参照して帳票の種類を識別する。
本実施例では、抽出した枠構造の特徴と枠構造参照テーブルの「帳票A」または「帳票C」の枠構造の特徴とを照合し、「帳票A」または「帳票C」のいずれかであることを識別する。
【0031】
本実施例では、図6(a)に示すように罫線の枠が1段である場合、「帳票A」と判定し、2段である場合、「帳票C」と判定するものとする。
帳票の種類を識別すると認識領域抽出手段43は、予め記憶部3に記憶された文字の読取り領域を抽出し、その領域の画像情報を帳票イメージメモリ31から読み出して認識領域データメモリ33に記憶させる。
【0032】
S5:文字認識手段44は認識領域データメモリ33に記憶された画像情報から文字を認識する処理を行う。
このようにして文字認識装置1は、バーコード501の大きさと位置が共通する帳票を同一のグループとなるように分類したレイアウトグループテーブル60を記憶部3に予め記憶しておき、帳票読取部2で読取った帳票の画像情報からバーコード検出手段41が帳票50のバーコード501の大きさ、位置を算出し、帳票識別手段42がそのバーコード501の大きさ、位置に基づいてレイアウトグループテーブル60を検索してグループ化された帳票種別68を抽出し、その帳票種別から帳票の枠構造の特徴に基づいて帳票の種類を識別してその帳票の文字を認識する処理を行う。
【0033】
以上説明したように、本実施例では、バーコードの大きさと位置が共通する帳票を同一のグループとなるように分類したレイアウトグループテーブルを記憶部に記憶し、読取った帳票の画像情報から算出したバーコードの大きさ、位置に基づいてそのレイアウトグループテーブルを検索してグループ化された帳票種別を抽出するようにしたことにより、帳票の枠構造の特徴に基づいて検索する対象となる帳票種別を少なくすることができ、帳票を読取ってから文字の読取り領域を特定するまでに必要な処理の時間を短縮することができるという効果が得られる。
【図面の簡単な説明】
【0034】
【図1】実施例における文字認識装置の構成を示すブロック図
【図2】実施例における文字認識装置の処理の流れを示すフローチャート
【図3】実施例におけるバーコード検出方法の説明図
【図4】実施例におけるバーコードの大きさを算出する方法の説明図
【図5】実施例におけるバーコードの位置を算出する方法の説明図
【図6】実施例におけるレイアウトグループテーブルの説明図
【符号の説明】
【0035】
1 文字認識装置
2 帳票読取部
3 記憶部
31 帳票イメージメモリ
32 帳票辞書
33 認識領域データメモリ
4 制御部
41 バーコード検出手段
42 帳票識別手段
43 認識領域抽出手段
44 文字認識手段
50、51、52、53 帳票
501 バーコード

【特許請求の範囲】
【請求項1】
帳票読取部で読取った帳票の画像情報から抽出した特徴に基づいて帳票の種類を特定し、その帳票の種類に応じて決定される領域の文字を認識する文字認識装置において、
帳票のバーコードの大きさおよび帳票におけるバーコードの位置が共通する帳票の種類を同一の帳票群になるように分類し、その帳票群毎にバーコードの大きさ並びに帳票におけるバーコードの位置を示す情報および帳票の種類を示す帳票種別からなる帳票分類情報を予め記憶する記憶部と、
読み取った帳票の画像情報からバーコードの大きさおよび帳票における位置を算出するバーコード検出手段と、
前記バーコード検出手段が算出したバーコードの大きさおよび帳票における位置に基づいて前記記憶部に記憶された帳票分類情報を検索して帳票種別を抽出する帳票識別手段と、
読み取った帳票の画像情報から抽出した特徴を前記帳票識別手段が抽出した帳票種別毎の特徴と照合し、帳票の種類を特定して文字が存在する領域を検出する認識領域抽出手段とを設け、
帳票のバーコードの大きさおよび帳票における位置に基づいて抽出した帳票種別の中から帳票の種類を特定して文字が存在する領域を検出するようにしたことを特徴とする文字認識装置。
【請求項2】
請求項1の文字認識装置において、
前記バーコードの大きさは、バーコードの幅および高さ、
前記バーコードの帳票における位置は、帳票の左端からバーコードの左端までの距離、帳票の右端からバーコードの右端までの距離、帳票の下端からバーコードの下端までの距離、および帳票の上端からバーコードの上端までの距離としたことを特徴とする文字認識装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2008−186399(P2008−186399A)
【公開日】平成20年8月14日(2008.8.14)
【国際特許分類】
【出願番号】特願2007−21656(P2007−21656)
【出願日】平成19年1月31日(2007.1.31)
【出願人】(000000295)沖電気工業株式会社 (6,645)
【Fターム(参考)】