説明

情報処理装置、情報処理方法ならびに記憶媒体、プログラム

【課題】 マーク認識を行う帳票処理装置において、登録帳票画像データとして、記入済みの帳票を利用できるようにする。
【解決手段】 マーク認識処理方法であって、登録帳票画像データの特徴量と、マーク領域の画像データと、マーク領域が記入済みか否かを示すマーク情報とを登録する工程(ステップS1806)と、判定対象帳票画像データの特徴量と、登録帳票画像データの特徴量とに基づいて、該判定対象帳票画像データを特定する工程(ステップS1810)と、前記特定された登録帳票画像データに含まれるマーク領域の画像データと、前記判定対象帳票画像データに含まれるマーク領域の画像データとを前記マーク情報に応じて比較し、マーク領域におけるマークの有無を、前記比較結果に基づいて判定する工程(ステップS1811)とを備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、所定のマークを記入するための領域が設けられた帳票を読み込むことにより生成された、画像データを処理するための処理技術に関するものである。
【背景技術】
【0002】
一般に、帳票中に印字された文字で構成される複数の選択項目のうち、所定の領域にマークを記入することによって選択された選択項目を特定するマーク認識機能(以下、OMR)を備える帳票処理装置が知られている。
【0003】
従来の帳票処理装置におけるOMRは、人間の目には識別できるが機械では読み取られないような特定のドロップアウト・カラーを用いて、マーク記入用の案内文字等が印刷された帳票を処理対象としてきた。そして、複数の案内文字上のいずれかに、例えば黒色の鉛筆等でマークが記入されていると、これを検出し、どの選択項目が選択されたかを判定していた。
【0004】
OMRでは、帳票上に印刷された案内文字と記入されたマークの色との相違によってマークのみを検出し、その検出されたマークの帳票上の位置に基づいて選択された選択項目を判定する。
【0005】
しかしながら、上記OMRでは、特定の色をドロップアウト・カラーとして読み取らないようにするために、光学フィルタを用いている。このため、ドロップアウト・カラーとして設定することができる色は限られ、それ以外の色をドロップアウト処理することは困難であった。
【0006】
かかる問題を解決するための発明としては、例えば、特開2001−126019号公報などが挙げられる。同公報によれば、マークが記入される領域(「読み取り領域」)が全て未記入となっている帳票の各読み取り領域の画像データ(「未記入画像データ」)を予め登録しておく。その上で、処理対象となる他の帳票の各読み取り領域の画像データと比較することでマークが記入されているか否かを判定することとしている。
【特許文献1】特開2001−126019号公報
【発明の開示】
【発明が解決しようとする課題】
【0007】
しかしながら、上記特許文献1に開示された発明の場合、登録する画像データは未記入画像データである必要があり、ユーザが未記入画像データを所有していない場合などには判定を行うことができないという問題があった。
【0008】
本発明は、上記課題に鑑みてなされたものであり、帳票の各読み取り領域が全て未記入ではない場合でも、当該帳票の各読み取り領域の画像データに基づいて、他の帳票の読み取り領域におけるマークの有無を判定できるようにすることを第一の目的とする。
【0009】
更に、マークの有無の判定を繰り返し実行することにより、未記入画像データを自動生成することで、より精度の高い判定を実現できるようにすることを第二の目的とする。
【課題を解決するための手段】
【0010】
上記の目的を達成するために本発明に係る情報処理装置は以下のような構成を備える。即ち、
マークを記入するための領域が設けられた帳票を読み込むことにより生成された、画像データを処理する情報処理装置であって、
前記生成された画像データを登録画像データとして特定するための特徴量を登録する特徴量登録手段と、
前記登録画像データに含まれる、前記領域の画像データを、前記特徴量と対応付けて登録する領域画像登録手段と、
前記領域の画像データにマークが記入されているか否かを示すマーク情報を、該領域の画像データに対応付けて登録するマーク情報登録手段と、
入力される画像データの特徴量と、前記登録画像データの特徴量とに基づいて、該入力される画像データが前記登録画像データのいずれに該当するかを特定する特定手段と、
前記特定手段により特定された前記登録画像データに含まれる、前記領域の画像データ内の予め定められた濃度以上の画素の数と、前記入力される画像データに含まれる、前記領域の画像データ内の予め定められた濃度以上の画素の数とを、前記マーク情報に基づいて比較する比較手段と、
前記入力される画像データに含まれる、前記領域におけるマークの有無を、前記比較手段における比較結果に基づいて判定する判定手段とを備える。
【発明の効果】
【0011】
本発明によれば、帳票の各読み取り領域が全て未記入ではない場合でも、当該帳票の各読み取り領域の画像データに基づいて、他の帳票の読み取り領域におけるマークの有無を判定できるようにすることが可能となる。
【0012】
更に、マークの有無の判定を繰り返し実行することにより、未記入画像データを生成することで、より精度の高い判定が実現できるようになる。
【発明を実施するための最良の形態】
【0013】
以下、本発明の一実施形態について図面を参照して詳細に説明する。
【0014】
1.帳票処理装置のハードウェア構成
図1は本発明の一実施形態にかかる情報処理装置を備える帳票処理装置のハードウェア構成を示す図である。図1に示すように帳票処理装置は、CPU101、メモリ102、ハードディスク103、入力部104、出力部105、画像読み取り装置106、画像信号変換装置107がそれぞれシステムバス108を介して互いに通信可能に接続されている。システムバス108は、例えばPCIバス、AGPバス、メモリバス等を意味する。なお、図1では、各バス間の接続用チップやキーボードインタフェースやいわゆるSCSIやATAPIのような入出力用インタフェースは省略されている。
【0015】
CPU101は、オペレーションシステム(OS)や各種アプリケーションプログラムに基づいて、四則演算や比較演算等の各種演算を行ったり、ハードディスク103の制御を行う。メモリ102は、CPU101実行時にはハードディスク103等の記憶媒体から読み出されたオペレーションシステムや各種アプリケーションプログラム等が記憶されるとともに、ワーク領域として用いられる。
【0016】
入力部104は、例えば、キーボードやマウス等、ユーザが帳票処理装置に対する指示を入力するための機能を備える。出力部105はディスプレイ装置(例えば、CRTやLCD)やプリンタ装置等、帳票処理装置における処理結果を出力するための機能を備える。
【0017】
画像読み取り装置106は、例えば、スキャナやファックス等、紙媒体の情報を読み取り、画像信号を生成する機能を備える。画像信号変換装置107は画像読み取り装置106が読み取った多値の画像信号を2値の白黒の画像信号に変換する。ハードディスク103は、オペレーションシステム(OS)103−1やアプリケーションプログラム(以下で説明するフローチャートを実行可能なプログラムも含む)103−2および登録帳票データベース(以下、登録帳票DB)103−3を格納している。
【0018】
2.登録帳票DBの構成
次に、ハードウェア103に格納されている登録帳票DB103−3の詳細について説明する。なお、以降、説明にあたっては、登録帳票画像データとして、図4に示す登録帳票画像データ400を、判定対象となる画像データとして図5の判定対象帳票画像データ500を具体例として用いることとする。
【0019】
図2はハードウェア103が格納している登録帳票DB103−3の構成を示す図である。登録帳票DB103−3は、判定処理の際の雛型となる帳票の画像データ(以下、登録帳票画像データ)の関連情報を格納するDBであり、レコード単位で格納されている(201)。それぞれのレコード(図2の例ではレコード1乃至3)は“登録特徴量”格納領域202と、“画像情報”格納領域203と、“テンプレート情報”格納領域204とを備える。
【0020】
“登録特徴量”格納領域202は、登録帳票画像データを構成する各属性別のブロックの特徴量を格納する領域である。具体的には、テキストブロック、イメージブロック、ラインブロックのサイズや位置情報等、登録帳票画像データを特定するための特徴量が格納されている。
【0021】
図4の登録帳票画像データ400の例では、テキストブロックとして401の特徴量が、イメージブロックとして402の特徴量が、ラインブロックとして403の特徴量がそれぞれ登録されることとなる。
【0022】
“画像情報”格納領域203は、登録帳票画像データの読み取り領域の画像データを格納する領域である。図4の登録帳票画像データ400の例では、読み取り領域400A、400B、400C、400Dがそれぞれ登録されることとなる。
【0023】
“テンプレート情報”格納領域204は、読み取り領域の画像データのテンプレート情報を格納する領域である。
【0024】
図3は“テンプレート情報”格納領域204に格納されるテンプレート情報の一例を示す図である。テンプレート情報300は、左上座標部301と右下座標部302と状態部303とを備える。
【0025】
左上座標部301は、登録帳票画像データ400の各読み取り領域(400A、400B、400C、400D)の左上端部の位置を示す。右下座標部302は、登録帳票画像データ400の各読み取り領域(400A、400B、400C、400D)の右下端部の位置を示す。
【0026】
また、状態部303は、登録帳票画像データ400の各読み取り領域が、マークが記入されている“記入済み状態”であるのか、マークが記入されていない“未記入状態”であるのかを示す情報が格納されている。なお状態部303がONの場合は登録帳票画像データの当該読み取り領域の画像データは記入済み状態にあることを、OFFの場合は未記入状態にあることをそれぞれ示している。
【0027】
3.帳票処理装置における判定処理の流れ
次に帳票処理装置における判定処理の流れについて説明する。
【0028】
3.1 判定処理全体の流れ
図18は、本発明の一実施形態にかかる帳票処理装置における判定処理全体の流れを示す図である。
【0029】
ステップS1801では、ユーザより、画像読み取り装置106を通じて雛形となる帳票の読み取り指示を受け付ける。雛形となる帳票の読み取り指示を受け付けると、ステップS1802では、画像読み取り装置106が当該帳票を読み取り、ステップS1803では、画像信号変換部107を通じて2値の登録帳票画像データ400を生成する。
【0030】
なお、ステップS1803にて生成された登録帳票画像データ400はメモリ103に読み込まれ、出力部105を通じて表示出力される。これにより、ユーザは出力部105を通じて登録帳票画像データ400を確認することができる。
【0031】
ステップS1804では、ユーザによる当該テンプレート情報300の入力を受け付ける。ここで、ユーザは登録帳票画像データ400を確認すると、入力部104を介して、当該登録帳票画像データ400の各読み取り領域のテンプレート情報300(「位置情報」およびマークの有無を示す「状態」ON/OFF)を入力する。登録帳票画像データ400の場合、読み取り領域として400A〜400Dの4領域がある。このため、各読み取り領域400A〜400Dのテンプレート情報として304〜307(図3)に示す情報が入力されることとなる。なお、このテンプレート情報の入力は、表示されている登録帳票画像上で、マウスポインタやタッチパネルなどを用いて指定されることにより行われるものとするが、直接座標値を入力するようにしても構わない。
【0032】
ユーザはテンプレート情報300の入力が終了すると、入力部104を通じて帳票登録処理命令を行う。
【0033】
そこで、ステップS1805では、入力部104を通じて帳票登録処理命令を受信すると、当該テンプレート情報300をメモリ102に読み込むことで、テンプレート情報300を取得する。さらに、登録帳票画像データとテンプレート情報とに基づいて、ステップS1806では帳票登録処理を実行する(帳票登録処理の詳細は後述)。帳票登録処理が終了すると、出力部105を通じて帳票登録処理終了をユーザへ通知する。このようにして帳票登録処理が行われると、帳票認識処理(マーク認識処理)を行うことができるようになる。
【0034】
次に帳票認識処理の概要を説明する。ステップS1807にて、ユーザによる判定対象帳票の読み取り指示を受け付けると、ステップS1808では、画像読み取り装置106が当該帳票を読み取る。そして、ステップS1809では、画像信号変換装置107を通じて2値の判定対象帳票画像データ500を生成する。生成された2値の判定対象帳票画像データ500はメモリ102に読み込まれ、ステップS1810にて帳票認識処理が実行される(なお、帳票認識処理の詳細は後述する)。
【0035】
ステップS1811では、ステップS1810における帳票認識処理にて抽出された登録帳票画像データ400のレコード情報201をメモリ102に読み込む。続いてレコード情報201内の“テンプレート情報”格納領域204に格納されているテンプレート情報300を参照し、判定対象帳票画像データ500の各読み取り領域500A、500B、500C、500Dのマーク認識処理を行う。なお、マーク認識処理の詳細は後述する。
【0036】
ステップS1812では、出力部105を通じてマーク認識処理結果をユーザに通知する。ユーザは出力部105を通じてマーク認識処理結果を認識する。最後に以後のマーク認識処理を効率的に行うために、ステップS1813では登録帳票DB103−3の更新処理を行う(登録帳票DB103−3の更新処理の詳細は後述する)。
【0037】
3.2 帳票登録処理(ステップS1806)の流れ
次に、図19を用いて、帳票登録処理(ステップS1806)の詳細を説明する。
【0038】
ステップS1901では、メモリ102上にある登録帳票画像データ400から各属性別のブロックの特徴量を抽出する。
【0039】
ステップS1902では、抽出した特徴量と類似する登録特徴量202を持つレコードを登録帳票DB103−3内から検索する。
【0040】
ステップS1902における検索の結果、該当するレコードが存在する場合には、すでに当該登録帳票画像データと同一の登録帳票画像データが登録されていると判断し、ステップS1904に進む。ステップS1904では、ユーザに既に登録帳票DB103−3に、該当する登録帳票画像データが存在することを出力部105を通じて通知する。なお、この通知の際に、当該検索された帳票画像を表示し、実際に同じかどうかユーザに確認させるように構成しても構わない。
【0041】
一方、ステップS1902における検索の結果、該当するレコードが存在しない場合には、ステップS1905に進む。ステップS1905では、当該登録帳票画像データを登録すべく、登録帳票DB103−3に新たにレコードを作成する。更に、ステップS1906で“登録特徴量”格納領域202に登録帳票画像データ400の特徴量を格納する。更に、ステップS1907では、ステップS1804〜S1805でユーザにより入力されたテンプレート情報が、“テンプレート情報”格納領域204に格納される。ステップS1908では、“画像情報”格納領域203に登録帳票画像データ400の読み取り領域の画像データがそれぞれ格納される。
【0042】
3.3 帳票認識処理(ステップS1810)の流れ
次に図20を用いて、帳票認識処理(ステップS1810)の詳細を説明する。
【0043】
ステップS2001にて、入力部104を介して帳票認識処理の指示が入力されると、ステップS2002では、これを受信し、ステップS2003では、メモリ102上にある判定対象帳票画像データ500から特徴量を抽出する。
【0044】
ステップS2004では、抽出した特徴量と類似する登録特徴量202を持つレコードを登録帳票DB103−3内から検索する。
【0045】
ステップS2004における検索の結果、該当するレコードが存在しないと判定された場合には、ユーザにその旨を通知し(ステップS2006)、帳票登録処理を促した後、ステップS1814に戻り、処理を終了する。一方、該当するレコードが存在する場合は、該当するレコード201(ここでは、登録帳票画像データ400)をメモリ102上に読み込む。
【0046】
3.4 マーク認識処理(ステップS1811)の流れ
次に図21を用いて、マーク認識処理(ステップS1811)の詳細を説明する。
【0047】
ステップS2101では、マーク認識処理の結果を格納するための認識結果ファイルを作成する。図7は認識結果ファイルの一例を示す図である。
【0048】
認識結果ファイル700は判定対象帳票画像データ500の各読み取り領域500A、500B、500C、500Dのマーク認識処理の結果を格納するためのファイルである。各読み取り領域に対応して設けられた認識結果格納領域には、ONまたはOFFのいずれかが格納される。ONは「マークが記入されている」画像データであることを、OFFは「マークが記入されていない」画像データであることを示す。
【0049】
なお、ステップS2101にて認識結果ファイル700を作成した際には、各読み取り領域に対応する認識結果格納領域は全てOFFで初期化する。
【0050】
ステップS2102では、メモリ102上にある登録帳票画像データ400の各読み取り領域の特徴量を抽出し、ステップS2103では、テンプレート情報を抽出する。
【0051】
ステップS2104では、判定対象帳票画像データ500の各読み取り領域(500A乃至500D)の画像データを抽出する。ステップS2105では、登録帳票画像データの各読み取り領域(400A乃至400D)の画像データを抽出する。
【0052】
ステップS2106では、読み取り領域Aの画像データ400Aと画像データ500Aとを比較する(以下、「比較処理」と称す。なお、比較処理の詳細は後述。)。比較処理が終了すると、ステップS2107では、当該処理結果を認識結果ファイル700の読み取り領域Aの認識結果格納領域に格納する。
【0053】
ステップS2108では、上記比較処理を全ての読み取り領域A、B、C、Dにおいて行ったか否かを判定する。比較処理を行っていない読み取り領域があると判定された場合には、ステップS2104に戻る。一方、全ての読み取り領域について比較処理を完了したと判定された場合には、ステップS2109に進む。
【0054】
ステップS2109では、出力部105を通じて認識結果ファイル700を出力する。
【0055】
3.5 比較処理(ステップS2106)の流れ
次に、図22を用いて、比較処理(ステップS2106)の詳細を説明する。なお、上記各処理の説明にあたっては、便宜上、登録帳票画像データ400と判定対象帳票画像データ500とを用いたが、ここでは、より実際の画像に近い形で説明するために、読み取り領域Aに特化して説明を行うこととする。
【0056】
図9のA901〜A907は、それぞれ、登録帳票画像データ400または、判定対象帳票画像データ500の読み取り領域Aの様々なパターンの画像データの具体例を示すものである。
【0057】
ステップS2201では、メモリ102上にある登録帳票画像データのテンプレート情報300における読み取り領域Aの状態部303がONであるのかOFFであるのかを参照する。
【0058】
テンプレート情報300における読み取り領域Aの状態部がOFFであった場合には、ステップS2210に進む。なお、テンプレート情報300における読み取り領域Aの状態部がOFFであった場合とは、具体的には、図9の画像データA902のように、マークが付けられていない読み取り領域Aの画像データが登録されていた場合である。
【0059】
このとき、画像データA901〜A907のいずれかが、判定対象帳票画像データ500の読み取り領域Aの画像データとして入力され、比較された場合を考える。ステップS2210では、登録帳票画像データ400の読み取り領域Aの画像データA902の黒画素数と判定対象帳票画像データ500の読み取り領域Aの画像データ(A901〜A907のいずれか)の黒画素数とをそれぞれ算出する。なお、黒画素数とは、画像データを構成する各画素のうち、所定の濃度以上の濃度を有する画素の数をいう。
【0060】
ステップS2211では、登録帳票画像データ400の読み取り領域Aの画像データの黒画素数と判定対象帳票画像データ500の読み取り領域Aの画像データの黒画素数とを比較する。
【0061】
判定対象帳票画像データ500の読み取り領域Aの画像データの黒画素数が、登録帳票画像データ400の読み取り領域Aの画像データの黒画素数よりも多い場合には、ステップS2213に進む。
【0062】
ステップS2213では、認識結果ファイル700の読み取り領域Aの認識結果格納領域にONを格納する。
【0063】
このように、画像データA902が登録帳票画像データ400の読み取り領域Aの画像データ(状態OFF)として登録されていた場合には、認識結果格納領域は次のようになる。すなわち、画像データA901、A903〜907が判定対象帳票画像データの読み取り領域Aとして入力された場合、認識結果格納領域はONとなる。
【0064】
一方、ステップS2202において、テンプレート情報300における読み取り領域Aの状態部がONであった場合には、ステップS2203に進む。なお、読み取り領域Aの状態部がONであった場合とは、具体的には、例えば、図9の画像データA901、A903〜A907のように、マークが付けられている登録帳票画像データ400の読み取り領域Aの画像データが登録されていた場合である。
【0065】
ここでは、画像データA901がテンプレート情報として登録されており、判定対象帳票画像の画像データとして画像データA902〜A907が順次入力された場合について説明する。ステップS2203では、画像データA901に対して横方向(X方向)にスキャンを行って黒画素数をカウントし、黒画素ヒストグラムA1001(図10)を生成する。更に、画像データA901に対して縦方向(Y方向)にスキャンを行って黒画素数をカウントし、黒画素ヒストグラムA1301(図13)を生成する。(なお、図13では、比較を行いやすいように、ヒストグラムを90度回転させた状態で説明している。)
ステップS2204では、画像データA901と同様に、判定対象帳票画像データ500の読み取り領域Aの画像データA902〜A907に対して横方向(X方向)にスキャンして、黒画素ヒストグラムA1002〜A1007(図10)を生成する。更に、画像データA902〜A907に対して縦方向(X方向)にスキャンして黒画素ヒストグラムA1302〜A1307(図13)を生成する。
【0066】
ステップS2205では、横方向の登録帳票画像の黒画素ヒストグラムA1001と判定対象帳票画像の黒画素ヒストグラムA1002〜A1007との増減推移変化位置(本実施例ではヒストグラムの増減の変化が最も大きい個所とする。以下では、この部分を「特徴部」と称す)を算出する。図10において、A1008〜A1014は、横方向の黒画素ヒストグラムA1001〜A1007の特徴部を示す。
【0067】
更に、それら特徴部A1008〜A1014の読み取り領域の原点A1015に対するY方向の画素単位の位置を示す位置情報を算出する。図11のA1101〜A1107は、読み取り領域Aの画像データの横方向の黒画素ヒストグラムの特徴部A1008〜A1014の原点A1015に対するY方向の位置情報を示している。
【0068】
更に、算出された位置情報のうち、位置情報A1101と、位置情報A1102〜A1107とを順次比較する。
【0069】
ステップS2206で位置情報A1101と位置情報A1102〜A1107に相違がある場合には、位置情報A1102〜A1107を位置情報A1101に合わせるべく位置補正を行う。これにより、特徴部A1009〜A1014の原点A1015に対するY方向の位置が一致する。
【0070】
黒画素ヒストグラムA1002〜A1007の位置補正後の黒画素ヒストグラムを図12に示す。図12において、黒画素ヒストグラムA1202〜A1207は、それぞれ黒画素ヒストグラムA1002〜A1007を位置補正したものに対応する。なお、参考のために、黒画素ヒストグラム1001も合わせて図示している。
【0071】
図10では、位置補正前の黒画素ヒストグラムA1002〜A1007の特徴部A1009〜A1014のうち、黒画素ヒストグラムA1007の特徴部A1014だけが、黒画素ヒストグラムA1001の特徴部A1008よりも下方向にずれていた。しかし、図12に示すように、位置補正後の黒画素ヒストグラムA1002〜A1007の特徴部A1009〜A1014の位置は、すべて黒画素ヒストグラムA1001の特徴部1008の位置に一致している。
【0072】
このように、位置補正を行うのは、一般的にスキャナなどの画像読み取り装置106から帳票を読み込むと画像のずれが生じ、読み取り領域のそれぞれの位置情報A1101〜A1107には相違が発生する可能性が高いためである。
【0073】
かかる位置補正は、縦方向についても同様に行う。具体的には、まず黒画素ヒストグラムA1301と黒画素ヒストグラムA1302〜A1307の特徴部A1308〜A1314を算出する。そして、特徴部A1308〜A1314の読み取り領域の原点A1315に対する画素単位の位置を示す位置情報を算出する。図14のA1401〜A1407は、読み取り領域Aの画像データの縦方向の黒画素ヒストグラムの特徴部A1308〜A1314の原点A1315に対するX方向の位置情報を示している。
【0074】
算出された位置情報について、位置情報A1401とA1402〜A1407とを順次比較し、相違がある場合は、位置情報A1402〜A1407を位置情報A1401に合わせるべく位置補正を行う。
【0075】
図14の場合、特徴部A1311、A1314以外の特徴部の位置情報(A1402、A1403、A1405、A1406)が特徴部A1308の位置情報A1401と相違する。したがって、黒画素ヒストグラムA1302、A1303、A1305、A1306がX方向の位置補正の対象となる。図15に位置補正後の黒画素ヒストグラムを示す。
【0076】
ステップS2207では、位置補正後の横方向の黒画素ヒストグラムA1001と黒画素ヒストグラムA1202〜A1207との各画素単位における黒画素数の多さを順次比較する。
【0077】
図16は、横方向の黒画素ヒストグラムA1001ならびに黒画素ヒストグラムA1202〜1207の所定の位置(A1208〜A1211)における黒画素数を示す図である。なお、位置A1208〜A1211は図12に示すとおりである。
【0078】
図16によれば、例えば、位置A1208では、黒画素ヒストグラムA1001の黒画素数は0であるのに対して、黒画素ヒストグラムA1206の黒画素数は20である。また、位置A1209では、黒画素ヒストグラムA1001の黒画素数は7であるのに対して、黒画素ヒストグラムA1203の黒画素数は13である。また、位置A1210では、黒画素ヒストグラムA1001の黒画素数は10であるのに対して、黒画素ヒストグラムA1204の黒画素数は14である。更に、位置A1211では、黒画素ヒストグラムA1001の黒画素数は4であるのに対して、黒画素ヒストグラムA1203の黒画素数は6である。
【0079】
つまり、黒画素ヒストグラムA1203〜A1207は、いずれかの位置において黒画素ヒストグラムA1001よりも黒画素数が多い。このように、判定対象帳票画像データにマークが記入されていた場合、たとえマークが記入された画像データを登録帳票画像データとして登録していたとしても、画素位置単位で比較すれば、必ず判定対象帳票画像データの黒画素数の方が多くなる位置が存在する。
【0080】
逆に、判定対象帳票画像データにマークが記入されていなければ、画素位置単位で黒画素数を比較しても、全ての画素位置において、判定対象帳票画像データの黒画素数が小さくなることとなる。
【0081】
このように、マークが付された画像データを登録帳票画像データとして登録されていた場合(つまり、ステップS2202においてYesの場合)には、黒画素ヒストグラムの黒画素数を画素位置単位で比較することで、マークの有無を判定することができる。
【0082】
なお、ステップS2207では、位置補正後の縦方向の黒画素ヒストグラムA1301と黒画素ヒストグラムA1502〜A1507との各画素単位における黒画素の多さについても順次比較する。
【0083】
図17は、縦方向の黒画素ヒストグラムA1301ならびに黒画素ヒストグラムA1502〜A1507の所定の位置(A1508〜A1515)における黒画素数を示す図である。なお、位置A1508〜A1515は図15に示すとおりである。
【0084】
図17によれば、位置A1508では、黒画素ヒストグラムA1301の黒画素数は0であるのに対して、黒画素ヒストグラムA1507の黒画素数は5である。また、位置A1509では、黒画素ヒストグラムA1301の黒画素数は3であるのに対して、黒画素ヒストグラムA1505の黒画素数は6である。以下同様に、黒画素ヒストグラムA1202以外の黒画素ヒストグラム(A1503〜A1507)には、横方向の場合同様、黒画素ヒストグラムA1301よりも黒画素数が多くなる画素位置が存在する。
【0085】
ステップS2207における比較の結果、判定対象帳票画像データの黒画素ヒストグラムが登録帳票画像データの黒画素ヒストグラムより黒画素数が所定閾値以上多い画素位置がある場合には、マークが記入されていると判断する。また、黒画素数が多い画素位置がない場合にはマークが記入されていないと判断する。つまり、ステップS2208において、「Yes」の場合には、ステップS2209に進み、「No」の場合には、比較処理を終了する。なお、S2208で、全く同じヒストグラム形状であると判断した場合は、登録帳票画像データと同様であるとして、S2209に進み記入あり(ON)と判断する。
【0086】
ステップS2209では、認識結果ファイル700の読み取り領域Aの認識結果格納領域にONを格納する。
【0087】
また、画像データA901が登録帳票画像データ400の読み取り領域Aの画像データ(状態ON)として登録されていた場合には、画像データA903〜907が属する各判定対象帳票画像データについては、読み取り領域Aの認識結果格納領域がONとなる。なお、画像データA902が属する判定対象帳票画像データについては、読み取り領域Aの認識結果格納領域はOFFのままである。
【0088】
このように、本実施形態にかかる帳票処理装置では、テンプレート情報がOFFの場合には、黒画素数の総数を比較することにより、マークの有無を判定する。また、テンプレート情報がONの場合には、横方向及び縦方向の黒画素ヒストグラムを作成し、画素単位の黒画素数を比較することにより、マークの有無を判定する。つまり、テンプレート情報に基づいて、比較処理を実行する点に特徴がある。
【0089】
なお、ここでは説明のために横方向、縦方向の黒画素ヒストグラムにおける処理を同時に進行することとしたが、特にこれに限られない。例えば、片方の黒画素ヒストグラム比較において既にONと判断された黒画素ヒストグラムについては他方の黒画素ヒストグラムの処理を行わないなどして処理量を減らすようにしても良い。
【0090】
3.6 更新処理(ステップS1813)の流れ
図23は登録帳票DB103−3の更新処理の詳細を説明する図である。
【0091】
認識結果ファイル700を出力すると、ステップS2301では、テンプレート情報300の読み取り領域の状態部303を参照する。状態部303がONの場合には(ステップS2302においてYesの場合には)、ステップS2303に進む。(なお、ステップS2302でNoと判断した場合はステップS2307に進む。)
ステップS2303では、認識結果ファイル700の読み取り領域の処理結果を参照する。ステップS2303における参照の結果、OFFの場合は(ステップS2304においてYesの場合には)、ステップS2305に進む。一方、認識結果ファイル700の読み取り領域の処理結果がONの場合は(ステップS2304においてNoの場合には)ステップS2307に進む。
【0092】
ステップS2305では、メモリ102上の登録帳票画像データ400の読み取り領域の画像データに判定対象帳票画像データ500の読み取り領域の画像データを上書きする。更に、ステップS2306では、テンプレート情報300の読み取り領域の状態部303をOFFにする。
【0093】
ステップS2307では、上記処理を全ての読み取り領域A〜Dに対して行う。全ての読み取り領域に対して画像情報更新処理(ステップS2305)を実行すると、メモリ102上の登録帳票画像データ400は、登録帳票画像データ800(図8)のようになる。また、全ての読み取り領域に対してテンプレート情報更新処理(ステップS2306)を実行すると、メモリ102上のテンプレート情報300は、テンプレート情報600(図6)のようになる。
【0094】
全ての読み取り領域A〜Dに対して上記処理を実行したと判定された場合には、ステップS2308に進み、更新履歴情報の有無を判定する。
【0095】
ステップS2308において、更新履歴情報があると判定された(いずれかの読み取り領域に対して更新処理が実行されたと判定された)場合には、ステップS2309で登録帳票画像データ800の特徴量を抽出する。また、ステップS2310では、登録帳票DB103−3内のレコード201の“画像情報”格納領域203に登録帳票画像データ800の読み取り領域の画像データを格納する。
【0096】
ステップS2311では、“登録特徴量”格納領域202に抽出した特徴量を格納する。更にステップS2312では、“テンプレート情報”格納領域204にテンプレート情報を格納する。
【0097】
一方、メモリ102上の登録帳票画像データ400を更新していない場合(ステップS2308においてNoの場合)、処理を行わない。以上で登録帳票DB103−3の更新処理を終了する。
【0098】
以上の説明から明らかなように、本実施形態によれば、帳票の各読み取り領域が全て未記入でない場合でも、当該帳票の各読み取り領域の画像データに基づいて、他の帳票の読み取り領域におけるマークの有無を判定することが可能となる。
【0099】
更に、マークの有無の判定を実行することにより、各読み取り領域が、未記入の画像データによって更新されていき、各読み取り領域が全て未記入の画像データにより登録帳票DBを構成することが可能となる。この結果、マークの有無の判定がより高い精度で実現できるようになる。
【0100】
4.他の実施形態
なお、本発明は、複数の機器(例えばホストコンピュータ、インタフェイス機器、リーダ、プリンタなど)から構成されるシステムに適用しても、一つの機器からなる装置(例えば、複写機、ファクシミリ装置など)に適用してもよい。
【0101】
また、本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給するよう構成することによっても達成されることはいうまでもない。この場合、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読出し実行することにより、上記機能が実現されることとなる。なお、この場合、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。
【0102】
プログラムコードを供給するための記憶媒体としては、例えば、フロッピ(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、磁気テープ、不揮発性のメモリカード、ROMなどを用いることができる。
【0103】
また、コンピュータが読出したプログラムコードを実行することにより、前述した実施形態の機能が実現される場合に限られない。例えば、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0104】
さらに、記憶媒体から読出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、前述した実施形態の機能が実現される場合も含まれる。つまり、プログラムコードがメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって実現される場合も含まれる。
【図面の簡単な説明】
【0105】
【図1】本発明の一実施形態にかかる情報処理装置を備える帳票処理装置のハードウェア構成を示す図である。
【図2】ハードウェア103が格納している登録帳票DB103−3の構成を示す図である。
【図3】“テンプレート情報”格納領域204に格納されるテンプレート情報の一例を示す図である。
【図4】登録帳票画像データの一例を示す図である。
【図5】判定対象帳票画像データの一例を示す図である。
【図6】更新処理後のテンプレート情報の一例を示す図である。
【図7】認識結果ファイルの一例を示す図である。
【図8】更新処理後の登録帳票画像データの一例を示す図である。
【図9】読み取り領域の画像データの一例を示す図である。
【図10】読み取り領域の画像データを横方向に投射した黒画素ヒストグラムを示す図である。
【図11】読み取り領域の画像データを横方向に投射した黒画素ヒストグラムの特徴部の位置情報を示す図である。
【図12】読み取り領域の画像データを横方向に投射した黒画素ヒストグラムの位置補正後の状態を示す図である。
【図13】読み取り領域の画像データを縦方向に投射した黒画素ヒストグラムを示す図である。
【図14】読み取り領域の画像データを縦方向に投射した黒画素ヒストグラムの特徴部の位置情報を示す図である。
【図15】読み取り領域の画像データを縦方向に投射した黒画素ヒストグラムの位置補正後の状態を示す図である。
【図16】読み取り領域の画像データを横方向に投射した黒画素ヒストグラムの各画素位置における黒画素数を示す図である。
【図17】読み取り領域の画像データを縦方向に投射した黒画素ヒストグラムの各画素位置における黒画素数を示す図である。
【図18】本発明の一実施形態にかかる帳票処理装置における判定処理全体の流れを示す図である。
【図19】帳票登録処理の詳細の流れを示す図である。
【図20】帳票認識処理の詳細の流れを示す図である。
【図21】マーク認識処理の詳細の流れを示す図である。
【図22】比較処理の詳細の流れを示す図である。
【図23】登録帳票DB103−3の更新処理の詳細の流れを示す図である。

【特許請求の範囲】
【請求項1】
マークを記入するための領域が設けられた帳票を読み込むことにより生成された、画像データを処理する情報処理装置であって、
前記生成された画像データを登録画像データとして特定するための特徴量を登録する特徴量登録手段と、
前記登録画像データに含まれる、前記領域の画像データを、前記特徴量と対応付けて登録する領域画像登録手段と、
前記領域の画像データにマークが記入されているか否かを示すマーク情報を、該領域の画像データに対応付けて登録するマーク情報登録手段と、
入力される画像データの特徴量と、前記登録画像データの特徴量とに基づいて、該入力される画像データが前記登録画像データのいずれに該当するかを特定する特定手段と、
前記特定手段により特定された前記登録画像データに含まれる、前記領域の画像データ内の予め定められた濃度以上の画素の数と、前記入力される画像データに含まれる、前記領域の画像データ内の予め定められた濃度以上の画素の数とを、前記マーク情報に基づいて比較する比較手段と、
前記入力される画像データに含まれる、前記領域におけるマークの有無を、前記比較手段における比較結果に基づいて判定する判定手段と
を備えることを特徴とする情報処理装置。
【請求項2】
前記比較手段は、
前記マーク情報が、前記マークが記入されていないことを示す場合には、予め定められた濃度以上の濃度を有する総画素数を比較し、
前記マーク情報が、前記マークが記入されていることを示す場合には、任意の方向の濃度ヒストグラムを、対応する画素ごとに比較することを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記判定手段は、
前記入力される画像データに含まれる、前記領域の画像データの、前記予め定められた濃度以上の濃度を有する総画素数の方が少ない場合には、該領域に、マークが記入されていないと判定することを特徴とする請求項2に記載の情報処理装置。
【請求項4】
前記判定手段は、
前記入力される画像データに含まれる、前記領域の画像データの、いずれの画素の濃度ヒストグラムも、前記登録画像データに含まれる、前記領域の画像データの、対応する画素の濃度ヒストグラムよりも小さい場合に、前記入力される画像データに含まれる、前記領域に、マークが記入されていないと判定することを特徴とする請求項2に記載の情報処理装置。
【請求項5】
前記判定手段により、前記領域にマークが記入されていないと判定された場合に、該領域の画像データにより、前記領域画像登録手段に登録されている画像データを更新し、前記マーク情報登録手段に登録されている前記マーク情報を、前記マークが記入されていないことを示す情報に更新する更新手段を更に備えることを特徴とする請求項4に記載の情報処理装置。
【請求項6】
マークを記入するための領域が備えられた帳票を読み込むことにより生成された、画像データを処理する情報処理方法であって、
前記生成された画像データを登録画像データとして特定するための特徴量を登録する特徴量登録工程と、
前記登録画像データに含まれる、前記領域の画像データを、前記特徴量と対応付けて登録する領域画像登録工程と、
前記領域の画像データにマークが記入されているか否かを示すマーク情報を、該領域の画像データに対応付けて登録するマーク情報登録工程と、
入力される画像データの特徴量と、前記登録画像データの特徴量とに基づいて、該入力される画像データが前記登録画像データのいずれに該当するかを特定する特定工程と、
前記特定工程により特定された前記登録画像データに含まれる、前記領域の画像データ内の予め定められた濃度以上の画素の数と、前記入力される画像データに含まれる、前記領域の画像データ内の予め定められた濃度以上の画素の数とを、前記マーク情報に基づいて比較する比較工程と、
前記入力される画像データに含まれる、前記領域におけるマークの有無を、前記比較工程における比較結果に基づいて判定する判定工程と
を備えることを特徴とする情報処理方法。
【請求項7】
請求項6に記載の情報処理方法をコンピュータによって実現させるための制御プログラムを格納した記憶媒体。
【請求項8】
請求項6に記載の情報処理方法をコンピュータによって実現させるための制御プログラム。
【請求項9】
帳票に記入されたマークの有無を識別する情報処理装置であって、
登録対象の帳票をスキャンすることによって得た帳票画像データを取得する帳票画像取得手段と、
前記登録対象の帳票画像データにおいて、マークの記入位置と当該マークの有無情報とを登録する登録手段と、
識別対象の帳票画像データを取得する識別対象画像取得手段と、
前記識別対象の帳票画像データにおける前記マークの記入位置に対応する部分画像を、当該マークの有無情報に基づいて識別手法を切り替えてマーク認識するマーク認識手段と
を有することを特徴とする情報処理装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22】
image rotate

【図23】
image rotate


【公開番号】特開2007−164452(P2007−164452A)
【公開日】平成19年6月28日(2007.6.28)
【国際特許分類】
【出願番号】特願2005−359527(P2005−359527)
【出願日】平成17年12月13日(2005.12.13)
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】