説明

画像処理プログラム、画像処理装置及び画像処理方法

【課題】撮影画像に被写体以外の物体の画像が含まれているか否かを正確に判定できるようにする。
【解決手段】スタンド型イメージスキャナ50の画像撮影部71は置台を撮影し、撮影画像を画像処理装置10の撮影画像記憶部61に格納する。輪郭抽出処理部63は、撮影画像記憶部61に格納されている撮影画像から輪郭画像を抽出し、それを輪郭画像記憶部62に格納する。円形度、直線数演算部64は、輪郭画像記憶部62に格納されている輪郭画像を基に輪郭画像の円形度と輪郭画像を構成する直線の本数を求める。手写り判定部65は、その求められた円形度と直線本数を基に、帳票画像に手写りがあるか否かを判定する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像処理に係り、特に撮像素子で撮影した画像を処理する画像処理プログラム、画像処理方法、画像処理装置に関する。
【背景技術】
【0002】
金融機関等においては、帳票の画像読み取りのために帳票読取装置が利用されている。この帳票読取装置は、帳票の画像を取得するための装置としてスタンド型イメージスキャナを備えている。このスタンド型イメージスキャナは、帳票を置くための置台、該置台に帳票を正しく載置するための手助けとなる帳票突合ガイド、撮像素子であるCCDカメラ、該CCDカメラを置台から所定距離だけ離して支える支柱を備えている(例えば、特許文献1、2参照)。スタンド型イメージスキャナが備えるCCDカメラは、2次元の画像を撮像する二次元エリアセンサであり、置台に載置された帳票を撮影することで帳票の画像を取り込む。スタンド型イメージスキャナは、自身が撮影した画像をUSB(Universal Serial Bus)などの通信インターフェースを介して上位装置(例えば、パーソナルコンピュータなど)に送信する。上位装置は、スタンド型イメージスキャナから受信する画像データを基に帳票の画像(帳票画像)を生成する。そして、その生成した帳票画像に文字認識処理を施し、帳票画像から必要となる文字情報を抽出する。
【0003】
スタンド型イメージスキャナの用いられているCCD素子の特徴として、高精細に読み取るために1枚の画像を複数の部分画像に分割するフィールド読み出し方式が用いられる。すなわち、スタンド型イメージスキャナは、帳票の部分画像(分割画像)を合成することで帳票全体画像を生成する。
【0004】
帳票読取装置では、スタンド型イメージスキャナに対する帳票の画像読み取りの開始指示は、上位装置が備える撮影ボタン(読取キー)をオペレータが押下することで行われるのが一般的である。この場合、オペレータは、帳票を置台に正しく載置した後、自分の手がCCDカメラの撮影エリアから外れたことを確認してから撮影ボタンを押下する必要がある。しかしながら、オペレータが帳票読み取りを急いだ場合、撮影ボタンを押下するタイミングが早すぎて、オペレータの手が帳票の撮影エリアに入っている状態でCCDカメラによる撮影が開始され、帳票の撮像画像に手が写りこんでしまうという問題があった。このように、帳票の撮影時に帳票画像の手が写って撮影されてしまうと、上位装置が生成する帳票画像の一部に手の画像が含まれるために帳票画像の文字認識をする際に文字認識エラーが発生し、再度、帳票の撮影を行う必要が生じる。この結果、帳票処理業務の効率が低下する。
【0005】
このような帳票の画像読み取り時の手写りは、オペレータの慣れによって低減するが、帳票読取装置の初期の読み取りエラーの要因の大半を占めるため問題となっていた。
また、上述したようにスタンド型イメージスキャナによる帳票の撮影は複数回にわたって実行されるので、オペレータによる帳票の画像読み取り開始の指示を受けた後にCCDカメラが帳票の画像の撮像を開始するようにすると、上位装置が帳票画像を生成するまでに長い時間を要してしまうので、上位装置が帳票の文字認識処理を開始するまでの時間や、帳票画像を表示装置の画面に表示するまでの時間が長くなってしまう。このため、スタンド型イメージスキャナは、オペレータが帳票の画像読み取り指示をする前に、CCDカメラによる帳票の撮像を開始するようにしている。この技術は、一般に、「プレスキャン」と呼ばれている(例えば、特許文献3参照)。
【0006】
ところが、プレスキャンを行うと、オペレータの手が分割画像に含まれてしまうという問題が発生する。これは、オペレータが帳票を置台に正しく置いてから帳票の画像読み取り開始指示を行うまでの時間と、オペレータが自分の手を置台から離すまでの時間との関係により必然的に発生する。このように、プレスキャンを行った場合、分割画像に手の画像が含まれると、上位装置が複数の分割画像を合成して生成する帳票画像に手が写ってしまい、帳票画像の文字認識を行うとエラーが発生するので問題となる。このため、従来、プレスキャンにより得られた帳票画像に手写りが有るか検出する技術が提案されている(例えば、特許文献3参照)。
【0007】
特許文献3には、上位装置が分割画像から合成した合成画像に含まれる所定領域の各画素の平均階調値(濃淡値)が所定の範囲に存在するか否かを検出することで、または合成画像に含まれる各画素に所定の範囲の階調値(例えば、肌色階調値)を表す連続した画素が所定の画素数以上で含まれるか否かを検出することで、合成画像内に手写り領域(手写り画像)が存在するか否かを判定する手法が開示されている。また、手写り領域のみに関して上記手写り判定を行うことで、手写り判定に要する時間を短縮する手法も開示されている。
【先行技術文献】
【特許文献】
【0008】
【特許文献1】特開2001−78176号公報
【特許文献2】特開平8−9102号公報
【特許文献3】特開2010−57079号公報
【発明の概要】
【発明が解決しようとする課題】
【0009】
特許文献3に開示されている手法は、画像処理装置(スタンド型イメージスキャナの上位装置)がプレスキャンにより得られた合成画像に手写り領域が存在するか否かを判定することで、手写り領域の存在しない帳票画像を短時間で取得できるという効果を有している。また、逐次モニタ画面に表示される合成画像を目視しながら合成画像に手写り領域が存在するか否かを確認するというオペレータの作業が不要になるので、オペレータの作業負担が軽減されるという効果も有している。しかし、特許文献3に開示されている手法は、「手写りがあった場合には帳票の外周領域(判定領域)の平均階調値が薄くなる」ということを前提としている。しかし、実際にスタンド型イメージスキャナを使用する時にはオペレータが着衣している服の袖部分の色が肌色に近い場合もありうるので、手ではなく服など肌色に近い物を手写りとして検出してしまうこともある。また、特許文献3の手法では、帳票が帳票設置台(置台)に正しく設置されていない場合も手写りとして判定するようにしている。スタンド型イメージスキャナでは、帳票が帳票設置台からはみ出して置かれることは日常的にある。このような場合、特許文献3の手法では、帳票が一定時間以上経過しても正しく帳票設置台に正しく設置されない場合にはそれを手写り有りが所定回数以上検出されたものとみなして、エラー出力(読取不可を示すエラー通知出力)するようにしている。したがって、特許文献3の手法では、手写りを正確に検出できないという欠点があった。
【0010】
最近の帳票画像の文字認識装置は、帳票画像を取得した時点で自動的に文字認識を開始する手法が主流である。オペレータが画像を確認して手写りがあったら帳票画像を読み直す方法もあるが、この方法は自動化にならないので現在ではほとんど行われていない。しかし、帳票の文字認識を自動的に開始する装置には、手写りが原因で文字認識がエラーとなった場合でも、オペレータは手写りがエラー原因なのか、または帳票に書かれた文字の字形が悪いことがエラー原因なのか区別できないという問題があった。このため、帳票の文字認識を自動的に開始する装置においては、手写りを装置側で自動的に正確に判定することが非常に重要になっている。
【0011】
本発明は、撮影画像に撮影対象の被写体以外の物体が写っているか否かを自動的に正確に判定できるようにすることを目的とする。
【課題を解決するための手段】
【0012】
上記課題を解決するために、撮像素子で撮影した画像を処理する画像処理プログラムが提供される。この画像処理プログラムの一態様は、コンピュータに実行されることで、コンピュータを、被写体の撮影画像から被写体部分の輪郭を抽出し、被写体部分を含む輪郭画像を作成する輪郭画像抽出手段と、該輪郭画像抽出手段によって作成された輪郭画像を基に、該輪郭画像内に被写体以外の物体の画像が含まれているか否かを判定するために必要となる特徴量を算出する特徴量計算手段と、該特徴量計算手段により得られた特徴量を基に、前記輪郭画像内に被写体以外の物体の画像が含まれているか否かを判定する判定手段として機能させる。
【0013】
また、画像処理プログラムの別の態様は、コンピュータに実行されることで、コンピュータを、オペレータによる撮影指示がなされる前に、撮像手段により被写体を撮影するプレスキャン手段と、該プレスキャン手段により取得された撮影画像から被写体部分の輪郭を抽出し、被写体部分を含む輪郭画像を作成する輪郭画像抽出手段と、該輪郭画像抽出手段によって作成された輪郭画像内に被写体以外の物体の画像が含まれているか否かを判定するために必要となる特徴量を算出する特徴量計算手段と、該特徴量計算手段により得られた特徴量を基に、前記輪郭画像内に被写体以外の物体の画像が含まれているか否かを判定する判定手段と、該判定手段により前記輪郭画像内に被写体以外の物体の画像が含まれていると判定された場合には、該プレスキャン手段により得られた少なくとも2つの撮影画像を基に、撮像手段が撮影する撮影画像内に被写体以外の物体が写らなくなるまでの時間を計算する計算手段と、前記プレスキャンによる撮影が本来必要とされる解像度よりも低い解像度での撮影であった場合には、前記計算手段により算出された時間に応じた適切なタイミングで、前記撮像手段により前記被写体を本来必要な解像度で再度撮影する再スキャン手段として機能させる。
【0014】
前記計算手段は、例えば、オペレータ毎の移動量に関するデータを、オペレータが撮影指示を行う毎に移動量データ記憶手段に記憶させ、前記移動量データ記憶手段に移動量に関するデータを記憶した回数が一定回数に達したオペレータについては、該オペレータのそれまでの移動量に関するデータの平均値を計算し、その計算により得られた平均値を前記移動量情報記憶手段に記憶させ、以後、前記オペレータについて撮影手段が撮影する撮影画像内に被写体以外の物体が写らなくなるまでの時間を計算する際には前記移動量データ記憶手段に記憶されている前記オペレータの平均値を用いて計算する。
【発明の効果】
【0015】
上記画像処理装置プログラム、画像処理方法、画像処理装置によれば、撮影画像に撮影対象の被写体以外の物体が写っているか否かを自動的に正確に判定できる。
【図面の簡単な説明】
【0016】
【図1】本発明の実施の形態のシステム全体のハードウェア構成を示す図である。
【図2】本発明の実施の第1の形態の機能構成を示す機能ブロック図である。
【図3】本発明の実施の形態におけるプレスキャンにより合成した画像に手写り含まれているか否かを判定する第1の手法の原理を説明する図である。
【図4】本発明の実施の形態におけるプレスキャンにより合成した画像に手写り含まれているか否かを判定する第2の手法の原理を説明する図である。
【図5】本発明の実施の形態における帳票の読み取り開始タイミングの判定手法の原理を説明する図である。
【図6】手写りが無いプレスキャン画像から輪郭画像を作成する場合の例を示す図である。
【図7】手写りが有るプレスキャン画像から輪郭画像を作成する場合の例を示す図である。
【図8】手写りが無いプレスキャン画像における面積と周囲長の計算方法を示す図である。
【図9】手写りが無いプレスキャン画像において検出される直線本数を示す図である。
【図10】手写りが有るプレスキャン画像において検出される直線本数を示す図である。
【図11】手写りが有るプレスキャン画像において、検出する直線の長さを規定することで検出される直線本数を示す図である。
【図12】輪郭画像から求めた円形度及び直線本数を基にして、プレスキャン画像に手写りが有るか否かを判定するアルゴリズムを示すフローチャートである。
【図13】本発明の実施の第2の形態の機能構成を示す機能ブロック図である。
【図14】プレスキャン開始後のスタンド型イメージスキャナの置台上での帳票とオペレータの手の動きの時間的な状態遷移に伴う「円形度」と「直線本数」の時間的遷移を示す表である。
【図15】図14に示す6つに状態の各状態における帳票画像を示す図である。
【図16】プレスキャンにより得られた2つの帳票画像を基に手が撮影されなくなるまでの時間を計算する手法を説明するための図である。
【図17】プレスキャン画像に手写りが無くなってから本スキャンまたは後処理を開始する手法を示すフローチャートである。
【図18】プレスキャン画像に手写りが無くなる時間を予測計算して、本スキャンまたは後処理を開始する手法を説明するフローチャートである。
【図19】帳票上に誤って置かれた物が帳票の輪郭を覆いながら帳票からはみ出している場合に、本発明の画像処理装置の実施の第1及び第2の形態を適用したケースを説明する図である。
【図20】置台に正しくセットされた帳票内に付箋紙のようなものが張り付いている場合に本発明の実施の形態の第1及び第2の形態を適用したケースを説明する図である。
【図21】帳票が撮影範囲からはみ出している場合に本発明の実施の第1及び第2の形態を適用したケースを説明する図である。
【図22】帳票の外に異物が撮影範囲内に置かれている場合に本発明の実施の第1及び第2の形態を適用したケースを説明する図である。
【図23】本発明の実施の第3の形態の機能構成を示す機能ブロック図である。
【図24】図23に示す移動速度テーブル記憶部内に設けられるテーブルの構成例を示す図である。
【発明を実施するための最良の形態】
【0017】
以下、図面を参照しながら、本発明の実施の形態を詳細に説明する。
図1は、本発明の実施の形態のシステム全体のハードウェア構成を示す図である。
図1に本発明の実施の形態は、画像処理装置10、モニタ20、キーボード(KB)30、マウス40、及びスタンド型イメージスキャナ50を備えている。画像処理装置10は、帳票画像のOCR(Optical Character Recognition:光学文字認識)機能を備えており、スタンド型イメージスキャナ50によりOCR処理で必要となる解像度の帳票画像を取得する必要がある。
【0018】
画像処理装置10は、例えば、パーソナルコンピュータであり、CPU(Central Processing Unit)11、RAM(Random Access Memory)12、HDD(Hard Disk Drive)13、USB(Universal Serial Interface)インターフェース14を備えている。CPU11は、バス15を介してRAM12、HDD13、USBインターフェース14と接続されている。尚、図1には図示していないが、画像処理装置10は、ROM(Read Only Memory)やLAN(Local Area Network)などのネットワークに接続するためのNIC(Network Interface Card)なども備えている。また、画像処理装置10は、必要に応じて時刻を計時するタイマーも備える。
【0019】
尚、図1には図示していないが、画像処理装置10内にはCPU11とモニタ20の間に表示制御部が設けられており、CPU11は該表示制御部を介してモニタ20の画面表示を行う。また、CPU11は、画像処理装置10内に設けられた不図示のメモリコントラーを介してRAM12に対するデータのリード/ライトを行う。また、画像処理装置10は不図示のHDDコントローラ(例えば、SATA(Serial Advanced Technology Attachment) コントローラなど)を備えており、該HDDコントローラを介してHDD13に対するデータのリード/ライトを行う。また、画像処理装置10は、IPL(Initial Program Load)やBIOS(Basic Input/Output System)などを格納するROMも備えている。
【0020】
CPU11は、RAM12にロードされているプログラムを実行することで画像処理装置10全体を制御する。RAM12は、随時データの書き込み/読み出しが可能な半導体メモリであり、OS(Operating System)やアプリケーションプログラムなどのソフトウェアがHDD13からロードされる領域や、CPU11が処理を実行する際に使用するデータを格納する領域などを備えている。また、RAM12は、スタンド型イメージスキャナ50から画像処理装置10のUSBインターフェース14に転送されてくる撮影画像を記憶する領域やその撮影画像を処理する際に使用される作業領域も備えている。
【0021】
HDD13は、OSやドライバ・ソフトウェア、アプリケーションプログラム、さらには、CPU11が処理を実行するために必要なデータなどが格納される領域を備える記憶装置である。上記アプリケーションプログラムは、例えば、帳票画像のOCR処理機能や帳票画像をモニタ20に表示する機能などを備えている。上記ドライバ・ソフトウェアは、スタンド型イメージスキャナ50が撮影した画像から、手写りが無い帳票画像を取得し、その手写りが無い帳票画像を、上記OCR処理機能を備えたアプリケーションプログラムに渡す機能を備えている。また、HDD13は、上記ドライバ・ソフトウェアが取得した手写りが無い帳票画像を格納する領域を備える。
【0022】
USBインターフェース14は、キーボード30、マウス40及びスタンド型イメージスキャナ50の各デバイスのUSB端子とUSBケーブルで接続され、キーボード30、マウス40及びスタンド型イメージスキャナ50との間で、USB規格に準拠して制御信号やデータの通信を行う。スタンド型イメージスキャナ50が撮影した画像は、スタンド型イメージスキャナ50からUSBインターフェース14に転送され、USBインターフェース14を経由してRAM12に書き込まれる。
【0023】
モニタ20は、例えば液晶ディスプレイなどの表示装置であり、CPU11の制御を受けて、オペレータに対するユーザ・インターフェース画面の表示や、スタンド型イメージスキャナ50が読み取った帳票の画面などを表示する。
【0024】
キーボード30とマウス40は、オペレータが画像処理装置10に対して帳票の読み取りを指示する操作のために用いられる入力装置である。オペレータは、キーボード30やマウス40を操作することで、モニタ20に表示されるユーザ・インターフェース画面への入力を行い、ユーザ・インターフェース画面を介して、スタンド型イメージスキャナ50への帳票読み取り開始を指示する。このオペレータによる帳票読み取り開始指示の操作は、キーボード30に設けられた読取りキーの押下またはモニタ20に表示されているユーザ・インターフェース画面上の読取りキーをマウス40によりクリックする操作などにより実行される。
【0025】
スタンド型イメージスキャナ50は、帳票(撮影対象の被写体)を撮影して帳票の画像(帳票画像)を取得するための非接触型のイメージスキャナであり、撮影した画像を、USBケーブルを介して画像処理装置10のUSBインターフェース14に転送する。スタンド型イメージスキャナ50は、前記特許文献1の図1、図3に開示されている帳票撮像装置とほぼ同様な構成であり、CCDカメラ51、置台52、帳票突合ガイド53及び支柱54を備えている。置台52と帳票突合ガイド53は、それぞれ、特許文献1の図3に開示されている置台2と帳票突合ガイド3とほぼ同様な構成をしている。すなわち、置台52の表面の色は帳票と明確に識別できる色(例えば黒色)となっている。スタンド型イメージスキャナ50は、置台52の載置(セット)された帳票を、CCDカメラ51により複数回に分けて撮影する。これは、CCDカメラ51の解像度が、画像処理装置10が帳票画像のOCR処理を実行するために必要となる解像度よりも低いためである。このため、CCDカメラ51は、複数フィールドに分けて帳票画像の1フレームを撮影(撮像)する。1フレームのフィールド数は、例えば、3フィールド、4フィールド、または6フィールド等である。CCDカメラ51による撮影により、画像処理装置10が帳票画像のOCR処理を実行することが可能となる解像度を有する帳票画像が取得される。CCDカメラ51の撮影範囲は置台52全体よりも広い範囲である。スタンド型イメージスキャナ50は、CCDカメラ51により撮影された画像から「帳票+α」の大きさの画像を切り出し、その切り出した画像を画像処理装置10に転送する。ここで、αは所定幅(例えば、5cm)を表す。このため、置台52に帳票が正しく載置された場合にスタンド型イメージスキャナ50から画像処理装置10に転送される撮影画像は、中央が帳票の画像(帳票画像)で、周辺が帳票全体を取り囲んでいる置台52の外縁部の画像(黒画素で構成された黒背景画像)となる(特許文献1の図3参照)。帳票の外縁部分の画像は白画素領域となるので、撮影画像を外側から内側に走査し、黒画素から白画素の変化する境目を検出することで、撮影画像から帳票画像を抽出できる。
【0026】
画像処理装置10は、スタンド型イメージスキャナ50がプレスキャンにより取得した部分画像(フィールド画像)を合成して所定の解像度を有する合成画像(以下、便宜上、プレスキャン画像と呼ぶ)を生成し、そのプレスキャン画像に手写り含まれているか否かを判定する。
【0027】
スタンド型イメージスキャナ50は、撮影機能として、「動画モード」と「静止画モード」の2つの撮影モードを備えている。スタンド型イメージスキャナ50によるプレスキャンは動画モードまたは静止画モードによって実行される。動画モードは、後処理(帳票画像のOCR処理や画面表示など)で必要とされる解像度よりも低い解像度(低解像度)でプレスキャンを行うモードである。静止画モードは、帳票画像の後処理で必要とされる解像度(高解像度)でプレスキャンを行うモードである。動画モードの1回の撮影時間(1フレーム全体の撮影時間)は例えば30msである。静止画モードの1回の撮影時間は例えば500msである。後処理は、スタンド型イメージスキャナ50で取得された高解像度の帳票画像に対して「画像の倍率、/歪み/斜行を補正する処理」(画像変換)が施されてから実行される。したがって、後処理を実行するためには、静止画モードでの撮影により取得された1フレームの画像が必要となる。
【0028】
本発明の実施の形態では、プレスキャンにより手写りが無い帳票画像が取得されたか否かを判定し、動画モードでのプレスキャンにより手写りが無い帳票画像が取得されたと判定された場合には本スキャンが開始される。すなわち、プレスキャンが動画モードで行われた場合には、手写りが無い帳票画像が取得されたと判定されると、画像スタンド型イメージスキャナ50により静止画モードで置台52全体の再撮影が開始され、その再撮影により取得された画像がスタンド型イメージスキャナ50から画像処理装置10に転送される。他方、プレスキャンが静止画モードで行われていた場合には、手写りが無い帳票画像が取得されたと判定された時点で、既に、後処理で必要となる解像度の手写りが無い帳票画像が画像処理装置10内に取り込まれているので、スタンド型イメージスキャナ50による置台52の再撮影は実行しない。本発明の実施の形態では、本スキャンを、「後処理で必要となる解像度で帳票が正しく載置された置台52全体を撮影し、その撮影により得られた撮影画像を画像処理装置10に取り込み・記憶する処理」と定義する。このため、プレスキャンが静止画モードであった場合には、手写りが無い帳票画像を撮影し、その撮影画像を画像処理装置10内に取り込み・記憶したプレスキャンが本スキャンに該当することになる。
【0029】
[実施の第1の形態]
図2は、図1に示すハードウェア構成を備える本発明の実施の第1の形態の画像処理装置の機能構成を示す機能ブロック図である。
【0030】
図2に示す画像処理装置10−1は、撮影画像記憶部61、輪郭画像記憶62、輪郭抽出処理部63、円形度、直線数演算部64、手写り判定部65及び出力部66を備えている。撮影画像記憶部61と輪郭画像記憶部62の記憶領域は、例えば、RAM12に設けられる。CPU11は、本発明の実施の形態の画像処理装置プログラムをHDD13からRAM12にロードして実行する。
スタンド型イメージスキャナ50は、画像撮影部71を備えている。画像撮影部71は、CCDカメラ51により置台52を含む範囲を複数のフィールドに分けて撮影する。画像撮影部71は、CCDカメラ51が撮影した複数フィールドから成る画像から「帳票+α」の大きさの撮影画像を切り出し、その切り出した撮影画像を複数のブロックに分割し、ブロック単位で撮影画像記憶部61に転送する。便宜上、このブロック単位の画像をブロック画像と呼ぶことにする。画像撮影部71は、上述した「動画モード」と「静止画モード」の2つの撮影モードを備えている。画像撮影部71は、1フレームの画像(帳票及びその周囲の黒背景画像を含む画像)を、動画モードのときには30msで、静止画モードのときには500msで撮影する。
【0031】
撮影画像記憶部61は、画像撮影部71からブロック単位で転送されてくる撮影画像を記憶する記憶領域を備える。撮影画像記憶部61は、画像撮影部71から転送されてくるブロック画像を受信・記憶し、画像撮影部71から1フレームを構成する全ブロックの画像を受信すると、それらのブロック画像を合成して1フレームの画像を生成し、その生成したフレーム画像をカラー画像に変換する。そして、そのカラー画像を所定の記憶領域に格納する。このフレーム画像の内、プレスキャンにより取得されるフレーム画像を、上述したように、「プレスキャン画像」と呼ぶことにする。撮影画像記憶部61は、フレーム画像を記憶する際、そのフレーム画像に取得時刻(フレーム画像の生成時刻)を付加して記憶する。該取得時刻は、画像処理装置10内のタイマー(不図示)から取得する。
【0032】
輪郭画像記憶部62は、輪郭抽出処理部63が抽出した輪郭画像を格納する記憶領域を備えている。この輪郭画像には、プレスキャン画像と同様に取得時刻情報を付加するようにしてもよい。
【0033】
輪郭抽出処理部63は、撮影画像記憶部61からプレスキャン画像を読み出し、後述する手法により、プレスキャン画像から輪郭画像を抽出し、その輪郭画像を輪郭画像記憶部62に書き込む。輪郭抽出処理部63は、撮影画像記憶部61に格納されているカラーのプレスキャン画像を白黒の2値のフレーム画像に変換してから輪郭画像を抽出する。輪郭抽出処理部63は、2値のフレーム画像から帳票の画像部分の輪郭と手の画像部分の輪郭を抽出し、2値のフレーム画像から上記輪郭で囲まれた画像部分を抽出することにより輪郭画像を抽出する。この輪郭画像は、手写りが無いフレーム画像の場合には帳票全体の画像になる。他方、手写りがあるフレーム画像の場合の輪郭画像は、帳票全体の画像から手写り画像部分を削除した画像となる。そして、その抽出した輪郭画像を輪郭画像記憶部62に格納する。
【0034】
円形度、直線数演算部64は、輪郭画像記憶部62から輪郭画像を読み出し、後述する手法により、正常に撮影された帳票画像と輪郭画像を基に後述する円形度を計算する。また、輪郭画像を構成する直線の本数を検出する。
【0035】
手写り判定部65は、円形度、直線数演算部64が求めた円形度もしくは直線本数、またはそれら両方を基に、撮影画像記憶部61に格納されている撮影画像に手写りが有るか否かを判定する。手写り判定部65は、画像撮影部71のプレスキャンの撮影モード(動画モードまたは静止画モード)を保持する記憶部(不図示)を備えている。手写り判定部65は、上記手写り判定において撮影画像に手写りが無いと判断すると、プレスキャンが動画モードであった場合には画像撮影部71に再撮影を指示する。他方、プレスキャンが静止画モードであった場合には、出力部66に帳票画像の出力指示に通知する。
【0036】
出力部66は、手写り判定部65から帳票画像の出力指示の通知を受け取ると、撮影画像記憶部61から手写りが無い帳票画像を読み出し、その帳票画像をモニタ20に出力する。
【0037】
{手写り判定手法の原理}
次に、本発明の実施の形態におけるプレスキャンにより取得された帳票画像に手写りが含まれているか否かを判定する手法(手写り判定手法)の原理を説明する。
【0038】
(1)円形度を用いる手法
図3は、プレスキャン画像に手写りが含まれているか否かを判定する第1の手法を説明する図である。図3(a)は手写りが含まれるプレスキャン画像を、図3(b)は手写りが無いプレスキャン画像(帳票が正常に撮影されたプレスキャン画像)を示している。また、図3(a)、(b)中において、帳票画像の輪郭を点線で示している。
【0039】
第1の手法は、円形度を用いる。円形度は以下のように定義される。
円形度=4π×面積/(周囲長×周囲長) ・・・・・・・・ (1)
面積 :帳票画像の面積(輪郭画像の面積)
周囲長:帳票画像の周囲長(輪郭画像の輪郭の長さ)
式(1)において、円形度は円の場合に“1”となる。輪郭画像については後述する。
【0040】
図3(a)、(b)に示すプレスキャン画像100、200おいて、黒枠画像(黒背景画像)101、201は、帳票が置台52に正しく載置されたときに帳票の外枠となる置台52の外周部分の画像であり、白領域(白画素領域)102、202は帳票の画像である。また、図3(a)、(b)において白領域102、202の周囲に描かれた点線部分103、203は帳票画像の輪郭を示す。すなわち、点線部分103、203の長さは、帳票画像102、202の輪郭の長さ(周囲長)を示すものである。図3(a)に示すプレスキャン画像100では、黒枠画像と帳票画像の一部が手の画像104で覆われている。手の画像104は、スタンド型イメージスキャナ50のCCDカメラが撮影したときに帳票の上部に存在したオペレータの手の画像である。
【0041】
図3(a)に示す手写りが有るプレスキャン画像100と図3(b)に示す手写りが無いプレスキャン画像200のそれぞれについて、上記式(1)を用いて円形度を計算すると、図3(b)に示す手写りが無いプレスキャン画像200の方が図3(a)に示す手写りが有るプレスキャン画像100のよりも円形度が高くなる。これは、手写りが有るプレスキャン画像100内の輪郭画像102の面積が手写りが無いプレスキャン画像200内の輪郭画像202の面積よりも小さく、かつ、手写りが有るプレスキャン画像内の輪郭画像102の周囲長103の方が手写りが無いプレスキャン画像200内の輪郭画像202の周囲長203よりも長くなるからである。したがって、上記式(1)を用いてプレスキャン画像の円形度を計算し、その計算で算出された円形度を適切な基準値と比較することによって、プレスキャン画像に手写りが存在するか否かを判定することが可能となる。すなわち、円形度が基準値を下回った場合には手写り有りと判定することができる。
【0042】
(2)線状に写る手写りを特徴量として用いる手法
スタンド型イメージスキャナ50では、上述したように、CCDカメラ51の1回の撮影で取得される帳票画像の解像度が後処理で必要とされる帳票画像の解像度よりも低いため、帳票が載置された置台52を複数回に分けて撮影している。この場合、露光タイミングの異なる複数フィールドの画像から1枚(1フレーム)の画像を生成する。このため、置台52の上部でオペレータの手が動いているときにCCDカメラ51で置台52を撮影すると、いくつかのフィールドの画像に手の画像が写りこむ。
【0043】
図4(a)〜(c)は、CCDカメラ51が図面の水平方向に1フィールド単位で画素をずらしながらプレスキャンした場合の例である。図4(a)は、置台52の上部でオペレータの手が動いているときにCCDカメラ51でプレスキャンしたときに取得されるプレスキャン画像の例を示す図である。この例では、プレスキャン画像110の帳票画像領域112の右側下方に縦縞の手の画像114が写っている。図4(b)は、手の画像114の一部を拡大した図である。図4(b)は、CCDカメラ51が4回に分けて置台52を撮影した場合の例である。この場合のプレスキャン画像112は、異なる時刻で撮影された4フィールドの画像から構成される。図4(b)に示す例では、4フィールド中の1フィールドに手が写りこんでおり、写りこんだ手が縦縞の線状の画像となって撮影されている。
【0044】
図4(c)は、帳票の右側下方に、図4(a)に写った手と同じ形状の黒色の塗り潰しがあった場合に取得されるプレスキャン画像210の例を示している。この場合、黒色の塗り潰し部分は静止しているので全てのフィールドの撮影時に写し出される。したがって、図4(c)に示すように、プレスキャン画像210の帳票画像領域212の右側下方に写っている黒色の塗り潰し部分215は縦縞の線状の画像とはならず全体が黒色の画像となっている。したがって、本発明の実施の形態では、プレスキャン画像の帳票画像領域内に手に似た形状の画像が写っていた場合でも、その画像に線状の直線が含まれるか否かを検出することで、「手の画像」と「手の形状に似た帳票の塗り潰し等」とを判別するようにする。
【0045】
尚、CCDカメラ51が帳票の1フレーム分の画像を撮影する期間中、ずっとオペレータの手が置台52の上で静止していた場合には、プレスキャン画像において手の画像は縞模様に写らず、手全体がまんべんなく写ってしまう。このような場合には、公知文献1に開示されている肌色の階調値を利用する手法を用いることで、プレスキャン画像内の手の画像を検出することができる。したがって、手の画像が縞模様に写るという特徴を利用する本発明の実施の形態の手法と公知文献の手の検出手法を併用することで、プレスキャン画像に写りこんでいる手の画像を確実に検出することが可能である。
【0046】
{手写りが無い帳票の画像読み取り開始タイミングの判定手法の原理}
次に、本発明の実施の形態における帳票の読み取り開始タイミングの判定手法を、図5のタイミングシーケンス図を参照しながら説明する。
【0047】
図5のタイミングシーケンス図において、時間は矢印の向き、すなわち図面上で左側から右側に進行する。図5には、「セット動作前」(帳票をスタンド型イメージスキャナ50の置台52にセット(載置)する動作を行う前の状態)、「セット中」(帳票をスタンド型イメージスキャナ50の置台52にセットしている最中の状態)、「セット後」(帳票をスタンド型イメージスキャナ50の置台52に正しくセットした後の状態)、及び「帳票を読み取り可」(スタンド型イメージスキャナ50が帳票全体を読み取り可能になった状態)の4種類の状態が示されている。また、上記4種類の帳票画像状態であるときの「帳票」と「オペレータの手」の状態が、それぞれ、「有」(置台52上に有る)、「無」(置台52上に無い)、「動」(置台52上を動いていている)及び「止」(置台52上で静止している)という記号で示されている。また、4種輪の各状態の時にCCDカメラ51により撮影された部分画像から合成されたプレスキャン画像が示されている。プレスキャン画像310はセット動作前に撮影された画像、プレスキャン画像320はセット中に撮影された画像、プレスキャン画像330はセット後に撮影された画像、プレスキャン画像340は読み取り可の状態(手写りが無くなった状態)のときに撮影された画像である。
【0048】
以下、本発明の実施の形態における帳票の画像読み取り開始タイミングの判定手法を時間順に説明する。
(1)オペレータがスタンド型イメージスキャナ50の置台52に帳票をセットする前に、CCDカメラ51により、一定の時間間隔で置台52を連続してプレスキャンする。セット動作前は、置台52上には帳票及びオペレータの手が無いため、この状態のときには図5に示すプレスキャン画像310が取得される。プレスキャン画像310は、置台52の上面全体を撮影した画像となるので全体が黒色の画像となる。
【0049】
(2)オペレータが置台52に帳票をセット中のときは、帳票とオペレータの手が共に動いているので、この状態の時には図5に示すプレスキャン画像320が取得される。プレスキャン画像320は、置台52上にあるセット途中の帳票と帳票をセットしようとしているオペレータの手が共に線状の縞となって写し出される画像となる。
【0050】
(3)オペレータは、スタンド型イメージスキャナ50の置台52に帳票をセットし終えると、時刻T0で読取りキーを押下してスタンド型イメージスキャナ50による帳票の画像読み取り開始を指示する。この例では、時刻T0はオペレータが置台52に帳票をセットし終える前であり、時刻T0の時点では置台52に帳票を正しくセットしようとしてオペレータの手が動いている。したがって、オペレータが読取りキーを押下した時点で取得されるプレスキャン画像はプレスキャン画像320に似た画像となる。
【0051】
(4)置台52に帳票を正しくセットした直後では、帳票は静止しているが、オペレータの手はまだ置台52上を移動中なので、この時点では図5に示すプレスキャン画像330が取得される。プレスキャン画像330は、帳票画像に縦縞の手の画像が写りこむ画像となる。
【0052】
(5)その後、帳票上からオペレータの手が消えると、それ以降には図5に示すプレスキャン画像340が取得される。プレスキャン画像340は、手写りが無い帳票画像とその帳票画像の外縁を囲む黒背景画像とから成る画像となる。
【0053】
本発明の実施の形態では、プレスキャンによりプレスキャン画像340を最初に取得すると、プレスキャン画像340に手写りが無いことを自動的に判定し、プレスキャンが動画モードであった場合には、該判定したタイミング(時刻T1)で本スキャンを開始する。他方、プレスキャンが静止画モードであった場合には、撮影画像記憶部61に記憶されている手写りが無いプレスキャン画像340を基に後処理が開始される。
【0054】
(4)の方法ではなく、下記の(5)の方法で本スキャンを開始してもよい。
(5)プレスキャン画像330を取得してからプレスキャン画像340を取得するまでの期間のどこかでプレスキャン画像から手が完全に抜けるので、プレスキャン画像330を取得するまでに取得した2つの手写りプレスキャン画像を利用することで手写りが無いプレスキャン画像を取得可能になるまでのタイミングを予測計算し、その予測計算で得られたタイミング(時刻Ti2)でスキャン(スタンド型イメージスキャナ50による静止画モードまたは動画モードでの撮影)を開始する。この予測計算では、例えば、異なる時刻で取得された2つのプレスキャン画像間における手の画像の移動量や円形度の変化量などを使用する。この予測計算の手法の詳細については後述する。
【0055】
また、更には、各オペレータについて、置台52に帳票をセットする毎に、毎回、帳票を置台52にセットした後の手の移動速度(プレスキャン画像内での単位時間当たりの手の移動量)または円形度を算出・記憶していくことで、オペレータ毎の平均移動速度または平均円形度を学習し、学習終了後は個々のオペレータに合ったタイミングで上記スキャンを開始するようにする。この学習手法の詳細についても後述する。
【0056】
このように、本発明の実施の形態においては、プレスキャンにより得られた画像を基に、CCDカメラ51が撮影する帳票画像からオペレータの手が完全に抜けたことを確認するか、またはCCDカメラ51が撮影する帳票画像帳からオペレータの手が抜けるタイミングを予測する。そして、上記確認後、本スキャン(プレスキャンが動画モードの場合)または後処理(プレスキャンが静止画モードの場合)を開始する。また、上記予測タイミングで、本スキャン(プレスキャンが動画モードの場合)または後処理(プレスキャンが静止画モードの場合)を開始する。
【0057】
{手写り判定手法の実施例}
次に、上述した手写り判定手法の原理を用いた実施例の処理手順を説明する。
1.帳票の円形度を求める。
ここで、「帳票」とは、プレスキャンにおいてCCDカメラ51により撮影された画像内での帳票部分の画像であり、撮影画像記憶部61に記憶されている撮影画像の帳票画像部分を示す。
【0058】
(1)プレスキャンにより読み取った画像(プレスキャン画像)の外縁から内部に向かって白黒の変化点(黒画素から白画素に変化する点)を探索し、その探索により抽出した変化点を輪郭とする輪郭画像を作成する。この輪郭画像作成処理を、図6と図7を参照して、より具体的に説明する。
【0059】
図6は、手写りが無いプレスキャン画像から輪郭画像を作成する場合の例を示している。
図6(a)に示す手写りが無いプレスキャン画像410について、上記方法で白黒変化点を抽出し、図6(b)に示す輪郭画像411を作成する。輪郭画像411の輪郭線413は、帳票の輪郭線に等しくなる。すなわち、手写りが無いプレスキャン画像410から作成される輪郭画像411は帳票画像に等しくなる。
【0060】
図7は、手写りが有るプレスキャン画像から輪郭画像を作成する場合の例を示している。
図7(a)に示すプレスキャン画像420は手写りが有る帳票画像の一例である。プレスキャン画像420の右側には手の画像422が写っている。プレスキャン画像420から上記方法により白黒変化点を抽出することで、図7(b)に示す輪郭画像421aまたは図7(c)に示す輪郭画像421bを作成する。輪郭画像421aは、帳票の3辺(上辺、左辺及び右辺及び下辺の一部と手の画像422の帳票画像領域内の部分の輪郭を輪郭線423aとする画像となる。また、輪郭画像421bは、上記帳票の3辺(上辺、左辺及び右辺)並びに下辺の一部と線状の縦縞の手の画像を輪郭線423bとする画像となる。すなわち、輪郭画像421aと輪郭画像421bの違いは、手の部分の輪郭線の形状のみである。輪郭画像421aまたは輪郭画像421bのいずれを作成するかは、輪郭抽出の設定条件を変えることで容易に可能である。
【0061】
(2)上記(1)で作成した輪郭画像内の全画素数(=面積)と輪郭線の画素数(=周囲長)を計算する。輪郭画像内の全画素数には、輪郭線の画素も含まれる。
図8を参照して、手写りが無い帳票画像における面積と周囲長の計算方法を説明する。
【0062】
図8には手写りが無いプレスキャン画像410の輪郭画像411と輪郭線413が示されている。図8に示すように、手写りが無いプレスキャン画像410の場合には、輪郭画像411の面積は帳票画像の面積と等しくなる。輪郭線413は幅が1画素の線である。手写りが無いプレスキャン画像410の輪郭画像411の場合には、帳票画像411内の全画素数を面積として、輪郭線413の画素数を周囲長として計算する。
【0063】
手写りが有るプレスキャン画像の場合には、図7(b)、(c)に示す手写りが有る輪郭画像421a、421bとそれらの輪郭線423a、423bを基に、上記と同様にして面積と周囲長を求める。輪郭画像412aの輪郭線421bについて周囲長を計算する場合、線状の縦縞部分については、縦縞の線を構成している画素数を計数する。
【0064】
(3)帳票の円形度を計算する。
上記の式(1)を用いて、上述のようにして求めた面積と周囲長から帳票の円形度を計算する。ここで、手写りが無い輪郭画像の円形度を「標準円形度」(円形度の基準値)に設定する。手写りが有る輪郭画像の円形度は標準円形度よりも低い値となる。これは、手写りが有る輪郭画像の場合、周囲長は手写りが無い輪郭画像の周囲長よりも長く、円形度は手写りが無い輪郭画像の円形度よりも低い値となるからである。
【0065】
2.輪郭画像から直線本数を求める。
輪郭線の画素に対してハフ変換を行い、輪郭線を構成する複数の近似直線を検出する。そして、検出された複数の近似直線の本数を求める。図9において○付き数字で示すように、手写りが無い輪郭画像411の場合には、ハフ変換により、帳票の4辺が近似直線として検出される。したがって、輪郭画像が手写りが無い帳票画像である場合には、直線本数として4本(標準直線本数)が検出される。
【0066】
一方、手写りが有る輪郭画像の場合には、検出される直線本数は標準直線本数(4本)よりも多くなる。これは、図10(a)に示す手写りが有る輪郭画像421aの場合には手の輪郭の形状が複雑になるためである。また、図10(b)に示すように、帳票上を動いている手を撮影した場合に取得される手写りが有る輪郭画像421の場合には、手の画像部分が多数の線状の縦縞から構成される。輪郭画像421bの場合には上記多数の線状の縦縞が直線として検出されるので、多数の直線が検出されることになる。尚、図10(a)、(b)に示す○付き数字は直線の本数を表すものである。図10(b)の場合には直線本数が多すぎるため○付き数字を一部省略している。
【0067】
このように、手写りが有る輪郭画像の輪郭線から検出される直線本数は手写りが無い輪郭画像の輪郭線から検出される直線本数よりも多くなるので、輪郭画像から輪郭を構成する直線の本数を検出し、その検出された直線本数が予め定めた標準直線本数(本実施例では4本)より多いか否かを判定することで、プレスキャン画像に手写りが有るか否かを判定することが可能となる。
【0068】
{直線本数検出の変形例}
また、輪郭画像から検出する直線(線分)の長さを規定することで、輪郭画像から検出した直線の本数が予め定めた標準直線本数よりも少ない場合にプレスキャン画像に手写りが有ると判定するようにすることも可能である。この手法を、図9と図11を参照して説明する。
【0069】
輪郭画像から検出する線分の長さ(直線の長さ)を適切に規定すると、図9に示す手写りが無い輪郭画像411から検出される直線の本数は4本となる。すなわち、輪郭画像411から帳票の4辺が直線として検出される。一方、図11に示すように、手写りが有る輪郭画像431aの場合には、帳票の輪郭となる4辺の内の少なくとも1辺(図11の例では下辺)が手に覆われるため、手に覆われた辺が直線として検出されない。このため、輪郭画像から検出される直線の本数は4本よりも少なくなる(図11の例では3本(下辺以外の辺)。したがって、輪郭画像から検出する直線(線分)の長さを規定することで、輪郭画像から検出される直線本数が標準直線本数よりも少ない場合にプレスキャン画像に手写りが有ると判定することが可能となる。この手法は、帳票の4辺のみについて直線であるかどうかを検出すればよく、手の輪郭を構成する直線については検出する必要が無いので、輪郭画像から輪郭線を抽出する処理が容易になるという利点がある。
【0070】
{手写り判定の処理フロー}
図12は、上述した円形度並びに直線本数を基にしてプレスキャン画像の手写りの有無を判定する手法のアルゴリズムを示すフローチャートである。
【0071】
図12のフローチャートの処理手順を説明する。
まず、「円形度≧標準円形度」であるかを判定する(ステップS11)。ステップS11でYesと判定すればステップS13に進み、ステップS13において「プレスキャン画像に手写り無し」と判定する。
【0072】
ステップS11でNoと判定すれば、次に、「直線本数=標準直線本数」であるかを判定する(ステップS12)。ステップS12でYesと判定すれば、ステップS13に進み、ステップS13において「プレスキャン画像に手写り無し」と判定する。
【0073】
ステップS13でNoと判定すればステップS14に進み、ステップS14において「プレスキャン画像に手写り有り」と判定する。
このように、図12のフローチャートに示す手法では、円形度と直線本数の両方を用いて、「円形度<標準円形度であり」、かつ、「直線本数>標準直線本数である」場合に、プレスキャン画像に手写りが有ると判定する。
【0074】
尚、円形度と直線本数の両方を利用せずに、円形度または直線本数を単独で利用して帳票画像の手写りの有無を判定することも可能である(図14の状態(a)〜(f)参照)。また、上記直線本数検出の変形例を利用した手法のアルゴリズムは、図12のフローチャートをそのまま適用できる。
【0075】
本発明の実施の第1の形態によれば、プレスキャン画像から抽出した輪郭画像から特徴量(円形度または直線本数)を抽出し、その抽出した特徴量(円形度または直線本数)を標準値(標準円形度または標準円形度)と比較することで、プレスキャン画像に手写りが有るか否かを正確に判定できる。
【0076】
[実施の第2の形態]
図13は、図1に示すハードウェア構成を有する本発明の画像処理装置の実施の第2の形態の機能構成を示すブロック図である。図13において、図2の画像処理装置10−1が備える構成要素と同じ構成要素には同一の符号を付与しており、それらの構成要素については詳しい説明を省略する。
【0077】
図13に示す画像処理装置10−2は、図2に示す画像処理装置10−1が備える構成要素61〜66に加え、移動量計算部67と手写り検出開始タイミング計算部68(68−1)を備えている。
【0078】
移動量計算部67は、手写り判定部65から前記手写り判定結果を入力し、その手写り判定結果を基に手写りが有るプレスキャン画像が撮影画像記憶部61に格納されたか否かを判断する。そして、手写り判定部65から「手写り有り」という手写り判定結果を2回入力すると、先に入力した「手写り有り」という手写り判定結果に対応するプレスキャン画像と、その後に入力した「手写り有り」という手写り判定結果に対応するプレスキャン画像の2つの画像を撮影画像記憶部61から読み出し、それら2つのプレスキャン画像を基に、「移動量をチェックする時間間隔Tec」(チェック時間間隔Tec)、「手の画像の移動量L2」、「手写りが無くなるまでの距離Lec」の3つのパラメータの値を求め、それら3つのパラメータの値を手写り検出開始タイミング計算部68−1に出力する。尚、移動量計算部67は、上記3つのパラメータの値を、輪郭画像記憶部62に記憶されている上記2つの手写りが有るプレスキャン画像に対応する輪郭画像から求めるようにしてもよい。
【0079】
手写り検出開始タイミング計算部68−1は、移動量計算部67から入力される「移動量をチェックする時間間隔Tec」、「時間間隔Tecの間の手の画像の移動量Lec」、及び「手写りが無くなるまでの距離L2」の3つのパラメータの値を基に、帳票画像から手写りが無くなるまでの時間T2を後述する方法により計算する。
【0080】
図14は、プレスキャン開始後の、スタンド型イメージスキャナ50の置台52上での帳票とオペレータの手の動きの時間的な状態遷移に伴う「円形度」と「直線本数」の時間的遷移を示す表である。図14には、時間順に(a)〜(f)までの6つの状態における円形度と直線本数の値を示している。図15(a)〜(f)は、図14の(a)〜(f)のそれぞれの状態に対応するプレスキャン画像の例を示している。図15(a)、(b)、(c)、(d)、(e)、(f)の各プレスキャン画像は、それぞれ、時刻Ta、Tb、Tc、Td、Te、Tfで取得された画像である。図15(a)〜(f)の各プレスキャン画像は、例えば、画像撮影部71により一定時間間隔で連続撮影された画像である。
【0081】
ここで、図14に示す状態(a)〜(f)について説明する。
状態(a)は、オペレータが帳票を置台52にセットする途中の状態であり、帳票とオペレータの手が共に置台52上で動いている。この状態(a)においてプレスキャンにより取得される画像は、図15(a)に示すように、帳票と帳票をセットしようとする手の双方が共に縦縞となって写し出されるプレスキャン画像510となる。
【0082】
状態(b)は、オペレータが帳票を置台52にセットする途中(もしくはセットし終わった時)にオペレータの手が帳票上で静止している状態でおり、帳票は置台52上で静止している。この状態(b)においてプレスキャンにより取得される画像は、図15(b)に示すように、帳票と帳票上の手の双方がきちんと写し出されるプレスキャン画像520となる。
【0083】
状態(c)は、オペレータが置台52に帳票を正しくセットした後、手を置台52から離そうと動かしている状態であり、帳票はセットされたまま静止している。この状態(c)においてプレスキャンにより取得される画像は、図15(c)に示すように、動いている手だけが縦縞になって写し出されるプレスキャン画像530となる。
【0084】
状態(d)は、帳票は置台52に正しくセットされたものの、オペレータの手が置台52上から完全に抜け切れずに止まっている状態である。この状態(d)においてプレスキャンにより取得される画像は、図15(d)に示すように、帳票と帳票上の手の双方が共に静止して写し出されるプレスキャン画像540となる。
【0085】
状態(e)は、帳票は置台52に正しくセットされ、オペレータの手が置台52上から抜けようとしている状態である。この状態(e)においてプレスキャンにより取得される画像は、図15(e)に示すように、帳票上に動いている手が縦縞となって写し出されるプレスキャン画像550となる。
【0086】
状態(f)は、帳票は置台52に正しくセットされ、オペレータの手が置台52上から完全に抜けた状態である。この状態(f)においてプレスキャンにより取得される画像は、図15(f)に示すように、置台52上にセットされた帳票と、該セットされた帳票の周囲を囲んでいる置台52の部分(黒枠)が写し出されるプレスキャン画像560となる。
【0087】
上述した手法を用いて状態(a)〜(f)におけるプレスキャン画像から円形度を求め、その円形度の値を標準円形度と比較することで、円形度を“低”、“中”、“高”の3種類に分類すると、状態(a)の円形度は“低”、状態(b)〜(e)の円形度は“中”、状態(f)の円形度は“高”となる。したがって、標準円形度を“高”に設定することにより、状態(f)のみを選別できる。また、上述した手法を用いて状態(a)〜(f)における帳票画像から直線本数を求め、その直線本数の値を標準直線本数(4本)と比較することで、検出された直線本数を“多”(4本より多い)と“4”の2種類に分類する。すると、検出される直線本数は、状態(a)〜(e)が“多”となり、状態(f)のみが“4”となる。以上の結果、状態(f)のみが、円形度が“高”で、かつ直線本数が“4”となる。したがって、円形度が“高”で、かつ直線本数が“4”となっているプレスキャン画像を検出することで、プレスキャン時に、手写りが無い帳票画像が得られたプレスキャン画像を検出できる。そして、その検出時を本スキャン(プレスキャンが動画モードのとき)または後処理(プレスキャンが静止画モードのとき)の開始タイミングとして決定することができる。
【0088】
ところで、オペレータが置台52に帳票を正しくセットした後、オペレータの手が置台52から完全に抜けるタイミングは、状態(e)と状態(f)の間である。したがって、状態(f)の検出を待たずに、状態(e)の時に取得された手写りが有るプレスキャン画像550とそれ以前に取得された手写りが有るプレスキャン画像(この例では、例えば、状態(c)の時に取得されたプレスキャン画像530)を用いて、プレスキャン画像から手が抜けきるタイミングを予測することで、状態(f)のプレスキャン画像が取得されるよりも前に、本スキャン(プレスキャンが動画モードのとき)または後処理(プレスキャンが静止画モードのとき)を開始することが可能となる。
【0089】
次に、状態(c)と状態(e)のプレスキャン画像530、550を用いて、上記の考えに基づいて最適な本スキャンまたは後処理の開始タイミングを計算する手法を、図16を参照して説明する。図16(a)、(b)に示すプレスキャン画像は、それぞれ、図15(c)、(e)に示すプレスキャン画像と同じものである。
【0090】
(1)図16(a)、(b)に示すプレスキャン画像530、550のそれぞれから、黒背景画像の左右の枠に平行な方向の手の画像の長さL1、L2を求める。この場合、L1、L2は手の画像の上端から黒背景画像の下枠の上端までの距離に設定する。そして、下記式(2)により、図16(b)に示すLecを求める。
Lec=L1−L2 ・・・(2)
【0091】
また、図15(c)に示すプレスキャン画像530の取得時刻Tcと図15(e)に示すプレスキャン画像550の取得時刻Teから、下記の式(3)により、チェック時間間隔Tecを求める。
Tec=Te−Tc ・・・(3)
【0092】
そして、最後に、下記式(4)により時間T2を求める。
T2=Tec×L2/Lec ・・・(4)
T2は、プレスキャン画像550を取得した時刻Teから手写りが無い帳票画像を取得可能となる時刻までの予測経過時間である。したがって、プレスキャンが動画モードであった場合には、時刻Teから時間T2が経過した後に本スキャンを開始することで、本スキャンの開始を早めることが可能となる。また、プレスキャンが静止画モードであった場合には、時刻Teから時間T2が経過した後に本スキャンを開始することで、本スキャンの開始を早めることが可能となる。
【0093】
また、前記円形度の変化量を利用して上記時間T2を計算することも可能である。この場合のT2を求める計算式は下記の式(5)となる。
T2=Tec×C2/Cec ・・・(5)
式(5)において、
C2:T2の円形度(手写りがない輪郭画像の円形度)
Cec=(時刻Teで取得した輪郭画像の円形度)−(時刻Tcで取得した輪郭画像の円形度)
Tec=Te−Tc
である。
【0094】
このように、本発明の実施の形態では、2つの手写りが有るプレスキャン画像を利用することで、手写りが無い帳票画像を取得可能な本スキャンの開始タイミング(プレスキャンが動画モードの場合)または後処理を開始可能なタイミング(プレスキャンが静止画モードの場合)を自動的に予測し、より早いタイミングで本スキャンまたは後処理を開始することができる(図5の時刻Ti2参照)。
【0095】
{プレスキャン画像に手写りが無いことを自動判定してから本スキャンまたは後処理を開始する場合の処理手順}
図17は、プレスキャン画像に手写りが無くなってから本スキャンまたは後処理を開始する手法(第1の手法)を示すフローチャートである。このフローチャートに示す処理は、画像処理装置10−1によって実行される。
【0096】
この手法では、まず、スタンド型イメージスキャナ50の画像撮影部71により帳票を撮影するプレスキャンを開始する(ステップS11)。このプレスキャンは、画像処理装置10(10−1〜10−3)が起動され、アプリケーションソフトから本発明の実施の形態の画像処理プログラム(前記ドライバ・ソフトウェア)がオープンされることにより開始される。プレスキャンの開始により、スタンド型イメージスキャナ50の画像撮影部71はプレスキャンを一定時間間隔で連続して実行する。プレスキャンにより画像撮影部71により撮影された画像は、上述のようにしてブロック画像単位で画像撮影部71から画像処理装置10(10−1〜10−3)のUSBインターフェース14に転送される。CPU11は、画像撮影部71から転送されてきたブロック画像からプレスキャン画像を生成し、そのプレスキャン画像を撮影画像記憶部61に格納する。このプレスキャンは、静止画モードまたは動画モードのいずれかのモードで行われる。動画モードで行われた場合には、解像度は劣るものの撮影間隔が静止画モードよりも短いので、プレスキャン画像の取得を静止画モードよりも高速に行える。その結果、手写りが無いプレスキャン画像を静止画モードよりも早く検出可能である。
【0097】
次に、輪郭抽出処理部63は撮影画像記憶部61に格納されているプレスキャン画像から輪郭画像を抽出し、その輪郭画像を輪郭画像記憶部62に格納する。円形度、直線数演算部64は、輪郭画像記憶部62に格納されている輪郭画像を基に円形度と直線本数を計算する(ステップS12)。手写り判定部65は、円形度、直線数演算部64によって計算された円形度と直線本数を基に、プレスキャン画像内の帳票画像に手写りが有るか判定する処理を行う(ステップS13)。手写り判定部65は、ステップS13での判定結果を基に、プレスキャン画像に手写りが有るか否を判定し(ステップS14)、プレスキャン画像に手写りが有ると判定した場合には(ステップS14、Yes)、処理をステップS12に戻す。
【0098】
このようにして、ステップS14で手写り判定部65がプレスキャン画像に手写りが無いと判定するまで、ステップS12〜ステップS14の処理を繰り返す。換言すれば、手写りが無いプレスキャン画像が取得されるまで、ステップS12〜S14の処理を繰り返す。
【0099】
手写り判定部65は、ステップS14においてプレスキャン画像に手写りが無いと判定すると(ステップS14、No)、ステップS15に処理を進める。
ステップS15においては、手写り判定部65はプレスキャンが静止画モードであるか否かどうか判断し、静止画モードであれば(ステップS15、Yes)処理をステップS17に進め、動画モードであれば(ステップS15、No)ステップS16に処理を進める。
【0100】
ステップS16においては、手写り判定部65は画像撮影部71に静止画モードでの撮影を指示し、画像撮影部71は静止画モードで置台52全体を含む範囲を再撮影する。そして、画像撮影部71は、該再撮影により取得した画像をブロック画像単位で撮影画像記憶部61に転送し、撮影画像記憶部61は画像撮影部71から受信したブロック画像から1フレームのカラー画像(カラーの帳票画像とその帳票画像を囲む黒背景画像を含む画像)を生成し、そのフレーム画像を撮影画像記憶部61内の所定領域に格納する。そして、撮影画像記憶部61は、ステップS17に処理を進める。
【0101】
ステップS17において、画像変換処理部(不図示)は、撮影画像記憶部61に格納されている手写りが無い帳票画像に画像変換処理(画像の倍率、/歪み/斜行を補正する処理)を施し、その画像変換処理が施された帳票画像を撮影画像記憶部61に格納する。出力部66は、撮影画像記憶部61から上記画像変換処理が施された帳票画像を読み出し、その帳票画像をUSBインターフェース14経由でモニタ20に出力する。OCR処理部(不図示)は、撮影画像記憶部61から上記画像変換が施された帳票画像を読み出し、その帳票画像の文字認識処理を実行する。
【0102】
以上のようにして、図17のフローチャートの処理が終了する。
{手写りが無くなる時間を計算して本スキャンまたは後処理を開始する場合の処理手順}
図18は、プレスキャン画像に手写りが無くなる時間を予測計算して本スキャンまたは後処理を開始する手法(第2の手法)を説明するフローチャートである。このフローチャートに示す処理は、画像処理装置10−2によって実行される。
【0103】
この手法では、まず、プレスキャンを開始し(ステップS31)、次に、ステップS31で取得されたプレスキャン画像を基に円形度と直線本数を計算する(ステップS32)。そして、ステップS32で求めた円形度と直線本数を基に、プレスキャン帳票画像に手写りがあるか否かを判定する(ステップS33)。次に、ステップS33の判定結果に基づいてプレスキャン帳票画像に手写りがあるか否かを判別する(ステップS34)。ステップS31〜S33の処理は、上述した図18のフローチャートのステップS11〜S13の処理と同様であるので、詳しい説明は省略する。
【0104】
手写り判定部65は、ステップS34において、プレスキャン画像に手写りが有ると判定すると(ステップS34でYes)、処理をステップS35に進める。他方、プレスキャン画像に手写りが無いと判定すると(ステップS34、No)、処理をステップS41に進める。
【0105】
ステップS35において、手写り判定部65は、前回もプレスキャン画像に手写りが有ると判定したか否かを判断する(ステップS35)。このステップS35の処理は、連続する2つのプレスキャン画像において手写り有りと判定したか否かを判断する処理である。ステップS35において、手写り判定部65が前回もプレスキャン画像に手写り有りと判定したと判断すると(ステップS35、Yes)、移動量計算部67と手写り検出開始タイミング計算部68−1は、上述した手法を用いて、スタンド型イメージスキャナ50の画像撮影部71が撮影した前回と今回の2つのプレスキャン画像からオペレータの手が抜けるまでの時間T2を計算し、その時間T2の間、処理をウェイトする(ステップS36)。
【0106】
そして、時間T2が経過すると、手写り判定部65は、プレスキャンが動画モードであった場合には画像撮影部71による撮影モードを静止画モードに切り替え、画像撮影部71は静止画モードでプレスキャンを実行する(ステップS37)。そして、静止画モードのプレスキャンで取得されたプレスキャン画像を基に、ステップS38〜S40の処理を行う。ステップS38〜S39の処理は、上述したステップS32〜S33の処理と同様であるので詳しい説明は省略する。
【0107】
手写り判定部65は、ステップS40においてプレスキャン画像に手写りがあると判定すると(ステップS40、Yes)、処理をステップS36に戻す。このようにして、手写りが無いプレスキャン画像が取得されるまでステップS36〜S40の処理を繰り返す。 そして、ステップS40において、手写り判定部65がプレスキャン画像に手写りが無いと判定すると(ステップS40、No)、ステップS43に処理を進める。
【0108】
ステップS41において、手写り判定部65は、プレスキャンが静止画モードであるか否かを判断し、静止画モードであれば(ステップS41、Yes)ステップS42に処理を進め、動画モードであれば(ステップS41、No)ステップS43に処理を進める。
【0109】
ステップS42の処理は、図17のフローチャートのステップS16の処理と同様であり、ステップS42の処理が終了すると、ステップS43の処理に進める。
ステップS43の処理は、図17のフローチャートのステップS16と同様の処理である。ステップS43において、画像変換処理部(不図示)により撮影画像記憶部61に格納されている手写りが無い帳票画像に画像変換処理(画像の倍率、/歪み/斜行を補正する処理)が施され、その画像変換処理が施された帳票画像は出力部66によりUSBインターフェース14経由でモニタ20に出力されると共に、OCR処理部(不図示)により文字認識処理が実行される。
【0110】
このように、第2の手法では、プレスキャンにより取得した手写りが有る2つのプレスキャン画像を基に、スタンド型イメージスキャナ50が撮影するプレスキャン画像に手が写らなくなるまでの時間T2を予測し、その予測した時間T2が経過した後に(時刻Ti2で)手写りが無いプレスキャン画像が取得できたならば、直ちに、そのプレスキャン画像に画像変換処理を行い、続けて、後処理を開始する。これにより、第1の手法よりも後処理を早く実行することが可能となる(図5参照)。
【0111】
尚、図18のフローチャートにおいて、プレスキャンを動画モードで開始した場合、ステップS37の処理を省略するようにしてもよい。このようなアルゴリズムは、ステップS36〜ステップS40の繰り返し処理を高速に実行できるので、予測時間T2が外れる可能性が高い場合に有効である。他方、ステップS37の処理を実行するアルゴリズムは、予測時間T2が外れる可能性が低い場合に有効である。これは、ステップS41の処理を開始する時点において静止画モードで撮影したプレスキャン画像が撮影画像記憶部61に既に格納されている(本スキャンが終了している)ので、画像撮影部71で再撮影することなく、ステップS41の処理を直ちに実行できるからである。
【0112】
尚、プレスキャンを動画モードで開始した場合であって、かつ、ステップS37の処理を実行しない場合には、ステップS38〜S40の処理は動画モードで実行される。この場合、ステップS40でプレスキャン画像に手写りがないと判断した場合には(ステップS40、No)、次に本スキャンを行い、その本スキャンで取得された帳票画像についてステップS43の処理を実行する。
【0113】
本発明の実施の第2の形態によれば、手写りが有る2つのプレスキャン画像を用いることで、本スキャンまたは後処理の開始タイミングを自動的に予測し、本スキャンまたは後処理をその予測したタイミングで開始することができる。
【0114】
{適用例}
次に、図19〜図22を参照しながら、本発明の画像処理装置の実施の第1及び第2の形態を、手写り以外の帳票画像を正しく取得できない状態に適用したと場合について説明する。
【0115】
図19〜図22において、図19は、帳票上に誤って置かれた物が帳票の輪郭を覆いながら帳票からはみ出している場合に、本発明の画像処理装置の実施の第1及び第2の形態を適用したケースを説明する図である。図19(a)において破線の矩形枠はスタンド型イメージスキャナ50のCCDカメラ51の撮影範囲610を示している。図20(a)、図21(a)、図22(a)の破線の矩形枠も同様である。したがって、図19(a)、図20(a)、図21(a)、図22(a)に示す撮影範囲610内の画像はCCDカメラ51によって撮影された画像である。
【0116】
図19(a)のケースでは、撮影範囲610内にある置台52に正しくセットされた帳票710の左下隅に物810が誤って置かれている。画像撮影部71は、図19(a)に示すCCDカメラ51によって撮影された撮影範囲610内の画像を図19(b)に示す切り出し範囲910で切り出し、その切り出した画像をブロック画像単位で撮影画像記憶部61に転送する。輪郭抽出処理部63は、切り出し範囲910内の撮影画像から、図19(b)に示す輪郭画像1010を抽出する。輪郭画像1010の輪郭線1011は、7本の直線から構成されている。したがって、円形度、直線数演算部64が輪郭線1011から検出する直線本数は標準直線本数(=4本)を超えるので、手写り判定部65は置台52上の帳票に誤って置かれた物810を判定できる。
【0117】
図20は、置台に正しくセットされた帳票内に付箋紙のようなものが張り付いている場合に本発明の実施の形態の第1及び第2の形態を適用したケースを説明する図である。付箋紙は印刷と区別できないので、撮影画像から帳票画像内の付箋紙の画像を判別することはできない。
【0118】
図20(a)に示すように帳票710の上(この例では左上)に付箋紙820が貼り付いている場合、画像撮影部71は図20(a)に示すCCDカメラ51によって撮影された撮影範囲610内の撮影画像を切り出し範囲920で切り出し、その切り出した画像をブロック画像単位で撮影画像記憶部61に転送する。図20(b)に示すように、輪郭抽出処理部63により、撮影画像記憶部61に格納された上記切り出し画像から抽出される輪郭画像1020の輪郭線1021は帳票画像の輪郭線と同様になる。このため、円形度、直線数演算部64が輪郭線1021から検出する直線本数は4本となり標準直線本数と等しくなるので、手写り判定部65は帳票710上に付箋紙820が貼り付いていることを判定することはできない。
【0119】
図21は、帳票が撮影範囲からはみ出している場合に本発明の実施の第1及び第2の形態を適用したケースを説明する図である。
図21(a)に示すように撮影範囲610から帳票710がはみ出している(この例では右側面にはみ出している)場合、撮影範囲610外にある帳票710の一部はCCDカメラ51により撮影されない。画像撮影部71は、図21(a)に示すCCDカメラ51により撮影された撮影範囲610内の撮影画像から図21(b)に示す切り出し範囲930内の画像を切り出し、その切り出した画像をブロック画像単位で撮影画像記憶部61に転送する。輪郭抽出処理部63は、図21(b)に示す切り出し範囲内の画像から輪郭画像1030を抽出する。この場合、帳票のはみ出し部分は置台52を覆うので、黒画素から白画素に変化する箇所を検出する通常の方法では帳票の輪郭画像を抽出することはできない。したがって、このような場合には、輪郭抽出処理部63は、撮影画像の撮影範囲610の外周に該当する部分を帳票画像の輪郭とみなして、図21(b)に示す輪郭画像1030を抽出する。この輪郭画像1030の輪郭線1031は矩形となる。したがって、円形度、直線数演算部64が輪郭線1013から検出する直線本数は標準直線本数と同じとなるので、手写り判定部65は輪郭線1013から検出される直線本数のみでは帳票710が置台52からはみ出していることを判定できない。しかしながら、輪郭画像1030の周囲長(輪郭線の画素数)は本来の帳票画像の周囲長よりも短いので、その円形度は標準円形度より小さくなる。このため、手写り判定部65は、円形度、直線数演算部64により計算された輪郭画像1030の円形度を標準円形度と比較することで、帳票710が置台52に正しくセットされていないことを判定できる。これに対し、前記公知文献3に開示されている手法は、帳票画像が帳票設置台(本実施形態の置台52に相当)からはみ出しているために合成画像内に黒色の枠(本実施形態の黒背景画像に相当)の領域の一部が存在しないような場合には手写り有りと判定するようにしているため(段落番号[0096]参照)、公知文献3に開示されている手法では、「手写り」と「帳票の置台からのはみ出し」とを区別することはできない。
【0120】
図22は、帳票の外に異物が撮影範囲内に置かれている場合に本発明の実施の第1及び第2の形態を適用したケースを説明する図である。
図22(a)に示すように、撮影範囲610内にある置台52に帳票710が正しくセットされ、かつ、撮影範囲610内の帳票710の外に物810が誤って置かれていた場合、画像撮影部71は、図22(a)に示すCCDカメラ51により撮影された撮影範囲610内の撮影画像から図22(b)に示す切り出し範囲940内の画像を切り出す。そして、その切り出した画像をブロック画像単位で撮影画像記憶部61に転送する。輪郭抽出処理部63は、上記切り出し画像から、図22(b)に示す輪郭画像1040を抽出する。この輪郭画像1040は帳票710の撮影画像そのものとなる。したがって、円形度、直線数演算部64が輪郭画像1040から抽出する輪郭線1041は帳票710の撮影画像の輪郭線と同じになる。この結果、手写り判定部65は帳票710の外側の撮影範囲610内に物810が誤って置かれていた場合、その物810を判定することはできない。
【0121】
[実施の第3の形態]
本発明の実施の第3の形態は、各オペレータについて、スタンド型イメージスキャナ50を利用した際の帳票を置台52に帳票をセットした後のオペレータの手の移動速度を毎回記録していくことで、各オペレータのオペレータ毎の本スキャン(プレスキャンが動画モードの場合)または後処理(プレスキャンが静止画モードの場合)の開始タイミングを学習する。
【0122】
図23は、図1に示すハードウェア構成を有する本発明の実施の第3の形態の機能ブロック構成を示す図である。図23に示す画像処理装置10−3おいて、図13に示す画像処理装置10−2が備える構成要素と同じ構成要素には同一の符号を付与しており、それらの構成要素については詳しい説明を省略する。
【0123】
画像処理装置10−3は、画像処理装置10−2が備える構成要素61〜66、68に加え、移動速度計算部69、移動速度テーブル記憶部70及びログオン制御部71を備えている。また、手写り検出開始タイミング計算部68−2は、図13に示す同一名称の構成要素(手写り検出開始タイミング計算部68−1)が有する機能に加え、更に別の機能も備えている。
【0124】
移動速度テーブル記憶部70は、例えばHDD13内に設けられ、スタンド型イメージスキャナ50を利用して帳票の画像読み取りを行うオペレータの移動速度を学習するために使用される移動速度テーブルを格納する記憶領域を備えている。ここで、移動速度とは、オペレータがスタンド型イメージスキャナ50を利用して帳票の画像読み取り操作を行う際の、置台52に帳票をセットした後のオペレータの手の移動速度のことである。オペレータがスタンド型イメージスキャナ50を利用して帳票の画像読み取り操作を行う毎に、そのオペレータの移動速度が移動速度テーブルに登録される。オペレータの移動速度の学習は、移動速度テーブルへの移動速度の登録回数が一定回数に達した時点で終了し、以後は、それまでの移動速度の平均値(平均移動速度)がオペレータの移動速度として用いられる。移動速度テーブルは、上記移動速度と上記平均移動速度を、各オペレータに一意的に割り当てられるオペレータID(オペレータ識別子)に対応付けて格納する。
【0125】
移動速度計算部69は、オペレータがスタンド型イメージスキャナ50を利用して帳票の画像の読み取り操作を行う毎に、該オペレータの移動速度を計算し、その計算した移動速度を、直接またはログオン制御部70を介して移動速度テーブルに登録する。
【0126】
ここで、移動速度計算部69が移動速度を求めるための計算式を、図16の例を用いて説明する。
上述したように、
T2=Tec×L2/Lec ・・・(4)
Tec=Te−Tc ・・・(3)
Lec=L2−L1 ・・・(2)
であるので、
移動速度をVmovとすると、
Vmov=Lec/Tec ・・・(6)
となる。
【0127】
したがって、式(4)と式(6)から、
T2=L2/Vmov ・・・(7)
が得られる。
【0128】
また、移動速度の学習が終了したオペレータの時間T2の計算式は下記の式(8)となる。
T2=L/Vmov-av ・・・(8)
L:プレスキャン画像(撮影画像)または輪郭画像内での手の画像の長さ(図16(c)、(e)のL1、L2に相当)
Vmov-av:平均移動速度
【0129】
移動速度計算部69は、移動速度の学習が終了すると、前記平均移動速度を求め、その平均移動速度を移動速度テーブルに、直接、またはログオン制御部70を介して移動速度テーブルに登録する。尚、後述するように、移動速度の学習が終了したオペレータの平均移動速度をログオン制御部71が求めるようにしてもよい。移動量計算部67は、移動速度の学習が終了したオペレータについては、以後の移動速度の計算を中止する。移動速度計算部69は、撮影画像記憶部61に格納されている手写りが有るプレスキャン画像または輪郭画像記憶部62に格納されている該プレスキャン画像の輪郭画像から前記式(7)のL2を求め、このL2を手写り検出開始タイミング計算部68−2に出力する。移動速度計算部69は、移動速度の学習が終了していないオペレータについては、移動量計算部67と同様にしてTec、Lec、L1、L2を求め、式(2)と式(6)から移動速度Vmovを求める。そして、L2と移動速度Vmovを手写り検出開始タイミング計算部68−2に出力する。移動量計算部67−3は、移動速度の学習が終了したオペレータについては、L2のみを手写り検出開始タイミング計算部68−2に出力する。
【0130】
手写り検出開始タイミング計算部68−2は、移動速度の学習がしていないオペレータについては、移動速度計算部69から入力するL2と移動速度Vmovを用いて前記式(7)により時間T2を計算する。また、移動速度の学習が終了したオペレータについては、移動速度計算部69から入力するL2と、直接またはログオン制御部70を介して移動速度テーブルから読み出した平均移動速度Vmov-avを用いて前記式(8)により時間T2を計算する。手写り検出開始タイミング計算部68−2は、上述のようにして計算した時間T2を輪郭抽出処理部63に通知する。輪郭抽出処理部63は、手写り検出開始タイミング計算部68−2から通知された時間T2の間、処理をウェイトする。尚、手写り検出開始タイミング計算部68−2は、移動速度の学習が終了していないオペレータの移動速度を、直接またはログオン制御部71を介して移動速度テーブルから読み出すことも可能である。
【0131】
ログオン制御部71は、画像処理装置10を利用するための認証画面であるログオン入力画面をモニタ20に表示し、ログオン入力画面に入力されたオペレータのユーザIDとパスワードによりユーザ認証を行う。オペレータは、ユーザ認証に成功することで、スタンド型イメージスキャナ50を利用して帳票の画像読み取り操作を行うことが可能になる。ログオン制御部71は、ユーザ認証に成功すると、オペレータのユーザIDを「オペレータID」として移動速度テーブル記憶部70に書き込むと共に、そのオペレータIDを移動速度計算部69と手写り検出開始タイミング計算部68−2に通知する。移動速度計算部69と手写り検出開始タイミング計算部68−2は、ログオン制御部71からオペレータIDを通知されることで、現在、画像処理装置10−3を利用しているオペレータのオペレータIDを知ることができ、移動速度テーブルに対するアクセスをオペレータIDに対応付けて実行できる。ログオン制御部71は、移動速度テーブルへのオペレータIDの登録を、例えば、各オペレータの初回のログオン時にのみ行う(移動速度テーブルアクセスの第1の形態)。この第1の形態の場合、移動速度計算部69は各オペレータについて移動速度テーブルへの移動速度の登録回数を管理できるので、各オペレータの移動速度の学習終了を判断できる。そして、移動速度の学習が終了したオペレータについては、平均移動速度を求め、その平均移動速度を移動速度テーブルに登録する。
【0132】
また、上記第1の形態ではなく、移動速度テーブルの管理をログオン制御部71が一元的に管理するようにしてもよい。この形態においては、各オペレータの移動速度と平均移動速度の書き込みは、移動速度計算部69からの依頼を受けてログオン制御部71が実行する。また、ログオン制御部71は、手写り検出開始タイミング計算部68−2からの依頼を受けて、現在、スタンド型イメージスキャナ50を利用しているオペレータのオペレータIDの移動速度Vmovまたは平均移動速度Vmov-avを手写り検出開始タイミング計算部68−2に通知する(移動速度テーブルアクセスの第2の形態)。この第2の形態では、ログオン制御部71が各オペレータの移動速度の移動速度テーブルへの登録回数を管理できるので、ログオン制御部71は、移動速度の学習が終了したオペレータについては、平均移動速度を求め、その平均移動速度を移動速度テーブルに登録する。また、移動速度の学習が終了したオペレータのオペレータIDを移動速度計算部69と手写り検出開始タイミング計算部68−2に通知する。これにより、移動速度計算部69と手写り検出開始タイミング計算部68−2は、移動速度の学習が終了したオペレータのオペレータIDを知ることができる。
【0133】
手写り検出開始タイミング計算部68−2は、移動速度の学習が終了したオペレータについては、式(8)を用いて時間T2を計算する。したがって、移動速度計算部69は、移動速度の学習が終了したオペレータについてはLのみを求めればよい。換言すれば、移動速度の学習終了後は、移動速度計算部69は、1つの手写りがあるプレスキャン画像(撮影画像)またはその輪郭画像からLを求めればよい。これにより、手写り検出開始タイミング計算部68−2は、移動速度の学習が終了したオペレータについて時間T2を計算する際には、手写り判定部65が2回手写りを判定するのを待つ必要はなくなる。換言すれば、2つの手写りが有るプレスキャン画像を利用しなくても、1つの手写りが有るプレスキャン画像のみ(例えば、最初に検出された手写りが有るプレスキャン画像またはその輪郭画像)を用いて時間T2を算出できる。したがって、移動速度の学習が終了したオペレータについては、時間T2の算出タイミングを、移動速度の学習終了前よりも早めることが可能となる。
【0134】
このように、移動速度の学習終了後は、移動速度計算部69による移動速度の計算を実行する必要はなく、手写り検出開始タイミング計算部68−2は、移動速度テーブルに格納されている各オペレータの平均移動速度を読み出すことで、各オペレータの時間T2を計算することが可能となる。これにより、学習終了後は、時間T2の計算時間が短縮される。しかも、手写り判定部65が「最初の手写りが有るプレスキャン画像」を検出した時点で、そのプレスキャン画像を用いて、直ちに、時間T2を算出することが可能となる。
次に、移動速度テーブルの構成例を説明する。
【0135】
図24は、図23に示す移動速度テーブル記憶部70内に設けられる移動速度テーブルの構成例を示す図である。
図24に示す移動速度テーブル1100は、各オペレータに固有のID(オペレータID)を用いて個々のオペレータの移動速度の平均量を記憶・管理する機能を備えている。尚、図24の移動速度テーブル1100に記載されているTc、Te、Lecは、図16に示す同一表記のパラメータと同じパラメータであり、上記時間T2の算出式(4)で必要とされるパラメータである。ここで、移動速度テーブル1100に格納される移動速度は、単位時間(この例では1s(1秒))当たりの移動量(単位はmm)に等しく、その単位はmm/sである。
【0136】
移動速度テーブル1100は、オペレータIDをキーとするテーブルであり、各オペレータについて、スタンド型イメージスキャナ50により帳票の画像読み取りの操作を行ったときの各回の移動速度と、移動速度の学習終了後に算出された平均移動速度を格納する。移動速度テーブル1100の各エントリは、オペレータIDを格納するフィールドと、そのオペレータIDを有するオペレータの移動速度を格納するフィールドを備えている。該移動速度を格納するフィールドは、オペレータの各回のスタンド型イメージスキャナ50操作時の移動速度と、移動速度の学習終了後に求められた平均移動速度を格納するフィールドを備えている。
【0137】
図24に示す移動速度テーブル1100には、オペレータIDが、それぞれ、“0001”、“0002”、“0003”、“0004”である4人のオペレータの毎回の移動速度と平均移動速度が格納されている。移動速度テーブル1100には、オペレータIDが“0001”のオペレータについて、1回目、2回目、3回目の移動速度が、それぞれ、240mm/s、220mm/s、230mm/sであることと、平均移動速度が230mm/sであるという情報が格納されている。オペレータIDが“0002”、“0003”、“0004”のそれぞれのオペレータについても、同様に、毎回の移動速度と平均移動速度の情報が格納されている。
【0138】
尚、移動速度とその平均移動速度ではなく、円形度変化量とその平均円形度変化量をテーブルに格納するような実施例も可能である。このような実施例の画像処理装置は、図23の移動速度テーブル記憶部70を円形度記憶テーブ記憶部に、移動速度計算部69を円形度計算部に置き換える構成にし、前記円形度記憶テーブル記憶部内に円形度記憶テーブルを設けることで実現できる。
【0139】
尚、移動速度を学習する手法では学習後にも毎回手の画像の長さLを求める必要があるが、円形度変化量を学習する手法の場合、C2は一定値であるので、学習後には平均円形度変化量をテーブルから読み出すだけで時間T2を計算できるという利点がある。
【0140】
また、平均移動速度、平均円形度変化量の求め方は、過去の全ての値の平均を求める方法に限らず、直近の所定数の平均値を求める方法など様々な形態が考えられる。
本発明の実施の第3の形態によれば、各オペレータの平均的な移動速度または円形度変化量を学習することで、学習終了後は、各オペレータの本スキャン開始タイミングを、本発明の実施の第2の形態よりも高速に自動的に求めることができる。
【0141】
尚、一定時間間隔で撮影したプレスキャン画像(もしくは輪郭画像)から時間T2を求める場合には、最初のみ上述した方法によりタイムスタンプからTecを求めるようにしてもよい。この場合、以後の時間T2の計算では、その最初に求めたTecを用いるようにする。
【0142】
本発明の画像処理方法を適用したソフトウェア(プログラム)は、可搬性の記憶媒体に格納して配布するようにしてもよいし、ネットワークからダウンロードして配布するようにしてもよい。さらには、Saas(Software as a Service)などのようにクラウドサービスでソフトウェアを提供するようにしてもよい。
【0143】
以上、本発明を実施の形態に基づき説明したが、本発明は上述した実施の形態に限定されるものではない。本発明の保護範囲は、特許請求の範囲に記載された発明とその均等物に及ぶ。
【符号の説明】
【0144】
10(10−1〜10−3) 画像処理装置
11 CPU
12 RAM
13 HDD
14 USBインターフェース
20 モニタ
30 キーボード
40 マウス
50 スタンド型イメージスキャナ
51 CCDカメラ
52 置台
53 帳票突合ガイド
54 支柱
61 撮影画像記憶部
62 輪郭画像記憶部
63 輪郭抽出処理部
64 円形度、直線数演算部
65 手写り判定部
66 出力部
67 移動量計算部
68(68−1、68−2) 手写り検出開始タイミング計算部
69 移動速度計算部
70 移動速度テーブル記憶部
71 ログオン制御部
1100 移動速度テーブル

【特許請求の範囲】
【請求項1】
コンピュータを、
被写体の撮影画像から被写体部分の輪郭を抽出し、被写体部分を含む輪郭画像を作成する輪郭画像抽出手段と、
該輪郭画像抽出手段によって作成された輪郭画像を基に、該輪郭画像内に被写体以外の物体の画像が含まれているか否かを判定するために必要となる特徴量を算出する特徴量計算手段と、
該特徴量計算手段により得られた特徴量を基に、前記輪郭画像内に被写体以外の物体の画像が含まれているか否かを判定する判定手段、
として機能させるための画像処理プログラム。
【請求項2】
前記特徴量は、被写体が正常に撮影された場合に得られる輪郭画像の面積と実際の撮影により得られた輪郭画像の周囲長を用いて算出される円形度であり、
前記判定手段は、前記特徴量計算手段により算出された円形度を予め定めた標準円形度と比較することで、輪郭画像内に被写体以外の物体の画像が含まれているか否かを判定する、
ことを特徴とする請求項1記載の画像処理プログラム。
【請求項3】
前記特徴量は、前記輪郭画像の輪郭を構成する直線と前記輪郭画像から検出される直線の合計本数であり、
前記判定手段は、前記特徴量計算手段により検出された直線本数を予め定めた標準直線本数と比較することで、輪郭画像内に被写体以外の物体の画像が含まれているか否かを判定する、
ことを特徴とする請求項1乃至2記載の画像処理プログラム。
【請求項4】
前記特徴量は、撮影により得られた輪郭画像の輪郭に含まれる前記被写体の輪郭を構成する辺の数であり、
前記判定手段は、前記特徴量計算手段により検出された辺の数を予め定めた標準辺数と比較することで、輪郭画像内に被写体以外の物体の画像が含まれているか否かを判定する、
ことを特徴とする請求項1乃至3記載の画像処理プログラム。
【請求項5】
コンピュータを、
オペレータによる撮影指示がなされる前に、画像撮影手段に対して被写体をプレスキャンするように指示するプレスキャン指示手段と、
該プレスキャンにより取得された撮影画像から被写体部分の輪郭を抽出し、被写体部分を含む輪郭画像を作成する輪郭画像抽出手段と、
該輪郭画像抽出手段によって作成された輪郭画像内に被写体以外の物体の画像が含まれているか否かを判定するために必要となる特徴量を算出する特徴量計算手段と、
該特徴量計算手段により得られた特徴量を基に、前記輪郭画像内に被写体以外の物体の画像が含まれているか否かを判定する判定手段と、
該判定手段により前記輪郭画像内に被写体以外の物体の画像が含まれていると判定された場合には、前記プレスキャンにより得られた少なくとも2つの被写体以外の物体が含まれる撮影画像もしくはそれら2つの撮影画像の輪郭画像を基に、前記画像撮影手段が撮影する撮影画像内に被写体以外の物体が写らなくなるまでの時間を計算する計算手段と、
前記画像撮影手段によるプレスキャンにおける撮影が本来必要とされる解像度よりも低い解像度での撮影であった場合には、前記計算手段により算出された時間に応じた適切なタイミングで、前記画像撮影手段に対して前記被写体を本来必要とされる解像度で再度スキャンするように指示する再スキャン指示手段、
として機能させるための画像処理プログラム。
【請求項6】
前記計算手段は、異なる時刻に撮影された前記2つの被写体以外の物体が含まれる撮影画像もしくはそれら2つの撮影画像の輪郭画像間での物体の移動量を求め、その移動量を基に前記時間を計算することを特徴とする請求項5記載の画像処理プログラム。
【請求項7】
前記計算手段は、オペレータ毎の移動量に関するデータを、オペレータが撮影指示を行う毎に移動量データ記憶手段に記憶させ、前記移動量データ記憶手段に移動量に関するデータを記憶した回数が一定回数に達したオペレータについては、該オペレータのそれまでの移動量に関するデータの平均値を計算し、その計算により得られた平均値を前記移動量情報記憶手段に記憶させ、以後、前記オペレータについて撮影手段が撮影する撮影画像内に被写体以外の物体が写らなくなるまでの時間を計算する際には前記移動量データ記憶手段に記憶されている前記オペレータの平均値を用いて計算すること、
を特徴とする請求項6記載の画像処理プログラム。
【請求項8】
前記計算手段は、異なる時刻に撮影された前記2つの被写体以外の物体が含まれる撮影画像それぞれについて被写体が正常に撮影された場合に得られる輪郭画像の面積と該撮影により得られた輪郭画像の周囲長を用いて算出される円形度を求め、前記2つの被写体以外の物体が含まれる撮影画像の輪郭画像間における前記円形度の変化量である円形度変化量を基に、前記画像撮影手段が撮影する撮影画像内に被写体以外の物体が写らなくなるまでの時間を計算することを特徴とする請求項5乃至7記載の画像処理プログラム。
【請求項9】
前記計算手段は、オペレータ毎の円形度変化量を、オペレータが撮影指示を行う毎に円形度変化量記憶手段に記憶させ、前記円形度変化量記憶手段に円形度変化量を記憶した回数が一定回数に達したオペレータについては、該オペレータのそれまでの円形度変化量の平均値を計算し、その計算により得られた平均円形度変化量を前記円形度変化量記憶手段に記憶させ、以後、前記オペレータについて撮影手段が撮影する撮影画像内に被写体以外の物体が写らなくなるまでの時間を計算する際には前記円形度変化量記憶手段に記憶されている前記オペレータの平均円形度変化量を用いて計算すること、
を特徴とする請求項8記載の画像処理プログラム。
【請求項10】
被写体の撮影画像から被写体部分の輪郭を抽出し、被写体部分を含む輪郭画像を作成する輪郭画像抽出手段と、
該輪郭画像抽出手段によって作成された輪郭画像を基に、該輪郭画像内に被写体以外の物体の画像が含まれているか否かを判定するために必要となる特徴量を算出する特徴量計算手段と、
該特徴量計算手段により得られた特徴量を基に、前記輪郭画像内に被写体以外の物体の画像が含まれているか否かを判定する判定手段と、
を備えることを特徴とする画像処理装置。
【請求項11】
オペレータによる撮影指示がなされる前に、画像撮影手段に対して被写体をプレスキャンするように指示するプレスキャン指示手段と、
該プレスキャンにより取得された撮影画像から被写体部分の輪郭を抽出し、被写体部分を含む輪郭画像を作成する輪郭画像抽出手段と、
該輪郭画像抽出手段によって作成された輪郭画像内に被写体以外の物体の画像が含まれているか否かを判定するために必要となる特徴量を算出する特徴量計算手段と、
該特徴量計算手段により得られた特徴量を基に、前記輪郭画像内に被写体以外の物体の画像が含まれているか否かを判定する判定手段と、
該判定手段により前記輪郭画像内に被写体以外の物体の画像が含まれていると判定された場合には、前記プレスキャンにより得られた少なくとも2つの撮影画像を基に、前記画像撮影手段が撮影する撮影画像内に被写体以外の物体が写らなくなるまでの時間を計算する計算手段と、
前記画像撮影手段によるプレスキャンにおける撮影が本来必要とされる解像度よりも低い解像度での撮影であった場合には、前記計算手段により算出された時間に応じた適切なタイミングで、前記画像撮影手段に対して前記被写体を本来必要とされる解像度で再度スキャンするように指示する再スキャン指示手段と、
を備えることを特徴とする画像処理装置。
【請求項12】
前記計算手段は、異なる時刻に撮影された前記2つの被写体以外の物体が含まれる撮影画像もしくはそれら2つの撮影画像の輪郭画像間での物体の移動量を求め、その移動量を基に前記時間を計算することを特徴とする請求項11記載の画像処理装置。
【請求項13】
前記計算手段は、オペレータ毎の移動量に関するデータを、オペレータが撮影指示を行う毎に移動量データ記憶手段に記憶させ、前記移動量データ記憶手段に移動量に関するデータを記憶した回数が一定回数に達したオペレータについては、該オペレータのそれまでの移動量に関するデータの平均値を計算し、その計算により得られた平均値を前記移動量情報記憶手段に記憶させ、以後、前記オペレータについて撮影手段が撮影する撮影画像内に被写体以外の物体が写らなくなるまでの時間を計算する際には前記移動量データ記憶手段に記憶されている前記オペレータの平均値を用いて計算すること、
を特徴とする請求項12記載の画像処理装置。
【請求項14】
前記計算手段は、異なる時刻に撮影された前記2つの被写体以外の物体が含まれる撮影画像それぞれについて被写体が正常に撮影された場合に得られる輪郭画像の面積と該撮影により得られた輪郭画像の周囲長を用いて算出される円形度を求め、前記2つの被写体以外の物体が含まれる撮影画像の輪郭画像間における前記円形度の変化量である円形度変化量を基に、前記画像撮影手段が撮影する撮影画像内に被写体以外の物体が写らなくなるまでの時間を計算することを特徴とする請求項11乃至13記載の画像処理装置。
【請求項15】
前記計算手段は、オペレータ毎の円形度変化量を、オペレータが撮影指示を行う毎に円形度変化量記憶手段に記憶させ、前記円形度変化量記憶手段に円形度変化量を記憶した回数が一定回数に達したオペレータについては、該オペレータのそれまでの円形度変化量の平均値を計算し、その計算により得られた平均円形度変化量を前記円形度変化量記憶手段に記憶させ、以後、前記オペレータについて撮影手段が撮影する撮影画像内に被写体以外の物体が写らなくなるまでの時間を計算する際には前記円形度変化量記憶手段に記憶されている前記オペレータの平均円形度変化量を用いて計算すること、
を特徴とする請求項14記載の画像処理装置。
【請求項16】
被写体の撮影画像から被写体部分の輪郭を抽出し、被写体部分を含む輪郭画像を作成する輪郭画像抽出ステップと、
該輪郭画像抽出ステップによって作成された輪郭画像を基に、該輪郭画像内に被写体以外の物体の画像が含まれているか否かを判定するために必要となる特徴量を算出する特徴量計算ステップと、
該特徴量計算ステップにより得られた特徴量を基に、前記輪郭画像内に被写体以外の物体の画像が含まれているか否かを判定する判定ステップと、
を備えることを特徴とする画像処理方法。
【請求項17】
オペレータによる撮影指示がなされる前に、画像撮影手段に対して被写体をプレスキャンするように指示するプレスキャン指示ステップと、
該プレスキャンにより取得された撮影画像から被写体部分の輪郭を抽出し、被写体部分を含む輪郭画像を作成する輪郭画像抽出ステップと、
該輪郭画像抽出ステップによって作成された輪郭画像内に被写体以外の物体の画像が含まれているか否かを判定するために必要となる特徴量を算出する特徴量計算ステップと、
該特徴量計算ステップにより得られた特徴量を基に、前記輪郭画像内に被写体以外の物体の画像が含まれているか否かを判定する判定ステップと、
該判定ステップにより前記輪郭画像内に被写体以外の物体の画像が含まれていると判定された場合には、前記プレスキャンにより得られた少なくとも2つの撮影画像を基に、前記画像撮影手段が撮影する撮影画像内に被写体以外の物体が写らなくなるまでの時間を計算する計算ステップと、
前記画像撮影手段によるプレスキャンにおける撮影が本来必要とされる解像度よりも低い解像度での撮影であった場合には、前記計算ステップにより算出された時間に応じた適切なタイミングで、前記画像撮影手段に対して前記被写体を本来必要とされる解像度で再度スキャンするように指示する再スキャン指示ステップと、
を備えることを特徴とする画像処理方法。
【請求項18】
前記計算ステップは、異なる時刻に撮影された前記2つの被写体以外の物体が含まれる撮影画像もしくはそれら2つの撮影画像の輪郭画像間での物体の移動量を求め、その移動量を基に前記時間を計算することを特徴とする請求項17記載の画像処理方法。
【請求項19】
前記計算ステップは、オペレータ毎の移動量に関するデータを、オペレータが撮影指示を行う毎に移動量データ記憶手段に記憶させ、前記移動量データ記憶手段に移動量に関するデータを記憶した回数が一定回数に達したオペレータについては、該オペレータのそれまでの移動量に関するデータの平均値を計算し、その計算により得られた平均値を前記移動量情報記憶手段に記憶させ、以後、前記オペレータについて撮影手段が撮影する撮影画像内に被写体以外の物体が写らなくなるまでの時間を計算する際には前記移動量データ記憶手段に記憶されている前記オペレータの平均値を用いて計算すること、
を特徴とする請求項18記載の画像処理方法。
【請求項20】
前記計算ステップは、異なる時刻に撮影された前記2つの被写体以外の物体が含まれる撮影画像それぞれについて被写体が正常に撮影された場合に得られる輪郭画像の面積と該撮影により得られた輪郭画像の周囲長を用いて算出される円形度を求め、前記2つの被写体以外の物体が含まれる撮影画像の輪郭画像間における前記円形度の変化量である円形度変化量を基に、前記画像撮影手段が撮影する撮影画像内に被写体以外の物体が写らなくなるまでの時間を計算することを特徴とする請求項17乃至19記載の画像処理方法。
【請求項21】
前記計算手ステップは、オペレータ毎の円形度変化量を、オペレータが撮影指示を行う毎に円形度変化量記憶手段に記憶させ、前記円形度変化量記憶手段に円形度変化量を記憶した回数が一定回数に達したオペレータについては、該オペレータのそれまでの円形度変化量の平均値を計算し、その計算により得られた平均円形度変化量を前記円形度変化量記憶手段に記憶させ、以後、前記オペレータについて撮影手段が撮影する撮影画像内に被写体以外の物体が写らなくなるまでの時間を計算する際には前記円形度変化量記憶手段に記憶されている前記オペレータの平均円形度変化量を用いて計算すること、
を特徴とする請求項20記載の画像処理方法。

【図2】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図17】
image rotate

【図18】
image rotate

【図23】
image rotate

【図24】
image rotate

【図1】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図15】
image rotate

【図16】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22】
image rotate


【公開番号】特開2012−243120(P2012−243120A)
【公開日】平成24年12月10日(2012.12.10)
【国際特許分類】
【出願番号】特願2011−113280(P2011−113280)
【出願日】平成23年5月20日(2011.5.20)
【出願人】(000237639)富士通フロンテック株式会社 (667)
【Fターム(参考)】