説明

文字読取装置

【課題】訂正画面上で、帳票から読み取った文字を違和感なく訂正できるようにする。
【解決手段】この文字読取装置は、文字記入欄に文字が記入された帳票より読み取ったテキストデータ62と、帳票の文字記入欄および外形を指定した入力帳票パラメータ31と、帳票フォーム34とを記憶するデータベース6と、データベース6の入力帳票パラメータ31と画面サイズの指定値とから帳票と同じ入力フィールド(文字訂正入力欄33)を構成する画面構成パラメータ32を生成すると共に文字訂正入力欄33に適合するフォントを選定し、テキストデータ62を文字訂正入力欄33に挿入し、データベース6の帳票フォーム34をその文字訂正入力欄33の背景とした訂正画面35を表示する訂正処理部8とを備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、例えば帳票よりイメージスキャナ等で読み取った帳票の文字を訂正画面で訂正する文字読取装置に関する。
【背景技術】
【0002】
従来、帳票ベースのOCR装置で訂正画面を作成する場合、各入力フィールドの配置や位置合わせ、フォントサイズなどの指定がうまく合わない等と大変苦労した。また、訂正画面の縮小/拡大などは各アイテムの再配置やフォントサイズの選択を変えなくてはならず、変更が容易ではなかった。
従来の文字読取装置としては、例えばスキャナによって読み取ったデータを検証する上で、帳票上のデータの配置と表示画面でのデータの配置とを類似させることで、帳票と読み取ったデータとの検証を容易にする技術がある。
(例えば特許文献1参照)。
【特許文献1】特開平9−259200号公報
【発明の開示】
【発明が解決しようとする課題】
【0003】
しかしながら、上記従来の文字読取装置の場合、入力帳票と同じ訂正画面を作成しようとしても、帳票とほぼ同じレイアウトの枠に、オペレーティングシステムで許容されているフォントサイズ、ピッチを当てはめるしかなく、帳票上のデータの配置と表示画面でのデータの配置が類似してはいるものの、まったく同じではなく、文字読取結果の検証だけでなく訂正、つまり文字訂正欄へ新たなテキストをキー入力する上では、やはり違和感があった。
【0004】
本発明はこのような課題を解決するためになされたもので、帳票から読み取った文字を違和感なく訂正することのできる文字読取装置を提供することを目的としている。
【課題を解決するための手段】
【0005】
上記した目的を達成するために、本発明の文字読取装置は、文字記入欄に文字が記入された帳票より読み取ったテキストデータを記憶するテキストデータ記憶手段と、前記帳票の文字記入欄に相当する入力フィールドの範囲および外形を指定した入力帳票パラメータを記憶するパラメータ記憶手段と、文字記入欄に文字が未記入の状態の帳票フォームのイメージデータを記憶した帳票フォーム記憶手段と、前記パラメータ記憶手段に記憶された入力帳票パラメータと画面サイズの指定値に基づいて、画面構成パラメータを生成する手段と、前記画面構成パラメータに基づいて帳票の文字記入欄と同じ位置に配置した文字訂正用の入力フィールド、あるいは前記帳票と同じ配置関係で拡大率が異なる入力フィールドを作成すると共に、前記入力フィールドに適合する大きさ、ピッチのフォントを選定し、テキストデータ記憶手段に記憶されたテキストデータを、前記入力フィールドに挿入する手段と、前記入力フィールドに対し、前記帳票フォーム記憶手段に記憶された帳票フォームのイメージデータを背景とした訂正画面を表示する手段とを具備したことを特徴とする。
【0006】
本発明では、訂正画面の配置、文字訂正や入力しようとする入力フィールドの文字数、範囲を指定した入力帳票パラメータを文字読取装置に記憶させておき、帳票から読み取った文字を訂正するための訂正画面を構成する際に、入力帳票パラメータと画面サイズの指定値を基に帳票と同じ配置で入力フィールドを表示すると共に、入力フィールドの背景に読取元の帳票のフォームイメージを表示するので、帳票とまったく同じ位置、同じ大きさの文字入力欄で、文字認識結果のテキストデータを訂正することができる。
すなわち、訂正画面を表示すると、帳票から読み取った文字が帳票のフォームとまったく同じ位置に表示され、しかもその背景には帳票のフォームのイメージが表示されるので、訂正作業者は、訂正画面上で帳票をそのまま見ている感覚で読取結果の文字を訂正することができる。
【発明の効果】
【0007】
以上説明したように本発明によれば、帳票から読み取った文字を違和感なく訂正することができる。
【発明を実施するための最良の形態】
【0008】
以下、本発明の実施の形態を図面を参照して詳細に説明する。図1は本発明に係る一つの実施形態の文字読取装置の構成を示すブロック図である。
【0009】
図1に示すように、この文字読取装置は、入力部1、メモリ2、パラメータ生成部3、文字読取部4、辞書5、データベース6、印字部7、訂正処理部8、表示部9を備えている。入力部1は、例えばイメージスキャナとそのインターフェース等のハードウェアと、入力された画像データを取り込むためのソフトウェア等からなる帳票イメージ読取手段と、帳票読取に関する操作および帳票や画面に関するパラメータの指示値を入力するキーボード、マウス等のユーザ操作を受け付ける手段とを含むものである。
メモリ2、パラメータ生成部3、文字読取部4、辞書5、データベース6、印字部7、訂正処理部8、制御部10等は、コンピュータのCPU、メモリ、ハードディスク装置等のハードウェア、オペレーティングシステム(以下OSと称す)および制御ソフトウェア等が協働して実現されるものである。
【0010】
入力部1では、例えば読取台にセットされた、文字記入欄に文字の記入された帳票の表面をイメージスキャナがイメージスキャン、つまり画像を読み取って帳票イメージを取得し、メモリ2に記憶する。
【0011】
メモリ2は、帳票イメージを記憶するだけでなく、パラメータ生成部3、文字読取部4および制御部10が帳票イメージより文字領域を切り出し、文字認識し、文字認識結果のテキストデータを訂正し出力する等の処理を行う作業エリアとして機能する。
【0012】
パラメータ生成部3は、帳票イメージと対応するパラメータ入力欄を画面に表示し、オペレータによるキー入力に従って帳票イメージに対する入力帳票パラメータ(図3参照)を生成し、帳票IDに対応付けてデータベース6へ登録する。
【0013】
辞書5には、文字認識結果として出力される文字コードとこの文字コードに対応する文字画像(文字イメージ)が対応して格納されている。また辞書5には、さまざまなサイズのフォントデータが記憶されている。
【0014】
文字読取部4は、制御部10に制御されて、メモリ2に記憶された帳票イメージに対して予め自身に設定された文字レイアウト情報(以下文字読取定義パラメータと称す)を基に、帳票イメージのどの位置にどのように文字データが配置されているかのレイアウト解析を行い、文字列が含まれる領域(以下文字領域と称す)を切り出す処理を行う。
【0015】
文字読取部4は、切り出した文字領域に対して辞書5を参照して文字認識処理を実行し、文字認識結果として文字コード、つまりテキストデータを得る。文字読取部4は、帳票より読み取ったテキストデータ30と読取元の帳票イメージ62とをデータベース6に保存する。
【0016】
印字部7は、イメージスキャナで読み取った帳票に対して帳票1枚1枚を識別(特定)するための帳票通し番号(以下Seq番号という)を印字する。Seq番号は、制御部10が新規帳票読取の際にメモリ2上でカウントし印字部7に与える。この他、帳票には、帳票の種類を識別するための帳票IDが予め印刷されている。帳票IDは、レイアウト解析の際に文字読取部4によって帳票の種類を特定するために利用される。
【0017】
データベース6には、図2に示すように、帳票をイメージスキャンして得た帳票イメージ30と、この帳票イメージ30から文字認識して得た文字認識結果のファイルであるテキストデータ62とが対応して保存される。
訂正処理部8は、訂正画面を表示し、その訂正画面の文字訂正入力欄に、入力部1よりキー入力された文字にて文字認識結果を訂正し、データベース6の内容を更新する。
【0018】
また、データベース6には、図3に示すように、パラメータ生成部3により生成された入力帳票パラメータ31が記憶されている。
入力帳票パラメータ31は、入力帳票、つまりイメージスキャナにより読み取られる帳票の帳票サイズとして、例えば単位(mm)、A5(幅210、高さ148)等と、帳票内の読取フィールド(横方向始点、横方向終点、縦方向始点、縦方向終点、桁数)を実際の寸法(サイズ)で指定するデータであり、図5に示す文字訂正入力欄33を作成するための元データである。
【0019】
さらに、データベース6には、図6に示すような帳票フォームのイメージデータ34(以下帳票フォーム34と称す)が記憶されている。帳票フォーム34は、文字が記入されていない状態の帳票をイメージスキャナで読み取った帳票イメージである。
【0020】
データベース6は、文字記入欄に文字が記入された帳票より読み取ったテキストデータを記憶するテキストデータ記憶手段である。データベース6は、パラメータ生成部3により生成された帳票の文字記入欄および外形等を指定した入力帳票パラメータ31を記憶するパラメータ記憶手段である。データベース6は、帳票のフォームのイメージを記憶した帳票フォーム記憶手段である。
【0021】
訂正処理部8は、データベース6に記憶された入力帳票パラメータ31と画面サイズの指定値に従って画面構成パラメータ32を生成し、生成した画面構成パラメータ32に基づいて帳票の文字記入欄と同じ位置に配置した文字訂正入力欄、あるいは帳票と同じ配置関係で拡大率が異なる文字訂正入力欄を作成し、各文字訂正入力欄に適する大きさ、ピッチのフォントを選定した上で、データベース6に記憶されたテキストデータを該当する文字訂正入力欄に挿入し、データベース6に記憶された帳票のフォームイメージを背景とした訂正画面を生成し表示部9へ出力する。表示部9は、訂正処理部8から出力された訂正画面等を表示するモニタ等である。画面構成パラメータ32は、読取元の帳票に対して拡大率がまったく同じか、倍率指定により拡大率の異なる画面を構成するためのパラメータである。
つまり、訂正処理部8および表示部9は、作成した文字訂正入力欄に対し、データベース6に記憶された帳票のフォームイメージを背景とした訂正画面を表示する手段として機能する。
【0022】
以下、図2乃至図7を参照してこの文字読取装置の動作を説明する。
この文字読取装置では、スキャナまたはファイルから読み込んだ帳票イメージに対して文字読取定義パラメータに基づいた構造解析を行い、文字を読み取り、読み取った結果を訂正処理により訂正画面で確認を促し、訂正結果を、例えばデータベース6へ登録したり、印字部9へ出力する。
この場合、オペレータは、読取対象の帳票を読取台にセットし、入力部1に帳票IDをキー入力し、読取スタートボタンを押す。すると、制御部10は、新規の帳票通番であるSeq番号をメモリ2に設定し、入力部1に対して帳票の読み取りを指示する。この指示に従い入力部1はCCDセンサ等を駆動して帳票の表面をイメージスキャンすることで、帳票の画像データである帳票イメージ30(図2参照)をメモリ2に取り込む。
【0023】
帳票イメージ30がメモリ2に取り込まれると、文字読取部4は、メモリ2に記憶された帳票イメージ30に対して、帳票IDに該当する文字レイアウト情報を用いて帳票上の文字のレイアウトを解析し、文字領域を切り出し、メモリ2に展開する。
【0024】
文字読取部4は、メモリ2に展開されている文字領域について辞書5の文字イメージとのイメージマッチングによる文字認識を行い、一致あるいは類似する文字イメージに対応する文字コード、つまりテキストデータを辞書5より読み出して文字認識結果とする。
【0025】
1枚の帳票について、すべての文字領域の文字読取処理が終了すると、制御部10は、メモリ2に記憶されている文字認識結果のテキストデータ62と帳票イメージ30とをデータベース6へ保存する。
【0026】
次に、読み取ったテキストデータの訂正処理について説明する。
データベース6に保存したテキストデータを訂正する場合、この文字読取装置では、訂正作業者であるオペレータは、入力部1から訂正処理部8を起動する操作を行う。なお、上記文字読取処理の結果のテキストデータ62の中に、例えば「?」等の付与されたリジェクト文字があることが検出された場合に、訂正処理部8を起動するようにしてもよい。
起動した訂正処理部8は、データベース6に記憶されている入力帳票パラメータ31と画面サイズの指定値とを読み出して、これらのデータから画面構成パラメータ32を計算し、計算結果をメモリ2に展開すると共にデータベース6へ記憶する。
【0027】
この場合、訂正処理部8は、図3に示した入力帳票パラメータ31と訂正画面の画面サイズ(単位:dot)の指定値から、図4に示すような画面構成パラメータ32を計算し、データベース6へ記憶する。画面構成パラメータ32は、実際の画面上に配置される入力フィールド(文字訂正入力欄33)を示す値である。画面サイズの指定値は、予めメモリ2に設定しておいてもよく、訂正画面作成時にユーザに対して入力を促す画面を表示して、入力させるようにしてもよい。
【0028】
画面サイズが、例えば幅840、高さ592(dot)の場合、訂正処理部8は、入力帳票の寸法(mm)と画面サイズ(dot)との対比、つまり210:148=840:592を決定し、比例計算により画面構成パラメータ32を計算する。
そして、訂正処理部8は、計算して得た画面構成パラメータ32と帳票フォーム36を用いて訂正画面を作成し表示する。
【0029】
この際、訂正処理部8は、画面構成パラメータ32で指定される入力フィールドの大きさと文字数から1文字のサイズ(大きさ)及び文字ピッチ(間隔)を計算し、その入力フィールドにマッチした(適合する)フォントサイズを選定する。
【0030】
例えば図4の画面構成パラメータ32の「1.郵便番号1」の場合、訂正処理部8は、幅196−136=60、高さ138−114=24、1文字の幅60/3文字=20を計算で求め、幅:20、高さ:24に適合するフォントを辞書5あるいはOSによって指定されたフォント記憶部より選択し、文字読取結果のテキストデータを選択したフォントとして各入力フィールドに挿入する。これを他の「2.…」以降の項目についても繰り返し、図5に示すような文字訂正入力欄33を作成する。
【0031】
そして、訂正処理部8は、データベース6より該当帳票フォーム36を読み出して文字訂正入力欄33に対する背景とし、訂正画面を表示部9へ出力する。
これにより、表示部9に、文字読取結果を訂正するための訂正画面35(図7参照)が表示される。
【0032】
訂正画面35には、帳票の文字記入欄そのままの位置に入力フィールドとしての文字訂正入力欄33が表示されるので、訂正作業者は、訂正画面35に表示された文字訂正入力欄33にキー入力を行うことで、文字読取結果を訂正できる。
【0033】
このようにこの実施形態の文字読取装置によれば、入力帳票(帳票フォーマットの種類あるいは帳票ID)を指定するだけで、その入力帳票と同じ配置、フォントサイズ、ピッチで訂正画面が構成され、しかも訂正画面の背景には、その入力帳票のフォームイメージが配置されるので、訂正作業者は、帳票を使うのとまったく同じ感覚、つまり帳票の各文字訂正入力欄33に読取結果のテキストデータが挿入された違和感のない訂正画面で、文字認識結果のテキストデータを訂正できる。
【0034】
また、この例にあげた使い方の場合、入力帳票フォーマットは既にOCR読み取りの段階で指定されているので、訂正画面の位置パラメータの設定すら不要になる。
訂正画面を設計する場合、入力帳票フォームにこだわらず、フィールドの配置、入力フィールドの文字数/サイズを指定するだけで、訂正画面を簡単に作成できる。
【0035】
本発明は上記実施形態のみに限定されるものではない。
上記実施形態では、訂正画面の背景として表示される帳票フォーム34と同じ大きさ、位置になるように文字訂正入力欄33を構成したがフォント自体は自動選定となる。
そこで、訂正画面に表示される文字訂正入力欄33に表示される帳票フォーム34に対してフォントサイズ等をより近づけたい場合、個別に縮小/拡大の倍率指定を行うことで、図8に示すように、例えば「東芝太郎」の入力欄を大きくする等、所望の大きさに拡大あるいは縮小された文字訂正入力欄36を作成できるので、訂正を行い易い画面となる。つまり、画面内の個々の入力フィールドの倍率を指定することで、その倍率に合せた文字訂正入力欄33を設けた訂正画面を表示して訂正作業を行うことができる。倍率の指定は、整数倍とは限らず、小数点を含む倍率での指定が可能である。
【図面の簡単な説明】
【0036】
【図1】本発明の一つの実施形態の文字読取装置の構成を示すブロック図。
【図2】図1の文字読取装置で読み取られた帳票イメージの一例を示す図。
【図3】図1の文字読取装置に記憶されている入力帳票パラメータを示す図。
【図4】図1の文字読取装置に記憶されている画面構成パラメータを示す図。
【図5】帳票イメージから読み取った文字を入れた文字訂正入力欄を示す図。
【図6】帳票フォームの一例を示す図。
【図7】訂正画面の一例を示す図。
【図8】文字訂正入力欄の他の例を示す図。
【符号の説明】
【0037】
1…入力部、2…メモリ、3…パラメータ生成部、4…文字読取部、5…辞書、6…データベース、7…印字部、8…訂正処理部、9…表示部、10…制御部、30…帳票イメージ、31…入力帳票パラメータ、32…画面構成パラメータ、33,36…文字訂正入力欄、34…帳票フォーム、35…訂正画面、62…テキストデータ。

【特許請求の範囲】
【請求項1】
文字記入欄に文字が記入された帳票より読み取ったテキストデータを記憶するテキストデータ記憶手段と、
前記帳票の文字記入欄に相当する入力フィールドの範囲および外形を指定した入力帳票パラメータを記憶するパラメータ記憶手段と、
文字記入欄に文字が未記入の状態の帳票フォームのイメージデータを記憶した帳票フォーム記憶手段と、
前記パラメータ記憶手段に記憶された入力帳票パラメータと画面サイズの指定値に基づいて、画面構成パラメータを生成する手段と、
前記画面構成パラメータに基づいて帳票の文字記入欄と同じ位置に配置した文字訂正用の入力フィールド、あるいは前記帳票と同じ配置関係で拡大率が異なる入力フィールドを作成すると共に、前記入力フィールドに適合する大きさ、ピッチのフォントを選定し、テキストデータ記憶手段に記憶されたテキストデータを、前記入力フィールドに挿入する手段と、
前記入力フィールドに対し、前記帳票フォーム記憶手段に記憶された帳票フォームのイメージデータを背景とした訂正画面を表示する手段と
を具備したことを特徴とする文字読取装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate


【公開番号】特開2006−106904(P2006−106904A)
【公開日】平成18年4月20日(2006.4.20)
【国際特許分類】
【出願番号】特願2004−289371(P2004−289371)
【出願日】平成16年9月30日(2004.9.30)
【出願人】(000003078)株式会社東芝 (54,554)
【出願人】(301063496)東芝ソリューション株式会社 (1,478)
【Fターム(参考)】