説明

文字読取装置

【課題】帳票から読み取った文字を訂正画面で確実に判断できるようにする。
【解決手段】文字読取装置1は、文字記入欄に文字が未記入の状態の帳票フォーム34と辞書15を記憶したデータベース16と、デジタルペン2から入力された筆跡情報を基に文字イメージを生成すると共に、文字イメージの帳票4上の座標と帳票フォーム34の座標とを対応させて、帳票4の文字記入欄43からの文字のはみ出しとそのはみ出し方向を検出すると共に、文字のはみ出し方向へ切り出し範囲を広げた帳票フォーム34のフィールドイメージと、生成した文字イメージとを重畳して表示イメージを生成する文字イメージ処理部13と、その表示イメージと文字認識部14による認識結果とを並べた訂正画面を表示する訂正処理部18とを備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、例えばデジタルペン等のデジタイザを利用して帳票の文字記入欄に文字を筆記した際に、読み取った文字を訂正画面に表示して訂正する文字読取装置に関する。
【背景技術】
【0002】
従来のOCR読取装置では、訂正画面における文字読取結果の訂正作業を容易化するため、図7に示すように、例えばフラットベットタイプのイメージスキャナ等で読み取った帳票全体のイメージ71より読取対象となるフィールド毎にフィールドイメージ72,73を切り出し、図8に示すように、訂正画面80において、切り出したそれぞれのフィールドイメージ72,73と、読取結果のテキストデータ74,75とをそれぞれ対にして表示する方法がある。
この方法の場合、読取対象のフィールドから、はみ出した文字の記入部分は、切り出したフィールドイメージの中には表示されないため、訂正作業者は、帳票の文字記入欄に実際に筆記された文字がどのような文字であるかを判定できず、帳票全体のイメージ71をデータベースから呼び出すか、あるいは読取元の帳票自体から該当不明部分を見つけ出し、文字を判断することを行うため、訂正処理の作業効率が低下していた。読取元の帳票が、例えば業務用途のものの場合、バッチ処理のため多数枚が1つのファイルにまとめてファイリングされていることが多く、その中から該当する一枚の帳票を見つけ出すのが容易ではない。
一方、近年では、イメージスキャナ等を用いず、帳票に文字を記入する際に、手持ち型の装置にて帳票に印字されている特殊な符号化パターンのマークを光学的に読み取り、帳票上の位置座標を決定する技術が提案されている(例えば特許文献1参照)。
【特許文献1】特表2003−511761号公報
【発明の開示】
【発明が解決しようとする課題】
【0003】
上記先行技術は、あくまでも帳票にポイントされた位置を決定する技術であって、文字の読取や訂正に適用する具体的な技術は開示されていない。
【0004】
本発明はこのような課題を解決するためになされたもので、帳票から読み取った文字を訂正画面で確実に判断でき、文字読取結果の訂正作業の効率を向上することのできる文字読取装置を提供することを目的としている。
【課題を解決するための手段】
【0005】
上記した目的を達成するために、本発明の文字読取装置は、文字記入欄に文字が未記入の状態の帳票フォームのイメージデータを記憶した帳票フォーム記憶手段と、文字のイメージデータとテキストデータとを対応させて蓄積した辞書と、前記帳票の文字記入欄に筆記された文字の筆跡情報を取得する手段と、前記文字の筆跡情報を基に文字のイメージデータを生成する文字イメージ生成手段と、前記文字イメージ生成手段により生成された文字のイメージデータを文字認識してテキストデータを出力する文字認識手段と、前記文字イメージ生成手段により生成された文字のイメージデータの帳票上の座標と前記帳票フォーム記憶手段に記憶されている帳票フォームのイメージデータの座標とを対応させて、前記帳票の文字記入欄からの文字イメージのはみ出しとそのはみ出し方向を検出するはみ出し検出手段と、前記文字イメージ生成手段により生成された文字のイメージデータが含まれる前記帳票のフォームデータの第1文字記入欄のイメージと、前記はみ出し検出手段により検出されたはみ出し方向に位置する、前記帳票のフォームデータの第2文字記入欄のイメージとを結合したイメージと、前記文字イメージ生成手段により生成された文字のイメージデータとを重畳して表示イメージを生成する表示イメージ生成手段と、前記表示イメージ生成手段により生成された表示イメージと文字認識結果のテキストデータとを対応させた文字認識結果訂正用の訂正画面を表示する手段とを具備したことを特徴とする。
【0006】
本発明では、帳票の文字記入欄に筆記された文字の筆跡情報を取得すると、筆跡情報から文字イメージを生成し、帳票の文字記入欄からの文字イメージのはみ出しとそのはみ出し方向を検出し、文字のイメージデータが含まれる帳票の第1文字記入欄のイメージと、はみ出し方向に位置する帳票の第2文字記入欄のイメージとを結合したイメージと、文字のイメージデータとを重畳して表示イメージを生成し、生成した表示イメージと文字認識結果のテキストデータとを対応させた文字認識結果訂正用の訂正画面を表示する。
つまり、文字記入欄からはみ出して文字が記入された場合でもその文字イメージ全体が訂正画面に表示されるので、訂正作業者は、訂正画面上において、帳票から読み取った文字読取結果のテキストデータと、帳票の文字記入欄に筆記された文字のイメージデータとを対比させて元の文字を確実に確認し訂正することができる。
【発明の効果】
【0007】
以上説明したように本発明によれば、帳票から読み取った文字を訂正画面で確実に判断でき、文字読取結果の訂正作業の効率を向上することができる。
【発明を実施するための最良の形態】
【0008】
以下、本発明の実施の形態を図面を参照して詳細に説明する。図1は本発明に係る一つの実施形態の文字読取システムの構成を示すブロック図である。
【0009】
図1に示すように、この文字読取システムは、帳票4への筆記と筆跡情報の取得とを同時に行う機能を備えるデジタルペン2と、このデジタルペン2にUSBケーブル3を介して接続されたコンピュータの1つである文字読取装置1とを備えている。
帳票4の表面全体には、特殊な配置形態の複数のドット(黒点)からなるドットパターンが薄い黒色で印刷されている。ドットパターンのドットは、約0.3mmの間隔で、格子状に配置されている。それぞれのドットは、格子状の交点より上下左右にわずかにずれた位置に配置されている(図3参照)。
【0010】
また、帳票4には、スタートマーク41、エンドマーク42および文字記入欄43が薄い青色で印刷されている。デジタルペン2では、帳票4の表面に印刷されたドットパターンのみが処理対象とされ、薄い青色の部分は、デジタルペン2での処理対象から除外される。
【0011】
文字読取装置1は、制御部10、通信I/F11、記憶部12、文字イメージ処理部13、文字認識部14、辞書15、データベース16、訂正処理部18、表示部19を備えている。記憶部12、文字イメージ処理部13、文字認識部14、訂正処理部18、制御部10等は、CPU、メモリ、ハードディスク装置等のハードウェア、ハードディスク装置にインストールされたオペレーティングシステム(以下OSと称す)および制御ソフトウェア等が協働して実現されるものである。辞書15は、ハードディスク装置等に格納されている。データベース16は、ハードディスク装置に構築されている。
【0012】
通信I/F11は、デジタルペン2から送信された情報をUSBケーブル3を通じて受信する。通信I/F11は、帳票4の文字記入欄43に筆記された文字の筆跡情報をデジタルペン2より取得する手段として機能する。
記憶部12は、デジタルペン2から受信された筆跡情報を記憶する。筆跡情報とは、デジタルペン2のペン先の軌跡、書き順、スピード等のストローク情報、筆圧、筆記時刻等を含む情報である。また、記憶部12は、これだけでなく、文字イメージ処理部13、文字認識部14および制御部10が筆跡情報より生成した文字イメージの記憶、文字認識部14による文字認識処理、文字イメージ処理部13による帳票フォームからのイメージの切り出し処理、訂正処理部18による切り出されたフィールドのイメージと、読み取った文字イメージとを重畳し、文字認識結果のテキストデータと並べた訂正画面を表示する処理等を行う作業エリアとして機能する。
【0013】
文字イメージ処理部13は、制御部10に制御されて、記憶部12に記憶された筆跡情報に含まれるストローク情報(ペン先の軌跡(位置データ)、書き順、スピード等)とデータベース16の帳票イメージの座標情報とから、文字の単位で文字イメージを生成し、記憶部12へ記憶する。デジタルペン2が帳票4の表面を筆圧検知期間内になぞった位置データ(X座標、Y座標)の集合を軌跡といい、位置データ(X座標、Y座標)のうち、同じ筆圧検知期間内に区分されるものを書き順という。位置データ(X座標、Y座標)には、筆記時刻が対応付けられており、帳票4がペン先でなぞられた位置(座標)が変わる順序と時刻の移り変わりがが分るので、これらの情報からスピードが得られる。
【0014】
文字イメージ処理部13は、筆跡情報(位置データ(X座標、Y座標)と時刻)を基に座標上でドットデータを文字の単位で滑らかにつなげて文字のイメージデータを生成する文字イメージ生成手段として機能する。
文字イメージ処理部13は、生成した文字のイメージデータの帳票上の座標とデータベース16に記憶されている帳票フォーム34のイメージデータの座標とを対応させて、帳票4の文字記入欄43に相当する読取フィールドからの文字イメージのはみ出しとそのはみ出し方向を検出するはみ出し検出手段として機能する。
【0015】
文字イメージ処理部13は、検出したはみ出し方向へ切り出し範囲を広げた帳票フォーム34の文字記入欄に相当する読取フィールドのイメージと、生成した文字のイメージデータとを重畳して表示イメージ(図5参照)を生成する表示イメージ生成手段として機能する。
文字イメージ処理部13は、生成した文字のイメージデータが含まれる帳票フォーム34の第1文字記入欄に相当する読取フィールドのイメージと、検出したはみ出し方向に位置する、帳票フォーム34の第2文字記入欄に相当する隣接フィールドのイメージとをはみ出し方向に結合(連結)したイメージと、生成した文字のイメージデータとを重畳して表示イメージ(図6参照)を生成する表示イメージ生成手段として機能する。
【0016】
辞書15には、多数の文字画像(以下文字イメージと称す)と各文字イメージに対応付けられた文字コード(テキストデータ)とが保存されている。
【0017】
文字認識部14は、文字イメージ処理部13が生成し記憶部12に記憶した文字イメージに対して辞書15を参照して文字認識処理を実行し、文字認識結果として文字コード、つまりテキストデータを得る。
【0018】
文字認識部14は、文字認識の際に文字認識が不可能であったものについては「?」等のテキストデータ(文字コード)を付与し文字認識結果とする。文字認識部14は、帳票より読み取ったテキストデータ32と読取元の帳票文字イメージ31とをデータベース16に保存する。
つまり、文字認識部14は、文字イメージ処理部13により生成された文字のイメージデータと辞書15の文字イメージとをマッチングさせてテキストデータを出力する。
【0019】
データベース16には、帳票より読み取った帳票文字イメージ31と、この帳票文字イメージ31から文字認識して得た文字認識結果のファイルであるテキストデータ32とが対応して保存される。
【0020】
データベース16には、帳票フォームのイメージデータ34(以下帳票フォーム34と称す)が記憶されている。帳票フォーム34は、文字が未記入の状態の帳票をイメージスキャナ等で予め読み取っておいた帳票イメージであり、座標を指定(範囲を指定)することで部分的に切り出すことができる。例えば文字記入欄等が切り出される。データベース16は、ユーザにより文字が記入されていない帳票フォーム34を記憶した帳票フォーム記憶手段である。
【0021】
データベース16は、文字記入欄に文字が記入された帳票よりの筆跡情報を基に生成した文字イメージを文字認識して得たテキストデータを記憶するテキストデータ記憶手段である。
データベース16には、帳票管理テーブル33が記憶されている。帳票管理テーブル33は、帳票IDと帳票フォーム34を対応付けたテーブルであり、デジタルペン2より受信された帳票IDに対して、記憶されている中のどの帳票フォーム34を使うかを決定するためのテーブルである。
【0022】
訂正処理部18は、文字イメージ処理部13により生成された表示イメージと、文字認識部14により出力された文字認識結果のテキストデータとを対応させた文字認識結果訂正用の訂正画面を表示する手段として機能する。
訂正処理部18は、表示した訂正画面の文字訂正入力欄に表示された文字認識結果のテキストデータに対する訂正入力を受け付けてデータベース16のテキストデータ32を更新する。表示部19は、訂正処理部18から出力された訂正画面等を表示するモニタ等である。
【0023】
デジタルペン2は、図2に示すように、ペン型の外形をなすケース部20と、このケース部20に備えられたカメラ21、セントラルプロセッシングユニット22(以下CPU22と称す)、メモリ23、通信部24、ペン部25、インクタンク26、筆圧センサ27等から構成されている。デジタルペン2は、デジタイザの1つである。
【0024】
カメラ21は、発光ダイオード等の照明部と、CCDイメージセンサと、レンズ等の光学系とを備えたものである。赤外線発光部は、紙に対する照明として機能する。カメラ21は6×6ドット分の視野があり、筆圧検知により毎秒50以上のスナップショットを撮影する。
【0025】
ペン部25は、先端部よりインクタンク26からのインクが滲み出し、ユーザがその先端部を当接させた際に、帳票4の紙面にインクを付着させ、これにより文字を筆記および図形を描画できる。ペン部25は、先端部への圧力の印加に応じて伸縮する感圧タイプのものである。ペン部25の先端部を帳票4に押し付けると(ポイントすると)、筆圧センサ27により筆圧が検知され、CPU22は、カメラ21で撮影された紙面のドットパターンの読み取りを開始する。つまりペン部25は、ボールペンの機能と筆圧検知機能とを備えている。
【0026】
CPU22は、帳票4からのドットパターンの読み取りを、あるサンプリングレートで行うことで、読取動作に伴う膨大な情報(ペン部21の軌跡、書き順スピード等のストローク情報、筆圧、筆記時刻等を含む筆跡情報)を瞬時に認識する。
CPU22は、スタートマーク41の位置がポイントされたときに読み取りの開始を判定し、エンドマーク42の位置がポイントされたときに読み取りの終了を判定する。CPU22は、読み取りの開始から終了までの期間、筆圧検知によりカメラ21から取得された情報の画像処理を行い位置情報を生成し時刻と共にメモリ23へ筆跡情報として記憶する。
【0027】
メモリ23には、帳票4に印刷されているドットパターンに対応する座標情報が記憶されている。またメモリ23には、スタートマーク41の位置の座標を読み取った際に帳票4を識別するための情報として帳票ID、このペン自体を特定するための情報としてペンIDが記憶されている。
メモリ23は、エンドマーク42の位置がポイントされたときにCPU22が処理した筆跡情報を文字読取装置1へ送信するまで保存する。
通信部24は、文字読取装置1と接続されたUSBケーブル3を介して、メモリ23の情報を文字読取装置1へ送信する。USBケーブル3を使った有線通信の他、筆圧センサ24の情報の転送方法としては、例えば無線通信(IrDA通信、Bluetooth通信等)がある。Bluetoothは登録商標である。このデジタルペン2への電源供給は文字読取装置1からUSBケーブル3を通じて行われる。
【0028】
なお、デジタイザとしては、上記デジタルペン2と帳票4の組み合わせの他、ペン先方向へ超音波を発信する発信部と紙あるいはタブレットに反射した超音波を受信する受信部とを備え、ペン先の動いた軌跡を取得するようなデジタルペンでも良く、本発明は上記実施形態のデジタルペン2のみに限定されるものではない。
【0029】
図3はデジタルペン2のカメラ21で撮像される帳票4の範囲を示す図である。
デジタルペン2に内蔵されたカメラ21が1回に読み取ることができる帳票4上の範囲は、ドットの間隔が約0.3mmの場合、格子状に配置された6×6ドットの範囲、つまり36ドットである。36ドットの上下左右のずれの組み合わせを全て網羅すると、例えば6,000万平方キロメートル程度の巨大な座標平面からなる紙を作り出すことができる。このような巨大な座標平面のどの6×6ドット(正方形)をとってもそのドットパターンは異なる。従って、予め個々のドットパターンに対応する位置データ(座標情報)をメモリ23に格納しておくことで、帳票4上(ドットパターン上)のデジタルペン2の軌跡は、すべて異なる位置情報として認識できる。
【0030】
以下、図4乃至図6を参照してこの文字読取システムの動作を説明する。
この文字読取システムでは、訂正作業者が、デジタルペン2を帳票4のスタートマーク41の位置でポイントすると、筆圧センサ27により筆圧が検知され、CPU22は、ポイントされたことを検知する(図4のステップS101)。
これと同時に、カメラ21によりその位置のドットパターンが読み取られる。CPU22は、カメラ21により読み取られたドットパターンを基にメモリ23に記憶されている中の該当帳票IDを特定する。
【0031】
その後、帳票4の文字記入欄43へ文字が筆記(記入)されると、CPU22は、カメラ21により撮像された画像を処理し、画像処理により得られた筆跡情報を順次メモリ23へ記憶する(ステップS102)。画像処理では、カメラ21により撮像された所定エリアの画像のドットパターンを解析し位置情報に変換する等の処理が行われる。
【0032】
CPU22は、エンドマーク42がポイントされたことを検知するまで上記画像処理を繰り返す(ステップS103)。
【0033】
CPU22は、エンドマーク42がポイントされたことを検知すると(ステップS103のYes)、メモリ23に記憶されていた筆跡情報、ペンID、帳票IDをUSBケーブル3を通じて文字読取装置1へ送信する(ステップS104)。
【0034】
文字読取装置1では、デジタルペン2より送信された筆跡情報、ペンID、帳票ID等の情報を通信I/F11が受信し(ステップS105)、記憶部12に記憶する。
【0035】
制御部10は、記憶部12の帳票IDを基にデータベース16を参照し、読取処理された帳票フォーム34を特定する(ステップS106)。
【0036】
次に、文字イメージ処理部13は、記憶部12に記憶された筆跡情報のストローク情報を用いて文字単位のイメージ、つまり文字イメージを生成し(ステップS107)、座標データ(位置情報)と共に記憶部12に記憶する。
【0037】
文字イメージが記憶部12に記憶されると、文字認識部14は、記憶部12の文字イメージと辞書15の文字イメージとのイメージマッチングによる文字認識を行い(ステップS108)、一致あるいは類似する文字イメージに対応する文字コード、つまりテキストデータを辞書15より読み出して文字認識結果とする。なお、一致あるいは類似する文字イメージがヒットしなかった場合は、その文字イメージの文字認識結果として「?」を付与する。
【0038】
文字認識後、文字イメージ処理部13は、記憶部12に記憶された文字イメージの座標とデータベース16の帳票フォーム34の座標を基に、読取フィールドからその周囲の隣接フィールドへの文字のはみ出しの有無と、はみ出し有りの場合は、はみ出し方向(座標上のX軸方向へのはみ出し、Y軸方向へのはみ出し、X,Y方向へのはみ出し等)を検出する(ステップS109)。
【0039】
はみ出しを検出した後、文字イメージ処理部13は、表示イメージを生成するためのイメージデータの加工処理(表示イメージ加工処理)を行う(ステップS110)。
この表示イメージ加工処理は、従来のスキャン画像(帳票イメージ)からの領域切り出しの処理とは異なる処理となる。
つまり、文字読取装置1側では、デジタルペン2からは、画像データではなく筆跡情報(座標情報および時刻情報等)、ペンIDおよび帳票IDしか得られないため、文字イメージ処理部13が、筆跡情報に含まれる座標情報および時刻情報から文字だけのイメージデータを生成しており、実際の帳票4の文字記入欄43の画像はデジタルペン2からは得られない。
【0040】
そこで、この文字読取装置1では、データベース16に、予め帳票フォーム34を記憶しておき、文字イメージ処理部13は、データベース16の帳票フォーム34から切り出した文字記入欄43に相当するフィールドイメージと、生成した文字イメージとを合成、つまりフィールドイメージの上に文字イメージを重畳して、文字記入欄43に文字が記入された状態の表示イメージを生成する。
【0041】
この際、文字イメージ処理部13は、はみ出しを検出した結果、文字イメージのはみ出しがあった場合、帳票フォーム34からフィールドイメージを切り出す範囲を、文字イメージがはみ出した分だけ、はみ出し方向へ拡張した上で、帳票フォーム34から読取フィールドのイメージを切り出す。
そして、文字イメージ処理部13は、切り出した読取フィールドのイメージと、生成した文字イメージとを重畳して表示イメージを生成する。
【0042】
文字イメージ処理部13によって表示イメージが生成されると、訂正処理部18は、図5に示すように、文字イメージ処理部13により生成された表示イメージ51,52と、文字認識部14より認識された認識結果53,54とをそれぞれに対応させて並べた訂正画面50(第1の訂正画面表示例)を表示部19に表示する(ステップS111)。
【0043】
この第1の訂正画面表示例では、表示イメージ51と認識結果53とが対応しており、表示イメージ51の最後の文字の「5」が文字記入欄43の下側へはみ出していた関係で、認識結果53の最後の文字に、文字認識不能の記号である「?」が付与されている。
【0044】
このため、この文字読取装置1では、従来に比べて、切り出し範囲が下方に拡張されており、表示イメージ51の文字の、文字記入欄43からはみ出した下側部分についても繋がった状態で表示されており、訂正作業者は、領域拡張された表示イメージ51から、「?」が付与された読取元の文字が「5」という数字であることを判別できる。
なお、表示イメージ52については、他のフィールドへの文字イメージのはみ出しがないため、従来と同様の表示形態とされる。
【0045】
訂正作業者は、表示部19に表示された訂正画面50にて、「?」が付与された訂正箇所について、「5」という数字をキー入力(訂正入力)し(ステップS112)、確定操作を行うと(S113のYes)、訂正処理部18は、表示イメージ51、52と認識結果53,54とをデータベース16に保存する(ステップS114)。
表示イメージ51、52は、データベース16上では、帳票文字イメージ31として保存される。認識結果53,54は、データベース16上では、テキストデータ32として保存される。
【0046】
上記の例では、文字のはみ出しを検出した結果、帳票フォーム34からのフィールドイメージの切り出し範囲をはみ出し方向へ拡張して切り出して、文字イメージと重畳して表示イメージを生成する例について説明したが、これだけではない。
例えば文字イメージ処理部13は、帳票フォーム34から切り出す読取フィールド(第1文字記入欄)とはみ出し方向に隣接するフィールド(第2文字記入欄)とを結合した2行分あるいは2列分の文字記入欄43に相当するフィールドのイメージを帳票フォーム34から切り出して、文字イメージと重畳して表示イメージを生成する。
【0047】
この場合、訂正処理部18は、図6に示すように、文字イメージ処理部13により生成された表示イメージ61と、文字認識部14より認識された認識結果62とをそれぞれに対応させて並べた訂正画面60(第2の訂正画面例)を表示部19に表示する。
この第2の訂正画面表示例では、図5の場合と同様に、訂正作業者は、表示イメージ61から、「?」が付与された読取元の文字が「5」という数字であることを判別できる。図5の例の場合と比較すると、文字列周辺までを確認できるものの、一度に比較する対象となる文字数が多くなる。
【0048】
このようにこの実施形態の文字読取システムによれば、デジタルペン2等のペン型装置と帳票4のドットパターンとを組み合わせたデジタイザから得られる筆跡情報に含まれるストローク情報を利用し、帳票4の文字記入欄43に筆記された文字が読取フィールドから隣接するフィールドへのはみ出しを検出する。
そして、隣接するフィールドへの文字のはみ出しが検出された場合、第1の訂正画面表示例では、帳票フォーム34の該当読取フィールドのイメージをはみ出し方向に拡張して切り出したイメージと、生成した文字イメージとを重畳させた表示イメージ51を生成し、この表示イメージ51と文字認識結果のテキストデータ53とを並べて訂正画面50に表示することで、訂正画面50において、文字読取元の帳票に筆記された文字がどういう文字であるかを確実に判断できるようなり、読取結果の文字の訂正作業を効率よく行うことができる。
また、第2の訂正画面表示例では、隣接するフィールドへの文字のはみ出しが検出された場合には、帳票フォーム34の該当読取フィールドのイメージとはみ出し方向に隣接するフィールドのイメージとを並べたあるいは結合したイメージと、生成した文字イメージとを重畳させた表示イメージ61を生成し、この表示イメージ61と文字認識結果のテキストデータ62とを並べて訂正画面60に表示することで、訂正画面60において、文字読取元の帳票4に筆記された文字がどういう文字であるかを確実に判断できるようなり、読取結果の文字の訂正作業を効率よく行うことができる。
【0049】
本発明は上記実施形態のみに限定されるものではない。
上記実施形態では、訂正画面の表示例として、帳票フォーム34の読取フィールドをはみ出し方向に拡張して切り出したフィールドに、生成した文字イメージを重畳させて表示した例(図5)と、帳票フォーム34の読取フィールドと隣接フィールドとをはみ出し方向に結合したイメージに、生成した文字イメージを重畳させて表示した例(図6)とを示したが、これ以外に、例えば、生成した文字イメージに帳票フォーム34のフィールドを重ねずに、生成した文字イメージと、読取結果のテキストデータとを対応させて表示するだけでも良い。つまり文字記入欄(枠)を表示イメージに含めずに、文字イメージとテキストデータだけを表示しても良い。
【図面の簡単な説明】
【0050】
【図1】本発明の一つの実施形態の文字読取システムの構成を示すブロック図。
【図2】図1の文字読取システムのデジタルペンの構成を示す図。
【図3】図2のデジタルペンのカメラの撮像エリアで撮像される帳票のドットパターンの一例を示す図。
【図4】この文字読取システムの動作を示すフローチャート。
【図5】この文字読取システムの第1の訂正画面例を示す図。
【図6】この文字読取システムの第2の訂正画面例を示す図。
【図7】スキャナ等で読み取った帳票イメージからフィールドイメージ(部分画像)を切り出す動作を説明するための図。
【図8】従来の訂正画面の表示例を示す図。
【符号の説明】
【0051】
1…文字読取装置、2…デジタルペン、3…USBケーブル、4…帳票、10…制御部、11…通信I/F、12…メモリ、13…文字イメージ処理部、14…文字認識部、15…辞書、16…データベース、18…訂正処理部、19…表示部、20…ケース部、21…カメラ、22…CPU、23…記憶部124…通信部、25…ペン部、26…インクタンク、27…筆圧センサ、41…スタートマーク、42…エンドマーク、43…文字記入欄、50,60…訂正画面、51,52,61…表示イメージ、53,54,62…読取結果。

【特許請求の範囲】
【請求項1】
文字記入欄に文字が未記入の状態の帳票フォームのイメージデータを記憶した帳票フォーム記憶手段と、
文字のイメージデータとテキストデータとを対応させて蓄積した辞書と、
前記帳票の文字記入欄に筆記された文字の筆跡情報を取得する手段と、
前記文字の筆跡情報を基に文字のイメージデータを生成する文字イメージ生成手段と、
前記文字イメージ生成手段により生成された文字のイメージデータを文字認識してテキストデータを出力する文字認識手段と、
前記文字イメージ生成手段により生成された文字のイメージデータの帳票上の座標と前記帳票フォーム記憶手段に記憶されている帳票フォームのイメージデータの座標とを対応させて、前記帳票の文字記入欄からの文字イメージのはみ出しとそのはみ出し方向を検出するはみ出し検出手段と、
前記文字イメージ生成手段により生成された文字のイメージデータが含まれる前記帳票のフォームデータの第1文字記入欄のイメージと、前記はみ出し検出手段により検出されたはみ出し方向に位置する、前記帳票のフォームデータの第2文字記入欄のイメージとを結合したイメージと、前記文字イメージ生成手段により生成された文字のイメージデータとを重畳して表示イメージを生成する表示イメージ生成手段と、
前記表示イメージ生成手段により生成された表示イメージと文字認識結果のテキストデータとを対応させた文字認識結果訂正用の訂正画面を表示する手段と
を具備したことを特徴とする文字読取装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate


【公開番号】特開2006−106906(P2006−106906A)
【公開日】平成18年4月20日(2006.4.20)
【国際特許分類】
【出願番号】特願2004−289373(P2004−289373)
【出願日】平成16年9月30日(2004.9.30)
【出願人】(000003078)株式会社東芝 (54,554)
【出願人】(301063496)東芝ソリューション株式会社 (1,478)
【Fターム(参考)】