説明

文字読取方法、キャリアシート

【課題】帳票が非定型であっても能率的に帳票を読み取りその認識情報を管理するのに資する文字読取方法およびキャリアシートを提供すること。
【解決手段】キャリアシートの面を当該キャリアシートに面接触状態で保持された帳票の読み取り面とともに光学的に読み取り、読み取り情報を入力するステップと、光学的に読み取られた帳票の読み取り情報を認識するステップと、認識された帳票の情報を記録するステップと、キャリアシートに面接触状態で保持された帳票に、認識された帳票の情報に基づき所定の印字を行うステップとを有する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、キャリアシートを介して帳票を読み取る文字読取方法、および文字読取装置に読み取らせる帳票を搬送し読み取りを媒介するキャリアシートに係り、特に、帳票が非定型であっても能率的に帳票を読み取りかつその認識情報を管理するのに適する文字読取方法およびキャリアシートに関する。
【背景技術】
【0002】
文字読取装置は、帳票に記載された文字を光学的に読み取り読み取られた結果を文字認識する装置であり、光学読取部に帳票を自動(自走)搬送して連続的に光学的読取を行い、認識処理部では、あらかじめ登録された帳票情報(フォーマットコントロール情報)を利用して必要な文字の認識を行うことなどが現在なされている。
【0003】
しかしながら、光学読取部に帳票を連続的に自動搬送するためには、搬送機構の制約上、帳票がある定型になっていることが要求される。この定型をはずれる帳票の読み取りには、人手により1枚差しが必要である。このため、非定型帳票では定型帳票ほどに効率的な文字読み取り処理ができないのが現状である。
【0004】
また、このような非定型帳票には、地紋や透かし、色地を有するもの、薄紙、特殊紙や裏にカーボンを有するものなどもある。これらの場合は、単に人手により1枚差しを行うのみでは、読み取りがうまくいかないこともある。これは、光学的に読み取ったものを文字認識するためには、まず、認識に必要な領域(帳票の領域)を切り出す必要があるが、そもそも非定型の場合は帳票の載置位置によりその領域が一定にはならないためである。これに、さらに、非定型帳票が上記のように地色等がまちまちのため、ある固定的な帳票領域の検出方法では適切な結果を得る検出に対応し切れないことが原因として重なる。
【0005】
また、帳票に存在する記載を認識する場合には、そのどの部分を認識対象とするかなどを詳細にあらかじめ設定し(すなわちフォーマットコントロール情報を設定し)、その設定情報に基づき認識処理するのが通常である。このため、帳票には、識別情報が付されて(記載されて)いることが多い。読取装置側では、この識別情報を認識しあらかじめ設定されたフォーマットコントロール情報を呼び出してこれに基づき帳票の認識処理を行う。
【0006】
しかるに、非定型帳票では、識別情報が付されていないことを前提として考える必要があり、このような非定型帳票における効率的な文字読み取り処理は、新たな課題である。
【発明の開示】
【発明が解決しようとする課題】
【0007】
本発明は、上記のような事情を考慮してなされたもので、帳票が非定型であっても能率的に帳票を読み取りその認識情報を管理するのに資する文字読取方法およびキャリアシートを提供することを目的とする。
【課題を解決するための手段】
【0008】
上記の課題を解決するため、本発明に係る文字読取方法は、キャリアシートの面を当該キャリアシートに面接触状態で保持された帳票の読み取り面とともに光学的に読み取り、読み取り情報を入力するステップと、前記光学的に読み取られた帳票の読み取り情報を認識するステップと、前記認識された帳票の情報を記録するステップと、前記キャリアシートに面接触状態で保持された帳票に前記認識された帳票の情報に基づき所定の印字を行うステップとを有することを特徴とする。
【0009】
キャリアシートに面接触状態で保持された帳票に所定の印字を行うことにより、帳票の管理が容易になる。すなわち、印字を、通番や上記の認識情報、領域検出情報と関係づけられた記号などで行うことにより、帳票に必要な付帯情報をユーザの意図で付すことができる。
【0010】
したがって、帳票を読み取りその認識情報を管理するのに適する文字読取方法が得られる。印字する情報は、キャリアシートの識別用情報や帳票内の認識情報に依存して決定されるものであってもよいし、これらとは独立したものであってもよい。
【0011】
また、本発明に係るキャリアシートは、帳票の文字読み取り面とは異なる面に面接触可能でその面接触可能な領域がグレー色調が付された領域を持つ第1のシートと、前記第1のシートに帳票を面接触させた場合に前記帳票との面接触状態を保持しかつ前記帳票を前記第1のシートとの間にて挟持しかつ前記帳票の文字読み取り面まで透過する第2のシートとを有し、前記第2のシートは、前記第1のシートに帳票を面接触させ前記帳票との面接触状態を保持した場合に、前記帳票の一部領域を前記第1のシートとの間に挟持しないよう切り欠きを設けたことを特徴とする。
【0012】
第1のシートに、グレー色調が付されることにより、その領域内に保持される非定型帳票の位置検出が容易になる。したがって、このキャリアシートを用いれば、帳票が非定型であっても能率的に帳票を読み取ることが可能になる。反射率は、種々のものを用意し帳票に応じて適切なものを用いることができる。
【0013】
キャリアシートに保持される帳票の一部が、第1のシートと第2のシートにより挟持されないことにより、この保持された状態において帳票に所定の印字を行うことができる。すなわち、印字を、通番や上記の認識情報、領域検出情報と関係づけられた記号などで行うことにより、帳票に必要な付帯情報をユーザの意図で付すことができる。
【0014】
したがって、帳票を読み取りその認識情報を管理するのに資するキャリアシートが得られる。
【発明の効果】
【0015】
本発明によれば、帳票が非定型であっても能率的に帳票を読み取りその認識情報を管理するのに資する文字読取方法およびキャリアシートを提供することができる。
【発明を実施するための最良の形態】
【0016】
以下、本発明の実施形態を図面を参照しながら説明する。
【0017】
図1は、本発明の実施形態を実現するためのシステムを示す構成図である。同図に示すように、このシステムは、スキャナ11、パーソナルコンピュータ(以下、PCという。)12、記憶装置14とを有し、PC12には、応用ソフトウエアとしてOCR(optical character reader)ソフトウエア13が組み込まれている。
【0018】
スキャナ11は、OCRソフトウエア13の制御の下、帳票を順次光学読み取りし、その光学読み取りされた情報をOCRソフトウエア13に渡すものである。
【0019】
PC12は、OCRソフトウエア13が実行されるのに必要な基本ハードウエア(中央演算ユニット、メモリなど)、基本ソフトウエア(オペレーティングシステムなど)を備え、情報処理をするための基礎部分に当たるものである。なお、マンマシンインタフェースとして、キーボードやマウスなどの入力機器、ディスプレーやプリンタなどの出力機器を有するのが通常である。
【0020】
OCRソフトウエア13は、スキャナ11を制御するとともに、スキャナ11で光学読み取りされた情報を文字認識するものである。文字認識された情報は記憶装置14に送られ記憶される。なお、OCRソフトウエア13には、スキャナ11からの読み取り情報をいかに処理するかの方法をあらかじめ登録しておく。例えば、帳票の領域の抽出(トリミング処理)、帳票内での認識すべき文字の位置に基づく文字認識処理などの方法である。
【0021】
記憶装置14は、OCRソフトウエア13が認識処理して得た情報を記憶するものであり、種々の記憶装置を用いることができる。
【0022】
次に、スキャナ11のより詳細なハードウエア的構成を図2を参照して説明する。同図は、スキャナ11の構成を示す図である。
【0023】
同図に示すように、スキャナ11には、帳票24の供給側トレー21、排出側トレー22、23、光透過型重複搬送検出器25、変位検出型厚み検出器26、照明光源27、28、反射鏡29、読み取りセンサ30、印字部31、制御部32があり、供給側トレー21から搬送経路33に沿って帳票24を搬送(移送)し、排出側トレー22または23に排出する。
【0024】
なお、帳票24は、後述するキャリアシートに保持されて読み取りされる。そこで、原則的に、キャリアシートに言及しない場合は、帳票24を「搬送」すると表現するが、キャリアシートに言及する場合は、帳票24を「移送」するとも言う場合がある。また、以下では、帳票24は、キャリアシートに保持された帳票、または、キャリアシート面を含んだ帳票を意味する場合がある。
【0025】
供給側トレー21は、読み取るべき帳票24を一まとめ(バッチ)にして載置するものであり、帳票24は、一枚ずつ制御部32の指令により搬送経路33に沿って順次読み取りため送られていく。
【0026】
排出側トレー22、23は、光学的に読み取られた帳票24を排出するためのトレーであり、異常なく読み取りを完了したものとそうでないものとを区別して排出するため2つ設けられる。しかし必ずしも2つある必要はない。
【0027】
光透過型重複搬送検出器25は、搬送される帳票の一方の面の一部に光を照射し透過した光を反対の面でとらえ、その光強度により、搬送が重複していないか検出する。すなわち、一定のものが通過すれば、厚みがほぼ一定であることから透過する光量もある一定の量となるが、搬送が重複するとその光量は非常に小さくなる。これにより、重複搬送を検出する。
【0028】
変位検出型厚み検出器26は、通過するものを挟むようにしてその厚さを検出するものである。すなわち、挟むことにより、挟む側の物体に厚さに応じた変位を生じるのでこれを検知し、搬送が重複すればこれを検出できる。
【0029】
照明光源27、28は、読み取るべき帳票24の読み取り面を照明する。帳票24の読み取り面には照明されることにより反射光が生じ、その反射光が反射鏡29を介して読み取りセンサ30に達する。読み取りセンサ30は、このような反射光を帳票24の面領域内で微視的に分解して捉え、帳票24の面領域内の反射率パターンを検出する。これにより、帳票24の光学的読み取りがなされる。
【0030】
印字部31は、制御部32の下、読み取りされた帳票24に必要な印字を行うものである。
【0031】
制御部32は、OCRソフトウエア13(図1に図示)からの指令により、上記のようにスキャナ11自体の動作を制御するものである。
【0032】
次に、本発明の一実施形態に係るキャリアシートについて図3を参照して説明する。同図は、キャリアシートの構成を示す図あり、同図(a)は、帳票を保持していない状態を示し、同図(b)は、帳票を保持している状態を示す。
【0033】
図3(a)に示すように、このキャリアシートは、ほぼ白色の面の一定領域にグレー色調領域43を有する第1のシート41と、透明で一部に切り込み45があり第1のシート41に一定位置で面接触可能な第2のシート42とを有する。第1のシート41のグレー色調領域43以外の領域には識別用情報44がある。
【0034】
また、図3(b)に示すように、帳票46を保持した場合には、帳票46は、第1のシート41と第2のシート42との間に挟持されてその読み取り面が透明の第2のシート42側になるよう保持される。その場合に、切り込み45の部分では帳票46の一部表面が露出し、また、帳票46はグレー色調領域43の一部分に重なる。
【0035】
次に、以上の図1ないし図3で述べた構成を用いた本発明の実施形態に係る文字読取方法について説明する。
【0036】
始めに、図4は、参考例たる文字読取方法を説明する流れ図である。
【0037】
まず、スキャナ11で帳票24を読み取るべくキャリアシートで搬送する(ステップ51)。そして、キャリアシートごと光学的に読み取り(ステップ52)、光学読み取りされたキャリアシートのグレー色調領域43をOCRソフトウエア13で検出することにより帳票の位置する領域をグレー色調領域43のへりとして検出する(ステップ53)。例えば、グレー色調領域43は、ほぼ一定の反射率であって、ある閾値で区別すれば黒一色に見える。そこで黒一色でない部分を帳票24の領域とするというような処理を行う。
【0038】
また、次にキャリアシートにある識別用情報(ID)44をOCRソフトウエア13で認識しておく(ステップ54)。
【0039】
次に、この認識された結果をあらかじめ登録された情報(フォーマットコントロール情報)とつき合わせて帳票24内の必要な記載を切り出し認識する(ステップ54)。すなわち、識別用情報44に対応して帳票24がキャリアシートに保持されかつOCRソフトウエア13には識別用情報44に基づきフォーマットコントロール情報の登録があらかじめなされているので、帳票24に対応してその必要な記載を切り出し認識することができる。なお、フォーマットコントロール情報は、帳票24内の認識すべき対象の位置情報、字種情報(英数字、仮名、漢字など)、手書き/印刷の区分情報などである。これらの情報に対応して識別用情報(ID番号)44がキャリアシートに記載されている。
【0040】
次に、切り出し認識された情報は記憶装置14に記憶されることで電子化処理される(ステップ56)。
【0041】
以上のように、ある反射率のグレー色調を有するキャリアシートの面を、そのキャリアシートに面接触状態で保持され前記キャリアシートより面積の小さい帳票24の読み取り面とともに光学的に読み取れば、読み取られた面のうち前記ある反射率のグレー色調を有する領域を検出することにより帳票24の領域を検出することができる。すなわち、非定型の帳票24の大きさがキャリアシート内でいかなる大きさであっても、またその位置がずれることがあっても、適切に帳票領域を検出することができる。また、グレー色調の反射率は、種々のものを用意し帳票に応じて適切なものを用いることができる。
【0042】
また、識別用情報44を有するキャリアシートの面をそのキャリアシートに面接触状態で保持された帳票24の読み取り面とともに光学的に読み取ることにより、帳票24自体には識別用情報が振られていない非定型帳票も都合よく読み取り処理することができる。すなわち、キャリアシートに付された識別用情報44を用いれば、帳票24自体に識別用情報がある場合と同様に、帳票24の中の必要な部分についての情報であってあらかじめ登録されているフォーマットコントロール情報を用いることができる。大きさの異なる種々の帳票が混合する場合であっても、識別用情報44を異ならせたキャリアシートを複数用意することにより、ひとつのバッチとして読み取り処理することができる。
【0043】
次に、本発明の実施形態に係る文字読取方法について、図5を参照して説明する。同図は、本発明の実施形態に係る文字読取方法を説明する流れ図である。
【0044】
まず、スキャナ11で帳票24を読み取るべくキャリアシートで搬送する(ステップ71)。そして、キャリアシートごと光学的に読み取り(ステップ72)、光学的に読み取られた帳票24をOCRソフトウエア13で文字認識する(ステップ73)。この文字認識のためには、上記で説明したような方法を用いることができる。
【0045】
次に、認識された情報は記憶装置14に記憶されることで電子化処理される(ステップ74)。そして、キャリアシートに保持された帳票のうち第2のシート42で挟持されていない部分には、印字部31で印字を行う(ステップ75)。すなわち、第2のシート42には切り込み45があり、この切り込み45の部分に露出する帳票部分が印字のための領域である。
【0046】
こうすることにより、帳票24の管理が容易になる。すなわち、印字を、通番や上記の文字認識情報、領域検出情報と関係づけられた記号などで行うことにより、帳票24に必要な付帯情報をユーザの意図で付すことができる。
【図面の簡単な説明】
【0047】
【図1】本発明の実施形態を実現するためのシステムを示す構成図。
【図2】図1中に示したスキャナ11の構成を示す図。
【図3】本発明の一実施形態に係るキャリアシートの構成を示す図。
【図4】参考例たる文字読取方法を説明する流れ図。
【図5】本発明の実施形態に係る文字読取方法を説明する流れ図。
【符号の説明】
【0048】
11…スキャナ、12…パーソナルコンピュータ、13…OCRソフトウエア、14…記憶装置、21…供給側トレー、22,23…排出側トレー、24…帳票、25…光透過型重複搬送検出器、26…変位検出型厚み検出器、27,28…照明光源、29…反射鏡、30…読み取りセンサ、31…印字部、32…制御部、33…搬送経路、41…第1のシート、42…第2のシート、43…グレー色調領域、44…識別用情報、45…切り込み、46…帳票。

【特許請求の範囲】
【請求項1】
キャリアシートの面を当該キャリアシートに面接触状態で保持された帳票の読み取り面とともに光学的に読み取り、読み取り情報を入力するステップと、
前記光学的に読み取られた帳票の読み取り情報を認識するステップと、
前記認識された帳票の情報を記録するステップと、
前記キャリアシートに面接触状態で保持された帳票に前記認識された帳票の情報に基づき所定の印字を行うステップと
を有することを特徴とする文字読取方法。
【請求項2】
帳票の文字読み取り面とは異なる面に面接触可能でその面接触可能な領域がグレー色調が付された領域を持つ第1のシートと、
前記第1のシートに帳票を面接触させた場合に前記帳票との面接触状態を保持しかつ前記帳票を前記第1のシートとの間にて挟持しかつ前記帳票の文字読み取り面まで透過する第2のシートとを有し、
前記第2のシートは、前記第1のシートに帳票を面接触させ前記帳票との面接触状態を保持した場合に、前記帳票の一部領域を前記第1のシートとの間に挟持しないよう切り欠きを設けたこと
を特徴とするキャリアシート。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate


【公開番号】特開2008−10010(P2008−10010A)
【公開日】平成20年1月17日(2008.1.17)
【国際特許分類】
【出願番号】特願2007−209460(P2007−209460)
【出願日】平成19年8月10日(2007.8.10)
【分割の表示】特願2000−200321(P2000−200321)の分割
【原出願日】平成12年6月30日(2000.6.30)
【出願人】(000003078)株式会社東芝 (54,554)
【Fターム(参考)】