複数文書認識システム、複数文書認識用テンプレート及び複数文書認識方法
【課題】複数の任意の文書の文字認識処理を容易かつ効率的に行うことを可能とする複数文書認識システム、これに用いられる複数文書認識用テンプレート及び複数文書認識方法を提供する。
【解決手段】複数文書認識システム1は、複数の文書20各々を配置する複数の文書配置領域12各々を特定するための領域マーク各々が配置されたテンプレート10に対して、複数の文書20を配置した状態で、前記テンプレート10の画像を表す画像データを生成する画像生成手段101と、画像生成手段101により生成された画像データから領域マーク各々で特定される文書配置領域12各々を表す画像データ各々を抽出する文書領域抽出手段102と、文書領域抽出手段102により抽出された画像データ各々の文字認識処理を行うことにより、テンプレート10に配置された複数の文書20毎に、各文書20に記載された文字を認識する個別文書文字認識手段103とを備える。
【解決手段】複数文書認識システム1は、複数の文書20各々を配置する複数の文書配置領域12各々を特定するための領域マーク各々が配置されたテンプレート10に対して、複数の文書20を配置した状態で、前記テンプレート10の画像を表す画像データを生成する画像生成手段101と、画像生成手段101により生成された画像データから領域マーク各々で特定される文書配置領域12各々を表す画像データ各々を抽出する文書領域抽出手段102と、文書領域抽出手段102により抽出された画像データ各々の文字認識処理を行うことにより、テンプレート10に配置された複数の文書20毎に、各文書20に記載された文字を認識する個別文書文字認識手段103とを備える。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、複数の文書に記載されている文字を文書毎に認識する複数文書認識システム、これに用いられる複数文書認識用テンプレート及び複数文書認識方法に関する。
【背景技術】
【0002】
従来、営業活動に伴って対価の支払いや請求が発生した場合、請求書、領収証等の会計伝票を発行することが行われている。事業者は、この会計伝票の日付、金額、請求先、支払先等の情報をコンピュータに入力して、金銭の収支を管理したり会計資料を作成する必要があった。領収証は台紙に貼り付けられ、証拠資料として保管されている。
【0003】
また、従来、顧客データや取引先の担当者を管理するために、名刺に記載されている会社名、住所、氏名等の情報をコンピュータに入力することが行われている。名刺に記載されている情報を入力する担当者は、1枚ずつ名刺を見ながら、名刺に表示されている情報をコンピュータに入力する必要があった。
【0004】
このような各種データの入力作業の負担を軽減するために、近年、領収証や名刺等の文書を1枚ずつスキャナで読み取ったりカメラで撮影することにより、画像データを生成し、当該生成した画像データの文字認識処理をコンピュータに行わせて、当該文字認識処理により認識した文字をテキストデータとして保存することが行われている。
【0005】
しかしながら、会計伝票や名刺を1枚ずつスキャンしたり撮影していたのでは手間がかかるため、文書の画像データを効率的に生成するために、複数の文書を一度にスキャンすることが行われている(例えば、特許文献1、2参照)。特許文献1には、原稿台に無作為に置かれたサイズや種類の異なる複数の帳票を一度にスキャンした画像から、各帳票の画像部分を抽出する技術が記載されている。具体的には、特許文献1に記載の画像処理装置は、スキャンした画像上の直線を抽出し、当該抽出された直線のうち任意の直線に対して平行又は直角になる直線を抽出し、当該抽出した直線よりなる抽出直線画像から所定の矩形領域を抽出し、当該所定の矩形領域と、予め登録された、帳票構造を直線のみでパターン化した複数の帳票パターンとを比較して、一致する矩形領域の画像を1つの帳票画像として抽出している。
また、特許文献2には、枠線と文字を含む画像の枠線の構造を自動的に認識し、帳票内に記入されている文字領域を切り出すことが記載されている。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2008−167009号公報
【特許文献2】特開平8−212292号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
特許文献1に記載の技術では、帳票種別毎に帳票パターンを登録しておく必要があるが、領収証や請求書等の会計伝票は発行元によってレイアウトが様々であるため、全ての帳票のテンプレートを作成するのは困難である。また、特許文献1では、帳票に直線が引かれていることが前提となっているため、直線が引かれていない帳票には適用することができない。
【0008】
また、特許文献2についても、予め帳票の標準の枠罫線構造を登録しておく必要がある。また、帳票に枠線が引かれていることが前提となっているため、枠線が引かれていない帳票には適用することができない。また、複雑なロジックで帳票の枠線を認識する必要がある。
【0009】
本発明は、上述した問題点を解決するためになされたものであり、複数の任意の文書の文字認識処理を容易かつ効率的に行うことを可能とする複数文書認識システム、これに用いられる複数文書認識用テンプレート及び複数文書認識方法を提供することを目的とする。
【課題を解決するための手段】
【0010】
上記目的の少なくとも1つを達成するために、本発明に係る複数文書認識システムは、複数の文書各々を配置する複数の文書配置領域各々を特定するための領域マーク各々が配置されたテンプレートに対して、複数の文書を配置した状態で、前記テンプレートの画像を表す画像データを生成する画像生成手段と、前記画像生成手段により生成された画像データから前記領域マーク各々で特定される前記文書配置領域各々を表す画像データ各々を抽出する文書領域抽出手段と、前記文書領域抽出手段により抽出された前記画像データ各々の文字認識処理を行うことにより、前記テンプレートに配置された前記複数の文書毎に、該文書に記載された文字を認識する個別文書文字認識手段とを備えたことを特徴とする。
【0011】
本発明によれば、複数文書認識システムは、複数の文書各々を配置する複数の文書配置領域各々を特定するための領域マーク各々が配置されたテンプレートに対して、複数の文書を配置した状態で、前記テンプレートの画像を表す画像データを生成するため、複数の各文書を各文書配置領域に配置しておけば、生成した画像データから領域マークを認識して、文書配置領域を容易に特定することができるため、複数の任意の文書の文字認識処理を容易かつ効率的に行うことが可能となる。
【0012】
また、本発明に係る複数文書認識用テンプレートは、上記複数文書認識システムに用いられ、複数の文書各々を配置する複数の文書配置領域各々を特定する各領域マークが配置されていることを特徴とする。
【0013】
本発明によれば、複数の文書各々を配置する複数の文書配置領域各々を特定する領域マークが配置されている複数文書認識用テンプレートに複数の文書を配置することで、複数の任意の文書の文字認識処理を容易かつ効率的に行うことが可能となる。
【0014】
上記発明において、前記文書配置領域各々を特定する各領域マークは、種類と位置の異なる少なくとも3つの位置マークで構成されていることを特徴とする。
本発明によれば、種類と位置の異なる少なくとも3つの位置マークで文書配置領域各々を特定する領域マークを構成することで、領域マークを枠線等で構成する場合に比較して、領域マーク印刷用のインクを節約することができ、また、領域マーク作成用の材料費を節約することができ、コストを削減することができる。
【0015】
上記発明において、前記位置マークは、貼り付け、剥離及び再貼り付けが可能な貼付部材であることを特徴とする。
本発明によれば、文書のサイズに合わせて、テンプレートに対する位置マークの貼り付け場所を変更することができる。
【0016】
上記発明において、前記位置マークは、文書の角を挟むための挟込部を有していることを特徴とする。
本発明によれば、挟込部に文書の角を挟むことで、文書が移動するのを防止することができる。
【0017】
上記発明において、前記複数の文書配置領域内には、文書の角を差し込むための差込スリットが設けられていることを特徴とする。
本発明によれば、差込スリットに文書の角を挟むことで、文書が移動するのを防止することができる。
【0018】
上記発明において、前記複数の文書配置領域はマス目状に配置され、前記複数の文書配置領域各々は透明部材で覆われていることを特徴とする。
本発明によれば、文書を文書配置領域に配置して透明部材で覆うことで、文書が移動するのを防ぐことができるとともに、文書を透明部材で覆った状態で保管することができる。
【0019】
また、本発明に係る複数文書認識システムは、少なくとも3つの角に異なるマークを有する文書を複数配置した状態で、複数の前記文書を含む全体領域の画像を表す画像データを生成する画像生成手段と、前記画像生成手段により生成された画像データから、前記マークで特定される、前記複数の文書各々が配置された領域各々を表す画像データ各々を抽出する文書領域抽出手段と、前記文書領域抽出手段により抽出された前記画像データ各々の文字認識処理を行うことにより、前記複数の文書毎に、該文書に記載された文字を認識する個別文書文字認識手段とを備えたことを特徴とする。
【0020】
本発明によれば、複数文書認識システムは、少なくとも3つの角に異なるマークが表示された文書を複数配置した状態で、複数の前記文書を含む全体領域の画像を表す画像データを生成することで、当該画像データから容易にマークを認識することができるため、各文書が配置された領域を容易に認識することができ、複数の任意の文書の文字認識処理を容易かつ効率的に行うことが可能となる。
【0021】
上記発明において、前記文書は会計伝票であり、勘定科目と該勘定科目に関連するキーワードとを対応付けて記憶する勘定科目記憶手段と、前記複数の文書各々に記載された文字と前記勘定科目記憶手段に記憶されたキーワードとを比較することにより、前記文書各々に対応する勘定科目を判定する勘定科目判定手段と、前記文書各々について、前記文書に記載された文字の少なくとも一部で表される日付及び金額と前記勘定科目判定手段により判定された前記文書の勘定科目とを対応付けて、会計データを作成する会計データ作成手段とを備えたことを特徴とする。
本発明によれば、会計伝票の画像データから会計データを自動的に作成することができる。
【0022】
また、本発明に係る複数文書認識方法は、複数の文書各々を配置する複数の文書配置領域各々を特定するための領域マーク各々が配置されたテンプレートに対して、複数の文書を配置した状態で、前記テンプレートの画像を表す画像データを生成する画像生成ステップと、前記画像生成ステップにおいて生成された画像データから前記領域マーク各々で特定される前記文書配置領域各々を表す画像データ各々を抽出する文書領域抽出ステップと、前記文書領域抽出ステップにおいて抽出された前記画像データ各々の文字認識処理を行うことにより、前記テンプレートに配置された前記複数の文書毎に、該文書に記載された文字を認識する個別文書文字認識ステップとを備えたことを特徴とする。
【0023】
本発明に係る文書認識方法によれば、複数の文書各々を配置する複数の文書配置領域各々を特定するための領域マーク各々が配置されたテンプレートに対して、複数の文書を配置した状態で、前記テンプレートの画像を表す画像データを生成し、生成した画像データから領域マークを認識することで、文書が配置された文書配置領域を容易に特定することができるため、複数の任意の文書の文字認識処理を容易かつ効率的に行うことが可能となる。
【0024】
また、本発明に係る複数文書認識方法は、少なくとも3つの角に異なるマークを有する文書を複数配置した状態で、複数の前記文書を含む全体領域の画像を表す画像データを生成する画像生成ステップと、前記画像生成ステップにおいて生成された画像データから、前記マークで特定される、前記複数の文書各々が配置された領域各々を表す画像データ各々を抽出する文書領域抽出ステップと、前記文書領域抽出ステップにおいて抽出された前記画像データ各々の文字認識処理を行うことにより、前記複数の文書毎に、該文書に記載された文字を認識する個別文書文字認識ステップとを備えたことを特徴とする。
【0025】
本発明に係る複数文書認識方法によれば、少なくとも3つの角に異なるマークが表示された文書を複数配置した状態で、複数の前記文書を含む全体領域の画像を表す画像データを生成して、当該画像データからマークを認識することで、各文書が配置された領域を容易に認識することができるため、複数の任意の文書の文字認識処理を容易かつ効率的に行うことが可能となる。
【発明の効果】
【0026】
本発明によれば、複数文書認識システムは、複数の文書各々を配置する複数の文書配置領域各々を特定するための領域マーク各々が配置されたテンプレートに対して、複数の文書を配置した状態で、前記テンプレートの画像を表す画像データを生成するため、複数の各文書を各文書配置領域に配置しておけば、生成した画像データから領域マークを認識し、文書が配置された文書配置領域を容易に特定することができるため、複数の任意の文書の文字認識処理を容易かつ効率的に行うことが可能となる。
【図面の簡単な説明】
【0027】
【図1】本発明の第1実施形態に係る複数文書認識システムの機能構成を示すブロック図である。
【図2】同実施形態に係るテンプレートに文書が配置された状態の一例を示す図である。
【図3】同実施形態に係るテンプレートの一例を示す図である。
【図4】変形例に係るテンプレートの一例を示す図である。
【図5】変形例に係るテンプレートの一例を示す図である。
【図6】変形例に係るテンプレートの一例を示す図である。
【図7】勘定科目DBのデータ構成の一例を示す図である。
【図8】同実施形態に係る複数文書認識システムが行う複数文書認識処理の手順を示すフローチャートである。
【図9】第2実施形態に係る複数文書認識システムが認識する、複数の文書が配置された台紙の一例を示す図である。
【図10】文書の種類の変形例を示す図である。
【発明を実施するための形態】
【0028】
以下、本発明を実施するための形態を、図面を参照して詳細に説明する。
(第1実施形態)
図1は、本発明の第1実施形態に係る複数文書認識システム1全体の機能構成を示すブロック図である。同図に示すように、複数文書認識システム1は、画像生成手段101と、文書領域抽出手段102と、個別文書文字認識手段103と、勘定科目判定手段104と、会計データ作成手段105と、勘定科目DB(Data Base)106とを備えている。
【0029】
なお、複数文書認識システム1が備えるこれらの機能は、1つの装置に配置してもよいし、複数の装置に分散して配置してもよい。複数の装置に分散して配置する場合には、画像生成手段101をOCR(Optical Character Recognition)装置、スキャナ、カメラ等が備え、その他の機能をパーソナルコンピュータが備えるようにしてもよい。或いは、1つの装置が画像生成手段101を備え、別の装置が文書領域抽出手段102と個別文書文字認識手段103とを備え、もう1つの別の装置が勘定科目判定手段104と会計データ作成手段105とを備えていてもよい。或いは、1つの装置が画像生成手段101と文書領域抽出手段102と個別文書文字認識手段103とを備え、別の装置が勘定科目判定手段104と会計データ作成手段105とを備えていてもよい。
【0030】
画像生成手段101は対象物の画像を生成する。画像生成手段101としては、イメージスキャナやカメラを用いることができる。画像生成手段101としてスキャナを用いる場合には、スキャナの照明部が対象物の表面を走査しつつ当該対象物に光を照射し、スキャナのセンサが対象物からの反射光を検知して画像データを生成する。また、画像生成手段101としてカメラを用いる場合には、カメラのレンズが対象物の光を集めて撮像素子に結像させ、当該撮像素子を構成する複数の受光素子毎に光を電気信号に変化させることで、画像データを生成する。
【0031】
本実施形態では、画像データの生成対象となる「対象物」として、図2に示すテンプレート10を用いる。図2は、図3に示すテンプレート10に対して、領収証、納品書、請求書等の複数の文書20を配置したものである。
【0032】
テンプレート10は、その上に複数の文書20を配置できる2次元空間を有するものであれば、材質は何であってもよい。例えば、材質は、紙であってもよいし、プラスチックであってもよいし、樹脂であってもよい。テンプレート10上には、図3に示すように、文書配置領域12を特定するための位置マークS、L、Rが設けられている。この位置マークS、L、Rの裏面(不図示)には、例えば両面テープや磁石が設けられており、テンプレート10に対する貼り付け、剥離及び再貼り付けが可能となっている。位置マークSは表面に絵文字「S」が表示されており、位置マークLは表面に絵文字「L」が表示されており、位置マークRは表面に絵文字「R」が表示されている。これにより、3つの位置マークS、L、Rは、画像認識処理により区別できるようになっている。なお、3つの位置マークS、L、Rの表面に表示するものは絵文字に限定されることはなく、互いに区別可能なものであれば何でもよい。また、位置マークS、L、Rの表面には、文書20の角を挟むための挟込部22が設けられている。当該位置マークS、L、Rは、貼り付け、剥離、再貼り付けが可能な貼付部材であるため、文書20のサイズに合わせて位置マークS、L、Rを移動し、文書20の角を挟込部22に挟むことができるように調整可能である。
【0033】
これらの3つの位置マークS、L、Rは、1つの文書20を配置する文書配置領域12を特定するための「領域マーク」を構成する。文書配置領域12を矩形とした場合、位置マークSは文書配置領域12の左上を表し、位置マークLは文書配置領域12の左下の位置を表し、位置マークRは文書配置領域12の右下を表す。また、文書配置領域12の右上の位置は、2つの位置マークS、Lを通る直線12aに平行に他の位置マークRから伸ばした直線12bと、位置マークL、Rを通る直線12cに平行に他の位置マークSから伸ばした直線12dとの交点14となり、文書配置領域12を特定するための4つ目の位置は自動的に決定できる。このように、4つの位置マークを使用せずに、3つの位置マークS、L、Rによって文書配置領域12を特定することにより、使用する貼付部材の数を少なくすることができ、コストを削減することができる。
【0034】
画像生成手段101は、テンプレート10の位置マークS、L、Rで特定される各文書配置領域12に対して複数の文書20を配置した状態で、テンプレートの画像を表す画像データを生成する。
【0035】
なお、位置マークS、L、Rは貼付部材に限らず、図4に示すように、テンプレート10A上に「S」、「L」、「R」の絵文字を予めインクで印刷しておいてもよい。この場合にも、位置マークを3つとすることで、位置マークS、L、Rを印刷するインクの量を少なくすることができる。
【0036】
また、図5に示すように、文書配置領域12内の位置マークS、L、Rの近傍それぞれに差込スリット16を設けてもよい。テンプレート10Bが紙等の薄い部材で形成されている場合には、テンプレート10Bの厚さ方向に貫通する切り込みを入れることで、差込スリット16を容易に形成することができる。文書配置領域12に配置する文書20の少なくとも1つの角を当該差込スリット16に挟むことで、文書20が移動するのを防ぐことができる。
【0037】
また、文書20として名刺を用いる場合には、図6に示すように、名刺フォルダをテンプレート10Cとして利用してもよい。この場合には、テンプレート10C上に位置マークS、L、Rで特定される複数の文書配置領域12がマス目状に配置され、複数の文書配置領域12各々は透明部材18で覆われることとなる。この場合、テンプレート10Cは文書20の保管にも使用することができる。
【0038】
図1に示す文書領域抽出手段102、個別文書文字認識手段103、勘定科目判定手段104、及び会計データ作成手段105は、複数文書認識システム1を構成する装置が備える図示せぬCPU(Central Processing Unit)がメモリ、ハードディスク等の記憶装置に記憶されたプログラムに従って処理を実行することにより実現される機能である。
【0039】
文書領域抽出手段102は、画像生成手段101により生成された画像データから、位置マークS、L、Rで構成される領域マーク各々で特定される文書配置領域12各々を表す画像データ各々を抽出する。
【0040】
個別文書文字認識手段103は、文書領域抽出手段102により文書20毎に抽出された画像データ各々の文字認識処理を行うことにより、テンプレート10に配置された複数の文書20毎に、各文書20に記載された文字を認識する。
【0041】
文字認識処理の方式としては、公知の技術を用いることができる。例えば、個別文書文字認識手段103は、画像データを構成する各画素を白と黒の2値に変換して、画像データの特徴量を抽出する。そして、当該抽出した特徴量と、複数文書認識システム1が備える記憶装置に予め記憶しておいた、文字の種類に応じた特徴量とを比較して、文字の種類を判別し、当該文字の種類に対応するJISコード等の文字識別コードを決定する。
【0042】
また、個別文書文字認識手段103は、文書20毎に、認識した複数の各文字の位置関係に基づいて文字間の距離を算出し、当該文字間の距離が所定値以下の文字の集合を文字列と判定する。そして、当該文字列に含まれる文字や配列状態から、文字列の属性(日付、金額等)を判定する。例えば、「年」、「月」、「日」が含まれる文字列は日付、先頭に「¥」が存在する文字列は金額と判定する。
【0043】
なお、文字認識精度を向上させるために、異なる種類の文字認識用のソフトウェアを記憶装置に記憶させておき、これらの異なるソフトウェアによる異なるロジック各々を用いて文字認識処理を行ってもよい。例えば異なるロジックを3つ用いる場合、2つ以上のロジックによる文字の種類の判定結果が一致した場合に、当該判定結果を採用するようにするとよい。また、金額等の正確性が要求される文字認識処理を行う場合には、文字の種類の判定結果が全てのロジックで一致しした場合にのみ、当該判定結果を採用するという方式をとればよい。
【0044】
そして、個別文書文字認識手段103は、各文書20に対応する各画像データから認識した文字や文字列の属性を、文書20毎に記憶装置に記憶する。
勘定科目判定手段104は、複数の文書20各々に記載された文字と、勘定科目DB106に記憶されたキーワードとを比較することにより、一致するものが存在した場合には、当該文書20は会計伝票であると判定し、当該会計伝票の勘定科目を判定する。
【0045】
勘定科目DB106は、複数文書認識システム1が備える記憶装置に設けられたデータベースであり、勘定科目と、当該勘定科目に関連するキーワードと、を対応付けて記憶する。図7には、勘定科目DB106のデータ構成の一例を示す。例えば、領収証に「郵便料金」と記載されている場合には、その領収証に記載されている金額の勘定科目を「通信費」とする場合が多いため、図7に示すように、勘定科目「通信費」に対応付けられて、キーワード「領収証」と「郵便料金」が記憶されている。
【0046】
また、領収証に「書籍代」と記載されている場合には、その領収証に記載されている金額の勘定科目を「新聞図書費」とする場合が多いため、図7に示すように、勘定科目DB106には、勘定科目「新聞図書費」に対応付けられて、キーワード「領収証」と「書籍代」が記憶されている。
【0047】
また、領収証に「飲食代」と記載されており、一人当たりの金額が5,000円未満の場合には、その領収証に記載されている金額の勘定科目を「会議費」とする場合が多いため、図7に示すように、勘定科目DB106には、勘定科目「会議費」に対応付けられて、キーワード「領収証」、「飲食代」と、一人当たりの金額「5,000円未満」が記憶されている。
【0048】
また、領収証に「飲食代」と記載されており、一人当たりの金額が5,000円以上の場合には、その領収証に記載されている金額の勘定科目を「交際接待費」とする場合が多いため、図7に示すように、勘定科目DB106には、勘定科目「交際接待費」に対応付けられて、キーワード「領収証」、「飲食代」と、一人当たりの金額「5,000円以上」が記憶されている。
【0049】
勘定科目判定手段104は、複数の文書20各々に記載された文字と勘定科目DB106に記憶されたキーワードとを比較した結果、「領収証」と「飲食代」が一致した場合には、一人当たりの金額が勘定科目DB106の「一人当たりの金額」に該当するか否かを判定する。領収証に人数が記載してあった場合には、勘定科目判定手段104は、領収証に記載された金額を人数で除算することにより、一人当たりの金額を算出する。そして、勘定科目判定手段104は、一人当たりの金額が5,000円未満である場合には勘定科目が会議費であると判定し、一人当たりの金額が5,000円以上である場合には勘定科目が交際接待費であると判定する。一人当たりの金額が判定できなかった場合には、勘定科目が会議費又は交際接待費であると判定する。
【0050】
なお、「領収書」と記載されている文書20についても「領収証」と記載されているものと同様に勘定科目を判定できるように、「領収証」というキーワードを「領収」に変更してもよいし、「領収書」というキーワードを勘定科目DB106に追加してもよい。
【0051】
会計データ作成手段105は、当該会計伝票に記載された文字の少なくとも一部で表される日付及び金額と、勘定科目判定手段104により判定された当該会計伝票の勘定科目とを対応付けて、会計データを作成する。このようにして作成された会計データは、総勘定元帳等の会計用の帳票を作成する際の元データとして利用することができる。
【0052】
なお、勘定科目を判定できなかったもの、勘定科目が誤って判定されたもの、一人当たりの金額を算出できずに勘定科目が会議費又は交際接待費と判定されたもの、会計伝票でないにも関わらず勘定科目が判定されたもの等は、会計データ作成手段105により作成された会計データの勘定科目をユーザがユーザインターフェースを介してチェックして、キーボード等を用いて修正するようにすればよい。
【0053】
次に、図8に示すフローチャートを参照して、複数文書認識システム1が行う複数文書認識処理について説明する。ここでは、画像生成手段101としてスキャナを使用する場合について説明する。
【0054】
まず、ユーザは、図2に示すような、複数の文書20が配置されたテンプレート10を画像生成手段101の読取部に置き、当該テンプレート10をスキャンさせるための操作を行う。
これにより、画像生成手段101は、テンプレート10のうち文書20が配置された面を走査して、テンプレート10を光学的に読み取り、画像データを生成する(ステップS11)。
【0055】
文書領域抽出手段102は、画像生成手段101により生成された画像データの認識処理を行うことにより、複数の位置マークS、L、Rを判別する。そして、当該位置マークS、L、Rから複数の文書配置領域12各々を特定し、当該判定された複数の文書配置領域12各々を表す画像データ各々を抽出する(ステップS12)。
【0056】
次に、個別文書文字認識手段103は、文書領域抽出手段102により抽出された画像データ各々の文字認識処理を行うことにより、テンプレート10に配置された複数の文書20毎に各文書20に記載された文字を認識する。また、個別文書文字認識手段103は、各文書20に記載された文字について、当該文字同士の距離から文字列を判別し、当該文字列の属性(日付、金額等)等を認識する(ステップS13)。そして、文書20毎の文字の認識結果を記憶装置に記録する。
【0057】
次に、勘定科目判定手段104は、各文書20に記載された文字と、勘定科目DB106に記憶されたキーワードとを比較することにより、各文書20の勘定科目を判定する(ステップS14)。なお、文書20に記載された文字の中に、勘定科目DB106に記憶されたキーワードに一致するものが存在しなかった場合は、文書20が会計伝票でないか、会計伝票であってもキーワードが勘定科目DB106に記憶されていない場合であるので、判定不能とする。
【0058】
次に、会計データ作成手段105は、ステップS14で文書20の勘定科目を判定することができた場合には、文書20に記載された日付及び金額と、当該文書20の勘定科目とを対応付けて、会計データを作成する(ステップS15)。
【0059】
以上説明したように、電子データ化すべき文書20が複数ある場合に、それぞれの文書20を個別にスキャンしなくても、また、文書20に直線や枠が引かれていなくても、各文書配置領域12に文書20が配置された1枚のテンプレート10を1回スキャンして、テンプレート10の画像データを生成することで、文書領域抽出手段102は当該画像データから容易に位置マークS、L、Rを認識し、複数の文書配置領域12各々を容易に特定することができるため、複数の任意の文書20の文字認識処理を容易かつ効率的に行うことが可能となる。また、文書20が会計伝票である場合には、会計データを自動的に作成することができる。
【0060】
なお、上述した実施形態は一例に過ぎず、本発明の技術思想の範囲で種々な変形が可能である。例えば、上述した動作例では、画像生成手段101としてスキャナを用いたが、画像データを生成できるものであればよく、例えばカメラを用いてもよい。このカメラは、携帯電話機や情報通信端末に内蔵されたものであってもよい。この場合、画像生成手段101は、ユーザ操作による撮影指示を受けると、テンプレート10における複数の文書20が配置された領域を1回撮影して、画像データを生成する。画像生成手段101は、当該生成した画像データを、有線又は無線を介して、文書領域抽出手段102を備えた装置に送信する。
【0061】
なお、画像生成手段101としてカメラを用いた場合には、テンプレート10や文書20が斜め方向から撮影されて、画像データに傾きや歪みが生じる場合がある。このような場合に対処するために、個別文書文字認識手段103に対して、画像データの傾きや歪みを除去する機能を設けてもよい。具体的には、個別文書文字認識手段103は、画像生成手段101により生成された画像データから抽出した文字列の傾きとカメラの焦点距離とに基づいて、画像データの変換処理を実行することにより、画像データの傾きや歪みを除去する。画像データの傾きや歪みを除去した後、画像データの文字認識処理を行うことにより、文字認識の精度を向上させることができる。
【0062】
また、上述した実施形態では、文字認識処理を行う文書20として領収証、納品書、請求書を例示したが、これらに限定されることはなく、例えば図10に示すように、本、雑誌、パンフレット、新聞の切り抜き等を文書20として用いてもよいし、さらには、名刺、社内文書、契約書、受領書等、文字が記載されているあらゆるものを文書20として用いることができる。
【0063】
また、上述した実施形態では、文書20にキーワード「領収証」が記載されていることにより文書20が領収証であることを判別したが、文書20の種別の判定方法はこれに限定されることはなく、例えば、予め登録しておいた文書の輪郭や特徴量と、判定対象となる文書20の輪郭や特徴量とを比較してもよい。
【0064】
(第2実施形態)
次に、本発明の第2実施形態について説明する。上述した第1実施形態では、テンプレート10に対して位置マークS、L、Rで構成される領域マークを配置して、文書配置領域12を容易に識別できるようにしたが、第2実施形態では、領域マークを有するテンプレート10を用いずに、図9に示すように、文書20A自体の3つの角に異なる位置マークを予め印刷しておく。或いは、位置マークを手書きしてもよい。この位置マークは、第1実施形態と同様の位置マークS、L、Rを用いればよい。そして、この複数の文書20Aは、台紙30などに貼り付けておけばよい。
【0065】
画像生成手段101は、当該位置マークS、L、Rを有する文書20Aを複数配置した状態で、当該複数の文書20Aの全体領域の画像を表す画像データを生成する。その他の構成は第1実施形態と同様であるため、重複した説明を省略する。
【符号の説明】
【0066】
1………複数文書認識システム、10、10A、10B、10C………テンプレート、12a、12b、12c、12d………直線、14………交点、16………差込スリット、18………透明部材、101………画像生成手段、102………文書領域抽出手段、103………個別文書文字認識手段、104………勘定科目判定手段、105………会計データ作成手段、106………勘定科目DB、20、20A………文書、30………台紙。
【技術分野】
【0001】
本発明は、複数の文書に記載されている文字を文書毎に認識する複数文書認識システム、これに用いられる複数文書認識用テンプレート及び複数文書認識方法に関する。
【背景技術】
【0002】
従来、営業活動に伴って対価の支払いや請求が発生した場合、請求書、領収証等の会計伝票を発行することが行われている。事業者は、この会計伝票の日付、金額、請求先、支払先等の情報をコンピュータに入力して、金銭の収支を管理したり会計資料を作成する必要があった。領収証は台紙に貼り付けられ、証拠資料として保管されている。
【0003】
また、従来、顧客データや取引先の担当者を管理するために、名刺に記載されている会社名、住所、氏名等の情報をコンピュータに入力することが行われている。名刺に記載されている情報を入力する担当者は、1枚ずつ名刺を見ながら、名刺に表示されている情報をコンピュータに入力する必要があった。
【0004】
このような各種データの入力作業の負担を軽減するために、近年、領収証や名刺等の文書を1枚ずつスキャナで読み取ったりカメラで撮影することにより、画像データを生成し、当該生成した画像データの文字認識処理をコンピュータに行わせて、当該文字認識処理により認識した文字をテキストデータとして保存することが行われている。
【0005】
しかしながら、会計伝票や名刺を1枚ずつスキャンしたり撮影していたのでは手間がかかるため、文書の画像データを効率的に生成するために、複数の文書を一度にスキャンすることが行われている(例えば、特許文献1、2参照)。特許文献1には、原稿台に無作為に置かれたサイズや種類の異なる複数の帳票を一度にスキャンした画像から、各帳票の画像部分を抽出する技術が記載されている。具体的には、特許文献1に記載の画像処理装置は、スキャンした画像上の直線を抽出し、当該抽出された直線のうち任意の直線に対して平行又は直角になる直線を抽出し、当該抽出した直線よりなる抽出直線画像から所定の矩形領域を抽出し、当該所定の矩形領域と、予め登録された、帳票構造を直線のみでパターン化した複数の帳票パターンとを比較して、一致する矩形領域の画像を1つの帳票画像として抽出している。
また、特許文献2には、枠線と文字を含む画像の枠線の構造を自動的に認識し、帳票内に記入されている文字領域を切り出すことが記載されている。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2008−167009号公報
【特許文献2】特開平8−212292号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
特許文献1に記載の技術では、帳票種別毎に帳票パターンを登録しておく必要があるが、領収証や請求書等の会計伝票は発行元によってレイアウトが様々であるため、全ての帳票のテンプレートを作成するのは困難である。また、特許文献1では、帳票に直線が引かれていることが前提となっているため、直線が引かれていない帳票には適用することができない。
【0008】
また、特許文献2についても、予め帳票の標準の枠罫線構造を登録しておく必要がある。また、帳票に枠線が引かれていることが前提となっているため、枠線が引かれていない帳票には適用することができない。また、複雑なロジックで帳票の枠線を認識する必要がある。
【0009】
本発明は、上述した問題点を解決するためになされたものであり、複数の任意の文書の文字認識処理を容易かつ効率的に行うことを可能とする複数文書認識システム、これに用いられる複数文書認識用テンプレート及び複数文書認識方法を提供することを目的とする。
【課題を解決するための手段】
【0010】
上記目的の少なくとも1つを達成するために、本発明に係る複数文書認識システムは、複数の文書各々を配置する複数の文書配置領域各々を特定するための領域マーク各々が配置されたテンプレートに対して、複数の文書を配置した状態で、前記テンプレートの画像を表す画像データを生成する画像生成手段と、前記画像生成手段により生成された画像データから前記領域マーク各々で特定される前記文書配置領域各々を表す画像データ各々を抽出する文書領域抽出手段と、前記文書領域抽出手段により抽出された前記画像データ各々の文字認識処理を行うことにより、前記テンプレートに配置された前記複数の文書毎に、該文書に記載された文字を認識する個別文書文字認識手段とを備えたことを特徴とする。
【0011】
本発明によれば、複数文書認識システムは、複数の文書各々を配置する複数の文書配置領域各々を特定するための領域マーク各々が配置されたテンプレートに対して、複数の文書を配置した状態で、前記テンプレートの画像を表す画像データを生成するため、複数の各文書を各文書配置領域に配置しておけば、生成した画像データから領域マークを認識して、文書配置領域を容易に特定することができるため、複数の任意の文書の文字認識処理を容易かつ効率的に行うことが可能となる。
【0012】
また、本発明に係る複数文書認識用テンプレートは、上記複数文書認識システムに用いられ、複数の文書各々を配置する複数の文書配置領域各々を特定する各領域マークが配置されていることを特徴とする。
【0013】
本発明によれば、複数の文書各々を配置する複数の文書配置領域各々を特定する領域マークが配置されている複数文書認識用テンプレートに複数の文書を配置することで、複数の任意の文書の文字認識処理を容易かつ効率的に行うことが可能となる。
【0014】
上記発明において、前記文書配置領域各々を特定する各領域マークは、種類と位置の異なる少なくとも3つの位置マークで構成されていることを特徴とする。
本発明によれば、種類と位置の異なる少なくとも3つの位置マークで文書配置領域各々を特定する領域マークを構成することで、領域マークを枠線等で構成する場合に比較して、領域マーク印刷用のインクを節約することができ、また、領域マーク作成用の材料費を節約することができ、コストを削減することができる。
【0015】
上記発明において、前記位置マークは、貼り付け、剥離及び再貼り付けが可能な貼付部材であることを特徴とする。
本発明によれば、文書のサイズに合わせて、テンプレートに対する位置マークの貼り付け場所を変更することができる。
【0016】
上記発明において、前記位置マークは、文書の角を挟むための挟込部を有していることを特徴とする。
本発明によれば、挟込部に文書の角を挟むことで、文書が移動するのを防止することができる。
【0017】
上記発明において、前記複数の文書配置領域内には、文書の角を差し込むための差込スリットが設けられていることを特徴とする。
本発明によれば、差込スリットに文書の角を挟むことで、文書が移動するのを防止することができる。
【0018】
上記発明において、前記複数の文書配置領域はマス目状に配置され、前記複数の文書配置領域各々は透明部材で覆われていることを特徴とする。
本発明によれば、文書を文書配置領域に配置して透明部材で覆うことで、文書が移動するのを防ぐことができるとともに、文書を透明部材で覆った状態で保管することができる。
【0019】
また、本発明に係る複数文書認識システムは、少なくとも3つの角に異なるマークを有する文書を複数配置した状態で、複数の前記文書を含む全体領域の画像を表す画像データを生成する画像生成手段と、前記画像生成手段により生成された画像データから、前記マークで特定される、前記複数の文書各々が配置された領域各々を表す画像データ各々を抽出する文書領域抽出手段と、前記文書領域抽出手段により抽出された前記画像データ各々の文字認識処理を行うことにより、前記複数の文書毎に、該文書に記載された文字を認識する個別文書文字認識手段とを備えたことを特徴とする。
【0020】
本発明によれば、複数文書認識システムは、少なくとも3つの角に異なるマークが表示された文書を複数配置した状態で、複数の前記文書を含む全体領域の画像を表す画像データを生成することで、当該画像データから容易にマークを認識することができるため、各文書が配置された領域を容易に認識することができ、複数の任意の文書の文字認識処理を容易かつ効率的に行うことが可能となる。
【0021】
上記発明において、前記文書は会計伝票であり、勘定科目と該勘定科目に関連するキーワードとを対応付けて記憶する勘定科目記憶手段と、前記複数の文書各々に記載された文字と前記勘定科目記憶手段に記憶されたキーワードとを比較することにより、前記文書各々に対応する勘定科目を判定する勘定科目判定手段と、前記文書各々について、前記文書に記載された文字の少なくとも一部で表される日付及び金額と前記勘定科目判定手段により判定された前記文書の勘定科目とを対応付けて、会計データを作成する会計データ作成手段とを備えたことを特徴とする。
本発明によれば、会計伝票の画像データから会計データを自動的に作成することができる。
【0022】
また、本発明に係る複数文書認識方法は、複数の文書各々を配置する複数の文書配置領域各々を特定するための領域マーク各々が配置されたテンプレートに対して、複数の文書を配置した状態で、前記テンプレートの画像を表す画像データを生成する画像生成ステップと、前記画像生成ステップにおいて生成された画像データから前記領域マーク各々で特定される前記文書配置領域各々を表す画像データ各々を抽出する文書領域抽出ステップと、前記文書領域抽出ステップにおいて抽出された前記画像データ各々の文字認識処理を行うことにより、前記テンプレートに配置された前記複数の文書毎に、該文書に記載された文字を認識する個別文書文字認識ステップとを備えたことを特徴とする。
【0023】
本発明に係る文書認識方法によれば、複数の文書各々を配置する複数の文書配置領域各々を特定するための領域マーク各々が配置されたテンプレートに対して、複数の文書を配置した状態で、前記テンプレートの画像を表す画像データを生成し、生成した画像データから領域マークを認識することで、文書が配置された文書配置領域を容易に特定することができるため、複数の任意の文書の文字認識処理を容易かつ効率的に行うことが可能となる。
【0024】
また、本発明に係る複数文書認識方法は、少なくとも3つの角に異なるマークを有する文書を複数配置した状態で、複数の前記文書を含む全体領域の画像を表す画像データを生成する画像生成ステップと、前記画像生成ステップにおいて生成された画像データから、前記マークで特定される、前記複数の文書各々が配置された領域各々を表す画像データ各々を抽出する文書領域抽出ステップと、前記文書領域抽出ステップにおいて抽出された前記画像データ各々の文字認識処理を行うことにより、前記複数の文書毎に、該文書に記載された文字を認識する個別文書文字認識ステップとを備えたことを特徴とする。
【0025】
本発明に係る複数文書認識方法によれば、少なくとも3つの角に異なるマークが表示された文書を複数配置した状態で、複数の前記文書を含む全体領域の画像を表す画像データを生成して、当該画像データからマークを認識することで、各文書が配置された領域を容易に認識することができるため、複数の任意の文書の文字認識処理を容易かつ効率的に行うことが可能となる。
【発明の効果】
【0026】
本発明によれば、複数文書認識システムは、複数の文書各々を配置する複数の文書配置領域各々を特定するための領域マーク各々が配置されたテンプレートに対して、複数の文書を配置した状態で、前記テンプレートの画像を表す画像データを生成するため、複数の各文書を各文書配置領域に配置しておけば、生成した画像データから領域マークを認識し、文書が配置された文書配置領域を容易に特定することができるため、複数の任意の文書の文字認識処理を容易かつ効率的に行うことが可能となる。
【図面の簡単な説明】
【0027】
【図1】本発明の第1実施形態に係る複数文書認識システムの機能構成を示すブロック図である。
【図2】同実施形態に係るテンプレートに文書が配置された状態の一例を示す図である。
【図3】同実施形態に係るテンプレートの一例を示す図である。
【図4】変形例に係るテンプレートの一例を示す図である。
【図5】変形例に係るテンプレートの一例を示す図である。
【図6】変形例に係るテンプレートの一例を示す図である。
【図7】勘定科目DBのデータ構成の一例を示す図である。
【図8】同実施形態に係る複数文書認識システムが行う複数文書認識処理の手順を示すフローチャートである。
【図9】第2実施形態に係る複数文書認識システムが認識する、複数の文書が配置された台紙の一例を示す図である。
【図10】文書の種類の変形例を示す図である。
【発明を実施するための形態】
【0028】
以下、本発明を実施するための形態を、図面を参照して詳細に説明する。
(第1実施形態)
図1は、本発明の第1実施形態に係る複数文書認識システム1全体の機能構成を示すブロック図である。同図に示すように、複数文書認識システム1は、画像生成手段101と、文書領域抽出手段102と、個別文書文字認識手段103と、勘定科目判定手段104と、会計データ作成手段105と、勘定科目DB(Data Base)106とを備えている。
【0029】
なお、複数文書認識システム1が備えるこれらの機能は、1つの装置に配置してもよいし、複数の装置に分散して配置してもよい。複数の装置に分散して配置する場合には、画像生成手段101をOCR(Optical Character Recognition)装置、スキャナ、カメラ等が備え、その他の機能をパーソナルコンピュータが備えるようにしてもよい。或いは、1つの装置が画像生成手段101を備え、別の装置が文書領域抽出手段102と個別文書文字認識手段103とを備え、もう1つの別の装置が勘定科目判定手段104と会計データ作成手段105とを備えていてもよい。或いは、1つの装置が画像生成手段101と文書領域抽出手段102と個別文書文字認識手段103とを備え、別の装置が勘定科目判定手段104と会計データ作成手段105とを備えていてもよい。
【0030】
画像生成手段101は対象物の画像を生成する。画像生成手段101としては、イメージスキャナやカメラを用いることができる。画像生成手段101としてスキャナを用いる場合には、スキャナの照明部が対象物の表面を走査しつつ当該対象物に光を照射し、スキャナのセンサが対象物からの反射光を検知して画像データを生成する。また、画像生成手段101としてカメラを用いる場合には、カメラのレンズが対象物の光を集めて撮像素子に結像させ、当該撮像素子を構成する複数の受光素子毎に光を電気信号に変化させることで、画像データを生成する。
【0031】
本実施形態では、画像データの生成対象となる「対象物」として、図2に示すテンプレート10を用いる。図2は、図3に示すテンプレート10に対して、領収証、納品書、請求書等の複数の文書20を配置したものである。
【0032】
テンプレート10は、その上に複数の文書20を配置できる2次元空間を有するものであれば、材質は何であってもよい。例えば、材質は、紙であってもよいし、プラスチックであってもよいし、樹脂であってもよい。テンプレート10上には、図3に示すように、文書配置領域12を特定するための位置マークS、L、Rが設けられている。この位置マークS、L、Rの裏面(不図示)には、例えば両面テープや磁石が設けられており、テンプレート10に対する貼り付け、剥離及び再貼り付けが可能となっている。位置マークSは表面に絵文字「S」が表示されており、位置マークLは表面に絵文字「L」が表示されており、位置マークRは表面に絵文字「R」が表示されている。これにより、3つの位置マークS、L、Rは、画像認識処理により区別できるようになっている。なお、3つの位置マークS、L、Rの表面に表示するものは絵文字に限定されることはなく、互いに区別可能なものであれば何でもよい。また、位置マークS、L、Rの表面には、文書20の角を挟むための挟込部22が設けられている。当該位置マークS、L、Rは、貼り付け、剥離、再貼り付けが可能な貼付部材であるため、文書20のサイズに合わせて位置マークS、L、Rを移動し、文書20の角を挟込部22に挟むことができるように調整可能である。
【0033】
これらの3つの位置マークS、L、Rは、1つの文書20を配置する文書配置領域12を特定するための「領域マーク」を構成する。文書配置領域12を矩形とした場合、位置マークSは文書配置領域12の左上を表し、位置マークLは文書配置領域12の左下の位置を表し、位置マークRは文書配置領域12の右下を表す。また、文書配置領域12の右上の位置は、2つの位置マークS、Lを通る直線12aに平行に他の位置マークRから伸ばした直線12bと、位置マークL、Rを通る直線12cに平行に他の位置マークSから伸ばした直線12dとの交点14となり、文書配置領域12を特定するための4つ目の位置は自動的に決定できる。このように、4つの位置マークを使用せずに、3つの位置マークS、L、Rによって文書配置領域12を特定することにより、使用する貼付部材の数を少なくすることができ、コストを削減することができる。
【0034】
画像生成手段101は、テンプレート10の位置マークS、L、Rで特定される各文書配置領域12に対して複数の文書20を配置した状態で、テンプレートの画像を表す画像データを生成する。
【0035】
なお、位置マークS、L、Rは貼付部材に限らず、図4に示すように、テンプレート10A上に「S」、「L」、「R」の絵文字を予めインクで印刷しておいてもよい。この場合にも、位置マークを3つとすることで、位置マークS、L、Rを印刷するインクの量を少なくすることができる。
【0036】
また、図5に示すように、文書配置領域12内の位置マークS、L、Rの近傍それぞれに差込スリット16を設けてもよい。テンプレート10Bが紙等の薄い部材で形成されている場合には、テンプレート10Bの厚さ方向に貫通する切り込みを入れることで、差込スリット16を容易に形成することができる。文書配置領域12に配置する文書20の少なくとも1つの角を当該差込スリット16に挟むことで、文書20が移動するのを防ぐことができる。
【0037】
また、文書20として名刺を用いる場合には、図6に示すように、名刺フォルダをテンプレート10Cとして利用してもよい。この場合には、テンプレート10C上に位置マークS、L、Rで特定される複数の文書配置領域12がマス目状に配置され、複数の文書配置領域12各々は透明部材18で覆われることとなる。この場合、テンプレート10Cは文書20の保管にも使用することができる。
【0038】
図1に示す文書領域抽出手段102、個別文書文字認識手段103、勘定科目判定手段104、及び会計データ作成手段105は、複数文書認識システム1を構成する装置が備える図示せぬCPU(Central Processing Unit)がメモリ、ハードディスク等の記憶装置に記憶されたプログラムに従って処理を実行することにより実現される機能である。
【0039】
文書領域抽出手段102は、画像生成手段101により生成された画像データから、位置マークS、L、Rで構成される領域マーク各々で特定される文書配置領域12各々を表す画像データ各々を抽出する。
【0040】
個別文書文字認識手段103は、文書領域抽出手段102により文書20毎に抽出された画像データ各々の文字認識処理を行うことにより、テンプレート10に配置された複数の文書20毎に、各文書20に記載された文字を認識する。
【0041】
文字認識処理の方式としては、公知の技術を用いることができる。例えば、個別文書文字認識手段103は、画像データを構成する各画素を白と黒の2値に変換して、画像データの特徴量を抽出する。そして、当該抽出した特徴量と、複数文書認識システム1が備える記憶装置に予め記憶しておいた、文字の種類に応じた特徴量とを比較して、文字の種類を判別し、当該文字の種類に対応するJISコード等の文字識別コードを決定する。
【0042】
また、個別文書文字認識手段103は、文書20毎に、認識した複数の各文字の位置関係に基づいて文字間の距離を算出し、当該文字間の距離が所定値以下の文字の集合を文字列と判定する。そして、当該文字列に含まれる文字や配列状態から、文字列の属性(日付、金額等)を判定する。例えば、「年」、「月」、「日」が含まれる文字列は日付、先頭に「¥」が存在する文字列は金額と判定する。
【0043】
なお、文字認識精度を向上させるために、異なる種類の文字認識用のソフトウェアを記憶装置に記憶させておき、これらの異なるソフトウェアによる異なるロジック各々を用いて文字認識処理を行ってもよい。例えば異なるロジックを3つ用いる場合、2つ以上のロジックによる文字の種類の判定結果が一致した場合に、当該判定結果を採用するようにするとよい。また、金額等の正確性が要求される文字認識処理を行う場合には、文字の種類の判定結果が全てのロジックで一致しした場合にのみ、当該判定結果を採用するという方式をとればよい。
【0044】
そして、個別文書文字認識手段103は、各文書20に対応する各画像データから認識した文字や文字列の属性を、文書20毎に記憶装置に記憶する。
勘定科目判定手段104は、複数の文書20各々に記載された文字と、勘定科目DB106に記憶されたキーワードとを比較することにより、一致するものが存在した場合には、当該文書20は会計伝票であると判定し、当該会計伝票の勘定科目を判定する。
【0045】
勘定科目DB106は、複数文書認識システム1が備える記憶装置に設けられたデータベースであり、勘定科目と、当該勘定科目に関連するキーワードと、を対応付けて記憶する。図7には、勘定科目DB106のデータ構成の一例を示す。例えば、領収証に「郵便料金」と記載されている場合には、その領収証に記載されている金額の勘定科目を「通信費」とする場合が多いため、図7に示すように、勘定科目「通信費」に対応付けられて、キーワード「領収証」と「郵便料金」が記憶されている。
【0046】
また、領収証に「書籍代」と記載されている場合には、その領収証に記載されている金額の勘定科目を「新聞図書費」とする場合が多いため、図7に示すように、勘定科目DB106には、勘定科目「新聞図書費」に対応付けられて、キーワード「領収証」と「書籍代」が記憶されている。
【0047】
また、領収証に「飲食代」と記載されており、一人当たりの金額が5,000円未満の場合には、その領収証に記載されている金額の勘定科目を「会議費」とする場合が多いため、図7に示すように、勘定科目DB106には、勘定科目「会議費」に対応付けられて、キーワード「領収証」、「飲食代」と、一人当たりの金額「5,000円未満」が記憶されている。
【0048】
また、領収証に「飲食代」と記載されており、一人当たりの金額が5,000円以上の場合には、その領収証に記載されている金額の勘定科目を「交際接待費」とする場合が多いため、図7に示すように、勘定科目DB106には、勘定科目「交際接待費」に対応付けられて、キーワード「領収証」、「飲食代」と、一人当たりの金額「5,000円以上」が記憶されている。
【0049】
勘定科目判定手段104は、複数の文書20各々に記載された文字と勘定科目DB106に記憶されたキーワードとを比較した結果、「領収証」と「飲食代」が一致した場合には、一人当たりの金額が勘定科目DB106の「一人当たりの金額」に該当するか否かを判定する。領収証に人数が記載してあった場合には、勘定科目判定手段104は、領収証に記載された金額を人数で除算することにより、一人当たりの金額を算出する。そして、勘定科目判定手段104は、一人当たりの金額が5,000円未満である場合には勘定科目が会議費であると判定し、一人当たりの金額が5,000円以上である場合には勘定科目が交際接待費であると判定する。一人当たりの金額が判定できなかった場合には、勘定科目が会議費又は交際接待費であると判定する。
【0050】
なお、「領収書」と記載されている文書20についても「領収証」と記載されているものと同様に勘定科目を判定できるように、「領収証」というキーワードを「領収」に変更してもよいし、「領収書」というキーワードを勘定科目DB106に追加してもよい。
【0051】
会計データ作成手段105は、当該会計伝票に記載された文字の少なくとも一部で表される日付及び金額と、勘定科目判定手段104により判定された当該会計伝票の勘定科目とを対応付けて、会計データを作成する。このようにして作成された会計データは、総勘定元帳等の会計用の帳票を作成する際の元データとして利用することができる。
【0052】
なお、勘定科目を判定できなかったもの、勘定科目が誤って判定されたもの、一人当たりの金額を算出できずに勘定科目が会議費又は交際接待費と判定されたもの、会計伝票でないにも関わらず勘定科目が判定されたもの等は、会計データ作成手段105により作成された会計データの勘定科目をユーザがユーザインターフェースを介してチェックして、キーボード等を用いて修正するようにすればよい。
【0053】
次に、図8に示すフローチャートを参照して、複数文書認識システム1が行う複数文書認識処理について説明する。ここでは、画像生成手段101としてスキャナを使用する場合について説明する。
【0054】
まず、ユーザは、図2に示すような、複数の文書20が配置されたテンプレート10を画像生成手段101の読取部に置き、当該テンプレート10をスキャンさせるための操作を行う。
これにより、画像生成手段101は、テンプレート10のうち文書20が配置された面を走査して、テンプレート10を光学的に読み取り、画像データを生成する(ステップS11)。
【0055】
文書領域抽出手段102は、画像生成手段101により生成された画像データの認識処理を行うことにより、複数の位置マークS、L、Rを判別する。そして、当該位置マークS、L、Rから複数の文書配置領域12各々を特定し、当該判定された複数の文書配置領域12各々を表す画像データ各々を抽出する(ステップS12)。
【0056】
次に、個別文書文字認識手段103は、文書領域抽出手段102により抽出された画像データ各々の文字認識処理を行うことにより、テンプレート10に配置された複数の文書20毎に各文書20に記載された文字を認識する。また、個別文書文字認識手段103は、各文書20に記載された文字について、当該文字同士の距離から文字列を判別し、当該文字列の属性(日付、金額等)等を認識する(ステップS13)。そして、文書20毎の文字の認識結果を記憶装置に記録する。
【0057】
次に、勘定科目判定手段104は、各文書20に記載された文字と、勘定科目DB106に記憶されたキーワードとを比較することにより、各文書20の勘定科目を判定する(ステップS14)。なお、文書20に記載された文字の中に、勘定科目DB106に記憶されたキーワードに一致するものが存在しなかった場合は、文書20が会計伝票でないか、会計伝票であってもキーワードが勘定科目DB106に記憶されていない場合であるので、判定不能とする。
【0058】
次に、会計データ作成手段105は、ステップS14で文書20の勘定科目を判定することができた場合には、文書20に記載された日付及び金額と、当該文書20の勘定科目とを対応付けて、会計データを作成する(ステップS15)。
【0059】
以上説明したように、電子データ化すべき文書20が複数ある場合に、それぞれの文書20を個別にスキャンしなくても、また、文書20に直線や枠が引かれていなくても、各文書配置領域12に文書20が配置された1枚のテンプレート10を1回スキャンして、テンプレート10の画像データを生成することで、文書領域抽出手段102は当該画像データから容易に位置マークS、L、Rを認識し、複数の文書配置領域12各々を容易に特定することができるため、複数の任意の文書20の文字認識処理を容易かつ効率的に行うことが可能となる。また、文書20が会計伝票である場合には、会計データを自動的に作成することができる。
【0060】
なお、上述した実施形態は一例に過ぎず、本発明の技術思想の範囲で種々な変形が可能である。例えば、上述した動作例では、画像生成手段101としてスキャナを用いたが、画像データを生成できるものであればよく、例えばカメラを用いてもよい。このカメラは、携帯電話機や情報通信端末に内蔵されたものであってもよい。この場合、画像生成手段101は、ユーザ操作による撮影指示を受けると、テンプレート10における複数の文書20が配置された領域を1回撮影して、画像データを生成する。画像生成手段101は、当該生成した画像データを、有線又は無線を介して、文書領域抽出手段102を備えた装置に送信する。
【0061】
なお、画像生成手段101としてカメラを用いた場合には、テンプレート10や文書20が斜め方向から撮影されて、画像データに傾きや歪みが生じる場合がある。このような場合に対処するために、個別文書文字認識手段103に対して、画像データの傾きや歪みを除去する機能を設けてもよい。具体的には、個別文書文字認識手段103は、画像生成手段101により生成された画像データから抽出した文字列の傾きとカメラの焦点距離とに基づいて、画像データの変換処理を実行することにより、画像データの傾きや歪みを除去する。画像データの傾きや歪みを除去した後、画像データの文字認識処理を行うことにより、文字認識の精度を向上させることができる。
【0062】
また、上述した実施形態では、文字認識処理を行う文書20として領収証、納品書、請求書を例示したが、これらに限定されることはなく、例えば図10に示すように、本、雑誌、パンフレット、新聞の切り抜き等を文書20として用いてもよいし、さらには、名刺、社内文書、契約書、受領書等、文字が記載されているあらゆるものを文書20として用いることができる。
【0063】
また、上述した実施形態では、文書20にキーワード「領収証」が記載されていることにより文書20が領収証であることを判別したが、文書20の種別の判定方法はこれに限定されることはなく、例えば、予め登録しておいた文書の輪郭や特徴量と、判定対象となる文書20の輪郭や特徴量とを比較してもよい。
【0064】
(第2実施形態)
次に、本発明の第2実施形態について説明する。上述した第1実施形態では、テンプレート10に対して位置マークS、L、Rで構成される領域マークを配置して、文書配置領域12を容易に識別できるようにしたが、第2実施形態では、領域マークを有するテンプレート10を用いずに、図9に示すように、文書20A自体の3つの角に異なる位置マークを予め印刷しておく。或いは、位置マークを手書きしてもよい。この位置マークは、第1実施形態と同様の位置マークS、L、Rを用いればよい。そして、この複数の文書20Aは、台紙30などに貼り付けておけばよい。
【0065】
画像生成手段101は、当該位置マークS、L、Rを有する文書20Aを複数配置した状態で、当該複数の文書20Aの全体領域の画像を表す画像データを生成する。その他の構成は第1実施形態と同様であるため、重複した説明を省略する。
【符号の説明】
【0066】
1………複数文書認識システム、10、10A、10B、10C………テンプレート、12a、12b、12c、12d………直線、14………交点、16………差込スリット、18………透明部材、101………画像生成手段、102………文書領域抽出手段、103………個別文書文字認識手段、104………勘定科目判定手段、105………会計データ作成手段、106………勘定科目DB、20、20A………文書、30………台紙。
【特許請求の範囲】
【請求項1】
複数の文書各々を配置する複数の文書配置領域各々を特定するための領域マーク各々が配置されたテンプレートに対して、複数の文書を配置した状態で、前記テンプレートの画像を表す画像データを生成する画像生成手段と、
前記画像生成手段により生成された画像データから前記領域マーク各々で特定される前記文書配置領域各々を表す画像データ各々を抽出する文書領域抽出手段と、
前記文書領域抽出手段により抽出された前記画像データ各々の文字認識処理を行うことにより、前記テンプレートに配置された前記複数の文書毎に、該文書に記載された文字を認識する個別文書文字認識手段と
を備えたことを特徴とする複数文書認識システム。
【請求項2】
請求項1に記載の複数文書認識システムに用いられる、複数の文書各々を配置する複数の文書配置領域各々を特定する各領域マークが配置された複数文書認識用テンプレート。
【請求項3】
前記文書配置領域各々を特定する各領域マークは、種類と位置の異なる少なくとも3つの位置マークで構成されていることを特徴とする請求項2に記載の複数文書認識用テンプレート。
【請求項4】
前記位置マークは、貼り付け、剥離及び再貼り付けが可能な貼付部材であることを特徴とする請求項3に記載の複数文書認識用テンプレート。
【請求項5】
前記位置マークは、文書の角を挟むための挟込部を有していることを特徴とする請求項4に記載の複数文書認識用テンプレート。
【請求項6】
前記複数の文書配置領域内には、文書の角を差し込むための差込スリットが設けられていることを特徴とする請求項2又は3に記載の複数文書認識用テンプレート。
【請求項7】
前記複数の文書配置領域はマス目状に配置され、前記複数の文書配置領域各々は透明部材で覆われていることを特徴とする請求項2又は3に記載の複数文書認識用テンプレート。
【請求項8】
少なくとも3つの角に異なるマークを有する文書を複数配置した状態で、複数の前記文書を含む全体領域の画像を表す画像データを生成する画像生成手段と、
前記画像生成手段により生成された画像データから、前記マークで特定される、前記複数の文書各々が配置された領域各々を表す画像データ各々を抽出する文書領域抽出手段と、
前記文書領域抽出手段により抽出された前記画像データ各々の文字認識処理を行うことにより、前記複数の文書毎に、該文書に記載された文字を認識する個別文書文字認識手段と
を備えたことを特徴とする複数文書認識システム。
【請求項9】
前記文書は会計伝票であり、
勘定科目と該勘定科目に関連するキーワードとを対応付けて記憶する勘定科目記憶手段と、
前記複数の文書各々に記載された文字と前記勘定科目記憶手段に記憶されたキーワードとを比較することにより、前記文書各々に対応する勘定科目を判定する勘定科目判定手段と、
前記文書各々について、前記文書に記載された文字の少なくとも一部で表される日付及び金額と前記勘定科目判定手段により判定された前記文書の勘定科目とを対応付けて、会計データを作成する会計データ作成手段と
を備えたことを特徴とする請求項1又は8に記載の複数文書認識システム。
【請求項10】
複数の文書各々を配置する複数の文書配置領域各々を特定するための領域マーク各々が配置されたテンプレートに対して、複数の文書を配置した状態で、前記テンプレートの画像を表す画像データを生成する画像生成ステップと、
前記画像生成ステップにおいて生成された画像データから前記領域マーク各々で特定される前記文書配置領域各々を表す画像データ各々を抽出する文書領域抽出ステップと、
前記文書領域抽出ステップにおいて抽出された前記画像データ各々の文字認識処理を行うことにより、前記テンプレートに配置された前記複数の文書毎に、該文書に記載された文字を認識する個別文書文字認識ステップと
を備えたことを特徴とする複数文書認識方法。
【請求項11】
少なくとも3つの角に異なるマークを有する文書を複数配置した状態で、複数の前記文書を含む全体領域の画像を表す画像データを生成する画像生成ステップと、
前記画像生成ステップにおいて生成された画像データから、前記マークで特定される、前記複数の文書各々が配置された領域各々を表す画像データ各々を抽出する文書領域抽出ステップと、
前記文書領域抽出ステップにおいて抽出された前記画像データ各々の文字認識処理を行うことにより、前記複数の文書毎に、該文書に記載された文字を認識する個別文書文字認識ステップと
を備えたことを特徴とする複数文書認識方法。
【請求項1】
複数の文書各々を配置する複数の文書配置領域各々を特定するための領域マーク各々が配置されたテンプレートに対して、複数の文書を配置した状態で、前記テンプレートの画像を表す画像データを生成する画像生成手段と、
前記画像生成手段により生成された画像データから前記領域マーク各々で特定される前記文書配置領域各々を表す画像データ各々を抽出する文書領域抽出手段と、
前記文書領域抽出手段により抽出された前記画像データ各々の文字認識処理を行うことにより、前記テンプレートに配置された前記複数の文書毎に、該文書に記載された文字を認識する個別文書文字認識手段と
を備えたことを特徴とする複数文書認識システム。
【請求項2】
請求項1に記載の複数文書認識システムに用いられる、複数の文書各々を配置する複数の文書配置領域各々を特定する各領域マークが配置された複数文書認識用テンプレート。
【請求項3】
前記文書配置領域各々を特定する各領域マークは、種類と位置の異なる少なくとも3つの位置マークで構成されていることを特徴とする請求項2に記載の複数文書認識用テンプレート。
【請求項4】
前記位置マークは、貼り付け、剥離及び再貼り付けが可能な貼付部材であることを特徴とする請求項3に記載の複数文書認識用テンプレート。
【請求項5】
前記位置マークは、文書の角を挟むための挟込部を有していることを特徴とする請求項4に記載の複数文書認識用テンプレート。
【請求項6】
前記複数の文書配置領域内には、文書の角を差し込むための差込スリットが設けられていることを特徴とする請求項2又は3に記載の複数文書認識用テンプレート。
【請求項7】
前記複数の文書配置領域はマス目状に配置され、前記複数の文書配置領域各々は透明部材で覆われていることを特徴とする請求項2又は3に記載の複数文書認識用テンプレート。
【請求項8】
少なくとも3つの角に異なるマークを有する文書を複数配置した状態で、複数の前記文書を含む全体領域の画像を表す画像データを生成する画像生成手段と、
前記画像生成手段により生成された画像データから、前記マークで特定される、前記複数の文書各々が配置された領域各々を表す画像データ各々を抽出する文書領域抽出手段と、
前記文書領域抽出手段により抽出された前記画像データ各々の文字認識処理を行うことにより、前記複数の文書毎に、該文書に記載された文字を認識する個別文書文字認識手段と
を備えたことを特徴とする複数文書認識システム。
【請求項9】
前記文書は会計伝票であり、
勘定科目と該勘定科目に関連するキーワードとを対応付けて記憶する勘定科目記憶手段と、
前記複数の文書各々に記載された文字と前記勘定科目記憶手段に記憶されたキーワードとを比較することにより、前記文書各々に対応する勘定科目を判定する勘定科目判定手段と、
前記文書各々について、前記文書に記載された文字の少なくとも一部で表される日付及び金額と前記勘定科目判定手段により判定された前記文書の勘定科目とを対応付けて、会計データを作成する会計データ作成手段と
を備えたことを特徴とする請求項1又は8に記載の複数文書認識システム。
【請求項10】
複数の文書各々を配置する複数の文書配置領域各々を特定するための領域マーク各々が配置されたテンプレートに対して、複数の文書を配置した状態で、前記テンプレートの画像を表す画像データを生成する画像生成ステップと、
前記画像生成ステップにおいて生成された画像データから前記領域マーク各々で特定される前記文書配置領域各々を表す画像データ各々を抽出する文書領域抽出ステップと、
前記文書領域抽出ステップにおいて抽出された前記画像データ各々の文字認識処理を行うことにより、前記テンプレートに配置された前記複数の文書毎に、該文書に記載された文字を認識する個別文書文字認識ステップと
を備えたことを特徴とする複数文書認識方法。
【請求項11】
少なくとも3つの角に異なるマークを有する文書を複数配置した状態で、複数の前記文書を含む全体領域の画像を表す画像データを生成する画像生成ステップと、
前記画像生成ステップにおいて生成された画像データから、前記マークで特定される、前記複数の文書各々が配置された領域各々を表す画像データ各々を抽出する文書領域抽出ステップと、
前記文書領域抽出ステップにおいて抽出された前記画像データ各々の文字認識処理を行うことにより、前記複数の文書毎に、該文書に記載された文字を認識する個別文書文字認識ステップと
を備えたことを特徴とする複数文書認識方法。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【公開番号】特開2013−105383(P2013−105383A)
【公開日】平成25年5月30日(2013.5.30)
【国際特許分類】
【出願番号】特願2011−249790(P2011−249790)
【出願日】平成23年11月15日(2011.11.15)
【出願人】(505004444)
【Fターム(参考)】
【公開日】平成25年5月30日(2013.5.30)
【国際特許分類】
【出願日】平成23年11月15日(2011.11.15)
【出願人】(505004444)
【Fターム(参考)】
[ Back to top ]