複数文書認識システム、複数文書認識用テンプレート及び複数文書認識方法

【課題】複数の任意の文書の文字認識処理を容易かつ効率的に行うことを可能とする複数文書認識システム、これに用いられる複数文書認識用テンプレート及び複数文書認識方法を提供する。
【解決手段】複数文書認識システム１は、複数の文書２０各々を配置する複数の文書配置領域１２各々を特定するための領域マーク各々が配置されたテンプレート１０に対して、複数の文書２０を配置した状態で、前記テンプレート１０の画像を表す画像データを生成する画像生成手段１０１と、画像生成手段１０１により生成された画像データから領域マーク各々で特定される文書配置領域１２各々を表す画像データ各々を抽出する文書領域抽出手段１０２と、文書領域抽出手段１０２により抽出された画像データ各々の文字認識処理を行うことにより、テンプレート１０に配置された複数の文書２０毎に、各文書２０に記載された文字を認識する個別文書文字認識手段１０３とを備える。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、複数の文書に記載されている文字を文書毎に認識する複数文書認識システム、これに用いられる複数文書認識用テンプレート及び複数文書認識方法に関する。
【背景技術】
【０００２】
従来、営業活動に伴って対価の支払いや請求が発生した場合、請求書、領収証等の会計伝票を発行することが行われている。事業者は、この会計伝票の日付、金額、請求先、支払先等の情報をコンピュータに入力して、金銭の収支を管理したり会計資料を作成する必要があった。領収証は台紙に貼り付けられ、証拠資料として保管されている。
【０００３】
また、従来、顧客データや取引先の担当者を管理するために、名刺に記載されている会社名、住所、氏名等の情報をコンピュータに入力することが行われている。名刺に記載されている情報を入力する担当者は、１枚ずつ名刺を見ながら、名刺に表示されている情報をコンピュータに入力する必要があった。
【０００４】
このような各種データの入力作業の負担を軽減するために、近年、領収証や名刺等の文書を１枚ずつスキャナで読み取ったりカメラで撮影することにより、画像データを生成し、当該生成した画像データの文字認識処理をコンピュータに行わせて、当該文字認識処理により認識した文字をテキストデータとして保存することが行われている。
【０００５】
しかしながら、会計伝票や名刺を１枚ずつスキャンしたり撮影していたのでは手間がかかるため、文書の画像データを効率的に生成するために、複数の文書を一度にスキャンすることが行われている（例えば、特許文献１、２参照）。特許文献１には、原稿台に無作為に置かれたサイズや種類の異なる複数の帳票を一度にスキャンした画像から、各帳票の画像部分を抽出する技術が記載されている。具体的には、特許文献１に記載の画像処理装置は、スキャンした画像上の直線を抽出し、当該抽出された直線のうち任意の直線に対して平行又は直角になる直線を抽出し、当該抽出した直線よりなる抽出直線画像から所定の矩形領域を抽出し、当該所定の矩形領域と、予め登録された、帳票構造を直線のみでパターン化した複数の帳票パターンとを比較して、一致する矩形領域の画像を１つの帳票画像として抽出している。
また、特許文献２には、枠線と文字を含む画像の枠線の構造を自動的に認識し、帳票内に記入されている文字領域を切り出すことが記載されている。
【先行技術文献】
【特許文献】
【０００６】
【特許文献１】特開２００８−１６７００９号公報
【特許文献２】特開平８−２１２２９２号公報
【発明の概要】
【発明が解決しようとする課題】
【０００７】
特許文献１に記載の技術では、帳票種別毎に帳票パターンを登録しておく必要があるが、領収証や請求書等の会計伝票は発行元によってレイアウトが様々であるため、全ての帳票のテンプレートを作成するのは困難である。また、特許文献１では、帳票に直線が引かれていることが前提となっているため、直線が引かれていない帳票には適用することができない。
【０００８】
また、特許文献２についても、予め帳票の標準の枠罫線構造を登録しておく必要がある。また、帳票に枠線が引かれていることが前提となっているため、枠線が引かれていない帳票には適用することができない。また、複雑なロジックで帳票の枠線を認識する必要がある。
【０００９】
本発明は、上述した問題点を解決するためになされたものであり、複数の任意の文書の文字認識処理を容易かつ効率的に行うことを可能とする複数文書認識システム、これに用いられる複数文書認識用テンプレート及び複数文書認識方法を提供することを目的とする。
【課題を解決するための手段】
【００１０】
上記目的の少なくとも１つを達成するために、本発明に係る複数文書認識システムは、複数の文書各々を配置する複数の文書配置領域各々を特定するための領域マーク各々が配置されたテンプレートに対して、複数の文書を配置した状態で、前記テンプレートの画像を表す画像データを生成する画像生成手段と、前記画像生成手段により生成された画像データから前記領域マーク各々で特定される前記文書配置領域各々を表す画像データ各々を抽出する文書領域抽出手段と、前記文書領域抽出手段により抽出された前記画像データ各々の文字認識処理を行うことにより、前記テンプレートに配置された前記複数の文書毎に、該文書に記載された文字を認識する個別文書文字認識手段とを備えたことを特徴とする。
【００１１】
本発明によれば、複数文書認識システムは、複数の文書各々を配置する複数の文書配置領域各々を特定するための領域マーク各々が配置されたテンプレートに対して、複数の文書を配置した状態で、前記テンプレートの画像を表す画像データを生成するため、複数の各文書を各文書配置領域に配置しておけば、生成した画像データから領域マークを認識して、文書配置領域を容易に特定することができるため、複数の任意の文書の文字認識処理を容易かつ効率的に行うことが可能となる。
【００１２】
また、本発明に係る複数文書認識用テンプレートは、上記複数文書認識システムに用いられ、複数の文書各々を配置する複数の文書配置領域各々を特定する各領域マークが配置されていることを特徴とする。
【００１３】
本発明によれば、複数の文書各々を配置する複数の文書配置領域各々を特定する領域マークが配置されている複数文書認識用テンプレートに複数の文書を配置することで、複数の任意の文書の文字認識処理を容易かつ効率的に行うことが可能となる。
【００１４】
上記発明において、前記文書配置領域各々を特定する各領域マークは、種類と位置の異なる少なくとも３つの位置マークで構成されていることを特徴とする。
本発明によれば、種類と位置の異なる少なくとも３つの位置マークで文書配置領域各々を特定する領域マークを構成することで、領域マークを枠線等で構成する場合に比較して、領域マーク印刷用のインクを節約することができ、また、領域マーク作成用の材料費を節約することができ、コストを削減することができる。
【００１５】
上記発明において、前記位置マークは、貼り付け、剥離及び再貼り付けが可能な貼付部材であることを特徴とする。
本発明によれば、文書のサイズに合わせて、テンプレートに対する位置マークの貼り付け場所を変更することができる。
【００１６】
上記発明において、前記位置マークは、文書の角を挟むための挟込部を有していることを特徴とする。
本発明によれば、挟込部に文書の角を挟むことで、文書が移動するのを防止することができる。
【００１７】
上記発明において、前記複数の文書配置領域内には、文書の角を差し込むための差込スリットが設けられていることを特徴とする。
本発明によれば、差込スリットに文書の角を挟むことで、文書が移動するのを防止することができる。
【００１８】
上記発明において、前記複数の文書配置領域はマス目状に配置され、前記複数の文書配置領域各々は透明部材で覆われていることを特徴とする。
本発明によれば、文書を文書配置領域に配置して透明部材で覆うことで、文書が移動するのを防ぐことができるとともに、文書を透明部材で覆った状態で保管することができる。
【００１９】
また、本発明に係る複数文書認識システムは、少なくとも３つの角に異なるマークを有する文書を複数配置した状態で、複数の前記文書を含む全体領域の画像を表す画像データを生成する画像生成手段と、前記画像生成手段により生成された画像データから、前記マークで特定される、前記複数の文書各々が配置された領域各々を表す画像データ各々を抽出する文書領域抽出手段と、前記文書領域抽出手段により抽出された前記画像データ各々の文字認識処理を行うことにより、前記複数の文書毎に、該文書に記載された文字を認識する個別文書文字認識手段とを備えたことを特徴とする。
【００２０】
本発明によれば、複数文書認識システムは、少なくとも３つの角に異なるマークが表示された文書を複数配置した状態で、複数の前記文書を含む全体領域の画像を表す画像データを生成することで、当該画像データから容易にマークを認識することができるため、各文書が配置された領域を容易に認識することができ、複数の任意の文書の文字認識処理を容易かつ効率的に行うことが可能となる。
【００２１】
上記発明において、前記文書は会計伝票であり、勘定科目と該勘定科目に関連するキーワードとを対応付けて記憶する勘定科目記憶手段と、前記複数の文書各々に記載された文字と前記勘定科目記憶手段に記憶されたキーワードとを比較することにより、前記文書各々に対応する勘定科目を判定する勘定科目判定手段と、前記文書各々について、前記文書に記載された文字の少なくとも一部で表される日付及び金額と前記勘定科目判定手段により判定された前記文書の勘定科目とを対応付けて、会計データを作成する会計データ作成手段とを備えたことを特徴とする。
本発明によれば、会計伝票の画像データから会計データを自動的に作成することができる。
【００２２】
また、本発明に係る複数文書認識方法は、複数の文書各々を配置する複数の文書配置領域各々を特定するための領域マーク各々が配置されたテンプレートに対して、複数の文書を配置した状態で、前記テンプレートの画像を表す画像データを生成する画像生成ステップと、前記画像生成ステップにおいて生成された画像データから前記領域マーク各々で特定される前記文書配置領域各々を表す画像データ各々を抽出する文書領域抽出ステップと、前記文書領域抽出ステップにおいて抽出された前記画像データ各々の文字認識処理を行うことにより、前記テンプレートに配置された前記複数の文書毎に、該文書に記載された文字を認識する個別文書文字認識ステップとを備えたことを特徴とする。
【００２３】
本発明に係る文書認識方法によれば、複数の文書各々を配置する複数の文書配置領域各々を特定するための領域マーク各々が配置されたテンプレートに対して、複数の文書を配置した状態で、前記テンプレートの画像を表す画像データを生成し、生成した画像データから領域マークを認識することで、文書が配置された文書配置領域を容易に特定することができるため、複数の任意の文書の文字認識処理を容易かつ効率的に行うことが可能となる。
【００２４】
また、本発明に係る複数文書認識方法は、少なくとも３つの角に異なるマークを有する文書を複数配置した状態で、複数の前記文書を含む全体領域の画像を表す画像データを生成する画像生成ステップと、前記画像生成ステップにおいて生成された画像データから、前記マークで特定される、前記複数の文書各々が配置された領域各々を表す画像データ各々を抽出する文書領域抽出ステップと、前記文書領域抽出ステップにおいて抽出された前記画像データ各々の文字認識処理を行うことにより、前記複数の文書毎に、該文書に記載された文字を認識する個別文書文字認識ステップとを備えたことを特徴とする。
【００２５】
本発明に係る複数文書認識方法によれば、少なくとも３つの角に異なるマークが表示された文書を複数配置した状態で、複数の前記文書を含む全体領域の画像を表す画像データを生成して、当該画像データからマークを認識することで、各文書が配置された領域を容易に認識することができるため、複数の任意の文書の文字認識処理を容易かつ効率的に行うことが可能となる。
【発明の効果】
【００２６】
本発明によれば、複数文書認識システムは、複数の文書各々を配置する複数の文書配置領域各々を特定するための領域マーク各々が配置されたテンプレートに対して、複数の文書を配置した状態で、前記テンプレートの画像を表す画像データを生成するため、複数の各文書を各文書配置領域に配置しておけば、生成した画像データから領域マークを認識し、文書が配置された文書配置領域を容易に特定することができるため、複数の任意の文書の文字認識処理を容易かつ効率的に行うことが可能となる。
【図面の簡単な説明】
【００２７】
【図１】本発明の第１実施形態に係る複数文書認識システムの機能構成を示すブロック図である。
【図２】同実施形態に係るテンプレートに文書が配置された状態の一例を示す図である。
【図３】同実施形態に係るテンプレートの一例を示す図である。
【図４】変形例に係るテンプレートの一例を示す図である。
【図５】変形例に係るテンプレートの一例を示す図である。
【図６】変形例に係るテンプレートの一例を示す図である。
【図７】勘定科目ＤＢのデータ構成の一例を示す図である。
【図８】同実施形態に係る複数文書認識システムが行う複数文書認識処理の手順を示すフローチャートである。
【図９】第２実施形態に係る複数文書認識システムが認識する、複数の文書が配置された台紙の一例を示す図である。
【図１０】文書の種類の変形例を示す図である。
【発明を実施するための形態】
【００２８】
以下、本発明を実施するための形態を、図面を参照して詳細に説明する。
（第１実施形態）
図１は、本発明の第１実施形態に係る複数文書認識システム１全体の機能構成を示すブロック図である。同図に示すように、複数文書認識システム１は、画像生成手段１０１と、文書領域抽出手段１０２と、個別文書文字認識手段１０３と、勘定科目判定手段１０４と、会計データ作成手段１０５と、勘定科目ＤＢ（Data Base）１０６とを備えている。
【００２９】
なお、複数文書認識システム１が備えるこれらの機能は、１つの装置に配置してもよいし、複数の装置に分散して配置してもよい。複数の装置に分散して配置する場合には、画像生成手段１０１をＯＣＲ（Optical Character Recognition）装置、スキャナ、カメラ等が備え、その他の機能をパーソナルコンピュータが備えるようにしてもよい。或いは、１つの装置が画像生成手段１０１を備え、別の装置が文書領域抽出手段１０２と個別文書文字認識手段１０３とを備え、もう１つの別の装置が勘定科目判定手段１０４と会計データ作成手段１０５とを備えていてもよい。或いは、１つの装置が画像生成手段１０１と文書領域抽出手段１０２と個別文書文字認識手段１０３とを備え、別の装置が勘定科目判定手段１０４と会計データ作成手段１０５とを備えていてもよい。
【００３０】
画像生成手段１０１は対象物の画像を生成する。画像生成手段１０１としては、イメージスキャナやカメラを用いることができる。画像生成手段１０１としてスキャナを用いる場合には、スキャナの照明部が対象物の表面を走査しつつ当該対象物に光を照射し、スキャナのセンサが対象物からの反射光を検知して画像データを生成する。また、画像生成手段１０１としてカメラを用いる場合には、カメラのレンズが対象物の光を集めて撮像素子に結像させ、当該撮像素子を構成する複数の受光素子毎に光を電気信号に変化させることで、画像データを生成する。
【００３１】
本実施形態では、画像データの生成対象となる「対象物」として、図２に示すテンプレート１０を用いる。図２は、図３に示すテンプレート１０に対して、領収証、納品書、請求書等の複数の文書２０を配置したものである。
【００３２】
テンプレート１０は、その上に複数の文書２０を配置できる２次元空間を有するものであれば、材質は何であってもよい。例えば、材質は、紙であってもよいし、プラスチックであってもよいし、樹脂であってもよい。テンプレート１０上には、図３に示すように、文書配置領域１２を特定するための位置マークＳ、Ｌ、Ｒが設けられている。この位置マークＳ、Ｌ、Ｒの裏面（不図示）には、例えば両面テープや磁石が設けられており、テンプレート１０に対する貼り付け、剥離及び再貼り付けが可能となっている。位置マークＳは表面に絵文字「Ｓ」が表示されており、位置マークＬは表面に絵文字「Ｌ」が表示されており、位置マークＲは表面に絵文字「Ｒ」が表示されている。これにより、３つの位置マークＳ、Ｌ、Ｒは、画像認識処理により区別できるようになっている。なお、３つの位置マークＳ、Ｌ、Ｒの表面に表示するものは絵文字に限定されることはなく、互いに区別可能なものであれば何でもよい。また、位置マークＳ、Ｌ、Ｒの表面には、文書２０の角を挟むための挟込部２２が設けられている。当該位置マークＳ、Ｌ、Ｒは、貼り付け、剥離、再貼り付けが可能な貼付部材であるため、文書２０のサイズに合わせて位置マークＳ、Ｌ、Ｒを移動し、文書２０の角を挟込部２２に挟むことができるように調整可能である。
【００３３】
これらの３つの位置マークＳ、Ｌ、Ｒは、１つの文書２０を配置する文書配置領域１２を特定するための「領域マーク」を構成する。文書配置領域１２を矩形とした場合、位置マークＳは文書配置領域１２の左上を表し、位置マークＬは文書配置領域１２の左下の位置を表し、位置マークＲは文書配置領域１２の右下を表す。また、文書配置領域１２の右上の位置は、２つの位置マークＳ、Ｌを通る直線１２ａに平行に他の位置マークＲから伸ばした直線１２ｂと、位置マークＬ、Ｒを通る直線１２ｃに平行に他の位置マークＳから伸ばした直線１２ｄとの交点１４となり、文書配置領域１２を特定するための４つ目の位置は自動的に決定できる。このように、４つの位置マークを使用せずに、３つの位置マークＳ、Ｌ、Ｒによって文書配置領域１２を特定することにより、使用する貼付部材の数を少なくすることができ、コストを削減することができる。
【００３４】
画像生成手段１０１は、テンプレート１０の位置マークＳ、Ｌ、Ｒで特定される各文書配置領域１２に対して複数の文書２０を配置した状態で、テンプレートの画像を表す画像データを生成する。
【００３５】
なお、位置マークＳ、Ｌ、Ｒは貼付部材に限らず、図４に示すように、テンプレート１０Ａ上に「Ｓ」、「Ｌ」、「Ｒ」の絵文字を予めインクで印刷しておいてもよい。この場合にも、位置マークを３つとすることで、位置マークＳ、Ｌ、Ｒを印刷するインクの量を少なくすることができる。
【００３６】
また、図５に示すように、文書配置領域１２内の位置マークＳ、Ｌ、Ｒの近傍それぞれに差込スリット１６を設けてもよい。テンプレート１０Ｂが紙等の薄い部材で形成されている場合には、テンプレート１０Ｂの厚さ方向に貫通する切り込みを入れることで、差込スリット１６を容易に形成することができる。文書配置領域１２に配置する文書２０の少なくとも１つの角を当該差込スリット１６に挟むことで、文書２０が移動するのを防ぐことができる。
【００３７】
また、文書２０として名刺を用いる場合には、図６に示すように、名刺フォルダをテンプレート１０Ｃとして利用してもよい。この場合には、テンプレート１０Ｃ上に位置マークＳ、Ｌ、Ｒで特定される複数の文書配置領域１２がマス目状に配置され、複数の文書配置領域１２各々は透明部材１８で覆われることとなる。この場合、テンプレート１０Ｃは文書２０の保管にも使用することができる。
【００３８】
図１に示す文書領域抽出手段１０２、個別文書文字認識手段１０３、勘定科目判定手段１０４、及び会計データ作成手段１０５は、複数文書認識システム１を構成する装置が備える図示せぬＣＰＵ（Central Processing Unit）がメモリ、ハードディスク等の記憶装置に記憶されたプログラムに従って処理を実行することにより実現される機能である。
【００３９】
文書領域抽出手段１０２は、画像生成手段１０１により生成された画像データから、位置マークＳ、Ｌ、Ｒで構成される領域マーク各々で特定される文書配置領域１２各々を表す画像データ各々を抽出する。
【００４０】
個別文書文字認識手段１０３は、文書領域抽出手段１０２により文書２０毎に抽出された画像データ各々の文字認識処理を行うことにより、テンプレート１０に配置された複数の文書２０毎に、各文書２０に記載された文字を認識する。
【００４１】
文字認識処理の方式としては、公知の技術を用いることができる。例えば、個別文書文字認識手段１０３は、画像データを構成する各画素を白と黒の２値に変換して、画像データの特徴量を抽出する。そして、当該抽出した特徴量と、複数文書認識システム１が備える記憶装置に予め記憶しておいた、文字の種類に応じた特徴量とを比較して、文字の種類を判別し、当該文字の種類に対応するＪＩＳコード等の文字識別コードを決定する。
【００４２】
また、個別文書文字認識手段１０３は、文書２０毎に、認識した複数の各文字の位置関係に基づいて文字間の距離を算出し、当該文字間の距離が所定値以下の文字の集合を文字列と判定する。そして、当該文字列に含まれる文字や配列状態から、文字列の属性（日付、金額等）を判定する。例えば、「年」、「月」、「日」が含まれる文字列は日付、先頭に「￥」が存在する文字列は金額と判定する。
【００４３】
なお、文字認識精度を向上させるために、異なる種類の文字認識用のソフトウェアを記憶装置に記憶させておき、これらの異なるソフトウェアによる異なるロジック各々を用いて文字認識処理を行ってもよい。例えば異なるロジックを３つ用いる場合、２つ以上のロジックによる文字の種類の判定結果が一致した場合に、当該判定結果を採用するようにするとよい。また、金額等の正確性が要求される文字認識処理を行う場合には、文字の種類の判定結果が全てのロジックで一致しした場合にのみ、当該判定結果を採用するという方式をとればよい。
【００４４】
そして、個別文書文字認識手段１０３は、各文書２０に対応する各画像データから認識した文字や文字列の属性を、文書２０毎に記憶装置に記憶する。
勘定科目判定手段１０４は、複数の文書２０各々に記載された文字と、勘定科目ＤＢ１０６に記憶されたキーワードとを比較することにより、一致するものが存在した場合には、当該文書２０は会計伝票であると判定し、当該会計伝票の勘定科目を判定する。
【００４５】
勘定科目ＤＢ１０６は、複数文書認識システム１が備える記憶装置に設けられたデータベースであり、勘定科目と、当該勘定科目に関連するキーワードと、を対応付けて記憶する。図７には、勘定科目ＤＢ１０６のデータ構成の一例を示す。例えば、領収証に「郵便料金」と記載されている場合には、その領収証に記載されている金額の勘定科目を「通信費」とする場合が多いため、図７に示すように、勘定科目「通信費」に対応付けられて、キーワード「領収証」と「郵便料金」が記憶されている。
【００４６】
また、領収証に「書籍代」と記載されている場合には、その領収証に記載されている金額の勘定科目を「新聞図書費」とする場合が多いため、図７に示すように、勘定科目ＤＢ１０６には、勘定科目「新聞図書費」に対応付けられて、キーワード「領収証」と「書籍代」が記憶されている。
【００４７】
また、領収証に「飲食代」と記載されており、一人当たりの金額が５，０００円未満の場合には、その領収証に記載されている金額の勘定科目を「会議費」とする場合が多いため、図７に示すように、勘定科目ＤＢ１０６には、勘定科目「会議費」に対応付けられて、キーワード「領収証」、「飲食代」と、一人当たりの金額「５，０００円未満」が記憶されている。
【００４８】
また、領収証に「飲食代」と記載されており、一人当たりの金額が５，０００円以上の場合には、その領収証に記載されている金額の勘定科目を「交際接待費」とする場合が多いため、図７に示すように、勘定科目ＤＢ１０６には、勘定科目「交際接待費」に対応付けられて、キーワード「領収証」、「飲食代」と、一人当たりの金額「５，０００円以上」が記憶されている。
【００４９】
勘定科目判定手段１０４は、複数の文書２０各々に記載された文字と勘定科目ＤＢ１０６に記憶されたキーワードとを比較した結果、「領収証」と「飲食代」が一致した場合には、一人当たりの金額が勘定科目ＤＢ１０６の「一人当たりの金額」に該当するか否かを判定する。領収証に人数が記載してあった場合には、勘定科目判定手段１０４は、領収証に記載された金額を人数で除算することにより、一人当たりの金額を算出する。そして、勘定科目判定手段１０４は、一人当たりの金額が５，０００円未満である場合には勘定科目が会議費であると判定し、一人当たりの金額が５，０００円以上である場合には勘定科目が交際接待費であると判定する。一人当たりの金額が判定できなかった場合には、勘定科目が会議費又は交際接待費であると判定する。
【００５０】
なお、「領収書」と記載されている文書２０についても「領収証」と記載されているものと同様に勘定科目を判定できるように、「領収証」というキーワードを「領収」に変更してもよいし、「領収書」というキーワードを勘定科目ＤＢ１０６に追加してもよい。
【００５１】
会計データ作成手段１０５は、当該会計伝票に記載された文字の少なくとも一部で表される日付及び金額と、勘定科目判定手段１０４により判定された当該会計伝票の勘定科目とを対応付けて、会計データを作成する。このようにして作成された会計データは、総勘定元帳等の会計用の帳票を作成する際の元データとして利用することができる。
【００５２】
なお、勘定科目を判定できなかったもの、勘定科目が誤って判定されたもの、一人当たりの金額を算出できずに勘定科目が会議費又は交際接待費と判定されたもの、会計伝票でないにも関わらず勘定科目が判定されたもの等は、会計データ作成手段１０５により作成された会計データの勘定科目をユーザがユーザインターフェースを介してチェックして、キーボード等を用いて修正するようにすればよい。
【００５３】
次に、図８に示すフローチャートを参照して、複数文書認識システム１が行う複数文書認識処理について説明する。ここでは、画像生成手段１０１としてスキャナを使用する場合について説明する。
【００５４】
まず、ユーザは、図２に示すような、複数の文書２０が配置されたテンプレート１０を画像生成手段１０１の読取部に置き、当該テンプレート１０をスキャンさせるための操作を行う。
これにより、画像生成手段１０１は、テンプレート１０のうち文書２０が配置された面を走査して、テンプレート１０を光学的に読み取り、画像データを生成する（ステップＳ１１）。
【００５５】
文書領域抽出手段１０２は、画像生成手段１０１により生成された画像データの認識処理を行うことにより、複数の位置マークＳ、Ｌ、Ｒを判別する。そして、当該位置マークＳ、Ｌ、Ｒから複数の文書配置領域１２各々を特定し、当該判定された複数の文書配置領域１２各々を表す画像データ各々を抽出する（ステップＳ１２）。
【００５６】
次に、個別文書文字認識手段１０３は、文書領域抽出手段１０２により抽出された画像データ各々の文字認識処理を行うことにより、テンプレート１０に配置された複数の文書２０毎に各文書２０に記載された文字を認識する。また、個別文書文字認識手段１０３は、各文書２０に記載された文字について、当該文字同士の距離から文字列を判別し、当該文字列の属性（日付、金額等）等を認識する（ステップＳ１３）。そして、文書２０毎の文字の認識結果を記憶装置に記録する。
【００５７】
次に、勘定科目判定手段１０４は、各文書２０に記載された文字と、勘定科目ＤＢ１０６に記憶されたキーワードとを比較することにより、各文書２０の勘定科目を判定する（ステップＳ１４）。なお、文書２０に記載された文字の中に、勘定科目ＤＢ１０６に記憶されたキーワードに一致するものが存在しなかった場合は、文書２０が会計伝票でないか、会計伝票であってもキーワードが勘定科目ＤＢ１０６に記憶されていない場合であるので、判定不能とする。
【００５８】
次に、会計データ作成手段１０５は、ステップＳ１４で文書２０の勘定科目を判定することができた場合には、文書２０に記載された日付及び金額と、当該文書２０の勘定科目とを対応付けて、会計データを作成する（ステップＳ１５）。
【００５９】
以上説明したように、電子データ化すべき文書２０が複数ある場合に、それぞれの文書２０を個別にスキャンしなくても、また、文書２０に直線や枠が引かれていなくても、各文書配置領域１２に文書２０が配置された１枚のテンプレート１０を１回スキャンして、テンプレート１０の画像データを生成することで、文書領域抽出手段１０２は当該画像データから容易に位置マークＳ、Ｌ、Ｒを認識し、複数の文書配置領域１２各々を容易に特定することができるため、複数の任意の文書２０の文字認識処理を容易かつ効率的に行うことが可能となる。また、文書２０が会計伝票である場合には、会計データを自動的に作成することができる。
【００６０】
なお、上述した実施形態は一例に過ぎず、本発明の技術思想の範囲で種々な変形が可能である。例えば、上述した動作例では、画像生成手段１０１としてスキャナを用いたが、画像データを生成できるものであればよく、例えばカメラを用いてもよい。このカメラは、携帯電話機や情報通信端末に内蔵されたものであってもよい。この場合、画像生成手段１０１は、ユーザ操作による撮影指示を受けると、テンプレート１０における複数の文書２０が配置された領域を１回撮影して、画像データを生成する。画像生成手段１０１は、当該生成した画像データを、有線又は無線を介して、文書領域抽出手段１０２を備えた装置に送信する。
【００６１】
なお、画像生成手段１０１としてカメラを用いた場合には、テンプレート１０や文書２０が斜め方向から撮影されて、画像データに傾きや歪みが生じる場合がある。このような場合に対処するために、個別文書文字認識手段１０３に対して、画像データの傾きや歪みを除去する機能を設けてもよい。具体的には、個別文書文字認識手段１０３は、画像生成手段１０１により生成された画像データから抽出した文字列の傾きとカメラの焦点距離とに基づいて、画像データの変換処理を実行することにより、画像データの傾きや歪みを除去する。画像データの傾きや歪みを除去した後、画像データの文字認識処理を行うことにより、文字認識の精度を向上させることができる。
【００６２】
また、上述した実施形態では、文字認識処理を行う文書２０として領収証、納品書、請求書を例示したが、これらに限定されることはなく、例えば図１０に示すように、本、雑誌、パンフレット、新聞の切り抜き等を文書２０として用いてもよいし、さらには、名刺、社内文書、契約書、受領書等、文字が記載されているあらゆるものを文書２０として用いることができる。
【００６３】
また、上述した実施形態では、文書２０にキーワード「領収証」が記載されていることにより文書２０が領収証であることを判別したが、文書２０の種別の判定方法はこれに限定されることはなく、例えば、予め登録しておいた文書の輪郭や特徴量と、判定対象となる文書２０の輪郭や特徴量とを比較してもよい。
【００６４】
（第２実施形態）
次に、本発明の第２実施形態について説明する。上述した第１実施形態では、テンプレート１０に対して位置マークＳ、Ｌ、Ｒで構成される領域マークを配置して、文書配置領域１２を容易に識別できるようにしたが、第２実施形態では、領域マークを有するテンプレート１０を用いずに、図９に示すように、文書２０Ａ自体の３つの角に異なる位置マークを予め印刷しておく。或いは、位置マークを手書きしてもよい。この位置マークは、第１実施形態と同様の位置マークＳ、Ｌ、Ｒを用いればよい。そして、この複数の文書２０Ａは、台紙３０などに貼り付けておけばよい。
【００６５】
画像生成手段１０１は、当該位置マークＳ、Ｌ、Ｒを有する文書２０Ａを複数配置した状態で、当該複数の文書２０Ａの全体領域の画像を表す画像データを生成する。その他の構成は第１実施形態と同様であるため、重複した説明を省略する。
【符号の説明】
【００６６】
１………複数文書認識システム、１０、１０Ａ、１０Ｂ、１０Ｃ………テンプレート、１２ａ、１２ｂ、１２ｃ、１２ｄ………直線、１４………交点、１６………差込スリット、１８………透明部材、１０１………画像生成手段、１０２………文書領域抽出手段、１０３………個別文書文字認識手段、１０４………勘定科目判定手段、１０５………会計データ作成手段、１０６………勘定科目ＤＢ、２０、２０Ａ………文書、３０………台紙。

【特許請求の範囲】
【請求項１】
複数の文書各々を配置する複数の文書配置領域各々を特定するための領域マーク各々が配置されたテンプレートに対して、複数の文書を配置した状態で、前記テンプレートの画像を表す画像データを生成する画像生成手段と、
前記画像生成手段により生成された画像データから前記領域マーク各々で特定される前記文書配置領域各々を表す画像データ各々を抽出する文書領域抽出手段と、
前記文書領域抽出手段により抽出された前記画像データ各々の文字認識処理を行うことにより、前記テンプレートに配置された前記複数の文書毎に、該文書に記載された文字を認識する個別文書文字認識手段と
を備えたことを特徴とする複数文書認識システム。
【請求項２】
請求項１に記載の複数文書認識システムに用いられる、複数の文書各々を配置する複数の文書配置領域各々を特定する各領域マークが配置された複数文書認識用テンプレート。
【請求項３】
前記文書配置領域各々を特定する各領域マークは、種類と位置の異なる少なくとも３つの位置マークで構成されていることを特徴とする請求項２に記載の複数文書認識用テンプレート。
【請求項４】
前記位置マークは、貼り付け、剥離及び再貼り付けが可能な貼付部材であることを特徴とする請求項３に記載の複数文書認識用テンプレート。
【請求項５】
前記位置マークは、文書の角を挟むための挟込部を有していることを特徴とする請求項４に記載の複数文書認識用テンプレート。
【請求項６】
前記複数の文書配置領域内には、文書の角を差し込むための差込スリットが設けられていることを特徴とする請求項２又は３に記載の複数文書認識用テンプレート。
【請求項７】
前記複数の文書配置領域はマス目状に配置され、前記複数の文書配置領域各々は透明部材で覆われていることを特徴とする請求項２又は３に記載の複数文書認識用テンプレート。
【請求項８】
少なくとも３つの角に異なるマークを有する文書を複数配置した状態で、複数の前記文書を含む全体領域の画像を表す画像データを生成する画像生成手段と、
前記画像生成手段により生成された画像データから、前記マークで特定される、前記複数の文書各々が配置された領域各々を表す画像データ各々を抽出する文書領域抽出手段と、
前記文書領域抽出手段により抽出された前記画像データ各々の文字認識処理を行うことにより、前記複数の文書毎に、該文書に記載された文字を認識する個別文書文字認識手段と
を備えたことを特徴とする複数文書認識システム。
【請求項９】
前記文書は会計伝票であり、
勘定科目と該勘定科目に関連するキーワードとを対応付けて記憶する勘定科目記憶手段と、
前記複数の文書各々に記載された文字と前記勘定科目記憶手段に記憶されたキーワードとを比較することにより、前記文書各々に対応する勘定科目を判定する勘定科目判定手段と、
前記文書各々について、前記文書に記載された文字の少なくとも一部で表される日付及び金額と前記勘定科目判定手段により判定された前記文書の勘定科目とを対応付けて、会計データを作成する会計データ作成手段と
を備えたことを特徴とする請求項１又は８に記載の複数文書認識システム。
【請求項１０】
複数の文書各々を配置する複数の文書配置領域各々を特定するための領域マーク各々が配置されたテンプレートに対して、複数の文書を配置した状態で、前記テンプレートの画像を表す画像データを生成する画像生成ステップと、
前記画像生成ステップにおいて生成された画像データから前記領域マーク各々で特定される前記文書配置領域各々を表す画像データ各々を抽出する文書領域抽出ステップと、
前記文書領域抽出ステップにおいて抽出された前記画像データ各々の文字認識処理を行うことにより、前記テンプレートに配置された前記複数の文書毎に、該文書に記載された文字を認識する個別文書文字認識ステップと
を備えたことを特徴とする複数文書認識方法。
【請求項１１】
少なくとも３つの角に異なるマークを有する文書を複数配置した状態で、複数の前記文書を含む全体領域の画像を表す画像データを生成する画像生成ステップと、
前記画像生成ステップにおいて生成された画像データから、前記マークで特定される、前記複数の文書各々が配置された領域各々を表す画像データ各々を抽出する文書領域抽出ステップと、
前記文書領域抽出ステップにおいて抽出された前記画像データ各々の文字認識処理を行うことにより、前記複数の文書毎に、該文書に記載された文字を認識する個別文書文字認識ステップと
を備えたことを特徴とする複数文書認識方法。

【図１】