説明

情報処理装置、帳票種別推定方法および帳票種別推定用プログラム

【課題】予め書式定義を作成することなく、帳票種別を推定することを課題とする。
【解決手段】帳票の外観上の特徴に係る特徴データを、帳票種別毎に蓄積する特徴データベース31に接続される情報処理装置1に、処理対象帳票の画像データを取得する画像データ取得部21と、画像データから、処理対象帳票に係る特徴データを取得する特徴データ取得部22と、特徴データベース31に蓄積されている特徴データから、処理対象帳票に係る特徴データに一致または類似する特徴データを特定することで、処理対象帳票の帳票種別を推定する推定部24と、推定部24によって処理対象帳票の帳票種別が推定されなかった場合に、処理対象帳票に係る特徴データを特徴データベース31に追加する特徴データ追加部25と、を備えた。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、帳票種別を推定するための情報処理装置、方法およびプログラムに関する。
【背景技術】
【0002】
従来、入力画像データを取得するデータ取得部と、登録画像データまたは登録画像の特徴量を記憶したメモリと、上記入力画像データが上記登録画像に対応する画像データであるか否かの判定処理を行う類似度判定処理部とを備えた画像処理装置であって、類似度判定処理部は、入力画像データの付帯情報に応じて判定処理の処理内容を変更する画像処理装置がある(特許文献1を参照)。
【0003】
また、文書タイプ識別処理部が登録画像の文書タイプの属性(帳票、図面など)を識別し、その属性を画像情報DBに登録し、登録画像を画像DBに登録する画像処理装置であって、文書検索時には、文書タイプにより分類された表示画面を作成して表示デバイスに表示し、ユーザは入力デバイスを使用して表示画面上から「帳票」などのカテゴリを選択し、選択された「帳票」のサムネイル一覧が表示される画像処理装置がある(特許文献2を参照)。その他、帳票等から得られた画像を処理するための技術が種々提案されている(特許文献3から6を参照)。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2008−301476号公報
【特許文献2】特開2008−204184号公報
【特許文献3】国際公開第97/05561号
【特許文献4】特開2000−242855号公報
【特許文献5】特開2009−238217号公報
【特許文献6】特開2007−58626号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
従来、スキャナ等を用いて、紙媒体として発生した帳票の画像データを生成して帳票の種別を識別し、OCR(Optical Character Recognition)処理を行う技術がある。このような技術では、帳票の種別を識別し、OCR処理を行うために、全ての帳票の種別について、帳票種別毎に予め書式定義(帳票定義)を作成しておく必要があった。
【0006】
しかし、このような書式定義の作成は難しく、書式定義を予め作成するには、帳票種別の識別サービスの利用者または提供者に手間をかけるものであった。
【0007】
本発明は、上記した問題に鑑み、予め書式定義を作成することなく、帳票種別を推定することを課題とする。
【課題を解決するための手段】
【0008】
本発明では、上記課題を解決するために、以下の手段を採用した。即ち、本発明は、帳票の外観上の特徴に係る特徴データを、帳票種別毎に蓄積する特徴データ蓄積手段に接続される情報処理装置であって、処理対象帳票の画像データを取得する画像データ取得手段と、前記画像データから、前記処理対象帳票に係る特徴データを取得する特徴データ取得手段と、前記特徴データ蓄積手段に蓄積されている特徴データから、前記処理対象帳票に
係る特徴データに一致または類似する特徴データを特定することで、該処理対象帳票の帳票種別を推定する推定手段と、前記推定手段によって前記処理対象帳票の帳票種別が推定されなかった場合に、該処理対象帳票に係る特徴データを前記特徴データ蓄積手段に追加する特徴データ追加手段と、を備える情報処理装置である。
【0009】
ここで、帳票種別とは、帳票の外観から区別可能な帳票の種類である。特徴データ蓄積手段は、このような帳票種別を推定可能とするために、帳票の外観上の特徴に係る特徴データを、帳票種別毎に蓄積する。特徴データ蓄積手段によって蓄積され、または特徴データ取得手段によって取得される特徴データとしては、例えば、罫線、罫線の数、特徴点、特徴点の数、色情報(色具合)、およびこれらに関連する画像の特徴量が含まれてよい。また、特徴データは、帳票の外観に基づいて取得可能な情報であればよく、先述の具体例に限定されない。
【0010】
本発明によれば、推定手段によって、処理対象帳票の帳票種別が推定され、帳票種別の推定に失敗した場合、特徴データ追加手段によって、処理対象帳票に係る特徴データが特徴データ蓄積手段に追加されることで、帳票種別の推定、および学習が可能となる。
【0011】
また、前記特徴データ追加手段は、前記推定手段によって前記処理対象帳票の帳票種別が推定されなかった場合に、該処理対象帳票に係る特徴データを、新たな帳票種別に係る特徴データとして前記特徴データ蓄積手段に追加してもよい。
【0012】
帳票種別の推定に失敗した場合に、処理対象帳票に係る特徴データを、新たな帳票種別に係る特徴データとして特徴データ蓄積手段に追加することで、以後の帳票種別推定において、学習された帳票データを用いることが可能となる。
【0013】
また、前記情報処理装置は、前記特徴データ蓄積手段に蓄積されている特徴データから、該特徴データに含まれる所定のパラメータが、前記画像データから取得された所定のパラメータを基準とする所定の範囲内にある1または複数の特徴データを抽出する抽出手段を更に備え、前記推定手段は、前記抽出手段によって抽出された特徴データから、前記処理対象帳票に係る特徴データに一致または類似する特徴データを特定することで、該処理対象帳票の帳票種別を推定してもよい。
【0014】
即ち、抽出手段によって第一段階の絞り込みが行われ、推定手段によって第二段階の絞り込みが行われる。この際、何れかの段階における絞り込み手法を、他の段階における絞り込み手法に比べて負荷の軽いものとすることで、帳票種別推定に係る全体の負荷を軽減し、処理を高速化することが出来る。特に、絞り込みの対象となる母数が大きい第一段階の絞り込みにおいて、インデックス検索等の比較的負荷の軽い絞り込み手法を採用し、第二段階の絞り込みにおいて、最近傍探索等の比較的正確性の高い絞り込み手法を採用することで、処理速度を損なうことなく、正確性の高い帳票種別推定を行うことが可能となる。なお、絞り込み処理のステージは、二段階に限定されない。絞り込み処理は、三段階以上のステージに分割されて実行されてもよい。
【0015】
また、前記所定のパラメータは、前記画像データから取得された特徴点の数を特定可能な情報を含み、前記抽出手段は、前記特徴データ蓄積手段に蓄積されている特徴データから、該特徴データに含まれる特徴点の数が、前記画像データから取得された特徴点の数を基準とする所定の範囲内にある1または複数の特徴データを抽出してもよい。
【0016】
また、前記所定のパラメータは、前記画像データから取得された罫線の数を特定可能な情報を含み、前記抽出手段は、前記特徴データ蓄積手段に蓄積されている特徴データから、該特徴データに含まれる罫線の数が、前記画像データから取得された罫線の数を基準と
する所定の範囲内にある1または複数の特徴データを抽出してもよい。
【0017】
ここで、所定のパラメータは、特徴点の数または罫線の数を特定可能な情報を含んでいればよい。即ち、所定のパラメータは、特徴点の数または罫線の数そのものであってもよいし、取得された特徴点または罫線毎の情報であってもよい。所定のパラメータが、取得された特徴点または罫線毎の情報である場合には、この特徴点または罫線毎の情報の数をカウントすることによって、特徴点の数または罫線の数を特定することが出来る。
【0018】
また、前記所定のパラメータは、前記画像データから取得された色具合を特定可能な情報を含み、前記抽出手段は、前記特徴データ蓄積手段に蓄積されている特徴データから、該特徴データに含まれる色具合が、前記画像データから取得された色具合を基準とする所定の範囲内にある1または複数の特徴データを抽出してもよい。
【0019】
ここで、色具合とは、画像データに基づいて取得された、該画像データの色に関する傾向を示す情報である。色具合としては、例えば、RGBカラーヒストグラムを用いることが出来る。
【0020】
また、前記特徴データは、前記画像データから算出された特徴量を含み、前記推定手段は、前記抽出手段によって抽出された特徴データに含まれる特徴量に対して、前記画像データから取得された特徴量を用いた最近傍探索を行うことで、該抽出された特徴データから、前記処理対象帳票に係る特徴データに一致または類似する特徴データを特定し、該処理対象帳票の帳票種別を推定してもよい。
【0021】
また、本発明は、コンピュータによって実行される方法、またはコンピュータに実行させるプログラムとしても把握することが可能である。また、本発明は、そのようなプログラムをコンピュータその他の装置、機械等が読み取り可能な記録媒体に記録したものでもよい。ここで、コンピュータ等が読み取り可能な記録媒体とは、データやプログラム等の情報を電気的、磁気的、光学的、機械的、または化学的作用によって蓄積し、コンピュータ等から読み取ることができる記録媒体をいう。
【発明の効果】
【0022】
本発明によれば、予め書式定義を作成することなく、帳票種別を推定することが可能となる。
【図面の簡単な説明】
【0023】
【図1】実施形態に係る帳票種別検索システムの構成の概略を示す図である。
【図2】実施形態に係るアプリケーションサーバの機能構成の概略を示す図である。
【図3】実施形態に係る特徴データベースに含まれるテーブルAの構成を示す図である。
【図4】実施形態に係る特徴データベースに含まれるテーブルBの構成を示す図である。
【図5】実施形態に係る帳票種別識別・学習処理の流れを示すフローチャートである。
【図6A】実施形態に係る処理対象帳票の画像データの例を示す図である。
【図6B】図6Aに例示した処理対象帳票から抽出された、罫線のみのグレースケール画像の例を示す図である。
【図6C】図6Bに例示した罫線のみのグレースケール画像において、特徴点が抽出された様子を例示する図である。
【発明を実施するための形態】
【0024】
以下、本発明に係る情報処理装置の実施の形態について、図面に基づいて説明する。なお、以下に説明する実施の形態は、本発明を実施する一例を示すものであって、本発明を以下に説明する具体的構成に限定するものではない。本発明を実施するにあたっては、実施の形態に応じた具体的構成が適宜採用されることが好ましい。
【0025】
本実施形態において、本発明に係る情報処理装置は、帳票種別検索システム100において帳票種別検索サービスを提供するアプリケーションサーバ1として実施される。但し、本発明の適用対象は、帳票種別を推定するための情報処理装置であればよく、アプリケーションサーバ1に限定されない。たとえば、情報処理装置は、ユーザ端末9として実施されてもよいし、所謂クラウド等として実施されてもよい。
【0026】
<帳票種別検索システムの構成>
図1は、本実施形態に係る帳票種別検索システム100の構成の概略を示す図である。帳票種別検索システム100は、ユーザ端末9とのインターフェースを提供するためのWebサーバ2と、帳票種別検索サービスを提供するためのアプリケーションサーバ1と、特徴データや画像データ等の各種情報が蓄積されるデータベース3(特徴データベース31および画像データベース32)と、が互いに接続されたシステムである。
【0027】
Webサーバ2は、ユーザ端末9に対して帳票種別検索サービスのためのインターフェースを提供するためのサーバである。本実施形態に係る帳票種別検索システム100において、ユーザは、スキャナ等を用いて作成した帳票の画像データを、Webサーバ2に対して送信する。但し、帳票が初めから画像データとして業務において用いられている場合には、ユーザは、紙媒体のスキャンを行う必要はない。Webサーバ2は、ユーザ端末9から送信された画像データを受け付け、アプリケーションサーバ1に対して送信する。
【0028】
アプリケーションサーバ1は、Webサーバ2を介して、ユーザ端末9から送信された画像データを受信し、後述する帳票種別識別・学習処理を実行する。アプリケーションサーバ1によって帳票種別識別・学習処理が実行されることで、ユーザ端末9から送信された画像データに係る帳票の帳票種別が推定される。そして、アプリケーションサーバ1は、推定結果(画像データに係る帳票の帳票種別)を、Webサーバ2を介してユーザ端末9に送信する。具体的には、アプリケーションサーバ1は、画像データに係る帳票の帳票種別が「AAA社の見積書」であると推定された場合、この推定結果をWebサーバ2に通知し、Webサーバ2は、Webインターフェースを介して、ユーザに対して、「AAA社の見積書です」等のメッセージを通知する。
【0029】
即ち、本実施形態に係る帳票種別検索システム100によれば、ユーザは、帳票の画像データを送信するのみで、当該帳票の帳票種別を知ることが可能となる。更に、このような帳票種別検索システム100を用いることで、帳票種別検索サービスを利用したユーザに対して、「AAA社の見積書なので購買部に送付する」、「BBB社の納品確認書なので受入部門に転送する」等の業務フローを構築したり、「AAA社の見積書です。OCR対応しているのは、CCC社のOCRソフトウェアであり、書式定義はRX0001で、1円/1枚で利用できます」等の付加サービスを提供したりすることが出来る。
【0030】
アプリケーションサーバ1は、CPU(Central Processing Unit)11と、RAM(Random Access Memory)12と、ROM(Read Only Memory)13と、補助記憶装置19と、ネットワークを介した外部との通信を行うためのネットワークインターフェース16と、が電気的に接続された情報処理装置である。
【0031】
但し、情報処理装置の具体的なハードウェア構成に関しては、実施の形態に応じて適宜
構成要素の省略や置換、追加が可能である。例えば、アプリケーションサーバ1には、必要に応じてディスプレイやマウス、キーボード等の入出力装置が接続されてもよい。
【0032】
CPU11は、中央処理装置であり、RAM12およびROM13等に展開された命令及びデータを処理することで、RAM12、補助記憶装置19、入出力装置等の、アプリケーションサーバ1に備えられた各構成を制御する。また、RAM12は、主記憶装置であり、CPU11によって制御され、各種命令やデータが書き込まれ、読み出される。即ち、CPU11、RAM12、およびROM13は、アプリケーションサーバ1の制御部を構成する。
【0033】
補助記憶装置19は、不揮発性の記憶装置であり、主にアプリケーションサーバ1の電源を落としても保持したい情報、例えば、RAM12にロードされるアプリケーションサーバ1のOS(Operating System)や、後述するフローチャートに示された処理を実行するための各種プログラムの他、アプリケーションサーバ1によって使用される各種データが書き込まれ、読み出される。補助記憶装置19としては、例えば、EEPROM(Electrically Erasable Programmable
ROM)やHDD(Hard Disk Drive)等を用いることが出来る。
【0034】
なお、Webサーバ2、データベース3およびユーザ端末9は、アプリケーションサーバ1と同じく、一般的なコンピュータとしての構成であるCPU、RAM、ROM、補助記憶装置、ネットワークインターフェース等を備える(図示は省略する)。また、ユーザ端末9は、例えばパーソナルコンピュータであり、処理対象の帳票の画像データを取得するためのスキャナに接続されていてもよい。
【0035】
図2は、本実施形態に係るアプリケーションサーバ1の機能構成の概略を示す図である。本実施形態に係る情報処理装置は、CPU11が、RAM12に展開された各種プログラムを解釈および実行することで、画像データ取得部21、特徴データ取得部22、抽出部23、推定部24および特徴データ追加部25を備えるアプリケーションサーバ1として機能する。これらの機能部は、夫々、本発明に係る情報処理装置が備える各手段に相当する機能を実行する。また、本実施形態では、これらの機能がいずれも汎用のCPU11によって実行される例について説明しているが、これらの機能は、その一部または全部が、1または複数の専用のプロセッサによって実現されてもよい。
【0036】
画像データ取得部21は、処理対象帳票の画像データを取得する。
【0037】
特徴データ取得部22は、画像データから、処理対象帳票に係る特徴データを取得することで、帳票の画像データの符号化を行う。本実施形態において、特徴データには、罫線、罫線の数、特徴点、特徴点の数、色情報およびこれらの情報から算出された特徴量(例えば、特徴量ベクトル)が含まれる。特徴データ取得の詳細については、フローチャートを用いて後述する。
【0038】
抽出部23は、インデックス検索による第一段階の絞り込みを行う。より具体的には、抽出部23は、特徴データベース31に蓄積されている特徴データから、当該特徴データに含まれる罫線の数、特徴点の数および色具合が、画像データから取得された罫線の数、特徴点の数および色具合を基準とする所定の範囲内にある(即ち、特徴点等のパラメータが近似する)1または複数の特徴データを抽出する。
【0039】
図3および図4は、本実施形態に係る特徴データベース31の構成を示す図である。特徴データベース31は、帳票の外観上の特徴に係る特徴データを、帳票種別(帳票種別ID)毎に蓄積するデータベースであり、本実施形態では、特徴データベース31には、帳
票種別毎に、罫線の数、特徴点の数および色具合(RGBカラーヒストグラム)を保持するテーブルA(図3を参照)と、帳票の画像データに基づいて、罫線、特徴点および色具合について算出された特徴量を、当該帳票の帳票種別(帳票種別ID)に関連づけて保持するテーブルB(図4を参照)とが含まれる。
【0040】
推定部24は、最近傍探索による第二段階の絞り込みを行う。より具体的には、推定部24は、抽出部23によって抽出された特徴データに含まれる特徴量に対して、画像データから取得された特徴量を用いた最近傍探索を行うことで、抽出された特徴データから、処理対象帳票に係る特徴データに一致または類似する特徴データを特定し、処理対象帳票の帳票種別を推定する。但し、帳票種別の推定には、一致または類似する特徴データを特定することが可能な手法であれば、最近傍探索以外の手法が用いられてもよい。
【0041】
特徴データ追加部25は、推定部24によって処理対象帳票の帳票種別が推定されなかった場合に、処理対象帳票に係る特徴データを、新たな帳票種別に係る特徴データとして特徴データベース31に追加する。
【0042】
<処理の流れ>
図5は、本実施形態に係る帳票種別識別・学習処理の流れを示すフローチャートである。本フローチャートに示された処理は、ユーザ端末9から送信された帳票の画像データが、Webサーバ2を介して受信されたことを契機として実行される。但し、本フローチャートに示された処理は予め蓄積された帳票の画像データに対して、バッチ処理されてもよい。なお、本実施形態においてフローチャートを用いて説明される処理の具体的な内容および順序等は、本発明を実施する上での一例である。具体的な処理内容および順序等は、実施の形態に応じて適宜選択されてよい。
【0043】
ステップS101では、画像データが取得される。アプリケーションサーバ1の画像データ取得部21は、ユーザ端末9から送信された、処理対象帳票の画像データを、Webサーバ2を介して取得する。その後、処理はステップS102へ進む。
【0044】
ステップS102では、罫線が抽出される。アプリケーションサーバ1の特徴データ取得部22は、ステップS101において取得された画像データから、罫線を抽出する。罫線の抽出については、従来一般的に用いられている画像解析技術を用いることで可能であるため、詳細な説明は省略する。罫線抽出のための具体的な方法には、どのような方法が採用されてもよい。本実施形態では、帳票に係る画像データから、罫線に係る部分と罫線以外の部分(文字や記号、写真等)とを、画像解析によって峻別し、罫線のみの画像データを生成する。ここで生成される罫線のみの画像データは、本ステップにおける罫線の特定およびステップS103における特徴点の抽出を容易にするため、グレースケール画像または2値画像であることが好ましい。
【0045】
図6Aは、本実施形態に係る処理対象帳票の画像データの例を示す図である。また、図6Bは、図6Aに例示した処理対象帳票から抽出された、罫線のみのグレースケール画像の例を示す図である。図6Aおよび図6Bによれば、本実施形態において、帳票に係る画像データから、罫線に係る部分と罫線以外の部分とが峻別され、罫線のみの画像データが生成されていることが分かる。
【0046】
特徴データ取得部22は、生成された罫線のみの画像データから、罫線を1本1本特定していくことで、罫線を抽出する。更に、特徴データ取得部22は、抽出された罫線の数をカウントする。一般的に罫線には縦方向に延びる罫線と横方向に延びる罫線とがあり、本数が異なるが、本実施形態では、縦方向の罫線と横方向の罫線とを区別せず、罫線の総数をカウントする。これは、本実施形態に係る帳票種別識別・学習処理では、ステップS
103において後述するように、縦方向の罫線と横方向の罫線との交点が特徴点として抽出されるため、後述する特徴データの抽出および帳票種別の推定において、罫線同士の交点の重み付けが、罫線の縦横本数と交点とで二重に考慮されてしまわないようにするためである。その後、処理はステップS103へ進む。
【0047】
ステップS103では、特徴点が抽出される。アプリケーションサーバ1の特徴データ取得部22は、ステップS102において取得された画像データから、特徴点を抽出する。特徴点の抽出については、従来一般的に用いられている画像分析技術を用いることで可能であるため、詳細な説明は省略する。本実施形態では、ステップS102において生成された罫線のみの画像データから、罫線やその交点に係る特徴点を抽出する方法が用いられる。
【0048】
図6Cは、図6Bに例示した罫線のみのグレースケール画像において、特徴点が抽出された様子を例示する図である。図6には、抽出された特徴点が、丸印をもって示されている。図6Aおよび図6Cによれば、本実施形態において、帳票に係る画像データから、画像データの一致不一致を判定するために参照可能な特徴的な点(例えば、縦方向の罫線と横方向の罫線との交点)が抽出されていることが分かる。但し、特徴点は、画像データの一致不一致を判定するために参照可能な特徴的な点であればよく、罫線同士の交点に限定されない。特徴点抽出のための具体的な方法には、どのような方法が採用されてもよい。更に、特徴データ取得部22は、抽出された特徴点の数をカウントする。その後、処理はステップS104へ進む。
【0049】
ステップS104では、色具合が取得される。アプリケーションサーバ1の特徴データ取得部22は、ステップS102において取得された画像データから、色具合を取得する。色具合の取得については、従来一般的に用いられている画像分析技術を用いることで可能であるため、詳細な説明は省略する。色具合の取得のための具体的な方法には、どのような方法が採用されてもよい。本実施形態では、ステップS102において取得された画像データの、RGBカラーヒストグラムを生成し、これを色具合として取得する。本実施形態に係る帳票種別識別・学習処理では、罫線および特徴点の抽出を、グレースケールの画像データを用いて行っているため、色具合を取得し、後述する絞り込みに用いることで、罫線や特徴点において一致または類似しているが色違いである等の帳票を区別することが出来る。その後、処理はステップS105へ進む。
【0050】
ステップS105では、特徴量が算出される。アプリケーションサーバ1の特徴データ取得部22は、ステップS102からステップS104において取得された特徴データ(本実施形態では、罫線、特徴点および色具合)に関する特徴量を算出する。特徴量の算出については、従来一般的に用いられている特徴量算出技術を用いることで可能である。画像の特徴量としては、画像のモーメントやテクスチャ、エッジ量等があり、例えば、特徴データ取得部22は、ステップS103で抽出された特徴点を用いて、画像の回転、平行移動、拡大、縮小等の幾何学的変形に対して不変な量(不変量)としての特徴量を算出することが出来る。また、特徴データ取得部22は、ステップS102で得られる2値画像に対して、高次局所自己相関特徴計算を行うことで、特徴量を算出することが出来る。その後、処理はステップS106へ進む。
【0051】
ステップS106では、第一段階の絞り込みが行われる。第一段階の絞り込みは、ステップS102からステップS104において得られた特徴データのうち、罫線の数、特徴点の数および色具合を用いた、特徴データベース31のインデックス検索によって行われる。アプリケーションサーバ1の抽出部23は、ステップS102からステップS104において得られた罫線の数、特徴点の数および色具合の夫々を検索キーとして特徴データベース31を検索する。但し、この検索では、罫線の数、特徴点の数および色具合の夫々
について所定の許容範囲が設定されることで、完全一致しないが、近似する値を含むレコード、即ち、値がステップS102からステップS104において得られた値を基準とする所定の許容範囲内にあるレコードも抽出される。本ステップでは、罫線の数、特徴点の数および色具合の全てについて一致または近似する値を含むレコードのみが抽出される。但し、抽出の条件としては、罫線の数、特徴点の数および色具合の各パラメータについて、異なる重み付けが設定されていてもよい。本ステップにおける第一段階の絞り込みの結果、特徴データベース31から、1または複数のレコード(特徴データ)が抽出される。その後、処理はステップS107へ進む。
【0052】
ステップS107では、第二段階の絞り込みが行われる。第二段階の絞り込みは、ステップS105において算出された特徴量を用いた、最近傍探索によって行われる。アプリケーションサーバ1の推定部24は、ステップS105において算出された特徴点を用いて、ステップS106において抽出されたレコードに対して、最近傍探索を行う。本フローチャートに示す帳票種別識別・学習処理によれば、ステップS106で説明した第一段階の絞り込みによって、比較的処理負荷の軽いインデックス検索によってレコードが絞り込まれている。このため、ステップS107の最近傍探索の対象となるレコード(特徴データ)は、特徴データベース31の総サイズに対して小さくなっており、特徴データベース31の全体に対して最近傍探索を行う場合に比べて、処理負荷が低減されている。最近傍探索によって、ステップS101において取得された画像データの特徴データに最も近い特徴データを有するレコードが特定される。そして、推定部24は、この特定されたレコードに係る帳票種別を、ステップS101において取得された画像データに係る帳票の帳票種別であると推定する。その後、処理はステップS108へ進む。
【0053】
ステップS108では、推定結果の有無が判定される。アプリケーションサーバ1の制御部は、ステップS107において、1のレコード(特徴データ)が、ステップS101において取得された画像データの特徴データとして特定されたか否か、換言すれば、帳票種別の推定結果が得られたか否かを判定する。帳票種別の推定結果が得られなかったと判定された場合、処理はステップS109へ進む。一方、帳票種別の推定結果が得られたと判定された場合、処理はステップS110へ進む。
【0054】
ステップS109では、特徴データベース31への登録が行われる。アプリケーションサーバ1の特徴データ追加部25は、ステップS102からステップS105において取得された罫線の数、特徴点の数、色具合および特徴量を、新たな帳票種別に係る特徴データとして、特徴データベース31に蓄積させる。但し、特徴データベース31には、取得されたその他の特徴データ(特徴点、罫線等)についても蓄積されてよい。また、特徴データ追加部25は、蓄積された特徴データに関連づけて、ステップS101において取得された画像データを、画像データベース32に蓄積する。即ち、本実施形態に係る帳票種別識別・学習処理によれば、推定結果が得られなかった帳票の画像データおよび特徴データが、新たな帳票種別に係る画像データおよび特徴データとして学習される。ここで学習された特徴データは、次回以降に帳票種別識別・学習処理が実行される際に、帳票種別識別のために参照される。その後、本フローチャートに示された処理は終了する。
【0055】
ステップS110およびステップS111では、推定結果がユーザに対して提示され、推定結果の正否が判定される。帳票種別の推定結果が得られたとステップS108において判定された場合、アプリケーションサーバ1の制御部は、推定結果に係る帳票種別を特徴データベース31から取得し、Webサーバ2を介してユーザ端末9に送信する(ステップS110)。ユーザ端末9によって受信された推定結果に係る帳票種別は、ユーザ端末9によって表示されることでユーザに対して提示される。ユーザは、ユーザ端末9に表示された推定結果を参照し、正しい結果が得られているか否かを、Webサーバ2に対して返信する。アプリケーションサーバ1は、ユーザ端末からの返信の内容に従って、推定
結果が正しい結果であったか否か、即ち、推定結果に係る帳票種別が、ステップS101において取得された画像データに係る帳票の帳票種別を正しく示しているか否か、を判定する(ステップS111)。
【0056】
推定結果が正しい結果ではなかったと判定された場合、処理はステップS109へ進む。即ち、推定結果が正しい結果ではなかったと判定された場合、得られた情報は新たな帳票種別に係る情報であるとして、特徴データベース31および画像データベース32に蓄積される。ステップS109における処理の詳細については先述の通りであるため、説明を省略する。その後、本フローチャートに示された処理は終了する。一方、推定結果が正しい結果であったと判定された場合、処理はステップS112へ進む。
【0057】
ステップS112およびステップS113では、OCR処理が行われ、結果が送信される。アプリケーションサーバ1の制御部は、OCR処理のための書式定義が蓄積された書式定義データベース(図示は省略する)から、推定された帳票種別に係る書式定義を取得する。そして、アプリケーションサーバ1の制御部は、当該書式定義に従って、ステップS101において取得された画像データに対するOCR処理を行う(ステップS112)。OCR処理が完了すると、アプリケーションサーバ1の制御部は、Webサーバ2を介して、ユーザ端末9に対して、帳票の画像データに含まれていた文字情報を含むOCR処理の結果を送信する(ステップS113)。また、制御部は、この際、帳票種別も併せてユーザ端末9に送信してもよい。その後、本フローチャートに示された処理は終了する。
【0058】
<効果>
本実施形態に係る帳票種別検索システム100によれば、予め書式定義を作成することなく、帳票種別を推定することが出来る。また、未知の帳票種別については学習を行い、以後の帳票種別推定において、学習された帳票データを用いることが可能となる。
【0059】
更に、本実施形態に係る帳票種別検索システム100によれば、抽出部23による第一段階の絞り込みにおいて比較的負荷の軽いインデックス検索を採用し、推定部24による第二段階の絞り込みにおいて比較的正確性の高い最近傍探索を採用することで、処理速度を損なうことなく、正確性の高い帳票種別推定を行うことが可能となる。
【符号の説明】
【0060】
1 アプリケーションサーバ
2 Webサーバ
3 データベース
9 ユーザ端末
21 画像データ取得部
22 特徴データ取得部
23 抽出部
24 推定部
25 特徴データ追加部
31 特徴データベース
32 画像データベース

【特許請求の範囲】
【請求項1】
帳票の外観上の特徴に係る特徴データを、帳票種別毎に蓄積する特徴データ蓄積手段に接続される情報処理装置であって、
処理対象帳票の画像データを取得する画像データ取得手段と、
前記画像データから、前記処理対象帳票に係る特徴データを取得する特徴データ取得手段と、
前記特徴データ蓄積手段に蓄積されている特徴データから、前記処理対象帳票に係る特徴データに一致または類似する特徴データを特定することで、該処理対象帳票の帳票種別を推定する推定手段と、
前記推定手段によって前記処理対象帳票の帳票種別が推定されなかった場合に、該処理対象帳票に係る特徴データを前記特徴データ蓄積手段に追加する特徴データ追加手段と、
を備える情報処理装置。
【請求項2】
前記特徴データ追加手段は、前記推定手段によって前記処理対象帳票の帳票種別が推定されなかった場合に、該処理対象帳票に係る特徴データを、新たな帳票種別に係る特徴データとして前記特徴データ蓄積手段に追加する、
請求項1に記載の情報処理装置。
【請求項3】
前記特徴データ蓄積手段に蓄積されている特徴データから、該特徴データに含まれる所定のパラメータが、前記画像データから取得された所定のパラメータを基準とする所定の範囲内にある1または複数の特徴データを抽出する抽出手段を更に備え、
前記推定手段は、前記抽出手段によって抽出された特徴データから、前記処理対象帳票に係る特徴データに一致または類似する特徴データを特定することで、該処理対象帳票の帳票種別を推定する、
請求項1または2に記載の情報処理装置。
【請求項4】
前記所定のパラメータは、前記画像データから取得された特徴点の数を特定可能な情報を含み、
前記抽出手段は、前記特徴データ蓄積手段に蓄積されている特徴データから、該特徴データに含まれる特徴点の数が、前記画像データから取得された特徴点の数を基準とする所定の範囲内にある1または複数の特徴データを抽出する、
請求項3に記載の情報処理装置。
【請求項5】
前記所定のパラメータは、前記画像データから取得された罫線の数を特定可能な情報を含み、
前記抽出手段は、前記特徴データ蓄積手段に蓄積されている特徴データから、該特徴データに含まれる罫線の数が、前記画像データから取得された罫線の数を基準とする所定の範囲内にある1または複数の特徴データを抽出する、
請求項3または4に記載の情報処理装置。
【請求項6】
前記所定のパラメータは、前記画像データから取得された色具合を特定可能な情報を含み、
前記抽出手段は、前記特徴データ蓄積手段に蓄積されている特徴データから、該特徴データに含まれる色具合が、前記画像データから取得された色具合を基準とする所定の範囲内にある1または複数の特徴データを抽出する、
請求項3から5の何れか一項に記載の情報処理装置。
【請求項7】
前記特徴データは、前記画像データから算出された特徴量を含み、
前記推定手段は、前記抽出手段によって抽出された特徴データに含まれる特徴量に対し
て、前記画像データから取得された特徴量を用いた最近傍探索を行うことで、該抽出された特徴データから、前記処理対象帳票に係る特徴データに一致または類似する特徴データを特定し、該処理対象帳票の帳票種別を推定する、
請求項1から6の何れか一項に記載の情報処理装置。
【請求項8】
帳票の外観上の特徴に係る特徴データを、帳票種別毎に蓄積する特徴データ蓄積手段に接続されるコンピュータが、
処理対象帳票の画像データを取得する画像データ取得ステップと、
前記画像データから、前記処理対象帳票に係る特徴データを取得する特徴データ取得ステップと、
前記特徴データ蓄積手段に蓄積されている特徴データから、前記処理対象帳票に係る特徴データに一致または類似する特徴データを特定することで、該処理対象帳票の帳票種別を推定する推定ステップと、
前記推定ステップにおいて前記処理対象帳票の帳票種別が推定されなかった場合に、該処理対象帳票に係る特徴データを前記特徴データ蓄積手段に追加する特徴データ追加ステップと、
を実行する帳票種別推定方法。
【請求項9】
帳票の外観上の特徴に係る特徴データを、帳票種別毎に蓄積する特徴データ蓄積手段に接続されるコンピュータに、
処理対象帳票の画像データを取得する画像データ取得ステップと、
前記画像データから、前記処理対象帳票に係る特徴データを取得する特徴データ取得ステップと、
前記特徴データ蓄積手段に蓄積されている特徴データから、前記処理対象帳票に係る特徴データに一致または類似する特徴データを特定することで、該処理対象帳票の帳票種別を推定する推定ステップと、
前記推定ステップにおいて前記処理対象帳票の帳票種別が推定されなかった場合に、該処理対象帳票に係る特徴データを前記特徴データ蓄積手段に追加する特徴データ追加ステップと、
を実行させるための帳票種別推定用プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6A】
image rotate

【図6B】
image rotate

【図6C】
image rotate


【公開番号】特開2012−198684(P2012−198684A)
【公開日】平成24年10月18日(2012.10.18)
【国際特許分類】
【出願番号】特願2011−61567(P2011−61567)
【出願日】平成23年3月18日(2011.3.18)
【出願人】(000136136)株式会社PFU (354)
【Fターム(参考)】