説明

帳票認識システム、帳票認識方法及びコンピュータプログラム

【課題】 帳票の記入者が自由に設計した帳票であっても、フォームを使わずに帳票をOCRで認識可能とすること。
【解決手段】 予め帳票の論理構造を定義し、入力された入力帳票の値を取得可能としたシステムであり、帳票上の項目名に関連する用語をグルーピングした概念辞書DB、帳票の種類別に帳票の論理構造を定義したスキーマ情報DBを備える。入力帳票の項目名をOCRエンジンで読み取り、各項目名が概念辞書DBに記憶されたグループのうち、どのグループに属しているかを抽出する。抽出したグループと順序をスキーマ情報DBに記憶された複数のスキーマ情報を参照して入力帳票の論理構造を推測し、帳票の候補リストを動的に生成する。生成した候補リストの中から、帳票の値を読み取り、その帳票の値をスキーマ情報の要素名及びデータ型と照合し、帳票結果として出力する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、帳票の認識技術に関し、特に、フォームを使わずに帳票をOCRで認識することが可能な技術に関する発明である。
【背景技術】
【0002】
従来、帳票の電子化技術としては、光学式文字読み取り装置(以下、OCR(Optical Character Reader)と表記する)を用いて帳票を認識する方法や、スキャナ等の入力装置で帳票を読み取り、読み取った帳票をコンピュータのOCRソフトを用いて認識させる方法が知られている。OCRで帳票を認識するためには、認識エリアを定義した帳票と、それに対応したフォームを事前に準備する必要がある。
【0003】
帳票においては、帳票を識別するために、帳票にタイミングマークやシートID等を設定したり、帳票のレイアウトを構成している見出し・罫線・図の位置及び特徴点を登録する。次に認識エリアを特定するために、タイミングマーク及び特徴点からの相対的な位置と大きさを登録する。認識段階では、定義された認識エリアを文字認識(OCR)してデータを取り出す(例えば、特許文献1参照)。
【0004】
【特許文献1】特開2003−168075号公報
【発明の開示】
【発明が解決しようとする課題】
【0005】
OCRは、生産性を向上させる手段として定評があり、現在においても有効な手段として一般的である。しかしながら、帳票によるOCRの運用には次のような問題が生じている。
第一に、業務上で使用する帳票のレイアウト設計を行う必要がある。この方法は個々の記入者側の要望を含んだ帳票を作成するには手間がかかり、記入者(注文書においては発注する側の人々)の一部にしか利用されない結果になりがちである。
第二に、記入者が作成した帳票を登録する方法が普及したが、認識できる帳票に対応したフォームの種類を数多くする必要があり、場合によっては膨大な数になってしまう。フォームを数多く登録した場合には、帳票の認識を間違う弊害が発生する。さらに、帳票のレイアウトが変更された場合、その都度、フォームの再登録を行う必要がある。
第三に、FAXを入力媒体として帳票を認識する場合、FAXの汚れやゆがみ、縮小に影響されるため、特徴点が劣化し誤認識を引き起こすケースが多く、実用範囲が限定されている。
第四に、近年では記入者側のパソコン環境が向上し、記入者側が自由に帳票を作成することが容易となった。また、帳票を構成しているテーブル内の行や列の数が可変となる帳票を作成できるアプリケーションソフトの普及も著しい。しかし、このようなテーブルの列や行が可変する帳票があった場合には、可変フィールドに対応したフォームを作成できないのが現状である。
【0006】
第四の問題点について図9を参照して詳しく説明する。図9(a)、(b)は、A社がX社に対し、商品を注文するための注文書の一部を概略的に示した図である。図9(a)に示すように、A社は、1月は商品A〜商品Cという三種類の異なる商品を注文した。この場合、2行目から4行目のセルに亘って商品名が記載され、5行目に合計金額が記載されることになる。
また、図9(b)に示すように、2月は商品A〜商品Gという七種類の異なる商品を注文した。2月の場合は、2行目から8行目のセルに亘って商品名が記載され、9行目に合計金額が記載されることになる。つまり、2月の注文書は、1月の注文書と比較すると4行分のセルが増加したことになり、合計金額が記載される行も5行目から9行目へとずれることになる。このような場合には、フォームによる認識手法では対応することができない。
【0007】
すなわち、帳票の認識における問題点は、基本的にフォームによる認識手法が帳票のレイアウトに依存することにある。一方、フォームによる認識手法で認識できない帳票(以下、非定型帳票と表記する)の数は無視できないほど多く、ますます増加傾向となっている。非定型帳票は、現時点では手入力を強いているが、記入者が自由に設計した非定型帳票の入力を効率化する技術が強く望まれている。
【0008】
そこで、本発明は上記の問題点に鑑みなされたものであり、帳票の記入者が自由に設計した帳票であっても、フォームを使わずに帳票をOCRで認識可能な技術を提供することにある。
【課題を解決するための手段】
【0009】
(請求項1)
請求項1記載の発明は、予め帳票の論理構造を定義し、入力された入力帳票の値を取得可能とした帳票認識システムを提供する。
すなわち、帳票上の項目名を、項目名に関連する用語に基づいてグルーピングし、複数のグループを作成した概念辞書を記憶する概念辞書データベースと、前記項目名が属するグループ及び前記入力帳票の値を、所定の言語を用いて要素名及びデータ型によってそれぞれ関連付けて、帳票の種類別に帳票の論理構造を定義して作成した複数のスキーマ情報を記憶するスキーマ情報データベースと、前記入力帳票の項目名を読み取り手段を用いて読み取った際に、各項目名が概念辞書データベースに記憶されたグループのうち、どのグループに属しているかを参照して抽出し、当該抽出したグループと順序を前記スキーマ情報データベースに記憶された複数のスキーマ情報を参照して前記入力帳票の論理構造を推測し、少なくとも一つの帳票の候補リストを動的に生成する候補リスト生成手段と、当該候補リスト生成手段が生成した候補リストの中から、帳票の値を読み取る帳票値読み取り手段と、読み取った帳票の値を、前記スキーマ情報の要素名及びデータ型と照合して整合性を判別する要素名/データ型判別手段と、を備えた帳票認識システムに係る。
【0010】
(用語説明)
「項目名」とは、帳票の見出しに該当するものであり、例えば注文書であれば、「番号」、「製品名」、「数量」、「単価」、「金額」などのことである。
「概念辞書データベース」とは、帳票上の項目名を、項目名に関連する用語に基づいてグルーピングした複数のデータ群のことである。関連する用語に基づいてグルーピングした例としては、項目名の中で「製品名」、「商品」、「品名」などの同じ用途で使用している項目名をグルーピングすることなどが考えられる。
「帳票構造」とは、複数種類の帳票の構造のことであり、罫線で構成されたテーブル内の行や列に帳票の項目名と、その項目名に属するグループに対応する帳票の値が記載された構造のことである。
「スキーマ情報データベース」とは、所定の言語を用いて、帳票の種類(注文書や申込書等)別に帳票の要素名及びデータ型を定義した構造のことである。
【0011】
(作用)
帳票の項目名を収集し、当該項目名に関連する用語に基づいてグルーピングし、複数のグループを作成した概念辞書を概念辞書データベースに記憶する。
項目名が属するグループ及び入力帳票の値を、所定の言語を用いて要素名及びデータ型によってそれぞれ関連付けて、帳票の種類別に帳票の論理構造を定義して作成した複数のスキーマ情報をスキーマ情報データベースに記憶する。
候補リスト生成手段が入力帳票の項目名を読み取り手段を用いて読み取った際に、各項目名が概念辞書データベースに記憶されたグループのうち、どのグループに属しているかを参照して抽出する。ここで抽出したグループと順序をスキーマ情報データベースに記憶された複数のスキーマ情報を参照して入力帳票の論理構造を推測し、少なくとも一つの帳票候補を動的に生成する。
帳票値読み取り手段が、生成した候補リストの中から、帳票の値を読み取る。
また、要素名/データ型判別手段が読み取った帳票の値を、スキーマ情報の要素名及びデータ型と照合して整合性を判別する。
【0012】
すなわち、本システムは、読み取り対象となる入力帳票の論理構造を定義し、帳票結果を取得可能としている。特に、概念辞書データベース及びスキーマ情報データベースから入力帳票の論理構造を推測して候補リストを動的に生成する処理を加えることで、帳票の記入者が自由に設計した帳票であっても、フォームを使わずに帳票をOCRで認識可能となる。これにより、非定型帳票を認識する際の作業性および時間効率が格段に向上するため、生産性に優れたシステムとなる。
【0013】
(請求項2)
請求項2記載の発明は、請求項1記載の発明を限定したものであり、前記要素名/データ型判別手段が判別した帳票の値を帳票結果として出力する出力手段を備えたことを特徴とする。
【0014】
(作用)
出力手段が、要素名/データ型判別手段が判別した帳票の値を帳票結果として出力する。すなわち、取得した帳票の値を帳票結果として出力し、利用することができる。なお、出力先としては、アプリケーションソフト、データベース及び電子フォームなどがあるが、帳票の値を利用可能であれば、その形態を問うものではない。
【0015】
(請求項3)
請求項3記載の発明は、請求項2に記載の発明を限定したものであり、前記出力手段がリレーショナルデータベースに対して前記帳票結果を出力可能としたことを特徴とする。
【0016】
(作用)
本発明は、帳票結果をリレーショナルデータベースに対して出力可能とした発明である。 すなわち、帳票結果の出力先をリレーショナルデータベースとすれば、本システムのスキーマ情報とRDBのスキーマ情報を容易に対応付けることが可能となり、スムーズに帳票の値を出力可能としている。すなわち、電子フォームの論理構造とほぼ同様の構造をリレーショナルデータベース上に構築することが可能であり、データを出力するにあたっての段取りが容易となる。
【0017】
(請求項4)
請求項4記載の発明は、請求項1から請求項3のいずれかに記載の発明を限定したものであり、前記帳票値読み取り手段が読み込んだ帳票の値を補正する補正手段を備え、その補正手段は、読み取った帳票の値を構成する文字列のうち、少なくとも一つの文字列が読み取りできた場合には、読み取りすることが不可となった文字列から補正後の項目名を特定することを可能としたこと特徴とする。
【0018】
(作用)
補正手段が帳票値読み取り手段が読み込んだ帳票の値を補正する。これは、例えば、「単価」という文字を読み込んだつもりが、実際には「△価」または「単△」というような一文字のみしか認識されなかったとする。このような場合、補正手段には、「△価」の「価」及び「単△」の「単」という文字は、「単価」に該当する文字である、というような単語を特定するための所定のアルゴリズムが設定されている。このため、入力帳票の認識時に全ての文字を正確に読み込むことができなかった場合でも、認識処理が中断されるのを最小限に抑えることができ、帳票認識処理の効率化を図ることができる。
【0019】
(請求項5)
請求項5記載の発明は、請求項1から請求項4のいずれかに記載の発明を限定したものであり、前記スキーマ情報に用いる所定の言語にXMLを用いたことを特徴とする。
【0020】
(請求項6)
予め帳票の論理構造を定義し、入力された入力帳票の値を取得可能とした帳票認識方法を提供する。
すなわち、帳票上の項目名を、項目名に関連する用語に基づいてグルーピングし、複数のグループを作成した概念辞書を記憶する概念辞書データベースと、前記項目名が属するグループ及び前記入力帳票の値を、所定の言語を用いて要素名及びデータ型によってそれぞれ関連付けて、帳票の種類別に帳票の論理構造を定義して作成した複数のスキーマ情報を記憶するスキーマ情報データベースと、前記入力帳票の項目名を読み取り手段を用いて読み取った際に、各項目名が概念辞書データベースに記憶されたグループのうち、どのグループに属しているかを参照して抽出し、当該抽出したグループと順序を前記スキーマ情報データベースに記憶された複数のスキーマ情報を参照して前記入力帳票の論理構造を推測し、少なくとも一つの帳票の候補リストを動的に生成する候補リスト生成手順と、当該候補リスト生成手順が生成した候補リストの中から、帳票の値を読み取る帳票値読み取り手順と、読み取った帳票の値を、前記スキーマ情報の要素名及びデータ型と照合して整合性を判別する要素名/データ型判別手順と、を備えた帳票認識方法に係る。
【0021】
(請求項7)
請求項7記載の発明は、請求項6に記載の帳票認識方法を限定したものであり、前記要素名/データ型判別手順が判別した帳票の値を帳票結果として出力する出力手順を備えたことを特徴とする。
【0022】
(請求項8)
請求項8記載の発明は、請求項7に記載の帳票認識方法を限定したものであり、前記出力手順がリレーショナルデータベースに対して前記帳票結果を出力可能としたことを特徴とする。
【0023】
(請求項9)
予め帳票の論理構造を定義し、入力された入力帳票の値を取得可能とした帳票認識方法をコンピュータに実行させるプログラムを提供する。
そのプログラムは、帳票上の項目名を、項目名に関連する用語に基づいてグルーピングし、複数のグループを作成した概念辞書を記憶する概念辞書データベースと、前記項目名が属するグループ及び前記入力帳票の値を、所定の言語を用いて要素名及びデータ型によってそれぞれ関連付けて、帳票の種類別に帳票の論理構造を定義して作成した複数のスキーマ情報を記憶するスキーマ情報データベースと、前記入力帳票の項目名を読み取り手段を用いて読み取った際に、各項目名が概念辞書データベースに記憶されたグループのうち、どのグループに属しているかを参照して抽出し、当該抽出したグループと順序を前記スキーマ情報データベースに記憶された複数のスキーマ情報を参照して前記入力帳票の論理構造を推測し、少なくとも一つの帳票の候補リストを動的に生成する候補リスト生成手順と、当該候補リスト生成手順が生成した候補リストの中から、帳票の値を読み取る帳票値読み取り手順と、読み取った帳票の値を、前記スキーマ情報の要素名及びデータ型と照合して整合性を判別する要素名/データ型判別手順と、をコンピュータに実行させることとしたコンピュータプログラムに係る。
【0024】
(請求項10)
請求項10記載の発明は、請求項9に記載のコンピュータプログラムを限定したものであり、前記要素名/データ型判別手順が判別した帳票の値を帳票結果として出力する出力手順を備えたことを特徴とする
【0025】
(請求項11)
請求項11記載の発明は、請求項10に記載のコンピュータプログラムを限定したものであり、前記出力手順がリレーショナルデータベースに対して前記帳票結果を出力可能としたことを特徴とする。
【0026】
請求項9から請求項11に記載のコンピュータプログラムを、記録媒体へ記憶させて提供することもできる。ここで、「記録媒体」とは、それ自身では空間を占有し得ないプログラムを担持することができる媒体であり、例えば、フレキシブルディスク、ハードディスク、CD−R、MO(光磁気ディスク)、DVD−Rなどである。
また、これらの発明に係るプログラムを格納したコンピュータから、通信回線を通じて他のコンピュータへ伝送することも可能である。
また、汎用的な端末装置に対して、請求項9から請求項11に記載の発明に係るプログラムをプリインストール、あるいはダウンロードすることで、他の請求項に係るシステム(サーバ)を形成することも可能である。
【発明の効果】
【0027】
請求項1から請求項5に記載の発明によれば、帳票の記入者が自由に設計した帳票であっても、フォームを使わずに帳票をOCRで認識可能としている。このため、生産性の向上に寄与したシステムを提供することができた。
請求項6から請求項8に記載の発明によれば、帳票の記入者が自由に設計した帳票であっても、フォームを使わずに帳票をOCRで認識可能としている。生産性の向上に寄与したプロセスを提供することができた。
請求項9から請求項11に記載の発明によれば、帳票の記入者が自由に設計した帳票であっても、フォームを使わずに帳票をOCRで認識可能としている。このため、生産性の向上に寄与したプログラムを提供することができた。
【発明を実施するための最良の形態】
【0028】
以下、本発明を実施の形態及び図面に基づいて、更に詳しく説明する。図1は、本発明に係る帳票認識システムの全体構成を示す概略図であり、図2は、認識装置の各機能を示したフローチャートである。
図1に示すように、帳票認識システム10は、読み取り対象として入力される帳票(以下、入力帳票20と表記する)の値となる帳票結果50を取得可能としたシステムであり、OCRエンジン40(読み取り手段)を有する認識装置30を備えて構成されている。
【0029】
図2に示すように、認識装置30は、入力帳票20をOCRで認識した際に概念辞書及び複数の帳票構造を定義したスキーマ情報を参照して入力帳票20の論理構造を推測し、帳票の種類を示す候補リスト(以下、候補リストと表記する)を動的に生成する候補リスト生成手段(S101)と、その候補リストの中から、「帳票の値」を読み取る帳票値読み取り手段(S102)と、その読み取った「帳票の値」がどの帳票に該当するのかを特定するための要素名/データ型判別手段(S103)と、判別した「帳票の値」を帳票結果50として出力する出力手段と、を備えて構成されている。以下、本システムの詳細について、S101、S102、S103及びS104の各処理手順に基づいて説明していく。
【0030】
(S101:候補リスト生成手段)
図3は、帳票の候補リストを生成するための概念図を示した図である。図3に示すように、[候補リスト生成手段]は、入力帳票20から帳票の種類を示す候補リストを生成するために、事前に作成した概念辞書データベース(以後、データベースをDBと略記する)31及びスキーマ情報DB32を参照し、入力帳票20の論理構造を推測することになる。まず、候補リストの生成に必要となる概念辞書DB31及びスキーマ情報DB32の説明を行う。
【0031】
「概念辞書」とは、帳票の種別毎に記載された「項目名」を収集して帳票用単語リストというものを作成する。この帳票用単語リストとは、例えば、〔注文書〕であれば、「番号」、「製品名」、「数量」、「単価」、「金額」などの項目名が該当し、〔入会申込書〕であれば、「氏名」、「住所」、「コース名」、「支払い方法」、「クレジット番号」などの項目名が該当する。
また、これらの帳票用単語リストを関連用語によってグルーピングを行う。関連用語によってグルーピングするとは、例えば、帳票用単語リストの中で「製品名」、「商品」、「品名」などの同じ用途で使用している項目名をグルーピングすることである(例えば、製品グループなど)。グルーピングした項目名及びグループ名をもとに概念辞書の作成が行われ、作成された概念辞書は、概念辞書DB31として記憶される。
【0032】
「スキーマ情報」とは、XML(Extensible Markup Language)言語を用いて、帳票の種類(注文書や申込書等)別に帳票の要素名及びデータ型を定義した構造のことである。図4を参照して説明すると、〔注文書〕の項目欄には、「番号」、「製品名」、「数量」、「単価」、「金額」の各項目名が記載され、これら各項目名が属するのが、例えば製品グループなどの「グループ名」となっている。すなわち、この「グループ名」は、スキーマ情報においての「要素名」に対応することになる。また、図4の「001」や「クリアシート」のデータ型(数字や文字)は、スキーマ情報における「データ型」に対応することになる。
【0033】
図4は図5に示したスキーマ情報に対応した注文書の例を示している。
図5において、4,5,7,8,9行目の要素名が、図4に示す「番号」、「製品名」、「数量」、「単価」、「金額」の各項目名が属するグループ名にそれぞれ対応している。例えば、5行目に記載されている「element name="productname"」は、〔注文書〕には〔製品グループ〕が存在することを定義している。また、「type="string"」は、〔製品グループ〕の「データ型」を定義しており、「クリアシート」などの「文字列」が入力可能である。
【0034】
また、4,7,8,9行目では、「データ型」が「type="number"」となっている。この「number」には「数字」または「金額」などの数値が入力可能である。なお、「use="required"」とは、入力帳票20を定義する上での必須項目であるという意味である。これに対して、4行目に記載されている「use="optional"」は、オプション項目であるため、省略することが可能となっている。ここで作成されたスキーマ情報は、スキーマ情報DB32に記憶される。
【0035】
なお、本実施形態のスキーマ情報としてはXMLを採用して帳票の種類別に要素名及びデータ型を定義しているが、これに限定されることはない。すなわち、スキーマを利用可能とする言語であれば、その言語の種類を問うものではない。例えば、リレーショナルデータベースで利用するSQL(Structured Query Language)等を用いてスキーマ情報を定義することも当然可能である。
【0036】
図6は、入力帳票20の一例を示す注文書である。上記の概念辞書DB31及びスキーマ情報DB32をもとに候補リストが生成される処理手順としては、まず、注文書の項目名である「製品名」、「数量」、「単価」、「金額」、「備考」、「合計」をOCRエンジン40を用いて読み込んだ場合、これら各項目名が概念辞書DB31に記憶されているどの「グループ名」に属しているかを参照する。例えば、「製品名」であれば、「製品グループ」に該当しているなどである。
上記のようにして、概念辞書DB31から入力帳票20の項目名に該当するグループ名を抽出すると、その抽出したグループ名と順序をスキーマ情報DB32に記憶された複数のスキーマ情報とを参照して入力帳票20の論理構造を推測する。つまり、複数の論理構造の中から帳票の種類を示す可能性が高いと思われる論理構造を抽出する。
【0037】
また、入力帳票20には帳票を構成するのに必要な要素が必ず存在する。
図7(a)においては、「製品名」、「数量」、「金額」という要素が[注文書]という性質上から必要な要素となる。したがって、[注文書]のテーブルには、これら「製品名」、「数量」、「金額」が属するグループ名が必ず存在することになる。
一方、図7(b)に示すように、入会申込書のテーブルには、「氏名」、「住所」、「支払い方法」、「コース名」という項目名があるが、これらは[入会申込書]という性質上から必要な要素となる。したがって、[入会申込書]には、「氏名」、「住所」、「支払い方法」、「コース名」が属するグループ名が必ず存在することになる。
【0038】
すなわち、スキーマ情報DB32には、図7に示したような帳票の種類に応じた複数のスキーマが予め定義されていることになる。そして、このスキーマ情報に基づいて、帳票の種類を判別することで判別精度を高めている。例えば、入力帳票20の論理構造が〔注文書〕の論理構造に該当すると判別した場合には、入力帳票20は、〔注文書〕である可能性が高いと判別され、[入会申込書]の論理構造に該当すると判別した場合には、入力帳票20は、[入会申込書]である可能性が高いと判別される。
以上のようにして、入力帳票20から論理構造を推測して候補リストを動的に生成することになる。なお、生成された候補リストは、一つに限定される場合もあるが、複数生成される場合もある。
【0039】
(S102:帳票値読み取り手段)
〔帳票値読み取り手段〕は、〔候補リスト生成手段〕が生成した候補リストの中から、スキーマ情報DB32を参照してスキーマ情報の「データ型」に該当する「帳票の値」を読み取る機能である。図6の注文書を参照して説明すると、注文書における「コピー用紙」が”製品名の要素”に該当する「帳票の値」となる。また、入力帳票20における「75,000」が”金額の要素”に該当する「帳票の値」となる。
【0040】
(S103:要素名/データ型判別手段)
〔要素名/データ型判別手段〕は、帳票値読み取り手段が読み取った「帳票の値」を、事前にスキーマ情報が定義した「要素名」及び「データ型」と照合して判別する。図5および図6を参照して説明すると、読み取った帳票の値が「コピー用紙」の場合、「コピー用紙」が属するグループ名は、「製品グループ」となる。この「製品グループ」はスキーマ情報の要素名である「productname」に対応し、データ型は「string」となる。この「string」は前述したように「文字型」であり、読み取った値の「コピー用紙」も「文字型」であるため、「コピー用紙」のデータ型(文字型)とスキーマ情報のデータ型(string)が一致する。本プロセスの照合関係を図8に示す。
【0041】
また、読み取った帳票の値が「75,000」の場合、「75,000」が属するグループ名は、「金額グループ」となる。この「金額グループ」はスキーマ情報の要素名である「price」に対応し、データ型は「number」となる。このデータ型は「数字」を示しているため、読み取った値の「75,000」も「数字」であることから、「75,000」のデータ型(数字型)とスキーマ情報のデータ型(number)が一致する。本プロセスの照合関係を図8に示す。
【0042】
(S104:出力手段)
〔出力手段〕は、〔要素名/データ型判別手段〕が帳票の値をスキーマ情報の「要素名」及び「データ型」と照合して整合性が一致した場合、当該帳票の値を帳票結果50として出力する機能である。帳票結果50の出力先としては、例えば、販売管理・顧客管理などのアプリケーションソフトウェアや基幹系データベースなどであり、これらに対しては帳票結果50を変換して出力することが容易となっている。
【0043】
なお、出力先をリレーショナルデータベース(以下RDBとする)とした場合には、本システムのスキーマ情報とRDBのスキーマ情報を容易に対応付けることが可能となり、スムーズに帳票の値を出力可能としている。すなわち、電子フォームの論理構造とほぼ同様の構造をRDB上に構築することが可能であり、データの出力するにあたっての段取りが容易となる。
【0044】
(補正処理)
次に、本システムの補正処理について説明する。補正処理は、帳票の項目名や〔帳票値読み取り手段〕等が読み込んだ入力帳票の値を、〔補正手段〕が補正することにより実現され、読み取った項目名及び帳票の値を構成する文字列のうち、少なくとも一つの文字列が読み取りできた場合には、読み取りすることができなかった文字列から補正後の項目名及び帳票の値に該当する単語を特定することを可能としている。
例えば、「単価」という文字を読み込んだつもりが、実際には「△価」または「単△」というような一文字のみしか認識されなかったとする。このような場合、〔補正手段〕には、「△価」の「価」及び「単△」の「単」という文字は、「単価」に該当する文字である、というような単語を特定するための所定のアルゴリズムが設定されている。このため、入力帳票20の認識時に全ての文字を正確に読み込むことができなかった場合でも、認識処理が中断されるのを最小限に抑えることができ、帳票認識処理の効率化を図ることができる。
【0045】
以下、本システムの一連の処理手順について説明する。
まず、帳票上の項目名を収集して帳票用単語リストを作成し、これをもとに関連用語でグルーピングを行い、概念辞書DB31に記憶する。
次に、帳票構造毎に帳票の要素名とデータ型によって、帳票の論理構造を定義したスキーマ情報をスキーマ情報DB32に記憶する。
【0046】
次に、〔候補リスト生成手段〕がOCRエンジン40を用いて入力帳票20を読み取り、概念辞書DB31を参照して入力帳票20に該当する帳票の種類を推測する。その後、スキーマ情報DB32を参照して入力帳票20の種類を特定し、帳票の候補リストを動的に生成する。
【0047】
次に、〔帳票値読み取り手段〕が帳票の候補リストの中から、帳票結果50に相当する帳票の値を読み取る。
また、〔要素名/データ型判別手段〕が、〔帳票値読み取り手段〕が読み取った帳票の値をスキーマ情報の要素名及びデータ型と照合して整合性を判別する。
判別結果が一致した場合には、[出力手段]が取得した帳票の値を帳票結果50として出力する。出力先としては、販売管理・顧客管理などのアプリケーションソフトウェアや基幹系データベースなどである。一方、判別結果が一致しなかった場合には、処理終了となる。
【0048】
以上のように、帳票認識システム10は、帳票の論理構造を事前に定義することで、入力帳票20の帳票結果50を取得可能としている。すなわち、帳票の記入者が自由に設計した非定型帳票であっても、帳票を認識できる。
従来技術の問題点に対応させると、第一の問題点であった、業務上で使用する帳票のレイアウト設計を行う必要がなくなる。
また、第二の問題点であった、認識できる帳票に対応したフォームの種類を数多く登録する必要があり、これに伴い、フォームの認識を間違う弊害や、帳票のレイアウトが変更された場合にフォームの再登録を行う必要があったが、帳票認識システム10ではフォームを必要としないで帳票認識が可能なため、このような問題は発生しないことになる。
また、第三の問題点であった、FAXを入力媒体として帳票を認識する場合、FAXの汚れやゆがみ、縮小に影響されるため、特徴点が劣化し誤認識を引き起こすケースが多く、実用範囲が限定されていたが、帳票認識システム10では、帳票の論理構造から帳票構造を認識するため、このような問題は発生しないことになる。
また、第四の問題点であった、帳票を構成しているテーブルの行や列の数が可変となる帳票には、フォームが対応できていないのが現状であったが、帳票認識システム10では、フォームを用いずに、帳票の論理構造から帳票構造を認識するため、このような問題は発生しないことになる。
【0049】
したがって、非定型帳票を認識する際の作業性および時間効率が格段に向上する。また、取得した帳票結果50をリレーショナルデータベースや電子フォームなどへ出力可能としているため、データを出力するにあたっての段取りが容易となり、生産性の向上に寄与する。さらに、補正手段を備えているため、認識処理においての精度向上にも寄与することなる。
【0050】
なお、本発明に係る帳票認識システム10は、上述した実施形態に限定されることはない。すなわち、帳票の論理構造を定義することで、入力帳票20の論理構造を推測し、帳票結果50を取得可能とする形態であれば他の手段でも良い。
【図面の簡単な説明】
【0051】
【図1】本発明に係る帳票認識システムの全体構成を示す概略図である。
【図2】帳票認識システムの各処理を示したフローチャートである。
【図3】候補リストの生成に関する概念を示した概念図である。
【図4】スキーマ情報の説明をした図である。
【図5】XMLを用いてスキーマ情報を定義した図である。
【図6】注文書を例とした帳票の構造を示した概略図である。
【図7】候補リストの生成について説明した図であり、(a)は、注文書を示し、(b)は、入会申込書を示した図である。
【図8】入力帳票、概念辞書及びスキーマ情報の対応関係を説明した図である。
【図9】従来技術の説明をした図である。
【符号の説明】
【0052】
10 帳票認識システム
20 帳票
30 認識装置
31 概念辞書データベース
32 スキーマ情報データベース
40 OCRエンジン
50 認識結果

【特許請求の範囲】
【請求項1】
予め帳票の論理構造を定義し、入力された入力帳票の値を取得可能とした帳票認識システムであって、
帳票上の項目名を、項目名に関連する用語に基づいてグルーピングし、複数のグループを作成した概念辞書を記憶する概念辞書データベースと、
前記項目名が属するグループ及び前記入力帳票の値を、所定の言語を用いて要素名及びデータ型によってそれぞれ関連付けて、帳票の種類別に帳票の論理構造を定義して作成した複数のスキーマ情報を記憶するスキーマ情報データベースと、
前記入力帳票の項目名を読み取り手段を用いて読み取った際に、各項目名が概念辞書データベースに記憶されたグループのうち、どのグループに属しているかを参照して抽出し、当該抽出したグループと順序を前記スキーマ情報データベースに記憶された複数のスキーマ情報を参照して前記入力帳票の論理構造を推測し、少なくとも一つの帳票の候補リストを動的に生成する候補リスト生成手段と、
当該候補リスト生成手段が生成した候補リストの中から、帳票の値を読み取る帳票値読み取り手段と、
読み取った帳票の値を、前記スキーマ情報の要素名及びデータ型と照合して整合性を判別する要素名/データ型判別手段と、
を備えたことを特徴とする帳票認識システム。
【請求項2】
前記要素名/データ型判別手段が判別した帳票の値を帳票結果として出力する出力手段を備えたことを特徴とする請求項1に記載の帳票認識システム。
【請求項3】
前記出力手段がリレーショナルデータベースに対して前記帳票結果を出力可能としたことを特徴とする請求項2に記載の帳票認識システム。
【請求項4】
前記帳票値読み取り手段が読み込んだ帳票の値を補正する補正手段を備え、その補正手段は、読み取った帳票の値を構成する文字列のうち、少なくとも一つの文字列が読み取りできた場合には、読み取りすることが不可となった文字列から補正後の項目名を特定することを可能としたこと特徴とする請求項1から請求項3のいずれかに記載の帳票認識システム。
【請求項5】
前記スキーマ情報に用いる所定の言語にXMLを用いたことを特徴とする請求項1に記載の帳票認識システム。
【請求項6】
予め帳票の論理構造を定義し、入力された入力帳票の値を取得可能とした帳票認識方法であって、
帳票上の項目名を、項目名に関連する用語に基づいてグルーピングし、複数のグループを作成した概念辞書を記憶する概念辞書データベースと、
前記項目名が属するグループ及び前記入力帳票の値を、所定の言語を用いて要素名及びデータ型によってそれぞれ関連付けて、帳票の種類別に帳票の論理構造を定義して作成した複数のスキーマ情報を記憶するスキーマ情報データベースと、
前記入力帳票の項目名を読み取り手段を用いて読み取った際に、各項目名が概念辞書データベースに記憶されたグループのうち、どのグループに属しているかを参照して抽出し、当該抽出したグループと順序を前記スキーマ情報データベースに記憶された複数のスキーマ情報を参照して前記入力帳票の論理構造を推測し、少なくとも一つの帳票の候補リストを動的に生成する候補リスト生成手順と、
当該候補リスト生成手順が生成した候補リストの中から、帳票の値を読み取る帳票値読み取り手順と、
読み取った帳票の値を、前記スキーマ情報の要素名及びデータ型と照合して整合性を判別する要素名/データ型判別手順と、
を備えたことを特徴とする帳票認識方法。
【請求項7】
前記要素名/データ型判別手順が判別した帳票の値を帳票結果として出力する出力手順を備えたことを特徴とする請求項6に記載の帳票認識方法。
【請求項8】
前記出力手順がリレーショナルデータベースに対して前記帳票結果を出力可能としたことを特徴とする請求項7に記載の帳票認識方法。
【請求項9】
予め帳票の論理構造を定義し、入力された入力帳票の値を取得可能とした帳票認識方法をコンピュータに実行させるプログラムであって、
そのプログラムは、帳票上の項目名を、項目名に関連する用語に基づいてグルーピングし、複数のグループを作成した概念辞書を記憶する概念辞書データベースと、
前記項目名が属するグループ及び前記入力帳票の値を、所定の言語を用いて要素名及びデータ型によってそれぞれ関連付けて、帳票の種類別に帳票の論理構造を定義して作成した複数のスキーマ情報を記憶するスキーマ情報データベースと、
前記入力帳票の項目名を読み取り手段を用いて読み取った際に、各項目名が概念辞書データベースに記憶されたグループのうち、どのグループに属しているかを参照して抽出し、当該抽出したグループと順序を前記スキーマ情報データベースに記憶された複数のスキーマ情報を参照して前記入力帳票の論理構造を推測し、少なくとも一つの帳票の候補リストを動的に生成する候補リスト生成手順と、
当該候補リスト生成手順が生成した候補リストの中から、帳票の値を読み取る帳票値読み取り手順と、
読み取った帳票の値を、前記スキーマ情報の要素名及びデータ型と照合して整合性を判別する要素名/データ型判別手順と、
をコンピュータに実行させることとしたコンピュータプログラム。
【請求項10】
前記要素名/データ型判別手順が判別した帳票の値を帳票結果として出力する出力手順を備えたことを特徴とする請求項9に記載のコンピュータプログラム。
【請求項11】
前記出力手順がリレーショナルデータベースに対して前記帳票結果を出力可能としたことを特徴とする請求項10に記載のコンピュータプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公開番号】特開2006−134106(P2006−134106A)
【公開日】平成18年5月25日(2006.5.25)
【国際特許分類】
【出願番号】特願2004−322827(P2004−322827)
【出願日】平成16年11月5日(2004.11.5)
【出願人】(596177043)株式会社 ハンモック (3)
【Fターム(参考)】