説明

文書の有効性を決定するためのシステム、方法およびコンピュータプログラム製品

一実施形態による方法は、電子的第1の文書から識別子を抽出するステップと、識別子を使用して、第1の文書と関連付けられた相補的文書を識別するステップと、を含む。第1の文書の有効性は、第1の文書からのテキスト情報、相補的文書からのテキスト情報、および所定のビジネスルールを同時に検討することによって決定される。決定された有効性は、表示として出力される。また、上述の方法論を提供、実行、および/または有効化するためのシステムおよびコンピュータプログラム製品も、提示される。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、文書分析システム、方法、およびコンピュータプログラム製品に関し、より具体的には、本発明は、文書の有効性を決定するためのシステム、方法、およびコンピュータプログラム製品に関する。
【背景技術】
【0002】
現在、ビジネス取引は、2人以上の当事者間の情報の交換として記録される。情報は、送信者によって生成され、種々の手段を介して、例えば紙文書、電子的文書等を介して、受信者に到達可能である。ビジネス取引内では、両当事者が、文書の内容および取引の種類に関するいくつかの情報を有することが暗黙的に推測される。
【0003】
多くの場合、受信当事者は、取引を前提として、文書の内容を比較することによって、受信した文書の内容を認証する必要がある。これは、例えば、ヒトが文書を熟読し、文書内容を既に受信者の所有にある対応する内容と比較することによって達成可能である。しかしながら、文書のレイアウトおよび形式は、送信者間で大きく異なり、大まかに構成されており、関連情報の自動抽出および認識を非常に困難かつ不正確なものにする。さらに、そのような手動検閲は、時間およびコストの両方がかかる。
【発明の概要】
【発明が解決しようとする課題】
【0004】
したがって、現在、自動ビジネス取引文書認証方法の改良の必要性が存在する。
【課題を解決するための手段】
【0005】
一実施形態による方法は、第1の文書のスキャンされた画像上で光学式文字認識(OCR)を実行するステップと、第1の文書から識別子を抽出するステップと、を含む。第1の文書と関連付けられた相補的文書は、識別子を使用して、識別される。第1の文書を相補的文書にマッピングする仮説のリストは、第1の文書からのテキスト情報、相補的文書からのテキスト情報、および所定のビジネスルールを使用して、生成される。第1の文書の有効性は、仮説に基づいて、決定される。決定された有効性は、表示として出力される。
【0006】
別の実施形態による方法は、電子的第1の文書から識別子を抽出するステップと、識別子を使用して、第1の文書と関連付けられた相補的文書を識別するステップと、を含む。第1の文書の有効性は、第1の文書からのテキスト情報、相補的文書からのテキスト情報、および所定のビジネスルールを同時に検討することによって、決定される。決定された有効性は、表示として出力される。
【0007】
また、上述の方法論を提供、実行、および/または有効化するためのシステムおよびコンピュータプログラム製品も、提示される。
【0008】
本発明の他の側面および利点は、一例として、本発明の原理を例証する、図面と関連して検討される場合、以下の発明を実施するための形態から明白となるであろう。
【0009】
本発明の性質および利点だけでなく、好ましい使用形態のより完全なる理解のために、付随の図面と合わせて熟読される、以下の発明を実施するための形態を参照されたい。
【図面の簡単な説明】
【0010】
【図1】図1は、本発明の一実施形態による、文書の有効性を決定するための方法である。
【図2】図2は、本発明の一実施形態による、請求書の有効性を決定するための方法である。
【図3】図3は、本発明の一実施形態による、知的エージェントを使用せず、請求書の有効性を決定するための方法を例証する。
【図4】図4は、一実施形態による、ネットワークアーキテクチャを例証する。
【図5】図5は、一実施形態による、図4のサーバおよび/またはクライアントと関連付けられ得る、代表的ハードウェア環境を示す。
【発明を実施するための形態】
【0011】
以下の説明は、本発明を実行するために現在想定されている、最良の形態である。本説明は、本発明の一般的原理を例証する目的のために行われ、本明細書に請求される発明の概念を制限することを意味するものではない。さらに、本明細書に説明される特定の特徴は、種々の可能性のある組み合わせおよび順列のそれぞれにおいて、他の説明される特徴と組み合わせて使用可能である。
【0012】
本明細書に別途具体的に定義されない限り、すべての用語は、明細書から含意される意味だけでなく、当業者によって理解され、辞書、論文等に定義される意味を含め、その広範な可能性のある解釈が与えられるものとする。
【0013】
また、明細書および添付の請求項で使用されるように、単数形「a」、「an」、および「the」は、別途指定されない限り、複数形を含むことに留置されたい。
【0014】
ビジネス取引をサポートする典型的文書として、物品を購入する際に交換される文書、例えば、注文書、請求書、見積要求、配達証明等の他の文書が挙げられる。当然ながら、多くの他の種類の取引も、存在する。
【0015】
受信当事者は、取引を前提として、多くの場合、データベース内に電子的に格納される、文書の内容を比較することによって、受信した文書の内容を認証する必要がある。すなわち、受信者は、受信した文書から情報を読み出す、または抽出し、それをそのデータベース内に格納された対応する情報と比較する必要がある。これは、例えば、ヒトが文書を熟読し、そのデータをエンコードし、それを受信者のデータベースの対応する内容と比較することによって、達成可能である。情報の抽出は、文書から関連情報を自動的に抽出する技術を利用することによって、少なくともある程度、自動化可能である。
【0016】
今日、多くの文書は、依然として、紙で受信され、ヒトによる読み取り可能性のために構築されている。文書のレイアウトおよび形式は、送信者間で大きく異なり、大まかに構成されており、先行技術方法を使用しての関連情報の自動抽出および認識を非常に困難かつ不正確なものにする。1枚の紙から情報を抽出する方法の1つは、最初に、紙画像をテキストに変換し、次いで、テキストを見進め、必要とされるフィールドの抽出を行う、プログラムの使用によるものである。これらのプログラムの最も高度な点は、テキストまたは画像の特別な特徴を検索し、関連情報を特定することである。これは、文書構造および文書言語の著しい知識を要求する。
【0017】
認証を最終決定するために、抽出されたデータは、抽出されたデータを受信者データベースの内容と比較し、エラーを補正し、取引を認証する、人物またはプログラムに回送される。抽出されたデータとデータベースの内容の効果的自動比較を達成するために、最初に、送信者と受信者の言語との間の意味的差異を解決する必要がある。しばしば、言語には、多くの微妙な差が存在し、自動比較を直接的にし、故に、非効果的にする。例えば、送信者および受信者は、異なる単位を使用し、直接比較不可能な異なる値をもたらす場合がある。したがって、満足のゆく自動化率を達成するために、自動比較に先立って、送信者の言語をそのデータベース内の受信者の言語に翻訳する、データの正規化が、行われる必要がある。
【0018】
ビジネス取引を認証するための代替プロセスは、データを抽出または正規化する必要なく、関与当事者によって理解される、取引の直接的、すなわち、自動比較、したがって、認証を可能にする、電子データ交換(EDI)を利用することである。EDIは、情報交換のための標準化された文書形式の使用を通して、データ正規化問題を事前に解決することによって、本レベルの自動化を達成する。これらの形式の設定は、時間およびコストがかかり、環境変化に容易に適応しないプロセスをもたらす。
【0019】
一実施形態では、ある自動ビジネス取引認証プロセスは、標準化された文書形式を手動で定義する必要なく、EDIに近い自動取引認証レベルを可能にする。これは、上述のような、情報抽出に続き、データ正規化、次いで、受信者のデータベースとの比較といった連続プロセスの範囲を超えて達成される。新しいプロセスは、利用可能なすべての情報を利用し、同時に、取引を認証する。異なる情報源は、受信した文書、そのデータベース内に格納される受信者の取引の予測値、および特有の取引に関するビジネスルールである。新しいプロセスは、これらの源からの情報を分析し、同時に、相補的情報を使用して、相互作用を認証する。
【0020】
具体的には、抽出およびOCRエラーを自動的に補正するだけでなく、データを自動的に正規化し、受信した文書と受信者のデータベースの非常に効率的比較を生み出し、したがって、取引の効率的自動認証をもたらすことが可能である。加えて、経時的に、プロセスは、送信者特有のデータフォーマッティングを学習可能であって、順に、本特有の送信者のための自動取引認証のレベルを改良する。要するに、新しいプロセスは、受信した文書(紙または電子)の源から独立して、独創的に、自動取引認証を可能にする。経時的に、プロセスは、各受信者のための非常に特有のデータ正規化を自動的に構築可能である。本質的に、新しいプロセスは、受信者側のEDIによって使用される、標準化された文書形式を自動的に生成する。
【0021】
一実施形態では、紙の請求書認証プロセスは、以下のステップを含む。最初に、紙の請求書が、スキャンされる。次に、光学式文字認識(OCR)が、スキャンされた請求書に適用される。加えて、情報が、請求書から抽出される。抽出された請求書ヘッダ情報の実施例は、請求書番号、総請求額、送信者の氏名および住所である。数量、記述、単価、および明細行項目の総額等の明細行項目情報の抽出は、効果的かつ確実に行うことは困難である。故に、明細行項目の抽出は、しばしば、割愛される場合がある。
【0022】
さらに、抽出された情報は、手動で認証される。必要に応じて、OCRエラーおよび特有のフィールドに対してエクストラクタによって割り当てられたラベルが、補正される。例えば、注文書番号としてエクストラクタによって識別された番号が、実際に、顧客番号であるかどうか決定される。さらに、抽出された情報の内容は、注文書と整合することによって、認証される。例えば、請求書から抽出された総請求額は、注文書の注文総量と整合されてもよい。また、請求書は、認証された情報を請求書認証ルールと確認することによって、認証される。
【0023】
しかしながら、いくつかの困難点が、本プロセスによって生じる。第1に、効果的かつ信頼できる自動抽出システムの設定は、時間がかかる。特に、上述のように、明細行項目の抽出は、困難である。明細行項目抽出のための自動システムは、しばしば、テンプレート抽出に依存し、ベンダ毎に特注テンプレートを有する必要がある。その上、明細行項目によって保持される情報は、請求書を認証するために重要である。
【0024】
加えて、請求書の認証の場合、抽出された情報の大部分は、無関係である場合がある。説明されたプロセスを考える場合、どの情報が請求書認証のために重要であるか、およびどの情報が無視可能であるかの知識は、抽出された情報の認証に関与するオペレータにとって、利用不可能である。その結果、オペレータは、しばしば、実際に必要とされる以上の情報を認証および補正する。さらに、内容の手動認証は、時間がかかる。内容の自動認証は、請求書と注文書情報との間の意味的差異を処理するために、設定プロセスを要求する。例えば、単位は、請求書と注文書との間で異なる場合がある。要するに、効果的自動整合を達成するために、請求書データを正規化する必要があり得る。データ正規化の設定は、時間および労力がかかる。サプライヤ毎に、特有のデータ正規化が、要求される。同様に、注文物品の記述は、請求書と注文書との間で、実質的に異なる可能性がある。例えば、90度接続パイプは、請求書上では、L型接続パイプ、注文書上では、直角接続パイプとして説明される場合がある。
【0025】
これらの困難点および問題の結果、特に、明細行項目情報も、請求書認証のために必要とされる場合、自動請求書認証は、しばしば、非効果的であって、受信請求書のわずかな部分のみ適用可能となる。上述の最初の2つの困難点を効果的に排除する、電子請求書を使用することによって、プロセスをさらに改良可能である。電子請求書の場合、データ正規化ステップは、自動内容認証のために残る。
【0026】
上述の請求書認証プロセスの不利点の1つは、利用可能な情報の他の源から独立して、一度に1つの情報源を処理する、その連続的性質である。例えば、スキャンされた紙の請求書を考える場合、OCRステップは、スキャンされた画素の入力に与えられた最も可能性の高い文字列の検索を試行する。OCRステップは、抽出情報および注文書と整合することによって抽出された内容認証情報を考慮しない。明らかに、本付加的情報は、可能性のある文字列を制約し、したがって、OCRステップを改良可能である。ビジネスルールは、OCRステップ、抽出ステップだけでなく、データ正規化ステップに恩恵をもたらし得る、別の付加的情報源である。請求書の場合、例示的ビジネスルールとして、明細行項目の総額は、送達された明細行項目数量に単価を乗じたものに等しいはずである。整合ステップを通して、認証の際、本情報を利用することによって、例えば、請求書と注文書との間の単位の差異の曖昧さを解消可能である。これらは、認証プロセスにおいて、同時に付加的情報を利用する利点を例証する、多くの実施列のうちのいくつかにすぎない。
【0027】
上述のプロセスと対照的に、後述の請求書認証プロセスは、請求書の有効性を決定するために、同時に、いくつかまたはすべての利用可能な情報源を利用する。一般に、利用可能な情報源として、請求書自体、対応する注文書、配達受領書、およびビジネスルールが挙げられる。請求書認証プロセスは、OCR、抽出、注文書と整合することによって抽出された内容の認証、およびビジネスルールから情報を得る。所与の情報の組み合わされた制約下、可能な仮説を評価し、その結果、請求書の有効性を示す、信頼スコアをもたらす。加えて、プロセスもまた、潜在的問題を示唆する。例えば、注文書の任意の位置と整合しない、請求書上の明細行項目、不足送達、超過送達、請求書と注文書との間の価格差等である。
【0028】
図1は、文書の有効性を決定するための方法100を示す。方法100は、任意の所望の環境において実行されてもよいことに留意されたい。
【0029】
操作102に示されるように、光学式文字認識(OCR)が、取引全体の一部として使用される、紙文書であり得る、第1の文書のスキャンされた画像上で行われる。第1の文書は、手書き、タイプ、またはプリントされたテキストの任意の物理的表現を含んでもよい。例えば、第1の文書として、請求書、領収証、明細書、販売注文文書、保険金請求文書等を含んでもよい。別の実施例では、第1の文書として、福利厚生の説明文書、医療保険文書等を含んでもよい。
【0030】
加えて、一実施形態では、スキャンされた画像は、第1の文書をスキャンすることによって、生成されてもよい。例えば、文書は、個人または市販のハードウェアスキャンデバイス、スキャンソフトウェア等を使用して、スキャンされてもよい。
【0031】
さらに、スキャンされた画像は、文書のスキャンから得られた任意の画像を含んでもよい。例えば、スキャンされた画像は、JPEG画像、ビットマップ画像、TIFF画像、RAW画像等を含んでもよい。当然ながら、しかしながら、スキャンされた画像は、任意の画像の種類を含んでもよい。加えて、本実施形態に照らして、光学式文字認識は、スキャンされた画像の機械編集可能テキストへの任意の機械的または電子的変換を含んでもよい。
【0032】
上述のOCRステップは、特定の状況では、行われる必要がない場合があることに留意されたい。例えば、ある事例では、第1の文書は、電子的文書を含んでもよい。
【0033】
加えて、操作104に示されるように、識別子が、第1の文書から抽出される。本実施形態に照らして、識別子は、識別の目的のために使用可能な第1の文書の任意の側面を含んでもよい。例えば、識別子は、注文書番号、文書の見出し、文書の表題、OCRされたバージョンの文書のファイル名等を含んでもよい。一実施形態では、識別子は、スキャンされ、OCRされたバージョンの第1の文書から抽出されてもよい。
【0034】
別の実施形態では、識別子は、第1の文書の1つ以上の部分をスキャンすることによって、第1の文書から抽出されてもよい。さらに別の実施形態では、識別子は、文書のOCRを行うステップと同時に抽出されてもよい。さらに別の実施形態では、識別子は、手動で抽出されてもよい。しかしながら、識別子は、当然ながら、任意の様式において、第1の文書から抽出されてもよい。
【0035】
さらに、代替アプローチでは、第1の文書から識別子を抽出するのではなく、識別子は、いくつかの他の源から、例えば、識別子を入力するユーザから、第1の文書上のバーコードのスキャンから、第1の文書の電子画像のファイル名から等の入力であってもよい。
【0036】
さらに、操作106に示されるように、第1の文書と関連付けられた相補的文書(または、複数の文書)が、識別子を使用して、識別されてもよい。本実施形態に照らして、相補的文書として、何らかの方法で、第1の文書と関連付けられた任意の文書を含んでもよい。例えば、相補的文書として、注文書、覚書、配達受領書等のうちの少なくとも1つを含んでもよい。別の実施形態では、相補的文書は、第1の文書と関係を有してもよい。例えば、相補的文書として、第1の文書と関連する注文書を含んでもよく、その場合、第1の文書は、請求書である。
【0037】
別の実施形態では、相補的文書は、識別子をデータベース、リポジトリ等と比較することによって、識別されてもよい。例えば、注文書は、注文書番号を注文書リポジトリと比較することによって、識別されてもよい。さらに別の実施形態では、相補的文書は、読み出されてもよい。例えば、相補的文書は、データベース、リポジトリ等から読み出されてもよい。
【0038】
また、オプションとして、識別子は、加えて、第1の文書を相補的文書とリンクする、付加的文書を使用して、決定されてもよい。例えば、ベンダ識別子は、未出荷注文書番号のリストをベンダの識別子とリンクする、付加的文書から抽出されてもよい。
【0039】
さらに、操作108に示されるように、第1の文書を相補的文書にマッピングする仮説のリストが、第1の文書からのテキスト情報、相補的文書からのテキスト情報、および所定のビジネスルールを使用して、生成される。一実施形態では、第1の文書および相補的文書からのテキスト情報として、数値情報、テキスト、記号等を含んでもよい。例えば、テキスト情報として、物品の記述、明細行項目、ヘッダフィールド項目、単価、物品の数量、計算価格等を含んでもよい。
【0040】
別の実施形態では、いくつかのテキスト情報は、第1の文書から抜けている場合がある。例えば、OCRステップによるエラーが存在する場合がある。それに応じて、任意の空隙を充填するために、第1の文書の列が、認証されてもよく、第1の文書からの正確なテキスト情報を取得するために、平方平衡化等の操作が行われてもよい。
【0041】
さらに別の実施形態では、第1の文書上の用語は、同一物を参照するものとして、相補的文書上の異なる用語と相関されてもよい。例えば、サプライヤ、顧客等の異なる実体は、製品、測定単位等の記述のために、異なる記述または異なる言語を使用する場合がある。別の実施形態では、直接相関が検索されない場合、第1の文書上の用語に対して、最近似整合が、決定されてもよい。加えて、用語の相関は、データベース内に格納されてもよい。例えば、翻訳データベースは、後の使用のために、仮説のリストの生成の際、オンザフライで構築されてもよい。
【0042】
加えて、仮説のリストは、線、色等、第1の文書および相補的文書からの非テキスト情報を使用して、生成されてもよい。さらに、仮説のリストは、第1の文書および相補的文書からの場所情報を使用して、生成されてもよい。例えば、場所情報として、第1の文書または相補的文書内のテキスト情報の場所を含んでもよい。本場所情報は、仮説のリストの生成を支援してもよい。例えば、正確であることが分かっているテキスト情報の場所を使用して、エラーが他のテキスト情報とともに存在するかどうかを決定してもよい。
【0043】
別の実施形態では、仮説は、第1の文書および対応する文書のテキスト情報の1つ以上の項目間の任意の対応を含んでもよい。例えば、仮説は、第1の文書からのテキスト情報と対応する文書からのテキスト情報との間の整合を含んでもよい。さらに、所定のビジネスルールとして、ビジネスに関連する任意の所定のルールを含んでもよい。一実施形態では、所定のビジネスルールは、第1の文書または相補的文書に関連してもよい。例えば、所定のビジネスルールとして、明細行項目の総額は、数量を単価で乗じたものに等しいというルールを含んでもよい。別の実施例では、所定のビジネスルールとして、全明細行項目は、第1の文書の小計と等しい必要があるというルールを含んでもよい。
【0044】
加えて、予測値または他の制約が、仮説のリストの生成の際に使用されてもよい。例えば、特定の量のある製品が予測されていることを開示する、ERPシステムからの予測値が、使用されてもよい。
【0045】
一例示的実施形態では、第1の文書と相補的文書との間で潜在的に整合する任意のフィールドが、仮説を生成するために、潜在的フィールドとして選択される。加えて、単一フィールドは、複数の潜在的対応する仮説を有してもよい。すべての潜在的に整合するフィールドが、決定されると、第1の文書および/または相補的文書の構造が決定され、フィールドが、論理的順番に群化される。例えば、フィールドは、「最近傍」様式で群化されてもよい。別の実施例では、フィールドは、記述、質、価格、合計等として、群化されてもよい。さらに、次いで、所定のビジネスルールを使用して、フィールドの有効性を確認する。例えば、所定のビジネスルールは、個々の量フィールドを個々の価格フィールドと乗じたものが、総額フィールドと等しいことを確認してもよい。このように、正確な仮説が、再構築または抽出をほとんど使用せずに、生成され得る。
【0046】
別の例示的実施形態では、抽出は、テキスト情報だけでなく、各フィールドに関する初期概念を提供するために、OCRされたバージョンの第1の文書にわたって実行される。抽出されたテキスト情報、所定のビジネスルール、および相補的文書を利用した分析後、抽出されたテキスト情報が、改変される。例えば、番号、文字、および他のフィールド項目が、所定のビジネスルールならびに相補的文書から得られた情報に従って、改変される。改変が行われた後、付加的分析が、改変された抽出テキスト情報、所定のビジネスルール、および相補的文書を利用して、行われる。このように、抽出されたテキスト情報は、相補的文書により正確に関連するように、微調整されてもよい。
【0047】
さらに別の例示的実施形態では、抽出は、明細行項目を表す、すべての明細行および明細行群を識別するために、OCRされたバージョンの第1の文書にわたって実行される。加えて、相互相関が、相補的文書と抽出された第1の文書からのテキスト情報との間で行われる。さらに、第1の文書は、相互相関を使用して、再構築される。
【0048】
別の実施形態では、第1の文書内のOCRエラーは、相補的文書からのテキスト情報および所定のビジネスルールのうちの少なくとも1つを使用して、補正されてもよい。加えて、別の実施形態では、第1の文書からのデータは、相補的文書からのテキスト情報および所定のビジネスルールのうちの少なくとも1つを使用して、正規化されてもよい。さらに、さらに別の実施形態では、相補的文書からのデータは、第1の文書からのテキスト情報および所定のビジネスルールのうちの少なくとも1つを使用して、正規化されてもよい。例えば、正規化として、グラムからキログラム、オンスからグラム、ドルからユーロ等への変換を含んでもよい。
【0049】
加えて、操作110に示されるように、第1の文書の有効性は、仮説に基づいて、決定される。本実施形態に照らして、有効性は、第1の文書が、相補的文書と十分に関連するかどうかの表示を含んでもよい。例えば、有効性として、第1の文書が相補的文書と整合することの表示を含んでもよい。加えて、有効性は、仮説を分析することによって、決定されてもよい。別の実施形態では、加えて、決定は、仮説の信頼レベルに基づいてもよい。
【0050】
さらに、一実施形態では、第1の文書の有効性を決定する際、潜在的問題に遭遇すると、警告が、生成されてもよい。例えば、警告として、第1および相補的文書における、予測された類似または同一値の不整合の識別を含んでもよい。加えて、別の実施形態では、第1の文書の明細行項目、ヘッダフィールド項目等の項目の補正および認証のうちの少なくとも1つを示す、ユーザ入力が、受信されてもよい。
【0051】
さらに、別の実施形態では、第1の文書の有効性を決定するステップは、第1の文書内の予測されるまたは実際の明細行項目、ヘッダフィールド項目等のための値を自動的に予想するステップを含んでもよい。また、第1の文書の有効性を決定するステップは、相補的文書からのテキスト情報およびビジネスルールのうちの少なくとも1つに基づいて、第1の文書内の予測されるまたは実際の明細行項目、ヘッダフィールド項目等のための値を自動的に補正することを含んでもよい。さらに別の実施形態では、第1の文書は、仮説およびビジネスルールを使用して、再構築されてもよく、その場合、有効性を決定するステップは、再構築された第1の文書を分析する。オプションとして、第1の文書の有効性を決定するステップは、第1の文書からのテキスト情報を全体的に認証するステップを含んでもよい。例えば、請求書の各明細行項目が、全体的に認証されてもよい。
【0052】
さらに別の実施形態では、第1の文書が有効であると決定すると、知識が、生成された仮説に基づいて、生成されてもよい。例えば、知識を生成するステップは、変換を使用するステップを含んでもよい。当技術分野において周知の任意の変換方法を使用可能である。種々の実施形態で使用され得る、いくつかの変換方法は、2007年5月23日出願のSchmidtlerらの米国特許出願公開第US2008−0097936A1号に記載されており、参照することによって本明細書に組み込まれる。
【0053】
一例示的実施形態では、抽出された第1の文書からのテキスト情報が、個人によって検証されると、または抽出されたテキスト情報が、完全整合の決定によって、コンピュータによって検証されると、検証結果が、エクストラクタに送信される。このように、エクストラクタは、検証された情報から「学習」し、検証された情報を将来的抽出および分析に適用可能である。
【0054】
さらに、操作112に示されるように、決定された有効性は、表示として出力される。出力表示は、テキスト、画像、音、または決定された有効性を表す任意の他の表示を含んでもよい。例えば、表示は、グラフ表示デバイス等に出力されてもよい。さらに、表示は、例えば、RAM、ROM、ハードドライブ等、当技術分野において周知の種類の記憶媒体に出力され、そこに格納されてもよい。このように、第1の文書は、ほとんどの場合、ヒトの介入を伴わずに、第1の文書内の有効ではないものの正確な知識をもって、シームレスに認証され得る。加えて、一実施形態では、決定された有効性を使用して、ビジネス取引を認証してもよい。
【0055】
加えて、第1の文書が有効であることの決定に失敗すると、または第1の文書が無効であることを決定すると、照合画面が、ユーザに出力されてもよい。例えば、第1の文書内の1つ以上のエラーが、相補的文書と解決不可能な整合をもたらす場合、エラーが、照合画面に提示され、そこで、ヒトオペレータ(例えば、顧客またはサプライヤの従業員)が、第1の文書の有効性の決定を支援するために、エラーを閲覧し、第1の文書を補正してもよい。ヒトによる操作は、メッセージ、例えば、電子メールメッセージを介して、解決不可能なエラーが、第1の文書とともに存在することを通知されてもよい。ヒトによる補正が行われた後、次いで、方法は、補正された第1の文書上で反復されてもよい。
【0056】
別の実施形態では、照合画面にアクセスするための通知が、第1の文書の送信者に送信されてもよい。さらに、第1の文書への修正は、照合画面を閲覧するユーザによって、受信されてもよい。さらに、修正された第1の文書の再認証が、試行されてもよい。
【0057】
本明細書に提示される方法論は、同一取引に関連し得る、またはそうではない、連続文書のために反復されてもよい。例えば、第2の文書が、第1の文書と同一取引の一部であると想定する。第1の文書の有効性を決定後、第2の文書の有効性が、オリジナルの相補的文書を再度使用して、および/または第1の文書を相補的文書として使用して、決定されてもよい。したがって、例証的シーケンスは、図1の方法を実行し、第1の文書を認証し、次いで、第2の文書のスキャンされた画像上でOCRを行い、第2の文書から識別子を抽出することであってもよい。第2の文書と関連付けられた第2の相補的文書が、識別される。上述のように、第2の相補的文書は、第1の文書を認証するために使用されたものと同一であってもよく、および/または認証された第1の文書は、第2の相補的文書として使用されてもよい。別のアプローチでは、第2の相補的文書は、いくつかの他の文書全部である。第2の文書を第2の相補的文書にマッピングする仮説のリストは、第2の文書からのテキスト情報、第2の相補的文書からのテキスト情報、および所定のビジネスルールを使用して、生成される。第2の文書の有効性は、仮説に基づいて決定され、第2の文書の決定された有効性は、ある表示として出力される。
【0058】
一実施例では、第1の文書は、請求書であってもよく、その有効性は、相補的文書として関連付けられた注文書を使用して、決定される。また、関連付けられた配達証明も、認証されるべきである。しかしながら、2つの文書上に示される数量、価格等の方法が変動するために、配達証明を注文書と認証することは困難であると想定される。請求書が認証されると、配達証明を認証するために、相補的文書として使用されてもよい。
【0059】
同様に、第1の文書の有効性の決定を試行するために、一般的方法が、再度行われてもよいが、今回は、異なる相補的文書が使用される。本アプローチは、2つ以上の有効性の決定を提供することによって、第1の文書の有効のより高い信頼性を提供するために有用となり得る。また、本アプローチは、文書の認証際、最初の試行が失敗した場合に、使用されてもよい。
【0060】
図2は、別の実施形態による、請求書の有効性を決定するための方法200を示す。オプションとして、方法200は、図1のアーキテクチャおよび環境に照らして、実行されてもよい。しかしながら、方法200は、当然ながら、任意の所望の環境において実行されてもよい。
【0061】
操作202に示されるように、請求書が、スキャンされる。加えて、操作204では、スキャンされた請求書が、OCRされる。さらに、操作206では、請求書から、注文書番号および/または販売者の住所の抽出が、試行される。一実施形態では、抽出は、請求書に対応する注文書を識別する目的のためであってもよい。別の実施形態では、抽出は、単純エクストラクタによって、行われてもよい。
【0062】
操作208では、自動抽出が失敗したかどうかが決定される。失敗した場合、操作210では、注文書番号および/または販売者の住所が、請求書から手動で抽出される。
【0063】
加えて、操作208において、自動抽出が失敗していないと決定される場合、操作212では、注文書情報が、注文書リポジトリ214から、所与の請求書のために要求される。例えば、注文書情報は、ERPシステムから要求されてもよい。
【0064】
さらに、操作216では、所与の請求書のための注文書が、注文書リポジトリ214から読み出される。一実施形態では、一式の注文書が、所与の請求書から読み出されてもよい。
【0065】
また、操作216において読み出された所与の請求書のための注文書だけでなく、スキャンされ、OCRされた請求書も、統合反復請求書認証を行う、統合された整合および抽出アルゴリズム220を利用して、処理される。一実施形態では、明細行項目情報は、統合された整合および抽出アルゴリズム220によって、スキャンされ、OCRされた請求書から、自動的に識別および認証されてもよい。例えば、明細行項目の単価、数量、記述、および明細行項目価格に加え、小計、税額、発送費および定数量、ならびに総額が、請求書から、自動的に識別および認証されてもよい。別の実施例では、統計的エクストラクタが、請求書にわたって実行されてもよい。統計的エクストラクタは、単価、数量、説明、明細行項目価格等の抽出されたデータに関する情報を提供してもよい。
【0066】
加えて、操作222では、統合された整合および抽出アルゴリズム220によって、請求書が有効であるかどうかが決定される。例えば、請求書が、不完全または不正確なデータを含有するかどうかが決定されてもよい。操作222において、請求書が有効であることが決定される場合、操作224では、請求書が、その有効性を前提として、さらに処理される。操作222において、請求書が無効であると決定される場合、操作226では、請求書は、認証プロセスによって検出された1つ以上のエラーに従って、さらに処理される。
【0067】
しかしながら、操作222において、さらなる入力が必要とされると決定される場合、操作228では、知的エージェントが、任意の整合結果を分析し、認証を妨害した特有の問題を決定する。加えて、操作230では、操作228において、ユーザからのさらなる入力が必要であると、知的エージェントによる分析から得られた特有の問題が、表示される。さらに、操作232では、ユーザは、任意の要求されたさらなる入力を供給し、本さらなる入力は、順に、統合された整合および抽出アルゴリズム220とともに、操作218において抽出された情報および操作216において読み出された所与の請求書のための注文書を利用して、処理される。
【0068】
例えば、請求書が、自動的に認証不可能である場合、システムは、ユーザに、請求書の自動認証を妨害した請求書上の特有のフィールドのOCRされたデータおよび抽出結果を補正ならびに認証するよう指示することによって、ユーザから付加的情報を要求してもよい。次いで、補正され、認証された情報は、付加的情報を考慮して、請求書の有効性を再評価するために、統合された整合および抽出アルゴリズム220にフィードバックされてもよい。オプションとして、本プロセスは、請求書が、認証される、または請求書を無効にする、請求書に関する深刻な問題が識別されるまで、反復されてもよい。
【0069】
別の実施例では、システムは、高い正確性をもって、自動認証を妨害する請求書に関する特有の情報を自動的に識別し得る。これは、ビジネスルールを利用して、整合仮説を分析する、知的エージェントによって、達成されてもよい。知的エージェントは、必要な入力を最小限にし、非常に効率的手動認証および補正をもたらし得る。
【0070】
その結果、上述の方法200は、他の請求書認証アプローチと比較して、多くの利点をもたらす。例えば、上述の方法200は、ゼロ設定を提供してもよく、任意のヒトの介入を伴わずに、実質的に多数の請求書をシームレスに処理可能にし得る。加えて、上述の方法200は、OCRおよび抽出結果の手動認証ならびに補正の加速化だけでなく、無効請求書の効率的識別も提供し得る。このように、不足送達、超過送達、および超過価格設定等の状況が、専門の従業員がそのような請求書を検索または分析する必要なく、1つ以上の請求書に基づいて、発生しているかどうかが決定され得る。
【0071】
さらに、上述の方法200は、異なる利用可能な情報源の同時使用を提供してもよい。抽出からの知識を利用し、それを注文書の予測値と比較し、適用可能ビジネスルールと確認することによって、上述の方法200は、改良された抽出の正確性をもたらし得る。特に、明細行項目抽出の正確性は、実質的に改良され得る。さらに、上述の方法200は、自動OCRエラー補正だけでなく、自動データ正規化を提供してもよい。また、上述の方法200は、統合プロセスであるため、任意の改良が、相互に助長しあい得る。例えば、改良されたOCRは、改良された抽出をもたらし、順に、より優れた整合をもたらし得る等である。
【0072】
図3は、さらに別の実施形態による、知的エージェントを使用せず、請求書の有効性を決定するための方法300を示す。オプションとして、方法300は、図1および/または2のアーキテクチャならびに環境に照らして、実行されてもよい。しかしながら、方法300は、当然ながら、任意の所望の環境において、実行されてもよい。
【0073】
操作302に示されるように、請求書が、スキャンされる。加えて、操作304では、スキャンされた請求書が、OCRされる。さらに、操作306では、請求書から、注文書番号および/または販売者の住所の抽出が、試行される。操作308では、自動抽出が失敗したかどうかが、決定される。失敗した場合、操作310では、注文書番号および/または販売者の住所は、請求書から手動で抽出される。
【0074】
加えて、操作308において、自動抽出が失敗しなかったと決定される場合、操作312では、注文書情報が、注文書リポジトリ314から、所与の請求書のために要求される。例えば、注文書情報は、ERPシステムから要求されてもよい。
【0075】
さらに、操作316では、所与の請求書のための注文書は、注文書リポジトリ314から読み出される。一実施形態では、一式の注文書が、所与の請求書のために読み出されてもよい。
【0076】
また、スキャンされ、OCRされた請求書だけでなく、操作316において読み出された所与の請求書のための注文書が、統合反復請求書認証を行う、統合された整合および抽出アルゴリズム320を利用して、処理される。加えて、操作322では、統合された整合および抽出アルゴリズム320によって、請求書が有効であるかどうかが、決定される。例えば、請求書が不完全または不正確なデータを含有するかどうかが、決定されてもよい。
【0077】
操作322において、請求書が有効であると決定される場合、操作324では、請求書は、その有効性を前提して、さらに処理される。操作322において、請求書が無効であると決定される場合、操作326では、請求書は、認証プロセスによって検出された1つ以上のエラーに従って、さらに処理される。
【0078】
しかしながら、操作322において、さらなる入力が必要であると決定される場合、操作328では、現在の整合結果が、表示される。加えて、操作330では、ユーザは、さらなる入力をシステムに供給し、本さらなる入力は、順に、統合された整合および抽出アルゴリズム320とともに、操作318において抽出された情報ならびに操作316において読み出された所与の請求書のための注文書を利用して、処理される。
【0079】
一実施形態では、請求書の有効性は、OCRからの情報、抽出からの情報、注文書との整合、ビジネスルール、および潜在的に手動で認証される情報を同時に利用することによって、決定されてもよい。本統合された整合プロセスのために使用される、アルゴリズムの実施例は、以下の実施形態に説明される。
【0080】
本実施形態に照らして、位置は、注文書位置を含み、請求書明細行は、請求書上の物理的明細行を含み、明細行項目は、送達される特有の物品および対応する料金の記述を含む。加えて、明細行項目フィールドは、特定の意味を伴う、明細行項目の構成要素、例えば、送達される物品の記述、単価、数量、および/または計算価格を含む。さらに、記述は、送達される物品を記述する、特有の明細行項目フィールドを含む。また、位置整合候補(PMC)は、注文書位置に整合する候補である、明細行項目の組み合わせを含む。一実施形態では、PMCは、位置に対して1対1のマッピングを行う一方、明細行項目は、必ずしも、位置に対して1対1のマッピングを有するわけではない。
【0081】
整合および抽出アルゴリズムは、請求書上に与えられた情報を対応する注文書と比較することによって、請求書を認証する。この目的を達成するために、アルゴリズムは、以下のタスクを行う。最初に、アルゴリズムは、所与の請求書上の明細行項目を本請求書の未出荷注文書位置と関連付けることによって、明細行項目を認証する。加えて、アルゴリズムは、合計、小計、税金だけでなく、認証された明細行項目に対する発送費および定数量等の他の付加的料金のための抽出された値を考慮して、請求書の一貫性を確認することによって、請求書を認証する。さらに、アルゴリズムは、請求書の有効性を示すスコアだけでなく、アルゴリズムによって決定された明細行項目および注文書位置に対するそのフィールドの最良の関連性を出力する。
【0082】
アルゴリズムは、整合仮説のリストを生成する。一実施例では、整合仮説は、明細行項目および未出荷注文書位置のリストに対するそのそれぞれのフィールドの可能性のある関連性であるだけでなく、合計、小計、税金、および請求書を認証するために必要な他の付加的料金のための可能性のある値である。アルゴリズムは、生成された仮説のそれぞれに対して、関連性および認証の全体的コストを決定する。最もコストのかからない仮説が、最終結果として、選択される。
【0083】
コストは、異なる情報源に基づいてもよい。例えば、アルゴリズムは、OCR結果および文字の信頼性を利用してもよい。加えて、アルゴリズムは、エクストラクタ結果、例えば、請求書上のトークン毎に、可能性のあるラベル割当のリストおよび関連付けられた信頼性を利用してもよい。さらに、アルゴリズムは、OCRの補正および抽出結果だけでなく、注文書情報およびビジネスルール等、ユーザ提供入力を利用してもよい。
【0084】
整合仮説は、2つのステッププロセスにおいて生成される。第1のステップは、請求書の明細行項目から一式のPMCを形成する。しかしながら、ここでの複雑な要因は、明細行項目が、必ずしも、位置に対して1対1にマッピングされない場合があることである。時として、いくつかの明細行項目は、同一位置にマッピングされる場合がある。加えて、一実施形態では、いくつかの位置は、同一明細行項目にマッピングされる場合がある。故に、アルゴリズムは、抽出およびOCR結果を考慮して、明細行項目を組み合わせることによって、PMCを生成する。加えて、さらに別の実施形態では、いくつかの位置が同一明細行項目にマッピングされる場合を処理するために、明細行項目整合候補(LIMC)が、位置集合から作成されてもよい。
【0085】
第2のステップは、生成されたPMC集合の特有の1対1マッピングを位置に対して選択することによる整合仮説の作成および結果として生じる認証を最終決定する。別のアプローチでは、明細行項目に対する生成されたLIMC集合の特有の1対1マッピングが、選択される。さらに別のアプローチでは、上述の組み合わせが、使用されてもよい。
【0086】
便宜上、以下は、PMCを指すが、類似方法論が、LIMCおよび/またはPMCとLIMCの組み合わせの使用に適用されてもよいことを理解されたい。整合仮説の全体的コストcは、表1に示されるように、2つのステップの個々のコストの合計である。
【0087】
表1
c=cPMC+cMAP
表1に示されるように、cPMCは、特有のPMC集合を生成するコストを示し、cMAPは、位置に対する生成されたPMC集合の特有の1対1マッピングおよび請求書の認証と関連付けられたコストである。コストcPMCは、表2に示されるように、以下の合計に因数分解される。
【0088】
表2
cPMC=cprior+cline+cextraction+cOCR+csequence+calignment
異なるコストcprior、cextraction、cOCR、csequence、calignment、およびclineは、表3に示されるように定義される。
【0089】
表3
cprior:明細行項目の特有の組み合わせと関連付けられたコスト。明細行項目の組み合わせに関する以前の知識を含有する、発見的コストである。例えば、請求書上に順序通りに現れる明細行項目の組み合わせは、非連続明細行項目の組み合わせより好ましい。
cline:明細行項目対一般的請求書明細行となるように、本PMC集合のために使用される、明細行項目の確率の対数和。確率は、一般的請求書明細行と比較して、異なるフォーマットの明細行項目に基づく。
cextraction:本PMC集合のためのラベル:記述、数量、単価、および計算価格が割り当てられたトークンの抽出確率の対数和。
cOCR:本PMC集合によって、ラベル:数量、単価、および計算価格が割り当てられたトークンは、数量×単価=計算価格の制約を充足する必要がある。コストcOCRは、これらのトークンにおける異なる文字のOCR信頼性を考慮して、本代数的制約を充足するステップと関連付けられたコストである。
csequence:本コストは、明細行項目フィールドのいくつかの配列は、他よりも可能性が高いという以前の知識を獲得する。例えば、請求書上では、計算価格が、明細行項目上の第1の明細行項目フィールドに観察され、単価、数量、そして最後に記述が続く可能性はなく、反対に、記述、数量、単価、および計算価格の配列が、明細行項目に非常に一般的である。
calignment:明細行項目フィールドが垂直に整列される傾向にあるという観察を反映するコスト。
【0090】
第2のステップのマッピングコストcMAPは、表4に示される。
【0091】
表4
cMAP=cmatch+cvalid
変数cmatchは、位置に対する本PMC集合の1対1マッピングの総コストを表す。ある位置に対して単一PMCを整合させる個々の整合コストの和である。単一整合コストは、位置における対応する入力に対する個々の明細行項目フィールド:説明、数量、単価、および計算価格のファジー整合のコストから導出される。ファジー整合は、抽出された明細行項目フィールド内の個々の文字のOCR信頼性を考慮する。
【0092】
変数cvalidは、位置に対して選択された本PMC集合の1対1マッピングを考慮して、請求書の有効性を決定し、本情報を所定のビジネスルールに従って請求書から抽出された付加的情報と確認するコストを表す。例えば、デフォルトのビジネスルールは、本PMC集合の計算価格の和が、請求書小計、請求書合計、税金、ならびに発送費および手数料等の付加的抽出された料金のために抽出された値と釣り合うことであってもよい。コストは、抽出された値の抽出確率および個々の文字の関連付けられたOCR信頼性に基づいてもよい。
【0093】
整合仮説の数は、明細行項目の数だけでなく、位置に応じて、階乗式に増加する。故に、最良整合仮説のための全数検索は、先行技術方法を使用すると、数十以上の明細行項目および位置を伴う請求書の場合、直ぐに非実用的となる。高度アルゴリズムは、効率的かつ効果的に検索の近似値を求める。選択されたアプローチは、以下の段落に説明される。
【0094】
可能性のあるPMC集合の数は、明細行項目の数に階乗式である。同様に、特有のPMC集合を前提とした、位置に対する可能性のある1対1マッピングの数も、位置および明細行項目の数に階乗式である。故に、結果として生じる可能性のある整合仮説の数は、マッピングの階乗式数と組み合わせられたPMC集合の階乗式数であって、上述のように、先行技術方法を使用すると、整合仮説の全数検索空間を非実用的なものとする。
【0095】
マッピング空間から独立して、PMC集合空間を検索することは、検索の複雑度を低下させるであろう。しかしながら、本アプローチは、明細行項目と位置の準最適関連性をもたらす。これは、整合仮説検索空間に厳し過ぎる制限を適用し、局所最適をもたらす。例証的実施例は、めったに観察されないレイアウトの明細行項目を伴う、請求書である。本事例では、抽出された明細行項目フィールドに対する最良の推測は、系統的に誤っている可能性がある。さらに、cPMCにおける付加的コストは、誤抽出結果を克服するように、問題を十分に抑制せず、したがって、最終的には、明細行項目と位置との誤関連性をもたらす。この場合、マッピングコストcMAPに含有される情報の同時分析が、問題を解決するために必要である。
【0096】
選択されたアルゴリズムは、PMC集合空間およびマッピング空間を同時に検索する。これは、特有の問題の先験的知識を利用することによって、明細行項目および位置の数を考慮して、検索空間の組み合わせ増加に対処する。例えば、特有のPMC集合を前提として、すべての可能性のあるマッピングの全数検索は、不必要である。この時点で、問題は、十分に抑制され、最良マッピングのための盲目的検索は、十分となる。一方、最良PMC集合のための盲目的検索は、明細行項目と位置との準最適関連性をもたらす傾向にある。検索のために採用される最終戦略は、PMC集合空間の制限された組み合わせ検索を適用し、特有のPMC集合を前提として、それを最良のマッピングのための盲目的検索と組み合わせることである。アルゴリズムは、PMC集合空間の制限された組み合わせ検索のために、確率論的アニーリングを使用する。
【0097】
【表1】

表5は、上述のプロセスをより詳細に説明する。初期PMC集合を生成し、個々のPMCを位置に盲目的に関連付けることによって、整合仮説を開始する。アルゴリズムのメインループは、整合仮説空間を通して反復することによって、初期整合仮説の改良を試行する。メインループの各反復において、アルゴリズムは、確率論的アニーリングを使用して、PMC集合を選択し、盲目的検索を使用して、位置に対するその最良マッピングを決定する。アルゴリズムは、全体的コストcの改良が限界になる時を決定する。
【0098】
【表2】

表6は、PMC集合を反復的に生成するための手順を例証する。修正されたPMC集合は、最初に、本明細行項目の組み合わせおよび明細行項目候補の検討される集合にわずかな変更を行うことによって、生成される。変更は、コスト:cpriorおよびclineに従って、サンプリングされる。本アニーリング温度を前提とすると、より高いコストcprior+clineを伴う、選択された変更は、時として、受容される。第2のステップでは、いくつかの明細行項目フィールドのラベルは、コスト:cextraction、cOCR、csequence、calignment、および本アニーリング温度を使用して、無作為に修正される。
【0099】
本発明は、特有の実施形態を参照して、例証および説明されたが、さらなる修正および改良が、当業者に想起されるであろう。したがって、本発明は、例証される特定の形式に限定されず、本明細書の教示のあらゆる可能性のある修正を網羅することが、添付の請求項に意図されることを理解されたい。
【0100】
本説明は、当業者が本発明を作成および使用可能となるように提示され、本発明の特定の用途およびその要件に照らして、提供される。開示される実施形態に対する種々の修正は、当業者に容易に明白となり、本明細書に定義される一般的原理は、本発明の精神および範囲から逸脱することなく、他の実施形態および用途に適用されてもよい。したがって、本発明は、示される実施形態に限定されることが意図されるものではなく、本明細書に開示される原理および特徴に準拠して、最大限の範囲が供与される。
【0101】
特に、本明細書で論じられる種々の実施形態は、複数のコンピュータシステムの中でも、通信の手段として、インターネットを使用して、実装される。当業者は、本発明が、通信媒体として、インターネットの使用に限定されず、本発明の代替方法が、専用イントラネット、LAN、WAN、PSTN、または他の通信手段の使用に対応してもよいことを認識するであろう。加えて、有線、無線(例えば、無線周波数)、および任意の通信リンクの種々の組み合わせが、利用されてもよい。
【0102】
本発明の本実施形態が冷笑的に実行されるプログラム環境は、ファクシミリ装置および携帯型コンピュータ等、1つ以上の汎用コンピュータまたは特殊用途デバイスを組み込む。そのようなデバイス(例えば、プロセッサ、メモリ、データ記憶装置、入力および出力デバイス)の詳細は、周知であるため、明確性のために、省略される。
【0103】
また、本明細書に提示される技法は、種々の技術を使用して実装される場合があることを理解されたい。例えば、本明細書に説明される方法は、コンピュータシステム上で実行するソフトウェア内に実装される、またはマイクロプロセッサの組み合わせ、あるいは他の特別に設計されたアプリケーション特有の統合された回路、プログラム可能論理デバイス、もしくは種々のそれらの組み合わせを利用して、ハードウェア内に実装されてもよい。特に、本明細書に説明される方法は、搬送波、ディスクドライブ、またはコンピュータ読み取り可能媒体等の記憶媒体上に常駐する、一連のコンピュータ実行可能命令によって、実装されてもよい。搬送波の例示的形式は、ローカルネットワークまたはインターネット等の公的にアクセス可能なネットワークに沿って、デジタルデータストリームを伝達する、電気、電磁気、または光信号であり得る。加えて、本発明の特有の実施形態は、オブジェクト指向ソフトウェアプログラミング概念を採用し得るが、本発明は、そのように限定されず、コンピュータの動作を指示する他の形式を採用するように、容易に適応される。
【0104】
また、種々の実施形態は、そこにコンピュータコードを有する、コンピュータ読み取り可能媒体を備える、コンピュータプログラム製品の形式として提供可能である。コンピュータ読み取り可能媒体は、読取専用および書込可能CDならびにDVD、磁気メモリ、半導体メモリ(例えば、フラッシュメモリおよび他のポータブルメモリカード等)等の光学媒体を含む、コンピュータによる使用のために、そこにコンピュータコードを格納可能な任意の媒体を含むことが可能である。さらに、そのようなソフトウェアは、ネットワーク、無線リンク、不揮発性メモリデバイス等を介して、あるコンピューティングデバイスから別のコンピューティングデバイスにダウンロードまたは別様に転送可能である。
【0105】
図4は、一実施形態による、ネットワークアーキテクチャ400を例証する。示されるように、複数のネットワーク402が、提供される。本ネットワークアーキテクチャ400に照らして、ネットワーク402はそれぞれ、インターネット、ピアツーピア・ネットワーク等のローカルエリアネットワーク(LAN)、無線ネットワーク、広域ネットワーク(WAN)を含むが、それられに限定されない、任意の形式をとり得る。
【0106】
ネットワーク402に連結されるのは、ネットワーク402上で通信可能なサーバ404である。また、ネットワーク402およびサーバ404に連結されるのは、複数のクライアント406である。そのようなサーバ404および/またはクライアント406はそれぞれ、デスクトップコンピュータ、ラップトップコンピュータ、携帯型コンピュータ、携帯電話、携帯端末(PDA)、周辺機器(例えば、プリンタ等)、コンピュータの任意の構成要素、および/または任意の他の種類の論理を含んでもよい。ネットワーク402間の通信を促進するために、少なくとも1つのゲートウェイ408が、随意に、その間に連結される。
【0107】
1つ以上のスキャナ410が、ネットワーク、サーバ404、および/またはクライアント406に連結されてもよい。スキャナ410は、任意の相互接続経路を介して、付属機械によって、および/または他の機械によって遠隔で、アクセス可能であってもよい。
【0108】
図5は、一実施形態による、図4のサーバ404および/またはクライアント406と関連付けられ得る、代表的ハードウェア環境を示す。そのような図は、一実施形態による、マイクロプロセッサ等の中央演算装置510と、システムバス512を介して相互に接続される、いくつかの他のユニットと、を有する、ワークステーションの典型的ハードウェア構成を例証する。
【0109】
図5に示されるワークステーションは、ランダムアクセスメモリ(RAM)514と、読取専用メモリ(ROM)516と、ディスク記憶ユニット520等の周辺デバイスをバス512に接続するためのI/Oアダプタ518と、キーボード524、マウス526、スピーカ528、マイクロホン532、および/またはタッチスクリーン(図示せず)等の他のユーザインターフェースデバイスをバス512に接続するためのユーザインターフェースアダプタ522と、ワークステーションを通信ネットワーク535(例えば、データ処理ネットワーク)に接続するための通信アダプタ534と、バス512をディスプレイデバイス538に接続するためのディスプレイアダプタ536と、を含む。
【0110】
ワークステーションは、そこに常駐する任意の所望のオペレーティングシステムを有してもよい。また、実施形態は、上述のもの以外のプラットフォームおよびオペレーティングシステム上に実装されてもよいことを理解されるであろう。一実施形態は、JAVA(登録商標)、C、および/またはC++言語、または他のプログラミング言語とともに、オブジェクト指向プログラミング法を使用して、書き込まれてもよい。オブジェクト指向プログラミング(OOP)は、複雑な用途を開発するために、ますます使用されるようになっている。
【0111】
当然ながら、本明細書に記載される種々の実施形態は、ハードウェア、ソフトウェア、またはそれらの任意の所望の組み合わせを利用して、実装されてもよい。その点に関して、本明細書に記載される種々の機能性を実装可能な任意の種類の論理が、利用されてもよい。
【0112】
種々の実施形態について、上述されたが、それらは、一例として提示されているにすぎず、制限ではないことを理解されたい。したがって、好ましい実施形態の幅および範囲は、上述の例示的実施形態のいずれかによって制限されるべきではなく、以下の請求項およびその同等物に従ってのみ定義されるべきである。

【特許請求の範囲】
【請求項1】
第1の文書のスキャンされた画像上で光学式文字認識(OCR)を実行することと、
該第1の文書から識別子を抽出することと、
該識別子を使用して、該第1の文書と関連付けられた相補的文書を識別することと、
該第1の文書を該相補的文書にマッピングする仮説のリストを生成することであって、
該第1の文書からのテキスト情報と、
該相補的文書からのテキスト情報と、
所定のビジネスルールと
を使用して、行うことと、
該仮説に基づいて、該第1の文書の有効性を決定することと、
該決定された有効性の表示を出力することと
を含む、方法。
【請求項2】
前記第1の文書は、請求書である、請求項1に記載の方法。
【請求項3】
前記相補的文書は、前記請求書と関係を有する注文書、覚書、および配達受領書のうちの少なくとも1つである、請求項2に記載の方法。
【請求項4】
前記スキャンされた画像を生成するために、スキャナを使用して、前記第1の文書をスキャンすることをさらに含む、請求項1に記載の方法。
【請求項5】
前記相補的文書からのテキスト情報および前記所定のビジネスルールのうちの少なくとも1つを使用して、前記第1の文書内のOCRエラーを補正することをさらに含む、請求項1に記載の方法。
【請求項6】
前記相補的文書からのテキスト情報および前記所定のビジネスルールのうちの少なくとも1つを使用して、前記第1の文書からのデータを正規化することをさらに含む、請求項1に記載の方法。
【請求項7】
前記第1の文書からのテキスト情報および前記所定のビジネスルールのうちの少なくとも1つを使用して、前記相補的文書からのデータを正規化することをさらに含む、請求項1に記載の方法。
【請求項8】
前記第1の文書の有効性を決定する場合に潜在的問題に遭遇すると、警告を生成することをさらに含む、請求項1に記載の方法。
【請求項9】
前記警告は、前記第1の文書および前記相補的文書における予測された類似値または同一値の不整合の識別を含む、請求項8に記載の方法。
【請求項10】
前記第1の文書の明細行項目またはヘッダフィールド項目の補正および認証のうちの少なくとも1つを示すユーザ入力を受信することをさらに含む、請求項1に記載の方法。
【請求項11】
前記第1の文書の有効性を決定することは、該第1の文書内の予測される明細行項目または実際の明細行項目のための値を自動的に予想することを含む、請求項1に記載の方法。
【請求項12】
前記第1の文書の有効性を決定することは、前記相補的文書からのテキスト情報および前記ビジネスルールのうちの少なくとも1つに基づいて、前記第1の文書内の予測される明細行項目または実際の明細行項目またはヘッダフィールド項目のための値を自動的に補正することを含む、請求項1に記載の方法。
【請求項13】
前記第1の文書は、福利厚生の説明文書、販売注文文書、および保険金請求文書のうちの少なくとも1つである、請求項1に記載の方法。
【請求項14】
同一物を参照するものとして、前記第1の文書上の用語を前記相補的文書上の異なる用語を相関させることをさらに含む、請求項1に記載の方法。
【請求項15】
前記用語の相関をデータベース内に格納することをさらに含む、請求項14に記載の方法。
【請求項16】
前記仮説およびビジネスルールを使用して、前記第1の文書を再構築することをさらに含み、前記有効性を決定することは、該再構築された第1の文書を分析する、請求項1に記載の方法。
【請求項17】
前記第1の文書が有効であることを決定すると、前記生成された仮説に基づいて、知識を生成することをさらに含む、請求項1に記載の方法。
【請求項18】
前記知識を生成することは、変換を使用することを含む、請求項17に記載の方法。
【請求項19】
前記第1の文書が有効であることの決定に失敗すると、または該第1の文書が無効であることを決定すると、ユーザに照合画面を出力することをさらに含む、請求項1に記載の方法。
【請求項20】
前記照合画面にアクセスするための通知が、前記第1の文書の送信者に送信される、請求項19に記載の方法。
【請求項21】
前記照合画面を閲覧するユーザによる、前記第1の文書への修正を受信することをさらに含む、請求項19に記載の方法。
【請求項22】
前記修正された第1の文書の再認証を試行することをさらに含む、請求項22に記載の方法。
【請求項23】
前記決定された有効性は、ビジネス取引を認証するために使用される、請求項1に記載の方法。
【請求項24】
第2の文書のスキャンされた画像上でOCRを実行することと、
該第2の文書から識別子を抽出することと、
該第2の文書と関連付けられた相補的文書を識別することと、
該第2の文書を該第2の相補的文書にマッピングする仮説のリストを生成することであって、
該第2の文書からのテキスト情報と、
該第2の相補的文書からのテキスト情報と、
所定のビジネスルールと、
を使用して行う、ことと、
該仮説に基づいて、該第2の文書の有効性を決定することと、
該第2の文書の決定された有効性の表示を出力することと
をさらに含む、請求項1に記載の方法。
【請求項25】
前記認証された第1の文書は、前記第2の相補的文書として使用される、請求項24に記載の方法。
【請求項26】
前記第1の文書の有効性を再度決定するために、第2の相補的文書を使用して、前記方法を反復することをさらに含む、請求項1に記載の方法。
【請求項27】
電子的第1の文書から識別子を抽出することと、
該識別子を使用して、該第1の文書と関連付けられた相補的文書を識別することと、
該第1の文書からのテキスト情報と、
該相補的文書からのテキスト情報と、
所定のビジネスルールと、
を同時に検討することによって、該第1の文書の有効性を決定することと、
該決定された有効性の表示を出力することと
を含む、方法。
【請求項28】
前記相補的文書からのテキスト情報および前記所定のビジネスルールのうちの少なくとも1つを使用して、前記第1の文書内のOCRエラーを補正することをさらに含む、請求項27に記載の方法。
【請求項29】
前記相補的文書からのテキスト情報および前記所定のビジネスルールのうちの少なくとも1つを使用して、前記第1の文書からのデータを正規化することをさらに含む、請求項27に記載の方法。
【請求項30】
前記第1の文書からのテキスト情報および前記所定のビジネスルールのうちの少なくとも1つを使用して、前記相補的文書からのデータを正規化することをさらに含む、請求項27に記載の方法。
【請求項31】
前記第1の文書の有効性を決定する際、潜在的問題に遭遇すると、警告を生成することをさらに含む、請求項27に記載の方法。
【請求項32】
前記警告は、前記第1および相補的文書における予測された類似値または同一値の不整合の識別を含む、請求項31に記載の方法。
【請求項33】
前記第1の文書の明細行項目またはヘッダフィールド項目の補正および認証のうちの少なくとも1つを示すユーザ入力を受信することをさらに含む、請求項27に記載の方法。
【請求項34】
前記第1の文書の有効性を決定することは、該第1の文書内の予測されるまたは実際の明細行項目のための値を自動的に予想するステップを含む、請求項27に記載の方法。
【請求項35】
前記第1の文書の有効性を決定することは、前記相補的文書からのテキスト情報および前記ビジネスルールのうちの少なくとも1つに基づいて、該第1の文書内の予測されるまたは実際の明細行項目またはヘッダフィールド項目のための値を自動的に補正することを含む、請求項27に記載の方法。
【請求項36】
前記決定された有効性を使用して、ビジネス取引を認証する、請求項27に記載の方法。
【請求項37】
電子的第2の文書を取得することと、
該第2の文書と関連付けられた第2の相補的文書を識別することと、
該第1の文書からのテキスト情報と、
該相補的文書からのテキスト情報と、
所定のビジネスルールと、
を使用して、
該第2の文書を該第2の相補的文書にマッピングする仮説のリストを生成することと、
該仮説に基づいて、該第2の文書の有効性を決定することと、
該第2の文書の決定された有効性の表示を出力することと
をさらに含む、請求項27に記載の方法。
【請求項38】
前記認証された第1の文書は、前記第2の相補的文書として使用される、請求項37に記載の方法。
【請求項39】
前記第1の文書の有効性を再度決定するために、第2の相補的文書を使用して、前記方法を反復することをさらに含む、請求項27に記載の方法。
【請求項40】
コンピュータ読み取り可能媒体上で具現化される、コンピュータプログラム製品であって、
第1の文書のスキャンされた画像上で光学式文字認識(OCR)を実行するためのコードと、
該第1の文書から識別子を抽出するためのコードと、
該識別子を使用して、該第1の文書と関連付けられた相補的文書を識別するためのコードと、
該第1の文書からのテキスト情報と、
該相補的文書からのテキスト情報と、
所定のビジネスルールと、
を使用して、該第1の文書を該相補的文書にマッピングする仮説のリストを生成するためのコードと、
該仮説に基づいて、該第1の文書の有効性を決定するためのコードと、
該決定された有効性の表示を出力するためのコードと
を備える、コンピュータプログラム製品。
【請求項41】
第1の文書のスキャンされた画像上で光学式文字認識(OCR)を実行することと、
該第1の文書から識別子を抽出することと、
該識別子を使用して、該第1の文書と関連付けられた相補的文書を識別することと、
該第1の文書からのテキスト情報と、該相補的文書からのテキスト情報と、所定のビジネスルールと、を使用して、該第1の文書を該相補的文書にマッピングする仮説のリストを生成することと、
該仮説に基づいて、該第1の文書の有効性を決定することと、
該決定された有効性の表示を出力することと
を行うためのデバイスを備える、システム。
【請求項42】
コンピュータ読み取り可能媒体上で具現化される、コンピュータプログラム製品であって、
電子的第1の文書から識別子を抽出するためのコードと、
該識別子を使用して、該第1の文書と関連付けられた相補的文書を識別するためのコードと、
該第1の文書からのテキスト情報と、
該相補的文書からのテキスト情報と、
所定のビジネスルールと、
を同時に検討することによって、該第1の文書の有効性を決定するためのコードと、
該決定された有効性の表示を出力するためのコードと
を備える、コンピュータプログラム製品。
【請求項43】
電子的第1の文書から識別子を抽出することと、該識別子を使用して、該第1の文書と関連付けられた相補的文書を識別することと、該第1の文書からのテキスト情報と、該相補的文書からのテキスト情報と、所定のビジネスルールとを同時に検討することによって、前記第1の文書の有効性を決定することと、該決定された有効性の表示を出力することとを行うためのデバイスを備える、システム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate


【公表番号】特表2012−517637(P2012−517637A)
【公表日】平成24年8月2日(2012.8.2)
【国際特許分類】
【出願番号】特願2011−549266(P2011−549266)
【出願日】平成22年2月4日(2010.2.4)
【国際出願番号】PCT/US2010/023224
【国際公開番号】WO2010/093556
【国際公開日】平成22年8月19日(2010.8.19)
【出願人】(505149170)コファックス, インコーポレイテッド (2)
【Fターム(参考)】