説明

文書保存システム

システムは、取得した文書画像からテキスト文書を作成する。検索可能なメタデータ要素は、ユーザによって、あるいはテキスト文書を作成するために使用されるテンプレートによって、テキスト文書の全部あるいは一部に割り当てられ得る。テキスト文書と対応するメタデータ要素とは、テキスト文書の内容および/あるいはテキスト文書に対応するメタデータ要素に基づいた後のテキスト文書の探索および検索を容易にするために、保存され得る。

【発明の詳細な説明】
【技術分野】
【0001】
背景
発明の分野
ここで開示されるシステムおよび方法は、一般的に情報検索に関し、特に、その後に行われる検索および情報読出のためのユーザ情報の保存に関する。
【背景技術】
【0002】
関連技術の説明
現在のコンピュータネットワーク、特にインターネットは、膨大な情報を広範囲にかつ容易に利用可能なものとした。たとえば、インターネット検索エンジンは、インターネットに接続された非常に多くのウェブ文書にインデックスを付す。インターネットに接続したユーザは、簡単な検索クエリを入力することよって、当該検索クエリに関連するウェブ文書をすばやく見つけ出すことができる。
【発明の概要】
【発明が解決しようとする課題】
【0003】
ウェブサイトや他のオンライン上の文書のような、公衆に利用可能な文書に加えて、近年、ワード文書のようなユーザ文書、電子メール、音楽などにインデックスを付することや、それらを保存することを容易にするための試みが為されてきている。グーグルデスクトップ検索(Google Desktop Search)や、コペルニクスデスクトップ検索(Copernic Desktop Search)や、アップルコンピュータ社のサファリのようなアプリケーションは、典型的には、ユーザのローカルな記憶装置のなかの指定された領域内を検索し、当該領域内で識別される検索可能な文書のインデックスを保持する。残念ながら、従来の文書インデックス付与ツールは、文書を基にしたテキストでないものを記憶したり、効率的にインデックスを付与したりするものではない。
【課題を解決するための手段】
【0004】
概要
ある局面に従うと、方法は、文書画像を受け取ることを含み得る。文書画像は、テキスト文書に変換され得る。検索可能な情報がテキスト文書に関連付けられて取得され得る。少なくとも1つの検索可能なメタデータ要素がテキスト文書に関連付けられ得る。テキスト文書と少なくとも1つの検索可能なメタデータ要素とが、少なくとも1つの検索可能なメタデータ要素に基づいて、その後に実行される検索のために記憶され得る。
【0005】
他の局面に従うと、システムは、文書の画像を取得するように構成された文書取得システムと、処理システムとを含み得る。処理システムは、画像に含まれたテキストを識別し、識別されたテキストに基づいてテキスト文書を生成し、テキスト文書に関連する検索可能な情報を取得し、少なくとも1つの検索可能なメタデータ要素をテキスト文書に関連付け、テキスト文書と少なくとも1つの検索可能なメタデータ要素とを少なくとも1つの検索可能なメタデータ要素に基づいてその後に実行される検索のためにコンピュータネットワークを介してデータベースへと送信するように構成され得る。
【0006】
さらに他の局面に従えば、方法は、画像文書を受け取ること、画像文書に含まれるテキストを識別すること、識別されたテキストに基づいてテキスト文書を生成すること、テキスト文書に関連する検索可能な情報を取得すること、検索可能な情報に基づいて少なくとも1つの検索可能なメタデータ要素をテキスト文書に関連付けること、少なくとも1つの検索可能なメタデータ要素に基づいてその後に実行される検索のためにテキスト文書と少
なくとも1つの検索可能なメタデータ要素とをデータベースに格納することを含み得る。
【0007】
本明細書に組み込まれるとともに本明細書の一部を構成する、添付の図面は、本発明の実施の形態を図示し、説明文とともに本発明を説明するものである。図面は、以下のものを含む。
【図面の簡単な説明】
【0008】
【図1】ここで開示される局面に係るシステムと方法とが実現され得る代表的なシステム100を示す概略図である。
【図2】図1に係るクライエント装置あるいはサーバ装置を示す代表的な概略図である。
【図3】図1に係る処理システムによって利用され得る代表的なコンピュータ読取可能な媒体の一部を示す概略図である。
【図4】代表的な光学式文字認識用のテンプレートを示す代表的な概略図である。
【図5】文書の取得、処理、管理に関する代表的な処理を示すフローチャートである。
【発明を実施するための形態】
【0009】
詳細な説明
以下、図面を参照しつつ、本発明について詳細に説明する。異なる図面における同一の参照符号は、同一あるいは同様の要素を特定し得るものである。そして、本発明は、以下の詳細な説明によって限定されるものではない。
【0010】
概要
より多くの種類の文書が、検索エンジンを介して検索可能になりつつある。たとえば、個人的な文書や、金融文書や、領収書や、通信文書などのような、文書が読み取られて、それらのテキストが光学式文字認識(OCR)を利用することによって認識され得る。ここに示される実施の形態のように、効率的で簡単な方法によってこれらの文書の保存や検索を可能にすることは有益なものとなり得る。
【0011】
ここに示される実施の形態に係るシステムおよび方法は、文書を取得したり検索したりすることを容易にし、関連のあるメタデータ情報を文書に割り当てることを容易にすることができる。文書に光学的文字認識が行なわれたりその他の処理が施されたりすることによって、取得された文書のテキスト形式が作成される。文書や、当該文書に関連付けられたメタデータやテキスト形式は、オンライン上の格納場所やサーバに格納され得る。これによって、文書情報は、テキスト形式や関連するメタデータに含まれる情報に基づいて、多くの装置によって容易に検索あるいは読出され得る。
【0012】
代表的なシステム
図1は、ここで開示される局面に係るシステムと方法とが実現され得る代表的なシステム100を示す概略図である。システム100は、文書取得システム110、処理システム120、ネットワーク130、文書データベースサーバ140、テンプレートデータベースサーバ150を含み得る。ある実施の形態においては、文書取得システム110は、文書のページを読み取るように構成されたスキャナあるいは同様の画像取得装置を含み得る。スキャナは、文書を読み取ったり獲得したりするために従来の技術を利用することができる。他の実施の形態においては、文書取得システム110は、コンピュータ読取可能なテキスト情報を含むあるいは含まないデジタル文書を検索したり取り込んだりするように構成され得る。たとえば、文書取得システム110は、ネットワーク130を介して銀行のウェブサーバ(図示せず)からオンライン上の銀行取引明細書を検索するように構成され得る。このようなオンライン上の銀行取引明細書は、当初、画像あるいはテキストと
して認識されない電子文書フォーマット(たとえば、pdf、tiff、jpeg、など)として検索され得る。ここで使用される「文書」という文言は、機械が読取可能であったり機械が格納可能な作業生産物、電子媒体、印刷媒体などを含むように広く解釈されるべきものである。たとえば、文書は、印刷媒体(たとえば、新聞、雑誌、書籍、百科事典など)、電子新聞、電子書籍、電子雑誌、オンラインの百科事典、電子媒体(たとえば、画像ファイル、音楽ファイル、ビデオファイル、ウェブキャスト、ポッドキャストなど)などに含まれる情報を含み得る。
【0013】
以下では、さらに詳細に説明する。処理システム120は、文書に関連付けられたテキストを認識するために、文書取得システム110によって取得されたりその他の方法で検索されたりした文書に対してOCR処理を施すように構成され得る。処理システム120は、パーソナルコンピュータ、無線電話、パーソナルデジタルアシスタント(PDA)、ラップトップ、その他の種類の計算装置あるいは通信装置などのような装置として定義され得るクライエント装置、これらの装置の1つによって実行されるスレッドや処理、および/あるいはこれらの装置の1つによって実行可能なオブジェクトを含み得る。他の局面においては、処理システム120は、文書を合成したり、処理したり、検索したり、および/あるいは維持したりするサーバ装置を含み得る。このような局面においては、「シンクライエント」装置は、サーバ主体の処理システム120と相互に作用するように構成され、文書に対する処理がクライエント装置に対して遠隔で実行され得る。
【0014】
ある実施の形態においては、処理システム120によって行なわれるOCR処理は、取得された各々の文書の全体に対して、予めメタデータが当該文書に関連付けられていない状態で実行され得る。他の実施の形態としては、OCR処理は、処理システム120によって自動的に選択された、あるいはユーザによって選択および/あるいは構成されたテンプレートあるいは予め準備された構成に基づいて実行され得る。テンプレートは、検索可能なメタデータを文書の各部分に割り当てたり、あるいは処理システム120に文書のうちの予め定められた部分だけに対してOCR処理を行なわせる旨の指示を与えたりできる。
【0015】
上述の銀行取引明細書の例においては、OCR用のテンプレートが備えられた銀行は、処理システム120に明細書のどの部分がどのような種類の情報に関連するのかについての指示を与え得る。たとえば、取引明細書の文書の第1の部分は口座情報を含み、一方、第2の部分は取引情報を含み得る。テンプレートは、さらに、取引明細書の取引情報の部分のみにOCR処理を施すべきことを示し得る。文書に対してOCR処理あるいはその他の処理を施すよりも前に文書についての情報を与えることによって、情報の取得がより効率的に実行され得る。ある代表的な実施の形態においては、テンプレートは、テンプレートデータベースサーバ150のテンプレートデータベース155に格納されたりその他の方法によって維持され得る。そして、テンプレートは、ネットワーク130を介してアクセス可能になる。他の実施の形態(図示せず)においては、テンプレートデータベースサーバ150および/あるいはテンプレートデータベース155は、処理システム120にローカルに配置され得る。以下では、詳細に、上述の実施の形態に関係する追加的な詳細事項について説明する。
【0016】
文書データベースサーバ140は、取得された文書に割り当てられたあるいは関連付けられたメタデータと同様に、OCR処理が施されたテキストを文書に関連付けて格納するように構成される文書データベース145を含み得る。ある実施の形態においては、取得された文書の電子的なコピーも、文書データベース145に格納され得る。図に示すように、ある実施の形態においては、文書データベースサーバ140は、ネットワーク130を介して処理システム120に接続され得る。しかし、他の実施の形態においては、文書データベースサーバ140および/あるいは文書データベース145は、処理システム1
20に対してローカルに格納されてもよい。
【0017】
文書データベースサーバ140は、文書のテキスト情報およびメタデータ情報を文書データベース145のデータベースレコード内に格納し得る。ある実施の形態においては、文書データベース145のレコードは、関係(リレーショナル)データベースを形成するように配列され得る。しかしながら、ここに示される局面に従うものであれば、どのような好適なデータベース構造が実現されてもよい。
【0018】
ネットワーク130は、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)、公衆交換電話網(PSTN)のような電話網、イントラネット、インターネット、あるいはこれらのネットワークを組合せたものを含み得る。処理システム120およびデータベースサーバ140,150は、有線、無線、および/あるいは光学的な接続を介して、ネットワーク130に接続され得る。
【0019】
代表的な処理システム/読取システムの基本設計概念
図2は、クライエント装置あるいはサーバ装置(後述する「システム110/120」)を示す代表的な概略図である。クライエント装置あるいはサーバ装置は、1または複数の文書取得システム110、処理システム120、文書データベースサーバ140、および/あるいはテンプレートデータベースサーバ150に対応し得る。本実施の形態においては、システム110/120は、コンピュータによって実現され得る。他の実施の形態においては、システム110/120は、1組の協働したコンピュータを含み得る。システム110/120は、バス210、プロセッサ220、メインメモリ230、ROM(Read Only Memory)240、記憶装置250、入力デバイス260、出力デバイス270、通信インターフェイス280を含み得る。バス210は、システム110/120の要素間の伝達を可能にする経路を含み得る。
【0020】
プロセッサ220は、指令を解釈および実行し得るプロセッサ、マイクロプロセッサあるいはプロセッシングロジックを含み得る。メインメモリ230は、プロセッサ220によって実行される情報や指令を格納し得るRAM(Random Access Memory)あるいはその他のタイプの揮発性の記憶装置を含み得る。ROM240は、プロセッサ220によって利用される情報や指令を不揮発に格納し得るROM装置あるいはその他のタイプの不揮発性の記憶装置を含み得る。記憶装置250は、磁気的および/あるいは光学的な記録媒体および対応のドライブを含み得る。
【0021】
入力デバイス260は、キーボード、マウス、ペン、音声認識、および/あるいは生体認証機構などのような、操作者に情報をシステム110/120に入力させるための機構を含み得る。出力デバイス270は、情報を操作者に出力する機構を含むものであって、ディスプレイ、プリンタ、スピーカなどを含み得る。通信インターフェイス280は、システム110/120に他の装置および/あるいはシステムと通信することを可能にするトランシーバのような機構を含み得る。たとえば、通信インターフェイス280は、ネットワーク130のようなネットワークを介して、他の装置やシステムと通信するための機構を含み得る。
【0022】
以下、詳述する。システム110/120は、操作に関連する文書処理を実行し得る。システム110/120は、メモリ230のようなコンピュータ読取可能な媒体に含まれるソフトウェアの指令を実行するプロセッサ220に応じて、これらの操作を実行し得る。コンピュータ読取可能な媒体は、物理的あるいは論理的な記憶装置および/あるいは搬送波として定義され得る。
【0023】
ソフトウェアの指令は、データ記憶装置250のような他のコンピュータ読取可能な媒
体から、あるいは通信インターフェイス280を介して他の装置から、メモリ230へと読出され得る。メモリ230に格納されるソフトウェアの指令は、プロセッサ220に、後述するような処理を実行させ得る。あるいは、ハードウェアとしての電気回路が、本発明のさまざまな局面における処理を実現するためにソフトウェアの指令の代わりに、あるいは当該ソフトウェアの指令と組み合されて使用され得る。このように、本発明の実施の形態は、ハードウェア回路とソフトウェアとの如何なる特定の組合せにも限定されるものではない。
【0024】
代表的なコンピュータ読取可能な媒体
図3は、処理システムによって利用され得る代表的なコンピュータ読取可能な媒体の一部を示す概略図である。ある実施の形態においては、コンピュータ読取可能な媒体300は、クライエント120のメモリ230に対応し得る。図3に示されるコンピュータ読取可能な媒体300の一部は、オペレーティングシステム310、OCRソフトウェア320、文書管理ソフトウェア330を含み得る。
【0025】
より詳細には、オペレーティングシステム310は、マイクロソフトウィンドウズ(登録商標)、ユニックス、あるいはリナックスのオペレーティングシステムのような、オペレーティングシステムのソフトウェアを含み得る。OCRソフトウェア320は、文書取得システム110による文書画像の取得を開始するために、文書取得システム110に接続するためのソフトウェア(たとえばドライバ)を含み、あるいは利用し得る。加えて、OCRソフトウェア320は、取得された文書の画像をテキスト形式に変換するためのソフトウェアを含み得る。簡単に上述したように、OCRソフトウェア320は、テンプレートデータベースサーバ150から検索されたテンプレートを利用することによって、文書の効率的な認識やメタデータ要素の文書への効率的な割り当てを容易にし得る。
【0026】
図4は、上述した銀行取引明細書の例に関連するOCRテンプレート400の代表的な図示の代表的な概略図である。図に示すように、テンプレート400は、ヘッダ情報およびフッダ情報に関係する非OCR領域405,410を識別し得る。非OCR領域405,410は、処理システム120に、取得された文書のうちのこれらの領域の位置に対応する部分にOCR処理を施さないように指示することができる。口座領域415は、処理システム120に、「口座情報」メタデータ情報を、取得された文書のうちの領域415の位置に対応する部分内において識別されたテキスト情報に割り当てるように指示し得る。同様に、取引領域420は、処理システム120に、「取引」メタデータ要素を、取得された文書のうちの領域420の位置に対応する部分内において識別されたテキスト情報に割り当てるように指示し得る。テンプレートを利用することによって処理された文書に対するOCR処理やメタデータの割り当てを指示することによって、認識やメタデータの割り当てが、手動の場合の形態と比較してより効率的に実行され得る。
【0027】
ここで示される局面に係るある実施の形態においては、OCRソフトウェア320は、文書画像が正確にテキスト形式に変換された可能性を示したりあるいはその他の方法で当該可能性を決める、変換された文書のためのOCRの信頼性を決定することができる。ある実施の形態においては、OCRソフトウェアは、OCRの信頼性が予め定められたレベル以下であるときに、文書画像の再読取あるいは再取得を開始してもよい。ある実施の形態においては、再読取あるいは再取得は、前回よりも大きな解像度によって実行され得る。さらなる実施の形態として、OCRの信頼性がテンプレートによって識別された各エリアについて求められ、予め定められた領域についてのOCRの信頼性が予め定められたレベル以下であるときのみに再読取あるいは再取得が行なわれる。あるいは、文書のうちの異なる領域のOCRの信頼性のしきい値が、当該文書に含まれる情報の相対的な重要性に基づいて異なるものであってもよい。これによって、より重要な領域についての高い精度の変換を維持しつつ、重要でないあるいは比較的重要でない領域からデータを再度読取っ
たり再度取得したりすることによって生じる不必要な遅延を防止することができる。
【0028】
文書管理ソフトウェア330は、OCRソフトウェア320によって出力された文書のテキスト形式を手動で見直すことを可能にするためのソフトウェアを含み得る。文書管理ソフトウェア330は、メタデータ要素をテキスト形式の1または複数の部分に割り当てるとともに、テキスト形式を訂正したり編集したりし得る。たとえば、上述した銀行取引明細書の例においては、取引明細書の日付や日付範囲および銀行名や口座名が文書に割り当てられ得る。加えて、文書のある部分には「負債」メタデータ要素が割り当てられ、一方、文書の他の部分には「預金」メタデータ要素が割り当てられ得る。文書管理ソフトウェア330は、その後に実行される探索および検索のために、テキスト形式、当該テキスト形式に対応するメタデータ要素、および/あるいは当該テキスト形式に対応する文書画像を、文書データベースサーバ140に記憶し得る。ある実施の形態においては、文書管理ソフトウェア330は、グーグル(登録商標)(Google(登録商標))のライトハウス(Lighthouse)やピカソ(Picasa(登録商標))のような画像管理アプリケーションを含み得る。
【0029】
メタデータ要素を文書に対する検索可能なテキスト形式に割り当てることは、1または複数のメタデータ要素だけでなく文書データの組合せを利用することによって、文書に含まれる情報のより効率的な検索を容易にし得る。たとえば、特定の取引を含む文書は、文書の日付範囲内の日付や取引の種類だけでなく、ユーザによるテキスト形式内の特定の受取人の検索に応じても、より簡単に検索され得る。
【0030】
代表的な処理
図5は、文書の取得、処理、管理に関する代表的な処理を示すフローチャートである。図5の処理は、文書取得システム110あるいは処理システム120内の1または複数のソフトウェアおよび/あるいはハードウェアの要素、あるいはそれらの組合せによって実行され得る。他の実施の形態においては、当該処理は、他の装置や、文書取得システム110および/あるいは処理システム120とは別の装置のグループや、文書取得システム110および/あるいは処理システム120を含む装置のグループに含まれる1または複数のソフトウェアおよび/あるいはハードウェアの要素によって実行され得る。
【0031】
処理は、文書取得システム110が文書を表わす1または複数の画像を取得することによって開始され得る(動作510)。上述したように、ある実施の形態においては、文書のページの画像を取得するために従来の読取技術が利用され得る。あるいは、文書画像は、ローカルに、あるいはネットワーク130を介してアクセス可能な遠隔の資源からアクセス可能な、電子的な情報源から検索されたり取得されたりし得る。
【0032】
画像が取得されると、文書のテキスト形式あるいは検索可能な形式を作成するために、文書画像にOCR処理が施される(動作515)。OCR処理には、文書の各ページ画像に基づいて、テキストが配置されるページ上の位置を示す情報とともに、認識可能なテキストの画像の分析および当該画像に含まれるテキストの特徴(たとえば、フォント、サイズ、書式など)の分析が含まれ得る。
【0033】
ある実施の形態においては、OCR処理が、文書画像の各々の全体に対して実行され得る。他の実施の形態においては、OCR処理は、テンプレートデータベースサーバ150から、あるいは自身の記憶領域(たとえば、データ記憶装置210)から、読出されたテンプレートに基づいて文書画像の部分に対して実行され得る。たとえば、ある実施の形態においては、銀行が、サーバ150によって運営されるウェブサイトからテンプレートを提供する。他の実施例としては、同様の形式の文書を後で利用するときのために、ユーザがテンプレートを作成したり保存し得る。上述したように、テンプレートは、文書の種類
に応じてさまざまな領域を示し得る。テンプレートは、メタデータ要素を規定したり、メタデータ要素をそれらの領域にあるいは文書全体に対して割り当てるために利用され得る。ここで示される局面に係る他の実施の形態としては、テンプレートは、認識を行なうためのOCR処理に、特定の信頼性のレベルを指定する。
【0034】
文書のテキスト形式が生成されると、変換のための信頼性レベルが決定され得る(動作520)。このとき、信頼性レベルが、正確な変換を表わす予め定められたしきい値レベル以上であるか否かが判断される(動作525)。予め定められたしきい値以上でない場合(動作525においてNOである場合)、処理は、同様の解像度あるいはさらに向上させられた解像度によって再度画像を取得するために動作510へと戻り得る。一方、予め定められたしきい値以上である場合(動作525にてYESである場合)、生成されたテキスト形式が、ユーザによって確認されるためにおよび/あるいはユーザによって編集されるためにユーザへと示され得る(動作530)。テキスト形式に対する変更、追加、あるいは削除が受け付けられる(動作535)。生成されたテキスト形式をユーザが見直すことによって、ユーザは効率的にOCRのエラーを修正することができ、慎重に扱うべきあるいは秘密にすべき情報をテキスト形式から取り除くことができる。
【0035】
次に、テキスト形式の探索および/あるいは検索を容易にするために、1または複数のメタデータ要素がテキスト形式に関連付けられたり割り当てられたりする(動作540)。上述したように、文書のテキストに含まれる情報だけでなく、文書の内容を代表するものをメタデータ要素として文書全体にあるいはテキスト文書の指定された部分に付与され得る。たとえば、上述の銀行取引明細書の例においては、「銀行取引明細書」のようなメタデータ要素、文書の日付あるいは日付範囲、口座名などが、文書のテキスト形式に割り当てられ得る。加えて、メタデータ要素は、文書のテキスト形式の選択された領域に割り当てられ得る。たとえば、預金取引は「預金」メタデータ要素に割り当てられ、一方、銀行取引明細書の負債取引は「負債」メタデータ要素に割り当てられ得る。このようにして、OCRで読取られた内容に関係する情報が、テキスト文書に関連付けられ得る。
【0036】
好ましいメタデータ要素が割り当てられたり、予めテンプレートによって割り当てられていたり、取り除かれたり、編集されたりすると、テキスト形式および当該テキスト形式に関連付けられたメタデータ要素が文書データベースサーバ140の文書データベース145に格納され得る(動作545)。ある代表的な実施の形態においては、文書データベースサーバ140は、OCRで読取られたユーザの文書のためにオンライン上の格納環境を維持するように構成されたウェブサーバであり得る。他の実施の形態においては、ユーザが、取得した画像も文書データベース145に格納し得る。これによって、後でテキスト形式とともに実際の画像の文書自体を検索することが可能になる。
【0037】
まとめ
ここで示されるシステムおよび方法は、自動的に文書に関連付けられたメタデータを識別し、メタデータと文書の画像および/あるいはテキスト形式との対応関係を生成し得る。これによって、システムあるいは方法は、文書の内容と当該文書に関連付けられたメタデータの両方を検索したり、および/あるいはその他の処理を行なったりすることを可能にする。
【0038】
上記のように、本発明の好ましい実施の形態の説明として、図示および説明を行なったが、これらは本発明を完全に網羅したり、本発明を開示された形態に厳格に限定したりすることを意図するものではない。上記の教示から修正や変更が可能であることは明らかであって、本発明の実際の運用から当該修正や変更が為され得る。
【0039】
たとえば、図5においては一連の動作が示されているが、本発明の原理に基づいて他の
実施形態においては当該動作の順序が修正され得る。さらに、独立した動作が並行して実行され得る。
【0040】
上述したように、本発明の局面が、図に示された実施の形態に係るものとは異なる形式のソフトウェア、ファームウェア、ハードウェアによって実現され得ることが明らかなものとなるであろう。本発明の原理に即した局面を実現するために用いられる実際のソフトウェアコードや特別な制御ハードウェアは、本発明を限定するものではない。上記のように上記の局面に係る操作および動作は、特定のソフトウェアコードを参照することなく説明されている。ここでの記載に基づいて、ソフトウェアや制御ハードウェアを上記の局面を実現するように設計することが可能であることが理解される。
【0041】
本出願で用いられた要素、動作、指令は、特に説明がない限り、本発明の重要なものあるいは本質的なものと解釈すべきではない。また、本出願では、「a」という冠詞は、1つまたは複数のものを含むことを意図される。1つのもののみを意図する場合には、「1つの」あるいは同様の言葉が使用される。さらに、「基づいて」という語句は、特にその他の説明がない限り、「少なくとも部分的に基づいて」という意味を成すことが意図される。

【特許請求の範囲】
【請求項1】
文書画像を受け取るステップと、
前記文書画像をテキスト文書に変換するステップと、
前記テキスト文書に関する検索可能な情報を取得するステップと、
前記検索可能な情報に基づいて、少なくとも1つの検索可能なメタデータ要素を前記テキスト文書に関連付けるステップと、
前記少なくとも1つの検索可能なメタデータ要素に基づいた後の検索のために、前記テキスト文書と前記少なくとも1つの検索可能なメタデータ要素とを格納するステップとを備える、方法。
【請求項2】
前記文書画像を受け取るステップは、光学読取装置を用いて文書画像を取得するステップを含む、請求項1に記載の方法。
【請求項3】
前記文書画像を受け取るステップは、記憶媒体から前記文書画像の電子版を取得するステップを含む、請求項1に記載の方法。
【請求項4】
前記記憶媒体は、コンピュータネットワークを介してアクセス可能である、請求項3に記載の方法。
【請求項5】
前記文書画像を前記テキスト文書に変換するステップは、
前記文書画像に光学文字認識処理を行なうことによって、前記文書のテキストを認識するステップと、
認識された前記文書のテキストを含む前記テキスト文書を作成するステップとを含む、請求項1に記載の方法。
【請求項6】
前記文書画像の部分を前記テキスト文書に変換するための指令を含むテンプレートを読み出すステップと、
前記文書画像を前記テンプレートに基づいて前記テキスト文書へ変換するステップとをさらに備える、請求項1に記載の方法。
【請求項7】
前記テンプレートを読み出すステップは、コンピュータネットワークを介してアクセス可能なテンプレートデータベースからテンプレートを読み出すステップを含む、請求項6に記載の方法。
【請求項8】
前記少なくとも1つの検索可能なメタデータ要素を、前記文書画像の少なくとも一部分に対応する前記テキスト文書の少なくとも一部分に割当てるための指令を含むテンプレートを読み出すステップと、
前記少なくとも1つの検索可能なメタデータ要素を前記テンプレートに基づいて前記テキスト文書の少なくとも一部分に関連付けるステップとをさらに備える、請求項1に記載の方法。
【請求項9】
後の検索のために前記テキスト文書と前記少なくとも1つの検索可能なメタデータ要素とを格納するステップは、コンピュータネットワークを介してアクセス可能なサーバに前記テキスト文書と前記少なくとも1つの検索可能なメタデータ要素とを格納するステップを含む、請求項1に記載の方法。
【請求項10】
前記テキスト文書と前記少なくとも1つの検索可能なメタデータ要素とともに前記文書画像を格納するステップをさらに備える、請求項9に記載の方法。
【請求項11】
テキスト文書を修正するための指令を受付けるステップと、
受付けた指令に応じて前記テキスト文書を修正することによって修正テキスト文書を生成するステップと、
前記少なくとも1つの検索可能なメタデータ要素に基づいた後の検索のために、前記修正テキスト文書と前記少なくとも1つの検索可能なメタデータ要素とを格納するステップとをさらに備える、請求項1に記載の方法。
【請求項12】
前記指令は、前記テキスト文書の少なくとも一部分を削除する指令を含む、請求項11に記載の方法。
【請求項13】
前記指令は、前記テキスト文書の少なくとも一部分を訂正する指令を含む、請求項12に記載の方法。
【請求項14】
前記文書画像に対応する前記テキスト文書の正確さを示す信頼性レベルを決定するステップと、
前記信頼性レベルが予め定められたしきい値以下であると判断されたときに、前記文書画像を再度取得するステップとを備える、請求項1に記載の方法。
【請求項15】
文書画像を受け取るための手段と、
前記文書画像をテキスト文書に変換するための手段と、
前記テキスト文書に関する検索可能な情報を取得するための手段と、
前記検索可能な情報に基づいて、少なくとも1つの検索可能なメタデータ要素を前記テキスト文書に関連付けるための手段と、
前記少なくとも1つの検索可能なメタデータ要素に基づいた後の検索のために、前記テキスト文書と前記少なくとも1つの検索可能なメタデータ要素とを格納するための手段とを備える、システム。
【請求項16】
文書の画像を取得するように構成された文書取得システムと、
前記画像に含まれるテキストを識別し、
識別されたテキストに基づいてテキスト文書を作成し、
前記テキスト文書に関する検索可能な情報を取得し、
前記検索可能な情報に基づいて少なくとも1つの検索可能なメタデータ要素を前記テキスト文書に関連付け、
前記少なくとも1つの検索可能なメタデータ要素に基づいた後の検索のために、前記テキスト文書と前記少なくとも1つの検索可能なメタデータ要素とをデータベースへ転送するように構成された処理システムとを備える、システム。
【請求項17】
前記文書取得システムは、光学スキャナを備える、請求項16に記載のシステム。
【請求項18】
前記処理システムは、さらに、テンプレートに基づいて少なくとも1つの初期のメタデータ要素を前記テキスト文書に割当てるように構成される、請求項16に記載のシステム。
【請求項19】
前記少なくとも1つの初期のメタデータ要素は、前記テキスト文書の全体に対して関連付けられる、請求項18に記載のシステム。
【請求項20】
前記少なくとも1つの初期のメタデータ要素は、前記テンプレートによって識別される前記テキスト文書の部分に関連付けられる、請求項18に記載のシステム。
【請求項21】
画像文書を受け取るステップと、
前記画像文書に含まれるテキストを識別するステップと、
識別されたテキストに基づいてテキスト文書を作成するステップと、
前記テキスト文書に関する検索可能な情報を取得するステップと、
前記検索可能な情報に基づいて、少なくとも1つの検索可能なメタデータ要素を前記テキスト文書に関連付けるステップと、
前記少なくとも1つの検索可能なメタデータ要素に基づいた後の検索のために、前記テキスト文書と前記少なくとも1つの検索可能なメタデータ要素とをデータベースに格納するステップとを備える、方法。
【請求項22】
文書画像を受け取るための1または複数の指令と、
前記文書画像をテキスト文書に変換するための1または複数の指令と、
前記テキスト文書に関する検索可能な情報を取得するための1または複数の指令と、
前記検索可能な情報に基づいて、少なくとも1つの検索可能なメタデータ要素を前記テキスト文書に関連付けるための1または複数の指令と、
前記少なくとも1つの検索可能なメタデータ要素に基づいた後の検索のために、前記テキスト文書と前記少なくとも1つの検索可能なメタデータ要素とを格納するための1または複数の指令とを備える、コンピュータ実行可能な指令を格納したコンピュータ読取可能な媒体。
【請求項23】
読取装置から文書画像を受け取るステップと、
前記文書画像に基づいて、前記文書画像に光学文字認識処理を施すことによってテキスト文書を作成するステップと、
前記テキスト文書の修正を受付けるステップと、
受付けた修正に基づいて、修正テキスト文書を作成するステップと、
前記修正テキスト文書に関する検索可能な情報を識別するステップと、
前記検索可能な情報に基づいて、少なくとも1つの検索可能なメタデータ要素を前記修正テキスト文書の少なくとも一部分に関連付けるステップと、
前記少なくとも1つの検索可能なメタデータ要素に基づいた後の検索のために、前記修正テキスト文書と前記少なくとも1つの検索可能なメタデータ要素とを格納するステップとを備える、方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate


【公表番号】特表2010−515167(P2010−515167A)
【公表日】平成22年5月6日(2010.5.6)
【国際特許分類】
【出願番号】特願2009−544223(P2009−544223)
【出願日】平成19年12月21日(2007.12.21)
【国際出願番号】PCT/US2007/088582
【国際公開番号】WO2008/083083
【国際公開日】平成20年7月10日(2008.7.10)
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.リナックス
【出願人】(502208397)グーグル インコーポレイテッド (161)
【Fターム(参考)】