ドキュメントページの自動分類

【課題】本などのソースのページの画像を、表表紙、著作権ページ、目次、テキスト、索引などの分類に、自動的に分類するシステムおよび方法が開示される。
【解決手段】一実施形態では、分類プロセスの中で３つのフェーズが提供される。分類プロセスの第１フェーズの間、単一ページ基準に基づいてページ画像の予備分類を決定するために、第１の分類器が使用されてもよい。分類プロセスの第２フェーズの間、複数ページおよび／またはグローバル基準に基づいて、ページ画像のための最終分類を決定するために、第２の分類器が使用されてもよい。分類の、任意選択の第３フェーズの間、検証基準に基づいてページ画像の最終分類を検証するために、検証器が使用されてもよい。自動分類に失敗した場合、ページ画像は、手作業による分類のために人間のオペレータに引き渡されてもよい。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、コンテンツのページの画像の分類（ｃｌａｓｓｉｆｉｃａｔｉｏｎ）を提供するシステムおよび方法に関する。
【背景技術】
【０００２】
情報時代は、人々が読むためのコンテンツの爆発的な増加をもたらした。このコンテンツは、印刷されて存在する、本、雑誌、新聞、ニュースレター、マニュアル、ガイド、リファレンス、アーティクル（記事）、レポート、ドキュメントなどの従来のソースから、および、前述のソースをデジタル形式で提供する電子媒体から取得される。インターネットは、ポータブルドキュメントファイル（ＰＤＦ：ｐｏｒｔａｂｌｅｄｏｃｕｍｅｎｔ
ｆｉｌｅｓ）および電子ブック（ｅ−ｂｏｏｋｓ）などの、デジタル形式のコンテンツのさらに広い範囲の公開をますます容易にしてきた。
【０００３】
デジタルイメージング装置の技術進歩は、印刷されたソースからのコンテンツの、デジタル形式への変換を可能にした。例えば、自動原稿送り装置（ａｕｔｏｍａｔｉｃｄｏｃｕｍｅｎｔｆｅｅｄｅｒｓ）またはスキャニングロボット（ｓｃａｎｎｉｎｇｒｏｂｏｔｓ）を装備したスキャナを含む、デジタルイメージングシステムが現在では入手可能であり、そのようなシステムは、印刷されたコンテンツのページのデジタル画像を取得し、そして、文字認識技術を使用して画像をコンピュータ読み取り可能なテキストに変換する。それらの「ページ画像」は、次に、コンピューティング装置内に記憶されて、ユーザに配布されてもよい。ページ画像は、さらに、．ｐｄｆフォーマット（ポータブルドキュメントフォーマット（ＰｏｒｔａｂｌｅＤｏｃｕｍｅｎｔＦｏｒｍａｔ））の電子ファイルを含む、電子ファイルなどの、その他のソースから提供されてもよい。
【発明の概要】
【発明が解決しようとする課題】
【０００４】
コンピューティング装置上に記憶された、本またはその他のソースからのコンテンツの１つ以上のページの画像に、ユーザがアクセスを試みる際に、画像によって表されるページのタイプまたは分類に基づいて、そのようなアクセスを容易にし、それによりユーザ体験を向上させることが望ましい場合がある。例えば、コンテンツに、ページ画像ごとに順次アクセスすることによって、コンテンツの特定の部分に到達するようにユーザに強いるのではなく、例えば、目次として、またはテキストの開始として分類されたページ画像への、直接リンクが提供されてもよい。
【０００５】
現在のところ、ページ内容の分類は手作業で行われており、これは時間がかかり、コストがかかる。したがって、コンテンツのページの画像を自動的に分類するための方法およびシステムが必要とされている。
【課題を解決するための手段】
【０００６】
本発明の実施形態によれば、本などのソースのページ画像を、表表紙（ｆｒｏｎｔｃｏｖｅｒ）、著作権ページ（ｃｏｐｙｒｉｇｈｔｐａｇｅ）、目次（ｔａｂｌｅｏｆ
ｃｏｎｔｅｎｔｓ）、テキスト（ｔｅｘｔ）、索引（ｉｎｄｅｘ）などの分類に、自動的に分類するシステムが提供される。例えば、ソースのコンテンツに関連する基準（ｃｒｉｔｅｒｉａ）を記憶するためのデータベースと、データベース内に記憶された基準に基づいて、ソースからのコンテンツのページの画像を自動的に分類する分類器（ｃｌａｓｓｉｆｉｅｒ）とを含む、システムが開示される。基準は、画像が分類器によって分類されているページのコンテンツに関連していてもよく、かつ／または、基準は、ソース全体のコンテンツに関連していてもよい。さらに、基準は、アプリオリな知識に基づく動的な情報を含み、かつ／または、基準は、予め定められた静的な情報を含んでもよい。システムは、分類器によって提供された、ページの画像の分類を検証する、検証器（ｖｅｒｉｆｉｅｒ）を任意選択で含んでもよい。しかし、分類器が、ページの画像を分類することができない場合、または、検証器が、分類器によって生成された分類を検証することができない場合、ページの画像は手作業で分類されてもよい。
【０００７】
上述のシステムと一般に整合性のある、ページ画像を分類するための方法と、ページ画像を分類するための命令がエンコードされたコンピュータ読み取り可能な媒体とが、さらに開示される。
【０００８】
本のページ画像、またはコンテンツのその他のソースのページ画像が、電子的に利用できるようにされる前に、ソースのさまざまなページ画像を、それらの中に含まれるコンテンツのタイプに従って分類することが望ましい場合がある。例えば、本のページ画像は、「表紙（ｃｏｖｅｒ）」、「著作権ページ（ｃｏｐｙｒｉｇｈｔｐａｇｅ）」、「目次（ｔａｂｌｅｏｆｃｏｎｔｅｎｔｓ）」、「テキスト（ｔｅｘｔ）」、「索引（ｉｎｄｅｘ）」などとして分類されてもよい。いくつかの実施形態では、そのような分類は、例えば目次などの、特定のタイプのページの画像にユーザを直接リンクするために使用されてもよい。さらに他の実施形態では、そのような分類は、表紙ページの画像などの、特定のページ画像を、アクセスから除外するために使用されてもよい。さらに、白紙ページなどの、著作権保護されていないページの画像を除外することによって、ユーザは、アクセスされているコンテンツのコピーをユーザが所有していない場合にコンテンツの一定の割合のみがアクセスされることを可能にする、公正使用の理論（ｆａｉｒｕｓｅｄｏｃｔｒｉｎｅ）の下で、著作権保護されたページのより多くの画像へのアクセスを許可されてもよい。
【０００９】
現在のところ、ページ画像は、人間のオペレータによって手作業で分類されている。これは、時間がかかる、高価なプロセスである。ページ画像の分類のコストおよび時間を削減するために、ページ画像を自動的に分類するためのシステムおよび方法が開示される。分類は、以下に限定されないが、表表紙（ｆｒｏｎｔｃｏｖｅｒ）、フロントフェイス（ｆｒｏｎｔｆａｃｅ）（通常は、本のすぐ内側の白黒のカバー）、前付け（ｆｒｏｎｔｍａｔｔｅｒ）（通常は、概説（ｒｅｖｉｅｗｓ）、白紙ページ（ｂｌａｎｋｐａｇｅｓ）、序文（ｉｎｔｒｏｄｕｃｔｉｏｎ）、前書き（ｐｒｅｆａｃｅ）、献辞（ｄｅｄｉｃａｔｉｏｎ）などを含む）、著作権ページ（ｃｏｐｙｒｉｇｈｔｐａｇｅ）、目次（ｔａｂｌｅｏｆｃｏｎｔｅｎｔｓ）、テキスト（ｔｅｘｔ）（通常は、本またはソースの本文（ｍａｉｎｂｏｄｙ）を含むが、序文、前書きなどは除く）、索引（ｉｎｄｅｘ）、後付け（ｂａｃｋｍａｔｔｅｒ）（概説（ｒｅｖｉｅｗｓ）、注文用紙（ｏｒｄｅｒｆｏｒｍｓ）など）、および裏表紙（ｂａｃｋｃｏｖｅｒ）を含んでもよい。ページ画像は、システムの目的のために好適と考えられる、または、例えば本、雑誌、定期刊行物などに基づいた、任意のカテゴリまたはタイプに分類されてもよいということを、当業者は認識するであろう。
【図面の簡単な説明】
【００１０】
【図１】本発明により形成されるページ画像分類システムの実施形態の例を示すブロック図である。
【図２】図１に示す分類システムのモジュールの例を示すブロック図である。
【図３】単一ページ画像分類モジュールの例を示すブロック図である。
【図４】複数ページ画像分類モジュールの例を示すブロック図である。
【図５】分類モジュールと組み合わせて使用されてもよい任意選択の検証モジュールの例を示すブロック図である。
【図６】図１に示す分類システムを実施するためのコンピューティング環境の例を示すブロック図である。
【図７】リニアコンビネータ分類器の例のブロック図である。
【図８】ページ画像分類のための方法の例を示すフロー図である。
【図９】図８のフロー図内で参照される単一ページ画像分類のための方法の例を示すフロー図である。
【図１０】図８のフロー図内で参照される複数ページ画像分類のための方法の例を示すフロー図である。
【図１１】図８のフロー図内で参照される、ページ画像分類の任意選択の検証のための方法の例を示すフロー図である。
【発明を実施するための形態】
【００１１】
本発明の前述の態様と、付随する利点の多くとは、以下の詳細な説明を添付の図面ととともに参照することによって本発明がよりよく理解されるにつれて、より容易に理解されるようになるであろう。
【００１２】
一実施形態では、分類プロセスの中で３つのフェーズが提供される。分類プロセスの第１フェーズの間、単一ページ基準（ｓｉｎｇｌｅ−ｐａｇｅｃｒｉｔｅｒｉａ）に基づいて、ページ画像の予備分類を決定するために、第１の分類器が使用されてもよい。分類プロセスの第２フェーズの間、複数ページおよび／またはグローバル基準（ｍｕｌｔｉｐｌｅ−ｐａｇｅａｎｄ／ｏｒｇｌｏｂａｌｃｒｉｔｅｒｉａ）に基づいて、ページ画像のための最終分類を決定するために、第２の分類器が使用されてもよい。分類の、任意選択の第３フェーズの間、検証基準に基づいてページ画像の最終分類を検証するために、検証器が使用されてもよい。各フェーズの間、決定された分類をページ画像が有する確率が、所望される確率しきい値に達しない場合は、同じページ画像に対して分類プロセスが反復されてもよい。さらに、所望される反復しきい値を超える回数、同じページ画像に対して分類フェーズが反復された場合、そのページ画像は、最終分類のために人間のオペレータに引き渡されてもよい。
【００１３】
図１は、ページ画像分類システムの一実施形態を示すブロック図である。一般に、本またはその他のソースの、ソートされたページ画像が、収集されて記憶される。各ページ画像は、分類基準に基づいて分類される。各ページについての分類は、本またはソースの、将来の、例えば、アクセス中または公開中などにおける使用のために記憶される。図示されている実施形態では、ページ画像１０２からのデジタル化されたページデータが、分類システム１０４に入力される。分類システム１０４は、分類基準１０６を使用して、各ページ画像１０２を分類する。各ページ画像分類１０８は、さらなる解析または使用のために記録される。
【００１４】
上記で簡単に述べたように、分類システム１０４は、ページ画像分類の複数のフェーズを実施してもよい。例えば、一実施形態では、予備ページ画像分類が第１のフェーズにおいて決定され、最終ページ画像分類が第２のフェーズにおいて決定され、最終分類は、任意選択の第３の、すなわち「検証」フェーズにおいて検証される。第１、第２、および第３のフェーズを実施するための分類システムの実施形態が、図２に示されている。図示されている実施形態では、ページ画像１０２からのデジタル化されたページデータが、単一ページ（ＳＰ）画像分類器２０２に入力される。ＳＰ分類器２０２は、各ページ画像に予備分類を割り当てるために使用される。一実施形態では、単一ページ画像分類器２０２は、図７に関して以下でより詳細に説明するリニアコンビネータ分類器（ｌｉｎｅａｒｃｏｍｂｉｎａｔｏｒｃｌａｓｓｉｆｉｅｒ）である。別の実施形態では、単一ページ画像分類器は、実験結果を分類するための、確率に基づいた方法として当技術分野で周知の、ベイズ分類器（Ｂａｙｅｓｉａｎｃｌａｓｓｉｆｉｅｒ）である。分類器の、さまざまなタイプおよび／または組み合わせが、本開示の範囲を逸脱することなく使用されてもよいということを、当業者は認識するであろう。単一ページ画像分類器２０２がこのように呼ばれる理由は、使用される分類器のタイプによるのではなく、ページ画像１０２を分類するために使用される基準のタイプによる。より具体的には、単一ページ画像分類器２０２は、分類されているページ画像のコンテンツのみに基づく、単一ページ（ＳＰ）基準２０４を使用する。ＳＰ画像分類器２０２は、各ページ画像１０２についての予備分類を生成する。
【００１５】
図２にさらに示されているように、複数ページ（ＭＰ）分類器２０６は、ページ画像１０２からのデジタル化されたページデータと、ＳＰ分類器２０２によって提供される各ページ画像についての予備分類と、複数ページ（ＭＰ）基準２０８とを受け取る。ＳＰ画像分類器２０２と同様に、ＭＰ画像分類器２０６がこのように呼ばれる理由は、それが使用する基準、すなわち、複数ページ基準による。ＭＰ基準２０８は、ソースの構成（ｓｔｒｕｃｔｕｒｅ）、主題（ｓｕｂｊｅｃｔｍａｔｔｅｒ）、数字および語密度（ｎｕｍｅｒａｌａｎｄｗｏｒｄｄｅｎｓｉｔｉｅｓ）などを含む、ソース全体に関する情報に基づく。分類器、ソース、またはその他の設計上の考慮に基づいた、より少ない、より多くの、または異なる基準が使用されてもよいということを、当業者は認識するであろう。ＭＰ分類器２０６は、上述の受け取った情報を使用して、各ページ画像についての最終ページ画像分類２１０を割り当てる。図２では、ＳＰ分類器２０２およびＭＰ分類器２０６は別個のモジュールとして示されているが、さらに別の実施形態では、ＭＰ画像分類器２０６およびＳＰ画像分類器２０２は、それらのそれぞれの機能を実行するために、それぞれ、ＭＰ基準２０８およびＳＰ基準２０４を使用する、単一のモジュールとして実装される。
【００１６】
別の実施形態では、最終ページ画像分類２１０と、デジタル化されたページデータと、（図５に関して以下でより詳細に説明する）検証基準２１８とが、最終分類２１０を確認するために、任意選択の検証器２１２によって受け取られて使用される。検証器２１２は、各ページ画像分類に検証基準２１８を適用して、分類の正しさを検証し、分類の確認（ｃｏｎｆｉｒｍａｔｉｏｎ）２１４を発行する。一実施形態では、検証器２１２がページ画像の最終ページ画像分類を却下する場合、そのページ画像は、ページ画像分類の最終決定を行うために人間のオペレータに引き渡される。
【００１７】
ＳＰ基準２０４およびＭＰ基準２０８内に組み入れられる分類基準は、単一ページ−総計軸（ｓｉｎｇｌｅｐａｇｅ−ｔｏ−ａｇｇｒｅｇａｔｅａｘｉｓ）および静的−動的軸（ｓｔａｔｉｃ−ｄｙｎａｍｉｃａｘｉｓ）という、２つの概念軸に沿って編成された特徴および情報を含む。単一ページ−総計軸は、他のページ画像とは無関係な、単一ページ画像の情報から、ソース全体より得られる総計情報までにわたる情報を含む。例えば、ページ画像内に出現する「ＣＯＮＴＥＮＴＳ（目次）」などのキーワードは、単一ページ情報であり、他のページ画像内の情報とは無関係である。一方、ソース内でのページ画像の位置（例えば、本の前半または後半にある）は、他のページ画像またはソース全体から得られる、総計情報（例えば、本の中のページ画像の総数）に依存する情報を提供する。
【００１８】
静的−動的軸は、「ＣＯＮＴＥＮＴＳ（目次）」、「ＩＮＤＥＸ（索引）」、「ＣＨＡＰＴＥＲ（章）」などの、分類特徴として予め定められた静的な情報またはキーワードから、ＳＰ分類フェーズにおけるページ画像の分類の間に得られる動的な情報またはキーワードまでにわたる情報を含む。例えば、本の著者の名前は、表紙ページの画像から抽出されてもよく、続いて、謝辞ページの画像などの、その他のページ画像の分類における特徴として使用されてもよい。特徴は、一般に、これらの軸の両方からの情報を含む。ある特徴は、動的情報を含み、かつ、単一ページ画像に関連していてもよく、一方、別の特徴は、動的情報を含み、かつ、総計情報に関連していてもよい。例えば、上述のように、著者の名前は、動的キーワード特徴であり、この特徴は、他のページ画像とは無関係な、単一ページ画像に関連している。総計情報に関連している動的キーワードの例は、目次から抽出されたトピックであり、このトピックは、後で、緒言（ｆｏｒｅｗｏｒｄ）（前付け（ｆｒｏｎｔｍａｔｔｅｒ））および第１章（Ｃｈａｐｔｅｒ１）（テキスト（ｔｅｘｔ））などの、本のその他の部分を区別するために使用されてもよい。
【００１９】
図３は、単一ページ画像分類モジュールの例をより詳細に示すブロック図である。図２に関して上述したように、ＳＰ画像分類器２０２は、デジタル化されたページデータをページ画像１０２から受け取り、ＳＰ基準２０４を使用して、各ページ画像に予備分類を割り当てる。一実施形態では、ＳＰ基準２０４は、以下に限定されないが、静的キーワードと、動的キーワードと、画像と、フォントの多様性（ｆｏｎｔｖａｒｉｅｔｙ）とを含んでもよい。分類器、ソース、またはその他の設計上の考慮に基づいた、より少ない、より多くの、または異なる基準が使用されてもよいということを、当業者は認識するであろう。静的キーワードは、「ＣＯＮＴＥＮＴＳ（目次）」、「ＩＮＤＥＸ（索引）」などの、予め定められたキーワードであり、それらは、それらのキーワードが見出されたページ画像についての可能な分類を示す。例えば、ページ画像内で見出された静的キーワード「ＣＯＮＴＥＮＴＳ」は、その画像が、目次（ｔａｂｌｅｏｆｃｏｎｔｅｎｔｓ）を含むページの画像であることの可能性を増加させる。その他の特徴が、ページ画像の分類に関する決定を行うために寄与してもよい。例えば、静的キーワード「ＣＯＮＴＥＮＴＳ」が、「ＴＡＢＬＥＯＦ」という語によって先行され、かつ、すべて大文字である場合、その画像が目次（ｔａｂｌｅｏｆｃｏｎｔｅｎｔｓ）を含むページの画像である可能性はさらに増加する。
【００２０】
動的キーワードは、アプリオリな、または演繹的な知識に基づいてもよい特徴である。例えば、「ＩＳＢＮ」は、出版された本についての既知の識別子である。ただし、各ＩＳＢＮの後には、ＩＳＢＮの値である、特殊な形式の番号が続く。ＩＳＢＮ番号は、著作権ページ上に現れなければならない。したがって、ＩＳＢＮキーワードと番号とがページ画像内に現れた場合、そのページ画像は、著作権ページとして分類されてもよい。一実施形態では、動的キーワードは、カタログデータベースに基づいて作成されてもよい。動的キーワードの別の例は、上述のように、著者の名前である。
【００２１】
画像は、単一ページ画像の分類のための基準として使用されてもよい、もう１つの特徴である。例えば、画像によって覆われた大きな表面積を有するページの画像は、表表紙または裏表紙のページ画像である可能性がより高い。単一のより小さな画像は、しばしば、ドロップキャップ（通常は章の始まりで見出される、パラグラフの、拡大された最初の文字）を示し、これは、章の始まりを見つけるために、したがって、本文テキストの開始を見つけるために、使用されてもよい。動的特徴のさらに別の例として、さまざまなサイズのさまざまなフォントを含むページの画像は、非本文ページの画像である可能性がより高い。例えば、目次は、主要なトピックについては、ローマ数字と、より大きな太字フォントとを、そしてサブトピックについては、より小さなフォントを有する場合がある。
【００２２】
上述のように、ＳＰ画像分類器２０２は、ページ画像１０２から取得したデジタル化されたページデータにＳＰ基準２０４を適用して、各ページ画像に予備分類３０６を割り当てる。さらに、ＳＰ画像分類器２０２は、各ページが処理される際に、グローバルページデータ３０８を収集してもよい。一実施形態では、グローバルページデータ３０８は、後でＭＰ基準２０８と組み合わせられて複数ページ分類のために使用されるように、データベース内に記憶される。別の実施形態では、グローバルページデータ３０８は、ＭＰ基準２０８と統合されて、ＭＰ特徴を形成してもよい。分類プロセスのフェーズ１は、このようにして、ＳＰ画像分類器２０２によって完了される。分類プロセスのフェーズ２は、ＳＰ分類器２０２からの、フェーズ１の出力を使用して、ＭＰ分類器２０６によって実行される。
【００２３】
図４は、複数ページ画像分類モジュールの例をより詳細に示すブロック図である。ＭＰ画像分類器２０６は、予備ページ分類３０６と、ページ画像１０２からのデジタル化されたページデータと、グローバルページデータ３０８とを受け取る。ＭＰ画像分類器２０６は、この情報をＭＰ基準２０８と組み合わせ、そして、この組み合わせを各ページ画像に適用して、最終ページ画像分類２１０を各ページ画像に割り当てる。グローバルページデータ３０８は、ソース全体の中のすべてのページ画像から収集された総計情報を含む。一実施形態では、ＭＰ基準２０８は、動的および／または静的情報を含む。非限定的な例として、ページ画像位置情報（ｐａｇｅｉｍａｇｅｌｏｃａｔｉｏｎｉｎｆｏｒｍａｔｉｏｎ）、タイトルキーワード（ｔｉｔｌｅｋｅｙｗｏｒｄｓ）、文の構成（ｓｅｎｔｅｎｃｅｓｔｒｕｃｔｕｒｅ）、前ページ（ｐｒｅｖｉｏｕｓｐａｇｅ）、数字密度（ｄｉｇｉｔｄｅｎｓｉｔｙ）、および語密度（ｗｏｒｄｄｅｎｓｉｔｙ）が挙げられる。分類器、ソース、またはその他の設計上の考慮に基づいた、より少ない、より多くの、または異なる基準が使用されてもよいということを、当業者は認識するであろう。一実施形態では、ページ画像位置情報は、ページ画像分類を、他の可能な分類を除外することによって決定するために使用される。例えば、本の前部内のページの画像は、後付けとして分類されなくてもよい。本の前部は、本の合計サイズを基準にして指定されてもよく、したがって、総計情報を含む特徴と見なされる。例えば、本の全ページの、１０パーセントなどの、いくらかの所定のパーセンテージは、本の前部と見なされてもよく、そして、前部の中に含まれるいかなるページも、後付けとして分類されなくてもよく、これは、ページ画像の可能な分類を絞り込むために役立つ。
【００２４】
上述したように、動的キーワードは、総計情報に関連していてもよい。一実施形態では、動的キーワードは、ＳＰ画像分類器２０２によって、分類の第１フェーズの間に、各ページ画像から抽出される。例えば、目次が構文解析されてもよく、そして、動的キーワードが抽出されて、グローバルページデータ３０８の部分として保存されてもよい。上述したように、動的キーワードは、緒言および第１章などの、さまざまなタイプのページを区別するために使用されてもよい。
【００２５】
タイトルキーワードは、ソース全体を通しての平均フォントサイズに関する情報を含む、グローバルページデータ３０８に基づいて識別されてもよい。一実施形態では、平均フォントサイズよりも大きな語は、タイトルキーワードと見なされてもよい。他の実施形態では、その他の、または追加の規則が、タイトルキーワードを識別するために使用されてもよい。いったん識別されたら、タイトルキーワードは、その後、他のページ画像内の章および節の始まりを識別するために使用されてもよい。
【００２６】
文の構成は、総計情報を含む別の動的特徴である。文の構成は、新しいページまたは章の始まりの画像を識別するために使用されてもよい。例えば、前ページ画像におけるピリオドの後の、大文字にされた語の存在は、新しいページが新しい文で開始されることを示す場合がある。一実施形態では、文を構文解析し、構文解析された文をどのようなタイプのページが含むかを判定するために、文法に基づくエンジンが使用されてもよい。
【００２７】
前ページは、総計情報を含む動的特徴である。一実施形態では、ページ画像の分類は、前ページとしての画像の分類に基づいて決定されてもよい。例えば、テキスト分類を有するページ画像は、同じ分類を有する別のページ画像に続く可能性が最も高い。別の実施形態では、ページ画像が、特定の分類を、そのページ画像が同じまたは異なる分類を有する別のページ画像に続く場合に有する確率を提供するための、観察された確率の表が構築されてもよい。そのような表は、例えば、目次の分類を有するページ画像は、２５％の場合に、前付けの分類を有するページ画像に続き、表表紙の分類を有するページ画像は、０パーセントの場合に、任意のその他のページ画像に続く、ということを示してもよい。
【００２８】
数字密度は、総計情報を含む別の特徴である。数字密度は、ソース全体を通しての数字密度分布の統計的記述である。数字密度特徴は、特定のページ画像を、特定の分類を有するとして識別するために、または、その他のページ画像を、ページ画像から除外するために使用されてもよい。例えば、平均数字密度よりも高い数字密度を有するページ画像は、目次または索引の分類を有する可能性がより高い。
【００２９】
語密度は、数字密度に類似した特徴であるが、数字密度特徴によって示される分類とは異なる分類を有する、ページ画像の可能性を示す。例えば、平均語密度よりも低い語密度を有するページ画像は、テキスト（本文テキスト）の分類を有する可能性がより低い。ヒストグラムなどの、語密度対ページ番号のグラフは、特定のページの画像において語密度の急激な変化を示す場合があり、これは、特定のタイプのページ分類を有するページ画像のグループの始まりまたは終わりを示す。例えば、語密度の急激な増加は、目次分類を有するページ画像から、テキスト分類を有するページ画像への移行を示す場合がある。
【００３０】
図２を参照すると、ＭＰ画像分類器２０６は、任意選択の検証器２１２に、最終ページ画像分類２１０を、確認のために提供してもよい。図５にさらに詳細に示されているように、任意選択の検証器２１２は、最終ページ画像分類２１０と、ページ画像１０２からのデジタル化されたデータと、グローバルページデータ３０８と、追加の検証基準２１８とを、ＭＰ分類器２０６によって割り当てられた最終ページ画像分類２１０を検証するために使用してもよい。いくつかの実施形態では、検証器２１２は、さらに、予備ページ画像分類３０６を、検証を補助するために使用してもよい。一実施形態では、検証基準２１８は、ＳＰ基準２０４とＭＰ基準２０８との組み合わせである。別の実施形態では、検証基準２１８は、ＳＰ基準２０４とＭＰ基準２０８とのサブセットである。さらに別の実施形態では、検証基準２１８は、ＳＰ基準２０４またはＭＰ基準２０８のいずれでも使用されていない特徴を含んでもよい。さらに別の実施形態では、検証基準２１８は、各ページに対して実行するための計算コストが低い特徴を含んでもよい。そのような特徴は、ＳＰ分類器２０２およびＭＰ分類器２０６によって行われた分類決定に対する検査としてのみ使用される。例えば、検証器２１２は、裏表紙として分類されたページ画像が本の最後のページの画像であることを確実にするために、検証特徴を使用してもよい。そのような検証は、上述の語密度などの、その他の特徴を使用した検証よりも計算コストが低い。さらに別の実施形態では、任意選択の検証器２１２は、分類のための、人間が理解できる基準を実施するために使用されてもよい。ＳＰ分類器２０２およびＭＰ分類器２０６によって使用される基準の多くは、直感的に明白ではない可能性がある統計的方法に基づく。例えば、語密度および数字密度は、特定のページ画像分類を人間に直接的には示さない可能性がある、本質的に統計的な基準である。検証器２１２は、直感的により明白な検証基準２１８を使用してもよい。例えば、１つの検証基準は、表表紙のページ画像が目次のページ画像の後に現れることはあり得ないという事実を含んでもよい。この基準は、人間にとって直感的により明白である。そのような基準は、ページ画像の分類における、人間の確信を増加させる。
【００３１】
検証器２１２は、最終分類２１０を確認または却下する、ページ画像分類確認２１４を提供する。図５では別個に示されているが、別の実施形態では、検証器２１２、ＭＰ分類器２０６、およびＳＰ分類器２０２は、それらのそれぞれの機能を実行するために、それぞれ、検証基準２１８、ＭＰ基準２０８、およびＳＰ基準２０４を使用する、単一のモジュールとして実装される。
【００３２】
図６は、図１に示す分類システムの実施形態を実装するためのコンピューティング環境の例を示すブロック図である。このコンピューティング環境の例では、さまざまな分類基準６１６と、ページ画像分類データ６１４と、グローバルページデータ６１８とを、分類のフェーズに応じて使用する、（ＳＰ画像分類器２０２、ＭＰ画像分類器２０６、および／または検証器２１２を含んでもよい）分類器６１２が、メモリ６２０内に提供される。ＯＣＲアプリケーションモジュール６１０が、スキャンされたページ１００から取得したデータをデジタル化し、抽出された情報を分類器６１２に提供するために、使用されてもよい。抽出された情報は、ページ番号と、コンピュータ符号化されたテキスト（例えば、ＡＳＣＩＩ文字）と、ピクチャなどの、非テキストデータとしてラベル付けされた画像とを含んでもよい。分類基準は、ＳＰ基準２０４、ＭＰ基準２０８、および／または検証基準２１８を含んでもよい。基準の各セットは、図２〜図４に関して上述したように、分類のそれぞれのフェーズの間に使用される。一実施形態では、ページ画像１０２は、スキャニング装置６２２を使用して、ソースのページ１００をスキャンすることによって取得される。得られたデータは、入出力（Ｉ／Ｏ）インタフェースモジュール６０４を介して、プロセッサ６０２に提供される。別の実施形態では、ソースのページ１００は、予めスキャンされ、得られたページ画像は遠隔データベース内に記憶される。この実施形態では、ページ画像は、ネットワークインタフェース６０６を介して、分類システム６００に提供される。さらに別の実施形態では、ページ画像は、．ｐｄｆフォーマットのファイルなどの、電子ドキュメントまたはファイルとして提供されてもよい。
【００３３】
分類モジュールの例と、それらのための動作環境とについて説明したので、ＳＰ画像分類器などの、分類器の動作について、より詳細に説明する。上述のように、分類器７００は、図７に示すように、分類基準を組み合わせてページ画像分類得点７０６を生成する、リニアコンビネータであってもよい。分類器７００は、１つの分類のための（ＳＰ基準などの）分類基準７０２を、一度に１つのページ画像に適用して、そのページ画像が、その特定の分類に適合するかどうかを判定する。各ページ画像と各分類とについて、ページ画像分類得点７０６が分類しきい値７０８未満である場合、そのページ画像についてのページ画像分類は却下され、そのページ画像についての新しい分類が試される。このプロセスは、ページ画像についての分類が見出されるまで、または、ページ画像についての分類が何も見出されなくなるまで、継続される。ページ画像についての分類が何も見出されない場合、プロセスは、各ページ画像について、ページ画像についての新しいデータを使用して、一定の回数、反復されてもよい。所定の数の反復された試みの後で、分類が何も見出されていない場合、そのページ画像についての分類を手作業で割り当てるために、そのページ画像は人間のオペレータに委ねられてもよい。一実施形態では、分類基準７０２は、加重係数（ｗｅｉｇｈｔｅｄｃｏｅｆｆｉｃｉｅｎｔｓ）７０４を使用して線形結合される。加重係数７０４は、分類器７００によって分類されているページ画像を、それぞれの分類基準７０２が、現在考慮されているページ画像分類を有するとして正しく識別する確率を示す、それぞれの分類基準７０２に関連付けられた確率であってもよい。したがって、分類器７００によって現在考慮されている各潜在的なページ画像分類について、基準７０２と加重係数７０４との異なる線形結合が使用されてもよい。
【００３４】
図２に関して上述したように、分類プロセスは、単一ページ画像分類フェーズと、複数ページ分類フェーズと、追加の任意選択の検証フェーズとを含んでもよい。図８は、そのような分類のための方法の例を示すフロー図である。ルーチン８００は、ブロック８０２で、デジタル化されたデータをページ画像１０２から取得する。次に、サブルーチン９００で、ＳＰ画像分類が実行される。図３に関して上述したように、ＳＰ画像分類は、分類されている単一ページ画像内に含まれている情報に完全に基づく特徴を含む、ＳＰ基準２０４に基づいて実行される。判断ブロック８０４で、ルーチン８００は、分類されるべき追加のページ画像がドキュメント内に残っているかどうかを判定する。追加のページ画像が残っている場合、ルーチン８００はサブルーチン９００に戻り、そこで、追加のページ画像がＳＰ画像分類器２０２によって分類される。ページ画像がもはや残っていない場合、ルーチン８００はサブルーチン１０００に進み、そこでは、ＭＰ画像分類器２０６が、ＭＰ基準２０８を使用してページ画像を分類する。図４に関して上述したように、ＭＰ基準２０８は、サブルーチン９００においてＳＰ画像分類器２０２によって作成および提供された、総計グローバルページ情報３０８に、少なくとも部分的に基づく。ブロック１０００で、ＭＰ画像分類サブルーチンによってページ画像が分類されたら、ルーチン８００は、判断ブロック８０６で、分類されたページ画像が検証されるべきかどうかを判定する。分類されたページ画像が検証されるべきである場合、ルーチン８００はサブルーチン１１００に進み、それにより、分類されたページ画像の分類は検証される。ルーチンは、判断ブロック８０８に進み、それにより、ルーチン８００は、ＭＰ画像分類ルーチン１０００によって分類されるべき追加のページ画像が残っているかどうかを判定する。判断ブロック８０６に戻ると、検証が必要とされない場合、ルーチン８００は、ブロック８０８に進む。分類されるべき追加のページ画像が残っている場合、ルーチン８００は、追加のページ画像を分類するために、サブルーチン１０００に戻る。追加のページ画像が残っていない場合、ルーチン８００は、ブロック８１０で終了する。ルーチン８００は、任意選択の検証フェーズを含む、全体的な分類方法を説明する。各フェーズについて、以下でより詳細に検討する。
【００３５】
図９は、図８のフロー図内で参照される単一ページ画像分類のための方法の例を示すフロー図である。図３に関して上述したように、サブルーチン９００は、所与のページ画像をＳＰ基準２０４を使用して分類する。サブルーチン９００は、図８に示された分類プロセスの第１フェーズを実施する。一実施形態では、ＳＰ基準２０４は、以下に限定されないが、静的キーワードと、動的キーワードと、画像と、フォントの多様性とを含んでもよい。上述したように、基準は、一度に１つのページに、かつ、一度に１つの分類のために、適用されてもよい。サブルーチン９００は、ブロック９０２で、リニアコンビネータ分類器を使用して、または、ベイズ分類器などのその他の分類器を使用して、ＳＰ基準２０４を適用してもよい。サブルーチン９００は、ページ画像に適合する最適な分類が見出されるまで、さまざまなページ画像分類のためのＳＰ基準２０４を適用する。判断ブロック９０４で、適合する分類が何も見出されない場合、サブルーチン９００は判断ブロック９０６に進み、そこで、同じページ画像分類のために、しきい値回数だけ、ＳＰ基準２０４が適用されたかどうかに関する判定が行われる。しきい値回数だけ適用された場合、サブルーチン９００はブロック９０８に進み、そこでは、人間のオペレータが手作業で予備分類をページに割り当て、そして、サブルーチン９００はブロック９１０に進む。別法として、判断ブロック９０４で、適合する分類が何も見出されない場合、ブロック９０８で、分類されているドキュメント全体からのページ画像が人間のオペレータによって手作業で分類され、そして、サブルーチン９００は終了する。しきい値に達していない場合、サブルーチン９００はブロック９０２に戻り、そこでは、ことによると、新しいまたは追加のページ画像データ、ならびに／あるいは、新しいまたは追加のＳＰ基準２０４を使用して、同じページ画像分類のために、ページ画像にＳＰ基準２０４が再び適用される。一実施形態では、ブロック９０６および９０８は、分類プロセスが第１フェーズのみを、すなわち、ＳＰ基準２０４に基づく分類を含む場合に実施される。別の実施形態では、ブロック９０６および９０８は、図１０に関して以下で説明する、分類の第２フェーズの間にのみ実行される。さらに別の実施形態では、例えば、テストの目的のために、または、結果として得られる分類の質を向上させるために、ブロック９０６および９０８は、分類プロセスのすべてのフェーズで実行される。判断ブロック９０４で、ページ画像のための適合する分類が識別された場合、ルーチン９００はブロック９１０に進み、そこで、ページ画像のための予備分類が記録される。ブロック９１２で、グローバルページデータが更新される。上述したように、グローバルページデータは、ＭＰ基準２０８と組み合わせられて、分類の第２フェーズにおいて、ＭＰ分類器２０６によってページに適用されてもよい。グローバルページデータは、ソース全体の中のすべてのページ画像から収集された総計情報を含んでもよい。一実施形態では、図４に関して上述したように、ＭＰ基準２０８は、以下に限定されないが、ページ位置情報と、動的キーワードと、タイトルキーワードと、文の構成と、前ページと、数字密度と、語密度とを含む。サブルーチン９００は、ブロック９１４で終了する。図８で説明した、分類プロセスの第１フェーズは、このようにして完了する。
【００３６】
分類プロセスの第２フェーズは、サブルーチン１０００で開始され、そこでは、ＭＰ基準２０８がページ画像に適用される。図１０は、図８のフロー図内で参照される複数ページ分類のための方法の例を示すフロー図である。サブルーチン１０００はブロック１００２に進み、そこでは、ＭＰ基準２０８をページ画像に適用するために分類器が使用される。一実施形態では、基準は、一度に１つのページ画像に、かつ、一度に１つの分類のために、適用される。サブルーチン１０００は、ブロック１００２で、リニアコンビネータ分類器を使用して、または、ベイズ分類器などのその他の分類器を使用して、ＭＰ基準２０８を適用してもよい。サブルーチン１０００は、ページ画像に適合する最適な分類が見出されるまで、さまざまなページ画像分類のためのＭＰ基準２０８を適用する。判断ブロック１００４で、適合する分類が何も見出されない場合、サブルーチン１０００は判断ブロック１００６に進み、そこで、同じページ画像分類のために、しきい値回数だけ、ＭＰ基準２０８が適用されたかどうかに関する判定が行われる。しきい値回数だけ適用された場合、サブルーチン１０００はブロック１００８に進み、そこでは、人間のオペレータが手作業で最終分類をページ画像に割り当て、そして、サブルーチン１０００はブロック１０１０に進む。別法として、判断ブロック１００４で、適合する分類が何も見出されない場合、ブロック１００８およびサブルーチン１０００で、分類されているドキュメント全体からのページ画像が人間のオペレータによって手作業で分類される。しきい値に達していない場合、サブルーチン１０００はブロック１００２に戻り、そこでは、ことによると、新しいまたは追加のページ画像データ、ならびに／あるいは、新しいまたは追加のＭＰ基準２０８を使用して、同じページ画像分類のために、ページ画像にＭＰ基準２０８が再び適用される。判断ブロック１００４で、ページ画像のための適合する分類が識別された場合、ルーチン１０００はブロック１０１０に進み、そこで、ページ画像のための最終分類が記録される。サブルーチン１０００は、ブロック１０１２で終了し、このようにして、図８に示した分類プロセスの第２フェーズは完了する。
【００３７】
分類プロセスの、任意選択の最終フェーズは、検証フェーズである。上述のように、検証フェーズは、正しいページ画像分類の確率を増加させるために、最終段階で使用される。図１１は、図８のフロー図内で参照される、ページ画像分類の任意選択の検証のための方法の例を示すフロー図である。サブルーチン１１００はブロック１１０２に進み、そこでは、検証基準２１８をページに適用するために分類器が使用される。一実施形態では、基準は、一度に１つのページ画像に、かつ、一度に１つの分類のために、適用される。サブルーチン１１００は、ブロック１１０２で、リニアコンビネータ分類器を使用して、または、ベイズ分類器などのその他の分類器を使用して、検証基準２１８を適用してもよい。サブルーチン１１００は、ページ画像分類のための検証基準２１８を適用して、ルーチン１０００によって決定された最終分類の妥当性を判定する。判断ブロック１１０４で、最終分類が却下された場合、サブルーチン１１００はブロック１１０６に進み、そこでは、人間のオペレータがページ画像に最終分類を手作業で割り当て、そして、サブルーチン１０００はブロック１１０８に進む。ブロック１１０４で、ページのための最終分類が検証された場合、ルーチンはブロック１１１０で終了し、このようにして、図８に示した分類プロセスの任意選択の第３の最終フェーズは完了する。
【００３８】
実施形態の例を図示および説明してきたが、本開示の精神および範囲を逸脱することなく、さまざまな変更がそれらの中で行われてもよいということが理解されるであろう。例えば、分類の３つのフェーズ、すなわち、ＳＰ、ＭＰ、および検証が、本明細書に記載されたが、これらのフェーズのうちの任意の１つが除去または修正されてもよいということ、および、追加のフェーズまたは分類方法が使用されてもよいということを、当業者は認識するであろう。さらに、任意の分類器または検証器の出力は、さまざまなフォーマットで記憶されてもよい。例えば、各ページ画像についての分類は、テキストファイル内に単に記憶されてもよい。別の実施形態では、ページ画像は、例えばブックマークの形態で、分類の注釈を付けられてもよい。
【００３９】
本発明の範囲は、したがって、本明細書に記載された特定の例からではなく、特許請求の範囲およびその均等物から決定されるべきである。

【特許請求の範囲】
【請求項１】
基準の第１のセットに基づいて、ソースからのコンテンツのページの画像についての第１の分類を自動的に決定する、第１のページ画像分類器であって、基準の前記第１のセットは、前記ソースからの前記分類の対象となるページ画像の前記コンテンツに少なくとも部分的に適用され、前記ソースからの他のページ画像のコンテンツからは独立した基準のセットである、第１のページ画像分類器と、
前記第１のページ画像分類器によって決定された前記ページ画像の前記第１の分類に基づいて、かつ、基準の第２のセットに基づいて、前記ページ画像の第２の分類を自動的に決定する、第２のページ画像分類器であって、基準の前記第２のセットは、前記ソースからの複数のページ画像のコンテンツに少なくとも部分的に適用される基準のセットである、第２のページ画像分類器と、
前記ページの前記画像の前記第２の分類を確認する、検証器と、
を具備する、システム。
【請求項２】
前記検証器が前記ページ画像の前記第２の分類を確認することができない場合、前記ページ画像は手作業で分類される、請求項１に記載のシステム。
【請求項３】
前記第２のページ画像分類器は、前記第１の画像分類器によって取得されたグローバルデータにさらに基づいて、前記ページ画像についての前記第２の分類を自動的に決定する、請求項１に記載のシステム。
【請求項４】
分類基準を記憶するためのデータベースをさらに具備する、請求項１に記載のシステム。
【請求項５】
前記ページの前記コンテンツに関連している、基準の前記第１のセットは、静的情報と動的情報とのうちの少なくとも１つを含む、請求項４に記載のシステム。
【請求項６】
前記コンテンツの前記ソースに関連している、基準の前記第１のセットは、静的情報と動的情報とのうちの少なくとも１つを含む、請求項５に記載のシステム。
【請求項７】
前記第２のページ画像分類器は、グローバルページデータにさらに基づいて、前記ページの前記画像の第２の分類を自動的に決定する、請求項５に記載のシステム。
【請求項８】
前記グローバルページデータは、前記第１の分類器によって前記ソースのすべてのページ画像から収集された総計ページ情報を含む、請求項７に記載のシステム。
【請求項９】
前記データベースは検証基準をさらに記憶し、
前記検証器は、前記検証基準に基づいて、前記ページの前記画像の前記分類を検証する、
請求項４に記載のシステム。
【請求項１０】
前記検証基準は、前記ページの前記コンテンツと、前記コンテンツの前記ソースとのうちの少なくとも１つに関連している、請求項９に記載のシステム。
【請求項１１】
前記検証基準は、前記ページの前記コンテンツにも、前記コンテンツの前記ソースにも関連していない、請求項９に記載のシステム。
【請求項１２】
前記検証基準は、計算コストが低い、請求項９に記載のシステム。
【請求項１３】
前記検証基準は、人間が理解できる基準である、請求項９に記載のシステム。
【請求項１４】
前記ページ画像の前記第２の分類は前記分類対象となる前記ページ画像の前のページ画像の前記第１の分類に基づいている、請求項１に記載のシステム。
【請求項１５】
前記ページ画像の前記第２の分類は、前記ページ画像が他のページの次のページの画像である場合に、前記ページ画像が前記他のページ画像と同じかまたは異なる第１の分類を有する確率の表に基づいている、請求項１に記載のシステム。
【請求項１６】
前記ページ画像の前記第２の分類は、前記ページ画像が他のページの次のページの画像である場合に、前記ページ画像と前記他のページ画像とに渡って存在する文法構造に基づいている、請求項１に記載のシステム。
【請求項１７】
ソースからの分類の対象となるページ画像のコンテンツに少なくとも部分的に適用され、前記ソースからの他のページ画像のコンテンツからは独立した基準の第１のセットを記憶するためのデータベースと、
前記データベース内に記憶された前記基準の第１のセットに基づいて、前記ソースからのコンテンツのページ画像を自動的に分類する第１の分類器と、
前記第１の分類器によって決定された前記ページ画像の前記第１の分類に基づいて、かつ、基準の第２のセットに基づいて、前記ページ画像の第２の分類を自動的に決定する、第２の分類器であって、基準の前記第２のセットは、前記ソースからの複数のページ画像のコンテンツに少なくとも部分的に適用される、第２の分類器と、
を具備する、システム。
【請求項１８】
前記ソース全体の前記コンテンツに、前記第２の基準は関連している、請求項１７に記載のシステム。
【請求項１９】
前記第１のまたは第２の基準は動的情報を含む、請求項１７に記載のシステム。
【請求項２０】
前記第１のまたは第２の基準は静的情報を含む、請求項１７に記載のシステム。
【請求項２１】
前記第２の分類器は、前記ページの前記画像を、表表紙と、フロントフェイスと、前付けと、著作権ページと、目次と、テキストと、インデックスと、後付けと、裏表紙とのうちの少なくとも１つとして分類する、請求項１７に記載のシステム。
【請求項２２】
前記第１のまたは第２の分類器は、リニアコンビネータである、請求項１７に記載のシステム。
【請求項２３】
前記リニアコンビネータは、前記ページの前記画像を、前記データベース内に記憶された前記第１のまたは第２の基準と、少なくとも１つの加重係数とに基づいて自動的に分類する、請求項２２に記載のシステム。
【請求項２４】
前記第１のまたは第２の分類器は、ベイズ分類器である、請求項１７に記載のシステム。
【請求項２５】
前記第１のまたは第２の分類器が前記ページの前記画像を自動的に分類することができない場合、前記ページの前記画像は手作業で分類される、請求項１７に記載のシステム。
【請求項２６】
前記第２の分類器によって提供された、前記ページの前記画像の第２の分類を検証する、検証器をさらに具備する、請求項１７に記載のシステム。
【請求項２７】
前記検証器が前記ページの前記画像の前記第２の分類を検証することができない場合、前記ページの前記画像は手作業で分類される、請求項２６に記載のシステム。
【請求項２８】
ソースからのコンテンツのページの画像に、第１の分類のための第１の基準を適用して、前記ページの前記画像についての第１の分類得点を決定することであって、前記第１の基準は、前記ソースからの前記分類の対象となるページ画像の前記コンテンツに少なくとも部分的に適用され、前記ソースからの他のページ画像のコンテンツからは独立した基準であり、
前記ページの前記画像についての前記第１の分類得点を、しきい値と比較し、
前記第１の分類得点が前記しきい値を満たす場合、前記ページの前記画像に前記第１の分類を自動的に割り当て、
前記第１の分類得点が前記しきい値を満たさない場合に、
前記ページの前記画像に、第２の分類のための第２の基準を適用して、前記ページの前記画像についての第２の分類得点を決定することであって、前記第２の基準は、前記第１の分類器によって決定された前記ページ画像の前記第１の分類、および前記ソースからの複数のページ画像のコンテンツに少なくとも部分的に適用される基準のセットに基づいており、
前記ページの前記画像についての前記第２の分類得点を、前記しきい値と比較し、
前記第２の分類得点が前記しきい値を満たさない場合に、
前記ページの前記画像に、第ｎの分類のための基準を適用して、前記ページの前記画像についての第ｎの分類得点を決定し、
前記ページの前記画像についての前記第ｎの分類得点を、前記しきい値と比較し、
前記第ｎの分類得点が前記しきい値を満たす場合、前記ページの前記画像に前記第ｎの分類を自動的に割り当てる、
ことを含む、コンピュータ実施方法。
【請求項２９】
前記第ｎの分類得点が前記しきい値を満たさない場合は、前記ページの前記画像に分類を手作業で割り当てる、請求項２８に記載のコンピュータ実施方法。
【請求項３０】
前記第１の基準は、前記ページの前記コンテンツに関連している、請求項２８に記載のコンピュータ実施方法。
【請求項３１】
前記第２の基準は、前記ソース全体の前記コンテンツに関連している、請求項２８に記載のコンピュータ実施方法。
【請求項３２】
前記基準に加重が適用される、請求項２８に記載のコンピュータ実施方法。
【請求項３３】
前記ページの前記画像の前記第１の分類を記憶する、
ことをさらに含む、請求項２８に記載のコンピュータ実施方法。
【請求項３４】
前記ページの前記画像への前記第１の基準の適用が不成功である場合に、前記ページの前記画像の前記第１の分類を手作業で割り当てることをさらに含む、請求項２８に記載のコンピュータ実施方法。
【請求項３５】
前記第１の基準は、静的情報と動的情報とのうちの少なくとも１つを含む、請求項２８に記載のコンピュータ実施方法。
【請求項３６】
前記ページの前記画像の前記第２の分類を記憶する、
ことをさらに含む、請求項２８に記載のコンピュータ実施方法。
【請求項３７】
前記ページの前記画像への前記第２の基準の適用が不成功である場合に、前記ページの前記画像の前記第２の分類を手作業で割り当てることをさらに含む、請求項２８に記載のコンピュータ実施方法。
【請求項３８】
前記第２の基準は、静的情報と動的情報とのうちの少なくとも１つを含む、請求項２８に記載のコンピュータ実施方法。
【請求項３９】
前記ページの前記画像にグローバルページデータを適用し、
前記ページの前記画像への、前記第２の基準と前記グローバルページデータとの適用が成功である場合に、前記ページの前記画像に第２の分類を自動的に割り当てる、
ことをさらに含む、請求項２８に記載のコンピュータ実施方法。
【請求項４０】
前記グローバルページデータは、前記ソースのすべてのページ画像から収集された総計ページ情報を含む、請求項３９に記載のコンピュータ実施方法。
【請求項４１】
前記ページの前記画像の前記第２の分類を検証することをさらに含む、請求項２８に記載のコンピュータ実施方法。
【請求項４２】
前記ページの前記画像の前記第２の分類の検証が不成功である場合に、前記ページの前記画像の分類を手作業で割り当てることをさらに含む、請求項４１に記載のコンピュータ実施方法。
【請求項４３】
請求項２８〜４２のいずれか一項に記載の方法を実行するためのコンピュータプログラム。

【図１】

【図２】

【図３】

【図４】

【図５】

【図６】

【図７】

【図８】

【図９】

【図１０】

【図１１】

【公開番号】特開２０１３−９３０４０（Ｐ２０１３−９３０４０Ａ）
【公開日】平成２５年５月１６日（２０１３．５．１６）
【国際特許分類】

物理学 (1,541,580)
- 計算；計数 (381,677)
  - イメージデータ処理または発生一般 (58,387)
    - 汎用イメージデータ処理 (27,485)
  - 電気的デジタルデータ処理 (228,215)
    - 特定の機能に特に適合したデジタル計算またはデータ処理の装置また... (34,028)
      - 情報検索；そのためのデータベース構造 (17,914)

【出願番号】特願２０１２−２８３８４５（Ｐ２０１２−２８３８４５）
【出願日】平成２４年１２月２７日（２０１２．１２．２７）
【分割の表示】特願２００９−５２６９０６（Ｐ２００９−５２６９０６）の分割
【原出願日】平成１９年８月３０日（２００７．８．３０）
【出願人】（５０７２４４０２４）アマゾン　テクノロジーズ，インク． (3)
【Ｆターム（参考）】

イメージ処理・作成 (84,044)

[ Back to top ]

ドキュメントページの自動分類

メニュー

スポンサーリンク

次の公報 »

« 前の公報

ドキュメントページの自動分類

メニュー

スポンサー リンク

次の公報 »

« 前の公報

スポンサーリンク