画像読み取り装置
【課題】 読み取った画像データを処理サーバーに転送する際、画像データ全体を送信すると、データを傍受、抽出された場合、第三者に原稿の内容が漏れてしまう。また、処理サーバーで必要のない画像データも原稿中には存在する。必要のない画像データ量だけ無駄なネットワーク通信が発生してしまう。
【解決手段】 画像データに対し、処理する認識処理外部サーバーを決定する手段と
外部サーバーとのネットワークの種類を判断する手段と外部サーバーの信頼度からデータ分割度合いを判断する手段とネットワークの種類とデータ分割度合いから、画像データを分割する手段と分割した矩形画像データを外部サーバーに送信し、処理結果を受信する手段と指定されたファイル形式の文書を生成し、指定された文書管理サーバーへ格納する手段とを有する画像読取装置。
【解決手段】 画像データに対し、処理する認識処理外部サーバーを決定する手段と
外部サーバーとのネットワークの種類を判断する手段と外部サーバーの信頼度からデータ分割度合いを判断する手段とネットワークの種類とデータ分割度合いから、画像データを分割する手段と分割した矩形画像データを外部サーバーに送信し、処理結果を受信する手段と指定されたファイル形式の文書を生成し、指定された文書管理サーバーへ格納する手段とを有する画像読取装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、処理サーバーと連携する画像読み取り装置に関するものである。
【背景技術】
【0002】
現在、スキャナー、ファクシミリ装置、複写機、又はこれらを複合した複合機、パーソナルコンピュータ、サーバー等をネットワークで相互に接続して、それぞれのサービス、機能を連携させて画像を生成する画像読み取り装置が存在している。そして、この画像生成処理を効率的に動作させる方法が提案されている。
【0003】
例えば、特許文献1に記載の技術では、画像読み取り装置で生成した画像をサーバーに送信する際、画像に含まれる有色部分の矩形画像のみ送信することにより、ネットワーク転送を効率化する方法を提供している。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開平6−303434号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
上記従来技術では、読み取った画像のすべての有色部分の矩形画像を送信する。そのため、サーバーにはすべての矩形画像が保存され、そのデータを傍受、抽出されてしまうというセキュリティ面での問題がある。また、実際にサーバーが処理に必要でない矩形画像も送信してしまうため、余計なネットワークトラフィックが発生してしまうという課題がある。
【課題を解決するための手段】
【0006】
本発明は上記課題を解決するものであり、
原稿を読み取る読み取り手段(117)と
前記読み取り手段で読み取った画像データを保存するファイル形式を設定する手段(図11)と
前記画像データに対し、処理する認識処理外部サーバーを決定する手段(図12)と
前記外部サーバーとのネットワークの種類を判断する手段(S102)と
前記外部サーバーの信頼度からデータ分割度合いを判断する手段(S103)と
前記ネットワークの種類とデータ分割度合いから、画像データを分割する手段(S404)と
前記分割した矩形画像データを前記外部サーバーに送信し、処理結果を受信する手段(S412)と
前記読み取り手段で読み取った画像データと前記外部サーバーの処理結果から、指定されたファイル形式の文書を生成する手段(S105)と
前記指定されたファイル形式の文書を指定された文書管理サーバー40へ格納ファイルを送信する手段(S106)とを有する画像読み取り装置(118)。
【発明の効果】
【0007】
外部サーバーのネットワークの種類や信頼度を用い画像データの転送方法を切り替えることによって、データ傍受やデータ抽出された場合においても、画像データの内容を識別することが困難になる。したがって、セキュリティ面で安全に処理を行うことが可能となる。また、文字領域部分の画像のみ送信することになるので、1つの文書を処理するのに必要な通信量が減少し、効率よく処理を行うことが可能となる。
【図面の簡単な説明】
【0008】
【図1】システム構成図
【図2】画像読み取り装置−ハードウェア構成図
【図3】外部サーバー−ハードウェア構成図
【図4】画像読み取り装置−画像処理メインフローチャート
【図5】画像読み取り装置−外部サーバーネットワーク種類判断フローチャート
【図6】画像読み取り装置−画像データの分割度合い判断フローチャート
【図7】画像読み取り装置−データ送信フローチャート
【図8】外部サーバー−データ処理フローチャート
【図9】画像読み取り装置−外部サーバー指定リスト
【図10】分割画像例
【図11】画像読み取り装置−スキャン送信画面例
【図12】画像読み取り装置−外部サーバー指定リスト画面例
【発明を実施するための形態】
【0009】
以下、本発明を実施するための最良の形態について図面を用いて説明する。
【0010】
[システム構成]
図1は本発明の実施形態のシステム構成の一例である。スキャナー10、帳票認識処理サーバー20、文書管理サーバー40はネットワーク(イントラネット)で接続されている。また、OCR処理サーバー30はネットワーク(インターネット)で接続されている。本実施例のスキャナー10は、複合機などでもよい。また、帳票処理サーバー20やOCR処理サーバー30はスキャナー10の一部機能を代行する処理サーバーの一例であって、その処理機能はこれに限らない。また、本実施例で処理サーバーは2台で構成するが、その台数は複数あってもよい。
【0011】
図2は本発明の実施形態の画像読み取り装置のコントローラユニットのハードウェア構成を示す図である。コントローラユニット118は、画像読み取り装置して機能するスキャナー117と接続することで、画像データやデバイス情報の入力を行う。
【0012】
CPU101は、画像読取装置全体を制御するプロセッサである。
【0013】
NVMEM100は、CPU101が動作するためのシステムワークメモリであり、プログラムを記録するためのプログラムメモリや、画像データを一時記録するための画像メモリでもある。NVMEM100は不揮発性のメモリであり設定情報等を記録する。
【0014】
FlashROM102は書き換え可能な不揮発性メモリであり、システムを制御するための各種制御プログラムが記録される。
【0015】
操作部I/F104は、操作部105とのインターフェース部で、操作部105に表示する画像データを出力する。また、操作部105からユーザーが入力した情報を、CPU101に伝える役割をする。
【0016】
USBポート110は、USBデバイス111との接続を可能にする。
【0017】
以上のデバイスがシステムバス106上に配置される。
【0018】
イメージバスIMAGE BUSI/F108は、システムバス106と画像データを高速で転送する画像バス112とを接続し、データ構造を変換するバスブリッジである。画像バス112は、PCIバスまたはIEEE1394で構成される。
【0019】
画像バス112上には以下のデバイスが配置される。
【0020】
ラスタイメージプロセッサRIP113はPDLコードのようなベクトルデータをビットマップイメージに展開する。
【0021】
スキャナーI/F115は、スキャナー117とコントローラユニット118を接続し、画像データの変換を行う。
【0022】
画像処理部116は、入力画像データに対し補正、加工、編集を行ったり、スキャナー入力画像データに対して、スキャナーの補正、解像度変換等を行う。また、これに加えて、画像データの回転や、多値画像データに対してはJPEG、2値画像データはJBIG、MMR、MH等の圧縮伸張処理を行う。また、帳票処理サーバー20やOCR処理サーバー30に送信する矩形画像の生成を行う。さらに、文書管理サーバー40に送信する文書ファイルの生成を行う。
【0023】
スキャナー117は、原稿を読み込み画像データに変換する部分である。その方式はレーザー等があるが、どの方式でも構わない。
【0024】
操作部105は、LCD表示部を有し、LCD上にタッチパネルシートが貼られている。また操作キーを有している。システムの操作画面を表示するとともに、表示してあるキーが押されるとその位置情報をCPU101に伝える。
【0025】
LANインターフェース107は、LANに接続するための機能ユニットで、LANを介してPCやサーバーに画像ファイルを送信したり、他のデバイスの情報を取得したりするために使用される。
【0026】
図3は本実施例の帳票認識処理サーバー20やOCR処理サーバー30もしくは文書管理サーバー40のハードウェア構成図の一例である。本発明を制御するCPU21、CPU21のワークエリアを提供するRAM22、記憶装置23、他機器とネットワークによる通信を行うネットワーク装置24、メインバス25により構成されている。
【0027】
[画像読み取りメインフロー]
図4は、本発明の実施形態に係る、スキャナー10における、画像処理メインフローチャートである。
【0028】
ステップS101において、操作部105で図10のような画面を用い、スキャン、文書管理サーバー40への文書ファイル格納を指示させる。この際、文書管理サーバー40へ保存する文書ファイル形式によって画像処理部116で行う処理が決定する。スキャナー117は本指示により、原稿台、ドキュメントフィーダーから原稿を読み込み、画像データを一時保存する。本実施例では、「検索可能なPDFファイル」が選択される。
【0029】
ステップS102において、前記ステップS101で指示された画像処理をもとに、画像処理可能な外部サーバーのネットワーク接続種類を判断する。詳細は後述する。本実施例では、外部サーバー指定リスト図9より、OCR機能を持つサーバーのネットワーク種類を取り出す。さらに、自動判別を用い、インターネットで接続されていると判断する。外部サーバー指定リスト図9は、事前に、操作部105を用い、図12のような設定画面で設定されている。
【0030】
ステップS103において、画像処理を行う外部サーバーへ送信する画像データの分割度合いを判断する。詳細は後述する。本実施例では、外部サーバー指定リスト図9より、サーバー信頼度を取り出す。さらに、その信頼度からデータ分割度合いを細かいに設定する。
【0031】
ステップS104において、前記ステップS102, S103において判断した情報を元に、画像を分割し、外部処理サーバーへ送信する。また、外部サーバーの処理結果を受信する。本実施例では、OCR処理が行える最小矩形画像に分割し、矩形画像ごとにOCR処理を依頼し、認識結果文字列を受信する。
【0032】
ステップS105において、前記ステップS104の処理結果と前記ステップS101の画像データを合成し、文書ファイル(検索可能なPDF)を生成する。
【0033】
ステップS106において、前記ステップS104で生成した文書ファイルを前記ステップS101において指示された文書管理サーバー40へ送信し、本フローを終了する。
【0034】
[外部サーバーネットワーク種類判断フロー]
図5は、本発明の実施形態に係る、スキャナー10における、外部サーバーネットワーク種類判断フローチャートである。図4のステップS102の詳細化した図である。
【0035】
ステップS201において、外部サーバー指定リスト図9から前記ステップS101で指定された画像処理設定に基づき、処理可能な外部サーバーを検索する。本実施例ではOCR処理設定を指示され、OCRサーバーを検索する。検索されたOCRサーバーのネットワーク種類を取得し、次のステップへ進む。ネットワーク種類が設定されていない、もしくは、自動の場合、ステップS202へ移る。ネットワークの種類が設定されている場合は、ステップS206移る。
【0036】
ステップS202において、前記ステップS201で検索された外部サーバーのアドレスを取得しDNSなど名前解決サーバーを用い、名前解決を行い、IPアドレスを取得する。
【0037】
ステップS203において、自機IPアドレスを取得し、外部サーバーのIPアドレスを比較する。外部サーバーのIPアドレスが同一サブネット内にない場合は、外部サーバーがインターネットにあると判断し、ステップS205へ移る。外部サーバーのIPアドレスが同一サブネット内にある場合は、外部サーバーがイントラネットにあると判断し、ステップS206へ移る。
【0038】
ステップS204において、前記ステップS201で検索された外部サーバーのネットワーク種類設定を取得する。ネットワーク種類設定がインターネットの場合は、ステップS205へ移る。ネットワーク種類設定がイントラネットの場合は、ステップS206へ移る。
【0039】
ステップS205において、前記ステップS201で検索された外部サーバーのネットワーク種類設定をイントラネットに設定し、本フローを終了する。
【0040】
ステップS206において、前記ステップS201で検索された外部サーバーのネットワーク種類設定をインターネットに設定し、本フローを終了する。
【0041】
[画像データの分割度合い判断フロー]
図6は、本発明の実施形態に係る、スキャナー10における、画像データの分割度合い判断フローチャートである。
【0042】
ステップS301において、外部サーバー指定リスト図9から前記ステップS101で指定された画像処理設定に基づき、処理可能な外部サーバーを検索する。本実施例ではOCR処理設定を指示され、OCRサーバーを検索する。検索されたOCRサーバーのサーバー信頼度設定を取得し、次のステップへ進む。
【0043】
ステップS302において、前記ステップS301で取得したサーバー信頼度が高い場合は、ステップS303へ移る。サーバー信頼度が中の場合は、ステップS304へ移る。サーバー信頼度が低い場合は、ステップS305へ移る。
【0044】
ステップS303において、前記ステップS301で検索された外部サーバーへ送信するデータ分割設定を“荒い”に設定し、本フローを終了する。
【0045】
ステップS304において、前記ステップS301で検索された外部サーバーへ送信するデータ分割設定を“普通”に設定し、本フローを終了する。
【0046】
ステップS305において、前記ステップS301で検索された外部サーバーへ送信するデータ分割設定を“細かい”に設定し、本フローを終了する。
【0047】
[データ送信フロー]
図7は、本発明の実施形態に係る、スキャナー10における、データ送信フローチャートである。
【0048】
ステップS401において、外部サーバー指定リスト図9から前記ステップS101で指定された画像処理設定に基づき、処理可能な外部サーバーを検索する。本実施例ではOCR処理設定を指示され、OCRサーバーを検索する。検索されたOCRサーバーの情報を取得する。
【0049】
ステップS402において、前記外部サーバーネットワーク種類判断フローで判断したネットワークの種類を取得する。ここで、ネットワークの種類がイントラネットの場合、外部サーバーの信頼性も高く、データ傍受や外部サーバーからデータ抽出される可能性が低いため、ステップS410へ移る。ネットワークの種類がインターネットの場合、データ傍受や外部サーバーからデータ抽出される可能性があるため、前記ステップS101で読み込んだ画像データ全体を送信するべきではない。したがって、ステップS403へ移る。
【0050】
ステップS403において、前記画像データの分割度合い判断フローで判断したデータ分割度合いを取得する。画像データを送信する外部サーバーの信頼性が低い、データ傍受やデータ抽出の可能性が高い場合、画像データを細かく分割するステップS404へ移る。外部サーバーの信頼性が中程度である場合、画像データをある程度まとまった矩形画像にまとめるステップS405へ移る。インターネットであっても、外部サーバーの信頼性が高い場合、画像データをまとまった矩形画像にまとめるステップS407へ移る。
【0051】
ステップS404において、画像データを像域分離技術により、文字領域から文字単位の矩形画像を生成する。図10のような画像データを読み込んだ場合、文字矩形分割31のように区切られる。各矩形画像を後述のステップS411により、1つ1つ外部サーバーに送信すると、外部サーバーではOCRにより認識することが可能である。さらに、文字単位の矩形画像が一時的に外部サーバーに保存される。単体の矩形画像では、文章を推測することは困難であるため、外部サーバーの信頼性が低くても、安全に処理を行うことが可能となる。
【0052】
ステップS405において、処理は前記ステップS404と同じである。本ステップではさらにステップS406へ移る。
【0053】
ステップS406において、前記ステップS405で生成した文字単位の横方向に隣接する矩形画像を接合し、行単位の矩形画像32を生成する。
【0054】
ステップS407において、処理は前記ステップS404と同じである。本ステップではさらにステップS408へ移る。
【0055】
ステップS408において、処理は前記ステップS406と同じである。本ステップではさらにステップS409へ移る。
【0056】
ステップS409において、前記ステップS408で生成した行単位の縦方向に隣接する矩形画像を接合し、ブロック単位の矩形画像33を生成する。外部サーバーがインターネットで接続されていても、提供元や管理、運用、契約の面で信頼性が高い場合は、後述する画像送信の回数を減らすことが可能となる。
【0057】
ステップS410において、画像データ全体を1つの矩形画像として生成する。
【0058】
ステップS411において、外部サーバーに前記ステップS404からS410で生成した矩形画像を送信する。処理可能な外部サーバーが複数あった場合は、矩形画像ごとに異なる外部サーバーに送信してもよい。外部サーバーを分散させることにより、そのうちの一つの外部サーバーからデータを抽出されても、元の原稿に記載されている内容を判別することは困難になる。
【0059】
ステップS412において、外部サーバーの処理結果を受信する。
【0060】
ステップS413において、前記ステップS404からS410で生成したすべての矩形画像を処理したか確認する。処理していない場合は、前記ステップS411に戻り、次の矩形画像を処理する。すべての矩形画像の処理を終えたら、本フローを終了する。
【0061】
[外部サーバー処理フロー]
図8は、本発明の実施形態に係る、外部サーバー20,30における、データ処理フローチャートである。
【0062】
ステップS501において、前記ステップS411で送信された矩形画像を受信する。
【0063】
ステップS502において、前記ステップS501で受信した矩形画像に対し認識処理を実行する。
【0064】
ステップS503において、前記ステップS503の認識結果を送信し、本フローを終了する。
【0065】
本発明の実施形態で、外部サーバーのネットワークの種類や信頼度を用い画像データの転送方法を切り替えることによって、データ傍受やデータ抽出された場合においても、画像データの内容を識別することが困難になる。したがって、セキュリティ面で安全に処理を行うことが可能となる。また、文字領域部分の画像のみ送信することになるので、1つの文書を処理するのに必要な通信量が減少し、効率よく処理を行うことが可能となる。
【符号の説明】
【0066】
10 スキャナー
20 帳票認識処理サーバー
30 OCR処理サーバー
【技術分野】
【0001】
本発明は、処理サーバーと連携する画像読み取り装置に関するものである。
【背景技術】
【0002】
現在、スキャナー、ファクシミリ装置、複写機、又はこれらを複合した複合機、パーソナルコンピュータ、サーバー等をネットワークで相互に接続して、それぞれのサービス、機能を連携させて画像を生成する画像読み取り装置が存在している。そして、この画像生成処理を効率的に動作させる方法が提案されている。
【0003】
例えば、特許文献1に記載の技術では、画像読み取り装置で生成した画像をサーバーに送信する際、画像に含まれる有色部分の矩形画像のみ送信することにより、ネットワーク転送を効率化する方法を提供している。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開平6−303434号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
上記従来技術では、読み取った画像のすべての有色部分の矩形画像を送信する。そのため、サーバーにはすべての矩形画像が保存され、そのデータを傍受、抽出されてしまうというセキュリティ面での問題がある。また、実際にサーバーが処理に必要でない矩形画像も送信してしまうため、余計なネットワークトラフィックが発生してしまうという課題がある。
【課題を解決するための手段】
【0006】
本発明は上記課題を解決するものであり、
原稿を読み取る読み取り手段(117)と
前記読み取り手段で読み取った画像データを保存するファイル形式を設定する手段(図11)と
前記画像データに対し、処理する認識処理外部サーバーを決定する手段(図12)と
前記外部サーバーとのネットワークの種類を判断する手段(S102)と
前記外部サーバーの信頼度からデータ分割度合いを判断する手段(S103)と
前記ネットワークの種類とデータ分割度合いから、画像データを分割する手段(S404)と
前記分割した矩形画像データを前記外部サーバーに送信し、処理結果を受信する手段(S412)と
前記読み取り手段で読み取った画像データと前記外部サーバーの処理結果から、指定されたファイル形式の文書を生成する手段(S105)と
前記指定されたファイル形式の文書を指定された文書管理サーバー40へ格納ファイルを送信する手段(S106)とを有する画像読み取り装置(118)。
【発明の効果】
【0007】
外部サーバーのネットワークの種類や信頼度を用い画像データの転送方法を切り替えることによって、データ傍受やデータ抽出された場合においても、画像データの内容を識別することが困難になる。したがって、セキュリティ面で安全に処理を行うことが可能となる。また、文字領域部分の画像のみ送信することになるので、1つの文書を処理するのに必要な通信量が減少し、効率よく処理を行うことが可能となる。
【図面の簡単な説明】
【0008】
【図1】システム構成図
【図2】画像読み取り装置−ハードウェア構成図
【図3】外部サーバー−ハードウェア構成図
【図4】画像読み取り装置−画像処理メインフローチャート
【図5】画像読み取り装置−外部サーバーネットワーク種類判断フローチャート
【図6】画像読み取り装置−画像データの分割度合い判断フローチャート
【図7】画像読み取り装置−データ送信フローチャート
【図8】外部サーバー−データ処理フローチャート
【図9】画像読み取り装置−外部サーバー指定リスト
【図10】分割画像例
【図11】画像読み取り装置−スキャン送信画面例
【図12】画像読み取り装置−外部サーバー指定リスト画面例
【発明を実施するための形態】
【0009】
以下、本発明を実施するための最良の形態について図面を用いて説明する。
【0010】
[システム構成]
図1は本発明の実施形態のシステム構成の一例である。スキャナー10、帳票認識処理サーバー20、文書管理サーバー40はネットワーク(イントラネット)で接続されている。また、OCR処理サーバー30はネットワーク(インターネット)で接続されている。本実施例のスキャナー10は、複合機などでもよい。また、帳票処理サーバー20やOCR処理サーバー30はスキャナー10の一部機能を代行する処理サーバーの一例であって、その処理機能はこれに限らない。また、本実施例で処理サーバーは2台で構成するが、その台数は複数あってもよい。
【0011】
図2は本発明の実施形態の画像読み取り装置のコントローラユニットのハードウェア構成を示す図である。コントローラユニット118は、画像読み取り装置して機能するスキャナー117と接続することで、画像データやデバイス情報の入力を行う。
【0012】
CPU101は、画像読取装置全体を制御するプロセッサである。
【0013】
NVMEM100は、CPU101が動作するためのシステムワークメモリであり、プログラムを記録するためのプログラムメモリや、画像データを一時記録するための画像メモリでもある。NVMEM100は不揮発性のメモリであり設定情報等を記録する。
【0014】
FlashROM102は書き換え可能な不揮発性メモリであり、システムを制御するための各種制御プログラムが記録される。
【0015】
操作部I/F104は、操作部105とのインターフェース部で、操作部105に表示する画像データを出力する。また、操作部105からユーザーが入力した情報を、CPU101に伝える役割をする。
【0016】
USBポート110は、USBデバイス111との接続を可能にする。
【0017】
以上のデバイスがシステムバス106上に配置される。
【0018】
イメージバスIMAGE BUSI/F108は、システムバス106と画像データを高速で転送する画像バス112とを接続し、データ構造を変換するバスブリッジである。画像バス112は、PCIバスまたはIEEE1394で構成される。
【0019】
画像バス112上には以下のデバイスが配置される。
【0020】
ラスタイメージプロセッサRIP113はPDLコードのようなベクトルデータをビットマップイメージに展開する。
【0021】
スキャナーI/F115は、スキャナー117とコントローラユニット118を接続し、画像データの変換を行う。
【0022】
画像処理部116は、入力画像データに対し補正、加工、編集を行ったり、スキャナー入力画像データに対して、スキャナーの補正、解像度変換等を行う。また、これに加えて、画像データの回転や、多値画像データに対してはJPEG、2値画像データはJBIG、MMR、MH等の圧縮伸張処理を行う。また、帳票処理サーバー20やOCR処理サーバー30に送信する矩形画像の生成を行う。さらに、文書管理サーバー40に送信する文書ファイルの生成を行う。
【0023】
スキャナー117は、原稿を読み込み画像データに変換する部分である。その方式はレーザー等があるが、どの方式でも構わない。
【0024】
操作部105は、LCD表示部を有し、LCD上にタッチパネルシートが貼られている。また操作キーを有している。システムの操作画面を表示するとともに、表示してあるキーが押されるとその位置情報をCPU101に伝える。
【0025】
LANインターフェース107は、LANに接続するための機能ユニットで、LANを介してPCやサーバーに画像ファイルを送信したり、他のデバイスの情報を取得したりするために使用される。
【0026】
図3は本実施例の帳票認識処理サーバー20やOCR処理サーバー30もしくは文書管理サーバー40のハードウェア構成図の一例である。本発明を制御するCPU21、CPU21のワークエリアを提供するRAM22、記憶装置23、他機器とネットワークによる通信を行うネットワーク装置24、メインバス25により構成されている。
【0027】
[画像読み取りメインフロー]
図4は、本発明の実施形態に係る、スキャナー10における、画像処理メインフローチャートである。
【0028】
ステップS101において、操作部105で図10のような画面を用い、スキャン、文書管理サーバー40への文書ファイル格納を指示させる。この際、文書管理サーバー40へ保存する文書ファイル形式によって画像処理部116で行う処理が決定する。スキャナー117は本指示により、原稿台、ドキュメントフィーダーから原稿を読み込み、画像データを一時保存する。本実施例では、「検索可能なPDFファイル」が選択される。
【0029】
ステップS102において、前記ステップS101で指示された画像処理をもとに、画像処理可能な外部サーバーのネットワーク接続種類を判断する。詳細は後述する。本実施例では、外部サーバー指定リスト図9より、OCR機能を持つサーバーのネットワーク種類を取り出す。さらに、自動判別を用い、インターネットで接続されていると判断する。外部サーバー指定リスト図9は、事前に、操作部105を用い、図12のような設定画面で設定されている。
【0030】
ステップS103において、画像処理を行う外部サーバーへ送信する画像データの分割度合いを判断する。詳細は後述する。本実施例では、外部サーバー指定リスト図9より、サーバー信頼度を取り出す。さらに、その信頼度からデータ分割度合いを細かいに設定する。
【0031】
ステップS104において、前記ステップS102, S103において判断した情報を元に、画像を分割し、外部処理サーバーへ送信する。また、外部サーバーの処理結果を受信する。本実施例では、OCR処理が行える最小矩形画像に分割し、矩形画像ごとにOCR処理を依頼し、認識結果文字列を受信する。
【0032】
ステップS105において、前記ステップS104の処理結果と前記ステップS101の画像データを合成し、文書ファイル(検索可能なPDF)を生成する。
【0033】
ステップS106において、前記ステップS104で生成した文書ファイルを前記ステップS101において指示された文書管理サーバー40へ送信し、本フローを終了する。
【0034】
[外部サーバーネットワーク種類判断フロー]
図5は、本発明の実施形態に係る、スキャナー10における、外部サーバーネットワーク種類判断フローチャートである。図4のステップS102の詳細化した図である。
【0035】
ステップS201において、外部サーバー指定リスト図9から前記ステップS101で指定された画像処理設定に基づき、処理可能な外部サーバーを検索する。本実施例ではOCR処理設定を指示され、OCRサーバーを検索する。検索されたOCRサーバーのネットワーク種類を取得し、次のステップへ進む。ネットワーク種類が設定されていない、もしくは、自動の場合、ステップS202へ移る。ネットワークの種類が設定されている場合は、ステップS206移る。
【0036】
ステップS202において、前記ステップS201で検索された外部サーバーのアドレスを取得しDNSなど名前解決サーバーを用い、名前解決を行い、IPアドレスを取得する。
【0037】
ステップS203において、自機IPアドレスを取得し、外部サーバーのIPアドレスを比較する。外部サーバーのIPアドレスが同一サブネット内にない場合は、外部サーバーがインターネットにあると判断し、ステップS205へ移る。外部サーバーのIPアドレスが同一サブネット内にある場合は、外部サーバーがイントラネットにあると判断し、ステップS206へ移る。
【0038】
ステップS204において、前記ステップS201で検索された外部サーバーのネットワーク種類設定を取得する。ネットワーク種類設定がインターネットの場合は、ステップS205へ移る。ネットワーク種類設定がイントラネットの場合は、ステップS206へ移る。
【0039】
ステップS205において、前記ステップS201で検索された外部サーバーのネットワーク種類設定をイントラネットに設定し、本フローを終了する。
【0040】
ステップS206において、前記ステップS201で検索された外部サーバーのネットワーク種類設定をインターネットに設定し、本フローを終了する。
【0041】
[画像データの分割度合い判断フロー]
図6は、本発明の実施形態に係る、スキャナー10における、画像データの分割度合い判断フローチャートである。
【0042】
ステップS301において、外部サーバー指定リスト図9から前記ステップS101で指定された画像処理設定に基づき、処理可能な外部サーバーを検索する。本実施例ではOCR処理設定を指示され、OCRサーバーを検索する。検索されたOCRサーバーのサーバー信頼度設定を取得し、次のステップへ進む。
【0043】
ステップS302において、前記ステップS301で取得したサーバー信頼度が高い場合は、ステップS303へ移る。サーバー信頼度が中の場合は、ステップS304へ移る。サーバー信頼度が低い場合は、ステップS305へ移る。
【0044】
ステップS303において、前記ステップS301で検索された外部サーバーへ送信するデータ分割設定を“荒い”に設定し、本フローを終了する。
【0045】
ステップS304において、前記ステップS301で検索された外部サーバーへ送信するデータ分割設定を“普通”に設定し、本フローを終了する。
【0046】
ステップS305において、前記ステップS301で検索された外部サーバーへ送信するデータ分割設定を“細かい”に設定し、本フローを終了する。
【0047】
[データ送信フロー]
図7は、本発明の実施形態に係る、スキャナー10における、データ送信フローチャートである。
【0048】
ステップS401において、外部サーバー指定リスト図9から前記ステップS101で指定された画像処理設定に基づき、処理可能な外部サーバーを検索する。本実施例ではOCR処理設定を指示され、OCRサーバーを検索する。検索されたOCRサーバーの情報を取得する。
【0049】
ステップS402において、前記外部サーバーネットワーク種類判断フローで判断したネットワークの種類を取得する。ここで、ネットワークの種類がイントラネットの場合、外部サーバーの信頼性も高く、データ傍受や外部サーバーからデータ抽出される可能性が低いため、ステップS410へ移る。ネットワークの種類がインターネットの場合、データ傍受や外部サーバーからデータ抽出される可能性があるため、前記ステップS101で読み込んだ画像データ全体を送信するべきではない。したがって、ステップS403へ移る。
【0050】
ステップS403において、前記画像データの分割度合い判断フローで判断したデータ分割度合いを取得する。画像データを送信する外部サーバーの信頼性が低い、データ傍受やデータ抽出の可能性が高い場合、画像データを細かく分割するステップS404へ移る。外部サーバーの信頼性が中程度である場合、画像データをある程度まとまった矩形画像にまとめるステップS405へ移る。インターネットであっても、外部サーバーの信頼性が高い場合、画像データをまとまった矩形画像にまとめるステップS407へ移る。
【0051】
ステップS404において、画像データを像域分離技術により、文字領域から文字単位の矩形画像を生成する。図10のような画像データを読み込んだ場合、文字矩形分割31のように区切られる。各矩形画像を後述のステップS411により、1つ1つ外部サーバーに送信すると、外部サーバーではOCRにより認識することが可能である。さらに、文字単位の矩形画像が一時的に外部サーバーに保存される。単体の矩形画像では、文章を推測することは困難であるため、外部サーバーの信頼性が低くても、安全に処理を行うことが可能となる。
【0052】
ステップS405において、処理は前記ステップS404と同じである。本ステップではさらにステップS406へ移る。
【0053】
ステップS406において、前記ステップS405で生成した文字単位の横方向に隣接する矩形画像を接合し、行単位の矩形画像32を生成する。
【0054】
ステップS407において、処理は前記ステップS404と同じである。本ステップではさらにステップS408へ移る。
【0055】
ステップS408において、処理は前記ステップS406と同じである。本ステップではさらにステップS409へ移る。
【0056】
ステップS409において、前記ステップS408で生成した行単位の縦方向に隣接する矩形画像を接合し、ブロック単位の矩形画像33を生成する。外部サーバーがインターネットで接続されていても、提供元や管理、運用、契約の面で信頼性が高い場合は、後述する画像送信の回数を減らすことが可能となる。
【0057】
ステップS410において、画像データ全体を1つの矩形画像として生成する。
【0058】
ステップS411において、外部サーバーに前記ステップS404からS410で生成した矩形画像を送信する。処理可能な外部サーバーが複数あった場合は、矩形画像ごとに異なる外部サーバーに送信してもよい。外部サーバーを分散させることにより、そのうちの一つの外部サーバーからデータを抽出されても、元の原稿に記載されている内容を判別することは困難になる。
【0059】
ステップS412において、外部サーバーの処理結果を受信する。
【0060】
ステップS413において、前記ステップS404からS410で生成したすべての矩形画像を処理したか確認する。処理していない場合は、前記ステップS411に戻り、次の矩形画像を処理する。すべての矩形画像の処理を終えたら、本フローを終了する。
【0061】
[外部サーバー処理フロー]
図8は、本発明の実施形態に係る、外部サーバー20,30における、データ処理フローチャートである。
【0062】
ステップS501において、前記ステップS411で送信された矩形画像を受信する。
【0063】
ステップS502において、前記ステップS501で受信した矩形画像に対し認識処理を実行する。
【0064】
ステップS503において、前記ステップS503の認識結果を送信し、本フローを終了する。
【0065】
本発明の実施形態で、外部サーバーのネットワークの種類や信頼度を用い画像データの転送方法を切り替えることによって、データ傍受やデータ抽出された場合においても、画像データの内容を識別することが困難になる。したがって、セキュリティ面で安全に処理を行うことが可能となる。また、文字領域部分の画像のみ送信することになるので、1つの文書を処理するのに必要な通信量が減少し、効率よく処理を行うことが可能となる。
【符号の説明】
【0066】
10 スキャナー
20 帳票認識処理サーバー
30 OCR処理サーバー
【特許請求の範囲】
【請求項1】
原稿を読み取る読み取り手段(117)と
前記読み取り手段で読み取った画像データを保存するファイル形式を設定する手段(図11)と
前記画像データに対し、処理する認識処理外部サーバーを決定する手段(図12)と
前記外部サーバーとのネットワークの種類を判断する手段(S102)と
前記外部サーバーの信頼度からデータ分割度合いを判断する手段(S103)と
前記ネットワークの種類とデータ分割度合いから、画像データを分割する手段(S404)と
前記分割した矩形画像データを前記外部サーバーに送信し、処理結果を受信する手段(S412)と
前記読み取り手段で読み取った画像データと前記外部サーバーの処理結果から、指定されたファイル形式の文書を生成する手段(S105)と
前記指定されたファイル形式の文書を指定された文書管理サーバー40へ格納ファイルを送信する手段(S106)とを有する画像読み取り装置(118)。
【請求項1】
原稿を読み取る読み取り手段(117)と
前記読み取り手段で読み取った画像データを保存するファイル形式を設定する手段(図11)と
前記画像データに対し、処理する認識処理外部サーバーを決定する手段(図12)と
前記外部サーバーとのネットワークの種類を判断する手段(S102)と
前記外部サーバーの信頼度からデータ分割度合いを判断する手段(S103)と
前記ネットワークの種類とデータ分割度合いから、画像データを分割する手段(S404)と
前記分割した矩形画像データを前記外部サーバーに送信し、処理結果を受信する手段(S412)と
前記読み取り手段で読み取った画像データと前記外部サーバーの処理結果から、指定されたファイル形式の文書を生成する手段(S105)と
前記指定されたファイル形式の文書を指定された文書管理サーバー40へ格納ファイルを送信する手段(S106)とを有する画像読み取り装置(118)。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【公開番号】特開2012−253579(P2012−253579A)
【公開日】平成24年12月20日(2012.12.20)
【国際特許分類】
【出願番号】特願2011−124747(P2011−124747)
【出願日】平成23年6月3日(2011.6.3)
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】
【公開日】平成24年12月20日(2012.12.20)
【国際特許分類】
【出願日】平成23年6月3日(2011.6.3)
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】
[ Back to top ]