画像読取装置及び方法、画像読取システム、プログラム、並びに記憶媒体
【課題】 本発明は、原稿を再読み取りする時間を短縮することができ、ユーザに読取解像度の変更を意識させることなく、画像読み取り及び文字認識処理を行うことができる画像読取システムを提供する。
【解決手段】 本画像読取システムは、パーソナルコンピュータ等から成る情報処理装置100と、当該情報処理装置100に通信ネットワーク300を介して接続されたスキャナ200とで構成され、情報処理装置100が、スキャナ200から受信したプレスキャン画像を文字や絵など同類のブロックに分割し、分割した各ブロックのブロック位置情報及び最適解像度を逐次算出してスキャナ200に送信し、当該ブロック位置情報及び最適解像度に基づいて当該ブロックの本スキャンを順次行わせる。
【解決手段】 本画像読取システムは、パーソナルコンピュータ等から成る情報処理装置100と、当該情報処理装置100に通信ネットワーク300を介して接続されたスキャナ200とで構成され、情報処理装置100が、スキャナ200から受信したプレスキャン画像を文字や絵など同類のブロックに分割し、分割した各ブロックのブロック位置情報及び最適解像度を逐次算出してスキャナ200に送信し、当該ブロック位置情報及び最適解像度に基づいて当該ブロックの本スキャンを順次行わせる。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、原稿の画像を最適な読取解像度で読み取ることが可能な画像読取装置及び方法、画像読取システム、プログラム、並びに記憶媒体に関するものである。
【背景技術】
【0002】
近年、原稿の画像を読み取ると共に、OCR(Optical Character Reader)処理と連動して高精度の文字認識を行う画像読取装置が提案されている(例えば、特許文献1参照)。この画像読取装置では、低解像度で原稿の読み取り動作が実行された後にOCR処理で文字認識が行われ、文字認識率が所定値未満である場合、当該所定値に達するまで段階的に解像度を上げて読み取り動作が行われている。
【特許文献1】特開2000−293633号公報
【発明の開示】
【発明が解決しようとする課題】
【0003】
しかしながら、上記特許文献1に記載された画像読取装置では、文字認識率が所定値未満である場合、たとえ原稿上に文字認識率の高い部分があっても、読取解像度を上げて再度原稿全体に対して読み取り動作が実行されることになり、無駄に時間を消費するという問題がある。
【0004】
また、再読み取り時間を短縮するために、最初に低解像度で読み取り動作が実行された時点で、ユーザ自身が原稿に応じた最適な読取解像度を意識しなければならないという問題もある。
【0005】
本発明は、上記問題を解決すべく成されたものであり、原稿を再読み取りする時間を短縮することができ、ユーザに読取解像度の変更を意識させることなく、画像読み取り及び文字認識処理を行うことができる画像読取装置及び方法、画像読取システム、プログラム、並びに記憶媒体を提供することを目的とする。
【課題を解決するための手段】
【0006】
上記目的を達成するために、請求項1記載の画像読取システムは、原稿の画像を読み取る画像読取装置と、当該画像読取装置に接続された情報処理装置とで構成される画像読取システムにおいて、前記画像読取装置は、前記原稿を第1の読取解像度で読み取る第1の画像読取手段と、前記第1の画像読取手段により得られた第1の画像データを前記情報処理装置に送信する送信手段と、前記情報処理装置からの指示情報に基づいて前記原稿上の複数の範囲を互いに異なる第2の読取解像度で読み取る第2の画像読取手段とを備え、前記情報処理装置は、前記画像読取装置から受信した前記第1の画像データを複数の第2の画像データに分割する分割手段と、前記複数の第2の画像データからそれぞれ第2の読取解像度を算出する算出手段と、前記算出された第2の読取解像度を記憶する読取解像度記憶手段と、前記原稿を前記第2の画像データ毎に前記第2の読取解像度で読み取るように指示する指示情報を前記画像読取装置に送る画像読取指示手段とを備えることを特徴とする。
【0007】
上記目的を達成するために、請求項11記載の画像読取装置は、原稿の画像を読み取る画像読取装置において、前記原稿を第1の読取解像度で読み取る第1の画像読取手段と、前記第1の画像読取手段により得られた第1の画像データを複数の第2の画像データに分割する分割手段と、前記複数の第2の画像データからそれぞれ第2の読取解像度を算出する算出手段と、前記原稿を前記第2の画像データ毎に前記第2の読取解像度で読み取る第2の画像読取手段とを備えることを特徴とする。
【0008】
上記目的を達成するために、請求項12記載の画像読取方法は、原稿の画像を読み取る画像読取装置の画像読取方法において、前記原稿を第1の読取解像度で読み取る第1の画像読取工程と、前記第1の画像読取手段により得られた第1の画像データを複数の第2の画像データに分割する分割工程と、前記複数の第2の画像データからそれぞれ第2の読取解像度を算出する算出工程と、前記原稿を前記第2の画像データ毎に前記第2の読取解像度で読み取る第2の画像読取工程とを備えることを特徴とする。
【0009】
上記目的を達成するために、請求項13記載の画像読取方法は、原稿の画像を読み取る画像読取装置と、当該画像読取装置に接続された情報処理装置とで構成される画像読取システムの画像読取方法において、前記原稿を第1の読取解像度で読み取る第1の画像読取工程と、前記第1の画像読取手段により得られた第1の画像データを前記情報処理装置に送信する送信工程と、前記情報処理装置からの指示情報に基づいて前記原稿上の複数の範囲を互いに異なる第2の読取解像度で読み取る第2の画像読取工程と、前記画像読取装置から受信した前記第1の画像データを複数の第2の画像データに分割する分割工程と、前記複数の第2の画像データからそれぞれ第2の読取解像度を算出する算出工程と、前記算出された第2の読取解像度を記憶する読取解像度記憶工程と、前記原稿を前記第2の画像データ毎に前記第2の読取解像度で読み取るように指示する指示情報を前記画像読取装置に送る画像読取指示工程とを備えることを特徴とする。
【発明の効果】
【0010】
本発明によれば、原稿を第1の読取解像度で読み取って得られた第1の画像データを複数の第2の画像データに分割し、当該複数の第2の画像データからそれぞれ第2の読取解像度を算出し、原稿を第2の画像データ毎に第2の読取解像度で読み取るので、画像データの部分ごとに読取解像度を変更して読み取りを行うことにより、原稿の再読み取り時間を短縮することができ、ユーザに読取解像度の変更を意識させることなく、画像読み取り及び文字認識処理を行うことができる。
【発明を実施するための最良の形態】
【0011】
以下、本発明の実施の形態を図面を参照して詳細に説明する。
【0012】
[第1の実施の形態]
図1は、本発明の実施の形態に係る画像読取システム全体のシステム構成と内部のハードウェア構成を示すブロック図である。
【0013】
図1において、本画像読取システム1は、パーソナルコンピュータ等から成る情報処理装置100と、当該情報処理装置100に通信ネットワーク300を介して接続されたスキャナ200とで構成される。
【0014】
情報処理装置100は、CPU101と、RAM102と、ROM103と、外部メモリ104と、入力装置106と、表示装置107と、印刷装置108と、通信インターフェース109とを備える。スキャナ200は、不図示の原稿台上に載置された原稿の画像を読み取ることが可能な画像読取装置である。
【0015】
ROM103又は外部メモリ104は、CPU101の制御プログラムであるBIOS(Basic Input/Output System)やオペレーティングシステム(以下、「OS」という。)等を記憶するものである。RAM102は、CPU101の主メモリ、ワークエリア等として機能するものである。
【0016】
CPU101は、システムバス110に接続された各種デバイスとのアクセスを総括的に制御すると共に、後述する処理の実行に際して必要なプログラム等をRAM102にロードし、当該プログラム等を実行することで各種動作を実現するものである。
【0017】
入力装置106は、キーボードやポインティングデバイス等で構成されるものである。表示装置107は、LCD(Liquid Crystal Display)等で構成されるものである。印刷装置108は、レーザプリンタ等で構成されるものである。通信インターフェース109は、所定のプロトコルにより通信ネットワーク300に接続すると共に、スキャナ200との通信を制御するものである。
【0018】
外部メモリ104は、ハードディスク等の記憶装置で構成され、後述する文字認識処理で使用されるデータベース(DB)105を備える。DB105は、図11(a)に示す解像度変換Indexテーブル1101及び図11(b)に示す解像度変換No.テーブル1102を備える。解像度変換Indexテーブル1101は、文字の高さから解像度変換テーブルNo.を決定するためのテーブル情報である。解像度変換No.テーブル1102は、黒白変化点数から必要最小限の解像度を決定するためのテーブル情報である。
【0019】
次に、図1の画像読取システム1における文字認識処理について図2〜図6を参照して説明する。
【0020】
図2は、図1の画像読取システム1にて実行される文字認識処理を示すフローチャートである。本処理は、ROM103又は外部メモリ104に格納されたプログラムに基づいてCPU101により実行されるものである。
【0021】
図2において、まず、ステップS401では、スキャナ200が原稿に対して75dpiの低解像度でプレスキャンを行い、その結果をプレスキャン画像として情報処理装置100に送信する。
【0022】
次に、情報処理装置100は、スキャナ200からプレスキャン画像を受信し(ステップS402)、受信したプレスキャン画像から原稿の空白部分を検出、除外し、文字や絵など同類のものをまとめていくつかのブロックに分割する(ステップS403)。ここで、ブロックに分割されたプレスキャン画像の一例を図3に示す。
【0023】
図3において、プレスキャン画像301では、文字のかたまり(文字列)が4つあることからブロック302,303,304,305に分割される。
【0024】
また、ステップS403では、ブロック302〜305のプレスキャン画像301上での位置や幅、高さ等のブロック位置情報を測定し、ブロック位置情報テーブルとしてRAM102に記憶する。ここで、記憶されたブロック位置情報テーブルの一例を図4に示す。
【0025】
図4において、ブロック位置情報テーブル201には、ブロックNo.1〜4に対応してブロック302〜305の各ブロックのX軸及びY軸方向の各位置、幅、及び高さが格納されている。ブロックナンバー(No.)は、スキャンされる順に各ブロックに対して付されている。なお、X軸及びY軸の位置については各ブロックの頂点のうちの1つとするが、これに限定されるものではない。
【0026】
図2に戻り、ステップS404では、ブロック302〜305の各ブロックに対して後述する最適解像度決定処理を行い、各ブロックのドット高及び最適解像度を算出し、ブロック別解像度テーブルとしてRAM102に格納する。ここで、ブロック別解像度テーブルの一例を図6に示す。
【0027】
図6において、ブロック別解像度テーブル901には、ブロックNo.1〜4に対応してブロック302〜305の各ブロックのドット高[ドット]及び最適解像度[dpi]が格納されている。このドット高は、各ブロックにおける文字1行分の高さである。このドット高に基づいて当該ブロックをどれくらいの解像度で読み取るのが文字認識率を向上させるのに最適かを決定し、決定した解像度が最適解像度である。ブロック別解像度テーブル901における最適解像度は、それぞれのブロックを32[ドット]以上で読み取られるように算出されたものであるが、これに限定されるものではない。
【0028】
図2に戻って、ステップS405では、ステップS403でRAM102に格納されたブロック位置情報テーブル201から1ブロック分(例えば、ブロックNo.1)のブロック位置情報を読み出すと共に、RAM102に格納されたブロック別解像度テーブル901から当該ブロックに対応する最適解像度を読み出す。つづいて、ステップS406において、ステップS405で読み出した1ブロック分のブロック位置情報と最適解像度をスキャナ200に送信する。
【0029】
ステップS407において、スキャナ200は、情報処理装置100から受信した1ブロック分のブロック位置情報に基づいてスキャン位置を特定し、当該ブロックに対応する最適解像度で原稿上の当該ブロックの本スキャンを行う。つづいて、本スキャンした結果を情報処理装置100に送信する(ステップS408)。
【0030】
情報処理装置100は、スキャナ200から本スキャン結果を受信すると、全てのブロックに対して本スキャンが終了したか否かを判断し(ステップS409)、全てのブロックに対して本スキャンが終了しておらず、残っているブロックがあるときは、ステップS405に戻って、次のブロック(例えば、ブロックNo.2)に移行する。一方、全てのブロックに対して本スキャンが終了しているときは、ステップS410に進む。
【0031】
ステップS410では、受信した各ブロックの本スキャン結果に対して文字認識処理を行って、本処理を終了する。
【0032】
上記処理により、原稿上に文字サイズが互いに異なる文字列が複数存在していても、これらを各々最適な読取解像度でスキャンすることができ、文字認識率を向上させると共に、再読み取りする時間を短縮することができる。
【0033】
図5は、図2のステップS404における最適解像度決定処理の詳細を示すフローチャートである。
【0034】
図5において、ステップS601では、ブロック302〜305のうちの1ブロックに対して当該ブロックが文字列か否かを判断する。一般に文字パタ−ンのような二次元情報は空間周波数の高い成分を多く含み、写真などの絵柄は空間周波数の低い成分を多く含む。従って、エッジ検出などの公知技術を用いることによって、入力画像中に含まれる文字領域と絵柄領域とを識別しうる。また網点処理された写真などは網点検出によって検出しうるので、それを文字領域と区別することもできる。これらの結果、当該ブロックが文字列でない場合は、当該ブロックに対して文字認識を行わず、ステップS605に進む。一方、当該ブロックが文字列である場合はステップS602へ進む。
【0035】
次に、ステップS602において、当該文字列ブロックにおける空白部分を検出し、行間を認識する。例えば、プレスキャン画像301では、横方向に空白が続く部分が検出され、行間307として認識される。つづいて、ステップS603において、ステップS602で認識された行間から文字1行分の高さ306を認識し、ドット高として当該文字列ブロックのブロック別解像度テーブル901に格納する。
【0036】
次に、ステップS604において、ステップS603で認識されたドット高に基づいて、文字列ブロックの文字部分が例えば32[ドット]以上で読み取られるように最適解像度を算出し、ステップS605において、算出した最適解像度を当該文字列ブロックのブロック別解像度テーブル901に格納する。
【0037】
次に、ステップS605において、全てのブロックに対して最適解像度を算出したか否かを判断し、算出していないブロックがあるときは、ステップS601に戻って、次のブロックに移行する。一方、全てのブロックに対して最適解像度を算出したときは、リターンする。
【0038】
上記第1の実施の形態によれば、スキャナ200から受信したプレスキャン画像を文字や絵など同類のブロックに分割し、分割した各ブロックのブロック位置情報及び最適解像度を逐次算出してスキャナ200に送信し、当該ブロック位置情報及び最適解像度に基づいて当該ブロックの本スキャンを順次行わせるので、読み取りたい紙面の位置毎に最適な読取解像度の設定での再読み取り処理が行われるため、原稿の再読み取り時間を短縮することができる。
【0039】
また、低解像度でプレスキャンを実行し、予め文字認識が困難と予想される範囲を認識し、自動的に最適解像度を設定して画像読み取り処理を実行することにより、ユーザが解像度を意識せずに画像読み取りを行うことができる。
【0040】
[第2の実施の形態]
本発明の第2の実施の形態に係る画像読取システムは、その構成(図1)が上記第1の実施の形態と同じであり、同一の構成要素には同一の符号を付してそれらの説明を省略する。以下に、上記第1の実施の形態と異なる点のみを説明する。
【0041】
図7は、本発明の第2の実施の形態における文字認識処理を示すフローチャートである。本処理は、ROM103又は外部メモリ104に格納されたプログラムに基づいてCPU101により実行されるものである。なお、ステップS701〜S704の処理は、図2のステップS401〜S404と同じである。
【0042】
図7において、ステップS705では、RAM102に格納されたブロック位置情報テーブル201から全ブロックのブロック位置情報を読み出すと共に、RAM102に格納されたブロック別解像度テーブル901から全ブロックの最適解像度を読み出す。つづいて、ステップS706において、ステップS705で読み出した全ブロックのブロック位置情報と最適解像度を一括してスキャナ200に送信する。
【0043】
ステップS707において、スキャナ200は、情報処理装置100から受信した全ブロックのブロック位置情報に基づいてスキャン位置を特定し、各ブロックに対応する最適解像度で原稿上のそれぞれのブロックの本スキャンを行う。つづいて、本スキャンした結果を情報処理装置100に送信する(ステップS708)。
【0044】
情報処理装置100は、スキャナ200から本スキャン結果を受信すると(ステップS709)、受信した全てのブロックの本スキャン結果に対して文字認識処理を行って(ステップS710)、本処理を終了する。
【0045】
本第2の実施の形態によれば、スキャナ200から受信したプレスキャン画像を文字列や絵、図などのブロックに分割し、分割した全ブロックの位置情報及び最適解像度を算出してスキャナ200に一括して送信し、当該位置情報及び最適解像度に基づいて全ブロックの本スキャンを行わせるので、本スキャンにかかる時間をより短くすることができる。
【0046】
[第3実施の形態]
本発明の第3の実施の形態に係る画像読取システムは、その構成(図1)が上記第1の実施の形態と同じであり、同一の構成要素には同一の符号を付してそれらの説明を省略する。以下に、上記第1の実施の形態と異なる点のみを説明する。
【0047】
図8は、本発明の第3の実施の形態における最適解像度決定処理の詳細を示すフローチャートである。本処理は、ROM103又は外部メモリ104に格納されたプログラムに基づいてCPU101により実行されるものである。
【0048】
図8において、ステップS501では、ブロック302〜305のうちの1ブロックに対して当該ブロックが文字列か否かを判断する。この結果、当該ブロックが文字列でない場合は、当該ブロックに対して文字認識を行わず、リターンする。一方、当該ブロックが文字列である場合はステップS502へ進む。
【0049】
次に、ステップS502において、ROM103又は外部メモリ104に予め格納されている変化点数解像度対応テーブルを読み出す。変化点数解像度対応テーブルには、図11(a)に示す解像度変換Indexテーブル1101及び解像度変換No.テーブル1102が含まれる。
【0050】
次に、ステップS503において、ブロック302〜305のうちの1ブロックから所定数の走査線を読み取り、白画素から黒画素及び黒画素から白画素への変化点を計数する。次に、ステップS504において、当該ブロックにおける文字1行分の高さが走査線何本分かを解析し、その走査線数と変化点数解像度対応テーブルに基づいて最適解像度を算出する。すなわち走査線数と図11(a)の解像度変換Indexテーブル1101から解像度変換テーブルNo.を決定し、図11(b)の解像度変換No.テーブル1102と計数された変化点数より最適解像度を算出し、図12に示すブロック別解像度テーブル1201に格納する。
【0051】
上記第3の実施の形態によれば、白画素から黒画素及び黒画素から白画素に変化する変化点の数を計数することにより最適解像度を算出するので、上記第1の実施の形態の効果に加え、原稿上の文字がかすれていたり、薄い色であっても最適解像度を算出することができ、文字認識処理を適切に行うことができる。
【0052】
なお、本第3の実施の形態を上記第2の実施の形態に適用することで、本発明が実現することも可能である。
【0053】
[第4の実施の形態]
本発明の第4の実施の形態に係る画像読取システムは、その構成(図1)が上記第1の実施の形態と同じであり、同一の構成要素には同一の符号を付してそれらの説明を省略する。以下に、上記第1の実施の形態と異なる点のみを説明する。
【0054】
上記第1〜第3の実施の形態では、読取解像度を意識することなくスキャンする方法について説明したが、本第4の実施の形態では、ブロック毎に文字認識結果を確認してスキャンする方法について説明する。
【0055】
図9は、本発明の第4の実施の形態における文字認識処理を示すフローチャートである。本処理は、ROM103又は外部メモリ104に格納されたプログラムに基づいてCPU101により実行されるものである。
【0056】
図9において、まず、情報処理装置100は、ROM103又は外部メモリ104に予め格納されている変化点数解像度対応テーブルを読み出す(ステップS801)。変化点数解像度対応テーブルには、図11(a)に示す解像度変換Indexテーブル1101及び解像度変換No.テーブル1102が含まれる。
【0057】
次に、スキャナ200が原稿に対して75dpiの低解像度でプレスキャンを行い、その結果をプレスキャン画像として情報処理装置100に送信する(ステップS802)。
【0058】
次に、情報処理装置100は、スキャナ200からプレスキャン画像を受信し(ステップS803)、受信したプレスキャン画像から原稿の空白部分を検出し、文字や絵など同類のものをまとめていくつかのブロックに分割する(ステップS804)。
【0059】
次に、分割した各ブロックに対し、ステップS801で読み出した変化点数解像度対応テーブルを利用して後述するブロックスキャン処理を行い(ステップS805)、スキャン未処理ブロックがあるか否かを判別し(ステップS817)、スキャン未処理ブロックがないときは本処理を終了する。
【0060】
図10は、図9のステップS805のブロックスキャン処理の詳細を示すフローチャートである。
【0061】
図10において、まず、ブロック302〜305のうちの1ブロックから所定数の走査線を読み取り、白画素から黒画素及び黒画素から白画素への変化点を計数する(ステップS806)。次に、当該ブロックにおける文字1行分の高さが走査線何本分かを解析し、その走査線数と図11(a)の解像度変換Indexテーブル1101から解像度変換テーブルNo.を決定し、図11(b)の解像度変換No.テーブル1102とステップS806で計数された変化点数より最適解像度を算出する(ステップS807)。
【0062】
次に、計数された変化点数及び算出された最適解像度を図12のブロック別解像度テーブル1201に格納する(ステップS808)。つづいて、RAM102に格納されたブロック位置情報テーブル201から1ブロック分のブロック位置情報を読み出すと共に、RAM102に格納されたブロック別解像度テーブル1201から当該ブロックに対応する最適解像度を読み出してスキャナ200に送信する(ステップS809)。
【0063】
スキャナ200は、情報処理装置100から受信した1ブロックを、受信した最適解像度で本スキャンし(ステップS810)、その本スキャン結果と本スキャンした現在位置の情報を情報処理装置100に送信する(ステップS811)。
【0064】
情報処理装置100は、スキャナ200から受信した本スキャン結果に対して文字認識処理を行う(ステップS812)。次に、文字認識処理の結果を表示装置107に表示し(ステップS813)、表示した文字認識処理の結果に対する可否をユーザに入力させ(ステップS814)、ユーザによりOKと判定されたか否かを判別する(ステップS815)。この結果、NGと判定されたときは、ユーザにより手動で解像度が変更され(ステップS816)、再度ステップS808以降の処理を行う一方、OKと判定されたときは、リターンする。
【0065】
上記第4の実施の形態によれば、スキャナ200から受信したプレスキャン画像を文字や絵など同類のブロックに分割し、分割した各ブロックのブロック位置情報及び最適解像度を算出してスキャナ200に送信し、当該ブロック位置情報及び最適解像度に基づいて当該ブロックの本スキャンを行わせ、スキャナ200から受信した本スキャン結果に対して文字認識処理して文字認識結果を表示し、当該文字認識結果の可否をユーザに判定させるので、ユーザの要求に応じた文字認識結果を提供することができる。
【0066】
上記第1〜第4の実施の形態において、画像読取システム1では、情報処理装置100とスキャナ200とが別体で構成されているが、一体で構成されていてもよい。また、スキャナ200は、画像読み取り機能を有するものであれば複写機やファクシミリ、複合機であってもよい。
【0067】
本発明の目的は、上記実施の形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)が記憶媒体に格納されたプログラムコードを読み出して実行することによっても達成される。
【0068】
この場合、記憶媒体から読み出されたプログラムコード自体が上述した実施の形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。
【0069】
また、プログラムコードを供給するための記憶媒体としては、例えば、フロッピー(登録商標)ディスク、ハードディスク、光磁気ディスク、CD−ROM、CD−R、CD−RW、DVD−ROM、DVD−RAM、DVD−RW、DVD+RW、磁気テープ、不揮発性のメモリカード、ROM等を用いることができる。または、プログラムコードをネットワークを介してダウンロードしてもよい。
【0070】
また、コンピュータが読み出したプログラムコードを実行することにより、上記実施の形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼動しているOS(オペレーティングシステム)等が実際の処理の一部または全部を行い、その処理によって上述した実施の形態の機能が実現される場合も含まれる。
【0071】
更に、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPU等が実際の処理の一部または全部を行い、その処理によって上述した実施の形態の機能が実現される場合も含まれる。
【0072】
また、コンピュータが読み出したプログラムコードを実行することにより、前述した各実施の形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているOSなどが実際の処理の一部または全部を行い、その処理によって前述した各実施の形態の機能が実現される場合も、本発明に含まれることは云うまでもない。
【0073】
この場合、上記プログラムは、該プログラムを記憶した記憶媒体から直接、又はインターネット、商用ネットワーク、若しくはローカルエリアネットワーク等に接続された不図示の他のコンピュータやデータベース等からダウンロードすることにより供給される。
【図面の簡単な説明】
【0074】
【図1】本発明の実施の形態に係る画像読取システム全体のシステム構成と内部のハードウェア構成を示すブロック図である。
【図2】図1の画像読取システム1にて実行される文字認識処理を示すフローチャートである。
【図3】図2のステップS401でスキャナ200によりプレスキャンされた画像の一例を示す図である。
【図4】ブロック位置情報テーブルの一例を示す図である。
【図5】図2のステップS404における最適解像度決定処理の詳細を示すフローチャートである。
【図6】ブロック別解像度テーブルの一例を示す図である。
【図7】本発明の第2の実施の形態における文字認識処理を示すフローチャートである。
【図8】本発明の第3の実施の形態における最適解像度決定処理の詳細を示すフローチャートである。
【図9】本発明の第4の実施の形態における文字認識処理を示すフローチャートである。
【図10】図9のステップS805のブロックスキャン処理の詳細を示すフローチャートである。
【図11】(a)は解像度変換Indexテーブルの一例を示す図であり、(b)は解像度変換No.テーブルの一例を示す図である。
【図12】ブロック別解像度テーブルの他の例を示す図である。
【符号の説明】
【0075】
1 画像読取システム
100 情報処理装置
101 CPU
102 RAM
103 ROM
104 外部メモリ
107 表示装置
200 スキャナ
301 プレスキャン画像
302,303,304,305 ブロック
【技術分野】
【0001】
本発明は、原稿の画像を最適な読取解像度で読み取ることが可能な画像読取装置及び方法、画像読取システム、プログラム、並びに記憶媒体に関するものである。
【背景技術】
【0002】
近年、原稿の画像を読み取ると共に、OCR(Optical Character Reader)処理と連動して高精度の文字認識を行う画像読取装置が提案されている(例えば、特許文献1参照)。この画像読取装置では、低解像度で原稿の読み取り動作が実行された後にOCR処理で文字認識が行われ、文字認識率が所定値未満である場合、当該所定値に達するまで段階的に解像度を上げて読み取り動作が行われている。
【特許文献1】特開2000−293633号公報
【発明の開示】
【発明が解決しようとする課題】
【0003】
しかしながら、上記特許文献1に記載された画像読取装置では、文字認識率が所定値未満である場合、たとえ原稿上に文字認識率の高い部分があっても、読取解像度を上げて再度原稿全体に対して読み取り動作が実行されることになり、無駄に時間を消費するという問題がある。
【0004】
また、再読み取り時間を短縮するために、最初に低解像度で読み取り動作が実行された時点で、ユーザ自身が原稿に応じた最適な読取解像度を意識しなければならないという問題もある。
【0005】
本発明は、上記問題を解決すべく成されたものであり、原稿を再読み取りする時間を短縮することができ、ユーザに読取解像度の変更を意識させることなく、画像読み取り及び文字認識処理を行うことができる画像読取装置及び方法、画像読取システム、プログラム、並びに記憶媒体を提供することを目的とする。
【課題を解決するための手段】
【0006】
上記目的を達成するために、請求項1記載の画像読取システムは、原稿の画像を読み取る画像読取装置と、当該画像読取装置に接続された情報処理装置とで構成される画像読取システムにおいて、前記画像読取装置は、前記原稿を第1の読取解像度で読み取る第1の画像読取手段と、前記第1の画像読取手段により得られた第1の画像データを前記情報処理装置に送信する送信手段と、前記情報処理装置からの指示情報に基づいて前記原稿上の複数の範囲を互いに異なる第2の読取解像度で読み取る第2の画像読取手段とを備え、前記情報処理装置は、前記画像読取装置から受信した前記第1の画像データを複数の第2の画像データに分割する分割手段と、前記複数の第2の画像データからそれぞれ第2の読取解像度を算出する算出手段と、前記算出された第2の読取解像度を記憶する読取解像度記憶手段と、前記原稿を前記第2の画像データ毎に前記第2の読取解像度で読み取るように指示する指示情報を前記画像読取装置に送る画像読取指示手段とを備えることを特徴とする。
【0007】
上記目的を達成するために、請求項11記載の画像読取装置は、原稿の画像を読み取る画像読取装置において、前記原稿を第1の読取解像度で読み取る第1の画像読取手段と、前記第1の画像読取手段により得られた第1の画像データを複数の第2の画像データに分割する分割手段と、前記複数の第2の画像データからそれぞれ第2の読取解像度を算出する算出手段と、前記原稿を前記第2の画像データ毎に前記第2の読取解像度で読み取る第2の画像読取手段とを備えることを特徴とする。
【0008】
上記目的を達成するために、請求項12記載の画像読取方法は、原稿の画像を読み取る画像読取装置の画像読取方法において、前記原稿を第1の読取解像度で読み取る第1の画像読取工程と、前記第1の画像読取手段により得られた第1の画像データを複数の第2の画像データに分割する分割工程と、前記複数の第2の画像データからそれぞれ第2の読取解像度を算出する算出工程と、前記原稿を前記第2の画像データ毎に前記第2の読取解像度で読み取る第2の画像読取工程とを備えることを特徴とする。
【0009】
上記目的を達成するために、請求項13記載の画像読取方法は、原稿の画像を読み取る画像読取装置と、当該画像読取装置に接続された情報処理装置とで構成される画像読取システムの画像読取方法において、前記原稿を第1の読取解像度で読み取る第1の画像読取工程と、前記第1の画像読取手段により得られた第1の画像データを前記情報処理装置に送信する送信工程と、前記情報処理装置からの指示情報に基づいて前記原稿上の複数の範囲を互いに異なる第2の読取解像度で読み取る第2の画像読取工程と、前記画像読取装置から受信した前記第1の画像データを複数の第2の画像データに分割する分割工程と、前記複数の第2の画像データからそれぞれ第2の読取解像度を算出する算出工程と、前記算出された第2の読取解像度を記憶する読取解像度記憶工程と、前記原稿を前記第2の画像データ毎に前記第2の読取解像度で読み取るように指示する指示情報を前記画像読取装置に送る画像読取指示工程とを備えることを特徴とする。
【発明の効果】
【0010】
本発明によれば、原稿を第1の読取解像度で読み取って得られた第1の画像データを複数の第2の画像データに分割し、当該複数の第2の画像データからそれぞれ第2の読取解像度を算出し、原稿を第2の画像データ毎に第2の読取解像度で読み取るので、画像データの部分ごとに読取解像度を変更して読み取りを行うことにより、原稿の再読み取り時間を短縮することができ、ユーザに読取解像度の変更を意識させることなく、画像読み取り及び文字認識処理を行うことができる。
【発明を実施するための最良の形態】
【0011】
以下、本発明の実施の形態を図面を参照して詳細に説明する。
【0012】
[第1の実施の形態]
図1は、本発明の実施の形態に係る画像読取システム全体のシステム構成と内部のハードウェア構成を示すブロック図である。
【0013】
図1において、本画像読取システム1は、パーソナルコンピュータ等から成る情報処理装置100と、当該情報処理装置100に通信ネットワーク300を介して接続されたスキャナ200とで構成される。
【0014】
情報処理装置100は、CPU101と、RAM102と、ROM103と、外部メモリ104と、入力装置106と、表示装置107と、印刷装置108と、通信インターフェース109とを備える。スキャナ200は、不図示の原稿台上に載置された原稿の画像を読み取ることが可能な画像読取装置である。
【0015】
ROM103又は外部メモリ104は、CPU101の制御プログラムであるBIOS(Basic Input/Output System)やオペレーティングシステム(以下、「OS」という。)等を記憶するものである。RAM102は、CPU101の主メモリ、ワークエリア等として機能するものである。
【0016】
CPU101は、システムバス110に接続された各種デバイスとのアクセスを総括的に制御すると共に、後述する処理の実行に際して必要なプログラム等をRAM102にロードし、当該プログラム等を実行することで各種動作を実現するものである。
【0017】
入力装置106は、キーボードやポインティングデバイス等で構成されるものである。表示装置107は、LCD(Liquid Crystal Display)等で構成されるものである。印刷装置108は、レーザプリンタ等で構成されるものである。通信インターフェース109は、所定のプロトコルにより通信ネットワーク300に接続すると共に、スキャナ200との通信を制御するものである。
【0018】
外部メモリ104は、ハードディスク等の記憶装置で構成され、後述する文字認識処理で使用されるデータベース(DB)105を備える。DB105は、図11(a)に示す解像度変換Indexテーブル1101及び図11(b)に示す解像度変換No.テーブル1102を備える。解像度変換Indexテーブル1101は、文字の高さから解像度変換テーブルNo.を決定するためのテーブル情報である。解像度変換No.テーブル1102は、黒白変化点数から必要最小限の解像度を決定するためのテーブル情報である。
【0019】
次に、図1の画像読取システム1における文字認識処理について図2〜図6を参照して説明する。
【0020】
図2は、図1の画像読取システム1にて実行される文字認識処理を示すフローチャートである。本処理は、ROM103又は外部メモリ104に格納されたプログラムに基づいてCPU101により実行されるものである。
【0021】
図2において、まず、ステップS401では、スキャナ200が原稿に対して75dpiの低解像度でプレスキャンを行い、その結果をプレスキャン画像として情報処理装置100に送信する。
【0022】
次に、情報処理装置100は、スキャナ200からプレスキャン画像を受信し(ステップS402)、受信したプレスキャン画像から原稿の空白部分を検出、除外し、文字や絵など同類のものをまとめていくつかのブロックに分割する(ステップS403)。ここで、ブロックに分割されたプレスキャン画像の一例を図3に示す。
【0023】
図3において、プレスキャン画像301では、文字のかたまり(文字列)が4つあることからブロック302,303,304,305に分割される。
【0024】
また、ステップS403では、ブロック302〜305のプレスキャン画像301上での位置や幅、高さ等のブロック位置情報を測定し、ブロック位置情報テーブルとしてRAM102に記憶する。ここで、記憶されたブロック位置情報テーブルの一例を図4に示す。
【0025】
図4において、ブロック位置情報テーブル201には、ブロックNo.1〜4に対応してブロック302〜305の各ブロックのX軸及びY軸方向の各位置、幅、及び高さが格納されている。ブロックナンバー(No.)は、スキャンされる順に各ブロックに対して付されている。なお、X軸及びY軸の位置については各ブロックの頂点のうちの1つとするが、これに限定されるものではない。
【0026】
図2に戻り、ステップS404では、ブロック302〜305の各ブロックに対して後述する最適解像度決定処理を行い、各ブロックのドット高及び最適解像度を算出し、ブロック別解像度テーブルとしてRAM102に格納する。ここで、ブロック別解像度テーブルの一例を図6に示す。
【0027】
図6において、ブロック別解像度テーブル901には、ブロックNo.1〜4に対応してブロック302〜305の各ブロックのドット高[ドット]及び最適解像度[dpi]が格納されている。このドット高は、各ブロックにおける文字1行分の高さである。このドット高に基づいて当該ブロックをどれくらいの解像度で読み取るのが文字認識率を向上させるのに最適かを決定し、決定した解像度が最適解像度である。ブロック別解像度テーブル901における最適解像度は、それぞれのブロックを32[ドット]以上で読み取られるように算出されたものであるが、これに限定されるものではない。
【0028】
図2に戻って、ステップS405では、ステップS403でRAM102に格納されたブロック位置情報テーブル201から1ブロック分(例えば、ブロックNo.1)のブロック位置情報を読み出すと共に、RAM102に格納されたブロック別解像度テーブル901から当該ブロックに対応する最適解像度を読み出す。つづいて、ステップS406において、ステップS405で読み出した1ブロック分のブロック位置情報と最適解像度をスキャナ200に送信する。
【0029】
ステップS407において、スキャナ200は、情報処理装置100から受信した1ブロック分のブロック位置情報に基づいてスキャン位置を特定し、当該ブロックに対応する最適解像度で原稿上の当該ブロックの本スキャンを行う。つづいて、本スキャンした結果を情報処理装置100に送信する(ステップS408)。
【0030】
情報処理装置100は、スキャナ200から本スキャン結果を受信すると、全てのブロックに対して本スキャンが終了したか否かを判断し(ステップS409)、全てのブロックに対して本スキャンが終了しておらず、残っているブロックがあるときは、ステップS405に戻って、次のブロック(例えば、ブロックNo.2)に移行する。一方、全てのブロックに対して本スキャンが終了しているときは、ステップS410に進む。
【0031】
ステップS410では、受信した各ブロックの本スキャン結果に対して文字認識処理を行って、本処理を終了する。
【0032】
上記処理により、原稿上に文字サイズが互いに異なる文字列が複数存在していても、これらを各々最適な読取解像度でスキャンすることができ、文字認識率を向上させると共に、再読み取りする時間を短縮することができる。
【0033】
図5は、図2のステップS404における最適解像度決定処理の詳細を示すフローチャートである。
【0034】
図5において、ステップS601では、ブロック302〜305のうちの1ブロックに対して当該ブロックが文字列か否かを判断する。一般に文字パタ−ンのような二次元情報は空間周波数の高い成分を多く含み、写真などの絵柄は空間周波数の低い成分を多く含む。従って、エッジ検出などの公知技術を用いることによって、入力画像中に含まれる文字領域と絵柄領域とを識別しうる。また網点処理された写真などは網点検出によって検出しうるので、それを文字領域と区別することもできる。これらの結果、当該ブロックが文字列でない場合は、当該ブロックに対して文字認識を行わず、ステップS605に進む。一方、当該ブロックが文字列である場合はステップS602へ進む。
【0035】
次に、ステップS602において、当該文字列ブロックにおける空白部分を検出し、行間を認識する。例えば、プレスキャン画像301では、横方向に空白が続く部分が検出され、行間307として認識される。つづいて、ステップS603において、ステップS602で認識された行間から文字1行分の高さ306を認識し、ドット高として当該文字列ブロックのブロック別解像度テーブル901に格納する。
【0036】
次に、ステップS604において、ステップS603で認識されたドット高に基づいて、文字列ブロックの文字部分が例えば32[ドット]以上で読み取られるように最適解像度を算出し、ステップS605において、算出した最適解像度を当該文字列ブロックのブロック別解像度テーブル901に格納する。
【0037】
次に、ステップS605において、全てのブロックに対して最適解像度を算出したか否かを判断し、算出していないブロックがあるときは、ステップS601に戻って、次のブロックに移行する。一方、全てのブロックに対して最適解像度を算出したときは、リターンする。
【0038】
上記第1の実施の形態によれば、スキャナ200から受信したプレスキャン画像を文字や絵など同類のブロックに分割し、分割した各ブロックのブロック位置情報及び最適解像度を逐次算出してスキャナ200に送信し、当該ブロック位置情報及び最適解像度に基づいて当該ブロックの本スキャンを順次行わせるので、読み取りたい紙面の位置毎に最適な読取解像度の設定での再読み取り処理が行われるため、原稿の再読み取り時間を短縮することができる。
【0039】
また、低解像度でプレスキャンを実行し、予め文字認識が困難と予想される範囲を認識し、自動的に最適解像度を設定して画像読み取り処理を実行することにより、ユーザが解像度を意識せずに画像読み取りを行うことができる。
【0040】
[第2の実施の形態]
本発明の第2の実施の形態に係る画像読取システムは、その構成(図1)が上記第1の実施の形態と同じであり、同一の構成要素には同一の符号を付してそれらの説明を省略する。以下に、上記第1の実施の形態と異なる点のみを説明する。
【0041】
図7は、本発明の第2の実施の形態における文字認識処理を示すフローチャートである。本処理は、ROM103又は外部メモリ104に格納されたプログラムに基づいてCPU101により実行されるものである。なお、ステップS701〜S704の処理は、図2のステップS401〜S404と同じである。
【0042】
図7において、ステップS705では、RAM102に格納されたブロック位置情報テーブル201から全ブロックのブロック位置情報を読み出すと共に、RAM102に格納されたブロック別解像度テーブル901から全ブロックの最適解像度を読み出す。つづいて、ステップS706において、ステップS705で読み出した全ブロックのブロック位置情報と最適解像度を一括してスキャナ200に送信する。
【0043】
ステップS707において、スキャナ200は、情報処理装置100から受信した全ブロックのブロック位置情報に基づいてスキャン位置を特定し、各ブロックに対応する最適解像度で原稿上のそれぞれのブロックの本スキャンを行う。つづいて、本スキャンした結果を情報処理装置100に送信する(ステップS708)。
【0044】
情報処理装置100は、スキャナ200から本スキャン結果を受信すると(ステップS709)、受信した全てのブロックの本スキャン結果に対して文字認識処理を行って(ステップS710)、本処理を終了する。
【0045】
本第2の実施の形態によれば、スキャナ200から受信したプレスキャン画像を文字列や絵、図などのブロックに分割し、分割した全ブロックの位置情報及び最適解像度を算出してスキャナ200に一括して送信し、当該位置情報及び最適解像度に基づいて全ブロックの本スキャンを行わせるので、本スキャンにかかる時間をより短くすることができる。
【0046】
[第3実施の形態]
本発明の第3の実施の形態に係る画像読取システムは、その構成(図1)が上記第1の実施の形態と同じであり、同一の構成要素には同一の符号を付してそれらの説明を省略する。以下に、上記第1の実施の形態と異なる点のみを説明する。
【0047】
図8は、本発明の第3の実施の形態における最適解像度決定処理の詳細を示すフローチャートである。本処理は、ROM103又は外部メモリ104に格納されたプログラムに基づいてCPU101により実行されるものである。
【0048】
図8において、ステップS501では、ブロック302〜305のうちの1ブロックに対して当該ブロックが文字列か否かを判断する。この結果、当該ブロックが文字列でない場合は、当該ブロックに対して文字認識を行わず、リターンする。一方、当該ブロックが文字列である場合はステップS502へ進む。
【0049】
次に、ステップS502において、ROM103又は外部メモリ104に予め格納されている変化点数解像度対応テーブルを読み出す。変化点数解像度対応テーブルには、図11(a)に示す解像度変換Indexテーブル1101及び解像度変換No.テーブル1102が含まれる。
【0050】
次に、ステップS503において、ブロック302〜305のうちの1ブロックから所定数の走査線を読み取り、白画素から黒画素及び黒画素から白画素への変化点を計数する。次に、ステップS504において、当該ブロックにおける文字1行分の高さが走査線何本分かを解析し、その走査線数と変化点数解像度対応テーブルに基づいて最適解像度を算出する。すなわち走査線数と図11(a)の解像度変換Indexテーブル1101から解像度変換テーブルNo.を決定し、図11(b)の解像度変換No.テーブル1102と計数された変化点数より最適解像度を算出し、図12に示すブロック別解像度テーブル1201に格納する。
【0051】
上記第3の実施の形態によれば、白画素から黒画素及び黒画素から白画素に変化する変化点の数を計数することにより最適解像度を算出するので、上記第1の実施の形態の効果に加え、原稿上の文字がかすれていたり、薄い色であっても最適解像度を算出することができ、文字認識処理を適切に行うことができる。
【0052】
なお、本第3の実施の形態を上記第2の実施の形態に適用することで、本発明が実現することも可能である。
【0053】
[第4の実施の形態]
本発明の第4の実施の形態に係る画像読取システムは、その構成(図1)が上記第1の実施の形態と同じであり、同一の構成要素には同一の符号を付してそれらの説明を省略する。以下に、上記第1の実施の形態と異なる点のみを説明する。
【0054】
上記第1〜第3の実施の形態では、読取解像度を意識することなくスキャンする方法について説明したが、本第4の実施の形態では、ブロック毎に文字認識結果を確認してスキャンする方法について説明する。
【0055】
図9は、本発明の第4の実施の形態における文字認識処理を示すフローチャートである。本処理は、ROM103又は外部メモリ104に格納されたプログラムに基づいてCPU101により実行されるものである。
【0056】
図9において、まず、情報処理装置100は、ROM103又は外部メモリ104に予め格納されている変化点数解像度対応テーブルを読み出す(ステップS801)。変化点数解像度対応テーブルには、図11(a)に示す解像度変換Indexテーブル1101及び解像度変換No.テーブル1102が含まれる。
【0057】
次に、スキャナ200が原稿に対して75dpiの低解像度でプレスキャンを行い、その結果をプレスキャン画像として情報処理装置100に送信する(ステップS802)。
【0058】
次に、情報処理装置100は、スキャナ200からプレスキャン画像を受信し(ステップS803)、受信したプレスキャン画像から原稿の空白部分を検出し、文字や絵など同類のものをまとめていくつかのブロックに分割する(ステップS804)。
【0059】
次に、分割した各ブロックに対し、ステップS801で読み出した変化点数解像度対応テーブルを利用して後述するブロックスキャン処理を行い(ステップS805)、スキャン未処理ブロックがあるか否かを判別し(ステップS817)、スキャン未処理ブロックがないときは本処理を終了する。
【0060】
図10は、図9のステップS805のブロックスキャン処理の詳細を示すフローチャートである。
【0061】
図10において、まず、ブロック302〜305のうちの1ブロックから所定数の走査線を読み取り、白画素から黒画素及び黒画素から白画素への変化点を計数する(ステップS806)。次に、当該ブロックにおける文字1行分の高さが走査線何本分かを解析し、その走査線数と図11(a)の解像度変換Indexテーブル1101から解像度変換テーブルNo.を決定し、図11(b)の解像度変換No.テーブル1102とステップS806で計数された変化点数より最適解像度を算出する(ステップS807)。
【0062】
次に、計数された変化点数及び算出された最適解像度を図12のブロック別解像度テーブル1201に格納する(ステップS808)。つづいて、RAM102に格納されたブロック位置情報テーブル201から1ブロック分のブロック位置情報を読み出すと共に、RAM102に格納されたブロック別解像度テーブル1201から当該ブロックに対応する最適解像度を読み出してスキャナ200に送信する(ステップS809)。
【0063】
スキャナ200は、情報処理装置100から受信した1ブロックを、受信した最適解像度で本スキャンし(ステップS810)、その本スキャン結果と本スキャンした現在位置の情報を情報処理装置100に送信する(ステップS811)。
【0064】
情報処理装置100は、スキャナ200から受信した本スキャン結果に対して文字認識処理を行う(ステップS812)。次に、文字認識処理の結果を表示装置107に表示し(ステップS813)、表示した文字認識処理の結果に対する可否をユーザに入力させ(ステップS814)、ユーザによりOKと判定されたか否かを判別する(ステップS815)。この結果、NGと判定されたときは、ユーザにより手動で解像度が変更され(ステップS816)、再度ステップS808以降の処理を行う一方、OKと判定されたときは、リターンする。
【0065】
上記第4の実施の形態によれば、スキャナ200から受信したプレスキャン画像を文字や絵など同類のブロックに分割し、分割した各ブロックのブロック位置情報及び最適解像度を算出してスキャナ200に送信し、当該ブロック位置情報及び最適解像度に基づいて当該ブロックの本スキャンを行わせ、スキャナ200から受信した本スキャン結果に対して文字認識処理して文字認識結果を表示し、当該文字認識結果の可否をユーザに判定させるので、ユーザの要求に応じた文字認識結果を提供することができる。
【0066】
上記第1〜第4の実施の形態において、画像読取システム1では、情報処理装置100とスキャナ200とが別体で構成されているが、一体で構成されていてもよい。また、スキャナ200は、画像読み取り機能を有するものであれば複写機やファクシミリ、複合機であってもよい。
【0067】
本発明の目的は、上記実施の形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)が記憶媒体に格納されたプログラムコードを読み出して実行することによっても達成される。
【0068】
この場合、記憶媒体から読み出されたプログラムコード自体が上述した実施の形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。
【0069】
また、プログラムコードを供給するための記憶媒体としては、例えば、フロッピー(登録商標)ディスク、ハードディスク、光磁気ディスク、CD−ROM、CD−R、CD−RW、DVD−ROM、DVD−RAM、DVD−RW、DVD+RW、磁気テープ、不揮発性のメモリカード、ROM等を用いることができる。または、プログラムコードをネットワークを介してダウンロードしてもよい。
【0070】
また、コンピュータが読み出したプログラムコードを実行することにより、上記実施の形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼動しているOS(オペレーティングシステム)等が実際の処理の一部または全部を行い、その処理によって上述した実施の形態の機能が実現される場合も含まれる。
【0071】
更に、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPU等が実際の処理の一部または全部を行い、その処理によって上述した実施の形態の機能が実現される場合も含まれる。
【0072】
また、コンピュータが読み出したプログラムコードを実行することにより、前述した各実施の形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているOSなどが実際の処理の一部または全部を行い、その処理によって前述した各実施の形態の機能が実現される場合も、本発明に含まれることは云うまでもない。
【0073】
この場合、上記プログラムは、該プログラムを記憶した記憶媒体から直接、又はインターネット、商用ネットワーク、若しくはローカルエリアネットワーク等に接続された不図示の他のコンピュータやデータベース等からダウンロードすることにより供給される。
【図面の簡単な説明】
【0074】
【図1】本発明の実施の形態に係る画像読取システム全体のシステム構成と内部のハードウェア構成を示すブロック図である。
【図2】図1の画像読取システム1にて実行される文字認識処理を示すフローチャートである。
【図3】図2のステップS401でスキャナ200によりプレスキャンされた画像の一例を示す図である。
【図4】ブロック位置情報テーブルの一例を示す図である。
【図5】図2のステップS404における最適解像度決定処理の詳細を示すフローチャートである。
【図6】ブロック別解像度テーブルの一例を示す図である。
【図7】本発明の第2の実施の形態における文字認識処理を示すフローチャートである。
【図8】本発明の第3の実施の形態における最適解像度決定処理の詳細を示すフローチャートである。
【図9】本発明の第4の実施の形態における文字認識処理を示すフローチャートである。
【図10】図9のステップS805のブロックスキャン処理の詳細を示すフローチャートである。
【図11】(a)は解像度変換Indexテーブルの一例を示す図であり、(b)は解像度変換No.テーブルの一例を示す図である。
【図12】ブロック別解像度テーブルの他の例を示す図である。
【符号の説明】
【0075】
1 画像読取システム
100 情報処理装置
101 CPU
102 RAM
103 ROM
104 外部メモリ
107 表示装置
200 スキャナ
301 プレスキャン画像
302,303,304,305 ブロック
【特許請求の範囲】
【請求項1】
原稿の画像を読み取る画像読取装置と、当該画像読取装置に接続された情報処理装置とで構成される画像読取システムにおいて、
前記画像読取装置は、前記原稿を第1の読取解像度で読み取る第1の画像読取手段と、
前記第1の画像読取手段により得られた第1の画像データを前記情報処理装置に送信する送信手段と、
前記情報処理装置からの指示情報に基づいて前記原稿上の複数の範囲を互いに異なる第2の読取解像度で読み取る第2の画像読取手段とを備え、
前記情報処理装置は、前記画像読取装置から受信した前記第1の画像データを複数の第2の画像データに分割する分割手段と、
前記複数の第2の画像データからそれぞれ第2の読取解像度を算出する算出手段と、
前記算出された第2の読取解像度を記憶する読取解像度記憶手段と、
前記原稿を前記第2の画像データ毎に前記第2の読取解像度で読み取るように指示する指示情報を前記画像読取装置に送る画像読取指示手段とを備えることを特徴とする画像読取システム。
【請求項2】
前記分割手段は、前記第1の画像データを少なくとも、文字で構成される第2の画像データと文字以外のもので構成される第2の画像データとに分割することを特徴とする請求項1記載の画像読取システム。
【請求項3】
前記算出手段は、前記文字で構成される第2の画像データの当該文字の大きさに基づいて前記第2の読取解像度を算出することを特徴とする請求項2記載の画像読取システム。
【請求項4】
前記算出手段は、前記文字で構成される第2の画像データの当該文字における白黒変更点の数に基づいて前記第2の読取解像度を算出することを特徴とする請求項2記載の画像読取システム。
【請求項5】
前記第2の読取解像度は、前記第1の読取解像度よりも高解像度であることを特徴とする請求項1乃至4のいずれか1項に記載の画像読取システム。
【請求項6】
前記情報処理装置は、前記複数の第2の画像データに対応する前記原稿上の読み取り位置を位置情報として記憶する位置情報記憶手段を更に備え、前記画像読取指示手段は、前記算出された第2の読取解像度及び前記位置情報を前記指示情報として送ることを特徴とする請求項1乃至5のいずれか1項に記載の画像読取システム。
【請求項7】
前記第2の画像読取手段は、前記複数の第2の画像データに対応する前記原稿上の範囲を前記位置情報に基づいて特定し、当該範囲を互いに異なる第2の読取解像度で読み取ることを特徴とする請求項1乃至6のいずれか1項に記載の画像読取システム。
【請求項8】
前記情報処理装置は、前記第2の画像読取手段により得られた原稿の画像データに対して文字認識を行う文字認識手段と、
前記文字認識された結果を表示する表示手段と、
ユーザからの入力に応じて前記第2の読取解像度を変更する変更手段とを更に備えることを特徴とする請求項1乃至7のいずれか1項に記載の画像読取システム。
【請求項9】
前記画像読取指示手段は、前記指示情報を前記第2の画像データ毎に前記画像読取装置に送ることを特徴とする請求項1乃至8のいずれか1項に記載の画像読取システム。
【請求項10】
前記画像読取指示手段は、前記指示情報を一括して前記画像読取装置に送ることを特徴とする請求項1乃至8のいずれか1項に記載の画像読取システム。
【請求項11】
原稿の画像を読み取る画像読取装置において、
前記原稿を第1の読取解像度で読み取る第1の画像読取手段と、
前記第1の画像読取手段により得られた第1の画像データを複数の第2の画像データに分割する分割手段と、
前記複数の第2の画像データからそれぞれ第2の読取解像度を算出する算出手段と、
前記原稿を前記第2の画像データ毎に前記第2の読取解像度で読み取る第2の画像読取手段とを備えることを特徴とする画像読取装置。
【請求項12】
原稿の画像を読み取る画像読取装置の画像読取方法において、
前記原稿を第1の読取解像度で読み取る第1の画像読取工程と、
前記第1の画像読取手段により得られた第1の画像データを複数の第2の画像データに分割する分割工程と、
前記複数の第2の画像データからそれぞれ第2の読取解像度を算出する算出工程と、
前記原稿を前記第2の画像データ毎に前記第2の読取解像度で読み取る第2の画像読取工程とを備えることを特徴とする画像読取方法。
【請求項13】
原稿の画像を読み取る画像読取装置と、当該画像読取装置に接続された情報処理装置とで構成される画像読取システムの画像読取方法において、
前記原稿を第1の読取解像度で読み取る第1の画像読取工程と、
前記第1の画像読取手段により得られた第1の画像データを前記情報処理装置に送信する送信工程と、
前記情報処理装置からの指示情報に基づいて前記原稿上の複数の範囲を互いに異なる第2の読取解像度で読み取る第2の画像読取工程と、
前記画像読取装置から受信した前記第1の画像データを複数の第2の画像データに分割する分割工程と、
前記複数の第2の画像データからそれぞれ第2の読取解像度を算出する算出工程と、
前記算出された第2の読取解像度を記憶する読取解像度記憶工程と、
前記原稿を前記第2の画像データ毎に前記第2の読取解像度で読み取るように指示する指示情報を前記画像読取装置に送る画像読取指示工程とを備えることを特徴とする画像読取方法。
【請求項14】
請求項12又は13記載の画像読取方法をコンピュータに実行させるためのコンピュータに読み取り可能なプログラム。
【請求項15】
請求項12又は13記載の画像読取方法をコンピュータに実行させるためのコンピュータに読み取り可能なプログラムを記憶して記憶媒体。
【請求項1】
原稿の画像を読み取る画像読取装置と、当該画像読取装置に接続された情報処理装置とで構成される画像読取システムにおいて、
前記画像読取装置は、前記原稿を第1の読取解像度で読み取る第1の画像読取手段と、
前記第1の画像読取手段により得られた第1の画像データを前記情報処理装置に送信する送信手段と、
前記情報処理装置からの指示情報に基づいて前記原稿上の複数の範囲を互いに異なる第2の読取解像度で読み取る第2の画像読取手段とを備え、
前記情報処理装置は、前記画像読取装置から受信した前記第1の画像データを複数の第2の画像データに分割する分割手段と、
前記複数の第2の画像データからそれぞれ第2の読取解像度を算出する算出手段と、
前記算出された第2の読取解像度を記憶する読取解像度記憶手段と、
前記原稿を前記第2の画像データ毎に前記第2の読取解像度で読み取るように指示する指示情報を前記画像読取装置に送る画像読取指示手段とを備えることを特徴とする画像読取システム。
【請求項2】
前記分割手段は、前記第1の画像データを少なくとも、文字で構成される第2の画像データと文字以外のもので構成される第2の画像データとに分割することを特徴とする請求項1記載の画像読取システム。
【請求項3】
前記算出手段は、前記文字で構成される第2の画像データの当該文字の大きさに基づいて前記第2の読取解像度を算出することを特徴とする請求項2記載の画像読取システム。
【請求項4】
前記算出手段は、前記文字で構成される第2の画像データの当該文字における白黒変更点の数に基づいて前記第2の読取解像度を算出することを特徴とする請求項2記載の画像読取システム。
【請求項5】
前記第2の読取解像度は、前記第1の読取解像度よりも高解像度であることを特徴とする請求項1乃至4のいずれか1項に記載の画像読取システム。
【請求項6】
前記情報処理装置は、前記複数の第2の画像データに対応する前記原稿上の読み取り位置を位置情報として記憶する位置情報記憶手段を更に備え、前記画像読取指示手段は、前記算出された第2の読取解像度及び前記位置情報を前記指示情報として送ることを特徴とする請求項1乃至5のいずれか1項に記載の画像読取システム。
【請求項7】
前記第2の画像読取手段は、前記複数の第2の画像データに対応する前記原稿上の範囲を前記位置情報に基づいて特定し、当該範囲を互いに異なる第2の読取解像度で読み取ることを特徴とする請求項1乃至6のいずれか1項に記載の画像読取システム。
【請求項8】
前記情報処理装置は、前記第2の画像読取手段により得られた原稿の画像データに対して文字認識を行う文字認識手段と、
前記文字認識された結果を表示する表示手段と、
ユーザからの入力に応じて前記第2の読取解像度を変更する変更手段とを更に備えることを特徴とする請求項1乃至7のいずれか1項に記載の画像読取システム。
【請求項9】
前記画像読取指示手段は、前記指示情報を前記第2の画像データ毎に前記画像読取装置に送ることを特徴とする請求項1乃至8のいずれか1項に記載の画像読取システム。
【請求項10】
前記画像読取指示手段は、前記指示情報を一括して前記画像読取装置に送ることを特徴とする請求項1乃至8のいずれか1項に記載の画像読取システム。
【請求項11】
原稿の画像を読み取る画像読取装置において、
前記原稿を第1の読取解像度で読み取る第1の画像読取手段と、
前記第1の画像読取手段により得られた第1の画像データを複数の第2の画像データに分割する分割手段と、
前記複数の第2の画像データからそれぞれ第2の読取解像度を算出する算出手段と、
前記原稿を前記第2の画像データ毎に前記第2の読取解像度で読み取る第2の画像読取手段とを備えることを特徴とする画像読取装置。
【請求項12】
原稿の画像を読み取る画像読取装置の画像読取方法において、
前記原稿を第1の読取解像度で読み取る第1の画像読取工程と、
前記第1の画像読取手段により得られた第1の画像データを複数の第2の画像データに分割する分割工程と、
前記複数の第2の画像データからそれぞれ第2の読取解像度を算出する算出工程と、
前記原稿を前記第2の画像データ毎に前記第2の読取解像度で読み取る第2の画像読取工程とを備えることを特徴とする画像読取方法。
【請求項13】
原稿の画像を読み取る画像読取装置と、当該画像読取装置に接続された情報処理装置とで構成される画像読取システムの画像読取方法において、
前記原稿を第1の読取解像度で読み取る第1の画像読取工程と、
前記第1の画像読取手段により得られた第1の画像データを前記情報処理装置に送信する送信工程と、
前記情報処理装置からの指示情報に基づいて前記原稿上の複数の範囲を互いに異なる第2の読取解像度で読み取る第2の画像読取工程と、
前記画像読取装置から受信した前記第1の画像データを複数の第2の画像データに分割する分割工程と、
前記複数の第2の画像データからそれぞれ第2の読取解像度を算出する算出工程と、
前記算出された第2の読取解像度を記憶する読取解像度記憶工程と、
前記原稿を前記第2の画像データ毎に前記第2の読取解像度で読み取るように指示する指示情報を前記画像読取装置に送る画像読取指示工程とを備えることを特徴とする画像読取方法。
【請求項14】
請求項12又は13記載の画像読取方法をコンピュータに実行させるためのコンピュータに読み取り可能なプログラム。
【請求項15】
請求項12又は13記載の画像読取方法をコンピュータに実行させるためのコンピュータに読み取り可能なプログラムを記憶して記憶媒体。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【公開番号】特開2006−186414(P2006−186414A)
【公開日】平成18年7月13日(2006.7.13)
【国際特許分類】
【出願番号】特願2004−374712(P2004−374712)
【出願日】平成16年12月24日(2004.12.24)
【出願人】(301015956)キヤノンソフトウェア株式会社 (364)
【Fターム(参考)】
【公開日】平成18年7月13日(2006.7.13)
【国際特許分類】
【出願日】平成16年12月24日(2004.12.24)
【出願人】(301015956)キヤノンソフトウェア株式会社 (364)
【Fターム(参考)】
[ Back to top ]