説明

画像読取装置、画像処理プログラム、及び、情報処理装置

【課題】画像の地色を白色に近付ける補正が行われる前の画像データ及び当該補正が行われた後の画像データのうちいずれかユーザが画像の内容を把握し易い方の画像データを出力すること。
【解決手段】画像データが表す画像の地色を所定の色に近付ける補正を行う補正処理(S107)と、補正前の画像データが表す画像上の文字を認識する第1の文字認識処理(S104)と、補正後の画像データが表す画像上の文字を認識する第2の文字認識処理(S107)と、第1の文字認識処理による認識結果と第2の文字認識処理による認識結果との優劣を判断する優劣判断処理(S108)と、第1の文字認識処理による認識結果が優れていると判断された場合は補正前の画像データを出力し、第2の文字認識処理による認識結果が優れていると判断された場合は補正後の画像データを出力する出力処理(S110)と、を実行する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像データが表す画像の内容をユーザが把握し易くなるようにする技術に関する。
【背景技術】
【0002】
従来、画像データが表す画像から原稿の地色を示す地色濃度値を求め、画像データの各画素値に補正係数として「255/地色濃度値」を乗じることによって地色を除去する技術が知られている(例えば、特許文献1参照)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特許第4209094号明細書(段落0017)
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、画像から地色を除去すると、却ってユーザが画像の内容を把握し難くなってしまうことが起こり得る。
本明細書では、画像の地色を白色に近付ける補正が行われる前の画像データ及び当該補正が行われた後の画像データのうちいずれかユーザが画像の内容を把握し易い方の画像データを出力できる技術を開示する。
【課題を解決するための手段】
【0005】
本明細書によって開示される画像読取装置は、原稿を読み取って画像データを生成する読取部と、前記読取部によって生成された前記画像データを処理する処理部と、を備え、前記処理部は、前記画像データが表す画像の地色を所定の色に近付ける補正を行う補正処理と、前記補正前の前記画像データが表す画像上の文字を認識する第1の文字認識処理と、前記補正後の前記画像データが表す画像上の文字を認識する第2の文字認識処理と、前記第1の文字認識処理による認識結果と前記第2の文字認識処理による認識結果との優劣を判断する優劣判断処理と、前記優劣判断処理によって前記第1の文字認識処理による認識結果が前記第2の文字認識処理による認識結果よりも優れていると判断された場合は前記補正前の前記画像データを出力し、前記第2の文字認識処理による認識結果が前記第1の文字認識処理による認識結果よりも優れていると判断された場合は前記補正後の前記画像データを出力する出力処理と、を実行する。
【0006】
また、前記優劣判断処理は、前記第1の文字認識処理によって認識できた文字の数である第1の文字数を計数する第1の文字数計数処理と、前記第2の文字認識処理によって認識できた文字の数である第2の文字数を計数する第2の文字数計数処理と、前記第1の文字数と前記第2の文字数とを比較していずれの文字数の方が多いかを判断する文字数比較処理と、を含み、前記文字数比較処理によって前記第1の文字数の方が前記第2の文字数より多いと判断された場合は前記第1の文字認識処理による認識結果を前記第2の文字認識処理による認識結果よりも優れていると判断し、前記第2の文字数の方が前記第1の文字数より多いと判断された場合は前記第2の文字認識処理による認識結果を前記第1の文字認識処理による認識結果よりも優れていると判断してもよい。
【0007】
また、前記処理部は、前記補正前の前記画像データを解析して前記原稿の地色を示す地色濃度値を取得し、前記補正処理において地色を前記所定の色に近付ける際に用いる補正係数であって取得した前記地色濃度値を前記所定の色の濃度値にする前記補正係数を決定する決定処理を実行してもよい。
【0008】
また、前記処理部は、前記第2の文字認識処理による認識結果が前記第1の文字認識処理による認識結果よりも優れていると判断されなかった場合は、前回の前記補正処理で用いた前記補正係数を所定の規則に従って変更しながら、前記第2の文字認識処理による認識結果が前記第1の文字認識処理による認識結果よりも優れていると判断されるか、又は、前記補正処理による補正回数が所定回数に達するまで前記補正処理、前記第2の文字認識処理、及び、前記優劣判断処理を繰り返し、前記補正処理による補正回数が前記所定回数に達した場合は、前記優劣判断処理において、前記第1の文字認識処理による認識結果が前記第2の文字認識処理による認識結果よりも優れていると判断してもよい。
【0009】
また、前記処理部は、前回の前記補正処理で用いた補正係数よりも画像の地色を白色に近付ける効果が小さくなるように前記補正係数を変更してもよい。
【0010】
また、前記処理部は前記補正処理において地色を前記所定の色に近付ける際に用いる補正係数であって予め設定されている互いに異なる複数の補正係数の中から順に補正係数を選択しながら、前記第2の文字認識処理による認識結果が前記第1の文字認識処理による認識結果よりも優れていると判断されるか、又は、前記補正処理による補正回数が所定回数に達するまで前記補正処理、前記第2の文字認識処理、及び、前記優劣判断処理を繰り返し、前記補正処理による補正回数が前記所定回数に達した場合は、前記優劣判断処理において、前記第1の文字認識処理による認識結果が前記第2の文字認識処理による認識結果よりも優れていると判断してもよい。
【0011】
また、前記処理部は、地色を白色に近付ける効果が大きい前記補正係数から白色に近付ける効果が小さい前記補正係数の順に選択してもよい。
【0012】
また、前記処理部は、前記第1の文字数及び前記第2の文字数がいずれも基準文字数以下である場合は、前記優劣判断処理において、前記第1の文字数及び前記第2の文字数の大小によらず、前記第1の文字認識処理による認識結果が前記第2の文字認識処理による認識結果よりも優れていると判断してもよい。
【0013】
また、当該画像読取装置は、ユーザに情報を通知する通知部を備え、前記処理部は、前記出力処理によって前記補正前の前記画像データを出力した場合は、前記通知部を制御して、前記画像データが表す画像の地色を前記所定の色に近付ける補正が行われなかったことをユーザに通知する通知処理を実行してもよい。
【0014】
なお、本明細書によって開示される技術は、画像読取方法、画像処理プログラム、情報処理装置、画像処理プログラムを記録した記録媒体等の種々の態様で実現することができる。
【発明の効果】
【0015】
上記の画像読取装置によると、画像の地色を白色に近付ける補正が行われる前の画像データ及び当該補正が行われた後の画像データのうちいずれかユーザが画像の内容を把握し易い方の画像データを出力できる。
【図面の簡単な説明】
【0016】
【図1】実施形態1に係る読取部の構成を簡略化して示す模式図。
【図2】イメージスキャナの電気的構成を示すブロック図。
【図3】地色補正による濃度値の変化を示すグラフ。
【図4】ユーザが文字を読み難くなってしまう画像例を示す模式図。
【図5】読取・出力処理の流れの流れを示すフローチャート。
【図6】地色補正・第2の文字認識・第2の文字数計数処理の流れを示すフローチャート。
【図7】優劣判断処理の流れを示すフローチャート。
【図8】実施形態2に係る読取・出力処理の流れを示すフローチャート。
【図9】地色補正・第2の文字認識・第2の文字数計数・優劣判断処理の流れを示すフローチャート。
【図10】実施形態3に係る読取・出力処理の流れを示すフローチャート。
【図11】地色補正・第2の文字認識・第2の文字数計数・優劣判断処理の流れを示すフローチャート。
【発明を実施するための形態】
【0017】
<実施形態1>
実施形態1を図1ないし図7によって説明する。
(1)読取部の概略構成
図1は、実施形態1に係る画像読取装置としてのイメージスキャナ1(図2参照)が備える読取部10の構成を簡略化して示す模式図である。ここでは等倍光学系を用いて原稿を読み取るCIS(Contact Image Sensor)方式の読取部10を例に説明する。
なお、読取部10には図1に示す構成の他に、後述する図2で説明するデバイス制御部34、AFE35、駆動部36、及び、画像処理部37も含まれる。
【0018】
イメージスキャナ1の筐体11の上壁には開口が形成されており、その開口がプラテンガラス12によって閉塞されている。なお、図1では筐体11の一部のみを示している。プラテンガラス12には読み取り対象の原稿Mが載置される。
原稿カバー13は原稿Mを抑える原稿マット14を有しており、プラテンガラス12を覆う閉姿勢とプラテンガラス12を開放する開姿勢とに回動可能に筐体11に連結されている。
【0019】
読取デバイス15は、RGB3色の発光ダイオードなどで構成される光源16、複数の受光素子が紙面垂直方向(主走査方向)に直線状に配列されたイメージセンサ17、原稿Mで反射された反射光をイメージセンサ17の各受光素子に等倍で結像させるロッドレンズアレイ18、これらが搭載されるキャリッジ19などを備えて構成されている。なお、光学系は原稿像を縮小してイメージセンサ17に結像する縮小光学系であってもよい。
【0020】
搬送機構20は、駆動ローラ21、従動ローラ22、これらに掛け回されたタイミングベルト23などを備えて構成されており、後述する駆動部36によって駆動されることにより読取デバイス15をプラテンガラス12の盤面に平行な副走査方向(図中のA方向)に搬送する。
上述した読取デバイス15は搬送機構20によって副走査方向に搬送されつつ、光源16の色を順に切り替えながら原稿Mを1ラインずつ読み取る。
【0021】
(2)イメージスキャナの電気的構成
図2は、イメージスキャナ1の電気的構成を示すブロック図である。イメージスキャナ1は、制御部30、デバイス制御部34、AFE(Analog Front End)35、駆動部36、画像処理部37、表示部38、操作部39、通信インタフェース部40などを備えて構成されている。
【0022】
制御部30は、CPU31、ROM32、RAM33などを備えて構成されている。CPU31はROM32に記憶されている各種のプログラムを実行することによってイメージスキャナ1の各部を制御する。ROM32にはCPU31によって実行される制御プログラムや各種のデータなどが記憶されている。RAM33はCPU31が各種の処理を実行するための主記憶装置として用いられる。制御部30は処理部の一例である。
【0023】
デバイス制御部34は制御部30からの指示の下で読取デバイス15の光源16やイメージセンサ17を制御する回路である。
AFE35はイメージセンサ17から出力されるアナログ信号のゲイン調整、ゲイン調整されたアナログ信号をデジタル信号に変換するA/D変換などを行う回路である。
駆動部36は例えばステッピングモータであり、前述した搬送機構20を駆動する。
【0024】
画像処理部37は、AFE35から出力されたデジタル信号にガンマ補正やシェーディング補正、その他各種の画像処理を施して画素毎にRGB3色の濃度値を持つ画像データを生成する回路である。
表示部38は、液晶ディスプレイなどの表示装置、表示装置を駆動する駆動回路などで構成されている。表示部38は通知部の一例である。
【0025】
操作部39は各種のボタンを備えて構成されている。ユーザは操作部39を操作することによって各種の設定や読み取りの指示などを行うことができる。また、ユーザは操作部39を操作することにより、後述する地色補正を行うか否かを設定することができる。
通信インタフェース部40は、LAN(LocalAria Network)などの通信ネットワーク、USB(Universal Serial Bus)、パラレル回線などを介してパーソナルコンピュータなどの外部の装置と通信するためのインタフェースである。
【0026】
(3)画像の地色補正
新聞などのように地色が白色でない文書原稿を読み取って画像データを生成すると、地色が白色でないことにより、生成した画像データが表す画像上でユーザが文字を読み難い場合がある。そのため、イメージスキャナ1は画像上でユーザが文字を読み易くするために、画像データが表す画像の地色を白色に近付ける地色補正を行う。地色を白色に近付けるとは、元の地色を基準として、その元の地色よりも白色に近い色にすることをいい、本実施形態の場合は地色の濃度値を元の濃度値より大きい値にすることをいう。白色は所定の色の一例である。
【0027】
ここで、理解を容易にするため、本実施形態では画像データが表す画像はモノクロ画像であるものとする。モノクロ画像は画素毎にRGBの濃度値が互いに同じであるので、以降の説明ではR成分の濃度値を対象に説明する。また、本実施形態では濃度値が取り得る範囲は0(黒色)〜255(白色)までの256階調であるとする。
【0028】
実施形態1では画像データを構成している各画素の濃度値(R成分の濃度値)に以下の式1及び式2によって示される補正式を適用することによって地色補正を行う。地色補正後のR成分の濃度値はそのまま地色補正後のG成分及びB成分の濃度値としても用いられるものとする。
【0029】
地色補正後の濃度値=地色補正前の濃度値×補正係数D ・・・ 式1
補正係数D=最大濃度値/地色濃度値 ・・・ 式2
【0030】
式2において最大濃度値は画素が取り得る最大の濃度値であり、本実施形態の場合は255である。
また、式2において地色濃度値とは、画像データが表す画像において地色を表している画素の濃度値である。一般に文字は原稿の先頭からある程度のマージンをおいて表記される。このため画像の先頭からある程度の範囲までの画素、言い換えると上述したマージン部分の画素は地色を表す画素である可能性が高い。そこで、イメージスキャナ1は画像の先頭からある程度の範囲にある画素から濃度値を取得し、取得した濃度値の平均値を地色濃度値とする。上述した「ある程度の範囲」は適宜に決定することができる。
【0031】
図3は、上述した地色補正による濃度値の変化を示すグラフである。図示する例では地色濃度値が100である場合を示している。上述した補正式を用いると地色濃度値100は白色の濃度値255に変換される。すなわち、地色が白色に補正される。
ただし、実施形態1では上述した補正式を全ての画素に適用するので、地色よりも白色に近い画素、言い換えると、濃度値が100より大きい画素は補正後の濃度値が255を超えてしまう。そこで、実施形態1では補正前の濃度値が100以上である画素については全て補正後の濃度値を255とする。
【0032】
(4)文字が読み難くなる画像例
上述したように地色補正は画像上でユーザが文字を読み易くするために行うものであるが、文字の色の方が地色よりも白色に近い場合は地色補正を行うと文字が消えてしまい、却ってユーザが文字を読み難くなってしまう。以下、図4を参照して説明する。
【0033】
図4は、ユーザが文字を読み難くなってしまう画像例を示す模式図である。
画像例1は地色が灰色で文字が白色の原稿を読み取って生成された画像データが表す画像を示している。画像例1では地色補正を行うと灰色の地色が白色になることにより、白色の文字が消えてしまう。従って、地色補正を行うと却ってユーザが文字を読み難くなってしまう
【0034】
画像例2は地色が2色に分かれており、地色濃度値を取得する領域と文字が表記されている領域とで地色が異なる原稿を読み取って生成された画像データが表す画像を示している。図示する例では文字が表記されている領域については地色が白色であるので地色の方が文字の色よりも白色に近い。しかしながら、補正式で用いる地色濃度値は画像の先頭からある程度の範囲までの領域から取得されるので、その領域の地色と比較すると、文字の色の方が地色よりも白色に近い。従って、地色補正を行うと文字も地色も白色になり、文字が消えてしまう。
【0035】
(5)読取・出力処理
上述したように、地色補正を行うと却ってユーザが文字を読み難くなってしまう場合もある。そこで、イメージスキャナ1は、地色補正前の画像及び地色補正後の画像のそれぞれについて文字認識処理を実行し、地色補正前の画像の認識結果と地色補正後の画像の認識結果との優劣を判断する。そして、イメージスキャナ1は、いずれか認識結果が優れていると判断された画像を表す画像データを出力する。
【0036】
より具体的には、イメージスキャナ1は地色補正前の画像で認識できた文字の数(第1の文字数)と地色補正後の画像で認識できた文字の数(第2の文字数)とを比較する。そして、イメージスキャナ1は、第1の文字数の方が第2の文字数より多い場合は地色補正前の画像の認識結果が優れていると判断し、第2の文字数の方が第1の文字数より多い場合は地色補正後の画像の認識結果が優れていると判断する。これは、文字認識処理によって認識できた文字の数が多い画像ほどユーザが文字を読み易い画像であるといえるからである。
【0037】
(5−1)読取・出力処理の流れ
図5は、実施形態1に係る読取・出力処理の流れの流れを示すフローチャートである。
S101では、制御部30は原稿を読み取って画像データを生成する。以下、この画像データのことを第1の画像データという。
【0038】
S102では、制御部30は第1の画像データをRAM33に記憶する。
S103では、制御部30はユーザによって地色補正を行うように設定されているか否かを判定し、地色補正を行うように設定されている場合(S103:YES)はS104に進み、地色補正を行わないように設定されている場合(S103:NO)はS109に進む。
【0039】
S104では、制御部30は第1の画像データが表す画像に文字認識処理を実行し、認識できた文字の数(第1の文字数)をカウントする。なお、図中では第1の画像データが表す画像を第1の画像と省略している。S104は第1の文字認識処理、及び、第1の文字数計数処理の一例である。
【0040】
S105では、制御部30は第1の画像データを解析して原稿の地色を示す地色濃度値を取得する。
S106では、制御部30はS105で取得した地色濃度値から補正係数Dを決定する。S106は決定処理の一例である。
【0041】
S107では、制御部30は第1の画像データが表す画像を複製した第2の画像データに地色補正を実行し、地色補正後の画像に文字認識処理を実行する地色補正・第2の文字認識・第2の文字数計数処理を実行する。地色補正・第2の文字認識・第2の文字数計数処理の詳細については後述する。
【0042】
S108では、制御部30はS104での認識結果とS107での認識結果との優劣を判断する優劣判断処理を実行する。詳しくは後述するが、優劣判断処理では優れていると判断された認識結果に対応する画像データが出力対象として指定される。
S109では、制御部30は第1の画像データを出力対象として指定する。
【0043】
S110では、制御部30はS108又はS109で出力対象として指定された画像データを出力する。
画像データの出力は、外部の装置への送信であってもよいし、イメージスキャナ1に着脱可能に装着されるリムーバブルメモリへの書き込みであってもよいし、イメージスキャナ1とプリンタとが一体に構成されている場合はプリンタでの印刷であってもよい。S110は出力処理の一例である。
【0044】
(5−2)地色補正・第2の文字認識・第2の文字数計数処理
図6は、S107で実行される地色補正・第2の文字認識・第2の文字数計数処理の流れを示すフローチャートである。
S201では、制御部30は第1の画像データを複製し、第2の画像データとしてRAM33に記憶する。
【0045】
S202では、制御部30はS106で決定された補正係数Dを用いて第2の画像データが表す画像の地色補正を行う。S202は補正処理の一例である。
S203では、制御部30はS202で地色補正が行われた後の第2の画像データが表す画像に文字認識処理を実行し、認識できた文字の数(第2の文字数)をカウントする。S203は第2の文字認識処理、及び、第2の文字数計数処理の一例である。
【0046】
(5−3)優劣判断処理
図7は、S108で実行される優劣判断処理の流れを示すフローチャートである。
S301では、制御部30は第1の文字数及び第2の文字数がいずれも基準文字数以下であるか否か判断し、いずれの文字数も基準文字数より多い場合(S301:NO)はS302に進み、いずれか一方でも基準文字数以下である場合(S301:YES)はS303に進む。
S302では、制御部30は第1の文字数と第2の文字数とを比較し、第1の文字数が第2の文字数以上である場合はS303に進み、第1の文字数が第2の文字数未満である場合はS305に進む。S302は文字数比較処理の一例である。
【0047】
S303では、制御部30は第1の文字認識処理による認識結果が優れていると判断し、第1の画像データを出力対象の画像データとして指定する。
S304では、制御部30は地色補正していない旨のメッセージを表示部38に表示する。S304は通知処理の一例である。
S305では、制御部30は第2の文字認識処理による認識結果が優れていると判断し、第2の画像データを出力対象の画像データとして指定する。
【0048】
(6)実施形態の効果
以上説明した実施形態1に係るイメージスキャナ1によると、第1の文字認識処理による認識結果が優れていると判断された場合は補正前の画像データを出力し、第2の文字認識処理による認識結果が優れていると判断された場合は補正後の画像データを出力するので、画像の地色を白色に近付ける補正が行われる前の画像データ及び当該補正が行われた後の画像データのうちいずれかユーザが画像の内容を把握し易い方の画像データを出力できる。
【0049】
更に、イメージスキャナ1よると、第1の文字数の方が第2の文字数より多い場合は第1の文字認識処理による認識結果が優れていると判断し、第2の文字数の方が第1の文字数より多い場合は第2の文字認識処理による認識結果が優れていると判断する。
ある画像と当該画像の地色を白色に近付ける補正が行われた画像とがある場合、文字認識処理によって認識できた文字の数が多い画像の方がユーザにとって文字を読み易いといえる。イメージスキャナ1よると、第1の文字数の方が第2の文字数より多い場合は第1の文字認識処理による認識結果が優れていると判断し、第2の文字数の方が第1の文字数より多い場合は第2の文字認識処理による認識結果が優れていると判断するので、画像の地色を白色に近付ける補正が行われる前の画像データ及び当該補正が行われた後の画像データのうちいずれかユーザが文字を読み易い方の画像データを出力できる。
【0050】
更に、イメージスキャナ1よると、補正前の画像データ(第1の画像データ)を解析して原稿の地色を示す地色濃度値を取得し、取得した地色濃度値が白色の濃度値に変換される補正係数Dを決定するので、画像の地色が白色に近付く補正係数を画像データ毎に適切に決定できる。
【0051】
更に、イメージスキャナ1よると、第1の文字数及び第2の文字数がいずれも基準文字数以下である場合は、優劣判断処理の判断によらず補正前の画像データである第1の画像データを出力する。
文字を読み易くするために画像の地色を白色に近付ける場合、文字が少ない画像まで地色を白色に近付けてしまうと、画質を不必要に劣化させてしまう。
イメージスキャナ1によると、第1の文字数及び第2の文字数がいずれも基準文字数以下である場合は補正前の画像データ(第1の画像データ)を出力するので、文字が少ない画像の画質を不必要に劣化させてしまわないようにすることができる。
【0052】
更に、イメージスキャナ1よると、補正前の画像データ(第1の画像データ)を出力した場合は地色補正が行われなかったことをユーザに通知するので、ユーザは地色補正が行われなかったことを知ることができる。
【0053】
<実施形態2>
実施形態2を図8ないし図9によって説明する。
実施形態1では画像データから地色濃度値を取得して補正係数Dを決定する場合を例に説明したが、実施形態2では地色を白色に近付ける際に用いる補正係数であって互いに異なる複数の補正係数Dが予め設定されており、それら複数の補正係数Dの中から順に補正係数Dを選択しながら地色補正、第2の文字認識処理、及び、優劣判断処理を繰り返すことにより、可能な限り第2の画像データを出力対象として指定する。
【0054】
ここでは補正係数D1、D2、D3、・・・、DNのN(N≧1)個の補正係数Dが予め設定されているものとし、Dの後ろに付されている番号が小さい補正係数Dほど値が大きく、番号が大きい補正係数Dほど値が小さいとする。なお、各補正係数Dをどのような値にするかは適宜に決定できる。
【0055】
番号が小さい補正係数Dほど値が大きいので、番号が小さい補正係数Dほど地色を白色に近付ける効果が大きく、番号が大きい補正係数ほど地色を白色に近付ける効果が小さい。実施形態2では番号が小さい補正係数Dから順に選択するものとする。すなわち、地色を白色に近付ける効果が大きい補正係数Dから地色を白色に近付ける効果が小さい補正係数Dの順に選択するものとする。言い換えると、地色を複数の所定の色のうち相対的に薄い所定の色から濃い所定の色にする順に補正係数を選択する。
【0056】
(1)読取・出力処理の流れ
図8は、実施形態2に係る読取・出力処理の流れを示すフローチャートである。ここでは実施形態1と実質的に同一の処理には同一の符号を付して説明を省略する。また、前述したように実施形態2では予め記憶部に記憶されている補正係数Dを用いて地色補正を行うので、第1の画像データから地色濃度値を取得して補正係数Dを決定する処理(図5に示すS105及びS106)は実行されない。
【0057】
S401では、制御部30は補正回数をカウントするカウンタnに1をセットする。
S402では、制御部30は地色補正・第2の文字認識・第2の文字数計数・優劣判断処理を実行する。詳しくは後述するが、地色補正・第2の文字認識・第2の文字数計数・優劣判断処理では、第2の文字数の方が第1の文字数よりも多い場合は第2の画像データが出力対象の画像データとして指定されるが、第1の文字数の方が第2の文字数よりも多い場合は、第1の画像データも第2の画像データも出力対象の画像データとして指定されない。
【0058】
S403では、制御部30は出力対象の画像データが指定されているか否かを判定し、指定されている場合(S403:YES)はS110に進み、指定されていない場合(S403:NO)はS402に戻って処理を繰り返す。
【0059】
(2)地色補正・第2の文字認識・第2の文字数計数・優劣判断処理
図9は、地色補正・第2の文字認識・第2の文字数計数・優劣判断処理の流れを示すフローチャートである。ここでは実施形態1と実質的に同一の処理には同一の符号を付して説明を省略する。
【0060】
S501では、制御部30はカウンタnが補正係数の数であるN以下であるか否かを判定し、N以下である場合(S501:YES)は未だ選択していない補正係数があるとしてS502に進み、Nより大きい場合は全ての補正係数を選択したとしてS303に進む。
S502では、制御部30は補正係数Dとしてn番目の補正係数Dnを選択する。
【0061】
S503では、制御部30はS104でカウントした第1の文字数とS107でカウントした第2の文字数とを比較し、第1の文字数が第2の文字数以上である場合はS504に進み、第1の文字数が第2の文字数未満である場合はS305に進む。
S504では、制御部30は第2の画像データをRAM33から消去する。
S505では、制御部30はnに1を加算する。
【0062】
上述した地色補正・第2の文字認識・第2の文字数計数・優劣判断処理は、第2の文字認識処理による認識結果が優れていると判断されるか、すなわちS503で第1の文字数が第2の文字数未満であると判断されるか、又は、地色補正がN回実行されるまで処理が繰り返される。
そして、第2の文字認識処理による認識結果が優れていると判断された場合はS305において第2の画像データが出力対象として指定される。一方、第2の文字認識処理による認識結果が優れていると判断されることなく地色補正がN回実行された場合は、第1の文字認識処理による認識結果が優れていると判断され、S303において第1の画像データが出力対象として指定されることになる。
【0063】
(3)実施形態の効果
以上説明した実施形態2に係るイメージスキャナによると、補正係数Dを順に選択しながら地色補正、第2の文字認識処理、及び、優劣判断処理を繰り返すことによって可能な限り第2の画像データを出力対象として指定するので、補正前の画像データに比べてユーザが文字を読み易い画像データを出力できる可能性が高くなる。
また、このイメージスキャナによると、予め設定されている互いに異なる複数の補正係数Dの中から補正係数Dを選択するので、画像データを解析して補正係数Dを決定する場合に比べ、補正係数Dを決定するための処理量を軽減できる。
【0064】
更に、このイメージスキャナよると、画像の地色を白色に近付ける効果が大きい補正係数Dから白色に近付ける効果が小さい補正係数Dの順に選択する。
例えば、画像の地色を白色に近付ける効果が小さい補正係数Dから画像の地色を白色に近付ける効果が大きい補正係数Dの順に選択すると、徐々に画像の地色が白色に近付くことになるので、補正前に比べてユーザが文字を読み易くなったとき、ユーザが文字を読み易い範囲で画像の地色をより白色に近付けることができる補正係数Dがあったとしても、すなわちユーザが更に文字を読み易くなる補正係数Dがあったとしても、その補正係数Dが用いられないことになる。
このイメージスキャナよると、画像の地色を白色に近付ける効果が大きい補正係数Dから白色に近付ける効果が小さい補正係数Dの順に選択するので、すなわち徐々に画像の地色が濃くなっていくように補正係数Dを選択するので、ユーザが文字を読み易い範囲で極力画像の地色を白色に近付けることができる。
【0065】
<実施形態3>
実施形態3を図10ないし図11によって説明する。
実施形態3に係るイメージスキャナも上述した実施形態2と同様に地色補正、第2の文字認識処理、及び、優劣判断処理を繰り返すが、実施形態3では複数の補正係数Dが予め設定されているのではなく、イメージスキャナは第1の画像データから地色濃度値を取得して補正係数Dを決定し、最初の地色補正ではその補正係数Dを用いて地色補正を行う。そして、イメージスキャナは、2回目以降の地色補正では直前の地色補正で用いた補正係数Dを所定の変更規則に従って変更しながら地色補正を行う。
【0066】
ここでは所定の変更規則として、直前の地色補正で用いた補正係数DからΔDを減じる場合を例に説明する。ΔDが減じられた後の補正係数Dは第2の所定の色とする補正係数の一例である。ΔDの値は適宜に決定することができる。
補正係数DからΔDを減じるのは、直前の地色補正よりも地色を白色に近付ける効果が小さくなるようにするためである。直前の地色補正で地色が補正された第2の画像データについて第2の文字認識処理による認識結果が優れていると判断されなかったということは、地色を白色に近付ける効果が大きすぎて文字まで読み難くなってしまったということである。そのため、次回の地色補正では地色を白色に近付ける効果を小さくするために、イメージスキャナは補正係数DからΔDを減じる。
【0067】
なお、直前の地色補正で用いた補正係数DからΔDを減じるのではなく、直前の地色補正で用いた補正係数Dに1未満の値を乗算することによって補正係数Dを小さくしてもよい。また、ΔDは常に同じでなくてもよく、例えば補正回数が増えるにつれてΔDを小さくしてもよいし、補正回数が増えるにつれてΔDを大きくしてもよい。
【0068】
(1)読取・出力処理の流れ
図10は、実施形態3に係る読取・出力処理の流れを示すフローチャートである。ここでは実施形態1と実質的に同一の処理には同一の符号を付して説明を省略する。
実施形態2に係る読取・出力処理と実施形態3に係る読取・出力処理との違いは、実施形態3では最初の地色補正で使用する補正係数については第1の画像データから取得した地色濃度値に基づいて決定するので、第1の画像データから地色濃度値を取得して補正係数Dを決定する処理(図5のS105及びS106)が実行される点である。
【0069】
S601では、補正回数をカウントするカウンタnに1をセットする。
S602では、制御部30は実施形態3に係る地色補正・第2の文字認識・第2の文字数計数・優劣判断処理を実行する。
S603では、制御部30は出力対象の画像データが指定されているか否かを判定し、指定されている場合(S603:YES)はS110に進み、指定されていない場合(S603:NO)はS602に戻って処理を繰り返す。
【0070】
(2)地色補正・第2の文字認識・第2の文字数計数・優劣判断処理
図11は、実施形態3に係る地色補正・第2の文字認識・第2の文字数計数・優劣判断処理の流れを示すフローチャートである。ここでは実施形態1及び2と実質的に同一の処理には同一の符号を付して説明を省略する。
【0071】
実施形態2に係る地色補正・第2の文字認識・第2の文字数計数・優劣判断処理と、実施形態3に係る地色補正・第2の文字認識・第2の文字数計数・優劣判断処理との違いは、実施形態3では実施形態2のS502が実行されず、その替わりにS505の後でS701が実行される点である。
S701では、制御部30は補正係数DからΔDを減じる。
【0072】
(3)実施形態の効果
以上説明した実施形態3に係るイメージスキャナよると、補正係数を変更しながら地色補正、第2の文字認識処理、及び、優劣判断処理を繰り返すことによって可能な限り第2の画像データを出力対象として指定するので、補正前の画像データに比べてユーザが文字を読み易い画像データを出力できる可能性が高くなる。
【0073】
更に、このイメージスキャナよると、前回の地色補正で用いた補正係数Dよりも画像の地色を白色に近付ける効果が小さくなるように補正係数Dを変更する。
例えば、前回の地色補正で用いた補正係数Dよりも画像の地色を白色に近付ける効果が大きくなるように補正係数Dを変更すると、徐々に画像の地色が白色に近付くことになるので、補正前に比べてユーザが文字を読み易くなったとき、ユーザが文字を読み易い範囲で画像の地色をより白色に近付けることができる補正係数Dがあったとしても、すなわちユーザが更に文字を読み易くなる補正係数Dがあったとしても、その補正係数Dが用いられないことになる。
このイメージスキャナによると、前回の地色補正で用いた補正係数Dよりも画像の地色を白色に近付ける効果が小さくなるように補正係数Dを変更するので、すなわち徐々に画像の地色が濃くなっていくように補正係数Dを変更するので、ユーザが文字を読み易い範囲で極力画像の地色を白色に近付けることができる。
【0074】
<他の実施形態>
実施形態は上記記述及び図面によって説明した実施形態に限定されるものではなく、例えば次のような実施形態も技術的範囲に含まれる。
【0075】
(1)上記実施形態では補正処理、第1の文字認識処理、第2の文字認識処理、優劣判断処理、及び、出力処理をイメージスキャナ1の制御部30によって実行する場合を例に説明したが、これらの処理は例えば画像処理プログラムを実行するパーソナルコンピュータ(以下「PC」という)によって実行されてもよい。PCは情報処理装置の一例である。
具体的には例えば、イメージスキャナ1は生成した画像データに地色補正を実行することなくPCに送信し、画像処理プログラムを実行するPCが上述した各処理を実行することにより、認識結果が優れていると判断された画像データを出力してもよい。この場合の出力は、記憶装置への保存、ディスプレイへの表示、プリンタでの印刷、他のコンピュータへの送信などである。
【0076】
なお、画像データはイメージスキャナ1から取得したものに限られず、インターネットのWEBサイトから取得した画像データやデジタルカメラから取得した画像データなどであってもよい。
また、上述した画像処理プログラムはPCで実行されるものに限定されず、例えば携帯電話や携帯情報端末で実行されてもよい。
【0077】
(2)上記実施形態では画像データが表す画像がモノクロ画像であるものとし、Rの濃度値を対象に地色補正を行う場合を例に説明したが、画像データが表す画像はカラー画像であってもよい。
ただし、カラー画像では各画素のRGBの濃度値は互いに同じであるとは限らない。この場合は、画像データの色空間をYCbCr色空間に変換し、Y成分の値を用いて地色補正を行ってもよい。Y成分の値の範囲が0〜255である場合、0は黒色、255は白色を表す。この場合はY成分の値のみを補正し、Cb成分及びCr成分の値は変更しないものとする。
【0078】
(3)上記実施形態では地色のみでなく文字も含めて画像全体の色を白色に近付ける場合を例に説明したが、地色のみを白色に近付け、地色以外の色は白色に近付けないようにしてもよい。具体的には例えば、第1の画像データから取得した地色濃度値との差が所定範囲内である濃度値を持つ画素についてのみ地色補正を行ってもよい。
【0079】
(4)上記実施形態では処理部として制御部30を例に説明したが、処理部は制御部30と画像処理部37とによって構成されてもよいし、画像処理部37のみによって構成されてもよい。
【0080】
(5)上記実施形態では所定の色として白色を例に説明したが、例えば地色が灰色で文字が白色の場合は、所定の色は黒色であってもよい。
【符号の説明】
【0081】
1・・・イメージスキャナ、10・・・読取部、30・・・制御部、37・・・画像処理部、38・・・表示部、40・・・通信インタフェース部


【特許請求の範囲】
【請求項1】
原稿を読み取って画像データを生成する読取部と、
前記読取部によって生成された前記画像データを処理する処理部と、
を備え、
前記処理部は、
前記画像データが表す画像の地色を所定の色に近付ける補正を行う補正処理と、
前記補正前の前記画像データが表す画像上の文字を認識する第1の文字認識処理と、
前記補正後の前記画像データが表す画像上の文字を認識する第2の文字認識処理と、
前記第1の文字認識処理による認識結果と前記第2の文字認識処理による認識結果との優劣を判断する優劣判断処理と、
前記優劣判断処理によって前記第1の文字認識処理による認識結果が前記第2の文字認識処理による認識結果よりも優れていると判断された場合は前記補正前の前記画像データを出力し、前記第2の文字認識処理による認識結果が前記第1の文字認識処理による認識結果よりも優れていると判断された場合は前記補正後の前記画像データを出力する出力処理と、
を実行する、画像読取装置。
【請求項2】
請求項1に記載の画像読取装置であって、
前記優劣判断処理は、
前記第1の文字認識処理によって認識できた文字の数である第1の文字数を計数する第1の文字数計数処理と、
前記第2の文字認識処理によって認識できた文字の数である第2の文字数を計数する第2の文字数計数処理と、
前記第1の文字数と前記第2の文字数とを比較していずれの文字数の方が多いかを判断する文字数比較処理と、
を含み、前記文字数比較処理によって前記第1の文字数の方が前記第2の文字数より多いと判断された場合は前記第1の文字認識処理による認識結果を前記第2の文字認識処理による認識結果よりも優れていると判断し、前記第2の文字数の方が前記第1の文字数より多いと判断された場合は前記第2の文字認識処理による認識結果を前記第1の文字認識処理による認識結果よりも優れていると判断する、画像読取装置。
【請求項3】
請求項1又は請求項2に記載の画像読取装置であって、
前記処理部は、前記補正前の前記画像データを解析して前記原稿の地色を示す地色濃度値を取得し、前記補正処理において地色を前記所定の色に近付ける際に用いる補正係数であって取得した前記地色濃度値を前記所定の色の濃度値にする前記補正係数を決定する決定処理を実行する、画像読取装置。
【請求項4】
請求項3に記載の画像読取装置であって、
前記処理部は、前記第2の文字認識処理による認識結果が前記第1の文字認識処理による認識結果よりも優れていると判断されなかった場合は、前回の前記補正処理で用いた前記補正係数を所定の規則に従って変更しながら、前記第2の文字認識処理による認識結果が前記第1の文字認識処理による認識結果よりも優れていると判断されるか、又は、前記補正処理による補正回数が所定回数に達するまで前記補正処理、前記第2の文字認識処理、及び、前記優劣判断処理を繰り返し、
前記補正処理による補正回数が前記所定回数に達した場合は、前記優劣判断処理において、前記第1の文字認識処理による認識結果が前記第2の文字認識処理による認識結果よりも優れていると判断する、画像読取装置。
【請求項5】
請求項4に記載の画像読取装置であって、
前記処理部は、前回の前記補正処理で用いた補正係数よりも画像の地色を白色に近付ける効果が小さくなるように前記補正係数を変更する、画像読取装置。
【請求項6】
請求項1又は請求項2に記載の画像読取装置であって、
前記処理部は前記補正処理において地色を前記所定の色に近付ける際に用いる補正係数であって予め設定されている互いに異なる複数の補正係数の中から順に補正係数を選択しながら、前記第2の文字認識処理による認識結果が前記第1の文字認識処理による認識結果よりも優れていると判断されるか、又は、前記補正処理による補正回数が所定回数に達するまで前記補正処理、前記第2の文字認識処理、及び、前記優劣判断処理を繰り返し、
前記補正処理による補正回数が前記所定回数に達した場合は、前記優劣判断処理において、前記第1の文字認識処理による認識結果が前記第2の文字認識処理による認識結果よりも優れていると判断する、画像読取装置。
【請求項7】
請求項6に記載の画像読取装置であって、
前記処理部は、地色を白色に近付ける効果が大きい前記補正係数から白色に近付ける効果が小さい前記補正係数の順に選択する、画像読取装置。
【請求項8】
請求項2に記載の画像読取装置であって、
前記処理部は、前記第1の文字数及び前記第2の文字数がいずれも基準文字数以下である場合は、前記優劣判断処理において、前記第1の文字数及び前記第2の文字数の大小によらず、前記第1の文字認識処理による認識結果が前記第2の文字認識処理による認識結果よりも優れていると判断する、画像読取装置。
【請求項9】
請求項1乃至請求項8のいずれか一項に記載の画像読取装置であって、
ユーザに情報を通知する通知部を備え、
前記処理部は、前記出力処理によって前記補正前の前記画像データを出力した場合は、前記通知部を制御して、前記画像データが表す画像の地色を前記所定の色に近付ける補正が行われなかったことをユーザに通知する通知処理を実行する、画像読取装置。
【請求項10】
画像データが表す画像の地色を所定の色に近付ける補正を行う補正処理と、
前記補正前の前記画像データが表す画像上の文字を認識する第1の文字認識処理と、
前記補正後の前記画像データが表す画像上の文字を認識する第2の文字認識処理と、
前記第1の文字認識処理による認識結果と前記第2の文字認識処理による認識結果との優劣を判断する優劣判断処理と、
前記優劣判断処理によって前記第1の文字認識処理による認識結果が前記第2の文字認識処理による認識結果よりも優れていると判断された場合は前記補正前の前記画像データを出力し、前記第2の文字認識処理による認識結果が前記第1の文字認識処理による認識結果よりも優れていると判断された場合は前記補正後の前記画像データを出力する出力処理と、
をコンピュータに実行させる画像処理プログラム。
【請求項11】
画像データが表す画像の地色を所定の色に近付ける補正を行う補正処理と、
前記補正前の前記画像データが表す画像上の文字を認識する第1の文字認識処理と、
前記補正後の前記画像データが表す画像上の文字を認識する第2の文字認識処理と、
前記第1の文字認識処理による認識結果と前記第2の文字認識処理による認識結果との優劣を判断する優劣判断処理と、
前記優劣判断処理によって前記第1の文字認識処理による認識結果が前記第2の文字認識処理による認識結果よりも優れていると判断された場合は前記補正前の前記画像データを出力し、前記第2の文字認識処理による認識結果が前記第1の文字認識処理による認識結果よりも優れていると判断された場合は前記補正後の前記画像データを出力する出力処理と、
を実行する処理部を備える情報処理装置。


【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate


【公開番号】特開2013−115734(P2013−115734A)
【公開日】平成25年6月10日(2013.6.10)
【国際特許分類】
【出願番号】特願2011−262427(P2011−262427)
【出願日】平成23年11月30日(2011.11.30)
【出願人】(000005267)ブラザー工業株式会社 (13,856)
【Fターム(参考)】