説明

文書読取装置

【課題】文字の判読が可能な解像度で文書を読み取ることが可能な文書読取装置を提供する。
【解決手段】読取部2は、文書20を最高解像度で読み取って基準文書画像データを生成し、最高解像度よりも低い複数の異なる解像度で文書20を読み取って複数の文書画像データを生成する。文字認識部3は、基準文書画像データと複数の文書画像データとに対して文字認識処理を行い、基準文書画像データと複数の文書画像データとのそれぞれにおいて、操作者によって指定された領域に含まれる所定の大きさ以下の文字の数をカウントする。比較部4は、基準文書画像データの文字数と複数の文書画像データのそれぞれの文字数とを比較し、基準文字数との文字数の差が許容範囲に含まれる解像度で読み取られた文書画像データのうち、最も低い解像度で読み取られた文書画像データを出力する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、文書を読み取って文字認識を行う文書読取装置に関する。
【背景技術】
【0002】
例えば紙等に印刷された文書、又は手書きされた文書を、スキャナで読み取って文書画像データを生成することが行われている。例えば、文書画像データを電子メールに添付して送信することが行われている。
【0003】
スキャナの解像度をユーザが手動で設定する場合には、解像度が低すぎたり高すぎたりする場合がある。解像度が低すぎると、スキャナで読み取られた文書画像を再現したときの画質の低下を招き、文書画像中の文字を判読することがユーザにとって困難になるおそれがある。例えば文字の潰れやかすれ等によって、文字が読み難くなるおそれがある。一方、解像度が高すぎると、文書画像データの容量が大きくなってしまうため、文書画像データを保存する場合に大きな容量の記憶媒体が必要となってしまう。また、文書画像データの容量が大きいと、電子メールに文書画像データを添付して送信する場合に、データ送信の容量制限を超えてしまうことや、送信に時間がかかってしまうこと等がある。
【0004】
下記の特許文献1には、文書画像データに対して文字認識処理を行い、文字ごとの文字認識確度を求め、その文字認識確度に基づいてスキャナの解像度を変更する装置が開示されている。
【0005】
また、下記の特許文献2には、複数の異なる解像度の画像データを生成し、各画像データに対して文字認識処理を行い、各画像データに対する文字認識処理の結果に基づいて、格納すべき画像データを決定する装置が開示されている。
【0006】
また、下記の特許文献3には、画像データに対して文字認識処理を行い、キーワードが文字認識処理の結果に出現している回数をカウントし、そのカウント値に基づいて文字認識の精度を判断する装置が開示されている。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】特開平11−203411号公報
【特許文献2】特開2000−316077号公報
【特許文献3】特開2006−172055号公報
【発明の概要】
【発明が解決しようとする課題】
【0008】
上述したようにスキャナの解像度が低すぎると、文書画像データの画質低下を招くおそれがあり、スキャナの解像度が高すぎると、文書画像データの容量が大きくなってしまう問題がある。従って、文字の判読が可能な最低限の解像度を決定し、その解像度で文書を読み取って文書画像データを生成することが望まれている。
【0009】
ところで、文書によっては、図が多い文書や説明文が多い文書等がある。また、図と説明文とが記載されている文書もある。例えば仕様書等では、図と説明文とが1つの文書に記載されていることがある。例えばビル管理システムに関する仕様書では、ビル管理に用いられるシステムを図で表すシステム構成図や、各機器についての説明文等が1つの文書に記載されていることがある。このような文書では、特に説明文の文字が潰れたりかすれたりして判読が困難になることは望ましくない。このように、文書によっては判読が困難になっては特に困る箇所があり、その箇所に含まれる文字の判読が可能な最低限の解像度で文書画像データを生成することが望まれている。
【0010】
また、1つの文書においても、文字によって大きさが異なることがある。例えば上述した仕様書等では、図に記載された文字の大きさと、説明文に記載された文字の大きさとが異なる場合がある。スキャナの解像度が同じであっても、大きい文字は判読が容易であるが、小さい文字は判読が困難になりやすい。従って、一概にすべての文字を対象にして解像度を決定しても、文字の大きさによっては潰れやかすれ等が発生して、ユーザにとって判読が困難になるおそれがある。
【0011】
上述した特許文献1〜3に記載された装置は、ユーザにとって判読が困難になっては特に困る箇所や、文字の大きさ等については考慮されていない。
【0012】
本発明の目的は、文字の判読が可能な解像度で文書を読み取ることが可能な文書読取装置を提供することである。
【課題を解決するための手段】
【0013】
本発明は、文書を最高解像度で読み取って基準文書画像データを生成し、前記最高解像度よりも低い複数の異なる解像度で前記文書を読み取って複数の文書画像データを生成する読取手段と、前記基準文書画像データと前記複数の文書画像データとに対して文字認識処理を行い、前記基準文書画像データと前記複数の文書画像データとのそれぞれにおいて、操作者によって指定された領域に含まれる文字のうち所定の大きさ以下の文字の数をカウントする文字認識手段と、前記基準文書画像データについてカウントされた基準文字数と、前記複数の文書画像データのそれぞれについてカウントされた文字数とを比較し、前記基準文字数との文字数の差が許容範囲に含まれる解像度で読み取られた文書画像データのうち、最も低い解像度で読み取られた文書画像データを出力する比較手段と、を有することを特徴とする文書読取装置である。
【0014】
また、本発明に係る文書読取装置であって、前記読取手段は、前記最高解像度から順番に解像度を下げて前記文書を読み取ることにより、前記基準文書画像データと前記複数の文書画像データとを生成し、前記比較手段は、解像度を下げて読み取りが行われるたびに生成された文書画像データの文字数と前記基準文字数とを比較し、前記基準文字数との文字数の差が前記許容範囲に含まれなくなる最初の解像度よりも1つ高い解像度で読み取られた文書画像データを出力する、ことを特徴とする。
【0015】
また、本発明に係る文書読取装置であって、前記比較手段は、解像度を下げて読み取りが行われるたびに生成された文書画像データの文字数と前記基準文字数とを比較し、文書画像データの文字数が前記基準文字数よりも少なくなる最初の解像度よりも1つ高い解像度で読み取られた文書画像データを出力する、ことを特徴とする。
【0016】
また、本発明に係る文書読取装置であって、前記文書画像データについてカウントされた文字数と前記基準文字数との差が前記許容範囲に含まれる場合には、前記読取手段の解像度を低下させ、前記文書画像データについてカウントされた文字数と前記基準文字数との差が前記許容範囲に含まれない場合には、前記読取手段の解像度を増加させる解像度変更手段を更に有し、前記比較手段は、前記基準文字数との文字数の差が前記許容範囲に含まれる解像度で読み取られた文書画像データのうち、最も低い解像度で読み取られた文書画像データを出力する、ことを特徴とする。
【発明の効果】
【0017】
本発明によると、基準文字数との文字数の差が許容範囲に含まれる解像度で読み取られた文書画像データのうち、最も低い解像度で読み取られた文書画像データを出力することにより、文字の判読が可能な文書画像データのなかで、容量が最小となる文書画像データを出力することが可能となる。また、指定された領域に含まれる小さい文字の判読が可能な文書画像データを出力することが可能となる。
【図面の簡単な説明】
【0018】
【図1】本発明の実施形態に係る文書読取装置を示すブロック図である。
【図2】表示装置の画面に表示される基準文書画像の一例を示す図である。
【図3】本発明の実施形態に係る文書読取装置による動作を示すフローチャートである。
【発明を実施するための形態】
【0019】
図1及び図2を参照して、本発明の実施形態に係る文書読取装置について説明する。図1は、本発明の実施形態に係る文書読取装置を示すブロック図である。図2は、表示装置の画面に表示される基準文書画像の一例を示す図である。
【0020】
本発明の実施形態に係る文書読取装置1は、読取部2と、文字認識部3と、比較部4と、解像度変更部5と、制御部6と、ユーザインターフェース(UI)7と、出力部10とを備える。文書読取装置1は、文書20の画像を読み取って文書画像データを生成する。
【0021】
読取部2は、紙媒体としての文書20の画像を読み取り、文書20を表す文書画像データを生成する。読取部2としては、例えば光学的スキャナが用いられる。読取部2は自動給紙機構を備え、紙媒体としての文書20を自動的に順次、読み取るようにしてもよい。
【0022】
読取部2は、後述する制御部6によって設定された解像度で文書20の画像を読み取って文書画像データを生成する。読取部2に設定可能な解像度を、一例として解像度が高い順から、解像度X1,X2,X3,X4,X5とする。解像度X1は一例として800dpiであり、読取部2に設定可能な最高の解像度である。以下、解像度X1を最高解像度X1と称することとする。解像度X2は、最高解像度X1よりも1つ低い解像度であり、一例として600dpiである。解像度X3は、解像度X2よりも1つ低い解像度であり、一例として400dpiである。解像度X4は、解像度X3よりも1つ低い解像度であり、一例として200dpiである。解像度X5は、解像度X4よりも1つ低い解像度であり、一例として100dpiである。なお、解像度X1,X2,X3,X4,X5を示す解像度情報は、例えば解像度変更部5に予め記憶されている。
【0023】
本実施形態では、読取部2は、最高解像度X1で文書20の画像を読み取って基準文書画像データD1を生成し、文字認識部3とユーザインターフェース7とに基準文書画像データD1を出力する。また、読取部2は、最高解像度X1よりも低い解像度Xn(n=2,3,4,5のいずれか)で文書20の画像を読み取って文書画像データDn(n=2,3,4,5のいずれか)を生成して文字認識部3に出力する。
【0024】
ユーザインターフェース(UI)7は、操作部8と表示部9とを備えている。表示部9は表示装置で構成されており、読取部2から出力された基準文書画像データD1に基づく基準文書画像を表示する。操作部8は入力装置で構成されている。ユーザは操作部8を用いて、表示部9に表示されている基準文書画像上で、文字の可読性評価の対象となる比較対象領域を指定する。
【0025】
図2に、表示部9に表示された基準文書画像の一例を示す。一例として、文書20がビル管理システムの仕様書である場合について説明する。ビル管理システムの仕様書としての文書20には、例えば、ビル管理に用いられるシステムを図で表すシステム構成図と、ビルの管理を行う中央監視機器の各機能についての説明文と、参考図とが記載されている。表示部9に表示された基準文書画像100には、システム構成図110と中央監視機器機能表120と参考図130とが含まれている。システム構成図110には、ビルの管理に用いられるシステムを表す図と、各部の名称等を示す文字列とが含まれている。中央監視機器機能表120には、各機器の記号を示す文字列、名称を示す文字列、及び機能を説明するための文字列等が含まれている。参考図130には、図と文字列とが含まれている。ユーザは、1つの比較対象領域を指定してもよいし、複数の比較対象領域を指定してもよい。例えば、ユーザは操作部8を用いて、破線で示す比較対象領域111,121を指定する。図2に示す例では、システム構成図110に対して比較対象領域111が指定されており、中央監視機器機能表120に対して比較対象領域121が指定されている。比較対象領域111,121の位置を示す座標情報が、ユーザインターフェース(UI)7から文字認識部3に出力される。
【0026】
文字認識部3は、読取部2で生成された文書画像データに対して文字認識処理を行うことにより文書画像データに含まれる文字を認識し、認識された文字をテキスト文字列として抽出する。文字認識部3は、例えばOCR(Optical Character Recognition)技術によって文書画像データに含まれる文字を認識する。そして、文字認識部3は、認識された文字の数をカウントし、カウントされた文字数を示す文字数データを比較部4に出力する。
【0027】
本実施形態では、文字認識部3は、最高解像度X1で読み取られた基準文書画像データD1に対して文字認識処理を行うことにより基準文書画像データD1に含まれる文字を認識し、基準文書画像データD1に含まれる文字の数(基準文字数N1)をカウントする。本実施形態では、文字認識部3は、比較対象領域に含まれる文字の数をカウントする。図2に示す例では、文字認識部3は、基準文書画像データD1の比較対象領域111,121内における文書画像データに対して文書認識処理を行うことにより、基準文書画像データD1の比較対象領域111,121に含まれる文字を認識し、比較対象領域111,121に含まれる文字の数(基準文字数N1)をカウントする。また、文字認識部3は、所定の大きさ(閾値)以下の文字の数をカウントして、その数を基準文字数N1としてもよい。所定の大きさを示す値(閾値)は、文字認識部3に予め設定されていてもよいし、ユーザが操作部8を用いることで閾値を入力するようにしてもよい。例えば、文字認識部3は、基準文書画像データD1の比較対象領域111,121に含まれる文字のうち、所定の大きさ(閾値)以下の文字の数をカウントし、その数を基準文字数N1とする。また、文字認識部3は、基準文書画像データD1の比較対象領域111,121に含まれる文字のうち、大きさが最も小さい文字の数をカウントし、その数を基準文字数N1としてもよい。例えば、文字認識部3は、各文字の横幅及び縦幅のうち少なくとも一方を求め、横幅又は縦幅を文字の大きさとすればよい。
【0028】
また、文字認識部3は、最高解像度X1よりも低い解像度Xn(n=2,3,4,5のいずれか)で読み取られた文書画像データDnに対して文字認識処理を行うことにより文書画像データDnに含まれる文字を認識し、文書画像データDnに含まれる文字の数(文字数Nn)をカウントする。一例として、文字認識部3は、解像度X2にて読み取られた文書画像データD2に対して文字認識処理を行うことにより文書画像データD2に含まれる文字を認識し、文書画像データD2に含まれる文字の数(文字数N2)をカウントする。最高解像度X1と同様に、文字認識部3は、文書画像データDnの比較対象領域111,121内における文書画像データに対して文書認識処理を行うことにより、文書画像データDnの比較対象領域111,121に含まれる文字を認識し、比較対象領域111,121に含まれる文字の数(文字数Nn)をカウントする。また、最高解像度X1と同様に、文字認識部3は、所定の大きさ(閾値)以下の文字の数をカウントし、その数を文字数Nnとしてもよい。例えば、文字認識部3は、文書画像データDnの比較対象領域111,121に含まれる文字のうち、所定の大きさ(閾値)以下の文字の数をカウントし、その数を文字数Nnとする。また、文字認識部3は、文書画像データDnの比較対象領域111,121に含まれる文字のうち、大きさが最も小さい文字の数をカウントし、その数を文字数Nnとしてもよい。
【0029】
なお、文書20のフォーマットが決められており、文字認識処理の対象となる領域が予め決められている場合には、ユーザが比較対象領域を指定しなくてもよい。この場合、比較対象領域を示す座標情報を文字認識部3に予め設定しておき、文字認識部3は、文書画像データの所定領域(比較対象領域)に対して文字認識処理を行うことにより、比較対象領域に含まれる文字の数をカウントする。例えば仕様書等の文書ではフォーマットが決まっていることがあるため、予め設定された領域に対して文字認識処理を行うことにより、ユーザの手間を省くことが可能となる。
【0030】
比較部4は、文字認識部3によってカウントされた文字数に基づいて出力対象の文書画像データを決定し、決定された文書画像データを出力部10に出力する。具体的には、比較部4は、最高解像度X1で読み取られた基準文書画像データD1の基準文字数N1と、最高解像度X1よりも低い解像度Xn(n=2,3,4,5のいずれか)で読み取られた文書画像データDnの文字数Nnとを比較し、文字数N1と文字数Nnとの大小関係に基づいて出力対象の文書画像データを決定する。
【0031】
例えば、比較部4は、文字数Nnと基準文字数N1とを比較して、基準文字数N1との文字数の差が予め設定された許容範囲に含まれる解像度Xnのうちの最低の解像度を決定し、その最低の解像度で読み取られた文書画像データを出力部10に出力する。許容範囲を示す情報は、比較部4に予め記憶されていてもよいし、ユーザが操作部8を用いて許容範囲を示す情報を入力してもよい。一例として許容範囲がゼロの場合、比較部4は、文字数Nnが基準文字数N1と等しくなる解像度Xnのうちの最低の解像度を特定し、その最低の解像度で読み取られた文書画像データを出力部10に出力する。換言すると、比較部4は、文字数Nnが基準文字数N1よりも少なくなる解像度Xnのうちの最高の解像度を特定し、その特定された最高の解像度よりも1つ高い解像度で読み取られた文書画像データを出力部10に出力する。
【0032】
解像度変更部5は、読取部2における解像度を変更する。本実施形態では、解像度変更部5は、比較部4による比較結果に応じて解像度の変更を行う。解像度変更部5は、解像度を示す解像度情報を制御部6に出力する。解像度変更部5の詳細な機能については、後述する。
【0033】
制御部6は、読取部2の動作を制御する。例えば、制御部6は、読取部2の解像度の設定を行う。また、制御部6は、読取部2の読み取り動作の開始及び停止を制御する。また、読取部2に自動給紙機構が設けられている場合には、制御部6は自動給紙機構の制御を行ってもよい。
【0034】
出力部10は、読取部2によって生成された文書画像データを表示したり、記憶したり、文書読取装置1の外部に出力したりする。例えば、出力部10は表示装置によって構成されており、生成された文書画像データを表示してもよい。または、出力部10は記憶装置で構成されており、生成された文書画像データを記憶してもよい。または、出力部10は紙等に印刷を行うプリンタで構成されており、生成された文書画像データに基づく文書画像を紙等に印刷してもよい。または、出力部10は、ネットワークインターフェース等の通信装置で構成されており、生成された文書画像データを文書読取装置1の外部に送信してもよい。
【0035】
なお、文字認識部3、比較部4、解像度変更部5、及び制御部6は、例えばハードウェア資源とソフトウェアとの協働により実現されてもよい。具体的には、文字認識部3、比較部4、解像度変更部5、及び制御部6のそれぞれ機能は、記憶媒体に記憶された文字認識プログラム、比較プログラム、解像度変更プログラム、及び制御プログラムがメインメモリに読み出されてCPU(Central Processing Unit)により実行されることによって実現される。文字認識プログラム、比較プログラム、解像度変更プログラム、及び制御プログラムは、コンピュータ読み取り可能な記憶媒体に記憶されて提供されることも可能であるし、データ通信として通信により提供されることも可能である。ただし、文字認識部3、比較部4、解像度変更部5、及び制御部6は、ハードウェアで実現されてもよい。また、文字認識部3、比較部4、解像度変更部5、及び制御部6は、物理的に1つの装置により実現されてもよいし、複数の装置により実現されてもよい。
【0036】
次に図3を参照して、本実施形態に係る文書読取装置1による動作について説明する。図3は、本実施形態に係る文書読取装置による動作を示すフローチャートである。まず、動作の概要について説明する。文書読取装置1は、最高解像度X1で文書20を読み取って基準文字数N1を取得し、最高解像度X1から解像度を徐々に下げていき、文字数Nnと基準文字数N1との差が許容範囲に含まれなくなる最初の解像度Xnを特定し、その解像度Xnよりも1つ高い解像度で読み取られた文書画像データを出力する。すなわち、文書読取装置1は、文字数Nnと基準文字数N1との差が許容範囲に含まれる解像度で読み取られた文書画像データのうち、最も低い解像度で読み取られた文書画像データを出力する。一例として許容範囲がゼロの場合には、文書読取装置1は、最高解像度X1で文書20を読み取って基準文字数N1を取得し、最高解像度X1から解像度を徐々に下げていき、文字数Nnが基準文字数N1よりも少なくなる最初の解像度Xnを特定し、その解像度Xnよりも1つ高い解像度で読み取られた文書画像データを出力する。すなわち、文書読取装置1は、文字数が基準文字数N1と等しくなる解像度で読み取られた文書画像データのうち、最も低い解像度で読み取られた文書画像データを出力する。以下、一例として許容範囲がゼロの場合の動作について説明する。
【0037】
まず、制御部6は、解像度の初期値を読取部2に設定する。この初期値は、読取部2の最高解像度X1(例えば800dpi)である。読取部2は、最高解像度X1で文書20の画像を読み取って基準文書画像データD1を生成する(ステップS01)。読取部2は、文字認識部3とユーザインターフェース(UI)7とに基準文書画像データD1を出力する。
【0038】
表示部9は、読取部2から出力された基準文書画像データD1に基づく基準文書画像を表示する(ステップS02)。例えば図2に示すように、表示部9は、基準文書画像100を表示する。
【0039】
次に、ユーザは操作部8を用いて、表示部9に表示されている基準文書画像100上で、文字の可読性評価の対象となる比較対象領域を指定する(ステップS03)。例えば、ユーザは操作部8を用いて、システム構成図110に対して比較対象領域111を指定し、中央監視機器機能表120に対して比較対象領域121を指定する。システム構成図と中央監視機器機能表とには、機器の名称を示す文字列と機能を説明するための文字列とが含まれている。このような名称や説明文等を示す文字が潰れたりかすれたりして判読が困難になることは、ユーザにとって望ましくない。本実施形態では、判読が困難になっては特に困る領域(比較対象領域111,121)をユーザが指定するようにし、その比較対象領域111,121に含まれる文字の数に基づいて、出力対象の文字画像データを決定する。ユーザによって指定された比較対象領域111,121の位置を示す座標情報が、ユーザインターフェース(UI)7から文字認識部3に出力される。
【0040】
文字認識部3は、読取部2から出力された基準文書画像データD1の比較対象領域111,121内における文書画像データに対して文書認識処理を行うことにより、基準文書画像データD1のうちの比較対象領域111,121に含まれる文字を認識する。本実施形態では、文字認識部3は、比較対象領域111,121に含まれる文字のうち、所定の大きさ(閾値)以下の文字の数をカウントし、その数を基準文字数N1とする(ステップS04)。小さい文字は、潰れやすかったりかすれやすかったりするため、判読し難くなる小さい文字の数を比較対象とする。文字認識部3は、基準文字数N1を示す基準文字数データを比較部4に出力する。なお、文字認識部3は、予め設定された比較対象領域に文字認識処理を行うことにより、比較対象領域に含まれる文字の数をカウントしてもよい。
【0041】
次に、解像度変更部5は、読取部2の解像度を変更する(ステップS05)。本実施形態では、解像度変更部5は、読取部2の解像度を、直前に実行された読み取り動作の解像度よりも1つ低い解像度に変更し、変更後の解像度を示す解像度情報を制御部6に出力する。この時点では、直前に実行された読み取り動作の解像度は最高解像度X1であるため、解像度変更部5は、読取部2の解像度を、最高解像度X1よりも1つ低い解像度X2(600dpi)に変更し、解像度X2を示す解像度情報を制御部6に出力する。
【0042】
制御部6は、読取部2の解像度を解像度X2に設定し、読取部2にセットされている文書20を再度、読み取るよう指示する。読取部2は、解像度X2で文書20の画像を読み取って文書画像データD2を生成する(ステップS06)。読取部2は、文字認識部3に文書画像データD2を出力する。
【0043】
そして、文字認識部3は、読取部2から出力された文書画像データD2の比較対象領域111,121内における文書画像データに対して文字認識処理を行うことにより、文書画像データD2のうちの比較対象領域111,121に含まれる文字を認識する。本実施形態では、文字認識部3は、比較対象領域111,121に含まれる文字のうち、所定の大きさ(閾値)以下の文字の数をカウントし、その数を文字数N2とする(ステップ07)。文字認識部3は、文字数N2を示す文字数データを比較部4に出力する。
【0044】
比較部4は、基準文字数N1と文字数N2とを比較する(ステップS08)。
【0045】
文字数N2が基準文字数N1よりも少ない場合(ステップS08,Yes)、比較部4は、解像度X2よりも1つ高い解像度で読み取られた文書画像データを出力部10に出力し、出力部10はその文書画像データを出力する(ステップS09)。この時点では、解像度X2よりも1つ高い解像度は最高解像度X1であるため、比較部4は、最高解像度X1で読み取られた基準文書画像データD1を出力部10に出力する。出力部10は、基準文書画像データD1を出力する。これにより処理は終了する。
【0046】
文字数N2が基準文字数N1よりも少ないということは、解像度X2で読み取られた文書画像データD2では、文字の判読が可能な程度の画質が維持されていないことを意味している。すなわち、解像度X2は、文字の判読に十分な解像度ではないということになる。従って、比較部4は、解像度X2よりも高い最高解像度X1で読み取られた基準文書画像データD1を出力部10に出力する。
【0047】
一方、文字数N2が基準文字数N1よりも少なくない場合(ステップS08,No)、処理はステップS05に戻る。すなわち、文字数N2が基準文字数N1と等しい場合には、処理はステップS05に戻る。そして、解像度変更部5は、読取部2の解像度を、直前に実行された読み取り動作の解像度よりも1つ低い解像度に変更し(ステップS05)、変更後の解像度を示す解像度情報を制御部6に出力する。この時点では、読取部2により直前に実行された読み取り動作の解像度は解像度X2であるため、解像度変更部5は、読取部2の解像度を、解像度X2よりも1つ低い解像度X3(400dpi)に変更し、解像度X3を示す解像度情報を制御部6に出力する。
【0048】
文字数N2が基準文字数N1と等しいということは、解像度X2で読み取られた文書画像データD1では、文字の判読が可能な程度の画質が維持されていることを意味している。すなわち、解像度X2は、文字の判読に十分な解像度であるということになる。しかしながら、解像度X2は、文字の判読が可能な最低限の解像度であるか不明であるため、解像度を解像度X3に下げてステップS06〜S08の処理を実行する。
【0049】
読取部2は、制御部6の制御の下、解像度X3で文書の画像を読み取って文書画像データD3を生成し(ステップS06)、文字認識部3に文書画像データD3を出力する。
【0050】
文字認識部3は、読取部2から出力された文書画像データD3の比較対象領域111,121内における文書画像データに対して文字認識処理を行う。本実施形態では、文字認識部3は、比較対象領域111,121に含まれる文字のうち、所定の大きさ(閾値)以下の文字の数をカウントし、その数を文字数N3とする(ステップS07)。文字認識部3は、文字数N3を示す文字数データを比較部4に出力する。
【0051】
比較部4は、基準文字数N1と文字数N3とを比較する(ステップS08)。
【0052】
文字数N3が基準文字数N1よりも少ない場合(ステップS08,Yes)、比較部4は、解像度X3よりも1つ高い解像度で読み取られた文書画像データを出力部10に出力する。この時点では、解像度X3よりも1つ高い解像度は解像度X2であるため、比較部4は、解像度X2で読み取られた文書画像データD2を出力部10に出力する。出力部10は、文書画像データD2を出力する(ステップS09)。これにより処理は終了する。
【0053】
文字数N3が基準文字数N1よりも少ないということは、解像度X3は、文字の判読に十分な解像度ではないということになる。従って、比較部4は、解像度X3よりも1つ解像度が高い解像度X2で読み取られた文書画像データD2を出力部10に出力する。これにより、解像度X2は、文字の判読が可能な最低限の解像度ということになる。
【0054】
一方、文字数N3が基準文字数N1よりも少なくない場合(ステップS08,No)、処理はステップS05に戻る。すなわち、文字数N3が基準文字数N1と等しい場合には、処理はステップS05に戻る。解像度変更部5は、読取部2の解像度を、直前に実行された読み取り動作の解像度X3よりも1つ低い解像度X4に変更する(ステップS05)。そして、上述したように、ステップS06〜S08の処理が実行される。以降、文字数Nnが基準文字数N1よりも少なくなるまで、ステップS05〜S08の処理を繰り返して実行する。読取部2の解像度を最低の解像度X5まで下げても文字数N5が基準文字数N1よりも少なくならない場合には、比較部4は、最低の解像度X5で読み取られた文書画像データD5を出力部10に出力する。解像度X5は、文字の判読が可能な最低限の解像度ということになる。以上のように、本実施形態に係る文書読取装置1は、カウントされた文字数が基準文字数N1よりも少なくなるまで、読取部2の解像度を下げて読み取り動作を繰り返す。
【0055】
なお、上述した動作例では、許容範囲がゼロの場合について説明したが、文字数Nnと基準文字数N1との差が許容範囲に含まれるか否かによって、出力対象の文字画像データを決定してもよい。この場合、ステップS08において、比較部4が、文字数Nnと基準文字数N1とを比較する。文字数Nnと基準文字数N1との差が許容範囲に含まれない場合には(ステップS08,Yes)、処理はステップS09に進む。一方、文字数Nnと基準文字数N1との差が許容範囲に含まれる場合には(ステップS08,No)、処理はステップS05に戻り、ステップS05〜S08の処理が実行される。
【0056】
以上の処理を行う文書読取装置1によると、文字の判読が可能な最低限の解像度で文書20を読み取って文書画像データを生成することができる。そのことにより、文字の判読が可能な文書画像データのなかで、容量が最小となる文書画像データを生成して出力することができる。また、本実施形態に係る文書読取装置1は、判読が困難になっては特に困る領域(比較対象領域)の指定をユーザから受けて、その比較対象領域に含まれる文字のうち所定の大きさ(閾値)以下の文字の数をカウントし、その文字数に基づいて出力対象の文書画像データを決定する。そのことにより、判読が困難になっては特に困る領域に含まれる小さい文字を判読することが可能な最低限の解像度を決定し、その最低限の解像度で文書20を読み取って文書画像データを生成することができる。その結果、判読が困難になっては困る領域に含まれる小さい文字の判読が可能な文書画像データが得られる。
【0057】
また、別の例として、文書読取装置1は、最高解像度X1で文書20を読み取って基準文字数N1を取得し、最低の解像度(例えば解像度X5)から解像度を徐々に上げていき、文字数Nnと基準文字数N1との差が許容範囲に含まれる最初の解像度Xnを特定し、その解像度Xnで読み取られた文書画像データを出力するようにしてもよい。一例として許容範囲がゼロの場合には、文書読取装置1は、文字数Nnが基準文字数N1と等しくなる最初の解像度Xnを特定し、その解像度Xnで読み取られた文書画像データを出力する。このように、最低の解像度から解像度を徐々に上げて処理を行っても、上述した実施形態と同様に、文字の判読が可能な最低限の解像度で文書20を読み取って文書画像データを生成することができる。
【0058】
また、文字には、漢字、ひらがな、カタカナ、アルファベット、数字等の種類がある。文字の種類によっては、スキャナの解像度が同じであっても文書画像上において判読が容易な文字もあれば、判読が困難な文字もある。そこで、文字認識部3は、指定された種類の文字の数をカウントして、基準文字数N1及び文字数Nnを求めてもよい。例えば、ユーザが操作部8を用いて文字の種類を指定すると、文字認識部3は、指定された種類の文字の数をカウントする。一例として、潰れたりこすれたりして読み難くなりやすい漢字の数をカウントすることにより、漢字の判読が可能な最低限の解像度で文書20を読み取って文書画像データを生成することができる。
【0059】
なお、上述した実施形態では、解像度を変えるたびに読取部2が文書20を読み取り、その後、文字認識部3及び比較部4による処理が行われているが、すべての解像度X1〜X5で文書20を一旦読み取ってもよい。この場合、文書読取装置1は、すべての解像度X1〜X5で文書20を読み取り、基準文字数N1と文字数N1〜N5とを比較し、文字数Nnと基準文字数N1との差が許容範囲に含まれる解像度で読み取られた文書画像データのうち、最も低い解像度で読み取られた文書画像データを出力するようにしてもよい。このようにすべての解像度X1〜X5で文書20を一旦読み取ってしまっても、上述した実施形態と同様に、文字の判読が可能で容量が最小の文書画像データを出力することができる。
【0060】
[二分検索法を用いた処理方法]
本実施形態に係る文書読取装置1は、二分検索法によって文字の判読が可能な最低限の解像度を決定してもよい。この場合、解像度変更部5は、複数の異なる解像度の中央の解像度を、読取部2に設定する解像度に決定する。二分検索法を用いた解像度の決定方法について具体例を挙げて説明する。読取部2に設定可能な解像度を、一例として解像度が高い順から、解像度X1,X2,X3,X4,X5,X6,X7とする。
【0061】
上述した実施形態と同様に、制御部6は、最高解像度X1を読取部2に設定する。読取部2は、最高解像度X1で文書20の画像を読み取って基準文書画像データD1を生成する。そして、文字認識部3は、基準文書画像データD1の比較対象領域111,121に含まれる文字のうち、所定の大きさ(閾値)以下の文字の数をカウントし、その数を基準文字数N1とする。
【0062】
次に、解像度変更部5は、解像度X1〜X7を解像度の検索範囲とし、解像度X1〜X7の中央値の解像度X4を選択する。制御部6は、読取部2の解像度を解像度X4に設定し、読取部2は、解像度X4で文書20の画像を読み取って文書画像データD4を生成する。そして、文字認識部3は、文書画像データD4の比較対象領域111,121に含まれる文字のうち、所定の大きさ(閾値)以下の文字の数をカウントし、その数を文字数N4とする。比較部4は、基準文字数N1と文字数N4とを比較する。
【0063】
(A1:基準文字数N1と文字数N4との差が許容範囲に含まれない場合)
基準文字数N1と文字数N4との差が許容範囲に含まれない場合には、解像度変更部5は、解像度の検索範囲を解像度X1〜X3に変えて、解像度X1〜X3の中央値の解像度X2を選択する。基準文字数N1と文字数N4との差が許容範囲に含まれないということは、解像度X4は、文字の判読に十分な解像度ではないことを意味している。従って、解像度変更部5は、解像度X4よりも高い解像度X1〜X3を検索範囲とし、解像度X1〜X3の中央値の解像度X2を選択する。一例として許容範囲がゼロの場合において、文字数N4が基準文字数N1よりも少ない場合には、解像度変更部5は、解像度X1〜X3の中央値の解像度X2を選択する。そして、読取部2は、解像度X2で文書20を読み取って文書画像データD2を生成する。また、文字認識部3は、文書画像データD2の文字数N2をカウントする。
【0064】
(A1−1:基準文字数N1と文字数N2との差が許容範囲に含まれない場合)
基準文字数N1と文字数N2との差が許容範囲に含まれない場合には、比較部4は、最高解像度X1で読み取られた基準文書画像データD1を出力部10に出力する。基準文字数N1と文字数N2との差が許容範囲に含まれないということは、解像度X2が、文字の判読に十分な解像度ではないことを意味している。従って、比較部4は、最高解像度X1で読み取られた基準文書画像データD1を出力部10に出力する。これにより、文字の判読が可能な最低限の解像度で読み取られた文書画像データが、出力部10に出力されることになる。この例では、最高解像度X1以外の解像度X2〜X7は、文字の判読に十分な解像度ではないと判定され、最高解像度X1で読み取られた文書画像データが、最低限の解像度で読み取られた文書画像データに該当することになる。一例として許容範囲がゼロの場合において、文字数N2が基準文字数N1よりも少ない場合には、比較部4は、最高解像度X1で読み取られた基準文書画像データD1を出力部10に出力する。
【0065】
(A1−2:基準文字数N1と文字数N2との差が許容範囲に含まれる場合)
一方、基準文字数N1と文字数N2との差が許容範囲に含まれる場合には、解像度変更部5は、解像度X2よりも低く解像度X4よりも高い解像度X3を選択する。基準文字数N1と文字数N2との差が許容範囲に含まれるということは、解像度X2は、文字の判読に十分な解像度であることを意味している。しかしながら、解像度X2は、文字の判読が可能な最低限の解像度であるか不明であるため、解像度変更部5は、解像度X2よりも低く解像度X4よりも高い解像度X3を選択する。一例として許容範囲がゼロの場合において、文字数N2が基準文字数N1と等しい場合には、解像度変更部5は、解像度X2よりも低く解像度X4よりも高い解像度X3を選択する。そして、読取部2及び文字認識部3は、上述した処理を繰り返す。
【0066】
(A1−2−1:基準文字数N1と文字数N3との差が許容範囲に含まれない場合)
基準文字数N1と文字数N3との差が許容範囲に含まれない場合には、比較部4は、解像度X2で読み取られた文書画像データD2を出力部10に出力する。基準文字数N1と文字数N3との差が許容範囲に含まれないということは、解像度X3は、文字の判読に十分な解像度ではないことを意味している。一方で、解像度X2は、文字の判読に十分な解像度であると判定されているため、比較部4は、解像度X2で読み取られた文書画像データD2を出力部10に出力する。これにより、文書の判読が可能な最低限の解像度X2で読み取られた文書画像データD2が、出力部10に出力される。一例として許容範囲がゼロの場合において、文字数N3が基準文字数N1よりも少ない場合には、比較部4は、解像度X2で読み取られた文書画像データD2を出力部10に出力する。
【0067】
(A1−2−2:基準文字数N1と文字数N3との差が許容範囲に含まれる場合)
一方、基準文字数N1と文字数N3との差が許容範囲に含まれる場合には、比較部4は、解像度X3で読み取られた文書画像データD3を出力部10に出力する。これにより、文書の判読が可能な最低限の解像度X3で読み取られた文書画像データD3が、出力部10に出力される。一例として許容範囲がゼロの場合において、文字数N3が基準文字数N1と等しい場合には、比較部4は、解像度X3で読み取られた文書画像データD3を出力部10に出力する。
【0068】
(A2:基準文字数N1と文字数N4との差が許容範囲に含まれる場合)
基準文字数N1と文字数N4との差が許容範囲に含まれる場合には、解像度変更部5は、解像度の検索範囲を解像度X5〜X7に変えて、解像度X5〜X7の中央値の解像度X6を選択する。基準文字数N1と文字数N4との差が許容範囲に含まれるということは、解像度X4は、文字の判読に十分な解像度であることを意味している。しかしながら、解像度X4は、文字の判読に可能な最低限の解像度であるか不明であるため、解像度変更部5は、解像度X4よりも低い解像度X5〜X7を検索範囲とし、解像度X5〜X7の中央値の解像度X6を選択する。一例として許容範囲がゼロの場合において、文字数N4が基準文字数N1と等しい場合には、解像度変更部5は、解像度X5〜X7の中央値の解像度X6を選択する。そして、読取部2は解像度X6で文書20を読み取って文書画像データD6を生成する。また、文字認識部3は、文書画像データD6の文字数N6をカウントする。
【0069】
(A2−1:基準文字数N1と文字数N6との差が許容範囲に含まれない場合)
基準文字数N1と文字数N6との差が許容範囲に含まれない場合には、解像度変更部5は、解像度X4よりも低く解像度X6よりも高い解像度X5を選択する。基準文字数N1と文字数N6との差が許容範囲に含まれないということは、解像度X6は、文字の判読に十分な解像度ではないことを意味している。従って、解像度変更部5は、解像度X4よりも低く解像度X6よりも高い解像度X5を選択する。一例として許容範囲がゼロの場合において、文字数N6が基準文字数N1よりも少ない場合には、解像度変更部5は、解像度X4よりも低く解像度X6よりも高い解像度X5を選択する。そして、読取部2及び文字認識部3は、上述した処理を繰り返す。
【0070】
(A2−1−1:基準文字数N1と文字数N5との差が許容範囲に含まれない場合)
基準文字数N1と文字数N5との差が許容範囲に含まれない場合には、比較部4は、解像度X4で読み取られた文書画像データD4を出力部10に出力する。基準文字数N1と文字数N5との差が許容範囲に含まれないということは、解像度X5は、文字の判読に十分な解像度ではないことを意味している。一方で、解像度X4は、文字の判読に十分な解像度であると判定されているため、比較部4は、解像度X4で読み取られた文書画像データD4を出力部10に出力する。これにより、文字の判読が可能な最低限の解像度X4で読み取られた文書画像データD4が、出力部10に出力される。一例として許容範囲がゼロの場合において、文字数N5が基準文字数N1よりも少ない場合には、比較部4は、解像度X4で読み取られた文書画像データD4を出力部10に出力する。
【0071】
(A2−1−2:基準文字数N1と文字数N5との差が許容範囲に含まれる場合)
一方、基準文字数N1と文字数N5との差が許容範囲に含まれる場合には、比較部4は、解像度X5で読み取られた文書画像データD5を出力部10に出力する。これにより、文字の判読が可能な最低限の解像度X5で読み取られた文書画像データD5が、出力部10に出力される。一例として許容範囲がゼロの場合において、文字数N5が基準文字数N1と等しい場合には、比較部4は、解像度X5で読み取られた文書画像データD5を出力部10に出力する。
【0072】
(A2−2:基準文字数N1と文字数N6との差が許容範囲に含まれる場合)
一方、基準文字数N1と文字数N6との差が許容範囲に含まれる場合には、解像度変更部5は、解像度X7を選択する。基準文字数N1と文字数N6との差が許容範囲に含まれるこということは、解像度X6は、文字の判読に十分な解像度であることを意味している。しかしながら、解像度X6は、文字の判読に可能な最低限の解像度であるか不明であるため、解像度変更部5は、解像度X6よりも低い解像度X7(最低の解像度)を選択する。一例として許容範囲がゼロの場合において、文字数N6が基準文字数N1と等しい場合には、解像度変更部5は解像度X7を選択する。そして、読取部2及び文字認識部3は、上述した処理を繰り返す。
【0073】
(A2−2−1:基準文字数N1と文字数N7との差が許容範囲に含まれない場合)
基準文字数N1と文字数N7との差が許容範囲に含まれない場合には、比較部4は、解像度X6で読み取られた文書画像データD6を出力部10に出力する。基準文字数N1と文字数N7との差が許容範囲に含まれないということは、解像度X7は、文字の判読に十分な解像度ではないことを意味している。一方で、解像度X6は、文字の判読に十分な解像度であると判定されているため、比較部4は、解像度X6で読み取られた文書画像データD6を出力部10に出力する。これにより、文字の判読が可能な最低限の解像度X6で読み取られた文書画像データD6が、出力部10に出力される。一例として許容範囲がゼロの場合において、文字数N7が基準文字数N1よりも少ない場合には、比較部4は、解像度X6で読み取られた文書画像データD6を出力部10に出力する。
【0074】
(A2−2−2:基準文字数N1と文字数N7との差が許容範囲に含まれる場合)
一方、基準文字数N1と文字数N7との差が許容範囲に含まれる場合には、比較部4は、解像度X7で読み取られた文書画像データD7を出力部10に出力する。これにより、文字の判読が可能な最低限の解像度X7で読み取られた文書画像データD7が、出力部10に出力される。この例では、読取部2に設定されるすべての解像度が、文字の判読に十分な解像度であると判定されている。この場合、すべての解像度のうちの最低の解像度X7で読み取られた文書画像データD7が、最低限の解像度で読み取られた文書画像データに該当することになる。一例として許容範囲がゼロの場合において、文字数N7が基準文字数N1と等しい場合には、比較部4は、解像度X7で読み取られた文書画像データD7を出力部10に出力する。
【0075】
以上のように、二分検索法を用いることにより、文字の判読が可能な最低限の解像度を効率的に決定して、その解像度で読み取られた文書画像データを出力することが可能となる。特に、読取部2に設定可能な解像度が細分化されて数が多い場合には、二分検索法を適用することにより、文字の判読が可能な最低限の解像度を効率的に決定することが可能となる。
【0076】
なお、上述した二分検索法の適用例では、読取部2に設定可能な解像度として解像度X1〜X7を例に挙げて説明したが、解像度の数は上記の例に限られない。解像度の数が上記の例で挙げた数よりも多くても少なくても、上記の例と同じ効果を奏することができる。
【符号の説明】
【0077】
1 文書読取装置、2 読取部、3 文字認識部、4 比較部、5 解像度変更部、6制御部、7 ユーザインターフェース、8 操作部、9 表示部、10 出力部、20 文書、100 基準文書画像、110 システム構成図、111,121 比較対象領域、120 中央監視機器機能表、130 参考図。

【特許請求の範囲】
【請求項1】
文書を最高解像度で読み取って基準文書画像データを生成し、前記最高解像度よりも低い複数の異なる解像度で前記文書を読み取って複数の文書画像データを生成する読取手段と、
前記基準文書画像データと前記複数の文書画像データとに対して文字認識処理を行い、前記基準文書画像データと前記複数の文書画像データとのそれぞれにおいて、操作者によって指定された領域に含まれる文字のうち所定の大きさ以下の文字の数をカウントする文字認識手段と、
前記基準文書画像データについてカウントされた基準文字数と、前記複数の文書画像データのそれぞれについてカウントされた文字数とを比較し、前記基準文字数との文字数の差が許容範囲に含まれる解像度で読み取られた文書画像データのうち、最も低い解像度で読み取られた文書画像データを出力する比較手段と、
を有することを特徴とする文書読取装置。
【請求項2】
請求項1に記載の文書読取装置であって、
前記読取手段は、前記最高解像度から順番に解像度を下げて前記文書を読み取ることにより、前記基準文書画像データと前記複数の文書画像データとを生成し、
前記比較手段は、解像度を下げて読み取りが行われるたびに生成された文書画像データの文字数と前記基準文字数とを比較し、前記基準文字数との文字数の差が前記許容範囲に含まれなくなる最初の解像度よりも1つ高い解像度で読み取られた文書画像データを出力する、
ことを特徴とする文書読取装置。
【請求項3】
請求項2に記載の文書読取装置であって、
前記比較手段は、解像度を下げて読み取りが行われるたびに生成された文書画像データの文字数と前記基準文字数とを比較し、文書画像データの文字数が前記基準文字数よりも少なくなる最初の解像度よりも1つ高い解像度で読み取られた文書画像データを出力する、
ことを特徴とする文書読取装置。
【請求項4】
請求項1に記載の文字読取装置であって、
前記文書画像データについてカウントされた文字数と前記基準文字数との差が前記許容範囲に含まれる場合には、前記読取手段の解像度を低下させ、前記文書画像データについてカウントされた文字数と前記基準文字数との差が前記許容範囲に含まれない場合には、前記読取手段の解像度を増加させる解像度変更手段を更に有し、
前記比較手段は、前記基準文字数との文字数の差が前記許容範囲に含まれる解像度で読み取られた文書画像データのうち、最も低い解像度で読み取られた文書画像データを出力する、
ことを特徴とする文書読取装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate


【公開番号】特開2012−222730(P2012−222730A)
【公開日】平成24年11月12日(2012.11.12)
【国際特許分類】
【出願番号】特願2011−89111(P2011−89111)
【出願日】平成23年4月13日(2011.4.13)
【出願人】(000236056)三菱電機ビルテクノサービス株式会社 (1,792)
【Fターム(参考)】