画像歪み補正装置、画像読取装置、画像形成装置、プログラム及び記憶媒体

【課題】スキャン画像内の文字サイズに関係なく画像の主走査方向の歪み補正における精度の高精度化を図る。
【解決手段】スキャン画像内の文字サイズに合わせて変更される閾値（第１閾値および第２閾値）を用いて抽出された黒画素ランを基に縦成分矩形を抽出し、縦成分矩形間の主走査方向および副走査方向の距離を基に文字行を抽出する。すなわち、文字サイズに合わせて閾値を変更する（例えば、英文画像のように文字が小さい場合にはランとして登録する時の長さの最小値を小さくする）ことで、確実に縦成分矩形を抽出できるようになり縦成分矩形の抽出漏れを防止するとともに、このようにして抽出された縦成分矩形を用いることで隣接する文字の接触を防止する。このような縦成分矩形から近似曲線を求めることにより、スキャン画像内の文字サイズに関係なく画像の主走査方向の歪み補正における精度の高精度化を図ることができる。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、書籍原稿画像を画像読取手段により読み取ったスキャン画像の歪みを補正する画像歪み補正装置、画像読取装置、画像形成装置、プログラム及び記憶媒体に関する。
【背景技術】
【０００２】
フラットベッドスキャナを用いて読み取る原稿の多くはシート状の原稿であり、コンタクトガラス上に開閉自在の圧板を設け、コンタクトガラス上に原稿を載置した後に圧板を閉じて原稿をスキャンするようにしている。しかし、原稿としてはシート状のものに限られず、書籍原稿（本、冊子など）も原稿として扱われることがあり、そのような場合にもコンタクトガラス上に書籍原稿を載置し、原稿をスキャンすることになる。
【０００３】
ところが、原稿として書籍原稿を用いた場合には、図７１に示すように、書籍原稿１００のページ綴じ部１０１がコンタクトガラス１０２から浮き上がってしまう。このように書籍原稿１００のページ綴じ部１０１がコンタクトガラス１０２から浮き上がってしまった場合には、ページ綴じ部１０１が焦点面から離れてしまうため、浮き上がった部分のスキャン画像には、画像歪み、影、文字ぼけなどの画像劣化が発生する。劣化した画像のページ綴じ部１０１は読みにくく、ＯＣＲにより文字認識処理を行うときの認識率が著しく低下する。特に、厚手製本ではその割合が高く、また、書籍原稿１００のページ綴じ部１０１を焦点面から離れないように加圧作業した場合には、書籍原稿１００自体を破損してしまうこともある。
【０００４】
このような問題を解決すべく、画像の濃度情報から物体の３次元形状を推定する方法を用いて、画像の歪みを補正する方法が提案されている。このような画像の濃度情報から物体の３次元形状を推定する方法としては、非特許文献１に記載されているShape from Shadingと呼ばれる方法が代表的な例である。
【０００５】
また、特許文献１には、三角測量方式により書籍の形状を測定し、歪みを補正する方法が提案されている。
【０００６】
さらに、特許文献２には、読み取りスキャン画像のページ外形の形状を用いて書籍表面の３次元形状を推定する方法が提案されている。
【０００７】
しかしながら、前述したShape from Shadingと呼ばれる方法によれば、計算量が多く、歪み補正処理の計算時間が長いので、実用化は困難である。
【０００８】
また、特許文献１に記載されている方法によれば、三角測量方式により書籍の形状を測定するための特別な形状計測装置が必要になるため、適当ではない。
【０００９】
さらに、特許文献２に記載されている方法によれば、少ない計算量で歪み補正ができるが、ページ外形が画像中に完全に収まりきれずに途中で切れているような場合には有効な補正ができない。
【００１０】
そこで、本出願人は、ページ外形が途中で切れているような読み取りスキャン画像であっても、その歪みを少ない計算量で有効に補正することができる画像歪み補正装置を特願2002-247643にて提案している。特願2002-247643によれば、ページ外形だけではなく文字行情報および罫線情報を用いて画像の歪みを補正し、しかも、スキャナ（画像読取手段）の固有パラメータ（レンズの焦点面距離、スキャン光軸の位置（アドレス））を利用していないので、任意のスキャナの出力画像を補正できる。
【００１１】
【非特許文献１】T. Wada, H. Uchida and T. Matsuyama, “Shape from Shading with Interreflections under a Proximal Light Source: Distortion-Free Copying of an Unfolded Book”, International Journal Computer Vision 24（2）, 125-135（1997）
【特許文献１】特開平5-161002号公報
【特許文献２】特開平11-41455号公報
【発明の開示】
【発明が解決しようとする課題】
【００１２】
しかしながら、上述したようなページ外形が途中で切れているような読み取りスキャン画像であっても、その歪みを少ない計算量で有効に補正することができる画像歪み補正装置によれば、ページ外形ではなく、文字行情報および罫線情報を用いて画像の歪みを補正するようにしているが、まだ、完全とはいえず、解決されねばならない課題が存在する。
【００１３】
例えば、歪み補正するための手がかりとして文字行を利用する従来方式では、文字単位の矩形を抽出し、それらの矩形から主走査方向の補正では近似曲線を求めている。ところが、図７２に示すように、英文画像では、日本語で書かれた画像と異なりアルファベット文字で書かれているために文字のアスペクト比がさまざまであり、また、文字間の間隔が狭くなる場合もある。そのため、英文画像に対して矩形抽出を行うと、水平方向に隣接する文字同士が複数個接触し一つの矩形として抽出されてしまう場合がある。このように文字同士が複数個接触し一つの矩形として抽出された矩形を基に歪み補正を行うと、主走査方向の歪み補正に悪影響を及ぼすことがある。
【００１４】
より詳細には、主走査方向の歪み補正では、矩形抽出後、行統合して、行内の矩形から近似曲線を生成し、それを基に補正を行っている。そこで、文字同士が接触した矩形から行を生成しようとすると、図７３に示すように、複数分の行が一行と誤認識されやすく不適切な行が生成されることがある。そして、行統合した一行内にある実際に存在する文字数よりも矩形数が減る。そのため、一行内にある矩形の中心座標を基に生成される近似曲線は、不安定となってしまう問題点がある。
【００１５】
また、例えば、歪み補正するための手がかりとして文字行を利用する従来方式では、文字単位の矩形を抽出し、副走査方向の補正では矩形の縦横比（アスペクト比）から副走査方向変倍率を算出し補正を行っている。しかしながら、図７４に示すように、英文画像では、日本語で書かれた画像と異なりアルファベット文字で書かれているために文字のアスペクト比がさまざまであるため、副走査方向の歪み補正に悪影響を及ぼすことがある。
【００１６】
より詳細には、副走査方向の歪み補正では、矩形抽出後、文字外接矩形に関して、アスペクト比、即ち（文字の横辺の長さ）/（文字の縦辺の長さ）を利用する。歪んだ画像では、歪み領域と非歪み領域でこのアスペクト比が異なる。例えば、非歪み領域で、アスペクト比が１である矩形は、歪み領域では、一般に１以下の値となる。ここで、副走査方向の補正方式はまず、画像をページ綴じ部に平行な複数の短冊領域に分割する。そして、各短冊領域について、そこに含まれる文字外接矩形のアスペクト比の平均を求め、その算出したアスペクト比の平均を基に副走査方向変倍率を決定する。ところが、図７４（ａ）に示すように日本語で書かれた画像に関してはアスペクト比が１に近い文字が多いため、副走査方向の補正の精度は良好であったが、英語で書かれた画像に関しては問題が生じる。英文画像は、矩形抽出の際に文字同士が接触する矩形が多いことと、図７４（ｂ）に示すようにアルファベット文字のアスペクト比にもともとばらつきがあるため、文字外接矩形のアスペクト比から副走査方向変倍率を算出すると不適切な値になってしまうという問題点がある。
【００１７】
本発明は、スキャン画像内の文字サイズに関係なく画像の主走査方向の歪み補正における精度の高精度化を図ることができる画像歪み補正装置、画像読取装置、画像形成装置、プログラム及び記憶媒体を提供することを目的とする。
【００１８】
本発明は、スキャン画像内の文字サイズに関係なく画像の副走査方向の歪み補正における精度の高精度化を図ることができる画像歪み補正装置、画像読取装置、画像形成装置、プログラム及び記憶媒体を提供することを目的とする。
【課題を解決するための手段】
【００１９】
請求項１記載の発明の画像歪み補正装置は、画像読取手段の主走査方向に対してページ綴じ部がほぼ平行となるようにスキャン面の上もしくは下に接触した書籍原稿画像を前記画像読取手段により読み取ったスキャン画像の歪みを当該スキャン画像内の文字行の形状を基に補正する画像歪み補正装置において、前記スキャン画像内の文字のサイズを算出するサイズ算出手段と、算出した文字サイズに応じ、黒画素ランの抽出に用いる閾値を設定する第１の閾値設定手段と、前記スキャン画像から主走査方向に前記閾値の数の黒画素が連結する黒画素ランのみを抽出するラン抽出手段と、抽出した黒画素ランを基に縦成分のみの矩形を縦成分矩形として抽出する縦成分矩形抽出手段と、抽出した縦成分矩形間の主走査方向および副走査方向の距離を基に文字行を抽出する文字行抽出手段と、抽出した文字行の中から、前記スキャン画像の歪み補正に利用するための文字行を決定する文字行決定手段と、決定した文字行中に存在する各縦成分矩形を基に近似曲線を算出する近似曲線算出手段と、を備える。
【００２０】
したがって、スキャン画像内の文字サイズに合わせて変更される閾値を用いて抽出された黒画素ランを基に縦成分矩形が抽出され、縦成分矩形間の主走査方向および副走査方向の距離を基に文字行が抽出される。すなわち、文字サイズに合わせて閾値を変更する（例えば、英文画像のように文字が小さい場合にはランとして登録する時の長さの最小値を小さくする）ことで、確実に縦成分矩形を抽出できるようになり縦成分矩形の抽出漏れが防止されるとともに、このようにして抽出された縦成分矩形を用いることで隣接する文字の接触が防止される。このような縦成分矩形から近似曲線を求めることにより、スキャン画像内の文字サイズに関係なく画像の主走査方向の歪み補正における精度の高精度化を図ることが可能になる。
【００２１】
請求項２記載の発明は、請求項１記載の画像歪み補正装置において、前記サイズ算出手段により算出した文字サイズに応じ、縦成分矩形の主走査方向の長さを規定する第３閾値を設定する第２の閾値設定手段と、前記縦成分矩形抽出手段により抽出した縦成分矩形の主走査方向の長さが前記第３閾値以上の場合、当該縦成分矩形の長さを当該第３閾値の長さに縮める縮小手段と、を備える。
【００２２】
したがって、文字サイズに応じて縦成分矩形の主走査方向の長さを規定する第３閾値が設定され、縦成分矩形の主走査方向の長さが第３閾値以上の場合、当該縦成分矩形の長さが当該第３閾値の長さに縮められることにより、小さい文字の縦成分矩形を極端に短くすることを防止しつつ主走査方向に矩形が接触するのを防ぐことが可能になるので、複数分の行が一行と誤認識されやすいという事態が回避され、安定した行統合が可能になる。
【００２３】
請求項３記載の発明は、請求項１または２記載の画像歪み補正装置において、前記サイズ算出手段により算出した文字サイズに応じ、前記文字行抽出手段における文字行を抽出する際の主走査方向の統合距離である第４閾値を設定する第３の閾値設定手段を備え、前記文字行抽出手段は、前記第４閾値により規定された文字行を抽出する際の主走査方向の統合距離に従って文字行を抽出する。
【００２４】
したがって、文字行を抽出する際の主走査方向の統合距離である第４閾値が文字サイズに応じて設定され、第４閾値により規定された文字行を抽出する際の主走査方向の統合距離に従って文字行が抽出される。これにより、英語文のように日本語文に比べて主走査方向の矩形間距離が短くなるような場合には、行抽出時の主走査方向の統合距離である第４閾値を小さくすることで、過剰な行統合を回避することが可能になる。
【００２５】
なお、スキャン画像内の文字のサイズを算出するサイズ算出手段においては、請求項４記載の発明のように、前記スキャン画像中に前記文字サイズの算出を行うための領域を指定し、この指定領域内における標準的な文字の外接矩形を抽出し、抽出した文字の外接矩形の主走査方向における距離を前記文字サイズとして算出する。そして、前記スキャン画像のページ綴じ部を境にした左右両側に前記文字サイズの算出を行うための領域を指定した場合には、請求項５記載の発明のように、指定領域の何れかで前記文字サイズが算出されなかった場合、前記文字サイズが算出された側の前記文字サイズを採用し、請求項６記載の発明のように、指定領域の両方で前記文字サイズが算出されなかった場合、予め定められた一定の値を前記文字サイズとし、請求項７記載の発明のように、指定領域の両方で算出された前記文字サイズを比較し、小さい方の前記文字サイズを両方の前記文字サイズとして採用する。
【００２６】
また、抽出した文字行の中から、前記スキャン画像の歪み補正に利用するための文字行を決定する文字行決定手段においては、請求項８記載の発明のように、ページ綴じ部付近まで最も食い込んでいる矩形に包摂される罫線を前記スキャン画像の歪み補正に利用するための罫線と決定し、または、請求項９記載の発明のように、副走査方向の長さが最も長い矩形に包摂される罫線を前記スキャン画像の歪み補正に利用するための罫線と決定し、もしくは、請求項１０記載の発明のように、前記スキャン画像のページ外形に最も近い矩形に包摂される罫線を前記スキャン画像の歪み補正に利用するための罫線と決定する。また、請求項１１記載の発明のように、前記スキャン画像の歪み補正に利用するための罫線を、ページ綴じ部付近まで最も食い込んでいる矩形に包摂される罫線、副走査方向の長さが最も長い矩形に包摂される罫線、前記スキャン画像のページ外形に最も近い矩形に包摂される罫線の順に決定するようにしても良い。
【００２７】
請求項１２記載の発明は、請求項１ないし１１のいずれか一記載の画像歪み補正装置において、主走査方向の歪み補正後の各文字行内にて隣接する縦成分矩形の中心座標間の副走査方向の距離を矩形間距離として検出する距離検出手段と、主走査方向の歪み補正後の画像を主走査方向に平行な方向を長辺とする短冊状の複数の領域に分割し、各短冊領域内での矩形間距離の平均を基に非歪み領域と歪み領域で矩形間距離が同じになるような前記スキャン画像の短冊領域毎の副走査方向変倍率を算出する変倍率算出手段と、を備え、前記短冊領域の幅は、前記サイズ算出手段により算出した文字サイズに基づいて決定される。
【００２８】
したがって、文字サイズに基づいて短冊領域の幅が決定され、この幅に基づいて縦成分矩形の中心座標間の距離の平均が短冊単位で求められ、非歪み領域と歪み領域で矩形間距離が同じになるような副走査方向変倍率が算出される。すなわち、文字サイズに合わせて閾値を変更する（例えば、英文画像のように文字が小さい場合には短冊領域の幅を小さくする）ことで、短冊領域毎の副走査方向変倍率の精度を高精度にすることが可能になる。これにより、スキャン画像内の文字サイズに関係なく画像の副走査方向の歪み補正における精度の高精度化を図ることが可能になる。
【００２９】
請求項１３記載の発明の画像読取装置は、原稿画像を読み取る画像読取手段と、この画像読取手段により読み取られたスキャン画像の補正を行う請求項１ないし１２のいずれか一記載の画像歪み補正装置と、を備える。
【００３０】
したがって、請求項１ないし１２のいずれか一記載の発明と同様の作用を奏する画像読取装置が得られる。
【００３１】
請求項１４記載の発明の画像形成装置は、原稿画像を読み取る画像読取手段と、この画像読取手段により読み取られたスキャン画像の補正を行う請求項１ないし１２のいずれか一記載の画像歪み補正装置と、この画像歪み補正装置から出力される画像データに基づいた画像を用紙上に印刷する画像印刷装置と、を備える。
【００３２】
したがって、請求項１ないし１２のいずれか一記載の発明と同様の作用を奏する画像形成装置が得られる。
【００３３】
請求項１５記載の発明のプログラムは、画像読取手段の主走査方向に対してページ綴じ部がほぼ平行となるようにスキャン面の上もしくは下に接触した書籍原稿画像を前記画像読取手段により読み取ったスキャン画像の歪みを当該スキャン画像内の文字行の形状を基に補正する処理をコンピュータに実行させるプログラムであって、前記コンピュータに、前記スキャン画像内の文字のサイズを算出するサイズ算出機能と、算出した文字サイズに応じ、黒画素ランの抽出に用いる閾値を設定する第１の閾値設定機能と、前記スキャン画像から主走査方向に前記閾値の数の黒画素が連結する黒画素ランのみを抽出するラン抽出機能と、抽出した黒画素ランを基に縦成分のみの矩形を縦成分矩形として抽出する縦成分矩形抽出機能と、抽出した縦成分矩形間の主走査方向および副走査方向の距離を基に文字行を抽出する文字行抽出機能と、抽出した文字行の中から、前記スキャン画像の歪み補正に利用するための文字行を決定する文字行決定機能と、決定した文字行中に存在する各縦成分矩形を基に近似曲線を算出する近似曲線算出機能と、を実行させる。
【００３４】
したがって、スキャン画像内の文字サイズに合わせて変更される閾値を用いて抽出された黒画素ランを基に縦成分矩形が抽出され、縦成分矩形間の主走査方向および副走査方向の距離を基に文字行が抽出される。すなわち、文字サイズに合わせて閾値を変更する（例えば、英文画像のように文字が小さい場合にはランとして登録する時の長さの最小値を小さくする）ことで、確実に縦成分矩形を抽出できるようになり縦成分矩形の抽出漏れが防止されるとともに、このようにして抽出された縦成分矩形を用いることで隣接する文字の接触が防止される。このような縦成分矩形から近似曲線を求めることにより、スキャン画像内の文字サイズに関係なく画像の主走査方向の歪み補正における精度の高精度化を図ることが可能になる。
【００３５】
請求項１６記載の発明は、請求項１５記載のプログラムにおいて、前記サイズ算出機能により算出した文字サイズに応じ、縦成分矩形の主走査方向の長さを規定する第３閾値を設定する第２の閾値設定機能と、前記縦成分矩形抽出機能により抽出した縦成分矩形の主走査方向の長さが前記第３閾値以上の場合、当該縦成分矩形の長さを当該第３閾値の長さに縮める縮小機能と、を前記コンピュータに実行させる。
【００３６】
したがって、文字サイズに応じて縦成分矩形の主走査方向の長さを規定する第３閾値が設定され、縦成分矩形の主走査方向の長さが第３閾値以上の場合、当該縦成分矩形の長さが当該第３閾値の長さに縮められることにより、小さい文字の縦成分矩形を極端に短くすることを防止しつつ主走査方向に矩形が接触するのを防ぐことが可能になるので、複数分の行が一行と誤認識されやすいという事態が回避され、安定した行統合が可能になる。
【００３７】
請求項１７記載の発明は、請求項１５または１６記載のプログラムにおいて、前記サイズ算出機能により算出した文字サイズに応じ、前記文字行抽出機能における文字行を抽出する際の主走査方向の統合距離である第４閾値を設定する第３の閾値設定機能を前記コンピュータに実行させ、前記文字行抽出機能は、前記第４閾値により規定された文字行を抽出する際の主走査方向の統合距離に従って文字行を抽出する。
【００３８】
したがって、文字行を抽出する際の主走査方向の統合距離である第４閾値が文字サイズに応じて設定され、第４閾値により規定された文字行を抽出する際の主走査方向の統合距離に従って文字行が抽出される。これにより、英語文のように日本語文に比べて主走査方向の矩形間距離が短くなるような場合には、行抽出時の主走査方向の統合距離である第４閾値を小さくすることで、過剰な行統合を回避することが可能になる。
【００３９】
なお、スキャン画像内の文字のサイズを算出するサイズ算出手段においては、請求項１８記載の発明のように、前記スキャン画像中に前記文字サイズの算出を行うための領域を指定し、この指定領域内における標準的な文字の外接矩形を抽出し、抽出した文字の外接矩形の主走査方向における距離を前記文字サイズとして算出する。そして、前記スキャン画像のページ綴じ部を境にした左右両側に前記文字サイズの算出を行うための領域を指定した場合には、請求項１９記載の発明のように、指定領域の何れかで前記文字サイズが算出されなかった場合、前記文字サイズが算出された側の前記文字サイズを採用し、請求項２０記載の発明のように、指定領域の両方で前記文字サイズが算出されなかった場合、予め定められた一定の値を前記文字サイズとし、請求項２１記載の発明のように、指定領域の両方で算出された前記文字サイズを比較し、小さい方の前記文字サイズを両方の前記文字サイズとして採用する。
【００４０】
また、抽出した文字行の中から、前記スキャン画像の歪み補正に利用するための文字行を決定する文字行決定機能においては、請求項２２記載の発明のように、ページ綴じ部付近まで最も食い込んでいる矩形に包摂される罫線を前記スキャン画像の歪み補正に利用するための罫線と決定し、または、請求項２３記載の発明のように、副走査方向の長さが最も長い矩形に包摂される罫線を前記スキャン画像の歪み補正に利用するための罫線と決定し、もしくは、請求項２４記載の発明のように、前記スキャン画像のページ外形に最も近い矩形に包摂される罫線を前記スキャン画像の歪み補正に利用するための罫線と決定する。また、請求項２５記載の発明のように、前記スキャン画像の歪み補正に利用するための罫線を、ページ綴じ部付近まで最も食い込んでいる矩形に包摂される罫線、副走査方向の長さが最も長い矩形に包摂される罫線、前記スキャン画像のページ外形に最も近い矩形に包摂される罫線の順に決定するようにしても良い。
【００４１】
請求項２６記載の発明は、請求項１５ないし２５のいずれか一記載のプログラムにおいて、主走査方向の歪み補正後の各文字行内にて隣接する縦成分矩形の中心座標間の副走査方向の距離を矩形間距離として検出する距離検出機能と、主走査方向の歪み補正後の画像を主走査方向に平行な方向を長辺とする短冊状の複数の領域に分割し、各短冊領域内での矩形間距離の平均を基に非歪み領域と歪み領域で矩形間距離が同じになるような前記スキャン画像の短冊領域毎の副走査方向変倍率を算出する変倍率算出機能と、を前記コンピュータに実行させ、前記短冊領域の幅は、前記サイズ算出手段により算出した文字サイズに基づいて決定される。
【００４２】
したがって、文字サイズに基づいて短冊領域の幅が決定され、この幅に基づいて縦成分矩形の中心座標間の距離の平均が短冊単位で求められ、非歪み領域と歪み領域で矩形間距離が同じになるような副走査方向変倍率が算出される。すなわち、文字サイズに合わせて閾値を変更する（例えば、英文画像のように文字が小さい場合には短冊領域の幅を小さくする）ことで、短冊領域毎の副走査方向変倍率の精度を高精度にすることが可能になる。これにより、スキャン画像内の文字サイズに関係なく画像の副走査方向の歪み補正における精度の高精度化を図ることが可能になる。
【００４３】
請求項２７記載の発明の記憶媒体は、請求項１５ないし２６のいずれか一記載のプログラムを記憶する。
【００４４】
したがって、請求項１５ないし２６のいずれか一記載のプログラムを有体物の形態で取り扱うことが可能となる。
【発明の効果】
【００４５】
本発明によれば、スキャン画像内の文字サイズに合わせて変更される閾値を用いて抽出された黒画素ランを基に縦成分矩形を抽出し、縦成分矩形間の主走査方向および副走査方向の距離を基に文字行を抽出する。すなわち、文字サイズに合わせて閾値を変更する（例えば、英文画像のように文字が小さい場合にはランとして登録する時の長さの最小値を小さくする）ことで、確実に縦成分矩形を抽出できるようになり縦成分矩形の抽出漏れを防止するとともに、このようにして抽出された縦成分矩形を用いることで隣接する文字の接触を防止する。このような縦成分矩形から近似曲線を求めることにより、スキャン画像内の文字サイズに関係なく画像の主走査方向の歪み補正における精度の高精度化を図ることができる。
【００４６】
本発明によれば、文字サイズに基づいて短冊領域の幅を決定し、この幅に基づいて縦成分矩形の中心座標間の距離の平均を短冊単位で求め、非歪み領域と歪み領域で矩形間距離が同じになるような副走査方向変倍率を算出する。すなわち、文字サイズに合わせて閾値を変更する（例えば、英文画像のように文字が小さい場合には短冊領域の幅を小さくする）ことで、短冊領域毎の副走査方向変倍率の精度を高精度にすることができるので、スキャン画像内の文字サイズに関係なく画像の副走査方向の歪み補正における精度の高精度化を図ることができる。
【発明を実施するための最良の形態】
【００４７】
[第一の実施の形態]
本発明の第一の実施の形態を図１ないし図５６に基づいて説明する。本実施の形態の画像歪み補正装置は画像形成装置であるデジタル複写機に備えられており、画像読取装置としてはデジタル複写機のスキャナ部が適用されている。
【００４８】
ここで、図１はスキャナ部１の構成を示す縦断正面図である。図１に示すように、スキャナ部１は、原稿を載置するコンタクトガラス２と、原稿の露光用の露光ランプ３および第一反射ミラー４からなる第一走行体５と、第二反射ミラー６および第三反射ミラー７からなる第二走行体８と、原稿の画像を読み取る撮像素子としてのＣＣＤ（Charge Coupled Device）９と、このＣＣＤ９に結像させるためのレンズユニット１０と、原稿を載置する基準になるとともにコンタクトガラス２のズレや外れを防止する原稿スケール１１と、この原稿スケール１１の下側に設置されたシェーディング補正用の白基準板１２と、フレーム１４とを備えている。ＣＣＤ９はセンサボード１３上に形成されている。
【００４９】
原稿の走査時には、第一走行体５および第二走行体８はステッピングモータ２４（図３参照）によって副走査方向に移動する。すなわち、第一走行体５および第二走行体８がコンタクトガラス２の下を走行して、露光ランプ３で原稿を露光走査し、その反射光を第一反射ミラー４、第二反射ミラー６および第三反射ミラー７で反射して、レンズユニット１０を通してＣＣＤ９に結像させる。ここに、画像読取手段が実現されている。
【００５０】
このようなスキャナ部１は、このスキャナ部１で読み取られた原稿の画像に基づく画像データに応じ、例えば電子写真方式で用紙上に画像の形成を行う画像印刷装置であるプリンタ部（図示せず）を備えるデジタル複写機１６に搭載されている。図２は、スキャナ部１を搭載したデジタル複写機１６の上部部分を示す斜視図である。図２に示すように、スキャナ部１には、コンタクトガラス２に対して開閉自在な圧板１７と、この圧板１７の開閉を検出する開閉センサ１８とが設けられている。なお、デジタル複写機１６に備えられるプリンタとしては、電子写真方式のほか、インクジェット方式、昇華型熱転写方式、銀塩写真方式、直接感熱記録方式、溶融型熱転写方式など、種々の印刷方式を適用することができる。その具体的な構成については周知であるため、詳細な説明は省略する。
【００５１】
図３は、スキャナ部１の制御系の電気的な接続を示すブロック図である。図３に示すように、この制御系は、スキャナ部１の全体を制御するメイン制御部１９に、ＣＣＤ９で読み取った画像データに各種の画像処理を施す回路である画像処理部２０と、第一走行体５および第二走行体８を制御する回路である走行体制御部２１と、デジタル複写機１６への各種操作を受け付け、また、各種メッセージを表示する操作パネル２２と、ＣＣＤ９で読み取った画像データや所定のデータ等を記憶するメモリ２３とが接続されている。なお、操作パネル２２には、コピー開始を宣言するためのコピースタートキー等が設けられている。また、走行体制御部２１には、露光ランプ３と、第一走行体５および第二走行体８を駆動するステッピングモータ２４と、第一走行体５および第二走行体８がホームポジションにあるか否かを検出するスキャナホームポジションセンサ（ＨＰセンサ）２５と、開閉センサ１８とが接続されている。
【００５２】
ここで、図４は画像処理部２０の基本的な内部構成を示すブロック図である。図４に示すように、画像処理部２０は、原稿をＣＣＤ９により読み取ったアナログ画像信号の増幅処理やデジタル変換処理等を行うアナログビデオ処理部２６、シェーディング補正処理を行うシェーディング補正処理部２７、シェーディング補正処理後のデジタル画像信号に、ＭＴＦ補正、変倍処理、γ補正等の各種画像データ処理を行いスキャン画像を生成する画像データ処理部２８から構成されている。以上のような画像処理後のデジタル画像信号は、メイン制御部１９を介してプリンタ部に送信されて、画像形成に供される。
【００５３】
メイン制御部１９は、図５に示すように、各部を集中的に制御するＣＰＵ（Central Processing Unit）３１を備えており、このＣＰＵ３１には、ＢＩＯＳなどを記憶した読出し専用メモリであるＲＯＭ（Read Only Memory）３２と、各種データを書換え可能に記憶してＣＰＵ３１の作業エリアとして機能するＲＡＭ（Random Access Memory）３３とがバス３４で接続されており、マイクロコンピュータを構成している。さらにバス３４には、制御プログラムが記憶されたＨＤＤ３５と、ＣＤ（Compact Disc）−ＲＯＭ３７を読み取るＣＤ−ＲＯＭドライブ３６と、プリンタ部等との通信を司るインタフェース（Ｉ／Ｆ）３８とが接続されている。
【００５４】
図５に示すＣＤ−ＲＯＭ３７は、この発明の記憶媒体を実施するものであり、所定の制御プログラムが記憶されている。ＣＰＵ３１は、ＣＤ−ＲＯＭ３７に記憶されている制御プログラムをＣＤ−ＲＯＭドライブ３６で読み取り、ＨＤＤ３５にインストールする。これにより、メイン制御部１９は、後述するような各種の処理を行うことが可能な状態となる。
【００５５】
なお、記憶媒体としては、ＣＤ−ＲＯＭ３７のみならず、ＤＶＤなどの各種の光ディスク、各種光磁気ディスク、フレキシブルディスクなどの各種磁気ディスク、半導体メモリ等、各種方式のメディアを用いることができる。また、インターネットなどのネットワークからプログラムをダウンロードし、ＨＤＤ３５にインストールするようにしてもよい。この場合に、送信側のサーバでプログラムを記憶している記憶装置も、この発明の記憶媒体である。なお、プログラムは、所定のＯＳ（Operating System）上で動作するものであってもよいし、その場合に後述の各種処理の一部の実行をＯＳに肩代わりさせるものであってもよいし、ワープロソフトなど所定のアプリケーションソフトやＯＳなどを構成する一群のプログラムファイルの一部として含まれているものであってもよい。
【００５６】
次に、メイン制御部１９に設けられたＣＰＵ３１が制御プログラムに基づいて実行する各種処理の内容について説明する。ここでは、ＣＰＵ３１が実行する処理のうち、本実施の形態のスキャナ部１が備える特長的な機能であるスキャン画像の歪み補正機能を実現するスキャン画像の歪み補正処理についてのみ説明する。すなわち、メイン制御部１９は画像歪み補正装置として機能するものである。
【００５７】
図６は、スキャン画像の歪み補正処理の流れを概略的に示すフローチャートである。なお、ここでは、図７に示すように、書籍原稿４０がそのページ綴じ部４１とスキャナ部１の画像読み取りの主走査方向とが平行になるように位置させてコンタクトガラス２に載置されている場合について説明する。
【００５８】
まず、ステップＳ１において、画像データ処理部２８から出力されたコンタクトガラス２に載置されている書籍原稿４０のスキャン画像を入力する。ここで、図８は入力した画像の一例を示したものである。そして、図９に示すように、入力された書籍原稿４０のスキャン画像には、ページ綴じ部４１の近傍において歪みが生じている。
【００５９】
次いで、書籍原稿４０のスキャン画像（例えば、モノクロ多値画像）の最適２値化処理を実行し（ステップＳ２）、副走査方向の黒画素（スキャン画像の画素の中でその濃度値が予め定めた濃度値よりも濃い画素）数のヒストグラムを求める（ステップＳ３）。図１０は、図８に示した画像の綴じ部境界線左側の黒画素ヒストグラムである。図１０中の横軸は、主走査方向の黒画素（スキャン画像の画素の中でその濃度値が予め定めた濃度値よりも濃い画素）の位置を示し、図１０中の縦軸は、その位置毎の黒画素数を示すものである。なお、ページ綴じ部４１のスキャン画像である綴じ部境界線としては、スキャン画像中の画素の中でその濃度値が最も濃い画素が位置する副走査方向の位置が選択される。
【００６０】
なお、スキャン画像がカラー多値画像の場合における２値化処理は、例えばＲＧＢ成分の何れか一つの成分に着目し（例えばＧ成分）、Ｇ成分の所定の濃度閾値よりも大きいものを黒画素とし、Ｇ成分の所定の濃度閾値よりも小さいものを白画素とすれば良い。また、ＲＧＢを色変換して輝度成分と色差成分とに分け、輝度成分で閾値処理を行うようにしても良い。
【００６１】
続くステップＳ４においては、ページ外形／罫線／文字行の抽出処理を実行する。ここで、図１１は、ページ外形／罫線／文字行の抽出処理の流れを概略的に示すフローチャートである。
【００６２】
［スキャン画像からのページ外形の抽出］
まず、ステップＳ４１におけるスキャン画像からのページ外形の抽出処理について説明する。ここで、図１２は上端にページ外形が存在するスキャン画像の一例を示す説明図、図１３は図１２に示したスキャン画像の綴じ部境界線左側の黒画素ヒストグラムである。図１３に示すヒストグラムのｘ軸はスキャン画像の主走査方向（図１２の上下方向）を示すものであり、スキャン画像の上端はヒストグラムの左端に対応付けられている。なお、ページ外形が下端に存在するスキャン画像の場合には、スキャン画像の下端がヒストグラムの右端に対応付けられることになる。したがって、図１２に示すようにスキャン画像の上端にページ外形が存在する場合、スキャン画像の上部に黒い帯が現れることから、図１３に示すヒストグラムの左端には高い縦棒が現れることになる。本実施の形態では、このような特性を利用して、スキャン画像にページ外形が存在するか否かの判断を行う。
【００６３】
より具体的には、図１３に示すように、綴じ部境界線からスキャン画像の左端（図１２の左端）までの距離ＡＯ、ヒストグラム縦棒の高さＢＯとし、その比率を下記に示す式（１）により算出し、
【００６４】
【数１】

【００６５】
算出された比率ｋが、予め定められた閾値よりも大きい場合に、スキャン画像にページ外形が存在すると判断する。
【００６６】
なお、スキャン画像の上下にページ外形が存在する場合には、ヒストグラムの左右両端に高い縦棒が現れることになるので、このような場合には、ヒストグラムの左右両端の高い縦棒に基づいてスキャン画像にページ外形が存在するか否かの判断がそれぞれ実行される。
【００６７】
以上の処理により、スキャン画像にページ外形が存在すると判断された場合には、左右ページの上下辺のいずれにページ外形が存在しているのかという情報とともにページ外形を抽出し、ＲＡＭ３３に一時的に記憶する。
【００６８】
なお、このスキャン画像にページ外形が存在するか否かの判断処理は、スキャン画像の綴じ部境界線を境にした左右ページ毎に実行される。
【００６９】
［スキャン画像からの罫線の抽出］
続くステップＳ４２においては、スキャン画像からの罫線の抽出処理を実行する。ステップＳ４２におけるスキャン画像からの罫線の抽出処理について説明する。
【００７０】
［罫線候補の検出］
ここで、図１４は罫線が存在するスキャン画像の一例を示す説明図である。本実施の形態では、罫線の矩形抽出を導入し、図１４に示すようなスキャン画像に存在する罫線を１つの矩形として抽出する。なお、詳細については後述するが、ただ単に矩形抽出を行うだけでは罫線が単独で抽出できない場合もあるために、本実施の形態では、ランの登録に制限を設けた矩形抽出を行う。
【００７１】
図１５は、２値化した画像に矩形抽出を施した結果を示す説明図である。図１５に示すように、黒画素が連結している箇所が１つの矩形として抽出される。図１５に示すように、罫線が存在していれば、副走査方向に細長い矩形として抽出されることから、細長い矩形の有無や抽出した矩形の形状（長さ・縦横比）や位置を基に罫線の有無の判定を行う。
【００７２】
ただし、ただ単に矩形抽出を行うだけでは、罫線が単独で抽出できない場合もある。図１６に示すように、罫線がノイズと接触している場合、ノイズを含む矩形が抽出されてしまう。また、図１７のような表が含まれる画像の場合は、副走査方向の罫線は主走査方向の罫線と交差するため、表全体が１つの矩形として抽出され罫線が単独で抽出できない。
【００７３】
［ランの登録に制限を設けた矩形抽出］
そこで、罫線を単独で抽出するために、ランの登録に制限を設けた矩形抽出を行う。図１６に示すような罫線とノイズが接触している画像に対して、主走査方向（垂直方向）に一定値未満のランのみを登録し矩形を抽出すると、図１８に示すように罫線を構成する黒画素は登録対象のランとなるが、ノイズを構成する黒画素はランとして登録されない。罫線を構成する黒画素を対象として矩形抽出を行うため、罫線を単独で抽出することができる。
【００７４】
なお、罫線を矩形抽出するにあたって、副走査方向（水平方向）に長いランのみを対象に矩形抽出を行う方法もあるが、この方法だと綴じ部付近の歪み部分は矩形内に含まれない。ところが、本実施の形態の方式を用いることにより、罫線の綴じ部付近の歪み部分も矩形内に含めることが可能となり、より正確な罫線の位置や長さを検出することが出来る。
【００７５】
［矩形統合］
表など、副走査方向（水平方向）の罫線と主走査方向（垂直方向）の罫線とが交差している画像に矩形抽出を行うと、主走査方向の罫線はランとして登録されないため、副走査方向に矩形が細切れに抽出されてしまう。すると、図１９に示すように、副走査方向に長い罫線があるにもかかわらず、その罫線は１つの矩形として抽出されず、複数の細切れの矩形となって抽出される。
【００７６】
そこで、矩形統合を行う。副走査方向における距離が一定値以下の矩形同士を統合する。図２０は、矩形統合を施した例である。矩形統合は、図２０に示すように、細切れになっていた矩形を１つの矩形に統合し、罫線の矩形を抽出するものである。この矩形統合は、かすれた罫線や点線の罫線に対して行っても、罫線全体が１つの矩形として抽出されるため有効な方法である。
【００７７】
［最適罫線の選択］
次いで、一定値未満のランのみを登録した矩形抽出を行い、副走査方向に細長い矩形の有無にて罫線の有無を判定する。このような罫線の有無の判定は、画像の左上・左下・右上・右下の４箇所それぞれにおいて行う。例えば、図２１に示す画像の場合、左上にのみ罫線が存在しないということになる。ある箇所にて複数罫線が存在する場合は、補正に利用する罫線を以下の優先順位で決定する。
【００７８】
１．綴じ部付近まで食い込んでいる罫線
例えば、図２１に示す画像の右下の場合、綴じ部付近まで食い込んでいる罫線が補正に利用される。
【００７９】
２．長さが長い方の罫線
例えば、図２１に示す画像の右上の場合、双方の罫線は綴じ部付近まで食い込んでいるため、長さが長い方の罫線が補正に利用される。
【００８０】
３．位置が外側の罫線
例えば、図２１に示す画像の左下の場合、双方の罫線は綴じ部付近まで食い込んでいて、なおかつ、長さがほぼ同じため、画像の外側に位置する罫線が補正に利用される。
【００８１】
［最適罫線の座標値検出］
以上のようにして最適罫線を選択した後、各罫線の座標値を検出する。罫線の位置座標は、抽出された矩形の座標から得ることができる。なお、特殊な例として、副走査方向に細長い矩形の位置が画像の上端や下端に接している場合は、その矩形がノイズである可能性を考慮して、罫線とはみなさないものとする。また、左右のページそれぞれで細長い矩形が抽出された場合（例えば、左上と右上、左下と右下）、画像によっては、綴じ部をまたがる形で左右ページの矩形が統合されることがある。すると、水平方向画像全体に細長い矩形が抽出されることから、抽出された矩形にそのような特徴が見られた場合は、綴じ部位置を境にその矩形を分割する。
【００８２】
以上の処理により、スキャン画像に罫線が存在すると判断された場合には、左右各ページのいずれの位置に罫線が存在しているのかという情報とともに罫線を抽出し、ＲＡＭ３３に一時的に記憶する。
【００８３】
［スキャン画像からの文字行の抽出］
続くステップＳ４３においては、スキャン画像からの文字行の抽出処理を実行する。ステップＳ４３におけるスキャン画像からの文字行の抽出処理について説明する。本実施の形態においては、まず、スキャン画像中の文字行が縦書き文字行なのか、横書き文字行なのかの判別を行う。
【００８４】
［文字行の判別］
スキャン画像中の文字行が縦書き文字行なのか、横書き文字行なのかの判別手法について説明する。ここで、図２２は図８に示した画像の副走査方向の黒白反転数ヒストグラムである。図２２中の横軸は、副走査方向（左右方向）の黒画素（スキャン画像を黒白反転させた画素の中でその濃度値が予め定めた濃度値よりも濃い画素）の主走査方向上での位置を示し、図２２中の縦軸は、その位置毎の黒画素数を示すものである。また、図２３は図８に示した画像の主走査方向の黒白反転数ヒストグラムである。図２３中の横軸は、主走査方向（上下方向）の黒画素（スキャン画像を黒白反転させた画素の中でその濃度値が予め定めた濃度値よりも濃い画素）の副走査方向上での位置を示し、図２３中の縦軸は、その位置毎の黒画素数を示すものである。画像中の文字が横書きの図８に示したようなスキャン画像の場合、図２２に示すような副走査方向のヒストグラムは激しく変化するが、図２３に示すような主走査方向のヒストグラムの変化は少ない。また、特に図示しないが、スキャン画像中の文字行が縦書き文字行である場合には、主走査方向のヒストグラムは激しく変化するが、副走査方向のヒストグラムの変化は少ない。
【００８５】
上述したような判別手法は、具体的には下記に示す各式により実現される。まず、下記に示す式（２）により、
【００８６】
【数２】

【００８７】
主走査方向ｙの位置でのヒストグラム値Pnt（ｙ）の平均値meanＨが算出される。ここで、heightは画像の高さである。
そして、下記に示す式（３）により、
【００８８】
【数３】

【００８９】
副走査方向のヒストグラムの主走査方向に関する分散σＨが得られる。
同様に、下記に示す式（４）により、
【００９０】
【数４】

【００９１】
副走査方向ｘの位置でのヒストグラム値Pnt（ｘ）の平均値meanＶが算出される。ここで、widthは画像の幅である。
そして、下記に示す式（５）により、
【００９２】
【数５】

【００９３】
主走査方向のヒストグラムの副走査方向に関する分散σｖが得られる。
【００９４】
上述したようにスキャン画像中の文字行が横書き文字行である場合には、副走査方向のヒストグラムの主走査方向に関する分散σＨが、主走査方向のヒストグラムの副走査方向に関する分散σｖより大きい。逆に、スキャン画像中の文字行が縦書き文字行である場合には、主走査方向のヒストグラムの副走査方向に関する分散σｖが、副走査方向のヒストグラムの主走査方向に関する分散σＨより大きい。つまり、分散σＨと分散σｖとの比較により、スキャン画像中の文字行が縦書き文字行なのか、横書き文字行なのかの判別が可能になっている。
【００９５】
なお、スキャン画像中の文字行が縦書き文字行なのか、横書き文字行なのかの判別に、黒白反転数ヒストグラムを用いたのは、文字行と写真部分との混同を避けるためである。一般に、黒画素ヒストグラムの値が同程度の場合、文字領域のほうが写真領域よりも黒白反転数ヒストグラムの値が大きくなるからである。
【００９６】
［横書き文字行候補の検出］
以上のようにして横書き文字行と判別された場合、横書き文字行候補を検出する。従来方式では、文字単位の外接矩形を抽出して横書き文字行候補を検出するようにしていたが、矩形を抽出する際に隣接する文字同士が接触して複数の文字が一つの矩形となる問題点があった。そこで、本実施の形態では、ランの長さに制限を設けて文字の縦成分のみの矩形を抽出することで不適切なランを排除し、隣接する文字が接触しないようにする。ここで、縦成分とは文字の垂直方向の成分のことである。このように文字の縦成分のみの矩形を抽出する理由は、アルファベット（ａ〜ｚ）文字のアスペクト比は一定ではないが、文字に含まれる垂直方向の成分のピッチが一定に近いためである。具体的には、文字と思われる黒画素の集合部分であるランを探索し、ランが発見された時にはランの終始座標の長さが主走査方向に予め定めた第１閾値以上かつ予め定めた第２閾値以下であればランとして登録する（ラン抽出手段）。
【００９７】
ここで、縦成分の矩形を抽出する際のランの長さの閾値について説明する。本実施の形態においては、ランの長さの閾値（第１閾値及び第２閾値）を書かれている文字サイズに合わせて切り替えるようにしている。このように文字サイズに合わせて閾値を切り替えるようにするのは、小さい文字の英文画像においては、縦成分の矩形を抽出する際にランの長さの閾値が適切でないと、登録されるべきランも排除されてしまうことがあり、抽出される縦成分の矩形数も減ってしまうという問題があるからである。以下において、文字サイズに合わせた閾値の切り替え手法について詳述する。
【００９８】
文字サイズに合わせた閾値（第１閾値及び第２閾値）の切り替えは、英文画像の文字サイズ（標準矩形サイズ）を算出し（サイズ算出手段）、その値を基にランとして登録するための閾値を変更することにより行われる（第１の閾値設定手段）。標準矩形サイズの算出は、以下に示す処理手順により行われる。
１．図２４に示すように、スキャン画像の綴じ部を境にした左右両側において、標準矩形サイズの算出を行うための領域Ｚをそれぞれ指定する。例えば、図２４に示す指定領域Ｚは、スキャン画像の高さの１／３〜２／３、スキャン画像の左右両側の幅の１／３〜２／３の部分である。このような指定領域Ｚは、歪みが生じておらず、かつ、スキャン画像のページ外形から一定距離だけ離れていることが望ましい。
２．図２４に示すように、指定領域Ｚ内の文字の外接矩形を抽出する。指定領域Ｚ内の文字の外接矩形の抽出については周知の技術であるので、その説明は省略する。
３．２で抽出した文字の外接矩形の中で、指定領域Ｚに接している文字の外接矩形、規定外の文字の外接矩形は排除し、図２５に示すように残った文字の外接矩形（図２５中、網掛けを施した矩形）の主走査方向における距離Ｗ（Ｗ＝Ｘｅ−Ｘｓ）を算出する。図２６に示すように、Ｘｓは外接矩形の主走査方向の開始座標、Ｘｅは終止座標である。また、規定外の文字の外接矩形とは、矩形抽出の際に隣接する文字同士がくっついて抽出されてしまい、高さや幅が極端に大きい外接矩形である。
４．３の計算結果を基に、下記の式により標準矩形サイズを算出する。
標準矩形サイズ＝各外接矩形の主走査方向における距離Ｗの総和／外接矩形の数
５．４の計算結果を基に、標準矩形サイズは以下のように設定する。
・スキャン画像の綴じ部を境にした左右両側の何れかの標準矩形サイズが０の場合、０でない方の標準矩形サイズを採用する。
・スキャン画像の綴じ部を境にした左右両側の両方が０の場合、予め定められた一定の値を標準矩形サイズとする。
・スキャン画像の綴じ部を境にした左右両側で比較をし、小さい方の標準矩形サイズを両方の標準矩形サイズとして採用する。
以上により算出された標準矩形サイズが標準サイズ以下の場合には、登録するランの長さの閾値の最小値を小さくする。すなわち、英文画像のように文字が小さい場合には、ランとして登録する時の長さの最小値を小さくすることにより、小さい文字の縦成分矩形を抽出できるようになり、最適な縦成分矩形の抽出を行うことができるようになる。
【００９９】
このようにして登録したランを基に縦成分のみの矩形抽出を行う（縦成分矩形抽出手段）。ここで、横書き文字行候補の検出の結果の一例を図２７に示す。
【０１００】
加えて、本実施の形態においては、縦成分の矩形を抽出後、縦成分の矩形の長さを主走査方向にある一定の長さに縮める。このように縦成分の矩形の長さを主走査方向に縮めるのは、従来方式では、複数分の行が一行と誤認識されやすいという問題点があったからである。すなわち、縦成分の矩形の長さを主走査方向に縮めることにより、主走査方向に矩形が接触するのを防ぎ、安定した行統合が可能になる。ここで、図２８は縦成分矩形を縮める手法を示す説明図である。図２８に示すように、縦成分の矩形の主走査方向の開始座標をＸｓ、終止座標をＸｅ、中心座標をＺとして、Ｚを基準に上部分と下部分を縮め、主走査方向に閾値（第３閾値）以下になるようにすることで、縦成分矩形を縮める（縮小手段）。このように縦成分矩形を主走査方向に縮める長さの閾値は、前述した標準矩形サイズに基づいて決定される（第２の閾値設定手段）。このように縦成分矩形を主走査方向に縮める長さの閾値を標準矩形サイズに基づいて決定するのは、文字サイズに関係なく一定の値で縮めてしまうと、短い縦成分矩形の場合には縦成分矩形としての長さが短くなってしまい、行抽出が不安定になるからである。以下において、縦成分矩形を主走査方向に縮める長さの閾値の計算手法について詳述する。
【０１０１】
縦成分矩形を主走査方向に縮める長さの閾値Ｋは、前述した標準矩形サイズを基に、下記の式により算出される。
長さの閾値Ｋ＝標準矩形サイズ／５＋縦成分矩形を縮めるときの最小値
この計算式によれば、標準矩形サイズが５増加するごとに区切り、５増加に対して閾値Ｋを１増加させる。また、計算式の縦成分矩形を縮めるときの最小値は、解像度毎に定めているため、閾値Ｋも解像度毎に対応している。図２９は、縦成分矩形を主走査方向に縮める長さの閾値Ｋの計算結果の一例をグラフ化したものである。なお、図２９に示すグラフは、２００ｄｐｉの場合を示している。すなわち、英文画像のように文字が小さい場合には、縦成分矩形を主走査方向に縮める長さの閾値Ｋを小さくすることにより、小さい文字の縦成分矩形を極端に短くすることがなくなり、確実に文字行を抽出できるようになる。
【０１０２】
ここで、縦成分矩形を縮めた横書き文字行候補の検出の結果の一例を図３０に示す。図３０（ａ）は縦成分矩形を縮める前、図３０（ｂ）は縦成分矩形を縮めた後である。
【０１０３】
以上のようにして文字の縦成分矩形を抽出し、主走査方向に縦成分矩形を縮めた後、図３１に示すように、主走査方向間に隣接する矩形の行統合を行い、文字行を抽出する（文字行抽出手段）。ここで、矩形の行統合を行った場合、主走査方向間に隣接する矩形間の距離を一定にすると、文字が小さい英文画像の場合は主走査方向間に隣接する矩形間の距離は小さいために、過剰に行を統合するという問題が発生する。特に、英語文は、日本語文に比べて主走査方向の矩形間距離が短くなるため、行抽出時の主走査方向の統合距離の閾値を厳しくする必要がある。そこで、本実施の形態においては、行抽出時の主走査方向の統合距離の閾値（第４閾値）を、前述した標準矩形サイズに基づいて決定する（第３の閾値設定手段）。すなわち、標準矩形サイズに基づいて標準的な文字サイズでないと判定された場合は、行抽出時の主走査方向の統合距離の閾値を小さくするようにする。
【０１０４】
なお、縦成分矩形から行統合を行うとノイズの行が統合されることがある。ノイズの行内にある縦成分の矩形から生成される近似曲線は補正に適さない。そこで、長さがある一定以下の行はノイズとみなして、補正に利用しないようにする。これらの方法を行うと、安定した近似曲線を得る可能性が高くなる。
【０１０５】
次いで、一行内の縦成分矩形の中心座標を基に近似曲線を生成する。ここで、図３２（ａ）は縦成分矩形による近似曲線の生成を示す説明図、（ｂ）は行を拡大して示す説明図である。
【０１０６】
［最適横書き文字行の選択］
次に、抽出した横書き文字行の中から歪み補正に最適な横書き文字行を選択する（文字行決定手段）。複数の横書き文字行が検出される場合、どの横書き文字行を用いて歪み補正するかを選択する必要がある。最適な横書き文字行の選択基準の一例としては、前述した最適な罫線の選択基準と基本的に同様であって、補正に利用する横書き文字行を以下の優先順位で決定する。
【０１０７】
１．綴じ部付近まで食い込んでいる横書き文字行
例えば、図３３に示す画像の右下の場合、綴じ部付近まで食い込んでいる横書き文字行が補正に利用される。
【０１０８】
２．長さが長い方の横書き文字行
例えば、図３３に示す画像の右上の場合、双方の横書き文字行は綴じ部付近まで食い込んでいるため、長さが長い方の横書き文字行が補正に利用される。
【０１０９】
３．位置が外側の横書き文字行
例えば、図３３に示す画像の左下の場合、双方の横書き文字行は綴じ部付近まで食い込んでいて、なおかつ、長さがほぼ同じため、画像の外側に位置する横書き文字行が補正に利用される。
【０１１０】
なお、本実施の形態においては、図３４に示すように、ページ外形に歪みを生じている部分がまだらに読み取られているような場合に、この部分Ｅを横書き文字行として認識する場合がある。そのため、綴じ部境界線Ｄを跨いでいる横書き文字行や、ページ外形の上端又は下端近傍の横書き文字行は補正に利用しないようにする。これにより、安定した近似曲線を得る可能性が高くなる。
【０１１１】
［最適横書き文字行の座標値の決定］
最適な横書き文字行が選択された場合には、横書き文字行の（主走査方向の）座標値を決定する（近似曲線算出手段）。横書き文字行の（主走査方向の）座標値は、横書き文字行内の各縦成分矩形主走査方向の中心点を連結し、直線部分と曲線部分とを近似して抽出することにより横書き文字行の（主走査方向の）座標値を決定することになる。より詳細には、図３３に示すＤは綴じ部境界線であり、ＢＤの間は多項式近似曲線で（主走査方向の）座標値を推定し、一番左端のＡとＢとの間は近似直線の値で（主走査方向の）座標値を推定する。
【０１１２】
以上の処理により、スキャン画像に横書き文字行が存在すると判断された場合には、左右各ページのいずれの位置に横書き文字行が存在しているのかという情報とともに横書き文字行を抽出し、ＲＡＭ３３に一時的に記憶する。
【０１１３】
［縦書き文字行に基づく横書き文字行の抽出］
次に、各縦書き文字行から横書き文字行を抽出する。
【０１１４】
図３５は、各縦書き文字行からの横書き文字行の抽出処理の流れを概略的に示すフローチャートである。図３５に示すように、まず、縦書き文字行の行切り出し矩形を抽出する（ステップＳ２０１）。なお、縦書き文字行の行切り出し矩形の抽出処理は、ＯＣＲ等で一般に用いられている周知の技術をそのまま利用することができるので、その説明は省略する。図３６は、抽出した行切り出し矩形を例示的に示す説明図である。
【０１１５】
次いで、縦書き文字行の先頭（もしくは末尾）のｙ座標が最大（もしくは最小）の縦書き文字行を抽出し、さらに、そこから予め定めた距離範囲内に先頭（もしくは末尾）が存在する縦書き文字行を抽出する（ステップＳ２０２）。より具体的には、図３６に示した例においては、図３７に示すように、縦書き文字行の先頭文字のｙ座標が最大の縦書き文字行はＡで示した縦書き文字行である。そして、その先頭位置から予め定めた距離範囲ｈ内に存在する行先頭文字は、図３７中、黒丸“●”で示した文字である。すなわち、黒丸“●”で示す文字を含む縦書き文字行のみを抽出し、それ以外の縦書き文字行Ｂ，Ｃは除外する。なお、ｈはスキャン画像の解像度によって定められる定数である。
【０１１６】
次に、抽出した縦書き文字行の先頭（もしくは末尾）のｙ座標に関してヒストグラムを構成する（ステップＳ２０３）。図３８では、ページの左端に近い縦書き文字行Ｄを基準行とし、その先頭のｙ座標（ｙＤ）を基準座標としている。以後、ｙＤに対して一定幅ｄ（例えば抽出した縦書き文字行の平均幅の１／２）の範囲内に先頭が存在する縦書き文字行の数を、ｙＤに関するヒストグラムの値とする。図３８では、ｙＤを示す直線を上下に挟む点線の範囲内に先頭が存在する縦書き文字行がその対象となる。したがって、ページの左端に近い縦書き文字行Ｄの右隣の縦書き文字行Ｅは、その範囲外である。このように、既存の基準座標の対象範囲に先頭が含まれない縦書き文字行が出現した場合は、その縦書き文字行を新たな基準行とし、その先頭座標を新たな基準座標（ここでは、ｙＥ）とする。また、縦書き文字行Ｅの右隣の縦書き文字行Ｆの行先頭座標はｙＤの対象範囲に含まれるので、新たな基準座標を設けることなく、ｙＤに関するヒストグラムの値を１だけカウントアップする。
【０１１７】
以下、同様の処理を綴じ部境界線に向かって続けて行く。その結果、図３８に示す例では、ｙＤの対象範囲に含まれる縦書き文字行は斜線を施した矩形で囲まれた７つで、ｙＥの対象範囲に含まれる縦書き文字行は網掛けを施した矩形で囲まれた４つとなる（これら以外の矩形で囲まれた縦書き文字行に関しても、基準行、基準座標と対象範囲がそれぞれ定められるが、図３８では省略している）。なお、ｙＤの対象範囲には本来無関係であるべき縦書き文字行Ｇも含まれているが、次のステップＳ２０４にてこれは除外される。
【０１１８】
続いて、ステップＳ２０３にて構成したヒストグラムの中で、最大の値に対応する基準行の対象範囲に含まれる縦書き文字行の中で、最もページの左端（もしくは右端）にある縦書き文字行（基準行）を開始行として、綴じ部境界線へ向かって、先頭（もしくは末尾）のｙ座標が近接した縦書き文字行を抽出する（ステップＳ２０４）。図３８では、基準座標ｙＤの対象範囲に含まれる文字行が７つと最大であったので、その中の左端の縦書き文字行Ｄを開始行とし、開始行（縦書き文字行Ｄ）から綴じ部境界線へ向かって先頭のｙ座標が近接した縦書き文字行を抽出していく。
【０１１９】
ところで、開始行（縦書き文字行Ｄ）から綴じ部境界線へ向かって先頭のｙ座標が近接した縦書き文字行を抽出する際には、画像の歪みを生じていない部分と歪みを生じている部分とで処理内容を切り替える。
【０１２０】
まず、画像の歪みを生じていない部分における処理について図３９を参照しつつ説明する。画像の歪みを生じていない部分では、着目行Ｈを基準として、次の２条件を満足する縦書き文字行を抽出する。
１．ｙ座標の正方向（図３９中、上方へ向かう方向）に関して、着目行Ｈの先頭位置から一定範囲内ｂ１（例えば平均文字行幅の１／２）に抽出する縦書き文字行の先頭が存在すること
２．ｙ座標の負方向（図３９中、下方へ向かう方向）に関して、着目行Ｈの先頭位置から見てｘ座標の正方向（綴じ部境界線へ向かう方向）に対して予め定めた一定角度（ここでは、角度を直線の傾き（ｂ２／ａ１）で表している）の範囲内に抽出する縦書き文字行の先頭が存在すること
すなわち、着目行Ｈの次の縦書き文字行Ｉの先頭は上記の範囲外なので除外することになるが、さらに次の縦書き文字行Ｊの先頭は範囲内に存在するので抽出することになる。以下、縦書き文字行Ｊを新たな着目行として同様の処理を続ける。
【０１２１】
次に、画像の歪みを生じている部分における処理について図４０を参照しつつ説明する。画像の歪みを生じている部分では、着目行Ｌを基準として、次の２条件を満足する縦書き文字行を抽出する。
１．ｙ座標の負方向（図４０中、下方へ向かう方向）に関して、着目行Ｌの先頭位置から見てｘ座標の正方向（綴じ部境界線へ向かう方向）に対して予め定めた一定角度（ここでは、角度を直線の傾き（ｂ３／ａ２）で表しているが、歪みを生じている部分では基本的にページの内側へ文字行の先頭が食い込んでいくのを考慮して、ｂ２／ａ１＜ｂ３／ａ２とする）の範囲内に抽出する縦書き文字行の先頭が存在すること
２．着目行Ｌの先頭位置と抽出する縦書き文字行の先頭位置を結ぶ直線の傾き（ｂ４／ａ２）が、着目行Ｌの先頭位置と直前の抽出行Ｋの先頭位置を結ぶ直線の傾き（ｂ５／ａ３）から一定値αを引いた値よりも大きい。すなわち、“ｂ４／ａ２＞ｂ５／ａ３−α”を満足すること（基本的には、“ｂ４／ａ２＞ｂ５／ａ３”で良いが、誤差を考慮して一定値αを導入する。一定値αは予め定めた値である）
すなわち、着目行Ｌの次の縦書き文字行Ｍの先頭はこの条件外なので除外することになるが、さらに次の縦書き文字行Ｎの先頭は条件を満足するので抽出することになる。以下、縦書き文字行Ｎを新たな着目行として同様の処理を続ける。
【０１２２】
さて、ここで問題となるのは、歪みを生じていない部分と歪みを生じている部分をいかに識別するかであるが、これは次のように行っている。すなわち、着目行と次の抽出行の先頭のｙ座標をそれぞれｙＣ，ｙＮとすると、“ｙＮ−ｙＣ”が一定値（例えば、平均文字行幅の１／４）以上となれば、それ以降を歪みを生じている部分とする。
【０１２３】
以上の方法により図３８から抽出した縦書き文字行を、図４１において斜線を施した矩形で囲んで示す。
【０１２４】
最後に、抽出した縦書き文字行の先頭（もしくは末尾）の位置座標に関する近似曲線多項式を算出する（ステップＳ２０５）。抽出した各縦書き文字行の行切り出し矩形の先頭を連結して外形を形成する場合には、図４２に示すように、連結する各縦書き文字行の行切り出し矩形の上辺中心点に基づき、抽出した縦書き文字行の先頭の位置座標に関する近似曲線多項式を算出する。また、抽出した各縦書き文字行の行切り出し矩形の末尾を連結して外形を形成する場合には、図４２に示すように、連結する各縦書き文字行の行切り出し矩形の下辺中心点に基づき、抽出した縦書き文字行の末尾の位置座標に関する近似曲線多項式を算出する。
【０１２５】
なお、最後に不適切な縦書き文字行の外形を排除する。これは、前述したように多項式近似により座標値を推定する際に、多項式近似による推定曲線の形状が不適切である場合には補正の際にかえって歪みが増大する恐れがあるので、このような縦書き文字行の外形を排除するものである。不適切な近似曲線形状の例としては、前述した罫線や横書き文字行の場合と同様であって、特に図示しないが、曲線が書籍の外側へ向かうような場合や、中心線を超えて大きく内側へ食い込むような場合である。
【０１２６】
なお、推定曲線の形状が不適切であるとして縦書き文字行の外形を排除した場合には、歪み補正用の縦書き文字行の外形は無いということになる。
【０１２７】
以上の処理により、スキャン画像に縦書き文字行の外形が存在すると判断された場合には、左右各ページのいずれの位置に縦書き文字行の外形が存在しているのかという情報とともに縦書き文字行の外形を抽出し、ＲＡＭ３３に一時的に記憶する。
【０１２８】
なお、以下においては、横書き文字行及び縦書き文字行の外形を文字行として扱うものとする。
【０１２９】
以上、ステップＳ４１〜Ｓ４３の処理により、ページ外形／罫線／文字行の抽出処理（ステップＳ４）が終了する。
【０１３０】
続くステップＳ５（図６参照）においては、画像歪み補正処理を実行する。画像歪み補正処理は、図４３に示すように、概略的には、歪み補正（伸長）に際しての基準となる線（基準線）としてスキャン画像の上辺（もしくは下辺）の近傍に位置するページ外形／罫線／文字行の何れかを選択する処理（ステップＳ５１：基準線選択処理）、基準線に対応するものであって補正率（伸長率）の算出用の参照線としてスキャン画像の上辺（もしくは下辺）の近傍に位置するページ外形／罫線／文字行の何れかを選択する処理（ステップＳ５２：参照線選択処理）、基準線が罫線や文字行の場合に、基準線より下部の画像情報の欠落を最小限にするための仮想的なページ外形を算出する処理（ステップＳ５３：仮想ページ外形算出処理）、仮想的なページ外形に基づいてスキャン画像に伸長処理を施して主走査方向の歪みを補正する処理（ステップＳ５４：主走査方向歪み補正処理）、補正画像の文字外接矩形に基づいてスキャン画像に伸長処理を施して副走査方向の歪みを補正する処理（ステップＳ５５：副走査方向歪み補正処理）により構成されている。
【０１３１】
ここで、基準線選択処理（ステップＳ５１）及び参照線選択処理（ステップＳ５２）においては、基準線または参照線として、スキャン画像の上辺（もしくは下辺）の近傍に位置するページ外形／罫線／文字行の何れかを選択することになるが、本実施の形態におけるページ外形、罫線、文字行の選択の優先順位は、
ページ外形＞罫線＞文字行
とされている。このような選択優先順位にしたのは、文字行はページ外形や罫線に比べて抽出精度が低く、また、画像の外側にあるページ外形を利用する方が精度の高い歪み補正率を得ることができるためである。ただし、本実施の形態においては、ページ外形は一般に左右ページにまたがるが、罫線や文字行は両ページにあるとは限らないので、スキャン画像の上辺または下辺からの基準線選択の優先順位は、下記に示すようになる。
【０１３２】
１．「ページ外形」（ページ外形は、常に左右両ページに存在する）
２．左右両ページともに「罫線」
３．一方のページが「罫線」、他方のページが「文字行」
４．左右両ページともに「文字行」
５．一方のページのみに「罫線」、他方のページには「手がかりなし」
６．一方のページのみに「文字行」、他方のページには「手がかりなし」
ここで、「手がかりなし」とは、ページ外形、罫線、文字行のいずれも抽出できなかった場合を言う。
【０１３３】
次に、仮想ページ外形算出処理（ステップＳ５３）及び主走査方向歪み補正処理（ステップＳ５４）の例について、上記優先順位に基づいて順に説明する。
【０１３４】
１．スキャン画像の上辺及び下辺のいずれにも「ページ外形」が存在する場合
ここでは、スキャン画像の上辺及び下辺のいずれにも「ページ外形」が存在する場合について説明する。図４４に示すように、スキャン画像の上辺及び下辺のいずれにも「ページ外形」が存在する場合は、いずれを基準線、参照線にしても構わない。なお、本実施の形態においては、基準線として選択した「ページ外形」、「罫線」、「文字行」は、下辺に位置させるものとする。この場合においては、基準線と仮想ページ外形とは一致していることから、仮想ページ外形算出処理（ステップＳ５３）においては特に処理を実行しなくても良い。
【０１３５】
次いで、主走査方向歪み補正処理（ステップＳ５４）について説明する。ここで、ｘ０は「ページ外形」の直線部分と曲線部分との境界点である。主走査方向歪み補正処理としては、まず、この境界点ｘ０における基準線と参照線間の距離ｈ０（図４５参照）に基づいて歪み補正率を算出する。歪み補正率は、主走査方向に画像を伸長して補正する際に、基準線と参照線との間の距離を副走査方向の全ての位置において等しくさせるためのものである。すなわち、位置ｘにおける基準線と参照線間の距離をｈ（図４５参照）とした場合には、位置ｘにおける歪み補正率は、
ｈ０／ｈ
として表すことができる。即ち、歪み補正率とは、主走査方向に画像を伸長して補正する際に、基準線と参照線との間の距離を副走査方向の全ての位置ｘにおいて等しくなるように、各ｘに関して算出した値である。
【０１３６】
次に、実際に補正をする際は、まず、図４５に示すように仮想ページ外形（ここでは基準線）が直線（最下辺）になるように、主走査方向に各画素をシフトする。その後、副走査方向の全ての位置ｘにおいて、画像を主走査方向の上辺側にｈ０／ｈで伸長すれば、図４５の上辺の「ページ外形」ＥがＲＥとなるように画像が補正される。
【０１３７】
２．スキャン画像の上辺及び下辺の何れか一方に「ページ外形」が存在し、他方の辺には「罫線」と「文字行」とが存在する場合
ここでは、スキャン画像の上辺及び下辺の何れか一方に「ページ外形」が存在し、他方の辺ではページ外形が途中で切れているが「罫線」と「文字行」とが存在する場合について説明する。図４６に示すように、スキャン画像の上辺及び下辺の何れか一方に「ページ外形」が存在し、他方の辺には「罫線」と「文字行」とが存在する場合は、「ページ外形」を基準線として下辺に位置させ、「文字行」と「罫線」とを参照線とする（図４６に示す例では、左ページが「文字行」、右ページが「罫線」である）。この場合においても、基準線と仮想ページ外形とは一致していることから、仮想ページ外形算出処理（ステップＳ５３）においては特に処理を実行しなくても良い。
【０１３８】
次いで、主走査方向歪み補正処理（ステップＳ５４）について説明する。ここで、ｘ０は「ページ外形」の直線部分と曲線部分との境界点である。主走査方向歪み補正処理としては、まず、この境界点ｘ０における基準線と参照線間の距離ｈ０（図４７参照）に基づいて歪み補正率を算出する。位置ｘにおける基準線と参照線間の距離をｈ（図４７参照）とした場合には、位置ｘにおける歪み補正率は、
ｈ０／ｈ
として表すことができる。
【０１３９】
次に、実際に補正をする際は、まず、図４７に示すように仮想ページ外形（ここでは基準線）が直線（最下辺）になるように、主走査方向に各画素をシフトする。その後、副走査方向の全ての位置ｘにおいて、画像を主走査方向の上辺側にｈ０／ｈで伸長すれば、図４７の右ページでは、上辺の「罫線」ＬＵがＲＬＵとなるように画像が補正される。左ページ上辺の「文字行」についても同様に行う。
【０１４０】
３．スキャン画像の左右両ページの上辺及び下辺の何れか一方に「罫線」が存在し、他方の辺には「罫線」と「文字行」とが存在する場合
ここでは、スキャン画像の左右両ページの上辺及び下辺の何れか一方に「罫線」が存在し、他方の辺には「罫線」と「文字行」とが存在する場合について説明する。スキャン画像の左右両ページの上辺及び下辺の何れか一方に「罫線」が存在し、他方の辺には「罫線」と「文字行」とが存在する場合は、図４８に示すように、左右両ページに「罫線」が存在する側を下辺に位置させ、その２本の「罫線」を基準線とし、他方の辺に位置する「文字行」と「罫線」とを参照線とする（図４８に示す例では、左ページが「文字行」、右ページが「罫線」である）。ところで、このように、基準線が「ページ外形」ではない場合は、基準線をそのまま仮想ページ外形と見なしてはならない。なぜなら、両者を一致させた場合、後の主走査方向歪み補正処理において仮想ページ外形（基準線）を最下辺に画素シフトする際、基準線より下方の画像情報が全て欠落してしまうからである。
【０１４１】
そこで、基準線が「ページ外形」でない場合は、図４８において点線で示すような仮想ページ外形ＶＥを求める仮想ページ外形算出処理（ステップＳ５３）を実行する。ここで、ｘ０は下辺の「罫線」ＬＤの直線部分と曲線部分との境界点である。仮想ページ外形算出処理は、境界点ｘ０における「罫線」ＬＤからスキャン画像の最下辺までの距離ａ０と、境界点ｘ０における「罫線」ＬＤから上辺の「罫線」ＬＵまでの距離ｂ０とに基づいて仮想ページ外形ＶＥを算出するものである。すなわち、「罫線」ＬＤ上の位置ｘから上辺の「罫線」ＬＵまでの距離ｂが解かれば、
ａ／ｂ＝ａ０／ｂ０
であることから、「罫線」ＬＤ上の位置ｘから仮想ページ外形ＶＥまでの距離ａを算出することができる。したがって、「罫線」ＬＤ上の位置から仮想ページ外形ＶＥまでの距離を副走査方向の全ての位置ｘにおいて算出することにより、仮想ページ外形ＶＥを求めることができる。このような処理は、左右ページについてそれぞれ独立に行われる。
【０１４２】
次いで、主走査方向歪み補正処理（ステップＳ５４）について説明する。主走査方向歪み補正処理としては、まず、前述した境界点ｘ０における「罫線」ＬＤからスキャン画像の最下辺までの距離ａ０と、境界点ｘ０における「罫線」ＬＤから上辺の「罫線」ＬＵまでの距離ｂ０とを加算した距離ｈ０（ｈ０＝ａ０＋ｂ０）に基づいて歪み補正率を算出する。位置ｘにおける上辺の「罫線」ＬＵからスキャン画像の最下辺までの距離をｈ（ｈ＝ａ＋ｂ）とした場合には、位置ｘにおける歪み補正率は、
ｈ０／ｈ
として表すことができる。
【０１４３】
次に、実際に補正をする際は、まず、図４９に示すように仮想ページ外形ＶＥが直線（最下辺）になるように、主走査方向に各画素をシフトする。その後、副走査方向の全ての位置ｘにおいて、画像を主走査方向の上辺側にｈ０／ｈで伸長すれば、図４３の右ページでは、上辺の「罫線」ＬＵがＲＬＵ（厳密には、ｘの位置は「罫線」ＬＵの直線部と曲線部との境界には一致しないが、ここでは「罫線」ＬＤの境界をそのまま用いる）となるように画像が補正される。左ページ上辺の「文字行」についても同様に行う。
【０１４４】
このように、仮想ページ外形ＶＥを利用することで、シフトによる画像の欠落を最小限に抑えることができる。
【０１４５】
４．スキャン画像の左右両ページの上辺及び下辺の何れか一方に「罫線」と「文字行」とが存在し、他方の辺の一方のページのみに「罫線」が存在する場合
ここでは、スキャン画像の左右両ページの上辺及び下辺の何れか一方に「罫線」と「文字行」とが存在し、他方の辺の一方のページのみに「罫線」が存在する場合について説明する。スキャン画像の左右両ページの上辺及び下辺の何れか一方に「罫線」と「文字行」とが存在し、他方の辺の一方のページのみに「罫線」が存在する場合（他方のページは「手がかりなし」）は、図５０に示すように、「罫線」と「文字行」とが存在する側を下辺に位置させ、それらの「罫線」と「文字行」とを基準線とし、他方の辺に位置する「罫線」とスキャン画像を副走査方向に貫く中心線Ｃとを参照線とする（図５０に示す例では、左ページが「罫線」、右ページが「手がかりなし」である）。なお、中心線Ｃは、スキャン画像の主走査方向の中心を副走査方向に横切る線であり、書籍原稿４０の中心線ではない。
【０１４６】
このように基準線が「ページ外形」でない場合は、前述したように、図５０において点線で示すような仮想ページ外形ＶＥを求める仮想ページ外形算出処理（ステップＳ５３）を実行する。ここで、ｘ０は下辺の「罫線」ＬＤの直線部分と曲線部分との境界点である。仮想ページ外形算出処理は、境界点ｘ０における「罫線」ＬＤからスキャン画像の最下辺までの距離ａ０と、境界点ｘ０における「罫線」ＬＤから中心線Ｃまでの距離ｂ０とに基づいて仮想ページ外形ＶＥを算出するものである。すなわち、「罫線」ＬＤ上の位置ｘから中心線Ｃまでの距離ｂが解かれば、
ａ／ｂ＝ａ０／ｂ０
であることから、「罫線」ＬＤ上の位置ｘから仮想ページ外形ＶＥまでの距離ａを算出することができる。したがって、「罫線」ＬＤ上の位置から仮想ページ外形ＶＥまでの距離を副走査方向の全ての位置ｘにおいて算出することにより、仮想ページ外形ＶＥを求めることができる。このような処理は、左右ページについてそれぞれ独立に行われる。なお、右ページのように上辺に「罫線」が存在する場合については、中心線Ｃに代えて、前述したように上辺の「罫線」を用いる。
【０１４７】
次いで、主走査方向歪み補正処理（ステップＳ５４）について説明する。主走査方向歪み補正処理としては、まず、前述した境界点ｘ０における「罫線」ＬＤからスキャン画像の最下辺までの距離ａ０と、境界点ｘ０における「罫線」ＬＤから中心線Ｃまでの距離ｂ０とを加算した距離ｈ０（ｈ０＝ａ０＋ｂ０）に基づいて歪み補正率を算出する。位置ｘにおける中心線Ｃからスキャン画像の最下辺までの距離をｈ（ｈ＝ａ＋ｂ）とした場合には、位置ｘにおける歪み補正率は、
ｈ０／ｈ
として表すことができる。
【０１４８】
次に、実際に補正をする際は、まず、図５１に示すように仮想ページ外形ＶＥが直線（最下辺）になるように、主走査方向に各画素をシフトする。その後、副走査方向の全ての位置ｘにおいて、画像を主走査方向の上辺側にｈ０／ｈで伸長して補正する。左ページ上辺の「罫線」についても同様に行う。なお、右ページについては、補正によってシフトにより一旦歪んだ中心線Ｃが元の直線ＲＣに戻るが、Ｃがスキャナ部１の光軸と一致する場合以外は、画像全体の補正は不完全となる。
【０１４９】
５．スキャン画像の左右何れかのページの上辺及び下辺の何れか一方に「罫線」が存在し、他方の辺の他方のページのみに「文字行」が存在する場合
ここでは、スキャン画像の左右何れかのページの上辺及び下辺の何れか一方に「罫線」が存在し、他方の辺の他方のページのみに「文字行」が存在する場合について説明する。スキャン画像の左右何れかのページの上辺及び下辺の何れか一方に「罫線」が存在し（他方のページは「手がかりなし」）、他方の辺の他方のページのみに「文字行」が存在する場合（一方のページは「手がかりなし」）は、図５２に示すように、「罫線」が存在する側を下辺に位置させ、その「罫線」を基準線とし、「罫線」が存在しない方のページ（「文字行」が存在する方のページ）については、文字行Ｌを中心線Ｃを挟んで線対称の位置に移動させた曲線ＳＬを基準線とする。参照線については、「罫線」が存在するページは中心線Ｃを、「文字行」が存在するページはその「文字行」を、それぞれ参照線とする。
【０１５０】
なお、歪み補正率の算出や画素シフト、補正（伸長）処理についてはこれまでの例と同様であるため、それらの説明は省略する。
【０１５１】
最後に、副走査方向歪み補正処理（ステップＳ５５）について説明する。本実施の形態の副走査方向の歪み補正処理は、スキャナ部１（画像読取手段）の固有パラメータ（レンズの焦点面距離、スキャン光軸の位置（アドレス））が未知の場合における副走査方向歪み補正処理であって、副走査方向に隣接する縦成分矩形の中心座標間の距離を算出し、算出した距離の値を利用して副走査方向変倍率を算出するものである。
【０１５２】
図５３は、本実施の形態の副走査方向歪み補正処理の流れを概略的に示すフローチャートである。図５３に示すように、ステップＳ３０１においては、主走査方向歪み補正されたスキャン画像に基づいて文字の縦成分矩形Ａ（図５４参照）を抽出する。ここで、文字認識処理については周知の技術であるので、その説明は省略する。このように文字の縦成分矩形Ａを抽出するのは、この文字の縦成分矩形Ａの形状の変化を基に、副走査方向の歪みを補正するためである。
【０１５３】
続いて、図５４に示すように、スキャン画像を書籍原稿４０のページ綴じ部４１に平行な方向の複数の短冊状の領域Ｚに分割した後（ステップＳ３０２）、各短冊領域Ｚについて、副走査方向に隣接する縦成分矩形Ａの中心座標間の距離の平均値を求める（ステップＳ３０３：距離検出手段）。
【０１５４】
なお、短冊領域Ｚの幅は、第一の実施の形態で述べた標準矩形サイズに基づいて決定される。このように短冊領域Ｚの幅を標準矩形サイズに基づいて決定するのは、短冊領域Ｚの幅を文字サイズに関係なく一定の値にしてしまうと、文字サイズが小さい場合に短冊領域Ｚの幅が大きすぎると、後述する短冊領域毎の副走査方向変倍率の精度が低くなるからである。
【０１５５】
ここで、副走査方向に隣接する縦成分矩形Ａの中心座標間の距離の平均値の求め方について図５５を参照しつつ詳述する。
１．図５５に示すように、今注目している縦成分矩形Ａ１の中心座標を（Ｘ０，Ｙ０）とし、副走査方向に隣接する縦成分矩形Ａ２の中心座標を（Ｘ１，Ｙ１）とする。
２．副走査方向での縦成分矩形の中心座標間の距離Ｗ（Ｗ＝Ｘ１−Ｘ０）を求める。
３．単語間の距離を対象とすると、距離Ｗの値が大きくなり不安定になってしまう。そこで、距離Ｗがある一定値以上のものは排除する。
４．縦成分矩形の中心座標間の中点Ｃ（Ｃ＝（Ｘ０＋Ｘ１）／２）を求め、距離Ｗの中点Ｃが属する短冊領域Ｚを求める（図５５の例では、中点Ｃは短冊領域Ｚ１に属する）。
５．各短冊領域Ｚ内の縦成分矩形Ａ間の距離Ｗの平均値を求める。
【０１５６】
なお、短冊領域Ｚの位置の変化に対する縦成分矩形Ａ間の距離Ｗの平均の変化にフィルタリング処理を施して、短冊領域Ｚの位置の変化に対する縦成分矩形Ａ間の距離Ｗの平均の変化がなだらかになるようにしても良い。
【０１５７】
このようにして各短冊領域内の距離Ｗの平均値を求めた後、各短冊領域内の距離Ｗの平均値から、短冊領域毎の副走査方向変倍率を算出する（ステップＳ３０４：変倍率算出手段）。副走査方向変倍率は、非歪み領域と歪み領域で縦成分矩形Ａ間の距離を各短冊領域で同じにするものである。本実施の形態においては、ある基準となる短冊領域Ｚを定め、その基準短冊領域Ｚの縦成分矩形Ａ間の距離Ｗの平均を原稿画像全体の基準矩形間距離とし、
（基準矩形間距離）／（各短冊領域の矩形間距離の平均）
の値を、当該短冊領域の副走査方向変倍率とする。なお、全短冊領域の矩形間距離の平均の最大値を基準矩形間距離とすることが好ましい。
【０１５８】
なお、各短冊領域Ｚの境界部で副走査方向変倍率が連続的に変化するように副走査方向変倍率を補正するようにしても良い。
【０１５９】
最後に、スキャン画像に対して、ステップＳ３０４で算出した短冊領域毎の副走査方向変倍率に応じて短冊領域Ｚの短辺方向（副走査方向）の拡大処理を行い、書籍原稿４０のページ綴じ部４１付近の歪みを補正する（ステップＳ３０５）。なお、画像の拡大処理は、例えばコピーの変倍機能として良く使われる３次関数のコンボリューション法等を用いて実行される。
【０１６０】
以上により副走査方向歪み補正処理（ステップＳ５５）が終了し、図６に示すスキャン画像の歪み補正処理が終了する。ここで、図５６は歪みを補正した画像を示す平面図である。以上の処理によれば、図８に示したような書籍原稿４０のページ綴じ部４１の近傍において生じていたスキャン画像の歪みが、図５６に示すように補正されることになる。
【０１６１】
このように本実施の形態によれば、スキャン画像内の文字サイズに合わせて変更される閾値（第１閾値および第２閾値）を用いて抽出された黒画素ランを基に縦成分矩形が抽出され、縦成分矩形間の主走査方向および副走査方向の距離を基に文字行が抽出される。すなわち、文字サイズに合わせて閾値を変更する（例えば、英文画像のように文字が小さい場合にはランとして登録する時の長さの最小値を小さくする）ことで、確実に縦成分矩形を抽出できるようになり縦成分矩形の抽出漏れが防止されるとともに、このようにして抽出された縦成分矩形を用いることで隣接する文字の接触が防止される。このような縦成分矩形から近似曲線を求めることにより、スキャン画像内の文字サイズに関係なく画像の主走査方向の歪み補正における精度の高精度化を図ることが可能になる。
【０１６２】
また、文字サイズに応じて縦成分矩形の主走査方向の長さを規定する第３閾値が設定され、縦成分矩形の主走査方向の長さが第３閾値以上の場合、当該縦成分矩形の長さが当該第３閾値の長さに縮められることにより、小さい文字の縦成分矩形を極端に短くすることを防止しつつ主走査方向に矩形が接触するのを防ぐことが可能になるので、複数分の行が一行と誤認識されやすいという事態が回避され、安定した行統合が可能になる。
【０１６３】
さらに、文字行を抽出する際の主走査方向の統合距離である第４閾値が文字サイズに応じて設定され、第４閾値により規定された文字行を抽出する際の主走査方向の統合距離に従って文字行が抽出される。これにより、英語文のように日本語文に比べて主走査方向の矩形間距離が短くなるような場合には、行抽出時の主走査方向の統合距離である第４閾値を小さくすることで、過剰な行統合を回避することが可能になる。
【０１６４】
さらにまた、文字サイズに基づいて短冊領域の幅が決定され、この幅に基づいて縦成分矩形の中心座標間の距離の平均が短冊単位で求められ、非歪み領域と歪み領域で矩形間距離が同じになるような副走査方向変倍率が算出される。すなわち、文字サイズに合わせて閾値を変更する（例えば、英文画像のように文字が小さい場合には短冊領域の幅を小さくする）ことで、短冊領域毎の副走査方向変倍率の精度を高精度にすることが可能になる。これにより、スキャン画像内の文字サイズに関係なく画像の副走査方向の歪み補正における精度の高精度化を図ることが可能になる。
【０１６５】
［第二の実施の形態］
本発明の第二の実施の形態を図５７ないし図６５に基づいて説明する。なお、前述した第一の実施の形態と同一部分は同一符号で示し説明も省略する。本実施の形態は、前述した第一の実施の形態とは、図４３のステップＳ５５における副走査方向の歪み補正処理が異なるものである。本実施の形態は、スキャナ部１（画像読取手段）の固有パラメータ（レンズの焦点面距離、スキャン光軸の位置（アドレス））が未知の場合における副走査方向歪み補正処理である。
【０１６６】
図５７は、固有パラメータが未知の場合における副走査方向歪み補正処理の流れを概略的に示すフローチャートである。図５７に示すように、ステップＳ１０１においては、主走査方向歪み補正されたスキャン画像に基づいて文字の外接矩形Ａ（図５８参照）を抽出する。ここで、文字認識処理については周知の技術であるので、その説明は省略する。このように文字の外接矩形Ａを抽出するのは、この文字の外接矩形Ａの形状の変化を基に、副走査方向の歪みを補正するためである。ここでは、図５８に示すように、文字外接矩形Ａの横辺の長さｗ、縦辺の長さｈ、および、文字の中心Ｂを定義する。ここで、文字の中心Ｂは、外接矩形Ａの対角線の交点である。
【０１６７】
続いて、図５９に示すように、スキャン画像を書籍原稿４０のページ綴じ部４１に平行な方向の複数の短冊状の領域Ｃに分割した後（ステップＳ１０２）、各短冊領域Ｃについて、そこに含まれる文字外接矩形Ａに関する特徴量を求める（ステップＳ１０３）。ここで、ある短冊領域Ｃに含まれる文字外接矩形Ａとは、その中心が当該短冊領域Ｃに含まれるような外接矩形Ａのことである。例えば、図５９の短冊領域Ｃ１に含まれる外接矩形Ａは、図中の網掛けを施した矩形である。
【０１６８】
さて、上記の文字外接矩形Ａに関する特徴量は、
（文字の横辺の長さ）／（文字の縦辺の長さ）＝ｗ／ｈ
を基に求められる。すなわち、各短冊領域Ｃについて、そこに含まれる全ての文字外接矩形Ａのｗ／ｈの値の平均値をその短冊領域Ｃの特徴量とするのである。
【０１６９】
しかしながら、単に、ｗ／ｈの平均値を算出すると不適切な場合がある。文字の中には、句読点や数式中の記号のようにそのサイズが元々小さく、ｗ／ｈの値が不安定なものがある。また、矩形抽出の際に隣接する文字同士がくっついて抽出されてしまい、ｗが極端に大きい文字外接矩形Ａが生じる場合もある。特徴量を求める場合は、このような特殊な文字や極端にｗが大きいものを予め排除しておく必要がある。そこで、続くステップＳ１０４においては、予め閾値を定めておいて、ｈの値がその閾値より小さな文字外接矩形Ａを予め排除するとともに、ｗ／ｈの比率に関する閾値を予め定めておき、ｗ／ｈの値が其の閾値よりも大きい文字外接矩形Ａも予め排除する。例えば、図６０中に示した網掛けを施した文字外接矩形Ａが予め排除されることになる。
【０１７０】
続くステップＳ１０５においては、前述したように極端な文字外接矩形Ａを排除した後に、各短冊領域Ｃ内の文字外接矩形Ａのｗ／ｈの平均値を求める。図６１に各短冊領域Ｃ内の外接矩形Ａのｗ／ｈの平均値の一例を示す。なお、図６１中の短冊領域Ｃ２は、書籍原稿４０のページ綴じ部４１を含む短冊領域である。
【０１７１】
続いて、書籍原稿４０のページ綴じ部４１を含む短冊領域Ｃ２に文字外接矩形Ａが存在するか否かを判断する（ステップＳ１０６）。これは、図６０に示すように、一般には書籍原稿４０のページ綴じ部４１付近には文字外接矩形Ａが存在しない場合が多いからである。書籍原稿４０のページ綴じ部４１を含む短冊領域Ｃ２に文字外接矩形Ａが存在する場合は（ステップＳ１０６のＹ）、その文字外接矩形Ａを利用して特徴量は算出されているのでそのままステップＳ１０８に進む。
【０１７２】
一方、書籍原稿４０のページ綴じ部４１を含む短冊領域Ｃ２に文字外接矩形Ａが存在しない場合は（ステップＳ１０６のＮ）、ステップＳ１０７に進み、書籍原稿４０のページ綴じ部４１を含む短冊領域Ｃ２の特徴量を求める。なお、書籍原稿４０のページ綴じ部４１を含む短冊領域Ｃ２の識別は、例えば、スキャン画像（例えば、モノクロ多値画像）の地肌濃度変化を各短冊領域Ｃごとに求め、短冊領域Ｃ内の最も濃度の薄い濃度値を求めることにより実現される。図６２は地肌濃度変化を求めた一例を示したものであり、地肌濃度が最も濃い短冊領域が、書籍原稿４０のページ綴じ部４１を含む短冊領域Ｃ２であるとみなされる。
【０１７３】
なお、スキャン画像がカラー多値画像の場合における書籍原稿４０のページ綴じ部４１を含む短冊領域Ｃ２の識別は、例えばＲＧＢ成分の何れか一つの成分（例えばＧ成分）に着目し、そのＧ成分の地肌濃度を使用して識別するようにすれば良い。また、ＲＧＢを色変換して輝度成分と色差成分とに分け、輝度成分を使用して書籍原稿４０のページ綴じ部４１を含む短冊領域Ｃ２を識別するようにしても良い。
【０１７４】
書籍原稿４０のページ綴じ部４１を含む短冊領域Ｃ２の特徴量は、次のようにして定められる。ここでは、統計的特徴量の算出対象となり得る文字外接矩形Ａが存在し、かつ、ページ綴じ部４１を含む短冊領域Ｃ２の最近傍である短冊領域Ｃの特徴量に対して予め定めた定数値を乗じることにより算出された値が、書籍原稿４０のページ綴じ部４１を含む短冊領域Ｃ２における特徴量とみなされるものである。つまり、図６１に示した例では、書籍原稿４０のページ綴じ部４１を含む短冊領域Ｃ２の左右何れの短冊領域Ｃ３，Ｃ４にも文字外接矩形Ａが存在するので、どちらか適当な方の特徴量を選択し（ここでは右側の○印の方）、それに予め定めた定数値（ここでは０．５）を乗じて、これを書籍原稿４０のページ綴じ部４１を含む短冊領域Ｃ２の特徴量としている。
【０１７５】
続くステップＳ１０８においては、各短冊領域Ｃの特徴量に対する適切なフィルタリング処理、例えば、短冊領域Ｃの位置の変化方向（即ち副走査方向）に関する移動平均を求める処理を施すなどして、短冊領域Ｃの位置の変化に対する（副走査方向の）特徴量の変化がなだらかになるようにする。ただし、ここでも書籍原稿４０のページ綴じ部４１付近は特別な処理が必要となる。なぜなら、副走査方向に関して長さが全て等しいウィンドウを用いてフィルタリングを行うと、書籍原稿４０のページ綴じ部４１付近の特徴量の変化の鋭さが失われてしまうからである。
【０１７６】
ここで、長さが全て５であるウィンドウを用いて図６１に示した各短冊領域Ｃの特徴量に対してフィルタリング処理を施した結果を図６３に示す。図６３に示すように、長さが全て５であるウィンドウを用いてフィルタリング処理を施した場合には、書籍原稿４０のページ綴じ部４１付近の特徴量（ｗ／ｈ）の変化がなだらかになり過ぎてしまう。このような場合には、書籍原稿４０のページ綴じ部４１付近での適切な画像補正が不可能になってしまう。
【０１７７】
そこで、本実施の形態においては、フィルタリング処理の際には、フィルタのウィンドウが書籍原稿４０のページ綴じ部４１を含む短冊領域Ｃ２の両側の短冊領域Ｃ３，Ｃ４に跨がらないように、ページ綴じ部４１付近でウィンドウ長を調整する。ここで、図６４はページ綴じ部４１付近でウィンドウ長を調整してフィルタリング処理を施した結果を示すグラフである。図６４に示すように、ページ綴じ部４１付近でウィンドウ長を調整した場合には、ページ綴じ部４１付近の特徴量（ｗ／ｈ）の変化を適切に表現できるので、良好な画像補正が実現できる。
【０１７８】
続くステップＳ１０９においては、各短冊領域Ｃの推定歪み量を算出する。各短冊領域Ｃの推定歪み量の算出手法は、以下に示す通りである。
【０１７９】
まず、短冊領域の歪み量を算出するための基準となる短冊領域（基準短冊領域）を定める。ここでは、歪みが最も小さいと考えられる短冊領域Ｃ、例えば、特徴量（ｗ／ｈ）が最大である短冊領域Ｃを基準短冊領域とする。この処理は左右ページで共通に行っても良いが、左右独立に基準短冊領域を定めても構わない。図６４においては、左右独立に基準短冊領域を定めた例を示しており、○印を施した短冊領域Ｃが基準短冊領域であり、左側の基準特徴量を“Ｌｗ０／Ｌｈ０”、右側の基準特徴量を“Ｒｗ０／Ｒｈ０”、でそれぞれ示している。
【０１８０】
次に、基準短冊領域の特徴量ｗ０／ｈ０をスキャン画像全体の基準特徴量とし、
（各短冊領域の特徴量）／（基準特徴量）＝（ｗ／ｈ）／（ｗ０／ｈ０）
の値を、各短冊領域の推定歪み量として算出する。
【０１８１】
なお、書籍原稿４０のページ綴じ部４１から外れたページ外側付近の短冊領域Ｃを基準短冊領域とすると、書籍原稿４０のページ綴じ部４１付近とはフォントや活字のサイズの違いが大きくて、適切な推定歪み量が算出できない場合も考えられる。そのような画像を対象とする場合は、基準短冊領域の探索範囲を予め書籍原稿４０のページ綴じ部４１付近に限定しておくのが有効である。これを実現するためには、地肌濃度が予め定めた濃度よりも濃い短冊領域Ｃのみから基準短冊領域を求めるようにすれば良い。
【０１８２】
最後に、スキャン画像に対して、短冊領域Ｃの短辺方向（副走査方向）の拡大処理を行い、書籍原稿４０のページ綴じ部４１付近の歪みを補正する（ステップＳ１１０）。その場合の拡大率は、ステップＳ１０９において算出した推定歪み量の逆数、すなわち、
（基準特徴量）／（各短冊領域の特徴量）＝（ｗ０／ｈ０）／（ｗ／ｈ）
とする。ここで、上記の基準短冊領域を左右共通に定めた場合には、この拡大率も左右共通の基準特徴量によって算出し、独立に定めた場合には、左右それぞれの基準特徴量で独立に算出するようにする。図６５は、図６４に示した特徴量に基づいて算出した補正拡大率を示したものである。
【０１８３】
なお、ここでも、書籍原稿４０のページ綴じ部４１付近から離れた短冊領域Ｃはもともと画像の歪みが無い領域である可能性が高いので、拡大処理の対象としない方が良い場合がある。拡大処理を行ったために、かえって不自然な歪みが生じてしまう可能性があるからである。これを防ぐために、地肌濃度が予め定めた濃度よりも薄い短冊領域Ｃについては、推定歪み量を“１”とする。
【０１８４】
また、短冊領域Ｃ内において共通の補正拡大率を適用した場合、隣接する短冊領域Ｃの境界部での補正拡大率が不連続となるため、補正画像が不自然となる。そこで、隣接する短冊領域Ｃの境界部での補正拡大率が連続的に変化するように、補正拡大率を予め補正しておく。これは、例えば図６５に示す短冊領域Ｃの中央部分の補正拡大率を推定歪み量の逆数を示す点としてプロットし、これらの点を線分で結んで直線補完することで、他の部分の補正拡大率とすることで実現できる。以上の処理により、スキャン画像の副走査方向の補正拡大率が確定する。
【０１８５】
なお、画像の拡大処理は、例えばコピーの変倍機能として良く使われる３次関数のコンボリューション法等を用いて実行される。
【０１８６】
以上により副走査方向歪み補正処理が終了し、図６に示すスキャン画像の歪み補正処理が終了する。以上の処理によれば、図８に示したような書籍原稿４０のページ綴じ部４１の近傍において生じていたスキャン画像の歪みが、図５６に示すように補正されることになる。
【０１８７】
［第三の実施の形態］
本発明の第三の実施の形態を図６６ないし図６９に基づいて説明する。なお、前述した第一の実施の形態と同一部分は同一符号で示し説明も省略する。本実施の形態は、前述した第一の実施の形態とは、図４３のステップＳ５５における副走査方向の歪み補正処理が異なるものである。本実施の形態は、スキャナ部１（画像読取手段）の固有パラメータ（レンズの焦点面距離、スキャン光軸の位置（アドレス））が既知の場合における副走査方向歪み補正処理である。
【０１８８】
スキャンの主走査方向と書籍原稿４０のページ綴じ部４１の境界線が平行な場合、レンズユニット１０等のスキャナーレンズによる書籍原稿４０を読み取るとき、結像系は次の特性を持つ。主走査方向は中心投影であり、副走査方向は平射投影である。ここで、これらの特性を利用して、３次元形状復元を行う。
【０１８９】
中心投影する場合、図６６と図６７に示すように書籍原稿４０の表面はコンタクトガラス２の表面から浮いて結像距離が遠くなり、画像の拡大倍率は小さくなるので、外形エッジの直線はだんだん内側に湾曲していく。図６７の縮む量ＡＢを測定すれば、図６６に示す浮いた本の表面の高さｈを計算できる。従って、直線の内側への歪み量を測定すれば、３次元形状（書籍原稿４０のコンタクトガラス２からの浮き上がりの量）を復元できる。
【０１９０】
ここで、書籍原稿４０を水平にコンタクトガラス２上に置くことを仮定する。そうすると、３次元の形状は２次元になる。スキャナーレンズの結像関係を図６８に示す。ＯＯ´はレンズの光軸であり、０はレンズの中心である。Ｆはレンズの中心０からスキャナ表面（コンタクトガラス２）までの距離で、これを、スキャナの焦点距離と言う。スキャナ表面上の点Ｂは結像面でＤに結像する。浮いた製本（書籍原稿４０）の表面上の点ＣはＥに結像する。それぞれの結像面の中心０との距離はｙ´とｙである（第一走行体５および第二走行体８が副走査方向に移動することによって、中心０も移動するが、その軌跡を結像中心線と呼ぶことにする）。三角形の相似関係により次の関係式（６），（７）が得られる。
ｈ／Ｆ＝ＡＢ／ＡＯ´ ・・・（６）
ＡＢ／ＡＯ´＝（ｙ´−ｙ）／ｙ・・・（７）
また、式（６），（７）により、書籍原稿４０の浮き上がりの量ｈが次式（８）により得られる。
ｈ＝Ｆ×（（ｙ´−ｙ）／ｙ）・・・（８）
この式（８）により２次元の歪み量から３次元形状が求められることがわかる。ここで、歪み量（ｙ´−ｙ）と距離yは画像から求められるが、本実施の形態では、これを文字行あるいは罫線の直線成分と曲線部分との距離から求めるものである。レンズの焦点距離Ｆはスキャナ部１によって定まる既知量であり、スキャナ部１の設定値かレンズの校正値を用いる。
【０１９１】
したがって、スキャナ部１（画像読取手段）の固有パラメータ（レンズの焦点面距離、スキャン光軸の位置（アドレス））が既知の場合には、ページ外形／罫線／文字行の湾曲の度合いから書籍表面のスキャン面からの浮きの高さｈを求め、図６９に示すように、副走査方向の１画素分をｍ倍に伸張して継ぎ足すことにより、副走査方向の歪みを補正することができる。
【０１９２】
以上により副走査方向歪み補正処理が終了し、図６に示すスキャン画像の歪み補正処理が終了する。以上の処理によれば、図８に示したような書籍原稿４０のページ綴じ部４１の近傍において生じていたスキャン画像の歪みが、図５６に示すように補正されることになる。
【０１９３】
なお、各実施の形態においては、画像読取装置としてデジタル複写機のスキャナ部１を適用したが、これに限るものではなく、例えば自動ページ捲り機能を搭載したスキャナ等に適用するようにしても良い。
【０１９４】
また、各実施の形態においては、書籍原稿４０のページ綴じ部４１とスキャナ部１の画像読み取りの主走査方向とが平行になるように位置させて書籍原稿４０をコンタクトガラス２上に下向きに載置した場合について説明したが、これに限るものではない。例えば、図７０に示すように、上向きの書籍原稿４０をコンタクトガラス２の下方からコンタクトガラス２に対して押し付けるように接触させるものであっても良い。
【０１９５】
さらに、各実施の形態においては、画像歪み補正装置を画像形成装置であるデジタル複写機１６に備え、デジタル複写機１６のスキャナ部１で読み取ったスキャン画像に対して画像の歪み補正処理を施すようにしたが、これに限るものではない。例えば、原稿画像を読み取る画像読取手段を備えたイメージスキャナをパーソナルコンピュータに接続するとともに、このパーソナルコンピュータのＨＤＤに記憶媒体であるＣＤ−ＲＯＭ３７に格納されたプログラムをインストールすることによって画像歪み補正装置を構成しても、前述したような各種の作用効果と同様の作用効果を得ることができる。また、記憶媒体であるＣＤ−ＲＯＭ３７に格納されたプログラムをパーソナルコンピュータのＨＤＤにインストールすることによって画像歪み補正装置を構成し、予め画像読取手段により読み取られたスキャン画像に対して歪み補正処理を施すようにしても良い。
【図面の簡単な説明】
【０１９６】
【図１】本発明の第一の実施の形態のスキャナ部の構成を示す縦断正面図である。
【図２】スキャナ部を搭載したデジタル複写機の上部部分を示す斜視図である。
【図３】スキャナ部の制御系の電気的な接続を示すブロック図である。
【図４】画像処理部の基本的な内部構成を示すブロック図である。
【図５】メイン制御部の電気的な接続を示すブロック図である。
【図６】スキャン画像の歪み補正処理の流れを概略的に示すフローチャートである。
【図７】スキャナ部のコンタクトガラス上に書籍原稿を載置した状態を示す斜視図である。
【図８】入力した画像の一例を示す平面図である。
【図９】スキャン画像のページ綴じ部の近傍の歪みを示す説明図である。
【図１０】図８に示した画像の黒画素ヒストグラムである。
【図１１】ページ外形／罫線／文字行の抽出処理の流れを概略的に示すフローチャートである。
【図１２】上端にページ外形が存在するスキャン画像の一例を示す説明図である。
【図１３】図１２に示したスキャン画像の綴じ部境界線左側の黒画素ヒストグラムである。
【図１４】長い罫線が存在するスキャン画像の一例を示す説明図である。
【図１５】２値化した画像に矩形抽出を施した結果を示す説明図である。
【図１６】罫線がノイズと接触している場合を示す説明図である。
【図１７】表が含まれる画像を示す説明図である。
【図１８】一定値未満のランのみを登録し矩形を抽出した結果を示す説明図である。
【図１９】副走査方向に矩形が細切れに抽出されてしまう場合を示す説明図である。
【図２０】矩形統合を施した例を示す説明図である。
【図２１】矩形抽出を行った結果を示す説明図である。
【図２２】図８に示した画像の副走査方向の黒白反転数ヒストグラムである。
【図２３】図８に示した画像の主走査方向の黒白反転数ヒストグラムである。
【図２４】標準矩形サイズの算出を行うための領域を示す説明図である。
【図２５】必要な指定領域内の文字の外接矩形を示す説明図である。
【図２６】文字の外接矩形の主走査方向における距離を求める手法を示す説明図である。
【図２７】横書き文字行候補の検出の結果の一例を示す説明図である。
【図２８】縦成分矩形を縮める手法を示す説明図である。
【図２９】縦成分矩形を主走査方向に縮める長さの閾値の計算結果の一例を示すグラフである。
【図３０】縦成分矩形を縮めた横書き文字行候補の検出の結果の一例を示す説明図である。
【図３１】主走査方向間に隣接する矩形の行統合を示す説明図である。
【図３２】（ａ）は縦成分矩形による近似曲線の生成を示す説明図、（ｂ）は行を拡大して示す説明図である。
【図３３】矩形抽出を行った結果を示す説明図である。
【図３４】ページ外形に歪みを生じている部分がまだらに読み取られているような場合に、この部分を横書き文字行として認識する場合を示す説明図である。
【図３５】各縦書き文字行からの横書き文字行の抽出処理の流れを概略的に示すフローチャートである。
【図３６】抽出した行切り出し矩形を例示的に示す説明図である。
【図３７】予め定めた距離範囲内に先頭が存在する縦書き文字行を例示的に示す説明図である。
【図３８】抽出した縦書き文字行の先頭のｙ座標に関してヒストグラムを構成する状態を示す説明図である。
【図３９】画像の歪みを生じていない部分における処理を示す説明図である。
【図４０】画像の歪みを生じている部分における処理を示す説明図である。
【図４１】抽出した縦書き文字行を示す説明図である。
【図４２】縦書き文字行の行切り出し矩形を示す説明図である。
【図４３】画像歪み補正処理の流れを概略的に示すフローチャートである。
【図４４】スキャン画像の上辺及び下辺のいずれにも「ページ外形」が存在する場合を示す説明図である。
【図４５】図４４を画素シフトした状態を示す説明図である。
【図４６】スキャン画像の上辺及び下辺の何れか一方に「ページ外形」が存在し、他方の辺には「罫線」と「文字行」とが存在する場合を示す説明図である。
【図４７】図４６を画素シフトした状態を示す説明図である。
【図４８】スキャン画像の左右両ページの上辺及び下辺の何れか一方に「罫線」が存在し、他方の辺には「罫線」と「文字行」とが存在する場合を示す説明図である。
【図４９】図４８を画素シフトした状態を示す説明図である。
【図５０】スキャン画像の左右両ページの上辺及び下辺の何れか一方に「罫線」と「文字行」とが存在し、他方の辺の一方のページのみに「罫線」が存在する場合を示す説明図である。
【図５１】図５０を画素シフトした状態を示す説明図である。
【図５２】スキャン画像の左右何れかのページの上辺及び下辺の何れか一方に「罫線」が存在し、他方の辺の他方のページのみに「文字行」が存在する場合を示す説明図である。
【図５３】副走査方向歪み補正処理の流れを概略的に示すフローチャートである。
【図５４】書籍原稿のページ綴じ部に平行な方向の複数の短冊状の領域に分割した状態を示す説明図である。
【図５５】副走査方向に隣接する縦成分矩形の中心座標間の距離の算出を示す説明図である。
【図５６】歪みを補正した画像を示す平面図である。
【図５７】本発明の第二の実施の形態の副走査方向歪み補正処理の流れを概略的に示すフローチャートである。
【図５８】抽出された文字外接矩形を示す説明図である。
【図５９】二値化画像を書籍原稿のページ綴じ部に平行な方向の複数の短冊状の領域に分割した状態を示す説明図である。
【図６０】予め排除される文字外接矩形を示す説明図である。
【図６１】各短冊領域内の外接矩形の特徴量の平均値の一例を示すグラフである。
【図６２】各短冊領域内の地肌濃度変化の一例を示すグラフである。
【図６３】図６１に示した各短冊領域の特徴量に対して長さが全て５であるウィンドウを用いてフィルタリング処理を施した結果を示すグラフである。
【図６４】図６１に示した各短冊領域の特徴量に対してページ綴じ部付近でウィンドウ長を調整してフィルタリング処理を施した結果を示すグラフである。
【図６５】図６４に示した特徴量に基づいて算出した補正拡大率を示すグラフである。
【図６６】本発明の第三の実施の形態の副走査方向歪み補正処理の説明のために本の表面の浮いた高さを示す説明図である。
【図６７】画像が縮む量を示す説明図である。
【図６８】スキャナーレンズの結像関係を示す説明図である。
【図６９】固有パラメータが既知の場合における副走査方向歪み補正処理を示す説明図である。
【図７０】コンタクトガラスに書籍原稿を接触させた状態を示す正面図である。
【図７１】コンタクトガラス上に書籍原稿を載置した状態を示す正面図である。
【図７２】文字単位の矩形抽出を示し、（ａ）は日本語の矩形抽出、（ｂ）は英文の矩形抽出を示す説明図である。
【図７３】複数分の行が一行と誤認識される場合を示す説明図である。
【図７４】文字単位のアスペクト比を示し、（ａ）は日本語のアスペクト比、（ｂ）は英語のアスペクト比を示す説明図である。
【符号の説明】
【０１９７】
１画像読取装置
１６画像形成装置
１９画像歪み補正装置
３７記憶媒体
４０書籍原稿
４１ページ綴じ部

【特許請求の範囲】
【請求項１】
画像読取手段の主走査方向に対してページ綴じ部がほぼ平行となるようにスキャン面の上もしくは下に接触した書籍原稿画像を前記画像読取手段により読み取ったスキャン画像の歪みを当該スキャン画像内の文字行の形状を基に補正する画像歪み補正装置において、
前記スキャン画像内の文字のサイズを算出するサイズ算出手段と、
算出した文字サイズに応じ、黒画素ランの抽出に用いる閾値を設定する第１の閾値設定手段と、
前記スキャン画像から主走査方向に前記閾値の数の黒画素が連結する黒画素ランのみを抽出するラン抽出手段と、
抽出した黒画素ランを基に縦成分のみの矩形を縦成分矩形として抽出する縦成分矩形抽出手段と、
抽出した縦成分矩形間の主走査方向および副走査方向の距離を基に文字行を抽出する文字行抽出手段と、
抽出した文字行の中から、前記スキャン画像の歪み補正に利用するための文字行を決定する文字行決定手段と、
決定した文字行中に存在する各縦成分矩形を基に近似曲線を算出する近似曲線算出手段と、
を備えることを特徴とする画像歪み補正装置。
【請求項２】
前記サイズ算出手段により算出した文字サイズに応じ、縦成分矩形の主走査方向の長さを規定する第３閾値を設定する第２の閾値設定手段と、
前記縦成分矩形抽出手段により抽出した縦成分矩形の主走査方向の長さが前記第３閾値以上の場合、当該縦成分矩形の長さを当該第３閾値の長さに縮める縮小手段と、
を備えることを特徴とする請求項１記載の画像歪み補正装置。
【請求項３】
前記サイズ算出手段により算出した文字サイズに応じ、前記文字行抽出手段における文字行を抽出する際の主走査方向の統合距離である第４閾値を設定する第３の閾値設定手段を備え、
前記文字行抽出手段は、前記第４閾値により規定された文字行を抽出する際の主走査方向の統合距離に従って文字行を抽出する、
ことを特徴とする請求項１または２記載の画像歪み補正装置。
【請求項４】
前記サイズ算出手段は、前記スキャン画像中に前記文字サイズの算出を行うための領域を指定し、この指定領域内における標準的な文字の外接矩形を抽出し、抽出した文字の外接矩形の主走査方向における距離を前記文字サイズとして算出する、
ことを特徴とする請求項１記載の画像歪み補正装置。
【請求項５】
前記サイズ算出手段は、前記スキャン画像のページ綴じ部を境にした左右両側に前記文字サイズの算出を行うための領域を指定し、これらの指定領域の何れかで前記文字サイズが算出されなかった場合、前記文字サイズが算出された側の前記文字サイズを採用する、
ことを特徴とする請求項４記載の画像歪み補正装置。
【請求項６】
前記サイズ算出手段は、前記スキャン画像のページ綴じ部を境にした左右両側に前記文字サイズの算出を行うための領域を指定し、これらの指定領域の両方で前記文字サイズが算出されなかった場合、予め定められた一定の値を前記文字サイズとする、
ことを特徴とする請求項４記載の画像歪み補正装置。
【請求項７】
前記サイズ算出手段は、前記スキャン画像のページ綴じ部を境にした左右両側に前記文字サイズの算出を行うための領域を指定し、これらの指定領域の両方で算出された前記文字サイズを比較し、小さい方の前記文字サイズを両方の前記文字サイズとして採用する、
ことを特徴とする請求項４記載の画像歪み補正装置。
【請求項８】
前記文字行決定手段は、ページ綴じ部付近まで最も食い込んでいる文字行を前記スキャン画像の歪み補正に利用するための文字行と決定する、
ことを特徴とする請求項１ないし７のいずれか一記載の画像歪み補正装置。
【請求項９】
前記文字行決定手段は、副走査方向の長さが最も長い文字行を前記スキャン画像の歪み補正に利用するための文字行と決定する、
ことを特徴とする請求項１ないし７のいずれか一記載の画像歪み補正装置。
【請求項１０】
前記文字行決定手段は、前記スキャン画像のページ外形に最も近い文字行を前記スキャン画像の歪み補正に利用するための文字行と決定する、
ことを特徴とする請求項１ないし７のいずれか一記載の画像歪み補正装置。
【請求項１１】
前記文字行決定手段は、前記スキャン画像の歪み補正に利用するための文字行を、ページ綴じ部付近まで最も食い込んでいる文字行、副走査方向の長さが最も長い文字行、前記スキャン画像のページ外形に最も近い文字行の順に決定する、
ことを特徴とする請求項１ないし７のいずれか一記載の画像歪み補正装置。
【請求項１２】
主走査方向の歪み補正後の各文字行内にて隣接する縦成分矩形の中心座標間の副走査方向の距離を矩形間距離として検出する距離検出手段と、
主走査方向の歪み補正後の画像を主走査方向に平行な方向を長辺とする短冊状の複数の領域に分割し、各短冊領域内での矩形間距離の平均を基に非歪み領域と歪み領域で矩形間距離が同じになるような前記スキャン画像の短冊領域毎の副走査方向変倍率を算出する変倍率算出手段と、
を備え、
前記短冊領域の幅は、前記サイズ算出手段により算出した文字サイズに基づいて決定される、
ことを特徴とする請求項１ないし１１のいずれか一記載の画像歪み補正装置。
【請求項１３】
原稿画像を読み取る画像読取手段と、
この画像読取手段により読み取られたスキャン画像の補正を行う請求項１ないし１２のいずれか一記載の画像歪み補正装置と、
を備えることを特徴とする画像読取装置。
【請求項１４】
原稿画像を読み取る画像読取手段と、
この画像読取手段により読み取られたスキャン画像の補正を行う請求項１ないし１２のいずれか一記載の画像歪み補正装置と、
この画像歪み補正装置から出力される画像データに基づいた画像を用紙上に印刷する画像印刷装置と、
を備えることを特徴とする画像形成装置。
【請求項１５】
画像読取手段の主走査方向に対してページ綴じ部がほぼ平行となるようにスキャン面の上もしくは下に接触した書籍原稿画像を前記画像読取手段により読み取ったスキャン画像の歪みを当該スキャン画像内の文字行の形状を基に補正する処理をコンピュータに実行させるプログラムであって、前記コンピュータに、
前記スキャン画像内の文字のサイズを算出するサイズ算出機能と、
算出した文字サイズに応じ、黒画素ランの抽出に用いる閾値を設定する第１の閾値設定機能と、
前記スキャン画像から主走査方向に前記閾値の数の黒画素が連結する黒画素ランのみを抽出するラン抽出機能と、
抽出した黒画素ランを基に縦成分のみの矩形を縦成分矩形として抽出する縦成分矩形抽出機能と、
抽出した縦成分矩形間の主走査方向および副走査方向の距離を基に文字行を抽出する文字行抽出機能と、
抽出した文字行の中から、前記スキャン画像の歪み補正に利用するための文字行を決定する文字行決定機能と、
決定した文字行中に存在する各縦成分矩形を基に近似曲線を算出する近似曲線算出機能と、
を実行させることを特徴とするプログラム。
【請求項１６】
前記サイズ算出機能により算出した文字サイズに応じ、縦成分矩形の主走査方向の長さを規定する第３閾値を設定する第２の閾値設定機能と、
前記縦成分矩形抽出機能により抽出した縦成分矩形の主走査方向の長さが前記第３閾値以上の場合、当該縦成分矩形の長さを当該第３閾値の長さに縮める縮小機能と、
を前記コンピュータに実行させることを特徴とする請求項１５記載のプログラム。
【請求項１７】
前記サイズ算出機能により算出した文字サイズに応じ、前記文字行抽出機能における文字行を抽出する際の主走査方向の統合距離である第４閾値を設定する第３の閾値設定機能を前記コンピュータに実行させ、
前記文字行抽出機能は、前記第４閾値により規定された文字行を抽出する際の主走査方向の統合距離に従って文字行を抽出する、
ことを特徴とする請求項１５または１６記載のプログラム。
【請求項１８】
前記サイズ算出機能は、前記スキャン画像中に前記文字サイズの算出を行うための領域を指定し、この指定領域内における標準的な文字の外接矩形を抽出し、抽出した文字の外接矩形の主走査方向における距離を前記文字サイズとして算出する、
ことを特徴とする請求項１５記載のプログラム。
【請求項１９】
前記サイズ算出機能は、前記スキャン画像のページ綴じ部を境にした左右両側に前記文字サイズの算出を行うための領域を指定し、これらの指定領域の何れかで前記文字サイズが算出されなかった場合、前記文字サイズが算出された側の前記文字サイズを採用する、
ことを特徴とする請求項１８記載のプログラム。
【請求項２０】
前記サイズ算出機能は、前記スキャン画像のページ綴じ部を境にした左右両側に前記文字サイズの算出を行うための領域を指定し、これらの指定領域の両方で前記文字サイズが算出されなかった場合、予め定められた一定の値を前記文字サイズとする、
ことを特徴とする請求項１８記載のプログラム。
【請求項２１】
前記サイズ算出機能は、前記スキャン画像のページ綴じ部を境にした左右両側に前記文字サイズの算出を行うための領域を指定し、これらの指定領域の両方で算出された前記文字サイズを比較し、小さい方の前記文字サイズを両方の前記文字サイズとして採用する、
ことを特徴とする請求項１８記載のプログラム。
【請求項２２】
前記文字行決定機能は、ページ綴じ部付近まで最も食い込んでいる文字行を前記スキャン画像の歪み補正に利用するための文字行と決定する、
ことを特徴とする請求項１５ないし２１のいずれか一記載のプログラム。
【請求項２３】
前記文字行決定機能は、副走査方向の長さが最も長い文字行を前記スキャン画像の歪み補正に利用するための文字行と決定する、
ことを特徴とする請求項１５ないし２１のいずれか一記載のプログラム。
【請求項２４】
前記文字行決定機能は、前記スキャン画像のページ外形に最も近い文字行を前記スキャン画像の歪み補正に利用するための文字行と決定する、
ことを特徴とする請求項１５ないし２１のいずれか一記載のプログラム。
【請求項２５】
前記文字行決定機能は、前記スキャン画像の歪み補正に利用するための文字行を、ページ綴じ部付近まで最も食い込んでいる文字行、副走査方向の長さが最も長い文字行、前記スキャン画像のページ外形に最も近い文字行の順に決定する、
ことを特徴とする請求項１５ないし２１のいずれか一記載のプログラム。
【請求項２６】
主走査方向の歪み補正後の各文字行内にて隣接する縦成分矩形の中心座標間の副走査方向の距離を矩形間距離として検出する距離検出機能と、
主走査方向の歪み補正後の画像を主走査方向に平行な方向を長辺とする短冊状の複数の領域に分割し、各短冊領域内での矩形間距離の平均を基に非歪み領域と歪み領域で矩形間距離が同じになるような前記スキャン画像の短冊領域毎の副走査方向変倍率を算出する変倍率算出機能と、
を前記コンピュータに実行させ、
前記短冊領域の幅は、前記サイズ算出手段により算出した文字サイズに基づいて決定される、
ことを特徴とする請求項１５ないし２５のいずれか一記載のプログラム。
【請求項２７】
請求項１５ないし２６のいずれか一記載のプログラムを記憶することを特徴とする記憶媒体。

【図１】