説明

画像処理装置、画像処理用プログラムおよびこれが記録される記録媒体

【課題】簡単に、かつ短時間に画像の向きを検出することができる、汎用性の高い画像処理装置、この機能をコンピュータに実現させる画像処理用プログラム、およびこれが記録される記録媒体を提供する。
【解決手段】領域設定部12は、画像をその長辺方向に横切る長辺方向領域と、画像をその短辺方向に横切る短辺方向領域とを設定する。文字個別認識部13は、画像中において隣合う文字と文字とを区別し、1文字ずつ個別認識する。文字数計数部14は、長辺方向領域内で長辺方向に並ぶ文字の文字数を計数し、短辺方向領域内で短辺方向に並ぶ文字の文字数を計数する。判別部16は、長辺方向に計数された計数結果と、短辺方向に計数された計数結果との大小関係を判別する。画像回転部17は、判別部16による判別結果に基づいて、画像を回転させる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像の向きを検出する画像処理装置、この機能をコンピュータに実現させる画像処理用プログラム、およびこれが記録される記録媒体に関する。
【背景技術】
【0002】
第1の従来技術に係る画像処理装置では、画像中の文字の方向の検知を行い、そのデータに基づいて画像データを処理することによって、所望の方向の出力画像を形成する(たとえば特許文献1参照)。
【0003】
第2の従来技術に係る画像処理装置では、ヘッダおよびフッタの有無を認識し、ヘッダおよびフッタの位置を判定することによって、原稿方向の違いを検出する(たとえば特許文献2参照)。
【0004】
【特許文献1】特開平6−103410号公報
【特許文献2】特開2002−57891号公報
【発明の開示】
【発明が解決しようとする課題】
【0005】
第1の従来技術では、文字の向きを認識する必要が生じ、簡単で高速な処理ができないという問題点がある。
【0006】
第2の従来技術では、ヘッダおよびフッタ領域に記載のない文書について、原稿の向きを検出できないという問題点がある。
【0007】
本発明の目的は、簡単に、かつ短時間に画像の向きを検出することができる、汎用性の高い画像処理装置、この機能をコンピュータに実現させる画像処理用プログラム、およびこれが記録される記録媒体を提供することである。
【課題を解決するための手段】
【0008】
本発明に従えば、画像処理装置は、画像読取部と、領域設定部と、文字個別認識部と、文字数計数部と、判別部と、画像回転部とを含んで構成される。画像読取部は、原稿を、長方形の画像として読取る。領域設定部は、長辺方向領域と、短辺方向領域とを設定する。長辺方向領域は、画像をその長辺方向に横切る。短辺方向領域は、画像をその短辺方向に横切る。文字個別認識部は、画像中において隣合う文字と文字とを区別し、1文字ずつ個別認識する。文字数計数部は、長辺方向領域内で長辺方向に並ぶ文字の文字数を計数し、短辺方向領域内で短辺方向に並ぶ文字の文字数を計数する。判別部は、文字数計数部によって長辺方向に計数された計数結果と、短辺方向に計数された計数結果との大小関係を判別する。画像回転部は、判別部による判別結果に基づいて、画像を回転させる。
【0009】
また本発明に従えば、画像処理用プログラムは、コンピュータを、読取制御部と、領域設定部と、文字個別認識部と、文字数計数部と、判別部と、画像回転部として機能させる。読取制御部は、画像読取部を制御し、画像読取部は、原稿を、長方形の画像として読取る。領域設定部は、長辺方向領域と、短辺方向領域とを設定する。長辺方向領域は、画像をその長辺方向に横切る。短辺方向領域は、画像をその短辺方向に横切る。文字個別認識部は、画像中において隣合う文字と文字とを区別し、1文字ずつ個別認識する。文字数計数部は、長辺方向領域内で長辺方向に並ぶ文字の文字数を計数し、短辺方向領域内で短辺方向に並ぶ文字の文字数を計数する。判別部は、文字数計数部によって長辺方向に計数された計数結果と、短辺方向に計数された計数結果との大小関係を判別する。画像回転部は、判別部による判別結果に基づいて、画像を回転させる。
【0010】
また本発明に従えば、記録媒体には、前記画像処理用プログラムが、コンピュータに読取り可能に記録される。
【発明の効果】
【0011】
本発明によれば、領域設定部は、長辺方向領域と、短辺方向領域とを設定する。判別部は、文字数計数部によって長辺方向に計数された計数結果と、短辺方向に計数された計数結果との大小関係を判別する。画像回転部は、判別部による判別結果に基づいて、画像を回転させる。これによって、画像の向きを原稿の向きに沿って判別することができる。文字の向きを検出する必要がないので、簡単に画像の向きを検出することができる。したがって、文字の向きを検出して画像の向きを判別する場合に比べて、高速な処理を実現することができる。またヘッダおよびフッタ領域の記載の有無に関係なく画像の向きを検出することができる。したがって、汎用性の高い画像処理装置を実現することができる。
【0012】
また本発明によれば、画像処理用プログラムは、コンピュータを、読取制御部と、領域設定部と、文字個別認識部と、文字数計数部と、判別部と、画像回転部として機能させる。読取制御部は、画像読取部を制御する。これによって、高速な処理を行うことを可能とすることができる。
【0013】
また本発明によれば、記録媒体には、前記画像処理用プログラムが、コンピュータに読取り可能に記録される。これによって、画像処理用プログラムを、コンピュータが読取り可能な状態で、記録媒体として保存することができる。
【発明を実施するための最良の形態】
【0014】
以下、図面を参照しながら本発明を実施するための形態を、複数の形態について説明する。以下の説明においては、各形態に先行する形態ですでに説明している事項に対応している部分には同一の参照符を付し、重複する説明を略する場合がある。構成の一部のみを説明している場合、構成の他の部分は、先行して説明している形態と同様とする。実施の各形態で具体的に説明している部分の組合せばかりではなく、特に組合せに支障が生じなければ、実施の形態同士を部分的に組合せることも可能である。またそれぞれの実施形態は、本発明に係る技術を具体化するために例示するものであり、本発明の技術的範囲を限定するものではない。以下の説明は、画像処理装置10、画像処理用プログラムおよびこれが記録される記録媒体についての説明をも含む。
【0015】
(第1実施形態)
図1は、本発明の第1実施形態に係る画像処理装置10の構成を表すブロック図である。画像処理装置10は、画像の向きを検出し、その検出結果に応じて画像を処理する装置である。画像処理用プログラムは、コンピュータに画像処理装置10の少なくとも一部の機能を実現させるためのプログラムである。記録媒体は、画像処理用プログラムが、コンピュータに読取り可能に記録される媒体である。本実施形態において画像処理装置10は、コンピュータを含んで構成されており、たとえばプリント機能、コピー機能、ファクシミリ送受信機能等を有するデジタル複合機の少なくとも一部を構成する装置である。
【0016】
画像処理装置10は、画像読取部11と、領域設定部12と、文字個別認識部13と、文字数計数部14と、判別部16と、画像回転部17とを含んで構成される。画像読取部11は、原稿を、長方形の画像として読取る。領域設定部12は、長辺方向領域18と、短辺方向領域19とを設定する。長辺方向領域18は、画像をその長辺方向に横切る。短辺方向領域19は、画像をその短辺方向に横切る。文字個別認識部13は、画像中において隣合う文字と文字とを区別し、1文字ずつ個別認識する。
【0017】
文字数計数部14は、長辺方向領域18内で長辺方向に並ぶ文字の文字数を計数し、短辺方向領域19内で短辺方向に並ぶ文字の文字数を計数する。判別部16は、文字数計数部14によって長辺方向に計数された計数結果と、短辺方向に計数された計数結果との大小関係を判別する。画像回転部17は、判別部16による判別結果に基づいて、画像を回転させる。
【0018】
画像読取部11は、複数の原稿を複数の画像として順に読取り、画像回転部17は、複数の画像のうち第2以降の画像における判別結果が、複数の画像のうちの第1の画像における判別結果と統一される向きに、第2以降の画像を統一する。画像処理装置10は、姿勢情報追記部20をさらに含む。姿勢情報追記部20は、画像回転部17が向きを統一した複数の画像に対し、各画像の向きの情報を各画像の画像情報に追記する。
【0019】
図2は、本発明の第1実施形態における画像の一例と、設定された長辺方向領域18および短辺方向領域19とを表す図である。領域設定部12は、長辺方向領域18および短辺方向領域19を、1つの画像に対してそれぞれ複数設定し、文字数計数部14は、複数の長辺方向領域18および複数の短辺方向領域19において文字数を計数する。
【0020】
複数の長辺方向領域18のうちの2つは、文字を含む領域のうち、短辺方向に互いに最も遠くに位置する領域として設定され、複数の短辺方向領域19のうちの2つは、文字を含む領域のうち、長辺方向に互いに最も遠くに位置する領域として設定され、文字数計数部14は、最も短辺方向一方Y1に位置する長辺方向領域18のうち最も短辺方向一方Y1に位置する文字の文字数を計数し、最も短辺方向他方Y2に位置する長辺方向領域18のうち最も短辺方向他方Y2に位置する文字の文字数を計数し、最も長辺方向一方X1に位置する短辺方向領域19のうち最も長辺方向一方X1に位置する文字の文字数を計数し、最も長辺方向他方X2に位置する短辺方向領域19のうち最も長辺方向他方X2に位置する文字の文字数を計数する。
【0021】
長辺方向に離れる2つの短辺方向領域19のうち、長辺方向一方X1の短辺方向領域19を第1領域21とし、短辺方向に離れる2つの長辺方向領域18のうち、短辺方向一方Y1の長辺方向領域18を第2領域22とする。長辺方向に離れる2つの短辺方向領域19のうち、長辺方向他方X2の短辺方向領域19を第3領域23とし、短辺方向に離れる2つの長辺方向領域18のうち、短辺方向他方Y2の長辺方向領域18を第4領域24とする。
【0022】
第1〜第4領域21〜24は、文字が含まれる領域のうち最も外方に位置する領域として選択される。第1および第3領域23の幅寸法、すなわち長辺方向の長さは、1文字以上を含む長さに設定される。第2および第4領域22,24の幅寸法、すなわち短辺方向の長さも、1文字以上を含む長さに設定される。第1領域21を設定した後、文字個別認識部13によって認識を試み、第1領域21において文字が認識されない場合には、第1領域21を長辺方向他方X2へ拡張する。第2〜第4領域22,24においても同様に、設定した後、文字個別認識部13によって認識を試み、第2〜第4領域22,24の各領域において文字が認識されない場合には、第2領域22は、短辺方向他方Y2へ、第3領域23は、長辺方向一方X1へ、第4領域24は短辺方向一方Y1へ、領域を拡張する。すなわち、第1〜第4領域21〜24を、それぞれ画像の中央寄りに拡張する。
【0023】
その後、第1および第3領域23においては短辺方向に並ぶ文字の文字数と、第2および第4領域22,24において長辺方向領域18に並ぶ文字の文字数とを計数する。判別部16は、第1〜第4領域21〜24における計数結果を比較し、計数結果が大きかった順に、各領域を序列化する。第1実施形態においては、第1および第3領域23のうち、文字数が多かった領域を画像の上方であるとすることによって、画像の上下を認識する。
【0024】
ただし他の実施形態においては、たとえば第1および第3領域23のうち、計数結果が大きかった方を、短辺方向の文字数として採用し、第2および第4領域22,24のうち、計数結果が大きかった方を、長辺方向の文字数として採用する構成とする構成も、可能である。その場合には、長辺方向の文字数および短辺方向の文字数のうち、多い文字数に対応する方向を、原稿の横方向であると判別してもよい。原稿の横方向と判断された方向に延びる2つの領域の文字数を比較し、文字数の多かった領域を、画像の上方であると判断してもよい。
【0025】
またさらに他の実施形態においては、また第1および第3領域23における計数結果を平均して短辺方向の文字数とし、第2および第4領域22,24における計数結果を平均して長辺方向の文字数として、多い文字数に対応する方向を原稿の横方向であると判別してもよい。
【0026】
その後、画像の上方であると判別された画像における向きを、画像を回転する。画像の情報には、画像を表示または記録する場合における上下左右の向きの情報が含まれる。この画像の向きを変更することによって、表示または記録される場合に、画像は回転される。画像が記録される場合とは、たとえば印刷などによって記録担体に記録する場合などである。画像の向きの変更は、画像回転部17によって行われる。画像回転部17は、画像を角度90度、180度、270度に回転させることができ、判別部16による判別結果に応じて画像を回転させる。
【0027】
第1実施形態において画像処理装置10は、判別部16による判別結果を記憶する結果記憶部をさらに備え、結果記憶部は、各長辺方向領域18の位置情報と各短辺方向領域19の位置情報とを、各長辺方向領域18および各短辺方向領域19に含まれる各計数結果に関連付けて記憶する。画像処理装置10は、コンピュータを含んで構成されており、コンピュータは、読取制御部25と、領域設定部12と、文字個別認識部13と、文字数計数部14と、判別部16と、画像回転部17として機能する。読取制御部25は、画像読取部11を制御する。
【0028】
画像処理装置10は、メイン制御部33をさらに含み、メイン制御部33は、読取制御部25、領域設定部12、文字個別認識部13、文字数計数部14、判別部16、画像回転部17、および姿勢情報追記部20に接続され、これらを制御する。またメイン制御部は、読取制御部25と同一の構成、具体的には同一のCPUによって実現され、画像読取部の制御をも行う構成とすることも可能である。
【0029】
図3は、本発明の第1実施形態における画像処理方法の工程を表すフローチャートである。画像処理方法は、画像の向きを判別し、判別の結果に応じて回転させる方法である。画像処理方法は、画像読取工程と、領域設定工程と、文字個別認識工程と、文字数計数工程と、判別工程と、画像回転工程とを含んで構成される。第1実施形態において画像処理方法は、さらに判断工程を含む。
【0030】
本処理開始後、ステップa1の画像読取工程に移行し、画像読取部11によって原稿を画像として読取る。次に、ステップa2の領域設定工程に移行し、領域設定部12によって、長辺方向領域18と短辺方向領域19とを設定する。次に、ステップa3の文字個別認識工程に移行し、長辺方向領域18内および短辺方向領域19内に記載される文字の個別認識を行う。文字の個別認識は、光学文字認識(Optical Character Recognition)によって行われる。次に、ステップa4の判断工程に移行し、長辺方向領域18内および短辺方向領域19内で文字を個別認識することができたかどうかを判断する。
【0031】
ステップa4の判断工程において、文字の個別認識ができなかったと判断された場合には、ステップa2の領域設定工程に移行し、長辺方向領域18および短辺方向領域19を、画像の中央寄りに拡張する。ステップa4の判断工程において、文字の認識ができたと判断された場合には、ステップa5の文字数計数工程に移行し、長辺方向領域18内で長辺方向に並ぶ文字の文字数、および短辺方向領域19内で短辺方向に並ぶ文字の文字数を計数する。次にステップa6の判別工程に移行し、文字数計数工程で計数された計数結果の大小関係を比較する。次にステップa7の画像回転工程に移行し、判別工程で判別された判別結果に応じて、画像を回転させる。その後、本処理を終了する。
【0032】
第1実施形態では、領域設定工程において、長辺方向領域18および短辺方向領域19を、文字が記載される領域のうち最も外方に位置する領域として設定することから、文字個別認識工程で文字が認識されない場合に長辺方向領域18および短辺方向領域19を内方に拡張する構成としたけれども、他の実施形態において、長辺方向領域18および短辺方向領域19を画像の中央部に、設定する場合には、判断工程を省略することも可能である。
【0033】
第1実施形態によれば、領域設定部12は、長辺方向領域18と、短辺方向領域19とを設定する。判別部16は、文字数計数部14によって長辺方向に計数された計数結果と、短辺方向に計数された計数結果との大小関係を判別する。画像回転部17は、判別部16による判別結果に基づいて、画像を回転させる。これによって、画像の向きを原稿の向きに沿って判別することができる。文字の向きを検出する必要がないので、簡単に画像の向きを検出することができる。したがって、文字の向きを検出して画像の向きを判別する場合に比べて、高速な処理を実現することができる。またヘッダおよびフッタ領域の記載の有無に関係なく画像の向きを検出することができる。したがって、汎用性の高い画像処理装置10を実現することができる。
【0034】
また第1実施形態によれば、画像処理装置10は、姿勢情報追記部20をさらに含む。姿勢情報追記部20は、画像回転部17が向きを統一した複数の画像に対し、各画像の向きの情報を各画像の画像情報に追記する。これによって、複数の画像のうち、一部が取り出されて取り扱われることがあっても、所望の向きに画像の向きを合わせた状態のまま、画像を取り扱うことが可能となる。
【0035】
また、文字数計数部14は、最も短辺方向一方Y1に位置する長辺方向領域18のうち最も短辺方向一方Y1に位置する文字の文字数を計数し、最も短辺方向他方Y2に位置する長辺方向領域18のうち最も短辺方向他方Y2に位置する文字の文字数を計数し、最も長辺方向一方X1に位置する短辺方向領域19のうち最も長辺方向一方X1に位置する文字の文字数を計数し、最も長辺方向他方X2に位置する短辺方向領域19のうち最も長辺方向他方X2に位置する文字の文字数を計数する。これによって、2つの短辺方向領域19が、長辺方向に互いに最も遠くに位置する領域として設定されることによって、原稿が、ヘッダおよびフッタの少なくともいずれか1つを含む場合には、ヘッダおよびフッタに位置する文字の文字数を計数することが可能となる。
【0036】
また、判別部16による判別結果を記憶する結果記憶部をさらに備え、結果記憶部は、各長辺方向領域18の位置情報と各短辺方向領域19の位置情報とを、各長辺方向領域18および各短辺方向領域19に含まれる各計数結果に関連付けて記憶する。これによって、画像中の文字数に関する情報を多く収集することができるので、高い精度で画像の向きを判別することが可能となる。
【0037】
また、画像処理方法は、画像処理装置10を用いて、画像読取工程、領域設定工程、文字個別認識工程、文字数計数工程、判別工程および画像回転工程を含んで構成されるので、画像の向きを原稿の向きに沿って判別することができる。文字の向きを検出する必要がないので、簡単に画像の向きを検出することができる。したがって、文字の向きを検出して画像の向きを判別する場合に比べて、高速な処理を実現することができる。またヘッダおよびフッタ領域の記載の有無に関係なく画像の向きを検出することができる。したがって、高い汎用性において画像処理を行うことができる。
【0038】
また第1実施形態によれば、画像処理用プログラムは、コンピュータを、読取制御部25と、領域設定部12と、文字個別認識部13と、文字数計数部14と、判別部16と、画像回転部17として機能させる。読取制御部25は、画像読取部11を制御する。これによって、高速な処理を行うことを可能とすることができる。
【0039】
また第1実施形態によれば、記録媒体には、前記画像処理用プログラムが、コンピュータに読取り可能に記録される。これによって、画像処理用プログラムを、コンピュータが読取り可能な状態で、記録媒体として保存することができる。
【0040】
(第2実施形態)
図4は、本発明の第2実施形態に係る画像処理装置10の斜視図である。第2実施形態に係る画像処理装置10は、第1実施形態に係る画像処理装置10に類似しており、以下、第1実施形態に対する第2実施形態の相違点を中心に説明する。画像処理装置10は、記録部26をさらに含み、記録部26は、画像読取部11が読取った画像を印刷などによって記録する。画像処理装置10は、送信部27をさらに含み、送信部27は、画像読取部11が読取った画像の画像情報を送信する。
【0041】
第2実施形態において画像処理装置10は、さらにコピー機能を有するコピー手段を備える。送信部27は、たとえばファクシミリ送受信機能を有するファクシミリ送受信手段、および電子メールの送受信機能を有する電子メールの送受信手段の少なくともいずれか1つを含んで構成される。
【0042】
デジタル複合機には、通信網を介して外部機器が接続される。たとえば、室内あるいは建物内などに限られた通信網として敷設される通信ネットワークLANを介して、外部コンピュータ28などが接続される。また図示していないゲートウェイなどを介してインターネット回線が接続される。さらにインターネット回線を介してインターネットファクシミリ装置31が接続されており、公衆電話回線を介して他のファクシミリ装置32が接続される。
【0043】
図5は、本発明の第2実施形態に係る画像処理装置10の構成を表すブロック図である。図5に示されるように、デジタル複合機は、メイン制御部33と、制御用メモリ34と、制御用バッファ36と、画像記憶部38と、フォーマット変換部39と、画像読取部11と、記録部26と、パネル制御部42と、符号化復号化制御部44と、LAN制御部46と、モデム48と、網制御部49と、および画像処理部51を備えている。画像処理部51は、読取制御部25と、領域設定部12と、文字個別認識部13と、文字数計数部14と、判別部16と、画像回転部17とを含む。
【0044】
メイン制御部33は、CPUなどで実現され、予め画像情報を符号化するために定められる符号化方式のうちから使用する符号化方式を選択し送信部27の制御を行う。また本実施形態では、画像処理装置10の使用者によって設定された相手情報を用いて、送信を行う。制御用メモリ34は、不揮発性のメモリ、もしくはバックアップされたメモリなどからなり、制御プログラムや相手先情報が記憶されている。
【0045】
制御用バッファ36は、リードオンリーメモリ(RAM)であり、プログラムのデータ用として使用される。画像記憶部38は、符号化された画像データを記憶するとともに、後述する画像読取部11から読み取ったデータ、または受信したデータ、復号後のデータなどを記憶する。
【0046】
フォーマット変換部39は、符号化された画像データを所定のファイルフォーマットに変換する。画像読取部11は、CCDを利用したスキャナで、原稿を所定の解像度の画像として読み取る。そして、読み取った結果、ドットイメージデータ(原稿データ)を出力する。記録部26は、電子写真方式のプリンタ装置を備え、通信により受信した原稿等のデータをハードコピー(プリントアウト)する。
【0047】
パネル制御部42では、原稿の読み取り、相手先入力などの指示が行われ、対応した画面が表示される。パネル制御部42は、図示しない表示装置及び操作部を備えている。表示装置は、液晶表示装置(LCD)又はCRTディスプレイ等の表示装置であり、動作状態や送信先などを表示する。操作部は、操作するために必要なキーボード及びマウス等(入力装置)を備えている。本実施形態のパネル制御部42は、表示装置及び操作部を一体としたタッチパネルである。本実施形態ではパネル制御部42のタッチパネルから、相手先の設定を行う。設定された相手先情報は、制御用メモリ34に格納される。
【0048】
符号化復号化制御部44は、読み取った原稿データの符号化または受信時の復号化を行う。即ち、符号化復号化制御部44は、画像信号を符号化圧縮するとともに、符号化圧縮されている画像情報を元の画像信号に復号化する。符号化復号化制御部44は、ファクシミリ通信で一般に使用されている、MH(Modified Hufman)、MR(Modified READ)およびMMR(Modified Modified READ)などの符号化方式を用いることができる。
【0049】
LAN制御部46は、LAN(Local Area Network)と接続され、インターネット経由による電子メールデータの通信及びインターネットファクシミリ装置31の通信を行う。
【0050】
モデム48は、電話回線と接続され、ファクシミリの通信を行う。モデム48は、ファクシミリ通信が可能なファクシミリモデムから構成されている。また、モデム48は、NCU(Network Control Unit)と直接的に接続されている。網制御部49(NCU)は、電話回線と接続され、回線の制御を行う。すなわち、NCUは、アナログの公衆電話回線網(PSTN)との回線の閉結及び開放の動作を行うハードウェアであり、必要に応じてモデム48を公衆電話回線網と接続する。
【0051】
なお、インターネットファクシミリ装置31は、LANインターフェースを用いて、LAN等のコンピュータネットワークを介して、電子メールを送受信する。より具体的には、スキャナが読み取った画像情報(例えば、ビットマップデータ)を、例えばMHのような圧縮形式で圧縮して圧縮ファイルを得る。
【0052】
圧縮は、原稿1ページ単位で行われる。次いで、フォーマット変換部39は、これらの圧縮ファイルを、1つのTIFF(Tag Image File Format)ファイルに変換し、このTIFFファイルを、例えばMIME(Multipurpose Internet Mail Extension) に従ってマルチパートメールに添付する。
【0053】
ここまでの処理により、画像情報は電子メールのフォーマットに変換される。この電子メールは、LAN制御部46によりLANインターフェースを介してSMTP等のメール転送プロトコルを用いて送信される。
【0054】
第2実施形態によれば、画像処理装置10は、記録部26をさらに含み、記録部26は、画像読取部11が読取った画像をたとえば印刷などによって記録する。これによって、記録された状態においても、原稿の向きを統一された状態に保つことができる。
【0055】
また第2実施形態によれば、画像処理装置10は、送信部27をさらに含み、送信部27は、画像読取部11が読取った画像の画像情報を送信する。これによって、他の電子機器においても画像の向きを所望の向きとした状態で取り扱うことが可能となる。
【0056】
(第3実施形態)
第3実施形態に係る画像処理装置10は、第1実施形態に係る画像処理装置10に類似しており、以下、第1実施形態に対する第3実施形態の相違点を中心に説明する。第3実施形態において画像読取部11は、複数の原稿を複数の画像として順に読取り、画像回転部17は、複数の画像のうち第2以降の画像における判別結果が、複数の画像のうちの第1の画像における判別結果と統一される向きに、第2以降の画像を統一する。
【0057】
図6は、本発明の第3実施形態における画像処理方法の工程を表すフローチャートである。図6に示すように、第3実施形態における画像処理方法の各工程のうち、ステップb2の領域設定工程からステップb7の画像回転工程までの各工程は、図3に示した各工程と同様である。ステップb1における画像読取工程では、複数の原稿を、画像として読取る。ステップb7の画像回転工程の後、ステップb8の画像統一工程に移行し、複数の画像の向きの統一を行う。画像統一工程では、画像回転工程で第1の画像に対して行った処理と同じ回転処理を、第2以降の画像に対して、すべて同一の処理を行う。
【0058】
これによって、第2以降の画像は、第1の画像の判定結果と統一される向きに回転され、複数の画像に対して、その向きを統一することができる。複数の画像のうち第1のページには、原稿に記載される内容のうち、比較的重要な内容が記載される場合が多く、また第1の画像として取り込まれる画像は、複数の原稿のうち、最も視認容易な位置に配置されている場合が多い。したがって、第1の画像の向きに原稿の全体を統一することによって、複数の画像の向きを所望の向きに統一することができる。
【0059】
(第4実施形態)
第4実施形態における画像処理方法は、第3実施形態における画像処理方法に類似しており、以下、第3実施形態に対する第4実施形態の相違点を中心に説明する。第4実施形態に係る画像処理方法のフローチャートは、図6に示したフローチャートと同様のフローチャートとなる。第4実施形態における画像統一工程では、第2以降の各画像に対して、ステップb2の領域設定工程〜ステップb7の画像回転工程と同じ処理を行う。つまり、第2以降の画像に対しては、各画像毎に、同様の処理を行う。これによって、すべての画像の向きの統一が行われる。第4実施形態では、各画像に対して判別を行うので、縦に長い原稿、すなわち縦向きの原稿と、横に長い原稿、すなわち横向きの原稿とが混在していても、個別に向きを調整することができる。
【0060】
(第5実施形態)
第5実施形態に係る画像処理装置10は、第1実施形態に係る画像処理装置10に類似しており、以下、第1実施形態に対する第5実施形態の相違点を中心に説明する。第5実施形態において画像読取部11は、複数の原稿を複数の画像として読取る。画像処理装置10は、枚数計数部をさらに含み、枚数計数部は、複数の画像のうち、画像に対する判別結果が同一となった画像の枚数を計数する。画像回転部17は、枚数計数部が最も多い枚数を計数した判別結果に対応する画像の向きに合わせて、残余の画像の向きを統一する。すなわち、第5実施形態では、すべての原稿を縦向きまたは横向きの原稿として統一する。
【0061】
図7は、本発明の第5実施形態における画像処理方法の工程を表すフローチャートである。第5実施形態では、各画像に対する判別工程の後、各画像に対して縦に長い画像であったか、横に長い画像であったかを判断して、縦向きの画像と横向きの画像との枚数を計数する。換言すれば、回転不必要な画像であったか、または90度回転させる画像であったかを判断する。
【0062】
他の実施形態においては、回転不要な画像であったか、90度回転させる画像であったか、180度回転させる画像であったか、または270度回転させる画像であったかを判断して、各回転角度に対応した画像の枚数を計数する構成とすることも可能である。
【0063】
第5実施形態では、ステップc1の画像読取工程で、複数の原稿の画像をすべて読み取るならば、ステップc2の領域設定工程〜ステップc7の枚数計数工程までを繰り返す。画像読取工程を、各原稿毎に行うならば、ステップc1の画像読取工程〜ステップc7の枚数計数工程までを繰り返す。
【0064】
画像統一工程では、枚数計数部が最も多い枚数を計数した判別結果に対応する画像の向きに合わせて、残余の画像の向きを統一する。回転不要な画像であったか、90度回転させる画像であったか、180度回転させる画像であったか、または270度回転させる画像であったかを判断する場合には、各画像における2つの短辺方向領域19のうちの文字数の多い短辺方向領域19か、または各画像における2つの長辺方向領域18のうちの文字数の多い長辺方向領域18を上方として設定する。
【0065】
これによって、仮に縦向きと横向きなど、向きの異なる原稿が混在していたとしても、複数の原稿のうち多くの原稿が示す向きを所望の向きとして、画像の向きを統一することができる。原稿の内容によっては、複数の原稿が所望の向きに統一された状態であっても、複数の原稿のうち少数の原稿は、向きが異なることを前提として所望の向きが設定されていることがある。複数の原稿のうち多くの原稿が示す向きを所望の向きとして統一することで、原稿について予め定められた所望の向きに、画像の向きを統一することができる。本実施形態において枚数計数部の機能は、コンピュータによって実現され、画像処理部51の一部を成す。
【0066】
第1〜第5実施形態において、記録媒体には、前記画像処理用プログラムが、コンピュータに読取り可能に記録される。これによって、画像処理用プログラムを、コンピュータが読取り可能な状態で、記録媒体として保存することができる。
【0067】
第1〜第5実施形態では、プログラムは、画像処理装置10の記憶装置たとえば半導体メモリあるいはハードディスク装置などの記憶装置に記憶されているが、これらの記憶装置に限定されるものではなく、コンピュータで読取り可能な記録媒体に記録されていてもよい。記録媒体は、たとえば図示しない外部記憶装置としてプログラム読取装置を設け、そこに記録媒体を挿入することによって読取り可能な記録媒体であってもよいし、あるいは他の装置の記憶装置であってもよい。
【0068】
いずれの記録媒体であっても、記憶されているプログラムがコンピュータからアクセスされて実行される構成であればよい。あるいはいずれの記録媒体であっても、プログラムが読み出され、読み出されたプログラムが、記憶装置のプログラム記憶エリアに記憶されて、そのプログラムが実行される構成であってもよい。さらに通信ネットワークを介して他の装置からダウンロードされてプログラム記憶エリアに記憶させてもよい。ダウンロード用のプログラムは、予めコンピュータの記憶装置に記憶しておくか、あるいは別な記録媒体からプログラム記憶エリアにインストールしておく。
【0069】
本体と分離可能に構成される記録媒体は、たとえば磁気テープ/カセットテープなどのテープ系の記録媒体、フレキシブルディスク/ハードディスクなどの磁気ディスクもしくはCD−ROM(Compact Disk Read Only Memory)/MO(Magneto Optical disk)/MD(Mini Disc)/DVD(Digital Versatile Disk)/ブルーレイディスクなどの光ディスクのディスク系の記録媒体、IC(Integrated Circuit)カード(メモリカードを含む)/光カードなどのカード系の記録媒体、またはマスクROM/EPROM(
Erasable Programmable Read Only Memory)/EEPROM(Electrically Erasable
Programmable Read Only Memory)/フラッシュROMなどの半導体メモリを含む固定的にプログラムを担持する記録媒体であってもよい。
【0070】
(変形例)
本発明に係る技術内容は、特許請求の範囲に記載された技術的範囲内において、種々の変更を加えることが可能である。他の実施形態において文字個別認識部13は、長辺方向領域18および短辺方向領域19に含まれる単語または文を個別認識してもよい。原稿が横書きであることを前提とするならば、単語を認識することができる方向は、原稿の横方向に限られるため、原稿の縦方向および横方向を判断することができる。
【0071】
またさらに他の実施形態において判別部16は、複数の長辺方向領域18において計数された計数結果を長辺方向領域18の数において平均した長辺方向平均と、複数の短辺方向領域19において計数された計数結果を短辺方向領域19の数において平均した短辺方向平均との大小関係を判別することを特徴とする。これによって、画像の長辺方向領域18および短辺方向領域19に含まれる文字数が一定しないときにも、長辺方向に並ぶ文字の文字数と短辺方向に並ぶ文字の文字数との大小関係を、高い精度で判別することが可能となる。
【0072】
またさらに他の実施形態において画像処理装置10は、画像に含まれる表、図、およびスキームが配置される領域をオブジェクト領域として認識するオブジェクト認識部と、文字個別認識部13において認識された文字の大きさを認識する文字サイズ認識部と、オブジェクト領域の大きさと、文字の大きさとを比較し、オブジェクト領域内に、長辺方向および短辺方向に含むことができる文字の文字数を予測する文字数予測部とをさらに含み、文字数計数部14は、計数結果に文字数予測部の予測結果を含む構成としてもよい。
【0073】
これによって、原稿に表、図およびスキームの少なくともいずれか1つが配置されていても、表、図およびスキームの代わりに文字が配置された場合の文字数を計測することができる。したがって、表、図およびスキームの少なくともいずれか1つが配置される原稿の画像について、文字のみが配置された状態を予測して文字数を計測することができる。これによって、表、図およびスキームを含む原稿の画像についても、表、図およびスキームの影響を排除して、高い精度で画像の向きを判別することができる。
【図面の簡単な説明】
【0074】
【図1】本発明の第1実施形態に係る画像処理装置10の構成を表すブロック図である。
【図2】本発明の第1実施形態における画像の一例と、設定された長辺方向領域18および短辺方向領域19とを表す図である。
【図3】本発明の第1実施形態における画像処理方法の工程を表すフローチャートである。
【図4】本発明の第2実施形態に係る画像処理装置10の斜視図である。
【図5】本発明の第2実施形態に係る画像処理装置10の構成を表すブロック図である。
【図6】本発明の第3実施形態における画像処理方法の工程を表すフローチャートである。
【図7】本発明の第5実施形態における画像処理方法の工程を表すフローチャートである。
【符号の説明】
【0075】
10 画像処理装置
11 画像読取部
12 領域設定部
13 文字個別認識部
14 文字数計数部
16 判別部
17 画像回転部
18 長辺方向領域
19 短辺方向領域
26 記録部
27 送信部

【特許請求の範囲】
【請求項1】
原稿を、長方形の画像として読取る画像読取部と、
前記画像をその長辺方向に横切る長辺方向領域と、前記画像をその短辺方向に横切る短辺方向領域とを設定する領域設定部と、
前記画像中において隣合う文字と文字とを区別し、1文字ずつ個別認識する文字個別認識部と、
前記長辺方向領域内で前記長辺方向に並ぶ文字の文字数を計数し、前記短辺方向領域内で前記短辺方向に並ぶ文字の文字数を計数する文字数計数部と、
文字数計数部によって前記長辺方向に計数された計数結果と、前記短辺方向に計数された計数結果との大小関係を判別する判別部と、
前記判別部による判別結果に基づいて、画像を回転させる画像回転部とを含むことを特徴とする画像処理装置。
【請求項2】
前記画像読取部は、複数の原稿を複数の画像として順に読取り、
前記画像回転部は、前記複数の画像のうちの第2以降の画像における判別結果が、前記複数の画像のうちの第1の画像における判別結果と統一される向きに、前記第2以降の画像の向きを統一することを特徴とする請求項1に記載の画像処理装置。
【請求項3】
前記画像読取部は、複数の原稿を複数の画像として読取り、
前記複数の画像のうち、画像に対する判別結果が同一となった画像の枚数を計数する枚数計数部をさらに含み、
前記画像回転部は、枚数計数部が最も多い枚数を計数した判別結果に対応する画像の向きに合わせて、残余の画像の向きを統一することを特徴とする請求項1に記載の画像処理装置。
【請求項4】
前記画像回転部が向きを統一した複数の画像に対し、各画像の向きの情報を、各画像の画像情報に追記する姿勢情報追記部をさらに含むことを特徴とする請求項2または3に記載の画像処理装置。
【請求項5】
前記画像読取部が読取った画像を記録する記録部をさらに含むことを特徴とする請求項1〜4のいずれか1つに記載の画像処理装置。
【請求項6】
前記画像読取部が読取った画像の画像情報を送信する送信部をさらに含むことを特徴とする請求項1〜5のいずれか1つに記載の画像処理装置。
【請求項7】
コンピュータを、
原稿を長方形の画像として読取る画像読取部を制御する読取制御部と、
前記画像をその長辺方向に横切る長辺方向領域と、前記画像をその短辺方向に横切る短辺方向領域とを設定する領域設定部と、
前記画像中において隣合う文字と文字との区別し、1文字ずつ個別認識する文字個別認識部と、
前記長辺方向領域内で前記長辺方向に並ぶ文字の文字数を計数し、前記短辺方向領域内で前記短辺方向に並ぶ文字の文字数を計数する文字数計数部と、
文字数計数部によって前記長辺方向に計数された計数結果と、前記短辺方向に計数された計数結果との大小関係を判別する判別部と、
前記判別部による判別結果に基づいて、画像を回転させる画像回転部として機能させるための画像処理用プログラム。
【請求項8】
請求項7に記載の画像処理用プログラムが、コンピュータに読取り可能に記録される記録媒体。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2010−124244(P2010−124244A)
【公開日】平成22年6月3日(2010.6.3)
【国際特許分類】
【出願番号】特願2008−296090(P2008−296090)
【出願日】平成20年11月19日(2008.11.19)
【出願人】(000005049)シャープ株式会社 (33,933)
【Fターム(参考)】