説明

画像処理装置、文字拡大処理方法および文字拡大プログラム

【課題】文書画像に含まれる文字を拡大する際、文書の体裁を崩すことなく、しかも短い処理時間で効率良く文字を拡大できるようにする。
【解決手段】画像処理装置は、入力する文書画像D1から、文字領域を行単位で抽出する文字領域抽出部32と、各文字領域をその近傍に位置する他の文字領域と比較することにより、少なくとも同一の文字属性を有する一又は複数の文字領域ごとにグループ化し、各グループに含まれる文字領域を内包する矩形の文字ブロックを形成する文字ブロック形成部33と、各文字ブロックごとに、当該文字ブロックを内包し、かつ、当該文字ブロックの周囲の余白領域を含む拡大枠を設定すると共に、各拡大枠を他の拡大枠と干渉しない範囲で略最大となるように設定する拡大枠設定部36と、各拡大枠に内包される文字ブロックを各拡大枠の範囲内に収まるように拡大する拡大処理部37とを備える構成である。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像処理装置、文字拡大処理方法および文字拡大プログラムに関し、特に文書画像に含まれる文字の拡大処理を行う技術に関する。
【背景技術】
【0002】
従来、文字を含む文書画像をプリンタ装置などでプリント出力する際、文字領域に含まれる文字を拡大して出力するようにした技術が種々提案されている(例えば特許文献1,2)。プリント出力時に文字を拡大して出力することにより、例えば老眼や弱視などのために小さな文字を読むことが困難なユーザであっても容易に文章を読むことができるようになる。
【0003】
例えば特許文献1には、文書画像に含まれる文字領域と非文字領域とを判定して文書画像から文字領域を分離して拡大処理を行う技術が開示されている。すなわち、文書画像から分離した文字領域の文字サイズを検出し、文字領域をセンタリング処理した後に、センタリング処理後の文字領域が文字領域以外の領域を越えないように該文字領域の文字を拡大する処理が行われる。そして拡大された文字を含む文字領域のイメージデータと、非文字領域のイメージデータとを、再レイアウトして合成し、印刷用のイメージデータが生成される。
【0004】
また特許文献2には、文字領域と非文字領域と空白領域とを有する文書画像において、文字領域の周辺の空白領域を利用して、その文字領域に含まれる小さな文字を拡大する技術が開示されている。この技術では、行間を利用して文字を拡大する際、行の中心位置を維持したまま文字領域に含まれる小さな文字を拡大するようにしている。また、文字領域の周辺の空白領域を利用して文字を拡大する際、非文字領域を縮小又は移動させることによって空白領域を広げ、その広がった空白領域を利用して文字を拡大するようになっている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2005−223824号公報
【特許文献2】特開2008−177823号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、上記従来の技術では、文書画像に含まれる文字を拡大するのに要する時間が長いという問題がある。例えば、上記特許文献1では、文字領域を所定の領域内でセンタリングするので、文字領域の中心位置を算出したり、センタリングを行う領域の中心位置を算出したりするのに時間を要する。また文字領域に含まれる文字を拡大した後、文字領域と非文字領域とを合成するための処理に時間を要する。また上記特許文献2では、行の中心位置を算出したり、非文字領域を縮小又は移動させたりするのに時間を要する。また特許文献2の技術でも、文字を拡大した後に文字領域と非文字領域とを再配置する処理が行われるので、この処理に時間を要する。さらに特許文献2では文字の拡大処理を行単位で行うので、文書画像に含まれる行数が増加すれば、それに伴って処理時間が長くなる。このように上述した技術では、効率的に文字を拡大することができない。
【0007】
また、上記特許文献1では、文字を拡大した後に文字領域と非文字領域との合成処理を行っても文字領域と非文字領域とが重なってしまうことがあり、元の文書画像のレイアウトが崩れてしまうという問題もある。また特許文献2のように、文字の拡大処理を行単位で行ってしまうと、行毎に異なる拡大率で拡大されてしまうことがあり、例えば複数行からなる文章が行毎に異なる文字サイズとなってしまい、却って文章を読みづらくしてしまう可能性がある。
【0008】
また、一般的な文書画像には、ヘッダやフッタなどのように重要な意味を有さない文字列が含まれることが多く、このような文字列を拡大してしまうと却って文書の体裁を崩してしまう可能性がある。また文書に含まれるタイトルなどの文字列は、文書が作成された時点で他の文字列よりも読みやすい大きな文字サイズとなっていることが多く、拡大処理を行う必要がない場合が多い。ところが、上記従来の技術では、このような文字列に対しても他の文字列と同様に処理されるので、文字が拡大されてしまい、文書の体裁が崩れてしまうという問題がある。
【0009】
そこで本発明は、上記従来の問題点を解決するためになされたものであり、従来と比較して、文書の体裁を崩すことがなく、しかも短い処理時間で効率良く文字を拡大できるようにした画像処理装置、文字拡大処理方法および文字拡大プログラムを提供することを目的としている。
【課題を解決するための手段】
【0010】
上記目的を達成するため、請求項1にかかる発明は、画像処理装置であって、文字領域と余白領域とを有する文書画像から、文字領域を行単位で抽出する文字領域抽出手段と、前記文字領域抽出手段により抽出される行単位の各文字領域をその近傍に位置する他の文字領域と比較することにより、少なくとも同一の文字属性を有する一又は複数の文字領域ごとにグループ化し、各グループに含まれる文字領域を内包する矩形の文字ブロックを形成する文字ブロック形成手段と、前記文書画像の余白領域を抽出する余白領域抽出手段と、前記文字ブロック形成手段により形成される文字ブロックごとに、当該文字ブロックを内包し、かつ、当該文字ブロックの周囲の余白領域を含む拡大枠を設定すると共に、各拡大枠を他の拡大枠と干渉しない範囲で略最大となるように設定する拡大枠設定手段と、各拡大枠に内包される文字ブロックを各拡大枠の範囲内に収まるように拡大する拡大処理手段と、を備えることを特徴とする構成である。
【0011】
また請求項2にかかる発明は、請求項1記載の画像処理装置において、前記文字属性が、フォントタイプ又は文字サイズであることを特徴とする構成である。
【0012】
また請求項3にかかる発明は、請求項1又は2に記載の画像処理装置において、前記文字ブロック形成手段は、同一の文字属性を有し、かつ、同一の行間を有する複数の文字領域を一のグループにグループ化することを特徴とする構成である。
【0013】
また請求項4にかかる発明は、請求項1乃至3のいずれかに記載の画像処理装置において、前記拡大処理手段は、文字ブロックを拡大する際に、当該文字ブロックの拡大率を決定する拡大率決定手段を更に備え、前記拡大率決定手段は、前記拡大枠の範囲内で収まる最大の拡大率を決定することを特徴とする構成である。
【0014】
また請求項5にかかる発明は、請求項4記載の画像処理装置において、前記拡大率決定手段は、文字ブロックに含まれる文字サイズが、前記文書画像中に存在する最大の文字サイズを超えないように、文字ブロックの拡大率を決定することを特徴とする構成である。
【0015】
また請求項6にかかる発明は、請求項1乃至5のいずれかに記載の画像処理装置において、前記拡大処理手段は、文字ブロックを拡大するか否かを判定する拡大判定手段を更に備え、前記拡大判定手段は、前記文書画像の最上位置又は最下位置にあり、かつ、他の文字ブロックに比してブロックサイズの小さい文字ブロックを拡大対象から除外することを特徴とする構成である。
【0016】
また請求項7にかかる発明は、請求項1乃至5のいずれかに記載の画像処理装置において、前記拡大処理手段は、文字ブロックを拡大するか否かを判定する拡大判定手段を更に備え、前記拡大判定手段は、前記文書画像中に存在する文字サイズのうち最大の文字サイズを含む文字ブロックを拡大対象から除外することを特徴とする構成である。
【0017】
また請求項8にかかる発明は、文字拡大処理方法であって、文字領域と余白領域とを有する文書画像から、文字領域を行単位で抽出するステップと、行単位で抽出される各文字領域をその近傍に位置する他の文字領域と比較することにより、少なくとも同一の文字属性を有する一又は複数の文字領域ごとにグループ化し、各グループに含まれる文字領域を内包する矩形の文字ブロックを形成するステップと、前記文書画像の余白領域を抽出するステップと、文字ブロックごとに、当該文字ブロックを内包し、かつ、当該文字ブロックの周囲の余白領域を含む拡大枠を設定すると共に、各拡大枠を他の拡大枠と干渉しない範囲で略最大となるように設定するステップと、各拡大枠に内包される文字ブロックを各拡大枠の範囲内に収まるように拡大するステップと、を有することを特徴とする構成である。
【0018】
また請求項9にかかる発明は、文字拡大プログラムであって、コンピュータを、文字領域と余白領域とを有する文書画像から、文字領域を行単位で抽出する文字領域抽出手段、前記文字領域抽出手段により抽出される行単位の各文字領域をその近傍に位置する他の文字領域と比較することにより、少なくとも同一の文字属性を有する一又は複数の文字領域ごとにグループ化し、各グループに含まれる文字領域を内包する矩形の文字ブロックを形成する文字ブロック形成手段、前記文書画像の余白領域を抽出する余白領域抽出手段、前記文字ブロック形成手段により形成される文字ブロックごとに、当該文字ブロックを内包し、かつ、当該文字ブロックの周囲の余白領域を含む拡大枠を設定すると共に、各拡大枠を他の拡大枠と干渉しない範囲で略最大となるように設定する拡大枠設定手段、および、各拡大枠に内包される文字ブロックを各拡大枠の範囲内に収まるように拡大する拡大処理手段、として機能させることを特徴とする構成である。
【発明の効果】
【0019】
本発明によれば、少なくとも同一の文字属性を有する一又は複数の文字領域を含む文字ブロックごとに拡大する処理が行われるので、文書の体裁を崩すことがなく、しかも短い処理時間で効率良く文字を拡大できるようになる。
【図面の簡単な説明】
【0020】
【図1】画像処理システムの一構成例を示す図である。
【図2】コンピュータのハードウェア構成の一例を示すブロック図である。
【図3】CPUが文字拡大プログラムを実行することによって実現される制御部の機能構成の一例を示すブロック図である。
【図4】文字の拡大対象となる文書画像の一例を示す図である。
【図5】文字領域抽出部により抽出される行単位の文字領域の一例を示す図である。
【図6】文字ブロック形成部により形成される文字ブロックの一例を示す図である。
【図7】余白領域抽出部によって設定される利用可能余白範囲の一例を示す図である。
【図8】拡大枠設定部により各文字ブロックに対して設定される拡大枠の一例を示す図である。
【図9】拡大枠設定部によって検出される印刷可能範囲の一例を示す図である。
【図10】拡大枠設定部によって印刷可能範囲に拡げた拡大枠の一例を示す図である。
【図11】拡大判定部による拡大判定処理が行われた後の文書画像の一例を示す図である。
【図12】拡大実行部により拡大処理が行われた後の文書画像を示す図である。
【図13】文書画像に含まれる文字を拡大するための文字拡大処理の詳細な処理手順の一例を示すフローチャートである。
【発明を実施するための形態】
【0021】
以下、本発明に関する好ましい実施形態について図面を参照しつつ詳細に説明する。尚、以下に説明する実施形態において互いに共通する部材には同一符号を付しており、それらについての重複する説明は省略する。
【0022】
図1は、本実施形態における画像処理システムの一構成例を示す図である。この画像処理システムは、一般的なパーソナルコンピュータ(PC)などで構成されるコンピュータ1と、プリンタ機能などを備えた画像形成装置2とがネットワーク3を介して相互にデータ通信可能なように接続された構成である。ネットワーク3は、例えばLANなどのネットワークであるが、コンピュータ1と画像形成装置2とを直接接続する単なるケーブルであっても構わない。
【0023】
コンピュータ1は、ユーザによる編集操作に基づいて文書画像を生成する。またコンピュータ1は、外部から文書画像を入力することも可能である。そしてコンピュータ1は、それらの文書画像を、ネットワーク3を介して画像形成装置2に出力する。画像形成装置2は、印刷用紙などの所定の印刷媒体に対し、コンピュータ1から入力する文書画像に基づいて画像形成を行い、プリント出力を行う。尚、画像形成装置2は、プリンタ機能のみを備えた印刷装置であっても良いし、プリンタ機能の他にコピー機能、FAX機能、スキャナ機能などの複数の機能を備えたMFP(Multi Function Peripheral)であっても良い。
【0024】
本実施形態では、上記のような構成においてコンピュータ1が文書画像を画像形成装置2に出力する際に、その文書画像に含まれる文字を拡大して出力することができるようになっている。コンピュータ1から文字の拡大された文書画像が出力されることにより、画像形成装置2でプリント出力される文書画像は、老眼や弱視などのために小さな文字を読むことが困難なユーザであっても容易に文章を読むことが可能な文書画像となる。つまり、本実施形態では、コンピュータ1が文字の拡大処理を行う画像処理装置として機能する。
【0025】
図2は、コンピュータ1のハードウェア構成の一例を示す図である。図2に示すように、コンピュータ1は、制御部10と、ネットワークインタフェース13と、表示部14と、操作部15と、記憶装置16とを備え、これらがデータバス20を介して相互にデータの入出力を行える構成である。制御部10は、CPU11とメモリ12とを備えており、CPU11が記憶装置16に記憶されている各種のプログラムを読み出して実行することにより各種の処理部として機能する。メモリ12は、CPU11がプログラムを実行することに伴う一時的なデータなどを記憶するものである。ネットワークインタフェース13は、コンピュータ1をネットワーク3に接続するためのものである。表示部14は、コンピュータ1を使用するユーザに対して各種の情報を表示するためのものである。操作部15は、例えばキーボードやマウスなどで構成され、コンピュータ1を使用するユーザからの入力操作を受け付ける。記憶装置16は、ハードディスク装置などで構成された不揮発性の記憶手段である。
【0026】
記憶装置16には、プリンタドライバ17と、文書作成アプリケーションプログラム19とが予めインストールされている。プリンタドライバ17は、コンピュータ1が画像形成装置2に対して印刷用の文書画像を出力するためのプログラムである。このプリンタドライバ17には、コンピュータ1に、文書画像に含まれる文字を拡大する処理を行わせる文字拡大プログラム18が組み込まれている。また文書作成アプリケーションプログラム19は、コンピュータ1において文書画像を作成および編集するためのプログラムである。
【0027】
コンピュータ1を使用するユーザが操作部15を操作することによって文書画像の作成又は編集を指示すると、CPU11は、文書作成アプリケーションプログラム19を読み出して実行する。そして操作部15を介して入力するユーザの編集操作に基づいて文書画像を生成する。このような文書画像は、文字のみからなる文字領域と、文字以外の画像などが配置された非文字領域と、文字領域および非文字領域を除く余白領域とで構成されている。尚、文書画像には非文字領域が含まれない場合もあり、この場合、文書画像は文字領域と余白領域とで構成される。
【0028】
またコンピュータ1を使用するユーザが操作部15を操作することによって上記のような文書画像の印刷指示を行った場合、CPU11は、プリンタドライバ17を読み出して実行する。CPU11は、プリンタドライバ17を実行すると、表示部14に対し、文書画像を画像形成装置2に出力する際の設定操作画面を表示すると共に、操作部15を介してユーザによる設定操作の入力を受け付ける。そしてユーザが文書画像に含まれる文字の拡大処理の実行を指示した場合、CPU11は、プリンタドライバ17に組み込まれた文字拡大プログラム18を読み出して実行することにより、文書画像に含まれる文字の拡大処理を実行する。
【0029】
図3は、CPU11が文字拡大プログラム18を実行することによって実現される制御部10の機能構成の一例を示すブロック図である。図3に示すように制御部10は、文書画像取得部31、文字領域抽出部32、文字ブロック形成部33、余白領域抽出部34、非文字領域抽出部35、拡大枠設定部36、および、拡大処理部37として機能する。また拡大処理部37は、拡大判定部37aと拡大率決定部37bと拡大実行部37cとを備えている。制御部10は、これら各部を順次に、又は並列的に機能させることにより、入力する文書画像D1に含まれる文字のみを拡大した文書画像D2を生成して出力するように構成される。
【0030】
文書画像取得部31は、文字の拡大対象となる文書画像D1を取得する処理部である。例えば、CPU11によって文字拡大プログラム18が実行されると、文書画像取得部31は、プリンタドライバ17から文字の拡大対象となる文書画像D1を取得する。
【0031】
図4は、文字の拡大対象となる文書画像D1の一例を示す図である。文書画像取得部31は、例えば図4に示すような文書画像D1を取得する。尚、この文書画像D1の全体のサイズは、プリント出力を行う際の用紙サイズに対応している。この文書画像D1には、複数箇所に配置された文字領域41と、文書画像D1の中央のやや右下の位置に配置された画像などの非文字領域42とが含まれている。また文字領域41および非文字領域42のいずれにも該当しない空白の部分は全て余白領域43となっている。したがって、図4に示す文書画像D1は、文字領域41と、非文字領域42と、余白領域43とで構成されている。
【0032】
文字領域抽出部32は、文書画像取得部31によって取得される文書画像D1から、文字領域41を行単位で抽出する処理部である。尚、文字領域抽出部32において文字領域41を行単位で抽出するための具体的な手法としては、公知の手法を採用すれば良い。この文字領域抽出部32により、文字領域41と非文字領域42と余白領域43とで構成される文書画像D1から文字領域41のそれぞれに含まれる文字列が行単位で抽出される。
【0033】
図5は、文字領域抽出部32により抽出される行単位の文字領域の一例を示す図である。文書画像D1には文字列が複数行含まれているため、文書画像取得部31によって行単位での文字列抽出が行われると、図5に示すように文書画像D1から複数の文字領域51〜61が得られる。すなわち、複数の文字領域51〜61のそれぞれは、1行の文字列で構成されている。このように文字領域抽出部32は、文書画像取得部31によって取得される文書画像D1から行単位で文字領域51〜61を抽出する。
【0034】
文字ブロック形成部33は、文字領域抽出部32において行単位で抽出された複数の文字領域51〜61をグループ化することにより文字ブロックを形成する処理部である。すなわち、文字ブロック形成部33は、文字領域抽出部32で抽出された複数の文字領域51〜61のそれぞれを、その近傍に位置する他の文字領域(図5の場合は上下に隣り合う他の文字領域)と比較する。このとき、一の文字領域に含まれる文字の文字属性と、他の文字領域に含まれる文字の文字属性とが同一であるか否かが比較される。ここで文字属性とは、フォントタイプや文字サイズなどである。そして文字ブロック形成部33は、互いに近傍に位置し、かつ、同一の文字属性を有する一又は複数の文字領域をひとつに纏めることでグループ化を行っていく。このとき、ある一の文字領域に含まれる文字の文字属性が、その上下近傍に位置する他の文字領域の文字属性と異なる場合、当該一の文字領域は、それ単独で一のグループとなる。また、同一の文字属性を有する複数の文字領域が連続的に配置されている場合、それら複数の文字領域がひとつに纏められて一のグループとなる。そしてこのようなグループ化を行っていくことにより、同一の表記形態となっている一又は複数の文字領域が一のグループとなり、文書画像D1から少なくとも1つのグループが生成される。
【0035】
また文字ブロック形成部33が複数の文字領域51〜61をグループ化するために文字領域の比較を行う際には、一の文字領域と他の文字領域との距離(例えば行間など)を検出し、その距離に基づいてグループ化を行うことが好ましい。例えば3つ以上の文字領域をひとつに纏めてグループ化を行う際には、それら3つ以上の文字領域が同一の文字属性を有しており、さらに各文字領域間の行間が同一であることを条件として一のグループに纏めることが好ましい。これにより、同一の文字属性を有する場合であっても、行間の異なる文字領域を別のグループに分類することができる。また例えば、一の文字領域と他の文字領域との距離が所定値以上である場合には、互いに連続した文章を構成する文字列ではないと考えられるため、この場合は互いに別のグループとすることが好ましい。尚、この場合の所定値は適宜設定可能である。
【0036】
そして文字ブロック形成部33は、上記のようにして生成される各グループごとに、そのグループに含まれる全ての文字領域の外郭となる矩形の文字ブロックを形成する。つまり、文字ブロックは、グループに対応して形成され、各グループに含まれている一又は複数の文字領域を内包する最小の矩形ブロックとなる。
【0037】
このようにして文字ブロック形成部33による文字ブロックの形成処理が行われると、図5に示す文書画像D1から、図6に示すような複数の文字ブロック71〜75が形成される。すなわち、文字領域51,52が文字ブロック71となり、文字領域53がそれ単独で文字ブロック72となり、文字領域54,55,56,57が文字ブロック73となり、文字領域58,59,60が文字ブロック74となり、さらに文字領域61がそれ単独で文字ブロック75となる。そして、このような複数の文字ブロック71〜75のそれぞれが、文字を拡大する際の拡大対象領域となる。
【0038】
余白領域抽出部34は、文書画像取得部31によって取得される文書画像D1から余白領域43を抽出すると共に、その抽出した余白領域43に対して文字拡大時に利用可能な最大の余白領域の範囲を設定する処理部である。この余白領域抽出部34は、まず、図4に示すような文字領域41と非文字領域42と余白領域43とで構成される文書画像D1から余白領域43を抽出する。そして次に、その抽出した余白領域43に対して文字拡大時に利用可能な最大の余白領域の範囲を設定する。例えば余白領域抽出部34は、文書画像D1が作成された文書作成アプリケーションプログラム19によって設定されている余白領域(例えば、ユーザが文書画像D1に対して任意に設定した余白領域)を除く範囲を、文字拡大時に利用可能な最大の余白領域の範囲として設定する。尚、以下においては、上記のようにして設定される、文字拡大時に利用可能な最大の余白領域の範囲を、利用可能余白範囲と呼ぶ。
【0039】
図7は、余白領域抽出部34によって文書画像D1に設定される利用可能余白範囲44の一例を示す図である。図に示す一点鎖線が利用可能余白範囲44の外枠であり、文書作成アプリケーションプログラム19において規定されている余白領域との境界線である。そして、利用可能余白範囲44の内側から文字ブロック71〜75および非文字領域42を除いた領域が文字拡大時に利用可能な余白領域となる。
【0040】
このように余白領域抽出部34は、文書画像D1に含まれる全ての余白領域43のうち、文書画像D1の周縁部に設定されている余白領域を除いた領域を、文字拡大に利用する利用可能余白範囲44として設定する。これにより、後述する拡大処理において拡大される文字が、例えばユーザの設定した文書画像D1の周縁部の余白領域にまで及んで大きく拡大されることを防止することができるようになる。
【0041】
非文字領域抽出部35は、文書画像取得部31によって取得される文書画像D1から非文字領域42を抽出する処理部である。尚、非文字領域抽出部35において非文字領域42を抽出するための具体的な手法としては、公知の手法を採用すれば良い。この非文字領域抽出部35により、文字領域41と非文字領域42と余白領域43とで構成される文書画像D1から非文字領域42が全て抽出される。
【0042】
拡大枠設定部36は、文字ブロック形成部33により形成される複数の文字ブロック71〜75のそれぞれに対して個別の拡大枠を設定する処理部である。この拡大枠設定部36は、例えば一の文字ブロックに対して拡大枠を設定する際、当該一の文字ブロックを内包し、かつ、当該一の文字ブロックの周囲の余白領域を含む拡大枠を設定する。このとき、設定される拡大枠は、上述した利用可能余白範囲44よりも外側へはみ出さず、しかも他の拡大枠や非文字領域42に干渉しない略最大の矩形枠として設定される。
【0043】
図8は、拡大枠設定部36により各文字ブロック71〜75に対して設定される拡大枠81a〜85aの一例を示す図である。図8に示すように、文字ブロック71には拡大枠81aが設定され、文字ブロック72には拡大枠82aが設定される。同様に、文字ブロック73には拡大枠83aが設定され、文字ブロック74には拡大枠84aが設定される。さらに文字ブロック75には拡大枠85aが設定される。このように拡大枠81a〜85aは、文字ブロック71〜75のそれぞれに対応して設定される。そして、それぞれの拡大枠81a〜85aは互い重なり合うことがなく、また非文字領域42にも重ならないように設定される。さらに、それぞれの拡大枠81a〜85aは、図7に示した利用可能余白範囲44を超えないように設定される。
【0044】
また拡大枠設定部36は、上記のようにして設定される拡大枠81a〜85aを、画像形成装置2による印刷が可能な範囲(印刷可能範囲)にまで拡大することができるようになっている。拡大枠81a〜85aを印刷可能範囲にまで拡大するか否かは適宜実行可能である。例えばユーザが文書画像に含まれる文字の拡大処理の実行を指示する際に、画像形成装置2による印刷可能範囲にまで文字を拡大する範囲を拡げることを指定した場合、拡大枠設定部36は、上記のようにして拡大枠81a〜85aを設定する処理を行った後、さらにその拡大枠81a〜85aを印刷可能範囲にまで拡げる処理を行う。
【0045】
拡大枠81a〜85aを印刷可能範囲にまで拡げる場合、拡大枠設定部36は、画像形成装置2の印刷可能範囲を検出する。画像形成装置2の印刷可能範囲に関する情報は、プリンタドライバ17に予め設定されている。そのため、拡大枠設定部36は、プリンタドライバ17に設定されている情報を読み出すことにより、画像形成装置2の印刷可能範囲を検出する。ただし、これに限られず、その他の手法で画像形成装置2の印刷可能範囲を検出しても良い。
【0046】
図9は、拡大枠設定部36によって検出される印刷可能範囲46の一例を示す図である。図に示す二点鎖線が印刷可能範囲46の限界を示す外枠であり、画像形成装置2はこの内側に画像形成を行うことが可能である。このような印刷可能範囲46が検出されると、拡大枠設定部36は、利用可能余白範囲44を限界として設定された拡大枠81a〜85aを、さらに印刷可能範囲46にまで拡張する処理を行う。このときもまた、拡大枠設定部36は、それぞれの拡大枠81a〜85aを、印刷可能範囲46よりも外側へはみ出させず、しかも他の拡大枠や非文字領域42に干渉しない略最大の矩形枠となるように拡張する。
【0047】
図10は、拡大枠設定部36により拡大枠81a〜85aをさらに拡げた拡大枠81b〜85bの一例を示す図である。拡大枠設定部36による拡大枠の拡張処理が行われると、図10に示すように、拡大枠81aは拡大枠81bとなり、拡大枠82aは拡大枠82bとなる。また拡大枠83aは拡大枠83bとなり、拡大枠84aは拡大枠84bとなる。さらに拡大枠85aは拡大枠85bとなる。これらの拡張された拡大枠81b〜85bは、文字ブロック71〜75のそれぞれに対応している。そして、それぞれの拡大枠81b〜85bは互い重なり合うことがなく、また非文字領域42にも重ならないように拡張されている。さらに、それぞれの拡大枠81b〜85bは、図9に示した印刷可能範囲46を超えないように拡張されている。
【0048】
拡大処理部37は、文字ブロック形成部33により形成される文字ブロック71〜75の中から拡大対象となる文字ブロックを選択し、その選択した文字ブロックを拡大枠設定部36により設定される拡大枠の範囲内に収まるように拡大する処理部である。拡大処理部37は、上述したように、拡大判定部37aと拡大率決定部37bと拡大実行部37cとを備えている。拡大判定部37aが拡大対象となる文字ブロックを選択し、拡大率決定部37bが拡大対象として選択された文字ブロックの拡大率を決定する。そして拡大実行部37cが、拡大対象として選択された文字ブロックの拡大率に基づいてそれぞれの文字ブロックを拡大する処理を行う。以下、さらに詳しく説明する。
【0049】
拡大判定部37aは、文字ブロック形成部33によって形成された文字ブロック71〜75のそれぞれについて、その文字ブロックを拡大するか否か、すなわち、その文字ブロックを拡大対象とするか否かを判定する。
【0050】
この拡大判定部37aは、第1に、文書画像D1の最上位置又は最下位置にある文字ブロックであって、他の文字ブロックに比してブロックサイズの小さい文字ブロックを拡大対象から除外する。このような文字ブロックとしては、例えば文書画像D1に含まれるヘッダやフッタなどが該当する。ヘッダやフッタは、文書作成日時や作成者等を表すものであり、文書の本文などと比較すると情報としての有用性は低く、拡大して見やすくする意義に乏しいからである。尚、この第1の除外条件では、ブロックサイズではなく、文字サイズを評価するようにしても良い。つまり、文書画像D1の最上位置又は最下位置にある文字ブロックであって、他の文字ブロックに比して文字サイズの小さい文字列を含む文字ブロックを拡大対象から除外するようにしても良い。
【0051】
また拡大判定部37aは、第2に、文書画像D1中に存在する文字サイズのうち最大の文字サイズを含む文字ブロックを拡大対象から除外する。文書画像D1において最大の文字サイズを含む文字ブロックとしては、例えば文書のタイトルなどを含む文字ブロックが相当する。文書のタイトルなどの文字列は、文書が作成された時点で既に他の文字列よりも読みやすい大きな文字サイズとなっていることが多く、そのような場合は拡大処理を行う必要がない。そのため、本実施形態では、文書画像D1において最大の文字サイズを含む文字ブロックを拡大対象から除外するようにしている。ただし、文書画像D1における最大の文字サイズが、所定サイズよりも小さい場合には拡大対象から除外しないようにしても良い。
【0052】
上記のようにして拡大判定部37aは、文字ブロック形成部33によって形成された文字ブロック71〜75のうちから、拡大対象から除外する文字ブロックを特定し、残った文字ブロックを拡大対象として選択する。
【0053】
図11は、拡大判定部37aにより拡大判定処理が行われた後の文書画像D1を示す図である。図例では、拡大判定部37aによって拡大対象として選択された文字ブロックについてはそれに対応する拡大枠を示しており、拡大対象から除外された文字ブロックについては拡大枠を省略している。すなわち、図例の場合、拡大判定部37aは、文字ブロック71,72,75を拡大対象から除外している。そして文字ブロック73,74の2つの文字ブロックが拡大対象として選択されている。
【0054】
拡大率決定部37bは、拡大対象として選択された文字ブロックのそれぞれについて、その文字ブロックを含む拡大枠に収まる範囲で最大の拡大率を決定する処理部である。例えば図11の場合、拡大率決定部37bは、文字ブロック73が拡大枠83bに収まる範囲で最大となる拡大率を決定すると共に、文字ブロック74が拡大枠84bに収まる範囲で最大となる拡大率を決定する。ここで、拡大率決定部37bが文字ブロックの拡大率を決定する際、縦倍率と横倍率とを異なる値に設定してしまうと、文字ブロックに含まれる文字列が縦方向や横方向に延びた状態となり、却って文字を読み難くしてしまう可能性がある。そのため、縦倍率と横倍率とは同じ値を保持したまま拡大枠に収まる最大の拡大率を決定することが好ましい。
【0055】
上記のようにして拡大対象として選択された各文字ブロックについて拡大枠に収まる最大の拡大率が決定される。ところが、各文字ブロックを、拡大枠に収まる最大の拡大率で拡大してしまうと、その文字ブロックに含まれる文字列の文字サイズが、文書のタイトルの文字サイズよりも大きくなってしまい、タイトルが目立たなくなってしまう可能性がある。そこで、拡大率決定部37bは、各文字ブロックについて拡大枠に収まる最大の拡大率を決定した後、その拡大率を調整するための処理を行う。すなわち、拡大率決定部37bは、上記のようにして決定される拡大率に基づいて文字ブロックの拡大処理を行うことにより、その文字ブロックに含まれる文字列の文字サイズが、文書画像D1における最大の文字サイズを超えるか否かを判定する。そして文書画像D1における最大の文字サイズを超える場合には、当該文字ブロックの拡大率を、文書画像D1における最大の文字サイズを超えない範囲で最大の値に変更する。また文書画像D1における最大の文字サイズを超えない場合には、当該文字ブロックについて上記のようにして決定された拡大率をそのまま採用する。このようにして拡大率の調整処理が行われることにより、各文字ブロックの拡大率が最終的に決定される。
【0056】
拡大実行部37cは、拡大率決定部37bにより決定される各文字ブロックの拡大率に基づいて拡大対象となっている各文字ブロックを拡大する処理部である。拡大実行部37cが文字ブロックの拡大処理を行うことにより、その文字ブロックに含まれる文字も拡大される。拡大実行部37cは、文字ブロックを拡大する際、その文字ブロックに設定されている拡大枠を超えないように拡大処理を行う。例えば、拡大率決定部37bによって決定された拡大率に基づいて文字ブロックを拡大し、その拡大した文字ブロックが拡大枠をはみ出していれば、文字ブロックを拡大枠の範囲内に移動させるようにしても良い。
【0057】
図12は、拡大実行部37cにより拡大処理が行われた後の文書画像D2を示す図である。文字ブロック73は、拡大枠83bとほぼ一致する大きさまで拡大されている。また文字ブロック74は、文書画像D1に含まれる最大の文字サイズを超えないように拡大率が調整されているので、拡大枠84bとほぼ一致する大きさまでは拡大されず、拡大枠84bよりも小さくなっている。そして拡大後の文字ブロック74に含まれる文字列の文字サイズは、文書画像D1における最大の文字サイズとほぼ同じサイズとなるように拡大されている。
【0058】
上記のようにして文字が拡大された文書画像D2が生成されると、CPU11が文字拡大プログラム18を実行することによって行われる処理が終了する。そしてプリンタドライバ17による機能によって、文書画像D2が、画像形成装置2に送信される。その結果、画像形成装置2においてプリント出力が行われる。
【0059】
次に、CPU11が文字拡大プログラム18を実行することによって行われる具体的な処理手順について説明する。図13は、文書画像D1に含まれる文字を拡大するための文字拡大処理の詳細な処理手順の一例を示すフローチャートである。CPU11は、文字拡大プログラム18を読み出して実行を開始すると、まず処理対象となる文書画像D1を取得する(ステップS1)。そしてCPU11は、その取得した文書画像D1に含まれる文字領域41を行単位で抽出していく(ステップS2)。そして行単位で抽出された各文字領域をその近傍に位置する他の文字領域と比較していくことにより、少なくとも同一の文字属性を有する一又は複数の文字領域ごとにグループ化を行う(ステップS3)。そして、各グループごとに、そのグループに含まれる文字領域を内包する矩形の文字ブロックを形成する(ステップS4)。
【0060】
次にCPU11は、取得した文書画像D1に含まれる余白領域43を抽出する(ステップS5)。このとき、文書画像D1から抽出した余白領域43に対して利用可能余白範囲44を設定する。そしてCPU11は、取得した文書画像D1に含まれる非文字領域42を抽出する(ステップS6)。
【0061】
次にCPU11は、文字ブロックごとに、拡大枠を設定する(ステップS7)。このとき設定される拡大枠は、利用可能余白範囲44の範囲内で設定されると共に、他の拡大枠や非文字領域42と干渉しないように設定される。そしてステップS7で設定した拡大枠を、印刷可能範囲46まで拡げるか否かを判断し(ステップS8)、印刷可能範囲46まで拡げる場合には(ステップS8でYES)、文字ブロックごとに設定された拡大枠を印刷可能範囲46にまで拡張させる(ステップS9)。一方、印刷可能範囲46まで拡げない場合(ステップS8でNO)、ステップS7で設定された拡大枠がそのまま各文字ブロックの拡大枠となる。
【0062】
次にCPU11は、文字ブロックごとに拡大処理を行うか否かの判定を行い、拡大対象となる文字ブロックを選択する(ステップS10)。そして拡大対象の文字ブロックごとに拡大率を決定し(ステップS11)、その拡大率に従って文字ブロックを拡大する(ステップS12)。このとき、文字ブロックごとに設定されている拡大枠の内側に収まるように拡大処理が行われる。そしてCPU11は、選択された文字ブロックを拡大した文書画像D2を出力し(ステップS13)、全ての処理を終了する。
【0063】
以上のように、本実施形態では、コンピュータ1が文字の拡大処理を行う画像処理装置として機能する。そしてこの画像処理装置は、文字領域と余白領域とを有する文書画像から、文字領域を行単位で抽出し、行単位で抽出された各文字領域をその近傍に位置する他の文字領域と比較することにより、少なくとも同一の文字属性を有する一又は複数の文字領域ごとにグループ化し、各グループに含まれる文字領域を内包する矩形の文字ブロックを形成する。そしてこの矩形の文字ブロックが拡大処理の対象となり、文字ブロックごとに設定される拡大枠の範囲内に収まるように拡大処理が行われる。
【0064】
したがって、本実施形態では、拡大処理を行うために文書画像に含まれる各文字列の正確な位置を算出する必要はなく、しかも文字ブロックに複数行の文字列が含まれていれば、それら複数の文字列を一括して拡大することができる。そして文字ブロックを拡大するときには、他の文字ブロックや非文字領域と重ならない拡大枠の範囲内に収まるように拡大するので、拡大処理を行った後に文字領域と非文字領域とを再配置する必要がない。そのため、効率的に文字の拡大処理を行うことができるようになり、文字の拡大された文書画像が得られるまでの処理時間を従来よりも短縮することができる。
【0065】
また本実施形態では、拡大処理を行った後に文字領域と非文字領域とが重なることがないので、元の文書画像のレイアウトを崩すことなく、文字の読みやすい文書画像を生成することができる。さらに、ひとつの文章を構成する文字列が複数行に亘って表記されている場合には、それら複数行の文字列は同じ文字ブロックに含まれることとなり、一定の拡大率で拡大されるため、文章を構成する文字列が行毎に異なる文字サイズとなることはない。それ故、拡大処理を行って得られる文書画像は、読みやすく、しかも体裁の良い文書画像となる。
【0066】
また本実施形態では、拡大処理を行う際、文書画像の最上位置又は最下位置にあり、かつ、他の文字ブロックに比してブロックサイズの小さい文字ブロックについては拡大対象から除外するようにしている。それ故、ヘッダやフッタなどのように情報として有用性の低い文字列については拡大処理が行われず、文書の体裁を保持したまま必要な文字だけを拡大することができる。また、情報として有用性の低い文字列を拡大対象から除外することにより、実際に拡大処理を行う文字ブロックの数を減らすことができるので、より一層効率的に文字の拡大処理を行うことが可能になる。
【0067】
また本実施形態では、拡大処理を行う際、文書画像に含まれる最大の文字サイズを含む文字ブロックを拡大対象から除外するようにしている。そのため、文書に含まれるタイトルなどの文字列が拡大されることはなく、文書の体裁が崩れてしまうことを防止することができる。またこの場合も、実際に拡大処理を行う文字ブロックの数を減らすことができるので、より一層効率的に文字の拡大処理を行うことが可能になる。
【0068】
さらに本実施形態では、拡大処理後の文字を読みやすくするために、各文字ブロックの拡大率がなるべく大きな値となるように決定されるが、文字ブロックに含まれる文字の文字サイズが拡大処理を行うことによって文書画像に含まれる最大の文字サイズを超えてしまう場合には、その文字ブロックの拡大率を、文書画像に含まれる最大の文字サイズを超えないように決定する。これにより、文書に含まれるタイトルなどの文字列が他の文字列よりも目立たなくなってしまうことを防止することができる。そして文書の体裁を良好に保持しつつ、必要な文字列のみを拡大することが可能である。
【0069】
(変形例)
以上、本発明に関するいくつかの実施形態について説明したが、本発明は上述した内容に限られるものではなく、種々の変形例が適用可能である。
【0070】
例えば、上述した実施形態では、プリンタドライバ17に文字拡大プログラム18が組み込まれている場合を例示したが、これに限られるものではない。すなわち、上述した処理を行う文字拡大プログラム18が単独のアプリケーションプログラムとして提供されるものであっても構わない。
【0071】
また上述した実施形態では、コンピュータ1が文字の拡大処理を行う画像処理装置として機能する場合を例示した。しかし、上述した処理は、コンピュータ1以外にも適用することができる。例えば、画像形成装置2が上述した文字拡大プログラム18を実行することにより、プリント出力時に文字拡大処理を行うようにしても良い。また画像形成装置2がMFPで構成される場合、スキャナ機能により原稿を読み取って文書画像を入力することができる。このような場合には、スキャナ機能によって入力される文書画像に対し、上述した文字拡大処理を行うことでその文書文字に含まれる文字を拡大することも可能である。
【0072】
また上述した実施形態では、利用可能余白範囲44を設定する際、文書画像に含まれる余白領域43のうちから、文書作成アプリケーションプログラム19によって設定されている余白領域を除く範囲を、利用可能余白範囲44として設定する場合を例示した。しかし、上述したように例えばスキャナ機能により原稿を読み取って得られる文書画像には、文書作成アプリケーションプログラム19などによって設定される余白領域は存在しない。そのため、このような場合には、例えば文書画像に含まれる文字領域および非文字領域と内接する矩形の余白領域を仮想的に設定し、その仮想的な余白領域を利用可能余白範囲44として設定するようにしても良い。
【符号の説明】
【0073】
1 コンピュータ(画像処理装置)
10 制御部
18 文字拡大プログラム
31 文書画像取得部
32 文字領域抽出部(文字領域抽出手段)
33 文字ブロック形成部(文字ブロック形成手段)
34 余白領域抽出部(余白領域抽出手段)
35 非文字領域抽出部
36 拡大枠設定部(拡大枠設定手段)
37 拡大処理部(拡大処理手段)
37a 拡大判定部(拡大判定手段)
37b 拡大率決定部(拡大率決定手段)
41 文字領域
42 非文字領域
43 余白領域
D1 文書画像

【特許請求の範囲】
【請求項1】
文字領域と余白領域とを有する文書画像から、文字領域を行単位で抽出する文字領域抽出手段と、
前記文字領域抽出手段により抽出される行単位の各文字領域をその近傍に位置する他の文字領域と比較することにより、少なくとも同一の文字属性を有する一又は複数の文字領域ごとにグループ化し、各グループに含まれる文字領域を内包する矩形の文字ブロックを形成する文字ブロック形成手段と、
前記文書画像の余白領域を抽出する余白領域抽出手段と、
前記文字ブロック形成手段により形成される文字ブロックごとに、当該文字ブロックを内包し、かつ、当該文字ブロックの周囲の余白領域を含む拡大枠を設定すると共に、各拡大枠を他の拡大枠と干渉しない範囲で略最大となるように設定する拡大枠設定手段と、
各拡大枠に内包される文字ブロックを各拡大枠の範囲内に収まるように拡大する拡大処理手段と、
を備えることを特徴とする画像処理装置。
【請求項2】
前記文字属性は、フォントタイプ又は文字サイズであることを特徴とする請求項1記載の画像処理装置。
【請求項3】
前記文字ブロック形成手段は、同一の文字属性を有し、かつ、同一の行間を有する複数の文字領域を一のグループにグループ化することを特徴とする請求項1又は2に記載の画像処理装置。
【請求項4】
前記拡大処理手段は、文字ブロックを拡大する際に、当該文字ブロックの拡大率を決定する拡大率決定手段を更に備え、
前記拡大率決定手段は、前記拡大枠の範囲内で収まる最大の拡大率を決定することを特徴とする請求項1乃至3のいずれかに記載の画像処理装置。
【請求項5】
前記拡大率決定手段は、文字ブロックに含まれる文字サイズが、前記文書画像中に存在する最大の文字サイズを超えないように、文字ブロックの拡大率を決定することを特徴とする請求項4記載の画像処理装置。
【請求項6】
前記拡大処理手段は、文字ブロックを拡大するか否かを判定する拡大判定手段を更に備え、
前記拡大判定手段は、前記文書画像の最上位置又は最下位置にあり、かつ、他の文字ブロックに比してブロックサイズの小さい文字ブロックを拡大対象から除外することを特徴とする請求項1乃至5のいずれかに記載の画像処理装置。
【請求項7】
前記拡大処理手段は、文字ブロックを拡大するか否かを判定する拡大判定手段を更に備え、
前記拡大判定手段は、前記文書画像中に存在する文字サイズのうち最大の文字サイズを含む文字ブロックを拡大対象から除外することを特徴とする請求項1乃至5のいずれかに記載の画像処理装置。
【請求項8】
文字領域と余白領域とを有する文書画像から、文字領域を行単位で抽出するステップと、
行単位で抽出される各文字領域をその近傍に位置する他の文字領域と比較することにより、少なくとも同一の文字属性を有する一又は複数の文字領域ごとにグループ化し、各グループに含まれる文字領域を内包する矩形の文字ブロックを形成するステップと、
前記文書画像の余白領域を抽出するステップと、
文字ブロックごとに、当該文字ブロックを内包し、かつ、当該文字ブロックの周囲の余白領域を含む拡大枠を設定すると共に、各拡大枠を他の拡大枠と干渉しない範囲で略最大となるように設定するステップと、
各拡大枠に内包される文字ブロックを各拡大枠の範囲内に収まるように拡大するステップと、
を有することを特徴とする文字拡大処理方法。
【請求項9】
コンピュータを、
文字領域と余白領域とを有する文書画像から、文字領域を行単位で抽出する文字領域抽出手段、
前記文字領域抽出手段により抽出される行単位の各文字領域をその近傍に位置する他の文字領域と比較することにより、少なくとも同一の文字属性を有する一又は複数の文字領域ごとにグループ化し、各グループに含まれる文字領域を内包する矩形の文字ブロックを形成する文字ブロック形成手段、
前記文書画像の余白領域を抽出する余白領域抽出手段、
前記文字ブロック形成手段により形成される文字ブロックごとに、当該文字ブロックを内包し、かつ、当該文字ブロックの周囲の余白領域を含む拡大枠を設定すると共に、各拡大枠を他の拡大枠と干渉しない範囲で略最大となるように設定する拡大枠設定手段、および、
各拡大枠に内包される文字ブロックを各拡大枠の範囲内に収まるように拡大する拡大処理手段、
として機能させることを特徴とする文字拡大プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate


【公開番号】特開2011−151703(P2011−151703A)
【公開日】平成23年8月4日(2011.8.4)
【国際特許分類】
【出願番号】特願2010−12913(P2010−12913)
【出願日】平成22年1月25日(2010.1.25)
【出願人】(303000372)コニカミノルタビジネステクノロジーズ株式会社 (12,802)
【Fターム(参考)】