説明

画像処理装置および画像処理方法

【課題】 アルファベットと漢字が混在する文において、アンチエイリアス処理を施すことで生じる漢字のコントラストの低下により、両文字の間での生じる濃淡差を改善する。
【解決手段】 画像処理装置1は、画像の中から文字を抽出する文字抽出手段32と、前記文字の所定の領域に中間濃度を付加する中間濃度付加手段34と、前記文字の中から所定の文字を識別する文字識別手段35と、前記所定の文字に付加された前記中間濃度を修正する中間濃度修正手段36とを備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、文字を含む画像データを処理する画像処理装置および画像処理方法に関する。
【背景技術】
【0002】
情報機器において、情報を表示する表示手段としてCRT(Cathod Ray Tube)やLCD(Liquid Crystal Display)が用いられる。これらの解像度は、70dpi(dots Per inch)から200dpi程度であり、600dpi以上の解像度を有するプリンタや印刷物に比べて解像度が低いため、小さいフォントを2値で描画すると、ドット抜けを生じたり、ドット同士が繋がり文字が潰れたりした。
このような問題を解決すべく、ヒンティングやアンチエイリアスという方法が知られている。ヒンティングは、文字の部品ごとに線幅を指定したり、文字の部品同士の距離を指定するものであるが、これらの処理やフォントの設計が非常に複雑になるという問題を有した。また、アンチエイリアスは、実際に出力される解像度よりも高い解像度でフォントを描画し、塗り潰された面積を実際の解像度に変換する際に、濃度として変換する方法である。この方法では、描画するピクセルよりも線分が細い場合には、ピクセルの濃度は100%よりも薄くなり、他方で、本来は0%の濃度で表示される領域であっても、それを表現するピクセル内に線分が含まれると濃度が0%よりも濃くなるため、描画する像のコントラストが低下するという問題を有した。
これらの問題に対処するため、下記の特許文献1のように、ヒンティングの技術を応用して線幅の必要な部分に、アンチエイリアス処理を施して出力することで、描画する像の濃度を上昇させていた。
【0003】
【特許文献1】特開平10−26972号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
しかしながら、特許文献1で示すような従来の方法では、ヒンティング技術を用いるため、処理が複雑である。
また、文字の種類によらず、テーブル等を用いて文字の濃度を一括して変換することで、文字が濃くなり読み易くなるが、濃度の値を変換することにより塗り潰される面積が濃度に比例するという数学的な正しさが失われるため、フォント本来のデザインは損なわれる。
また、漢字は、アルファベットに比べて画数が多いことから、フォントの線分が中間調で表示されることが多い。従って、アルファベットと漢字が混在する文では、漢字はアルファベットに比べて濃度が薄い印象を与える。
【課題を解決するための手段】
【0005】
上記した課題を解決するために、本発明の画像処理装置は、画像の中から文字を抽出する文字抽出手段と、前記文字の所定の領域に中間濃度を付加する中間濃度付加手段と、前記文字の中から所定の文字を識別する文字識別手段と、前記所定の文字に付加された前記中間濃度を修正する中間濃度修正手段とを備えることを特徴とする。
この発明によれば、文字識別手段で識別した所定の文字を対象に、この文字の所定の領域に付加された中間濃度を中間濃度修正手段で修正することにより、漢字などの複雑な文字はコントラスト感が高まることで読みやすさが向上し、一方、数字やアルファベットなどの単純な文字は正確なデザインで表示することができる。また、文字の種類が異なることで生じる文字間の濃度差を軽減することができる。
【0006】
本発明では、中間濃度付加手段は、アンチエイリアス処理を施すことが好ましい。
この発明によれば、アンチエイリアス処理を施すことにより、斜め線や曲線がギザギザになるジャギーを目立たないように処理できる。
【0007】
本発明では、前記所定の文字は、漢字であっても良く、また、全角文字であっても良い。
また、本発明は、前記画像を表示する表示手段を更に備え、前記中間濃度修正手段は、前記表示手段が所定の解像度より低い場合に、前記中間濃度を修正することが好ましい。
また、本発明では、前記中間濃度修正手段は、ガンマ補正を用いて修正することが好ましい。
この発明によれば、文字が漢字や全角文字の場合、または表示手段が所定の解像度より低い場合に、文字の濃度を修正できる。
【0008】
上記した課題を解決するために、本発明の画像処理方法は、画像の中から文字を抽出する文字抽出工程と、前記文字の所定の領域に中間濃度を付加する中間濃度付加工程と、前記文字の中から所定の文字を識別する文字識別工程と、前記所定の文字に付加された前記中間濃度を修正する中間濃度修正工程とを備えることを特徴とする。
この発明によれば、前記した画像処理装置と同様の効果を奏する。
【発明を実施するための最良の形態】
【0009】
以下、本発明の実施形態を図面に基いて説明する。
(実施形態)
【0010】
<画像処理装置1の機能>
図1は、画像処理装置1の機能構成を示すブロック図である。この画像処理装置1の機能構成は、大きく分けて、アプリケーションソフト10と、OS(Operating System)20と、表示手段45とで構成される。
アプリケーションソフト10は、例えば、マイクロソフト社のWindows(登録商標)に添付されるマイクロソフト・ペイントのような描画ソフトである。このような描画ソフトは、ユーザが描いた絵や文字から画像データを生成する画像データ生成手段12を有する。
OS20は、前記したWindows(登録商標)のように、ファイルの管理、メモリの管理、入出力の管理、ユーザーインターフェースの提供などを行なう基本ソフトウェアである。即ち、ファイルを開いたり、画面に表示したりなど、アプリケーションには共通の動作があるが、それぞれのアプリケーションにこのような共通部分の処理を提供している。また、このOS20には、GDI(Graphic Device Interface)のような描画サービス機能を備える描画サービス部30と、表示手段45に対応した描画処理手段40が含まれる。ここで、描画サービス機能とは、図形、数学的曲線の描画、フォント描画、図形の塗り潰し、図形の重ね合わせ、座標の管理、任意の解像度での出力、任意の色数での出力などの機能である。
【0011】
尚、この描画サービス部30は、文字抽出手段32と、中間濃度付加手段34と、文字識別手段35と、中間濃度修正手段36とを備える。
文字抽出手段32は、画像データから文字の部分を抽出する。ここで、この画像処理装置1で扱われる文字について説明する。この画像処理装置1で文字を利用するためには、文字コードという文字集合と符号化方法を定義したシステムを利用する。即ち、JIS X 0208やJIS X 0212で定義された文字集合である区点コード、7ビットの伝送路で送ることができるため電子メールで利用されるJISコード、Windows(登録商標)等で使用されるシフトJISコード、Unix(登録商標)系OSで利用されるEUCコード、複数バイトを用いて世界中の文字を表示するUnicodeなどが文字コードとして知られている。これらの文字コードにおいては以下のような規則がある。
【0012】
区点コードにおいて、94×94の行列の中に8836個の文字を配置しているが、その行に相当するのが区である。1−2区は各種記号、3区は数字、ローマ字、4区はひらがな、5区はカタカナ、6区はギリシャ文字、7区はキリル文字、8区は罫線素片、16−47区は第一水準漢字、48−84区は第二水準漢字が配置される。区点コードは文字集合であり、コンピュータ上で扱うためには、JISやシフトJISといったコーディングが必要になる。
また、JISコード(ISO−2022−JP)ではエスケープシーケンスを目印にして文字コードを切り替える。例えば、“[ESC] ( B”によってASCIIに切り替わり、“[ESC] ( J”によってJISローマ字に切り替わり、“[ESC] $ @”によってJIS−1978に切り替わり、“[ESC] $ B”によってJIS−1983に切り替わる。
また、シフトJISコードでは、英数字(ASCII、0x21〜0x7E)や1バイト仮名(半角カナ、0xA1〜0xDF)はそのまま用い、2バイト文字は英数字や1バイト仮名と重複しない、10進数の129〜159,224〜239(0x81〜0x9F,0xE0〜0xEF)の範囲のバイトが現れると2バイトモードが開始される。続く第2バイトは64〜126,128〜252(0x40〜0x7E,0x80〜0xFC)の範囲を利用する。
【0013】
更に、EUCコードでは第1バイトが0x21〜0x7EでASCII(G0セット)、第1バイトが0xA0〜0xFF、第2バイトが0xA0〜0xFFでJIS X 0208−1900(新JIS)(G1セット)、第1バイトが0x8E、第2バイトが0xA0〜0xFFでJIS X 0201カナ(1バイト仮名)(G2セット)、第1バイトが0x8F、第2バイトが0xA0〜0xFF、第3バイトが0xA0〜0xFFでJIS X 0212−1990(補助漢字)(G3セット)を表す。
また、UnicodeをUCS−2(Universal Character Set coded in 2 octets)を用いて表すと、U+0000〜U+007FがASCII、U+0080〜U+07FFがギリシャ文字やロシア文字、U+0800〜U+FFFFが漢字や仮名となる。このUnicodeをUTF−8(Unicode Transformation Format,8−bit encoding form)を用いて表すと、第1バイトが0xxxxxxx(xには0または1が入る。)となる1バイトのコードがASCII、第1バイトが110xxxxx、第2バイトが10yyyyyy(yには0または1が入る。)となる2バイトのコードがギリシャ文字やロシア文字、第1バイトが1110xxxx、第2バイトが10yyyyyy、第3バイトが10yyyyyyとなる3バイトのコードが漢字や仮名などを表す。
中間濃度付加手段34は、文字抽出手段32で抽出した文字に対して、中間濃度を付加する。この中間濃度の付加とは、アンチエイリアス処理を施すことである。このアンチエイリアス処理について、フォントの描画を例に取り説明する。
【0014】
この画像処理装置1を始めとする多くの情報機器では、輪郭線の座標を記録したアウトラインフォントが多く用いられる。フォント描画機能は、このアウトラインフォントから指定されたサイズで文字を形成する機能を備える。即ち、アウトラインフォントの描画処理は、ピクセルの中心がアウトラインの内部にある場合にはそのピクセルの塗り潰しを行い、アウトライン外部にある場合は塗り潰しを行わない。このため、表示手段45が低い解像度であることに加えて、小さいサイズのフォントで描画した場合、ドット抜けや線と線との余白が無くなるといった問題を生じる。また、白と黒の2値であるために、斜め線や曲線がギザギザになるジャギー(擬似輪郭、エイリアシング)が目立つ。このようなジャギーは、例えば、Jamaes D.Foleyetal「コンピュータグラフィックス、原理および実際」、第2版に説明されているように、文字の所定の領域、即ち、始点や終点のような端部に中間濃度を付加するアンチエイリアス処理を施すことで滑らかにできる。
文字識別手段35は、文字抽出手段32で抽出した文字の中から、所定の文字か否かを識別する。ここで、所定の文字は、画像処理装置1で予め設定される。即ち、所定の文字が漢字のみ該当する場合や、2バイトで表示される全角文字が全て該当する場合を設定できることに加えて、表示手段45で表示する解像度が低い場合や、フォントのサイズが所定のサイズ以下の場合にのみ、該当するように設定できる。このように設定された文字か否かの判断は、前記した文字コードの規則を用いて判断できる。
【0015】
中間濃度修正手段36は、文字識別手段35で所定の文字と識別された文字の中間濃度を、所定のテーブルに従い修正する。ここで、所定のテーブルとは、ガンマ補正により得られる補正値のテーブルである。ガンマ補正とは、画像などの色のデータと、それが実際に出力される際の信号の相対関係を、特に中間調において調節することで、より自然に近い表示を得るための補正操作である。例えば、この画像処理装置1の表示手段45に採用されているCRTは、その構造上、入力信号の電圧に対する、出力輝度値は非線形であるため、この出力輝度値をガンマ補正により補正している。
入力値をPi、出力値をPo、ガンマ値をγ、信号の最大値を256とすると、入力値と出力値との関係は、次式で表される。
【0016】
【数1】

【0017】
ここで、0が黒、255が白として、出力解像度のそれぞれ縦横2倍のオーバーサンプリングを行うと、0,1,2,3,4の5階調が得られる。これを256階調に丸め、またγに2を適用すると図9のような、ガンマ補正による入力値と出力値の関係が得られる。この関係を基にテーブルを予め作成して、補正の際に参照する。尚、本実施形態では、中間調の濃度値を変える方法としてガンマ補正を用いるが、この方法に限定するものではない。
描画処理手段40は、ディスプレイドライバのように、表示手段45のハードウェアの違いを吸収し、上位のソフトウェア(OSカーネルなど)に対して統一的なグラフィックスの出力手段を提供するデバイスドライバである。
【0018】
<画像処理装置1の構成>
次に、画像処理装置1のハードウェアについて説明する。図2は、画像処理装置1のハードウェア構成を示す図である。この画像処理装置1は、情報処理の主体となるハードウェアとしてCPU50を具備している。このCPU50には、バスライン70により、ROM52、RAM54、例えばハードディスクドライブやメモリカードのような記憶装置56、キーボード60や図示を略したマウス等から入力された情報をバスライン70に伝える入力装置58、表示手段45を備えた表示装置64を駆動する表示駆動装置62およびプリンタ68と接続する入出力I/F(InterFace)66などが接続されている。
この画像処理装置1では、ROM52、RAM54および記憶装置56は、各種動作に必要な制御プログラムやデータファイルがソフトウェアとして記憶されている。例えば、CPU50に各種の処理動作を実行させる制御プログラムは、記憶装置56に事前にインストールされており、画像処理装置1の起動時にRAM54に複写されてCPU50に読み取られる。
また、CPU50やRAM54等からなるハードウェア資源と、ROM52や記憶装置56に記憶されたソフトウェアとが有機的に協働することにより、前記したそれぞれの機能を実現している。
【0019】
<画像処理装置1の作用>
以上の構成を有する画像処理装置1の処理について説明する。図3は、この画像処理装置1の処理の流れを示すフローチャートである。
最初に、描画ソフトのようなアプリケーションソフトがユーザにより起動される(ステップS102)。
このアプリケーションソフトは、Windows(登録商標)の管理下でユーザからの要求に応じて動作するイベントドリブンなソフトウェアである。従って、このソフトウェアは、入力装置58からの入力要求(ステップS104)、プリンタ68による印刷要求(ステップS110)およびアプリケーションの終了要求(ステップS116)などを常に監視している。従って、入力装置58からの入力要求が無く(ステップS104でNo)、プリンタ68による印刷要求も無く(ステップS110でNo)、更にアプリケーションの終了要求も無い(ステップS116でNo)場合は、再度、前記した入力装置58からの入力要求(ステップS104)に戻り、このループにより、これらの要求を監視する。
【0020】
ここで、入力装置58からの入力要求が有った場合(ステップS104でYes)、描画サービス部30を利用する(ステップS106)。この描画サービス部30での処理の詳細は後述する。この描画サービス部30で処理された画像は、表示装置64に送られ表示される(ステップS108)。その後、前記したループに戻る。
また、プリンタ68による印刷要求が有った場合(ステップS110でYes)、描画サービス部30を利用する(ステップS112)。この描画サービス部30で処理された画像は、プリンタ68に送られ印刷される(ステップS114)。その後、前記したループに戻る。
また、アプリケーションの終了要求が有った場合(ステップS116でYes)は、前記したループを抜け、一連の処理を終了する。
【0021】
<描画サービス部30の作用>
次に、描画サービス部30での処理について説明する。図4は、この描画サービス部30での処理の流れを示すフローチャートである。
描画サービス部30では、最初に、入力装置58や記憶装置56から、描画する画像データを入力する(ステップS120)。ここで、図5は、アウトラインフォントにより生成された「い」の文字を示す図であり、以降、この図5のような文字が入力された場合を例に取り、図5〜図10も参照して説明する。
次に、入力した文字のフォントに対してアンチエイリアス処理を行って描画する(ステップS122)。ここで、アンチエイリアス処理について説明する。
最初に、文字抽出工程が実行される。即ち、文字抽出手段32が文字部分である「い」を抽出する。図6は、抽出した文字を表示装置64の解像度に合わせて描画したイメージ図である。
続いて、中間濃度付加工程が実行される。即ち、アンチエイリアス処理を行う中間濃度付加手段34は、図7のように、表示装置64の解像度の2倍の解像度で描画したイメージを生成する。更に、中間濃度付加手段34は、図7のようなイメージから、2倍の解像度で塗り潰された面積を濃度に比例させて描画したイメージを示す。具体的には、図6のマス目1つの中に図7のマス目が4つずつ含まれるが、4つのうちの1つも塗り潰されていなければ白を、1つ塗り潰されていれば25%のグレーを、2つ塗り潰されていれば50%のグレーを、3つ塗り潰されていれば75%のグレーを、4つとも塗り潰されていれば黒を用いて図6のマス目を塗り潰す。このように、中間濃度付加手段34によりアンチエイリアス処理を施すことで、図8のようなイメージが生成される。
【0022】
次に、描画する文字のフォントの文字幅やサイズ等フォントの基準寸法が定義されたフォントメトリックスを出力する(ステップS124)。
続いて、文字識別工程が実行され、文字識別手段35で、表示装置64の設定されている解像度が所定の閾値以下か否かを調べる(ステップS126)。ここで、表示装置64の設定されている解像度が所定の閾値以下である場合(ステップS126でYes)、更に、対象の文字が漢字か否かを調べる(ステップS128)。
ここで、対象の文字が漢字である場合(ステップS128でYes)、中間濃度修正手段36により、中間濃度修正工程が実行され、中間濃度の補正を行う(ステップS130)。ここで、中間濃度の補正は、前記したガンマ補正により作成されたテーブルを参照する。例えば、図8のようなイメージに対して、ガンマ補正を施すことにより、中間濃度が補正され、図10に示すようなイメージになる。尚、本フローチャートでは、漢字のみを中間濃度修正の対象としたが、全角文字である場合や、表示する解像度が標準で使用される解像度より低い場合や、フォントのサイズが標準よりも小さいサイズの場合についても、文字識別手段35の設定により中間濃度修正の対象にできる。
図4にもどり、前記したフォントメトリックスに従い、中間濃度が補正されたイメージを表示装置64に表示して終了する(ステップS132)。加えて、表示装置64の設定されている解像度が所定の閾値以下でない場合(ステップS126でNo)、および、対象の文字が漢字でない場合(ステップS128でNo)においても、フォントメトリックスに従い、イメージを表示装置64に表示して終了する(ステップS132)。
【0023】
以上述べた実施形態によれば、以下のような効果を奏する。
(1)文字抽出手段32と文字識別手段35は、文字コードを用いるため、文字の字体や大きさに依らず、所定の文字の抽出や識別ができる。
(2)描画サービス部30は、OS20の内部で処理されるため、アプリケーションソフト10に依らず処理できる。
【0024】
以上、本発明を図示した実施形態に基づいて説明したが、本発明は、これらに限定されるものではなく、以下に述べるような変形例も想定できる。
(1)描画処理手段40は、ディスプレイドライバのようなデバイスドライバに限らず、プリンタドライバと略同一の機能を有して印刷処理を行い、印刷結果を電子ファイルとして出力する「仮想プリンタ」のデバイスドライバでも良い。
(2)画像処理装置1で表示する言語は、日本語に限らず、中国語や朝鮮語など複雑な字体を含む言語でも良い。
【図面の簡単な説明】
【0025】
【図1】本発明の実施形態に係る画像処理装置の機能構成を示すブロック図。
【図2】実施形態に係る画像処理装置のハードウェア構成を示す図。
【図3】実施形態に係る画像処理装置の処理の流れを示すフローチャート。
【図4】実施形態に係る描画サービス部での処理の流れを示すフローチャート。
【図5】実施形態に係るアウトラインフォントにより生成された文字を示す図。
【図6】実施形態に係る表示装置の解像度に合わせて描画したイメージ図。
【図7】実施形態に係る表示装置の解像度の2倍の解像度で描画したイメージ図。
【図8】実施形態に係るアンチエイリアス処理を施したイメージ図。
【図9】実施形態に係るガンマ補正による入力値と出力値の関係を示す図。
【図10】実施形態に係るガンマ補正による中間濃度を補正したイメージ図。
【符号の説明】
【0026】
1…画像処理装置、10…アプリケーションソフト、12…画像データ生成手段、20…OS、30…描画サービス部、32…文字抽出手段、34…中間濃度付加手段、35…文字識別手段、36…中間濃度修正手段、40…描画処理手段、45…表示手段、50…CPU、52…ROM、54…RAM、56…記憶装置、58…入力装置、60…キーボード、62…表示駆動装置、64…表示装置、66…入出力I/F、68…プリンタ、70…バスライン。

【特許請求の範囲】
【請求項1】
画像の中から文字を抽出する文字抽出手段と、
前記文字の所定の領域に中間濃度を付加する中間濃度付加手段と、
前記文字の中から所定の文字を識別する文字識別手段と、
前記所定の文字に付加された前記中間濃度を修正する中間濃度修正手段とを備えることを特徴とする画像処理装置。
【請求項2】
請求項1に記載の画像処理装置において、
前記中間濃度付加手段は、アンチエイリアス処理を施すことを特徴とする画像処理装置。
【請求項3】
請求項1乃至2に記載の画像処理装置において、
前記所定の文字は、漢字であることを特徴とする画像処理装置。
【請求項4】
請求項1乃至2に記載の画像処理装置において、
前記所定の文字は、全角文字であることを特徴とする画像処理装置。
【請求項5】
請求項1乃至4のいずれか一項に記載の画像処理装置において、
前記画像を表示する表示手段を更に備え、
前記中間濃度修正手段は、前記表示手段が所定の解像度より低い場合に、前記中間濃度を修正することを特徴とする画像処理装置。
【請求項6】
請求項1乃至5のいずれか一項に記載の画像処理装置において、
前記中間濃度修正手段は、ガンマ補正を用いて修正することを特徴とする画像処理装置。
【請求項7】
画像の中から文字を抽出する文字抽出工程と、
前記文字の所定の領域に中間濃度を付加する中間濃度付加工程と、
前記文字の中から所定の文字を識別する文字識別工程と、
前記所定の文字に付加された前記中間濃度を修正する中間濃度修正工程とを備えることを特徴とする画像処理方法。


【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図9】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図10】
image rotate


【公開番号】特開2006−208636(P2006−208636A)
【公開日】平成18年8月10日(2006.8.10)
【国際特許分類】
【出願番号】特願2005−19262(P2005−19262)
【出願日】平成17年1月27日(2005.1.27)
【出願人】(000002369)セイコーエプソン株式会社 (51,324)
【Fターム(参考)】