画像からテキスト筆画画像を抽出する方法及び装置
【課題】画像からテキスト筆画画像を抽出する方法及び装置を提供する。
【解決手段】本発明の1態様によれば、画像からテキスト筆画画像を抽出する方法は、画像のエッジ情報と勾配情報を取得し、取得されたエッジ情報と勾配情報に予め設けられた強調処理を行うことにより、画像においてテキストに関するエッジ情報と勾配情報を強調し、強調されたエッジ情報と勾配情報に対応するテキスト筆画画像を取得することを含む。
【解決手段】本発明の1態様によれば、画像からテキスト筆画画像を抽出する方法は、画像のエッジ情報と勾配情報を取得し、取得されたエッジ情報と勾配情報に予め設けられた強調処理を行うことにより、画像においてテキストに関するエッジ情報と勾配情報を強調し、強調されたエッジ情報と勾配情報に対応するテキスト筆画画像を取得することを含む。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像処理分野に関し、特に、画像からテキスト筆画画像を抽出する方法及び装置に関する。
【背景技術】
【0002】
現在の情報処理分野において、大量のビデオファイルが存在している。これらビデオファイルに効率的な検索を行う必要がある。ビデオ注釈、ビデオ探索等については、ビデオにおけるテキスト情報が正確且つ簡単な手がかりとなる。従って、ビデオに含まれるテキスト情報をどのように正確に抽出して認識するかということは、後続のビデオ注釈、ビデオ検索にとって非常に重要である。
【発明の概要】
【発明が解決しようとする課題】
【0003】
既知の幾つかのテキスト筆画の抽出技術は、速度が遅く、ノイズが大きく、筆画の尺度に敏感ではないなどの欠点がある。
上記した課題を解決しうる、画像からテキスト筆画画像を抽出する方法及び装置が望まれる。
【課題を解決するための手段】
【0004】
以下に、本発明を簡単に説明して本発明の幾つかの態様の基本的な理解を提供する。この簡単な説明は、本発明に対する網羅的なものではない。その目的としては、本発明の肝心部分又は重要部分を決定する意図がなく、本発明の範囲を限定する意図もなく、簡単な形式で幾つかの概念を提供して後述のより詳しい説明の先行説明とすることに過ぎない。
本発明は、画像からテキスト筆画画像を抽出する方法及び装置を提供することを目的とする。
【0005】
本発明の1つの態様によれば、画像からテキスト筆画画像(text stroke image)を抽出する方法であって、画像のエッジ情報と勾配情報を取得し、取得されたエッジ情報と勾配情報に予め設けられた強調処理(enhancement)を行うことにより、画像においてテキストに関するエッジ情報と勾配情報を強調し、強調されたエッジ情報と勾配情報に対応するテキスト筆画画像を取得することを含む方法が提供される。
【0006】
本発明の別の態様によれば、画像からテキスト筆画画像を抽出する装置であって、画像のエッジ情報と勾配情報を取得する情報取得手段と、取得されたエッジ情報と勾配情報に予め設けられた強調処理を行うことにより、画像においてテキストに関するエッジ情報と勾配情報を強調する強調手段と、強調されたエッジ情報と勾配情報に対応するテキスト筆画画像を取得する筆画画像取得手段とを備える装置が提供される。
【0007】
また、本発明の実施の形態では、上記方法を実現するコンピュータプログラムが更に提供される。
【0008】
また、本発明の実施の形態では、上記方法を実現するコンピュータプログラムコードが記録され、少なくともコンピュータにより読取り可能な媒体の形式のコンピュータプログラムプロダクトが更に提供される。
【0009】
以下の図面による本発明に対する最適の実施の形態の詳細な説明により、本発明の上記利点及び他の利点がより明らかになるであろう。
【図面の簡単な説明】
【0010】
以下、図面に基づいて本発明の実施の形態に対する説明を参照し、本発明の上記目的、特徴及び利点、並びに他の目的、特徴及び利点をより容易に理解することができる。図面における構成要素は本発明の原理を示すものに過ぎない。図面において、同一又は類似の技術的特徴又は構成要素は、同一又は類似の符号で示される。
【図1】本発明の実施の形態に係る、画像からテキスト筆画画像を抽出する方法を示すフローチャートである。
【図2】図2は、ステップ信号、パルス信号、ソーベル演算子に対応する信号、ソーベル演算子でステップ信号を抽出した抽出結果、ソーベル演算子でパルス信号を抽出した抽出結果、ステップ信号の抽出結果に絶対値を取った信号、パルス信号の抽出結果に絶対値を取った信号、及び相応のオフセットを行った信号を示す模式図である。
【図3】本発明による、ソーベル演算子を利用して画像からテキスト筆画画像を抽出する方法を示すフローチャートである。
【図4】処理される原始画像を示す図である。
【図5A】ソーベル演算子を用いて畳込み処理を行った画像を示す図である。
【図5B】ソーベル演算子を用いて畳込み処理を行った画像を示す図である。
【図5C】ソーベル演算子を用いて畳込み処理を行った画像を示す図である。
【図5D】ソーベル演算子を用いて畳込み処理を行った画像を示す図である。
【図5E】ソーベル演算子を用いて畳込み処理を行った画像を示す図である。
【図5F】ソーベル演算子を用いて畳込み処理を行った画像を示す図である。
【図5G】ソーベル演算子を用いて畳込み処理を行った画像を示す図である。
【図5H】ソーベル演算子を用いて畳込み処理を行った画像を示す図である。
【図6A】ソーベル演算子で処理した画像を対向する方向にオフセットし、且つオフセットした画像を合成して得られた四つの画像を示す図である。
【図6B】ソーベル演算子で処理した画像を対向する方向にオフセットし、且つオフセットした画像を合成して得られた四つの画像を示す図である。
【図6C】ソーベル演算子で処理した画像を対向する方向にオフセットし、且つオフセットした画像を合成して得られた四つの画像を示す図である。
【図6D】ソーベル演算子で処理した画像を対向する方向にオフセットし、且つオフセットした画像を合成して得られた四つの画像を示す図である。
【図7A】ソーベル演算子で処理した画像を反対の方向にオフセットし、且つオフセットした画像を合成して得られた四つの画像を示す図である。
【図7B】ソーベル演算子で処理した画像を反対の方向にオフセットし、且つオフセットした画像を合成して得られた四つの画像を示す図である。
【図7C】ソーベル演算子で処理した画像を反対の方向にオフセットし、且つオフセットした画像を合成して得られた四つの画像を示す図である。
【図7D】ソーベル演算子で処理した画像を反対の方向にオフセットし、且つオフセットした画像を合成して得られた四つの画像を示す図である。
【図8】整合された細い筆画画像を示す図である。
【図9】整合した太い筆画画像を示す図である。
【図10】フィルタリング処理により得られた太い筆画画像を示す図である。
【図11】本発明の実施の形態に係る、画像からテキスト筆画画像を抽出する装置を示すブロック図である。
【図12】本発明の実施の形態に係る、ソーベル演算子で画像からテキスト筆画画像を抽出する装置を示すブロック図である。
【図13】本発明における、画像からテキスト筆画画像を抽出する方法及び装置を実施可能なコンピュータ装置を例として示す構成図である。
【発明を実施するための形態】
【0011】
以下に、図面を参照して本発明の実施の形態を説明する。本発明の一つの図面又は一種類の実施の形態に説明された要素と特徴は、一つ又はそれ以上の他の図面或いは実施の形態に示された要素及び特徴と結合することができる。ここで、明瞭にするために、図面及び説明において、当業者にとって知られている、本発明と関係ない構成要素と処理の表示及び説明が省略されている。
【0012】
以下に、図1を参照して本発明の実施の形態に係る、画像からテキスト筆画画像を抽出する方法について説明する。
図1は、本発明の実施の形態に係る、画像からテキスト筆画画像を抽出する方法を示すフローチャートである。図1に示されたように、ステップS102において、画像のエッジ情報及び勾配情報を取得することができる。
好ましくは、画像のエッジ情報及び勾配情報を表すステップ信号又はパルス信号を解析し、解析結果に基づいてエッジ情報と勾配情報を抽出することができる。
【0013】
画像において、細い筆画の画像データをパルス信号で示し、太い筆画の画像データ及びそれと類似する大きい尺度対象をステップ信号で示すことができる。パルス信号を解析し、その解析結果に基づいて細い筆画のエッジ情報と勾配情報を抽出することができる。また、ステップ信号を解析し、その解析結果に基づいて太い筆画のエッジ情報と勾配情報を抽出し、太い筆画と類似する大きい尺度対象のエッジ情報と勾配情報を抽出することができる。
【0014】
以下に、図2を参照して、ソーベル演算子でステップ信号を抽出する過程とソーベル演算子でパルス信号を抽出する過程、及びオフセット処理と合成処理により強調処理を実行する過程について説明する。
【0015】
図2(i)はステップ信号、図2(ii)はパルス信号、図2(iii)と図2(iv)はソーベル演算子に対応する信号、図2(v)はソーベル演算子でステップ信号を抽出した抽出結果、図2(vi)はソーベル演算子でパルス信号を抽出した抽出結果、図2(vii)はステップ信号の抽出結果に絶対値を取った信号、図2(viii)はパルス信号の抽出結果に絶対値を取った信号、及び図2(ix)と図2(x)は相応のオフセットした信号を示した。
【0016】
ここで、図2における座標及び大きさは、限定的ではなく、例示的なものであり、且つ関連の信号処理の原理を示すためのものに過ぎない。
【0017】
図2に示されたように、(図2(iii)に示されるような)ソーベル演算子で(図2(i)に示されるような)ステップ信号を抽出することにより、(図2(v)に示されるような)単一の谷状な信号を取得することができる。その一方、(図2(iv)に示されるような)ソーベル演算子で(図2(ii)に示されるような)パルス信号を抽出することにより、(図2(vi)に示されるような)谷状な信号と山のような信号を結合した信号を取得することができる。以上のように、ソーベル演算子でステップ信号とパルス信号を抽出することにより、(図2(v)と図2(vi)に示されるような)差異の大きい二つの信号を相応的に取得することができる。
【0018】
次に、後に説明する(例えばオフセット処理と合成処理を含む)強調処理によりステップ信号とパルス信号を強調することができる。これにより、パルス信号に対応する細い筆画の画像データ及びステップ信号に対応する太い筆画の画像データを抽出する。
【0019】
例えば、ソーベル演算子で抽出されたパルス信号における(図2(vi)に示されるような)谷状な信号に絶対値を取って(即ち谷状な信号の大きさを取る)別の山のような信号(図2(viii)に示されるような)を得ることができる。その後に、当該別の山のような信号と元の山のような信号の部分(即ちソーベル演算子で抽出された山のような信号)を対向的な方向にオフセットさせ、且つオフセットした当該別の山のような信号と元の山のような信号とを重ねることにより(図2(x)に示されるような)、更に当該パルス信号に対応する細い筆画の画像データを強調することができる。また、(図2(v)に示されるような)ソーベル演算子で抽出されたステップ信号における谷状な信号に絶対値を取って、(図2(vii)に示されるような)もう一つの山のような信号を得ることができる。その後、(図2(ix)に示されるような)当該もう一つの山のような信号をオフセットさせる。
【0020】
選択的に、予め設けられたフィルタリング条件に基づいて、太い筆画と類似する大きい尺度対象のエッジ情報と勾配情報をフィルタリングすると共に、太い筆画のエッジ情報と勾配情報を残すことができる。具体的なフィルタリング処理について後に説明する。
【0021】
選択的に、画像の明瞭度に基づいて、或いは必要に応じて、図4に示された原始画像に対してフィルタリングしても良い。例えば、ローパスフィルタを用いて原始画像をフィルタリングすることによって画像中のノイズを抑制することができる。ローパスフィルタは、例えばガウシャンフィルタであっても良いが、それに限定されなく、当業者に既知された任意の適当なローパスフィルタであっても良い。
【0022】
ステップS104において、取得されたエッジ処理と勾配処理に予め設けられた強調処理を行うことにより、画像においてテキストに関するエッジ情報と勾配情報を強調することができる。
【0023】
各種の方法でエッジ情報と勾配情報に強調処理を行うことができる。好ましくは、2値化処理と整合処理でエッジ情報と勾配情報を強調することができる。ここでの整合処理は、積集合を求める処理、最大値を求める処理、或いは平均値を求める処理であっても良い。好ましくは、後に説明されるように、整合処理は積集合を求める処理であっても良い。
【0024】
ステップS106において、強調されたエッジ情報と勾配情報に対応するテキスト筆画画像を得ることができる。
【0025】
以下に、図3〜図10を参照して、本発明の実施の形態に係る、ソーベル演算子で画像からテキスト筆画画像を抽出する方法について説明する。
【0026】
図3は本発明の実施の形態に係る、ソーベル演算子で画像からテキスト筆画画像を抽出する方法を示すフローチャートである。図4は処理する原始画像を示す図である。図5A〜図5Hは、ソーベル演算子で畳み込み処理を行った画像を示す図である。図6A〜図6Dは、画像を対向する方向にオフセットさせ、且つオフセットした画像を合成した四つの画像を示す図である。図7A〜図7Dは、画像を反対の方向にオフセットさせ、且つオフセットした画像を合成した四つの画像を示す図である。図8は、整合した細い筆画画像を示す図である。図9は、整合した太い筆画画像を示す図である。図10は、フィルタリング処理を行った太い筆画画像を示す図である。
【0027】
図3に示されたように、ステップS202において、(例えば図4に示された原始画像といった)処理される画像に(例えばローパスフィルタといった)平滑化処理を行うことができる。ステップS202は選択可能なものである。言い換えれば、画像が比較に明瞭である場合に、或いは必要に応じて、図4に示された画像に(例えばローパスフィルタといった)平滑化処理を行わなくても良い。
【0028】
ここで、図4に示された原始画像を処理すべき画像とする。図4において、抽出されたテキスト筆画に、画像の右上隅にあるFUJITSUと画像の下側の日本語文字を含むと望ましい。なお、FUJITSUは細い筆画の文字、日本語文字は太い筆画の文字である。ここでは、図4が例示的なものに過ぎない。実際に、画像において細い筆画の文字のみ、或いは太い筆画の文字のみが含まれる場合もある。
【0029】
ステップS204において、ソーベル(Sobel)演算子で平滑化された画像に畳み込み処理を行うことができる。ステップS202の平滑化処理が行われない場合に、ソーベル演算子を直接に利用して、(例えば図4に示された原始画像)処理する画像に畳み込み処理を行うことができる。
【0030】
具体的に、ソーベル演算子を利用して、処理する画像に複数の方向において畳み込み処理を行う。言い換えれば、画像の複数の方向におけるエッジ情報と勾配情報を取得するための複数のソーベル演算子のコンボリューションカーネルを利用して、画像の画像データに畳み込み演算をそれぞれ行う。
【0031】
例えば、ソーベル演算子を利用して、処理される画像に四つの方向において畳み込み処理を行う。好ましくは、これら四つの方向が水平方向、垂直方向、及び二つの対角線方向を含む。畳み込み処理が行われた画像は、図5A〜5Hに示される。これら四つの方向を選択する原因としては、これら四つの方向のそれぞれが常用な筆画
(外1)
に対応するからである。
【0032】
例えば、利用されたソーベル演算子のコンボリューションカーネルは、以下のようになる。
【表1】
【0033】
なお、Shは水平方向に係るソーベル演算子のコンボリューションカーネル、Svは垂直方向に係るソーベル演算子のコンボリューションカーネル、Srdは第1の対角線方向に係るソーベル演算子のコンボリューションカーネル、Sldは第2の対角線方向に係るソーベル演算子のコンボリューションカーネルである。第1の対角線方向は右上隅から左下隅までの対角線方向、第2の対角線方向は左下隅から右下隅までの対角線方向である。
【0034】
ここで、畳み込み処理の結果が正と負の両方を含むため、二層の画像を利用して畳み込み結果を記憶することができる。その一つは正パルス応答画像を記憶するために用いられ、もう一つは負パルス応答画像を記憶するために用いられる。言い換えれば、各方向に対する畳み込み演算の結果を、各方向に対する正パルス応答画像データと負パルス応答画像データとに区分する。
【0035】
本明細書に四つの方向の例が開示されたが、四つの方向において畳み込み演算を行うことに限定されるわけではない。高精度が必要の場合に、或いは他の必要に応じて、より多い方向、例えば8個の方向のソーベル演算子のコンボリューションカーネルを利用して、処理する画像に畳み込み処理を行うことができる。より多い方向の畳み込み演算により、精度のより高い結果を得ることができる。ソーベル演算子の定義及び画像データとの畳み込み処理は、任意の好適な従来の技術によるものであっても良い。
【0036】
図4に示された原始画像に畳み込み処理を行うことにより、図5A〜図5Hに示された、ソーベル演算子のコンボリューションカーネルで畳み込み処理を行った画像を得ることができる。
【0037】
具体的に、図5Aは、水平方向の正パルス応答画像データを含む画像、図5Bは、水平方向の負パルス応答画像データを含む画像を、それぞれ示す。図5Cは、垂直方向の正パルス応答画像データを含む画像、図5Dは、垂直方向の負パルス応答画像データを含む画像をそれぞれ示す。図5Eは、右上隅から左下隅までの対角線方向の正パルス応答画像データを含む画像、図5Fは、右上隅から左下隅までの対角線方向の負パルス応答画像データを含む画像をそれぞれ示す。図5Gは、左上隅から右下隅までの対角線方向の正パルス応答画像データを含む画像、図5Hは、左上隅から右下隅までの対角線方向の負パルス応答画像データを含む画像をそれぞれ示す。
【0038】
次に、図6A〜6D及び図7A〜7Dに示されたように、ステップS206において、予め推定された筆画幅を利用して、正パルス応答画像データと負パルス応答画像データをオフセットし、オフセットされた画像を合成する。
【0039】
各方向に対する正パルス応答画像データと負パルス応答画像データに対して、それを対向する方向にオフセットし、かつ、加算する演算を実行することによって、各方向に対する第1の合成画像データを得ることができる。また、各方向に対する正パルス応答画像データと負パルス応答画像データに対して、それを反対の方向にオフセットし、かつ、加算する演算を実行することによって、各方向に対する第2の合成画像データを得ることができる。
【0040】
例えば、対向する方向にオフセットさせ、かつ、加算する演算は、以下の(1)式に基づいて実行されても良い。
Ih(x,y)=(Ih-positive(x,y-w/2)+Ih-negative(x,y+w/2))/2
Iv(x,y)=(Iv-positive(x-w/2,y)+Iv-negative(x+w/2,y))/2
Ird(x,y)=(Ird-positive(x+w/2,y-w/2)+Ird-negative(x-w/2,y+w/2))/2
Ild(x,y)=(Ild-positive(x-w/2,y-w/2)+Ild-negative(x+w/2,y+w/2))/2
また、反対の方向にオフセットし、かつ、加算する演算が以下の(2)式に基づいて実行されても良い。
【0041】
Ih’(x,y)=(Ih-positive(x,y+w/2)+Ih-negative(x,y-w/2))/2,
Iv’(x,y)=(Iv-positive(x+w/2,y)+Iv-negative(x-w/2,y))/2,
Ird’(x,y)=(Ird-positive(x-w/2,y+w/2)+Ird-negative(x+w/2,y-w/2))/2,
Ild’(x,y)=(Ild-positive(x+w/2,y+w/2)+Ild-negative(x-w/2,y-w/2))/2
なお、xは画素の横座標、yは画素の縦座標、Ih(x,y)、Iv(x,y)、Ird(x,y)及びIld(x,y)は画素の横方向、縦方向及び二つの対角線方向の四つの方向に対する第1の合成画像データをそれぞれ示す。なお、第1の合成画像データを含む画像は、図5A〜5Dに示される。
【0042】
図6Aは、データIh(x,y)を含む画像、図6Bは、データIv(x,y)を含む画像、図6Cは、データIrd(x,y)を含む画像、図6Dは、データIld(x,y)を含む画像をそれぞれ示す。
【0043】
Ih’(x,y)、Iv’(x,y)及びIrd’(x,y)、Ild’(x,y)は、画素の横方向、縦方向及び二つの対角線方向の四つの方向に対する第2の合成画像データをそれぞれ示す。なお、第2の合成画像データを含む画像は図7A〜7Dに示される。
【0044】
図7Aは、データIh’(x,y)を含む画像、図7Bは、データIv’(x,y)を含む画像、図7Cは、データIrd’(x,y)を含む画像、図7Dは、データIld’(x,y)を含む画像をそれぞれ示す。
【0045】
Ih-positive(x,y)、Iv-positive(x,y)、Ird-positive(x,y)及びIld-positive(x,y)は、画素の横方向、縦方向及び二つの対角線方向の四つの方向に対する正パルス応答画像データをそれぞれ示す。なお、正パルス応答画像データを含む画像は、図5A、図5C、図5Eと図5Gに示された。
【0046】
Ih-negative(x,y)、Iv-negative(x,y)、Ird-negative(x,y)及びIld-negative(x,y)は、画素の横方向、縦方向及び二つの対角線方向の四つの方向に対する負パルス応答画像データをそれぞれ示す。なお、負パルス応答画像データを含む画像は、図5B、図5D、図5Fと図5Hに示される。
【0047】
前記処理に係るwは、予め推定された筆画幅である。例えば、経験によってwの値を推定しても良く、或いは画像を目視してwの値を推定しても良い。また、前記の(1)式と(2)式は、画素の横方向、縦方向及び二つの対角線方向の四つの方向に対する画像データに合成処理を行う具体的な例のみを示したが、本発明に限定するものではない。実際に、筆画を強調する適切な合成処理であれば、任意の処理が適用される。
【0048】
ここで、対向する方向へのオフセット及び反対の方向へのオフセットを行うことは、非特定な画像にどの方向へのオフセットにより筆画の強調の効果を実現できるかを容易に特定するとは限らないからである。従って、対向する方向へのオフセット及び反対の方向へのオフセットをそれぞれ試して行うことにより、必ず筆画の強調の効果を実現することができる。事前にどの方向へのオフセットにより筆画の強調の効果を実現できるかを特定できれば、対向する方向へのオフセット及び反対の方向へのオフセットを同時に実行する必要がなくなる。即ち、対向する方向へのオフセットと反対の方向へのオフセットのいずれかを実行すれば良い。本明細書に示した画像の例では、図6A〜6Dに示されるように、対向する方向にオフセットすることにより筆画の強調の効果を実現することができる。図7A〜7Dに示されたように、反対する方向にオフセットすることにより筆画の強調の効果を実現することができない。
【0049】
ステップS208において、ステップS206に合成された画像に高い閾値による2値化処理と整合処理を行うことができる。
【0050】
例えば、予め設けされた高い閾値を用いて、各方向に対する第1の合成画像データと第2の合成画像データに高い閾値による2値化処理をそれぞれ行うことができる。高い閾値による2値化処理が行われた、各方向に対する第1の合成画像データに整合処理を行い、高い閾値による2値化処理が行われた、各方向に対する第2の合成画像データに整合処理を行う。
【0051】
ここでの整合処理は、積集合を求める処理、最大値を求める処理、或いは平均値を求める処理のいずれか一つの処理であっても良い。
【0052】
整合処理が積集合を求める処理であれば、以下の式に従って積集合を求める処理を行うことができる。
【0053】
Ioutput-thin=Ih-binarized-high∪Iv-binarized-high∪Ird-binarized-high∪Ild-binarized-high
I’output-thin=I’h-binarized-high∪I’v-binarized-high∪I’rd-binarized-high∪I’ld-binarized-high
なお、Ioutput-thinは、積集合が求められた第1の細い筆画画像データであり、Ih-binarized-high、Iv-binarized-high、Ird-binarized-high及びIld-binarized-highのそれぞれは、第1の合成画像データIh(x,y)、Iv(x,y)、Ird(x,y)及びIld(x,y)に高い閾値による2値化処理を行った2値化画像データである。なお、I’output-thinは、積集合が求められた第2の細い筆画画像データであり、I’h-binarized-high、I’v-binarized-high、I’rd-binarized-high及びI’ld-binarized-highのそれぞれは、第2の合成画像データIh’(x,y)、Iv’(x,y)、Ird’(x,y)及びIld’(x,y)に高い閾値による2値化処理を行った2値化画像データである。
【0054】
ステップS210において、細い筆画画像データを取得することができる。即ち、Ioutput-thinとI’output-thinを取得する。
【0055】
ステップS212において、合成された画像に低い閾値による2値化処理と整合処理を行うことができる。
【0056】
例えば、予め設けられた、前記高い閾値よりも小さい低い閾値を利用して、各方向に対する第1の合成画像データと第2の合成画像データに低い閾値による2値化処理をそれぞれ行うことができる。低い閾値による2値化処理が行われた、各方向に対する第1の合成画像データには、整合処理が施され、第2の2値化処理が行われた、各方向に対する第2の合成画像データには、整合処理が施される。
【0057】
ここでの整合処理は、積集合を求める処理、最大値を求める処理、或いは平均値を求める処理のいずれか一つの処理であっても良い。
【0058】
整合処理が積集合を求める処理であれば、例えば、以下の式に従って積集合を求める処理を行うことができる。
Ioutput-thick=Ih-binarized-low∪Iv-binarized-low∪Ird-binarized-low∪Ild-binarized-low
I’output-thick=I’h-binarized-low∪I’v-binarized-low∪I’rd-binarized-low∪I’ld-binarized-low
なお、Ioutput-thickは、積集合が求められた第1の太い筆画画像データであり、Ih-binarized-low、Iv-binarized-low、Ird-binarized-low及びIld-binarized-lowのそれぞれは、第1の合成画像データIh(x,y)、Iv(x,y)、Ird(x,y)及びIld(x,y)に低い閾値による2値化処理を行った2値化画像データである。なお、I’output-thickは、積集合が求められた第2の太い筆画画像データであり、I’h-binarized-low、I’v-binarized-low、I’rd-binarized-low及びI’ld-binarized-lowのそれぞれは、第2の合成画像データIh’(x,y)、Iv’(x,y)、Ird’(x,y)及びIld’(x, y)に低い閾値による2値化処理を行った2値化画像データである。
【0059】
以上のように、事前にどの方向へのオフセットにより筆画の強調の効果を実現できるかを特定できれば、対向する方向へのオフセットと反対の方向へのオフセットを同時に実行して第1の合成画像データと第2の合成画像データを取得する必要がなくなる。即ち、(例えば対向する方向又は反対の方向といった)筆画の強調の効果を実現できる方向においてオフセットを行い、相応の合成画像データが取得される。一方、当該合成画像データには、前記の2値化処理と整合処理が施される。
【0060】
ステップS214において、選択的に、予め設けられたフィルタリング条件に応じて、ステップS212で処理されたデータがフィルタリングされる。
【0061】
具体的に、予め設けられたフィルタリング条件を利用して、第1の太い筆画画像データと第2の太い筆画画像データにおける連通領域に関するデータにフィルタリング処理をそれぞれ行うことにより、予め設けられたフィルタリング条件を満足する第1の連通領域の画像データと第2の連通領域の画像データが取得される。
【0062】
ここで予め設けられたフィルタリング条件を利用して第1の太い筆画画像データと第2の太い筆画画像データにフィルタリング処理を行うことは、ステップS212で得られた第1の太い筆画画像データと第2の太い筆画画像データに、太い筆画に加えて、例えば画像における人間のエッジデータといった、その他のオブジェクトのエッジデータ又はその他の太い筆画と類似するエッジデータが含まれる可能性があるからである。予め設けられたフィルタリング条件を利用して第1の太い筆画画像データと第2の太い筆画画像データにフィルタリング処理を行うことにより、太い筆画に対応する連通領域の画像データをより正確に取得することができる。
【0063】
なお、予め設けられたフィルタリング条件は、(1)連通領域内の画素の階調分散が予め設けられた分散閾値よりも小さいこと、(2)連通領域の内側エッジから外側エッジまでの画素の極性が一致すること、及び(3)連通領域の大きさが予め設けられた大きさ閾値以内にあること、のいずれかであっても良い。或いは、フィルタリング条件は、上記(1)、(2)及び(3)のうち、二つ又は複数の条件の任意の組み合わせであっても良い。
【0064】
ここで、連通領域とは、ステップS212の処理により得られた太い筆画画像データが示したエッジからなる閉じた領域である。
【0065】
フィルタリング条件(1)、即ち連通領域内の画素の階調分散が予め設けられた分散閾値よりも小さいことは、具体的に、まずステップS212で処理された画像において連通領域に関する座標情報を取得することができる。次に座標情報及び図4に示された原始画像に基づいて連通領域の階調分散を特定し、当該連通領域内の階調分散が予め設けられた分散閾値よりも小さいか否かを判断する。連通領域内の階調分散が予め設けられた分散閾値よりも小さい場合に、当該連通領域を保留し、即ち当該連通領域が太い筆画と関連あると考えられる。さもなければ、当該連通領域をフィルタリングする。
【0066】
フィルタリング条件(2)、即ち連通領域の内側エッジから外側エッジまでの画素極性が一致であることは、具体的に、まずステップS212で処理された画像において連通領域に関する座標情報を取得することができる。次に座標情報及び図4に示された原始画像に基づいて連通領域の内側エッジから外側エッジまでの画素極性が一致か否かを特定する。連通領域内の内側エッジと外側エッジの画素極性が一致である場合に、当該連通領域を保留し、即ち当該連通領域が太い筆画と関連あると考えられる。さもなければ、当該連通領域をフィルタリングする。
【0067】
ここでの画素の極性は、一つの内側エッジの画素の諧調と、当該内側エッジの画素と隣接する外側エッジの画素の階調との関係として理解されても良い。例えば、2値化画像における画素の階調が「0」或いは「255」に設置される場合に、二つの画素の階調値が何れも「0」或いは「255」であれば、この二つの画素の極性が一致であると考えられる。さもなければ、極性が不一致であると考えられる。勿論、必要に応じて画素極性が一致であるその他の適切な条件を設定しても良く、ここでは詳しく説明しない。
【0068】
フィルタリング条件(3)、即ち連通領域の大きさが予め設けられた大きさ領域以内にあることは、具体的に、連通領域の大きさが予め設けられた閾値以内にあれば、当該連通領域を保留し、即ち当該連通領域が太い筆画と関連あると考えられる。さもなければ、当該連通領域をフィルタリングする。ここで、太い筆画画像が細い筆画画像よりも大きいであるが、一般的に比較的な共通の上限があるため、当該上限に基づいて前記の予め設けられた閾値を設定しても良いことは、容易に理解できる。連通領域のサイズが大きすぎであれば、当該連通領域が対応するのは太い筆画ではなく非筆画対象であると考えても良い。例えば、殆どの場合に、太い筆画サイズが画像全体のサイズの半分ひいては半分以上を占拠することはない。勿論、特別な場合に太い筆画のサイズが確かに大きいであれば、前記の予め設けられた閾値の大きさを調整すればこのような態様を反映することができる。
【0069】
なお、前記の予め設けられた分散閾値と予め設けられた大きさ閾値は、予め試験によって得られた経験値に基づいて特定しても良く、或いは、画像サンプルに対する目視に基づいて特定しても良い。勿論、任意のその他の適切な方法で特定しても良い。
【0070】
フィルタリング条件(1)、(2)及び(3)のうち、二つ又は全部の条件を組み合わせてフィルタリングを実行することもできる。
【0071】
次に、ステップS216において、第1の連通領域の画像データと第2の連通領域の画像データにそれぞれ対応する第1の太い筆画エッジ画像データと第2の太い筆画エッジ画像データを取得する。
【0072】
ステップS218において、第1の細い筆画画像データと第2の細い筆画画像データにそれぞれ対応する(図8に示されるような)第1の細い筆画画像と第2の細い筆画画像(図示せず)を取得し、第1の太い筆画エッジ画像データと第2の太い筆画エッジ画像データにそれぞれ対応する(図10に示されるような)第1の太い筆画画像と第2の太い筆画画像(図示せず)を取得する。
【0073】
理解すべきなのは、ステップS214を実行しない場合でも太い筆画画像を取得することができる。言い換えれば、ステップS212で取得されたIoutput-thickとI’output-thickに基づいて(図9に示されるような)第1の太い筆画画像と第2の太い筆画画像を取得することができる。
【0074】
本明細書において、前記ステップにより第2の細い筆画画像と第2の太い筆画画像を取得することができるが、反対の方向へのオフセットにより筆画の強調の効果を実現できないため、対応的に得られた第2の細い筆画画像や第2の太い筆画画像を具体的に示していない。
【0075】
選択的に、テキスト筆画の精度、テキスト筆画のリコールレート、或いはテキスト筆画の精度とテキスト筆画のリコールレートとの折衷に基づいて、第1の細い筆画画像と第2の細い筆画画像のいずれかを最終的な細い筆画画像として選別することができる。また、テキスト筆画の精度、テキスト筆画のリコールレート、或いはテキスト筆画の精度とテキスト筆画のリコールレートとの折衷に基づいて、第1の太い筆画画像と第2の太い筆画画像のいずれかを最終的な太い筆画画像として選別することもできる。本明細書の例において、対向する方向へのオフセットにより筆画の強調の効果を実現できるため、テキスト筆画の精度、テキスト筆画のリコールレート、或いはテキスト筆画の精度とテキスト筆画のリコールレートとの折衷に基づいて、第1の細い筆画画像と第1の太い筆画画像を最終的な筆画抽出結果として取得することができる。
【0076】
本明細書に言及されたテキスト筆画の精度は、実際に検出された正しい筆画の数と実際に検出された筆画の数との比として理解されても良い。テキスト筆画のリコールレートは、実際に検出された正しい筆画の数と実際に存在した正しい筆画の数との比として理解されても良い。
【0077】
以上のように、ソーベル演算子を例として画像からテキスト筆画画像を抽出する方法を説明した。しかしながら、ただ例示的な方式で画像からテキスト筆画画像を抽出する方法を説明するに過ぎない。使用可能な演算子はこれに限定されなく、Robert演算子、Prewitt演算子、Laplace演算子、log演算子、Canny演算子、或いはその他の任意の適切な演算子であっても良い。
【0078】
また、ステップS208とS212で2値化処理を行ってから整合処理を行うことを説明したが、実際に整合処理を行ってから2値化処理を行っても良い。
【0079】
以上に言及された高い閾値と低い閾値は、経験によって特定されても良く、或いは何回かの試験によって特定されても良い。しかしながら、これはただ例示的なものに過ぎず、任意の適切な方法で高い閾値と低い閾値を特定することができる。
【0080】
以下、図11を参照して、本発明の実施の形態に係る、画像からテキスト筆画画像を抽出する装置400を説明する。
【0081】
図11は、本発明の実施の形態に係る、画像からテキスト筆画画像を抽出する装置400を示すブロック図である。装置400は、例えば、上述のように図1を参照して説明された、画像からテキスト筆画画像を抽出する方法を実行することができる。
【0082】
具体的に、装置400は、前記画像のエッジ情報と勾配情報を取得する情報取得手段402と、取得されたエッジ情報と勾配情報に予め設けられた強調処理を行うことにより、前記画像におけるテキストに関するエッジ情報と勾配情報を強調する強調手段404と、強調されたエッジ情報と勾配情報に対応するテキスト筆画画像を取得する筆画画像取得手段406とを備える。
【0083】
選択的に、装置400は、選別手段(図示せず)を備えても良い。選別手段は、抽出された複数のテキスト筆画画像に選別を行うように配置される。
【0084】
情報取得手段402は、代表画像のエッジ情報と勾配情報のステップ信号又はパルス信号を解析し、解析結果に基づいてエッジ情報と勾配情報を抽出するように配置される。
【0085】
画像において、細い筆画の画像データはパルス信号で表し、太い筆画の画像データ及び太い筆画と類似する大きい尺度対象は、ステップ信号で表すことができる。パルス信号を解析し、その解析結果に基づいて細い筆画のエッジ情報と勾配情報を抽出することができる。また、ステップ信号を解析し、その解析結果に基づいて、太い筆画のエッジ情報と勾配情報を抽出し、太い筆画と類似する大きい尺度対象のエッジ情報と勾配情報を抽出することができる。
【0086】
選択的に、装置400は、更にノイズ削減手段(図示せず)を備えても良い。ノイズ削減手段は、画像の明瞭度に基づいて、或いは必要に応じて、原始画像にフィルタリングを行ってノイズを削減するように配置される。例えば、ローパスフィルタを利用して画像をフィルタリングすることにより、原始画像におけるノイズを削減することができる。ローパスフィルタは、ガウシアンフィルタであっても良いが、それに限定されなく、当業者にとって知られている任意の適切なローパスフィルタであっても良い。
【0087】
強調手段404は、各種の方法に基づいてエッジ情報と勾配情報に強調処理を行うように配置される。好ましくは、2値化処理と整合処理によりエッジ情報と勾配情報を強調することができる。ここでの強調処理は、積集合を求める処理、最大値を求める処理、或いは平均値を求める処理の何れかであっても良い。好ましくは、後述されるように、整合処理は積集合処理であっても良い。
【0088】
以下に、図12を参照して、本発明の実施の形態に係る、ソーベル演算子で画像からテキスト筆画画像を抽出する装置400’を説明する。
【0089】
図12は、本発明の実施の形態に係る、ソーベル演算子で画像からテキスト筆画画像を抽出する装置400’を示すブロック図である。
【0090】
装置400’は、上述されたように図3〜図10に示された、本発明の実施の形態に係るソーベル演算子で画像からテキスト筆画画像を抽出する方法を実行することができる。
【0091】
具体的には、装置400と同様に、装置400’は、情報取得手段402’と、強調手段404’と、筆画画像取得手段406’とを備える。選択的に、装置400’は、選別手段とノイズ削減手段(何れも図示せず)を備えても良い。
【0092】
選別手段は、テキスト筆画の精度とテキスト筆画のリコールレートとのうち少なくとも一つに基づいて、前記第1の細い筆画画像と前記第2の細い筆画画像の何れかを最終的な細い筆画画像として選別し、及び/又は、前記第1の太い筆画画像と前記第2の太い筆画画像の何れかを最終的な太い筆画画像として選別するように配置される。具体的な選別処理は、図3〜図10を参照して説明されたため、ここでは説明を重複しない。
【0093】
ノイズ削減手段は、原始画像(即ち処理する画像)をフィルタリングしてノイズを削減するように配置される。具体的なノイズ削減処理は、図3〜図10に参照して説明されたため、ここでは説明を重複しない。
【0094】
なお、情報取得手段402’は、畳み込み演算サブ手段4022と区分サブ手段4024とを備えても良い。畳み込み演算サブ手段4022は、画像の複数の方向におけるエッジ情報と勾配情報を取得するための複数のソーベル演算子のコンボリューションカーネルを利用して前記画像の画像データと畳み込み演算をそれぞれ行うするように配置される。区分サブ手段4024は、各方向に対する畳み込み演算の結果を各方向に対する正パルス応答画像データと負パルス応答画像データとに区分するように配置される。
【0095】
強調手段404’は、第1の合成画像取得サブ手段4042及び/又は第2の合成画像取得サブ手段4044を備えても良い。第1の合成画像取得サブ手段4042は、各方向に対する正パルス応答画像データと負パルス応答画像データに、対向する方向へのオフセット及び加算を実行することにより、各方向に対する第1の合成画像データを取得するように配置される。第2の合成画像取得サブ手段4044は、各方向に対する正パルス応答画像データと負パルス応答画像データに、反対の方向へのオフセット及び加算を実行することにより、各方向に対する第2の合成画像データを取得するように配置される。
【0096】
前記筆画画像取得手段406’は、第1の2値化処理サブ手段4062と、第1の細い筆画画像取得サブ手段4064と、第2の細い筆画画像取得サブ手段4066と、第2の2値化処理サブ手段4068と、第1の太い筆画画像取得サブ手段40610と、第2の太い筆画画像取得サブ手段40612とを備えても良い。
【0097】
第1の2値化処理サブ手段4062は、予め設けられた第1の閾値を利用して各方向に対する第1の合成画像データと第2の合成画像データに第1の2値化処理をそれぞれ行うように配置される。
【0098】
第1の細い筆画画像取得サブ手段4064は、第1の2値化処理が行われた各方向に対する第1の合成画像データに整合処理を行って第1の細い筆画画像データを取得することにより、前記第1の細い筆画画像データに対応する第1の細い筆画画像を取得するように配置される。
【0099】
第2の細い筆画画像取得サブ手段4066は、第1の2値化処理が行われた各方向に対する第2の合成画像データに整合処理を行って第2の細い筆画画像データを取得することにより、前記第2の細い筆画画像データに対応する第2の細い筆画画像を取得するように配置される。
【0100】
第2の2値化処理サブ手段4068は、予め設けられた、第1の閾値よりも小さい第2の閾値を利用して各方向に対する第1の合成画像データと第2の合成画像データに第2の2値化処理をそれぞれ行うように配置される。
【0101】
第1の太い筆画画像取得サブ手段40610は、第2の2値化処理が行われた各方向に対する第1の合成画像データに整合処理を行って第1の太い筆画画像データを取得することにより、前記第1の太い筆画画像データに対応する第1の太い筆画画像を取得するように配置される。
【0102】
第2の太い筆画画像取得サブ手段40612は、第2の2値化処理が行われた各方向に対する第2の合成画像データに整合処理を行って第2の太い筆画画像データを取得することにより、前記第2の太い筆画画像データに対応する第2の太い筆画画像を取得するように配置される。
【0103】
筆画画像取得手段406は、必要に応じて、第1の2値化処理サブ手段4062、第1の細い筆画画像取得サブ手段4064、第2の細い筆画画像取得サブ手段4066のみを備えても良いし、或いは、第2の2値化処理サブ手段4068、第1の太い筆画画像取得サブ手段40610、第2の太い筆画画像取得サブ手段40612のみを備えても良い。言い換えれば、筆画画像取得手段406は、必要に応じて、細い筆画画像又は太い筆画画像のみを取得するように配置される。例えば、処理する画像において太い筆画又は細い筆画のテキスト情報のみが存在し、或いは太い筆画又は細い筆画のテキスト情報のみを取得する必要がある場合が該当する。
【0104】
更に、以上のように、事前にどの方向へのオフセットにより筆画の強調の効果を実現できるかを特定することができれば、強調手段404’は、第1の合成画像取得サブ手段4042と第2の合成画像取得サブ手段4044とのうち、当該方向における処理に対応する合成画像取得サブ手段を備えても良い。一方、筆画画像取得手段406’は、第1の細い筆画画像取得サブ手段4064と第2の細い筆画画像取得サブ手段4066とのうち、当該方向における処理に対応するもの、及び第1の太い筆画画像取得サブ手段40610と第2の太い筆画画像取得サブ手段40612とのうち、当該方向における処理に対応するもののみを備えても良い。
【0105】
装置400’は、例えば、上述のように図3〜図10に示された、本発明の実施の形態に係るソーベル演算子で画像からテキスト筆画画像を抽出する方法を実行するように配置される。簡単にするために、ここでは第1の2値化処理サブ手段4062と、第1の細い筆画画像取得サブ手段4064と、第2の細い筆画画像取得サブ手段4066と、第2の2値化処理サブ手段4068と、第1の太い筆画画像取得サブ手段40610と、第2の太い筆画画像取得サブ手段40612とを具体的に説明しない。
【0106】
また、選択的に、筆画画像取得手段406’は、フィルタリングサブ手段(図示せず)を更に備えても良い。フィルタリングサブ手段は、予め設けられたフィルタリング条件を利用して第1の太い筆画エッジ画像データと第2の太い筆画エッジデータにおける、連通領域に関するデータにフィルタリング処理を行って、予め設けられたフィルタリング条件を満足する第1の連通領域の画像データと第2の連通領域の画像データを取得するように配置される。
【0107】
予め設けられたフィルタリング条件は、前記連通領域内の画素の階調分散が予め設けられた分散閾値によりも小さいである条件と、前記連通領域の内側エッジから外側エッジまでの画素極性が一致である条件と、前記連通領域の大きさが予め設けられた大きさの閾値内にある条件と、のうちの少なくとも一つを含む。予め設けられたフィルタリング条件については、図3〜図10を参照して説明されたため、ここでは説明を重複しない。
【0108】
本発明の実施の形態に係る、画像からテキスト筆画画像を抽出する方法及び装置により、少なくとも以下の技術的効果の一つを実現することができる。即ち、スピードが速くなる効果、及び、筆画の抽出と同時に処理されるビデオの悪品質に起因したノイズと筆画尺度に対する不敏感を抑制できる効果である。また、本発明の実施の形態に係る、画像からテキスト筆画画像を抽出する方法及び装置には、テキストの色、テキスト背景のコントラスト等の従来の知識の必要が無くなる。
【0109】
以上に具体的な実施の形態を用いて本発明の基本的な原理を説明したが、本発明の方法及び装置の全て、或は任意のステップ又は構成要素をいかなる演算装置(プロセッサ、記憶媒体等を含む)又は演算装置のネットワークにおいてハードウェア、ファームウェア、ソフトウェア又はそれらの組合せで実現可能であることを当業者は理解することができる。これは、本発明の説明を検討した場合に、当業者により基本的なプログラミングスキルで実現可能である。
【0110】
したがって、本発明の目的は更に、いかなる演算装置で一つのプログラム又は一組のプログラムを実行することで実現可能である。前記の演算装置は周知の汎用装置であっても良い。したがって、本発明の目的は、前記方法又は装置を実現するプログラムコードを含むプログラム製品を提供するだけで実現可能である。つまり、このようなプログラム製品と、このようなプログラム製品を記憶する媒体も本発明を構成する。勿論、前記の記憶媒体は、既に知られているか又は将来的に開発される任意の種類の記憶媒体であっても良い。
【0111】
ソフトウェア及び/又はファームウェアにより本発明の実施の形態を実現する場合に、記憶媒体又はネットワークから専用のハードウェア構成を有するコンピュータ、例えば図13に示された汎用のコンピュータ1200へ当該ソフトウェアを構成するプログラムをインストールする。当該コンピュータは、各種のプログラムがインストールされている場合に、各機能などを実行することができる。
【0112】
図13において、中央処理装置(CPU)1201は、読取専用メモリ(ROM)1202に記憶されたプログラム又は記憶部1208からランダムアクセスメモリ(RAM)1203にロードされたプログラムに基づいて各種の処理を実行する。RAM1203には、必要に応じてCPU1201が各種の処理等を実行するために必要なデータも記憶されている。CPU1201、ROM1202とRAM1203は、バス1204を介して互いに接続されている。入力/出力インタフェース1205もバス1204に接続されている。
【0113】
入力部1206(キーボード、マウス等を含む)と、出力部1207(ディスプレイ、例えばブラウン管(CRT)、液晶ディスプレイ(LCD)等とスピーカ等を含む)と、記憶部1208(ハードディスク等を含)と、通信部1209(ネットワークインターフェースカード、例えばLANカード、モデム等を含む)とは、入力/出力インタフェース1205に接続されている。通信部1209はネットワーク、例えばインターネットを経由して通信処理を実行する。必要に応じて、入力/出力インタフェース1205にはドライバ1210も接続されている。磁気ディスク、光ディスク、光磁気ディスク、半導体メモリ等のような取り外し可能な媒体1211は、必要に応じてドライバ1210に装着される。これにより、読み出されたコンピュータプログラムが必要に応じて記憶部1208にインストールされる。
【0114】
ソフトウェアで前記一連の処理を実現する場合に、ネットワーク、例えばインターネット、又は記憶媒体、例えば取外し可能な媒体1211からソフトウェアを構成するプログラムをインストールする。
【0115】
このような記憶媒体は、図13に示された、その中にプログラムが記憶されており、デバイスから離れて配送されてユーザにプログラムを提供する取り外し可能な媒体1211に限定されないことを、当業者が理解すべきである。取り外し可能な媒体1211として、例えば、磁気ディスク(フロッピディスク(登録商標)含む)、光ディスク(コンパクトディスクリードオンリーメモリ(CD−ROM)やデジタルバーサティルディスク(DVD)を含む)、光磁気ディスク(ミニディスク(MD)(登録商標)含む)及び半導体メモリを含む。或いは、記憶媒体は、ROM1202、記憶部1208に含まれるハードディスクであって、プログラムが記憶されており、且つそれらを含むデバイスと一緒にユーザに配送されるハードディスクなどであっても良い。
【0116】
本発明は、更にコンピュータが読取り可能なコマンドコードを記憶するプログラムプロダクトを開示した。コマンドコードは、コンピュータにより読取られて実行されると、上述された本発明の実施の形態に係る方法を実行することができる。
【0117】
一方、上記のコンピュータ読取り可能なコマンドコードを記憶するプログラムプロダクトを保持する記憶媒体も本発明の開示に含まれる。記憶媒体は、フロプティカルディスク、光ディスク、光磁気ディスク、メモリカード、メモリスティック等を含むが、それらに限定されない。
【0118】
当業者は、ここで列挙されたのは例示的なものであり、本発明に限定しないことについて理解すべきである。
【0119】
本明細書において、「第1」、「第2」及び「第N個」等の記述は、説明された特徴を文字上で区別して本発明を明瞭に説明するためのものである。従って、それはいかなる限定的な意味を有するものではない。
【0120】
上記方法の各ステップ及び上記装置の各構成モジュール及び/又は手段は、例示として、ソフトウェア、ファームウェア、ハードウェア又はその組み合わせとして実施し、且つ相応の装置における一部とすることができる。上記装置における各構成モジュール、手段がソフトウェア、ファームウェア、ハードウェア又はその組み合わせの形態で配置される時に使用可能な具体的な方法又は形態は、当業者に周知されたため、ここでは詳しく説明しない。
【0121】
ソフトウェア又はファームウェアで実現される場合に、例示として、記憶媒体又はネットワークから専用のハードウェア構成を有するコンピュータ(例えば図13に示された汎用のコンピュータ1200)へ当該ソフトウェアを構成するプログラムをインストールすることができる。当該コンピュータは、各種のプログラムがインストールされている場合に、各機能などを実行することができる。
【0122】
以上、本発明の具体的な実施の形態に対する説明において、一種の実施の形態について説明及び/又は図示した特徴は、同一又は類似した形態で、一つ又は複数のその他の実施の形態で使用され、その他の実施の形態における特徴と組み合わせ、或いはその他の実施の形態における特徴を置換することができる。
【0123】
強調すべきは、専門用語「備える/含む」は本明細書に使用される時に特徴、要素、ステップ又は構成要素の存在を指すが、一つ又は複数のその他の特徴、要素、ステップ又は構成要素の存在又は付加を排除するわけではない。
【0124】
また、本発明の方法は、明細書に説明された時間順で実行されることに限定されず、その他の時間に従って順次に、並行に又は個別に実行されでも良い。したがって、本明細書に説明された方法の実行順は、本発明の技術的範囲を限定するものではない。
【0125】
以上のように、本発明の具体的な実施の形態の説明により本発明を開示したが、当業者は以下に付記される本願発明の要旨と範囲内に本発明に対する様々な変更、改善又は同等物を設計することができる。これら変更、改善又は同等物は、本発明の保護範囲内に含まれるものと認めるべきである。
(付記)
(付記1)
画像からテキスト筆画画像を抽出する方法であって、
前記画像のエッジ情報と勾配情報を取得するステップと、
取得されたエッジ情報と勾配情報に予め設けられた強調処理を行うことにより、前記画像においてテキストに関するエッジ情報と勾配情報を強調するステップと、
強調されたエッジ情報と勾配情報に対応するテキスト筆画画像を取得するステップと、
を含むことを特徴とする方法。
(付記2)
前記画像のエッジ情報と勾配情報を取得するステップは、
前記画像のエッジ情報と勾配情報を代表するステップ信号又はパルス信号を解析し、解析結果に基づいて前記エッジ情報と前記勾配情報を抽出することを含む、
付記1記載の方法。
(付記3)
前記画像のエッジ情報と勾配情報を取得するステップは、
画像の複数の方向におけるエッジ情報と勾配情報を取得するための複数のソーベル演算子のコンボリューションカーネルを利用して、前記画像の画像データと畳み込み演算をそれぞれ行い、
各方向に対する畳み込み演算の結果を各方向に対する正パルス応答画像データと負パルス応答画像データに区分することを含み、
前記画像においてテキストに関するエッジ情報と勾配情報を強調するステップは、
各方向に対する正パルス応答画像データと負パルス応答画像データに、対向する方向へのオフセット及び加算を実行して、各方向に対する第1の合成画像データを取得し、及び/又は、
各方向に対する正パルス応答画像データと負パルス応答画像データに、反対の方向へのオフセット及び加算を実行して、各方向に対する第2の合成画像データを取得することを含み、
前記強調されたエッジ情報と勾配情報に対応するテキスト筆画画像を取得するステップは、
予め設けられた第1の閾値を用いて各方向に対する第1の合成画像データ及び/又は第2の合成画像データに第1の2値化処理をそれぞれ行い、第1の2値化処理が行われた、各方向に対する第1の合成画像データに整合処理を行って第1の細い筆画画像データを取得することにより、前記第1の細い筆画画像データに対応する第1の細い筆画画像を取得し、及び/又は、第1の2値化処理が行われた、各方向に対する第2の合成画像データに整合処理を行って、対応する第2の細い筆画画像データを取得することにより、前記第2の細い筆画画像データに対応する第2の細い筆画画像を取得し、及び/又は、
予め設けられた、第1の閾値よりも小さい第2の閾値を用いて各方向に対する第1の合成画像データ及び/又は第2の合成画像データに第2の2値化処理をそれぞれ行い、第2の2値化処理が行われた、各方向に対する第1の合成画像データに整合処理を行って第1の太い筆画画像データを取得することにより、前記第1の太い筆画画像データに対応する第1の太い筆画画像を取得し、及び/又は、第2の2値化処理が行われた、各方向に対する第2の合成画像データに整合処理を行って、対応する第2の太い筆画画像データを取得することにより、前記第2の太い筆画画像データに対応する第2の太い筆画画像を取得することを含む、
付記2記載の方法。
(付記4)
前記整合処理は、積集合を求める処理と、最大値を求める処理と、平均値を求める処理との何れかを含む、
付記3記載の方法。
(付記5)
前記画像の複数の方向におけるエッジ情報と勾配情報を取得するための複数のソーベル演算子のコンボリューションカーネルを利用して前記画像の画像データと畳み込み演算をそれぞれ行うステップは、
画像の横方向、縦方向及び二つの対角線方向の四つの方向におけるエッジ情報と勾配情報を取得するための四つのソーベル演算子のコンボリューションカーネルを利用して前記画像の画像データと畳み込み演算をそれぞれ行うことを含む、
付記3又は4記載の方法。
(付記6)
前記対向する方向へのオフセット及び加算は、以下の式
Ih(x,y)=(Ih-positive(x,y-w/2)+Ih-negative(x,y+w/2))/2、
Iv(x,y)=(Iv-positive(x-w/2,y)+Iv-negative(x+w/2,y))/2、
Ird(x,y)=(Ird-positive(x+w/2,y-w/2)+Ird-negative(x-w/2,y+w/2))/2、及び
Ild(x,y)=(Ild-positive(x-w/2,y-w/2)+Ild-negative(x+w/2,y+w/2))/2、
に基づいて行われ、
前記の反対の方向へのオフセット及び加算は、以下の式
Ih’(x,y)=(Ih-positive(x,y+w/2)+Ih-negative(x,y-w/2))/2、
Iv’(x,y)=(Iv-positive(x+w/2,y)+Iv-negative(x-w/2,y))/2、
Ird’(x,y)=(Ird-positive(x-w/2,y+w/2)+Ird-negative(x+w/2,y-w/2))/2、及び
Ild’(x,y)=(Ild-positive(x+w/2,y+w/2)+Ild-negative(x-w/2,y-w/2))/2、
に基づいて行われ、
xは画素の横座標、yは前記画素の縦座標、Ih(x,y)、Iv(x,y)、Ird(x,y)とIld(x,y)は前記画素の横方向、縦方向、及び二つの対角線方向の四つの方向に対する第1の合成画像データをそれぞれ示し、
Ih’(x,y)、Iv’(x,y)、Ird’(x,y)及びIld’(x,y)は、前記画素の横方向、縦方向及び二つの対角線方向の四つの方向に対する第2の合成画像データをそれぞれ示し、
Ih-positive(x,y)、Iv-positive(x,y)、Ird-positive(x,y)及びIld-positive(x,y)は、前記画素の横方向、縦方向及び二つの対角線方向の四つの方向に対する正パルス応答画像データをそれぞれ示し、
Ih-negative(x,y)、Iv-negative(x,y)、Ird-negative(x,y)及びIld-negative(x,y)は、前記画素の横方向、縦方向及び二つの対角線方向の四つの方法に対する負パルス応答画像データをそれぞれ示し、wは予め推定された筆画幅である、
付記3乃至5の何れか記載の方法。
(付記7)
前記第1の太い筆画エッジ画像データと前記第2の太い筆画エッジ画像データにそれぞれ対応する第1の太い筆画画像と第2の太い筆画画像を取得するステップは、
予め設けられたフィルタリング条件を利用して前記第1の太い筆画エッジ画像データと前記第2の太い筆画エッジ画像データにおける連通領域データにフィルタリング処理をそれぞれ行うことにより、前記予め設けられたフィルタリング条件を満たす第1の連通領域の画像データと第2の連通領域の画像データを取得し、
前記第1の連通領域の画像データと前記第2の連通領域の画像データにそれぞれ対応する第1の太い筆画画像と第2の太い筆画画像を取得することを含む、
付記3乃至6の何れか記載の方法。
(付記8)
前記予め設けられたフィルタリング条件は、少なくとも、
前記連通領域内の画素の階調分散が予め設けられた分散の閾値よりも小さい条件と、
前記連通領域内の内側エッジから外側エッジまでの画素極性が一致する条件と、
前記連通領域の大きさが予め設けられた大きさの閾値内にある条件と、
のうちの一つを含む、
付記7記載の方法。
(付記9)
テキスト筆画の精度とテキスト筆画のリコールレートとのうちの少なくとも一つに基づいて、前記第1の細い筆画画像と前記第2の細い筆画画像の何れかを最終的な細い筆画画像として選別し、及び/又は、前記第1の太い筆画画像と前記第2の太い筆画画像の何れかを最終的な太い筆画画像として選別することを更に含む、
付記3乃至8の何れか記載の方法。
(付記10)
画像からテキスト筆画画像を抽出する装置であって、
前記画像のエッジ情報と勾配情報を取得する情報取得手段と、
取得されたエッジ情報と勾配情報に予め設けられた強調処理を行うことにより、前記画像においてテキストに関するエッジ情報と勾配情報を強調する強調手段と、
強調されたエッジ情報と勾配情報に対応するテキスト筆画画像を取得する筆画画像取得手段と、
を備えることを特徴とする装置。
(付記11)
前記情報取得手段は、前記画像のエッジ情報と勾配情報を代表するステップ信号又はパルス信号を解析し、解析結果に基づいて前記エッジ情報と前記勾配情報を抽出する、
付記10記載の装置。
(付記12)
前記情報取得手段は、
画像の複数の方向におけるエッジ情報と勾配情報を取得するための複数のソーベル演算子のコンボリューションカーネルを利用して、前記画像の画像データと畳み込み演算をそれぞれ行う畳み込み演算サブ手段と、
各方向に対する畳み込み演算の結果を各方向に対する正パルス応答画像データと負パルス応答画像データに区分する区分サブ手段とを備え、
前記強調手段は、
各方向に対する正パルス応答画像データと負パルス応答画像データに、対向する方向へのオフセット及び加算を実行して、各方向に対する第1の合成画像データを取得する第1の合成画像取得サブ手段、及び/又は、
各方向に対する正パルス応答画像データと負パルス応答画像データに、反対の方向へのオフセット及び加算を実行して、各方向に対する第2の合成画像データを取得する第2の合成画像取得サブ手段を備え、
前記筆画画像取得手段は、
予め設けられた第1の閾値を用いて各方向に対する第1の合成画像データ及び/又は第2の合成画像データに第1の2値化処理をそれぞれ行う第1の2値化処理サブ手段と、第1の2値化処理が行われた、各方向に対する第1の合成画像データに整合処理を行って第1の細い筆画画像データを取得することにより、前記第1の細い筆画画像データに対応する第1の細い筆画画像を取得する第1の細い筆画画像取得サブ手段と、及び/又は、第1の2値化処理が行われた、各方向に対する第2の合成画像データに整合処理を行って、対応する第2の細い筆画画像データを取得することにより、前記第2の細い筆画画像データに対応する第2の細い筆画画像を取得する第2の細い筆画画像取得サブ手段と、及び/又は、
予め設けられた、第1の閾値よりも小さい第2の閾値を用いて各方向に対する第1の合成画像データ及び/又は第2の合成画像データに第2の2値化処理をそれぞれ行う第2の2値化処理サブ手段と、第2の2値化処理が行われた、各方向に対する第1の合成画像データに整合処理を行って第1の太い筆画画像データを取得することにより、前記第1の太い筆画画像データに対応する第1の太い筆画画像を取得する第1の太い筆画画像取得サブ手段と、及び/又は、第2の2値化処理が行われた、各方向に対する第2の合成画像データに整合処理を行って、対応する第2の太い筆画画像データを取得することにより、前記第2の太い筆画画像データに対応する第2の太い筆画画像を取得する第2の太い筆画画像取得サブ手段とを備える、
付記11記載の装置。
(付記13)
前記整合処理は、積集合を求める処理と、最大値を求める処理と、平均値を求める処理との何れかを含む、
付記12記載の装置。
(付記14)
前記畳み込み演算サブ手段は、画像の横方向、縦方向及び二つの対角線方向の四つの方向におけるエッジ情報と勾配情報を取得するための四つのソーベル演算子のコンボリューションカーネルを利用して前記画像の画像データと畳み込み演算をそれぞれ行う、付記12又は13記載の装置。
(付記15)
前記対向する方向へのオフセット及び加算は、以下の式
Ih(x,y)=(Ih-positive(x,y-w/2)+Ih-negative(x,y+w/2))/2、
Iv(x,y)=(Iv-positive(x-w/2,y)+Iv-negative(x+w/2,y))/2、
Ird(x,y)=(Ird-positive(x+w/2,y-w/2)+Ird-negative(x-w/2,y+w/2))/2、及び
Ild(x,y)=(Ild-positive(x-w/2,y-w/2)+Ild-negative(x+w/2,y+w/2))/2、
に基づいて行われ、
前記の反対する方向へのオフセット及び加算は、以下の式
Ih’(x,y)=(Ih-positive(x,y+w/2)+Ih-negative(x,y-w/2))/2、
Iv’(x,y)=(Iv-positive(x+w/2,y)+Iv-negative(x-w/2,y))/2、
Ird’(x,y)=(Ird-positive(x-w/2,y+w/2)+Ird-negative(x+w/2,y-w/2))/2、及び
Ild’(x,y)=(Ild-positive(x+w/2,y+w/2)+Ild-negative(x-w/2,y-w/2))/2、
に基づいて行われ、
xは画素の横座標、yは前記画素の縦座標、Ih(x,y)、Iv(x,y)、Ird(x,y)及びIld(x,y)は、前記画素の横方向、縦方向、及び二つの対角線方向の四つの方向に対する第1の合成画像データをそれぞれ示し、
Ih’(x,y)、Iv’(x,y)、Ird’(x,y)及びIld’(x,y)は、前記画素の横方向、縦方向及び二つの対角線方向の四つの方向に対する第2の合成画像データをそれぞれ示し、
Ih-positive(x,y)、Iv-positive(x,y)、Ird-positive(x,y)及びIld-positive(x,y)は、前記画素の横方向、縦方向及び二つの対角線方向の四つの方向に対する正パルス応答画像データをそれぞれ示し、
Ih-negative(x,y)、Iv-negative(x,y)、Ird-negative(x,y)及びIld-negative(x,y)は、前記画素の横方向、縦方向及び二つの対角線方向の四つの方法に対する負パルス応答画像データをそれぞれ示し、wは予め推定された筆画幅である、
付記12乃至14の何れか記載の装置。
(付記16)
前記筆画画像取得手段は、更に、予め設けられたフィルタリング条件を利用して前記第1の太い筆画エッジ画像データと前記第2の太い筆画エッジ画像データにおける連通領域データにフィルタリング処理をそれぞれ行うことにより、前記予め設けられたフィルタリング条件を満たす第1の連通領域の画像データと第2の連通領域の画像データを取得するフィルタリングサブ手段を備える、
付記12乃至15の何れか記載の装置。
(付記17)
前記予め設けられたフィルタリング条件は、少なくとも、前記連通領域内の画素の階調分散が予め設けられた分散の閾値よりも小さい条件と、前記連通領域内の内側エッジから外側エッジまでの画素極性が一致である条件と、前記連通領域の大きさが予め設けられた大きさの閾値内にある条件と、のうちの一つを含む、
付記16記載の装置。
(付記18)
テキスト筆画の精度とテキスト筆画のリコールレートとのうちの少なくとも一つに基づいて、前記第1の細い筆画画像と前記第2の細い筆画画像の何れかを最終的な細い筆画画像として選別し、及び/又は、前記第1の太い筆画画像と前記第2の太い筆画画像の何れかを最終的な太い筆画画像として選別する選別手段を更に備える、
付記12乃至17の何れか記載の装置。
(付記19)
コンピュータに、付記1乃至9の何れか記載の、画像からテキスト筆画画像を抽出する方法を実行させるための命令を含むコンピュータプログラム。
(付記20)
付記19記載のコンピュータプログラムを記録したコンピュータ読み取り可能な記録媒体。
【符号の説明】
【0126】
400:画像からテキスト筆画画像を抽出する装置
402:情報取得手段
404:強調手段
406:筆画画像取得手段
400’:画像からテキスト筆画画像を抽出する装置
402’:情報取得手段
4022:畳込み演算サブ手段
4024:区分サブ手段
404’:強調手段
4042:第1の合成画像取得サブ手段
4044:第2の合成画像取得サブ手段
406’:筆画画像取得手段
4062:第1の2値化処理サブ手段
4064:第1の細い筆画画像取得サブ手段
4066:第2の細い筆画画像取得サブ手段
4068:第2の2値化処理サブ手段
40610:第1の太い筆画画像取得サブ手段
40612:第2の太い筆画画像取得サブ手段
【技術分野】
【0001】
本発明は、画像処理分野に関し、特に、画像からテキスト筆画画像を抽出する方法及び装置に関する。
【背景技術】
【0002】
現在の情報処理分野において、大量のビデオファイルが存在している。これらビデオファイルに効率的な検索を行う必要がある。ビデオ注釈、ビデオ探索等については、ビデオにおけるテキスト情報が正確且つ簡単な手がかりとなる。従って、ビデオに含まれるテキスト情報をどのように正確に抽出して認識するかということは、後続のビデオ注釈、ビデオ検索にとって非常に重要である。
【発明の概要】
【発明が解決しようとする課題】
【0003】
既知の幾つかのテキスト筆画の抽出技術は、速度が遅く、ノイズが大きく、筆画の尺度に敏感ではないなどの欠点がある。
上記した課題を解決しうる、画像からテキスト筆画画像を抽出する方法及び装置が望まれる。
【課題を解決するための手段】
【0004】
以下に、本発明を簡単に説明して本発明の幾つかの態様の基本的な理解を提供する。この簡単な説明は、本発明に対する網羅的なものではない。その目的としては、本発明の肝心部分又は重要部分を決定する意図がなく、本発明の範囲を限定する意図もなく、簡単な形式で幾つかの概念を提供して後述のより詳しい説明の先行説明とすることに過ぎない。
本発明は、画像からテキスト筆画画像を抽出する方法及び装置を提供することを目的とする。
【0005】
本発明の1つの態様によれば、画像からテキスト筆画画像(text stroke image)を抽出する方法であって、画像のエッジ情報と勾配情報を取得し、取得されたエッジ情報と勾配情報に予め設けられた強調処理(enhancement)を行うことにより、画像においてテキストに関するエッジ情報と勾配情報を強調し、強調されたエッジ情報と勾配情報に対応するテキスト筆画画像を取得することを含む方法が提供される。
【0006】
本発明の別の態様によれば、画像からテキスト筆画画像を抽出する装置であって、画像のエッジ情報と勾配情報を取得する情報取得手段と、取得されたエッジ情報と勾配情報に予め設けられた強調処理を行うことにより、画像においてテキストに関するエッジ情報と勾配情報を強調する強調手段と、強調されたエッジ情報と勾配情報に対応するテキスト筆画画像を取得する筆画画像取得手段とを備える装置が提供される。
【0007】
また、本発明の実施の形態では、上記方法を実現するコンピュータプログラムが更に提供される。
【0008】
また、本発明の実施の形態では、上記方法を実現するコンピュータプログラムコードが記録され、少なくともコンピュータにより読取り可能な媒体の形式のコンピュータプログラムプロダクトが更に提供される。
【0009】
以下の図面による本発明に対する最適の実施の形態の詳細な説明により、本発明の上記利点及び他の利点がより明らかになるであろう。
【図面の簡単な説明】
【0010】
以下、図面に基づいて本発明の実施の形態に対する説明を参照し、本発明の上記目的、特徴及び利点、並びに他の目的、特徴及び利点をより容易に理解することができる。図面における構成要素は本発明の原理を示すものに過ぎない。図面において、同一又は類似の技術的特徴又は構成要素は、同一又は類似の符号で示される。
【図1】本発明の実施の形態に係る、画像からテキスト筆画画像を抽出する方法を示すフローチャートである。
【図2】図2は、ステップ信号、パルス信号、ソーベル演算子に対応する信号、ソーベル演算子でステップ信号を抽出した抽出結果、ソーベル演算子でパルス信号を抽出した抽出結果、ステップ信号の抽出結果に絶対値を取った信号、パルス信号の抽出結果に絶対値を取った信号、及び相応のオフセットを行った信号を示す模式図である。
【図3】本発明による、ソーベル演算子を利用して画像からテキスト筆画画像を抽出する方法を示すフローチャートである。
【図4】処理される原始画像を示す図である。
【図5A】ソーベル演算子を用いて畳込み処理を行った画像を示す図である。
【図5B】ソーベル演算子を用いて畳込み処理を行った画像を示す図である。
【図5C】ソーベル演算子を用いて畳込み処理を行った画像を示す図である。
【図5D】ソーベル演算子を用いて畳込み処理を行った画像を示す図である。
【図5E】ソーベル演算子を用いて畳込み処理を行った画像を示す図である。
【図5F】ソーベル演算子を用いて畳込み処理を行った画像を示す図である。
【図5G】ソーベル演算子を用いて畳込み処理を行った画像を示す図である。
【図5H】ソーベル演算子を用いて畳込み処理を行った画像を示す図である。
【図6A】ソーベル演算子で処理した画像を対向する方向にオフセットし、且つオフセットした画像を合成して得られた四つの画像を示す図である。
【図6B】ソーベル演算子で処理した画像を対向する方向にオフセットし、且つオフセットした画像を合成して得られた四つの画像を示す図である。
【図6C】ソーベル演算子で処理した画像を対向する方向にオフセットし、且つオフセットした画像を合成して得られた四つの画像を示す図である。
【図6D】ソーベル演算子で処理した画像を対向する方向にオフセットし、且つオフセットした画像を合成して得られた四つの画像を示す図である。
【図7A】ソーベル演算子で処理した画像を反対の方向にオフセットし、且つオフセットした画像を合成して得られた四つの画像を示す図である。
【図7B】ソーベル演算子で処理した画像を反対の方向にオフセットし、且つオフセットした画像を合成して得られた四つの画像を示す図である。
【図7C】ソーベル演算子で処理した画像を反対の方向にオフセットし、且つオフセットした画像を合成して得られた四つの画像を示す図である。
【図7D】ソーベル演算子で処理した画像を反対の方向にオフセットし、且つオフセットした画像を合成して得られた四つの画像を示す図である。
【図8】整合された細い筆画画像を示す図である。
【図9】整合した太い筆画画像を示す図である。
【図10】フィルタリング処理により得られた太い筆画画像を示す図である。
【図11】本発明の実施の形態に係る、画像からテキスト筆画画像を抽出する装置を示すブロック図である。
【図12】本発明の実施の形態に係る、ソーベル演算子で画像からテキスト筆画画像を抽出する装置を示すブロック図である。
【図13】本発明における、画像からテキスト筆画画像を抽出する方法及び装置を実施可能なコンピュータ装置を例として示す構成図である。
【発明を実施するための形態】
【0011】
以下に、図面を参照して本発明の実施の形態を説明する。本発明の一つの図面又は一種類の実施の形態に説明された要素と特徴は、一つ又はそれ以上の他の図面或いは実施の形態に示された要素及び特徴と結合することができる。ここで、明瞭にするために、図面及び説明において、当業者にとって知られている、本発明と関係ない構成要素と処理の表示及び説明が省略されている。
【0012】
以下に、図1を参照して本発明の実施の形態に係る、画像からテキスト筆画画像を抽出する方法について説明する。
図1は、本発明の実施の形態に係る、画像からテキスト筆画画像を抽出する方法を示すフローチャートである。図1に示されたように、ステップS102において、画像のエッジ情報及び勾配情報を取得することができる。
好ましくは、画像のエッジ情報及び勾配情報を表すステップ信号又はパルス信号を解析し、解析結果に基づいてエッジ情報と勾配情報を抽出することができる。
【0013】
画像において、細い筆画の画像データをパルス信号で示し、太い筆画の画像データ及びそれと類似する大きい尺度対象をステップ信号で示すことができる。パルス信号を解析し、その解析結果に基づいて細い筆画のエッジ情報と勾配情報を抽出することができる。また、ステップ信号を解析し、その解析結果に基づいて太い筆画のエッジ情報と勾配情報を抽出し、太い筆画と類似する大きい尺度対象のエッジ情報と勾配情報を抽出することができる。
【0014】
以下に、図2を参照して、ソーベル演算子でステップ信号を抽出する過程とソーベル演算子でパルス信号を抽出する過程、及びオフセット処理と合成処理により強調処理を実行する過程について説明する。
【0015】
図2(i)はステップ信号、図2(ii)はパルス信号、図2(iii)と図2(iv)はソーベル演算子に対応する信号、図2(v)はソーベル演算子でステップ信号を抽出した抽出結果、図2(vi)はソーベル演算子でパルス信号を抽出した抽出結果、図2(vii)はステップ信号の抽出結果に絶対値を取った信号、図2(viii)はパルス信号の抽出結果に絶対値を取った信号、及び図2(ix)と図2(x)は相応のオフセットした信号を示した。
【0016】
ここで、図2における座標及び大きさは、限定的ではなく、例示的なものであり、且つ関連の信号処理の原理を示すためのものに過ぎない。
【0017】
図2に示されたように、(図2(iii)に示されるような)ソーベル演算子で(図2(i)に示されるような)ステップ信号を抽出することにより、(図2(v)に示されるような)単一の谷状な信号を取得することができる。その一方、(図2(iv)に示されるような)ソーベル演算子で(図2(ii)に示されるような)パルス信号を抽出することにより、(図2(vi)に示されるような)谷状な信号と山のような信号を結合した信号を取得することができる。以上のように、ソーベル演算子でステップ信号とパルス信号を抽出することにより、(図2(v)と図2(vi)に示されるような)差異の大きい二つの信号を相応的に取得することができる。
【0018】
次に、後に説明する(例えばオフセット処理と合成処理を含む)強調処理によりステップ信号とパルス信号を強調することができる。これにより、パルス信号に対応する細い筆画の画像データ及びステップ信号に対応する太い筆画の画像データを抽出する。
【0019】
例えば、ソーベル演算子で抽出されたパルス信号における(図2(vi)に示されるような)谷状な信号に絶対値を取って(即ち谷状な信号の大きさを取る)別の山のような信号(図2(viii)に示されるような)を得ることができる。その後に、当該別の山のような信号と元の山のような信号の部分(即ちソーベル演算子で抽出された山のような信号)を対向的な方向にオフセットさせ、且つオフセットした当該別の山のような信号と元の山のような信号とを重ねることにより(図2(x)に示されるような)、更に当該パルス信号に対応する細い筆画の画像データを強調することができる。また、(図2(v)に示されるような)ソーベル演算子で抽出されたステップ信号における谷状な信号に絶対値を取って、(図2(vii)に示されるような)もう一つの山のような信号を得ることができる。その後、(図2(ix)に示されるような)当該もう一つの山のような信号をオフセットさせる。
【0020】
選択的に、予め設けられたフィルタリング条件に基づいて、太い筆画と類似する大きい尺度対象のエッジ情報と勾配情報をフィルタリングすると共に、太い筆画のエッジ情報と勾配情報を残すことができる。具体的なフィルタリング処理について後に説明する。
【0021】
選択的に、画像の明瞭度に基づいて、或いは必要に応じて、図4に示された原始画像に対してフィルタリングしても良い。例えば、ローパスフィルタを用いて原始画像をフィルタリングすることによって画像中のノイズを抑制することができる。ローパスフィルタは、例えばガウシャンフィルタであっても良いが、それに限定されなく、当業者に既知された任意の適当なローパスフィルタであっても良い。
【0022】
ステップS104において、取得されたエッジ処理と勾配処理に予め設けられた強調処理を行うことにより、画像においてテキストに関するエッジ情報と勾配情報を強調することができる。
【0023】
各種の方法でエッジ情報と勾配情報に強調処理を行うことができる。好ましくは、2値化処理と整合処理でエッジ情報と勾配情報を強調することができる。ここでの整合処理は、積集合を求める処理、最大値を求める処理、或いは平均値を求める処理であっても良い。好ましくは、後に説明されるように、整合処理は積集合を求める処理であっても良い。
【0024】
ステップS106において、強調されたエッジ情報と勾配情報に対応するテキスト筆画画像を得ることができる。
【0025】
以下に、図3〜図10を参照して、本発明の実施の形態に係る、ソーベル演算子で画像からテキスト筆画画像を抽出する方法について説明する。
【0026】
図3は本発明の実施の形態に係る、ソーベル演算子で画像からテキスト筆画画像を抽出する方法を示すフローチャートである。図4は処理する原始画像を示す図である。図5A〜図5Hは、ソーベル演算子で畳み込み処理を行った画像を示す図である。図6A〜図6Dは、画像を対向する方向にオフセットさせ、且つオフセットした画像を合成した四つの画像を示す図である。図7A〜図7Dは、画像を反対の方向にオフセットさせ、且つオフセットした画像を合成した四つの画像を示す図である。図8は、整合した細い筆画画像を示す図である。図9は、整合した太い筆画画像を示す図である。図10は、フィルタリング処理を行った太い筆画画像を示す図である。
【0027】
図3に示されたように、ステップS202において、(例えば図4に示された原始画像といった)処理される画像に(例えばローパスフィルタといった)平滑化処理を行うことができる。ステップS202は選択可能なものである。言い換えれば、画像が比較に明瞭である場合に、或いは必要に応じて、図4に示された画像に(例えばローパスフィルタといった)平滑化処理を行わなくても良い。
【0028】
ここで、図4に示された原始画像を処理すべき画像とする。図4において、抽出されたテキスト筆画に、画像の右上隅にあるFUJITSUと画像の下側の日本語文字を含むと望ましい。なお、FUJITSUは細い筆画の文字、日本語文字は太い筆画の文字である。ここでは、図4が例示的なものに過ぎない。実際に、画像において細い筆画の文字のみ、或いは太い筆画の文字のみが含まれる場合もある。
【0029】
ステップS204において、ソーベル(Sobel)演算子で平滑化された画像に畳み込み処理を行うことができる。ステップS202の平滑化処理が行われない場合に、ソーベル演算子を直接に利用して、(例えば図4に示された原始画像)処理する画像に畳み込み処理を行うことができる。
【0030】
具体的に、ソーベル演算子を利用して、処理する画像に複数の方向において畳み込み処理を行う。言い換えれば、画像の複数の方向におけるエッジ情報と勾配情報を取得するための複数のソーベル演算子のコンボリューションカーネルを利用して、画像の画像データに畳み込み演算をそれぞれ行う。
【0031】
例えば、ソーベル演算子を利用して、処理される画像に四つの方向において畳み込み処理を行う。好ましくは、これら四つの方向が水平方向、垂直方向、及び二つの対角線方向を含む。畳み込み処理が行われた画像は、図5A〜5Hに示される。これら四つの方向を選択する原因としては、これら四つの方向のそれぞれが常用な筆画
(外1)
に対応するからである。
【0032】
例えば、利用されたソーベル演算子のコンボリューションカーネルは、以下のようになる。
【表1】
【0033】
なお、Shは水平方向に係るソーベル演算子のコンボリューションカーネル、Svは垂直方向に係るソーベル演算子のコンボリューションカーネル、Srdは第1の対角線方向に係るソーベル演算子のコンボリューションカーネル、Sldは第2の対角線方向に係るソーベル演算子のコンボリューションカーネルである。第1の対角線方向は右上隅から左下隅までの対角線方向、第2の対角線方向は左下隅から右下隅までの対角線方向である。
【0034】
ここで、畳み込み処理の結果が正と負の両方を含むため、二層の画像を利用して畳み込み結果を記憶することができる。その一つは正パルス応答画像を記憶するために用いられ、もう一つは負パルス応答画像を記憶するために用いられる。言い換えれば、各方向に対する畳み込み演算の結果を、各方向に対する正パルス応答画像データと負パルス応答画像データとに区分する。
【0035】
本明細書に四つの方向の例が開示されたが、四つの方向において畳み込み演算を行うことに限定されるわけではない。高精度が必要の場合に、或いは他の必要に応じて、より多い方向、例えば8個の方向のソーベル演算子のコンボリューションカーネルを利用して、処理する画像に畳み込み処理を行うことができる。より多い方向の畳み込み演算により、精度のより高い結果を得ることができる。ソーベル演算子の定義及び画像データとの畳み込み処理は、任意の好適な従来の技術によるものであっても良い。
【0036】
図4に示された原始画像に畳み込み処理を行うことにより、図5A〜図5Hに示された、ソーベル演算子のコンボリューションカーネルで畳み込み処理を行った画像を得ることができる。
【0037】
具体的に、図5Aは、水平方向の正パルス応答画像データを含む画像、図5Bは、水平方向の負パルス応答画像データを含む画像を、それぞれ示す。図5Cは、垂直方向の正パルス応答画像データを含む画像、図5Dは、垂直方向の負パルス応答画像データを含む画像をそれぞれ示す。図5Eは、右上隅から左下隅までの対角線方向の正パルス応答画像データを含む画像、図5Fは、右上隅から左下隅までの対角線方向の負パルス応答画像データを含む画像をそれぞれ示す。図5Gは、左上隅から右下隅までの対角線方向の正パルス応答画像データを含む画像、図5Hは、左上隅から右下隅までの対角線方向の負パルス応答画像データを含む画像をそれぞれ示す。
【0038】
次に、図6A〜6D及び図7A〜7Dに示されたように、ステップS206において、予め推定された筆画幅を利用して、正パルス応答画像データと負パルス応答画像データをオフセットし、オフセットされた画像を合成する。
【0039】
各方向に対する正パルス応答画像データと負パルス応答画像データに対して、それを対向する方向にオフセットし、かつ、加算する演算を実行することによって、各方向に対する第1の合成画像データを得ることができる。また、各方向に対する正パルス応答画像データと負パルス応答画像データに対して、それを反対の方向にオフセットし、かつ、加算する演算を実行することによって、各方向に対する第2の合成画像データを得ることができる。
【0040】
例えば、対向する方向にオフセットさせ、かつ、加算する演算は、以下の(1)式に基づいて実行されても良い。
Ih(x,y)=(Ih-positive(x,y-w/2)+Ih-negative(x,y+w/2))/2
Iv(x,y)=(Iv-positive(x-w/2,y)+Iv-negative(x+w/2,y))/2
Ird(x,y)=(Ird-positive(x+w/2,y-w/2)+Ird-negative(x-w/2,y+w/2))/2
Ild(x,y)=(Ild-positive(x-w/2,y-w/2)+Ild-negative(x+w/2,y+w/2))/2
また、反対の方向にオフセットし、かつ、加算する演算が以下の(2)式に基づいて実行されても良い。
【0041】
Ih’(x,y)=(Ih-positive(x,y+w/2)+Ih-negative(x,y-w/2))/2,
Iv’(x,y)=(Iv-positive(x+w/2,y)+Iv-negative(x-w/2,y))/2,
Ird’(x,y)=(Ird-positive(x-w/2,y+w/2)+Ird-negative(x+w/2,y-w/2))/2,
Ild’(x,y)=(Ild-positive(x+w/2,y+w/2)+Ild-negative(x-w/2,y-w/2))/2
なお、xは画素の横座標、yは画素の縦座標、Ih(x,y)、Iv(x,y)、Ird(x,y)及びIld(x,y)は画素の横方向、縦方向及び二つの対角線方向の四つの方向に対する第1の合成画像データをそれぞれ示す。なお、第1の合成画像データを含む画像は、図5A〜5Dに示される。
【0042】
図6Aは、データIh(x,y)を含む画像、図6Bは、データIv(x,y)を含む画像、図6Cは、データIrd(x,y)を含む画像、図6Dは、データIld(x,y)を含む画像をそれぞれ示す。
【0043】
Ih’(x,y)、Iv’(x,y)及びIrd’(x,y)、Ild’(x,y)は、画素の横方向、縦方向及び二つの対角線方向の四つの方向に対する第2の合成画像データをそれぞれ示す。なお、第2の合成画像データを含む画像は図7A〜7Dに示される。
【0044】
図7Aは、データIh’(x,y)を含む画像、図7Bは、データIv’(x,y)を含む画像、図7Cは、データIrd’(x,y)を含む画像、図7Dは、データIld’(x,y)を含む画像をそれぞれ示す。
【0045】
Ih-positive(x,y)、Iv-positive(x,y)、Ird-positive(x,y)及びIld-positive(x,y)は、画素の横方向、縦方向及び二つの対角線方向の四つの方向に対する正パルス応答画像データをそれぞれ示す。なお、正パルス応答画像データを含む画像は、図5A、図5C、図5Eと図5Gに示された。
【0046】
Ih-negative(x,y)、Iv-negative(x,y)、Ird-negative(x,y)及びIld-negative(x,y)は、画素の横方向、縦方向及び二つの対角線方向の四つの方向に対する負パルス応答画像データをそれぞれ示す。なお、負パルス応答画像データを含む画像は、図5B、図5D、図5Fと図5Hに示される。
【0047】
前記処理に係るwは、予め推定された筆画幅である。例えば、経験によってwの値を推定しても良く、或いは画像を目視してwの値を推定しても良い。また、前記の(1)式と(2)式は、画素の横方向、縦方向及び二つの対角線方向の四つの方向に対する画像データに合成処理を行う具体的な例のみを示したが、本発明に限定するものではない。実際に、筆画を強調する適切な合成処理であれば、任意の処理が適用される。
【0048】
ここで、対向する方向へのオフセット及び反対の方向へのオフセットを行うことは、非特定な画像にどの方向へのオフセットにより筆画の強調の効果を実現できるかを容易に特定するとは限らないからである。従って、対向する方向へのオフセット及び反対の方向へのオフセットをそれぞれ試して行うことにより、必ず筆画の強調の効果を実現することができる。事前にどの方向へのオフセットにより筆画の強調の効果を実現できるかを特定できれば、対向する方向へのオフセット及び反対の方向へのオフセットを同時に実行する必要がなくなる。即ち、対向する方向へのオフセットと反対の方向へのオフセットのいずれかを実行すれば良い。本明細書に示した画像の例では、図6A〜6Dに示されるように、対向する方向にオフセットすることにより筆画の強調の効果を実現することができる。図7A〜7Dに示されたように、反対する方向にオフセットすることにより筆画の強調の効果を実現することができない。
【0049】
ステップS208において、ステップS206に合成された画像に高い閾値による2値化処理と整合処理を行うことができる。
【0050】
例えば、予め設けされた高い閾値を用いて、各方向に対する第1の合成画像データと第2の合成画像データに高い閾値による2値化処理をそれぞれ行うことができる。高い閾値による2値化処理が行われた、各方向に対する第1の合成画像データに整合処理を行い、高い閾値による2値化処理が行われた、各方向に対する第2の合成画像データに整合処理を行う。
【0051】
ここでの整合処理は、積集合を求める処理、最大値を求める処理、或いは平均値を求める処理のいずれか一つの処理であっても良い。
【0052】
整合処理が積集合を求める処理であれば、以下の式に従って積集合を求める処理を行うことができる。
【0053】
Ioutput-thin=Ih-binarized-high∪Iv-binarized-high∪Ird-binarized-high∪Ild-binarized-high
I’output-thin=I’h-binarized-high∪I’v-binarized-high∪I’rd-binarized-high∪I’ld-binarized-high
なお、Ioutput-thinは、積集合が求められた第1の細い筆画画像データであり、Ih-binarized-high、Iv-binarized-high、Ird-binarized-high及びIld-binarized-highのそれぞれは、第1の合成画像データIh(x,y)、Iv(x,y)、Ird(x,y)及びIld(x,y)に高い閾値による2値化処理を行った2値化画像データである。なお、I’output-thinは、積集合が求められた第2の細い筆画画像データであり、I’h-binarized-high、I’v-binarized-high、I’rd-binarized-high及びI’ld-binarized-highのそれぞれは、第2の合成画像データIh’(x,y)、Iv’(x,y)、Ird’(x,y)及びIld’(x,y)に高い閾値による2値化処理を行った2値化画像データである。
【0054】
ステップS210において、細い筆画画像データを取得することができる。即ち、Ioutput-thinとI’output-thinを取得する。
【0055】
ステップS212において、合成された画像に低い閾値による2値化処理と整合処理を行うことができる。
【0056】
例えば、予め設けられた、前記高い閾値よりも小さい低い閾値を利用して、各方向に対する第1の合成画像データと第2の合成画像データに低い閾値による2値化処理をそれぞれ行うことができる。低い閾値による2値化処理が行われた、各方向に対する第1の合成画像データには、整合処理が施され、第2の2値化処理が行われた、各方向に対する第2の合成画像データには、整合処理が施される。
【0057】
ここでの整合処理は、積集合を求める処理、最大値を求める処理、或いは平均値を求める処理のいずれか一つの処理であっても良い。
【0058】
整合処理が積集合を求める処理であれば、例えば、以下の式に従って積集合を求める処理を行うことができる。
Ioutput-thick=Ih-binarized-low∪Iv-binarized-low∪Ird-binarized-low∪Ild-binarized-low
I’output-thick=I’h-binarized-low∪I’v-binarized-low∪I’rd-binarized-low∪I’ld-binarized-low
なお、Ioutput-thickは、積集合が求められた第1の太い筆画画像データであり、Ih-binarized-low、Iv-binarized-low、Ird-binarized-low及びIld-binarized-lowのそれぞれは、第1の合成画像データIh(x,y)、Iv(x,y)、Ird(x,y)及びIld(x,y)に低い閾値による2値化処理を行った2値化画像データである。なお、I’output-thickは、積集合が求められた第2の太い筆画画像データであり、I’h-binarized-low、I’v-binarized-low、I’rd-binarized-low及びI’ld-binarized-lowのそれぞれは、第2の合成画像データIh’(x,y)、Iv’(x,y)、Ird’(x,y)及びIld’(x, y)に低い閾値による2値化処理を行った2値化画像データである。
【0059】
以上のように、事前にどの方向へのオフセットにより筆画の強調の効果を実現できるかを特定できれば、対向する方向へのオフセットと反対の方向へのオフセットを同時に実行して第1の合成画像データと第2の合成画像データを取得する必要がなくなる。即ち、(例えば対向する方向又は反対の方向といった)筆画の強調の効果を実現できる方向においてオフセットを行い、相応の合成画像データが取得される。一方、当該合成画像データには、前記の2値化処理と整合処理が施される。
【0060】
ステップS214において、選択的に、予め設けられたフィルタリング条件に応じて、ステップS212で処理されたデータがフィルタリングされる。
【0061】
具体的に、予め設けられたフィルタリング条件を利用して、第1の太い筆画画像データと第2の太い筆画画像データにおける連通領域に関するデータにフィルタリング処理をそれぞれ行うことにより、予め設けられたフィルタリング条件を満足する第1の連通領域の画像データと第2の連通領域の画像データが取得される。
【0062】
ここで予め設けられたフィルタリング条件を利用して第1の太い筆画画像データと第2の太い筆画画像データにフィルタリング処理を行うことは、ステップS212で得られた第1の太い筆画画像データと第2の太い筆画画像データに、太い筆画に加えて、例えば画像における人間のエッジデータといった、その他のオブジェクトのエッジデータ又はその他の太い筆画と類似するエッジデータが含まれる可能性があるからである。予め設けられたフィルタリング条件を利用して第1の太い筆画画像データと第2の太い筆画画像データにフィルタリング処理を行うことにより、太い筆画に対応する連通領域の画像データをより正確に取得することができる。
【0063】
なお、予め設けられたフィルタリング条件は、(1)連通領域内の画素の階調分散が予め設けられた分散閾値よりも小さいこと、(2)連通領域の内側エッジから外側エッジまでの画素の極性が一致すること、及び(3)連通領域の大きさが予め設けられた大きさ閾値以内にあること、のいずれかであっても良い。或いは、フィルタリング条件は、上記(1)、(2)及び(3)のうち、二つ又は複数の条件の任意の組み合わせであっても良い。
【0064】
ここで、連通領域とは、ステップS212の処理により得られた太い筆画画像データが示したエッジからなる閉じた領域である。
【0065】
フィルタリング条件(1)、即ち連通領域内の画素の階調分散が予め設けられた分散閾値よりも小さいことは、具体的に、まずステップS212で処理された画像において連通領域に関する座標情報を取得することができる。次に座標情報及び図4に示された原始画像に基づいて連通領域の階調分散を特定し、当該連通領域内の階調分散が予め設けられた分散閾値よりも小さいか否かを判断する。連通領域内の階調分散が予め設けられた分散閾値よりも小さい場合に、当該連通領域を保留し、即ち当該連通領域が太い筆画と関連あると考えられる。さもなければ、当該連通領域をフィルタリングする。
【0066】
フィルタリング条件(2)、即ち連通領域の内側エッジから外側エッジまでの画素極性が一致であることは、具体的に、まずステップS212で処理された画像において連通領域に関する座標情報を取得することができる。次に座標情報及び図4に示された原始画像に基づいて連通領域の内側エッジから外側エッジまでの画素極性が一致か否かを特定する。連通領域内の内側エッジと外側エッジの画素極性が一致である場合に、当該連通領域を保留し、即ち当該連通領域が太い筆画と関連あると考えられる。さもなければ、当該連通領域をフィルタリングする。
【0067】
ここでの画素の極性は、一つの内側エッジの画素の諧調と、当該内側エッジの画素と隣接する外側エッジの画素の階調との関係として理解されても良い。例えば、2値化画像における画素の階調が「0」或いは「255」に設置される場合に、二つの画素の階調値が何れも「0」或いは「255」であれば、この二つの画素の極性が一致であると考えられる。さもなければ、極性が不一致であると考えられる。勿論、必要に応じて画素極性が一致であるその他の適切な条件を設定しても良く、ここでは詳しく説明しない。
【0068】
フィルタリング条件(3)、即ち連通領域の大きさが予め設けられた大きさ領域以内にあることは、具体的に、連通領域の大きさが予め設けられた閾値以内にあれば、当該連通領域を保留し、即ち当該連通領域が太い筆画と関連あると考えられる。さもなければ、当該連通領域をフィルタリングする。ここで、太い筆画画像が細い筆画画像よりも大きいであるが、一般的に比較的な共通の上限があるため、当該上限に基づいて前記の予め設けられた閾値を設定しても良いことは、容易に理解できる。連通領域のサイズが大きすぎであれば、当該連通領域が対応するのは太い筆画ではなく非筆画対象であると考えても良い。例えば、殆どの場合に、太い筆画サイズが画像全体のサイズの半分ひいては半分以上を占拠することはない。勿論、特別な場合に太い筆画のサイズが確かに大きいであれば、前記の予め設けられた閾値の大きさを調整すればこのような態様を反映することができる。
【0069】
なお、前記の予め設けられた分散閾値と予め設けられた大きさ閾値は、予め試験によって得られた経験値に基づいて特定しても良く、或いは、画像サンプルに対する目視に基づいて特定しても良い。勿論、任意のその他の適切な方法で特定しても良い。
【0070】
フィルタリング条件(1)、(2)及び(3)のうち、二つ又は全部の条件を組み合わせてフィルタリングを実行することもできる。
【0071】
次に、ステップS216において、第1の連通領域の画像データと第2の連通領域の画像データにそれぞれ対応する第1の太い筆画エッジ画像データと第2の太い筆画エッジ画像データを取得する。
【0072】
ステップS218において、第1の細い筆画画像データと第2の細い筆画画像データにそれぞれ対応する(図8に示されるような)第1の細い筆画画像と第2の細い筆画画像(図示せず)を取得し、第1の太い筆画エッジ画像データと第2の太い筆画エッジ画像データにそれぞれ対応する(図10に示されるような)第1の太い筆画画像と第2の太い筆画画像(図示せず)を取得する。
【0073】
理解すべきなのは、ステップS214を実行しない場合でも太い筆画画像を取得することができる。言い換えれば、ステップS212で取得されたIoutput-thickとI’output-thickに基づいて(図9に示されるような)第1の太い筆画画像と第2の太い筆画画像を取得することができる。
【0074】
本明細書において、前記ステップにより第2の細い筆画画像と第2の太い筆画画像を取得することができるが、反対の方向へのオフセットにより筆画の強調の効果を実現できないため、対応的に得られた第2の細い筆画画像や第2の太い筆画画像を具体的に示していない。
【0075】
選択的に、テキスト筆画の精度、テキスト筆画のリコールレート、或いはテキスト筆画の精度とテキスト筆画のリコールレートとの折衷に基づいて、第1の細い筆画画像と第2の細い筆画画像のいずれかを最終的な細い筆画画像として選別することができる。また、テキスト筆画の精度、テキスト筆画のリコールレート、或いはテキスト筆画の精度とテキスト筆画のリコールレートとの折衷に基づいて、第1の太い筆画画像と第2の太い筆画画像のいずれかを最終的な太い筆画画像として選別することもできる。本明細書の例において、対向する方向へのオフセットにより筆画の強調の効果を実現できるため、テキスト筆画の精度、テキスト筆画のリコールレート、或いはテキスト筆画の精度とテキスト筆画のリコールレートとの折衷に基づいて、第1の細い筆画画像と第1の太い筆画画像を最終的な筆画抽出結果として取得することができる。
【0076】
本明細書に言及されたテキスト筆画の精度は、実際に検出された正しい筆画の数と実際に検出された筆画の数との比として理解されても良い。テキスト筆画のリコールレートは、実際に検出された正しい筆画の数と実際に存在した正しい筆画の数との比として理解されても良い。
【0077】
以上のように、ソーベル演算子を例として画像からテキスト筆画画像を抽出する方法を説明した。しかしながら、ただ例示的な方式で画像からテキスト筆画画像を抽出する方法を説明するに過ぎない。使用可能な演算子はこれに限定されなく、Robert演算子、Prewitt演算子、Laplace演算子、log演算子、Canny演算子、或いはその他の任意の適切な演算子であっても良い。
【0078】
また、ステップS208とS212で2値化処理を行ってから整合処理を行うことを説明したが、実際に整合処理を行ってから2値化処理を行っても良い。
【0079】
以上に言及された高い閾値と低い閾値は、経験によって特定されても良く、或いは何回かの試験によって特定されても良い。しかしながら、これはただ例示的なものに過ぎず、任意の適切な方法で高い閾値と低い閾値を特定することができる。
【0080】
以下、図11を参照して、本発明の実施の形態に係る、画像からテキスト筆画画像を抽出する装置400を説明する。
【0081】
図11は、本発明の実施の形態に係る、画像からテキスト筆画画像を抽出する装置400を示すブロック図である。装置400は、例えば、上述のように図1を参照して説明された、画像からテキスト筆画画像を抽出する方法を実行することができる。
【0082】
具体的に、装置400は、前記画像のエッジ情報と勾配情報を取得する情報取得手段402と、取得されたエッジ情報と勾配情報に予め設けられた強調処理を行うことにより、前記画像におけるテキストに関するエッジ情報と勾配情報を強調する強調手段404と、強調されたエッジ情報と勾配情報に対応するテキスト筆画画像を取得する筆画画像取得手段406とを備える。
【0083】
選択的に、装置400は、選別手段(図示せず)を備えても良い。選別手段は、抽出された複数のテキスト筆画画像に選別を行うように配置される。
【0084】
情報取得手段402は、代表画像のエッジ情報と勾配情報のステップ信号又はパルス信号を解析し、解析結果に基づいてエッジ情報と勾配情報を抽出するように配置される。
【0085】
画像において、細い筆画の画像データはパルス信号で表し、太い筆画の画像データ及び太い筆画と類似する大きい尺度対象は、ステップ信号で表すことができる。パルス信号を解析し、その解析結果に基づいて細い筆画のエッジ情報と勾配情報を抽出することができる。また、ステップ信号を解析し、その解析結果に基づいて、太い筆画のエッジ情報と勾配情報を抽出し、太い筆画と類似する大きい尺度対象のエッジ情報と勾配情報を抽出することができる。
【0086】
選択的に、装置400は、更にノイズ削減手段(図示せず)を備えても良い。ノイズ削減手段は、画像の明瞭度に基づいて、或いは必要に応じて、原始画像にフィルタリングを行ってノイズを削減するように配置される。例えば、ローパスフィルタを利用して画像をフィルタリングすることにより、原始画像におけるノイズを削減することができる。ローパスフィルタは、ガウシアンフィルタであっても良いが、それに限定されなく、当業者にとって知られている任意の適切なローパスフィルタであっても良い。
【0087】
強調手段404は、各種の方法に基づいてエッジ情報と勾配情報に強調処理を行うように配置される。好ましくは、2値化処理と整合処理によりエッジ情報と勾配情報を強調することができる。ここでの強調処理は、積集合を求める処理、最大値を求める処理、或いは平均値を求める処理の何れかであっても良い。好ましくは、後述されるように、整合処理は積集合処理であっても良い。
【0088】
以下に、図12を参照して、本発明の実施の形態に係る、ソーベル演算子で画像からテキスト筆画画像を抽出する装置400’を説明する。
【0089】
図12は、本発明の実施の形態に係る、ソーベル演算子で画像からテキスト筆画画像を抽出する装置400’を示すブロック図である。
【0090】
装置400’は、上述されたように図3〜図10に示された、本発明の実施の形態に係るソーベル演算子で画像からテキスト筆画画像を抽出する方法を実行することができる。
【0091】
具体的には、装置400と同様に、装置400’は、情報取得手段402’と、強調手段404’と、筆画画像取得手段406’とを備える。選択的に、装置400’は、選別手段とノイズ削減手段(何れも図示せず)を備えても良い。
【0092】
選別手段は、テキスト筆画の精度とテキスト筆画のリコールレートとのうち少なくとも一つに基づいて、前記第1の細い筆画画像と前記第2の細い筆画画像の何れかを最終的な細い筆画画像として選別し、及び/又は、前記第1の太い筆画画像と前記第2の太い筆画画像の何れかを最終的な太い筆画画像として選別するように配置される。具体的な選別処理は、図3〜図10を参照して説明されたため、ここでは説明を重複しない。
【0093】
ノイズ削減手段は、原始画像(即ち処理する画像)をフィルタリングしてノイズを削減するように配置される。具体的なノイズ削減処理は、図3〜図10に参照して説明されたため、ここでは説明を重複しない。
【0094】
なお、情報取得手段402’は、畳み込み演算サブ手段4022と区分サブ手段4024とを備えても良い。畳み込み演算サブ手段4022は、画像の複数の方向におけるエッジ情報と勾配情報を取得するための複数のソーベル演算子のコンボリューションカーネルを利用して前記画像の画像データと畳み込み演算をそれぞれ行うするように配置される。区分サブ手段4024は、各方向に対する畳み込み演算の結果を各方向に対する正パルス応答画像データと負パルス応答画像データとに区分するように配置される。
【0095】
強調手段404’は、第1の合成画像取得サブ手段4042及び/又は第2の合成画像取得サブ手段4044を備えても良い。第1の合成画像取得サブ手段4042は、各方向に対する正パルス応答画像データと負パルス応答画像データに、対向する方向へのオフセット及び加算を実行することにより、各方向に対する第1の合成画像データを取得するように配置される。第2の合成画像取得サブ手段4044は、各方向に対する正パルス応答画像データと負パルス応答画像データに、反対の方向へのオフセット及び加算を実行することにより、各方向に対する第2の合成画像データを取得するように配置される。
【0096】
前記筆画画像取得手段406’は、第1の2値化処理サブ手段4062と、第1の細い筆画画像取得サブ手段4064と、第2の細い筆画画像取得サブ手段4066と、第2の2値化処理サブ手段4068と、第1の太い筆画画像取得サブ手段40610と、第2の太い筆画画像取得サブ手段40612とを備えても良い。
【0097】
第1の2値化処理サブ手段4062は、予め設けられた第1の閾値を利用して各方向に対する第1の合成画像データと第2の合成画像データに第1の2値化処理をそれぞれ行うように配置される。
【0098】
第1の細い筆画画像取得サブ手段4064は、第1の2値化処理が行われた各方向に対する第1の合成画像データに整合処理を行って第1の細い筆画画像データを取得することにより、前記第1の細い筆画画像データに対応する第1の細い筆画画像を取得するように配置される。
【0099】
第2の細い筆画画像取得サブ手段4066は、第1の2値化処理が行われた各方向に対する第2の合成画像データに整合処理を行って第2の細い筆画画像データを取得することにより、前記第2の細い筆画画像データに対応する第2の細い筆画画像を取得するように配置される。
【0100】
第2の2値化処理サブ手段4068は、予め設けられた、第1の閾値よりも小さい第2の閾値を利用して各方向に対する第1の合成画像データと第2の合成画像データに第2の2値化処理をそれぞれ行うように配置される。
【0101】
第1の太い筆画画像取得サブ手段40610は、第2の2値化処理が行われた各方向に対する第1の合成画像データに整合処理を行って第1の太い筆画画像データを取得することにより、前記第1の太い筆画画像データに対応する第1の太い筆画画像を取得するように配置される。
【0102】
第2の太い筆画画像取得サブ手段40612は、第2の2値化処理が行われた各方向に対する第2の合成画像データに整合処理を行って第2の太い筆画画像データを取得することにより、前記第2の太い筆画画像データに対応する第2の太い筆画画像を取得するように配置される。
【0103】
筆画画像取得手段406は、必要に応じて、第1の2値化処理サブ手段4062、第1の細い筆画画像取得サブ手段4064、第2の細い筆画画像取得サブ手段4066のみを備えても良いし、或いは、第2の2値化処理サブ手段4068、第1の太い筆画画像取得サブ手段40610、第2の太い筆画画像取得サブ手段40612のみを備えても良い。言い換えれば、筆画画像取得手段406は、必要に応じて、細い筆画画像又は太い筆画画像のみを取得するように配置される。例えば、処理する画像において太い筆画又は細い筆画のテキスト情報のみが存在し、或いは太い筆画又は細い筆画のテキスト情報のみを取得する必要がある場合が該当する。
【0104】
更に、以上のように、事前にどの方向へのオフセットにより筆画の強調の効果を実現できるかを特定することができれば、強調手段404’は、第1の合成画像取得サブ手段4042と第2の合成画像取得サブ手段4044とのうち、当該方向における処理に対応する合成画像取得サブ手段を備えても良い。一方、筆画画像取得手段406’は、第1の細い筆画画像取得サブ手段4064と第2の細い筆画画像取得サブ手段4066とのうち、当該方向における処理に対応するもの、及び第1の太い筆画画像取得サブ手段40610と第2の太い筆画画像取得サブ手段40612とのうち、当該方向における処理に対応するもののみを備えても良い。
【0105】
装置400’は、例えば、上述のように図3〜図10に示された、本発明の実施の形態に係るソーベル演算子で画像からテキスト筆画画像を抽出する方法を実行するように配置される。簡単にするために、ここでは第1の2値化処理サブ手段4062と、第1の細い筆画画像取得サブ手段4064と、第2の細い筆画画像取得サブ手段4066と、第2の2値化処理サブ手段4068と、第1の太い筆画画像取得サブ手段40610と、第2の太い筆画画像取得サブ手段40612とを具体的に説明しない。
【0106】
また、選択的に、筆画画像取得手段406’は、フィルタリングサブ手段(図示せず)を更に備えても良い。フィルタリングサブ手段は、予め設けられたフィルタリング条件を利用して第1の太い筆画エッジ画像データと第2の太い筆画エッジデータにおける、連通領域に関するデータにフィルタリング処理を行って、予め設けられたフィルタリング条件を満足する第1の連通領域の画像データと第2の連通領域の画像データを取得するように配置される。
【0107】
予め設けられたフィルタリング条件は、前記連通領域内の画素の階調分散が予め設けられた分散閾値によりも小さいである条件と、前記連通領域の内側エッジから外側エッジまでの画素極性が一致である条件と、前記連通領域の大きさが予め設けられた大きさの閾値内にある条件と、のうちの少なくとも一つを含む。予め設けられたフィルタリング条件については、図3〜図10を参照して説明されたため、ここでは説明を重複しない。
【0108】
本発明の実施の形態に係る、画像からテキスト筆画画像を抽出する方法及び装置により、少なくとも以下の技術的効果の一つを実現することができる。即ち、スピードが速くなる効果、及び、筆画の抽出と同時に処理されるビデオの悪品質に起因したノイズと筆画尺度に対する不敏感を抑制できる効果である。また、本発明の実施の形態に係る、画像からテキスト筆画画像を抽出する方法及び装置には、テキストの色、テキスト背景のコントラスト等の従来の知識の必要が無くなる。
【0109】
以上に具体的な実施の形態を用いて本発明の基本的な原理を説明したが、本発明の方法及び装置の全て、或は任意のステップ又は構成要素をいかなる演算装置(プロセッサ、記憶媒体等を含む)又は演算装置のネットワークにおいてハードウェア、ファームウェア、ソフトウェア又はそれらの組合せで実現可能であることを当業者は理解することができる。これは、本発明の説明を検討した場合に、当業者により基本的なプログラミングスキルで実現可能である。
【0110】
したがって、本発明の目的は更に、いかなる演算装置で一つのプログラム又は一組のプログラムを実行することで実現可能である。前記の演算装置は周知の汎用装置であっても良い。したがって、本発明の目的は、前記方法又は装置を実現するプログラムコードを含むプログラム製品を提供するだけで実現可能である。つまり、このようなプログラム製品と、このようなプログラム製品を記憶する媒体も本発明を構成する。勿論、前記の記憶媒体は、既に知られているか又は将来的に開発される任意の種類の記憶媒体であっても良い。
【0111】
ソフトウェア及び/又はファームウェアにより本発明の実施の形態を実現する場合に、記憶媒体又はネットワークから専用のハードウェア構成を有するコンピュータ、例えば図13に示された汎用のコンピュータ1200へ当該ソフトウェアを構成するプログラムをインストールする。当該コンピュータは、各種のプログラムがインストールされている場合に、各機能などを実行することができる。
【0112】
図13において、中央処理装置(CPU)1201は、読取専用メモリ(ROM)1202に記憶されたプログラム又は記憶部1208からランダムアクセスメモリ(RAM)1203にロードされたプログラムに基づいて各種の処理を実行する。RAM1203には、必要に応じてCPU1201が各種の処理等を実行するために必要なデータも記憶されている。CPU1201、ROM1202とRAM1203は、バス1204を介して互いに接続されている。入力/出力インタフェース1205もバス1204に接続されている。
【0113】
入力部1206(キーボード、マウス等を含む)と、出力部1207(ディスプレイ、例えばブラウン管(CRT)、液晶ディスプレイ(LCD)等とスピーカ等を含む)と、記憶部1208(ハードディスク等を含)と、通信部1209(ネットワークインターフェースカード、例えばLANカード、モデム等を含む)とは、入力/出力インタフェース1205に接続されている。通信部1209はネットワーク、例えばインターネットを経由して通信処理を実行する。必要に応じて、入力/出力インタフェース1205にはドライバ1210も接続されている。磁気ディスク、光ディスク、光磁気ディスク、半導体メモリ等のような取り外し可能な媒体1211は、必要に応じてドライバ1210に装着される。これにより、読み出されたコンピュータプログラムが必要に応じて記憶部1208にインストールされる。
【0114】
ソフトウェアで前記一連の処理を実現する場合に、ネットワーク、例えばインターネット、又は記憶媒体、例えば取外し可能な媒体1211からソフトウェアを構成するプログラムをインストールする。
【0115】
このような記憶媒体は、図13に示された、その中にプログラムが記憶されており、デバイスから離れて配送されてユーザにプログラムを提供する取り外し可能な媒体1211に限定されないことを、当業者が理解すべきである。取り外し可能な媒体1211として、例えば、磁気ディスク(フロッピディスク(登録商標)含む)、光ディスク(コンパクトディスクリードオンリーメモリ(CD−ROM)やデジタルバーサティルディスク(DVD)を含む)、光磁気ディスク(ミニディスク(MD)(登録商標)含む)及び半導体メモリを含む。或いは、記憶媒体は、ROM1202、記憶部1208に含まれるハードディスクであって、プログラムが記憶されており、且つそれらを含むデバイスと一緒にユーザに配送されるハードディスクなどであっても良い。
【0116】
本発明は、更にコンピュータが読取り可能なコマンドコードを記憶するプログラムプロダクトを開示した。コマンドコードは、コンピュータにより読取られて実行されると、上述された本発明の実施の形態に係る方法を実行することができる。
【0117】
一方、上記のコンピュータ読取り可能なコマンドコードを記憶するプログラムプロダクトを保持する記憶媒体も本発明の開示に含まれる。記憶媒体は、フロプティカルディスク、光ディスク、光磁気ディスク、メモリカード、メモリスティック等を含むが、それらに限定されない。
【0118】
当業者は、ここで列挙されたのは例示的なものであり、本発明に限定しないことについて理解すべきである。
【0119】
本明細書において、「第1」、「第2」及び「第N個」等の記述は、説明された特徴を文字上で区別して本発明を明瞭に説明するためのものである。従って、それはいかなる限定的な意味を有するものではない。
【0120】
上記方法の各ステップ及び上記装置の各構成モジュール及び/又は手段は、例示として、ソフトウェア、ファームウェア、ハードウェア又はその組み合わせとして実施し、且つ相応の装置における一部とすることができる。上記装置における各構成モジュール、手段がソフトウェア、ファームウェア、ハードウェア又はその組み合わせの形態で配置される時に使用可能な具体的な方法又は形態は、当業者に周知されたため、ここでは詳しく説明しない。
【0121】
ソフトウェア又はファームウェアで実現される場合に、例示として、記憶媒体又はネットワークから専用のハードウェア構成を有するコンピュータ(例えば図13に示された汎用のコンピュータ1200)へ当該ソフトウェアを構成するプログラムをインストールすることができる。当該コンピュータは、各種のプログラムがインストールされている場合に、各機能などを実行することができる。
【0122】
以上、本発明の具体的な実施の形態に対する説明において、一種の実施の形態について説明及び/又は図示した特徴は、同一又は類似した形態で、一つ又は複数のその他の実施の形態で使用され、その他の実施の形態における特徴と組み合わせ、或いはその他の実施の形態における特徴を置換することができる。
【0123】
強調すべきは、専門用語「備える/含む」は本明細書に使用される時に特徴、要素、ステップ又は構成要素の存在を指すが、一つ又は複数のその他の特徴、要素、ステップ又は構成要素の存在又は付加を排除するわけではない。
【0124】
また、本発明の方法は、明細書に説明された時間順で実行されることに限定されず、その他の時間に従って順次に、並行に又は個別に実行されでも良い。したがって、本明細書に説明された方法の実行順は、本発明の技術的範囲を限定するものではない。
【0125】
以上のように、本発明の具体的な実施の形態の説明により本発明を開示したが、当業者は以下に付記される本願発明の要旨と範囲内に本発明に対する様々な変更、改善又は同等物を設計することができる。これら変更、改善又は同等物は、本発明の保護範囲内に含まれるものと認めるべきである。
(付記)
(付記1)
画像からテキスト筆画画像を抽出する方法であって、
前記画像のエッジ情報と勾配情報を取得するステップと、
取得されたエッジ情報と勾配情報に予め設けられた強調処理を行うことにより、前記画像においてテキストに関するエッジ情報と勾配情報を強調するステップと、
強調されたエッジ情報と勾配情報に対応するテキスト筆画画像を取得するステップと、
を含むことを特徴とする方法。
(付記2)
前記画像のエッジ情報と勾配情報を取得するステップは、
前記画像のエッジ情報と勾配情報を代表するステップ信号又はパルス信号を解析し、解析結果に基づいて前記エッジ情報と前記勾配情報を抽出することを含む、
付記1記載の方法。
(付記3)
前記画像のエッジ情報と勾配情報を取得するステップは、
画像の複数の方向におけるエッジ情報と勾配情報を取得するための複数のソーベル演算子のコンボリューションカーネルを利用して、前記画像の画像データと畳み込み演算をそれぞれ行い、
各方向に対する畳み込み演算の結果を各方向に対する正パルス応答画像データと負パルス応答画像データに区分することを含み、
前記画像においてテキストに関するエッジ情報と勾配情報を強調するステップは、
各方向に対する正パルス応答画像データと負パルス応答画像データに、対向する方向へのオフセット及び加算を実行して、各方向に対する第1の合成画像データを取得し、及び/又は、
各方向に対する正パルス応答画像データと負パルス応答画像データに、反対の方向へのオフセット及び加算を実行して、各方向に対する第2の合成画像データを取得することを含み、
前記強調されたエッジ情報と勾配情報に対応するテキスト筆画画像を取得するステップは、
予め設けられた第1の閾値を用いて各方向に対する第1の合成画像データ及び/又は第2の合成画像データに第1の2値化処理をそれぞれ行い、第1の2値化処理が行われた、各方向に対する第1の合成画像データに整合処理を行って第1の細い筆画画像データを取得することにより、前記第1の細い筆画画像データに対応する第1の細い筆画画像を取得し、及び/又は、第1の2値化処理が行われた、各方向に対する第2の合成画像データに整合処理を行って、対応する第2の細い筆画画像データを取得することにより、前記第2の細い筆画画像データに対応する第2の細い筆画画像を取得し、及び/又は、
予め設けられた、第1の閾値よりも小さい第2の閾値を用いて各方向に対する第1の合成画像データ及び/又は第2の合成画像データに第2の2値化処理をそれぞれ行い、第2の2値化処理が行われた、各方向に対する第1の合成画像データに整合処理を行って第1の太い筆画画像データを取得することにより、前記第1の太い筆画画像データに対応する第1の太い筆画画像を取得し、及び/又は、第2の2値化処理が行われた、各方向に対する第2の合成画像データに整合処理を行って、対応する第2の太い筆画画像データを取得することにより、前記第2の太い筆画画像データに対応する第2の太い筆画画像を取得することを含む、
付記2記載の方法。
(付記4)
前記整合処理は、積集合を求める処理と、最大値を求める処理と、平均値を求める処理との何れかを含む、
付記3記載の方法。
(付記5)
前記画像の複数の方向におけるエッジ情報と勾配情報を取得するための複数のソーベル演算子のコンボリューションカーネルを利用して前記画像の画像データと畳み込み演算をそれぞれ行うステップは、
画像の横方向、縦方向及び二つの対角線方向の四つの方向におけるエッジ情報と勾配情報を取得するための四つのソーベル演算子のコンボリューションカーネルを利用して前記画像の画像データと畳み込み演算をそれぞれ行うことを含む、
付記3又は4記載の方法。
(付記6)
前記対向する方向へのオフセット及び加算は、以下の式
Ih(x,y)=(Ih-positive(x,y-w/2)+Ih-negative(x,y+w/2))/2、
Iv(x,y)=(Iv-positive(x-w/2,y)+Iv-negative(x+w/2,y))/2、
Ird(x,y)=(Ird-positive(x+w/2,y-w/2)+Ird-negative(x-w/2,y+w/2))/2、及び
Ild(x,y)=(Ild-positive(x-w/2,y-w/2)+Ild-negative(x+w/2,y+w/2))/2、
に基づいて行われ、
前記の反対の方向へのオフセット及び加算は、以下の式
Ih’(x,y)=(Ih-positive(x,y+w/2)+Ih-negative(x,y-w/2))/2、
Iv’(x,y)=(Iv-positive(x+w/2,y)+Iv-negative(x-w/2,y))/2、
Ird’(x,y)=(Ird-positive(x-w/2,y+w/2)+Ird-negative(x+w/2,y-w/2))/2、及び
Ild’(x,y)=(Ild-positive(x+w/2,y+w/2)+Ild-negative(x-w/2,y-w/2))/2、
に基づいて行われ、
xは画素の横座標、yは前記画素の縦座標、Ih(x,y)、Iv(x,y)、Ird(x,y)とIld(x,y)は前記画素の横方向、縦方向、及び二つの対角線方向の四つの方向に対する第1の合成画像データをそれぞれ示し、
Ih’(x,y)、Iv’(x,y)、Ird’(x,y)及びIld’(x,y)は、前記画素の横方向、縦方向及び二つの対角線方向の四つの方向に対する第2の合成画像データをそれぞれ示し、
Ih-positive(x,y)、Iv-positive(x,y)、Ird-positive(x,y)及びIld-positive(x,y)は、前記画素の横方向、縦方向及び二つの対角線方向の四つの方向に対する正パルス応答画像データをそれぞれ示し、
Ih-negative(x,y)、Iv-negative(x,y)、Ird-negative(x,y)及びIld-negative(x,y)は、前記画素の横方向、縦方向及び二つの対角線方向の四つの方法に対する負パルス応答画像データをそれぞれ示し、wは予め推定された筆画幅である、
付記3乃至5の何れか記載の方法。
(付記7)
前記第1の太い筆画エッジ画像データと前記第2の太い筆画エッジ画像データにそれぞれ対応する第1の太い筆画画像と第2の太い筆画画像を取得するステップは、
予め設けられたフィルタリング条件を利用して前記第1の太い筆画エッジ画像データと前記第2の太い筆画エッジ画像データにおける連通領域データにフィルタリング処理をそれぞれ行うことにより、前記予め設けられたフィルタリング条件を満たす第1の連通領域の画像データと第2の連通領域の画像データを取得し、
前記第1の連通領域の画像データと前記第2の連通領域の画像データにそれぞれ対応する第1の太い筆画画像と第2の太い筆画画像を取得することを含む、
付記3乃至6の何れか記載の方法。
(付記8)
前記予め設けられたフィルタリング条件は、少なくとも、
前記連通領域内の画素の階調分散が予め設けられた分散の閾値よりも小さい条件と、
前記連通領域内の内側エッジから外側エッジまでの画素極性が一致する条件と、
前記連通領域の大きさが予め設けられた大きさの閾値内にある条件と、
のうちの一つを含む、
付記7記載の方法。
(付記9)
テキスト筆画の精度とテキスト筆画のリコールレートとのうちの少なくとも一つに基づいて、前記第1の細い筆画画像と前記第2の細い筆画画像の何れかを最終的な細い筆画画像として選別し、及び/又は、前記第1の太い筆画画像と前記第2の太い筆画画像の何れかを最終的な太い筆画画像として選別することを更に含む、
付記3乃至8の何れか記載の方法。
(付記10)
画像からテキスト筆画画像を抽出する装置であって、
前記画像のエッジ情報と勾配情報を取得する情報取得手段と、
取得されたエッジ情報と勾配情報に予め設けられた強調処理を行うことにより、前記画像においてテキストに関するエッジ情報と勾配情報を強調する強調手段と、
強調されたエッジ情報と勾配情報に対応するテキスト筆画画像を取得する筆画画像取得手段と、
を備えることを特徴とする装置。
(付記11)
前記情報取得手段は、前記画像のエッジ情報と勾配情報を代表するステップ信号又はパルス信号を解析し、解析結果に基づいて前記エッジ情報と前記勾配情報を抽出する、
付記10記載の装置。
(付記12)
前記情報取得手段は、
画像の複数の方向におけるエッジ情報と勾配情報を取得するための複数のソーベル演算子のコンボリューションカーネルを利用して、前記画像の画像データと畳み込み演算をそれぞれ行う畳み込み演算サブ手段と、
各方向に対する畳み込み演算の結果を各方向に対する正パルス応答画像データと負パルス応答画像データに区分する区分サブ手段とを備え、
前記強調手段は、
各方向に対する正パルス応答画像データと負パルス応答画像データに、対向する方向へのオフセット及び加算を実行して、各方向に対する第1の合成画像データを取得する第1の合成画像取得サブ手段、及び/又は、
各方向に対する正パルス応答画像データと負パルス応答画像データに、反対の方向へのオフセット及び加算を実行して、各方向に対する第2の合成画像データを取得する第2の合成画像取得サブ手段を備え、
前記筆画画像取得手段は、
予め設けられた第1の閾値を用いて各方向に対する第1の合成画像データ及び/又は第2の合成画像データに第1の2値化処理をそれぞれ行う第1の2値化処理サブ手段と、第1の2値化処理が行われた、各方向に対する第1の合成画像データに整合処理を行って第1の細い筆画画像データを取得することにより、前記第1の細い筆画画像データに対応する第1の細い筆画画像を取得する第1の細い筆画画像取得サブ手段と、及び/又は、第1の2値化処理が行われた、各方向に対する第2の合成画像データに整合処理を行って、対応する第2の細い筆画画像データを取得することにより、前記第2の細い筆画画像データに対応する第2の細い筆画画像を取得する第2の細い筆画画像取得サブ手段と、及び/又は、
予め設けられた、第1の閾値よりも小さい第2の閾値を用いて各方向に対する第1の合成画像データ及び/又は第2の合成画像データに第2の2値化処理をそれぞれ行う第2の2値化処理サブ手段と、第2の2値化処理が行われた、各方向に対する第1の合成画像データに整合処理を行って第1の太い筆画画像データを取得することにより、前記第1の太い筆画画像データに対応する第1の太い筆画画像を取得する第1の太い筆画画像取得サブ手段と、及び/又は、第2の2値化処理が行われた、各方向に対する第2の合成画像データに整合処理を行って、対応する第2の太い筆画画像データを取得することにより、前記第2の太い筆画画像データに対応する第2の太い筆画画像を取得する第2の太い筆画画像取得サブ手段とを備える、
付記11記載の装置。
(付記13)
前記整合処理は、積集合を求める処理と、最大値を求める処理と、平均値を求める処理との何れかを含む、
付記12記載の装置。
(付記14)
前記畳み込み演算サブ手段は、画像の横方向、縦方向及び二つの対角線方向の四つの方向におけるエッジ情報と勾配情報を取得するための四つのソーベル演算子のコンボリューションカーネルを利用して前記画像の画像データと畳み込み演算をそれぞれ行う、付記12又は13記載の装置。
(付記15)
前記対向する方向へのオフセット及び加算は、以下の式
Ih(x,y)=(Ih-positive(x,y-w/2)+Ih-negative(x,y+w/2))/2、
Iv(x,y)=(Iv-positive(x-w/2,y)+Iv-negative(x+w/2,y))/2、
Ird(x,y)=(Ird-positive(x+w/2,y-w/2)+Ird-negative(x-w/2,y+w/2))/2、及び
Ild(x,y)=(Ild-positive(x-w/2,y-w/2)+Ild-negative(x+w/2,y+w/2))/2、
に基づいて行われ、
前記の反対する方向へのオフセット及び加算は、以下の式
Ih’(x,y)=(Ih-positive(x,y+w/2)+Ih-negative(x,y-w/2))/2、
Iv’(x,y)=(Iv-positive(x+w/2,y)+Iv-negative(x-w/2,y))/2、
Ird’(x,y)=(Ird-positive(x-w/2,y+w/2)+Ird-negative(x+w/2,y-w/2))/2、及び
Ild’(x,y)=(Ild-positive(x+w/2,y+w/2)+Ild-negative(x-w/2,y-w/2))/2、
に基づいて行われ、
xは画素の横座標、yは前記画素の縦座標、Ih(x,y)、Iv(x,y)、Ird(x,y)及びIld(x,y)は、前記画素の横方向、縦方向、及び二つの対角線方向の四つの方向に対する第1の合成画像データをそれぞれ示し、
Ih’(x,y)、Iv’(x,y)、Ird’(x,y)及びIld’(x,y)は、前記画素の横方向、縦方向及び二つの対角線方向の四つの方向に対する第2の合成画像データをそれぞれ示し、
Ih-positive(x,y)、Iv-positive(x,y)、Ird-positive(x,y)及びIld-positive(x,y)は、前記画素の横方向、縦方向及び二つの対角線方向の四つの方向に対する正パルス応答画像データをそれぞれ示し、
Ih-negative(x,y)、Iv-negative(x,y)、Ird-negative(x,y)及びIld-negative(x,y)は、前記画素の横方向、縦方向及び二つの対角線方向の四つの方法に対する負パルス応答画像データをそれぞれ示し、wは予め推定された筆画幅である、
付記12乃至14の何れか記載の装置。
(付記16)
前記筆画画像取得手段は、更に、予め設けられたフィルタリング条件を利用して前記第1の太い筆画エッジ画像データと前記第2の太い筆画エッジ画像データにおける連通領域データにフィルタリング処理をそれぞれ行うことにより、前記予め設けられたフィルタリング条件を満たす第1の連通領域の画像データと第2の連通領域の画像データを取得するフィルタリングサブ手段を備える、
付記12乃至15の何れか記載の装置。
(付記17)
前記予め設けられたフィルタリング条件は、少なくとも、前記連通領域内の画素の階調分散が予め設けられた分散の閾値よりも小さい条件と、前記連通領域内の内側エッジから外側エッジまでの画素極性が一致である条件と、前記連通領域の大きさが予め設けられた大きさの閾値内にある条件と、のうちの一つを含む、
付記16記載の装置。
(付記18)
テキスト筆画の精度とテキスト筆画のリコールレートとのうちの少なくとも一つに基づいて、前記第1の細い筆画画像と前記第2の細い筆画画像の何れかを最終的な細い筆画画像として選別し、及び/又は、前記第1の太い筆画画像と前記第2の太い筆画画像の何れかを最終的な太い筆画画像として選別する選別手段を更に備える、
付記12乃至17の何れか記載の装置。
(付記19)
コンピュータに、付記1乃至9の何れか記載の、画像からテキスト筆画画像を抽出する方法を実行させるための命令を含むコンピュータプログラム。
(付記20)
付記19記載のコンピュータプログラムを記録したコンピュータ読み取り可能な記録媒体。
【符号の説明】
【0126】
400:画像からテキスト筆画画像を抽出する装置
402:情報取得手段
404:強調手段
406:筆画画像取得手段
400’:画像からテキスト筆画画像を抽出する装置
402’:情報取得手段
4022:畳込み演算サブ手段
4024:区分サブ手段
404’:強調手段
4042:第1の合成画像取得サブ手段
4044:第2の合成画像取得サブ手段
406’:筆画画像取得手段
4062:第1の2値化処理サブ手段
4064:第1の細い筆画画像取得サブ手段
4066:第2の細い筆画画像取得サブ手段
4068:第2の2値化処理サブ手段
40610:第1の太い筆画画像取得サブ手段
40612:第2の太い筆画画像取得サブ手段
【特許請求の範囲】
【請求項1】
画像からテキスト筆画画像を抽出する方法であって、
前記画像のエッジ情報と勾配情報を取得するステップと、
取得されたエッジ情報と勾配情報に予め設けられた強調処理を行うことにより、前記画像においてテキストに関するエッジ情報と勾配情報を強調するステップと、
強調されたエッジ情報と勾配情報に対応するテキスト筆画画像を取得するステップと、
を含むことを特徴とする方法。
【請求項2】
前記画像のエッジ情報と勾配情報を取得するステップは、
前記画像のエッジ情報と勾配情報を代表するステップ信号又はパルス信号を解析し、解析結果に基づいて前記エッジ情報と前記勾配情報を抽出することを含む、
請求項1記載の方法。
【請求項3】
前記画像のエッジ情報と勾配情報を取得するステップは、
画像の複数の方向におけるエッジ情報と勾配情報を取得するための複数のソーベル演算子のコンボリューションカーネルを利用して、前記画像の画像データと畳み込み演算をそれぞれ行い、
各方向に対する畳み込み演算の結果を各方向に対する正パルス応答画像データと負パルス応答画像データに区分することを含み、
前記画像においてテキストに関するエッジ情報と勾配情報を強調するステップは、
各方向に対する正パルス応答画像データと負パルス応答画像データに、対向する方向へのオフセット及び加算を実行して、各方向に対する第1の合成画像データを取得し、及び/又は、
各方向に対する正パルス応答画像データと負パルス応答画像データに、反対の方向へのオフセット及び加算を実行して、各方向に対する第2の合成画像データを取得することを含み、
前記強調されたエッジ情報と勾配情報に対応するテキスト筆画画像を取得するステップは、
予め設けられた第1の閾値を用いて各方向に対する第1の合成画像データ及び/又は第2の合成画像データに第1の2値化処理をそれぞれ行い、第1の2値化処理が行われた、各方向に対する第1の合成画像データに整合処理を行って第1の細い筆画画像データを取得することにより、前記第1の細い筆画画像データに対応する第1の細い筆画画像を取得し、及び/又は、第1の2値化処理が行われた、各方向に対する第2の合成画像データに整合処理を行って、対応する第2の細い筆画画像データを取得することにより、前記第2の細い筆画画像データに対応する第2の細い筆画画像を取得し、及び/又は、
予め設けられた、第1の閾値よりも小さい第2の閾値を用いて各方向に対する第1の合成画像データ及び/又は第2の合成画像データに第2の2値化処理をそれぞれ行い、第2の2値化処理が行われた、各方向に対する第1の合成画像データに整合処理を行って第1の太い筆画画像データを取得することにより、前記第1の太い筆画画像データに対応する第1の太い筆画画像を取得し、及び/又は、第2の2値化処理が行われた、各方向に対する第2の合成画像データに整合処理を行って、対応する第2の太い筆画画像データを取得することにより、前記第2の太い筆画画像データに対応する第2の太い筆画画像を取得することを含む、
請求項2記載の方法。
【請求項4】
前記整合処理は、積集合を求める処理と、最大値を求める処理と、平均値を求める処理との何れかを含む、
請求項3記載の方法。
【請求項5】
前記画像の複数の方向におけるエッジ情報と勾配情報を取得するための複数のソーベル演算子のコンボリューションカーネルを利用して前記画像の画像データと畳み込み演算をそれぞれ行うステップは、
画像の横方向、縦方向及び二つの対角線方向の四つの方向におけるエッジ情報と勾配情報を取得するための四つのソーベル演算子のコンボリューションカーネルを利用して前記画像の画像データと畳み込み演算をそれぞれ行うことを含む、
請求項3又は4記載の方法。
【請求項6】
前記対向する方向へのオフセット及び加算は、以下の式
Ih(x, y) = (Ih-positive(x, y-w/2) + Ih-negative(x, y+w/2))/2、
Iv(x, y) = (Iv-positive(x-w/2, y) + Iv-negative(x+w/2, y))/2、
Ird(x, y) = (Ird-positive(x+w/2, y-w/2) + Ird-negative(x-w/2, y+w/2))/2、及び
Ild(x, y) = (Ild-positive(x-w/2, y-w/2) + Ild-negative(x+w/2, y+w/2))/2、
に基づいて行われ、
前記の反対の方向へのオフセット及び加算は、以下の式
Ih’(x, y) = (Ih-positive(x, y+w/2) + Ih-negative(x, y-w/2))/2、
Iv’(x, y) = (Iv-positive(x+w/2, y) + Iv-negative(x-w/2, y))/2、
Ird’(x, y) = (Ird-positive(x-w/2, y+w/2) + Ird-negative(x+w/2, y-w/2))/2、及び
Ild’(x, y) = (Ild-positive(x+w/2, y+w/2) + Ild-negative(x-w/2, y-w/2))/2、
に基づいて行われ、
xは画素の横座標、yは前記画素の縦座標、Ih(x, y)、Iv(x, y)、Ird(x, y)とIld(x, y)は前記画素の横方向、縦方向、及び二つの対角線方向の四つの方向に対する第1の合成画像データをそれぞれ示し、
Ih’(x, y)、Iv’(x, y)、Ird’(x, y)及びIld’(x, y)は、前記画素の横方向、縦方向及び二つの対角線方向の四つの方向に対する第2の合成画像データをそれぞれ示し、
Ih-positive(x, y)、Iv-positive(x, y)、Ird-positive(x, y)及びIld-positive(x, y)は、前記画素の横方向、縦方向及び二つの対角線方向の四つの方向に対する正パルス応答画像データをそれぞれ示し、
Ih-negative(x, y)、Iv-negative(x, y)、Ird-negative(x, y)及びIld-negative(x, y)は、前記画素の横方向、縦方向及び二つの対角線方向の四つの方法に対する負パルス応答画像データをそれぞれ示し、wは予め推定された筆画幅である、
請求項3乃至5の何れか記載の方法。
【請求項7】
前記第1の太い筆画エッジ画像データと前記第2の太い筆画エッジ画像データにそれぞれ対応する第1の太い筆画画像と第2の太い筆画画像を取得するステップは、
予め設けられたフィルタリング条件を利用して前記第1の太い筆画エッジ画像データと前記第2の太い筆画エッジ画像データにおける連通領域データにフィルタリング処理をそれぞれ行うことにより、前記予め設けられたフィルタリング条件を満たす第1の連通領域の画像データと第2の連通領域の画像データを取得し、
前記第1の連通領域の画像データと前記第2の連通領域の画像データにそれぞれ対応する第1の太い筆画画像と第2の太い筆画画像を取得することを含む、
請求項3乃至6の何れか記載の方法。
【請求項8】
前記予め設けられたフィルタリング条件は、少なくとも、
前記連通領域内の画素の階調分散が予め設けられた分散の閾値よりも小さい条件と、
前記連通領域内の内側エッジから外側エッジまでの画素極性が一致する条件と、
前記連通領域の大きさが予め設けられた大きさの閾値内にある条件と、
のうちの一つを含む、
請求項7記載の方法。
【請求項9】
テキスト筆画の精度とテキスト筆画のリコールレートとのうちの少なくとも一つに基づいて、前記第1の細い筆画画像と前記第2の細い筆画画像の何れかを最終的な細い筆画画像として選別し、及び/又は、前記第1の太い筆画画像と前記第2の太い筆画画像の何れかを最終的な太い筆画画像として選別することを更に含む、
請求項3乃至8の何れか記載の方法。
【請求項10】
画像からテキスト筆画画像を抽出する装置であって、
前記画像のエッジ情報と勾配情報を取得する情報取得手段と、
取得されたエッジ情報と勾配情報に予め設けられた強調処理を行うことにより、前記画像においてテキストに関するエッジ情報と勾配情報を強調する強調手段と、
強調されたエッジ情報と勾配情報に対応するテキスト筆画画像を取得する筆画画像取得手段と、
を備えることを特徴とする装置。
【請求項1】
画像からテキスト筆画画像を抽出する方法であって、
前記画像のエッジ情報と勾配情報を取得するステップと、
取得されたエッジ情報と勾配情報に予め設けられた強調処理を行うことにより、前記画像においてテキストに関するエッジ情報と勾配情報を強調するステップと、
強調されたエッジ情報と勾配情報に対応するテキスト筆画画像を取得するステップと、
を含むことを特徴とする方法。
【請求項2】
前記画像のエッジ情報と勾配情報を取得するステップは、
前記画像のエッジ情報と勾配情報を代表するステップ信号又はパルス信号を解析し、解析結果に基づいて前記エッジ情報と前記勾配情報を抽出することを含む、
請求項1記載の方法。
【請求項3】
前記画像のエッジ情報と勾配情報を取得するステップは、
画像の複数の方向におけるエッジ情報と勾配情報を取得するための複数のソーベル演算子のコンボリューションカーネルを利用して、前記画像の画像データと畳み込み演算をそれぞれ行い、
各方向に対する畳み込み演算の結果を各方向に対する正パルス応答画像データと負パルス応答画像データに区分することを含み、
前記画像においてテキストに関するエッジ情報と勾配情報を強調するステップは、
各方向に対する正パルス応答画像データと負パルス応答画像データに、対向する方向へのオフセット及び加算を実行して、各方向に対する第1の合成画像データを取得し、及び/又は、
各方向に対する正パルス応答画像データと負パルス応答画像データに、反対の方向へのオフセット及び加算を実行して、各方向に対する第2の合成画像データを取得することを含み、
前記強調されたエッジ情報と勾配情報に対応するテキスト筆画画像を取得するステップは、
予め設けられた第1の閾値を用いて各方向に対する第1の合成画像データ及び/又は第2の合成画像データに第1の2値化処理をそれぞれ行い、第1の2値化処理が行われた、各方向に対する第1の合成画像データに整合処理を行って第1の細い筆画画像データを取得することにより、前記第1の細い筆画画像データに対応する第1の細い筆画画像を取得し、及び/又は、第1の2値化処理が行われた、各方向に対する第2の合成画像データに整合処理を行って、対応する第2の細い筆画画像データを取得することにより、前記第2の細い筆画画像データに対応する第2の細い筆画画像を取得し、及び/又は、
予め設けられた、第1の閾値よりも小さい第2の閾値を用いて各方向に対する第1の合成画像データ及び/又は第2の合成画像データに第2の2値化処理をそれぞれ行い、第2の2値化処理が行われた、各方向に対する第1の合成画像データに整合処理を行って第1の太い筆画画像データを取得することにより、前記第1の太い筆画画像データに対応する第1の太い筆画画像を取得し、及び/又は、第2の2値化処理が行われた、各方向に対する第2の合成画像データに整合処理を行って、対応する第2の太い筆画画像データを取得することにより、前記第2の太い筆画画像データに対応する第2の太い筆画画像を取得することを含む、
請求項2記載の方法。
【請求項4】
前記整合処理は、積集合を求める処理と、最大値を求める処理と、平均値を求める処理との何れかを含む、
請求項3記載の方法。
【請求項5】
前記画像の複数の方向におけるエッジ情報と勾配情報を取得するための複数のソーベル演算子のコンボリューションカーネルを利用して前記画像の画像データと畳み込み演算をそれぞれ行うステップは、
画像の横方向、縦方向及び二つの対角線方向の四つの方向におけるエッジ情報と勾配情報を取得するための四つのソーベル演算子のコンボリューションカーネルを利用して前記画像の画像データと畳み込み演算をそれぞれ行うことを含む、
請求項3又は4記載の方法。
【請求項6】
前記対向する方向へのオフセット及び加算は、以下の式
Ih(x, y) = (Ih-positive(x, y-w/2) + Ih-negative(x, y+w/2))/2、
Iv(x, y) = (Iv-positive(x-w/2, y) + Iv-negative(x+w/2, y))/2、
Ird(x, y) = (Ird-positive(x+w/2, y-w/2) + Ird-negative(x-w/2, y+w/2))/2、及び
Ild(x, y) = (Ild-positive(x-w/2, y-w/2) + Ild-negative(x+w/2, y+w/2))/2、
に基づいて行われ、
前記の反対の方向へのオフセット及び加算は、以下の式
Ih’(x, y) = (Ih-positive(x, y+w/2) + Ih-negative(x, y-w/2))/2、
Iv’(x, y) = (Iv-positive(x+w/2, y) + Iv-negative(x-w/2, y))/2、
Ird’(x, y) = (Ird-positive(x-w/2, y+w/2) + Ird-negative(x+w/2, y-w/2))/2、及び
Ild’(x, y) = (Ild-positive(x+w/2, y+w/2) + Ild-negative(x-w/2, y-w/2))/2、
に基づいて行われ、
xは画素の横座標、yは前記画素の縦座標、Ih(x, y)、Iv(x, y)、Ird(x, y)とIld(x, y)は前記画素の横方向、縦方向、及び二つの対角線方向の四つの方向に対する第1の合成画像データをそれぞれ示し、
Ih’(x, y)、Iv’(x, y)、Ird’(x, y)及びIld’(x, y)は、前記画素の横方向、縦方向及び二つの対角線方向の四つの方向に対する第2の合成画像データをそれぞれ示し、
Ih-positive(x, y)、Iv-positive(x, y)、Ird-positive(x, y)及びIld-positive(x, y)は、前記画素の横方向、縦方向及び二つの対角線方向の四つの方向に対する正パルス応答画像データをそれぞれ示し、
Ih-negative(x, y)、Iv-negative(x, y)、Ird-negative(x, y)及びIld-negative(x, y)は、前記画素の横方向、縦方向及び二つの対角線方向の四つの方法に対する負パルス応答画像データをそれぞれ示し、wは予め推定された筆画幅である、
請求項3乃至5の何れか記載の方法。
【請求項7】
前記第1の太い筆画エッジ画像データと前記第2の太い筆画エッジ画像データにそれぞれ対応する第1の太い筆画画像と第2の太い筆画画像を取得するステップは、
予め設けられたフィルタリング条件を利用して前記第1の太い筆画エッジ画像データと前記第2の太い筆画エッジ画像データにおける連通領域データにフィルタリング処理をそれぞれ行うことにより、前記予め設けられたフィルタリング条件を満たす第1の連通領域の画像データと第2の連通領域の画像データを取得し、
前記第1の連通領域の画像データと前記第2の連通領域の画像データにそれぞれ対応する第1の太い筆画画像と第2の太い筆画画像を取得することを含む、
請求項3乃至6の何れか記載の方法。
【請求項8】
前記予め設けられたフィルタリング条件は、少なくとも、
前記連通領域内の画素の階調分散が予め設けられた分散の閾値よりも小さい条件と、
前記連通領域内の内側エッジから外側エッジまでの画素極性が一致する条件と、
前記連通領域の大きさが予め設けられた大きさの閾値内にある条件と、
のうちの一つを含む、
請求項7記載の方法。
【請求項9】
テキスト筆画の精度とテキスト筆画のリコールレートとのうちの少なくとも一つに基づいて、前記第1の細い筆画画像と前記第2の細い筆画画像の何れかを最終的な細い筆画画像として選別し、及び/又は、前記第1の太い筆画画像と前記第2の太い筆画画像の何れかを最終的な太い筆画画像として選別することを更に含む、
請求項3乃至8の何れか記載の方法。
【請求項10】
画像からテキスト筆画画像を抽出する装置であって、
前記画像のエッジ情報と勾配情報を取得する情報取得手段と、
取得されたエッジ情報と勾配情報に予め設けられた強調処理を行うことにより、前記画像においてテキストに関するエッジ情報と勾配情報を強調する強調手段と、
強調されたエッジ情報と勾配情報に対応するテキスト筆画画像を取得する筆画画像取得手段と、
を備えることを特徴とする装置。
【図1】
【図2】
【図3】
【図5A】
【図5B】
【図5C】
【図5D】
【図5E】
【図5F】
【図5G】
【図5H】
【図6A】
【図6B】
【図6C】
【図6D】
【図7A】
【図7B】
【図7C】
【図7D】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図4】
【図2】
【図3】
【図5A】
【図5B】
【図5C】
【図5D】
【図5E】
【図5F】
【図5G】
【図5H】
【図6A】
【図6B】
【図6C】
【図6D】
【図7A】
【図7B】
【図7C】
【図7D】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図4】
【公開番号】特開2012−252691(P2012−252691A)
【公開日】平成24年12月20日(2012.12.20)
【国際特許分類】
【出願番号】特願2012−110573(P2012−110573)
【出願日】平成24年5月14日(2012.5.14)
【出願人】(000005223)富士通株式会社 (25,993)
【Fターム(参考)】
【公開日】平成24年12月20日(2012.12.20)
【国際特許分類】
【出願日】平成24年5月14日(2012.5.14)
【出願人】(000005223)富士通株式会社 (25,993)
【Fターム(参考)】
[ Back to top ]