テキスト強調方法及び装置、並びにテキスト抽出方法及び装置
【課題】コンピュータが画像におけるテキストを強調する方法を提供する。
【解決手段】コンピュータが、少なくとも一行のテキストを含む原画像を取得する現画像取得ステップ、前記原画像における任意な原画素点からその近傍集合における各近傍画素点までの直接差異度及び間接差異度に基づいて、前記各原画素点の原輝度値又は/及び原色値に対して筆画二次元フィルタリングを行い、前記原画像のフィルタリング後の更新輝度値又は/及び更新色値を取得する更新値取得ステップ、及び、前記原画像のフィルタリング後の前記更新輝度値又は/及び更新色値により、対応する前記原輝度値又は及び原色値をそれぞれ置換し、前記原画像に対応するテキスト強調画像を生成する強調画像生成ステップを実行する。前記近傍集合の範囲は、前記原画素点を中心とし、且つ辺長がwである正方形となり、wは前記原画像の高さより小さい。
【解決手段】コンピュータが、少なくとも一行のテキストを含む原画像を取得する現画像取得ステップ、前記原画像における任意な原画素点からその近傍集合における各近傍画素点までの直接差異度及び間接差異度に基づいて、前記各原画素点の原輝度値又は/及び原色値に対して筆画二次元フィルタリングを行い、前記原画像のフィルタリング後の更新輝度値又は/及び更新色値を取得する更新値取得ステップ、及び、前記原画像のフィルタリング後の前記更新輝度値又は/及び更新色値により、対応する前記原輝度値又は及び原色値をそれぞれ置換し、前記原画像に対応するテキスト強調画像を生成する強調画像生成ステップを実行する。前記近傍集合の範囲は、前記原画素点を中心とし、且つ辺長がwである正方形となり、wは前記原画像の高さより小さい。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像処理に関し、特に、画像内のテキストを強調する方法及び装置、並びに画像内のテキストを抽出する方法及び装置に関する。
【背景技術】
【0002】
ビデオを再生する過程中、又は画像を観賞するときに、ビデオ又は画像には、往々テキスト説明が含まれる。そのテキスト説明は、例えば、ビデオ内のイベントの発生時間及び場所に対する説明や、画像の解釈などである。これらのテキスト内容はビデオ又は画像と密に関係するため、ビデオ又は画像におけるテキストの抽出は非常に重要な技術になる。
【0003】
従来技術では、ビデオ又は画像のテキストを抽出する方法は、二値化、又はエッジ色のクラスタリング及び検出技術を基礎として、画像又はビデオにおけるテキストを抽出することができる。
【0004】
しかしながら、従来技術でテキストを抽出する際に、ビデオ又は画像にノイズが多すぎ、画像又はビデオが不明瞭であり、ひいてはビデオの一部に照明変化が存在することにより、画像又はビデオ中のテキストと背景との境界が不明瞭になり、又はテキスト内容が不明瞭になり、テキストの抽出効果に影響を与える。
【0005】
したがって、如何に原画像又はビデオ中のテキストに対して強調処理を行って、画像又はビデオ中のテキストを強調し、さらにテキスト抽出の効果を最適化するかについては、従来技術での解決すべき問題になる。
【発明の概要】
【発明が解決しようとする課題】
【0006】
本発明の目的は、上述の問題を鑑み、原画像中のテキストがより明瞭になり、さらにテキスト抽出の効果を最適化可能になるように、少なくとも一行のテキストを含む原画像中のテキストに対して強調処理を行えるテキスト強調方法及び装置、並びにテキスト抽出方法及び装置を提供することにある。
【課題を解決するための手段】
【0007】
本発明の一実施例によれば、コンピュータが画像におけるテキストを強調する方法が提供される。この方法において、前記コンピュータは、少なくとも一行のテキストを含む原画像を取得する現画像取得ステップ、前記原画像における任意な原画素点からその近傍集合における各近傍画素点までの直接差異度及び間接差異度に基づいて、前記各原画素点の原輝度値又は/及び原色値に対して筆画二次元フィルタリングを行い、前記原画像のフィルタリング後の更新輝度値又は/及び更新色値を取得する更新値取得ステップ、及び、前記原画像のフィルタリング後の前記更新輝度値又は/及び更新色値により、対応する前記原輝度値又は及び原色値をそれぞれ置換し、前記原画像に対応するテキスト強調画像を生成する強調画像生成ステップを実行する。また、前記近傍集合の範囲は、前記原画素点を中心とし、且つ辺長がwである正方形となり、wは前記原画像の高さより小さい。
【発明の効果】
【0008】
本発明の実施例によれば、画像内のテキストを強調する方法及び装置、並びに画像内のテキストを抽出する方法及び装置を提供することができるという効果が得られる。
【図面の簡単な説明】
【0009】
【図1】本発明の一実施例による第1種のテキスト強調方法を示すフローチャートである。
【図2】第1種のテキスト強調方法におけるステップS102を示すフローチャートである。
【図3】本発明の一実施例による第2種のテキスト強調方法を示すフローチャートである。
【図4】第2種のテキスト強調方法におけるステップS302を示すフローチャートである。
【図5】第2種のテキスト強調方法におけるステップS302を示す他のフローチャートである。
【図6】第2種のテキスト強調方法におけるステップS302を示す他のフローチャートである。
【図7】第2種のテキスト強調方法におけるステップS302を示す他のフローチャートである。
【図8】第2種のテキスト強調方法におけるステップS304を示すフローチャートである。
【図9】本発明の一実施例による第1種のテキスト強調装置を示す模式図である。
【図10】第1種のテキスト強調装置におけるフィルタモジュール902を示す模式図である。
【図11】本発明の一実施例による第2種のテキスト強調装置を示す模式図である。
【図12】第2種のテキスト強調装置における筆画極性推定モジュール1101を示す模式図である。
【図13】第2種のテキスト強調装置における筆画極性推定モジュール1101を示す他の模式図である。
【図14】第2種のテキスト強調装置における筆画極性推定モジュール1101を示す他の模式図である。
【図15】第2種のテキスト強調装置における筆画極性推定モジュール1101を示す他の模式図である。
【図16】第2種のテキスト強調装置における判断モジュール1102を示す模式図である。
【図17】本発明の一実施例によるテキスト抽出方法を示すフローチャートである。
【図18】本発明の一実施例によるテキスト抽出装置を示す模式図である。
【図19】本発明の一実施例による、情報処理装置としてのコンピュータの模式的な構造を示すブロック図である。
【発明を実施するための形態】
【0010】
以下、図面を参照しながら本発明の実施例を詳細に説明する。
【0011】
図1は、本発明の一実施例による第1種のテキスト強調方法を示すフローチャートである。図1に示すように、第1種のテキスト強調方法は、具体的に以下のステップを含む。なお、この第1種のテキスト強調方法は、例えば、コンピュータにより実行されてもよい。
【0012】
S101:少なくとも一行のテキストを含む原画像を取得する。
【0013】
本発明の実施例においては、上述のテキスト強調とは、少なくとも一行のテキストを含む原画像中のテキストに対して強調処理を行うことを指す。ここでの強調は、テキストのエッジを深めること、又は、テキストと背景との区別を際立たせることであると理解することができる。また、本発明の実施例は、応用されるときに、筆画内部の画素の一致性を強調するとともに、テキストと背景との差異度を深める効果を達するように、テキストの外観(例えば、輝度又は色等)及びその形状(例えば、テキストがしま模様となる)情報を考慮した。
【0014】
S102:原画像における任意な原画素点からその近傍集合(neighborhood set)における各近傍画素点までの直接差異度と間接差異度に基づいて、各原画素点の原輝度値又は/及び原色値に対して筆画二次元フィルタリングを行って、原画像のフィルタリング後の更新された更新輝度値又は/及び更新色値を取得する。近傍集合の範囲は、原画素点を中心とし、且つ辺長がwである正方形となり、wは原画像の高さよりも小さい。
【0015】
本ステップでの直接差異度は任意な原画素点がその近傍集合における各領域画素点との直接外観差異、例えば色又は輝度の差異を示し、間接差異度は原画素点からその近傍集合における各領域画素点まで経由した画素のグラジエントモジュール(gradient module)を示す。直接差異度と間接差異度により各原画素点の原輝度値又は/及び原色値に対して筆画二次元フィルタリングを行って、原画像のフィルタリング後の更新された更新輝度値又は/及び更新色値を取得することができる。なお、ここでの近傍集合は、原画素点を中心とし、且つwを辺長とする正方形を取るように取得可能である。なお、wは、原画像の高さより小さく、原画像の高さの8分の1をとることが好ましい。
【0016】
図2は、第1種のテキスト強調方法におけるステップS102を示すフローチャートである。実際の応用においては、図2に示すように、上述のS102は、具体的に以下の内容を含む。
【0017】
S201:原画素点と各近傍画素点との原輝度値又は/及び原色値に対して代数的減算を行って、直接差異度を取得する。
【0018】
本実施例において、D1(i,j)で画素iとjの直接差異度を示すと、以下の式(1)により輝度値の直接差異度を算出することができる。
【数1】
【0019】
ただし、f’(i)は目標画素の近傍集合における各近傍画素の輝度の平均値を示し、即ち、目標画素の画素値の代わりに近傍画素の画素値の平均値を用いて直接差異度を算出する。σ(i)は画素iの周りの局所輝度標準偏差を示し、正規化に役立つことができる。
【0020】
また、以下の式(2)により画素iとjの輝度値の直接差異度を算出することもできる。
【数2】
【0021】
ただし、f(i)は目標画素の近傍集合における各近傍画素の輝度の平均値を示す。
【0022】
ここで説明すべきは、画素iとjの色値の直接差異度を算出する時に、以下の式(3)又は(4)をそれぞれ採用することもできる。
【数3】
【数4】
【0023】
式(3)及び(4)中のnは画素の色情報としてのRチャネル、Gチャネル及びBチャネルを示す。ここで説明すべきは、上述の直接差異度を算出する式は、ただ例示的なものである。当業者は上述の式に対して適応的な変更を行うことができる。
【0024】
S202:原画素点からその近傍集合の各近傍画素点までのグラジエントモジュールに基づいて、間接差異度を取得する。
【0025】
なお、本実施例において、D2(i,j)で画素iとjの間接差異度を示すと、以下の式(5)により画素iとjの輝度値の間接差異度を算出することができる。
【数5】
【0026】
ただし、
【数6】
は、iからjへの方向に沿う、画素lにおけるグラジエントモジュールを示す。式(5)におけるbと式(1)におけるaはともに予め設定された所定のパラメータである。フィルタリングの平滑程度を制御するように両者の単調性が一致している。
【0027】
もちろん、実際の応用において、式(5)における最大勾配値の代わりに、iからjまで経由した画素の輝度の最大及び最小の勾配値の差を用いて算出することもできる。算出方法は以下の式(6)に示す。
【数7】
【0028】
ただし、Maxは勾配値の最大値を示し、minは勾配値の最小値を示す。
【0029】
また、画素iとjの色値の間接差異度については、以下の式(7)及び式(8)でそれぞれ算出することもできる。
【数8】
【数9】
【0030】
nは画素の色情報としてのRチャネル、Gチャネル及びBチャネルを示す。ここで説明すべきは、上述の間接差異度を算出する式は、ただ例示的なものである。当業者は上述の式に対して適応的な変更を行うことができる。
【0031】
S203:直接差異度及び間接差異度に基づいて、原画素点に対する各近傍画素点の輝度値又は/及び色値の重み値を算出する。
【0032】
間接差異度及び直接差異度を取得した後に、以下の式(9)で重み値を算出することができる。
【数10】
【0033】
ただし、D1(i,j)は画素iとjの輝度及び/又は色値の直接差異度を示し、D2(i,j)は画素iとjの輝度及び/又は色値の間接差異度を示す。なお、w(i,j)は輝度の重み値を示し、wn(i,j)は色値の重み値を示す。
【0034】
S204:以下の筆画二次元フィルタ式(10)で原画素点の更新輝度値を算出する。
【数11】
【0035】
ただし、N(i)は画素点iの近傍集合を示し、w(i,j)は原画素点iに対する近傍画素点jの輝度値の重み値を示す。f(j)は近傍集合内の画素点jの輝度値である。
【0036】
S205:以下の筆画二次元フィルタ式(11)で原画素点の更新色値を算出する。
【数12】
【0037】
ただし、wn(i,j)はnチャネルにおいて原画素点iに対する近傍画素点jの色値の重み値を示し、fn(j)はnチャネルにおいて前記近傍集合内の画素点jの色値である。
【0038】
ここで説明すべきは、ステップS204及びS205は、更新輝度値及び更新色値をそれぞれ算出するため、実際の応用においてそのうちの任意の一つのステップを選択して実行し、又は二つのステップを同時に実行することにより、本実施例を実現することができる。
【0039】
再び図1を参照する。
【0040】
S103:フィルタリングした更新輝度値又は/及び更新色値で、対応する前記原輝度値又は/及び原色値をそれぞれ置換して、前記原画像に対応するテキスト強調画像を生成する。
【0041】
フィルタリングされた後の更新輝度値又は/及び更新色値を取得した後に、更新輝度値又は/及び更新色値で、原輝度値又は/及び原色値をそれぞれ置換する。このように置換された後、原画像における画素点中のテキスト筆画が強調され、さらに、筆画内部の画素の一致性が強調され、テキストと背景の差異度が深まった。
【0042】
図3は、本発明の一実施例による第2種のテキスト強調方法を示すフローチャートである。図3に示すように、第2種のテキスト強調方法は、具体的に以下のステップを含む。なお、この第2種のテキスト強調方法は、例えば、コンピュータにより実行されてもよい。
【0043】
S301:少なくとも一行のテキストを含む原画像を取得する。
【0044】
S302:原画像におけるテキストの筆画極性を推定する。極性は、筆画領域内部に位置する画素点と、筆画領域外部に位置する画素点との間の輝度値又は/及び色値の大きさの関係を示す。
【0045】
実際の応用において、テキストの筆画強調は主にフィルタ技術、即ち、筆画外の周りの画素値で筆画内の目標画素値を強調するものを採用しているため、筆画内の目標画素点の周りのノイズ画素点が筆画強調の効果に悪影響を与えることになる。この影響は、細い筆画又は筆画の間隔を処理する際により明らかになる。このような品質下落を回避するために、本実施例において筆画極性推定が導入されている。本ステップで推定した筆画極性は、筆画領域内部の画素点と筆画領域外部の画素点との間の輝度値又は/及び色値の大きさの関係を示すことができる。
【0046】
図4は、第2種のテキスト強調方法におけるステップS302を示すフローチャートである。具体的には、極性が筆画領域内部の画素点と筆画領域外部の画素点との間の輝度値の大きさの関係を示す場合に、図4に示されたように、原画像におけるテキストの筆画極性を推定するステップは、以下の内容を含む。
【0047】
S401:水平方向、垂直方向及び二つの対角線方向(即ち、原画像の幅方向、高さ方向及び二つの対角線方向)において、以下の式(12)により筆画応答強度をそれぞれ算出する。
【数13】
【0048】
ただし、wは原画像の高さの8分の一であり、f(i)は画素点iの輝度値を示す。本ステップにより、水平方向、垂直方向及び二つの対角線方向上の四つの筆画応答強度を取得することができる。
【0049】
S402:算出した四つの筆画応答強度のうちの最大の筆画応答強度が以下の2つの条件、即ち、[f(i)−f(l)]と[f(i)−f(k)]の筆画極性が同じ、且つこの最大の筆画応答強度が予め設定された所定の閾値よりも大きいという2つの条件を満たしているか否かを判断する。肯定の場合に、ステップS403を実行する。否定の場合に、ステップS404を実行する。
【0050】
具体的な応用においては、テキスト筆画内部の画素点と背景画素点との輝度又は色値は一般的に反対なものであるため、[f(i)−f(l)]と[f(i)−f(k)]の極性が同じであれば、i画素点が筆画内部の画素点である可能性が高いことを示す。本ステップは、原画像におけるすべての画素点から、筆画内部の画素点である可能性のあるものを検出する。ここでの極性が同じであることは、i画素点の輝度値及び/又は色値が同時にl画素点及びk画素点より大きい、又は、i点の輝度値及び/又は色値が同時にl画素点及びk画素点より小さいことを示し、即ち、[f(i)−f(l)]と[f(i)−f(k)]が同時にゼロよりも大きい、又は、ゼロ以下であることを示す。筆画応答強度の所定の閾値は、実際の必要に応じて調整することができる。従って、本発明は、この所定の閾値の選択を限定しない。
【0051】
S403:[f(i)−f(l)]又は[f(i)−f(k)]の極性に基づいて、テキストの推定筆画極性を特定する。
【0052】
i画素点が上述の二つの条件を満たしていると、[f(i)−f(l)]又は[f(i)−f(k)]の極性に基づいて、テキスト内の推定筆画極性をp(i)として特定し、筆画内部の画素点と外部の画素点とを区分できれば、その値取りが任意である。例えば、テキスト筆画内部の画素点の輝度値が背景画像点の輝度値より低い場合に、p(i)を0に設定する。それ相応に、p(i)が1であることは、テキスト筆画内部の画素点の輝度値が背景画素点の輝度値以上であることを示す。
【0053】
S404:算出した筆画応答強度を大きさに従って順に選出し、ステップS402を実行する。
【0054】
最大の筆画応答強度が上述の二つの条件を満たしていない場合に、二番目の大きい筆画応答強度を選択してステップS402の判断ステップを実行し、上述の二つの条件を満たす筆画応答強度を取得するまで、これによって類推して筆画応答強度の大きさに従って順番に行う。又は、上述の四つの筆画応答強度がいずれも上述の二つの条件を満たさない場合に、前記画素点iを非筆画画素点とする。
【0055】
また、極性が筆画領域内部の画素点と筆画領域外部の画素点との間の輝度値の大きさの関係を示す場合に、他の実施形態もある。図5は、第2種のテキスト強調方法におけるステップS302を示す他のフローチャートである。図5に示されたように、原画像におけるテキストの筆画極性を推定するステップは、具体的に以下の内容を含む。
【0056】
S501:一つの方向において、上記式(12)により、原画像における各原画素点の筆画応答強度を算出する。この一つの方向は水平方向、垂直方向及び二つの対角線方向の何れかである。
【0057】
本ステップは、まず、水平方向、垂直方向及び二つの対角線方向の何れかにおいて筆画応答強度を算出する。
【0058】
S502:筆画応答強度が以下の二つの条件、即ち[f(i)−f(l)]と[f(i)−f(k)]との極性が同じ、且つこの筆画応答強度が予め設定された所定の閾値よりも大きいことを同時に満たしているか否かを判断する。肯定の場合に、ステップS503を実行する。否定の場合に、算出した筆画応答強度に対して処理を行わず、さらに演算を行っていない他の方向において、原画像における各原画素点の筆画応答強度を算出する。
【0059】
S503:[f(i)−f(l)]又は[f(i)−f(k)]の極性に基づいて、原画素点iの初期極性を特定する。
【0060】
算出した筆画応答強度が既に上記二つの条件を満たしている場合に、[f(i)−f(l)]又は[f(i)−f(k)]の極性に従って、原画素点iの初期極性を特定する。ここで特定した初期極性は、[f(i)−f(l)]又は[f(i)−f(k)]の極性と同じはずである。
【0061】
S504:四つの方向上の筆画応答強度の算出がすべて完了したか否かを判断する。肯定の場合に、ステップS505を実行する。否定の場合に、ステップS501を実行する。
【0062】
次に、水平方向、垂直方向及び二つの対角線方向の四つの方向上の筆画応答強度の算出がすべて完了したか否かを判断し、算出が完了していない場合に、筆画応答強度を算出していない方向の何れかを選択して、ステップS501を実行する必要がある。
【0063】
S505:四つの方向上の最大の筆画応答強度が対応する初期極性をテキストの推定筆画極性として特定する。
【0064】
四つの方向上の筆画応答強度の算出がすべて完了した場合に、上記二つの条件を満たしている筆画応答強度のうち、最大の筆画応答強度の対応する初期極性を選択して、上述のテキストの推定筆画極性を特定する。即ち、原画像におけるテキストの推定筆画極性は最大の筆画応答強度の対応する初期極性と同じである。
【0065】
図6は、第2種のテキスト強調方法におけるステップS302を示す他のフローチャートである。極性が筆画領域内部の画素点と筆画領域外部の画素点との間の色値の大きさの関係を示す場合に、原画像におけるテキストの筆画極性を推定するステップは、図6に示されたように、具体的に以下の内容を含む。
【0066】
S601:水平方向、垂直方向及び二つの対角線方向において以下の式(13)により、各チャネルの筆画応答強度をそれぞれ算出する。
【数14】
【0067】
ただし、wは原画像の高さの8分の一であり、fn(i)は画素点iのチャネルnにおける色値を示す。例えば、nチャネルがそれぞれRチャネル、Gチャネル及びBチャネルの場合に、筆画応答強度がRチャネル、Gチャネル及びBチャネルにおける筆画応答強度の合計である。
【0068】
S602:算出した各チャネルの四つの筆画応答強度のうち、最大の筆画応答強度が以下の二つの条件、即ち、チャネルnにおいて[fn(i)−fn(l)]と[fn(i)−fn(k)]との極性が何れも一致し、且つこの筆画応答強度が予め設定された所定の閾値より大きいことを満たしているか否かを判断する。肯定の場合に、ステップS603を実行し、否定の場合に、ステップS604を実行する。
【0069】
本ステップにおいて、任意のチャネルにおいても、[fn(i)−fn(l)]と[fn(i)−fn(k)]との極性が一致するという条件を満たす必要がある。
【0070】
S603:[fn(i)−fn(l)]又は[fn(i)−fn(k)]の極性に基づいて、テキストの推定筆画極性を特定する。
【0071】
S604:算出した筆画応答強度を大きさに従って順に選択して、ステップS602を実行する。
【0072】
最大の筆画応答強度が上記二つの条件を満たさない場合に、本ステップにおいて、ある筆画応答強度が前記二つの条件を満たすまで、大きさに従って順に、二番目、三番目及び四番目の筆画応答強度を選択してステップS602を実行する。又は、四つの筆画応答強度がいずれも上記二つの条件を満たさない場合に、画素点iを非筆画画素点とする。例えば、二番目の大きい筆画応答強度が既に上記二つの条件を満たしている場合に、筆画極性推定の流れを中止する。
【0073】
実際の応用において、極性が筆画領域内部の画素点と筆画領域外部の画素点の間の色値の大きさの関係を示す場合に、他の実施形態も存在する。図7は、第2種のテキスト強調方法におけるステップS302を示す他のフローチャートである。図7に示されたように、原画像におけるテキストの筆画極性を推定するステップは、以下の内容を含む。
【0074】
S701:一つの方向において、上記式(13)により、原画像における各原画素点の各チャネルの筆画応答強度を算出し、この一つの方向は水平方向、垂直方向及び二つの対角線方向の何れかである。
【0075】
S702:一つの方向における各チャネルの筆画応答強度が以下の二つの条件、即ち、チャネルnにおいて[fn(i)−fn(l)]と[fn(i)−fn(k)]との極性が一致し、且つこの筆画応答強度が予め設定された所定の閾値よりも大きいことを同時に満たしているか否かを判断する。肯定の場合に、ステップS703を実行する。否定の場合に、この方向において初期極性を設けない。
【0076】
S703:[fn(i)−fn(l)]又は[fn(i)−fn(k)]の極性に基づいて、原画素点iの初期極性を特定する。
【0077】
ステップS701で算出した一つの方向の筆画応答強度が上記二つの条件を満たしている場合に、原画素点iのこの方向における初期極性を、[fn(i)−fn(l)]又は[fn(i)−fn(k)]の極性と同じように設置する。
【0078】
S704:四つの方向上の筆画応答強度の算出がすべて完了したか否かを判断し、肯定の場合に、ステップS705を実行し、否定の場合に、ステップS701を実行する。
【0079】
S705:四つの方向上の最大の筆画応答強度が対応する初期極性を、テキストの推定筆画極性として特定する。
【0080】
四つの方向上の筆画応答強度の算出がすべて完了した場合に、四つの方向上の、上記二つの条件を満たしている筆画応答強度から、最大の筆画応答強度の対応する初期極性を選択して、上述のテキストの推定筆画極性とする。四つの方向上の筆画応答強度の算出がすべて完了していない場合に、さらに算出されていない方向の何れかを選択してステップS701を実行する。
【0081】
再び図3を参照する。
【0082】
S303:原画像における任意の原画素点からその近傍集合における各近傍画素点までの直接差異度及び間接差異度に基づいて、各原画素点の原輝度値又は/及び原色値に対して筆画二次元フィルタリングを行って、原画像のフィルタリング後の更新輝度値又は/及び更新色値を取得する。近傍集合の範囲は、原画素点を中心とし、且つ辺長がwである正方形となり、wが原画像の高さより小さい。
【0083】
本ステップの詳細については、本実施例の関連内容を参照することができるため、ここで省略される。ここで説明すべきは、本ステップはステップS302と同時に実行しても良く、又はステップS303を実行してから、ステップS302を実行しても良い。
【0084】
S304:原画像の各画素点に対して、フィルタリング後の更新輝度値又は/及び更新色値が上述の筆画極性と合わせるか否かを判断し、肯定の場合に、ステップS305を実行し、否定の場合に、置換を行わない。
【0085】
算出により筆画極性が得られ、及び筆画フィルタリングが行われた後に、順に原画像の各画素点のフィルタリング後の更新輝度値又は/及び更新色値が上述の筆画極性と合わせるか否いかを判断することができる。ある画素点のフィルタリング後の更新輝度値又は/及び更新色値が上述の筆画極性と合わせない場合に、この画素点の原輝度値又は/及び色値を置換せず、次の画素点のフィルタリング後の更新輝度値又は/及び更新色値が上述の筆画極性と合わせるか否かを判断し続ける。
【0086】
図8は、第2種のテキスト強調方法におけるステップS304を示すフローチャートである。図8に示されたように、前記ステップS304は具体的に、以下の内容を含む。
【0087】
S801:フィルタリング後の更新輝度値又は/及び更新色値と、原輝度値又は/及び原色値との第1の大きさの関係を取得する。
【0088】
まず、フィルタリング後の更新輝度値又は/及び更新色値と、原輝度値又は/及び原色値との第1の大きさの関係を取得する。ここでの第1の大きさの関係について、例えば、更新輝度値が原輝度値の輝度より明るい場合に、第1の大きさの関係は更新輝度値が原輝度値より大きいことであり、又は、例えば、更新色値が原色値より大きい場合に、第1の大きさの関係は、更新色値が原色値より大きいことである。この第1の大きさの関係は、更新輝度値又は/更新色値と、原輝度値又は/及び原色値とに対して代数的減算を行って取得することができる。
【0089】
S802:第1の大きさの関係が上述の筆画極性に示された第2の大きさの関係と合わせるか否かを判断する。
【0090】
上述の筆画極性が筆画内部の画素点の輝度値又は/及び色値と、筆画外部の画素点の輝度値又は/及び色値との大きさの関係を示すため、更新色値が原色値より大きい、且つ筆画極性が示す第2の大きさの関係も更新色値が原色値より大きいことである場合に、又は、更新色値が原色値より小さい、且つ筆画極性が示す第2の大きさの関係も更新色値が原色値より小さいことである場合に、第1の大きさの関係と、上述の筆画極性に示された第2の大きさの関係とが合わせると考えられる。逆に、第1の大きさの関係と、第2の大きさの関係とが合わせないと考えられる。
【0091】
再び図3を参照する。
【0092】
S305:フィルタリング後の更新輝度値又は/及び更新色値で、対応する原輝度値又は/及び原色値をそれぞれ置換して、原画像に対応するテキスト強調画像を生成する。
【0093】
第1の大きさの関係と、第2の大きさの関係とが合わせた場合に、フィルタリング後の更新輝度値又は/及び更新色値で、対応する原輝度値又は/及び原色値をそれぞれ置換することにより、原画像に対応するテキスト強調画像を取得することができる。本実施例は、筆画極性推定のステップにより、筆画極性がフィルタリング後の更新輝度値又は更新色値と合わせた場合に、さらにテキスト強調を行うようにすることができ、第1種のテキスト強調方法と比べてテキスト強調の効果がより顕著になり、後続のテキスト抽出の正確性の向上に寄与することができる。
【0094】
本発明の実施例による上述のテキスト強調方法によれば、取得されたテキスト強調画像中の画素点におけるテキスト筆画が強調され、筆画内部の画素の一致性が強調され、且つテキストと背景との差異度が深まれ、即ち原画像に含まれたテキストが強調された。これにより、後続のこのテキスト強調画像に対するテキスト抽出がより精度良く且つ正確になる。
【0095】
また、本発明の一実施例は、上述の第1種のテキスト強調方法に対応する第1種のテキスト強調装置を提供する。図9は、本発明の一実施例による第1種のテキスト強調装置を示す模式図である。
【0096】
図9に示されたように、第1種のテキスト強調装置は、少なくとも一行のテキストを含む原画像を取得するための取得モジュール901を備えることができる。
【0097】
さらに、第1種のテキスト強調装置は、図9に示されたように、原画像における任意な原画素点からその近傍集合における各近傍画素点までの直接差異度及び間接差異度に基づいて、各原画素点の原輝度値又は/及び原色値に対して筆画二次元フィルタリングを行って、原画像のフィルタリング後の更新輝度値又は/及び更新色値を取得するためのフィルタモジュール902を備えることができる。なお、近傍集合の範囲は、原画素点を中心とし、且つ辺長がwである正方形となり、前記wは原画像の高さより小さい。
【0098】
図10は、第1種のテキスト強調装置におけるフィルタモジュール902を示す模式図である。
【0099】
図10に示されたように、フィルタモジュール902は、
原画素点と各近傍画素点の原輝度値又は/及び原色値に対して代数的減算を行って、直接差異度を取得するようにするための第1の取得サブモジュール1001と、
原画素点からその近傍集合における各近傍画素点までのグラジエントモジュールに基づいて、間接差異度を取得するようにするための第2の取得サブモジュール1002と、
直接差異度と間接差異度とに基づいて、各近傍画素点の原画素点に対する輝度値又は/及び色値の重み値を算出するための重み算出サブモジュール1003と、
上述の筆画二次元フィルタ式(10)により、原画素点の更新輝度値を算出するための更新輝度値算出サブモジュール1004と、
上述の筆画二次元フィルタ式(11)により、原画素点の更新色値を算出するための更新色値算出サブモジュール1005と、を備えることができる。
【0100】
再び図9を参照する。第1種のテキスト強調装置は、フィルタリング後の更新輝度値又は/及び更新色値で、対応する原輝度値又は/及び色値をそれぞれ置換して、原画像に対応するテキスト強調画像を生成するための置換モジュール903を備えることができる。
【0101】
本発明の実施例による上述のテキスト強調装置によれば、フィルタリング後の更新輝度値又は/及び更新色値を取得した後に、更新輝度値又は/及び更新色値で、原輝度値又は/及び原色値をそれぞれ置換することにより、原画像における画素点中のテキスト筆画が強調され、さらに筆画内部の画素の一致性が強調され、且つテキストと背景の差異度が深まれ、これにより、後続のテキスト抽出のためによりよいテキスト強調画像を提供し、後続のテキスト抽出の正確性及び精度を向上することもできる。
【0102】
また、本発明の一実施例は、上述の第2種のテキスト強調方法に対応する第2種のテキスト強調装置を更に提供する。図11は、本発明の一実施例による第2種のテキスト強調装置を示す模式図である。
【0103】
図11に示されたように、第2種のテキスト強調装置は、少なくとも一行のテキストを含む原画像を取得するための取得モジュール901と、原画像におけるテキストの筆画極性を推定するための筆画極性推定モジュール1101とを備えることができる。ここで、極性は、筆画領域内部に位置する画素点と、筆画領域外部に位置する画素点との間の輝度値又は/及び色値の大きさの関係を示す。
【0104】
筆画極性推定モジュール1101は、異なる応用シーンにおいて異なる具体的な配置を行うことができる。図12は、第2種のテキスト強調装置における筆画極性推定モジュール1101を示す模式図である。
【0105】
あるシーンにおいて、極性が筆画領域内部の画素点と、筆画領域外部の画素点との間の輝度値の大きさの関係を示す場合に、図12に示されたように、筆画極性推定モジュール1101は、
水平方向、垂直方向及び二つの対角線方向上において上記式(12)により、筆画応答強度をそれぞれ算出するための第1の算出サブモジュール1201と、
算出した四つの筆画応答強度のうち、最大の筆画応答強度が以下の二つの条件、即ち[f(i)−f(l)]と[f(i)−f(k)]の極性が同じ、且つこの筆画応答強度が予め設定された所定の閾値より大きいことを満たしているか否かを判断するための第1の判断サブモジュール1202と、
第1の判断サブモジュール1202による判断結果が肯定の場合に、[f(i)−f(l)]と[f(i)−f(k)]の極性に基づいて、テキストの推定筆画極性を特定するための第1の特定サブモジュール1203と、
第1の判断サブモジュール1202による判断結果が否定の場合に、ある筆画応答強度が上記二つの条件を満たすまで、算出した筆画応答強度を大きさに従って順番に選択し、且つ第1の判断サブモジュールをトリガし(起動し)、又は、上記四つの筆画応答強度がいずれも上記二つの条件を満たさない場合に、画素点iを非筆画画素点とするための第1のトリガサブモジュール1204と、を備えることができる。
【0106】
図13は、第2種のテキスト強調装置における筆画極性推定モジュール1101を示す他の模式図である。
【0107】
他のシーンにおいて、極性が筆画領域内部の画素点と筆画領域外部の画素点の間の輝度値の大きさの関係を示す場合に、図13に示されたように、筆画極性推定モジュール1101は、
水平方向、垂直方向及び二つの対角線方向の何れかにおいて、上記式(12)により、原画像における各原画素点の筆画応答強度を算出するための第2の算出サブモジュール1301と、
筆画応答強度が以下の二つの条件、即ち[f(i)−f(l)]と[f(i)−f(k)]の極性が同じ、且つこの筆画応答強度が予め設定された所定の閾値より大きいことを同時に満たしているか否かを判断するための第2の判断サブモジュール1302と、
第2の判断サブモジュール1302による判断結果が肯定の場合に、[f(i)−f(l)]と[f(i)−f(k)]の極性に基づいて、原画素点iの初期極性を特定するための第2の特定サブモジュール1303と、
四つの方向上の筆画応答強度の算出がすべて完了したか否かを判断するための第3の判断サブモジュール1304と、
第3の判断サブモジュール1304による判断結果が肯定の場合に、四つの方向上の最大の筆画応答強度の対応する初期極性をテキストの推定筆画極性として特定するための第3の特定サブモジュール1305と、
第3の判断サブモジュール1304による判断結果が否定の場合に、第2の算出サブモジュールをトリガ(起動)するための第2のトリガサブモジュール1306と、を備えることができる。
【0108】
図14は、第2種のテキスト強調装置における筆画極性推定モジュール1101を示す他の模式図である。
【0109】
他のシーンにおいては、極性が筆画領域内部の画素点と、筆画領域外部の画素点との間の色値の大きさの関係を示す場合に、図14に示されたように、筆画極性推定モジュール1101は、
水平方向、垂直方向及び二つの対角線方向において、上記式(13)により、筆画応答強度をそれぞれ算出するための第3の算出サブモジュール1401と、
算出した筆画応答強度のうち、最大の筆画応答強度が以下の二つの条件、即ちチャネルnにおいて[fn(i)−fn(l)]と[fn(i)−fn(k)]の極性が一致し、且つ前記筆画応答強度が予め設定された所定の閾値より大きいことを満たしているか否かを判断するための第4の判断サブモジュール1402と、
第4の判断サブモジュール1402による判断結果が肯定の場合に、[fn(i)−fn(l)]又は[fn(i)−fn(k)]の極性に基づいて、テキストの推定筆画極性を特定するための第4の特定サブモジュール1403と、
第4の判断サブモジュール1402による判断結果が否定の場合に、ある筆画応答強度が上記二つの条件を満たすまで、大きさの関係に従って順番に算出した筆画応答強度を選択し、且つ第4の判断サブモジュール1402をトリガし(起動し)、又は、四つの筆画応答強度がいずれも上記二つの条件を満たしていない場合に、画素点iを非筆画画素点とするための第3のトリガサブモジュール1404と、を備えることができる。
【0110】
図15は、第2種のテキスト強調装置における筆画極性推定モジュール1101を示す他の模式図である。
【0111】
他のシーンにおいて、極性が筆画領域内部の画素点と、筆画領域外部の画素点との間の色値の大きさの関係を示す場合に、図15に示されたように、筆画極性推定モジュール1101は、
水平方向、垂直方向及び二つの対角線方向の何れかにおいて、上記式(13)により、原画像における各原画素点の筆画応答強度を算出するための第4の算出サブモジュール1501と、
筆画応答強度が以下の二つの条件、即ち、チャネルnにおいて[fn(i)−fn(l)]と[fn(i)−fn(k)]の極性が一致し、且つこの筆画応答強度が予め設定された所定の閾値より大きいことを同時に満たしているか否かを判断するための第5の判断サブモジュール1502と、
第5の判断サブモジュール1502による判断結果が肯定の場合に、[fn(i)−fn(l)]又は[fn(i)−fn(k)]の極性に基づいて、原画素点iの初期極性を特定するための第5の特定サブモジュール1503と、
四つの方向上の筆画応答強度の算出がすべて完了したか否かを判断するための第6の判断サブモジュール1504と、
第6の判断サブモジュール1504による判断結果が肯定の場合に、四つの方向上の最大の筆画応答強度の対応する初期極性をテキストの推定筆画極性として特定するための第6の特定サブモジュール1505と、
第6の判断サブモジュール1505による判断結果が否定の場合に、第4の算出サブモジュール1501をトリガ(起動)するための第4のトリガサブモジュール1506と、を備えることができる。
【0112】
再び図11を参照する。第2種のテキスト強調装置は、さらに、原画像における任意な原画素点からその近傍集合における各近傍画素点までの直接差異度と間接差異度とに基づいて、各原画素点の原輝度値又は/及び原色値に対して筆画二次元フィルタリングを行って、原画像のフィルタリング後の更新輝度値又は/及び更新色値を取得するためのフィルタモジュール902を含むことができる。近傍集合の範囲は、原画素点を中心とし、且つ辺長がwである正方形となり、前記wは原画像の高さより小さい。
【0113】
また、図11に示すように、第2種のテキスト強調装置は、さらに、フィルタリング後の更新輝度値又は/及び更新色値と筆画極性とが合わせるか否かを判断し、肯定の場合に、置換モジュール903をトリガ(起動)するための判断モジュール1102を備えることができる。
【0114】
図16は、第2種のテキスト強調装置における判断モジュール1102を示す模式図である。
【0115】
図16に示されたように、実際の応用において、判断モジュール1102は、
フィルタリング後の更新輝度値又は/及び更新色値と、原輝度値又は/及び原色値との第1の大きさの関係を取得するための第3の取得サブモジュール1601と、
第1の大きさの関係と、筆画極性が示す第2の大きさの関係とが合わせるか否かを判断するための第7の判断サブモジュール1602とを備えることができる。
【0116】
なお、第1の大きさの関係及び第2の大きさの関係については、上述の第2種のテキスト強調方法におけるステップS304のフローチャットを示す図8に関連する記載に既に説明したため、ここで省略する。
【0117】
再び図11を参照する。第2種のテキスト強調装置は、さらに、フィルタリング後の更新輝度値又は/及び更新色値で、対応の原輝度値又は/及び原色値をそれぞれ置換して、原画像に対応するテキスト強調画像を生成するための置換モジュール903を備えることができる。
【0118】
本発明の実施例による上述の装置によれば、さらに、筆画極性推定の形態を採用することにより、フィルタリング後の更新色値又は更新輝度値に対して検証を行うことができる。筆画極性がフィルタリング後の更新色値又は/及び更新輝度値と合わせた場合に、さらにフィルタリング後の更新輝度値又は/及び更新色値で、対応の原輝度値又は/及び原色値をそれぞれ置換することにより、取得したテキスト強調画像がより有効且つ精度が良くなる。
【0119】
図17は、本発明の一実施例によるテキスト抽出方法を示すフローチャートである。図17に示されたように、本発明の一実施例は、テキスト強調された後にテキスト抽出方法をさらに提供する。このテキスト抽出方法は、以下のステップを含む。なお、このテキスト抽出方法は、例えば、コンピュータにより実行されてもよい。
【0120】
S1701:少なくとも一行のテキストを含む原画像を取得する。
【0121】
S1702:原画像における任意な原画素点からその近傍集合における各近傍画素点までの直接差異度と間接差異度とに基づいて、各原画素点の原輝度値又は/及び原色値に対して筆画二次元フィルタリングを行って、原画像のフィルタリング後の更新輝度値又は/及び更新色値を取得する。近傍集合の範囲は、原画素点を中心とし、且つ辺長がwである正方形となり、wは原画像の高さより小さい。
【0122】
S1703:フィルタリング後の更新輝度値又は/及び更新色値で、対応の原輝度値又は/及び原色値をそれぞれ置換して、原画像に対応するテキスト強調画像を生成する。
【0123】
S1704:テキスト強調画像におけるテキストを抽出する。
【0124】
上述のテキスト抽出方法を採用すれば、テキスト強調画像に基づいてテキスト抽出を行うことができる。このように抽出されたテキストはより正確に且つ精度が良くなる。同時に、抽出時にテキストが既に強調されたため、テキスト抽出の複雑度を削減し、テキスト抽出の効率を向上することができる。
【0125】
図18は、本発明の一実施例によるテキスト抽出装置を示す模式図である。本発明の一実施例は、図18に示されたように、上述のテキスト抽出方法に対応するテキスト抽出装置をさらに提供する。このテキスト抽出装置は、
少なくとも一行のテキストを含む原画像を取得するための取得モジュール901と、
原画像における任意な原画素点からその近傍集合における各近傍画素点までの直接差異度と間接差異度とに基づいて、各原画素点の原輝度値又は/及び原色値に対して筆画二次元フィルタリングを行って、原画像のフィルタリング後の更新輝度値又は/及び更新色値を取得するためのフィルタモジュール902であって、近傍集合の範囲は、原画素点を中心とし、且つ辺長がwである正方形となり、wは原画像の高さより小さいフィルタモジュール902と、
フィルタリング後の更新輝度値又は/及び更新色値で、対応の原輝度値又は/及び色値をそれぞれ置換して、原画像に対応するテキスト強調画像を生成するための置換モジュール903と、
テキスト強調画像におけるテキストを抽出するための抽出モジュール1801と、を備える。
【0126】
上述のテキスト抽出装置を採用すると、テキスト強調画像に基づいてテキスト抽出を行うことができる。このように抽出されたテキストはより正確に且つ精度が良くなる。同時に、抽出時にテキストが既に強調されたため、テキスト抽出の複雑度を低減し、テキスト抽出の効率を向上することができる。
【0127】
また、ここで説明すべきは、上述の一連の処理又は装置は、ソフトウェア及び/又はファームウェアにより実現されてもよい。ソフトウェア及び/又はファームウェアにより実現される場合に、記憶媒体又はネットワークから、専用ハードウェア構造を有するコンピュータ、例えば図19に示された汎用コンピュータ1900に、このソフトウェア及び/又はファームウェアを構成する各種のプログラムをインストールすることにより、このコンピュータは、各種の機能を実行することができる。
【0128】
図19は、本発明の一実施例による、情報処理装置としてのコンピュータの模式的な構造を示すブロック図である。図19において、中央処理ユニット(CPU)1901は、リードオンリーメモリ(ROM)1902に記憶されたプログラム、又は記憶部1908からランダムアクセスメモリ(RAM)1903にロードされた各種のプログラムに基づいて、各種の処理を実行する。RAM1903には、必要に応じて、CPU1901が各種の処理等を実行するときに必要とするデータも記憶される。
【0129】
CPU1901、ROM1902及びRAM1903は、バス1904を経由して互いに接続される。入力/出力インターフェース1905もバス1904に接続される。
【0130】
キーボード及びマウス等を含む入力部1906と、例えば陰極線管(CRT)又は液晶ディスプレイー(LCD)等のようなディスプレイー及びスピーカ等を含む出力部1907と、ハードディスク等を含む記憶部1908と、LANカードのようなネットワークインターフェースカード及びモデム等を含む通信部1909とは、入力/出力インターフェース1905に接続される。通信部1909は、インターネットのようなネットワークを経由して通信処理を実行する。
【0131】
必要に応じて、ドライブ1910も入力/出力インターフェース1905に接続される。取り外し可能な媒体1911、例えば磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等が必要に応じてドライブ1910に取り付けられ、これによりその中から読み出されたコンピュータプログラムが必要に応じて記憶部1908にインストールされる。
【0132】
ソフトウェアにより上述の一連の処理を実現する場合は、ネットワーク(例えばインターネット)、又は記憶媒体(例えば取り外し可能な媒体1911)から、ソフトウェアを構成するプログラムをインストールする。
【0133】
このような記憶媒体は、図19に示された、その中にプログラムが記憶されており、デバイスから離れて配送されてユーザにプログラムを提供する取り外し可能な媒体1911に限定されないことを、当業者は理解すべきである。取り外し可能な媒体1911としては、例えば、磁気ディスク(フロッピディスク(登録商標)含む)、光ディスク(コンパクトディスクリードオンリーメモリ(CD−ROM)やディジタルヴァーサタイルディスク(DVD)を含む)、光磁気ディスク(ミニディスク(MD)(登録商標)含む)及び半導体メモリを含む。又は、記憶媒体は、ROM1902、又は記憶部1908に含まれるハードディスク等であっても良い。それらは、プログラムを記憶しており、且つそれらを含むデバイスと一緒にユーザに配布される。
【0134】
さらに説明すべきは、上述の一連の処理のステップは、説明した通りに時間順に従って実行することが出来るが、必ず時間順に従うとは限らない。幾つかのステップは、並行又は互いに独立して実行することができる。
【0135】
以上、本発明の好ましい実施例を説明したが、本発明はこの実施例に限定されず、本発明の趣旨を離脱しない限り、本発明に対するあらゆる変更は本発明の技術的範囲に属する。
【0136】
以上の実施例を含む実施形態に関し、更に以下の付記を開示する。
【0137】
(付記1)コンピュータが、画像におけるテキストを強調する方法であって、前記コンピュータが、少なくとも一行のテキストを含む原画像を取得する原画像取得ステップ、前記原画像における任意な原画素点からその近傍集合における各近傍画素点までの直接差異度と間接差異度に基づいて、前記各原画素点の原輝度値又は/及び原色値に対して筆画二次元フィルタリングを行い、前記原画像のフィルタリング後の更新輝度値又は/及び更新色値を取得する更新値取得ステップ、及び、フィルタリング後の前記更新輝度値又は/及び更新色値により、対応する前記原輝度値又は/及び原色値をそれぞれ置換し、前記原画像に対応するテキスト強調画像を生成する強調画像生成ステップを実行し、前記近傍集合の範囲は、前記原画素点を中心とし、且つ辺長がwである正方形となり、wは前記原画像の高さより小さい方法。
【0138】
(付記2)前記更新値取得ステップは、前記原画素点と各近傍画素点の原輝度値又は/及び原色値に対して代数的減算を行って前記直接差異度を取得するステップ、前記原画素点からその近傍集合の各近傍画素点までのグラジエントモジュールに基づいて前記間接差異度を取得するステップ、前記直接差異度及び前記間接差異度に基づいて各近傍画素点の前記原画素点に対する輝度値又は/及び色値の重み値を算出するステップ、以下の筆画二次元フィルタ式を採用して前記原画素点の更新輝度値を算出するステップであって、
【数15】
ここで、N(i)は画素点iの近傍集合を示し、w(i,j)は前記近傍集合内の近傍画素点jの、画素点iに対する輝度値の重み値を示し、f(j)は前記近傍画素点jの原輝度値であるステップ、及び/又は、以下の筆画二次元フィルタ式を採用して前記原画素点の更新色値を算出するステップであって、
【数16】
ここで、wn(i,j)はnチャネルにおいて前記近傍画素点jの、原画素点iに対する色値の重み値を示し、fn(j)はnチャネルにおいて前記近傍画素点jの原色値であるステップを含む、付記1に記載の方法。
【0139】
(付記3)前記コンピュータが、さらに、前記原画像取得ステップの後に、前記原画像におけるテキストの筆画極性を推定する極性推定ステップであって、前記極性は筆画領域内部に位置する画素点と、筆画領域外部に位置する画素点との間の原輝度値又は/及び原色値の大きさの関係を示す極性推定ステップ、及び、前記更新値取得ステップの後に、フィルタリング後の前記更新輝度値又は/及び更新色値と、前記筆画極性とが合わせるか否かを判断し、肯定の場合に、前記原輝度値又は/及び原色値を置換する更新値判断ステップを実行する付記1に記載の方法。
【0140】
(付記4)前記極性が筆画領域内部の画素点と、筆画領域外部の画素点との間の輝度値の大きさの関係を示す場合に、前記極性推定ステップは、水平方向、垂直方向及び二つの対角線方向において、以下の式を採用して筆画応答強度をそれぞれ算出するステップであって、
【数17】
ここで、wは前記原画像の高さの8分の一であり、f(i)は画素点iの輝度値を示すステップ、及び、算出した四つの筆画応答強度のうち最大の筆画応答強度が次の二つの条件、即ち、[f(i)−f(l)]と[f(i)−f(k)]の極性が同じ、且つ前記最大の筆画応答強度が所定の閾値よりも大きいという二つの条件を満たしているか否かを判断し、肯定の場合に、[f(i)−f(l)]と[f(i)−f(k)]の極性に基づいて前記テキストの推定筆画極性を特定し、否定の場合に、ある筆画応答強度が前記二つの条件を満たすまで、算出された前記筆画応答強度を大きさに従って順に選択して前記判断ステップを実行し、或いは、前記四つの筆画応答強度がいずれも前記二つの条件を満たさない場合に、前記画素点iを非筆画画素点とするステップを含む、付記3に記載の方法。
【0141】
(付記5)前記極性が筆画領域内部の画素点と、筆画領域外部の画素点との間の輝度値の大きさの関係を示す場合に、前記極性推定ステップは、水平方向、垂直方向及び二つの対角線方向の何れか一つの方向において、以下の式を採用して前記原画像における各原画素点の筆画応答強度を算出するステップであって、
【数18】
ここで、wは前記原画像の高さの8分の一であり、f(i)は画素点iの輝度値を示すステップ、前記筆画応答強度が次の二つの条件、即ち、[f(i)−f(l)]と[f(i)−f(k)]の極性が同じ、且つ前記筆画応答強度が所定の閾値より大きいという二つの条件を同時に満たすか否かを判断し、肯定の場合に、[f(i)−f(l)]又は[f(i)−f(k)]の極性に基づいて前記原画素点iの初期極性を特定するステップ、及び、四つの方向上の筆画応答強度の算出がすべて完了したか否かを判断し、肯定の場合に、四つの方向上の最大の筆画応答強度が対応する初期極性を、前記テキストの推定筆画極性として特定し、否定の場合に、前記筆画応答強度の算出ステップを繰り返すステップを含む、付記3に記載の方法。
【0142】
(付記6)前記極性が筆画領域内部の画素点と筆画領域外部の画素点との間の色値の大きさの関係を示す場合に、前記極性推定ステップは、水平方向、垂直方向及び二つの対角線方向において、以下の式を採用して筆画応答強度をそれぞれ算出するステップであって、
【数19】
ここで、wは前記原画像の高さの8分の一であり、fn(i)は画素点iのチャネルnにおける色値を示すステップ、算出した四つの筆画応答強度のうち最大の筆画応答強度が次の二つの条件、即ち、チャネルnにおいて[fn(i)−fn(l)]と[fn(i)−fn(l)]との極性が一致し、且つ前記筆画応答強度が所定の閾値より大きいという二つの条件を満たしているか否かを判断し、肯定の場合に、[fn(i)−fn(l)]又は[fn(i)−fn(k)]の極性に基づいて前記テキストの推定筆画極性を特定し、否定の場合に、ある筆画応答強度が前記二つの条件を満たすまで、算出した前記筆画応答強度を大きさに従って順に選択して前記判断ステップを実行し、或いは、前記四つの筆画応答強度がいずれも前記二つの条件を満たしていない場合に、前記画素点iを非筆画画素点とするステップを含む、付記3に記載の方法。
【0143】
(付記7)前記極性が筆画領域内部の画素点と、筆画領域外部の画素点との間の色値の大きさの関係を示す場合に、前記極性推定ステップは、水平方向、垂直方向及び二つの対角線方向の何れか一つの方向において、以下の式を採用して前記原画像における各原画素点の筆画応答強度を算出するステップであって、
【数20】
ここで、wは前記原画像の高さの8分の一であり、fn(i)は画素点iのチャネルnにおいる色値を示すステップ、前記筆画応答強度が次の二つの条件、即ち、チャネルnにおいて[fn(i)−fn(l)]と[fn(i)−fn(k)]との極性が一致し、且つ前記筆画応答強度が所定の閾値より大きいという二つの条件を同時に満たしているか否かを判断し、肯定の場合に、[fn(i)−fn(l)]又は[fn(i)−fn(k)]の極性に基づいて前記原画素点iの初期極性を特定するステップ、及び、四つの方向上の筆画応答強度の算出がすべて完了したか否かを判断し、肯定の場合に、四つの方向上の最大の筆画応答強度が対応する初期極性を、前記テキストの推定筆画極性として特定し、否定の場合に、前記筆画応答強度算出ステップを繰り返すステップを含む、付記3に記載の方法。
【0144】
(付記8)前記更新値判断ステップは、フィルタリング後の前記更新輝度値又は/及び更新色値と、前記原輝度値又は/及び原色値との第1の大きさの関係を取得するステップ、及び、前記第1の大きさの関係と、前記筆画極性に示された第2の大きさの関係とが合わせるか否かを判断するステップを含む、付記3に記載の方法。
【0145】
(付記9)画像におけるテキストを強調する装置であって、少なくとも一行のテキストを含む原画像を取得する取得モジュールと、前記原画像における任意な原画素点からその近傍集合における各近傍画素点までの直接差異度と間接差異度に基づいて、前記各原画素点の原輝度値又は/及び原色値に対して筆画二次元フィルタリングを行って、前記原画像のフィルタリング後の更新輝度値又は/及び更新色値を取得するフィルタモジュールと、フィルタリング後の前記更新輝度値又は/及び更新色値で、対応する前記原輝度値又は/及び原色値をそれぞれ置換して、前記原画像に対応するテキスト強調画像を生成する置換モジュールと、を含み、前記近傍集合の範囲は、前記原画素点を中心とし、且つ辺長がwである正方形となり、wは前記原画像の高さより小さい装置。
【0146】
(付記10)前記のフィルタモジュールは、前記原画素点と各近傍画素点との原輝度値又は/及び原色値に対して代数的減算を行って前記直接差異度を取得する第1の取得サブモジュール、前記原画素点からその近傍集合の各近傍画素点までのグラジエントモジュールに基づいて前記間接差異度を取得する第2の取得サブモジュール、前記直接差異度と間接差異度に基づいて各近傍画素点の、前記原画素点に対する輝度値又は/及び色値の重み値を算出する重み算出サブモジュール、以下の筆画二次元フィルタ式を採用して、前記原画素点の更新輝度値を算出する更新輝度値算出サブモジュールと、及び/又は、
【数21】
以下の筆画二次元フィルタ式を採用して、前記原画素点の更新色値を算出する更新色値算出サブモジュールを含み、
【数22】
ここで、N(i)は画素点iの近傍集合を示し、w(i,j)は近傍画素点jの、原画素点iに対する輝度値の重み値を示し、f(j)は前記近傍画素点jの輝度値であり、wn(i,j)はnチャネルにおいて近傍画素点jの、原画素点iに対する色値の重み値を示し、fn(j)はnチャネルにおいて前記近傍集合内の画素点jの色値である、付記9に記載の装置。
【0147】
(付記11)前記原画像におけるテキストの筆画極性を推定する筆画極性推定モジュールと、フィルタリング後の前記更新輝度値又は/及び更新色値と、前記筆画極性とが合わせるか否かを判断し、肯定の場合に、前記置換モジュールをトリガする判断モジュールと、を更に含み、前記極性は筆画領域内部に位置する画素点と、筆画領域外部に位置する画素点との間の原輝度値又は/及び原色値の大きさの関係を示す、付記9に記載の装置。
【0148】
(付記12)前記極性が筆画領域内部の画素点と筆画領域外部の画素点との間の輝度値の大きさの関係を示す場合に、前記筆画極性推定モジュールは、水平方向、垂直方向及び二つの対角線方向において、下記の式を採用して筆画応答強度をそれぞれ算出する第1の算出サブモジュールであって、
【数23】
ここで、wは前記原画像の高さの8分の一であり、f(i)は画素点iの輝度値を示す第1の算出サブモジュール、算出した四つの筆画応答強度のうち最大の筆画応答強度が次の二つの条件、即ち、[f(i)−f(l)]と[f(i)−f(k)]の極性が同じ、且つ前記筆画応答強度が所定の閾値よりも大きいという二つの条件を満たしているか否かを判断する第1の判断サブモジュール、及び、前記第1の判断サブモジュールによる結果が肯定の場合に、[f(i)−f(l)]と[f(i)−f(k)]の極性に基づいて前記テキストの推定筆画極性を特定する第1の特定サブモジュールと、前記第1の判断サブモジュールによる結果が否定の場合に、ある筆画応答強度が前記二つの条件を満たすまで、算出された前記筆画応答強度を大きさに従って順に選択して前記第1の判断サブモジュールをトリガし、或いは、前記四つの筆画応答強度がいずれも前記二つの条件を満たさない場合に、前記画素点iを非筆画画素点とする第1のトリガサブモジュールを含む、付記11に記載の装置。
【0149】
(付記13)前記極性が筆画領域内部の画素点と、筆画領域外部の画素点との間の輝度値の大きさの関係を示す場合に、前記筆画極性推定モジュールは、水平方向、垂直方向及び二つの対角線方向の何れか一つの方向において、以下の式を採用して前記原画像における各原画素点の筆画応答強度を算出するため第2の算出サブモジュールであって、
【数24】
ここで、wは前記原画像の高さの8分の一であり、f(i)は画素点iの輝度値を示す第2の算出サブモジュール、前記筆画応答強度が次の二つの条件、即ち、[f(i)−f(l)]と[f(i)−f(k)の極性が同じ、且つ前記筆画応答強度が所定の閾値よりも大きいという二つの条件を同時に満たすか否かを判断する第2の判断サブモジュール、前記第2の判断サブモジュールによる結果が肯定の場合に、[f(i)−f(l)]又は[f(i)−f(k)]の極性に基づいて前記原画素点iの初期極性を特定する第2の特定サブモジュール、四つの方向上の筆画応答強度の算出がすべて完了したか否かを判断する第3の判断サブモジュール、前記第3の判断サブモジュールによる結果が肯定の場合に、四つの方向上の最大の筆画応答強度が対応する初期極性を、前記テキストの推定筆画極性として特定するための第3の特定サブモジュール、前記第3の判断サブモジュールによる結果が否定の場合に、前記の第2の算出サブモジュールをトリガ(起動)する第2のトリガサブモジュールを含む、付記11に記載の装置。
【0150】
(付記14)前記極性が筆画領域内部の画素点と、筆画領域外部の画素点との間の色値の大きさの関係を示す場合に、前記筆画極性推定モジュールは、水平方向、垂直方向及び二つの対角線方向において、以下の式を採用して筆画応答強度をそれぞれ算出する第3の算出サブモジュールであって、
【数25】
ここで、wは前記原画像の高さの8分の一であり、fn(i)はチャネルnにおいて画素点iの色値を示す第3の算出サブモジュール、算出した四つの筆画応答強度のうち最大の筆画応答強度が次の二つの条件、即ち、チャネルnにおいて[fn(i)−fn(l)]と[fn(i)−fn(l)]との極性が一致し、且つ前記筆画応答強度が所定の閾値よりも大きいという二つの条件を満たしているか否かを判断する第4の判断サブモジュール、前記第4の判断サブモジュールによる結果が肯定の場合に、[fn(i)−fn(l)]又は[fn(i)−fn(k)]の極性に基づいて前記テキストの推定筆画極性を特定する第4の特定サブモジュール、及び、前記第4の判断サブモジュールによる結果が否定の場合に、ある筆画応答強度が前記二つの条件を満たすまで、算出した前記筆画応答強度を大きさに従って順に選択して前記第4の判断サブモジュールをトリガし、或いは、前記四つの筆画応答強度がいずれも前記二つの条件を満たしていない場合に、前記画素点iを非筆画画素点とする第3のトリガサブモジュールを含む、付記11に記載の装置。
【0151】
(付記15)前記極性が筆画領域内部の画素点と、筆画領域外部の画素点との間の色値の大きさの関係を示す場合に、前記筆画極性推定モジュールは、水平方向、垂直方向及び二つの対角線方向の何れか一つの方向において、以下の式を採用して前記原画像における各原画素点の筆画応答強度を算出する第4の算出サブモジュールであって、
【数26】
ここで、wは原画像の高さの8分の一であり、fn(i)はチャネルnにおいて画素点iの色値を示す第4の算出サブモジュール、前記筆画応答強度が次の二つの条件、即ち、チャネルnにおいて[fn(i)−fn(l)]と[fn(i)−fn(k)]との極性が一致し、且つ前記筆画応答強度が所定の閾値よりも大きいという二つの条件を同時に満たしているか否かを判断する第5の判断サブモジュール、前記第5の判断サブモジュールによる結果が肯定の場合に、[fn(i)−fn(l)]又は[fn(i)−fn(k)]の極性に基づいて前記原画素点iの初期極性を特定する第5の特定サブモジュール、四つの方向上の筆画応答強度の算出がすべて完了したか否かを判断する第6の判断サブモジュールと、前記第6の判断サブモジュールによる結果が肯定の場合に、四つの方向上の最大の筆画応答強度が対応する初期極性を、前記テキストの推定筆画極性として特定する第6の特定サブモジュール、及び、前記第6の判断サブモジュールによる結果が否定の場合に、前記の第4の算出サブモジュールをトリガする第4のトリガサブモジュールを含む、付記11に記載の装置。
【0152】
(付記16)前記の判断モジュールは、フィルタリング後の前記更新輝度値又は/及び更新色値と、原輝度値又は/及び原色値との第1の大きさの関係を取得する第3の取得サブモジュールと、前記第1の大きさの関係と、前記筆画極性に示された第2の大きさの関係とが合わせるか否かを判断する第7の判断サブモジュールとを含む、付記11に記載の装置。
【0153】
(付記17)コンピュータが、画像におけるテキストを抽出する方法であって、コンピュータが、少なくとも一行のテキストを含む原画像を取得するステップ、前記原画像における任意な原画素点からその近傍集合における各近傍画素点までの直接差異度と間接差異度に基づいて、前記各原画素点の原輝度値又は/及び原色値に対して筆画二次元フィルタリングを行い、前記原画像のフィルタリング後の更新輝度値又は/及び更新色値を取得するステップ、前記フィルタリング後の更新輝度値又は/及び更新色値で、対応する前記原輝度値又は/及び原色値をそれぞれ置換して、前記原画像に対応するテキスト強調画像を生成するステップ、及び、前記テキスト強調画像におけるテキストを抽出するステップを実行し、前記近傍集合の範囲は、原画素点を中心とし、且つ辺長がwである正方形となり、wは前記原画像の高さより小さい方法。
【0154】
(付記18)画像におけるテキストを抽出する装置であって、少なくとも一行のテキストを含む原画像を取得するモジュール、前記原画像における任意な原画素点からその近傍集合における各近傍画素点までの直接差異度と間接差異度に基づいて、前記各原画素点の原輝度値又は/及び原色値に対して筆画二次元フィルタリングを行い、前記原画像のフィルタリング後の更新輝度値又は/及び更新色値を取得するモジュール、フィルタリング後の前記更新輝度値又は/及び更新色値で、対応する前記原輝度値又は/及び原色値をそれぞれ置換して、前記原画像に対応するテキスト強調画像を生成するモジュール、及び、前記テキスト強調画像におけるテキストを抽出するモジュールを含み、前記近傍集合の範囲は、原画素点を中心とし、且つ辺長がwである正方形となり、wは前記原画像の高さより小さい装置。
【技術分野】
【0001】
本発明は、画像処理に関し、特に、画像内のテキストを強調する方法及び装置、並びに画像内のテキストを抽出する方法及び装置に関する。
【背景技術】
【0002】
ビデオを再生する過程中、又は画像を観賞するときに、ビデオ又は画像には、往々テキスト説明が含まれる。そのテキスト説明は、例えば、ビデオ内のイベントの発生時間及び場所に対する説明や、画像の解釈などである。これらのテキスト内容はビデオ又は画像と密に関係するため、ビデオ又は画像におけるテキストの抽出は非常に重要な技術になる。
【0003】
従来技術では、ビデオ又は画像のテキストを抽出する方法は、二値化、又はエッジ色のクラスタリング及び検出技術を基礎として、画像又はビデオにおけるテキストを抽出することができる。
【0004】
しかしながら、従来技術でテキストを抽出する際に、ビデオ又は画像にノイズが多すぎ、画像又はビデオが不明瞭であり、ひいてはビデオの一部に照明変化が存在することにより、画像又はビデオ中のテキストと背景との境界が不明瞭になり、又はテキスト内容が不明瞭になり、テキストの抽出効果に影響を与える。
【0005】
したがって、如何に原画像又はビデオ中のテキストに対して強調処理を行って、画像又はビデオ中のテキストを強調し、さらにテキスト抽出の効果を最適化するかについては、従来技術での解決すべき問題になる。
【発明の概要】
【発明が解決しようとする課題】
【0006】
本発明の目的は、上述の問題を鑑み、原画像中のテキストがより明瞭になり、さらにテキスト抽出の効果を最適化可能になるように、少なくとも一行のテキストを含む原画像中のテキストに対して強調処理を行えるテキスト強調方法及び装置、並びにテキスト抽出方法及び装置を提供することにある。
【課題を解決するための手段】
【0007】
本発明の一実施例によれば、コンピュータが画像におけるテキストを強調する方法が提供される。この方法において、前記コンピュータは、少なくとも一行のテキストを含む原画像を取得する現画像取得ステップ、前記原画像における任意な原画素点からその近傍集合における各近傍画素点までの直接差異度及び間接差異度に基づいて、前記各原画素点の原輝度値又は/及び原色値に対して筆画二次元フィルタリングを行い、前記原画像のフィルタリング後の更新輝度値又は/及び更新色値を取得する更新値取得ステップ、及び、前記原画像のフィルタリング後の前記更新輝度値又は/及び更新色値により、対応する前記原輝度値又は及び原色値をそれぞれ置換し、前記原画像に対応するテキスト強調画像を生成する強調画像生成ステップを実行する。また、前記近傍集合の範囲は、前記原画素点を中心とし、且つ辺長がwである正方形となり、wは前記原画像の高さより小さい。
【発明の効果】
【0008】
本発明の実施例によれば、画像内のテキストを強調する方法及び装置、並びに画像内のテキストを抽出する方法及び装置を提供することができるという効果が得られる。
【図面の簡単な説明】
【0009】
【図1】本発明の一実施例による第1種のテキスト強調方法を示すフローチャートである。
【図2】第1種のテキスト強調方法におけるステップS102を示すフローチャートである。
【図3】本発明の一実施例による第2種のテキスト強調方法を示すフローチャートである。
【図4】第2種のテキスト強調方法におけるステップS302を示すフローチャートである。
【図5】第2種のテキスト強調方法におけるステップS302を示す他のフローチャートである。
【図6】第2種のテキスト強調方法におけるステップS302を示す他のフローチャートである。
【図7】第2種のテキスト強調方法におけるステップS302を示す他のフローチャートである。
【図8】第2種のテキスト強調方法におけるステップS304を示すフローチャートである。
【図9】本発明の一実施例による第1種のテキスト強調装置を示す模式図である。
【図10】第1種のテキスト強調装置におけるフィルタモジュール902を示す模式図である。
【図11】本発明の一実施例による第2種のテキスト強調装置を示す模式図である。
【図12】第2種のテキスト強調装置における筆画極性推定モジュール1101を示す模式図である。
【図13】第2種のテキスト強調装置における筆画極性推定モジュール1101を示す他の模式図である。
【図14】第2種のテキスト強調装置における筆画極性推定モジュール1101を示す他の模式図である。
【図15】第2種のテキスト強調装置における筆画極性推定モジュール1101を示す他の模式図である。
【図16】第2種のテキスト強調装置における判断モジュール1102を示す模式図である。
【図17】本発明の一実施例によるテキスト抽出方法を示すフローチャートである。
【図18】本発明の一実施例によるテキスト抽出装置を示す模式図である。
【図19】本発明の一実施例による、情報処理装置としてのコンピュータの模式的な構造を示すブロック図である。
【発明を実施するための形態】
【0010】
以下、図面を参照しながら本発明の実施例を詳細に説明する。
【0011】
図1は、本発明の一実施例による第1種のテキスト強調方法を示すフローチャートである。図1に示すように、第1種のテキスト強調方法は、具体的に以下のステップを含む。なお、この第1種のテキスト強調方法は、例えば、コンピュータにより実行されてもよい。
【0012】
S101:少なくとも一行のテキストを含む原画像を取得する。
【0013】
本発明の実施例においては、上述のテキスト強調とは、少なくとも一行のテキストを含む原画像中のテキストに対して強調処理を行うことを指す。ここでの強調は、テキストのエッジを深めること、又は、テキストと背景との区別を際立たせることであると理解することができる。また、本発明の実施例は、応用されるときに、筆画内部の画素の一致性を強調するとともに、テキストと背景との差異度を深める効果を達するように、テキストの外観(例えば、輝度又は色等)及びその形状(例えば、テキストがしま模様となる)情報を考慮した。
【0014】
S102:原画像における任意な原画素点からその近傍集合(neighborhood set)における各近傍画素点までの直接差異度と間接差異度に基づいて、各原画素点の原輝度値又は/及び原色値に対して筆画二次元フィルタリングを行って、原画像のフィルタリング後の更新された更新輝度値又は/及び更新色値を取得する。近傍集合の範囲は、原画素点を中心とし、且つ辺長がwである正方形となり、wは原画像の高さよりも小さい。
【0015】
本ステップでの直接差異度は任意な原画素点がその近傍集合における各領域画素点との直接外観差異、例えば色又は輝度の差異を示し、間接差異度は原画素点からその近傍集合における各領域画素点まで経由した画素のグラジエントモジュール(gradient module)を示す。直接差異度と間接差異度により各原画素点の原輝度値又は/及び原色値に対して筆画二次元フィルタリングを行って、原画像のフィルタリング後の更新された更新輝度値又は/及び更新色値を取得することができる。なお、ここでの近傍集合は、原画素点を中心とし、且つwを辺長とする正方形を取るように取得可能である。なお、wは、原画像の高さより小さく、原画像の高さの8分の1をとることが好ましい。
【0016】
図2は、第1種のテキスト強調方法におけるステップS102を示すフローチャートである。実際の応用においては、図2に示すように、上述のS102は、具体的に以下の内容を含む。
【0017】
S201:原画素点と各近傍画素点との原輝度値又は/及び原色値に対して代数的減算を行って、直接差異度を取得する。
【0018】
本実施例において、D1(i,j)で画素iとjの直接差異度を示すと、以下の式(1)により輝度値の直接差異度を算出することができる。
【数1】
【0019】
ただし、f’(i)は目標画素の近傍集合における各近傍画素の輝度の平均値を示し、即ち、目標画素の画素値の代わりに近傍画素の画素値の平均値を用いて直接差異度を算出する。σ(i)は画素iの周りの局所輝度標準偏差を示し、正規化に役立つことができる。
【0020】
また、以下の式(2)により画素iとjの輝度値の直接差異度を算出することもできる。
【数2】
【0021】
ただし、f(i)は目標画素の近傍集合における各近傍画素の輝度の平均値を示す。
【0022】
ここで説明すべきは、画素iとjの色値の直接差異度を算出する時に、以下の式(3)又は(4)をそれぞれ採用することもできる。
【数3】
【数4】
【0023】
式(3)及び(4)中のnは画素の色情報としてのRチャネル、Gチャネル及びBチャネルを示す。ここで説明すべきは、上述の直接差異度を算出する式は、ただ例示的なものである。当業者は上述の式に対して適応的な変更を行うことができる。
【0024】
S202:原画素点からその近傍集合の各近傍画素点までのグラジエントモジュールに基づいて、間接差異度を取得する。
【0025】
なお、本実施例において、D2(i,j)で画素iとjの間接差異度を示すと、以下の式(5)により画素iとjの輝度値の間接差異度を算出することができる。
【数5】
【0026】
ただし、
【数6】
は、iからjへの方向に沿う、画素lにおけるグラジエントモジュールを示す。式(5)におけるbと式(1)におけるaはともに予め設定された所定のパラメータである。フィルタリングの平滑程度を制御するように両者の単調性が一致している。
【0027】
もちろん、実際の応用において、式(5)における最大勾配値の代わりに、iからjまで経由した画素の輝度の最大及び最小の勾配値の差を用いて算出することもできる。算出方法は以下の式(6)に示す。
【数7】
【0028】
ただし、Maxは勾配値の最大値を示し、minは勾配値の最小値を示す。
【0029】
また、画素iとjの色値の間接差異度については、以下の式(7)及び式(8)でそれぞれ算出することもできる。
【数8】
【数9】
【0030】
nは画素の色情報としてのRチャネル、Gチャネル及びBチャネルを示す。ここで説明すべきは、上述の間接差異度を算出する式は、ただ例示的なものである。当業者は上述の式に対して適応的な変更を行うことができる。
【0031】
S203:直接差異度及び間接差異度に基づいて、原画素点に対する各近傍画素点の輝度値又は/及び色値の重み値を算出する。
【0032】
間接差異度及び直接差異度を取得した後に、以下の式(9)で重み値を算出することができる。
【数10】
【0033】
ただし、D1(i,j)は画素iとjの輝度及び/又は色値の直接差異度を示し、D2(i,j)は画素iとjの輝度及び/又は色値の間接差異度を示す。なお、w(i,j)は輝度の重み値を示し、wn(i,j)は色値の重み値を示す。
【0034】
S204:以下の筆画二次元フィルタ式(10)で原画素点の更新輝度値を算出する。
【数11】
【0035】
ただし、N(i)は画素点iの近傍集合を示し、w(i,j)は原画素点iに対する近傍画素点jの輝度値の重み値を示す。f(j)は近傍集合内の画素点jの輝度値である。
【0036】
S205:以下の筆画二次元フィルタ式(11)で原画素点の更新色値を算出する。
【数12】
【0037】
ただし、wn(i,j)はnチャネルにおいて原画素点iに対する近傍画素点jの色値の重み値を示し、fn(j)はnチャネルにおいて前記近傍集合内の画素点jの色値である。
【0038】
ここで説明すべきは、ステップS204及びS205は、更新輝度値及び更新色値をそれぞれ算出するため、実際の応用においてそのうちの任意の一つのステップを選択して実行し、又は二つのステップを同時に実行することにより、本実施例を実現することができる。
【0039】
再び図1を参照する。
【0040】
S103:フィルタリングした更新輝度値又は/及び更新色値で、対応する前記原輝度値又は/及び原色値をそれぞれ置換して、前記原画像に対応するテキスト強調画像を生成する。
【0041】
フィルタリングされた後の更新輝度値又は/及び更新色値を取得した後に、更新輝度値又は/及び更新色値で、原輝度値又は/及び原色値をそれぞれ置換する。このように置換された後、原画像における画素点中のテキスト筆画が強調され、さらに、筆画内部の画素の一致性が強調され、テキストと背景の差異度が深まった。
【0042】
図3は、本発明の一実施例による第2種のテキスト強調方法を示すフローチャートである。図3に示すように、第2種のテキスト強調方法は、具体的に以下のステップを含む。なお、この第2種のテキスト強調方法は、例えば、コンピュータにより実行されてもよい。
【0043】
S301:少なくとも一行のテキストを含む原画像を取得する。
【0044】
S302:原画像におけるテキストの筆画極性を推定する。極性は、筆画領域内部に位置する画素点と、筆画領域外部に位置する画素点との間の輝度値又は/及び色値の大きさの関係を示す。
【0045】
実際の応用において、テキストの筆画強調は主にフィルタ技術、即ち、筆画外の周りの画素値で筆画内の目標画素値を強調するものを採用しているため、筆画内の目標画素点の周りのノイズ画素点が筆画強調の効果に悪影響を与えることになる。この影響は、細い筆画又は筆画の間隔を処理する際により明らかになる。このような品質下落を回避するために、本実施例において筆画極性推定が導入されている。本ステップで推定した筆画極性は、筆画領域内部の画素点と筆画領域外部の画素点との間の輝度値又は/及び色値の大きさの関係を示すことができる。
【0046】
図4は、第2種のテキスト強調方法におけるステップS302を示すフローチャートである。具体的には、極性が筆画領域内部の画素点と筆画領域外部の画素点との間の輝度値の大きさの関係を示す場合に、図4に示されたように、原画像におけるテキストの筆画極性を推定するステップは、以下の内容を含む。
【0047】
S401:水平方向、垂直方向及び二つの対角線方向(即ち、原画像の幅方向、高さ方向及び二つの対角線方向)において、以下の式(12)により筆画応答強度をそれぞれ算出する。
【数13】
【0048】
ただし、wは原画像の高さの8分の一であり、f(i)は画素点iの輝度値を示す。本ステップにより、水平方向、垂直方向及び二つの対角線方向上の四つの筆画応答強度を取得することができる。
【0049】
S402:算出した四つの筆画応答強度のうちの最大の筆画応答強度が以下の2つの条件、即ち、[f(i)−f(l)]と[f(i)−f(k)]の筆画極性が同じ、且つこの最大の筆画応答強度が予め設定された所定の閾値よりも大きいという2つの条件を満たしているか否かを判断する。肯定の場合に、ステップS403を実行する。否定の場合に、ステップS404を実行する。
【0050】
具体的な応用においては、テキスト筆画内部の画素点と背景画素点との輝度又は色値は一般的に反対なものであるため、[f(i)−f(l)]と[f(i)−f(k)]の極性が同じであれば、i画素点が筆画内部の画素点である可能性が高いことを示す。本ステップは、原画像におけるすべての画素点から、筆画内部の画素点である可能性のあるものを検出する。ここでの極性が同じであることは、i画素点の輝度値及び/又は色値が同時にl画素点及びk画素点より大きい、又は、i点の輝度値及び/又は色値が同時にl画素点及びk画素点より小さいことを示し、即ち、[f(i)−f(l)]と[f(i)−f(k)]が同時にゼロよりも大きい、又は、ゼロ以下であることを示す。筆画応答強度の所定の閾値は、実際の必要に応じて調整することができる。従って、本発明は、この所定の閾値の選択を限定しない。
【0051】
S403:[f(i)−f(l)]又は[f(i)−f(k)]の極性に基づいて、テキストの推定筆画極性を特定する。
【0052】
i画素点が上述の二つの条件を満たしていると、[f(i)−f(l)]又は[f(i)−f(k)]の極性に基づいて、テキスト内の推定筆画極性をp(i)として特定し、筆画内部の画素点と外部の画素点とを区分できれば、その値取りが任意である。例えば、テキスト筆画内部の画素点の輝度値が背景画像点の輝度値より低い場合に、p(i)を0に設定する。それ相応に、p(i)が1であることは、テキスト筆画内部の画素点の輝度値が背景画素点の輝度値以上であることを示す。
【0053】
S404:算出した筆画応答強度を大きさに従って順に選出し、ステップS402を実行する。
【0054】
最大の筆画応答強度が上述の二つの条件を満たしていない場合に、二番目の大きい筆画応答強度を選択してステップS402の判断ステップを実行し、上述の二つの条件を満たす筆画応答強度を取得するまで、これによって類推して筆画応答強度の大きさに従って順番に行う。又は、上述の四つの筆画応答強度がいずれも上述の二つの条件を満たさない場合に、前記画素点iを非筆画画素点とする。
【0055】
また、極性が筆画領域内部の画素点と筆画領域外部の画素点との間の輝度値の大きさの関係を示す場合に、他の実施形態もある。図5は、第2種のテキスト強調方法におけるステップS302を示す他のフローチャートである。図5に示されたように、原画像におけるテキストの筆画極性を推定するステップは、具体的に以下の内容を含む。
【0056】
S501:一つの方向において、上記式(12)により、原画像における各原画素点の筆画応答強度を算出する。この一つの方向は水平方向、垂直方向及び二つの対角線方向の何れかである。
【0057】
本ステップは、まず、水平方向、垂直方向及び二つの対角線方向の何れかにおいて筆画応答強度を算出する。
【0058】
S502:筆画応答強度が以下の二つの条件、即ち[f(i)−f(l)]と[f(i)−f(k)]との極性が同じ、且つこの筆画応答強度が予め設定された所定の閾値よりも大きいことを同時に満たしているか否かを判断する。肯定の場合に、ステップS503を実行する。否定の場合に、算出した筆画応答強度に対して処理を行わず、さらに演算を行っていない他の方向において、原画像における各原画素点の筆画応答強度を算出する。
【0059】
S503:[f(i)−f(l)]又は[f(i)−f(k)]の極性に基づいて、原画素点iの初期極性を特定する。
【0060】
算出した筆画応答強度が既に上記二つの条件を満たしている場合に、[f(i)−f(l)]又は[f(i)−f(k)]の極性に従って、原画素点iの初期極性を特定する。ここで特定した初期極性は、[f(i)−f(l)]又は[f(i)−f(k)]の極性と同じはずである。
【0061】
S504:四つの方向上の筆画応答強度の算出がすべて完了したか否かを判断する。肯定の場合に、ステップS505を実行する。否定の場合に、ステップS501を実行する。
【0062】
次に、水平方向、垂直方向及び二つの対角線方向の四つの方向上の筆画応答強度の算出がすべて完了したか否かを判断し、算出が完了していない場合に、筆画応答強度を算出していない方向の何れかを選択して、ステップS501を実行する必要がある。
【0063】
S505:四つの方向上の最大の筆画応答強度が対応する初期極性をテキストの推定筆画極性として特定する。
【0064】
四つの方向上の筆画応答強度の算出がすべて完了した場合に、上記二つの条件を満たしている筆画応答強度のうち、最大の筆画応答強度の対応する初期極性を選択して、上述のテキストの推定筆画極性を特定する。即ち、原画像におけるテキストの推定筆画極性は最大の筆画応答強度の対応する初期極性と同じである。
【0065】
図6は、第2種のテキスト強調方法におけるステップS302を示す他のフローチャートである。極性が筆画領域内部の画素点と筆画領域外部の画素点との間の色値の大きさの関係を示す場合に、原画像におけるテキストの筆画極性を推定するステップは、図6に示されたように、具体的に以下の内容を含む。
【0066】
S601:水平方向、垂直方向及び二つの対角線方向において以下の式(13)により、各チャネルの筆画応答強度をそれぞれ算出する。
【数14】
【0067】
ただし、wは原画像の高さの8分の一であり、fn(i)は画素点iのチャネルnにおける色値を示す。例えば、nチャネルがそれぞれRチャネル、Gチャネル及びBチャネルの場合に、筆画応答強度がRチャネル、Gチャネル及びBチャネルにおける筆画応答強度の合計である。
【0068】
S602:算出した各チャネルの四つの筆画応答強度のうち、最大の筆画応答強度が以下の二つの条件、即ち、チャネルnにおいて[fn(i)−fn(l)]と[fn(i)−fn(k)]との極性が何れも一致し、且つこの筆画応答強度が予め設定された所定の閾値より大きいことを満たしているか否かを判断する。肯定の場合に、ステップS603を実行し、否定の場合に、ステップS604を実行する。
【0069】
本ステップにおいて、任意のチャネルにおいても、[fn(i)−fn(l)]と[fn(i)−fn(k)]との極性が一致するという条件を満たす必要がある。
【0070】
S603:[fn(i)−fn(l)]又は[fn(i)−fn(k)]の極性に基づいて、テキストの推定筆画極性を特定する。
【0071】
S604:算出した筆画応答強度を大きさに従って順に選択して、ステップS602を実行する。
【0072】
最大の筆画応答強度が上記二つの条件を満たさない場合に、本ステップにおいて、ある筆画応答強度が前記二つの条件を満たすまで、大きさに従って順に、二番目、三番目及び四番目の筆画応答強度を選択してステップS602を実行する。又は、四つの筆画応答強度がいずれも上記二つの条件を満たさない場合に、画素点iを非筆画画素点とする。例えば、二番目の大きい筆画応答強度が既に上記二つの条件を満たしている場合に、筆画極性推定の流れを中止する。
【0073】
実際の応用において、極性が筆画領域内部の画素点と筆画領域外部の画素点の間の色値の大きさの関係を示す場合に、他の実施形態も存在する。図7は、第2種のテキスト強調方法におけるステップS302を示す他のフローチャートである。図7に示されたように、原画像におけるテキストの筆画極性を推定するステップは、以下の内容を含む。
【0074】
S701:一つの方向において、上記式(13)により、原画像における各原画素点の各チャネルの筆画応答強度を算出し、この一つの方向は水平方向、垂直方向及び二つの対角線方向の何れかである。
【0075】
S702:一つの方向における各チャネルの筆画応答強度が以下の二つの条件、即ち、チャネルnにおいて[fn(i)−fn(l)]と[fn(i)−fn(k)]との極性が一致し、且つこの筆画応答強度が予め設定された所定の閾値よりも大きいことを同時に満たしているか否かを判断する。肯定の場合に、ステップS703を実行する。否定の場合に、この方向において初期極性を設けない。
【0076】
S703:[fn(i)−fn(l)]又は[fn(i)−fn(k)]の極性に基づいて、原画素点iの初期極性を特定する。
【0077】
ステップS701で算出した一つの方向の筆画応答強度が上記二つの条件を満たしている場合に、原画素点iのこの方向における初期極性を、[fn(i)−fn(l)]又は[fn(i)−fn(k)]の極性と同じように設置する。
【0078】
S704:四つの方向上の筆画応答強度の算出がすべて完了したか否かを判断し、肯定の場合に、ステップS705を実行し、否定の場合に、ステップS701を実行する。
【0079】
S705:四つの方向上の最大の筆画応答強度が対応する初期極性を、テキストの推定筆画極性として特定する。
【0080】
四つの方向上の筆画応答強度の算出がすべて完了した場合に、四つの方向上の、上記二つの条件を満たしている筆画応答強度から、最大の筆画応答強度の対応する初期極性を選択して、上述のテキストの推定筆画極性とする。四つの方向上の筆画応答強度の算出がすべて完了していない場合に、さらに算出されていない方向の何れかを選択してステップS701を実行する。
【0081】
再び図3を参照する。
【0082】
S303:原画像における任意の原画素点からその近傍集合における各近傍画素点までの直接差異度及び間接差異度に基づいて、各原画素点の原輝度値又は/及び原色値に対して筆画二次元フィルタリングを行って、原画像のフィルタリング後の更新輝度値又は/及び更新色値を取得する。近傍集合の範囲は、原画素点を中心とし、且つ辺長がwである正方形となり、wが原画像の高さより小さい。
【0083】
本ステップの詳細については、本実施例の関連内容を参照することができるため、ここで省略される。ここで説明すべきは、本ステップはステップS302と同時に実行しても良く、又はステップS303を実行してから、ステップS302を実行しても良い。
【0084】
S304:原画像の各画素点に対して、フィルタリング後の更新輝度値又は/及び更新色値が上述の筆画極性と合わせるか否かを判断し、肯定の場合に、ステップS305を実行し、否定の場合に、置換を行わない。
【0085】
算出により筆画極性が得られ、及び筆画フィルタリングが行われた後に、順に原画像の各画素点のフィルタリング後の更新輝度値又は/及び更新色値が上述の筆画極性と合わせるか否いかを判断することができる。ある画素点のフィルタリング後の更新輝度値又は/及び更新色値が上述の筆画極性と合わせない場合に、この画素点の原輝度値又は/及び色値を置換せず、次の画素点のフィルタリング後の更新輝度値又は/及び更新色値が上述の筆画極性と合わせるか否かを判断し続ける。
【0086】
図8は、第2種のテキスト強調方法におけるステップS304を示すフローチャートである。図8に示されたように、前記ステップS304は具体的に、以下の内容を含む。
【0087】
S801:フィルタリング後の更新輝度値又は/及び更新色値と、原輝度値又は/及び原色値との第1の大きさの関係を取得する。
【0088】
まず、フィルタリング後の更新輝度値又は/及び更新色値と、原輝度値又は/及び原色値との第1の大きさの関係を取得する。ここでの第1の大きさの関係について、例えば、更新輝度値が原輝度値の輝度より明るい場合に、第1の大きさの関係は更新輝度値が原輝度値より大きいことであり、又は、例えば、更新色値が原色値より大きい場合に、第1の大きさの関係は、更新色値が原色値より大きいことである。この第1の大きさの関係は、更新輝度値又は/更新色値と、原輝度値又は/及び原色値とに対して代数的減算を行って取得することができる。
【0089】
S802:第1の大きさの関係が上述の筆画極性に示された第2の大きさの関係と合わせるか否かを判断する。
【0090】
上述の筆画極性が筆画内部の画素点の輝度値又は/及び色値と、筆画外部の画素点の輝度値又は/及び色値との大きさの関係を示すため、更新色値が原色値より大きい、且つ筆画極性が示す第2の大きさの関係も更新色値が原色値より大きいことである場合に、又は、更新色値が原色値より小さい、且つ筆画極性が示す第2の大きさの関係も更新色値が原色値より小さいことである場合に、第1の大きさの関係と、上述の筆画極性に示された第2の大きさの関係とが合わせると考えられる。逆に、第1の大きさの関係と、第2の大きさの関係とが合わせないと考えられる。
【0091】
再び図3を参照する。
【0092】
S305:フィルタリング後の更新輝度値又は/及び更新色値で、対応する原輝度値又は/及び原色値をそれぞれ置換して、原画像に対応するテキスト強調画像を生成する。
【0093】
第1の大きさの関係と、第2の大きさの関係とが合わせた場合に、フィルタリング後の更新輝度値又は/及び更新色値で、対応する原輝度値又は/及び原色値をそれぞれ置換することにより、原画像に対応するテキスト強調画像を取得することができる。本実施例は、筆画極性推定のステップにより、筆画極性がフィルタリング後の更新輝度値又は更新色値と合わせた場合に、さらにテキスト強調を行うようにすることができ、第1種のテキスト強調方法と比べてテキスト強調の効果がより顕著になり、後続のテキスト抽出の正確性の向上に寄与することができる。
【0094】
本発明の実施例による上述のテキスト強調方法によれば、取得されたテキスト強調画像中の画素点におけるテキスト筆画が強調され、筆画内部の画素の一致性が強調され、且つテキストと背景との差異度が深まれ、即ち原画像に含まれたテキストが強調された。これにより、後続のこのテキスト強調画像に対するテキスト抽出がより精度良く且つ正確になる。
【0095】
また、本発明の一実施例は、上述の第1種のテキスト強調方法に対応する第1種のテキスト強調装置を提供する。図9は、本発明の一実施例による第1種のテキスト強調装置を示す模式図である。
【0096】
図9に示されたように、第1種のテキスト強調装置は、少なくとも一行のテキストを含む原画像を取得するための取得モジュール901を備えることができる。
【0097】
さらに、第1種のテキスト強調装置は、図9に示されたように、原画像における任意な原画素点からその近傍集合における各近傍画素点までの直接差異度及び間接差異度に基づいて、各原画素点の原輝度値又は/及び原色値に対して筆画二次元フィルタリングを行って、原画像のフィルタリング後の更新輝度値又は/及び更新色値を取得するためのフィルタモジュール902を備えることができる。なお、近傍集合の範囲は、原画素点を中心とし、且つ辺長がwである正方形となり、前記wは原画像の高さより小さい。
【0098】
図10は、第1種のテキスト強調装置におけるフィルタモジュール902を示す模式図である。
【0099】
図10に示されたように、フィルタモジュール902は、
原画素点と各近傍画素点の原輝度値又は/及び原色値に対して代数的減算を行って、直接差異度を取得するようにするための第1の取得サブモジュール1001と、
原画素点からその近傍集合における各近傍画素点までのグラジエントモジュールに基づいて、間接差異度を取得するようにするための第2の取得サブモジュール1002と、
直接差異度と間接差異度とに基づいて、各近傍画素点の原画素点に対する輝度値又は/及び色値の重み値を算出するための重み算出サブモジュール1003と、
上述の筆画二次元フィルタ式(10)により、原画素点の更新輝度値を算出するための更新輝度値算出サブモジュール1004と、
上述の筆画二次元フィルタ式(11)により、原画素点の更新色値を算出するための更新色値算出サブモジュール1005と、を備えることができる。
【0100】
再び図9を参照する。第1種のテキスト強調装置は、フィルタリング後の更新輝度値又は/及び更新色値で、対応する原輝度値又は/及び色値をそれぞれ置換して、原画像に対応するテキスト強調画像を生成するための置換モジュール903を備えることができる。
【0101】
本発明の実施例による上述のテキスト強調装置によれば、フィルタリング後の更新輝度値又は/及び更新色値を取得した後に、更新輝度値又は/及び更新色値で、原輝度値又は/及び原色値をそれぞれ置換することにより、原画像における画素点中のテキスト筆画が強調され、さらに筆画内部の画素の一致性が強調され、且つテキストと背景の差異度が深まれ、これにより、後続のテキスト抽出のためによりよいテキスト強調画像を提供し、後続のテキスト抽出の正確性及び精度を向上することもできる。
【0102】
また、本発明の一実施例は、上述の第2種のテキスト強調方法に対応する第2種のテキスト強調装置を更に提供する。図11は、本発明の一実施例による第2種のテキスト強調装置を示す模式図である。
【0103】
図11に示されたように、第2種のテキスト強調装置は、少なくとも一行のテキストを含む原画像を取得するための取得モジュール901と、原画像におけるテキストの筆画極性を推定するための筆画極性推定モジュール1101とを備えることができる。ここで、極性は、筆画領域内部に位置する画素点と、筆画領域外部に位置する画素点との間の輝度値又は/及び色値の大きさの関係を示す。
【0104】
筆画極性推定モジュール1101は、異なる応用シーンにおいて異なる具体的な配置を行うことができる。図12は、第2種のテキスト強調装置における筆画極性推定モジュール1101を示す模式図である。
【0105】
あるシーンにおいて、極性が筆画領域内部の画素点と、筆画領域外部の画素点との間の輝度値の大きさの関係を示す場合に、図12に示されたように、筆画極性推定モジュール1101は、
水平方向、垂直方向及び二つの対角線方向上において上記式(12)により、筆画応答強度をそれぞれ算出するための第1の算出サブモジュール1201と、
算出した四つの筆画応答強度のうち、最大の筆画応答強度が以下の二つの条件、即ち[f(i)−f(l)]と[f(i)−f(k)]の極性が同じ、且つこの筆画応答強度が予め設定された所定の閾値より大きいことを満たしているか否かを判断するための第1の判断サブモジュール1202と、
第1の判断サブモジュール1202による判断結果が肯定の場合に、[f(i)−f(l)]と[f(i)−f(k)]の極性に基づいて、テキストの推定筆画極性を特定するための第1の特定サブモジュール1203と、
第1の判断サブモジュール1202による判断結果が否定の場合に、ある筆画応答強度が上記二つの条件を満たすまで、算出した筆画応答強度を大きさに従って順番に選択し、且つ第1の判断サブモジュールをトリガし(起動し)、又は、上記四つの筆画応答強度がいずれも上記二つの条件を満たさない場合に、画素点iを非筆画画素点とするための第1のトリガサブモジュール1204と、を備えることができる。
【0106】
図13は、第2種のテキスト強調装置における筆画極性推定モジュール1101を示す他の模式図である。
【0107】
他のシーンにおいて、極性が筆画領域内部の画素点と筆画領域外部の画素点の間の輝度値の大きさの関係を示す場合に、図13に示されたように、筆画極性推定モジュール1101は、
水平方向、垂直方向及び二つの対角線方向の何れかにおいて、上記式(12)により、原画像における各原画素点の筆画応答強度を算出するための第2の算出サブモジュール1301と、
筆画応答強度が以下の二つの条件、即ち[f(i)−f(l)]と[f(i)−f(k)]の極性が同じ、且つこの筆画応答強度が予め設定された所定の閾値より大きいことを同時に満たしているか否かを判断するための第2の判断サブモジュール1302と、
第2の判断サブモジュール1302による判断結果が肯定の場合に、[f(i)−f(l)]と[f(i)−f(k)]の極性に基づいて、原画素点iの初期極性を特定するための第2の特定サブモジュール1303と、
四つの方向上の筆画応答強度の算出がすべて完了したか否かを判断するための第3の判断サブモジュール1304と、
第3の判断サブモジュール1304による判断結果が肯定の場合に、四つの方向上の最大の筆画応答強度の対応する初期極性をテキストの推定筆画極性として特定するための第3の特定サブモジュール1305と、
第3の判断サブモジュール1304による判断結果が否定の場合に、第2の算出サブモジュールをトリガ(起動)するための第2のトリガサブモジュール1306と、を備えることができる。
【0108】
図14は、第2種のテキスト強調装置における筆画極性推定モジュール1101を示す他の模式図である。
【0109】
他のシーンにおいては、極性が筆画領域内部の画素点と、筆画領域外部の画素点との間の色値の大きさの関係を示す場合に、図14に示されたように、筆画極性推定モジュール1101は、
水平方向、垂直方向及び二つの対角線方向において、上記式(13)により、筆画応答強度をそれぞれ算出するための第3の算出サブモジュール1401と、
算出した筆画応答強度のうち、最大の筆画応答強度が以下の二つの条件、即ちチャネルnにおいて[fn(i)−fn(l)]と[fn(i)−fn(k)]の極性が一致し、且つ前記筆画応答強度が予め設定された所定の閾値より大きいことを満たしているか否かを判断するための第4の判断サブモジュール1402と、
第4の判断サブモジュール1402による判断結果が肯定の場合に、[fn(i)−fn(l)]又は[fn(i)−fn(k)]の極性に基づいて、テキストの推定筆画極性を特定するための第4の特定サブモジュール1403と、
第4の判断サブモジュール1402による判断結果が否定の場合に、ある筆画応答強度が上記二つの条件を満たすまで、大きさの関係に従って順番に算出した筆画応答強度を選択し、且つ第4の判断サブモジュール1402をトリガし(起動し)、又は、四つの筆画応答強度がいずれも上記二つの条件を満たしていない場合に、画素点iを非筆画画素点とするための第3のトリガサブモジュール1404と、を備えることができる。
【0110】
図15は、第2種のテキスト強調装置における筆画極性推定モジュール1101を示す他の模式図である。
【0111】
他のシーンにおいて、極性が筆画領域内部の画素点と、筆画領域外部の画素点との間の色値の大きさの関係を示す場合に、図15に示されたように、筆画極性推定モジュール1101は、
水平方向、垂直方向及び二つの対角線方向の何れかにおいて、上記式(13)により、原画像における各原画素点の筆画応答強度を算出するための第4の算出サブモジュール1501と、
筆画応答強度が以下の二つの条件、即ち、チャネルnにおいて[fn(i)−fn(l)]と[fn(i)−fn(k)]の極性が一致し、且つこの筆画応答強度が予め設定された所定の閾値より大きいことを同時に満たしているか否かを判断するための第5の判断サブモジュール1502と、
第5の判断サブモジュール1502による判断結果が肯定の場合に、[fn(i)−fn(l)]又は[fn(i)−fn(k)]の極性に基づいて、原画素点iの初期極性を特定するための第5の特定サブモジュール1503と、
四つの方向上の筆画応答強度の算出がすべて完了したか否かを判断するための第6の判断サブモジュール1504と、
第6の判断サブモジュール1504による判断結果が肯定の場合に、四つの方向上の最大の筆画応答強度の対応する初期極性をテキストの推定筆画極性として特定するための第6の特定サブモジュール1505と、
第6の判断サブモジュール1505による判断結果が否定の場合に、第4の算出サブモジュール1501をトリガ(起動)するための第4のトリガサブモジュール1506と、を備えることができる。
【0112】
再び図11を参照する。第2種のテキスト強調装置は、さらに、原画像における任意な原画素点からその近傍集合における各近傍画素点までの直接差異度と間接差異度とに基づいて、各原画素点の原輝度値又は/及び原色値に対して筆画二次元フィルタリングを行って、原画像のフィルタリング後の更新輝度値又は/及び更新色値を取得するためのフィルタモジュール902を含むことができる。近傍集合の範囲は、原画素点を中心とし、且つ辺長がwである正方形となり、前記wは原画像の高さより小さい。
【0113】
また、図11に示すように、第2種のテキスト強調装置は、さらに、フィルタリング後の更新輝度値又は/及び更新色値と筆画極性とが合わせるか否かを判断し、肯定の場合に、置換モジュール903をトリガ(起動)するための判断モジュール1102を備えることができる。
【0114】
図16は、第2種のテキスト強調装置における判断モジュール1102を示す模式図である。
【0115】
図16に示されたように、実際の応用において、判断モジュール1102は、
フィルタリング後の更新輝度値又は/及び更新色値と、原輝度値又は/及び原色値との第1の大きさの関係を取得するための第3の取得サブモジュール1601と、
第1の大きさの関係と、筆画極性が示す第2の大きさの関係とが合わせるか否かを判断するための第7の判断サブモジュール1602とを備えることができる。
【0116】
なお、第1の大きさの関係及び第2の大きさの関係については、上述の第2種のテキスト強調方法におけるステップS304のフローチャットを示す図8に関連する記載に既に説明したため、ここで省略する。
【0117】
再び図11を参照する。第2種のテキスト強調装置は、さらに、フィルタリング後の更新輝度値又は/及び更新色値で、対応の原輝度値又は/及び原色値をそれぞれ置換して、原画像に対応するテキスト強調画像を生成するための置換モジュール903を備えることができる。
【0118】
本発明の実施例による上述の装置によれば、さらに、筆画極性推定の形態を採用することにより、フィルタリング後の更新色値又は更新輝度値に対して検証を行うことができる。筆画極性がフィルタリング後の更新色値又は/及び更新輝度値と合わせた場合に、さらにフィルタリング後の更新輝度値又は/及び更新色値で、対応の原輝度値又は/及び原色値をそれぞれ置換することにより、取得したテキスト強調画像がより有効且つ精度が良くなる。
【0119】
図17は、本発明の一実施例によるテキスト抽出方法を示すフローチャートである。図17に示されたように、本発明の一実施例は、テキスト強調された後にテキスト抽出方法をさらに提供する。このテキスト抽出方法は、以下のステップを含む。なお、このテキスト抽出方法は、例えば、コンピュータにより実行されてもよい。
【0120】
S1701:少なくとも一行のテキストを含む原画像を取得する。
【0121】
S1702:原画像における任意な原画素点からその近傍集合における各近傍画素点までの直接差異度と間接差異度とに基づいて、各原画素点の原輝度値又は/及び原色値に対して筆画二次元フィルタリングを行って、原画像のフィルタリング後の更新輝度値又は/及び更新色値を取得する。近傍集合の範囲は、原画素点を中心とし、且つ辺長がwである正方形となり、wは原画像の高さより小さい。
【0122】
S1703:フィルタリング後の更新輝度値又は/及び更新色値で、対応の原輝度値又は/及び原色値をそれぞれ置換して、原画像に対応するテキスト強調画像を生成する。
【0123】
S1704:テキスト強調画像におけるテキストを抽出する。
【0124】
上述のテキスト抽出方法を採用すれば、テキスト強調画像に基づいてテキスト抽出を行うことができる。このように抽出されたテキストはより正確に且つ精度が良くなる。同時に、抽出時にテキストが既に強調されたため、テキスト抽出の複雑度を削減し、テキスト抽出の効率を向上することができる。
【0125】
図18は、本発明の一実施例によるテキスト抽出装置を示す模式図である。本発明の一実施例は、図18に示されたように、上述のテキスト抽出方法に対応するテキスト抽出装置をさらに提供する。このテキスト抽出装置は、
少なくとも一行のテキストを含む原画像を取得するための取得モジュール901と、
原画像における任意な原画素点からその近傍集合における各近傍画素点までの直接差異度と間接差異度とに基づいて、各原画素点の原輝度値又は/及び原色値に対して筆画二次元フィルタリングを行って、原画像のフィルタリング後の更新輝度値又は/及び更新色値を取得するためのフィルタモジュール902であって、近傍集合の範囲は、原画素点を中心とし、且つ辺長がwである正方形となり、wは原画像の高さより小さいフィルタモジュール902と、
フィルタリング後の更新輝度値又は/及び更新色値で、対応の原輝度値又は/及び色値をそれぞれ置換して、原画像に対応するテキスト強調画像を生成するための置換モジュール903と、
テキスト強調画像におけるテキストを抽出するための抽出モジュール1801と、を備える。
【0126】
上述のテキスト抽出装置を採用すると、テキスト強調画像に基づいてテキスト抽出を行うことができる。このように抽出されたテキストはより正確に且つ精度が良くなる。同時に、抽出時にテキストが既に強調されたため、テキスト抽出の複雑度を低減し、テキスト抽出の効率を向上することができる。
【0127】
また、ここで説明すべきは、上述の一連の処理又は装置は、ソフトウェア及び/又はファームウェアにより実現されてもよい。ソフトウェア及び/又はファームウェアにより実現される場合に、記憶媒体又はネットワークから、専用ハードウェア構造を有するコンピュータ、例えば図19に示された汎用コンピュータ1900に、このソフトウェア及び/又はファームウェアを構成する各種のプログラムをインストールすることにより、このコンピュータは、各種の機能を実行することができる。
【0128】
図19は、本発明の一実施例による、情報処理装置としてのコンピュータの模式的な構造を示すブロック図である。図19において、中央処理ユニット(CPU)1901は、リードオンリーメモリ(ROM)1902に記憶されたプログラム、又は記憶部1908からランダムアクセスメモリ(RAM)1903にロードされた各種のプログラムに基づいて、各種の処理を実行する。RAM1903には、必要に応じて、CPU1901が各種の処理等を実行するときに必要とするデータも記憶される。
【0129】
CPU1901、ROM1902及びRAM1903は、バス1904を経由して互いに接続される。入力/出力インターフェース1905もバス1904に接続される。
【0130】
キーボード及びマウス等を含む入力部1906と、例えば陰極線管(CRT)又は液晶ディスプレイー(LCD)等のようなディスプレイー及びスピーカ等を含む出力部1907と、ハードディスク等を含む記憶部1908と、LANカードのようなネットワークインターフェースカード及びモデム等を含む通信部1909とは、入力/出力インターフェース1905に接続される。通信部1909は、インターネットのようなネットワークを経由して通信処理を実行する。
【0131】
必要に応じて、ドライブ1910も入力/出力インターフェース1905に接続される。取り外し可能な媒体1911、例えば磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等が必要に応じてドライブ1910に取り付けられ、これによりその中から読み出されたコンピュータプログラムが必要に応じて記憶部1908にインストールされる。
【0132】
ソフトウェアにより上述の一連の処理を実現する場合は、ネットワーク(例えばインターネット)、又は記憶媒体(例えば取り外し可能な媒体1911)から、ソフトウェアを構成するプログラムをインストールする。
【0133】
このような記憶媒体は、図19に示された、その中にプログラムが記憶されており、デバイスから離れて配送されてユーザにプログラムを提供する取り外し可能な媒体1911に限定されないことを、当業者は理解すべきである。取り外し可能な媒体1911としては、例えば、磁気ディスク(フロッピディスク(登録商標)含む)、光ディスク(コンパクトディスクリードオンリーメモリ(CD−ROM)やディジタルヴァーサタイルディスク(DVD)を含む)、光磁気ディスク(ミニディスク(MD)(登録商標)含む)及び半導体メモリを含む。又は、記憶媒体は、ROM1902、又は記憶部1908に含まれるハードディスク等であっても良い。それらは、プログラムを記憶しており、且つそれらを含むデバイスと一緒にユーザに配布される。
【0134】
さらに説明すべきは、上述の一連の処理のステップは、説明した通りに時間順に従って実行することが出来るが、必ず時間順に従うとは限らない。幾つかのステップは、並行又は互いに独立して実行することができる。
【0135】
以上、本発明の好ましい実施例を説明したが、本発明はこの実施例に限定されず、本発明の趣旨を離脱しない限り、本発明に対するあらゆる変更は本発明の技術的範囲に属する。
【0136】
以上の実施例を含む実施形態に関し、更に以下の付記を開示する。
【0137】
(付記1)コンピュータが、画像におけるテキストを強調する方法であって、前記コンピュータが、少なくとも一行のテキストを含む原画像を取得する原画像取得ステップ、前記原画像における任意な原画素点からその近傍集合における各近傍画素点までの直接差異度と間接差異度に基づいて、前記各原画素点の原輝度値又は/及び原色値に対して筆画二次元フィルタリングを行い、前記原画像のフィルタリング後の更新輝度値又は/及び更新色値を取得する更新値取得ステップ、及び、フィルタリング後の前記更新輝度値又は/及び更新色値により、対応する前記原輝度値又は/及び原色値をそれぞれ置換し、前記原画像に対応するテキスト強調画像を生成する強調画像生成ステップを実行し、前記近傍集合の範囲は、前記原画素点を中心とし、且つ辺長がwである正方形となり、wは前記原画像の高さより小さい方法。
【0138】
(付記2)前記更新値取得ステップは、前記原画素点と各近傍画素点の原輝度値又は/及び原色値に対して代数的減算を行って前記直接差異度を取得するステップ、前記原画素点からその近傍集合の各近傍画素点までのグラジエントモジュールに基づいて前記間接差異度を取得するステップ、前記直接差異度及び前記間接差異度に基づいて各近傍画素点の前記原画素点に対する輝度値又は/及び色値の重み値を算出するステップ、以下の筆画二次元フィルタ式を採用して前記原画素点の更新輝度値を算出するステップであって、
【数15】
ここで、N(i)は画素点iの近傍集合を示し、w(i,j)は前記近傍集合内の近傍画素点jの、画素点iに対する輝度値の重み値を示し、f(j)は前記近傍画素点jの原輝度値であるステップ、及び/又は、以下の筆画二次元フィルタ式を採用して前記原画素点の更新色値を算出するステップであって、
【数16】
ここで、wn(i,j)はnチャネルにおいて前記近傍画素点jの、原画素点iに対する色値の重み値を示し、fn(j)はnチャネルにおいて前記近傍画素点jの原色値であるステップを含む、付記1に記載の方法。
【0139】
(付記3)前記コンピュータが、さらに、前記原画像取得ステップの後に、前記原画像におけるテキストの筆画極性を推定する極性推定ステップであって、前記極性は筆画領域内部に位置する画素点と、筆画領域外部に位置する画素点との間の原輝度値又は/及び原色値の大きさの関係を示す極性推定ステップ、及び、前記更新値取得ステップの後に、フィルタリング後の前記更新輝度値又は/及び更新色値と、前記筆画極性とが合わせるか否かを判断し、肯定の場合に、前記原輝度値又は/及び原色値を置換する更新値判断ステップを実行する付記1に記載の方法。
【0140】
(付記4)前記極性が筆画領域内部の画素点と、筆画領域外部の画素点との間の輝度値の大きさの関係を示す場合に、前記極性推定ステップは、水平方向、垂直方向及び二つの対角線方向において、以下の式を採用して筆画応答強度をそれぞれ算出するステップであって、
【数17】
ここで、wは前記原画像の高さの8分の一であり、f(i)は画素点iの輝度値を示すステップ、及び、算出した四つの筆画応答強度のうち最大の筆画応答強度が次の二つの条件、即ち、[f(i)−f(l)]と[f(i)−f(k)]の極性が同じ、且つ前記最大の筆画応答強度が所定の閾値よりも大きいという二つの条件を満たしているか否かを判断し、肯定の場合に、[f(i)−f(l)]と[f(i)−f(k)]の極性に基づいて前記テキストの推定筆画極性を特定し、否定の場合に、ある筆画応答強度が前記二つの条件を満たすまで、算出された前記筆画応答強度を大きさに従って順に選択して前記判断ステップを実行し、或いは、前記四つの筆画応答強度がいずれも前記二つの条件を満たさない場合に、前記画素点iを非筆画画素点とするステップを含む、付記3に記載の方法。
【0141】
(付記5)前記極性が筆画領域内部の画素点と、筆画領域外部の画素点との間の輝度値の大きさの関係を示す場合に、前記極性推定ステップは、水平方向、垂直方向及び二つの対角線方向の何れか一つの方向において、以下の式を採用して前記原画像における各原画素点の筆画応答強度を算出するステップであって、
【数18】
ここで、wは前記原画像の高さの8分の一であり、f(i)は画素点iの輝度値を示すステップ、前記筆画応答強度が次の二つの条件、即ち、[f(i)−f(l)]と[f(i)−f(k)]の極性が同じ、且つ前記筆画応答強度が所定の閾値より大きいという二つの条件を同時に満たすか否かを判断し、肯定の場合に、[f(i)−f(l)]又は[f(i)−f(k)]の極性に基づいて前記原画素点iの初期極性を特定するステップ、及び、四つの方向上の筆画応答強度の算出がすべて完了したか否かを判断し、肯定の場合に、四つの方向上の最大の筆画応答強度が対応する初期極性を、前記テキストの推定筆画極性として特定し、否定の場合に、前記筆画応答強度の算出ステップを繰り返すステップを含む、付記3に記載の方法。
【0142】
(付記6)前記極性が筆画領域内部の画素点と筆画領域外部の画素点との間の色値の大きさの関係を示す場合に、前記極性推定ステップは、水平方向、垂直方向及び二つの対角線方向において、以下の式を採用して筆画応答強度をそれぞれ算出するステップであって、
【数19】
ここで、wは前記原画像の高さの8分の一であり、fn(i)は画素点iのチャネルnにおける色値を示すステップ、算出した四つの筆画応答強度のうち最大の筆画応答強度が次の二つの条件、即ち、チャネルnにおいて[fn(i)−fn(l)]と[fn(i)−fn(l)]との極性が一致し、且つ前記筆画応答強度が所定の閾値より大きいという二つの条件を満たしているか否かを判断し、肯定の場合に、[fn(i)−fn(l)]又は[fn(i)−fn(k)]の極性に基づいて前記テキストの推定筆画極性を特定し、否定の場合に、ある筆画応答強度が前記二つの条件を満たすまで、算出した前記筆画応答強度を大きさに従って順に選択して前記判断ステップを実行し、或いは、前記四つの筆画応答強度がいずれも前記二つの条件を満たしていない場合に、前記画素点iを非筆画画素点とするステップを含む、付記3に記載の方法。
【0143】
(付記7)前記極性が筆画領域内部の画素点と、筆画領域外部の画素点との間の色値の大きさの関係を示す場合に、前記極性推定ステップは、水平方向、垂直方向及び二つの対角線方向の何れか一つの方向において、以下の式を採用して前記原画像における各原画素点の筆画応答強度を算出するステップであって、
【数20】
ここで、wは前記原画像の高さの8分の一であり、fn(i)は画素点iのチャネルnにおいる色値を示すステップ、前記筆画応答強度が次の二つの条件、即ち、チャネルnにおいて[fn(i)−fn(l)]と[fn(i)−fn(k)]との極性が一致し、且つ前記筆画応答強度が所定の閾値より大きいという二つの条件を同時に満たしているか否かを判断し、肯定の場合に、[fn(i)−fn(l)]又は[fn(i)−fn(k)]の極性に基づいて前記原画素点iの初期極性を特定するステップ、及び、四つの方向上の筆画応答強度の算出がすべて完了したか否かを判断し、肯定の場合に、四つの方向上の最大の筆画応答強度が対応する初期極性を、前記テキストの推定筆画極性として特定し、否定の場合に、前記筆画応答強度算出ステップを繰り返すステップを含む、付記3に記載の方法。
【0144】
(付記8)前記更新値判断ステップは、フィルタリング後の前記更新輝度値又は/及び更新色値と、前記原輝度値又は/及び原色値との第1の大きさの関係を取得するステップ、及び、前記第1の大きさの関係と、前記筆画極性に示された第2の大きさの関係とが合わせるか否かを判断するステップを含む、付記3に記載の方法。
【0145】
(付記9)画像におけるテキストを強調する装置であって、少なくとも一行のテキストを含む原画像を取得する取得モジュールと、前記原画像における任意な原画素点からその近傍集合における各近傍画素点までの直接差異度と間接差異度に基づいて、前記各原画素点の原輝度値又は/及び原色値に対して筆画二次元フィルタリングを行って、前記原画像のフィルタリング後の更新輝度値又は/及び更新色値を取得するフィルタモジュールと、フィルタリング後の前記更新輝度値又は/及び更新色値で、対応する前記原輝度値又は/及び原色値をそれぞれ置換して、前記原画像に対応するテキスト強調画像を生成する置換モジュールと、を含み、前記近傍集合の範囲は、前記原画素点を中心とし、且つ辺長がwである正方形となり、wは前記原画像の高さより小さい装置。
【0146】
(付記10)前記のフィルタモジュールは、前記原画素点と各近傍画素点との原輝度値又は/及び原色値に対して代数的減算を行って前記直接差異度を取得する第1の取得サブモジュール、前記原画素点からその近傍集合の各近傍画素点までのグラジエントモジュールに基づいて前記間接差異度を取得する第2の取得サブモジュール、前記直接差異度と間接差異度に基づいて各近傍画素点の、前記原画素点に対する輝度値又は/及び色値の重み値を算出する重み算出サブモジュール、以下の筆画二次元フィルタ式を採用して、前記原画素点の更新輝度値を算出する更新輝度値算出サブモジュールと、及び/又は、
【数21】
以下の筆画二次元フィルタ式を採用して、前記原画素点の更新色値を算出する更新色値算出サブモジュールを含み、
【数22】
ここで、N(i)は画素点iの近傍集合を示し、w(i,j)は近傍画素点jの、原画素点iに対する輝度値の重み値を示し、f(j)は前記近傍画素点jの輝度値であり、wn(i,j)はnチャネルにおいて近傍画素点jの、原画素点iに対する色値の重み値を示し、fn(j)はnチャネルにおいて前記近傍集合内の画素点jの色値である、付記9に記載の装置。
【0147】
(付記11)前記原画像におけるテキストの筆画極性を推定する筆画極性推定モジュールと、フィルタリング後の前記更新輝度値又は/及び更新色値と、前記筆画極性とが合わせるか否かを判断し、肯定の場合に、前記置換モジュールをトリガする判断モジュールと、を更に含み、前記極性は筆画領域内部に位置する画素点と、筆画領域外部に位置する画素点との間の原輝度値又は/及び原色値の大きさの関係を示す、付記9に記載の装置。
【0148】
(付記12)前記極性が筆画領域内部の画素点と筆画領域外部の画素点との間の輝度値の大きさの関係を示す場合に、前記筆画極性推定モジュールは、水平方向、垂直方向及び二つの対角線方向において、下記の式を採用して筆画応答強度をそれぞれ算出する第1の算出サブモジュールであって、
【数23】
ここで、wは前記原画像の高さの8分の一であり、f(i)は画素点iの輝度値を示す第1の算出サブモジュール、算出した四つの筆画応答強度のうち最大の筆画応答強度が次の二つの条件、即ち、[f(i)−f(l)]と[f(i)−f(k)]の極性が同じ、且つ前記筆画応答強度が所定の閾値よりも大きいという二つの条件を満たしているか否かを判断する第1の判断サブモジュール、及び、前記第1の判断サブモジュールによる結果が肯定の場合に、[f(i)−f(l)]と[f(i)−f(k)]の極性に基づいて前記テキストの推定筆画極性を特定する第1の特定サブモジュールと、前記第1の判断サブモジュールによる結果が否定の場合に、ある筆画応答強度が前記二つの条件を満たすまで、算出された前記筆画応答強度を大きさに従って順に選択して前記第1の判断サブモジュールをトリガし、或いは、前記四つの筆画応答強度がいずれも前記二つの条件を満たさない場合に、前記画素点iを非筆画画素点とする第1のトリガサブモジュールを含む、付記11に記載の装置。
【0149】
(付記13)前記極性が筆画領域内部の画素点と、筆画領域外部の画素点との間の輝度値の大きさの関係を示す場合に、前記筆画極性推定モジュールは、水平方向、垂直方向及び二つの対角線方向の何れか一つの方向において、以下の式を採用して前記原画像における各原画素点の筆画応答強度を算出するため第2の算出サブモジュールであって、
【数24】
ここで、wは前記原画像の高さの8分の一であり、f(i)は画素点iの輝度値を示す第2の算出サブモジュール、前記筆画応答強度が次の二つの条件、即ち、[f(i)−f(l)]と[f(i)−f(k)の極性が同じ、且つ前記筆画応答強度が所定の閾値よりも大きいという二つの条件を同時に満たすか否かを判断する第2の判断サブモジュール、前記第2の判断サブモジュールによる結果が肯定の場合に、[f(i)−f(l)]又は[f(i)−f(k)]の極性に基づいて前記原画素点iの初期極性を特定する第2の特定サブモジュール、四つの方向上の筆画応答強度の算出がすべて完了したか否かを判断する第3の判断サブモジュール、前記第3の判断サブモジュールによる結果が肯定の場合に、四つの方向上の最大の筆画応答強度が対応する初期極性を、前記テキストの推定筆画極性として特定するための第3の特定サブモジュール、前記第3の判断サブモジュールによる結果が否定の場合に、前記の第2の算出サブモジュールをトリガ(起動)する第2のトリガサブモジュールを含む、付記11に記載の装置。
【0150】
(付記14)前記極性が筆画領域内部の画素点と、筆画領域外部の画素点との間の色値の大きさの関係を示す場合に、前記筆画極性推定モジュールは、水平方向、垂直方向及び二つの対角線方向において、以下の式を採用して筆画応答強度をそれぞれ算出する第3の算出サブモジュールであって、
【数25】
ここで、wは前記原画像の高さの8分の一であり、fn(i)はチャネルnにおいて画素点iの色値を示す第3の算出サブモジュール、算出した四つの筆画応答強度のうち最大の筆画応答強度が次の二つの条件、即ち、チャネルnにおいて[fn(i)−fn(l)]と[fn(i)−fn(l)]との極性が一致し、且つ前記筆画応答強度が所定の閾値よりも大きいという二つの条件を満たしているか否かを判断する第4の判断サブモジュール、前記第4の判断サブモジュールによる結果が肯定の場合に、[fn(i)−fn(l)]又は[fn(i)−fn(k)]の極性に基づいて前記テキストの推定筆画極性を特定する第4の特定サブモジュール、及び、前記第4の判断サブモジュールによる結果が否定の場合に、ある筆画応答強度が前記二つの条件を満たすまで、算出した前記筆画応答強度を大きさに従って順に選択して前記第4の判断サブモジュールをトリガし、或いは、前記四つの筆画応答強度がいずれも前記二つの条件を満たしていない場合に、前記画素点iを非筆画画素点とする第3のトリガサブモジュールを含む、付記11に記載の装置。
【0151】
(付記15)前記極性が筆画領域内部の画素点と、筆画領域外部の画素点との間の色値の大きさの関係を示す場合に、前記筆画極性推定モジュールは、水平方向、垂直方向及び二つの対角線方向の何れか一つの方向において、以下の式を採用して前記原画像における各原画素点の筆画応答強度を算出する第4の算出サブモジュールであって、
【数26】
ここで、wは原画像の高さの8分の一であり、fn(i)はチャネルnにおいて画素点iの色値を示す第4の算出サブモジュール、前記筆画応答強度が次の二つの条件、即ち、チャネルnにおいて[fn(i)−fn(l)]と[fn(i)−fn(k)]との極性が一致し、且つ前記筆画応答強度が所定の閾値よりも大きいという二つの条件を同時に満たしているか否かを判断する第5の判断サブモジュール、前記第5の判断サブモジュールによる結果が肯定の場合に、[fn(i)−fn(l)]又は[fn(i)−fn(k)]の極性に基づいて前記原画素点iの初期極性を特定する第5の特定サブモジュール、四つの方向上の筆画応答強度の算出がすべて完了したか否かを判断する第6の判断サブモジュールと、前記第6の判断サブモジュールによる結果が肯定の場合に、四つの方向上の最大の筆画応答強度が対応する初期極性を、前記テキストの推定筆画極性として特定する第6の特定サブモジュール、及び、前記第6の判断サブモジュールによる結果が否定の場合に、前記の第4の算出サブモジュールをトリガする第4のトリガサブモジュールを含む、付記11に記載の装置。
【0152】
(付記16)前記の判断モジュールは、フィルタリング後の前記更新輝度値又は/及び更新色値と、原輝度値又は/及び原色値との第1の大きさの関係を取得する第3の取得サブモジュールと、前記第1の大きさの関係と、前記筆画極性に示された第2の大きさの関係とが合わせるか否かを判断する第7の判断サブモジュールとを含む、付記11に記載の装置。
【0153】
(付記17)コンピュータが、画像におけるテキストを抽出する方法であって、コンピュータが、少なくとも一行のテキストを含む原画像を取得するステップ、前記原画像における任意な原画素点からその近傍集合における各近傍画素点までの直接差異度と間接差異度に基づいて、前記各原画素点の原輝度値又は/及び原色値に対して筆画二次元フィルタリングを行い、前記原画像のフィルタリング後の更新輝度値又は/及び更新色値を取得するステップ、前記フィルタリング後の更新輝度値又は/及び更新色値で、対応する前記原輝度値又は/及び原色値をそれぞれ置換して、前記原画像に対応するテキスト強調画像を生成するステップ、及び、前記テキスト強調画像におけるテキストを抽出するステップを実行し、前記近傍集合の範囲は、原画素点を中心とし、且つ辺長がwである正方形となり、wは前記原画像の高さより小さい方法。
【0154】
(付記18)画像におけるテキストを抽出する装置であって、少なくとも一行のテキストを含む原画像を取得するモジュール、前記原画像における任意な原画素点からその近傍集合における各近傍画素点までの直接差異度と間接差異度に基づいて、前記各原画素点の原輝度値又は/及び原色値に対して筆画二次元フィルタリングを行い、前記原画像のフィルタリング後の更新輝度値又は/及び更新色値を取得するモジュール、フィルタリング後の前記更新輝度値又は/及び更新色値で、対応する前記原輝度値又は/及び原色値をそれぞれ置換して、前記原画像に対応するテキスト強調画像を生成するモジュール、及び、前記テキスト強調画像におけるテキストを抽出するモジュールを含み、前記近傍集合の範囲は、原画素点を中心とし、且つ辺長がwである正方形となり、wは前記原画像の高さより小さい装置。
【特許請求の範囲】
【請求項1】
コンピュータが、画像におけるテキストを強調する方法であって、
前記コンピュータが、
少なくとも一行のテキストを含む原画像を取得する現画像取得ステップ、
前記原画像における任意な原画素点からその近傍集合における各近傍画素点までの直接差異度及び間接差異度に基づいて、前記各原画素点の原輝度値又は/及び原色値に対して筆画二次元フィルタリングを行い、前記原画像のフィルタリング後の更新輝度値又は/及び更新色値を取得する更新値取得ステップ、及び
前記原画像のフィルタリング後の前記更新輝度値又は/及び更新色値により、対応する前記原輝度値又は及び原色値をそれぞれ置換し、前記原画像に対応するテキスト強調画像を生成する強調画像生成ステップを実行し、
前記近傍集合の範囲は、前記原画素点を中心とし、且つ辺長がwである正方形となり、wは前記原画像の高さより小さい方法。
【請求項2】
前記更新値取得ステップは、
前記原画素点と各近傍画素点との原輝度値又は/及び原色値に対して代数的減算を行って前記直接差異度を求めるステップ、
前記原画素点からその近傍集合の各近傍画素点までのグラジエントモジュールに基づいて前記間接差異度を求めるステップ、
前記直接差異度及び前記間接差異度に基づいて、各近傍画素点の、前記原画素点に対する輝度値又は/及び色値の重み値を算出するステップ、
以下の筆画二次元フィルタ式を採用して、前記原画素点の更新輝度値を算出するステップであって、
【数27】
ここで、N(i)は画素点iの近傍集合を示し、w(i,j)は近傍画素点jの、原画素点iに対する輝度値の重み値を示し、f(j)は前記近傍画素点jの輝度値であるステップ、及び/又は、
以下の筆画二次元フィルタ式を採用して、前記原画素点の更新色値を算出するステップであって、
【数28】
ここで、wn(i,j)はnチャネルにおいて近傍画素点jの、原画素点iに対する色値の重み値を示し、fn(j)はnチャネルにおいて前記近傍画素点jの色値であるステップを含む、請求項1に記載の方法。
【請求項3】
前記コンピュータが、更に、
前記原画像取得ステップの後に、前記原画像におけるテキストの筆画極性を推定する極性推定ステップであって、前記極性は筆画領域内部に位置する画素点と、筆画領域外部に位置する画素点との間の原輝度値又は/及び原色値の大きさの関係を示す極性推定ステップ、及び、
前記更新値取得ステップの後に、フィルタリング後の前記更新輝度値又は/及び更新色値と、前記筆画極性とが合わせるか否かを判断し、肯定の場合に、前記原輝度値又は/原色値を置換する更新値判断ステップを実行する、請求項1に記載の方法。
【請求項4】
前記極性が筆画領域内部の画素点と、筆画領域外部の画素点との間の輝度値の大きさの関係を示す場合に、前記極性推定ステップは、
前記原画像の幅方向、高さ方向及び二つの対角線方向において、以下の式を採用して筆画応答強度をそれぞれ算出するステップであって、
【数29】
ここで、wは前記原画像の高さの8分の一であり、f(i)は画素点iの輝度値を示すステップ、及び
算出した四つの筆画応答強度のうち最大の筆画応答強度が次の二つの条件、即ち、[f(i)−f(l)]と[f(i)−f(k)]の極性が同じ、且つ前記筆画応答強度が所定の閾値よりも大きいとの二つの条件を満たしているか否かを判断し、肯定の場合に、[f(i)−f(l)]と[f(i)−f(k)]の極性に基づいて前記テキストの推定筆画極性を特定し、否定の場合に、ある筆画応答強度が前記二つの条件を満たすまで、前記四つの筆画応答強度を大きさに従って順に選択して該判断ステップを実行し、又は、前記四つの筆画応答強度がいずれも前記二つの条件を満たさない場合に、前記画素点iを非筆画画素点とするステップを含む、請求項3に記載の方法。
【請求項5】
前記極性が筆画領域内部の画素点と、筆画領域外部の画素点との間の輝度値の大きさの関係を示す場合に、前記極性推定ステップは、
前記原画像の幅方向、高さ方向及び二つの対角線方向の何れか一つの方向において、以下の式を採用して前記原画像における各原画素点の筆画応答強度を算出するステップであって、
【数30】
ここで、wは前記原画像の高さの8分の一であり、f(i)は画素点iの輝度値を示すステップ、
前記筆画応答強度が次の二つの条件、即ち、[f(i)−f(l)]と[f(i)−f(k)]の極性が同じ、且つ前記筆画応答強度が所定の閾値よりも大きいとの二つの条件を同時に満たすか否かを判断し、肯定の場合に、[f(i)−f(l)]又は[f(i)−f(k)]の極性に基づいて前記原画素点iの初期極性を特定するステップ、及び
四つの方向上の筆画応答強度の算出がすべて完了したか否かを判断し、肯定の場合に、四つの方向上の最大の筆画応答強度が対応する初期極性を、前記テキストの推定筆画極性として特定し、否定の場合に、前記筆画応答強度の算出ステップを繰り返すステップを含む、請求項3に記載の方法。
【請求項6】
前記極性が筆画領域内部の画素点と、筆画領域外部の画素点との間の色値の大きさの関係を示す場合に、前記極性推定ステップは、
前記原画像の幅方向、高さ方向及び二つの対角線方向において、以下の式を採用して前記原画像における各原画素点の筆画応答強度をそれぞれ算出するステップであって、
【数31】
ここで、wは前記原画像の高さの8分の一であり、fn(i)はチャネルnにおいて画素点iの色値を示すステップ、及び
算出した四つの筆画応答強度のうち最大の筆画応答強度が次の二つの条件、即ち、チャネルnにおいて[fn(i)−fn(l)]と[fn(i)−fn(l)]との極性が一致し、且つ前記筆画応答強度が所定の閾値よりも大きいとの二つの条件を満たしているか否かを判断し、肯定の場合に、[fn(i)−fn(l)]又は[fn(i)−fn(k)]の極性に基づいて、前記テキストの推定筆画極性を特定し、否定の場合に、ある筆画応答強度が前記二つの条件を満たすまで、前記四つの筆画応答強度を大きさに従って順に選択して該判断ステップを実行し、又は、前記四つの筆画応答強度がいずれも前記二つの条件を満たしていない場合に、前記画素点iを非筆画画素点とするステップを含む、請求項3に記載の方法。
【請求項7】
前記極性が筆画領域内部の画素点と、筆画領域外部の画素点との間の色値の大きさの関係を示す場合に、前記極性推定ステップは、
前記原画像の幅方向、高さ方向及び二つの対角線方向の何れか一つの方向において、以下の式を採用して前記原画像における各原画素点の筆画応答強度を算出するステップであって、
【数32】
ここで、wは前記原画像の高さの8分の一であり、fn(i)はチャネルnにおいて画素点iの色値を示すステップ、
前記筆画応答強度が次の二つの条件、即ち、チャネルnにおいて[fn(i)−fn(l)]と[fn(i)−fn(k)]との極性が一致し、且つ前記筆画応答強度が所定の閾値よりも大きいとの二つの条件を同時に満たしているか否かを判断し、肯定の場合に、[fn(i)−fn(l)]又は[fn(i)−fn(k)]の極性に基づいて前記原画素点iの初期極性を特定するステップ、及び
四つの方向上の筆画応答強度の算出がすべて完了したか否かを判断し、肯定の場合に、四つの方向上の最大の筆画応答強度が対応する初期極性を、前記テキストの推定筆画極性として特定し、否定の場合に、前記筆画応答強度の算出ステップを繰り返すステップを含む、請求項3に記載の方法。
【請求項8】
前記更新値判断ステップは、
フィルタリング後の前記更新輝度値又は/及び更新色値と、前記原輝度値又は/及び原色値との第1の大きさの関係を取得するステップ、及び
前記第1の大きさの関係と、前記筆画極性が示す第2の大きさの関係とが合わせるか否かを判断するステップを含む、請求項3に記載の方法。
【請求項9】
画像におけるテキストを強調する装置であって、
少なくとも一行のテキストを含む原画像を取得する取得モジュール、
前記原画像における任意な原画素点からその近傍集合における各近傍画素点までの直接差異度及び間接差異度に基づいて、前記各原画素点の原輝度値又は/及び原色値に対して筆画二次元フィルタリングを行い、前記原画像のフィルタリング後の更新輝度値又は/及び更新色値を取得するフィルタモジュール、及び
フィルタリング後の前記更新輝度値又は/及び更新色値で、対応する前記原輝度値又は/及び原色値をそれぞれ置換し、前記原画像に対応するテキスト強調画像を生成する置換モジュール、を含み、
前記近傍集合の範囲は、原画素点を中心とし、且つ辺長がwである正方形となり、wは前記原画像の高さより小さい装置。
【請求項10】
コンピュータが、画像におけるテキストを抽出する方法であって、
前記コンピュータが、
少なくとも一行のテキストを含む原画像を取得するステップ、
前記原画像における任意な原画素点からその近傍集合における各近傍画素点までの直接差異度及び間接差異度に基づいて、前記各原画素点の原輝度値又は/及び原色値に対して筆画二次元フィルタリングを行い、前記原画像のフィルタリング後の更新輝度値又は/及び更新色値を取得するステップ、
フィルタリング後の前記更新輝度値又は/及び更新色値により、対応する前記原輝度値又は/及び原色値をそれぞれ置換し、前記原画像に対応するテキスト強調画像を生成するステップ、及び
前記テキスト強調画像におけるテキストを抽出するステップを実行し、
前記近傍集合の範囲は、原画素点を中心とし、且つ辺長がwである正方形となり、wは前記原画像の高さより小さい方法。
【請求項1】
コンピュータが、画像におけるテキストを強調する方法であって、
前記コンピュータが、
少なくとも一行のテキストを含む原画像を取得する現画像取得ステップ、
前記原画像における任意な原画素点からその近傍集合における各近傍画素点までの直接差異度及び間接差異度に基づいて、前記各原画素点の原輝度値又は/及び原色値に対して筆画二次元フィルタリングを行い、前記原画像のフィルタリング後の更新輝度値又は/及び更新色値を取得する更新値取得ステップ、及び
前記原画像のフィルタリング後の前記更新輝度値又は/及び更新色値により、対応する前記原輝度値又は及び原色値をそれぞれ置換し、前記原画像に対応するテキスト強調画像を生成する強調画像生成ステップを実行し、
前記近傍集合の範囲は、前記原画素点を中心とし、且つ辺長がwである正方形となり、wは前記原画像の高さより小さい方法。
【請求項2】
前記更新値取得ステップは、
前記原画素点と各近傍画素点との原輝度値又は/及び原色値に対して代数的減算を行って前記直接差異度を求めるステップ、
前記原画素点からその近傍集合の各近傍画素点までのグラジエントモジュールに基づいて前記間接差異度を求めるステップ、
前記直接差異度及び前記間接差異度に基づいて、各近傍画素点の、前記原画素点に対する輝度値又は/及び色値の重み値を算出するステップ、
以下の筆画二次元フィルタ式を採用して、前記原画素点の更新輝度値を算出するステップであって、
【数27】
ここで、N(i)は画素点iの近傍集合を示し、w(i,j)は近傍画素点jの、原画素点iに対する輝度値の重み値を示し、f(j)は前記近傍画素点jの輝度値であるステップ、及び/又は、
以下の筆画二次元フィルタ式を採用して、前記原画素点の更新色値を算出するステップであって、
【数28】
ここで、wn(i,j)はnチャネルにおいて近傍画素点jの、原画素点iに対する色値の重み値を示し、fn(j)はnチャネルにおいて前記近傍画素点jの色値であるステップを含む、請求項1に記載の方法。
【請求項3】
前記コンピュータが、更に、
前記原画像取得ステップの後に、前記原画像におけるテキストの筆画極性を推定する極性推定ステップであって、前記極性は筆画領域内部に位置する画素点と、筆画領域外部に位置する画素点との間の原輝度値又は/及び原色値の大きさの関係を示す極性推定ステップ、及び、
前記更新値取得ステップの後に、フィルタリング後の前記更新輝度値又は/及び更新色値と、前記筆画極性とが合わせるか否かを判断し、肯定の場合に、前記原輝度値又は/原色値を置換する更新値判断ステップを実行する、請求項1に記載の方法。
【請求項4】
前記極性が筆画領域内部の画素点と、筆画領域外部の画素点との間の輝度値の大きさの関係を示す場合に、前記極性推定ステップは、
前記原画像の幅方向、高さ方向及び二つの対角線方向において、以下の式を採用して筆画応答強度をそれぞれ算出するステップであって、
【数29】
ここで、wは前記原画像の高さの8分の一であり、f(i)は画素点iの輝度値を示すステップ、及び
算出した四つの筆画応答強度のうち最大の筆画応答強度が次の二つの条件、即ち、[f(i)−f(l)]と[f(i)−f(k)]の極性が同じ、且つ前記筆画応答強度が所定の閾値よりも大きいとの二つの条件を満たしているか否かを判断し、肯定の場合に、[f(i)−f(l)]と[f(i)−f(k)]の極性に基づいて前記テキストの推定筆画極性を特定し、否定の場合に、ある筆画応答強度が前記二つの条件を満たすまで、前記四つの筆画応答強度を大きさに従って順に選択して該判断ステップを実行し、又は、前記四つの筆画応答強度がいずれも前記二つの条件を満たさない場合に、前記画素点iを非筆画画素点とするステップを含む、請求項3に記載の方法。
【請求項5】
前記極性が筆画領域内部の画素点と、筆画領域外部の画素点との間の輝度値の大きさの関係を示す場合に、前記極性推定ステップは、
前記原画像の幅方向、高さ方向及び二つの対角線方向の何れか一つの方向において、以下の式を採用して前記原画像における各原画素点の筆画応答強度を算出するステップであって、
【数30】
ここで、wは前記原画像の高さの8分の一であり、f(i)は画素点iの輝度値を示すステップ、
前記筆画応答強度が次の二つの条件、即ち、[f(i)−f(l)]と[f(i)−f(k)]の極性が同じ、且つ前記筆画応答強度が所定の閾値よりも大きいとの二つの条件を同時に満たすか否かを判断し、肯定の場合に、[f(i)−f(l)]又は[f(i)−f(k)]の極性に基づいて前記原画素点iの初期極性を特定するステップ、及び
四つの方向上の筆画応答強度の算出がすべて完了したか否かを判断し、肯定の場合に、四つの方向上の最大の筆画応答強度が対応する初期極性を、前記テキストの推定筆画極性として特定し、否定の場合に、前記筆画応答強度の算出ステップを繰り返すステップを含む、請求項3に記載の方法。
【請求項6】
前記極性が筆画領域内部の画素点と、筆画領域外部の画素点との間の色値の大きさの関係を示す場合に、前記極性推定ステップは、
前記原画像の幅方向、高さ方向及び二つの対角線方向において、以下の式を採用して前記原画像における各原画素点の筆画応答強度をそれぞれ算出するステップであって、
【数31】
ここで、wは前記原画像の高さの8分の一であり、fn(i)はチャネルnにおいて画素点iの色値を示すステップ、及び
算出した四つの筆画応答強度のうち最大の筆画応答強度が次の二つの条件、即ち、チャネルnにおいて[fn(i)−fn(l)]と[fn(i)−fn(l)]との極性が一致し、且つ前記筆画応答強度が所定の閾値よりも大きいとの二つの条件を満たしているか否かを判断し、肯定の場合に、[fn(i)−fn(l)]又は[fn(i)−fn(k)]の極性に基づいて、前記テキストの推定筆画極性を特定し、否定の場合に、ある筆画応答強度が前記二つの条件を満たすまで、前記四つの筆画応答強度を大きさに従って順に選択して該判断ステップを実行し、又は、前記四つの筆画応答強度がいずれも前記二つの条件を満たしていない場合に、前記画素点iを非筆画画素点とするステップを含む、請求項3に記載の方法。
【請求項7】
前記極性が筆画領域内部の画素点と、筆画領域外部の画素点との間の色値の大きさの関係を示す場合に、前記極性推定ステップは、
前記原画像の幅方向、高さ方向及び二つの対角線方向の何れか一つの方向において、以下の式を採用して前記原画像における各原画素点の筆画応答強度を算出するステップであって、
【数32】
ここで、wは前記原画像の高さの8分の一であり、fn(i)はチャネルnにおいて画素点iの色値を示すステップ、
前記筆画応答強度が次の二つの条件、即ち、チャネルnにおいて[fn(i)−fn(l)]と[fn(i)−fn(k)]との極性が一致し、且つ前記筆画応答強度が所定の閾値よりも大きいとの二つの条件を同時に満たしているか否かを判断し、肯定の場合に、[fn(i)−fn(l)]又は[fn(i)−fn(k)]の極性に基づいて前記原画素点iの初期極性を特定するステップ、及び
四つの方向上の筆画応答強度の算出がすべて完了したか否かを判断し、肯定の場合に、四つの方向上の最大の筆画応答強度が対応する初期極性を、前記テキストの推定筆画極性として特定し、否定の場合に、前記筆画応答強度の算出ステップを繰り返すステップを含む、請求項3に記載の方法。
【請求項8】
前記更新値判断ステップは、
フィルタリング後の前記更新輝度値又は/及び更新色値と、前記原輝度値又は/及び原色値との第1の大きさの関係を取得するステップ、及び
前記第1の大きさの関係と、前記筆画極性が示す第2の大きさの関係とが合わせるか否かを判断するステップを含む、請求項3に記載の方法。
【請求項9】
画像におけるテキストを強調する装置であって、
少なくとも一行のテキストを含む原画像を取得する取得モジュール、
前記原画像における任意な原画素点からその近傍集合における各近傍画素点までの直接差異度及び間接差異度に基づいて、前記各原画素点の原輝度値又は/及び原色値に対して筆画二次元フィルタリングを行い、前記原画像のフィルタリング後の更新輝度値又は/及び更新色値を取得するフィルタモジュール、及び
フィルタリング後の前記更新輝度値又は/及び更新色値で、対応する前記原輝度値又は/及び原色値をそれぞれ置換し、前記原画像に対応するテキスト強調画像を生成する置換モジュール、を含み、
前記近傍集合の範囲は、原画素点を中心とし、且つ辺長がwである正方形となり、wは前記原画像の高さより小さい装置。
【請求項10】
コンピュータが、画像におけるテキストを抽出する方法であって、
前記コンピュータが、
少なくとも一行のテキストを含む原画像を取得するステップ、
前記原画像における任意な原画素点からその近傍集合における各近傍画素点までの直接差異度及び間接差異度に基づいて、前記各原画素点の原輝度値又は/及び原色値に対して筆画二次元フィルタリングを行い、前記原画像のフィルタリング後の更新輝度値又は/及び更新色値を取得するステップ、
フィルタリング後の前記更新輝度値又は/及び更新色値により、対応する前記原輝度値又は/及び原色値をそれぞれ置換し、前記原画像に対応するテキスト強調画像を生成するステップ、及び
前記テキスト強調画像におけるテキストを抽出するステップを実行し、
前記近傍集合の範囲は、原画素点を中心とし、且つ辺長がwである正方形となり、wは前記原画像の高さより小さい方法。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【公開番号】特開2013−4094(P2013−4094A)
【公開日】平成25年1月7日(2013.1.7)
【国際特許分類】
【出願番号】特願2012−132919(P2012−132919)
【出願日】平成24年6月12日(2012.6.12)
【出願人】(000005223)富士通株式会社 (25,993)
【Fターム(参考)】
【公開日】平成25年1月7日(2013.1.7)
【国際特許分類】
【出願日】平成24年6月12日(2012.6.12)
【出願人】(000005223)富士通株式会社 (25,993)
【Fターム(参考)】
[ Back to top ]