説明

文書文字差異検出装置

【課題】複数の文書画像における印刷文字の差異を容易に把握できる。
【解決手段】差異領域抽出部101によって比較対象の2つの画像の差異がある部分の差分領域を抽出する。差異がある文字領域にある2つの文字画像の文字を文字認識部102によってそれぞれ認識する。具体的には文字パターンデータベース105のデータを参照して入力された文字画像がどの文字画像に近いかを判断し対応する文字コードを得る。次に、文字比較部103によって各文字コードを比較し、同じ文字コードであればフォント違いとして結果を出力する。同じ文字コードでなければ文字自体の違いとして結果を出力する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、文書文字差異検出装置に関するものである。
【背景技術】
【0002】
ビジネス分野において、帳票は欠かすことのできないツールである。帳票とは、帳簿や伝票類の総称であり、流通、経理など様々な場所で利用されている。この帳票は膨大な数となり、帳票を管理する管理方法が重要となってくる。現在は帳票もデジタル化が進み、デジタルデータとして保存されているが、デジタルデータに基づいて帳票を印刷する機会も多い。例えば帳票の種類によってはデジタルデータに基づいて印刷した帳票に署名や捺印を行うことがある。この帳票の印刷は一度だけに限らず、複数回行われることがあり、異なるプリンタによって帳票を印刷することもある。各プリンタでは出力フォーマットやプログラム言語であるページ記述言語の変換方法が異なる。このため、同じ帳票データであっても各プリンタ毎で出力した帳票である印刷物の間で位置ずれなどが発生することがある。例えば各プリンタの出力フォーマットの違いによって印刷文字の出力位置が変わったり、ページ記述言語に変換する方法が異なることによって別の印刷文字や空白に変換されたりすることがある。このような印刷文字の差異は、管理者が目視検査により検出していた。この管理者による目視検査は時間を要すると共に、2つの印刷物の印刷文字を相互に目視で比較する作業は管理者への負担も大きい。そのため、2つの印刷物の間で印刷文字の差異を検出できる文書文字差異検出装置が求められている。
【0003】
その文書文字差異検出装置として、特許文献1に記載のものが知られている。この特許文献1の文書文字差異検出装置の構成を図5に示す。同図にように、2つの互いに異なるプリンタ(図示せず)によって同じ帳票データに基づいて2つの印刷物201、202を出力する。その印刷物201、202をスキャナ203でそれぞれ光学的に読み込んでデジタル画像データにそれぞれ変換する。そして、変換された2つのデジタル画像データの差異を表示する差異表示画像を文書文字差異検出装置204によって作成する。ここで、文書文字差異検出装置204の構成を図6に示す。同図に示すように文書文字差異検出装置204は、印刷画像取得部301、二値化部302、画像補正部303、差異表示画像作成部304及び差異表示画像出力部305を含んで構成されている。そして、印刷画像取得部301によって同じ帳票データに基づいて図示していない2つのプリンタによって印刷された2つの印刷物を図5のスキャナ20により光学的に読み込んで変換された2つのデジタル画像データを取得する。二値化部302では、印刷画像取得部301が取得した2つのデジタル画像データをそれぞれ二値化する。例えば一定の明度を閾値とし、この閾値より明るい画素を白、暗い画素を黒とする。そして、画像補正部303では、2つの画像の上下左右のずれ、回転、拡大縮小などの位置合わせ及びサイズ合わせの補正を行う。差異表示画像作成部304では補正後の2つの画像における画素を互いに比較し差分がある画素を画像の差異とする。そして、その画像の差異の画素には例えば色を使ってわかりやすく表示する差異表示画像を作成する。差異表示画像出力部305は、作成された差異表示画像を図5の出力装置205に出力する。
【0004】
文書文字差異検出装置における差異表示画像作成部によって作成された差異表示画像の一例を図7に示す。図7の画像401及び画像402は、同じ帳票データに基づいて異なるプリンタでそれぞれ印刷した印刷物である。画像403は、画像401及び画像402をそれぞれスキャナで光学的に読み込み、デジタル画像データにそれぞれ変換すると共に各画像の位置合わせ等の補正を施した2つのデジタル画像データを重ね、印刷したり、あるいはモニタ等の表示部に表示したものである。そして、その出力された画像403では、少なくとも、第1画像のみ黒画素の部分、第2画像のみ黒画素の部分、第1画像及び第2画像の黒画素が重なっている部分、の3種類の画像を例えば複数色で色分けすることによって2つの印刷物における画像の差異部分404〜407を容易に把握することができる。
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、上記特許文献1の文書文字差異検出装置では、図8に示すような複数の文書画像における印刷文字の差異部分を特定できても以下のような理由で印刷文字の差異が、文字自体の違いであるのか、あるいはフォントの違いであるのかは判別できない。図8の文字群1は、「あ」「い」「う」のゴシック体で印刷した3つの印刷文字からなる文字群である。文字群2は、「あ」「い」「え」のゴシック体で印刷した3つの印刷文字からなる文字群である。文字群3は、「あ」「い」「う」の明朝体で印刷した3つの印刷文字からなる文字群である。これらの文字群を光学的に読み込み位置合わせやサイズ合わせの補正を施して画素の比較を行ったとき、文字群1と文字群2とを比較した結果を示す結果画像1のように、3文字目の印刷文字の文字自体で差異があることが明らかにわかる。一方、文字群1と文字群3とを比較した場合、その結果を示す結果画像2のように、3文字の印刷文字全ての文字自体は互いに同じであると判別できるが、文字群3の印刷文字のフォントの特徴部分が文字群1の印刷文字に隠れてしまい印刷文字のフォントの違いを判別することが難しくなっている。上記特許文献1の文書文字差異検出装置では、複数の文書画像における印刷文字の文字自体の違いを特定できても、印刷文字のフォントの違いを特定することができなかった。
【0006】
本発明は以上の問題点に鑑みなされたものであり、その目的は、複数の文書画像における印刷文字の差異が文字自体の違いであるのか、あるいはフォントの違いであるかを容易に判別できる文書文字差異検出装置を提供することである。
【課題を解決するための手段】
【0007】
上記目的を達成するために、請求項1の発明は、印刷文字データを含む同じ帳票データに基づいて異なる複数の印刷装置によって出力した複数の帳票を光学的に読み取って各デジタル文書画像データを取得する文書画像取得手段と、各デジタル文書画像データをそれぞれ二値化する二値化手段と、二値化された各画像データに互いの位置合わせ及びサイズ合わせを行う補正を施す補正手段と、補正後の各画像データの画素同士を比較する比較手段と、比較結果により画素の差分がある部分を各画像データの差異部分とし、当該差分部分内に含まれている印刷文字を特定するように表示する差異表示画像を作成する差異表示画像作成手段と、作成された差異表示画像を出力する差異表示画像出力手段とを備える文書文字差異検出装置において、前記差異部分の各印刷文字を文字認識した結果に基づいて、前記差異部分の各印刷文字を差異が文字自体の違いであるのか、あるいはフォントの違いであるかを判別する差異判別手段と、該差異判別手段による判別結果を出力する判別結果出力手段とを備えることを特徴とするものである。
【0008】
本発明においては、帳票データに基づいて印刷装置から出力した帳票では、印刷装置が異なると、同じ帳票データであっても、出力された各帳票における印刷文字の文字自体あるいはフォントが変わることがある。各印刷文字の文字自体は同じであるにもかかわらず各画像では差異部分があるということは各印刷文字のフォントが違う場合が考えられる。それ以外の場合では各印刷文字の文字自体が違う場合である。各印刷文字の文字自体が互いに同じか否かを検出するために各印刷文字の文字認識を行うことにより、その文字認識の結果によって文字が異なっていれば差異部分の各印刷文字の差異が文字自体の違いであり、文字が同じであれば差異部分の各印刷文字の差異がフォントの違いであることが判別できる。そして、その判別結果を判別結果出力手段によって出力する。これにより、複数の文書画像における印刷文字の差異が文字自体の違いであるのか、あるいはフォントの違いであるのかを容易に判別することができる。
【発明の効果】
【0009】
本発明によれば、複数の文書画像における印刷文字の差異が文字自体の違いであるのか、あるいはフォントの違いであるのかを容易に判別できるという特有な効果が得られる。
【図面の簡単な説明】
【0010】
【図1】本発明の実施形態に係る文書文字差異検出装置の一構成例を示すブロック図である。
【図2】図1の差異判別部の一構成例を示すブロック図である。
【図3】文字パターンデータベースの特徴量と文字コードの一例を示す図である。
【図4】本実施形態の文書文字差異検出装置における差異判別処理を示すフローチャートである。
【図5】従来の文書文字差異検出システムの構成例を示す概略図である。
【図6】図5の文書文字差異検出装置の構成例を示すブロック図である。
【図7】差異表示画像の一例を示す図である。
【図8】印刷文字の差異判別の結果を示す図である。
【発明を実施するための形態】
【0011】
以下、本発明の実施形態を図面に基づき説明する。
【0012】
図1は本発明の実施形態に係る文書文字差異検出装置の一構成例を示すブロック図である。同図において、図6と同じ参照符号は同じ構成要素を示す。本実施形態の文書文字差異検出装置1は、印刷画像取得部301、二値化部302、画像補正部303、差異判別部100、差異表示画像作成部304及び差異表示画像出力部305を含んで構成されている。図6の文書文字差異検出装置204と異なる構成としての差異判別部100は、2つの文書画像における印刷文字の差異が文字のフォントの違いによるものか、文字自体の違いによるものかを判別する。
【0013】
この印刷文字の差異を判別する差異判別部について詳細に説明する。図2は図1の差異判別部の一構成例を示すブロック図である。差異判別部100は、差異領域抽出部101、文字認識部102、文字比較部103、差異出力部104及び文字パターンデータベース105を含んで構成されている。そして、差異領域抽出部101は、2つの文書画像における印刷文字の差異がある部分の文字領域を抽出する。文字領域の抽出は、例えば2つの文書画像の画素を互いに比較し、画素に差分がある画素をもとにその画素から連続する画素を連結成分として抽出し、抽出した連結成分をもとに外接する外接矩形を設定しその外接矩形を差分領域とするなどの方法で行う。あるいは、黒ランのヒストグラムによる文字切出し方法を用いてもよい。印刷文字は所定の矩形領域内に印刷されているので連結成分抽出によって設定された外接矩形が重なるようであればその各差分領域は1つの差分領域にまとめるなどしても良い。
【0014】
そして、2つのスキャン画像の濃度差やノイズなどの影響により、同じフォント、同じ文字であっても微少な差異が出ることがある。この場合は、差異領域抽出部101では設定した閾値より小さい差異がある文字は差異がある文字から除くなどの処理を行ってもよい。次に、文字認識部102では、印刷文字の画像を入力として受け取り、文字コードのような、どの文字かを表す値を出力する。例えば文字コードと印刷文字画像を対向づけたテーブルを文字パターンデータベース105に格納しておき、入力された印刷文字画像がどの文字画像に近いかを判断し対応する文字コードを出力する。文字パターンデータベース105に登録しておくのは印刷文字画像以外の文字の特徴量でも良い。この場合は入力画像の特徴量と近いものを探すことになる。文字パターンデータベース105の一例を図3に示す。同図に示す文字パターンデータベースの例では、印刷文字の特徴量の集合と文字コードを対応づけたものである。そして、文字パターンデータベースは必要な文字分だけのデータを持つ。文字認識処理では認識したい文字画像と文字パターンデータベースとを比較して最も近いデータを特定し、特定したデータの文字コードを出力する。
【0015】
文字認識によって対応する文字コードが得られないこともある。ノイズなどの影響でスキャナ画像の品質が悪かったりすると文字画像と文字コードの対応付けに失敗してしまう可能性がある。このような場合には文字コードを出力する代わりに、文字認識に失敗したという結果を出力する。また、文字認識には別の印刷文字と認識してしまう認識誤りが起こることもあるので、文字認識の確からしさを調節できるようになっていてもよい。入力された文字画像と文字パターンデータベースの画像を比較する際に、類似度のようなものの算出を行い、その類似度が最も高いものを認識結果として出力する。この場合に、その最も高い類似度が予め設定した閾値より低かったときには認識失敗とされるので、信頼性の高い認識結果だけを後の処理での比較に回すことになる。これにより、この認識誤りのまま次の比較結果に回すことを減らすことができるという利点がある。また、類似度に対する閾値はユーザが手動で指定してもよいし、画像の特性から自動で設定するようにしてもよい。次に、図2の文字比較部103では、文字認識部102からの文字コードが同じあれば同じ文字であるのでフォントが違うだけであると判断し、文字コードが異なっていれば文字自体が違うと判別する。また、文字認識部102で文字認識に失敗したという結果が出力されていた場合には差異不明と判断する。そして、差異出力部104は、文字比較部103による判別結果を図1の差異表示画像作成部304に出力する。
【0016】
次に、本実施形態の文書文字差異検出装置における差異判別処理について当該処理フローを示す図4に従って説明する。
先ず、図2の差異領域抽出部101によって比較対象の2つの画像の差異がある部分の差分領域を抽出する(ステップS101)。差異がある文字領域にある2つの文字画像の文字を文字認識部102によってそれぞれ認識する(ステップS102)。具体的には文字パターンデータベース105のデータを参照して入力された文字画像がどの文字画像に近いかを判断し対応する文字コードを得る。そして、文字認識が成功したか否かを判断し(ステップS103)、文字認識が成功していれば、それぞれの文字コードを得る(ステップS103;YES)。次に、文字比較部103によって各文字コードを比較し(ステップS104)、同じ文字コードであればフォント違いとして結果を出力する(ステップS105;YES、ステップS106)。同じ文字コードでなければ文字自体の違いとして結果を出力する(ステップS105;NO、ステップS107)。また、ステップS103で文字認識が成功しなかったならば差異不明として結果を出力する(ステップS103;NO、ステップS108)。各結果を出力したら、文字認識した差異領域が最後の差異領域かを判定し(ステップS109)最後の差異領域となるまでステップS102に戻って差異判別を繰り返す。
【0017】
以上に説明したものは一例であり、本発明は、次の態様毎に特有の効果を奏する。
(態様A)
差異部分の各印刷文字を文字認識した結果に基づいて、差異部分の各印刷文字の差異が文字自体の違いであるのか、あるいはフォントの違いであるかを判別する差異判別手段と、該差異判別手段による判別結果を出力する判別結果出力手段とを備える。これによれば、上記実施形態について説明したように、帳票データに基づいて印刷装置から出力した帳票では、印刷装置が異なると、同じ帳票データであっても、出力された各帳票における印刷文字の文字自体あるいはフォントが変わることがある。各印刷文字の文字自体は同じであるにもかかわらず各画像では差異部分があるということは各印刷文字のフォントが違う場合が考えられる。それ以外の場合では各印刷文字の文字自体が違う場合である。各印刷文字の文字自体が互いに同じか否かを検出するために差異判別部100における文字認識部102によって各印刷文字の文字認識を行うことにより、その文字認識の結果によって文字が異なっていれば差異部分の各印刷文字の差異が文字自体の違いであり、文字が同じであれば差異部分の各印刷文字の差異がフォントの違いであることが差異判別部100における文字比較部103によって判別できる。これにより、複数の文書画像における印刷文字の差異が文字自体の違いであるのか、あるいはフォントの違いであるのかを容易に判別できる。
(態様B)
(態様A)において、差異判別手段は、印刷文字の特徴量と印刷文字に付された規定の文字コードを対応付けさせて格納されたデータベースを参照して抽出された部分内の各印刷文字の特徴量にそれぞれ対応する文字コードをそれぞれ読み出して各印刷文字を認識する文字認識手段と、読み出した各文字コードを互いに比較する文字比較手段とを有している。これによれば、上記実施形態について説明したように、差異判別部100における差異領域抽出部101によって比較対象の2つの画像の差異がある部分の差分領域を抽出する。差異がある文字領域にある2つの文字画像の文字を文字認識部102によってそれぞれ認識する。具体的には文字パターンデータベース105のデータを参照して入力された文字画像がどの文字画像に近いかを判断し対応する文字コードを得る。次に、文字比較部103によって各文字コードを比較し、同じ文字コードであればフォント違いとして判別結果を出力する。同じ文字コードでなければ文字自体の違いとして判別結果を出力する。これにより、複数の文書画像における印刷文字の差異が文字自体の違いであるのか、あるいはフォントの違いであるのかを容易に判別して印刷文字の差異を特定できる。
(態様C)
(態様A)において、文字認識手段で各印刷文字のいずれか1つでもデータベースから文字コードの読み出しができなかったときは、差異判別手段の判別結果は差異不明とする。これによれば、上記実施形態について説明したように、認識誤りのまま次の比較結果に回すことを減らすことができる。
【符号の説明】
【0018】
100 差異判別部
101 差異領域抽出部
102 文字認識部
103 文字比較部
104 差異出力部
105 文字パターンデータベース
201 印刷物
202 印刷物
203 スキャナ
204 文書文字差異検出装置
205 出力装置
301 印刷画像取得部
302 二値化部
303 画像補正部
304 差異表示画像作成部
305 差異表示画像出力部
401〜403 画像
404〜407 差異部分
【先行技術文献】
【特許文献】
【0019】
【特許文献1】特開2007−293809号公報

【特許請求の範囲】
【請求項1】
印刷文字データを含む同じ帳票データに基づいて異なる複数の印刷装置によって出力した複数の帳票を光学的に読み取って各デジタル文書画像データを取得する文書画像取得手段と、各デジタル文書画像データをそれぞれ二値化する二値化手段と、二値化された各画像データに互いの位置合わせ及びサイズ合わせを行う補正を施す補正手段と、補正後の各画像データの画素同士を比較する比較手段と、比較結果により画素の差分がある部分を各画像データの差異部分とし、当該差分部分内に含まれている印刷文字を特定するように表示する差異表示画像を作成する差異表示画像作成手段と、作成された差異表示画像を出力する差異表示画像出力手段とを備える文書文字差異検出装置において、
前記差異部分の各印刷文字を文字認識した結果に基づいて、前記差異部分の各印刷文字の差異が文字自体の違いであるのか、あるいはフォントの違いであるかを判別する差異判別手段と、
該差異判別手段による判別結果を出力する判別結果出力手段と
を備えることを特徴とする文書文字差異検出装置。
【請求項2】
請求項1記載の文書文字差異検出装置において、
前記差異判別手段は、印刷文字の特徴量と印刷文字に付された規定の文字コードを対応付けさせて格納されたデータベースを参照して抽出された部分内の各印刷文字の特徴量にそれぞれ対応する文字コードをそれぞれ読み出して各印刷文字を認識する文字認識手段と、読み出した各文字コードを互いに比較する文字比較手段とを有し、前記文字認識手段によって読み出した各印刷文字の各文字コードを前記文字比較手段によって互いに比較し各文字コードが同じであれば各印刷文字の差異がフォントの違いであると判別し、各文字コードが同じでなければ各印刷文字の差異が文字自体の違いであると判別し、各判別結果を前記判別結果出力手段によって出力することを特徴とする文書文字差異検出装置。
【請求項3】
請求項2記載の文書文字差異検出装置において、
前記文字認識手段で各印刷文字のいずれか1つでも前記データベースから文字コードの読み出しができなかったときは、前記差異判別手段による判別結果は差異不明とすることを特徴とする文書文字差異検出装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate


【公開番号】特開2013−90262(P2013−90262A)
【公開日】平成25年5月13日(2013.5.13)
【国際特許分類】
【出願番号】特願2011−231472(P2011−231472)
【出願日】平成23年10月21日(2011.10.21)
【出願人】(000006747)株式会社リコー (37,907)
【Fターム(参考)】