説明

画像処理装置および画像処理プログラム

【課題】抽出対象のドキュメント画像と原本画像との差分に含まれる欠損部分、特に複雑な文字などに発生した途切れ部分をより正確に接続して修復可能とする。
【解決手段】ドキュメントから追記画像(追記情報)を抽出する画像処理において、抽出対象の追記ドキュメント画像データと原本ドキュメント画像データとの差分を差分抽出部111でとって追記情報を生成し、この追記情報に含まれる欠損部分を修復する際に、欠損部分に相当する細線(リンク)を、第2の細線化部113で細線化して得た細線化追記ドキュメント画像から欠損線分特定部114で特定し(見つけ出し)、その特定した細線で欠損部分を修復する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像処理装置および画像処理プログラムに関し、特に例えば追記情報の解析処理などにおいて行われる原本ドキュメントと追記ドキュメントとの差分データに含まれる欠損部の修復処理など、様々なデータ抽出処理によって得られる欠損部を含む線画データの修復を効率的に実行する画像処理装置および画像処理プログラムに関する。
【背景技術】
【0002】
画像処理の分野において、例えばプリンタやFAX(ファクシミリ装置)などから出力したドキュメントに、ユーザがペンや鉛筆、スタンプなどで追記した部分を抽出したり、セキュリティ文書が改竄されていないかどうかを検証したりする処理について、様々な研究、開発が行われている。
【0003】
一般的に、このような追記抽出、改竄検証などの処理には、オリジナルのドキュメントデータと、追記等の可能性がある出力ドキュメントとを比較する処理が行われる。すなわち、追記抽出の対象となる紙ドキュメントをスキャナなどの画像読取装置でスキャンして得たスキャン画像データと、PC(パーソナルコンピュータ)やプリンタなどのサーバに蓄積されている原本画像データとの差分をとることによって追記画像データを抽出するというものである。
【0004】
ところが、スキャン画像データと原本画像データとの差分をとる手法では、ドキュメント上に元から存在する文字や図形などの既存画像に対して、追記した文字や図形などの追記画像に重なり部分がある場合に、差分処理によって抽出した追記画像(追記情報)に既存画像との重なり部分が含まれず、当該重なり部分で途切れた画像となってしまうという問題があった。
【0005】
そのため、従来は、スキャン画像から原本画像を差し引いて得た追記画像の途切れ部分を修復するようにしていた。具体的には、例えば、原本画像の黒画素を順次走査し、着目黒画素の周囲8画素に追記画像の黒画素があるときに、着目画素に相当する追記画像の画素を黒にするという処理を行うことによって途切れを修復するようにしていた(例えば、特許文献1参照)。
【0006】
また、スキャン画像から原本画像を差し引く差分処理によって得た追記画像から、途切れた追記部分の輪郭を作成し、その輪郭画像から原本画像をさらに差し引くことによって接続すべき端点の座標と接続方向を検出し、さらに、その端点位置と接続方向の情報から端点同士を接続し閉曲線を構成してその内部を着色するという処理を行うことにより、途切れの発生してしまった追記画像の途切れ部分を接続(修復)するようにしていた(例えば、特許文献2参照)。
【0007】
【特許文献1】特開平08−063546号公報
【特許文献2】特開2004−213230号公報
【発明の開示】
【発明が解決しようとする課題】
【0008】
しかしながら、追記画像を検出しようとするドキュメントのスキャン画像には画質の劣化、即ちかすれ具合や色合いに変化が発生してしまう可能性が高い。プリントおよび追記の後に、何回かコピーされている場合などは特に、追記部分はかすれなど画質劣化が激しいために、追記画像の抽出対象のドキュメントスキャン画像から抽出した追記部分の輪郭は、直線ではなくジグザグになる場合が多い。このため、端点および補間方向(接続方向)の特定が困難となり、上記特許文献1,2記載の手法を適用しても、完全な形で修復した追記画像を取得することは難しい。
【0009】
また、途切れを修復して追記画像を取得する際、直線の途切れのように接続すべき端点を容易に発見できる場合は大きな問題がないが、ペンや鉛筆などの筆記具によって追記された文字など、複雑な線分を持つ追記画像における途切れ修復にあっては、接続すべき端点を正確に発見するが難しいために、上記特許文献1,2記載の手法を適用しても、正確な途切れ修復は困難である。
【0010】
本発明は、上記課題に鑑みてなされたものであって、その目的とするところは、例えばドキュメントから追記画像(追記情報)を抽出する画像処理において、抽出対象のドキュメント画像と原本画像との差分に含まれる欠損部分、特に複雑な文字などに発生した途切れ部分を、より正確に接続して修復することが可能な画像処理装置および画像処理プログラムを提供することにある。
【課題を解決するための手段】
【0011】
上記目的を達成するために、本発明では次のような構成を採っている。すなわち、所定の画像から所定の情報を抽出する、例えば原本ドキュメントに対して追記処理のなされた追記ドキュメントの画像から追記情報を抽出する。そして、この抽出した追記情報に対して細線化処理を実行するとともに、前記追記ドキュメントの画像に対して細線化処理を実行する。そして、追記ドキュメントの画像を細線化した第2の細線化画像から、抽出した追記情報を細線化した第1の細線化画像の欠損部分に相当する線分を特定して欠損線分画像を生成し、この欠損線分画像と第1の細線化画像とを合成して修復追記抽出画像を生成する。
【0012】
例えば、ドキュメントから追記情報を抽出する画像処理において、抽出対象の追記ドキュメント画像と原本ドキュメント画像との差分から抽出される追記情報に含まれる欠損部分を修復する際に、追記ドキュメントの画像を細線化した第2の細線化画像(細線化追記ドキュメント画像)から、抽出した追記情報を細線化した第1の細線化画像(細線化追記抽出画像)の欠損部分に相当する線分を特定することで、欠損部分に相当する線分を第2の細線化画像から見つけ出すことができる。そして、この見つけ出した線分を第1の細線化画像と合成することで、抽出した追記情報に含まれる欠損部分を修復できる。
【発明の効果】
【0013】
本発明によれば、欠損部分に相当する線分を細線化追記ドキュメント画像から見つけ出し、その線分で欠損部分を修復することにより、どの端点とどの端点とを接続すれば良いのかが明確になるために、かすれなどスキャン画像の劣化が激しい場合でも、また漢字などの複雑な文字に発生した途切れ部分でも、より正確に接続して修復することができる。
【発明を実施するための最良の形態】
【0014】
以下、本発明の実施の形態について図面を参照して詳細に説明する。
【0015】
図1は、本発明が適用される画像情報処理システムの構成の概略を示すシステム構成図である。図1において、画像処理装置100は本発明による画像処理装置に相当し、例えば、原本ドキュメント10と、当該原本ドキュメント10に対してコメントやアンダーラインなどの様々なメモ書きを含む情報(追記情報)が記入された追記ドキュメント20とから、両ドキュメント上の画像の差分をとって追記情報を抽出する処理において、差分情報の欠損部を修復する処理を行う。
【0016】
なお、本発明による画像処理装置100は、差分処理のみならず、その他、様々な処理によって得られた欠損部を含む情報における当該欠損部を修復する処理全般に適用可能である。図1には、その一つの処理例である差分処理に係る画像情報処理システムを例示しているに過ぎない。
【0017】
本適用例に係る画像情報処理システムにおいては、原本ドキュメント10と追記ドキュメント20とを画像読取装置、例えばスキャナ30によって読み取り、この読み取りによって得られた原本ドキュメント画像データと追記ドキュメント画像データとを画像処理装置100に入力する。画像処理装置100は、原本ドキュメント画像データと追記ドキュメント画像データとから、両ドキュメント上の画像の差分をとって追記情報を抽出するとともに、抽出した追記情報に含まれる欠損部を修復する処理を行う。
【0018】
ところで、背景技術の欄において説明したように、従来の差分抽出技術では、原本ドキュメントと追記ドキュメントとの画像の重なり部分が途切れた追記情報として抽出される問題がある。このことについて具体的に説明する。
【0019】
例えば、図2に示すように、原本ドキュメント51と当該原本ドキュメント51に線分53が追記された追記ドキュメント52とがある場合を考える。この場合、本来追記情報は、線分53であるにもかかわらず、原本ドキュメント51と追記ドキュメント52との差分をとると、追記抽出情報(差分データ)55に示すように、原本ドキュメント51の画像との重なり部分で途切れた線分として抽出されるために、追記情報を正しく抽出できない。
【0020】
なお、本発明による画像処理装置100は、図2に示す差分処理によって抽出した追記情報の修復処理だけでなく、その他の手法によって取得された様々な欠損部を含む途切れ情報の修復処理も実行することができる。
【0021】
例えば、図3(A)は、原本ドキュメントの画像を適用することなく、追記ドキュメント61の画像のみから追記抽出情報62を抽出する処理例を示している。例えば、追記ドキュメント61の元画像と異なる色で追記情報が追記されている場合、この追記色情報のみを追記ドキュメント61から抽出する処理によって、追記抽出情報62が取得される。しかし、この場合も、原本画像との重なり部分が途切れた画像として追記情報が取得される。
【0022】
また、図3(B)は、罫線付きドキュメント71から罫線を除去した罫線除去情報72を抽出する処理例を示している。このような抽出処理を行った場合、罫線部としての直線を除去することで、罫線との重なり部分が除去された情報が出力され、本来取得したい追記情報の一部が欠落してしまう。
【0023】
本発明による画像処理装置100は、このような途切れ部分や欠損部分を持つ追記抽出情報55,62,72について、途切れ部分や欠損部分をより確実に修復して、途切れや欠損のない追記抽出情報を効率的にかつ確実に正確に生成する処理を行うことを特徴としている。
【0024】
以下に、本発明による画像処理装置100およびその処理プログラムについて具体的に説明する。
【0025】
図4は、本発明による画像処理装置100を含む画像情報処理システムのより具体的な構成例を示すブロック図である。図4において、画像データ入力部41は、図1のスキャナ30に相当し、原本ドキュメントの画像を読み取ることによって得られる原本ドキュメント画像データと、追記ドキュメント20の画像を読み取ることによって得られる追記ドキュメント画像データとを本発明による画像処理装置100に入力する。
【0026】
なお、ここでは、原本ドキュメント画像データおよび追記ドキュメント画像データの両方をスキャナ30で読み取ってそれらの画像データを画像処理装置100に入力するとしているが、原本ドキュメント画像データについては、例えば、サーバから与えられる電子原本の画像データを画像処理装置100に入力しても良く、また本画像処理装置100内のメモリに蓄積されている電子原本の画像データを用いることも可能である。
【0027】
画像処理装置100は、CPU(Central Processing Unit:中央演算装置)101、I/O回路102、ROM103、RAM104およびHDD(ハードディスクドライブ)装置105などを有し、これら構成要素がバスライン106を介して相互に通信可能に接続された構成となっている。
【0028】
CPU101は、演算処理を含む本画像処理装置100全体の処理の制御を行う。I/O回路102は、画像データ入力部41および画像データ出力部42を含む周辺機器との入出力を管理する。ROM103は、CPU101による制御の下に実行される各種処理の処理プログラムを格納する。RAM104は、当該各種処理の実行時に使用される一次記憶装置である。HDD105は、CPU101による制御の下に処理された画像データや、外部から取り込んだ画像データなどを記憶する。
【0029】
画像データ出力部41は、プリンタやディスプレイ等の出力装置とその制御手段によって構成され、画像処理装置100での処理によって追記ドキュメントから抽出され、途切れ部分や欠損部分が修復された途切れや欠損のない追記情報(追記抽出情報)を印刷(記録)紙に印刷出力したり、あるいは、表示画面上に表示出力したりする。
【0030】
[実施例1]
図5は、本発明の実施例1に係る画像処理装置100Aの機能構成例を示すブロック図である。図5に示すように、本実施例1に係る画像処理装置100Aは、差分抽出部111、第1の細線化部112、第2の細線化部113、欠損線分特定部114および合成部115を有する構成となっている。
【0031】
(差分抽出部)
差分抽出部111は、特許請求の範囲の情報抽出手段に相当し、所定の画像から所定の情報を抽出する。例えば、原本ドキュメント画像データと、原本に含まれない追記情報を含む追記ドキュメント画像データとの差分をとることにより、原本に含まれない追記情報を抽出して追記抽出画像データとして出力する。ここで、差分抽出には、周知の技術、例えば特開2004−213230号公報や、特開2004−341914号公報等に記載の技術を用いることができる。その差分抽出技術とは、例えば、原本ドキュメント画像データのx,y座標位置と、追記ドキュメント画像データのx,y座標位置との差分の有無を検出し、差分が存在する場合にのみ追記情報として抽出するというものである。
【0032】
この差分抽出処理例について図6を参照してより具体的に説明する。図6には、原本ドキュメント251と追記ドキュメント252とから差分を抽出する処理例を示している。追記ドキュメント252には、元々の原本ドキュメント251には含まれない追記情報253が含まれている。
【0033】
差分抽出部111は、原本ドキュメント251と追記ドキュメント252とから両画像の差分をとることによって追記情報を抽出し、その追記抽出画像データ254として出力する。ただし、図6から明らかなように、差分抽出によって得られる追記抽出画像データ254に含まれる抽出情報は、原本データとの重なり部分(図に示す原本に元々記載のある文字「ますか」との重なり部分)が途切れた不完全な追記情報である。
【0034】
(細線化部)
第1の細線化部112は、差分抽出部111から出力される追記抽出画像データに対して細線化処理を実行する。第2の細線化部113は、追記ドキュメント画像データに対して細線化処理を実行する。
【0035】
ここに、第1,第2の細線化部112,113での細線化処理とは、処理対象の画像に含まれる線分を、太い線も細い線も一律に、線分の中心を表す線幅が例えば1画素(ドット)の線に変換する処理を言う。具体的には、細線化処理では、例えば、着目画素を左上から右下へ移動させながら、その周りの画素値パターンによって着目画素の画素値を変更する。
【0036】
図7に、第1,第2の細線化部112,113が実行する細線化処理の具体例を示す。第1の細線化部112は、図7(a)に示すように、差分抽出部111での差分抽出によって抽出した追記情報のみからなる追記抽出画像データ254に対して細線化処理を施すことにより、第1の細線化画像である細線化追記抽出画像255を生成し、当該細線化追記抽出画像255を欠損線分特定部114に対して出力する。この細線化処理により、細線化追記抽出画像255は欠損部を含む線分画像となる。
【0037】
一方、第2の細線化部113は、図7(b)に示すように、原本情報および追記情報の双方を含む追記ドキュメント画像データ256に対して細線化処理を施すことにより、第2の細線化画像である細線化追記ドキュメント256を生成し、当該細線化追記ドキュメント256を欠損線分特定部114に対して出力する。
【0038】
なお、追記抽出画像データの細線化処理の前処理として、当該追記抽出画像データに対して膨張処理を施して太線化を実行し、微小な欠損部分を消滅させた後、細線化処理を実行する構成を採るようにしても良い。ここに、膨張処理(太線化処理)とは、線分などの有効画像領域を上下左右にn画素膨らませる処理を言う。この膨張処理により、微小な欠損部分を消滅させることが可能となる。その後、細線化処理を実行することで、比較的大きな欠損部分のみが残った細線化データを生成することができる。
【0039】
(欠損線分特定部)
欠損線分特定部114は、第2の細線化部113が出力する細線化追記ドキュメント256から、第1の細線化部112が出力する細線化追記抽出画像255の欠損部分に相当する線分を特定して欠損線分画像を生成する。図5に示すように、欠損線分特定部114は、ノード位置特定部1141、リンク長算出部1142、リンク分類部1143および最短リンク集合探索部1144によって構成されている。
【0040】
ノード位置特定部1141は、細線化追記抽出画像255における端点および細線化追記ドキュメント256における交点、分岐点、端点をノードとし、当該ノードの位置(座標)を特定する。具体的には、着目画素を左上から右下へ移動させながら、その周りの画素値パターンによって交点、分岐点、端点を抽出してノードとし、当該ノードの座標位置を記憶する。
【0041】
リンク長算出部1142は、ノード位置特定部1141が特定したノードの座標位置を基に、ノードとノードとの結ぶ細線(以下、「リンク」と記述する)の長さを算出する。具体的には、各ノードからON画素(白背景における黒画素/黒背景における白画素)を1ドット(画素)ずつたどって、次のノードに到達するまでのドット数(画素数)をリンク長として算出する。
【0042】
リンク分類部1143は、リンク長算出部1142が算出したリンク長を基に、各リンクが概ね細線化追記抽出画像255と重なるかどうかを検出して、重なり無しリンク集合を抽出する。例えば、全リンクを一つずつ細線化追記抽出画像255と重なりが無いかチェックしてゆき、重なるドットが1つでもあるリンクは、それを重なり有りと判定する。
【0043】
最短リンク集合探索部1144は、リンク分類部1143が分類した最短リンク集合、即ち重なり無しリンク集合から、細線化追記抽出画像255の2端点を最短長で結ぶリンクの集合を探索して欠損線分画像とする。具体的には、細線化追記抽出画像255の端点から生成されたノード一つ一つについて、重なり無しリンク集合に属するリンクをつないで他の細線化追記抽出画像の端点から生成されたノードに到達するかどうかを検出し、つながるものがあればそれを最短リンク集合とする。また、複数ある場合は、リンク長の総和が小さい方を最短リンク集合とする。
【0044】
また、別の方法として、ダイクストラ法を使うこともできる。ダイクストラ法は、カーナビ等で現在地から目的地に至る最短距離経路を求める手法として多用されており、任意のノードを起点に他の全てのノードに到達する最短距離経路、即ち最短リンク集合を一意的に求めることができる。この特性を利用し、細線化追記抽出画像255の端点から生成されたノードが最短距離で到達できる他の追記画像細線の端点から生成されたノードおよびその経路を一意的に求めることができる。
【0045】
(合成部)
合成部115は、欠損線分特定部114が特定した欠損線分画像と、第1の細線化部112が追記抽出画像データから生成した細線化追記抽出画像との合成処理を実行して、修復追記抽出画像データとして出力する。この合成処理では、欠損線分特定部114の最短リンク集合探索部1144が探索した最短リンク集合に相当する細線化追記抽出画像255上の画素をON画素(画像を表示する有効画素)にする画素値変更を行う。
【0046】
合成部115の処理例について、図8を参照して説明する。図8に示す細線化追記抽出画像255は、第1の細線化部112が追記抽出画像データから生成した細線化追記抽出画像データに基づく画像である。また、図8に示す欠損線分特定部114の出力画像271は、欠損線分特定部114が細線化追記ドキュメント256から特定した、細線化追記抽出画像255の欠損部分に相当する欠損線分によって構成される画像である。本例の場合、出力画像271には、5つの欠損線分a,b,c,d,eが含まれている。
【0047】
合成部115は、これら図8に示す細線化追記抽出画像255と欠損線分特定部114の出力画像271とを合成する処理を行う。この合成処理の結果、図8に示す修復追記抽出画像データ281が生成される。
【0048】
以上説明した実施例1に係る画像処理装置100Aの各構成要素、即ち差分抽出部111、第1,第2の細線化部112,113、欠損線分特定部114および合成部115、さらには欠損線分特定部114を構成するノード位置特定部1141、リンク長算出部1142、リンク分類部1143および最短リンク集合探索部1144については、パーソナルコンピュータ(PC)のように、所定プログラムを実行することによって情報記憶処理、画像処理、演算処理等の各機能を実行するコンピュータ機器を利用してソフトウェア構成によって実現することが考えられる。ただし、ソフトウェア構成による実現に限られるものではなく、ハードウェア構成、あるいはハードウェアとソフトウェアの複合構成によって実現することも可能である。
【0049】
ソフトウェア構成によって実現する場合、差分抽出部111、第1,第2の細線化部112,113、欠損線分特定部114および合成部115、さらにはノード位置特定部1141、リンク長算出部1142、リンク分類部1143および最短リンク集合探索部1144としてコンピュータを機能させるプログラムが本発明による画像処理プログラムとなる。
【0050】
また、以下に説明する画像処理シーケンスにおける各ステップの処理を実行するプログラムが、本発明による画像処理プログラムであるとも言える。そして、これらの画像処理プログラムについては、あらかじめコンピュータ内にインストールしておくことが考えられる。ただし、あらかじめインストールされているのではなく、コンピュータ読み取り可能な記憶媒体に格納されて提供されるものであっても良く、または有線若しくは無線による通信手段を介して配信されるものであっても良い。
【0051】
(欠損部の修復処理)
次に、上記構成の実施例1に係る画像処理装置100Aにおいて、CPU101(図4参照)による制御の下に実行する、追記抽出画像の欠損部分を修復する画像処理の処理シーケンスの手順の一例について、図9および図10のフローチャートにしたがって説明する。
【0052】
先ず、差分抽出(差分抽出部111での処理に相当)によって抽出した追記情報のみからなる追記抽出画像に対して細線化処理を行って細線化追記抽出画像とし(ステップS11)、次いで原本情報および追記情報の双方を含む追記ドキュメントに対して細線化処理を行って細線化追記ドキュメントとする(ステップS12)。これらの細線化処理は、図5の第1,第2の細線化部112,113の処理に相当する。
【0053】
次に、図7(a)から明らかなように、欠損部を多数含む線分画像である細線化追記抽出画像のノード(端点)を抽出し、抽出したノードの各々に識別子であるノードIDを付与するとともに、各ノードの位置(座標)を取得する(ステップS13)。この時点における細線化追記抽出画像のノード数(端点数)をNmとする。次いで、細線化追記ドキュメントのノード(端点・交点・分岐点)を抽出し、抽出したノードの各々にノードIDを付与するとともに、各ノードの位置(座標)を取得する(ステップS14)。細線化追記ドキュメントの全ノード数をNnとする。
【0054】
次に、ノードIDの番号iをi=1に設定し(ステップS15)、次いで、ノード(ID=i)の分岐数Nbを取得する(ステップS16)。例えば、図11に示すように、ノード(ID=i)が端点(A)の場合はNb=1、分岐点(B)の場合はNb=3、交点(C)の場合はNb=4となる。ステップS13〜ステップS16までの各処理は、図5のノード位置特定部1141の処理に相当する。
【0055】
次に、分岐数Nbの番号jをj=1に設定し(ステップS17)、次いで、他のノードに到達するまでの細線をたどって2つのノード間の距離をリンク長Lとする(ステップS18)。具体的には、あるノードからON画素を1ドット(画素)ずつたどって、他のノードに到達するまでのドット数(画素数)をリンク長Lとする。このステップS17の処理は、図5のリンク長特定部1142の処理に相当する。
【0056】
次に、両端のノードIDとリンク長とをリンクリストに記録し(ステップS19)、次いで、分岐数Nbの番号jをインクリメント(j=j+1)し(ステップS20)、次いで、ノードIDの番号iが分岐数Nb以下(i≦Nb)であるか否かを判断し(ステップS21)、i≦Nbであれば、ステップS18に戻って、ステップS18〜ステップS20の各処理を、ステップS21でi>Nbと判定するまで繰り返して実行する。
【0057】
i>Nbであれば、分岐数Nbの番号jをインクリメント(j=1+1)し(ステップS22)、次いで、ノードIDの番号iが全ノード数Nn以下(i≦Nn)であるか否かを判断し(ステップS23)、i≦Nnであれば、ステップS16に戻って、ステップS16〜ステップS22の各処理を、ステップS23でi>Nnと判定するまで繰り返して実行する。
【0058】
このステップS16〜ステップS23までの処理ループは、リンクリストを作成するための処理ループである。ここで、リンクリストを作成する処理について、理解を容易にするために、図12に示す簡易な線分図形を例に挙げて具体的に説明する。
【0059】
図12に示す簡易な線分図形では、ノードが7個(Nn=7)存在する。これら7個のノードに対して、図の左上から右下への走査順にノードIDを付与する(ID=1〜ID=7)。ここで、ID=1,ID=2,ID=4,ID=6,ID=7の5個のノードは端点(Nb=1)である。ID=3のノードは交点(Nb=4)である。ID=5は分岐点(Nb=3)である。
【0060】
これら7個のノード(ID=1〜7)において、ID=1のノードから順番のリンク長Lを求める。ここで、2つのノードにおいて、リンク長を求めるために細線をたどる際の出発側のノードをノード1、到達側のノードをノード2とする。
【0061】
先ず、i=1のときは、Nb=1、出発側のノード1はID=1のノードで、当該ノードが端点であり(j=1)、到達側のノード2はID=3のノードとなる。そして、ID=1のノードからID=3のノードまでの細線をたどって求めた両ノード間のリンク長LをL1とする。次に、i=2のときは、Nb=1、出発側のノード1はID=2のノードで、当該ノードが端点であり(j=1)、到達側のノード2はID=3のノードとなる。そして、ID=1のノードからID=3のノードまでの細線をたどって求めた両ノード間のリンク長LをL2とする。
【0062】
次に、i=3のときは、Nb=4、出発側のノード1はID=3のノードであり、当該ノードが交点であることから、4個の分岐(j=1〜4)についてリンク長Lを求めることになる。先ず、j=1のとき、到達側のノード2はID=1のノードであり、ID=3のノードからID=1のノードまでの細線をたどって求めた両ノード間のリンク長LをL1とする。j=2のとき、到達側のノード2はID=2のノードであり、ID=3のノードからID=2のノードまでの細線をたどって求めた両ノード間のリンク長LをL2とする。j=3のとき、到達側のノード2はID=5のノードであり、ID=3のノードからID=5のノードまでの細線をたどって求めた両ノード間のリンク長LをL4とする。j=4のとき、到達側のノード2はID=4のノードであり、ID=3のノードからID=4のノードまでの細線をたどって求めた両ノード間のリンク長LをL3とする。
【0063】
次に、i=4のときは、出発側のノード1はID=4のノードで、当該ノードが端点であり(j=1)、到達側のノード2はID=3のノードとなる。そして、ID=4のノードからID=3のノードまでの細線をたどって求めた両ノード間のリンク長LをL3とする。以降、同様にして、i=5,6,7について、出発側のノード1から到達側のノード2までの細線をたどってリンク長Lを求める。そして、このようにして求めたノード1,2のノードIDと両ノード1,2間のリンク長Lとからリンクリストが作成される。図13に、上記具体例の場合に作成されるリンクリストの一例を示す。
【0064】
ここで、図13のリンクリストから明らかなように、上述したリンクリストの作成処理の場合には、同じ2つのノード間のリンク長が重複して求められることになる。例えば、i=3のときに、j=1で求めたID=3のノードとID=1のノードとの間のリンク長L1は、i=1,j=1で求めたID=1のノードとID=3のノードとの間のリンク長L1と同じであり、j=2で求めたID=3のノードとID=2のノードとの間のリンク長L2は、i=2,j=1で求めたID=2のノードとID=3のノードとの間のリンク長L2と同じである。また、i=4,j=1で求めたID=4のノードとID=3のノードとの間のリンク長L3は、i=3,j=4で求めたID=3のノードとID=4のノードとの間のリンク長L3と同じである。
【0065】
このように、一度求めたノード間(リンク)のリンク長Lについては、同じノード間のリンク長が既に求められているか否かの判断ステップを追加して、同じノード間のリンク長について重複して求めないようにすることも可能である。このようにして、重複した処理を省略することにより、リンクリストを作成する処理の処理スピードを上げることができる。
【0066】
追記抽出画像の欠損部分を修復する処理シーケンスに説明を戻す。以降では、図10のフローチャートにしたがって説明する。
【0067】
上述した処理ループによるリンクリストの作成が完了したら、当該リンクリストから重複するリンクを削除し、残った各リンクの画像とそれに相当する位置の細線化追記抽出画像とで論理積(AND)をとり、その論理積結果にON画素があれば、即ち細線化追記抽出画像と重なる画素(ドット)が1つでもあれば、重なり有りと判定してそのリンクをリンクリストから除外する(ステップS24)。このステップS24の処理は、図5のリンク分類部1143の処理に相当する。
【0068】
ここで、上述したように、リンクリストの作成処理において、同じノード間のリンク長について重複して求めないようにする場合には、ステップS24におけるリンクリストから重複するリンクを削除する処理は不要となる。これにより、リンクリストから重複するリンクを削除する処理を省く分だけステップS24の処理を高速化できる。
【0069】
次に、ノードIDの番号iをi=1に設定し(ステップS25)、次いで、ステップS24で分類した最短リンク集合、即ち重なり無しリンク集合から、細線化追記抽出画像255の2端点を最短長で結ぶリンクの集合を探索する(ステップS26)。具体的には、ノード(ID=1)から他のノードに至る距離を近い順に求め、ノード(ID≦Nm)にぶつかったら、それに至るまでの最短リンク集合とする。このステップS26の処理は、図5の最短リング集合探索部1144の処理に相当する。
【0070】
次に、ステップS26で探索した最短リンク集合に相当する細線化追記抽出画像上の画素をON画素(有効画素)に画素値変更を行うことで、細線化追記抽出画像と欠損線分画像とを合成する(ステップS27)。次に、ノードIDの番号iをインクリメント(i=1+1)し(ステップS28)、次いで、ノードIDの番号iがステップS13で取得したノード数(端点数)Nm以下(i≦Nm)であるか否かを判断し(ステップS29)、i≦Nmであれば、ステップS26に戻って、ステップS26〜ステップS28の各処理を、ステップS29でi>Nmと判定するまで繰り返して実行する。
【0071】
このステップS26〜ステップS29までの処理ループは、細線化追記抽出画像(例えば、図7(a)の細線化追記抽出画像255)における途切れの端点間を結ぶ最短リンクの組み合わせ(最短リンク集合)を求めるための処理ループである。
【0072】
上述したように、例えばドキュメントから追記画像(追記情報)を抽出する画像処理において、抽出対象の追記ドキュメント画像と原本ドキュメント画像との差分から抽出される追記情報に含まれる欠損部分を修復する際に、欠損部分に相当する細線(リンク)を細線化追記ドキュメント画像(細線画像)から特定し(見つけ出し)、その特定した細線で欠損部分を修復する手法を採ることにより、どの端点とどの端点とを接続すれば良いのかが明確になるために、特に複雑な文字に発生した途切れ部分など、複雑に途切れた部分で端点が密集している場合でも、欠損部分を正確に修復できる。
【0073】
また、追記画像の欠損部分に相当する細線化追記ドキュメント画像が複雑に分岐していて、当該欠損部分に相当する細線がどれなのか判別が難しい場合でも、細線の最短リンク集合を探索することで、最も確からしい欠損細線を見つけることができる。
【0074】
なお、ノード位置特定部1141の処理において、細線化追記抽出画像(第1の細線化画像)255の端点をノードとするとき、当該細線化追記抽出画像255の端点と細線化追記ドキュメント画像(第2の細線化画像)256とが重ならない場合に、細線化追記抽出画像255の端点に相当する追記ドキュメントの画像上の画素に近接する追記ドキュメント画像256上の画素をノードするようにしても良い。この手法を採ることにより、細線化追記抽出画像255の端点付近が追記ドキュメント画像256とぴったり重ならず、微妙にずれる場合があっても、欠損部分を正確に修復できる。
【0075】
なお、本実施例1では、原本ドキュメント画像データと、原本に含まれない追記情報を含む追記ドキュメント画像データとを差分抽出部111に入力して、当該差分抽出部111での差分抽出によって追記情報を抽出する画像処理装置100Aに適用した場合を例に挙げて説明したが、本発明は追記情報を抽出する画像処理装置100Aへの適用に限られるものではない。以下に、他の適用例に係る別の実施例について説明する。
【0076】
[実施例2]
図14は、本発明の実施例2に係る画像処理装置100Bの機能構成例を示すブロック図であり、図中、図5と同等部分には同一符号を付して示している。
【0077】
実施例1に係る画像処理装置100Aは、追記ドキュメント画像データと原本ドキュメント画像データとを入力とし、追記ドキュメント画像データと原本ドキュメント画像データとの差分をとって追記情報を抽出する構成を採っているのに対して、本実施例2に係る画像処理装置100Bは、追記ドキュメント画像データのみを入力とし、当該追記ドキュメント画像データから直接追記情報を抽出する構成を採っている。
【0078】
この追記ドキュメント画像データからの追記情報の直接抽出は、次の原理によって可能である。すなわち、例えば、原本の記録情報(画像情報)が全て黒色で記録され、追記情報が全て赤色で記録されている追記ドキュメントがある場合は、当該追記ドキュメントから赤色で記録された追記情報のみを抽出する色識別処理によって、追記情報の抽出が可能となる。
【0079】
本実施例2に係る画像処理装置100Bは、図5の差分抽出部116の代わりに追記抽出部116を備えており、それ以外の構成は実施例1に係る画像処理装置100Aの構成と同じである。すなわち、画像処理装置100Bは、追記抽出部116、第1の細線化部112、第2の細線化部113、欠損線分特定部114および合成部115を有する構成を採り、原本ドキュメントに含まれる文字情報などの色と追記された情報の色とが異なる場合、例えば、原本がすべて黒色の文字や線分によって記録され、追記が赤色で行われている場合に適用可能である。
【0080】
この画像処理装置100Bにおいて、第1の細線化部112、第2の細線化部113、欠損線分特定部114および合成部115が持つ機能は、実施例1に係る画像処理装置100Aの場合と同じであり、その説明については重複するので省略する。追記抽出部116は、追記ドキュメント画像データから、所定の色(本例では、追記情報の色である赤)を持つ情報を追記情報として抽出する。なお、追記抽出部116が抽出する追記情報の色情報については、ユーザが指定入力するなどの方法が考えられる。
【0081】
この追記抽出部116において抽出された追記情報は、実施例1に係る画像処理装置100Aの差分抽出部111が生成する追記情報と同様に、やはり、原本に含まれる情報との重なり部分で途切れが発生する場合がある。例えば、原本に含まれる黒の文字上に追記された赤色が正確に赤とは認識されず、黒と認識される場合があり、このような重なり部分を追記抽出部116が追記情報として認識しない場合があるからである。
【0082】
このような途切れ部分(欠損部分)は、実施例1に係る画像処理装置100Aの場合と同様に、第1の細線化部112、第2の細線化部113、欠損線分特定部114および合成部115における処理によって修復され、最終的に正確な追記情報からなる修復追記抽出画像データが生成される。その結果、実施例1に係る画像処理装置100Aの場合と同様に、スキャン画像の劣化が激しい場合でも、また複雑な文字に発生した途切れ部分など、複雑に途切れた部分で端点が密集している場合でも、欠損部分を正確に修復できる。
【0083】
[実施例3]
図15は、本発明の実施例3に係る画像処理装置100Cの機能構成例を示すブロック図であり、図中、図14と同等部分には同一符号を付して示している。
【0084】
本実施例3に係る画像処理装置100Cは、図14の追記抽出部116の代わりに罫線分離部117を備えており、それ以外の構成は実施例1に係る画像処理装置100Aの構成と同じである。すなわち、画像処理装置100Cは、罫線分離部117、第1の細線化部112、第2の細線化部113、欠損線分特定部114および合成部115を有する構成を採り、原本ドキュメントが例えば表などの罫線情報によって構成され、その表に元々記載されている文字やユーザが後から追記した文字などを、罫線を含まない記載内容情報として抽出する場合に有効となる。
【0085】
この画像処理装置100Bにおいて、第1の細線化部112、第2の細線化部113、欠損線分特定部114および合成部115が持つ機能は、実施例1に係る画像処理装置100Aの場合と同じであり、その説明については重複するので省略する。罫線分離部117は、ドキュメント画像データから、罫線のみを削除することによって記載内容情報を抽出する。
【0086】
この罫線分離部117において抽出された記載内容情報は、実施例1に係る画像処理装置100Aの差分抽出部111が生成する追記情報と同様に、やはり、表罫線との重なり部分で途切れが発生する場合がある。例えば、罫線上に重なって記録された記載内容情報は、罫線情報として削除され、抽出される記載内容情報に含まれなくなるからである。
【0087】
このような途切れ部分(欠損部分)は、実施例1に係る画像処理装置100Aの場合と同様に、第1の細線化部112、第2の細線化部113、欠損線分特定部114および合成部115における処理によって修復され、最終的に正確な記載内容情報からなる修復記載内容抽出画像データが生成される。その結果、実施例1に係る画像処理装置100Aの場合と同様に、スキャン画像の劣化が激しい場合でも、また複雑な文字に発生した途切れ部分など、複雑に途切れた部分で端点が密集している場合でも、欠損部分を正確に修復できる。
【0088】
なお、本発明は、上記実施例1〜3に係る画像処理装置100A〜100Cへの適用に限られるものではなく、例えば、追記ドキュメント画像に含まれる線分の色や揺らぎなどの特徴から、印刷による情報と手書きによる情報とを判別し、手書きによる追記情報を抽出するなど、原本に含まれない追記情報を含む追記ドキュメント画像データから当該追記情報を抽出する画像処理を行う画像処理装置全般に適用可能である。
【図面の簡単な説明】
【0089】
【図1】本発明が適用される画像情報処理システムの構成の概略を示すシステム構成図である。
【図2】原本ドキュメントと追記ドキュメントとの差分処理によって追記情報を取得する処理例についての説明図である。
【図3】追記情報を取得する他の処理例についての説明図である。
【図4】本発明による画像処理装置を含む画像情報処理システムのより具体的な構成例を示すブロック図である。
【図5】本発明の実施例1に係る画像処理装置の機能構成例を示すブロック図である。
【図6】原本ドキュメントと追記ドキュメントとから差分を抽出する処理例についての説明図である。
【図7】細線化処理の具体例についての説明図である。
【図8】合成処理の具体例についての説明図である。
【図9】追記抽出画像の欠損部分を修復する処理シーケンスの手順の一例を示すフローチャート(その1)である。
【図10】追記抽出画像の欠損部分を修復する処理シーケンスの手順の一例を示すフローチャート(その2)である。
【図11】ノード(ID=i)の分岐数Nbについての説明図である。
【図12】リンクリストを作成する処理についての簡易な線分図形を用いた説明図である。
【図13】リンクリストの一例を示す図である。
【図14】本発明の実施例2に係る画像処理装置の機能構成例を示すブロック図である。
【図15】本発明の実施例3に係る画像処理装置の機能構成例を示すブロック図である。
【符号の説明】
【0090】
10…原本ドキュメント、20…追記ドキュメント、30…スキャナ、41…画像データ入力部、42…画像データ出力部、100,100A,100B,100C…画像処理装置、111…差分抽出部、112…第1の細線化部、113…第2の細線化部、114…欠損線分特定部、115…合成部、116…追記抽出部、117…罫線分離部

【特許請求の範囲】
【請求項1】
所定の画像から所定の情報を抽出する情報抽出手段と、
前記情報抽出手段が抽出した情報に対して細線化処理を実行する第1の細線化手段と、
前記所定の画像に対して細線化処理を実行する第2の細線化手段と、
前記第2の細線化手段が細線化した第2の細線化画像から、前記第1の細線化手段が細線化した第1の細線化画像の欠損部分に相当する線分を特定して欠損線分画像を生成する欠損線分特定手段と、
前記欠損線分特定手段が生成した欠損線分画像と前記第1の細線化画像とを合成して修復追記抽出画像を生成する合成手段と
を備えることを特徴とする画像処理装置。
【請求項2】
原本ドキュメントに対して追記処理のなされた追記ドキュメントの画像から追記情報を抽出する追記情報抽出手段と、
前記追記情報抽出手段が抽出した追記情報に対して細線化処理を実行する第1の細線化手段と、
前記追記ドキュメントの画像に対して細線化処理を実行する第2の細線化手段と、
前記第2の細線化手段が細線化した第2の細線化画像から、前記第1の細線化手段が細線化した第1の細線化画像の欠損部分に相当する線分を特定して欠損線分画像を生成する欠損線分特定手段と、
前記欠損線分特定手段が生成した欠損線分画像と前記第1の細線化画像とを合成して修復追記抽出画像を生成する合成手段と
を備えることを特徴とする画像処理装置。
【請求項3】
ドキュメントの画像から表罫線の情報を分離してドキュメントに記載されている記載内容情報を抽出する記載内容情報抽出手段と、
前記記載内容情報抽出手段が抽出した記載内容情報に対して細線化処理を実行する第1の細線化手段と、
前記ドキュメントの画像に対して細線化処理を実行する第2の細線化手段と、
前記第2の細線化手段が細線化した第2の細線化画像から、前記第1の細線化手段が細線化した第1の細線化画像の欠損部分に相当する線分を特定して欠損線分画像を生成する欠損線分特定手段と、
前記欠損線分特定手段が生成した欠損線分画像と前記第1の細線化画像とを合成して修復追記抽出画像を生成する合成手段と
を備えることを特徴とする画像処理装置。
【請求項4】
前記欠損線分特定手段は、
前記第1の細線化画像の端点と前記第2の細線化画像の交点、分岐点および端点とをノードとするとき、当該ノードの位置を特定するノード位置特定手段と、
ノードとノードとを結ぶリンクの長さを計算するリンク長算出手段と、
前記リンク長算出手段が算出した各リンクが前記第1の細線化画像と重なるか否かを判断して重ならないリンク集合を抽出するリンク分類手段と、
前記リンク分類手段が抽出したリンク集合から前記第1の細線化画像の2端点を最短長で結ぶ重なり無しの最短リンク集合を探索して前記欠損線分画像とする最短リンク集合探索手段とを有する
ことを特徴とする請求項1記載の画像処理装置。
【請求項5】
前記合成手段は、前記最短リンク集合探索手段が探索した最短リンク集合に相当する前記第1の細線化画像上の画素を有効画素にすることにより、前記欠損線分画像と前記第1の細線化画像とを合成する
ことを特徴とする請求項2記載の画像処理装置。
【請求項6】
前記ノード位置特定手段は、前記第1の細線化画像の端点をノードとするとき、当該第1の細線化画像の端点と前記第2の細線化画像とが重ならない場合に、前記第1の細線化画像の端点に相当する前記追記ドキュメントの画像上の画素に近接する前記第2の細線化画像上の画素をノードとする
ことを特徴とする請求項2記載の画像処理装置。
【請求項7】
原本ドキュメントに対して追記処理のなされた追記ドキュメントの画像から追記情報を抽出する追記情報抽出ステップと、
前記追記情報抽出ステップで抽出した追記情報に対して細線化処理を実行する第1の細線化ステップと、
前記追記ドキュメントの画像に対して細線化処理を実行する第2の細線化ステップと、
前記第2の細線化ステップで細線化した第2の細線化画像から、前記第1の細線化ステップで細線化した第1の細線化画像の欠損部分に相当する線分を特定して欠損線分画像を生成する欠損線分特定ステップと、
前記欠損線分特定ステップで生成した欠損線分画像と前記第1の細線化画像とを合成して修復追記抽出画像を生成する合成ステップと
の各処理をコンピュータに実行させることを特徴とする画像処理プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate


【公開番号】特開2007−233889(P2007−233889A)
【公開日】平成19年9月13日(2007.9.13)
【国際特許分類】
【出願番号】特願2006−57160(P2006−57160)
【出願日】平成18年3月3日(2006.3.3)
【出願人】(000005496)富士ゼロックス株式会社 (21,908)
【Fターム(参考)】