説明

文書管理システム

【課題】元の文書を変更して作成された原稿を電子データにして管理するとき、データ量をコンパクトにするとともに、変更された原稿データの改ざんを防ぐようにする。
【解決手段】文書データに基づいて作成された原稿から原稿データを入力する入力部20と、文書データに対する原稿データの変更を検出する検出部22と、原稿データに変更があるとき、入力された原稿データを記憶部21に保存し、原稿データに変更がないとき、入力された原稿データを保存せず、原稿データの代わりに文書データを利用して原稿データを管理する管理部23と、原稿データを出力する出力部24とを有する。管理部23は、原稿データの変更の有無と利用するデータとの関係を示す属性情報を作成する。出力部24は、属性情報に基づいて、原稿データあるいは文書データを出力する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、文書データを元にして作成された原稿データを保存する文書管理システムに関する。
【背景技術】
【0002】
契約書、決裁書、請求書等の文書は、画像処理装置によって印刷されて作成される。この文書に対して、利用者は、サイン、捺印、拇印等により、署名を行う。このように元の文書に手が加えられて変更された原稿は、画像処理装置によって読み取られ、原稿データが保存される。このようにして、原稿は電子化されて管理される。
【0003】
ここで、元の文書から作成された原稿を電子データとして管理するとき、例えば特許文献1には、原稿データと原稿に対応する文書データとの差分情報を抽出して、文書データと差分情報とを対応付けて保持することが記載されている。また、特許文献2には、スキャン画像の文字領域に対して文字認識処理を行い、文字のイメージデータを作成することが記載されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2005−149097号公報
【特許文献2】特開2008−193234号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
利用者によってサイン、捺印等のように後から追加された署名情報を含む原稿を電子データ化したとき、署名情報がイメージデータからベクトルデータに変換されて、差分情報として保存される。しかし、ベクトル化された差分情報は編集可能であるので、署名情報が改ざんされ、別の署名に置き換えられるおそれがある。また、原稿のイメージデータを作成すれば、改ざんは防げるが、元の文書から変更された原稿だけでなく、元の文書と同じ原稿もイメージデータにされるので、データ量が多くなってしまう。
【0006】
本発明は、上記に鑑み、元の文書に変更を加えて作成された原稿をコンパクトな電子データにしながら、改ざんを防げるように管理する文書管理システムの提供を目的とする。
【課題を解決するための手段】
【0007】
本発明は、文書データを保存する記憶部と、文書データに基づいて作成された原稿から原稿データを入力する入力部と、文書データに対する原稿データの変更を検出する検出部と、原稿データの変更の有無に応じて、入力された原稿データを保存するか否かを決め、文書データを利用して原稿データを管理する管理部とを備えたものである。
【0008】
原稿データに変更がない場合、元の文書データと同じである。そのため、管理部は、変更なしの場合、原稿データを保存しない。この原稿データに対しては、すでに保存されている文書データを代用できる。
【0009】
すなわち、管理部は、原稿データに変更があるとき、入力された原稿データを記憶部に保存し、原稿データに変更がないとき、入力された原稿データを保存せず、原稿データの代わりに文書データを利用する。そして、管理部は、原稿データの変更の有無と利用するデータとの関係を示す属性情報を作成する。このように、既存の文書データを利用することにより、変更された原稿データと属性情報だけを管理すればよい。
【0010】
複数ページの原稿が入力されたとき、検出部は、ページ単位で原稿データの変更の有無を検出し、管理部は、変更されたページの原稿データを保存し、変更されていないページの原稿データを保存せず、変更されたページに対する原稿データおよび変更されていないページに対する文書データの関係を示す属性情報を作成する。変更されていないページに対しては、文書データの該当するページが利用される。
【0011】
属性情報に基づいて文書データを利用しながら原稿データを出力する出力部を備える。管理部は、属性情報に基づいて原稿データを出力するか、あるいは文書データを出力するかを判断し、出力部は、変更があるときには原稿データを出力し、変更がないときには文書データを出力する。元の文書に署名情報などが加えられた原稿では、変更された原稿データが入力され、そのまま保存される。出力部がこの原稿データを出力したとき、署名情報による変更内容が忠実に再現されて出力される。
【0012】
文書データと原稿データとは異なる形式のデータとされる。すなわち、文書データは、編集可能なデータとされ、原稿データは、改ざんできないよう編集不可能なデータとされる。そのため、検出部は、文書データをビットマップ化した画像データと原稿データとを比較して、画像データと原稿データが一致するかを検出し、一致しないとき、変更ありと判断し、一致するとき、変更なしと判断する。
【0013】
検出部は、変更の誤判定を防ぐために、文書データをビットマップ化した画像データに対して膨張化処理を行う。入力部が原稿をスキャンして、原稿データを入力するとき、原稿がずれてセットされたときに、上記の膨張化処理を施すことにより、原稿のずれを許容でき、誤検出をなくすことができる。
【0014】
検出部は、文書データにおける変更されることが想定される特定領域と、原稿データにおける前記特定領域に対応する検出領域とを比較して、原稿データの変更を検出する。特定領域では、変更される蓋然性が高い。したがって、特定領域における変更の有無を検出することにより、効率的に検出処理を行える。
【発明の効果】
【0015】
本発明によると、原稿を電子データにして管理するとき、代用できるデータを利用することにより、保存するデータ量を少なくできる。また、変更された原稿データはそのまま保存され、かつ出力されるので、変更内容を忠実に再現することができる。
【図面の簡単な説明】
【0016】
【図1】本発明の文書管理システムの概略構成図
【図2】画像処理装置の概略構成を示すブロック図
【図3】文書管理システムの機能ブロック図
【図4】元の文書および変更された原稿を示す図
【図5】原稿データの変更の有無を検出する検出処理のフローチャート
【図6】原稿データと文書データの画像比較のフローチャート
【図7】保存される原稿データおよび属性表を示す図
【図8】原稿データの出力するときのフローチャート
【図9】画像データの膨張化処理を説明するための図
【発明を実施するための形態】
【0017】
本実施形態の文書管理システムを図1に示す。文書管理システムは、文書を作成する情報処理装置1と、文書の出入力を行う画像処理装置2と、文書を管理する管理サーバ3とがLAN等のネットワークを通じて通信可能に接続されて形成される。なお、情報処理装置1および画像処理装置2は複数であってもよい。
【0018】
情報処理装置1は、一般的な制御部、記憶部、表示部等を備えたコンピュータである。管理サーバも同様に、制御部、記憶部、表示部等を備えたコンピュータである。画像処理装置2は、図2に示すように、デジタル複合機であって、印刷部10、読取部11、操作部12、ハードディスク等の記憶部13、通信部14、メモリ15、制御部16を有している。そして、画像処理装置2は、コピー、プリント、スキャン、ファクシミリ通信、ファイリングといった処理を行う。
【0019】
情報処理装置1は、ワープロソフトや表計算ソフトなどによって文書データを作成する。そして、情報処理装置1は文書データを印刷データに変換して、画像処理装置2に送信する。画像処理装置2は、通信部14を通じて印刷データを受け取る。制御部16は、印刷部10を動作させて、印刷データを用紙に印刷する。このようにして、情報処理装置1によって作成された文書から原稿が作成される。
【0020】
また、利用者は、原稿を読取部11にセットし、操作部12によりデータの出力先、読取条件、解像度などを設定して、スキャンの実行を指示する。読取部11は、原稿の画像をラスタライズして、原稿を読み取る。制御部16は、入力された画像をPDF、TIFF、JPEG等の所定のデータ形式に画像データに変換して、1つの原稿データのファイルとして記憶部13に記憶する。複数ページの原稿がスキャンされたとき、原稿データはページ単位で作成される。
【0021】
コピーの場合、印刷部10が、入力された原稿データを用紙に印刷して出力する。ファクシミリ送信の場合、モデムを有する通信部14が、電話回線を通じて原稿データを送信する。データ通信の場合、通信部14が、ネットワークを通じて原稿データを情報処理装置1、管理サーバ3、他の画像処理装置2に送信する。
【0022】
本文書管理システムでは、管理サーバ3が文書データおよび原稿データを管理する。そして、情報処理装置1は、これらのデータを表示したり、データ送信する。画像処理装置2は、これらのデータに対して、印刷、ファクシミリ送信、データ送信といった処理を行う。
【0023】
ここで、利用者は、元の文書に変更を加えて原稿を作成する。変更として、サイン、捺印、メモなどを加える。この原稿から得られる原稿データを管理するために、文書管理システムは、図3に示すように、文書データに基づいて作成された原稿から原稿データを入力する入力部20と、文書データおよび原稿データを保存する記憶部21と、文書データに対する原稿データの変更を検出する検出部22と、元の文書に対する原稿の変更の有無に応じて原稿データを保存するか否かを決める管理部23と、文書データおよび原稿データを出力する出力部24とを備える。
【0024】
管理部23は、原稿データに変更があるとき、入力された原稿データを記憶部21に保存し、原稿データに変更がないとき、管理部23は、入力された原稿データを保存せず、この原稿データの元である文書データを利用する。そして、管理部23は、原稿データの変更の有無に関する属性情報を作成する。属性情報は、原稿データの変更の有無に対する原稿データおよび文書データの利用関係を示す。
【0025】
管理部23は、原稿データを出力するとき、属性情報に基づいて文書データを利用するか決める。この結果にしたがって、出力部24は、原稿データに変更があるとき、原稿データを出力し、原稿データに変更がないとき、この原稿データに対応する文書データを出力する。なお、原稿データの出力は、印刷だけでなく、表示、データ送信も含む。
【0026】
上記のような原稿の管理を行う本文書管理システムにおいて、画像処理装置2の読取部11が入力部20とされる。管理サーバ3の記憶部が、上記の記憶部21とされ、制御部が検出部22および管理部23として機能する。画像処理装置2の印刷部10および通信部14、情報処理装置1の表示部がそれぞれ出力部24として機能する。
【0027】
利用者が情報処理装置1において文書を作成したとき、情報処理装置1は、作成された文書データを画像処理装置2に出力し、画像処理装置2は、文書データを印刷して、文書を出力する。また、情報処理装置1は、文書データを管理サーバ3に送信する。管理サーバ3は、文書データを1つのファイルとして記憶部21に保存する。
【0028】
図4(a)に、作成された文書を示す。この文書は、3ページからなる契約書である。利用者は、第1ページにサインによる署名を行う。これによって、図4(b)に示すように、元の文書を変更した原稿が作成される。この文書と原稿とでは、第1ページが異なり、第2および第3ページは同じである。
【0029】
利用者は、上記の原稿を電子データにして保存する。まず、画像処理装置2の読取部11は、原稿をスキャンして、原稿データを入力する。制御部16は、入力された原稿データを通信部14を通じて管理サーバ3に出力する。管理サーバ3の制御部は、受け取った原稿データを記憶部21に一時的に記憶する。
【0030】
そして、管理サーバ3は、原稿データの変更の有無に応じて原稿データを保存するか否かを決めるとともに、文書データを利用するか否かを決めて、入力された原稿データの管理を行う。
【0031】
管理サーバ3の制御部は検出部22として機能し、図5に示すように、検出部22は、文書データと原稿データとを第1ページ目から1ページずつ順に画像比較して(S1,S2)、画像の一致、不一致により変更の有無を検出する(S3)。
【0032】
具体的には、検出部22は、原稿の元の文書に対応する文書データを記憶部21から読み出す。ここで、該当する文書データは、利用者によって選択される。すなわち、利用者の操作により、画像処理装置2あるいは情報処理装置1は、管理サーバ3に保存されている文書データのリストを管理サーバ3から取得して、画面に表示する。利用者が文書デー
タを選択すると、画像処理装置2あるいは情報処理装置1は、選択された文書データの情報を管理サーバ3に送信し、管理サーバ3は、該当する文書データを特定する。
【0033】
なお、これに代わって、自動的に文書データを特定するようにしてもよい。画像処理装置2の制御部16は、文書データのファイル名あるいは保存先アドレスを示すバーコードのような識別画像を形成して、文書データを印刷するときに識別画像も印刷する。そして、読取部11が、識別画像が埋め込まれた原稿を読み取ると、制御部16は、入力された原稿データから識別画像を読み取り、識別画像を解読する。制御部16は、該当する文書データを特定して、管理サーバ3に文書データに関する情報を知らせる。
【0034】
原稿データと文書データとはデータ形式が異なるので、図6に示すように、検出部22は、文書データを1ページずつビットマップデータに変換する(S10)。そして、検出部22は、ビットマップ化された文書データをメモリ上に展開して、X座標が1〜Xmax、Y座標が1〜Ymaxの画像データを作成する。なお、原稿データも同様に、メモリ上に展開される。
【0035】
検出部22は、各座標(X,Y)の文書データに対する画像データの画素値と原稿データの画素値をそれぞれ取得して、座標毎に順に画素数の比較を行う(S11〜S13)。モノクロ画像の場合、白色の画素値=0、黒色の画素値=1とすると、同じ座標における文書データの画素値が0、原稿データの画素値が1の場合、検出部22は、画像が付加されたと判断する。このとき、検出部22は、画像が付加された画素をカウントし、画素数のカウント値Cを+1する(S14)。文書データの画素値と原稿データの画素値とが同じ場合、検出部22は、画像に変更なしと判断し、カウント値をアップしない。この画素値の比較が全ての座標に対して行われる(S15〜S18)。
【0036】
検出部22は、1ページ分の比較が終わると、カウント値Cが閾値Cthを超えたかをチェックする(S19)。原稿に汚れが付いた場合、画素値が異なるので、画像が付加されたと誤判断される。そこで、閾値を設定することにより、このような誤判断を防げる。すなわち、多少の汚れがあると、誤って画素数がカウントアップされるが、閾値を越えなければ、意図しない画像の付加とみなすことができる。
【0037】
カウント値が閾値を超えているとき、検出部22は、1ページの画像が一致しないと判定し(S20)、このページの原稿は元の文書から変更されたものであると判断する。カウント値が閾値以下の場合、検出部22は、1ページの画像が一致すると判定し(S21)、このページの原稿は変更されていないと判断する。検出部22は、全てのページに対して、変更の有無を判断する。
【0038】
管理サーバ3の制御部における管理部23は、上記のように行われた検出部22の判断結果に基づいて、図7に示すような原稿データの変更に関する属性情報を示した属性表を作成する。管理部23は、変更のあるページに対して、このページの原稿データを記憶部21に保存し、このページの属性を原稿ページとする(S4)。変更のないページに対しては、このページの属性を文書データとする(S5)。なお、このページの原稿データは保存されない。また、属性表には、原稿データのファイル名および元の文書データのファイル名も書き込まれる。管理部23は、作成した属性表を記憶部21に保存する。管理部23は、1ページ毎に属性表にページの属性を記録していき、全てのページに対して比較および記録を行う(S6,S7)。
【0039】
したがって、入力された原稿データのファイルとして、変更のあるページの原稿データだけが保存される。なお、ファイルは、マルチページファイルとされる。そして、入力された原稿データに対する属性表は、原稿データのファイルに関連付けられて保存される。なお、原稿の全ページに変更がない場合、データのないファイルが作成される。属性表における各ページの属性は、全て文書データとなる。
【0040】
このように原稿を電子データとして管理するとき、データを必要最小限に留めて、データ量を低減でき、コンパクトな電子データにできる。そして、保存される原稿データは編集不可能なデータとされ、編集可能な文書データとは異なる。したがって、保存された原稿データの改ざんを防止できる。
【0041】
次に、利用者が保存されている原稿データを印刷して出力する場合、利用者は、画像処理装置2あるいは情報処理装置1において、出力したい原稿データを選択して、印刷指示の操作を行う。この指示を受けた管理サーバ3において、図8に示すように、管理部23は、選択された原稿データに対する属性表を参照し、第1ページから順に各ページの属性を読み出す(S30,S31)。管理部23は、属性を判断し(S32)、該当ページの属性が原稿データのとき、管理部23は、原稿データを出力すると判断し、原稿データの該当ページを記憶部21から読み出す(S33)。そして、管理部23は、該当ページの印刷データを画像処理装置2に送信するとともに、印刷の指示を行う(S35)。該当ページの属性が文書データのとき、管理部23は、文書データを出力すると判断し、文書データの該当ページを記憶部21から読み出す(S34)。管理部23は、文書データに対する印刷データを画像処理装置2に送信して、印刷の指示を行う(S35)。管理部23は、全てのページにおいて、文書データあるいは原稿データのいずれかのデータを送信する(S36,S37)。
【0042】
画像処理装置2は、原稿データの変更の有無に応じて、ページ毎に原稿データあるいは文書データを印刷して出力する。なお、原稿データの出力は、印刷に限らず、表示部での表示、データ送信であってもよい。データ送信の場合、管理サーバ3の制御部が、送信先に原稿データあるいは文書データを送信する。
【0043】
このように、保存される原稿データは、変更されたページの原稿データであり、読み取られたままのデータである。この原稿データを出力したとき、変更箇所を忠実に再現することができる。例えば、署名が加えられた原稿の場合、原稿データは編集可能なデータではないので、署名情報の改ざんを防止できる。
【0044】
ところで、原稿をスキャンして、原稿データを入力するが、原稿をセットしたとき、ずれていた場合、画像が一致するか否かで原稿データの変更の有無を検出するときの精度が悪くなり、誤判定のおそれがある。そこで、検出部22は、文書データをビットマップ化して作成した画像データに対して、膨張化処理を行う。すなわち、画像データをX方向およびY方向にずらした画像と元画像とをOR処理(論理和演算処理)する。図9に示すように、(i)の元画像に対して、ずらした画像をOR処理すると、(ii)のような重なった画像となる。そして、ずらす方向を変えて、複数回OR処理を行うことにより、(iii)のように画像が膨張する。
【0045】
検出部22は、膨張化処理した画像データに基づいて、原稿データとの画像比較を行い、画素値が異なる画素をカウントして、カウント値を得る。したがって、原稿データがずれていても、原稿データは膨張化処理された画像データと一致することになる。検出部22は、画像に変更なしとみなして、カウント値を加算しない。これにより、誤判定が減る。
【0046】
また、原稿が定型の文書である場合、利用者が署名する領域は決まっている。そこで、検出部22は、文書データにおける変更されることが想定される特定領域を規定し、この特定領域に対応する原稿データにおける検出領域を特定して、両領域での画像比較を行う。
【0047】
例えば、特定領域は、サインを記入する領域のXY座標によって規定できる。管理部23は、文書データが入力されたとき、文書データにおける特定領域に関する情報を予め登録しておく。検出部22は、入力された原稿データが定型の文書であることを認識すると、上記の情報を取得し、文書データから作成した画像データにおける特定領域の画像データを抽出する。そして、検出部22は、入力された原稿データにおける特定領域に対応する検出領域を特定し、特定領域の画像データと検出領域の画像データとを比較して、変更の有無を検出する。このように、限られたデータの中で検出処理を行えるので、処理に要する時間を短縮でき、しかも誤判定をなくすことができる。
【0048】
なお、本発明は、上記実施形態に限定されるものではなく、本発明の範囲内で上記実施形態に多くの修正および変更を加え得ることは勿論である。上記の文書管理システムでは、管理サーバが変更の有無を検出しているが、画像処理装置の制御部が検出部および管理部の機能を実行してもよい。また、画像処理装置の記憶部が、原稿データおよび文書データを保存してもよい。
【0049】
利用者が、情報処理装置において文書データを開き、署名情報などを付加して原稿データを作成する。情報処理装置は、作成された原稿データを管理サーバに送信する。この場合、情報処理装置が入力部となる。
【符号の説明】
【0050】
1 情報処理装置
2 画像処理装置
3 管理サーバ
20 入力部
21 記憶部
22 検出部
23 管理部
24 出力部

【特許請求の範囲】
【請求項1】
文書データを保存する記憶部と、文書データに基づいて作成された原稿から原稿データを入力する入力部と、文書データに対する原稿データの変更を検出する検出部と、原稿データの変更の有無に応じて、入力された原稿データを保存するか否かを決め、文書データを利用して原稿データを管理する管理部とを備えたことを特徴とする文書管理システム。
【請求項2】
管理部は、原稿データに変更があるとき、入力された原稿データを記憶部に保存し、原稿データに変更がないとき、入力された原稿データを保存せず、原稿データの代わりに文書データを利用し、原稿データの変更の有無と利用するデータとの関係を示す属性情報を作成することを特徴とする請求項1記載の文書管理システム。
【請求項3】
複数ページの原稿が入力されたとき、検出部は、ページ単位で原稿データの変更の有無を検出し、管理部は、変更されたページの原稿データを保存し、変更されていないページの原稿データを保存せず、変更されたページに対する原稿データおよび変更されていないページに対する文書データの関係を示す属性情報を作成することを特徴とする請求項1または2記載の文書管理システム。
【請求項4】
属性情報に基づいて文書データを利用しながら原稿データを出力する出力部を備えたことを特徴とする請求項2または3記載の文書管理システム。
【請求項5】
管理部は、属性情報に基づいて原稿データを出力するか、あるいは文書データを出力するかを判断し、出力部は、変更があるときには原稿データを出力し、変更がないときには文書データを出力することを特徴とする請求項4記載の文書管理システム。
【請求項6】
文書データと原稿データとは異なる形式のデータとされ、検出部は、文書データをビットマップ化した画像データと原稿データとを比較して、画像データと原稿データが一致するかを検出し、一致しないとき、変更ありと判断し、一致するとき、変更なしと判断することを特徴とする請求項1〜5のいずれかに記載の文書管理システム。
【請求項7】
検出部は、変更の誤判定を防ぐために、文書データをビットマップ化した画像データに対して膨張化処理を行うことを特徴とする請求項6記載の文書管理システム。
【請求項8】
検出部は、文書データにおける変更されることが想定される特定領域と、原稿データにおける前記特定領域に対応する検出領域とを比較して、原稿データの変更を検出することを特徴とする請求項1〜6のいずれかに記載の文書管理システム。
【請求項9】
サーバと画像処理装置とが通信可能に接続され、サーバは、記憶部、検出部および管理部を備え、画像処理装置は、入力部および出力部を備えたことを特徴とする請求項1〜8のいずれかに記載の文書管理システム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公開番号】特開2011−22896(P2011−22896A)
【公開日】平成23年2月3日(2011.2.3)
【国際特許分類】
【出願番号】特願2009−168799(P2009−168799)
【出願日】平成21年7月17日(2009.7.17)
【出願人】(000005049)シャープ株式会社 (33,933)
【Fターム(参考)】