説明

書籍掲載文書の電子的な編集・内容変更システム、書籍掲載文書の電子的な編集・内容変更プログラムおよび書籍作成システム

【課題】一度組版された印刷物の内容の修正を、紙を使わず且つ容易に行うことができる印刷用データ内容変更システムを提供する。
【解決手段】組版データFaを、ワープロソフトで読み書き可能なワープロデータFbに変換するデータ変換手段44と、組版データFaにおけるページの区切り位置を検出するページ位置検出手段52と、ワープロデータFbの該当する位置に組版データにおけるページの区切りであることを示すページ位置情報57を付加するページ位置表示手段56と、ワープロデータFbの内容を変更した場合に、変更前のワープロデータFbと、変更後のワープロデータFcとを比較することによって変更箇所を検出する変更箇所検出手段58と、検出された変更箇所を記憶する結果記憶手段66とを具備する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、印刷物を出版する際に用いられる組版装置に通信可能に接続されたシステム、プログラムおよびこれらによって作成されたデータを用いた書籍作成システムに関する。
【背景技術】
【0002】
書籍の出版においては、印刷する文章等を書籍の体裁に整えるため、電子的に組版を行う組版装置が広く用いられている(例えば、特許文献1)。
以下、組版装置を用いた従来の印刷手順の概略を説明する。
組版装置によって組版が完了すると、組版された内容を印刷する。この印刷物(ゲラ)を見ながら執筆者や校正作業者が校正を行う。校正の結果、変更箇所がある場合には、執筆者や校正作業者は赤字で印刷物に変更内容を記入する。その後、組版装置の操作者は、赤字で記入された印刷物を見て組版装置に変更内容を入力する。
そして、このような校正は数回行われ、校正した内容が最終的に印刷物として印刷される。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開平10−58632号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
上述したように、従来は印刷物を見て校正する方式が一般的であったが、この方式では大量の紙を使わざるをえないので、資源保護・環境保護の観点からして好ましくないという課題がある。また、印刷物を使った校正では、熟練した校正作業者でないと校正しづらく、容易に校正が行えないという課題もある。さらに、印刷物に校正内容を手書きで記入していたので、記入する人の字が汚い場合などは校正内容を判別することが困難になると言う課題もある。
【0005】
また、近年のパソコンの普及により、執筆者もパソコンにインストールされているワープロソフトを使用して原稿を書くことが一般的になってきている。このような執筆者は、組版後に校正する場合にもワープロソフトを用いて校正したいという要望があるという課題もある。
【0006】
例えば、書籍掲載内容と同一のワープロソフトのデータを用意し、ワープロソフトを用いて改訂を実行した場合、いずれの箇所をどのように修正したのか不明であるため、改訂した文書単位で組替えを行うしかない。すなわち、例として1文書が書籍の50ページ分に相当し、そのうちの1文字だけを修正した場合であっても、50ページ分の組版と校正が必要となってしまうという課題がある。
すなわち、改訂前の文書と改訂後の文書とを比較し、「どこがどのように変更されたか」ということと「変更箇所が書籍上のどのページに該当するのか」を組版を行う前に知ることができれば、飛躍的な効率化が図れる。
【0007】
なお、特に法律関係の加除式の書籍を印刷している事業者の場合、法改正があった場合には加除式の書籍の改訂はページ単位で行われる。すなわち、法改正前の該当ページを印刷した物に編集者が赤ペン等で法改正部分を書き入れていき、赤ペンが入った印刷物を別の編集者が見て、文字数等を考えてページ数の増減を検討する。そして、組版装置の操作者は、編集者が検討した結果に基づいて組版装置に改訂部分を入力していき、入力された部分は印刷されて、赤ペンが入った印刷物と比較して校正される。
このように、加除式の書籍の改訂については、ページ数の増減などの検討を、直接印刷物を見て人手によって行わなくては成らず、非常に手間がかかっている。さらに、校正についても、赤ペンによって修正された印刷物に基づいて校正しなくてはならず、非常に手間がかかっているという課題がある。
【0008】
すなわち、本発明は上記課題を解決すべくなされ、その目的とするところは、一度組版された印刷物の内容の修正を、紙を使わず且つ容易に行うことができる書籍掲載文書の電子的な編集・内容変更システムを提供することにある。
【課題を解決するための手段】
【0009】
本発明にかかる書籍掲載文書の電子的な編集・内容変更システムによれば、モニタと、組版装置とデータ通信可能に接続された通信手段と、組版装置において生成される組版データを、ワープロソフトで読み書き可能なワープロデータにデータ形式を変換するデータ変換手段と、組版文書におけるページの区切り位置を検出するページ位置検出手段と、前記データ変換手段によって、組版データから変換されたワープロデータの、前記ページ位置検出手段によって検出された組版データのページの区切り位置に該当する位置に、組版データにおけるページの区切りであることを示すページ位置情報を、前記モニタによって表示可能となるように付加するページ位置表示手段と、ページ位置情報が付加されたワープロデータを、変更前ワープロデータとして記憶する変更前ワープロデータ記憶手段と、ワープロデータの内容を変更した場合に、変更されたワープロデータを変更後ワープロデータとして記憶する変更後ワープロデータ記憶手段と、前記変更前ワープロデータと、前記変更後ワープロデータとを比較することによって変更箇所を検出する変更箇所検出手段と、該変更箇所検出手段によって検出された変更箇所を記憶する結果記憶手段とを具備することを特徴としている。
この構成を採用することによって、組版された組版データをワープロデータに変換するので、校正には紙を使わずに、ワープロソフトを用いて行うことができる。また、変更(校正)前のワープロデータと変更(校正)後のワープロデータを比較して変更箇所を検出できるので、修正(校正)内容が正しいかどうかの確認が容易且つ迅速に行える。
【0010】
また、前記データ変換手段は、前記組版装置の組版データを、修正または執筆を実行する文書単位でワープロデータに変換することを特徴としてもよい。
この構成によれば、修正や執筆は通常は文書(見出しから次の見出しまでの間。内容によってその長さは異なる)単位で行われるので、文書単位でデータ変換されれば、その部分だけの修正で済み、手間を掛けずに書籍の改訂等を行うことができる。
【0011】
また、結果記憶手段に記憶されている変更箇所に基づいて、変更箇所をまとめた差異表示データを作成する差異表示作成手段を具備することを特徴としてもよい。
この構成によれば、どの部分が変更された箇所であるかがわかりやすくなる。
【0012】
さらに、前記差異表示データは、変更箇所が存する組版データ上でのページ単位および段落単位で変更箇所をまとめたものであることを特徴としてもよい。
すなわち、ページ単位で変更の有無が分かれば、変更が無いページに対しては確認等しなくても良いので手間が省け、さらに変更箇所を知りたい場合には、段落単位での差異表示データを確認すれば良いので、変更の有無と変更箇所と変更内容との確認が迅速且つ確実に行える。
【0013】
また、前記変更箇所検出手段は、ワープロデータ内の表が変更されているか否かを検出可能に設けられていることを特徴としてもよい。
このように、表が変更になっていても、いずれの箇所が変更になったかわかりやすいので、変更内容が正しいかどうかの確認を迅速に行うことができる。
【0014】
さらに、前記差異表示作成手段は、前記結果記憶手段に記憶されている変更箇所に基づいて、変更後ワープロデータに対して、変更された箇所の属性を、変更されていない箇所の属性とは異なるように変換して前記差異表示データを作成することを特徴としてもよい。
これによれば、変更箇所および変更内容が一目で把握できる。
【0015】
さらに、前記差異表示作成手段は、前記結果記憶手段に記憶されている変更箇所に基づいて、変更前ワープロデータおよび変更後ワープロデータに対して、変更された箇所の属性を、変更されていない箇所の属性とは異なるように変換し、両者を左右に並べて新旧対照が可能な前記差異表示データを作成することを特徴としてよい。
この構成によれば、新旧対照表のような差異表示で確認できるので、変更箇所および変更内容が一目で把握できる。
【0016】
なお、前記差異表示作成手段は、ワープロデータ内に表がある場合、表を構成する行を分離した状態の差異表示データを作成することを特徴としてもよい。
この構成によれば、表内の行やセル単位での変更箇所や変更内容がわかりやすくなる。
【0017】
なお、法律関係の書籍には、改正された部分を、色を変えるなどして明示した書籍形態がある。また、法条文の変更箇所を示すには、一般的に新旧対照形式が用いられる。従来、これらの作成を実現するには、改正の際に変更箇所を記録する等の作業が必要であり、且つそれを書籍やコンテンツの形式として表現しなくてはならないので、多くの労力を必要としてきた。
そこで、本発明にかかる書籍作成システムによれば、請求項6記載の書籍掲載文書の電子的な編集・内容変更システムと、該書籍掲載図書の電子的な編集・内容変更システムによって作成された差異表示データを受信し、該差異表示データのデータ形式を組版データに変換するデータ変換手段を有する組版装置と、該組版装置によって変換された組版データを印刷する印刷装置とを備え、変更された箇所の属性が、変更されていない箇所の属性と異なるように表示された書籍を作成することを特徴としている。
この構成によれば、変更された箇所が明示された書籍の作成が容易に行える。
【0018】
また、本発明にかかる書籍作成システムによれば、請求項7記載の書籍掲載文書の電子的な編集・内容変更システムと、該書籍掲載図書の電子的な編集・内容変更システムによって作成された差異表示データを受信し、該差異表示データのデータ形式を組版データに変換するデータ変換手段を有する組版装置と、該組版装置によって変換された組版データを印刷する印刷装置とを備え、変更された箇所の属性が、変更されていない箇所の属性と異なるように表示され、且つ一のページに変更前の文書と変更後の文書の双方が表示された書籍を作成することを特徴としてもよい。
これによれば、新旧対照形式によって変更された箇所が明示された書籍の作成が容易に行える。
【発明の効果】
【0019】
本発明にかかる書籍掲載文書の電子的な編集・内容変更システムおよび書籍掲載文書の電子的な編集・内容変更プログラムによれば、一度組版された印刷物の内容の変更を、紙を使わず且つ容易に行うことができる。
【図面の簡単な説明】
【0020】
【図1】執筆されたデータが書籍になるまでの概略を示す説明図である。
【図2】組版データを改訂する場合の従来の手順を示す説明図である。
【図3】組版データを改訂する場合に本発明のシステムによる手順を示す説明図である。
【図4】本発明に係る書籍掲載文書の電子的な編集・内容変更システムおよび書籍掲載文書の電子的な編集・内容変更プログラムの構成を示すブロック図である。
【図5】組版データとデータ変更後のワープロデータの例を示す説明図である。
【図6】データ変換時のフローチャートである。
【図7】文書比較の動作の概略を示す説明図である。
【図8】文書を比較する差分比較アルゴリズムについて説明する説明図である。
【図9】エディットグラフ上で変更と判断する場合の説明図である。
【図10】文書の比較項目の構成について示す説明図である。
【図11】階層構造となっている文章の差分比較アルゴリズムの比較例を説明する説明図である。
【図12】差分比較アルゴリズムにおける特別処理について説明する説明図である。
【図13】差分比較アルゴリズムによって組み合わせを確定させるところについて説明する説明図である。
【図14】ページ比較の例について説明する説明図である。
【図15】図14の続きである。
【図16】詳細比較の例について説明する説明図である。
【図17】図16の続きである。
【図18】ページ比較差異表示データの一例を示す説明図である。
【図19】詳細比較差異表示データの一例を示す説明図である。
【図20】本発明に係る書籍作成システムの構成を示す説明図である。
【発明を実施するための形態】
【0021】
以下、本発明の好適な実施の形態を添付図面に基づいて説明する。
まず、本発明の背景について説明する。
図1では、執筆されたデータをどのように書籍にするかについて、一般的な過程が示されている。
図1(a)では、執筆者がワープロソフトを用いて執筆したデータを示している。この段階では、執筆者が執筆した範囲(執筆の単位)で文書単位が構成される。また、この段階ではワープロソフトのファイル単位もこの文書単位であることが一般的である。
【0022】
図1(b)では、執筆された文書が組版装置に入力されて組版された状態でのデータを示している。ここでは、執筆されたデータに見出しおよびページ番号が付与される。また、組版装置においては、(a)における文書単位とは無関係に文書がまとめられる。この組版装置における組版単位は、印刷会社において、ページ数を参照したり、内容の区切りをみたり、書式の相違等をみることで決定される。
【0023】
図1(c)では、組版装置で組版されたデータに基づいて書籍として印刷された結果を示している。書籍となるためには、必ず奇数ページと偶数ページとが一体となり、それが1枚の紙で表と裏に配置されるように構成される。
【0024】
図2には、書籍を改訂する場合において、従来のように紙で校正をするところを示す。
すなわち、従来では、書籍の内容全てを印刷し、この印刷した紙に、執筆者等が修正を加える。そして修正がある紙だけを抜き出して組版原稿を作成し、この組版原稿に基づいて修正した部分を人手により組版装置に入力するのである。
【0025】
図3には、書籍を改訂する場合において、本発明のシステムを用いた手順の概略を示す。
本発明の書籍掲載文書の電子的な編集・内容変更システムでは、書籍として組版データの状態で、文書の範囲を選択し、この選択された文書単位で組版データをワープロデータに変換する。ここで、文書の範囲を選択するのは、本発明のシステムの操作者である。操作者は、組版データ中の見出しや、書式の違いなどに基づいて文書の範囲を選択する。
本発明の書籍掲載文書の電子的な編集・内容変更システムは、選択された文書単位でワープロデータに変換し、変更後のワープロデータを執筆者等(編集者も修正等を行う場合もある)がワープロソフト上で修正を行う。そして、本システムは、文書単位で修正前のワープロデータと修正後のワープロデータとで変更箇所を検出し、検出箇所を表示する。
このようなシステムによれば、文章単位ごとにどこがどのように変更されたのかおよび書籍のどのページのどの部分をどのように修正すればよいのかが容易に判断できる。
【0026】
続いて、本発明の全体構成について、図4に基づいて説明する。
本実施形態の書籍掲載文書の電子的な編集・内容変更システム30は、組版装置Aに対してLAN(Local Area Network)等のネットワークNを介して互いに通信可能に接続された、コンピュータBによって実現される。
【0027】
コンピュータBは、通常のパーソナルコンピュータまたはワークステーション等で構成される。
このようなコンピュータBは、CPUおよびメモリを含み、ソフトウェアプログラムを実行することによって各制御を行うことができる制御部32と、キーボードおよびマウス等のポインティングデバイスからなり、操作者が制御部32に対して情報を入力する入力手段34と、液晶ディスプレイやCRT等の制御部からの信号に応じて情報を表示可能なモニタ36と、ネットワークNを介して他のコンピュータや電子機器等とデータを通信可能なLANカードまたはLANポート等の通信手段40と、ソフトウェアプログラムや各種データを記憶する記憶手段42とを備えている。記憶手段42としては主としてハードディスクが挙げられる。
【0028】
コンピュータBのハードディスク42には、データ変換プログラムp1が記憶されている。
データ変換プログラムp1がハードディスク42から読み出されて制御部32によって実行されることにより、本発明の書籍掲載文書の電子的な編集・内容変更システム30を構成する各手段(機能)が実現される。
また、コンピュータBのハードディスク42は、変更箇所検出手段58によって検出された変更箇所の結果を記憶しておく結果記憶手段66も実現している。
【0029】
なお、コンピュータBに接続される組版装置Aも、通常のパーソナルコンピュータまたはワークステーション等で構成される。
組版装置Aでは、組版作業者が印刷対象となる文章を入力および編集を実行できる組版手段25を有している。このような機能は、組版装置Aのハードディスクまたは半導体メモリ等の記憶手段24に記憶されている組版プログラムp0が制御部22に読み出されて実行されることで実現される。
【0030】
なお、組版装置Aには、ワープロデータで構成されるワープロデータを組版データで構成される組版データに変換するデータ変換手段26が設けられている。データ変換手段26は、組版装置Aのハードディスクまたは半導体メモリ等の記憶手段24に記憶されているデータ変換プログラムp11が制御部22に読み出されて実行されることで実現される。このデータ変換手段26については公知のものであるので、ここではその内容については詳述しない。
【0031】
また、組版装置Aのデータ変換手段26は、コンピュータBによってHTML等の言語で作成されたページ比較差異表示データ70や、詳細比較差異表示データ80をマークアップ言語であるXML等の言語に変換する機能も有している。このようなデータ変換手段26の機能は、組版装置Aのハードディスクまたは半導体メモリ等の記憶手段24に記憶されているデータ変換プログラムp12が制御部22に読み出されて実行されることで実現される。
【0032】
さらに、組版装置Aには、作成された組版データFaを記憶しておくことができる組版データ記憶手段28が設けられている。組版データ記憶手段28としては、ハードディスクなどを採用するとよい。
【0033】
続いて、コンピュータBにインストールされたデータ変換プログラムp1が制御部32により実行されることで実現される各手段について説明する。
【0034】
(データ変換手段)
本実施形態におけるデータ変換手段44は、組版装置Aの組版データ記憶手段28に記憶されている組版データFaを読み出し、読み出した組版データFaをワープロデータFbに変換して変更前ワープロデータ記憶手段55に記憶する機能を有している。
【0035】
組版データとは、組版装置Aにおいてデータとして使用できるものであり、具体的には、図5に示すように、組版データFaは、実際に印刷される対象となる印刷対象データCaをマークアップ言語であるXML言語で記述して生成されたものである。
【0036】
なお、ノンブルとは、一般的には各ページの端の部分(天、小口、地、またはのど等)に印刷される、対応するページのページ番号のことである。
【0037】
ワープロデータについては、上述したようにワープロソフトによって読み書きされる形式のデータであり、本発明としては、特定のワープロソフトに対応するワープロデータに限定するものではない。
【0038】
組版データとワープロデータの変換は、漢字、ひらがな、カタカナ、アルファベットなどの本来の文字の他に算術記号、図形なども含まれる。さらに、スペースやタブなども文字と同様に変換される。さらには、文字サイズ、書体(斜体、太字等)、文字色、文字間隔、下線の有無なども文字と同様に変換される。
【0039】
検索手段47は、文字だけではなく、組版データFaから読み取った段落情報に基づいて組版データをワープロデータに変換する。段落情報としては、段落の配置(絶対位置、相対位置、揃え等)、字下げ量(初行の字下げ量および2行目以降の字下げ量)、行間隔、禁則処理の設定などがある。また、ここでいう段落とは、文章の段落に限定されるものではなく、対象となる文書中の一定の区切りであって、例えば、文章の見出し、表、図なども段落情報に含まれるものとする。
【0040】
検索手段47が組版データFaの段落を表すタグ「<p name=”・・・”>」または「<p>」と、タグ「</p>」を検索する。これらのタグ49により、それらの間の記述が一つの段落であることが示される(なお、柱やノンブルも段落の一つとして扱う)。
【0041】
(ページ位置検出手段)
次に、ページ位置検出手段52について説明する。
ページ位置検出手段52は、組版データFa中のページ位置を検出する機能を有するものである。
ページ位置検出手段52は、操作者が指定した組版データFaの中から、ページの境界を表すタグ54を検索する。このタグ54の例としては、「<?page x?>」(xはページ番号)のように記述されている。このタグ「<?page x?>」の意味としては、それ以降の記述の、印刷されるページ番号xを定義するものである。言い換えると、タグ「<?page x?>」は、その位置でページが切り替わること、すなわちページの境界を表している。
【0042】
(ページ位置表示手段)
ページ位置表示手段56は、ページ位置検出手段52によって検出されたページ位置をワープロデータFbの該当箇所に埋め込む機能を有する。したがって、このページ位置表示手段56が動作するのは、上述したデータ変換手段44によって組版データFaからワープロデータFbが作成された後、または作成途中の場合である。
【0043】
ページ位置情報57としては、文書の本文とは明らかに異なるような表示となるようにすることが好ましい。例えば、図5に示すような形式にするとよい。なお、ページ位置情報57は、ワープロデータFb内に入力されるものであるから、当然ながらワープロデータによるものである。
また、ページ位置表示手段56は、制御部32のCPUが、上述したような動作を実行することにより実現される。
【0044】
上述してきた、データ変換手段44、ページ位置検出手段52およびページ位置表示手段56がそれぞれ動作することによって、組版装置Aで作成された組版データFaからワープロデータFbが作成される。
作成されたワープロデータFbは、変更前ワープロデータ記憶手段55に記憶される。変更前ワープロデータ記憶手段55とは、具体的にはハードディスク42などが該当する。
【0045】
このように、ワープロデータFbが作成されることにより、校正作業者や執筆者が校正しようとする場合、ワープロソフトによって内容の変更が容易に行える。
【0046】
続いて、図6のフローチャートに基づいて、データ変換手段44、ページ位置検出手段52およびページ位置表示手段56による組版データからワープロデータへの変換動作について説明する。
データ変換手段44は、組版データFa(組版装置Aに記憶されている)を所定の文書単位に分割するように、操作者に促す画面をモニタ36に表示させる(ステップS100)。モニタ36には、操作者が、組版データFaの何ページ〜何ページまでを1つの文書単位にするかを入力可能な入力部が表示され、操作者が入力部に文書単位として区切るページを入力する。
【0047】
データ変換手段44は、文書単位となっている組版ファイル(以下、文書単位に構成されている組版データの1つ1つを組版ファイルと称する場合がある)を読み込む(ステップS102)。
そして、ページ位置検出手段52は、読み込んだ組版ファイル内のページ位置を検出するとともに、読み込んだ組版ファイル内のノンブルの値を検出する(ステップS104)。
【0048】
データ変換手段44は、検出したノンブルの値と、文書単位として操作者が入力した区切りのページとを比較する(ステップS106)。
比較の結果、検出したノンブルの値と、文書単位として操作者が入力した区切りのページとが一致している場合、ここから1つの文書単位が始まるので、データ変換手段44は、変更後のワープロデータが記憶されるワープロデータファイルを生成する(ステップS107)。
【0049】
また、すでにワープロデータファイルが生成されている場合には、ステップS108へ移行し、ページ位置検出手段52は、ステップS107で生成されたワープロデータファイルにページ位置情報を書き込む(ステップS108)。
そして、データ変換手段44は、次のページ位置までの組版データFaをワープロデータFbに変換し、書き込まれたページ位置情報に続けて、変換されたワープロデータは、ワープロデータファイルに書き込まれる(ステップS110)。
【0050】
なお、データ変換手段44は、組版データFaのワープロデータFbへの変換後、読み込んだ次のノンブルの値と、文書単位として操作者が入力した区切りのページとを比較する(ステップS112)。
比較の結果、検出したノンブルの値と、文書単位として操作者が入力した区切りのページとが一致している場合、これで、1つの文書単位が終了する。このため、データ変換手段44は、変更後のワープロデータを記憶したワープロデータファイルを閉じる(ステップS113)。
【0051】
なお、上記ステップS112において、データ変換手段44が組版データFaのワープロデータFbへの変換後、読み込んだ次のノンブルの値と、文書単位として操作者が入力した区切りのページとを比較した結果、検出したノンブルの値と、文書単位として操作者が入力した区切りのページとが一致していない場合、ステップS104へ戻り、ページ位置検出手段52が、読み込んだ組版ファイル内のページ位置を検出するとともに、読み込んだ組版ファイル内のノンブルの値を検出する。
そしてデータ変換手段44は、読み込んだ組版ファイル内のノンブルの値が、最初に操作者が設定した値(操作者が決めた文書単位の最終ページ)になるまでデータ変換を繰り返し実行する。
【0052】
また、ステップS113でワープロデータファイルを閉じた後、データ変換手段44は、組版ファイルを全て処理したか否かを判断する。
組版ファイルを全て処理した場合、データ変換手段44による変換処理工程は終了する。
処理していない組版ファイルが存在する場合、ステップS102へ戻り、データ変換手段は、処理していない組版ファイルの読み込みを実行する。
【0053】
(ワープロデータの内容の変更)
上述してきた構成によって作成されたページ位置情報が付加されたワープロデータFbは、改訂等の場合には執筆者または校正作業者によってその内容が変更されることがある。ワープロデータFbの変更は、ワープロデータFbをワープロソフトが読み込むことによりワープロソフト上で行われる。
【0054】
(ページ位置情報の取り扱い)
なお、ワープロデータFbを変更した後の校正時には、ページ全体を削除することでページ数が減少したり、あるいは文字列を追加することでページ数が増加してしまう可能性もある。しかしながら、ワープロデータに付加されているページ位置情報については、削除や修正の必要はない。
変更されたワープロデータFcをあらためて組版装置Aに読み込んで、組版装置Aの操作者が適宜組版をし直すため、ワープロデータFc上でのページ位置の変更については特に必要が無いと認められるためである。
【0055】
(変更箇所検出手段)
変更箇所検出手段58は、上述してきたようなデータ変換手段44、ページ位置検出手段52およびページ位置表示手段56がそれぞれ動作することによって作成されたワープロデータFbの内容を、執筆者や校正作業者が変更した場合に、その変更箇所を検出する機能を有している。なお、変更されたワープロデータFcは、変更後ワープロデータ記憶手段59に記憶される。変更後ワープロデータ記憶手段59としては、ハードディスク42などが該当する。
【0056】
ここで、変更箇所検出手段58の機能と概略動作について図7に基づいて説明する。
変更箇所検出手段58は、大きく分けて「ページ比較」と「詳細比較」の2つの機能を有している。
変更箇所検出手段58のページ比較機能は、ページレベルでの比較という程度の意味合いで用いている用語であり、ノンブルの値(ページ)およびページ位置情報で区切られた範囲内の文書を比較対象に含む。
ページ比較機能では、まず、比較対象となるワープロデータを操作者が選択したら、選択された変更前のワープロデータFbと変更後のワープロデータFcのそれぞれに同じファイル名が存在するか否かを判断する。
変更箇所検出手段58は、変更前のワープロデータFbと同じファイル名が変更後のワープロデータFcに存在しないことを検出した場合には、このファイルが変更後に削除されたファイルであると判断し、結果記憶手段66に判断した事項を記憶する。
また、変更箇所検出手段58は、変更後のワープロデータFbに存在するファイル名と同じファイル名が変更前に存在しない場合には、このファイルが変更後に追加されたファイルであると判断し、結果記憶手段66に判断した事項を記憶する。
【0057】
続いて、変更箇所検出手段58のページ比較機能は、同じファイル名が存在した場合には、同じファイル名どうしの変更前と変更後のワープロデータ間でページ位置情報を比較し、同じノンブルの値があるか否かを判断する。
変更箇所検出手段58は、変更前のワープロデータFbと同じノンブルの値が変更後のワープロデータFcに存在しないことを検出した場合には、このページが変更後に削除されたページであると判断し、結果記憶手段66に判断した事項を記憶する。
また、変更箇所検出手段58は、変更後のワープロデータFbに存在するノンブルの値と同じノンブルの値が変更前に存在しない場合には、このページが変更後に追加されたページであると判断し、結果記憶手段66に判断した事項を記憶する。
【0058】
さらに、変更箇所検出手段58のページ比較機能は、同じノンブルの値が存在する場合には、同じノンブルの値どうしの変更前と変更後のワープロデータ間でページ内の文書を比較し、同じノンブルの値のページ内の文書に差異があるか否かを判断する。
【0059】
差異表示作成手段60は、ページ比較機能の実行結果について、この結果を表示させるためのページ比較差異表示データを、結果記憶手段66に記憶されている内容に基づいて作成する。
ページ比較差異表示データ70は、変更前と変更後で同じファイル名が存在しなかったファイルについて、変更後に削除された旨または変更後に追加された旨が表示されるように作成されるとともに、変更前と変更後で同じファイル名が存在した場合には、各ノンブルの比較結果を表にして表示させるように作成される。各ノンブルの比較結果のページ比較差異表示データ70は、図7に示すように、文書に差異が無ければ情報欄に何も表示されないように作成されるとともに、変更前と変更後で同じノンブルの値が存在しなかったファイルについて、変更後に削除された旨または変更後に追加された旨が表示されるように作成される。
作成されたページ比較差異表示データ70は差異表示データ記憶手段68に記憶される。
【0060】
変更箇所検出手段58の詳細比較機能は、ページ比較の実行後に動作する。詳細比較機能とは、詳細レベルでの比較といった意味合いで用いている用語である。
詳細比較機能は、ページ比較機能によって差異があると判断されたページの文書を文字単位で比較する。詳細比較機能の具体的な動作については後述するが、文字自体の変更だけではなく、文字の属性情報についても比較できる。
【0061】
変更箇所検出手段58は、詳細比較機能の実行結果を結果記憶手段66に記憶する。
そして、差異表示作成手段60は、この結果を表示させるための詳細比較差異表示データ80を結果記憶手段66に記憶されている内容に基づいて作成する。
詳細比較差異表示データ80は、変更前のワープロデータFbと変更後のワープロデータFcを左右に並べて配置する新旧対照方式となるように作成され、且つ変更前のワープロデータFbと変更後のワープロデータFcにおいて差異があった箇所の文字の属性を他の部分の属性とは異ならせて表示されるように作成される。
作成された詳細比較差異表示データ80も差異表示データ記憶手段68に記憶される。
【0062】
(変更箇所を検出するための方法)
変更箇所検出手段58における変更箇所の検出は、変更前のワープロデータFbと変更後のワープロデータFcの差分をとることによって行われる。
ワープロデータFbとFcとを差分比較することで、比較したワープロデータFbとFcとの差異、および差異の箇所の特定が可能となる。
【0063】
変更箇所検出手段58は、文書比較に用いられる手段として公知のアルゴリズムであるO(NP)方式を採用している。
O(NP)方式では、文書の比較とは、比較対象となる2つの文書の最長共通部分と最小編集距離を求める問題であると捉え、エディットグラフと呼ばれるグラフを用いて文書の比較を実行する。
エディットグラフは、比較対象となる文書の要素をそれぞれX軸(横軸)およびY軸(縦軸)に配置し、各要素から縦方向または横方向に線を延ばして格子状に形成したものである。エディットグラフは、その左上が原点(0,0)であり、位置座標(X,Y)は左上を(0,0)とし、右方向がX軸の正方向、下方向がY軸の正方向であるとする。
【0064】
O(NP)方式では、原点(0,0)から比較を開始し、現在の座標(X,Y)に対してX軸とY軸のそれぞれに+1した座標(X+1,Y+1)つまり現在の座標から右斜め下の交点の要素を比較する。
比較した要素が一致する場合には、現在の座標から要素が一致した座標(X+1,Y+1)へ移動する。したがって比較した要素が一致した場合の移動は、格子状の縦線または横線を移動するのではなく交点間の対角線上を移動することとなる。
比較した要素が一致しない場合には、現在の座標(X,Y)からX軸方向にのみ+1した座標(X+1,Y)と、現在の座標(X,Y)からY軸方向にのみ+1した座標(X,Y+1)の双方に移動する。すなわち、比較した要素が一致しない場合には、対角線上ではなく、縦線上または横線上を移動することとなる。
【0065】
そして、移動した先の現在の座標からX軸とY軸のそれぞれに+1した座標、つまり現在の座標から右斜め下の交点の要素を比較する。
この動作を、右下の座標に到達するまで繰り返し実行する。右下の座標とは、X座標の最大値(M)とY座標の最大値(Y)の座標(M,N)で表される。左上から右下までの移動経路が要素の比較結果である。
【0066】
要素の差異の有無の検出は、移動経路によって行われる。
移動経路がエディットグラフの対角線と一致する場合、比較要素が完全に一致したことを示している。移動経路がエディットグラフの対角線と一致しない場合、要素に差異(追加、削除または変更)があることを示している。
【0067】
要素のうちいずれの箇所に差異があるかの検出も移動経路によって検出される。
すなわち、移動経路が交点間を対角線上(斜め)に移動している箇所については要素が一致している箇所であり、移動経路が交点間をX方向またはY方向に移動している箇所については要素に差異がある箇所である。
【0068】
続いて、図8に示すように、文字列「あいうえ」と文字列「あうえお」を比較する場合について、エディットグラフを用いた文書比較の判断例を説明する。
変更箇所検出手段58は、まず「あいうえ」をX軸上に、「あうえお」をY軸上に配置したエディットグラフを作成する。そして、変更箇所検出手段58は、エディットグラフの左上から右下に向けてグラフの交点における文字同士を比較して行く。
【0069】
まず、左上の座標から比較をスタートするので、変更箇所検出手段58は、現在の座標(0,0)に対して右斜め下のそれぞれ+1した座標(1,1)における文字を比較する。
座標(1,1)では文字は「あ」と「あ」で一致するので、変更箇所検出手段58は、座標(1,1)に進み、続けてこの座標からそれぞれ+1した座標(2,2)における文字を比較する。座標(2,2)では文字は「う」と「い」で不一致であるから、変更箇所検出手段58は、座標(2,2)には進まないで、座標(2,1)および座標(1,2)に進む。
【0070】
座標(2,1)に進んだ場合、変更箇所検出手段58が次に比較する座標は、座標(2,1)にそれぞれ+1した座標(3,2)であり、その文字は「え」と「い」である。つまり座標(3,2)は不一致であるので、変更箇所検出手段58は、座標(2,1)からは座標(3,1)および座標(2,2)へ進む。
【0071】
なお、座標(1,2)に進んだ場合、変更箇所検出手段58が次に比較する座標は、座標(1,2)にそれぞれ+1した座標(2,3)であり、その文字は「う」と「う」である。つまり座標(2,3)は一致するので、変更箇所検出手段58は、座標(2,3)へ進み、さらに座標(2,3)にそれぞれ+1した座標(3,4)の文字を比較する。座標(3,4)の文字は「え」と「え」で一致するので、変更箇所検出手段58は、一致する座標(3,4)へ進む。そして、変更箇所検出手段58は、座標(3,4)からは一番右下の座標(4,4)へ進む。
【0072】
このようにして、変更箇所検出手段58は、文字を比較しつつエディットグラフの左上から右下まで移動し、そのルートを見ることで文字列の同一または差異を判定することができる。左上から右下へ移動するには、複数のルートが存在し、変更箇所検出手段58は、それら全てのルートを確認し、右下の座標に最も早く到達したルートが文字列の比較結果であると判定する。
【0073】
なお、図9に示すように、変更箇所検出手段58は、エディットグラフ上で縦方向または横方向に移動した後、この移動経路と同じ移動量分移動した場合、例えば縦方向の後に同じ移動量分だけ横方向に移動する場合と、横方向の後に同じ移動量分だけ縦方向に移動する場合においては、この箇所は追加や削除ではなく、「変更」と判断する。
図9の例では、座標(1,1)から座標(2,2)へ移動する間、横方向の座標(2,1)へ移動し、座標(2,1)から縦方向の座標(2,2)へ移動している。したがって、変更箇所検出手段58は、文字列Aの2番目の文字「い」が「お」に変更されたと判断する。同様に、座標(2,2)から座標(3,3)へ移動する間、横方向の座標(3,2)へ移動し、座標(3,2)から縦方向の座標(3,3)へ移動している。したがって、変更箇所検出手段58は、文字列Aの3番目の文字「う」が「お」に変更されたと判断する。
【0074】
(ワープロデータの比較項目)
次に、ワープロデータのデータ構造と比較項目について、図10に基づいて説明する。
ワープロデータの最上位階層は、ファイルである。ファイルの属性情報としてファイル名が保持される。
ファイルの下層には、1または複数のページが存在する。ページの属性情報としてノンブルが保持される。ページの区切りはページ位置情報に基づいて決定されるものであり、またページ位置情報にノンブルの値が記述されている。
【0075】
ページの下層には、1または複数の段落が存在する。段落には文章を扱うものと表を扱うものの2種類が存在し、それぞれの種類は段落の属性情報である段落タイプによって判別している。また、段落の属性情報はその他に段落のスタイルやインデント等の情報も保持している。
【0076】
文章段落には文字列を扱うものと図形を扱うものの2種類が存在し、それぞれの種類は属性情報である文章タイプによって判別している。
また、文字列の文章の下層には、複数の文字が存在する。文字の属性情報としては文字、ルビ文字、テキストスタイル、文字サイズ、長平体、イタリック、上下付き、ベースライン調整、アンダーライン、囲み罫およびボールド等が保持される。
【0077】
図形の種類としては、図形および画像も含む。図形の属性情報としては図形の種類を判別する図形タイプと図形が持つデータが保持される。また、画像を扱う場合には、属性情報としてファイル名が保持される。
【0078】
また、表の段落の場合、属性情報として表スタイル、揃えが保持される。
さらに表の下層には、複数の行が存在する。
行の下層には、複数のセルが存在する。セルの属性情報としては、セル罫線、斜線、セル結合、セル内揃えが保持される。さらにセル罫線の属性情報として、セルの上下左右、セル間の属性情報が保持される。
なお、セルの下層には、複数の段落が存在する場合がある。この場合、この段落について上述したような段落およびこの段落の下層項目が保持される。
【0079】
なお、変更箇所検出手段58による「ページ比較機能」と「詳細比較機能」とでは、比較する属性情報が異なっている。
ページ比較機能は、ページ毎の差異を比較する機能であるので、要素が持つ全ての属性情報を網羅的に比較する。
一方、詳細比較機能は、要素が持つタイプ(段落タイプ、文章タイプ)と文字列の比較処理を元に要素の組み合わせを確定させ、その組み合わせの確定後に属性情報を別途比較する。
【0080】
(階層構造を比較するアルゴリズム)
本発明では単なる文字列だけを比較するわけではなく、上述したように、階層構造になっている各項目ごと、ファイル単位、ページ単位、段落単位、文章単位および文字単位でのそれぞれの比較が必要となる。
そこで、このように階層構造になっている場合の差異の判定方法を、O(NP)方式で実行する場合について以下に説明する。
【0081】
以下では、段落の中に複数の文字が存在する2階の階層構造となっている場合の例について、図11に基づいて説明する。
変更前のワープロデータFbは、(1)〜(4)までの4つの段落を有しており、各段落には「あいうえ」、「かかか」、「さしす」、「たちつて」の文字列が記述されているとする。
このデータを変更した変更後のワープロデータFcは、A〜Dまでの4つの段落を有しており、各段落には「あいうお」、「さしす」、「たちツて」、「なな」の文字列が記述されているとする。
【0082】
変更箇所検出手段58は、まず上位階層である段落を比較するエディットグラフを作成する。段落比較用のエディットグラフは、X軸に変更後の段落A,B,C,Dが配置され、Y軸に変更前の段落(1),(2),(3),(4)が配置される。
変更箇所検出手段58は、段落比較用のエディットグラフの左上の座標から最初に比較すべき座標(1,1)の段落を比較する。
【0083】
ここで、変更箇所検出手段58は、段落Aと段落(1)との比較を行うために、段落A内の文字列と段落(1)内の文字列を抽出してこれらの文字列をX軸およびY軸に配置した文字比較用のエディットグラフを作成する。
この文字比較用のエディットグラフでは、変更後の文字「あいうお」がX軸に配置され、変更前の文字「あいうえ」がY軸に配置される。
【0084】
図8で説明したようなアルゴリズムを変更箇所検出手段58が実行することにより、この文字比較用のエディットグラフにおいて文字比較すると、4つの文字のうち最後の文字のみが異なっていることが判定できる。
変更箇所検出手段58は、文字比較用のエディットグラフにおいて差異が検出されたか否か、どの箇所に差異があったかを、結果記憶手段66に記憶する。
【0085】
次に、変更箇所検出手段58は、段落比較用のエディットグラフに戻り、段落比較用のエディットグラフにおける座標(1,1)が不一致だったことを受けて座標(1,1)には進まずに、座標(1,0)および座標(0,1)に進む。
例えば、変更箇所検出手段58は、座標(1,0)に進んだ場合には、座標(1,0)にそれぞれ+1した位置の座標(2,1)を比較する。座標(2、1)は段落Bと段落(1)との比較である。
【0086】
変更箇所検出手段58は、段落Bと段落(1)との比較をするため、段落B内の文字列と段落(1)内の文字列を抽出してこれらの文字列をX軸およびY軸に配置した文字比較用のエディットグラフを作成する。
この文字比較用のエディットグラフでは、変更後の段落B内の文字「さしす」がX軸に配置され、変更前の段落(1)内の文字「あいうえ」がY軸に配置される。
以下、文字比較用のエディットグラフにおける具体的な比較方法については省略するが、結果として変更箇所検出手段58は、文字比較用のエディットグラフにおいて差異が検出されたか否かと、どの箇所に差異があったかを、結果記憶手段66に記憶する。
【0087】
そして、変更箇所検出手段58は、再び段落比較用のエディットグラフに戻り、段落比較用のエディットグラフにおける座標(2,1)が不一致だったことを受けて、座標(1,1)および座標(2,0)へ進む。
以下の詳細な動作については説明を省略するが、このように本実施形態では、上位階層のエディットグラフ上での移動を下位階層のエディットグラフによって一致・不一致を確認しつつ行うことにより、全階層における変更箇所の検出を確実に行えるようになっている。
【0088】
上述してきた変更箇所検出手段58による比較処理は、各階層の要素の比較に適用される。また、比較処理では図10に示したような各階層の要素が保持する属性情報が比較対象となる。
【0089】
(差異判定時の特別処理)
差異判定時の特別な処理について図12に基づいて説明する。
上述した変更箇所検出手段58が実行する差分比較アルゴリズムにおいては、下位階層での比較結果に基づいて上位階層で差異の有無を判定するようにしてきた。
しかし、段落や表内の行について、下位階層の文字列の中の文字が1文字しか違っていない場合であっても「差異有り」として判定してしまえば、上位階層のエディットグラフで不一致のルートを選択せざるを得なくなってしまい、段落全体や行全体が追加または削除されたとの判定になる場合もある。
【0090】
このことを図12の例で説明すると、通常、人間が差異を判定すると、編集前の段落(1)は1文字だけ変更されていると見る。さらに段落(2)が削除されることによって、段落(3)は段落Bに繰り上がっていると見る。段落(4)は2文字変更されて段落Cに繰り上がっていると見る。そして、段落Dが追加されたと見る。
しかし、エディットグラフを用いた差分比較アルゴリズムによって自動的に差異判定を実行した場合には、変更前の段落(3)と変更後の段落Bが一致する以外は、段落すべて不一致であるとの判定が出るだけであり、何れの段落どうしを組み合わせて比較するかということができない。
【0091】
そこで、本実施形態の変更箇所検出手段58では、詳細比較機能において変更率と言う概念を導入して、差異判定の処理を実行する。
変更率とは、文字列中の文字数に対して差異のある文字数の割合をいう。例えば、段落(1)と段落Aとを比較した場合には、全文字数4つに対し、変更されている文字数は1つであるから、変更率は1/4で25%であると計算される。また、段落(4)と段落Cとを比較した場合には、全文字数4つに対し、変更されている文字数は2つであるから、変更率は2/4で50%と計算される。
【0092】
変更箇所検出手段58は、予め変更率の閾値を設定しておき、下位階層である段落または表内の行の文字列について閾値以上の変更率であることが算出された場合には、該当する段落または表内の行についてはエディットグラフ上で不一致としてルートを策定し、下位階層である段落または表内の行の文字列について閾値未満の変更率であることが算出された場合には、該当する段落または表内の行についてエディットグラフは一致したものとしてルートが策定される。
【0093】
図12の下段の段落比較用のエディットグラフによれば、上記のような変更率の概念を導入し、変更率の閾値を70%とすれば、段落(1)と段落Aとは変更率25%であるから一致として判定され、段落(4)と段落Cとは変更率50%であるからこれも一致として判定される。
こうして、図12の上段の変更率の概念を導入しないエディットグラフのルートよりも、下段の変更率の概念を導入したエディットグラフのルートの方が一致する段落が多くなり、後述する比較要素の組み合わせに際して文字列内の文字の変更についても正確に判定ができるようになる。
なお、このような差異判定時の特別処理は、詳細比較機能でのみ実施する。ページ比較機能では差異の有無のみが判明できれば良いから変更率の概念を導入の必要性がないためである。
【0094】
(比較要素の組み合わせ)
次に、図13に基づいて、比較要素の組み合わせについて説明する。
なお、比較要素の組み合わせの確定は、詳細比較機能でのみ実施される。変更箇所検出手段58によって実行される組み合わせ処理は、各要素の比較によって得られたエディットグラフから要素の組み合わせを確定し、その確定した組み合わせに基づいてさらに下位階層の比較処理を実行する。変更箇所検出手段58は、この下位階層においても比較結果のエディットグラフから要素の組み合わせを確定し、その下位階層があればさらにその下位階層の比較処理を実行する。
変更箇所検出手段58は、詳細比較において上位階層から下位階層へ繰り返し組み合わせ確定を実施することによって、差異のある箇所を特定することができ、差異のある箇所の表示が可能となる。
【0095】
図13では、図12に示したワープロデータの例とほぼ同様な例に基づいている。
変更前のワープロデータFbは、(1)〜(4)までの4つの段落を有しており、各段落には「あいうえ」、「かかか」、「さしす」、「たちつて」の文字列が記述されているとする。
このデータを変更した変更後のワープロデータFcは、A〜Dまでの4つの段落を有しており、各段落には「あいえ」、「さしす」、「たつちて」、「なな」の文字列が記述されているとする。
【0096】
図12で説明したように変更率と言う概念を用いて変更箇所検出手段58が詳細比較を実行すると図13の左端に記載されたエディットグラフのような結果が出る。
このエディットグラフの移動経路に基づいて段落同士の組み合わせを確定させる場合には、変更箇所検出手段58によって、変更率の概念により一致と判断される段落(1)と段落Aとが組み合わせられる。
また、変更箇所検出手段58によって、段落(2)は削除と判断される。
変更箇所検出手段58によって、一致すると判断される段落(3)と段落Bとが組み合わせられる。
変更箇所検出手段58によって、変更率の概念により一致と判断される段落(4)と段落Cとが組み合わせられる。
最後に、変更箇所検出手段58によって、変更前には一致する段落が存在しない段落Dが追加されたと判定される。
【0097】
変更箇所検出手段58は、組み合わせ確定を実行した後、組み合わせによって対応する要素があるものについては、その対応する要素における下位要素の比較処理を実行する。
この例では、変更箇所検出手段58は、変更前の段落(1)と変更後の段落Aが対応する要素であるので、段落(1)の文字列「あいうえ」と段落Aの文字列「あいえ」を文字比較する。この文字比較によって、図13の右側上段のエディットグラフが結果として得られる。そして、変更箇所検出手段58は、このエディットグラフによって、図13の右側上段のように組み合わせを確定する。この例では、変更によって文字「う」が削除されたことが分かる。
【0098】
また、変更箇所検出手段58は、組み合わせられた変更前の段落(3)と変更後の段落Bとを比較する場合、段落(3)の文字列「さしす」と段落Bの文字列「さしす」を文字比較する。この文字比較によって、図13の右側中段のエディットグラフが結果として得られる。そして、変更箇所検出手段58は、このエディットグラフによって、図13の右側中段のように組み合わせを確定する。
【0099】
さらに、変更箇所検出手段58は、組み合わせられた変更前の段落(4)と変更後の段落Cとを比較する場合、段落(4)の文字列「たちつて」と段落Cの文字列「たつちて」を文字比較する。この文字比較によって、図13の右側下段のエディットグラフが結果として得られる。そして、変更箇所検出手段58は、このエディットグラフによって、図13の右側下段のように組み合わせを確定する。
【0100】
(差異比較の具体例)
次に、図14〜図19に基づいて、本実施形態における変更箇所検出手段の具体例を説明する。
まず、ページ比較機能の具体例について図14〜図15に基づいて説明する。
【0101】
(フォルダ選択)
フォルダ選択については図14の(A)に示す。
操作者は、コンピュータBの入力手段34を操作することによって、変更前ワープロデータ記憶手段55に記憶されている変更前ワープロデータFbのフォルダと、変更後ワープロデータ記憶手段59に記憶されている変更後ワープロデータFcのフォルダとを選択する。
【0102】
(ファイル比較)
変更箇所検出手段58は、選択されたフォルダについて、図13の(b)に示すように、ファイル比較を実行する。ファイル比較は、変更箇所検出手段58が、選択されたフォルダ内に保存されている各ファイルのファイル名同士を比較する。
変更箇所検出手段58は、一致するファイル名が存在する場合、このファイル名で比較の組み合わせを確定させて結果記憶手段66に記憶させる。組み合わせが確定したファイルは、次のページどうしの比較に移行する。ここでは、ファイル名「aaa」同士とファイル名「ddd」同士の組み合わせが決定した例が記載されている。
【0103】
変更箇所検出手段58は、変更前に存在し、変更後に存在しないファイル名を検出した場合、該当するファイルが変更後に削除されたものである旨を結果記憶手段66に記憶する。このようなファイルは次のページどうしの比較は実行しない。ここでは、ファイル名「bbb」が削除した例として記載されている。
また、変更箇所検出手段58は、変更前に存在しておらず、変更後に存在するファイル名を検出した場合、該当するファイルが変更後に追加されたものである旨を結果記憶手段66に記憶する。このようなファイルについても次のページどうしの比較は実行しない。ここでは、ファイル名「ccc」が追加した例として記載されている。
【0104】
(ページどうしの比較)
続いて、図14に示すように、変更箇所検出手段58はファイル比較において組み合わせが確定したファイルについて、このファイル内のページどうしの比較を実行する。
ページどうしの比較は、変更箇所検出手段58が、ファイル内のページ位置情報57に記述されているノンブルの値を検出し、ノンブルの値同士を比較する。
変更箇所検出手段58は、一致するノンブルの値が存在する場合、この同じノンブルの値の範囲を同じページとして組み合わせを確定させる。確定させた組み合わせは、結果記憶手段66に記憶される。組み合わせが確定したページは、次の段落比較に移行する。
【0105】
変更箇所検出手段58は、変更前に存在し、変更後に存在しないノンブルの値を検出した場合、該当するページが変更後に削除されたものである旨を結果記憶手段66に記憶する。このようなページは次の段落比較は実行しない。ファイル「aaa」の例では、ノンブルの値が3のページが削除された例として記載されている。
また、変更箇所検出手段58は、変更前に存在しておらず、変更後に存在するノンブルの値を検出した場合、該当するページが変更後に追加されたものである旨を結果記憶手段66に記憶する。このようなページについても次の段落比較は実行しない。ここでは、ファイル「aaa」の例では、ノンブルの値が2.2のページが追加された例として記載されている。
【0106】
(段落比較)
続いて、図15に示すページ内の段落比較について説明する。
まず、変更箇所検出手段58は、段落の属性情報を比較し、差異が無ければ下位階層の比較を実行する。変更箇所検出手段58は、下位階層の比較で差異が検出された場合には、該当段落は差異ありと判断する。
変更箇所検出手段58は、段落比較で差異が検出された場合には、それ以降の段落の比較を実行せず、該当ページを差異ありと判断して結果記憶手段66に記憶する。
【0107】
(文字比較)
段落比較で差異が検出されなかった場合には、変更箇所検出手段58は、段落内の文字比較を実行する。
変更箇所検出手段58は、文字比較で差異が検出されなかった場合には、差異なしとの結果を結果記憶手段66に記憶し、差異が検出された場合には、該当ページを差異ありと判断して結果記憶手段66に記憶する。
【0108】
なお、図15の例においては、ファイル名「aaa」のノンブルの値が1のページの1段落目にあたる変更前の「はじめに」と変更後の「はじめに」とを比較している。この1段落目では段落比較および文字比較において差異がないので、変更箇所検出手段58は差異なしと判断して結果記憶手段66に記憶する。
次に、変更箇所検出手段58は2段落目の変更前の「あああああああああああ」と変更後の「あああああ」とを比較する。この場合、文字比較の6文字目で差異が検出されるので、変更箇所検出手段58は、3段落目の比較を実行せずにノンブルの値が1のページは差異ありと判断して、その旨を結果記憶手段66に記憶する。
【0109】
また、ファイル名「ddd」のノンブルの値が1のページの1段落目どうしを比較すると文字比較まで実行しても差異がないことが判断される。このため、変更箇所検出手段58は、1段落目は差異がない旨を結果記憶手段66に記憶する。
2段落目においても差異がないので、変更箇所検出手段58は該当ページの全段落について差異がないことが検出できたので、該当ページは差異がない旨を結果記憶手段66に記憶する。
【0110】
差異表示作成手段60は、上述したページ比較の結果として結果記憶手段66に記憶されているページ比較機能の結果に基づいて、図15に示されているようなページ比較差異表示データ70を作成する。また、図18には、ページ比較差異表示データの別の具体例を示す。
ページ比較差異表示データ70は、ファイル単位で表に作成される。ファイル単位の表には、ノンブルの値ごと(ページごと)に差異の有無、追加されたページ、または削除されたページであるかを表示させる。
また、差異表示作成手段60は、追加されたファイルまたは削除されたファイルについては、ファイル単位の表は作成せずに、ファイル名の後に追加または削除された旨(ここでは、変更後ファイルのみ、または変更前ファイルのみ)の記載をする。
このページ比較差異表示データ70は、差異表示作成手段60によって表示可能なデータに変換されて、差異表示データ記憶手段68に記憶される。表示可能なデータ形式としてはHTML形式等を採用するとよい。
【0111】
(詳細比較)
続いて図16〜図17に基づいて詳細比較機能の例について説明する。
変更箇所検出手段58の詳細比較機能は、操作者がいずれかのページを選択することで選択されたページについての詳細比較機能が実行される。
ここでは、例えばノンブルの値が2のページが選択されたものとする。
【0112】
(段落比較−組み合わせ確定)
変更箇所検出手段58は、段落以下の要素を階層的に比較処理し、その比較結果に基づいて組み合わせを確定する。ここでは、変更率の概念を用いた特別処理を実行し、変更率が予め設定された閾値未満であれば要素の変更と判断し、変更率が予め設定された閾値以上であれば要素の追加または削除であると判断する。
【0113】
また、段落には、文章段落と表段落の2つの段落タイプが存在するため、変更箇所検出手段58は段落タイプを含めた比較を実行する。
さらに、文章段落には、文章と図形の2つの文章タイプが存在するため、変更箇所検出手段58は文章タイプを含めた比較を実行する。
なお、図形の比較においては、変更箇所検出手段58は、図形の種類を判別する図形タイプ、およびその図形データについて比較する。なお、図形の比較においては、変更箇所検出手段58は、変更率を用いた特別処理を実行しないので、1箇所でも異なっていれば差異ありと判断する。図形タイプが画像の場合には、画像ファイル名も比較対象に含める。
【0114】
なお、変更箇所検出手段58は、段落固有の属性情報(段落スタイルやインデント)については、上述した段落タイプ等の比較とは別途実行する。そして、段落固有の属性情報比較結果として差異があれば、差異ありとして結果記憶手段66に記憶する。
【0115】
図16の例では、変更前の段落「ああアアアアアアア」と変更後の段落「アアアアアア」とを比較した変更率が、予め設定した閾値(70%)未満であるので、変更箇所検出手段58は、これらを変更と判断して組み合わせを確定する。
また、変更前の「いいいいいいい」と変更後の「いたたたたたい」とを比較した変更率が、予め設定した閾値以上であるので、変更前の「いいいいいいい」は削除、変更後の「いたたたたたい」は追加と判断する。
【0116】
(表の行比較−組み合わせ確定)
段落タイプが表段落である場合、変更箇所検出手段58は表を行単位に分割し、表内の行以下の要素を階層的に比較処理し、その比較結果に基づいて表の行の組み合わせを確定する。この表の行比較においても変更率を用いた特別処理を実行する。
図16の例では、表の1行目どうしは差異なしとして判断され、次のセル比較に移行する。
表の変更前の2行目と変更後の3行目の比較では、変更率が予め設定された閾値未満であるので、変更箇所検出手段58は、これらを組み合わせ確定する。
また、変更箇所検出手段58は、変更後の2行目は追加された行として判断する。
さらに変更前の3行目と変更後の4行目の比較では、変更率が予め設定された閾値未満であるので、変更箇所検出手段58は、これらを組み合わせ確定する。
【0117】
(セル比較−組み合わせ確定)
行比較において組み合わせが確定された行は、変更箇所検出手段58によってさらにセル単位に分割され、セル以下の要素を階層的に比較処理し、その比較結果に基づいてセルの組み合わせを確定する。
なお、変更箇所検出手段58は、セル固有の属性情報(セル罫線等)については、上述したセル内の比較とは別途実行する。そして、セル固有の属性情報比較結果として差異があれば、差異ありとして結果記憶手段66に記憶する。
【0118】
図16の例では、変更箇所検出手段58は、表の1行目どうしのセルを比較して組み合わせを確定している。
また、変更前の2行目のセルと変更後の3行目のセルでは、変更箇所検出手段58は、変更前の2行目のセルの2番目が削除され、変更後の3行目のセルが1つになったものと判断する。
【0119】
(文字比較−組み合わせ確定)
変更箇所検出手段58は、文章段落における組み合わせが確定したもの、およびセルについて組み合わせが確定したものについて、文字列を文字単位で分割した後、文字を比較処理し、その比較結果に基づいて文字の組み合わせを確定する。
なお、変更箇所検出手段58は、文字固有の属性情報(ルビ文字、テキストスタイル等)については、上述した文字比較とは別途実行する。そして、文字固有の属性情報比較結果として差異があれば、差異ありとして結果記憶手段66に記憶する。
【0120】
図17の例では、変更前の1段落目の「ああアアアアアアア」と変更後の1段落目の「アアアアアアア」とを比較した変更箇所検出手段58は、変更前の1段落目の最初の2文字「ああ」が削除されたと判断する。
また、変更前の4段落目の「ううううううう」と変更後の4段落目の「ううううううう」とを比較した変更箇所検出手段58は、別途実行される属性情報の比較により、アンダーラインを付した箇所が差異として検出する。
【0121】
差異表示作成手段60は、上述した詳細比較の結果として結果記憶手段66に記憶されている詳細比較機能の結果に基づいて、図17に示されているような詳細比較差異表示データを作成する。また、図19には、詳細比較差異表示データの別の具体例を示す。
詳細比較差異表示データ80は、ページ単位で表に作成される。表は、左側に変更前のワープロデータ、右側に変更後のワープロデータを並べた新旧対照方式で表示されるように作成される。また、組み合わせが確定した要素どうしが水平方向に一致するように配置される。
【0122】
また、差異表示作成手段60は、差異が無いページについては、変更前と変更後の双方とも表示しない。さらに、変更前のページが削除された場合は、変更前のページのみを表示させ、または変更後にページが追加された場合は、変更後のページのみを表示させる。
【0123】
また、差異表示作成手段60は、詳細比較差異表示データ80において、差異が生じた箇所を特定できるように作成する。
例えば、差異の無い段落および差異の無い行の色は文字色をグレー色で表示し、差異がある段落および差異がある行の色は文字色を黒色とする。
また例えば、変更、追加または削除した箇所は文字色をオレンジ色とする。なお、表のセルが追加された箇所もオレンジ色にする。さらに、文字の追加や削除によって新旧段落の文字数が異なる箇所は文字列中に「□」を追加するなどして新旧段落の文字ズレが生じないようにする。この「□」のようにシステム上で追加された文字については緑色で表示する。
【0124】
なお、差異表示作成手段60は、段落スタイルまたは表スタイル、長平体、ベースライン調整など表示画面上で表現できない箇所に差異がある場合には、該当箇所の背景色を水色で表示させる。また、この該当箇所が段落の場合には、文字の背景色を水色で表示させ、該当箇所が表の場合には、セルの背景色を水色で表示させ、該当箇所が図形の場合には、図形枠内の背景色を水色で色づけする。
【0125】
この詳細比較差異表示データ80は、差異表示作成手段60によって表示可能なデータに変換されて、差異表示データ記憶手段68に記憶される。表示可能なデータ形式としてはHTML形式等を採用するとよい。
なお、差異が存在した箇所の色を他の箇所の色とは異なる色とする例としては、上述した例に限られることはない。
さらに、詳細比較差異表示データ80としては、新旧対照方式のように変更前のワープロデータFbと変更後のワープロデータFcを並べて配置する表示方式には限定せず、変更前のワープロデータFbと変更後のワープロデータFcにおいて変更箇所の特定ができれば、別のページに表示されるような表示方式を採用してもよい。
【0126】
なお、ページ比較差異表示データ70および詳細比較差異表示データ80が、特許請求の範囲でいう差異表示データに該当する。
【0127】
(書籍作成システム)
図20に示すように、書籍を作成するシステムは、書籍掲載文書の電子的な編集・内容変更システムであるコンピュータBと、コンピュータBに接続された組版装置Aと、組版装置Aにデータ通信可能に接続された印刷装置C(プリンター)とを有している。印刷装置Cは、組版装置Aから出力される組版データを紙に印刷する装置である。
まず、変更後のワープロデータFcは、コンピュータBから組版装置Aに対して通信手段40を介して送信される。
【0128】
ワープロデータFcを受信した組版装置Aは、データ変換手段26がワープロデータFcをマークアップ言語等の組版装置A用のデータ形式に変換する。組版装置Aは、ワープロデータFcを変換したデータを印刷装置Cに送信することによって、書籍の改訂版を手間をかけずに作成することができる。
このとき、ページ比較データ70および詳細比較差異表示データ80によって検出された箇所について修正、組替えを行えばよい。このため、従来であれば全ページに対して行っていた組版を、検出された箇所のみで行えばよいので、組版の手間を改善できる。
また、改訂箇所の確認は、ページ比較データ70および詳細比較差異表示データ80によって検出された箇所について行えばよい。このため、従来であれば全ページに対して行っていた校正を、検出された箇所のみで行えばよいので校正の手間を改善できる。
【0129】
新旧対照形式の書籍の作成は、以下のように行われる。
差異表示データ記憶手段68に記憶されている、変更箇所の属性が他の部位の属性とは異なっている詳細比較差異表示データ80の新旧対照形式のデータを、組版装置Aに対して送信する。送信は図4に示した通信手段40を介して実行する。
なお、上述したように、詳細比較差異表示データ80をHTML言語で作成しておけば、組版装置Aのデータ変換手段26によって組版装置Aが取り込み可能なマークアップ言語等のデータ形式に変換することは容易である。
そして、組版装置Aから、マークアップ言語にデータ変換した詳細比較差異表示データ80の新旧対照形式のデータを印刷装置Cに送信することにより、新旧対照形式の書籍を容易に作成することができる。
【0130】
また、改訂された部分を、色を変えるなどして明示した書籍の作成は以下のように行われる。
新旧対照形式の書籍と同様に、変更箇所の属性が他の部位の属性とは異なっている詳細比較差異表示データ80の新旧対照形式のデータを、組版装置Aに対して送信する。
ここで、新旧対照形式の新側、つまり改訂後の内容だけを対象として、組版装置Aのデータ変換手段26によって組版装置Aが取り込み可能なマークアップ言語等のデータ形式に変換を行う。
そして、組版装置Aから、印刷装置Cに送信することにより、改訂された部分を明示した書籍を容易に作成することができる。
【0131】
(WEBコンテンツ等への利用)
差異表示データ記憶手段68に記憶されている、変更箇所および変更箇所の属性を含んだ詳細比較差異表示データ80をHTML言語で作成しておけば、そのままWEBサイト上のコンテンツとして公開することができる。
【0132】
(その他の実施形態)
上述してきた実施形態では、印刷物が加除式の場合であるか否かについては言及しなかった。すなわち、印刷物が加除式か否かによって本発明の印刷物データ内容変更システムの動作が変わるものではないので、特に加除式について言及する必要がないと考えたためである。
【0133】
なお、本発明の印刷物データ内容変更システムは、書籍の作成中の段階、改訂時、重版時のいずれの場合においても、内容の変更、校正が容易に行える。
【0134】
なお、上述したページ位置情報と、差異表示データを作成する差異表示作成手段は、書籍内容の改訂の際に用いることには限定されない。すなわち、通常のワープロソフトで作成された文書や法令の条文等をデータで保存しておき、改訂があったときに保存されたデータに対して用いることもできる。
【0135】
例えば、法令の条文をワープロデータで管理する場合は、条文の先頭位置や、別表の開始位置にページ位置情報を埋め込む。その際、ページ位置情報のノンブルに該当する部分には、条文名や別表の見出し等を表示するとよい。
任意の時点での法令の条文を変更前ワープロデータとして作成し、それに対して改正を加えた結果を、変更後ワープロデータとし、本発明の差異表示データを作成する差異表示作成手段を用いることで、改正の内容が新旧形式で表示可能となる。
このような構成によって、法令の条文を対象とした編集の電子化の一形態を実現することができ、且つ改正内容の編集、確認を容易とするという効果を得ることができる。
【符号の説明】
【0136】
22 制御部
24 記憶手段
25 組版手段
26 データ変換手段
28 組版データ記憶手段
30 書籍掲載文書の電子的な編集・内容変更システム
32 制御部
34 入力手段
36 モニタ
40 通信手段
42 記憶手段(ハードディスク)
44 データ変換手段
46 データベース
47 検索手段
50 入力手段
52 ページ位置検出手段
55 変更前ワープロデータ記憶手段
56 ページ位置表示手段
57 ページ位置情報
58 変更箇所検出手段
59 変更後ワープロデータ記憶手段
60 差異表示作成手段
66 結果記憶手段
68 差異表示データ記憶手段
70 ページ比較差異表示データ
80 詳細比較差異表示データ
A 組版装置
B コンピュータ
C 印刷装置
Ca 印刷対象データ
Fa 組版データ
Fb 変更前ワープロデータ
Fc 変更後ワープロデータ
N ネットワーク
P 最大共通中心列パス
p0 組版プログラム
p1、p11 データ変換プログラム

【特許請求の範囲】
【請求項1】
モニタと、
組版装置とデータ通信可能に接続された通信手段と、
組版装置において生成される組版データを、ワープロソフトで読み書き可能なワープロデータにデータ形式を変換するデータ変換手段と、
組版文書におけるページの区切り位置を検出するページ位置検出手段と、
前記データ変換手段によって、組版データから変換されたワープロデータの、前記ページ位置検出手段によって検出された組版データのページの区切り位置に該当する位置に、組版データにおけるページの区切りであることを示すページ位置情報を、前記モニタによって表示可能となるように付加するページ位置表示手段と、
ページ位置情報が付加されたワープロデータを、変更前ワープロデータとして記憶する変更前ワープロデータ記憶手段と、
ワープロデータの内容を変更した場合に、変更されたワープロデータを変更後ワープロデータとして記憶する変更後ワープロデータ記憶手段と、
前記変更前ワープロデータと、前記変更後ワープロデータとを比較することによって変更箇所を検出する変更箇所検出手段と、
該変更箇所検出手段によって検出された変更箇所を記憶する結果記憶手段とを具備することを特徴とする書籍掲載文書の電子的な編集・内容変更システム。
【請求項2】
前記データ変換手段は、
前記組版装置の組版データを、修正または執筆を実行する文書単位でワープロデータに変換することを特徴とする請求項1記載の書籍掲載文書の電子的な編集・内容変更システム。
【請求項3】
結果記憶手段に記憶されている変更箇所に基づいて、変更箇所をまとめた差異表示データを作成する差異表示作成手段を具備することを特徴とする請求項1または請求項2記載の書籍掲載文書の電子的な編集・内容変更システム。
【請求項4】
前記差異表示データは、
変更箇所が存する組版データ上でのページ単位および段落単位で変更箇所をまとめたものであることを特徴とする請求項3記載の書籍掲載文書の電子的な編集・内容変更システム。
【請求項5】
前記変更箇所検出手段は、
ワープロデータ内の表が変更されているか否かを検出可能に設けられていることを特徴とする請求項1〜請求項4のうちのいずれか1項記載の書籍掲載文書の電子的な編集・内容変更システム。
【請求項6】
前記差異表示作成手段は、
前記結果記憶手段に記憶されている変更箇所に基づいて、変更後ワープロデータに対して、変更された箇所の属性を、変更されていない箇所の属性とは異なるように変換して前記差異表示データを作成することを特徴とする請求項3〜請求項5のうちのいずれか1項記載の書籍掲載文書の電子的な編集・内容変更システム。
【請求項7】
前記差異表示作成手段は、
前記結果記憶手段に記憶されている変更箇所に基づいて、変更前ワープロデータおよび変更後ワープロデータに対して、変更された箇所の属性を、変更されていない箇所の属性とは異なるように変換し、両者を左右に並べて新旧対照が可能な前記差異表示データを作成することを特徴とする請求項3〜請求項5のうちのいずれか1項記載の書籍掲載文書の電子的な編集・内容変更システム。
【請求項8】
前記差異表示作成手段は、
ワープロデータ内に表がある場合、表を構成する行を分離した状態の差異表示データを作成することを特徴とする請求項3〜請求項7のうちのいずれか1項記載の書籍掲載文書の電子的な編集・内容変更システム。
【請求項9】
モニタと、組版装置とデータ通信可能に接続された通信手段とを有するコンピュータに読み取り可能に設けられ、
組版装置において生成される組版データを、ワープロソフトで読み書き可能なワープロデータにデータ形式を変換するデータ変換機能と、
組版データにおけるページの区切り位置を検出するページ位置検出機能と、
前記データ変換機能によって、組版データから変換されたワープロデータの、前記ページ位置検出機能によって検出された組版データのページの区切り位置に該当する位置に、組版データにおけるページの区切りであることを示すページ位置情報を、前記モニタによって表示可能となるように付加するページ位置表示機能と、
ページ位置情報が付加されたワープロデータを、変更前ワープロデータとして変更前ワープロデータ記憶手段に記憶させる変更前ワープロデータ記憶機能と、
ワープロデータの内容を変更した場合に、変更されたワープロデータを変更後ワープロデータとして変更後ワープロデータ記憶手段に記憶させる変更後ワープロデータ記憶機能と、
前記変更前ワープロデータと、前記変更後ワープロデータとを比較することによって変更箇所を検出する変更箇所検出機能と、
該変更箇所検出手段によって検出された変更箇所を結果記憶手段に記憶させる結果記憶機能とをコンピュータに実現させることを特徴とする書籍掲載文書の電子的な編集・内容変更プログラム。
【請求項10】
前記データ変換機能は、
前記組版装置の組版データを、修正または執筆を実行する文書単位でワープロデータに変換することを特徴とする請求項9記載の書籍掲載文書の電子的な編集・内容変更プログラム。
【請求項11】
結果記憶手段に記憶されている変更箇所に基づいて、変更箇所をまとめた差異表示データを作成する差異表示作成機能を実現させることを特徴とする請求項9または請求項10記載の書籍掲載文書の電子的な編集・内容変更プログラム。
【請求項12】
前記差異表示データは、
変更箇所が存する組版データ上でのページ単位および段落単位で変更箇所をまとめたものであることを特徴とする請求項11記載の書籍掲載文書の電子的な編集・内容変更プログラム。
【請求項13】
前記変更箇所検出機能は、
ワープロデータ内の表が変更されているか否かを検出可能に設けられていることを特徴とする請求項9〜請求項12のうちのいずれか1項記載の書籍掲載文書の電子的な編集・内容変更プログラム。
【請求項14】
前記差異表示作成機能は、
前記結果記憶手段に記憶されている変更箇所に基づいて、変更後ワープロデータに対して、変更された箇所の属性を、変更されていない箇所の属性とは異なるように変換して前記差異表示データを作成することを特徴とする請求項11〜請求項13のうちのいずれか1項記載の書籍掲載文書の電子的な編集・内容変更プログラム。
【請求項15】
前記差異表示作成機能は、
前記結果記憶手段に記憶されている変更箇所に基づいて、変更前ワープロデータおよび変更後ワープロデータに対して、変更された箇所の属性を、変更されていない箇所の属性とは異なるように変換し、両者を左右に並べて新旧対照が可能な前記差異表示データを作成することを特徴とする請求項11〜請求項13のうちのいずれか1項記載の書籍掲載文書の電子的な編集・内容変更プログラム。
【請求項16】
前記差異表示作成機能は、
ワープロデータ内に表がある場合、表を構成する行を分離した状態の差異表示データを作成することを特徴とする請求項11〜請求項15のうちのいずれか1項記載の書籍掲載文書の電子的な編集・内容変更プログラム。
【請求項17】
請求項6記載の書籍掲載文書の電子的な編集・内容変更システムと、
該書籍掲載図書の電子的な編集・内容変更システムによって作成された差異表示データを受信し、該差異表示データのデータ形式を組版データに変換するデータ変換手段を有する組版装置と、
該組版装置によって変換された組版データを印刷する印刷装置とを備え、
変更された箇所の属性が、変更されていない箇所の属性と異なるように表示された書籍を作成することを特徴とする書籍作成システム。
【請求項18】
請求項7記載の書籍掲載文書の電子的な編集・内容変更システムと、
該書籍掲載図書の電子的な編集・内容変更システムによって作成された差異表示データを受信し、該差異表示データのデータ形式を組版データに変換するデータ変換手段を有する組版装置と、
該組版装置によって変換された組版データを印刷する印刷装置とを備え、
変更された箇所の属性が、変更されていない箇所の属性と異なるように表示され、且つ一のページに変更前の文書と変更後の文書の双方が表示された書籍を作成することを特徴とする書籍作成システム。

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図20】
image rotate

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate