説明

文書処理システム

【課題】 複数の文書を統合してできる最終原稿に、統一されたページ番号やヘッダ、フッタ等を付加する際、既に原稿に付与されているページ番号やヘッダ、フッタを容易にかつ確実に削除する手段が求められている。
【解決手段】文書処理装置において、削除したいオブジェクトを含む矩形領域およびオブジェクトを指定する手段と、指定された矩形領域内のオブジェクト情報を抽出する手段と、他ページに対し、同じ矩形領域内に同じオブジェクト情報があるかを検索する手段と、検索結果を表示し、処理を選択実行させる手段を提供する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、複数ファイルを取り込み、統合ファイルを生成する文書処理システムに関するものである。
【背景技術】
【0002】
文書や表あるいは図形やイメージといった描画オブジェクトは、それぞれの専用アプリケーションを用いて作成や編集を行う方が、自由度が高く作業効率も高い。
【0003】
そのため、ファイルフォーマットの異なる複数のアプリケーションで作成し、それぞれできあがったドキュメントを統合し、最終原稿を作成するというアプリケーションがある。
【0004】
また、同一フォーマットではあるが、作成者ごとや章別ファイルとして作成されているものを最終的に統合して最終原稿を作成することが可能なアプリケーションもある。
【0005】
最終原稿を作成する時のドキュメントフォーマットとしては、PDF(Adobeによって公開されている電子文書フォーマット:Portable Document Format)が広く用いられている。
【0006】
PDFは仕様が公開されているため、複数のアプリケーションで作成されたアプリケーション特有のフォーマットからPDFに変換し、PDF形式で複数のドキュメントを結合し、統一的に扱うことが可能なためである。
【0007】
図14は、章ごとに作成された2つの原稿を統合したアプリケーションの例で、このようなアプリケーションでは、統合してできあがったドキュメントに対し、さらにページの組替えや情報の付加等を行ない、最終原稿を作成している。
【0008】
また、複数のドキュメントを統合するということで、最終的なページ番号付けやヘッダ、フッタの設定も重要な機能となっており、このアプリケーション自体で統一的なページ番号やヘッダ、フッタを作成する手段が提供されている。(例えば、特許文献1参照)
【先行技術文献】
【特許文献】
【0009】
【特許文献1】特開2004−348428号公報
【発明の概要】
【発明が解決しようとする課題】
【0010】
しかし、特許文献1の従来技術では、フッタやヘッダを挿入したい位置にすでに画像が存在するかを調べ、すでに存在するページについてのみ存在する画像を空白で削除するというものである。
【0011】
そのため、すでに存在するヘッダやフッタを削除するための目的に用意されたものではないため、例えば図15に示すように、元から存在するヘッダやフッタと、新規に付加するヘッダやフッタが、異なる位置に複数存在してしまうという問題がある。
【0012】

そのため、統合してできる最終原稿に一連のページ番号を振るという機能には、入力原稿に既に付与されているヘッダやフッタ、ページ番号等を自動的に削除する手段も提供されることが課題として課されている。
【0013】
従来のアプリケーションでは、この課題を解決するために、ページ内の矩形領域を指定し、その矩形領域内に全体が含まれるオブジェクトを自動的に削除する手段を提供していた。
【0014】
しかし、複数ドキュメントからなる統合ドキュメントでは、必ずしもヘッダやフッタ、ページ番号位置が一定ではないため、削除したいもの以外の情報が削除されてしまうという問題がある。
【0015】
入力原稿に既に含まれているヘッダやフッタ、ページ番号等のオブジェクトを適切に検出して自動削除する、ドキュメント統合機能を備えた文書処理装置を提供することが課題である。
【課題を解決するための手段】
【0016】
複数の入力ドキュメントを結合し、1つの出力ドキュメントを生成し、ヘッダやフッタやページ番号等の情報を付加する文書処理システムにおいて、選択したページ内の矩形領域を指定する矩形領域指定手段と、前記矩形領域内に包含される第一のオブジェクトを抽出する第一のオブジェクト抽出手段と、前記第一のオブジェクト抽出手段で抽出した第一のオブジェクトを削除する第一のオブジェクト削除手段と、前記第一のオブジェクト削除手段で削除したオブジェクト属性を記憶するオブジェクト記憶手段と、前記選択したページ以外のページに対し、前記矩形領域指定手段で指定したのと同じ矩形領域内に包含される第二のオブジェクトを抽出する第二のオブジェクト抽出手段と、前記オブジェクト記憶手段で記憶したオブジェクト属性と前記第二のオブジェクト抽出手段結果のオブジェクト属性を比較するオブジェクト比較手段と、前記オブジェクト比較手段で一致した時のみ前記第二のオブジェクト抽出手段で抽出した第二のオブジェクトを削除する第二のオブジェクト削除手段を有することを特徴とする。
【発明の効果】
【0017】
元原稿で割り付けたページ番号あるいはヘッダ、フッタ情報が、ページ毎に異なる位置に描画されている場合においても、簡単な操作で容易かつ確実に一括削除することが可能となる。
【図面の簡単な説明】
【0018】
【図1】本実施形態のスタンドアロン型の文書処理システムのソフトウェア構成例を示すブロック図である。
【図2】本実施形態の文書処理システムを実現するハードウェア構成例を示すブロック図である。
【図3】ブックファイルの構造の一例を示す図である。
【図4】ブック属性の一覧を示す図である。
【図5】章属性の一覧を示す図である。
【図6】ページ属性の一覧を示す図である。
【図7】ブックファイルを開く手順例を示すフローチャートである。
【図8】電子原稿ファイルをブックファイルにインポートする手順例を示すフローチャートである。
【図9】図8のステップ801に示すアプリケーションデータを電子原稿ファイルに変換する手順例を示すフローチャートである。
【図10】製本アプリケーションのUI画面である。
【図11】新規にブックファイルが作成された際のUI画面である。
【図12】クライアントサーバ型の文書処理システムのソフトウェア構成例を示すブロック図である。
【図13】ステイプル制御システムの構成を示すブロック図である。
【図14】従来例の2つの原稿を統合したアプリケーションを示す図
【図15】従来例のアプリケーションの課題を示す図
【図16】本実施例の文書処理システムのオブジェクト削除処理フロー図
【図17】本実施例の領域選択を示す図
【図18】本実施例の抽出オブジェクト指定を示す図
【図19】本実施例の文書処理システムのオブジェクト抽出処理フロー図
【図20】本実施例のオブジェクト削除時の確認メッセージを示す図
【発明を実施するための形態】
【0019】
以下、本発明を実施するための最良の形態について図面を用いて説明する。
【実施例】
【0020】
<システム概要>
まず、本発明に係る文書処理システムの概要について、図1乃至図12を参照して以下に説明する。尚、この文書処理システムは、一般のアプリケーションによって作成されたデータファイルを電子原稿ファイルに変換する電子原稿ライタと、その電子原稿ファイルを編集する機能を提供する製本アプリケーションとを含む。そして作成されたデータを一まとめにした文書の作成及び編集を可能とし、その操作性を向上させて文書編集を効率的に行えるものである。
【0021】
<システム構成及び動作>
図1は、本実施形態の文書処理システムのソフトウェア構成を示す図である。文書処理システムは、本発明の情報処理装置に好適な実施形態であるデジタルコンピュータ101(以下、ホストコンピュータとも呼ぶ)によって実現されている。図1に示す一般アプリケーション101は、ワードプロセシングやスプレッドシート、フォトレタッチ、ドロー、あるいはペイント、プレゼンテーション、テキスト編集などの機能を提供するアプリケーションプログラムであり、OSに対する印刷機能を有している。これらのアプリケーションは、作成された文書データや画像データなどのアプリケーションデータを印刷する際に、オペレーティングシステム(OS)によって提供される所定のインタフェース(一般に、GDIと呼ばれる)を利用する。即ち、アプリケーション101は、作成したデータを印刷するために、上述のインタフェースを提供するOSの出力モジュールに対して、あらかじめ定められる、OSに依存する形式の出力コマンド(GDI関数と呼ばれる)を送信する。一方、出力コマンドを受けた出力モジュールは、その出力コマンドをプリンタ等の出力デバイスが処理可能な形式に変換して、変換されたコマンド(DDI関数と呼ばれる)を出力する。出力デバイスが処理可能な形式はデバイスの種類やメーカ、機種などによって異なるため、デバイスごとにデバイスドライバが提供されている。OSではそのデバイスドライバを利用してコマンドの変換を行い、印刷データを生成し、JL(Job Language)でくくることにより印刷ジョブが生成される。OSとしてマイクロソフト社のウインドウズを利用する場合には、前述した出力モジュールとしてはGDI(Graphic Device Interface)と呼ばれるモジュールが相当する。
【0022】
電子原稿ライタ102は、上述のデバイスドライバを改良したものであり、本文書処理システム実現のために提供されるソフトウェアモジュールである。但し、電子原稿ライタ102は特定の出力デバイスを目的としておらず、詳細は後述する製本アプリケーション104やプリンタドライバ106により処理可能な形式に出力コマンドを変換する。この電子原稿ライタ102による変換後の形式(以後電子原稿形式と呼ぶ)は、ページ単位の原稿を詳細な書式をもって表現可能であれば特に問わない。実質的な標準形式のうち、例えばアドビシステムズによるPDF形式やSVG形式などが電子原稿形式として採用できる。
【0023】
一般アプリケーション101から電子原稿ライタ102を利用させる場合には、出力に使用するデバイスドライバとして電子原稿ライタ102を指定してから印刷を実行させる。但し、電子原稿ライタ102によって作成されたままの電子原稿ファイルは、電子原稿ファイルとして十分な形式を備えていない。そのため、デバイスドライバとして電子原稿ライタ102を指定するのは製本アプリケーション104であり、その管理下でアプリケーションデータの電子原稿ファイルへの変換が実行される。そして、製本アプリケーション104は電子原稿ライタ102が生成した新規の不十分な電子原稿ファイルを後述する形式を備えた電子原稿ファイルとして完成させる。以下、この点を明瞭に識別する必要がある場合、電子原稿ライタ102によって作成されたファイルを「電子原稿ファイル」と呼び、製本アプリケーション104によって構造を与えられた電子原稿ファイルを「ブックファイル」と呼ぶ。また、特に区別する必要がない場合は、アプリケーションにより生成されるドキュメントファイル、電子原稿ファイル、及びブックファイルをいずれも文書ファイル(または文書データ)と呼ぶ。
【0024】
デバイスドライバとして電子原稿ライタ102を指定し、一般アプリケーション101によりデータを印刷させることで、アプリケーションデータを電子原稿形式に変換する。アプリケーションデータはアプリケーション101によって定義されたページ(以後論理ページあるいは原稿ページと呼ぶ)を単位とする電子原稿形式に変換される。そして、電子原稿ファイル103としてハードディスクなどの記憶媒体に格納される。尚、ハードディスクは、本実施形態の文書処理システムを実現するコンピュータが備えているローカルドライブであっても良く、ネットワークに接続されている場合にはネットワーク上に提供されるドライブであっても良い。
【0025】
製本アプリケーション104は電子原稿ファイル(あるいはブックファイル)103を読み込み、それを編集するための機能を利用者に提供する。但し、製本アプリケーション104は、各ページの内容を編集する機能は提供しておらず、ページを最小単位として構成される、後述する章やブックの構造を編集するための機能を提供している。
【0026】
製本アプリケーション104によって編集されたブックファイル103を印刷する際には、製本アプリケーション104によって電子原稿デスプーラ105が起動される。電子原稿デスプーラ105は、製本アプリケーションと共にコンピュータ内にインストールされるプログラムモジュールである。製本アプリケーションで利用するドキュメント(ブックファイル)を印刷する際に、プリンタドライバへ描画データを出力するために使用されるモジュールである。電子原稿デスプーラ105は、指定されたブックファイルをハードディスクから読み出し、ブックファイルに記述された形式で各ページを印刷するために、前述したOSの出力モジュールに適合する出力コマンドを生成し、不図示の出力モジュールに出力する。その際に、出力デバイスとして使用されるプリンタ107用のプリンタドライバ106がデバイスドライバとして指定される。上述の出力モジュールは、受信した出力コマンドをデバイスコマンドに変換して指定されたプリンタ107用のプリンタドライバ106に出力し、そのプリンタドライバ106がプリンタ107で解釈実行可能なページ記述言語等のコマンドに変換する。そして、変換されたコマンドはプリンタドライバ106から不図示のシステムスプーラを介してプリンタ107に送信され、プリンタ107によってコマンドに応じた画像が印刷される。
【0027】
図2は、コンピュータ100のハードウェアブロック図である。図2において、CPU201は、ROM203のプログラム用ROMに記憶された、あるいはハードディスク211からRAM202にロードされたOSや一般アプリケーション、製本アプリケーションなどのプログラムを実行する。そして、図1のソフトウェア構成や、後述するフローチャートの手順を実現する。RAM202は、CPU201の主メモリ、ワークエリア等として機能する。キーボードコントローラ(KBC)205は、キーボード209や不図示のポインティングデバイスからのキー入力を制御する。CRTコントローラ(CRTC)206は、CRTディスプレイ210の表示を制御する。ディスクコントローラ(DKC)207は、ブートプログラム、種々のアプリケーション、フォントデータ、ユーザファイル、後述する編集ファイル等を記憶するハードディスク(HD)211やフロッピー(登録商標)ディスク(FD)等とのアクセスを制御する。PRTC208は、接続されたプリンタ107との間の信号の交換を制御する。NC212はネットワークに接続されて、ネットワークに接続された他の機器との通信制御処理を実行する。
【0028】
<電子原稿データの形式>
編集アプリケーション104の詳細を言及する前に、ブックファイルのデータ形式について説明する。ブックファイルは紙媒体の書物を似せた3層の層構造を有する。まず、上位層は「ブック」と呼ばれ、1冊の本を似せており、その本全般に係る属性が定義されている。その下の中間層は、本でいう章に相当し、やはり「章」と呼ばれる。各章についても、章毎の属性が定義できる。そして、下位層は「ページ」であり、アプリケーションプログラムで定義された各ページに相当する。尚、各ページについてもページ毎の属性が定義できる。更に、一つのブックは複数の章を含んでいてよく、また一つの章は複数のページを含むこともできる。
【0029】
図3に示す(A)は、ブックファイルの形式の一例を模式的に示す図である。図示するように、この例では、ブックファイルにおけるブック,章,ページは、それぞれに相当するノードにより示されている。一つのブックファイルは一つのブックを含む。ブック,章は、ブックとしての構造を定義するための概念であるから、定義された属性値と下位層へのリンクとをその実体として含む。ページは、アプリケーションプログラムによって出力されたページ毎のデータを実体として有する。そのため、ページは、その属性値のほかに、原稿ページの実体(原稿ページデータ)と各原稿ページデータへのリンクを含む。
【0030】
尚、紙媒体等に出力する際の印刷ページは複数の原稿ページを含む場合がある。この構造に関してはリンクによって表示されず、ブック、章、ページ各階層における属性として表示される。
【0031】
図3において、ブック301には、ブック属性が定義されていると共に、2つの章302A,302Bがリンクされている。このリンクにより、章302A,302Bがブック301に包含されていることが表示される。章302Aには、ページ303A,303Bがリンクされ、これらページが含まれることが示されている。各ページ303A,303Bにはそれぞれ属性値が定義され、その実体である原稿ページデータ(1)、(2)へのリンクが含まれる。これらリンクは、図3に示す(B)のように原稿ページデータ304のデータ(1),(2)を指し示し、ページ303A、303Bの実体が原稿ページデータ(1)、(2)であることを表示している。
【0032】
図4は、ブック属性のリストである。下位層と重複して定義可能な項目に関しては、下位層の属性値が優先採用される。そのため、ブック属性にのみ含まれる項目に関しては、ブック属性に定義された値はブック全体を通して有効な値となる。しかし、下位層と重複する項目については、下位層において定義されていない場合における既定値としての意味を有する。尚、図示された各項目は具体的に1項目に対応するのではなく、関連する複数の項目を含むものもある。
【0033】
図5は章属性の、図6はページ属性のリストである。章属性とページ属性との関係もブック属性と下位層の属性との関係と同様である。
【0034】
図4〜図6から明らかなように、ブック属性に固有の項目は、印刷方法、製本詳細、表紙/裏表紙、インデックス紙(タブシート)、合紙、章区切りの6項目である。これらはブックを通して定義される項目である。印刷方法の属性としては、片面印刷、両面印刷、製本印刷の3つの値を指定できる。ここで、製本印刷とは、別途指定する枚数の用紙を束にして2つ折りにし、その束をつづり合わせることで製本が可能となる形式で印刷する方法である。製本詳細属性としては、製本印刷が指定されている場合に、見開き方向や、束になる枚数等が指定できる。
【0035】
表紙/裏表紙属性は、ブックとしてまとめられる電子原稿ファイルを印刷する際に、表紙及び裏表紙となる用紙を付加することの指定、及び付加した用紙への印刷内容の指定を含む。インデックス紙属性は、章の区切りとして、印刷装置に別途用意される耳付きのインデックス紙の挿入の指定及びインデックス(タブ)部分への印刷内容の指定を含む。しかし、後述するタブ用原稿データを印字するインデックスシートの場合、インデックス部分への印刷内容は反映されない。この属性は、印刷用紙とは別に用意された用紙を所望の位置に挿入するインサート機能を持ったインサータが使用する印刷装置に備えられている場合か、あるいは、複数の給紙カセットを使用可能である場合に有効となる。これは合紙属性についても同様である。
【0036】
合紙属性は、章の区切りとして、インサータから、あるいは給紙カセットから供給される用紙の挿入の指定、及び合紙を挿入する場合には、給紙元の指定などを含む。
【0037】
章区切り属性は、章の区切り目において、新たな用紙を使用するか、新たな印刷ページを使用するか、特に何もしないか等の指定を含む。片面印刷時には、新たな用紙の使用と新たな印刷ページの使用とは同じ意味を持つ。両面印刷時には、「新たな用紙の使用」を指定すれば連続する章が1枚の用紙に印刷されることは無いが、「新たな印刷ページの使用」を指定すれば、連続する章が1枚の用紙の表裏に印刷されることがあり得る。
【0038】
章属性に関しては、章に固有の項目はなく、全てブック属性と重複する。従って、章属性における定義とブック属性における定義とが異なれば、章属性で定義された値が優先する。ブック属性と章属性とにのみ共通する項目は、用紙サイズ、用紙方向、N−up印刷指定、拡大縮小、排紙方法の5項目である。これらのうち、N−up印刷指定属性は1印刷ページに含まれる原稿ページ数を指定するための項目である。指定可能な配置としては、1×1、1×2、2×2、3×3、4×4などがある。排紙方法属性は、排出した用紙にステイプル処理を施すか否かを指定するための項目であり、この属性の有効性は使用する印刷装置がステイプル機能を有するか否かに依存する。
【0039】
ページ属性に固有の項目には、タブ用原稿属性、ページ回転属性、ズーム、配置指定、アノテーション、ページ分割などがある。タブ用原稿属性は、リンクする原稿ページがタブ用原稿データか否かを指定するための項目である。ページ回転属性は、原稿ページを印刷ページに配置する際の回転角度を指定するための項目である。ズーム属性は、原稿ページの変倍率を指定するための項目である。変倍率は、仮想論理ページ領域のサイズを100%として指定される。仮想論理ページ領域とは、原稿ページを、Nup等の指定に応じて配置した場合に、1原稿ページが占める領域である。例えば、1×1であれば、仮想論理ページ領域は1印刷ページに相当する領域となり、1×2であれば、1印刷ページの各辺を約70パーセントに縮小した領域となる。
【0040】
ブック、章、ページについて共通な属性としては、ウォーターマーク属性及びヘッダ・フッタ属性がある。ここで、ウォーターマークとは、アプリケーションで作成されたデータに重ねて印刷される、別途指定される画像や文字列などである。ヘッダ・フッタは、それぞれ各ページの上余白及び下余白に印刷されるウォーターマークである。但し、ヘッダ・フッタには、ページ番号や日時など変数により指定可能な項目が用意されている。尚、ウォーターマーク属性およびヘッダ・フッタ属性において指定可能な内容は、章とページとは共通であるが、ブックはそれらと異なっている。ブックにおいてはウォーターマークやヘッダ・フッタの内容を設定できるし、また、ブック全体を通してどのようにウォーターマークやヘッダ・フッタを印刷するかを指定することができる。一方、章やページでは、その章やページにおいて、ブックで設定されたウォーターマークやヘッダ・フッタを印刷するか否かを指定できる。
【0041】
<ブックファイルの生成手順>
ブックファイルは上述したような構造及び内容を有している。次に、製本アプリケーション104及び電子原稿ライタ102によるブックファイルの作成手順について説明する。ブックファイルの作成手順は、製本アプリケーション104によるブックファイルの編集操作の一環として実現される。
【0042】
図7は、製本アプリケーション104によりブックファイルを開く際の手順である。まず、開こうとするブックファイルが、新規作成すべきものであるか、それとも既存のものであるか判定する(ステップS701)。新規作成の場合には、章を含まないブックファイルを新規に作成する(ステップS702)。新規に作成されるブックファイルは、図3の例で示せば、ブックノード301のみ有し、章のノードに対するリンクが存在しないブックのノードとなる。ブック属性は、新規作成用としてあらかじめ用意された属性のセットが適用される。そして、新規ブックファイルを編集するためのユーザインタフェース(UI)画面を表示する(ステップS703)。図11は、新規にブックファイルが作成された際のUI画面の一例である。この場合は、ブックファイルは実質的な内容を持たないため、UI画面1100には何も表示されない。
【0043】
一方、既存のブックファイルがあれば、指定されたブックファイルを開き(ステップS703)、そのブックファイルの構造、属性、内容に従ってユーザインタフェース(UI)画面を表示する。図10は、既存のブックファイルから指定されたブックファイルを表示するUI画面の一例である。UI画面1100は、ブックの構造を示すツリー部1101と、印刷された状態を表示するプレビュー部1102とを含む。ツリー部1101には、ブックに含まれる章、各章に含まれるページが図3に示す(A)のような木構造で表示される。ツリー部1101に表示されるページは原稿ページである。またプレビュー部1102には、印刷ページの内容が縮小されて表示される。その表示順序はブックの構造を反映したものとなっている。
【0044】
さて、開かれたブックファイルには、電子原稿ライタ102によって電子原稿ファイルに変換されたアプリケーションデータを、新たな章として追加することができる。この機能を電子原稿インポート機能と呼ぶ。図7に示す手順によって新規に作成されたブックファイルに電子原稿インポートすることで、そのブックファイルには実体が与えられる。この機能は、図10の画面にアプリケーションデータをドラッグアンドドロップ操作することで起動される。
【0045】
図8に電子原稿インポートの手順を示す。まず、指定されたアプリケーションデータを生成したアプリケーションプログラムを起動し、デバイスドライバとして電子原稿ライタ102を指定してアプリケーションデータを印刷出力させることで、電子原稿データに変換する(ステップS801)。変換を終えたなら、変換されたデータが画像データであるか否かを判定する(ステップS802)。この判定は、ウインドウズOSの下であれば、アプリケーションデータのファイル拡張子に基づいて行われる。例えば、拡張子が「bmp」であればウインドウズビットマップデータであり、「jpg」であればjpeg圧縮された画像データ、「tiff」であればtiff形式の画像データであると判定できる。また、このような画像データの場合はS8010のようにアプリケーションを起動せずに、画像データから直接電子原稿ファイルを生成することが可能であるため、S8010の処理を省略することも可能である。
【0046】
ここで、画像データでなかった場合には、ステップS801で生成された電子原稿ファイルを、現在開かれているブックファイルのブックに、新たな章として追加する(ステップS803)。章属性としては、ブック属性と共通するものについてはブック属性の値がコピーされ、そうでないものについては、予め用意された規定値に設定される。
【0047】
また、ステップS802で画像データである場合には、原則として新たな章は追加されず、指定されている章に、ステップS801で生成された電子原稿ファイルに含まれる各原稿ページが追加される(ステップS804)。但し、ブックファイルが新規作成されたファイルであれば、新たな章が作成されて、その章に属するページとして電子原稿ファイルの各ページが追加される。ページ属性は、上位層の属性と共通のものについてはその属性値が与えられ、アプリケーションデータにおいて定義された属性を電子原稿ファイルに引き継いでいるものについてはその値が与えられる。例えば、Nup指定などがアプリケーションデータにおいて指定されていた場合には、その属性値が引き継がれる。このようにして、新規なブックファイルが作成され、あるいは、新規な章が追加される。
【0048】
図9は、図8に示すステップS801において、電子原稿ライタ102により電子原稿ファイルを生成させる手順のフローチャートである。まず、新たな電子原稿ファイルを作成してそれを開く(ステップS901)。指定したアプリケーションデータに対応するアプリケーションを起動し、電子原稿ライタをデバイスドライバとしてOSの出力モジュールに対して出力コマンドを送信させる。出力モジュールは、受信した出力コマンドを電子原稿ライタ102によって電子原稿形式のデータに変換し、出力する(ステップS902)。その出力先はステップS901で開いた電子原稿ファイルである。指定されたデータ全てについて変換が終了したか判定し(ステップS903)、終了していれば電子原稿ファイルを閉じる(ステップS904)。電子原稿ライタ102によって生成される電子原稿ファイルは、図3の(B)に示される原稿ページデータの実体を含むファイルである。
【0049】
<ブックファイルの編集>
以上のようにして、アプリケーションデータからブックファイルを作成することができる。生成されたブックファイルについては、章及びページに対して次のような編集操作が可能である。
【0050】
(1)新規追加
(2)削除
(3)コピー
(4)切り取り
(5)貼り付け
(6)移動
(7)章名称変更
(8)ページ番号名称振り直し
(9)表紙挿入
(10)合紙挿入
(11)インデックス紙挿入
(12)各原稿ページに対するページレイアウト。
【0051】
このほか、一旦行った編集操作を取り消す操作や、更に取り消した操作をやり直す操作が可能である。これら編集機能により、例えば複数のブックファイルの統合、ブックファイル内で章やページの再配置、ブックファイル内で章やページの削除、原稿ページのレイアウト変更、合紙やインデックス紙の挿入などの編集操作が可能となる。これらの操作を行うと、図4、図5に示す属性に操作結果が反映されたり、あるいはブックファイルの構造に反映される。例えば、ブランクページの新規追加操作を行えば、指定された箇所にブランクページが挿入される。このブランクページは原稿ページとして扱われる。また、原稿ページに対するレイアウトを変更すれば、その変更内容は、印刷方法やN−up印刷、表紙/裏表紙、インデックス紙、合紙、章区切りといった属性に反映される。
【0052】
<ブックファイルの出力>
以上のように作成・編集されるブックファイルは、印刷出力を最終目的とするものである。ここで、利用者が図10に示した製本アプリケーションのUI画面1100からファイルメニューを選択し、そこから印刷を選択すると、指定した出力デバイスにより印刷出力される。この際、まず製本アプリケーション104は、現在開かれているブックファイルからジョブチケットを作成し、そのジョブチケットを電子原稿デスプーラ105に渡す。一方、電子原稿デスプーラ105は、ジョブチケットをOSの出力コマンド、例えばウインドウズのGDI関数に変換し、それを出力モジュール、例えばGDIに送信する。出力モジュールは、指定されたプリンタドライバ106によってデバイスに適したコマンドを生成し、そのデバイスに送信する。
【0053】
ここで、ジョブチケットは原稿ページを最小単位とする構造を有するデータである。ジョブチケットにおける構造は、用紙上における原稿ページのレイアウトを定義している。ジョブチケットは1ジョブにつき1つ発行される。そのため、まず最上位にドキュメントというノードがあり、文書全体の属性、例えば両面印刷/片面印刷などが定義されている。その下には、用紙ノードが属し、用いるべき用紙の識別子やプリンタにおける給紙口の指定などの属性が含まれる。各用紙ノードには、その用紙で印刷されるシートのノードが属する。1シートは1枚の用紙に相当する。各シートには、印刷ページ(物理ページ)が属する。片面印刷ならば1シートには1物理ページが属し、両面印刷ならば1シートに2物理ページが属する。各物理ページには、その上に配置される原稿ページが属する。また物理ページの属性として、原稿ページのレイアウトが含まれる。
【0054】
電子原稿デスプーラ105は、上述のジョブチケットを、出力モジュールへの出力コマンドに変換する。
【0055】
<そのほかのシステム構成>
本実施形態の文書処理システムの概要は以上のようなものである。これはスタンドアロン型のシステムであるが、これを拡張したサーバクライアントシステムでもほぼ同様の構成・手順でブックファイルを作成・編集できる。但し、ブックファイルや印刷処理はサーバによって管理される。
【0056】
図12は、サーバクライアント型文書処理システムの構成を示すブロック図である。クライアント文書処理システムは、スタンドアロン型システムに、クライアントモジュールであるDOMSドライバ109及びDOMSプリントサービスモジュール110、DS(文書サービス)クライアントモジュール108を加えた構成を有する。DOMSはDocument Output Management Service:文書出力管理サービスを意味する。このクライアント文書処理システム1200に文書管理サーバ1201、印刷集中管理サーバ1202及びプリントサーバ1203が接続されている。これらサーバは、通常ネットワークによってクライアント文書処理システムと接続されるが、サーバが同時にクライアントとしても機能する場合には、ネットワーク間の通信をシミュレートするプロセス間通信によって接続される。
【0057】
尚、図12に示す例では、文書管理サーバ1201と印刷集中管理サーバ1202の両方のサーバがクライアントに接続されているが、何れか一方のみネットワーク上に存在する場合もあり得る。例えば、接続されているサーバが文書管理サーバであれば、そのクライアントモジュール108を含む文書管理サーバクライアントシステム1201SCが、スタンドアロン型文書管理システムに追加される。また印刷集中管理サーバ1202であれば、そのクライアントモジュールを含む印刷管理サーバクライアントシステム1202SCが、スタンドアロン型文書管理システムに追加される。
【0058】
文書管理サーバ1201は、製本アプリケーション104により作成・編集されたブックファイルを格納するサーバである。文書管理サーバ1201によってブックファイルを管理する場合、ブックファイルはクライアントPCのローカルHDに代わって、あるいはそれに加えて、文書管理サーバ1201のデータベース1211に保存される。製本アプリケーション104と文書管理サーバ1201との間のブックファイルの保存及び読み出しは、DSクライアント108及びDSコア1212を介して行われる。
【0059】
印刷集中管理サーバ1202は、クライアント文書管理システム1200に格納された、あるいは文書管理サーバ1201に格納されたブックファイルの印刷を管理するサーバである。クライアントにおける印刷要求は、DOMSドライバ109およびDOMSプリントサービスモジュール110を介して印刷集中管理サーバ1202のDOMSWGサーバモジュール1221に送信される。集中印刷管理サーバ1202は、クライアントのプリンタで印刷する場合にはクライアントのDOMSプリントサービスモジュール110を介して電子原稿デスプーラ105に電子原稿データを渡す。プリントサーバ1203により印刷する場合には、プリントサーバ1203のDOMSプリントサービスモジュール1203に送信する。集中印刷管理サーバは、例えば保存されているブックファイルに対して印刷要求を発行した利用者の資格などについてセキュリティチェックを行ったり、印刷処理のログを保存したりする。このように、文書処理システムは、スタンドアロンとしても、クライアントサーバシステムとしても実現できる。
【0060】
<プレビュー表示の内容>
既に説明した通り、ブックファイルが製本アプリケーションによって開かれると、図10に示したユーザインタフェース画面1100が表示される。ツリー部1101には、開いているブック(以下、「注目ブック」と呼ぶ)の構造を示すツリーが表示される。プレビュー部には、利用者の指定に応じて、3通りの表示方法が用意されている。まず、第1は原稿ページをそのまま表示する原稿ビューと呼ばれるモードである。この原稿ビューモードでは、注目ブックに属する原稿ページの内容が縮小されて表示される。尚、プレビュー部1102の表示にレイアウトは反映されない。次に、第2は印刷ビューモードである。この印刷ビューモードでは、プレビュー部1102には原稿ページのレイアウトが反映された形で原稿ページが表示される。そして、第3は簡易印刷ビューモードである。この簡易印刷ビューモードでは、各原稿ページの内容はプレビュー部の表示には反映されず、レイアウトのみが反映される。
【0061】
<ステイプル制御>
次に、ステイプル機能を有するプリンタと接続するコンピュータ100の製本アプリケーション104によって行われるステイプル制御について説明する。
【0062】
図13は、ステイプル制御システムの構成を示すブロック図である。図示するように、ステイプル制御システムは、図2に示したホストコンピュータ100とステイプル機能を有するプリンタ107とで構成される。
【0063】
以下、プリンタ107の構成について説明する。尚、本発明の機能が実現されるのであれば、単体の機器であっても、複数の機器からなるシステムであっても、LAN,WAN等のネットワークを介して接続がなされ、処理が行われるシステムであっても本発明を適用できる。
【0064】
図示するように、プリンタ107において、1301はプリンタCPUである。プリンタCPUは、ROM1302内のプログラム用ROMに記憶された制御プログラム等や外部メモリ1303に記憶された制御プログラム等に基づいて動作する。そして、システムバス1304に接続される印刷部I/F1305を介して、印刷部(プリンタエンジン)1306に出力情報としての画像信号を出力する。また、このROM1302内のプログラムROMには、CPU1301の制御プログラム等が記憶さる。ROM1302内のフォント用ROMには、出力情報を生成する際に使用するフォントデータ等が記憶される。ROM1302内のデータ用ROMには、ハードディスク等の外部メモリ1303がないプリンタの場合、ホストコンピュータ100上で利用される情報等が記憶されている。
【0065】
また、CPU1301は、入力部1307を介してホストコンピュータ100との通信処理が可能となっており、プリンタ107内の情報等をホストコンピュータ100に通知できる。RAM1308は、CPU1301の主メモリや、ワークエリア等として機能するRAMであり、図示しない増設ポートに接続されるオプションRAMによりメモリ容量を拡張することができるように構成されている。
【0066】
尚、RAM1308は、出力情報展開領域、環境データ格納領域、NVRAM等に用いられる。上述したハードディスク(HD)、ICカード等の外部メモリ1303は、メモリコントローラ(MC)1309によりアクセスを制御される。外部メモリ1303は、オプションとして接続され、フォントデータ、エミュレーションプログラム、フォームデータ等を記憶する。また、操作パネル1311は操作のためのスイッチ及びLED表示器等で構成されている。
【0067】
また、上述の外部メモリ1303は1個に限らず、複数個備えられ、内蔵フォントに加えてオプションカード、言語系の異なるプリンタ制御言語を解釈するプログラムを格納した外部メモリを複数接続できるように構成されていても良い。更に、図示しないNVRAMを有し、操作パネル1311からのプリンタモード設定情報を記憶するようにしても良い。
【0068】
<オブジェクト削除処理>
次に、コンピュータ100の製本アプリケーション104によって行われるオブジェクト削除処理について説明する。
【0069】
図16は、本実施例のコンピュータ100の製本アプリケーションのオブジェクト削除処理手順を示すフローチャートである。
【0070】
製本アプリケーションが起動し、複数のドキュメントから統合されたドキュメントに対してオブジェクト削除処理が起動すると、S1601で削除したいオブジェクト属性を特定するための矩形領域指定するためのページ選択を行う。
【0071】
次にステップS1602で、選択したページにおいて、矩形領域の指定を行う。
【0072】
図17は、ステップS1601で選択したページにおいて、矩形領域を指定した例を示している。
【0073】
また、ステップS1602の矩形指定において、1つの矩形では指定が不十分な場合、複数個の矩形領域を指定可能なように実装してもよい。
【0074】
次にステップS1603で、抽出対象オブジェクト属性を指定させる。
【0075】
オブジェクト属性は、本実施例では、文字列で構成されたオブジェクトであって、さらに数字によって構成されるページ番号、年月日に相当する数字およびセパレータで構成された日付、指定文字列に分類される。
【0076】
尚、本実施例ではオブジェクト属性として年月日による日付を挙げたが、時分秒といった時刻を加えた日時を示すオブジェクトにも容易に応用可能である。
【0077】
また、本実施例でのオブジェクト属性は、ページ番号、日付、指定文字列を挙げたが、ヘッダやフッタを構成する他の描画要素であってもよい。
【0078】
図18は抽出対象オブジェクトを指定するためのユーザーインタフェースの一例を示すもので、オブジェクト属性として、ページ番号、日付、指定文字列が選択可能となっており、ページ番号を抽出対象とするように指定した例を示すものである。
【0079】
次にステップS1604で、図19で後述する矩形領域内に含まれるオブジェクトの抽出処理を行う。
【0080】
ステップS1605で、オブジェクトの抽出結果より、未処理オブジェクトがあるか否かの判別を行ない、未処理オブジェクトがあればステップS1606へ、未処理オブジェクトがなければステップS1610の処理を行う。
【0081】
ステップS1606では、抽出したオブジェクト属性の表示およびそのオブジェクトを削除するか否かの指定を行う。
【0082】
図20は抽出したオブジェクト属性を表示するユーザーインタフェースの一例を示すもので、ページ番号“1”を抽出したことを示し、さらにそれを削除対象とするか否かを指定されるものである。
【0083】
次にステップS1607で、抽出したオブジェクトを削除するか否かの指定の判別を行ない、削除指定であればステップS1608の処理を、削除しない指定であればステップS1604の処理を行う。
【0084】
ステップS1608では、オブジェクトの削除処理を行う。
【0085】
この削除処理は、削除対象となるオブジェクトを表示するのに必要なデータのみをファイルから削除するものである。
【0086】
次にステップS1609で、削除したオブジェクト属性を記憶し、ステップS1604の処理を行う。
【0087】
ステップS1610では、ステップS1601で選択したページ以外のページで未処理のものがあるか否かを判別し、未処理のページがあればステップS1611の処理を、未処理のページがなければ処理を終了する。
【0088】
ステップS1611では、ステップS1602で指定したのと同じ矩形領域を当てはめ、図19で後述する矩形領域内に含まれるオブジェクトの抽出処理を行う。
【0089】
ステップS1612で、オブジェクトの抽出結果より、未処理オブジェクトがあるか否かの判別を行ない、未処理オブジェクトがあればステップS1613へ、未処理オブジェクトがなければステップS1610の処理を行う。
【0090】
ステップS1613では、ステップS1609で記憶した削除対象オブジェクトと同じ属性かを判別し、同じであればステップS1614の処理を、同じでなければステップS1611の処理を行う。
【0091】
次にステップS1614では、図20に示すように、削除対象オブジェクト属性の表示およびそのオブジェクトを削除するか否かの指定を行う。
【0092】
次にステップS1615で、一致した削除対象オブジェクトを削除するか否かの指定の判別を行ない、削除指定であればステップS1616の処理を、削除しない指定であればステップS1611の処理を行う。
【0093】
ステップS1616では、オブジェクトの削除処理を行ない、ステップS1611の処理に戻る。
【0094】
図19は、本実施例のコンピュータ100の製本アプリケーションの矩形内オブジェクト抽出処理手順を示すフローチャートである。
【0095】
先ず、ステップS1901で、矩形領域内に包含される文字列データを逐次抽出する。
【0096】

ここで、文字列でなく、図形やイメージで構成された描画オブジェクトの場合、前処理として、一旦イメージ化し、文字認識処理を行った上で、再度文字列として文字列データ抽出処理を行えばよい。
【0097】
また、矩形領域内に包含されるか否かの判断は、文字列単位等一区切りとなる描画データの外接矩形を求め、それとの比較を行えばよい。
【0098】
次にステップS1902で、文字列データが抽出できたか否かを判別し、抽出できたらステップS1903へ、抽出できなければステップS1916の処理を行う。
【0099】
ステップS1903では、ステップS1603で抽出対象オブジェクトとしてページ番号が指定されているか否かを判別し、指定されていればステップS1904へ、指定されていなければステップS1908の処理を行う。
【0100】
ステップS1904では、抽出した文字列データが、ページ番号か否かの判別を行ない、ページ番号と判別すれば、ステップS1905へ、ページ番号でなければステップS1908の処理を行う。
【0101】
ページ番号であるかを判別する手段のひとつとして、選択したページの前後の同一矩形位置にあるオブジェクト属性が、同じ書体、同じ文字サイズ、同じ表記形式の数字あるいはその組み合わせで構成されているかによって判断すればよい。
【0102】
尚、表記形式の一例として、“1、2、3、、、”、“−1−、−2−、−3−、、、”、“1/n、2/n、3/n、、、”、“一、二、三、、、”、“ページ1、ページ2、ページ3、、、”、“Page1、Page2、Page3、、、”等あり、これらを全てページ番号として扱う。
【0103】
ステップS1905では、処理中のページの前後のページに対し、ステップS1901と同様に矩形領域内に包含される文字列データの抽出を行う。
【0104】
ステップS1906では、前後のページの文字列が、ステップS1904で判定したページ番号と連番になっているかを判定し、連番であればステップS1907へ、連番でなければステップS1908の処理を行う。
【0105】
本実施例では、ページ番号の場合、通常連番になるものであり、連番でないと判定したときには、ページ番号ではないと判定したが、ページ番号が連続しない場合もあり、そのときはこのステップS1906の処理を行わなくてもよい。
【0106】
ステップS1907では、抽出したオブジェクトとそのオブジェクト属性がページ番号であるという結果を、矩形内オブジェクト抽出処理の呼び出し元に返し終了する。
【0107】
次にステップS1908で、ステップS1603で抽出対象オブジェクト属性として日付が指定されているか否かを判別し、指定されていればステップS1909へ、指定されていなければステップS1913の処理を行う。
【0108】
ステップS1909では、抽出した文字列データが、日付か否かの判別を行ない、日付と判別すれば、ステップS1910へ、日付でなければステップS1913の処理を行う。
【0109】
日付であるかを判別する手段のひとつとして、日付を表現する各種表記形式を事前に設定し、設定された表記形式との一致性を確認することで、日付であるかを判断すればよい。
【0110】
尚、日付表記の一例として、“平成X年Y月Z日”、“HX.Y.Z”、“200X年Y月Z日”、“200X.Y.Z”、“200X―Y―Z”、“200X/Y/Z”、“Z/Y/200X”、“Y/Z/200X”、等あり、これらを全て日付として扱う。
【0111】
ステップS1910では、処理中のページの前後のページに対し、ステップS1901と同様に矩形領域内に包含される文字列データの抽出を行う。
【0112】
ステップS1911では、前後のページの文字列が、ステップS1909で判定した日付と連番になっているかを判定し、連番であればステップS1913へ、連番でなければステップS1912の処理を行う。
【0113】
本実施例では、日付の場合、ページ番号とは異なり、通常連番になることはないので、連番と判定したときには、日付ではないと判定したが、このステップS1911の処理を行わなくてもよい。
【0114】
ステップS1912では、抽出したオブジェクトとそのオブジェクト属性が日付であるという結果を、矩形内オブジェクト抽出処理の呼び出し元に返し終了する。
【0115】
次にステップS1913では、ステップS1603で指定文字列の指定であるか否かを判別し、指定されていればステップS1914の処理を、指定されていなければステップS1901の処理を行う。
【0116】
ステップS1914では、抽出した文字列とステップS1603で指定された文字列の比較を行ない、同じであればステップS1915の処理を、異なればステップS1901の処理を行う。
【0117】
ステップS1915では、抽出したオブジェクトとそのオブジェクト属性が指定文字列であるという結果を、矩形内オブジェクト抽出処理の呼び出し元に返し終了する。
【0118】
一方、ステップS1902の判別で、文字列データが抽出できなければ、ステップS1916で抽出オブジェクトなしという結果を、矩形内オブジェクト抽出処理の呼び出し元に返し終了する。
【0119】
また、矩形が複数個指定されている場合、矩形ごとに繰り返しオブジェクト抽出を行う。
【0120】
以上により、元原稿で割り付けたページ番号あるいはヘッダ、フッタ情報が、ページ毎に異なる位置に描画されている場合においても、簡単な操作で容易かつ確実に一括削除することが可能となる。
【0121】
また、削除するものを事前に表示し、削除してよいか否かを確認するステップを提供することにより、誤削除を防ぐこともできる。
【0122】
また、矩形領域を複数個指定可能とすることにより、全然位置が異なる複数のものを一回の操作で削除可能となる。
【符号の説明】
【0123】
100 ホストコンピュータ
107 プリンタ
201 CUP
202 RAM
203 ROM
204 システムバス
207 ディスクコントローラ

【特許請求の範囲】
【請求項1】
複数の入力ドキュメントを結合し、1つの出力ドキュメントを生成し、情報を付加する文書処理システムにおいて、
選択したページ内の矩形領域を指定する矩形領域指定手段と、
前記矩形領域の内に包含される第一のオブジェクトを抽出する第一のオブジェクト抽出手段と、
前記第一のオブジェクト抽出手段で抽出した第一のオブジェクトを削除する第一のオブジェクト削除手段と、
前記第一のオブジェクト削除手段で削除したオブジェクト属性を記憶するオブジェクト記憶手段と、
前記選択したページ以外のページに対し、前記矩形領域指定手段で指定したのと同じ矩形領域内に包含される第二のオブジェクトを抽出する第二のオブジェクト抽出手段と、
前記オブジェクト記憶手段で記憶したオブジェクト属性と前記第二のオブジェクト抽出手段結果のオブジェクト属性を比較するオブジェクト比較手段と、
前記オブジェクト比較手段で一致した時のみ前記第二のオブジェクト抽出手段で抽出した第二のオブジェクトを削除する第二のオブジェクト削除手段を有することを特徴とする文書処理システム。
【請求項2】
前記オブジェクト比較手段で一致したオブジェクト属性を表示し、処理を選択させる表示選択手段を有することを特徴とする請求項1記載の文書処理システム。
【請求項3】
前記矩形領域指定手段に加え、抽出するオブジェクト属性を指定するオブジェクト属性指定手段を有することを特徴とする請求項1記載の文書処理システム。
【請求項4】
前記オブジェクト属性は、ページ番号あるいは日付あるいは指定文字列のいずれかを含むことを特徴とする請求項1記載の文書処理システム。
【請求項5】
前記矩形領域指定手段は、複数個指定可能であることを特徴とする請求項1記載の文書処理システム。

【図4】
image rotate

【図6】
image rotate

【図13】
image rotate

【図16】
image rotate

【図19】
image rotate

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図5】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図14】
image rotate

【図15】
image rotate

【図17】
image rotate

【図18】
image rotate

【図20】
image rotate


【公開番号】特開2012−83930(P2012−83930A)
【公開日】平成24年4月26日(2012.4.26)
【国際特許分類】
【出願番号】特願2010−229202(P2010−229202)
【出願日】平成22年10月12日(2010.10.12)
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】