説明

印刷データ処理装置

【課題】印刷データの処理をするにあたって、利便性のより高いネットワーク複合機を提供する。
【解決手段】ネットワーク複合機1は、ページ記述言語で記述されたPDLデータD1によって示される文書を印刷する機能を有している。ネットワーク複合機1は、プリンタ19とテキスト生成部23とメモリ12とを備える。プリンタ19は、入力されたPDLデータD1に基づいて、PDLデータD1によって示される文書を用紙に印刷する。テキスト生成部23は、プリンタ19によって印刷される文書のPDLデータD1に基づいて、文書を示すテキストデータD3を生成する。メモリ12は、生成されたテキストデータD3を保存する。よって、PDLデータD1を一度入力すれば、PDLデータD1によって示される文書の印刷とこの文書のテキストデータD3の保存との双方を行うことができる。従って、利用者の利便性を向上させることができる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ページ記述言語で記述された印刷データを処理する印刷データ処理装置に関する。
【背景技術】
【0002】
従来から、電子化された印刷データを用紙に印刷する印刷装置がある(下記特許文献1参照)。また、用紙に印刷された文書をスキャナによって読み込み、文書のイメージを取得して文字認識(OCR:Optical Character Recognition)処理を行うことにより、文書を示すテキストデータを生成するOCR装置も知られている。
【特許文献1】特開平8−286861号公報
【発明の開示】
【発明が解決しようとする課題】
【0003】
ところで、利用者が、文書を用紙に印刷して利用し、更に、その文書をテキストデータとして管理したい場合がある。この場合、利用者は、印刷装置を操作することにより、印刷装置によって文書を用紙に印刷し、更に、利用者は、OCR装置を操作することにより、印刷した文書をOCR装置によって読み込んで、テキストデータに変換する必要がある。このため、操作が煩雑になり、利用者の利便性が低かった。
【0004】
そこで、本発明は、印刷データの処理をするにあたって、利便性のより高い印刷データ処理装置を提供することを目的とする。
【課題を解決するための手段】
【0005】
本発明の印刷データ処理装置は、ページ記述言語で記述された印刷データを処理する印刷データ処理装置であって、印刷データに基づいて印刷を行う印刷手段と、印刷手段による印刷に供される印刷データに基づいて、文字コードデータを生成する生成手段と、生成手段によって生成された文字コードデータを記憶する記憶手段と、を備えることを特徴とする。
【0006】
本発明の印刷データ処理装置では、印刷データを一度入力すれば、この印刷データの印刷と文字コードデータの保存との双方を行うことができる。よって、利用者は、容易に、印刷データを用紙に印刷して利用すると共に、その印刷データを文字コードデータとして管理することができる。従って、利用者の利便性を向上させることができる。
【0007】
上記印刷データ処理装置は、印刷データから文字コードを抽出可能か否か判断する判断手段と、印刷データに基づいてラスタライズデータを生成するラスタライズ手段と、を備え、生成手段は、判断手段が文字コードを抽出可能と判断した場合に、印刷データから文字コードを抽出することにより、文字コードデータを生成する抽出手段と、判断手段が文字コードを抽出できないと判断した場合に、ラスタライズ手段によって生成されたラスタライズデータに文字認識処理を施すことにより、文字コードを認識して、文字コードデータを生成するOCR手段と、を有することが好ましい。
【0008】
この場合、印刷データから文字コードを抽出可能か否か判断し、文字コードが抽出可能な場合は、文字コードを印刷データから抽出して文字コードデータを生成し、文字コードが抽出できない場合は、ラスタライズデータに変換してからOCR処理を施すことにより、文字コードを認識して、文字コードデータを生成する。これにより、入力された印刷データから文字コードを抽出可能な場合と、文字コードを抽出できない場合とに分けて、的確に処理を行う。このため、文字コードを抽出可能な印刷データであっても、文字コードを抽出不可能な印刷データであっても、文字コードデータを生成することができる。
【0009】
上記印刷データ処理装置では、印刷手段は、ラスタライズ手段によって生成されたラスタライズデータを用いて印刷を行い、OCR手段は、印刷手段による印刷に供されるラスタライズデータに文字認識処理を施すことが好ましい。
【0010】
この場合、印刷データに基づいて生成したラスタライズデータを印刷処理とOCR処理との双方に利用するので、より効率的にデータ処理を行うことができる。
【発明の効果】
【0011】
本発明の印刷データ処理装置によれば、利用者は、印刷データの印刷物と文字コードデータとの双方を容易に取得することができる。従って、印刷データの処理をするにあたって、利用者の利便性を向上させることができる。
【発明を実施するための最良の形態】
【0012】
以下、図面を参照して本発明の好適な実施形態について詳細に説明する。なお、各図において、同一要素には同一符号を付して重複する説明を省略する。
【0013】
図1及び図2を用いて、本実施形態に係るネットワーク複合機1の構成について説明する。図1は、実施形態に係るネットワーク複合機1の構成を示すブロック図である。図2は、ネットワーク複合機1が有するデータ処理部20の構成を示すブロック図である。ネットワーク複合機1は、印刷データ処理装置が組み込まれた複合機であって、後述するように、入力された印刷データの処理を行う機能を有する。
【0014】
図1に示すように、ネットワーク複合機1は、CPU(Central Processing Unit)11、メモリ12、NCU(Network Control Unit)13、モデム14、LAN(Local Area Network)インターフェース15、操作部16、IFAX(インターネットファクシミリ)制御部17、スキャナ18、プリンタ19、及びデータ処理部20を備えて構成されている。これらの各構成要素は、相互にデータの入出力が可能に通信線2で接続されている。なお、メモリ12とプリンタ19とは、それぞれ、特許請求の範囲に記載の記憶手段と印刷手段とに相当する。
【0015】
ネットワーク複合機1では、CPU11が、メモリに記憶されたプログラムを実行することにより、ネットワーク複合機1の各構成要素の動作を制御している。ネットワーク複合機1は、PSTN(Public Switched Telephone Network)50に、モデム14を介して接続され、NCU13が、モデム14とPSTN50との接続の制御を行う。すなわち、ネットワーク複合機1は、PSTN50に接続された他のネットワーク複合機との間で、FAXの送受信が可能に構成されている。
【0016】
ネットワーク複合機1は、LAN51に、LANインターフェース15を介して接続されている。ネットワーク複合機1は、LAN51に接続されたパーソナルコンピュータ30とのデータの送受信が可能に構成されている。また、IFAX制御部17は、電子メール形式を用いて、インターネットを介してファクシミリの送受信を行う。
【0017】
操作部16は、利用者から入力を受け付ける部分であり、タッチパネル及び入力ボタンにより構成されている。スキャナ18は、CCD(Charge Coupled Device)ラインセンサを用いて、用紙に印刷された文書を読み取る。プリンタ19は、電子写真方式を用いて、メモリ12内に保存された印刷データを用紙に印刷する。
【0018】
メモリ12内に保存される印刷データは、受信したFAXデータ、スキャナ18によって読み込まれたデータ、パーソナルコンピュータ30から入力されたPDL(Page Description Language)データ等である。PDLデータは、ページ記述言語で記述された印刷データである。このPDLデータは、文章及び図、写真等が含まれた文書を示す。
【0019】
データ処理部20は、パーソナルコンピュータ30からLANインターフェース15を介してPDLデータを入力する。このデータ処理部20は、図2に示すように、判断部21とラスタライズ部22とテキスト生成部23とを備える。なお、判断部21は特許請求の範囲に記載の判断手段に相当し、ラスタライズ部22は特許請求の範囲に記載のラスタライズ手段に相当し、テキスト生成部23は、特許請求の範囲に記載の生成手段に相当する。
【0020】
判断部21は、入力したPDLデータから文字コードを抽出可能か否か判断する。例えば、PDLデータがレジデントフォントを用いていれば、判断部21は、PDLデータから文字コードを抽出可能であると判断する。PDLデータがレジデントフォントを用いていなければ、判断部21は、PDLデータから文字コードを抽出できないと判断する。例えば、判断部21は、PDLデータのヘッダに“ゴシック ポイント12”等のデータを読み取った場合、このPDLデータにはレジデントフォントが用いられているので、入力したPDLデータから文字コードを抽出可能と判断する。
【0021】
ラスタライズ部22は、LANインターフェース15から入力したPDLデータに印刷ラスタライズ処理を施すことにより、PDLデータをラスタライズデータに変換し、メモリ12へ出力する。メモリ12は、この印刷用のラスタライズデータを記憶する。プリンタ19は、メモリ12に記憶されたラスタライズデータを入力して、用紙に文書の印刷を行う。
【0022】
なお、入力したPDLデータがレジデントフォントではないと判断部21によって判断された場合、PDLデータをそのまま印刷ラスタライズ処理できないので、この場合は、ダウンロードフォント処理を行ってから、印刷ラスタライズ処理を行う。
【0023】
テキスト生成部23は、PDLデータに基づいて、このPDLデータによって示される文書のテキストデータを生成する。テキストデータは、文書に含まれる文字を文字コードで示した文字コードデータである。テキスト生成部23は、テキストデータを生成するために、抽出部23AとOCR部23Bとを有する。なお、抽出部23AとOCR部23Bとは、それぞれ、特許請求の範囲に記載の抽出手段とOCR手段とに相当する。
【0024】
抽出部23Aは、判断部21によって文字コードを抽出可能と判断されたPDLデータから文字コードを抽出することにより、テキストデータを生成する。OCR部23Bは、判断部21によって文字コードを抽出できないと判断されたPDLデータについて処理を行う。
【0025】
具体的には、OCR部23Bは、文字コードを抽出できないと判断されたPDLデータのラスタライズデータをラスタライズ部22から入力する。そして、OCR部23Bは、入力したラスタライズデータにOCR処理を施すことにより、文字コードを認識して、テキストデータを生成する。
【0026】
テキスト生成部23は、生成したテキストデータをメモリ12へ出力する。これにより、PDLデータによって示される文書のテキストデータが、メモリ12に保存される。
【0027】
図3を参照して、ネットワーク複合機1におけるデータ処理の流れを説明する。図3は、実施形態に係るネットワーク複合機1におけるデータ処理の流れを示す図である。ネットワーク複合機1に入力されたPDLデータD1は、ラスタライズ部22によって印刷ラスタライズ処理され、ラスタライズデータD2に変換される。このラスタライズデータD2は、メモリ12を介してプリンタ19へ出力される。
【0028】
一方、PDLデータD1から文字コードが抽出できる場合、抽出部23Aによって文字コードが抽出され、テキストデータD3が生成される。PDLデータD1から文字コードが抽出できない場合、そのラスタライズデータD2が、OCR部23BによってOCR処理されることにより、テキストデータD3が生成される。生成されたテキストデータは、メモリ12に保存される。
【0029】
引き続いて、実施形体に係るネットワーク複合機1の動作について説明する。図4は、実施形態に係るネットワーク複合機1による印刷データ処理の処理手順を示すフロー図である。
【0030】
まず、PDLデータが、パーソナルコンピュータ30からLANインターフェース15を介してデータ処理部20に入力されると、入力されたPDLデータがレジデントフォントを用いているか否か、判断部21によって判断される(ステップS100)。すなわち、入力したPDLデータから文字コードを抽出可能か否かが、判断される。
【0031】
PDLデータがレジデントフォントを用いていると判断された場合(ステップS100でYes)、文字コードが、PDLデータから抽出部23Aによって抽出される(ステップS101)。抽出された文字コードは、メモリ12に記憶される(ステップS102)。入力されたPDLデータには、ラスタライズ部22によって印刷ラスタライズ処理が施され、ラスタライズデータが生成される(ステップS104)。
【0032】
PDLデータがレジデントフォントを用いていないと判断された場合(ステップS100でNo)、ダウンロードフォント処理が行われる(ステップS103)。その後、PDLデータには、ダウンロードしたフォント情報を用いて印刷ラスタライズ処理が施され、ラスタライズデータが生成される(ステップS104)。
【0033】
生成されたラスタライズデータは、メモリ12に記憶される(ステップS105)。そして、このラスタライズデータを用いて、文書が、プリンタ19によって用紙に印刷される(ステップS106)。
【0034】
引き続いて、抽出された文字コードがメモリ12に記憶されている場合(ステップS107でYes)、テキストデータが、テキスト生成部23によってメモリ12内の文字コードを用いて生成され、メモリ12に保存される(ステップS109)。文字コードがメモリ12に記憶されていない場合(ステップS107でNo)、ラスタライズデータが、OCR部23BによってOCR処理を施され、文字コードが認識される(ステップS108)。これにより、テキストデータが、テキスト生成部23によって生成され、メモリ12に保存される(ステップS109)。
【0035】
処理されたPDLデータが、文書の最終ページデータでない場合(ステップS110でNo)は、ステップS100へ戻って、次のページのPDLデータの処理を行う。処理したPDLデータが、文書の最終ページデータである場合(ステップS110でYes)、処理を終了する。これにより、入力されたPDLデータによって示される文書の印刷とテキストデータの保存とが同時かつ自動的に行われる。印刷データをテキストデータとして保存することにより、例えば、印刷データの管理又は全検索等を容易に行うことができる。
【0036】
以上説明したように、実施形態に係るネットワーク複合機1では、PDLデータを一度入力すれば、PDLデータによって示される文書の印刷とこの文書のテキストデータの保存との双方を行うことができる。よって、利用者は、容易に、文書を用紙に印刷して利用すると共に、その文書をテキストデータとして管理することができる。このため、利用者は、PDLデータの印刷操作を行った後、更に、印刷物にOCR処理を行うための操作を行う必要がなくなる。従って、利用者の利便性を向上させることができる。
【0037】
ネットワーク複合機1では、ラスタライズデータに基づいてテキストデータを生成するので、印刷物にOCR処理を施してテキストデータを生成する場合と比較して、スキャナの解像度等の影響を排除することができるため、文字認識精度を向上させることができる。
【0038】
また、ネットワーク複合機1は、PDLデータから文字コードを抽出可能か否か判断し、文字コードが抽出可能な場合は、文字コードをPDLデータから抽出してテキストデータを生成する。そして、PDLデータから文字コードが抽出できない場合は、ラスタライズデータに変換してからOCR処理を施すことにより、文字コードを認識してテキストデータを生成する。このため、入力された印刷データから文字コードを抽出可能なデータである場合と、文字コードを抽出できないデータである場合とに分けて、的確に処理を行う。このため、文字コードを抽出可能なPDLデータであっても、文字コードを抽出できないPDLであってもテキストデータを生成することができる。
【0039】
また、ネットワーク複合機1は、PDLデータに基づいて生成したラスタライズデータを印刷処理とOCR処理との双方に利用するので、より効率的にデータ処理を行うことができる。
【0040】
以上、本発明の実施の形態について説明したが、本発明は、上記実施形態に限定されるものではなく種々の変形が可能である。例えば、上記実施形態では、印刷処理をした後に、テキストデータの生成処理を行ったが、印刷処理とテキストデータの生成処理とを並行して行ってもよい。
【0041】
また、上記実施形態では、印刷データ処理装置がネットワーク複合機に組み込まれた場合について説明したが、印刷データ処理装置は、印刷データの印刷機能を有するプリンタ等に組み込まれてもよい。
【0042】
また、上記実施形態では、PDLデータから文字コードを抽出可能か否か判断するにあたって、PDLデータがレジデントフォントを用いている場合に文字コードを抽出可能と判断した。これにかぎらず、PDLデータがダウンロードフォントを用いている場合であっても、PDLデータから文字コードを抽出可能であれば、抽出部23Aによって文字コードを抽出し、テキストデータを生成してもよい。
【図面の簡単な説明】
【0043】
【図1】実施形態に係るネットワーク複合機の構成を示すブロック図である。
【図2】実施形態に係るネットワーク複合機が有するデータ処理部の構成を示すブロック図である。
【図3】実施形態に係るネットワーク複合機におけるデータ処理の流れを示す図である。
【図4】実施形態に係るネットワーク複合機による印刷データ処理の処理手順を示すフロー図である。
【符号の説明】
【0044】
1 ネットワーク複合機
12 メモリ
19 プリンタ
20 データ処理部
21 判断部
22 ラスタライズ部
23 テキスト生成部
23A 抽出部
23B OCR部

【特許請求の範囲】
【請求項1】
ページ記述言語で記述された印刷データを処理する印刷データ処理装置であって、
前記印刷データに基づいて印刷を行う印刷手段と、
前記印刷手段による印刷に供される前記印刷データに基づいて、文字コードデータを生成する生成手段と、
前記生成手段によって生成された前記文字コードデータを記憶する記憶手段と、を備えることを特徴とする印刷データ処理装置。
【請求項2】
前記印刷データから文字コードを抽出可能か否か判断する判断手段と、
前記印刷データに基づいてラスタライズデータを生成するラスタライズ手段と、を備え、
前記生成手段は、
前記判断手段が文字コードを抽出可能と判断した場合に、前記印刷データから文字コードを抽出することにより、前記文字コードデータを生成する抽出手段と、
前記判断手段が文字コードを抽出できないと判断した場合に、前記ラスタライズ手段によって生成された前記ラスタライズデータに文字認識処理を施すことにより、文字コードを認識して、前記文字コードデータを生成するOCR手段と、を有することを特徴とする請求項1に記載の印刷データ処理装置。
【請求項3】
前記印刷手段は、前記ラスタライズ手段によって生成された前記ラスタライズデータを用いて印刷を行い、
前記OCR手段は、前記印刷手段による印刷に供される前記ラスタライズデータに文字認識処理を施すことを特徴とする請求項2に記載の印刷データ処理装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate


【公開番号】特開2010−118821(P2010−118821A)
【公開日】平成22年5月27日(2010.5.27)
【国際特許分類】
【出願番号】特願2008−289644(P2008−289644)
【出願日】平成20年11月12日(2008.11.12)
【出願人】(000006297)村田機械株式会社 (4,916)
【Fターム(参考)】