画像形成装置
【課題】 従来はテキスト描画命令をパス描画命令にアウトライン変換することで、該当個所が文字として描画されず、文字表示の為の最適な処理がなされないという問題があった。
【解決手段】 これを解決するためにパス描画命令から文字パス群を抽出し、それらの文字らしさ(文字尤度)を算出することで、文字属性を復元する。
【解決手段】 これを解決するためにパス描画命令から文字パス群を抽出し、それらの文字らしさ(文字尤度)を算出することで、文字属性を復元する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、パス描画命令を含む文書データを処理する画像形成装置、画像形成方法に関するものである。
【背景技術】
【0002】
電子データを用いた入稿処理が広く利用されている。これはデータ作成者が自分で画像や文字の配置を自分のコンピュータ上で決定し、それをネットワークなどを介してデータ印刷者に送信する。データ印刷者はこれを元に印刷を行うものである。
【0003】
しかしこの場合、データの作成者と印刷者の間で環境に違いが生じると、望まれない印刷結果が生じる場合がある。その代表的な例がフォントの有無である。印刷者が有していないフォントが電子データに含まれる場合には、そのフォントに類似した別の代替フォントを使用しなければならなくなる。しかし、これにより作成者が意図したものと違う印刷結果となる場合がある。
【0004】
これを回避する1つの手段として、印刷者が有していないフォントに関しては、これをパスを描画する画像描画命令に置き換えるアウトライン処理がある。元の電子データでは、文字を描画する位置やサイズなどの描画属性情報と描画するべき文字を識別し実際に描画するテキスト描画命令によって、文字描画を行っていた。アウトライン処理とは、この描画属性情報と描画命令を利用し、テキスト描画命令をパス点設定命令とパス塗潰し命令に変換することである。
【0005】
これにより印刷者が有さないフォントを使用する印刷データであっても、パス描画命令として処理することで作成者の意図した結果に近い結果が得られる。
【0006】
又、アウトライン化する際にテキスト部分のエッジを抽出し、そのエッジ部分を強調する画像処理を行うものがある(特許文献1)。これを始めとして、従来はアウトライン化を行う際にトラッピング処理等を加えるのが一般的であった。
【特許文献1】特開平10−294863号公報
【発明の開示】
【発明が解決しようとする課題】
【0007】
しかし、従来はテキスト描画命令をパス描画命令に変換することで、該当個所が文字として描画されず、文字表示の為の最適な処理がなされないという問題があった。この最適な処理には、ヒンティング情報に基づいた線幅調整、あるいは文字用のディザパターンの使用等が含まれる。
【0008】
特許文献1は、アウトライン化する際にテキスト部分のエッジを抽出し、そのエッジ部分を強調する画像処理を行うものである。これを始めとして、従来はアウトライン化を行う際にトラッピング処理等を加えるのが一般的であった。しかしながら、アウトライン化する際に補正処理が適用されていない文書データが入稿される場合もある。また補正処理がそのデバイスに対して適切ではない可能性もある。そのためアウトライン化されたデータに対して補正を行う手段を検討する必要がある。
【課題を解決するための手段】
【0009】
課題を解決するために、本発明に基づく画像形成装置及び画像形成方法ならびに画像形成方法を実行するプログラムは、
パス描画命令の特徴に基づきグルーピング処理を行いパス群を生成する手段と、
パス群の特徴に基づき、該パスが文字であることの尤度を求める手段と、
尤度の高いパス群に対して、文字描画と同じ描画処理を実行する手段と
を有する。
【0010】
パス群の特徴に基づき該文字尤度を求める手段として、周辺のパス群が直線状に位置している場合に尤度が高いものと認識する手段を有していても良い。
【0011】
パス群の特徴に基づき該文字尤度を求める手段として、パス群のバウンダリボックスの縦横比がほぼ1あるいは外部のデータベース等により記録保持されている文字として識別するに適切な縦横比に基づいて尤度を決定する手段を有していても良い。
【0012】
パス群の特徴に基づき該文字尤度を求める手段として、パス群のバウンダリボックスの頻度を求め、高頻度であるバウンダリボックスのパス群は尤度が高いものと認識する手段を有していても良い。
【0013】
パス群の特徴に基づき該文字尤度を求める手段として、パス群が描画される色が隣接するパス群のものと同一である場合に尤度が高いものと認識する手段とを有していても良い。
【0014】
パス群の特徴に基づき該文字尤度を求める手段として、尤度が一定以下のものに関してはパス描画命令を実行し、さらにそのパス描画命令に対して文字認識処理を行い、尤度を決定する手段を有していても良い。
【0015】
以上に示した文字尤度を求める手段の少なくとも2つ以上を組み合わせて尤度を求める手段を有しても良い。
【発明の効果】
【0016】
請求項1の発明によれば、画像形成処理を行っている際に、処理を行っているパス描画命令が、アウトライン化された文字描画命令に由来するか否かを判定することが可能となる。アウトライン化された文字描画命令であれば、文字描画と同じ描画設定を行う事で最適な処理を用いることができる。
【0017】
請求項2の発明によれば、特に横書き・縦書きで記載された文章データを含むデータに対する文字識別度をより高くすることが出来る。
【0018】
請求項3の発明によれば、文字毎の縦横幅が一定に近い漢字やハングル、アルファベットのように文字毎の縦横比が異なる文字グリフに対する文字識別度をより高くすることができる。
【0019】
請求項4の発明によれば、同じ大きさの文字が繰り返し使用されるようなデータに対する文字識別度をより高くすることが出来る。
【0020】
請求項5の発明によれば、文字が描画される色が統一的であるようなデータに対する文字識別度をより高くすることが出来る。
【0021】
請求項6の発明によれば、文字であるか否かの判定が難しい場合には、その文字を実際に描画し、文字認識処理によって文字か否かを判定することで、全データを処理するよりも短い時間で文字識別処理を実行できる。
【0022】
請求項7の発明によれば、以上の発明を組み合わせて、統合的な判断に基づいた文字識別処理を実施することが出来る。
【発明を実施するための最良の形態】
【0023】
次に、本発明の詳細を実施例の記述に従って説明する。
【0024】
<コンピュータ構成>
図1は、本発明の実施の形態例に係るシステムのコンピュータの構成図の例を示している。101はCPU、すなわち中央処理装置であり、装置全体の制御及び演算処理等を行う。103はROMすなわち読み出し専用メモリであり、システム起動プログラム、基本I/Oプログラム、及び文字コードをビットパターンに変換するための文字パターンデータ(フォントデータ)等を記憶している。
【0025】
102はRAMすなわちランダムアクセスメモリであり、CPU101の演算に使用するデータや演算結果、表示のために文字コードから変換された文字パターンデータ列や図形データ、イメージデータ等を一時記憶する。
【0026】
106はKBDC、すなわちキーボード制御部であり、107はKB、すなわちキーボードよりキー入力データ(文字コードや制御コード)を受け取り、CPU101へ伝達する。104はDSPC、すなわちディスプレイ制御部であり、RAM102に格納された文字パターンデータ列を読み出し、DSP105に転送する。105はDSP、すなわちディスプレイ装置であり、DSPC104より文字パターンデータ列、図形データ、イメージデータを受け取り、表示画面に表示する。
【0027】
108はDSKC、すなわちディスク制御部であり、外部記憶装置109に対するアクセス制御を行う。109はハードディスク装置である。HDには、文字パターンデータ(フォントデータ)やフォントデータを読み出してビットマップデータに変換する文字展開処理プログラム、図形データを処理する図形展開処理プログラム、イメージデータを処理するイメージデータ処理プログラム等を記憶している。
【0028】
110はNIC、すなわちネットワークインタフェイスカードであり、ネットワーク201と接続し他の機器と情報交換を行う。201はネットワークであり、多数のコンピュータがネットワークインタフェイスを利用して接続するイントラネットのようなコンピュータネットワークを意味する。
【0029】
<プリンタ構成例>
図2は、本実施例における複合機の主要部構成を示すブロック図である。
【0030】
コントローラユニット2000は、画像入力デバイスであるスキャナ2070や画像出力デバイスであるプリンタ2095を接続し、スキャナ2070で読み取られた画像データをプリンタ2095により印刷出力するコピー機能を実現するための制御を行う。また、同時にコントローラユニット2000はLAN3000や公衆回線3001(WAN)に接続することによって、画像情報やデバイス情報の入出力を行うための制御も行う。
【0031】
コントローラユニット2000は、具体的には、CPU2001を有し、CPU2001は、ROM2003に格納されているブートプログラムによりオペレーションシステム(OS)を立ち上る。このOS上でHDD(ハードディスクドライブ)2004に格納されているアプリケーションプログラムを実行することによって各種処理を実行する。このCPU2001の作業領域としてはRAM2002が用いられる。RAM2002は、作業領域とともに、画像データを一時記憶するための画像メモリ領域を提供する。HDD2004は、上記アプリケーションプログラムとともに、画像データを格納する。
【0032】
CPU2001には、システムバス2007を介して、ROM2003およびRAM2002が接続されている。また、CPU2001にはその他に操作部I/F(操作部インタフェース)2006、ネットワークI/F(ネットワークインタフェース)2010、モデム2050およびイメージバスI/F(イメージインタフェース)2005も接続されている。
【0033】
操作部I/F2006は、タッチパネルを有する操作部2012とのインターフェースであり、操作部2012に表示する画像データを操作部2012に対して出力する。また、操作部I/F2006は、操作部2012においてユーザにより入力された情報をCPU2001に送出する。
【0034】
次に、ネットワークI/F2010は、LAN3000に接続され、LAN3000を介してLAN3000上の各装置との間で情報の入出力を行う。モデム2050は、公衆回線3001に接続され、公衆回線3001を介して情報の入出力を行う。
【0035】
イメージバスI/F2005は、システムバス2007と画像データを高速で転送する画像バス2008を接続し、データ構造を変換するためのバスブリッジである。画像バス2008は、PCIバスまたはIEEE1394から構成される。画像バス2008上には、RIP2060、デバイスI/F2020、スキャナ画像処理部2080、プリンタ画像処理部2090、画像回転部2030、サムネイル作成部2035および画像圧縮部2040が設けられている。RIP2060は、ラスタイメージプロセッサであり、PDLコードをビットマップイメージに展開するプロセッサである。デバイスI/F2020には、スキャナ2070およびプリンタ2095が接続され、デバイスI/F2020は、画像データの同期系/非同期系の変換を行う。スキャナ画像処理部2080は、入力画像データに対し補正、加工、編集を行う。プリンタ画像処理部2090は、プリント出力画像データに対してプリンタの補正、解像度変換などを行う。画像回転部2030は、画像データの回転を行う。画像圧縮部2040は、多値画像データをJPEGデータに、2値画像データをJBIG、MMR、MHなどのデータに圧縮するとともに、その伸張処理を行う。
【0036】
図3は図2の複写機のリーダ部2070およびプリンタ部2095のハードウェア構成を模式的に示す図である。
【0037】
リーダ部2070とプリンタ部2095とは、図3に示すように、一体的に構成されている。リーダ部2070は、原稿給紙ユニット9250を搭載し、原稿給紙ユニット9250は、原稿を先頭から順に1枚ずつプラテンガラス9211上へ給送。各原稿の読取動作が終了する毎にその原稿をプラテンガラス9211から排出トレイ(図示せず)に排出する。リーダ部2070は、原稿がプラテンガラス9211上に給送されると、ランプ9212を点灯し、移動ユニット9213の移動を開始する。この移動ユニット9213の移動によりプラテンガラス9211上の原稿に対する読取走査が行われる。この読取走査中、原稿からの反射光は、各ミラー9214,9215,9216およびレンズ9217を経てCCDイメージセンサ(以下、CCDという)9218に導かれ、原稿上の画像がCCD9218の撮像面上に結像される。CCD9218は、撮像面に結像された画像を電気信号に変換し、この電気信号は所定の処理施された後に制御装置9110に入力される。
【0038】
プリンタ部2095は、レーザドライバ9321を有し、レーザドライバ9321は、制御装置9110から入力された画像データに基づきレーザ発光部9322を駆動する。これにより、レーザ発光部9322からは画像データに応じたレーザ光が発光され、このレーザ光は走査されながら感光ドラム9323上に照射される。感光ドラム9323上には、照射されたレーザ光により静電潜像が形成され、この静電潜像は現像器9324から供給されたトナーによりトナー像として可視像化される。レーザ光の照射タイミングに同期して、各カセット9311,9312から記録紙が搬送路を介して感光ドラム9323と転写部9325との間に給紙され、感光ドラム9323上のトナー像は転写部9325により給紙された記録紙上に転写される。
【0039】
トナー像が転写された記録紙は搬送ベルトを介して定着ローラ対(加熱ローラと加圧ローラ)9326に送られ、定着ローラ対9326は、記録紙を熱圧し、記録紙上のトナー像を記録紙上に定着させる。この定着ローラ対9326を通過した記録紙は、排紙ローラ対9327により排紙ユニット9330に排紙される。排紙ユニット9330は、ソート、ステイプルなどの後処理を施すことが可能なシート処理装置からなる。また、両面記録モードが設定されている場合には、記録紙を排紙ローラ対9327まで搬送した後に、排紙ローラ対9327の回転方向を逆転させ、フラッパ9328によって再給紙搬送路9329へ導く。再給紙搬送路9329に導かれた記録紙は、上述したタイミングで感光ドラム9323と転写部9325との間に再給紙され、この記録紙の裏面にトナー像が転写される。
【実施例1】
【0040】
実施例1は本発明を適用した好適な例を記載する。
【0041】
PDL処理の基本的な流れは、処理開始111、データ受信112、文書構成把握113、処理ページ選択114、印刷命令実行115、処理継続判断116、処理終了117の各工程から構成される。
【0042】
<データ受信112>
印刷に用いる文書データを外部あるいは内部から受け取るための工程である。
【0043】
文書データは、ネットワークI/F2010を会してLAN3000から、ネットワーク上に位置する別のコンピュータよりプリンタに入稿されるものとする。本発明において、入稿される文書データのデータフォーマットは本質とは異なるため、限定はしないが、例えばPDF((登録商標)Portable Document Format)等に対して適用することが出来る。
【0044】
プリンタに入稿されたデータを印刷するタイミングには、データを受け取った場合に即時に対応する場合、一時的に保持しユーザーの支持に基づいて開始をする場合などがある。本発明ではどちらに対しても適用することが出来る。
【0045】
例えば、プリンタに入稿されたデータは、ネットワークI/F2010から入力され、これを外部記憶装置109に保持される。これに対してユーザーが操作部2012等から印刷指示を行う事で印刷を行うものとする。
【0046】
あるいはここで、文書データを処理するべき処理設定を受信しても良い。
【0047】
<文書構成把握113>
受信した文書データには、文書データの構成が記載されている場合がある。これを解析することにより、処理するべきページ枚数を把握したりするための工程である。
【0048】
<処理ページ選択114>
処理を行うべきページを示すデータを選択するための工程である。文書構成把握113に基づいて処理を行うべきページのデータを特定し、次に示す印刷命令実行を行うための工程である。
【0049】
<印刷命令実行115>
処理ページ選択114で選択されたページに対して、画像データを形成する工程である。詳細については後述する。
【0050】
<処理継続判断116>
文書構成把握115で処理したページのほかに、処理するべきページが存在するかを判断するための工程である。もし処理するべきページがあれば、処理ページ選択114に戻り、新たな処理ページの選択処理を行う。
【0051】
処理するべきページがない場合は、処理を終了する(処理終了117)。
【0052】
ここで、印刷命令実行115について、図12を用いて更に詳細に説明を行う。印刷命令実行115は、印刷処理命令実行開始121、処理命令選択122、処理命令分岐123、描画処理124〜126、パス群DB登録127、処理継続判断128、終了処理129から構成される。
【0053】
<描画命令選択122>
印刷データにはどの描画命令の処理順序と処理方法が記述されたコンテンツデータが含まれている。この工程は、処理順序に従い、以降の工程で処理するべき描画命令を選択するための工程である。
【0054】
<描画命令分岐123>
描画命令選択122に基づいて、次に処理するべき工程を分岐するための工程である。ここでは、描画命令を、画像描画命令、テキスト描画命令、パス描画命令に分類している。
【0055】
<改良パス描画命令124A,124B>
これらは共通して、本発明での核となるアウトライン化されたテキストを好適に処理するための工程である。詳細は後述する。
【0056】
<画像描画命令125>
本工程は画像描画命令を実行するための工程である。画像描画命令とは、イメージと呼ばれる画像データを描画する命令である。文書データに格納する際に、イメージをDCT圧縮やMR・MH圧縮等を用いて圧縮し、サイズを縮小している場合もある。この場合は、画像を描画する際に展開を行う。
【0057】
<テキスト描画命令126>
本工程はテキスト描画命令を実行するための工程である。テキスト描画命令とは、文字を描画するための命令であり、使用するべきフォントの種別と、表示するべきサイズ、表示するべき文字列を指定する。
【0058】
<パス群DB登録処理127>
描画命令分岐123において、パス描画命令が使用されていた場合は本工程によってパス群DBに登録が成される。
【0059】
パス描画命令とは、パス点設定命令とパス塗潰し命令から構成される。パス点設定命令とは線の描画・塗りつぶしなどで処理を行う領域を指定するための処理である。一方、パス塗潰し命令とは、パス点設定命令によって指定されたパスに対して様々な描画命令を行う処理である。単純な1色での塗りつぶしだけではなく、グラデーションの指定、パターンの指定などができても良い。
【0060】
ここで、パス群DBにはパス点設定命令ならびにパス塗潰し命令が保持される。
【0061】
<処理継続判断128>
描画命令選択122で選択され、以上の工程で処理されてきた描画命令の他に処理するべき描画命令が存在するかを判断するための工程である。ここで描画するべき描画命令が残っている場合には、描画命令選択122に戻る。
【0062】
描画するべき描画命令がない場合には、処理を終了する(処理終了129)
次に、改良パス描画命令124A,124Bでの更に詳細について、図13を用いて説明を行う。改良パス描画命令は、改良パス描画命令開始131、パス群DB確認132、文字候補パス群抽出133、文字尤度算出134、文字尤度確認136、描画属性設定137,138、パス描画139、処理継続判断140、終了141から構成される。
【0063】
<パス群DB確認処理132>
今後処理するべきパス群がパス群DBに登録されているか否かを判定する工程である。パス群DBにデータが存在しない場合、処理を終了する(処理終了141)。
【0064】
パス群DBにデータが存在する場合、文字候補パス群抽出133を実行する。
【0065】
<文字候補パス群抽出処理133>
パス群DBに含まれるパスデータは文字単位ではない。本工程は、それらのパス群を文字単位にグルーピングするための工程である。
【0066】
まず、アウトライン化処理の例を図4に示す。元のテキスト描画命令401には、使用するフォント名称、描画する位置、描画するテキストの文字コードなどが含まれる。これを元にパス点設定命令402、404、パス塗潰し命令403、405に変換する。この例の場合では文字グリフが大きく二つに分けられている(402と404)。
【0067】
この402〜405で現れるパス描画命令を用いて、該パス描画命令がテキスト描画を行っていたものであるかを判定するのが本発明の趣旨である。
【0068】
ここで対象となるパス描画命令を図5に示す。この時点ではパス設定命令とパス塗潰し命令で構成される描画命令群であるため、テキストとして処理することができない。
【0069】
次にこのパス描画命令群のバウンダリボックスを求める。この結果を図6に示す。1つの文字が複数のパス描画命令とパス塗潰し命令の組合せによって描画される場合もある。この場合、(1)あるパス点設定命令のバウンダリボックス内に別のパス点設定命令のバウンダリボックスと重なりを有する場合には、それらを1つのパス群として認識する。(2)隣接するパス点設定命令と組み合わせた新しいバウンダリボックスが、縦横比が1に近い場合にはそれらを1つのパス群として認識する。
【0070】
図6の「ン」と「社」という字に注目したものが図7である。「ン」の場合、バウンダリボックス701に対して、バウンダリボックス702が重なりを有しているので、これらを1つの文字候補のパス群として認識する。一方、「社」の場合、703と704は隣接しており、これらを組み合わせたバウンダリボックス705の縦横比は1に近い。この場合も1つの文字候補のパス群として認識する。
【0071】
以上の作業を繰り返すことで、図8のように全てのパス点設定命令から、文字候補のパス群を抽出することが出来る。
【0072】
<文字尤度算出134>
本工程は、文字候補パス群抽出工程133によって決定された文字単位のパス群に対して文字らしさを示す文字尤度を算出する工程である。
【0073】
以降では、文字候補パス群の並びに注目した評価方法について、図9を用いて説明する。
【0074】
≪文字尤度の算出(文字の直線性)≫
日本語で使用される漢字・カタカナ・ひらがなを、文章を表示するために用いる場合にはそのグリフの中心座標があまりずれないという特徴がある。これに基づき、文字尤度算出を行うのが請求項2に記載した発明である。
【0075】
一連の文字候補パス群に対して、それぞれの中心座標を求める(901)。更にこれらの中心座標が別の文字候補パス群のものと一致するかを求める。この場合、ある程度の許容誤差を設けることが望ましい。一致した場合にこれらの中心座標の平均を新たな中心座標とする。これを繰り返すことで文字候補パスのうち直線状に位置するパス群を抽出することが出来、更にこれらの文字尤度を高めることで文字識別を高めることが出来る。
【0076】
しかしながらこの方法では、「ゃゅょ」のような拗音、「っ」のような促音、あるいは「ぁぃぅぇぉ」のような他の字よりも一回り小さな字体に対する識別が困難に成ってしまうという問題もある。こうした場合には、中心座標ではなく横書きの場合は下端の座標、あるいは縦書きの場合は右端の座標を元に算出する方法を用いても良い(902)。
【0077】
これを繰り返し、それぞれの文字候補パス群が文字である尤度を算出する事が出来る。
【0078】
<処理パス群選択135>
これ移行は実際に描画する処理となる。本工程は、パス群DBより描画するべきパスならびにパス群を選択する工程である。
【0079】
<文字尤度確認処理136>
本工程は、パスならびにパス群が有する文字尤度を元にどの描画属性を設定するかを判定するための工程である。
【0080】
単純な方法としては、ある閾値を設け、閾値未満であればパスとしての描画属性設定137を行い、閾値以上であれば文字としての描画属性設定138を行う。
【0081】
<パス描画属性設定137>
<テキスト描画属性設定138>
パスあるいはテキストとして描画を行う設定を、次に描画するパスオブジェクトに設定する。例えば使用するディザパターンやトナー載り量制限などの設定がある。
【0082】
<パス描画処理139>
本工程は、描画属性設定137,138で設定された描画属性を利用し、処理パス群選択工程で選択されたパスに対して、描画処理を行う工程である。
【0083】
<処理継続判断140>
処理パス群選択135で選択され、以上の工程で処理されてきたパス・パス群の他に処理するべきパス・パス群が存在するかを判断するための工程である。ここで処理するべきパス群が残っている場合には、処理パス群選択135に戻る。
【0084】
処理するべきパス群がない場合には、パス群DB初期化141を行う。
【0085】
<パス群DB初期化141>
本工程は、パス群DBに含まれる情報を初期化する。この際、使用していたパラメータなどを初期化しない方法をとっても良い。処理を終了する(処理終了141)
【実施例2】
【0086】
実施例2としては、文字尤度算出136で使用することの出来る、別の文字尤度算出方法について述べる。なお、それ以外の構成については、実施例1と同等であるためここでは省略する。
【0087】
≪文字尤度の算出(バウンダリボックスの縦横比)≫
日本語の文章で使用される漢字・カタカナ・ひらがなは、一部を除いては、その縦横比がほぼ1:1に近いという特性がある。また英語やひらがな・カタカナの場合繰り返し同じ文字が使用されるためにその縦横比の頻度を元に見つけやすいという特性がある。これらの特性に着目したのが、請求項3の発明である。
【0088】
漢字の場合「一」「二」等の一部の字を抜かせば、多くは正方形即ち縦横比1:1前後に近い形に収まる形状をしている。よって縦横比の頻度に基づいて漢字であるか否かを想定することが可能である。
【0089】
更にアルファベットの場合には、大文字・小文字など限られた文字の組み合わせて文章を構成するために、漢字などと比べて同じグリフの再利用性が高い。よって文字候補パス群のバウンダリ縦横比に対する頻度を導けば、そこから文字と思しき候補の選出が可能となる。
【0090】
特にこの発明は、文章主体の文書データに対して好適な効果を齎す。
【0091】
この例を図10を元に説明する。各文字候補パス群に対して、その高さと幅を算出する。ここから縦横比を求める。1001〜1008までの文字のうち、「ノ」を示す1003以外は全て高さ10、幅10で比率が1.0であるならば、これらのパス群は全て文字尤度の高いパス群として扱う。
【0092】
≪文字尤度の算出(バウンダリボックスのサイズ頻度解析)≫
一般的な新聞や週刊誌などを見ても明らかなように、出版物の文書の文字サイズは統一されている場合が多い。これに着目したのが請求項4の発明である。
【0093】
文字のバウンダリボックスサイズに対して頻度を求め、ある一定以上繰り返し出現するバウンダリボックスに対しては文字尤度を高く見積もることが可能である。
【0094】
特にこの発明は、文書フォーマットがある程度決まっている文書データに対して好適な効果を齎す。
【0095】
この例を図10を元に説明する。各文字候補パス群に対して、その高さと幅を算出する。ここで、それぞれの高さないし幅の頻度を求めると、高さは全て10px、幅は1つを除外して全て10となる。よってこの場合には、高さ10px、あるいは幅10pxのデータに関しては文字尤度の高いデータとして扱う。
【0096】
先ほどの1003のデータの場合には、高さは他のデータと同じであるが、幅が異なるため他のデータに比べて文字尤度を低く扱うようにする。
【0097】
≪文字尤度の算出(パス塗潰し命令の色情報)≫
文書に含まれる文字の色は、判読性の都合上、統一されている場合が多い。よってアウトライン化した結果得られたパス塗潰し命令の色情報に着目し、同じ色での塗りつぶしが実施されていた場合には、それらが元は同じ単語や文章に属していた可能性があるといえる。
【0098】
ここで同色と述べたが、例えば赤や青、緑などの色を文書中で目立たせるために用いる場合もあるので、これらを考慮して文字尤度を算出することも有効な手段の1つである。
【0099】
特にこの発明は、オフィス文書のような文章主体の文書データに対して好適な効果を齎す。
【0100】
≪文字尤度の算出(文字認識処理を含む)≫
対象となるパス群が文字という可能性が高くはないが、しかし文字ではないと決定付けることも困難であるような文字尤度であった場合においては、実際にその文字を描画し、文字認識処理を試みても良い。
【0101】
またこの結果を元に、このパス群が文字であるという前提を利用して該パスに関連する別のパス群の文字尤度を高く見積もっても良い。
【0102】
この場合、他の全ての描画命令を実行し、最終的な画像を作成してから文字認識処理を行うよりも計算量が小さくなるというメリットがある。対象とするべき文字候補パスのみを描画するため、処理時間も短くなり、また背景画像に伴うノイズが入らないために文字であるかどうかの識別性能の向上も見込める。
【0103】
≪文字尤度の算出(組合せ)≫
以上に示した算出方法は、組み合わせることで、より望ましい文字尤度の算出を試みる方法である。単純平均に基づくほか、加重平均を行ったりしても良い。
【図面の簡単な説明】
【0104】
【図1】本発明の画像形成方法を用いた画像形成処理を行うためのコンピュータ構成である
【図2】本発明を用いることのできる複合機のシステム構成である
【図3】本発明を用いることのできる複合機のハードウェア構成である
【図4】テキストのアウトライン化の一例である。
【図5】実施例1で説明に用いるアウトライン化されたテキストである。
【図6】図5に対してバウンダリボックスを抽出した結果である。
【図7】図6に対するグルーピングの一例である。
【図8】図6に対してパスのグルーピングを行った結果である。
【図9】図6に対し、中心線あるいは下線に基づく文字尤度算出の例である。
【図10】図6に対し、バウンダリボックスのサイズに基づいての文字尤度算出の例である。
【図11】本発明の実施例における、PDLインタプリタのフローチャートである。
【図12】本発明の実施例における、描画命令処理のフローチャートである。
【図13】本発明の実施例における、改良パス描画命令のフローチャートである。
【符号の説明】
【0105】
401 アウトライン化する前のテキスト描画命令
402-405 アウトライン化によって求められるパス描画命令(パス点設定命令・パス塗潰し命令)
901 パス群の中心線に基づく文字尤度算出の例
902 パス群の下端線に基づく文字尤度算出の例
【技術分野】
【0001】
本発明は、パス描画命令を含む文書データを処理する画像形成装置、画像形成方法に関するものである。
【背景技術】
【0002】
電子データを用いた入稿処理が広く利用されている。これはデータ作成者が自分で画像や文字の配置を自分のコンピュータ上で決定し、それをネットワークなどを介してデータ印刷者に送信する。データ印刷者はこれを元に印刷を行うものである。
【0003】
しかしこの場合、データの作成者と印刷者の間で環境に違いが生じると、望まれない印刷結果が生じる場合がある。その代表的な例がフォントの有無である。印刷者が有していないフォントが電子データに含まれる場合には、そのフォントに類似した別の代替フォントを使用しなければならなくなる。しかし、これにより作成者が意図したものと違う印刷結果となる場合がある。
【0004】
これを回避する1つの手段として、印刷者が有していないフォントに関しては、これをパスを描画する画像描画命令に置き換えるアウトライン処理がある。元の電子データでは、文字を描画する位置やサイズなどの描画属性情報と描画するべき文字を識別し実際に描画するテキスト描画命令によって、文字描画を行っていた。アウトライン処理とは、この描画属性情報と描画命令を利用し、テキスト描画命令をパス点設定命令とパス塗潰し命令に変換することである。
【0005】
これにより印刷者が有さないフォントを使用する印刷データであっても、パス描画命令として処理することで作成者の意図した結果に近い結果が得られる。
【0006】
又、アウトライン化する際にテキスト部分のエッジを抽出し、そのエッジ部分を強調する画像処理を行うものがある(特許文献1)。これを始めとして、従来はアウトライン化を行う際にトラッピング処理等を加えるのが一般的であった。
【特許文献1】特開平10−294863号公報
【発明の開示】
【発明が解決しようとする課題】
【0007】
しかし、従来はテキスト描画命令をパス描画命令に変換することで、該当個所が文字として描画されず、文字表示の為の最適な処理がなされないという問題があった。この最適な処理には、ヒンティング情報に基づいた線幅調整、あるいは文字用のディザパターンの使用等が含まれる。
【0008】
特許文献1は、アウトライン化する際にテキスト部分のエッジを抽出し、そのエッジ部分を強調する画像処理を行うものである。これを始めとして、従来はアウトライン化を行う際にトラッピング処理等を加えるのが一般的であった。しかしながら、アウトライン化する際に補正処理が適用されていない文書データが入稿される場合もある。また補正処理がそのデバイスに対して適切ではない可能性もある。そのためアウトライン化されたデータに対して補正を行う手段を検討する必要がある。
【課題を解決するための手段】
【0009】
課題を解決するために、本発明に基づく画像形成装置及び画像形成方法ならびに画像形成方法を実行するプログラムは、
パス描画命令の特徴に基づきグルーピング処理を行いパス群を生成する手段と、
パス群の特徴に基づき、該パスが文字であることの尤度を求める手段と、
尤度の高いパス群に対して、文字描画と同じ描画処理を実行する手段と
を有する。
【0010】
パス群の特徴に基づき該文字尤度を求める手段として、周辺のパス群が直線状に位置している場合に尤度が高いものと認識する手段を有していても良い。
【0011】
パス群の特徴に基づき該文字尤度を求める手段として、パス群のバウンダリボックスの縦横比がほぼ1あるいは外部のデータベース等により記録保持されている文字として識別するに適切な縦横比に基づいて尤度を決定する手段を有していても良い。
【0012】
パス群の特徴に基づき該文字尤度を求める手段として、パス群のバウンダリボックスの頻度を求め、高頻度であるバウンダリボックスのパス群は尤度が高いものと認識する手段を有していても良い。
【0013】
パス群の特徴に基づき該文字尤度を求める手段として、パス群が描画される色が隣接するパス群のものと同一である場合に尤度が高いものと認識する手段とを有していても良い。
【0014】
パス群の特徴に基づき該文字尤度を求める手段として、尤度が一定以下のものに関してはパス描画命令を実行し、さらにそのパス描画命令に対して文字認識処理を行い、尤度を決定する手段を有していても良い。
【0015】
以上に示した文字尤度を求める手段の少なくとも2つ以上を組み合わせて尤度を求める手段を有しても良い。
【発明の効果】
【0016】
請求項1の発明によれば、画像形成処理を行っている際に、処理を行っているパス描画命令が、アウトライン化された文字描画命令に由来するか否かを判定することが可能となる。アウトライン化された文字描画命令であれば、文字描画と同じ描画設定を行う事で最適な処理を用いることができる。
【0017】
請求項2の発明によれば、特に横書き・縦書きで記載された文章データを含むデータに対する文字識別度をより高くすることが出来る。
【0018】
請求項3の発明によれば、文字毎の縦横幅が一定に近い漢字やハングル、アルファベットのように文字毎の縦横比が異なる文字グリフに対する文字識別度をより高くすることができる。
【0019】
請求項4の発明によれば、同じ大きさの文字が繰り返し使用されるようなデータに対する文字識別度をより高くすることが出来る。
【0020】
請求項5の発明によれば、文字が描画される色が統一的であるようなデータに対する文字識別度をより高くすることが出来る。
【0021】
請求項6の発明によれば、文字であるか否かの判定が難しい場合には、その文字を実際に描画し、文字認識処理によって文字か否かを判定することで、全データを処理するよりも短い時間で文字識別処理を実行できる。
【0022】
請求項7の発明によれば、以上の発明を組み合わせて、統合的な判断に基づいた文字識別処理を実施することが出来る。
【発明を実施するための最良の形態】
【0023】
次に、本発明の詳細を実施例の記述に従って説明する。
【0024】
<コンピュータ構成>
図1は、本発明の実施の形態例に係るシステムのコンピュータの構成図の例を示している。101はCPU、すなわち中央処理装置であり、装置全体の制御及び演算処理等を行う。103はROMすなわち読み出し専用メモリであり、システム起動プログラム、基本I/Oプログラム、及び文字コードをビットパターンに変換するための文字パターンデータ(フォントデータ)等を記憶している。
【0025】
102はRAMすなわちランダムアクセスメモリであり、CPU101の演算に使用するデータや演算結果、表示のために文字コードから変換された文字パターンデータ列や図形データ、イメージデータ等を一時記憶する。
【0026】
106はKBDC、すなわちキーボード制御部であり、107はKB、すなわちキーボードよりキー入力データ(文字コードや制御コード)を受け取り、CPU101へ伝達する。104はDSPC、すなわちディスプレイ制御部であり、RAM102に格納された文字パターンデータ列を読み出し、DSP105に転送する。105はDSP、すなわちディスプレイ装置であり、DSPC104より文字パターンデータ列、図形データ、イメージデータを受け取り、表示画面に表示する。
【0027】
108はDSKC、すなわちディスク制御部であり、外部記憶装置109に対するアクセス制御を行う。109はハードディスク装置である。HDには、文字パターンデータ(フォントデータ)やフォントデータを読み出してビットマップデータに変換する文字展開処理プログラム、図形データを処理する図形展開処理プログラム、イメージデータを処理するイメージデータ処理プログラム等を記憶している。
【0028】
110はNIC、すなわちネットワークインタフェイスカードであり、ネットワーク201と接続し他の機器と情報交換を行う。201はネットワークであり、多数のコンピュータがネットワークインタフェイスを利用して接続するイントラネットのようなコンピュータネットワークを意味する。
【0029】
<プリンタ構成例>
図2は、本実施例における複合機の主要部構成を示すブロック図である。
【0030】
コントローラユニット2000は、画像入力デバイスであるスキャナ2070や画像出力デバイスであるプリンタ2095を接続し、スキャナ2070で読み取られた画像データをプリンタ2095により印刷出力するコピー機能を実現するための制御を行う。また、同時にコントローラユニット2000はLAN3000や公衆回線3001(WAN)に接続することによって、画像情報やデバイス情報の入出力を行うための制御も行う。
【0031】
コントローラユニット2000は、具体的には、CPU2001を有し、CPU2001は、ROM2003に格納されているブートプログラムによりオペレーションシステム(OS)を立ち上る。このOS上でHDD(ハードディスクドライブ)2004に格納されているアプリケーションプログラムを実行することによって各種処理を実行する。このCPU2001の作業領域としてはRAM2002が用いられる。RAM2002は、作業領域とともに、画像データを一時記憶するための画像メモリ領域を提供する。HDD2004は、上記アプリケーションプログラムとともに、画像データを格納する。
【0032】
CPU2001には、システムバス2007を介して、ROM2003およびRAM2002が接続されている。また、CPU2001にはその他に操作部I/F(操作部インタフェース)2006、ネットワークI/F(ネットワークインタフェース)2010、モデム2050およびイメージバスI/F(イメージインタフェース)2005も接続されている。
【0033】
操作部I/F2006は、タッチパネルを有する操作部2012とのインターフェースであり、操作部2012に表示する画像データを操作部2012に対して出力する。また、操作部I/F2006は、操作部2012においてユーザにより入力された情報をCPU2001に送出する。
【0034】
次に、ネットワークI/F2010は、LAN3000に接続され、LAN3000を介してLAN3000上の各装置との間で情報の入出力を行う。モデム2050は、公衆回線3001に接続され、公衆回線3001を介して情報の入出力を行う。
【0035】
イメージバスI/F2005は、システムバス2007と画像データを高速で転送する画像バス2008を接続し、データ構造を変換するためのバスブリッジである。画像バス2008は、PCIバスまたはIEEE1394から構成される。画像バス2008上には、RIP2060、デバイスI/F2020、スキャナ画像処理部2080、プリンタ画像処理部2090、画像回転部2030、サムネイル作成部2035および画像圧縮部2040が設けられている。RIP2060は、ラスタイメージプロセッサであり、PDLコードをビットマップイメージに展開するプロセッサである。デバイスI/F2020には、スキャナ2070およびプリンタ2095が接続され、デバイスI/F2020は、画像データの同期系/非同期系の変換を行う。スキャナ画像処理部2080は、入力画像データに対し補正、加工、編集を行う。プリンタ画像処理部2090は、プリント出力画像データに対してプリンタの補正、解像度変換などを行う。画像回転部2030は、画像データの回転を行う。画像圧縮部2040は、多値画像データをJPEGデータに、2値画像データをJBIG、MMR、MHなどのデータに圧縮するとともに、その伸張処理を行う。
【0036】
図3は図2の複写機のリーダ部2070およびプリンタ部2095のハードウェア構成を模式的に示す図である。
【0037】
リーダ部2070とプリンタ部2095とは、図3に示すように、一体的に構成されている。リーダ部2070は、原稿給紙ユニット9250を搭載し、原稿給紙ユニット9250は、原稿を先頭から順に1枚ずつプラテンガラス9211上へ給送。各原稿の読取動作が終了する毎にその原稿をプラテンガラス9211から排出トレイ(図示せず)に排出する。リーダ部2070は、原稿がプラテンガラス9211上に給送されると、ランプ9212を点灯し、移動ユニット9213の移動を開始する。この移動ユニット9213の移動によりプラテンガラス9211上の原稿に対する読取走査が行われる。この読取走査中、原稿からの反射光は、各ミラー9214,9215,9216およびレンズ9217を経てCCDイメージセンサ(以下、CCDという)9218に導かれ、原稿上の画像がCCD9218の撮像面上に結像される。CCD9218は、撮像面に結像された画像を電気信号に変換し、この電気信号は所定の処理施された後に制御装置9110に入力される。
【0038】
プリンタ部2095は、レーザドライバ9321を有し、レーザドライバ9321は、制御装置9110から入力された画像データに基づきレーザ発光部9322を駆動する。これにより、レーザ発光部9322からは画像データに応じたレーザ光が発光され、このレーザ光は走査されながら感光ドラム9323上に照射される。感光ドラム9323上には、照射されたレーザ光により静電潜像が形成され、この静電潜像は現像器9324から供給されたトナーによりトナー像として可視像化される。レーザ光の照射タイミングに同期して、各カセット9311,9312から記録紙が搬送路を介して感光ドラム9323と転写部9325との間に給紙され、感光ドラム9323上のトナー像は転写部9325により給紙された記録紙上に転写される。
【0039】
トナー像が転写された記録紙は搬送ベルトを介して定着ローラ対(加熱ローラと加圧ローラ)9326に送られ、定着ローラ対9326は、記録紙を熱圧し、記録紙上のトナー像を記録紙上に定着させる。この定着ローラ対9326を通過した記録紙は、排紙ローラ対9327により排紙ユニット9330に排紙される。排紙ユニット9330は、ソート、ステイプルなどの後処理を施すことが可能なシート処理装置からなる。また、両面記録モードが設定されている場合には、記録紙を排紙ローラ対9327まで搬送した後に、排紙ローラ対9327の回転方向を逆転させ、フラッパ9328によって再給紙搬送路9329へ導く。再給紙搬送路9329に導かれた記録紙は、上述したタイミングで感光ドラム9323と転写部9325との間に再給紙され、この記録紙の裏面にトナー像が転写される。
【実施例1】
【0040】
実施例1は本発明を適用した好適な例を記載する。
【0041】
PDL処理の基本的な流れは、処理開始111、データ受信112、文書構成把握113、処理ページ選択114、印刷命令実行115、処理継続判断116、処理終了117の各工程から構成される。
【0042】
<データ受信112>
印刷に用いる文書データを外部あるいは内部から受け取るための工程である。
【0043】
文書データは、ネットワークI/F2010を会してLAN3000から、ネットワーク上に位置する別のコンピュータよりプリンタに入稿されるものとする。本発明において、入稿される文書データのデータフォーマットは本質とは異なるため、限定はしないが、例えばPDF((登録商標)Portable Document Format)等に対して適用することが出来る。
【0044】
プリンタに入稿されたデータを印刷するタイミングには、データを受け取った場合に即時に対応する場合、一時的に保持しユーザーの支持に基づいて開始をする場合などがある。本発明ではどちらに対しても適用することが出来る。
【0045】
例えば、プリンタに入稿されたデータは、ネットワークI/F2010から入力され、これを外部記憶装置109に保持される。これに対してユーザーが操作部2012等から印刷指示を行う事で印刷を行うものとする。
【0046】
あるいはここで、文書データを処理するべき処理設定を受信しても良い。
【0047】
<文書構成把握113>
受信した文書データには、文書データの構成が記載されている場合がある。これを解析することにより、処理するべきページ枚数を把握したりするための工程である。
【0048】
<処理ページ選択114>
処理を行うべきページを示すデータを選択するための工程である。文書構成把握113に基づいて処理を行うべきページのデータを特定し、次に示す印刷命令実行を行うための工程である。
【0049】
<印刷命令実行115>
処理ページ選択114で選択されたページに対して、画像データを形成する工程である。詳細については後述する。
【0050】
<処理継続判断116>
文書構成把握115で処理したページのほかに、処理するべきページが存在するかを判断するための工程である。もし処理するべきページがあれば、処理ページ選択114に戻り、新たな処理ページの選択処理を行う。
【0051】
処理するべきページがない場合は、処理を終了する(処理終了117)。
【0052】
ここで、印刷命令実行115について、図12を用いて更に詳細に説明を行う。印刷命令実行115は、印刷処理命令実行開始121、処理命令選択122、処理命令分岐123、描画処理124〜126、パス群DB登録127、処理継続判断128、終了処理129から構成される。
【0053】
<描画命令選択122>
印刷データにはどの描画命令の処理順序と処理方法が記述されたコンテンツデータが含まれている。この工程は、処理順序に従い、以降の工程で処理するべき描画命令を選択するための工程である。
【0054】
<描画命令分岐123>
描画命令選択122に基づいて、次に処理するべき工程を分岐するための工程である。ここでは、描画命令を、画像描画命令、テキスト描画命令、パス描画命令に分類している。
【0055】
<改良パス描画命令124A,124B>
これらは共通して、本発明での核となるアウトライン化されたテキストを好適に処理するための工程である。詳細は後述する。
【0056】
<画像描画命令125>
本工程は画像描画命令を実行するための工程である。画像描画命令とは、イメージと呼ばれる画像データを描画する命令である。文書データに格納する際に、イメージをDCT圧縮やMR・MH圧縮等を用いて圧縮し、サイズを縮小している場合もある。この場合は、画像を描画する際に展開を行う。
【0057】
<テキスト描画命令126>
本工程はテキスト描画命令を実行するための工程である。テキスト描画命令とは、文字を描画するための命令であり、使用するべきフォントの種別と、表示するべきサイズ、表示するべき文字列を指定する。
【0058】
<パス群DB登録処理127>
描画命令分岐123において、パス描画命令が使用されていた場合は本工程によってパス群DBに登録が成される。
【0059】
パス描画命令とは、パス点設定命令とパス塗潰し命令から構成される。パス点設定命令とは線の描画・塗りつぶしなどで処理を行う領域を指定するための処理である。一方、パス塗潰し命令とは、パス点設定命令によって指定されたパスに対して様々な描画命令を行う処理である。単純な1色での塗りつぶしだけではなく、グラデーションの指定、パターンの指定などができても良い。
【0060】
ここで、パス群DBにはパス点設定命令ならびにパス塗潰し命令が保持される。
【0061】
<処理継続判断128>
描画命令選択122で選択され、以上の工程で処理されてきた描画命令の他に処理するべき描画命令が存在するかを判断するための工程である。ここで描画するべき描画命令が残っている場合には、描画命令選択122に戻る。
【0062】
描画するべき描画命令がない場合には、処理を終了する(処理終了129)
次に、改良パス描画命令124A,124Bでの更に詳細について、図13を用いて説明を行う。改良パス描画命令は、改良パス描画命令開始131、パス群DB確認132、文字候補パス群抽出133、文字尤度算出134、文字尤度確認136、描画属性設定137,138、パス描画139、処理継続判断140、終了141から構成される。
【0063】
<パス群DB確認処理132>
今後処理するべきパス群がパス群DBに登録されているか否かを判定する工程である。パス群DBにデータが存在しない場合、処理を終了する(処理終了141)。
【0064】
パス群DBにデータが存在する場合、文字候補パス群抽出133を実行する。
【0065】
<文字候補パス群抽出処理133>
パス群DBに含まれるパスデータは文字単位ではない。本工程は、それらのパス群を文字単位にグルーピングするための工程である。
【0066】
まず、アウトライン化処理の例を図4に示す。元のテキスト描画命令401には、使用するフォント名称、描画する位置、描画するテキストの文字コードなどが含まれる。これを元にパス点設定命令402、404、パス塗潰し命令403、405に変換する。この例の場合では文字グリフが大きく二つに分けられている(402と404)。
【0067】
この402〜405で現れるパス描画命令を用いて、該パス描画命令がテキスト描画を行っていたものであるかを判定するのが本発明の趣旨である。
【0068】
ここで対象となるパス描画命令を図5に示す。この時点ではパス設定命令とパス塗潰し命令で構成される描画命令群であるため、テキストとして処理することができない。
【0069】
次にこのパス描画命令群のバウンダリボックスを求める。この結果を図6に示す。1つの文字が複数のパス描画命令とパス塗潰し命令の組合せによって描画される場合もある。この場合、(1)あるパス点設定命令のバウンダリボックス内に別のパス点設定命令のバウンダリボックスと重なりを有する場合には、それらを1つのパス群として認識する。(2)隣接するパス点設定命令と組み合わせた新しいバウンダリボックスが、縦横比が1に近い場合にはそれらを1つのパス群として認識する。
【0070】
図6の「ン」と「社」という字に注目したものが図7である。「ン」の場合、バウンダリボックス701に対して、バウンダリボックス702が重なりを有しているので、これらを1つの文字候補のパス群として認識する。一方、「社」の場合、703と704は隣接しており、これらを組み合わせたバウンダリボックス705の縦横比は1に近い。この場合も1つの文字候補のパス群として認識する。
【0071】
以上の作業を繰り返すことで、図8のように全てのパス点設定命令から、文字候補のパス群を抽出することが出来る。
【0072】
<文字尤度算出134>
本工程は、文字候補パス群抽出工程133によって決定された文字単位のパス群に対して文字らしさを示す文字尤度を算出する工程である。
【0073】
以降では、文字候補パス群の並びに注目した評価方法について、図9を用いて説明する。
【0074】
≪文字尤度の算出(文字の直線性)≫
日本語で使用される漢字・カタカナ・ひらがなを、文章を表示するために用いる場合にはそのグリフの中心座標があまりずれないという特徴がある。これに基づき、文字尤度算出を行うのが請求項2に記載した発明である。
【0075】
一連の文字候補パス群に対して、それぞれの中心座標を求める(901)。更にこれらの中心座標が別の文字候補パス群のものと一致するかを求める。この場合、ある程度の許容誤差を設けることが望ましい。一致した場合にこれらの中心座標の平均を新たな中心座標とする。これを繰り返すことで文字候補パスのうち直線状に位置するパス群を抽出することが出来、更にこれらの文字尤度を高めることで文字識別を高めることが出来る。
【0076】
しかしながらこの方法では、「ゃゅょ」のような拗音、「っ」のような促音、あるいは「ぁぃぅぇぉ」のような他の字よりも一回り小さな字体に対する識別が困難に成ってしまうという問題もある。こうした場合には、中心座標ではなく横書きの場合は下端の座標、あるいは縦書きの場合は右端の座標を元に算出する方法を用いても良い(902)。
【0077】
これを繰り返し、それぞれの文字候補パス群が文字である尤度を算出する事が出来る。
【0078】
<処理パス群選択135>
これ移行は実際に描画する処理となる。本工程は、パス群DBより描画するべきパスならびにパス群を選択する工程である。
【0079】
<文字尤度確認処理136>
本工程は、パスならびにパス群が有する文字尤度を元にどの描画属性を設定するかを判定するための工程である。
【0080】
単純な方法としては、ある閾値を設け、閾値未満であればパスとしての描画属性設定137を行い、閾値以上であれば文字としての描画属性設定138を行う。
【0081】
<パス描画属性設定137>
<テキスト描画属性設定138>
パスあるいはテキストとして描画を行う設定を、次に描画するパスオブジェクトに設定する。例えば使用するディザパターンやトナー載り量制限などの設定がある。
【0082】
<パス描画処理139>
本工程は、描画属性設定137,138で設定された描画属性を利用し、処理パス群選択工程で選択されたパスに対して、描画処理を行う工程である。
【0083】
<処理継続判断140>
処理パス群選択135で選択され、以上の工程で処理されてきたパス・パス群の他に処理するべきパス・パス群が存在するかを判断するための工程である。ここで処理するべきパス群が残っている場合には、処理パス群選択135に戻る。
【0084】
処理するべきパス群がない場合には、パス群DB初期化141を行う。
【0085】
<パス群DB初期化141>
本工程は、パス群DBに含まれる情報を初期化する。この際、使用していたパラメータなどを初期化しない方法をとっても良い。処理を終了する(処理終了141)
【実施例2】
【0086】
実施例2としては、文字尤度算出136で使用することの出来る、別の文字尤度算出方法について述べる。なお、それ以外の構成については、実施例1と同等であるためここでは省略する。
【0087】
≪文字尤度の算出(バウンダリボックスの縦横比)≫
日本語の文章で使用される漢字・カタカナ・ひらがなは、一部を除いては、その縦横比がほぼ1:1に近いという特性がある。また英語やひらがな・カタカナの場合繰り返し同じ文字が使用されるためにその縦横比の頻度を元に見つけやすいという特性がある。これらの特性に着目したのが、請求項3の発明である。
【0088】
漢字の場合「一」「二」等の一部の字を抜かせば、多くは正方形即ち縦横比1:1前後に近い形に収まる形状をしている。よって縦横比の頻度に基づいて漢字であるか否かを想定することが可能である。
【0089】
更にアルファベットの場合には、大文字・小文字など限られた文字の組み合わせて文章を構成するために、漢字などと比べて同じグリフの再利用性が高い。よって文字候補パス群のバウンダリ縦横比に対する頻度を導けば、そこから文字と思しき候補の選出が可能となる。
【0090】
特にこの発明は、文章主体の文書データに対して好適な効果を齎す。
【0091】
この例を図10を元に説明する。各文字候補パス群に対して、その高さと幅を算出する。ここから縦横比を求める。1001〜1008までの文字のうち、「ノ」を示す1003以外は全て高さ10、幅10で比率が1.0であるならば、これらのパス群は全て文字尤度の高いパス群として扱う。
【0092】
≪文字尤度の算出(バウンダリボックスのサイズ頻度解析)≫
一般的な新聞や週刊誌などを見ても明らかなように、出版物の文書の文字サイズは統一されている場合が多い。これに着目したのが請求項4の発明である。
【0093】
文字のバウンダリボックスサイズに対して頻度を求め、ある一定以上繰り返し出現するバウンダリボックスに対しては文字尤度を高く見積もることが可能である。
【0094】
特にこの発明は、文書フォーマットがある程度決まっている文書データに対して好適な効果を齎す。
【0095】
この例を図10を元に説明する。各文字候補パス群に対して、その高さと幅を算出する。ここで、それぞれの高さないし幅の頻度を求めると、高さは全て10px、幅は1つを除外して全て10となる。よってこの場合には、高さ10px、あるいは幅10pxのデータに関しては文字尤度の高いデータとして扱う。
【0096】
先ほどの1003のデータの場合には、高さは他のデータと同じであるが、幅が異なるため他のデータに比べて文字尤度を低く扱うようにする。
【0097】
≪文字尤度の算出(パス塗潰し命令の色情報)≫
文書に含まれる文字の色は、判読性の都合上、統一されている場合が多い。よってアウトライン化した結果得られたパス塗潰し命令の色情報に着目し、同じ色での塗りつぶしが実施されていた場合には、それらが元は同じ単語や文章に属していた可能性があるといえる。
【0098】
ここで同色と述べたが、例えば赤や青、緑などの色を文書中で目立たせるために用いる場合もあるので、これらを考慮して文字尤度を算出することも有効な手段の1つである。
【0099】
特にこの発明は、オフィス文書のような文章主体の文書データに対して好適な効果を齎す。
【0100】
≪文字尤度の算出(文字認識処理を含む)≫
対象となるパス群が文字という可能性が高くはないが、しかし文字ではないと決定付けることも困難であるような文字尤度であった場合においては、実際にその文字を描画し、文字認識処理を試みても良い。
【0101】
またこの結果を元に、このパス群が文字であるという前提を利用して該パスに関連する別のパス群の文字尤度を高く見積もっても良い。
【0102】
この場合、他の全ての描画命令を実行し、最終的な画像を作成してから文字認識処理を行うよりも計算量が小さくなるというメリットがある。対象とするべき文字候補パスのみを描画するため、処理時間も短くなり、また背景画像に伴うノイズが入らないために文字であるかどうかの識別性能の向上も見込める。
【0103】
≪文字尤度の算出(組合せ)≫
以上に示した算出方法は、組み合わせることで、より望ましい文字尤度の算出を試みる方法である。単純平均に基づくほか、加重平均を行ったりしても良い。
【図面の簡単な説明】
【0104】
【図1】本発明の画像形成方法を用いた画像形成処理を行うためのコンピュータ構成である
【図2】本発明を用いることのできる複合機のシステム構成である
【図3】本発明を用いることのできる複合機のハードウェア構成である
【図4】テキストのアウトライン化の一例である。
【図5】実施例1で説明に用いるアウトライン化されたテキストである。
【図6】図5に対してバウンダリボックスを抽出した結果である。
【図7】図6に対するグルーピングの一例である。
【図8】図6に対してパスのグルーピングを行った結果である。
【図9】図6に対し、中心線あるいは下線に基づく文字尤度算出の例である。
【図10】図6に対し、バウンダリボックスのサイズに基づいての文字尤度算出の例である。
【図11】本発明の実施例における、PDLインタプリタのフローチャートである。
【図12】本発明の実施例における、描画命令処理のフローチャートである。
【図13】本発明の実施例における、改良パス描画命令のフローチャートである。
【符号の説明】
【0105】
401 アウトライン化する前のテキスト描画命令
402-405 アウトライン化によって求められるパス描画命令(パス点設定命令・パス塗潰し命令)
901 パス群の中心線に基づく文字尤度算出の例
902 パス群の下端線に基づく文字尤度算出の例
【特許請求の範囲】
【請求項1】
パス描画命令を含む文書データファイルを処理する画像形成装置において、
パス描画命令の特徴に基づきグルーピング処理を行いパス群を生成する手段と、
パス群の特徴に基づき、該パスが文字であることの尤度を求める手段と、
尤度の高いパス群に対して、文字描画と同じ描画処理を実行する手段と
を有する画像形成装置。
【請求項2】
パス群の特徴に基づき該文字尤度を求める手段として、パス群が直線状に位置している場合に尤度が高いものと認識する手段を有する
ことを特徴とする請求項1に記載の画像形成装置。
【請求項3】
パス群の特徴に基づき該文字尤度を求める手段として、パス群のバウンダリボックスの縦横比がほぼ1である、あるいはいずれかの方法によって既知である文字縦横比基準に近い場合には尤度が高いものと認識する手段を有することを特徴とする請求項1に記載の画像形成装置。
【請求項4】
パス群の特徴に基づき該文字尤度を求める手段として、パス群のバウンダリボックスの縦、横のいずれかすくなくとも1つの頻度を求め、高頻度であるバウンダリボックスのパス群は尤度が高いものと認識する手段を有する
ことを特徴とする請求項1に記載の画像形成装置。
【請求項5】
パス群の特徴に基づき該文字尤度を求める手段として、パス群が描画される色が隣接するパス群のものと同一である場合に尤度が高いものと認識する手段とを有することを特徴とする請求項1に記載の画像形成装置。
【請求項6】
パス群の特徴に基づき該文字尤度を求める手段として、尤度がある閾値範囲に含まれるものに関してはパス描画命令を実行して画像を作成し、かつその画像に対して文字認識処理を行い、尤度を決定する手段を有する
ことを特徴とする請求項1に記載の画像形成装置
【請求項7】
請求項2〜請求項6のいずれかに記載の尤度決定手段の少なくとも2つ以上を組み合わせて尤度を求める手段を有する
ことを特徴とする画像形成装置。
【請求項1】
パス描画命令を含む文書データファイルを処理する画像形成装置において、
パス描画命令の特徴に基づきグルーピング処理を行いパス群を生成する手段と、
パス群の特徴に基づき、該パスが文字であることの尤度を求める手段と、
尤度の高いパス群に対して、文字描画と同じ描画処理を実行する手段と
を有する画像形成装置。
【請求項2】
パス群の特徴に基づき該文字尤度を求める手段として、パス群が直線状に位置している場合に尤度が高いものと認識する手段を有する
ことを特徴とする請求項1に記載の画像形成装置。
【請求項3】
パス群の特徴に基づき該文字尤度を求める手段として、パス群のバウンダリボックスの縦横比がほぼ1である、あるいはいずれかの方法によって既知である文字縦横比基準に近い場合には尤度が高いものと認識する手段を有することを特徴とする請求項1に記載の画像形成装置。
【請求項4】
パス群の特徴に基づき該文字尤度を求める手段として、パス群のバウンダリボックスの縦、横のいずれかすくなくとも1つの頻度を求め、高頻度であるバウンダリボックスのパス群は尤度が高いものと認識する手段を有する
ことを特徴とする請求項1に記載の画像形成装置。
【請求項5】
パス群の特徴に基づき該文字尤度を求める手段として、パス群が描画される色が隣接するパス群のものと同一である場合に尤度が高いものと認識する手段とを有することを特徴とする請求項1に記載の画像形成装置。
【請求項6】
パス群の特徴に基づき該文字尤度を求める手段として、尤度がある閾値範囲に含まれるものに関してはパス描画命令を実行して画像を作成し、かつその画像に対して文字認識処理を行い、尤度を決定する手段を有する
ことを特徴とする請求項1に記載の画像形成装置
【請求項7】
請求項2〜請求項6のいずれかに記載の尤度決定手段の少なくとも2つ以上を組み合わせて尤度を求める手段を有する
ことを特徴とする画像形成装置。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【公開番号】特開2010−26986(P2010−26986A)
【公開日】平成22年2月4日(2010.2.4)
【国際特許分類】
【出願番号】特願2008−190997(P2008−190997)
【出願日】平成20年7月24日(2008.7.24)
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】
【公開日】平成22年2月4日(2010.2.4)
【国際特許分類】
【出願日】平成20年7月24日(2008.7.24)
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】
[ Back to top ]