画像処理装置、画像変換方法、およびコンピュータプログラム

【課題】文字の形状を良好に保ちつつデータ量の少ないベクタ画像を生成する。
【解決手段】ラスタ形式のイメージデータに含まれる文字を抽出するラベリング部１０２と、抽出した文字の複雑さを示す複雑度を求める複雑度算出部１０３と、求めた複雑度に基づいて、その文字の変換に曲線近似を用いるか否かを決定する近似方法決定部１０４と、を設けておき、曲線近似を用いると決定した場合は、その文字の輪郭の各部分をそれぞれ直線近似しまたは曲線近似することによってその文字をベクタ形式に変換し、曲線近似を用いないと判定した場合は、その文字の輪郭の各部分を曲線近似することなく直線近似することによってその文字をベクタ形式に変換する。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、スキャナで読み取った画像データをベクタ形式に変換する画像処理装置およびその変換方法などに関する。
【背景技術】
【０００２】
近年、紙の文書をスキャナで読み取って電子化して保管することが多く行われている。スキャナで読み取られた文書は、例えばビットマップ形式の画像データとして保存される。
【０００３】
ビットマップ形式では、ドット（ピクセル）の集合で文字を表現するので、その文字を表示しまたは印刷する際に複雑な計算を必要としない。しかし、ビットマップ形式の画像データが示す画像を表示しまたは印刷する装置（出力装置）の解像度によっては、表示しまたは印刷した文字の輪郭にジャギー（がたつき）が目立ってしまうという欠点がある。
【０００４】
そこで、従来、アウトライン化と呼ばれる処理を施すことによってビットマップ形式の画像をベクタフォントの画像（ベクタ画像）に変換することが行われている。
【０００５】
ベクタ画像では、文字の輪郭を直線および曲線で近似することによって輪郭線を形成し、その輪郭線で囲まれた領域を塗りつぶすことによってその文字を再現するので、ジャギーが目立ちにくくなる。また、出力結果が出力装置の解像度に依存しないので、出力装置が変わっても文字の部分の画質が安定しやすい。しかし、ベクタ画像において文字の形状をできるだけ正確に再現しかつ滑らかに表現するためには、文字の輪郭を再現するための点（輪郭点）を多くする必要がある。よって、文字の部分の画質の維持のために、データ量が大幅に増えてしまうことがある。
【０００６】
従来、ベクタ画像に関連する技術として、特許文献１に開示されるような画像処理装置が提案されている。
【０００７】
特許文献１の画像処理装置によると、原稿を読み取って得たイメージ情報を、文字のサイズ、字体、および色などの属性に基づいて分割し、分割したイメージ情報ごとにアウトライン化する。
【特許文献１】特開２００７―１２９５５７号公報
【発明の開示】
【発明が解決しようとする課題】
【０００８】
ところで、既に説明したように、ベクタ画像への変換を行うと画像データ全体のデータ量が増えることがある。特に、複雑な形状の文字は輪郭点の個数が多くなるので、そのような文字を多く含む画像データの場合はデータ量の増加が顕著に現れる。そこで輪郭点の個数を減らすことも考えられるが、そうすると文字の形状が変わってしまう恐れがあるので、そのような方法は好ましくない。
【０００９】
本発明はこのような問題点に鑑み、文字の形状を良好に保ちつつ従来よりもデータ量の少ないベクタ画像を生成できるようにすることを目的とする。
【課題を解決するための手段】
【００１０】
本発明の一形態に係る画像処理装置は、ラスタ形式のイメージデータに含まれる文字を抽出する文字抽出手段と、前記文字の複雑さを示す複雑度を求める複雑度算出手段と、前記複雑度算出手段によって求められた前記複雑度に基づいて、前記文字をラスタ形式からベクタ形式に変換する際に曲線近似を用いるか否かを判定する判定手段と、前記判定手段が曲線近似を用いると判定した場合は、前記文字の輪郭の各部分をそれぞれ直線近似しまたは曲線近似することによって当該文字をベクタ形式に変換し、曲線近似を用いないと判定した場合は、当該文字の輪郭の各部分を曲線近似することなく直線近似することによって当該文字をベクタ形式に変換する、画像変換手段と、を有する。
【００１１】
好ましくは、前記判定手段は、前記複雑度算出手段が求めた前記複雑度が所定の複雑さよりも複雑であることを示す値である場合に、曲線近似を用いないと判定する。
【００１２】
または、前記複雑度算出手段は、前記文字のエッジを形成する画素であるエッジ画素の個数に基づいて前記複雑度を求める。
【００１３】
または、前記複雑度は、前記エッジ画素の個数である。
【００１４】
または、前記複雑度は、前記文字の大きさを示す値に対する前記エッジ画素の個数の割合である。
【発明の効果】
【００１５】
本発明によると、文字の形状を良好に保ちつつ従来よりもデータ量の少ないベクタ画像を生成することができる。
【発明を実施するための最良の形態】
【００１６】
図１は本発明の一実施形態に係る画像形成装置１のハードウェア構成の例を示す図である。
【００１７】
図１に示す画像形成装置１は、コピー、スキャナ、ファクシミリ、ネットワークプリンティング、ドキュメントサーバ、およびファイル転送などの様々な機能を集約した画像処理装置である。複合機またはＭＦＰ（Multi Function Peripherals）などと呼ばれることもある。
【００１８】
画像形成装置１は、図１に示すように、スキャナ１０ａ、ＣＰＵ１０ｂ、ハードディスク１０ｃ、ＲＡＭ１０ｄ、ＲＯＭ１０ｅ、印刷装置１０ｆ、モデム１０ｇ、ネットワークインタフェース１０ｈ、制御用回路１０ｋ、および操作パネル１０ｍなどによって構成される。
【００１９】
スキャナ１０ａは、原稿の用紙（以下、単に「原稿」と記載する。）に描かれている写真、文字、絵、図表などの画像を光学的に読み取って電子データ化する装置である。読み取られた画像は、ＲＧＢ（Ｒ（赤）、Ｇ（緑）、およびＢ（青））によって表されるビットマップなどの形式の画像データとして保存される。予め指定しておくことによって、ＰＤＦ（Portable Document Format）の形式で保存することもできる。
【００２０】
ＣＰＵ１０ｂは、スキャナ１０ａが読み取った原稿の画像データをＴＩＦＦ、ＪＰＥＧ、ビットマップ、およびＰＤＦなどの形式のファイルに変換するための処理を行う。また、ビットマップ形式（ラスタ形式）の画像データをベクタ形式に変換する処理を行う。ユーザからの入力の検出、操作パネル１０ｍの表示の制御，または電子メールの作成など、画像形成装置１の全体的な制御も行う。
【００２１】
印刷装置１０ｆは、スキャナ１０ａで読み取られた画像データの画像または他の装置から送信されてきた画像データの画像を用紙に印刷する装置である。画像形成装置１がカラー印刷に対応している場合は、イエロー、マゼンタ、シアン、およびブラックの４色のトナーを用いて印刷を行う。
【００２２】
操作パネル１０ｍは、ユーザが画像形成装置１に対して種々の入力を行うための装置である。ユーザは、操作パネル１０ｍを用いて、画像データの保存形式の選択、スキャンの条件の設定、処理の開始または実行の指令の入力、電子メールの宛先の入力などの種々の操作を行うことができる。
【００２３】
モデム１０ｇは、ＮＣＵ（Network Control Unit）が内蔵されており、アナログの公衆回線を介して他のファクシミリ端末と接続し、ファクシミリプロトコルに基づくデータ制御およびファクシミリデータの変復調などを行う。
【００２４】
ネットワークインタフェース１０ｈは、ＮＩＣ（Network Interface Card）であって、ＬＡＮまたはインターネットなどを介して他の装置への接続を行う。
【００２５】
制御用回路１０ｋは、ハードディスク１０ｃ、操作パネル１０ｍ、スキャナ１０ａ、印刷装置１０ｆ、モデム１０ｇ、およびネットワークインタフェース１０ｈなどの装置を制御するための回路である。
【００２６】
ハードディスク１０ｃには、後に説明する図２に示すような各部の機能を実現するためのプログラムおよびデータなどが格納されている。これらは必要に応じてＲＡＭ１０ｄに読み出され、ＣＰＵ１０ｂによってプログラムが実行される。これらのプログラムまたはデータの一部または全部を、ＲＯＭ１０ｅに記憶させておいてもよい。または、図２の機能の一部または全部を、制御用回路１０ｋによって実現するようにしてもよい。
【００２７】
図２は画像形成装置１の機能的構成の例を示す図、図３は画像形成装置１における画像処理の流れを説明するための図である。
【００２８】
次に、文字および写真を含む画像が印刷された原稿ＧＫをスキャナ１０ａで読み取って得られるラスタ形式の原稿画像データＧＤを、ＰＤＦ形式のファイルに変換して保存する際の画像形成装置１の各部の処理について、図２および図３を参照しながら説明する。
【００２９】
図２に示すように、画像形成装置１は、画像データ取得部１１、文字非文字分離部１２、背景分離部１３、アウトライン化部１４、圧縮データ生成部１５、ファイル生成部１６、およびファイル保存部１７などによって構成される。
【００３０】
ユーザが原稿ＧＫをスキャナ１０ａにセットし、保存形式をＰＤＦに設定してスキャンの実行のコマンドを入力すると、スキャナ１０ａは、その原稿ＧＫの画像をスキャンし、ラスタ形式の原稿画像データＧＤを生成する（図３の＃１０１）。
【００３１】
画像データ取得部１１は、その原稿画像データＧＤを取得する（＃１０２）。文字非文字分離部１２は、原稿画像データＧＤに含まれる文字と、図、写真、または表などの文字意外のオブジェクトである非文字オブジェクトＨＯとを分離する処理を行う（＃１０３）。この処理は、公知の方法を用いて行う。
【００３２】
以下、原稿画像データＧＤから非文字オブジェクトＨＯが省かれた画像データを「第一文字画像データＭＧ」と記載する。原稿画像データＧＤから文字が省かれた画像データを「非文字画像データＨＧ」と記載する。
【００３３】
背景分離部１３は、第一文字画像データＭＧに表される文字とその背景とを分離する処理を行う（＃１０４）。この処理は、例えば、濃度値が所定の濃度値以上である画素を、文字を形成する画素として抽出することによって行う。または、エッジを形成する画素を、文字を形成する画素として抽出することによって行う。
【００３４】
以下、第一文字画像データＭＧから背景を省いた画像データを「第二文字画像データＮＧ」と記載する。第一文字画像データＭＧから文字を省いた画像データを「背景画像データＫＧ」と記載する。
【００３５】
アウトライン化部１４は、第二文字画像データＮＧに表される各文字に対してアウトライン化の処理を施し、ラスタ形式で表される各文字をベクタ形式に変換する処理を行う（＃１０５）。これについては、後に詳しく説明する。以下、第二文字画像データＮＧに対してこのアウトライン化の処理が施されてできる画像データを「ベクタ文字画像データＶＤ」と記載する。
【００３６】
圧縮データ生成部１５は、ベクタ文字画像データＶＤ、背景画像データＫＧ、および非文字画像データＨＧのそれぞれについての圧縮データを生成する（＃１０６）。
【００３７】
具体的には、ベクタ文字画像データＶＤをＦＬＡＴＥなどの可逆圧縮の方式で圧縮する。背景画像データＫＧおよび非文字画像データＨＧに対しては低解像度化したあと、ＪＰＥＧなどの非可逆圧縮の方式で圧縮する。
【００３８】
ファイル生成部１６は、生成された、ベクタ文字画像データＶＤ、背景画像データＫＧ、および非文字画像データＨＧのそれぞれの圧縮データを用いてＰＤＦ形式のファイル（ＰＤＦファイル）を生成する。ファイル保存部１７は、生成されたＰＤＦファイルを保存する（＃１０７）。
【００３９】
図４はアウトライン化部１４の構成の例を示す図、図５は二値化された画像データに表される文字の例を示す図、図６は文字のエッジを示す画像の例を示す図、図７は文字の輪郭を形成する頂点画素を検出するための画素の配置パターンＴＰを示す図、図８は頂点画素の検出の具体例を示す図、図９は直線近似の具体例を示す図、図１０は選択曲線近似処理の具体例を示す図、図１１は二値文字画像データＮＤに示される文字の例を示す図、図１２は近似処理済ブロックデータＫＭＤの構成の例を示す図、図１３は近似処理済ブロックデータＫＭＤの例を示す図である。
【００４０】
アウトライン化部１４は、二値化部１０１、ラベリング部１０２、複雑度算出部１０３、近似方法決定部１０４、頂点検出部１０５、直線近似処理部１０６、および曲線近似処理部１０７などによって構成される。
【００４１】
二値化部１０１は、第二文字画像データＮＧを二値化する。二値化することによって、二値化の閾値よりも濃度値の高い画素がドットが打たれた画素（黒画素）となり、その閾値よりも濃度値の低い画素がドットが打たれていない画素（白画素）となる。これによって、第二文字画像データＮＧの文字の部分が、図５（ａ）に示すように黒画素によって表される。以下、第二文字画像データＮＧを二値化することによって得られた画像データを「二値文字画像データＮＤ」と記載する。
【００４２】
ラベリング部１０２は、二値文字画像データＮＤに示される文字ごとにラベリングを行う。この処理は次のようにして行う。
【００４３】
二値文字画像データＮＤに含まれる連結する黒画素である黒画素郡を検出し、その黒画素郡を包含する矩形の領域であるブロックＢＫを定義する。この際、所定の距離内にある黒画素群同士を一つの文字を形成する黒画素群とみなし、各黒画素群を包含するブロックＢＫ同士を統合して一つのブロックＢＫとする。そのような処理を行うことによって、図５（ｂ）に示すようなブロックＢＫ１、ＢＫ２、…を定義する。以下、ブロックＢＫ１、ＢＫ２、…を「ブロックＢＫ」と総称して記載することがある。他の装置または部材などについても同様に符号の末尾に付した連番またはアルファベットを省略することによって総称して記載することがある。なお、ブロックＢＫは、二値文字画像データＮＤの左上端の画素の位置を原点として、そのブロックＢＫの左上端および右下端の画素の座標によって定義される。左上端の画素の座標によってそのブロックＢＫの文字の位置が特定され、左上端および右下端の画素の座標によってそのブロックＢＫの縦の長さおよび横の長さ、すなわちそのブロックＢＫの大きさが特定される。本実施形態において、ブロックＢＫのサイズは、そのブロックＢＫに含まれる文字の大きさとして使用する。
【００４４】
複雑度算出部１０３は、ラベリングされた各文字のそれぞれについて、その文字の複雑さを示す複雑度を求める処理を行う。この処理は次のようにして行う。なお、ここでは、ブロックＢＫ１を例にあげて説明する。
【００４５】
公知のエッジ検出フィルタを用いて、ブロックＢＫ１内に示される文字のエッジの画素（エッジ画素）を検出する。それによって、図６に示すような、「八」の文字のエッジを示す画像が得られる。検出したエッジ画素の個数を数え、その個数をその「八」の文字の複雑度として記憶する。
【００４６】
近似方法決定部１０４は、ラベリングされた各文字について、それぞれの文字に対して求められた複雑度に基づいてその文字の輪郭に対する近似方法を次のようにして決定する。
【００４７】
その文字がある程度複雑であると判断できる場合、すなわちその文字の複雑度が所定の閾値（複雑さ判定閾値）よりも大きい場合は、その文字の輪郭を曲線近似を用いることなく直線近似すると決定する。その文字がさほど複雑ではないと判断できる場合、すなわちその文字の複雑度が複雑さ判定閾値以下である場合は、その文字の輪郭を直線近似に加えて曲線近似も用いて近似すると決定する。
【００４８】
頂点検出部１０５は、各ブロックＢＫ内の文字の頂点（変化点）の画素（頂点画素）を検出する。この検出の処理は、図７に示す、頂点画素の検出に用いる白画素と黒画素の配置のパターン（配置パターン）である頂点検出パターンＰＴ１〜ＰＴ８を用いて行う。すなわち、パターンマッチングによってこれら頂点検出パターンＰＴ１〜ＰＴ８のいずれかと一致するブロックＢＫ内の箇所を探索し、一致した箇所の画素のうちでその一致した頂点検出パターンＰＴの頂点位置Ｔに位置する画素を頂点画素として検出する。ここで、図８を参照しながら頂点画素の検出の処理について具体的に説明する。
【００４９】
図８（ａ）には、二値文字画像データＮＤに含まれる「八」の文字を包含するブロックＢＫ１が示される。図８（ｂ）には、ブロックＢＫ内の特定の部分（特定部分ＡＲ１）の拡大図が示される。
【００５０】
この特定部分ＡＲ１に着目して、特定部分ＡＲ１内を左上から順に走査すると、画素群ＡＨの箇所において、頂点検出パターンＰＴ１と一致する配置パターンが検出される。その画素群ＡＨにおいて、その頂点検出パターンＰＴ１の頂点位置Ｔに位置する画素ＧＳ２２が頂点画素として検出される。同様にして頂点画素の検出を行うと、画素ＧＳ２３、ＧＳ４３、ＧＳ５３、ＧＳ１８、およびＧＳ２８が頂点画素として検出される。
【００５１】
検出された頂点画素を線分で結ぶことによって図５（ｃ）に示すような「八」の文字の輪郭を示す画像を生成できる。
【００５２】
直線近似処理部１０６は、二値文字画像データＮＤに含まれる各文字の輪郭を直線近似する。本実施形態では、３つ以上の頂点によって形成される文字の輪郭を２つの頂点を結ぶ線分（近似線分）によって直線近似する。そのような直線近似を文字の輪郭の全体に渡って行う。ここで、直線近似の手順について、図９を参照して具体的に説明する。
【００５３】
図９（ａ）には、「八」の文字の輪郭を示す画像が示される。この画像は、頂点検出部１０５によって求められた頂点画素の中心を線分で結ぶことによって描かれる。図９（ｂ）には、図９（ａ）の輪郭を示す画像の特定の部分（特定部分ＡＲ２）の拡大図が示される。
【００５４】
特定部分ＡＲ２において、まず、任意の頂点を始点として選択する。ここでは、頂点Ｐ１を始点として選択したものとする。始点Ｐ１と始点Ｐ１から２つ隣の頂点Ｐ３を近似線分の終点の候補（終点候補）として選択する。始点Ｐ１と終点候補の頂点（終点候補点）Ｐ３とを結ぶ線分と、始点Ｐ１と終点候補点Ｐ３との間にある頂点である頂点Ｐ２との距離を求める。求めた距離が所定の閾値（直線近似閾値）よりも短いか否かをチェックする。短い場合は、終点候補を次の頂点Ｐ４に移して同様の処理を行う。すなわち、始点Ｐ１と終点候補点Ｐ４とを結ぶ線分と、始点Ｐ１と終点候補点Ｐ４との間にある各頂点である頂点Ｐ２およびＰ３のそれぞれとの距離を求める。求めた各距離が所定の閾値（直線近似閾値）よりも短いか否かをチェックする。いずれの距離も直線近似閾値よりも短い場合は、終点候補をさらに次の頂点である頂点Ｐ５に移して同様の処理を行う。
【００５５】
始点と終点候補点とを結ぶ線分と、始点とその終点候補の頂点との間にある各頂点との距離のいずれかが直線近似閾値よりも長くなるような終点候補が現れるまで、終点候補を、順次、次の頂点に移していく。そのいずれかの距離が直線近似閾値以上になった時点で近似線分の終点を決定する。図９（ｂ）の例では、終点候補が頂点Ｐ５となったときに、始点Ｐ１と終点候補点Ｐ５とを結ぶ線分と頂点Ｐ２との距離が直線近似閾値よりも長くなるものとする。
【００５６】
頂点候補が頂点Ｐ５に移ると、同様にして、始点Ｐ１と終点候補点Ｐ５とを結ぶ線分と、始点Ｐ１と終点候補点Ｐ５との間にある各頂点との距離を求める。その線分と頂点Ｐ２との距離は直線近似閾値よりも長いので、この時点で頂点Ｐ１を始点とする近似線分の終点を決定する。終点は、その時点の終点候補の一つ手前の頂点に決定する。図９（ｂ）の例では、終点候補点Ｐ５の一つ手前の頂点Ｐ４を終点として決定する。そして、頂点Ｐ１、Ｐ２、Ｐ３、およびＰ４によって形成される輪郭が、図９（ｃ）に示すような始点Ｐ１と終点Ｐ４とを結ぶ線分Ｓ１４で近似されるように、頂点Ｐ１および頂点Ｐ４をそれぞれ始点および終点として記録しておく。
【００５７】
終点が決まると、その終点を次の近似線分の始点として、当該次の近似線分を求める処理を行う。すなわち、頂点Ｐ４を始点とし、その２つ隣の頂点である頂点Ｐ６を終点候補として、それらを結ぶ線分と、それら始点Ｐ４と終点候補点Ｐ６との間にある各頂点との距離を求める。以下、既に説明した方法と同様にして、終点候補を移していき、終点を決定する。同様の処理を繰り返し、文字の輪郭の全部について近似線分の始点および終点を求める。
【００５８】
直線近似処理部１０６は、上記のような方法で、ラベリングによって検出された全てのブロックＢＫの文字の輪郭を直線近似し、直線近似が行われたあとの文字を示す近似処理済ブロックデータＫＭＤをブロックＢＫごとに出力する。近似処理済ブロックデータＫＭＤの詳細については後で説明する。
【００５９】
曲線近似処理部１０７は、文字の輪郭を直線近似に加えて曲線近似も用いて近似すると決定されたブロックＢＫに含まれる文字の輪郭のうちで所定の条件を満たす部分を曲線近似する処理（選択曲線近似処理）を行う。曲線近似は、近似処理済ブロックデータＫＭＤに示される直線近似が施された後の文字の輪郭に対して行う。
【００６０】
本実施形態では、文字の輪郭を形成する近似線分のうちの隣り合う２つの近似線分に着目し、それら２つの近似線分が次の（１）および（２）の条件をともに満たす場合に、それら２つの近似線分によって表される輪郭をベジェ曲線で近似する。
（１）２つの近似線分の両方が所定の長さ（曲線近似閾値）よりも短い。
（２）２つの近似線分の接点にできる小さいほうの角度（判定対象角度）が所定の角度（近似閾値角度）よりも大きい。
【００６１】
ここで、選択曲線近似処理について図１０を参照しながら具体的に説明する。
【００６２】
図１０（ａ）には、近似線分Ｓ１〜Ｓ５によって形成される、「八」の文字の特定部分ＡＲ２における輪郭が示される。図１０（ａ）の例では、判定対象角度Ｋ４、Ｋ１２、およびＫ１６が近似閾値角度よりも大きく、判定対象角度Ｋ１３が近似閾値角度よりも小さいものとする。また、近似線分Ｓ１、Ｓ２、Ｓ３、およびＳ４の長さは、曲線近似閾値よりも短く、近似線分Ｓ５は、曲線近似閾値よりも長いものとする。
【００６３】
図１０（ａ）において、近似線分Ｓ１とＳ２とに着目すると、これらの近似線分Ｓ１およびＳ２はいずれも曲線近似閾値よりも短いので上記の（１）の条件を満たす。また、判定対象角度Ｋ４は、近似閾値角度よりも大きいので上記の（２）の条件も満たす。すなわち、近似線分Ｓ１およびＳ２は上記の（１）および（２）の条件をともに満たすので、これらの近似線分の輪郭に対して曲線近似を行う。曲線近似は、例えば、次のようにして行う。
【００６４】
近似線分Ｓ１の中点Ｃ１および近似線分Ｓ２の中点Ｃ２を求める。それら中点Ｃ１およびＣ２をそれぞれ始端点および終端点とし、所定のルールに従ってさらに別の２つの制御点を決めて、図１０（ｂ）に示すようなベジェ曲線ＢＣ１を求める。２つの制御点は、中点Ｃ１において近似線分Ｓ１に接しかつ中点Ｃ２において近似線分Ｓ２に接するベジェ曲線が描かれる点とする。例えば、頂点Ｐ４と中点Ｃ１との中点および頂点Ｐ４と中点Ｃ２との中点としてもよい。また、そのベジェ曲線がＰ４とできるだけ近くなるような点としてもよい。
【００６５】
次に、近似線分Ｓ２およびＳ３に着目する。これらについても上述の（１）および（２）の条件をともに満たすので、これらの近似線分の輪郭に対して同様の方法で曲線近似を行う。
【００６６】
次に、近似線分Ｓ３およびＳ４に着目する。これらの近似線分の判定対象角度Ｋ１３は、近似閾値角度よりも小さい。よって、上記の（２）の条件を満たさないので、これらの近似線分の組合せに対しては曲線近似は行わない。
【００６７】
次に、近似線分Ｓ４およびＳ５に着目する。近似線分Ｓ５は曲線近似閾値よりも長いので、上記の（１）の条件を満たさない。よって、これらの近似線分の組合せに対しては曲線近似は行わない。
【００６８】
隣り合う近似線分の各組合せに対してこのような処理を行い、上記の（１）および（２）の条件を満たす組合せに対して曲線近似を行っていく。図１０（ａ）の例の場合は、このような処理によって、図１０（ｂ）に示すような輪郭が得られる。
【００６９】
曲線近似処理部１０７は、このような方法で、直線近似処理部１０６から取得した全ての近似処理済ブロックデータＫＭＤの示される文字の輪郭に対して選択曲線近似処理を行い、近似処理済ブロックデータＫＭＤを、選択曲線近似処理が行われた後の文字を示すデータに更新する。さらに、ラベリングされた各文字の近似処理済ブロックデータＫＭＤを用いて、それらの文字を示すベクタ形式の画像データであるベクタ文字画像データＶＤを生成する。そして、そのベクタ文字画像データＶＤを圧縮データ生成部１５に出力する。ここで、近似処理済ブロックデータＫＭＤの詳細を図１１〜図１３を参照しながら説明する。
【００７０】
図１１には、「Ｌ」の文字を含む画像の例が示される。この「Ｌ」の文字の輪郭は、頂点Ａ、Ｂ、Ｃ、Ｄ、Ｅ、およびＦのそれぞれを結ぶ近似線分によって表される。この画像の左上端を原点とする各頂点Ａ、Ｂ、Ｃ、Ｄ、Ｅ、およびＦの座標は、図１１に示すとおりである。
【００７１】
図１１に示すこのブロックＢＫの近似処理済ブロックデータＫＭＤには、図１２に示すように、そのブロックＢＫの近似処理済ブロックデータＫＭＤの始まりを示す符号（ｑ）、倍率と精度、基準点の座標、頂点Ａ〜頂点Ｇの頂点データＴＤ、そのブロックＢＫの右下端の点（ブロック終端点）の座標、およびそのブロックＢＫの近似処理済ブロックデータＫＭＤの終りを示す符号（Ｑ）などが含まれる。基準点は、そのブロックＢＫの左上端の点である。
【００７２】
頂点データＴＤには、図１２（ｂ）に示すように、その頂点が直線近似による線分の終点である場合に、基準点を原点とするその頂点の座標および直線近似を表す符号の「Ｓ」が示される。
【００７３】
例えば、頂点Ｃの頂点データＴＤｃには、「２０，９８０，Ｓ」が示される。「Ｓ」は、直線近似を意味するので、頂点Ｃの直前の頂点である頂点Ｂと頂点Ｃとを結ぶ近似線分によって文字の輪郭を近似することを意味する。すなわち、基準点を原点とした場合の座標が（２０，０）の頂点Ｂおよび（２０，９８０）の頂点Ｃを結ぶ近似線分によって輪郭を描画して再現することを意味する。
【００７４】
一方、曲線近似の場合は、頂点データＴＤには、図１２（ｃ）に示すように、２つの制御点の座標、終端点の座標、および曲線近似を意味する符号の「Ｃ」が示される。図１２（ｂ）の例の場合は、基準点を原点とした（５，２０）および（１０，２０）の座標の点を制御点とし、（２０，５）の座標の点を終端点とし、この頂点データＴＤの頂点の直前の点（直前の近似方法が直線近似である場合は直前の近似線分の終点、直前の近似方法が曲線近似である場合は直前のベジェ曲線の終端点）を始端点としてベジェ曲線を求めることによって文字の輪郭を近似することを意味する。
【００７５】
図１３（ａ）には、直線近似が行われて生成されたあるブロックＢＫの近似処理済ブロックデータＫＭＤが示される。この近似処理済ブロックデータＫＭＤによって再現される文字の輪郭に対してさらに選択曲線近似処理を行うと、近似処理済ブロックデータＫＭＤが図１３（ｂ）のように更新される。図１３（ｂ）において、下線で示される箇所が曲線近似によって表される輪郭の部分の頂点の頂点データＴＤである。この図１３の例から分かるように、曲線近似を行うと、頂点データＴＤのデータ量が多くなることによって近似処理済ブロックデータＫＭＤの全体のデータ量が多くなる。
【００７６】
図１４はスキャンした画像データをＰＤＦファイルに変換する際の画像形成装置１の全体的な処理の流れを説明するためのフローチャート、図１５はアウトライン化の処理の流れを説明するためのフローチャート、図１６は比較的複雑な形状の文字および比較的単純な形状の文字に対して本実施形態のアウトライン化の処理を行った場合の結果の例を示す図である。
【００７７】
図１４において、ユーザは、スキャナ１０ａに原稿ＧＫをセットし、保存形式としてＰＤＦファイルを指定する。ユーザがスキャンの実行のコマンドを入力すると、画像形成装置１は、その原稿ＧＫをスキャンし（＃２０１）、その原稿ＧＫの画像を示すラスタ形式の原稿画像データＧＤを生成する（＃２０２）。画像形成装置１は、生成したラスタ形式の原稿画像データＧＤを用いて、以下のようにしてＰＤＦファイルを生成する。
【００７８】
原稿画像データＧＤにおける、文字の部分と非文字オブジェクトＨＯの部分とを抽出する（＃２０３）。非文字オブジェクトＨＯが除かれた、その抽出された文字を表す第一文字画像データＭＧから背景を除去する（＃２０４）。背景が除去された、その抽出された文字を表す第二文字画像データＮＧに対して本実施形態に係るアウトライン化の処理を施す（＃２０５）。
【００７９】
アウトライン化の処理において、第二文字画像データＮＧを二値化する（図１５の＃３０１）。二値化によって得られた二値文字画像データＮＤに対してラベリングの処理を行い、それに含まれる各文字を包含する各ブロックＢＫを求める（＃３０２）。ラベリングした各文字について、ベクタ形式への変換の際の近似方法を決定する。この決定は、次のようにして行う。
【００８０】
ラベリングされた文字を一つ選択する（＃３０３）。その文字（選択文字）の複雑度を求める（＃３０４）。その複雑度が複雑さ判定閾値よりも大きいか否かをチェックする。
【００８１】
選択文字の複雑度が複雑さ判定閾値よりも大きい場合は（＃３０５でＹｅｓ）、その選択文字に対して曲線近似の処理は行わないと決定する（＃３０６）。
【００８２】
選択文字の複雑度が複雑さ判定閾値よりも大きくない場合は（＃３０５でＮｏ）、その選択文字に対して曲線近似の処理を行うと決定する（＃３０７）。
【００８３】
ラベリングした全ての文字に対してステップ＃３０３〜３０７の処理を行う（＃３０８でＮｏ）。
【００８４】
ラベリングした全ての文字に対してステップ＃３０３〜３０７の処理が完了すると（＃３０８でＹｅｓ）、各文字の頂点を検出し（＃３０９）、文字の輪郭を特定する（＃３１０）。さらに、各文字の輪郭を直線近似する（＃３１１）。
【００８５】
ステップ＃３０７において曲線近似の処理を行うと決定した文字に対しては、直線近似の後、既に説明した選択曲線近似処理を行う（＃３１２）。
【００８６】
以上の処理によって第二文字画像データＮＧをラスタ形式からベクタ形式に変換し、それによって生成されるベクタ形式のベクタ文字画像データＶＤを保存する（＃３１３）。
【００８７】
すなわち、ステップ＃２０５のアウトライン化の処理では、比較的複雑な形状の文字は、曲線近似を用いることなく直線近似のみによって輪郭を近似する。これによって、図１６（ａ）に示すように、比較的複雑な形状の文字の輪郭が直線によって表される。比較的単純な形状の文字は、直線近似および曲線近似によって輪郭を近似する。これによって、図１６（ｂ）に示すように、比較的単純な形状の文字の輪郭が直線および曲線によって描かれる。
【００８８】
保存したベクタ文字画像データＶＤを可逆圧縮の方式で圧縮し、背景画像データＫＧおよび非文字オブジェクトＨＯの画像は、低解像度化した後、非可逆圧縮の方式で圧縮する（図１４の＃２０６）。そして、それぞれの圧縮データを用いてＰＤＦファイルを生成する（＃２０７）。
【００８９】
図１７は比較的単純な形状の文字に対して本実施形態のアウトライン化の処理を行った結果の例を示す図、図１８は比較的複雑な形状の文字に対して本実施形態のアウトライン化の処理を行った結果の例を示す図、図１９は文字の大きさと複雑さ判定閾値との関係を示す図である。
【００９０】
図１７（ａ）および図１８（ａ）には、各文字を直線近似した場合の例が示される。図１７（ｂ）および図１８（ｂ）には、それぞれ、その直線近似された図１７（ａ）および図１８（ａ）の各文字の輪郭に対して選択曲線近似処理を行った場合の例が示される。
【００９１】
図１７（ａ）を見て分かるように、曲線近似を用いることなく直線近似のみで文字の輪郭を近似すると、文字の輪郭のカーブの部分に角が生じて文字が角張ってしまう。そうすすると、文字の形が不自然に見えてしまう。１７（ａ）に示すような比較的単純な形状の文字の場合に、その不自然さが特に顕著に現れることによって画質の劣化が目立つ。そこで、このような直線近似された文字の輪郭に対して選択曲線近似処理を行う。すると、図１７（ｂ）に示すように、より自然な輪郭を得ることができる。
【００９２】
しかし、図１８（ａ）と図１８（ｂ）とを比較して分かるように、文字の形状が比較的複雑な場合は、曲線近似を用いた場合も用いなかった場合も、見た目にさほど大きな差は現れない。従って、画質の劣化を低減するためには、特に形状が単純な文字に対して曲線近似を用いることが好ましいと言える。
【００９３】
本実施形態によると、直線近似と曲線近似との近似の結果にほとんど差がでないような形状が複雑な文字に対しては、近似後のデータ量が大きくなる曲線近似を用いない。よって、形状が複雑な文字に対しても無条件に曲線近似を用いる従来の方法と比べて、近似の処理の後のデータ量を減らすことができる。さらに、計算量の多い曲線近似の処理を好適に減らすことができるので処理の効率を高めることができる。また、直線近似をした場合に輪郭の角ばり具合が目立つような比較的単純な形状の文字に対しては曲線近似を用いるので、従来の方法と比べてほとんど画質を劣化させることなく上述の効果を奏することができる。
【００９４】
本実施形態では、複雑度を、ブロックＢＫ内のエッジ画素の個数としたが、ブロックＢＫの大きさ（縦の長さ×横の長さ）、すなわちブロックＢＫ内の画素の総数に対するエッジ画素の個数の割合としてもよい。または、複雑度として、文字の周囲長（輪郭線の長さ）を用いてもよい。
【００９５】
本実施形態では、複雑さ判定閾値として文字の大きさによらず１つの値を用いたが、文字の大きさによって値が変わるようにしてもよい。その場合は、例えば、図１９に示すように、文字のサイズが大きくなるほど複雑さ判定閾値が大きくなるような、文字の大きさと複雑さ判定閾値との関係を定義しておく。図１９の例では、横軸が文字の大きさ（ポイント）を示し縦軸が複雑さ判定閾値を示す。近似方法決定部１０４によって近似方法を決定する際には、近似方法を決定する対象の文字の大きさに対応する複雑さ判定閾値を図１９の関係に基づいて求め、その複雑さ判定閾値を用いて既に説明した方法で近似方法を決定する。形状が比較的複雑な文字の場合は、その文字を直線近似しても、図１８を参照して説明したように、輪郭の角ばりは目立ちにくい。しかし、そのような複雑な形状の文字であっても、文字のサイズが大きくなると、文字のサイズが小さい場合よりもその角ばりが目立ってくる。よって、上述のように、文字のサイズが大きくなるほど複雑さ判定閾値が大きくなるように定めておくことによって、複雑な形状の文字であっても、角ばりが目立つと判断できるほど文字のサイズが大きい場合には、適切に曲線近似が用いられるようになる。それによって、そのような角ばりの発生を抑えることができる。
【００９６】
本実施形態では、スキャナ１０ａによってスキャンした画像データを用いたが、ネットワークインタフェース１０ｈによって他の装置から受信した画像データを用いてもよい。
【００９７】
本実施形態では、二値化部１０１において濃度値に基づいて二値化を行ったが、明度に基づいて行うようにしてもよい。その場合は、例えば、明度が所定の閾値よりも高い画素を白画素とし、低い画素を黒画素とする。
【００９８】
また、図２または図４の各部の機能の一部をハードウェアによって実現してもよい。例えば、入力画像処理部および出力画像処理部などのハードウェアを画像形成装置１に設けておく。入力画像処理部は、スキャナ１０ａから原稿画像データＧＤを受け付け、それに対して、色変換、色補正、解像度変換、領域判別などの処理を行う。出力画像処理部は、スクリーン制御、スムージング処理、およびＰＷＭ制御などを行う。処理された後のデータは、ハードディスク１０ｃ、ＲＡＭ１０ｄ、またはＲＯＭ１０ｅなどに保存する。
【００９９】
なお、直線近似および曲線近似の方法は、本実施形態で説明した方法に限られるものではなく、その他種々の方法を用いることができる。
【０１００】
また、文字のエッジは、画素１個分の幅であってもよいし、２個以上の幅であってもよい。
【０１０１】
その他、画像形成装置１の全体または各部の構成、機能、処理の内容または順序、各データが示す内容などは、本発明の趣旨に沿って適宜変更することができる。
【図面の簡単な説明】
【０１０２】
【図１】本発明の一実施形態に係る画像形成装置のハードウェア構成の例を示す図である。
【図２】画像形成装置の機能的構成の例を示す図である。
【図３】画像形成装置における画像処理の流れを説明するための図である。
【図４】アウトライン化部の構成の例を示す図である。
【図５】二値化された画像データに表される文字の例を示す図である。
【図６】文字のエッジを示す画像の例を示す図である。
【図７】文字の輪郭を形成する頂点画素を検出するための画素の配置パターンを示す図である。
【図８】頂点画素の検出の具体例を示す図である。
【図９】直線近似の具体例を示す図である。
【図１０】選択曲線近似処理の具体例を示す図である。
【図１１】二値文字画像データに示される文字の例を示す図である。
【図１２】近似処理済ブロックデータの構成の例を示す図である。
【図１３】近似処理済ブロックデータの例を示す図である。
【図１４】スキャンした画像データをＰＤＦファイルに変換する際の画像形成装置の全体的な処理の流れを説明するためのフローチャートである。
【図１５】アウトライン化の処理の流れを説明するためのフローチャートである。
【図１６】比較的複雑な形状の文字および比較的単純な形状の文字に対して本実施形態のアウトライン化の処理を行った場合の結果の例を示す図である。
【図１７】比較的単純な形状の文字に対して本実施形態のアウトライン化の処理を行った結果の例を示す図である。
【図１８】比較的複雑な形状の文字に対して本実施形態のアウトライン化の処理を行った結果の例を示す図である。
【図１９】文字の大きさと複雑さ判定閾値との関係を示す図である。
【符号の説明】
【０１０３】
１画像形成装置（画像処理装置、コンピュータ）
１２文字非文字分離部（文字抽出手段）
１３背景分離部（文字抽出手段）
１５圧縮データ生成部（圧縮手段）
１０２ラベリング部（文字抽出手段）
１０３複雑度算出部（複雑度算出手段）
１０４近似方法決定部（判定手段）
１０６直線近似処理部（画像変換手段）
１０７曲線近似処理部（画像変換手段）
ＧＤ原稿画像データ（イメージデータ）
ＮＧ第二文字画像データＮＧ（イメージデータ）

【特許請求の範囲】
【請求項１】
ラスタ形式のイメージデータに含まれる文字を抽出する文字抽出手段と、
前記文字の複雑さを示す複雑度を求める複雑度算出手段と、
前記複雑度算出手段によって求められた前記複雑度に基づいて、前記文字をラスタ形式からベクタ形式に変換する際に曲線近似を用いるか否かを判定する判定手段と、
前記判定手段が曲線近似を用いると判定した場合は、前記文字の輪郭の各部分をそれぞれ直線近似しまたは曲線近似することによって当該文字をベクタ形式に変換し、曲線近似を用いないと判定した場合は、当該文字の輪郭の各部分を曲線近似することなく直線近似することによって当該文字をベクタ形式に変換する、画像変換手段と、
を有することを特徴とする画像処理装置。
【請求項２】
前記判定手段は、前記複雑度算出手段が求めた前記複雑度が所定の複雑さよりも複雑であることを示す値である場合に、曲線近似を用いないと判定する、
請求項１記載の画像処理装置。
【請求項３】
前記複雑度算出手段は、前記文字のエッジを形成する画素であるエッジ画素の個数に基づいて前記複雑度を求める、
請求項１または２に記載の画像処理装置。
【請求項４】
前記複雑度は、前記エッジ画素の個数である、
請求項３記載の画像形成装置。
【請求項５】
前記複雑度は、前記文字の大きさを示す値に対する前記エッジ画素の個数の割合である、
請求項３記載の画像形成装置。
【請求項６】
ラスタ形式のイメージデータを圧縮する画像処理装置であって、
前記イメージデータに含まれる文字を抽出する文字抽出手段と、
前記文字の複雑さを示す複雑度を求める複雑度算出手段と、
前記複雑度算出手段によって求められた前記複雑度に基づいて、前記文字をラスタ形式からベクタ形式に変換する際に曲線近似を用いるか否かを判定する判定手段と、
前記判定手段が曲線近似を用いると判定した場合は、前記文字の輪郭の各部分をそれぞれ直線近似しまたは曲線近似することによって当該文字をベクタ形式に変換し、曲線近似を用いないと判定した場合は、当該文字の輪郭の各部分を曲線近似することなく直線近似することによって当該文字をベクタ形式に変換する、画像変換手段と、
前記画像変換手段によってベクタ形式に変換された前記文字を可逆圧縮し、前記イメージデータに含まれる当該文字以外の部分を非可逆圧縮することによって、圧縮データを生成する圧縮手段と、
を有することを特徴とする画像処理装置。
【請求項７】
画像処理装置における、イメージデータをラスタ形式からベクタ形式に変換するための画像変換方法であって、
ラスタ形式の前記イメージデータに含まれる文字を抽出し、
前記文字の複雑さを示す複雑度を求め、
求めた前記複雑度に基づいて、前記文字をラスタ形式からベクタ形式に変換する際に曲線近似を用いるか否かを判定し、
曲線近似を用いると判定した場合は、前記文字の輪郭の各部分をそれぞれ直線近似しまたは曲線近似することによって当該文字をベクタ形式に変換し、
曲線近似を用いないと判定した場合は、前記文字の輪郭の各部分を曲線近似することなく直線近似することによって当該文字をベクタ形式に変換する、
ことを特徴とする画像変換方法。
【請求項８】
ラスタ形式のイメージデータをベクタ形式に変換するためのコンピュータに、
前記イメージデータに含まれる文字を抽出する処理と、
前記文字の複雑さを示す複雑度を求める処理と、
求めた前記複雑度に基づいて、前記文字をラスタ形式からベクタ形式に変換する際に曲線近似を用いるか否かを判定する処理と、
曲線近似を用いると判定した場合は、前記文字の輪郭の各部分をそれぞれ直線近似しまたは曲線近似することによって当該文字をベクタ形式に変換し、曲線近似を用いないと判定した場合は、前記文字の輪郭の各部分を曲線近似することなく直線近似することによって当該文字をベクタ形式に変換する、処理と、
を実行させることを特徴とするコンピュータプログラム。

【図１】