画像処理装置及び画像処理プログラム
【課題】文字認識処理によって文字画像ではない画像に対して文字画像であると認識された誤りを減少させるようにした画像処理装置を提供する。
【解決手段】画像処理装置の受付手段は、文字認識された文字候補画像と該文字候補画像に関する情報を受け付け、第1の判定手段は、前記受付手段によって受け付けられた文字候補画像に関する情報に基づいて、該文字候補画像が文字画像であるか否かを判定し、第2の判定手段は、前記第1の判定手段によって文字画像であると判定されなかった場合又は文字画像ではないと判定されなかった場合は、前記受付手段によって受け付けられた文字候補画像の特徴を抽出し、該文字候補画像が文字画像であるか否かを判定する。
【解決手段】画像処理装置の受付手段は、文字認識された文字候補画像と該文字候補画像に関する情報を受け付け、第1の判定手段は、前記受付手段によって受け付けられた文字候補画像に関する情報に基づいて、該文字候補画像が文字画像であるか否かを判定し、第2の判定手段は、前記第1の判定手段によって文字画像であると判定されなかった場合又は文字画像ではないと判定されなかった場合は、前記受付手段によって受け付けられた文字候補画像の特徴を抽出し、該文字候補画像が文字画像であるか否かを判定する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像処理装置及び画像処理プログラムに関する。
【背景技術】
【0002】
画像内の対象物を識別する技術が知られている。
これに関連する技術として、例えば、特許文献1には、2つのクラスに属する入力データを高速かつ高精度にパターン識別し、そのための学習方法を提供することを課題とし、複数の判別方法の組み合わせを順次実行することにより、入力データを所定のクラスに分類するパターン識別において、前記判別方法の少なくとも1つにおいて、前記入力データをN(N≧2)次元特徴空間上の対応点にマッピングするマッピングステップと、前記対応点に基づいて、次の判別方法を実行するべきかどうかを判定する判定ステップと、前記判定ステップにおいて次の判別方法を実行するべきであると判定された場合に、前記対応点に基づいて、次に実行するべき判別方法を選択する選択ステップと、を有する学習方法が開示されている。
【0003】
また、例えば、特許文献2には、物体検出装置において誤検出を低減することを課題とし、画像を取得する画像取得部と、画像取得部から入力された画像から検出窓が設定されている検出窓領域画像を取り込み、検出窓領域画像に検出対象物が存在しているか否かを予め学習した情報に基づいて判定する固定識別器と、検出窓領域画像から算出した情報を辞書データに追加して検出対象物が存在しているか否かを判定する学習識別器と、固定識別器及び学習識別器からの出力に基づき検出対象物が存在するか否かを判定する判定手段とを設けることが開示されている。
【0004】
また、例えば、特許文献3には、カスケード接続された複数の識別器の段数を設置環境に適応して制御することを課題とし、物体検出装置は、画像を取得する画像取得部と、画像取得部から入力された画像から検出窓が設定されている検出窓領域画像を取り込み、検出窓領域画像に検出対象物が存在しているか否かを判定する強識別器を直列に複数段接続したカスケード型識別器である固定識別器と、強識別器を使用していない段がある場合にカスケード型識別器の使用段数を減らす識別器更新手段と、を有することが開示されている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2009−086749号公報
【特許文献2】特開2010−170201号公報
【特許文献3】特開2010−170198号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
本発明は、文字認識処理によって文字画像ではない画像に対して文字画像であると認識された誤りを減少させるようにした画像処理装置及び画像処理プログラムを提供することを目的としている。
【課題を解決するための手段】
【0007】
かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
請求項1の発明は、文字認識された文字候補画像と該文字候補画像に関する情報を受け付ける受付手段と、前記受付手段によって受け付けられた文字候補画像に関する情報に基づいて、該文字候補画像が文字画像であるか否かを判定する第1の判定手段と、前記第1の判定手段によって文字画像であると判定されなかった場合又は文字画像ではないと判定されなかった場合は、前記受付手段によって受け付けられた文字候補画像の特徴を抽出し、該文字候補画像が文字画像であるか否かを判定する第2の判定手段を具備することを特徴とする画像処理装置である。
【0008】
請求項2の発明は、前記受付手段によって受け付けられた文字候補画像に関する情報に基づいて、文字列に関する特徴量、文字間に関する特徴量、文字列に関する特徴量のいずれか1つ以上を抽出する第1の抽出手段をさらに具備し、前記第1の判定手段は、前記第1の抽出手段によって抽出された特徴量に基づいて、前記文字候補画像が文字画像であるか否かを判定することを特徴とする請求項1に記載の画像処理装置である。
【0009】
請求項3の発明は、前記受付手段によって受け付けられた文字候補画像の複雑度に関する特徴量、画素の連なりに関する特徴量のいずれか1つ以上を抽出する第2の抽出手段をさらに具備し、前記第2の判定手段は、前記第2の抽出手段によって抽出された特徴量に基づいて、前記文字候補画像が文字画像であるか否かを判定することを特徴とする請求項1又は2に記載の画像処理装置である。
【0010】
請求項4の発明は、コンピュータを、文字認識された文字候補画像と該文字候補画像に関する情報を受け付ける受付手段と、前記受付手段によって受け付けられた文字候補画像に関する情報に基づいて、該文字候補画像が文字画像であるか否かを判定する第1の判定手段と、前記第1の判定手段によって文字画像であると判定されなかった場合又は文字画像ではないと判定されなかった場合は、前記受付手段によって受け付けられた文字候補画像の特徴を抽出し、該文字候補画像が文字画像であるか否かを判定する第2の判定手段として機能させるための画像処理プログラムである。
【発明の効果】
【0011】
請求項1の画像処理装置によれば、文字認識処理によって文字画像ではない画像に対して文字画像であると認識された誤りを減少させることができる。
【0012】
請求項2の画像処理装置によれば、本構成を有していない場合に比較して、文字候補画像に関する情報を用いた文字画像であるか否かの判定を精度よく行うことができる。
【0013】
請求項3の画像処理装置によれば、本構成を有していない場合に比較して、文字候補画像の特徴を用いた文字画像であるか否かの判定を精度よく行うことができる。
【0014】
請求項4の画像処理プログラムによれば、文字認識処理によって文字画像ではない画像に対して文字画像であると認識された誤りを減少させることができる。
【図面の簡単な説明】
【0015】
【図1】本実施の形態の前提となる構成例についての概念的なモジュール構成図である。
【図2】本実施の形態の構成例についての概念的なモジュール構成図である。
【図3】文字認識情報テーブルのデータ構造例を示す説明図である。
【図4】本実施の形態による処理例を示すフローチャートである。
【図5】第1特徴量算出モジュールの具体的な例を示す説明図である。
【図6】第2特徴量算出モジュールの具体的な例を示す説明図である。
【図7】第1画像判定処理モジュールにおける判定動作処理例の概要を示す説明図である。
【図8】第1画像判定処理モジュール、第2画像判定処理モジュールにおける文字画像判定器の動作処理例を模式的に示す説明図である。
【図9】特徴量xに対する文字画像、非文字画像の分布と判定関数の関係例を示すグラフである。
【図10】特徴量xに対する文字画像、非文字画像の分布と判定関数の関係例を示すグラフである。
【図11】第1画像判定処理モジュールにおける判定値、しきい値を用いた判定動作処理例の概要を示す説明図である。
【図12】本実施の形態を実現するコンピュータのハードウェア構成例を示すブロック図である。
【発明を実施するための形態】
【0016】
<本実施の形態の前提>
本実施の形態が利用されるシステムの構成例として、図1の例に示すように、画像受付モジュール110、文字認識モジュール120、文字画像判定モジュール130、判定結果出力モジュール140を有している。
画像受付モジュール110は、文字認識モジュール120に接続されており、画像105を受け付けて、その画像105を文字認識モジュール120へ渡す。画像105を受け付けるとは、例えば、スキャナ、カメラ等で画像を読み込むこと、ファックス等で通信回線を介して外部機器から画像を受信すること、ハードディスク(コンピュータに内蔵されているものの他に、ネットワークを介して接続されているもの等を含む)等に記憶されている画像を読み出すこと等が含まれる。文字認識モジュール120が対象とする画像は、2値画像であるが、多値画像(カラー画像を含む)を受け付けた場合は、2値画像に変換すればよい。受け付ける画像は、1枚であってもよいし、複数枚であってもよい。また、画像の内容として、ビジネスに用いられる文書、広告宣伝用のパンフレット等であってもよい。
【0017】
文字認識モジュール120は、画像受付モジュール110と文字画像判定モジュール130に接続されており、対象とする画像105に対して文字認識処理を行い、その結果得られた文字候補画像とその文字認識情報125を文字画像判定モジュール130に渡す。文字候補画像とは、文字認識モジュール120によって文字領域として認識された画像領域である。つまり、文字認識モジュール120によって文字として認識された1文字分の画像である。そして、その文字候補画像に関する情報(以下、文字認識情報ともいう)は、例えば、文字列矩形情報、文字矩形情報、文字コード情報、文字の認識確度情報等である。つまり、文字認識モジュール120によって文字候補画像を抽出、認識するのに要した情報、認識した結果、その認識結果に関わる情報によって構成されている。
文字認識モジュール120で用いる文字認識技術に関しては、従来技術としてさまざまな方式があるが、本実施の形態においては、文字認識情報や文字候補画像を出力可能な技術であれば、そのうちどれかを用いればよい。
【0018】
文字画像判定モジュール130は、文字認識モジュール120と判定結果出力モジュール140に接続されており、文字認識モジュール120から渡された文字候補画像が文字画像か非文字画像かを判定し、その結果を判定結果出力モジュール140に渡す。図2以降を用いて後述する。文字認識モジュール120によって文字画像として文字認識された画像であったとしても、文字認識モジュール120のアルゴリズム、エラー等によって文字画像でない場合もあり得る。そのような場合であっても、文字画像判定モジュール130は、文字候補画像が文字画像であるか否かを判定し、文字画像ではない画像に対する文字認識結果を排除し得るようにするものである。文字画像判定モジュール130内のモジュール構成、処理等については、図2以降を用いて後述する。
【0019】
判定結果出力モジュール140は、文字画像判定モジュール130と接続されており、文字画像判定モジュール130による判定結果である判定結果(「文字」又は「非文字」)145を出力する。判定結果(「文字」又は「非文字」)145を出力するとは、例えば、文字認識モジュール120による認識結果を用いる他の情報処理装置へ渡すこと、画像データベース等の画像記憶装置へ画像105と文字と判定された文字画像の文字認識情報(認識結果である文字コード情報とその文字画像の位置情報である文字矩形情報だけでもよい)とともに対応させて書き込むこと、メモリーカード等の記憶媒体に記憶すること等の他に、プリンタ等の印刷装置で印刷すること、ディスプレイ等の表示装置に表示すること等が含まれる。また、文字画像判定モジュール130による判定結果を用いて、文字画像ではないと判定された文字認識結果は出力せずに、文字画像であると判定された文字認識結果だけを出力するようにしてもよい。
【0020】
<実施の形態>
以下、図面に基づき本発明を実現するにあたっての好適な一実施の形態の例を説明する。
図2は、本実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、それらのモジュールとして機能させるためのコンピュータ・プログラム(コンピュータにそれぞれの手順を実行させるためのプログラム、コンピュータをそれぞれの手段として機能させるためのプログラム、コンピュータにそれぞれの機能を実現させるためのプログラム)、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するの意である。また、モジュールは機能に一対一に対応していてもよいが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態に応じて、又はそれまでの状況・状態に応じて定まることの意を含めて用いる。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。もちろんのことながら、「システム」には、人為的な取り決めである社会的な「仕組み」(社会システム)にすぎないものは含まない。
また、各モジュールによる処理毎に又はモジュール内で複数の処理を行う場合はその処理毎に、対象となる情報を記憶装置から読み込み、その処理を行った後に、処理結果を記憶装置に書き出すものである。したがって、処理前の記憶装置からの読み込み、処理後の記憶装置への書き出しについては、説明を省略する場合がある。なお、ここでの記憶装置としては、ハードディスク、RAM(Random Access Memory)、外部記憶媒体、通信回線を介した記憶装置、CPU(Central Processing Unit)内のレジスタ等を含んでいてもよい。
【0021】
本実施の形態である画像処理装置は、文字認識された文字候補画像が文字画像であるか否かを判定するものであって、図2の例に示すように、文字画像判定モジュール130は第1画像判定モジュール210、第2画像判定モジュール220を有している。
【0022】
文字画像判定モジュール130は、文字認識モジュール120によって文字認識された文字候補画像とその文字認識情報125を受け付ける。
第1画像判定モジュール210は、文字画像判定モジュール130によって受け付けられた文字認識情報に基づいて、その文字候補画像が文字画像であるか否かを判定する。
第1画像判定モジュール210は、第1特徴量算出モジュール212、第1画像判定処理モジュール214を有している。
第1特徴量算出モジュール212は、文字画像判定モジュール130によって受け付けられた文字認識情報に基づいて、文字列に関する特徴量、文字間に関する特徴量、文字列に関する特徴量のいずれか1つ以上を抽出する。
第1画像判定処理モジュール214は、第1特徴量算出モジュール212によって抽出された特徴量に基づいて、文字候補画像が文字画像であるか否かを判定する。
【0023】
第2画像判定モジュール220は、文字候補画像から画像処理で得られる情報に基づいて判定を行う。つまり、第1画像判定モジュール210によって文字画像であると判定されなかった場合又は文字画像ではないと判定されなかった場合は、文字画像判定モジュール130によって受け付けられた文字候補画像の特徴を抽出し、その文字候補画像が文字画像であるか否かを判定する。
第2画像判定モジュール220は、第2特徴量算出モジュール222、第2画像判定処理モジュール224を有している。
第2特徴量算出モジュール222は、文字画像判定モジュール130によって受け付けられた文字候補画像の複雑度に関する特徴量、画素の連なりに関する特徴量のいずれか1つ以上を抽出する。
第2画像判定処理モジュール224は、第2特徴量算出モジュール222によって抽出された特徴量に基づいて、対象としている文字候補画像が文字画像であるか否かを判定する。
【0024】
第1画像判定処理モジュール214が、文字画像であることを高い確度で判定するモジュールである場合は、文字画像であると判定されなかった場合に第2画像判定処理モジュール224による判定を行う。「文字画像であると判定されなかった場合」とは、文字画像ではないと判定した場合と、「文字画像である」又は「文字画像ではない」のいずれにも判定できなかった場合を含む。
第1画像判定処理モジュール214が、文字画像でないことを高い確度で判定するモジュールである場合は、文字画像でないと判定されなかった場合に第2画像判定処理モジュール224による判定を行う。「文字画像でないと判定されなかった場合」とは、文字画像であると判定した場合と、「文字画像である」又は「文字画像ではない」のいずれにも判定できなかった場合を含む。
つまり、第1画像判定処理モジュール214では高い確度での判定ができなかった場合に、次の第2画像判定処理モジュール224による判定を行うことになる。また、第1画像判定モジュール210が判定に用いる情報は、画像情報以外のテキスト、数値等の情報であり、第2画像判定モジュール220が判定に用いる情報は、文字候補画像そのものであり、いわゆる画像情報である。このため、第1画像判定モジュール210による判定は、第2画像判定モジュール220による判定よりも高速で行うことができ、第1画像判定モジュール210での高い確度での判定ができた場合は、第2画像判定モジュール220による判定は行わないことになる。したがって、判定結果出力モジュール140に渡す判定結果(「文字」又は「非文字」)135は、第1画像判定処理モジュール214が出力する場合もあるし、第2画像判定処理モジュール224によって出力される場合もある。
なお、ここで高い確度でとは、予め定められた確度と比較した場合に、その予め定められた確度以上又はより高いことをいう。
【0025】
ここで図2に示すブロック図と、図4に示すフローチャートで文字画像判定モジュール130における文字候補画像の判定処理の流れを説明する。
図4のステップS402において、文字画像判定モジュール130は文字認識モジュール120で得られた文字認識情報及び文字領域として認識された文字候補画像を、文字認識モジュール120によって文字列と認識された単位毎に受け付ける。
図3は文字認識モジュール120から出力される文字列単位の文字認識情報の具体的な一例を説明する図である。文字列単位の文字認識情報テーブル300は、文字列矩形情報312、文字数情報314、文字矩形情報316、文字コード情報318、認識確度情報320で構成される。
【0026】
文字列矩形情報312は、受け付けられる文字列中の全ての文字矩形(文字画像を囲む矩形)を囲む矩形の座標値(例えば、文字矩形を囲む最小の矩形の座標値)であり、左上座標(xl,yl)、右下座標(xr,yr)が格納されている。この他に、左上座標(xl,yl)と文字列矩形の幅と高さであってもよい。
文字数情報314は、受け付けられる文字列中の文字矩形数nが格納されている。
文字矩形情報316は、受け付けられる文字列中の各文字の外接矩形の座標値(例えば、文字画像を囲む最小の矩形の座標値)であり、左上座標(xl,yl)、右下座標(xr,yr)が格納されている。この他に、左上座標(xl,yl)と文字矩形の幅と高さであってもよい。
文字コード情報318は、文字列中の各文字候補画像を文字認識モジュール120が認識した結果である文字コードであり、例えば文字コードとしてunicodeで格納される。
認識確度情報320は、文字列中の各文字を文字認識モジュール120が認識した際の結果の信頼度を表す数値情報である。この数値は、ある文字の認識において、認識結果の候補が多い場合には数値は小さくなり、認識結果の候補が少ない場合は大きくなる。例えば認識結果の候補が1つしかない場合は1.0、認識結果の候補が2つの場合は0.5となる。
ここで当然であるが、文字列毎の文字認識情報テーブル300においては、文字矩形情報316、文字コード情報318、認識確度情報320は文字矩形数n分だけ格納されることになる。
【0027】
ステップS404において、第1画像判定モジュール210は、第1特徴量算出モジュール212において、図3の例を用いて先述した文字認識情報テーブル300を受け付け、その文字認識情報テーブル300から「文字列らしさ」あるいは「文字列としてのきれいさ」を数値として算出したものと文字認識情報テーブル300から得られる数値を第1の特徴量として第1画像判定処理モジュール214に出力する。なお、第1画像判定モジュール210の第1特徴量算出モジュール212の詳細は後述する。
【0028】
ステップS406において、第1画像判定モジュール210は、第1画像判定処理モジュール214において、ステップS404で算出した第1の特徴量を受け付けて、前記第1の特徴量に基づいて対象の文字候補画像が「文字」画像か「非文字」画像かを判定する。「文字」画像と判定された場合(ステップS406でYes)は、文字画像判定モジュール130はステップS412に処理を移し、判定結果として「文字」を出力する。「非文字」画像と判定された場合(ステップS406でNo)は、文字画像判定モジュール130は対象の文字候補画像を第2画像判定処理モジュール224に入力してステップS408に処理を移す。
【0029】
ステップS408において、第2画像判定モジュール220は、第2特徴量算出モジュール222において、第1画像判定モジュール210において「非文字」画像と判定された文字候補画像から、第2の画像特徴量として画像処理により特徴値(例えば、特徴値は1つであってもよいし、複数であってもよい)を算出する。なお、第2画像判定モジュール220の第2特徴量算出モジュール222の詳細は後述する。
【0030】
ステップS410において、第2画像判定モジュール220は、第2画像判定処理モジュール224において、ステップS408で算出した第2の特徴量を受け付けて、前記第2の特徴量に基づいて対象の文字候補画像が「文字」画像か「非文字」画像かを判定する。ステップS410では、「文字」と判定された場合でも「非文字」と判定された場合でも、処理をステップS412に移す。
【0031】
ステップS412において、文字画像判定モジュール130は、第1画像判定モジュール210又は第2画像判定モジュール220による判定結果(「文字」又は「非文字」)135を判定結果出力モジュール140に渡す。
ステップS414において、文字画像判定モジュール130は、受け付けた文字列内の全ての文字候補画像の処理が終了したかどうかを判定する。もし終了していなければ(ステップS414でNo)処理をステップS406に移し、ステップS406からステップS412の処理を繰り返す。受け付けた文字列内の全ての文字候補画像の処理が終了した場合(ステップS414でYes)には処理をステップS416に移す。
ステップS416において、文字画像判定モジュール130は、文字認識モジュール120で認識された全ての文字列の処理が終了したかどうか判定する。終了していなければ(ステップS416でNo)処理をステップS402に移し、次の文字列に対してステップS402からステップS414までの処理を繰り返す。全ての文字列の処理が終了した場合(ステップS416でYes)には、文字画像判定モジュール130は文字画像判定処理を終了する(ステップS499)。
【0032】
次に、第1画像判定モジュール210の第1特徴量算出モジュール212による処理の詳細について説明する。
図5(a)は第1特徴量算出モジュール212の具体的な一例を説明する図である。図5(a)に示す具体例では、第1特徴量算出モジュール212aは、文字列特徴量算出モジュール512a、文字間特徴量算出モジュール514a、単文字特徴量算出モジュール516aを有している。
【0033】
文字列特徴量算出モジュール512aは、図3の例に示した文字列毎の文字認識情報テーブル300を用いて、「文字列らしさ」あるいは「文字列としてのきれいさ」を数値として算出する。ここで言う「文字列らしさ」あるいは「文字列としてのきれいさ」とは、文字列毎にその文字列内の各文字の並びが揃っている、又は各文字の大きさが均一かどうかということを意味するものである。したがって、例えば、対象としている文字列内の各文字のサイズはほぼ均一で、文字列の中心に沿って均等な距離で並んでいる場合は、その文字列は「文字列らしい」あるいは「文字列としてきれい」とする。その反対に文字列内の各文字がばらばらに位置していたり、各文字の大きさが極端に異なっていたりする場合は、その文字列は「文字列らしくない」あるいは「文字列としてきれい」ではないとする。言い換えれば、「文字列らしさ」あるいは「文字列のきれいさ」は文字列内の文字の並びや大きさのばらつきを数値化したものである。なお、「各文字のサイズがほぼ均一」とは、例えば、文字サイズの分散が予め定められた値よりも小さいこと又は以下であることをいう。また、「均等な距離で並んでいる場合」の「均等」として、例えば、各距離が予め定められた範囲内にあることも含める。「各文字がばらばらに位置する場合」とは、例えば、均等な距離で並んでいない場合をいう。「各文字の大きさが極端に異なっている場合」とは、例えば、文字サイズの分散が予め定められた値よりも大きいこと又は以上であることをいう。
【0034】
ここで、文字列特徴量算出モジュール512aにおいて、図3の例に示す文字認識情報テーブル300を用いて算出される「文字列らしさ」あるいは「文字列のきれいさ」を表す特徴量の具体的な一例を示す。
1.文字列内の文字矩形高さ(又は文字矩形幅)の標準偏差σs
【数1】
ここで、siはi番目の文字矩形高さ(又は文字矩形幅)、s((1)式のΣ内のカッコ内で−の項をいい、以下の説明では単にsとする)は文字列中の文字矩形高さ(又は文字矩形幅)の平均値、nは文字列中の文字矩形数をそれぞれ表す。
【0035】
2.(文字列中央値−文字中央値)の標準偏差σc
【数2】
ここで、ciはi番目の文字矩形の重心のy座標値(又はx座標値)と文字矩形の重心のy座標値(又はx座標値)の差分の絶対値、c((2)式のΣ内のカッコ内で−の項をいい、以下の説明では単にcとする)はciの平均値、nは文字列中の文字矩形数をそれぞれ表す。
【0036】
3.文字列高さ(あるいは文字列幅)対する平均文字矩形高さ(又は文字矩形幅)rs
【数3】
ここで、sは文字列中の文字矩形高さ(又は文字矩形幅)の平均値、lsは文字列高さ(あるいは文字列幅)をそれぞれ表す。
【0037】
4.認識確度平均値cf((4)式の左辺をいい、以下の説明では単にcfとする)
【数4】
ここで、cfiは文字列中のi番目の文字の認識確度値を表す。
【0038】
文字間特徴量算出モジュール514aは、図3の例に示した文字認識情報テーブル300のうち文字コード情報318を用いて、あるN文字間の文字並びが出現する出現頻度を算出する。例えば、N=2として、2文字間の文字並びが出現する出現頻度を算出する。この出現頻度は、よく使われる単語や単語+助詞などの場合には高い数値となり、あまり出現しないような文字並びの場合は低い数値となる。例えば、本実施の形態における文字間特徴量算出モジュール514aでは、既存のNgramデータと文字コード情報318を用いて、bigram(2文字間)、trigram(3文字間)の値を算出する。
単文字特徴量算出モジュール516aは、図3の例に示した文字認識情報テーブル300のうち文字認識確度情報320を出力する。
【0039】
第1画像判定モジュール210においては、第1特徴量算出モジュール212aを構成する3つの算出モジュールである文字列特徴量算出モジュール512a、文字間特徴量算出モジュール514a、単文字特徴量算出モジュール516aの全てで特徴量を算出することが望ましいが、これに限定されるわけではない。例えば図3の例に示した文字認識情報テーブル300のうち、文字認識モジュール120が文字認識情報テーブル300として認識確度情報320を出力しない、又は認識確度情報320を算出しないので出力できないなどの場合は、図5(b)の例に示すように、文字列特徴量算出モジュール512b、文字間特徴量算出モジュール514bで第1特徴量算出モジュール212bを構成するようにしてもよい。
【0040】
また、文字間の文字並びの出現頻度を算出するためのNgramデータなどの出現頻度データが用意できない場合や、システムの構成上それらのデータを格納する記憶容量が制限される場合には、図5(c)の例に示すように、文字列特徴量算出モジュール512c、単文字特徴量算出モジュール516cで第1特徴量算出モジュール212cを構成するようにしてもよい。
【0041】
さらには、前記2つのいずれにも該当する場合には、図5(d)の例に示すように、文字列特徴量算出モジュール512dだけで第1特徴量算出モジュール212dを構成することも可能である。この場合は先に説明した認識確度平均値は算出されない。
つまり、第1画像判定モジュール210の第1特徴量算出モジュール212dは、どのような既存の文字認識モジュール120を用いても文字認識情報として出力される、又は容易に算出できる文字列矩形と文字矩形の座標情報から「文字列らしさ」又は「文字列のきれいさ」を数値として算出する文字列特徴量算出モジュール512dを基本構成要素とすることで、文字判定装置の構成上の制限や文字認識モジュール120から出力される文字認識情報の仕様により柔軟に対応することが可能である。また、第1特徴量算出モジュール512dにおける特徴量の算出は、第1特徴量算出モジュール212にとっては、テキスト、数値等の情報である図3の例に示した文字認識情報テーブル300に基づいて算出されるため、後述する第2特徴量算出モジュール222による計算量よりも少なくなる。
【0042】
次に、第2画像判定モジュール220の第2特徴量算出モジュール222の詳細について説明する。
図6は、第2特徴量算出モジュール222の具体的な一例を説明する図である。図6に示す具体例では、第2特徴量算出モジュール222は、サイズ規格化モジュール612、複雑度特徴量算出モジュール614、ラン特徴量算出モジュール616を有している。
【0043】
サイズ規格化モジュール612は、文字認識モジュール120で得られた文字領域として認識された文字候補画像の大きさを第2特徴量算出モジュール220の処理を行うために必要な予め定められた大きさに規格化する。規格化するサイズは、例えば64×64画素サイズなどである。もちろん正方形サイズに規格化するだけに限らず、同じサイズに規格化するのであれば長方形になるように規格化してもよい。
【0044】
複雑度特徴量算出モジュール614は、文字候補画像の2値画像としての複雑さに基づく特徴量を算出する。例えば、具体的には以下に示すような特徴量を算出する。
1.連結成分数
文字候補画像中の連結成分の数である。
2.連結成分周囲長
文字候補画像中の連結成分の周囲長である。文字候補画像中に連結成分が複数ある場合はその最大値あるいは平均値を算出する。
3.複雑度
複雑度cは以下の式(5)で表される値である。
【数5】
4.密度
画像密度dは以下の式(6)で表される値である。
【数6】
5.0度方向(水平方向)における黒白変化点数
文字候補画像中における0度方向(水平方向又は主走査方向)の黒画素から白画素へ変わる回数の総和である。
6.90度方向(垂直方向)における黒白変化点数
文字候補画像中における90度方向(垂直方向又は副走査方向)の黒画素から白画素へ変わる回数の総和である。
【0045】
ラン特長量算出モジュール616は、文字候補画像のランレングスに基づく特徴量を算出する。例えば、具体的には以下に示すような特徴量を算出する。
1.ラン長(4方向)
それぞれ0度、45度、90度、135度方向のラン長である。ここで算出されるラン長は文字候補画像内の連結成分に対するそれぞれの方向における最大値あるいは平均値である。
2.方向寄与度(4方向)
それぞれ0度、45度、90度、135度方向のラン長に対する方向寄与度である。方向寄与度に関しては、例えば、(「背景・文字の形状特徴と動的修正識別関数を用いた映像中テロップ認識」信学論(D−II)VOL.J83−D−2,No.7,pp.1658−1666)に開示されており、4方向(0度、45度、90度、135度)の文字ラン長の連続性を表すものである。方向寄与度特徴Diは以下の式(7)で算出される。
【数7】
ここで、l1、l2、l3、l4はそれぞれ0度、45度、90度、135度方向のラン長を表す。
【0046】
第2画像判定モジュール220においては、第2特徴量算出モジュール222を構成する2つの算出モジュールである複雑度特徴量算出モジュール614、ラン特長量算出モジュール616で算出する特徴量を全て用いることが望ましいがこれに限定されるわけではない。第2特徴量算出モジュール222で算出される前記の特徴量は、受け付けられた文字候補画像から画像処理で算出されるため、第1特徴量算出モジュール212における特徴量算出と比較して負荷のかかる処理となる。したがって処理負荷の軽減のため、例えば複雑度特徴量算出モジュール614における特徴量だけを算出する、あるいはラン特徴量算出モジュール616における特徴量だけを算出するといった構成をとってもよい。
反対に、処理負荷よりも判定精度がより重要な装置では、複雑度特徴量算出モジュール614、ラン特徴量算出モジュール616で算出する特徴量を増やすといった構成をとってもよい。
【0047】
以上述べてきたように、第1特徴量算出モジュール212、第2特徴量算出モジュール222は、文字列毎の文字認識情報や2値化された文字候補画像から複数の特性の異なる特徴量を算出するが、算出される各特徴量の値の範囲(値域)は異なるので、例えば算出される実数値の特徴量vに対して、(0≦v≦1)で値の正規化を行い、値の範囲を揃えて出力する特徴量を同様に扱えるようにしてもよい。
【0048】
次に、第1画像判定モジュール210における第1画像判定処理モジュール214、第2画像判定モジュール220における第2画像判定処理モジュール224の詳細について説明する。ここで第1画像判定処理モジュール214と第2画像判定処理モジュール224は、後述する文字画像判定器(700、701、702、70n)が異なるだけで動作は同一であるので、以降では第1画像判定処理モジュール214を具体例として説明する。
【0049】
第1画像判定処理モジュール214は、複数の異なる文字画像判定器(700、701、702、70n)で構成され、各文字画像判定器は、先の第1特徴量算出モジュール212の説明で述べたような特徴量を判定基準に用いて、文字候補画像が文字画像であるか否かを判定する。
【0050】
図7は、第1画像判定処理モジュール214における判定動作の概要を説明した図である。図7において、y0、y1、y2、・・・ynは、それぞれ各文字画像判定器(700、701、702、70n)からの出力である判定値であり、これら判定値についての詳細は後述する。
ここでは、図7を用いて第1画像判定処理モジュール214の動作例の概要について説明する。先に述べたように第2画像判定処理モジュール224においても文字画像判定器(700、701、702、70n)が異なるのみで動作は同一なので第2画像判定処理モジュール224の動作については省略する。
【0051】
まず、第1画像判定処理モジュール214では、文字画像判定器700が動作する。文字画像判定器700は、第1特徴量算出モジュール212で算出された1つの特徴量(図7の例における特徴量0)、例えば前述の「文字列内の文字矩形高さ(又は文字矩形幅)の標準偏差」に基づいて、判別値y0を出力する。
判定モジュール750(第1画像判定処理モジュール214)は、出力された判定値y0に基づいて、文字候補画像が文字画像か非文字画像かを判定する。ここで非文字画像と判定された場合には、判定結果を出力して第1画像判定処理モジュール214における対象としている文字候補画像に対する判定動作をここで終了する。文字画像と判定された文字候補画像は文字画像判定器701に出力される。
【0052】
文字画像判定器700で対象としている文字候補画像が文字画像と判定された場合は、次に文字画像判定器701が動作する。文字画像判定器701は、前段の文字画像判定器700と同様に第1特徴量算出モジュール212で算出された別の1つの特徴量(図7の例における特徴量1)、例えば前述の「(文字列中央値−文字中央値)の標準偏差」に基づいて、判定値y1を出力する。
判定モジュール751(第1画像判定処理モジュール214)は、出力された判定値y1に基づいて、前段の判定モジュール750と同様な動作を行う。以下同様に、前段の文字画像判定器(700、701、702、70n)が文字画像と判定した文字候補画像を、第1特徴量算出モジュール212で算出した特徴量に基づいた予め定められた判定値を用いて判定していき、最終的な判定結果を得る。
このように第1画像判定処理モジュール214は、各文字画像判定器(700、701、702、・・・)で文字画像と判定された場合は後段の文字画像判定器(701、702、・・・、70n)へ文字候補画像を出力して判定動作を行い、非文字画像と判定された場合は判定結果を出力して、判定動作を終了する。つまり、第1画像判定処理モジュール214は、受け付けられた文字候補画像に対して、あきらかに非文字画像と判定できる対象に関してはできるだけ前段の文字画像判定器(700、701、702、・・・、70n)で判断し、文字画像に関しては多くの文字画像判定器(700、701、702、・・・、70n)の判断で判定を行うように動作する。
【0053】
次に、文字画像判定器について説明する。
図8は、第1画像判定処理モジュール214、第2画像判定処理モジュール224における文字画像判定器(70i、70i+1、70i+2、70i+3、・・・)の動作例を模式的に表したものである。図8の例に示すように、文字画像判定器(70i、70i+1、70i+2、70i+3、・・・)は、第1特徴量算出モジュール212、第2特徴量算出モジュール222からの特徴量xiを受け付け、文字画像判定器(70i、70i+1、70i+2、70i+3、・・・)毎に設定された判定関数yにしたがって判定値yiを出力する。ここで判定関数yは、以下の式(8)で表される1入力1出力関数である。
【数8】
つまり、第1特徴量算出モジュール212、第2特徴量算出モジュール222からの出力である特徴量xiに対して、式(8)にしたがって一意に判定値yiが出力される。
【0054】
ここで、例えば第1特徴量算出モジュール212、第2特徴量算出モジュール222から算出される、ある特徴量に対する文字画像と非文字画像の分布が図9(a)の例で表されるような場合を考える。図9(a)の例に示すような分布は、予め多数の文字画像、非文字画像に対して、ある特徴量を算出して、それら特徴量に対する文字画像、非文字画像の頻度分布を生成することで得られる。このような分布が得られる前提において、各文字画像判定器(70i、70i+1、70i+2、70i+3)の判定関数yは、以下の式(9)で表される関数で設定する。
【数9】
これを図示したものを図9(b)の例に示す。図9(b)の例で示すように、式(9)で設定される判定関数yは特徴量xに対して、値域(−1≦y≦1)を取る関数であり、図9の例において、非文字画像分布の下限値x0、文字画像分布の上限値x1とすると、
【数10】
である。このように図9(b)に示すような判定関数yを設定することで、第1特徴量算出モジュール212、第2特徴量算出モジュール222からの出力である特徴量xiに対して一意の判定値yiが得られる。
【0055】
次に、各文字画像判定器(70i、70i+1、70i+2、70i+3)から出力された判定値yに基づく判定処理の詳細について説明する。なお先に述べたように、文字画像判定器(70i、70i+1、70i+2、70i+3)が異なるだけで、文字画像判定モジュール130における判定処理は、第1画像判定処理モジュール214と第2画像判定処理モジュール224とでは同様なので、ここでの説明でも第1画像判定処理モジュール214を具体例として説明する。
【0056】
第1画像判定処理モジュール214は、各文字画像判定器(70i、70i+1、70i+2、70i+3、・・・)から出力された判定値yに対して、しきい値を用いて文字候補画像が文字画像か、非文字画像かの判断を行う。なお、しきい値は、第1画像判定処理モジュール214による文字候補画像の判定処理とは別に、予め定められた値に設定しておくことが望ましい。
以下に、しきい値の設定方法について述べる。
各文字画像判定器(70i、70i+1、70i+2、70i+3、・・・)で用いるしきい値それぞれは、各文字画像判定器(70i、70i+1、70i+2、70i+3、・・・)毎に設定された判定関数に基づいて決定される。図10にしきい値の設定の具体的な一例を示す。図10(b)に示す具体例では、しきい値thは、特徴量x2における判定関数yの出力値で設定している。ここで特徴量x2の具体的な決定方法は、例えば、x2は文字画像分布における上位5%の個数を含む境界特徴量とする。ただしこれに限るわけではなく文字判定装置の用途、又は要求精度等により境界特徴量x2の決定方法は変更されてもよい。また簡単な決定方法としては、
x2=x0
のようにx2を非文字画像分布の下限値などとしてもよい。
【0057】
第1画像判定処理モジュール214は、文字画像判定器(70i、70i+1、70i+2、70i+3、・・・)から出力される判定値yと上述したしきい値を用いて、以下の(11)式のように文字候補画像を判定する。
【数11】
次に、第1画像判定処理モジュール214における判定値y、しきい値を用いた判定動作の詳細について、図11の例に示すブロック図を用いて説明する。
文字画像判定器1100は、第1特徴量算出モジュール212で算出された特徴量0(例えば、式(1)で算出される標準偏差σs)と設定された判定関数0に基づいて判定値y0を出力する。
判定モジュール1150(第1画像判定処理モジュール214)は、文字画像判定器1100から出力された判定値y0と、文字画像判定器1100の判定関数0に基づいて決定したしきい値th0とを比較し、y0≦th0の場合は、判定結果「非文字」を出力して、対象とする文字候補画像の判定処理を終了する。y0>th0の場合は、文字候補画像を文字画像判定器1101に出力する。
【0058】
次に、文字画像判定器1101は、第1特徴量算出モジュール212で算出された特徴量1(例えば、式(2)で算出される標準偏差σc)と設定された判定関数1に基づいて判定値y1を出力する。
判定モジュール1151(第1画像判定処理モジュール214)は、文字画像判定器1101から出力された識別値y1と、前段の文字画像判定器1100から出力された判定値y0との和Y1(=y0+y1)と、文字画像判定器1101の判定関数1に基づいて決定したしきい値th1とを比較し、Y1≦th1の場合は、判定結果「非文字」を出力して、対象とする文字候補画像の識別処理を終了する。Y1>th1の場合は、文字候補画像を文字画像判定器1102に出力する。
【0059】
以下同様に、対象とする判定モジュール(1150、1151、1152、・・・)で「文字画像」と判定された場合には、後段の文字画像判定器(1101、1102、・・・110n)と判定モジュール(1151、1152、・・・、115n)において、前述の処理を繰り返す。なお、その場合には、先に述べたように、対象とする文字画像判定器(1100、1101、1102、・・・、110n)の判定値と前段までの各文字画像判定器(1100、1101、1102、・・・)の判定器値の和(例えば、判定モジュール1152では、Y2=y0+y1+y2)と対象とする判定モジュール(1150、1151、1152、・・・、115n)のしきい値との比較を行うようにする。
【0060】
図12を参照して、本実施の形態の画像処理装置のハードウェア構成例について説明する。図12に示す構成は、例えばパーソナルコンピュータ(PC)などによって構成されるものであり、スキャナ等のデータ読み取り部1217と、プリンタなどのデータ出力部1218を備えたハードウェア構成例を示している。
【0061】
CPU(Central Processing Unit)1201は、前述の実施の形態において説明した各種のモジュール、すなわち、文字認識モジュール120、文字画像判定モジュール130、第1画像判定モジュール210、第1特徴量算出モジュール212、第1画像判定処理モジュール214、第2画像判定モジュール220、第2特徴量算出モジュール222、第2画像判定処理モジュール224等の各モジュールの実行シーケンスを記述したコンピュータ・プログラムにしたがった処理を実行する制御部である。
【0062】
ROM(Read Only Memory)1202は、CPU1201が使用するプログラムや演算パラメータ等を格納する。RAM(Random Access Memory)1203は、CPU1201の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはCPUバスなどから構成されるホストバス1204により相互に接続されている。
【0063】
ホストバス1204は、ブリッジ1205を介して、PCI(Peripheral Component Interconnect/Interface)バスなどの外部バス1206に接続されている。
【0064】
キーボード1208、マウス等のポインティングデバイス1209は、操作者により操作される入力デバイスである。ディスプレイ1210は、液晶表示装置又はCRT(Cathode Ray Tube)などがあり、各種情報をテキストやイメージ情報として表示する。
【0065】
HDD(Hard Disk Drive)1211は、ハードディスクを内蔵し、ハードディスクを駆動し、CPU1201によって実行するプログラムや情報を記録又は再生させる。ハードディスクには、受け付けられた文字認識情報、文字候補画像、判定結果などが格納される。さらに、その他の各種のデータ処理プログラム等、各種コンピュータ・プログラムが格納される。
【0066】
ドライブ1212は、装着されている磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体1213に記録されているデータ又はプログラムを読み出して、そのデータ又はプログラムを、インタフェース1207、外部バス1206、ブリッジ1205、及びホストバス1204を介して接続されているRAM1203に供給する。リムーバブル記録媒体1213も、ハードディスクと同様のデータ記録領域として利用可能である。
【0067】
接続ポート1214は、外部接続機器1215を接続するポートであり、USB、IEEE1394等の接続部を持つ。接続ポート1214は、インタフェース1207、及び外部バス1206、ブリッジ1205、ホストバス1204等を介してCPU1201等に接続されている。通信部1216は、ネットワークに接続され、外部とのデータ通信処理を実行する。データ読み取り部1217は、例えばスキャナであり、ドキュメントの読み取り処理を実行する。データ出力部1218は、例えばプリンタであり、ドキュメントデータの出力処理を実行する。
【0068】
なお、図12に示す画像処理装置のハードウェア構成は、1つの構成例を示すものであり、本実施の形態は、図12に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア(例えば特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)等)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続しているような形態でもよく、さらに図12に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、複写機、ファックス、スキャナ、プリンタ、複合機(スキャナ、プリンタ、複写機、ファックス等のいずれか2つ以上の機能を有している画像処理装置)などに組み込まれていてもよい。
【0069】
なお、各モジュールの処理内容として背景技術で説明した技術を採用してもよい。また、数式を用いて説明したが、数式には、その数式と同等のものが含まれる。同等のものとは、その数式そのものの他に、最終的な結果に影響を及ぼさない程度の数式の変形、又は数式をアルゴリズミックな解法で解くこと等が含まれる。
【0070】
なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、前記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray Disc(登録商標))、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM(登録商標))、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。また、圧縮や暗号化など、復元可能であればどのような態様で記録されていてもよい。
【符号の説明】
【0071】
110…画像受付モジュール
120…文字認識モジュール
130…文字画像判定モジュール
140…判定結果出力モジュール
210…第1画像判定モジュール
212…第1特徴量算出モジュール
214…第1画像判定処理モジュール
220…第2画像判定モジュール
222…第2特徴量算出モジュール
224…第2画像判定処理モジュール
612…サイズ規格化モジュール
614…複雑度特徴量算出モジュール
616…ラン特徴量算出モジュール
【技術分野】
【0001】
本発明は、画像処理装置及び画像処理プログラムに関する。
【背景技術】
【0002】
画像内の対象物を識別する技術が知られている。
これに関連する技術として、例えば、特許文献1には、2つのクラスに属する入力データを高速かつ高精度にパターン識別し、そのための学習方法を提供することを課題とし、複数の判別方法の組み合わせを順次実行することにより、入力データを所定のクラスに分類するパターン識別において、前記判別方法の少なくとも1つにおいて、前記入力データをN(N≧2)次元特徴空間上の対応点にマッピングするマッピングステップと、前記対応点に基づいて、次の判別方法を実行するべきかどうかを判定する判定ステップと、前記判定ステップにおいて次の判別方法を実行するべきであると判定された場合に、前記対応点に基づいて、次に実行するべき判別方法を選択する選択ステップと、を有する学習方法が開示されている。
【0003】
また、例えば、特許文献2には、物体検出装置において誤検出を低減することを課題とし、画像を取得する画像取得部と、画像取得部から入力された画像から検出窓が設定されている検出窓領域画像を取り込み、検出窓領域画像に検出対象物が存在しているか否かを予め学習した情報に基づいて判定する固定識別器と、検出窓領域画像から算出した情報を辞書データに追加して検出対象物が存在しているか否かを判定する学習識別器と、固定識別器及び学習識別器からの出力に基づき検出対象物が存在するか否かを判定する判定手段とを設けることが開示されている。
【0004】
また、例えば、特許文献3には、カスケード接続された複数の識別器の段数を設置環境に適応して制御することを課題とし、物体検出装置は、画像を取得する画像取得部と、画像取得部から入力された画像から検出窓が設定されている検出窓領域画像を取り込み、検出窓領域画像に検出対象物が存在しているか否かを判定する強識別器を直列に複数段接続したカスケード型識別器である固定識別器と、強識別器を使用していない段がある場合にカスケード型識別器の使用段数を減らす識別器更新手段と、を有することが開示されている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2009−086749号公報
【特許文献2】特開2010−170201号公報
【特許文献3】特開2010−170198号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
本発明は、文字認識処理によって文字画像ではない画像に対して文字画像であると認識された誤りを減少させるようにした画像処理装置及び画像処理プログラムを提供することを目的としている。
【課題を解決するための手段】
【0007】
かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
請求項1の発明は、文字認識された文字候補画像と該文字候補画像に関する情報を受け付ける受付手段と、前記受付手段によって受け付けられた文字候補画像に関する情報に基づいて、該文字候補画像が文字画像であるか否かを判定する第1の判定手段と、前記第1の判定手段によって文字画像であると判定されなかった場合又は文字画像ではないと判定されなかった場合は、前記受付手段によって受け付けられた文字候補画像の特徴を抽出し、該文字候補画像が文字画像であるか否かを判定する第2の判定手段を具備することを特徴とする画像処理装置である。
【0008】
請求項2の発明は、前記受付手段によって受け付けられた文字候補画像に関する情報に基づいて、文字列に関する特徴量、文字間に関する特徴量、文字列に関する特徴量のいずれか1つ以上を抽出する第1の抽出手段をさらに具備し、前記第1の判定手段は、前記第1の抽出手段によって抽出された特徴量に基づいて、前記文字候補画像が文字画像であるか否かを判定することを特徴とする請求項1に記載の画像処理装置である。
【0009】
請求項3の発明は、前記受付手段によって受け付けられた文字候補画像の複雑度に関する特徴量、画素の連なりに関する特徴量のいずれか1つ以上を抽出する第2の抽出手段をさらに具備し、前記第2の判定手段は、前記第2の抽出手段によって抽出された特徴量に基づいて、前記文字候補画像が文字画像であるか否かを判定することを特徴とする請求項1又は2に記載の画像処理装置である。
【0010】
請求項4の発明は、コンピュータを、文字認識された文字候補画像と該文字候補画像に関する情報を受け付ける受付手段と、前記受付手段によって受け付けられた文字候補画像に関する情報に基づいて、該文字候補画像が文字画像であるか否かを判定する第1の判定手段と、前記第1の判定手段によって文字画像であると判定されなかった場合又は文字画像ではないと判定されなかった場合は、前記受付手段によって受け付けられた文字候補画像の特徴を抽出し、該文字候補画像が文字画像であるか否かを判定する第2の判定手段として機能させるための画像処理プログラムである。
【発明の効果】
【0011】
請求項1の画像処理装置によれば、文字認識処理によって文字画像ではない画像に対して文字画像であると認識された誤りを減少させることができる。
【0012】
請求項2の画像処理装置によれば、本構成を有していない場合に比較して、文字候補画像に関する情報を用いた文字画像であるか否かの判定を精度よく行うことができる。
【0013】
請求項3の画像処理装置によれば、本構成を有していない場合に比較して、文字候補画像の特徴を用いた文字画像であるか否かの判定を精度よく行うことができる。
【0014】
請求項4の画像処理プログラムによれば、文字認識処理によって文字画像ではない画像に対して文字画像であると認識された誤りを減少させることができる。
【図面の簡単な説明】
【0015】
【図1】本実施の形態の前提となる構成例についての概念的なモジュール構成図である。
【図2】本実施の形態の構成例についての概念的なモジュール構成図である。
【図3】文字認識情報テーブルのデータ構造例を示す説明図である。
【図4】本実施の形態による処理例を示すフローチャートである。
【図5】第1特徴量算出モジュールの具体的な例を示す説明図である。
【図6】第2特徴量算出モジュールの具体的な例を示す説明図である。
【図7】第1画像判定処理モジュールにおける判定動作処理例の概要を示す説明図である。
【図8】第1画像判定処理モジュール、第2画像判定処理モジュールにおける文字画像判定器の動作処理例を模式的に示す説明図である。
【図9】特徴量xに対する文字画像、非文字画像の分布と判定関数の関係例を示すグラフである。
【図10】特徴量xに対する文字画像、非文字画像の分布と判定関数の関係例を示すグラフである。
【図11】第1画像判定処理モジュールにおける判定値、しきい値を用いた判定動作処理例の概要を示す説明図である。
【図12】本実施の形態を実現するコンピュータのハードウェア構成例を示すブロック図である。
【発明を実施するための形態】
【0016】
<本実施の形態の前提>
本実施の形態が利用されるシステムの構成例として、図1の例に示すように、画像受付モジュール110、文字認識モジュール120、文字画像判定モジュール130、判定結果出力モジュール140を有している。
画像受付モジュール110は、文字認識モジュール120に接続されており、画像105を受け付けて、その画像105を文字認識モジュール120へ渡す。画像105を受け付けるとは、例えば、スキャナ、カメラ等で画像を読み込むこと、ファックス等で通信回線を介して外部機器から画像を受信すること、ハードディスク(コンピュータに内蔵されているものの他に、ネットワークを介して接続されているもの等を含む)等に記憶されている画像を読み出すこと等が含まれる。文字認識モジュール120が対象とする画像は、2値画像であるが、多値画像(カラー画像を含む)を受け付けた場合は、2値画像に変換すればよい。受け付ける画像は、1枚であってもよいし、複数枚であってもよい。また、画像の内容として、ビジネスに用いられる文書、広告宣伝用のパンフレット等であってもよい。
【0017】
文字認識モジュール120は、画像受付モジュール110と文字画像判定モジュール130に接続されており、対象とする画像105に対して文字認識処理を行い、その結果得られた文字候補画像とその文字認識情報125を文字画像判定モジュール130に渡す。文字候補画像とは、文字認識モジュール120によって文字領域として認識された画像領域である。つまり、文字認識モジュール120によって文字として認識された1文字分の画像である。そして、その文字候補画像に関する情報(以下、文字認識情報ともいう)は、例えば、文字列矩形情報、文字矩形情報、文字コード情報、文字の認識確度情報等である。つまり、文字認識モジュール120によって文字候補画像を抽出、認識するのに要した情報、認識した結果、その認識結果に関わる情報によって構成されている。
文字認識モジュール120で用いる文字認識技術に関しては、従来技術としてさまざまな方式があるが、本実施の形態においては、文字認識情報や文字候補画像を出力可能な技術であれば、そのうちどれかを用いればよい。
【0018】
文字画像判定モジュール130は、文字認識モジュール120と判定結果出力モジュール140に接続されており、文字認識モジュール120から渡された文字候補画像が文字画像か非文字画像かを判定し、その結果を判定結果出力モジュール140に渡す。図2以降を用いて後述する。文字認識モジュール120によって文字画像として文字認識された画像であったとしても、文字認識モジュール120のアルゴリズム、エラー等によって文字画像でない場合もあり得る。そのような場合であっても、文字画像判定モジュール130は、文字候補画像が文字画像であるか否かを判定し、文字画像ではない画像に対する文字認識結果を排除し得るようにするものである。文字画像判定モジュール130内のモジュール構成、処理等については、図2以降を用いて後述する。
【0019】
判定結果出力モジュール140は、文字画像判定モジュール130と接続されており、文字画像判定モジュール130による判定結果である判定結果(「文字」又は「非文字」)145を出力する。判定結果(「文字」又は「非文字」)145を出力するとは、例えば、文字認識モジュール120による認識結果を用いる他の情報処理装置へ渡すこと、画像データベース等の画像記憶装置へ画像105と文字と判定された文字画像の文字認識情報(認識結果である文字コード情報とその文字画像の位置情報である文字矩形情報だけでもよい)とともに対応させて書き込むこと、メモリーカード等の記憶媒体に記憶すること等の他に、プリンタ等の印刷装置で印刷すること、ディスプレイ等の表示装置に表示すること等が含まれる。また、文字画像判定モジュール130による判定結果を用いて、文字画像ではないと判定された文字認識結果は出力せずに、文字画像であると判定された文字認識結果だけを出力するようにしてもよい。
【0020】
<実施の形態>
以下、図面に基づき本発明を実現するにあたっての好適な一実施の形態の例を説明する。
図2は、本実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、それらのモジュールとして機能させるためのコンピュータ・プログラム(コンピュータにそれぞれの手順を実行させるためのプログラム、コンピュータをそれぞれの手段として機能させるためのプログラム、コンピュータにそれぞれの機能を実現させるためのプログラム)、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するの意である。また、モジュールは機能に一対一に対応していてもよいが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態に応じて、又はそれまでの状況・状態に応じて定まることの意を含めて用いる。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。もちろんのことながら、「システム」には、人為的な取り決めである社会的な「仕組み」(社会システム)にすぎないものは含まない。
また、各モジュールによる処理毎に又はモジュール内で複数の処理を行う場合はその処理毎に、対象となる情報を記憶装置から読み込み、その処理を行った後に、処理結果を記憶装置に書き出すものである。したがって、処理前の記憶装置からの読み込み、処理後の記憶装置への書き出しについては、説明を省略する場合がある。なお、ここでの記憶装置としては、ハードディスク、RAM(Random Access Memory)、外部記憶媒体、通信回線を介した記憶装置、CPU(Central Processing Unit)内のレジスタ等を含んでいてもよい。
【0021】
本実施の形態である画像処理装置は、文字認識された文字候補画像が文字画像であるか否かを判定するものであって、図2の例に示すように、文字画像判定モジュール130は第1画像判定モジュール210、第2画像判定モジュール220を有している。
【0022】
文字画像判定モジュール130は、文字認識モジュール120によって文字認識された文字候補画像とその文字認識情報125を受け付ける。
第1画像判定モジュール210は、文字画像判定モジュール130によって受け付けられた文字認識情報に基づいて、その文字候補画像が文字画像であるか否かを判定する。
第1画像判定モジュール210は、第1特徴量算出モジュール212、第1画像判定処理モジュール214を有している。
第1特徴量算出モジュール212は、文字画像判定モジュール130によって受け付けられた文字認識情報に基づいて、文字列に関する特徴量、文字間に関する特徴量、文字列に関する特徴量のいずれか1つ以上を抽出する。
第1画像判定処理モジュール214は、第1特徴量算出モジュール212によって抽出された特徴量に基づいて、文字候補画像が文字画像であるか否かを判定する。
【0023】
第2画像判定モジュール220は、文字候補画像から画像処理で得られる情報に基づいて判定を行う。つまり、第1画像判定モジュール210によって文字画像であると判定されなかった場合又は文字画像ではないと判定されなかった場合は、文字画像判定モジュール130によって受け付けられた文字候補画像の特徴を抽出し、その文字候補画像が文字画像であるか否かを判定する。
第2画像判定モジュール220は、第2特徴量算出モジュール222、第2画像判定処理モジュール224を有している。
第2特徴量算出モジュール222は、文字画像判定モジュール130によって受け付けられた文字候補画像の複雑度に関する特徴量、画素の連なりに関する特徴量のいずれか1つ以上を抽出する。
第2画像判定処理モジュール224は、第2特徴量算出モジュール222によって抽出された特徴量に基づいて、対象としている文字候補画像が文字画像であるか否かを判定する。
【0024】
第1画像判定処理モジュール214が、文字画像であることを高い確度で判定するモジュールである場合は、文字画像であると判定されなかった場合に第2画像判定処理モジュール224による判定を行う。「文字画像であると判定されなかった場合」とは、文字画像ではないと判定した場合と、「文字画像である」又は「文字画像ではない」のいずれにも判定できなかった場合を含む。
第1画像判定処理モジュール214が、文字画像でないことを高い確度で判定するモジュールである場合は、文字画像でないと判定されなかった場合に第2画像判定処理モジュール224による判定を行う。「文字画像でないと判定されなかった場合」とは、文字画像であると判定した場合と、「文字画像である」又は「文字画像ではない」のいずれにも判定できなかった場合を含む。
つまり、第1画像判定処理モジュール214では高い確度での判定ができなかった場合に、次の第2画像判定処理モジュール224による判定を行うことになる。また、第1画像判定モジュール210が判定に用いる情報は、画像情報以外のテキスト、数値等の情報であり、第2画像判定モジュール220が判定に用いる情報は、文字候補画像そのものであり、いわゆる画像情報である。このため、第1画像判定モジュール210による判定は、第2画像判定モジュール220による判定よりも高速で行うことができ、第1画像判定モジュール210での高い確度での判定ができた場合は、第2画像判定モジュール220による判定は行わないことになる。したがって、判定結果出力モジュール140に渡す判定結果(「文字」又は「非文字」)135は、第1画像判定処理モジュール214が出力する場合もあるし、第2画像判定処理モジュール224によって出力される場合もある。
なお、ここで高い確度でとは、予め定められた確度と比較した場合に、その予め定められた確度以上又はより高いことをいう。
【0025】
ここで図2に示すブロック図と、図4に示すフローチャートで文字画像判定モジュール130における文字候補画像の判定処理の流れを説明する。
図4のステップS402において、文字画像判定モジュール130は文字認識モジュール120で得られた文字認識情報及び文字領域として認識された文字候補画像を、文字認識モジュール120によって文字列と認識された単位毎に受け付ける。
図3は文字認識モジュール120から出力される文字列単位の文字認識情報の具体的な一例を説明する図である。文字列単位の文字認識情報テーブル300は、文字列矩形情報312、文字数情報314、文字矩形情報316、文字コード情報318、認識確度情報320で構成される。
【0026】
文字列矩形情報312は、受け付けられる文字列中の全ての文字矩形(文字画像を囲む矩形)を囲む矩形の座標値(例えば、文字矩形を囲む最小の矩形の座標値)であり、左上座標(xl,yl)、右下座標(xr,yr)が格納されている。この他に、左上座標(xl,yl)と文字列矩形の幅と高さであってもよい。
文字数情報314は、受け付けられる文字列中の文字矩形数nが格納されている。
文字矩形情報316は、受け付けられる文字列中の各文字の外接矩形の座標値(例えば、文字画像を囲む最小の矩形の座標値)であり、左上座標(xl,yl)、右下座標(xr,yr)が格納されている。この他に、左上座標(xl,yl)と文字矩形の幅と高さであってもよい。
文字コード情報318は、文字列中の各文字候補画像を文字認識モジュール120が認識した結果である文字コードであり、例えば文字コードとしてunicodeで格納される。
認識確度情報320は、文字列中の各文字を文字認識モジュール120が認識した際の結果の信頼度を表す数値情報である。この数値は、ある文字の認識において、認識結果の候補が多い場合には数値は小さくなり、認識結果の候補が少ない場合は大きくなる。例えば認識結果の候補が1つしかない場合は1.0、認識結果の候補が2つの場合は0.5となる。
ここで当然であるが、文字列毎の文字認識情報テーブル300においては、文字矩形情報316、文字コード情報318、認識確度情報320は文字矩形数n分だけ格納されることになる。
【0027】
ステップS404において、第1画像判定モジュール210は、第1特徴量算出モジュール212において、図3の例を用いて先述した文字認識情報テーブル300を受け付け、その文字認識情報テーブル300から「文字列らしさ」あるいは「文字列としてのきれいさ」を数値として算出したものと文字認識情報テーブル300から得られる数値を第1の特徴量として第1画像判定処理モジュール214に出力する。なお、第1画像判定モジュール210の第1特徴量算出モジュール212の詳細は後述する。
【0028】
ステップS406において、第1画像判定モジュール210は、第1画像判定処理モジュール214において、ステップS404で算出した第1の特徴量を受け付けて、前記第1の特徴量に基づいて対象の文字候補画像が「文字」画像か「非文字」画像かを判定する。「文字」画像と判定された場合(ステップS406でYes)は、文字画像判定モジュール130はステップS412に処理を移し、判定結果として「文字」を出力する。「非文字」画像と判定された場合(ステップS406でNo)は、文字画像判定モジュール130は対象の文字候補画像を第2画像判定処理モジュール224に入力してステップS408に処理を移す。
【0029】
ステップS408において、第2画像判定モジュール220は、第2特徴量算出モジュール222において、第1画像判定モジュール210において「非文字」画像と判定された文字候補画像から、第2の画像特徴量として画像処理により特徴値(例えば、特徴値は1つであってもよいし、複数であってもよい)を算出する。なお、第2画像判定モジュール220の第2特徴量算出モジュール222の詳細は後述する。
【0030】
ステップS410において、第2画像判定モジュール220は、第2画像判定処理モジュール224において、ステップS408で算出した第2の特徴量を受け付けて、前記第2の特徴量に基づいて対象の文字候補画像が「文字」画像か「非文字」画像かを判定する。ステップS410では、「文字」と判定された場合でも「非文字」と判定された場合でも、処理をステップS412に移す。
【0031】
ステップS412において、文字画像判定モジュール130は、第1画像判定モジュール210又は第2画像判定モジュール220による判定結果(「文字」又は「非文字」)135を判定結果出力モジュール140に渡す。
ステップS414において、文字画像判定モジュール130は、受け付けた文字列内の全ての文字候補画像の処理が終了したかどうかを判定する。もし終了していなければ(ステップS414でNo)処理をステップS406に移し、ステップS406からステップS412の処理を繰り返す。受け付けた文字列内の全ての文字候補画像の処理が終了した場合(ステップS414でYes)には処理をステップS416に移す。
ステップS416において、文字画像判定モジュール130は、文字認識モジュール120で認識された全ての文字列の処理が終了したかどうか判定する。終了していなければ(ステップS416でNo)処理をステップS402に移し、次の文字列に対してステップS402からステップS414までの処理を繰り返す。全ての文字列の処理が終了した場合(ステップS416でYes)には、文字画像判定モジュール130は文字画像判定処理を終了する(ステップS499)。
【0032】
次に、第1画像判定モジュール210の第1特徴量算出モジュール212による処理の詳細について説明する。
図5(a)は第1特徴量算出モジュール212の具体的な一例を説明する図である。図5(a)に示す具体例では、第1特徴量算出モジュール212aは、文字列特徴量算出モジュール512a、文字間特徴量算出モジュール514a、単文字特徴量算出モジュール516aを有している。
【0033】
文字列特徴量算出モジュール512aは、図3の例に示した文字列毎の文字認識情報テーブル300を用いて、「文字列らしさ」あるいは「文字列としてのきれいさ」を数値として算出する。ここで言う「文字列らしさ」あるいは「文字列としてのきれいさ」とは、文字列毎にその文字列内の各文字の並びが揃っている、又は各文字の大きさが均一かどうかということを意味するものである。したがって、例えば、対象としている文字列内の各文字のサイズはほぼ均一で、文字列の中心に沿って均等な距離で並んでいる場合は、その文字列は「文字列らしい」あるいは「文字列としてきれい」とする。その反対に文字列内の各文字がばらばらに位置していたり、各文字の大きさが極端に異なっていたりする場合は、その文字列は「文字列らしくない」あるいは「文字列としてきれい」ではないとする。言い換えれば、「文字列らしさ」あるいは「文字列のきれいさ」は文字列内の文字の並びや大きさのばらつきを数値化したものである。なお、「各文字のサイズがほぼ均一」とは、例えば、文字サイズの分散が予め定められた値よりも小さいこと又は以下であることをいう。また、「均等な距離で並んでいる場合」の「均等」として、例えば、各距離が予め定められた範囲内にあることも含める。「各文字がばらばらに位置する場合」とは、例えば、均等な距離で並んでいない場合をいう。「各文字の大きさが極端に異なっている場合」とは、例えば、文字サイズの分散が予め定められた値よりも大きいこと又は以上であることをいう。
【0034】
ここで、文字列特徴量算出モジュール512aにおいて、図3の例に示す文字認識情報テーブル300を用いて算出される「文字列らしさ」あるいは「文字列のきれいさ」を表す特徴量の具体的な一例を示す。
1.文字列内の文字矩形高さ(又は文字矩形幅)の標準偏差σs
【数1】
ここで、siはi番目の文字矩形高さ(又は文字矩形幅)、s((1)式のΣ内のカッコ内で−の項をいい、以下の説明では単にsとする)は文字列中の文字矩形高さ(又は文字矩形幅)の平均値、nは文字列中の文字矩形数をそれぞれ表す。
【0035】
2.(文字列中央値−文字中央値)の標準偏差σc
【数2】
ここで、ciはi番目の文字矩形の重心のy座標値(又はx座標値)と文字矩形の重心のy座標値(又はx座標値)の差分の絶対値、c((2)式のΣ内のカッコ内で−の項をいい、以下の説明では単にcとする)はciの平均値、nは文字列中の文字矩形数をそれぞれ表す。
【0036】
3.文字列高さ(あるいは文字列幅)対する平均文字矩形高さ(又は文字矩形幅)rs
【数3】
ここで、sは文字列中の文字矩形高さ(又は文字矩形幅)の平均値、lsは文字列高さ(あるいは文字列幅)をそれぞれ表す。
【0037】
4.認識確度平均値cf((4)式の左辺をいい、以下の説明では単にcfとする)
【数4】
ここで、cfiは文字列中のi番目の文字の認識確度値を表す。
【0038】
文字間特徴量算出モジュール514aは、図3の例に示した文字認識情報テーブル300のうち文字コード情報318を用いて、あるN文字間の文字並びが出現する出現頻度を算出する。例えば、N=2として、2文字間の文字並びが出現する出現頻度を算出する。この出現頻度は、よく使われる単語や単語+助詞などの場合には高い数値となり、あまり出現しないような文字並びの場合は低い数値となる。例えば、本実施の形態における文字間特徴量算出モジュール514aでは、既存のNgramデータと文字コード情報318を用いて、bigram(2文字間)、trigram(3文字間)の値を算出する。
単文字特徴量算出モジュール516aは、図3の例に示した文字認識情報テーブル300のうち文字認識確度情報320を出力する。
【0039】
第1画像判定モジュール210においては、第1特徴量算出モジュール212aを構成する3つの算出モジュールである文字列特徴量算出モジュール512a、文字間特徴量算出モジュール514a、単文字特徴量算出モジュール516aの全てで特徴量を算出することが望ましいが、これに限定されるわけではない。例えば図3の例に示した文字認識情報テーブル300のうち、文字認識モジュール120が文字認識情報テーブル300として認識確度情報320を出力しない、又は認識確度情報320を算出しないので出力できないなどの場合は、図5(b)の例に示すように、文字列特徴量算出モジュール512b、文字間特徴量算出モジュール514bで第1特徴量算出モジュール212bを構成するようにしてもよい。
【0040】
また、文字間の文字並びの出現頻度を算出するためのNgramデータなどの出現頻度データが用意できない場合や、システムの構成上それらのデータを格納する記憶容量が制限される場合には、図5(c)の例に示すように、文字列特徴量算出モジュール512c、単文字特徴量算出モジュール516cで第1特徴量算出モジュール212cを構成するようにしてもよい。
【0041】
さらには、前記2つのいずれにも該当する場合には、図5(d)の例に示すように、文字列特徴量算出モジュール512dだけで第1特徴量算出モジュール212dを構成することも可能である。この場合は先に説明した認識確度平均値は算出されない。
つまり、第1画像判定モジュール210の第1特徴量算出モジュール212dは、どのような既存の文字認識モジュール120を用いても文字認識情報として出力される、又は容易に算出できる文字列矩形と文字矩形の座標情報から「文字列らしさ」又は「文字列のきれいさ」を数値として算出する文字列特徴量算出モジュール512dを基本構成要素とすることで、文字判定装置の構成上の制限や文字認識モジュール120から出力される文字認識情報の仕様により柔軟に対応することが可能である。また、第1特徴量算出モジュール512dにおける特徴量の算出は、第1特徴量算出モジュール212にとっては、テキスト、数値等の情報である図3の例に示した文字認識情報テーブル300に基づいて算出されるため、後述する第2特徴量算出モジュール222による計算量よりも少なくなる。
【0042】
次に、第2画像判定モジュール220の第2特徴量算出モジュール222の詳細について説明する。
図6は、第2特徴量算出モジュール222の具体的な一例を説明する図である。図6に示す具体例では、第2特徴量算出モジュール222は、サイズ規格化モジュール612、複雑度特徴量算出モジュール614、ラン特徴量算出モジュール616を有している。
【0043】
サイズ規格化モジュール612は、文字認識モジュール120で得られた文字領域として認識された文字候補画像の大きさを第2特徴量算出モジュール220の処理を行うために必要な予め定められた大きさに規格化する。規格化するサイズは、例えば64×64画素サイズなどである。もちろん正方形サイズに規格化するだけに限らず、同じサイズに規格化するのであれば長方形になるように規格化してもよい。
【0044】
複雑度特徴量算出モジュール614は、文字候補画像の2値画像としての複雑さに基づく特徴量を算出する。例えば、具体的には以下に示すような特徴量を算出する。
1.連結成分数
文字候補画像中の連結成分の数である。
2.連結成分周囲長
文字候補画像中の連結成分の周囲長である。文字候補画像中に連結成分が複数ある場合はその最大値あるいは平均値を算出する。
3.複雑度
複雑度cは以下の式(5)で表される値である。
【数5】
4.密度
画像密度dは以下の式(6)で表される値である。
【数6】
5.0度方向(水平方向)における黒白変化点数
文字候補画像中における0度方向(水平方向又は主走査方向)の黒画素から白画素へ変わる回数の総和である。
6.90度方向(垂直方向)における黒白変化点数
文字候補画像中における90度方向(垂直方向又は副走査方向)の黒画素から白画素へ変わる回数の総和である。
【0045】
ラン特長量算出モジュール616は、文字候補画像のランレングスに基づく特徴量を算出する。例えば、具体的には以下に示すような特徴量を算出する。
1.ラン長(4方向)
それぞれ0度、45度、90度、135度方向のラン長である。ここで算出されるラン長は文字候補画像内の連結成分に対するそれぞれの方向における最大値あるいは平均値である。
2.方向寄与度(4方向)
それぞれ0度、45度、90度、135度方向のラン長に対する方向寄与度である。方向寄与度に関しては、例えば、(「背景・文字の形状特徴と動的修正識別関数を用いた映像中テロップ認識」信学論(D−II)VOL.J83−D−2,No.7,pp.1658−1666)に開示されており、4方向(0度、45度、90度、135度)の文字ラン長の連続性を表すものである。方向寄与度特徴Diは以下の式(7)で算出される。
【数7】
ここで、l1、l2、l3、l4はそれぞれ0度、45度、90度、135度方向のラン長を表す。
【0046】
第2画像判定モジュール220においては、第2特徴量算出モジュール222を構成する2つの算出モジュールである複雑度特徴量算出モジュール614、ラン特長量算出モジュール616で算出する特徴量を全て用いることが望ましいがこれに限定されるわけではない。第2特徴量算出モジュール222で算出される前記の特徴量は、受け付けられた文字候補画像から画像処理で算出されるため、第1特徴量算出モジュール212における特徴量算出と比較して負荷のかかる処理となる。したがって処理負荷の軽減のため、例えば複雑度特徴量算出モジュール614における特徴量だけを算出する、あるいはラン特徴量算出モジュール616における特徴量だけを算出するといった構成をとってもよい。
反対に、処理負荷よりも判定精度がより重要な装置では、複雑度特徴量算出モジュール614、ラン特徴量算出モジュール616で算出する特徴量を増やすといった構成をとってもよい。
【0047】
以上述べてきたように、第1特徴量算出モジュール212、第2特徴量算出モジュール222は、文字列毎の文字認識情報や2値化された文字候補画像から複数の特性の異なる特徴量を算出するが、算出される各特徴量の値の範囲(値域)は異なるので、例えば算出される実数値の特徴量vに対して、(0≦v≦1)で値の正規化を行い、値の範囲を揃えて出力する特徴量を同様に扱えるようにしてもよい。
【0048】
次に、第1画像判定モジュール210における第1画像判定処理モジュール214、第2画像判定モジュール220における第2画像判定処理モジュール224の詳細について説明する。ここで第1画像判定処理モジュール214と第2画像判定処理モジュール224は、後述する文字画像判定器(700、701、702、70n)が異なるだけで動作は同一であるので、以降では第1画像判定処理モジュール214を具体例として説明する。
【0049】
第1画像判定処理モジュール214は、複数の異なる文字画像判定器(700、701、702、70n)で構成され、各文字画像判定器は、先の第1特徴量算出モジュール212の説明で述べたような特徴量を判定基準に用いて、文字候補画像が文字画像であるか否かを判定する。
【0050】
図7は、第1画像判定処理モジュール214における判定動作の概要を説明した図である。図7において、y0、y1、y2、・・・ynは、それぞれ各文字画像判定器(700、701、702、70n)からの出力である判定値であり、これら判定値についての詳細は後述する。
ここでは、図7を用いて第1画像判定処理モジュール214の動作例の概要について説明する。先に述べたように第2画像判定処理モジュール224においても文字画像判定器(700、701、702、70n)が異なるのみで動作は同一なので第2画像判定処理モジュール224の動作については省略する。
【0051】
まず、第1画像判定処理モジュール214では、文字画像判定器700が動作する。文字画像判定器700は、第1特徴量算出モジュール212で算出された1つの特徴量(図7の例における特徴量0)、例えば前述の「文字列内の文字矩形高さ(又は文字矩形幅)の標準偏差」に基づいて、判別値y0を出力する。
判定モジュール750(第1画像判定処理モジュール214)は、出力された判定値y0に基づいて、文字候補画像が文字画像か非文字画像かを判定する。ここで非文字画像と判定された場合には、判定結果を出力して第1画像判定処理モジュール214における対象としている文字候補画像に対する判定動作をここで終了する。文字画像と判定された文字候補画像は文字画像判定器701に出力される。
【0052】
文字画像判定器700で対象としている文字候補画像が文字画像と判定された場合は、次に文字画像判定器701が動作する。文字画像判定器701は、前段の文字画像判定器700と同様に第1特徴量算出モジュール212で算出された別の1つの特徴量(図7の例における特徴量1)、例えば前述の「(文字列中央値−文字中央値)の標準偏差」に基づいて、判定値y1を出力する。
判定モジュール751(第1画像判定処理モジュール214)は、出力された判定値y1に基づいて、前段の判定モジュール750と同様な動作を行う。以下同様に、前段の文字画像判定器(700、701、702、70n)が文字画像と判定した文字候補画像を、第1特徴量算出モジュール212で算出した特徴量に基づいた予め定められた判定値を用いて判定していき、最終的な判定結果を得る。
このように第1画像判定処理モジュール214は、各文字画像判定器(700、701、702、・・・)で文字画像と判定された場合は後段の文字画像判定器(701、702、・・・、70n)へ文字候補画像を出力して判定動作を行い、非文字画像と判定された場合は判定結果を出力して、判定動作を終了する。つまり、第1画像判定処理モジュール214は、受け付けられた文字候補画像に対して、あきらかに非文字画像と判定できる対象に関してはできるだけ前段の文字画像判定器(700、701、702、・・・、70n)で判断し、文字画像に関しては多くの文字画像判定器(700、701、702、・・・、70n)の判断で判定を行うように動作する。
【0053】
次に、文字画像判定器について説明する。
図8は、第1画像判定処理モジュール214、第2画像判定処理モジュール224における文字画像判定器(70i、70i+1、70i+2、70i+3、・・・)の動作例を模式的に表したものである。図8の例に示すように、文字画像判定器(70i、70i+1、70i+2、70i+3、・・・)は、第1特徴量算出モジュール212、第2特徴量算出モジュール222からの特徴量xiを受け付け、文字画像判定器(70i、70i+1、70i+2、70i+3、・・・)毎に設定された判定関数yにしたがって判定値yiを出力する。ここで判定関数yは、以下の式(8)で表される1入力1出力関数である。
【数8】
つまり、第1特徴量算出モジュール212、第2特徴量算出モジュール222からの出力である特徴量xiに対して、式(8)にしたがって一意に判定値yiが出力される。
【0054】
ここで、例えば第1特徴量算出モジュール212、第2特徴量算出モジュール222から算出される、ある特徴量に対する文字画像と非文字画像の分布が図9(a)の例で表されるような場合を考える。図9(a)の例に示すような分布は、予め多数の文字画像、非文字画像に対して、ある特徴量を算出して、それら特徴量に対する文字画像、非文字画像の頻度分布を生成することで得られる。このような分布が得られる前提において、各文字画像判定器(70i、70i+1、70i+2、70i+3)の判定関数yは、以下の式(9)で表される関数で設定する。
【数9】
これを図示したものを図9(b)の例に示す。図9(b)の例で示すように、式(9)で設定される判定関数yは特徴量xに対して、値域(−1≦y≦1)を取る関数であり、図9の例において、非文字画像分布の下限値x0、文字画像分布の上限値x1とすると、
【数10】
である。このように図9(b)に示すような判定関数yを設定することで、第1特徴量算出モジュール212、第2特徴量算出モジュール222からの出力である特徴量xiに対して一意の判定値yiが得られる。
【0055】
次に、各文字画像判定器(70i、70i+1、70i+2、70i+3)から出力された判定値yに基づく判定処理の詳細について説明する。なお先に述べたように、文字画像判定器(70i、70i+1、70i+2、70i+3)が異なるだけで、文字画像判定モジュール130における判定処理は、第1画像判定処理モジュール214と第2画像判定処理モジュール224とでは同様なので、ここでの説明でも第1画像判定処理モジュール214を具体例として説明する。
【0056】
第1画像判定処理モジュール214は、各文字画像判定器(70i、70i+1、70i+2、70i+3、・・・)から出力された判定値yに対して、しきい値を用いて文字候補画像が文字画像か、非文字画像かの判断を行う。なお、しきい値は、第1画像判定処理モジュール214による文字候補画像の判定処理とは別に、予め定められた値に設定しておくことが望ましい。
以下に、しきい値の設定方法について述べる。
各文字画像判定器(70i、70i+1、70i+2、70i+3、・・・)で用いるしきい値それぞれは、各文字画像判定器(70i、70i+1、70i+2、70i+3、・・・)毎に設定された判定関数に基づいて決定される。図10にしきい値の設定の具体的な一例を示す。図10(b)に示す具体例では、しきい値thは、特徴量x2における判定関数yの出力値で設定している。ここで特徴量x2の具体的な決定方法は、例えば、x2は文字画像分布における上位5%の個数を含む境界特徴量とする。ただしこれに限るわけではなく文字判定装置の用途、又は要求精度等により境界特徴量x2の決定方法は変更されてもよい。また簡単な決定方法としては、
x2=x0
のようにx2を非文字画像分布の下限値などとしてもよい。
【0057】
第1画像判定処理モジュール214は、文字画像判定器(70i、70i+1、70i+2、70i+3、・・・)から出力される判定値yと上述したしきい値を用いて、以下の(11)式のように文字候補画像を判定する。
【数11】
次に、第1画像判定処理モジュール214における判定値y、しきい値を用いた判定動作の詳細について、図11の例に示すブロック図を用いて説明する。
文字画像判定器1100は、第1特徴量算出モジュール212で算出された特徴量0(例えば、式(1)で算出される標準偏差σs)と設定された判定関数0に基づいて判定値y0を出力する。
判定モジュール1150(第1画像判定処理モジュール214)は、文字画像判定器1100から出力された判定値y0と、文字画像判定器1100の判定関数0に基づいて決定したしきい値th0とを比較し、y0≦th0の場合は、判定結果「非文字」を出力して、対象とする文字候補画像の判定処理を終了する。y0>th0の場合は、文字候補画像を文字画像判定器1101に出力する。
【0058】
次に、文字画像判定器1101は、第1特徴量算出モジュール212で算出された特徴量1(例えば、式(2)で算出される標準偏差σc)と設定された判定関数1に基づいて判定値y1を出力する。
判定モジュール1151(第1画像判定処理モジュール214)は、文字画像判定器1101から出力された識別値y1と、前段の文字画像判定器1100から出力された判定値y0との和Y1(=y0+y1)と、文字画像判定器1101の判定関数1に基づいて決定したしきい値th1とを比較し、Y1≦th1の場合は、判定結果「非文字」を出力して、対象とする文字候補画像の識別処理を終了する。Y1>th1の場合は、文字候補画像を文字画像判定器1102に出力する。
【0059】
以下同様に、対象とする判定モジュール(1150、1151、1152、・・・)で「文字画像」と判定された場合には、後段の文字画像判定器(1101、1102、・・・110n)と判定モジュール(1151、1152、・・・、115n)において、前述の処理を繰り返す。なお、その場合には、先に述べたように、対象とする文字画像判定器(1100、1101、1102、・・・、110n)の判定値と前段までの各文字画像判定器(1100、1101、1102、・・・)の判定器値の和(例えば、判定モジュール1152では、Y2=y0+y1+y2)と対象とする判定モジュール(1150、1151、1152、・・・、115n)のしきい値との比較を行うようにする。
【0060】
図12を参照して、本実施の形態の画像処理装置のハードウェア構成例について説明する。図12に示す構成は、例えばパーソナルコンピュータ(PC)などによって構成されるものであり、スキャナ等のデータ読み取り部1217と、プリンタなどのデータ出力部1218を備えたハードウェア構成例を示している。
【0061】
CPU(Central Processing Unit)1201は、前述の実施の形態において説明した各種のモジュール、すなわち、文字認識モジュール120、文字画像判定モジュール130、第1画像判定モジュール210、第1特徴量算出モジュール212、第1画像判定処理モジュール214、第2画像判定モジュール220、第2特徴量算出モジュール222、第2画像判定処理モジュール224等の各モジュールの実行シーケンスを記述したコンピュータ・プログラムにしたがった処理を実行する制御部である。
【0062】
ROM(Read Only Memory)1202は、CPU1201が使用するプログラムや演算パラメータ等を格納する。RAM(Random Access Memory)1203は、CPU1201の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはCPUバスなどから構成されるホストバス1204により相互に接続されている。
【0063】
ホストバス1204は、ブリッジ1205を介して、PCI(Peripheral Component Interconnect/Interface)バスなどの外部バス1206に接続されている。
【0064】
キーボード1208、マウス等のポインティングデバイス1209は、操作者により操作される入力デバイスである。ディスプレイ1210は、液晶表示装置又はCRT(Cathode Ray Tube)などがあり、各種情報をテキストやイメージ情報として表示する。
【0065】
HDD(Hard Disk Drive)1211は、ハードディスクを内蔵し、ハードディスクを駆動し、CPU1201によって実行するプログラムや情報を記録又は再生させる。ハードディスクには、受け付けられた文字認識情報、文字候補画像、判定結果などが格納される。さらに、その他の各種のデータ処理プログラム等、各種コンピュータ・プログラムが格納される。
【0066】
ドライブ1212は、装着されている磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体1213に記録されているデータ又はプログラムを読み出して、そのデータ又はプログラムを、インタフェース1207、外部バス1206、ブリッジ1205、及びホストバス1204を介して接続されているRAM1203に供給する。リムーバブル記録媒体1213も、ハードディスクと同様のデータ記録領域として利用可能である。
【0067】
接続ポート1214は、外部接続機器1215を接続するポートであり、USB、IEEE1394等の接続部を持つ。接続ポート1214は、インタフェース1207、及び外部バス1206、ブリッジ1205、ホストバス1204等を介してCPU1201等に接続されている。通信部1216は、ネットワークに接続され、外部とのデータ通信処理を実行する。データ読み取り部1217は、例えばスキャナであり、ドキュメントの読み取り処理を実行する。データ出力部1218は、例えばプリンタであり、ドキュメントデータの出力処理を実行する。
【0068】
なお、図12に示す画像処理装置のハードウェア構成は、1つの構成例を示すものであり、本実施の形態は、図12に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア(例えば特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)等)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続しているような形態でもよく、さらに図12に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、複写機、ファックス、スキャナ、プリンタ、複合機(スキャナ、プリンタ、複写機、ファックス等のいずれか2つ以上の機能を有している画像処理装置)などに組み込まれていてもよい。
【0069】
なお、各モジュールの処理内容として背景技術で説明した技術を採用してもよい。また、数式を用いて説明したが、数式には、その数式と同等のものが含まれる。同等のものとは、その数式そのものの他に、最終的な結果に影響を及ぼさない程度の数式の変形、又は数式をアルゴリズミックな解法で解くこと等が含まれる。
【0070】
なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、前記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray Disc(登録商標))、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM(登録商標))、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。また、圧縮や暗号化など、復元可能であればどのような態様で記録されていてもよい。
【符号の説明】
【0071】
110…画像受付モジュール
120…文字認識モジュール
130…文字画像判定モジュール
140…判定結果出力モジュール
210…第1画像判定モジュール
212…第1特徴量算出モジュール
214…第1画像判定処理モジュール
220…第2画像判定モジュール
222…第2特徴量算出モジュール
224…第2画像判定処理モジュール
612…サイズ規格化モジュール
614…複雑度特徴量算出モジュール
616…ラン特徴量算出モジュール
【特許請求の範囲】
【請求項1】
文字認識された文字候補画像と該文字候補画像に関する情報を受け付ける受付手段と、
前記受付手段によって受け付けられた文字候補画像に関する情報に基づいて、該文字候補画像が文字画像であるか否かを判定する第1の判定手段と、
前記第1の判定手段によって文字画像であると判定されなかった場合又は文字画像ではないと判定されなかった場合は、前記受付手段によって受け付けられた文字候補画像の特徴を抽出し、該文字候補画像が文字画像であるか否かを判定する第2の判定手段
を具備することを特徴とする画像処理装置。
【請求項2】
前記受付手段によって受け付けられた文字候補画像に関する情報に基づいて、文字列に関する特徴量、文字間に関する特徴量、文字列に関する特徴量のいずれか1つ以上を抽出する第1の抽出手段
をさらに具備し、
前記第1の判定手段は、前記第1の抽出手段によって抽出された特徴量に基づいて、前記文字候補画像が文字画像であるか否かを判定する
ことを特徴とする請求項1に記載の画像処理装置。
【請求項3】
前記受付手段によって受け付けられた文字候補画像の複雑度に関する特徴量、画素の連なりに関する特徴量のいずれか1つ以上を抽出する第2の抽出手段
をさらに具備し、
前記第2の判定手段は、前記第2の抽出手段によって抽出された特徴量に基づいて、前記文字候補画像が文字画像であるか否かを判定する
ことを特徴とする請求項1又は2に記載の画像処理装置。
【請求項4】
コンピュータを、
文字認識された文字候補画像と該文字候補画像に関する情報を受け付ける受付手段と、
前記受付手段によって受け付けられた文字候補画像に関する情報に基づいて、該文字候補画像が文字画像であるか否かを判定する第1の判定手段と、
前記第1の判定手段によって文字画像であると判定されなかった場合又は文字画像ではないと判定されなかった場合は、前記受付手段によって受け付けられた文字候補画像の特徴を抽出し、該文字候補画像が文字画像であるか否かを判定する第2の判定手段
として機能させるための画像処理プログラム。
【請求項1】
文字認識された文字候補画像と該文字候補画像に関する情報を受け付ける受付手段と、
前記受付手段によって受け付けられた文字候補画像に関する情報に基づいて、該文字候補画像が文字画像であるか否かを判定する第1の判定手段と、
前記第1の判定手段によって文字画像であると判定されなかった場合又は文字画像ではないと判定されなかった場合は、前記受付手段によって受け付けられた文字候補画像の特徴を抽出し、該文字候補画像が文字画像であるか否かを判定する第2の判定手段
を具備することを特徴とする画像処理装置。
【請求項2】
前記受付手段によって受け付けられた文字候補画像に関する情報に基づいて、文字列に関する特徴量、文字間に関する特徴量、文字列に関する特徴量のいずれか1つ以上を抽出する第1の抽出手段
をさらに具備し、
前記第1の判定手段は、前記第1の抽出手段によって抽出された特徴量に基づいて、前記文字候補画像が文字画像であるか否かを判定する
ことを特徴とする請求項1に記載の画像処理装置。
【請求項3】
前記受付手段によって受け付けられた文字候補画像の複雑度に関する特徴量、画素の連なりに関する特徴量のいずれか1つ以上を抽出する第2の抽出手段
をさらに具備し、
前記第2の判定手段は、前記第2の抽出手段によって抽出された特徴量に基づいて、前記文字候補画像が文字画像であるか否かを判定する
ことを特徴とする請求項1又は2に記載の画像処理装置。
【請求項4】
コンピュータを、
文字認識された文字候補画像と該文字候補画像に関する情報を受け付ける受付手段と、
前記受付手段によって受け付けられた文字候補画像に関する情報に基づいて、該文字候補画像が文字画像であるか否かを判定する第1の判定手段と、
前記第1の判定手段によって文字画像であると判定されなかった場合又は文字画像ではないと判定されなかった場合は、前記受付手段によって受け付けられた文字候補画像の特徴を抽出し、該文字候補画像が文字画像であるか否かを判定する第2の判定手段
として機能させるための画像処理プログラム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【公開番号】特開2013−45393(P2013−45393A)
【公開日】平成25年3月4日(2013.3.4)
【国際特許分類】
【出願番号】特願2011−184684(P2011−184684)
【出願日】平成23年8月26日(2011.8.26)
【出願人】(000005496)富士ゼロックス株式会社 (21,908)
【Fターム(参考)】
【公開日】平成25年3月4日(2013.3.4)
【国際特許分類】
【出願日】平成23年8月26日(2011.8.26)
【出願人】(000005496)富士ゼロックス株式会社 (21,908)
【Fターム(参考)】
[ Back to top ]