画像処理装置、画像処理方法、制御プログラム及び記録媒体

【課題】文字を含む画像を文字認識することにより文字検索の検索対象として格納する場合に、文字検索の適合率を向上すること。
【解決手段】画像から文字領域を抽出して文字情報を生成し、検索対象情報として格納する画像処理装置であって、画像を取得する入力情報取得部１２１と、第一の領域抽出方法に基づいて画像から文字領域を抽出して第一の文字情報を生成し、第一の領域抽出方法とは異なる第二の領域抽出方法に基づいて画像から文字領域を抽出して第二の文字情報を生成する文字情報認識部１２２と、第一の文字情報及び第二の文字情報を検索対象情報として検索対象ＤＢ１０６に登録する情報登録部１２３とを含むことを特徴とする。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、画像処理装置、画像処理方法、制御プログラム及び記録媒体に関し、特に、画像として表示された文字情報を検索対象の文字情報として記憶する処理に関する。
【背景技術】
【０００２】
近年、情報の電子化が推進される傾向にある。情報の電子化の一態様として、文章を含む画像をスキャン等によって取得し、その画像に表示されている文字を文字情報として認識する処理がある。このような処理は、ＯＣＲ（ＯｐｔｉｃａｌＣｈａｒａｃｔｅｒＲｅｃｏｇｎｉｔｉｏｎ：光学文字認識）と呼ばれている。
【０００３】
複数行からなる文章を含む画像に対してＯＣＲ処理を実行する場合、ＯＣＲ処理を実行する前段階の処理として、文字行領域を抽出する処理が必要となる。このような文字行領域を抽出する方法としては、例えば夫々の文字を連結して行を抽出する方法がある。また、他の方法としては、入力された文章画像を二値化した上で論理和縮小し、縮小された画像に含まれる連結成分の縦横比を判定することにより、行を抽出する方法が提案されている（例えば、特許文献１参照）。
【０００４】
また、文書のレイアウトが複雑な画像において、単一の抽出条件では抽出が困難な文字行領域を抽出するための方法も提案されている（例えば、特許文献２参照）。特許文献２に開示された方法においては、複数の異なる抽出条件夫々に基づいて複数の文字行領域が抽出される。そして、抽出された複数の文字行領域に対する文字認識結果に基づいて、採用する文字行領域が決定される。
【特許文献１】特開平５−２６６０７５号公報
【特許文献２】特開２００６−２４４３０９号公報
【発明の開示】
【発明が解決しようとする課題】
【０００５】
従来、上述したような文字認識技術は、主として文字を含む画像を文字情報として再現すること、即ち、再現性を高めることが課題とされていた。しかしながら、近年、情報の検索技術の重要性に伴い、文字認識技術によって文字を含む画像情報を文字検索の対象として格納するという要求がある。この場合、上記の再現性よりも、入力された検索語に基づいて画像に含まれる文字を抽出する適合率が重要視される。
【０００６】
上記適合率は、画像に含まれる文字行領域を正確に抽出し、文字認識を正確に実行することにより向上することができる。他方、文字行領域が正確に抽出されない場合、その画像に含まれる文章を正確に文字認識することができない。その結果、画像として含まれている文字を文字情報として格納することが出来ないため、文字検索を実行しても正しい検索結果を得ることができず、適合率が低下する。
【０００７】
換言すると、文字認識を実行することにより、文字を含む画像を文字検索の検索対象として格納する場合、再現性と適合率のトレードオフとはならず、適合率が優先される。
【０００８】
本発明は、上記実情を考慮してなされたものであり、文字を含む画像を文字認識することにより文字検索の検索対象として格納する場合に、文字検索の適合率を向上することを目的とする。
【課題を解決するための手段】
【０００９】
上記課題を解決するために、請求項１に記載の発明は、文字領域を含む画像から前記文字領域を抽出して文字情報を生成し、検索対象情報として格納する画像処理装置であって、前記画像を取得する画像取得部と、前記文字領域を抽出するための第一の領域抽出方法に基づいて前記取得された画像から文字領域を抽出し、第一の文字情報を生成する第一の文字領域抽出部と、前記第一の領域抽出方法とは異なる第二の領域抽出方法に基づいて前記取得された画像から文字領域を抽出し、第二の文字情報を生成する第二の文字領域抽出部と、前記第一の文字情報及び前記第二の文字情報を前記検索対象情報として記録媒体に格納する情報格納部とを含むことを特徴とする。
【００１０】
また、請求項２に記載の発明は、請求項１に記載の画像処理装置において、前記第１の領域抽出方法は、文字行を認識する方向が前記第２の領域抽出方法とは異なることを特徴とする。
【００１１】
また、請求項３に記載の発明は、請求項１または２に記載の画像処理装置において、前記第１の領域抽出方法は、文字の上下を認識する方向が前記第２の領域抽出方法とは異なることを特徴とする。
【００１２】
また、請求項４に記載の発明は、請求項１乃至３いずれかに記載の画像処理装置において、前記１の領域抽出方法は、文字行において文字を読み進める方向が前記第２の領域抽出方法とは異なることを特徴とする。
【００１３】
また、請求項５に記載の発明は、請求項１乃至４いずれかに記載の画像処理装置において、前記第１の領域抽出方法は、複数の文字行において行を読み進める方向が前記第２の領域抽出方法とは異なることを特徴とする。
【００１４】
また、請求項６に記載の発明は、請求項１乃至５いずれか１に記載の画像処理装置において、前記第１の文字領域抽出部が抽出した第１の文字領域と前記第２の文字領域抽出部が抽出した第２の文字領域とが重複している場合に、前記重複している領域に表示されている文字情報を前記検索対象情報としての格納対象から除外する格納対象除外部を有し、前記格納対象除外部は、前記第１の文字領域の全体が前記第２の文字領域に含まれる場合、前記第１の文字情報を前記格納対象から除外することを特徴とする。
【００１５】
また、請求項７に記載の発明は、請求項１乃至６いずれか１に記載の画像処理装置において、前記第１の文字領域抽出部が抽出した第１の文字領域と前記第２の文字領域が抽出した第２の文字領域とが重複している場合に、前記重複している領域に表示されている文字情報を前記検索対象情報としての格納対象から除外する格納対象除外部を有し、前記格納対象除外部は、前記第１の文字領域の横方向の範囲全体が前記第２の文字領域の横方向の範囲全体に含まれ、且つ前記第１の文字領域の文字行の方向及び前記第２の文字領域の文字行の方向が所定の条件を満たす場合に、前記第１の文字情報のうち前記重複している領域に表示されている文字情報を前記格納対象から除外することを特徴とする。
【００１６】
また、請求項８に記載の発明は、請求項７に記載の画像処理装置において、前記格納対象除外部は、前記第１の文字領域の文字行の方向及び前記第２の文字領域の文字行の方向が横方向である場合に、前記第１の文字情報のうち前記重複している領域に表示されている文字情報を前記格納対象から除外することを特徴とする。
【００１７】
また、請求項９に記載の発明は、請求項１乃至８いずれか１に記載の画像処理装置において、前記第１の文字領域抽出部が抽出した第１の文字領域と前記第２の文字領域が抽出した第２の文字領域とが重複している場合に、前記重複している領域に表示されている文字情報を前記検索対象情報としての格納対象から除外する格納対象除外部を有し、前記格納対象除外部は、前記第１の文字領域の縦方向の範囲全体が前記第２の文字領域の縦方向の範囲全体に含まれ、且つ前記第１の文字領域の文字行の方向及び前記第２の文字領域の文字行の方向が所定の条件を満たす場合に、前記第１の文字情報のうち前記重複している領域に表示されている文字情報を前記格納対象から除外することを特徴とする。
【００１８】
また、請求項１０に記載の発明は、請求項９に記載の画像処理装置において、前記格納対象除外部は、前記第１の文字領域の文字行の方向及び前記第２の文字領域の文字行の方向が縦方向である場合に、前記第１の文字情報のうち前記重複している領域に表示されている文字情報を前記格納対象から除外することを特徴とする。
【００１９】
また、請求項１１に記載の発明は、請求項１乃至１０いずれかに記載の画像処理装置において、辞書情報を取得する辞書情報取得部と、前記第一の文字情報若しくは前記第二の文字情報を検索して前記取得された辞書情報に含まれる単語を抽出する辞書検索部と、前記辞書検索部による検索結果に応じて前記第一の文字情報若しくは前記第二の文字情報を前記検索対象情報としての格納対象から除外する格納対象除外部とを有することを特徴とする。
【００２０】
また、請求項１２に記載の発明は、請求項１１に記載の画像処理装置において、前記格納対象除外部は、前記第一の文字情報及び前記第二の文字情報のうち、前記辞書検索部による検索の結果抽出された単語がすべて一文字の単語であるものを前記格納対象から除外することを特徴とする。
【００２１】
また、請求項１３に記載の発明は、請求項１乃至１２に記載の画像処理装置において、前記第１の文字領域抽出部若しくは前記第２の文字領域抽出部が抽出した文字領域に表示されている文字情報を前記検索対象情報としての格納対象から除外する格納対象除外部を有し、前記格納対象除外部は、前記文字領域の行方向及び当該行方向と平行な方向の前記文字領域の幅の関係に基づいて前記文字領域に表示されている文字情報を前記格納対象から除外することを特徴とする。
【００２２】
また、請求項１４に記載の発明は、請求項１３に記載の画像処理装置において、前記格納対象除外部は、前記文字領域の幅であって前記文字領域の行方向と平行な方向の幅が所定の範囲以下である場合に、前記文字領域に表示されている文字情報を前記格納対象から除外することを特徴とする。
【００２３】
また、請求項１５に記載の発明は、請求項１乃至１４に記載の画像処理装置において、前記第１の文字領域抽出部若しくは前記第２の文字領域抽出部が抽出した文字領域に表示されている文字情報を前記検索対象情報としての格納対象から除外する格納対象除外部を有し、前記格納対象除外部は、前記文字領域の行方向及び前記文字領域のアスペクト比の関係に基づいて前記文字領域に表示されている文字情報を前記格納対象から除外することを特徴とする。
【００２４】
また、請求項１６に記載の発明は、文字領域を含む画像から前記文字領域を抽出して文字情報を生成し、検索対象情報として格納する画像処理方法であって、画像取得部が、前記画像を取得し、第一の文字領域抽出部が、前記文字領域を抽出するための第一の領域抽出方法に基づいて前記取得された画像から文字領域を抽出して第一の文字情報を生成し、第二の文字領域抽出部が、前記第一の領域抽出方法とは異なる第二の領域抽出方法に基づいて前記取得された画像から文字領域を抽出して第二の文字情報を生成し、情報格納部が、前記第一の文字情報及び前記第二の文字情報を前記検索対象情報として記録媒体に格納することを特徴とする。
【００２５】
また、請求項１７に記載の発明は、情報処理装置を、文字領域を含む画像から前記文字領域を抽出して文字情報を生成して検索対象情報として格納する画像処理装置として動作させる制御プログラムであって、前記画像を取得するステップと、前記文字領域を抽出するための第一の領域抽出方法に基づいて前記取得された画像から文字領域を抽出して第一の文字情報を生成するステップと、前記第一の領域抽出方法とは異なる第二の領域抽出方法に基づいて前記取得された画像から文字領域を抽出して第二の文字情報を生成するステップと、前記第一の文字情報及び前記第二の文字情報を前記検索対象情報として記録媒体に格納するステップとを前記情報処理装置に実行させることを特徴とする。
【００２６】
また、請求項１８に記載の発明は、記録媒体であって、請求項１４に記載の制御プログラムを情報処理装置が読み取り可能な形式で記録したことを特徴とする。
【発明の効果】
【００２７】
本発明によれば、文字を含む画像を文字認識することにより文字検索の検索対象として格納する場合に、文字検索の適合率を向上することが可能となる。
【発明を実施するための最良の形態】
【００２８】
実施の形態１．
以下、図面を参照して、本発明の実施形態を詳細に説明する。本実施形態においては、現行をスキャンして画像情報を生成し、その画像情報に対して文字認識を実行して画像情報と文字情報とを関連付けて格納する画像処理装置を例として説明する。
【００２９】
図１は、本実施形態に係る画像処理装置１のハードウェア構成を示すブロック図である。図１に示すように、本実施形態に係る画像処理装置１は、一般的なサーバやＰＣ（ＰｅｒｓｏｎａｌＣｏｍｐｕｔｅｒ）等の情報処理端末と同様の構成を含む。即ち、本実施形態に係る画像処理装置１は、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）１０、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）２０、エンジン３０、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）４０、ＮＶＲＡＭ（Ｎｏｎ―ＶｏｌａｔｉｌｅＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）５０及びＩ／Ｆ６０がバス９０を介して接続されている。また、Ｉ／Ｆ６０にはＬＣＤ（ＬｉｑｕｉｄＣｒｙｓｔａｌＤｉｓｐｌａｙ）７０及び操作部８０が接続されている。
【００３０】
ＣＰＵ１０は演算手段であり、画像処理装置１全体の動作を制御する。ＲＡＭ２０は、情報の高速な読み書きが可能な揮発性の記憶媒体であり、ＣＰＵ１０が情報を処理する際の作業領域として用いられる。エンジン３０は、スキャナやプリンタ等の画像処理機能を実行する画像処理エンジンである。ＲＯＭ４０は、読み出し専用の不揮発性記憶媒体であり、ファームウェア等のプログラムが格納されている。
【００３１】
ＮＶＲＡＭ５０は、情報の読み書きが可能な不揮発性の記憶媒体であり、ＯＳ（ＯｐｅｒａｔｉｎｇＳｙｓｔｅｍ）や各種の制御プログラム、アプリケーション・プログラム及びアプリケーション・プログラムの動作パラメータの情報等が格納される。Ｉ／Ｆ６０は、バス９０と各種のハードウェアやネットワーク等を接続し制御する。ＬＣＤ７０は、ユーザが画像処理装置１の状態を確認するための視覚的ユーザインタフェースである。操作部８０は、キーボードやマウス等、ユーザが画像処理装置１に情報を入力するためのユーザインタフェースである。
【００３２】
このようなハードウェア構成において、ＲＯＭ４０やＮＶＲＡＭ５０若しくは図示しないＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）や光学ディスク等の記憶媒体に格納されたプログラムがＲＡＭ２０に読み出され、ＲＡＭ２０に読み出されたプログラムに従ってＣＰＵ１０が動作することにより、ソフトウェア制御部が構成される。このようにして構成されたソフトウェア制御部と、ハードウェアとの組み合わせによって、本実施形態に係る画像処理装置１の機能を実現する機能ブロックが構成される。
【００３３】
図２は、本実施形態に係る画像処理装置１の機能構成を示すブロック図である。図２に示すように、本実施例に係る画像処理装置１は、コントローラ１００、ＡＤＦ（ＡｕｔｏＤｏｃｕｍｅｎｔＦｅｅｄｅｒ：原稿自動搬送装置）１０１、スキャナユニット１０２、排紙トレイ１０３、ネットワークＩ／Ｆ１０４、ディスプレイパネル１０５及び検索対象ＤＢ１０６を有する。
【００３４】
また、コントローラ１００は、主制御部１１１、エンジン制御部１１２、入出力制御部１１３、画像処理部１１４及び文字認識制御部１２０を有する。尚、図２においては、電気的接続を実線の矢印で示しており、用紙の流れを破線の矢印で示している。コントローラ１００は、図１に示すＲＡＭ２０にロードされたプログラムに従ってＣＰＵ１０が動作することにより実現される。
【００３５】
ネットワークＩ／Ｆ１０４は、画像処理装置１がクライアント端末等の他の機器と通信する際のインタフェースである。ネットワークＩ／Ｆ１０４は、図１に示すＩ／Ｆ６０によって実現される。ディスプレイパネル１０５は、画像処理装置１の状態を視覚的に表示する出力インタフェースであると共に、タッチパネルとしてユーザが画像処理装置１を直接操作する際の入力インタフェースでもある。ディスプレイパネル１０５は、図１に示すＬＣＤ７０及び操作部８０によって実現される。
【００３６】
検索対象ＤＢ１０６は、文字検索の対象となる情報が格納されているデータベースである。検索対象ＤＢ１０６は、図１に示すＮＶＲＡＭ５０や図示しないＨＤＤ等の不揮発性の記憶媒体に記憶された情報によって実現される。
【００３７】
主制御部１１１は、コントローラ１００に含まれる各部を制御する役割を担い、コントローラ１００の各部に命令を与える。エンジン制御部１１２は、スキャナユニット１０２等を制御若しくは駆動する駆動手段としての役割を担う。入出力制御部１１３は、ネットワークＩ／Ｆ１０４若しくはディスプレイパネルを介して入力される情報を主制御部１１１に入力する。また、入出力制御部１１３は、主制御部１１１の命令に従ってネットワークＩ／Ｆ１０４を介してネットワークに接続された他の装置に情報を送信する。更に入出力制御部１１３は、主制御部１１１の命令に従い、ディスプレイパネル１０５の表示を制御する。
【００３８】
画像処理部１１４は、主制御部１１１の制御に従い、スキャナユニット１０２から入力される撮像データを処理し、画像情報を生成する。この画像情報とは、スキャナ動作の結果物として図示しないＨＤＤに格納され若しくはネットワークＩ／Ｆ１０４を介してクライアント端末等に送信される情報である。
【００３９】
文字認識制御部１２０は、主制御部１１１の制御に従い、検索対象ＤＢ１０６への登録対象として入力された画像情報を解析し、文字認識を実行する。そして、文字認識制御部１２０は、実行した文字認識の結果に従い、入力された画像情報と文字認識によって生成された文字情報とを関連付けて検索対象ＤＢ１０６に格納する。文字認識制御部１２０によって提供される機能が本実施形態の要旨の１つとなる。
【００４０】
画像処理装置１がスキャナとして動作する場合は、ユーザによるディスプレイパネル１０５の操作若しくはネットワークＩ／Ｆ１０４を介して外部のクライアント装置等から入力されるスキャン実行指示に応じて、入出力制御部１１３が主制御部１１１にスキャン実行信号を転送する。主制御部１１１は、受信したスキャン実行信号に基づき、エンジン制御部１１２を制御する。
【００４１】
エンジン制御部１１２は、ＡＤＦ１０１を駆動し、ＡＤＦ１０１にセットされた撮像対象原稿をスキャナユニット１０２に搬送する。また、エンジン制御部１１２は、スキャナユニット１０２を駆動し、ＡＤＦ１０１から搬送される原稿を撮像する。また、ＡＤＦ１０１に原稿がセットされておらず、スキャナユニット１０２に直接原稿がセットされた場合、スキャナユニット１０２は、エンジン制御部１１２の制御に従い、セットされた原稿を撮像する。即ち、スキャナユニット１０２が撮像部として動作する。
【００４２】
撮像動作においては、スキャナユニット１０２に含まれるＣＣＤ等の撮像素子が原稿を光学的に走査し、光学情報に基づいて生成された撮像情報が生成される。エンジン制御部１１２は、スキャナユニット１０２が生成した撮像情報を画像処理部１１４に転送する。画像処理部１１４は、主制御部１１１の制御に従い、エンジン制御部１１２から受信した撮像情報に基づいて画像情報を生成する。
【００４３】
画像処理部１１４が生成した画像情報はＨＤＤ等の画像形成装置１に装着された記憶媒体に保存される。画像処理部１１４によって生成された画像情報は、ユーザの指示に応じてそのままＨＤＤ等に格納され若しくは入出力制御部１１３及びネットワークＩ／Ｆ１０８を介して外部の装置に送信される。
【００４４】
尚、図１、図２においては、画像処理装置１が単一の装置によって構成される場合を例としている。しかしながら、ネットワークによって接続された複数の装置に分割して図１、図２に示す機能を実現することも可能である。このような画像処理装置１において、上述したように、本実施形態の要旨は、文字認識制御部１２０による文字認識処理にある。本実施形態に係る文字認識制御部１２０について、図３を参照して更に詳細に説明する。
【００４５】
図３は、本実施形態に係る文字認識制御部１２０の詳細及び文字認識制御部１２０と主制御部１１１、検索対象ＤＢ１０６との接続関係を示すブロック図である。図３に示すように、本実施形態に係る文字認識制御部１２０は、入力情報取得部１２１、文字情報認識部１２２及び情報登録部１２３を有する。本実施形態に係る情報挿入制御部１２０は、図１に示すＲＡＭ２０にロードされたプログラムに従ってＣＰＵ１０が動作することにより構成される。
【００４６】
入力情報取得部１２１は、検索対象として検索対象ＤＢ１２０に登録すべき画像情報を入力情報として取得する。入力情報は、スキャナユニット１０２によるスキャン処理によって生成される画像情報若しくはネットワークＩ／Ｆ１０４を介して入力される画像情報である。入力情報取得部１２１は、上記入力情報を主制御部１１１から取得する。入力情報取得部１２１は、取得した入力情報を文字情報認識部１２２に入力する。
【００４７】
文字情報認識部１２２は、入力情報取得部１２１が取得した入力情報に含まれる文字情報を認識する。文字情報認識部１２２は、入力情報として取得した画像情報から文字行が表示されている文字行領域を抽出した上で、文字認識を実行する。文字情報認識部１２２は、上記文字行領域を抽出するための方法を複数種類有し、夫々の方法に基づいて文字行を抽出した上で文字認識を実行する。文字情報認識部１２２による処理は後に詳述する。
【００４８】
情報登録部１２３は、入力情報取得部１２１が取得した画像情報と文字情報認識部１２２が文字認識により生成した文字情報とを関連付けて検索対象ＤＢ１０６に登録する。
【００４９】
次に、本実施形態に係る画像処理装置１の動作について説明する。図４は、本実施形態に係る画像処理装置１の動作を示すフローチャートである。図４に示すように、まず、入力情報取得部１２１が、主制御部１１１から入力情報として画像情報を取得する（Ｓ４０１）。即ち、入力情報取得部１２１が画像取得部として機能する。図５に、本実施形態のＳ４０１において入力情報取得部１２１が取得する画像の例を示す。図５に示す入力情報は、白地に黒い文字で文章が表示された画像情報である。
【００５０】
尚、上述したように、Ｓ４０１において入力情報取得部１２１が取得する画像情報は、スキャナユニット１０２によるスキャン若しくはネットワークＩ／Ｆ１０４を介した情報の入力等により入力される。入力情報取得部１２１は、取得した入力情報を文字情報認識部１２２に入力する。
【００５１】
図５に示すような入力情報を取得すると、文字情報認識部１２２は、複数の行抽出方法から一の方法を選択する（Ｓ４０２）。そして、文字情報認識部１２２は、Ｓ４０２において選択した行抽出方法に基づいて行抽出を実行する（Ｓ４０３）。
【００５２】
まず、Ｓ４０２の処理において、黒画素を連結して黒画素の外接矩形を生成し、生成された外接矩形を横方向に連結して行を抽出する方法が選択された場合を説明する。この場合、文字情報認識部１２２は、Ｓ４０３の処理において、入力情報において連続している黒画素を認識する。そして、文字情報認識部１２２は、認識した黒画素の外接矩形を抽出する。図６は、文字認識部１２２による矩形抽出処理の態様を示す図である。
【００５３】
図６に示すように外接矩形を抽出すると、文字情報認識部１２２は、抽出した外接矩形を横方向に連結して文字行を抽出する。図７は、図６に示す外接矩形の抽出結果に基づいて横書きの行が抽出された結果を示す例である。文字行の抽出が完了すると、文字情報認識部１２２は、抽出した文字行に対して文字認識を実行する（Ｓ４０４）。文字情報認識部１２２は、Ｓ４０４において、特徴抽出、パターン辞書照合により文字画像に対応するテキストデータを抽出し、文字認識を実行する。文字認識処理においては、公知の技術を用いることが可能であり、本実施形態においては詳細な説明を省略する。
【００５４】
図８は、図７のように抽出された文字行に対して文字認識を実行した結果、生成される文字情報を示す図である。図８に示すように、図７のように抽出された文字行に対して文字認識を実行した場合、“文字認識技術は、紙データを電子化する技術の一つです。・・・対する期待は小さくなることはないようです。”という文字情報が生成される。このように、まずは文字情報認識部１２２が第一の文字領域抽出部として機能する。
【００５５】
文字認識を実行して図８に示すような文字情報を生成すると、文字情報認識部１２２は、実行可能な行抽出方法の全てを選択してＳ４０３、Ｓ４０４の処理を実行したか確認する（Ｓ４０５）。全ての行抽出方法を選択していない場合（Ｓ４０５／ＮＯ）、文字情報認識部１２２は、Ｓ４０２からの処理を繰り返す。
【００５６】
図９は、Ｓ４０２において縦書きの行抽出方法が選択された場合の行抽出結果の例を示す図である。この場合、文字情報認識部１２２は、図６に示すように抽出された外接矩形を縦方向に連結し、図９に示すように文字行を抽出する（Ｓ４０３）。文字行の抽出が完了すると、文字情報認識部１２２は、上記と同様に抽出した文字行に対して文字認識を実行する（Ｓ４０４）。
【００５７】
図１０は、図９のように抽出された文字行に対して文字認識を実行した結果、生成される文字情報を示す図である。図１０に示すように、図９のように抽出された文字行に対して文字認識を実行した場合、“つ日対一今にのだ術段ん技。・・・認。紙期字すもる文でです”という文字情報が生成される。このように、Ｓ４０２において他の行抽出方法が選択された結果、文字情報認識部１２２が第二の文字領域抽出部として機能する。
【００５８】
このように、Ｓ４０３、Ｓ４０４の処理が繰り返されることにより、同一の画像領域が異なる文字行領域として認識され、夫々異なる文字情報が生成される。そして、実行可能な行抽出方法の全てを選択し、Ｓ４０３、Ｓ４０４の処理を終えると（Ｓ４０５／ＹＥＳ）、文字情報認識部１２２は、入力情報取得部１２１から取得した画像情報及び図８、図１０に示すように生成した文字情報を情報登録部１２３に入力する。
【００５９】
情報登録部１２３は、文字情報認識部１２２から入力された情報を検索対象ＤＢ１０６に登録し（Ｓ４０６）、処理を終了する。即ち、情報登録部１２３が、検索対象ＤＢ１０６に情報を格納する情報格納部として機能する。Ｓ４０６において、情報登録部１２３は、入力情報取得部１２１がＳ４０１において取得した画像情報と、文字情報認識部１２２が生成した夫々の文字情報とを関連付けて検索対象ＤＢ１０６に登録する。図１１に、検索対象ＤＢ１０６が記憶している情報の例を示す。
【００６０】
図１１に示すように、検索対象ＤＢ１０６には、画像格納パス、文字情報１、２、３・・・の情報が関連付けられて記憶されている。画像格納パスとは、Ｓ４０１において入力情報取得部１２１が取得した画像情報の格納パスの情報である。文字情報１、２、３・・・は、文字情報認識部１２２が生成した文字情報である。検索対象ＤＢ１０６が検索される場合、文字情報１、２、３・・・が文字検索の対象となる。上述したように、文字情報認識部１２２は、複数の異なる行抽出方法に基づいて文字行領域を抽出し、複数の文字情報を生成する。従って、図１１に示すように、複数の文字情報が、画像情報に関連付けられて記憶される。
【００６１】
図８、図１０の文字情報を人間が参照すれば、図８に係る行抽出方法が正確であって図１０に係る行抽出方法が不正確であることは明らかであり、容易に判断できる。しかしながら、情報処理装置にそのような判断を実行させることは困難である。また、新聞や雑誌の誌面等、図１２に示すように縦書き、横書き及び画像とが混在した原稿においては、上記の判断はより困難となる。
【００６２】
上記判断を行なう方法も各種提案されてはいるが、その精度は十分ではない。従って、誤った文字行領域が採用される場合も多く、その場合、図１０に示すような誤った文字情報が採用される。結果的に、図８に示す正確な文字情報が検索対象とならないために検索漏れが生じ、適合率が低下してしまう。
【００６３】
本実施形態においては、図１１に示すように、複数の行抽出方法を適用して生成された文字情報を全て検索対象として格納する。これにより、正確な文字情報の登録が誤って排除されてしまうようなことがなく、検索対象情報の登録に際して、検索の適合率を向上することが可能となる。
【００６４】
以上説明したように、本実施形態に係る画像処理装置１により、文字を含む画像を文字認識することにより文字検索の検索対象として格納する場合に、文字検索の適合率を向上することが可能となる。また、上記実施形態によれば、図１０に示すような余分な文字情報も検索対象として登録されることとなる。しかしながら、図１０に示すように、誤った行抽出方法によって抽出された文字情報は文章や単語として成立しない情報である。従って、検索に際して検索ノイズが増大することはなく、検索対象情報を登録するという目的において不具合は生じない。
【００６５】
尚、上記実施形態においては、Ｓ４０２において選択される行抽出処理の種類の例として、図７、図９において説明したように、行方向が異なる行抽出処理を例として説明した。この他、正確な文字情報の抽出のために、Ｓ４０２において文字情報認識部１２２が選択可能な行抽出処理の種類は可能な限り多いことが好ましい。
【００６６】
例えば、上記実施形態においては、図４のＳ４０３の処理として、白黒の画像において黒画素を連結して文字行を抽出する例を説明した。この他、入力画像がカラー画像である場合に、色彩の近い画素を連結して画素集合を生成し、生成した画素集合を連結して文字行を抽出しても良い。即ち、行抽出方法のバリエーションとして、文字を構成する線の認識方法が異なる態様が考えられる。
【００６７】
また、上記実施形態においては、図７、図９において説明した行方向に加えて、例えば文字方向が考えられる。図１３は、設計図等に見られる紙面上のレイアウトの例を示す図である。図１３に含まれる文字情報のうち、“高さ９０ｍｍ”という文字情報は、文字方向が２７０°回転している。このように、行抽出方法のバリエーションとして、文字の上下を認識する方向が異なる態様が考えられる。
【００６８】
また、“高さ９０ｍｍ”という文字情報の行方向は縦であるが、下から上に読む特殊な行方向である。即ち、レイアウト形式によっては、行方向に加えて文字を読み進める方向（以降、文字読み方向とする）も様々である。従って、行抽出方法のバリエーションとして、文字を読み進める方向が異なる態様が考えられる。
【００６９】
同様に、図９に示すように行が抽出された場合であっても、右から左に読むのではなく、左から右に読む場合も考えられる。即ち、レイアウト形式によっては、行を読み進める際の方向（以降、行読み方向とする）も様々である。従って、行抽出方法のバリエーションとして、行を読み進める方向が異なる態様が考えられる。
【００７０】
上述したような様々なレイアウト形式に対応するため、行方向、文字方向、文字読み方向及び行読み方向等をパラメータとする行抽出方法のバリエーション情報を、文字情報認識部１２２に登録しておくことが好ましい。文字情報認識部１２２は、Ｓ４０２において、上記登録されている行抽出方法のバリエーションの１つを選択することにより、様々な態様での文字認識を実行することが可能となる。
【００７１】
図１４に、文字情報認識部１２２に登録される行抽出方法のバリエーション情報の例を示す。図１４に示すように、文字情報認識部１２２に登録される罵詈エーション情報は、行方向、文字方向、文字読み方向及び行読み方向の情報を含む。行方向は、“縦”、“横”のように、示される。文字方向は、“０°”、“２７０°”のように、文字の回転角度によって示される。図５に示すような文字であれば“０°”であり、“２７０°”であれば、図１３の“高さ・・・”の文字のように回転していることを示す。文字読み方向及び行読み方向は、文字若しくは行を読み進める方向が矢印で示されている。
【００７２】
図１４の例において、例えばＩＤ“００１”のバリエーション情報は、行方向が縦であり、文字は図１３の“高さ・・・”の文字のように回転していないことを示す。また、文字読み方向は、上から下であり、行読み方向は右から左であることを示す。
【００７３】
実施の形態２．
実施の形態１においては、図４に示すように、複数の行抽出方法に基づいて生成した文字情報を全て検索対象ＤＢ１０６に登録することにより、適合率を向上する例を説明した。上述したように、誤った行抽出方法によって生成され登録された文字情報は、検索結果に悪影響を与えることはない。しかしながら、誤った行抽出方法によって登録される文字情報により、余分な記憶領域が必要となる。本実施形態においては、検索の適合率を維持しつつ、誤った行抽出方法によって登録される文字情報を削減することにより、余分に必要となる記憶領域を低減する例を説明する。尚、実施の形態１において説明した符号と同一の符号を付す厚生は、同一または相当部を示し、説明を省略する。
【００７４】
本実施形態に係る画像処理装置１は、図１、図２及び図３において説明した態様と略同様の構成を有する。本実施形態に係る画像処理装置１は、文字認識制御部１２０による検索対象ＤＢ１０６への情報登録処理が異なる。図を参照して、文字認識制御部１２０による検索対象ＤＢ１０６への情報登録処理について説明する。
【００７５】
図１５は、本実施形態に係る文字認識制御部１２０の動作を示すフローチャートである。図１５に示すように、Ｓ１５０１〜Ｓ１５０５までは、図４において説明したＳ４０１〜Ｓ４０５と同様に処理が実行される。そして、全行抽出方法について文字認識を完了すると（Ｓ１５０５／ＹＥＳ）、文字情報認識部１２２は、誤認識によって生成された文字情報を削除する（Ｓ１５０６）。Ｓ１５０６の処理は、誤認識によって生成された文字情報を、検索対象ＤＢ１０６への格納対象から除外する処理である。即ち、文字情報認識部１２２が、格納対象除外部として機能する。
【００７６】
Ｓ１５０６において文字情報認識部１２２が実行する処理の詳細について、図１６を参照して説明する。図１６は、文字情報認識部１２２がＳ１５０６において誤認識によって生成された文字情報を削除する際の手段（以降、誤検出領域削除手段とする）の一覧を示す情報である。図１６に示すように、本実施形態に係る文字情報認識部１２２は、重複領域削除手段及び辞書検索削除手段を有する。
【００７７】
まず、重複領域削除手段について説明する。重複領域削除手段は、異なる行抽出方法によって抽出された複数の文字領域が重複している場合に、所定の条件に基づいて重複している文字領域を削除する。図１７（ａ）〜（ｄ）を参照して、重複領域削除手段による重複領域の削除太陽について説明する。
【００７８】
図１７（ａ）は、文字領域Ａの中に文字領域Ｂが含まれている場合を示す図である。図１７（ａ）に示す場合、文字情報認識部１２２は、文字領域Ａと文字領域Ｂの行方向及び文字方向等が同一であれば、斜線で示す文字領域Ｂは削除し、文字領域Ａの文字情報のみを検索対象ＤＢ１０６に登録する。文字領域Ａと文字領域Ｂの行方向及び文字方向等が同一であれば、文字領域Ｂに含まれる文字情報は文字領域Ａにも含まれている。従って、文字領域Ａの文字情報を登録することにより、削除した文字領域Ｂの文字情報も登録されるため、適合率は低下しない。
【００７９】
図１７（ｂ）は、文字領域Ｃの一部と文字領域Ｄの一部とが重複している場合を示す図である。図１７（ｂ）の例においては、文字領域Ｃの横幅が文字領域Ｄの横幅よりも広く、且つ文字領域Ｄの横方向の範囲は文字領域Ｃの横方向の範囲内に含まれている。この場合、文字情報認識部１２２は、文字領域Ｃ及び文字領域Ｄの行方向が共に横方向であれば、文字領域Ｃの全部及び文字領域Ｄから斜線で示す領域を削除した部分を検索対象ＤＢ１０６に登録する。
【００８０】
文字領域Ｃ及び文字領域Ｄの行方向が共に横方向であれば、文字領域Ｃの文字情報を全部登録することにより、斜線で示す重複部分の文字情報は全て含まれる。従って、文字領域Ｃの全部を登録することにより、削除した斜線部分の文字情報も登録されるため、適合率は低下しない。
【００８１】
図１７（ｃ）は、文字領域Ｅの一部と文字領域Ｆの一部とが重複している場合を示す図である。図１７（ｃ）の例においては、文字領域Ｅの縦幅が文字領域Ｆの縦幅よりも広く、且つ文字領域Ｆの縦方向の範囲は文字領域Ｅの縦方向の範囲内に含まれている。この場合、文字情報認識部１２２は、文字領域Ｅ及び文字領域Ｆの行方向が共に縦方向であれば、文字領域Ｅの全部及び文字領域Ｆから斜線で示す領域を削除した部分を検索対象ＤＢ１０６に登録する。
【００８２】
文字領域Ｅ及び文字領域Ｆの行方向が共に縦方向であれば、文字領域Ｅの文字情報を全部登録することにより、斜線で示す重複部分の文字情報は全て含まれる。従って、文字領域Ｅの全部を登録することにより、削除した斜線部分の文字情報も登録されるため、適合率は低下しない。
【００８３】
図１７（ｄ）は、文字領域Ｇの一部と文字領域Ｈの一部とが重複している場合を示す図である。図１７（ｄ）の例において、文字領域Ｇと文字領域Ｈとは、縦方向及び横方向が共にずれて重なっている。この場合、文字情報認識部１２２は、文字領域Ｇの文字情報と文字領域Ｈの文字情報とを夫々登録する。
【００８４】
図１７（ｄ）の場合、例えば、文字領域Ｇの全部と文字領域Ｈから斜線部を削除した部分の文字情報を登録する場合を考える。この場合、文字領域Ｇ及び文字領域Ｈの行方向が共に横方向であったとしても、文字領域Ｈから斜線部を削除することにより、斜線部とその右側の領域との文章が切断されてしまう。他方、文字領域Ｇ及び文字領域Ｈの行方向が共に縦方向であったとしても、文字領域Ｈから斜線部を削除することにより、斜線部とその下側の領域との文章が切断されてしまう。従って、図１７（ｄ）に示すような重複態様、即ち、一方の領域と他方の領域との横方向及び縦方向がずれて重複している態様では、重複領域の削除を行なわない。
【００８５】
このように、本実施形態に係る重複領域削除手段では、一方の領域の縦若しくは横方向の範囲の全てが他方の領域の縦若しくは横方向の範囲に含まれており、且つ行方向が所定の条件に合致する場合に限り、重複領域を削除する。換言すると、本実施形態においては、削除しても文字行が分割されない場合のみ、重複領域を削除する。これにより、明らかに余分な重複領域のみを削除し、検索時の適合率を維持したまま必要となる記憶領域を低減することが可能となる。
【００８６】
次に、辞書検索削除手段について説明する。辞書検索削除手段は、文字認識の結果生成された文字情報に対して辞書検索を実行し、一つも単語がヒットしなかった文字情報を削除する。このため本実施形態に係る文字情報認識部１２２は、図１８に示すように、辞書情報ＤＢ１０７にアクセス可能に構成される。即ち、文字情報認識部１２２が辞書情報取得部及び辞書検索部として機能する。尚、辞書検索削除手段は、図１７に示すような文字領域毎に辞書検索を実行する。
【００８７】
例えば、図９において説明したように行抽出が実行されて生成された図１０のような文字情報では、辞書に登録された単語が含まれることは少ないと考えられる。他方、“日”、“今”、“文”等の一文字の単語は、誤った行抽出方法によって生成された文字情報であっても含まれる。従って、辞書検索削除手段は、辞書情報ＤＢ１０７に登録された単語のうち、２文字以上の単語が含まれない文字領域を削除する。
【００８８】
このように、本実施形態に係る辞書検索削除手段では、辞書に登録されている単語が含まれない文字領域を削除する。これにより、明らかに余分な文字領域を削除し、検索時の適合率を維持したまま必要となる記憶領域を低減することが可能となる。
【００８９】
文字情報認識部１２２は、上述した重複領域削除手段及び辞書検索削除手段により明らかに不要な文字領域の文字情報を削除すると、入力情報取得部１２１から取得した画像情報及び削除されなかった文字情報を情報登録部１２３に入力する。情報登録部１２３は、図４のＳ４０６と同様に情報を登録し（Ｓ１５０７）、処理を終了する。
【００９０】
重複領域削除手段及び辞書検索削除手段が、明らかに不要と判断される文字領域の文字情報を削除することにより、検索対象ＤＢ１０６に登録される文字情報の量が低減される。検索対象ＤＢ１０６に登録される文字情報の量が低減されることにより、検索対象の情報が低減される。従って、上述したように、明らかに扶養と判断される文字領域の文字情報を削除することにより、検索に要する時間を低減することも可能となる。
【００９１】
尚、上記実施形態においては、図１６において説明したように、誤認識領域削除手段の一例として重複領域削除手段及び辞書検索削除手段を説明した。この他、明らかに不要と判断される文字領域を削除する手段であれば、誤認識領域削除手段として用いることが可能である。
【００９２】
上記誤認識領域削除手段の１つの例として、文字領域の縦若しくは横方向の幅と行方向との関係による削除が考えられる。例えば、横書きの文字領域の場合、横方向の幅が少なくとも数文字から数十文字分の幅を有すると考えられる。従って、横書きの文字領域で且つ横方向の幅が数文字分に満たない場合、例えば、１乃至３文字程度の幅である場合、その文字領域は誤認識された領域であるとして削除する。同様に、縦書きの文字領域の場合、縦方向の幅が少なくとも数文字から数十文字分の幅を有すると考えられる。従って、縦書きの文字領域で且つ縦方向の幅が上記と同様に数文字分に満たない場合、その文字領域を削除する。
【００９３】
また、文字領域の行方向とアスペクト比による削除が考えられる。例えば、横書きの文字領域の場合、縦方向よりも横方向の幅の方が広くなると考えられる。従って、横書きの文字領域で且つ横方向よりも縦方向の幅の方が広い文字領域は、誤認識された領域であるとして削除する。同様に縦書きの文字領域の場合、横方向よりも縦方向の幅の方が広くなると考えられる。従って、縦書きの文字領域で且つ縦方向よりも横方向の幅の方が広い文字領域は、上記と同様に削除する。
【図面の簡単な説明】
【００９４】
【図１】本発明の実施形態に係る画像処理装置のハードウェア構成を示すブロック図である。
【図２】本発明の実施形態に係る画像処理装置の機能構成を示すブロック図である。
【図３】本発明の実施形態に係る文字認識制御部の機能構成を示すブロック図である。
【図４】本発明の実施形態に係る画像処理装置の動作を示すフローチャートである。
【図５】本発明の実施形態に係る入力情報の例を示す図である。
【図６】本発明の実施形態に係る黒画素の外接矩形の抽出態様を示す図である。
【図７】本発明の実施形態に係る行抽出態様を示す図である。
【図８】本発明の実施形態において文字認識により生成された文字情報の例を示す図である。
【図９】本発明の実施形態に係る行抽出態様を示す図である。
【図１０】本発明の実施形態において文字認識により生成された文字情報の例を示す図である。
【図１１】本発明の実施形態に係る検索対象ＤＢが記憶している情報の例を示す図である。
【図１２】本発明の実施形態に係る読み取り原稿の例を示す図である。
【図１３】本発明の実施形態に係る読み取り原稿の例を示す図である。
【図１４】本発明の実施形態に係る文字情報認識部が記憶している行抽出方法のバリエーション情報を示す図である。
【図１５】本発明の他の実施形態に係る画像処理装置の動作を示す図である。
【図１６】本発明の他の実施形態に係る誤認識領域削除手段の一覧を示す図である。
【図１７】本発明の他の実施形態に係る誤認識領域の削除態様を示す図である。
【図１８】本発明の他の実施形態に係る文字認識制御部の機能構成を示す図である。
【符号の説明】
【００９５】
１画像処理装置
１０ＣＰＵ
２０ＲＡＭ
３０エンジン
４０ＲＯＭ
５０ＮＶＲＡＭ
６０Ｉ／Ｆ
７０ＬＣＤ
８０操作部
１００コントローラ
１０１ＡＤＦ
１０２スキャナユニット
１０３排紙トレイ
１０４ネットワークＩ／Ｆ
１０５ディスプレイパネル
１０６検索対象ＤＢ
１０７辞書情報ＤＢ
１１１主制御部
１１２エンジン制御部
１１３入出力制御部
１１４画像処理装置
１２０文字認識制御部
１２１入力情報取得部
１２２文字情報認識部
１２３情報登録部

【特許請求の範囲】
【請求項１】
文字領域を含む画像から前記文字領域を抽出して文字情報を生成し、検索対象情報として格納する画像処理装置であって、
前記画像を取得する画像取得部と、
前記文字領域を抽出するための第一の領域抽出方法に基づいて前記取得された画像から文字領域を抽出し、第一の文字情報を生成する第一の文字領域抽出部と、
前記第一の領域抽出方法とは異なる第二の領域抽出方法に基づいて前記取得された画像から文字領域を抽出し、第二の文字情報を生成する第二の文字領域抽出部と、
前記第一の文字情報及び前記第二の文字情報を前記検索対象情報として記録媒体に格納する情報格納部とを含むことを特徴とする、画像処理装置。
【請求項２】
前記第１の領域抽出方法は、文字行を認識する方向が前記第２の領域抽出方法とは異なることを特徴とする、請求項１に記載の画像処理装置。
【請求項３】
前記第１の領域抽出方法は、文字の上下を認識する方向が前記第２の領域抽出方法とは異なることを特徴とする、請求項１または２に記載の画像処理装置。
【請求項４】
前記１の領域抽出方法は、文字行において文字を読み進める方向が前記第２の領域抽出方法とは異なることを特徴とする、請求項１乃至３いずれかに記載の画像処理装置。
【請求項５】
前記第１の領域抽出方法は、複数の文字行において行を読み進める方向が前記第２の領域抽出方法とは異なることを特徴とする、請求項１乃至４いずれかに記載の画像処理装置。
【請求項６】
前記第１の文字領域抽出部が抽出した第１の文字領域と前記第２の文字領域抽出部が抽出した第２の文字領域とが重複している場合に、前記重複している領域に表示されている文字情報を前記検索対象情報としての格納対象から除外する格納対象除外部を有し、
前記格納対象除外部は、前記第１の文字領域の全体が前記第２の文字領域に含まれる場合、前記第１の文字情報を前記格納対象から除外することを特徴とする、請求項１乃至５いずれか１に記載の画像処理装置。
【請求項７】
前記第１の文字領域抽出部が抽出した第１の文字領域と前記第２の文字領域が抽出した第２の文字領域とが重複している場合に、前記重複している領域に表示されている文字情報を前記検索対象情報としての格納対象から除外する格納対象除外部を有し、
前記格納対象除外部は、前記第１の文字領域の横方向の範囲全体が前記第２の文字領域の横方向の範囲全体に含まれ、且つ前記第１の文字領域の文字行の方向及び前記第２の文字領域の文字行の方向が所定の条件を満たす場合に、前記第１の文字情報のうち前記重複している領域に表示されている文字情報を前記格納対象から除外することを特徴とする、請求項１乃至６いずれか１に記載の画像処理装置。
【請求項８】
前記格納対象除外部は、前記第１の文字領域の文字行の方向及び前記第２の文字領域の文字行の方向が横方向である場合に、前記第１の文字情報のうち前記重複している領域に表示されている文字情報を前記格納対象から除外することを特徴とする、請求項７に記載の画像処理装置。
【請求項９】
前記第１の文字領域抽出部が抽出した第１の文字領域と前記第２の文字領域が抽出した第２の文字領域とが重複している場合に、前記重複している領域に表示されている文字情報を前記検索対象情報としての格納対象から除外する格納対象除外部を有し、
前記格納対象除外部は、前記第１の文字領域の縦方向の範囲全体が前記第２の文字領域の縦方向の範囲全体に含まれ、且つ前記第１の文字領域の文字行の方向及び前記第２の文字領域の文字行の方向が所定の条件を満たす場合に、前記第１の文字情報のうち前記重複している領域に表示されている文字情報を前記格納対象から除外することを特徴とする、請求項１乃至８いずれか１に記載の画像処理装置。
【請求項１０】
前記格納対象除外部は、前記第１の文字領域の文字行の方向及び前記第２の文字領域の文字行の方向が縦方向である場合に、前記第１の文字情報のうち前記重複している領域に表示されている文字情報を前記格納対象から除外することを特徴とする、請求項９に記載の画像処理装置。
【請求項１１】
辞書情報を取得する辞書情報取得部と、
前記第一の文字情報若しくは前記第二の文字情報を検索して前記取得された辞書情報に含まれる単語を抽出する辞書検索部と、
前記辞書検索部による検索結果に応じて前記第一の文字情報若しくは前記第二の文字情報を前記検索対象情報としての格納対象から除外する格納対象除外部とを有することを特徴とする、請求項１乃至１０いずれかに記載の画像処理装置。
【請求項１２】
前記格納対象除外部は、前記第一の文字情報及び前記第二の文字情報のうち、前記辞書検索部による検索の結果抽出された単語がすべて一文字の単語であるものを前記格納対象から除外することを特徴とする、請求項１１に記載の画像処理装置。
【請求項１３】
前記第１の文字領域抽出部若しくは前記第２の文字領域抽出部が抽出した文字領域に表示されている文字情報を前記検索対象情報としての格納対象から除外する格納対象除外部を有し、
前記格納対象除外部は、前記文字領域の行方向及び当該行方向と平行な方向の前記文字領域の幅の関係に基づいて前記文字領域に表示されている文字情報を前記格納対象から除外することを特徴とする、請求項１乃至１２に記載の画像処理装置。
【請求項１４】
前記格納対象除外部は、前記文字領域の幅であって前記文字領域の行方向と平行な方向の幅が所定の範囲以下である場合に、前記文字領域に表示されている文字情報を前記格納対象から除外することを特徴とする、請求項１３に記載の画像処理装置。
【請求項１５】
前記第１の文字領域抽出部若しくは前記第２の文字領域抽出部が抽出した文字領域に表示されている文字情報を前記検索対象情報としての格納対象から除外する格納対象除外部を有し、
前記格納対象除外部は、前記文字領域の行方向及び前記文字領域のアスペクト比の関係に基づいて前記文字領域に表示されている文字情報を前記格納対象から除外することを特徴とする、請求項１乃至１４に記載の画像処理装置。
【請求項１６】
文字領域を含む画像から前記文字領域を抽出して文字情報を生成し、検索対象情報として格納する画像処理方法であって、
画像取得部が、前記画像を取得し、
第一の文字領域抽出部が、前記文字領域を抽出するための第一の領域抽出方法に基づいて前記取得された画像から文字領域を抽出して第一の文字情報を生成し、
第二の文字領域抽出部が、前記第一の領域抽出方法とは異なる第二の領域抽出方法に基づいて前記取得された画像から文字領域を抽出して第二の文字情報を生成し、
情報格納部が、前記第一の文字情報及び前記第二の文字情報を前記検索対象情報として記録媒体に格納することを特徴とする、画像処理方法。
【請求項１７】
情報処理装置を、文字領域を含む画像から前記文字領域を抽出して文字情報を生成して検索対象情報として格納する画像処理装置として動作させる制御プログラムであって、
前記画像を取得するステップと、
前記文字領域を抽出するための第一の領域抽出方法に基づいて前記取得された画像から文字領域を抽出して第一の文字情報を生成するステップと、
前記第一の領域抽出方法とは異なる第二の領域抽出方法に基づいて前記取得された画像から文字領域を抽出して第二の文字情報を生成するステップと、
前記第一の文字情報及び前記第二の文字情報を前記検索対象情報として記録媒体に格納するステップとを前記情報処理装置に実行させることを特徴とする、制御プログラム。
【請求項１８】
請求項１４に記載の制御プログラムを情報処理装置が読み取り可能な形式で記録したことを特徴とする記録媒体。

【図１】