説明

文書処理装置

【課題】OCRに用いるテンプレートを容易に作成する。
【解決手段】文書処理装置は、テンプレート画像において色マーカーが付された領域51〜53を認識し、各領域の位置を示す座標と各領域に含まれる文字列(指定文字)とを、テンプレートとして登録する。こうして登録されたテンプレートを用いて、新たに読まれた原稿の画像において、テンプレートの座標で特定される領域内で、指定文字以外の文字をOCRにより認識し、変動パラメータとして原稿画像と共に登録する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、原稿の画像から文字を抽出し、その画像の管理に用いる文書処理装置に関する。
【背景技術】
【0002】
従来、帳票を読み取り、その後に帳票内の線分を抽出し、抽出された線分に基づいて、自動的に帳票内の特定の領域を抽出することで、記入済みの帳票をOCR(Optical Character Recognition)を行うときのテンプレートを作成することが提案されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2005−267394号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
従来の技術では、帳票以外、つまり線分のない原稿では、容易にOCRテンプレートを作成することができない。
本発明の課題は、帳票に限らず様々な原稿を対象としたOCRテンプレートを容易に作成することのできる技術を提供することにある。
【課題を解決するための手段】
【0005】
以下に、課題を解決するための手段として複数の態様を説明する。これら態様は、必要に応じて任意に組み合わせることができる。
【0006】
本発明の第1見地に係る文書処理装置は、原稿から得られた画像において、指定文字に基づいて特定される文字を変動パラメータとして認識する。この文書処理装置は、画像読取部、領域位置情報取得部、指定文字取得部、およびテンプレート記憶部を備える。画像読取部は、原稿上の画像をテンプレート画像として読み取る。領域位置情報取得部は、テンプレート画像において、予め定められた特徴を有する指定領域の位置情報を領域位置情報として取得する。指定文字取得部は、指定領域に含まれる文字列から、指定文字を取得する。テンプレート記憶部は、指定文字を領域位置情報と関連付けて記憶する。
この文書処理装置によると、予め特定の様式を有する原稿を読み取って、そこから、未知の原稿において文字認識を行うべき領域を示す情報(指定領域の位置情報および指定文字)を取得することができる。従って、OCRテンプレートが容易に作成される。
【0007】
文書処理装置は、指定文字に対する変動パラメータの相対位置を表す相対位置情報を取得する相対位置情報取得部をさらに備えていてもよい。さらに、テンプレート記憶部は、相対位置情報を指定文字と関連付けて記憶してもよい。これによって、文字認識するべき領域の位置を、より厳密に規定することができる。
【0008】
領域位置情報取得部は、特定の色を示す領域を指定領域として認識することで、領域位置情報を取得してもよい。
【0009】
また、本発明の第2見地に係る文書処理装置は、原稿から得られた画像において、指定文字に基づいて特定される文字を変動パラメータとして認識する。この文書処理装置は、画像読取部、テンプレート記憶部、テンプレート認識部、および変動パラメータ抽出部を備える。画像読取部は、原稿上の画像を原稿画像として読み取る。テンプレート記憶部は、指定文字と領域位置情報とを関連付けて記憶する。テンプレート認識部は、原稿画像において、領域位置情報によって特定される領域である抽出領域内で、指定文字を認識する。変動パラメータ抽出部は、指定文字以外に抽出領域に存在する文字を変動パラメータとして抽出する。
このように、上述の領域位置情報および指定文字に基づいて、原稿画像上で、文字認識を行って変動パラメータを取得すべき領域が特定される。つまり、原稿画像の全体に対して文字認識を行うことなく、特定の領域のみについて文字認識を行うことで、必要な文字列が容易に得られる。なお、変動パラメータ抽出部は、指定文字以外に抽出領域に存在する文字の全てを変動パラメータとして抽出するだけでなく、指定文字以外に抽出領域に存在する文字の一部のみを変動パラメータとして抽出してもよい。
【0010】
文書処理装置は、抽出領域に指定文字が存在しない場合、より広い領域に対応するように領域位置情報を補正する領域位置情報補正部をさらに備えてもよい。
【0011】
文書処理装置は、変動パラメータを原稿画像と関連付けて記憶する文書記憶部をさらに備えていてもよい。
【0012】
文書処理装置は、ユーザから検索語の入力を受け付ける検索受付部と、検索語と一致する変動パラメータと関連付けられた原稿画像を、文書記憶部内の原稿画像から選択する検索部と、をさらに備えてもよい。
【0013】
また、文書処理装置は、上述の第1見地および第2見地に係る構成の両方を備えていてもよい。すなわち、文書処理装置は、画像読取部、領域位置情報取得部、指定文字取得部、テンプレート記憶部、テンプレート認識部、および変動パラメータ抽出部を備えていてもよい。画像読取部は、原稿上の画像をテンプレート画像又は原稿画像として読み取る。領域位置情報取得部は、画像読取部によって読み取られたテンプレート画像において、予め定められた特徴を有する指定領域の位置を、領域位置情報として取得する。指定文字取得部は、指定領域に含まれる文字列から、指定文字を取得する。テンプレート記憶部は、指定文字を領域位置情報と関連付けて記憶する。テンプレート認識部は、画像読取部によって読み取られた原稿画像において、領域位置情報によって特定される領域である抽出領域内で、指定文字を認識する。変動パラメータ抽出部は、指定文字以外に抽出領域に存在する文字を変動パラメータとして抽出する。
【発明の効果】
【0014】
本発明によると、予め特定の様式を有する原稿を読み取って、そこから、未知の原稿において文字認識を行うべき領域を示す情報(領域位置情報および指定文字)を取得することができる。従って、OCRテンプレートが容易に作成される。
【図面の簡単な説明】
【0015】
【図1】本発明の実施形態に係る複合機の概要を示すブロック図。
【図2】複合機におけるテンプレート登録処理のフローチャート。
【図3A】テンプレート原稿の例を示す図。
【図3B】指定領域の例を示す図。
【図3C】仮テンプレートの例を示す図。
【図4A】登録されるテンプレートの例を示す図。
【図4B】登録されるテンプレートの他の例を示す図。
【図4C】登録されるテンプレートのさらに他の例を示す図。
【図5】複合機における文書登録のフローチャート。
【図6A】原稿画像における、図4Aのテンプレートを用いたテンプレート認識および変動パラメータの抽出を模式的に示す図。
【図6B】原稿画像における、図4Bのテンプレートを用いたテンプレート認識および変動パラメータの抽出を模式的に示す図。
【図6C】原稿画像における、図4Cのテンプレートを用いたテンプレート認識および変動パラメータの抽出を模式的に示す図。
【発明を実施するための形態】
【0016】
(1)複合機の構成
図1を参照して、本実施形態の複合機について説明する。図1は、複合機1全体の構成を示すブロック図である。
【0017】
複合機1は、コピー機、プリンタ、スキャナ、およびファクシミリ装置としての機能を有する装置である。
図1に示すように、複合機1は、NCU(Network Control Unit)11、モデム12、ネットワークインターフェース13、画像読取部14、画像形成部15、操作パネル16、記憶部17および制御装置18を備える。複合機1内の各部は、バスによって接続されている。
【0018】
NCU11は、PSTN(公衆交換電話網:Public Subscriber Telephone Network)101に接続されており、電話回線を介して発呼および着呼を含む通信を制御する。
【0019】
モデム12は、デジタル信号とアナログ信号を相互変換する変復調装置である。
【0020】
ネットワークインターフェース13は、複合機1のインターネット102への接続を可能とし、複合機1の外部の機器との通信を可能とする。ネットワークインターフェース13として、LAN(Local Area Network)に接続可能なインターフェースが設けられており、複合機1が同LANに接続された他の機器との通信可能であってもよい。
画像読取部14は、原稿上の画像を読み取ることで画像データを取得する。本実施形態では、画像読取部14はカラー画像データを取得することができる。具体的には、画像読取部14は、図示しない原稿搬送装置、プラテンガラス、光源、ミラー群、レンズ、読取素子、および信号処理回路等を備える。原稿搬送装置によって搬送される原稿またはプラテンガラス上に載置された原稿は、光源によって照明される。原稿からの反射光は、ミラー群およびレンズによって読取素子上に導かれる。読取素子は受けた光に応じた電気信号を出力し、信号処理回路がこの電気信号にデジタル化等の処理を施すことで、画像データが得られる
【0021】
画像形成部15は、用紙上に画像データに沿った画像を形成する。画像形成部15としては、電子写真方式またはインクジェット方式等の方式によって画像形成を行う装置が採用される。
【0022】
操作パネル16は、表示パネルおよびタッチセンサを有するタッチパネル161;並びにハードキー162等を備える。タッチパネル161は、表示パネルによって画像を表示することで、画像形成装置の動作状況およびエラーの発生等の情報をユーザに伝えると共に、ソフトキーを介してユーザからの操作を受け付けることができる。また、ハードキーは、テンキー、実行キーおよびおキャンセルキー等のキーを含み、ユーザからの操作を受け付けることができる。ユーザは、操作パネル16を用いて、例えば、コピー、スキャンまたはファクシミリ送信等を実行する指示を入力することができる。
【0023】
記憶部17は、複合機1の電源がオフとなってもその記憶内容が消えない不揮発性メモリである。記憶部17は、具体的にはテンプレート記憶領域(テンプレート記憶部)171および文書記憶領域(文書記憶部)172を有する。テンプレート記憶領域171には、後述のテンプレートが記憶される。また、文書記憶領域172には、後述の画像データおよび変動パラメータが記憶される。
【0024】
制御装置18は、複合機1内の各部の動作を制御し、また種々の演算等の処理を実行する装置である。制御装置18は、MPU(Micro Processing Unit)等の演算装置並びにフラッシュメモリおよびSDRAM(Synchronous Dynamic Random Access Memory)等の記憶装置を備える。MPUは、フラッシュメモリ内に格納されたプログラムを読み出して実行することで、制御装置18の機能を実現する。具体的には、制御装置18は、複合機1の各部の動作を制御することで、コピー、プリント、ファクシミリ送受信およびスキャン等の動作を実行させる。また、制御装置18は、文字認識部20、テンプレート取得部31(領域位置情報取得部、指定文字取得部、相対位置情報取得部)、テンプレート認識部41、座標補正部42(領域位置情報補正部)、変動パラメータ抽出部43、および検索部44として機能する。各部の機能については後述する。フラッシュメモリは、種々のプログラムを格納する。SDRAMは、読込および書込が可能なメモリであり、MPUがプログラムを実行するときのワークエリアとして機能する。
【0025】
以上に述べた構成の他に、複合機1は、必要に応じて種々のデバイスを有する。例えば、複合機1は、図示しないCODEC(Coder and Decoder)を備えている。CODEC画像データを圧縮(符号化)/展開(復号化)する。
【0026】
(2)テンプレート登録
図2、図3A〜図3C、および図4A〜図4Cを参照して、テンプレート登録について説明する。図2はテンプレート登録の流れを示すフローチャートであり、図3Aはテンプレート原稿の例を示す図であり、図3Bは指定領域の例を示す図であり、図3Cは仮テンプレートの例を示す図である。図4A〜図4Cは、登録されるテンプレートの例である。
【0027】
(2−1)テンプレート原稿の読取:ステップS1
図2に示すように、まず、画像読取部14がテンプレート原稿50上の画像を読み取り、画像データを取得する(ステップS1)。図3Aに示すように、テンプレート原稿50は、色マーカーの付された第1指定領域51、第2指定領域52および第3指定領域53を有する
【0028】
(2−2)指定領域の座標取得:ステップS2〜S3
テンプレート取得部31は、領域位置情報取得部として機能する。
【0029】
すなわち、テンプレート取得部31は、予め指定された色が付された領域を認識することで指定領域を認識し(ステップS2)、その座標を領域位置情報として取得する(ステップS3)。例えば、予め黄色がマーカー色として指定されている場合、テンプレート取得部31は、テンプレート原稿50の画像の中で、黄色が付された領域を認識する。
なお、マーカーは、指定領域の有する特徴の一例に過ぎない。指定領域は、予め定められ、テンプレート原稿における他の領域と区別できる特徴を有していればよい。特徴としては、マーカー以外に、字体、下線、色文字等が挙げられる。
【0030】
さらに、図3Bに示すように、テンプレート取得部31は、認識された領域の対角の2点の座標を取得する。図3Bの例では、第1指定領域51に対応する領域位置情報として、座標(X11,Y11)および座標(X12,Y12)が取得される。このように特定された2つの座標を対角とする長方形の領域を、以下では「テンプレート領域」と称し、図3Aおよび図3Bでは符号“54”を付す。
【0031】
同様に、第2指定領域52に対応する第2テンプレート領域55の座標、および第3指定領域53に対応する第3テンプレート領域56の座標が取得される(図3Aおよび図3C)。
【0032】
なお、色の指定は、デフォルトで設定されていてもよいし、操作パネル16を介して入力されてもよい。
【0033】
(2−3)仮テンプレートの取得:ステップS4〜S6
テンプレート取得部31は、指定文字取得部および相対位置情報取得部としても機能する。テンプレート取得部31によって、仮テンプレートが取得され、その後テンプレートが編集されることで、最終的なテンプレート(座標、指定文字、および相対位置情報を含む)が取得される。
【0034】
まず、仮テンプレートの取得について説明する。テンプレート取得部31の制御の下、テンプレート領域に対して、文字認識部20によるOCR処理が実行される(ステップS4)。すなわち、画像データに基づいて、文字認識部20はテンプレート領域に含まれる文字列を認識する。図3Aに示すように、第1テンプレート領域54に含まれる文字列は“技術文書:ZZZ報告書”であり、第2テンプレート領域55に含まれる文字列は“日付:2010年1月15日”であり、第3テンプレート領域56に含まれる文字列は“作成者:鈴木太郎”である。
【0035】
こうして認識された文字列およびステップS3で取得された座標は、仮テンプレートとして、上述のSDRAM等の記憶媒体に記憶される(ステップS5)。1つのテンプレート原稿50内で、上述の指定された色を示す領域が他にあれば(ステップS6でNo)、他の領域について、座標取得、OCR処理および仮テンプレートの記憶が実行される(ステップS3〜S5)。1つのテンプレート原稿50内で、上述の指定された色を示す全ての領域について仮テンプレートの記憶が完了すれば(ステップS6でYes)、次の処理が行われる。
図3Aの例では、3つの指定領域51〜53について以上の処理が実行される。
【0036】
仮テンプレートについて、具体的に説明する。図3Cに示すように、仮テンプレート60は、第1情報61、第2情報62および第3情報63を有する。第1情報61は、第1テンプレート領域54の座標を有すると共に、Indexとして、第1テンプレート領域54から得られた文字列である“技術文書:ZZZ報告書”を有する。第2情報62は、第2テンプレート領域55の座標を有すると共に、Indexとして、第2テンプレート領域55から得られた文字列である“日付:2010年1月15日”を有する。第3情報63は、第3テンプレート領域56の座標を有すると共に、Indexとして、第3テンプレート領域56から得られた文字列である“作成者:鈴木太郎”を有する。
【0037】
(2−4)テンプレートの編集:ステップS7
次の処理として、仮テンプレートの編集が行われる(ステップS7)。
具体的には、タッチパネル161上に、仮テンプレート60が表示されると共に、テンプレートに含まれる情報の編集を受け付けるソフトキーが表示される。“編集”とは、追加、変更、および削除を含む。なお、編集されない情報は表示される必要はない。例えば、座標が編集不可に設定されている場合、座標は仮テンプレートとして表示されなくてもよい。
【0038】
テンプレート取得部31は、これらのソフトキーを介してユーザが行った入力に基づいて仮テンプレートを編集することで、最終的なテンプレートを取得する。最終的に得られるテンプレートは、上述の座標を含むと共に、インデックス名、指定文字および相対位置情報を含んでいてもよい。
【0039】
インデックス名は、ユーザにより指定される文字列であり、一般的には、後述の変動パラメータの分類を示す文字列である。具体的には、インデックス名として、技術文書、年間報告書、月間報告書および実験報告書等の文書の種類;作成日および提出日等の日付の種類;並びに文書の作成者、責任者および受領者等の氏名の種類を表すアルファベットが指定される。
【0040】
指定文字とは、IndexおよびDelimiterを含む概念である。指定文字には、記号も含まれる。Indexは、後述の変動パラメータに付随して表記される文字列である。Delimiterは、変動パラメータと他の文字列との間の区切りを示す記号であり、例えばIndexと変動パラメータとの区切りを示す記号である。Delimiterの記号としては、コロン又はセミコロン等が用いられる。
【0041】
相対位置情報とは、指定文字に対する変動パラメータの相対位置を示す情報であり、例えば、指定文字に対する変動パラメータの方向を表す情報である。方向の入力は、“右”、“左”、“上”および“下”の選択肢を示すソフトキーが表示され、いずれかのソフトキーが押下されることで行われる。
また、テンプレート取得部31は、ユーザからの指示に応じて、領域位置情報である座標を修正することもできる。つまり、タッチパネル161に表示された座標を見たユーザが、より適切な値を入力することで、上述の座標は修正可能である。
【0042】
テンプレートの具体例について以下に説明する。
(i)第1例
図4Aのテンプレート70は、第1テンプレート情報701、第2テンプレート情報702および第3テンプレート情報703を含む。第1テンプレート情報701、第2テンプレート情報702および第3テンプレート情報703はそれぞれ、第1情報61、第2情報62および第3情報63が編集されることで得られる情報である。テンプレート情報701〜703は、第1テンプレート領域54、第2テンプレート領域55および第3テンプレート領域56の座標をそれぞれ含むと共に、インデックス名、指定文字および相対位置情報を含む。
【0043】
図4Aに示すように、第1テンプレート情報701は、インデックス名(Index name)として、文書名である“技術文書”に対応する文字列“Technical Doc”を有する。第2テンプレート情報702は、“日付”に対応する文字列“Date”を有する。第3テンプレート情報703は、“作成者”に対応する文字列“Originator”を有する。これらの文字列は、ユーザが入力することで得られる。
【0044】
図4Aに示すように、指定文字として、第1テンプレート情報701は、Indexとして文字列“技術文書:”を有する。この文字列は、仮テンプレートの第1情報61(図3C)において、Indexに含まれる文字列“ZZZ技術文書”が、ユーザの指示に基づいて削除されることで得られる。また、第2テンプレート情報702は、Indexとして文字列“日付:”を有する。この文字列は、第2情報62のIndexに含まれる文字列“2010年1月15日”が削除されることで得られる。第3テンプレート情報703は、Indexとして文字列“作成者:”を有する。この文字列は、第3情報のIndexに含まれる文字列“鈴木太郎”が削除されることで得られる。このように、図4Aのテンプレート情報701〜703において、指定文字であるIndexは、変動パラメータの分類を示す文字列およびDelimiterの両方を含む。
【0045】
テンプレート原稿50は、指定領域51〜53中に、指定文字以外の文字列(後述の変動パラメータに相当する文字列である、“ZZZ報告書”、“2010年1月15日”、および“鈴木太郎”)を含む。それゆえ、仮テンプレート60から文字列を削除することで、指定文字が得られる。ただし、テンプレート原稿が指定文字以外の文字列を指定領域中に含まない場合、このような削除の作業は必要ない。
【0046】
図4Aに示すように、第1テンプレート情報701、第2テンプレート情報702および第3テンプレート情報703は、相対位置情報(Location)として、“右(Right)”との情報を有する。
【0047】
(ii)第2例
図4Bのテンプレート71は、指定文字として、Indexを含まず、Delimiterのみを有する。それ以外は、本例のテンプレート71は、第1例のテンプレート70と同様の構成である。具体的には、テンプレート71の第1テンプレート情報711、第2テンプレート情報712、および第3テンプレート情報713は、Delimiterとしてコロン(:)を有し、Indexを含まない。
このように、テンプレート取得部31は、仮テンプレート60に含まれる“Index”をユーザの指示に応じて削除することができるし、“Delimiter”を追加することもできる。
【0048】
(iii)第3例
図4Cのテンプレート72は、指定文字として、IndexおよびDelimiterの両方を、個別の情報として含む以外は、第1例のテンプレート70と同様の構成である。
【0049】
つまり、テンプレート72の第1テンプレート情報721は、Indexとして“技術文書”を含み、Delimiterとしてコロン含む。第2テンプレート情報722は、Indexとして“日付”を含み、Delimiterとしてコロンを含む。第3テンプレート情報723は、Indexとして“作成者”を含み、Delimiterとしてコロンを含む。
このように、テンプレート取得部31は、仮テンプレート60に含まれるIndexの一部を削除することができるし、“Delimiter”を追加することもできる。
【0050】
(2−5)テンプレートの登録:ステップS8およびS9
編集が完了した後(ステップS8でYes)、テンプレート取得部31の制御の下、編集後の最新のテンプレートが、記憶部17のテンプレート記憶領域171に記憶される(ステップS9)。こうして、テンプレート領域の座標と指定文字とが、関連付けて記憶される。
【0051】
編集の完了は、例えば、ハードキーとして設けられたスタートキーの押下、ソフトキーとして設けられた“完了”キーの押下、ソフトキーとして設けられた“保存”キーの押下等によって指示される。
【0052】
(3)文書登録
複合機1は、文字を含む原稿の画像(文書)を変動パラメータと関連付けて登録し、この変動パラメータを文書の管理に用いることができる。すなわち、変動パラメータは、インデックスとして利用される。
以下に、文書登録について図5を参照して説明する。図5は文書登録の流れを示すフローチャートである。
【0053】
(3−1)テンプレート選択:S11
複合機1は、操作パネル16により、ユーザから、以下の処理に用いるテンプレートの選択を受け付ける(ステップS11)。
【0054】
(3−2)原稿読取:S12〜S20
画像読取部14は、ユーザにセットされた原稿から画像を読み取る(ステップS12)。
【0055】
(3−3)変動パラメータの抽出:ステップS13〜S19
テンプレート認識部41は、得られた画像から、ステップS11で選択されたテンプレートに含まれる座標によって特定される領域を抽出する(ステップS13)。
【0056】
抽出された領域(以下、「抽出領域」と称する)に対して、テンプレート認識部41の制御の下、文字認識部20によってOCR処理が実行される(ステップS14)。
【0057】
テンプレート認識部41は、こうして得られた文字列に、テンプレート中の指定文字(Indexおよび/またはDelimiter)が含まれているかどうか判定する(ステップS15)。
【0058】
指定文字と一致する文字が含まれていれば(ステップS16でYes)、変動パラメータ抽出部43は、指定文字に対して、テンプレート中の相対位置情報により特定される位置に存在する文字列を、変動パラメータとして抽出する(ステップS17)。
変動パラメータ抽出部43は、抽出領域に存在する文字の全てを変動パラメータとして抽出するだけでなく、指定文字以外に抽出領域に存在する文字の一部のみを変動パラメータとして抽出してもよい。例えば、変動パラメータとして抽出すべき文字数に制限値が設けられていてもよく、抽出領域中に存在する文字列がこの制限値を超えるときは、変動パラメータ抽出部43は、この制限値に合致する数の文字列を抽出してもよい。
なお、変動パラメータ抽出部43が抽出した文字が、タッチパネル161上に表示されることで、ユーザが抽出内容を確認することができる。変動パラメータ抽出部43は、ユーザの指示等に応じて、変動パラメータの修正(一部の文字列の削除および変更等)をさらに行ってもよい。
【0059】
指定文字と一致する文字が含まれていなければ(ステップS16でNo)、座標補正部42は、抽出領域がより広くなるように、座標を補正する(ステップS18)。具体的には、1つのテンプレート情報における2つの座標のX成分同士の差および/またはY成分同士の差が大きくなるように、座標が補正される。補正後の座標報に基づいて、領域抽出以降の処理が再度行われる。
【0060】
以上の処理は、1つのテンプレートによって特定される全ての抽出領域について変動パラメータの取得が完了するまで行われる(ステップS19)。
【0061】
変動パラメータ抽出の具体例について、図6A〜図6Cを参照して説明する。図6A〜図6Cは、同一の原稿から得られた画像において、上述のテンプレート70〜72をそれぞれ用いた場合のテンプレート認識および変動パラメータの抽出を模式的に示す図面である。以下に説明する。
【0062】
(i)第1例
ステップS12で図4Aのテンプレート70が選択された場合、図6Aに示すように、原稿画像80において、第1テンプレート情報701、第2テンプレート702、および第3テンプレート703の座標に基づいて、第1抽出領域81、第2抽出領域82および第3抽出領域83が抽出される(ステップS13)。
【0063】
第1抽出領域81において、第1テンプレート情報701のIndex“技術文書:”に一致する文字列811が認識され、相対位置情報に基づいて、文字列811の右側に存在する変動パラメータ812である文字列“実験報告書”が抽出される(ステップS14〜S17)。
【0064】
第2抽出領域82では、第2テンプレート情報702のIndex“日付:”に一致する文字列821が認識され、相対位置情報に基づいて、文字列821の右側に存在する変動パラメータ822である文字列“2010年3月15日”が抽出される(ステップS14〜S17)。
【0065】
第3抽出領域83では、第3テンプレート情報703のIndex“作成者:”に一致する文字列831が認識され、相対位置情報に基づいて、文字列831の右側に存在する変動パラメータ832である文字列“田中次郎”が抽出される(ステップS14〜S17)。
【0066】
(ii)第2例
本例では、用いられるテンプレートが異なる以外、特に指定文字が異なる以外は、第1例と同じ処理がなされ、抽出される変動パラメータも同じである。
【0067】
ステップS12で図4Bのテンプレート71が選択された場合も、図6Bに示すように、原稿画像80において、第1抽出領域81、第2抽出領域82および第3抽出領域83が抽出される(ステップS13)。
【0068】
第1抽出領域81において、第1テンプレート情報711のDelimiterに一致する記号841が認識され、相対位置情報に基づいて、変動パラメータ812が抽出される(ステップS14〜S17)。
【0069】
第2抽出領域82では、第2テンプレート情報712のDelimiterに一致する記号842が認識され、相対位置情報に基づいて、変動パラメータ822が抽出される(ステップS14〜S17)。
【0070】
第3抽出領域83では、第3テンプレート情報713のDelimiterに一致する記号843が認識され、相対位置情報に基づいて、変動パラメータ832が抽出される(ステップS14〜S17)。
【0071】
(iii)第3例
本例では、用いられるテンプレートが異なる以外、特に指定文字が異なる以外は、第1例と同じ処理がなされ、抽出される変動パラメータも同じである。
【0072】
ステップS12で図4Cのテンプレート72が選択された場合も、図6Cに示すように、原稿画像80において、第1抽出領域81、第2抽出領域82および第3抽出領域83が抽出される(ステップS13)。
【0073】
第1抽出領域81において、第1テンプレート情報721のIndex“技術文書”に一致する文字列記号851およびDelimiterに一致する記号841が認識される(ステップS14〜S16)。そして、相対位置情報に基づいて、記号841の右側に存在する変動パラメータ812が抽出される(ステップS14〜S17)。
【0074】
第2抽出領域82では、第2テンプレート情報722のIndex“日付”に一致する文字列852およびDelimiterに一致する記号842が認識される(ステップS14〜S16)。そして、相対位置情報に基づいて、記号842の右側に存在する変動パラメータ822が抽出される(ステップS14〜S17)。
【0075】
第3抽出領域83では、第3テンプレート情報723のIndex“作成者”に一致する文字列853およびDelimiterに一致する記号843が認識される(ステップS14〜S16)。そして、相対位置情報に基づいて、記号843の右側に存在する変動パラメータ832が抽出される(ステップS14〜S17)。
【0076】
(3−4)文書登録:ステップS20
変動パラメータの取得が完了した後(ステップS19でYes)、原稿の画像データと変動パラメータとが関連付けられて、文書記憶領域172に記憶される(ステップS20)。具体的には、変動パラメータはXML(Extensible Markup Language)データとして保存される。
【0077】
(4)文書検索
こうして登録された変動パラメータは、例えば文書の分類および検索に用いられる。
ユーザが操作、パネル16を介して、検索語を入力し、さらに検索実行を指示したとき、検索部44は、この検索語に一致する変動パラメータを有する画像を文書記憶領域172内で検索する。検索結果はタッチパネル161上に表示される。こうして、ユーザは容易に目的の画像を入手することができる。
なお、検索部44においては、部分一致または完全一致等の検索方法が、デフォルトで設定されていてもよいし、ユーザの指定によって検索方法が変更可能であってもよい。
【0078】
以上、本発明の一実施形態について説明したが、本発明は上記実施形態に限定されるものではなく、発明の要旨を逸脱しない範囲で種々の変更が可能である
【0079】
(5)特徴
複合機1は、原稿から得られた画像において、指定文字に基づいて特定される文字を変動パラメータとして認識する。この複合機1は、画像読取部14、テンプレート取得部31、およびテンプレート記憶領域171を備える。画像読取部14は、原稿上の画像を読み取る。テンプレート取得部31は、画像読取部14によって読み取られたテンプレート画像において、予め定められた特徴を有する指定領域51〜54の座標を取得する。テンプレート取得部31は、指定領域51〜54に含まれる文字列から、指定文字を取得する。テンプレート記憶領域171は、指定文字を座標と関連付けて記憶する。
【0080】
この複合機1によると、予め特定の様式を有する原稿を読み取って、そこから、未知の原稿において文字認識を行うべき領域を示す情報(領域位置情報および指定文字)を取得することができる。従って、OCRテンプレートが容易に作成される。
【0081】
複合機1において、テンプレート取得部31は、指定文字に対する変動パラメータの相対位置を表す相対位置情報を取得する、相対位置情報取得部としても機能する。さらに、テンプレート記憶領域171は、相対位置情報を指定文字と関連付けて記憶してもよい。これによって、文字認識するべき領域の位置を、より厳密に規定することができる。
【0082】
複合機1において、テンプレート取得部31は特定の色を示す領域を認識する。
【0083】
また、複合機1は、テンプレート認識部41および変動パラメータ抽出部43を備える。テンプレート認識部41は、原稿画像80において、座標によって特定される領域である抽出領域81〜83内で、指定文字を認識する。変動パラメータ抽出部43は、指定文字以外に抽出領域81〜83に存在する文字を変動パラメータとして抽出する。
【0084】
このように、上述の座標および指定文字に基づいて、原稿画像上で、文字認識を行って変動パラメータを取得すべき領域が特定される。つまり、原稿画像の全体に対して文字認識を行うことなく、特定の領域のみについて文字認識を行うことで、必要な文字列が容易に得られる。
【0085】
複合機1は、抽出領域81〜83に指定文字が存在しない場合、より広い領域に対応するように領域位置情報を補正する座標補正部42をさらに備える。
複合機1は、変動パラメータを原稿画像と関連付けて記憶する文書記憶領域172をさらに備える。
【0086】
複合機1において、操作パネル16は、ユーザから検索語の入力を受け付ける。検索部44は、検索語と一致する変動パラメータと関連付けられた原稿画像を、文書記憶部内の原稿画像から選択する。
【産業上の利用可能性】
【0087】
本発明は、画像読取機能を有する装置、例えばファクシミリ装置、スキャナ、複合機等に利用可能である。
【符号の説明】
【0088】
1 複合機
12 モデム
13 ネットワークインターフェース
14 画像読取部
15 画像形成部
16 操作パネル
17 記憶部
18 制御装置
20 文字認識部
31 テンプレート取得部(領域位置情報取得部、指定文字取得部、相対位置情報取得部)
41 テンプレート認識部
42 座標補正部
43 変動パラメータ抽出部
44 検索部
50 テンプレート原稿
51 第1指定領域
52 第2指定領域
53 第3指定領域
54 第1テンプレート領域
55 第2テンプレート領域
56 第3テンプレート領域
60 仮テンプレート
70 テンプレート
71 テンプレート
72 テンプレート
102 インターネット
161 タッチパネル(検索受付部)
162 ハードキー
171 テンプレート記憶領域(テンプレート記憶部)
172 文書記憶領域

【特許請求の範囲】
【請求項1】
原稿から得られた画像において、領域位置情報によって特定される領域中で、指定文字に基づいて特定される文字を変動パラメータとして認識する文書処理装置であって、
原稿上の画像をテンプレート画像として読み取る画像読取部と、
前記テンプレート画像において、予め定められた特徴を有する指定領域の位置を前記領域位置情報として取得する領域位置情報取得部と、
前記指定領域に含まれる文字列から、前記指定文字を取得する指定文字取得部と、
前記指定文字を前記領域位置情報と関連付けて記憶するテンプレート記憶部と、
を備える文書処理装置。
【請求項2】
前記指定文字に対する前記変動パラメータの相対位置を表す相対位置情報を取得する相対位置情報取得部をさらに備え、
前記テンプレート記憶部は、前記相対位置情報を前記指定文字と関連付けて記憶する
請求項1に記載の文書処理装置。
【請求項3】
前記領域位置情報取得部は特定の色を示す領域を前記指定領域として認識することで、前記領域位置情報を取得する
請求項1または2に記載の文書処理装置。
【請求項4】
原稿から得られた画像において、領域位置情報によって特定される領域中で、指定文字に基づいて特定される文字を変動パラメータとして認識する文書処理装置であって、
原稿上の画像を原稿画像として読み取る画像読取部と、
前記指定文字と前記領域位置情報とを関連付けて記憶するテンプレート記憶部と、
前記原稿画像において、前記領域位置情報によって特定される領域である抽出領域内で、前記指定文字を認識するテンプレート認識部と、
前記指定文字以外に前記抽出領域に存在する文字を変動パラメータとして抽出する変動パラメータ抽出部と、
を備える文書処理装置。
【請求項5】
前記抽出領域に前記指定文字が存在しない場合、より広い領域に対応するように前記領域位置情報を補正する領域位置情報補正部をさらに備える
請求項4に記載の文書処理装置。
【請求項6】
前記変動パラメータを前記原稿画像と関連付けて記憶する文書記憶部をさらに備える
請求項4または5のいずれかに記載の文書処理装置。
【請求項7】
ユーザから検索語の入力を受け付ける検索受付部と、
前記検索語と一致する変動パラメータと関連付けられた前記原稿画像を、前記文書記憶部内の原稿画像から選択する検索部と、
をさらに備える請求項6に記載の文書処理装置。
【請求項8】
原稿から得られた画像において、領域位置情報によって特定される領域中で、指定文字に基づいて特定される文字を変動パラメータとして認識する文書処理装置であって、
原稿上の画像をテンプレート画像又は原稿画像として読み取る画像読取部と、
前記テンプレート画像において、予め定められた特徴を有する指定領域の位置を領域位置情報として取得する領域位置情報取得部と、
前記指定領域に含まれる文字列から、指定文字を取得する指定文字取得部と、
前記指定文字を前記領域位置情報と関連付けて記憶するテンプレート記憶部と、
前記原稿画像において、前記領域位置情報によって特定される領域である抽出領域内で、前記指定文字を認識するテンプレート認識部と、
前記指定文字以外に前記抽出領域に存在する文字を変動パラメータとして抽出する変動パラメータ抽出部と、
を備える文書処理装置。

【図1】
image rotate

【図2】
image rotate

【図3A】
image rotate

【図3B】
image rotate

【図3C】
image rotate

【図4A】
image rotate

【図4B】
image rotate

【図4C】
image rotate

【図5】
image rotate

【図6A】
image rotate

【図6B】
image rotate

【図6C】
image rotate