説明

文字認識ユニットおよび文章処理装置

【課題】共通部分と個別部分とを有する複数の原稿の文字認識に要する時間を短縮する。
【解決手段】共通部分と個別部分とを有する複数の原稿の文字認識を行う文字認識ユニットであって、前記複数の原稿の各画像を取得する第1の取得手段と、前記複数の原稿のうち最初に文字認識の対象となる1枚目の原稿に基づいて得られた、前記共通部分を特定する特定情報を取得する第2の取得手段と、前記1枚目の原稿については前記共通部分と前記個別部分とを文字認識すべき対象領域として設定するとともに、2枚目以降の原稿については前記共通部分以外の領域に前記対象領域を設定する設定手段と、前記対象領域のみに対して文字認識を行う認識手段と、を備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、原稿の文字を認識する文字認識ユニット、および文字認識の結果を処理する文章処理装置に関する。
【背景技術】
【0002】
近年、原稿に記載された文字を読み取って、読み取り結果を活用する文字認識装置が、名刺の情報を読み取る用途などに活用され始めている。
【0003】
名刺を対象とする文字認識装置では、例えば、先ず、紙面の画像がスキャナを用いて文字認識装置に取り込まれ(画像入力)、「社名」、「氏名」、「住所」、「電話番号」等の各項目毎に文字認識すべき文字群が存在している文字認識の対象領域が設定される(対象領域設定)。
【0004】
次に、各項目の属性に応じた辞書を使用するなどして各対象領域に含まれている個々の文字が何であるかの認識がなされ(文字認識)、単語などの言語情報を利用して読み取った文字の修正などが行われる(後処理)。
【0005】
ところで、名刺においては各項目の記載位置(レイアウト)は、通常、会社毎に異なっているが、例えば、同一会社の名刺などの同種の名刺においては、レイアウトはほとんど同じである場合が多い。
【0006】
そこで、特許文献1に記載された文字認識装置では、文字認識の各対象領域毎に領域の位置情報と、項目名とを対応づけてテンプレートとして設定、保存しておき、同種名刺の文字認識処理の際に、処理対象の名刺に対応したテンプレートを選択、利用することによって、名刺1枚毎に文字認識の対象領域を設定する手間を省いて文字認識の効率を上げている。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】特開2001−202475号公報
【発明の概要】
【発明が解決しようとする課題】
【0008】
しかしながら、特許文献1の文字認識装置では、複数枚の同種の名刺の文字認識を行う際に、「会社名」、「住所」等のような各名刺間で内容が共通している共通情報を有する項目についても、「氏名」等の名刺毎の個別情報を有する項目と同様に名刺一枚毎に毎回文字認識を行う必要がある。
【0009】
文字認識は、上述した一連の文字読取処理の工程の中でも処理装置の能力面および処理時間の観点で、通常、最も処理コストがかかる処理であることから、特許文献1の文字認識装置によっては、処理時間の短縮化、あるいは処理能力が低い装置を採用することによる低コスト化を行うことが困難であるといった問題がある。
【0010】
本発明は、こうした問題を解決するためになされたもので、複数枚の同種名刺に対する文字認識を行う際に、文字認識の対象となるデータ量を効率よく減ずることによって文字認識に要する時間を短縮することができる技術を提供することを目的とする。
【課題を解決するための手段】
【0011】
上記の課題を解決するため、請求項1の発明は、共通部分と個別部分とを有する複数の原稿の文字認識を行う文字認識ユニットであって、前記複数の原稿の各画像を取得する第1の取得手段と、前記複数の原稿のうち最初に文字認識の対象となる1枚目の原稿に基づいて得られた、前記共通部分を特定する特定情報を取得する第2の取得手段と、前記1枚目の原稿については前記共通部分と前記個別部分とを文字認識すべき対象領域として設定するとともに、2枚目以降の原稿については前記共通部分以外の領域に前記対象領域を設定する設定手段と、前記対象領域のみに対して文字認識を行う認識手段と、を備えることを特徴とする。
【0012】
また、請求項2の発明は、請求項1に記載された文字認識ユニットであって、前記特定情報を記憶する記憶手段をさらに備えることを特徴とする。
【0013】
また、請求項3の発明は、請求項2に記載された文字認識ユニットであって、所定の操作入力に応答して前記特定情報を前記記憶手段から取得する第3の取得手段をさらに備え、前記第3の取得手段が前記特定情報を取得した場合には、(a)前記文字認識ユニットは、前記第2の取得手段を不能化するとともに、(b)前記設定手段は、取得された前記特定情報に基づいて前記複数の原稿のそれぞれに前記対象領域を設定することを特徴とする。
【0014】
また、請求項4の発明は、文章処理装置であって、請求項1から請求項3のいずれか1つの請求項に記載された文字認識ユニットと、前記1枚目の原稿における前記共通部分についての文字認識の結果と、前記2枚目以降の各原稿における前記対象領域についての文字認識の結果とに基づいて前記各原稿の文字データを生成する生成部と、を備えることを特徴とする。
【発明の効果】
【0015】
請求項1から請求項4に記載された各発明によれば、1枚目の原稿に基づいて各原稿に共通する共通部分を特定する特定情報が取得され、2枚目以降の原稿の文字認識を行う際には共通部分以外の領域に文字認識の対象領域が設定されるので、共通部分についての文字認識が不要となり、効率よく文字認識の対象となるデータ量を減ずることができ、文字認識に要する時間を短縮することができる。
【図面の簡単な説明】
【0016】
【図1】実施形態に係る文章処理装置の外観の1例を示す図である。
【図2】実施形態に係る文章処理装置の主な構成の1例を示すブロック図である。
【図3】実施形態に係る文章処理装置および文字認識ユニットの主な機能構成の1例を示すブロック図である。
【図4】名刺の構成の一例を示す図である。
【図5】共通部分の選択画面の一例を示す図である。
【図6】名刺における共通部分の位置情報の一例を示す図である。
【図7】テンプレートの一例を示す図である。
【図8】名刺の構成の一例を示す図である。
【図9】2枚目以降の名刺における対象領域の設定を説明する図である。
【図10】2枚目以降の名刺における対象領域の設定を説明する図である。
【図11】テンプレートの選択画面の一例を示す図である。
【図12】実施形態に係る文章処理装置および文字認識ユニットの動作フローの一例を示す図である。
【図13】実施形態に係る文章処理装置および文字認識ユニットの動作フローの一例を示す図である。
【発明を実施するための形態】
【0017】
<1.文章処理装置の構成:>
図1は、実施形態に係る文章処理装置1の外観の1例を示す図である。図2は、文章処理装置1の主な構成の1例を示すブロック図である。
【0018】
図1および図2に示すように、文章処理装置1は、原稿給送部31と、原稿載置部32と、読取部41と、入出力部42と、記録部51と、表示部62が設けられた操作部61と、原稿検出部71と、を主に備えている。
【0019】
文章処理装置1は、これらの各構成要素を適宜制御下で利用することにより、FAX機能、コピー機能、スキャン機能、プリント機能、文字認識機能、およびアドレス帳登録機能などの諸機能を実現する構成となっている。なお、アドレス帳登録機能および文字認識ユニット2(図3)によって実現される文字認識機能については、後述する。
【0020】
原稿給送部31は、いわゆる自動給紙(ADF:Automatic Document Feeder)方式により、原稿を読取部41へと給送する。原稿給送部31によって給送される原稿の画像は、給送経路の所定位置において読取部41によって給送中に取得される。
【0021】
図1に示すように、原稿給送部31は、主として、読取対象となる原稿を載置する原稿台33と、読取部41によってADFスキャン方式で読取処理が実行された原稿を蓄積する原稿排出台34と、を有している。
【0022】
ここで、原稿給送部31は、例えば、名刺サイズの小さな原稿からA3サイズの大きな原稿まで、各種サイズの原稿を読取部41へと給紙可能に構成されている。
【0023】
原稿載置部32は、図1に示すように、原稿給送部31の下方に配置されており、原稿を静止させた状態で原稿の画像を読取部41に取得させる、いわゆるフラットベッド(Flat Bed)スキャン方式による画像読取に使用される。
【0024】
例えば、原稿載置部32に対して原稿給送部31が開閉されることによって、読取対象となる原稿が、原稿載置部32に載置される。
【0025】
そして、読取部41から投光された読取用の検出光が、原稿載置部32を透過して原稿の表面で反射され、再び原稿載置部32を透過した光が、読取部41の受光センサに読み取られることによって、原稿の画像が取得される。
【0026】
また、原稿載置部32は、読取部41による画像の読取に係る主走査方向および副走査方向に沿って行列状に複数の名刺を保持する名刺ホルダーが、原稿載置部32に載置された状態で、これら複数の名刺をフラットベッドスキャン方式によって一度に効率よく読み取り可能なようにも構成されている。
【0027】
読取部41は、いわゆるスキャナ部であり、図1に示すように、原稿給送部31および原稿載置部32の下方に設けられている。読取部41は、画像読取用の検出光を投光する投光部と、原稿表面で反射された検出光を光電変換する受光部とを有するスキャナを用いて原稿の情報を画像データとして読み取るように構成されている。
【0028】
ここで、読取部41は、フラットベッドスキャン方式のスキャナ部として原稿を読み取るとともに、ADFスキャン方式のスキャナ部としても原稿を読み取り可能なように構成されている。
【0029】
読取部41で読み取られた画像データは、例えばJPEG方式に圧縮され、RAM22の画像格納部23に記憶される。
【0030】
入出力部42は、文章処理装置1を外部のネットワークに接続するためのインタフェース部であり、例えば、外部のコンピュータから供給される画像データをプリンタとして機能する文章処理装置1へと入力するとともに、スキャナとして機能する文章処理装置1が取得した画像データを外部のコンピュータなどへと出力する。
【0031】
入出力部42は、また、電話回線とのインタフェースも備えており、文章処理装置1がFAXとして機能するときの入出力インタフェースなどとしても機能する。
【0032】
記録部51は、電子写真方式により、静電潜像に基づいたトナー画像を記録紙に記録する画像形成部である。
【0033】
例えば、記録部51は、画像格納部23に記憶された画像データに基づいて感光体ドラム(図示省略)上にトナー画像を形成するとともに、このトナー画像を記録部51の下方に設けられた給紙部から供給される記録紙に転写させることによって、原稿から読み取られた画像を記録紙に記録する。
【0034】
操作部61は、いわゆる操作パネルである。操作部61にはタッチパネルとしても機能する表示部62と、読取開始ボタン63をはじめとする各種の操作ボタンなどを備えている。
【0035】
表示部62は、例えば、液晶ディスプレイにより構成されており、文章処理装置1の動作状況、操作内容等を表示部62に表示される情報によって文章処理装置1の操作者(以下、単に、「操作者」と称する)に提示する表示手段として機能する。
【0036】
また、表示部62は、指や専用のペンで画面に触れることによって画面上の位置を指定できる「タッチパネル」としての機能を有している。
【0037】
したがって、操作者は、表示部62に表示された内容に基づき、表示部62の「タッチパネル」機能を使用した指示を行うことによって、文章処理装置1に所定の処理(例えば、記録紙に画像を記録させる処理)を実行させることができる。
【0038】
すなわち、表示部62は、文章処理装置1に対する操作者の諸操作をタッチパネルおよび各種ボタンを介して受け付ける入力部としても機能する。
【0039】
このように、操作者は、操作部61上の表示部62から文章処理装置1の状態などを取得するとともに、表示部62および各種操作ボタンを用いて設定および動作等を文章処理装置1に入力することができる。
【0040】
原稿検出部71は、例えば、原稿給送部31に設けられた接触式または非接触式のセンサにより構成されており、原稿台33に載置された原稿の存在を検出する。
【0041】
MPU(Micro Processing Unit)11は、文章処理装置1の各機能部を統轄制御する制御処理装置であり、ROM21に格納されたプログラムに従った制御および処理を実行する。
【0042】
MPU11は、後述するように、認識部12、設定部13、第3取得部14、第2取得部15、初稿検出部16、および生成部17としても機能する。
【0043】
また、MPU11、ROM21、RAM22、記憶装置26、読取部41、記録部51等のそれぞれは、信号線19を介して電気的に接続されている。したがって、MPU11は、例えば、記録部51による記録処理等を所定のタイミングで実行できる。
【0044】
RAM(Random Access Memory )22は、読み書き自在の揮発性メモリであり、読取部41が読み取った画像および入出力部42から入力された画像を格納する画像格納部23、MPU11の処理情報を一時的に記憶するワークメモリなどとして機能する。
【0045】
ROM(Read Only Memory)21は、読出し専用メモリであり、MPU11を動作させるプログラムなどを格納している。なお、読み書き自在の不揮発性メモリ(例えば、フラッシュメモリ)が、ROM13に代えて使用されてもよい。
【0046】
記憶装置26は、例えば、フラッシュメモリ等の読み書き自在な不揮発性メモリによって構成されており、文章処理装置1に対する設定情報などの各種情報を恒久的に記録する。
【0047】
記憶装置26は、また、テンプレート格納部27およびアドレス格納部28を備えており、それぞれには、後述するテンプレートおよびアドレス帳が格納される。
【0048】
<2.文字認識ユニットの構成:>
◎アドレス帳登録機能に係る文章処理装置1について:
図3は、実施形態に係る文章処理装置1および文字認識ユニット2の主な機能構成の1例を示すブロック図である。
【0049】
なお、図3では、文章処理装置1の各機能構成のうち、名刺などの原稿の画像を読み取って該画像に対して文字認識を行い、文字認識の結果のうちの必要な情報をアドレス帳に登録する機能(以下、単に「アドレス帳登録機能」と称する)に関連する機能部が示されている。
【0050】
図3に示されるように、文章処理装置1は、文字認識ユニット2、生成部17、およびアドレス格納部28などの各機能部を主に動作させることによって、アドレス帳登録機能を発揮する。
【0051】
生成部17は、MPU11によって実現される機能部であり、文字認識ユニット2が生成した名刺等の各種原稿についての文字認識の結果に基づいて、アドレス帳に登録するための登録データを生成する。
【0052】
アドレス格納部28は、記憶装置26によって実現される機能部であり、生成部17が生成した登録データをアドレス帳として格納する。
【0053】
◎文字認識ユニット2について:
図3に示される文字認識ユニット2は、各種原稿の画像に対して文字認識を行うことによって文字認識の結果である文字データを取得する文字認識を行う機能部である。
【0054】
文字認識ユニット2は、第1取得部43、画像格納部23、表示部62、認識部12、設定部13、第3取得部14、第2取得部15、初稿検出部16、およびテンプレート格納部27を主な機能部として備えて構成される。
【0055】
文字認識ユニット2は、これらの機能部を適宜動作させることによって、例えば同じ会社などの名刺および同種の帳票などのように、各原稿に共通する共通部分と、各原稿毎の個別部分とを有する複数の原稿に対する文字認識において、複数の原稿のうち最初に文字認識の対象となる1枚目の原稿に基づいて、各原稿に共通する共通部分を特定する特定情報を取得する。
【0056】
また、文字認識ユニット2は、2枚目以降の原稿の文字認識を行う際には共通部分以外の領域に文字認識の対象領域を設定する。
【0057】
従って、2枚目以降の原稿では、共通部分についての再度の文字認識が不要となり、効率よく文字認識の対象となるデータ量を減ずることによって文字認識に要する時間を短縮することができる。
【0058】
なお、既述したように、図2に示される構成例では、認識部12、設定部13、第3取得部14、第2取得部15、および初稿検出部16の各機能部は、MPU11によって実現されているが、これらの各機能部はそれぞれ、例えば、専用のハードウェア回路などによって実現されてもよい。
【0059】
第1取得部43は、例えば、読取部41または入出力部42などによって実現される機能部であり、文章処理装置1の処理対象である複数の原稿の画像を取得する。
【0060】
取得された画像データは、MPU11によってRAM22の画像格納部23に格納されるとともに、表示部62に画像、または認識部12による文字認識を経た文字データとして表示される。
【0061】
読取部41が第1取得部43として動作している場合には、第1取得部43は、処理対象の名刺に対してADFスキャン方式等の画像読取処理を行って原稿の画像を取得する。
【0062】
また、入出力部42が第1取得部43として動作している場合には、第1取得部43は、外部のコンピュータなどによって既に取得されている原稿の画像を文章処理装置1に入力することによって原稿の画像を取得する。
【0063】
このように、読取部41と入出力部42は、文字認識ユニット2の第1取得部43として機能する。
【0064】
初稿検出部16は、共通部分と個別部分とを有する複数の原稿のうち最初に文字認識の対象となる1枚目の原稿を検出する機能部である。また、第2取得部15は、初稿検出部16によって検出された1枚目の原稿に基づいて得られた、複数の各原稿に共通する共通部分を特定する特定情報を取得する。
【0065】
第2取得部15によって取得された共通部分の特定情報は、共通部分と個別部分とを有する複数の原稿における共通部分を特定する特定情報を収めたテンプレート(以下、単に「テンプレート」と称する)としてテンプレート格納部27に記憶され、第3取得部14によってテンプレート格納部27から取得される。
【0066】
第3取得部14は、文字認識の対象である複数の名刺等の原稿に共通する共通部分を特定する特定情報を所定の操作入力に応答してテンプレート格納部27から取得する機能部である。
【0067】
具体的には、例えば、操作者が、アドレス格納部28に格納された各テンプレートのうち文字認識の対象である原稿に対応したテンプレートを選択し、該選択を確認する入力操作をタッチパネル等から行うことによって、第3取得部14は、該入力操作に応答して、選択されたテンプレートに収められた特定情報を取得する。
【0068】
また、例えば、先ず、第3取得部14が、処理対象の名刺の画像と、各テンプレートに収められた共通部分の領域とを重ねて比較することで所望のテンプレートを自動的に特定して、該テンプレートを表示部62に表示し、次に、操作者がタッチパネル等を介して該テンプレートが処理対象の名刺に対応した適切なテンプレートであることを確認する入力を行い、該入力操作に応答して、第3取得部14が、特定されたテンプレートから特定情報を取得する構成が採用されてもよい。
【0069】
設定部13は、原稿の画像に対して文字認識の対象領域を設定する機能部であり、また、認識部12は、設定部13によって設定された文字認識の対象領域のみに対して文字認識を行う機能部である。
【0070】
次に、図3に示される各機能部の動作について、図12および図13に示されるフローチャート、その他の各図面を用いて詳しく説明する。
【0071】
<3.文章処理装置1および文字認識ユニット2の動作説明:>
図12および図13は、共通部分と個別部分とを有する複数の原稿が複数の名刺である場合において、これら複数の名刺(以下、単に「複数の名刺」と称する)をアドレス帳作成の処理対象とする文章処理装置1および文字認識ユニット2の動作フローの一例を示す図である。
【0072】
◎1枚目の名刺基準の文字認識処理およびアドレス帳作成について:
以下では、共通部分と個別部分とを有する複数の原稿における共通部分を特定する特定情報であるテンプレート(以下、単に「テンプレート」と称する)が、これら複数の名刺および他の原稿に対して未だテンプレート格納部27に格納されていない場合における文章処理装置1および文字認識ユニット2の動作を、図12および図13に示されるフローチャートを用いて説明する。
【0073】
先ず、名刺の情報をアドレス帳へと登録するために、操作者が複数の名刺を文章処理装置1の原稿台33に載置することにより、該載置が原稿検出部71によって検出されて、検出信号が、MPU11へと供給される。
【0074】
そして、該検出信号を供給されたMPU11からの制御によって、表示部62には、文章処理装置1の動作モードの選択を促す画面が表示される。
【0075】
操作者は、表示部62に表示された該画面において「複数の同種の原稿からのアドレス帳登録」モード(以下、単に「アドレス帳登録モード」と称する)を選択する。
【0076】
該モードの選択によって文章処理装置1は、図12に示される「複数の同種名刺からのアドレス帳作成処理」を開始する。
【0077】
次に、アドレス帳登録モードにおいて操作者が読取開始ボタン63を押し込むと、この操作の信号がMPU11へと供給されて、初稿検出部16は、現在の処理対象の名刺が1枚目の名刺であると判定し、1枚目の名刺であることを示す1枚目検出フラグをRAM22にセットする。
【0078】
MPU11は、1枚目検出フラグの設定状態によって、処理対象の名刺が1枚目であるか否かを判定する(ステップS10)。
【0079】
ここでは、1枚目検出フラグがセットされているので、MPU11は処理をステップS20へと移し、1以上の既存のテンプレートがテンプレート格納部27に格納されているか否かを判定する。
【0080】
複数枚の同種名刺に対する文字認識を行う場合に、このように1枚目の名刺が現在の文字認識対象であることを操作者に提示して、共通部分を特定したテンプレートが存在するか否かの選択を促せば、既存のテンプレートがあるにもかかわらず、不必要なテンプレートの作成を行って時間を浪費する状況の発生を少なくすることができ、複数枚の同種名刺についての文字認識を高速化することができる。
【0081】
また、適切なテンプレートが無い場合には1枚目の名刺に基づいてテンプレートを作成する手法によれば、当初の何枚か名刺については全ての項目についての文字認識を行った後に、以降の名刺に基づいて共通部分を設定する場合に比べて、複数の名刺全体の文字認識に要する処理時間を短縮することができる。
【0082】
なお、1枚目検出フラグに代えて、例えば、処理する名刺を計数するカウンタを用いることによって1枚目の名刺を検出してもよい。
【0083】
ここでは、既述したように既存のテンプレートは存在していないので、MPU11は、現在の処理対象の名刺に基づいてテンプレートを作成するために処理をステップS50へと移す。
【0084】
ステップS50では、第1取得部43(ここでは、読取部41)が1枚目の名刺の画像データを取得する。また、取得された画像データはMPU11によって画像格納部23(図3)格納される。
【0085】
ここで、図4は、1枚目の名刺6aの構成の一例を示す図である。図4に示されるように、名刺には、一般に、「会社名」、「住所」等のような各名刺間で内容が共通している共通情報を有する項目についての情報が記載されている共通部分と、「氏名」のように名刺毎の個別情報を有する項目についての情報が記載されている個別部分とが存在している。
【0086】
図4に示される例では、共通部分8a、8b、および8cは、それぞれ「会社名」、「住所」「電話番号」が記載された共通部分であり、個別部分9a、9b、9c、および9dは、それぞれ「所属」、「役職」、「氏名」、および「電子メールアドレス」が記載された個別部分である。
【0087】
図4に示されるように、各個別部分および各共通部分は、名刺6aの全体領域の中にそれぞれ領域を有している。
【0088】
また、共有部分は、文字認識を一度行って文字認識の結果を記憶しておけば、再度の文字認識が不要な部分であり、個別部分は、原稿毎に文字認識を行うことが必要な部分である。
【0089】
次に、図12に戻って、設定部13は、取得された名刺の画像データの全域を解析し、「社名」、「氏名」、「住所」、「電話番号」等の共通部分および個別部分から成る各項目毎に文字認識すべき文字群が存在している文字認識の対象領域を設定する(ステップS60)。
【0090】
すなわち、設定部13は、1枚目の原稿については共通部分と個別部分とを文字認識すべき対象領域として設定する。なお、この段階では、通常、文字認識処理は行われておらず、公知の画像処理技術によって対象領域の設定が行われる。
【0091】
文字認識の対象領域が設定されると、認識部12は、設定された対象領域のみを対象として、該対象領域から個々の文字の画像を抽出し、ROM21または記憶装置26などに記憶されている辞書の内容と照合することによって個々の文字が何であるかを認識する文字認識を実施する(ステップS70)。
【0092】
次に、MPU11は、認識部12によって行われた各対象領域毎の文字認識の結果に基づいて各対象領域の項目名を推測する。
【0093】
該推測には、例えば、対象領域の文字群に「都道府県」等の文字が含まれている場合には該対象領域の項目は「住所」であると推測する手法などが用いられる。
【0094】
ここで、図5は、共通部分の選択画面の一例を示す図である。MPU11は、各対象領域の項目名が推測できると、推測した各項目名と、各項目の内容、すなわち、各対象領域に含まれる文字群についての文字データと、各項目が共通部分に対する項目であるかを操作者が選択可能にするためのインタフェース(図5における「Y」/「N」ボタン)を図5に示されるように各項目毎に行単位で表示部62に表示する。
【0095】
該画像では、項目名およびその内容は、表示部62上で操作者が指示することによって修正可能な修正モードに移行するインタフェースも備えており、操作者は、表示部62に表示された認識結果が妥当か否かを判定し、妥当でない場合には文字認識ユニット2の状態を修正モードに移行させて文字認識の結果を修正する(ステップS80)。
【0096】
該修正モードでは、例えば、誤って文字認識された文字の修正、電子メールアドレスが電話番号であると誤認識されたような項目名の認識の誤り修正、欠落している情報の補充する修正、および原稿上では2行にわたって記載された住所のうちの1行分のみが住所として認識されて2行目が住所以外の項目として認識されている場合に、2行目の項目名を変更する修正などが行われる。
【0097】
また、修正については、ROM21などに格納された単語辞書を参照することなどによる自動修正が採用されてもよい。
【0098】
なお、図5に示される例では、文字認識の結果の修正に連動して共通部分の位置情報の修正が自動的に行われるが、例えば、取得された名刺の画像が、対象領域を周囲の領域から識別することが可能なように表示部62に表示されている状態において、操作者が共通部分の領域をタッチパネルを用いて画像上で修正を行うことが可能な構成を採用してもよい。
【0099】
このように文字認識結果によらず画像に基づいても共通部分は特定できるので本発明の有用性を損なうものではないが、図5に例示されるように、1枚目の原稿の文字認識の結果に基づいて特定された共通部分の特定情報を取得する手法によれば、画像を表示して共通部分を特定する場合に比べて、より小さな表示部を採用することができるので、小さな表示装置を備えた小型の文章処理装置であっても、共通部分を適切に特定することによって共通部分と個別部分とを備えた複数の原稿についての文字認識処理を高速で行うことができる。
【0100】
操作者は、文字認識結果についての必要な修正が終了すれば、表示部62に表示された各項目が共通部分に対応するものであるか、個別部分に対応する項目であるかを判断し、共通部分に対応する文字認識の結果を、タッチパネル上の「Y」/「N」ボタンの「Y」ボタンを指示することによって、共通部分の選択を行う(ステップS90)。
【0101】
図6は、処理対象の名刺における共通部分8aの位置情報を例示する図である。図6に示されるように、名刺における領域の位置情報は、例えば、名刺の左上を原点P0とする座標系における各領域の左上端部の点P1および右下端部の点P2の座標などによって特定される。
【0102】
操作者は、共通部分の選択が完了すれば、画面上の「確認」ボタンを指示することによって共通部分の選択を終了する。
【0103】
図12に戻って、該指示操作によって共通部分の選択が終了することにより、共通部分についての選択結果は、MPU11へと供給される。
【0104】
また、第2取得部15は、操作者の選択結果をもとに、項目名、項目の内容、および各共通部分などの各共通部分を特定する特定情報を取得してテンプレートを作成し、テンプレート格納部27に格納する(ステップS100)。
【0105】
なお、既述した修正モードで修正が行われた場合は、修正内容が反映された特定情報が取得される。
【0106】
図7は、テンプレートの一例を示す図であり、該テンプレートは、図4に示される名刺に対応している。
【0107】
図7に示されるテンプレートでは、例えば、各共通部分のそれぞれについて項目名と、内容と、共通部分の左上端部の座標および右下端部の座標とが各共通部分の特定情報として対応づけられており、一組の同種の名刺群に対しては、通常、1つのテンプレートが設定される。
【0108】
各テンプレートは、例えば、当該テンプレートの名称、データサイズ、含まれる共通部分の個数、ならびに各共通部分のそれぞれについての項目名および内容のそれぞれの文字数などを記録したヘッダ部と、含まれる各共通部分のそれぞれについて、項目名、内容、領域の左上座標、および領域の右下座標などを順次記憶したデータ部とを有するデータ構造に基づいて、テンプレート格納部27に格納される。
【0109】
テンプレートにおける各共通部分の特定情報は、ヘッダ部分の情報を参照することによって順不同に参照され得る。
【0110】
また、テンプレート格納部27には、例えば、各テンプレートのそれぞれについて名称および格納先アドレスなどを記載したテンプレートライブラリ管理テーブルも格納されており、各テンプレートの参照は、該管理テーブルを参照することによって順不同に行われ得る。
【0111】
上述の説明では、第2取得部15は操作者の操作によって定められた共通部分の特定情報を取得しているが、第2取得部15は、ROM21などに予め記憶されている共通情報の項目名などの情報に基づいて自動的に共通部分を特定し、テンプレートを設定、記録する処理を行ってもよい。
【0112】
すなわち、第2取得部15は、1枚目の原稿に基づいた操作者の操作に応じて、または、1枚目の原稿に基づいて自動的に、共通部分を特定する特定情報を取得する処理を行う。
【0113】
なお、図7に示されるテンプレートでは、各共通部分の位置情報についての特定情報として、共通部分の領域範囲の左上端点と、右下端点の座標を採用しているが、例えば、共通部分以外の領域範囲を示す座標情報等の位置情報を採用しても本発明の有用性を損なうことはない。
【0114】
また、図6の例では、各共通部分の領域は、1つの項目を形成する全ての文字から成る文字列を囲む矩形として示されているが、例えば、文字列を囲む楕円形などで合ってもよいし、1つの項目の文字列を形成する各文字毎に、文字を囲む領域範囲を指定してもよい。
【0115】
次に、図12に戻って、生成部17は、ステップS80において必要な修正が行われた、共通部分および個別部分についての文字認識の結果のうち、アドレス帳に登録すべき所定の項目についての情報を所定の順序に配列することなどによってアドレス帳への登録データを生成する(ステップS110)。
【0116】
生成部17によってアドレス帳への登録データが生成されると、MPU11は、アドレス格納部28に生成された登録データを格納することによって、取得された登録データのアドレス帳への登録を行う(ステップS120)。
【0117】
アドレス帳への登録が完了することにより、MPU11は、1枚目の名刺であることを示す1枚目検出フラグをクリアする。
【0118】
次に、MPU11は、全ての名刺についてのアドレス帳作成処理が完了したか否かを確認する(ステップS130)。該完了の確認は、例えば、ADFスキャン方式によって読み取られる場合であれば原稿検出部71による名刺の検出の有無によって行われる。
【0119】
また、既述した専用ホルダに保持された複数の名刺をフラットベッドスキャン方式で読み取る場合には、該完了の確認は、ホルダーにおける所定の終了位置に保持された名刺についての処理が完了したか否かを確認することなどによって行われる。
【0120】
また、文章処理装置1への名刺の挿入、文字認識およびアドレス帳登録、ならびに文章処理装置1からの名刺抜き取りという一連の作業を各名刺一枚毎に繰り返しつつアドレス帳を作成する場合では、例えば、各名刺毎のアドレス帳登録処理が完了する毎に、表示部62に「続行」か「終了」か、を選択可能なインタフェースを備えた画面を表示して操作者に選択を促し、操作者による該選択の結果に基づいて、全ての名刺についてのアドレス帳作成処理が完了したか否かを判定する手法などが採用され得る。
【0121】
全ての名刺についてのアドレス帳作成処理が完了している場合には、文章処理装置1はアドレス帳作成処理を終了するが、ここでは、全ての名刺についてのアドレス帳作成処理が完了していないので、処理はステップS10へと戻される。
【0122】
ステップS10において、ここでは2枚目の名刺が処理対象であって、1枚目検出フラグがクリアされているので、MPU11は処理をステップS170(図13)に移し、該ステップにおいて、ステップS50と同様に名刺の画像データが取得される。
【0123】
図8は、2枚目の名刺6bの構成の一例を示す図である。名刺6bにおいては、共通部分8aから8cの位置および記載内容は、名刺6aと同じである。
【0124】
また、名刺6bの個別部分9eから9hは、それぞれ名刺6aにおける個別部分9aから9dの各項目に対応しているが、それぞれの記載内容は名刺6aとは異なっている。
【0125】
さらに、文字数の変動に伴って、それぞれの位置情報も、個別部分9aから9dのそれぞれの位置情報とは異なっている。
【0126】
この場合、1枚目の名刺6aに基づいて共通部分を特定する特定情報がテンプレートとして既に取得されているので、2枚目の名刺6bについての画像データが取得されると、設定部13は、テンプレートとして設定されている各共通部分の位置情報に基づいて、名刺6bについての文字認識の対象領域を各共通部分以外の領域に設定する(ステップS180)。
【0127】
図9および図10は、2枚目の名刺6bを例として2枚目以降の名刺における対象領域の設定を説明する図である。
【0128】
図9は、名刺6bにおける共通部分8aから8c以外の領域である非共通部分7aを示しており、また、図10は、名刺6bにおける文字認識の対象領域である個別部分9eから9hを示している。
【0129】
設定部13は、処理対象の名刺についての共通部分の特定情報が格納されたテンプレートを用いて、図9および図10に示されるように2枚目以降の原稿について、共通部分以外の領域である非共通部分7aに文字認識の対象領域を設定する。
【0130】
次に、図13に戻って、設定部13による対象領域の設定がされると、認識部12が、ステップS70と同様にして対象領域のみについての文字認識を行う(ステップS190)。
【0131】
文字認識が完了すれば、文字認識の結果が表示部62に表示される。操作者は、表示された内容を参照してステップS80と同様に文字認識の結果の必要な修正を行う(ステップS200)。
【0132】
文字認識の結果についての必要な修正が完了すれば、生成部17は、2枚目以降の名刺についての文字認識の結果と、テンプレートに保存されている、1枚目の名刺に基づいて生成された共通部分の文字認識の結果と、のうちのアドレス帳に登録すべき所定の項目についての情報を、所定の順序に配列することなどによってアドレス帳への登録データを生成する(ステップS210)。
【0133】
生成部17によってアドレス帳への登録データが生成されると、MPU11は、1枚目の名刺と同様にして2枚目の名刺についての登録データをアドレス帳に登録する(ステップS120)。
【0134】
次に、MPU11は、1枚目の名刺についての処理と同様にして、ステップS130の処理において全ての名刺についてのアドレス帳作成処理が完了したか否かを確認する。
【0135】
全ての名刺についてのアドレス帳作成処理が完了していなければ、MPU11は、処理をステップS10へと戻し、文章処理装置1および文字認識ユニット2の各機能部によって、未処理の全ての名刺について2枚目の名刺についての処理と同様の処理が繰り返される。
【0136】
全ての名刺についてのアドレス帳作成処理が完了している場合には、MPU11は、アドレス帳作成処理を終了する。
【0137】
以上に説明した処理手順によって、共通部分を特定する特定情報であるテンプレートが1つもテンプレート格納部27に格納されていない状態から共通部分と個別部分とを有する複数の原稿を対象とするアドレス帳作成処理が開始される場合におけるアドレス帳作成処理が行われる。
【0138】
上述したように、文字認識ユニット2においては、複数の原稿のうち最初に文字認識の対象となる1枚目の原稿に基づいて各原稿に共通する共通部分を特定する特定情報が取得され、2枚目以降の原稿の文字認識を行う際には共通部分以外の領域に文字認識の対象領域が設定されるので、共通部分についての再度の文字認識が不要となり、効率よく文字認識の対象となるデータ量を減ずることによって文字認識に要する時間を短縮することができる。
【0139】
◎テンプレート基準の文字認識処理およびアドレス帳作成について:
次に、テンプレート格納部27に1枚目の原稿に基づいて作成された1以上のテンプレートが既に格納されている状態から共通部分と個別部分とを有する複数の原稿を対象とするアドレス帳作成処理が開始される場合の、アドレス帳作成処理について説明する。
【0140】
図12において、アドレス帳作成処理が開始されると、ステップS10の判定処理において、処理対象の名刺が1枚目であるとの判定がなされ、次に、ステップS20の判定処理において、1以上のテンプレートが既存であるとの判定がなされて処理はステップS30へと移される。
【0141】
このタイミングでMPU11は、1枚目の名刺に基づいて共通部分を特定する特定情報を取得する第2取得部15の処理機能を不能化する。
【0142】
また、このタイミングでMPU11の第3取得部14は、処理対象の複数の名刺に対するアドレス帳作成処理において、1枚目の名刺に基づいて新たにテンプレートを作成して2枚目以降の名刺に適用する(1枚目の名刺基準の文字認識処理)か、既存のテンプレートを1枚目以下のすべての名刺に対して適用する(テンプレート基準の文字認識処理)かの選択を操作者に促すためのインタフェースを備えた画面を表示部62に表示する。
【0143】
操作者は、表示部62に表示された画面のタッチパネルを操作することによって、これから行おうとする処理が「1枚目の名刺基準の文字認識処理」であるか、「テンプレート基準の文字認識処理」であるかを選択する(ステップS30)。
【0144】
ステップS30において、「1枚目の名刺基準の文字認識処理」が選択された場合には、「1枚目の名刺基準の文字認識処理」の説明において既述した各処理フローに沿って文字認識およびアドレス帳作成が行われ、「テンプレート基準の文字認識処理」が選択された場合には、処理はステップS140へ移される(ステップS40)。
【0145】
操作者の選択に基づいて処理がステップS140に移されると、MPU11は、テンプレート格納部27に格納されている各テンプレートを表示部62に表示するなどして、操作者に対して使用するテンプレートの選択を促す。
【0146】
図11は、ステップS140において表示部62に表示されるテンプレートの選択画面の一例を示す図である。
【0147】
図11に示される例では、各テンプレートとともにテンプレート格納部27に格納されているテンプレートライブラリ管理テーブルに基づいて、各テンプレートの名称が画面に表示されている。
【0148】
既述したようにテンプレートライブラリ管理テーブルには、各テンプレートのそれぞれについて名称および格納先アドレスなどが格納されている。
【0149】
そして、操作者によって選択されたテンプレートの参照は、テンプレートライブラリ管理テーブルをMPU11が参照することによって行われる。
【0150】
図11の例は、A社からD社の各社の名刺についてのテンプレートが、それぞれ「A社名刺」、「B社名刺」、「C社名刺」、「D社名刺」という名称でテンプレート格納部27に格納されているとともに、今回の処理対象である複数の名刺である「○○株式会社」の名刺に対応するテンプレートが「○○株式会社名刺」という名称でテンプレート格納部27に格納されている場合を例示している。
【0151】
図13に戻って、操作者は、図11に示された「○○株式会社名刺」というテンプレートの名称をタッチパネル上で指示することによって該テンプレートを選択する。
【0152】
この選択動作によって該名称の表示が、白地上の黒文字から黒地上の白文字へと反転表示されたことによって、操作者は、選択が適切になされたことを確認した後、「確認」ボタンを押し込んで選択を確定させ、テンプレートの選択処理を終了させる(ステップS150)。
【0153】
操作者が押し込んだ「確認」ボタンからの押し込み信号をトリガーとして検出するなどして、第3取得部14は、操作者に選択されたテンプレートに基づいて共通部分の特定情報、すなわち、共通部分の項目名、文字認識の結果、および位置情報などを取得する(ステップS160)。
【0154】
共通部分についての特定情報が取得されると、「1枚目の名刺基準の文字認識処理」の説明欄で説明した、2枚目以降の名刺に対する各処理が、今回の「テンプレート基準の文字認識処理」における1枚目以下の各名刺に対して適用され、該各名刺についてのアドレス帳作成処理が完了される。
【0155】
以上に説明した処理手順によって、共通部分を特定する特定情報を格納した1つ以上のテンプレートが既にテンプレート格納部27に格納されている状態から、共通部分と個別部分とを有する複数の原稿を対象とするアドレス帳作成処理が開始される場合の、アドレス帳作成処理が行われる。
【0156】
また、個別部分と共通部分とを有する複数の同種原稿を対象とする文字認識において、一枚目の原稿に基づいて作成されたテンプレートを保存しておき、再度、該複数の同種名刺を対象とする文字認識を行う際の一枚目以降の原稿に対して保存したテンプレートを適用すれば、該再度の文字認識処理においては、一枚目の原稿に基づいて再度、共通部分を特定する特定情報を取得する必要がないので、該再度の複数枚の原稿についての文字認識処理の時間を短縮することができる。
【0157】
<4.変形例:>
以上、本発明の実施の形態について説明してきたが、本発明は上記実施の形態に限定されるものではなく様々な変形が可能である。
【0158】
(1)本実施の形態において、共通部分についての各特定情報が1つのテンプレートに納められるものとして説明したが、共通部分と各特定情報との対応付けを適切に行えば、例えば、各特定情報を各特定情報毎に個別に保存する構成を採用してもよい。
【0159】
(2)また、本実施の形態において、テンプレートは記憶装置26のテンプレート格納部27に恒久的に格納されると説明したが、RAM22に一時的に格納するものとしても、多数の複数枚の同種名刺を、複数の名刺群ごとに分割して文字認識処理を行う場合も多いことから、本願発明の有用性を損なうものではない。
【0160】
(3)また、本実施の形態において、第1取得部43は、共通部分が特定されている場合の名刺に対しても、名刺の全体領域に対して画像の取得を行うが、名刺の全体領域のうち少なくとも非共通部分7aの全ての画像が取得できるように、共通部分に基づいて画像取得領域を設定しても良い。
【0161】
この構成によれば、例えば、読取部41の副走査方向に沿って名刺の上下方向が定まるようにフラットベッドに名刺が置かれて画像が取得される場合において、名刺の上半分のみに非共通部分7aが存在していれば、該上半分のみを画像取得の対象とすることができるので、2枚目以降の名刺についての画像取得時間を削減することができ、複数枚の名刺についての文字認識に係る総時間を短縮することができる。
【符号の説明】
【0162】
1 文章処理装置
2 文字認識ユニット
31 原稿給送部
32 原稿載置部
33 原稿台
34 原稿排出台
41 読取部
42 入出力部
43 第1取得部
51 記録部
61 操作部
62 表示部
63 読取開始ボタン
71 原稿検出部
6a,6b 名刺
7a 非共通部分
8a,8b,8c 共通部分
9a,9b,9c,9d,9e,9f,9g,9h 個別部分

【特許請求の範囲】
【請求項1】
共通部分と個別部分とを有する複数の原稿の文字認識を行う文字認識ユニットであって、
前記複数の原稿の各画像を取得する第1の取得手段と、
前記複数の原稿のうち最初に文字認識の対象となる1枚目の原稿に基づいて得られた、前記共通部分を特定する特定情報を取得する第2の取得手段と、
前記1枚目の原稿については前記共通部分と前記個別部分とを文字認識すべき対象領域として設定するとともに、2枚目以降の原稿については前記共通部分以外の領域に前記対象領域を設定する設定手段と、
前記対象領域のみに対して文字認識を行う認識手段と、
を備えることを特徴とする文字認識ユニット。
【請求項2】
請求項1に記載された文字認識ユニットであって、
前記特定情報を記憶する記憶手段をさらに備えることを特徴とする文字認識ユニット。
【請求項3】
請求項2に記載された文字認識ユニットであって、
所定の操作入力に応答して前記特定情報を前記記憶手段から取得する第3の取得手段をさらに備え、
前記第3の取得手段が前記特定情報を取得した場合には、
(a)前記文字認識ユニットは、前記第2の取得手段を不能化するとともに、
(b)前記設定手段は、取得された前記特定情報に基づいて前記複数の原稿のそれぞれに前記対象領域を設定することを特徴とする文字認識ユニット。
【請求項4】
請求項1から請求項3のいずれか1つの請求項に記載された文字認識ユニットと、
前記1枚目の原稿における前記共通部分についての文字認識の結果と、前記2枚目以降の各原稿における前記対象領域についての文字認識の結果とに基づいて前記各原稿の文字データを生成する生成部と、
を備えることを特徴とする文章処理装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate