帳票作成装置、帳票作成プログラム、および帳票作成方法
【課題】従来、スキャナが読み取った帳票の画像データに対して、OCR装置で適切にOCR処理できないことがあった。また、OCR処理の精度を優先して帳票のレイアウトが固定的にしか形成されなかった。本発明は、レイアウトの自由度を確保しつつ、生成された帳票のOCR処理の精度を向上する。
【解決手段】本発明の帳票作成装置110は、OCR処理に適合する画像要素を規定する設定情報の範囲を保持する保持部164と、ユーザ入力と、保持部に保持された設定情報の範囲とに基づいて、帳票画像を生成する画像生成部170と、を有する。
【解決手段】本発明の帳票作成装置110は、OCR処理に適合する画像要素を規定する設定情報の範囲を保持する保持部164と、ユーザ入力と、保持部に保持された設定情報の範囲とに基づいて、帳票画像を生成する画像生成部170と、を有する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、帳票の作成を行う帳票作成装置、帳票作成プログラム、および帳票作成方法に関する。
【背景技術】
【0002】
近年、様々な分野でペーパーレス化が進められているものの、例えば、組織の基幹業務では、伝票、勤怠表、アンケート用紙、テスト用紙等や、病院においてはこれらに加えて問診表等、依然、紙に印刷された帳票が用いられている。ユーザは、後から手書き等で帳票に書き込まれた情報を効率的に管理するため、スキャナで帳票を読み込み、OCR(Optical Character Reader)装置でOCR処理を施している。
【0003】
しかし、帳票のレイアウトや書式が適切でない場合、OCR処理が適切に行われない場合がある。そこで、ユーザが入力したOCR機種、行フィールド数、文字数に応じて、予め規定された形式で固定的に帳票のレイアウトが決定される技術が公開されている(例えば、特許文献1)。また、帳票から読み取ったイメージデータと、選定基準とする複数の選定基準イメージデータとを比較し、該当する選定基準イメージデータを選定して、その選定基準イメージデータに基づいてOCR処理を行う情報処理装置が提案されている(例えば、特許文献2)。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開平8−30659号公報
【特許文献2】特開2000−132542号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
従来、スキャナが読み取った帳票の画像データに対して、OCR装置で適切にOCR処理できないことがあった。また、OCR処理の精度を優先して帳票のレイアウトが固定的にしか形成されなかった。
【0006】
そこで本発明は、このような課題に鑑み、レイアウトの自由度を確保しつつ、生成された帳票のOCR処理の精度を向上可能な、帳票作成装置、帳票作成プログラム、および帳票作成方法を提供することを目的としている。
【課題を解決するための手段】
【0007】
上記課題を解決するために、本発明の帳票作成装置は、OCR処理に適合する画像要素を規定する設定情報の範囲を保持する保持部と、ユーザ入力と、保持部に保持された設定情報の範囲とに基づいて、帳票画像を生成する画像生成部と、を有する。
【0008】
画像生成部は、帳票画像を構成する画像要素の設定情報の初期値を、保持部に保持された設定情報の範囲で設定してもよい。
【0009】
帳票画像を構成する画像要素それぞれに対して、OCR処理に適合するか否かを判断する適合判断部をさらに有してもよい。
【0010】
適合判断部は、帳票画像を構成する画像要素のうち、ユーザに指定された画像要素のみOCR処理に適合するか否かを判断してもよい。
【0011】
適合判断部は、保持部に保持された設定情報の範囲に基づいて、OCR処理に適合するか否かを判断してもよい。
【0012】
帳票画像を構成する画像要素のうち、OCR処理に適合しない画像要素をOCR処理に適合する画像要素に置換する要素置換部をさらに有してもよい。
【0013】
保持部は、置換候補となる画像要素のパターンを保持し、要素置換部は、帳票画像を構成する画像要素と、保持部に保持されたパターンとに対してパターンマッチングを行い、パターンに該当する画像要素をOCR処理に適合する画像要素に置換してもよい。
【0014】
設定情報には、少なくとも、文字フォント、文字サイズ、用紙サイズ、罫線の長さ、罫線の線幅、罫線の向き、文字枠の大きさ、文字枠の線幅、チェックボックスの大きさ、チェックボックスの間隔、バーコードの種類、バーコードの大きさ、バーコードのエレメント幅、バーコードのチェックデジット、色、ドロップアウトカラー、位置決めマークの大きさ、位置決めマークの配置、印刷時の倍率、印刷後の画像要素の大きさのいずれかが含まれてもよい。
【0015】
帳票画像が印刷される場合に、予め定められた印刷条件で印刷するように画像形成装置を制御する出力制御部をさらに有してもよい。
【0016】
上記課題を解決するために、本発明の帳票作成プログラムは、コンピュータを、OCR処理に適合する画像要素を規定する設定情報の範囲を保持する保持部と、ユーザ入力と、保持部に保持された設定情報の範囲とに基づいて、帳票画像を生成する画像生成部と、して機能させる。
【0017】
上記課題を解決するために、本発明の帳票作成方法は、ユーザ入力に応じて帳票画像を生成する生成ステップと、帳票画像を構成する画像要素それぞれに対して、OCR処理に適合するか否かを判断する判断ステップと、判断結果を表示する表示ステップと、を有する。
【発明の効果】
【0018】
以上説明したように本発明は、このような課題に鑑み、レイアウトの自由度を確保しつつ、生成された帳票のOCR処理の精度を向上可能となる。
【図面の簡単な説明】
【0019】
【図1】帳票処理システムの概略的な接続関係を示した説明図である。
【図2】帳票作成装置の構成を示した機能ブロック図である。
【図3】帳票画像の一例を示す説明図である。
【図4】設定情報を説明するための説明図である。
【図5】適合判断部の判断処理を説明するための説明図である。
【図6】要素置換部のパターンマッチングに基づく置換処理を説明するための説明図である。
【図7】OCR装置の構成を示した機能ブロック図である。
【図8】帳票作成方法の全体的な処理の流れを示したフローチャートである。
【発明を実施するための形態】
【0020】
以下に添付図面を参照しながら、本発明の好適な実施形態について詳細に説明する。かかる実施形態に示す寸法、材料、その他具体的な数値等は、発明の理解を容易とするための例示にすぎず、特に断る場合を除き、本発明を限定するものではない。なお、本明細書及び図面において、実質的に同一の機能、構成を有する要素については、同一の符号を付することにより重複説明を省略し、また本発明に直接関係のない要素は図示を省略する。
【0021】
(帳票処理システム100)
図1は、帳票処理システム100の概略的な接続関係を示した説明図である。帳票処理システム100は、帳票作成装置110と、OCR装置120と、プリンタ(画像形成装置)130と、スキャナ140とを含んで構成される。帳票作成装置110は、インターネット、LAN(Local Area Network)、専用回線等の通信網150を通じて、OCR装置120と接続されている。また、帳票作成装置110はプリンタ130と、OCR装置120はスキャナ140と例えばLANを通じて接続されている。さらに、通信網150には、企業等の基幹システムのアプリケーションサーバ152が接続されている。
【0022】
帳票作成装置110は、ユーザによるレイアウトの作成入力を受け付けると、画像要素を組み合わせて帳票154のレイアウトを示すレイアウト画像を生成する。そして、プリンタ130はその生成されたレイアウトに沿って帳票154を印刷する。ユーザは、印刷された帳票154に、例えば業務上の情報を、手書き、押印および打刻等で記載する。帳票154への記載が完了すると、スキャナ140は、情報が記載された帳票154を読み取り、OCR装置120は、その読み取られた画像データに対してOCR処理を行い、帳票154に書き込まれた書込情報を取得し、アプリケーションサーバ152に出力することで、書込み情報が基幹システムで利用される。
【0023】
例えば、ユーザが手動で入力したOCR機種、行フィールド数、文字数に応じて、帳票の書式を自動生成する帳票作成装置が提案されている。しかし、このような提案による帳票作成装置は、作成する帳票の文字枠や帳票サイズを画一的に決定しているに過ぎない。
【0024】
本実施形態にかかる帳票処理システム100では、帳票作成装置110が、帳票画像をOCR処理に適合するように生成するため、レイアウトの自由度を確保しつつ、生成された帳票154のOCR処理の精度を向上することが可能となる。以下、帳票作成装置110、OCR装置120の順にそれぞれの構成を詳細に述べる。
【0025】
(帳票作成装置110)
図2は、帳票作成装置110の構成を示した機能ブロック図である。帳票作成装置110は、表示部160と、操作部162と、保持部164と、中央制御部166とを含んで構成される。
【0026】
表示部160は、液晶ディスプレイ、有機EL(Electro Luminescence)ディスプレイ等で構成される。操作部162は、表示部160の表示面上に設置されたタッチパネル、操作キーが複数設けられたキーボード、マウス等のポインティングデバイス、十字キー、ジョイスティック等で構成される。帳票作成装置110は、表示部160に帳票作成画面を表示し、操作部162を通じたユーザの操作入力を受け付けて帳票154のレイアウト画像(以下、単に帳票画像という)を生成する。
【0027】
帳票作成装置110には、帳票画像を生成する際、設計モードとして、設計に制限のない通常モードと、OCR処理への適合を考慮したOCR帳票モードとが用意されており、操作部162を通じたユーザ入力に従って切り換えられる。
【0028】
また、OCR帳票モードにおいて、ユーザ入力に応じて、帳票154の基本情報として、色、ドロップアウト、スキャナ読取解像度、スキャナ補正の有無等の設定が行われる。色の設定では、カラー、モノクロ等が選択できる。ドロップアウトの設定では、スキャナ140で認識されないドロップアウト色を用いたハードドロップアウト帳票、OCR処理装置120におけるOCR処理で選択した色をドロップアウトするソフトドロップアウト帳票、どの色もドロップアウトされないようにスキャナ140の光源に複数色を用いる非ドロップアウト帳票等が選択できる。スキャナ読取解像度の設定は、200/240/300/400dpi等が選択できる。スキャナ補正の有無の設定では、スキャナ140で読み取った帳票154の画像データに対して、例えば傾き補正等の処理を行うか否かを選択できる。
【0029】
図3は、帳票画像の一例を示す説明図である。図3に示すように、帳票画像の画像要素として、例えば、文字枠182a、文字182b、基準マーク182c、バーコード182d等の配置が設定される。ここで、基準マーク182cは、スキャナ140が読み取った画像データに対してOCR装置120がOCR処理を施す際、帳票154の方向およびレイアウトの位置の基準となる。また、バーコード182dは、任意の情報を所定の規則に従って符号化したものであり、例えば、帳票154を識別する帳票IDを示す。
【0030】
帳票作成装置110は、操作部162を通じたユーザの操作入力に応じて図3に示すような帳票画像を生成する。このとき、帳票154は、規則性のある入力態様を纏めた領域である複数の入力領域184を含む。入力領域184は、例えば文字枠182aで囲まれている。入力領域184には、入力領域184毎に、書き込まれることが想定される文字種(英字、数字、日本語、記号等)や属性(手書文字、活字等)等を設定することが可能である。
【0031】
保持部164は、HDD(Hard Disk Drive)、フラッシュメモリ、不揮発性RAM(Random Access Memory)等で構成される。本実施形態において、保持部164は、帳票作成装置110と一体に形成されるが、かかる場合に限定されず、別体の、例えば、NAS(Network Attached Storage)や外付けのHDD、USB(Universal Serial Bus)メモリ等であってもよい。
【0032】
保持部164は、帳票画像におけるOCR処理に適合する画像要素(例えば、罫線)を規定する設定情報(例えば、長さや太さ)の範囲と、置換候補となる画像要素のパターンを保持する。画像要素のパターンについては後に詳述する。設定情報には、少なくとも、文字フォント、文字サイズ、用紙サイズ、罫線の長さ、罫線の線幅、罫線の向き、文字枠182aの大きさ、文字枠182aの線幅、チェックボックスの大きさ、チェックボックスの間隔、バーコードの種類、バーコードの大きさ、バーコードのエレメント幅、バーコードのチェックデジット、色、ドロップアウトカラー、位置決めマークの大きさ、位置決めマークの配置、印刷時の倍率、印刷後の画像要素の大きさのいずれかが含まれる。
【0033】
設定情報のうち、文字フォントの選択範囲は、明朝体またはゴシック体、文字サイズの選択範囲は、10〜14ポイント等となる。用紙サイズの選択範囲は、通常の帳票の場合は、最大A4判、ドロップアウトカラー帳票の場合は最大B4判等となる。罫線の長さの選択範囲は、5mm以上、罫線の線幅の選択範囲は、0.2mm以上、罫線の向きの選択範囲は、垂直方向または水平方向等となる。また、文字枠182aの大きさは、文字枠182aの高さと幅で定義され、その選択範囲は、高さ10mm以上、幅7mm以上等となる。文字枠182aの線幅の選択範囲は、0.2mm以上等となる。
【0034】
設定情報のうち、バーコードの種類の選択範囲は、NW−7、OODE39、OODE128、JAN13等となり、バーコードの大きさの選択範囲は、高さ10mm以上、全体幅100mm以下等と指定される。また、バーコードを構成するバーやスペース1本の幅であるエレメント幅の選択範囲は、最小幅0.2mm(300/400dpi)、最小幅0.3mm(200/240dpi)、最大幅2.0mm等となる。バーコードのチェックデジットの選択範囲は、NW−7(モジュラス10/11/16)、OOE39(モジュラス43)等となる。
【0035】
設定情報のうち、色の選択範囲は、印刷濃度が高い黒色等となる。ドロップアウトカラーの選択範囲は、鮮明な、赤、緑、青系統の色等となる。また、印刷時の倍率の選択範囲は、90%〜110%等となる。
【0036】
上述した設定情報のうち、印刷時の倍率の影響を受ける、例えば、文字の大きさや罫線の線幅等については、設定情報の選択範囲は、印刷時の倍率100%である場合の寸法(印刷後の画像要素の大きさ)としてもよいし、任意に指定された倍率で印刷された後の寸法としてもよい。
【0037】
また、設定情報の選択範囲には、画像要素の種類毎に、または、隣接する画像要素の組み合わせに応じて、隣接する画像要素との間隔の下限値も示される。さらに、保持部164には、帳票画像全体を一つの画像要素とみなし、その画像要素の設定情報の選択範囲として、上述した基本情報の選択範囲が保持されていてもよい。
【0038】
図4は、設定情報を説明するための説明図である。図4(a)は、チェックボックスの大きさと間隔を説明するための説明図であり、図4(b)は、位置決めマーク192の大きさと配置を説明するための説明図である。
【0039】
図4(a)に示すように、例えば、画像要素であるチェックボックス190の設定情報のうち、チェックボックス190の大きさは、チェックボックス190の幅190a、高さ190b等で、チェックボックス190の間隔は、隣接するチェックボックス190同士の横の間隔190c、縦の間隔190d等で示される。設定情報の選択範囲は、幅190a、高さ190bがそれぞれ4mm以上、横の間隔190c、縦の間隔190dがそれぞれ2mm以上等となる。
【0040】
また、図4(b)に示すように、例えば、画像要素である位置決めマーク192の設定情報のうち、位置決めマーク192の大きさは、例えば、位置決めマーク192が矩形の場合、幅192a、高さ192b、例えば、位置決めマーク192がドーナツ型の場合、直径192c、線幅192d等で示され、位置決めマーク192の配置は、例えば、位置決めマーク192の中心の、帳票画像上の位置座標等で示される。設定情報の選択範囲は、幅192aが4.5mm〜5.5mm、高さ192bが2.5〜3.5mm、直径192cが4.5mm〜5.5mm、線幅192dが1.0〜1.5mm等となる。また、設定情報が位置決めマーク192の中心の位置座標である場合、設定情報の選択範囲は、帳票画像の縦横の端からの距離192e、192fがそれぞれ1.0mm以上等となる。
【0041】
保持部164は、かかる設定情報について、OCR処理に適合する範囲を保持部164に保持する。本実施形態の帳票作成装置110は、上述したように、画像要素の設定情報として多数の詳細な項目についてまで設定ができ、保持部164に保持された設定情報の範囲を参照して帳票画像を生成することによりOCR処理の精度を向上することが可能となる。
【0042】
中央制御部166は、中央処理装置(CPU)、プログラム等が格納されたROM、ワークエリアとしてのRAM等を含む半導体集積回路により、帳票作成装置110全体を制御する。また、中央制御部166は、画像生成部170と、適合判断部172と、要素置換部174と、データ出力部176と、出力制御部178と、定義出力部180としても機能する。
【0043】
画像生成部170は、操作部162を通じたユーザ入力と、保持部164に保持された設定情報の範囲とに基づいて、帳票画像を生成する。例えば、画像生成部170は、上述したOCR帳票モードにおいて、帳票画像の生成のユーザ入力があると、帳票画像を構成する画像要素の設定情報の初期値を、保持部164に保持された設定情報の範囲で設定する。
【0044】
画像要素、例えば、罫線、文字枠182a、文字182b等の配置を指示するユーザ入力があると、画像生成部170は、その画像要素の設定情報、例えば、罫線の線幅や文字182bの大きさ等の初期値を、保持部164に保持された設定情報の範囲に基づいて設定し、配置する。かかる構成により、始めから、OCR処理に適した初期値が設定情報として設定された画像要素を配置でき作業効率を向上できる。
【0045】
このとき、画像生成部170は、ユーザ入力に応じて、設定情報の初期値を、保持部164に保持された設定情報の範囲の中でもOCR処理により適した推奨値としたり、設定情報の範囲の中では比較的OCR処理に適さない限界値としたりする。推奨値を用いると、OCR処理の精度がより向上し、限界値を用いると、例えば、文字サイズを比較的小さくできたり、画像要素間の間隔を比較的詰めることができたりするため、帳票のレイアウトの自由度が高まる。また、初期値は、ユーザ入力によって変更可能である。ユーザ入力によって変更された初期値は、変更前の初期値に初期化することもできる。
【0046】
また、保持部164に保持された設定情報の範囲は、例えば、OCR装置120の機種名や、OCR装置120のOCR処理部で用いられるOCR処理ソフトウェアの名称およびバージョン毎に保持されており、画像生成部170は、ユーザ入力やOCR装置120からの制御情報に応じて、該当する設定情報の範囲を用いることとしてもよい。
【0047】
適合判断部172は、例えば、通常モードからOCR帳票モードへの切り換えや、ユーザによるOCR帳票モードの選択入力を契機として、既に生成されている帳票画像を構成する画像要素それぞれに対して、OCR処理に適合するか否かを判断する。適合判断部172は、例えば、保持部164に保持された設定情報の範囲やその他の画像要素との組み合わせに基づいて、OCR処理に適合するか否かを判断する。
【0048】
図5は、適合判断部172の判断処理を説明するための説明図である。適合判断部172が帳票画像を構成する画像要素それぞれに対して、OCR処理に適合するか否かを判断すると、図5に示すように、表示部160に、判断結果画面194を表示させて判断結果をユーザに報知する。例えば、領域196aに、バーコード「伝票番号」(画像要素)の高さが、保持部164に保持された設定情報の範囲外となりOCR処理に適合しない高さであることと、その範囲の下限値とが表示される。また、領域196bに、英数字項目「顧客ID」の文字サイズが保持部164に保持された設定情報の範囲外となりOCR処理に適合しない大きさであることと、その範囲の下限値とが表示される。
【0049】
また、ユーザ入力によって、図5のハッチングで示すように領域196aが選択されると、例えば、表示部160に並列して表示されている帳票画像における、該当する画像要素、すなわち、バーコード「伝票番号」自体が、強調表示(ハイライト)されるため、ユーザは、OCR処理に適合しない画像要素を容易に把握できる。
【0050】
このように、保持部164に保持された、画像要素の設定情報の範囲を参照する構成より、画像要素の設定要素と範囲との比較という簡易な処理で、OCR処理に適合するか否かを判断することができる。また、保持部164は、新たに生成する画像要素の設定情報の初期値を設定するための設定情報の範囲と、すでに生成されている画像要素がOCR処理に適合しているか否か判断するための設定情報の範囲とをそれぞれ別に保持してもよい。さらに、適合判断部172は、ユーザ入力に応じて、上述した初期値の推奨値を用いて判断基準を厳しくしたり、初期値の限界値を用いて判断基準を緩めたりする。
【0051】
適合判断部172を備える構成により、例えば、すでに作成した画像要素の設定情報が、保持部164に保持された設定情報の範囲に含まれておらず、そのままでは、OCR処理の精度が不十分になってしまいかねない場合であっても、画像生成部170が、保持部164に保持された設定情報の範囲に含まれないと判断した設定情報の画像要素を報知することで、ユーザに修正を促すことが可能となる。
【0052】
また、適合判断部172は、帳票画像を構成する画像要素のうち、ユーザに個別にまたは範囲で指定された画像要素やその設定情報、またはすべての画像要素に対して指定された設定情報のみを、OCR処理に適合するか否かを判断する。
【0053】
かかる構成により、例えば、OCR処理の精度が十分な画像要素や、ドロップアウトカラー等で意図的にOCR処理の対象外とした画像要素等、OCR処理に適合するか否かの判断が不要な画像要素についてまで、無駄に判定処理をしてしまう事態を回避することができ、処理負荷を軽減し処理時間を短縮することが可能となる。また、ユーザは、例えば、特に厳しい判断基準で判断を所望する設定情報がある場合、その設定情報のみを選択して、判断基準を厳しくした後、OCR処理に適合するか否かの判断をすることもできる。
【0054】
要素置換部174は、帳票画像を構成する画像要素のうち、OCR処理に適合しない画像要素をOCR処理に適合する画像要素に置換する。
【0055】
図5に示すように、判断結果画面194には、上部に「一括自動修正」と表記されたボタン198aが、領域196a、196b毎に、例えば「自動修正」と表記されたボタン198b、198cが表示される。ユーザが、操作部162を通じて、ボタン198aを選択すると、すべての領域196a、196bで示された画像要素の設定情報がそれぞれに対応する範囲内の値に書き換えられる。また、ユーザが、ボタン198b、198cを選択すると、個別に画像要素の設定情報を自動修正することができる。さらに、自動修正に限らず、ユーザは、操作部162を通じて、設定情報として任意の値を入力して修正してもよい。
【0056】
かかる構成により、OCR処理に適合しない画像要素を、OCR処理に適合する画像要素に自動的に置換でき、OCR処理に適合する画像要素となるように、ユーザが画像要素の設定情報等を修正する作業負担を軽減することが可能となる。
【0057】
また、要素置換部174は、帳票画像を構成する画像要素と、保持部164に保持されたパターンとに対してパターンマッチングを行い、そのパターンに該当する画像要素をOCR処理に適合する画像要素に置換する。
【0058】
図6は、要素置換部174のパターンマッチングに基づく置換処理を説明するための説明図である。OCR処理に適さない入力形式、例えば、「好き」「普通」「嫌い」の文字に、ユーザが丸で囲むような入力形式の画像要素や、一つの文字枠に予め定められた形式の複数の文字(例えば複数桁の数値)の書き込みをする画像要素があった場合、図6に示すように、パターン置換画面200において、置換を推奨する対象の画像要素に対する、置換候補が表示される。
【0059】
図5において説明した判断結果画面194と同様、パターン置換画面200においても、ユーザ入力によって、選択された画像要素について、表示部160に並列して表示されている帳票画像における、該当する画像要素自体が、強調表示(ハイライト)されることとする。
【0060】
ユーザ入力によって、ボタン202a〜202b、ボタン204a〜204dから、いずれかが選択されると、要素置換部174は、その選択されたボタン202a〜202b、ボタン204a〜204dに対応する、例えば、「好き」「普通」「嫌い」の文字それぞれの側にチェックボックスを設ける画像要素および文字枠を文字数分に分割する補助線を加えた画像要素等に置換する。また、「一括自動修正」ボタン206が選択されると、要素置換部174は、OCR処理に適さない入力形式の画像要素それぞれについて、予め定められた優先順位に応じて、OCR処理に最も適合する入力形式の画像要素を自動的に選択して置換する。
【0061】
かかる構成により、ユーザがOCR処理に適合しない入力形式を知っておらずとも、要素置換部174がOCR処理に適合しない入力形式の画像要素を報知し、その置換候補を示して、ユーザ入力によって選択されたOCR処理に適合する入力形式とすることができ、OCR処理の精度を向上することが可能となる。
【0062】
データ出力部176は、帳票画像を印刷に対応した形式に変換してプリンタ130に出力する。
【0063】
出力制御部178は、帳票画像が印刷される場合に、予め定められた印刷条件で印刷するようにプリンタ130を制御する。出力制御部178は、プリンタ130を直接制御する場合に限定されず、出力制御部178は、変更を禁止する印刷条件等の制御情報をプリンタ130に出力し、プリンタ130がその制御情報に基づいて、印刷条件を設定してもよい。
【0064】
OCR処理の精度が高くなるレイアウトに設定したとしても、プリンタ130で印刷条件が変更され、例えば縮小印刷をしてしまうと、印刷された帳票の文字の大きさが小さくなったり線の太さが細くなったりして、OCR処理の精度が低下してしまう可能性がある。出力制御部178が、予め定められた印刷条件で印刷するようにプリンタ130を制御することで、そのような事態を回避することが可能となる。
【0065】
定義出力部180は、画像生成部170が生成した帳票画像を電子的にOCR装置120に出力する。また、定義出力部180は、帳票画像を出力する場合に限らず、帳票画像から、OCR処理のための定義を示す定義情報を生成してOCR装置120に出力してもよい。
【0066】
上述したように、本実施形態の帳票作成装置110は、ユーザ入力に応じて自由な帳票設計を可能とすると共に、画像要素の設定情報を、OCR処理に適合するように、保持部164に保持された設定情報の範囲に収めて帳票画像を生成することができる。そのため、帳票154に対するOCR処理の精度を向上することが可能となる。
【0067】
(OCR装置120)
図7は、OCR装置120の構成を示した機能ブロック図である。OCR装置120は、表示部300と、操作部302と、中央制御部304とを含んで構成される。
【0068】
表示部300は、液晶ディスプレイ、有機ELディスプレイ等で構成される。操作部302は、表示部300の表示面上に設置されたタッチパネル、操作キーが複数設けられたキーボード、マウス等のポインティングデバイス、十字キー、ジョイスティック等で構成される。
【0069】
中央制御部304は、中央処理装置(CPU)、プログラム等が格納されたROM、ワークエリアとしてのRAM等を含む半導体集積回路により、OCR装置120全体を制御する。また、中央制御部304は、画像取得部320、定義取得部322、OCR処理部324、サーバ出力部326としても機能する。
【0070】
画像取得部320は、帳票154を読み取って生成した画像データをスキャナ140から取得する。
【0071】
定義取得部322は、帳票作成装置110の定義出力部180が出力した帳票画像または定義情報を取得する。帳票画像を取得した場合、定義取得部322は、その帳票画像から、OCR処理のための定義を示す定義情報を生成する。
【0072】
OCR処理部324は、例えば、画像取得部320が取得した画像データの画像のうち、基準マーク182cの位置を基準とし、定義取得部322が取得または生成した定義情報に基づいて、スキャナ140が読み取った帳票154の画像データに対してOCR処理(画像データから、その画像データが示す文字や数字等の内容を抽出する処理)を行う。
【0073】
サーバ出力部326は、OCR処理部324が行ったOCR処理の結果、抽出された文字や数字等の情報を、アプリケーションサーバ152に出力する。
【0074】
以上、説明した帳票作成装置110やOCR装置120によって、レイアウトの自由度を確保しつつ、生成された帳票154のOCR処理の精度を向上することが可能となる。また、コンピュータを、帳票作成装置110として機能させる帳票生成プログラムや、その帳票生成プログラムを記憶した、コンピュータで読み取り可能なフレキシブルディスク、光磁気ディスク、ROM、EPROM、EEPROM、CD(Compact Disc)、DVD(Digital Versatile Disk)、BD(Blu-ray Disc)等の記憶媒体も提供される。ここで、プログラムは、任意の言語や記述方法にて記述されたデータ処理手段をいう。
【0075】
また、この帳票生成プログラムは、帳票作成装置110に通信網150を介して接続された任意のアプリケーションプログラムサーバに記憶されていてもよく、必要に応じてその全部または一部をダウンロードすることもできる。
【0076】
(帳票作成方法)
次に、上述した帳票処理システムの運用を行う帳票作成方法を説明する。図8は、帳票作成方法の全体的な処理の流れを示したフローチャートである。
【0077】
図8に示すように、帳票画像の生成を指示するユーザ入力があると(S400)、画像生成部170は、現在の設計モードがOCR帳票モードであるか否かを判断し(S402)、OCR帳票モードである場合(S402のYES)、画像生成部170は、操作部162を通じたユーザ入力と、保持部164に保持された、OCR処理に適合させるための設定情報の範囲とに基づいて、帳票画像を生成する(S404)。OCR帳票モードでなく通常モードである場合(S402のNO)、画像生成部170は、ユーザ入力のみに基づいて帳票画像を生成する(S406)。
【0078】
そして、通常モードからOCR帳票モードへの切り換えや、OCR処理への適合判断を指示するユーザ入力があると(S408のYES)、適合判断部172は、帳票画像を構成する画像要素それぞれに対して、OCR処理に適合するか否かを判断し(S410)、その判断結果を示す判断結果画面を表示部160に表示させる(S412)。
【0079】
要素置換部174は、自動または手動での修正を指示するユーザ入力があるか否かを判断し(S414)、修正を指示するユーザ入力があると(S414のYES)、帳票画像を構成する画像要素のうち、OCR処理に適合しない画像要素をOCR処理に適合する画像要素に置換する(S416)。
【0080】
画像要素置換ステップS416の後、または、適合判断ユーザ入力判定ステップS408において、通常モードからOCR帳票モードへの切り換えや、OCR処理への適合判断を指示するユーザ入力がない場合(S408のNO)、要素置換部174は、パターンマッチングを指示するユーザ入力があるか否かを判断する(S418)。パターンマッチングを指示するユーザ入力があると(S418のYES)、帳票画像を構成する画像要素と、保持部164に保持されたパターンとに対してパターンマッチングを行い(S420)、該当する画像要素があるか否かを判断する(S422)。該当する画像要素がある場合(S422のYES)、要素置換部174は、表示部160にパターン置換画面を表示させる(S424)。
【0081】
要素置換部174は、置換候補を選択し置換するユーザ入力があるか否かを判断し(S426)、置換候補を選択し置換するユーザ入力があると(S426のYES)、要素置換部174は、OCR処理に適さない入力形式の画像要素を、選択された、OCR処理に適合する入力形式の画像要素に置換する(S428)。
【0082】
このような帳票作成方法によれば、レイアウトの自由度を確保しつつ、生成された帳票154のOCR処理の精度を向上することが可能となる。
【0083】
以上、添付図面を参照しながら本発明の好適な実施形態について説明したが、本発明はかかる実施形態に限定されないことは言うまでもない。当業者であれば、特許請求の範囲に記載された範疇において、各種の変更例または修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。
【0084】
なお、本明細書の帳票作成方法における各工程は、必ずしもフローチャートとして記載された順序に沿って時系列に処理する必要はなく、並列的あるいはサブルーチンによる処理を含んでもよい。
【産業上の利用可能性】
【0085】
本発明は、帳票の作成を行う帳票作成装置、帳票作成プログラム、および帳票作成方法に利用することができる。
【符号の説明】
【0086】
110 …帳票作成装置
130 …プリンタ(画像形成装置)
164 …保持部
170 …画像生成部
172 …適合判断部
174 …要素置換部
176 …データ出力部
178 …出力制御部
【技術分野】
【0001】
本発明は、帳票の作成を行う帳票作成装置、帳票作成プログラム、および帳票作成方法に関する。
【背景技術】
【0002】
近年、様々な分野でペーパーレス化が進められているものの、例えば、組織の基幹業務では、伝票、勤怠表、アンケート用紙、テスト用紙等や、病院においてはこれらに加えて問診表等、依然、紙に印刷された帳票が用いられている。ユーザは、後から手書き等で帳票に書き込まれた情報を効率的に管理するため、スキャナで帳票を読み込み、OCR(Optical Character Reader)装置でOCR処理を施している。
【0003】
しかし、帳票のレイアウトや書式が適切でない場合、OCR処理が適切に行われない場合がある。そこで、ユーザが入力したOCR機種、行フィールド数、文字数に応じて、予め規定された形式で固定的に帳票のレイアウトが決定される技術が公開されている(例えば、特許文献1)。また、帳票から読み取ったイメージデータと、選定基準とする複数の選定基準イメージデータとを比較し、該当する選定基準イメージデータを選定して、その選定基準イメージデータに基づいてOCR処理を行う情報処理装置が提案されている(例えば、特許文献2)。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開平8−30659号公報
【特許文献2】特開2000−132542号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
従来、スキャナが読み取った帳票の画像データに対して、OCR装置で適切にOCR処理できないことがあった。また、OCR処理の精度を優先して帳票のレイアウトが固定的にしか形成されなかった。
【0006】
そこで本発明は、このような課題に鑑み、レイアウトの自由度を確保しつつ、生成された帳票のOCR処理の精度を向上可能な、帳票作成装置、帳票作成プログラム、および帳票作成方法を提供することを目的としている。
【課題を解決するための手段】
【0007】
上記課題を解決するために、本発明の帳票作成装置は、OCR処理に適合する画像要素を規定する設定情報の範囲を保持する保持部と、ユーザ入力と、保持部に保持された設定情報の範囲とに基づいて、帳票画像を生成する画像生成部と、を有する。
【0008】
画像生成部は、帳票画像を構成する画像要素の設定情報の初期値を、保持部に保持された設定情報の範囲で設定してもよい。
【0009】
帳票画像を構成する画像要素それぞれに対して、OCR処理に適合するか否かを判断する適合判断部をさらに有してもよい。
【0010】
適合判断部は、帳票画像を構成する画像要素のうち、ユーザに指定された画像要素のみOCR処理に適合するか否かを判断してもよい。
【0011】
適合判断部は、保持部に保持された設定情報の範囲に基づいて、OCR処理に適合するか否かを判断してもよい。
【0012】
帳票画像を構成する画像要素のうち、OCR処理に適合しない画像要素をOCR処理に適合する画像要素に置換する要素置換部をさらに有してもよい。
【0013】
保持部は、置換候補となる画像要素のパターンを保持し、要素置換部は、帳票画像を構成する画像要素と、保持部に保持されたパターンとに対してパターンマッチングを行い、パターンに該当する画像要素をOCR処理に適合する画像要素に置換してもよい。
【0014】
設定情報には、少なくとも、文字フォント、文字サイズ、用紙サイズ、罫線の長さ、罫線の線幅、罫線の向き、文字枠の大きさ、文字枠の線幅、チェックボックスの大きさ、チェックボックスの間隔、バーコードの種類、バーコードの大きさ、バーコードのエレメント幅、バーコードのチェックデジット、色、ドロップアウトカラー、位置決めマークの大きさ、位置決めマークの配置、印刷時の倍率、印刷後の画像要素の大きさのいずれかが含まれてもよい。
【0015】
帳票画像が印刷される場合に、予め定められた印刷条件で印刷するように画像形成装置を制御する出力制御部をさらに有してもよい。
【0016】
上記課題を解決するために、本発明の帳票作成プログラムは、コンピュータを、OCR処理に適合する画像要素を規定する設定情報の範囲を保持する保持部と、ユーザ入力と、保持部に保持された設定情報の範囲とに基づいて、帳票画像を生成する画像生成部と、して機能させる。
【0017】
上記課題を解決するために、本発明の帳票作成方法は、ユーザ入力に応じて帳票画像を生成する生成ステップと、帳票画像を構成する画像要素それぞれに対して、OCR処理に適合するか否かを判断する判断ステップと、判断結果を表示する表示ステップと、を有する。
【発明の効果】
【0018】
以上説明したように本発明は、このような課題に鑑み、レイアウトの自由度を確保しつつ、生成された帳票のOCR処理の精度を向上可能となる。
【図面の簡単な説明】
【0019】
【図1】帳票処理システムの概略的な接続関係を示した説明図である。
【図2】帳票作成装置の構成を示した機能ブロック図である。
【図3】帳票画像の一例を示す説明図である。
【図4】設定情報を説明するための説明図である。
【図5】適合判断部の判断処理を説明するための説明図である。
【図6】要素置換部のパターンマッチングに基づく置換処理を説明するための説明図である。
【図7】OCR装置の構成を示した機能ブロック図である。
【図8】帳票作成方法の全体的な処理の流れを示したフローチャートである。
【発明を実施するための形態】
【0020】
以下に添付図面を参照しながら、本発明の好適な実施形態について詳細に説明する。かかる実施形態に示す寸法、材料、その他具体的な数値等は、発明の理解を容易とするための例示にすぎず、特に断る場合を除き、本発明を限定するものではない。なお、本明細書及び図面において、実質的に同一の機能、構成を有する要素については、同一の符号を付することにより重複説明を省略し、また本発明に直接関係のない要素は図示を省略する。
【0021】
(帳票処理システム100)
図1は、帳票処理システム100の概略的な接続関係を示した説明図である。帳票処理システム100は、帳票作成装置110と、OCR装置120と、プリンタ(画像形成装置)130と、スキャナ140とを含んで構成される。帳票作成装置110は、インターネット、LAN(Local Area Network)、専用回線等の通信網150を通じて、OCR装置120と接続されている。また、帳票作成装置110はプリンタ130と、OCR装置120はスキャナ140と例えばLANを通じて接続されている。さらに、通信網150には、企業等の基幹システムのアプリケーションサーバ152が接続されている。
【0022】
帳票作成装置110は、ユーザによるレイアウトの作成入力を受け付けると、画像要素を組み合わせて帳票154のレイアウトを示すレイアウト画像を生成する。そして、プリンタ130はその生成されたレイアウトに沿って帳票154を印刷する。ユーザは、印刷された帳票154に、例えば業務上の情報を、手書き、押印および打刻等で記載する。帳票154への記載が完了すると、スキャナ140は、情報が記載された帳票154を読み取り、OCR装置120は、その読み取られた画像データに対してOCR処理を行い、帳票154に書き込まれた書込情報を取得し、アプリケーションサーバ152に出力することで、書込み情報が基幹システムで利用される。
【0023】
例えば、ユーザが手動で入力したOCR機種、行フィールド数、文字数に応じて、帳票の書式を自動生成する帳票作成装置が提案されている。しかし、このような提案による帳票作成装置は、作成する帳票の文字枠や帳票サイズを画一的に決定しているに過ぎない。
【0024】
本実施形態にかかる帳票処理システム100では、帳票作成装置110が、帳票画像をOCR処理に適合するように生成するため、レイアウトの自由度を確保しつつ、生成された帳票154のOCR処理の精度を向上することが可能となる。以下、帳票作成装置110、OCR装置120の順にそれぞれの構成を詳細に述べる。
【0025】
(帳票作成装置110)
図2は、帳票作成装置110の構成を示した機能ブロック図である。帳票作成装置110は、表示部160と、操作部162と、保持部164と、中央制御部166とを含んで構成される。
【0026】
表示部160は、液晶ディスプレイ、有機EL(Electro Luminescence)ディスプレイ等で構成される。操作部162は、表示部160の表示面上に設置されたタッチパネル、操作キーが複数設けられたキーボード、マウス等のポインティングデバイス、十字キー、ジョイスティック等で構成される。帳票作成装置110は、表示部160に帳票作成画面を表示し、操作部162を通じたユーザの操作入力を受け付けて帳票154のレイアウト画像(以下、単に帳票画像という)を生成する。
【0027】
帳票作成装置110には、帳票画像を生成する際、設計モードとして、設計に制限のない通常モードと、OCR処理への適合を考慮したOCR帳票モードとが用意されており、操作部162を通じたユーザ入力に従って切り換えられる。
【0028】
また、OCR帳票モードにおいて、ユーザ入力に応じて、帳票154の基本情報として、色、ドロップアウト、スキャナ読取解像度、スキャナ補正の有無等の設定が行われる。色の設定では、カラー、モノクロ等が選択できる。ドロップアウトの設定では、スキャナ140で認識されないドロップアウト色を用いたハードドロップアウト帳票、OCR処理装置120におけるOCR処理で選択した色をドロップアウトするソフトドロップアウト帳票、どの色もドロップアウトされないようにスキャナ140の光源に複数色を用いる非ドロップアウト帳票等が選択できる。スキャナ読取解像度の設定は、200/240/300/400dpi等が選択できる。スキャナ補正の有無の設定では、スキャナ140で読み取った帳票154の画像データに対して、例えば傾き補正等の処理を行うか否かを選択できる。
【0029】
図3は、帳票画像の一例を示す説明図である。図3に示すように、帳票画像の画像要素として、例えば、文字枠182a、文字182b、基準マーク182c、バーコード182d等の配置が設定される。ここで、基準マーク182cは、スキャナ140が読み取った画像データに対してOCR装置120がOCR処理を施す際、帳票154の方向およびレイアウトの位置の基準となる。また、バーコード182dは、任意の情報を所定の規則に従って符号化したものであり、例えば、帳票154を識別する帳票IDを示す。
【0030】
帳票作成装置110は、操作部162を通じたユーザの操作入力に応じて図3に示すような帳票画像を生成する。このとき、帳票154は、規則性のある入力態様を纏めた領域である複数の入力領域184を含む。入力領域184は、例えば文字枠182aで囲まれている。入力領域184には、入力領域184毎に、書き込まれることが想定される文字種(英字、数字、日本語、記号等)や属性(手書文字、活字等)等を設定することが可能である。
【0031】
保持部164は、HDD(Hard Disk Drive)、フラッシュメモリ、不揮発性RAM(Random Access Memory)等で構成される。本実施形態において、保持部164は、帳票作成装置110と一体に形成されるが、かかる場合に限定されず、別体の、例えば、NAS(Network Attached Storage)や外付けのHDD、USB(Universal Serial Bus)メモリ等であってもよい。
【0032】
保持部164は、帳票画像におけるOCR処理に適合する画像要素(例えば、罫線)を規定する設定情報(例えば、長さや太さ)の範囲と、置換候補となる画像要素のパターンを保持する。画像要素のパターンについては後に詳述する。設定情報には、少なくとも、文字フォント、文字サイズ、用紙サイズ、罫線の長さ、罫線の線幅、罫線の向き、文字枠182aの大きさ、文字枠182aの線幅、チェックボックスの大きさ、チェックボックスの間隔、バーコードの種類、バーコードの大きさ、バーコードのエレメント幅、バーコードのチェックデジット、色、ドロップアウトカラー、位置決めマークの大きさ、位置決めマークの配置、印刷時の倍率、印刷後の画像要素の大きさのいずれかが含まれる。
【0033】
設定情報のうち、文字フォントの選択範囲は、明朝体またはゴシック体、文字サイズの選択範囲は、10〜14ポイント等となる。用紙サイズの選択範囲は、通常の帳票の場合は、最大A4判、ドロップアウトカラー帳票の場合は最大B4判等となる。罫線の長さの選択範囲は、5mm以上、罫線の線幅の選択範囲は、0.2mm以上、罫線の向きの選択範囲は、垂直方向または水平方向等となる。また、文字枠182aの大きさは、文字枠182aの高さと幅で定義され、その選択範囲は、高さ10mm以上、幅7mm以上等となる。文字枠182aの線幅の選択範囲は、0.2mm以上等となる。
【0034】
設定情報のうち、バーコードの種類の選択範囲は、NW−7、OODE39、OODE128、JAN13等となり、バーコードの大きさの選択範囲は、高さ10mm以上、全体幅100mm以下等と指定される。また、バーコードを構成するバーやスペース1本の幅であるエレメント幅の選択範囲は、最小幅0.2mm(300/400dpi)、最小幅0.3mm(200/240dpi)、最大幅2.0mm等となる。バーコードのチェックデジットの選択範囲は、NW−7(モジュラス10/11/16)、OOE39(モジュラス43)等となる。
【0035】
設定情報のうち、色の選択範囲は、印刷濃度が高い黒色等となる。ドロップアウトカラーの選択範囲は、鮮明な、赤、緑、青系統の色等となる。また、印刷時の倍率の選択範囲は、90%〜110%等となる。
【0036】
上述した設定情報のうち、印刷時の倍率の影響を受ける、例えば、文字の大きさや罫線の線幅等については、設定情報の選択範囲は、印刷時の倍率100%である場合の寸法(印刷後の画像要素の大きさ)としてもよいし、任意に指定された倍率で印刷された後の寸法としてもよい。
【0037】
また、設定情報の選択範囲には、画像要素の種類毎に、または、隣接する画像要素の組み合わせに応じて、隣接する画像要素との間隔の下限値も示される。さらに、保持部164には、帳票画像全体を一つの画像要素とみなし、その画像要素の設定情報の選択範囲として、上述した基本情報の選択範囲が保持されていてもよい。
【0038】
図4は、設定情報を説明するための説明図である。図4(a)は、チェックボックスの大きさと間隔を説明するための説明図であり、図4(b)は、位置決めマーク192の大きさと配置を説明するための説明図である。
【0039】
図4(a)に示すように、例えば、画像要素であるチェックボックス190の設定情報のうち、チェックボックス190の大きさは、チェックボックス190の幅190a、高さ190b等で、チェックボックス190の間隔は、隣接するチェックボックス190同士の横の間隔190c、縦の間隔190d等で示される。設定情報の選択範囲は、幅190a、高さ190bがそれぞれ4mm以上、横の間隔190c、縦の間隔190dがそれぞれ2mm以上等となる。
【0040】
また、図4(b)に示すように、例えば、画像要素である位置決めマーク192の設定情報のうち、位置決めマーク192の大きさは、例えば、位置決めマーク192が矩形の場合、幅192a、高さ192b、例えば、位置決めマーク192がドーナツ型の場合、直径192c、線幅192d等で示され、位置決めマーク192の配置は、例えば、位置決めマーク192の中心の、帳票画像上の位置座標等で示される。設定情報の選択範囲は、幅192aが4.5mm〜5.5mm、高さ192bが2.5〜3.5mm、直径192cが4.5mm〜5.5mm、線幅192dが1.0〜1.5mm等となる。また、設定情報が位置決めマーク192の中心の位置座標である場合、設定情報の選択範囲は、帳票画像の縦横の端からの距離192e、192fがそれぞれ1.0mm以上等となる。
【0041】
保持部164は、かかる設定情報について、OCR処理に適合する範囲を保持部164に保持する。本実施形態の帳票作成装置110は、上述したように、画像要素の設定情報として多数の詳細な項目についてまで設定ができ、保持部164に保持された設定情報の範囲を参照して帳票画像を生成することによりOCR処理の精度を向上することが可能となる。
【0042】
中央制御部166は、中央処理装置(CPU)、プログラム等が格納されたROM、ワークエリアとしてのRAM等を含む半導体集積回路により、帳票作成装置110全体を制御する。また、中央制御部166は、画像生成部170と、適合判断部172と、要素置換部174と、データ出力部176と、出力制御部178と、定義出力部180としても機能する。
【0043】
画像生成部170は、操作部162を通じたユーザ入力と、保持部164に保持された設定情報の範囲とに基づいて、帳票画像を生成する。例えば、画像生成部170は、上述したOCR帳票モードにおいて、帳票画像の生成のユーザ入力があると、帳票画像を構成する画像要素の設定情報の初期値を、保持部164に保持された設定情報の範囲で設定する。
【0044】
画像要素、例えば、罫線、文字枠182a、文字182b等の配置を指示するユーザ入力があると、画像生成部170は、その画像要素の設定情報、例えば、罫線の線幅や文字182bの大きさ等の初期値を、保持部164に保持された設定情報の範囲に基づいて設定し、配置する。かかる構成により、始めから、OCR処理に適した初期値が設定情報として設定された画像要素を配置でき作業効率を向上できる。
【0045】
このとき、画像生成部170は、ユーザ入力に応じて、設定情報の初期値を、保持部164に保持された設定情報の範囲の中でもOCR処理により適した推奨値としたり、設定情報の範囲の中では比較的OCR処理に適さない限界値としたりする。推奨値を用いると、OCR処理の精度がより向上し、限界値を用いると、例えば、文字サイズを比較的小さくできたり、画像要素間の間隔を比較的詰めることができたりするため、帳票のレイアウトの自由度が高まる。また、初期値は、ユーザ入力によって変更可能である。ユーザ入力によって変更された初期値は、変更前の初期値に初期化することもできる。
【0046】
また、保持部164に保持された設定情報の範囲は、例えば、OCR装置120の機種名や、OCR装置120のOCR処理部で用いられるOCR処理ソフトウェアの名称およびバージョン毎に保持されており、画像生成部170は、ユーザ入力やOCR装置120からの制御情報に応じて、該当する設定情報の範囲を用いることとしてもよい。
【0047】
適合判断部172は、例えば、通常モードからOCR帳票モードへの切り換えや、ユーザによるOCR帳票モードの選択入力を契機として、既に生成されている帳票画像を構成する画像要素それぞれに対して、OCR処理に適合するか否かを判断する。適合判断部172は、例えば、保持部164に保持された設定情報の範囲やその他の画像要素との組み合わせに基づいて、OCR処理に適合するか否かを判断する。
【0048】
図5は、適合判断部172の判断処理を説明するための説明図である。適合判断部172が帳票画像を構成する画像要素それぞれに対して、OCR処理に適合するか否かを判断すると、図5に示すように、表示部160に、判断結果画面194を表示させて判断結果をユーザに報知する。例えば、領域196aに、バーコード「伝票番号」(画像要素)の高さが、保持部164に保持された設定情報の範囲外となりOCR処理に適合しない高さであることと、その範囲の下限値とが表示される。また、領域196bに、英数字項目「顧客ID」の文字サイズが保持部164に保持された設定情報の範囲外となりOCR処理に適合しない大きさであることと、その範囲の下限値とが表示される。
【0049】
また、ユーザ入力によって、図5のハッチングで示すように領域196aが選択されると、例えば、表示部160に並列して表示されている帳票画像における、該当する画像要素、すなわち、バーコード「伝票番号」自体が、強調表示(ハイライト)されるため、ユーザは、OCR処理に適合しない画像要素を容易に把握できる。
【0050】
このように、保持部164に保持された、画像要素の設定情報の範囲を参照する構成より、画像要素の設定要素と範囲との比較という簡易な処理で、OCR処理に適合するか否かを判断することができる。また、保持部164は、新たに生成する画像要素の設定情報の初期値を設定するための設定情報の範囲と、すでに生成されている画像要素がOCR処理に適合しているか否か判断するための設定情報の範囲とをそれぞれ別に保持してもよい。さらに、適合判断部172は、ユーザ入力に応じて、上述した初期値の推奨値を用いて判断基準を厳しくしたり、初期値の限界値を用いて判断基準を緩めたりする。
【0051】
適合判断部172を備える構成により、例えば、すでに作成した画像要素の設定情報が、保持部164に保持された設定情報の範囲に含まれておらず、そのままでは、OCR処理の精度が不十分になってしまいかねない場合であっても、画像生成部170が、保持部164に保持された設定情報の範囲に含まれないと判断した設定情報の画像要素を報知することで、ユーザに修正を促すことが可能となる。
【0052】
また、適合判断部172は、帳票画像を構成する画像要素のうち、ユーザに個別にまたは範囲で指定された画像要素やその設定情報、またはすべての画像要素に対して指定された設定情報のみを、OCR処理に適合するか否かを判断する。
【0053】
かかる構成により、例えば、OCR処理の精度が十分な画像要素や、ドロップアウトカラー等で意図的にOCR処理の対象外とした画像要素等、OCR処理に適合するか否かの判断が不要な画像要素についてまで、無駄に判定処理をしてしまう事態を回避することができ、処理負荷を軽減し処理時間を短縮することが可能となる。また、ユーザは、例えば、特に厳しい判断基準で判断を所望する設定情報がある場合、その設定情報のみを選択して、判断基準を厳しくした後、OCR処理に適合するか否かの判断をすることもできる。
【0054】
要素置換部174は、帳票画像を構成する画像要素のうち、OCR処理に適合しない画像要素をOCR処理に適合する画像要素に置換する。
【0055】
図5に示すように、判断結果画面194には、上部に「一括自動修正」と表記されたボタン198aが、領域196a、196b毎に、例えば「自動修正」と表記されたボタン198b、198cが表示される。ユーザが、操作部162を通じて、ボタン198aを選択すると、すべての領域196a、196bで示された画像要素の設定情報がそれぞれに対応する範囲内の値に書き換えられる。また、ユーザが、ボタン198b、198cを選択すると、個別に画像要素の設定情報を自動修正することができる。さらに、自動修正に限らず、ユーザは、操作部162を通じて、設定情報として任意の値を入力して修正してもよい。
【0056】
かかる構成により、OCR処理に適合しない画像要素を、OCR処理に適合する画像要素に自動的に置換でき、OCR処理に適合する画像要素となるように、ユーザが画像要素の設定情報等を修正する作業負担を軽減することが可能となる。
【0057】
また、要素置換部174は、帳票画像を構成する画像要素と、保持部164に保持されたパターンとに対してパターンマッチングを行い、そのパターンに該当する画像要素をOCR処理に適合する画像要素に置換する。
【0058】
図6は、要素置換部174のパターンマッチングに基づく置換処理を説明するための説明図である。OCR処理に適さない入力形式、例えば、「好き」「普通」「嫌い」の文字に、ユーザが丸で囲むような入力形式の画像要素や、一つの文字枠に予め定められた形式の複数の文字(例えば複数桁の数値)の書き込みをする画像要素があった場合、図6に示すように、パターン置換画面200において、置換を推奨する対象の画像要素に対する、置換候補が表示される。
【0059】
図5において説明した判断結果画面194と同様、パターン置換画面200においても、ユーザ入力によって、選択された画像要素について、表示部160に並列して表示されている帳票画像における、該当する画像要素自体が、強調表示(ハイライト)されることとする。
【0060】
ユーザ入力によって、ボタン202a〜202b、ボタン204a〜204dから、いずれかが選択されると、要素置換部174は、その選択されたボタン202a〜202b、ボタン204a〜204dに対応する、例えば、「好き」「普通」「嫌い」の文字それぞれの側にチェックボックスを設ける画像要素および文字枠を文字数分に分割する補助線を加えた画像要素等に置換する。また、「一括自動修正」ボタン206が選択されると、要素置換部174は、OCR処理に適さない入力形式の画像要素それぞれについて、予め定められた優先順位に応じて、OCR処理に最も適合する入力形式の画像要素を自動的に選択して置換する。
【0061】
かかる構成により、ユーザがOCR処理に適合しない入力形式を知っておらずとも、要素置換部174がOCR処理に適合しない入力形式の画像要素を報知し、その置換候補を示して、ユーザ入力によって選択されたOCR処理に適合する入力形式とすることができ、OCR処理の精度を向上することが可能となる。
【0062】
データ出力部176は、帳票画像を印刷に対応した形式に変換してプリンタ130に出力する。
【0063】
出力制御部178は、帳票画像が印刷される場合に、予め定められた印刷条件で印刷するようにプリンタ130を制御する。出力制御部178は、プリンタ130を直接制御する場合に限定されず、出力制御部178は、変更を禁止する印刷条件等の制御情報をプリンタ130に出力し、プリンタ130がその制御情報に基づいて、印刷条件を設定してもよい。
【0064】
OCR処理の精度が高くなるレイアウトに設定したとしても、プリンタ130で印刷条件が変更され、例えば縮小印刷をしてしまうと、印刷された帳票の文字の大きさが小さくなったり線の太さが細くなったりして、OCR処理の精度が低下してしまう可能性がある。出力制御部178が、予め定められた印刷条件で印刷するようにプリンタ130を制御することで、そのような事態を回避することが可能となる。
【0065】
定義出力部180は、画像生成部170が生成した帳票画像を電子的にOCR装置120に出力する。また、定義出力部180は、帳票画像を出力する場合に限らず、帳票画像から、OCR処理のための定義を示す定義情報を生成してOCR装置120に出力してもよい。
【0066】
上述したように、本実施形態の帳票作成装置110は、ユーザ入力に応じて自由な帳票設計を可能とすると共に、画像要素の設定情報を、OCR処理に適合するように、保持部164に保持された設定情報の範囲に収めて帳票画像を生成することができる。そのため、帳票154に対するOCR処理の精度を向上することが可能となる。
【0067】
(OCR装置120)
図7は、OCR装置120の構成を示した機能ブロック図である。OCR装置120は、表示部300と、操作部302と、中央制御部304とを含んで構成される。
【0068】
表示部300は、液晶ディスプレイ、有機ELディスプレイ等で構成される。操作部302は、表示部300の表示面上に設置されたタッチパネル、操作キーが複数設けられたキーボード、マウス等のポインティングデバイス、十字キー、ジョイスティック等で構成される。
【0069】
中央制御部304は、中央処理装置(CPU)、プログラム等が格納されたROM、ワークエリアとしてのRAM等を含む半導体集積回路により、OCR装置120全体を制御する。また、中央制御部304は、画像取得部320、定義取得部322、OCR処理部324、サーバ出力部326としても機能する。
【0070】
画像取得部320は、帳票154を読み取って生成した画像データをスキャナ140から取得する。
【0071】
定義取得部322は、帳票作成装置110の定義出力部180が出力した帳票画像または定義情報を取得する。帳票画像を取得した場合、定義取得部322は、その帳票画像から、OCR処理のための定義を示す定義情報を生成する。
【0072】
OCR処理部324は、例えば、画像取得部320が取得した画像データの画像のうち、基準マーク182cの位置を基準とし、定義取得部322が取得または生成した定義情報に基づいて、スキャナ140が読み取った帳票154の画像データに対してOCR処理(画像データから、その画像データが示す文字や数字等の内容を抽出する処理)を行う。
【0073】
サーバ出力部326は、OCR処理部324が行ったOCR処理の結果、抽出された文字や数字等の情報を、アプリケーションサーバ152に出力する。
【0074】
以上、説明した帳票作成装置110やOCR装置120によって、レイアウトの自由度を確保しつつ、生成された帳票154のOCR処理の精度を向上することが可能となる。また、コンピュータを、帳票作成装置110として機能させる帳票生成プログラムや、その帳票生成プログラムを記憶した、コンピュータで読み取り可能なフレキシブルディスク、光磁気ディスク、ROM、EPROM、EEPROM、CD(Compact Disc)、DVD(Digital Versatile Disk)、BD(Blu-ray Disc)等の記憶媒体も提供される。ここで、プログラムは、任意の言語や記述方法にて記述されたデータ処理手段をいう。
【0075】
また、この帳票生成プログラムは、帳票作成装置110に通信網150を介して接続された任意のアプリケーションプログラムサーバに記憶されていてもよく、必要に応じてその全部または一部をダウンロードすることもできる。
【0076】
(帳票作成方法)
次に、上述した帳票処理システムの運用を行う帳票作成方法を説明する。図8は、帳票作成方法の全体的な処理の流れを示したフローチャートである。
【0077】
図8に示すように、帳票画像の生成を指示するユーザ入力があると(S400)、画像生成部170は、現在の設計モードがOCR帳票モードであるか否かを判断し(S402)、OCR帳票モードである場合(S402のYES)、画像生成部170は、操作部162を通じたユーザ入力と、保持部164に保持された、OCR処理に適合させるための設定情報の範囲とに基づいて、帳票画像を生成する(S404)。OCR帳票モードでなく通常モードである場合(S402のNO)、画像生成部170は、ユーザ入力のみに基づいて帳票画像を生成する(S406)。
【0078】
そして、通常モードからOCR帳票モードへの切り換えや、OCR処理への適合判断を指示するユーザ入力があると(S408のYES)、適合判断部172は、帳票画像を構成する画像要素それぞれに対して、OCR処理に適合するか否かを判断し(S410)、その判断結果を示す判断結果画面を表示部160に表示させる(S412)。
【0079】
要素置換部174は、自動または手動での修正を指示するユーザ入力があるか否かを判断し(S414)、修正を指示するユーザ入力があると(S414のYES)、帳票画像を構成する画像要素のうち、OCR処理に適合しない画像要素をOCR処理に適合する画像要素に置換する(S416)。
【0080】
画像要素置換ステップS416の後、または、適合判断ユーザ入力判定ステップS408において、通常モードからOCR帳票モードへの切り換えや、OCR処理への適合判断を指示するユーザ入力がない場合(S408のNO)、要素置換部174は、パターンマッチングを指示するユーザ入力があるか否かを判断する(S418)。パターンマッチングを指示するユーザ入力があると(S418のYES)、帳票画像を構成する画像要素と、保持部164に保持されたパターンとに対してパターンマッチングを行い(S420)、該当する画像要素があるか否かを判断する(S422)。該当する画像要素がある場合(S422のYES)、要素置換部174は、表示部160にパターン置換画面を表示させる(S424)。
【0081】
要素置換部174は、置換候補を選択し置換するユーザ入力があるか否かを判断し(S426)、置換候補を選択し置換するユーザ入力があると(S426のYES)、要素置換部174は、OCR処理に適さない入力形式の画像要素を、選択された、OCR処理に適合する入力形式の画像要素に置換する(S428)。
【0082】
このような帳票作成方法によれば、レイアウトの自由度を確保しつつ、生成された帳票154のOCR処理の精度を向上することが可能となる。
【0083】
以上、添付図面を参照しながら本発明の好適な実施形態について説明したが、本発明はかかる実施形態に限定されないことは言うまでもない。当業者であれば、特許請求の範囲に記載された範疇において、各種の変更例または修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。
【0084】
なお、本明細書の帳票作成方法における各工程は、必ずしもフローチャートとして記載された順序に沿って時系列に処理する必要はなく、並列的あるいはサブルーチンによる処理を含んでもよい。
【産業上の利用可能性】
【0085】
本発明は、帳票の作成を行う帳票作成装置、帳票作成プログラム、および帳票作成方法に利用することができる。
【符号の説明】
【0086】
110 …帳票作成装置
130 …プリンタ(画像形成装置)
164 …保持部
170 …画像生成部
172 …適合判断部
174 …要素置換部
176 …データ出力部
178 …出力制御部
【特許請求の範囲】
【請求項1】
OCR処理に適合する画像要素を規定する設定情報の範囲を保持する保持部と、
ユーザ入力と、前記保持部に保持された設定情報の範囲とに基づいて、帳票画像を生成する画像生成部と、
を有する帳票作成装置。
【請求項2】
前記画像生成部は、前記帳票画像を構成する画像要素の設定情報の初期値を、前記保持部に保持された設定情報の範囲で設定する
請求項1に記載の帳票作成装置。
【請求項3】
前記帳票画像を構成する画像要素それぞれに対して、OCR処理に適合するか否かを判断する適合判断部をさらに有する
請求項1または2に記載の帳票作成装置。
【請求項4】
前記適合判断部は、前記帳票画像を構成する画像要素のうち、ユーザに指定された画像要素のみOCR処理に適合するか否かを判断する
請求項3に記載の帳票作成装置。
【請求項5】
前記適合判断部は、前記保持部に保持された設定情報の範囲に基づいて、OCR処理に適合するか否かを判断する
請求項3または4に記載の帳票作成装置。
【請求項6】
前記帳票画像を構成する画像要素のうち、OCR処理に適合しない画像要素をOCR処理に適合する画像要素に置換する要素置換部をさらに有する
請求項1から5のいずれか1項に記載の帳票作成装置。
【請求項7】
前記保持部は、置換候補となる画像要素のパターンを保持し、
前記要素置換部は、前記帳票画像を構成する画像要素と、前記保持部に保持されたパターンとに対してパターンマッチングを行い、前記パターンに該当する画像要素をOCR処理に適合する画像要素に置換する
請求項6に記載の帳票作成装置。
【請求項8】
前記設定情報には、少なくとも、文字フォント、文字サイズ、用紙サイズ、罫線の長さ、罫線の線幅、罫線の向き、文字枠の大きさ、文字枠の線幅、チェックボックスの大きさ、チェックボックスの間隔、バーコードの種類、バーコードの大きさ、バーコードのエレメント幅、バーコードのチェックデジット、色、ドロップアウトカラー、位置決めマークの大きさ、位置決めマークの配置、印刷時の倍率、印刷後の画像要素の大きさのいずれかが含まれる
請求項1から7のいずれか1項に記載の帳票作成装置。
【請求項9】
前記帳票画像が印刷される場合に、予め定められた印刷条件で印刷するように画像形成装置を制御する出力制御部をさらに有する
請求項1から8のいずれか1項に記載の帳票作成装置。
【請求項10】
コンピュータを、
OCR処理に適合する画像要素を規定する設定情報の範囲を保持する保持部と、
ユーザ入力と、前記保持部に保持された設定情報の範囲とに基づいて、帳票画像を生成する画像生成部と、
して機能させる帳票作成プログラム。
【請求項11】
ユーザ入力に応じて帳票画像を生成する生成ステップと、
帳票画像を構成する画像要素それぞれに対して、OCR処理に適合するか否かを判断する判断ステップと、
前記判断結果を表示する表示ステップと、
を有する帳票作成方法。
【請求項1】
OCR処理に適合する画像要素を規定する設定情報の範囲を保持する保持部と、
ユーザ入力と、前記保持部に保持された設定情報の範囲とに基づいて、帳票画像を生成する画像生成部と、
を有する帳票作成装置。
【請求項2】
前記画像生成部は、前記帳票画像を構成する画像要素の設定情報の初期値を、前記保持部に保持された設定情報の範囲で設定する
請求項1に記載の帳票作成装置。
【請求項3】
前記帳票画像を構成する画像要素それぞれに対して、OCR処理に適合するか否かを判断する適合判断部をさらに有する
請求項1または2に記載の帳票作成装置。
【請求項4】
前記適合判断部は、前記帳票画像を構成する画像要素のうち、ユーザに指定された画像要素のみOCR処理に適合するか否かを判断する
請求項3に記載の帳票作成装置。
【請求項5】
前記適合判断部は、前記保持部に保持された設定情報の範囲に基づいて、OCR処理に適合するか否かを判断する
請求項3または4に記載の帳票作成装置。
【請求項6】
前記帳票画像を構成する画像要素のうち、OCR処理に適合しない画像要素をOCR処理に適合する画像要素に置換する要素置換部をさらに有する
請求項1から5のいずれか1項に記載の帳票作成装置。
【請求項7】
前記保持部は、置換候補となる画像要素のパターンを保持し、
前記要素置換部は、前記帳票画像を構成する画像要素と、前記保持部に保持されたパターンとに対してパターンマッチングを行い、前記パターンに該当する画像要素をOCR処理に適合する画像要素に置換する
請求項6に記載の帳票作成装置。
【請求項8】
前記設定情報には、少なくとも、文字フォント、文字サイズ、用紙サイズ、罫線の長さ、罫線の線幅、罫線の向き、文字枠の大きさ、文字枠の線幅、チェックボックスの大きさ、チェックボックスの間隔、バーコードの種類、バーコードの大きさ、バーコードのエレメント幅、バーコードのチェックデジット、色、ドロップアウトカラー、位置決めマークの大きさ、位置決めマークの配置、印刷時の倍率、印刷後の画像要素の大きさのいずれかが含まれる
請求項1から7のいずれか1項に記載の帳票作成装置。
【請求項9】
前記帳票画像が印刷される場合に、予め定められた印刷条件で印刷するように画像形成装置を制御する出力制御部をさらに有する
請求項1から8のいずれか1項に記載の帳票作成装置。
【請求項10】
コンピュータを、
OCR処理に適合する画像要素を規定する設定情報の範囲を保持する保持部と、
ユーザ入力と、前記保持部に保持された設定情報の範囲とに基づいて、帳票画像を生成する画像生成部と、
して機能させる帳票作成プログラム。
【請求項11】
ユーザ入力に応じて帳票画像を生成する生成ステップと、
帳票画像を構成する画像要素それぞれに対して、OCR処理に適合するか否かを判断する判断ステップと、
前記判断結果を表示する表示ステップと、
を有する帳票作成方法。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【公開番号】特開2011−248480(P2011−248480A)
【公開日】平成23年12月8日(2011.12.8)
【国際特許分類】
【出願番号】特願2010−118806(P2010−118806)
【出願日】平成22年5月24日(2010.5.24)
【出願人】(000136136)株式会社PFU (354)
【公開日】平成23年12月8日(2011.12.8)
【国際特許分類】
【出願日】平成22年5月24日(2010.5.24)
【出願人】(000136136)株式会社PFU (354)
[ Back to top ]