説明

画像処理装置

【課題】原稿データに含まれている複数の文字情報の中から所望の文字情報群の配列規則を判定できる画像処理装置を提供する。
【解決手段】入力された名簿データから指定の宛名検索キーワードに該当する宛名を検索し、位置の計算と文字方向(横書き/縦書き)の判別を行う。この宛名の文字方向に基づいて該宛名を基点とした名簿データにおける宛名配列方向を予測する(S121)。上記の宛名に対して予測配列方向に配置されている文字を宛名候補として検出し(S122)、データベースを参照して宛名であるか否か照合する(S123)。照合された場合は(S124;Yes)、その文字(宛名)の位置を計算する(S125)。このようにして、名簿データに含まれている複数の宛名の位置を求め、これらの位置関係(間隔)に基づいて、名簿データに含まれている全ての宛名の配列を計算する(S126)。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、入力された原稿データに含まれている文字情報の配列規則を判定する機能を備えた画像処理装置に関する。
【背景技術】
【0002】
各種の文字情報(文字列)が一覧形式に記載されている書類などを光学式文字読取装置(Optical Character Reader;OCR)で読み取り、そのデータから所望の文字情報を抽出して他の書類に合成して印刷出力する技術は一般に知られている。
【0003】
たとえば、特許文献1に記載されている放置自転車管理システムでは、放置自転車に関する情報が記載された書類(防犯回答登録リスト)を読み取って抽出した防犯登録番号、登録者氏名、登録者住所を、放置自転車の持ち主に対する引き取り通知書に合成して自動発行するようにしている。またこの技術では、読み取る書類の書式(フォーマット)が予め決められており、所定の範囲(防犯登録番号、登録者氏名、登録者住所が記載されている範囲)のみを読み取ることで所望の文字情報を抽出するようにしている。
【0004】
【特許文献1】特開特開2000−40101号公報
【発明の開示】
【発明が解決しようとする課題】
【0005】
しかしながら、上記の技術では読み取り対象となる書類が特定の書式に限られてしまい、抽出する文字情報の位置や配列が不明である場合は対応することができない。たとえば、一般の名簿などは書式が様々であり、氏名や住所などの位置や配列は様々である。このような様々な書式の名簿などから全員分の氏名のみを抽出するようなことはできないため、汎用性に乏しい問題がある。
【0006】
本発明は、上記の問題を解決しようとするものであり、原稿データに含まれている複数の文字情報の中から所望の文字情報群の配列規則を判定することができる画像処理装置を提供することを目的としている。
【課題を解決するための手段】
【0007】
かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
【0008】
[1]原稿データが入力される入力部と、
前記入力部から入力された第1の原稿データに含まれている複数の文字情報の中から内容が同じ種類である文字情報群の配列規則を判定する場合に、前記種類に属する文字情報を使用してその文字情報に該当する第1の文字情報を検索し、その第1の文字情報から所定方向に検索して前記種類に属する第2の文字情報を特定し、前記第1の文字情報と前記第2の文字情報との位置関係に基づいて前記配列規則を判定する制御部と、
を備える
ことを特徴とする画像処理装置。
【0009】
上記発明では、入力された原稿データ(第1の原稿データ)に含まれている複数の文字情報の中から、配列規則を判定しようとする文字情報群と同じ種類の文字情報を使用して、その文字情報(検索キーワード)に該当する第1の文字情報を検索する。
【0010】
上記の文字情報群の種類とは、文字自体で分類される種類(アラビア数字、ローマ字、漢字など)などではなく、内容(情報内容)で分類される種類(名称、単語など)を指す。検索に使用する文字情報には、たとえば上記種類における代表的な文字情報やユーザが指定した文字情報などを使用することができる。
【0011】
そして、第1の文字情報から所定方向に検索して上記種類に属する第2の文字情報を特定し、第1の文字情報と第2の文字情報との位置関係に基づいて、上記種類に属する文字情報群の配列規則を判定する。たとえば、上記種類に属する文字情報群は、第1の文字情報と第2の文字情報とを含む列方向に第1の文字情報と第2の文字情報の間隔で配列されているなどと判定する。
【0012】
これにより、原稿データに含まれている複数の文字情報の中から内容が同じ種類である文字情報群の配列規則を判定することができる。
【0013】
[2]前記制御部は、前記第1の文字情報の検索では、その検索における検出確率の高い文字情報から順番に使用して前記第1の原稿データに含まれている複数の文字情報の中から検出された文字情報を前記第1の文字情報に決定する
ことを特徴とする[1]に記載の画像処理装置。
【0014】
上記発明では、第1の原稿データに含まれている複数の文字情報の中から第1の文字情報を検索する場合に、その検索における検出確率の高い文字情報(検索キーワード)から順番に使用して、該当する文字情報を検索する。そして、上記文字情報(検索キーワード)に該当する文字情報が検出された場合にその文字情報を第1の文字情報に決定する。このように、検出確率の高い文字情報から順番に使用して検索を行うことで、第1の文字情報の検索効率を向上することができる。
【0015】
[3]前記制御部は、前記第1の文字情報と前記第2の文字情報とを含む第1の列に配列された第3の文字情報から、前記第1の列方向とは異なる方向に検索して前記種類に属する第4の文字情報を特定できた場合は、その第4の文字情報の位置も加味して前記配列規則を判定する
ことを特徴とする[1]または[2]に記載の画像処理装置。
【0016】
上記発明では、第3の文字情報は、第1の文字情報と第2の文字情報とを含んだ第1の列に配列されている文字情報である。この第3の文字情報には、第1の文字情報と、第2の文字情報と、第1の列に配列されているそれ以外の文字情報とが含まれる。この第3の文字情報におけるいずれか1つまたは複数から第1の列とは異なる方向に検索して上記種類に属する第4の文字情報を特定できた場合は、配列規則を判定しようとする文字情報群が複数列で配列(2次元配列)されていると推定でき、その第4の文字情報の位置も加味して配列規則を判定する。これにより、複数列の配列規則も判定可能となる。
【0017】
[4]前記制御部は、前記第4の文字情報から前記第1の列に沿った方向に検索して前記種類に属する第5の文字情報を特定し、前記第4の文字情報と前記第5の文字情報との位置関係に基づいてその第4の文字情報と第5の文字情報とを含む第2の列に対する前記配列規則を判定する
ことを特徴とする[3]に記載の画像処理装置。
【0018】
上記発明では、複数列の配列規則の判定において、第1の列に沿った(第1の列と平行な)第2の列における上記文字情報群の配列規則が第1の列とは個別に判定される。
【0019】
[5]前記制御部は、前記第1の列に沿った前記第4の文字情報を含む第2の列に対して前記第1の文字情報と前記第2の文字情報との位置関係に基づいて判定した前記配列規則を適用することでその第2の列に対する前記配列規則を判定する
ことを特徴とする[3]に記載の画像処理装置。
【0020】
上記発明では、複数列の配列規則の判定において、第1の列に沿った(第1の列と平行な)第2の列における上記文字情報群の配列規則が第1の列と同じ配列規則であると判定される。
【0021】
[6]前記制御部は、前記第3の文字情報と前記第4の文字情報との位置関係に基づいて前記第1の列方向とは異なる方向の前記配列規則を判定する
ことを特徴とする[3]に記載の画像処理装置。
【0022】
上記発明では、第1の列方向とは異なる方向における上記文字情報群の配列規則を第3の文字情報と第4の文字情報との位置関係に基づいて判定する。たとえば、上記文字情報群は、第1の列方向とは異なる方向には、第3の文字情報と第4の文字情報の間隔で配列されているなどと判定する。
【0023】
これにより、複数列の上記文字情報群に対する配列規則の判定において、第1の列方向とは異なる方向の配列規則を判定することができる。
【0024】
[7]前記制御部は、前記第1の原稿データが複数ページのデータである場合は、前記配列規則の判定をページ毎に行う
ことを特徴とする[1]乃至[6]のいずれか1つに記載の画像処理装置。
【0025】
上記発明では、複数ページの原稿データ(第1の原稿データ)に対しては、ページ毎に上記文字情報群の配列規則が判定される。
【0026】
[8]前記制御部は、前記第1の文字情報の文字方向に基づいて前記所定方向を決定する
ことを特徴とする[1]乃至[7]のいずれか1つに記載の画像処理装置。
【0027】
上記発明では、第1の文字情報の文字方向に基づいて、第1の文字情報から第2の文字情報を検索する所定方向(検索方向)を決定する。この文字方向とは、文字の並び方向であり、横書きや縦書きといった書字方向を指す。たとえば、第1の文字情報が横書きの場合は、配列規則を判定しようとする文字情報群が上下方向(縦方向)に配列されている可能性が高いため、上下方向に検索し、縦書きの場合は、同文字情報群が左右方向(横方向)に配列されている可能性が高いため、左右方向に検索するなどする。これにより、第2の文字情報を効率よく検索して特定できるようになる。
【0028】
[9]前記制御部は、前記第1の文字情報の書式と前記第1の文字情報に隣接する文字情報の書式とを比較し、前記第1の文字情報に対して書式の異なる文字情報が配置されている方向は前記第2の文字情報を検索する方向から除外する
ことを特徴とする[1]乃至[8]のいずれか1つに記載の画像処理装置。
【0029】
上記発明では、第1の文字情報に隣接する文字情報が第1の文字情報と書式(文字の大きさ、書体など)が異なる場合は、配列規則を判定しようとする文字情報群が第1の文字情報からその書式の異なる文字情報の方向に配列されている可能性は低いため、その方向には第2の文字情報の検索を行わないようにする。これにより、第2の文字情報を効率よく検索して特定できるようになる。
【0030】
また、上記発明を[8]に記載した第1の文字情報の文字方向に基づいて所定方向(第2の文字情報の検索方向)を決定する発明と組み合わせる場合は、たとえば、第1の文字情報が横書きであるため所定方向を上下方向にしようとするが、上下方向における一方向(たとえば上方向)に配置されている文字情報の書式が異なる場合にその一方向へは第2の文字情報を検索しないなどが可能である。
【0031】
[10]前記制御部は、前記第1の原稿データに含まれている複数の文字情報の中から前記配列規則に則って前記種類に属する個々の文字情報を抽出し、その文字情報を前記入力部から入力された第2の原稿データに合成して出力する
ことを特徴とする[1]乃至[9]のいずれか1つに記載の画像処理装置。
【0032】
上記発明では、第1の原稿データから抽出された内容が同じ種類である個々の文字情報が第2の原稿データに合成されて出力される。
【0033】
[11]前記制御部は、指定された文字情報を使用して前記第2の原稿データからその文字情報に該当する第6の文字情報を検索し、その第6の文字情報の位置と書式とに基づいて、前記第2の原稿データに合成する文字情報の位置と書式とを決定する
ことを特徴とする[10]に記載の画像処理装置。
【0034】
上記発明では、第2の原稿データから検索した指定の文字情報(第6の文字情報)に対して、第1の原稿データから抽出した文字情報を合成する場合に、その合成する文字情報の位置と書式(文字の大きさ、文字方向など)を、上記指定の文字情報の位置と書式に基づいて決定する。これにより、指定の文字情報に対して合成する文字情報を見栄え良く配置したり、見栄えの良くなる書式にしたりするなどが可能となる。
【0035】
[12]前記制御部は、前記種類に属する文字情報が登録されたデータベースを参照して前記特定を行う
ことを特徴とする[1]乃至[11]のいずれか1つに記載の画像処理装置。
【0036】
上記発明では、上記文字情報(第2〜第5の文字情報)の特定を、上記種類に属する文字情報が登録されたデータベースを参照して簡単に行うことができる。
【0037】
[13]前記制御部は、前記配列規則に則って前記抽出した文字情報に対し、前記種類に属する文字情報が登録されたデータベースを参照して前記種類に属するか否かを判定する
ことを特徴とする[1]乃至[11]のいずれか1つに記載の画像処理装置。
【0038】
上記発明では、配列規則に則って抽出した文字情報が上記種類に属するか否かの判定(検証)を、上記種類に属する文字情報が登録されたデータベースを参照して簡単に行うことができる。なお、上記第1および第2の文字情報や第4および第5の文字情報は、上記種類に属することが判明しているため、上記判定を省略するようにしてもよい。これにより、抽出した中に上記種類に属していない文字情報が含まれていた場合はその文字情報を除外するなどが可能となる。
【0039】
[14]前記制御部は、前記種類に属するか否かの判定では、前記種類に属さないことを示す条件が登録されたデータベースも参照し、前記条件に該当する文字情報は前記種類に属さないと判定する
ことを特徴とする[13]に記載の画像処理装置。
【0040】
上記発明では、配列規則に則って抽出した文字情報が上記種類に属するか否かの判定においては、上記種類に属さないことを示す条件を登録したデータベースも参照することで、判定を行う上での効率や精度を向上できる。
【0041】
[15]表示部と、操作部とを備え、
前記制御部は、前記判定の結果を前記表示部に表示し、その判定の結果に対する確定または訂正の操作を前記操作部により受け付ける
ことを特徴とする[13]または[14]に記載の画像処理装置。
【0042】
上記発明では、配列規則に則って抽出された文字情報が上記種類に属するか否かを自動判定した結果が表示され、ユーザはその判定結果を確認して確定または訂正できるようになる。これにより、誤判定された文字情報や出力する必要のない文字情報などが第2の原稿データに合成されて出力されるような無駄を抑制することができる。
【発明の効果】
【0043】
本発明の画像処理装置によれば、原稿データに含まれている複数の文字情報の中から所望の文字情報群の配列規則を判定できるようになる。したがって、汎用性や利便性が向上する。
【発明を実施するための最良の形態】
【0044】
以下、図面に基づき本発明の実施の形態を説明する。
【0045】
[第1の実施の形態]
図1は、本発明の第1の実施の形態に係る画像処理装置としての複合機10(MFP;Multi Function Peripheral/Multi Function Printer)の概略構成を示している。
【0046】
複合機10は、原稿のコピー機能、プリンタ機能、スキャナ機能、ファクシミリ機能などを備えている。
【0047】
スキャナ機能には、光学的に読み取った原稿に記載されている文字のイメージデータを自動認識してテキストデータに変換するOCR機能が設けられている。
【0048】
コピー機能には、読み取った原稿をデフォルト設定やユーザ設定による条件で複写印刷する通常コピーモードの他に、上記のOCR機能を使用して第1の原稿に含まれている所望の文字情報(文字列)を抽出し第2の原稿に合成して印刷する自動合成モードが設けられている。この自動合成モードは、たとえば第1の原稿(抽出元原稿)としての「名簿」や「住所録」などから所望の文字情報としての「宛名」や「宛先」などを抽出して第2の原稿(合成先原稿)としての「送付状」、「案内状」、「通知書」などに自動的に合成するなどにより、宛名書きや宛先書きなどの作業を軽減できるモードである(自動宛名書きモード/自動宛先書きモード)。
【0049】
なお、本明細中で使用する「文字情報」とは、1つまたは複数の文字からなる何らかの意味(情報)を有する名称や単語などを指し、一般的に使われている「文字列」などと同義である。この文字情報は、たとえば、人名(姓、名)、社名、地名(日本の場合は都道府県市区町村名)、郵便番号など、内容(情報内容)による分類が可能である。以下では「文字情報」を単に「文字」と呼ぶ場合がある。
【0050】
また、名簿などに記載されている人名や社名などの名称(名前)は、送付状などのドキュメント(書類)における宛名欄に記入されることで、そのドキュメントにおける宛名となる。ただし本明細中では、便宜的に名簿上でも宛名と称して説明する。
【0051】
複合機10は、制御部としてのCPU(Central Processing Unit)11に、バス12を介してROM(Read Only Memory)13と、RAM(Random Access Memory)14と、不揮発メモリ15と、ハードディスク装置(Hard Disk Drive;HDD)16と、操作部17と、表示部18と、ファクシミリ通信部19と、ネットワーク通信部20と、原稿送り装置制御部21と、スキャナ部22と、画像処理部23と、プリンタ部24とを接続して構成される。
【0052】
CPU11は、ROM13に格納されているプログラムに基づいて複合機10の動作を制御する。自動合成モードでは、原稿データに対する文字(文字情報)の抽出と合成も行う。RAM14はCPU11がプログラムを実行する際に各種データを一時的に格納するワークメモリとして使用されるほか、画像データを一時的に保存するための画像メモリなどにも使用される。
【0053】
不揮発メモリ15は、電源がオフされても記憶が保持されるメモリであり、装置固有の情報や各種の設定情報などが記憶される。ハードディスク装置16は、各種の保存データなどを格納するほか、原稿のスキャンやコピーにおける画像データ、クライアント端末から依頼された印刷における画像データ(印刷データ)なども保存する。
【0054】
操作部17は、モード選択ボタン、スタートボタン、ストップボタン、テンキーなどの各種のボタン類などで構成され、ユーザなどが複合機10に対して行う各種の操作を受け付ける機能を果たす。表示部18は、液晶ディスプレイなどで構成され、操作画面、設定画面、案内画面などの各種の画面を表示する機能を果たす。
【0055】
ファクシミリ通信部19は、ファクシミリ機能を備えた外部装置と公衆回線を通じて通信する機能を果たす。ネットワーク通信部20は、クライアント端末やサーバなどの外部装置とLAN(Local Area Network)などのネットワークを通じて通信する機能を果たす。
【0056】
原稿送り装置制御部21は、図示しない自動原稿送り装置(Auto Document Feeder;ADF)の動作を制御する機能を果たす。自動原稿送り装置は、スキャナ部22による読取位置に原稿を自動で送り込む機能を備えている。たとえば、原稿が積載される原稿トレイと、原稿トレイに積載された原稿をスキャナ部22の読取位置に案内し排出するための搬送通路と、原稿トレイに積載された原稿を1枚ずつ搬送通路に送り込み、スキャナ部22の読取位置を通過させて搬送通路から排出する複数の搬送ローラと、スキャナ部22による読み取りの済んだ原稿が搬送通路から排出される排出トレイなどで構成される。
【0057】
スキャナ部22は、原稿を光学的に読み取って画像データ(原稿データ)を取得する機能を果たす。たとえば、原稿に光を照射する光源と、原稿からの反射光を受光して原稿を幅方向(主走査方向)に1ライン分読み取るイメージセンサと、イメージセンサによるライン単位の読み取り位置を原稿の長さ方向(副走査方向)に移動させるスキャン機構と、原稿からの反射光をイメージセンサに導いて結像させるレンズやミラーからなる光学経路(光学系)などを備えている。
【0058】
画像処理部23は画像データに対して、画像補正、回転、拡大/縮小、圧縮/伸張など各種の画像処理を施す機能を果たす。また、クライアント端末から依頼された印刷における印刷データ(ベクタ形式のイメージデータ)に対してラスタライズ処理を施す機能を果たす。
【0059】
プリンタ部24は、入力された画像データに対応する画像を用紙に形成して出力する機能を果たす。たとえば、用紙の搬送装置と、感光体ドラムと、帯電装置と、レーザーユニットと、現像装置と、転写分離装置と、クリーニング装置と、定着装置などを備え、電子写真プロセスによって用紙上に画像を形成するレーザープリンタなどとして構成される。
【0060】
図2は、自動合成モードにおけるCPU11の機能ブロック図を示している。また本図では、自動合成モードに関連する上述した複合機10の主要構成も示している。
【0061】
自動合成モードでは、たとえば、宛名が未記入であるドキュメント50と、ドキュメント50に記入する宛名としての人名(姓、名)や社名などが複数記載されている名簿60とを読み取ってOCR機能による文字の自動認識を行う。このOCR処理による文字認識後に、ドキュメント50に記載されている「様」、「殿」、「御中」などの敬称の検索と、名簿60に記載されている複数の宛名(文字情報群)の配列規則の判定(配列予測)やその規則で配列されている文字が宛名であるか否かの判定を行う。そして、名簿60から全ての宛名を抽出し、各宛名を敬称に合わせて合成した宛名数分のドキュメント50を印刷するなどが可能となっている。
【0062】
データ入力部22は、上記例のような宛名が未記入であるドキュメント50の画像データと、ドキュメント50に記入する宛名が記載された名簿60の画像データとを入力する機能を果たす。ここでは、データ入力部22は上述したスキャナ部22で構成されている。データ入力部22(スキャナ部22)は、自動原稿送り装置にセットされ自動で送り込まれるなどしたドキュメント50と名簿60を光学的に読み取り、各々の画像データ(原稿データ)を取得することでデータ入力を行う。
【0063】
また、上記のような原稿の読み取りによるデータ入力で、ドキュメント50と名簿60の画像データを識別するには、読み取る原稿の種類をユーザが指定して個別に読み取らせるなどの構成により実現できる。
【0064】
たとえば、操作部17に、合成先原稿(ドキュメント50)を指定する合成先原稿指定ボタンと、抽出元原稿(名簿60)を指定する抽出元原稿指定ボタンとを設ける。ユーザは、一方の種類の原稿を複合機10にセットし、その種類に対応する原稿指定ボタンを操作してから読み取り開始ボタン(スタートボタン)を操作する。この原稿の読み取り完了後に、他方の種類の原稿を複合機10にセットし、その種類に対応する原稿指定ボタンを操作してから読み取り開始ボタンを操作する。このような構成により、入力された画像データがユーザの指定した種類の原稿に対応するデータであることを識別できるようになる。
【0065】
また、入力された画像データをOCR処理して原稿の内容を解析し、自動的に識別するようにしてもよい。
【0066】
なお、以下ではドキュメントの画像データを「ドキュメントデータ」と略称し、名簿の画像データを「名簿データ」と略称する。また、それらを総称する場合は「原稿データ」と言う。
【0067】
データ保存部14は、データ入力部22から入力されたドキュメントデータと名簿データを保存する機能を果たす。ここでは、データ保存部14は上述したRAM14、もしくは、複合機10内に実装されているDRAM(Dynamic Random Access Memory)やSRAM(Static Random Access Memory)などのメモリで構成される。
【0068】
CPU11は、原稿情報出力部31と、文字照合部32と、文字座標検出部33と、宛名配列予測部34と、宛名読出部35と、宛名判定部36と、宛名貼付部37とを備え、これらの機能部によって名簿データからの宛名の抽出とドキュメントデータへの合成とを行う。
【0069】
データ出力部24は、CPU11によって作成された、宛名が合成されたドキュメントデータを出力する機能を果たす。ここでは、データ出力部24は上述したプリンタ部24で構成されている。データ出力部24(プリンタ部24)は、上記のドキュメントデータに対応する画像を用紙に形成して出力することでデータ出力を行う。
【0070】
CPU11における原稿情報出力部31は、原稿データに含まれている所望の文字(宛名、敬称など)の位置や大きさを判別(計算)するために必要となる原稿に関する情報(原稿情報)を作成して出力する役割を担う。本例では、文字の位置や大きさをライン数(ドット数)で表すようにしている。
【0071】
詳細には、原稿情報出力部31は、データ入力部22から原稿データが入力されると、その原稿データに係る原稿情報を格納した原稿情報テーブル41を作成する。原稿情報は、原稿サイズと、読み取り解像度と、それらの情報から計算した原稿の幅方向(X方向)および長さ方向(Y方向)のライン数である。原稿情報出力部31は、この原稿情報を格納した原稿情報テーブル41を文字座標検出部33と宛名配列予測部34に出力する。
【0072】
たとえば、原稿が上記のドキュメント50と名簿60であって、それらの原稿サイズと読み取り解像度が同じであれば、同一の情報を格納した1つ(共通)の原稿情報テーブルを作成する。原稿サイズと読み取り解像度の少なくとも一方が異なっていてライン数が異なる場合には、1つ原稿情報テーブルに各原稿の情報を個別に格納したり、原稿情報テーブルを原稿毎に作成したりするなどしてもよい。
【0073】
文字照合部32は、原稿データに含まれている所望の文字の検索に使用する検索キーワードの提示や、所望の文字の特定や判定における照合を行う役割を担う。詳細には、予め設定された検索キーワードとなる文字を文字座標検出部33に提示したり、宛名配列予測部34や宛名判定部36から照合を依頼された文字を照合したりする。
【0074】
上記の提示や照合に用いる文字は、ハードディスク装置16などに格納されたデータベース38に予め登録されている。本例の場合は、データベース38に宛名としての人名(日本で使用されている苗字)と、敬称としての「様」、「殿」、「さん」などが登録されている(宛名リスト/敬称リスト)。また必要に応じて、宛名としての社名や、敬称としての「御中」や、地名、郵便番号、電話番号などの宛先に関する情報(宛先リスト)を登録するようにしてもよい。
【0075】
文字照合部32はデータベース38にアクセスすることで、検索キーワードとして提示する文字(敬称検索キーワード/宛名検索キーワード)の取得や、照合を依頼された文字の照合を行う。また検索キーワードは、ユーザが操作部17などを通して指定(設定)することも可能となっている。
【0076】
文字座標検出部33は、原稿データに含まれている所望の文字の検出とその位置(座標位置)および大きさ(文字サイズ)を計算する役割を担う。
【0077】
詳細には、文字照合部32から提示された敬称検索キーワードをドキュメントデータから検索し、原稿情報テーブル41に格納されている原稿のXYライン数を使用して、検索した敬称の位置とサイズをXYライン数として算出する。さらに、検索した敬称の文字方向(横書き/縦書き)を判別する。この検索した敬称と、位置を示すXYライン数と、文字サイズを示すXYライン数と、文字方向とを格納した敬称座標テーブル42を作成し、宛名貼付部37に出力する。
【0078】
また、文字照合部32から提示された宛名検索キーワードを名簿データから検索し、原稿情報テーブル41に格納されている原稿のXYライン数を使用して、検索した宛名の位置とサイズをXYライン数として算出する。さらに、検索した宛名の文字方向(横書き/縦書き)を判別する。この検索した宛名と、位置を示すXYライン数と、文字サイズを示すXYライン数と、文字方向とを格納した宛名座標テーブル43を作成し、宛名配列予測部34に出力する。
【0079】
宛名配列予測部34は、名簿データに含まれている宛名の配列を予測して(配列規則を判定して)その結果を出力する役割を担う。詳細には、原稿情報テーブル41と宛名座標テーブル43に基づいて、名簿データに含まれている宛名の配列を予測(計算)し、宛名毎に(宛名と推測できる文字毎に)予測配置位置を示すXYライン数と文字サイズを示すXYライン数とを対応付けて格納した宛名配列テーブル44を作成し、宛名読出部35に出力する。
【0080】
宛名読出部35は、宛名配列予測部34が予測した位置に配置されている文字を名簿データから読み出して出力する役割を担う。詳細には、宛名配列テーブル44に格納されている情報(予測配置位置および対応する文字サイズ)に基づいて名簿データから文字を読み出し、その文字を元の情報に対応付けて宛名配列テーブル44に格納し、宛名判定部36に出力する。
【0081】
宛名判定部36は、名簿データから読み出された文字が宛名であるか否かを判定してその結果を出力する役割を担う。詳細には、宛名配列テーブル44に格納されている文字の照合を文字照合部32に依頼し、その結果を示す宛名判定情報をその文字に対応付けて宛名配列テーブル44に格納することにより、宛名配列テーブル44から新たに宛名判定テーブル45を作成し、宛名貼付部37に出力する。
【0082】
宛名貼付部37は、宛名と判定された文字をドキュメントデータに貼り付けて出力する役割を担う。詳細には、宛名判定テーブル45に格納されている文字の中から、宛名判定情報に基づいて宛名とされた文字を読み出し、敬称座標テーブル42に基づいてドキュメントデータの敬称に合わせて貼り付け、データ出力部24に出力する。
【0083】
またCPU11はプログラムを実行することで、名簿データに含まれている宛名(文字情報群)の配列規則を判定する場合に、宛名に属する文字(宛名検索キーワード)を使用してその文字に該当する第1の文字を検索し、その第1の文字から所定方向に検索して宛名に属する第2の文字を特定し、第1の文字と第2の文字との位置関係に基づいて宛名の配列規則を判定する機能を果たす。所定方向は、本実施の形態では名簿データ(名簿60)における上下左右方向とされており、第1の文字からいずれの方向へ検索するかは、第1の文字の文字方向(横書き/縦書き)などに基づいて決定するようになっている。
【0084】
次に、複合機10の動作について説明する。
【0085】
図3は、複合機10による自動合成モードの処理の流れを示している。図3に示すフローチャートでは処理の概要を説明し、詳細については後述する。
【0086】
複合機10では、ユーザによるモード選択ボタンの操作で自動合成モード(自動宛名書きモード)が選択されると、CPU11は本処理を開始する(Start)。続いて、ユーザによる操作で上述したドキュメント50と名簿60の読み取りを行い、原稿データ(ドキュメントデータ/名簿データ)を入力する(ステップS101)
【0087】
この原稿データの入力では、ユーザは、たとえばドキュメント50を自動原稿送り装置にセットし、原稿の種類をドキュメント(合成先原稿)に指定してからスタートボタンを押下する。CPU11は、原稿送り装置制御部21を介して自動原稿送り装置によりドキュメント50を送り込む。このドキュメント50をスキャナ部22で読み取り、スキャナ部22から入力された画像データをドキュメント50の画像データ(ドキュメントデータ)であると認識してデータ保存部14に保存する。
【0088】
ドキュメント50の読み取りが完了すると、ユーザは、名簿60を自動原稿送り装置にセットし、原稿の種類を名簿(抽出元原稿)に指定してからスタートボタンを押下する。CPU11は、原稿送り装置制御部21を介して自動原稿送り装置により名簿60を送り込む。この名簿60をスキャナ部22で読み取り、スキャナ部22から入力された画像データを名簿60の画像データ(名簿データ)であると認識してデータ保存部14に保存する。
【0089】
CPU11は、ドキュメントデータと名簿データから、それらのデータに含まれている敬称や宛名の位置や大きさを判別(計算)するために必要となる原稿情報を格納した原稿情報テーブル41を作成する(ステップS102)。
【0090】
続いて、ドキュメントデータに対するOCR処理と敬称検索キーワードを使用した検索によって、ドキュメント50に記載されている敬称を検索する。また、名簿データに対するOCR処理と宛名検索キーワードを使用した検索によって、名簿60に記載されている複数の宛名の中から所定数(少なくとも1つ)の宛名を検索する(ステップS103)。この宛名の周辺に配置されている他の宛名をデータベース38を参照して特定し、これらの複数の宛名の位置関係に基づいて全ての宛名の配列位置を予測する(ステップS104)。
【0091】
CPU11は、名簿データから、予測した配列位置に存在する個々の文字を宛名候補として読み出し(ステップS105)、宛名であるか否かをデータベース38を参照して個々に判定する(ステップS106)。宛名であると判定した文字については、ドキュメントデータにおける敬称の近傍位置に貼り付ける(ステップS107)。このドキュメントデータをプリンタ部24に入力して宛名が合成されたドキュメントを印刷出力し(ステップS108)、本処理を終了する(End)。
【0092】
次に、図3のフローチャートに示した手順に従って自動合成モードの詳細を図4〜図16を用いて説明する。
【0093】
本実施の形態では、学校の先生が生徒の父兄へ配布する「お知らせ資料」に父兄の名前を個別に記入する場合で説明する。たとえば、お知らせ資料に宛名を1通ずつ手書きすると手間が掛かるため、複合機10の自動合成モードを使用して、図4に示すようなお知らせ資料としてのドキュメント50と、生徒の氏名や住所が記載されたクラス(○年○組)の名簿60を読み取らせることにより、お知らせ資料への宛名書きを自動で行うようにする。
【0094】
ドキュメント50は、文書全体の書式が横書きとされている。文書の右肩部(右上部)に宛名記入欄が設けられ、「様」と記載された敬称51が配置されている。敬称51のサイズは12ptとなっている。この敬称51の前側(図示の左側)に宛名を横書きで記入するようになっており、宛名自体は未記入で敬称51の前側は空白となっている。
【0095】
名簿60は、書式が横書きとされ、複数の生徒の氏名61と住所62が一覧形式で記載されている。詳細には、生徒1人分の氏名61と住所62が横方向(左右方向)に配列され、氏名61の50音順に縦方向(上下方向)に配列されている。また、文字サイズは8ptとなっている。
【0096】
本例では、ドキュメント50と名簿60は共に、A4サイズの縦向きであり、600dpi(dot per inch)の解像度で読み取る場合で説明する。また、原稿の幅方向(左右方向)をX方向とし、長さ方向(上下方向)をY方向とすると共に、XY座標における原点位置を図示の左下角部に設定した場合で説明する。
【0097】
(1)原稿データ(ドキュメント、名簿)入力
図3のステップS101では、図4に示すように、データ入力部22から入力されたドキュメント50の画像データ(ドキュメントデータ70)と名簿60の画像データ(名簿データ80)は、データ保存部14に一旦保存される。
【0098】
(2)原稿情報作成
図3のステップS102では、図4に示すように、原稿情報出力部31は、入力されたドキュメントデータ70および名簿データ80の原稿サイズと読み取り解像度から原稿のXY方向のライン数(ドット数)を計算する。
【0099】
ドキュメント50と名簿60が共に、A4サイズの縦向きで、解像度が600dpiで読み取られた本例の場合は、XY方向のライン数はそれぞれ[X:Y=4960Line:7015Line]と計算される。原稿情報出力部31は、原稿サイズと、解像度と、XYライン数とを格納した共通の原稿情報テーブル41を作成する。なお、ドキュメント50と名簿60で原稿サイズおよび読み取り解像度の少なくとも一方が異なっていてXYライン数が異なる場合には、上記の原稿情報テーブル41に各々の原稿情報を個別に格納する、もしくは、原稿情報テーブルを個別に作成するなどする。
【0100】
(3)敬称/宛名検索
ここでは、図3のステップS103による、ドキュメントデータ70と名簿データ80から指定の文字(敬称/宛名)を検索する方法について説明する。
【0101】
(3−1)ドキュメントデータからの指定敬称検索方法
図5に示すように、データ保存部14に保存されているドキュメントデータ70が文字座標検出部33に入力される。このデータ入力と共に、原稿情報出力部31は原稿情報テーブル41を文字座標検出部33に出力する。文字照合部32は、予め設定されている敬称検索キーワード90をデータベース38から取得して文字座標検出部33に出力する。本例では、敬称検索キーワード90は「様」としている。
【0102】
文字座標検出部33は、ドキュメントデータ70をOCR処理し、敬称検索キーワード90の「様」という文字がドキュメントデータ70に存在するかを検索する。ドキュメントデータ70に「様」という文字が存在しておらず、検出できなかった場合には、文字座標検出部33は文字照合部32に対して次の敬称検索キーワードの出力を要求し、新たに入力された敬称検索キーワードを使用して再検索する。
【0103】
敬称検索キーワードの例としては、「様」の他に、「殿」、「さん」、などが挙げられる。また、宛名が社名などの場合には「御中」なども挙げられる。文字照合部32は、文字座標検出部33から敬称検索キーワードの出力要求を受ける毎に、予め設定されている順番で敬称検索キーワードを文字座標検出部33に出力する。
【0104】
本例の場合はドキュメントデータ70に「様」という文字が存在しているため(敬称51)、文字座標検出部33はその文字(検索指定文字)を検出する。そして、検出した文字(「様」)の座標位置と文字サイズを計算する。
【0105】
座標位置は、1文字の場合はその文字の中心位置とし、複数文字の場合は先頭の文字の中心位置とする。文字サイズは、1文字の場合はその文字のみのサイズとし、複数文字の場合はその複数文字全体のサイズとする。
【0106】
本例の場合は、座標位置がX:Y=4600Line:6800Line(180mm:267mm相当)となり、文字サイズがX:Y=105Line:105Line(12ptからの概略換算値)となる。
【0107】
文字座標検出部33は、更に宛名の貼り付けに必要な情報として文字方向も検出する。検索指定文字が複数文字の場合は、文字の並びが左右方向であれば文字方向を横書き(「ヨコ」)として検出し、文字の並びが上下方向であれば文字方向を縦書き(「タテ」)として検出する。
【0108】
本例の「様」のように1文字である場合は、その文字のみでは文字方向を検出できないため、文字座標検出部33が再度、他の複数文字を検索して文字方向を検出したり、ユーザによってドキュメント50の横書き/縦書きを指定してもらったりするなどしてもよい。また、複数文字の再検索では、たとえば、「です。」、「ます。」、「である。」など、文章に必ず存在する文字を検索することで、文字方向の検出が可能である。
【0109】
本例のドキュメント50は横書きであり、上記の文字方向は横書きとして検出される。文字座標検出部33は、検出した文字(敬称51)を敬称欄に格納すると共にその文字の座標位置と文字サイズの計算結果、および、文字方向の検出結果を格納した敬称座標テーブル42を作成する。
【0110】
(3−2)名簿データからの指定宛名検索方法
図6に示すように、データ保存部14に保存されている名簿データ80が文字座標検出部33に入力される。このデータ入力と共に、原稿情報出力部31は原稿情報テーブル41を文字座標検出部33に出力する。文字照合部32は、予め設定されている宛名検索キーワード91をデータベース38から取得して文字座標検出部33に出力する。本例では、宛名検索キーワード91は「佐藤」としている。
【0111】
なお、本例のようにドキュメントデータ70(ドキュメント50)と名簿データ80(名簿60)で原稿情報テーブル41が共通である場合には、名簿データ80の入力に伴う原稿情報出力部31から文字座標検出部33への原稿情報テーブル41の出力を省略し、文字座標検出部33はドキュメントデータ70の入力時に原稿情報出力部31から入力された原稿情報テーブル41を使用して処理を進めるようにしてもよい。
【0112】
文字座標検出部33は、名簿データ80をOCR処理し、宛名検索キーワード91である「佐藤」という文字が名簿データ80に存在するか検索する。名簿データ80に「佐藤」という文字が存在しておらず、検出できなかった場合には、文字座標検出部33は文字照合部32に対して次の宛名検索キーワードの出力を要求し、新たに入力された宛名検索キーワードを使用して再検索する。
【0113】
宛名検索キーワードは、たとえば、日本で使用されている苗字を予めデータベース38に登録しておき、文字照合部32が文字座標検出部33から宛名検索キーワードの出力要求を受ける毎に、使用数の多い(検出確率の高い)苗字から順番に宛名検索キーワード91として出力したり、ユーザが設定した苗字を宛名検索キーワード91として出力したりするなどが可能である。
【0114】
前者の場合は、たとえば図7(A)に示すように、日本での使用数が多く、苗字の検索において検出確率の高い苗字から順番に、「佐藤」、「鈴木」、「高橋」、「田中」などが宛名検索キーワードとして出力される。後者の場合は、たとえば図7(B)に示すように、ユーザが操作部17を通じて設定した「鈴木」という苗字が宛名検索キーワードとして出力される。
【0115】
本例の場合は名簿データ80に「佐藤」という文字が存在していないため、図7(A)に例示した構成では、文字座標検出部33は文字照合部32に対して次の宛名検索キーワードの出力を要求する。文字照合部32は、次の宛名検索キーワード92として「鈴木」を文字座標検出部33に出力する(図6参照)。
【0116】
「鈴木」という文字は本例の名簿データ80に存在しているため(文字63)、文字座標検出部33はその文字(検索指定文字)を検出し、ここで検索を中止する。そして、検出した文字63(「鈴木」)の座標位置と文字サイズを計算する。なお、1文字であるか複数文字であるかに応じた座標位置と文字サイズの計算方法は、敬称の場合と同じである。
【0117】
本例の場合は、座標位置(先頭文字の「鈴」の中心位置)がX:Y=800Line:4300Lineとなり、文字サイズ(「鈴木」の2文字の全体のサイズ)がX:Y=140Line:70Line(8ptからの概略換算値)となる。
【0118】
文字座標検出部33は、更に宛名の貼り付けに必要な情報として文字方向も検出する。なお、1文字であるか複数文字であるかに応じた文字方向の検出方法は、敬称の場合と同じである。本例の「鈴木」のように2文字の並びが左右方向であれば文字方向は横書き(「ヨコ」)として検出される。文字座標検出部33は、検出した文字(文字63)を宛名欄に格納すると共にその文字の座標位置と文字サイズの計算結果、および、文字方向の検出結果を格納した宛名座標テーブル43Aを作成する。
【0119】
図8は、上述した敬称/宛名検索の処理の流れを示すフローチャートであり、図3のステップS103を詳細に示したサブルーチンである。
【0120】
敬称/宛名検索の処理が開始されると、文字照合部32は敬称検索キーワードを文字座標検出部33に出力する(ステップS111)。文字座標検出部33は、指定された敬称検索キーワードに一致(該当)する文字(敬称)をドキュメントデータ70から検索する(ステップS112)。検索指定文字を検出できない場合は(ステップS113;No)、文字照合部32に次の敬称検索キーワードの出力を要求する(ステップS111以降の繰り返し)。
【0121】
検索指定文字を検出できた場合は(ステップS113;Yes)、その文字(敬称)の配置位置などを計算する(ステップS114)。詳細は、上述した座標位置と文字サイズの計算および文字方向の検出である。そして文字座標検出部33は、その結果を敬称座標テーブル42に格納する。
【0122】
続いて、文字照合部32は宛名検索キーワードを文字座標検出部33に出力する(ステップS115)。文字座標検出部33は、指定された宛名検索キーワードに一致(該当)する文字(宛名(苗字))を名簿データ80から検索する(ステップS116)。検索指定文字を検出できない場合は(ステップS117;No)、文字照合部32に次の宛名検索キーワードの出力を要求する(ステップS115以降の繰り返し(図7(A)に例示した構成の場合))。
【0123】
検索指定文字を検出できた場合は(ステップS117;Yes)、その文字(宛名)の配置位置などを計算する(ステップS118)。詳細は、上述した座標位置と文字サイズの計算および文字方向の検出である。そして文字座標検出部33は、その結果を宛名座標テーブル43に格納し、本処理を終了する(Return)。
【0124】
(4)宛名配列位置予測
ここでは、図3のステップS104による、名簿データ80に含まれている宛名(名簿60に記載されている氏名)の配列位置を予測する(配列規則を判定する)方法について説明する。上述した(3−2)で「鈴木」という宛名を1つ検出しており、この検出結果に基づいて「鈴木」以外の宛名がどのように配列されているかを予測する。
【0125】
図9に示すように、一般に名簿に記載されている氏名が横書きの場合は、氏名が上下方向に配列されている可能性が高く、氏名が縦書きの場合は、氏名が左右方向に配列されている可能性が高い。上述した宛名座標テーブル43Aには、検出した宛名の文字方向(横書き/縦書き)が格納されており、この文字方向に基づいて、検出された宛名(本例では「鈴木」)から次の宛名を検索する方向を決定する。
【0126】
図10に示すように、文字座標検出部33からOCR処理済みの名簿データ80と宛名座標テーブル43が宛名配列予測部34に入力される。
【0127】
本例のように検出した宛名(「鈴木」)が横書きの場合は、それ以外の宛名は上下に配列されていると予測できる。宛名配列予測部34は、OCR処理された名簿データ80の中から宛名座標テーブル43Aの座標位置に基づいて1つ目の宛名(「鈴木」の文字63)の位置を把握し、宛名座標テーブル43Aの文字方向が「ヨコ」である場合は、名簿データ80の中から上記宛名(「鈴木」の文字63)の上側に隣接する「斉藤」の文字64と下側に隣接する「田中」の文字65を検出して、文字照合部32に宛名であるか否かの照合を依頼する。
【0128】
また、宛名座標テーブル43Aの文字方向が「タテ」である場合は、名簿データ80の中から上記の1つ目の宛名の左側に隣接する文字と右側に隣接する文字を検出して、文字照合部32に宛名であるか否かの照合を依頼する。
【0129】
なお、上下または左右における片側にしか隣接する文字がない場合には、その1つの文字を検出して、文字照合部32に宛名であるか否かの照合を依頼するようにしてもよい。
【0130】
文字照合部32は、入力された文字64、65をデータベース38の宛名リストと照合し、その結果を適合または不適合で宛名配列予測部34に出力する。本例の場合は、文字64、65について共に適合を出力する。
【0131】
宛名配列予測部34は、この結果を受けて文字64の「斉藤」と文字65の「田中」が宛名(苗字)であると特定(判定)し、文字63の「鈴木」の上下に宛名が配列されていると予測する。続いて宛名配列予測部34は、文字座標検出部33に、文字63(「鈴木」)の上下に隣接する文字64(「斉藤」)と文字65(「田中」)を指定してそれらの配置位置の計算を依頼する。
【0132】
文字座標検出部33は、保持しているOCR処理済みの名簿データ80から指定の文字64(「斉藤」)と文字65(「田中」)を検出し、上述した文字63(「鈴木」)の場合と同様の手順で宛名座標テーブルをそれぞれ作成し、配置位置の計算結果として宛名配列予測部34に出力する。
【0133】
文字64(「斉藤」)については、座標位置(先頭文字の「斉」の中心位置)がX:Y=800Line:4370Lineとなり、文字サイズ(「斉藤」の2文字の全体のサイズ)がX:Y=140Line:70Lineとなり、文字方向が横書きとなる。文字座標検出部33は、文字64の「斉藤」を宛名欄に格納すると共に上記の各情報を格納した宛名座標テーブル43Bを作成し(図12参照)、宛名配列予測部34に出力する。
【0134】
文字65(「田中」)については、座標位置(先頭文字の「田」の中心位置)がX:Y=800Line:4230Lineとなり、文字サイズ(「田中」の2文字の全体のサイズ)がX:Y=140Line:70Lineとなり、文字方向が横書きとなる。文字座標検出部33は、文字65の「田中」を宛名欄に格納すると共に上記の各情報を格納した宛名座標テーブル43Cを作成し(図12参照)、宛名配列予測部34に出力する。
【0135】
これに伴い、原稿情報出力部31は、宛名配列の計算に用いる原稿情報を格納した前述の原稿情報テーブル41を宛名配列予測部34に出力する。
【0136】
宛名配列予測部34は、図12に示すように、保持している宛名座標テーブル43Aと、入力された宛名座標テーブル43B、43Cおよび原稿情報テーブル41とに格納されている情報を使用して、宛名配列を計算する。詳細には、既に宛名であることが判明している文字63(「鈴木」)、文字64(「斉藤」)、文字65(「田中」)の各座標位置を示すXYライン数と名簿データ80のXYライン数に基づいて、宛名の配置位置と最大配置数を計算する。
【0137】
宛名の配置位置については、本例の場合は上記3つの文字のX方向における位置が全て800Lineであることから、個々の宛名は名簿データ80におけるX=800Lineに沿った上下方向に配列されていると判定する。
【0138】
また、上記3つの文字のY方向における位置から宛名の配置間隔を計算する。本例の場合は、「鈴木」とその上側に隣接する「斉藤」とのY方向の距離(間隔)を計算すると、4370Line−4300Line=70Lineとなる。「鈴木」とその下側に隣接する「田中」とのY方向の距離(間隔)を計算すると、4300Line−4230Line=70Lineとなる。このように、隣接する文字同士の間隔が70Lineであることから、宛名の配置間隔は70Lineであると判定する。
【0139】
これらを総合して、宛名の配置位置としては、個々の宛名が名簿データ80におけるX=800Lineに沿った上下方向に70Lineの間隔で配列(配置)されていると判定する。
【0140】
宛名の最大配置数については、「鈴木」、「斉藤」、「田中」のいずれかの文字の位置を基準に計算する。たとえば、「鈴木」を基準とした場合は、その上側に配列されている宛名の配置数と下側に配列されている宛名の配置数とを以下の式で計算する。なお、下記式の除算結果で端数が生じた場合は切り捨てる。
【0141】
・基準文字に対する上側の配置数:A={原稿のYライン数(7015Line)−基準文字のYライン数(4300Line)}÷宛名の配置間隔(70Line)
・基準文字に対する下側の配置数:B=基準文字のYライン数(4300Line)÷宛名の配置間隔(70Line)
【0142】
宛名の最大配置数は、下記式で示すように、上記のAとBと、基準文字分の「1」とを加算した値となる。
【0143】
宛名の最大配置数:Nmax=A+B+1
【0144】
なお、本例では宛名の配置位置と最大配置数の計算を、宛名の配列方向が上下方向の場合で説明しているが、宛名の配列方向が左右方向の場合でも、「X」と「Y」を入れ替え、「上下」を「左右」に置き換えるだけで、計算方法自体は同じである。
【0145】
宛名配列予測部34は、上記の計算を終えると、宛名欄と、座標位置欄(XYライン数)と、文字サイズ欄(XYライン数)とを対応させて宛名数分だけ設けたマトリックス状の宛名配列テーブル44を作成し、宛名毎の座標位置と文字サイズを格納する。また、既に宛名であることが判明している「鈴木」、「斉藤」、「田中」を対応する宛名欄に格納する。
【0146】
図13は、上述した宛名配列位置予測の処理の流れを示すフローチャートであり、図3のステップS104を詳細に示したサブルーチンである。
【0147】
宛名配列位置予測の処理が開始されると、文字座標検出部33はOCR処理済みの名簿データ80と宛名座標テーブル43Aを宛名配列予測部34に出力する。宛名配列予測部34は、宛名座標テーブル43Aに格納されている宛名(「鈴木」)の文字方向に基づいて、その宛名を基点とした名簿データ80における宛名配列方向を予測する(ステップS121)。
【0148】
続いて、上記の宛名(「鈴木」)に対して予測配列方向に配置されている文字(「斉藤」、「田中」)を宛名候補として名簿データ80から検出し(ステップS122)、文字照合部32に宛名であるか否かの照合を依頼する。文字照合部32は、データベース38の宛名リストで照合を行い、その結果を宛名配列予測部34に出力する(ステップS123)。
【0149】
照合されなかった場合は(ステップS124;No)、予測配列方向に配置されている次の文字を宛名候補として検出し、文字照合部32に同様の照合を依頼する(ステップS122以降の繰り返し)。
【0150】
照合された場合は(ステップS124;Yes)、文字座標検出部33は、その文字(宛名)の配置位置などを計算する(ステップS125)。詳細は、座標位置と文字サイズの計算および文字方向の検出である。文字座標検出部33は、その結果を宛名座標テーブル43B、43Cに格納し、宛名座標テーブル43B、43Cを宛名配列予測部34に入力する。また原稿情報出力部31は、原稿情報テーブル41を宛名配列予測部34に入力する。
【0151】
宛名配列予測部34は、宛名座標テーブル43A、43B、43Cに格納されている各宛名のXYライン数と、原稿情報テーブル41に格納されている名簿60のXYライン数に基づいて、文字(宛名)の配列(宛名の配置位置と最大配置数)を計算し、その結果を宛名配列テーブル44として作成し(ステップS126)、本処理を終了する(Return)。
【0152】
(5)宛名読み出し
図3のステップS105では、上述した宛名の配列予測(計算結果)に基づいて名簿データ80から宛名を読み出す。図14に示すように、宛名配列予測部34からOCR処理済みの名簿データ80と宛名配列テーブル44が宛名読出部35に入力される。宛名読出部35は、既に宛名であることが判明している「鈴木」、「斉藤」、「田中」を除いて、名簿データ80から宛名配列テーブル44の各座標位置(XYライン数)に配置されている文字を検出し、対応する宛名欄に格納する。検出および格納した結果は図示の通りとなる。なお、「空欄」は空白で文字が無いことを示す。
【0153】
(6)宛名判定
名簿60には宛名以外にも様々な文字が記載されているため、名簿データ80から読み出した文字が宛名であるか否か判定する必要がある。図3のステップS106ではその判定を行う。図15に示すように、宛名読出部35から宛名配列テーブル44が宛名判定部36に入力される。宛名判定部36は、宛名配列テーブル44の宛名欄に格納されている文字を順番に文字照合部32に入力して宛名であるか否かの照合を依頼する。
【0154】
文字照合部32は、入力された文字をデータベース38の宛名リストと照合し、その結果を適合(○)または不適合(×)で宛名判定部36に出力する。
【0155】
たとえば、文字の無い「(空欄)」部分は宛名リストに登録されていないため、不適合となる。「年○組」や「氏名」などの文字も宛名リストに登録されていないため、不適合となる。これに対し、「安藤」、「斉藤」、「鈴木」、「田中」、「渡辺」などは宛名リストに登録されており、適合となる。
【0156】
宛名判定部36は、宛名配列テーブル44に宛名判定欄を追加した宛名判定テーブル45を作成し、文字照合部32からの適合(○)または不適合(×)を、対応する文字の宛名判定欄に格納して宛名判定テーブル45を完成させる。この宛名判定欄に格納された情報は、「○」が宛名であることを示し(宛名適合)、「×」が宛名ではないことを示す(宛名不適合)。
【0157】
なお、宛名であることが既に判明している「鈴木」、「斉藤」、「田中」については、宛名配列テーブル44の作成時に予め宛名判定欄を設けて適合(○)を格納しておくことにより、文字照合部32への照合依頼を省略するようにしてもよい。
【0158】
また、日本で使用されている苗字は数万種以上あると推定され、一般的なものでも数千種以上あるとされており、宛名(苗字)の判定精度を高めるためにデータベースの登録数を多くすると、照合に時間を要することが懸念される。また、宛名として取引先の社名を登録し照合するような場合も、登録数が数百社などと多くなる場合は同様の懸念がある。いずれにしても、名簿における宛名の記載数が多くて照合する文字の数(宛名の判定数)が多くなる場合は、全ての文字の照合に要する時間が長くなることが懸念される。
【0159】
そこで、宛名でないことは明確であるが名簿などで多用される文字、たとえば、名簿の名称や記載内容(情報)の種類を示す単語などを、非宛名リストとしてデータベース38に登録し、対象の文字をその非宛名リストで先に検索するようにしてもよい。
【0160】
非宛名リストに登録する文字は、一例として、上記の「年○組」や「氏名」の他に、「名簿」、「名前」、「男性」、「女性」、「学校」(小学校/中学校/専門学校)、「高校」、「大学」、「クラス」(クラス名簿)、「連絡網」(緊急連絡網)、「会社」、「役員」(役員名簿)、「社員」(社員名簿)、「団体」(団体名簿)、「サークル」(サークル名簿)、「自治会」(自治会名簿)などが挙げられる。さらに、「住所」、「郵便番号」、「電話番号」、「生年月日」、「備考」などを加えるようにしてもよい。
【0161】
このような非宛名リストで対象の文字を先に検索し、該当する場合は不適合(×)とすることで、宛名判定の効率や精度を向上することができる。さらに、この非宛名リストを上述した宛名配列を予測するときの文字(本例では「斉藤」と「田中」)の照合に利用するようにしてもよい。
【0162】
また、宛名判定の結果を表示部18に表示して誤りが無いかをユーザが確認できるようにしたり、操作部17を通して確定や訂正できるようにしたりしてもよい。たとえば、宛名候補として検出した文字とその宛名判定結果(「○」/「×」)を表示する。誤りが無ければ確定し、宛名である文字に誤判定で付けられた「×」は「○」に、宛名でない文字に誤判定で付けられた「○」は「×」に訂正できるように構成するなどしてもよい。
【0163】
また、ドキュメントの内容などによっては、名簿に記載されている全ての宛名が差し出しの対象ではなく、特定の宛名のみが対象になるようなこともある。このような場合に、ユーザは宛名であるが出力する必要のない文字に対し、意図的に「○」から「×」に変更するようなことも可能になる。
【0164】
(7)宛名貼り付け
図3のステップS107では、図16に示すように、文字座標検出部33は敬称座標テーブル42を宛名貼付部37に出力し、宛名判定部36は宛名判定テーブル45を宛名貼付部37に出力する。
【0165】
宛名貼付部37は、入力された各テーブルの情報に基づいて宛名の貼り付け位置を計算する。また、貼り付け位置の条件として、本例では以下の3つの条件が予め設定されている。
【0166】
・条件A:宛名と敬称の並びを揃える。
⇒文字方向が横書きの場合はY方向の位置を合わせる。
文字方向が縦書きの場合はX方向の位置を合わせる。
・条件B:宛名と敬称の文字の大きさ(フォントサイズ)を揃える。
・条件C:宛名と敬称の間に1文字分の空白を設ける。
【0167】
敬称座標テーブル42より、敬称51(「様」)の座標位置はX:Y=4600Line:6800Line、文字サイズはX:Y=105Line×105Line、文字方向は横書きとなっている。
【0168】
たとえば、「鈴木」という宛名52を貼り付ける場合は、条件AよりY方向の位置が6800Lineとなる。条件Bより、文字の大きさは1文字当たり8pt(70Line×70Line)から12pt(105Line×105Line)へ1.5倍拡大することになり、「鈴木」の2文字全体の文字サイズがX:Y=140Line×70LineからX:Y=210Line×105Lineに変更される。条件Cより、「鈴木」と「様」の間に1文字分に相当するX:Y=105×105Line分の空白が設けられることになる。
【0169】
その結果、「鈴木」の貼り付け位置(先頭文字の「鈴」の中心位置)はX:Y=4285Line:6800Lineとなる。なお、「木」の貼り付け位置(中心位置)はX:Y=4390Line:6800Lineとなる。
【0170】
また宛名貼付部37は、宛名判定テーブル45における宛名判定の「○」の数をカウントして、最終的に確定された宛名の数を求め、その宛名数分のドキュメントデータ70の出力を要求する。これにより、データ保存部14に保存されているドキュメントデータ70が宛名貼付部37に順次入力される。
【0171】
宛名貼付部37は、宛名判定テーブル45の宛名欄から宛名判定が「○」となっている宛名を順番に読み出し、文字サイズを変更してドキュメントデータ70における上記の位置に貼り付ける。この宛名を貼り付けたドキュメントデータ75をプリンタ部24に出力することを、最後の宛名に対して終えるまで繰り返す。
【0172】
(8)宛名入りドキュメント出力
図3のステップS108では、図16に示すように、プリンタ部24は宛名貼付部37から入力されたドキュメントデータ75に対応する画像を用紙に形成し、宛名入りのドキュメント55として出力する。
【0173】
このように、本実施の形態に係る複合機10では、入力された名簿データ80に含まれている複数の文字情報の中から、配列規則を判定しようとする宛名に属する文字情報(宛名検索キーワード)を使用して、その文字情報に該当する第1の文字情報(本例では「鈴木」)を検索する。この第1の文字情報から所定方向(上下左右方向)に検索して宛名に属する第2の文字情報(本例では「斉藤」、「田中」)を特定し、第1の文字情報と第2の文字情報との位置関係に基づいて、宛名の配列規則を判定する。たとえば上述したように、宛名は第1の文字情報と第2の文字情報とを含む列方向に第1の文字情報と第2の文字情報の間隔で配列されているなどと判定する。これにより、名簿データ80に含まれている宛名の配列規則を判定することができる。
【0174】
また、名簿データ80から第1の文字情報を検索する場合に、宛名(苗字)の検索における検出確率の高い宛名検索キーワードから順番に使用して(本例では「佐藤」→「鈴木」→「高橋」→「田中」→・・・など)、該当する文字情報を検索し、宛名検索キーワードに該当する文字情報が検出された場合にその文字情報を第1の文字情報に決定する。このように、検出確率の高い宛名検索キーワードから順番に使用して検索を行うことで、第1の文字情報の検索効率を向上することができる。
【0175】
また、第1の文字情報から第2の文字情報を検索する際に、第1の文字情報が横書きの場合には宛名が上下方向に配列されていると予測して上下方向に検索し、縦書きの場合には宛名が左右方向に配列されていると予測して左右方向に検索する。このように、第1の文字情報の文字方向(横書き/縦書き)に基づいて第2の文字情報の検索方向を決定することにより、第2の文字情報を効率よく検索して特定することができる。
【0176】
また、名簿データ80(名簿60)から抽出した宛名をドキュメントデータ70(ドキュメント50)に合成する際には、ドキュメントデータ70から検索した敬称(指定の文字情報)に対して、第1の原稿データから抽出した文字情報を合成する場合に、合成する宛名の位置と書式(文字の大きさ、文字方向など)を、上記敬称の位置と書式に基づいて決定する。これにより、敬称に対して合成する宛名を見栄え良く配置したり、見栄えの良くなる書式にしたりすることができる。
【0177】
また、名簿データ80から抽出した文字に対する宛名判定の結果を表示部18に表示してユーザが確認し、操作部17を通して確定や訂正できるように構成した場合は、自動判定で誤って判定された宛名や出力する必要のない宛名などがドキュメントに合成されて出力されるような無駄を抑制することができる。
【0178】
[第2の実施の形態]
第1の実施の形態では名簿に宛名が1列で記載されている場合を説明したが、第2の実施の形態では複数列で記載されている場合について説明する。
【0179】
名簿には、宛名(氏名)が複数列で記載されているものがある。その場合は、図17に示すように、宛名が横書きであるか縦書きであるかにかかわらず、最初に検出した宛名(たとえば「鈴木」)の上下左右に他の宛名が配置されている可能性が高い。
【0180】
このような名簿の例としては、図18に示すように、氏名を男女別に記載する場合などが挙げられる。この名簿200を例に、宛名が複数列で配列(2次元配列)されているときの配列規則の判定方法を説明する。
【0181】
まず、第1の実施の形態で説明した(1)原稿データ入力により、データ入力部22からドキュメント50の画像データ(ドキュメントデータ70)と名簿200の画像データ(名簿データ210)が入力され、データ保存部14に保存される。続いて、(2)原稿情報作成、および、(3−1)ドキュメントデータからの指定敬称検索方法を同様に行う。
【0182】
続いて、文字座標検出部33は名簿データ210をOCR処理し、第1の実施の形態で説明した(3−2)名簿データからの指定宛名検索方法により(図6参照)、宛名検索キーワードに該当する文字を検索する。
【0183】
本例の名簿データ210にも1番目の宛名検索キーワードである「佐藤」が存在していないことにより、2番目の宛名検索キーワードである「鈴木」を検索する。「鈴木」は、男性側の列(1列目)に配置されている文字201と、女性側の列(2列目)に配置されている文字202とで2つ存在している。文字座標検出部33は、これらのいずれか1つを検出した時点で検索を中止する。ここでは、1列目の文字201を検出した場合で説明する。
【0184】
次に、第1の実施の形態で説明した(4)宛名配列位置予測により(図10〜図13参照)、文字座標検出部33からOCR処理済みの名簿データ210が宛名配列予測部34に入力され、宛名配列予測部34は文字201の上下に配列されている各文字を検出し、図19に示すような宛名配列テーブル220を作成する。この宛名配列テーブル220の宛名欄には、第1の実施の形態で説明した(5)宛名読み出しにより(図14参照)、名簿データ210の1列目に配列されている各文字が格納される。
【0185】
続いて、文字座標検出部33は左右方向(2列目以降)の宛名検索を行う。左右方向の宛名検索は、たとえば、名簿データ210のXY座標における原点位置(左下角部)の直近に配置されている宛名候補の文字(空欄を含む)を基準に開始する。本例の場合は、図19に示すように、「(空欄)」⇒「渡辺」・・・⇒「年○組」⇒「(空欄)」の順番に左右方向の宛名検索を順次行う。
【0186】
図20に示すように、最初に空欄203の左右方向に配置されている文字を検出する。本例の場合、空欄203の左右には文字が存在していないため検出できないことになる。このような場合は、次の文字(「渡辺」)に移行する。
【0187】
2番目の「渡辺」の文字204の左右方向に配置されている文字の検出では、本例の場合は、右側に配置されている「渡辺」の文字205を検出する。宛名配列予測部34は、文字照合部32にこの文字が宛名であるか否かの照合を依頼する。
【0188】
本例における文字205の「渡辺」は宛名(苗字)であると特定(判定)され、宛名配列予測部34は文字205の上側に宛名が配列されていると予測する。続いて、文字205の上側に隣接する文字を検出し、文字照合部32に宛名であるか否かの照合を依頼する。この文字が宛名であると特定された場合には、宛名配列予測部34は文字座標検出部33に、文字205(「渡辺」)とその上側に位置する文字を指定してそれらの配置位置の計算を依頼する。
【0189】
文字座標検出部33は、指定された文字に対する配置位置の計算結果を宛名座標テーブルとして宛名配列予測部34に出力する。宛名配列予測部34は、この宛名座標テーブルに基づいて、第1列目と同様の手順で第2列目に対する宛名の配置位置と最大配置数を計算する。続いて、第1列目の宛名配列テーブル220に、第2列目の宛名欄と、座標位置欄(XYライン数)と、文字サイズ欄(XYライン数)とを追加した宛名配列テーブルを作成し(図12参照)、宛名読出部35に出力する((4)宛名配列位置予測を参照)。
【0190】
宛名読出部35は、名簿データ210から上記の宛名配列テーブルにおける第2列目の各座標位置に配置されている文字を検出し、対応する宛名欄に格納する。これにより、図21に示すような宛名配列テーブル221が作成される((5)宛名読み出しを参照)。
【0191】
以降は、第1の実施の形態で説明した宛名配列テーブル44を上記の宛名配列テーブル221に置き換えた内容で、(6)宛名判定〜(8)宛名入りドキュメント出力を行う。これにより、名簿200に2列で記載されている個々の宛名が記入された宛名数分のドキュメントが複合機10から印刷出力される。
【0192】
このように、本実施の形態では宛名が複数列で記載されている名簿に対して、宛名の配列規則を判定できるようになる。また、ここでは名簿200(名簿データ210)における1列目の文字201を検出した場合で説明したが、2列目の文字202を検出した場合でも、上述した手順で同様に複数列の配列規則を判定することができる。
【0193】
[第3の実施の形態]
第1および第2の実施の形態では名簿が1ページの場合(宛名が1ページに記載されている場合)を説明したが、第3の実施の形態では名簿が複数ページの場合(宛名が複数ページに記載されている場合)について説明する。
【0194】
名簿には、宛名(氏名)が複数ページに亘って記載されているものがある。このような名簿の例としては、図22に示すように、氏名を男女別に異なるページに記載する場合などが挙げられる。この名簿300を例に、宛名が複数ページに記載されているときの配列規則の判定方法を説明する。
【0195】
本例の名簿300は計2ページとされており、1ページ目301に男性の氏名が記載され、2ページ目302に女性の氏名が記載されている。
【0196】
まず、第1の実施の形態で説明した(1)原稿データ入力により、データ入力部22からドキュメント50の画像データ(ドキュメントデータ70)と、名簿300における1ページ目301の画像データ(名簿1ページ目データ311)および2ページ目302の画像データ(名簿2ページ目データ312)とが入力され、データ保存部14に保存される。
【0197】
複合機10は、このデータ入力において名簿のページ数を取得する。ページ数の取得は、たとえば、ユーザが操作部17を通して名簿のページ数を入力したり、前述したような読み取る原稿の種類を指定できる構成にて、名簿を指定した読み取りにてページ数をカウントしたりするなどにより行うことができる。
【0198】
続く(2)原稿情報作成では、原稿情報出力部31は、第1の実施の形態で説明した原稿情報テーブル41に追加して、名簿データとして名簿のページ数(本例では2ページ)を格納した原稿情報テーブル320を作成する。
【0199】
(3)敬称/宛名検索における(3−2)名簿データからの指定宛名検索方法、および、(4)宛名配列位置予測では、原稿情報テーブル320の名簿データに格納されているページ数より、名簿300のページ数を把握し、上記の(3−2)および(4)を名簿1ページ目データ311と名簿2ページ目データ312に対して順番に行う。そして、宛名配列予測部34は、宛名配列位置予測の結果として図23に示すような宛名配列テーブル330を作成する。
【0200】
本例の宛名配列テーブル330では、座標位置(XYライン数)の格納欄内に宛名数分のページ欄(「page」)が追加して設けられており、宛名を読み出す名簿のページ数がページ欄に格納されている。
【0201】
(5)宛名読み出しでは、宛名読出部35が宛名配列テーブル330を使用して名簿1ページ目データ311と名簿2ページ目データ312から宛名を読み出す。図22に示した2ページの名簿300から宛名を読み出した結果が図23となる。
【0202】
以降は、第1の実施の形態で説明した宛名配列テーブル44を上記の宛名配列テーブル330に置き換えた内容で、(6)宛名判定〜(8)宛名入りドキュメント出力を行う。これにより、2ページの名簿300に記載されている個々の宛名が記入された宛名数分のドキュメントが複合機10から印刷出力される。
【0203】
このように、本実施の形態では、宛名が複数ページに亘って記載されている名簿に対して、ページ毎に宛名の配列規則を判定できるようになる。
【0204】
以上、本発明の実施の形態を図面によって説明してきたが、具体的な構成は実施の形態に示したものに限られるものではなく、本発明の要旨を逸脱しない範囲における変更や追加があっても本発明に含まれる。
【0205】
たとえば、上述の実施の形態では、配列規則を判定する文字情報群の種類として、名簿に記載されている宛名(氏名)を例に説明したが、対象となる文字情報群の種類はこれに限らない。個人名(氏名)以外の宛名や、宛先などとしてもよい。
【0206】
前者の例としては、社名、店名、機関名、団体名、法人名などの各種の集団名などが挙げられる。後者の例としては、住所、郵便番号、電話番号、電子メールアドレスなどが挙げられる。
【0207】
また、名簿から宛名と宛先を抽出してドキュメントに合成するなどのように、第1の原稿データに含まれている複数種類の文字情報群の配列規則を判定すると共に、それらを抽出し組み合わせて第2の原稿データに合成して出力するようにしてもよい。
【0208】
第2の原稿データは、実施の形態で説明したようなドキュメントデータに限らない。たとえば、特定の書式の名簿に記載されている文字情報を抽出して他の書式の名簿に合成するようなことも可能であり、その場合は、第1の原稿データとしての名簿データとは異なる名簿データが第2の原稿データとなる。
【0209】
具体的には、複数種類の文字情報(たとえば、氏名、住所、郵便番号、電話番号など)が記載されている名簿から所定種類の文字情報のみ(たとえば、氏名と電話番号のみなど)を抽出して他の名簿に転記するような編集や、縦書きの名簿から横書きの名簿に作り替えるような書式変更(フォーマット変更)などが挙げられる。
【0210】
(4)宛名配列位置予測では、最初に検出した宛名の文字方向に基づいて次の宛名の検索方向を決定するようにしているが、決定した方向に検索して2つ目以降の宛名を特定できなかった場合には、その方向とは異なる方向に検索して同宛名を特定するようにしてもよい。たとえば、最初に検出した宛名の文字方向が横書きであり、その宛名から先ず上下方向に検索して2つ目以降の宛名を特定できなかった場合には、次は左右方向に検索して同宛名を特定するなどである。
【0211】
また、上記の文字方向以外の条件に基づいて2つ目以降の宛名の検索方向を決定するようにしてもよい。
【0212】
具体的には、ユーザが指定した検索方向に決定したり、最初に検出した宛名と周囲(上下左右)に隣接配置されている文字の書式を比較し、その比較結果に基づいて検索方向を決定したりするなどが可能である。後者の場合の書式には、文字の大きさや書体などを用いることができる。
【0213】
たとえば、書式の異なる文字が配置されている方向に宛名が配列されている可能性は低いと予測できるため、その方向は検索方向から除外して、残りの方向を検索方向に決定するなどが可能である。また、このような文字の書式による条件と、上記の文字方向による条件とから総合的に判断して2つ目以降の宛名の検索方向を決定するようにしてもよい。
【0214】
(7)宛名貼り付けにて説明した貼り付け位置の条件は、上述した3つの条件に限らない。この貼り付け位置の条件は、原稿の書式などに応じた様々な条件を設定することができる。また、管理者やユーザなどが条件の設定や変更を行えるように構成してもよい。
【0215】
第2の実施の形態で説明した複数列に対する配列規則の判定では、1列目の宛名配列予測後に行う2列目以降の宛名の検索(左右方向の宛名検索)を、原稿の原点位置の直近に配置されている宛名から順番に行うようにしているが、順番はこれに限らない。
【0216】
また、宛名の配列規則を列毎に行うようにしているが、たとえば、最初の列で判定した配列規則を他の列に適用するようにしてもよい。この場合は、配列規則の判定処理を軽減することができる。
【0217】
また、3列以上でも配列規則の判定が可能である。その場合は、たとえば、1列目の宛名と2列目の宛名の位置関係(間隔)に基づいて、列に沿った方向(実施の形態における上下方向)とは異なる方向(実施の形態における左右方向)の配列規則を判定するようにしてもよい。
【0218】
第3の実施の形態で説明した複数ページに対する配列規則の判定では、ページ毎に配列規則を判定するようにしているが、特定のページで判定した配列規則を他のページに適用するようにしてもよい。この場合の特定のページは、1ページ目に限らない。たとえば、最初の検索キーワードに該当する文字情報を含んだページが特定のページとなる。
【0219】
また、文字情報の提示や照合に用いるデータベース38を複合機10の内部に設ける構成としているが、このようなデータベースを外部に設けて複合機10がアクセスするような構成としてもよい。
【0220】
複合機10に対するデータ入力は、実施の形態で説明した原稿の読み取りによる入力に限らない。たとえば、ネットワークで接続されたクライアント端末などからの印刷データの入力や、USB(Universal Serial Bus)メモリなどの外部接続が可能な情報記憶装置からのファイルデータの入力などとしてもよい。
【0221】
複合機10からのデータ出力は、実施の形態で説明した印刷による出力に限らない。たとえば、ネットワークで接続されたクライアント端末やサーバなどの外部装置へのデータ転送による出力や、上記のUSBメモリなどへのファイルデータの出力などとしてもよい。
【0222】
また、複合機10におけるプリンタ部24は、レーザ光に代えてLED(Light Emitting Diode)で感光体ドラムを走査露光するLEDプリンタなどの他の方式のプリンタとしてもよい。
【0223】
また本発明は、実施の形態で説明した複合機に限らず、複写機やプリンタ機などの他の画像処理装置にも適用可能である。
【図面の簡単な説明】
【0224】
【図1】本発明の第1の実施の形態に係る画像処理装置としての複合機の概略構成を示すブロック図である。
【図2】本発明の第1の実施の形態に係る複合機の自動合成モードにおけるCPUの機能ブロック構成を示す機能ブロック図である。
【図3】本発明の第1の実施の形態に係る複合機による自動合成モードの処理を示す流れ図である。
【図4】図3における原稿データ入力から原稿情報作成までを説明する説明図である。
【図5】図3における敬称/宛名検索の指定敬称検索方法を説明する説明図である。
【図6】図3における敬称/宛名検索の指定宛名検索方法を説明する説明図である。
【図7】図6の指定宛名検索における宛名検索キーワードを出力する構成を説明する説明図である。
【図8】図3における敬称/宛名検索の処理(サブルーチン)を示す流れ図である。
【図9】宛名の文字方向と宛名の検索方向の関係を説明する説明図である。
【図10】図3における宛名配列位置予測(宛名照合)を説明する説明図である。
【図11】図3における宛名配列位置予測(宛名配置位置計算)を説明する説明図である。
【図12】図3における宛名配列位置予測で宛名座標テーブルおよび原稿情報テーブルから作成される宛名配列テーブルを説明する説明図である。
【図13】図3における宛名配列位置予測の処理(サブルーチン)を示す流れ図である。
【図14】図3における宛名読み出しを説明する説明図である。
【図15】図3における宛名判定を説明する説明図である。
【図16】図3における宛名貼り付けから宛名入りドキュメント出力までを説明する説明図である。
【図17】本発明の第2の実施の形態に係る複数列の宛名に対する配列規則の判定において、横書き/縦書きの宛名が複数列で配列されている例を説明する説明図である。
【図18】本発明の第2の実施の形態に係る宛名が複数列に記載された名簿を示す図である。
【図19】図18の名簿における1列目の宛名が格納された宛名配列テーブルを示す図である。
【図20】図18の名簿における2列目の宛名検索と宛名配列位置予測を説明する説明図である。
【図21】宛名が複数列に記載された名簿に対して作成される宛名配列テーブルの一例を示すと共に、図18の名簿における1列目と2列目の宛名が格納された状態を示す図である。
【図22】本発明の第3の実施の形態に係る宛名が複数ページに記載された名簿と、その名簿データの入力によって作成された原稿情報テーブルを示す図である。
【図23】宛名が複数ページに記載された名簿に対して作成される宛名配列テーブルの一例を示すと共に、図22の名簿における1ページ目と2ページ目に記載された宛名が格納された状態を示す図である。
【符号の説明】
【0225】
10…複合機(MFP)
11…CPU
12…バス
13…ROM
14…RAM/データ保存部
15…不揮発メモリ
16…ハードディスク装置
17…操作部
18…表示部
19…ファクシミリ通信部
20…ネットワーク通信部
21…原稿送り装置制御部
22…スキャナ部/データ入力部
23…画像処理部
24…プリンタ部/データ出力部
31…原稿情報出力部
32…文字照合部
33…文字座標検出部
34…宛名配列予測部
35…宛名読出部
36…宛名判定部
37…宛名貼付部
38…データベース
41…原稿情報テーブル
42…敬称座標テーブル
43…宛名座標テーブル
43A、43B、43C…宛名座標テーブル
44…宛名配列テーブル
45…宛名判定テーブル
50…ドキュメント
55…ドキュメント
51…敬称
52…宛名
60…名簿
61…氏名
62…住所
63、64、65…文字
70…ドキュメントデータ
75…ドキュメントデータ
80…名簿データ
90…敬称検索キーワード
91、92…宛名検索キーワード
200…名簿
201、202…文字
203…空欄
204、205…文字
210…名簿データ
220、221…宛名配列テーブル
300…名簿
301…1ページ目
302…2ページ目
311…名簿1ページ目データ
312…名簿2ページ目データ
320…原稿情報テーブル
330…宛名配列テーブル

【特許請求の範囲】
【請求項1】
原稿データが入力される入力部と、
前記入力部から入力された第1の原稿データに含まれている複数の文字情報の中から内容が同じ種類である文字情報群の配列規則を判定する場合に、前記種類に属する文字情報を使用してその文字情報に該当する第1の文字情報を検索し、その第1の文字情報から所定方向に検索して前記種類に属する第2の文字情報を特定し、前記第1の文字情報と前記第2の文字情報との位置関係に基づいて前記配列規則を判定する制御部と、
を備える
ことを特徴とする画像処理装置。
【請求項2】
前記制御部は、前記第1の文字情報の検索では、その検索における検出確率の高い文字情報から順番に使用して前記第1の原稿データに含まれている複数の文字情報の中から検出された文字情報を前記第1の文字情報に決定する
ことを特徴とする請求項1に記載の画像処理装置。
【請求項3】
前記制御部は、前記第1の文字情報と前記第2の文字情報とを含む第1の列に配列された第3の文字情報から、前記第1の列方向とは異なる方向に検索して前記種類に属する第4の文字情報を特定できた場合は、その第4の文字情報の位置も加味して前記配列規則を判定する
ことを特徴とする請求項1または2に記載の画像処理装置。
【請求項4】
前記制御部は、前記第4の文字情報から前記第1の列に沿った方向に検索して前記種類に属する第5の文字情報を特定し、前記第4の文字情報と前記第5の文字情報との位置関係に基づいてその第4の文字情報と第5の文字情報とを含む第2の列に対する前記配列規則を判定する
ことを特徴とする請求項3に記載の画像処理装置。
【請求項5】
前記制御部は、前記第1の列に沿った前記第4の文字情報を含む第2の列に対して前記第1の文字情報と前記第2の文字情報との位置関係に基づいて判定した前記配列規則を適用することでその第2の列に対する前記配列規則を判定する
ことを特徴とする請求項3に記載の画像処理装置。
【請求項6】
前記制御部は、前記第3の文字情報と前記第4の文字情報との位置関係に基づいて前記第1の列方向とは異なる方向の前記配列規則を判定する
ことを特徴とする請求項3に記載の画像処理装置。
【請求項7】
前記制御部は、前記第1の原稿データが複数ページのデータである場合は、前記配列規則の判定をページ毎に行う
ことを特徴とする請求項1乃至6のいずれか1つに記載の画像処理装置。
【請求項8】
前記制御部は、前記第1の文字情報の文字方向に基づいて前記所定方向を決定する
ことを特徴とする請求項1乃至7のいずれか1つに記載の画像処理装置。
【請求項9】
前記制御部は、前記第1の文字情報の書式と前記第1の文字情報に隣接する文字情報の書式とを比較し、前記第1の文字情報に対して書式の異なる文字情報が配置されている方向は前記第2の文字情報を検索する方向から除外する
ことを特徴とする請求項1乃至8のいずれか1つに記載の画像処理装置。
【請求項10】
前記制御部は、前記第1の原稿データに含まれている複数の文字情報の中から前記配列規則に則って前記種類に属する個々の文字情報を抽出し、その文字情報を前記入力部から入力された第2の原稿データに合成して出力する
ことを特徴とする請求項1乃至9のいずれか1つに記載の画像処理装置。
【請求項11】
前記制御部は、指定された文字情報を使用して前記第2の原稿データからその文字情報に該当する第6の文字情報を検索し、その第6の文字情報の位置と書式とに基づいて前記第2の原稿データに合成する文字情報の位置と書式とを決定する
ことを特徴とする請求項10に記載の画像処理装置。
【請求項12】
前記制御部は、前記種類に属する文字情報が登録されたデータベースを参照して前記特定を行う
ことを特徴とする請求項1乃至11のいずれか1つに記載の画像処理装置。
【請求項13】
前記制御部は、前記配列規則に則って前記抽出した文字情報に対し、前記種類に属する文字情報が登録されたデータベースを参照して前記種類に属するか否かを判定する
ことを特徴とする請求項1乃至11のいずれか1つに記載の画像処理装置。
【請求項14】
前記制御部は、前記種類に属するか否かの判定では、前記種類に属さないことを示す条件が登録されたデータベースも参照し、前記条件に該当する文字情報は前記種類に属さないと判定する
ことを特徴とする請求項13に記載の画像処理装置。
【請求項15】
表示部と、操作部とを備え、
前記制御部は、前記判定の結果を前記表示部に表示し、その判定の結果に対する確定または訂正の操作を前記操作部により受け付ける
ことを特徴とする請求項13または14に記載の画像処理装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22】
image rotate

【図23】
image rotate


【公開番号】特開2010−72850(P2010−72850A)
【公開日】平成22年4月2日(2010.4.2)
【国際特許分類】
【出願番号】特願2008−238354(P2008−238354)
【出願日】平成20年9月17日(2008.9.17)
【出願人】(303000372)コニカミノルタビジネステクノロジーズ株式会社 (12,802)
【Fターム(参考)】