説明

文字認識装置

【課題】 1枚の名刺に複数の所属が記載されている場合に、名刺に記載されている文字を部分的に認識できなかったとしても、各所属と各所属に付随する情報との不整合が生じることを防止することが可能な文字認識装置を提供する。
【解決手段】 文字認識装置3は、名刺を読取り画像データを生成する読取部13と、生成された画像データから文字を認識し、文字コード及び、該文字コードの名刺上の位置情報を生成する文字コード生成部30と、生成された位置情報に基づいて、所属(拠点)を示す文字コードと、所属に付随する電話番号等の情報を示す文字コードとの相対的な位置関係を判定し、当該判定の結果に基づいて、所属毎に、所属を示す文字コードと、該所属に付随する情報を示す文字コードとをまとめてグループ化するグループ化部31とを備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、文字認識装置に関し、特に、名刺を読取って文字を認識する文字認識装置に関する。
【背景技術】
【0002】
従来から、紙面などに記載されている文字を認識して文字コードを出力する文字認識装置が様々な用途に使用されている。例えば、名刺に記載されている氏名、会社名、住所、電話番号等を文字認識し、その認識結果を例えばアドレス帳のデータ等として利用することができるように出力する文字認識装置も知られている。ここで、特許文献1には、1枚の名刺から認識された文字情報(文字コード)の中に、例えば、本社と営業所といった複数の所属先の住所及び住所に付随する電話番号などが存在する場合には、複数の住所・電話番号などを、住所単位で分割し、複数組の名刺データとして電子手帳に出力する名刺読取り装置(文字認識装置)が開示されている。
【0003】
特許文献1に開示されている名刺読取り装置では、住所データが複数ある場合は、氏名を転送データ一時記憶部に一時的に記憶させ、この記憶させた氏名と、住所及び住所に対応した電話番号とを組合せて出力データとしている。ここで、電話番号より住所データが先に文字認識部から返ってきた場合は、住所に続く電話番号が住所に対応する電話番号として設定される。逆に電話番号が住所データより先に文字認識部から返ってきた場合は、この電話番号が住所に対応する電話番号として設定される。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特許第2851469号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
上述したように、特許文献1に開示されている名刺読取り装置では、文字認識部から返ってくる順序に従って住所と該住所に付随する電話番号等の情報とが対応付けられている。そのため、例えば、名刺に記載されている文字を部分的に認識することができなかった場合に、所属先の住所と、該住所に付随する情報との不整合が生じるおそれがある。
【0006】
本発明は、上記問題点を解消する為になされたものであり、1枚の名刺に複数の所属が記載されている場合に、名刺に記載されている文字を部分的に認識できなかったとしても、各所属と各所属に付随する情報との不整合が生じることを防止することが可能な文字認識装置を提供することを目的とする。
【課題を解決するための手段】
【0007】
本発明に係る文字認識装置は、名刺を読取り画像データを生成する読取手段と、読取手段により生成された画像データから文字を認識し、文字コード、及び該文字コードの名刺上の位置情報を生成する生成手段と、生成手段により生成された位置情報に基づいて、所属を示す文字コードと、所属に付随する情報を示す文字コードとの相対的な位置関係を判定し、当該判定の結果に基づいて、所属毎に、所属を示す文字コードと、該所属に付随する情報を示す文字コードとをまとめてグループ化するグループ化手段とを備えることを特徴とする。
【0008】
本発明に係る文字認識装置によれば、所属を示す文字コードの名刺上の記載位置と、所属に付随する情報を示す文字コードの記載位置との相対的な関係が判定され、その判定結果に基づいて、所属を示す文字コードとその所属に付随する情報を示す文字コードとが所属毎にまとめられてグループ化される。よって、1枚の名刺に複数の所属が記載されている場合に、名刺に記載されている文字を部分的に認識できなかったとしても、各所属と各所属に付随する情報との不整合が生じることを防止することが可能となる。
【0009】
ここで、上記所属を示す文字コードは、所属先の拠点又は所属先の住所であることが好ましい。このようにすれば、所属先の拠点又は所属先の住所毎に、拠点(例えば、本社、支社、営業所など)又は住所と、拠点又は住所に付随する情報(例えば、電話番号、FAX番号など)とをグループ化することができる。
【0010】
本発明に係る文字認識装置は、所属先の拠点を表す単語が登録されている辞書データを記憶する記憶手段を備え、グループ化手段が、辞書データを用いて、文字コードの中から所属先の拠点を示す文字コードを抽出することが好ましい。このようにすれば、名刺から認識された文字コードの中から所属先を示す文字コードを的確に抽出することができる。
【0011】
本発明に係る文字認識装置は、グループ化手段によりグループ化が行われる際に、文字コードに対して、属性項目毎にタグ情報を付加する付加手段を備えることが好ましい。このようにすれば、付加されたタグ情報によって、文字コードの属性項目を認識することができるため、名刺データを容易に利用することが可能となる。
【0012】
本発明に係る文字認識装置は、グループ化手段により1以上のグループにグループ化された文字コードを、名刺毎に、住所録データベースに登録する登録手段をさらに備えることが好ましい。この場合、1以上のグループにグループ化された文字コードが名刺毎に登録されるため、複数の所属が記載された名刺であっても、名刺毎に住所録データベースに登録して、管理・利用することが可能となる。
【0013】
本発明に係る文字認識装置では、グループ化手段が、横書きの名刺の場合には上下の位置関係、縦書きの名刺の場合には左右の位置関係に基づいて、所属を示す文字コードと、該所属に付随する情報を示す文字コードとをまとめてグループ化することが好ましい。このようにすれば、横書きの名刺であっても縦書きの名刺であっても、所属と所属に付随する情報との位置関係に基づいて、複数の所属と、各所属に付随する情報との対応関係を適切に判別してグループ化することが可能となる。なお、複数の所属が存在する場合に、グループ化手段は、所属毎にグループ化した複数のグループをまとめて単一の名刺データとする。
【発明の効果】
【0014】
本発明によれば、1枚の名刺に複数の所属が記載されている場合に、名刺に記載されている文字を部分的に認識できなかったとしても、各所属と各所属に付随する情報との不整合が生じることを防止することが可能となる。
【図面の簡単な説明】
【0015】
【図1】実施形態に係る文字認識装置が搭載された複合機の構成を示すブロック図である。
【図2】複数の所属が記載された名刺の一例を示す図である。
【図3】実施形態に係る文字認識装置により生成された名刺データの一例を示す図である。
【図4】実施形態に係る文字認識装置により生成された名刺データを利用した住所録データベースの表示画面の一例を示す図である。
【図5】実施形態に係る文字認識装置による名刺読取処理の処理手順を示すフローチャートである。
【図6】図5に示される名刺読取処理に含まれる格納拠点判定処理の処理手順を示すフローチャートである。
【発明を実施するための形態】
【0016】
以下、図面を参照して本発明の好適な実施形態について詳細に説明する。なお、各図において、同一要素には同一符号を付して重複する説明を省略する。
【0017】
まず、図1を用いて、実施形態に係る文字認識装置3が搭載された複合機(MFP:Multi Functional Peripheral)1の構成について説明する。図1は、文字認識装置3が搭載された複合機1の構成を示すブロック図である。
【0018】
複合機1は、スキャナ、プリンタ、コピー、及びファクシミリ(FAX)の各機能を有している。これらの機能を実現するために複合機1は、制御部10、操作部11、表示部12、読取部13、記憶部14、記録部16、コーデック17、モデム18、NCU19、IFAX制御部20、Webサーバ21、及び、NIC22等を備えている。なお、各部はバス(通信路)23で相互に通信可能に接続されている。
【0019】
また、複合機1には、文字認識装置3が搭載されている。文字認識装置3は、名刺などを読取って文字を認識し、認識した文字コードを名刺データとして複合機1の住所録データベースに出力・登録する機能を有している。特に、文字認識装置3は、名刺に複数の所属(拠点又は住所)が記載されている場合に、所属毎に、所属と該所属に付随するデータ(例えば、電話番号、FAX番号など)とをグループ化して出力する。そのため、文字認識装置3は、上述したスキャナ、プリンタ、コピー、FAX機能と共有する制御部10、操作部11、表示部12、読取部13、記憶部14、及び文字認識部15を備えている。続いて、各構成要素について詳細に説明する。
【0020】
制御部10は、演算を行うマイクロプロセッサ、マイクロプロセッサに各処理を実行させるためのプログラム等を記憶するROM、演算結果などの各種データを一時的に記憶するRAM、及びデータがバックアップされているバックアップRAM等により構成されている。制御部10は、ROMに記憶されているプログラムを実行することにより、以下に説明する文字認識装置3を含む複合機1を構成する各部の機能を実現するとともに、複合機1を構成するハードウェアを統合的に制御する。
【0021】
操作部11は、複合機1の各機能を利用するために用いられる複数のキー、例えば、テンキー、短縮キー、スタートキー、ストップキー、及び各種のファンクションキー等を備えている。操作部11は、例えば、名刺を読取って文字を認識し、名刺データを取得する操作をユーザから受け付ける。また、操作部11は、表示部12により表示される住所録データベースの中から、例えば、送信先のFAX番号を選択する操作などをユーザから受け付ける。
【0022】
表示部12は、LCD等を用いた表示装置であり、複合機1の動作状態及び/又は各種設定内容等を表示する。また、表示部12は、読取られた名刺データ、及び、名刺データから作成された住所録データベースを表示する。
【0023】
読取部13は、光源及びCCD等によって構成されており、名刺、及び紙文書等の原稿を設定された副走査線密度に応じてライン毎に読み取り、画像データを生成する。すなわち、読取部13は、特許請求の範囲に記載の読取手段として機能する。読取部13で生成された名刺の画像データは文字認識装置3を構成する文字認識部15に出力される。また、読取部13で生成された画像データは、コピーを行う場合には記録部16に出力され、FAXを送信するときにはコーデック17に出力される。
【0024】
記憶部14は、FAX又はIFAXで受信された画像データ(FAXデータ)、コーデック17で符号化された画像データ、及び外部のパーソナルコンピュータから受信されて符号化圧縮された画像データ等を記憶する。また、記憶部14は、所属先の拠点を表す単語が登録されている辞書データを記憶する。すなわち、記憶部14は、特許請求の範囲に記載の記憶手段として機能する。ここで、所属先の拠点を示す単語としては、例えば、「本社」「本店」「本部」「支社」「支店」「支部」「営業所」「出張所」「オフィス」「事業所」「工場」などが挙げられる。なお、記憶部14としては、例えば、CF(コンパクトフラッシュ(登録商標))又はHD(ハードディスク)などが好適に用いられる。
【0025】
文字認識部15は、読取部13で生成された名刺の画像データから文字を認識し、認識した文字コードを名刺データとして複合機1の住所録データベースに出力・登録する。特に、文字認識部15は、名刺に複数の所属(拠点又は住所)が記載されている場合に、所属毎に、所属と該所属に付随するデータ(例えば、電話番号、FAX番号など)とをグループ化して出力する。そのため、文字認識部15は、文字コード生成部30、グループ化部31、タグ情報付加部32、及びデータベース登録部33を有している。
【0026】
文字コード生成部30は、読取部13により読み取られて生成された名刺の画像データから文字を認識し、属性項目毎に文字コードを生成するとともに、該文字コードが記載されている名刺上の位置情報(文字が記載されている矩形領域の四隅のXY座標)を生成する。すなわち、文字コード生成部30は、特許請求の範囲に記載の生成手段として機能する。ここで、属性項目としては、例えば、「会社名」「部署」「氏名」「住所」「郵便番号」「電話番号」「FAX番号」などが挙げられる。なお、文字コード生成部30で生成された属性項目毎の文字コード、及び位置情報はグループ化部31に出力される。
【0027】
グループ化部31は、記憶部14に記憶されている辞書データを用いて、文字コード生成部30により生成された文字コードの中から所属先の拠点を示す文字コードを抽出する。また、グループ化部31は、文字コード生成部30により生成された位置情報に基づいて、所属(名刺に所属先の拠点が記載されている場合にはその拠点、拠点が記載されていないときには住所)を示す文字コード(文字コード列)と、所属に付随する情報(例えば電話番号、FAX番号など、ただし、拠点が記載されている場合には住所も付随情報に該当する)を示す文字コードとの相対的な位置関係を判定し、その判定の結果に基づいて、所属毎に、所属を示す文字コードと、該所属に付随する情報を示す文字コードとをまとめてグループ化する。また、複数の所属が存在する場合に、グループ化部31は、所属毎にグループ化した複数のグループをまとめて単一の名刺データとする。すなわち、グループ化部31は、特許請求の範囲に記載のグループ化手段として機能する。なお、グループ化部31は、横書きの名刺の場合には上下の位置関係、縦書きの名刺の場合には左右の位置関係に基づいて、生成された文字コードをまとめてグループ化する。
【0028】
ここで、図2を参照しつつ、より具体的にグループ化の方法について説明する。図2は、複数の所属が記載された名刺の一例を示す図であり、図2に示された名刺では、「本社」及び「神戸支店」が所属先の拠点に該当する。図2に示された名刺は横書きであるので、グループ化部31は、文字コードの座標情報に基づいて、拠点を示す文字コードと拠点に付随する情報を示す文字コードとの上下の位置関係を判定し、拠点毎に、拠点に付随する情報を振り分け、グループ化を行う。
【0029】
図2の例では、住所「東京都港区xx町yy−zz」は、拠点「本社」より下に位置し、拠点「神戸支店」より位置が上であるため、「本社」に振り分けられる。また、住所「神戸市中央区xxx−yyyy」は、拠点「本社」及び「神戸支店」よりも下に位置し、かつ、「神戸支店」よりも下に拠点を示す単語が無いため、「神戸支店」に振り分けられる。同様にして、郵便番号、電話番号、FAX番号なども「本社」又は「神戸支店」に振り分けられ、グループ化される。なお、名刺に拠点が記載されていない場合には、住所との位置関係に基づいて、グループ化が行われる。
【0030】
タグ情報付加部32は、グループ化部31によりグループ化が行われる際に、文字コードに対して、属性項目(例えば、住所、郵便番号、電話番号、FAX番号など)毎にタグ情報を付加する。すなわち、タグ情報付加部32は、特許請求の範囲に記載の付加手段として機能する。
【0031】
ここで、タグ情報が付加された名刺データの一例を図3に示す。なお、図3は、図2に示された名刺が読取られ、タグ情報が付加されて、グループ化された名刺データを示す図である。図3に示された例では、属性項目「拠点」に対して、タグ情報<Name>が付加されている。また、属性項目「郵便番号」に対して、タグ情報<Zip>が付加され、属性項目「住所」に対して、タグ情報<Address>が付加されている。さらに、属性項目「電話番号」に対して、タグ情報<Tel>が付加されて、属性項目「FAX番号」に対して、タグ情報<Fax>が付加されている。なお、図3に示された例では、<Hub1><Hub2>それぞれが、「本社」と「神戸支店」についてのグループになっており、その内部に、所属先の拠点及び該拠点に付随する情報が格納されている。なお、グループ化部31でグループ化され、タグ情報付加部32でタグ情報が付加された文字コードは、データベース登録部33に出力される。
【0032】
データベース登録部33は、グループ化部31及びタグ情報付加部32により、タグ情報が付加され、1以上のグループにグループ化された文字コードを、名刺毎に、住所録データベースに登録する。すなわち、データベース登録部33は、特許請求の範囲に記載の登録手段として機能する。なお、名刺情報が登録された住所録データベースは、記憶部14に記憶される。
【0033】
ここで、データベース登録部33により登録された住所録データベース(アドレス帳)の表示画面の一例を図4に示す。なお、ここでは、図2に示された名刺の名刺データが登録された場合を例にして説明する。例えば、FAXを送信する際に、ユーザにより、操作部11が操作され、住所録データベースが呼び出されると、図4の上段に示されるように、FAXの宛先となる複数の氏名が表示部12に表示される。ここで、ユーザが、「村田太郎」氏を選択すると、FAX番号として、名刺から読取られた「本社」と「神戸支店」双方のFAX番号が表示部12に表示される。そのため、ユーザは、FAXを送付したい拠点を選択して、FAXを送信することができる。
【0034】
その他、記録部16は、電子写真方式のプリンタであり、パーソナルコンピュータなどから入力されるPCプリントデータ、読取部13により読み取られて生成された画像データを用紙にプリントアウトする。また、記録部16は、FAX、IFAX等で受信された画像データを用紙にプリントアウトする。
【0035】
コーデック17は、読取部13で読み取られた画像データを符号化圧縮(以下、単に「符号化」という)するとともに符号化されている画像データを復号する。モデム(変復調器)18は、ディジタル信号とアナログ信号との間の変復調を行なう。また、モデム18は、ディジタル命令信号(DCS)等の各種機能情報の発生及び検出を行なう。NCU(Network Control Unit)19は、モデム18と接続されており、モデム18と公衆交換電話網(PSTN)50との接続を制御する。また、NCU19は、送信先のFAX番号に対応した呼出信号の送出、及びその着信を検出する機能を備えている。
【0036】
IFAX制御部20は、インターネット環境を利用したIFAX機能を司る。IFAX制御部20は、SMTP(Simple Mail Transfer Protocol)に従って電子メールを送信する機能、及び、POP(Post Office Protocol)に従って電子メールを受信する機能を有している。IFAX制御部20は、送信原稿をTIFF形式等の画像データとして電子メールに添付し、メールアドレス(SMTPサーバ)宛てに送信する。また、IFAX制御部20は、設定された時間毎にPOPサーバから電子メールを受信する。
【0037】
Webサーバ21は、例えばHTMLで記述されたホームページ、ログインページ、及びファクシミリ操作ページ等のデータに対して、パーソナルコンピュータ等からアクセスして所定のHTTPタスクを実行することを可能にする。NIC22は、各種通信プロトコルの送受信制御処理、及び各種通信プロトコル上のデータ解析処理及びデータ作成処理を行なうネットワークインターフェースである。
【0038】
次に、図5及び図6を併せて参照しつつ、複合機1に搭載された文字認識装置3による名刺読取処理について説明する。図5は、文字認識装置3による名刺読取処理の処理手順を示すフローチャートである。また、図6は、図5に示される名刺読取処理に含まれる格納拠点判定処理の処理手順を示すフローチャートである。なお、ここでは、図2に示される名刺を読取り、図3に示される名刺データを出力する場合を例にして説明する。
【0039】
まず、ステップS100では、読取部13により名刺が読取られ、画像データが生成される。続いて、ステップS102では、ステップS100で生成された画像データに対して文字認識処理が施され、例えば「会社名」「部署」「氏名」「住所」「郵便番号」「電話番号」「FAX番号」などの属性項目毎に文字コードが生成される。なお、所属先の拠点は属性項目「UNKNOWN」で出力される。また、ステップS102では、文字コードの名刺上の位置情報(座標情報)が生成される。
【0040】
次に、ステップS104では、全ての文字コード(文字コード列)に対して、拠点判定及び住所判定が行われたか否かについての判断が行われる。ここで、全ての文字コードに対して拠点判定及び住所判定が行われた場合、すなわち拠点判定及び住所判定が終了した場合には、ステップS120に処理が移行する。一方、拠点判定又は住所判定がまだ終了していないときには、ステップS106に処理が移行する。
【0041】
ステップS106では、属性項目が「UNKNOWN」の文字コード(文字コード列)と辞書データに記憶されている拠点を示す単語とが照合されることによって、文字コードが所属先の拠点を示すものであるか否かを判定する拠点判定が行われる。文字コードが、拠点を示す単語を含む場合には、拠点を示すものであると判定される。なお、拠点を示す単語としては、上述したように、例えば、「本社」「本店」「本部」「支社」「支店」「支部」「営業所」「出張所」「オフィス」「事業所」「工場」などが挙げられる。
【0042】
そして、ステップS108において、ステップS106での判定結果に基づいて、判定された文字コードが拠点を示す文字コードであると判断された場合には、ステップS110に処理が移行する。ステップS110では、拠点数をカウントするカウンタ(以下「拠点カウンタ」という)がインクリメント(+1)される。そして、ステップS112において、拠点情報コンテナが生成される。ここで、拠点情報コンテナとは、図3に示される、タグ<Hub>と</Hub>とで括られ、所属先の拠点及び該拠点に付随する情報が格納される領域を指す。なお、本ステップにおいて拠点情報コンテナが生成された時点では、その内部の情報はまだ格納されていない。その後、ステップS104に処理が移行し、上述したステップS104の処理が再度実行される。
【0043】
一方、ステップS108において、拠点を示す文字コードではないと判断されたときには、ステップS114において、文字コードの住所判定が行われる。住所判定では、ステップS102で文字コードが生成される際に、文字コードと対応付けて生成された属性項目を利用することができる。続くステップS116では、ステップS114での判定結果に基づいて、判定された文字コードが住所を示す文字コードであると判断された場合には、ステップS118に処理が移行する。ステップS118では、住所数をカウントするカウンタ(以下「住所カウンタ」という)がインクリメント(+1)される。その後、ステップS104に処理が移行し、上述したステップS104の処理が再度実行される。一方、住所を示す文字コードではないと判断されたときには、住所カウンタがインクリメントされることなく、ステップS104に処理が移行し、上述したステップS104の処理が再度実行される。
【0044】
上述したステップS104において、全ての文字コードについて拠点判定及び住所判定が終了したと判断された場合には、ステップS120において、拠点カウンタの値に基づいて、拠点が存在するか否かについての判断が行われる。ここで、拠点が存在しないと判断された場合、すなわち、拠点カウンタの値がゼロの場合には、ステップS122において、住所カウンタの値に基づいて、住所数分の拠点情報コンテナが生成される。その後、ステップS128に処理が移行する。
【0045】
一方、ステップS120において拠点が存在すると判断された場合、すなわち、拠点カウンタの値が1以上の場合には、ステップS124に処理が移行する。ステップS124では、名刺に記載されている住所数が拠点数よりも多いか否か、すなわち住所カウンタの値が拠点カウンタの値よりも大きいか否かについての判断が行われる。ここで、住所数(住所カウンタ値)が拠点数(拠点カウンタ値)よりも多い場合には、ステップS126において、(住所数−拠点数)分、すなわち住所数に対して不足している分の拠点情報コンテナが生成される。その後、ステップS128に処理が移行する。一方、住所数が拠点の数以下のときには、すでに必要な数の拠点情報コンテナが既に生成済みであるため、拠点情報コンテナが新たに生成されることなく、ステップS128に処理が移行する。これにより、拠点数又は住所数のうち、多い方の数に合わせて拠点情報コンテナが生成される。
【0046】
ステップS128では、名刺の記載順にしたがって、拠点情報がソートされる。続いて、ステップS130では、すべての拠点情報コンテナに、拠点単位に、文字コードの格納が行われたか否か、すなわち、すべての拠点情報コンテナに対して文字コードの格納が終了したか否かについての判断が行われる。ここで、すべての拠点情報コンテナに対して文字コードの格納が終了した場合には、本処理が終了する。一方、すべての拠点情報コンテナに対して文字コードの格納がまだ終了していないときには、ステップS132において、格納拠点判定処理(グループ化処理)が実行される。ここで、図6を参照しつつ、格納拠点判定処理について説明する。
【0047】
図6に示されるステップS200では、ソートされた先頭の拠点情報(図2に示された例では「本社」)がターゲットにセットされる。続くステップS202では、拠点の位置情報(座標情報)が取り出される。そして、ステップS204において、拠点の位置情報と格納対象文字コード(格納対象文字コード列)の位置情報とが比較され、双方の位置関係が判定される。なお、位置の比較方法については、上述した通りであるので、ここでは詳細な説明を省略する。
【0048】
次に、ステップS206では、ステップS204で判定された結果に基づいて、セットされているターゲットに格納することが妥当か否かについての判断が行われる。ここで、セットされているターゲットに格納することが妥当ではないと判断された場合には、ステップS208において、次の拠点情報(図2に示された例では「神戸支店」)が新たにターゲットとしてセットされる。そして、ステップS202に処理が移行し、上述したステップS202以降の処理が繰り返して実行される。
【0049】
一方、ステップS206において、セットされているターゲットに格納することが妥当であると判断されたときには、ステップS210において、ターゲットに格納対象文字コードが格納された後、図5に示されるステップS134に処理が移行する。
【0050】
ステップS134では、ステップS210でターゲットに格納された格納対象文字コードが、拠点情報コンテナに格納される。その後、ステップS128に処理が移行し、すべての拠点情報コンテナに文字コードが格納されるまで、ステップS128〜S134の処理が繰り返して実行される。そして、すべての拠点情報コンテナに対して文字コードの格納が終了(すなわちグループ化が終了)した場合には、本処理が終了する。ここで、上述した図3は、すべての拠点情報コンテナに対して文字コードが格納された(グループ化された)名刺データの一例を示すものである。なお、生成された名刺データは、上述したように、住所録データベースなどに出力されて利用される。
【0051】
本実施形態によれば、所属を示す文字コードの名刺上の記載位置と、所属に付随する情報を示す文字コードの記載位置との相対的な関係が判定され、その判定結果に基づいて、所属を示す文字コードとその所属に付随する情報を示す文字コードとが所属毎にまとめられてグループ化される。よって、1枚の名刺に複数の所属が記載されている場合に、名刺に記載されている文字を部分的に認識できなかったとしても、各所属と各所属に付随する情報との不整合が生じることを防止することが可能となる。
【0052】
ここで、上記所属を示す文字コードは、所属先の拠点又は所属先の住所であるため、所属先の拠点又は所属先の住所毎に、拠点(例えば、本社、支社、営業所など)又は住所と、拠点又は住所に付随する情報(例えば、電話番号、FAX番号など)とをグループ化することができる。なお、名刺に所属先の拠点が記載されている場合には拠点が所属として設定され、拠点が記載されていないときには住所が所属として設定される。
【0053】
本実施形態によれば、所属先の拠点を表す単語が登録されている辞書データを用いて、文字コードの中から所属先の拠点を示す文字コードが抽出される。そのため、名刺から認識された文字コードの中から所属先を示す文字コードを的確に抽出することができる。
【0054】
本実施形態によれば、グループ化が行われる際に、文字コードに対して、属性項目毎にタグ情報が付加される。そのため、付加されたタグ情報によって、文字コードの属性項目(例えば、拠点、住所、電話番号等)を認識することができるため、名刺データを容易に利用することが可能となる。
【0055】
本実施形態によれば、1以上のグループにグループ化された文字コードが、名刺毎に、住所録データベースに登録される。この場合、1以上のグループにグループ化された文字コードが名刺毎に登録されるため、複数の所属が記載された名刺であっても、名刺毎に名刺データを住所録データベースに登録して、管理・利用することが可能となる。
【0056】
本実施形態によれば、横書きの名刺の場合には上下の位置関係、縦書きの名刺の場合には左右の位置関係に基づいて、所属を示す文字コードと、該所属に付随する情報を示す文字コードとがグループ化される。そのため、横書きの名刺であっても縦書きの名刺であっても、所属と所属に付随する情報との位置関係に基づいて、複数の所属と、各所属に付随する情報との対応関係を適切に判別してグループ化することが可能となる。
【0057】
以上、本発明の実施の形態について説明したが、本発明は、上記実施形態に限定されるものではなく種々の変形が可能である。例えば、上記実施形態では、文字認識装置3が複合機1に搭載されている場合を例にして説明したが、文字認識装置3は、単独で使用することもできる。
【0058】
上記実施形態では、所属(拠点/住所)が2つ記載されている名刺を例にして説明したが、所属は2つに限られることなく、3つ以上であってもよい。また、複数の会社が名刺に記載されている場合にも適用することができる。さらに、名刺には、上述した項目に加えて、所属部署、肩書き、電子メールアドレス、及びURLなどがさらに記載されていてもよい。
【0059】
上記実施形態では、拠点の下側に住所等が記載されていたが、拠点の横に住所等が記載されていてもよい。この場合、拠点の横又は下側に記載されているか否かに基づいて、グループ化を行うことができる。
【符号の説明】
【0060】
1 複合機
3 文字認識装置
10 制御部
11 操作部
12 表示部
13 読取部
14 記憶部
15 文字認識部
16 記録部
17 コーデック
18 モデム
19 NCU
20 IFAX制御部
21 Webサーバ
22 NIC
23 バス
30 文字コード生成部
31 グループ化部
32 タグ情報付加部
33 データベース登録部


【特許請求の範囲】
【請求項1】
名刺を読取り画像データを生成する読取手段と、
前記読取手段により生成された画像データから文字を認識し、文字コード、及び該文字コードの名刺上の位置情報を生成する生成手段と、
前記生成手段により生成された位置情報に基づいて、所属を示す文字コードと、所属に付随する情報を示す文字コードとの相対的な位置関係を判定し、当該判定の結果に基づいて、所属毎に、所属を示す文字コードと、該所属に付随する情報を示す文字コードとをまとめてグループ化するグループ化手段と、を備えることを特徴とする文字認識装置。
【請求項2】
前記所属を示す文字コードは、所属先の拠点又は所属先の住所であることを特徴とする請求項1に記載の文字認識装置。
【請求項3】
所属先の拠点を表す単語が登録されている辞書データを記憶する記憶手段を備え、
前記グループ化手段は、前記辞書データを用いて、前記文字コードの中から所属先の拠点を示す文字コードを抽出することを特徴とする請求項2に記載の文字認識装置。
【請求項4】
前記グループ化手段によりグループ化が行われる際に、文字コードに対して、属性項目毎にタグ情報を付加する付加手段を備えることを特徴とする請求項1〜3のいずれか1項に記載の文字認識装置。
【請求項5】
前記グループ化手段により1以上のグループにグループ化された文字コードを、名刺毎に、住所録データベースに登録する登録手段をさらに備えることを特徴とする請求項1〜4のいずれか1項に記載の文字認識装置。
【請求項6】
前記グループ化手段は、横書きの名刺の場合には上下の位置関係、縦書きの名刺の場合には左右の位置関係に基づいて、所属を示す文字コードと、該所属に付随する情報を示す文字コードとをまとめてグループ化することを特徴とする請求項1〜5のいずれか1項に記載の文字認識装置。
【請求項7】
前記グループ化手段は、複数の所属が存在する場合に、所属毎にグループ化した複数のグループをまとめて単一の名刺データとすることを特徴とする請求項1〜6のいずれか1項に記載の文字認識装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate