説明

住所データベース構築装置および住所データベース構築方法

【課題】未登録部が住所データベースなしでは読取り困難な場合にも効率よく住所データベースを構築・更新することができる住所データベース構築装置および住所データベース構築方法を提供する。
【解決手段】住所情報が記載された郵便物や帳票等の紙葉類を住所情報に基づき区分処理する紙葉類処理装置において、郵便物や帳票等の紙葉類に記載された住所情報を利用して住所データベースを構築する住所データベース構築装置において、住所情報の一部の認識に成功し残りの部分の認識に失敗した場合、その画像を蓄積しておき、あらかじめ定められた所定のタイミングで、その蓄積された画像の中から未登録データの記載されている可能性の高い画像を検出して表示し、この表示された画像に基づき認識に失敗した部分の住所情報を入力し、この入力された住所情報を住所データベースに登録する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、たとえば、住所情報が記載された郵便物や帳票等の紙葉類を住所情報に基づき区分処理する紙葉類処理装置において、郵便物や帳票等の紙葉類に記載された住所情報を利用して住所データベースを構築する住所データベース構築装置および住所データベース構築方法に関する。
【背景技術】
【0002】
たとえば、住所情報が記載された郵便物や帳票等の紙葉類を住所情報に基づき区分処理する紙葉類処理装置においては、郵便物や帳票等の紙葉類に記載された住所情報を読取り、住所データベースを参照することにより住所情報を認識するようになっている。
【0003】
したがって、住所データベースは住所認識処理に不可欠であり、住所データベースに不備があると住所認識の精度が落下する。住所情報は、市町村の合併、マンションの新規追加、転居などにより、常に変化しており、定期的なメンテナンスが必要であるが、そのためには多大なコストがかかっている。そのため、従来、住所データベースの構築、更新処理が工夫されている。
【0004】
その1つとして、郵便物に記載されている住所情報を、住所データベースに未登録な部分を含め文字認識処理により読取り、その読取り結果をオペレータに提示して、住所データベースに新規登録するか否かの判断をさせる技術が公知である(たとえば、特許文献1参照)。
【0005】
また、上記特許文献1と同様に、住所データベースに未登録な部分を含め文字認識処理により読取り、様々な条件で住所データベースの更新処理を行なう技術が公知である(たとえば、特許文献2参照)。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2007−41919号公報
【特許文献2】特開2009−146393号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、上記した特許文献1、2のいずれも、住所データベースに未登録な部分を文字認識処理により正しく読取らなければならない。特に、手書きされた住所情報では、住所データベース未登録部分の全文字を正しく読取るのは非常に困難である。手書きされた住所情報は、住所データベースを用いて後処理を行なうか、もしくは、個別の文字を読取るアプローチではなく、文字列画像と住所データベースとをマッチングすることで最もスコアの高い住所データベース内単語を選択するというアプローチを取ることが多く、この場合従来法は適用できない。
【0008】
そこで、本発明は、未登録部が住所データベースなしでは読取り困難な場合にも効率よく住所データベースを構築・更新することができる住所データベース構築装置および住所データベース構築方法を提供することを目的とする。
【課題を解決するための手段】
【0009】
本発明の住所データベース構築装置は、住所情報が含まれた画像を利用して住所データベースを構築する住所データベース構築装置において、前記画像から前記住所データベースを利用して住所情報を認識する住所認識手段と、この住所認識手段により住所情報の一部の認識に成功し残りの部分の認識に失敗した場合に、その画像を蓄積する蓄積手段と、この蓄積手段に蓄積された画像を表示する蓄積画像表示手段と、この蓄積画像表示手段により表示された画像に基づき、前記住所認識手段により認識に失敗した部分の住所情報を入力する未登録データ入力手段と、この未登録データ入力手段より入力された住所情報を前記住所データベースに登録するデータ登録手段とを具備している。
【0010】
本発明の住所データベース構築装置は、住所情報が含まれた画像を利用して住所データベースを構築する住所データベース構築装置において、前記画像から前記住所データベースを利用して住所情報を認識する住所認識手段と、この住所認識手段により住所情報の認識に失敗した画像を表示する画像表示手段と、この画像表示手段により表示される画像に含まれる住所情報を入力する住所入力手段と、この住所入力手段により入力された住所情報が前記住所データベースに登録されているか否かの判定を入力する判定入力手段と、この判定入力手段により登録されていないと判定入力された場合に前記画像を蓄積する蓄積手段と、この蓄積手段に蓄積された画像を表示する蓄積画像表示手段と、この蓄積画像表示手段により表示された画像に基づき、前記住所情報のうち前記住所入力手段により入力されていない部分の一部または全部の住所情報を入力する未登録データ入力手段と、この未登録データ入力手段より入力された住所情報を前記住所データベースに登録するデータ登録手段とを具備している。
【0011】
本発明の住所データベース構築装置は、住所情報が含まれた画像を利用して住所データベースを構築する住所データベース構築装置において、前記画像から前記住所データベースを利用して住所情報を認識する住所認識手段と、この住所認識手段により住所情報の認識に失敗した画像を表示する画像表示手段と、この画像表示手段により表示される画像に含まれる住所情報を入力する住所入力手段と、この住所入力手段により入力された住所情報が前記住所データベースに登録されているか否かの判定を入力する判定入力手段と、前記住所認識手段により住所情報の一部の認識に成功し残りの部分の認識に失敗した画像あるいは判定入力手段により登録されていないと判定入力された画像を蓄積する蓄積手段と、この蓄積手段に蓄積された画像を表示する蓄積画像表示手段と、この蓄積画像表示手段により表示された画像に基づき、前記住所認識手段により認識に失敗した部分の住所情報を入力する未登録データ入力手段と、この未登録データ入力手段より入力された住所情報を前記住所データベースに登録するデータ登録手段とを具備している。
【0012】
本発明の住所データベース構築方法は、住所情報が含まれた画像を利用して住所データベースを構築する住所データベース構築方法において、前記画像から前記住所データベースを利用して住所情報を認識する住所認識ステップと、この住所認識ステップにより住所情報の一部の認識に成功し残りの部分の認識に失敗した場合に、その画像を蓄積手段に蓄積する画像蓄積ステップと、前記蓄積手段に蓄積された画像を蓄積画像表示手段に表示する蓄積画像表示ステップと、前記蓄積画像表示手段に表示された画像に基づき、前記住所認識ステップにより認識に失敗した部分の住所情報を入力する未登録データ入力ステップと、この未登録データ入力ステップより入力された住所情報を前記住所データベースに登録するデータ登録ステップとを具備している。
【0013】
本発明の住所データベース構築方法は、住所情報が含まれた画像を利用して住所データベースを構築する住所データベース構築方法において、前記画像から前記住所データベースを利用して住所情報を認識する住所認識ステップと、この住所認識ステップにより住所情報の認識に失敗した画像を画像表示手段に表示する画像表示ステップと、前記画像表示手段に表示された画像に含まれる住所情報を入力する住所入力ステップと、この住所入力ステップにより入力された住所情報が前記住所データベースに登録されているか否かの判定を入力する判定入力ステップと、この判定入力ステップにより登録されていないと判定入力された場合に前記画像を蓄積手段に蓄積する画像蓄積ステップと、前記蓄積手段に蓄積された画像を蓄積画像表示手段に表示する蓄積画像表示ステップと、前記蓄積画像表示手段に表示された画像に基づき、前記住所情報のうち前記住所入力ステップにより入力されていない部分の一部または全部の住所情報を入力する未登録データ入力ステップと、この未登録データ入力ステップより入力された住所情報を前記住所データベースに登録するデータ登録ステップとを具備している。
【発明の効果】
【0014】
本発明によれば、未登録部が住所データベースなしでは読取り困難な場合にも効率よく住所データベースを構築・更新することができる住所データベース構築装置および住所データベース構築方法を提供できる。
【図面の簡単な説明】
【0015】
【図1】本発明の実施の形態に係る住所データベース構築装置および住所データベース構築方法が適用される紙葉類処理装置の構成を概略的に示すブロック図。
【図2】処理対象としての紙葉類の一例を示す図。
【図3】住所データベースの一例を示す図。
【図4】蓄積部の蓄積内容の具体例を示す図。
【図5】住所データベース構築処理について説明するフローチャート。
【図6】蓄積処理について説明するフローチャート。
【図7】蓄積データ更新処理について説明するフローチャート。
【図8】未登録データ登録処理について説明するフローチャート。
【発明を実施するための形態】
【0016】
以下、本発明の実施の形態について図面を参照して説明する。
図1は、本発明の実施の形態に係る住所データベース構築装置および住所データベース構築方法が適用される紙葉類処理装置の構成を概略的に示すものである。この紙葉類処理装置1は、たとえば、郵便物や帳票等の紙葉類に記載された住所情報を読取り認識し、その認識結果に基づき当該紙葉類を区分処理するものである。
【0017】
図1において、紙葉類処理装置1は、区分機本体3、ビデオコーディングシステム(以降、VCSと略称する)4、および、住所データベース登録装置(以降、住所DB登録装置と略称する)5から構成されていて、これらは互いに通信可能なように接続されている。
【0018】
区分機本体3は、紙葉類を住所情報などにより区分処理するものである。VCS4は、区分機本体3にて住所情報が認識できなかった紙葉類の住所情報をオペレータのコーディング作業により入力するものである。住所DB登録装置5は、区分機本体3にて住所情報の認識に失敗した部分の住所情報を住所データベース19に登録するものである。
【0019】
区分機本体3は、前面にオペレーションパネル10が設けられている。オペレーションパネル10は、オペレータ(操作員)が処理モードや処理開始を指定したり、本装置の動作状態などを表示したりする。
【0020】
区分機本体3は、紙葉類Pを供給する供給部11を有する。供給部11に収容される紙葉類Pは、たとえば、図2に示すように、郵便番号、住所、宛名などの文字情報からなる住所情報が記載されている郵便物である。供給部11は、紙葉類Pを所定の間隔で一通づつ主搬送路12へ供給する。
【0021】
なお、供給部11に供給される紙葉類Pには、住所情報以外に、紙葉類Pの住所情報を示す宛先バーコード、あるいは、住所情報の認識ができなかった紙葉類に付与される識別情報としてのIDバーコードが記載されたものもある。
【0022】
主搬送路12上には、バーコードリーダ(以降、BCRと略称する)13、スキャナ14、バーコードライタ(以降、BCWと略称する)15、および、区分部16が設けられている。これらの各部は、各紙葉類に対する搬送状態などの処理状況に応じた区分制御部17による制御に基づいて動作する。
【0023】
BCR13は、主搬送路12上を搬送される紙葉類に印字されているIDバーコードあるいは宛先バーコードなどのバーコードを読取るものである。BCR13は、バーコードの画像を読取る読取部と、読取画像におけるバーコードを認識する認識部を有する。BCR13によるバーコードの認識結果は、区分制御部17へ供給される。
【0024】
スキャナ14は、主搬送路12上の紙葉類の画像を光学的に読取るもので、住所認識手段としての住所認識部18に接続される。住所認識部18は、住所データベース(住所DB)19に登録されている住所情報を参照することにより、スキャナ14により読取った画像から住所情報を認識し、その住所情報の認識結果を区分制御部17へ供給する。
【0025】
BCW15は、必要に応じて紙葉類にIDバーコード、あるいは、宛先バーコードを印刷する。たとえば、BCW15は、住所認識部18により住所情報が認識できた紙葉類に対し認識結果としての住所情報をバーコード化した宛先バーコードを印刷する。また、BCW15は、住所認識部18により住所情報が認識できなかった紙葉類に対し区分制御部17から与えられる識別情報(書状ID)をバーコード化したIDバーコードを印刷する。つまり、BCW15は、住所情報が認識できた紙葉類にはその認識結果を宛先バーコードとして印刷し、住所情報が認識できなかった紙葉類にはIDバーコードを印刷する。
【0026】
すなわち、上記宛先バーコードは、OCR認識結果としての宛先情報そのものを示すバーコードであり、上記IDバーコードは、当該紙葉類を識別するための識別情報を示すバーコードである。上記IDバーコードで示す紙葉類の識別情報は、VCS4において打鍵入力された住所情報と紙葉類とを対応づけるための情報である。言い換えると、上記IDバーコードが印刷されている紙葉類は、VCS4による処理対象となる紙葉類である。
【0027】
BCW15の紙葉類の搬送方向の下流側には、紙葉類が住所情報に応じて区分される区分部16が設けられている。この区分部16は、複数の段、複数の列に区画された複数の区分ポケット(図示しない)から構成されている。各ポケットは、区分先ごとに対応して設定されており、住所情報あるいは機械コードに基づいて、紙葉類が住所情報に対応したポケットに順次集積される。
【0028】
また、区分部16には、区分先が認識できなかった紙葉類が集積されるVCS排除ポケット(図示しない)が設けられている。このVCS排除ポケットに集積された紙葉類は、住所情報がVCS4にて入力された後に、供給部11に再供給され、当該紙葉類のIDコードとVCS4にて入力された住所情報とに基づいて再区分されるようになっている。
【0029】
図3は、住所データベース19の一例を示している。住所データベース19は、たとえば、紙葉類(たとえば、郵便物)の処理対象となる地域に存在する全ての住所情報がツリー構造(階層構造)により格納されている。
【0030】
次に、VCS4について説明する。
VCS4は、画像蓄積分配装置21および複数のビデオコーディングディスク(以降、VCDと略称する)22などから構成されている。
【0031】
画像蓄積分配装置21は、区分機本体3で住所情報が認識できなかった紙葉類の画像を各VCD22へ配信し、各VCD22による住所情報の打鍵入力結果を区分機本体3へ返す処理を行なう。画像蓄積分配装置21には、区分機本体3におけるスキャナ14、区分制御部17、住所認識部18、住所データベース19および住所DB登録装置5が接続されている。
【0032】
画像蓄積分配装置21は、住所認識部18で住所情報が認識できなかった紙葉類の画像に当該紙葉類の識別情報(書状ID)を対応づけて記憶し、記憶した紙葉類の画像を各VCD22へ配信する。
【0033】
VCD22は、画像表示手段としての画像表示部23、住所入力手段としての住所入力部24および判定入力手段としての判定入力部25などを有する。住所入力部24および判定入力部25は、たとえば、キーボード等により構成されている。
【0034】
VCD22では、画像蓄積分配装置21から分配される紙葉類の画像を画像表示部23に表示する。紙葉類の画像を表示した状態において、VCD22では、オペレータが住所入力部24により住所情報を入力する。VCD22による入力結果は、当該紙葉類の識別情報(IDコード)と対応づけて画像蓄積分配装置21へ返される。
【0035】
また、画像蓄積分配装置21は、VCD22からの入力結果を当該紙葉類の識別情報(IDコード)と対応づけて区分制御部17へ供給する。これにより、区分制御部17では、紙葉類に付与したIDバーコードに基づいて打鍵入力された住所情報が得られる。
【0036】
なお、画像蓄積分配装置21およびVCD22は、たとえば、画像表示部、画像制御部、記憶部およびキーボード等を有するパーソナルコンピュータで構成される。
【0037】
次に、住所DB登録装置5について説明する。
住所DB登録装置5は、蓄積手段としての蓄積部31、蓄積画像表示手段としての蓄積画像表示部32、未登録データ入力手段としての未登録データ入力部33、データ登録手段としてのデータ登録部34、および、これら全体を制御する制御部35などから構成されている。未登録データ入力部33およびデータ登録部34は、たとえば、キーボード等により構成されている。
【0038】
蓄積部31は、住所認識部18での認識の結果、住所データベース19の途中の階層までが認識でき、そこよりも下位の階層が認識できない、という認識結果になった場合、当該画像と途中の階層までの認識結果(途中確定住所)等が蓄積されるもので、詳細は後述する。
【0039】
図4は、蓄積部31の蓄積内容の具体例を示している。途中までの認識結果(途中確定住所)「川崎市 幸区 小向○○町 1−2−5 コーポ△△ 301」41と、そのような認識結果となった画像42と、月ごとの画像の数(累積回数)43と、さらに「301」の下位も認識できた月ごとの画像の数(累積回数)44が蓄積されている例である。このように、途中までの認識結果ごとに、同様に保存される。
【0040】
蓄積画像表示部32は、蓄積部31に蓄積された画像等を表示するものである。
未登録データ入力部33は、蓄積画像表示部32に表示された画像に基づき、住所認識部18で認識に失敗した部分の住所情報等を入力するものである。
データ登録部34は、未登録データ入力部33より入力された住所情報を住所データベース19に登録するものである。
【0041】
なお、住所DB登録装置5は、たとえば、画像表示部、画像制御部、記憶部およびキーボード等を有するパーソナルコンピュータで構成される。
【0042】
以下、このような構成において本実施の形態に係る住所データベース構築処理の代表例について概略を説明する。
スキャナ14で住所情報の記載された紙葉類(郵便物、帳票など)Pを読取ることにより、住所情報の含まれた画像が得られる。図2に紙葉類Pから得られた画像の一例を示す。
【0043】
住所認識部18では、スキャナ14で得られた画像を認識し、住所データベース19を参照することによりどの住所文字列が書かれているかを判断する。図3に住所データベース19の一例を示す。たとえば、図2の画像を図3の住所データベース19を用いて認識すると、「川崎市 幸区 小向○○町 1−2−5 コーポ△△ 301」が書かれており、「301」の下位データ「東京太郎」、「東京花子」のいずれともマッチしない、という結果となる。
【0044】
住所認識部18での認識の結果、住所データベース19の途中の階層までが認識でき、そこよりも下位の階層が認識できない、という認識結果になった場合、住所DB登録装置5の蓄積部31に当該画像と途中の階層までの認識結果が蓄積される。また、途中の階層までの認識結果が同じであった回数がカウントされ、蓄積される。
【0045】
なお、途中の階層までの認識結果が同じであり、かつ、その下位の階層も認識できた回数が蓄積されていてもよい。また、カウントが月ごとなどの期間ごとに保存されていてもよい。
【0046】
図4に蓄積部31の蓄積内容例を示す。図4によれば、途中までの認識結果(途中確定住所)「川崎市 幸区 小向○○町 1−2−5 コーポ△△ 301」41と、そのような認識結果となった画像42と、月ごとの画像の数(累積回数)43と、さらに「301」の下位も認識できた月ごとの画像の数(累積回数)44が蓄積されている例を示している。このように、途中までの認識結果ごとに、同様に保存される。
【0047】
住所DB登録装置5の制御部35は、蓄積部31に蓄積されたデータを用いて、住所データベース19に未登録なデータを検出する。たとえば、図4の例において、1月〜3月のカウント数23が10〜15件であるのに対し、4月のカウント数23が30件と大幅に増加している。これは、「川崎市 幸区 小向○○町 1−2−5 コーポ△△ 301」に、4月から新たな人物が転居してきた可能性を示唆している。
【0048】
未登録なデータの検出方法としてはいろいろ考えられる。たとえば、カウント数そのものではなく、下位の階層が認識できた回数との比を用いてもよい。また、月ごとの変化ではなく、全期間でのカウント数もしくは比を用いてもよい。
【0049】
未登録なデータが検出された場合、制御部35は、当該画像を蓄積部31から取出して蓄積画像表示部32に表示する。その場合、同一の途中認識結果を持つ画像を複数取出して表示し、オペレータがそれを見てデータベース未登録なデータの存在を判断する。
【0050】
未登録データが見つかった場合、未登録データ入力部33より未登録データを入力する。入力された未登録データは、データ登録部34により、住所データベース19の途中認識結果の下位階層に登録される。
【0051】
このように、住所情報の一部の認識に成功し残りの部分の認識に失敗した場合、その画像を蓄積しておき、あらかじめ定められた所定のタイミングで、その蓄積された画像の中から未登録データの記載されている可能性の高い画像を検出して表示し、この表示された画像に基づき認識に失敗した部分の住所情報を入力し、この入力された住所情報を住所データベースに登録するものである。これにより、未登録部が住所データベースなしでは読取り困難な場合にも効率よく住所データベースを構築・更新することができる。
【0052】
次に、本実施の形態に係る住所データベース構築処理について図5に示すフローチャートを参照して詳細に説明する。
【0053】
紙葉類が搬送路12によりスキャナ14による画像読取位置に搬送されてくると、スキャナ14は、搬送路12を搬送される紙葉類の画像を読取る(ステップS11)。スキャナ21により紙葉類の画像が得られると、住所認識部18は、スキャナ21により読込まれた画像に対し、住所データベース19を用いた住所認識を行なう(ステップS12)。
【0054】
住所認識部18は、認識の結果、住所データベース19のツリー構造の最下層までマッチしたかどうか評価する(ステップS13)。この評価の結果、最下層までマッチした場合、それは認識に成功しているということであるので、住所認識部18は、住所DB登録装置5の蓄積部31に対する蓄積データの更新処理を行なう(ステップS14)。ステップS14の蓄積データ更新処理の詳細は後で説明する。
【0055】
ステップS14の蓄積データ更新処理が終了すると、住所認識部18は、認識結果を区分制御部17へ送ることにより、対象物の住所情報が認識できた場合の処理(後処理A)が行なわれる(ステップS15)。たとえば、処理対象物が郵便物であれば、当該郵便物を認識した住所情報に対応する区分ポケットに区分する処理が行なわれる。
【0056】
ステップS13における評価の結果、最下層までマッチしなかった場合、住所認識部18は、ステップ12における住所認識の結果が、途中の階層まではマッチしているがその下の階層はマッチしていない、ということかどうかを判定する(ステップS16)。
【0057】
この判定の結果、住所認識の結果が、途中の階層まではマッチしているがその下の階層はマッチしていない、ということである場合、それは下の階層が住所データベース19に存在しない疑いがあるということであるので、住所認識部18は、住所DB登録装置5の蓄積部31への蓄積処理を行なう(ステップS17)。ステップS17の蓄積処理の詳細は後で説明する。
【0058】
ステップS17の蓄積処理が終了すると、住所認識部18は、住所DB登録装置5の蓄積部31に対する蓄積データの更新処理を行ない(ステップS18)、ステップS19に進む。ステップS18の蓄積データ更新処理の詳細は後で説明する。
【0059】
ステップS16における判定の結果、住所認識結果が、途中の階層まではマッチしているがその下の階層はマッチしていない、ということではない場合、住所情報が認識できなかったということであるので、ステップS19に進む。
【0060】
ステップS19では、住所認識部18は、住所情報が認識できなかった紙葉類の画像を画像蓄積分配装置21を介してVCD22へ送り、画像表示部23に当該画像を表示する。
【0061】
VCD22では、オペレータが画像表示部23に表示された画像を見ながら、住所入力部24により住所情報の入力を行なう(ステップS20)。たとえば、処理対象物が郵便物であれば、郵便番号と、丁目、番地、号の数字の入力などが行なわれる。
【0062】
ステップS20での住所情報の入力が終了すると、オペレータは判定入力部12により判定入力を行なう(ステップS21)。たとえば、ステップS20にて入力された住所情報を基に、住所データベース19を参照することで、その住所情報に相当する氏名のリストを画像表示部23に一覧表示し、そのリストから選択する、という方法で行なわれる。一覧表示されたリストの中に、入力された住所情報に相当する氏名が存在しない場合は、その旨入力される。
【0063】
VCD22では、ステップS21での判定入力が終了すると、その判定入力の結果を見て、リストに存在したのかしないのかの判断を行なう(ステップS22)。この判断の結果、リストに存在した場合(つまり、入力された住所情報に相当する氏名が住所データベース19に存在した場合)、VCD22にて対象物の住所情報が教示できた場合の処理(後処理B)が行なわれる(ステップS23)。たとえば、処理対象物が郵便物であれば、対象物の画像と住所情報をセットで記憶しておく、などである。
【0064】
ステップS22における判断の結果、リストに存在しなかった場合(つまり、入力された住所情報に相当する氏名が住所データベース19に存在しない場合)、VCD22は、住所DB登録装置5の蓄積部31への蓄積処理を行なう(ステップS24)。ステップS24の蓄積処理の詳細は後で説明する。
【0065】
ステップS24の蓄積処理が終了すると、VCD22は、住所DB登録装置5の蓄積部31に対する蓄積データの更新処理を行ない(ステップS25)、ステップS26に進む。ステップS25の蓄積データ更新処理の詳細は後で説明する。
【0066】
ステップS26では、対象物の住所情報が特定できなかった場合の処理が行なわれる。たとえば、処理対象物が郵便物であれば、宛先不明として返送するためのフラグを立てておく、などである。
【0067】
次に、ステップS17,S24における蓄積処理について図6に示すフローチャートを参照して説明する。
【0068】
まず、蓄積部31に対し同一の途中確定住所41が既に登録されているか否かの判断を行なう(ステップS31)。この判断の結果、登録されていない場合、蓄積部31に対し途中確定住所の新規追加を行なう(ステップS32)。
【0069】
ステップS32の新規追加処理が終了した場合、あるいは、ステップS31における判断の結果、登録されていた場合、蓄積部31の該当途中確定住所41に対し画像42を登録し(ステップS33)、図4における累積回数43を「+1」し(ステップS34)、当該蓄積処理を終了する。
【0070】
次に、ステップS14,S18,S25における蓄積データ更新処理について図7を参照して説明する。
【0071】
まず、蓄積部31にて前方一致する途中確定住所を検索する(ステップ41)。たとえば、前記例で言えば、「川崎市 幸区 小向○○町 1−2−5」までマッチし、その下が認識されていない場合、ここで検索する途中確定住所は、「川崎市」、「川崎市 幸区」、「川崎市 幸区 小向○○町」の3つとなる。
【0072】
ステップS41における検索の結果、前方一致する途中確定住所が見つかった場合、見つかった途中確定住所における累積回数43(図4参照)を「+1」して(ステップS42)、ステップS41に戻り、他に前方一致する途中確定住所がないか検索を続ける。
【0073】
ステップS41における検索の結果、前方一致する途中確定住所が見つからなかった場合は、当該蓄積データ更新処理を終了する。
【0074】
次に、住所DB登録装置5における未登録データ登録処理について図8を参照して説明する。
【0075】
まず、制御部35は、蓄積部31の画像の中から未登録データの記載されている可能性の高い画像を検出する(ステップS51)。この検出方法は様々に考えられる。たとえば、図4における累積回数43の値そのものを用いてもよいし、累積回数43と累積回数44との比の値を用いてもよい。
また、上記値について、先月からの増分が大きいものをもって検出結果としてもよいし、ある月の値そのものが大きいものをもって検出結果としてもよい。
また、検出結果は、上位n個を順に選択してもよいし、所定の閾値以上のものを順に選択してもよいし、上位n個以内かつ所定の閾値以上のものを順に選択してもよい。閾値は全データ共通でもよいし、住所の階層ごとに別にしてもよいし、さらには、各途中確定住所で別々にしてもよい。
【0076】
また、図5におけるステップS24にて蓄積部31に保存された画像は、オペレータによる判断が行なわれたものであるため、ステップS17にて蓄積部31に保存された画像に比べ未登録データが含まれる可能性が非常に高い。そこで、ステップS24にて保存された画像とステップS17にて保存された画像は別々に集計し、ステップS24にて保存された画像を優先的に検出してもよい。
【0077】
次に、制御部35は、ステップS51において未登録データの記載されている可能性の高い画像が検出されたか否かを判断する(ステップS52)。この判断の結果、検出されなかった場合は当該未登録データ登録処理を終了する。
【0078】
ステップS52における判断の結果、検出された場合、制御部35は、その検出された画像を蓄積部31から取出して蓄積画像表示部32に表示する(ステップS53)。この場合、同じ途中確定住所に保存されている画像を複数取出して同時に表示してもよいし、オペレータの操作により別の画像に切換えられるようにしてもよい。
【0079】
オペレータは、蓄積画像表示部32に表示された画像を目視チェックすることにより、住所データベース19に登録すべき未登録データであると判断した場合に、未登録データ入力部33によりその未登録データを入力する(ステップS54)。
【0080】
次に、制御部35は、未登録データが入力された否かを判断し(ステップS55)、入力されなかった場合はステップ51に戻り、上記同様な動作を繰り返す。
ステップS55における判断結果、未登録データが入力された場合、その入力された未登録データは、データ登録部34により、住所データベース19の途中認識結果の下位階層に登録される(ステップS56)。
【0081】
なお、以上述べた住所データベース構築処理は、VCD22の処理結果および住所認識部18の処理結果をそれぞれ蓄積データ更新処理に利用した場合であるが、必ずしも両方の処理結果を蓄積データ更新処理に利用する必要はなく、少なくともいずれか一方の処理結果を蓄積データ更新処理に利用すればよい。
【0082】
たとえば、図5のフローチャートにおいて、ステップS24およびS25の処理がなくてもよい。これは、VCD22の処理結果を蓄積データ更新処理に利用しない場合に相当する。
【0083】
また、図5のフローチャートにおいて、ステップS16,S17およびS18の処理がなくてもよい。これは、住所認識部18の住所認識結果を蓄積データ更新処理に利用しない場合に相当する。
【0084】
また、図5のフローチャートにおいて、ステップS16における条件を更に限定してもよい。たとえば、氏名の手前までは認識できたが氏名のみ認識できなかった場合は、ステップS21におけるオペレータの判定を用いた方がより正確な判定ができるので、ステップS17ではなく直接ステップS19に進んでもよい。
【0085】
さらに、図5のフローチャートにおけるステップS20もしくはステップS21において、氏名以外のデータに対しても住所データベース19に存在するか否かの判断ができる場合、ステップS16からステップS17に進む条件を更に狭めてもよい。
【0086】
また、前記実施の形態では、住所DB登録装置5が区分機本体3とセットになっている場合について説明したが、必ずしも区分機本体3とセットになっている必要はなく、住所DB登録装置5を区分機本体3と離れた遠隔地に設置し、ネットワークを介して区分機本体3(住所認識部18および住所データベース19)に接続した構成としても同様に実施できる。
さらに、1つの住所DB登録装置5が複数の区分機本体3と接続された構成としてもよい。
【符号の説明】
【0087】
P…紙葉類、1…紙葉類処理装置、3…区分機本体、4…ビデオコーディングシステム(VCS)、5…住所データベース登録装置(住所DB登録装置)、10…オペレーションパネル、11…供給部、12…主搬送路、13…バーコードリーダ(BCR)、14…スキャナ、15…バーコードライタ(BCW)、16…区分部、17…区分制御部、18…住所認識部(住所認識手段)、19…住所データベース(住所DB)、21…画像蓄積分配装置、22…ビデオコーディングディスク(VCD)、23…画像表示部(画像表示手段)、24…住所入力部(住所入力手段)、25…判定入力部(判定入力手段)、31…蓄積部(蓄積手段)、32…蓄積画像表示部(蓄積画像表示手段)、33…未登録データ入力部(未登録データ入力手段)、34…データ登録部(データ登録手段)、35…制御部。

【特許請求の範囲】
【請求項1】
住所情報が含まれた画像を利用して住所データベースを構築する住所データベース構築装置において、
前記画像から前記住所データベースを利用して住所情報を認識する住所認識手段と、
この住所認識手段により住所情報の一部の認識に成功し残りの部分の認識に失敗した場合に、その画像を蓄積する蓄積手段と、
この蓄積手段に蓄積された画像を表示する蓄積画像表示手段と、
この蓄積画像表示手段により表示された画像に基づき、前記住所認識手段により認識に失敗した部分の住所情報を入力する未登録データ入力手段と、
この未登録データ入力手段より入力された住所情報を前記住所データベースに登録するデータ登録手段と、
を具備したことを特徴とする住所データベース構築装置。
【請求項2】
住所情報が含まれた画像を利用して住所データベースを構築する住所データベース構築装置において、
前記画像から前記住所データベースを利用して住所情報を認識する住所認識手段と、
この住所認識手段により住所情報の認識に失敗した画像を表示する画像表示手段と、
この画像表示手段により表示される画像に含まれる住所情報を入力する住所入力手段と、
この住所入力手段により入力された住所情報が前記住所データベースに登録されているか否かの判定を入力する判定入力手段と、
この判定入力手段により登録されていないと判定入力された場合に前記画像を蓄積する蓄積手段と、
この蓄積手段に蓄積された画像を表示する蓄積画像表示手段と、
この蓄積画像表示手段により表示された画像に基づき、前記住所情報のうち前記住所入力手段により入力されていない部分の一部または全部の住所情報を入力する未登録データ入力手段と、
この未登録データ入力手段より入力された住所情報を前記住所データベースに登録するデータ登録手段と、
を具備したことを特徴とする住所データベース構築装置。
【請求項3】
住所情報が含まれた画像を利用して住所データベースを構築する住所データベース構築装置において、
前記画像から前記住所データベースを利用して住所情報を認識する住所認識手段と、
この住所認識手段により住所情報の認識に失敗した画像を表示する画像表示手段と、
この画像表示手段により表示される画像に含まれる住所情報を入力する住所入力手段と、
この住所入力手段により入力された住所情報が前記住所データベースに登録されているか否かの判定を入力する判定入力手段と、
前記住所認識手段により住所情報の一部の認識に成功し残りの部分の認識に失敗した画像あるいは判定入力手段により登録されていないと判定入力された画像を蓄積する蓄積手段と、
この蓄積手段に蓄積された画像を表示する蓄積画像表示手段と、
この蓄積画像表示手段により表示された画像に基づき、前記住所認識手段により認識に失敗した部分の住所情報を入力する未登録データ入力手段と、
この未登録データ入力手段より入力された住所情報を前記住所データベースに登録するデータ登録手段と、
を具備したことを特徴とする住所データベース構築装置。
【請求項4】
前記住所認識手段により認識に成功した住所情報の途中までの階層あるいは住所入力手段により入力された住所情報を確定住所として前記画像と対応付けて前記蓄積手段に蓄積することを特徴とする請求項1〜3のいずれかに記載の住所データベース構築装置。
【請求項5】
前記蓄積手段、前記蓄積画像表示手段、前記未登録データ入力手段および前記データ登録手段は1つの住所データベース登録装置を構成し、この住所データベース登録装置がネットワークを介して前記住所認識手段および前記住所データベースに接続されていることを特徴とする請求項1〜4のいずれかに記載の住所データベース構築装置。
【請求項6】
前記確定住所の累積回数も前記蓄積手段に蓄積することを特徴とする請求項4または請求項5記載の住所データベース構築装置。
【請求項7】
前記確定住所の累積回数をあらかじめ定められた期間ごとに前記蓄積手段に蓄積することを特徴とする請求項6記載の住所データベース構築装置。
【請求項8】
前記確定住所を含み更に他の部分も認識に成功した累積回数も前記蓄積手段に蓄積することを特徴とする請求項6または請求項7記載の住所データベース構築装置。
【請求項9】
前記累積回数が最大もしくは所定の閾値を超えた確定住所に対応する画像を前記蓄積画像表示手段に表示することを特徴とする請求項6または請求項7記載の住所データベース構築装置。
【請求項10】
前記確定住所の累積回数と前記確定住所を含み更に他の部分も認識に成功した累積回数との比が最大もしくは所定の閾値を超えた確定住所に対応する画像を前記蓄積画像表示手段に表示することを特徴とする請求項8記載の住所データベース構築装置。
【請求項11】
前記確定住所の累積回数、もしくは前記確定住所の累積回数と前記確定住所を含み更に他の部分も認識に成功した累積回数との比について、前期間からの増加度合いが所定の閾値を超えた確定住所に対応する画像を前記蓄積画像表示手段に表示することを特徴とする請求項7または請求項8記載の住所データベース構築装置。
【請求項12】
前記蓄積画像表示手段に確定住所が同一の画像を複数同時に表示することを特徴とする請求項4〜11のいずれかに記載の住所データベース構築装置。
【請求項13】
住所情報が含まれた画像を利用して住所データベースを構築する住所データベース構築方法において、
前記画像から前記住所データベースを利用して住所情報を認識する住所認識ステップと、
この住所認識ステップにより住所情報の一部の認識に成功し残りの部分の認識に失敗した場合に、その画像を蓄積手段に蓄積する画像蓄積ステップと、
前記蓄積手段に蓄積された画像を蓄積画像表示手段に表示する蓄積画像表示ステップと、
前記蓄積画像表示手段に表示された画像に基づき、前記住所認識ステップにより認識に失敗した部分の住所情報を入力する未登録データ入力ステップと、
この未登録データ入力ステップより入力された住所情報を前記住所データベースに登録するデータ登録ステップと、
を具備したことを特徴とする住所データベース構築方法。
【請求項14】
住所情報が含まれた画像を利用して住所データベースを構築する住所データベース構築方法において、
前記画像から前記住所データベースを利用して住所情報を認識する住所認識ステップと、
この住所認識ステップにより住所情報の認識に失敗した画像を画像表示手段に表示する画像表示ステップと、
前記画像表示手段に表示された画像に含まれる住所情報を入力する住所入力ステップと、
この住所入力ステップにより入力された住所情報が前記住所データベースに登録されているか否かの判定を入力する判定入力ステップと、
この判定入力ステップにより登録されていないと判定入力された場合に前記画像を蓄積手段に蓄積する画像蓄積ステップと、
前記蓄積手段に蓄積された画像を蓄積画像表示手段に表示する蓄積画像表示ステップと、
前記蓄積画像表示手段に表示された画像に基づき、前記住所情報のうち前記住所入力ステップにより入力されていない部分の一部または全部の住所情報を入力する未登録データ入力ステップと、
この未登録データ入力ステップより入力された住所情報を前記住所データベースに登録するデータ登録ステップと、
を具備したことを特徴とする住所データベース構築方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate


【公開番号】特開2011−197823(P2011−197823A)
【公開日】平成23年10月6日(2011.10.6)
【国際特許分類】
【出願番号】特願2010−61539(P2010−61539)
【出願日】平成22年3月17日(2010.3.17)
【出願人】(000003078)株式会社東芝 (54,554)
【Fターム(参考)】