情報処理装置
【課題】オペレータの負担を軽減しつつ高性能な認識処理を実現できるようにする。
【解決手段】データベース検索処理部102は、オペレータが入力装置13を通じて入力する郵便番号等に相当する第1の文字列を検索キーとして、住所データベースに記憶されている情報の中から住所に相当する第2の文字列を検索する。文字認識処理部104は、文字辞書記憶部103に記憶されている文字辞書を用いて、書状画像の中の所定の領域に対する文字認識を行い、氏名もしくは名称、電話番号、郵便番号、住所などを含む文字列の候補をそれぞれ生成する。文字画像選択処理部105は、生成された候補の中から、データベース検索処理部102によって検索された第2の文字列に該当する文字列を選択する。文字画像記憶部106は、選択された文字列を構成する個々の文字とその文字画像との対応関係を記憶する。文字辞書学習処理部107は、記憶された個々の文字とその文字画像との対応関係を用いて、文字辞書に対する学習処理を実行する。
【解決手段】データベース検索処理部102は、オペレータが入力装置13を通じて入力する郵便番号等に相当する第1の文字列を検索キーとして、住所データベースに記憶されている情報の中から住所に相当する第2の文字列を検索する。文字認識処理部104は、文字辞書記憶部103に記憶されている文字辞書を用いて、書状画像の中の所定の領域に対する文字認識を行い、氏名もしくは名称、電話番号、郵便番号、住所などを含む文字列の候補をそれぞれ生成する。文字画像選択処理部105は、生成された候補の中から、データベース検索処理部102によって検索された第2の文字列に該当する文字列を選択する。文字画像記憶部106は、選択された文字列を構成する個々の文字とその文字画像との対応関係を記憶する。文字辞書学習処理部107は、記憶された個々の文字とその文字画像との対応関係を用いて、文字辞書に対する学習処理を実行する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、住所情報が記載された書状の画像を取り込んで文字認識処理を行う情報処理装置に関し、特に、文字認識処理に使用される文字辞書等の学習を行うことが可能な情報処理装置に関する。
【背景技術】
【0002】
郵便物などの書状上に記載された文字の認識を行う文字認識処理においては、一般に、画像から切り出した文字パターンを予め用意した文字辞書と照合し、文字辞書に登録されている文字のうち最も可能性の高いものを文字認識結果として得る。
【0003】
文字辞書を作成するためには、各文字に対して1つまたは複数個の文字画像を用意し、それを用いて辞書学習を行う。各文字に対して用意する文字画像の数が多ければ、より高性能な文字辞書を作成することが可能となる。文字辞書の改良を行う場合は、新たな文字画像を追加するか、もしくは一部の文字画像を差し替えてから辞書学習をやり直す。
【0004】
また、文字画像を作成するためには、文字列を含んでいる画像に対してオペレータが1文字ずつ手で文字領域を指定してその部分の画像を文字画像として保存することを繰り返す必要がある。ある程度文字認識処理技術が発達してからは、ツールを用いることにより、画像から文字を自動的に切り出して、モニタ画面上に各文字画像を表示し、オペレータが各文字画像に対応する文字列を指定する方法も採られるようになった。
【0005】
例えば、特許文献1には、リジェクトされた書状に記載された文字パターンに対し、オペレータが文字入力を行った後、文字パターンと正解文字コードとの対応関係に基づき、文字辞書の更新を行うことが開示されている。また、特許文献2には、リジェクトされた書状に記載された宛名の文字パターンに対し、オペレータが文字入力を行った後、宛名の文字パターンと正解宛名コードとの対応関係に基づき、宛名の知識データベースの更新を行うことが開示されている。
【特許文献1】特開平9−57203号公報
【特許文献2】特開平9−57204号公報
【発明の開示】
【発明が解決しようとする課題】
【0006】
しかしながら、文字認識に使用される文字辞書を作成するためには、従来、書状の画像から複数の文字画像を切り出した後、オペレータは文字画像毎に正しい文字列を逐一入力しなければならない。このため、オペレータの負担は大きく、作業にかかる時間やコストも大きい。また、オペレータが入力した情報を元に学習処理を行っただけでは、文字辞書や知識データベースの性能を向上させることは難しい。
【0007】
本発明は上記実情に鑑みてなされたものであり、オペレータの負担を軽減しつつ高性能な認識処理を実現する情報処理装置を提供することを目的とする。
【課題を解決するための手段】
【0008】
本発明に係る情報処理装置は、住所情報が記載された書状の画像を取り込んで文字認識処理を行う情報処理装置であって、書状の記載に使用される個々の住所に関する情報を記憶する住所情報記憶手段と、第1の文字列を検索キーとして、前記住所情報記憶手段に記憶されている情報の中から住所に相当する第2の文字列を検索する検索処理手段と、前記書状の記載に使用される個々の文字とその画像である文字画像との対応関係を示す文字辞書を記憶する文字辞書記憶手段と、前記文字辞書記憶手段に記憶されている前記文字辞書を用いて、前記画像の中の所定の領域に対する文字認識を行い、少なくとも住所を含む文字列の候補を生成する文字認識処理手段と、前記文字認識処理手段により生成された候補の中から、前記検索処理手段によって検索された前記第2の文字列に該当する文字列を選択する文字画像選択処理手段と、前記文字画像選択処理手段により選択された前記文字列を構成する個々の文字とその文字画像との対応関係を用いて、前記文字辞書記憶手段に記憶されている前記文字辞書に対する学習処理を実行する文字辞書学習処理手段とを具備することを特徴とする。
【発明の効果】
【0009】
本発明によれば、オペレータの負担を軽減しつつ高性能な認識処理を実現することができる。
【発明を実施するための最良の形態】
【0010】
この発明の実施の形態を図面に基づいて詳細に説明する。
図1は、この発明の各実施形態に共通して使用される区分機1を示す外観図であり、図2は区分機1の概略構成を示す図である。この区分機1は、大型の箱型状の区分機本体1aを有している。この区分機1は、郵便物(書状)Pの情報を読取り、その読取内容から宛名領域や貼付シールの領域などを認識し、この認識結果に基づいて該当する区分先に郵便物Pを区分するものである。
上記区分機本体1aには、供給部2と、スキャナ部3と、搬送部4と、区分部5と、収納部6とが設けられている。この供給部2からの郵便物Pが搬送路によって搬送されることにより、搬送部4、区分部5を順次介して収納部6に導かれる。
【0011】
上記供給部2は、郵便物Pを載置する載置台7と、この載置台7から郵便物Pを一通ずつ取り出して搬送路に送る取出し部8とを有している。上記スキャナ部3は、搬送路によって搬送される1通ずつの郵便物P上の全体の画像を光学的に読取って画像情報を生成する。上記搬送部4は、スキャナ部3を通過してきた郵便物Pを区分部5へ搬送する。上記収納部6は、郵便物Pを区分収納する多数の収納ポケット6aを有している。上記区分部5は、搬送部4から送られてくる郵便物Pをスキャナ部3からの画像情報に対する後述する認識結果に基づいて収納ポケット6a、…のいずれかに振り分ける。
【0012】
上記スキャナ部3は、郵便物P上を光学的に走査して光電変換することによりパターン信号として紙葉類上の情報を読取る読取手段であり、たとえば郵便物P上に光を照射する光源、およびその反射光を受けて電気信号に変換する自己走査形のCCDイメージセンサ等によって構成される。上記スキャナ部3の出力は情報処理部10中の認識部に供給される。
【0013】
上記区分機1において、上記供給部2、スキャナ部3、搬送部4、区分部5、情報処理部10は、制御部11に接続されている。この制御部11は、区分機1の全体の動作を制御する。たとえば、制御部11は図示しないメモリに記憶されている区分指定テーブルを用いて、上記情報処理部10での認識結果(もしくは判定結果)に対応する区分指定データを読出し、この読出した区分指定データ(収納ポケット6a、…のアドレス)に対応する収納ポケット6a、…に上記郵便物Pを搬送せしめるものである。
さらに、上記制御部11はドライバ(図示せず)により上記搬送路等の搬送機構部(図示せず)を駆動することにより、搬送系全体の制御を行うようになっている。
【0014】
以下の各実施形態では、上記情報処理部10に設けられる文字辞書等に対する効率的な学習処理を実現するための構成および動作の詳細について説明する。
【0015】
<第1の実施形態>
まず、本発明の第1の実施形態について説明する。
【0016】
図3は、この発明の第1の実施形態に係わる、オペレータが入力した文字列を元に郵便物に記載された宛先情報を認識するための文字辞書を自動学習させるシステムの構成を示すブロック図である。
【0017】
このシステムは、郵便物Pの書状画像を取り込むためのスキャナ部3と、取り込んだ画像を表示するためのディスプレイ12と、オペレータが入力作業を行うための入力装置13と、学習処理部100とを含んでいる。
【0018】
学習処理部100は、前述の情報処理部10により実現され、住所データベース101、データベース検索処理部102、文字辞書記憶部103、文字認識処理部104、文字画像選択処理部105、文字画像記憶部106、および文字辞書学習処理部107を有する。
【0019】
住所データベース101は、郵便物Pの記載に使用される個々の住所に関する情報を記憶するものである。
【0020】
データベース検索処理部102は、入力装置13を通じて入力される第1の文字列(氏名もしくは名称、電話番号、又は郵便番号など)を検索キーとして、住所データベース101に記憶されている情報の中から住所に相当する第2の文字列を検索するものである。
【0021】
文字辞書記憶部103は、郵便物Pの記載に使用される個々の文字とその画像である文字画像との対応関係を示す文字辞書を記憶するものである。この文字辞書には、一つの文字に対して複数の異なる種類の文字画像を対応付けて登録することが可能である。
【0022】
文字認識処理部104は、文字辞書記憶部103に記憶されている文字辞書を用いて、画像の中の所定の領域に対する文字認識を行い、氏名もしくは名称、電話番号、郵便番号、住所などに相当する文字列の候補をそれぞれ生成するものである。
【0023】
文字画像選択処理部105は、文字認識処理部104により生成された候補の中から、データベース検索処理部102によって検索された第2の文字列に該当する文字列を選択するものである。具体的には、この文字画像選択処理部105は、文字認識処理部104により生成された候補の中から、入力装置13を通じて入力された第1の文字列に該当する文字列を選択し、この選択した文字列が画像の中で位置している行に隣接する行の文字列の候補の中から、上記第2の文字列に該当する文字列を選択する。
【0024】
文字画像記憶部106は、文字画像選択処理部105によって選択された文字列を構成する個々の文字とその文字画像とを対応付けて記憶するものである。
【0025】
文字辞書学習処理部107は、文字画像記憶部106に記憶された個々の文字とその文字画像との対応関係を用いて、文字辞書記憶部103に記憶されている文字辞書に対する学習処理を実行するものである。
【0026】
次に、このような機能を備えたシステムにおける具体的な処理について説明する。
【0027】
スキャナ部3によって取り込まれた書状画像は、必要なデータ処理が施された後、ディスプレイ12の画面上に表示される。
【0028】
オペレータは、入力装置13から書状画像中に記載されている宛先情報の一部、例えば郵便番号情報を入力する。入力された情報は、学習処理部100内のデータベース検索処理部102に渡され、データベース検索処理部102は、その情報を検索キーとして住所データベース101を検索する。
【0029】
住所データベースに登録されている情報の例を図4および図5に示す。図4の例では、各郵便番号に対応する住所情報が登録されている。郵便番号に対応している住所情報は県名から町名までをひと固まりのデータとして扱う。また宛先住所が県名から書かれている場合と、県名が省略されて市町村名から記述されている場合の両方に対応する場合には、図5のように県名情報と市町村名情報とを別データとして扱っていてもよい。その場合には、例えば郵便番号情報として「2128501」を入力した時にデータベース検索結果として、「神奈川県川崎市幸区柳町」と「川崎市幸区柳町」の2つを返す。
【0030】
一方、文字認識処理部104は、スキャナ部3によって取り込まれた書状画像から、画像中から文字行および文字候補を切り出し、各文字候補をあらかじめ用意してある文字辞書記憶部103内の文字辞書を用いて認識する。書状画像の一例を図6に示す。
【0031】
文字認識処理部104では、図7の例に示すように1行につき複数通りの文字切り出し候補が発生する。しかし、オペレータが入力装置13から入力した情報は必ず画像中のどこかに記載されているので、入力情報と同一の認識結果を持つ文字行が存在するはずである。例えば図6に示した書状画像を見て、オペレータは宛先郵便番号「212−8501」を入力装置13から入力する。この時、文字認識処理部104は、書状画像から文字行を6行検出し、各文字行に対して文字切り出しおよび文字認識処理を実行する。文字切り出し候補の中に正しく切り出された文字画像が確実に含まれるようにするため、文字切り出し候補を1行に1通りしか生成するのではなく、切り出しアルゴリズムやパラメータを切り替えることによって複数組の文字切り出し候補を生成するようにすることが望ましい。本実施形態では、宛先郵便番号行「212−8501」に対し図7のように3通りの文字切り出し候補が作成されたものとする。
【0032】
文字画像選択処理部105は、文字切り出し候補の中から入力装置13から入力した情報と一致するものを検索し、見つかった文字切り出し候補の各画像とその文字種(文字コード等)とを文字画像記憶部106に記憶する。入力情報「212−8501」と一致する認識結果が得られるのは、宛先郵便番号行に対して文字切り出しおよび文字認識処理した結果得られた図7の3候補のうち一番上の候補だけなので、これらの文字画像および文字認識結果が文字画像記憶部106に記憶される。
【0033】
宛先住所郵便番号として「212−8501」が記載されていた場合、宛先郵便番号のすぐそばに記載されている宛先住所情報は住所データベース101で検索して得られた住所情報と一致しているはずである。よって宛先郵便番号行付近の行の文字切り出し結果および文字認識結果を「神奈川県川崎市幸区柳町」または「川崎市幸区柳町」と照合する。文字認識処理部104において宛先住所行を処理した時の文字切り出し候補および文字認識結果の一例を図8に示す。図8の例の場合、上から2番目の文字切り出し候補の認識結果が住所データベース101から郵便番号「212−8501」に対応する住所情報として検索した結果「神奈川県川崎市幸区柳町」と一致するので、これらの文字画像および文字認識結果を文字画像記憶部106に記憶する。
【0034】
このように、1枚の書状画像を見てオペレータが宛先郵便番号を入力するだけで、宛先郵便番号行および宛先住所行を構成していた個々の文字画像とその文字種の情報を取得することができた。この作業を複数枚の書状画像について繰り返し、それぞれの郵便番号行および宛先住所行を構成する文字画像およびその文字種の情報を文字画像記憶部106に記憶する。
【0035】
こうして文字画像記憶部106に蓄積された文字画像情報は、オペレータが答え教え作業を実施していない時間帯に、文字辞書学習処理部107により処理される。文字辞書学習処理部107では、各文字画像は文字の種類ごとに分類され、文字辞書記憶部103内の文字辞書の学習処理に使用される。学習処理完了後は、例えば、更新された文字辞書で従来の文字辞書を置き換える。
【0036】
なお、郵便物には明朝体などの活字が印刷される場合もあれば、草書体やペン字で手書き文字が書かれている場合もある。このため、文字画像記憶部106に記憶される文字の中には、例えば同じ「朝」を表す文字であっても、種々なカテゴリの文字が記憶されることがあり得る。文字画像記憶部106の中に、文字辞書としてまだ登録されていない種類の文字に相当する文字画像がある場合には、その文字画像と該当する文字との対応付けが文字辞書に追加登録されることになる。例えば、図9に示すように、文字辞書において「朝」の文字コード03611に対し明朝体に相当する文字画像を対応付ける登録が済んでいる状態で、明朝体とはカテゴリが異なる草書体やペン字に該当する文字画像が文字画像記憶部106に記憶された場合には、当該画像も「朝」の文字コード03611に対応するものとして追加登録されることになる。
【0037】
次に、図10のフローチャートを参照して、本実施形態におけるシステムの動作について説明する。
【0038】
書状画像がスキャナ部3を通じて取り込まれると、その画像に必要な処理が施された後、ディスプレイ12の画面上に表示される(ステップS11)。
【0039】
ディスプレイに表示される書状画像を見たオペレータが第1の文字列(郵便番号等)を入力すると、データベース検索処理部102がその文字列を取得する(ステップS12)。
【0040】
データベース検索処理部102においては、第1の文字列を検索キーとして、住所データベース101から、住所を示す第2の文字列が検索される(ステップS13)。
【0041】
一方、文字認識処理部104においては、画像からの文字の切り出し、文字辞書を用いた文字認識、文字列の候補の生成が行われる(ステップS14)。
【0042】
文字画像選択処理部105においては、文字認識処理部104にて生成された文字列の候補の中から、第1の文字列に該当する文字列が選択され(ステップS15)、次いで、選択された文字列が画像の中で位置している行に隣接する行の文字列の候補の中から、データベース検索処理部102で得られた第2の文字列に該当する文字列が選択される(ステップS16)。
【0043】
文字画像記憶部106においては、文字画像選択処理部105で選択された各文字列を構成する個々の文字とその文字画像とが記憶される(ステップS17)。
【0044】
文字辞書学習処理部107においては、文字画像記憶部106に記憶された個々の文字とその文字画像との関係を用いた文字辞書学習が実行される(ステップS18)。
【0045】
次に、図11のフローチャートを参照して、図10中のステップS18(文字学習処理)における詳細な処理を説明する。
【0046】
文字画像記憶部106に記憶されたn個の文字(i=1〜n)とその文字画像が順次読み出され(ステップS1)、1文字単位で、順番に以下のような処理が行われる。
【0047】
所定の記憶領域を使用して、検討対象の文字の番号を表す変数iを1にセットする(ステップS2)。
【0048】
変数iがnを超えているか、即ち、全ての文字に対する検討が完了しているか否かが判別される(ステップS3)。完了していなければ(ステップS3のNo)、検討対象であるi番目の文字及びその文字画像と、文字辞書との比較が行われ(ステップS4)、該当する文字が文字辞書に存在するか否かが判別される(ステップS5)。該当する文字が存在しなければ(ステップS5のNo)、検討対象であるi番目の文字とその文字画像との組合せが新規なものとして、文字辞書に登録される(ステップS6)。そして、所定の記憶領域上の変数iに1が加算され、ステップS3からの処理が繰り返される。
【0049】
一方、ステップS5において該当する文字が存在していれば(ステップS5のYes)、その文字と類似した文字画像も文字辞書に存在しているか否かが判別される(ステップS7)。文字画像も存在していれば、登録済みであるため、新規登録は行われない。そして、所定の記憶領域上の変数iに1が加算され、ステップS3からの処理が繰り返される。
【0050】
また、ステップS5において該当する文字が存在し(ステップS5のYes)、且つ、ステップS7において類似する文字画像が存在しない場合には(ステップS7のNo)、登録済みの文字画像とはカテゴリが違う文字画像であるものとみなされ、検討対象であるi番目の文字とその文字画像との組合せが新規なものとして、文字辞書に追加登録される(ステップS8)。なお、同じ文字に対応する登録済みの方の文字画像が不要となる場合には、この文字画像に対して新規な文字画像を上書きする更新処理を行うようにしてもよい。そして、所定の記憶領域上の変数iに1が加算され、ステップS3からの処理が繰り返される。
【0051】
なお、図11で説明した処理は、後述する他の実施形態にも適用できるものである。
【0052】
このように第1の実施形態によれば、オペレータが入力した文字列をキーワードとして住所データベースを検索し、それに該当する住所情報を取り出し、その住所情報と一致する文字認識結果を選択して、そのときの各文字候補の記載位置から文字パターンの切り出しを行って、その結果を文字辞書学習に使用している。また、オペレータが入力しなかった文字についても文字辞書学習を行っており、かつ、オペレータが入力した情報を元に文字切り出し位置を特定している。これにより、文字切り出し作業および文字辞書学習を自動化することができ、高性能な文字辞書を容易に形成することができる。
【0053】
<第2の実施形態>
次に、本発明の第2の実施形態について説明する。
【0054】
図12は、この発明の第2の実施形態に係わる、オペレータが答え教えすることなく、郵便物に記載された宛先情報を認識するための文字辞書を自動学習させるシステムの構成を示すブロック図である。
【0055】
このシステムは、郵便物Pの書状画像を取り込むためのスキャナ部3と、学習処理部200とを含んでいる。本実施形態でも、図6に示した郵便画像が入力された場合を例にとって説明する。
【0056】
学習処理部200は、前述の情報処理部10により実現され、住所データベース201、文字辞書記憶部202、文字認識処理部(A)203、文字認識処理部(B)204、データベース検索処理部205、文字画像選択処理部206、文字画像記憶部207、および文字辞書学習処理部208を有する。
【0057】
住所データベース201は、郵便物Pの記載に使用される個々の住所に関する情報を記憶するものである。
【0058】
文字辞書記憶部202は、郵便物Pの記載に使用される個々の文字とその画像である文字画像との対応関係を示す文字辞書を記憶するものである。この文字辞書には、一つの文字に対して複数の異なる種類の文字画像を対応付けて登録することが可能である。
【0059】
文字認識処理部(A)203は、文字辞書記憶部202に記憶されている文字辞書を用いて、画像の中の所定の領域に対する文字認識を行い、第1の文字列(氏名もしくは名称、電話番号、又は郵便番号など)の候補を生成するものである。
【0060】
文字認識処理部(B)204は、上記第1の文字列の画像上で位置する行に隣接する行から、住所に相当する第2の文字列の候補をそれぞれ生成するものである。
【0061】
データベース検索処理部205は、文字認識処理部(A)203により生成された第1の文字列(氏名もしくは名称、電話番号、又は郵便番号など)を検索キーとして、住所データベース101に記憶されている情報の中から住所に相当する第2の文字列を検索するものである。
【0062】
文字画像選択処理部206は、文字認識処理部(B)204により生成された候補の中から、データベース検索処理部205によって検索された第2の文字列に該当する文字列を選択するものである。
【0063】
文字画像記憶部207は、文字画像選択処理部206によって選択された文字列を構成する個々の文字とその文字画像とを対応付けて記憶するものである。
【0064】
文字辞書学習処理部208は、文字画像記憶部207に記憶された個々の文字とその文字画像との対応関係を用いて、文字辞書記憶部202に記憶されている文字辞書に対する学習処理を実行するものである。
【0065】
次に、このような機能を備えたシステムにおける具体的な処理について説明する。
【0066】
文字認識処理部(A)203は、スキャナ部3によって取り込まれた書状画像から、文字行および文字候補を切り出し、各文字候補をあらかじめ用意してある文字辞書記憶部202内の文字辞書を用いて認識する。そして特定の特徴を持つ文字列を検出する。特定の特徴を持つ文字列としては、例えば郵便番号を使用する。郵便番号を使用する場合は、7桁の数字が並んでいる文字行を画像上から検出する。図6の書状画像の場合、行「212−8501」と行「001−0000」が検出される。
【0067】
文字認識処理部(A)203によって検出された文字列は、データベース検索処理部205に渡される。データベース検索処理部205は、その情報を検索キーとして住所データベース201を検索する。住所データベース201に登録されている情報が図4に示したものであった場合、「212−8501」に対する検索結果は「神奈川県川崎市幸区柳町」、「001−0000」に対する検索結果は「北海道札幌市北区」となる。
【0068】
郵便番号として認識できない行や、郵便番号として読めても住所データベース201に登録されていなかった行は郵便番号行ではなかったと判断する。
【0069】
郵便番号行が見つかった場合は、その郵便番号行に隣接する行を文字認識処理部(B)204で処理する。文字認識処理部(B)204では、文字候補を切り出し、各文字候補をあらかじめ用意してある文字辞書記憶部202内の文字辞書を用いて認識する。
【0070】
文字画像選択処理部206では、文字認識処理部(B)204で検出した文字切り出し候補の中から住所データベース101で検索して得られた住所情報と一致する結果がないかを調べる。例えば郵便番号行として「212−8501」を文字認識処理部(A)203が検出した場合、図4に示したデータベースから住所情報「神奈川県川崎市幸区柳町」を取得し、文字認識処理部(B)204の文字切り出しおよび文字認識結果の中にこれと一致するものがないかを照合する。文字認識処理部(B)204の処理結果が図8に示したものであった場合、照合の結果上から2番目の文字切り出しおよび文字認識結果が選択され、これらの文字画像および文字認識結果が文字画像記憶部207に記憶される。
【0071】
このように、1枚の書状画像に必ず記載されている情報、例えば郵便番号を検出することで、郵便番号行および住所行を構成していた個々の文字画像とその文字種の情報を取得することができた。この作業を複数枚の書状画像について繰り返し、それぞれの郵便番号行および住所行を構成する文字画像およびその文字種の情報を文字画像記憶部207に記憶する。
【0072】
こうして文字画像記憶部207に蓄積された文字画像情報は、書状画像認識処理を実施していない時間帯に、文字辞書学習処理部208により処理される。文字辞書学習処理部208では、各文字画像は文字の種類ごとに分類され、文字辞書記憶部202内の文字辞書の学習処理に使用される。学習処理完了後は、例えば、更新された文字辞書で従来の文字辞書を置き換える。
【0073】
上記の説明では、検索キーとして郵便番号を用いて住所検索を行える情報を有する住所データベースの例を取り上げたが、代わりに、図13のように、検索キーとして氏名を用いて住所検索を行える情報を有する住所データベースを採用してもよいし、あるいは、図14のように、検索キーとして電話番号を用いて住所検索を行える情報を有する住所データベースを採用してもよい。
【0074】
次に、図15のフローチャートを参照して、本実施形態におけるシステムの動作について説明する。
【0075】
書状画像がスキャナ部3を通じて取り込まれると(ステップS21)、文字認識処理部(A)203において、画像からの文字の切り出し、文字辞書を用いた文字認識、文字列の候補の生成が行われ、特に、第1の文字列(郵便番号等)の候補が生成される(ステップS22)。
【0076】
一方、データベース検索処理部205においては、文字認識処理部(A)203で生成された第1の文字列を検索キーとして、住所を示す第2の文字列が検索される(ステップS23)。
【0077】
文字認識処理部(B)204においては、文字認識処理部(A)203で生成された第1の文字列が画像の中で位置している行に隣接する行の文字列が認識され、その文字列の候補が生成される。次いで、文字画像選択処理部206において、その生成された候補の中から、データベース検索処理部205で得られた第2の文字列に該当する文字列が選択される(ステップS24)。
【0078】
文字画像記憶部207においては、文字画像選択処理部206で選択された各文字列を構成する個々の文字とその文字画像とが記憶される(ステップS25)。
【0079】
文字辞書学習処理部208においては、文字画像記憶部207に記憶された個々の文字とその文字画像との関係を用いた文字辞書学習が実行される(ステップS26)。
【0080】
このように第2の実施形態によれば、オペレータが入力装置から郵便番号情報などを入力しなくても、郵便物の記載内容などに基づいて自動的に学習処理が行われるため、オペレータに手間をかけることなく、高性能な文字辞書を容易に形成することができる。
【0081】
なお、ここまで説明した第1の実施形態における文字辞書の学習処理のための構成および動作、もしくは第2の実施形態における文字辞書の学習処理のための構成および動作は、後述する第3の実施形態や第4の実施形態にも適用することができる。
【0082】
<第3の実施形態>
次に、本発明の第3の実施形態について説明する。
【0083】
図16は、この発明の第3の実施形態に係わる、オペレータが入力した文字列を元に郵便物に記載された宛先情報記載領域の標準位置を自動学習させるシステムの構成を示すブロック図である。
【0084】
このシステムは、郵便物Pの書状画像を取り込むためのスキャナ部3と、取り込んだ画像を表示するためのディスプレイ12と、オペレータが入力作業を行うための入力装置13と、学習処理部300とを含んでいる。
【0085】
学習処理部300は、前述の情報処理部10により実現され、住所データベース301、データベース検索処理部302、文字辞書記憶部303、宛先住所領域パラメータ記憶部304、宛先住所領域判定処理部305、文字認識処理部306、文字画像選択処理部307、宛先住所領域情報記憶部308、および宛先住所領域パラメータ学習処理部309を有する。
【0086】
住所データベース301は、郵便物Pの記載に使用される個々の住所に関する情報を記憶するものである。
【0087】
データベース検索処理部302は、入力装置13を通じて入力される第1の文字列(氏名もしくは名称、電話番号、又は郵便番号など)を検索キーとして、住所データベース301に記憶されている情報の中から住所に相当する第2の文字列を検索するものである。
【0088】
文字辞書記憶部303は、郵便物Pの記載に使用される個々の文字とその画像である文字画像との対応関係を示す文字辞書を記憶するものである。この文字辞書には、一つの文字に対して複数の異なる種類の文字画像を対応付けて登録することが可能である。
【0089】
宛先住所領域パラメータ記憶部304は、画像の中の宛先住所の領域を示す宛先住所領域情報(パラメータ)を記憶するものである。
【0090】
宛先住所領域判定処理部305は、宛先住所領域パラメータ記憶部304に記憶されている宛先住所領域情報(パラメータ)に基づいて、文字認識処理部306が文字認識を行うべき領域を判定するものである。
【0091】
文字認識処理部306は、文字辞書記憶部303に記憶されている文字辞書を用いて、宛先住所領域判定処理部305によって判定された領域に対する文字認識を行い、氏名もしくは名称、電話番号、郵便番号、住所などに相当する文字列の候補をそれぞれ生成するものである。
【0092】
文字画像選択処理部307は、文字認識処理部306により生成された候補の中から、データベース検索処理部302によって検索された第2の文字列に該当する文字列を選択するものである。具体的には、この文字画像選択処理部307は、文字認識処理部306により生成された候補の中から、入力装置13を通じて入力された第1の文字列に該当する文字列を選択し、この選択した文字列が画像の中で位置している行に隣接する行の文字列の候補の中から、上記第2の文字列に該当する文字列を選択する。
【0093】
宛先住所領域情報記憶部308は、文字画像選択処理部307によって選択された第1の文字列及び第2の文字列の画像上の各領域を示す情報(パラメータ)を記憶するものである。
【0094】
宛先住所領域パラメータ学習処理部309は、宛先住所領域情報記憶部308に記憶された各領域を示す情報(パラメータ)に基づいて、宛先住所領域パラメータ記憶部304に記憶されている宛先住所領域情報(パラメータ)に対する学習処理を実行するものである。
【0095】
次に、このような機能を備えたシステムにおける具体的な処理について説明する。
【0096】
スキャナ部3によって取り込まれた書状画像は、必要なデータ処理が施された後、ディスプレイ12の画面上に表示される。
【0097】
オペレータは、入力装置13から書状画像中に記載されている宛先情報の一部、例えば郵便番号情報を入力する。入力された情報は、学習処理部300内のデータベース検索処理部302に渡され、データベース検索処理部302は、その情報を検索キーとして住所データベース301を検索する。
【0098】
住所データベースに登録されている情報の例を図4および図5に示す。図4の例では、各郵便番号に対応する住所情報が登録されている。郵便番号に対応している住所情報は県名から町名までをひと固まりのデータとして扱う。また宛先住所が県名から書かれている場合と、県名が省略されて市町村名から記述されている場合の両方に対応する場合には、図5のように県名情報と市町村名情報とを別データとして扱っていてもよい。その場合には、例えば郵便番号情報として「2128501」を入力した時にデータベース検索結果として、「神奈川県川崎市幸区柳町」と「川崎市幸区柳町」の2つを返す。
【0099】
一方、宛先住所領域判定処理部305は、スキャナ部3によって取り込まれた書状画像から、宛先住所領域パラメータ記憶部304に記憶されている宛先情報領域に関する各種パラメータを元に、書状画像中の宛名記載範囲を推定する。図17に宛名記載範囲推定処理の一例を示す。図17の(a)に示した書状画像に対し、宛先住所領域パラメータ記憶部304に記憶されているパラメータ情報を元に推定した宛名記載範囲が、図17の(b)の破線枠で囲んで領域である。
【0100】
文字認識処理部306は、書状画像の宛名記載範囲と推定した範囲(図17の(b))から、文字行および文字候補を切り出し、各文字候補をあらかじめ用意してある文字辞書記憶部303内の文字辞書を用いて認識する。図17の(c)は、宛名記載範囲内から行を切り出した状態の例である。そしてオペレータが入力装置13から入力した文字列、例えば宛先郵便番号と一致する文字列を検出する。図17の(c)の書状画像の場合、行「212−8501」が検出される。
【0101】
宛先住所郵便番号として「212−8501」を検出した時、宛先郵便番号のすぐそばに記載されている宛先住所情報は住所データベース301で検索して得られた住所情報と一致しているはずである。よって文字画像選択処理部307において、宛先郵便番号行付近の行の文字切り出し結果および文字認識結果を「神奈川県川崎市幸区柳町」または「川崎市幸区柳町」と照合する。文字認識処理部306で宛先住所行を処理した時の文字切り出し候補および文字認識結果の一例を図8に示す。図8の例の場合、上から2番目の文字切り出し候補の認識結果が住所データベース301から郵便番号「212−8501」に対応する住所情報として検索した結果「神奈川県川崎市幸区柳町」と一致するので、この行が宛先住所行であることが判明する。
【0102】
こうして宛先郵便番号行および宛先住所行の記載位置が検出されると、宛先住所領域情報記憶部308は、その書状における宛先情報記載領域に関する情報を記憶する。宛先情報記載領域を検出する方法としては、例えば図18に示すように、検出した宛先郵便番号行と宛先住所行の領域を統合することで宛先情報記載領域を検出する。
【0103】
このように、1枚の書状画像を見てオペレータが宛先郵便番号を入力するだけで、宛先住所情報が記載されている領域に関する情報を取得することができた。この作業を複数枚の書状画像について繰り返し、各書状の宛先情報記載領域の情報を宛先住所領域情報記憶部308に記憶する。
【0104】
こうして宛先住所領域情報記憶部308に蓄積された宛先情報領域に関する各種情報は、オペレータが答え教え作業を実施していない時間帯に、宛先住所領域パラメータ学習処理部309により処理される。宛先住所領域パラメータ学習処理部309では、宛先住所領域情報記憶部308に記憶された情報を元に、宛先情報の標準記載位置やサイズに関する情報を学習する。学習処理完了後は、更新されたパラメータで宛先住所領域パラメータ記憶部304に記憶されている内容を更新する。
【0105】
次に、図19のフローチャートを参照して、本実施形態におけるシステムの動作について説明する。
【0106】
書状画像がスキャナ部3を通じて取り込まれると(ステップS31)、宛名住所領域判定処理部305において、宛名住所領域情報(パラメータ)に基づく宛名住所領域の判定が行われる(ステップS32)。
【0107】
この後、宛名住所領域判定処理部305で判定された宛名住所領域に対し、前述の図10で説明したステップS12〜S16と同様の処理が、文字認識処理部306や文字画像選択処理部307などにおいて行われる。
【0108】
宛先住所領域情報記憶部308においては、文字画像選択処理部307で選択された各文字列の領域を統合した宛先住所領域の情報(パラメータ)が記憶される(ステップS33)。
【0109】
宛先住所領域パラメータ学習処理部309においては、宛先住所領域情報記憶部308に記憶された宛先住所領域の情報(パラメータ)を用いた宛先住所領域の標準位置の学習が実行される(ステップS34)。
【0110】
このように第3の実施形態によれば、文字辞書学習だけでなく、宛先住所領域の標準位置の学習に関しても自動化することができ、高精度な宛先住所領域情報を容易に形成することができる。
【0111】
<第4の実施形態>
次に、本発明の第4の実施形態について説明する。
【0112】
図20は、この発明の第4の実施形態に係わる、オペレータが入力した文字列を元に郵便物に記載された差出人ごとに差出人住所情報記載領域と宛先情報記載領域の標準位置を自動学習させるシステムの構成を示すブロック図である。
【0113】
このシステムは、郵便物Pの書状画像を取り込むためのスキャナ部3と、取り込んだ画像を表示するためのディスプレイ12と、オペレータが入力作業を行うための入力装置13と、学習処理部400とを含んでいる。
【0114】
学習処理部400は、前述の情報処理部10により実現され、住所データベース401、データベース検索処理部402、文字辞書記憶部403、差出人別書状書式情報記憶部404、宛先住所領域判定処理部405、文字認識処理部(A)406、文字画像選択処理部(A)407、宛先住所領域情報記憶部408、差出人住所領域判定処理部409、文字認識処理部(B)410、文字画像選択処理部(B)411、差出人住所領域情報記憶部412、および差出人別書状書式学習処理部413を有する。
【0115】
住所データベース401は、郵便物Pの記載に使用される個々の住所に関する情報を記憶するものである。
【0116】
データベース検索処理部402は、入力装置13を通じて入力される第1の文字列(氏名もしくは名称、電話番号、又は郵便番号など)を検索キーとして、住所データベース401に記憶されている情報の中から住所に相当する第2の文字列を検索するものである。
【0117】
文字辞書記憶部403は、郵便物Pの記載に使用される個々の文字とその画像である文字画像との対応関係を示す文字辞書を記憶するものである。この文字辞書には、一つの文字に対して複数の異なる種類の文字画像を対応付けて登録することが可能である。
【0118】
差出人別書状書式情報記憶部404は、差出人別に書状の書式が定義された差出人別書状書式情報を記憶するものである。
【0119】
宛先住所領域判定処理部405は、差出人別書状書式情報記憶部404に記憶されている差出人別書状書式情報に基づいて、文字認識処理部(A)406が文字認識を行うべき領域(宛先住所領域)を判定するものである。
【0120】
文字認識処理部(A)406は、文字辞書記憶部403に記憶されている文字辞書を用いて、宛先住所領域判定処理部405によって判定された領域(宛先住所領域)に対する文字認識を行い、氏名もしくは名称、電話番号、郵便番号、住所などに相当する文字列の候補をそれぞれ生成するものである。
【0121】
文字画像選択処理部(A)407は、文字認識処理部(A)406により生成された候補の中から、データベース検索処理部402によって検索された第2の文字列に該当する文字列を選択するものである。具体的には、この文字画像選択処理部(A)407は、文字認識処理部(A)406により生成された候補の中から、入力装置13を通じて入力された第1の文字列に該当する文字列を選択し、この選択した文字列が画像の中で位置している行に隣接する行の文字列の候補の中から、上記第2の文字列に該当する文字列を選択する。
【0122】
宛先住所領域情報記憶部408は、文字画像選択処理部(A)407によって選択された第1の文字列及び第2の文字列の画像上の各領域を示す情報を記憶するものである。
【0123】
差出人住所領域判定処理部409は、差出人別書状書式情報記憶部404に記憶されている差出人別書状書式情報に基づいて、文字認識処理部(B)410が文字認識を行うべき領域(差出人住所領域)を判定するものである。
【0124】
文字認識処理部(B)410は、文字辞書記憶部403に記憶されている文字辞書を用いて、差出人住所領域判定処理部409によって判定された領域(差出人住所領域)に対する文字認識を行い、氏名もしくは名称、電話番号、郵便番号、住所などに相当する文字列の候補をそれぞれ生成するものである。
【0125】
文字画像選択処理部(B)411は、文字認識処理部(B)410により生成された候補の中から、データベース検索処理部402によって検索された第2の文字列に該当する文字列を選択するものである。具体的には、この文字画像選択処理部(B)411は、文字認識処理部(B)410により生成された候補の中から、入力装置13を通じて入力された第1の文字列に該当する文字列を選択し、この選択した文字列が画像の中で位置している行に隣接する行の文字列の候補の中から、上記第2の文字列に該当する文字列を選択する。
【0126】
差出人住所領域情報記憶部412は、文字画像選択処理部(B)411によって選択された第1の文字列及び第2の文字列の画像上の各領域を示す情報を記憶するものである。
【0127】
差出人別書状書式学習処理部413は、宛先住所領域情報記憶部408に記憶された第1の文字列及び第2の文字列の画像上の各領域を示す情報、および、差出人住所領域情報記憶部412に記憶された第1の文字列及び第2の文字列の画像上の各領域を示す情報に基づいて、差出人別書状書式情報記憶部404に記憶されている差出人別書状書式情報に対する学習処理を実行するものである。
【0128】
次に、このような機能を備えたシステムにおける具体的な処理について説明する。
【0129】
スキャナ部3によって取り込まれた書状画像は、必要なデータ処理が施された後、ディスプレイ12の画面上に表示される。
【0130】
オペレータは、入力装置13から書状画像中に記載されている差出人情報の一部および宛先情報の一部、例えば郵便番号情報を入力する。入力された情報は学習処理部400内のデータベース検索処理部402に渡され、データベース検索処理部402は入力された差出人に関する入力情報を検索キーとして住所データベース401を検索し、差出人の住所情報を取得する。同様に、入力された受取人に関する入力情報を検索キーとして住所データベース401を検索し、受取人の住所情報を取得する。
【0131】
大量のダイレクトメールを発送したり、逆に大量のメールを受け取ったりする会社および個人に対しては専用の郵便番号が割り振られている場合がある。図21に特定の会社に対して固有の郵便番号が割り振られている例を示す。図21の例では、「××商事」に対して「1009999」という郵便番号が割り振られている。
【0132】
図20では差出人の住所情報検索と受取人の住所情報検索とで同一の住所データベースを使用しているが、別々の住所データベースを使用してもよい。例えば受取人については郵便番号で検索し、差出人については図22に示すような差出人名を検索キーとして住所データベースを使用する場合が考えられる。
【0133】
以下の説明では、差出人・受取人共に郵便番号を検索キーとして住所情報を検索する場合について述べることにする。
【0134】
図23に、オペレータが入力した差出人および受取人の郵便番号情報を元に住所データベース401を検索して住所情報を取得する流れを示す。オペレータは差出人の郵便番号と受取人の郵便番号とを入力装置13から入力する。しかし、同じ差出人からの大量のダイレクトメールを処理する場合には、差出人郵便番号情報は毎回入力する必要はない。そのような場合は、書状画像1枚分の処理が終わって次の書状画像を処理する際に、前に入力した差出人郵便番号の情報はクリアせずに残しておくと、受取人郵便番号を入力するだけで認識処理が開始できるので、効率が良くなる。
【0135】
差出人に関する入力情報は、差出人別書状書式情報記憶部404に渡される。差出人別書状書式情報記憶部404には、図24に示されるように、オペレータが差出人に関して入力した情報や、郵便番号を検索キーとして得られた差出人および受取人の住所情報が記載されている書状画像中の標準位置が記憶されている。スキャナ部3によって取り込まれた書状画像は宛先住所領域判定処理部405に送られる。宛先住所領域判定処理部405は、差出人別書状書式情報記憶部304に登録されている宛先領域情報のうち、オペレータが入力した差出人の郵便番号用に用意されている各種パラメータを元に、書状画像中の宛名記載範囲を推定する。
【0136】
書状画像の宛名記載範囲と推定した範囲から、文字認識処理部(A)406は文字行および文字候補を切り出し、各文字候補をあらかじめ用意してある文字辞書記憶部403内の文字辞書を用いて認識する。図17の(c)は宛名記載範囲内から行を切り出した状態の例である。そしてオペレータが入力装置13から入力した文字列、例えば宛先郵便番号と一致する文字列を検出する。図17の(c)の書状画像の場合、行「212−8501」が検出される。
【0137】
宛先住所郵便番号として「212−8501」を検出した時、宛先郵便番号のすぐそばに記載されている宛先住所情報は住所データベース401で検索して得られた住所情報と一致しているはずである。よって文字画像選択処理部(A)407で宛先郵便番号行付近の行の文字切り出し結果および文字認識結果を「神奈川県川崎市幸区柳町」または「川崎市幸区柳町」と照合する。認識結果と住所情報が一致した場合、この行が宛先住所行であることが判明する。
【0138】
こうして宛先郵便番号行および宛先住所行の記載位置が検出されると、宛先住所領域情報記憶部408でその書状における宛先情報記載領域に関する情報を記憶する。宛先情報記載領域を検出する方法としては、例えば図25に示すように、検出した宛先郵便番号行と宛先住所行の領域を統合することで宛先情報記載領域を検出する。
【0139】
同様の手順で、差出人住所領域判定処理部409で差出人住所情報記載範囲を推定し、文字認識処理部(B)410はその範囲の中から文字候補を切り出して個々の文字候補を認識し、文字画像選択処理部(B)411で差出人住所行を検出する。そして差出人住所領域情報記憶部412では図25に示すように、検出した差出人郵便番号行と差出人住所行の領域を統合することで差出人情報記載領域を検出する。
【0140】
このように、1枚の書状画像を見てオペレータが差出人および受取人の宛先郵便番号を入力するだけで、差出人および受取人の住所情報が記載されている領域に関する情報を取得することができた。この作業を複数枚の書状画像について繰り返し、差出人および受取人情報記載領域に関する情報を差出人ごとに分類して差出人別書状書式学習処理部413に記憶する。
【0141】
こうして宛先住所領域情報記憶部408および差出人住所領域情報記憶部412に蓄積された各種情報は、オペレータが答え教え作業を実施していない時間帯に、差出人別書状書式学習処理部413により、差出人ごとの書状書式に関する学習を行うために使用される。学習処理完了後は、更新されたパラメータで差出人別書状書式情報記憶部404に記憶されている内容を更新する。
【0142】
次に、図26のフローチャートを参照して、本実施形態におけるシステムの動作について説明する。
【0143】
書状画像がスキャナ部3を通じて取り込まれると(ステップS31)、以下のような処理が行われる。
【0144】
宛名住所領域判定処理部405において、差出人別書状書式情報の中の宛先住所領域情報(パラメータ)に基づく宛先住所領域の判定が行われる(ステップS42A)。
【0145】
この後、宛名住所領域判定処理部405で判定された宛先住所領域に対し、前述の図10で説明したステップS12〜S16と同様の処理が、文字認識処理部(A)406や文字画像選択処理部(A)407などにおいて行われる。
【0146】
宛先住所領域情報記憶部408においては、文字画像選択処理部(A)407で選択された各文字列の領域を統合した宛先住所領域の情報(パラメータ)が記憶される(ステップS43A)。
【0147】
一方、差出人住所領域判定処理部409において、差出人別書状書式情報の中の差出人住所領域情報(パラメータ)に基づく差出人住所領域の判定が行われる(ステップS42B)。
【0148】
この後、差出人住所領域判定処理部409で判定された差出人住所領域に対し、前述の図10で説明したステップS12〜S16と同様の処理が、文字認識処理部(B)410や文字画像選択処理部(B)411などにおいて行われる。
【0149】
差出人住所領域情報記憶部412においては、文字画像選択処理部(B)411で選択された各文字列の領域を統合した差出人住所領域の情報(パラメータ)が記憶される(ステップS43B)。
【0150】
差出人別書状書式学習処理部413においては、宛先住所領域情報記憶部408に記憶された宛先住所領域の情報(パラメータ)および差出人住所領域情報記憶部412に記憶された差出人住所領域の情報(パラメータ)を用いた、差出人別書状書式中の宛先住所領域の標準位置および差出人住所領域の標準位置の学習が実行される(ステップS44)。
【0151】
このように第4の実施形態によれば、文字辞書学習や、宛先住所領域の標準位置の学習だけでなく、差出人住所領域の標準位置の学習に関しても自動化することができ、高精度な差出人別書状書式情報を容易に形成することができる。
【0152】
上述した各実施形態で述べた各種の処理手順は、コンピュータプログラムとして、コンピュータにより読み取り可能な記憶媒体(例えば磁気ディスク,光ディスク,半導体メモリ)に記憶させておき、必要に応じてそれをプロセッサにより読み出して実行するようにしてもよい。また、このようなコンピュータプログラムは、通信媒体を介してあるコンピュータから他のコンピュータに伝送することにより配布することも可能である。
【0153】
本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。
【図面の簡単な説明】
【0154】
【図1】この発明の各実施形態に共通して使用される区分機を示す外観図。
【図2】図1に示される区分機の概略構成を示す図。
【図3】この発明の第1の実施形態に係わる、オペレータが入力した文字列を元に郵便物に記載された宛先情報を認識するための文字辞書を自動学習させるシステムの構成を示すブロック図。
【図4】住所データベースに登録されている情報の第1の例。
【図5】住所データベースに登録されている情報の第2の例。
【図6】書状画像の一例を示す図。
【図7】1行につき複数通りの文字切り出し候補が発生することを示す図。
【図8】文字認識処理部において宛先住所行を処理した時の文字切り出し候補および文字認識結果の一例を示す図。
【図9】異なるカテゴリに相当する複数の文字画像が一つの文字コードに対応付けられて文字辞書に登録されることを示す図。
【図10】この発明の第1の実施形態におけるシステムの動作を示すフローチャート。
【図11】図10中のステップS18(文字学習処理)における詳細な処理を示すフローチャート。
【図12】この発明の第2の実施形態に係わる、オペレータが答え教えすることなく、郵便物に記載された宛先情報を認識するための文字辞書を自動学習させるシステムの構成を示すブロック図。
【図13】検索キーとして氏名を用いて住所検索を行える住所データベースの例を示す図。
【図14】検索キーとして電話番号を用いて住所検索を行える住所データベースの例を示す図。
【図15】この発明の第2の実施形態におけるシステムの動作を示すフローチャート。
【図16】この発明の第3の実施形態に係わる、オペレータが入力した文字列を元に郵便物に記載された宛先情報記載領域の標準位置を自動学習させるシステムの構成を示すブロック図。
【図17】宛名記載範囲推定処理の一例を示す図。
【図18】宛先郵便番号行と宛先住所行の領域を統合することで宛先情報記載領域を検出することを示す図。
【図19】この発明の第3の実施形態におけるシステムの動作を示すフローチャート。
【図20】この発明の第4の実施形態に係わる、オペレータが入力した文字列を元に郵便物に記載された差出人ごとに差出人住所情報記載領域と宛先情報記載領域の標準位置を自動学習させるシステムの構成を示すブロック図。
【図21】特定の会社に対して固有の郵便番号が割り振られている例を示す図。
【図22】差出人名を検索キーとして住所データベースを使用することを示す図。
【図23】オペレータが入力した差出人および受取人の郵便番号情報を元に住所データベースを検索して住所情報を取得する流れを示す図。
【図24】差出人別書状書式情報記憶部に記憶される各種の情報を示す図。
【図25】宛先郵便番号行と宛先住所行の領域を統合することで宛先情報記載領域を検出することを示す図。
【図26】この発明の第4の実施形態におけるシステムの動作を示すフローチャート。
【符号の説明】
【0155】
1…区分機、2…供給部、3…スキャナ部、4…、5…区分部、6…収納部、7…載置台、8…取出し部、10…情報処理部、11…制御部、12…ディスプレイ、13…入力装置、100,200…辞書学習処理部、300…宛先情報領域学習処理部、400…差出人別書状書式学習処理部。
【技術分野】
【0001】
本発明は、住所情報が記載された書状の画像を取り込んで文字認識処理を行う情報処理装置に関し、特に、文字認識処理に使用される文字辞書等の学習を行うことが可能な情報処理装置に関する。
【背景技術】
【0002】
郵便物などの書状上に記載された文字の認識を行う文字認識処理においては、一般に、画像から切り出した文字パターンを予め用意した文字辞書と照合し、文字辞書に登録されている文字のうち最も可能性の高いものを文字認識結果として得る。
【0003】
文字辞書を作成するためには、各文字に対して1つまたは複数個の文字画像を用意し、それを用いて辞書学習を行う。各文字に対して用意する文字画像の数が多ければ、より高性能な文字辞書を作成することが可能となる。文字辞書の改良を行う場合は、新たな文字画像を追加するか、もしくは一部の文字画像を差し替えてから辞書学習をやり直す。
【0004】
また、文字画像を作成するためには、文字列を含んでいる画像に対してオペレータが1文字ずつ手で文字領域を指定してその部分の画像を文字画像として保存することを繰り返す必要がある。ある程度文字認識処理技術が発達してからは、ツールを用いることにより、画像から文字を自動的に切り出して、モニタ画面上に各文字画像を表示し、オペレータが各文字画像に対応する文字列を指定する方法も採られるようになった。
【0005】
例えば、特許文献1には、リジェクトされた書状に記載された文字パターンに対し、オペレータが文字入力を行った後、文字パターンと正解文字コードとの対応関係に基づき、文字辞書の更新を行うことが開示されている。また、特許文献2には、リジェクトされた書状に記載された宛名の文字パターンに対し、オペレータが文字入力を行った後、宛名の文字パターンと正解宛名コードとの対応関係に基づき、宛名の知識データベースの更新を行うことが開示されている。
【特許文献1】特開平9−57203号公報
【特許文献2】特開平9−57204号公報
【発明の開示】
【発明が解決しようとする課題】
【0006】
しかしながら、文字認識に使用される文字辞書を作成するためには、従来、書状の画像から複数の文字画像を切り出した後、オペレータは文字画像毎に正しい文字列を逐一入力しなければならない。このため、オペレータの負担は大きく、作業にかかる時間やコストも大きい。また、オペレータが入力した情報を元に学習処理を行っただけでは、文字辞書や知識データベースの性能を向上させることは難しい。
【0007】
本発明は上記実情に鑑みてなされたものであり、オペレータの負担を軽減しつつ高性能な認識処理を実現する情報処理装置を提供することを目的とする。
【課題を解決するための手段】
【0008】
本発明に係る情報処理装置は、住所情報が記載された書状の画像を取り込んで文字認識処理を行う情報処理装置であって、書状の記載に使用される個々の住所に関する情報を記憶する住所情報記憶手段と、第1の文字列を検索キーとして、前記住所情報記憶手段に記憶されている情報の中から住所に相当する第2の文字列を検索する検索処理手段と、前記書状の記載に使用される個々の文字とその画像である文字画像との対応関係を示す文字辞書を記憶する文字辞書記憶手段と、前記文字辞書記憶手段に記憶されている前記文字辞書を用いて、前記画像の中の所定の領域に対する文字認識を行い、少なくとも住所を含む文字列の候補を生成する文字認識処理手段と、前記文字認識処理手段により生成された候補の中から、前記検索処理手段によって検索された前記第2の文字列に該当する文字列を選択する文字画像選択処理手段と、前記文字画像選択処理手段により選択された前記文字列を構成する個々の文字とその文字画像との対応関係を用いて、前記文字辞書記憶手段に記憶されている前記文字辞書に対する学習処理を実行する文字辞書学習処理手段とを具備することを特徴とする。
【発明の効果】
【0009】
本発明によれば、オペレータの負担を軽減しつつ高性能な認識処理を実現することができる。
【発明を実施するための最良の形態】
【0010】
この発明の実施の形態を図面に基づいて詳細に説明する。
図1は、この発明の各実施形態に共通して使用される区分機1を示す外観図であり、図2は区分機1の概略構成を示す図である。この区分機1は、大型の箱型状の区分機本体1aを有している。この区分機1は、郵便物(書状)Pの情報を読取り、その読取内容から宛名領域や貼付シールの領域などを認識し、この認識結果に基づいて該当する区分先に郵便物Pを区分するものである。
上記区分機本体1aには、供給部2と、スキャナ部3と、搬送部4と、区分部5と、収納部6とが設けられている。この供給部2からの郵便物Pが搬送路によって搬送されることにより、搬送部4、区分部5を順次介して収納部6に導かれる。
【0011】
上記供給部2は、郵便物Pを載置する載置台7と、この載置台7から郵便物Pを一通ずつ取り出して搬送路に送る取出し部8とを有している。上記スキャナ部3は、搬送路によって搬送される1通ずつの郵便物P上の全体の画像を光学的に読取って画像情報を生成する。上記搬送部4は、スキャナ部3を通過してきた郵便物Pを区分部5へ搬送する。上記収納部6は、郵便物Pを区分収納する多数の収納ポケット6aを有している。上記区分部5は、搬送部4から送られてくる郵便物Pをスキャナ部3からの画像情報に対する後述する認識結果に基づいて収納ポケット6a、…のいずれかに振り分ける。
【0012】
上記スキャナ部3は、郵便物P上を光学的に走査して光電変換することによりパターン信号として紙葉類上の情報を読取る読取手段であり、たとえば郵便物P上に光を照射する光源、およびその反射光を受けて電気信号に変換する自己走査形のCCDイメージセンサ等によって構成される。上記スキャナ部3の出力は情報処理部10中の認識部に供給される。
【0013】
上記区分機1において、上記供給部2、スキャナ部3、搬送部4、区分部5、情報処理部10は、制御部11に接続されている。この制御部11は、区分機1の全体の動作を制御する。たとえば、制御部11は図示しないメモリに記憶されている区分指定テーブルを用いて、上記情報処理部10での認識結果(もしくは判定結果)に対応する区分指定データを読出し、この読出した区分指定データ(収納ポケット6a、…のアドレス)に対応する収納ポケット6a、…に上記郵便物Pを搬送せしめるものである。
さらに、上記制御部11はドライバ(図示せず)により上記搬送路等の搬送機構部(図示せず)を駆動することにより、搬送系全体の制御を行うようになっている。
【0014】
以下の各実施形態では、上記情報処理部10に設けられる文字辞書等に対する効率的な学習処理を実現するための構成および動作の詳細について説明する。
【0015】
<第1の実施形態>
まず、本発明の第1の実施形態について説明する。
【0016】
図3は、この発明の第1の実施形態に係わる、オペレータが入力した文字列を元に郵便物に記載された宛先情報を認識するための文字辞書を自動学習させるシステムの構成を示すブロック図である。
【0017】
このシステムは、郵便物Pの書状画像を取り込むためのスキャナ部3と、取り込んだ画像を表示するためのディスプレイ12と、オペレータが入力作業を行うための入力装置13と、学習処理部100とを含んでいる。
【0018】
学習処理部100は、前述の情報処理部10により実現され、住所データベース101、データベース検索処理部102、文字辞書記憶部103、文字認識処理部104、文字画像選択処理部105、文字画像記憶部106、および文字辞書学習処理部107を有する。
【0019】
住所データベース101は、郵便物Pの記載に使用される個々の住所に関する情報を記憶するものである。
【0020】
データベース検索処理部102は、入力装置13を通じて入力される第1の文字列(氏名もしくは名称、電話番号、又は郵便番号など)を検索キーとして、住所データベース101に記憶されている情報の中から住所に相当する第2の文字列を検索するものである。
【0021】
文字辞書記憶部103は、郵便物Pの記載に使用される個々の文字とその画像である文字画像との対応関係を示す文字辞書を記憶するものである。この文字辞書には、一つの文字に対して複数の異なる種類の文字画像を対応付けて登録することが可能である。
【0022】
文字認識処理部104は、文字辞書記憶部103に記憶されている文字辞書を用いて、画像の中の所定の領域に対する文字認識を行い、氏名もしくは名称、電話番号、郵便番号、住所などに相当する文字列の候補をそれぞれ生成するものである。
【0023】
文字画像選択処理部105は、文字認識処理部104により生成された候補の中から、データベース検索処理部102によって検索された第2の文字列に該当する文字列を選択するものである。具体的には、この文字画像選択処理部105は、文字認識処理部104により生成された候補の中から、入力装置13を通じて入力された第1の文字列に該当する文字列を選択し、この選択した文字列が画像の中で位置している行に隣接する行の文字列の候補の中から、上記第2の文字列に該当する文字列を選択する。
【0024】
文字画像記憶部106は、文字画像選択処理部105によって選択された文字列を構成する個々の文字とその文字画像とを対応付けて記憶するものである。
【0025】
文字辞書学習処理部107は、文字画像記憶部106に記憶された個々の文字とその文字画像との対応関係を用いて、文字辞書記憶部103に記憶されている文字辞書に対する学習処理を実行するものである。
【0026】
次に、このような機能を備えたシステムにおける具体的な処理について説明する。
【0027】
スキャナ部3によって取り込まれた書状画像は、必要なデータ処理が施された後、ディスプレイ12の画面上に表示される。
【0028】
オペレータは、入力装置13から書状画像中に記載されている宛先情報の一部、例えば郵便番号情報を入力する。入力された情報は、学習処理部100内のデータベース検索処理部102に渡され、データベース検索処理部102は、その情報を検索キーとして住所データベース101を検索する。
【0029】
住所データベースに登録されている情報の例を図4および図5に示す。図4の例では、各郵便番号に対応する住所情報が登録されている。郵便番号に対応している住所情報は県名から町名までをひと固まりのデータとして扱う。また宛先住所が県名から書かれている場合と、県名が省略されて市町村名から記述されている場合の両方に対応する場合には、図5のように県名情報と市町村名情報とを別データとして扱っていてもよい。その場合には、例えば郵便番号情報として「2128501」を入力した時にデータベース検索結果として、「神奈川県川崎市幸区柳町」と「川崎市幸区柳町」の2つを返す。
【0030】
一方、文字認識処理部104は、スキャナ部3によって取り込まれた書状画像から、画像中から文字行および文字候補を切り出し、各文字候補をあらかじめ用意してある文字辞書記憶部103内の文字辞書を用いて認識する。書状画像の一例を図6に示す。
【0031】
文字認識処理部104では、図7の例に示すように1行につき複数通りの文字切り出し候補が発生する。しかし、オペレータが入力装置13から入力した情報は必ず画像中のどこかに記載されているので、入力情報と同一の認識結果を持つ文字行が存在するはずである。例えば図6に示した書状画像を見て、オペレータは宛先郵便番号「212−8501」を入力装置13から入力する。この時、文字認識処理部104は、書状画像から文字行を6行検出し、各文字行に対して文字切り出しおよび文字認識処理を実行する。文字切り出し候補の中に正しく切り出された文字画像が確実に含まれるようにするため、文字切り出し候補を1行に1通りしか生成するのではなく、切り出しアルゴリズムやパラメータを切り替えることによって複数組の文字切り出し候補を生成するようにすることが望ましい。本実施形態では、宛先郵便番号行「212−8501」に対し図7のように3通りの文字切り出し候補が作成されたものとする。
【0032】
文字画像選択処理部105は、文字切り出し候補の中から入力装置13から入力した情報と一致するものを検索し、見つかった文字切り出し候補の各画像とその文字種(文字コード等)とを文字画像記憶部106に記憶する。入力情報「212−8501」と一致する認識結果が得られるのは、宛先郵便番号行に対して文字切り出しおよび文字認識処理した結果得られた図7の3候補のうち一番上の候補だけなので、これらの文字画像および文字認識結果が文字画像記憶部106に記憶される。
【0033】
宛先住所郵便番号として「212−8501」が記載されていた場合、宛先郵便番号のすぐそばに記載されている宛先住所情報は住所データベース101で検索して得られた住所情報と一致しているはずである。よって宛先郵便番号行付近の行の文字切り出し結果および文字認識結果を「神奈川県川崎市幸区柳町」または「川崎市幸区柳町」と照合する。文字認識処理部104において宛先住所行を処理した時の文字切り出し候補および文字認識結果の一例を図8に示す。図8の例の場合、上から2番目の文字切り出し候補の認識結果が住所データベース101から郵便番号「212−8501」に対応する住所情報として検索した結果「神奈川県川崎市幸区柳町」と一致するので、これらの文字画像および文字認識結果を文字画像記憶部106に記憶する。
【0034】
このように、1枚の書状画像を見てオペレータが宛先郵便番号を入力するだけで、宛先郵便番号行および宛先住所行を構成していた個々の文字画像とその文字種の情報を取得することができた。この作業を複数枚の書状画像について繰り返し、それぞれの郵便番号行および宛先住所行を構成する文字画像およびその文字種の情報を文字画像記憶部106に記憶する。
【0035】
こうして文字画像記憶部106に蓄積された文字画像情報は、オペレータが答え教え作業を実施していない時間帯に、文字辞書学習処理部107により処理される。文字辞書学習処理部107では、各文字画像は文字の種類ごとに分類され、文字辞書記憶部103内の文字辞書の学習処理に使用される。学習処理完了後は、例えば、更新された文字辞書で従来の文字辞書を置き換える。
【0036】
なお、郵便物には明朝体などの活字が印刷される場合もあれば、草書体やペン字で手書き文字が書かれている場合もある。このため、文字画像記憶部106に記憶される文字の中には、例えば同じ「朝」を表す文字であっても、種々なカテゴリの文字が記憶されることがあり得る。文字画像記憶部106の中に、文字辞書としてまだ登録されていない種類の文字に相当する文字画像がある場合には、その文字画像と該当する文字との対応付けが文字辞書に追加登録されることになる。例えば、図9に示すように、文字辞書において「朝」の文字コード03611に対し明朝体に相当する文字画像を対応付ける登録が済んでいる状態で、明朝体とはカテゴリが異なる草書体やペン字に該当する文字画像が文字画像記憶部106に記憶された場合には、当該画像も「朝」の文字コード03611に対応するものとして追加登録されることになる。
【0037】
次に、図10のフローチャートを参照して、本実施形態におけるシステムの動作について説明する。
【0038】
書状画像がスキャナ部3を通じて取り込まれると、その画像に必要な処理が施された後、ディスプレイ12の画面上に表示される(ステップS11)。
【0039】
ディスプレイに表示される書状画像を見たオペレータが第1の文字列(郵便番号等)を入力すると、データベース検索処理部102がその文字列を取得する(ステップS12)。
【0040】
データベース検索処理部102においては、第1の文字列を検索キーとして、住所データベース101から、住所を示す第2の文字列が検索される(ステップS13)。
【0041】
一方、文字認識処理部104においては、画像からの文字の切り出し、文字辞書を用いた文字認識、文字列の候補の生成が行われる(ステップS14)。
【0042】
文字画像選択処理部105においては、文字認識処理部104にて生成された文字列の候補の中から、第1の文字列に該当する文字列が選択され(ステップS15)、次いで、選択された文字列が画像の中で位置している行に隣接する行の文字列の候補の中から、データベース検索処理部102で得られた第2の文字列に該当する文字列が選択される(ステップS16)。
【0043】
文字画像記憶部106においては、文字画像選択処理部105で選択された各文字列を構成する個々の文字とその文字画像とが記憶される(ステップS17)。
【0044】
文字辞書学習処理部107においては、文字画像記憶部106に記憶された個々の文字とその文字画像との関係を用いた文字辞書学習が実行される(ステップS18)。
【0045】
次に、図11のフローチャートを参照して、図10中のステップS18(文字学習処理)における詳細な処理を説明する。
【0046】
文字画像記憶部106に記憶されたn個の文字(i=1〜n)とその文字画像が順次読み出され(ステップS1)、1文字単位で、順番に以下のような処理が行われる。
【0047】
所定の記憶領域を使用して、検討対象の文字の番号を表す変数iを1にセットする(ステップS2)。
【0048】
変数iがnを超えているか、即ち、全ての文字に対する検討が完了しているか否かが判別される(ステップS3)。完了していなければ(ステップS3のNo)、検討対象であるi番目の文字及びその文字画像と、文字辞書との比較が行われ(ステップS4)、該当する文字が文字辞書に存在するか否かが判別される(ステップS5)。該当する文字が存在しなければ(ステップS5のNo)、検討対象であるi番目の文字とその文字画像との組合せが新規なものとして、文字辞書に登録される(ステップS6)。そして、所定の記憶領域上の変数iに1が加算され、ステップS3からの処理が繰り返される。
【0049】
一方、ステップS5において該当する文字が存在していれば(ステップS5のYes)、その文字と類似した文字画像も文字辞書に存在しているか否かが判別される(ステップS7)。文字画像も存在していれば、登録済みであるため、新規登録は行われない。そして、所定の記憶領域上の変数iに1が加算され、ステップS3からの処理が繰り返される。
【0050】
また、ステップS5において該当する文字が存在し(ステップS5のYes)、且つ、ステップS7において類似する文字画像が存在しない場合には(ステップS7のNo)、登録済みの文字画像とはカテゴリが違う文字画像であるものとみなされ、検討対象であるi番目の文字とその文字画像との組合せが新規なものとして、文字辞書に追加登録される(ステップS8)。なお、同じ文字に対応する登録済みの方の文字画像が不要となる場合には、この文字画像に対して新規な文字画像を上書きする更新処理を行うようにしてもよい。そして、所定の記憶領域上の変数iに1が加算され、ステップS3からの処理が繰り返される。
【0051】
なお、図11で説明した処理は、後述する他の実施形態にも適用できるものである。
【0052】
このように第1の実施形態によれば、オペレータが入力した文字列をキーワードとして住所データベースを検索し、それに該当する住所情報を取り出し、その住所情報と一致する文字認識結果を選択して、そのときの各文字候補の記載位置から文字パターンの切り出しを行って、その結果を文字辞書学習に使用している。また、オペレータが入力しなかった文字についても文字辞書学習を行っており、かつ、オペレータが入力した情報を元に文字切り出し位置を特定している。これにより、文字切り出し作業および文字辞書学習を自動化することができ、高性能な文字辞書を容易に形成することができる。
【0053】
<第2の実施形態>
次に、本発明の第2の実施形態について説明する。
【0054】
図12は、この発明の第2の実施形態に係わる、オペレータが答え教えすることなく、郵便物に記載された宛先情報を認識するための文字辞書を自動学習させるシステムの構成を示すブロック図である。
【0055】
このシステムは、郵便物Pの書状画像を取り込むためのスキャナ部3と、学習処理部200とを含んでいる。本実施形態でも、図6に示した郵便画像が入力された場合を例にとって説明する。
【0056】
学習処理部200は、前述の情報処理部10により実現され、住所データベース201、文字辞書記憶部202、文字認識処理部(A)203、文字認識処理部(B)204、データベース検索処理部205、文字画像選択処理部206、文字画像記憶部207、および文字辞書学習処理部208を有する。
【0057】
住所データベース201は、郵便物Pの記載に使用される個々の住所に関する情報を記憶するものである。
【0058】
文字辞書記憶部202は、郵便物Pの記載に使用される個々の文字とその画像である文字画像との対応関係を示す文字辞書を記憶するものである。この文字辞書には、一つの文字に対して複数の異なる種類の文字画像を対応付けて登録することが可能である。
【0059】
文字認識処理部(A)203は、文字辞書記憶部202に記憶されている文字辞書を用いて、画像の中の所定の領域に対する文字認識を行い、第1の文字列(氏名もしくは名称、電話番号、又は郵便番号など)の候補を生成するものである。
【0060】
文字認識処理部(B)204は、上記第1の文字列の画像上で位置する行に隣接する行から、住所に相当する第2の文字列の候補をそれぞれ生成するものである。
【0061】
データベース検索処理部205は、文字認識処理部(A)203により生成された第1の文字列(氏名もしくは名称、電話番号、又は郵便番号など)を検索キーとして、住所データベース101に記憶されている情報の中から住所に相当する第2の文字列を検索するものである。
【0062】
文字画像選択処理部206は、文字認識処理部(B)204により生成された候補の中から、データベース検索処理部205によって検索された第2の文字列に該当する文字列を選択するものである。
【0063】
文字画像記憶部207は、文字画像選択処理部206によって選択された文字列を構成する個々の文字とその文字画像とを対応付けて記憶するものである。
【0064】
文字辞書学習処理部208は、文字画像記憶部207に記憶された個々の文字とその文字画像との対応関係を用いて、文字辞書記憶部202に記憶されている文字辞書に対する学習処理を実行するものである。
【0065】
次に、このような機能を備えたシステムにおける具体的な処理について説明する。
【0066】
文字認識処理部(A)203は、スキャナ部3によって取り込まれた書状画像から、文字行および文字候補を切り出し、各文字候補をあらかじめ用意してある文字辞書記憶部202内の文字辞書を用いて認識する。そして特定の特徴を持つ文字列を検出する。特定の特徴を持つ文字列としては、例えば郵便番号を使用する。郵便番号を使用する場合は、7桁の数字が並んでいる文字行を画像上から検出する。図6の書状画像の場合、行「212−8501」と行「001−0000」が検出される。
【0067】
文字認識処理部(A)203によって検出された文字列は、データベース検索処理部205に渡される。データベース検索処理部205は、その情報を検索キーとして住所データベース201を検索する。住所データベース201に登録されている情報が図4に示したものであった場合、「212−8501」に対する検索結果は「神奈川県川崎市幸区柳町」、「001−0000」に対する検索結果は「北海道札幌市北区」となる。
【0068】
郵便番号として認識できない行や、郵便番号として読めても住所データベース201に登録されていなかった行は郵便番号行ではなかったと判断する。
【0069】
郵便番号行が見つかった場合は、その郵便番号行に隣接する行を文字認識処理部(B)204で処理する。文字認識処理部(B)204では、文字候補を切り出し、各文字候補をあらかじめ用意してある文字辞書記憶部202内の文字辞書を用いて認識する。
【0070】
文字画像選択処理部206では、文字認識処理部(B)204で検出した文字切り出し候補の中から住所データベース101で検索して得られた住所情報と一致する結果がないかを調べる。例えば郵便番号行として「212−8501」を文字認識処理部(A)203が検出した場合、図4に示したデータベースから住所情報「神奈川県川崎市幸区柳町」を取得し、文字認識処理部(B)204の文字切り出しおよび文字認識結果の中にこれと一致するものがないかを照合する。文字認識処理部(B)204の処理結果が図8に示したものであった場合、照合の結果上から2番目の文字切り出しおよび文字認識結果が選択され、これらの文字画像および文字認識結果が文字画像記憶部207に記憶される。
【0071】
このように、1枚の書状画像に必ず記載されている情報、例えば郵便番号を検出することで、郵便番号行および住所行を構成していた個々の文字画像とその文字種の情報を取得することができた。この作業を複数枚の書状画像について繰り返し、それぞれの郵便番号行および住所行を構成する文字画像およびその文字種の情報を文字画像記憶部207に記憶する。
【0072】
こうして文字画像記憶部207に蓄積された文字画像情報は、書状画像認識処理を実施していない時間帯に、文字辞書学習処理部208により処理される。文字辞書学習処理部208では、各文字画像は文字の種類ごとに分類され、文字辞書記憶部202内の文字辞書の学習処理に使用される。学習処理完了後は、例えば、更新された文字辞書で従来の文字辞書を置き換える。
【0073】
上記の説明では、検索キーとして郵便番号を用いて住所検索を行える情報を有する住所データベースの例を取り上げたが、代わりに、図13のように、検索キーとして氏名を用いて住所検索を行える情報を有する住所データベースを採用してもよいし、あるいは、図14のように、検索キーとして電話番号を用いて住所検索を行える情報を有する住所データベースを採用してもよい。
【0074】
次に、図15のフローチャートを参照して、本実施形態におけるシステムの動作について説明する。
【0075】
書状画像がスキャナ部3を通じて取り込まれると(ステップS21)、文字認識処理部(A)203において、画像からの文字の切り出し、文字辞書を用いた文字認識、文字列の候補の生成が行われ、特に、第1の文字列(郵便番号等)の候補が生成される(ステップS22)。
【0076】
一方、データベース検索処理部205においては、文字認識処理部(A)203で生成された第1の文字列を検索キーとして、住所を示す第2の文字列が検索される(ステップS23)。
【0077】
文字認識処理部(B)204においては、文字認識処理部(A)203で生成された第1の文字列が画像の中で位置している行に隣接する行の文字列が認識され、その文字列の候補が生成される。次いで、文字画像選択処理部206において、その生成された候補の中から、データベース検索処理部205で得られた第2の文字列に該当する文字列が選択される(ステップS24)。
【0078】
文字画像記憶部207においては、文字画像選択処理部206で選択された各文字列を構成する個々の文字とその文字画像とが記憶される(ステップS25)。
【0079】
文字辞書学習処理部208においては、文字画像記憶部207に記憶された個々の文字とその文字画像との関係を用いた文字辞書学習が実行される(ステップS26)。
【0080】
このように第2の実施形態によれば、オペレータが入力装置から郵便番号情報などを入力しなくても、郵便物の記載内容などに基づいて自動的に学習処理が行われるため、オペレータに手間をかけることなく、高性能な文字辞書を容易に形成することができる。
【0081】
なお、ここまで説明した第1の実施形態における文字辞書の学習処理のための構成および動作、もしくは第2の実施形態における文字辞書の学習処理のための構成および動作は、後述する第3の実施形態や第4の実施形態にも適用することができる。
【0082】
<第3の実施形態>
次に、本発明の第3の実施形態について説明する。
【0083】
図16は、この発明の第3の実施形態に係わる、オペレータが入力した文字列を元に郵便物に記載された宛先情報記載領域の標準位置を自動学習させるシステムの構成を示すブロック図である。
【0084】
このシステムは、郵便物Pの書状画像を取り込むためのスキャナ部3と、取り込んだ画像を表示するためのディスプレイ12と、オペレータが入力作業を行うための入力装置13と、学習処理部300とを含んでいる。
【0085】
学習処理部300は、前述の情報処理部10により実現され、住所データベース301、データベース検索処理部302、文字辞書記憶部303、宛先住所領域パラメータ記憶部304、宛先住所領域判定処理部305、文字認識処理部306、文字画像選択処理部307、宛先住所領域情報記憶部308、および宛先住所領域パラメータ学習処理部309を有する。
【0086】
住所データベース301は、郵便物Pの記載に使用される個々の住所に関する情報を記憶するものである。
【0087】
データベース検索処理部302は、入力装置13を通じて入力される第1の文字列(氏名もしくは名称、電話番号、又は郵便番号など)を検索キーとして、住所データベース301に記憶されている情報の中から住所に相当する第2の文字列を検索するものである。
【0088】
文字辞書記憶部303は、郵便物Pの記載に使用される個々の文字とその画像である文字画像との対応関係を示す文字辞書を記憶するものである。この文字辞書には、一つの文字に対して複数の異なる種類の文字画像を対応付けて登録することが可能である。
【0089】
宛先住所領域パラメータ記憶部304は、画像の中の宛先住所の領域を示す宛先住所領域情報(パラメータ)を記憶するものである。
【0090】
宛先住所領域判定処理部305は、宛先住所領域パラメータ記憶部304に記憶されている宛先住所領域情報(パラメータ)に基づいて、文字認識処理部306が文字認識を行うべき領域を判定するものである。
【0091】
文字認識処理部306は、文字辞書記憶部303に記憶されている文字辞書を用いて、宛先住所領域判定処理部305によって判定された領域に対する文字認識を行い、氏名もしくは名称、電話番号、郵便番号、住所などに相当する文字列の候補をそれぞれ生成するものである。
【0092】
文字画像選択処理部307は、文字認識処理部306により生成された候補の中から、データベース検索処理部302によって検索された第2の文字列に該当する文字列を選択するものである。具体的には、この文字画像選択処理部307は、文字認識処理部306により生成された候補の中から、入力装置13を通じて入力された第1の文字列に該当する文字列を選択し、この選択した文字列が画像の中で位置している行に隣接する行の文字列の候補の中から、上記第2の文字列に該当する文字列を選択する。
【0093】
宛先住所領域情報記憶部308は、文字画像選択処理部307によって選択された第1の文字列及び第2の文字列の画像上の各領域を示す情報(パラメータ)を記憶するものである。
【0094】
宛先住所領域パラメータ学習処理部309は、宛先住所領域情報記憶部308に記憶された各領域を示す情報(パラメータ)に基づいて、宛先住所領域パラメータ記憶部304に記憶されている宛先住所領域情報(パラメータ)に対する学習処理を実行するものである。
【0095】
次に、このような機能を備えたシステムにおける具体的な処理について説明する。
【0096】
スキャナ部3によって取り込まれた書状画像は、必要なデータ処理が施された後、ディスプレイ12の画面上に表示される。
【0097】
オペレータは、入力装置13から書状画像中に記載されている宛先情報の一部、例えば郵便番号情報を入力する。入力された情報は、学習処理部300内のデータベース検索処理部302に渡され、データベース検索処理部302は、その情報を検索キーとして住所データベース301を検索する。
【0098】
住所データベースに登録されている情報の例を図4および図5に示す。図4の例では、各郵便番号に対応する住所情報が登録されている。郵便番号に対応している住所情報は県名から町名までをひと固まりのデータとして扱う。また宛先住所が県名から書かれている場合と、県名が省略されて市町村名から記述されている場合の両方に対応する場合には、図5のように県名情報と市町村名情報とを別データとして扱っていてもよい。その場合には、例えば郵便番号情報として「2128501」を入力した時にデータベース検索結果として、「神奈川県川崎市幸区柳町」と「川崎市幸区柳町」の2つを返す。
【0099】
一方、宛先住所領域判定処理部305は、スキャナ部3によって取り込まれた書状画像から、宛先住所領域パラメータ記憶部304に記憶されている宛先情報領域に関する各種パラメータを元に、書状画像中の宛名記載範囲を推定する。図17に宛名記載範囲推定処理の一例を示す。図17の(a)に示した書状画像に対し、宛先住所領域パラメータ記憶部304に記憶されているパラメータ情報を元に推定した宛名記載範囲が、図17の(b)の破線枠で囲んで領域である。
【0100】
文字認識処理部306は、書状画像の宛名記載範囲と推定した範囲(図17の(b))から、文字行および文字候補を切り出し、各文字候補をあらかじめ用意してある文字辞書記憶部303内の文字辞書を用いて認識する。図17の(c)は、宛名記載範囲内から行を切り出した状態の例である。そしてオペレータが入力装置13から入力した文字列、例えば宛先郵便番号と一致する文字列を検出する。図17の(c)の書状画像の場合、行「212−8501」が検出される。
【0101】
宛先住所郵便番号として「212−8501」を検出した時、宛先郵便番号のすぐそばに記載されている宛先住所情報は住所データベース301で検索して得られた住所情報と一致しているはずである。よって文字画像選択処理部307において、宛先郵便番号行付近の行の文字切り出し結果および文字認識結果を「神奈川県川崎市幸区柳町」または「川崎市幸区柳町」と照合する。文字認識処理部306で宛先住所行を処理した時の文字切り出し候補および文字認識結果の一例を図8に示す。図8の例の場合、上から2番目の文字切り出し候補の認識結果が住所データベース301から郵便番号「212−8501」に対応する住所情報として検索した結果「神奈川県川崎市幸区柳町」と一致するので、この行が宛先住所行であることが判明する。
【0102】
こうして宛先郵便番号行および宛先住所行の記載位置が検出されると、宛先住所領域情報記憶部308は、その書状における宛先情報記載領域に関する情報を記憶する。宛先情報記載領域を検出する方法としては、例えば図18に示すように、検出した宛先郵便番号行と宛先住所行の領域を統合することで宛先情報記載領域を検出する。
【0103】
このように、1枚の書状画像を見てオペレータが宛先郵便番号を入力するだけで、宛先住所情報が記載されている領域に関する情報を取得することができた。この作業を複数枚の書状画像について繰り返し、各書状の宛先情報記載領域の情報を宛先住所領域情報記憶部308に記憶する。
【0104】
こうして宛先住所領域情報記憶部308に蓄積された宛先情報領域に関する各種情報は、オペレータが答え教え作業を実施していない時間帯に、宛先住所領域パラメータ学習処理部309により処理される。宛先住所領域パラメータ学習処理部309では、宛先住所領域情報記憶部308に記憶された情報を元に、宛先情報の標準記載位置やサイズに関する情報を学習する。学習処理完了後は、更新されたパラメータで宛先住所領域パラメータ記憶部304に記憶されている内容を更新する。
【0105】
次に、図19のフローチャートを参照して、本実施形態におけるシステムの動作について説明する。
【0106】
書状画像がスキャナ部3を通じて取り込まれると(ステップS31)、宛名住所領域判定処理部305において、宛名住所領域情報(パラメータ)に基づく宛名住所領域の判定が行われる(ステップS32)。
【0107】
この後、宛名住所領域判定処理部305で判定された宛名住所領域に対し、前述の図10で説明したステップS12〜S16と同様の処理が、文字認識処理部306や文字画像選択処理部307などにおいて行われる。
【0108】
宛先住所領域情報記憶部308においては、文字画像選択処理部307で選択された各文字列の領域を統合した宛先住所領域の情報(パラメータ)が記憶される(ステップS33)。
【0109】
宛先住所領域パラメータ学習処理部309においては、宛先住所領域情報記憶部308に記憶された宛先住所領域の情報(パラメータ)を用いた宛先住所領域の標準位置の学習が実行される(ステップS34)。
【0110】
このように第3の実施形態によれば、文字辞書学習だけでなく、宛先住所領域の標準位置の学習に関しても自動化することができ、高精度な宛先住所領域情報を容易に形成することができる。
【0111】
<第4の実施形態>
次に、本発明の第4の実施形態について説明する。
【0112】
図20は、この発明の第4の実施形態に係わる、オペレータが入力した文字列を元に郵便物に記載された差出人ごとに差出人住所情報記載領域と宛先情報記載領域の標準位置を自動学習させるシステムの構成を示すブロック図である。
【0113】
このシステムは、郵便物Pの書状画像を取り込むためのスキャナ部3と、取り込んだ画像を表示するためのディスプレイ12と、オペレータが入力作業を行うための入力装置13と、学習処理部400とを含んでいる。
【0114】
学習処理部400は、前述の情報処理部10により実現され、住所データベース401、データベース検索処理部402、文字辞書記憶部403、差出人別書状書式情報記憶部404、宛先住所領域判定処理部405、文字認識処理部(A)406、文字画像選択処理部(A)407、宛先住所領域情報記憶部408、差出人住所領域判定処理部409、文字認識処理部(B)410、文字画像選択処理部(B)411、差出人住所領域情報記憶部412、および差出人別書状書式学習処理部413を有する。
【0115】
住所データベース401は、郵便物Pの記載に使用される個々の住所に関する情報を記憶するものである。
【0116】
データベース検索処理部402は、入力装置13を通じて入力される第1の文字列(氏名もしくは名称、電話番号、又は郵便番号など)を検索キーとして、住所データベース401に記憶されている情報の中から住所に相当する第2の文字列を検索するものである。
【0117】
文字辞書記憶部403は、郵便物Pの記載に使用される個々の文字とその画像である文字画像との対応関係を示す文字辞書を記憶するものである。この文字辞書には、一つの文字に対して複数の異なる種類の文字画像を対応付けて登録することが可能である。
【0118】
差出人別書状書式情報記憶部404は、差出人別に書状の書式が定義された差出人別書状書式情報を記憶するものである。
【0119】
宛先住所領域判定処理部405は、差出人別書状書式情報記憶部404に記憶されている差出人別書状書式情報に基づいて、文字認識処理部(A)406が文字認識を行うべき領域(宛先住所領域)を判定するものである。
【0120】
文字認識処理部(A)406は、文字辞書記憶部403に記憶されている文字辞書を用いて、宛先住所領域判定処理部405によって判定された領域(宛先住所領域)に対する文字認識を行い、氏名もしくは名称、電話番号、郵便番号、住所などに相当する文字列の候補をそれぞれ生成するものである。
【0121】
文字画像選択処理部(A)407は、文字認識処理部(A)406により生成された候補の中から、データベース検索処理部402によって検索された第2の文字列に該当する文字列を選択するものである。具体的には、この文字画像選択処理部(A)407は、文字認識処理部(A)406により生成された候補の中から、入力装置13を通じて入力された第1の文字列に該当する文字列を選択し、この選択した文字列が画像の中で位置している行に隣接する行の文字列の候補の中から、上記第2の文字列に該当する文字列を選択する。
【0122】
宛先住所領域情報記憶部408は、文字画像選択処理部(A)407によって選択された第1の文字列及び第2の文字列の画像上の各領域を示す情報を記憶するものである。
【0123】
差出人住所領域判定処理部409は、差出人別書状書式情報記憶部404に記憶されている差出人別書状書式情報に基づいて、文字認識処理部(B)410が文字認識を行うべき領域(差出人住所領域)を判定するものである。
【0124】
文字認識処理部(B)410は、文字辞書記憶部403に記憶されている文字辞書を用いて、差出人住所領域判定処理部409によって判定された領域(差出人住所領域)に対する文字認識を行い、氏名もしくは名称、電話番号、郵便番号、住所などに相当する文字列の候補をそれぞれ生成するものである。
【0125】
文字画像選択処理部(B)411は、文字認識処理部(B)410により生成された候補の中から、データベース検索処理部402によって検索された第2の文字列に該当する文字列を選択するものである。具体的には、この文字画像選択処理部(B)411は、文字認識処理部(B)410により生成された候補の中から、入力装置13を通じて入力された第1の文字列に該当する文字列を選択し、この選択した文字列が画像の中で位置している行に隣接する行の文字列の候補の中から、上記第2の文字列に該当する文字列を選択する。
【0126】
差出人住所領域情報記憶部412は、文字画像選択処理部(B)411によって選択された第1の文字列及び第2の文字列の画像上の各領域を示す情報を記憶するものである。
【0127】
差出人別書状書式学習処理部413は、宛先住所領域情報記憶部408に記憶された第1の文字列及び第2の文字列の画像上の各領域を示す情報、および、差出人住所領域情報記憶部412に記憶された第1の文字列及び第2の文字列の画像上の各領域を示す情報に基づいて、差出人別書状書式情報記憶部404に記憶されている差出人別書状書式情報に対する学習処理を実行するものである。
【0128】
次に、このような機能を備えたシステムにおける具体的な処理について説明する。
【0129】
スキャナ部3によって取り込まれた書状画像は、必要なデータ処理が施された後、ディスプレイ12の画面上に表示される。
【0130】
オペレータは、入力装置13から書状画像中に記載されている差出人情報の一部および宛先情報の一部、例えば郵便番号情報を入力する。入力された情報は学習処理部400内のデータベース検索処理部402に渡され、データベース検索処理部402は入力された差出人に関する入力情報を検索キーとして住所データベース401を検索し、差出人の住所情報を取得する。同様に、入力された受取人に関する入力情報を検索キーとして住所データベース401を検索し、受取人の住所情報を取得する。
【0131】
大量のダイレクトメールを発送したり、逆に大量のメールを受け取ったりする会社および個人に対しては専用の郵便番号が割り振られている場合がある。図21に特定の会社に対して固有の郵便番号が割り振られている例を示す。図21の例では、「××商事」に対して「1009999」という郵便番号が割り振られている。
【0132】
図20では差出人の住所情報検索と受取人の住所情報検索とで同一の住所データベースを使用しているが、別々の住所データベースを使用してもよい。例えば受取人については郵便番号で検索し、差出人については図22に示すような差出人名を検索キーとして住所データベースを使用する場合が考えられる。
【0133】
以下の説明では、差出人・受取人共に郵便番号を検索キーとして住所情報を検索する場合について述べることにする。
【0134】
図23に、オペレータが入力した差出人および受取人の郵便番号情報を元に住所データベース401を検索して住所情報を取得する流れを示す。オペレータは差出人の郵便番号と受取人の郵便番号とを入力装置13から入力する。しかし、同じ差出人からの大量のダイレクトメールを処理する場合には、差出人郵便番号情報は毎回入力する必要はない。そのような場合は、書状画像1枚分の処理が終わって次の書状画像を処理する際に、前に入力した差出人郵便番号の情報はクリアせずに残しておくと、受取人郵便番号を入力するだけで認識処理が開始できるので、効率が良くなる。
【0135】
差出人に関する入力情報は、差出人別書状書式情報記憶部404に渡される。差出人別書状書式情報記憶部404には、図24に示されるように、オペレータが差出人に関して入力した情報や、郵便番号を検索キーとして得られた差出人および受取人の住所情報が記載されている書状画像中の標準位置が記憶されている。スキャナ部3によって取り込まれた書状画像は宛先住所領域判定処理部405に送られる。宛先住所領域判定処理部405は、差出人別書状書式情報記憶部304に登録されている宛先領域情報のうち、オペレータが入力した差出人の郵便番号用に用意されている各種パラメータを元に、書状画像中の宛名記載範囲を推定する。
【0136】
書状画像の宛名記載範囲と推定した範囲から、文字認識処理部(A)406は文字行および文字候補を切り出し、各文字候補をあらかじめ用意してある文字辞書記憶部403内の文字辞書を用いて認識する。図17の(c)は宛名記載範囲内から行を切り出した状態の例である。そしてオペレータが入力装置13から入力した文字列、例えば宛先郵便番号と一致する文字列を検出する。図17の(c)の書状画像の場合、行「212−8501」が検出される。
【0137】
宛先住所郵便番号として「212−8501」を検出した時、宛先郵便番号のすぐそばに記載されている宛先住所情報は住所データベース401で検索して得られた住所情報と一致しているはずである。よって文字画像選択処理部(A)407で宛先郵便番号行付近の行の文字切り出し結果および文字認識結果を「神奈川県川崎市幸区柳町」または「川崎市幸区柳町」と照合する。認識結果と住所情報が一致した場合、この行が宛先住所行であることが判明する。
【0138】
こうして宛先郵便番号行および宛先住所行の記載位置が検出されると、宛先住所領域情報記憶部408でその書状における宛先情報記載領域に関する情報を記憶する。宛先情報記載領域を検出する方法としては、例えば図25に示すように、検出した宛先郵便番号行と宛先住所行の領域を統合することで宛先情報記載領域を検出する。
【0139】
同様の手順で、差出人住所領域判定処理部409で差出人住所情報記載範囲を推定し、文字認識処理部(B)410はその範囲の中から文字候補を切り出して個々の文字候補を認識し、文字画像選択処理部(B)411で差出人住所行を検出する。そして差出人住所領域情報記憶部412では図25に示すように、検出した差出人郵便番号行と差出人住所行の領域を統合することで差出人情報記載領域を検出する。
【0140】
このように、1枚の書状画像を見てオペレータが差出人および受取人の宛先郵便番号を入力するだけで、差出人および受取人の住所情報が記載されている領域に関する情報を取得することができた。この作業を複数枚の書状画像について繰り返し、差出人および受取人情報記載領域に関する情報を差出人ごとに分類して差出人別書状書式学習処理部413に記憶する。
【0141】
こうして宛先住所領域情報記憶部408および差出人住所領域情報記憶部412に蓄積された各種情報は、オペレータが答え教え作業を実施していない時間帯に、差出人別書状書式学習処理部413により、差出人ごとの書状書式に関する学習を行うために使用される。学習処理完了後は、更新されたパラメータで差出人別書状書式情報記憶部404に記憶されている内容を更新する。
【0142】
次に、図26のフローチャートを参照して、本実施形態におけるシステムの動作について説明する。
【0143】
書状画像がスキャナ部3を通じて取り込まれると(ステップS31)、以下のような処理が行われる。
【0144】
宛名住所領域判定処理部405において、差出人別書状書式情報の中の宛先住所領域情報(パラメータ)に基づく宛先住所領域の判定が行われる(ステップS42A)。
【0145】
この後、宛名住所領域判定処理部405で判定された宛先住所領域に対し、前述の図10で説明したステップS12〜S16と同様の処理が、文字認識処理部(A)406や文字画像選択処理部(A)407などにおいて行われる。
【0146】
宛先住所領域情報記憶部408においては、文字画像選択処理部(A)407で選択された各文字列の領域を統合した宛先住所領域の情報(パラメータ)が記憶される(ステップS43A)。
【0147】
一方、差出人住所領域判定処理部409において、差出人別書状書式情報の中の差出人住所領域情報(パラメータ)に基づく差出人住所領域の判定が行われる(ステップS42B)。
【0148】
この後、差出人住所領域判定処理部409で判定された差出人住所領域に対し、前述の図10で説明したステップS12〜S16と同様の処理が、文字認識処理部(B)410や文字画像選択処理部(B)411などにおいて行われる。
【0149】
差出人住所領域情報記憶部412においては、文字画像選択処理部(B)411で選択された各文字列の領域を統合した差出人住所領域の情報(パラメータ)が記憶される(ステップS43B)。
【0150】
差出人別書状書式学習処理部413においては、宛先住所領域情報記憶部408に記憶された宛先住所領域の情報(パラメータ)および差出人住所領域情報記憶部412に記憶された差出人住所領域の情報(パラメータ)を用いた、差出人別書状書式中の宛先住所領域の標準位置および差出人住所領域の標準位置の学習が実行される(ステップS44)。
【0151】
このように第4の実施形態によれば、文字辞書学習や、宛先住所領域の標準位置の学習だけでなく、差出人住所領域の標準位置の学習に関しても自動化することができ、高精度な差出人別書状書式情報を容易に形成することができる。
【0152】
上述した各実施形態で述べた各種の処理手順は、コンピュータプログラムとして、コンピュータにより読み取り可能な記憶媒体(例えば磁気ディスク,光ディスク,半導体メモリ)に記憶させておき、必要に応じてそれをプロセッサにより読み出して実行するようにしてもよい。また、このようなコンピュータプログラムは、通信媒体を介してあるコンピュータから他のコンピュータに伝送することにより配布することも可能である。
【0153】
本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。
【図面の簡単な説明】
【0154】
【図1】この発明の各実施形態に共通して使用される区分機を示す外観図。
【図2】図1に示される区分機の概略構成を示す図。
【図3】この発明の第1の実施形態に係わる、オペレータが入力した文字列を元に郵便物に記載された宛先情報を認識するための文字辞書を自動学習させるシステムの構成を示すブロック図。
【図4】住所データベースに登録されている情報の第1の例。
【図5】住所データベースに登録されている情報の第2の例。
【図6】書状画像の一例を示す図。
【図7】1行につき複数通りの文字切り出し候補が発生することを示す図。
【図8】文字認識処理部において宛先住所行を処理した時の文字切り出し候補および文字認識結果の一例を示す図。
【図9】異なるカテゴリに相当する複数の文字画像が一つの文字コードに対応付けられて文字辞書に登録されることを示す図。
【図10】この発明の第1の実施形態におけるシステムの動作を示すフローチャート。
【図11】図10中のステップS18(文字学習処理)における詳細な処理を示すフローチャート。
【図12】この発明の第2の実施形態に係わる、オペレータが答え教えすることなく、郵便物に記載された宛先情報を認識するための文字辞書を自動学習させるシステムの構成を示すブロック図。
【図13】検索キーとして氏名を用いて住所検索を行える住所データベースの例を示す図。
【図14】検索キーとして電話番号を用いて住所検索を行える住所データベースの例を示す図。
【図15】この発明の第2の実施形態におけるシステムの動作を示すフローチャート。
【図16】この発明の第3の実施形態に係わる、オペレータが入力した文字列を元に郵便物に記載された宛先情報記載領域の標準位置を自動学習させるシステムの構成を示すブロック図。
【図17】宛名記載範囲推定処理の一例を示す図。
【図18】宛先郵便番号行と宛先住所行の領域を統合することで宛先情報記載領域を検出することを示す図。
【図19】この発明の第3の実施形態におけるシステムの動作を示すフローチャート。
【図20】この発明の第4の実施形態に係わる、オペレータが入力した文字列を元に郵便物に記載された差出人ごとに差出人住所情報記載領域と宛先情報記載領域の標準位置を自動学習させるシステムの構成を示すブロック図。
【図21】特定の会社に対して固有の郵便番号が割り振られている例を示す図。
【図22】差出人名を検索キーとして住所データベースを使用することを示す図。
【図23】オペレータが入力した差出人および受取人の郵便番号情報を元に住所データベースを検索して住所情報を取得する流れを示す図。
【図24】差出人別書状書式情報記憶部に記憶される各種の情報を示す図。
【図25】宛先郵便番号行と宛先住所行の領域を統合することで宛先情報記載領域を検出することを示す図。
【図26】この発明の第4の実施形態におけるシステムの動作を示すフローチャート。
【符号の説明】
【0155】
1…区分機、2…供給部、3…スキャナ部、4…、5…区分部、6…収納部、7…載置台、8…取出し部、10…情報処理部、11…制御部、12…ディスプレイ、13…入力装置、100,200…辞書学習処理部、300…宛先情報領域学習処理部、400…差出人別書状書式学習処理部。
【特許請求の範囲】
【請求項1】
住所情報が記載された書状の画像を取り込んで文字認識処理を行う情報処理装置であって、
書状の記載に使用される個々の住所に関する情報を記憶する住所情報記憶手段と、
第1の文字列を検索キーとして、前記住所情報記憶手段に記憶されている情報の中から住所に相当する第2の文字列を検索する検索処理手段と、
前記書状の記載に使用される個々の文字とその画像である文字画像との対応関係を示す文字辞書を記憶する文字辞書記憶手段と、
前記文字辞書記憶手段に記憶されている前記文字辞書を用いて、前記画像の中の所定の領域に対する文字認識を行い、少なくとも住所を含む文字列の候補を生成する文字認識処理手段と、
前記文字認識処理手段により生成された候補の中から、前記検索処理手段によって検索された前記第2の文字列に該当する文字列を選択する文字画像選択処理手段と、
前記文字画像選択処理手段により選択された前記文字列を構成する個々の文字とその文字画像との対応関係を用いて、前記文字辞書記憶手段に記憶されている前記文字辞書に対する学習処理を実行する文字辞書学習処理手段と、
を具備することを特徴とする情報処理装置。
【請求項2】
文字辞書記憶手段に記憶されている前記文字辞書は、一つの文字に対して複数の異なる種類の文字画像を対応付けて登録することが可能であることを特徴とする請求項1記載の情報処理装置。
【請求項3】
前記第1の文字列は、郵便番号に相当するものであることを特徴とする請求項1記載の情報処理装置。
【請求項4】
前記第1の文字列は、氏名もしくは名称に相当するものであることを特徴とする請求項1記載の情報処理装置。
【請求項5】
前記第1の文字列は、電話番号に相当するものであることを特徴とする請求項1記載の情報処理装置。
【請求項6】
前記第1の文字列は、入力装置を通じて入力されるものであることを特徴とする請求項1記載の情報処理装置。
【請求項7】
前記文字画像選択処理手段は、前記文字認識処理手段により生成された候補の中から、前記入力装置を通じて入力された前記第1の文字列に該当する文字列を選択し、この選択した文字列が前記画像の中で位置している行に隣接する行の文字列の候補の中から、前記第2の文字列に該当する文字列を選択することを特徴とする請求項6記載の情報処理装置。
【請求項8】
前記文字認識処理手段は、前記画像の中の所定の領域に対する文字認識を行って、前記検索キーとして使用される前記第1の文字列の候補を生成する第1の認識処理手段と、この第1の文字列の前記画像上で位置する行に隣接する行から前記第2の文字列の候補を生成する第2の認識処理手段とを含むことを特徴とする請求項1記載の情報処理装置。
【請求項9】
前記画像の中の宛先住所の領域を示す宛先住所領域情報を記憶する宛先住所領域情報記憶手段と、
前記宛先住所領域情報記憶手段に記憶されている前記宛先住所領域情報に基づいて、前記文字認識処理手段が文字認識を行うべき領域を判定する宛先住所領域判定手段と、
前記文字画像選択処理手段により選択された前記第1の文字列及び第2の文字列の前記画像上の各領域に基づいて、前記宛先住所領域情報記憶手段に記憶されている前記宛先住所領域情報に対する学習処理を実行する宛先住所領域情報学習処理手段と、
を更に具備することを特徴とする請求項7記載の情報処理装置。
【請求項10】
差出人別に書状の書式が定義された差出人別書状書式情報を記憶する差出人別書状書式情報記憶手段と、
前記差出人別書状書式情報記憶手段に記憶されている前記差出人別書状書式情報に基づいて、前記文字認識処理手段が文字認識を行うべき領域の中の宛先住所領域を判定する宛先住所領域判定手段と、
前記差出人別書状書式情報記憶手段に記憶されている前記差出人別書状書式情報に基づいて、前記文字認識処理手段が文字認識を行うべき領域の中の差出人住所領域を判定する差出人住所領域判定手段と、
前記文字画像選択処理手段によって前記宛先住所領域および前記差出人住所領域の各々に関して選択される前記第1の文字列及び第2の文字列の前記画像上の各領域に基づいて、前記差出人別書状書式情報記憶手段に記憶されている前記差出人別書状書式情報に対する学習処理を実行する宛先住所領域情報学習処理手段と、
を更に具備することを特徴とする請求項7記載の情報処理装置。
【請求項1】
住所情報が記載された書状の画像を取り込んで文字認識処理を行う情報処理装置であって、
書状の記載に使用される個々の住所に関する情報を記憶する住所情報記憶手段と、
第1の文字列を検索キーとして、前記住所情報記憶手段に記憶されている情報の中から住所に相当する第2の文字列を検索する検索処理手段と、
前記書状の記載に使用される個々の文字とその画像である文字画像との対応関係を示す文字辞書を記憶する文字辞書記憶手段と、
前記文字辞書記憶手段に記憶されている前記文字辞書を用いて、前記画像の中の所定の領域に対する文字認識を行い、少なくとも住所を含む文字列の候補を生成する文字認識処理手段と、
前記文字認識処理手段により生成された候補の中から、前記検索処理手段によって検索された前記第2の文字列に該当する文字列を選択する文字画像選択処理手段と、
前記文字画像選択処理手段により選択された前記文字列を構成する個々の文字とその文字画像との対応関係を用いて、前記文字辞書記憶手段に記憶されている前記文字辞書に対する学習処理を実行する文字辞書学習処理手段と、
を具備することを特徴とする情報処理装置。
【請求項2】
文字辞書記憶手段に記憶されている前記文字辞書は、一つの文字に対して複数の異なる種類の文字画像を対応付けて登録することが可能であることを特徴とする請求項1記載の情報処理装置。
【請求項3】
前記第1の文字列は、郵便番号に相当するものであることを特徴とする請求項1記載の情報処理装置。
【請求項4】
前記第1の文字列は、氏名もしくは名称に相当するものであることを特徴とする請求項1記載の情報処理装置。
【請求項5】
前記第1の文字列は、電話番号に相当するものであることを特徴とする請求項1記載の情報処理装置。
【請求項6】
前記第1の文字列は、入力装置を通じて入力されるものであることを特徴とする請求項1記載の情報処理装置。
【請求項7】
前記文字画像選択処理手段は、前記文字認識処理手段により生成された候補の中から、前記入力装置を通じて入力された前記第1の文字列に該当する文字列を選択し、この選択した文字列が前記画像の中で位置している行に隣接する行の文字列の候補の中から、前記第2の文字列に該当する文字列を選択することを特徴とする請求項6記載の情報処理装置。
【請求項8】
前記文字認識処理手段は、前記画像の中の所定の領域に対する文字認識を行って、前記検索キーとして使用される前記第1の文字列の候補を生成する第1の認識処理手段と、この第1の文字列の前記画像上で位置する行に隣接する行から前記第2の文字列の候補を生成する第2の認識処理手段とを含むことを特徴とする請求項1記載の情報処理装置。
【請求項9】
前記画像の中の宛先住所の領域を示す宛先住所領域情報を記憶する宛先住所領域情報記憶手段と、
前記宛先住所領域情報記憶手段に記憶されている前記宛先住所領域情報に基づいて、前記文字認識処理手段が文字認識を行うべき領域を判定する宛先住所領域判定手段と、
前記文字画像選択処理手段により選択された前記第1の文字列及び第2の文字列の前記画像上の各領域に基づいて、前記宛先住所領域情報記憶手段に記憶されている前記宛先住所領域情報に対する学習処理を実行する宛先住所領域情報学習処理手段と、
を更に具備することを特徴とする請求項7記載の情報処理装置。
【請求項10】
差出人別に書状の書式が定義された差出人別書状書式情報を記憶する差出人別書状書式情報記憶手段と、
前記差出人別書状書式情報記憶手段に記憶されている前記差出人別書状書式情報に基づいて、前記文字認識処理手段が文字認識を行うべき領域の中の宛先住所領域を判定する宛先住所領域判定手段と、
前記差出人別書状書式情報記憶手段に記憶されている前記差出人別書状書式情報に基づいて、前記文字認識処理手段が文字認識を行うべき領域の中の差出人住所領域を判定する差出人住所領域判定手段と、
前記文字画像選択処理手段によって前記宛先住所領域および前記差出人住所領域の各々に関して選択される前記第1の文字列及び第2の文字列の前記画像上の各領域に基づいて、前記差出人別書状書式情報記憶手段に記憶されている前記差出人別書状書式情報に対する学習処理を実行する宛先住所領域情報学習処理手段と、
を更に具備することを特徴とする請求項7記載の情報処理装置。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【図21】
【図22】
【図23】
【図24】
【図25】
【図26】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【図21】
【図22】
【図23】
【図24】
【図25】
【図26】
【公開番号】特開2007−4584(P2007−4584A)
【公開日】平成19年1月11日(2007.1.11)
【国際特許分類】
【出願番号】特願2005−185178(P2005−185178)
【出願日】平成17年6月24日(2005.6.24)
【出願人】(000003078)株式会社東芝 (54,554)
【Fターム(参考)】
【公開日】平成19年1月11日(2007.1.11)
【国際特許分類】
【出願日】平成17年6月24日(2005.6.24)
【出願人】(000003078)株式会社東芝 (54,554)
【Fターム(参考)】
[ Back to top ]