説明

文字入力装置、文字入力方法

【課題】文字認識結果を確認および訂正する場合に正しい文字を効率よく入力することができる文字入力装置、文字入力方法を提供する。
【解決手段】文字入力装置は、文字認識部、受付部、第1マッチング部、文字列設定部、記憶部を有する。文字認識部は帳票の画像に対して文字認識処理を行うことで認識結果として一つ以上の文字列を得る。受付部は一つ以上の文字列をそれぞれ分類するための項目を有し、各項目に対する入力文字列の入力を受け付ける。前記第1マッチング部は前記受付部により受け付けられた前記入力文字列と前記文字認識部により得られた一つ以上の文字列とをマッチングする。前記文字列設定部は前記入力文字列とマッチした前記文字列を前記入力文字列が入力された項目に対応付けて前記記憶部に記憶する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明の実施形態は、帳票に記載された情報を読み取り、読み取った情報に含まれる文字列を項目毎に分類する文字入力装置、文字入力方法に関する。
【背景技術】
【0002】
例えば名刺などの帳票に記載された情報(会社名、氏名、住所、役職、連絡先の電話番号など)を読み取り項目毎に分類する文字入力装置がある。
この種の文字入力装置では、読み取った結果を、各項目毎に自動的に分類し表示画面に表示してオペレータに確認を促す。
従来、オペレータが認識結果の文字を確認し、場合によっては、認識結果の文字を置き換えるための、いくつかの文字候補を既定の辞書から読み出して予測文字列として表示画面に表示する技術がある。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2000−348141号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
従来の自動項目分類の技術は、それほど精度のよいものではないため、誤分類の発生頻度が高く、誤分類が生じた場合は、該当項目から文字列を削除し再分類する必要があり、多くの時間を要することになる。
また従来の技術の場合、各項目への分類候補として表示される文字は、あくまでも辞書に登録されているものに限られることから、分類する候補として適切なものが表示されないことが多々ある。認識結果として適切でない文字が項目に分類された場合、上記同様に再分類の作業を要し作業効率が低下するという問題があった。
【0005】
本発明が解決しようとする課題は、帳票から読み取った文字列を適切な項目に分類することができる文字入力装置、文字入力方法を提供することにある。
【課題を解決するための手段】
【0006】
実施形態の文字入力装置は、文字認識部、受付部、第1マッチング部、文字列設定部、記憶部を有する。前記文字認識部は帳票を光学的に読み取って得られた画像に対して文字認識処理を行うことで認識結果として一つ以上の文字列を得る。前記受付部は前記文字認識部により認識された一つ以上の文字列をそれぞれ分類するための項目を有し、各項目に対する入力文字列の入力を受け付ける。前記第1マッチング部は前記受付部により受け付けられた前記入力文字列と前記文字認識部により得られた一つ以上の文字列とをマッチングする。前記文字列設定部は前記入力文字列とマッチした前記文字列を前記入力文字列が入力された項目に対応付けて前記記憶部に記憶する。
【図面の簡単な説明】
【0007】
【図1】第1実施形態の文字入力システムの構成を示す図である。
【図2】名刺を読み取った入力画像の一例を示す図である。
【図3】第1実施形態の文字入力システムの動作を示すフローチャートである。
【図4】入力画像から切り出した文字列画像のグループ毎に算出した外接矩形で文字画像を囲んだ様子を示す図である。
【図5】グループの各々を認識して得られた認識結果の例を示す。
【図6】入力ウィンドウの一例を示す図である。
【図7】DPマッチングによって最適化された入力文字列と認識結果のマッチングの様子を示す図である。
【図8】最適でないマッチングの様子を示す図である。
【図9】図5で示した認識結果のうち入力文字列「認識」とマッチングして列挙される文字列の一覧を示す図である。
【図10】認識結果、入力文字列およびマッチング結果の一例を示す図である。
【図11】入力ウィンドウに表示するリストボックスの表示例を示す図である。
【図12】入力ウィンドウにリストボックスを強調表示した例を示す図である。
【図13】文字入力システムのマッチング動作を示すフローチャートである。
【図14】「↓」キーが押された場合のマッチング結果選択部の動作を示すフローチャートである。
【図15】「↑」キーが押された場合のマッチング結果選択部の動作を示すフローチャートである。
【図16】「Enter」キーが押された場合のマッチング結果選択部の動作を示すフローチャートである。
【図17】「Tab」キーが押された場合のマッチング結果選択部の動作を示すフローチャートである。
【図18】第2実施形態の文字入力システムの構成を示すブロック図である。
【図19】単語辞書に格納される文字列の一例を示す図である。
【図20】第2マッチング部における単語マッチングと置き換えの様子を示す図である。
【図21】第3実施形態における文字列設定部の動作の様子を示すブロック図である。
【図22】第7実施形態の文字入力システムの構成を示すブロック図である。
【図23】第3マッチング部での入力文字列の設定の様子を示す図である。
【図24】第8実施形態の文字入力システムの構成を示すブロック図である。
【発明を実施するための形態】
【0008】
以下、図面を参照して、実施形態を詳細に説明する。
(第1実施形態)
図1は第1実施形態の文字入力システムの構成を示す図である。
図1に示すように、この実施形態の文字入力システムは、スキャナ1等の画像読取装置と、キーボード2等のキー入力装置と、モニタ3等の表示装置と、これらの機器と通信ケーブルまたはネットワークを介して接続されたコンピュータ10(以下「PC10」と称す)とを有している。
【0009】
PC10は、CPU、メモリ、ハードディスク装置、通信インターフェースなどのハードウェアと、ハードディスク装置にインストールされたプログラム(オペレーティングシステム(以下「OS」と称す)、画像認識ソフトウェアなど)を有するコンピュータである。メモリは記憶部13として機能する。
【0010】
ソフトウェア(プログラム)は、画像受付部11、文字認識部12、文字受付部14、第1マッチング部15、マッチング結果選択部16、文字列設定部17などを有している。
【0011】
画像受付部11は、スキャナ1から入力される帳票読取結果の画像(以下「入力画像」と称す)を受け付ける。文字認識部12は入力画像中から、文字画像の切り出しと切り出した文字画像に対する文字認識を行うことで、認識結果(テキストデータ(文字)と文字画像(または文字列と文字列画像)との組)を得る。すなわち文字認識部12は帳票を光学的に読み取って得られた画像に対して文字認識処理を行うことで認識結果として一つ以上の文字列(図5参照)を得る。なお以降の説明では単独の文字または文字列を「文字列」と称す。
【0012】
文字受付部14は、ユーザーによるキーボード2のキー操作で入力されたテキストデータ(入力文字列と称す)を受け付ける。
具体的には、文字受付部14は、文字認識部12により認識された一つ以上の文字列をそれぞれ分類するための項目を有する画面(図6の入力ウィンドウ51参照)をモニタ3に表示し、各項目に対する入力文字列の入力を受け付ける受付部として機能する。
【0013】
第1マッチング部15は文字認識部12により得られた認識結果の文字列と文字受付部14により受け付けられた入力文字列とをマッチングする。マッチング結果選択部16は、第1マッチング部15によるマッチングの結果、入力文字列とマッチした文字列が複数存在した場合、リストボックス52に候補リスト(選択候補)としてユーザーに提示し選択を促す。つまり第1マッチング部15でマッチしたマッチング結果を入力候補の文字列として入力ウィンドウ51に表示してユーザーに提示し、その候補の中のいずれかをユーザーに選択させる。
【0014】
文字列設定部17は入力文字列とマッチした文字列を入力文字列が入力された項目に対応付けて記憶部13に記憶する。
また、入力文字列とマッチした文字列が複数存在する場合、文字列設定部17は候補リストからユーザーに選択された候補をその項目に入力された入力文字列と置き換える。すなわち文字列設定部17は入力ウィンドウ51に表示された候補(リストボックス52の候補リスト)の中から、選択された候補を、入力文字列を入力した項目に設定し、項目と認識結果の文字列とを対応付ける。
【0015】
この実施形態は、PC10に汎用のOSと画像認識ソフトウェアを組み込むことによって構成できるため、以下ではそのような構成を仮定して説明を行う。但し、ここに示した実施形態は一例にしかすぎず、例えば各部を専用ハードウェアや、その集合体、または分散処理用のコンピュータネットワークとしてもよい。すなわち上述の各部の機能を含む構成ならば、ここで挙げた構成に関わらずどのようなもので実装してもよい。
【0016】
またこの第1実施形態では、記憶部13としてメモリを一例にあげたが、具体的には、例えば画像や変数等のデータを記憶可能なランダムアクセスメモリ(RAM)やハードディスクドライブ装置、フラッシュメモリ、ソリッドステートドライブ(SSD)等である。この他、特に断りがない限りこの実施形態では記憶部13として表記するが、上記したものに限らず記憶部13としては他のいかなる記憶媒体を用いてもよい。
【0017】
続いて図2乃至図17を参照して第1実施形態の文字入力システムの動作を説明する。
この第1実施形態の場合、スキャナ1の読み取り台にセットされた名刺がスキャナ1により読み取られると、図2に示すような名刺の画像(入力画像)がPC10に入力される。その入力画像を画像受付部11が受け付け、文字認識部12に渡す。
【0018】
文字認識部12では、入力画像から文字列が含まれる領域(部分)を検出およびその領域をグループ単位で認識し、認識結果(文字画像とテキストデータとの組)を記憶部13に記憶する。
【0019】
具体的には、文字認識部12における文字列の検出・認識動作は、図3のフローチャートに示すような手順で行われる。
【0020】
すなわち、文字認識部12は入力画像中から文字を構成する黒画素の連結成分を検出する(図3のステップS101)。
【0021】
文字認識部12は連結成分のうち、距離が予め設定された閾値以下の連結成分同士をまとめたグループを作成する(ステップS102)。
【0022】
文字認識部12は、作成した各々のグループについて外接矩形を算出する(ステップS103)。
【0023】
文字認識部12は、図4に示すように、各々の外接矩形で囲まれたグループ毎の文字画像について文字認識処理を実行し、図5に示すような認識結果(複数の文字列)を記憶部13に記憶する(ステップS104)。
【0024】
文字受付部14は、入力ウィンドウ51(図6参照)を表示し、ユーザーがキーボード2を操作することにより、入力ウィンドウ51内の各項目の欄に入力文字列が入力された場合、その入力文字列を受け付け、第1マッチング部15へ渡す。
【0025】
図6に示すように、入力ウィンドウ51には、「姓名」、「会社名」、「部署名」、「役職名」、「事業所名」、「郵便番号」、「住所」などの項目で文字列の入力フィールドが設けられている。この例では「姓名」という項目の入力フィールド(欄)に、例えば「認識」という文字列が入力文字列として入力されたものとする。
【0026】
なお、文字受付部14は、この他、キータイプを直接検知して当該文字に変換することで文字を取得してもよい。さらに仮名漢字変換フロントエンドプロセッサ等の外部プログラムを介して行って文字を取得してもよく、前述の趣旨を脱しない限りいかなる方法で文字を取得してもよい。
【0027】
次に、第1マッチング部15は、文字受付部14で受け付けた入力文字列と文字認識部12での認識結果の文字列とをマッチングし、マッチング結果を列挙(記憶部13に記憶)する。
【0028】
第1マッチング部15は文字受付部14で記憶した入力文字列と、認識結果の文字列各々について、例えばDPマッチングなどの技術を用いてマッチングし、それぞれの文字列のスコア(コスト)を算出し、算出したスコア(コスト)の順(スコア(コスト)の上位何番目まで)に候補を列挙(選出)する。
【0029】
この文字入力システムにおいて、DPマッチングは入力文字列の両端が固定、認識結果の両端がフリーの条件下で行う。
【0030】
一般に文字列同士のDPマッチングによる対応付けでは、図7に示すように、文字間の対応付けの状況によってスコア(以下「コスト」と称す)を定義し、それらを合計することで文字列全体の対応付けのコストを定義する。そして、このコストを最小化することで対応付けを最適化する。
【0031】
本実施形態では、図7、図8に示すように、入力文字列「認識」と認識結果の文字列「認識太郎」とで一致する文字が対応付けられた箇所のコストが0、入力文字列の中の文字と認識結果の文字列の中の不読文字とが対応付けられた箇所のコストがC1=10、入力文字列の中の文字と認識結果の文字列の中の文字とで異なる文字が対応付けられた箇所のコストがC2=20、入力文字列中の文字に認識結果の文字列の中の文字が対応付けられなかった場合のコストがC3=100、認識結果中の文字に入力文字列中の文字が対応付けられなかった場合のコストがC4=100とする。
【0032】
但し、認識結果の文字列の中の文字に入力文字列の中の文字が対応付けられなかった場合でも、当該文字が入力文字列の最初の文字に対応付けられた文字より前あるいは既入力の文字列の最後の文字に対応付けられた文字より後ならば、当該文字のコストは0とする。こうすることで認識結果の文字列の両端がフリー(認識結果に文字を追加可能)のDPマッチングを行うことができる。
【0033】
ここで示したコストC1、C2、C3、C4などの値は一例であり、自然なマッチングが期待できる値である限りいかなる値を設定してもよい。
【0034】
第1マッチング部15は、上記DPマッチングのコストが最低の認識結果を予め任意に定めた個数以内で列挙(選出)する。また、第1マッチング部15は、コストが予め任意に定められた定数以下(例えば0)の認識結果のみを列挙(選出)することで、図9に示すように、「認識」とい文字列が含まれる認識結果の文字列「認識太郎」、「認識ソリューション株式会社」、「認識県認識市認識町9−99−999」などがスコアの低い順に選出される。
【0035】
第1マッチング部15は、前述のDPマッチングで認識結果の内で入力文字列中の文字と対応付けられた文字の各々を、入力文字列中で対応付けられた文字に置き換え、マッチング結果とする。認識結果、入力文字列およびマッチング結果の一例を図10に示す。
【0036】
マッチング結果選択部16では、第1マッチング部15でマッチしたマッチング結果を入力候補文字列として、図6に示す入力ウィンドウ51の該当フィールドに表示してユーザーに提示し、入力候補文字列のうちいずれかを選択させる。
【0037】
マッチング結果選択部16は、マッチング結果を入力中の文字列の直下にリスト表示する。図11にリスト表示の一例を示す。リスト表示の機能はOSやウィジェットセットが提供するリストボックス表示機能により実現される。
【0038】
マッチング結果はリストボックス中の表示項目として登録され、マウス等のポインティングデバイスでクリックすることにより選択される。選択されたマッチング結果の番号(値)は変数SPOSに記憶される。変数SPOSは記憶部13に記憶されている。
【0039】
マッチング結果選択部16は、変数SPOSに値を設定した後、後述する文字列設定部17でSPOS番目のマッチング結果が入力文字列に設定されるように制御を行う。
【0040】
また、マッチング結果選択部16は、マッチング結果がキー操作によっても選択可能となるように、キー入力を監視してリストボックスの表示を制御する。
【0041】
図12に示すように、リストボックス52は、表示されている項目のうち1項目が強調表示されようになっており、マッチング結果選択部16は、強調表示によって項目、すなわちマッチング結果の仮選択を示す。
【0042】
仮選択の状態は、記憶部13に記憶されている変数KPOSで管理する。変数KPOSには仮選択がされていない状態で0が設定され、仮選択がされている状態では仮選択されているマッチング結果の番号が設定される。なお最初のマッチング結果が仮選択されている場合には1が設定される。また、以下ではマッチング結果の個数をnとする。
【0043】
マッチング結果選択部16は、第1マッチング部15により文字どうしがマッチングされる度に、図13に示すフローチャートの処理を行う。
【0044】
すなわち、マッチング結果選択部16は、まず、リストボックスがモニタ3に表示されているか否かを確認し(図13のステップS201)、リストボックスが表示されていなければ(ステップS201のNo)、リストボックスを表示する(ステップS202)。
【0045】
続いて、マッチング結果選択部16は、表示したリストボックスにマッチング結果の一覧を設定する(ステップS203)。
【0046】
最後に、マッチング結果選択部16は、変数KPOS=0とし、仮選択がなされていない状態にする(ステップS204)。
【0047】
マッチング結果選択部16は、キーボード2の第1の仮選択キー(例えば「↓」の刻印がなされているキー)が押される度に図14に示すフローチャートの処理を行う
すなわち、マッチング結果選択部16は、変数KPOSの値を確認し、変数KPOSの値が0か、0よりも大きな値かを判定する(ステップS301)。
【0048】
この判定の結果、変数KPOS>0の場合(ステップS301のYes)、つまり仮選択がなされている場合、マッチング結果選択部16は、変数KPOS=min(KPOS+1、n)とする(ステップS302)。ただし、min(x、y)はxとyのうち小さい方の数を返す関数である。
【0049】
また上記判定の結果、変数KPOS=0の場合(ステップS301のNo)、つまり仮選択がなされていない場合、マッチング結果選択部16は、変数KPOS=1、つまり第1番目のマッチング結果が選択された状態にする(ステップS303)。
【0050】
そして最後に、マッチング結果選択部16は、KPOS番目のマッチング結果を強調表示する(ステップS304)。
【0051】
マッチング結果選択部16は、キーボード2の第2の仮選択キー(例えば「↑」の刻印がなされているキー)が押される度に図15に示すフローチャートの処理を行う。
【0052】
すなわち、マッチング結果選択部16は、変数KPOSの値を確認し、変数KPOSの値が0か、0よりも大きな値かを判定する(ステップS401)。
【0053】
この判定の結果、変数KPOS>0の場合(ステップS401のYes)、つまり仮選択がなされている場合、マッチング結果選択部16は、KPOS=max(KPOS−1、1)とする(ステップS402)。但しmax(x、y)はxとyのうち大きい方の数を返す関数である。
【0054】
また上記判定の結果、変数KPOS=0の場合(ステップS401のNo)、つまり仮選択がなされていない場合、マッチング結果選択部16は、変数KPOS=nとする(ステップS403)。つまり第n番目のマッチング結果が選択された状態にする。
【0055】
そして最後に、マッチング結果選択部16は、KPOS番目のマッチング結果を強調表示する(ステップS404)。
【0056】
マッチング結果選択部16は、キーボード2の選択決定キー(例えば「Enter」の刻印がなされているキー)が押される度に図16に示すフローチャートの処理を行う。
【0057】
すなわち、マッチング結果選択部16は、変数KPOSの値を確認し、変数KPOSの値が0か、0よりも大きな値かを判定する(図16のステップS501)。
【0058】
この判定の結果、KPOS>0の場合(ステップS501のYes)、つまり仮選択がなされている場合、マッチング結果選択部16は、SPOS=KPOSとし(ステップS502)、後述する文字列設定部17でSPOS番目のマッチング結果が入力文字列に設定されるように制御を行う(ステップS503)。
【0059】
続いて、マッチング結果選択部16は、KPOS=0とし(ステップS504)、仮選択がなされていない状態にする。
【0060】
最後に、マッチング結果選択部16は、リストボックス52を非表示にする(ステップS505)。
【0061】
マッチング結果選択部16は、キーボード2の第2の選択決定キー(例えば「Tab」の刻印がなされているキー)が押される度に図17に示すフローチャートの処理を行う。
【0062】
すなわち、マッチング結果選択部16は、カウンタの値nを1と設定する(図17のステップS601)。
【0063】
そして、カウンタの値n=1の場合(ステップS601のYes)、マッチング結果選択部16は、SPOS=1とし(ステップS602)、後述する文字列設定部17でSPOS番目のマッチング結果が入力文字列に設定されるように制御を行う(ステップS603)。
【0064】
そして、マッチング結果選択部16は、KPOS=0とし(ステップS504)、仮選択がなされていない状態にする。
【0065】
最後に、マッチング結果選択部16は、リストボックス52を非表示にする(ステップS605)。
【0066】
文字列設定部17は、選択したマッチング結果を入力中の文字列に設定する。
文字列設定部17は、エディットボックス中にマッチング結果選択部16で選択されたマッチング結果を設定すると共に、エディットボックス中に一時保持した入力文字列をマッチング結果選択部16で選択されたマッチング結果の文字列で置き換える。
【0067】
このようにこの第1実施形態によれば、例えば名刺等の帳票をスキャナ1で読み取って得られた情報(一つ以上の文字列)を、例えば「姓名」、「会社名、」、…「住所」などの各項目に分類する上で、各項目の入力フィールドに初めの数文字程度(1,2文字か単語程度)の入力文字列をキー入力することで、入力文字列と認識結果の一つ以上の文字列とをマッチングし、マッチした文字列を、入力文字列を入力した項目と対応付けて記憶部13に記憶するので、帳票から読み取った文字または文字列を適切な項目に分類することができる。
また、マッチした文字列が複数存在する場合には、キー入力した入力文字列と置換する選択候補としてリストボックスに表示するので、現在仮名漢字変換や携帯端末等で一般的となった予測入力とルックアンドフィールが同様のインターフェースで実現できると共に、文字認識の結果から得た候補からユーザーが選択する形で入力でき、項目への文字入力を効率化することができる。
【0068】
(第2実施形態)
次に、図18を参照して第2実施形態の文字入力システムを説明する。図18は第2の実施形態の文字入力システムの構成を示す図である。なお図18において第1実施形態と同じ構成には同一の符号を付しその説明は省略する。
【0069】
図18に示すように、この第2の実施形態の文字入力システムのPC10は、単語辞書記憶部18、第2マッチング部19を有している。単語辞書記憶部18はメモリ等により実現される。単語辞書記憶部18には、複数の単語を格納した単語辞書が記憶されている。図19に示すように、単語辞書には辞書中の単語が文字列の配列として格納されている。
【0070】
第2マッチング部19は、文字受付部14により受け付けられた入力文字列と文字認識部12により得られた一つ以上の文字列と単語辞書中の単語とをマッチングして、該当項目に分類すべき文字列を選出する。
【0071】
具体的には、第2マッチング部19は、認識結果の文字列と入力文字列をキーにして単語辞書を検索し、ヒットした単語を選択候補(入力候補文字列)として読み出す。
【0072】
この場合、マッチング結果選択部16は第2マッチング部19によるマッチング結果を入力ウィンドウ51に該当項目に分類すべき選択候補の文字列として表示し、ユーザーに提示し選択させる。なおマッチング結果選択部16は認識結果の文字列と入力文字列にマッチした単語が複数存在した場合、選択候補として提示する。
【0073】
すなわち本実施形態におけるマッチング結果選択部16は第1マッチング部15の代わりに第2のマッチング部19でマッチしたマッチング結果を候補リストとしてユーザーに提示する。
【0074】
続いて、第2実施形態の文字入力システムの動作を説明する。
この第2実施形態では、第2マッチング部19は、文字認識部12での認識結果、文字受付部14で受け付けた入力文字列および単語辞書中の単語をマッチングする。
【0075】
第2マッチング部19は、先ず、認識結果の文字列各々について、単語辞書中の単語の各々とマッチングを行い、認識結果の文字列を単語辞書中の単語に置き換えることで、誤読文字または不読文字を除外した補正済み認識結果の文字列を生成する。
【0076】
単語辞書の単語と認識結果の文字列とのマッチングについては、第1の実施形態における第1マッチング部15での入力文字列に対する認識結果の文字列との対応付けと同じ方法で行う。
【0077】
次に、第2マッチング部19は、ユーザーによりキー入力された入力文字列と補正済み認識結果の文字列各々とをマッチングし、マッチング結果を得る。補正済み認識結果と入力文字列のマッチングは、第1実施形態における第1マッチング部15での認識結果と入力文字列の対応付けと同じ方法で行う。
【0078】
図20に示すように、認識結果の文字列が、例えば「認識ソンェーション株式会社」であり、キー入力された入力文字列が「ソリューション」である場合、第2マッチング部19は、入力文字列を優先して認識結果の文字列の該当部分を置換することで、「認識ソリューション株式会社」という補正済み認識結果を得る。すなわち認識結果の不読または誤読文字の部分が入力文字列に置換され、正しい文字を入力することができる。
【0079】
このようにこの第2実施形態によれば、分類対象の項目にキー入力された入力文字列と、認識結果の文字列と単語辞書中の単語とを併せてマッチングすることで、分類対象の項目に、より適切な選択候補をリストアップ(提示)することができる。なお項目欄に入力した入力文字列と認識結果の文字列と単語辞書中の単語などの3つ異なる情報ソースからの文字列をマッチングするには最初に2つをマッチングした後、その結果と残りの一つをマッチングすることになるため、いくつかの組み合わせが考えられるが、文字列のマッチングの全ての組み合わせは本発明の適用範囲に含まれる。
【0080】
(第3実施形態)
次に、第3実施形態の文字入力システムを説明する。なおこの第3実施形態は第1実施形態または第2の実施形態と同様に構成されるため構成図とその説明は省略する。
【0081】
この第3実施形態は、マッチング結果に例えば「?」等で示される不読文字が含まれている場合の動作に関するものであり、図21に示すように、姓名の項目欄に、例えば「認識」という入力文字列をユーザーが入力すると、マッチング結果としてリストボックス52に、例えば「認識太郎」、「認識ソリューション??社」、「認識県認識市認識町9−99−999」などの認識結果の文字列が表示される。この例では「認識ソリューション??社」という文字列に不読文字「?」、「?」が二つ含まれている。
この場合、不読文字「?」、「?」が含まれた「認識ソリューション??社」という文字列がユーザーにより選択されると、文字列設定部17は、「認識ソリューション??社」の中の不読文字「?」、「?」の直前までの文字である「認識ソリューション」を、項目欄に入力された編集対象の入力文字列「認識」と置換する。その他の動作は第1または第2実施形態と同様である。
【0082】
このようにこの第3実施形態によれば、認識結果の文字列と入力中の文字列および単語辞書中の単語を併せてマッチングしたときに、認識結果の中に不読文字や誤読文字が含まれていた場合でも、認識結果の文字列中の不読文字または誤読文字直前までの文字列を入力ウィンドウ51の入力フィールドにキー入力された入力文字列と置換することで、従来のように、誤分類からの再分類の手間をかけることなく、該当項目に適切な文字列を分類でき、作業効率を向上することができる。
【0083】
(第4実施形態)
次に、第4実施形態の文字入力システムを説明する。なおこの第4実施形態は第1実施形態または第2の実施形態と同様に構成されるため構成図とその説明は省略する。
【0084】
この第4実施形態は、第1マッチング部15または第2マッチング部19において、当該入力画像について認識結果の一つ以上の文字列(選択候補)の中からマッチング結果選択部16で既に選択された文字列(候補)に対して提示対象外を示すフラグを付し、フラグが付されている認識結果をマッチングの対象外とする。その他の動作については第1または第2実施形態と同等である。
【0085】
このようにこの第4実施形態によれば、第1マッチング部15または第2マッチング部19において、当該入力画像について認識結果の一つ以上の文字列(選択候補)の中からマッチング結果選択部16で既に選択された文字列(候補)をマッチングの対象外とすることで、不必要な候補が提示されなくなり、ユーザーによる候補の選択がし易くなる。
【0086】
(第5実施形態)
次に、第5実施形態の文字入力システムを説明する。なおこの第5実施形態は第1実施形態または第2の実施形態と同様に構成されるため構成図とその説明は省略する。
【0087】
この第5実施形態は、第1実施形態または第2の実施形態とはマッチング結果選択部16の動作が異なる。すなわちこの例のマッチング結果選択部16は、入力画像について認識結果の一つ以上の文字列(選択候補)の中から既に選択された文字列(候補)に対して提示対象外を示すフラグを付し、フラグが付されている認識結果を提示の対象外とする。その他の動作については第1または第2実施形態と同等である。
【0088】
このようにこの第5実施形態によれば、マッチング結果選択部16において、当該入力画像について認識結果の一つ以上の文字列(選択候補)の中から既に選択された文字列(候補)を提示の対象外とすることで、不必要な候補が提示されなくなり、ユーザーによる候補の選択がし易くなる。
【0089】
(第6実施形態)
次に、第6実施形態の文字入力システムを説明する。なおこの第6実施形態は第2の実施形態と同様に構成されるため構成図とその説明は省略する。
【0090】
この第6実施形態の場合、入力対象の項目毎に単語辞書または単語グループを複数を備え、第2マッチング部19は単語辞書または単語グループを項目毎に切り替えて対象とする単語をマッチングする。単語辞書は例えば住所辞書、郵便番号辞書、氏名辞書などであり、単語グループは単語辞書とは異なり、例えばカタカナ、数字、記号、漢字などといったグループに分けられた単語の群をいう。
【0091】
このようにこの第6実施形態によれば、入力対象の項目毎に単語辞書または単語グループを複数備え、第2マッチング部19でマッチング対象とする単語辞書または単語グループを項目毎に切り替えることで、不必要な単語とのマッチングを減らすことで処理時間を削減することができる。また誤った単語とのマッチングで認識結果が不正確に訂正されることを防止することができる。
【0092】
(第7実施形態)
次に、図22を参照して第7実施形態の文字入力システムを説明する。
図22に示すように、第7実施形態の文字入力システムは、第1実施形態の構成(第1マッチング部15を有する構成)に加えて、単語辞書記憶部18、第3マッチング部20および予備設定部21を備える。
単語辞書記憶部18には、入力対象の項目(「姓名」、「会社名」、「部署名」、「役職名」、「事業所名」、「郵便番号」、「住所」)毎に単語を格納した単語辞書が記憶されている。
【0093】
第3マッチング部20は、認識結果の各々について単語辞書中の単語とのマッチングを行い認識結果と対応する項目を判定する。この際、第3マッチング部20は、ユーザーによる入力に先立って、項目の各々について当該する単語辞書中の単語の各々と認識結果の各々をマッチングする。
【0094】
すなわち、この第3マッチング部20は、第1実施形態の第1マッチング部15において認識結果と文字受付部14で記憶した入力文字列をマッチングするのと同じ方法で、認識結果と単語の各々をマッチングし、認識結果と単語の組み合わせの各々のマッチングのコストを算出する。コストの算出方法については、図7,図8で説明した内容と同様である。
【0095】
予備設定部21は、第3マッチング部20で算出されたコストが最小となる認識結果の文字列を選出して、マッチした項目に対応するフィールドの入力文字列に設定するようマッチング結果選択部16に通知する。マッチング結果選択部16は、この通知を受けて該当項目のフィールドに入力文字列を設定する。
【0096】
予備設定部21およびマッチング結果選択部16は、第3マッチング部20によりマッチングされた項目に、ユーザーによる入力に先立って認識結果を設定する。
【0097】
第7実施形態の場合、図23に示すように、第3マッチング部20は、認識結果の文字が、例えば「姓名」の項目のフィールドに設定する文字列、例えば「認識太?」などの場合、この「認識太?」と「姓名」の項目の単語辞書の単語「太郎」、「一郎」、「花子」…をマッチングし、不読文字「?」の手前の文字「太」に対してコストが最小の「太郎」を選出する。
【0098】
すると、予備設定部21は、第3マッチング部20でマッチした項目のフィールドに、ユーザーによる入力に先立って入力文字列「認識太郎」を設定するようマッチング結果選択部16に通知し、マッチング結果選択部16はこの通知を受けて、選出された入力文字列「認識太郎」を、入力ウィンドウ51の該当項目のフィールドに設定する。
【0099】
このようにこの第7実施形態によれば、入力対象の項目毎に単語を格納した単語辞書を記憶する単語辞書記憶部18と、認識結果の各々について単語辞書中の単語とのマッチングを行い認識結果と対応する項目を判定する第3マッチング部20と、第3マッチング部20でマッチングされた項目に、ユーザーによる入力に先立って認識結果の文字列を設定する予備設定部21とを備えることで、文字列を入力すべき項目を自動的に判定できる認識結果については当該項目のフィールドへ自動入力する。この自動入力によりユーザーによるキー入力の手間を軽減することができる。
【0100】
(第8実施形態)
次に、図24を参照して第8実施形態の文字入力システムを説明する。
図24に示すように、第8実施形態の文字入力システムは、第2実施形態の構成(第2マッチング部19を有する構成)に加えて、単語辞書記憶部18、第3マッチング部20および予備設定部21を備える。この第8実施形態における単語辞書記憶部18、第3マッチング部20および予備設定部21は第7実施形態と同等である。
【0101】
単語辞書記憶部18には、入力対象の項目(「姓名」、「会社名」、「部署名」、「役職名」、「事業所名」、「郵便番号」、「住所」)毎に単語を格納した単語辞書が記憶されている。
【0102】
第3マッチング部20は、ユーザーによる入力に先立って、項目の各々について当該する単語辞書中の単語の各々と認識結果の各々をマッチングする。
【0103】
すなわち、この第3マッチング部20は、第2実施形態の第2マッチング部19において、文字認識部12での認識結果、文字受付部14で受け付けた入力文字列、および単語辞書の単語をマッチングして、マッチング結果の文字列を選出するのと同じ方法で、認識結果と入力文字列と単語辞書の単語の各々をマッチングし、認識結果と入力文字列と単語との組み合わせの各々のマッチングのコストを算出する。コストの算出方法については、図7,図8で説明した内容と同様である。
【0104】
予備設定部21は、第3マッチング部20で算出されたコストが最小となる認識結果を入力ウィンドウ51の項目に対応する文字列に設定するようマッチング結果選択部16に通知する。
【0105】
マッチング結果選択部16は、この通知を受けて認識結果として選出された入力文字列を、入力ウィンドウ51の該当項目のフィールドに設定する。
【0106】
この第8実施形態の場合、第3マッチング部20で、認識結果の文字と項目毎の単語辞書の単語とをマッチングし、予備設定部21によりコストが最小の文字列が選出される。
【0107】
すると、マッチング結果選択部16は、ユーザーによる入力に先立って、入力ウィンドウ51の該当項目のフィールドに、入力文字列「認識太郎」を設定する。
【0108】
そして、第2マッチング部19において、予備設定部21により選出されたコストが最小の入力文字列、文字受付部14で受け付け記憶部13に記憶した入力文字列、および単語辞書の単語をマッチングして、マッチング結果としてフィールドに設定する入力文字列を選出し入力ウィンドウ51の該当項目のフィールドにマッチング結果の文字列が入力される。これにより、ユーザーは、認識結果の文字列を適切な項目に分類することができる。
【0109】
このようにこの第8実施形態によれば、第7実施形態と同様にユーザーによるキー入力の手間を軽減することができる。
【0110】
このように上述した第1乃至第8実施形態によれば、帳票から読み取った文字または文字列を適切な項目に分類することができる文字入力装置、文字入力方法を提供することができる。
また、文字認識の結果が予め列挙した単語や書式にマッチしない場合や複数の項目が候補としてあがったなど、認識結果と入力項目との対応付けを自動的には行えない場合に、ユーザーによりキー入力された文字列を選択候補として採用することにより、認識結果と入力項目の対応付けをスムーズに行えるようになり、認識結果の文字列の修正作業を効率よく行うことができる。
【0111】
すなわち、文字認識結果を確認および訂正する場合に正しい文字を効率よく入力することができる。
【0112】
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
【0113】
また上記実施形態に示した各構成要素を、コンピュータのハードディスク装置などのストレージにインストールしたプログラムで実現してもよく、また上記プログラムを、コンピュータ読取可能な電子媒体:electronic mediaに記憶しておき、プログラムを電子媒体からコンピュータに読み取らせることで本発明の機能をコンピュータが実現するようにしてもよい。電子媒体としては、例えばCD−ROM等の記録媒体やフラッシュメモリ、リムーバブルメディア:Removable media等が含まれる。さらに、ネットワークを介して接続した異なるコンピュータに構成要素を分散して記憶し、各構成要素を機能させたコンピュータ間で通信することで実現してもよい。
【符号の説明】
【0114】
1…スキャナ、2…キーボード、3…モニタ、10…コンピュータ、11…画像受付部、12…文字認識部、13…記憶部、14…文字受付部、15…第1マッチング部、16…マッチング結果選択部、17…文字列設定部、18…単語辞書記憶部、19…第2マッチング部、20…第3マッチング部、21…予備設定部、51…入力ウィンドウ、52…リストボックス。

【特許請求の範囲】
【請求項1】
帳票を光学的に読み取って得られた画像に対して文字認識処理を行うことで、認識結果として複数の文字列を得る文字認識部と、
前記文字認識部により認識された一つ以上の文字列をそれぞれ分類するための項目を有し、各項目に対する入力文字列の入力を受け付ける受付部と、
前記文字列と前記入力文字列とを対応付けて記憶可能な記憶部と、
前記受付部により受け付けられた前記入力文字列と前記文字認識部により得られた一つ以上の文字列とをマッチングする第1マッチング部と、
前記入力文字列とマッチした前記文字列を前記入力文字列が入力された項目に対応付けて前記記憶部に記憶する文字列設定部と
を具備することを特徴とする文字入力装置。
【請求項2】
帳票を光学的に読み取って得られた画像に対して文字認識処理を行うことで、認識結果として一つ以上の文字列を得る文字認識部と、
単語を格納した辞書を記憶する辞書記憶部と、
前記文字認識部により認識された一つ以上の文字列をそれぞれ分類するための項目を有し、各項目に対する入力文字列の入力を受け付ける受付部と、
前記文字列と前記入力文字列とを対応付けて記憶可能な記憶部と、
前記受付部により受け付けられた前記入力文字列と前記文字認識部により得られた一つ以上の文字列と前記辞書中の単語とをマッチングする第2マッチング部と、
前記入力文字列とマッチした前記文字列を前記入力文字列が入力された項目に対応付けて前記記憶部に記憶する文字列設定部と
を具備することを特徴とする文字入力装置。
【請求項3】
前記入力文字列にマッチした前記文字列および/または単語が複数存在した場合、選択候補として提示するマッチング結果選択部を備え、
前記文字列設定部は、
前記提示された選択候補の中から、選択された候補を前記入力文字列が入力された項目に対応付けて前記記憶部に記憶することを特徴とする請求項1または2いずれか記載の文字入力装置。
【請求項4】
前記文字列設定部は、
認識結果の一つ以上の文字列の選択候補の中から、選択された文字列に不読文字が含まれていた場合、前記不読文字の直前までの文字列を前記入力文字列と置換することを特徴とする請求項1乃至3いずれか1記載の文字入力装置。
【請求項5】
前記第1マッチング部または前記第2マッチング部は、
同じ画像について既に選択された選択候補の文字列をマッチングの対象外とすることを特徴とする請求項3記載の文字入力装置。
【請求項6】
前記マッチング結果選択部は、
同じ画像について既に選択された選択候補の文字列を提示の対象外とすることを特徴とする請求項3記載の文字入力装置。
【請求項7】
入力対象の項目毎に前記辞書を複数備え、
前記第2マッチング部は、
マッチング対象とする辞書を、前記画像のグループ毎または前記画像から認識した文字列の項目毎に切り替えて使用することを特徴とした請求項2記載の文字入力装置。
【請求項8】
入力対象の項目毎に単語を格納した単語辞書を記憶する単語辞書記憶部と、
前記文字認識部により文字認識された認識結果の文字列各々について前記単語辞書中の単語とのマッチングを行い、前記認識結果の文字列が属する項目を判定する第3マッチング部と、
前記第3マッチング部により判定された項目に、前記認識結果の文字列を前記入力に先立って設定する予備設定部と、
を具備することを特徴とした請求項1乃至6いずれか1記載の文字入力装置。
【請求項9】
文字認識部、受付部、第1マッチング部、文字列設定部、記憶部を有する文字入力装置における文字入力方法において、
帳票を光学的に読み取って得られた画像に対して前記文字認識部が文字認識処理を行うことで認識結果として一つ以上の文字列を取得し、
取得された一つ以上の文字列をそれぞれ分類するための項目を有する前記受付部が、各項目に対する入力文字列の入力を受け付け、
受け付けられた前記入力文字列と文字認識により得られた一つ以上の文字列とを前記第1マッチング部がマッチングし、
前記入力文字列とマッチした前記文字列を、前記文字列設定部が、前記入力文字列が入力された項目に対応付けて前記記憶部に記憶する
ことを特徴とする文字入力方法。
【請求項10】
文字認識部、受付部、第2マッチング部、文字列設定部、記憶部を有する文字入力装置における文字入力方法において、
帳票を光学的に読み取って得られた画像に対して前記文字認識部が文字認識処理を行うことで、認識結果として一つ以上の文字列を取得し、
前記文字認識部により認識された一つ以上の文字列をそれぞれ分類するための項目を有する前記受付部が、各項目に対する入力文字列の入力を受け付け、
受け付けられた前記入力文字列と文字認識により得られた一つ以上の文字列と単語が格納された辞書中の単語とを前記第2マッチング部がマッチングし、
前記入力文字列とマッチした前記文字列を、前記文字列設定部が、前記入力文字列が入力された項目に対応付けて前記記憶部に記憶する
ことを特徴とする文字入力方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22】
image rotate

【図23】
image rotate

【図24】
image rotate


【公開番号】特開2013−69150(P2013−69150A)
【公開日】平成25年4月18日(2013.4.18)
【国際特許分類】
【出願番号】特願2011−207747(P2011−207747)
【出願日】平成23年9月22日(2011.9.22)
【出願人】(000003078)株式会社東芝 (54,554)
【出願人】(301063496)東芝ソリューション株式会社 (1,478)
【Fターム(参考)】