文字認識システムおよび文字認識プログラム

【課題】異なる字種が混在する文字の訂正を効率よく行えるようにする。
【解決手段】文字認識システムは、記憶部、訂正部、文字認識部を備える。記憶部は、文書から読み取った文書画像を文字認識した認識結果である文字コードと、当該文字コードに対応する文字画像とを記憶する。訂正部は、記憶部に認識結果として同一の文字コードが記憶されている文字画像の一覧を画面に表示し、画面に表示された文字画像の一覧に基づいて誤読訂正する文字画像を指定すると共に、指定された文字画像を指定された文字画像の認識結果である文字が属する字種と異なる字種を対象として文字認識することを指定する。文字認識部は、訂正部で指定された文字画像を訂正部で指定された字種を対象に文字認識する。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明の実施形態は、文字認識システムおよび文字認識プログラムに関する。
【背景技術】
【０００２】
一般に、文字認識装置では、新字体と旧字体の文字が混在する文書を文字認識する場合、旧字体は、現在の字体（現字体または正字という）に置き換えて認識される。
【０００３】
例えば"▲氣▼"という旧字体の文字画像を文字認識装置が文字認識した場合に、通常では"気"という現字体（正字）が出力される。また、"▲辯▼"、"▲瓣▼"、"▲辨▼"などの旧字体の文字画像を文字認識装置が文字認識した場合には、"琲"など全く意味の違う現在の字体の文字に誤読して認識される。
【０００４】
旧字体を直接認識できる文字認識装置も存在するが、これら字体の文字は極めて類似している場合が多く、誤読が多く発生するため、認識後には誤読訂正の作業が必須である。
【０００５】
従来、このように文書を光学的に読み取った画像を文字認識した結果の文字を訂正する訂正機能では、認識結果の文字列が表示されたエリア（欄）にキー操作で直接テキストを入力、つまり文字をタイプし、変換操作で一覧表示された漢字の中から該当する漢字を選択し確定操作することにより文字の訂正が行える。
【０００６】
ところで、現字体の辞書を主に用いる仮名漢字変換機能では、選択候補として旧字体の文字が表示されない場合があり、キーボードから直接入力すること自体が難しい。したがって、通常、手書き文字認識機能などを利用して旧字体の漢字そのものを特定した上で訂正することになる。
【先行技術文献】
【特許文献】
【０００７】
【特許文献１】特開平７−２３９９０１号公報
【発明の概要】
【発明が解決しようとする課題】
【０００８】
しかしながら、上記の訂正機能は、あくまで氏名のような、出現頻度の低い旧字体に対するものであり、例えば明治時代の新聞や書籍などのように旧字体が文章中に極めて多数存在する場合、訂正機能で一つの文字に対して漢字一覧を都度読み出してその中から選択するような操作を行っていたのでは作業効率が悪いという問題があった。
【０００９】
本発明が解決しようとする課題は、異なる字種が混在する文字の訂正を効率よく行える文字認識システムおよび文字認識プログラムを提供することにある。
【課題を解決するための手段】
【００１０】
実施形態の文字認識システムは、記憶部、訂正部、文字認識部を備える。記憶部は、文書から読み取った文書画像を文字認識した認識結果である文字コードと、当該文字コードに対応する文字画像とを記憶する。訂正部は、記憶部に認識結果として同一の文字コードが記憶されている文字画像の一覧を画面に表示し、画面に表示された文字画像の一覧に基づいて誤読訂正する文字画像を指定すると共に、指定された文字画像を指定された文字画像の認識結果である文字が属する字種と異なる字種を対象として文字認識することを指定する。文字認識部は、訂正部で指定された文字画像を訂正部で指定された字種を対象に文字認識する。
【図面の簡単な説明】
【００１１】
【図１】実施形態の文字認識システムの構成を示す図である。
【図２】新字体の文字コードの一例を示す図である。
【図３】旧字体の文字コードの一例を示す図である。
【図４】文字認識装置の動作を示すフローチャートである。
【図５】文字訂正装置の動作を示すフローチャートである。
【図６】新字体に分類された文字群を示す図である。
【図７】旧字体に分類された文字群を示す図である。
【図８】一覧表示された文字画像群の中から誤読文字を選択して訂正を行うための訂正画面の一例を示す図である。
【発明を実施するための形態】
【００１２】
以下、図面を参照して実施形態を詳細に説明する。図１は一つの実施形態の文字認識システムの構成を示す図である。
【００１３】
図１に示すように、この実施形態の文字認識システムは、スキャナ１が接続された文字認識装置２、文字訂正装置３、訂正端末４，５が相互にネットワーク６を介して接続して構成されている。
【００１４】
スキャナ１は、認識対象の文書を光学的に読み取り、読み取った画像（以下これを「文書画像」という）を文字認識装置２に出力する。認識対象の文書としては、例えば明治、大正、昭和などの年代（時代）の新聞、雑誌、一般書籍などがある。
【００１５】
訂正端末４，５は、文字認識装置２に対してネットワーク６を通じてアクセスし、入力装置（キーボード、マウス）および出力装置（モニタ、プリンタなど）として機能する端末である。
【００１６】
文字認識装置２および文字訂正装置３は、例えばＣＰＵ、メモリ、ハードディスク装置、ＣＤ−ＲＯＭ、ＤＶＤ−ＲＯＭなどの記録媒体を再生する再生装置としてのディスク再生装置などを有するコンピュータである。コンピュータでは、ディスク再生装置からハードディスク装置にインストールされた制御ソフトウェアをＣＰＵがメモリ上に読み出し、そのソフトウェアの処理を実行することで、コンピュータが文字認識装置、文字訂正装置として機能する。
【００１７】
文字認識装置２は、受付部２０、文字認識結果が記憶される記憶部としてのメモリ２１、レイアウト解析部２２、文字認識部２３、出力部２８を有している。
【００１８】
受付部２０は、スキャナ１が、文字が記載された文書を光学的に読み取った文書画像を受け付け、メモリ２１に記憶する。
【００１９】
メモリ２１は、各部が行う処理の作業領域として機能する他、文字認識部２３での文字認識結果を記憶する。このメモリ２１に記憶される文字認識結果は、文字認識対象となった文書画像とその文字認識結果（文字コード）と連続番号とが対応付けられて記憶されている。
【００２０】
レイアウト解析部２２は、メモリ２１に記憶された文書画像を読み出し、文書画像に対してレイアウト解析を行うことで、読み取り元の文書の構造（画像のどの位置に文字または文字列が記載されているかなど）を得る。
【００２１】
文字認識部２３は、レイアウト解析部２２により解析された文書構造に従い文書画像を文字の単位（文字画像）に切り出し、この切り出した文字画像を文字認識する。文字認識部２３は、文字認識対象の文字画像と、この文字画像の文字認識結果である文字コードとを対応付け、連続番号を付与して、メモリ２１に記憶する。
【００２２】
日本における漢字の使用年代（切り替わり年代）として、例えば１７９０年〜１９４６年（昭和２１年）の第１年代には康煕字典（文字数：49030文字）が使われ、１９４６年（昭和２１年）〜１９８１年（昭和５６年）の第２年代には当用漢字（文字数：1850文字）が使われ、１９８１年（昭和５６年）以降の第３年代は常用漢字（文字数：1945文字）が使われている。
【００２３】
この実施形態で利用される文字認識用の辞書は、認識対象の文書が作成された年代の字体が使われているもの、例えば昭和２１年以前などの古い新聞であれば、旧字体が使われている康煕字典漢字辞書（旧字体辞書）などを利用し、その後、字体が当用漢字などに改訂された昭和２１年以降などの現在の新聞などであれば、ＪＩＳ第１および第２水準相当の現在の辞書である当用漢字・常用漢字辞書（新字体辞書）を利用するものとする。
【００２４】
文書の文字認識処理が終了すると、出力部２８はメモリ２１から文字認識した結果得られた連続番号、文字コード、文字画像を、ネットワーク６を介して文字訂正装置３へ送る。
【００２５】
文字訂正装置３は、受付部３１、メモリ３２、新旧字体分類部３３、新字体訂正部３４、旧字体訂正部３５、辞書記憶部３７、文字認識部３８を有している。
【００２６】
受付部３１は、文字認識装置２から送られてきた文字認識結果（連続番号、文字コード、文字画像）を受け付け、メモリ３２に記憶する。また受付部３１は、訂正端末４，５に対して新字体専用の訂正画面（図８参照）または旧字体専用の訂正画面を送り、文字訂正の機能を提供する。
【００２７】
新旧字体分類部３３は、文字画像をメモリ３２から読み出し、文字認識結果として旧字体の文字コードが付与されている（対応付けられている）文字画像と新字体の文字コードが付与されている（対応付けられている）文字画像とに字種を分類（分離）する。この分類には、例えば文字コードの先頭の番号が「４」までが新字体、「５」以上を旧字体などといった識別ルールを用いる。
【００２８】
すなわち、新旧字体分類部３３は、メモリ３２に記憶された文字画像を、第１の字種（新字体）の文字（漢字）の文字コードが認識結果として対応付けられている文字画像の群と、第２の字種（旧字体）の文字（漢字）の文字コードが認識結果として対応付けられている文字画像の群に分類する。
【００２９】
新旧字体分類部３３では、予め文字コード毎に旧字体か新字体かを識別するためのルールが決められており、分類はそのルールに従って行われる。そして、旧字体の文字画像は、旧字体専用の訂正端末５の訂正画面に一覧表示されて訂正される。また新字体の文字画像は、新字体専用の訂正端末４の訂正画面に一覧表示されて訂正される。
【００３０】
新字体訂正部３４は、新字体専用の訂正端末４に訂正画面７０（図８参照）を表示し、誤読文字のユーザの訂正操作により訂正処理を行う。旧字体訂正部３５は、旧字体専用の訂正端末５に訂正画面（図示せず）を表示し、誤読文字のユーザの訂正操作により訂正処理を行う。
【００３１】
なお、この例では、新字体と旧字体とをそれぞれ別個の訂正端末で訂正を行う例について説明しているが、一つの端末の一つのモニターの画面に、新字体用の訂正画面と旧字体用の訂正画面を表示して作業してもよい。
【００３２】
これら新旧の訂正部３４，３５は、それぞれメモリ３２から文字認識結果として同じ文字コードが付与された（対応付けられている）文字画像を読み出して一覧表示し、文字コードとの対応関係を訂正する必要がある（誤読訂正の必要がある）文字画像に対する選択操作により再度文字認識を指示するための訂正画面を新字体専用の訂正端末４または旧字体専用の訂正端末５に表示する訂正指示部として機能する。各訂正部は、新旧字体分類部３３により分類された字種毎に訂正画面を表示する。
【００３３】
例えば新字体訂正部３４は、図８に示す訂正画面７０において、同じ字種（新字体）として分類された文字画像群の中から、誤読された訂正対象の文字画像がマウスの左クリック操作で選択された後の右クリック操作で、その文字画像を他の字種として再度文字認識することを指示するためのボタン（「旧字体」）を文字画像近傍にポップアップ表示する。なお旧字体訂正部３５の訂正画面の場合、ボタンは「新字体」と表示される。
【００３４】
図２に示すように、新字体の漢字は、ＪＩＳのコード体系で、新字体の文字コードと区点コードが対応している。例えば"亜"という新字体の文字コードは「３０２１」、区点コードは「１６０１」である。
【００３５】
図３に示すように、旧字体の漢字は、ＪＩＳのコード体系で、旧字体の文字コードと区点コードが対応している。例えば"▲亞▼"という旧字体の文字コードは「５０３３」、区点コードは「４８１９」である。
文字認識部３８は、新字体訂正部３４からの指示により、認識対象を旧字体に絞り旧字体辞書を参照して、選択された文字画像に対して再度文字認識（再認識処理）を行う。
【００３６】
また文字認識部３８は、旧字体訂正部３５からの指示により、認識対象を新字体に絞り、新字体辞書を参照して、選択された文字画像に対して再度文字認識（再認識処理）を行う。
【００３７】
続いて、図４乃至図８を参照してこの実施形態の文字認識システムの動作を説明する。
【００３８】
この文字認識システムの場合、スキャナ１にセットされた認識対象の文書（例えば新字体および旧字体の文字が混在する新聞や雑誌など）が光学的に読み取られると、その読み取られ文書画像が文字認識装置２へ入力される。
【００３９】
文字認識装置２では、スキャナ１からの文書画像が受付部２０により受け付けられ、メモリ２１に記憶される（図４のステップＳ１０１）。
【００４０】
レイアウト解析部２２は、メモリ２１に記憶された文書画像に対してレイアウト解析を行い（ステップＳ１０２）、レイアウト解析結果を文字認識部２３に通知する。
【００４１】
レイアウト解析結果を受けた文字認識部２３は、受け取ったレイアウト解析結果を基に文書画像に対して１文字ずつ文字認識を行い（ステップＳ１０３）、文字認識結果として、文字認識対象の文字画像と、この文字画像の文字認識結果である文字コードとを対応付け、連続番号を付与して、メモリ２１に記憶する。
【００４２】
そして、文書画像の文字認識がすべて終了すると（ステップＳ１０４）、出力部２８はメモリ２１から文字認識した結果得られた文字画像、文字コード、連続番号ネットワーク６を介して文字訂正装置３へ送信する。（ステップＳ１０５）。
【００４３】
文字訂正装置３では、受付部３１が文字認識装置２から送られてきた文字認識結果（連続番号、文字コード、文字画像）を受け付け、メモリ３２に記憶する。
【００４４】
新旧字体分類部３３は、メモリ３２から文字認識結果を読み出し、旧字体の文字コードが付与されている文字画像と新字体の文字コードが付与されている文字画像とに分類（分離）する（ステップＳ１１２）。
さらに、新旧字体分類部３３は、新字体として分類された文字画像群を同じ文字コード毎にグループ分けしメモリ３２に記憶する（ステップＳ１１３）。つまり文字コード毎のディレクトリ（フォルダ）を生成し各ディレクトリ（フォルダ）に同じ文字コードを持つ文字画像群を格納する。
【００４５】
分類の結果、例えば図６に示すように、新字体の"気"という文字コード「３５２４」を文字認識結果として持つ文字画像５０のグループが生成される。各文字画像５０には、対応付けられている連続番号５１と文字コード５２が図示されている。
【００４６】
また、同じ意味を持つ文字（漢字）であっても、図７に示すように、例えば旧字体の"▲氣▼"という文字コード「５Ｄ６６」を持つ文字画像６０のグループが旧字体の別グループとして分類される（ステップＳ１１４）。各文字画像６０には、連続番号６１と文字コード６２が付与されている。
【００４７】
文字認識率は１００％とはならず、どうしても若干の誤認識（誤読）が発生するため、文字認識結果の訂正作業を行うことになる。
【００４８】
このため、各訂正端末４，５において、誤読文字の確認と、その訂正作業が行われる。
【００４９】
新字体訂正部３４は、メモリ３２から文字認識結果として新字体の文字コードが得られた文字画像群を、例えば「あ」行から順に読み出し、訂正画面７０（図８参照）を訂正端末４へ送る。これにより、新字体の文字画像群を一覧表示した訂正画面７０が訂正端末４に表示される（ステップＳ１１５）。以下、一例として「気」という文字コードが文字認識結果として得られた文字画像群の誤読の確認とその訂正処理をする場合について説明する。
【００５０】
訂正端末４の操作者は、図８に示すような訂正画面７０の文字画像一覧の中から、誤読文字を目視で確認する。この例では、新字体の"気"の文字コード「３５２４」を持つ文字画像の中で、例えば旧字体の"▲氣▼"という連続番号「０００２」の文字画像があり、これが誤読文字７１である。
【００５１】
この場合、操作者は、誤読文字７１にカーソルを合わせて選択した後、例えばマウスを右クリック操作することで、プルダウンメニュー７２が表示されるので、表示されたメニューから「旧字体」ボタン７３を選択する（ステップＳ１１６）。
【００５２】
すると、文字訂正サーバ３では、新字体訂正部３４が、文字認識部３８に対して、選択された文字画像"▲氣▼"について、認識対象を旧字体に絞った再認識を行うよう指示する。
【００５３】
この指示により、文字認識部３８は、認識対象を旧字体に絞り、つまり旧字体の認識辞書だけを用いて再度文字認識（再認識処理）を行う（ステップＳ１１７）。
【００５４】
これにより、旧字体の"▲氣▼"という文字画像に対して、その文字認識結果として旧字体の"▲氣▼"の文字コード「５Ｄ６６」が付与され、メモリ３２の文字認識結果が変更される。つまりメモリ３２の文字認識結果の文字画像"▲氣▼"に付与されていた文字コード「３５２４」が「５Ｄ６６」に変更される。
【００５５】
すなわち、文字認識部３８は、再度文字認識が指示された文字画像に対して、再度の文字認識を行い、新たに文字認識した結果でメモリ３２の文字認識結果を更新する。
再認の文字識処理では、認識対象を旧字体に限定しているので、文字画像は正しく認識される可能性が高い。
【００５６】
一方、旧字体訂正部３５は、メモリ３２から文字認識結果として旧字体の文字コードが得られた文字画像群を、例えば「あ」行から順に読み出し、訂正画面を訂正端末５へ送る。これにより、旧文字画像群を一覧表示した訂正画面７０（図８参照）が訂正端末５に表示される（ステップＳ１１８）。
訂正端末５の操作者は、訂正画面７０の文字画像一覧の中から、誤読文字を目視で確認する。
【００５７】
この文字画像一覧の中に誤読文字が発見された場合には、操作者は、誤読文字にカーソルを合わせて選択した後、例えばマウスを右クリック操作することで、プルダウンメニューが表示されるので、表示されたメニューから「新字体」ボタンを選択する（ステップＳ１１９）。
【００５８】
すると、旧字体訂正部３５が、文字認識部３８に対して、選択された文字画像について、認識対象を新字体に絞った再認識を指示する。
この指示により、文字認識部３８は、認識対象を新字体に絞り、つまり新字体の認識辞書だけを用いて再度文字認識（再認識処理）を行う（ステップＳ１２０）。
【００５９】
すなわち、文字認識部３８は、再度文字認識が指示された文字画像に対して、再度の
文字認識を行い、新たに文字認識した結果でメモリ３２の文字認識結果を更新する。
再認の文字識処理では、認識対象を新字体に限定しているので、文字画像は正しく認識される可能性が高い。
【００６０】
旧字体の文字訂正は、現在の日本人にはなじみが薄く訂正が難しい画面となるが、逆に香港や台湾などの地域では今でも日本の旧字体に相当する文字が一般的に使われており、これらの文字は各地域の入力方法により容易に訂正可能である。
【００６１】
例えば台湾では注音符号と呼ばれる、読みを現す台湾独自の記号がキーボードに印刷されており、この記号をキーボードでタイプすることにより、漢字に変換して各文字を入力できる。このときの画面には日本語の言語的な特長は現れていないため、特に日本語に関する知識がない一般の台湾人オペレータでも文字の訂正が可能である。
【００６２】
このようにこの実施形態によれば、文字訂正の作業において、同じ字体として認識された文字画像の中から誤読した文字の再認識の指示を容易に行うことができ、文字認識結果の訂正作業を効率よく行うことができる。
【００６３】
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
【００６４】
上記実施形態では、文字認識装置と文字訂正装置とを別の筐体として構成したが、一つの筐体（装置）として構成してもよい。
【００６５】
また上記実施形態では、訂正対象の文字画像を選択し、マウスの右クリック操作でメニューを表示し、旧字体または新字体への再認識を指示したが、文字画像を選択するだけの操作で旧字体または新字体への再認識を指示してもよい。この場合、さらに文字訂正の作業を効率化することができる。
【００６６】
さらに上記実施形態では、字種として漢字の新字体と旧字体との相互での誤読訂正を説明したが、これに限定されない。例えば、数字と英文字との字種相互での誤読訂正をする実施形態でも良い。
【００６７】
また上記実施形態では、各構成要素を、コンピュータのハードディスク装置などのストレージにインストールしたプログラムで実現したが、上記プログラムを、コンピュータ読取可能な電子媒体：electronic mediaに記憶しておき、プログラムを電子媒体からコンピュータに読み取らせることで本発明の機能をコンピュータが実現するようにしてもよい。電子媒体としては、例えばＣＤ−ＲＯＭ，ＤＶＤ−ＲＯＭ等の記録媒体やフラッシュメモリ、リムーバブルメディア：Removable media等が含まれる。さらに、ネットワークを介して接続した異なるコンピュータに構成要素を分散して記憶し、各構成要素を機能させたコンピュータ間で通信することで実現してもよい。
【符号の説明】
【００６８】
１…スキャナ、２…文字認識装置、３…文字訂正装置、４…新字体訂正用の訂正端末、５…旧字体訂正用の訂正端末、６…ネットワーク、２０…受付部、２１…メモリ、２２…レイアウト解析部、２３…文字認識部、２８…出力部、３１…受付部、３２…メモリ、３３…新旧字体分類部、３４…新字体訂正部、３５…旧字体訂正部、３８…文字認識部。

【特許請求の範囲】
【請求項１】
文書から読み取った文書画像を文字認識した認識結果である文字コードと、当該文字コードに対応する文字画像とを記憶する記憶部と、
前記記憶部に認識結果として同一の文字コードが記憶されている文字画像の一覧を画面に表示し、前記画面に表示された文字画像の一覧に基づいて誤読訂正する文字画像を指定すると共に、前記指定された文字画像を前記指定された文字画像の認識結果である文字が属する字種と異なる字種を対象として文字認識することを指定するための訂正部と、
前記訂正部で指定された文字画像を前記訂正部で指定された字種を対象に文字認識する文字認識部と、
を具備する文字認識システム。
【請求項２】
文書から読み取った文書画像を文字認識した認識結果である文字コードと、当該文字コードに対応する文字画像とを記憶する記憶部と、
前記記憶部に認識結果として旧字体の同一の文字コードが記憶されている文字画像の一覧を画面に表示し、前記画面に表示された文字画像の一覧に基づいて誤読訂正する文字画像を指定すると共に、前記指定された文字画像を新字体を対象として文字認識することを指定するための訂正部と、
前記訂正部で指定された文字画像を前記訂正部で指定された新字体を対象に文字認識する文字認識部と、
を具備する文字認識システム。
【請求項３】
文書から読み取った文書画像を文字認識した認識結果である文字コードと、当該文字コードに対応する文字画像とを記憶する記憶部と、
前記記憶部に認識結果として新字体の同一の文字コードが記憶されている文字画像の一覧を画面に表示し、前記画面に表示された文字画像の一覧に基づいて誤読訂正する文字画像を指定すると共に、前記指定された文字画像を旧字体を対象として文字認識指定することを指定するための訂正部と、
前記訂正部で指定された文字画像を前記訂正部で指定された新字体を対象に文字認識をする文字認識部と、
を具備する文字認識システム。
【請求項４】
記憶部を持つコンピュータに処理を実行させる文字認識プログラムにおいて、
前記コンピュータを、
文書から読み取った文書画像を文字認識した認識結果である文字コードと、当該文字コードに対応する文字画像とを前記記憶部に記憶させる記憶手段と、
前記記憶部に認識結果として同一の文字コードが記憶されている文字画像の一覧を画面に表示させ、前記画面に表示された文字画像の一覧に基づいて誤読訂正する文字画像を指定させると共に、前記指定された文字画像を前記指定された文字画像の認識結果である文字が属する字種と異なる字種を対象として文字認識することを指定する訂正手段と、
前記指定された文字画像を前記指定された字種を対象に文字認識する文字認識手段
として機能させるための文字認識プログラム。

【図１】