説明

文字認識システムおよび文字認識プログラム

【課題】 異なる字種が混在する文字の訂正を効率よく行えるようにする。
【解決手段】文字認識システムは、記憶部、訂正部、文字認識部を備える。記憶部は、文書から読み取った文書画像を文字認識した認識結果である文字コードと、当該文字コードに対応する文字画像とを記憶する。訂正部は、記憶部に認識結果として同一の文字コードが記憶されている文字画像の一覧を画面に表示し、画面に表示された文字画像の一覧に基づいて誤読訂正する文字画像を指定すると共に、指定された文字画像を指定された文字画像の認識結果である文字が属する字種と異なる字種を対象として文字認識することを指定する。文字認識部は、訂正部で指定された文字画像を訂正部で指定された字種を対象に文字認識する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明の実施形態は、文字認識システムおよび文字認識プログラムに関する。
【背景技術】
【0002】
一般に、文字認識装置では、新字体と旧字体の文字が混在する文書を文字認識する場合、旧字体は、現在の字体(現字体または正字という)に置き換えて認識される。
【0003】
例えば"▲氣▼"という旧字体の文字画像を文字認識装置が文字認識した場合に、通常では"気"という現字体(正字)が出力される。また、"▲辯▼"、"▲瓣▼"、"▲辨▼"などの旧字体の文字画像を文字認識装置が文字認識した場合には、"琲"など全く意味の違う現在の字体の文字に誤読して認識される。
【0004】
旧字体を直接認識できる文字認識装置も存在するが、これら字体の文字は極めて類似している場合が多く、誤読が多く発生するため、認識後には誤読訂正の作業が必須である。
【0005】
従来、このように文書を光学的に読み取った画像を文字認識した結果の文字を訂正する訂正機能では、認識結果の文字列が表示されたエリア(欄)にキー操作で直接テキストを入力、つまり文字をタイプし、変換操作で一覧表示された漢字の中から該当する漢字を選択し確定操作することにより文字の訂正が行える。
【0006】
ところで、現字体の辞書を主に用いる仮名漢字変換機能では、選択候補として旧字体の文字が表示されない場合があり、キーボードから直接入力すること自体が難しい。したがって、通常、手書き文字認識機能などを利用して旧字体の漢字そのものを特定した上で訂正することになる。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】特開平7−239901号公報
【発明の概要】
【発明が解決しようとする課題】
【0008】
しかしながら、上記の訂正機能は、あくまで氏名のような、出現頻度の低い旧字体に対するものであり、例えば明治時代の新聞や書籍などのように旧字体が文章中に極めて多数存在する場合、訂正機能で一つの文字に対して漢字一覧を都度読み出してその中から選択するような操作を行っていたのでは作業効率が悪いという問題があった。
【0009】
本発明が解決しようとする課題は、異なる字種が混在する文字の訂正を効率よく行える文字認識システムおよび文字認識プログラムを提供することにある。
【課題を解決するための手段】
【0010】
実施形態の文字認識システムは、記憶部、訂正部、文字認識部を備える。記憶部は、文書から読み取った文書画像を文字認識した認識結果である文字コードと、当該文字コードに対応する文字画像とを記憶する。訂正部は、記憶部に認識結果として同一の文字コードが記憶されている文字画像の一覧を画面に表示し、画面に表示された文字画像の一覧に基づいて誤読訂正する文字画像を指定すると共に、指定された文字画像を指定された文字画像の認識結果である文字が属する字種と異なる字種を対象として文字認識することを指定する。文字認識部は、訂正部で指定された文字画像を訂正部で指定された字種を対象に文字認識する。
【図面の簡単な説明】
【0011】
【図1】実施形態の文字認識システムの構成を示す図である。
【図2】新字体の文字コードの一例を示す図である。
【図3】旧字体の文字コードの一例を示す図である。
【図4】文字認識装置の動作を示すフローチャートである。
【図5】文字訂正装置の動作を示すフローチャートである。
【図6】新字体に分類された文字群を示す図である。
【図7】旧字体に分類された文字群を示す図である。
【図8】一覧表示された文字画像群の中から誤読文字を選択して訂正を行うための訂正画面の一例を示す図である。
【発明を実施するための形態】
【0012】
以下、図面を参照して実施形態を詳細に説明する。図1は一つの実施形態の文字認識システムの構成を示す図である。
【0013】
図1に示すように、この実施形態の文字認識システムは、スキャナ1が接続された文字認識装置2、文字訂正装置3、訂正端末4,5が相互にネットワーク6を介して接続して構成されている。
【0014】
スキャナ1は、認識対象の文書を光学的に読み取り、読み取った画像(以下これを「文書画像」という)を文字認識装置2に出力する。認識対象の文書としては、例えば明治、大正、昭和などの年代(時代)の新聞、雑誌、一般書籍などがある。
【0015】
訂正端末4,5は、文字認識装置2に対してネットワーク6を通じてアクセスし、入力装置(キーボード、マウス)および出力装置(モニタ、プリンタなど)として機能する端末である。
【0016】
文字認識装置2および文字訂正装置3は、例えばCPU、メモリ、ハードディスク装置、CD−ROM、DVD−ROMなどの記録媒体を再生する再生装置としてのディスク再生装置などを有するコンピュータである。コンピュータでは、ディスク再生装置からハードディスク装置にインストールされた制御ソフトウェアをCPUがメモリ上に読み出し、そのソフトウェアの処理を実行することで、コンピュータが文字認識装置、文字訂正装置として機能する。
【0017】
文字認識装置2は、受付部20、文字認識結果が記憶される記憶部としてのメモリ21、レイアウト解析部22、文字認識部23、出力部28を有している。
【0018】
受付部20は、スキャナ1が、文字が記載された文書を光学的に読み取った文書画像を受け付け、メモリ21に記憶する。
【0019】
メモリ21は、各部が行う処理の作業領域として機能する他、文字認識部23での文字認識結果を記憶する。このメモリ21に記憶される文字認識結果は、文字認識対象となった文書画像とその文字認識結果(文字コード)と連続番号とが対応付けられて記憶されている。
【0020】
レイアウト解析部22は、メモリ21に記憶された文書画像を読み出し、文書画像に対してレイアウト解析を行うことで、読み取り元の文書の構造(画像のどの位置に文字または文字列が記載されているかなど)を得る。
【0021】
文字認識部23は、レイアウト解析部22により解析された文書構造に従い文書画像を文字の単位(文字画像)に切り出し、この切り出した文字画像を文字認識する。文字認識部23は、文字認識対象の文字画像と、この文字画像の文字認識結果である文字コードとを対応付け、連続番号を付与して、メモリ21に記憶する。
【0022】
日本における漢字の使用年代(切り替わり年代)として、例えば1790年〜1946年(昭和21年)の第1年代には康煕字典(文字数:49030文字)が使われ、1946年(昭和21年)〜1981年(昭和56年)の第2年代には当用漢字(文字数:1850文字)が使われ、1981年(昭和56年)以降の第3年代は常用漢字(文字数:1945文字)が使われている。
【0023】
この実施形態で利用される文字認識用の辞書は、認識対象の文書が作成された年代の字体が使われているもの、例えば昭和21年以前などの古い新聞であれば、旧字体が使われている康煕字典漢字辞書(旧字体辞書)などを利用し、その後、字体が当用漢字などに改訂された昭和21年以降などの現在の新聞などであれば、JIS第1および第2水準相当の現在の辞書である当用漢字・常用漢字辞書(新字体辞書)を利用するものとする。
【0024】
文書の文字認識処理が終了すると、出力部28はメモリ21から文字認識した結果得られた連続番号、文字コード、文字画像を、ネットワーク6を介して文字訂正装置3へ送る。
【0025】
文字訂正装置3は、受付部31、メモリ32、新旧字体分類部33、新字体訂正部34、旧字体訂正部35、辞書記憶部37、文字認識部38を有している。
【0026】
受付部31は、文字認識装置2から送られてきた文字認識結果(連続番号、文字コード、文字画像)を受け付け、メモリ32に記憶する。また受付部31は、訂正端末4,5に対して新字体専用の訂正画面(図8参照)または旧字体専用の訂正画面を送り、文字訂正の機能を提供する。
【0027】
新旧字体分類部33は、文字画像をメモリ32から読み出し、文字認識結果として旧字体の文字コードが付与されている(対応付けられている)文字画像と新字体の文字コードが付与されている(対応付けられている)文字画像とに字種を分類(分離)する。この分類には、例えば文字コードの先頭の番号が「4」までが新字体、「5」以上を旧字体などといった識別ルールを用いる。
【0028】
すなわち、新旧字体分類部33は、メモリ32に記憶された文字画像を、第1の字種(新字体)の文字(漢字)の文字コードが認識結果として対応付けられている文字画像の群と、第2の字種(旧字体)の文字(漢字)の文字コードが認識結果として対応付けられている文字画像の群に分類する。
【0029】
新旧字体分類部33では、予め文字コード毎に旧字体か新字体かを識別するためのルールが決められており、分類はそのルールに従って行われる。そして、旧字体の文字画像は、旧字体専用の訂正端末5の訂正画面に一覧表示されて訂正される。また新字体の文字画像は、新字体専用の訂正端末4の訂正画面に一覧表示されて訂正される。
【0030】
新字体訂正部34は、新字体専用の訂正端末4に訂正画面70(図8参照)を表示し、誤読文字のユーザの訂正操作により訂正処理を行う。旧字体訂正部35は、旧字体専用の訂正端末5に訂正画面(図示せず)を表示し、誤読文字のユーザの訂正操作により訂正処理を行う。
【0031】
なお、この例では、新字体と旧字体とをそれぞれ別個の訂正端末で訂正を行う例について説明しているが、一つの端末の一つのモニターの画面に、新字体用の訂正画面と旧字体用の訂正画面を表示して作業してもよい。
【0032】
これら新旧の訂正部34,35は、それぞれメモリ32から文字認識結果として同じ文字コードが付与された(対応付けられている)文字画像を読み出して一覧表示し、文字コードとの対応関係を訂正する必要がある(誤読訂正の必要がある)文字画像に対する選択操作により再度文字認識を指示するための訂正画面を新字体専用の訂正端末4または旧字体専用の訂正端末5に表示する訂正指示部として機能する。各訂正部は、新旧字体分類部33により分類された字種毎に訂正画面を表示する。
【0033】
例えば新字体訂正部34は、図8に示す訂正画面70において、同じ字種(新字体)として分類された文字画像群の中から、誤読された訂正対象の文字画像がマウスの左クリック操作で選択された後の右クリック操作で、その文字画像を他の字種として再度文字認識することを指示するためのボタン(「旧字体」)を文字画像近傍にポップアップ表示する。なお旧字体訂正部35の訂正画面の場合、ボタンは「新字体」と表示される。
【0034】
図2に示すように、新字体の漢字は、JISのコード体系で、新字体の文字コードと区点コードが対応している。例えば"亜"という新字体の文字コードは「3021」、区点コードは「1601」である。
【0035】
図3に示すように、旧字体の漢字は、JISのコード体系で、旧字体の文字コードと区点コードが対応している。例えば"▲亞▼"という旧字体の文字コードは「5033」、区点コードは「4819」である。
文字認識部38は、新字体訂正部34からの指示により、認識対象を旧字体に絞り旧字体辞書を参照して、選択された文字画像に対して再度文字認識(再認識処理)を行う。
【0036】
また文字認識部38は、旧字体訂正部35からの指示により、認識対象を新字体に絞り、新字体辞書を参照して、選択された文字画像に対して再度文字認識(再認識処理)を行う。
【0037】
続いて、図4乃至図8を参照してこの実施形態の文字認識システムの動作を説明する。
【0038】
この文字認識システムの場合、スキャナ1にセットされた認識対象の文書(例えば新字体および旧字体の文字が混在する新聞や雑誌など)が光学的に読み取られると、その読み取られ文書画像が文字認識装置2へ入力される。
【0039】
文字認識装置2では、スキャナ1からの文書画像が受付部20により受け付けられ、メモリ21に記憶される(図4のステップS101)。
【0040】
レイアウト解析部22は、メモリ21に記憶された文書画像に対してレイアウト解析を行い(ステップS102)、レイアウト解析結果を文字認識部23に通知する。
【0041】
レイアウト解析結果を受けた文字認識部23は、受け取ったレイアウト解析結果を基に文書画像に対して1文字ずつ文字認識を行い(ステップS103)、文字認識結果として、文字認識対象の文字画像と、この文字画像の文字認識結果である文字コードとを対応付け、連続番号を付与して、メモリ21に記憶する。
【0042】
そして、文書画像の文字認識がすべて終了すると(ステップS104)、出力部28はメモリ21から文字認識した結果得られた文字画像、文字コード、連続番号ネットワーク6を介して文字訂正装置3へ送信する。(ステップS105)。
【0043】
文字訂正装置3では、受付部31が文字認識装置2から送られてきた文字認識結果(連続番号、文字コード、文字画像)を受け付け、メモリ32に記憶する。
【0044】
新旧字体分類部33は、メモリ32から文字認識結果を読み出し、旧字体の文字コードが付与されている文字画像と新字体の文字コードが付与されている文字画像とに分類(分離)する(ステップS112)。
さらに、新旧字体分類部33は、新字体として分類された文字画像群を同じ文字コード毎にグループ分けしメモリ32に記憶する(ステップS113)。つまり文字コード毎のディレクトリ(フォルダ)を生成し各ディレクトリ(フォルダ)に同じ文字コードを持つ文字画像群を格納する。
【0045】
分類の結果、例えば図6に示すように、新字体の"気"という文字コード「3524」を文字認識結果として持つ文字画像50のグループが生成される。各文字画像50には、対応付けられている連続番号51と文字コード52が図示されている。
【0046】
また、同じ意味を持つ文字(漢字)であっても、図7に示すように、例えば旧字体の"▲氣▼"という文字コード「5D66」を持つ文字画像60のグループが旧字体の別グループとして分類される(ステップS114)。各文字画像60には、連続番号61と文字コード62が付与されている。
【0047】
文字認識率は100%とはならず、どうしても若干の誤認識(誤読)が発生するため、文字認識結果の訂正作業を行うことになる。
【0048】
このため、各訂正端末4,5において、誤読文字の確認と、その訂正作業が行われる。
【0049】
新字体訂正部34は、メモリ32から文字認識結果として新字体の文字コードが得られた文字画像群を、例えば「あ」行から順に読み出し、訂正画面70(図8参照)を訂正端末4へ送る。これにより、新字体の文字画像群を一覧表示した訂正画面70が訂正端末4に表示される(ステップS115)。以下、一例として「気」という文字コードが文字認識結果として得られた文字画像群の誤読の確認とその訂正処理をする場合について説明する。
【0050】
訂正端末4の操作者は、図8に示すような訂正画面70の文字画像一覧の中から、誤読文字を目視で確認する。この例では、新字体の"気"の文字コード「3524」を持つ文字画像の中で、例えば旧字体の"▲氣▼"という連続番号「0002」の文字画像があり、これが誤読文字71である。
【0051】
この場合、操作者は、誤読文字71にカーソルを合わせて選択した後、例えばマウスを右クリック操作することで、プルダウンメニュー72が表示されるので、表示されたメニューから「旧字体」ボタン73を選択する(ステップS116)。
【0052】
すると、文字訂正サーバ3では、新字体訂正部34が、文字認識部38に対して、選択された文字画像"▲氣▼"について、認識対象を旧字体に絞った再認識を行うよう指示する。
【0053】
この指示により、文字認識部38は、認識対象を旧字体に絞り、つまり旧字体の認識辞書だけを用いて再度文字認識(再認識処理)を行う(ステップS117)。
【0054】
これにより、旧字体の"▲氣▼"という文字画像に対して、その文字認識結果として旧字体の"▲氣▼"の文字コード「5D66」が付与され、メモリ32の文字認識結果が変更される。つまりメモリ32の文字認識結果の文字画像"▲氣▼"に付与されていた文字コード「3524」が「5D66」に変更される。
【0055】
すなわち、文字認識部38は、再度文字認識が指示された文字画像に対して、再度の文字認識を行い、新たに文字認識した結果でメモリ32の文字認識結果を更新する。
再認の文字識処理では、認識対象を旧字体に限定しているので、文字画像は正しく認識される可能性が高い。
【0056】
一方、旧字体訂正部35は、メモリ32から文字認識結果として旧字体の文字コードが得られた文字画像群を、例えば「あ」行から順に読み出し、訂正画面を訂正端末5へ送る。これにより、旧文字画像群を一覧表示した訂正画面70(図8参照)が訂正端末5に表示される(ステップS118)。
訂正端末5の操作者は、訂正画面70の文字画像一覧の中から、誤読文字を目視で確認する。
【0057】
この文字画像一覧の中に誤読文字が発見された場合には、操作者は、誤読文字にカーソルを合わせて選択した後、例えばマウスを右クリック操作することで、プルダウンメニューが表示されるので、表示されたメニューから「新字体」ボタンを選択する(ステップS119)。
【0058】
すると、旧字体訂正部35が、文字認識部38に対して、選択された文字画像について、認識対象を新字体に絞った再認識を指示する。
この指示により、文字認識部38は、認識対象を新字体に絞り、つまり新字体の認識辞書だけを用いて再度文字認識(再認識処理)を行う(ステップS120)。
【0059】
すなわち、文字認識部38は、再度文字認識が指示された文字画像に対して、再度の
文字認識を行い、新たに文字認識した結果でメモリ32の文字認識結果を更新する。
再認の文字識処理では、認識対象を新字体に限定しているので、文字画像は正しく認識される可能性が高い。
【0060】
旧字体の文字訂正は、現在の日本人にはなじみが薄く訂正が難しい画面となるが、逆に香港や台湾などの地域では今でも日本の旧字体に相当する文字が一般的に使われており、これらの文字は各地域の入力方法により容易に訂正可能である。
【0061】
例えば台湾では注音符号と呼ばれる、読みを現す台湾独自の記号がキーボードに印刷されており、この記号をキーボードでタイプすることにより、漢字に変換して各文字を入力できる。このときの画面には日本語の言語的な特長は現れていないため、特に日本語に関する知識がない一般の台湾人オペレータでも文字の訂正が可能である。
【0062】
このようにこの実施形態によれば、文字訂正の作業において、同じ字体として認識された文字画像の中から誤読した文字の再認識の指示を容易に行うことができ、文字認識結果の訂正作業を効率よく行うことができる。
【0063】
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
【0064】
上記実施形態では、文字認識装置と文字訂正装置とを別の筐体として構成したが、一つの筐体(装置)として構成してもよい。
【0065】
また上記実施形態では、訂正対象の文字画像を選択し、マウスの右クリック操作でメニューを表示し、旧字体または新字体への再認識を指示したが、文字画像を選択するだけの操作で旧字体または新字体への再認識を指示してもよい。この場合、さらに文字訂正の作業を効率化することができる。
【0066】
さらに上記実施形態では、字種として漢字の新字体と旧字体との相互での誤読訂正を説明したが、これに限定されない。例えば、数字と英文字との字種相互での誤読訂正をする実施形態でも良い。
【0067】
また上記実施形態では、各構成要素を、コンピュータのハードディスク装置などのストレージにインストールしたプログラムで実現したが、上記プログラムを、コンピュータ読取可能な電子媒体:electronic mediaに記憶しておき、プログラムを電子媒体からコンピュータに読み取らせることで本発明の機能をコンピュータが実現するようにしてもよい。電子媒体としては、例えばCD−ROM,DVD−ROM等の記録媒体やフラッシュメモリ、リムーバブルメディア:Removable media等が含まれる。さらに、ネットワークを介して接続した異なるコンピュータに構成要素を分散して記憶し、各構成要素を機能させたコンピュータ間で通信することで実現してもよい。
【符号の説明】
【0068】
1…スキャナ、2…文字認識装置、3…文字訂正装置、4…新字体訂正用の訂正端末、5…旧字体訂正用の訂正端末、6…ネットワーク、20…受付部、21…メモリ、22…レイアウト解析部、23…文字認識部、28…出力部、31…受付部、32…メモリ、33…新旧字体分類部、34…新字体訂正部、35…旧字体訂正部、38…文字認識部。

【特許請求の範囲】
【請求項1】
文書から読み取った文書画像を文字認識した認識結果である文字コードと、当該文字コードに対応する文字画像とを記憶する記憶部と、
前記記憶部に認識結果として同一の文字コードが記憶されている文字画像の一覧を画面に表示し、前記画面に表示された文字画像の一覧に基づいて誤読訂正する文字画像を指定すると共に、前記指定された文字画像を前記指定された文字画像の認識結果である文字が属する字種と異なる字種を対象として文字認識することを指定するための訂正部と、
前記訂正部で指定された文字画像を前記訂正部で指定された字種を対象に文字認識する文字認識部と、
を具備する文字認識システム。
【請求項2】
文書から読み取った文書画像を文字認識した認識結果である文字コードと、当該文字コードに対応する文字画像とを記憶する記憶部と、
前記記憶部に認識結果として旧字体の同一の文字コードが記憶されている文字画像の一覧を画面に表示し、前記画面に表示された文字画像の一覧に基づいて誤読訂正する文字画像を指定すると共に、前記指定された文字画像を新字体を対象として文字認識することを指定するための訂正部と、
前記訂正部で指定された文字画像を前記訂正部で指定された新字体を対象に文字認識する文字認識部と、
を具備する文字認識システム。
【請求項3】
文書から読み取った文書画像を文字認識した認識結果である文字コードと、当該文字コードに対応する文字画像とを記憶する記憶部と、
前記記憶部に認識結果として新字体の同一の文字コードが記憶されている文字画像の一覧を画面に表示し、前記画面に表示された文字画像の一覧に基づいて誤読訂正する文字画像を指定すると共に、前記指定された文字画像を旧字体を対象として文字認識指定することを指定するための訂正部と、
前記訂正部で指定された文字画像を前記訂正部で指定された新字体を対象に文字認識をする文字認識部と、
を具備する文字認識システム。
【請求項4】
記憶部を持つコンピュータに処理を実行させる文字認識プログラムにおいて、
前記コンピュータを、
文書から読み取った文書画像を文字認識した認識結果である文字コードと、当該文字コードに対応する文字画像とを前記記憶部に記憶させる記憶手段と、
前記記憶部に認識結果として同一の文字コードが記憶されている文字画像の一覧を画面に表示させ、前記画面に表示された文字画像の一覧に基づいて誤読訂正する文字画像を指定させると共に、前記指定された文字画像を前記指定された文字画像の認識結果である文字が属する字種と異なる字種を対象として文字認識することを指定する訂正手段と、
前記指定された文字画像を前記指定された字種を対象に文字認識する文字認識手段
として機能させるための文字認識プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate


【公開番号】特開2012−133653(P2012−133653A)
【公開日】平成24年7月12日(2012.7.12)
【国際特許分類】
【出願番号】特願2010−286313(P2010−286313)
【出願日】平成22年12月22日(2010.12.22)
【出願人】(000003078)株式会社東芝 (54,554)
【出願人】(301063496)東芝ソリューション株式会社 (1,478)
【Fターム(参考)】