説明

文字認識のための文字セグメントを自動的に識別する方法および装置

【課題】文字認識用の文字セグメントを自動的に識別する方法および装置を提供する。
【解決手段】文字認識用の文字セグメントを自動的に識別するための方法および装置が提供される。方法は、複数の単語、およびその複数の単語の各単語に対応するグランドトルース(ground truth)を受信することを含む。複数の単語は、筆記体で受信され得る。複数の単語の各単語は、各単語に対応するグランドトルースに基づいて、1つまたはより多くの文字セグメントに分割される。その後、各単語の分割は、1つまたはより多くの類似文字セグメントに基づいて、各単語を反復して再分割することによって改善される。

【発明の詳細な説明】
【技術分野】
【0001】
発明の分野
本発明は、概して、文字認識のための文字セグメントを自動的に識別する方法および装置に関する。より特定的には、本発明は、1つまたはより多くの単語レベルおよび行レベルのグランドトルース(ground truth)に基づいて、文字認識のための文字セグメントを自動的に識別するような分類器を訓練するための方法および装置に関する。
【背景技術】
【0002】
発明の背景
スキャンされた文章の編集可能でかつ検索可能なテキストへの自動変換は、正確でかつロバストな光学式文字認識(Optical Character Recognition:OCR)システムの使用を必要とする。OCRシステムは、テキストの入力画像を文字に分割することによる、スキャンされた画像からのテキストの認識を含む。スキャンされた画像からのテキストの認識のために、OCRシステムは、最初に、文字のサンプル画像とその対応するグランドトルースとを用いて訓練される。原稿におけるテキストを認識するためのOCRシステムの連続的な訓練の際に、OCRシステムは、テキストにおける異なる文字を識別することを習得する。
【発明の概要】
【発明が解決しようとする課題】
【0003】
英語のテキストのような非筆記体についてのOCRシステムは、高い精度のレベルにまで達している。この高精度レベルについての主な理由の1つは、非筆記体を、分離した文字に引き下げる自動的な事前処理を行なって、OCRシステムへの入力として提供する能力である。非筆記体における各文字は、非接触であるという非筆記体の生来的な特性のために、分離することができる。各文字が分離されると、対応する文字レベルのグランドトルースが、OCRシステムを訓練するために適用され得る。
【0004】
しかしながら、アラビア文字のような筆記体では、OCRエンジンを訓練するために個々の文字を分離することは複雑である。これは、アラビア文字で書かれた文字の接触している性質によるものである。さらに、アラビア語のテキストは、文字の発音を示すために文字の上方または下方に配置されるドットやアクセントマークのような付加文字を含み得る。これは、非筆記体のテキストを認識するために設計されたOCRシステムによって用いられる既知の事前処理技術が、アラビア語のテキストを正確に処理することを妨げる。さらに、多くのアラビア文字は、その文字が単語の始めに配置されるか、中間に配されるか、最後に配置されるか、または単独の文字として配置されるかに依存して、3つまたは4つの形態を含む。アラビア語のテキストについてのこれらの特徴は、アラビア語のテキストを個々の文字に自動的に分割することを困難にする。
【0005】
現在、アラビア語のテキストを認識するためのOCRエンジンを訓練するために、アラビア語のテキストにおける単語の個々の文字を手動で区切る必要があり、対応するグランドトルースが、区切られた文字に対して入力される。大量の文章がOCRエンジンを訓練するために用いられる場合、単語における文字の手動区分および各文字についてのグランドトルースを引き続いて入力することは、面倒でありかつ間違いの元である。
【0006】
したがって、1つまたはより多くの単語レベルおよび行レベルのグランドトルースに基づいた、文字認識用の文字セグメントを自動的に識別するための方法および装置が必要とされている。
【課題を解決するための手段】
【0007】
一般的に言って、多くの実施形態に従って、本発明は文字認識用の文字セグメントを自動的に識別するための方法および装置を提供する。方法は、複数の単語、およびその複数の単語の各々の単語に対応するグランドトルースを受信することを含む。複数の単語の各単語は、各単語に対応するグランドトルースに基づいて、1つまたはより多くの文字セグメントに分割される。その後、各単語の分割は、1つまたはより多くの類似の文字セグメントに基づいて、各単語を反復的に再分割することによって改善される。
【0008】
添付の図面は、さまざまな実施形態を例示するとともに、本発明にすべて従うさまざまな原理および利点を説明することを提供する。図面において、同じ参照符合は個別の図を通して同一または機能的に類似の要素を示し、かつ以下の詳細な説明とともに本明細書に含まれてその一部を形成する。
【図面の簡単な説明】
【0009】
【図1】本発明の実施形態に従う、文字認識のための文字セグメントを自動的に識別する方法のフロー図を示す。
【図2a】本発明の実施形態に従った、複数の反復にわたるアラビア文字における単語の文字セグメントへの分割を示す概略図である。
【図2b】本発明の実施形態に従った、複数の反復にわたるアラビア文字における単語の文字セグメントへの分割を示す概略図である。
【図2c】本発明の実施形態に従った、複数の反復にわたるアラビア文字における単語の文字セグメントへの分割を示す概略図である。
【図3】本発明の実施形態に従う、文字認識用の文字セグメントを自動的に識別するための装置を示す図である。
【発明を実施するための形態】
【0010】
当業者は、図中の要素は単純化および明確化のために示されており、必ずしも縮尺通りに描かれていないことを理解するであろう。たとえば、本発明の実施形態の理解を向上するのを助けるために、図におけるいくつかの要素の寸法は、他の要素に比べて誇張され得る。
【0011】
発明の詳細な説明
本発明に従う詳細な実施形態の説明の前に、本実施形態が、第1に、文字認識のための文字セグメントを自動的に識別することに関連する方法ステップおよび装置要素の組み合わせに属することに注意すべきである。したがって、装置要素および方法ステップは、必要に応じて、図において慣習的なシンボルで表わされ、当業者には容易に明白である本明細書の記載の利益を有する詳細を伴う開示が曖昧にならないように、本発明の実施形態の理解に関する特定の詳細のみを示す。
【0012】
本文書において、第1および第2、上部および下部などのような関係語は、単に、1つのエンティティまたは動作を、他のエンティティまたは動作と区別するためだけに用いられ、そのようなエンティティまたは動作間において、実際のそのような関係または順序を必ずしも必要とせず、または意味していない。語句「備える(comprise)」、「備えている(comprising)」またはその任意の変形は、要素のリストを含むプロセス、方法、項目または装置が、それらの要素のみではなく、そのようなプロセス、方法、項目または装置に明示的に列挙されておらずまたは生来的に備わっていない他の要素を含み得るように、非排他的包含をカバーすることを意図している。「…を備える」によって始まる要素は、多くの制限なしに、その要素を備えるプロセス、方法、項目または装置において、追加的な同一の要素の存在を排除するものではない。
【0013】
本明細書において説明される発明の実施形態は、1つまたはより多くの従来のトランザクション−クライアントと、固有の記憶されたプログラム指令とで構成され、そのプログラム指令は、特定の非トランザクション−クライアント回路と関連して文字認識用の文字セグメントを自動的に識別するための方法および装置の機能のいくつか、多くまたは全てを実行するように1つまたはより多くのトランザクション−クライアントを制御する。非トランザクション−クライアント回路は、限定されないが、無線受信器、無線送信器、信号ドライバ、クロック回路、電源回路、およびユーザ入力装置を含む。すなわち、これらの機能は、画像におけるテキストを認識するための画像分割についての方法のステップとして解釈され得る。あるいは、いくつかのまたは全ての機能は、記憶されたプログラム指令を有さない状態機械によって、または1つまたはより多くの特定用途向け集積回路(ASIC)で実現されてもよく、それらにおいては、各機能または特定の機能のいくつかの組み合わせはカスタムロジックとして実現される。もちろん、この2つのアプローチの組合せを用いることもできる。したがって、これらの機能のための方法および手段が、本明細書において説明される。さらに、たとえば、利用可能時間、現在の技術、および経済的考慮によって動機付けられる可能性のある大幅な努力および多くの設計事項にもかかわらず、本明細書に開示される概念および原理によって案内される場合に、当業者は、最小の実験でそのようなソフトウェア指令およびプログラム、ならびにICを容易に生成することが可能であるだろう。
【0014】
一般的に言って、多くの実施形態に従って、本発明は文字認識用の文字セグメントを自動的に識別するための方法および装置を提供する。方法は、複数の単語、およびその複数の単語の各々の単語に対応するグランドトルースを受信することを含む。複数の単語の各単語は、各単語に対応するグランドトルースに基づいて、1つまたはより多くの文字セグメントに分割される。その後、各単語の分割は、1つまたはより多くの類似の文字セグメントに基づいて、各単語を反復的に再分割することによって改善される。
【0015】
図1は、本発明の実施形態に従う、文字認識用の文字セグメントを自動的に識別するための方法のフロー図を示す。方法は、ステップ102にて、複数の単語、およびその複数の単語の各々の単語に対応するグランドトルースを受信することを含む。実施形態においては、複数の単語は、1行のテキストに対応し、そのテキストの行全体についてのグランドトルースが受信され得る。複数の単語が段落、ページのあるゾーン、1ページ、または複数ページに対応し得ることが、本発明の範囲から逸脱することなく当業者には明らかであろう。複数の単語は、筆記体であり得る。たとえば、複数の単語は、アラビア文字、ペルシャ文字、クルド文字などであり得る。
【0016】
ステップ104にて、複数の単語の各単語は、各単語に対応するグランドトルースに基づいて、1つまたはより多くの文字セグメント(以下、「文字セグメント」と称する。)に自動的に分割され得る。単語は、その単語のグランドトルースによって示される文字数に基づいて、文字セグメントに分割される。たとえば、単語のグランドトルースが、その単語に4つの文字があることを示している場合は、その単語は4つのセグメントに分割される。単語の文字セグメントへの分割は、その単語内の文字セグメントについての境界を表わす。一実施形態においては、その単語のグランドトルースによって示される文字数に基づいて、その単語を文字セグメントにランダムに分けることによって分割され得る。他の実施形態においては、単語は、その単語内の各文字に関連する平均文字幅に基づいて、その単語を文字セグメントに分けることによって分割され得る。特定の文字についての平均文字幅は、文書コーパス(corpus)を解析し、特定の文字のすべての発生の幅を平均することによって決定され得る。文字幅を決定するための他の方法も、本発明の範囲から逸脱することなく作用されてもよいことが、当業者には明らかであろう。
【0017】
各単語の構成文字セグメントへのランダムな、または平均文字幅に基づいた分割は、正確でないかもしれない。これは、各文字セグメントに関連するノイズによるものであり得る。そのノイズは、文字セグメントに関連するセグメントにおける、1つまたはより多くの隣接文字セグメントの部分に対応し得る。ノイズは、文字セグメントにおける外部からの(foreign)セグメントも含む。これらの外部からのセグメントは、撮像光センサからの量子化ノイズ、撮像装置光学系上のほこり、インクスパッタ、およびトナー汚れであり得る。
【0018】
単語の文字セグメントに関連するノイズを最小化するために、ステップ106にて、各単語の分割は、文字セグメントを、1つまたはより多くの類似文字セグメント(以下、「類似文字セグメント」と称する。)と比較することにより、各単語を反復的に再分割することによって自動的に改善される。類似文字セグメントを決定するために、単語の文字セグメントのグランドトルースが、複数の単語および予め記憶された1組の文字セグメントにおける他の文字セグメントのグランドトルースと比較される。2つのグランドトルースが一致した場合、その2つのグランドトルースに関連する文字セグメントは、類似文字セグメントとみなされる。類似文字セグメントの比較において、単語内の各文字セグメントの分割が改善される。複数の単語の各単語の分割を改善することは、各単語の文字セグメントについての複数の水平境界および複数の垂直境界を決定することを含む。その後、各単語の文字セグメントの複数の水平境界および複数の垂直境界は、各単語の文字セグメントと類似文字セグメントとを複数の反復にわたって比較することによって、反復的に修正される。複数の反復にわたって文字セグメントを改善することは、図2aから図2cに関連して説明されるように、文字セグメントに関連するノイズを排除する。
【0019】
さらに、複数の単語に関連した文字セグメントが、複数の単語に関連した類似文字セグメントとともに記憶され、予め記憶された文字セグメントの組に加えられてもよい。類似文字セグメントを伴った文字セグメントは、複数の単語の各単語の分割を改善するための後続的な反復のために用いられ得る。ここで、類似文字セグメントを伴う文字セグメントが、各反復の後に予め記憶された文字セグメントの組に追加されるので、予め記憶された文字セグメントの組は、動的に成長する文字セグメントの組である。
【0020】
図2a〜図2cは、1つまたはより多くの文字セグメントに反復的に分割されるアラビア文字の単語200を例示的に示す。まず、単語200は、ランダムにまたは平均文字幅に基づいて、単語200のグランドトルースによって示された多くの文字に基づく多くのセグメントに分割される。図2aにおいて、単語200のグランドトルースが、単語200が7文字で構成されていることを示している場合は、単語200は、ランダムにまたは平均文字幅に基づいて、セグメント202−1,セグメント202−2,セグメント202−3,セグメント202−4,セグメント202−5,セグメント202−6,セグメント202−7(以下、セグメント202−1から202−7と称する。)のような7つのセグメントに分割される。セグメント202−1から202−7は、それぞれ、文字セグメント204,文字セグメント206,文字セグメント208,文字セグメント210,文字セグメント212,文字セグメント214,文字セグメント216(以下、文字セグメント204−216と称する。)についての境界を規定する。
【0021】
その後、文字セグメント204−216の分割は、文字セグメント204−216を1つまたはより多くの類似文字セグメント(以下、類似文字セグメントと称する。)と反復的に比較することによって改善される。この場合において、セグメント202−1から202−7は、図2bに示されるような比較に基づいて、セグメント218−1,セグメント218−2,セグメント218−3,セグメント218−4,セグメント218−5,セグメント218−6,セグメント218−7(以下、セグメント218−1から218−7と称する。)にそれぞれ改善される。類似文字セグメントを決定するために、文字セグメント204−216のグランドトルースが、複数の単語からの他の文字セグメントおよび予め記憶された文字セグメントの組のグランドトルースと比較される。2つのグランドトルースが同じ場合は、2つのグランドトルースに関連する文字セグメントは、類似文字セグメントであるとみなされる。
【0022】
文字セグメント204−216を類似文字セグメントと比較する際に、複数の水平境界および複数の垂直境界が、文字セグメント204−216の各々について決定される。文字セグメント204−216の各々についての複数の水平境界および複数の垂直境界は、図2bにおけるセグメント218−1から218−7として示される。したがって、この比較に基づいて単語200のセグメントを改善することによって、文字セグメント204−216は、文字セグメント220,文字セグメント222,文字セグメント224,文字セグメント226,文字セグメント228,文字セグメント230,文字セグメント232(以下、文字セグメント220−232と称する。)へそれぞれ改善される。文字セグメント204−216を文字セグメント220−232へ改善することは、文字セグメント204−216における1つまたはより多くの隣接文字の部分を排除し、それによって、文字セグメント204−216に存在するノイズを低減する。
【0023】
その後、文字セグメント204−216は、文字セグメント204−216に対応する類似文字セグメントとともに、予め記憶された文字セグメントの組に記憶され得る。そして、記憶された類似文字セグメントを伴う文字セグメントは、複数の単語の分割を改善するための後続の反復のために用いられ得る。
【0024】
同様に、複数の単語の各単語は、複数の反復にわたって類似文字セグメントと比較され、各単語の分割は各反復において改善される。図2cを参照して、単語200の分割を示すn番目の反復が示される。この場合は、図2bのセグメント218−1から218−7は、図2cに示されるような比較に基づいて、セグメントn−1,セグメントn−2,セグメントn−3,セグメントn−4,セグメントn−5,セグメントn−6,セグメントn−7(以下、セグメントn−1からn−7と称する。)に改善される。比較に基づいて単語200の分割を改善する際に、n番目の反復において文字セグメント220−232は、文字セグメント204−216は、文字セグメント234,文字セグメント236,文字セグメント238,文字セグメント240,文字セグメント242,文字セグメント244,文字セグメント246(以下、文字セグメント234−246と称する。)へそれぞれ改善される。
【0025】
図3は、本発明の実施形態に従う、文字認識用の文字セグメントを自動的に認識するための装置300を示す。装置300は、メモリ302と、メモリ302に結合されたプロセッサ304とを含む。
【0026】
プロセッサ304は、複数の単語と、その複数の単語の各単語に対応するグランドトルースとを受けるように構成される。一実施形態においては、複数の単語は、1行のテキストに対応し、テキストの全体の行についてのグランドトルースが受信される。複数の単語は、段落、ページ内のあるゾーン、1ページ、または複数のページでもよいことが、本発明の範囲から逸脱することなく、当業者には明らかであろう。複数の単語は、筆記体であり得る。
【0027】
さらに、プロセッサ304は、複数の単語の各単語を、その単語のグランドトルースによって示される文字数に基づいて、1つまたはより多くの文字セグメント(以下、「文字セグメント」と称する。)に分割するように構成される。単語の文字セグメントへの分割は、文字セグメントについての境界を表わす。一実施形態においては、プロセッサ304は、単語のグランドトルースによって示される文字数に基づいて、その単語を文字セグメントにランダムに分けることによって、単語を分割するように構成される。他の実施形態においては、プロセッサ304は、その単語における各文字に関連する平均文字幅に基づいてその単語を分けることによって、単語を分割するように構成される。複数の単語の各単語の分割は、図1に関連して説明される。
【0028】
プロセッサ304は、さらに、複数の単語における各単語の文字セグメントを1つまたはより多くの類似文字セグメント(以下、「類似文字セグメント」と称する。)と比較することにより各単語を反復的に再分割することによって、各単語の分割を改善するように構成される。類似文字セグメントは、1つまたはより多くの複数の単語、および予め記憶された文字セグメントの組から、プロセッサ304によって選択され得る。類似文字セグメントを決定するために、文字セグメントのグランドトルースは、複数の単語および予め記憶された文字セグメントの組における他の文字セグメントのグランドトルースと比較される。2つのグランドトルースが一致する場合、2つのグランドトルースに関連する文字セグメントは、類似文字セグメントであるとみなされる。
【0029】
類似文字セグメントを比較する際に、プロセッサ304は、複数の単語の各単語における各文字セグメントの分割を改善する。各単語の分割を改善するために、プロセッサ304は、各単語の文字セグメントについての複数の水平境界および複数の垂直境界を決定するように構成される。そして、複数の水平境界および複数の垂直境界は、図1および図2aから図2cに関連して説明されたように、文字セグメントを類似文字セグメントと比較することによって、反復的に修正される。複数の水平境界および複数の垂直境界を規定することに加えて、プロセッサ304は、さらに、文字セグメントの1つまたはより多くの隣接文字の部分を除去して各単語の分割を改善するように構成される。
【0030】
さらに、複数の単語に関連する文字セグメントは、その複数の単語に関連する類似文字セグメントとともにメモリ302に記憶され、予め記憶された文字セグメントの組に追加され得る。予め記憶された文字セグメントの組も、メモリ302に記憶され得る。類似文字セグメントを伴う文字セグメントは、複数の単語の各単語の分割を改善するための後続の反復のために用いられ得る。
【0031】
本発明のさまざまな実施形態は、文字認識用の文字セグメントを自動的に識別するための方法および装置を提供する。方法および装置は、アラビア文字の単語のような、筆記体の単語の効果的な分割を可能にする。方法は、複数の単語の各単語を、単語レベルまたは行レベルのグランドトルースに基づいて、1つまたはより多くの文字セグメントに自動的に分割することを可能にする。反復的な比較による各単語の分割は、各単語の分割を手動で区分する必要性を排除し、それによって、誤差率および単語を文字セグメントに分割するために必要とされる時間を低減する。グランドトルースが単語レベルまたは行レベルで与えられるので、各文字セグメントについてのグランドトルースを手動で提供することも回避される。これは、分類器を訓練するためにグランドトルースを提供するのに必要とされる時間を低減する。
【0032】
当業者は、本明細書に記載された上記の認識された利点および他の利点が、単なる例示に過ぎず、本発明のさまざまな実施形態のすべての利点の完全な表現であるとは意味されていないことを理解するであろう。
【0033】
上記明細書においては、本発明の特定の実施形態が説明された。しかしながら、当業者は、以下の特許請求の範囲に記載されるように、本発明の範囲から逸脱することなく、さまざまな修正および変形がなされ得ることを理解する。したがって、明細書および図面は、制限的な意味というよりは例示的な意味と考えられるべきであり、そのようなすべての修正は、本発明の範囲内に含まれることが意図される。利益、利点、問題の解決、および任意の利益、利点、または解決を生じるあるいはより顕著にする任意の要素は、全てまたは任意の請求項の、重大な、必須の、または本質的な特徴あるいは要素であるとして解釈されるべきではない。本発明は、本出願の継続中になされる補正を含む添付の請求項、および発行されたそれらの請求項の均等物によってのみ規定される。
【符号の説明】
【0034】
300 装置、302 メモリ,304 プロセッサ。

【特許請求の範囲】
【請求項1】
文字認識のための文字セグメントを自動的に識別する方法であって、
前記方法は、
複数の単語、および前記複数の単語の各単語に対応するグランドトルース(ground truth)を受信するステップと、
各単語を、各単語に対応する前記グランドトルースに基づいて、少なくとも1つの文字セグメントに分割するステップと、
少なくとも1つの類似文字セグメントに基づいて各単語を反復して再分割することによって、各単語の分割を改善するステップとを備え、
前記少なくとも1つの類似文字セグメントは、各単語に関連する前記少なくとも1つの文字セグメントに類似する、方法。
【請求項2】
前記複数の単語は、1行のテキストである、請求項1に記載の方法。
【請求項3】
前記複数の単語は、筆記体である、請求項1に記載の方法。
【請求項4】
単語は、前記単語のグランドトルースに関連する多くの文字に基づいて、少なくとも1つの文字セグメントに分割される、請求項1に記載の方法。
【請求項5】
前記単語を分割するステップは、
前記単語を前記少なくとも1つの文字セグメントにランダムに分割するステップ、および
前記複数の単語の各文字に関連した予め規定された平均文字幅に基づいて、前記単語を前記少なくとも1つの文字セグメントに分割するステップ、
のうちの少なくとも1つのステップを含む、請求項4に記載の方法。
【請求項6】
前記各単語の分割を改善するステップは、前記少なくとも1つの文字セグメントについての水平境界および垂直境界を決定するステップを含む、請求項1に記載の方法。
【請求項7】
前記各単語の分割を改善するステップは、前記少なくとも1つの文字セグメントのうちの1つの文字セグメントを、前記少なくとも1つの類似文字セグメントと比較するステップを含み、
前記文字セグメントのグランドトルースと前記少なくとも1つの類似文字セグメントのグランドトルースとは一致する、請求項1に記載の方法。
【請求項8】
前記少なくとも1つの類似文字セグメントは、
前記複数の単語、および
予め記憶された1組の文字セグメント、
のうちの少なくとも1つから選択される、請求項7に記載の方法。
【請求項9】
前記少なくとも1つの文字セグメントおよび前記少なくとも1つの類似文字セグメントのうちの少なくとも1つを記憶するステップをさらに備える、請求項7に記載の方法。
【請求項10】
前記各単語の分割を改善するステップは、少なくとも1つの隣接する文字の少なくとも一部分を削除するステップを含む、請求項1に記載の方法。
【請求項11】
文字認識のための文字セグメントを自動的に識別するための装置であって、
メモリと、
前記メモリに結合されたプロセッサとを備え、
前記プロセッサは、
複数の単語、および前記複数の単語の各単語に対応するグランドトルースを受信し、
各単語を、各単語に対応する前記グランドトルースに基づいて、少なくとも1つの文字セグメントに分割し、
少なくとも1つの類似文字セグメントに基づいて、各単語を反復して再分割することによって、各単語の分割を改善するように構成され、
前記少なくとも1つの類似文字セグメントは、各単語に関連する前記少なくとも1つの文字セグメントに類似する、装置。
【請求項12】
前記複数の単語は、1行のテキストである、請求項11に記載の装置。
【請求項13】
前記複数の単語は、筆記体である、請求項11に記載の装置。
【請求項14】
前記プロセッサは、単語を、前記単語のグランドトルースに関連する多くの文字に基づいて、少なくとも1つの文字セグメントに分割するようにさらに構成される、請求項11に記載の装置。
【請求項15】
前記単語を少なくとも1つの文字セグメントに分割するために、前記プロセッサは、
前記単語を前記少なくとも1つの文字セグメントにランダムに分割すること、および
前記複数の単語の各文字に関連した予め規定された平均文字幅に基づいて、前記単語を前記少なくとも1つの文字セグメントに分割すること、
のうちの少なくとも1つを実行するようにさらに構成される、請求項11に記載の装置。
【請求項16】
前記プロセッサは、前記少なくとも1つの文字セグメントについての水平境界および垂直境界を決定することによって、各単語の分割を改善するようにさらに構成される、請求項11に記載の装置。
【請求項17】
前記プロセッサは、前記少なくとも1つの文字セグメントの文字セグメントを、前記少なくとも1つの類似文字セグメントと比較することによって、各単語の分割を改善するようにさらに構成され、
前記文字セグメントのグランドトルースと前記少なくとも1つの類似文字セグメントのグランドトルースとは一致する、請求項11に記載の装置。
【請求項18】
前記プロセッサは、
前記複数の単語、および
予め記憶された1組の文字セグメント、
のうちの少なくとも1つから、前記少なくとも1つの類似文字セグメント選択するようにさらに構成される、請求項17に記載の装置。
【請求項19】
前記少なくとも1つの文字セグメント、前記少なくとも1つの類似文字セグメント、および前記予め記憶された1組の文字セグメントのうちの少なくとも1つは、前記メモリ内に記憶される、請求項17に記載の装置。
【請求項20】
前記プロセッサは、少なくとも1つの隣接する文字の少なくとも一部分を削除して各単語の分割を改善するようにさらに構成される、請求項11に記載の装置

【図1】
image rotate

【図2a】
image rotate

【図2b】
image rotate

【図2c】
image rotate

【図3】
image rotate


【公開番号】特開2013−97784(P2013−97784A)
【公開日】平成25年5月20日(2013.5.20)
【国際特許分類】
【出願番号】特願2012−32709(P2012−32709)
【出願日】平成24年2月17日(2012.2.17)
【出願人】(511072895)キング・アブドゥルアジズ・シティ・フォー・サイエンス・アンド・テクノロジー(ケイ・エイ・シィ・エス・ティ) (13)
【氏名又は名称原語表記】KING ABDULAZIZ CITY FOR SCIENCE AND TECHNOLOGY (KACST)
【Fターム(参考)】