説明

Fターム[5B029EE08]の内容

文字入力 (4,843) | 画像処理 (623) | 画像の分離 (249) | 文字の分離 (175)

Fターム[5B029EE08]の下位に属するFターム

Fターム[5B029EE08]に分類される特許

61 - 80 / 123


【課題】帳票に記入された文字を文字認識する際に、誤認識等を引き起こす、文字認識の対象とならない文字等を消去する技術を提供するものである。
【解決手段】文字認識の対象となる読取領域702の中に、誤認識等を引き起こす文字認識の対象とならない文字等含む削除領域701を設定する。そして、ラベル情報外接矩形サイズ比較部217によって、原帳票に記載されている印刷文字に一致すると判定された文字等を、削除領域701から消去し、削除領域704を作成する。さらに、削除領域704では、消去すべき文字(「ご」の下の部分)と記入された文字(「埼」の上の部分)とが重なっているので、ラベル情報パタンテンプレートマッチング部218によって実行されるテンプレートマッチングによって、消去すべき文字に該当する部分が特定され、記入された文字と重なっている印刷文字の部分を消去し、認識対象領域705を作成する。 (もっと読む)


【課題】 分離文字の抽出精度、文字認識精度を向上させる。
【解決手段】 入力された画像から文字塊を抽出し、文字塊または当該文字塊の組み合わせを1つの文字画像として、複数の文字画像で構成される複数の文字列パターンを生成する。その生成された各文字列パターンにおける各文字画像を文字認識することにより、その文字認識結果とその類似度を得る。そして、各文字画像の文字認識結果と類似度とに基づいて、文字列パターンそれぞれについて合計類似度を算出して、最も高い文字列パターンの情報を選択する。その際、文字認識結果が特定文字である文字画像が文字列パターンに含まれている場合、当該特定文字に関する類似度を相対的に低くする重みを付与してから、当該文字列パターンの合計類似度を算出するようにする。 (もっと読む)


【課題】複数列の文字列からなる検出対象文字列の画像について,一列分の文字列それぞれの画像相互の列方向の位置ずれが大きい場合や,前記検出対象文字列を構成する文字の一部について,文字画像と文字画像との間の隙間が明確でない場合であっても,各文字画像の存在領域を極力正しく特定できること。
【解決手段】2値画像における連結画素のうち所定の文字画像の条件及び相対的な位置関係の条件を満たす文字候補画像を特定し(S3,S4),それを含む文字列包含推定領域の画像について,一列分の文字列の画像の列幅範囲を推定し(S7),その範囲の列領域画像の列直交方向の投影データの上限制限データの相互相関関数から,列領域画像相互の列方向位置ずれ量を求め(S11),そのずれ量を修正した画像全体における列直交方向の投影データの上限制限データに基づいて,各文字画像の存在領域の位置を特定する(S16)。 (もっと読む)


【課題】テロップ文字の輝度に依存せず、低輝度や中輝度のテロップ文字であっても、高精度にテロップ文字パターンを抽出して認識率を向上する。
【解決手段】 テロップ領域画像から生成したグレースケール画像からエッジを抽出して膨張させたエッジ領域画像を生成する(S1〜S3)。エッジ領域画像をマスク画像としてグレースケール画像のマスク画像に属する画素の輝度ヒストグラムを作成する(S4)。輝度ヒストグラムの輝度を多値化して複数の輝度クラスに分割し(S5)、輝度クラス毎に、各クラスに属する輝度の画素を集めた2値画像を生成し、面積が最大となるクラスの2値画像をテロップ文字候補画像として選択する(S5,S6)。テロップ文字候補画像に対応してテロップ領域画像で使われている文字色を判定し、文字色に該当する文字画素をテロップ文字候補画像から抽出することによりノイズ画素を除去してテロップ文字画像を生成する(S7)。
(もっと読む)


【課題】帳票イメージから各プリントパターンが個別に抽出され得るようにすること。
【解決手段】パターン分離抽出装置10は、表示装置10aに表示された帳票イメージのうち、ドラッグ等により色サンプルが幾つか選択されると、選択された帳票イメージに含まれる複数のプリントパターンのそれぞれについて、そのプリントパターン一つのみからなるイメージデータを生成し、出力する。各プリントパターンのイメージデータが生成される際、帳票イメージの全画素のうち、複数のプリントパターンへの帰属度が高い画素については、それら全てのプリントパターンイメージを構成する画素として採用される。 (もっと読む)


【課題】文書画像を生成する際には、文字の切り出しが正しく行われやすくする文書画像を生成すること、及び、文字認識等の後処理を行う場合には、文字切り出しが正常に行われやすくすること。
【解決手段】文字コードで構成される文章情報200に基づき、文書画像データを生成する情報処理装置であって、互いに異なる複数のマスクパターンを記憶する記憶手段と、文章情報200を入力する入力手段と、該入力手段によって前記文章情報200の中の文章を構成する文字コードの順番に、対応する文字パターンを生成する文字パターン生成手段と、該文字パターン生成手段で注目文字コードに対応する文字パターンを生成する場合、従前に選択したマスクパターンとは異なるマスクパターンを前記記憶手段から選択する選択手段と、注目文字コードに対応する文字パターンと、前記選択手段で選択されたマスクパターンとを合成し、合成後の文字パターンをページ画像206の一部として出力する合成手段と、を備えることを特徴とする。 (もっと読む)


【課題】印刷品質のばらつきや小切手等の変形によって波形の変形が大きい場合であっても、精度良くMICR文字認識を行うことができる磁気インク文字認識方法及び磁気文字認識装置を提供する。
【解決手段】情報記録媒体の表面に印字されたMICR文字を読取ることによって文字を認識する磁気文字認識方法および磁気文字認識装置において、最初の比較において一致係数が高いものから順に複数の候補文字を選択しておき、それぞれの候補文字ごとに、その比較位置をずらしながら基準波形と文字波形との一致係数を算出し、候補文字ごとの最大一致係数を求め、それらのうちで最も高い最大一致係数を示す候補文字を読取り文字として決定する。 (もっと読む)


【課題】予め文字の大きさやアスペクト比などを設定することなく,画像情報に含まれた文字列領域を正確に決定することのできる画像の文字領域決定方法及び画像の文字領域決定装置を提供すること。
【解決手段】複数の連結画素に文字認識処理を施したときの同一性が最も高い同一性最高連結画素を判別して(S4),該同一性最高連結画素と外接矩形の大きさが同じ連結画素を抽出し(S5),さらに,その抽出された上記連結画素から所定の条件で配置された連結画素を抽出する(S6)。その後,その抽出された連結画素と上記同一性最高連結画素とを含む外接矩形領域を画像情報における文字列領域と決定する(S7)。 (もっと読む)


【課題】文字認識率の向上と文字認識処理速度の向上とを両立できるようにする。
【解決手段】描画面へ座標入力装置により入力された手書き文字の認識を行う手書き文字認識装置であって、前記描画面から文字領域の抽出を行う文字領域抽出手段と、前記文字領域内の手書き文字の傾斜角を取得する傾斜角取得手段と、前記文字領域内の手書き文字の傾斜角を修正する傾斜角修正手段と、前記文字領域内の手書き文字認識を行う文字認識手段と、前記文字領域の描画面内での位置に応じて文字認識処理または傾斜角取得処理を変更する処理変更手段とを備えることを特徴とする手書き文字認識装置等、を提供する。 (もっと読む)


【課題】他の文字矩形と結合しない文字矩形パターンを辞書データとして登録し、該辞書データとマッチングした文字矩形を他の文字矩形と結合させずに文字切出を行うようにして、文字切出の困難な文字画像からでも正確でかつ高速に文字パターンを切り出すことができ、誤読文字を低減させることができるようにする。
【解決手段】全角文字又は幅の広い文字及び半角文字又は幅の細い文字を含む文字パターンから成る文字列の画像から各文字パターンを1文字単位で切り出す文字切出方法であって、誤って結合する半角文字又は幅の細い文字、及び、1文字で他の文字とは結合しない文字の文字パターンを辞書データとして登録し、射影によって検出された文字矩形とパターンマッチングを行い、マッチングした文字矩形を他の文字矩形とは結合させずに文字パターンを切り出す。 (もっと読む)


【課題】複数画像中にある文字から文字列を生成することができないことを課題とし、複数画像中にある文字から文字列を生成することができるようにした画像処理システムを提供する。
【解決手段】画像処理システムの画像入力手段は、時系列に連動した画像を入力し、第1の文字抽出手段は前記画像入力手段によって入力された第1の画像から文字を抽出し、第2の文字抽出手段は前記画像入力手段によって入力され、前記第1の画像より後の画像である第2の画像から文字を抽出し、差分検出手段は前記第1の文字抽出手段によって抽出された文字と前記第2の文字抽出手段によって抽出された文字との差分を検出し、分割手段は前記差分検出手段によって検出された差分を、前記第1の画像と前記第2の画像との間にある画像の数にあわせて分割し、合成手段は前記分割手段によって分割された文字の差分を、前記第1の画像と前記第2の画像との間にある画像に合成する。 (もっと読む)


【課題】エッジ組情報に頼らない、省メモリな、かつ文字領域を極力失わない文字領域判別をすることが可能な画像処理装置を提供する。
【解決手段】文字領域検出部509では、文字領域を極力失わずに抽出するために、エッジ情報にて1次選別するのではなく、濃度情報を基に二値化部509aで得られた結果で1次選別を行い、文字判定部509cでは文字の仕様上の最大幅を超えた画素列を非文字領域に分別する文字補正によって、2次選別を行う。文字補正は最低限注目ラインの二値化結果を図示しないメモリに入れておけば機能するため、省メモリな処理が可能である。 (もっと読む)


【課題】
帳票の種類が多様な読み取り対象に対して,高精度な帳票認識手法を提案することである。また,種類の識別手法を提案することである。また,帳票に記載されている下線を抽出する手法を提供することである。
【解決手段】
帳票画像200から罫線枠204,206と文字行212を抽出し,文字識別結果と単語辞書を照合することにより,文字識別の誤りを修正する。表の特徴と,照合により求めた帳票名と項目名から帳票の種類を識別する。帳票画像から文字行と罫線を抽出し,抽出した罫線から枠を構成する罫線を除去し,残りの罫線と文字行の配置を比較することにより,下線を抽出する。
【効果】
登記済通知書のような非定型帳票に対しても高精度に帳票の種類を識別することができ,下線を文字中のストロークなどと間違うことなく,高精度に抽出することができる。 (もっと読む)


【課題】背景色のある文字領域(例えば、蛍光ペンによるマークを付けた文字領域部分)であっても、文字認識率を高めることができる文字認識処理システムおよび文字認識処理プログラムを提供する。
【解決手段】文字認識処理の確からしさを評価し、前記文字認識の確からしさが低いと評価された場合は、文字認識処理の対象となった領域に対して複数の領域に分類し、前記分類された領域に対して、文字認識の確からしさが高いと評価された領域に関する情報に応じて文字と文字以外とを分離し、前記分離された文字領域に対して文字認識処理を行う。 (もっと読む)


【課題】文書領域抽出の性能を向上させることができる画像処理装置、画像形成装置、プログラムおよび画像処理方法を提供する。
【解決手段】レイアウトの概略(文字や写真・絵の大体の空間的配置や分布など)に基づいて計算された文書画像データの画像特徴量を用いて当該文書画像データの画像タイプを分類識別した後、分類結果及び画像タイプと領域抽出方法の対応規則を対応付けた情報に基づいてレイアウト解析における領域抽出の方法を選択し、選択された領域抽出の方法に基づいて文書画像データを領域に分割する。これにより、レイアウトの概略に従うことで画像のタイプを特徴付ける画像特徴量を高速に計算することができるとともに、文書画像データの画像タイプに適したレイアウト解析における領域抽出方法を選択することができるので、文書領域抽出の性能を向上させることができる。 (もっと読む)


【課題】行方向の判定につき正解率を向上させる。
【解決手段】本行方向判定方法は、縦書き又は横書きの文字群の読み取り結果に対する縦方向の文字認識処理による第1の認識文字数と、読み取り結果に対する横方向の文字認識処理による第2の認識文字数とを取得する工程と、n(nは2以上の整数)個の連続文字の出現確率を格納するnグラムデータ格納部を参照して、縦方向の文字認識処理によるn個の連続認識文字の第1の平均出現確率と、横方向の文字認識処理によるn個の連続認識文字の第2の平均出現確率とを算出する工程と、第1の認識文字数と第2の認識文字数とが所定の条件を満たす場合には、第1の平均出現確率と第2の平均出現確率の大小に応じて縦書き又は横書きを判定する判定ステップとを含む。このようにnグラムを用いることによって、単語でないような語が認識された場合であっても行方向を正確に判定することができるようになる。 (もっと読む)


【課題】影と日向との境界を含むような画像から文字領域を的確に抽出する。
【解決手段】対象画像に平滑化処理およびエッジ抽出処理を施し、該処理後の画像に対して、連続領域毎に画像を区分けする第1のラベリング処理を施し、第1のラベリング処理でラベリングされた各連続領域の中で、予め定めた文字としての上限サイズより大きい領域を消去し、消去後の画像に対して膨張収縮処理を施し、収縮処理後の画像に対して第2のラベリング処理を施し、前記消去後の画像(膨張収縮前の画像)に残っているラベリングされた各領域の中で、第2のラベリング処理でラベリングされた領域の内側に包含された領域を検出し、該検出された領域を前記消去後の画像から削除する。 (もっと読む)


【課題】画像から文字をより精度よく認識できる文字認識装置を提供する。
【解決手段】文字認識装置1では、画像分割部15は、画像を複数の文字領域に分割する。このとき、つぶれ判定部16は、その複数の文字領域をつぶれているか否かを判定し、つぶれていると判定した場合、文字認識部17はその文字領域の認識をしない。このように、認識しても高精度な結果は得られない文字領域の認識をしないことにより、高精度な認識ができる文字領域の認識結果を効率的に出力する。 (もっと読む)


【課題】地紋、罫線、印影等があり、保険証別に対象項目の読取位置が異なる保険証を高精度に認識する。
【解決手段】保険証を撮像して保険証画像を生成する第1の工程と、前記保険証画像から地紋を検出して除去する第2の工程と、前記保険証画像から罫線を検出して除去する第3の工程と、前記保険証画像から印影を検出して除去する第4の工程と、前記の各種工程の後の保険証画像の文字を認識する工程とを備えたものである。 (もっと読む)


【課題】多値の文字パターンの黒画素の密度を用いて文字認識に最適な2値の文字パターンを得るためのプレーンを決定する文字認識装置の提供。
【解決手段】多値の文字パターンの各画素を輝度値毎のプレーンに割り当て、文字認識に最適なプレーンを選択して2値の文字パターンを得る文字認識装置において、プレーンごとの黒画素数を測定する黒画素数測定部と、前記黒画素数の累積度数をプレーンごとに計算する累積度数計算部と、前記累積度数からプレーンごとの累積黒画素密度を求め、所定値にもっとも近い累積黒画素密度となるプレーンを出力するプレーン選択部と、を備えた。 (もっと読む)


61 - 80 / 123