説明

Fターム[5B064CA05]の内容

文字認識 (8,173) | 前処理 (500) | 画像処理 (419)

Fターム[5B064CA05]の下位に属するFターム

Fターム[5B064CA05]に分類される特許

1 - 16 / 16


【課題】印刷された文書内の類似文字の判別率の向上を図る。
【解決手段】文書管理システム10は、外観が類似する文字群の中から第1の文字を判別するための判別情報を第1の文字の印刷像の光学特性に反映させて第1の文字を印刷するプリンターと、第1の文字を光学的に読み込んで印刷像の光学特性から判別情報を取得し、取得した判別情報に基づいて文字群の中から第1の文字を判別するスキャナー180と、を備える。 (もっと読む)


【課題】 簡易な構成でより正確に位置検出を行うことができる光検出装置、及び光検出装置を備える紙葉類処理装置を提供することを目的とする。
【解決手段】 一実施形態に係る光検出装置は、搬送される紙葉類に対して光を照射する第1の照明部と、第2の照明部と、を有する照明部と、前記紙葉類が搬送される搬送面上の走査範囲から光を受光する受光部と、前記受光部により受光された光に基づいて画像を取得する画像取得部と、前記照明部の前記第1の照明部が点灯している場合に前記画像取得部により第1の画像を取得し、前記照明部の前記第2の照明部が点灯している場合に前記画像取得部により第2の画像を取得するように前記画像取得部を制御する制御部と、を具備し、前記第1の照明部は、光軸が前記紙葉類に対して所定の角度を成すように設けられた第1の光源と、前記受光部の光軸に対して前記第1の光源と対向する位置に設けられた第2の光源とを有し、前記第2の照明部は、前記第1の光源と前記第2の光源とのうちのいずれか1つを有する。 (もっと読む)


【課題】文字の認識率を向上させる。
【解決手段】画像情報に対し文字認識を行い、画像情報のうち一文字として認識された画像領域に対し複数の認識結果候補文字を取得する第1の文字認識部214と、文字の画像情報であるマスク画像が記憶されたマスク画像格納部222と、マスク画像格納部を参照し、認識結果候補文字の夫々に対し認識結果候補文字に対応するマスク画像を取得し、マスク画像と一文字として認識された画像領域との論理積をとった論理積画像を生成するマスク処理部215と、論理積画像の夫々に対し文字認識を行い、論理積画像に対応する文字である認識文字、及び、認識文字と論理積画像との類似度を決定する第2の文字認識部216と、第2の文字認識部が決定した認識文字夫々の論理積画像との類似度に基づき、複数の認識文字の中から、一文字として認識された画像領域に対応する文字を決定する決定部217と、を備える。 (もっと読む)


【課題】磁気インク文字が傾いた状態で磁気ヘッドを通過した場合における磁気インク文字の誤認識を防止することができる画像読取装置を提供する。
【解決手段】画像読取装置は、原稿に印刷された磁気インク文字を磁気データとして読み取る磁気読取手段(ステップS101)と、読み取られた磁気データとMICR辞書情報とを比較することで得られる磁気的類似度に基づいて、磁気インク文字を認識する磁気文字認識手段(ステップS103)と、原稿の画像を画像データとして光学的に読み取る読取手段(ステップS102)と、読み取られた画像データに基づいて、画像の傾き角を算出する算出手段(ステップS104)と、磁気文字認識手段による磁気インク文字の認識結果と算出手段により算出された前記画像の傾き角とに基づいて、磁気インク文字を最終認識する最終認識処理手段(ステップS105)と、を備える。 (もっと読む)


【課題】単純化された態様でパターン認識を行うこと。
【解決手段】パターン検出ステップ2と、このパターン検出ステップ2において得られたパターンの特性付けを行う特性付与ステップ3と、この特性付与ステップ3において得られたパターンの認識を行う認識ステップ4と、を順に行うパターン認識方法であって、パターン特性付与ステップにおいては、M (p,q)をパターンのフーリエ−メリーン変換としかつp,qを回転およびスケール変化のそれぞれに対応したパターンの不変量を示す係数としたときに、フーリエ−メリーン空間内におけるパターンD (p,q)の不変量記述子を得る。 (もっと読む)


【課題】タブ譜を含む楽譜を従来よりも正確に認識することができるようにする。
【解決手段】タブ譜302の音符のノートナンバと、当該タブ譜302の音符と対になっている五線譜301の音符のノートナンバとの差を算出する。算出したノートナンバが閾値NoteDiffThrよりも大きい場合に、当該五線譜301の音符のノートナンバから、当該タブ譜302の音符に適用されるタブ譜チューニング情報408を減算した値を、当該タブ譜302の音符の新たな数字NewNumTabとする。 (もっと読む)


【課題】 OCR結果に混入している誤認識を効率よく検出する割合を示す「誤り検出率」を可能な限り100%に近づけていくことでOCRシステムの精度(認識率)を向上させて、実用的かつ効率的な技術の提供を目的とするものである。
【解決手段】 データの記入されたフォーム(帳票)を電子画像フォームとして読み取る画像読取手段と、読み取った電子画像フォームを性質の異なる、すなわち、誤認識を共通にしない或いは共通にすることの少ない2種類(以上)のOCRエンジンでOCR認識するOCR認識手段と、認識結果が一致した文字は自動的にデータベースへ保存し、一致しない文字及び一致してもいずれか一方のOCRエンジンの認識の信頼性の低い文字は確認修正後にデータベースへ保存するデータベース保存手段と、を備えたことを特徴とする。 (もっと読む)


【課題】文書画像中の文字が直線状に並んでいない場合や文字に直線的な部分が存在しない場合にもスキュー補正できる手法を提供する。射影変換やアフィン変換などの変形を受けた画像の補正にも適用できる手法を提供する。
【解決手段】不変量と変量を組み合わせた幾何変形推定法を用い、変形量を推定し、推定に基づき画像を補正する。実施形態では、あらかじめ様々な文字フォントを回転させながら変量(例えば、文字の外接矩形の面積)の変化を測定し、これを不変量(例えば、文字凸包内の黒画素と白画素の面積)と共に事例として記憶しておく。そして補正したい画像の各連結成分(多くは単文字に相当)から算出した回転不変量により事例を呼び出し、同じく算出した回転変量から文字の回転角を得る。文書画像44サンプルを用いて、簡単な傾き推定実験を行ったところ、25サンプルにおいて誤差1度以下、42サンプルにおいて誤差2度以下という精度を得た。 (もっと読む)


【課題】文書画像に含まれる表の罫線を精度よく検出することを目的とする。
【解決手段】表を含む文書画像を読み取って罫線を抽出する表認識装置の第一の表認識プログラムは、表認識装置に以下の処理を実行させることを特徴とする。ランレングス処理によって該文書内のラン線分情報を検出し、エッジ抽出処理によって該文書内のエッジ線分情報を検出し、該ラン線分情報および該エッジ線分情報の隣接する状態と罫線の候補の種類との関係を予め定めた条件に応じて該表の罫線の候補の種類を判別し、罫線とするか否かを判別する条件情報を罫線の候補の種類に応じて切り替え、罫線の候補と条件情報とから表の罫線情報を求める。 (もっと読む)


【課題】「途切れ」や「かすれ」が生じた画像を良好に修復する。
【解決手段】画像処理装置は、画像データのうちの文字や細線からなる領域を「特定領域」として特定し(Sa2)、この特定領域を二値化する(Sa3)。そして、画像処理装置は、背景に相当する画素が連続する長さ(ランレングス)をX方向とY方向のそれぞれについて算出し(Sa4、Sa5)、算出したランレングスに基づいてモルフォロジ演算における構造要素の形状を決定する(Sa6)。その後、画像処理装置はこの構造要素を用いてクロージング処理を実行する(Sa7)ことにより、文字や細線の「途切れ」や「かすれ」を修復する。 (もっと読む)


【課題】ドキュメント画像データに含まれる文字画像データに埋め込み情報を埋め込む処理、或いはその埋め込み情報を検出する処理を行うにあたり、文字画像データのフォントタイプの制限がなく、さらに、比較的低い演算負荷で実現できること。
【解決手段】特定の一部の領域である共通埋め込み領域のうちの少なくとも一部に有画像の画素が存在するという特性を有する特定文字に関する特定文字関連情報を記憶しておき、ドキュメント画像データに含まれる文字画像データ各々について、それが特定文字を表すものであるか否かを判別し(S104)、特定文字を表す文字画像データ各々に、その文字が占める画像領域の中の共通埋め込み領域A0の全画素を無画像とする補正を行うか否かにより、埋め込み情報を埋め込む(S105)。同様に、特定文字を表す文字画像データの共通埋め込み領域の全画素が無画像か否かを判別することにより、埋め込み情報を検出する。 (もっと読む)


【課題】スキャナだけでなくカメラでの撮像に対しても好適な手法を用いて機械可読性を補強するような情報を図形に埋め込み、前記情報が埋め込まれた実環境中の図形、例えば文字パターンを高い精度で認識することのできる認識手法を提供するものである。
【解決手段】図形を認識するために用いる認識情報を、不変量を用いて図形に埋め込み認識用図形を作成することを特徴とする認識情報の埋め込み方法と、不変量を用いて認識用図形に埋め込まれた情報を抽出し、抽出した情報に基づいて前記認識用図形に対応する元の図形を認識することを特徴とする図形認識方法とを適用する。 (もっと読む)


【構成】γ補正回路52は、イメージセンサ48によって捉えられた被写界像の再現性を互いに異なる態様で補正する6個のγ補正特性を保持する。カメラCPU60は、イメージセンサ48によって捉えられた被写界像のコントラストに基づいて、6個のγ補正特性の中から3個のγ補正特性を選択する。文字は、カメラCPU60によって選択された3個のγ補正特性の各々によって補正された再現性を有する被写界像から、カメラCPU60によって認識される。カメラCPU60によって認識された3個の文字は、LCD36に表示される。文字選択操作は、カメラCPU60によって受け付けられる。LCD36に表示された3個の文字のうち文字選択操作に従う1つの文字はフラッシュメモリ42に保存される。
【効果】 被写界に現れた文字と同じ文字を簡単な処理で作成することができる。 (もっと読む)


【課題】教育用教材についての採点集計処理の省力化を図りつつ、その場合であっても採点集計処理を精度良く、しかも必要以上の手間を要することなく行えるようにする。
【解決手段】解答欄への解答の記入および当該解答に対する正誤判定の記入がされた教育用教材に対する画像読み取りを行って画像データを得る画像入力手段3と、その画像データを基にして前記正誤判定の記入内容を認識する認識手段5と、前記認識手段5による認識結果に基づき前記教育用教材に記入された正誤判定の採点集計を行う算出・演算手段6,7と、その採点集計結果を前記教育用教材上に印刷出力するプリント手段8とを備えて、教材処理装置を構成する。 (もっと読む)


【課題】 紙文書をスキャンすることにより得られた画像データについて、画像データの内容を維持したまま、より見やすく編集することを目的とする。
【解決手段】 属性の異なる複数のオブジェクトを含む文書をスキャンすることにより得られた画像データを処理する画像処理方法であって、前記画像データを、属性の異なるオブジェクトからなるブロック毎に分割する分割工程と、属性が文字であると判定されたオブジェクトについてベクトル化する文字処理工程と、前記ベクトル化されたオブジェクトが、前記分割工程により分割されたブロックのうち、表ブロックを構成するセル内に位置していた場合に、該オブジェクトからなる文字ブロックを該セルに内接するよう拡大し(ステップS1602)、該拡大された文字ブロックに対応して、該文字ブロックに含まれる該オブジェクトを拡大する文字拡大工程(ステップS1603)とを備える。 (もっと読む)


【課題】 初期投資や手間を掛けずに簡便に名刺データの管理を行う。
【解決手段】 被写体の像を電気的な画像信号に変換して周期的に出力する画像出力手段と、前記画像信号を表示する表示手段と、内部発生または外部発生のシャッターキー操作信号に応答して前記画像信号又は前記画像信号を圧縮処理した信号を記録媒体に記録する記録制御手段とを備えた電子カメラにおいて、前記画像信号から文字情報を抽出してテキスト文字列に変換し、該テキスト文字列を当該文字情報の項目毎に分類して格納する。画像信号中の文字情報をテキスト文字列に変換して保持することができ、例えば、電子カメラ単体で名刺データの管理を行うことができる。 (もっと読む)


1 - 16 / 16