説明

Fターム[5B064EA27]の内容

文字認識 (8,173) | 後処理 (1,120) | 修正、確定 (961) | 他の情報からの推測によるもの (137) | 記載位置、フォーマット (61)

Fターム[5B064EA27]に分類される特許

1 - 20 / 61


【課題】カメラ等の帳票撮影状態が不安定な画像入力装置で帳票画像を入力した場合でも、高速に精度良く、各項目の入力画像内の記載位置を特定し、各項目毎の処理を行うことができる帳票処理装置及び記録媒体を提供すること。
【解決手段】処理対象領域が、一定の不記載領域で囲まれ処理対象領域の存在方向と高さを表現している開始記号と終了記号で挟まれた帳票について、領域記号検出部で、入力画像から開始記号及び終了記号を検出し、領域抽出部で、開始記号及び終了記号の位置と高さと方向を用いて処理対象領域を抽出し、処理部で、処理対象領域に記載されている内容を開始記号及び終了記号の種類に従って処理することにより、帳票の入力画像から項目の開始記号及び終了記号を抽出して各項目の入力画像内の記載位置を特定し、各項目毎の処理を行う。 (もっと読む)


【課題】
文字列が多数記載されている帳票画像内からも、また、点状ノイズが入った帳票画像内からも、高速に読み取り対象の項目名−項目値ペアを抽出することができる帳票認識方式を提供する。
【解決手段】
帳票画像内の文字列領域を検出したのち、文字列認識を行う以前の文字列に対して、文字列の画像情報を元に、当該文字列が読取対象の項目名もしくは項目値であるかどうかの認識優先度を設定する(S110)。次に、認識優先度の高い文字列矩形から順に文字列認識処理(S230)、辞書照合処理(240)、項目名−項目値関係抽出処理(S250)を行い、帳票画像内から読み取り対象の項目名−項目値関係が抽出されたと判定されれば(S130)、帳票認識処理を終了することにより、帳票画像内の全ての文字列に対して、文字列認識処理、辞書照合処理、項目名−項目値関係抽出処理を行うことなく、高速に帳票認識処理を行う。 (もっと読む)


【課題】誤認識文字を含み得る認識結果の文字データから所望のデータを抽出する。
【解決手段】情報処理装置(30)は、所望の項目に対する少なくとも1つの項目の文字または文字列の位置関係を表す条件情報(436)を格納し、文字認識によって生成された文字位置情報を含む文字データ(334)を格納する記憶部(312)を含む。情報処理装置は、さらに、文字データを少なくとも1つの項目の文字または文字列と比較して、文字データにおいて少なくとも1つの項目の文字または文字列と一致または近似するとみなせる文字または文字列を検出し、検出された文字または文字列とその位置関係にある所望の項目のデータを抽出する抽出部(302,3028)を含む。 (もっと読む)


【課題】処理コストが小さく、かつ、誤認識を抑制することのできる帳票文字認識装置を得る。
【解決手段】スコアによる棄却判定部107は、文字パターン認識部106で得た認識結果の信頼度の値を元に認識結果の棄却判定を行う。文字・枠線接触数検出部110は、文字記入欄内の画像から1文字分の非文字枠画像を取り出し、非文字枠画像に接触している文字枠線の数を計測する。罫線接触棄却判定部111は、非文字枠画像に接触している文字枠線数が所定の閾値を越える場合に、文字枠線に対応した文字の認識結果を棄却する。棄却処理統合部108は、スコアによる棄却判定部107の結果と罫線接触棄却判定部111の結果の両方を元に、最終的に出力する文字認識結果の棄却判定を行う。 (もっと読む)


【課題】コンピュータ端末を用いた情報の読み取りにおいて、年間スケジュール表に含まれる日付情報を漏れなく判定し、予定内容データの読み取りを支援するシステムを提供する。
【解決手段】年間スケジュール表(表形式データ)から数値を含む区画を検出する。次に、近接する数値を含んだ区画の関連性を検出し、関連する区画を関連領域として特定する。そして、特定したそれぞれの関連領域が日付領域に該当するかどうかを判定することにより、年間スケジュール表における月ごとの日付領域を判定する。 (もっと読む)


【課題】複数色が混在した複雑な画像を背景とした複数色の文字を含む文字列を認識する。
【解決手段】文字列を含むカラー画像から生成される、それぞれ異なる色に対応する二値画像である複数の色分解画像それぞれに対して文字認識処理を行うことにより、前記複数の色分解画像それぞれに含まれるパターンに類似した文字を示す候補文字と当該候補文字の確からしさを示す確信度と当該候補文字の前記色分解画像における位置を示す情報とを含む認識結果を生成し、前記複数の色分解画像から得られた候補文字の集合に含まれる、相対位置が同じ複数の候補文字について、最大の確信度を持つ候補文字を選択し、前記選択処理で選択された候補文字を、前記相対位置に従って結合して、前記文字列を生成する。 (もっと読む)


【課題】画像に文字が含まれていない場合に文字列による検索を行う際、文字列が誤って検索されてしまうことを防ぎ、より精度良く文字列探索を行う。
【解決手段】文字列探索の際に、探索キーとされた長さLの文字列から、該文字列の前から後の方向に存在する全ての2個の文字の組である文字ペアを選び、各々の文字ペアに対して、候補文字集合中から文字カテゴリが一致する全ての2個の候補文字の組を探索する処理を行い、該処理の結果探索された全ての2個の候補文字の組に対して、ピッチが一定でかつ直線的に並ぶ文字列を特定するパラメータの組を算出する際に、候補文字パターンの変形角度を推定しその結果に基づく判定処理を行って合格した場合にだけ該2個の候補文字の組と該パラメータの組の情報を投票空間に投票する。 (もっと読む)


【課題】本発明は、帳票内に存在する押印の文字を正確に認識する帳票認識装置を提供することを目的とする。
【解決手段】帳票画像を取得するイメージ入力部と、帳票画像から押印画像を検出する押印画像検出部と、押印色とその他の色とを分離する背景色分離部と、押印画像の傾きを補正する傾き補正部と、文字列を切り出す文字列探索部と、文字列を構成する各文字を切り出す文字切出部と、各文字を認識する文字認識部と、文字列形式に適合する文字認識結果を選択する知識処理部と、文字認識結果と当該文字認識結果の信頼度とに基づいて文字認識結果を棄却するか否かを判定する棄却判定部と、文字認識結果が棄却された場合に、押印画像の文字を再度認識させるか否かを判定するリトライ判定部と、を備えることを特徴とする帳票認識装置。 (もっと読む)


【課題】文字列を含む画像の文字認識を行う際に、文字部分を示す文字ブロックの誤認識を抑制する。
【解決手段】文字ブロック位置取得部1aは、項目名文字列と項目名に対応する内容を示す文字を有する内容文字列とを有する画像から、項目名文字列を示す項目名文字ブロックと、内容文字列の一部または全部を示す内容文字ブロックとを抽出し、項目名文字ブロックと内容文字ブロックとの位置を示す位置情報を取得する。対応関係設定部1bは、文字ブロック位置取得部1aにより取得した位置情報に基づいて内容文字ブロックの位置から所定の方向に存在する項目名文字ブロックを抽出し、内容文字ブロックと抽出した項目名文字ブロックの項目名とを関連付け、文字ブロック統合部1eにより設定された関連付けの結果を対応関係記憶部1dに記憶させる。 (もっと読む)


【課題】読取位置の変更があっても読取定義の変更や管理を意識することなく文字認識が
できる、手書き文字認識システムおよび手書き文字認識プログラムを提供することを目的
とする。
【解決手段】本発明の手書き文字認識システム1は位置情報が紙面上に設けられた記入用
紙2に対し筆記すると共に、前記筆記の際に前記位置情報を読み込んで筆跡情報を生成す
るペン装置3と、ペン装置3で生成された前記筆跡情報に基づき筆跡イメージを生成する
筆跡イメージ生成部6と、記入用紙2に記入項目毎のチェック欄が設けられ、前記チェッ
ク欄への筆記の有無を前記筆跡イメージに基づき検出する読取位置調整検出部8と、前記
検出結果が有りの場合に、前記チェック欄への筆記に続く筆記を、このチェック欄に関連
づけられた前記記入項目への筆記として、前記筆跡イメージに基づき文字認識を行う文字
認識部9とを備える。 (もっと読む)


【課題】文字認識を正確に実行すること。
【解決手段】文字認識装置100は、分類部162が入力画像に対して文字認識を実行することで確信度を求め、求めた確信度に基づいて文字領域とノイズ付文字領域を特定する。そして、仮行候補位置推定部163、行矩形補正部164が、文字領域とヒストグラムの頻度に基づいて、仮行候補矩形を特定し、文字矩形確定部165が、仮行候補矩形の重なる領域を文字領域として特定する。文字認識処理部166は、文字矩形特定部165に特定された文字領域に対して文字認識を実行する。 (もっと読む)


【課題】複数の頁のうちいずれか1つの頁の画像に含まれる文字画像を、他の頁に対する処理に利用し得るようにする。
【解決手段】CPU11は、画像取得部17が読み込んだ特定頁の頁数に対応する各記入領域の添付先情報を取得する。そして、CPU11は、各記入領域に添付先が定められているか否かを記入領域毎に判断する。記入領域に添付先が定められている場合には、CPU11は、特定頁の画像データから、その記入領域の記入領域位置情報で示される矩形部分のデータを、文字を表す文字画像データとして抽出する。そして、CPU11は、この文字画像データを、特定頁に対応付けるとともに、添付先情報が示す添付先である特定頁以外の頁に対応付けてRAM13に記憶する。 (もっと読む)


【課題】原稿における誤記修正等の編集作業の負担を低減しつつ、ユーザ所望の内容及び書式に従い、且つ、誤記のない文書をユーザに提供し得る。
【解決手段】多機能機1は、スキャナ部25により、文字列を含む原稿に基づいた生成文書データ50を取得する。CPU11は、生成文書データ50内に存在する文字列を、各文字の書式情報に基づいて、テキストブロック51に分割する(S4)。CPU11は、生成文書データ内の文字について、再変換による修正又は文字の追加・削除による修正を、ユーザの操作に基づいて実行し、修正結果に適した書式を適用する(S6)。CPU11は、ユーザにより書式取得範囲71、書式適用範囲72が設定されると、書式取得範囲71に係る書式情報を、書式適用範囲72を構成する文字の書式として適用する(S7)。CPU11は、ユーザの操作に基づいて、生成文書データ50に基づく印刷物を出力する(S13)。 (もっと読む)


【課題】続け字を適正に文字認識する。
【解決手段】文字毎に文字の形状が予め登録された文字辞書125と、帳票に記載された記載文字と帳票の枠線との接触箇所を検出する接触検出部116と、記載文字の形状を判断して、文字辞書に予め登録された文字の中から記載文字との類似度が高い文字を候補文字として抽出する形状判断部117と、候補文字が所定の条件に適合する場合に、候補文字を確定文字として格納部に格納する文字確定部118とを有し、文字確定部は、形状判断部によって抽出された候補文字が接触検出部によって検出された接触箇所と同じ箇所で帳票の枠線と接触する文字である場合に、候補文字を確定文字として格納部に格納する。 (もっと読む)


【課題】磁気インク文字が傾いた状態で磁気ヘッドを通過した場合における磁気インク文字の誤認識を防止することができる画像読取装置を提供する。
【解決手段】画像読取装置は、原稿に印刷された磁気インク文字を磁気データとして読み取る磁気読取手段(ステップS101)と、読み取られた磁気データとMICR辞書情報とを比較することで得られる磁気的類似度に基づいて、磁気インク文字を認識する磁気文字認識手段(ステップS103)と、原稿の画像を画像データとして光学的に読み取る読取手段(ステップS102)と、読み取られた画像データに基づいて、画像の傾き角を算出する算出手段(ステップS104)と、磁気文字認識手段による磁気インク文字の認識結果と算出手段により算出された前記画像の傾き角とに基づいて、磁気インク文字を最終認識する最終認識処理手段(ステップS105)と、を備える。 (もっと読む)


【課題】グレースケールで保管された業務文書に対してOCRを適用する際に、文字列と印影が重なっている場合であっても、文字列の情報を残しつつ印影だけを除去するための技術を提供する。
【解決手段】印影の近傍に存在する文字列を、データベースと照合することにより、印影と重なった文字列を推定する。より具体的には、まず、グレースケールで入力された業務文書における印影領域を除去する。次に、除去された印影領域の近傍に存在する文字情報であって、一部の文字が印影領域によって不明確となっている文字情報を印影関連情報として抽出する。そして、抽出された印影関連情報の属性を特定し、文字列候補を格納する取引先の情報を格納する取引先データベースを参照して、属性毎に分類された印影関連情報を基に、印影領域と重複して不明確となっている文字列を推定する。 (もっと読む)


【課題】タブ譜を含む楽譜を従来よりも正確に認識することができるようにする。
【解決手段】タブ譜302の音符のノートナンバと、当該タブ譜302の音符と対になっている五線譜301の音符のノートナンバとの差を算出する。算出したノートナンバが閾値NoteDiffThrよりも大きい場合に、当該五線譜301の音符のノートナンバから、当該タブ譜302の音符に適用されるタブ譜チューニング情報408を減算した値を、当該タブ譜302の音符の新たな数字NewNumTabとする。 (もっと読む)


【課題】文字が記載された被写体からその文字を高精度にかつ迅速に得ることができる携帯端末装置のプログラム、携帯端末装置、画像認識システム及び盗難車検索システムを提供する。
【解決手段】携帯電話1は、ナンバープレートが撮像された画像からそのナンバープレート部分である被写体画像を切り出すと共にその被写体画像を盗難車検索サーバ20に送信する(ステップS1、S3)。盗難車検索サーバ20は、被写体画像を画像処理することにより、ナンバープレートに記載された文字情報を抽出する(ステップS4)。その文字情報と一致する自動車登録番号が盗難車データベースに登録されているか否かを検索し(ステップS5)、その結果を携帯電話1に送信する(ステップS7)。携帯電話1はこの結果をディスプレイに表示する。 (もっと読む)


【課題】同じ箇所に重ね書きされた文字のストロークの区切りの誤りを容易に修正することができる文字入力装置を提供する。
【解決手段】ストローク記憶手段62は、ストローク抽出手段61が抽出した各ストロークデータを時間順に記憶する。区切り推定手段63は、文字の区切りに該当するストロークデータ集合の区切りを推定し、区切り情報記憶手段64は、その区切りを示す区切り情報を記憶する。文字認識手段65は、区切り情報によって定まるストロークデータ集合毎に文字を認識し、表示手段66は、その文字を表示する。区切り変更手段67は、区切り情報記憶手段64が記憶する区切り情報をユーザの操作に応じて変更する。 (もっと読む)


【課題】文字数が変動する正規表現で表された情報を効率良くかつ正確に文字認識すること。
【解決手段】文字ラティス生成部107は、文字列領域に対して文字別辞書を用いた文字認識を実行し、文字列における1文字分の単位領域とその接続関係を示す文字ラティスを生成する。認識信頼度算出部108は、正規ラティスおよび文字ラティスの単位領域の組み合わせについて認識信頼度から成立可能性を判定し、成立する可能性がある組み合わせをノードとする対応テーブルを生成する。パス生成部109は、対応テーブルにおいて、ノードを連結してパスを生成する。最適パス決定部110は、対応テーブルにおけるパスのうち再現率および適合率が最大のパスを最適パスと決定する。対象領域抽出部111は、最適パスに対応する文字ラティスの単位領域を含む領域を、最終的に文字認識の対象となる対象領域として抽出する。 (もっと読む)


1 - 20 / 61