説明

Fターム[5B064AA01]の内容

文字認識 (8,173) | 読取り用途 (1,386) | 帳票、文書 (787)

Fターム[5B064AA01]に分類される特許

41 - 60 / 787


【課題】ルビ文字の対象となる親文字を正しく特定する。また、ルビ文字の認識結果にルビ種別情報を付加する。
【解決手段】レイアウト解析手段22は、入力画像に対してレイアウト解析処理を行って文章領域を抽出する。領域分別手段23は、文章領域に対して領域分別処理を行い、本文行領域と行間領域とに分別する。仮決定手段24は、行間文字列を抽出し、行間文字列ごとに、本文行領域の文字列の中から仮親文字列を決定するとともに、仮ルビ種別を決定する。文字認識手段25は、文字認識処理を行う。本決定手段26は、仮親文字列の認識結果を参照キーとしてフリガナ辞書31を参照することによって得られるルビ候補の少なくとも1つと、行間文字列の認識結果が一致するか否かの判定であるルビ一致判定を行い、仮親文字列を本親文字列として決定する、或いは、仮親文字列に含まれる一部の文字列を除いた残りの文字列を本親文字列として決定する。 (もっと読む)


【課題】各文字の複数の特徴を考慮して文字列の認識精度を向上させた電子機器および文字認識方法を提供する。
【解決手段】実施形態によれば、電子機器1は、画像中から第1文字候補102(1)と第2文字候補102(2)とを検出する文字検出部14と、第1文字候補102(1)及び第2文字候補102(2)の特徴として少なくとも文字の大きさ、色、線幅の何れかを含む特徴データを検出する特徴検出15と、第1文字候補102(1)の特徴データと第2文字候補102(2)の特徴データとの一致度に基づいて文字列103として統合するか否かを判別する文字列統合部16と、文字列103の属性を示す部分を検出して対応するアプリケーション21を起動する制御部20とを有する。 (もっと読む)


【課題】
文字列が多数記載されている帳票画像内からも、また、点状ノイズが入った帳票画像内からも、高速に読み取り対象の項目名−項目値ペアを抽出することができる帳票認識方式を提供する。
【解決手段】
帳票画像内の文字列領域を検出したのち、文字列認識を行う以前の文字列に対して、文字列の画像情報を元に、当該文字列が読取対象の項目名もしくは項目値であるかどうかの認識優先度を設定する(S110)。次に、認識優先度の高い文字列矩形から順に文字列認識処理(S230)、辞書照合処理(240)、項目名−項目値関係抽出処理(S250)を行い、帳票画像内から読み取り対象の項目名−項目値関係が抽出されたと判定されれば(S130)、帳票認識処理を終了することにより、帳票画像内の全ての文字列に対して、文字列認識処理、辞書照合処理、項目名−項目値関係抽出処理を行うことなく、高速に帳票認識処理を行う。 (もっと読む)


【課題】電子ペンを用いて問題を解答した場合に、解答を適切に訂正可能な採点システムを提供する。
【解決手段】採点システムは、電子ペンと、解答用紙と、採点手段とを備える。電子ペンは、コード化パターンを読み取り、手書きストロークに関する記入情報を生成する。解答用紙には、問題と、その解答欄と、訂正解答欄とが印刷され、かつ、解答欄及び訂正解答欄を含む領域にコード化パターンが印刷されている。採点手段は、解答欄及び訂正解答欄への電子ペンによる記入情報に基づき採点を行う。 (もっと読む)


【課題】受け付けた文書情報がそのまま表示される場合に比べて、文書情報に含まれる確認させるべき属性値が強調されて表示される情報処理装置、情報処理プログラム、及び情報処理システムを提供する。
【解決手段】対話ジョブにおいて、対話部36が文書情報のイメージデータ50を表示装置16に表示させる際に、表示制御処理部46は、記憶部42に記憶されているジョブフローの定義からフロー定義Aであることを特定し、各ジョブを解析する。対話ジョブの後段のジョブが前段のジョブにより設定された属性の設定値を使用しており、前段のジョブかつ、領域OCRで作成した属性を使用しており、さらに、当該属性が記憶部42に記憶されている注意すべき属性のリストに含まれる属性である場合は、文書情報のイメージデータ50上の当該属性に対応する領域を強調して表示するようプレビュー表示イメージデータを作成し、表示装置16に表示させる。 (もっと読む)


【課題】 簡易な構成でより正確に位置検出を行うことができる光検出装置、及び光検出装置を備える紙葉類処理装置を提供することを目的とする。
【解決手段】 一実施形態に係る光検出装置は、搬送される紙葉類に対して光を照射する第1の照明部と、第2の照明部と、を有する照明部と、前記紙葉類が搬送される搬送面上の走査範囲から光を受光する受光部と、前記受光部により受光された光に基づいて画像を取得する画像取得部と、前記照明部の前記第1の照明部が点灯している場合に前記画像取得部により第1の画像を取得し、前記照明部の前記第2の照明部が点灯している場合に前記画像取得部により第2の画像を取得するように前記画像取得部を制御する制御部と、を具備し、前記第1の照明部は、光軸が前記紙葉類に対して所定の角度を成すように設けられた第1の光源と、前記受光部の光軸に対して前記第1の光源と対向する位置に設けられた第2の光源とを有し、前記第2の照明部は、前記第1の光源と前記第2の光源とのうちのいずれか1つを有する。 (もっと読む)


【課題】読み取られた原稿上の読取画像に対応して、異なるファイル形式のファイルを生成可能な制御装置及びコンピュータプログラムを提供することを目的とする。
【解決手段】原稿を読み取る読取部を制御するための制御装置である。制御装置では、読取部で読み取られた原稿上の読取画像の中から、複数のセル画像を行と列とに並べて構成されるテーブル画像が特定される(S110)。テーブル画像が特定された場合(S110:Yes)、第一のファイル形式にて、読取画像に対応する第一のファイルが生成される(S114、S116、S124)。テーブル画像が特定されなかった場合(S110:No)、第一のファイル形式とはファイル形式が異なる第二のファイル形式にて、読取画像に対応し、第一のファイルとは異なる第二のファイルが生成される(S118、S124)。 (もっと読む)


【課題】文書中の文字を正確に認識し、文字認識結果を高精度に検定する。
【解決手段】文書中の座標を取得する座標取得装置と、二つの文書を照合するサーバと、を備えた文書検定システムであって、前記座標取得装置は、前記文書中の座標を、該座標を取得した時刻と共に取得し、前記サーバは、第1の文書から取得された第1の座標と、第2の文書から取得された第2の座標とを対応付ける座標対応付け部、前記第1の文書において前記第1の座標の近傍の第1の文字列、及び、前記第2の文書において前記第2の座標の近傍の第2の文字列を抽出する文字抽出部と、前記抽出された第1及び第2の文字列から文字を認識する文字認識部と、前記第1の文字列の認識結果に基づいて、前記第2の文字列の認識精度を検定する検定部とを備える。 (もっと読む)


【課題】誤認識文字を含み得る認識結果の文字データから所望のデータを抽出する。
【解決手段】情報処理装置(30)は、所望の項目に対する少なくとも1つの項目の文字または文字列の位置関係を表す条件情報(436)を格納し、文字認識によって生成された文字位置情報を含む文字データ(334)を格納する記憶部(312)を含む。情報処理装置は、さらに、文字データを少なくとも1つの項目の文字または文字列と比較して、文字データにおいて少なくとも1つの項目の文字または文字列と一致または近似するとみなせる文字または文字列を検出し、検出された文字または文字列とその位置関係にある所望の項目のデータを抽出する抽出部(302,3028)を含む。 (もっと読む)


【課題】画像処理を規定するパラメータを適正に調整する。
【解決手段】CPU11は、文字列を構成する少なくとも1つの文字の認識が失敗したか否かを判定する成否判定部113と、成否判定部113によって文字列を構成する少なくとも1つの文字の認識が失敗したと判定された場合に、文字の認識が失敗した原因を推定する原因推定部116と、原因推定部116によって推定された原因に基づいて、画像処理を規定する複数のパラメータのうち、推定された原因に対応する少なくとも1つのパラメータの値を修正する処理修正部117と、を備える。 (もっと読む)


【課題】複数の頁から構成される原稿の特徴文字列を、本構成を有していない場合と比較して効率的に決定可能な画像処理装置を提供する。
【解決手段】特徴文字列候補抽出部32は、原稿に関する文字列である特徴文字列の候補を、頁ごとに1つずつ抽出する。頁情報算出部34は、特徴文字列候補それぞれに関する頁に関する頁情報を頁ごとに算出する。特徴文字列決定部36は、各頁から特徴文字列候補が算出されその特徴文字列候補に関する頁情報が算出されるごとに、その特徴文字列候補に関する頁情報に基づいて、原稿全体の特徴文字列を決定する。 (もっと読む)


【課題】手書き文字のOCR処理結果を、人が修正または確認を行う際に、修正漏れおよび確認漏れが生じにくい画像処理装置を提供する。
【解決手段】表示部と、画像データから文字候補領域を認識し、文字候補領域の文字が手書き文字であるかを判定して、手書き文字と判定した場合に判定結果を手書き文字判定結果として出力する文字判定部と、文字判定部に判定された手書き文字を文字認識候補の文字パターンと関連付けて、関連付けの結果を手書き文字認識結果として出力する文字データ処理部と、画像データを表示部の第1画面領域に表示させ、手書き文字判定結果を表示部の第2画面領域に表示させ、手書き文字認識結果の文字パターンを表示部の第3画面領域に表示させる表示制御部と、ユーザからの修正の指示に基づいて、第3画面領域に表示された文字パターンの修正を受け付けて、文字パターンの変更を行う修正部とを備える。 (もっと読む)


【課題】磁気インク文字の認識に際し、認識率を向上する。
【解決手段】小切手搬送機構30と磁気ヘッド54と制御部71とを備えた小切手読取装置1は、搬送される小切手4に記録された磁気インク文字を磁気ヘッド54により磁気的に読み取って得られる信号波形データを解析し、信号波形データにおいて1番目に検出されたピークと判断したものをピークAとし、ピークAの位置における波形の値が所定の値以下である場合に、ピークAの位置より後の所定の範囲S2に位置するピークBを検出し、ピークBの位置における波形の値のピークAの位置における波形の値に対する比率が所定の比率a以上である場合に、ピークAをノイズと判定する。 (もっと読む)


【課題】処理コストが小さく、かつ、誤認識を抑制することのできる帳票文字認識装置を得る。
【解決手段】スコアによる棄却判定部107は、文字パターン認識部106で得た認識結果の信頼度の値を元に認識結果の棄却判定を行う。文字・枠線接触数検出部110は、文字記入欄内の画像から1文字分の非文字枠画像を取り出し、非文字枠画像に接触している文字枠線の数を計測する。罫線接触棄却判定部111は、非文字枠画像に接触している文字枠線数が所定の閾値を越える場合に、文字枠線に対応した文字の認識結果を棄却する。棄却処理統合部108は、スコアによる棄却判定部107の結果と罫線接触棄却判定部111の結果の両方を元に、最終的に出力する文字認識結果の棄却判定を行う。 (もっと読む)


【課題】外部の電話帳等のデータベースを用いず、簡素化された装置構成を用いて、精度よく且つ高速で文字認識を行う。
【解決手段】文字認識装置1は、画像を入力する画像読み込み部101と、画像の文字領域を検出する文字領域検出部103と、文字領域を一文字単位で分割する文字領域分割部104と、分割領域に存在する文字に対して一文字ごとの文字認識を行い、一文字に付き1つ以上の文字認識処理結果の候補を出力する文字認識部105と、前記候補を入力し、候補への遷移に対する重み値を計算し、候補および重み値の組に基づく第1文字列遷移データを作成する第1文字列遷移データ作成部106と、第1文字列遷移データに基づき状態遷移を順次行い、各状態遷移における重み値を累積して状態遷移ごとの累積重み値を算出し、一つ以上の状態遷移の結果を累積重み値に基づき出力するWFST処理部109とを備える。 (もっと読む)


【課題】認識対象の文字を入力する仕組みに制約がなく、高精度に文字を認識できる文字認識方法等を提供する。
【解決手段】文字認識装置1は、認識対象画像を入力し(S101)、ストローク部品への分割処理を実行し(S102)、ストローク部品の集合から、認識対象スカラー値に変換し(S103)、辞書データベース3を参照して認識対象スカラー値と一致する辞書スカラー値を検索する(S104)。辞書スカラー値33は、全体構成を示すスカラー値、ストローク部品ごとの要素種別を示すスカラー値、交差ノードの数を示すスカラー値、交差ノードとストローク部品のリンクを示すスカラー値などを有する。 (もっと読む)


【課題】コンピュータ端末を用いた情報の読み取りにおいて、年間スケジュール表に含まれる日付情報を漏れなく判定し、予定内容データの読み取りを支援するシステムを提供する。
【解決手段】年間スケジュール表(表形式データ)から数値を含む区画を検出する。次に、近接する数値を含んだ区画の関連性を検出し、関連する区画を関連領域として特定する。そして、特定したそれぞれの関連領域が日付領域に該当するかどうかを判定することにより、年間スケジュール表における月ごとの日付領域を判定する。 (もっと読む)


【課題】文字認識が未完了の段階でも検索や再利用の有効度合いを高める。
【解決手段】レイアウト解析部103は、画像蓄積部102に蓄積された文書画像の領域毎の属性を解析し、文字サイズ特定部104は解析結果を基に文字サイズを特定する。文字認識順序決定部105は文字認識の順序を文字の大きな領域から行うことを決定し、文字認識部106は決定された順序で文字認識を行う。 (もっと読む)


【課題】複数色が混在した複雑な画像を背景とした複数色の文字を含む文字列を認識する。
【解決手段】文字列を含むカラー画像から生成される、それぞれ異なる色に対応する二値画像である複数の色分解画像それぞれに対して文字認識処理を行うことにより、前記複数の色分解画像それぞれに含まれるパターンに類似した文字を示す候補文字と当該候補文字の確からしさを示す確信度と当該候補文字の前記色分解画像における位置を示す情報とを含む認識結果を生成し、前記複数の色分解画像から得られた候補文字の集合に含まれる、相対位置が同じ複数の候補文字について、最大の確信度を持つ候補文字を選択し、前記選択処理で選択された候補文字を、前記相対位置に従って結合して、前記文字列を生成する。 (もっと読む)


【課題】文字列に複合文字が含まれる場合であっても、文字列を精度よく認識する。
【解決手段】文字認識装置は、文字列を表すデータを取得し、取得したデータが表す文字列から、濁点又は半濁点を判別するために予め決められた条件を満たす文字を特定する。次に、文字認識装置は、特定された文字と、この文字が複合文字の一の構成要素である場合にこの複合文字の他の構成要素となる文字とが近づくように、この特定された文字を移動する。そして、文字認識装置は、文字の形及び隣接する文字間の関連性に基づいて、文字の移動が行われた後の文字列を認識する。 (もっと読む)


41 - 60 / 787