説明

Fターム[5B064EA19]の内容

文字認識 (8,173) | 後処理 (1,120) | 修正、確定 (961) | 文字列の解析によるもの (315) | 単語 (169)

Fターム[5B064EA19]に分類される特許

1 - 20 / 169


【課題】特定の項目が記入される帳票に対して、特定の項目のデータを抽出する精度を高めることを目的とする。
【解決手段】帳票処理システムにおいて、複数の抽出対象枠に対応する文字列と、複数の抽出対象枠の配置関係と、を対応付けた枠構造辞書データを記憶し、枠抽出部と、枠構造辞書データを参照し、枠抽出部によって抽出された抽出枠を抽出対象枠に対応付けた照合結果を算出する枠照合部と、抽出対象枠に対応付けられた抽出枠に存在する文字行を抽出する文字行抽出部と、枠照合部によって算出された各照合結果に対して、抽出対象枠の文字列に対する当該文字行の類似度を示す枠スコアを算出し、各照合結果のスコアである照合結果スコアを算出するスコア算出部と、スコア算出部によって算出された照合結果スコアに基づいて、一の照合結果を抽出照合結果とすることを特徴とする帳票処理システム。 (もっと読む)


【課題】 より高い精度で単語の認識を行うことができる単語認識装置、単語認識プログラム、及び単語認識装置を備える紙葉類処理装置を提供する。
【解決手段】 一実施形態に係る単語認識装置は、複数の単語を格納する単語辞書と、単語画像から文字候補を抽出し、文字候補の認識を行い、前記単語辞書に格納されている単語毎に第1の評価値を計算する解析的マッチング手段と、特徴が出現する特徴確率を計算し、前記単語画像と前記単語辞書に格納されている単語毎の単語モデルと前記特徴確率とに基づいて第2の評価値を計算する全体的マッチング手段と、予め設定された第1の補正パラメータにより前記第1の評価値を補正し、予め設定された第2の補正パラメータにより前記第2の評価値を補正する補正手段と、補正された前記第1の評価値と補正された前記第2の評価値とを統合して第3の評価値を算出する統合評価値算出手段と、を具備する。 (もっと読む)


【課題】文字認識結果を確認および訂正する場合に正しい文字を効率よく入力することができる文字入力装置、文字入力方法を提供する。
【解決手段】文字入力装置は、文字認識部、受付部、第1マッチング部、文字列設定部、記憶部を有する。文字認識部は帳票の画像に対して文字認識処理を行うことで認識結果として一つ以上の文字列を得る。受付部は一つ以上の文字列をそれぞれ分類するための項目を有し、各項目に対する入力文字列の入力を受け付ける。前記第1マッチング部は前記受付部により受け付けられた前記入力文字列と前記文字認識部により得られた一つ以上の文字列とをマッチングする。前記文字列設定部は前記入力文字列とマッチした前記文字列を前記入力文字列が入力された項目に対応付けて前記記憶部に記憶する。 (もっと読む)


【課題】動画と関連付ける情報として、本構成を有していない場合に比較して、動画内の画像に対する文字認識結果であって、認識精度の高い文字認識結果を用いるようにした情報処理装置を提供する。
【解決手段】情報処理装置の判定手段は、動画内で撮影されている静止画像を判定し、文字認識手段は、前記判定手段によって判定された静止画像を対象として文字認識を行い、取得手段は、前記動画に関する情報を取得し、修正手段は、前記取得手段によって取得された情報に基づいて、前記文字認識手段による文字認識結果を修正し、出力手段は、前記修正手段によって修正された文字認識結果を前記動画と関連付けて出力する。 (もっと読む)


【課題】より高い精度で単語の認識を行うことができる単語認識装置、単語認識方法、及び単語認識装置を備える紙葉類処理装置を提供する。
【解決手段】一実施形態に係る単語認識装置は、複数の単語を格納する単語辞書と、単語を含む画像を受け取る画像受取手段と、前記画像から単語毎の単語画像を抽出する単語画像抽出手段と、前記単語画像から文字候補を抽出する文字候補抽出手段と、前記文字候補に対して認識を行い、前記単語辞書に格納されている単語毎に第1の評価値を計算する解析的マッチング手段と、前記単語画像と前記単語辞書に格納されている単語毎の単語モデルとに基づいて第2の評価値を計算する全体的マッチング手段と、前記第1の評価値と前記第2の評価値とを統合して第3の評価値を算出する統合評価値算出手段と、前記統合評価値算出手段により算出された前記第3の評価値を出力する出力手段と、を具備する。 (もっと読む)


【課題】 より高い精度で単語の認識を行うことができる単語認識装置、単語認識方法、及び単語認識装置を備える紙葉類処理装置を提供する。
【解決手段】 一実施形態に係る単語認識装置は、複数の単語を格納する単語辞書と、単語画像を抽出し、単語画像から文字候補を抽出し、文字候補に対して文字認識を行い、文字認識の結果に基づいて、単語辞書に格納されている単語毎に第1の評価値を計算する解析的マッチング手段と、単語画像から特徴を抽出し、単語辞書に格納されている単語毎に単語モデルを生成し、単語モデル毎に特徴が出現する確率を示す第2の評価値を計算する全体的マッチング手段と、特徴が出現する特徴確率を計算する特徴確率計算手段と、第1の評価値と第2の評価値と特徴確率の逆数とを乗算し第3の評価値を算出する統合評価値算出手段と、統合評価値算出手段により算出された第3の評価値を出力する出力手段と、を具備する。 (もっと読む)


【課題】画像から文字を認識する場合にあって、本構成を有していない場合に比較して、精度が高い文字認識結果を出力するようにした画像処理装置を提供する。
【解決手段】画像処理装置の切出位置抽出手段は、画像から文字画像を切り出す位置を抽出し、文字候補抽出手段は、抽出された位置によって分けられた文字画像に対して文字認識を行った結果である複数の文字候補を抽出し、ネットワーク生成手段は、抽出された複数の文字候補の各々をノードとし、隣接する文字画像のノード間にリンクを構築することによってネットワークを生成し、限定手段は、生成されたネットワーク内のノードに先頭方向又は最後尾方向のいずれか一方向から接続するリンクに対して、予め定められた文字列パターンに合致するリンクに限定し、出力手段は、限定されたリンクによってつながれたパス内の文字候補列を文字認識結果として出力する。 (もっと読む)


【課題】文字認識結果の候補を定義した情報を用いた文字認識で文字認識結果が得られなかった場合でも文字認識結果を得ることができ、誤認識の可能性があることを知らせることを可能にする。
【解決手段】端末装置10において、制御部11は、単語照合による文字認識を行うよう単語照合部13を制御し、単語照合部13から文字認識結果が返された場合には、その尤度が閾値以上であれば、文字認識結果を正しい結果として出力するよう認識情報出力部15を制御し、その尤度が閾値以下であれば、文字認識結果を誤認識の可能性がある結果として出力するよう認識情報出力部15を制御し、単語照合部13から文字認識結果が返されなかった場合には、文脈処理による文字認識を行うよう文脈処理部14を制御し、その尤度に関わらず、文字認識結果を誤認識の可能性がある結果として出力するよう認識情報出力部15を制御する。 (もっと読む)


【課題】 画像に検索キーワードが特徴的に用いられている場合に検出をしやすくする。
【解決手段】 画像検索装置10は、検索対象の画像を格納する画像データベース11と、画像における文字列領域を抽出する文字列領域抽出部13と、文字列領域に含まれる文字列を認識する文字列候補認識部14と、文字列領域の画像から、文字列を構成する文字の大きさ、色、形状及び装飾、並びに文字色と背景色とのコントラストの何れかに基づく当該文字列の視覚的特徴量を算出する視覚的特徴量算出部16と、検索用のキーワードを入力する検索キーワード入力部17と、キーワードが、認識された文字列に一致するか否かを検索すると共に、一致した文字列が認識された文字列領域から算出された視覚的特徴量から、画像のスコア値を算出する検索部18と、検索の結果を算出されたスコア値に応じて出力する出力部19とを備える。 (もっと読む)


【課題】キーワードと関連性の高い文字を含む画像を当該キーワードとの関連性の高い順に並べて出力する。
【解決手段】(1)画像中の文字ごとに当該文字との類似度の高い方から順に所定数の文字候補が類似度の高い順に整列されている文字候補群を記憶している。例えば、画像100中の文字番号1の文字に対する文字候補群は「眼」,「限」,「眠」,…である。(2)文字番号が連続する文字候補群中にキーワードの構成文字が1文字ずつ同順で含まれることを選出条件として、当該選出条件を満たす画像ごとに、各文字候補群中における各構成文字の順位の合計スコアを算出する。例えば、キーワード「眼精疲労」,「疲れ目」,「眼病予防」との関係で、画像100の合計スコアはそれぞれ4,4,7となる。(3)各画像がキーワードに対する合計スコアの昇順に配置されるように検索結果ページを生成する。 (もっと読む)


【課題】ショートハンド・オン・キーボード・インタフェースを介して入力されるテキスト入力を改善する。
【解決手段】単語認識システムは、ショートハンド・オン・キーボード・インタフェースを介して入力されるテキスト入力を改善する。コア辞書は、ある言語において一般的に用いられる単語を含む。拡張辞書は、コア辞書に含まれない単語を含む。このシステムは、コア辞書からの単語のみを直接出力する。拡張辞書からの候補単語は、ユーザによって選択されると出力され、同時にコア辞書に載ることができる。連結モジュールによって、ユーザは、長い単語の部分を別個に入力することができる。複合単語モジュールは、連結によって1つの長い単語を形成する2つの一般的な短い単語を組み合わせる。 (もっと読む)


【課題】帳票上の文字を認識し、その帳票に含まれる見出しと、帳票上に記入または印字された文字(文字列)に対応するデータ部とを対応付けする文字認識装置において、データ部から範囲を指定してマスクを行うことを可能とした文字認識装置を提供することである。
【解決手段】提案する文字認識装置は、帳票を読み取って得られる帳票画像から文字列を認識する文字列認識部と、見出しに相当する文字列と、対応する枠であるデータ部に印字または記入されるべき文字列のデータ特性とを有する見出し定義情報を基に、前記認識された文字列のうちから見出しに相当する文字列を特定する見出し特定部と、特定された見出しに対応付けられるべき文字列がある枠としてのデータ部を特定するデータ部特定部と、マスクすべき見出しと、マスク方法とを有するマスク定義情報、及び、前記特定されたデータ部の文字列に対する認識結果情報を基に、前記マスクすべき領域を算出するマスク領域算出部と、を有する。 (もっと読む)


【課題】
文字列が多数記載されている帳票画像内からも、また、点状ノイズが入った帳票画像内からも、高速に読み取り対象の項目名−項目値ペアを抽出することができる帳票認識方式を提供する。
【解決手段】
帳票画像内の文字列領域を検出したのち、文字列認識を行う以前の文字列に対して、文字列の画像情報を元に、当該文字列が読取対象の項目名もしくは項目値であるかどうかの認識優先度を設定する(S110)。次に、認識優先度の高い文字列矩形から順に文字列認識処理(S230)、辞書照合処理(240)、項目名−項目値関係抽出処理(S250)を行い、帳票画像内から読み取り対象の項目名−項目値関係が抽出されたと判定されれば(S130)、帳票認識処理を終了することにより、帳票画像内の全ての文字列に対して、文字列認識処理、辞書照合処理、項目名−項目値関係抽出処理を行うことなく、高速に帳票認識処理を行う。 (もっと読む)


【課題】外部の電話帳等のデータベースを用いず、簡素化された装置構成を用いて、精度よく且つ高速で文字認識を行う。
【解決手段】文字認識装置1は、画像を入力する画像読み込み部101と、画像の文字領域を検出する文字領域検出部103と、文字領域を一文字単位で分割する文字領域分割部104と、分割領域に存在する文字に対して一文字ごとの文字認識を行い、一文字に付き1つ以上の文字認識処理結果の候補を出力する文字認識部105と、前記候補を入力し、候補への遷移に対する重み値を計算し、候補および重み値の組に基づく第1文字列遷移データを作成する第1文字列遷移データ作成部106と、第1文字列遷移データに基づき状態遷移を順次行い、各状態遷移における重み値を累積して状態遷移ごとの累積重み値を算出し、一つ以上の状態遷移の結果を累積重み値に基づき出力するWFST処理部109とを備える。 (もっと読む)


【課題】コンピュータ端末を用いた情報の読み取りにおいて、年間スケジュール表に含まれる日付情報を漏れなく判定し、予定内容データの読み取りを支援するシステムを提供する。
【解決手段】年間スケジュール表(表形式データ)から数値を含む区画を検出する。次に、近接する数値を含んだ区画の関連性を検出し、関連する区画を関連領域として特定する。そして、特定したそれぞれの関連領域が日付領域に該当するかどうかを判定することにより、年間スケジュール表における月ごとの日付領域を判定する。 (もっと読む)


【課題】連続する記事部分の媒体資料解析を提供すること。
【解決手段】本発明は、複数のページにわたって連続する記事を有する媒体資料を解析するシステムおよび方法に関する。媒体資料アナライザは、セグメンタと記事コンポーザとを含む。セグメンタは、媒体資料内のコラム状の本文テキストに関連するブロックセグメントを識別する。記事コンポーザは、言語統計情報および連続移行情報に基づいて、識別されたブロックセグメントのうちのいずれが、媒体資料内の複数のページにわたって広がる連続する記事に属するかを決定する。 (もっと読む)


【課題】類似字種への誤認識を防ぐとともに、認識速度を著しく向上する。
【解決手段】特定語句と、特定語句の文字数の長さとの関係を記憶する特定語句記憶部41と、手書き入力された文字列を取得する文字列取得部31と、取得した文字列を複数個のユニットに仮切出しする仮切出部32と、切り出された各ユニット毎に複数の文字パターン候補を構成する文字パターン候補構成部33と、各文字パターン候補を連結する文字パターン候補連結部34と、連結された各文字パターン候補における終端までの文字数の長さを算出する文字数算出部35と、構成された文字パターン候補を、特定語句記憶部41に記憶された特定語句と、文字パターン候補毎に算出された終端までの文字数の長さと、に基づき限定する文字パターン候補限定部36と、限定された文字パターン候補に基づいて文字の認識を行う文字認識部37と、を備える。 (もっと読む)


【課題】精度の高い文字認識を短時間で実施する文字認識装置を提供する。
【解決手段】文字認識処理部3は、OCR辞書データを参照し、画像に写っている各文字の形状に対応する候補文字を取得し、該候補文字の中から画像に写っている文字の認識文字を特定する。さらに、文字認識処理部3は、認識文字を所定の単位に分け文字列を作成する。削除処理部41は、文字列の末尾の文字を削除して前方一致検索を行い、検索できるまで前記削除を繰り返す。付加処理部42は、削除処理部41により検索された文字列の末尾に候補文字を順に付加して前方一致検索を行い、検索されるまで前記付加を繰り返し、さらに、前記文字列を削除する前の前記文字列の当初文字数になるまで、候補文字の付加を用いた検索を繰り返す。 (もっと読む)


【課題】手書き文書中のテキスト情報を高精度に抽出して被検索データとすることと、被検索データを高精度に検索することとを両立させた情報処理装置を提供する。
【解決手段】多数の単語を格納する単語辞書10と、画像データから文字情報を抽出して文字認識する文字情報抽出部31と、文字認識された前記文字情報のうち、前記単語辞書10に含まれる単語をテキスト化して被検索データに挿入し、当該被検索データをデータベース40に格納する被検索単語抽出部32と、検索対象のテキスト情報を入力する検索テキスト入力部51と、前記検索対象のテキスト情報から前記単語辞書10に含まれる単語を検索単語として抽出する検索単語抽出部52と、前記検索単語と前記データベース40とを照合する検索部53と、を備える。 (もっと読む)


【課題】書類から光学的に読み取った画像の文字列の判読性を確認できる画像処理装置を提供する。
【解決手段】画像処理装置は、画像取得部、記憶部、文字認識部、比較部、判読性判定部を備える。前記画像取得部は書類の画像を取得する。前記記憶部には前記書類特有の文字列候補が前記書類の種別毎に記憶されている。前記文字認識部は前記画像取得部により取得された画像に対して予め設定された文字認識辞書を用いて文字認識処理を行い、文字列を得る。前記比較部は前記文字認識部により得られた文字列と前記記憶部の書類の種別毎の文字列候補とを比較する。前記判読性判定部は、前記比較部により比較された書類の種別毎の文字列候補と文字列との一致/不一致の度合いが予め設定された基準値を超えたか否かにより、前記画像取得部により前記画像が取得された書類の種別と前記書類の判読性を判定する。 (もっと読む)


1 - 20 / 169