説明

Fターム[5B064AA01]の内容

文字認識 (8,173) | 読取り用途 (1,386) | 帳票、文書 (787)

Fターム[5B064AA01]に分類される特許

161 - 180 / 787


【課題】文字画像と文字情報とが混在した電子文書に対する文字認識の精度を向上させる。
【解決手段】電子文書処理装置10は、文字情報と文字画像とを含む電子文書を取得し、電子文書に含まれる文字情報と文字画像の少なくとも一部を処理対象文字列に設定し、処理対象文字列に含まれる少なくとも1つの文字画像を文字認識した結果得られた複数の文字候補を、その評価値と共に生成する。また、電子文書処理装置10は、複数の文字情報に対して他の文字情報との共起関係に基づく関係評価値を保持し、複数の文字候補毎に、処理対象文字列に含まれる少なくとも1つの文字情報との共起関係に基づく関係評価値を取得し、複数の文字候補毎の、生成された評価値と、取得された関係評価値とに基づく評価に応じて、複数の文字候補の中から文字認識した文字画像に対応する文字情報を選択する。 (もっと読む)


【課題】 電子文書内にフォントデータを格納するようにした場合、ファイルサイズが増加してしまうという問題があった。また、描画するテキストの位置が、文書画像中の各文字画像の位置と合うようにしたい。
【解決手段】 本発明では、文書画像内の複数の文字画像に対して文字認識処理を行い、各文字画像に対応する文字コードを得る。幅の異なる複数種類の字形データの中から、各文字画像の文字の幅(或いは文字送り幅)に適合する字形データの種類を選択する。次に、文書画像と、文字認識して得た複数の文字コードと、複数の異なる文字コードで共通利用させるための複数種類の字形データと、複数の文字コードの描画の際に使用する前記選択した字形データの種類を示すデータとを格納した電子文書を生成し、指定された送信先へ送信する。 (もっと読む)


【課題】白色下地の黒色文字及び黒色下地の白色文字を含む文字画像から、精度良く文字認識及び文字抽出を行うことを課題とする。
【解決手段】本発明に係る文字認識装置は、黒色下地の白色文字を含む文字画像から文字認識を行う文字認識装置であって、文字認識用パターンの特徴量と、文字認識用パターンが白黒反転された反転文字認識用パターンの特徴量とが登録されたパターン辞書と、文字画像の特徴量と、反転文字認識用パターンの特徴量とを比較することにより、文字認識を行う文字認識手段とを備え、文字認識手段により反転文字認識用パターンの特徴量との比較に基づいて文字認識されない場合、文字認識手段は、文字画像の特徴量と、文字認識用パターンの特徴量とを比較することにより文字認識を行う。 (もっと読む)


【課題】単一トラックの磁気センサを用いた磁気インク文字読取装置の読取処理速度と、複数トラックの磁気センサを用いた磁気インク文字読取装置の読取処理の信頼性を兼ね備えた磁気インク文字読取装置を提供する。
【解決手段】単一トラックの磁気センサと複数トラックの磁気センサによる磁気インク文字読取機能を持つ磁気インク文字読み取り装置を構成し、状況に応じて単一トラックの磁気センサと複数トラックの磁気センサを使い分けて、磁気インク文字の読み取り処理を行う。 (もっと読む)


【課題】画像内の関連しない領域を関連する組としてしまうという問題を防止するようにした画像処理装置を提供する。
【解決手段】画像処理装置の領域抽出手段は、1枚以上の画像から文字が記載された第1の領域と第2の領域を抽出し、文字認識手段は、前記領域抽出手段によって抽出された前記第1の領域と前記第2の領域内の文字を認識し、関連領域抽出手段は、前記文字認識手段による認識結果に基づいて、前記領域抽出手段によって抽出された前記第1の領域と関連する前記第2の領域の組を抽出する。 (もっと読む)


【課題】文字認識を正確に実行すること。
【解決手段】文字認識装置100は、分類部162が入力画像に対して文字認識を実行することで確信度を求め、求めた確信度に基づいて文字領域とノイズ付文字領域を特定する。そして、仮行候補位置推定部163、行矩形補正部164が、文字領域とヒストグラムの頻度に基づいて、仮行候補矩形を特定し、文字矩形確定部165が、仮行候補矩形の重なる領域を文字領域として特定する。文字認識処理部166は、文字矩形特定部165に特定された文字領域に対して文字認識を実行する。 (もっと読む)


【課題】イメージ化された書類から認識された文字列を、高い精度で補正することが可能な認識文字列補正装置および認識文字列補正用プログラムを提供する。
【解決手段】対象の文書に使用する正規の文字列情報と、文字の類似パターンごとの、該当する文字情報群およびこの文字情報群の中から選択された一の代表文字情報で構成された類似パターン情報とを記憶する補正情報記憶部31と、正規の文字列情報を構成する文字情報のうち類似パターンの文字情報群にある文字情報が当該類似パターンの代表文字情報に変換された文字列情報と、取得された認識文字列情報が同様に代表文字情報に変換された文字列情報とを比較する文字列比較部35と、比較された結果、同一の文字列情報であったときには、取得された認識文字列情報を正規の文字列情報に置き換えることで補正する文字列補正部36とを備える。 (もっと読む)


【課題】イメージ化された書類から認識された文字列を、高い精度で補正することが可能な認識文字列補正装置および認識文字列補正用プログラムを提供する。
【解決手段】予め設定された、文書に使用する正規の文字列情報と、この正規の文字列情報ごとの、当該文字列の中の文字で構成された当該文字列を識別するためのキーワードおよび当該文字列として認識される文字の桁数の範囲とを記憶する補正情報記憶部31と、記憶されたキーワードおよび桁数の範囲に基づいて、認識された文字列に該当する正規の文字列情報を抽出する正規文字列抽出部33と、取得された認識文字列情報を抽出された正規の文字列情報に置き換えることで補正する文字列補正部34とを備える。 (もっと読む)


【課題】文字認識処理の速度を改善する。
【解決手段】画像処理装置1は、天地判定部27、文字認識部13、辞書選択部28を有している。天地判定部27は、日本語の辞書データおよび英語の辞書データを参照して、画像データに示される文字パターンの方向を上下左右の4方向の各々にした場合の各文字パターンと前記辞書データの文字パターンとのマッチングを行い、前記マッチングの結果に基づいて前記画像データの天地方向を判定する。文字認識部13は、辞書データを使用して前記画像データに対して文字認識処理を行う。辞書選択部28は、文字認識部13に使用させる辞書データとして、前記マッチングの結果に応じた言語の辞書データを選択する。 (もっと読む)


【課題】パターン認識処理において、認識処理の精度を保ち、かつ、高速化することを目的とする。
【解決手段】パターン認識用辞書生成装置は、パターン入力部と、n次元特徴を抽出する特徴抽出部と、m次元特徴にn次元特徴を変換する特徴選択関数を生成し、特徴選択用辞書として記憶媒体に格納する特徴選択辞書生成部と、パターンの類似度を算出するための詳細識別関数を生成し、識別用辞書として記憶媒体に格納する識別関数生成部と、n次元特徴空間の部分空間で、かつ、m次元特徴空間の部分空間であるL次元特徴空間上のL次元特徴にm次元特徴を変換する大分類特徴選択関数を生成し、詳細識別関数をL次元特徴空間上の関数として変換することによって大分類識別関数を生成し、大分類特徴選択関数を特徴選択用辞書として記憶媒体に格納し、大分類識別関数を識別用辞書として記憶媒体に格納する識別関数主要部分抽出部と、を備える。 (もっと読む)


【課題】複数の頁のうちいずれか1つの頁の画像に含まれる文字画像を、他の頁に対する処理に利用し得るようにする。
【解決手段】CPU11は、画像取得部17が読み込んだ特定頁の頁数に対応する各記入領域の添付先情報を取得する。そして、CPU11は、各記入領域に添付先が定められているか否かを記入領域毎に判断する。記入領域に添付先が定められている場合には、CPU11は、特定頁の画像データから、その記入領域の記入領域位置情報で示される矩形部分のデータを、文字を表す文字画像データとして抽出する。そして、CPU11は、この文字画像データを、特定頁に対応付けるとともに、添付先情報が示す添付先である特定頁以外の頁に対応付けてRAM13に記憶する。 (もっと読む)


【課題】2値化タイプのプロセス、セグメント化、および認識を結合して単一のプロセスにする、低解像度の撮影されたドキュメントの光学式文字認識(OCR)用のグローバル最適化フレームワークを提供する。
【解決手段】このフレームワークは、大量のデータ上でトレーニングされる機械学習アプローチを含む。コンボリューショナルニューラルネットワークを採用して、複数の位置において分類関数を計算し、2値化を不要とする中間調の入力を受け入れることができる。このフレームワークは、前処理、レイアウト分析、文字認識、および単語認識を活用して、高い認識率を出力する。またこのフレームワークは、ダイナミックプログラミングおよび言語モデルも採用して、希望の出力に到達する。 (もっと読む)


利便性のためユーザが連続入力した入力文字列を認識する手書き文字認識の方法と装置が提供される。本方法は、入力文字列における複数のストローク結合の単文字認識精度に関する特徴量と空間幾何学的な特徴量とを含む、入力文字列の様々な特徴量を計算する工程と確率モデル係数がサンプル訓練を通じたパラメータ推定法で推定される確率モデルにより、様々な切り出しパターンについて各ストローク結合の切り出し信頼度を計算する工程と上記複数のストローク結合の単文字認識を行う時にマルチテンプレートマッチング法で様々な書字パターンの文字を認識する工程と最良の切り出しパスを検索する工程と認識結果最適化用の後処理を行う工程とを含む。本方法及び装置は、構造が単純で、ハードウェア要求が低く、認識が高速かつ高精度であり、組込システムに実装できる利点を有する。
(もっと読む)


【課題】帳票の画像を見ながら行うデータ入力作業を効率良く行えるようにする。
【解決手段】このデータエントリシステムは、帳票を光学的に読み取った画像を表示する表示装置と、帳票における文字記載欄の配置を含むフォーマット情報が記憶された帳票情報記憶部と、帳票中の文字記載欄毎に、テキスト入力ボックスを表示するための設定情報が記憶された入力ボックス設定情報記憶部と、画面上でポインタが移動された位置情報に従って帳票情報記憶部と入力ボックス設定情報記憶部から該当情報を読み出し、画面上の文字記載欄の近傍位置にテキスト入力ボックスをポップアップ表示するテキスト入力ボックス表示制御部とを備える。 (もっと読む)


【課題】文字認識処理において、文字認識精度を維持しつつ、処理速度を向上させる。
【解決手段】画像処理装置1は文字認識部13を有し、文字認識部13は第1認識処理部32、第2認識処理部33、辞書選択部34を有している。第1認識処理部32は、画像データから抽出された文書原稿のタイトル部に対して日本語の辞書データおよび外国語の辞書データを用いて第1文字認識処理を行う。第2認識処理部33は、画像データ全体に対して第2文字認識処理を行う。また、辞書選択部34は、第1文字認識処理の処理結果に基づいて、第2認識処理部33にて使用される辞書データを選択する。 (もっと読む)


【課題】名刺等に表記された漢字画像情報とこれに対応するローマ字画像情報とを読み取った際に、ローマ字画像情報から抽出したローマ字で漢字の文字認識処理を補完し、漢字の文字認識精度を向上することができるようにする。
【解決手段】文字認識装置は、画像読取装置100と情報処理装置200とで構成されている。情報処理装置200の制御部201は、原稿の画像情報から抽出した漢字画像情報毎に形状的特徴に基づいて対応する漢字を選択する際に、特定の漢字画像情報と所定の関係を有するローマ字画像情報について選択されたローマ字に基づいて、特定の漢字画像情報について選択処理で選択された複数の漢字の中から特定の漢字画像情報に対応する漢字を検索する。 (もっと読む)


【課題】筆記者によって記入された文字を参照して、データ入力者がデータ入力を行う際に、そのデータ入力者に対し、筆記された文字列によって表される内容を知られにくくするデータ入力システムを提供する。
【解決手段】画像読取装置100は、帳票毎に読み取った原画像データを一文字単位に分割した分割原画像データを抽出し、各分割原画像データの抽出順序を含む識別情報を設定して記憶すると共に、各分割原画像データの文字に対応する文字対応情報を抽出し、その分割原画像データの識別情報と文字対応情報とを関連づけて出力する。データ入力受付装置200は、画像読取装置100により出力される分割原画像データから予め定めた手順に従って分割原画像データを抽出して表示し、表示した分割原画像データに対してデータ入力者が入力した文字データを、表示した分割原画像データ及び当該分割原画像データの識別情報と関連づけて記憶する。 (もっと読む)


【課題】従来の技術では、誤文字の辞書マスタを有しているが、マスタへの登録機能がないため、誤文字を誰が、何を基に、どのようにマスタへ反映するかという問題がある。また、誤認識文字を修正する機能はあるが、1つ以上の修正候補より人為的に選択する必要がある。
【解決手段】画像データを文字認識する文字認識処理部120と、文字認識した結果を格納する情報データベース(D1,D2)と、文字認識において誤認識された誤文字と正しい文字を正誤辞書マスタデータベース(D3)へ登録する正誤辞書マスタ登録処理部330と、前記正誤辞書マスタデータベース(D3)に登録された誤文字により、前記情報データベース(D1,D2)に格納されている既存データを全て一括修正する文字正誤チェック処理部250と、を備える (もっと読む)


【課題】原稿の種類の区別無く読み取られた画像データに対しても、文字の認識精度を高めることが可能な画像処理装置、画像形成装置、画像処理方法、並びに前記画像処理装置を実現するためのコンピュータプログラム及び該コンピュータプログラムを記録した記録媒体を提供する。
【解決手段】画像処理装置2のA/D変換部20が受け付けた画像データに基づく画像より、原稿検知部23が、画像入力装置1で読み取られた原稿のサイズを検出して原稿の種類を判定し、判定された原稿の種類が名刺以外の一般原稿の場合(又は名刺の場合)、文字認識部31a(又は31b)が文字を認識し、フォーマット化処理部32a(又は32b)が、認識された文字が埋め込まれたPDF形式の画像データ(又はvCardのデータ)を生成し、送受信装置5が生成されたデータを外部にイメージ送信する。 (もっと読む)


【課題】画素塊に関する情報を画像内の画素塊の画像に付与する場合にあって、その付与する情報はその画像内の画素塊の画像よりも高解像度である画素塊に関する情報とするようにした画像処理装置を提供する。
【解決手段】画像処理装置の情報生成手段は、複数の画素塊の画像と該画素塊の画像よりも高解像度である該画素塊に関する情報を生成し、記憶手段は、前記情報生成手段によって生成された画素塊の画像と該画素塊に関する情報を記憶し、照合手段は、受け付けた画像内の画素塊の画像と前記記憶手段によって記憶されている画素塊の画像を照合し、情報付与手段は、前記照合手段による照合結果に基づいて、前記記憶手段から画素塊に関する情報を抽出して、該画素塊に関する情報を前記受け付けた画像内の画素塊の画像に付与する。 (もっと読む)


161 - 180 / 787