説明

Fターム[5B064DA27]の内容

文字認識 (8,173) | 文字認識 (428) | 辞書 (330) | 辞書の作成 (127) | 学習によるもの (63)

Fターム[5B064DA27]に分類される特許

1 - 20 / 63


【課題】極端な癖のある文字をOCR認識する場合に、高い認識率でかつ効率的なOCR認識を実現することが可能な仕組みを提供する。
【解決手段】読取装置から送信される画像データに含まれる文字情報の読取を実行する情報処理装置であって、前記読取装置により読み取られた文書の特定矩形領域から得られた情報を取得する画像データ取得手段と、前記画像データ取得手段で取得した前記画像データに含まれる文字情報の読取を実行する読取手段と、前記読取手段で前記画像データより読み取った読取情報を用いることにより、前記文書に書かれている文字情報を認識するためのプロファイルを特定する特定手段と、前記特定手段で特定した前記プロファイルを用いることにより前記文書に書かれている文字情報の認識を実行する文字情報認識手段と、前記文字情報認識手段で文字認識を実行した結果得られるエラー回数に応じて、適用する認識結果を決定する決定手段と、前記決定手段で決定した前記認識結果を登録する登録手段とを備える。 (もっと読む)


【課題】1つのクラス内に全く異なる字体が混在している場合でも環境を考慮して手書き単語の認識精度を著しく向上することが可能な手書き単語認識装置を提供する。
【解決手段】郵便物処理システムにおいて郵便物上の画像内に存在する手書き単語を認識する手書き単語認識装置において、1つのクラス内に全く異なる字体が混在している場合でも、1つの状態に対し複数個のガウス分布を割り当て可能とすることで、両隣の文字による文字変形等の環境を考慮して手書き単語の認識精度を著しく向上させる。 (もっと読む)


【課題】 識別に有効な特徴成分を残しつつ識別に不要な成分を削除して特徴選択を行い、認識を高速化、高精度化する。
【解決手段】 学習用パターンから選定されるパターン対の各々についてn次元特徴を抽出し、その差分特徴の各々に対して重要度を設定する。差分特徴の射影長を保存するような特徴成分を重要度の順に導出し、導出された特徴成分が生成する差分主空間へn次元特徴を射影する射影行列を生成して差分主空間辞書に記録する。射影行列を用いて学習用パターンのn次元特徴をm次元特徴に変換し、学習用パターンを識別するための識別関数を生成して差分空間内識別辞書に記録する。与えられたパターンの認識時には、識対象となるパターンからn次元特徴を抽出し、差分主空間辞書に記録された射影行列を用いてm次元特徴を取得し、差分主空間内識別辞書の識別関数を用いて各カテゴリに対するパターンの類似度を算出する。 (もっと読む)


【課題】本発明は、帳票内に存在する押印の文字を正確に認識する帳票認識装置を提供することを目的とする。
【解決手段】帳票画像を取得するイメージ入力部と、帳票画像から押印画像を検出する押印画像検出部と、押印色とその他の色とを分離する背景色分離部と、押印画像の傾きを補正する傾き補正部と、文字列を切り出す文字列探索部と、文字列を構成する各文字を切り出す文字切出部と、各文字を認識する文字認識部と、文字列形式に適合する文字認識結果を選択する知識処理部と、文字認識結果と当該文字認識結果の信頼度とに基づいて文字認識結果を棄却するか否かを判定する棄却判定部と、文字認識結果が棄却された場合に、押印画像の文字を再度認識させるか否かを判定するリトライ判定部と、を備えることを特徴とする帳票認識装置。 (もっと読む)


【課題】電子文書の言語または言語ファミリといった画像の特徴を特定する方法を提供する。
【解決手段】本発明に係る方法の一形態では、画像データの所定の領域に含まれる複数の字体要素について、特徴点の数に対応する字体要素の出現回数を、特徴点の数をビンとした度数分布として積算し、該度数分布から対象分布特性を求め、対象分布特性と、見本分布特性とを比較することにより文字の言語または言語ファミリを特定する。 (もっと読む)


【課題】パターン認識を高精度に行うパターン認識装置、パターン認識プログラム、パターン認識方法を提供する。
【解決手段】学習用サンプルパターンを種別する複数のカテゴリごとに、同じカテゴリに含まれる複数の特徴ベクトルごとに求められる参照特徴ベクトルの同じ位置の要素を、予め設定された範囲の軸に投影し、軸上の要素ごとに、予め設定されたマージン量とカテゴリを関連付けて生成した候補テーブルを記録する記録部7と、与えられたパターンの参照特徴ベクトルを求め、前記候補テーブルを用いて、該参照特徴ベクトルの要素ごとに分類をして候補カテゴリ集合を求め、分類した候補カテゴリ集合を出力する分類部と、を備えるパターン認識装置である。 (もっと読む)


少なくとも1つのアイテムに対する光学式文字認識(OCR)の精度を向上させるシステムおよび/または方法において、少なくとも1つのOCRモジュールから、OCRスキャニングのOCR結果を取得することと;OCR結果の少なくとも一部分を使用して、少なくとも1つのOCRシードを生成させることと;OCRシードの少なくとも一部分を使用して、少なくとも1つのOCR学習セットを生成させることと;OCR学習セットを少なくとも1つのアイテムに適用して、付加的な光学式文字認識(OCR)結果を取得することとを含む。 (もっと読む)


【課題】入力パターンの各カテゴリに対する類似度を過去の認識結果に基づいて評価した値で認識結果を判定でき、効率的に精度の高いパターン認識を実現するパターン認識方法、文字認識方法、パターン認識プログラム、文字認識プログラム、パターン認識装置および文字認識装置を提供する。
【解決手段】パターン認識処理では、認識用の辞書に登録されている複数のカテゴリに対する入力パターンの類似度を算出し、算出した類似度を正解である条件で当該類似度となる確率と正解でないという条件で当該類似度となる確率とから得られる第1評価値に変換し、その第1評価値と事前確率とから第2評価値を算出し、第2評価値が最大となるカテゴリを選択するようにしたものである。 (もっと読む)


【課題】2値化タイプのプロセス、セグメント化、および認識を結合して単一のプロセスにする、低解像度の撮影されたドキュメントの光学式文字認識(OCR)用のグローバル最適化フレームワークを提供する。
【解決手段】このフレームワークは、大量のデータ上でトレーニングされる機械学習アプローチを含む。コンボリューショナルニューラルネットワークを採用して、複数の位置において分類関数を計算し、2値化を不要とする中間調の入力を受け入れることができる。このフレームワークは、前処理、レイアウト分析、文字認識、および単語認識を活用して、高い認識率を出力する。またこのフレームワークは、ダイナミックプログラミングおよび言語モデルも採用して、希望の出力に到達する。 (もっと読む)


【課題】パターン認識処理において、認識処理の精度を保ち、かつ、高速化することを目的とする。
【解決手段】パターン認識用辞書生成装置は、パターン入力部と、n次元特徴を抽出する特徴抽出部と、m次元特徴にn次元特徴を変換する特徴選択関数を生成し、特徴選択用辞書として記憶媒体に格納する特徴選択辞書生成部と、パターンの類似度を算出するための詳細識別関数を生成し、識別用辞書として記憶媒体に格納する識別関数生成部と、n次元特徴空間の部分空間で、かつ、m次元特徴空間の部分空間であるL次元特徴空間上のL次元特徴にm次元特徴を変換する大分類特徴選択関数を生成し、詳細識別関数をL次元特徴空間上の関数として変換することによって大分類識別関数を生成し、大分類特徴選択関数を特徴選択用辞書として記憶媒体に格納し、大分類識別関数を識別用辞書として記憶媒体に格納する識別関数主要部分抽出部と、を備える。 (もっと読む)


【課題】類似文字における特徴の差異を高精度に識別すること。
【解決手段】文字識別プログラムが、任意の文字を、互いに類似する文字カテゴリ(例えば、文字カテゴリA、文字カテゴリB)のどちらに属するかを識別する際に、文字カテゴリA、文字カテゴリBに共通する情報を特徴空間上の共通分布として求め、求めた共通分布を各文字カテゴリが示す分布に対し、畳み込み積分を行う。そして、畳み込んだ分布に基づき、固有値、固有ベクトルをカテゴリごとに新たに算出し、擬似ベイズ識別を行う。 (もっと読む)


【課題】 辞書を記憶する記憶容量が小さな装置であっても、画像パターンの認識精度を向上させることができるパターン認識辞書作成装置を提供する。
【解決手段】 入力画像の特徴量を求めて特徴ベクトルを生成する特徴ベクトル生成部111と、各画像の特徴ベクトル同士を比較して類似度の高い画像をグループとしてまとめるグループ化部114と、特徴ベクトル生成部で生成された特徴ベクトルに基づいて、画像の画素分布の情報を含む複数の特徴データを生成する主成分分析部113と、パターン認識用辞書を作成する場合に、グループに含まれない画像の特徴データのデータ量よりもグループに含まれる画像の特徴データのデータ量が多くなるように記憶装置23にデータを記憶させる辞書生成・登録部115とを有している。 (もっと読む)


【課題】低確信度の画像を収集分類することによりサンプル画像を効率的に収集して識別器の再学習を速やかに行う。
【解決手段】ナンバープレートを読み取った画像から文字画像を切り出して文字を識別する文字識別器を備え、文字識別の結果の確信度および前記切り出した文字画像を出力する複数の車番認識装置と、低確信度の文字画像を、複数グループに分類して収集してデータベースに格納する確信度判定部、および前記表示器に表示された文字画像を正しい認識結果にしたがって再分類し、前記文字画像と前記正しい認識結果の情報との紐付け情報を入力できる入力手段を備えた識別器パラメータ学習管理部を具備したセンタ装置を備え、前記再分類された文字画像および該画像と紐付けされた文字画像の認識結果の情報を教師データとして文字識別器を再学習させて文字識別器の識別パラメータを更新する。 (もっと読む)


【課題】学習に必要な演算量を低減可能なパターン識別装置の学習方法を提供する。
【解決手段】特徴抽出用パラメータに従ってデータから識別用特徴量を抽出する特徴抽出器11と、識別用特徴量を入力としてそのデータに表されたパターンを識別する識別器12とを有するパターン識別装置1の学習方法は、(a)学習用データセットに含まれる同一のパターンが表された学習用データの組を特徴抽出器11に入力して得られる識別用特徴量のクラスタを決定するステップと、(b)クラスタ間の最小距離を求めるステップと、(c)最小距離の極大値が検出されたか否か判定するステップと、(d)極大値が検出されていないと判定した場合、特徴抽出用パラメータを変更して、ステップ(a)〜(c)を繰り返すステップと、(e)極大値が検出された場合、その極大値に対応する特徴抽出用パラメータが、パターン識別処理の実行時に使用されるものとするステップを含む。 (もっと読む)


【課題】手書きサンプルの汎用的な特徴およびユーザ固有の特徴を使用して、最小レベルのユーザ固有登録データを用いた適応的手書き認識を提供する。
【解決手段】汎用分類器およびユーザ固有分類器が認識プロセスを容易にできるようにすることによって、特定ユーザの手書きの特徴を利用して、ユーザがまだ入力していない手書き文字の特性を迅速に識別することができる。したがって、ユーザが、登録すなわち「トレーニング」データとして文字を初めに入力する必要なしに、新しい文字を認識することができる。本発明の一例では、汎用的な特徴の処理が、複数のユーザについてトレーニングされた汎用分類器によって実施される。本発明の別の例では、ユーザ固有の手書き認識を提供するために、ユーザ固有分類器を使用して、必要に応じて汎用分類器による分類を修正する。 (もっと読む)


【課題】文字画像が含まれるパターン画像から文字を認識する上で、類似する文字を高精度に識別して認識する。
【解決手段】このパターン認識装置は、辞書学習部23、フィルタ・マスク学習部24、部分領域特徴量計算部26、パターン識別部28および特徴ベクトル生成部29を有している。各学習部23,24は、パターン識別部28のマッチングによる認識結果に基づいてフィルタ・マスクと辞書ベクトルの更新量を積算し、学習が終了の場合、フィルタ・マスク記憶部25のフィルタ・マスクと、辞書ベクトル記憶部21の辞書ベクトルをそれぞれ更新する。 (もっと読む)


【課題】確率分布を用いた場合の文字認識と同等の文字認識能力を発揮させつつ、辞書容量を削減することを課題とする。
【解決手段】辞書作成装置10は、平均ベクトル及び共分散行列を含んで構成される確率分布を辞書登録するが、全ての文字カテゴリに各々の固有値及び固有ベクトルを対応付けて辞書登録させずに、文字カテゴリ間で特徴ベクトルが類似する分布形状については複数の分布形状を1つの分布形状に纏めて代表させるとともに、代表させる分布形状と纏めようとする文字カテゴリとを対応付けて辞書登録する。 (もっと読む)


【課題】文字認識装置は、入力された文字画像を認識して出力する場合に、高精度な文字認識を実現することを課題とする。
【解決手段】文字認識装置は、入力された文字画像を認識して出力する場合に、入力された文字画像の比較分類対象となる文字カテゴリの構造情報を利用して文字パターンを抽出し、抽出された文字パターンと当該文字パターンに対応する文字カテゴリとの類似度が最大となる文字カテゴリを、入力された文字画像の認識結果として出力する。 (もっと読む)


【課題】画像データから精度よく文字認識を行うとともに、ユーザ辞書を用いた場合であっても、誤認識を避けることが可能な文字認識装置を提供する。
【解決手段】文字認識装置1は、通常辞書10aおよびユーザ辞書10bに基づいて画像データから文字認識を行う認識手段30と、認識後に入力装置を介して修正された文字列を学習文字列として入力する学習文字列入力手段41と、学習文字列を構成する文字ごとに当該文字に対応する文字コードと文字パターンとを対応付けてユーザ辞書10bに登録するユーザ辞書登録手段420と、学習文字列を学習文字列テーブル10cに登録する学習文字列登録手段421と、を備え、認識手段30は、ユーザ辞書10bに基づいて文字認識を行った文字列が学習文字列である場合に学習文字列を認識結果とし、当該文字列が学習文字列でない場合に通常辞書10aに基づいて文字認識を行う。 (もっと読む)


【課題】パターン認識率を向上する。
【解決手段】このパターン認識装置は、入力された文字パターンを特徴ベクトルに変換する入力部21と、標準的な認識ベクトル(固有値および固有ベクトル)が記憶された認識用辞書27と、入力部21により変換された文字の特徴ベクトルから、認識用辞書27の認識ベクトルと比較するための文字パターン固有の特徴を示す複数の認識ベクトルを求める特徴抽出部22と、複数の認識ベクトルと認識用辞書27に記憶された認識ベクトルとを比較してパターン認識を行い、固有ベクトル毎に一致の度合いを示すスコアを求める認識部24と、固有ベクトル毎の1位候補のスコアと2位候補のスコアとの関係から1位候補の認識結果の信頼度を求める信頼度計算部23と、信頼度計算の結果から信頼度が閾値以上の固有ベクトルを選択し認識部24に出力するベクトル選択部25とを備える。 (もっと読む)


1 - 20 / 63