説明

Fターム[5B029CC28]の内容

文字入力 (4,843) | 機構制御 (1,689) | 読取り領域制御 (945) | 領域の切出し (494) | 文字行 (162)

Fターム[5B029CC28]に分類される特許

1 - 20 / 162


【課題】特定の項目が記入される帳票に対して、特定の項目のデータを抽出する精度を高めることを目的とする。
【解決手段】帳票処理システムにおいて、複数の抽出対象枠に対応する文字列と、複数の抽出対象枠の配置関係と、を対応付けた枠構造辞書データを記憶し、枠抽出部と、枠構造辞書データを参照し、枠抽出部によって抽出された抽出枠を抽出対象枠に対応付けた照合結果を算出する枠照合部と、抽出対象枠に対応付けられた抽出枠に存在する文字行を抽出する文字行抽出部と、枠照合部によって算出された各照合結果に対して、抽出対象枠の文字列に対する当該文字行の類似度を示す枠スコアを算出し、各照合結果のスコアである照合結果スコアを算出するスコア算出部と、スコア算出部によって算出された照合結果スコアに基づいて、一の照合結果を抽出照合結果とすることを特徴とする帳票処理システム。 (もっと読む)


【課題】取得された平均文字幅が、不適切である場合、適切な平均文字幅を取得する方法を提供する。
【解決手段】文字集合の第1の平均文字幅を取得することと、第1の平均文字幅と文字集合の実際の平均文字幅との近似度を表す第1の平均文字幅の信頼度を信頼度計算方法により取得することと、第1の平均文字幅の信頼度に従って、文字集合の平均文字幅が第1の平均文字幅であるか又は第2の平均文字幅であるかを判定することとを備える。 (もっと読む)


【課題】複雑なレイアウトの文書画像の行分割を正確に実現すると共に、ノイズを含む文書画像にも適用する。
【解決手段】テキストブロックを分割して少なくとも1つの画素領域を含む第1の画素領域を取得する第1の分割ステップと、第1の画素領域の各画素領域中の各々の画素行における連続白画素シーケンス間の共通重複部分を空白領域として検出し、第1の画素領域の画素領域から空白領域を除去して第2の画素領域を取得する空白領域除去ステップと、第2の画素領域を利用してテキスト行分割を実行するテキスト行分割ステップとを備える。 (もっと読む)


【課題】複雑な背景に文字が重畳された場合でも高速に文字が認識できる技術を提供する。
【解決手段】文字列矩形推定部12により、文字らしさを表す特徴量を用いて文字列の位置と大きさを推定し、代表文字認識部14により、推定した文字列の位置と大きさから代表的な文字の認識を行い、個別文字認識部16により、代表文字の認識結果から文字の探索範囲を適切に設定して各文字の認識を行う。これにより、複雑な背景に文字が重畳された場合でも高速に文字を認識することができる。 (もっと読む)


【課題】 文字や罫線の色が不定で、かつ文字色に濃淡や色の変動がある状況において、文字の画素のみを残し、その他の色の画素をドロップアウトする。
【解決手段】 入力された画像の画素を色クラスタリングして、クラスタ内の画素数から背景と文字の色を求める。画像中の色の分布から文字色の代表値を検出し、文字色の変動幅を考慮して文字色の画素を選択することにより、2値画像を生成する。また、文字の色以外の罫線などのノイズがある場合には、文字とノイズとを弁別して、ノイズをドロップアウトした文字の2値画像を生成する。2つのドロップアウト画像を用いて文字認識を行い、認識スコアが高い方を出力する。2つのドロップアウト方法による2値画像に対して文字認識することで、色むらがある場合と、罫線などのノイズがある場合の両方に対して、認識精度を向上することができる。 (もっと読む)


【課題】文字画像処理において、行毎に2色で交互に塗りつぶして配置されている交互配置表に対して、表を抽出することができる。
【解決手段】画像入力部11は、データアクセス部12を起動させてデータ記憶部13に記憶されている、多値の画像データを取得する。領域識別処理部14は、取得された多値の画像データに対して、文字領域、図領域、写真領域、表領域を識別する。罫線抽出処理部15は、得られた領域データに対して、罫線抽出処理を施す。領域識別処理部14は、得られた表領域の領域データに対して、主走査方向または副走査方向の各ラインに与えられている色成分の平均カラーマップ値を算出する。領域識別処理部14は、得られた各ラインのカラーマップ値が同一かつ連続している場合に、罫線行として抽出する。領域識別処理部14は、得られた罫線行から、罫線行内の各セルを抽出する。結果出力部16は、得られた罫線抽出結果データを出力する。 (もっと読む)


【課題】OCRの精度等に依存することなく、新たなデータのBOXへの適正な振り分けが行えるファイル振り分け装置等を提供する。
【解決手段】記憶領域であるボックス61に新たに保存されるデータに対して、既にボックス内に保存されているデータを基に、振り分け基準を作成するためのデータをユーザの収集対象データの設定に基づいて収集するデータ収集手段1と、収集されたデータから特徴を抽出して振り分け基準を作成する振り分け基準作成手段1と、前記振り分け基準作成手段で作成された基準に基づいて、新たなデータに対してボックスへの振り分けを実行するファイル振り分け制御手段1を備えている。 (もっと読む)


【課題】画像内にあって、(1)文字列要素の大きさ、(2)文字列要素間の方向、(3)文字列要素間の間隔、のいずれか1つ以上が異なる文字列が混在している場合であっても、その文字列を抽出するようにした画像処理装置を提供する。
【解決手段】画像処理装置の受付手段は、画像内の第1の文字列要素に関する情報として、その大きさ、前文字列要素からの方向、前文字列要素からの距離、を受け付け、予測手段は、第1の文字列要素に関する情報に基づいて、第2の文字列要素を予測し、検出手段は、第2の文字列要素に基づいて、第2の文字列要素を検出し、修正手段は、過去の文字列要素に関する情報に基づいて、第2の文字列要素に関する情報を修正し、制御手段は、第2の文字列要素を次の第1の文字列要素として、受付手段が受け付けるように制御し、予測手段、検出手段、修正手段による処理を繰り返して行わせるように制御する。 (もっと読む)


【課題】 画像に検索キーワードが特徴的に用いられている場合に検出をしやすくする。
【解決手段】 画像検索装置10は、検索対象の画像を格納する画像データベース11と、画像における文字列領域を抽出する文字列領域抽出部13と、文字列領域に含まれる文字列を認識する文字列候補認識部14と、文字列領域の画像から、文字列を構成する文字の大きさ、色、形状及び装飾、並びに文字色と背景色とのコントラストの何れかに基づく当該文字列の視覚的特徴量を算出する視覚的特徴量算出部16と、検索用のキーワードを入力する検索キーワード入力部17と、キーワードが、認識された文字列に一致するか否かを検索すると共に、一致した文字列が認識された文字列領域から算出された視覚的特徴量から、画像のスコア値を算出する検索部18と、検索の結果を算出されたスコア値に応じて出力する出力部19とを備える。 (もっと読む)


【課題】文字認識処理を効率的に行うこと。
【解決手段】検出部1aは、帳票を撮像して得られた画像情報2から該帳票のレイアウトが変更された旨を示す識別情報2aを検出する。領域特定部1bは、検出部1aが識別情報2aを検出すると、画像情報2に含まれる、所定の文字認識処理を行う処理対象領域3を識別するための領域識別情報2bを検出して、領域識別情報2bに基づき処理対象領域3を特定する。処理部1cは、特定した処理対象領域3に対して所定の文字認識処理を行う。 (もっと読む)


【課題】1回のスキャンで複数の任意の帳票を読み取った場合にも、各帳票を認識し、帳票毎に処理を行うことを可能とする帳票認識システムを提供する。
【解決手段】帳票認識システム10は、台紙20に貼り付けられた複数の帳票を1回のスキャンで読み取り、前記複数の帳票の画像データを生成する読取手段101と、読取手段101により生成された画像データに基づいて、前記画像データで表される前記スキャンで読み取られた領域のうち前記複数の帳票各々が存在する領域を判定する帳票認識手段103と、読取手段101により生成された画像データ及び帳票認識手段103により判定された前記複数の帳票各々が存在する領域に基づいて、前記複数の帳票各々に記載された文字を認識する文字認識手段102とを備える。 (もっと読む)


【課題】画像ブロック中のキャラクタの向きを識別する方法および装置を開示する。
【解決手段】方法は:さまざまな向きを想定されるキャラクタ向きとして想定することによって、前記画像ブロックに対して光学式文字認識処理を実行して、想定されるキャラクタ向きのそれぞれにおいて、サブ画像ブロック、それらのサブ画像ブロックに対応する認識されたキャラクタおよびその正しさ指標を得る工程と;180°の相互関係をもつ想定されるキャラクタ向きにあるサブ画像ブロックにおいて、それらのサブ画像ブロックの最小一致対を探す工程と;前記さまざまな想定されるキャラクタ向きにおけるサブ画像ブロックの異なる数の、識別結果に対する効果をなくすよう、探し出された最小一致対におけるサブ画像ブロックを調整する工程と;調整されたサブ画像ブロックに基づいて、想定されるキャラクタ向きのそれぞれにおいて、累積正しさ指標を計算する工程と;累積正しさ指標に従って前記画像ブロックにおけるキャラクタの向きを識別する工程とを含む。 (もっと読む)


【課題】画像認識の対象となる文字列に含まれる数字を書くための数字用テンプレートを提供すること。
【解決手段】画像認識の対象となる文字列に含まれる数字を書くための数字用テンプレートTMP1は、セグメントSG1〜SG3で構成される、0から9までの数字のそれぞれを書けるようにする切り抜き部TP1〜TP6を備え、切り抜き部TP1〜TP6のそれぞれを構成するセグメントSG1〜SG3は、切り抜き部TP1〜TP6を用いて書かれた0から9までの数字のそれぞれの画像に関する、文字列の並び方向に垂直な方向への射影に切れ目が生じないように配置されることを特徴とする。 (もっと読む)


【課題】帳票上の文字を認識し、その帳票に含まれる見出しと、帳票上に記入または印字された文字(文字列)に対応するデータ部とを対応付けする文字認識装置において、データ部から範囲を指定してマスクを行うことを可能とした文字認識装置を提供することである。
【解決手段】提案する文字認識装置は、帳票を読み取って得られる帳票画像から文字列を認識する文字列認識部と、見出しに相当する文字列と、対応する枠であるデータ部に印字または記入されるべき文字列のデータ特性とを有する見出し定義情報を基に、前記認識された文字列のうちから見出しに相当する文字列を特定する見出し特定部と、特定された見出しに対応付けられるべき文字列がある枠としてのデータ部を特定するデータ部特定部と、マスクすべき見出しと、マスク方法とを有するマスク定義情報、及び、前記特定されたデータ部の文字列に対する認識結果情報を基に、前記マスクすべき領域を算出するマスク領域算出部と、を有する。 (もっと読む)


【課題】
文字列が多数記載されている帳票画像内からも、また、点状ノイズが入った帳票画像内からも、高速に読み取り対象の項目名−項目値ペアを抽出することができる帳票認識方式を提供する。
【解決手段】
帳票画像内の文字列領域を検出したのち、文字列認識を行う以前の文字列に対して、文字列の画像情報を元に、当該文字列が読取対象の項目名もしくは項目値であるかどうかの認識優先度を設定する(S110)。次に、認識優先度の高い文字列矩形から順に文字列認識処理(S230)、辞書照合処理(240)、項目名−項目値関係抽出処理(S250)を行い、帳票画像内から読み取り対象の項目名−項目値関係が抽出されたと判定されれば(S130)、帳票認識処理を終了することにより、帳票画像内の全ての文字列に対して、文字列認識処理、辞書照合処理、項目名−項目値関係抽出処理を行うことなく、高速に帳票認識処理を行う。 (もっと読む)


【課題】複数色が混在した複雑な画像を背景とした複数色の文字を含む文字列を認識する。
【解決手段】文字列を含むカラー画像から生成される、それぞれ異なる色に対応する二値画像である複数の色分解画像それぞれに対して文字認識処理を行うことにより、前記複数の色分解画像それぞれに含まれるパターンに類似した文字を示す候補文字と当該候補文字の確からしさを示す確信度と当該候補文字の前記色分解画像における位置を示す情報とを含む認識結果を生成し、前記複数の色分解画像から得られた候補文字の集合に含まれる、相対位置が同じ複数の候補文字について、最大の確信度を持つ候補文字を選択し、前記選択処理で選択された候補文字を、前記相対位置に従って結合して、前記文字列を生成する。 (もっと読む)


【課題】ノイズとともにノイズではない領域(文字または文字の一部)を除去してしまい、磁気インク文字の誤認識を引き起こしてしまう。
【解決手段】明度平均値判定部82において、ノイズがないまたは少ないと判断した場合、複雑ノイズ除去処理部84において複雑なノイズ除去処理を実施すことなく、単純ノイズ除去処理部83において単純なノイズ除去処理のみを実施する。このため、ノイズでない領域(文字または文字の一部)を、複雑なノイズ除去処理を実施することにより、汚れ、サイン、または記録媒体の背景などのノイズとともに文字または文字の一部を、ノイズとして除去してしまうことを抑制し、磁気インク文字の誤認識を低下させることが可能となる。 (もっと読む)


【課題】映像に含まれる文字画像に対して好適な抽出処理を実行できる文字抽出装置、表示方法及び文字抽出方法の提供。
【解決手段】本実施形態の文字抽出装置は、映像データを再生する再生手段と、再生手段により再生された映像データを表示装置に出力する出力手段と、映像データを用いて表示装置が表示する映像の何れかの位置に対応する外部入力を受け付ける受付手段と、表示装置が表示する映像の中の、外部入力が対応する位置から一定範囲内にある第1形状の画像を抽出する画像抽出手段と、抽出手段により抽出された画像から文字を抽出する文字抽出手段とを備える。 (もっと読む)


【課題】不特定多数の種類の帳票を、予め定義されたフォームを用いずに認識する装置において、文字認識制度を劣化させることなく、二値化処理を高速化する。
【解決手段】罫線で区切られたセルの中に文字若しくは文字列を含む、又は含まないセルで構成される表を含む帳票に記載されている文字を認識する帳票認識装置であって、前記表のセルの配置を定める表構造を画定し、画像から予め定められた文字又は文字列である見出しを抽出し、前記見出しを含むセルである見出しセルの位置を前記表構造中に特定して、画定された前記表構造のセルのうち、セル内に何らかの文字又は文字列が記入されている記入済みセルを検出し、検出された前記記入済みセルのみを二値化対象セルとして選択する。前記表の中の前記二値化対象セルの二値化処理を行ない二値画像を生成することにより、前記二値画像から帳票に記載されている文字を認識する。 (もっと読む)


【課題】スケールを自動的に導くこと。
【解決手段】画像処理装置100は、画像データからスケール値の異なる複数のスケール画像を生成し、各スケール画像からブロブ画像を生成する。そして、画像処理装置100は、ブロブ画像の数とスケール値との関係に基づいて、ブロブ画像の数の変化の割合が所定の閾値に収まるスケール値を固有スケール値として計算する。画像処理装置100は、固有スケール値に対応したブロブ画像の各ブロブに重心が含まれる文書画像の2値画像の連結成分全体の外接矩形に対応した、文書画像、または文書画像の2値画像上の領域を、前記固有スケールにおける画像要素領域として出力する。 (もっと読む)


1 - 20 / 162