説明

Fターム[5B029CC29]の内容

文字入力 (4,843) | 機構制御 (1,689) | 読取り領域制御 (945) | 領域の切出し (494) | 文字領域と図形領域の分離 (180)

Fターム[5B029CC29]に分類される特許

1 - 20 / 180


【課題】文字画像処理において、行毎に2色で交互に塗りつぶして配置されている交互配置表に対して、表を抽出することができる。
【解決手段】画像入力部11は、データアクセス部12を起動させてデータ記憶部13に記憶されている、多値の画像データを取得する。領域識別処理部14は、取得された多値の画像データに対して、文字領域、図領域、写真領域、表領域を識別する。罫線抽出処理部15は、得られた領域データに対して、罫線抽出処理を施す。領域識別処理部14は、得られた表領域の領域データに対して、主走査方向または副走査方向の各ラインに与えられている色成分の平均カラーマップ値を算出する。領域識別処理部14は、得られた各ラインのカラーマップ値が同一かつ連続している場合に、罫線行として抽出する。領域識別処理部14は、得られた罫線行から、罫線行内の各セルを抽出する。結果出力部16は、得られた罫線抽出結果データを出力する。 (もっと読む)


【課題】OCRの精度等に依存することなく、新たなデータのBOXへの適正な振り分けが行えるファイル振り分け装置等を提供する。
【解決手段】記憶領域であるボックス61に新たに保存されるデータに対して、既にボックス内に保存されているデータを基に、振り分け基準を作成するためのデータをユーザの収集対象データの設定に基づいて収集するデータ収集手段1と、収集されたデータから特徴を抽出して振り分け基準を作成する振り分け基準作成手段1と、前記振り分け基準作成手段で作成された基準に基づいて、新たなデータに対してボックスへの振り分けを実行するファイル振り分け制御手段1を備えている。 (もっと読む)


【課題】画像中の互いに種類の異なる領域を特定する精度を向上する。
【解決手段】複数の画素のそれぞれのエッジ強度を表すエッジ画像における複数の判定領域のそれぞれに対してエッジ強度の程度を表す特徴値を算出する。そして、特徴値によって表されるエッジ強度の程度が所定の基準以上である場合に、判定領域を不均一な画像を表す第1種領域として特定し、判定領域の特徴値によって表されるエッジ強度の程度が所定の基準よりも小さい場合に、判定領域を均一な画像を表す第2種領域として特定する。 (もっと読む)


【課題】本発明は、画像におけるテキスト領域を位置決めする方法及び装置を開示する。
【解決手段】本発明による画像におけるテキスト領域の位置決め方法は、入力画像における各画素の周りに存在可能なテキストの大きさを推定するステップと、上記テキストの大きさ及び領域差異度に基づいて、上記入力画像から候補筆画領域を抽出するステップと、上記候補筆画領域から真の筆画領域を特定するステップと、前記真の筆画領域をマージしてテキスト領域を形成するステップとを含む。 (もっと読む)


【課題】帳票上の文字を認識し、その帳票に含まれる見出しと、帳票上に記入または印字された文字(文字列)に対応するデータ部とを対応付けする文字認識装置において、データ部から範囲を指定してマスクを行うことを可能とした文字認識装置を提供することである。
【解決手段】提案する文字認識装置は、帳票を読み取って得られる帳票画像から文字列を認識する文字列認識部と、見出しに相当する文字列と、対応する枠であるデータ部に印字または記入されるべき文字列のデータ特性とを有する見出し定義情報を基に、前記認識された文字列のうちから見出しに相当する文字列を特定する見出し特定部と、特定された見出しに対応付けられるべき文字列がある枠としてのデータ部を特定するデータ部特定部と、マスクすべき見出しと、マスク方法とを有するマスク定義情報、及び、前記特定されたデータ部の文字列に対する認識結果情報を基に、前記マスクすべき領域を算出するマスク領域算出部と、を有する。 (もっと読む)


【課題】帳票上の角印の画像を検出することを可能とした帳票読取装置を提供することである。
【解決手段】提案する帳票読取装置は、前記帳票を読み取って得られる帳票画像上の各文字を認識し、前記各文字に対する認識結果および外接矩形を求める文字認識部と、前記文字の外接矩形と一致または略一致する罫線の組み合わせが存在する文字を検出し、その文字と罫線の組み合わせとを合わせて角印の画像として検出する角印検出部と、を有する。 (もっと読む)


【課題】
文字列が多数記載されている帳票画像内からも、また、点状ノイズが入った帳票画像内からも、高速に読み取り対象の項目名−項目値ペアを抽出することができる帳票認識方式を提供する。
【解決手段】
帳票画像内の文字列領域を検出したのち、文字列認識を行う以前の文字列に対して、文字列の画像情報を元に、当該文字列が読取対象の項目名もしくは項目値であるかどうかの認識優先度を設定する(S110)。次に、認識優先度の高い文字列矩形から順に文字列認識処理(S230)、辞書照合処理(240)、項目名−項目値関係抽出処理(S250)を行い、帳票画像内から読み取り対象の項目名−項目値関係が抽出されたと判定されれば(S130)、帳票認識処理を終了することにより、帳票画像内の全ての文字列に対して、文字列認識処理、辞書照合処理、項目名−項目値関係抽出処理を行うことなく、高速に帳票認識処理を行う。 (もっと読む)


【課題】予め書式定義を作成することなく、帳票種別を推定することを課題とする。
【解決手段】帳票の外観上の特徴に係る特徴データを、帳票種別毎に蓄積する特徴データベース31に接続される情報処理装置1に、処理対象帳票の画像データを取得する画像データ取得部21と、画像データから、処理対象帳票に係る特徴データを取得する特徴データ取得部22と、特徴データベース31に蓄積されている特徴データから、処理対象帳票に係る特徴データに一致または類似する特徴データを特定することで、処理対象帳票の帳票種別を推定する推定部24と、推定部24によって処理対象帳票の帳票種別が推定されなかった場合に、処理対象帳票に係る特徴データを特徴データベース31に追加する特徴データ追加部25と、を備えた。 (もっと読む)


【課題】読み取られた原稿上の読取画像に対応して、異なるファイル形式のファイルを生成可能な制御装置及びコンピュータプログラムを提供することを目的とする。
【解決手段】原稿を読み取る読取部を制御するための制御装置である。制御装置では、読取部で読み取られた原稿上の読取画像の中から、複数のセル画像を行と列とに並べて構成されるテーブル画像が特定される(S110)。テーブル画像が特定された場合(S110:Yes)、第一のファイル形式にて、読取画像に対応する第一のファイルが生成される(S114、S116、S124)。テーブル画像が特定されなかった場合(S110:No)、第一のファイル形式とはファイル形式が異なる第二のファイル形式にて、読取画像に対応し、第一のファイルとは異なる第二のファイルが生成される(S118、S124)。 (もっと読む)


【課題】処理領域の自動分類、グループ化を適切に行い、帳票定義をできるだけ省力化することができる帳票定義装置を提供する。
【解決手段】帳票情報を定義する帳票定義装置1において、入力された帳票画像から帳票情報の処理領域を自動的に検出する処理領域検出部21と、検出された各処理領域のサイズの類似性、各処理領域の上下左右への接続状況、及び各処理領域を囲む周囲の罫線情報の類似性に関する情報に基づいて、同一カテゴリーの内容が記入されるべき同一グループに分類する処理領域グルーピング作成部22と、入力部からの入力情報基づいて同一のグループに分類された処理領域を選択するグループ選択I/F部24と、選択されたグループの設定情報を一括して定義するグループ情報定義部25とを備えるようにした。 (もっと読む)


【課題】画像に対する文字列検知処理の検知精度の向上をさせる。
【解決手段】本発明の文字列検知装置は、1以上の文字からなる文字列を画像から検知する文字列検知装置において、上記画像を構成する各画素が有する色情報に基づいて、類似色を有する一定数以上の画素群からなるクラスタを少なくとも1つ定義するクラスタリング手段と、上記画像を、上記クラスタリング手段によって定義された上記クラスタに属する画素群の領域と、その他の画素群の領域とに分割して、上記画像から上記その他の画素群の領域が排除されたクリッピング画像を生成するクリッピング手段と、上記クリッピング手段によって生成されたクリッピング画像から、検知すべき文字列である検知対象文字列の各文字を検知することにより、該検知対象文字列を検知する文字列検知手段とを備えていることを特徴としている。 (もっと読む)


【課題】画像データの指定した領域で罫線などの余分な要素を含むことなく高い認識精度で文字などの画像を認識することができる画像処理装置を提供する。
【解決手段】ユーザに画像データ中から指定領域を指定させる指定領域入力部204と、前記画像データを白黒画素からなる二値画像とし、該二値画像における黒画素と白画素の分布状態から前記指定領域の外周領域における境界線を決定し、前記指定領域を含めて該境界線に囲まれる領域を一次領域とする一次領域設定部205と、前記一次領域における画像データから罫線を抽出し除外する二次領域設定部210と、罫線除外後領域データD2について前記指定領域に基づいて目的の画像を切り出すための矩形抽出処理を行いその外接領域を抽出する外接領域抽出処理部215aと、前記外接領域を除外領域と包含領域に選別する除外/包含処理部215bと、前記包含領域をマージする統合処理部215cと、を備える。 (もっと読む)


【課題】精度良く線分を抽出することができる画像処理装置を提供する。
【解決手段】画像に含まれる線分を抽出する画像処理装置であって、画像の所定数の画素からなる処理単位ごとに、濃度が変化する方向である濃度変化方向を決定する濃度変化方向決定部と、濃度変化方向が反対向きの一対の処理単位を処理単位対とし、濃度変化方向と垂直な方向に連続して配置されている複数の処理単位対を含む処理単位群を線分として抽出する線分抽出部とを備える。 (もっと読む)


【課題】不特定多数の種類の帳票を、予め定義されたフォームを用いずに認識する装置において、文字認識制度を劣化させることなく、二値化処理を高速化する。
【解決手段】罫線で区切られたセルの中に文字若しくは文字列を含む、又は含まないセルで構成される表を含む帳票に記載されている文字を認識する帳票認識装置であって、前記表のセルの配置を定める表構造を画定し、画像から予め定められた文字又は文字列である見出しを抽出し、前記見出しを含むセルである見出しセルの位置を前記表構造中に特定して、画定された前記表構造のセルのうち、セル内に何らかの文字又は文字列が記入されている記入済みセルを検出し、検出された前記記入済みセルのみを二値化対象セルとして選択する。前記表の中の前記二値化対象セルの二値化処理を行ない二値画像を生成することにより、前記二値画像から帳票に記載されている文字を認識する。 (もっと読む)


【課題】スケールを自動的に導くこと。
【解決手段】画像処理装置100は、画像データからスケール値の異なる複数のスケール画像を生成し、各スケール画像からブロブ画像を生成する。そして、画像処理装置100は、ブロブ画像の数とスケール値との関係に基づいて、ブロブ画像の数の変化の割合が所定の閾値に収まるスケール値を固有スケール値として計算する。画像処理装置100は、固有スケール値に対応したブロブ画像の各ブロブに重心が含まれる文書画像の2値画像の連結成分全体の外接矩形に対応した、文書画像、または文書画像の2値画像上の領域を、前記固有スケールにおける画像要素領域として出力する。 (もっと読む)


【課題】連続する記事部分の媒体資料解析を提供すること。
【解決手段】本発明は、複数のページにわたって連続する記事を有する媒体資料を解析するシステムおよび方法に関する。媒体資料アナライザは、セグメンタと記事コンポーザとを含む。セグメンタは、媒体資料内のコラム状の本文テキストに関連するブロックセグメントを識別する。記事コンポーザは、言語統計情報および連続移行情報に基づいて、識別されたブロックセグメントのうちのいずれが、媒体資料内の複数のページにわたって広がる連続する記事に属するかを決定する。 (もっと読む)


【課題】枠線によって囲まれた様々な形状の対象領域を確実に認識すること。
【解決手段】交点抽出部が、入力画像から抽出した罫線同士の交点を抽出し、記憶部が、交点に属する各罫線に沿ってこの交点からそれぞれ遠ざかるまたは近づく向きの腕ベクトルと、この腕ベクトルが経路探索に用いられたか否かを示すフラグとを含んだ交点情報を記憶し、枠線抽出部が、所定の交点を始点として腕ベクトルの向きに従った経路探索を行うことによって閉じた経路が検出された場合に、この閉じた経路を枠線として抽出し、閉じた経路の検出に用いられた腕ベクトルに対応するフラグを使用済みへ更新し、すべてのフラグが使用済みへ更新された場合に、経路探索を終了させるように枠線認識装置を構成する。 (もっと読む)


【課題】切り出された文字候補画像が文字画像か非文字画像であるかを短時間で識別する。
【解決手段】文字画像である可能性があると判定された領域の画像が文字候補画像切出部21により文字候補画像として切出され、画像サイズ規格化部22により所定のサイズに規格化される。特徴量抽出器311〜31Nは、規格化された文字候補画像からそれぞれ異なる複数の画像特性に基づく特徴量を順次抽出する。文字識別器321〜32Nでは、抽出された特徴量に基づいて、当該文字候補画像が文字画像である可能性または非文字画像である可能性を示す識別値を算出し、しきい値と比較してその文字候補画像が文字画像/非文字画像/不明画像のいずれであるかを識別する。判定器24は、少なくとも1つの文字識別器32により文字候補画像が文字画像又は非文字画像であると識別された場合、その文字候補画像を文字画像または非文字画像であると判定する。 (もっと読む)


【課題】より正確に文書画像における歪曲を取り除き、文書位置合わせの品質を確かにし、それによって、帳票テンプレートの正確性を高めることができる画像形成装置等を提供する。
【解決手段】罫線が抽出されて、実二次元空間にマッピングされる。マッピングされた罫線と罫線テンプレートのテンプレートセルとの間の対応が決定される。互いに対応するセルの対ごとに、テンプレートセル内の各画素の位置が、セル間のアフィン変換に基づいて、実二次元空間における実位置にマッピングされる。実位置に隣接する位置にある画像内の複数の画素の画素値に基づく画素値は、実位置に対応するテンプレートセル内の画素の画素値として生成される。画像に対応する合成画像は、生成された画素値を有するテンプレート内の画素と罫線テンプレートの罫線とをマージすることによって生成される。帳票テンプレートは、複数の画像に対応する合成画像に基づいて得られる。 (もっと読む)


【課題】文字領域を含む画像に対して当該文字の再利用性の向上を考慮した補正処理を行う。
【解決手段】入力画像から文字領域を抽出し、歪みを補正する。複数の歪み補正後の文字領域に関する情報を用いて歪み補正後の文字領域に対する補正量を決定し、補正を行う。 (もっと読む)


1 - 20 / 180