説明

Fターム[5B029CC18]の内容

文字入力 (4,843) | 機構制御 (1,689) | 検出、切換え制御 (593) | 書式 (104)

Fターム[5B029CC18]の下位に属するFターム

Fターム[5B029CC18]に分類される特許

1 - 20 / 62


【課題】本発明では、OCR帳票における入力フィールドの属性情報を、上記したような従来方法における複雑な作業工程を経ることなく、ほぼ自動的に作成することができるものであって、このような従来技術が持っている欠点を解消し、より効率的なデータ処理の達成を目的としている。
【解決手段】光学的読取装置を利用した電子調査票自動作成のための入力部分自動判別および入力規則設定システムにおいて、未記入の調査票と特定記号が記載された調査票の双方のイメージデータを作成し、得られたイメージデータを相互に照合して得られる差異部分に基づき、入力フィールド情報を自動的に取得することを特徴とする入力フィールド情報決定方法に関する。 (もっと読む)


【課題】見出し部分に対するデータ部分の文字列の縦横の並びが規則的に整列していない帳票においても、帳票の見出しに対応するデータ部分の文字列を対応付けする。
【解決手段】見出しと明細行の文字列との対応付けは、特定しやすい順に行い、残った解析しにくい項目を最後に消去法で特定する。まず、見出しと明細行の文字列とが1対1で対応する行を特定し(S12)、次に、固定長の文字列を特定し(S14)、文字列の折り返しのない可変長の文字列を特定し(S15)、文字列の折り返しがあり1対1で対応する可変長の文字列を特定し(S16)、文字列の折り返しのあり1対Nで対応する可変長の文字列を特定し(S17)、それぞれ対応付けする。そして、1明細が複数行の明細行を特定し(S18)、折り返した文字列を1つに統合する(S19)。 (もっと読む)


【課題】帳票のレイアウトを自動認識する帳票認識装置において、表構造を認識し、最小矩形の属性を自動決定する。
【解決手段】帳票イメージから抽出した最小矩形の行方向の接続関係から論理行に分類し、連続して同じ行構造を持つ論理行を1つのブロックにまとめ、表の上下に接続するブロック間で、同じ列構造を持つブロックを論理列の単位でまとる。この表構造から、属する行数が最大であるブロックをボデイ部分に、そのブロックの上及び下を、ヘッダ部、フッタ部に決定し、ヘッダ部を見出し部分とし、論理列単位で文字認識して、見出し部分の属性を決定し、見出し部分の属性からボデイ部分の最小矩形の属性を決定する。 (もっと読む)


【課題】見出し等の階層レベルの判定処理を行なうことなく、見出し等の階層レベルを反映したサマリ画像を生成することのできる文書処理装置、文書サマリ作成方法および文書サマリ作成プログラムを提供すること。
【解決手段】文書処理装置は、段のレイアウトに基づいて、文書画像の頁ごとに、段の行方向に垂直な方向の少なくとも1つのレイアウト基準線を設定する(S216)。そして、文書処理装置は、所定の種別の文書要素に対応するサマリ領域を含む部分領域を、設定されたレイアウト基準線を基準として切出す(S218)。文書処理装置は、このようにして切出された部分領域を、所定の要素基準線を基準として所定の画像に配置することで、サマリ画像を生成する。 (もっと読む)


【課題】曖昧性を解消して、表中の文字列が項目かデータを判別する。
【解決手段】以下のステップで、項目あるいはデータの曖昧性を解消する。
(1) 言語パターンと、レイアウトパターンに基づき、各文字列の項目らしさの尤度を計算する。
(2) 上下、左右の近傍の文字列のラベルの組合せに対し、単語共起尤度と、レイアウトパターン共起尤度を計算する。
(3) 上記(1)による尤度と(2)による尤度の積が最も高くなるような、ラベルの組み合わせを選択する。 (もっと読む)


【課題】多様なフォーマットの文書に共通する「一般論理構造モデル」の作成および更新作業を支援する。
【解決手段】(1)先ず、紙の入力帳票を画像認識して、該入力帳票の論理構造を取得する。(2)次に、予め用意されている更新前の「一般論理構造モデル」と、(1)で取得された入力帳票の論理構造とを比較する。この比較の結果、入力帳票の論理構造の「見出し」のうちで「一般論理構造モデル」の論理要素に対応するものが存在するが、該論理要素の名称または「実表現」として登録されていないと、該「見出し」を「一般論理構造モデル」の「実表現」として登録する必要がある。(3)そこで、論理構造モデル作成支援プログラム、論理構造モデル作成支援装置および論理構造モデル作成支援方法は、入力帳票から取得された「見出し」を、「一般論理構造モデル」の対応する論理要素の「実表現」として追加する作業を支援して、作業者の負担軽減を図る。 (もっと読む)


【課題】認識した帳票データの訂正作業において、訂正作業者の負担を軽減することを課題とする。
【解決手段】この帳票認識装置は、各種の帳票に対応付けて、当該帳票を構成する複数の文字列それぞれを示す論理要素と当該論理要素間の関係とを示す論理構造を記憶する論理構造雛形記憶部を備え、入力された帳票を認識し、論理構造雛形記憶部に記憶される論理要素と一致する文字列と、論理構造雛形記憶部に記憶される論理要素間の関係を満たす帳票上の文字列の組み合わせとを抽出して格納し、格納された帳票データと、認識された帳票画像とをそれぞれ表示部に出力し、表示部に表示された帳票データの文字列がユーザにより選択された場合に、当該選択された文字列に関係する文字列を特定して、特定した文字列を他の文字列と区別して表示部に表示出力するとともに、帳票画像のうち当該特定された帳票データの文字列を含む最低限の領域を表示部に表示出力する。 (もっと読む)


【課題】登録してある帳票でなくても容易にデータを抽出することと、新たな登録帳票を容易に作成することを課題とする。
【解決手段】この帳票データ抽出装置は、複数の帳票を予め記憶する登録帳票記憶部と、各種の帳票における論理構造を記憶する共通論理構造記憶部とを備える。そして、帳票データ抽出装置は、登録帳票に対応付けて、論理構造に基づいて取得された当該登録帳票上の論理構造である登録帳票データを記憶し、入力帳票に対して、共通論理構造記憶部に記憶される論理構造に基づいて、当該入力帳票上の論理構造である入力帳票データを抽出し、抽出された入力帳票データに基づいて、当該入力帳票データに類似する登録帳票データを特定し、特定された登録帳票データに基づいて、入力帳票から入力帳票データを再抽出し、再抽出できない論理要素については入力帳票データから抽出して、再抽出した入力帳票データを新たな登録帳票データとして生成する。 (もっと読む)


【課題】どのような形式の帳票であってもその論理構造認識を高精度に実現すること。
【解決手段】(A)は、論理要素グループG1の見出し単語候補“消耗品費”を選択した場合の二つ組候補である。“消耗品費”とデータ単語候補との位置関係から、3個の二つ組候補が得られる。(B)は、論理要素グループG2の見出し単語候補“19年度”を選択した場合の二つ組候補である。“19年度”とデータ単語候補との位置関係から、3個の二つ組候補が得られる。(C)は、論理要素グループG1の見出し単語候補“消耗品費”と、論理要素グループG2の見出し単語候補“19年度”とを選択した場合の三つ組候補である。(A)と(B)に共通するデータ(8,000)のみが三つ組候補を構成する。(D)は、論理要素グループG1の見出し単語候補“旅費”と、論理要素グループG2の見出し単語候補“17年度”とを選択した場合の三つ組候補である。 (もっと読む)


【課題】 特別なマークを必要とせず、文字数や位置、角度が不定の同心円上に印字された環状の文字列を、高速かつ正確に読み取り可能とする文字読み取り方法を提供すること。
【解決手段】 環状に文字列が印字されている円形ワーク12の画像から、文字をかたまりとして高速に検索する。各かたまりの中心座標から各かたまりの順番を決定し、文字列の先頭と終端を求める。文字列を囲む扇状の領域を設定し、その領域を直線上の長方形領域に置換する。直線状に置換された画像で、予め登録されているモデルの文字画像と比較してパターンマッチングを行い、その一致度によって文字を特定して、文字の読み取りを行う。 (もっと読む)


【課題】 帳票画像を読み取る際の条件に影響されず、帳票画像データの検索を精度よく、効率的に行うことを可能にすること。
【解決手段】 テーブル要素を含む帳票画像データの検索を実行する情報処理装置における情報処理方法は、入力された画像データから少なくとも一つのテーブル要素を抽出する。テーブル要素の位置情報とサイズ情報と枠線の太さとに関する特徴データを算出し、枠線の太さ情報に基づいて、前記抽出したテーブル要素の中から、比較対象にするテーブル要素を選択する。そして、選択されたテーブル要素の特徴データに基づいて、予め登録されている帳票画像データの中から、入力された画像データに類似する帳票画像データを判定する。また、比較対象にするテーブル要素を選択する際に比較順位を割り当てて、当該割り当てられた比較順位とテーブル要素の特徴データとに基づいて、入力された画像データに類似する帳票画像データを判定する。 (もっと読む)


【課題】 入力文書画像に対して文書画像解析処理を実施、文字領域の検出及び該領域の属性(例えば、見出し、キャプション、本文等)の判別及び文字自体の認識処理を実行し、該結果に対する確度の検出をすることで、単語単位、文節単位、文単位、文書全体の確度の算出によって、検索等の高度文書処理に利用者の利便性向上を図ること。
【解決手段】 スキャナ等の画像入力部、前処理部、文書画像構造解析部、文字認識部、確度算出部、電子ドキュメント生成部より、構成される。 (もっと読む)


【課題】文書画像の行と段の抽出機能を持つ文書画像認識装置に関し,横行と縦行が混在する文書画像の行・段の抽出を高速かつ高精度に行うことができるようにすることを目的とする。
【解決手段】文書画像傾き検出部1は,文書画像を参照して文字を構成する成分の集合を抽出し,これをもとに横および縦の行候補を抽出し,それらの各々の行候補に対して信頼度を推定し,推定した行信頼度に基づいて確度の高い行の集合を抽出する。その結果をもとに確度の高い行の集合の文字成分の配置を用いて傾きを推定する。レイアウト解析部5は,文書画像を構成する基礎要素の集合から行方向の確定した行集合を抽出し,行同士の関連付けによる段抽出と段を制約とした行抽出とを相互に実行して行と段を抽出する。 (もっと読む)


【課題】複雑なレイアウトを持つ文書の論理構造を高精度に認識する。
【解決手段】認識情報取得手段3により、外部から入力される文書レイアウトのレイアウト構造が認識され、そのレイアウト構造および文字情報が得られる。また、出力手段4により、得られた文字情報の各文字列に対し、テンプレート格納手段2に格納されたテンプレート毎に、テンプレートに含まれるノード単位で各文字列との一致が、そのノードによって構成される下位テンプレートの整合性を再帰的に検証することにより判断されて文字情報との整合性を備える前記テンプレートが検出され、検出されたテンプレートの各ノード間の位置関係が、得られたレイアウト構造を満たすか否かが判断され、位置関係を満たすテンプレートが、入力された文書レイアウトのテンプレートとして出力され、そのマッチング結果を文書レイアウトに対する論理構造認識結果として出力する。 (もっと読む)


【課題】簡単な構成とユーザ操作でフォーム原稿の記入枠領域における書込み情報を高速かつ高精度に読み取って認識処理し、得られた書込みデータを属性データに対応付けて出力することができる画像処理装置提供することを目的とする。
【解決手段】未記入のフォーム原稿を読み取って生成した項目属性データとその項目に隣接する記入枠領域情報(座標データ)、およびその記入枠領域がその項目の記入枠であることを表す対応情報をフォーム別に記憶管理する記憶管理24と、画像読取部21で読み取られた記入済みフォーム原稿画像の記入枠領域を前記記入枠領域情報に基づいて抽出するデータ抽出部25と、抽出したデータを認識処理して書込みデータを生成する認識処理部26と、記憶管理部24に記憶管理されている属性データおよび対応情報に基づいて書込みデータを属性データに対応付けて出力する出力部27を備えている。 (もっと読む)


【課題】帳票文書画像などから自動抽出された罫線やセルを容易に修正できるようにする。
【解決手段】本表データ処理方法は、複数のセルを含む表の画像から複数の候補セルを生成し、当該候補セルの特定の組み合わせを抽出して初期的な表を出力するステップと、初期的な表においてユーザから当該初期的な表に含まれる特定の候補セルの指定を誤りセルの指定として受け付けるステップと、指定された上記誤りセルの少なくとも一部を置換可能な候補セルを上記候補セルの特定の組み合わせ以外から選択して候補集合を生成し、当該候補集合のデータを記憶装置に格納する候補集合生成ステップと、記憶装置に格納された候補集合をユーザに提示して、候補集合に含まれるいずれかの候補セルの選択を促す提示ステップとを含む。このようにユーザの手間を削減できれば業務効率が改善する。 (もっと読む)


【課題】論理要素間の整合性のとれた電子帳票の自動認識を高精度におこなうこと。
【解決手段】帳票処理装置1300では、あらかじめ帳票200からレイアウト情報500と文字情報600とを抽出しておく。単語候補抽出部1301は、文字情報600から単語候補を抽出する機能を有する。単語出現数値化部1302は、単語候補の各要素から出現する割合(出現確率)を算出する機能を有する。単語関係数値化部1303は、各単語候補間の関係が成り立つ割合(遷移確率)を与える機能を有する。単語評価部1304は、各単語候補がそれぞれの論理要素から出現する割合(評価値、具体的には事後確率)を算出する機能を有する。単語決定部1305は、評価値に基づいて、要素およびその単語候補を、帳票200における要素およびその文字列に決定する機能を有する。 (もっと読む)


【課題】 これまでの帳票処理では、帳票認識を用いて事前に登録された帳票だけが読み取り可能であるため、登録されていない帳票は、たとえ読み取る情報が帳票に記載されていても自動的に抽出することができなかった。また、帳票上の文字を単に読み取っても、帳票毎に決められた処理に渡す情報を自動的に抽出することができなかった。
【解決手段】 帳票のレイアウト情報を抽出し、あらかじめ登録された複数の帳票パタンから同一のレイアウトを持つパタンを特定し、あらかじめ帳票パタン毎に設定されたテンプレートを用いて帳票内の記載内容を読み取る第1の帳票読み取り手段と、帳票内の文字を読み取り、読み取った単語等を用いて帳票の種類を特定するとともに、帳票の種類に応じてあらかじめ定めた記載内容を読み取る第2の帳票読み取り手段を有する。 (もっと読む)


【課題】類似しているが書式が異なる帳票を認識する場合、帳票に記載されている項目名を精度良く認識する帳票認識装置を提供する。
【解決手段】入力された帳票の画像情報を認識する帳票認識装置において、帳票認識装置は、帳票を認識する帳票認識処理を実行し、帳票認識処理によって認識されない項目名があるか否かを判定し、認識されない項目名があると判定された場合、認識されなかった項目名に対応するデータ枠を再度検出し、検出されたデータ枠の文字列を認識する。 (もっと読む)


【課題】 帳票の画像データから、帳票の種別を識別し、さらに帳票の中の罫線で囲まれた記載枠内に記載された個人情報を保護できるようにする。
【解決手段】 帳票の画像データを画像処理して、罫線を検索する。基準線41,42,43,44を検出して基準枠20Aが存在していることを認識できた時点で、画像データが帳票Aに関するものであると類推できる。さらに、基準枠20Aを基準として、枠50,55を検出し、さらに、記載枠21,22,23,・・・が正規の位置にあるかを検索する。各記載枠が存在していることを検出できた後に、各記載枠の画像データを部分的に切り出し、その内容をテキストデータとし、暗号化されたファイル名を付して保存する。 (もっと読む)


1 - 20 / 62