説明

Fターム[5B064EA18]の内容

文字認識 (8,173) | 後処理 (1,120) | 修正、確定 (961) | 文字列の解析によるもの (315)

Fターム[5B064EA18]の下位に属するFターム

単語 (169)
構文、文法 (30)

Fターム[5B064EA18]に分類される特許

101 - 116 / 116


【課題】 文書原本になされた追記によって指定された被追記部分を抽出し、これを各種の利用目的に備えて保存しておくことが可能な技術を提供することにある。
【解決手段】 制御部11は、入力部13に入力された画像データが表す追記文書から追記画像を抽出し、その追記画像と所定の位置関係を有する画像領域を特定する。さらに、制御部11は、特定された画像領域に配置された被追記画像データを抽出して、これらを追記画像の色別に不揮発性記憶部12に記憶する。このように、制御部11が追記文書の画像データから被追記画像画像データを分離して記憶することによって、例えば被追記画像のみを対象とした検索処理や表示処理を行うことが可能となる。また、被追記画像データを追記画像の色別に記憶するので、その色別に検索処理や表示処理を行うことも実現できる。 (もっと読む)


【課題】画像に含まれる文字を処理する精度を向上する。
【解決手段】この画像処理装置は、文書から読み取った画像データを入力する画像入力部1と、画像入力部1より入力された画像データを記憶する画像メモリ部2と、画像メモリ部2の画像データから文字列を認識するための文字列領域を検出するレイアウト解析部3と、文字認識用の辞書7と、レイアウト解析部3により検出された文字列領域に対して、辞書7を利用して文字認識を行うことで文字コードを得る文字認識部4と、文字コードに含まれる微小要素の情報が登録された微小要素データベース5と、文字認識結果の文字コードをキーにして微小要素データベース5を参照して文字コードに微小要素が含まれるか否かを判定し、微小要素が含まれる文字コードに対して微小要素を除外して画像メモリ部2の画像データからノイズ成分を除去する画像処理部6とを備える。 (もっと読む)


【課題】 電子化対象の文書に記載されている数値表現の表す数量のカテゴリを詳細に特定することを可能にする。
【解決手段】 1または複数の名詞と、単位が付与された数値である数量のカテゴリを表すカテゴリデータと、を対応付けて複数記憶している文書処理装置に、入力された文書データを解析させ、単位が付与された数値を表す文字列である数値表現を含む文を表す文データを抽出させる。上記文書処理装置は、その文データを解析してその文データに含まれている名詞の集合を生成する一方、その集合との類似の度合いが最も高い上記1または複数の名詞に対応付けて記憶しているカテゴリデータの表すカテゴリを、前記抽出手段によって抽出された文データの表す文に含まれている数値表現の表す数量のカテゴリとして特定する。 (もっと読む)


【課題】 予め用意された文書形式でなくても、文書内容の属性及びそれに対応する属性内容の抽出を容易に行うことができる文書属性取得装置、文書属性取得方法および文書属性取得プログラムを提供する。
【解決手段】 表領域推定部201が、所定の形式で配列された属性、およびその属性内容を含む文書データから属性および属性内容を含む領域を表領域と推定すると、文字認識部203は、表領域中の文字を認識し、属性検索部205は、文字認識部203による認識結果に基づいて属性候補名辞書204を参照して属性を認識し、属性抽出部206は、認識された属性に対応する位置の文字列を属性内容として属性に対応付けて抽出する。 (もっと読む)


【課題】 活字と手書き文字が混在した文書の電子化を可能とした文字認識装置、文字認識方法および文字認識プログラムを提供する。
【解決手段】 画像入力部11によって、活字と手書き文字が混在した原稿の画像が生成され、この画像は活字部/手書き部分離処理部12によって、前記活字による活字部と前記手書き文字による手書き部とに分離される。それぞれに対し、活字部OCR処理部13と手書き部OCR処理部18によりOCR処理が行われ、活字OCRの結果は登録辞書17に登録される。手書き部OCR処理部18による手書き部の認識候補が複数で、その近傍の活字OCR結果に一致する活字があったとき、この活字を利用して手書き部のOCR処理を行い、この結果をOCR結果合成処理部21で活字OCRに合成する。 (もっと読む)


【課題】 紙文書を電子化して保存する際に、その電子化の結果が正しいか否かの確認および修正の手間を軽減させることを可能にする。
【解決手段】 文書の各ページの画像に対応するページ画像データが入力される入力手段と、前記入力手段へ入力されたページ画像データを解析し、前記文書に記載されている項目の記載内容を表す記載内容データを項目毎に抽出する抽出手段と、前記文書に記載される項目の各々についてその記載に用いられる文字の種別または記載される値を表すデータであるルールセットに基づいて、前記抽出手段により抽出された記載内容データの表す記載内容が正しいか否かを判定する判定手段と、前記判定手段により記載内容が正しくないと判定された項目についての記載内容データを、前記ルールセットに基づいて修正する修正手段とを有する文書処理装置を提供する。 (もっと読む)


【課題】 レセプト画像の文字認識に優れた光学式文字読取装置を提供する。
【解決手段】 本発明の光学式文字読取装置12は、レセプトのイメージデータの画像情報に対して文字データを割り当てる文字割当部80と、文字割当部により割り当てられた文字データの連続性を検出する連続性検出部82と、連続性検出部により、同一または外見的に類似する文字データが所定数以上連続して所定方向に並ぶ場合に、連続した文字データの一群を線として判断する書式解析部84を備える。 (もっと読む)


【課題】 電子化対象の文書に長さの短い文字列が多数記載されている場合に、その文書が定型文書であるか否かに拘わらず、その表題を正確に特定する。
【解決手段】 複数の文書の表題の各々に含まれている単語についてその出現頻度に応じた重みを表す重みデータが登録されている単語テーブルを文書処理装置に記憶させておき、電子化対象の文書に対応する文書データが入力された場合に、その文書データを解析してその文書に記載されている文字列とその記載位置または文字列長を表す属性データとを抽出させる。そして、抽出された文字列毎に、その文字列に含まれている単語および上記単語テーブルの登録内容に基づいて集計される第1の重みと、その文字列の属性データに基づいて算出される第2の重みとに基づいて、その文書の表題に対応する文字列を特定させる。 (もっと読む)


【課題】本発明は、空間関係を利用して、テキストおよび/またはグラフィクスを認識する体系的手段を提供する。
【解決手段】これにより、スケッチされた形状をその象徴的意味で補強し、スマートエディティング、美化、視覚的言語の対話的シミュレーションを含む多数の機能を可能にする。空間認識方法は、グループ化と認識が同時に行われたスケッチされた形状から、考えうるグループ化の大きな空間について検索に基づく最適化を行う。最適化は、ストロークの集合にクラスラベルを割り当てる分類器を利用する。全体的なグループ化の最適化は、分類器が縮尺および回転不変であれば、最適化されるように分類器の特性を仮定する。本発明の例では、アダブーストのバリアントを利用して記号の認識/分類を容易にしている。本発明の別の例では、ダイナミックプログラミングおよび/またはA−スター検索を利用して、最適化を実行する。 (もっと読む)


【課題】 文書に記された文字をより高精度に認識するための新たな仕組みを提供する。
【解決手段】分野別に分類された用語又は文字をそれぞれ記憶した複数の分野別用語辞書データベース11a,11b,11cを用意しておき、文書に記された内容が属する分野を判定する。そして、複数の分野別用語辞書データベース11a,11b,11cの中から、判定された分野に関連する分野別用語辞書データベースを選択し、その分野別用語辞書データベースに記憶されている用語又は文字を候補として文字認識を行う。このようにすれば、文書の内容が属する分野を判定したうえで、その分野に応じた適切な分野別用語辞書データベースを選択し、それを利用して文字認識を行うので、認識精度の向上を期待することができる。 (もっと読む)


【課題】漢字(アジア表意文字)の手書き認識入力は、漢字の複雑さと行書体を避けて書くため、手書き認識の入力スピードは低下する。その入力を迅速にしかも容易にできるシステムが必要である。
【解決手段】表意文字を入力し、インクストロークとして西洋言語手書き文字認識し、生ピンインラティスより有効な文字列を生成し、単語ラティスを得る。得られた単語ラティスを言語モデルデコーダに送り、最良の結果を漢字に変換する。 (もっと読む)


【課題】 定型または非定型の紙文書に手書きされた紙文書に対して所定の処理を実行させると共に、紙IDを読み取られずに取得された筆記情報を有効に活用することを目的とする。
【解決手段】 紙文書への筆記情報を検出する座標入力手段74と、紙文書上の該紙文書を識別する紙IDを認識して読み取る紙ID情報読み取り手段75と、読み取られた紙IDを保持する記憶手段71と、保持された紙IDを他の装置に送信する送信手段72と、を有する筆記情報入力装置60において、新規の紙IDを発行する紙ID発行手段400を更に有することによって上記課題を解決する。 (もっと読む)


【課題】 本発明の課題は、手書き又は活字された住所を光学的に読み取って文字認識をする際に、建物に関する情報を高い精度で認識可能とすることを目的とする。
【解決手段】 本発明の課題は、住所を示す住所画像を文字認識することによって得られた建物に関する方書き部の認識候補文字から、所定文字種別による文字列のパターンを生成して所定品詞を対応させて追加形態素解析辞書に追加し、前記方書き部の認識候補文字によって構成される複数の文字列を、前記方書き部の基本形態素解析辞書と前記追加形態素解析辞書とを用いて品詞間接続規則に従って形態素解析を実行して得られる文字列のうち、前記追加形態素解析辞書に優先して前記基本形態素解析辞書に予め登録されている単語を含む文字列から最も確からしい文字列によって前記方書き部を修正することによって達成される。 (もっと読む)


本発明は、フォームベースのデータ入力システムに入力されるデータを解釈する方法であって、特定のフォームフィールドに入力されたデータを、その情報内容を決定することができるように解読するステップであって、情報内容が一貫性のある機械可読形式である、ステップ、を含んでおり、データの解読が、情報内容の1つの以上の可能な値を決定するステップを含んでおり、事前定義されている特定の可能な結果に、正しいことの相対的に高い確率が与えられており、事前定義されている可能な結果が、特定のフォームフィールドのコンテキストに依存する、方法、を提供する。
(もっと読む)


移動可能なカメラで撮影した情景画像中に含まれうる単語を、単語辞書もしくは地図データベースを用いて効率的に抽出できるようにする。
位置情報取得手段101は、装置の現在位置を測位して位置情報を取得する。方位情報取得手段102は、装置の向きを検出して方位情報を取得する。文字列認識手段104は、現在位置情報と方位情報とにもとづいて、情景画像の撮影範囲を特定する。文字列認識手段104は、撮影範囲の位置に対応づけられている店舗名、建築物名および地名などの情報を、地図データベース103から抽出する。そして、文字列認識手段104は、抽出した店舗名、建築物名および地名などの単語知識を用いて文字認識を行う。 (もっと読む)


【課題】 煩雑な番号入力の作業を回避して原稿画像を送信することができる画像送信装置及びその制御方法並びに記憶媒体を提供する。
【解決手段】 原稿1において、送信先の電話番号は領域G1内に、送信すべき内容は領域G2にそれぞれ記載しておく。原稿1がセットされると、領域G1の画像を読み取り、その画像から数字を認識してそれを送信先の電話番号として一旦記憶し、表示部4に表示して、ユーザの確認を待つ。そして、訂正ボタン8が押下されたら訂正操作を実行する一方、送信許可を示す送信ボタン6の押下がなされた場合は、所望によりその番号を登録した上で、領域G2の画像の読み取り及びその画像の送信処理を行う。 (もっと読む)


101 - 116 / 116