説明

Fターム[5B029CC30]の内容

文字入力 (4,843) | 機構制御 (1,689) | 読取り領域制御 (945) | 領域の接合 (21)

Fターム[5B029CC30]に分類される特許

1 - 20 / 21


【課題】複雑なレイアウトの文書画像の行分割を正確に実現すると共に、ノイズを含む文書画像にも適用する。
【解決手段】テキストブロックを分割して少なくとも1つの画素領域を含む第1の画素領域を取得する第1の分割ステップと、第1の画素領域の各画素領域中の各々の画素行における連続白画素シーケンス間の共通重複部分を空白領域として検出し、第1の画素領域の画素領域から空白領域を除去して第2の画素領域を取得する空白領域除去ステップと、第2の画素領域を利用してテキスト行分割を実行するテキスト行分割ステップとを備える。 (もっと読む)


【課題】本発明は、画像におけるテキスト領域を位置決めする方法及び装置を開示する。
【解決手段】本発明による画像におけるテキスト領域の位置決め方法は、入力画像における各画素の周りに存在可能なテキストの大きさを推定するステップと、上記テキストの大きさ及び領域差異度に基づいて、上記入力画像から候補筆画領域を抽出するステップと、上記候補筆画領域から真の筆画領域を特定するステップと、前記真の筆画領域をマージしてテキスト領域を形成するステップとを含む。 (もっと読む)


【課題】帳票のレイアウトを自動認識する帳票認識装置において、表構造を認識し、最小矩形の属性を自動決定する。
【解決手段】帳票イメージから抽出した最小矩形の行方向の接続関係から論理行に分類し、連続して同じ行構造を持つ論理行を1つのブロックにまとめ、表の上下に接続するブロック間で、同じ列構造を持つブロックを論理列の単位でまとる。この表構造から、属する行数が最大であるブロックをボデイ部分に、そのブロックの上及び下を、ヘッダ部、フッタ部に決定し、ヘッダ部を見出し部分とし、論理列単位で文字認識して、見出し部分の属性を決定し、見出し部分の属性からボデイ部分の最小矩形の属性を決定する。 (もっと読む)


本発明による実施形態によると、画像及び映像からテキストを認識する際の最初のアクションは、画像及び映像内でテキストの位置を正確に位置決めすることである。その後で、位置決めされかつ場合によっては低い解像度のテキストを抽出、強調、及び2値化することができる。最終的に、既存のOCR技術を認識のために2値化されたテキストに適用することができる。他の実施形態は、本要約において説明した特徴から逸脱する可能性があるので、本要約を限定的なものと見なすべきではない。 (もっと読む)


【課題】媒体上に記入された手書き文字の電子化にあたり、その手書き文字の大きさに因らずに、当該手書き文字についての読み易さや認識精度等を向上させる。
【解決手段】文字記入領域を有した媒体についての画像データを取得する取得手段10と、前記取得手段10が取得した画像データから前記文字記入領域に記入された文字画像データを抽出する抽出手段12と、前記抽出手段12が抽出した文字画像データに基づいて前記文字記入領域に記入された文字サイズを認識する認識手段13と、前記認識手段13が認識した文字サイズを所定サイズに合わせるように前記文字画像データに対する拡大または縮小を行う正規化手段14と、を備えて画像処理装置2を構成する。 (もっと読む)


【課題】文字行の切り出し等を行うことをしないでマッチング処理を行うことができ、統合処理を行うことによってマッチング処理の回数を減少させることができ、計算量をより減少させることができるようにした画像処理システムを提供する。
【解決手段】画像処理システムの抽出手段は、画像から構成要素を抽出し、分類手段は、前記抽出手段によって抽出された構成要素を分類し、統合手段は、前記分類手段によって分類された構成要素を該構成要素間の重なりに基づいて統合し、該統合した構成要素を前記分類手段によって分類させる統合処理を行い、マッチング手段は、前記統合手段によって統合された構成要素に対してマッチング処理を行う。 (もっと読む)


【課題】 罫線を有する帳票のイメージデータから罫線パタンを抽出し、抽出した罫線パタンに基づいて帳票形式を識別する帳票処理装置において、帳票の全体が含まれないイメージデータであっても帳票形式の識別性能を向上し得る帳票処理装置を提供する。
【解決手段】
帳票の外形寸法によって影響を受ける特徴情報を生成する生成部を備える帳票処理装置において、帳票イメージデータから帳票全体のイメージが取得されているか否かを判定するはみ出し判定部と、帳票全体のイメージが取得されていないと判定すると、帳票イメージデータに所定寸法の補完イメージデータを付加して補完画像データを生成する画像補完処理部とを含み、該補完画像データを生成部に供給する。 (もっと読む)


【課題】 文書画像に設定される画像領域の修正に伴う読み順の変更作業を簡略化し、画像領域・読み順設定の利用性を高める。
【解決手段】 スキャナ入力された文書画像に対し、例えば、OCRの前処理として、処理対象の領域を所定の識別条件に従い分け、画像領域を設定、各領域に読み順を設定する。ユーザが設定領域の修正を指示すると、装置のソフトウェア処理で領域の修正に伴う読み順の順番を振り直す。領域を統合する修正をする場合、新規作成領域と重なる修正前の複数の領域を探索し(S303,304)、検出される複数の領域の重なり面積の最も大きい領域に付与されていた読み順を新規統合領域の読み順として引き継ぐ。従来読み順の修正に手間の掛かるユーザ操作を必要としてが、本願発明の自動処理により、解消される。 (もっと読む)


【課題】プレ印刷文字を含む帳票上に記入されたマークを、プレ印刷文字の情報を予め登録することなしに認識可能なマーク認識装置を提供する。
【解決手段】マーク認識対象領域の画像の範囲内で、走査ライン毎に画素集合の分布幅を検出する投影情報作成部131と、走査ライン毎の画素集合の分布幅を比較し、分布幅が所定の閾値以上となる走査ラインで構成される文字範囲を検出する文字範囲検出部133と、分布幅が所定の閾値未満となる走査ラインで構成されるマーク範囲であって、文字範囲の両側の範囲で、画素集合の分布範囲を近似する矩形領域を各々に検出するマーク範囲検出部134と、文字範囲の両側の範囲で各々に検出された矩形領域を、文字範囲を介して結合し、認識対象領域の画像上において結合された矩形領域の座標を特定するマーク範囲結合部135と、を含むマーク認識装置が提供される。 (もっと読む)


【課題】帳票文書にずれて印刷された情報を適切な位置に関連付ける。
【解決手段】罫線から成る表と該表に関連した情報が記載された文書を画像として読み取る画像入力手段と画像から表の罫線を特定する罫線特定手段と罫線特定手段によって特定された罫線に基づき画像から罫線から成る罫線画像と情報画像とに分離する画像分離手段と画像分離手段によって分離された罫線画像から罫線から成る表構造を抽出する表構造抽出手段と画像分離手段によって分離された情報画像から情報の位置構造を抽出する情報構造抽出手段と前記表構造抽出手段によって抽出された表構造に前記情報構造抽出手段によって抽出された情報の位置構造を対応付ける構造対応付け手段とを有することで、枠を拡大した領域に交差した文字列をも扱うことができ、印刷ずれの影響を回避し、自動的に帳票文書から情報を正確に読み取ることができる。 (もっと読む)


【課題】文書処理において、文字間距離より行間距離の方が狭い特殊なレイアウトの原稿の場合においても、正しく行方向を判定し、文字領域を作成する。
【解決手段】水平方向と垂直方向の両方で行切り出しを行う。各々の場合において文字領域を作成する。判定対象の空白帯に文字行を挟んで他の空白帯が無いか1つ存在する場合は、判定対象の空白帯を文字領域間のセパレータとする。ただし、判定対象の空白帯に文字行を挟んで一方に他の空白帯が存在し、他方に明確な区切り要素か空白セパレータがある場合は、判定対象の空白帯を文字領域間のセパレータとしない。空白帯の長手方向と文字領域の行方向とが同じで、かつ空白帯が文字領域を貫通している場合には、その文字領域を棄却しない。最終的に一方を選択して文書処理を行う。 (もっと読む)


【課題】仏教経典の電子画像中の文字領域を明確に特定して、経典画像とテキストとの対応付けを効率よく行い得るようにすることにある。
【解決手段】仏教経典の電子画像をその仏教経典のテキストと対応付けするために、前記電子画像中の文字領域を特定するに際し、前記仏教経典の電子画像1を、その仏教経典に書かれた文字が判別可能なように白黒二値画像3とし、前記二値画像3中の前記書かれた文字を包含する矩形領域を文字領域として抽出し、前記抽出した文字領域を、その文字領域の位置と寸法との少なくとも一方で特定して、文字領域情報D2とすることを特徴とする、仏教経典電子画像中の文字領域の特定方法である。 (もっと読む)


【課題】 文書ファイルのフォーマットに依存せず、また、文字が画像に埋め込まれていても自動的に文字列を抽出し、文書ファイルを検索に利用できるようにする。
【解決手段】 文書ファイル読み込み装置101によって読み込まれた文書を文書ファイル表示装置102で自動的に表示する。文書ファイルスクロール装置103で文書の全領域が表示できるように自動的にスクロール表示し、スクロール毎に画面取得装置104にて画面キャプチャする。得られた部分画像を画面合成装置105でページ毎に1つの画像に統合し、レイアウト解析装置106及び文字認識装置107により得られた画像から文字列を抽出し、その結果をテキストファイル保存装置108にて保存する。 (もっと読む)


【課題】精度よくかつ高速に日本語と英語の識別を行うと共に、識別する範囲についても各文字領域毎に、またページ単位毎に両者を識別できる。
【解決手段】入力文書画像101を縮小102した後、黒画素連結成分を抽出103し、それらを統合して文字領域を生成104する。生成した文字領域について、日英判別手段105は、連結成分の長さを基にその成分を分類し、分類結果の集計値を基に日本語領域であるか英語領域であるかを判別する。 (もっと読む)


【課題】 活字と手書き文字が混在した文書における手書き文字の認識率を高めることが可能な文字認識装置、文字認識方法および文字認識プログラムを提供する。
【解決手段】 活字と手書き文字が混在した文書の入力画像が画像入力部11により生成された後、2値化部12で2値化される。2値化データに対し、文字切り出し部15によって1文字単位の切り出しを行い、それぞれの文字に対する異なる複数の特徴量を特徴量算出部16によって算出する。得られた特徴量を用いて、活字手書文字分離部19により活字と手書文字の分離を行うことで、手書き文字の認識率を上げることができる。 (もっと読む)


【課題】未知の照明条件に対し頑健な文字認識の実現。
【解決手段】複数の異なる二値化手段と、それらから得られる文字パタン候補を統合する手段と、文字パタン候補を解析して文字列として認識する手段。 (もっと読む)


【課題】 定型または非定型の紙文書に手書きされた紙文書に対して所定の処理を実行させると共に、紙IDを読み取られずに取得された筆記情報を有効に活用することを目的とする。
【解決手段】 紙文書への筆記情報を検出する座標入力手段74と、紙文書上の該紙文書を識別する紙IDを認識して読み取る紙ID情報読み取り手段75と、読み取られた紙IDを保持する記憶手段71と、保持された紙IDを他の装置に送信する送信手段72と、を有する筆記情報入力装置60において、新規の紙IDを発行する紙ID発行手段400を更に有することによって上記課題を解決する。 (もっと読む)


【課題】 定型または非定型の紙文書に対して所定の処理を実行させるための文書処理システムが得られる。また、紙文書に印刷されたドットの位置をより正確に検出する文書処理システムを提供する。
【解決手段】 紙文書を識別するための紙IDをエンコードした符号化紙IDを含む符号化情報が印刷された領域を複数有し、符号化情報には領域の紙文書における位置を示す座標情報をエンコードした符号化座標情報が含まれた紙文書に対して処理を行う文書処理システムであって、符号化紙IDと符号化座標情報と矩形である領域の枠とをドットを用いて紙文書に印刷する印刷手段と、ドットのぼけの程度を検出するぼけドット検出手段と、ぼけドット検出手段が検出した4隅のドットのぼけの程度のうち、ぼけの程度が最も大きいドットであるぼけドットの近傍のドットで、ぼけの程度が小さいドットの座標と、ぼけドット除くコーナー検出手段で検出されたドットとの座標から、紙文書での筆記位置を検出するためのパラメータを検出するパラメータ検出手段とを有する。 (もっと読む)


【課題】 定型または非定型の紙文書に対して所定の処理を実行させるための文書処理システムを提供する。
【解決手段】 紙を識別するための紙IDをエンコードした符号化紙IDを含む符号化情報が印刷された領域を複数有し、符号化情報には領域の紙における位置を示す座標情報をエンコードした符号化座標情報が含まれた紙に対して処理を行う文書処理システムであって、符号化紙IDと符号化座標情報とを作成するエンコード手段と、紙に対応する電子文書に対して割り当てられる文書IDと紙IDとを関連付ける文書紙ID関連手段と、紙IDを取得し、エンコード手段により作成された符号化紙IDと符号化座標情報を紙に印刷する印刷手段と、紙IDを管理する紙ID管理手段と、符号化紙IDと座標情報とが印刷された紙から、紙IDと座標情報を取得するとともに、紙に筆記された筆記情報を取得する情報取得手段と、情報取得手段により取得された筆記情報に対して行われる処理を示す処理IDと紙IDとを関連付ける処理紙ID関連手段とを有する。 (もっと読む)


【課題】手ぶれによる画像の歪みを解消し、完全なイメージデータを取得することによって、文字認識を確実に実行できるようにするとともに、取込んだイメージデータに対する文字認識を端末あるいは携帯端末以外の装置において実行し、その認識結果をアプリケーション等で文字認識を行ってデータを所望の制御部に入力することを可能とした光学的文字認識装置およびシステムを提供すること。
【解決手段】マウス機能と連動しており、書類上に書かれた関心のある個所のイメージのみを取り込め、文字やコードの認識はアプリケーションの背後で行うことができ、その認識結果はアプリケーション上の予め希望した場所へ直接入力される。スキャナ・モジュールは、マウスや携帯電話に組み込むことができ、インターネットを利用した様々な応用が考えられる。 (もっと読む)


1 - 20 / 21