説明

Fターム[5B064AB02]の内容

文字認識 (8,173) | 認識対象文字 (1,599) | 表記方法 (939) | 活字文字 (375)

Fターム[5B064AB02]に分類される特許

201 - 220 / 375


【課題】 印刷データをラスタライズしたラスタ画像の文字領域又は非文字領域にそれぞれ含まれる文字列を抽出する。
【解決手段】 印刷データから文字列を抽出する方法において、その印刷データをラスタライズし、ラスタ画像を得る。そして、ラスタ画像を文字領域と非文字領域とに分割し、文字領域のラスタ画像と、当該文字領域とほぼ同じ位置に描画される前記印刷データから抽出した文字データとに基づいて、メタデータに用いる文字データを決定する。 (もっと読む)


【課題】住所読み取り性能を向上でき、内蔵の住所知識辞書に登録されていない住所を読み取ることが可能な住所認識方法及び装置を提供する。
【解決手段】画像入力手段101で読み取られた住所情報が住所知識辞書203に登録されていない時に読み取られた住所情報のうち一部の住所情報を検索キーにしてネットワーク上で検索する検索サーバー401を具備する。そして検索された住所情報を読み取られた住所情報と照合し、検索された住所情報のうち画像入力手段101で読み取られた住所情報と一致する住所情報を読み取られた住所情報と認識する。 (もっと読む)


【課題】郵便物に記載された住所情報から読み取った住所情報を検証して、信頼度の高い住所DBを構築する装置及びその方法を提供する。
【解決手段】本発明は、住所情報が含まれた住所映像を利用して住所DBを構築する方法において、住所映像から住所を読み取る住所読取り部、住所読取り部で読み取った住所である読取り住所と、読取り住所の累積回数を算出した読取り住所の累積値とを貯蔵する読取り結果貯蔵部、実在する住所の有効住所が含まれた有効住所DBを貯蔵する有効住所貯蔵部、及び読取りの結果貯蔵部からロードした読取り住所の累積値が事前に設定された臨界値以上であるかどうかによって読取り住所を有効住所貯蔵部に貯蔵する有効住所抽出部を含む。本発明によると、郵便物に記載された住所情報から読み取った住所情報を検証して、住所DBを構築することによって、住所DBの信頼度と完成度を向上させる効果がある。 (もっと読む)


【課題】文書画像からテキスト情報に変換するにあたり、簡易かつ高速に変換処理を実行することが可能な文書処理装置を提供する。
【解決手段】文書画像から文字列画像の特徴量を抽出する。そして、その抽出した文字列画像の特徴量と、単語辞書に含まれる見出し語に対応する文字列画像の特徴量と、を比較し、両者の特徴量が所定の条件を満足した文書画像の文字列画像をテキスト情報として記録する。これにより、単語辞書に含まれる見出し語に対応する文字列画像の特徴量を用いて、文書画像からテキスト情報に変換することになる。 (もっと読む)


【課題】一時停止義務のある停止線のみを抽出して認識することが可能で、かつ、その認識精度を高めることが可能な画像認識装置を提供する。
【解決手段】自車両の現在位置を表す自車位置情報を取得する自車位置情報取得手段と、自車両の周辺の画像情報を取得する画像情報取得手段と、道路の路面に設けられた停止線と、停止線に隣接して設けられた所定の文字列との組み合せを対象地物とし、前記画像情報に含まれる前記対象地物の画像認識処理を行う画像認識手段と、前記対象地物の画像認識に成功した場合に、自車位置情報及び当該対象地物の画像認識結果に基づいて、一時停止義務がある地点を表す停止義務地点情報を生成する地点情報生成手段と、を備える。 (もっと読む)


【課題】特定文字列を含む画像領域を精度よく効率的に検出する。
【解決手段】矩形候補が検出できた場合、ステップS203において矩形内のOCR処理を試みる。ステップS204において、得られたOCR結果を用い、知識処理を行う。この知識処理とは、認識対象に「岩手」という単語があり知識辞書(文字認識辞書)に登録されている場合に、その単語の認識結果を実現するよう修正処理を行う処理である。ステップS205において、文字認識辞書を利用したステップS204の知識処理の結果がどのようになったかを判定する。知識処理が成功し、修正せずとも陸運支局名であった、もしくは陸運支局名に修正することが可能であった場合、その矩形は求める画像矩形であったと判定する。そして、ステップS206において、ステップS204の知識処理の結果を反映する等の処理を行い、検出処理を終了する。 (もっと読む)


言語の語彙の単語がツリーの葉のところに位置する言語モデル先読みツリーの各ノードにおける先読み確率を計算するシステムであって、第1の低次言語モデルを使用して語彙の単語それぞれに言語モデル確率を割り当てる手段と、第1の言語モデルを使用してツリーのすべてのノードの言語先読み確率を計算する手段と、語彙の1つまたは複数の単語の言語モデル確率を、より高次の言語モデルを使用して計算することができるかどうか判定し、単語をより高次の言語モデルを用いて更新する手段と、言語モデルが更新されている単語による影響を受けるノードにおいてのみ先読み確率を更新する手段とを備えるシステム。
(もっと読む)


【課題】知識処理に用いる住所辞書を証明書の作成時または発行時のものに自動的に対応させることができ、住所情報の文字認識精度を向上させることができる、証明書読取認識装置を提供することを課題とする。
【解決手段】本発明は、画像読取装置に接続され、記憶部と制御部を少なくとも備え、住所情報を記憶する住所辞書ファイルを世代毎に蓄積し、住所辞書ファイルの世代情報とファイル名を対応付けて記憶し、画像読取装置を制御して、証明書の画像を読取り、読取られた証明書の画像データに基づいて、証明書に記載された少なくとも日付情報と、住所情報候補としての上記住所情報と、を文字認識し、認識された日付情報と記憶された世代情報とを比較して、当該日付情報に対応する世代の住所辞書ファイルのファイル名を取得し、ファイル名の住所辞書ファイルを住所知識として住所情報候補を照会し、証明書の住所情報の知識処理を行う。 (もっと読む)


郵便小包(P)を処理する方法において、クライアント識別(CAI)コードが、小包の発送人によって小包に割り当てられ、小包が郵便仕分けシステム(T)を通過しているときに、郵便局職員(OP)によって用いられる。これらのクライアント識別コードは、小包が郵便仕分けシステムを通る最初のときより前に、第1のディジタルインプリント(V_Id)または画像署名に対応して、仕分けシステムにおけるメモリ(11)に記録される。取り扱い中の小包が第1の仕分け通過に沿って通過している間に、郵便住所ブロックを含む小包の画像が形成され、取り扱い中のインプリントのほか、仕分け処理における位置に関する情報が、小包の画像から導出される。この位置情報が関連付けられる取り扱い中のクライアント識別コードを読み出すために、この取り扱い中のインプリントとメモリに記録された第1のインプリントとの間の一致のための探索が行われる。
(もっと読む)


【課題】低解像度の文書画像に対して、その一部からであっても手書き文字か活字文字かの判別を精度良く行う。
【解決手段】文書画像処理装置10は、文書画像の中から文字を含む文章領域を特定し、特定された文章領域に含まれる文字を構成する各画素のうち、直線の一部である直線画素成分と曲線の一部である曲線画素成分との比率を算出し、算出された比率に基づいて、文章領域に含まれる文字が手書き文字又は活字文字のいずれかであるかを判定する。 (もっと読む)


【課題】文字認識装置及びその方法を提供する。
【解決手段】文字認識装置は、トレーニング文字画像あるいは認識すべき文字画像から文字画像の特徴ベクトルを抽出する特徴ベクトル抽出部と、特徴ベクトル抽出部により出力されたトレーニング文字画像の特徴ベクトルからなるトレーニングサンプルセットに基づいて複数のスパースサポートベクターマシン分類器を学習して得るトレーニング部と、トレーニング部によるトレーニング結果を記憶する記憶部と、スパースサポートベクターマシン分類器ごとに特徴ベクトル抽出部により出力された認識する文字画像の特徴ベクトルに対する出力を計算し、認識すべき文字画像と対応する文字を決定する認識部と、を有する。トレーニング部は、スパースサポートベクターマシン分類器の目標関数に0-ノルム正則化項を導入することによりスパースサポートベクターマシン分類器の決定関数におけるサポートベクトルの数を減少させる。 (もっと読む)


【課題】既に実行したOCR変換処理を、必要以上に無駄にすることなく、かつOCR変換のための時間を細分化管理することで、作業効率の低下を防止する。
【解決手段】サーチャブルPDF50を作成するためのOCR変換の際、当該元となる原稿のイメージ領域を複数の区画部Anに分類し、それぞれの区画部An毎にOCR変換時間を設定し、この設定した時間を経過しても当該区画部AnのOCR変換が見完了の場合は、その区画部AnのみOCR変換を断念するようにした。これにより、冗長されるOCR変換にある程度歯止めをかけて、処理時間の短縮化を図ると共に、他の区画部AnのOCR変換が完了していれば、その区画部AnのサーチャブルPDFとしての能力を維持することができる。 (もっと読む)


【課題】任意形状のパターンが重複した文字画像を高精度に文字認識すること。
【解決手段】ハッシュテーブル登録部22が各文字カテゴリの局所的な領域である部分入力画像の特徴を示すハッシュテーブル16を作成し、認識処理部21は、入力画像をメッシュ分割して部分入力画像に分割し、各部分入力画像について特徴を算出し、各部分入力画像と特徴が類似する部分文字画像をハッシュテーブルから検索し、部分入力画像の位置関係と部分文字画像の位置関係とを比較し、その整合性を評価して入力画像のどの領域にどの文字が存在するかを認識する。 (もっと読む)


【課題】低品質文字の識別方法及び装置を提供する。
【解決手段】低品質文字の識別方法は、ストロークエッジ特徴と画像パターン特徴とに基づいて、識別対象の文字のそれぞれを識別することにより、ストロークエッジ特徴と画像パターン特徴とに基づく二つの候補文字コードグループを取得するステップS1と、二つの候補文字コードグループ内の候補文字コードをマージすることにより、マージ候補文字コードグループを決定するステップS2と、マージ候補文字コードグループに対し、ストロークエッジ特徴と画像パターン特徴とのそれぞれに基づいて演算を行うことにより、2種類の識別距離を取得するステップS3と、2種類の識別距離から最適の候補文字コードを決定するステップS4と、を備える。本発明によれば、低品質文字画像の識別の正確さを大幅に向上させることができる。 (もっと読む)


【課題】入力画像の認識にとって重要な部分に対して着目を強めた特徴抽出を行うことで、類似文字の認識精度の向上を図る。
【解決手段】入力されたパターン画像に対して、画像の領域にて認識対象文字グループに対応して決められている配置の複数の部分領域それぞれの特徴量を計算する部分領域特徴量計算部124と、部分領域特徴量計算部により計算された複数の部分領域それぞれの特徴量から前記入力されたパターンの特徴ベクトルを生成する特徴ベクトル生成部126と、特徴ベクトル生成部より出力された特徴ベクトルを用いて、入力されたパターンの識別を行うパターン識別部122と、1または複数の前記部分領域を変更しつつその都度学習パターンの認識を行って得られた結果を評価することによって、部分領域特徴量計算部に設定される複数の部分領域を選定する学習部128とを具備する。 (もっと読む)


【課題】
フーリエによる画像の識別方式や画像の画素の位置を単一の数値データー化して識別する方式などでは、識別判断が困難な場合が多く、これの問題を解決するには、もっと柔軟性にとんだ方式の画像を面でとらえる方式が必要であるが、画素単位でサーチしたのでは時間がかかり低速である。処理速度が速くて正確に画像を認識できるコンピューターソフトウェアを開発する事
【解決手段】
まず、従来からあるOCR技術で照合し数個の候補を選び、次に、文字画像をbyte単位で配列に読み込み、黒もしくは、白の個数を算出する事で単一の数値化する方式を開発し、この計算式を使用して、辞書の文字画像の面積を算出し、辞書の文字画像とテキスト文字に変換する文字画像を重ね合わせて一つの文字画像を作成して面積を算出し、両者の面積を照合し、候補を一つに絞り込むというコンピューターソフトウェアを開発しました (もっと読む)


【課題】 文字の特徴抽出方法を改良して、より検索精度が高くなるような字形特徴辞書作成装置およびこれを備えた画像文書処理装置を提供する。
【解決手段】 画像文書中の文字数がMである文字列の画像を切り出し、これを1文字ごとに分割して各文字画像の画像特徴を抽出し、その画像特徴に基づき、文字画像の画像特徴を1文字単位で格納している字形特徴辞書より、適合度が高い順にN個(N>1の整数)の文字画像を候補文字として選択し、切り出した文字列の文字数M×N次の第1インデックス行列を作成する。この第1インデックス行列の第1列を構成する複数の候補文字からなる候補文字列に対して、予め定める言語モデルによる語彙解析を適用することにより、候補文字列を意味を成す文字列に調整した第2インデックス行列を作成し、検索に利用する。 (もっと読む)


【課題】 複数の文字が並ぶ文字列領域から、各文字の画像を高精度で抽出することができる文字画像抽出方法および文字画像抽出装置を提供する。
【解決手段】 抽出ステップでは、抽出部401によって、複数の文字が並ぶ文字列領域について、互いに連結している複数の画素で構成される連結成分を求め、その中から連結成分に外接する外接図形によって区画される区画要素を抽出する。第1改変ステップでは、第1改変部402によって、前記抽出された区画要素のうちで、少なくとも一部分が互いに重なり合う区画要素を統合させて新たな区画要素とする。第1選択ステップでは、第1選択部403によって、基準の大きさを予め定め、第1改変ステップにて改変された区画要素のうちで、前記基準の大きさよりも大きい区画要素を選択する。 (もっと読む)


【課題】全文検索の文書検索装置で、登録時に検索索引を作成、検索時は文書データ走査をせず索引から検索するNグラム方式は、文字認識誤りを許容する検索の場合、候補文字の組合せ数索引が必要でN値で増加で、索引サイズが増大する。また、キーワードの照合では誤認識候補文字の組合せとが成立し、キーワードとマッチしない箇所が抽出される。
【解決手段】文書画像の文字認識をし、その結果の第1位の認識候補文字で構成する第1の検索索引と、第2位以降の認識候補文字で構成する第2の検索索引を作成する索引作成手段と、検索キーワードが入力されるキーワード入力手段と、キーワードが構成される文字列と第1の検索索引および第2の検索索引を照合して照合度合いのスコアを算出する検索スコア算出手段と、検索スコア算出手段から得られた検索スコアをもとに検索結果を出力する出力手段を備える。 (もっと読む)


【課題】
スキャナーを用いて紙に印字されている文字を読み取り、コンピューターで一般的に使用されているテキスト文字に変換する際、多種多様なフォントがある為に従来の画素単位でのセンシングでは、時間がかかり過ぎるものになってしまうので高速処理を行わせるコンピューターソフトウェアを作成する事
【解決手段】
文字画像ファイルをそのままの状態でバイナリーファイルとして1byte単位で配列に読み込ませて、その配列要素の中から文字に使用されている黒か、バックに使用されている白か、どちらか一方の色コードを探し出し、その配列の添え字を画像の位置情報とみなし、その添字の総和を求めて一個の数値にし、この数値をもとに辞書との照合を行わせる事で、文字画像ファイルからテキスト文字に変換するコンピューターソフトウェアを開発する (もっと読む)


201 - 220 / 375