説明

Fターム[5B064EA18]の内容

文字認識 (8,173) | 後処理 (1,120) | 修正、確定 (961) | 文字列の解析によるもの (315)

Fターム[5B064EA18]の下位に属するFターム

単語 (169)
構文、文法 (30)

Fターム[5B064EA18]に分類される特許

61 - 80 / 116


【課題】対象文字列が、予め定められた種類のどれに相当するものかを少ない処理量で判定することができる文字列判定装置を提供する。
【解決手段】文字列の項目と対応付けられた、特定の形状を示す情報である文字列パターンが文字列情報に含まれているかどうかを検出する文字列パターン検出部22aと、文字列パターン検出部22aによって、文字列パターンが文字列情報内に検出された場合に、当該文字列パターンに対応する文字列の項目を、当該対象文字列の項目とする項目判定部22bとを備えている。 (もっと読む)


【課題】論理要素間の整合性のとれた電子帳票の自動認識を高精度におこなうこと。
【解決手段】帳票処理装置1300では、あらかじめ帳票200からレイアウト情報500と文字情報600とを抽出しておく。単語候補抽出部1301は、文字情報600から単語候補を抽出する機能を有する。単語出現数値化部1302は、単語候補の各要素から出現する割合(出現確率)を算出する機能を有する。単語関係数値化部1303は、各単語候補間の関係が成り立つ割合(遷移確率)を与える機能を有する。単語評価部1304は、各単語候補がそれぞれの論理要素から出現する割合(評価値、具体的には事後確率)を算出する機能を有する。単語決定部1305は、評価値に基づいて、要素およびその単語候補を、帳票200における要素およびその文字列に決定する機能を有する。 (もっと読む)


言語スクリプトの固有の特性を利用(例えば、アラビア言語の結合ルールを条件として)して、2段階のテキスト認識を可能にするシステムおよび方法である。このような2段階のシステムにおいて、1段階では、テキストと関連付けられた言語の結合ルールに基づいてつながった所定の結合文字グループを認識でき、もう1つの段階では、所定の結合文字グループを形成するそれぞれの構成文字に対するそれらの結合文字を分析(および認識)する。さまざまな分類器および人工知能コンポーネントは、各レベルにおいてテキスト認識をさらに容易にできる。
(もっと読む)


【課題】電子ホワイトボードなどの手書き入力装置における入力をより簡易にする技術を提供すること。
【解決手段】手書き文字の入力が可能な入力部10と、前記入力部10の入力を表示する表示部40と、前記入力された手書き文字をストロークデータとして蓄積する蓄積部15と、前記入力部10の新たな入力に対して、前記蓄積部15から特徴に共通点があるストロークデータを検索して、その結果を前記表示部40に候補として提示する検索部20と、提示された候補の1つを選択して、当該選択した候補を表示部40に反映する選択部30と、を有する入力装置であって、前記入力装置の利用状況情報を管理する管理部50をさらに備え、前記蓄積部15は、管理部50から利用状況情報を入力して、ストロークデータと利用状況情報とを関連づけて記録する。 (もっと読む)


【課題】文字列の抽出に失敗してから正しい文字列を得るまでに必要な手間を削減可能な文字列抽出装置を提供する。
【解決手段】文字認識装置1の文字列抽出部114は、文字データ記憶部118に記憶されている文字データの示す文字群から、文字列を抽出する。文字列再構成候補作成部116は、上記抽出した文字列に対して再構成が指示された場合、当該指示された文字列を示す文字情報から、当該指示された文字列とは異なる少なくとも1つの文字列を生成する。これにより、ユーザは、正しい順序に整列された文字列を、少ない手間で取得することができる。 (もっと読む)


【課題】枠なしで手書き入力された文字に対するより自由度の高い、筆記方向に依存しない枠なし文字認識(自由筆記文字列認識)を行う。
【解決手段】入力文字列パターン入力部5により枠なしで自由な方向で入力された文字列のパターンが入力される。入力された文字列パターンに含まれる各文字は、文字サイズ推定処理部11により、文字サイズを推定される。つぎに、文字切出し処理部12は、例えば、改行、筆記方向変化点に基づいて文字列の筆記方向の推定を行う。さらに、文字切出し処理部12は、推定された筆記方向に基づいて仮分割及び仮分割修正を行う。つぎに、最尤文字列探索処理部13では、文字切出しの行われた文字列に対して、認識エンジン部14及び最尤文字列探索部15により文字認識を行うと共に、この文字認識の結果を認識結果出力部6に出力する。認識結果出力部6は、この認識結果をアプリケーション3の表示画面上に表示するために出力する。 (もっと読む)


【課題】 記憶容量が制限された装置において、曖昧性を備えた文字入力方法により入力された文字列を確実に認識することのできる電子辞書装置、電子辞書検索方法、及び電子辞書プログラムを提供することを目的とする。
【解決手段】 音声や画像として操作入力部106より文字が入力されると、記録媒体104に記録された辞書情報を参照することによって、入力された文字を推測し、情報表示部107に推測した文字を表示させる。このとき、推測した文字より検索する文字列を認識し、認識した文字列により記録媒体104内の辞書情報の検索を行う。 (もっと読む)


【課題】枠なしで手書き入力された文字に対するより自由度の高い、筆記方向に依存しない枠なし文字認識(自由筆記文字列認識)を行う。
【解決手段】入力文字列パターン入力部5により枠なしで自由な方向で入力された文字列のパターンが入力される。入力された文字列パターンに含まれる各文字は、文字サイズ推定処理部11により、文字サイズを推定される。つぎに、文字切出し処理部12は、例えば、改行、筆記方向変化点に基づいて文字列の筆記方向の推定を行う。さらに、文字切出し処理部12は、推定された筆記方向に基づいて仮分割及び仮分割修正を行う。つぎに、最尤文字列探索処理部13では、文字切出しの行われた文字列に対して、認識エンジン部14及び最尤文字列探索部15により文字認識を行うと共に、この文字認識の結果を認識結果出力部6に出力する。認識結果出力部6は、この認識結果をアプリケーション3の表示画面上に表示するために出力する。 (もっと読む)


【課題】枠なしで手書き入力された文字に対するより自由度の高い、筆記方向に依存しない枠なし文字認識(自由筆記文字列認識)を行う。
【解決手段】入力文字列パターン入力部5により枠なしで自由な方向で入力された文字列のパターンが入力される。入力された文字列パターンに含まれる各文字は、文字サイズ推定処理部11により、文字サイズを推定される。つぎに、文字切出し処理部12は、例えば、改行、筆記方向変化点に基づいて文字列の筆記方向の推定を行う。さらに、文字切出し処理部12は、推定された筆記方向に基づいて仮分割及び仮分割修正を行う。つぎに、最尤文字列探索処理部13では、文字切出しの行われた文字列に対して、認識エンジン部14及び最尤文字列探索部15により文字認識を行うと共に、この文字認識の結果を認識結果出力部6に出力する。認識結果出力部6は、この認識結果をアプリケーション3の表示画面上に表示するために出力する。 (もっと読む)


【課題】 地名表記に対する異表記の生成や追加をアドホックに行うのではなく
、これらを可能な限り自動的に追加するとともに、自動的に追加できなかった表
記や不要な表記の追加や削除を二回目以降は自動的に行えるようにすること。
【解決手段】 地名表記を文脈自由文法によって表現し、地名表記の文字列と文
脈自由文法における構文カテゴリとを対応付ける知識、構文カテゴリおよび構文
カテゴリの配列を別の構文カテゴリに対応付ける知識を持つことにより地名表記
の異表記を追加できるようにする。また追加あるいは削除される表記のみを地名
表記辞書を記述する形式と同じ文脈自由文法によって記述しファイルに出力する
ことにより、それ以降の地名表記辞書作成の際に、上記追加、削除処理による変
更を自動的に反映させることができるようにする。 (もっと読む)


【課題】デジタルビデオレコーダにおいて番組のテロップ認識を行う際の文字認識精度を向上する。
【解決手段】デジタルビデオレコーダ1は、単語がジャンル毎に分類して記憶された知識辞書11と、知識辞書11および外部から取得した情報を用いて単語照合処理に用いる照合用辞書13を作成する照合用辞書作成部12と、テロップ認識部14により認識された認識結果の文字列に対して照合用辞書13を用いて知識処理(単語照合処理)を行うことで認識結果を評価し、知識辞書11更新のための更新用情報17を作成する単語照合処理部15と、更新用情報17を用いて知識辞書11を更新(修正)する知識辞書更新部16とを備える。 (もっと読む)


【課題】原文から翻訳対象の入力原文を取得した際に欠如した文字または誤入力された文字のある単語を、入力原文の取得元の特性を基に訂正することで、他言語への翻訳の際に未知語や非文の発生を低減し、翻訳精度を向上すると共に作業効率を向上する。
【解決手段】翻訳原文推定装置は、Webページより取得した文字列を単語の単位に分割した複数の単語のうち先頭単語の先頭文字が小文字が大文字かを判定し、先頭文字が小文字の場合、先頭単語の先頭に大文字のアルファベットを付加した複数の先頭単語置き換え単語を生成する形態素解析部14と、生成された複数の先頭単語置き換え単語について辞書部10の辞書データを基に選出された辞書部10に存在する先頭単語置き換え候補を原文の先頭単語と置き換えた1つ以上の文について辞書部10の辞書データを基に構文解析を行う構文解析部15と、その中から文法的に正しい原文候補を選出し翻訳部18へ出力する構文解析制御部16とを備える。 (もっと読む)


【課題】 レーザプリンタやコンピュータモニタ等のラスタディスプレイ装置上に画像を表示する改良した装置及び方法を提供する。
【解決手段】 本発明によれば、データ構造から派生されるラスタ画像を発生するシステム(10)が提供され、該システムは、データ処理装置と、該データ処理装置に対して入力ビットマップに関し認識処理を実行し入力ビットマップ内における識別可能なオブジェクトを検知する認識器と、識別可能なオブジェクト及び識別不可能なオブジェクトに対応するコード化データ及び入力ビットマップを包含するハイブリッドデータ構造を発生するメカニズムと、ハイブリッドデータ構造内の入力ビットマップから派生される視覚的に知覚可能なラスタ画像を発生することの可能な出力装置とを有することを特徴としている。 (もっと読む)


【課題】住所データベースに未登録の住所を、簡易に高い信頼性を持って登録する。また、未登録の場合でも、信頼性の高いものは読み取り完了とし読み取り性能の向上を図る。
【解決手段】住所データベース4への未登録の読み取り結果を、住所登録候補判定部2によって正誤判定し、住所登録候補データベース3に頻度情報、読み取り性能改善割合と共に保持する。住所登録候補データベース3に登録されている情報に基づき、読み取り結果が住所データベース4に登録されていない場合の読み取り完了判定、および住所データベース4への未登録住所の登録を行う。 (もっと読む)


【課題】 音声認識に代表される認識結果に誤りが含まれるテキストを入力としてマイニング処理した場合に、その認識の信頼度をテキストマイニング結果と共に利用者へ提供する。
【解決手段】 音声認識手段21では、音声データを認識しテキスト化し、音声認識信頼度計算手段22では、音声認識結果に含まれる単語1語1語に対する信頼度が計算される。マイニング計算手段24は、音声認識テキストに対しマイニング処理する。マイニング結果信頼度計算手段25では、音声認識信頼度を参照しつつ、テキストマイニング処理結果の上位リストに含まれる単語または表現について信頼度を計算する。マイニング結果提示手段26では、テキストマイニング結果の上位リストに含まれる単語または表現について、その単語または表現と共に計算した信頼度を利用者へ提示する。 (もっと読む)


【課題】 紙文書をスキャンし、オリジナルの電子文書を検索する原本検索において、精度高く応答性能の良い検索手段を実現する。
【解決手段】 OCRされたテキストから単語を抽出し、未知語に対しては屈折の影響を除去できるように単純化処理を行い、かつ、誤認識の観点から類似文字で構成される未知語を同一単語に統合しつつ未知語を登録し、統合された未知語をベースとして含有単語の統計情報に基づいて文書類似性を判定する処理を入れることにより、屈折方法の不明な単語に対する未知語の数を大幅に削減でき、高速の原本検索が実現できる。 (もっと読む)


【課題】
従来技術における接写の場合、ストレートタイプの携帯機器などでは、その構造上、筐体を撮像対象上に載置した場合に撮像レンズが撮像対象と接触し、そのためピントが合わせにくくなる、という課題がある。また、折りたたみタイプの携帯機器などでは、ある程度撮像レンズと撮像対象との距離を保つため液晶画面などが配置されている側の筐体を載置面とすると、ヒンジ部などの構造上、やはり載置をすることが困難であるという課題がある。
【解決手段】
以上の課題を解決するために、本発明は、撮像レンズを有する筐体が撮像対象に接触、載置される場合でも、撮像レンズと撮像対象との間の距離が撮像可能な距離に保たれるように、撮像レンズを収納する撮像レンズ収納凹部と、撮像レンズ収納凹部を有する筐体と、からなる電子機器を提供する。 (もっと読む)


文書の2次元的表現を利用して、文書の認識を促進する階層構造を抽出する。視覚構造が、統計解析アルゴリズムの2次元の適応を利用して文法的に解析される。このことにより、レイアウト構造(たとえば、段組、著者、タイトル、脚注など)およびその同類の認識が可能になるので、文書の構造コンポーネントを正確に解釈できる。文書のレイアウト認識を促進するために、追加的な技術を利用することができる。たとえば、機械学習を使用した文法的な解析技術、イメージ表現に基づく解析スコアリング、ブースティング技術、および/または「高速フィーチャ(fast features)」などを使用して文書の認識を促進することができる。
(もっと読む)


【課題】オペレータの負担を軽減しつつ高性能な認識処理を実現できるようにする。
【解決手段】データベース検索処理部102は、オペレータが入力装置13を通じて入力する郵便番号等に相当する第1の文字列を検索キーとして、住所データベースに記憶されている情報の中から住所に相当する第2の文字列を検索する。文字認識処理部104は、文字辞書記憶部103に記憶されている文字辞書を用いて、書状画像の中の所定の領域に対する文字認識を行い、氏名もしくは名称、電話番号、郵便番号、住所などを含む文字列の候補をそれぞれ生成する。文字画像選択処理部105は、生成された候補の中から、データベース検索処理部102によって検索された第2の文字列に該当する文字列を選択する。文字画像記憶部106は、選択された文字列を構成する個々の文字とその文字画像との対応関係を記憶する。文字辞書学習処理部107は、記憶された個々の文字とその文字画像との対応関係を用いて、文字辞書に対する学習処理を実行する。 (もっと読む)


【課題】 既存のニューラル・ネットワークから、手書き認識のための新しいニューラル・ネットワークを構築することを可能にする。
【解決手段】 所望の目標言語に基づいて、開始言語に既存のニューラル・ネットワークを選択する。ニューラル・ネットワークを修正して、目標言語の文字を認識するために用いることができるようにし、更に修正したニューラル・ネットワークを、目標言語の手書き認識装置に用いる。修正は、既存のニューラル・ネットワークの一次出力の1つ以上をコピーすることを含む。所望の目標言語に基づいて、しかるべき開始言語を選択することができる。加えて、多数の異なる言語から文字を認識するように構成されている比較的大型のニューラル・ネットワークである「スーパー・ネットワーク」を提供することができる。このようなスーパー・ネットワークを用いて、認識することを望む言語に必要でないスーパー・ネットワークからの出力を遮断するマスクをプログラミングすることによって、手書き認識装置をカスタム化することができる。 (もっと読む)


61 - 80 / 116