説明

Fターム[5B064EA18]の内容

文字認識 (8,173) | 後処理 (1,120) | 修正、確定 (961) | 文字列の解析によるもの (315)

Fターム[5B064EA18]の下位に属するFターム

単語 (169)
構文、文法 (30)

Fターム[5B064EA18]に分類される特許

81 - 100 / 116


【課題】手書き文字認識システムを提供する。
【解決手段】低レベル認識プロセッサ(34)が、時間順序誘導プロセッサから接続されており、順序付きのクラスタ・アレーを受け取り、それぞれの順序付きのクラスタ・アレーに対する文字リストを含むシーケンシャルな文字アレーを発生し、それぞれの文字リストには、対応する順序付きのクラスタ・アレーの可能性のある解釈を表す少なくとも1つの文字識別が含まれる。言語的なポスト・プロセッサ(36)が、低レベル認識プロセッサから接続されており、シーケンシャルな文字アレーを受け取り、文書の手書き文字の最も蓋然性のある解釈を表す出力ストリングを発生する。 (もっと読む)


【課題】 ユーザの操作回数が大幅に削減されているにも拘わらず、高い精度で文字認識可能な文字認識装置、および、文字認識方法を実現する。
【解決手段】 カメラ付き携帯電話1は、複数の言語のいずれかに含まれる文字の画像を文字認識して文字コードに変換する認識処理部23とを有している。当該認識処理部23は、上記複数の言語のそれぞれについて、文字の認識結果が当該言語でありそうだと推定したことを示す推定履歴情報を履歴情報記憶部41に格納する言語可能性値推定部42と、認識対象とする文字の属する言語が当該言語であると指定する操作を受け付けたことを示す操作履歴情報を履歴情報記憶部41に格納する操作部13とを備え、上記履歴情報記憶部41の履歴情報を参照して、文字の画像を文字コードに変換する。 (もっと読む)


【課題】 効率的にかつ精度良く手書き文字認識を実行することができる情報処理装置及びその制御方法、プログラムを提供する。
【解決手段】 手入力された軌跡データに対応する文字を認識する。その文字認識結果の候補文字列を後処理する。入力処理、文字認識結果の候補に対する処理を含む各種処理の実行を指示するための指示による処理種類に基づいて、新たに入力される文字を、後処理対象の文字列に継続させるか否かを判定する。 (もっと読む)


【課題】 文字認識率の向上を図ると共に、使用者の負荷を軽減することで実用性の高い翻訳装置を実現すること。
【解決手段】 画像処理部30は、撮影部10により測定された被写体までの距離に基づいて、静止画像データにパララックス補正を行う。そして、当該補正後の静止画像データから文字列を抽出し、当該抽出に失敗した場合は、静止画像データに対してエッジ強調や階調補正といった画像処理を施して、再度文字抽出を行う。言語処理部40は、画像処理部30により抽出された文字列を翻訳エンジン60に伝送する。翻訳エンジン60は、翻訳エンジン60から言語処理部40から入力された文字列の訳語を検索して、言語処理部40に返す。言語処理部40は、翻訳エンジン60から返された訳語を表示部70に表示させる。このとき、訳語の光学像がホログラフィック光学素子に投射されて、回折反射により使用者の眼に導かれる。 (もっと読む)


【課題】 文書から単語に加え、その属性情報を抽出する画像読み取り装置を提供する。
【解決手段】 本発明は、原稿の画像を読み取り、入力画像データを生成する画像読み取り手段と、前記入力画像データからレイアウト情報を生成するレイアウト解析手段と、前記レイアウト情報に基づいて、前記入力画像データを複数の小領域に分割する画像分割手段と、前記複数の小領域のうち、見出し文字列/画像を有する小領域を特定する識別子およびその見出し文字列/画像と、情報文字列/画像を有する小領域を特定する識別子およびその情報文字列/画像とを対応付けて記憶したデータベースと、前記データベースに記憶された情報に基づいて、前記見出し文字列/画像を有する小領域から登録対象語句を、前記情報文字列/画像を有する小領域からその属性情報を抽出する情報抽出手段と、前記辞書登録対象語句を出力する出力手段とを有する画像読み取り装置を提供する。 (もっと読む)


【課題】 撮像機能を用いて簡単かつ効率的に種々の情報を取得する。
【解決手段】 画像処理部160は、画像入力部133の撮像動作と並行して、撮像により取得された画像データの画像特性を検出し、撮像画像に所定のオブジェクトが示されているか否かを判別する。オブジェクトが検出された場合、画像処理部160は、検出した画像特性や記憶部150に格納されているオブジェクト毎の特徴情報に基づいて、オブジェクトの種類を判別する。オブジェクトがコードシンボルである場合には、デコードして情報を取得する。オブジェクトが文字列である場合には、記憶部150に格納されている特徴情報に基づいて、当該文字列の完全性や取得済みの文字列との連続性(関連性)などを判別する。完全性がない場合には、画像入力部133でさらなる撮像をおこない、取得された複数の画像から対象とする情報を取得する。連続性がある場合には、これらを一の情報として取得する。 (もっと読む)


【課題】光学的文字認識(以下、OCRとする)処理後に得られるOCR処理結果を確認する手間の軽減化を図ったOCR装置およびOCR結果確認方法を提供する。
【解決手段】OCR装置10は、確認対象となる範囲の指定等の入力操作を受け付ける操作部11と、情報を視覚的に提示する表示部12と、読み出し可能に格納された画像情報を光学的文字認識処理して得られる文字情報に光学的文字認識の正確さを評価した結果を反映した新たな文字情報を生成する光学的文字認識処理部14と、画像情報をOCR処理得られる文字情報にOCRの正確さを評価した結果を付加して新たな文字情報を生成するOCR処理部14と、OCR処理部14が生成した新たな文字情報からOCR処理結果の正確さを評価した音声情報を生成する音声変換部15と、取得した音声情報を音声出力する音声出力部16と、操作部11、表示部12、スキャナ部13、OCR処理部14、音声データ変換部15および音声出力部16を制御する制御部17とを具備する。 (もっと読む)


【課題】 文字認識の後処理の高速化を図る。
【解決手段】 複数の文字からなる入力文字列を光学的に認識して得られた文字認識結果を補正する後処理装置において、単語辞書G2を設ける。この単語辞書G2は、1文字をノードとするツリー構造にて単語を登録した構造である。 (もっと読む)


【課題】 シンボル間の識別能力を向上させる。
【解決手段】 一つの特徴量情報系列に対し、複数の正解シンボル系列候補を含む正解シンボル系列集合を用意して正解シンボル系列識別関数値の計算を行い、誤識別尺度の計算に用いる不正解シンボル系列を認識シンボル系列集合の中から正解シンボルと系列と、正解シンボル系列集合に含まれる正解シンボル系列に類似したシンボル系列とを除いた上で選択し、それぞれについて正解シンボル系列識別関数値と不正解シンボル系列識別関数値の計算を行う。 (もっと読む)


【課題】 手書き文字列を認識する単語認識装置において、単語の傾きおよび異なる文字サイズにおいても認識が向上する単語認識装置を提供すること。
【解決手段】入力画像から単語の特徴量を抽出した結果と辞書の個々の文字の特徴量から単語の特徴量を合成した結果とを照合することで単語の認識を行う単語認識装置であって、
複数の各種サイズの文字、部分文字列の特徴量と複数の各種文字サイズの画像を保持する辞書と、前記辞書に基づいて文字、部分文字列の特徴量から単語の特徴量を合成する手段および前記辞書に基づいて文字の画像から単語の画像を合成し特徴量の抽出を行う手段を有する特徴合成部とを備えたことを特徴とする単語認識装置。 (もっと読む)


【課題】 患者情報の配列形式に関わらず、患者情報を適切に単位情報毎に分類することのできる患者情報分類装置を実現すること。
【解決手段】 変換装置のCPUは、ユーザのコントローラの操作に基づいて、区切り文字130をメモリ130に設定し、次に、文字認識エリア情報132の設定を行う。次いで、医用画像データ32に基づく医用画像に対して文字認識エリア情報132で示される文字認識エリア内に文字認識処理を行う。CPUは、文字認識処理によって得られた文字認識結果134内に含まれる区切り文字130を判断して、その区切り文字130毎に文字認識結果134を分割する。そして、分割した文字認識結果134を、患者情報割り当てテーブル136の各区間に順に分類する。これにより、医用画像データ32に付帯された患者情報を個々の単位情報に分類することとなる。 (もっと読む)


【課題】名刺等に記述されている各部分の文字列が何の情報を示しているのかを予めあるいは認識時に指定する必要がなく、地名に酷似した氏名等が含まれている場合でも、名刺等の各部の文字列を正しい情報として取得すること。
【解決手段】情報処理装置100のCPUが、スキャナ200で読み取った名刺上の各文字列を意味属性で分類する際に、前記各文字列毎に、DB105〜107を参照して、前記文字列を分析して前記文字列の前記各意味属性に対する割り当ての尤らしさを示すスコアを複数のスコア付与方法によりそれぞれ付与し、前記各文字列の前記各意味属性への割り当て組み合わせパターン毎の前記それぞれ付与されたスコアの合計値に基づいて、前記いずれかの組み合わせパターンを選択し、該選択した組み合わせパターンで、前記各文字列を前記各意味属性に分類する構成を特徴とする。 (もっと読む)


【課題】 誤認識を含む認識結果から正しい単語を検索する際に短い時間しか与えられなくても、なるべく正解に近い単語を検索することができるようにし、また、長い時間を与えられればより精度よく正解の単語を辞書から検索することができるようにする。
【解決手段】 単語候補生成部4は、認識候補文字を組み合わせて複数の単語候補を生成するとともに、各単語候補に優先度情報を付加する。絞り込み部6は、優先度順に単語候補を読み出し、単語辞書7に含まれる情報を絞り込む。その絞り込みが不十分であると判定されると、次の順位の単語候補を読み出し、再度絞り込みを行う。また、絞り込みが十分と判定された場合、単語比較部9によって、絞り込んだ情報に含まれる辞書単語と単語候補との類似度を計算し、その後、さらに次の単語候補による絞り込みを行うか否かを判定する。単語比較部9は、単語候補との類似度が最も高い辞書単語を選定する。 (もっと読む)


【課題】 医療機関から月次大量に発生するレセプトの摘要欄のデータ化に人手による入力作業に頼ることなく、自動化を進めることで作業コストを大幅な低減できる帳票読取システムを提供する。
【解決手段】 帳票例であるレセプト1の紙面全体を複数の領域に区分され、その領域の1つを特定領域である「摘要欄」2とした場合、そこに記録された診療結果など重要な文字情報を、予め規定した判定用座標に基づいてその位置を特定して読み取って認識する。摘要欄2の文字情報を読み取って認識、知識処理、編集および修正の各処理を行う。医事用語辞書マスタ40の各辞書マスタ41〜47に単語登録されているものと摘要欄2中の文字情報の単語とを照合させ、適合しない単語にはたとえば「?」マークを付して項目ごとに切り取り、ホストPC3のモニタ画面に表示してオペレータに視識させる。修正装置50を利用して「?」マークの単語を修正し、編集データベース22に保存する。 (もっと読む)


【課題】データ送信時エラーを回避することができるタクシーチケット処理システムを提供する。
【解決手段】利用者はタクシーチケット3の利用者項目に、運転者は運転者項目に電子ペン10を使用して所定の情報を記入する。運転者は、タクシーチケット3のバーコードをスキャンし、チケット情報を読み取る。サーバ5は、電子ペン10が取得した記入情報及びチケット情報を取得し、座標テーブル506に基づいて利用者記入情報及び運転者記入情報をそれぞれ抽出し、利用者記入情報のストロークデータを文字認識することで各種利用料金を特定する。さらに、サーバは5、受信情報に含まれるチケット情報と、特定した利用料金と、抽出した運転者記入情報のイメージデータとをチケット利用DB40に記憶するとともに、タクシーの利用料金の請求書等にあたる請求データを作成する。 (もっと読む)


【課題】顧客の利用する自動車のナンバープレートを撮影してOCR認識する場合のように、信憑性の低いOCRの認識結果を用いて顧客データ検索する場合であっても、検索データのヒット率を向上すること。
【解決手段】カメラ101で撮影されたナンバープレート画像102から文字列を認識し、該認識された文字列データに検索候補展開エンジン106が正規化処理を加えて複数の検索候補データを生成し、該生成された複数の検索候補データに基づいて検索エンジン107が顧客データベースのデータ検索を行い、該検索結果(顧客データ)を画面109に出力することにより店員に通知する構成を特徴とする。 (もっと読む)


【課題】 手書き入力された筆跡の認識結果の入力先項目を簡便に指定することが可能な、あるいは、入力先項目を指定する必要がない、手書き情報入力装置を提供する。
【解決手段】 手書き入力領域とテキスト入力項目領域とを有するタブレット10と、手書き入力領域に表示された筆跡の少なくとも一部を選択する手書き入力を受け付け、選択された筆跡を確定する筆跡選択処理部12と、筆跡選択処理部12により確定された筆跡を認識する筆跡認識部13と、テキスト入力項目領域に表示される入力項目に関する情報を予め記憶した項目記憶部14と、項目記憶部14に記憶された情報に基づき、認識結果をテキスト入力項目領域中のどの入力項目へ送るかを操作者に選択させるための項目リストを生成し、入出力装置へ表示させる項目選択処理部15と、項目リストにおいて選択された入力項目へ認識結果を送り込む項目入力部16とを備えた手書き情報入力装置である。 (もっと読む)


【課題】単語イメージを構成する文字列内に認識が困難な文字が含まれている場合でも、特別な単語リスト等を予め用意することなく、高精度な文字認識を可能とする単語認識装置を提供する。
【解決手段】単語の認識を行う単語認識装置であって、画像に含まれる単語を構成する文字を認識する文字認識部と、文字認識部にて認識された文字の信頼度を判定する認識信頼度判定部と、認識信頼度判定部にて所定の閾値以下の認識信頼度である低信頼度文字と判定された文字を含む単語について、低信頼度文字をワイルドカードとして検索を行い候補単語を取得する検索処理部と、低信頼度文字を含む画像領域部分と、低信頼度文字に対応する前記候補単語の文字から形成される文字画像との類似度の判定を行う類似度判定部と、類似度判定部による判定結果に基づいて、候補単語を画像に含まれる単語として判定する単語判定部とを備えてなる。 (もっと読む)


【課題】 帳票の記入者が自由に設計した帳票であっても、フォームを使わずに帳票をOCRで認識可能とすること。
【解決手段】 予め帳票の論理構造を定義し、入力された入力帳票の値を取得可能としたシステムであり、帳票上の項目名に関連する用語をグルーピングした概念辞書DB、帳票の種類別に帳票の論理構造を定義したスキーマ情報DBを備える。入力帳票の項目名をOCRエンジンで読み取り、各項目名が概念辞書DBに記憶されたグループのうち、どのグループに属しているかを抽出する。抽出したグループと順序をスキーマ情報DBに記憶された複数のスキーマ情報を参照して入力帳票の論理構造を推測し、帳票の候補リストを動的に生成する。生成した候補リストの中から、帳票の値を読み取り、その帳票の値をスキーマ情報の要素名及びデータ型と照合し、帳票結果として出力する。 (もっと読む)


【課題】 文書原本になされた追記によって指定された被追記部分を抽出し、これを各種の利用目的に備えて保存しておくことが可能な技術を提供することにある。
【解決手段】 制御部11は、入力部13に入力された画像データが表す追記文書から追記画像を抽出し、その追記画像と所定の位置関係を有する画像領域を特定する。さらに、制御部11は、特定された画像領域に配置された被追記画像データを抽出して、これらを追記画像の色別に不揮発性記憶部12に記憶する。このように、制御部11が追記文書の画像データから被追記画像画像データを分離して記憶することによって、例えば被追記画像のみを対象とした検索処理や表示処理を行うことが可能となる。また、被追記画像データを追記画像の色別に記憶するので、その色別に検索処理や表示処理を行うことも実現できる。 (もっと読む)


81 - 100 / 116