説明

Fターム[5B075ND07]の内容

検索装置 (67,127) | 検索対象情報 (11,868) | 検索対象情報の内容 (10,277) | 静止画 (2,627) | 文字画像 (234)

Fターム[5B075ND07]に分類される特許

1 - 20 / 234


【課題】文書画像データベースの大規模化に伴って顕在化するLocally Likely Arrangement Hashing (LLAH) のメモリ効率の問題、および、特徴量の識別性の問題を解決する改善手法を提供する。LLAH は高いロバスト性を実現するために、必要メモリ量が多く、また、大規模化に対処するには、特徴量の識別性・安定性が十分でないという側面がある。
【解決手段】以下の3 点の改良を施す。第1は、ハッシュに保存する特徴点をサンプリングすることによる必要メモリ量の削減である。第2は、特徴量の次元数を増加させることによる識別性向上である。第3は、特徴量のうち冗長性のある次元を削除することによる安定性向上である。 (もっと読む)


【課題】ランキング関数生成の性能を向上し検索ランキングの精度向上を実現した文書検索装置を提供する。
【解決手段】訓練データ中の各クエリの異なる適合度の組合せの順序を変更したときの検索結果評価指標値の変更幅を求め、クエリ毎の最大の変更幅を基準にクエリ毎のマージンを求め、該マージンと訓練データによって、相対的に高い適合度の文書が検索結果上位となるスコア要因を保持したランキングモデルDB104を生成しておく。入力された検索クエリに対応するスコア要因重みを前記DB104から取得し、該スコア要因重みと、クエリ処理部150により算出された、検索結果集合とスコア要因を要素とするスコア要因値行列とを検索スコア計算部160で積算し、該算出された検索スコアの降順に入力検索クエリに対応する検索結果を提示する。 (もっと読む)


【課題】文献に出現するキーワード同士の変遷状態を効率及び精度よく把握するための解析技術を提供する。
【解決手段】時系列情報とテキスト情報とを含む時系列的テキストデータを解析する情報解析装置であって、複数の異なる時系列的テキストデータを取得する時系列的テキストデータ取得部と、解析の対象となるテキスト情報を取得する解析対象情報取得部と、前記複数の異なる時系列的テキストデータから、前記解析対象情報と共起する他の同属性の共起情報を抽出する共起情報抽出部と、前記解析対象情報が初出した時系列的テキストデータを基準として、他の時系列的テキストデータに時系列的な重み付けをされた時系列係数を付与する時系列係数付与部と、前記共起情報を含む複数の時系列的テキストデータに付与されている前記時系列係数を前記共起情報ごとに集計する集計部と、前記集計部の集計結果に基づいて、前記解析対象情報と前記共起情報との間の時系列的な変遷状態を解析する変遷状態解析部と、前記変遷状態を出力する出力部と、を備える、情報解析装置。 (もっと読む)


【課題】表示画面が小さくても,所望の部分を見やすくする。
【解決手段】表示画面80に,画像化された文書(文書画像)が表示される。文書画像について,文字認識が行われ,所定の単語(プログラムという単語)が枠61で囲まれる。枠61で囲まれた単語が選択されると,その単語が表示画面80の中央となり,かつ文書画像全体が拡大されるように,表示画面80に文書画像が表示される。ユーザが興味のある部分が見やすくなる。 (もっと読む)


【課題】テキスト情報を含む表示データ内から単語等の所定の文字列を抽出する処理に係る利便性を向上する。
【解決手段】処理装置1は、第1データのうち第2データを表示部に表示させる表示制御部35と、表示される第2データに含まれるテキスト情報を、第1データのうち第2データ以外のテキスト情報で補正し、第2データに含まれるデータ及び補正したデータから1つ以上の所定の文字列を抽出する文字列抽出部33と、を備える。 (もっと読む)


【課題】 同一の画像が複数のWebページの箇所において利用されている場合であっても有効に検索結果を活用する。
【解決手段】 画像検索装置10は、検索対象の画像を格納すると共に、当該画像から得られるハッシュ値と当該画像が利用されているWebサイトを示す情報とを対応付けて格納する画像データベース11と、検索用のキーワードを入力する検索キーワード入力部17と、入力されたキーワードを用いて、画像データベース11に格納された検索対象の画像を行う検索部18と、検索によって得られた画像を示す情報と、画像データベース11に当該画像のハッシュ値に対応付けられて格納されている当該画像が利用されているWebサイトを示す情報とを出力する出力部19とを備える。 (もっと読む)


【課題】 いろいろな方向に文字が並んでいる場合でも、文字列の抽出を行なうことのできる画像検索装置を提供する。
【解決手段】 本実施形態の画像検索装置は、画像を格納する画像格納部と、画像を文字認識処理し、一文字ごとの領域情報を抽出する文字認識部と、一文字ごとの領域情報を画像のメタデータとして格納するメタデータ格納部と、画像を検索するための文字列を入力する入力部と、文字列の各文字に基づいてメタデータ格納部に格納されている一文字ごとの領域情報を検索する検索部と、検索された領域情報から文字列の各文字に対応する中心座標をそれぞれ求め、複数の中心座標を用いて折れ線を生成する折れ線生成部と、折れ線の連結スコアを求めるスコア算出部とを備える。 (もっと読む)


【課題】 履歴情報に容易にアクセスできるとともにデータのバックアップにも有効であり、かつ利用環境の制約を受けにくい、ファイルに対して実行された操作の履歴情報の管理に用いられファイル履歴情報管理サーバ等を提供する。
【解決手段】 ファイルサーバに保存され、ファイルサーバに履歴情報が記録されているファイルに対し、端末装置を操作するユーザが印刷命令を実行した際に、この印刷命令に対してサーバで新たなURL等の記憶領域を割り当て、割り当てた記憶領域に印刷命令までの履歴情報を書き込んで保存する。さらに、ファイルサーバは割り当てたURLを識別するための二次元コードを発行してユーザ端末に送信し、ユーザ端末では印刷する文書等に二次元コードを埋め込むことによって、プリンタから印刷された文書の二次元コードを読み取るだけで、印刷までの履歴情報にダイレクトにアクセスすることを可能にしている。 (もっと読む)


【課題】電子書籍コンテンツに含まれる文字列を引用したコメントの入力を容易にすること。
【解決手段】書物のスキャンなどによる文字画像を含む電子書籍コンテンツについて、漫画のセリフ部分などユーザの興味ある箇所について領域の指定を受け付け、その領域について文字認識した文字列をコメント入力欄に挿入することにより、ユーザは、画面上の文字を改めて一文字ずつ入力することなくその箇所を囲むなど指定するだけで、電子書籍コンテンツに含まれる文字列を引用したコメントの入力を容易に行うことができる。 (もっと読む)


【課題】画像中のメインの被写体である代表文字列領域に対して、代表文字列領域以外の文字列情報を欠落させずに再利用する。
【解決手段】代表文字列領域抽出手段が、入力された画像から当該画像の中央に位置し、所定の大きさを有する文字領域である代表文字列領域を抽出する代表文字列領域抽出工程と、非代表文字列領域抽出手段が、入力された前記画像において、前記代表文字列領域の外にある文字領域である非代表文字列領域を抽出する非代表文字列領域抽出工程と、関連付け手段が、前記非代表文字列領域抽出工程において抽出された前記非代表文字列領域それぞれを、前記非代表文字列領域と前記代表文字列領域のそれぞれの消失点の位置関係に基づいて、前記代表文字列領域に関連付ける関連付け工程と、保持手段が、前記関連付け工程において関連付けられた前記代表文字列領域と前記非代表文字列領域の情報を保持する保持工程とを有する。 (もっと読む)


【課題】画像に文字が含まれていない場合に文字列による検索を行う際、文字列が誤って検索されてしまうことを防ぎ、より精度良く文字列探索を行う。
【解決手段】文字列探索の際に、探索キーとされた長さLの文字列から、該文字列の前から後の方向に存在する全ての2個の文字の組である文字ペアを選び、各々の文字ペアに対して、候補文字集合中から文字カテゴリが一致する全ての2個の候補文字の組を探索する処理を行い、該処理の結果探索された全ての2個の候補文字の組に対して、ピッチが一定でかつ直線的に並ぶ文字列を特定するパラメータの組を算出する際に、候補文字パターンの変形角度を推定しその結果に基づく判定処理を行って合格した場合にだけ該2個の候補文字の組と該パラメータの組の情報を投票空間に投票する。 (もっと読む)


【課題】格納先が付与された文書をスキャンして文書管理する場合に、改ざんチェックを行う。
【解決手段】文書管理システムであって、画像形成装置は、文書識別情報を含むメタデータが付与された紙文書を読み込む読込手段と、読み込まれた紙文書の画像データを文書管理装置に配信する配信手段とを備え、文書管理装置は、画像形成装置から受信した画像データからメタデータを抽出する抽出手段と、画像データにおいて、抽出されたメタデータに含まれる文書識別情報が示すテンプレートの指定領域と同一領域に対し、文字認識を行う文字認識手段と、文字認識された前記画像データの文書データと、前記メタデータに含まれる文書識別情報が示す文書データにおける、指定領域と同一領域の文書データとの照合を行う照合手段と、抽出された前記メタデータに照合結果を含め、メタデータに関連付けて前記画像データを記憶する画像記憶手段とを備える。 (もっと読む)


【課題】特異な負例が存在する場合であっても、検索目的と一致する文書を検索するために適切な検索式を構築すること。
【解決手段】複数の階層化されたカテゴリに分類される文書データベースにおいて、正例が分類されるカテゴリを取得する(ステップS2)。そして、取得したカテゴリ毎に、カテゴリに分類される正例に含まれる特徴語句であって、カテゴリに分類される負例には含まれない特徴語句を、カテゴリ特徴語句として取得する(ステップS4)。また、取得したカテゴリ毎に、カテゴリと、取得したカテゴリ特徴語句と、に基づいて副検索式を構築する(ステップS5)。さらに、正例に含まれる特徴語句を取得する(ステップS3)。そして、取得した特徴語句の和集合と、構築した副検索式と、に基づいて本検索式を構築する(ステップS6)。 (もっと読む)


【課題】 縮小画像の設定を行う前に文書の格納を行うため、縮小画像作成完了まで待たなくても文書の格納を実施し、ユーザが格納された文書を確認できるようにする。
【解決手段】 本発明の文書管理システムは、受信した文書を格納した後に、前記格納された文書を取得する取得手段と、前記取得手段により取得された文書の縮小画像を作成する作成手段と、前記作成手段により作成された縮小画像を該文書のインデックスとして設定する設定手段とを備える。 (もっと読む)


【課題】 特定ドキュメントの特定位置を一意に取得する検索要求に対し、検索インデックス作成時に、検索精度を低下させることなく、検索インデックスのサイズを減らす。
【解決手段】 本発明は、入力されたドキュメントの全体または一部領域から、インデックスキーを抽出する位置を文字を表現する文字コードの特徴に基づいて決定し、ドキュメントの全体または一部領域から、位置にある1文字以上の文字の組み合わせからなるインデックスキーを抽出し、インデックスキーと該インデックスキーが出現するドキュメントにおける出現位置を関連付けてインデックスDBに出力する。さらに、あるドキュメント内の一部領域を検索クエリとして受け付け、検索クエリから、クエリキーを抽出する位置を文字を表現する文字コードの特徴に基づいて決定し、検索クエリから、1文字以上の文字の組み合わせからなるクエリキーを抽出し、クエリキーに基づいて、インデックスDBを検索し、その検索結果を出力する。 (もっと読む)


【課題】データベースを用いることなく、あるコンテンツデータが表すコンテンツと関連するコンテンツを検索することが可能なコンテンツ管理システムを提供すること。
【解決手段】コンテンツ管理システム200は、コンテンツを表すコンテンツ情報と、当該コンテンツを識別するためのコンテンツ識別情報と、を含むコンテンツデータである親コンテンツデータに含まれる当該コンテンツ情報に基づいて生成されたコンテンツ情報が表すコンテンツを識別するためのコンテンツ識別情報を生成するコンテンツ識別情報生成部201と、上記生成されたコンテンツ情報と、上記親コンテンツデータに含まれる上記コンテンツ識別情報を含む関連コンテンツ情報と、上記生成されたコンテンツ識別情報と、を含むコンテンツデータである子コンテンツデータを生成するコンテンツデータ生成部202と、を備える。 (もっと読む)


【課題】ユーザから送信される情報に基づいて重み付けのある検索を行い、そのユーザが求めている可能性が高い情報を提供できるようにする。
【解決手段】データ検索装置は、検索に用いるメモデータを取得し(S1)、ここからキーワードを抽出(S4)した後に、キーワードに順位を付与する(S5)。データ検索装置は、このキーワードを複数のデータベースで検索して関連データを特定する(S6)。データベースは、キーワードと同様に、順位付けが行われている。データ検索装置は、関連データを複数特定した場合には、その関連データの検索に用いたキーワードとデータベースの順位に基づいて総合的な順位を算出し(S8)、この順位が高い関連データを出力する(S9)。 (もっと読む)


【課題】テキストと非テキスト情報が混在した文書の類似度検出を行う技術を提供する。
【解決手段】上記課題を解決するために第1の態様として、2つの文書データの類似度判定を支援するコンピュータで実行可能な方法であって、前記文書はテキスト、非テキスト、若しくはそれらの混在からなるオブジェクトを含んでおり、前記文書データの各々を有向グラフに変換して記憶するステップと、変換された有向グラフ間の類似度を前記コンピュータの演算処理により計算するステップであって、オブジェクトの重要度を用いて、前記類似度を計算するステップを有する方法、を提供する。 (もっと読む)


【課題】例文パターンの文字列と入力文の文字列間で1対複数に対応した相違値の算出し、求められた参照対訳パターンを用いて、入力文を翻訳する。
【解決手段】例文パターンの文字列に対して、固定項目の文字列を文字単位に変換する第1の変換手段と、入力文と、変換後の例文パターンとを対応させ、例文パターンの文字列要素から前記入力文の要素への写像について該例文パターンの文字列要素が固定項目のとき、1対1写像で交差写像が禁止であり、可変項目のとき、1対複数の写像で交差写像が禁止とする条件を満足し、かつ写像重みが最小となる相違値としての距離値及び類似度を算出する。最小距離値及び最大類似度を定める対応関係を抽出して、該対応関係を、前記入力文の文字列と、第1の変換手段による変換前の例文パターンとの対応関係に変換する第2の変換手段と、変換された対応関係を選択し、選択した対応関係に基づき前記入力文を翻訳する手段を備える。 (もっと読む)


【課題】未登録部が住所データベースなしでは読取り困難な場合にも効率よく住所データベースを構築・更新することができる住所データベース構築装置および住所データベース構築方法を提供する。
【解決手段】住所情報が記載された郵便物や帳票等の紙葉類を住所情報に基づき区分処理する紙葉類処理装置において、郵便物や帳票等の紙葉類に記載された住所情報を利用して住所データベースを構築する住所データベース構築装置において、住所情報の一部の認識に成功し残りの部分の認識に失敗した場合、その画像を蓄積しておき、あらかじめ定められた所定のタイミングで、その蓄積された画像の中から未登録データの記載されている可能性の高い画像を検出して表示し、この表示された画像に基づき認識に失敗した部分の住所情報を入力し、この入力された住所情報を住所データベースに登録する。 (もっと読む)


1 - 20 / 234